From c223df7d08037115bd9c15ce165ec258553985bd Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 9 Nov 2022 22:44:19 +0000
Subject: [PATCH 001/344] added inference example stub

---
 CMakeLists.txt                                |  6 ++
 config/config.inc                             |  7 ++
 config/config.linux                           |  1 +
 .../cpp/inference/MLP_Unify/CMakeLists.txt    | 12 +++
 examples/cpp/inference/MLP_Unify/Makefile     | 39 ++++++++
 examples/cpp/inference/MLP_Unify/mlp.cc       | 93 +++++++++++++++++++
 6 files changed, 158 insertions(+)
 create mode 100644 examples/cpp/inference/MLP_Unify/CMakeLists.txt
 create mode 100644 examples/cpp/inference/MLP_Unify/Makefile
 create mode 100644 examples/cpp/inference/MLP_Unify/mlp.cc

diff --git a/CMakeLists.txt b/CMakeLists.txt
index a50b41a59b..4c86199992 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -334,6 +334,8 @@ option(FF_BUILD_MOE "build mixture of experts example" OFF)
 option(FF_BUILD_MLP_UNIFY "build mlp unify example" OFF)
 option(FF_BUILD_SPLIT_TEST "build split test example" OFF)
 option(FF_BUILD_SPLIT_TEST_2 "build split test 2 example" OFF)
+option(FF_BUILD_MLP_UNIFY_INFERENCE "build mlp unify inference example" OFF)
+option(FF_BUILD_ALL_INFERENCE_EXAMPLES "build all inference examples. Overrides others" OFF)
 option(FF_BUILD_ALL_EXAMPLES "build all examples. Overrides others" OFF)
 option(FF_BUILD_UNIT_TESTS "build non-operator unit tests" OFF)
 option(FF_BUILD_SUBSTITUTION_TOOL "build substitution conversion tool" OFF)
@@ -376,6 +378,10 @@ if(FF_BUILD_MLP_UNIFY OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/MLP_Unify)
 endif()
 
+if(FF_BUILD_MLP_UNIFY OR FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
+  add_subdirectory(examples/cpp/inference/MLP_Unify)
+endif()
+
 if(FF_BUILD_SPLIT_TEST OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/split_test)
 endif()
diff --git a/config/config.inc b/config/config.inc
index da043b2880..58632183b9 100644
--- a/config/config.inc
+++ b/config/config.inc
@@ -91,6 +91,13 @@ elif [ "$FF_BUILD_ALL_EXAMPLES" = "OFF" ]; then
 else
   SET_EXAMPLES="-DFF_BUILD_ALL_EXAMPLES=ON"
 fi
+if [ "$FF_BUILD_ALL_INFERENCE_EXAMPLES" = "ON" ]; then
+  SET_EXAMPLES="-DFF_BUILD_ALL_INFERENCE_EXAMPLES=ON"
+elif [ "$FF_BUILD_ALL_INFERENCE_EXAMPLES" = "OFF" ]; then
+  SET_EXAMPLES="-DFF_BUILD_ALL_INFERENCE_EXAMPLES=OFF"
+else
+  SET_EXAMPLES="-DFF_BUILD_ALL_INFERENCE_EXAMPLES=ON"
+fi
 
 # enable C++ unit tests
 if [ "$FF_BUILD_UNIT_TESTS" = "ON" ]; then
diff --git a/config/config.linux b/config/config.linux
index 017243408b..28cf7c2fe1 100755
--- a/config/config.linux
+++ b/config/config.linux
@@ -39,6 +39,7 @@ FF_GASNET_CONDUIT=${FF_GASNET_CONDUIT:-ibv}
 
 # build C++ examples
 FF_BUILD_ALL_EXAMPLES=${FF_BUILD_ALL_EXAMPLES:-OFF}
+FF_BUILD_ALL_INFERENCE_EXAMPLES=${FF_BUILD_ALL_INFERENCE_EXAMPLES:-OFF}
 
 # build C++ unit tests
 FF_BUILD_UNIT_TESTS=${FF_BUILD_UNIT_TESTS:-OFF}
diff --git a/examples/cpp/inference/MLP_Unify/CMakeLists.txt b/examples/cpp/inference/MLP_Unify/CMakeLists.txt
new file mode 100644
index 0000000000..e4299dcfb3
--- /dev/null
+++ b/examples/cpp/inference/MLP_Unify/CMakeLists.txt
@@ -0,0 +1,12 @@
+cmake_minimum_required(VERSION 3.10)
+
+project(FlexFlowExampleInference_MLPUnify)
+set(project_target mlp_inference_unify)
+
+set(CPU_SRC
+  ${FLEXFLOW_CPP_DRV_SRC}
+  mlp.cc)
+
+cuda_add_executable(${project_target} ${CPU_SRC})
+target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
+target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
diff --git a/examples/cpp/inference/MLP_Unify/Makefile b/examples/cpp/inference/MLP_Unify/Makefile
new file mode 100644
index 0000000000..9798c4f18a
--- /dev/null
+++ b/examples/cpp/inference/MLP_Unify/Makefile
@@ -0,0 +1,39 @@
+# Copyright 2021 CMU, Facebook, LANL, MIT, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+#
+
+# Flags for directing the runtime makefile what to include
+DEBUG           ?= 1		# Include debugging symbols
+MAX_DIM         ?= 5		# Maximum number of dimensions
+OUTPUT_LEVEL    ?= LEVEL_DEBUG	# Compile time logging level
+USE_CUDA        ?= 0		# Include CUDA support (requires CUDA)
+USE_GASNET      ?= 0		# Include GASNet support (requires GASNet)
+USE_HDF         ?= 0		# Include HDF5 support (requires HDF5)
+ALT_MAPPERS     ?= 0		# Include alternative mappers (not recommended)
+USE_HIP         ?= 1		# Include HIP support (requires HIP)
+HIP_TARGET      ?= ROCM
+USE_GPU_REDUCTIONS ?= 0
+
+# Put the binary file name here
+OUTFILE		?= mlp_inference
+# List all the application source files here
+GEN_SRC		= mlp.cc
+GEN_GPU_SRC	=
+GEN_HIP_SRC     =
+
+ifndef FF_HOME
+$(error FF_HOME variable is not defined, aborting build)
+endif
+
+include $(FF_HOME)/FlexFlow.mk
diff --git a/examples/cpp/inference/MLP_Unify/mlp.cc b/examples/cpp/inference/MLP_Unify/mlp.cc
new file mode 100644
index 0000000000..167281b4c9
--- /dev/null
+++ b/examples/cpp/inference/MLP_Unify/mlp.cc
@@ -0,0 +1,93 @@
+/* Copyright 2021 Stanford University
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/model.h"
+#include <fstream>
+#include <sstream>
+#include <string>
+using namespace Legion;
+using namespace FlexFlow;
+
+void FlexFlow::top_level_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  FFConfig ffConfig;
+  fprintf(stderr,
+          "batchSize(%d) workersPerNodes(%d) numNodes(%d)\n",
+          ffConfig.batchSize,
+          ffConfig.workersPerNode,
+          ffConfig.numNodes);
+  FFModel ff(ffConfig);
+
+  std::vector<int> hidden_dims = {
+      8192, 8192, 8192, 8192, 8192, 8192, 8192, 8192};
+  Tensor input1, input2;
+  {
+    int const dims[] = {ffConfig.batchSize, 1024};
+    input1 = ff.create_tensor<2>(dims, DT_FLOAT);
+    input2 = ff.create_tensor<2>(dims, DT_FLOAT);
+  }
+  Tensor t1 = input1, t2 = input2;
+  for (size_t i = 0; i < hidden_dims.size(); i++) {
+    int const dims[] = {hidden_dims[i], t1->dims[0]};
+    ActiMode acti_mode =
+        (i + 1 == hidden_dims.size()) ? AC_MODE_NONE : AC_MODE_RELU;
+    t1 = ff.dense(t1, hidden_dims[i], acti_mode, false);
+    t2 = ff.dense(t2, hidden_dims[i], acti_mode, false);
+  }
+  Tensor t = ff.add(t1, t2);
+  t = ff.softmax(t);
+  Optimizer *optimizer = new SGDOptimizer(&ff, 0.001f);
+  std::vector<MetricsType> metrics;
+  metrics.push_back(METRICS_ACCURACY);
+  metrics.push_back(METRICS_SPARSE_CATEGORICAL_CROSSENTROPY);
+  ff.compile(optimizer, LOSS_SPARSE_CATEGORICAL_CROSSENTROPY, metrics);
+  ff.init_operators();
+  // Start timer
+  {
+    runtime->issue_execution_fence(ctx);
+    TimingLauncher timer(MEASURE_MICRO_SECONDS);
+    Future future = runtime->issue_timing_measurement(ctx, timer);
+    future.get_void_result();
+  }
+  double ts_start = Realm::Clock::current_time_in_microseconds();
+  for (int epoch = 0; epoch < ffConfig.epochs; epoch++) {
+    ff.reset_metrics();
+    int iterations = 128;
+    for (int iter = 0; iter < iterations; iter++) {
+      runtime->begin_trace(ctx, 111 /*trace_id*/);
+      ff.forward();
+      ff.zero_gradients();
+      // ff.backward();
+      // ff.update();
+      runtime->end_trace(ctx, 111 /*trace_id*/);
+    }
+  }
+  // End timer
+  {
+    runtime->issue_execution_fence(ctx);
+    TimingLauncher timer(MEASURE_MICRO_SECONDS);
+    Future future = runtime->issue_timing_measurement(ctx, timer);
+    future.get_void_result();
+  }
+  double ts_end = Realm::Clock::current_time_in_microseconds();
+  double run_time = 1e-6 * (ts_end - ts_start);
+  printf("ELAPSED TIME = %.4fs, THROUGHPUT = %.2f samples/s\n",
+         run_time,
+         ffConfig.batchSize * 128 * ffConfig.epochs / run_time);
+}
+
+void FlexFlow::register_custom_tasks() {}

From 0b2f1137eb6b864acbdc7d985e90dfcc42485132 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <ict@gabrieleoliaro.it>
Date: Wed, 9 Nov 2022 17:51:26 -0500
Subject: [PATCH 002/344] turning on inference mode

---
 examples/cpp/inference/MLP_Unify/mlp.cc | 24 ++++++++++++------------
 1 file changed, 12 insertions(+), 12 deletions(-)

diff --git a/examples/cpp/inference/MLP_Unify/mlp.cc b/examples/cpp/inference/MLP_Unify/mlp.cc
index 167281b4c9..5ea113de33 100644
--- a/examples/cpp/inference/MLP_Unify/mlp.cc
+++ b/examples/cpp/inference/MLP_Unify/mlp.cc
@@ -54,7 +54,7 @@ void FlexFlow::top_level_task(Task const *task,
   std::vector<MetricsType> metrics;
   metrics.push_back(METRICS_ACCURACY);
   metrics.push_back(METRICS_SPARSE_CATEGORICAL_CROSSENTROPY);
-  ff.compile(optimizer, LOSS_SPARSE_CATEGORICAL_CROSSENTROPY, metrics);
+  ff.compile(optimizer, LOSS_SPARSE_CATEGORICAL_CROSSENTROPY, metrics, CompMode.COMP_MODE_INFERENCE);
   ff.init_operators();
   // Start timer
   {
@@ -64,18 +64,18 @@ void FlexFlow::top_level_task(Task const *task,
     future.get_void_result();
   }
   double ts_start = Realm::Clock::current_time_in_microseconds();
-  for (int epoch = 0; epoch < ffConfig.epochs; epoch++) {
-    ff.reset_metrics();
-    int iterations = 128;
-    for (int iter = 0; iter < iterations; iter++) {
-      runtime->begin_trace(ctx, 111 /*trace_id*/);
-      ff.forward();
-      ff.zero_gradients();
-      // ff.backward();
-      // ff.update();
-      runtime->end_trace(ctx, 111 /*trace_id*/);
-    }
+  //for (int epoch = 0; epoch < ffConfig.epochs; epoch++) {
+  ff.reset_metrics();
+  int iterations = 128;
+  for (int iter = 0; iter < iterations; iter++) {
+    runtime->begin_trace(ctx, 111 /*trace_id*/);
+    ff.forward();
+    ff.zero_gradients();
+    // ff.backward();
+    // ff.update();
+    runtime->end_trace(ctx, 111 /*trace_id*/);
   }
+  //}
   // End timer
   {
     runtime->issue_execution_fence(ctx);

From 1ed8644c9fbd587fba772962993a67f2f38bb7e2 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 9 Nov 2022 23:16:09 +0000
Subject: [PATCH 003/344] fix

---
 examples/cpp/inference/MLP_Unify/mlp.cc | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/examples/cpp/inference/MLP_Unify/mlp.cc b/examples/cpp/inference/MLP_Unify/mlp.cc
index 5ea113de33..434b4f18e5 100644
--- a/examples/cpp/inference/MLP_Unify/mlp.cc
+++ b/examples/cpp/inference/MLP_Unify/mlp.cc
@@ -54,7 +54,7 @@ void FlexFlow::top_level_task(Task const *task,
   std::vector<MetricsType> metrics;
   metrics.push_back(METRICS_ACCURACY);
   metrics.push_back(METRICS_SPARSE_CATEGORICAL_CROSSENTROPY);
-  ff.compile(optimizer, LOSS_SPARSE_CATEGORICAL_CROSSENTROPY, metrics, CompMode.COMP_MODE_INFERENCE);
+  ff.compile(optimizer, LOSS_SPARSE_CATEGORICAL_CROSSENTROPY, metrics, CompMode::COMP_MODE_INFERENCE);
   ff.init_operators();
   // Start timer
   {

From a24fd7b83fb7b8cbb6adbf7de16cb2b49610f4ab Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 11 Nov 2022 06:48:36 +0000
Subject: [PATCH 004/344] fix inference case

---
 examples/cpp/inference/MLP_Unify/mlp.cc | 4 ----
 1 file changed, 4 deletions(-)

diff --git a/examples/cpp/inference/MLP_Unify/mlp.cc b/examples/cpp/inference/MLP_Unify/mlp.cc
index 434b4f18e5..26623b4a76 100644
--- a/examples/cpp/inference/MLP_Unify/mlp.cc
+++ b/examples/cpp/inference/MLP_Unify/mlp.cc
@@ -70,12 +70,8 @@ void FlexFlow::top_level_task(Task const *task,
   for (int iter = 0; iter < iterations; iter++) {
     runtime->begin_trace(ctx, 111 /*trace_id*/);
     ff.forward();
-    ff.zero_gradients();
-    // ff.backward();
-    // ff.update();
     runtime->end_trace(ctx, 111 /*trace_id*/);
   }
-  //}
   // End timer
   {
     runtime->issue_execution_fence(ctx);

From 6f6a281879c4411deddc7f0a1535f6b1df85f98d Mon Sep 17 00:00:00 2001
From: Ubuntu <ubuntu@ip-172-31-9-0.us-east-2.compute.internal>
Date: Fri, 11 Nov 2022 07:19:44 +0000
Subject: [PATCH 005/344] fix

---
 config/config.inc | 8 ++++----
 1 file changed, 4 insertions(+), 4 deletions(-)

diff --git a/config/config.inc b/config/config.inc
index 58632183b9..2308b8b66b 100644
--- a/config/config.inc
+++ b/config/config.inc
@@ -92,11 +92,11 @@ else
   SET_EXAMPLES="-DFF_BUILD_ALL_EXAMPLES=ON"
 fi
 if [ "$FF_BUILD_ALL_INFERENCE_EXAMPLES" = "ON" ]; then
-  SET_EXAMPLES="-DFF_BUILD_ALL_INFERENCE_EXAMPLES=ON"
+  SET_INFERENCE_EXAMPLES="-DFF_BUILD_ALL_INFERENCE_EXAMPLES=ON"
 elif [ "$FF_BUILD_ALL_INFERENCE_EXAMPLES" = "OFF" ]; then
-  SET_EXAMPLES="-DFF_BUILD_ALL_INFERENCE_EXAMPLES=OFF"
+  SET_INFERENCE_EXAMPLES="-DFF_BUILD_ALL_INFERENCE_EXAMPLES=OFF"
 else
-  SET_EXAMPLES="-DFF_BUILD_ALL_INFERENCE_EXAMPLES=ON"
+  SET_INFERENCE_EXAMPLES="-DFF_BUILD_ALL_INFERENCE_EXAMPLES=ON"
 fi
 
 # enable C++ unit tests
@@ -189,7 +189,7 @@ if [ -n "$FF_GPU_BACKEND" ]; then
   fi
 fi
 
-CMAKE_FLAGS="-DCUDA_USE_STATIC_CUDA_RUNTIME=OFF ${SET_CC} ${SET_CXX} ${SET_INSTALL_DIR} ${SET_BUILD} ${SET_CUDA_ARCH} ${SET_CUDA} ${SET_CUDNN} ${SET_PYTHON} ${SET_NCCL} ${SET_GASNET} ${SET_EXAMPLES} ${SET_USE_PREBUILT_LEGION} ${SET_USE_PREBUILT_NCCL} ${SET_USE_ALL_PREBUILT_LIBRARIES} ${SET_BUILD_UNIT_TESTS} ${SET_AVX2} ${SET_MAX_DIM} ${SET_ROCM_PATH} ${SET_FF_GPU_BACKEND}"
+CMAKE_FLAGS="-DCUDA_USE_STATIC_CUDA_RUNTIME=OFF ${SET_CC} ${SET_CXX} ${SET_INSTALL_DIR} ${SET_BUILD} ${SET_CUDA_ARCH} ${SET_CUDA} ${SET_CUDNN} ${SET_PYTHON} ${SET_NCCL} ${SET_GASNET} ${SET_EXAMPLES} ${SET_INFERENCE_EXAMPLES} ${SET_USE_PREBUILT_LEGION} ${SET_USE_PREBUILT_NCCL} ${SET_USE_ALL_PREBUILT_LIBRARIES} ${SET_BUILD_UNIT_TESTS} ${SET_AVX2} ${SET_MAX_DIM} ${SET_ROCM_PATH} ${SET_FF_GPU_BACKEND}"
 
 function run_cmake() {
 SRC_LOCATION=${SRC_LOCATION:=`dirname $0`/../}

From 9202297d846db45908b090a2bee0e37370780512 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 11 Nov 2022 18:53:37 +0000
Subject: [PATCH 006/344] added inference example for transformer

---
 CMakeLists.txt                                |   3 +
 .../cpp/inference/Transformer/CMakeLists.txt  |  19 +
 examples/cpp/inference/Transformer/Makefile   |  35 ++
 .../cpp/inference/Transformer/transformer.cc  | 397 ++++++++++++++++++
 .../cpp/inference/Transformer/transformer.cu  |  58 +++
 .../cpp/inference/Transformer/transformer.h   |  54 +++
 6 files changed, 566 insertions(+)
 create mode 100644 examples/cpp/inference/Transformer/CMakeLists.txt
 create mode 100644 examples/cpp/inference/Transformer/Makefile
 create mode 100644 examples/cpp/inference/Transformer/transformer.cc
 create mode 100644 examples/cpp/inference/Transformer/transformer.cu
 create mode 100644 examples/cpp/inference/Transformer/transformer.h

diff --git a/CMakeLists.txt b/CMakeLists.txt
index 4c86199992..5f886fcec0 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -419,6 +419,9 @@ endif()
 
 if(FF_BUILD_MOE OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/mixture_of_experts)
+
+if(FF_BUILD_TRANSFORMER OR FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
+  add_subdirectory(examples/cpp/inference/Transformer)
 endif()
 
 # installation
diff --git a/examples/cpp/inference/Transformer/CMakeLists.txt b/examples/cpp/inference/Transformer/CMakeLists.txt
new file mode 100644
index 0000000000..ac46d77f32
--- /dev/null
+++ b/examples/cpp/inference/Transformer/CMakeLists.txt
@@ -0,0 +1,19 @@
+cmake_minimum_required(VERSION 3.10)
+
+project(FlexFlowExample_Transformer)
+set(project_target transformer)
+
+set(CPU_SRC
+  ${FLEXFLOW_CPP_DRV_SRC}
+  transformer.cc
+  transformer.h)
+
+set(GPU_SRC
+transformer.cu)
+
+cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
+target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
+target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
+
+set(BIN_DEST "bin")
+install(TARGETS ${project_target} DESTINATION ${BIN_DEST})
diff --git a/examples/cpp/inference/Transformer/Makefile b/examples/cpp/inference/Transformer/Makefile
new file mode 100644
index 0000000000..911f234c45
--- /dev/null
+++ b/examples/cpp/inference/Transformer/Makefile
@@ -0,0 +1,35 @@
+# Copyright 2021 Facebook, Stanford, LANL
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+#
+
+# Flags for directing the runtime makefile what to include
+DEBUG           ?= 1		# Include debugging symbols
+MAX_DIM         ?= 4		# Maximum number of dimensions
+OUTPUT_LEVEL    ?= LEVEL_DEBUG	# Compile time logging level
+USE_CUDA        ?= 1		# Include CUDA support (requires CUDA)
+USE_GASNET      ?= 0		# Include GASNet support (requires GASNet)
+USE_HDF         ?= 1		# Include HDF5 support (requires HDF5)
+ALT_MAPPERS     ?= 0		# Include alternative mappers (not recommended)
+
+# Put the binary file name here
+OUTFILE		?= transformer
+# List all the application source files here
+GEN_SRC		= transformer.cc
+GEN_GPU_SRC	= transformer.cu
+
+ifndef FF_HOME
+$(error FF_HOME variable is not defined, aborting build)
+endif
+
+include $(FF_HOME)/FlexFlow.mk
diff --git a/examples/cpp/inference/Transformer/transformer.cc b/examples/cpp/inference/Transformer/transformer.cc
new file mode 100644
index 0000000000..38675577cc
--- /dev/null
+++ b/examples/cpp/inference/Transformer/transformer.cc
@@ -0,0 +1,397 @@
+/* Copyright 2021 Facebook
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "transformer.h"
+
+using namespace Legion;
+
+LegionRuntime::Logger::Category log_app("Transformer");
+
+Tensor create_emb(FFModel *model,
+                  Tensor const &input,
+                  int input_dim,
+                  int output_dim,
+                  int idx) {
+  float range = sqrt(1.0f / input_dim);
+  Initializer *embed_init = new UniformInitializer(std::rand(), -range, range);
+  return model->embedding(
+      input, input_dim, output_dim, AGGR_MODE_SUM, NULL, embed_init);
+}
+
+Tensor create_attention_encoder(FFModel *model,
+                                Tensor const &input,
+                                int hidden_dim,
+                                int num_heads,
+                                int kdim,
+                                int vdim) {
+  Tensor t = model->multihead_attention(
+      input, input, input, hidden_dim, num_heads, kdim, vdim);
+  return model->dense(model->dense(t, hidden_dim, AC_MODE_RELU, false /*bias*/),
+                      hidden_dim,
+                      AC_MODE_NONE,
+                      false /*bias*/);
+}
+
+void create_attention_encoder_decoder(FFModel *model,
+                                      Tensor const &input1,
+                                      Tensor const &input2,
+                                      Tensor &output1,
+                                      Tensor &output2,
+                                      int hidden_dim,
+                                      int num_heads,
+                                      int kdim,
+                                      int vdim) {
+  Tensor t1 =
+      model->add(model->multihead_attention(
+                     input1, input1, input1, hidden_dim, num_heads, kdim, vdim),
+                 input1);
+  t1 = model->dense(model->dense(t1, hidden_dim, AC_MODE_RELU, false /*bias*/),
+                    hidden_dim,
+                    AC_MODE_NONE,
+                    false /*bias*/);
+  Tensor t2 =
+      model->add(model->multihead_attention(
+                     input2, input2, input2, hidden_dim, num_heads, kdim, vdim),
+                 input2);
+  t2 = model->add(
+      model->multihead_attention(t2, t1, t1, hidden_dim, num_heads, kdim, vdim),
+      t2);
+  t2 = model->dense(model->dense(t2, hidden_dim, AC_MODE_RELU, false /*bias*/),
+                    hidden_dim,
+                    AC_MODE_NONE,
+                    false /*bias*/);
+  output1 = t1;
+  output2 = t2;
+}
+
+TransformerConfig::TransformerConfig(void) {
+  hidden_size = 1024;
+  embedding_size = 1024;
+  num_heads = 16;
+  num_layers = 12;
+  sequence_length = 512;
+}
+
+void parse_input_args(char **argv, int argc, TransformerConfig &config) {
+  for (int i = 1; i < argc; i++) {
+    if (!strcmp(argv[i], "--num-layers")) {
+      config.num_layers = atoi(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--embedding-size")) {
+      config.embedding_size = atoi(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--hidden-size")) {
+      config.hidden_size = atoi(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--num-heads")) {
+      config.num_heads = atoi(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--sequence-length")) {
+      config.sequence_length = atoi(argv[++i]);
+      continue;
+    }
+  }
+}
+
+void FlexFlow::top_level_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  FFConfig ffConfig;
+  TransformerConfig tfConfig;
+  {
+    InputArgs const &command_args = HighLevelRuntime::get_input_args();
+    char **argv = command_args.argv;
+    int argc = command_args.argc;
+    parse_input_args(argv, argc, tfConfig);
+    log_app.print("batchSize(%d) workersPerNodes(%d) numNodes(%d)",
+                  ffConfig.batchSize,
+                  ffConfig.workersPerNode,
+                  ffConfig.numNodes);
+    log_app.print("Hidden Size(%d)", tfConfig.hidden_size);
+    log_app.print("Embedding Vocab Size(%d)", tfConfig.embedding_size);
+    log_app.print("Number of Heads(%d)", tfConfig.num_heads);
+    log_app.print("Number of Layers(%d)", tfConfig.num_layers);
+    log_app.print("Sequence Length(%d)", tfConfig.sequence_length);
+  }
+  FFModel ff(ffConfig);
+  Tensor input;
+  {
+    int const dims[] = {
+        ffConfig.batchSize, tfConfig.sequence_length, tfConfig.hidden_size};
+    input = ff.create_tensor<3>(dims, DT_FLOAT);
+  }
+  // Tensor t = create_emb(&ff, input, tfConfig.embedding_size,
+  // tfConfig.hidden_size); Tensor input1 = input, input2 = input; Tensor t1,
+  // t2;
+  Tensor t = input;
+  for (int i = 0; i < tfConfig.num_layers; i++) {
+    t = create_attention_encoder(&ff,
+                                 t,
+                                 tfConfig.hidden_size,
+                                 tfConfig.num_heads,
+                                 tfConfig.hidden_size / tfConfig.num_heads,
+                                 tfConfig.hidden_size / tfConfig.num_heads);
+    // create_attention_encoder_decoder(&ff, input1, input2, t1, t2,
+    //     tfConfig.hidden_size, tfConfig.num_heads,
+    //     tfConfig.hidden_size / tfConfig.num_heads,
+    //     tfConfig.hidden_size / tfConfig.num_heads);
+    // input1 = t1;
+    // input2 = t2;
+  }
+  t = ff.dense(t, 1, AC_MODE_NONE, false /*bias*/);
+  Optimizer *optimizer = new SGDOptimizer(&ff, 0.01f);
+  std::vector<MetricsType> metrics;
+  // metrics.push_back(METRICS_ACCURACY);
+  // metrics.push_back(METRICS_MEAN_SQUARED_ERROR);
+  ff.compile(optimizer, LOSS_MEAN_SQUARED_ERROR_AVG_REDUCE, metrics, CompMode::COMP_MODE_INFERENCE);
+  // Data Loader
+  DataLoader loader(ff, tfConfig, input, ff.label_tensor);
+  loader.next_batch(ff);
+  loader.reset();
+  ff.init_operators();
+
+  // Start timer
+  {
+    runtime->issue_execution_fence(ctx);
+    TimingLauncher timer(MEASURE_MICRO_SECONDS);
+    Future future = runtime->issue_timing_measurement(ctx, timer);
+    future.get_void_result();
+  }
+  log_app.print("Warmup finished...Start timer...");
+  log_app.print("Num. epochs = %d", ffConfig.epochs);
+  log_app.print("Num. iterations/epoch = %d",
+                loader.num_samples / ffConfig.batchSize);
+  printf("parameters.size() = %lu\n", ff.parameters.size());
+  double ts_start = Realm::Clock::current_time_in_microseconds();
+  int epoch=0;
+  //for (int epoch = 0; epoch < ffConfig.epochs; epoch++) {
+    loader.reset();
+    ff.reset_metrics();
+    int iterations = loader.num_samples / ffConfig.batchSize;
+    for (int iter = 0; iter < iterations; iter++) {
+      // Only load data once for random input
+      if (iter == 0 && epoch == 0)
+        loader.next_batch(ff);
+      runtime->begin_trace(ctx, 111 /*trace_id*/);
+      ff.forward();
+      //ff.zero_gradients();
+      //ff.backward();
+      //ff.update();
+      runtime->end_trace(ctx, 111 /*trace_id*/);
+    }
+  //}
+  // End timer
+  {
+    runtime->issue_execution_fence(ctx);
+    TimingLauncher timer(MEASURE_MICRO_SECONDS);
+    Future future = runtime->issue_timing_measurement(ctx, timer);
+    future.get_void_result();
+  }
+  double ts_end = Realm::Clock::current_time_in_microseconds();
+  double run_time = 1e-6 * (ts_end - ts_start);
+  printf("ELAPSED TIME = %.4fs, THROUGHPUT = %.2f samples/s\n",
+         run_time,
+         loader.num_samples * ffConfig.epochs / run_time);
+}
+
+DataLoader::DataLoader(FFModel &ff,
+                       TransformerConfig const &tf,
+                       Tensor const &_input,
+                       Tensor const &_label) {
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  num_samples = 0;
+  log_app.print("Use random dataset...");
+  num_samples =
+      ff.config.batchSize * ff.config.workersPerNode * ff.config.numNodes;
+  log_app.print("Number of random samples = %d\n", num_samples);
+  return;
+  {
+    batch_input = _input;
+    int const dims[] = {num_samples, tf.sequence_length, tf.hidden_size};
+    full_input = ff.create_tensor<3>(dims, DT_FLOAT);
+  }
+  {
+    batch_label = _label;
+    int const dims[] = {num_samples, tf.sequence_length, 1};
+    full_label = ff.create_tensor<3>(dims, DT_FLOAT);
+  }
+  // Load entire dataset
+  // TODO: Use index launcher instead of task launcher
+  TaskLauncher launcher(CUSTOM_CPU_TASK_ID_1, TaskArgument(NULL, 0));
+  // regions[0]: full_sparse_input
+  launcher.add_region_requirement(
+      RegionRequirement(full_input->parallel_tensor->region,
+                        WRITE_ONLY,
+                        EXCLUSIVE,
+                        full_input->parallel_tensor->region,
+                        MAP_TO_FB_MEMORY));
+  launcher.add_field(0, FID_DATA);
+  // regions[1]: full_label
+  launcher.add_region_requirement(
+      RegionRequirement(full_label->parallel_tensor->region,
+                        WRITE_ONLY,
+                        EXCLUSIVE,
+                        full_label->parallel_tensor->region,
+                        MAP_TO_ZC_MEMORY));
+  launcher.add_field(1, FID_DATA);
+  runtime->execute_task(ctx, launcher);
+}
+
+void DataLoader::load_entire_dataset(Task const *task,
+                                     std::vector<PhysicalRegion> const &regions,
+                                     Context ctx,
+                                     Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+  // Note that these instances are in ZCM, can only use
+  // TensorAccessorW with readOutput flag
+  AccessorWO<float, 3> const acc_input(regions[0], FID_DATA);
+  AccessorWO<float, 3> const acc_label(regions[1], FID_DATA);
+  Rect<3> rect_input = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  Rect<3> rect_label = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+  assert(acc_input.accessor.is_dense_arbitrary(rect_input));
+  assert(acc_label.accessor.is_dense_arbitrary(rect_label));
+  float *input_ptr = acc_input.ptr(rect_input.lo);
+  float *label_ptr = acc_label.ptr(rect_label.lo);
+  // assert(rect_input == rect_label);
+
+  for (size_t i = 0; i < rect_input.volume(); i++)
+    input_ptr[i] = ((float)std::rand()) / RAND_MAX;
+  for (size_t i = 0; i < rect_label.volume(); i++)
+    label_ptr[i] = std::rand() % 2;
+}
+
+void DataLoader::next_batch(FFModel &ff) {
+  return;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  // Load Input
+  {
+    Domain domain = runtime->get_index_space_domain(
+        ctx, batch_input->parallel_tensor->parallel_is);
+    ArgumentMap argmap;
+    int idx = next_index;
+    for (Domain::DomainPointIterator it(domain); it; it++) {
+      SampleIdxs meta;
+      assert(ff.config.batchSize % batch_input->parallel_tensor->dims[2].size ==
+             0);
+      meta.num_samples =
+          ff.config.batchSize / batch_input->parallel_tensor->dims[2].size;
+      for (int i = 0; i < meta.num_samples; i++)
+        meta.idxs[i] = idx++;
+      argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
+    }
+    IndexLauncher launcher(CUSTOM_GPU_TASK_ID_2,
+                           batch_input->parallel_tensor->parallel_is,
+                           TaskArgument(NULL, 0),
+                           argmap,
+                           Predicate::TRUE_PRED,
+                           false /*must*/,
+                           0 /*mapper_id*/,
+                           batch_input->parallel_tensor->machine_view.hash());
+    // Full dataset in ZCM
+    launcher.add_region_requirement(
+        RegionRequirement(full_input->parallel_tensor->region,
+                          0 /*projection id*/,
+                          READ_ONLY,
+                          EXCLUSIVE,
+                          full_input->parallel_tensor->region,
+                          MAP_TO_ZC_MEMORY));
+    launcher.add_field(0, FID_DATA);
+    launcher.add_region_requirement(
+        RegionRequirement(batch_input->parallel_tensor->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_input->parallel_tensor->region));
+    launcher.add_field(1, FID_DATA);
+    runtime->execute_index_space(ctx, launcher);
+  }
+  // Load Labels
+  {
+    Domain domain = runtime->get_index_space_domain(
+        ctx, batch_label->parallel_tensor->parallel_is);
+    ArgumentMap argmap;
+    int idx = next_index;
+    for (Domain::DomainPointIterator it(domain); it; it++) {
+      SampleIdxs meta;
+      assert(ff.config.batchSize % batch_label->parallel_tensor->dims[2].size ==
+             0);
+      meta.num_samples =
+          ff.config.batchSize / batch_label->parallel_tensor->dims[2].size;
+      for (int i = 0; i < meta.num_samples; i++)
+        meta.idxs[i] = idx++;
+      argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
+    }
+    IndexLauncher launcher(CUSTOM_GPU_TASK_ID_2,
+                           batch_label->parallel_tensor->parallel_is,
+                           TaskArgument(NULL, 0),
+                           argmap,
+                           Predicate::TRUE_PRED,
+                           false /*must*/,
+                           0 /*mapper_id*/,
+                           batch_label->parallel_tensor->machine_view.hash());
+    // Full dataset in ZCM
+    launcher.add_region_requirement(
+        RegionRequirement(full_label->parallel_tensor->region,
+                          0 /*projection id*/,
+                          READ_ONLY,
+                          EXCLUSIVE,
+                          full_label->parallel_tensor->region,
+                          MAP_TO_ZC_MEMORY));
+    launcher.add_field(0, FID_DATA);
+    launcher.add_region_requirement(
+        RegionRequirement(batch_label->parallel_tensor->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_label->parallel_tensor->region));
+    launcher.add_field(1, FID_DATA);
+    runtime->execute_index_space(ctx, launcher);
+  }
+  // progress next_index
+  next_index += ff.config.batchSize;
+}
+
+void DataLoader::reset() {
+  next_index = 0;
+}
+
+void FlexFlow::register_custom_tasks() {
+  // Load entire dataset
+  {
+    TaskVariantRegistrar registrar(CUSTOM_CPU_TASK_ID_1, "Load Entire Dataset");
+    registrar.add_constraint(ProcessorConstraint(Processor::LOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<DataLoader::load_entire_dataset>(
+        registrar, "Load Entire Dataset Task");
+  }
+  // Load input
+  {
+    TaskVariantRegistrar registrar(CUSTOM_GPU_TASK_ID_2, "Load Inputs");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<DataLoader::load_input>(
+        registrar, "Load Inputs Task");
+  }
+}
diff --git a/examples/cpp/inference/Transformer/transformer.cu b/examples/cpp/inference/Transformer/transformer.cu
new file mode 100644
index 0000000000..7da473e54c
--- /dev/null
+++ b/examples/cpp/inference/Transformer/transformer.cu
@@ -0,0 +1,58 @@
+/* Copyright 2021 Stanford, Facebook
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/utils/cuda_helper.h"
+#include "transformer.h"
+
+void DataLoader::load_input(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+  SampleIdxs *meta = (SampleIdxs *)task->local_args;
+  TensorAccessorR<float, 3> acc_full_input(
+      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  TensorAccessorW<float, 3> acc_batch_input(regions[1],
+                                            task->regions[1],
+                                            FID_DATA,
+                                            ctx,
+                                            runtime,
+                                            false /*readOutput*/);
+  int batch_size = acc_batch_input.rect.hi[2] - acc_batch_input.rect.lo[2] + 1;
+  int embed_size = acc_batch_input.rect.hi[0] - acc_batch_input.rect.lo[0] + 1;
+  int seq_length = acc_batch_input.rect.hi[1] - acc_batch_input.rect.lo[1] + 1;
+  assert(acc_batch_input.rect.hi[0] == acc_full_input.rect.hi[0]);
+  assert(acc_batch_input.rect.lo[0] == acc_full_input.rect.lo[0]);
+  assert(acc_batch_input.rect.hi[1] == acc_full_input.rect.hi[1]);
+  assert(acc_batch_input.rect.lo[1] == acc_full_input.rect.lo[1]);
+
+  float *input_zc;
+  checkCUDA(cudaHostAlloc(&input_zc,
+                          sizeof(float) * acc_batch_input.rect.volume(),
+                          cudaHostAllocPortable | cudaHostAllocMapped));
+  assert(batch_size == meta->num_samples);
+  for (int i = 0; i < batch_size; i++) {
+    int base_offset = meta->idxs[i] * embed_size * seq_length;
+    for (int j = 0; j < embed_size * seq_length; j++)
+      input_zc[i * embed_size * seq_length + j] =
+          acc_full_input.ptr[base_offset + j];
+  }
+  checkCUDA(cudaMemcpy(acc_batch_input.ptr,
+                       input_zc,
+                       sizeof(float) * acc_batch_input.rect.volume(),
+                       cudaMemcpyHostToDevice));
+  checkCUDA(cudaFreeHost(input_zc));
+}
diff --git a/examples/cpp/inference/Transformer/transformer.h b/examples/cpp/inference/Transformer/transformer.h
new file mode 100644
index 0000000000..551a9eff19
--- /dev/null
+++ b/examples/cpp/inference/Transformer/transformer.h
@@ -0,0 +1,54 @@
+/* Copyright 2021 Facebook, Stanford
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/model.h"
+#define MAX_NUM_SAMPLES 65536
+
+using namespace Legion;
+using namespace FlexFlow;
+
+struct TransformerConfig {
+  TransformerConfig(void);
+  int hidden_size, embedding_size, num_heads, num_layers, sequence_length;
+};
+
+class DataLoader {
+public:
+  DataLoader(FFModel &ff,
+             TransformerConfig const &tf,
+             Tensor const &_input,
+             Tensor const &_label);
+  void next_batch(FFModel &ff);
+  void reset();
+  static void load_entire_dataset(Task const *task,
+                                  std::vector<PhysicalRegion> const &regions,
+                                  Context ctx,
+                                  Runtime *runtime);
+  static void load_input(Task const *task,
+                         std::vector<PhysicalRegion> const &regions,
+                         Context ctx,
+                         Runtime *runtime);
+
+public:
+  int num_samples, next_index;
+
+private:
+  Tensor full_input, batch_input, full_label, batch_label;
+};
+
+struct SampleIdxs {
+  int num_samples;
+  int idxs[MAX_NUM_SAMPLES];
+};

From f8644691e1c3e1c8fc4d9bc79efa1097ee366706 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 13 Nov 2022 11:13:47 -0500
Subject: [PATCH 007/344] added g-shard stub

---
 CMakeLists.txt                                |   9 +-
 .../cpp/inference/G-Shard-MoE/CMakeLists.txt  |  12 ++
 examples/cpp/inference/G-Shard-MoE/Makefile   |  39 ++++++
 examples/cpp/inference/G-Shard-MoE/g_shard.cc | 121 ++++++++++++++++++
 4 files changed, 180 insertions(+), 1 deletion(-)
 create mode 100644 examples/cpp/inference/G-Shard-MoE/CMakeLists.txt
 create mode 100644 examples/cpp/inference/G-Shard-MoE/Makefile
 create mode 100644 examples/cpp/inference/G-Shard-MoE/g_shard.cc

diff --git a/CMakeLists.txt b/CMakeLists.txt
index 5f886fcec0..07d77fb129 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -335,6 +335,8 @@ option(FF_BUILD_MLP_UNIFY "build mlp unify example" OFF)
 option(FF_BUILD_SPLIT_TEST "build split test example" OFF)
 option(FF_BUILD_SPLIT_TEST_2 "build split test 2 example" OFF)
 option(FF_BUILD_MLP_UNIFY_INFERENCE "build mlp unify inference example" OFF)
+option(FF_BUILD_TRANSFORMER_INFERENCE "build transformer inference example" OFF)
+option(FF_BUILD_G_SHARD_INFERENCE "build G-Shard inference example" OFF)
 option(FF_BUILD_ALL_INFERENCE_EXAMPLES "build all inference examples. Overrides others" OFF)
 option(FF_BUILD_ALL_EXAMPLES "build all examples. Overrides others" OFF)
 option(FF_BUILD_UNIT_TESTS "build non-operator unit tests" OFF)
@@ -419,11 +421,16 @@ endif()
 
 if(FF_BUILD_MOE OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/mixture_of_experts)
+endif()
 
-if(FF_BUILD_TRANSFORMER OR FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
+if(FF_BUILD_TRANSFORMER_INFERENCE OR FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/inference/Transformer)
 endif()
 
+if(FF_BUILD_G_SHARD_INFERENCE OR FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
+  add_subdirectory(examples/cpp/inference/G-Shard-MoE)
+endif()
+
 # installation
 set(INCLUDE_DEST "include")
 set(LIB_DEST "lib")
diff --git a/examples/cpp/inference/G-Shard-MoE/CMakeLists.txt b/examples/cpp/inference/G-Shard-MoE/CMakeLists.txt
new file mode 100644
index 0000000000..daab2dc49b
--- /dev/null
+++ b/examples/cpp/inference/G-Shard-MoE/CMakeLists.txt
@@ -0,0 +1,12 @@
+cmake_minimum_required(VERSION 3.10)
+
+project(FlexFlowExampleInferenceGShard)
+set(project_target g_shard)
+
+set(CPU_SRC
+  ${FLEXFLOW_CPP_DRV_SRC}
+  g_shard.cc)
+
+cuda_add_executable(${project_target} ${CPU_SRC})
+target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
+target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
diff --git a/examples/cpp/inference/G-Shard-MoE/Makefile b/examples/cpp/inference/G-Shard-MoE/Makefile
new file mode 100644
index 0000000000..f64e670e05
--- /dev/null
+++ b/examples/cpp/inference/G-Shard-MoE/Makefile
@@ -0,0 +1,39 @@
+# Copyright 2021 CMU, Facebook, LANL, MIT, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+#
+
+# Flags for directing the runtime makefile what to include
+DEBUG           ?= 1		# Include debugging symbols
+MAX_DIM         ?= 5		# Maximum number of dimensions
+OUTPUT_LEVEL    ?= LEVEL_DEBUG	# Compile time logging level
+USE_CUDA        ?= 0		# Include CUDA support (requires CUDA)
+USE_GASNET      ?= 0		# Include GASNet support (requires GASNet)
+USE_HDF         ?= 0		# Include HDF5 support (requires HDF5)
+ALT_MAPPERS     ?= 0		# Include alternative mappers (not recommended)
+USE_HIP         ?= 1		# Include HIP support (requires HIP)
+HIP_TARGET      ?= ROCM
+USE_GPU_REDUCTIONS ?= 0
+
+# Put the binary file name here
+OUTFILE		?= g_shard
+# List all the application source files here
+GEN_SRC		= g_shard.cc
+GEN_GPU_SRC	=
+GEN_HIP_SRC     =
+
+ifndef FF_HOME
+$(error FF_HOME variable is not defined, aborting build)
+endif
+
+include $(FF_HOME)/FlexFlow.mk
diff --git a/examples/cpp/inference/G-Shard-MoE/g_shard.cc b/examples/cpp/inference/G-Shard-MoE/g_shard.cc
new file mode 100644
index 0000000000..253fe77c93
--- /dev/null
+++ b/examples/cpp/inference/G-Shard-MoE/g_shard.cc
@@ -0,0 +1,121 @@
+/* Copyright 2021 Stanford University
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/model.h"
+#include <fstream>
+#include <sstream>
+#include <string>
+using namespace Legion;
+using namespace FlexFlow;
+
+void create_attention_decoder(FFModel *model,
+                                      Tensor const &input1,
+                                      Tensor const &input2,
+                                      Tensor &output1,
+                                      Tensor &output2,
+                                      int hidden_dim,
+                                      int num_heads,
+                                      int kdim,
+                                      int vdim) {
+  Tensor t1 =
+      model->add(model->multihead_attention(
+                     input1, input1, input1, hidden_dim, num_heads, kdim, vdim),
+                 input1);
+  t1 = model->dense(model->dense(t1, hidden_dim, AC_MODE_RELU, false /*bias*/),
+                    hidden_dim,
+                    AC_MODE_NONE,
+                    false /*bias*/);
+  Tensor t2 =
+      model->add(model->multihead_attention(
+                     input2, input2, input2, hidden_dim, num_heads, kdim, vdim),
+                 input2);
+  t2 = model->add(
+      model->multihead_attention(t2, t1, t1, hidden_dim, num_heads, kdim, vdim),
+      t2);
+  t2 = model->dense(model->dense(t2, hidden_dim, AC_MODE_RELU, false /*bias*/),
+                    hidden_dim,
+                    AC_MODE_NONE,
+                    false /*bias*/);
+  output1 = t1;
+  output2 = t2;
+}
+
+void FlexFlow::top_level_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  FFConfig ffConfig;
+  fprintf(stderr,
+          "batchSize(%d) workersPerNodes(%d) numNodes(%d)\n",
+          ffConfig.batchSize,
+          ffConfig.workersPerNode,
+          ffConfig.numNodes);
+  FFModel ff(ffConfig);
+
+  std::vector<int> hidden_dims = {
+      8192, 8192, 8192, 8192, 8192, 8192, 8192, 8192};
+  Tensor input1, input2;
+  {
+    int const dims[] = {ffConfig.batchSize, 1024};
+    input1 = ff.create_tensor<2>(dims, DT_FLOAT);
+    input2 = ff.create_tensor<2>(dims, DT_FLOAT);
+  }
+  Tensor t1 = input1, t2 = input2;
+  for (size_t i = 0; i < hidden_dims.size(); i++) {
+    int const dims[] = {hidden_dims[i], t1->dims[0]};
+    ActiMode acti_mode =
+        (i + 1 == hidden_dims.size()) ? AC_MODE_NONE : AC_MODE_RELU;
+    t1 = ff.dense(t1, hidden_dims[i], acti_mode, false);
+    t2 = ff.dense(t2, hidden_dims[i], acti_mode, false);
+  }
+  Tensor t = ff.add(t1, t2);
+  t = ff.softmax(t);
+  Optimizer *optimizer = new SGDOptimizer(&ff, 0.001f);
+  std::vector<MetricsType> metrics;
+  metrics.push_back(METRICS_ACCURACY);
+  metrics.push_back(METRICS_SPARSE_CATEGORICAL_CROSSENTROPY);
+  ff.compile(optimizer, LOSS_SPARSE_CATEGORICAL_CROSSENTROPY, metrics, CompMode::COMP_MODE_INFERENCE);
+  ff.init_operators();
+  // Start timer
+  {
+    runtime->issue_execution_fence(ctx);
+    TimingLauncher timer(MEASURE_MICRO_SECONDS);
+    Future future = runtime->issue_timing_measurement(ctx, timer);
+    future.get_void_result();
+  }
+  double ts_start = Realm::Clock::current_time_in_microseconds();
+  //for (int epoch = 0; epoch < ffConfig.epochs; epoch++) {
+  ff.reset_metrics();
+  int iterations = 128;
+  for (int iter = 0; iter < iterations; iter++) {
+    runtime->begin_trace(ctx, 111 /*trace_id*/);
+    ff.forward();
+    runtime->end_trace(ctx, 111 /*trace_id*/);
+  }
+  // End timer
+  {
+    runtime->issue_execution_fence(ctx);
+    TimingLauncher timer(MEASURE_MICRO_SECONDS);
+    Future future = runtime->issue_timing_measurement(ctx, timer);
+    future.get_void_result();
+  }
+  double ts_end = Realm::Clock::current_time_in_microseconds();
+  double run_time = 1e-6 * (ts_end - ts_start);
+  printf("ELAPSED TIME = %.4fs, THROUGHPUT = %.2f samples/s\n",
+         run_time,
+         ffConfig.batchSize * 128 * ffConfig.epochs / run_time);
+}
+
+void FlexFlow::register_custom_tasks() {}

From 7eb3a106ad554f90ee1cd900d8c116f45a781a12 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <ict@gabrieleoliaro.it>
Date: Wed, 16 Nov 2022 03:01:29 -0500
Subject: [PATCH 008/344] setting batch_size=1

---
 examples/cpp/inference/MLP_Unify/mlp.cc | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/examples/cpp/inference/MLP_Unify/mlp.cc b/examples/cpp/inference/MLP_Unify/mlp.cc
index 26623b4a76..9479cb3bcf 100644
--- a/examples/cpp/inference/MLP_Unify/mlp.cc
+++ b/examples/cpp/inference/MLP_Unify/mlp.cc
@@ -25,6 +25,7 @@ void FlexFlow::top_level_task(Task const *task,
                               Context ctx,
                               Runtime *runtime) {
   FFConfig ffConfig;
+  ffConfig.batchSize=1;
   fprintf(stderr,
           "batchSize(%d) workersPerNodes(%d) numNodes(%d)\n",
           ffConfig.batchSize,
@@ -36,7 +37,7 @@ void FlexFlow::top_level_task(Task const *task,
       8192, 8192, 8192, 8192, 8192, 8192, 8192, 8192};
   Tensor input1, input2;
   {
-    int const dims[] = {ffConfig.batchSize, 1024};
+    int const dims[] = {64, 1024};
     input1 = ff.create_tensor<2>(dims, DT_FLOAT);
     input2 = ff.create_tensor<2>(dims, DT_FLOAT);
   }

From aa0385030423797724092decc30d5539f7ec6bce Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 16 Nov 2022 15:51:50 +0000
Subject: [PATCH 009/344] added stub of moe part

---
 examples/cpp/inference/G-Shard-MoE/g_shard.cc | 76 ++++++++++++++++++-
 1 file changed, 74 insertions(+), 2 deletions(-)

diff --git a/examples/cpp/inference/G-Shard-MoE/g_shard.cc b/examples/cpp/inference/G-Shard-MoE/g_shard.cc
index 253fe77c93..d8310998f9 100644
--- a/examples/cpp/inference/G-Shard-MoE/g_shard.cc
+++ b/examples/cpp/inference/G-Shard-MoE/g_shard.cc
@@ -20,15 +20,87 @@
 using namespace Legion;
 using namespace FlexFlow;
 
+// embed_dim=768,
+// num_heads=12,
+// kdim=None,
+// vdim=None,
+// dropout=0.1,
+// bias=True,
+// add_bias_kv=False,
+// add_zero_attn=False,
+// self_attention=True,
+// encoder_decoder_attention=False,
+// q_noise=0.0,
+// qn_block_size=8,
+
+// Tensor FFModel::multihead_attention(const Tensor query,
+// const Tensor key,
+// const Tensor value,
+// int embed_dim,
+// int num_heads,
+// int kdim,
+// int vdim,
+// float dropout,
+// bool bias,
+// bool add_bias_kv,
+// bool add_zero_attn,
+// Initializer *kernel_initializer,
+// char const *name) {
+
+
 void create_attention_decoder(FFModel *model,
                                       Tensor const &input1,
                                       Tensor const &input2,
                                       Tensor &output1,
                                       Tensor &output2,
-                                      int hidden_dim,
+                                      int embed_dim,
                                       int num_heads,
                                       int kdim,
-                                      int vdim) {
+                                      int vdim,
+                                      float dropout=0.1,
+                                      bool normalize_before,
+                                      bool is_moe) {
+  
+  std::vector<int> axes = {embed_dim};
+  Tensor x = normalize_before ? model->LayerNorm(input1 /*const Tensor input*/, &axes /*std::vector<int> const &axes*/, true /*elementwise_affine*/, 1e-05 /*eps*/) : input1;
+  x = model->add(model->dropout(model->multihead_attention(x, x, x, embed_dim, num_heads, embed_dim, embed_dim, dropout, true /*bias*/, false /*add_bias_kv*/, false /*add_zero_attn*/), dropout), x);
+  //x = normalize_before ? x : model->LayerNorm(x, &axes, true, 1e-05);
+  x = model->LayerNorm(x, &axes, true, 1e-05);
+
+  if(!is_moe) {
+    x = model->dropout(model->dense(model->dropout(model->dense(x, 3072, AC_MODE_GELU, true /*bias*/), dropout), embed_dim, AC_MODE_NONE, true /*bias*/), dropout);
+  } else {
+    // x - seq_len, batch_size, model_dim
+    // x = x.transpose(0, 1) # batch_size, seq_len, model_dim
+    // x, l_aux = self.moe_layer(x)
+    // x = x.transpose(0, 1) # seq_len, batch_size, model_dim
+    //x = self.residual_connection(x, residual)
+    
+    //if not self.normalize_before:
+    //    x = self.final_layer_norm(x)
+    x = normalize_before ? x : model->LayerNorm(x, &axes, true, 1e-05);
+    float alpha = 2.0f;   // factor overhead tensor size for imbalance
+    float lambda = 0.04f; // multiplier for load balance term
+
+    // MoE model
+    Tensor gate_preds = ff.dense(x, num_exp, AC_MODE_RELU);
+    Tensor topK_output[2];
+    ff.top_k(gate_preds, topK_output, num_select, false);
+
+    Tensor exp_tensors[num_exp];
+    ff.group_by(input, topK_output[1], exp_tensors, num_exp, alpha);
+
+    Tensor agg_inputs[num_exp + 4];
+    agg_inputs[0] = ff.softmax(topK_output[0]); // gate preds
+    agg_inputs[1] = topK_output[1];             // gate assign
+    agg_inputs[2] = topK_output[1];             // gate assign TopK (for cache)
+    agg_inputs[3] = gate_preds;                 // full gate preds
+    for (int i = 0; i < num_exp; i++) {
+      Tensor exp_pred = ff.dense(exp_tensors[i], OUT_DIM, AC_MODE_RELU);
+      agg_inputs[i + 4] = ff.softmax(exp_pred);
+    }
+  }
+  
   Tensor t1 =
       model->add(model->multihead_attention(
                      input1, input1, input1, hidden_dim, num_heads, kdim, vdim),

From b1e1ed43c280d9981bba197ddacef9ad79c78295 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 16 Nov 2022 16:01:57 +0000
Subject: [PATCH 010/344] added moe placeholder

---
 examples/cpp/inference/G-Shard-MoE/g_shard.cc | 69 ++++++++++---------
 1 file changed, 36 insertions(+), 33 deletions(-)

diff --git a/examples/cpp/inference/G-Shard-MoE/g_shard.cc b/examples/cpp/inference/G-Shard-MoE/g_shard.cc
index d8310998f9..95c0b3f1dd 100644
--- a/examples/cpp/inference/G-Shard-MoE/g_shard.cc
+++ b/examples/cpp/inference/G-Shard-MoE/g_shard.cc
@@ -58,14 +58,14 @@ void create_attention_decoder(FFModel *model,
                                       int kdim,
                                       int vdim,
                                       float dropout=0.1,
-                                      bool normalize_before,
-                                      bool is_moe) {
+                                      bool normalize_before=false,
+                                      bool is_moe=false) {
   
   std::vector<int> axes = {embed_dim};
-  Tensor x = normalize_before ? model->LayerNorm(input1 /*const Tensor input*/, &axes /*std::vector<int> const &axes*/, true /*elementwise_affine*/, 1e-05 /*eps*/) : input1;
+  Tensor x = normalize_before ? model->layer_norm(input1 /*const Tensor input*/, axes /*std::vector<int> const &axes*/, true /*elementwise_affine*/, 1e-05 /*eps*/) : input1;
   x = model->add(model->dropout(model->multihead_attention(x, x, x, embed_dim, num_heads, embed_dim, embed_dim, dropout, true /*bias*/, false /*add_bias_kv*/, false /*add_zero_attn*/), dropout), x);
-  //x = normalize_before ? x : model->LayerNorm(x, &axes, true, 1e-05);
-  x = model->LayerNorm(x, &axes, true, 1e-05);
+  //x = normalize_before ? x : model->layer_norm(x, axes, true, 1e-05);
+  x = model->layer_norm(x, axes, true, 1e-05);
 
   if(!is_moe) {
     x = model->dropout(model->dense(model->dropout(model->dense(x, 3072, AC_MODE_GELU, true /*bias*/), dropout), embed_dim, AC_MODE_NONE, true /*bias*/), dropout);
@@ -78,50 +78,53 @@ void create_attention_decoder(FFModel *model,
     
     //if not self.normalize_before:
     //    x = self.final_layer_norm(x)
-    x = normalize_before ? x : model->LayerNorm(x, &axes, true, 1e-05);
+    x = normalize_before ? x : model->layer_norm(x, axes, true, 1e-05);
     float alpha = 2.0f;   // factor overhead tensor size for imbalance
     float lambda = 0.04f; // multiplier for load balance term
+    int num_exp = 128;
+    int num_select = 2;
 
     // MoE model
-    Tensor gate_preds = ff.dense(x, num_exp, AC_MODE_RELU);
+    Tensor input = x;
+    Tensor gate_preds = model->dense(x, num_exp, AC_MODE_RELU);
     Tensor topK_output[2];
-    ff.top_k(gate_preds, topK_output, num_select, false);
+    model->top_k(gate_preds, topK_output, num_select, false);
 
     Tensor exp_tensors[num_exp];
-    ff.group_by(input, topK_output[1], exp_tensors, num_exp, alpha);
+    model->group_by(input, topK_output[1], exp_tensors, num_exp, alpha);
 
     Tensor agg_inputs[num_exp + 4];
-    agg_inputs[0] = ff.softmax(topK_output[0]); // gate preds
+    agg_inputs[0] = model->softmax(topK_output[0]); // gate preds
     agg_inputs[1] = topK_output[1];             // gate assign
     agg_inputs[2] = topK_output[1];             // gate assign TopK (for cache)
     agg_inputs[3] = gate_preds;                 // full gate preds
     for (int i = 0; i < num_exp; i++) {
-      Tensor exp_pred = ff.dense(exp_tensors[i], OUT_DIM, AC_MODE_RELU);
-      agg_inputs[i + 4] = ff.softmax(exp_pred);
+      Tensor exp_pred = model->dense(exp_tensors[i], embed_dim, AC_MODE_RELU);
+      agg_inputs[i + 4] = model->softmax(exp_pred);
     }
   }
   
-  Tensor t1 =
-      model->add(model->multihead_attention(
-                     input1, input1, input1, hidden_dim, num_heads, kdim, vdim),
-                 input1);
-  t1 = model->dense(model->dense(t1, hidden_dim, AC_MODE_RELU, false /*bias*/),
-                    hidden_dim,
-                    AC_MODE_NONE,
-                    false /*bias*/);
-  Tensor t2 =
-      model->add(model->multihead_attention(
-                     input2, input2, input2, hidden_dim, num_heads, kdim, vdim),
-                 input2);
-  t2 = model->add(
-      model->multihead_attention(t2, t1, t1, hidden_dim, num_heads, kdim, vdim),
-      t2);
-  t2 = model->dense(model->dense(t2, hidden_dim, AC_MODE_RELU, false /*bias*/),
-                    hidden_dim,
-                    AC_MODE_NONE,
-                    false /*bias*/);
-  output1 = t1;
-  output2 = t2;
+  // Tensor t1 =
+  //     model->add(model->multihead_attention(
+  //                    input1, input1, input1, hidden_dim, num_heads, kdim, vdim),
+  //                input1);
+  // t1 = model->dense(model->dense(t1, hidden_dim, AC_MODE_RELU, false /*bias*/),
+  //                   hidden_dim,
+  //                   AC_MODE_NONE,
+  //                   false /*bias*/);
+  // Tensor t2 =
+  //     model->add(model->multihead_attention(
+  //                    input2, input2, input2, hidden_dim, num_heads, kdim, vdim),
+  //                input2);
+  // t2 = model->add(
+  //     model->multihead_attention(t2, t1, t1, hidden_dim, num_heads, kdim, vdim),
+  //     t2);
+  // t2 = model->dense(model->dense(t2, hidden_dim, AC_MODE_RELU, false /*bias*/),
+  //                   hidden_dim,
+  //                   AC_MODE_NONE,
+  //                   false /*bias*/);
+  // output1 = t1;
+  // output2 = t2;
 }
 
 void FlexFlow::top_level_task(Task const *task,

From b895fd0373528ac74c68e319b6664219aac1fb00 Mon Sep 17 00:00:00 2001
From: Rae Wong <33883582+yingyee0111@users.noreply.github.com>
Date: Wed, 16 Nov 2022 11:14:03 -0500
Subject: [PATCH 011/344] Data generator script, to refactor interface later

---
 examples/cpp/inference/data_generator.cpp | 140 ++++++++++++++++++++++
 1 file changed, 140 insertions(+)
 create mode 100644 examples/cpp/inference/data_generator.cpp

diff --git a/examples/cpp/inference/data_generator.cpp b/examples/cpp/inference/data_generator.cpp
new file mode 100644
index 0000000000..b6b2fc2ede
--- /dev/null
+++ b/examples/cpp/inference/data_generator.cpp
@@ -0,0 +1,140 @@
+//
+//  main.cpp
+//  dataloader
+//
+//  Created by User on 11/15/22.
+//
+
+#include <iostream>
+#include <ctime>
+#include <random>
+#include <unistd.h>
+#include <chrono>
+#include <thread>
+#include <math.h>
+using namespace std;
+typedef std::chrono::high_resolution_clock Clock;
+typedef std::chrono::milliseconds milliseconds;
+
+class Generator {
+    public:
+        size_t num_requests; // total number of requests
+        size_t tensor_size; // dimension of one request tensor
+        bool poisson; // false implied uniform distribution
+        double lambda; // mean #num of arrivals per sec
+        
+        Generator(size_t req, size_t tensor, bool poi, double lamb) {
+            num_requests = req;
+            tensor_size = tensor;
+            poisson = poi;
+            lambda = lamb;
+            compute_distribution();
+            arrivals_ptr = arrivals.begin();
+            timer_started = false;
+        }
+    
+        vector<vector<double>> get_requests(void); // function to retrieve requests
+    
+    private:
+        bool timer_started; // tracks if start time has been initiated
+        Clock::time_point start_time; // time when get_requests() is called for the first time
+        vector<double> arrivals; // arrival times (ms) generated based on distribution
+        vector<double>::iterator arrivals_ptr; // next request to output
+    
+        void compute_distribution( void ); // populate arrivals
+        vector<double> get_random_tensor(void); // generate a random tensor
+};
+
+void Generator::compute_distribution( void ) {
+    // set up uniform number generator [0,1)
+    random_device rnd;
+    mt19937 gen(rnd());
+    uniform_real_distribution<double> dist {0, 1.0};
+    double cur_arrival = 0; // assume first request comes in at time 0
+    
+    for (size_t i = 0; i < num_requests; i++) {
+        arrivals.push_back(cur_arrival);
+        cout << "arrival time " << i << ": +" << cur_arrival << "ms \n";
+        
+        if (poisson) {
+            double u = dist(gen);
+            double interval = -(1/lambda) * log(1-u) * 1000;
+            cur_arrival += interval;
+        } else {
+            cur_arrival += (1000/lambda);
+        }
+    }
+    return;
+};
+
+vector<vector<double>> Generator::get_requests(void) {
+    Clock::time_point cur_time = Clock::now();
+    vector<vector<double>> requests;
+    if (!timer_started){
+        // simply return one request and start timer for the first call
+        start_time = Clock::now();
+        timer_started = true;
+        arrivals_ptr++;
+        requests.push_back(get_random_tensor());
+        return requests;
+    }
+    
+    // output requests till we reach current timestamp
+    milliseconds ms_from_start = chrono::duration_cast<milliseconds>(cur_time - start_time);
+    while (arrivals_ptr < arrivals.end() && ms_from_start.count() >= *arrivals_ptr){
+        cout << "output request at arrival time +" << *arrivals_ptr << "\n";
+        requests.push_back(get_random_tensor());
+        arrivals_ptr++;
+    }
+    return requests;
+};
+
+vector<double> Generator::get_random_tensor(void) {
+    random_device rnd_device;
+    mt19937 mersenne_engine {rnd_device()};
+    uniform_real_distribution<double> dist {0, 1.0}; // state distribution
+    
+    auto gen = [&dist, &mersenne_engine](){
+                   return dist(mersenne_engine);
+               };
+
+    vector<double> vec(tensor_size);
+    generate(begin(vec), end(vec), gen);
+    return vec;
+};
+
+// for debugging
+void print_requests(vector<vector<double>> req) {
+    cout << "printing requests\n";
+    for (vector<double> v: req){
+        for (double e: v) {
+            cout << e << ",";
+        }
+        cout << "\n";
+    }
+    cout << "\n";
+};
+
+int main(int argc, const char * argv[]) {
+    // insert code here...
+    cout << "Hello, World!\n";
+    Generator data_generator(10, 4, true, 1);
+    
+    vector<vector<double>> req0 = data_generator.get_requests();
+    print_requests(req0);
+    
+    this_thread::sleep_for(milliseconds(1200));
+    vector<vector<double>> req1200 = data_generator.get_requests();
+    print_requests(req1200);
+    
+    this_thread::sleep_for(milliseconds(10));
+    vector<vector<double>> req1210 = data_generator.get_requests();
+    print_requests(req1210);
+    
+    this_thread::sleep_for(milliseconds(4000));
+    vector<vector<double>> req5210 = data_generator.get_requests();
+    print_requests(req5210);
+    
+    
+    return 0;
+}

From dcac31af79db74e05c2bb6a6288005e2cacddaa1 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 16 Nov 2022 17:53:49 +0000
Subject: [PATCH 012/344] integrate with Rae's generator

---
 .../cpp/inference/MLP_Unify/CMakeLists.txt    |  4 ++-
 examples/cpp/inference/MLP_Unify/mlp.cc       | 27 ++++++++++++++-----
 2 files changed, 24 insertions(+), 7 deletions(-)

diff --git a/examples/cpp/inference/MLP_Unify/CMakeLists.txt b/examples/cpp/inference/MLP_Unify/CMakeLists.txt
index e4299dcfb3..5a2402fdd0 100644
--- a/examples/cpp/inference/MLP_Unify/CMakeLists.txt
+++ b/examples/cpp/inference/MLP_Unify/CMakeLists.txt
@@ -5,8 +5,10 @@ set(project_target mlp_inference_unify)
 
 set(CPU_SRC
   ${FLEXFLOW_CPP_DRV_SRC}
-  mlp.cc)
+  mlp.cc
+  ../data_generator.h)
 
 cuda_add_executable(${project_target} ${CPU_SRC})
+target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/examples/cpp/inference)
 target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
 target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
diff --git a/examples/cpp/inference/MLP_Unify/mlp.cc b/examples/cpp/inference/MLP_Unify/mlp.cc
index 9479cb3bcf..938cb37d60 100644
--- a/examples/cpp/inference/MLP_Unify/mlp.cc
+++ b/examples/cpp/inference/MLP_Unify/mlp.cc
@@ -17,6 +17,7 @@
 #include <fstream>
 #include <sstream>
 #include <string>
+#include "data_generator.h"
 using namespace Legion;
 using namespace FlexFlow;
 
@@ -26,6 +27,7 @@ void FlexFlow::top_level_task(Task const *task,
                               Runtime *runtime) {
   FFConfig ffConfig;
   ffConfig.batchSize=1;
+  size_t total_requests = 256;
   fprintf(stderr,
           "batchSize(%d) workersPerNodes(%d) numNodes(%d)\n",
           ffConfig.batchSize,
@@ -37,7 +39,7 @@ void FlexFlow::top_level_task(Task const *task,
       8192, 8192, 8192, 8192, 8192, 8192, 8192, 8192};
   Tensor input1, input2;
   {
-    int const dims[] = {64, 1024};
+    int const dims[] = {total_requests, 1024};
     input1 = ff.create_tensor<2>(dims, DT_FLOAT);
     input2 = ff.create_tensor<2>(dims, DT_FLOAT);
   }
@@ -67,12 +69,25 @@ void FlexFlow::top_level_task(Task const *task,
   double ts_start = Realm::Clock::current_time_in_microseconds();
   //for (int epoch = 0; epoch < ffConfig.epochs; epoch++) {
   ff.reset_metrics();
-  int iterations = 128;
-  for (int iter = 0; iter < iterations; iter++) {
-    runtime->begin_trace(ctx, 111 /*trace_id*/);
-    ff.forward();
-    runtime->end_trace(ctx, 111 /*trace_id*/);
+  //int iterations = 128;
+  size_t processed_requests=0;
+  Generator data_generator(total_requests, 4, true, 25);
+  while(processed_requests < total_requests) {
+    vector<vector<double>> req = data_generator.get_requests();
+    size_t iterations = req.size();
+    for (size_t iter = 0; iter < iterations; iter++) {
+      runtime->begin_trace(ctx, 111 /*trace_id*/);
+      ff.forward();
+      runtime->end_trace(ctx, 111 /*trace_id*/);
+    }
+    processed_requests+= iterations;
   }
+
+  // for (int iter = 0; iter < iterations; iter++) {
+  //   runtime->begin_trace(ctx, 111 /*trace_id*/);
+  //   ff.forward();
+  //   runtime->end_trace(ctx, 111 /*trace_id*/);
+  // }
   // End timer
   {
     runtime->issue_execution_fence(ctx);

From 92c269fa71feb833850f78d157600a12c67e20da Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 16 Nov 2022 17:54:11 +0000
Subject: [PATCH 013/344] add missing file

---
 examples/cpp/inference/data_generator.h | 109 ++++++++++++++++++++++++
 1 file changed, 109 insertions(+)
 create mode 100644 examples/cpp/inference/data_generator.h

diff --git a/examples/cpp/inference/data_generator.h b/examples/cpp/inference/data_generator.h
new file mode 100644
index 0000000000..936b07727a
--- /dev/null
+++ b/examples/cpp/inference/data_generator.h
@@ -0,0 +1,109 @@
+#include <iostream>
+#include <ctime>
+#include <random>
+#include <unistd.h>
+#include <chrono>
+#include <thread>
+#include <math.h>
+using namespace std;
+typedef std::chrono::high_resolution_clock Clock;
+typedef std::chrono::milliseconds milliseconds;
+
+class Generator {
+    public:
+        size_t num_requests; // total number of requests
+        size_t tensor_size; // dimension of one request tensor
+        bool poisson; // false implied uniform distribution
+        double lambda; // mean #num of arrivals per sec
+        
+        Generator(size_t req, size_t tensor, bool poi, double lamb) {
+            num_requests = req;
+            tensor_size = tensor;
+            poisson = poi;
+            lambda = lamb;
+            compute_distribution();
+            arrivals_ptr = arrivals.begin();
+            timer_started = false;
+        }
+    
+        vector<vector<double>> get_requests(void); // function to retrieve requests
+    
+    private:
+        bool timer_started; // tracks if start time has been initiated
+        Clock::time_point start_time; // time when get_requests() is called for the first time
+        vector<double> arrivals; // arrival times (ms) generated based on distribution
+        vector<double>::iterator arrivals_ptr; // next request to output
+    
+        void compute_distribution( void ); // populate arrivals
+        vector<double> get_random_tensor(void); // generate a random tensor
+};
+
+void Generator::compute_distribution( void ) {
+    // set up uniform number generator [0,1)
+    random_device rnd;
+    mt19937 gen(rnd());
+    uniform_real_distribution<double> dist {0, 1.0};
+    double cur_arrival = 0; // assume first request comes in at time 0
+    
+    for (size_t i = 0; i < num_requests; i++) {
+        arrivals.push_back(cur_arrival);
+        cout << "arrival time " << i << ": +" << cur_arrival << "ms \n";
+        
+        if (poisson) {
+            double u = dist(gen);
+            double interval = -(1/lambda) * log(1-u) * 1000;
+            cur_arrival += interval;
+        } else {
+            cur_arrival += (1000/lambda);
+        }
+    }
+    return;
+};
+
+vector<vector<double>> Generator::get_requests(void) {
+    Clock::time_point cur_time = Clock::now();
+    vector<vector<double>> requests;
+    if (!timer_started){
+        // simply return one request and start timer for the first call
+        start_time = Clock::now();
+        timer_started = true;
+        arrivals_ptr++;
+        requests.push_back(get_random_tensor());
+        return requests;
+    }
+    
+    // output requests till we reach current timestamp
+    milliseconds ms_from_start = chrono::duration_cast<milliseconds>(cur_time - start_time);
+    while (arrivals_ptr < arrivals.end() && ms_from_start.count() >= *arrivals_ptr){
+        cout << "output request at arrival time +" << *arrivals_ptr << "\n";
+        requests.push_back(get_random_tensor());
+        arrivals_ptr++;
+    }
+    return requests;
+};
+
+vector<double> Generator::get_random_tensor(void) {
+    random_device rnd_device;
+    mt19937 mersenne_engine {rnd_device()};
+    uniform_real_distribution<double> dist {0, 1.0}; // state distribution
+    
+    auto gen = [&dist, &mersenne_engine](){
+                   return dist(mersenne_engine);
+               };
+
+    vector<double> vec(tensor_size);
+    generate(begin(vec), end(vec), gen);
+    return vec;
+};
+
+// for debugging
+void print_requests(vector<vector<double>> req) {
+    cout << "printing requests\n";
+    for (vector<double> v: req){
+        for (double e: v) {
+            cout << e << ",";
+        }
+        cout << "\n";
+    }
+    cout << "\n";
+};

From aa3edca13bf2e77a33e12694246efe4603e9cec2 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Thu, 17 Nov 2022 05:08:03 +0000
Subject: [PATCH 014/344] [InferenceManager] initial impl

---
 examples/cpp/inference/MLP_Unify/mlp.cc | 13 ++---
 include/flexflow/inference.h            | 38 +++++++++++++
 include/flexflow/operator.h             |  5 ++
 include/flexflow/ops/linear.h           |  4 ++
 src/ops/linear.cc                       | 45 +++++++++++++++
 src/runtime/inference_manager.cc        | 76 +++++++++++++++++++++++++
 6 files changed, 174 insertions(+), 7 deletions(-)
 create mode 100644 include/flexflow/inference.h
 create mode 100644 src/runtime/inference_manager.cc

diff --git a/examples/cpp/inference/MLP_Unify/mlp.cc b/examples/cpp/inference/MLP_Unify/mlp.cc
index 938cb37d60..0f74a1e974 100644
--- a/examples/cpp/inference/MLP_Unify/mlp.cc
+++ b/examples/cpp/inference/MLP_Unify/mlp.cc
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/model.h"
+#include "flexflow/inference.h"
 #include <fstream>
 #include <sstream>
 #include <string>
@@ -53,11 +54,8 @@ void FlexFlow::top_level_task(Task const *task,
   }
   Tensor t = ff.add(t1, t2);
   t = ff.softmax(t);
-  Optimizer *optimizer = new SGDOptimizer(&ff, 0.001f);
-  std::vector<MetricsType> metrics;
-  metrics.push_back(METRICS_ACCURACY);
-  metrics.push_back(METRICS_SPARSE_CATEGORICAL_CROSSENTROPY);
-  ff.compile(optimizer, LOSS_SPARSE_CATEGORICAL_CROSSENTROPY, metrics, CompMode::COMP_MODE_INFERENCE);
+  int num_inflight_batches = 10;
+  InferenceManager im(&ff, 5/*num_requests_per_batch*/, num_inflight_batches);
   ff.init_operators();
   // Start timer
   {
@@ -67,8 +65,9 @@ void FlexFlow::top_level_task(Task const *task,
     future.get_void_result();
   }
   double ts_start = Realm::Clock::current_time_in_microseconds();
+  int index = 0;
   //for (int epoch = 0; epoch < ffConfig.epochs; epoch++) {
-  ff.reset_metrics();
+  // ff.reset_metrics();
   //int iterations = 128;
   size_t processed_requests=0;
   Generator data_generator(total_requests, 4, true, 25);
@@ -77,7 +76,7 @@ void FlexFlow::top_level_task(Task const *task,
     size_t iterations = req.size();
     for (size_t iter = 0; iter < iterations; iter++) {
       runtime->begin_trace(ctx, 111 /*trace_id*/);
-      ff.forward();
+      im.inference((index++) % num_inflight_batches);
       runtime->end_trace(ctx, 111 /*trace_id*/);
     }
     processed_requests+= iterations;
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
new file mode 100644
index 0000000000..7991548b44
--- /dev/null
+++ b/include/flexflow/inference.h
@@ -0,0 +1,38 @@
+/* Copyright 2022 CMU, Stanford, Facebook, LANL
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#pragma once
+
+#include "flexflow/model.h"
+
+namespace FlexFlow {
+
+class FFModel;
+
+class InferenceManager {
+public:
+  InferenceManager(FFModel* _model,
+                   int max_num_requests_per_batch,
+                   int max_num_inflight_batches);
+  void compile_model_and_allocate_buffer(void);
+  void inference(int index);
+public:
+  std::unordered_map<ParallelTensor, std::vector<ParallelTensor> > tensor_buffer;
+  FFModel* model;
+  int max_num_requests_per_batch;
+  int max_num_inflight_batches;
+};
+
+}
diff --git a/include/flexflow/operator.h b/include/flexflow/operator.h
index 3fd84ce55b..bdaecac8a2 100644
--- a/include/flexflow/operator.h
+++ b/include/flexflow/operator.h
@@ -187,6 +187,11 @@ class Op {
   virtual void init(FFModel const &) = 0;
   virtual void forward(FFModel const &) = 0;
   virtual void backward(FFModel const &) = 0;
+  // Pure virtual functions for inference
+  virtual void inference(FFModel const &,
+                         std::vector<ParallelTensor> const &,
+                         std::vector<ParallelTensor> const &,
+                         std::vector<ParallelTensor> const &) {assert(false);};
   virtual void print_layer(FFModel const &model) = 0;
   virtual bool measure_operator_cost(Simulator *sim,
                                      MachineView const &mv,
diff --git a/include/flexflow/ops/linear.h b/include/flexflow/ops/linear.h
index eb414f2ed2..6ad1a0752f 100644
--- a/include/flexflow/ops/linear.h
+++ b/include/flexflow/ops/linear.h
@@ -37,6 +37,10 @@ class Linear : public Op {
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
+  void inference(FFModel const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &) override;
   void print_layer(FFModel const &model) override;
   bool get_int_parameter(PMParameter, int *) const override;
   static Op *
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index 668c8d070a..b47a884c5c 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -367,6 +367,51 @@ void Linear::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
+void Linear::inference(FFModel const &ff,
+                       std::vector<ParallelTensor> const &batch_inputs,
+                       std::vector<ParallelTensor> const &batch_weights,
+                       std::vector<ParallelTensor> const &batch_outputs) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_forward(ff, argmap);
+  IndexLauncher launcher(LINEAR_FWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(nullptr, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_weights[0]->region));
+  launcher.add_field(2, FID_DATA);
+  if (use_bias) {
+    launcher.add_region_requirement(RegionRequirement(batch_weights[1]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      batch_weights[1]->region));
+    launcher.add_field(3, FID_DATA);
+  }
+  runtime->execute_index_space(ctx, launcher);
+}
+
 void Linear::forward_task(Task const *task,
                           std::vector<PhysicalRegion> const &regions,
                           Context ctx,
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
new file mode 100644
index 0000000000..cd68b5e04d
--- /dev/null
+++ b/src/runtime/inference_manager.cc
@@ -0,0 +1,76 @@
+/* Copyright 2022 CMU, Stanford, Facebook, LANL
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/inference.h"
+
+namespace FlexFlow {
+
+using namespace Legion;
+
+InferenceManager::InferenceManager(FFModel *_model,
+                                   int _max_num_requests_per_batch,
+                                   int _max_num_inflight_batches)
+  : model(_model),
+    max_num_requests_per_batch(_max_num_requests_per_batch),
+    max_num_inflight_batches(_max_num_inflight_batches) {
+
+}
+
+void InferenceManager::compile_model_and_allocate_buffer(void) {
+  std::vector<MetricsType> metrics;
+  model->config.batchSize = max_num_requests_per_batch;
+  model->compile(LOSS_MEAN_SQUARED_ERROR_AVG_REDUCE, metrics, COMP_MODE_INFERENCE);
+  Context ctx = model->config.lg_ctx;
+  Runtime *runtime = model->config.lg_hlr;
+  for (const auto& op : model->operators) {
+    // Skip weight operators
+    if (op->op_type == OP_WEIGHT)
+      continue;
+    for (int i = 0; i < op->numOutputs; i++) {
+      ParallelTensor pt_base = op->outputs[i];
+      assert(tensor_buffer.find(pt_base) == tensor_buffer.end());
+      std::vector<ParallelTensor> list;
+      for (int j = 0; j < max_num_inflight_batches; j++) {
+        // Copy the metadata from pt_base to pt
+        ParallelTensor pt = new ParallelTensorBase(*pt_base);
+        pt->region = runtime->create_logical_region(ctx,
+                                                    pt_base->region.get_index_space(),
+                                                    pt_base->region.get_field_space());
+        pt->part = runtime->get_logical_partition(ctx, pt->region, pt_base->part.get_index_partition());
+        list.push_back(pt);
+      }
+      tensor_buffer[pt_base] = list;
+    }
+  }
+}
+
+void InferenceManager::inference(int index) {
+  assert(index < max_num_inflight_batches);
+  for (size_t o = 0; o < model->operators.size(); o++) {
+    Op* op = model->operators[o];
+    std::vector<ParallelTensor> inputs(op->numInputs);
+    std::vector<ParallelTensor> weights(op->numWeights);
+    std::vector<ParallelTensor> outputs(op->numOutputs);
+    for (int i = 0; i < op->numInputs; i++)
+      inputs[i] = tensor_buffer[op->inputs[i]][index];
+    for (int i = 0; i < op->numWeights; i++)
+      weights[i] = op->weights[i];
+    for (int i = 0; i < op->numOutputs; i++)
+      outputs[i] = tensor_buffer[op->outputs[i]][index];
+    op->inference(*model, inputs, weights, outputs);
+  }
+};
+
+};

From 17855aeaa071cbb09944947161b704b26911ce62 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 23 Nov 2022 10:04:57 -0500
Subject: [PATCH 015/344] added dataloader

---
 .../cpp/inference/MLP_Unify/CMakeLists.txt    |   1 +
 examples/cpp/inference/MLP_Unify/mlp.cc       | 234 +++++++++++++++---
 examples/cpp/inference/MLP_Unify/mlp.h        |  62 +++++
 3 files changed, 259 insertions(+), 38 deletions(-)
 create mode 100644 examples/cpp/inference/MLP_Unify/mlp.h

diff --git a/examples/cpp/inference/MLP_Unify/CMakeLists.txt b/examples/cpp/inference/MLP_Unify/CMakeLists.txt
index 5a2402fdd0..e83d292efc 100644
--- a/examples/cpp/inference/MLP_Unify/CMakeLists.txt
+++ b/examples/cpp/inference/MLP_Unify/CMakeLists.txt
@@ -6,6 +6,7 @@ set(project_target mlp_inference_unify)
 set(CPU_SRC
   ${FLEXFLOW_CPP_DRV_SRC}
   mlp.cc
+  mlp.h
   ../data_generator.h)
 
 cuda_add_executable(${project_target} ${CPU_SRC})
diff --git a/examples/cpp/inference/MLP_Unify/mlp.cc b/examples/cpp/inference/MLP_Unify/mlp.cc
index 0f74a1e974..9298a87b10 100644
--- a/examples/cpp/inference/MLP_Unify/mlp.cc
+++ b/examples/cpp/inference/MLP_Unify/mlp.cc
@@ -13,50 +13,190 @@
  * limitations under the License.
  */
 
-#include "flexflow/model.h"
-#include "flexflow/inference.h"
-#include <fstream>
-#include <sstream>
-#include <string>
-#include "data_generator.h"
+#include "mlp.h"
+
 using namespace Legion;
 using namespace FlexFlow;
 
+DataLoader::DataLoader(FFModel &ff,
+                       MLPConfig const &mlpConfig,
+                       InferenceManager const *im, 
+                       Tensor input) {
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  log_app.print("Use random dataset...");
+  
+  // The number of samples is the total number of request samples that can ever be loaded into memory at the same time. In the case of training, the value is batchSize * workersPerNode * numNodes, since each worker can only process one batch at a time. In inference,  batchSize
+  size_t max_parallel_requests = im->max_num_inflight_batches * (ff.config.batchSize * im->max_num_requests_per_batch);
+  num_samples = max_parallel_requests * ff.config.workersPerNode * ff.config.numNodes;
+  log_app.print("Number of random samples = %d\n", num_samples);
+
+  // return;
+  
+  // Create full input
+  {
+    batch_input = input;
+    int const dims[] = {num_samples, tf.sequence_length * mlpConfig->embedding_size};
+    full_input = ff.create_tensor<2>(dims, DT_FLOAT);
+  }
+
+  // Load entire dataset
+  // TODO: Use index launcher instead of task launcher
+  TaskLauncher launcher(CUSTOM_CPU_TASK_ID_1, TaskArgument(NULL, 0));
+  launcher.add_region_requirement(
+      RegionRequirement(full_input.parallel_tensor->region,
+                        WRITE_ONLY,
+                        EXCLUSIVE,
+                        full_input.parallel_tensor->region,
+                        MAP_TO_ZC_MEMORY));
+  launcher.add_field(0, FID_DATA);
+  runtime->execute_task(ctx, launcher);
+  reset();
+  next_batch(ff);
+}
+
+void DataLoader::load_entire_dataset(Task const *task,
+                                     std::vector<PhysicalRegion> const &regions,
+                                     Context ctx,
+                                     Runtime *runtime) {
+  assert(regions.size() == 1); // no labels
+  assert(task->regions.size() == 1);
+  // Note that these instances are in ZCM, can only use
+  // TensorAccessorW with readOutput flag
+  AccessorWO<float, 2> const acc_input(regions[0], FID_DATA);
+  Rect<2> rect_input = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  assert(acc_input.accessor.is_dense_arbitrary(rect_input));
+  float *input_ptr = acc_input.ptr(rect_input.lo);
+  // Fill dataset with random data
+  for (size_t i = 0; i < rect_input.volume(); i++) {
+    input_ptr[i] = ((float)std::rand()) / RAND_MAX;
+  }
+  log_app.print("finish loading data\n");
+}
+
+void DataLoader::next_batch(FFModel &ff) {
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  // Load Input
+  {
+    Rect<2> rect = runtime->get_index_space_domain(ctx, batch_input->parallel_tensor->parallel_is);
+    ArgumentMap argmap;
+    int idx = next_index;
+    for (PointInRectIterator<2> it(rect); it(); it++) {
+      SampleIdxs meta;
+      assert(ff.config.batchSize % (rect.hi[1] - rect.lo[1] + 1) == 0);
+      meta.num_samples = ff.config.batchSize / (rect.hi[1] - rect.lo[1] + 1);
+      for (int i = 0; i < meta.num_samples; i++)
+        meta.idxs[i] = idx++;
+      argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
+    }
+
+    IndexLauncher launcher(CUSTOM_GPU_TASK_ID_1,
+                           batch_input->parallel_tensor->parallel_is,
+                           TaskArgument(NULL, 0),
+                           argmap,
+                           Predicate::TRUE_PRED,
+                           false /*must*/,
+                           0 /*mapper_id*/,
+                           batch_input->parallel_tensor->machine_view.hash());
+    launcher.add_region_requirement(
+        RegionRequirement(full_input->parallel_tensor->region,
+                          0 /*projection id*/,
+                          READ_ONLY,
+                          EXCLUSIVE,
+                          full_input->parallel_tensor->region,
+                          MAP_TO_FB_MEMORY));
+    launcher.add_field(0, FID_DATA);
+    launcher.add_region_requirement(
+        RegionRequirement(batch_input->parallel_tensor->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_input->parallel_tensor->region));
+    launcher.add_field(1, FID_DATA);
+    runtime->execute_index_space(ctx, launcher);
+  }
+  // progress to the next_index
+  next_index += ff.config.batchSize;
+}
+
+void DataLoader::reset() {
+  next_index = 0;
+}
+
+
+Tensor create_mlp(FFModel *model,
+                  MLPConfig const *mlpConfig,
+                  Tensor const &input1,
+                  Tensor const &input2) {
+  Tensor t1 = input1, t2 = input2;
+  for (size_t i = 0; i < mlpConfig->hidden_dims.size(); i++) {
+    int const dims[] = {mlpConfig->hidden_dims[i], t1->dims[0]};
+    ActiMode acti_mode =
+        (i + 1 == mlpConfig->hidden_dims.size()) ? AC_MODE_NONE : AC_MODE_RELU;
+    t1 = model->dense(t1, mlpConfig->hidden_dims[i], acti_mode, false);
+    t2 = model->dense(t2, mlpConfig->hidden_dims[i], acti_mode, false);
+  }
+  Tensor t = model->add(t1, t2);
+  return model->softmax(t);
+}
+
 void FlexFlow::top_level_task(Task const *task,
                               std::vector<PhysicalRegion> const &regions,
                               Context ctx,
                               Runtime *runtime) {
+  
+  // Inference parameters
+  size_t total_requests = 256; // total number of requests processed as part of the simulation
+  size_t request_tensor_size = 4; // request tensor dimensions
+  bool poisson_distribution=true;
+  double lambda = 25; // average number of request arrivals per second
+  size_t num_requests_per_batch=5;
+  size_t num_inflight_batches = 10;
+
+  // MLP parameters
+  size_t embedding_size=1024;
+  size_t sequence_length=512;
+  std::vector<size_t> hidden_dims = {8192, 8192, 8192, 8192, 8192, 8192, 8192, 8192};
+
   FFConfig ffConfig;
   ffConfig.batchSize=1;
-  size_t total_requests = 256;
-  fprintf(stderr,
-          "batchSize(%d) workersPerNodes(%d) numNodes(%d)\n",
-          ffConfig.batchSize,
-          ffConfig.workersPerNode,
-          ffConfig.numNodes);
+  {
+    fprintf(stderr, "batchSize(%d) workersPerNodes(%d) numNodes(%d)\n",
+      ffConfig.batchSize,
+      ffConfig.workersPerNode,
+      ffConfig.numNodes
+    );
+  }
   FFModel ff(ffConfig);
-
-  std::vector<int> hidden_dims = {
-      8192, 8192, 8192, 8192, 8192, 8192, 8192, 8192};
+  MLPConfig mlpConfig(embedding_size, sequence_length, hidden_dims);
+  {
+    stringstream hd;
+    hd << '{'
+    for (size_t i = 0; i < hidden_dims.size(); i++) {
+      if (i != 0) hd << ",";
+      hd << hidden_dims[i];
+    }
+    hd << '}'
+    fprintf(stderr,
+      "embedding_size(%d) sequence_length(%d) hidden_dims(%s)\n",
+      mlpConfig.embedding_size,
+      mlpConfig.sequence_length,
+      hd.c_str());
+  }
+  
   Tensor input1, input2;
   {
-    int const dims[] = {total_requests, 1024};
+    int const dims[] = {total_requests, mlpConfig.sequence_length * mlpConfig.embedding_size};
     input1 = ff.create_tensor<2>(dims, DT_FLOAT);
     input2 = ff.create_tensor<2>(dims, DT_FLOAT);
   }
-  Tensor t1 = input1, t2 = input2;
-  for (size_t i = 0; i < hidden_dims.size(); i++) {
-    int const dims[] = {hidden_dims[i], t1->dims[0]};
-    ActiMode acti_mode =
-        (i + 1 == hidden_dims.size()) ? AC_MODE_NONE : AC_MODE_RELU;
-    t1 = ff.dense(t1, hidden_dims[i], acti_mode, false);
-    t2 = ff.dense(t2, hidden_dims[i], acti_mode, false);
-  }
-  Tensor t = ff.add(t1, t2);
-  t = ff.softmax(t);
-  int num_inflight_batches = 10;
-  InferenceManager im(&ff, 5/*num_requests_per_batch*/, num_inflight_batches);
+  Tensor t = create_mlp(&ff, &mlpConfig, input1, input2);
+  
+  InferenceManager im(&ff, num_requests_per_batch, num_inflight_batches);
   ff.init_operators();
+  
   // Start timer
   {
     runtime->issue_execution_fence(ctx);
@@ -65,12 +205,14 @@ void FlexFlow::top_level_task(Task const *task,
     future.get_void_result();
   }
   double ts_start = Realm::Clock::current_time_in_microseconds();
+  
+  
+  ///////////////////////////////////////////////////////////////////////////////////
+  
+  // Main loop, processing requests as they come (from the generator)
   int index = 0;
-  //for (int epoch = 0; epoch < ffConfig.epochs; epoch++) {
-  // ff.reset_metrics();
-  //int iterations = 128;
   size_t processed_requests=0;
-  Generator data_generator(total_requests, 4, true, 25);
+  Generator data_generator(total_requests, request_tensor_size, poisson_distribution, lambda);
   while(processed_requests < total_requests) {
     vector<vector<double>> req = data_generator.get_requests();
     size_t iterations = req.size();
@@ -82,11 +224,9 @@ void FlexFlow::top_level_task(Task const *task,
     processed_requests+= iterations;
   }
 
-  // for (int iter = 0; iter < iterations; iter++) {
-  //   runtime->begin_trace(ctx, 111 /*trace_id*/);
-  //   ff.forward();
-  //   runtime->end_trace(ctx, 111 /*trace_id*/);
-  // }
+  ///////////////////////////////////////////////////////////////////////////////////
+  
+  
   // End timer
   {
     runtime->issue_execution_fence(ctx);
@@ -101,4 +241,22 @@ void FlexFlow::top_level_task(Task const *task,
          ffConfig.batchSize * 128 * ffConfig.epochs / run_time);
 }
 
-void FlexFlow::register_custom_tasks() {}
+void FlexFlow::register_custom_tasks() {
+  // Load entire dataset
+  {
+    TaskVariantRegistrar registrar(CUSTOM_CPU_TASK_ID_1, "Load Entire Dataset");
+    registrar.add_constraint(ProcessorConstraint(Processor::LOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<DataLoader::load_entire_dataset>(
+        registrar, "Load Entire Dataset Task");
+  }
+  // Load input
+  {
+    TaskVariantRegistrar registrar(FlexFlow::CUSTOM_GPU_TASK_ID_1,
+                                   "Load Inputs");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<DataLoader::load_input>(
+        registrar, "Load Input Task");
+  }
+}
diff --git a/examples/cpp/inference/MLP_Unify/mlp.h b/examples/cpp/inference/MLP_Unify/mlp.h
new file mode 100644
index 0000000000..e2dba0f00a
--- /dev/null
+++ b/examples/cpp/inference/MLP_Unify/mlp.h
@@ -0,0 +1,62 @@
+/* Copyright 2022 CMU, Stanford
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/model.h"
+#include "flexflow/inference.h"
+#include <fstream>
+#include <sstream>
+#include <string>
+#include "data_generator.h"
+
+using namespace Legion;
+using namespace FlexFlow;
+
+struct MLPConfig {
+  MLPConfig(void);
+  MLPConfig(int embedding_size, int sequence_length, std::vector<size_t> hidden_dims)
+  : embedding_size(embedding_size),
+    sequence_length(sequence_length),
+    hidden_dims(hidden_dims) {}
+
+  int embedding_size, sequence_length;
+  std::vector<size_t> hidden_dims;
+};
+
+class DataLoader {
+public:
+  DataLoader(FFModel &ff,
+             MLPConfig const &mlpConfig,
+             InferenceManager const *im,
+             Tensor input);
+  /*static void load_input(Task const *task,
+                         std::vector<PhysicalRegion> const &regions,
+                         Context ctx,
+                         Runtime *runtime);*/
+  static void load_entire_dataset(Task const *task,
+                                  std::vector<PhysicalRegion> const &regions,
+                                  Context ctx,
+                                  Runtime *runtime);
+  void next_batch(FFModel &);
+  void reset(void);
+
+public:
+  int num_samples, next_index;
+  Tensor full_input, batch_input;
+};
+
+struct SampleIdxs {
+  int num_samples;
+  int idxs[MAX_NUM_SAMPLES];
+};
\ No newline at end of file

From 8de95ec6b9b9d3dab7fdd268ba7262ab04598eb7 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 2 Dec 2022 15:01:23 +0000
Subject: [PATCH 016/344] fix data generator to work for -std=c++ < 20

---
 examples/cpp/inference/data_generator.cpp | 105 +---------------------
 examples/cpp/inference/data_generator.h   |   7 ++
 2 files changed, 8 insertions(+), 104 deletions(-)

diff --git a/examples/cpp/inference/data_generator.cpp b/examples/cpp/inference/data_generator.cpp
index b6b2fc2ede..02b841286a 100644
--- a/examples/cpp/inference/data_generator.cpp
+++ b/examples/cpp/inference/data_generator.cpp
@@ -9,111 +9,8 @@
 #include <ctime>
 #include <random>
 #include <unistd.h>
-#include <chrono>
-#include <thread>
-#include <math.h>
+#include "data_generator.h"
 using namespace std;
-typedef std::chrono::high_resolution_clock Clock;
-typedef std::chrono::milliseconds milliseconds;
-
-class Generator {
-    public:
-        size_t num_requests; // total number of requests
-        size_t tensor_size; // dimension of one request tensor
-        bool poisson; // false implied uniform distribution
-        double lambda; // mean #num of arrivals per sec
-        
-        Generator(size_t req, size_t tensor, bool poi, double lamb) {
-            num_requests = req;
-            tensor_size = tensor;
-            poisson = poi;
-            lambda = lamb;
-            compute_distribution();
-            arrivals_ptr = arrivals.begin();
-            timer_started = false;
-        }
-    
-        vector<vector<double>> get_requests(void); // function to retrieve requests
-    
-    private:
-        bool timer_started; // tracks if start time has been initiated
-        Clock::time_point start_time; // time when get_requests() is called for the first time
-        vector<double> arrivals; // arrival times (ms) generated based on distribution
-        vector<double>::iterator arrivals_ptr; // next request to output
-    
-        void compute_distribution( void ); // populate arrivals
-        vector<double> get_random_tensor(void); // generate a random tensor
-};
-
-void Generator::compute_distribution( void ) {
-    // set up uniform number generator [0,1)
-    random_device rnd;
-    mt19937 gen(rnd());
-    uniform_real_distribution<double> dist {0, 1.0};
-    double cur_arrival = 0; // assume first request comes in at time 0
-    
-    for (size_t i = 0; i < num_requests; i++) {
-        arrivals.push_back(cur_arrival);
-        cout << "arrival time " << i << ": +" << cur_arrival << "ms \n";
-        
-        if (poisson) {
-            double u = dist(gen);
-            double interval = -(1/lambda) * log(1-u) * 1000;
-            cur_arrival += interval;
-        } else {
-            cur_arrival += (1000/lambda);
-        }
-    }
-    return;
-};
-
-vector<vector<double>> Generator::get_requests(void) {
-    Clock::time_point cur_time = Clock::now();
-    vector<vector<double>> requests;
-    if (!timer_started){
-        // simply return one request and start timer for the first call
-        start_time = Clock::now();
-        timer_started = true;
-        arrivals_ptr++;
-        requests.push_back(get_random_tensor());
-        return requests;
-    }
-    
-    // output requests till we reach current timestamp
-    milliseconds ms_from_start = chrono::duration_cast<milliseconds>(cur_time - start_time);
-    while (arrivals_ptr < arrivals.end() && ms_from_start.count() >= *arrivals_ptr){
-        cout << "output request at arrival time +" << *arrivals_ptr << "\n";
-        requests.push_back(get_random_tensor());
-        arrivals_ptr++;
-    }
-    return requests;
-};
-
-vector<double> Generator::get_random_tensor(void) {
-    random_device rnd_device;
-    mt19937 mersenne_engine {rnd_device()};
-    uniform_real_distribution<double> dist {0, 1.0}; // state distribution
-    
-    auto gen = [&dist, &mersenne_engine](){
-                   return dist(mersenne_engine);
-               };
-
-    vector<double> vec(tensor_size);
-    generate(begin(vec), end(vec), gen);
-    return vec;
-};
-
-// for debugging
-void print_requests(vector<vector<double>> req) {
-    cout << "printing requests\n";
-    for (vector<double> v: req){
-        for (double e: v) {
-            cout << e << ",";
-        }
-        cout << "\n";
-    }
-    cout << "\n";
-};
 
 int main(int argc, const char * argv[]) {
     // insert code here...
diff --git a/examples/cpp/inference/data_generator.h b/examples/cpp/inference/data_generator.h
index 936b07727a..14bf91b433 100644
--- a/examples/cpp/inference/data_generator.h
+++ b/examples/cpp/inference/data_generator.h
@@ -82,6 +82,13 @@ vector<vector<double>> Generator::get_requests(void) {
     return requests;
 };
 
+template< class ForwardIt, class Generator >
+void generate( ForwardIt first, ForwardIt last, Generator gen ) {
+  while (first != last) {
+    *first++ = gen();
+  }
+}
+
 vector<double> Generator::get_random_tensor(void) {
     random_device rnd_device;
     mt19937 mersenne_engine {rnd_device()};

From 59312b2c47af6719fc505d66d4def14d5246bfc7 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 2 Dec 2022 17:13:03 +0000
Subject: [PATCH 017/344] fix bugs

---
 CMakeLists.txt                            | 12 ++--
 config/config.linux                       |  4 +-
 examples/cpp/inference/MLP_Unify/mlp.cc   | 78 +++++++++++++----------
 examples/cpp/inference/MLP_Unify/mlp.h    | 13 ++--
 examples/cpp/inference/data_generator.cpp | 44 ++++++-------
 5 files changed, 81 insertions(+), 70 deletions(-)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index 07d77fb129..e7738cded8 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -423,13 +423,13 @@ if(FF_BUILD_MOE OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/mixture_of_experts)
 endif()
 
-if(FF_BUILD_TRANSFORMER_INFERENCE OR FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/inference/Transformer)
-endif()
+# if(FF_BUILD_TRANSFORMER_INFERENCE OR FF_BUILD_ALL_INFERENCE_EXAMPLES)
+#   add_subdirectory(examples/cpp/inference/Transformer)
+# endif()
 
-if(FF_BUILD_G_SHARD_INFERENCE OR FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/inference/G-Shard-MoE)
-endif()
+# if(FF_BUILD_G_SHARD_INFERENCE OR FF_BUILD_ALL_INFERENCE_EXAMPLES)
+#   add_subdirectory(examples/cpp/inference/G-Shard-MoE)
+# endif()
 
 # installation
 set(INCLUDE_DEST "include")
diff --git a/config/config.linux b/config/config.linux
index 28cf7c2fe1..0f819f4031 100755
--- a/config/config.linux
+++ b/config/config.linux
@@ -38,8 +38,8 @@ FF_USE_GASNET=${FF_USE_GASNET:-OFF}
 FF_GASNET_CONDUIT=${FF_GASNET_CONDUIT:-ibv}
 
 # build C++ examples
-FF_BUILD_ALL_EXAMPLES=${FF_BUILD_ALL_EXAMPLES:-OFF}
-FF_BUILD_ALL_INFERENCE_EXAMPLES=${FF_BUILD_ALL_INFERENCE_EXAMPLES:-OFF}
+FF_BUILD_ALL_EXAMPLES=${FF_BUILD_ALL_EXAMPLES:-ON}
+FF_BUILD_ALL_INFERENCE_EXAMPLES=${FF_BUILD_ALL_INFERENCE_EXAMPLES:-ON}
 
 # build C++ unit tests
 FF_BUILD_UNIT_TESTS=${FF_BUILD_UNIT_TESTS:-OFF}
diff --git a/examples/cpp/inference/MLP_Unify/mlp.cc b/examples/cpp/inference/MLP_Unify/mlp.cc
index 9298a87b10..9fea4e979b 100644
--- a/examples/cpp/inference/MLP_Unify/mlp.cc
+++ b/examples/cpp/inference/MLP_Unify/mlp.cc
@@ -24,19 +24,26 @@ DataLoader::DataLoader(FFModel &ff,
                        Tensor input) {
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
-  log_app.print("Use random dataset...");
-  
-  // The number of samples is the total number of request samples that can ever be loaded into memory at the same time. In the case of training, the value is batchSize * workersPerNode * numNodes, since each worker can only process one batch at a time. In inference,  batchSize
-  size_t max_parallel_requests = im->max_num_inflight_batches * (ff.config.batchSize * im->max_num_requests_per_batch);
-  num_samples = max_parallel_requests * ff.config.workersPerNode * ff.config.numNodes;
-  log_app.print("Number of random samples = %d\n", num_samples);
+  printf("Use random dataset...");
+
+  // The number of samples is the total number of request samples that can ever
+  // be loaded into memory at the same time. In the case of training, the value
+  // is batchSize * workersPerNode * numNodes, since each worker can only
+  // process one batch at a time. In inference,  batchSize
+  int max_parallel_requests =
+      im->max_num_inflight_batches *
+      (ff.config.batchSize * im->max_num_requests_per_batch);
+  num_samples =
+      max_parallel_requests * ff.config.workersPerNode * ff.config.numNodes;
+  printf("Number of random samples = %d\n", num_samples);
 
   // return;
   
   // Create full input
   {
     batch_input = input;
-    int const dims[] = {num_samples, tf.sequence_length * mlpConfig->embedding_size};
+    int const dims[] = {num_samples,
+                        mlpConfig.sequence_length * mlpConfig.embedding_size};
     full_input = ff.create_tensor<2>(dims, DT_FLOAT);
   }
 
@@ -44,15 +51,15 @@ DataLoader::DataLoader(FFModel &ff,
   // TODO: Use index launcher instead of task launcher
   TaskLauncher launcher(CUSTOM_CPU_TASK_ID_1, TaskArgument(NULL, 0));
   launcher.add_region_requirement(
-      RegionRequirement(full_input.parallel_tensor->region,
+      RegionRequirement(full_input->parallel_tensor->region,
                         WRITE_ONLY,
                         EXCLUSIVE,
-                        full_input.parallel_tensor->region,
+                        full_input->parallel_tensor->region,
                         MAP_TO_ZC_MEMORY));
   launcher.add_field(0, FID_DATA);
   runtime->execute_task(ctx, launcher);
   reset();
-  next_batch(ff);
+  //next_batch(ff);
 }
 
 void DataLoader::load_entire_dataset(Task const *task,
@@ -69,10 +76,10 @@ void DataLoader::load_entire_dataset(Task const *task,
   assert(acc_input.accessor.is_dense_arbitrary(rect_input));
   float *input_ptr = acc_input.ptr(rect_input.lo);
   // Fill dataset with random data
-  for (size_t i = 0; i < rect_input.volume(); i++) {
+  for (int i = 0; i < rect_input.volume(); i++) {
     input_ptr[i] = ((float)std::rand()) / RAND_MAX;
   }
-  log_app.print("finish loading data\n");
+  printf("finish loading data\n");
 }
 
 void DataLoader::next_batch(FFModel &ff) {
@@ -131,7 +138,7 @@ Tensor create_mlp(FFModel *model,
                   Tensor const &input1,
                   Tensor const &input2) {
   Tensor t1 = input1, t2 = input2;
-  for (size_t i = 0; i < mlpConfig->hidden_dims.size(); i++) {
+  for (int i = 0; i < mlpConfig->hidden_dims.size(); i++) {
     int const dims[] = {mlpConfig->hidden_dims[i], t1->dims[0]};
     ActiMode acti_mode =
         (i + 1 == mlpConfig->hidden_dims.size()) ? AC_MODE_NONE : AC_MODE_RELU;
@@ -148,17 +155,19 @@ void FlexFlow::top_level_task(Task const *task,
                               Runtime *runtime) {
   
   // Inference parameters
-  size_t total_requests = 256; // total number of requests processed as part of the simulation
-  size_t request_tensor_size = 4; // request tensor dimensions
-  bool poisson_distribution=true;
+  int total_requests =
+      256; // total number of requests processed as part of the simulation
+  int request_tensor_size = 4; // request tensor dimensions
+  bool poisson_distribution = true;
   double lambda = 25; // average number of request arrivals per second
-  size_t num_requests_per_batch=5;
-  size_t num_inflight_batches = 10;
+  int num_requests_per_batch = 5;
+  int num_inflight_batches = 10;
 
   // MLP parameters
-  size_t embedding_size=1024;
-  size_t sequence_length=512;
-  std::vector<size_t> hidden_dims = {8192, 8192, 8192, 8192, 8192, 8192, 8192, 8192};
+  int embedding_size = 1024;
+  int sequence_length = 512;
+  std::vector<int> hidden_dims = {
+      8192, 8192, 8192, 8192, 8192, 8192, 8192, 8192};
 
   FFConfig ffConfig;
   ffConfig.batchSize=1;
@@ -173,17 +182,15 @@ void FlexFlow::top_level_task(Task const *task,
   MLPConfig mlpConfig(embedding_size, sequence_length, hidden_dims);
   {
     stringstream hd;
-    hd << '{'
-    for (size_t i = 0; i < hidden_dims.size(); i++) {
-      if (i != 0) hd << ",";
+    hd << '{';
+    for (int i = 0; i < hidden_dims.size(); i++) {
+      if (i != 0) {
+        hd << ",";
+      }
       hd << hidden_dims[i];
     }
-    hd << '}'
-    fprintf(stderr,
-      "embedding_size(%d) sequence_length(%d) hidden_dims(%s)\n",
-      mlpConfig.embedding_size,
-      mlpConfig.sequence_length,
-      hd.c_str());
+    hd << '}';
+    fprintf(stderr, "embedding_size(%d) sequence_length(%d) hidden_dims(%s)\n", mlpConfig.embedding_size, mlpConfig.sequence_length, hd.str().c_str());
   }
   
   Tensor input1, input2;
@@ -211,12 +218,13 @@ void FlexFlow::top_level_task(Task const *task,
   
   // Main loop, processing requests as they come (from the generator)
   int index = 0;
-  size_t processed_requests=0;
-  Generator data_generator(total_requests, request_tensor_size, poisson_distribution, lambda);
-  while(processed_requests < total_requests) {
+  int processed_requests = 0;
+  Generator data_generator(
+      total_requests, request_tensor_size, poisson_distribution, lambda);
+  while (processed_requests < total_requests) {
     vector<vector<double>> req = data_generator.get_requests();
-    size_t iterations = req.size();
-    for (size_t iter = 0; iter < iterations; iter++) {
+    int iterations = req.size();
+    for (int iter = 0; iter < iterations; iter++) {
       runtime->begin_trace(ctx, 111 /*trace_id*/);
       im.inference((index++) % num_inflight_batches);
       runtime->end_trace(ctx, 111 /*trace_id*/);
diff --git a/examples/cpp/inference/MLP_Unify/mlp.h b/examples/cpp/inference/MLP_Unify/mlp.h
index e2dba0f00a..8d1cdd27ad 100644
--- a/examples/cpp/inference/MLP_Unify/mlp.h
+++ b/examples/cpp/inference/MLP_Unify/mlp.h
@@ -23,15 +23,18 @@
 using namespace Legion;
 using namespace FlexFlow;
 
+#define MAX_NUM_SAMPLES 1024000
+
 struct MLPConfig {
   MLPConfig(void);
-  MLPConfig(int embedding_size, int sequence_length, std::vector<size_t> hidden_dims)
-  : embedding_size(embedding_size),
-    sequence_length(sequence_length),
-    hidden_dims(hidden_dims) {}
+  MLPConfig(int embedding_size,
+            int sequence_length,
+            std::vector<int> hidden_dims)
+      : embedding_size(embedding_size), sequence_length(sequence_length),
+        hidden_dims(hidden_dims) {}
 
   int embedding_size, sequence_length;
-  std::vector<size_t> hidden_dims;
+  std::vector<int> hidden_dims;
 };
 
 class DataLoader {
diff --git a/examples/cpp/inference/data_generator.cpp b/examples/cpp/inference/data_generator.cpp
index 02b841286a..bf6456ef84 100644
--- a/examples/cpp/inference/data_generator.cpp
+++ b/examples/cpp/inference/data_generator.cpp
@@ -12,26 +12,26 @@
 #include "data_generator.h"
 using namespace std;
 
-int main(int argc, const char * argv[]) {
-    // insert code here...
-    cout << "Hello, World!\n";
-    Generator data_generator(10, 4, true, 1);
-    
-    vector<vector<double>> req0 = data_generator.get_requests();
-    print_requests(req0);
-    
-    this_thread::sleep_for(milliseconds(1200));
-    vector<vector<double>> req1200 = data_generator.get_requests();
-    print_requests(req1200);
-    
-    this_thread::sleep_for(milliseconds(10));
-    vector<vector<double>> req1210 = data_generator.get_requests();
-    print_requests(req1210);
-    
-    this_thread::sleep_for(milliseconds(4000));
-    vector<vector<double>> req5210 = data_generator.get_requests();
-    print_requests(req5210);
-    
-    
-    return 0;
+// This is for running the dataloader standalone
+int main(int argc, char const *argv[]) {
+  // insert code here...
+  cout << "Hello, World!\n";
+  Generator data_generator(10, 4, true, 1);
+
+  vector<vector<double>> req0 = data_generator.get_requests();
+  print_requests(req0);
+
+  this_thread::sleep_for(milliseconds(1200));
+  vector<vector<double>> req1200 = data_generator.get_requests();
+  print_requests(req1200);
+
+  this_thread::sleep_for(milliseconds(10));
+  vector<vector<double>> req1210 = data_generator.get_requests();
+  print_requests(req1210);
+
+  this_thread::sleep_for(milliseconds(4000));
+  vector<vector<double>> req5210 = data_generator.get_requests();
+  print_requests(req5210);
+
+  return 0;
 }

From 84a44e0a4de1dea1e05f478cf25c76e61b1bbdf9 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sat, 3 Dec 2022 00:24:03 -0500
Subject: [PATCH 018/344] cmake update

---
 CMakeLists.txt | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index e7738cded8..09856f5c66 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -376,9 +376,9 @@ if(FF_BUILD_ALEXNET OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/AlexNet)
 endif()
 
-if(FF_BUILD_MLP_UNIFY OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/MLP_Unify)
-endif()
+# if(FF_BUILD_MLP_UNIFY OR FF_BUILD_ALL_EXAMPLES)
+#   add_subdirectory(examples/cpp/MLP_Unify)
+# endif()
 
 if(FF_BUILD_MLP_UNIFY OR FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/inference/MLP_Unify)

From bb44ca14a7d86e76b1287965ea64d905f25c6ca5 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sat, 3 Dec 2022 19:48:26 +0000
Subject: [PATCH 019/344] fix filename

---
 examples/cpp/inference/MLP_Unify/CMakeLists.txt | 4 +++-
 1 file changed, 3 insertions(+), 1 deletion(-)

diff --git a/examples/cpp/inference/MLP_Unify/CMakeLists.txt b/examples/cpp/inference/MLP_Unify/CMakeLists.txt
index e83d292efc..57b9ea0835 100644
--- a/examples/cpp/inference/MLP_Unify/CMakeLists.txt
+++ b/examples/cpp/inference/MLP_Unify/CMakeLists.txt
@@ -9,7 +9,9 @@ set(CPU_SRC
   mlp.h
   ../data_generator.h)
 
-cuda_add_executable(${project_target} ${CPU_SRC})
+set(GPU_SRC mlp.cu)
+
+cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
 target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/examples/cpp/inference)
 target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
 target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})

From 32eaf3a9faec670543ed393a66215108678c67ce Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sat, 3 Dec 2022 20:07:56 +0000
Subject: [PATCH 020/344] cmake update

---
 CMakeLists.txt | 12 ++++++------
 1 file changed, 6 insertions(+), 6 deletions(-)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index 09856f5c66..06dab8812c 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -376,14 +376,14 @@ if(FF_BUILD_ALEXNET OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/AlexNet)
 endif()
 
-# if(FF_BUILD_MLP_UNIFY OR FF_BUILD_ALL_EXAMPLES)
-#   add_subdirectory(examples/cpp/MLP_Unify)
-# endif()
-
-if(FF_BUILD_MLP_UNIFY OR FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/inference/MLP_Unify)
+if(FF_BUILD_MLP_UNIFY OR FF_BUILD_ALL_EXAMPLES)
+  add_subdirectory(examples/cpp/MLP_Unify)
 endif()
 
+# if(FF_BUILD_MLP_UNIFY OR FF_BUILD_ALL_INFERENCE_EXAMPLES)
+#   add_subdirectory(examples/cpp/inference/MLP_Unify)
+# endif()
+
 if(FF_BUILD_SPLIT_TEST OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/split_test)
 endif()

From da7ba33d8d011e3e0499c6e94ab6530da2fd832f Mon Sep 17 00:00:00 2001
From: Daiyaan <marfeen@andrew.cmu.edu>
Date: Tue, 6 Dec 2022 19:32:23 +0000
Subject: [PATCH 021/344] [Attention] inference impl

---
 include/flexflow/ops/attention.h |  4 +++
 src/ops/attention.cc             | 50 ++++++++++++++++++++++++++++++++
 2 files changed, 54 insertions(+)

diff --git a/include/flexflow/ops/attention.h b/include/flexflow/ops/attention.h
index 2903497af9..d50ba78871 100644
--- a/include/flexflow/ops/attention.h
+++ b/include/flexflow/ops/attention.h
@@ -66,6 +66,10 @@ class MultiHeadAttention : public Op {
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
+  void inference(FFModel const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
diff --git a/src/ops/attention.cc b/src/ops/attention.cc
index 9c9c87bd56..662d4e47e1 100644
--- a/src/ops/attention.cc
+++ b/src/ops/attention.cc
@@ -523,6 +523,56 @@ void MultiHeadAttention::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
+void MultiHeadAttention::inference(FFModel const &ff,
+                       std::vector<ParallelTensor> const &batch_inputs,
+                       std::vector<ParallelTensor> const &batch_weights,
+                       std::vector<ParallelTensor> const &batch_outputs) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_forward(ff, argmap);
+  int idx = 0;
+  IndexLauncher launcher(ATTENTION_FWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(idx++, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[1]->region));
+  launcher.add_field(idx++, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[2]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[2]->region));
+  launcher.add_field(idx++, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_weights[0]->region));
+  launcher.add_field(idx++, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(4, FID_DATA);
+  runtime->execute_index_space(ctx, launcher);
+}
+
 /*
   regions[0](I): query
   regions[1](I): key

From c4ba15062af71de65a3b75d286169f563d843040 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 7 Dec 2022 03:04:57 +0000
Subject: [PATCH 022/344] [MOE][INFERENCE] - Added MoE for inference example

---
 CMakeLists.txt                                |   4 +
 examples/cpp/inference/data_generator.h       |  12 +-
 .../mixture_of_experts/CMakeLists.txt         |  22 +
 .../cpp/inference/mixture_of_experts/Makefile |  35 ++
 .../cpp/inference/mixture_of_experts/moe.cc   | 458 ++++++++++++++++++
 .../cpp/inference/mixture_of_experts/moe.cu   |  75 +++
 .../cpp/inference/mixture_of_experts/moe.h    |  60 +++
 .../inference/mixture_of_experts/run_moe.sh   |  11 +
 8 files changed, 671 insertions(+), 6 deletions(-)
 create mode 100644 examples/cpp/inference/mixture_of_experts/CMakeLists.txt
 create mode 100644 examples/cpp/inference/mixture_of_experts/Makefile
 create mode 100644 examples/cpp/inference/mixture_of_experts/moe.cc
 create mode 100644 examples/cpp/inference/mixture_of_experts/moe.cu
 create mode 100644 examples/cpp/inference/mixture_of_experts/moe.h
 create mode 100644 examples/cpp/inference/mixture_of_experts/run_moe.sh

diff --git a/CMakeLists.txt b/CMakeLists.txt
index 06dab8812c..b4eff0574d 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -423,6 +423,10 @@ if(FF_BUILD_MOE OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/mixture_of_experts)
 endif()
 
+if(FF_BUILD_MOE OR FF_BUILD_ALL_INFERENCE_EXAMPLES)
+  add_subdirectory(examples/cpp/inference/mixture_of_experts)
+endif()
+
 # if(FF_BUILD_TRANSFORMER_INFERENCE OR FF_BUILD_ALL_INFERENCE_EXAMPLES)
 #   add_subdirectory(examples/cpp/inference/Transformer)
 # endif()
diff --git a/examples/cpp/inference/data_generator.h b/examples/cpp/inference/data_generator.h
index 14bf91b433..199af572f8 100644
--- a/examples/cpp/inference/data_generator.h
+++ b/examples/cpp/inference/data_generator.h
@@ -82,12 +82,12 @@ vector<vector<double>> Generator::get_requests(void) {
     return requests;
 };
 
-template< class ForwardIt, class Generator >
-void generate( ForwardIt first, ForwardIt last, Generator gen ) {
-  while (first != last) {
-    *first++ = gen();
-  }
-}
+// template <class ForwardIt, class Generator>
+// void generate(ForwardIt first, ForwardIt last, Generator gen) {
+//   while (first != last) {
+//     *first++ = gen();
+//   }
+// }
 
 vector<double> Generator::get_random_tensor(void) {
     random_device rnd_device;
diff --git a/examples/cpp/inference/mixture_of_experts/CMakeLists.txt b/examples/cpp/inference/mixture_of_experts/CMakeLists.txt
new file mode 100644
index 0000000000..ee1c063b18
--- /dev/null
+++ b/examples/cpp/inference/mixture_of_experts/CMakeLists.txt
@@ -0,0 +1,22 @@
+cmake_minimum_required(VERSION 3.10)
+
+project(FlexFlowExample_MoE)
+set(project_target inference_moe)
+
+set(CPU_SRC
+  ${FLEXFLOW_CPP_DRV_SRC}
+  moe.cc
+  moe.h
+  ../data_generator.h)
+
+set(GPU_SRC
+  moe.cu)
+
+cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
+target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
+target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/examples/cpp/inference)
+target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
+
+set(BIN_DEST "bin")
+install(TARGETS ${project_target} DESTINATION ${BIN_DEST})
+
diff --git a/examples/cpp/inference/mixture_of_experts/Makefile b/examples/cpp/inference/mixture_of_experts/Makefile
new file mode 100644
index 0000000000..a9eb401850
--- /dev/null
+++ b/examples/cpp/inference/mixture_of_experts/Makefile
@@ -0,0 +1,35 @@
+# Copyright 2020 Stanford University
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+#
+
+# Flags for directing the runtime makefile what to include
+DEBUG           ?= 1		# Include debugging symbols
+MAX_DIM         ?= 4		# Maximum number of dimensions
+OUTPUT_LEVEL    ?= LEVEL_DEBUG	# Compile time logging level
+USE_CUDA        ?= 1		# Include CUDA support (requires CUDA)
+USE_GASNET      ?= 0		# Include GASNet support (requires GASNet)
+USE_HDF         ?= 0		# Include HDF5 support (requires HDF5)
+ALT_MAPPERS     ?= 0		# Include alternative mappers (not recommended)
+
+# Put the binary file name here
+OUTFILE		?= inference_moe
+# List all the application source files here
+GEN_SRC		= moe.cc
+GEN_GPU_SRC	= moe.cu
+
+ifndef FF_HOME
+$(error FF_HOME variable is not defined, aborting build)
+endif
+
+include $(FF_HOME)/FlexFlow.mk
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
new file mode 100644
index 0000000000..bf7a18bd0a
--- /dev/null
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -0,0 +1,458 @@
+/* Copyright 2020 Stanford
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "moe.h"
+#include "data_generator.h"
+#include "flexflow/inference.h"
+#include <fstream>
+#include <sstream>
+#include <string>
+
+#define NUM_SAMPLES 60000
+#define TRAIN_SAMPLES 60000
+#define TEST_SAMPLES 00000
+#define MNIST_DIMS 28 * 28
+#define CIFAR_DIMS 3 * 32 * 32
+#define DATA_DIMS MNIST_DIMS
+#define OUT_DIM 10
+
+using namespace Legion;
+
+LegionRuntime::Logger::Category log_app("MoE");
+int num_exp = 5;
+int num_select = 2;
+
+void parse_input_args(char **argv, int argc, MoeConfig &config) {
+  for (int i = 1; i < argc; i++) {
+    if (!strcmp(argv[i], "--dataset")) {
+      config.dataset_path = std::string(argv[++i]);
+      continue;
+    }
+  }
+}
+
+Tensor create_moe(FFModel *model,
+                  MoeConfig const *moeConfig,
+                  Tensor const &input) {
+  float alpha = 2.0f;   // factor overhead tensor size for imbalance
+  float lambda = 0.04f; // multiplier for load balance term
+
+  // MoE model
+  Tensor gate_preds = model->dense(input, 64, AC_MODE_RELU);
+  gate_preds = model->dense(gate_preds, num_exp, AC_MODE_RELU);
+  Tensor topK_output[2];
+  model->top_k(gate_preds, topK_output, num_select, false);
+
+  Tensor exp_tensors[num_exp];
+  // printf("num_exp: %i, alpha: %f\n", num_exp);
+  input->print("input_tensor");
+  topK_output[1]->print("topK_output[1]");
+  return topK_output[0];
+  // exp_tensors->print("exp_tensors");
+  // model->group_by(input, topK_output[1], exp_tensors, num_exp, alpha);
+
+  // Tensor agg_inputs[num_exp + 4];
+  // agg_inputs[0] = model->softmax(topK_output[0]); // gate preds
+  // agg_inputs[1] = topK_output[1];             // gate assign
+  // agg_inputs[2] = topK_output[1];             // gate assign TopK (for cache)
+  // agg_inputs[3] = gate_preds;                 // full gate preds
+  // for (int i = 0; i < num_exp; i++) {
+  //   Tensor exp_pred = model->dense(exp_tensors[i], OUT_DIM, AC_MODE_RELU);
+  //   agg_inputs[i + 4] = model->softmax(exp_pred);
+  // }
+
+  // Tensor coop_output = model->aggregate(agg_inputs, num_exp, lambda);
+  // model->get_metrics();
+  // return coop_output;
+}
+
+void FlexFlow::top_level_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  // Inference parameters
+  int total_requests =
+      256; // total number of requests processed as part of the simulation
+  int request_tensor_size = 4; // request tensor dimensions
+  bool poisson_distribution = true;
+  double lambda = 25; // average number of request arrivals per second
+  int num_requests_per_batch = 5;
+  int num_inflight_batches = 10;
+
+  //-----------------------------------------------------------------
+
+  FFConfig ffConfig;
+  MoeConfig moeConfig;
+  {
+    InputArgs const &command_args = HighLevelRuntime::get_input_args();
+    char **argv = command_args.argv;
+    int argc = command_args.argc;
+    parse_input_args(argv, argc, moeConfig);
+    log_app.print("batchSize(%d) workersPerNodes(%d) numNodes(%d)",
+                  ffConfig.batchSize,
+                  ffConfig.workersPerNode,
+                  ffConfig.numNodes);
+  }
+  FFModel ff(ffConfig);
+
+  Tensor input;
+  {
+    int const dims[] = {ffConfig.batchSize, DATA_DIMS};
+    input = ff.create_tensor<2>(dims, DT_FLOAT);
+  }
+
+  //-----------------------------------------------------------------
+
+  Tensor t = create_moe(&ff, &moeConfig, input);
+  InferenceManager im(&ff, num_requests_per_batch, num_inflight_batches);
+  im.compile_model_and_allocate_buffer();
+  ff.init_operators();
+
+  // Data Loader
+  DataLoader data_loader(ff, moeConfig, input, ff.label_tensor);
+
+  //-----------------------------------------------------------------
+
+  // Start timer
+  {
+    runtime->issue_execution_fence(ctx);
+    TimingLauncher timer(MEASURE_MICRO_SECONDS);
+    Future future = runtime->issue_timing_measurement(ctx, timer);
+    future.get_void_result();
+  }
+  double ts_start = Realm::Clock::current_time_in_microseconds();
+
+  ///////////////////////////////////////////////////////////////////////////////////
+
+  int index = 0;
+  int processed_requests = 0;
+  Generator data_generator(
+      total_requests, request_tensor_size, poisson_distribution, lambda);
+  while (processed_requests < total_requests) {
+    vector<vector<double>> req = data_generator.get_requests();
+    int iterations = req.size();
+    for (int iter = 0; iter < iterations; iter++) {
+      data_loader.next_batch(ff);
+      runtime->begin_trace(ctx, 111 /*trace_id*/);
+      im.inference((index++) % num_inflight_batches);
+      runtime->end_trace(ctx, 111 /*trace_id*/);
+    }
+    processed_requests += iterations;
+  }
+
+  ///////////////////////////////////////////////////////////////////////////////////
+
+  // End timer
+  {
+    runtime->issue_execution_fence(ctx);
+    TimingLauncher timer(MEASURE_MICRO_SECONDS);
+    Future future = runtime->issue_timing_measurement(ctx, timer);
+    future.get_void_result();
+  }
+  double ts_end = Realm::Clock::current_time_in_microseconds();
+  double run_time = 1e-6 * (ts_end - ts_start);
+  printf("ELAPSED TIME = %.4fs, THROUGHPUT = %.2f samples/s\n",
+         run_time,
+         TRAIN_SAMPLES * ffConfig.epochs / run_time);
+}
+
+DataLoader::DataLoader(FFModel &ff,
+                       MoeConfig const &moe,
+                       Tensor input,
+                       Tensor label) {
+  num_samples = NUM_SAMPLES;
+
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+
+  // Create full input
+  {
+    batch_input = input;
+    int const dims[] = {NUM_SAMPLES, DATA_DIMS};
+    full_input = ff.create_tensor<2>(dims, DT_FLOAT);
+  }
+  // Create full label
+  {
+    batch_label = label;
+    int const dims[] = {NUM_SAMPLES, 1};
+    full_label = ff.create_tensor<2>(dims, DT_INT32);
+  }
+
+  // Load entire dataset
+  // TODO: Use index launcher instead of task launcher
+  MoeConfig const *ptr = &moe;
+  TaskLauncher launcher(CUSTOM_CPU_TASK_ID_1,
+                        TaskArgument(&ptr, sizeof(MoeConfig *)));
+  // regions[0]: full_input
+  launcher.add_region_requirement(
+      RegionRequirement(full_input->parallel_tensor->region,
+                        WRITE_ONLY,
+                        EXCLUSIVE,
+                        full_input->parallel_tensor->region,
+                        MAP_TO_ZC_MEMORY));
+  launcher.add_field(0, FID_DATA);
+  // regions[1]: full_label
+  launcher.add_region_requirement(
+      RegionRequirement(full_input->parallel_tensor->region,
+                        WRITE_ONLY,
+                        EXCLUSIVE,
+                        full_input->parallel_tensor->region,
+                        MAP_TO_ZC_MEMORY));
+  launcher.add_field(1, FID_DATA);
+
+  runtime->execute_task(ctx, launcher);
+  reset();
+  next_batch(ff);
+}
+
+__inline__ int calc_offset(int c, int y, int x, int yscale, int xscale) {
+  return (c * yscale * xscale + y * xscale + x);
+}
+
+// =================================================
+//                    Load data
+// =================================================
+
+/* NOTE: Download files from http://yann.lecun.com/exdb/mnist/, unpack to
+this directory (Flexflow/examples/cpp/mixture_of_experts) */
+
+void read_cifar100(float *input_ptr, int *label_ptr) {
+  std::ifstream file;
+  file.open("train.bin", std::ios::in | std::ios::binary | std::ios::ate);
+  if (!file) {
+    std::cout << "Error opening CIFAR100 train data file" << std::endl;
+    assert(false);
+  }
+
+  file.seekg(0, std::ios::beg);
+
+  // each sample: <1 x coarse label><1 x fine label><3072 x pixel>
+  for (std::size_t i = 0; i < NUM_SAMPLES; i++) {
+    unsigned char temp = 0;
+    file.read((char *)&temp, sizeof(temp)); // coarse label, skip
+    file.read((char *)&temp, sizeof(temp));
+    label_ptr[i] = temp;
+    for (std::size_t j = 0; j < 3072; ++j) {
+      file.read((char *)&temp, sizeof(temp));
+      input_ptr[i * 3072 + j] = (float)temp / 255.0f;
+    }
+  }
+
+  file.close();
+}
+
+int reverseInt(int i) {
+  unsigned char c1, c2, c3, c4;
+
+  c1 = i & 255;
+  c2 = (i >> 8) & 255;
+  c3 = (i >> 16) & 255;
+  c4 = (i >> 24) & 255;
+
+  return ((int)c1 << 24) + ((int)c2 << 16) + ((int)c3 << 8) + c4;
+}
+
+void read_mnist(float *input_ptr, int *label_ptr) {
+  // read inputs
+  std::ifstream input("train-images-idx3-ubyte", std::ios::binary);
+  if (input.is_open()) {
+    int magic_number = 0;
+    int number_of_images = 0;
+    int n_rows = 0;
+    int n_cols = 0;
+    input.read((char *)&magic_number, sizeof(magic_number));
+    magic_number = reverseInt(magic_number);
+    input.read((char *)&number_of_images, sizeof(number_of_images));
+    number_of_images = reverseInt(number_of_images);
+    input.read((char *)&n_rows, sizeof(n_rows));
+    n_rows = reverseInt(n_rows);
+    input.read((char *)&n_cols, sizeof(n_cols));
+    n_cols = reverseInt(n_cols);
+
+    for (int i = 0; i < number_of_images; i++) {
+      for (int r = 0; r < n_rows; r++) {
+        for (int c = 0; c < n_cols; c++) {
+          unsigned char temp = 0;
+          input.read((char *)&temp, sizeof(temp));
+          input_ptr[i * n_rows * n_cols + r * n_cols + c] =
+              (float)temp / 255.0f;
+        }
+      }
+    }
+  } else {
+    std::cout << "Error opening MNIST input data file" << std::endl;
+    assert(false);
+  }
+
+  // read labels
+  std::ifstream labels("train-labels-idx1-ubyte", std::ios::binary);
+  if (labels.is_open()) {
+    int magic_number = 0;
+    int number_of_images = 0;
+    labels.read((char *)&magic_number, sizeof(magic_number));
+    magic_number = reverseInt(magic_number);
+    labels.read((char *)&number_of_images, sizeof(number_of_images));
+    number_of_images = reverseInt(number_of_images);
+
+    for (int i = 0; i < number_of_images; i++) {
+      unsigned char temp = 0;
+      labels.read((char *)&temp, sizeof(temp));
+      label_ptr[i] = temp;
+    }
+  } else {
+    std::cout << "Error opening MNIST label data file" << std::endl;
+    assert(false);
+  }
+}
+
+void DataLoader::load_entire_dataset(Task const *task,
+                                     std::vector<PhysicalRegion> const &regions,
+                                     Context ctx,
+                                     Runtime *runtime) {
+  // const MoeConfig* conf = *((MoeConfig**)task->args);
+  assert(regions.size() == 2);
+  assert(task->regions.size() == regions.size());
+
+  // get input and label pointer
+  AccessorWO<float, 2> const acc_input(regions[0], FID_DATA);
+  AccessorWO<int, 2> const acc_label(regions[1], FID_DATA);
+  Rect<2> rect_input = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  assert(acc_input.accessor.is_dense_arbitrary(rect_input));
+  Rect<2> rect_label = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+  assert(acc_label.accessor.is_dense_arbitrary(rect_label));
+  float *input_ptr = acc_input.ptr(rect_input.lo);
+  int *label_ptr = acc_label.ptr(rect_label.lo);
+
+  read_mnist(input_ptr, label_ptr);
+  log_app.print("finish loading data\n");
+}
+
+void DataLoader::next_batch(FFModel &ff) {
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  // Load input
+  {
+    IndexSpace task_is = batch_input->parallel_tensor->parallel_is;
+    Rect<2> rect = runtime->get_index_space_domain(ctx, task_is);
+    ArgumentMap argmap;
+    int idx = next_index;
+    for (PointInRectIterator<2> it(rect); it(); it++) {
+      SampleIdxs meta;
+      assert(ff.config.batchSize % (rect.hi[1] - rect.lo[1] + 1) == 0);
+      meta.num_samples = ff.config.batchSize / (rect.hi[1] - rect.lo[1] + 1);
+      for (int i = 0; i < meta.num_samples; i++)
+        meta.idxs[i] = idx++;
+      argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
+    }
+    IndexLauncher launcher(CUSTOM_GPU_TASK_ID_1,
+                           task_is,
+                           TaskArgument(NULL, 0),
+                           argmap,
+                           Predicate::TRUE_PRED,
+                           false /*must*/,
+                           0 /*mapper_id*/,
+                           batch_input->parallel_tensor->machine_view.hash());
+    launcher.add_region_requirement(
+        RegionRequirement(full_input->parallel_tensor->region,
+                          0 /*projection id*/,
+                          READ_ONLY,
+                          EXCLUSIVE,
+                          full_input->parallel_tensor->region,
+                          MAP_TO_ZC_MEMORY));
+    launcher.add_field(0, FID_DATA);
+    launcher.add_region_requirement(
+        RegionRequirement(batch_input->parallel_tensor->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_input->parallel_tensor->region));
+    launcher.add_field(1, FID_DATA);
+    runtime->execute_index_space(ctx, launcher);
+  }
+  // Load label
+  {
+    // IndexSpaceT<2> task_is = IndexSpaceT<2>(ff.get_or_create_task_is(2, ""));
+    IndexSpace task_is = batch_label->parallel_tensor->parallel_is;
+    Rect<2> rect = runtime->get_index_space_domain(ctx, task_is);
+    ArgumentMap argmap;
+    int idx = next_index;
+    for (PointInRectIterator<2> it(rect); it(); it++) {
+      SampleIdxs meta;
+      assert(ff.config.batchSize % (rect.hi[1] - rect.lo[1] + 1) == 0);
+      meta.num_samples = ff.config.batchSize / (rect.hi[1] - rect.lo[1] + 1);
+      for (int i = 0; i < meta.num_samples; i++)
+        meta.idxs[i] = idx++;
+      argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
+    }
+    IndexLauncher launcher(CUSTOM_GPU_TASK_ID_2,
+                           task_is,
+                           TaskArgument(NULL, 0),
+                           argmap,
+                           Predicate::TRUE_PRED,
+                           false /*must*/,
+                           0 /*mapper_id*/,
+                           batch_label->parallel_tensor->machine_view.hash());
+    launcher.add_region_requirement(
+        RegionRequirement(full_label->parallel_tensor->region,
+                          0 /*projection id*/,
+                          READ_ONLY,
+                          EXCLUSIVE,
+                          full_label->parallel_tensor->region,
+                          MAP_TO_ZC_MEMORY));
+    launcher.add_field(0, FID_DATA);
+    launcher.add_region_requirement(
+        RegionRequirement(batch_label->parallel_tensor->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_label->parallel_tensor->region));
+    launcher.add_field(1, FID_DATA);
+    runtime->execute_index_space(ctx, launcher);
+  }
+  next_index += ff.config.batchSize;
+}
+
+void DataLoader::reset() {
+  next_index = 0;
+}
+
+void FlexFlow::register_custom_tasks() {
+  // Load entire dataset
+  {
+    TaskVariantRegistrar registrar(CUSTOM_CPU_TASK_ID_1, "Load Entire Dataset");
+    registrar.add_constraint(ProcessorConstraint(Processor::LOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<DataLoader::load_entire_dataset>(
+        registrar, "Load Entire Dataset Task");
+  }
+  // Load input
+  {
+    TaskVariantRegistrar registrar(CUSTOM_GPU_TASK_ID_1, "Load Inputs");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<DataLoader::load_input>(
+        registrar, "Load Input Task");
+  }
+  // Load label
+  {
+    TaskVariantRegistrar registrar(CUSTOM_GPU_TASK_ID_2, "Load Labels");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<DataLoader::load_label>(
+        registrar, "Load Label Task");
+  }
+}
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cu b/examples/cpp/inference/mixture_of_experts/moe.cu
new file mode 100644
index 0000000000..c4224e0a49
--- /dev/null
+++ b/examples/cpp/inference/mixture_of_experts/moe.cu
@@ -0,0 +1,75 @@
+/* Copyright 2020 Stanford
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/utils/cuda_helper.h"
+#include "moe.h"
+
+void DataLoader::load_input(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+  SampleIdxs *meta = (SampleIdxs *)task->local_args;
+  TensorAccessorR<float, 2> acc_full_input(
+      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  TensorAccessorW<float, 2> acc_batch_input(regions[1],
+                                            task->regions[1],
+                                            FID_DATA,
+                                            ctx,
+                                            runtime,
+                                            false /*readOutput*/);
+
+  coord_t batch_size =
+      acc_batch_input.rect.hi[1] - acc_batch_input.rect.lo[1] + 1;
+  coord_t sample_dim =
+      acc_batch_input.rect.hi[0] - acc_batch_input.rect.lo[0] + 1;
+
+  // FIXME: currently assume continous indices
+  assert(batch_size == meta->num_samples);
+  for (int i = 1; i < batch_size; i++)
+    assert(meta->idxs[i] == meta->idxs[0] + i);
+  coord_t start_idx = meta->idxs[0];
+  float const *input_zc = acc_full_input.ptr + start_idx * sample_dim;
+  copy_kernel<<<GET_BLOCKS(acc_batch_input.rect.volume()), CUDA_NUM_THREADS>>>(
+      acc_batch_input.ptr, input_zc, acc_batch_input.rect.volume());
+  checkCUDA(cudaDeviceSynchronize());
+}
+
+void DataLoader::load_label(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+  SampleIdxs *meta = (SampleIdxs *)task->local_args;
+  TensorAccessorR<int, 2> acc_full_label(
+      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  TensorAccessorW<int, 2> acc_batch_label(regions[1],
+                                          task->regions[1],
+                                          FID_DATA,
+                                          ctx,
+                                          runtime,
+                                          false /*readOutput*/);
+  int batch_size = acc_batch_label.rect.hi[1] - acc_batch_label.rect.lo[1] + 1;
+  // FIXME: currently assume continous indices
+  assert(batch_size == meta->num_samples);
+  for (int i = 1; i < meta->num_samples; i++)
+    assert(meta->idxs[i] == meta->idxs[0] + i);
+  int const *input_zc = acc_full_label.ptr + meta->idxs[0];
+  copy_kernel<<<GET_BLOCKS(acc_batch_label.rect.volume()), CUDA_NUM_THREADS>>>(
+      acc_batch_label.ptr, input_zc, acc_batch_label.rect.volume());
+  checkCUDA(cudaDeviceSynchronize());
+}
diff --git a/examples/cpp/inference/mixture_of_experts/moe.h b/examples/cpp/inference/mixture_of_experts/moe.h
new file mode 100644
index 0000000000..5610de4ab7
--- /dev/null
+++ b/examples/cpp/inference/mixture_of_experts/moe.h
@@ -0,0 +1,60 @@
+/* Copyright 2017 Stanford, NVIDIA
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/model.h"
+#define MAX_NUM_SAMPLES 60000
+
+using namespace Legion;
+using namespace std;
+using namespace FlexFlow;
+
+struct MoeConfig {
+  MoeConfig(void) {
+    // Set default configurations here
+  }
+  std::string dataset_path;
+};
+
+class DataLoader {
+public:
+  DataLoader(FFModel &ff,
+             MoeConfig const &alexnet,
+             Tensor _input,
+             Tensor _label);
+  static void load_input(Task const *task,
+                         std::vector<PhysicalRegion> const &regions,
+                         Context ctx,
+                         Runtime *runtime);
+  static void load_label(Task const *task,
+                         std::vector<PhysicalRegion> const &regions,
+                         Context ctx,
+                         Runtime *runtime);
+  static void load_entire_dataset(Task const *task,
+                                  std::vector<PhysicalRegion> const &regions,
+                                  Context ctx,
+                                  Runtime *runtime);
+  void next_batch(FFModel &);
+  void reset(void);
+
+public:
+  int num_samples, next_index;
+  Tensor full_input, batch_input;
+  Tensor full_label, batch_label;
+};
+
+struct SampleIdxs {
+  int num_samples;
+  int idxs[MAX_NUM_SAMPLES];
+};
diff --git a/examples/cpp/inference/mixture_of_experts/run_moe.sh b/examples/cpp/inference/mixture_of_experts/run_moe.sh
new file mode 100644
index 0000000000..33c6c5f7fb
--- /dev/null
+++ b/examples/cpp/inference/mixture_of_experts/run_moe.sh
@@ -0,0 +1,11 @@
+#!/bin/bash
+#SBATCH --job-name=pagerank
+#SBATCH --output=slurm.txt
+#SBATCH --time=10:00
+#SBATCH --nodes=2
+#SBATCH --cpus-per-task=2
+#SBATCH --mem-per-cpu=6000MB
+#SBATCH --nodelist=g0001,g0002
+#SBATCH --partition=gpu
+
+srun -n 2 ./moe -ll:cpu 4 -ll:gpu 4 -ll:fsize 15000 -ll:zsize 15000 --nodes 2 -ll:util 1 -b 40 -e 1 --search-budget 1 --export strat-tmp.txt

From e093a44631bca9f5e863ec72ed4e71e3c25a8c91 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 13 Dec 2022 16:17:28 +0000
Subject: [PATCH 023/344] [Inference][MLP_Unify] - Fixed bug

---
 CMakeLists.txt                          | 6 +++---
 examples/cpp/inference/MLP_Unify/mlp.cc | 6 ++++++
 examples/cpp/inference/MLP_Unify/mlp.h  | 7 ++-----
 3 files changed, 11 insertions(+), 8 deletions(-)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index b4eff0574d..b796308aa3 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -380,9 +380,9 @@ if(FF_BUILD_MLP_UNIFY OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/MLP_Unify)
 endif()
 
-# if(FF_BUILD_MLP_UNIFY OR FF_BUILD_ALL_INFERENCE_EXAMPLES)
-#   add_subdirectory(examples/cpp/inference/MLP_Unify)
-# endif()
+if(FF_BUILD_MLP_UNIFY OR FF_BUILD_ALL_INFERENCE_EXAMPLES)
+  add_subdirectory(examples/cpp/inference/MLP_Unify)
+endif()
 
 if(FF_BUILD_SPLIT_TEST OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/split_test)
diff --git a/examples/cpp/inference/MLP_Unify/mlp.cc b/examples/cpp/inference/MLP_Unify/mlp.cc
index 9fea4e979b..b96cb9b22c 100644
--- a/examples/cpp/inference/MLP_Unify/mlp.cc
+++ b/examples/cpp/inference/MLP_Unify/mlp.cc
@@ -14,6 +14,11 @@
  */
 
 #include "mlp.h"
+#include "data_generator.h"
+#include "flexflow/inference.h"
+#include <fstream>
+#include <sstream>
+#include <string>
 
 using namespace Legion;
 using namespace FlexFlow;
@@ -202,6 +207,7 @@ void FlexFlow::top_level_task(Task const *task,
   Tensor t = create_mlp(&ff, &mlpConfig, input1, input2);
   
   InferenceManager im(&ff, num_requests_per_batch, num_inflight_batches);
+  im.compile_model_and_allocate_buffer();
   ff.init_operators();
   
   // Start timer
diff --git a/examples/cpp/inference/MLP_Unify/mlp.h b/examples/cpp/inference/MLP_Unify/mlp.h
index 8d1cdd27ad..213d77d992 100644
--- a/examples/cpp/inference/MLP_Unify/mlp.h
+++ b/examples/cpp/inference/MLP_Unify/mlp.h
@@ -13,14 +13,11 @@
  * limitations under the License.
  */
 
+
 #include "flexflow/model.h"
 #include "flexflow/inference.h"
-#include <fstream>
-#include <sstream>
-#include <string>
-#include "data_generator.h"
-
 using namespace Legion;
+using namespace std;
 using namespace FlexFlow;
 
 #define MAX_NUM_SAMPLES 1024000

From 7aa090d042a541d8c16b96324c2ebb7e26304e4c Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 13 Dec 2022 16:54:16 +0000
Subject: [PATCH 024/344] [Inference][TopK] - Added inference impl for TopK,
 removed batched weights from all ops

---
 examples/cpp/inference/MLP_Unify/mlp.h |  3 +--
 include/flexflow/operator.h            |  5 ++--
 include/flexflow/ops/attention.h       |  1 -
 include/flexflow/ops/linear.h          |  1 -
 include/flexflow/ops/topk.h            |  3 +++
 src/ops/attention.cc                   | 12 ++++-----
 src/ops/linear.cc                      |  9 +++----
 src/ops/topk.cc                        | 36 ++++++++++++++++++++++++++
 src/runtime/inference_manager.cc       |  5 +---
 9 files changed, 54 insertions(+), 21 deletions(-)

diff --git a/examples/cpp/inference/MLP_Unify/mlp.h b/examples/cpp/inference/MLP_Unify/mlp.h
index 213d77d992..7a8cc06955 100644
--- a/examples/cpp/inference/MLP_Unify/mlp.h
+++ b/examples/cpp/inference/MLP_Unify/mlp.h
@@ -13,9 +13,8 @@
  * limitations under the License.
  */
 
-
-#include "flexflow/model.h"
 #include "flexflow/inference.h"
+#include "flexflow/model.h"
 using namespace Legion;
 using namespace std;
 using namespace FlexFlow;
diff --git a/include/flexflow/operator.h b/include/flexflow/operator.h
index bdaecac8a2..2fe689c284 100644
--- a/include/flexflow/operator.h
+++ b/include/flexflow/operator.h
@@ -190,8 +190,9 @@ class Op {
   // Pure virtual functions for inference
   virtual void inference(FFModel const &,
                          std::vector<ParallelTensor> const &,
-                         std::vector<ParallelTensor> const &,
-                         std::vector<ParallelTensor> const &) {assert(false);};
+                         std::vector<ParallelTensor> const &) {
+    assert(false);
+  };
   virtual void print_layer(FFModel const &model) = 0;
   virtual bool measure_operator_cost(Simulator *sim,
                                      MachineView const &mv,
diff --git a/include/flexflow/ops/attention.h b/include/flexflow/ops/attention.h
index d50ba78871..be54ef21a1 100644
--- a/include/flexflow/ops/attention.h
+++ b/include/flexflow/ops/attention.h
@@ -67,7 +67,6 @@ class MultiHeadAttention : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   void inference(FFModel const &,
-                 std::vector<ParallelTensor> const &,
                  std::vector<ParallelTensor> const &,
                  std::vector<ParallelTensor> const &) override;
   void print_layer(FFModel const &model) override {
diff --git a/include/flexflow/ops/linear.h b/include/flexflow/ops/linear.h
index 6ad1a0752f..510799c43a 100644
--- a/include/flexflow/ops/linear.h
+++ b/include/flexflow/ops/linear.h
@@ -38,7 +38,6 @@ class Linear : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   void inference(FFModel const &,
-                 std::vector<ParallelTensor> const &,
                  std::vector<ParallelTensor> const &,
                  std::vector<ParallelTensor> const &) override;
   void print_layer(FFModel const &model) override;
diff --git a/include/flexflow/ops/topk.h b/include/flexflow/ops/topk.h
index 6b1613c828..1b31df998d 100644
--- a/include/flexflow/ops/topk.h
+++ b/include/flexflow/ops/topk.h
@@ -30,6 +30,9 @@ class TopK : public Op {
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
+  void inference(FFModel const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
diff --git a/src/ops/attention.cc b/src/ops/attention.cc
index 662d4e47e1..7b9e711b0c 100644
--- a/src/ops/attention.cc
+++ b/src/ops/attention.cc
@@ -523,10 +523,10 @@ void MultiHeadAttention::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-void MultiHeadAttention::inference(FFModel const &ff,
-                       std::vector<ParallelTensor> const &batch_inputs,
-                       std::vector<ParallelTensor> const &batch_weights,
-                       std::vector<ParallelTensor> const &batch_outputs) {
+void MultiHeadAttention::inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
@@ -558,11 +558,11 @@ void MultiHeadAttention::inference(FFModel const &ff,
                                                     EXCLUSIVE,
                                                     batch_inputs[2]->region));
   launcher.add_field(idx++, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(batch_weights[0]->part,
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
                                                     EXCLUSIVE,
-                                                    batch_weights[0]->region));
+                                                    weights[0]->region));
   launcher.add_field(idx++, FID_DATA);
   launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
                                                     0 /*projection id*/,
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index b47a884c5c..9413f5f726 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -369,7 +369,6 @@ void Linear::forward(FFModel const &ff) {
 
 void Linear::inference(FFModel const &ff,
                        std::vector<ParallelTensor> const &batch_inputs,
-                       std::vector<ParallelTensor> const &batch_weights,
                        std::vector<ParallelTensor> const &batch_outputs) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
@@ -395,18 +394,18 @@ void Linear::inference(FFModel const &ff,
                                                     EXCLUSIVE,
                                                     batch_outputs[0]->region));
   launcher.add_field(1, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(batch_weights[0]->part,
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
                                                     EXCLUSIVE,
-                                                    batch_weights[0]->region));
+                                                    weights[0]->region));
   launcher.add_field(2, FID_DATA);
   if (use_bias) {
-    launcher.add_region_requirement(RegionRequirement(batch_weights[1]->part,
+    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
                                                       0 /*projection id*/,
                                                       READ_ONLY,
                                                       EXCLUSIVE,
-                                                      batch_weights[1]->region));
+                                                      weights[1]->region));
     launcher.add_field(3, FID_DATA);
   }
   runtime->execute_index_space(ctx, launcher);
diff --git a/src/ops/topk.cc b/src/ops/topk.cc
index 1a87c6c80c..ae43038416 100644
--- a/src/ops/topk.cc
+++ b/src/ops/topk.cc
@@ -220,6 +220,42 @@ void TopK::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
+void TopK::inference(FFModel const &ff,
+                     std::vector<ParallelTensor> const &batch_inputs,
+                     std::vector<ParallelTensor> const &batch_outputs) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_forward(ff, argmap);
+  IndexLauncher launcher(TOPK_FWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[1]->region));
+  launcher.add_field(2, FID_DATA);
+  runtime->execute_index_space(ctx, launcher);
+}
+
 void TopK::forward_task(Task const *task,
                         std::vector<PhysicalRegion> const &regions,
                         Context ctx,
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index cd68b5e04d..71fe0ec6f9 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -61,15 +61,12 @@ void InferenceManager::inference(int index) {
   for (size_t o = 0; o < model->operators.size(); o++) {
     Op* op = model->operators[o];
     std::vector<ParallelTensor> inputs(op->numInputs);
-    std::vector<ParallelTensor> weights(op->numWeights);
     std::vector<ParallelTensor> outputs(op->numOutputs);
     for (int i = 0; i < op->numInputs; i++)
       inputs[i] = tensor_buffer[op->inputs[i]][index];
-    for (int i = 0; i < op->numWeights; i++)
-      weights[i] = op->weights[i];
     for (int i = 0; i < op->numOutputs; i++)
       outputs[i] = tensor_buffer[op->outputs[i]][index];
-    op->inference(*model, inputs, weights, outputs);
+    op->inference(*model, inputs, outputs);
   }
 };
 

From ab40cacab71914ec44a1e94b775b46600212ad55 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 13 Dec 2022 19:16:24 +0000
Subject: [PATCH 025/344] [GroupBy] - Add replica dimension

---
 include/flexflow/ops/groupby.h |  6 ++++--
 src/ops/group_by.cc            | 21 +++++++++++++++-----
 src/ops/group_by.cpp           | 35 +++++++++++++++++-----------------
 src/ops/group_by.cu            | 17 +++++++++++------
 4 files changed, 48 insertions(+), 31 deletions(-)

diff --git a/include/flexflow/ops/groupby.h b/include/flexflow/ops/groupby.h
index 4a15f6f439..a958f3c4ce 100644
--- a/include/flexflow/ops/groupby.h
+++ b/include/flexflow/ops/groupby.h
@@ -71,7 +71,8 @@ class Group_by : public Op {
                              int k,       // chosen experts
                              float alpha, // factor additional memory assigned
                              int batch_size,
-                             int data_dim);
+                             int data_dim,
+                             int n_replicas);
   static void
       backward_kernel_wrapper(GroupByMeta const *m,
                               float *input_grad,
@@ -81,7 +82,8 @@ class Group_by : public Op {
                               int k,       // chosen experts
                               float alpha, // factor additional memory assigned
                               int batch_size,
-                              int data_dim);
+                              int data_dim, 
+                              int n_replicas);
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
                              CostMetrics &cost_metrics) const override;
diff --git a/src/ops/group_by.cc b/src/ops/group_by.cc
index 850a5c4587..80ff3508b4 100644
--- a/src/ops/group_by.cc
+++ b/src/ops/group_by.cc
@@ -270,6 +270,7 @@ void Group_by::forward_task(Task const *task,
   int n = gb->n;
   float alpha = gb->alpha;
 
+  // Check that the number of regions is n+2: n outputs and 2 inputs
   assert((int)regions.size() == n + 2);
   assert((int)task->regions.size() == n + 2);
 
@@ -287,13 +288,16 @@ void Group_by::forward_task(Task const *task,
 
   coord_t input_rows = rect_input.hi[1] - rect_input.lo[1] + 1;
   coord_t input_cols = rect_input.hi[0] - rect_input.lo[0] + 1;
+  coord_t input_replicas = rect_input.hi[2] - rect_input.lo[2] + 1;
+  // Check that dimensions match in the input and assign tensors
   assert(input_rows == rect_assign.hi[1] - rect_assign.lo[1] + 1);
-
+  assert(input_replicas == rect_assign.hi[2] - rect_assign.lo[2] + 1); // does this need to be true?
   int k = rect_assign.hi[0] - rect_assign.lo[0] + 1;
   int batch_size = input_rows;
   int data_dim = input_cols;
+  int n_replicas = input_replicas;
 
-  // Create a vector of n outputs, where n is the number of experts.
+  // Create a vector of n outputs, where n is the number of experts. 
   // Each entry in the "outputs" vector points to the Legion tensor that will
   // contain the tockens dispatched to the corresponding expert
   float *outputs[n];
@@ -310,6 +314,9 @@ void Group_by::forward_task(Task const *task,
     assert(output_cols == input_cols);
   }
 
+  // Launch the kernel responsible from copying the data from the input tensor
+  // to each output tensor, according to the input to expert assignments from
+  // the assign tensor.
   Group_by::forward_kernel_wrapper(m,
                                    acc_input.ptr(rect_input),
                                    acc_assign.ptr(rect_assign),
@@ -318,7 +325,8 @@ void Group_by::forward_task(Task const *task,
                                    k,
                                    alpha,
                                    batch_size,
-                                   data_dim);
+                                   data_dim,
+                                   n_replicas);
 }
 
 void Group_by::backward(FFModel const &ff) {
@@ -388,11 +396,13 @@ void Group_by::backward_task(Task const *task,
 
   coord_t input_rows = rect_input_grad.hi[1] - rect_input_grad.lo[1] + 1;
   coord_t input_cols = rect_input_grad.hi[0] - rect_input_grad.lo[0] + 1;
+  coord_t input_replicas = rect_input_grad.hi[2] - rect_input_grad.lo[2] + 1;
   assert(input_rows == rect_assign.hi[1] - rect_assign.lo[1] + 1);
-
+  assert(input_replicas == rect_assign.hi[2] - rect_assign.lo[2] + 1); // does this need to be true?
   int k = rect_assign.hi[0] - rect_assign.lo[0] + 1;
   int batch_size = input_rows;
   int data_dim = input_cols;
+  int n_replicas = input_replicas;
 
   // get output
   float *output_grads[n];
@@ -417,7 +427,8 @@ void Group_by::backward_task(Task const *task,
                                     k,
                                     alpha,
                                     batch_size,
-                                    data_dim);
+                                    data_dim,
+                                    n_replicas);
 }
 
 void Group_by::serialize(Legion::Serializer &sez) const {
diff --git a/src/ops/group_by.cpp b/src/ops/group_by.cpp
index f45e9092a5..16c8354bca 100644
--- a/src/ops/group_by.cpp
+++ b/src/ops/group_by.cpp
@@ -33,25 +33,19 @@ __global__ void
                       int k,       // chosen experts
                       float alpha, // factor additional memory assigned
                       int batch_size,
-                      int data_dim) {
-  __shared__ float
-      *chosen_exp_preds[MAX_K *
-                        MAX_BATCH_SIZE]; // one pointer for each exp_assign
-                                         // (TopK_output[1]) element
+                      int data_dim,
+                      int n_replicas) {
+  __shared__ float *chosen_exp_preds[MAX_K * MAX_BATCH_SIZE]; // one pointer for each exp_assign (TopK_output[1]) element 
 
   // Get pred pointers, single thread per block
   if (threadIdx.x == 0) {
-    int exp_tensor_rows =
-        ceil(alpha * k / n * batch_size); // This is the max expert capacity
-    int expert_idx[MAX_N] = {
-        0}; // This is the number of tokens assigned to each expert
+    int exp_tensor_rows = ceil(alpha * k / n * batch_size); // This is the max expert capacity
+    int expert_idx[MAX_N] = {0};  // This is the number of tokens assigned to each expert
     // Iterate through flattened assign tensor, which has shape (k, batch_size)
     for (int i = 0; i < k * batch_size; i++) {
       // Get pointer to chosen expert predictions
-      int expert =
-          exp_assign[i]; // index of the expert that is to receive the token i
-      if (expert_idx[expert] >=
-          exp_tensor_rows) { // check if the expert is already at capacity
+      int expert = exp_assign[i]; // index of the expert that is to receive the token i
+      if (expert_idx[expert] >= exp_tensor_rows) { // check if the expert is already at capacity
         // dropped sample
         chosen_exp_preds[i] = 0;
         continue;
@@ -85,7 +79,8 @@ __global__ void
                        int k,       // chosen experts
                        float alpha, // factor additional memory assigned
                        int batch_size,
-                       int data_dim) {
+                       int data_dim,
+                       int n_replicas) {
   __shared__ float *chosen_exp_grads[MAX_K * MAX_BATCH_SIZE];
 
   // Get pred pointers, single thread
@@ -127,7 +122,8 @@ void Group_by::forward_kernel_wrapper(
     int k,       // chosen experts
     float alpha, // factor additional memory assigned
     int batch_size,
-    int data_dim) {
+    int data_dim,
+    int n_replicas) {
   // TODO: why cublas/cudnn stream is needed here?
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
@@ -148,7 +144,8 @@ void Group_by::forward_kernel_wrapper(
                      k,
                      alpha,
                      batch_size,
-                     data_dim);
+                     data_dim,
+                     n_replicas);
 }
 
 void Group_by::backward_kernel_wrapper(
@@ -160,7 +157,8 @@ void Group_by::backward_kernel_wrapper(
     int k,       // chosen experts
     float alpha, // factor additional memory assigned
     int batch_size,
-    int data_dim) {
+    int data_dim,
+    int n_replicas) {
   // TODO: why cublas/cudnn stream is needed here
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
@@ -183,7 +181,8 @@ void Group_by::backward_kernel_wrapper(
                      k,
                      alpha,
                      batch_size,
-                     data_dim);
+                     data_dim,
+                     n_replicas);
 }
 
 GroupByMeta::GroupByMeta(FFHandler handler, int n) : OpMeta(handler) {
diff --git a/src/ops/group_by.cu b/src/ops/group_by.cu
index ee0b18337c..5e5f4a6fb8 100644
--- a/src/ops/group_by.cu
+++ b/src/ops/group_by.cu
@@ -32,7 +32,8 @@ __global__ void
                       int k,       // chosen experts
                       float alpha, // factor additional memory assigned
                       int batch_size,
-                      int data_dim) {
+                      int data_dim,
+                      int n_replicas) {
   __shared__ float *chosen_exp_preds[MAX_K * MAX_BATCH_SIZE];
 
   // Get pred pointers, single thread per block
@@ -71,7 +72,8 @@ __global__ void
                        int k,       // chosen experts
                        float alpha, // factor additional memory assigned
                        int batch_size,
-                       int data_dim) {
+                       int data_dim,
+                       int n_replicas) {
   __shared__ float *chosen_exp_grads[MAX_K * MAX_BATCH_SIZE];
   assert(k <= MAX_K);
   assert(batch_size <= MAX_BATCH_SIZE);
@@ -115,7 +117,8 @@ void Group_by::forward_kernel_wrapper(
     int k,       // chosen experts
     float alpha, // factor additional memory assigned
     int batch_size,
-    int data_dim) {
+    int data_dim,
+    int n_replicas) {
   // TODO: why cublas/cudnn stream is needed here?
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
@@ -136,7 +139,7 @@ void Group_by::forward_kernel_wrapper(
                       min(CUDA_NUM_THREADS, (int)(batch_size * k * data_dim)),
                       0,
                       stream>>>(
-      input, exp_assign, m->dev_region_ptrs, n, k, alpha, batch_size, data_dim);
+      input, exp_assign, m->dev_region_ptrs, n, k, alpha, batch_size, data_dim, n_replicas);
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
     checkCUDA(cudaEventSynchronize(t_end));
@@ -157,7 +160,8 @@ void Group_by::backward_kernel_wrapper(
     int k,       // chosen experts
     float alpha, // factor additional memory assigned
     int batch_size,
-    int data_dim) {
+    int data_dim,
+    int n_replicas) {
   // TODO: why cublas/cudnn stream is needed here
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
@@ -184,7 +188,8 @@ void Group_by::backward_kernel_wrapper(
                                  k,
                                  alpha,
                                  batch_size,
-                                 data_dim);
+                                 data_dim,
+                                 n_replicas);
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
     checkCUDA(cudaEventSynchronize(t_end));

From 49601c572cb195f6d3605c8385c5f9bac6f13937 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 13 Dec 2022 19:27:01 +0000
Subject: [PATCH 026/344] [MoE] - uncommented layers

---
 .../cpp/inference/mixture_of_experts/moe.cc   | 46 +++++++++++--------
 1 file changed, 28 insertions(+), 18 deletions(-)

diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index bf7a18bd0a..d1f47359b3 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -51,31 +51,41 @@ Tensor create_moe(FFModel *model,
 
   // MoE model
   Tensor gate_preds = model->dense(input, 64, AC_MODE_RELU);
+  // gate_preds->print("gate_preds");
   gate_preds = model->dense(gate_preds, num_exp, AC_MODE_RELU);
+  // gate_preds->print("gate_preds2");
   Tensor topK_output[2];
   model->top_k(gate_preds, topK_output, num_select, false);
-
+  // topK_output[0]->print("topK_output[0]");
+  // topK_output[1]->print("topK_output[1]");
   Tensor exp_tensors[num_exp];
   // printf("num_exp: %i, alpha: %f\n", num_exp);
-  input->print("input_tensor");
-  topK_output[1]->print("topK_output[1]");
-  return topK_output[0];
-  // exp_tensors->print("exp_tensors");
-  // model->group_by(input, topK_output[1], exp_tensors, num_exp, alpha);
-
-  // Tensor agg_inputs[num_exp + 4];
-  // agg_inputs[0] = model->softmax(topK_output[0]); // gate preds
-  // agg_inputs[1] = topK_output[1];             // gate assign
-  // agg_inputs[2] = topK_output[1];             // gate assign TopK (for cache)
-  // agg_inputs[3] = gate_preds;                 // full gate preds
-  // for (int i = 0; i < num_exp; i++) {
-  //   Tensor exp_pred = model->dense(exp_tensors[i], OUT_DIM, AC_MODE_RELU);
-  //   agg_inputs[i + 4] = model->softmax(exp_pred);
+  // input->print("input_tensor");
+
+  // return topK_output[0];
+  // exp_tensors[0]->print("exp_tensors[0]");
+  // exp_tensors[num_exp-1]->print("exp_tensors[num_exp-1]");
+  model->group_by(input, topK_output[1], exp_tensors, num_exp, alpha);
+  // for (int i=0; i<num_exp; i++) {
+  //   exp_tensors[i]->dims[2] = 1;
+  //   exp_tensors[i]->print("exp_tensors[i]");
   // }
-
-  // Tensor coop_output = model->aggregate(agg_inputs, num_exp, lambda);
+  Tensor agg_inputs[num_exp + 4];
+  agg_inputs[0] = model->softmax(topK_output[0]); // gate preds
+  agg_inputs[1] = topK_output[1];                 // gate assign
+  agg_inputs[2] = topK_output[1]; // gate assign TopK (for cache)
+  agg_inputs[3] = gate_preds;     // full gate preds
+  for (int i = 0; i < num_exp; i++) {
+    Tensor exp_pred = model->dense(exp_tensors[i], OUT_DIM, AC_MODE_RELU);
+    exp_pred->print("exp_pred");
+    agg_inputs[i + 4] = model->softmax(exp_pred);
+  }
+  for (int i = 0; i < num_exp + 4; i++) {
+    agg_inputs[i]->print("agg_inputs[i]");
+  }
+  Tensor coop_output = model->aggregate(agg_inputs, num_exp, lambda);
   // model->get_metrics();
-  // return coop_output;
+  return coop_output;
 }
 
 void FlexFlow::top_level_task(Task const *task,

From 261d208c7ff2a9cc10891610d5003379e574d024 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 13 Dec 2022 19:33:55 +0000
Subject: [PATCH 027/344] fixes

---
 examples/cpp/inference/mixture_of_experts/moe.cc | 8 ++++----
 1 file changed, 4 insertions(+), 4 deletions(-)

diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index d1f47359b3..c1c1958e91 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -66,10 +66,10 @@ Tensor create_moe(FFModel *model,
   // exp_tensors[0]->print("exp_tensors[0]");
   // exp_tensors[num_exp-1]->print("exp_tensors[num_exp-1]");
   model->group_by(input, topK_output[1], exp_tensors, num_exp, alpha);
-  // for (int i=0; i<num_exp; i++) {
-  //   exp_tensors[i]->dims[2] = 1;
-  //   exp_tensors[i]->print("exp_tensors[i]");
-  // }
+  for (int i=0; i<num_exp; i++) {
+    exp_tensors[i]->dims[2] = 1; // temporary fix to replica dimension being undefined
+    exp_tensors[i]->print("exp_tensors[i]");
+  }
   Tensor agg_inputs[num_exp + 4];
   agg_inputs[0] = model->softmax(topK_output[0]); // gate preds
   agg_inputs[1] = topK_output[1];                 // gate assign

From d67bd3b6fd574ac0eab5ba63c0a1380affe71878 Mon Sep 17 00:00:00 2001
From: zwang86 <46699021+zwang86@users.noreply.github.com>
Date: Tue, 13 Dec 2022 21:05:50 -0500
Subject: [PATCH 028/344] Inference: Implement init version of
 Group_by::inference (#522)

* Implement init Group_by::inference

* Remove .DS_Store
---
 include/flexflow/ops/groupby.h |  3 +++
 src/ops/group_by.cc            | 43 ++++++++++++++++++++++++++++++++++
 2 files changed, 46 insertions(+)

diff --git a/include/flexflow/ops/groupby.h b/include/flexflow/ops/groupby.h
index a958f3c4ce..f118af0a38 100644
--- a/include/flexflow/ops/groupby.h
+++ b/include/flexflow/ops/groupby.h
@@ -35,6 +35,9 @@ class Group_by : public Op {
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
+  void inference(FFModel const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
diff --git a/src/ops/group_by.cc b/src/ops/group_by.cc
index 80ff3508b4..6ea01c83a8 100644
--- a/src/ops/group_by.cc
+++ b/src/ops/group_by.cc
@@ -261,6 +261,49 @@ void Group_by::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
+void Group_by::inference(FFModel const &ff,
+                    std::vector<ParallelTensor> const &batch_inputs,
+                    std::vector<ParallelTensor> const &batch_outputs) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  IndexLauncher launcher(GROUP_BY_FWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(Group_by)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  // data
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+
+  // assign
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[1]->region));
+  launcher.add_field(1, FID_DATA);
+
+  // output
+  for (int i = 0; i < n; i++) {
+    launcher.add_region_requirement(RegionRequirement(batch_outputs[i]->part,
+                                                      0 /*projection id*/,
+                                                      WRITE_ONLY,
+                                                      EXCLUSIVE,
+                                                      batch_outputs[i]->region));
+    launcher.add_field(i + 2, FID_DATA);
+  }
+
+  runtime->execute_index_space(ctx, launcher);
+}
+
 void Group_by::forward_task(Task const *task,
                             std::vector<PhysicalRegion> const &regions,
                             Context ctx,

From bc09bb990c0ae8c105a1a3a03f86be75e36ec1b7 Mon Sep 17 00:00:00 2001
From: Rae Wong <33883582+yingyee0111@users.noreply.github.com>
Date: Tue, 13 Dec 2022 21:06:06 -0500
Subject: [PATCH 029/344] feat: implement inference batch tensors (#521)

---
 include/flexflow/ops/aggregate.h      |  3 ++
 include/flexflow/ops/aggregate_spec.h |  3 ++
 src/ops/aggregate.cc                  | 50 +++++++++++++++++++++++++++
 src/ops/aggregate_spec.cc             | 49 ++++++++++++++++++++++++++
 4 files changed, 105 insertions(+)

diff --git a/include/flexflow/ops/aggregate.h b/include/flexflow/ops/aggregate.h
index 4eeb695e92..f93e26057d 100644
--- a/include/flexflow/ops/aggregate.h
+++ b/include/flexflow/ops/aggregate.h
@@ -36,6 +36,9 @@ class Aggregate : public Op {
             char const *name = nullptr);
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
+  void inference(FFModel const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &) override;
   void backward(FFModel const &) override;
   void print_layer(FFModel const &model) override {
     assert(0);
diff --git a/include/flexflow/ops/aggregate_spec.h b/include/flexflow/ops/aggregate_spec.h
index 8c1966e72a..7cd0ee49c0 100644
--- a/include/flexflow/ops/aggregate_spec.h
+++ b/include/flexflow/ops/aggregate_spec.h
@@ -28,6 +28,9 @@ class AggregateSpec : public Op {
                 char const *name);
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
+  void inference(FFModel const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &) override;
   void backward(FFModel const &) override;
   void print_layer(FFModel const &model) override {
     assert(0);
diff --git a/src/ops/aggregate.cc b/src/ops/aggregate.cc
index 0ad9d91d62..ce8894599f 100644
--- a/src/ops/aggregate.cc
+++ b/src/ops/aggregate.cc
@@ -243,6 +243,56 @@ void Aggregate::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
+void Aggregate::inference(FFModel const &ff
+                          std::vector<ParallelTensor> const &batch_inputs,
+                          std::vector<ParallelTensor> const &batch_outputs) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  parallel_is = outputs[0]->parallel_is;
+  IndexLauncher launcher(AGGREGATE_FWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(Aggregate)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  // gate_preds
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  // gate_assign
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[1]->region));
+  launcher.add_field(1, FID_DATA);
+  // exp_preds
+  for (int i = 0; i < n; i++) {
+    launcher.add_region_requirement(RegionRequirement(batch_inputs[i + 4]->part,
+                                                      0 /*projection id*/,
+                                                      READ_WRITE,
+                                                      EXCLUSIVE,
+                                                      batch_inputs[i + 4]->region));
+    launcher.add_field(i + 2, FID_DATA);
+  }
+  // output
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(n + 2, FID_DATA);
+  runtime->execute_index_space(ctx, launcher);
+}
+
+
 void Aggregate::forward_task(Task const *task,
                              std::vector<PhysicalRegion> const &regions,
                              Context ctx,
diff --git a/src/ops/aggregate_spec.cc b/src/ops/aggregate_spec.cc
index 749d071310..b0870684ec 100644
--- a/src/ops/aggregate_spec.cc
+++ b/src/ops/aggregate_spec.cc
@@ -232,6 +232,55 @@ void AggregateSpec::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
+void AggregateSpec::inference(FFModel const &ff
+                          std::vector<ParallelTensor> const &batch_inputs,
+                          std::vector<ParallelTensor> const &batch_outputs) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  parallel_is = outputs[0]->parallel_is;
+  IndexLauncher launcher(AGG_SPEC_FWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(AggregateSpec)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  // gate_preds
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  // gate_assign
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[1]->region));
+  launcher.add_field(1, FID_DATA);
+  // exp_preds
+  for (int i = 0; i < n; i++) {
+    launcher.add_region_requirement(RegionRequirement(batch_inputs[i + 4]->part,
+                                                      0 /*projection id*/,
+                                                      READ_WRITE,
+                                                      EXCLUSIVE,
+                                                      batch_inputs[i + 4]->region));
+    launcher.add_field(i + 2, FID_DATA);
+  }
+  // output
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(n + 2, FID_DATA);
+  runtime->execute_index_space(ctx, launcher);
+}
+
 void AggregateSpec::forward_task(Task const *task,
                                  std::vector<PhysicalRegion> const &regions,
                                  Context ctx,

From 5cce0671036d80a4fcae69538101eba5c47e7219 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 14 Dec 2022 02:53:03 +0000
Subject: [PATCH 030/344] fix

---
 src/ops/aggregate.cc      | 14 +++++++-------
 src/ops/aggregate_spec.cc | 18 ++++++++++--------
 src/ops/group_by.cc       | 15 ++++++++-------
 3 files changed, 25 insertions(+), 22 deletions(-)

diff --git a/src/ops/aggregate.cc b/src/ops/aggregate.cc
index ce8894599f..16f8d492f9 100644
--- a/src/ops/aggregate.cc
+++ b/src/ops/aggregate.cc
@@ -243,7 +243,7 @@ void Aggregate::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-void Aggregate::inference(FFModel const &ff
+void Aggregate::inference(FFModel const &ff,
                           std::vector<ParallelTensor> const &batch_inputs,
                           std::vector<ParallelTensor> const &batch_outputs) {
   ArgumentMap argmap;
@@ -275,11 +275,12 @@ void Aggregate::inference(FFModel const &ff
   launcher.add_field(1, FID_DATA);
   // exp_preds
   for (int i = 0; i < n; i++) {
-    launcher.add_region_requirement(RegionRequirement(batch_inputs[i + 4]->part,
-                                                      0 /*projection id*/,
-                                                      READ_WRITE,
-                                                      EXCLUSIVE,
-                                                      batch_inputs[i + 4]->region));
+    launcher.add_region_requirement(
+        RegionRequirement(batch_inputs[i + 4]->part,
+                          0 /*projection id*/,
+                          READ_WRITE,
+                          EXCLUSIVE,
+                          batch_inputs[i + 4]->region));
     launcher.add_field(i + 2, FID_DATA);
   }
   // output
@@ -292,7 +293,6 @@ void Aggregate::inference(FFModel const &ff
   runtime->execute_index_space(ctx, launcher);
 }
 
-
 void Aggregate::forward_task(Task const *task,
                              std::vector<PhysicalRegion> const &regions,
                              Context ctx,
diff --git a/src/ops/aggregate_spec.cc b/src/ops/aggregate_spec.cc
index b0870684ec..8a26b53906 100644
--- a/src/ops/aggregate_spec.cc
+++ b/src/ops/aggregate_spec.cc
@@ -232,9 +232,10 @@ void AggregateSpec::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-void AggregateSpec::inference(FFModel const &ff
-                          std::vector<ParallelTensor> const &batch_inputs,
-                          std::vector<ParallelTensor> const &batch_outputs) {
+void AggregateSpec::inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
@@ -264,11 +265,12 @@ void AggregateSpec::inference(FFModel const &ff
   launcher.add_field(1, FID_DATA);
   // exp_preds
   for (int i = 0; i < n; i++) {
-    launcher.add_region_requirement(RegionRequirement(batch_inputs[i + 4]->part,
-                                                      0 /*projection id*/,
-                                                      READ_WRITE,
-                                                      EXCLUSIVE,
-                                                      batch_inputs[i + 4]->region));
+    launcher.add_region_requirement(
+        RegionRequirement(batch_inputs[i + 4]->part,
+                          0 /*projection id*/,
+                          READ_WRITE,
+                          EXCLUSIVE,
+                          batch_inputs[i + 4]->region));
     launcher.add_field(i + 2, FID_DATA);
   }
   // output
diff --git a/src/ops/group_by.cc b/src/ops/group_by.cc
index 6ea01c83a8..79201dc626 100644
--- a/src/ops/group_by.cc
+++ b/src/ops/group_by.cc
@@ -262,8 +262,8 @@ void Group_by::forward(FFModel const &ff) {
 }
 
 void Group_by::inference(FFModel const &ff,
-                    std::vector<ParallelTensor> const &batch_inputs,
-                    std::vector<ParallelTensor> const &batch_outputs) {
+                         std::vector<ParallelTensor> const &batch_inputs,
+                         std::vector<ParallelTensor> const &batch_outputs) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
@@ -293,11 +293,12 @@ void Group_by::inference(FFModel const &ff,
 
   // output
   for (int i = 0; i < n; i++) {
-    launcher.add_region_requirement(RegionRequirement(batch_outputs[i]->part,
-                                                      0 /*projection id*/,
-                                                      WRITE_ONLY,
-                                                      EXCLUSIVE,
-                                                      batch_outputs[i]->region));
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[i]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[i]->region));
     launcher.add_field(i + 2, FID_DATA);
   }
 

From 74ccfaaa5228f29a614eeb434d51c48697a51bfd Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 14 Dec 2022 08:06:39 +0000
Subject: [PATCH 031/344] finished debugging moe/mlp

---
 examples/cpp/inference/MLP_Unify/mlp.cc          | 2 +-
 examples/cpp/inference/mixture_of_experts/moe.cc | 6 +++---
 2 files changed, 4 insertions(+), 4 deletions(-)

diff --git a/examples/cpp/inference/MLP_Unify/mlp.cc b/examples/cpp/inference/MLP_Unify/mlp.cc
index b96cb9b22c..9da8214c00 100644
--- a/examples/cpp/inference/MLP_Unify/mlp.cc
+++ b/examples/cpp/inference/MLP_Unify/mlp.cc
@@ -207,7 +207,7 @@ void FlexFlow::top_level_task(Task const *task,
   Tensor t = create_mlp(&ff, &mlpConfig, input1, input2);
   
   InferenceManager im(&ff, num_requests_per_batch, num_inflight_batches);
-  im.compile_model_and_allocate_buffer();
+  // im.compile_model_and_allocate_buffer();
   ff.init_operators();
   
   // Start timer
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index c1c1958e91..fe18e705bd 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -127,11 +127,11 @@ void FlexFlow::top_level_task(Task const *task,
 
   Tensor t = create_moe(&ff, &moeConfig, input);
   InferenceManager im(&ff, num_requests_per_batch, num_inflight_batches);
-  im.compile_model_and_allocate_buffer();
+  // im.compile_model_and_allocate_buffer();
   ff.init_operators();
 
   // Data Loader
-  DataLoader data_loader(ff, moeConfig, input, ff.label_tensor);
+  // DataLoader data_loader(ff, moeConfig, input, ff.label_tensor);
 
   //-----------------------------------------------------------------
 
@@ -154,7 +154,7 @@ void FlexFlow::top_level_task(Task const *task,
     vector<vector<double>> req = data_generator.get_requests();
     int iterations = req.size();
     for (int iter = 0; iter < iterations; iter++) {
-      data_loader.next_batch(ff);
+      // data_loader.next_batch(ff);
       runtime->begin_trace(ctx, 111 /*trace_id*/);
       im.inference((index++) % num_inflight_batches);
       runtime->end_trace(ctx, 111 /*trace_id*/);

From ea29f51b52861c61df9d9e65155970c69d1a4d42 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 14 Dec 2022 17:09:52 +0000
Subject: [PATCH 032/344] [MoE] - Added implementation of encoder

---
 examples/cpp/inference/mixture_of_experts/moe.cc | 16 ++++++++++++++++
 examples/cpp/inference/mixture_of_experts/moe.h  |  7 +++++++
 2 files changed, 23 insertions(+)

diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index fe18e705bd..ef0bf0b207 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -88,6 +88,22 @@ Tensor create_moe(FFModel *model,
   return coop_output;
 }
 
+Tensor create_moe_encoder(FFModel *model,
+                          MoeConfig const *moeConfig,
+                          Tensor const &input,
+                          int num_heads,
+                          int kdim,
+                          int vdim) {
+  Tensor t = model->multihead_attention(input,
+                                        input,
+                                        input,
+                                        moeConfig->hidden_size,
+                                        moeConfig->num_attention_heads,
+                                        moeConfig->attention_kdim,
+                                        moeConfig->attention_vdim);
+  return create_moe(model, moeConfig, t);
+}
+
 void FlexFlow::top_level_task(Task const *task,
                               std::vector<PhysicalRegion> const &regions,
                               Context ctx,
diff --git a/examples/cpp/inference/mixture_of_experts/moe.h b/examples/cpp/inference/mixture_of_experts/moe.h
index 5610de4ab7..d782132bbd 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.h
+++ b/examples/cpp/inference/mixture_of_experts/moe.h
@@ -23,8 +23,15 @@ using namespace FlexFlow;
 struct MoeConfig {
   MoeConfig(void) {
     // Set default configurations here
+    hidden_size = 64;
+    num_attention_heads = 16;
+    attention_kdim = attention_vdim = hidden_size / num_attention_heads;
   }
   std::string dataset_path;
+  int hidden_size;
+  int num_attention_heads;
+  int attention_kdim;
+  int attention_vdim;
 };
 
 class DataLoader {

From 1cd1fa35d8199efbd501c3b6d0a455d17d8cf0e9 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 14 Dec 2022 17:28:14 +0000
Subject: [PATCH 033/344] [MoE][Inference] - Added LayerNorm and residual
 connection to encoder

---
 .../cpp/inference/mixture_of_experts/moe.cc   | 23 +++---
 include/flexflow/ops/element_binary.h         |  3 +
 include/flexflow/ops/layer_norm.h             |  3 +
 src/ops/element_binary.cc                     | 71 +++++++++++++++++++
 src/ops/layer_norm.cc                         | 44 ++++++++++++
 5 files changed, 136 insertions(+), 8 deletions(-)

diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index ef0bf0b207..e2e93e0a22 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -94,14 +94,21 @@ Tensor create_moe_encoder(FFModel *model,
                           int num_heads,
                           int kdim,
                           int vdim) {
-  Tensor t = model->multihead_attention(input,
-                                        input,
-                                        input,
-                                        moeConfig->hidden_size,
-                                        moeConfig->num_attention_heads,
-                                        moeConfig->attention_kdim,
-                                        moeConfig->attention_vdim);
-  return create_moe(model, moeConfig, t);
+  std::vector<int> axes = {moeConfig->hidden_size};
+  Tensor t = model->layer_norm(
+      model->add(model->multihead_attention(input,
+                                            input,
+                                            input,
+                                            moeConfig->hidden_size,
+                                            moeConfig->num_attention_heads,
+                                            moeConfig->attention_kdim,
+                                            moeConfig->attention_vdim),
+                 input),
+      axes,
+      true,
+      1e-05);
+  return model->layer_norm(
+      model->add(create_moe(model, moeConfig, t), t), axes, true, 1e-05);
 }
 
 void FlexFlow::top_level_task(Task const *task,
diff --git a/include/flexflow/ops/element_binary.h b/include/flexflow/ops/element_binary.h
index cfacec50f7..b64539e53c 100644
--- a/include/flexflow/ops/element_binary.h
+++ b/include/flexflow/ops/element_binary.h
@@ -27,6 +27,9 @@ class ElementBinary : public Op {
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
+  void inference(FFModel const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
diff --git a/include/flexflow/ops/layer_norm.h b/include/flexflow/ops/layer_norm.h
index 8273b9ab52..9ab88c1202 100644
--- a/include/flexflow/ops/layer_norm.h
+++ b/include/flexflow/ops/layer_norm.h
@@ -26,6 +26,9 @@ class LayerNorm : public Op {
   void init(FFModel const &);
   void forward(FFModel const &);
   void backward(FFModel const &);
+  void inference(FFModel const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &) override;
   void print_layer(FFModel const &model) {
     assert(0);
   }
diff --git a/src/ops/element_binary.cc b/src/ops/element_binary.cc
index 56d132b32c..e41426d039 100644
--- a/src/ops/element_binary.cc
+++ b/src/ops/element_binary.cc
@@ -424,6 +424,77 @@ void ElementBinary::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
+void ElementBinary::inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_forward(ff, argmap);
+  IndexLauncher launcher(ELEMENTBINARY_FWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  if (inplace_a) {
+    assert(batch_outputs[0]->part == batch_inputs[0]->part);
+    assert(batch_outputs[0]->region == batch_inputs[0]->region);
+    launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                      0 /*projection id*/,
+                                                      READ_WRITE,
+                                                      EXCLUSIVE,
+                                                      batch_inputs[0]->region));
+    launcher.add_field(0, FID_DATA);
+    if (has_same_operands) {
+      // do nothing else
+    } else {
+      launcher.add_region_requirement(
+          RegionRequirement(batch_inputs[1]->part,
+                            0 /*projection id*/,
+                            READ_ONLY,
+                            EXCLUSIVE,
+                            batch_inputs[1]->region));
+      launcher.add_field(1, FID_DATA);
+    }
+  } else {
+    launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      batch_inputs[0]->region));
+    launcher.add_field(0, FID_DATA);
+    if (has_same_operands) {
+      launcher.add_region_requirement(
+          RegionRequirement(batch_outputs[0]->part,
+                            0 /*projection id*/,
+                            WRITE_ONLY,
+                            EXCLUSIVE,
+                            batch_outputs[0]->region));
+      launcher.add_field(1, FID_DATA);
+    } else {
+      launcher.add_region_requirement(
+          RegionRequirement(batch_inputs[1]->part,
+                            0 /*projection id*/,
+                            READ_ONLY,
+                            EXCLUSIVE,
+                            batch_inputs[1]->region));
+      launcher.add_field(1, FID_DATA);
+      launcher.add_region_requirement(
+          RegionRequirement(batch_outputs[0]->part,
+                            0 /*projection id*/,
+                            WRITE_ONLY,
+                            EXCLUSIVE,
+                            batch_outputs[0]->region));
+      launcher.add_field(2, FID_DATA);
+    }
+  }
+  runtime->execute_index_space(ctx, launcher);
+}
+
 /*
   regions[0](I): in1
   regions[1](I): in2
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index 5d7fff3410..76d5352944 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -278,6 +278,50 @@ void LayerNorm::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
+void LayerNorm::inference(FFModel const &ff,
+                          std::vector<ParallelTensor> const &batch_inputs,
+                          std::vector<ParallelTensor> const &batch_outputs) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_forward(ff, argmap);
+  IndexLauncher launcher(LAYERNORM_FWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  if (elementwise_affine) {
+    launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                      0 /*projection id*/,
+                                                      READ_WRITE,
+                                                      EXCLUSIVE,
+                                                      weights[0]->region));
+    launcher.add_field(2, FID_DATA);
+    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                      0 /*projection id*/,
+                                                      READ_WRITE,
+                                                      EXCLUSIVE,
+                                                      weights[1]->region));
+    launcher.add_field(3, FID_DATA);
+  }
+  runtime->execute_index_space(ctx, launcher);
+}
+
 /*
   regions[0](I): input
   regions[1](O): output

From c89e3e5880f104d7fb5af60e49baa5cef0b460c9 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 15 Dec 2022 14:45:19 -0500
Subject: [PATCH 034/344] [MOE] - Add support for multi-layer encoder

---
 .../cpp/inference/mixture_of_experts/moe.cc   | 55 ++++++++-----------
 .../cpp/inference/mixture_of_experts/moe.h    | 11 +++-
 2 files changed, 34 insertions(+), 32 deletions(-)

diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index e2e93e0a22..23dd88506e 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -51,20 +51,10 @@ Tensor create_moe(FFModel *model,
 
   // MoE model
   Tensor gate_preds = model->dense(input, 64, AC_MODE_RELU);
-  // gate_preds->print("gate_preds");
   gate_preds = model->dense(gate_preds, num_exp, AC_MODE_RELU);
-  // gate_preds->print("gate_preds2");
   Tensor topK_output[2];
   model->top_k(gate_preds, topK_output, num_select, false);
-  // topK_output[0]->print("topK_output[0]");
-  // topK_output[1]->print("topK_output[1]");
   Tensor exp_tensors[num_exp];
-  // printf("num_exp: %i, alpha: %f\n", num_exp);
-  // input->print("input_tensor");
-
-  // return topK_output[0];
-  // exp_tensors[0]->print("exp_tensors[0]");
-  // exp_tensors[num_exp-1]->print("exp_tensors[num_exp-1]");
   model->group_by(input, topK_output[1], exp_tensors, num_exp, alpha);
   for (int i=0; i<num_exp; i++) {
     exp_tensors[i]->dims[2] = 1; // temporary fix to replica dimension being undefined
@@ -76,7 +66,8 @@ Tensor create_moe(FFModel *model,
   agg_inputs[2] = topK_output[1]; // gate assign TopK (for cache)
   agg_inputs[3] = gate_preds;     // full gate preds
   for (int i = 0; i < num_exp; i++) {
-    Tensor exp_pred = model->dense(exp_tensors[i], OUT_DIM, AC_MODE_RELU);
+    Tensor exp_pred =
+        model->dense(exp_tensors[i], moeConfig->hidden_size, AC_MODE_RELU);
     exp_pred->print("exp_pred");
     agg_inputs[i + 4] = model->softmax(exp_pred);
   }
@@ -90,25 +81,26 @@ Tensor create_moe(FFModel *model,
 
 Tensor create_moe_encoder(FFModel *model,
                           MoeConfig const *moeConfig,
-                          Tensor const &input,
-                          int num_heads,
-                          int kdim,
-                          int vdim) {
-  std::vector<int> axes = {moeConfig->hidden_size};
-  Tensor t = model->layer_norm(
-      model->add(model->multihead_attention(input,
-                                            input,
-                                            input,
-                                            moeConfig->hidden_size,
-                                            moeConfig->num_attention_heads,
-                                            moeConfig->attention_kdim,
-                                            moeConfig->attention_vdim),
-                 input),
-      axes,
-      true,
-      1e-05);
-  return model->layer_norm(
-      model->add(create_moe(model, moeConfig, t), t), axes, true, 1e-05);
+                          Tensor const &input) {
+  std::vector<int> axes = {0, 1};
+  Tensor x = input;
+  for (int i = 0; i < moeConfig->num_encoder_layers; i++) {
+    x = model->layer_norm(
+        model->add(model->multihead_attention(x,
+                                              x,
+                                              x,
+                                              moeConfig->hidden_size,
+                                              moeConfig->num_attention_heads,
+                                              moeConfig->attention_kdim,
+                                              moeConfig->attention_vdim),
+                   x),
+        axes,
+        true,
+        1e-05);
+    x = model->layer_norm(
+        model->add(create_moe(model, moeConfig, x), x), axes, true, 1e-05);
+  }
+  return x;
 }
 
 void FlexFlow::top_level_task(Task const *task,
@@ -148,7 +140,8 @@ void FlexFlow::top_level_task(Task const *task,
 
   //-----------------------------------------------------------------
 
-  Tensor t = create_moe(&ff, &moeConfig, input);
+  Tensor t = create_moe_encoder(&ff, &moeConfig, input);
+  t = ff.dense(t, OUT_DIM, AC_MODE_RELU);
   InferenceManager im(&ff, num_requests_per_batch, num_inflight_batches);
   // im.compile_model_and_allocate_buffer();
   ff.init_operators();
diff --git a/examples/cpp/inference/mixture_of_experts/moe.h b/examples/cpp/inference/mixture_of_experts/moe.h
index d782132bbd..d447c9fd63 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.h
+++ b/examples/cpp/inference/mixture_of_experts/moe.h
@@ -15,6 +15,13 @@
 
 #include "flexflow/model.h"
 #define MAX_NUM_SAMPLES 60000
+#define NUM_SAMPLES 60000
+#define TRAIN_SAMPLES 60000
+#define TEST_SAMPLES 00000
+#define MNIST_DIMS 28 * 28
+#define CIFAR_DIMS 3 * 32 * 32
+#define DATA_DIMS MNIST_DIMS
+#define OUT_DIM 10
 
 using namespace Legion;
 using namespace std;
@@ -23,15 +30,17 @@ using namespace FlexFlow;
 struct MoeConfig {
   MoeConfig(void) {
     // Set default configurations here
-    hidden_size = 64;
+    hidden_size = DATA_DIMS;
     num_attention_heads = 16;
     attention_kdim = attention_vdim = hidden_size / num_attention_heads;
+    num_encoder_layers = 6;
   }
   std::string dataset_path;
   int hidden_size;
   int num_attention_heads;
   int attention_kdim;
   int attention_vdim;
+  int num_encoder_layers;
 };
 
 class DataLoader {

From b73a8c7e3378eabecce638373dad10e814822382 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 16 Dec 2022 13:06:00 -0500
Subject: [PATCH 035/344] added machine view parameter to inference

---
 include/flexflow/operator.h           |  3 ++-
 include/flexflow/ops/aggregate.h      |  3 ++-
 include/flexflow/ops/aggregate_spec.h |  3 ++-
 include/flexflow/ops/attention.h      |  3 ++-
 include/flexflow/ops/element_binary.h |  3 ++-
 include/flexflow/ops/groupby.h        |  3 ++-
 include/flexflow/ops/layer_norm.h     |  3 ++-
 include/flexflow/ops/linear.h         |  3 ++-
 include/flexflow/ops/topk.h           |  3 ++-
 src/ops/aggregate.cc                  |  6 ++++--
 src/ops/aggregate_spec.cc             | 11 ++++++-----
 src/ops/attention.cc                  |  6 ++++--
 src/ops/element_binary.cc             | 11 ++++++-----
 src/ops/group_by.cc                   |  6 ++++--
 src/ops/layer_norm.cc                 |  6 ++++--
 src/ops/linear.cc                     |  6 ++++--
 src/ops/topk.cc                       |  6 ++++--
 17 files changed, 54 insertions(+), 31 deletions(-)

diff --git a/include/flexflow/operator.h b/include/flexflow/operator.h
index 2fe689c284..a276f0fd74 100644
--- a/include/flexflow/operator.h
+++ b/include/flexflow/operator.h
@@ -190,7 +190,8 @@ class Op {
   // Pure virtual functions for inference
   virtual void inference(FFModel const &,
                          std::vector<ParallelTensor> const &,
-                         std::vector<ParallelTensor> const &) {
+                         std::vector<ParallelTensor> const &,
+                         MachineView const *mv = nullptr) {
     assert(false);
   };
   virtual void print_layer(FFModel const &model) = 0;
diff --git a/include/flexflow/ops/aggregate.h b/include/flexflow/ops/aggregate.h
index f93e26057d..6e4dd0b4ac 100644
--- a/include/flexflow/ops/aggregate.h
+++ b/include/flexflow/ops/aggregate.h
@@ -38,7 +38,8 @@ class Aggregate : public Op {
   void forward(FFModel const &) override;
   void inference(FFModel const &,
                  std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &) override;
+                 std::vector<ParallelTensor> const &,
+                 MachineView const *mv = nullptr) override;
   void backward(FFModel const &) override;
   void print_layer(FFModel const &model) override {
     assert(0);
diff --git a/include/flexflow/ops/aggregate_spec.h b/include/flexflow/ops/aggregate_spec.h
index 7cd0ee49c0..816574ced0 100644
--- a/include/flexflow/ops/aggregate_spec.h
+++ b/include/flexflow/ops/aggregate_spec.h
@@ -30,7 +30,8 @@ class AggregateSpec : public Op {
   void forward(FFModel const &) override;
   void inference(FFModel const &,
                  std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &) override;
+                 std::vector<ParallelTensor> const &,
+                 MachineView const *mv = nullptr) override;
   void backward(FFModel const &) override;
   void print_layer(FFModel const &model) override {
     assert(0);
diff --git a/include/flexflow/ops/attention.h b/include/flexflow/ops/attention.h
index be54ef21a1..1531708bb7 100644
--- a/include/flexflow/ops/attention.h
+++ b/include/flexflow/ops/attention.h
@@ -68,7 +68,8 @@ class MultiHeadAttention : public Op {
   void backward(FFModel const &) override;
   void inference(FFModel const &,
                  std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &) override;
+                 std::vector<ParallelTensor> const &,
+                 MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
diff --git a/include/flexflow/ops/element_binary.h b/include/flexflow/ops/element_binary.h
index b64539e53c..2f081f1b7e 100644
--- a/include/flexflow/ops/element_binary.h
+++ b/include/flexflow/ops/element_binary.h
@@ -29,7 +29,8 @@ class ElementBinary : public Op {
   void backward(FFModel const &) override;
   void inference(FFModel const &,
                  std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &) override;
+                 std::vector<ParallelTensor> const &,
+                 MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
diff --git a/include/flexflow/ops/groupby.h b/include/flexflow/ops/groupby.h
index f118af0a38..44e03ec6e3 100644
--- a/include/flexflow/ops/groupby.h
+++ b/include/flexflow/ops/groupby.h
@@ -37,7 +37,8 @@ class Group_by : public Op {
   void backward(FFModel const &) override;
   void inference(FFModel const &,
                  std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &) override;
+                 std::vector<ParallelTensor> const &,
+                 MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
diff --git a/include/flexflow/ops/layer_norm.h b/include/flexflow/ops/layer_norm.h
index 9ab88c1202..c05461acdf 100644
--- a/include/flexflow/ops/layer_norm.h
+++ b/include/flexflow/ops/layer_norm.h
@@ -28,7 +28,8 @@ class LayerNorm : public Op {
   void backward(FFModel const &);
   void inference(FFModel const &,
                  std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &) override;
+                 std::vector<ParallelTensor> const &,
+                 MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) {
     assert(0);
   }
diff --git a/include/flexflow/ops/linear.h b/include/flexflow/ops/linear.h
index 510799c43a..ab1c1febc5 100644
--- a/include/flexflow/ops/linear.h
+++ b/include/flexflow/ops/linear.h
@@ -39,7 +39,8 @@ class Linear : public Op {
   void backward(FFModel const &) override;
   void inference(FFModel const &,
                  std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &) override;
+                 std::vector<ParallelTensor> const &,
+                 MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override;
   bool get_int_parameter(PMParameter, int *) const override;
   static Op *
diff --git a/include/flexflow/ops/topk.h b/include/flexflow/ops/topk.h
index 1b31df998d..af62f51c93 100644
--- a/include/flexflow/ops/topk.h
+++ b/include/flexflow/ops/topk.h
@@ -32,7 +32,8 @@ class TopK : public Op {
   void backward(FFModel const &) override;
   void inference(FFModel const &,
                  std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &) override;
+                 std::vector<ParallelTensor> const &,
+                 MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
diff --git a/src/ops/aggregate.cc b/src/ops/aggregate.cc
index 16f8d492f9..8c36edf1bc 100644
--- a/src/ops/aggregate.cc
+++ b/src/ops/aggregate.cc
@@ -245,12 +245,14 @@ void Aggregate::forward(FFModel const &ff) {
 
 void Aggregate::inference(FFModel const &ff,
                           std::vector<ParallelTensor> const &batch_inputs,
-                          std::vector<ParallelTensor> const &batch_outputs) {
+                          std::vector<ParallelTensor> const &batch_outputs,
+                          MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
   set_argumentmap_for_init(ff, argmap);
   parallel_is = outputs[0]->parallel_is;
+  size_t machine_view_hash = mv ? mv->hash() : outputs[0]->machine_view.hash();
   IndexLauncher launcher(AGGREGATE_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(Aggregate)),
@@ -258,7 +260,7 @@ void Aggregate::inference(FFModel const &ff,
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
-                         outputs[0]->machine_view.hash());
+                         machine_view_hash);
   // gate_preds
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
diff --git a/src/ops/aggregate_spec.cc b/src/ops/aggregate_spec.cc
index 8a26b53906..1e3d66fdee 100644
--- a/src/ops/aggregate_spec.cc
+++ b/src/ops/aggregate_spec.cc
@@ -232,15 +232,16 @@ void AggregateSpec::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-void AggregateSpec::inference(
-    FFModel const &ff,
-    std::vector<ParallelTensor> const &batch_inputs,
-    std::vector<ParallelTensor> const &batch_outputs) {
+void AggregateSpec::inference(FFModel const &ff,
+                              std::vector<ParallelTensor> const &batch_inputs,
+                              std::vector<ParallelTensor> const &batch_outputs,
+                              MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
   set_argumentmap_for_init(ff, argmap);
   parallel_is = outputs[0]->parallel_is;
+  size_t machine_view_hash = mv ? mv->hash() : outputs[0]->machine_view.hash();
   IndexLauncher launcher(AGG_SPEC_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(AggregateSpec)),
@@ -248,7 +249,7 @@ void AggregateSpec::inference(
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
-                         outputs[0]->machine_view.hash());
+                         machine_view_hash);
   // gate_preds
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
diff --git a/src/ops/attention.cc b/src/ops/attention.cc
index 7b9e711b0c..d9ee14ecb6 100644
--- a/src/ops/attention.cc
+++ b/src/ops/attention.cc
@@ -526,12 +526,14 @@ void MultiHeadAttention::forward(FFModel const &ff) {
 void MultiHeadAttention::inference(
     FFModel const &ff,
     std::vector<ParallelTensor> const &batch_inputs,
-    std::vector<ParallelTensor> const &batch_outputs) {
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
   set_argumentmap_for_forward(ff, argmap);
   int idx = 0;
+  size_t machine_view_hash = mv ? mv->hash() : outputs[0]->machine_view.hash();
   IndexLauncher launcher(ATTENTION_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
@@ -539,7 +541,7 @@ void MultiHeadAttention::inference(
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
-                         outputs[0]->machine_view.hash());
+                         machine_view_hash);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
diff --git a/src/ops/element_binary.cc b/src/ops/element_binary.cc
index e41426d039..feb1862b04 100644
--- a/src/ops/element_binary.cc
+++ b/src/ops/element_binary.cc
@@ -424,14 +424,15 @@ void ElementBinary::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-void ElementBinary::inference(
-    FFModel const &ff,
-    std::vector<ParallelTensor> const &batch_inputs,
-    std::vector<ParallelTensor> const &batch_outputs) {
+void ElementBinary::inference(FFModel const &ff,
+                              std::vector<ParallelTensor> const &batch_inputs,
+                              std::vector<ParallelTensor> const &batch_outputs,
+                              MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
   set_argumentmap_for_forward(ff, argmap);
+  size_t machine_view_hash = mv ? mv->hash() : outputs[0]->machine_view.hash();
   IndexLauncher launcher(ELEMENTBINARY_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
@@ -439,7 +440,7 @@ void ElementBinary::inference(
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
-                         outputs[0]->machine_view.hash());
+                         machine_view_hash);
   if (inplace_a) {
     assert(batch_outputs[0]->part == batch_inputs[0]->part);
     assert(batch_outputs[0]->region == batch_inputs[0]->region);
diff --git a/src/ops/group_by.cc b/src/ops/group_by.cc
index 79201dc626..b341f004ac 100644
--- a/src/ops/group_by.cc
+++ b/src/ops/group_by.cc
@@ -263,10 +263,12 @@ void Group_by::forward(FFModel const &ff) {
 
 void Group_by::inference(FFModel const &ff,
                          std::vector<ParallelTensor> const &batch_inputs,
-                         std::vector<ParallelTensor> const &batch_outputs) {
+                         std::vector<ParallelTensor> const &batch_outputs,
+                         MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
+  size_t machine_view_hash = mv ? mv->hash() : outputs[0]->machine_view.hash();
   IndexLauncher launcher(GROUP_BY_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(Group_by)),
@@ -274,7 +276,7 @@ void Group_by::inference(FFModel const &ff,
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
-                         outputs[0]->machine_view.hash());
+                         machine_view_hash);
   // data
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index 76d5352944..bec6f7d651 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -280,11 +280,13 @@ void LayerNorm::forward(FFModel const &ff) {
 
 void LayerNorm::inference(FFModel const &ff,
                           std::vector<ParallelTensor> const &batch_inputs,
-                          std::vector<ParallelTensor> const &batch_outputs) {
+                          std::vector<ParallelTensor> const &batch_outputs,
+                          MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
   set_argumentmap_for_forward(ff, argmap);
+  size_t machine_view_hash = mv ? mv->hash() : outputs[0]->machine_view.hash();
   IndexLauncher launcher(LAYERNORM_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
@@ -292,7 +294,7 @@ void LayerNorm::inference(FFModel const &ff,
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
-                         outputs[0]->machine_view.hash());
+                         machine_view_hash);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index 9413f5f726..435080dbe1 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -369,11 +369,13 @@ void Linear::forward(FFModel const &ff) {
 
 void Linear::inference(FFModel const &ff,
                        std::vector<ParallelTensor> const &batch_inputs,
-                       std::vector<ParallelTensor> const &batch_outputs) {
+                       std::vector<ParallelTensor> const &batch_outputs,
+                       MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
   set_argumentmap_for_forward(ff, argmap);
+  size_t machine_view_hash = mv ? mv->hash() : outputs[0]->machine_view.hash();
   IndexLauncher launcher(LINEAR_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(nullptr, 0),
@@ -381,7 +383,7 @@ void Linear::inference(FFModel const &ff,
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
-                         outputs[0]->machine_view.hash());
+                         machine_view_hash);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
diff --git a/src/ops/topk.cc b/src/ops/topk.cc
index ae43038416..ec6da77a31 100644
--- a/src/ops/topk.cc
+++ b/src/ops/topk.cc
@@ -222,11 +222,13 @@ void TopK::forward(FFModel const &ff) {
 
 void TopK::inference(FFModel const &ff,
                      std::vector<ParallelTensor> const &batch_inputs,
-                     std::vector<ParallelTensor> const &batch_outputs) {
+                     std::vector<ParallelTensor> const &batch_outputs,
+                     MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
   set_argumentmap_for_forward(ff, argmap);
+  size_t machine_view_hash = mv ? mv->hash() : outputs[0]->machine_view.hash();
   IndexLauncher launcher(TOPK_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
@@ -234,7 +236,7 @@ void TopK::inference(FFModel const &ff,
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
-                         outputs[0]->machine_view.hash());
+                         machine_view_hash);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,

From 7b1e1624a527717ea27cdb0dadb0a829ff01a95f Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 16 Dec 2022 13:13:31 -0500
Subject: [PATCH 036/344] make inference functions return futuremaps

---
 include/flexflow/operator.h           | 10 +++++-----
 include/flexflow/ops/aggregate.h      |  9 +++++----
 include/flexflow/ops/aggregate_spec.h | 10 +++++-----
 include/flexflow/ops/attention.h      |  9 +++++----
 include/flexflow/ops/element_binary.h |  9 +++++----
 include/flexflow/ops/groupby.h        |  9 +++++----
 include/flexflow/ops/layer_norm.h     | 10 +++++-----
 include/flexflow/ops/linear.h         | 10 +++++-----
 include/flexflow/ops/topk.h           |  9 +++++----
 src/ops/aggregate.cc                  | 10 +++++-----
 src/ops/aggregate_spec.cc             | 11 ++++++-----
 src/ops/attention.cc                  |  4 ++--
 src/ops/element_binary.cc             | 11 ++++++-----
 src/ops/group_by.cc                   | 10 +++++-----
 src/ops/layer_norm.cc                 | 10 +++++-----
 src/ops/linear.cc                     | 10 +++++-----
 src/ops/topk.cc                       | 10 +++++-----
 17 files changed, 84 insertions(+), 77 deletions(-)

diff --git a/include/flexflow/operator.h b/include/flexflow/operator.h
index a276f0fd74..94304784c9 100644
--- a/include/flexflow/operator.h
+++ b/include/flexflow/operator.h
@@ -8,7 +8,7 @@
 #include <vector>
 
 namespace FlexFlow {
-
+using Legion::FutureMap;
 extern LegionRuntime::Logger::Category log_measure;
 
 class OpMeta;
@@ -188,10 +188,10 @@ class Op {
   virtual void forward(FFModel const &) = 0;
   virtual void backward(FFModel const &) = 0;
   // Pure virtual functions for inference
-  virtual void inference(FFModel const &,
-                         std::vector<ParallelTensor> const &,
-                         std::vector<ParallelTensor> const &,
-                         MachineView const *mv = nullptr) {
+  virtual FutureMap inference(FFModel const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) {
     assert(false);
   };
   virtual void print_layer(FFModel const &model) = 0;
diff --git a/include/flexflow/ops/aggregate.h b/include/flexflow/ops/aggregate.h
index 6e4dd0b4ac..5f73b8f7b3 100644
--- a/include/flexflow/ops/aggregate.h
+++ b/include/flexflow/ops/aggregate.h
@@ -5,6 +5,7 @@
 #include "flexflow/ops/aggregate_params.h"
 
 namespace FlexFlow {
+using Legion::FutureMap;
 
 #define AGGREGATE_MAX_K 4
 #define AGGREGATE_MAX_BATCH_SIZE 64
@@ -36,10 +37,10 @@ class Aggregate : public Op {
             char const *name = nullptr);
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
-  void inference(FFModel const &,
-                 std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &,
-                 MachineView const *mv = nullptr) override;
+  FutureMap inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void backward(FFModel const &) override;
   void print_layer(FFModel const &model) override {
     assert(0);
diff --git a/include/flexflow/ops/aggregate_spec.h b/include/flexflow/ops/aggregate_spec.h
index 816574ced0..21ade888a4 100644
--- a/include/flexflow/ops/aggregate_spec.h
+++ b/include/flexflow/ops/aggregate_spec.h
@@ -5,7 +5,7 @@
 #include "flexflow/ops/aggregate_spec_params.h"
 
 namespace FlexFlow {
-
+using Legion::FutureMap;
 #define AGGREGATE_SPEC_MAX_K 4
 #define AGGREGATE_SPEC_MAX_BATCH_SIZE 32
 #define AGGREGATE_SPEC_MAX_N 12
@@ -28,10 +28,10 @@ class AggregateSpec : public Op {
                 char const *name);
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
-  void inference(FFModel const &,
-                 std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &,
-                 MachineView const *mv = nullptr) override;
+  FutureMap inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void backward(FFModel const &) override;
   void print_layer(FFModel const &model) override {
     assert(0);
diff --git a/include/flexflow/ops/attention.h b/include/flexflow/ops/attention.h
index 1531708bb7..fe870579b3 100644
--- a/include/flexflow/ops/attention.h
+++ b/include/flexflow/ops/attention.h
@@ -10,6 +10,7 @@
 #include "flexflow/ops/attention_params.h"
 
 namespace FlexFlow {
+using Legion::FutureMap;
 
 class MultiHeadAttentionMeta;
 
@@ -66,10 +67,10 @@ class MultiHeadAttention : public Op {
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
-  void inference(FFModel const &,
-                 std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &,
-                 MachineView const *mv = nullptr) override;
+  FutureMap inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
diff --git a/include/flexflow/ops/element_binary.h b/include/flexflow/ops/element_binary.h
index 2f081f1b7e..593e229653 100644
--- a/include/flexflow/ops/element_binary.h
+++ b/include/flexflow/ops/element_binary.h
@@ -7,6 +7,7 @@
 #include "flexflow/ops/element_binary_params.h"
 
 namespace FlexFlow {
+using Legion::FutureMap;
 
 class ElementBinary : public Op {
 public:
@@ -27,10 +28,10 @@ class ElementBinary : public Op {
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
-  void inference(FFModel const &,
-                 std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &,
-                 MachineView const *mv = nullptr) override;
+  FutureMap inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
diff --git a/include/flexflow/ops/groupby.h b/include/flexflow/ops/groupby.h
index 44e03ec6e3..88e1df3ee9 100644
--- a/include/flexflow/ops/groupby.h
+++ b/include/flexflow/ops/groupby.h
@@ -6,6 +6,7 @@
 #include "flexflow/ops/groupby_params.h"
 
 namespace FlexFlow {
+using Legion::FutureMap;
 
 class GroupByMeta : public OpMeta {
 public:
@@ -35,10 +36,10 @@ class Group_by : public Op {
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
-  void inference(FFModel const &,
-                 std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &,
-                 MachineView const *mv = nullptr) override;
+  FutureMap inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
diff --git a/include/flexflow/ops/layer_norm.h b/include/flexflow/ops/layer_norm.h
index c05461acdf..9b43a40e3c 100644
--- a/include/flexflow/ops/layer_norm.h
+++ b/include/flexflow/ops/layer_norm.h
@@ -3,7 +3,7 @@
 #include "flexflow/model.h"
 
 namespace FlexFlow {
-
+using Legion::FutureMap;
 class LayerNormMeta;
 
 class LayerNorm : public Op {
@@ -26,10 +26,10 @@ class LayerNorm : public Op {
   void init(FFModel const &);
   void forward(FFModel const &);
   void backward(FFModel const &);
-  void inference(FFModel const &,
-                 std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &,
-                 MachineView const *mv = nullptr) override;
+  FutureMap inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) {
     assert(0);
   }
diff --git a/include/flexflow/ops/linear.h b/include/flexflow/ops/linear.h
index ab1c1febc5..6247dc7f76 100644
--- a/include/flexflow/ops/linear.h
+++ b/include/flexflow/ops/linear.h
@@ -6,7 +6,7 @@
 #include "flexflow/ops/linear_params.h"
 
 namespace FlexFlow {
-
+using Legion::FutureMap;
 class FFModel;
 class Layer;
 
@@ -37,10 +37,10 @@ class Linear : public Op {
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
-  void inference(FFModel const &,
-                 std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &,
-                 MachineView const *mv = nullptr) override;
+  FutureMap inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override;
   bool get_int_parameter(PMParameter, int *) const override;
   static Op *
diff --git a/include/flexflow/ops/topk.h b/include/flexflow/ops/topk.h
index af62f51c93..5c3f12d294 100644
--- a/include/flexflow/ops/topk.h
+++ b/include/flexflow/ops/topk.h
@@ -6,6 +6,7 @@
 #include "flexflow/ops/topk_params.h"
 
 namespace FlexFlow {
+using Legion::FutureMap;
 
 class TopKMeta : public OpMeta {
 public:
@@ -30,10 +31,10 @@ class TopK : public Op {
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
-  void inference(FFModel const &,
-                 std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &,
-                 MachineView const *mv = nullptr) override;
+  FutureMap inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
diff --git a/src/ops/aggregate.cc b/src/ops/aggregate.cc
index 8c36edf1bc..096b483a23 100644
--- a/src/ops/aggregate.cc
+++ b/src/ops/aggregate.cc
@@ -243,10 +243,10 @@ void Aggregate::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-void Aggregate::inference(FFModel const &ff,
-                          std::vector<ParallelTensor> const &batch_inputs,
-                          std::vector<ParallelTensor> const &batch_outputs,
-                          MachineView const *mv) {
+FutureMap Aggregate::inference(FFModel const &ff,
+                               std::vector<ParallelTensor> const &batch_inputs,
+                               std::vector<ParallelTensor> const &batch_outputs,
+                               MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
@@ -292,7 +292,7 @@ void Aggregate::inference(FFModel const &ff,
                                                     EXCLUSIVE,
                                                     batch_outputs[0]->region));
   launcher.add_field(n + 2, FID_DATA);
-  runtime->execute_index_space(ctx, launcher);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 void Aggregate::forward_task(Task const *task,
diff --git a/src/ops/aggregate_spec.cc b/src/ops/aggregate_spec.cc
index 1e3d66fdee..4ce863cb50 100644
--- a/src/ops/aggregate_spec.cc
+++ b/src/ops/aggregate_spec.cc
@@ -232,10 +232,11 @@ void AggregateSpec::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-void AggregateSpec::inference(FFModel const &ff,
-                              std::vector<ParallelTensor> const &batch_inputs,
-                              std::vector<ParallelTensor> const &batch_outputs,
-                              MachineView const *mv) {
+FutureMap
+    AggregateSpec::inference(FFModel const &ff,
+                             std::vector<ParallelTensor> const &batch_inputs,
+                             std::vector<ParallelTensor> const &batch_outputs,
+                             MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
@@ -281,7 +282,7 @@ void AggregateSpec::inference(FFModel const &ff,
                                                     EXCLUSIVE,
                                                     batch_outputs[0]->region));
   launcher.add_field(n + 2, FID_DATA);
-  runtime->execute_index_space(ctx, launcher);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 void AggregateSpec::forward_task(Task const *task,
diff --git a/src/ops/attention.cc b/src/ops/attention.cc
index d9ee14ecb6..57d945c2b3 100644
--- a/src/ops/attention.cc
+++ b/src/ops/attention.cc
@@ -523,7 +523,7 @@ void MultiHeadAttention::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-void MultiHeadAttention::inference(
+FutureMap MultiHeadAttention::inference(
     FFModel const &ff,
     std::vector<ParallelTensor> const &batch_inputs,
     std::vector<ParallelTensor> const &batch_outputs,
@@ -572,7 +572,7 @@ void MultiHeadAttention::inference(
                                                     EXCLUSIVE,
                                                     batch_outputs[0]->region));
   launcher.add_field(4, FID_DATA);
-  runtime->execute_index_space(ctx, launcher);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 /*
diff --git a/src/ops/element_binary.cc b/src/ops/element_binary.cc
index feb1862b04..9214113ccc 100644
--- a/src/ops/element_binary.cc
+++ b/src/ops/element_binary.cc
@@ -424,10 +424,11 @@ void ElementBinary::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-void ElementBinary::inference(FFModel const &ff,
-                              std::vector<ParallelTensor> const &batch_inputs,
-                              std::vector<ParallelTensor> const &batch_outputs,
-                              MachineView const *mv) {
+FutureMap
+    ElementBinary::inference(FFModel const &ff,
+                             std::vector<ParallelTensor> const &batch_inputs,
+                             std::vector<ParallelTensor> const &batch_outputs,
+                             MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
@@ -493,7 +494,7 @@ void ElementBinary::inference(FFModel const &ff,
       launcher.add_field(2, FID_DATA);
     }
   }
-  runtime->execute_index_space(ctx, launcher);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 /*
diff --git a/src/ops/group_by.cc b/src/ops/group_by.cc
index b341f004ac..33038d69c3 100644
--- a/src/ops/group_by.cc
+++ b/src/ops/group_by.cc
@@ -261,10 +261,10 @@ void Group_by::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-void Group_by::inference(FFModel const &ff,
-                         std::vector<ParallelTensor> const &batch_inputs,
-                         std::vector<ParallelTensor> const &batch_outputs,
-                         MachineView const *mv) {
+FutureMap Group_by::inference(FFModel const &ff,
+                              std::vector<ParallelTensor> const &batch_inputs,
+                              std::vector<ParallelTensor> const &batch_outputs,
+                              MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
@@ -304,7 +304,7 @@ void Group_by::inference(FFModel const &ff,
     launcher.add_field(i + 2, FID_DATA);
   }
 
-  runtime->execute_index_space(ctx, launcher);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 void Group_by::forward_task(Task const *task,
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index bec6f7d651..02dd519780 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -278,10 +278,10 @@ void LayerNorm::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-void LayerNorm::inference(FFModel const &ff,
-                          std::vector<ParallelTensor> const &batch_inputs,
-                          std::vector<ParallelTensor> const &batch_outputs,
-                          MachineView const *mv) {
+FutureMap LayerNorm::inference(FFModel const &ff,
+                               std::vector<ParallelTensor> const &batch_inputs,
+                               std::vector<ParallelTensor> const &batch_outputs,
+                               MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
@@ -321,7 +321,7 @@ void LayerNorm::inference(FFModel const &ff,
                                                       weights[1]->region));
     launcher.add_field(3, FID_DATA);
   }
-  runtime->execute_index_space(ctx, launcher);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 /*
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index 435080dbe1..49560fc20f 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -367,10 +367,10 @@ void Linear::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-void Linear::inference(FFModel const &ff,
-                       std::vector<ParallelTensor> const &batch_inputs,
-                       std::vector<ParallelTensor> const &batch_outputs,
-                       MachineView const *mv) {
+FutureMap Linear::inference(FFModel const &ff,
+                            std::vector<ParallelTensor> const &batch_inputs,
+                            std::vector<ParallelTensor> const &batch_outputs,
+                            MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
@@ -410,7 +410,7 @@ void Linear::inference(FFModel const &ff,
                                                       weights[1]->region));
     launcher.add_field(3, FID_DATA);
   }
-  runtime->execute_index_space(ctx, launcher);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 void Linear::forward_task(Task const *task,
diff --git a/src/ops/topk.cc b/src/ops/topk.cc
index ec6da77a31..52b54711cb 100644
--- a/src/ops/topk.cc
+++ b/src/ops/topk.cc
@@ -220,10 +220,10 @@ void TopK::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-void TopK::inference(FFModel const &ff,
-                     std::vector<ParallelTensor> const &batch_inputs,
-                     std::vector<ParallelTensor> const &batch_outputs,
-                     MachineView const *mv) {
+FutureMap TopK::inference(FFModel const &ff,
+                          std::vector<ParallelTensor> const &batch_inputs,
+                          std::vector<ParallelTensor> const &batch_outputs,
+                          MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
@@ -255,7 +255,7 @@ void TopK::inference(FFModel const &ff,
                                                     EXCLUSIVE,
                                                     batch_outputs[1]->region));
   launcher.add_field(2, FID_DATA);
-  runtime->execute_index_space(ctx, launcher);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 void TopK::forward_task(Task const *task,

From be13e076c9b3fb53ae02359c3e24ba21d6abc520 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Tue, 10 Jan 2023 22:59:56 +0000
Subject: [PATCH 037/344] [Experts] initial implementation

---
 config/config.linux                   |   2 +-
 include/flexflow/ffconst.h            |   1 +
 include/flexflow/model.h              |  20 +-
 include/flexflow/operator_params.h    |   1 +
 include/flexflow/ops/experts.h        |  79 ++++++
 include/flexflow/ops/experts_params.h |  26 ++
 src/ops/experts.cc                    | 365 ++++++++++++++++++++++++++
 src/runtime/model.cc                  |  30 +++
 8 files changed, 522 insertions(+), 2 deletions(-)
 create mode 100644 include/flexflow/ops/experts.h
 create mode 100644 include/flexflow/ops/experts_params.h
 create mode 100644 src/ops/experts.cc

diff --git a/config/config.linux b/config/config.linux
index 0f819f4031..1cf28a374c 100755
--- a/config/config.linux
+++ b/config/config.linux
@@ -14,7 +14,7 @@
 #INSTALL_DIR=
 
 # set build type
-BUILD_TYPE=${BUILD_TYPE:-Release}
+BUILD_TYPE=${BUILD_TYPE:-Debug}
 
 # set CUDA Arch to the desired GPU architecture(s) to target (e.g. pass "FF_CUDA_ARCH=60" for Pascal). 
 # To pass more than one value, separate architecture numbers with a comma (e.g. FF_CUDA_ARCH=70,75).
diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index 45e754231d..1a69d43aad 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -143,6 +143,7 @@ enum OperatorType {
   OP_POW,   // https://pytorch.org/docs/stable/generated/torch.pow.html
   OP_MEAN,  // https://pytorch.org/docs/stable/generated/torch.mean.html
   OP_LAYERNORM,
+  OP_EXPERTS,
   // Parallel Ops
   OP_REPARTITION,
   OP_COMBINE,
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index d3e7522b9e..0545cc7fbb 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -54,6 +54,10 @@ enum TaskIDs {
   ELEMENTUNARY_INIT_TASK_ID,
   ELEMENTUNARY_FWD_TASK_ID,
   ELEMENTUNARY_BWD_TASK_ID,
+  EXPERTS_INIT_TASK_ID,
+  EXPERTS_FWD_TASK_ID,
+  EXPERTS_BWD_TASK_ID,
+  EXPERTS_INF_TASK_ID,
   CONV2D_INIT_TASK_ID,
   CONV2D_INIT_PARA_TASK_ID,
   CONV2D_FWD_TASK_ID,
@@ -255,6 +259,7 @@ class Dropout;
 class ElementBinary;
 class ElementUnary;
 class Embedding;
+class Experts;
 class Flat;
 class Group_by;
 class LayerNorm;
@@ -448,7 +453,7 @@ class FFModel {
                 PoolType type = POOL_MAX,
                 ActiMode activation = AC_MODE_NONE,
                 char const *name = NULL);
-  // Add a batch_norm layer
+  // Add a layer_norm layer
   Tensor layer_norm(const Tensor input,
                     std::vector<int> const &axes,
                     bool elementwise_affine,
@@ -478,6 +483,15 @@ class FFModel {
   // Add a concat layer
   Tensor
       concat(int n, Tensor const *tensors, int axis, char const *name = NULL);
+  // Add an experts layer
+  Tensor experts(const Tensor input,
+                 const Tensor indices,
+                 int num_experts,
+                 int experts_start_idx,
+                 int experts_num_layers,
+                 int experts_output_dim_size,
+                 int experts_internal_dim_size,
+                 char const *name = nullptr);
   // Add a mean layer
   Tensor mean(const Tensor input,
               std::vector<int> const &dims,
@@ -849,6 +863,10 @@ class FFModel {
                          ElementUnary *>,
       std::unordered_map<std::pair<ParallelTensorShape, EmbeddingParams>,
                          Embedding *>,
+      std::unordered_map<
+          std::pair<std::pair<ParallelTensorShape, ParallelTensorShape>,
+                    ExpertsParams>,
+          Experts *>,
       std::unordered_map<std::pair<ParallelTensorShape, FlatParams>, Flat *>,
 
       std::unordered_map<
diff --git a/include/flexflow/operator_params.h b/include/flexflow/operator_params.h
index 8bf33a3cfa..8c6a8d0ddf 100644
--- a/include/flexflow/operator_params.h
+++ b/include/flexflow/operator_params.h
@@ -12,6 +12,7 @@
 #include "flexflow/ops/element_binary_params.h"
 #include "flexflow/ops/element_unary_params.h"
 #include "flexflow/ops/embedding_params.h"
+#include "flexflow/ops/experts_params.h"
 #include "flexflow/ops/flat_params.h"
 #include "flexflow/ops/groupby_params.h"
 #include "flexflow/ops/layer_norm_params.h"
diff --git a/include/flexflow/ops/experts.h b/include/flexflow/ops/experts.h
new file mode 100644
index 0000000000..74e9c0ff02
--- /dev/null
+++ b/include/flexflow/ops/experts.h
@@ -0,0 +1,79 @@
+#pragma once
+
+#include "flexflow/model.h"
+
+namespace FlexFlow {
+
+class ExpertsMeta : public OpMeta {
+public:
+  ExpertsMeta(FFHandler handler) : OpMeta(handler){};
+};
+
+class Experts : public Op {
+public:
+  using Params = ExpertsParams;
+  using Input = std::pair<ParallelTensor, ParallelTensor>;
+  Experts(FFModel &model,
+          Params const &params,
+          Input const &inputs,
+          char const *name = nullptr);
+  Experts(FFModel &model,
+          const ParallelTensor input,
+          const ParallelTensor indices,
+          int _num_experts,
+          int _experts_start_idx,
+          int _experts_num_layers,
+          int _experts_output_dim_size,
+          int _experts_internal_dim_size,
+          char const *name = nullptr);
+  static Op *
+      create_operator_from_layer(FFModel &model,
+                                 Layer const *layer,
+                                 std::vector<ParallelTensor> const &inputs);
+
+  void init(FFModel const &) override;
+  void forward(FFModel const &) override;
+  void backward(FFModel const &) override;
+  FutureMap inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
+  void print_layer(FFModel const &model) override;
+  void serialize(Legion::Serializer &) const override;
+  static PCG::Node deserialize(FFModel &ff,
+                               Legion::Deserializer &d,
+                               ParallelTensor inputs[],
+                               int num_inputs);
+  Op *materialize(FFModel &ff,
+                  ParallelTensor inputs[],
+                  int num_inputs) const override;
+  Params get_params() const;
+  static OpMeta *init_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static void forward_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static void backward_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
+  bool measure_operator_cost(Simulator *sim,
+                             MachineView const &pc,
+                             CostMetrics &cost_metrics) const override;
+
+public:
+  int num_experts;
+  int experts_start_idx;
+  int experts_num_layers;
+  int experts_output_dim_size;
+  int experts_internal_dim_size;
+};
+
+}; // namespace FlexFlow
diff --git a/include/flexflow/ops/experts_params.h b/include/flexflow/ops/experts_params.h
new file mode 100644
index 0000000000..8f0cee4959
--- /dev/null
+++ b/include/flexflow/ops/experts_params.h
@@ -0,0 +1,26 @@
+#pragma once
+
+#include "flexflow/parallel_tensor.h"
+
+namespace FlexFlow {
+
+struct ExpertsParams {
+  bool is_valid(
+      std::pair<ParallelTensorShape, ParallelTensorShape> const &) const;
+  int num_experts;
+  int experts_start_idx;
+  int experts_num_layers;
+  int experts_output_dim_size;
+  int experts_internal_dim_size;
+};
+
+bool operator==(ExpertsParams const &, ExpertsParams const &);
+
+} // namespace FlexFlow
+
+namespace std {
+template <>
+struct hash<FlexFlow::ExpertsParams> {
+  size_t operator()(FlexFlow::ExpertsParams const &) const;
+};
+} // namespace std
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
new file mode 100644
index 0000000000..438d9179f5
--- /dev/null
+++ b/src/ops/experts.cc
@@ -0,0 +1,365 @@
+/* Copyright 2022 CMU
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/experts.h"
+#include "legion/legion_utilities.h"
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::ArgumentMap;
+using Legion::Context;
+using Legion::coord_t;
+using Legion::Domain;
+using Legion::FutureMap;
+using Legion::IndexLauncher;
+using Legion::PhysicalRegion;
+using Legion::Predicate;
+using Legion::Rect;
+using Legion::RegionRequirement;
+using Legion::Runtime;
+using Legion::Task;
+using Legion::TaskArgument;
+using Legion::TaskLauncher;
+using PCG::Node;
+
+bool operator==(ExpertsParams const &lhs, ExpertsParams const &rhs) {
+  return lhs.num_experts == rhs.num_experts &&
+         lhs.experts_start_idx == rhs.experts_start_idx &&
+         lhs.experts_num_layers == rhs.experts_num_layers &&
+         lhs.experts_output_dim_size == rhs.experts_output_dim_size &&
+         lhs.experts_internal_dim_size == rhs.experts_internal_dim_size;
+}
+
+bool ExpertsParams::is_valid(
+    std::pair<ParallelTensorShape, ParallelTensorShape> const &input) const {
+  if (!input.first.is_valid())
+    return false;
+  if (!input.second.is_valid())
+    return false;
+  if (input.first.num_dims != input.second.num_dims + 1)
+    return false;
+  if (input.second.data_type != DT_INT32 && input.second.data_type != DT_INT64)
+    return false;
+  for (int i = 0; i < input.second.num_dims; i++)
+    if (input.second.dims[i] != input.first.dims[i + 1])
+      return false;
+  return true;
+}
+
+ExpertsParams Experts::get_params() const {
+  ExpertsParams params;
+  params.num_experts = num_experts;
+  params.experts_start_idx = experts_start_idx;
+  params.experts_num_layers = experts_num_layers;
+  params.experts_output_dim_size = experts_output_dim_size;
+  params.experts_internal_dim_size = experts_internal_dim_size;
+  return params;
+}
+
+Tensor FFModel::experts(const Tensor input,
+                        const Tensor indices,
+                        int num_experts,
+                        int experts_start_idx,
+                        int experts_num_layers,
+                        int experts_output_dim_size,
+                        int experts_internal_dim_size,
+                        char const *name) {
+  Layer *e = new Layer(this,
+                       OP_EXPERTS,
+                       DT_FLOAT,
+                       name,
+                       2 /*inputs*/,
+                       1 /*weights*/,
+                       1 /*outputs*/,
+                       input,
+                       indices);
+  assert(input->num_dims == indices->num_dims + 1);
+  for (int i = 0; i < indices->num_dims; i++)
+    assert(input->dims[i + 1] == indices->dims[i]);
+  assert(indices->data_type == DT_INT32 || indices->data_type == DT_INT64);
+  int dims[MAX_TENSOR_DIM];
+  int numdim = input->num_dims;
+  for (int i = 1; i < input->num_dims; i++)
+    dims[i] = input->dims[i];
+  dims[0] = experts_output_dim_size;
+  e->outputs[0] = create_tensor_legion_ordering(
+      numdim, dims, input->data_type, e, 0, true /*create_grad*/);
+  e->add_int_property("num_experts", num_experts);
+  e->add_int_property("experts_start_idx", experts_start_idx);
+  e->add_int_property("experts_num_layers", experts_num_layers);
+  e->add_int_property("experts_output_dim_size", experts_output_dim_size);
+  e->add_int_property("experts_internal_dim_size", experts_internal_dim_size);
+  layers.push_back(e);
+  return e->outputs[0];
+}
+
+Op *Experts::create_operator_from_layer(
+    FFModel &model,
+    Layer const *layer,
+    std::vector<ParallelTensor> const &inputs) {
+  long long value;
+  layer->get_int_property("num_experts", value);
+  int num_experts = value;
+  layer->get_int_property("experts_start_idx", value);
+  int experts_start_idx = value;
+  layer->get_int_property("experts_num_layers", value);
+  int experts_num_layers = value;
+  layer->get_int_property("experts_output_dim_size", value);
+  int experts_output_dim_size = value;
+  layer->get_int_property("experts_internal_dim_size", value);
+  int experts_internal_dim_size = value;
+  return new Experts(model,
+                     inputs[0],
+                     inputs[1],
+                     num_experts,
+                     experts_start_idx,
+                     experts_num_layers,
+                     experts_output_dim_size,
+                     experts_internal_dim_size,
+                     layer->name);
+}
+
+Experts::Experts(FFModel &model,
+                 ExpertsParams const &params,
+                 std::pair<ParallelTensor, ParallelTensor> const &inputs,
+                 char const *name)
+    : Experts(model,
+              inputs.first,
+              inputs.second,
+              params.num_experts,
+              params.experts_start_idx,
+              params.experts_num_layers,
+              params.experts_output_dim_size,
+              params.experts_internal_dim_size,
+              name) {}
+
+Experts::Experts(FFModel &model,
+                 const ParallelTensor input,
+                 const ParallelTensor indices,
+                 int _num_experts,
+                 int _experts_start_idx,
+                 int _experts_num_layers,
+                 int _experts_output_dim_size,
+                 int _experts_internal_dim_size,
+                 char const *name)
+    : Op(model,
+         OP_EXPERTS,
+         DT_FLOAT,
+         name,
+         2 /*inputs*/,
+         1 /*weights*/,
+         1 /*outputs*/,
+         input,
+         indices),
+      num_experts(_num_experts), experts_start_idx(_experts_start_idx),
+      experts_num_layers(_experts_num_layers),
+      experts_output_dim_size(_experts_output_dim_size),
+      experts_internal_dim_size(_experts_internal_dim_size) {
+  assert(input->num_dims == indices->num_dims + 1);
+  assert(indices->data_type == DT_INT32 || indices->data_type == DT_INT64);
+  for (int i = 0; i < indices->num_dims; i++)
+    assert(input->dims[i + 1] == indices->dims[i]);
+  // Assume that we don't parallelize the channel dim
+  assert(input->dims[0].degree == 1);
+  ParallelDim dims[MAX_TENSOR_DIM];
+  for (int i = 0; i < input->num_dims; i++)
+    dims[i] = input->dims[i];
+  dims[0].size = experts_output_dim_size;
+  numOutputs = 1;
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      input->num_dims, dims, input->data_type, this);
+}
+
+void Experts::serialize(Legion::Serializer &sez) const {
+  ExpertsParams params = get_params();
+  sez.serialize(params.num_experts);
+  sez.serialize(params.experts_start_idx);
+  sez.serialize(params.experts_num_layers);
+  sez.serialize(params.experts_output_dim_size);
+  sez.serialize(params.experts_internal_dim_size);
+}
+
+using PCG::Node;
+Node Experts::deserialize(FFModel &ff,
+                          Legion::Deserializer &dez,
+                          ParallelTensor inputs[],
+                          int num_inputs) {
+  assert(num_inputs == 2);
+  int num_experts, experts_start_idx, experts_num_layers,
+      experts_output_dim_size, experts_internal_dim_size;
+  dez.deserialize(num_experts);
+  dez.deserialize(experts_start_idx);
+  dez.deserialize(experts_num_layers);
+  dez.deserialize(experts_output_dim_size);
+  dez.deserialize(experts_internal_dim_size);
+
+  ExpertsParams params;
+  params.num_experts = num_experts;
+  params.experts_start_idx = experts_start_idx;
+  params.experts_num_layers = experts_num_layers;
+  params.experts_output_dim_size = experts_output_dim_size;
+  params.experts_internal_dim_size = experts_internal_dim_size;
+  return ff.get_or_create_node<Experts>({inputs[0], inputs[1]}, params);
+}
+
+Op *Experts::materialize(FFModel &ff,
+                         ParallelTensor inputs[],
+                         int num_inputs) const {
+  ExpertsParams params = get_params();
+  return new Experts(ff, params, {inputs[0], inputs[1]}, this->name);
+}
+
+void Experts::init(FFModel const &ff) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(EXPERTS_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(Experts)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[1]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
+OpMeta *Experts::init_task(Task const *task,
+                           std::vector<PhysicalRegion> const &regions,
+                           Context ctx,
+                           Runtime *runtime) {
+  Experts const *bmm = (Experts *)task->args;
+  FFHandler handle = *((FFHandler const *)task->local_args);
+  ExpertsMeta *m = new ExpertsMeta(handle);
+  return m;
+}
+
+void Experts::forward(FFModel const &ff) {
+  assert(false && "Experts is designed for inference only");
+}
+
+void Experts::forward_task(Task const *task,
+                           std::vector<PhysicalRegion> const &regions,
+                           Context ctx,
+                           Runtime *runtime) {
+  assert(false && "Experts is designed for inference only");
+}
+
+void Experts::backward(FFModel const &ff) {
+  assert(false && "Experts is designed for inference only");
+}
+
+void Experts::backward_task(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
+  assert(false && "Experts is designed for inference only");
+}
+
+FutureMap Experts::inference(FFModel const &ff,
+                             std::vector<ParallelTensor> const &batch_inputs,
+                             std::vector<ParallelTensor> const &batch_outputs,
+                             MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_forward(ff, argmap);
+  size_t machine_view_hash = mv ? mv->hash() : outputs[0]->machine_view.hash();
+  IndexLauncher launcher(EXPERTS_INF_TASK_ID,
+                         parallel_is,
+                         TaskArgument(nullptr, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[1]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+void Experts::inference_task(Task const *task,
+                             std::vector<PhysicalRegion> const &regions,
+                             Context ctx,
+                             Runtime *runtime) {
+  // TODO: to be implemented
+}
+
+void Experts::print_layer(FFModel const &ff) {
+  return;
+}
+
+bool Experts::measure_operator_cost(Simulator *sim,
+                                    MachineView const &c,
+                                    CostMetrics &cost_metrics) const {
+  // This is an inference only operator
+  assert(false);
+  return false;
+}
+
+}; // namespace FlexFlow
+
+namespace std {
+size_t hash<FlexFlow::ExpertsParams>::operator()(
+    FlexFlow::ExpertsParams const &params) const {
+  size_t key = 0;
+  hash_combine(key, params.num_experts);
+  hash_combine(key, params.experts_start_idx);
+  hash_combine(key, params.experts_num_layers);
+  hash_combine(key, params.experts_output_dim_size);
+  hash_combine(key, params.experts_internal_dim_size);
+  return key;
+}
+}; // namespace std
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index ad8a01563e..7350735314 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -35,6 +35,7 @@
 #include "flexflow/ops/element_binary.h"
 #include "flexflow/ops/element_unary.h"
 #include "flexflow/ops/embedding.h"
+#include "flexflow/ops/experts.h"
 #include "flexflow/ops/flat.h"
 #include "flexflow/ops/fused.h"
 #include "flexflow/ops/groupby.h"
@@ -3755,6 +3756,35 @@ void register_flexflow_internal_tasks() {
     Runtime::preregister_task_variant<ElementBinary::backward_task>(
         registrar, "ElementWiseBinary Backward Task");
   }
+  // Experts
+  {
+    TaskVariantRegistrar registrar(EXPERTS_INIT_TASK_ID, "Experts Init");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<OpMeta *, Experts::init_task>(
+        registrar, "Experts Init Task");
+  }
+  {
+    TaskVariantRegistrar registrar(EXPERTS_FWD_TASK_ID, "Experts Forward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<Experts::forward_task>(
+        registrar, "Experts Forward Task");
+  }
+  {
+    TaskVariantRegistrar registrar(EXPERTS_BWD_TASK_ID, "Experts Backward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<Experts::backward_task>(
+        registrar, "Experts Backward Task");
+  }
+  {
+    TaskVariantRegistrar registrar(EXPERTS_INF_TASK_ID, "Experts Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<Experts::inference_task>(
+        registrar, "Experts Inference Task");
+  }
   // Cast
   {
     TaskVariantRegistrar registrar(CAST_INIT_TASK_ID, "Cast Init");

From 9a32a6eed15580106218c583bd2c4ecde0487e74 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Tue, 10 Jan 2023 23:01:29 +0000
Subject: [PATCH 038/344] [Experts] undo a change

---
 config/config.linux | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/config/config.linux b/config/config.linux
index 1cf28a374c..0f819f4031 100755
--- a/config/config.linux
+++ b/config/config.linux
@@ -14,7 +14,7 @@
 #INSTALL_DIR=
 
 # set build type
-BUILD_TYPE=${BUILD_TYPE:-Debug}
+BUILD_TYPE=${BUILD_TYPE:-Release}
 
 # set CUDA Arch to the desired GPU architecture(s) to target (e.g. pass "FF_CUDA_ARCH=60" for Pascal). 
 # To pass more than one value, separate architecture numbers with a comma (e.g. FF_CUDA_ARCH=70,75).

From 285b2e971d2364091f2926e053046d4683d89ec5 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Sat, 14 Jan 2023 12:19:35 -0600
Subject: [PATCH 039/344] [MOE] update moe cpp example and aggregate
 implementation (#555)

* [MOE] update moe cpp example and aggregate implementation

* [MOE] bug fixes to make the MOE example work
---
 .../cpp/inference/mixture_of_experts/moe.cc   | 22 +++++++++----------
 src/ops/aggregate.cc                          | 21 ++++++++++--------
 src/ops/experts.cc                            | 16 ++++++++------
 src/runtime/ffconst_utils.cc                  |  2 ++
 4 files changed, 33 insertions(+), 28 deletions(-)

diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index 23dd88506e..459ffb42b5 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -31,7 +31,7 @@
 using namespace Legion;
 
 LegionRuntime::Logger::Category log_app("MoE");
-int num_exp = 5;
+int num_exp = 4;
 int num_select = 2;
 
 void parse_input_args(char **argv, int argc, MoeConfig &config) {
@@ -54,22 +54,20 @@ Tensor create_moe(FFModel *model,
   gate_preds = model->dense(gate_preds, num_exp, AC_MODE_RELU);
   Tensor topK_output[2];
   model->top_k(gate_preds, topK_output, num_select, false);
-  Tensor exp_tensors[num_exp];
-  model->group_by(input, topK_output[1], exp_tensors, num_exp, alpha);
-  for (int i=0; i<num_exp; i++) {
-    exp_tensors[i]->dims[2] = 1; // temporary fix to replica dimension being undefined
-    exp_tensors[i]->print("exp_tensors[i]");
-  }
   Tensor agg_inputs[num_exp + 4];
   agg_inputs[0] = model->softmax(topK_output[0]); // gate preds
   agg_inputs[1] = topK_output[1];                 // gate assign
   agg_inputs[2] = topK_output[1]; // gate assign TopK (for cache)
   agg_inputs[3] = gate_preds;     // full gate preds
-  for (int i = 0; i < num_exp; i++) {
-    Tensor exp_pred =
-        model->dense(exp_tensors[i], moeConfig->hidden_size, AC_MODE_RELU);
-    exp_pred->print("exp_pred");
-    agg_inputs[i + 4] = model->softmax(exp_pred);
+  for (int i = 0; i < num_exp /*number of experts layers*/; i++) {
+    Tensor exp_pred = model->experts(gate_preds,
+                                     topK_output[1],
+                                     32 /*number of experts*/,
+                                     32 * i /*expert start index*/,
+                                     1 /*number of linear layers*/,
+                                     moeConfig->hidden_size /*output_size*/,
+                                     moeConfig->hidden_size /*internal_size*/);
+    agg_inputs[i + 4] = exp_pred;
   }
   for (int i = 0; i < num_exp + 4; i++) {
     agg_inputs[i]->print("agg_inputs[i]");
diff --git a/src/ops/aggregate.cc b/src/ops/aggregate.cc
index 096b483a23..941c6da8cb 100644
--- a/src/ops/aggregate.cc
+++ b/src/ops/aggregate.cc
@@ -55,10 +55,8 @@ Tensor FFModel::aggregate(
     int num_dim = inputs[4]->num_dims;
     // Set output shape
     int dims[MAX_TENSOR_DIM];
-    for (int i = 0; i < num_dim - 1; i++) {
+    for (int i = 0; i < num_dim; i++)
       dims[i] = inputs[4]->dims[i];
-    }
-    dims[num_dim - 1] = inputs[0]->dims[num_dim - 1];
     li->outputs[0] = create_tensor_legion_ordering(
         num_dim, dims, DT_FLOAT, li, 0, true /*create_grad*/);
   }
@@ -143,11 +141,16 @@ Aggregate::Aggregate(FFModel &model,
   }
   // Set output shape
   ParallelDim dims[MAX_TENSOR_DIM];
+<<<<<<< HEAD
   for (int i = 0; i < num_dim - 1; i++) {
     dims[i] = inputs[4]->dims[i];
   }
   dims[num_dim - 2] = inputs[0]->dims[num_dim - 2];
   dims[num_dim - 1] = inputs[0]->dims[num_dim - 1];
+=======
+  for (int i = 0; i < num_dim; i++)
+    dims[i] = inputs[4]->dims[i];
+>>>>>>> 99a89a9b... [MOE] update moe cpp example and aggregate implementation (#555)
   numOutputs = 1;
   outputs[0] = model.create_parallel_tensor_legion_ordering(
       num_dim, dims, DT_FLOAT, this);
@@ -204,7 +207,7 @@ void Aggregate::forward(FFModel const &ff) {
   set_argumentmap_for_forward(ff, argmap);
   IndexLauncher launcher(AGGREGATE_FWD_TASK_ID,
                          parallel_is,
-                         TaskArgument(this, sizeof(Aggregate)),
+                         TaskArgument(nullptr, 0),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
@@ -255,7 +258,7 @@ FutureMap Aggregate::inference(FFModel const &ff,
   size_t machine_view_hash = mv ? mv->hash() : outputs[0]->machine_view.hash();
   IndexLauncher launcher(AGGREGATE_FWD_TASK_ID,
                          parallel_is,
-                         TaskArgument(this, sizeof(Aggregate)),
+                         TaskArgument(nullptr, 0),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
@@ -299,10 +302,10 @@ void Aggregate::forward_task(Task const *task,
                              std::vector<PhysicalRegion> const &regions,
                              Context ctx,
                              Runtime *runtime) {
-  int n = ((Aggregate *)task->args)->n;
-
-  assert((int)regions.size() == n + 3);
-  assert((int)task->regions.size() == n + 3);
+  assert(regions.size() == task->regions.size());
+  int n = regions.size() - 3;
+  // FIXME: skip the aggregate computation for now
+  return;
 
   AggregateMeta const *m = *((AggregateMeta **)task->local_args);
 
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index 438d9179f5..28405d3dd7 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -86,9 +86,9 @@ Tensor FFModel::experts(const Tensor input,
                        1 /*outputs*/,
                        input,
                        indices);
-  assert(input->num_dims == indices->num_dims + 1);
-  for (int i = 0; i < indices->num_dims; i++)
-    assert(input->dims[i + 1] == indices->dims[i]);
+  assert(input->num_dims == indices->num_dims);
+  for (int i = 1; i < indices->num_dims; i++)
+    assert(input->dims[i] == indices->dims[i]);
   assert(indices->data_type == DT_INT32 || indices->data_type == DT_INT64);
   int dims[MAX_TENSOR_DIM];
   int numdim = input->num_dims;
@@ -168,12 +168,14 @@ Experts::Experts(FFModel &model,
       experts_num_layers(_experts_num_layers),
       experts_output_dim_size(_experts_output_dim_size),
       experts_internal_dim_size(_experts_internal_dim_size) {
-  assert(input->num_dims == indices->num_dims + 1);
+  assert(input->num_dims == indices->num_dims);
   assert(indices->data_type == DT_INT32 || indices->data_type == DT_INT64);
-  for (int i = 0; i < indices->num_dims; i++)
-    assert(input->dims[i + 1] == indices->dims[i]);
-  // Assume that we don't parallelize the channel dim
+  for (int i = 1; i < indices->num_dims; i++)
+    assert(input->dims[i] == indices->dims[i]);
+  // Assume that we don't parallelize the channel dim of input
+  // nor the expert_assigned dim of indices
   assert(input->dims[0].degree == 1);
+  assert(indices->dims[0].degree == 1);
   ParallelDim dims[MAX_TENSOR_DIM];
   for (int i = 0; i < input->num_dims; i++)
     dims[i] = input->dims[i];
diff --git a/src/runtime/ffconst_utils.cc b/src/runtime/ffconst_utils.cc
index a604d0bd4b..901f72e816 100644
--- a/src/runtime/ffconst_utils.cc
+++ b/src/runtime/ffconst_utils.cc
@@ -45,6 +45,8 @@ std::string get_operator_type_name(OperatorType type) {
       return "Split";
     case OP_EMBEDDING:
       return "Embedding";
+    case OP_EXPERTS:
+      return "Experts";
     case OP_GROUP_BY:
       return "Group_by";
     case OP_CACHE:

From 521363421939092f0e3774d11db29ad069781c40 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 17 Jan 2023 21:00:48 -0500
Subject: [PATCH 040/344] [inference] removed gshard and transformer files

---
 CMakeLists.txt                                |  10 -
 .../cpp/inference/G-Shard-MoE/CMakeLists.txt  |  12 -
 examples/cpp/inference/G-Shard-MoE/Makefile   |  39 --
 examples/cpp/inference/G-Shard-MoE/g_shard.cc | 196 ---------
 .../cpp/inference/Transformer/CMakeLists.txt  |  19 -
 examples/cpp/inference/Transformer/Makefile   |  35 --
 .../cpp/inference/Transformer/transformer.cc  | 397 ------------------
 .../cpp/inference/Transformer/transformer.cu  |  58 ---
 .../cpp/inference/Transformer/transformer.h   |  54 ---
 9 files changed, 820 deletions(-)
 delete mode 100644 examples/cpp/inference/G-Shard-MoE/CMakeLists.txt
 delete mode 100644 examples/cpp/inference/G-Shard-MoE/Makefile
 delete mode 100644 examples/cpp/inference/G-Shard-MoE/g_shard.cc
 delete mode 100644 examples/cpp/inference/Transformer/CMakeLists.txt
 delete mode 100644 examples/cpp/inference/Transformer/Makefile
 delete mode 100644 examples/cpp/inference/Transformer/transformer.cc
 delete mode 100644 examples/cpp/inference/Transformer/transformer.cu
 delete mode 100644 examples/cpp/inference/Transformer/transformer.h

diff --git a/CMakeLists.txt b/CMakeLists.txt
index b796308aa3..b6a8fcec4e 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -335,8 +335,6 @@ option(FF_BUILD_MLP_UNIFY "build mlp unify example" OFF)
 option(FF_BUILD_SPLIT_TEST "build split test example" OFF)
 option(FF_BUILD_SPLIT_TEST_2 "build split test 2 example" OFF)
 option(FF_BUILD_MLP_UNIFY_INFERENCE "build mlp unify inference example" OFF)
-option(FF_BUILD_TRANSFORMER_INFERENCE "build transformer inference example" OFF)
-option(FF_BUILD_G_SHARD_INFERENCE "build G-Shard inference example" OFF)
 option(FF_BUILD_ALL_INFERENCE_EXAMPLES "build all inference examples. Overrides others" OFF)
 option(FF_BUILD_ALL_EXAMPLES "build all examples. Overrides others" OFF)
 option(FF_BUILD_UNIT_TESTS "build non-operator unit tests" OFF)
@@ -427,14 +425,6 @@ if(FF_BUILD_MOE OR FF_BUILD_ALL_INFERENCE_EXAMPLES)
   add_subdirectory(examples/cpp/inference/mixture_of_experts)
 endif()
 
-# if(FF_BUILD_TRANSFORMER_INFERENCE OR FF_BUILD_ALL_INFERENCE_EXAMPLES)
-#   add_subdirectory(examples/cpp/inference/Transformer)
-# endif()
-
-# if(FF_BUILD_G_SHARD_INFERENCE OR FF_BUILD_ALL_INFERENCE_EXAMPLES)
-#   add_subdirectory(examples/cpp/inference/G-Shard-MoE)
-# endif()
-
 # installation
 set(INCLUDE_DEST "include")
 set(LIB_DEST "lib")
diff --git a/examples/cpp/inference/G-Shard-MoE/CMakeLists.txt b/examples/cpp/inference/G-Shard-MoE/CMakeLists.txt
deleted file mode 100644
index daab2dc49b..0000000000
--- a/examples/cpp/inference/G-Shard-MoE/CMakeLists.txt
+++ /dev/null
@@ -1,12 +0,0 @@
-cmake_minimum_required(VERSION 3.10)
-
-project(FlexFlowExampleInferenceGShard)
-set(project_target g_shard)
-
-set(CPU_SRC
-  ${FLEXFLOW_CPP_DRV_SRC}
-  g_shard.cc)
-
-cuda_add_executable(${project_target} ${CPU_SRC})
-target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
-target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
diff --git a/examples/cpp/inference/G-Shard-MoE/Makefile b/examples/cpp/inference/G-Shard-MoE/Makefile
deleted file mode 100644
index f64e670e05..0000000000
--- a/examples/cpp/inference/G-Shard-MoE/Makefile
+++ /dev/null
@@ -1,39 +0,0 @@
-# Copyright 2021 CMU, Facebook, LANL, MIT, and Stanford (alphabetical)
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-#     http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-#
-
-# Flags for directing the runtime makefile what to include
-DEBUG           ?= 1		# Include debugging symbols
-MAX_DIM         ?= 5		# Maximum number of dimensions
-OUTPUT_LEVEL    ?= LEVEL_DEBUG	# Compile time logging level
-USE_CUDA        ?= 0		# Include CUDA support (requires CUDA)
-USE_GASNET      ?= 0		# Include GASNet support (requires GASNet)
-USE_HDF         ?= 0		# Include HDF5 support (requires HDF5)
-ALT_MAPPERS     ?= 0		# Include alternative mappers (not recommended)
-USE_HIP         ?= 1		# Include HIP support (requires HIP)
-HIP_TARGET      ?= ROCM
-USE_GPU_REDUCTIONS ?= 0
-
-# Put the binary file name here
-OUTFILE		?= g_shard
-# List all the application source files here
-GEN_SRC		= g_shard.cc
-GEN_GPU_SRC	=
-GEN_HIP_SRC     =
-
-ifndef FF_HOME
-$(error FF_HOME variable is not defined, aborting build)
-endif
-
-include $(FF_HOME)/FlexFlow.mk
diff --git a/examples/cpp/inference/G-Shard-MoE/g_shard.cc b/examples/cpp/inference/G-Shard-MoE/g_shard.cc
deleted file mode 100644
index 95c0b3f1dd..0000000000
--- a/examples/cpp/inference/G-Shard-MoE/g_shard.cc
+++ /dev/null
@@ -1,196 +0,0 @@
-/* Copyright 2021 Stanford University
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "flexflow/model.h"
-#include <fstream>
-#include <sstream>
-#include <string>
-using namespace Legion;
-using namespace FlexFlow;
-
-// embed_dim=768,
-// num_heads=12,
-// kdim=None,
-// vdim=None,
-// dropout=0.1,
-// bias=True,
-// add_bias_kv=False,
-// add_zero_attn=False,
-// self_attention=True,
-// encoder_decoder_attention=False,
-// q_noise=0.0,
-// qn_block_size=8,
-
-// Tensor FFModel::multihead_attention(const Tensor query,
-// const Tensor key,
-// const Tensor value,
-// int embed_dim,
-// int num_heads,
-// int kdim,
-// int vdim,
-// float dropout,
-// bool bias,
-// bool add_bias_kv,
-// bool add_zero_attn,
-// Initializer *kernel_initializer,
-// char const *name) {
-
-
-void create_attention_decoder(FFModel *model,
-                                      Tensor const &input1,
-                                      Tensor const &input2,
-                                      Tensor &output1,
-                                      Tensor &output2,
-                                      int embed_dim,
-                                      int num_heads,
-                                      int kdim,
-                                      int vdim,
-                                      float dropout=0.1,
-                                      bool normalize_before=false,
-                                      bool is_moe=false) {
-  
-  std::vector<int> axes = {embed_dim};
-  Tensor x = normalize_before ? model->layer_norm(input1 /*const Tensor input*/, axes /*std::vector<int> const &axes*/, true /*elementwise_affine*/, 1e-05 /*eps*/) : input1;
-  x = model->add(model->dropout(model->multihead_attention(x, x, x, embed_dim, num_heads, embed_dim, embed_dim, dropout, true /*bias*/, false /*add_bias_kv*/, false /*add_zero_attn*/), dropout), x);
-  //x = normalize_before ? x : model->layer_norm(x, axes, true, 1e-05);
-  x = model->layer_norm(x, axes, true, 1e-05);
-
-  if(!is_moe) {
-    x = model->dropout(model->dense(model->dropout(model->dense(x, 3072, AC_MODE_GELU, true /*bias*/), dropout), embed_dim, AC_MODE_NONE, true /*bias*/), dropout);
-  } else {
-    // x - seq_len, batch_size, model_dim
-    // x = x.transpose(0, 1) # batch_size, seq_len, model_dim
-    // x, l_aux = self.moe_layer(x)
-    // x = x.transpose(0, 1) # seq_len, batch_size, model_dim
-    //x = self.residual_connection(x, residual)
-    
-    //if not self.normalize_before:
-    //    x = self.final_layer_norm(x)
-    x = normalize_before ? x : model->layer_norm(x, axes, true, 1e-05);
-    float alpha = 2.0f;   // factor overhead tensor size for imbalance
-    float lambda = 0.04f; // multiplier for load balance term
-    int num_exp = 128;
-    int num_select = 2;
-
-    // MoE model
-    Tensor input = x;
-    Tensor gate_preds = model->dense(x, num_exp, AC_MODE_RELU);
-    Tensor topK_output[2];
-    model->top_k(gate_preds, topK_output, num_select, false);
-
-    Tensor exp_tensors[num_exp];
-    model->group_by(input, topK_output[1], exp_tensors, num_exp, alpha);
-
-    Tensor agg_inputs[num_exp + 4];
-    agg_inputs[0] = model->softmax(topK_output[0]); // gate preds
-    agg_inputs[1] = topK_output[1];             // gate assign
-    agg_inputs[2] = topK_output[1];             // gate assign TopK (for cache)
-    agg_inputs[3] = gate_preds;                 // full gate preds
-    for (int i = 0; i < num_exp; i++) {
-      Tensor exp_pred = model->dense(exp_tensors[i], embed_dim, AC_MODE_RELU);
-      agg_inputs[i + 4] = model->softmax(exp_pred);
-    }
-  }
-  
-  // Tensor t1 =
-  //     model->add(model->multihead_attention(
-  //                    input1, input1, input1, hidden_dim, num_heads, kdim, vdim),
-  //                input1);
-  // t1 = model->dense(model->dense(t1, hidden_dim, AC_MODE_RELU, false /*bias*/),
-  //                   hidden_dim,
-  //                   AC_MODE_NONE,
-  //                   false /*bias*/);
-  // Tensor t2 =
-  //     model->add(model->multihead_attention(
-  //                    input2, input2, input2, hidden_dim, num_heads, kdim, vdim),
-  //                input2);
-  // t2 = model->add(
-  //     model->multihead_attention(t2, t1, t1, hidden_dim, num_heads, kdim, vdim),
-  //     t2);
-  // t2 = model->dense(model->dense(t2, hidden_dim, AC_MODE_RELU, false /*bias*/),
-  //                   hidden_dim,
-  //                   AC_MODE_NONE,
-  //                   false /*bias*/);
-  // output1 = t1;
-  // output2 = t2;
-}
-
-void FlexFlow::top_level_task(Task const *task,
-                              std::vector<PhysicalRegion> const &regions,
-                              Context ctx,
-                              Runtime *runtime) {
-  FFConfig ffConfig;
-  fprintf(stderr,
-          "batchSize(%d) workersPerNodes(%d) numNodes(%d)\n",
-          ffConfig.batchSize,
-          ffConfig.workersPerNode,
-          ffConfig.numNodes);
-  FFModel ff(ffConfig);
-
-  std::vector<int> hidden_dims = {
-      8192, 8192, 8192, 8192, 8192, 8192, 8192, 8192};
-  Tensor input1, input2;
-  {
-    int const dims[] = {ffConfig.batchSize, 1024};
-    input1 = ff.create_tensor<2>(dims, DT_FLOAT);
-    input2 = ff.create_tensor<2>(dims, DT_FLOAT);
-  }
-  Tensor t1 = input1, t2 = input2;
-  for (size_t i = 0; i < hidden_dims.size(); i++) {
-    int const dims[] = {hidden_dims[i], t1->dims[0]};
-    ActiMode acti_mode =
-        (i + 1 == hidden_dims.size()) ? AC_MODE_NONE : AC_MODE_RELU;
-    t1 = ff.dense(t1, hidden_dims[i], acti_mode, false);
-    t2 = ff.dense(t2, hidden_dims[i], acti_mode, false);
-  }
-  Tensor t = ff.add(t1, t2);
-  t = ff.softmax(t);
-  Optimizer *optimizer = new SGDOptimizer(&ff, 0.001f);
-  std::vector<MetricsType> metrics;
-  metrics.push_back(METRICS_ACCURACY);
-  metrics.push_back(METRICS_SPARSE_CATEGORICAL_CROSSENTROPY);
-  ff.compile(optimizer, LOSS_SPARSE_CATEGORICAL_CROSSENTROPY, metrics, CompMode::COMP_MODE_INFERENCE);
-  ff.init_operators();
-  // Start timer
-  {
-    runtime->issue_execution_fence(ctx);
-    TimingLauncher timer(MEASURE_MICRO_SECONDS);
-    Future future = runtime->issue_timing_measurement(ctx, timer);
-    future.get_void_result();
-  }
-  double ts_start = Realm::Clock::current_time_in_microseconds();
-  //for (int epoch = 0; epoch < ffConfig.epochs; epoch++) {
-  ff.reset_metrics();
-  int iterations = 128;
-  for (int iter = 0; iter < iterations; iter++) {
-    runtime->begin_trace(ctx, 111 /*trace_id*/);
-    ff.forward();
-    runtime->end_trace(ctx, 111 /*trace_id*/);
-  }
-  // End timer
-  {
-    runtime->issue_execution_fence(ctx);
-    TimingLauncher timer(MEASURE_MICRO_SECONDS);
-    Future future = runtime->issue_timing_measurement(ctx, timer);
-    future.get_void_result();
-  }
-  double ts_end = Realm::Clock::current_time_in_microseconds();
-  double run_time = 1e-6 * (ts_end - ts_start);
-  printf("ELAPSED TIME = %.4fs, THROUGHPUT = %.2f samples/s\n",
-         run_time,
-         ffConfig.batchSize * 128 * ffConfig.epochs / run_time);
-}
-
-void FlexFlow::register_custom_tasks() {}
diff --git a/examples/cpp/inference/Transformer/CMakeLists.txt b/examples/cpp/inference/Transformer/CMakeLists.txt
deleted file mode 100644
index ac46d77f32..0000000000
--- a/examples/cpp/inference/Transformer/CMakeLists.txt
+++ /dev/null
@@ -1,19 +0,0 @@
-cmake_minimum_required(VERSION 3.10)
-
-project(FlexFlowExample_Transformer)
-set(project_target transformer)
-
-set(CPU_SRC
-  ${FLEXFLOW_CPP_DRV_SRC}
-  transformer.cc
-  transformer.h)
-
-set(GPU_SRC
-transformer.cu)
-
-cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
-target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
-target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
-
-set(BIN_DEST "bin")
-install(TARGETS ${project_target} DESTINATION ${BIN_DEST})
diff --git a/examples/cpp/inference/Transformer/Makefile b/examples/cpp/inference/Transformer/Makefile
deleted file mode 100644
index 911f234c45..0000000000
--- a/examples/cpp/inference/Transformer/Makefile
+++ /dev/null
@@ -1,35 +0,0 @@
-# Copyright 2021 Facebook, Stanford, LANL
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-#     http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-#
-
-# Flags for directing the runtime makefile what to include
-DEBUG           ?= 1		# Include debugging symbols
-MAX_DIM         ?= 4		# Maximum number of dimensions
-OUTPUT_LEVEL    ?= LEVEL_DEBUG	# Compile time logging level
-USE_CUDA        ?= 1		# Include CUDA support (requires CUDA)
-USE_GASNET      ?= 0		# Include GASNet support (requires GASNet)
-USE_HDF         ?= 1		# Include HDF5 support (requires HDF5)
-ALT_MAPPERS     ?= 0		# Include alternative mappers (not recommended)
-
-# Put the binary file name here
-OUTFILE		?= transformer
-# List all the application source files here
-GEN_SRC		= transformer.cc
-GEN_GPU_SRC	= transformer.cu
-
-ifndef FF_HOME
-$(error FF_HOME variable is not defined, aborting build)
-endif
-
-include $(FF_HOME)/FlexFlow.mk
diff --git a/examples/cpp/inference/Transformer/transformer.cc b/examples/cpp/inference/Transformer/transformer.cc
deleted file mode 100644
index 38675577cc..0000000000
--- a/examples/cpp/inference/Transformer/transformer.cc
+++ /dev/null
@@ -1,397 +0,0 @@
-/* Copyright 2021 Facebook
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "transformer.h"
-
-using namespace Legion;
-
-LegionRuntime::Logger::Category log_app("Transformer");
-
-Tensor create_emb(FFModel *model,
-                  Tensor const &input,
-                  int input_dim,
-                  int output_dim,
-                  int idx) {
-  float range = sqrt(1.0f / input_dim);
-  Initializer *embed_init = new UniformInitializer(std::rand(), -range, range);
-  return model->embedding(
-      input, input_dim, output_dim, AGGR_MODE_SUM, NULL, embed_init);
-}
-
-Tensor create_attention_encoder(FFModel *model,
-                                Tensor const &input,
-                                int hidden_dim,
-                                int num_heads,
-                                int kdim,
-                                int vdim) {
-  Tensor t = model->multihead_attention(
-      input, input, input, hidden_dim, num_heads, kdim, vdim);
-  return model->dense(model->dense(t, hidden_dim, AC_MODE_RELU, false /*bias*/),
-                      hidden_dim,
-                      AC_MODE_NONE,
-                      false /*bias*/);
-}
-
-void create_attention_encoder_decoder(FFModel *model,
-                                      Tensor const &input1,
-                                      Tensor const &input2,
-                                      Tensor &output1,
-                                      Tensor &output2,
-                                      int hidden_dim,
-                                      int num_heads,
-                                      int kdim,
-                                      int vdim) {
-  Tensor t1 =
-      model->add(model->multihead_attention(
-                     input1, input1, input1, hidden_dim, num_heads, kdim, vdim),
-                 input1);
-  t1 = model->dense(model->dense(t1, hidden_dim, AC_MODE_RELU, false /*bias*/),
-                    hidden_dim,
-                    AC_MODE_NONE,
-                    false /*bias*/);
-  Tensor t2 =
-      model->add(model->multihead_attention(
-                     input2, input2, input2, hidden_dim, num_heads, kdim, vdim),
-                 input2);
-  t2 = model->add(
-      model->multihead_attention(t2, t1, t1, hidden_dim, num_heads, kdim, vdim),
-      t2);
-  t2 = model->dense(model->dense(t2, hidden_dim, AC_MODE_RELU, false /*bias*/),
-                    hidden_dim,
-                    AC_MODE_NONE,
-                    false /*bias*/);
-  output1 = t1;
-  output2 = t2;
-}
-
-TransformerConfig::TransformerConfig(void) {
-  hidden_size = 1024;
-  embedding_size = 1024;
-  num_heads = 16;
-  num_layers = 12;
-  sequence_length = 512;
-}
-
-void parse_input_args(char **argv, int argc, TransformerConfig &config) {
-  for (int i = 1; i < argc; i++) {
-    if (!strcmp(argv[i], "--num-layers")) {
-      config.num_layers = atoi(argv[++i]);
-      continue;
-    }
-    if (!strcmp(argv[i], "--embedding-size")) {
-      config.embedding_size = atoi(argv[++i]);
-      continue;
-    }
-    if (!strcmp(argv[i], "--hidden-size")) {
-      config.hidden_size = atoi(argv[++i]);
-      continue;
-    }
-    if (!strcmp(argv[i], "--num-heads")) {
-      config.num_heads = atoi(argv[++i]);
-      continue;
-    }
-    if (!strcmp(argv[i], "--sequence-length")) {
-      config.sequence_length = atoi(argv[++i]);
-      continue;
-    }
-  }
-}
-
-void FlexFlow::top_level_task(Task const *task,
-                              std::vector<PhysicalRegion> const &regions,
-                              Context ctx,
-                              Runtime *runtime) {
-  FFConfig ffConfig;
-  TransformerConfig tfConfig;
-  {
-    InputArgs const &command_args = HighLevelRuntime::get_input_args();
-    char **argv = command_args.argv;
-    int argc = command_args.argc;
-    parse_input_args(argv, argc, tfConfig);
-    log_app.print("batchSize(%d) workersPerNodes(%d) numNodes(%d)",
-                  ffConfig.batchSize,
-                  ffConfig.workersPerNode,
-                  ffConfig.numNodes);
-    log_app.print("Hidden Size(%d)", tfConfig.hidden_size);
-    log_app.print("Embedding Vocab Size(%d)", tfConfig.embedding_size);
-    log_app.print("Number of Heads(%d)", tfConfig.num_heads);
-    log_app.print("Number of Layers(%d)", tfConfig.num_layers);
-    log_app.print("Sequence Length(%d)", tfConfig.sequence_length);
-  }
-  FFModel ff(ffConfig);
-  Tensor input;
-  {
-    int const dims[] = {
-        ffConfig.batchSize, tfConfig.sequence_length, tfConfig.hidden_size};
-    input = ff.create_tensor<3>(dims, DT_FLOAT);
-  }
-  // Tensor t = create_emb(&ff, input, tfConfig.embedding_size,
-  // tfConfig.hidden_size); Tensor input1 = input, input2 = input; Tensor t1,
-  // t2;
-  Tensor t = input;
-  for (int i = 0; i < tfConfig.num_layers; i++) {
-    t = create_attention_encoder(&ff,
-                                 t,
-                                 tfConfig.hidden_size,
-                                 tfConfig.num_heads,
-                                 tfConfig.hidden_size / tfConfig.num_heads,
-                                 tfConfig.hidden_size / tfConfig.num_heads);
-    // create_attention_encoder_decoder(&ff, input1, input2, t1, t2,
-    //     tfConfig.hidden_size, tfConfig.num_heads,
-    //     tfConfig.hidden_size / tfConfig.num_heads,
-    //     tfConfig.hidden_size / tfConfig.num_heads);
-    // input1 = t1;
-    // input2 = t2;
-  }
-  t = ff.dense(t, 1, AC_MODE_NONE, false /*bias*/);
-  Optimizer *optimizer = new SGDOptimizer(&ff, 0.01f);
-  std::vector<MetricsType> metrics;
-  // metrics.push_back(METRICS_ACCURACY);
-  // metrics.push_back(METRICS_MEAN_SQUARED_ERROR);
-  ff.compile(optimizer, LOSS_MEAN_SQUARED_ERROR_AVG_REDUCE, metrics, CompMode::COMP_MODE_INFERENCE);
-  // Data Loader
-  DataLoader loader(ff, tfConfig, input, ff.label_tensor);
-  loader.next_batch(ff);
-  loader.reset();
-  ff.init_operators();
-
-  // Start timer
-  {
-    runtime->issue_execution_fence(ctx);
-    TimingLauncher timer(MEASURE_MICRO_SECONDS);
-    Future future = runtime->issue_timing_measurement(ctx, timer);
-    future.get_void_result();
-  }
-  log_app.print("Warmup finished...Start timer...");
-  log_app.print("Num. epochs = %d", ffConfig.epochs);
-  log_app.print("Num. iterations/epoch = %d",
-                loader.num_samples / ffConfig.batchSize);
-  printf("parameters.size() = %lu\n", ff.parameters.size());
-  double ts_start = Realm::Clock::current_time_in_microseconds();
-  int epoch=0;
-  //for (int epoch = 0; epoch < ffConfig.epochs; epoch++) {
-    loader.reset();
-    ff.reset_metrics();
-    int iterations = loader.num_samples / ffConfig.batchSize;
-    for (int iter = 0; iter < iterations; iter++) {
-      // Only load data once for random input
-      if (iter == 0 && epoch == 0)
-        loader.next_batch(ff);
-      runtime->begin_trace(ctx, 111 /*trace_id*/);
-      ff.forward();
-      //ff.zero_gradients();
-      //ff.backward();
-      //ff.update();
-      runtime->end_trace(ctx, 111 /*trace_id*/);
-    }
-  //}
-  // End timer
-  {
-    runtime->issue_execution_fence(ctx);
-    TimingLauncher timer(MEASURE_MICRO_SECONDS);
-    Future future = runtime->issue_timing_measurement(ctx, timer);
-    future.get_void_result();
-  }
-  double ts_end = Realm::Clock::current_time_in_microseconds();
-  double run_time = 1e-6 * (ts_end - ts_start);
-  printf("ELAPSED TIME = %.4fs, THROUGHPUT = %.2f samples/s\n",
-         run_time,
-         loader.num_samples * ffConfig.epochs / run_time);
-}
-
-DataLoader::DataLoader(FFModel &ff,
-                       TransformerConfig const &tf,
-                       Tensor const &_input,
-                       Tensor const &_label) {
-  Context ctx = ff.config.lg_ctx;
-  Runtime *runtime = ff.config.lg_hlr;
-  num_samples = 0;
-  log_app.print("Use random dataset...");
-  num_samples =
-      ff.config.batchSize * ff.config.workersPerNode * ff.config.numNodes;
-  log_app.print("Number of random samples = %d\n", num_samples);
-  return;
-  {
-    batch_input = _input;
-    int const dims[] = {num_samples, tf.sequence_length, tf.hidden_size};
-    full_input = ff.create_tensor<3>(dims, DT_FLOAT);
-  }
-  {
-    batch_label = _label;
-    int const dims[] = {num_samples, tf.sequence_length, 1};
-    full_label = ff.create_tensor<3>(dims, DT_FLOAT);
-  }
-  // Load entire dataset
-  // TODO: Use index launcher instead of task launcher
-  TaskLauncher launcher(CUSTOM_CPU_TASK_ID_1, TaskArgument(NULL, 0));
-  // regions[0]: full_sparse_input
-  launcher.add_region_requirement(
-      RegionRequirement(full_input->parallel_tensor->region,
-                        WRITE_ONLY,
-                        EXCLUSIVE,
-                        full_input->parallel_tensor->region,
-                        MAP_TO_FB_MEMORY));
-  launcher.add_field(0, FID_DATA);
-  // regions[1]: full_label
-  launcher.add_region_requirement(
-      RegionRequirement(full_label->parallel_tensor->region,
-                        WRITE_ONLY,
-                        EXCLUSIVE,
-                        full_label->parallel_tensor->region,
-                        MAP_TO_ZC_MEMORY));
-  launcher.add_field(1, FID_DATA);
-  runtime->execute_task(ctx, launcher);
-}
-
-void DataLoader::load_entire_dataset(Task const *task,
-                                     std::vector<PhysicalRegion> const &regions,
-                                     Context ctx,
-                                     Runtime *runtime) {
-  assert(regions.size() == 2);
-  assert(task->regions.size() == 2);
-  // Note that these instances are in ZCM, can only use
-  // TensorAccessorW with readOutput flag
-  AccessorWO<float, 3> const acc_input(regions[0], FID_DATA);
-  AccessorWO<float, 3> const acc_label(regions[1], FID_DATA);
-  Rect<3> rect_input = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  Rect<3> rect_label = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  assert(acc_input.accessor.is_dense_arbitrary(rect_input));
-  assert(acc_label.accessor.is_dense_arbitrary(rect_label));
-  float *input_ptr = acc_input.ptr(rect_input.lo);
-  float *label_ptr = acc_label.ptr(rect_label.lo);
-  // assert(rect_input == rect_label);
-
-  for (size_t i = 0; i < rect_input.volume(); i++)
-    input_ptr[i] = ((float)std::rand()) / RAND_MAX;
-  for (size_t i = 0; i < rect_label.volume(); i++)
-    label_ptr[i] = std::rand() % 2;
-}
-
-void DataLoader::next_batch(FFModel &ff) {
-  return;
-  Context ctx = ff.config.lg_ctx;
-  Runtime *runtime = ff.config.lg_hlr;
-  // Load Input
-  {
-    Domain domain = runtime->get_index_space_domain(
-        ctx, batch_input->parallel_tensor->parallel_is);
-    ArgumentMap argmap;
-    int idx = next_index;
-    for (Domain::DomainPointIterator it(domain); it; it++) {
-      SampleIdxs meta;
-      assert(ff.config.batchSize % batch_input->parallel_tensor->dims[2].size ==
-             0);
-      meta.num_samples =
-          ff.config.batchSize / batch_input->parallel_tensor->dims[2].size;
-      for (int i = 0; i < meta.num_samples; i++)
-        meta.idxs[i] = idx++;
-      argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
-    }
-    IndexLauncher launcher(CUSTOM_GPU_TASK_ID_2,
-                           batch_input->parallel_tensor->parallel_is,
-                           TaskArgument(NULL, 0),
-                           argmap,
-                           Predicate::TRUE_PRED,
-                           false /*must*/,
-                           0 /*mapper_id*/,
-                           batch_input->parallel_tensor->machine_view.hash());
-    // Full dataset in ZCM
-    launcher.add_region_requirement(
-        RegionRequirement(full_input->parallel_tensor->region,
-                          0 /*projection id*/,
-                          READ_ONLY,
-                          EXCLUSIVE,
-                          full_input->parallel_tensor->region,
-                          MAP_TO_ZC_MEMORY));
-    launcher.add_field(0, FID_DATA);
-    launcher.add_region_requirement(
-        RegionRequirement(batch_input->parallel_tensor->part,
-                          0 /*projection id*/,
-                          WRITE_ONLY,
-                          EXCLUSIVE,
-                          batch_input->parallel_tensor->region));
-    launcher.add_field(1, FID_DATA);
-    runtime->execute_index_space(ctx, launcher);
-  }
-  // Load Labels
-  {
-    Domain domain = runtime->get_index_space_domain(
-        ctx, batch_label->parallel_tensor->parallel_is);
-    ArgumentMap argmap;
-    int idx = next_index;
-    for (Domain::DomainPointIterator it(domain); it; it++) {
-      SampleIdxs meta;
-      assert(ff.config.batchSize % batch_label->parallel_tensor->dims[2].size ==
-             0);
-      meta.num_samples =
-          ff.config.batchSize / batch_label->parallel_tensor->dims[2].size;
-      for (int i = 0; i < meta.num_samples; i++)
-        meta.idxs[i] = idx++;
-      argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
-    }
-    IndexLauncher launcher(CUSTOM_GPU_TASK_ID_2,
-                           batch_label->parallel_tensor->parallel_is,
-                           TaskArgument(NULL, 0),
-                           argmap,
-                           Predicate::TRUE_PRED,
-                           false /*must*/,
-                           0 /*mapper_id*/,
-                           batch_label->parallel_tensor->machine_view.hash());
-    // Full dataset in ZCM
-    launcher.add_region_requirement(
-        RegionRequirement(full_label->parallel_tensor->region,
-                          0 /*projection id*/,
-                          READ_ONLY,
-                          EXCLUSIVE,
-                          full_label->parallel_tensor->region,
-                          MAP_TO_ZC_MEMORY));
-    launcher.add_field(0, FID_DATA);
-    launcher.add_region_requirement(
-        RegionRequirement(batch_label->parallel_tensor->part,
-                          0 /*projection id*/,
-                          WRITE_ONLY,
-                          EXCLUSIVE,
-                          batch_label->parallel_tensor->region));
-    launcher.add_field(1, FID_DATA);
-    runtime->execute_index_space(ctx, launcher);
-  }
-  // progress next_index
-  next_index += ff.config.batchSize;
-}
-
-void DataLoader::reset() {
-  next_index = 0;
-}
-
-void FlexFlow::register_custom_tasks() {
-  // Load entire dataset
-  {
-    TaskVariantRegistrar registrar(CUSTOM_CPU_TASK_ID_1, "Load Entire Dataset");
-    registrar.add_constraint(ProcessorConstraint(Processor::LOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<DataLoader::load_entire_dataset>(
-        registrar, "Load Entire Dataset Task");
-  }
-  // Load input
-  {
-    TaskVariantRegistrar registrar(CUSTOM_GPU_TASK_ID_2, "Load Inputs");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<DataLoader::load_input>(
-        registrar, "Load Inputs Task");
-  }
-}
diff --git a/examples/cpp/inference/Transformer/transformer.cu b/examples/cpp/inference/Transformer/transformer.cu
deleted file mode 100644
index 7da473e54c..0000000000
--- a/examples/cpp/inference/Transformer/transformer.cu
+++ /dev/null
@@ -1,58 +0,0 @@
-/* Copyright 2021 Stanford, Facebook
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "flexflow/utils/cuda_helper.h"
-#include "transformer.h"
-
-void DataLoader::load_input(Task const *task,
-                            std::vector<PhysicalRegion> const &regions,
-                            Context ctx,
-                            Runtime *runtime) {
-  assert(regions.size() == 2);
-  assert(task->regions.size() == 2);
-  SampleIdxs *meta = (SampleIdxs *)task->local_args;
-  TensorAccessorR<float, 3> acc_full_input(
-      regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  TensorAccessorW<float, 3> acc_batch_input(regions[1],
-                                            task->regions[1],
-                                            FID_DATA,
-                                            ctx,
-                                            runtime,
-                                            false /*readOutput*/);
-  int batch_size = acc_batch_input.rect.hi[2] - acc_batch_input.rect.lo[2] + 1;
-  int embed_size = acc_batch_input.rect.hi[0] - acc_batch_input.rect.lo[0] + 1;
-  int seq_length = acc_batch_input.rect.hi[1] - acc_batch_input.rect.lo[1] + 1;
-  assert(acc_batch_input.rect.hi[0] == acc_full_input.rect.hi[0]);
-  assert(acc_batch_input.rect.lo[0] == acc_full_input.rect.lo[0]);
-  assert(acc_batch_input.rect.hi[1] == acc_full_input.rect.hi[1]);
-  assert(acc_batch_input.rect.lo[1] == acc_full_input.rect.lo[1]);
-
-  float *input_zc;
-  checkCUDA(cudaHostAlloc(&input_zc,
-                          sizeof(float) * acc_batch_input.rect.volume(),
-                          cudaHostAllocPortable | cudaHostAllocMapped));
-  assert(batch_size == meta->num_samples);
-  for (int i = 0; i < batch_size; i++) {
-    int base_offset = meta->idxs[i] * embed_size * seq_length;
-    for (int j = 0; j < embed_size * seq_length; j++)
-      input_zc[i * embed_size * seq_length + j] =
-          acc_full_input.ptr[base_offset + j];
-  }
-  checkCUDA(cudaMemcpy(acc_batch_input.ptr,
-                       input_zc,
-                       sizeof(float) * acc_batch_input.rect.volume(),
-                       cudaMemcpyHostToDevice));
-  checkCUDA(cudaFreeHost(input_zc));
-}
diff --git a/examples/cpp/inference/Transformer/transformer.h b/examples/cpp/inference/Transformer/transformer.h
deleted file mode 100644
index 551a9eff19..0000000000
--- a/examples/cpp/inference/Transformer/transformer.h
+++ /dev/null
@@ -1,54 +0,0 @@
-/* Copyright 2021 Facebook, Stanford
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "flexflow/model.h"
-#define MAX_NUM_SAMPLES 65536
-
-using namespace Legion;
-using namespace FlexFlow;
-
-struct TransformerConfig {
-  TransformerConfig(void);
-  int hidden_size, embedding_size, num_heads, num_layers, sequence_length;
-};
-
-class DataLoader {
-public:
-  DataLoader(FFModel &ff,
-             TransformerConfig const &tf,
-             Tensor const &_input,
-             Tensor const &_label);
-  void next_batch(FFModel &ff);
-  void reset();
-  static void load_entire_dataset(Task const *task,
-                                  std::vector<PhysicalRegion> const &regions,
-                                  Context ctx,
-                                  Runtime *runtime);
-  static void load_input(Task const *task,
-                         std::vector<PhysicalRegion> const &regions,
-                         Context ctx,
-                         Runtime *runtime);
-
-public:
-  int num_samples, next_index;
-
-private:
-  Tensor full_input, batch_input, full_label, batch_label;
-};
-
-struct SampleIdxs {
-  int num_samples;
-  int idxs[MAX_NUM_SAMPLES];
-};

From 4a0a70ef67f0031a55bcfc4a14258e7d7bcd4b3d Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 17 Jan 2023 21:10:16 -0500
Subject: [PATCH 041/344] Revert "make inference functions return futuremaps"

This reverts commit ee16d6dd1b14c7ad7fa1681b02b8a1b597cb8751.
---
 include/flexflow/operator.h           | 10 +++++-----
 include/flexflow/ops/aggregate.h      |  9 ++++-----
 include/flexflow/ops/aggregate_spec.h | 10 +++++-----
 include/flexflow/ops/attention.h      |  9 ++++-----
 include/flexflow/ops/element_binary.h |  9 ++++-----
 include/flexflow/ops/groupby.h        |  9 ++++-----
 include/flexflow/ops/layer_norm.h     | 10 +++++-----
 include/flexflow/ops/linear.h         | 10 +++++-----
 include/flexflow/ops/topk.h           |  9 ++++-----
 src/ops/aggregate.cc                  | 10 +++++-----
 src/ops/aggregate_spec.cc             | 11 +++++------
 src/ops/attention.cc                  |  4 ++--
 src/ops/element_binary.cc             | 11 +++++------
 src/ops/group_by.cc                   | 10 +++++-----
 src/ops/layer_norm.cc                 | 10 +++++-----
 src/ops/linear.cc                     | 10 +++++-----
 src/ops/topk.cc                       | 10 +++++-----
 17 files changed, 77 insertions(+), 84 deletions(-)

diff --git a/include/flexflow/operator.h b/include/flexflow/operator.h
index 94304784c9..a276f0fd74 100644
--- a/include/flexflow/operator.h
+++ b/include/flexflow/operator.h
@@ -8,7 +8,7 @@
 #include <vector>
 
 namespace FlexFlow {
-using Legion::FutureMap;
+
 extern LegionRuntime::Logger::Category log_measure;
 
 class OpMeta;
@@ -188,10 +188,10 @@ class Op {
   virtual void forward(FFModel const &) = 0;
   virtual void backward(FFModel const &) = 0;
   // Pure virtual functions for inference
-  virtual FutureMap inference(FFModel const &,
-                              std::vector<ParallelTensor> const &,
-                              std::vector<ParallelTensor> const &,
-                              MachineView const *mv = nullptr) {
+  virtual void inference(FFModel const &,
+                         std::vector<ParallelTensor> const &,
+                         std::vector<ParallelTensor> const &,
+                         MachineView const *mv = nullptr) {
     assert(false);
   };
   virtual void print_layer(FFModel const &model) = 0;
diff --git a/include/flexflow/ops/aggregate.h b/include/flexflow/ops/aggregate.h
index 5f73b8f7b3..6e4dd0b4ac 100644
--- a/include/flexflow/ops/aggregate.h
+++ b/include/flexflow/ops/aggregate.h
@@ -5,7 +5,6 @@
 #include "flexflow/ops/aggregate_params.h"
 
 namespace FlexFlow {
-using Legion::FutureMap;
 
 #define AGGREGATE_MAX_K 4
 #define AGGREGATE_MAX_BATCH_SIZE 64
@@ -37,10 +36,10 @@ class Aggregate : public Op {
             char const *name = nullptr);
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
-  FutureMap inference(FFModel const &,
-                      std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &,
-                      MachineView const *mv = nullptr) override;
+  void inference(FFModel const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &,
+                 MachineView const *mv = nullptr) override;
   void backward(FFModel const &) override;
   void print_layer(FFModel const &model) override {
     assert(0);
diff --git a/include/flexflow/ops/aggregate_spec.h b/include/flexflow/ops/aggregate_spec.h
index 21ade888a4..816574ced0 100644
--- a/include/flexflow/ops/aggregate_spec.h
+++ b/include/flexflow/ops/aggregate_spec.h
@@ -5,7 +5,7 @@
 #include "flexflow/ops/aggregate_spec_params.h"
 
 namespace FlexFlow {
-using Legion::FutureMap;
+
 #define AGGREGATE_SPEC_MAX_K 4
 #define AGGREGATE_SPEC_MAX_BATCH_SIZE 32
 #define AGGREGATE_SPEC_MAX_N 12
@@ -28,10 +28,10 @@ class AggregateSpec : public Op {
                 char const *name);
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
-  FutureMap inference(FFModel const &,
-                      std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &,
-                      MachineView const *mv = nullptr) override;
+  void inference(FFModel const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &,
+                 MachineView const *mv = nullptr) override;
   void backward(FFModel const &) override;
   void print_layer(FFModel const &model) override {
     assert(0);
diff --git a/include/flexflow/ops/attention.h b/include/flexflow/ops/attention.h
index fe870579b3..1531708bb7 100644
--- a/include/flexflow/ops/attention.h
+++ b/include/flexflow/ops/attention.h
@@ -10,7 +10,6 @@
 #include "flexflow/ops/attention_params.h"
 
 namespace FlexFlow {
-using Legion::FutureMap;
 
 class MultiHeadAttentionMeta;
 
@@ -67,10 +66,10 @@ class MultiHeadAttention : public Op {
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
-  FutureMap inference(FFModel const &,
-                      std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &,
-                      MachineView const *mv = nullptr) override;
+  void inference(FFModel const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &,
+                 MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
diff --git a/include/flexflow/ops/element_binary.h b/include/flexflow/ops/element_binary.h
index 593e229653..2f081f1b7e 100644
--- a/include/flexflow/ops/element_binary.h
+++ b/include/flexflow/ops/element_binary.h
@@ -7,7 +7,6 @@
 #include "flexflow/ops/element_binary_params.h"
 
 namespace FlexFlow {
-using Legion::FutureMap;
 
 class ElementBinary : public Op {
 public:
@@ -28,10 +27,10 @@ class ElementBinary : public Op {
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
-  FutureMap inference(FFModel const &,
-                      std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &,
-                      MachineView const *mv = nullptr) override;
+  void inference(FFModel const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &,
+                 MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
diff --git a/include/flexflow/ops/groupby.h b/include/flexflow/ops/groupby.h
index 88e1df3ee9..44e03ec6e3 100644
--- a/include/flexflow/ops/groupby.h
+++ b/include/flexflow/ops/groupby.h
@@ -6,7 +6,6 @@
 #include "flexflow/ops/groupby_params.h"
 
 namespace FlexFlow {
-using Legion::FutureMap;
 
 class GroupByMeta : public OpMeta {
 public:
@@ -36,10 +35,10 @@ class Group_by : public Op {
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
-  FutureMap inference(FFModel const &,
-                      std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &,
-                      MachineView const *mv = nullptr) override;
+  void inference(FFModel const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &,
+                 MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
diff --git a/include/flexflow/ops/layer_norm.h b/include/flexflow/ops/layer_norm.h
index 9b43a40e3c..c05461acdf 100644
--- a/include/flexflow/ops/layer_norm.h
+++ b/include/flexflow/ops/layer_norm.h
@@ -3,7 +3,7 @@
 #include "flexflow/model.h"
 
 namespace FlexFlow {
-using Legion::FutureMap;
+
 class LayerNormMeta;
 
 class LayerNorm : public Op {
@@ -26,10 +26,10 @@ class LayerNorm : public Op {
   void init(FFModel const &);
   void forward(FFModel const &);
   void backward(FFModel const &);
-  FutureMap inference(FFModel const &,
-                      std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &,
-                      MachineView const *mv = nullptr) override;
+  void inference(FFModel const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &,
+                 MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) {
     assert(0);
   }
diff --git a/include/flexflow/ops/linear.h b/include/flexflow/ops/linear.h
index 6247dc7f76..ab1c1febc5 100644
--- a/include/flexflow/ops/linear.h
+++ b/include/flexflow/ops/linear.h
@@ -6,7 +6,7 @@
 #include "flexflow/ops/linear_params.h"
 
 namespace FlexFlow {
-using Legion::FutureMap;
+
 class FFModel;
 class Layer;
 
@@ -37,10 +37,10 @@ class Linear : public Op {
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
-  FutureMap inference(FFModel const &,
-                      std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &,
-                      MachineView const *mv = nullptr) override;
+  void inference(FFModel const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &,
+                 MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override;
   bool get_int_parameter(PMParameter, int *) const override;
   static Op *
diff --git a/include/flexflow/ops/topk.h b/include/flexflow/ops/topk.h
index 5c3f12d294..af62f51c93 100644
--- a/include/flexflow/ops/topk.h
+++ b/include/flexflow/ops/topk.h
@@ -6,7 +6,6 @@
 #include "flexflow/ops/topk_params.h"
 
 namespace FlexFlow {
-using Legion::FutureMap;
 
 class TopKMeta : public OpMeta {
 public:
@@ -31,10 +30,10 @@ class TopK : public Op {
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
-  FutureMap inference(FFModel const &,
-                      std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &,
-                      MachineView const *mv = nullptr) override;
+  void inference(FFModel const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &,
+                 MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
diff --git a/src/ops/aggregate.cc b/src/ops/aggregate.cc
index 941c6da8cb..19ed275b5c 100644
--- a/src/ops/aggregate.cc
+++ b/src/ops/aggregate.cc
@@ -246,10 +246,10 @@ void Aggregate::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-FutureMap Aggregate::inference(FFModel const &ff,
-                               std::vector<ParallelTensor> const &batch_inputs,
-                               std::vector<ParallelTensor> const &batch_outputs,
-                               MachineView const *mv) {
+void Aggregate::inference(FFModel const &ff,
+                          std::vector<ParallelTensor> const &batch_inputs,
+                          std::vector<ParallelTensor> const &batch_outputs,
+                          MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
@@ -295,7 +295,7 @@ FutureMap Aggregate::inference(FFModel const &ff,
                                                     EXCLUSIVE,
                                                     batch_outputs[0]->region));
   launcher.add_field(n + 2, FID_DATA);
-  return runtime->execute_index_space(ctx, launcher);
+  runtime->execute_index_space(ctx, launcher);
 }
 
 void Aggregate::forward_task(Task const *task,
diff --git a/src/ops/aggregate_spec.cc b/src/ops/aggregate_spec.cc
index 4ce863cb50..1e3d66fdee 100644
--- a/src/ops/aggregate_spec.cc
+++ b/src/ops/aggregate_spec.cc
@@ -232,11 +232,10 @@ void AggregateSpec::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-FutureMap
-    AggregateSpec::inference(FFModel const &ff,
-                             std::vector<ParallelTensor> const &batch_inputs,
-                             std::vector<ParallelTensor> const &batch_outputs,
-                             MachineView const *mv) {
+void AggregateSpec::inference(FFModel const &ff,
+                              std::vector<ParallelTensor> const &batch_inputs,
+                              std::vector<ParallelTensor> const &batch_outputs,
+                              MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
@@ -282,7 +281,7 @@ FutureMap
                                                     EXCLUSIVE,
                                                     batch_outputs[0]->region));
   launcher.add_field(n + 2, FID_DATA);
-  return runtime->execute_index_space(ctx, launcher);
+  runtime->execute_index_space(ctx, launcher);
 }
 
 void AggregateSpec::forward_task(Task const *task,
diff --git a/src/ops/attention.cc b/src/ops/attention.cc
index 57d945c2b3..d9ee14ecb6 100644
--- a/src/ops/attention.cc
+++ b/src/ops/attention.cc
@@ -523,7 +523,7 @@ void MultiHeadAttention::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-FutureMap MultiHeadAttention::inference(
+void MultiHeadAttention::inference(
     FFModel const &ff,
     std::vector<ParallelTensor> const &batch_inputs,
     std::vector<ParallelTensor> const &batch_outputs,
@@ -572,7 +572,7 @@ FutureMap MultiHeadAttention::inference(
                                                     EXCLUSIVE,
                                                     batch_outputs[0]->region));
   launcher.add_field(4, FID_DATA);
-  return runtime->execute_index_space(ctx, launcher);
+  runtime->execute_index_space(ctx, launcher);
 }
 
 /*
diff --git a/src/ops/element_binary.cc b/src/ops/element_binary.cc
index 9214113ccc..feb1862b04 100644
--- a/src/ops/element_binary.cc
+++ b/src/ops/element_binary.cc
@@ -424,11 +424,10 @@ void ElementBinary::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-FutureMap
-    ElementBinary::inference(FFModel const &ff,
-                             std::vector<ParallelTensor> const &batch_inputs,
-                             std::vector<ParallelTensor> const &batch_outputs,
-                             MachineView const *mv) {
+void ElementBinary::inference(FFModel const &ff,
+                              std::vector<ParallelTensor> const &batch_inputs,
+                              std::vector<ParallelTensor> const &batch_outputs,
+                              MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
@@ -494,7 +493,7 @@ FutureMap
       launcher.add_field(2, FID_DATA);
     }
   }
-  return runtime->execute_index_space(ctx, launcher);
+  runtime->execute_index_space(ctx, launcher);
 }
 
 /*
diff --git a/src/ops/group_by.cc b/src/ops/group_by.cc
index 33038d69c3..b341f004ac 100644
--- a/src/ops/group_by.cc
+++ b/src/ops/group_by.cc
@@ -261,10 +261,10 @@ void Group_by::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-FutureMap Group_by::inference(FFModel const &ff,
-                              std::vector<ParallelTensor> const &batch_inputs,
-                              std::vector<ParallelTensor> const &batch_outputs,
-                              MachineView const *mv) {
+void Group_by::inference(FFModel const &ff,
+                         std::vector<ParallelTensor> const &batch_inputs,
+                         std::vector<ParallelTensor> const &batch_outputs,
+                         MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
@@ -304,7 +304,7 @@ FutureMap Group_by::inference(FFModel const &ff,
     launcher.add_field(i + 2, FID_DATA);
   }
 
-  return runtime->execute_index_space(ctx, launcher);
+  runtime->execute_index_space(ctx, launcher);
 }
 
 void Group_by::forward_task(Task const *task,
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index 02dd519780..bec6f7d651 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -278,10 +278,10 @@ void LayerNorm::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-FutureMap LayerNorm::inference(FFModel const &ff,
-                               std::vector<ParallelTensor> const &batch_inputs,
-                               std::vector<ParallelTensor> const &batch_outputs,
-                               MachineView const *mv) {
+void LayerNorm::inference(FFModel const &ff,
+                          std::vector<ParallelTensor> const &batch_inputs,
+                          std::vector<ParallelTensor> const &batch_outputs,
+                          MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
@@ -321,7 +321,7 @@ FutureMap LayerNorm::inference(FFModel const &ff,
                                                       weights[1]->region));
     launcher.add_field(3, FID_DATA);
   }
-  return runtime->execute_index_space(ctx, launcher);
+  runtime->execute_index_space(ctx, launcher);
 }
 
 /*
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index 49560fc20f..435080dbe1 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -367,10 +367,10 @@ void Linear::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-FutureMap Linear::inference(FFModel const &ff,
-                            std::vector<ParallelTensor> const &batch_inputs,
-                            std::vector<ParallelTensor> const &batch_outputs,
-                            MachineView const *mv) {
+void Linear::inference(FFModel const &ff,
+                       std::vector<ParallelTensor> const &batch_inputs,
+                       std::vector<ParallelTensor> const &batch_outputs,
+                       MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
@@ -410,7 +410,7 @@ FutureMap Linear::inference(FFModel const &ff,
                                                       weights[1]->region));
     launcher.add_field(3, FID_DATA);
   }
-  return runtime->execute_index_space(ctx, launcher);
+  runtime->execute_index_space(ctx, launcher);
 }
 
 void Linear::forward_task(Task const *task,
diff --git a/src/ops/topk.cc b/src/ops/topk.cc
index 52b54711cb..ec6da77a31 100644
--- a/src/ops/topk.cc
+++ b/src/ops/topk.cc
@@ -220,10 +220,10 @@ void TopK::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-FutureMap TopK::inference(FFModel const &ff,
-                          std::vector<ParallelTensor> const &batch_inputs,
-                          std::vector<ParallelTensor> const &batch_outputs,
-                          MachineView const *mv) {
+void TopK::inference(FFModel const &ff,
+                     std::vector<ParallelTensor> const &batch_inputs,
+                     std::vector<ParallelTensor> const &batch_outputs,
+                     MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
@@ -255,7 +255,7 @@ FutureMap TopK::inference(FFModel const &ff,
                                                     EXCLUSIVE,
                                                     batch_outputs[1]->region));
   launcher.add_field(2, FID_DATA);
-  return runtime->execute_index_space(ctx, launcher);
+  runtime->execute_index_space(ctx, launcher);
 }
 
 void TopK::forward_task(Task const *task,

From 17585d342565da8ba2a2ef3903d6e5ef8f8daaad Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 17 Jan 2023 23:24:57 -0500
Subject: [PATCH 042/344] post-rebase cleanup

---
 .../cpp/inference/mixture_of_experts/moe.cc   | 228 +++++++++++-------
 .../cpp/inference/mixture_of_experts/moe.cu   |  29 ++-
 .../cpp/inference/mixture_of_experts/moe.h    |  35 ++-
 .../inference/mixture_of_experts/run_moe.sh   |  11 -
 include/flexflow/ops/groupby.h                |   6 +-
 src/ops/aggregate.cc                          |   9 +-
 src/ops/group_by.cc                           |  21 +-
 src/ops/group_by.cpp                          |  37 +--
 src/ops/group_by.cu                           |  19 +-
 9 files changed, 212 insertions(+), 183 deletions(-)
 delete mode 100644 examples/cpp/inference/mixture_of_experts/run_moe.sh

diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index 459ffb42b5..7d6e1fddee 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -1,4 +1,4 @@
-/* Copyright 2020 Stanford
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
  *
  * Licensed under the Apache License, Version 2.0 (the "License");
  * you may not use this file except in compliance with the License.
@@ -20,19 +20,9 @@
 #include <sstream>
 #include <string>
 
-#define NUM_SAMPLES 60000
-#define TRAIN_SAMPLES 60000
-#define TEST_SAMPLES 00000
-#define MNIST_DIMS 28 * 28
-#define CIFAR_DIMS 3 * 32 * 32
-#define DATA_DIMS MNIST_DIMS
-#define OUT_DIM 10
-
 using namespace Legion;
 
 LegionRuntime::Logger::Category log_app("MoE");
-int num_exp = 4;
-int num_select = 2;
 
 void parse_input_args(char **argv, int argc, MoeConfig &config) {
   for (int i = 1; i < argc; i++) {
@@ -46,12 +36,8 @@ void parse_input_args(char **argv, int argc, MoeConfig &config) {
 Tensor create_moe(FFModel *model,
                   MoeConfig const *moeConfig,
                   Tensor const &input) {
-  float alpha = 2.0f;   // factor overhead tensor size for imbalance
-  float lambda = 0.04f; // multiplier for load balance term
-
   // MoE model
-  Tensor gate_preds = model->dense(input, 64, AC_MODE_RELU);
-  gate_preds = model->dense(gate_preds, num_exp, AC_MODE_RELU);
+  Tensor gate_preds = model->dense(input, num_exp, AC_MODE_RELU);
   Tensor topK_output[2];
   model->top_k(gate_preds, topK_output, num_select, false);
   Tensor agg_inputs[num_exp + 4];
@@ -72,7 +58,7 @@ Tensor create_moe(FFModel *model,
   for (int i = 0; i < num_exp + 4; i++) {
     agg_inputs[i]->print("agg_inputs[i]");
   }
-  Tensor coop_output = model->aggregate(agg_inputs, num_exp, lambda);
+  Tensor coop_output = model->aggregate(agg_inputs, num_exp, moeConfig->lambda);
   // model->get_metrics();
   return coop_output;
 }
@@ -138,14 +124,18 @@ void FlexFlow::top_level_task(Task const *task,
 
   //-----------------------------------------------------------------
 
-  Tensor t = create_moe_encoder(&ff, &moeConfig, input);
+  //Tensor t = create_moe_encoder(&ff, &moeConfig, input);
+  Tensor t = create_moe(&ff, &moeConfig, input);
   t = ff.dense(t, OUT_DIM, AC_MODE_RELU);
   InferenceManager im(&ff, num_requests_per_batch, num_inflight_batches);
   // im.compile_model_and_allocate_buffer();
   ff.init_operators();
 
   // Data Loader
-  // DataLoader data_loader(ff, moeConfig, input, ff.label_tensor);
+  ParallelTensor input_pt, label_pt;
+  ff.get_parallel_tensor_from_tensor(input, input_pt);
+  ff.get_parallel_tensor_from_tensor(ff.label_tensor, label_pt);
+  DataLoader data_loader(ff, moeConfig, input_pt, label_pt);
 
   //-----------------------------------------------------------------
 
@@ -194,8 +184,8 @@ void FlexFlow::top_level_task(Task const *task,
 
 DataLoader::DataLoader(FFModel &ff,
                        MoeConfig const &moe,
-                       Tensor input,
-                       Tensor label) {
+                       ParallelTensor input,
+                       ParallelTensor label) {
   num_samples = NUM_SAMPLES;
 
   Context ctx = ff.config.lg_ctx;
@@ -203,37 +193,72 @@ DataLoader::DataLoader(FFModel &ff,
 
   // Create full input
   {
+    // Input has dimensions (batch_size, data_dims), which in legion ordering
+    // becomes (data_dims, batch_size). The corresponding parallel tensor will
+    // thus have dimensions (data_dims, batch_size, replica_dim). The dimensions
+    // of the full_input tensor can be obtained by replacing the batch_size with
+    // the num_samples: (data_dims, num_samples, replica_dim)
+    assert(input->num_dims == 3); // two dimensions + the replica dimension
     batch_input = input;
-    int const dims[] = {NUM_SAMPLES, DATA_DIMS};
-    full_input = ff.create_tensor<2>(dims, DT_FLOAT);
+
+    ParallelDim dims[3];
+    for (int i = 0; i < 3; i++) {
+      dims[i].size = input->dims[i].size;
+      dims[i].degree = 1;
+      dims[i].parallel_idx = -1;
+      dims[i].is_replica_dim = input->dims[i].is_replica_dim;
+      // Assume only the first dim can be the replica dim
+      assert(i == 2 || (!dims[i].is_replica_dim));
+    }
+    dims[1].size = num_samples;
+
+    full_input = ff.create_parallel_tensor_legion_ordering(3, dims, DT_FLOAT);
+    ff.map_tensor(full_input, NULL /*parallel_op*/);
   }
+
   // Create full label
   {
+    assert(label->num_dims == LABEL_DIM + 2);
     batch_label = label;
-    int const dims[] = {NUM_SAMPLES, 1};
-    full_label = ff.create_tensor<2>(dims, DT_INT32);
+
+    ParallelDim dims[LABEL_DIM + 2];
+    for (int i = 0; i < LABEL_DIM + 2; i++) {
+      dims[i].size = label->dims[i].size;
+      dims[i].degree = 1;
+      dims[i].parallel_idx = -1;
+      dims[i].is_replica_dim = label->dims[i].is_replica_dim;
+      // Assume only the last dim can be the replica dim
+      assert(i == LABEL_DIM + 1 || (!dims[i].is_replica_dim));
+    }
+    assert(dims[LABEL_DIM].size == ff.config.batchSize);
+    // replace batch size with number of samples
+    dims[LABEL_DIM].size = num_samples;
+
+    full_label = ff.create_parallel_tensor_legion_ordering(
+        LABEL_DIM + 2, dims, DT_INT32);
+    ff.map_tensor(full_label, NULL /*parallel_op*/);
   }
 
   // Load entire dataset
   // TODO: Use index launcher instead of task launcher
+  assert(full_input != nullptr && "full_input is nullptr");
+
   MoeConfig const *ptr = &moe;
   TaskLauncher launcher(CUSTOM_CPU_TASK_ID_1,
                         TaskArgument(&ptr, sizeof(MoeConfig *)));
   // regions[0]: full_input
-  launcher.add_region_requirement(
-      RegionRequirement(full_input->parallel_tensor->region,
-                        WRITE_ONLY,
-                        EXCLUSIVE,
-                        full_input->parallel_tensor->region,
-                        MAP_TO_ZC_MEMORY));
+  launcher.add_region_requirement(RegionRequirement(full_input->region,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    full_input->region,
+                                                    MAP_TO_ZC_MEMORY));
   launcher.add_field(0, FID_DATA);
   // regions[1]: full_label
-  launcher.add_region_requirement(
-      RegionRequirement(full_input->parallel_tensor->region,
-                        WRITE_ONLY,
-                        EXCLUSIVE,
-                        full_input->parallel_tensor->region,
-                        MAP_TO_ZC_MEMORY));
+  launcher.add_region_requirement(RegionRequirement(full_label->region,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    full_label->region,
+                                                    MAP_TO_ZC_MEMORY));
   launcher.add_field(1, FID_DATA);
 
   runtime->execute_task(ctx, launcher);
@@ -241,17 +266,10 @@ DataLoader::DataLoader(FFModel &ff,
   next_batch(ff);
 }
 
-__inline__ int calc_offset(int c, int y, int x, int yscale, int xscale) {
-  return (c * yscale * xscale + y * xscale + x);
-}
-
 // =================================================
 //                    Load data
 // =================================================
 
-/* NOTE: Download files from http://yann.lecun.com/exdb/mnist/, unpack to
-this directory (Flexflow/examples/cpp/mixture_of_experts) */
-
 void read_cifar100(float *input_ptr, int *label_ptr) {
   std::ifstream file;
   file.open("train.bin", std::ios::in | std::ios::binary | std::ios::ate);
@@ -288,6 +306,8 @@ int reverseInt(int i) {
   return ((int)c1 << 24) + ((int)c2 << 16) + ((int)c3 << 8) + c4;
 }
 
+/* NOTE: Download files from http://yann.lecun.com/exdb/mnist/ and unpack to
+the current working directory */
 void read_mnist(float *input_ptr, int *label_ptr) {
   // read inputs
   std::ifstream input("train-images-idx3-ubyte", std::ios::binary);
@@ -350,19 +370,23 @@ void DataLoader::load_entire_dataset(Task const *task,
   assert(task->regions.size() == regions.size());
 
   // get input and label pointer
-  AccessorWO<float, 2> const acc_input(regions[0], FID_DATA);
-  AccessorWO<int, 2> const acc_label(regions[1], FID_DATA);
-  Rect<2> rect_input = runtime->get_index_space_domain(
+  AccessorWO<float, 3> const acc_input(regions[0], FID_DATA);
+  AccessorWO<int, LABEL_DIM + 2> const acc_label(regions[1], FID_DATA);
+  Rect<3> rect_input = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
   assert(acc_input.accessor.is_dense_arbitrary(rect_input));
-  Rect<2> rect_label = runtime->get_index_space_domain(
+  Rect<LABEL_DIM + 2> rect_label = runtime->get_index_space_domain(
       ctx, task->regions[1].region.get_index_space());
   assert(acc_label.accessor.is_dense_arbitrary(rect_label));
   float *input_ptr = acc_input.ptr(rect_input.lo);
   int *label_ptr = acc_label.ptr(rect_label.lo);
+  int num_samples = rect_input.hi[1] - rect_input.lo[1] + 1;
+  assert(rect_label.hi[1] - rect_label.lo[1] + 1 == num_samples);
 
+  // here, you can call `read_cifar100(input_ptr, label_ptr);` instead or load
+  // another dataset using the dataset_path from the MoeConfig object
   read_mnist(input_ptr, label_ptr);
-  log_app.print("finish loading data\n");
+  log_app.print("finish loading MNIST data\n");
 }
 
 void DataLoader::next_batch(FFModel &ff) {
@@ -370,80 +394,100 @@ void DataLoader::next_batch(FFModel &ff) {
   Runtime *runtime = ff.config.lg_hlr;
   // Load input
   {
-    IndexSpace task_is = batch_input->parallel_tensor->parallel_is;
-    Rect<2> rect = runtime->get_index_space_domain(ctx, task_is);
+    Domain domain =
+        runtime->get_index_space_domain(ctx, batch_input->parallel_is);
     ArgumentMap argmap;
     int idx = next_index;
-    for (PointInRectIterator<2> it(rect); it(); it++) {
+    // current limitation of the dataloader: only the batch dimension can be
+    // partitioned
+    int input_dims = batch_input->num_dims;
+    for (int i = 0; i < input_dims; i++) {
+      if (i != input_dims - 2) {
+        assert(batch_input->dims[i].degree == 1 &&
+               "Dataloader only supports batch size partitions");
+      }
+    }
+    int batch_size = batch_input->dims[input_dims - 2].size;
+    int n_partitions = batch_input->dims[input_dims - 2].degree;
+    assert(ff.config.batchSize % batch_size == 0);
+    assert(batch_size % n_partitions == 0);
+    for (Domain::DomainPointIterator it(domain); it; it++) {
       SampleIdxs meta;
-      assert(ff.config.batchSize % (rect.hi[1] - rect.lo[1] + 1) == 0);
-      meta.num_samples = ff.config.batchSize / (rect.hi[1] - rect.lo[1] + 1);
-      for (int i = 0; i < meta.num_samples; i++)
+      meta.num_samples = batch_size / n_partitions;
+      for (int i = 0; i < meta.num_samples; i++) {
         meta.idxs[i] = idx++;
+      }
       argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
     }
     IndexLauncher launcher(CUSTOM_GPU_TASK_ID_1,
-                           task_is,
+                           batch_input->parallel_is,
                            TaskArgument(NULL, 0),
                            argmap,
                            Predicate::TRUE_PRED,
                            false /*must*/,
                            0 /*mapper_id*/,
-                           batch_input->parallel_tensor->machine_view.hash());
-    launcher.add_region_requirement(
-        RegionRequirement(full_input->parallel_tensor->region,
-                          0 /*projection id*/,
-                          READ_ONLY,
-                          EXCLUSIVE,
-                          full_input->parallel_tensor->region,
-                          MAP_TO_ZC_MEMORY));
+                           batch_input->machine_view.hash());
+    launcher.add_region_requirement(RegionRequirement(full_input->region,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      full_input->region,
+                                                      MAP_TO_ZC_MEMORY));
     launcher.add_field(0, FID_DATA);
-    launcher.add_region_requirement(
-        RegionRequirement(batch_input->parallel_tensor->part,
-                          0 /*projection id*/,
-                          WRITE_ONLY,
-                          EXCLUSIVE,
-                          batch_input->parallel_tensor->region));
+    launcher.add_region_requirement(RegionRequirement(batch_input->part,
+                                                      0 /*projection id*/,
+                                                      WRITE_ONLY,
+                                                      EXCLUSIVE,
+                                                      batch_input->region));
     launcher.add_field(1, FID_DATA);
     runtime->execute_index_space(ctx, launcher);
   }
   // Load label
   {
-    // IndexSpaceT<2> task_is = IndexSpaceT<2>(ff.get_or_create_task_is(2, ""));
-    IndexSpace task_is = batch_label->parallel_tensor->parallel_is;
-    Rect<2> rect = runtime->get_index_space_domain(ctx, task_is);
+    Domain domain =
+        runtime->get_index_space_domain(ctx, batch_label->parallel_is);
     ArgumentMap argmap;
     int idx = next_index;
-    for (PointInRectIterator<2> it(rect); it(); it++) {
+    // current limitation of the dataloader: only the batch dimension can be
+    // partitioned
+    int label_dims = batch_label->num_dims;
+    assert(batch_label->dims[label_dims - 1].degree == 1);
+    for (int i = 0; i < LABEL_DIM; i++) {
+      assert(batch_label->dims[i].degree == 1 &&
+             "Dataloader only supports batch size partitions");
+    }
+    int batch_size = batch_label->dims[label_dims - 2].size;
+    int n_partitions = batch_label->dims[label_dims - 2].degree;
+    assert(ff.config.batchSize % batch_size == 0);
+    assert(batch_size % n_partitions == 0);
+    for (Domain::DomainPointIterator it(domain); it; it++) {
       SampleIdxs meta;
-      assert(ff.config.batchSize % (rect.hi[1] - rect.lo[1] + 1) == 0);
-      meta.num_samples = ff.config.batchSize / (rect.hi[1] - rect.lo[1] + 1);
-      for (int i = 0; i < meta.num_samples; i++)
+      meta.num_samples = batch_size / n_partitions;
+      for (int i = 0; i < meta.num_samples; i++) {
         meta.idxs[i] = idx++;
+      }
       argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
     }
     IndexLauncher launcher(CUSTOM_GPU_TASK_ID_2,
-                           task_is,
+                           batch_label->parallel_is,
                            TaskArgument(NULL, 0),
                            argmap,
                            Predicate::TRUE_PRED,
                            false /*must*/,
                            0 /*mapper_id*/,
-                           batch_label->parallel_tensor->machine_view.hash());
-    launcher.add_region_requirement(
-        RegionRequirement(full_label->parallel_tensor->region,
-                          0 /*projection id*/,
-                          READ_ONLY,
-                          EXCLUSIVE,
-                          full_label->parallel_tensor->region,
-                          MAP_TO_ZC_MEMORY));
+                           batch_label->machine_view.hash());
+    launcher.add_region_requirement(RegionRequirement(full_label->region,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      full_label->region,
+                                                      MAP_TO_ZC_MEMORY));
     launcher.add_field(0, FID_DATA);
-    launcher.add_region_requirement(
-        RegionRequirement(batch_label->parallel_tensor->part,
-                          0 /*projection id*/,
-                          WRITE_ONLY,
-                          EXCLUSIVE,
-                          batch_label->parallel_tensor->region));
+    launcher.add_region_requirement(RegionRequirement(batch_label->part,
+                                                      0 /*projection id*/,
+                                                      WRITE_ONLY,
+                                                      EXCLUSIVE,
+                                                      batch_label->region));
     launcher.add_field(1, FID_DATA);
     runtime->execute_index_space(ctx, launcher);
   }
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cu b/examples/cpp/inference/mixture_of_experts/moe.cu
index c4224e0a49..ae1e5aca30 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cu
+++ b/examples/cpp/inference/mixture_of_experts/moe.cu
@@ -1,4 +1,4 @@
-/* Copyright 2020 Stanford
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
  *
  * Licensed under the Apache License, Version 2.0 (the "License");
  * you may not use this file except in compliance with the License.
@@ -23,9 +23,9 @@ void DataLoader::load_input(Task const *task,
   assert(regions.size() == 2);
   assert(task->regions.size() == 2);
   SampleIdxs *meta = (SampleIdxs *)task->local_args;
-  TensorAccessorR<float, 2> acc_full_input(
+  TensorAccessorR<float, 3> acc_full_input(
       regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  TensorAccessorW<float, 2> acc_batch_input(regions[1],
+  TensorAccessorW<float, 3> acc_batch_input(regions[1],
                                             task->regions[1],
                                             FID_DATA,
                                             ctx,
@@ -39,8 +39,9 @@ void DataLoader::load_input(Task const *task,
 
   // FIXME: currently assume continous indices
   assert(batch_size == meta->num_samples);
-  for (int i = 1; i < batch_size; i++)
+  for (int i = 1; i < batch_size; i++) {
     assert(meta->idxs[i] == meta->idxs[0] + i);
+  }
   coord_t start_idx = meta->idxs[0];
   float const *input_zc = acc_full_input.ptr + start_idx * sample_dim;
   copy_kernel<<<GET_BLOCKS(acc_batch_input.rect.volume()), CUDA_NUM_THREADS>>>(
@@ -55,19 +56,21 @@ void DataLoader::load_label(Task const *task,
   assert(regions.size() == 2);
   assert(task->regions.size() == 2);
   SampleIdxs *meta = (SampleIdxs *)task->local_args;
-  TensorAccessorR<int, 2> acc_full_label(
+  TensorAccessorR<int, LABEL_DIM + 2> acc_full_label(
       regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  TensorAccessorW<int, 2> acc_batch_label(regions[1],
-                                          task->regions[1],
-                                          FID_DATA,
-                                          ctx,
-                                          runtime,
-                                          false /*readOutput*/);
-  int batch_size = acc_batch_label.rect.hi[1] - acc_batch_label.rect.lo[1] + 1;
+  TensorAccessorW<int, LABEL_DIM + 2> acc_batch_label(regions[1],
+                                                      task->regions[1],
+                                                      FID_DATA,
+                                                      ctx,
+                                                      runtime,
+                                                      false /*readOutput*/);
+  coord_t batch_size =
+      acc_batch_label.rect.hi[1] - acc_batch_label.rect.lo[1] + 1;
   // FIXME: currently assume continous indices
   assert(batch_size == meta->num_samples);
-  for (int i = 1; i < meta->num_samples; i++)
+  for (int i = 1; i < meta->num_samples; i++) {
     assert(meta->idxs[i] == meta->idxs[0] + i);
+  }
   int const *input_zc = acc_full_label.ptr + meta->idxs[0];
   copy_kernel<<<GET_BLOCKS(acc_batch_label.rect.volume()), CUDA_NUM_THREADS>>>(
       acc_batch_label.ptr, input_zc, acc_batch_label.rect.volume());
diff --git a/examples/cpp/inference/mixture_of_experts/moe.h b/examples/cpp/inference/mixture_of_experts/moe.h
index d447c9fd63..a9fd2d2325 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.h
+++ b/examples/cpp/inference/mixture_of_experts/moe.h
@@ -1,4 +1,4 @@
-/* Copyright 2017 Stanford, NVIDIA
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
  *
  * Licensed under the Apache License, Version 2.0 (the "License");
  * you may not use this file except in compliance with the License.
@@ -14,14 +14,15 @@
  */
 
 #include "flexflow/model.h"
-#define MAX_NUM_SAMPLES 60000
-#define NUM_SAMPLES 60000
-#define TRAIN_SAMPLES 60000
+#define MAX_NUM_SAMPLES 1000
+#define NUM_SAMPLES 1000
+#define TRAIN_SAMPLES 1000
 #define TEST_SAMPLES 00000
 #define MNIST_DIMS 28 * 28
 #define CIFAR_DIMS 3 * 32 * 32
 #define DATA_DIMS MNIST_DIMS
 #define OUT_DIM 10
+#define LABEL_DIM 1
 
 using namespace Legion;
 using namespace std;
@@ -29,26 +30,38 @@ using namespace FlexFlow;
 
 struct MoeConfig {
   MoeConfig(void) {
-    // Set default configurations here
+    // MoE layer
+    num_exp = 5;
+    num_select = 2;
+    alpha = 2.0f;
+    lambda = 0.04f;
     hidden_size = DATA_DIMS;
+    // Encoder layer
     num_attention_heads = 16;
     attention_kdim = attention_vdim = hidden_size / num_attention_heads;
     num_encoder_layers = 6;
   }
-  std::string dataset_path;
+  // MoE layer
+  int num_exp;
+  int num_select;
+  float alpha;  // factor overhead tensor size for imbalance
+  float lambda; // multiplier for load balance term
   int hidden_size;
+  // Encoder layer
   int num_attention_heads;
   int attention_kdim;
   int attention_vdim;
   int num_encoder_layers;
+  // Dataset
+  std::string dataset_path;
 };
 
 class DataLoader {
 public:
   DataLoader(FFModel &ff,
-             MoeConfig const &alexnet,
-             Tensor _input,
-             Tensor _label);
+             MoeConfig const &moe,
+             ParallelTensor input,
+             ParallelTensor label);
   static void load_input(Task const *task,
                          std::vector<PhysicalRegion> const &regions,
                          Context ctx,
@@ -66,8 +79,8 @@ class DataLoader {
 
 public:
   int num_samples, next_index;
-  Tensor full_input, batch_input;
-  Tensor full_label, batch_label;
+  FlexFlow::ParallelTensor full_input, batch_input;
+  FlexFlow::ParallelTensor full_label, batch_label;
 };
 
 struct SampleIdxs {
diff --git a/examples/cpp/inference/mixture_of_experts/run_moe.sh b/examples/cpp/inference/mixture_of_experts/run_moe.sh
deleted file mode 100644
index 33c6c5f7fb..0000000000
--- a/examples/cpp/inference/mixture_of_experts/run_moe.sh
+++ /dev/null
@@ -1,11 +0,0 @@
-#!/bin/bash
-#SBATCH --job-name=pagerank
-#SBATCH --output=slurm.txt
-#SBATCH --time=10:00
-#SBATCH --nodes=2
-#SBATCH --cpus-per-task=2
-#SBATCH --mem-per-cpu=6000MB
-#SBATCH --nodelist=g0001,g0002
-#SBATCH --partition=gpu
-
-srun -n 2 ./moe -ll:cpu 4 -ll:gpu 4 -ll:fsize 15000 -ll:zsize 15000 --nodes 2 -ll:util 1 -b 40 -e 1 --search-budget 1 --export strat-tmp.txt
diff --git a/include/flexflow/ops/groupby.h b/include/flexflow/ops/groupby.h
index 44e03ec6e3..afa69d891c 100644
--- a/include/flexflow/ops/groupby.h
+++ b/include/flexflow/ops/groupby.h
@@ -75,8 +75,7 @@ class Group_by : public Op {
                              int k,       // chosen experts
                              float alpha, // factor additional memory assigned
                              int batch_size,
-                             int data_dim,
-                             int n_replicas);
+                             int data_dim);
   static void
       backward_kernel_wrapper(GroupByMeta const *m,
                               float *input_grad,
@@ -86,8 +85,7 @@ class Group_by : public Op {
                               int k,       // chosen experts
                               float alpha, // factor additional memory assigned
                               int batch_size,
-                              int data_dim, 
-                              int n_replicas);
+                              int data_dim);
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
                              CostMetrics &cost_metrics) const override;
diff --git a/src/ops/aggregate.cc b/src/ops/aggregate.cc
index 19ed275b5c..49e564a702 100644
--- a/src/ops/aggregate.cc
+++ b/src/ops/aggregate.cc
@@ -55,8 +55,10 @@ Tensor FFModel::aggregate(
     int num_dim = inputs[4]->num_dims;
     // Set output shape
     int dims[MAX_TENSOR_DIM];
-    for (int i = 0; i < num_dim; i++)
+    for (int i = 0; i < num_dim - 1; i++) {
       dims[i] = inputs[4]->dims[i];
+    }
+    dims[num_dim - 1] = inputs[0]->dims[num_dim - 1];
     li->outputs[0] = create_tensor_legion_ordering(
         num_dim, dims, DT_FLOAT, li, 0, true /*create_grad*/);
   }
@@ -141,16 +143,11 @@ Aggregate::Aggregate(FFModel &model,
   }
   // Set output shape
   ParallelDim dims[MAX_TENSOR_DIM];
-<<<<<<< HEAD
   for (int i = 0; i < num_dim - 1; i++) {
     dims[i] = inputs[4]->dims[i];
   }
   dims[num_dim - 2] = inputs[0]->dims[num_dim - 2];
   dims[num_dim - 1] = inputs[0]->dims[num_dim - 1];
-=======
-  for (int i = 0; i < num_dim; i++)
-    dims[i] = inputs[4]->dims[i];
->>>>>>> 99a89a9b... [MOE] update moe cpp example and aggregate implementation (#555)
   numOutputs = 1;
   outputs[0] = model.create_parallel_tensor_legion_ordering(
       num_dim, dims, DT_FLOAT, this);
diff --git a/src/ops/group_by.cc b/src/ops/group_by.cc
index b341f004ac..e6dc00f690 100644
--- a/src/ops/group_by.cc
+++ b/src/ops/group_by.cc
@@ -316,7 +316,6 @@ void Group_by::forward_task(Task const *task,
   int n = gb->n;
   float alpha = gb->alpha;
 
-  // Check that the number of regions is n+2: n outputs and 2 inputs
   assert((int)regions.size() == n + 2);
   assert((int)task->regions.size() == n + 2);
 
@@ -334,16 +333,13 @@ void Group_by::forward_task(Task const *task,
 
   coord_t input_rows = rect_input.hi[1] - rect_input.lo[1] + 1;
   coord_t input_cols = rect_input.hi[0] - rect_input.lo[0] + 1;
-  coord_t input_replicas = rect_input.hi[2] - rect_input.lo[2] + 1;
-  // Check that dimensions match in the input and assign tensors
   assert(input_rows == rect_assign.hi[1] - rect_assign.lo[1] + 1);
-  assert(input_replicas == rect_assign.hi[2] - rect_assign.lo[2] + 1); // does this need to be true?
+
   int k = rect_assign.hi[0] - rect_assign.lo[0] + 1;
   int batch_size = input_rows;
   int data_dim = input_cols;
-  int n_replicas = input_replicas;
 
-  // Create a vector of n outputs, where n is the number of experts. 
+  // Create a vector of n outputs, where n is the number of experts.
   // Each entry in the "outputs" vector points to the Legion tensor that will
   // contain the tockens dispatched to the corresponding expert
   float *outputs[n];
@@ -360,9 +356,6 @@ void Group_by::forward_task(Task const *task,
     assert(output_cols == input_cols);
   }
 
-  // Launch the kernel responsible from copying the data from the input tensor
-  // to each output tensor, according to the input to expert assignments from
-  // the assign tensor.
   Group_by::forward_kernel_wrapper(m,
                                    acc_input.ptr(rect_input),
                                    acc_assign.ptr(rect_assign),
@@ -371,8 +364,7 @@ void Group_by::forward_task(Task const *task,
                                    k,
                                    alpha,
                                    batch_size,
-                                   data_dim,
-                                   n_replicas);
+                                   data_dim);
 }
 
 void Group_by::backward(FFModel const &ff) {
@@ -442,13 +434,11 @@ void Group_by::backward_task(Task const *task,
 
   coord_t input_rows = rect_input_grad.hi[1] - rect_input_grad.lo[1] + 1;
   coord_t input_cols = rect_input_grad.hi[0] - rect_input_grad.lo[0] + 1;
-  coord_t input_replicas = rect_input_grad.hi[2] - rect_input_grad.lo[2] + 1;
   assert(input_rows == rect_assign.hi[1] - rect_assign.lo[1] + 1);
-  assert(input_replicas == rect_assign.hi[2] - rect_assign.lo[2] + 1); // does this need to be true?
+
   int k = rect_assign.hi[0] - rect_assign.lo[0] + 1;
   int batch_size = input_rows;
   int data_dim = input_cols;
-  int n_replicas = input_replicas;
 
   // get output
   float *output_grads[n];
@@ -473,8 +463,7 @@ void Group_by::backward_task(Task const *task,
                                     k,
                                     alpha,
                                     batch_size,
-                                    data_dim,
-                                    n_replicas);
+                                    data_dim);
 }
 
 void Group_by::serialize(Legion::Serializer &sez) const {
diff --git a/src/ops/group_by.cpp b/src/ops/group_by.cpp
index 16c8354bca..e0b914cf1a 100644
--- a/src/ops/group_by.cpp
+++ b/src/ops/group_by.cpp
@@ -33,19 +33,25 @@ __global__ void
                       int k,       // chosen experts
                       float alpha, // factor additional memory assigned
                       int batch_size,
-                      int data_dim,
-                      int n_replicas) {
-  __shared__ float *chosen_exp_preds[MAX_K * MAX_BATCH_SIZE]; // one pointer for each exp_assign (TopK_output[1]) element 
+                      int data_dim) {
+  __shared__ float
+      *chosen_exp_preds[MAX_K *
+                        MAX_BATCH_SIZE]; // one pointer for each exp_assign
+                                         // (TopK_output[1]) element
 
   // Get pred pointers, single thread per block
   if (threadIdx.x == 0) {
-    int exp_tensor_rows = ceil(alpha * k / n * batch_size); // This is the max expert capacity
-    int expert_idx[MAX_N] = {0};  // This is the number of tokens assigned to each expert
+    int exp_tensor_rows =
+        ceil(alpha * k / n * batch_size); // This is the max expert capacity
+    int expert_idx[MAX_N] = {
+        0}; // This is the number of tokens assigned to each expert
     // Iterate through flattened assign tensor, which has shape (k, batch_size)
     for (int i = 0; i < k * batch_size; i++) {
       // Get pointer to chosen expert predictions
-      int expert = exp_assign[i]; // index of the expert that is to receive the token i
-      if (expert_idx[expert] >= exp_tensor_rows) { // check if the expert is already at capacity
+      int expert =
+          exp_assign[i]; // index of the expert that is to receive the token i
+      if (expert_idx[expert] >=
+          exp_tensor_rows) { // check if the expert is already at capacity
         // dropped sample
         chosen_exp_preds[i] = 0;
         continue;
@@ -79,8 +85,7 @@ __global__ void
                        int k,       // chosen experts
                        float alpha, // factor additional memory assigned
                        int batch_size,
-                       int data_dim,
-                       int n_replicas) {
+                       int data_dim) {
   __shared__ float *chosen_exp_grads[MAX_K * MAX_BATCH_SIZE];
 
   // Get pred pointers, single thread
@@ -122,8 +127,7 @@ void Group_by::forward_kernel_wrapper(
     int k,       // chosen experts
     float alpha, // factor additional memory assigned
     int batch_size,
-    int data_dim,
-    int n_replicas) {
+    int data_dim) {
   // TODO: why cublas/cudnn stream is needed here?
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
@@ -144,8 +148,7 @@ void Group_by::forward_kernel_wrapper(
                      k,
                      alpha,
                      batch_size,
-                     data_dim,
-                     n_replicas);
+                     data_dim);
 }
 
 void Group_by::backward_kernel_wrapper(
@@ -157,8 +160,7 @@ void Group_by::backward_kernel_wrapper(
     int k,       // chosen experts
     float alpha, // factor additional memory assigned
     int batch_size,
-    int data_dim,
-    int n_replicas) {
+    int data_dim) {
   // TODO: why cublas/cudnn stream is needed here
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
@@ -181,8 +183,7 @@ void Group_by::backward_kernel_wrapper(
                      k,
                      alpha,
                      batch_size,
-                     data_dim,
-                     n_replicas);
+                     data_dim);
 }
 
 GroupByMeta::GroupByMeta(FFHandler handler, int n) : OpMeta(handler) {
@@ -192,4 +193,4 @@ GroupByMeta::~GroupByMeta(void) {
   checkCUDA(hipFree(&dev_region_ptrs));
 }
 
-}; // namespace FlexFlow
+}; // namespace FlexFlow
\ No newline at end of file
diff --git a/src/ops/group_by.cu b/src/ops/group_by.cu
index 5e5f4a6fb8..ac29904e9f 100644
--- a/src/ops/group_by.cu
+++ b/src/ops/group_by.cu
@@ -32,8 +32,7 @@ __global__ void
                       int k,       // chosen experts
                       float alpha, // factor additional memory assigned
                       int batch_size,
-                      int data_dim,
-                      int n_replicas) {
+                      int data_dim) {
   __shared__ float *chosen_exp_preds[MAX_K * MAX_BATCH_SIZE];
 
   // Get pred pointers, single thread per block
@@ -72,8 +71,7 @@ __global__ void
                        int k,       // chosen experts
                        float alpha, // factor additional memory assigned
                        int batch_size,
-                       int data_dim,
-                       int n_replicas) {
+                       int data_dim) {
   __shared__ float *chosen_exp_grads[MAX_K * MAX_BATCH_SIZE];
   assert(k <= MAX_K);
   assert(batch_size <= MAX_BATCH_SIZE);
@@ -117,8 +115,7 @@ void Group_by::forward_kernel_wrapper(
     int k,       // chosen experts
     float alpha, // factor additional memory assigned
     int batch_size,
-    int data_dim,
-    int n_replicas) {
+    int data_dim) {
   // TODO: why cublas/cudnn stream is needed here?
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
@@ -139,7 +136,7 @@ void Group_by::forward_kernel_wrapper(
                       min(CUDA_NUM_THREADS, (int)(batch_size * k * data_dim)),
                       0,
                       stream>>>(
-      input, exp_assign, m->dev_region_ptrs, n, k, alpha, batch_size, data_dim, n_replicas);
+      input, exp_assign, m->dev_region_ptrs, n, k, alpha, batch_size, data_dim);
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
     checkCUDA(cudaEventSynchronize(t_end));
@@ -160,8 +157,7 @@ void Group_by::backward_kernel_wrapper(
     int k,       // chosen experts
     float alpha, // factor additional memory assigned
     int batch_size,
-    int data_dim,
-    int n_replicas) {
+    int data_dim) {
   // TODO: why cublas/cudnn stream is needed here
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
@@ -188,8 +184,7 @@ void Group_by::backward_kernel_wrapper(
                                  k,
                                  alpha,
                                  batch_size,
-                                 data_dim,
-                                 n_replicas);
+                                 data_dim);
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
     checkCUDA(cudaEventSynchronize(t_end));
@@ -208,4 +203,4 @@ GroupByMeta::~GroupByMeta(void) {
   checkCUDA(cudaFree(&dev_region_ptrs));
 }
 
-}; // namespace FlexFlow
+}; // namespace FlexFlow
\ No newline at end of file

From 1ce534b3f7bd66832e860101722c11d1aaae257a Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 17 Jan 2023 23:43:54 -0500
Subject: [PATCH 043/344] bug fix

---
 examples/cpp/inference/MLP_Unify/CMakeLists.txt | 4 +---
 1 file changed, 1 insertion(+), 3 deletions(-)

diff --git a/examples/cpp/inference/MLP_Unify/CMakeLists.txt b/examples/cpp/inference/MLP_Unify/CMakeLists.txt
index 57b9ea0835..e83d292efc 100644
--- a/examples/cpp/inference/MLP_Unify/CMakeLists.txt
+++ b/examples/cpp/inference/MLP_Unify/CMakeLists.txt
@@ -9,9 +9,7 @@ set(CPU_SRC
   mlp.h
   ../data_generator.h)
 
-set(GPU_SRC mlp.cu)
-
-cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
+cuda_add_executable(${project_target} ${CPU_SRC})
 target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/examples/cpp/inference)
 target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
 target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})

From 12779ffff07cebc2e8921ef9215ca91604d3d770 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 17 Jan 2023 23:48:04 -0500
Subject: [PATCH 044/344] more futuremap purging

---
 include/flexflow/ops/experts.h | 2 +-
 src/ops/experts.cc             | 4 ++--
 2 files changed, 3 insertions(+), 3 deletions(-)

diff --git a/include/flexflow/ops/experts.h b/include/flexflow/ops/experts.h
index 74e9c0ff02..9b05270f79 100644
--- a/include/flexflow/ops/experts.h
+++ b/include/flexflow/ops/experts.h
@@ -34,7 +34,7 @@ class Experts : public Op {
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
-  FutureMap inference(FFModel const &,
+  void inference(FFModel const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index 28405d3dd7..368ed9b93d 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -294,7 +294,7 @@ void Experts::backward_task(Task const *task,
   assert(false && "Experts is designed for inference only");
 }
 
-FutureMap Experts::inference(FFModel const &ff,
+void Experts::inference(FFModel const &ff,
                              std::vector<ParallelTensor> const &batch_inputs,
                              std::vector<ParallelTensor> const &batch_outputs,
                              MachineView const *mv) {
@@ -329,7 +329,7 @@ FutureMap Experts::inference(FFModel const &ff,
                                                     EXCLUSIVE,
                                                     batch_outputs[0]->region));
   launcher.add_field(2, FID_DATA);
-  return runtime->execute_index_space(ctx, launcher);
+  runtime->execute_index_space(ctx, launcher);
 }
 
 void Experts::inference_task(Task const *task,

From ef5fea026cd2e0f4a378104b7cf94e10f44a0762 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 17 Jan 2023 23:51:45 -0500
Subject: [PATCH 045/344] [Inference][MLP] removed non-working dataloader

---
 examples/cpp/inference/MLP_Unify/mlp.cc | 136 +-----------------------
 examples/cpp/inference/MLP_Unify/mlp.h  |   2 +-
 2 files changed, 3 insertions(+), 135 deletions(-)

diff --git a/examples/cpp/inference/MLP_Unify/mlp.cc b/examples/cpp/inference/MLP_Unify/mlp.cc
index 9da8214c00..56833814ba 100644
--- a/examples/cpp/inference/MLP_Unify/mlp.cc
+++ b/examples/cpp/inference/MLP_Unify/mlp.cc
@@ -1,4 +1,4 @@
-/* Copyright 2021 Stanford University
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
  *
  * Licensed under the Apache License, Version 2.0 (the "License");
  * you may not use this file except in compliance with the License.
@@ -23,120 +23,6 @@
 using namespace Legion;
 using namespace FlexFlow;
 
-DataLoader::DataLoader(FFModel &ff,
-                       MLPConfig const &mlpConfig,
-                       InferenceManager const *im, 
-                       Tensor input) {
-  Context ctx = ff.config.lg_ctx;
-  Runtime *runtime = ff.config.lg_hlr;
-  printf("Use random dataset...");
-
-  // The number of samples is the total number of request samples that can ever
-  // be loaded into memory at the same time. In the case of training, the value
-  // is batchSize * workersPerNode * numNodes, since each worker can only
-  // process one batch at a time. In inference,  batchSize
-  int max_parallel_requests =
-      im->max_num_inflight_batches *
-      (ff.config.batchSize * im->max_num_requests_per_batch);
-  num_samples =
-      max_parallel_requests * ff.config.workersPerNode * ff.config.numNodes;
-  printf("Number of random samples = %d\n", num_samples);
-
-  // return;
-  
-  // Create full input
-  {
-    batch_input = input;
-    int const dims[] = {num_samples,
-                        mlpConfig.sequence_length * mlpConfig.embedding_size};
-    full_input = ff.create_tensor<2>(dims, DT_FLOAT);
-  }
-
-  // Load entire dataset
-  // TODO: Use index launcher instead of task launcher
-  TaskLauncher launcher(CUSTOM_CPU_TASK_ID_1, TaskArgument(NULL, 0));
-  launcher.add_region_requirement(
-      RegionRequirement(full_input->parallel_tensor->region,
-                        WRITE_ONLY,
-                        EXCLUSIVE,
-                        full_input->parallel_tensor->region,
-                        MAP_TO_ZC_MEMORY));
-  launcher.add_field(0, FID_DATA);
-  runtime->execute_task(ctx, launcher);
-  reset();
-  //next_batch(ff);
-}
-
-void DataLoader::load_entire_dataset(Task const *task,
-                                     std::vector<PhysicalRegion> const &regions,
-                                     Context ctx,
-                                     Runtime *runtime) {
-  assert(regions.size() == 1); // no labels
-  assert(task->regions.size() == 1);
-  // Note that these instances are in ZCM, can only use
-  // TensorAccessorW with readOutput flag
-  AccessorWO<float, 2> const acc_input(regions[0], FID_DATA);
-  Rect<2> rect_input = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  assert(acc_input.accessor.is_dense_arbitrary(rect_input));
-  float *input_ptr = acc_input.ptr(rect_input.lo);
-  // Fill dataset with random data
-  for (int i = 0; i < rect_input.volume(); i++) {
-    input_ptr[i] = ((float)std::rand()) / RAND_MAX;
-  }
-  printf("finish loading data\n");
-}
-
-void DataLoader::next_batch(FFModel &ff) {
-  Context ctx = ff.config.lg_ctx;
-  Runtime *runtime = ff.config.lg_hlr;
-  // Load Input
-  {
-    Rect<2> rect = runtime->get_index_space_domain(ctx, batch_input->parallel_tensor->parallel_is);
-    ArgumentMap argmap;
-    int idx = next_index;
-    for (PointInRectIterator<2> it(rect); it(); it++) {
-      SampleIdxs meta;
-      assert(ff.config.batchSize % (rect.hi[1] - rect.lo[1] + 1) == 0);
-      meta.num_samples = ff.config.batchSize / (rect.hi[1] - rect.lo[1] + 1);
-      for (int i = 0; i < meta.num_samples; i++)
-        meta.idxs[i] = idx++;
-      argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
-    }
-
-    IndexLauncher launcher(CUSTOM_GPU_TASK_ID_1,
-                           batch_input->parallel_tensor->parallel_is,
-                           TaskArgument(NULL, 0),
-                           argmap,
-                           Predicate::TRUE_PRED,
-                           false /*must*/,
-                           0 /*mapper_id*/,
-                           batch_input->parallel_tensor->machine_view.hash());
-    launcher.add_region_requirement(
-        RegionRequirement(full_input->parallel_tensor->region,
-                          0 /*projection id*/,
-                          READ_ONLY,
-                          EXCLUSIVE,
-                          full_input->parallel_tensor->region,
-                          MAP_TO_FB_MEMORY));
-    launcher.add_field(0, FID_DATA);
-    launcher.add_region_requirement(
-        RegionRequirement(batch_input->parallel_tensor->part,
-                          0 /*projection id*/,
-                          WRITE_ONLY,
-                          EXCLUSIVE,
-                          batch_input->parallel_tensor->region));
-    launcher.add_field(1, FID_DATA);
-    runtime->execute_index_space(ctx, launcher);
-  }
-  // progress to the next_index
-  next_index += ff.config.batchSize;
-}
-
-void DataLoader::reset() {
-  next_index = 0;
-}
-
 
 Tensor create_mlp(FFModel *model,
                   MLPConfig const *mlpConfig,
@@ -255,22 +141,4 @@ void FlexFlow::top_level_task(Task const *task,
          ffConfig.batchSize * 128 * ffConfig.epochs / run_time);
 }
 
-void FlexFlow::register_custom_tasks() {
-  // Load entire dataset
-  {
-    TaskVariantRegistrar registrar(CUSTOM_CPU_TASK_ID_1, "Load Entire Dataset");
-    registrar.add_constraint(ProcessorConstraint(Processor::LOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<DataLoader::load_entire_dataset>(
-        registrar, "Load Entire Dataset Task");
-  }
-  // Load input
-  {
-    TaskVariantRegistrar registrar(FlexFlow::CUSTOM_GPU_TASK_ID_1,
-                                   "Load Inputs");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<DataLoader::load_input>(
-        registrar, "Load Input Task");
-  }
-}
+void FlexFlow::register_custom_tasks() {}
diff --git a/examples/cpp/inference/MLP_Unify/mlp.h b/examples/cpp/inference/MLP_Unify/mlp.h
index 7a8cc06955..7cd2f30430 100644
--- a/examples/cpp/inference/MLP_Unify/mlp.h
+++ b/examples/cpp/inference/MLP_Unify/mlp.h
@@ -1,4 +1,4 @@
-/* Copyright 2022 CMU, Stanford
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
  *
  * Licensed under the Apache License, Version 2.0 (the "License");
  * you may not use this file except in compliance with the License.

From a50069e4b3a61c22f8cded8a53c031169e8195a6 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 18 Jan 2023 00:12:36 -0500
Subject: [PATCH 046/344] bug fix

---
 .../cpp/inference/mixture_of_experts/moe.cc     | 17 +++++++++--------
 examples/cpp/inference/mixture_of_experts/moe.h |  7 ++++++-
 2 files changed, 15 insertions(+), 9 deletions(-)

diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index 7d6e1fddee..99bdec62fb 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -37,28 +37,29 @@ Tensor create_moe(FFModel *model,
                   MoeConfig const *moeConfig,
                   Tensor const &input) {
   // MoE model
-  Tensor gate_preds = model->dense(input, num_exp, AC_MODE_RELU);
+  Tensor gate_preds = model->dense(input, moeConfig->num_exp, AC_MODE_RELU);
   Tensor topK_output[2];
-  model->top_k(gate_preds, topK_output, num_select, false);
-  Tensor agg_inputs[num_exp + 4];
+  model->top_k(gate_preds, topK_output, moeConfig->num_select, false);
+  Tensor agg_inputs[moeConfig->num_exp + 4];
   agg_inputs[0] = model->softmax(topK_output[0]); // gate preds
   agg_inputs[1] = topK_output[1];                 // gate assign
   agg_inputs[2] = topK_output[1]; // gate assign TopK (for cache)
   agg_inputs[3] = gate_preds;     // full gate preds
-  for (int i = 0; i < num_exp /*number of experts layers*/; i++) {
+  assert(moeConfig->num_exp % moeConfig->fused_exp_block_size == 0);
+  for (int i = 0; i < moeConfig->num_exp /*number of experts layers*/; i++) {
     Tensor exp_pred = model->experts(gate_preds,
                                      topK_output[1],
-                                     32 /*number of experts*/,
-                                     32 * i /*expert start index*/,
+                                     moeConfig->fused_exp_block_size /*number of experts*/,
+                                     moeConfig->fused_exp_block_size * i /*expert start index*/,
                                      1 /*number of linear layers*/,
                                      moeConfig->hidden_size /*output_size*/,
                                      moeConfig->hidden_size /*internal_size*/);
     agg_inputs[i + 4] = exp_pred;
   }
-  for (int i = 0; i < num_exp + 4; i++) {
+  for (int i = 0; i < moeConfig->num_exp + 4; i++) {
     agg_inputs[i]->print("agg_inputs[i]");
   }
-  Tensor coop_output = model->aggregate(agg_inputs, num_exp, moeConfig->lambda);
+  Tensor coop_output = model->aggregate(agg_inputs, moeConfig->num_exp, moeConfig->lambda);
   // model->get_metrics();
   return coop_output;
 }
diff --git a/examples/cpp/inference/mixture_of_experts/moe.h b/examples/cpp/inference/mixture_of_experts/moe.h
index a9fd2d2325..ed7b5af483 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.h
+++ b/examples/cpp/inference/mixture_of_experts/moe.h
@@ -31,7 +31,11 @@ using namespace FlexFlow;
 struct MoeConfig {
   MoeConfig(void) {
     // MoE layer
-    num_exp = 5;
+    // total number of experts
+    num_exp = 128;
+    // number of experts in each block of fused experts
+    fused_exp_block_size = 32;
+    // number of experts to route each token to
     num_select = 2;
     alpha = 2.0f;
     lambda = 0.04f;
@@ -44,6 +48,7 @@ struct MoeConfig {
   // MoE layer
   int num_exp;
   int num_select;
+  int fused_exp_block_size;
   float alpha;  // factor overhead tensor size for imbalance
   float lambda; // multiplier for load balance term
   int hidden_size;

From 71463cc01092aea2507ce84e41e5588e8e18250d Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 18 Jan 2023 00:13:31 -0500
Subject: [PATCH 047/344] formatting

---
 examples/cpp/inference/MLP_Unify/mlp.cc       |  40 +++--
 examples/cpp/inference/data_generator.cpp     |   4 +-
 examples/cpp/inference/data_generator.h       | 167 +++++++++---------
 .../cpp/inference/mixture_of_experts/moe.cc   |  20 ++-
 include/flexflow/inference.h                  |   9 +-
 include/flexflow/ops/experts.h                |   6 +-
 src/ops/experts.cc                            |  37 ++--
 src/runtime/inference_manager.cc              |  35 ++--
 8 files changed, 169 insertions(+), 149 deletions(-)

diff --git a/examples/cpp/inference/MLP_Unify/mlp.cc b/examples/cpp/inference/MLP_Unify/mlp.cc
index 56833814ba..7631af0445 100644
--- a/examples/cpp/inference/MLP_Unify/mlp.cc
+++ b/examples/cpp/inference/MLP_Unify/mlp.cc
@@ -23,7 +23,6 @@
 using namespace Legion;
 using namespace FlexFlow;
 
-
 Tensor create_mlp(FFModel *model,
                   MLPConfig const *mlpConfig,
                   Tensor const &input1,
@@ -44,7 +43,7 @@ void FlexFlow::top_level_task(Task const *task,
                               std::vector<PhysicalRegion> const &regions,
                               Context ctx,
                               Runtime *runtime) {
-  
+
   // Inference parameters
   int total_requests =
       256; // total number of requests processed as part of the simulation
@@ -61,13 +60,13 @@ void FlexFlow::top_level_task(Task const *task,
       8192, 8192, 8192, 8192, 8192, 8192, 8192, 8192};
 
   FFConfig ffConfig;
-  ffConfig.batchSize=1;
+  ffConfig.batchSize = 1;
   {
-    fprintf(stderr, "batchSize(%d) workersPerNodes(%d) numNodes(%d)\n",
-      ffConfig.batchSize,
-      ffConfig.workersPerNode,
-      ffConfig.numNodes
-    );
+    fprintf(stderr,
+            "batchSize(%d) workersPerNodes(%d) numNodes(%d)\n",
+            ffConfig.batchSize,
+            ffConfig.workersPerNode,
+            ffConfig.numNodes);
   }
   FFModel ff(ffConfig);
   MLPConfig mlpConfig(embedding_size, sequence_length, hidden_dims);
@@ -81,21 +80,26 @@ void FlexFlow::top_level_task(Task const *task,
       hd << hidden_dims[i];
     }
     hd << '}';
-    fprintf(stderr, "embedding_size(%d) sequence_length(%d) hidden_dims(%s)\n", mlpConfig.embedding_size, mlpConfig.sequence_length, hd.str().c_str());
+    fprintf(stderr,
+            "embedding_size(%d) sequence_length(%d) hidden_dims(%s)\n",
+            mlpConfig.embedding_size,
+            mlpConfig.sequence_length,
+            hd.str().c_str());
   }
-  
+
   Tensor input1, input2;
   {
-    int const dims[] = {total_requests, mlpConfig.sequence_length * mlpConfig.embedding_size};
+    int const dims[] = {total_requests,
+                        mlpConfig.sequence_length * mlpConfig.embedding_size};
     input1 = ff.create_tensor<2>(dims, DT_FLOAT);
     input2 = ff.create_tensor<2>(dims, DT_FLOAT);
   }
   Tensor t = create_mlp(&ff, &mlpConfig, input1, input2);
-  
+
   InferenceManager im(&ff, num_requests_per_batch, num_inflight_batches);
   // im.compile_model_and_allocate_buffer();
   ff.init_operators();
-  
+
   // Start timer
   {
     runtime->issue_execution_fence(ctx);
@@ -104,10 +108,9 @@ void FlexFlow::top_level_task(Task const *task,
     future.get_void_result();
   }
   double ts_start = Realm::Clock::current_time_in_microseconds();
-  
-  
+
   ///////////////////////////////////////////////////////////////////////////////////
-  
+
   // Main loop, processing requests as they come (from the generator)
   int index = 0;
   int processed_requests = 0;
@@ -121,12 +124,11 @@ void FlexFlow::top_level_task(Task const *task,
       im.inference((index++) % num_inflight_batches);
       runtime->end_trace(ctx, 111 /*trace_id*/);
     }
-    processed_requests+= iterations;
+    processed_requests += iterations;
   }
 
   ///////////////////////////////////////////////////////////////////////////////////
-  
-  
+
   // End timer
   {
     runtime->issue_execution_fence(ctx);
diff --git a/examples/cpp/inference/data_generator.cpp b/examples/cpp/inference/data_generator.cpp
index bf6456ef84..7429fdb159 100644
--- a/examples/cpp/inference/data_generator.cpp
+++ b/examples/cpp/inference/data_generator.cpp
@@ -5,11 +5,11 @@
 //  Created by User on 11/15/22.
 //
 
-#include <iostream>
+#include "data_generator.h"
 #include <ctime>
+#include <iostream>
 #include <random>
 #include <unistd.h>
-#include "data_generator.h"
 using namespace std;
 
 // This is for running the dataloader standalone
diff --git a/examples/cpp/inference/data_generator.h b/examples/cpp/inference/data_generator.h
index 199af572f8..8c3a89d2a7 100644
--- a/examples/cpp/inference/data_generator.h
+++ b/examples/cpp/inference/data_generator.h
@@ -1,85 +1,88 @@
-#include <iostream>
+#include <chrono>
 #include <ctime>
+#include <iostream>
+#include <math.h>
 #include <random>
-#include <unistd.h>
-#include <chrono>
 #include <thread>
-#include <math.h>
+#include <unistd.h>
 using namespace std;
 typedef std::chrono::high_resolution_clock Clock;
 typedef std::chrono::milliseconds milliseconds;
 
 class Generator {
-    public:
-        size_t num_requests; // total number of requests
-        size_t tensor_size; // dimension of one request tensor
-        bool poisson; // false implied uniform distribution
-        double lambda; // mean #num of arrivals per sec
-        
-        Generator(size_t req, size_t tensor, bool poi, double lamb) {
-            num_requests = req;
-            tensor_size = tensor;
-            poisson = poi;
-            lambda = lamb;
-            compute_distribution();
-            arrivals_ptr = arrivals.begin();
-            timer_started = false;
-        }
-    
-        vector<vector<double>> get_requests(void); // function to retrieve requests
-    
-    private:
-        bool timer_started; // tracks if start time has been initiated
-        Clock::time_point start_time; // time when get_requests() is called for the first time
-        vector<double> arrivals; // arrival times (ms) generated based on distribution
-        vector<double>::iterator arrivals_ptr; // next request to output
-    
-        void compute_distribution( void ); // populate arrivals
-        vector<double> get_random_tensor(void); // generate a random tensor
+public:
+  size_t num_requests; // total number of requests
+  size_t tensor_size;  // dimension of one request tensor
+  bool poisson;        // false implied uniform distribution
+  double lambda;       // mean #num of arrivals per sec
+
+  Generator(size_t req, size_t tensor, bool poi, double lamb) {
+    num_requests = req;
+    tensor_size = tensor;
+    poisson = poi;
+    lambda = lamb;
+    compute_distribution();
+    arrivals_ptr = arrivals.begin();
+    timer_started = false;
+  }
+
+  vector<vector<double>> get_requests(void); // function to retrieve requests
+
+private:
+  bool timer_started; // tracks if start time has been initiated
+  Clock::time_point
+      start_time; // time when get_requests() is called for the first time
+  vector<double> arrivals; // arrival times (ms) generated based on distribution
+  vector<double>::iterator arrivals_ptr; // next request to output
+
+  void compute_distribution(void);        // populate arrivals
+  vector<double> get_random_tensor(void); // generate a random tensor
 };
 
-void Generator::compute_distribution( void ) {
-    // set up uniform number generator [0,1)
-    random_device rnd;
-    mt19937 gen(rnd());
-    uniform_real_distribution<double> dist {0, 1.0};
-    double cur_arrival = 0; // assume first request comes in at time 0
-    
-    for (size_t i = 0; i < num_requests; i++) {
-        arrivals.push_back(cur_arrival);
-        cout << "arrival time " << i << ": +" << cur_arrival << "ms \n";
-        
-        if (poisson) {
-            double u = dist(gen);
-            double interval = -(1/lambda) * log(1-u) * 1000;
-            cur_arrival += interval;
-        } else {
-            cur_arrival += (1000/lambda);
-        }
+void Generator::compute_distribution(void) {
+  // set up uniform number generator [0,1)
+  random_device rnd;
+  mt19937 gen(rnd());
+  uniform_real_distribution<double> dist{0, 1.0};
+  double cur_arrival = 0; // assume first request comes in at time 0
+
+  for (size_t i = 0; i < num_requests; i++) {
+    arrivals.push_back(cur_arrival);
+    cout << "arrival time " << i << ": +" << cur_arrival << "ms \n";
+
+    if (poisson) {
+      double u = dist(gen);
+      double interval = -(1 / lambda) * log(1 - u) * 1000;
+      cur_arrival += interval;
+    } else {
+      cur_arrival += (1000 / lambda);
     }
-    return;
+  }
+  return;
 };
 
 vector<vector<double>> Generator::get_requests(void) {
-    Clock::time_point cur_time = Clock::now();
-    vector<vector<double>> requests;
-    if (!timer_started){
-        // simply return one request and start timer for the first call
-        start_time = Clock::now();
-        timer_started = true;
-        arrivals_ptr++;
-        requests.push_back(get_random_tensor());
-        return requests;
-    }
-    
-    // output requests till we reach current timestamp
-    milliseconds ms_from_start = chrono::duration_cast<milliseconds>(cur_time - start_time);
-    while (arrivals_ptr < arrivals.end() && ms_from_start.count() >= *arrivals_ptr){
-        cout << "output request at arrival time +" << *arrivals_ptr << "\n";
-        requests.push_back(get_random_tensor());
-        arrivals_ptr++;
-    }
+  Clock::time_point cur_time = Clock::now();
+  vector<vector<double>> requests;
+  if (!timer_started) {
+    // simply return one request and start timer for the first call
+    start_time = Clock::now();
+    timer_started = true;
+    arrivals_ptr++;
+    requests.push_back(get_random_tensor());
     return requests;
+  }
+
+  // output requests till we reach current timestamp
+  milliseconds ms_from_start =
+      chrono::duration_cast<milliseconds>(cur_time - start_time);
+  while (arrivals_ptr < arrivals.end() &&
+         ms_from_start.count() >= *arrivals_ptr) {
+    cout << "output request at arrival time +" << *arrivals_ptr << "\n";
+    requests.push_back(get_random_tensor());
+    arrivals_ptr++;
+  }
+  return requests;
 };
 
 // template <class ForwardIt, class Generator>
@@ -90,27 +93,25 @@ vector<vector<double>> Generator::get_requests(void) {
 // }
 
 vector<double> Generator::get_random_tensor(void) {
-    random_device rnd_device;
-    mt19937 mersenne_engine {rnd_device()};
-    uniform_real_distribution<double> dist {0, 1.0}; // state distribution
-    
-    auto gen = [&dist, &mersenne_engine](){
-                   return dist(mersenne_engine);
-               };
+  random_device rnd_device;
+  mt19937 mersenne_engine{rnd_device()};
+  uniform_real_distribution<double> dist{0, 1.0}; // state distribution
+
+  auto gen = [&dist, &mersenne_engine]() { return dist(mersenne_engine); };
 
-    vector<double> vec(tensor_size);
-    generate(begin(vec), end(vec), gen);
-    return vec;
+  vector<double> vec(tensor_size);
+  generate(begin(vec), end(vec), gen);
+  return vec;
 };
 
 // for debugging
 void print_requests(vector<vector<double>> req) {
-    cout << "printing requests\n";
-    for (vector<double> v: req){
-        for (double e: v) {
-            cout << e << ",";
-        }
-        cout << "\n";
+  cout << "printing requests\n";
+  for (vector<double> v : req) {
+    for (double e : v) {
+      cout << e << ",";
     }
     cout << "\n";
+  }
+  cout << "\n";
 };
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index 99bdec62fb..f0823a9b80 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -47,19 +47,21 @@ Tensor create_moe(FFModel *model,
   agg_inputs[3] = gate_preds;     // full gate preds
   assert(moeConfig->num_exp % moeConfig->fused_exp_block_size == 0);
   for (int i = 0; i < moeConfig->num_exp /*number of experts layers*/; i++) {
-    Tensor exp_pred = model->experts(gate_preds,
-                                     topK_output[1],
-                                     moeConfig->fused_exp_block_size /*number of experts*/,
-                                     moeConfig->fused_exp_block_size * i /*expert start index*/,
-                                     1 /*number of linear layers*/,
-                                     moeConfig->hidden_size /*output_size*/,
-                                     moeConfig->hidden_size /*internal_size*/);
+    Tensor exp_pred = model->experts(
+        gate_preds,
+        topK_output[1],
+        moeConfig->fused_exp_block_size /*number of experts*/,
+        moeConfig->fused_exp_block_size * i /*expert start index*/,
+        1 /*number of linear layers*/,
+        moeConfig->hidden_size /*output_size*/,
+        moeConfig->hidden_size /*internal_size*/);
     agg_inputs[i + 4] = exp_pred;
   }
   for (int i = 0; i < moeConfig->num_exp + 4; i++) {
     agg_inputs[i]->print("agg_inputs[i]");
   }
-  Tensor coop_output = model->aggregate(agg_inputs, moeConfig->num_exp, moeConfig->lambda);
+  Tensor coop_output =
+      model->aggregate(agg_inputs, moeConfig->num_exp, moeConfig->lambda);
   // model->get_metrics();
   return coop_output;
 }
@@ -125,7 +127,7 @@ void FlexFlow::top_level_task(Task const *task,
 
   //-----------------------------------------------------------------
 
-  //Tensor t = create_moe_encoder(&ff, &moeConfig, input);
+  // Tensor t = create_moe_encoder(&ff, &moeConfig, input);
   Tensor t = create_moe(&ff, &moeConfig, input);
   t = ff.dense(t, OUT_DIM, AC_MODE_RELU);
   InferenceManager im(&ff, num_requests_per_batch, num_inflight_batches);
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index 7991548b44..5c9fe5f497 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -23,16 +23,17 @@ class FFModel;
 
 class InferenceManager {
 public:
-  InferenceManager(FFModel* _model,
+  InferenceManager(FFModel *_model,
                    int max_num_requests_per_batch,
                    int max_num_inflight_batches);
   void compile_model_and_allocate_buffer(void);
   void inference(int index);
+
 public:
-  std::unordered_map<ParallelTensor, std::vector<ParallelTensor> > tensor_buffer;
-  FFModel* model;
+  std::unordered_map<ParallelTensor, std::vector<ParallelTensor>> tensor_buffer;
+  FFModel *model;
   int max_num_requests_per_batch;
   int max_num_inflight_batches;
 };
 
-}
+} // namespace FlexFlow
diff --git a/include/flexflow/ops/experts.h b/include/flexflow/ops/experts.h
index 9b05270f79..bd27e8be24 100644
--- a/include/flexflow/ops/experts.h
+++ b/include/flexflow/ops/experts.h
@@ -35,9 +35,9 @@ class Experts : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   void inference(FFModel const &,
-                      std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &,
-                      MachineView const *mv = nullptr) override;
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &,
+                 MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override;
   void serialize(Legion::Serializer &) const override;
   static PCG::Node deserialize(FFModel &ff,
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index 368ed9b93d..517190f7b8 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -45,17 +45,24 @@ bool operator==(ExpertsParams const &lhs, ExpertsParams const &rhs) {
 
 bool ExpertsParams::is_valid(
     std::pair<ParallelTensorShape, ParallelTensorShape> const &input) const {
-  if (!input.first.is_valid())
+  if (!input.first.is_valid()) {
     return false;
-  if (!input.second.is_valid())
+  }
+  if (!input.second.is_valid()) {
     return false;
-  if (input.first.num_dims != input.second.num_dims + 1)
+  }
+  if (input.first.num_dims != input.second.num_dims + 1) {
     return false;
-  if (input.second.data_type != DT_INT32 && input.second.data_type != DT_INT64)
+  }
+  if (input.second.data_type != DT_INT32 &&
+      input.second.data_type != DT_INT64) {
     return false;
-  for (int i = 0; i < input.second.num_dims; i++)
-    if (input.second.dims[i] != input.first.dims[i + 1])
+  }
+  for (int i = 0; i < input.second.num_dims; i++) {
+    if (input.second.dims[i] != input.first.dims[i + 1]) {
       return false;
+    }
+  }
   return true;
 }
 
@@ -87,13 +94,15 @@ Tensor FFModel::experts(const Tensor input,
                        input,
                        indices);
   assert(input->num_dims == indices->num_dims);
-  for (int i = 1; i < indices->num_dims; i++)
+  for (int i = 1; i < indices->num_dims; i++) {
     assert(input->dims[i] == indices->dims[i]);
+  }
   assert(indices->data_type == DT_INT32 || indices->data_type == DT_INT64);
   int dims[MAX_TENSOR_DIM];
   int numdim = input->num_dims;
-  for (int i = 1; i < input->num_dims; i++)
+  for (int i = 1; i < input->num_dims; i++) {
     dims[i] = input->dims[i];
+  }
   dims[0] = experts_output_dim_size;
   e->outputs[0] = create_tensor_legion_ordering(
       numdim, dims, input->data_type, e, 0, true /*create_grad*/);
@@ -170,15 +179,17 @@ Experts::Experts(FFModel &model,
       experts_internal_dim_size(_experts_internal_dim_size) {
   assert(input->num_dims == indices->num_dims);
   assert(indices->data_type == DT_INT32 || indices->data_type == DT_INT64);
-  for (int i = 1; i < indices->num_dims; i++)
+  for (int i = 1; i < indices->num_dims; i++) {
     assert(input->dims[i] == indices->dims[i]);
+  }
   // Assume that we don't parallelize the channel dim of input
   // nor the expert_assigned dim of indices
   assert(input->dims[0].degree == 1);
   assert(indices->dims[0].degree == 1);
   ParallelDim dims[MAX_TENSOR_DIM];
-  for (int i = 0; i < input->num_dims; i++)
+  for (int i = 0; i < input->num_dims; i++) {
     dims[i] = input->dims[i];
+  }
   dims[0].size = experts_output_dim_size;
   numOutputs = 1;
   outputs[0] = model.create_parallel_tensor_legion_ordering(
@@ -295,9 +306,9 @@ void Experts::backward_task(Task const *task,
 }
 
 void Experts::inference(FFModel const &ff,
-                             std::vector<ParallelTensor> const &batch_inputs,
-                             std::vector<ParallelTensor> const &batch_outputs,
-                             MachineView const *mv) {
+                        std::vector<ParallelTensor> const &batch_inputs,
+                        std::vector<ParallelTensor> const &batch_outputs,
+                        MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 71fe0ec6f9..be572848be 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -22,22 +22,21 @@ using namespace Legion;
 InferenceManager::InferenceManager(FFModel *_model,
                                    int _max_num_requests_per_batch,
                                    int _max_num_inflight_batches)
-  : model(_model),
-    max_num_requests_per_batch(_max_num_requests_per_batch),
-    max_num_inflight_batches(_max_num_inflight_batches) {
-
-}
+    : model(_model), max_num_requests_per_batch(_max_num_requests_per_batch),
+      max_num_inflight_batches(_max_num_inflight_batches) {}
 
 void InferenceManager::compile_model_and_allocate_buffer(void) {
   std::vector<MetricsType> metrics;
   model->config.batchSize = max_num_requests_per_batch;
-  model->compile(LOSS_MEAN_SQUARED_ERROR_AVG_REDUCE, metrics, COMP_MODE_INFERENCE);
+  model->compile(
+      LOSS_MEAN_SQUARED_ERROR_AVG_REDUCE, metrics, COMP_MODE_INFERENCE);
   Context ctx = model->config.lg_ctx;
   Runtime *runtime = model->config.lg_hlr;
-  for (const auto& op : model->operators) {
+  for (auto const &op : model->operators) {
     // Skip weight operators
-    if (op->op_type == OP_WEIGHT)
+    if (op->op_type == OP_WEIGHT) {
       continue;
+    }
     for (int i = 0; i < op->numOutputs; i++) {
       ParallelTensor pt_base = op->outputs[i];
       assert(tensor_buffer.find(pt_base) == tensor_buffer.end());
@@ -45,10 +44,12 @@ void InferenceManager::compile_model_and_allocate_buffer(void) {
       for (int j = 0; j < max_num_inflight_batches; j++) {
         // Copy the metadata from pt_base to pt
         ParallelTensor pt = new ParallelTensorBase(*pt_base);
-        pt->region = runtime->create_logical_region(ctx,
-                                                    pt_base->region.get_index_space(),
-                                                    pt_base->region.get_field_space());
-        pt->part = runtime->get_logical_partition(ctx, pt->region, pt_base->part.get_index_partition());
+        pt->region =
+            runtime->create_logical_region(ctx,
+                                           pt_base->region.get_index_space(),
+                                           pt_base->region.get_field_space());
+        pt->part = runtime->get_logical_partition(
+            ctx, pt->region, pt_base->part.get_index_partition());
         list.push_back(pt);
       }
       tensor_buffer[pt_base] = list;
@@ -59,15 +60,17 @@ void InferenceManager::compile_model_and_allocate_buffer(void) {
 void InferenceManager::inference(int index) {
   assert(index < max_num_inflight_batches);
   for (size_t o = 0; o < model->operators.size(); o++) {
-    Op* op = model->operators[o];
+    Op *op = model->operators[o];
     std::vector<ParallelTensor> inputs(op->numInputs);
     std::vector<ParallelTensor> outputs(op->numOutputs);
-    for (int i = 0; i < op->numInputs; i++)
+    for (int i = 0; i < op->numInputs; i++) {
       inputs[i] = tensor_buffer[op->inputs[i]][index];
-    for (int i = 0; i < op->numOutputs; i++)
+    }
+    for (int i = 0; i < op->numOutputs; i++) {
       outputs[i] = tensor_buffer[op->outputs[i]][index];
+    }
     op->inference(*model, inputs, outputs);
   }
 };
 
-};
+}; // namespace FlexFlow

From 748bad7e4bc5d5b9f9f3c0502e51a000cb86aabf Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 19 Jan 2023 13:04:20 -0500
Subject: [PATCH 048/344] [Inference][Experts OP] - Fix several bugs and seg
 fault

---
 config/config.linux                              |  4 ++--
 examples/cpp/inference/mixture_of_experts/moe.cc |  8 ++++----
 include/flexflow/model.h                         |  1 +
 include/flexflow/ops/aggregate.h                 |  2 +-
 src/ops/experts.cc                               | 10 +++++-----
 src/runtime/graph.cc                             |  5 +++++
 src/runtime/model.cc                             |  5 +++++
 7 files changed, 23 insertions(+), 12 deletions(-)

diff --git a/config/config.linux b/config/config.linux
index 0f819f4031..28cf7c2fe1 100755
--- a/config/config.linux
+++ b/config/config.linux
@@ -38,8 +38,8 @@ FF_USE_GASNET=${FF_USE_GASNET:-OFF}
 FF_GASNET_CONDUIT=${FF_GASNET_CONDUIT:-ibv}
 
 # build C++ examples
-FF_BUILD_ALL_EXAMPLES=${FF_BUILD_ALL_EXAMPLES:-ON}
-FF_BUILD_ALL_INFERENCE_EXAMPLES=${FF_BUILD_ALL_INFERENCE_EXAMPLES:-ON}
+FF_BUILD_ALL_EXAMPLES=${FF_BUILD_ALL_EXAMPLES:-OFF}
+FF_BUILD_ALL_INFERENCE_EXAMPLES=${FF_BUILD_ALL_INFERENCE_EXAMPLES:-OFF}
 
 # build C++ unit tests
 FF_BUILD_UNIT_TESTS=${FF_BUILD_UNIT_TESTS:-OFF}
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index f0823a9b80..a72ef584d2 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -57,9 +57,9 @@ Tensor create_moe(FFModel *model,
         moeConfig->hidden_size /*internal_size*/);
     agg_inputs[i + 4] = exp_pred;
   }
-  for (int i = 0; i < moeConfig->num_exp + 4; i++) {
-    agg_inputs[i]->print("agg_inputs[i]");
-  }
+  // for (int i = 0; i < moeConfig->num_exp + 4; i++) {
+  //   agg_inputs[i]->print("agg_inputs[i]");
+  // }
   Tensor coop_output =
       model->aggregate(agg_inputs, moeConfig->num_exp, moeConfig->lambda);
   // model->get_metrics();
@@ -131,7 +131,7 @@ void FlexFlow::top_level_task(Task const *task,
   Tensor t = create_moe(&ff, &moeConfig, input);
   t = ff.dense(t, OUT_DIM, AC_MODE_RELU);
   InferenceManager im(&ff, num_requests_per_batch, num_inflight_batches);
-  // im.compile_model_and_allocate_buffer();
+  im.compile_model_and_allocate_buffer();
   ff.init_operators();
 
   // Data Loader
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 0545cc7fbb..b187629483 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -675,6 +675,7 @@ class FFModel {
     auto input_shapes = get_input_shape<typename T::Input>(input);
 
     if (!params.is_valid(input_shapes)) {
+      printf("!params.is_valid(input_shapes)\n");
       return PCG::Node::INVALID_NODE;
     }
 
diff --git a/include/flexflow/ops/aggregate.h b/include/flexflow/ops/aggregate.h
index 6e4dd0b4ac..bd757c6911 100644
--- a/include/flexflow/ops/aggregate.h
+++ b/include/flexflow/ops/aggregate.h
@@ -8,7 +8,7 @@ namespace FlexFlow {
 
 #define AGGREGATE_MAX_K 4
 #define AGGREGATE_MAX_BATCH_SIZE 64
-#define AGGREGATE_MAX_N 12
+#define AGGREGATE_MAX_N 128
 
 class AggregateMeta : public OpMeta {
 public:
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index 517190f7b8..540c7b2abd 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -51,15 +51,15 @@ bool ExpertsParams::is_valid(
   if (!input.second.is_valid()) {
     return false;
   }
-  if (input.first.num_dims != input.second.num_dims + 1) {
+  if (input.first.num_dims != input.second.num_dims) {
     return false;
   }
   if (input.second.data_type != DT_INT32 &&
       input.second.data_type != DT_INT64) {
     return false;
   }
-  for (int i = 0; i < input.second.num_dims; i++) {
-    if (input.second.dims[i] != input.first.dims[i + 1]) {
+  for (int i = 1; i < input.second.num_dims; i++) {
+    if (input.second.dims[i] != input.first.dims[i]) {
       return false;
     }
   }
@@ -89,7 +89,7 @@ Tensor FFModel::experts(const Tensor input,
                        DT_FLOAT,
                        name,
                        2 /*inputs*/,
-                       1 /*weights*/,
+                       0 /*weights*/, // to be changed back to 1
                        1 /*outputs*/,
                        input,
                        indices);
@@ -169,7 +169,7 @@ Experts::Experts(FFModel &model,
          DT_FLOAT,
          name,
          2 /*inputs*/,
-         1 /*weights*/,
+         0 /*weights*/, // to be changed back to 1
          1 /*outputs*/,
          input,
          indices),
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index 837585ae15..85f5132f6f 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -25,6 +25,7 @@
 #include "flexflow/ops/element_binary.h"
 #include "flexflow/ops/element_unary.h"
 #include "flexflow/ops/embedding.h"
+#include "flexflow/ops/experts.h"
 #include "flexflow/ops/flat.h"
 #include "flexflow/ops/groupby.h"
 #include "flexflow/ops/layer_norm.h"
@@ -2072,6 +2073,10 @@ void FFModel::deserialize_graph_optimal_view(
             {std::begin(inputs), std::begin(inputs) + num_inputs}, params);
         break;
       }
+      case OP_EXPERTS: {
+        node = Experts::deserialize(*this, dez, inputs, num_inputs);
+        break;
+      }
       case OP_POOL2D: {
         node = Pool2D::deserialize(*this, dez, inputs, num_inputs);
         break;
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 7350735314..770292a6f2 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -2764,6 +2764,11 @@ Op *FFModel::create_operator_from_layer(
       operators.push_back(op);
       return op;
     }
+    case OP_EXPERTS: {
+      Op *op = Experts::create_operator_from_layer(*this, layer, inputs);
+      operators.push_back(op);
+      return op;
+    }
     default:
       assert(false);
   }

From 4e0f568dee141ff5c1ec26c68872ac94981a603c Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 19 Jan 2023 21:07:23 -0500
Subject: [PATCH 049/344] removed unnecessary changes

---
 src/ops/aggregate.cc | 2 --
 src/ops/group_by.cpp | 2 +-
 src/ops/group_by.cu  | 2 +-
 3 files changed, 2 insertions(+), 4 deletions(-)

diff --git a/src/ops/aggregate.cc b/src/ops/aggregate.cc
index 49e564a702..b64238125c 100644
--- a/src/ops/aggregate.cc
+++ b/src/ops/aggregate.cc
@@ -301,8 +301,6 @@ void Aggregate::forward_task(Task const *task,
                              Runtime *runtime) {
   assert(regions.size() == task->regions.size());
   int n = regions.size() - 3;
-  // FIXME: skip the aggregate computation for now
-  return;
 
   AggregateMeta const *m = *((AggregateMeta **)task->local_args);
 
diff --git a/src/ops/group_by.cpp b/src/ops/group_by.cpp
index e0b914cf1a..f45e9092a5 100644
--- a/src/ops/group_by.cpp
+++ b/src/ops/group_by.cpp
@@ -193,4 +193,4 @@ GroupByMeta::~GroupByMeta(void) {
   checkCUDA(hipFree(&dev_region_ptrs));
 }
 
-}; // namespace FlexFlow
\ No newline at end of file
+}; // namespace FlexFlow
diff --git a/src/ops/group_by.cu b/src/ops/group_by.cu
index ac29904e9f..ee0b18337c 100644
--- a/src/ops/group_by.cu
+++ b/src/ops/group_by.cu
@@ -203,4 +203,4 @@ GroupByMeta::~GroupByMeta(void) {
   checkCUDA(cudaFree(&dev_region_ptrs));
 }
 
-}; // namespace FlexFlow
\ No newline at end of file
+}; // namespace FlexFlow

From 0733c94a5758ba5567d9bc6eddfbc27f1e1611a4 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 26 Jan 2023 11:53:49 -0500
Subject: [PATCH 050/344] Implement Experts operator (#582)

* backup

* finished all experts layer, except kernels

* moved deserializer back into ops, fixed initialization bug in aggregate

* save file

* bug fixes

* comment out assert for now

* finished kernel implementation

* fix hip build

* clang

* rename tensor

* fix
---
 .../cpp/inference/mixture_of_experts/moe.cc   | 115 ++--
 .../cpp/inference/mixture_of_experts/moe.h    |   4 +-
 include/flexflow/model.h                      |  21 +-
 include/flexflow/ops/aggregate.h              |   6 +-
 include/flexflow/ops/experts.h                |  36 +-
 include/flexflow/ops/experts_params.h         |   6 +-
 src/ops/aggregate.cc                          |  16 +
 src/ops/experts.cc                            | 522 ++++++++++++------
 src/ops/experts.cpp                           | 148 +++++
 src/ops/experts.cu                            | 150 +++++
 src/runtime/graph.cc                          |  22 +-
 src/runtime/model.cc                          |  17 +-
 src/runtime/substitution.cc                   |   8 +
 13 files changed, 821 insertions(+), 250 deletions(-)
 create mode 100644 src/ops/experts.cpp
 create mode 100644 src/ops/experts.cu

diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index a72ef584d2..e6f9a51d21 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -40,30 +40,29 @@ Tensor create_moe(FFModel *model,
   Tensor gate_preds = model->dense(input, moeConfig->num_exp, AC_MODE_RELU);
   Tensor topK_output[2];
   model->top_k(gate_preds, topK_output, moeConfig->num_select, false);
-  Tensor agg_inputs[moeConfig->num_exp + 4];
-  agg_inputs[0] = model->softmax(topK_output[0]); // gate preds
-  agg_inputs[1] = topK_output[1];                 // gate assign
-  agg_inputs[2] = topK_output[1]; // gate assign TopK (for cache)
-  agg_inputs[3] = gate_preds;     // full gate preds
-  assert(moeConfig->num_exp % moeConfig->fused_exp_block_size == 0);
-  for (int i = 0; i < moeConfig->num_exp /*number of experts layers*/; i++) {
-    Tensor exp_pred = model->experts(
-        gate_preds,
-        topK_output[1],
-        moeConfig->fused_exp_block_size /*number of experts*/,
-        moeConfig->fused_exp_block_size * i /*expert start index*/,
-        1 /*number of linear layers*/,
-        moeConfig->hidden_size /*output_size*/,
-        moeConfig->hidden_size /*internal_size*/);
-    agg_inputs[i + 4] = exp_pred;
+
+  assert(moeConfig->num_exp % moeConfig->experts_per_block == 0);
+  int nblocks = moeConfig->num_exp / moeConfig->experts_per_block;
+  Tensor exp_preds;
+  Tensor expert_block_inputs[3] = {input, topK_output[1], topK_output[0]};
+  for (int i = 0; i < nblocks /*number of experts layers*/; i++) {
+    Tensor block_preds =
+        model->experts(expert_block_inputs,
+                       moeConfig->experts_per_block,     /*number of experts*/
+                       moeConfig->experts_per_block * i, /*expert start index*/
+                       moeConfig->hidden_size,           /*output_size*/
+                       moeConfig->alpha);
+    assert(block_preds != nullptr);
+    if (i == 0) {
+      exp_preds = block_preds;
+    } else {
+      assert(exp_preds != nullptr);
+      model->add(exp_preds, block_preds, /*inplace_a*/ true);
+    }
   }
-  // for (int i = 0; i < moeConfig->num_exp + 4; i++) {
-  //   agg_inputs[i]->print("agg_inputs[i]");
-  // }
-  Tensor coop_output =
-      model->aggregate(agg_inputs, moeConfig->num_exp, moeConfig->lambda);
+
   // model->get_metrics();
-  return coop_output;
+  return exp_preds;
 }
 
 Tensor create_moe_encoder(FFModel *model,
@@ -94,14 +93,14 @@ void FlexFlow::top_level_task(Task const *task,
                               std::vector<PhysicalRegion> const &regions,
                               Context ctx,
                               Runtime *runtime) {
-  // Inference parameters
+  /* // Inference parameters
   int total_requests =
       256; // total number of requests processed as part of the simulation
   int request_tensor_size = 4; // request tensor dimensions
   bool poisson_distribution = true;
   double lambda = 25; // average number of request arrivals per second
   int num_requests_per_batch = 5;
-  int num_inflight_batches = 10;
+  int num_inflight_batches = 10; */
 
   //-----------------------------------------------------------------
 
@@ -130,9 +129,15 @@ void FlexFlow::top_level_task(Task const *task,
   // Tensor t = create_moe_encoder(&ff, &moeConfig, input);
   Tensor t = create_moe(&ff, &moeConfig, input);
   t = ff.dense(t, OUT_DIM, AC_MODE_RELU);
-  InferenceManager im(&ff, num_requests_per_batch, num_inflight_batches);
-  im.compile_model_and_allocate_buffer();
-  ff.init_operators();
+
+  /* InferenceManager im(&ff, num_requests_per_batch, num_inflight_batches);
+  im.compile_model_and_allocate_buffer(); */
+
+  Optimizer *optimizer = new SGDOptimizer(&ff, 0.001f);
+  std::vector<MetricsType> metrics;
+  metrics.push_back(METRICS_ACCURACY);
+  metrics.push_back(METRICS_SPARSE_CATEGORICAL_CROSSENTROPY);
+  ff.compile(optimizer, LOSS_SPARSE_CATEGORICAL_CROSSENTROPY, metrics);
 
   // Data Loader
   ParallelTensor input_pt, label_pt;
@@ -140,6 +145,8 @@ void FlexFlow::top_level_task(Task const *task,
   ff.get_parallel_tensor_from_tensor(ff.label_tensor, label_pt);
   DataLoader data_loader(ff, moeConfig, input_pt, label_pt);
 
+  ff.init_operators();
+
   //-----------------------------------------------------------------
 
   // Start timer
@@ -153,20 +160,50 @@ void FlexFlow::top_level_task(Task const *task,
 
   ///////////////////////////////////////////////////////////////////////////////////
 
-  int index = 0;
-  int processed_requests = 0;
-  Generator data_generator(
-      total_requests, request_tensor_size, poisson_distribution, lambda);
-  while (processed_requests < total_requests) {
-    vector<vector<double>> req = data_generator.get_requests();
-    int iterations = req.size();
+  // int index = 0;
+  // int processed_requests = 0;
+  // Generator data_generator(
+  //     total_requests, request_tensor_size, poisson_distribution, lambda);
+  // while (processed_requests < total_requests) {
+  //   vector<vector<double>> req = data_generator.get_requests();
+  //   int iterations = req.size();
+  //   for (int iter = 0; iter < iterations; iter++) {
+  //     // data_loader.next_batch(ff);
+  //     runtime->begin_trace(ctx, 111 /*trace_id*/);
+  //     im.inference((index++) % num_inflight_batches);
+  //     runtime->end_trace(ctx, 111 /*trace_id*/);
+  //   }
+  //   processed_requests += iterations;
+  // }
+
+  for (int epoch = 0; epoch < ffConfig.epochs; epoch++) {
+    data_loader.reset();
+    ff.reset_metrics();
+    int iterations = TRAIN_SAMPLES / ffConfig.batchSize;
+
     for (int iter = 0; iter < iterations; iter++) {
-      // data_loader.next_batch(ff);
-      runtime->begin_trace(ctx, 111 /*trace_id*/);
-      im.inference((index++) % num_inflight_batches);
-      runtime->end_trace(ctx, 111 /*trace_id*/);
+      data_loader.next_batch(ff);
+      if (epoch > 0) {
+        runtime->begin_trace(ctx, 111 /*trace_id*/);
+      }
+      ff.forward();
+      ff.zero_gradients();
+      // ff.backward();
+      ff.update();
+      // ff.recompile_on_condition(r);
+      if (epoch > 0) {
+        runtime->end_trace(ctx, 111 /*trace_id*/);
+      }
     }
-    processed_requests += iterations;
+
+    // TODO: Do properly
+    ff.reset_metrics();
+    // iterations = TEST_SAMPLES / ffConfig.batchSize;
+    // for (int iter = 0; iter < iterations; iter++) {
+    //   data_loader.next_batch(ff);
+    //   ff.forward();
+    //   ff.backward();
+    // }
   }
 
   ///////////////////////////////////////////////////////////////////////////////////
diff --git a/examples/cpp/inference/mixture_of_experts/moe.h b/examples/cpp/inference/mixture_of_experts/moe.h
index ed7b5af483..80cef3ff87 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.h
+++ b/examples/cpp/inference/mixture_of_experts/moe.h
@@ -34,7 +34,7 @@ struct MoeConfig {
     // total number of experts
     num_exp = 128;
     // number of experts in each block of fused experts
-    fused_exp_block_size = 32;
+    experts_per_block = 32;
     // number of experts to route each token to
     num_select = 2;
     alpha = 2.0f;
@@ -48,7 +48,7 @@ struct MoeConfig {
   // MoE layer
   int num_exp;
   int num_select;
-  int fused_exp_block_size;
+  int experts_per_block;
   float alpha;  // factor overhead tensor size for imbalance
   float lambda; // multiplier for load balance term
   int hidden_size;
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index b187629483..9ad9d52eab 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -57,7 +57,6 @@ enum TaskIDs {
   EXPERTS_INIT_TASK_ID,
   EXPERTS_FWD_TASK_ID,
   EXPERTS_BWD_TASK_ID,
-  EXPERTS_INF_TASK_ID,
   CONV2D_INIT_TASK_ID,
   CONV2D_INIT_PARA_TASK_ID,
   CONV2D_FWD_TASK_ID,
@@ -484,14 +483,15 @@ class FFModel {
   Tensor
       concat(int n, Tensor const *tensors, int axis, char const *name = NULL);
   // Add an experts layer
-  Tensor experts(const Tensor input,
-                 const Tensor indices,
-                 int num_experts,
-                 int experts_start_idx,
-                 int experts_num_layers,
-                 int experts_output_dim_size,
-                 int experts_internal_dim_size,
-                 char const *name = nullptr);
+  Tensor experts(
+      Tensor const *inputs,
+      int num_experts,
+      int experts_start_idx,
+      int experts_output_dim_size,
+      float alpha,
+      int experts_num_layers = 1,        // number of linear layers per expert
+      int experts_internal_dim_size = 0, // hidden dimension for internal layers
+      char const *name = NULL);
   // Add a mean layer
   Tensor mean(const Tensor input,
               std::vector<int> const &dims,
@@ -865,8 +865,7 @@ class FFModel {
       std::unordered_map<std::pair<ParallelTensorShape, EmbeddingParams>,
                          Embedding *>,
       std::unordered_map<
-          std::pair<std::pair<ParallelTensorShape, ParallelTensorShape>,
-                    ExpertsParams>,
+          std::pair<std::vector<ParallelTensorShape>, ExpertsParams>,
           Experts *>,
       std::unordered_map<std::pair<ParallelTensorShape, FlatParams>, Flat *>,
 
diff --git a/include/flexflow/ops/aggregate.h b/include/flexflow/ops/aggregate.h
index bd757c6911..ba7240802b 100644
--- a/include/flexflow/ops/aggregate.h
+++ b/include/flexflow/ops/aggregate.h
@@ -26,7 +26,7 @@ class Aggregate : public Op {
             ParallelTensor const *inputs,
             int _n,
             float _lambda_bal,
-            char const *name);
+            char const *name = nullptr);
   Aggregate(FFModel &model,
             Aggregate const &other,
             std::vector<ParallelTensor> const &inputs);
@@ -85,6 +85,10 @@ class Aggregate : public Op {
                                       int const batch_size,
                                       int out_dim);
   void serialize(Legion::Serializer &s) const override;
+  static PCG::Node deserialize(FFModel &ff,
+                               Legion::Deserializer &d,
+                               Input const &inputs,
+                               int num_inputs);
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &mv,
                              CostMetrics &cost_metrics) const override;
diff --git a/include/flexflow/ops/experts.h b/include/flexflow/ops/experts.h
index bd27e8be24..6b875a10b9 100644
--- a/include/flexflow/ops/experts.h
+++ b/include/flexflow/ops/experts.h
@@ -1,29 +1,36 @@
 #pragma once
 
 #include "flexflow/model.h"
+#include "flexflow/ops/experts_params.h"
 
 namespace FlexFlow {
 
 class ExpertsMeta : public OpMeta {
 public:
-  ExpertsMeta(FFHandler handler) : OpMeta(handler){};
+  ExpertsMeta(FFHandler handler, int num_experts);
+  ~ExpertsMeta(void);
+  float **dev_region_ptrs;
 };
 
+// definitions for the CUDA kernel
+#define MAX_BATCH_SIZE 64
+#define MAX_EXPERTS_PER_BLOCK 32
+
 class Experts : public Op {
 public:
   using Params = ExpertsParams;
-  using Input = std::pair<ParallelTensor, ParallelTensor>;
+  using Input = std::vector<ParallelTensor>;
   Experts(FFModel &model,
           Params const &params,
           Input const &inputs,
           char const *name = nullptr);
   Experts(FFModel &model,
-          const ParallelTensor input,
-          const ParallelTensor indices,
+          ParallelTensor const *inputs,
           int _num_experts,
           int _experts_start_idx,
-          int _experts_num_layers,
           int _experts_output_dim_size,
+          float _alpha,
+          int _experts_num_layers,
           int _experts_internal_dim_size,
           char const *name = nullptr);
   static Op *
@@ -42,11 +49,8 @@ class Experts : public Op {
   void serialize(Legion::Serializer &) const override;
   static PCG::Node deserialize(FFModel &ff,
                                Legion::Deserializer &d,
-                               ParallelTensor inputs[],
+                               Input const &inputs,
                                int num_inputs);
-  Op *materialize(FFModel &ff,
-                  ParallelTensor inputs[],
-                  int num_inputs) const override;
   Params get_params() const;
   static OpMeta *init_task(Legion::Task const *task,
                            std::vector<Legion::PhysicalRegion> const &regions,
@@ -56,6 +60,17 @@ class Experts : public Op {
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
                            Legion::Runtime *runtime);
+  static void forward_kernel_wrapper(ExpertsMeta const *m,
+                                     float const *acc_input_ptr,
+                                     int const *acc_indices_ptr,
+                                     float const *acc_topk_gate_preds_ptr,
+                                     float **outputs,
+                                     int num_experts,
+                                     int experts_start_idx,
+                                     int expert_capacity,
+                                     int chosen_experts,
+                                     int batch_size,
+                                     int out_dim);
   static void backward_task(Legion::Task const *task,
                             std::vector<Legion::PhysicalRegion> const &regions,
                             Legion::Context ctx,
@@ -71,8 +86,9 @@ class Experts : public Op {
 public:
   int num_experts;
   int experts_start_idx;
-  int experts_num_layers;
   int experts_output_dim_size;
+  float alpha;
+  int experts_num_layers;
   int experts_internal_dim_size;
 };
 
diff --git a/include/flexflow/ops/experts_params.h b/include/flexflow/ops/experts_params.h
index 8f0cee4959..20a65a06f8 100644
--- a/include/flexflow/ops/experts_params.h
+++ b/include/flexflow/ops/experts_params.h
@@ -5,12 +5,12 @@
 namespace FlexFlow {
 
 struct ExpertsParams {
-  bool is_valid(
-      std::pair<ParallelTensorShape, ParallelTensorShape> const &) const;
+  bool is_valid(std::vector<ParallelTensorShape> const &) const;
   int num_experts;
   int experts_start_idx;
-  int experts_num_layers;
   int experts_output_dim_size;
+  float alpha;
+  int experts_num_layers;
   int experts_internal_dim_size;
 };
 
diff --git a/src/ops/aggregate.cc b/src/ops/aggregate.cc
index b64238125c..a1e5fcbbad 100644
--- a/src/ops/aggregate.cc
+++ b/src/ops/aggregate.cc
@@ -166,6 +166,22 @@ Aggregate::Aggregate(FFModel &model,
                      char const *name)
     : Aggregate(model, inputs.data(), params.n, params.lambda_bal, name) {}
 
+using PCG::Node;
+Node Aggregate::deserialize(FFModel &ff,
+                            Legion::Deserializer &dez,
+                            std::vector<ParallelTensor> const &inputs,
+                            int num_inputs) {
+  int n;
+  float lambda_bal;
+  dez.deserialize(n);
+  dez.deserialize(lambda_bal);
+  assert(num_inputs == n + 4);
+  AggregateParams params;
+  params.n = n;
+  params.lambda_bal = lambda_bal;
+  return ff.get_or_create_node<Aggregate>(inputs, params);
+}
+
 void Aggregate::init(FFModel const &ff) {
   assert(check_output_input_weight_same_parallel_is());
   parallel_is = outputs[0]->parallel_is;
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index 540c7b2abd..288507b6d8 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -35,84 +35,78 @@ using Legion::TaskArgument;
 using Legion::TaskLauncher;
 using PCG::Node;
 
-bool operator==(ExpertsParams const &lhs, ExpertsParams const &rhs) {
-  return lhs.num_experts == rhs.num_experts &&
-         lhs.experts_start_idx == rhs.experts_start_idx &&
-         lhs.experts_num_layers == rhs.experts_num_layers &&
-         lhs.experts_output_dim_size == rhs.experts_output_dim_size &&
-         lhs.experts_internal_dim_size == rhs.experts_internal_dim_size;
-}
-
-bool ExpertsParams::is_valid(
-    std::pair<ParallelTensorShape, ParallelTensorShape> const &input) const {
-  if (!input.first.is_valid()) {
-    return false;
-  }
-  if (!input.second.is_valid()) {
-    return false;
-  }
-  if (input.first.num_dims != input.second.num_dims) {
-    return false;
-  }
-  if (input.second.data_type != DT_INT32 &&
-      input.second.data_type != DT_INT64) {
-    return false;
-  }
-  for (int i = 1; i < input.second.num_dims; i++) {
-    if (input.second.dims[i] != input.first.dims[i]) {
-      return false;
-    }
-  }
-  return true;
-}
-
-ExpertsParams Experts::get_params() const {
-  ExpertsParams params;
-  params.num_experts = num_experts;
-  params.experts_start_idx = experts_start_idx;
-  params.experts_num_layers = experts_num_layers;
-  params.experts_output_dim_size = experts_output_dim_size;
-  params.experts_internal_dim_size = experts_internal_dim_size;
-  return params;
-}
-
-Tensor FFModel::experts(const Tensor input,
-                        const Tensor indices,
+// For now, we use one input and one output per expert
+Tensor FFModel::experts(Tensor const *inputs,
                         int num_experts,
                         int experts_start_idx,
-                        int experts_num_layers,
                         int experts_output_dim_size,
+                        float alpha,
+                        int experts_num_layers,
                         int experts_internal_dim_size,
                         char const *name) {
+
+  // Check that there are three inputs: the input tensor, the indices and the
+  // topk_gate_preds
+  assert(inputs[0] != nullptr);
+  int num_dims = inputs[0]->num_dims;
+  assert(inputs[1]->num_dims == num_dims);
+  assert(inputs[2]->num_dims == num_dims);
+  int topk = inputs[1]->dims[0];
+  assert(inputs[2]->dims[0] == topk);
+  for (int i = 1; i < num_dims; i++) {
+    assert(inputs[0]->dims[i] == inputs[1]->dims[i]);
+    assert(inputs[1]->dims[i] == inputs[2]->dims[i]);
+  }
+  // assert(input->num_dims == indices->num_dims);
+  // for (int i = 1; i < indices->num_dims; i++) {
+  //   assert(input->dims[i] == indices->dims[i]);
+  // }
+  assert(inputs[1]->data_type == DT_INT32 || inputs[1]->data_type == DT_INT64);
+
+  assert(experts_num_layers == 1 && "Multi-layer experts not implemented yet.");
+  assert(experts_num_layers == 1 || experts_internal_dim_size > 0);
+
+  Tensor fused_experts = this->dense(
+      inputs[0], num_experts * experts_output_dim_size, AC_MODE_RELU);
+  fused_experts = this->softmax(fused_experts);
+
+  Tensor const layer_inputs[3] = {fused_experts, inputs[1], inputs[2]};
+
   Layer *e = new Layer(this,
                        OP_EXPERTS,
                        DT_FLOAT,
                        name,
-                       2 /*inputs*/,
-                       0 /*weights*/, // to be changed back to 1
-                       1 /*outputs*/,
-                       input,
-                       indices);
-  assert(input->num_dims == indices->num_dims);
-  for (int i = 1; i < indices->num_dims; i++) {
-    assert(input->dims[i] == indices->dims[i]);
-  }
-  assert(indices->data_type == DT_INT32 || indices->data_type == DT_INT64);
-  int dims[MAX_TENSOR_DIM];
-  int numdim = input->num_dims;
-  for (int i = 1; i < input->num_dims; i++) {
-    dims[i] = input->dims[i];
+                       3 /*inputs*/,
+                       0 /*weights*/,
+                       num_experts /*outputs*/,
+                       layer_inputs);
+
+  {
+    int dims[MAX_TENSOR_DIM];
+    for (int i = 1; i < num_dims; i++) {
+      dims[i] = inputs[0]->dims[i];
+    }
+    dims[0] = experts_output_dim_size;
+    for (int i = 0; i < num_experts; i++) {
+      e->outputs[i] = create_tensor_legion_ordering(
+          num_dims, dims, DT_FLOAT, e, 0, true /*create_grad*/);
+      assert(e->outputs[i] != nullptr);
+    }
   }
-  dims[0] = experts_output_dim_size;
-  e->outputs[0] = create_tensor_legion_ordering(
-      numdim, dims, input->data_type, e, 0, true /*create_grad*/);
+
   e->add_int_property("num_experts", num_experts);
   e->add_int_property("experts_start_idx", experts_start_idx);
-  e->add_int_property("experts_num_layers", experts_num_layers);
   e->add_int_property("experts_output_dim_size", experts_output_dim_size);
+  e->add_float_property("alpha", alpha);
+  e->add_int_property("experts_num_layers", experts_num_layers);
   e->add_int_property("experts_internal_dim_size", experts_internal_dim_size);
   layers.push_back(e);
-  return e->outputs[0];
+
+  Tensor ret = e->outputs[0];
+  for (int i = 1; i < num_experts; i++) {
+    this->add(ret, e->outputs[i], /*inplace_a*/ true);
+  }
+  return ret;
 }
 
 Op *Experts::create_operator_from_layer(
@@ -124,115 +118,228 @@ Op *Experts::create_operator_from_layer(
   int num_experts = value;
   layer->get_int_property("experts_start_idx", value);
   int experts_start_idx = value;
-  layer->get_int_property("experts_num_layers", value);
-  int experts_num_layers = value;
   layer->get_int_property("experts_output_dim_size", value);
   int experts_output_dim_size = value;
+  float value2;
+  layer->get_float_property("alpha", value2);
+  float alpha = value2;
+  layer->get_int_property("experts_num_layers", value);
+  int experts_num_layers = value;
   layer->get_int_property("experts_internal_dim_size", value);
   int experts_internal_dim_size = value;
   return new Experts(model,
-                     inputs[0],
-                     inputs[1],
+                     inputs.data(),
                      num_experts,
                      experts_start_idx,
-                     experts_num_layers,
                      experts_output_dim_size,
+                     alpha,
+                     experts_num_layers,
                      experts_internal_dim_size,
                      layer->name);
 }
 
+ExpertsParams Experts::get_params() const {
+  ExpertsParams params;
+  params.num_experts = num_experts;
+  params.experts_start_idx = experts_start_idx;
+  params.experts_output_dim_size = experts_output_dim_size;
+  params.alpha = alpha;
+  params.experts_num_layers = experts_num_layers;
+  params.experts_internal_dim_size = experts_internal_dim_size;
+  return params;
+}
+
+bool ExpertsParams::is_valid(
+    std::vector<ParallelTensorShape> const &inputs) const {
+  if (inputs.size() != 3) {
+    printf("Number of inputs to the Experts layer is wrong\n");
+    return false;
+  }
+  if (!inputs[0].is_valid()) {
+    printf("The first tensor passed to the Experts layer is not valid\n");
+    return false;
+  }
+  if (!inputs[1].is_valid()) {
+    printf("The second tensor passed to the Experts layer is not valid\n");
+    return false;
+  }
+  if (!inputs[2].is_valid()) {
+    printf("The third tensor passed to the Experts layer is not valid\n");
+    return false;
+  }
+  if (inputs[0].num_dims != inputs[1].num_dims ||
+      inputs[1].num_dims != inputs[2].num_dims) {
+    printf("Mismatch found between the number of dimensions of the three input "
+           "tensors for the Expert layer\n");
+    return false;
+  }
+  if (inputs[0].data_type != DT_FLOAT) {
+    printf("Data type of the first input to the Experts layer is wrong!\n");
+    return false;
+  }
+  if (inputs[1].data_type != DT_INT32 && inputs[1].data_type != DT_INT64) {
+    printf("Data type of the second input to the Experts layer is wrong!\n");
+    return false;
+  }
+  if (inputs[2].data_type != DT_FLOAT) {
+    printf("Data type of the third input to the Experts layer is wrong!\n");
+    return false;
+  }
+  if (inputs[0].dims[0].size != num_experts * experts_output_dim_size) {
+    printf("Dimension 0 of input tensor 1 to the Experts layer is wrong.\n");
+    return false;
+  }
+  if (inputs[1].dims[0] != inputs[2].dims[0]) {
+    printf(
+        "Dimension mismatch between indices and topk_gate_preds tensors passed "
+        "to the Experts layer.\n");
+    return false;
+  }
+  for (int i = 1; i < inputs[0].num_dims; i++) {
+    if (inputs[0].dims[i] != inputs[1].dims[i] ||
+        inputs[1].dims[i] != inputs[2].dims[i]) {
+      printf("Dimension mismatch among the input tensors passed to the Experts "
+             "layer.\n");
+      return false;
+    }
+  }
+  return true;
+}
+
+bool operator==(ExpertsParams const &lhs, ExpertsParams const &rhs) {
+  return lhs.num_experts == rhs.num_experts &&
+         lhs.experts_start_idx == rhs.experts_start_idx &&
+         lhs.experts_output_dim_size == rhs.experts_output_dim_size &&
+         lhs.alpha == rhs.alpha &&
+         lhs.experts_num_layers == rhs.experts_num_layers &&
+         lhs.experts_internal_dim_size == rhs.experts_internal_dim_size;
+}
+
 Experts::Experts(FFModel &model,
                  ExpertsParams const &params,
-                 std::pair<ParallelTensor, ParallelTensor> const &inputs,
+                 // std::pair<ParallelTensor, ParallelTensor> const &inputs,
+                 std::vector<ParallelTensor> const &inputs,
                  char const *name)
     : Experts(model,
-              inputs.first,
-              inputs.second,
+              inputs.data(),
               params.num_experts,
               params.experts_start_idx,
-              params.experts_num_layers,
               params.experts_output_dim_size,
+              params.alpha,
+              params.experts_num_layers,
               params.experts_internal_dim_size,
               name) {}
 
 Experts::Experts(FFModel &model,
-                 const ParallelTensor input,
-                 const ParallelTensor indices,
+                 ParallelTensor const *inputs,
                  int _num_experts,
                  int _experts_start_idx,
-                 int _experts_num_layers,
                  int _experts_output_dim_size,
+                 float _alpha,
+                 int _experts_num_layers,
                  int _experts_internal_dim_size,
                  char const *name)
     : Op(model,
          OP_EXPERTS,
          DT_FLOAT,
          name,
-         2 /*inputs*/,
-         0 /*weights*/, // to be changed back to 1
-         1 /*outputs*/,
-         input,
-         indices),
+         3 /*inputs*/,
+         0 /*weights*/,
+         _num_experts /*outputs*/,
+         inputs),
       num_experts(_num_experts), experts_start_idx(_experts_start_idx),
+      experts_output_dim_size(_experts_output_dim_size), alpha(_alpha),
       experts_num_layers(_experts_num_layers),
-      experts_output_dim_size(_experts_output_dim_size),
       experts_internal_dim_size(_experts_internal_dim_size) {
-  assert(input->num_dims == indices->num_dims);
-  assert(indices->data_type == DT_INT32 || indices->data_type == DT_INT64);
-  for (int i = 1; i < indices->num_dims; i++) {
-    assert(input->dims[i] == indices->dims[i]);
+
+  assert(num_experts > 0);
+  assert(numInputs == 3);
+  assert(numOutputs == num_experts);
+
+  assert(inputs[0] != nullptr);
+  int num_dims = inputs[0]->num_dims;
+  assert(inputs[1]->num_dims == num_dims);
+  assert(inputs[2]->num_dims == num_dims);
+
+  int out_dim = num_experts * experts_output_dim_size;
+  assert(inputs[0]->dims[0].size == out_dim);
+  int topk = inputs[1]->dims[0].size;
+  assert(inputs[2]->dims[0].size == topk);
+
+  for (int i = 1; i < num_dims; i++) {
+    assert(inputs[0]->dims[i] == inputs[1]->dims[i]);
+    assert(inputs[1]->dims[i] == inputs[2]->dims[i]);
   }
+  // assert(input->num_dims == indices->num_dims);
+  // for (int i = 1; i < indices->num_dims; i++) {
+  //   assert(input->dims[i] == indices->dims[i]);
+  // }
+  assert(inputs[1]->data_type == DT_INT32 || inputs[1]->data_type == DT_INT64);
+  assert(experts_num_layers == 1 && "Multi-layer experts not implemented yet.");
+  assert(experts_num_layers == 1 || experts_internal_dim_size > 0);
+
+  // assert(input->num_dims == indices->num_dims);
+  // assert(indices->data_type == DT_INT32 || indices->data_type == DT_INT64);
+  // for (int i = 1; i < indices->num_dims; i++) {
+  //   assert(input->dims[i] == indices->dims[i]);
+  // }
+
   // Assume that we don't parallelize the channel dim of input
   // nor the expert_assigned dim of indices
-  assert(input->dims[0].degree == 1);
-  assert(indices->dims[0].degree == 1);
+  assert(inputs[0]->dims[0].degree == 1);
+  assert(inputs[1]->dims[0].degree == 1);
+  assert(inputs[2]->dims[0].degree == 1);
+
   ParallelDim dims[MAX_TENSOR_DIM];
-  for (int i = 0; i < input->num_dims; i++) {
-    dims[i] = input->dims[i];
+  for (int i = 0; i < num_dims; i++) {
+    dims[i] = inputs[0]->dims[i];
   }
   dims[0].size = experts_output_dim_size;
-  numOutputs = 1;
-  outputs[0] = model.create_parallel_tensor_legion_ordering(
-      input->num_dims, dims, input->data_type, this);
+  // numOutputs = num_experts;
+  // numWeights = 0;
+  for (int i = 0; i < num_experts; i++) {
+    outputs[i] = model.create_parallel_tensor_legion_ordering(
+        num_dims, dims, inputs[0]->data_type, this, i /*owner_idx*/);
+    assert(outputs[i] != nullptr);
+  }
 }
 
 void Experts::serialize(Legion::Serializer &sez) const {
   ExpertsParams params = get_params();
   sez.serialize(params.num_experts);
   sez.serialize(params.experts_start_idx);
-  sez.serialize(params.experts_num_layers);
   sez.serialize(params.experts_output_dim_size);
+  sez.serialize(params.alpha);
+  sez.serialize(params.experts_num_layers);
   sez.serialize(params.experts_internal_dim_size);
 }
 
 using PCG::Node;
 Node Experts::deserialize(FFModel &ff,
                           Legion::Deserializer &dez,
-                          ParallelTensor inputs[],
+                          std::vector<ParallelTensor> const &inputs,
                           int num_inputs) {
-  assert(num_inputs == 2);
-  int num_experts, experts_start_idx, experts_num_layers,
-      experts_output_dim_size, experts_internal_dim_size;
+  int num_experts, experts_start_idx, experts_output_dim_size,
+      experts_num_layers, experts_internal_dim_size;
+  float alpha;
   dez.deserialize(num_experts);
   dez.deserialize(experts_start_idx);
-  dez.deserialize(experts_num_layers);
   dez.deserialize(experts_output_dim_size);
+  dez.deserialize(alpha);
+  dez.deserialize(experts_num_layers);
   dez.deserialize(experts_internal_dim_size);
 
+  assert(num_inputs == 3);
+
   ExpertsParams params;
   params.num_experts = num_experts;
   params.experts_start_idx = experts_start_idx;
-  params.experts_num_layers = experts_num_layers;
   params.experts_output_dim_size = experts_output_dim_size;
+  params.alpha = alpha;
+  params.experts_num_layers = experts_num_layers;
   params.experts_internal_dim_size = experts_internal_dim_size;
-  return ff.get_or_create_node<Experts>({inputs[0], inputs[1]}, params);
-}
 
-Op *Experts::materialize(FFModel &ff,
-                         ParallelTensor inputs[],
-                         int num_inputs) const {
-  ExpertsParams params = get_params();
-  return new Experts(ff, params, {inputs[0], inputs[1]}, this->name);
+  return ff.get_or_create_node<Experts>(inputs, params);
 }
 
 void Experts::init(FFModel const &ff) {
@@ -250,59 +357,68 @@ void Experts::init(FFModel const &ff) {
                          false /*must*/,
                          0 /*mapper_id*/,
                          outputs[0]->machine_view.hash());
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
+OpMeta *Experts::init_task(Task const *task,
+                           std::vector<PhysicalRegion> const &regions,
+                           Context ctx,
+                           Runtime *runtime) {
+  Experts const *exp = (Experts *)task->args;
+  FFHandler handle = *((FFHandler const *)task->local_args);
+  ExpertsMeta *m = new ExpertsMeta(handle, exp->num_experts);
+  m->profiling = exp->profiling;
+  return m;
+}
+
+void Experts::forward(FFModel const &ff) {
+  // assert(false && "Experts is designed for inference only");
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_forward(ff, argmap);
+  IndexLauncher launcher(EXPERTS_FWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(Experts)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  // expert predictions
   launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
                                                     EXCLUSIVE,
                                                     inputs[0]->region));
   launcher.add_field(0, FID_DATA);
+  // expert assignment indices
   launcher.add_region_requirement(RegionRequirement(inputs[1]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
                                                     EXCLUSIVE,
                                                     inputs[1]->region));
   launcher.add_field(1, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+  // topk_gate_preds
+  launcher.add_region_requirement(RegionRequirement(inputs[2]->part,
                                                     0 /*projection id*/,
-                                                    WRITE_ONLY,
+                                                    READ_ONLY,
                                                     EXCLUSIVE,
-                                                    outputs[0]->region));
+                                                    inputs[2]->region));
   launcher.add_field(2, FID_DATA);
-  FutureMap fm = runtime->execute_index_space(ctx, launcher);
-  fm.wait_all_results();
-  set_opmeta_from_futuremap(ff, fm);
-}
-
-OpMeta *Experts::init_task(Task const *task,
-                           std::vector<PhysicalRegion> const &regions,
-                           Context ctx,
-                           Runtime *runtime) {
-  Experts const *bmm = (Experts *)task->args;
-  FFHandler handle = *((FFHandler const *)task->local_args);
-  ExpertsMeta *m = new ExpertsMeta(handle);
-  return m;
-}
-
-void Experts::forward(FFModel const &ff) {
-  assert(false && "Experts is designed for inference only");
-}
-
-void Experts::forward_task(Task const *task,
-                           std::vector<PhysicalRegion> const &regions,
-                           Context ctx,
-                           Runtime *runtime) {
-  assert(false && "Experts is designed for inference only");
-}
-
-void Experts::backward(FFModel const &ff) {
-  assert(false && "Experts is designed for inference only");
-}
-
-void Experts::backward_task(Task const *task,
-                            std::vector<PhysicalRegion> const &regions,
-                            Context ctx,
-                            Runtime *runtime) {
-  assert(false && "Experts is designed for inference only");
+  for (int i = 0; i < num_experts; i++) {
+    // expert output per token (only the chosen experts have non-zero
+    // contributions)
+    launcher.add_region_requirement(RegionRequirement(outputs[i]->part,
+                                                      0 /*projection id*/,
+                                                      WRITE_ONLY,
+                                                      EXCLUSIVE,
+                                                      outputs[i]->region));
+    launcher.add_field(i + 3, FID_DATA);
+  }
+  runtime->execute_index_space(ctx, launcher);
 }
 
 void Experts::inference(FFModel const &ff,
@@ -314,40 +430,125 @@ void Experts::inference(FFModel const &ff,
   Runtime *runtime = ff.config.lg_hlr;
   set_argumentmap_for_forward(ff, argmap);
   size_t machine_view_hash = mv ? mv->hash() : outputs[0]->machine_view.hash();
-  IndexLauncher launcher(EXPERTS_INF_TASK_ID,
+  IndexLauncher launcher(EXPERTS_FWD_TASK_ID,
                          parallel_is,
-                         TaskArgument(nullptr, 0),
+                         TaskArgument(this, sizeof(Experts)),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
                          machine_view_hash);
-  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+  // expert predictions
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
                                                     EXCLUSIVE,
-                                                    batch_inputs[0]->region));
+                                                    inputs[0]->region));
   launcher.add_field(0, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
+  // expert assignment indices
+  launcher.add_region_requirement(RegionRequirement(inputs[1]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
                                                     EXCLUSIVE,
-                                                    batch_inputs[1]->region));
+                                                    inputs[1]->region));
   launcher.add_field(1, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+  // topk_gate_preds
+  launcher.add_region_requirement(RegionRequirement(inputs[2]->part,
                                                     0 /*projection id*/,
-                                                    WRITE_ONLY,
+                                                    READ_ONLY,
                                                     EXCLUSIVE,
-                                                    batch_outputs[0]->region));
+                                                    inputs[2]->region));
   launcher.add_field(2, FID_DATA);
+  for (int i = 0; i < num_experts; i++) {
+    // expert output per token (only the chosen experts have non-zero
+    // contributions)
+    launcher.add_region_requirement(RegionRequirement(outputs[i]->part,
+                                                      0 /*projection id*/,
+                                                      WRITE_ONLY,
+                                                      EXCLUSIVE,
+                                                      outputs[i]->region));
+    launcher.add_field(i + 3, FID_DATA);
+  }
   runtime->execute_index_space(ctx, launcher);
 }
 
-void Experts::inference_task(Task const *task,
-                             std::vector<PhysicalRegion> const &regions,
-                             Context ctx,
-                             Runtime *runtime) {
-  // TODO: to be implemented
+void Experts::forward_task(Task const *task,
+                           std::vector<PhysicalRegion> const &regions,
+                           Context ctx,
+                           Runtime *runtime) {
+  assert(regions.size() == task->regions.size());
+  int num_experts = regions.size() - 3;
+
+  Experts const *exp = (Experts *)task->args;
+  assert(exp != nullptr);
+  assert(exp->num_experts == num_experts);
+  float alpha = exp->alpha;
+  int experts_start_idx = exp->experts_start_idx;
+
+  ExpertsMeta const *m = *((ExpertsMeta **)task->local_args);
+
+  // get input, indices, topk_gate_preds
+  AccessorRO<float, 3> const acc_input(regions[0], FID_DATA);
+  AccessorRO<int, 3> const acc_indices(regions[1], FID_DATA);
+  AccessorRO<float, 3> const acc_topk_gate_pred(regions[2], FID_DATA);
+  Rect<3> rect_input = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  Rect<3> rect_indices = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+  Rect<3> rect_topk_gate_pred = runtime->get_index_space_domain(
+      ctx, task->regions[2].region.get_index_space());
+
+  coord_t batch_size = rect_input.hi[1] - rect_input.lo[1] + 1;
+  assert(batch_size == rect_indices.hi[1] - rect_indices.lo[1] + 1);
+  assert(batch_size ==
+         rect_topk_gate_pred.hi[1] - rect_topk_gate_pred.lo[1] + 1);
+  coord_t chosen_experts = rect_indices.hi[0] - rect_indices.lo[0];
+  assert(chosen_experts ==
+         rect_topk_gate_pred.hi[0] - rect_topk_gate_pred.lo[0]);
+  coord_t out_dim = (rect_input.hi[0] - rect_input.lo[0] + 1) / num_experts;
+
+  int expert_capacity =
+      ceil(alpha * (int)chosen_experts / num_experts * (int)batch_size);
+
+  assert(batch_size <= MAX_BATCH_SIZE &&
+         "batch size exceeds MAX_BATCH_SIZE defined in experts.h");
+  assert(
+      num_experts <= MAX_EXPERTS_PER_BLOCK &&
+      "number of experts exceeds MAX_EXPERTS_PER_BLOCK defined in experts.h");
+
+  float *outputs[num_experts];
+  for (int i = 0; i < num_experts; i++) {
+    Rect<3> rect_output = runtime->get_index_space_domain(
+        ctx, task->regions[3 + i].region.get_index_space());
+    assert((rect_output.hi[0] - rect_output.lo[0] + 1) == out_dim);
+    assert((rect_output.hi[1] - rect_output.lo[1] + 1) == batch_size);
+    outputs[i] = helperGetTensorPointerWO<float>(
+        regions[3 + i], task->regions[3 + i], FID_DATA, ctx, runtime);
+    assert(outputs[i] != nullptr);
+  }
+
+  Experts::forward_kernel_wrapper(m,
+                                  acc_input.ptr(rect_input),
+                                  acc_indices.ptr(rect_indices),
+                                  acc_topk_gate_pred.ptr(rect_topk_gate_pred),
+                                  outputs,
+                                  num_experts,
+                                  experts_start_idx,
+                                  expert_capacity,
+                                  chosen_experts,
+                                  batch_size,
+                                  out_dim);
+}
+
+void Experts::backward(FFModel const &ff) {
+  assert(false && "Experts is designed for inference only");
+}
+
+void Experts::backward_task(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
+  assert(false && "Experts is designed for inference only");
 }
 
 void Experts::print_layer(FFModel const &ff) {
@@ -358,7 +559,7 @@ bool Experts::measure_operator_cost(Simulator *sim,
                                     MachineView const &c,
                                     CostMetrics &cost_metrics) const {
   // This is an inference only operator
-  assert(false);
+  assert(false && "Experts is designed for inference only");
   return false;
 }
 
@@ -370,8 +571,9 @@ size_t hash<FlexFlow::ExpertsParams>::operator()(
   size_t key = 0;
   hash_combine(key, params.num_experts);
   hash_combine(key, params.experts_start_idx);
-  hash_combine(key, params.experts_num_layers);
   hash_combine(key, params.experts_output_dim_size);
+  hash_combine(key, params.alpha);
+  hash_combine(key, params.experts_num_layers);
   hash_combine(key, params.experts_internal_dim_size);
   return key;
 }
diff --git a/src/ops/experts.cpp b/src/ops/experts.cpp
new file mode 100644
index 0000000000..a19c7a3a9a
--- /dev/null
+++ b/src/ops/experts.cpp
@@ -0,0 +1,148 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/experts.h"
+#include "flexflow/utils/hip_helper.h"
+#include <hip/hip_runtime.h>
+
+namespace FlexFlow {
+
+__global__ void experts_forward_kernel(float const *input,
+                                       int const *indices,
+                                       float const *topk_gate_preds,
+                                       float **outputs,
+                                       int num_experts,
+                                       int experts_start_idx,
+                                       int chosen_experts,
+                                       int expert_capacity,
+                                       int batch_size,
+                                       int out_dim) {
+  // shared at the block level
+  __shared__ float token_assigned[MAX_BATCH_SIZE][MAX_EXPERTS_PER_BLOCK];
+
+  // initialize the token assignments to 0
+  CUDA_KERNEL_LOOP(i, MAX_BATCH_SIZE * MAX_EXPERTS_PER_BLOCK) {
+    int token_index = i / MAX_EXPERTS_PER_BLOCK;
+    int expert_index = i % MAX_EXPERTS_PER_BLOCK;
+    token_assigned[token_index][expert_index] = 0.0f;
+  }
+
+  __syncthreads();
+
+  // Compute token assignments, single thread per block
+  if (threadIdx.x == 0) {
+    int token_count[MAX_EXPERTS_PER_BLOCK] = {0};
+    for (int i = 0; i < chosen_experts * batch_size; i++) {
+      // Get the token index, between 0 and batch_size
+      int token_index = i / chosen_experts;
+      // Get global index (indices[i]) of expert to which the token is assigned,
+      // and compute the local index (expert_index) of the expert within the
+      // block of fused experts
+      int expert_index = indices[i] - experts_start_idx;
+      // check if the token is assigned to an expert in this block, and if so,
+      // whether the expert still has capacity not that since each expert is
+      // assigned to only one block, it is safe to reason about expert capacity
+      // locally
+      if (expert_index >= 0 && expert_index < num_experts &&
+          token_count[expert_index] < expert_capacity) {
+        token_assigned[token_index][expert_index] = topk_gate_preds[i];
+        token_count[expert_index]++;
+      } else {
+      }
+    }
+  }
+
+  __syncthreads();
+
+  // compute output
+  CUDA_KERNEL_LOOP(i, num_experts * batch_size * out_dim) {
+    // output indexing:
+    // i = expert_index*(batch_size*out_dim) + token_index*out_dim + dim_index
+    // input indexing:
+    // i = token_index * (num_experts * out_dim) + expert_index * out_dim +
+    // dim_index
+    int expert_index = i / (batch_size * out_dim);
+    // int token_index = (i - expert_index*(batch_size*out_dim)) / out_dim;
+    int token_index = (i % (batch_size * out_dim)) / out_dim;
+    // int dim_index = i - expert_index*(batch_size*out_dim) -
+    // token_index*out_dim;
+    int dim_index = i % out_dim;
+    outputs[expert_index][token_index * out_dim + dim_index] =
+        input[i] * token_assigned[token_index][expert_index];
+  }
+}
+
+/*static*/
+void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
+                                     float const *input,
+                                     int const *indices,
+                                     float const *topk_gate_preds,
+                                     float **outputs,
+                                     int num_experts,
+                                     int experts_start_idx,
+                                     int expert_capacity,
+                                     int chosen_experts,
+                                     int batch_size,
+                                     int out_dim) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  //   cudaEvent_t t_start, t_end;
+  //   if (m->profiling) {
+  //     cudaEventCreate(&t_start);
+  //     cudaEventCreate(&t_end);
+  //     cudaEventRecord(t_start, stream);
+  //   }
+  hipMemcpy(m->dev_region_ptrs,
+            outputs,
+            num_experts * sizeof(float *),
+            hipMemcpyHostToDevice);
+
+  hipLaunchKernelGGL(
+      experts_forward_kernel,
+      GET_BLOCKS(batch_size * num_experts * out_dim),
+      min(CUDA_NUM_THREADS, (int)(batch_size * num_experts * out_dim)),
+      0,
+      stream,
+      input,
+      indices,
+      topk_gate_preds,
+      m->dev_region_ptrs,
+      num_experts,
+      experts_start_idx,
+      chosen_experts,
+      expert_capacity,
+      batch_size,
+      out_dim);
+
+  // if (m->profiling) {
+  //     cudaEventRecord(t_end, stream);
+  //     checkCUDA(cudaEventSynchronize(t_end));
+  //     float elapsed = 0;
+  //     checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+  //     cudaEventDestroy(t_start);
+  //     cudaEventDestroy(t_end);
+  //     printf("[Experts] forward time = %.2lfms\n", elapsed);
+  // }
+}
+
+ExpertsMeta::ExpertsMeta(FFHandler handler, int num_experts) : OpMeta(handler) {
+  checkCUDA(hipMalloc(&dev_region_ptrs, num_experts * sizeof(float *)));
+}
+ExpertsMeta::~ExpertsMeta(void) {
+  checkCUDA(hipFree(&dev_region_ptrs));
+}
+
+}; // namespace FlexFlow
diff --git a/src/ops/experts.cu b/src/ops/experts.cu
new file mode 100644
index 0000000000..b3a7f3d3ca
--- /dev/null
+++ b/src/ops/experts.cu
@@ -0,0 +1,150 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/experts.h"
+#include "flexflow/utils/cuda_helper.h"
+
+namespace FlexFlow {
+
+__global__ void experts_forward_kernel(float const *input,
+                                       int const *indices,
+                                       float const *topk_gate_preds,
+                                       float **outputs,
+                                       int num_experts,
+                                       int experts_start_idx,
+                                       int chosen_experts,
+                                       int expert_capacity,
+                                       int batch_size,
+                                       int out_dim) {
+  // shared at the block level
+  __shared__ float token_assigned[MAX_BATCH_SIZE][MAX_EXPERTS_PER_BLOCK];
+
+  // initialize the token assignments to 0
+  CUDA_KERNEL_LOOP(i, MAX_BATCH_SIZE * MAX_EXPERTS_PER_BLOCK) {
+    int token_index = i / MAX_EXPERTS_PER_BLOCK;
+    int expert_index = i % MAX_EXPERTS_PER_BLOCK;
+    token_assigned[token_index][expert_index] = 0.0f;
+  }
+
+  __syncthreads();
+
+  // Compute token assignments, single thread per block
+  if (threadIdx.x == 0) {
+    int token_count[MAX_EXPERTS_PER_BLOCK] = {0};
+    for (int i = 0; i < chosen_experts * batch_size; i++) {
+      // Get the token index, between 0 and batch_size
+      int token_index = i / chosen_experts;
+      // Get global index (indices[i]) of expert to which the token is assigned,
+      // and compute the local index (expert_index) of the expert within the
+      // block of fused experts
+      int expert_index = indices[i] - experts_start_idx;
+      // check if the token is assigned to an expert in this block, and if so,
+      // whether the expert still has capacity not that since each expert is
+      // assigned to only one block, it is safe to reason about expert capacity
+      // locally
+      if (expert_index >= 0 && expert_index < num_experts &&
+          token_count[expert_index] < expert_capacity) {
+        token_assigned[token_index][expert_index] = topk_gate_preds[i];
+        token_count[expert_index]++;
+      } else {
+      }
+    }
+  }
+
+  __syncthreads();
+
+  // compute output
+  CUDA_KERNEL_LOOP(i, num_experts * batch_size * out_dim) {
+    // output indexing:
+    // i = expert_index*(batch_size*out_dim) + token_index*out_dim + dim_index
+    // input indexing:
+    // i = token_index * (num_experts * out_dim) + expert_index * out_dim +
+    // dim_index
+    int expert_index = i / (batch_size * out_dim);
+    // int token_index = (i - expert_index*(batch_size*out_dim)) / out_dim;
+    int token_index = (i % (batch_size * out_dim)) / out_dim;
+    // int dim_index = i - expert_index*(batch_size*out_dim) -
+    // token_index*out_dim;
+    int dim_index = i % out_dim;
+    outputs[expert_index][token_index * out_dim + dim_index] =
+        input[i] * token_assigned[token_index][expert_index];
+  }
+}
+
+/*static*/
+void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
+                                     float const *input,
+                                     int const *indices,
+                                     float const *topk_gate_preds,
+                                     float **outputs,
+                                     int num_experts,
+                                     int experts_start_idx,
+                                     int expert_capacity,
+                                     int chosen_experts,
+                                     int batch_size,
+                                     int out_dim) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  // checkCUDA(cublasSetStream(m->handle.blas, stream));
+  // checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
+
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+
+  // call forward_kernel
+  cudaMemcpyAsync(m->dev_region_ptrs,
+                  outputs,
+                  num_experts * sizeof(float *),
+                  cudaMemcpyHostToDevice,
+                  stream);
+
+  experts_forward_kernel<<<GET_BLOCKS(batch_size * num_experts * out_dim),
+                           min(CUDA_NUM_THREADS,
+                               (int)(batch_size * num_experts * out_dim)),
+                           0,
+                           stream>>>(input,
+                                     indices,
+                                     topk_gate_preds,
+                                     m->dev_region_ptrs,
+                                     num_experts,
+                                     experts_start_idx,
+                                     chosen_experts,
+                                     expert_capacity,
+                                     batch_size,
+                                     out_dim);
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[Experts] forward time = %.2lfms\n", elapsed);
+  }
+}
+
+ExpertsMeta::ExpertsMeta(FFHandler handler, int num_experts) : OpMeta(handler) {
+  checkCUDA(cudaMalloc(&dev_region_ptrs, num_experts * sizeof(float *)));
+}
+ExpertsMeta::~ExpertsMeta(void) {
+  checkCUDA(cudaFree(&dev_region_ptrs));
+}
+
+}; // namespace FlexFlow
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index 85f5132f6f..699b98cd5a 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -2060,21 +2060,19 @@ void FFModel::deserialize_graph_optimal_view(
         break;
       }
       case OP_AGGREGATE: {
-        // node = Aggregate::deserialize(*this, dez, inputs, num_inputs);
-        int n;
-        float lambda_bal;
-        dez.deserialize(n);
-        dez.deserialize(lambda_bal);
-        assert(num_inputs == n + 4);
-        AggregateParams params;
-        params.n = n;
-        params.lambda_bal = lambda_bal;
-        node = get_or_create_node<Aggregate>(
-            {std::begin(inputs), std::begin(inputs) + num_inputs}, params);
+        node = Aggregate::deserialize(
+            *this,
+            dez,
+            {std::begin(inputs), std::begin(inputs) + num_inputs},
+            num_inputs);
         break;
       }
       case OP_EXPERTS: {
-        node = Experts::deserialize(*this, dez, inputs, num_inputs);
+        node = Experts::deserialize(
+            *this,
+            dez,
+            {std::begin(inputs), std::begin(inputs) + num_inputs},
+            num_inputs);
         break;
       }
       case OP_POOL2D: {
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 770292a6f2..e0fc25d1ad 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -3027,7 +3027,7 @@ void FFModel::compile(LossType loss_type,
              operators[i]->op_guid);
       for (int j = 0; j < op->numInputs; j++) {
         LogicalRegion handle = op->inputs[j]->region;
-        printf("inputs[%d] region(%d,%d,%d)\n",
+        printf("\tinputs[%d] region(%d,%d,%d)\n",
                j,
                handle.get_index_space().get_id(),
                handle.get_field_space().get_id(),
@@ -3035,7 +3035,7 @@ void FFModel::compile(LossType loss_type,
       }
       for (int j = 0; j < op->numOutputs; j++) {
         LogicalRegion handle = op->outputs[j]->region;
-        printf("outputs[%d] region(%d,%d,%d)\n",
+        printf("\toutputs[%d] region(%d,%d,%d)\n",
                j,
                handle.get_index_space().get_id(),
                handle.get_field_space().get_id(),
@@ -3043,7 +3043,7 @@ void FFModel::compile(LossType loss_type,
       }
       for (int j = 0; j < op->numWeights; j++) {
         LogicalRegion handle = op->weights[j]->region;
-        printf("weights[%d] region(%d,%d,%d)\n",
+        printf("\tweights[%d] region(%d,%d,%d)\n",
                j,
                handle.get_index_space().get_id(),
                handle.get_field_space().get_id(),
@@ -3059,7 +3059,7 @@ void FFModel::compile(LossType loss_type,
     printf("operator[%zu]: type(%d)\n", i, operators[i]->op_type);
     for (int j = 0; j < op->numInputs; j++) {
       LogicalRegion handle = op->inputs[j]->region;
-      printf("inputs[%d] region(%d,%d,%d)\n",
+      printf("\tinputs[%d] region(%d,%d,%d)\n",
              j,
              handle.get_index_space().get_id(),
              handle.get_field_space().get_id(),
@@ -3067,7 +3067,7 @@ void FFModel::compile(LossType loss_type,
     }
     for (int j = 0; j < op->numOutputs; j++) {
       LogicalRegion handle = op->outputs[j]->region;
-      printf("outputs[%d] region(%d,%d,%d)\n",
+      printf("\toutputs[%d] region(%d,%d,%d)\n",
              j,
              handle.get_index_space().get_id(),
              handle.get_field_space().get_id(),
@@ -3783,13 +3783,6 @@ void register_flexflow_internal_tasks() {
     Runtime::preregister_task_variant<Experts::backward_task>(
         registrar, "Experts Backward Task");
   }
-  {
-    TaskVariantRegistrar registrar(EXPERTS_INF_TASK_ID, "Experts Inference");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<Experts::inference_task>(
-        registrar, "Experts Inference Task");
-  }
   // Cast
   {
     TaskVariantRegistrar registrar(CAST_INIT_TASK_ID, "Cast Init");
diff --git a/src/runtime/substitution.cc b/src/runtime/substitution.cc
index fb66ac6e36..d528fd6345 100644
--- a/src/runtime/substitution.cc
+++ b/src/runtime/substitution.cc
@@ -26,6 +26,7 @@
 #include "flexflow/ops/element_binary.h"
 #include "flexflow/ops/element_unary.h"
 #include "flexflow/ops/embedding.h"
+#include "flexflow/ops/experts.h"
 #include "flexflow/ops/flat.h"
 #include "flexflow/ops/linear.h"
 #include "flexflow/ops/noop.h"
@@ -3164,6 +3165,13 @@ bool FFModel::convert_graph_to_operators(
         new_op = new Aggregate(*this, inputs, aggr->n, aggr->lambda_bal, NULL);
         break;
       }
+      case OP_EXPERTS: {
+        Experts *exp = (Experts *)node.ptr;
+        ExpertsParams params = exp->get_params();
+        new_op = new Experts(
+            *this, params, {std::begin(inputs), std::end(inputs)}, NULL);
+        break;
+      }
       case OP_SPLIT: {
         Split *split = (Split *)node.ptr;
         std::vector<int> splits;

From 07a361744929ccdd3a4e5dedac6c13206e997c41 Mon Sep 17 00:00:00 2001
From: Viren Abhyankar <forvirenra@gmail.com>
Date: Thu, 26 Jan 2023 11:38:24 -0800
Subject: [PATCH 051/344] Dropout kernels (#591)

* Dropout kernels

* Include dropout
---
 include/flexflow/ops/dropout.h                |  38 ------
 .../flexflow/ops/kernels/dropout_kernels.h    |  53 ++++++++
 src/ops/dropout.cc                            |   3 +
 src/ops/fused.cpp                             |  11 +-
 src/ops/fused.cu                              |  13 +-
 .../dropout_kernels.cpp}                      | 114 +++++++++---------
 .../dropout_kernels.cu}                       | 110 +++++++++--------
 src/ops/kernels/element_binary_kernels.cu     |  68 +++++------
 src/ops/kernels/flat_kernels.cu               |   3 +-
 9 files changed, 223 insertions(+), 190 deletions(-)
 create mode 100644 include/flexflow/ops/kernels/dropout_kernels.h
 rename src/ops/{dropout.cpp => kernels/dropout_kernels.cpp} (81%)
 rename src/ops/{dropout.cu => kernels/dropout_kernels.cu} (80%)

diff --git a/include/flexflow/ops/dropout.h b/include/flexflow/ops/dropout.h
index e72792725e..37304bdada 100644
--- a/include/flexflow/ops/dropout.h
+++ b/include/flexflow/ops/dropout.h
@@ -1,18 +1,13 @@
 #ifndef _FLEXFLOW_DROPOUT_H
 #define _FLEXFLOW_DROPOUT_H
 
-#include "flexflow/device.h"
-#include "flexflow/fftype.h"
 #include "flexflow/layer.h"
 #include "flexflow/node.h"
-#include "flexflow/op_meta.h"
 #include "flexflow/operator.h"
 #include "flexflow/ops/dropout_params.h"
 
 namespace FlexFlow {
 
-class DropoutMeta;
-
 class Dropout : public Op {
 public:
   using Params = DropoutParams;
@@ -50,20 +45,6 @@ class Dropout : public Op {
                             std::vector<Legion::PhysicalRegion> const &regions,
                             Legion::Context ctx,
                             Legion::Runtime *runtime);
-  static void forward_kernel(DropoutMeta *m,
-                             float const *input_ptr,
-                             float *output_ptr,
-                             ffStream_t stream);
-  static void forward_kernel_wrapper(DropoutMeta *m,
-                                     float const *input_ptr,
-                                     float *output_ptr);
-  static void backward_kernel(DropoutMeta *m,
-                              float const *output_grad_ptr,
-                              float *input_grad_ptr,
-                              ffStream_t stream);
-  static void backward_kernel_wrapper(DropoutMeta *m,
-                                      float const *output_grad_ptr,
-                                      float *input_grad_ptr);
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
                              CostMetrics &cost_metrics) const override;
@@ -81,25 +62,6 @@ class Dropout : public Op {
   unsigned long long seed;
 };
 
-class DropoutMeta : public OpMeta {
-public:
-  DropoutMeta(FFHandler handle,
-              Dropout const *dropout,
-              Legion::Memory gpu_mem,
-              Legion::Domain const &output_domain);
-  ~DropoutMeta(void);
-  Realm::RegionInstance reserveInst;
-#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
-  cudnnTensorDescriptor_t inputTensor, outputTensor;
-  cudnnDropoutDescriptor_t dropoutDesc;
-#else
-  miopenTensorDescriptor_t inputTensor, outputTensor;
-  miopenDropoutDescriptor_t dropoutDesc;
-#endif
-  void *reserveSpace, *dropoutStates;
-  size_t reserveSpaceSize, dropoutStateSize;
-};
-
 }; // namespace FlexFlow
 
 #endif
diff --git a/include/flexflow/ops/kernels/dropout_kernels.h b/include/flexflow/ops/kernels/dropout_kernels.h
new file mode 100644
index 0000000000..421974fbaa
--- /dev/null
+++ b/include/flexflow/ops/kernels/dropout_kernels.h
@@ -0,0 +1,53 @@
+#ifndef _FLEXFLOW_OPS_KERNELS_DROPOUT_KERNELS_H
+#define _FLEXFLOW_OPS_KERNELS_DROPOUT_KERNELS_H
+
+#include "flexflow/device.h"
+#include "flexflow/fftype.h"
+#include "flexflow/op_meta.h"
+#include "flexflow/ops/dropout.h"
+
+namespace FlexFlow {
+
+class DropoutMeta : public OpMeta {
+public:
+  DropoutMeta(FFHandler handle,
+              Dropout const *dropout,
+              Legion::Memory gpu_mem,
+              Legion::Domain const &output_domain);
+  ~DropoutMeta(void);
+  Realm::RegionInstance reserveInst;
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+  cudnnTensorDescriptor_t inputTensor, outputTensor;
+  cudnnDropoutDescriptor_t dropoutDesc;
+#else
+  miopenTensorDescriptor_t inputTensor, outputTensor;
+  miopenDropoutDescriptor_t dropoutDesc;
+#endif
+  void *reserveSpace, *dropoutStates;
+  size_t reserveSpaceSize, dropoutStateSize;
+};
+
+namespace Kernels {
+namespace Dropout {
+void forward_kernel_wrapper(DropoutMeta *m,
+                            float const *input_ptr,
+                            float *output_ptr);
+void backward_kernel_wrapper(DropoutMeta *m,
+                             float const *output_grad_ptr,
+                             float *input_grad_ptr);
+
+namespace Internal {
+void forward_kernel(DropoutMeta *m,
+                    float const *input_ptr,
+                    float *output_ptr,
+                    ffStream_t stream);
+void backward_kernel(DropoutMeta *m,
+                     float const *output_grad_ptr,
+                     float *input_grad_ptr,
+                     ffStream_t stream);
+} // namespace Internal
+} // namespace Dropout
+} // namespace Kernels
+} // namespace FlexFlow
+
+#endif // _FLEXFLOW_OPS_KERNELS_DROPOUT_KERNELS_H
diff --git a/src/ops/dropout.cc b/src/ops/dropout.cc
index 75f8aec4b3..55f6730827 100644
--- a/src/ops/dropout.cc
+++ b/src/ops/dropout.cc
@@ -1,5 +1,6 @@
 #include "flexflow/ops/dropout.h"
 #include "flexflow/model.h"
+#include "flexflow/ops/kernels/dropout_kernels.h"
 #include "flexflow/utils/hash_utils.h"
 #include "legion/legion_utilities.h"
 
@@ -25,6 +26,8 @@ using Legion::TaskArgument;
 using Legion::TaskLauncher;
 using PCG::Node;
 
+using namespace FlexFlow::Kernels::Dropout;
+
 Tensor FFModel::dropout(const Tensor input,
                         float rate,
                         unsigned long long seed,
diff --git a/src/ops/fused.cpp b/src/ops/fused.cpp
index e7ab9aea6f..bd1ecdc0ab 100644
--- a/src/ops/fused.cpp
+++ b/src/ops/fused.cpp
@@ -16,11 +16,11 @@
 #include "flexflow/ops/fused.h"
 #include "flexflow/model.h"
 #include "flexflow/ops/batch_norm.h"
-#include "flexflow/ops/dropout.h"
 #include "flexflow/ops/element_unary.h"
 #include "flexflow/ops/kernels/batch_matmul_kernels.h"
 #include "flexflow/ops/kernels/concat_kernels.h"
 #include "flexflow/ops/kernels/conv_2d_kernels.h"
+#include "flexflow/ops/kernels/dropout_kernels.h"
 #include "flexflow/ops/kernels/element_binary_kernels.h"
 #include "flexflow/ops/kernels/flat_kernels.h"
 #include "flexflow/ops/kernels/linear_kernels.h"
@@ -199,9 +199,10 @@ __host__ void FusedOp::forward_task(Task const *task,
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
         DropoutMeta *m = (DropoutMeta *)metas->meta[op];
-        Dropout::forward_kernel_wrapper(m,
-                                        my_input_accessor[0].get_float_ptr(),
-                                        my_output_accessor[0].get_float_ptr());
+        Kernels::Dropout::forward_kernel_wrapper(
+            m,
+            my_input_accessor[0].get_float_ptr(),
+            my_output_accessor[0].get_float_ptr());
         break;
       }
       case OP_LINEAR: {
@@ -586,7 +587,7 @@ __host__ void FusedOp::backward_task(Task const *task,
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
         DropoutMeta *m = (DropoutMeta *)metas->meta[op];
-        Dropout::backward_kernel_wrapper(
+        Kernels::Dropout::backward_kernel_wrapper(
             m,
             my_output_grad_accessor[0].get_float_ptr(),
             my_input_grad_accessor[0].get_float_ptr());
diff --git a/src/ops/fused.cu b/src/ops/fused.cu
index 53ebfd93aa..60d8bc93e8 100644
--- a/src/ops/fused.cu
+++ b/src/ops/fused.cu
@@ -16,18 +16,18 @@
 #include "flexflow/accessor.h"
 #include "flexflow/model.h"
 #include "flexflow/ops/batch_norm.h"
-#include "flexflow/ops/dropout.h"
 #include "flexflow/ops/element_unary.h"
 #include "flexflow/ops/embedding.h"
 #include "flexflow/ops/fused.h"
 #include "flexflow/ops/kernels/batch_matmul_kernels.h"
 #include "flexflow/ops/kernels/concat_kernels.h"
 #include "flexflow/ops/kernels/conv_2d_kernels.h"
+#include "flexflow/ops/kernels/dropout_kernels.h"
 #include "flexflow/ops/kernels/element_binary_kernels.h"
+#include "flexflow/ops/kernels/flat_kernels.h"
 #include "flexflow/ops/kernels/linear_kernels.h"
 #include "flexflow/ops/kernels/pool_2d_kernels.h"
 #include "flexflow/ops/kernels/reshape_kernels.h"
-#include "flexflow/ops/kernels/flat_kernels.h"
 #include "flexflow/ops/kernels/transpose_kernels.h"
 #include "flexflow/utils/cuda_helper.h"
 
@@ -210,9 +210,10 @@ __host__ void FusedOp::forward_task(Task const *task,
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
         DropoutMeta *m = (DropoutMeta *)metas->meta[op];
-        Dropout::forward_kernel_wrapper(m,
-                                        my_input_accessor[0].get_float_ptr(),
-                                        my_output_accessor[0].get_float_ptr());
+        Kernels::Dropout::forward_kernel_wrapper(
+            m,
+            my_input_accessor[0].get_float_ptr(),
+            my_output_accessor[0].get_float_ptr());
         break;
       }
       case OP_LINEAR: {
@@ -732,7 +733,7 @@ __host__ void FusedOp::backward_task(Task const *task,
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
         DropoutMeta *m = (DropoutMeta *)metas->meta[op];
-        Dropout::backward_kernel_wrapper(
+        Kernels::Dropout::backward_kernel_wrapper(
             m,
             my_output_grad_accessor[0].get_float_ptr(),
             my_input_grad_accessor[0].get_float_ptr());
diff --git a/src/ops/dropout.cpp b/src/ops/kernels/dropout_kernels.cpp
similarity index 81%
rename from src/ops/dropout.cpp
rename to src/ops/kernels/dropout_kernels.cpp
index 9ec2270491..b0dd4c644e 100644
--- a/src/ops/dropout.cpp
+++ b/src/ops/kernels/dropout_kernels.cpp
@@ -13,7 +13,7 @@
  * limitations under the License.
  */
 
-#include "flexflow/ops/dropout.h"
+#include "flexflow/ops/kernels/dropout_kernels.h"
 #include "flexflow/utils/hip_helper.h"
 #include <hip/hip_runtime.h>
 
@@ -24,58 +24,6 @@ using Legion::coord_t;
 using Legion::Domain;
 using Legion::Memory;
 
-void Dropout::forward_kernel(DropoutMeta *m,
-                             float const *input_ptr,
-                             float *output_ptr,
-                             hipStream_t stream) {
-  checkCUDNN(miopenSetStream(m->handle.dnn, stream));
-
-  checkCUDNN(miopenDropoutForward(m->handle.dnn,
-                                  m->dropoutDesc,
-                                  m->inputTensor /* not used */,
-                                  m->inputTensor,
-                                  input_ptr,
-                                  m->outputTensor,
-                                  output_ptr,
-                                  m->reserveSpace,
-                                  m->reserveSpaceSize));
-}
-
-/*static*/
-void Dropout::forward_kernel_wrapper(DropoutMeta *m,
-                                     float const *input_ptr,
-                                     float *output_ptr) {
-  hipStream_t stream;
-  checkCUDA(get_legion_stream(&stream));
-  Dropout::forward_kernel(m, input_ptr, output_ptr, stream);
-}
-
-void Dropout::backward_kernel(DropoutMeta *m,
-                              float const *output_grad_ptr,
-                              float *input_grad_ptr,
-                              hipStream_t stream) {
-  checkCUDNN(miopenSetStream(m->handle.dnn, stream));
-
-  checkCUDNN(miopenDropoutBackward(m->handle.dnn,
-                                   m->dropoutDesc,
-                                   m->inputTensor /* not used */,
-                                   m->outputTensor,
-                                   output_grad_ptr,
-                                   m->inputTensor,
-                                   input_grad_ptr,
-                                   m->reserveSpace,
-                                   m->reserveSpaceSize));
-}
-
-/*static*/
-void Dropout::backward_kernel_wrapper(DropoutMeta *m,
-                                      float const *output_grad_ptr,
-                                      float *input_grad_ptr) {
-  hipStream_t stream;
-  checkCUDA(get_legion_stream(&stream));
-  Dropout::backward_kernel(m, output_grad_ptr, input_grad_ptr, stream);
-}
-
 DropoutMeta::DropoutMeta(FFHandler handler,
                          Dropout const *dropout,
                          Memory gpu_mem,
@@ -127,4 +75,62 @@ DropoutMeta::~DropoutMeta(void) {
   checkCUDNN(miopenDestroyDropoutDescriptor(dropoutDesc));
 }
 
-}; // namespace FlexFlow
+namespace Kernels {
+namespace Dropout {
+
+void forward_kernel_wrapper(DropoutMeta *m,
+                            float const *input_ptr,
+                            float *output_ptr) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  Internal::forward_kernel(m, input_ptr, output_ptr, stream);
+}
+
+void backward_kernel_wrapper(DropoutMeta *m,
+                             float const *output_grad_ptr,
+                             float *input_grad_ptr) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  Internal::backward_kernel(m, output_grad_ptr, input_grad_ptr, stream);
+}
+
+namespace Internal {
+
+void forward_kernel(DropoutMeta *m,
+                    float const *input_ptr,
+                    float *output_ptr,
+                    hipStream_t stream) {
+  checkCUDNN(miopenSetStream(m->handle.dnn, stream));
+
+  checkCUDNN(miopenDropoutForward(m->handle.dnn,
+                                  m->dropoutDesc,
+                                  m->inputTensor /* not used */,
+                                  m->inputTensor,
+                                  input_ptr,
+                                  m->outputTensor,
+                                  output_ptr,
+                                  m->reserveSpace,
+                                  m->reserveSpaceSize));
+}
+
+void backward_kernel(DropoutMeta *m,
+                     float const *output_grad_ptr,
+                     float *input_grad_ptr,
+                     hipStream_t stream) {
+  checkCUDNN(miopenSetStream(m->handle.dnn, stream));
+
+  checkCUDNN(miopenDropoutBackward(m->handle.dnn,
+                                   m->dropoutDesc,
+                                   m->inputTensor /* not used */,
+                                   m->outputTensor,
+                                   output_grad_ptr,
+                                   m->inputTensor,
+                                   input_grad_ptr,
+                                   m->reserveSpace,
+                                   m->reserveSpaceSize));
+}
+
+} // namespace Internal
+} // namespace Dropout
+} // namespace Kernels
+} // namespace FlexFlow
diff --git a/src/ops/dropout.cu b/src/ops/kernels/dropout_kernels.cu
similarity index 80%
rename from src/ops/dropout.cu
rename to src/ops/kernels/dropout_kernels.cu
index 70b0223c7a..4a76301fd6 100644
--- a/src/ops/dropout.cu
+++ b/src/ops/kernels/dropout_kernels.cu
@@ -13,7 +13,7 @@
  * limitations under the License.
  */
 
-#include "flexflow/ops/dropout.h"
+#include "flexflow/ops/kernels/dropout_kernels.h"
 #include "flexflow/utils/cuda_helper.h"
 
 namespace FlexFlow {
@@ -23,56 +23,6 @@ using Legion::coord_t;
 using Legion::Domain;
 using Legion::Memory;
 
-void Dropout::forward_kernel(DropoutMeta *m,
-                             float const *input_ptr,
-                             float *output_ptr,
-                             cudaStream_t stream) {
-  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
-
-  checkCUDNN(cudnnDropoutForward(m->handle.dnn,
-                                 m->dropoutDesc,
-                                 m->inputTensor,
-                                 input_ptr,
-                                 m->outputTensor,
-                                 output_ptr,
-                                 m->reserveSpace,
-                                 m->reserveSpaceSize));
-}
-
-/*static*/
-void Dropout::forward_kernel_wrapper(DropoutMeta *m,
-                                     float const *input_ptr,
-                                     float *output_ptr) {
-  cudaStream_t stream;
-  checkCUDA(get_legion_stream(&stream));
-  Dropout::forward_kernel(m, input_ptr, output_ptr, stream);
-}
-
-void Dropout::backward_kernel(DropoutMeta *m,
-                              float const *output_grad_ptr,
-                              float *input_grad_ptr,
-                              cudaStream_t stream) {
-  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
-
-  checkCUDNN(cudnnDropoutBackward(m->handle.dnn,
-                                  m->dropoutDesc,
-                                  m->outputTensor,
-                                  output_grad_ptr,
-                                  m->inputTensor,
-                                  input_grad_ptr,
-                                  m->reserveSpace,
-                                  m->reserveSpaceSize));
-}
-
-/*static*/
-void Dropout::backward_kernel_wrapper(DropoutMeta *m,
-                                      float const *output_grad_ptr,
-                                      float *input_grad_ptr) {
-  cudaStream_t stream;
-  checkCUDA(get_legion_stream(&stream));
-  Dropout::backward_kernel(m, output_grad_ptr, input_grad_ptr, stream);
-}
-
 DropoutMeta::DropoutMeta(FFHandler handler,
                          Dropout const *dropout,
                          Memory gpu_mem,
@@ -121,4 +71,60 @@ DropoutMeta::~DropoutMeta(void) {
   checkCUDNN(cudnnDestroyDropoutDescriptor(dropoutDesc));
 }
 
-}; // namespace FlexFlow
+namespace Kernels {
+namespace Dropout {
+
+void forward_kernel_wrapper(DropoutMeta *m,
+                            float const *input_ptr,
+                            float *output_ptr) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  Internal::forward_kernel(m, input_ptr, output_ptr, stream);
+}
+
+void backward_kernel_wrapper(DropoutMeta *m,
+                             float const *output_grad_ptr,
+                             float *input_grad_ptr) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  Internal::backward_kernel(m, output_grad_ptr, input_grad_ptr, stream);
+}
+
+namespace Internal {
+
+void forward_kernel(DropoutMeta *m,
+                    float const *input_ptr,
+                    float *output_ptr,
+                    cudaStream_t stream) {
+  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
+
+  checkCUDNN(cudnnDropoutForward(m->handle.dnn,
+                                 m->dropoutDesc,
+                                 m->inputTensor,
+                                 input_ptr,
+                                 m->outputTensor,
+                                 output_ptr,
+                                 m->reserveSpace,
+                                 m->reserveSpaceSize));
+}
+
+void backward_kernel(DropoutMeta *m,
+                     float const *output_grad_ptr,
+                     float *input_grad_ptr,
+                     cudaStream_t stream) {
+  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
+
+  checkCUDNN(cudnnDropoutBackward(m->handle.dnn,
+                                  m->dropoutDesc,
+                                  m->outputTensor,
+                                  output_grad_ptr,
+                                  m->inputTensor,
+                                  input_grad_ptr,
+                                  m->reserveSpace,
+                                  m->reserveSpaceSize));
+}
+
+} // namespace Internal
+} // namespace Dropout
+} // namespace Kernels
+} // namespace FlexFlow
diff --git a/src/ops/kernels/element_binary_kernels.cu b/src/ops/kernels/element_binary_kernels.cu
index 509946bddf..99db607447 100644
--- a/src/ops/kernels/element_binary_kernels.cu
+++ b/src/ops/kernels/element_binary_kernels.cu
@@ -268,21 +268,21 @@ void forward_kernel(ElementBinaryMeta const *m,
     // currently only handle add and sub
     assert(m->op_type == OP_EW_SUB || m->op_type == OP_EW_ADD ||
            m->op_type == OP_EW_MUL);
-    if(m->op_type == OP_EW_SUB || m->op_type == OP_EW_ADD){
+    if (m->op_type == OP_EW_SUB || m->op_type == OP_EW_ADD) {
       // output = (beta*output + alpha1*input1) + beta*output = input1
       checkCUDNN(cudnnOpTensor(m->handle.dnn,
-                              m->opDesc,
-                              &beta,
-                              m->outputTensor,
-                              out_ptr,
-                              &alpha1,
-                              m->input1Tensor,
-                              in1_ptr,
-                              &beta,
-                              m->outputTensor,
-                              out_ptr));
-      // output = (beta*output + alpha2*input2) + alpha1*output = alpha2*input2 
-      // + alpha1*input1 
+                               m->opDesc,
+                               &beta,
+                               m->outputTensor,
+                               out_ptr,
+                               &alpha1,
+                               m->input1Tensor,
+                               in1_ptr,
+                               &beta,
+                               m->outputTensor,
+                               out_ptr));
+      // output = (beta*output + alpha2*input2) + alpha1*output = alpha2*input2
+      // + alpha1*input1
       checkCUDNN(cudnnOpTensor(m->handle.dnn,
                                m->opDesc,
                                &beta,
@@ -294,7 +294,7 @@ void forward_kernel(ElementBinaryMeta const *m,
                                &alpha1,
                                m->outputTensor,
                                out_ptr));
-    } else if(m->op_type == OP_EW_MUL) {
+    } else if (m->op_type == OP_EW_MUL) {
       checkCUDNN(cudnnSetOpTensorDescriptor(m->opDesc,
                                             CUDNN_OP_TENSOR_ADD,
                                             CUDNN_DATA_FLOAT,
@@ -437,16 +437,16 @@ void backward_kernel(ElementBinaryMeta const *m,
             in1_grad_ptr));
       } else {
         checkCUDNN(cudnnOpTensor(m->handle.dnn,
-                                m->opDesc,
-                                &alpha1,
-                                m->outputTensor,
-                                out_grad_ptr,
-                                &alpha2,
-                                m->input2Tensor,
-                                in2_ptr,
-                                &beta,
-                                m->input1Tensor,
-                                in1_grad_ptr));
+                                 m->opDesc,
+                                 &alpha1,
+                                 m->outputTensor,
+                                 out_grad_ptr,
+                                 &alpha2,
+                                 m->input2Tensor,
+                                 in2_ptr,
+                                 &beta,
+                                 m->input1Tensor,
+                                 in1_grad_ptr));
       }
     }
     if (in2_grad_ptr != nullptr) {
@@ -477,16 +477,16 @@ void backward_kernel(ElementBinaryMeta const *m,
             in2_grad_ptr));
       } else {
         checkCUDNN(cudnnOpTensor(m->handle.dnn,
-                                m->opDesc,
-                                &alpha1,
-                                m->outputTensor,
-                                out_grad_ptr,
-                                &alpha2,
-                                m->input1Tensor,
-                                in1_ptr,
-                                &beta,
-                                m->input2Tensor,
-                                in2_grad_ptr));
+                                 m->opDesc,
+                                 &alpha1,
+                                 m->outputTensor,
+                                 out_grad_ptr,
+                                 &alpha2,
+                                 m->input1Tensor,
+                                 in1_ptr,
+                                 &beta,
+                                 m->input2Tensor,
+                                 in2_grad_ptr));
       }
     }
   } else {
diff --git a/src/ops/kernels/flat_kernels.cu b/src/ops/kernels/flat_kernels.cu
index 0de2c31585..3836c02c94 100644
--- a/src/ops/kernels/flat_kernels.cu
+++ b/src/ops/kernels/flat_kernels.cu
@@ -35,7 +35,8 @@ void backward_kernel_wrapper(float *input_grad_ptr,
                              size_t num_elements) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
-  Internal::backward_kernel(input_grad_ptr, output_grad_ptr, num_elements, stream);
+  Internal::backward_kernel(
+      input_grad_ptr, output_grad_ptr, num_elements, stream);
   // checkCUDA(cudaMemcpyAsync(acc_input_grad.ptr, acc_output_grad.ptr,
   //                           acc_input_grad.rect.volume() * sizeof(float),
   //                           cudaMemcpyDeviceToDevice));

From eaedc294a3c76a89c459893deba8b2627a11541e Mon Sep 17 00:00:00 2001
From: Viren Abhyankar <forvirenra@gmail.com>
Date: Thu, 26 Jan 2023 16:17:48 -0800
Subject: [PATCH 052/344] Softmax kernels (#593)

---
 .../flexflow/ops/kernels/softmax_kernels.h    | 52 +++++++++++
 include/flexflow/ops/softmax.h                | 39 --------
 src/ops/{ => kernels}/softmax.cpp             | 90 ++++++++++---------
 src/ops/{ => kernels}/softmax.cu              | 90 ++++++++++---------
 src/ops/softmax.cc                            |  7 +-
 5 files changed, 151 insertions(+), 127 deletions(-)
 create mode 100644 include/flexflow/ops/kernels/softmax_kernels.h
 rename src/ops/{ => kernels}/softmax.cpp (77%)
 rename src/ops/{ => kernels}/softmax.cu (77%)

diff --git a/include/flexflow/ops/kernels/softmax_kernels.h b/include/flexflow/ops/kernels/softmax_kernels.h
new file mode 100644
index 0000000000..81b34d8558
--- /dev/null
+++ b/include/flexflow/ops/kernels/softmax_kernels.h
@@ -0,0 +1,52 @@
+#ifndef _FLEXFLOW_OPS_KERNELS_SOFTMAX_KERNELS_H
+#define _FLEXFLOW_OPS_KERNELS_SOFTMAX_KERNELS_H
+
+#include "flexflow/device.h"
+#include "flexflow/fftype.h"
+#include "flexflow/op_meta.h"
+#include "flexflow/ops/softmax.h"
+
+namespace FlexFlow {
+
+class SoftmaxMeta : public OpMeta {
+public:
+  SoftmaxMeta(FFHandler handle,
+              Softmax const *softmax,
+              Legion::Domain const &input_domain);
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+  cudnnTensorDescriptor_t inputTensor;
+#else
+  miopenTensorDescriptor_t inputTensor;
+#endif
+  bool profiling;
+  int dim;
+  char op_name[MAX_OPNAME];
+};
+
+namespace Kernels {
+namespace Softmax {
+
+void forward_kernel_wrapper(SoftmaxMeta const *m,
+                            float const *input_ptr,
+                            float *output_ptr);
+
+void backward_kernel_wrapper(SoftmaxMeta const *m,
+                             float *input_grad_ptr,
+                             float const *output_grad_ptr,
+                             size_t num_elements);
+
+namespace Internal {
+void forward_kernel(SoftmaxMeta const *m,
+                    float const *input_ptr,
+                    float *output_ptr,
+                    ffStream_t stream);
+void backward_kernel(float *input_grad_ptr,
+                     float const *output_grad_ptr,
+                     size_t num_elements,
+                     ffStream_t stream);
+} // namespace Internal
+} // namespace Softmax
+} // namespace Kernels
+} // namespace FlexFlow
+
+#endif // _FLEXFLOW_OPS_KERNELS_SOFTMAX_KERNELS_H
diff --git a/include/flexflow/ops/softmax.h b/include/flexflow/ops/softmax.h
index c9d6a1e6a9..25a20315bd 100644
--- a/include/flexflow/ops/softmax.h
+++ b/include/flexflow/ops/softmax.h
@@ -1,33 +1,13 @@
 #ifndef _FLEXFLOW_SOFTMAX_H
 #define _FLEXFLOW_SOFTMAX_H
 
-#include "flexflow/device.h"
-#include "flexflow/fftype.h"
 #include "flexflow/layer.h"
 #include "flexflow/node.h"
-#include "flexflow/op_meta.h"
 #include "flexflow/operator.h"
 #include "flexflow/ops/softmax_params.h"
 
 namespace FlexFlow {
 
-class Softmax;
-
-class SoftmaxMeta : public OpMeta {
-public:
-  SoftmaxMeta(FFHandler handle,
-              Softmax const *softmax,
-              Legion::Domain const &input_domain);
-#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
-  cudnnTensorDescriptor_t inputTensor;
-#else
-  miopenTensorDescriptor_t inputTensor;
-#endif
-  bool profiling;
-  int dim;
-  char op_name[MAX_OPNAME];
-};
-
 class Softmax : public Op {
 public:
   using Params = SoftmaxParams;
@@ -63,28 +43,9 @@ class Softmax : public Op {
                             std::vector<Legion::PhysicalRegion> const &regions,
                             Legion::Context ctx,
                             Legion::Runtime *runtime);
-  void init_meta(SoftmaxMeta *m,
-                 Legion::Rect<2> const &input,
-                 Legion::Rect<2> const &output) const;
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
                              CostMetrics &cost_metrics) const override;
-  static void forward_kernel(SoftmaxMeta const *m,
-                             float const *input_ptr,
-                             float *output_ptr,
-                             ffStream_t stream);
-  static void forward_kernel_wrapper(SoftmaxMeta const *m,
-                                     float const *input_ptr,
-                                     float *output_ptr);
-  static void backward_kernel(float *input_grad_ptr,
-                              float const *output_grad_ptr,
-                              size_t num_elements,
-                              ffStream_t stream);
-  static void backward_kernel_wrapper(SoftmaxMeta const *m,
-                                      float *input_grad_ptr,
-                                      float const *output_grad_ptr,
-                                      size_t num_elements);
-
   Params get_params() const;
 
 private:
diff --git a/src/ops/softmax.cpp b/src/ops/kernels/softmax.cpp
similarity index 77%
rename from src/ops/softmax.cpp
rename to src/ops/kernels/softmax.cpp
index e53b41f4a4..d63bd0edc5 100644
--- a/src/ops/softmax.cpp
+++ b/src/ops/kernels/softmax.cpp
@@ -13,7 +13,7 @@
  * limitations under the License.
  */
 
-#include "flexflow/ops/softmax.h"
+#include "flexflow/ops/kernels/softmax_kernels.h"
 #include "flexflow/utils/hash_utils.h"
 #include "flexflow/utils/hip_helper.h"
 #include <hip/hip_runtime.h>
@@ -33,29 +33,12 @@ SoftmaxMeta::SoftmaxMeta(FFHandler handler,
   std::strcpy(op_name, softmax->name);
 }
 
-/* static */
-void Softmax::forward_kernel(SoftmaxMeta const *m,
-                             float const *input_ptr,
-                             float *output_ptr,
-                             hipStream_t stream) {
-  checkCUDNN(miopenSetStream(m->handle.dnn, stream));
+namespace Kernels {
+namespace Softmax {
 
-  float alpha = 1.0f, beta = 0.0f;
-  checkCUDNN(miopenSoftmaxForward_V2(m->handle.dnn,
-                                     &alpha,
-                                     m->inputTensor,
-                                     input_ptr,
-                                     &beta,
-                                     m->inputTensor,
-                                     output_ptr,
-                                     MIOPEN_SOFTMAX_ACCURATE,
-                                     MIOPEN_SOFTMAX_MODE_CHANNEL));
-}
-
-/* static */
-void Softmax::forward_kernel_wrapper(SoftmaxMeta const *m,
-                                     float const *input_ptr,
-                                     float *output_ptr) {
+void forward_kernel_wrapper(SoftmaxMeta const *m,
+                            float const *input_ptr,
+                            float *output_ptr) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -65,7 +48,7 @@ void Softmax::forward_kernel_wrapper(SoftmaxMeta const *m,
     hipEventCreate(&t_end);
     hipEventRecord(t_start, stream);
   }
-  Softmax::forward_kernel(m, input_ptr, output_ptr, stream);
+  Internal::forward_kernel(m, input_ptr, output_ptr, stream);
   if (m->profiling) {
     hipEventRecord(t_end, stream);
     checkCUDA(hipEventSynchronize(t_end));
@@ -81,23 +64,10 @@ void Softmax::forward_kernel_wrapper(SoftmaxMeta const *m,
   }
 }
 
-/* static */
-void Softmax::backward_kernel(float *input_grad_ptr,
-                              float const *output_grad_ptr,
-                              size_t num_elements,
-                              hipStream_t stream) {
-  checkCUDA(hipMemcpyAsync(input_grad_ptr,
-                           output_grad_ptr,
-                           num_elements * sizeof(float),
-                           hipMemcpyDeviceToDevice,
-                           stream));
-}
-
-/* static */
-void Softmax::backward_kernel_wrapper(SoftmaxMeta const *m,
-                                      float *input_grad_ptr,
-                                      float const *output_grad_ptr,
-                                      size_t num_elements) {
+void backward_kernel_wrapper(SoftmaxMeta const *m,
+                             float *input_grad_ptr,
+                             float const *output_grad_ptr,
+                             size_t num_elements) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -107,7 +77,7 @@ void Softmax::backward_kernel_wrapper(SoftmaxMeta const *m,
     hipEventCreate(&t_end);
     hipEventRecord(t_start, stream);
   }
-  Softmax::backward_kernel(
+  Internal::backward_kernel(
       input_grad_ptr, output_grad_ptr, num_elements, stream);
   if (m->profiling) {
     hipEventRecord(t_end, stream);
@@ -124,4 +94,38 @@ void Softmax::backward_kernel_wrapper(SoftmaxMeta const *m,
   }
 }
 
-}; // namespace FlexFlow
+namespace Internal {
+
+void forward_kernel(SoftmaxMeta const *m,
+                    float const *input_ptr,
+                    float *output_ptr,
+                    hipStream_t stream) {
+  checkCUDNN(miopenSetStream(m->handle.dnn, stream));
+
+  float alpha = 1.0f, beta = 0.0f;
+  checkCUDNN(miopenSoftmaxForward_V2(m->handle.dnn,
+                                     &alpha,
+                                     m->inputTensor,
+                                     input_ptr,
+                                     &beta,
+                                     m->inputTensor,
+                                     output_ptr,
+                                     MIOPEN_SOFTMAX_ACCURATE,
+                                     MIOPEN_SOFTMAX_MODE_CHANNEL));
+}
+
+void backward_kernel(float *input_grad_ptr,
+                     float const *output_grad_ptr,
+                     size_t num_elements,
+                     hipStream_t stream) {
+  checkCUDA(hipMemcpyAsync(input_grad_ptr,
+                           output_grad_ptr,
+                           num_elements * sizeof(float),
+                           hipMemcpyDeviceToDevice,
+                           stream));
+}
+
+} // namespace Internal
+} // namespace Softmax
+} // namespace Kernels
+} // namespace FlexFlow
diff --git a/src/ops/softmax.cu b/src/ops/kernels/softmax.cu
similarity index 77%
rename from src/ops/softmax.cu
rename to src/ops/kernels/softmax.cu
index 7114f06274..d83d9952c9 100644
--- a/src/ops/softmax.cu
+++ b/src/ops/kernels/softmax.cu
@@ -13,7 +13,7 @@
  * limitations under the License.
  */
 
-#include "flexflow/ops/softmax.h"
+#include "flexflow/ops/kernels/softmax_kernels.h"
 #include "flexflow/utils/cuda_helper.h"
 #include "flexflow/utils/hash_utils.h"
 
@@ -32,29 +32,12 @@ SoftmaxMeta::SoftmaxMeta(FFHandler handler,
   std::strcpy(op_name, softmax->name);
 }
 
-/* static */
-void Softmax::forward_kernel(SoftmaxMeta const *m,
-                             float const *input_ptr,
-                             float *output_ptr,
-                             cudaStream_t stream) {
-  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
+namespace Kernels {
+namespace Softmax {
 
-  float alpha = 1.0f, beta = 0.0f;
-  checkCUDNN(cudnnSoftmaxForward(m->handle.dnn,
-                                 CUDNN_SOFTMAX_ACCURATE,
-                                 CUDNN_SOFTMAX_MODE_CHANNEL,
-                                 &alpha,
-                                 m->inputTensor,
-                                 input_ptr,
-                                 &beta,
-                                 m->inputTensor,
-                                 output_ptr));
-}
-
-/* static */
-void Softmax::forward_kernel_wrapper(SoftmaxMeta const *m,
-                                     float const *input_ptr,
-                                     float *output_ptr) {
+void forward_kernel_wrapper(SoftmaxMeta const *m,
+                            float const *input_ptr,
+                            float *output_ptr) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -64,7 +47,7 @@ void Softmax::forward_kernel_wrapper(SoftmaxMeta const *m,
     cudaEventCreate(&t_end);
     cudaEventRecord(t_start, stream);
   }
-  Softmax::forward_kernel(m, input_ptr, output_ptr, stream);
+  Internal::forward_kernel(m, input_ptr, output_ptr, stream);
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
     checkCUDA(cudaEventSynchronize(t_end));
@@ -80,23 +63,10 @@ void Softmax::forward_kernel_wrapper(SoftmaxMeta const *m,
   }
 }
 
-/* static */
-void Softmax::backward_kernel(float *input_grad_ptr,
-                              float const *output_grad_ptr,
-                              size_t num_elements,
-                              cudaStream_t stream) {
-  checkCUDA(cudaMemcpyAsync(input_grad_ptr,
-                            output_grad_ptr,
-                            num_elements * sizeof(float),
-                            cudaMemcpyDeviceToDevice,
-                            stream));
-}
-
-/* static */
-void Softmax::backward_kernel_wrapper(SoftmaxMeta const *m,
-                                      float *input_grad_ptr,
-                                      float const *output_grad_ptr,
-                                      size_t num_elements) {
+void backward_kernel_wrapper(SoftmaxMeta const *m,
+                             float *input_grad_ptr,
+                             float const *output_grad_ptr,
+                             size_t num_elements) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -106,7 +76,7 @@ void Softmax::backward_kernel_wrapper(SoftmaxMeta const *m,
     cudaEventCreate(&t_end);
     cudaEventRecord(t_start, stream);
   }
-  Softmax::backward_kernel(
+  Internal::backward_kernel(
       input_grad_ptr, output_grad_ptr, num_elements, stream);
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
@@ -123,4 +93,38 @@ void Softmax::backward_kernel_wrapper(SoftmaxMeta const *m,
   }
 }
 
-}; // namespace FlexFlow
+namespace Internal {
+
+void forward_kernel(SoftmaxMeta const *m,
+                    float const *input_ptr,
+                    float *output_ptr,
+                    cudaStream_t stream) {
+  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
+
+  float alpha = 1.0f, beta = 0.0f;
+  checkCUDNN(cudnnSoftmaxForward(m->handle.dnn,
+                                 CUDNN_SOFTMAX_ACCURATE,
+                                 CUDNN_SOFTMAX_MODE_CHANNEL,
+                                 &alpha,
+                                 m->inputTensor,
+                                 input_ptr,
+                                 &beta,
+                                 m->inputTensor,
+                                 output_ptr));
+}
+
+void backward_kernel(float *input_grad_ptr,
+                     float const *output_grad_ptr,
+                     size_t num_elements,
+                     cudaStream_t stream) {
+  checkCUDA(cudaMemcpyAsync(input_grad_ptr,
+                            output_grad_ptr,
+                            num_elements * sizeof(float),
+                            cudaMemcpyDeviceToDevice,
+                            stream));
+}
+
+} // namespace Internal
+} // namespace Softmax
+} // namespace Kernels
+} // namespace FlexFlow
diff --git a/src/ops/softmax.cc b/src/ops/softmax.cc
index 813104292f..029b20afd1 100644
--- a/src/ops/softmax.cc
+++ b/src/ops/softmax.cc
@@ -15,6 +15,7 @@
 
 #include "flexflow/ops/softmax.h"
 #include "flexflow/model.h"
+#include "flexflow/ops/kernels/softmax_kernels.h"
 #include "flexflow/utils/hash_utils.h"
 
 namespace FlexFlow {
@@ -34,6 +35,8 @@ using Legion::Task;
 using Legion::TaskArgument;
 using Legion::TaskLauncher;
 
+using namespace FlexFlow::Kernels::Softmax;
+
 /* Params */
 bool operator==(SoftmaxParams const &lhs, SoftmaxParams const &rhs) {
   return lhs.dim == rhs.dim;
@@ -252,7 +255,7 @@ void Softmax::forward_task_with_dim(Task const *task,
                                           runtime,
                                           false /*readOutput*/);
 
-  Softmax::forward_kernel_wrapper(m, acc_input.ptr, acc_output.ptr);
+  forward_kernel_wrapper(m, acc_input.ptr, acc_output.ptr);
 }
 
 void Softmax::backward(FFModel const &ff) {
@@ -327,7 +330,7 @@ void Softmax::backward_task_with_dim(Task const *task,
   // make sure the image indices match!
   assert(acc_input_grad.rect == acc_output_grad.rect);
 
-  Softmax::backward_kernel_wrapper(
+  backward_kernel_wrapper(
       m, acc_input_grad.ptr, acc_output_grad.ptr, acc_input_grad.rect.volume());
 }
 

From 3e41717e4a61b3d36c173c15a3ef6ebe12593e3f Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 2 Feb 2023 14:29:26 -0500
Subject: [PATCH 053/344] fixed initialization error message

---
 src/ops/experts.cc | 29 +++++++++++++++++++++++++++++
 1 file changed, 29 insertions(+)

diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index 288507b6d8..7ad30dac03 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -357,6 +357,35 @@ void Experts::init(FFModel const &ff) {
                          false /*must*/,
                          0 /*mapper_id*/,
                          outputs[0]->machine_view.hash());
+  // expert predictions
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  // expert assignment indices
+  launcher.add_region_requirement(RegionRequirement(inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[1]->region));
+  launcher.add_field(1, FID_DATA);
+  // topk_gate_preds
+  launcher.add_region_requirement(RegionRequirement(inputs[2]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[2]->region));
+  launcher.add_field(2, FID_DATA);
+  for (int i = 0; i < num_experts; i++) {
+    launcher.add_region_requirement(RegionRequirement(outputs[i]->part,
+                                                      0 /*projection id*/,
+                                                      WRITE_ONLY,
+                                                      EXCLUSIVE,
+                                                      outputs[i]->region));
+    launcher.add_field(i + 3, FID_DATA);
+  }
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
   set_opmeta_from_futuremap(ff, fm);

From eb7284e68ba765e32f2f244075a96d94544cf2e9 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 3 Feb 2023 01:06:27 -0500
Subject: [PATCH 054/344] [MoE][Experts] - Add support for tensors with more
 than 2 dimensions (#607)

* add support for higher dimensions in experts.cc

* fix linear layer issue

* remove outdated comments

* redo change accidentally removed

* linting
---
 .../cpp/inference/mixture_of_experts/moe.cc   | 26 +++---
 .../cpp/inference/mixture_of_experts/moe.h    |  6 +-
 include/flexflow/ops/experts.h                |  2 +-
 src/ops/experts.cc                            | 80 +++++++++++--------
 src/ops/linear.cc                             |  2 +-
 5 files changed, 68 insertions(+), 48 deletions(-)

diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index e6f9a51d21..fa01cee517 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -68,7 +68,7 @@ Tensor create_moe(FFModel *model,
 Tensor create_moe_encoder(FFModel *model,
                           MoeConfig const *moeConfig,
                           Tensor const &input) {
-  std::vector<int> axes = {0, 1};
+  std::vector<int> axes = {0, 1, 2};
   Tensor x = input;
   for (int i = 0; i < moeConfig->num_encoder_layers; i++) {
     x = model->layer_norm(
@@ -104,8 +104,9 @@ void FlexFlow::top_level_task(Task const *task,
 
   //-----------------------------------------------------------------
 
-  FFConfig ffConfig;
   MoeConfig moeConfig;
+  FFConfig ffConfig;
+  ffConfig.batchSize = moeConfig.batch_size;
   {
     InputArgs const &command_args = HighLevelRuntime::get_input_args();
     char **argv = command_args.argv;
@@ -120,14 +121,15 @@ void FlexFlow::top_level_task(Task const *task,
 
   Tensor input;
   {
-    int const dims[] = {ffConfig.batchSize, DATA_DIMS};
-    input = ff.create_tensor<2>(dims, DT_FLOAT);
+    int const dims[] = {
+        ffConfig.batchSize, moeConfig.sequence_length, DATA_DIMS};
+    input = ff.create_tensor<3>(dims, DT_FLOAT);
   }
 
   //-----------------------------------------------------------------
 
-  // Tensor t = create_moe_encoder(&ff, &moeConfig, input);
-  Tensor t = create_moe(&ff, &moeConfig, input);
+  Tensor t = create_moe_encoder(&ff, &moeConfig, input);
+  // Tensor t = create_moe(&ff, &moeConfig, input);
   t = ff.dense(t, OUT_DIM, AC_MODE_RELU);
 
   /* InferenceManager im(&ff, num_requests_per_batch, num_inflight_batches);
@@ -140,10 +142,10 @@ void FlexFlow::top_level_task(Task const *task,
   ff.compile(optimizer, LOSS_SPARSE_CATEGORICAL_CROSSENTROPY, metrics);
 
   // Data Loader
-  ParallelTensor input_pt, label_pt;
-  ff.get_parallel_tensor_from_tensor(input, input_pt);
-  ff.get_parallel_tensor_from_tensor(ff.label_tensor, label_pt);
-  DataLoader data_loader(ff, moeConfig, input_pt, label_pt);
+  // ParallelTensor input_pt, label_pt;
+  // ff.get_parallel_tensor_from_tensor(input, input_pt);
+  // ff.get_parallel_tensor_from_tensor(ff.label_tensor, label_pt);
+  // DataLoader data_loader(ff, moeConfig, input_pt, label_pt);
 
   ff.init_operators();
 
@@ -177,12 +179,12 @@ void FlexFlow::top_level_task(Task const *task,
   // }
 
   for (int epoch = 0; epoch < ffConfig.epochs; epoch++) {
-    data_loader.reset();
+    // data_loader.reset();
     ff.reset_metrics();
     int iterations = TRAIN_SAMPLES / ffConfig.batchSize;
 
     for (int iter = 0; iter < iterations; iter++) {
-      data_loader.next_batch(ff);
+      // data_loader.next_batch(ff);
       if (epoch > 0) {
         runtime->begin_trace(ctx, 111 /*trace_id*/);
       }
diff --git a/examples/cpp/inference/mixture_of_experts/moe.h b/examples/cpp/inference/mixture_of_experts/moe.h
index 80cef3ff87..2df988f530 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.h
+++ b/examples/cpp/inference/mixture_of_experts/moe.h
@@ -40,10 +40,12 @@ struct MoeConfig {
     alpha = 2.0f;
     lambda = 0.04f;
     hidden_size = DATA_DIMS;
+    batch_size = 32;
+    sequence_length = 10;
     // Encoder layer
     num_attention_heads = 16;
     attention_kdim = attention_vdim = hidden_size / num_attention_heads;
-    num_encoder_layers = 6;
+    num_encoder_layers = 1; //
   }
   // MoE layer
   int num_exp;
@@ -52,6 +54,8 @@ struct MoeConfig {
   float alpha;  // factor overhead tensor size for imbalance
   float lambda; // multiplier for load balance term
   int hidden_size;
+  int batch_size;
+  int sequence_length;
   // Encoder layer
   int num_attention_heads;
   int attention_kdim;
diff --git a/include/flexflow/ops/experts.h b/include/flexflow/ops/experts.h
index 6b875a10b9..a7f0b46e05 100644
--- a/include/flexflow/ops/experts.h
+++ b/include/flexflow/ops/experts.h
@@ -13,7 +13,7 @@ class ExpertsMeta : public OpMeta {
 };
 
 // definitions for the CUDA kernel
-#define MAX_BATCH_SIZE 64
+#define MAX_BATCH_SIZE 32 * 10
 #define MAX_EXPERTS_PER_BLOCK 32
 
 class Experts : public Op {
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index 7ad30dac03..6450ab5173 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -57,10 +57,7 @@ Tensor FFModel::experts(Tensor const *inputs,
     assert(inputs[0]->dims[i] == inputs[1]->dims[i]);
     assert(inputs[1]->dims[i] == inputs[2]->dims[i]);
   }
-  // assert(input->num_dims == indices->num_dims);
-  // for (int i = 1; i < indices->num_dims; i++) {
-  //   assert(input->dims[i] == indices->dims[i]);
-  // }
+
   assert(inputs[1]->data_type == DT_INT32 || inputs[1]->data_type == DT_INT64);
 
   assert(experts_num_layers == 1 && "Multi-layer experts not implemented yet.");
@@ -270,20 +267,11 @@ Experts::Experts(FFModel &model,
     assert(inputs[0]->dims[i] == inputs[1]->dims[i]);
     assert(inputs[1]->dims[i] == inputs[2]->dims[i]);
   }
-  // assert(input->num_dims == indices->num_dims);
-  // for (int i = 1; i < indices->num_dims; i++) {
-  //   assert(input->dims[i] == indices->dims[i]);
-  // }
+
   assert(inputs[1]->data_type == DT_INT32 || inputs[1]->data_type == DT_INT64);
   assert(experts_num_layers == 1 && "Multi-layer experts not implemented yet.");
   assert(experts_num_layers == 1 || experts_internal_dim_size > 0);
 
-  // assert(input->num_dims == indices->num_dims);
-  // assert(indices->data_type == DT_INT32 || indices->data_type == DT_INT64);
-  // for (int i = 1; i < indices->num_dims; i++) {
-  //   assert(input->dims[i] == indices->dims[i]);
-  // }
-
   // Assume that we don't parallelize the channel dim of input
   // nor the expert_assigned dim of indices
   assert(inputs[0]->dims[0].degree == 1);
@@ -517,24 +505,46 @@ void Experts::forward_task(Task const *task,
   ExpertsMeta const *m = *((ExpertsMeta **)task->local_args);
 
   // get input, indices, topk_gate_preds
-  AccessorRO<float, 3> const acc_input(regions[0], FID_DATA);
-  AccessorRO<int, 3> const acc_indices(regions[1], FID_DATA);
-  AccessorRO<float, 3> const acc_topk_gate_pred(regions[2], FID_DATA);
-  Rect<3> rect_input = runtime->get_index_space_domain(
+  float const *input_ptr = helperGetTensorPointerRO<float>(
+      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  int const *indices_ptr = helperGetTensorPointerRO<int>(
+      regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  float const *topk_gate_pred_ptr = helperGetTensorPointerRO<float>(
+      regions[2], task->regions[2], FID_DATA, ctx, runtime);
+
+  Domain input_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
-  Rect<3> rect_indices = runtime->get_index_space_domain(
+  Domain indices_domain = runtime->get_index_space_domain(
       ctx, task->regions[1].region.get_index_space());
-  Rect<3> rect_topk_gate_pred = runtime->get_index_space_domain(
+  Domain topk_gate_pred_domain = runtime->get_index_space_domain(
       ctx, task->regions[2].region.get_index_space());
 
-  coord_t batch_size = rect_input.hi[1] - rect_input.lo[1] + 1;
-  assert(batch_size == rect_indices.hi[1] - rect_indices.lo[1] + 1);
-  assert(batch_size ==
-         rect_topk_gate_pred.hi[1] - rect_topk_gate_pred.lo[1] + 1);
-  coord_t chosen_experts = rect_indices.hi[0] - rect_indices.lo[0];
+  int input_dims = input_domain.get_dim();
+  int indices_dims = indices_domain.get_dim();
+  int topk_gate_pred_dims = topk_gate_pred_domain.get_dim();
+  assert(input_dims == indices_dims);
+  assert(indices_dims == topk_gate_pred_dims);
+
+  int replica_dim = input_dims - 1;
+  int samples_index = input_dims - 2;
+
+  coord_t out_dim =
+      (input_domain.hi()[0] - input_domain.lo()[0] + 1) / num_experts;
+  coord_t batch_size =
+      input_domain.hi()[samples_index] - input_domain.lo()[samples_index] + 1;
+  coord_t chosen_experts = indices_domain.hi()[0] - indices_domain.lo()[0];
   assert(chosen_experts ==
-         rect_topk_gate_pred.hi[0] - rect_topk_gate_pred.lo[0]);
-  coord_t out_dim = (rect_input.hi[0] - rect_input.lo[0] + 1) / num_experts;
+         topk_gate_pred_domain.hi()[0] - topk_gate_pred_domain.lo()[0]);
+
+  for (int i = 1; i < input_dims; i++) {
+    int a = input_domain.hi()[i] - input_domain.lo()[i] + 1;
+    int b = indices_domain.hi()[i] - indices_domain.lo()[i] + 1;
+    int c = topk_gate_pred_domain.hi()[i] - topk_gate_pred_domain.lo()[i] + 1;
+    assert(a == b && b == c);
+    if (i >= 1 && i < samples_index) {
+      batch_size *= a;
+    }
+  }
 
   int expert_capacity =
       ceil(alpha * (int)chosen_experts / num_experts * (int)batch_size);
@@ -547,19 +557,23 @@ void Experts::forward_task(Task const *task,
 
   float *outputs[num_experts];
   for (int i = 0; i < num_experts; i++) {
-    Rect<3> rect_output = runtime->get_index_space_domain(
+    Domain output_domain = runtime->get_index_space_domain(
         ctx, task->regions[3 + i].region.get_index_space());
-    assert((rect_output.hi[0] - rect_output.lo[0] + 1) == out_dim);
-    assert((rect_output.hi[1] - rect_output.lo[1] + 1) == batch_size);
+    assert((output_domain.hi()[0] - output_domain.lo()[0] + 1) == out_dim);
+    for (int j = 1; j < input_dims; j++) {
+      int a = input_domain.hi()[j] - input_domain.lo()[j] + 1;
+      int b = output_domain.hi()[j] - output_domain.lo()[j] + 1;
+      assert(a == b);
+    }
     outputs[i] = helperGetTensorPointerWO<float>(
         regions[3 + i], task->regions[3 + i], FID_DATA, ctx, runtime);
     assert(outputs[i] != nullptr);
   }
 
   Experts::forward_kernel_wrapper(m,
-                                  acc_input.ptr(rect_input),
-                                  acc_indices.ptr(rect_indices),
-                                  acc_topk_gate_pred.ptr(rect_topk_gate_pred),
+                                  input_ptr,
+                                  indices_ptr,
+                                  topk_gate_pred_ptr,
                                   outputs,
                                   num_experts,
                                   experts_start_idx,
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index 435080dbe1..0e09e20e44 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -464,7 +464,7 @@ void Linear::forward_task_with_dim(Task const *task,
   assert(acc_kernel.rect.volume() == static_cast<size_t>(in_dim * out_dim));
   float const *acc_bias_ptr = NULL;
   if (m->use_bias) {
-    TensorAccessorR<float, 3> acc_bias(
+    TensorAccessorR<float, NDIM> acc_bias(
         regions[3], task->regions[3], FID_DATA, ctx, runtime);
     assert(acc_bias.rect.volume() == static_cast<size_t>(out_dim));
     acc_bias_ptr = acc_bias.ptr;

From 19e3dccf49c92fea9ecbf8513639b49bf8f3beee Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sat, 4 Feb 2023 16:01:59 -0500
Subject: [PATCH 055/344] [Inference] - Bug fixes and code improvements (#605)

* fixed compilation bug and others

* add inference init functions

* fixed init issue

* fix bug

* further cleanup

* fix

* fix

* bring back EXPERTS_INF_TASK_ID task id

* passing configurations via init task only

* removed task arg from other operators
---
 examples/cpp/inference/data_generator.h       |   2 +-
 .../cpp/inference/mixture_of_experts/moe.cc   |  81 ++++---------
 include/flexflow/inference.h                  |   1 +
 include/flexflow/model.h                      |   4 +
 include/flexflow/operator.h                   |   5 +
 include/flexflow/ops/aggregate.h              |   3 +
 include/flexflow/ops/aggregate_spec.h         |   3 +
 include/flexflow/ops/attention.h              |   3 +
 include/flexflow/ops/element_binary.h         |   3 +
 include/flexflow/ops/experts.h                |  14 ++-
 include/flexflow/ops/groupby.h                |  42 +++----
 include/flexflow/ops/layer_norm.h             |   3 +
 include/flexflow/ops/linear.h                 |   3 +
 include/flexflow/ops/noop.h                   |   7 ++
 include/flexflow/ops/softmax.h                |   7 ++
 include/flexflow/ops/topk.h                   |   3 +
 include/flexflow/parallel_ops/parallel_op.h   |   8 ++
 include/flexflow/parallel_ops/partition.h     |  11 ++
 src/ops/aggregate.cc                          |  23 ++++
 src/ops/aggregate_spec.cc                     |  31 ++++-
 src/ops/attention.cc                          |  56 ++++++++-
 src/ops/element_binary.cc                     |  68 ++++++++++-
 src/ops/experts.cc                            | 114 +++++++++++++-----
 src/ops/experts.cpp                           |  23 ++--
 src/ops/experts.cu                            |  23 ++--
 src/ops/group_by.cc                           |  91 +++++++++-----
 src/ops/group_by.cpp                          |  45 +++----
 src/ops/group_by.cu                           |  45 +++----
 src/ops/layer_norm.cc                         |  38 +++++-
 src/ops/linear.cc                             |  53 +++++++-
 src/ops/noop.cc                               |  88 ++++++++++++++
 src/ops/softmax.cc                            |  67 ++++++++++
 src/ops/topk.cc                               |  43 ++++++-
 src/parallel_ops/partition.cc                 |  89 ++++++++++++++
 src/runtime/inference_manager.cc              |  44 +++++++
 src/runtime/model.cc                          |  21 +++-
 36 files changed, 944 insertions(+), 221 deletions(-)

diff --git a/examples/cpp/inference/data_generator.h b/examples/cpp/inference/data_generator.h
index 8c3a89d2a7..98af050a98 100644
--- a/examples/cpp/inference/data_generator.h
+++ b/examples/cpp/inference/data_generator.h
@@ -78,7 +78,7 @@ vector<vector<double>> Generator::get_requests(void) {
       chrono::duration_cast<milliseconds>(cur_time - start_time);
   while (arrivals_ptr < arrivals.end() &&
          ms_from_start.count() >= *arrivals_ptr) {
-    cout << "output request at arrival time +" << *arrivals_ptr << "\n";
+    cout << "request at arrival time +" << *arrivals_ptr << "\n";
     requests.push_back(get_random_tensor());
     arrivals_ptr++;
   }
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index fa01cee517..918f04d0b7 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -16,9 +16,12 @@
 #include "moe.h"
 #include "data_generator.h"
 #include "flexflow/inference.h"
+#include <cstdlib>
 #include <fstream>
+#include <iostream>
 #include <sstream>
 #include <string>
+#include <unistd.h>
 
 using namespace Legion;
 
@@ -93,14 +96,14 @@ void FlexFlow::top_level_task(Task const *task,
                               std::vector<PhysicalRegion> const &regions,
                               Context ctx,
                               Runtime *runtime) {
-  /* // Inference parameters
+  // Inference parameters
   int total_requests =
       256; // total number of requests processed as part of the simulation
   int request_tensor_size = 4; // request tensor dimensions
   bool poisson_distribution = true;
   double lambda = 25; // average number of request arrivals per second
   int num_requests_per_batch = 5;
-  int num_inflight_batches = 10; */
+  int num_inflight_batches = 10;
 
   //-----------------------------------------------------------------
 
@@ -132,22 +135,15 @@ void FlexFlow::top_level_task(Task const *task,
   // Tensor t = create_moe(&ff, &moeConfig, input);
   t = ff.dense(t, OUT_DIM, AC_MODE_RELU);
 
-  /* InferenceManager im(&ff, num_requests_per_batch, num_inflight_batches);
-  im.compile_model_and_allocate_buffer(); */
-
-  Optimizer *optimizer = new SGDOptimizer(&ff, 0.001f);
-  std::vector<MetricsType> metrics;
-  metrics.push_back(METRICS_ACCURACY);
-  metrics.push_back(METRICS_SPARSE_CATEGORICAL_CROSSENTROPY);
-  ff.compile(optimizer, LOSS_SPARSE_CATEGORICAL_CROSSENTROPY, metrics);
+  InferenceManager im(&ff, num_requests_per_batch, num_inflight_batches);
+  im.compile_model_and_allocate_buffer();
+  im.init_operators_inference();
 
   // Data Loader
-  // ParallelTensor input_pt, label_pt;
-  // ff.get_parallel_tensor_from_tensor(input, input_pt);
-  // ff.get_parallel_tensor_from_tensor(ff.label_tensor, label_pt);
-  // DataLoader data_loader(ff, moeConfig, input_pt, label_pt);
-
-  ff.init_operators();
+  /* ParallelTensor input_pt, label_pt;
+  ff.get_parallel_tensor_from_tensor(input, input_pt);
+  ff.get_parallel_tensor_from_tensor(ff.label_tensor, label_pt);
+  DataLoader data_loader(ff, moeConfig, input_pt, label_pt); */
 
   //-----------------------------------------------------------------
 
@@ -162,50 +158,21 @@ void FlexFlow::top_level_task(Task const *task,
 
   ///////////////////////////////////////////////////////////////////////////////////
 
-  // int index = 0;
-  // int processed_requests = 0;
-  // Generator data_generator(
-  //     total_requests, request_tensor_size, poisson_distribution, lambda);
-  // while (processed_requests < total_requests) {
-  //   vector<vector<double>> req = data_generator.get_requests();
-  //   int iterations = req.size();
-  //   for (int iter = 0; iter < iterations; iter++) {
-  //     // data_loader.next_batch(ff);
-  //     runtime->begin_trace(ctx, 111 /*trace_id*/);
-  //     im.inference((index++) % num_inflight_batches);
-  //     runtime->end_trace(ctx, 111 /*trace_id*/);
-  //   }
-  //   processed_requests += iterations;
-  // }
-
-  for (int epoch = 0; epoch < ffConfig.epochs; epoch++) {
-    // data_loader.reset();
-    ff.reset_metrics();
-    int iterations = TRAIN_SAMPLES / ffConfig.batchSize;
-
+  int index = 0;
+  int processed_requests = 0;
+  Generator data_generator(
+      total_requests, request_tensor_size, poisson_distribution, lambda);
+  // data_loader.reset();
+  while (processed_requests < total_requests) {
+    vector<vector<double>> req = data_generator.get_requests();
+    int iterations = req.size();
     for (int iter = 0; iter < iterations; iter++) {
       // data_loader.next_batch(ff);
-      if (epoch > 0) {
-        runtime->begin_trace(ctx, 111 /*trace_id*/);
-      }
-      ff.forward();
-      ff.zero_gradients();
-      // ff.backward();
-      ff.update();
-      // ff.recompile_on_condition(r);
-      if (epoch > 0) {
-        runtime->end_trace(ctx, 111 /*trace_id*/);
-      }
+      runtime->begin_trace(ctx, 111 /*trace_id*/);
+      im.inference((index++) % num_inflight_batches);
+      runtime->end_trace(ctx, 111 /*trace_id*/);
     }
-
-    // TODO: Do properly
-    ff.reset_metrics();
-    // iterations = TEST_SAMPLES / ffConfig.batchSize;
-    // for (int iter = 0; iter < iterations; iter++) {
-    //   data_loader.next_batch(ff);
-    //   ff.forward();
-    //   ff.backward();
-    // }
+    processed_requests += iterations;
   }
 
   ///////////////////////////////////////////////////////////////////////////////////
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index 5c9fe5f497..bb2a70e8a8 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -27,6 +27,7 @@ class InferenceManager {
                    int max_num_requests_per_batch,
                    int max_num_inflight_batches);
   void compile_model_and_allocate_buffer(void);
+  void init_operators_inference();
   void inference(int index);
 
 public:
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 9ad9d52eab..2e13e9f4cf 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -57,6 +57,7 @@ enum TaskIDs {
   EXPERTS_INIT_TASK_ID,
   EXPERTS_FWD_TASK_ID,
   EXPERTS_BWD_TASK_ID,
+  EXPERTS_INF_TASK_ID,
   CONV2D_INIT_TASK_ID,
   CONV2D_INIT_PARA_TASK_ID,
   CONV2D_FWD_TASK_ID,
@@ -760,6 +761,9 @@ class FFModel {
                           Legion::Runtime *runtime);
   void reset_metrics();
   void init_operators();
+  void init_operators_inference(
+      std::vector<ParallelTensor> const &batch_inputs,
+      std::vector<ParallelTensor> const &batch_outputs);
   void prefetch();
   void forward(int seq_length = -1);
   void compute_metrics();
diff --git a/include/flexflow/operator.h b/include/flexflow/operator.h
index a276f0fd74..280df29f83 100644
--- a/include/flexflow/operator.h
+++ b/include/flexflow/operator.h
@@ -185,6 +185,11 @@ class Op {
   virtual bool get_weight_parameter(TNParameter, DIMParameter, int *) const;
   // Pure virtual functions that must be implemented
   virtual void init(FFModel const &) = 0;
+  virtual void init_inference(FFModel const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &) {
+    assert(false);
+  };
   virtual void forward(FFModel const &) = 0;
   virtual void backward(FFModel const &) = 0;
   // Pure virtual functions for inference
diff --git a/include/flexflow/ops/aggregate.h b/include/flexflow/ops/aggregate.h
index ba7240802b..4d6aaeccb9 100644
--- a/include/flexflow/ops/aggregate.h
+++ b/include/flexflow/ops/aggregate.h
@@ -35,6 +35,9 @@ class Aggregate : public Op {
             Input const &inputs,
             char const *name = nullptr);
   void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &) override;
   void forward(FFModel const &) override;
   void inference(FFModel const &,
                  std::vector<ParallelTensor> const &,
diff --git a/include/flexflow/ops/aggregate_spec.h b/include/flexflow/ops/aggregate_spec.h
index 816574ced0..2792ce58a4 100644
--- a/include/flexflow/ops/aggregate_spec.h
+++ b/include/flexflow/ops/aggregate_spec.h
@@ -27,6 +27,9 @@ class AggregateSpec : public Op {
                 float _lambda_bal,
                 char const *name);
   void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &) override;
   void forward(FFModel const &) override;
   void inference(FFModel const &,
                  std::vector<ParallelTensor> const &,
diff --git a/include/flexflow/ops/attention.h b/include/flexflow/ops/attention.h
index 1531708bb7..684e29e910 100644
--- a/include/flexflow/ops/attention.h
+++ b/include/flexflow/ops/attention.h
@@ -64,6 +64,9 @@ class MultiHeadAttention : public Op {
                                  Layer const *layer,
                                  std::vector<ParallelTensor> const &inputs);
   void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   void inference(FFModel const &,
diff --git a/include/flexflow/ops/element_binary.h b/include/flexflow/ops/element_binary.h
index 2f081f1b7e..1116519e8c 100644
--- a/include/flexflow/ops/element_binary.h
+++ b/include/flexflow/ops/element_binary.h
@@ -25,6 +25,9 @@ class ElementBinary : public Op {
                 char const *name = nullptr,
                 bool inplace_a = false);
   void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   void inference(FFModel const &,
diff --git a/include/flexflow/ops/experts.h b/include/flexflow/ops/experts.h
index a7f0b46e05..190e76d865 100644
--- a/include/flexflow/ops/experts.h
+++ b/include/flexflow/ops/experts.h
@@ -7,8 +7,14 @@ namespace FlexFlow {
 
 class ExpertsMeta : public OpMeta {
 public:
-  ExpertsMeta(FFHandler handler, int num_experts);
+  ExpertsMeta(FFHandler handler,
+              int _num_experts,
+              int _experts_start_idx,
+              float _alpha);
   ~ExpertsMeta(void);
+  int num_experts;
+  int experts_start_idx;
+  float alpha;
   float **dev_region_ptrs;
 };
 
@@ -39,6 +45,9 @@ class Experts : public Op {
                                  std::vector<ParallelTensor> const &inputs);
 
   void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   void inference(FFModel const &,
@@ -65,9 +74,6 @@ class Experts : public Op {
                                      int const *acc_indices_ptr,
                                      float const *acc_topk_gate_preds_ptr,
                                      float **outputs,
-                                     int num_experts,
-                                     int experts_start_idx,
-                                     int expert_capacity,
                                      int chosen_experts,
                                      int batch_size,
                                      int out_dim);
diff --git a/include/flexflow/ops/groupby.h b/include/flexflow/ops/groupby.h
index afa69d891c..0b8a001f67 100644
--- a/include/flexflow/ops/groupby.h
+++ b/include/flexflow/ops/groupby.h
@@ -9,8 +9,9 @@ namespace FlexFlow {
 
 class GroupByMeta : public OpMeta {
 public:
-  GroupByMeta(FFHandler handle, int n);
+  GroupByMeta(FFHandler handle, int n, float _alpha);
   ~GroupByMeta(void);
+  float alpha;
   float **dev_region_ptrs;
 };
 
@@ -33,6 +34,9 @@ class Group_by : public Op {
            Input const &inputs,
            char const *name = nullptr);
   void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   void inference(FFModel const &,
@@ -66,26 +70,22 @@ class Group_by : public Op {
   Op *materialize(FFModel &ff,
                   ParallelTensor inputs[],
                   int num_inputs) const override;
-  static void
-      forward_kernel_wrapper(GroupByMeta const *m,
-                             float const *input,
-                             int const *exp_assign,
-                             float **outputs,
-                             int n,       // num experts
-                             int k,       // chosen experts
-                             float alpha, // factor additional memory assigned
-                             int batch_size,
-                             int data_dim);
-  static void
-      backward_kernel_wrapper(GroupByMeta const *m,
-                              float *input_grad,
-                              int const *exp_assign,
-                              float **output_grads,
-                              int n,       // num experts
-                              int k,       // chosen experts
-                              float alpha, // factor additional memory assigned
-                              int batch_size,
-                              int data_dim);
+  static void forward_kernel_wrapper(GroupByMeta const *m,
+                                     float const *input,
+                                     int const *exp_assign,
+                                     float **outputs,
+                                     int n, // num experts
+                                     int k, // chosen experts
+                                     int batch_size,
+                                     int data_dim);
+  static void backward_kernel_wrapper(GroupByMeta const *m,
+                                      float *input_grad,
+                                      int const *exp_assign,
+                                      float **output_grads,
+                                      int n, // num experts
+                                      int k, // chosen experts
+                                      int batch_size,
+                                      int data_dim);
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
                              CostMetrics &cost_metrics) const override;
diff --git a/include/flexflow/ops/layer_norm.h b/include/flexflow/ops/layer_norm.h
index c05461acdf..3a81fe50f1 100644
--- a/include/flexflow/ops/layer_norm.h
+++ b/include/flexflow/ops/layer_norm.h
@@ -24,6 +24,9 @@ class LayerNorm : public Op {
             bool allocate_weights,
             char const *name);
   void init(FFModel const &);
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &) override;
   void forward(FFModel const &);
   void backward(FFModel const &);
   void inference(FFModel const &,
diff --git a/include/flexflow/ops/linear.h b/include/flexflow/ops/linear.h
index ab1c1febc5..fb2767a590 100644
--- a/include/flexflow/ops/linear.h
+++ b/include/flexflow/ops/linear.h
@@ -35,6 +35,9 @@ class Linear : public Op {
          bool allocate_weights = false);
 
   void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   void inference(FFModel const &,
diff --git a/include/flexflow/ops/noop.h b/include/flexflow/ops/noop.h
index 5f39c999e6..688ab083df 100644
--- a/include/flexflow/ops/noop.h
+++ b/include/flexflow/ops/noop.h
@@ -17,7 +17,14 @@ class NoOp : public Op {
        const ParallelTensor output,
        char const *name = NULL);
   void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &) override;
   void forward(FFModel const &) override;
+  void inference(FFModel const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &,
+                 MachineView const *mv = nullptr) override;
   void backward(FFModel const &) override;
   void print_layer(FFModel const &model) override {
     assert(0);
diff --git a/include/flexflow/ops/softmax.h b/include/flexflow/ops/softmax.h
index 25a20315bd..c1d3ebdba2 100644
--- a/include/flexflow/ops/softmax.h
+++ b/include/flexflow/ops/softmax.h
@@ -21,7 +21,14 @@ class Softmax : public Op {
           const Input input,
           char const *name = nullptr);
   void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &) override;
   void forward(FFModel const &) override;
+  void inference(FFModel const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &,
+                 MachineView const *mv = nullptr) override;
   void backward(FFModel const &) override;
   bool get_int_parameter(PMParameter, int *) const override;
   void print_layer(FFModel const &model) override {
diff --git a/include/flexflow/ops/topk.h b/include/flexflow/ops/topk.h
index af62f51c93..9c82930822 100644
--- a/include/flexflow/ops/topk.h
+++ b/include/flexflow/ops/topk.h
@@ -28,6 +28,9 @@ class TopK : public Op {
        Input const input,
        char const *name = nullptr);
   void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   void inference(FFModel const &,
diff --git a/include/flexflow/parallel_ops/parallel_op.h b/include/flexflow/parallel_ops/parallel_op.h
index a374b7ab40..0bf573996c 100644
--- a/include/flexflow/parallel_ops/parallel_op.h
+++ b/include/flexflow/parallel_ops/parallel_op.h
@@ -24,6 +24,12 @@ class ParallelOp : public Op {
   virtual void forward(FFModel const &) = 0;
   virtual void backward(FFModel const &) = 0;
   virtual void create_input_partition(FFModel &model) = 0;
+  virtual void create_input_partition_inference(
+      FFModel &model,
+      std::vector<ParallelTensor> const &batch_inputs,
+      std::vector<ParallelTensor> const &batch_outputs) {
+    assert(false);
+  }
   void print_layer(FFModel const &model){};
   virtual bool measure_operator_cost(Simulator *sim,
                                      MachineView const &pc,
@@ -34,6 +40,8 @@ class ParallelOp : public Op {
 
 public:
   Legion::LogicalPartition input_lp, output_grad_lp;
+  std::unordered_map<ParallelTensor, Legion::LogicalPartition>
+      inference_input_lps;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/parallel_ops/partition.h b/include/flexflow/parallel_ops/partition.h
index 5c2fa9c228..d940841eb4 100644
--- a/include/flexflow/parallel_ops/partition.h
+++ b/include/flexflow/parallel_ops/partition.h
@@ -24,8 +24,19 @@ class Repartition : public ParallelOp {
               Input const input,
               char const *name = nullptr);
   void create_input_partition(FFModel &model) override;
+  void create_input_partition_inference(
+      FFModel &model,
+      std::vector<ParallelTensor> const &batch_inputs,
+      std::vector<ParallelTensor> const &batch_outputs) override;
   void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &) override;
   void forward(FFModel const &) override;
+  void inference(FFModel const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &,
+                 MachineView const *mv = nullptr) override;
   void backward(FFModel const &) override;
   bool get_int_parameter(PMParameter, int *) const override;
   bool append_parallel_op_info(
diff --git a/src/ops/aggregate.cc b/src/ops/aggregate.cc
index a1e5fcbbad..458a58b3fe 100644
--- a/src/ops/aggregate.cc
+++ b/src/ops/aggregate.cc
@@ -182,6 +182,29 @@ Node Aggregate::deserialize(FFModel &ff,
   return ff.get_or_create_node<Aggregate>(inputs, params);
 }
 
+void Aggregate::init_inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(AGGREGATE_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(Aggregate)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         batch_outputs[0]->machine_view.hash());
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
 void Aggregate::init(FFModel const &ff) {
   assert(check_output_input_weight_same_parallel_is());
   parallel_is = outputs[0]->parallel_is;
diff --git a/src/ops/aggregate_spec.cc b/src/ops/aggregate_spec.cc
index 1e3d66fdee..a206610095 100644
--- a/src/ops/aggregate_spec.cc
+++ b/src/ops/aggregate_spec.cc
@@ -155,6 +155,29 @@ AggregateSpec::AggregateSpec(FFModel &model,
   numWeights = 0;
 }
 
+void AggregateSpec::init_inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(AGG_SPEC_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(AggregateSpec)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         batch_outputs[0]->machine_view.hash());
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
 void AggregateSpec::init(FFModel const &ff) {
   assert(check_output_input_weight_same_parallel_is());
   parallel_is = outputs[0]->parallel_is;
@@ -193,7 +216,7 @@ void AggregateSpec::forward(FFModel const &ff) {
   set_argumentmap_for_forward(ff, argmap);
   IndexLauncher launcher(AGG_SPEC_FWD_TASK_ID,
                          parallel_is,
-                         TaskArgument(this, sizeof(AggregateSpec)),
+                         TaskArgument(NULL, 0),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
@@ -244,7 +267,7 @@ void AggregateSpec::inference(FFModel const &ff,
   size_t machine_view_hash = mv ? mv->hash() : outputs[0]->machine_view.hash();
   IndexLauncher launcher(AGG_SPEC_FWD_TASK_ID,
                          parallel_is,
-                         TaskArgument(this, sizeof(AggregateSpec)),
+                         TaskArgument(NULL, 0),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
@@ -288,9 +311,9 @@ void AggregateSpec::forward_task(Task const *task,
                                  std::vector<PhysicalRegion> const &regions,
                                  Context ctx,
                                  Runtime *runtime) {
-  int n = ((AggregateSpec *)task->args)->n;
+  assert(regions.size() == task->regions.size());
+  int n = regions.size() - 3;
 
-  assert((int)regions.size() == n + 3);
   assert((int)task->regions.size() == n + 3);
 
   AggregateSpecMeta const *m = *((AggregateSpecMeta **)task->local_args);
diff --git a/src/ops/attention.cc b/src/ops/attention.cc
index d9ee14ecb6..8f5043e49e 100644
--- a/src/ops/attention.cc
+++ b/src/ops/attention.cc
@@ -372,6 +372,59 @@ MultiHeadAttention::MultiHeadAttention(
                          allocate_weights,
                          name) {}
 
+void MultiHeadAttention::init_inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(ATTENTION_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(MultiHeadAttention)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         batch_outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[1]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[2]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[2]->region));
+  launcher.add_field(2, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(3, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(4, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
 void MultiHeadAttention::init(FFModel const &ff) {
   assert(check_output_input_weight_same_parallel_is());
   parallel_is = outputs[0]->parallel_is;
@@ -533,7 +586,8 @@ void MultiHeadAttention::inference(
   Runtime *runtime = ff.config.lg_hlr;
   set_argumentmap_for_forward(ff, argmap);
   int idx = 0;
-  size_t machine_view_hash = mv ? mv->hash() : outputs[0]->machine_view.hash();
+  size_t machine_view_hash =
+      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
   IndexLauncher launcher(ATTENTION_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
diff --git a/src/ops/element_binary.cc b/src/ops/element_binary.cc
index feb1862b04..ab4df2826a 100644
--- a/src/ops/element_binary.cc
+++ b/src/ops/element_binary.cc
@@ -246,6 +246,71 @@ void ElementBinary::do_inplace_output(void) {
   inplace_a = true;
 }
 
+void ElementBinary::init_inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs) {
+  // Check if we have the same oprands
+  has_same_operands = (batch_inputs[0]->region == batch_inputs[1]->region);
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(ELEMENTBINARY_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(ElementBinary)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         batch_outputs[0]->machine_view.hash());
+  int rid = 0;
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(rid++, FID_DATA);
+  if (!has_same_operands) {
+    launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
+                                                      0 /*projection id*/,
+                                                      READ_WRITE,
+                                                      EXCLUSIVE,
+                                                      batch_inputs[1]->region));
+    launcher.add_field(rid++, FID_DATA);
+  } else {
+    assert(batch_inputs[0]->part == batch_inputs[1]->part);
+  }
+  if (!inplace_a) {
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[0]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[0]->region));
+    launcher.add_field(rid++, FID_DATA);
+  } else {
+    assert(batch_outputs[0]->part == batch_inputs[0]->part);
+    assert(batch_outputs[0]->region == batch_inputs[0]->region);
+  }
+  // launcher.add_region_requirement(
+  //   RegionRequirement(input_grad_lps[0], 0/*projection id*/,
+  //     WRITE_ONLY, EXCLUSIVE, inputs[0]->region_grad));
+  // launcher.add_field(3, FID_DATA);
+  // if (inputs[0]->region_grad != inputs[1]->region_grad) {
+  //  regions[4](I/O): input1_grad
+  //  launcher.add_region_requirement(
+  //    RegionRequirement(input_grad_lps[1], 0/*projection id*/,
+  //                      WRITE_ONLY, EXCLUSIVE, inputs[1]->region_grad));
+  //  launcher.add_field(4, FID_DATA);
+  //}
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
 void ElementBinary::init(FFModel const &ff) {
   // Check if we have the same oprands
   has_same_operands = (inputs[0]->region == inputs[1]->region);
@@ -432,7 +497,8 @@ void ElementBinary::inference(FFModel const &ff,
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
   set_argumentmap_for_forward(ff, argmap);
-  size_t machine_view_hash = mv ? mv->hash() : outputs[0]->machine_view.hash();
+  size_t machine_view_hash =
+      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
   IndexLauncher launcher(ELEMENTBINARY_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index 6450ab5173..b5dbfae0b1 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -330,6 +330,58 @@ Node Experts::deserialize(FFModel &ff,
   return ff.get_or_create_node<Experts>(inputs, params);
 }
 
+void Experts::init_inference(FFModel const &ff,
+                             std::vector<ParallelTensor> const &batch_inputs,
+                             std::vector<ParallelTensor> const &batch_outputs) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(EXPERTS_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(Experts)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         batch_outputs[0]->machine_view.hash());
+  // expert predictions
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  // expert assignment indices
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[1]->region));
+  launcher.add_field(1, FID_DATA);
+  // topk_gate_preds
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[2]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[2]->region));
+  launcher.add_field(2, FID_DATA);
+  for (int i = 0; i < num_experts; i++) {
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[i]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[i]->region));
+    launcher.add_field(i + 3, FID_DATA);
+  }
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
 void Experts::init(FFModel const &ff) {
   assert(check_output_input_weight_same_parallel_is());
   parallel_is = outputs[0]->parallel_is;
@@ -385,7 +437,8 @@ OpMeta *Experts::init_task(Task const *task,
                            Runtime *runtime) {
   Experts const *exp = (Experts *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
-  ExpertsMeta *m = new ExpertsMeta(handle, exp->num_experts);
+  ExpertsMeta *m = new ExpertsMeta(
+      handle, exp->num_experts, exp->experts_start_idx, exp->alpha);
   m->profiling = exp->profiling;
   return m;
 }
@@ -398,7 +451,7 @@ void Experts::forward(FFModel const &ff) {
   set_argumentmap_for_forward(ff, argmap);
   IndexLauncher launcher(EXPERTS_FWD_TASK_ID,
                          parallel_is,
-                         TaskArgument(this, sizeof(Experts)),
+                         TaskArgument(nullptr, 0),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
@@ -446,62 +499,58 @@ void Experts::inference(FFModel const &ff,
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
   set_argumentmap_for_forward(ff, argmap);
-  size_t machine_view_hash = mv ? mv->hash() : outputs[0]->machine_view.hash();
-  IndexLauncher launcher(EXPERTS_FWD_TASK_ID,
+  size_t machine_view_hash =
+      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  IndexLauncher launcher(EXPERTS_INF_TASK_ID,
                          parallel_is,
-                         TaskArgument(this, sizeof(Experts)),
+                         TaskArgument(nullptr, 0),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
                          machine_view_hash);
   // expert predictions
-  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
                                                     EXCLUSIVE,
-                                                    inputs[0]->region));
+                                                    batch_inputs[0]->region));
   launcher.add_field(0, FID_DATA);
   // expert assignment indices
-  launcher.add_region_requirement(RegionRequirement(inputs[1]->part,
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
                                                     EXCLUSIVE,
-                                                    inputs[1]->region));
+                                                    batch_inputs[1]->region));
   launcher.add_field(1, FID_DATA);
   // topk_gate_preds
-  launcher.add_region_requirement(RegionRequirement(inputs[2]->part,
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[2]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
                                                     EXCLUSIVE,
-                                                    inputs[2]->region));
+                                                    batch_inputs[2]->region));
   launcher.add_field(2, FID_DATA);
   for (int i = 0; i < num_experts; i++) {
     // expert output per token (only the chosen experts have non-zero
     // contributions)
-    launcher.add_region_requirement(RegionRequirement(outputs[i]->part,
-                                                      0 /*projection id*/,
-                                                      WRITE_ONLY,
-                                                      EXCLUSIVE,
-                                                      outputs[i]->region));
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[i]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[i]->region));
     launcher.add_field(i + 3, FID_DATA);
   }
   runtime->execute_index_space(ctx, launcher);
 }
 
-void Experts::forward_task(Task const *task,
-                           std::vector<PhysicalRegion> const &regions,
-                           Context ctx,
-                           Runtime *runtime) {
+void Experts::inference_task(Task const *task,
+                             std::vector<PhysicalRegion> const &regions,
+                             Context ctx,
+                             Runtime *runtime) {
   assert(regions.size() == task->regions.size());
   int num_experts = regions.size() - 3;
 
-  Experts const *exp = (Experts *)task->args;
-  assert(exp != nullptr);
-  assert(exp->num_experts == num_experts);
-  float alpha = exp->alpha;
-  int experts_start_idx = exp->experts_start_idx;
-
   ExpertsMeta const *m = *((ExpertsMeta **)task->local_args);
 
   // get input, indices, topk_gate_preds
@@ -546,9 +595,6 @@ void Experts::forward_task(Task const *task,
     }
   }
 
-  int expert_capacity =
-      ceil(alpha * (int)chosen_experts / num_experts * (int)batch_size);
-
   assert(batch_size <= MAX_BATCH_SIZE &&
          "batch size exceeds MAX_BATCH_SIZE defined in experts.h");
   assert(
@@ -575,14 +621,18 @@ void Experts::forward_task(Task const *task,
                                   indices_ptr,
                                   topk_gate_pred_ptr,
                                   outputs,
-                                  num_experts,
-                                  experts_start_idx,
-                                  expert_capacity,
                                   chosen_experts,
                                   batch_size,
                                   out_dim);
 }
 
+void Experts::forward_task(Task const *task,
+                           std::vector<PhysicalRegion> const &regions,
+                           Context ctx,
+                           Runtime *runtime) {
+  assert(false && "Experts is designed for inference only");
+}
+
 void Experts::backward(FFModel const &ff) {
   assert(false && "Experts is designed for inference only");
 }
diff --git a/src/ops/experts.cpp b/src/ops/experts.cpp
index a19c7a3a9a..92fb1e6e13 100644
--- a/src/ops/experts.cpp
+++ b/src/ops/experts.cpp
@@ -90,15 +90,15 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                      int const *indices,
                                      float const *topk_gate_preds,
                                      float **outputs,
-                                     int num_experts,
-                                     int experts_start_idx,
-                                     int expert_capacity,
                                      int chosen_experts,
                                      int batch_size,
                                      int out_dim) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
+  int expert_capacity =
+      ceil(m->alpha * chosen_experts / m->num_experts * batch_size);
+
   //   cudaEvent_t t_start, t_end;
   //   if (m->profiling) {
   //     cudaEventCreate(&t_start);
@@ -107,21 +107,21 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
   //   }
   hipMemcpy(m->dev_region_ptrs,
             outputs,
-            num_experts * sizeof(float *),
+            m->num_experts * sizeof(float *),
             hipMemcpyHostToDevice);
 
   hipLaunchKernelGGL(
       experts_forward_kernel,
-      GET_BLOCKS(batch_size * num_experts * out_dim),
-      min(CUDA_NUM_THREADS, (int)(batch_size * num_experts * out_dim)),
+      GET_BLOCKS(batch_size * m->num_experts * out_dim),
+      min(CUDA_NUM_THREADS, (int)(batch_size * m->num_experts * out_dim)),
       0,
       stream,
       input,
       indices,
       topk_gate_preds,
       m->dev_region_ptrs,
-      num_experts,
-      experts_start_idx,
+      m->num_experts,
+      m->experts_start_idx,
       chosen_experts,
       expert_capacity,
       batch_size,
@@ -138,7 +138,12 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
   // }
 }
 
-ExpertsMeta::ExpertsMeta(FFHandler handler, int num_experts) : OpMeta(handler) {
+ExpertsMeta::ExpertsMeta(FFHandler handler,
+                         int _num_experts,
+                         int _experts_start_idx,
+                         float _alpha)
+    : OpMeta(handler), num_experts(_num_experts),
+      experts_start_idx(_experts_start_idx), alpha(_alpha) {
   checkCUDA(hipMalloc(&dev_region_ptrs, num_experts * sizeof(float *)));
 }
 ExpertsMeta::~ExpertsMeta(void) {
diff --git a/src/ops/experts.cu b/src/ops/experts.cu
index b3a7f3d3ca..769b96e5ae 100644
--- a/src/ops/experts.cu
+++ b/src/ops/experts.cu
@@ -89,9 +89,6 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                      int const *indices,
                                      float const *topk_gate_preds,
                                      float **outputs,
-                                     int num_experts,
-                                     int experts_start_idx,
-                                     int expert_capacity,
                                      int chosen_experts,
                                      int batch_size,
                                      int out_dim) {
@@ -100,6 +97,9 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
   // checkCUDA(cublasSetStream(m->handle.blas, stream));
   // checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
 
+  int expert_capacity =
+      ceil(m->alpha * chosen_experts / m->num_experts * batch_size);
+
   cudaEvent_t t_start, t_end;
   if (m->profiling) {
     cudaEventCreate(&t_start);
@@ -110,20 +110,20 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
   // call forward_kernel
   cudaMemcpyAsync(m->dev_region_ptrs,
                   outputs,
-                  num_experts * sizeof(float *),
+                  m->num_experts * sizeof(float *),
                   cudaMemcpyHostToDevice,
                   stream);
 
-  experts_forward_kernel<<<GET_BLOCKS(batch_size * num_experts * out_dim),
+  experts_forward_kernel<<<GET_BLOCKS(batch_size * m->num_experts * out_dim),
                            min(CUDA_NUM_THREADS,
-                               (int)(batch_size * num_experts * out_dim)),
+                               (int)(batch_size * m->num_experts * out_dim)),
                            0,
                            stream>>>(input,
                                      indices,
                                      topk_gate_preds,
                                      m->dev_region_ptrs,
-                                     num_experts,
-                                     experts_start_idx,
+                                     m->num_experts,
+                                     m->experts_start_idx,
                                      chosen_experts,
                                      expert_capacity,
                                      batch_size,
@@ -140,7 +140,12 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
   }
 }
 
-ExpertsMeta::ExpertsMeta(FFHandler handler, int num_experts) : OpMeta(handler) {
+ExpertsMeta::ExpertsMeta(FFHandler handler,
+                         int _num_experts,
+                         int _experts_start_idx,
+                         float _alpha)
+    : OpMeta(handler), num_experts(_num_experts),
+      experts_start_idx(_experts_start_idx), alpha(_alpha) {
   checkCUDA(cudaMalloc(&dev_region_ptrs, num_experts * sizeof(float *)));
 }
 ExpertsMeta::~ExpertsMeta(void) {
diff --git a/src/ops/group_by.cc b/src/ops/group_by.cc
index e6dc00f690..f6e05945a6 100644
--- a/src/ops/group_by.cc
+++ b/src/ops/group_by.cc
@@ -164,6 +164,54 @@ Group_by::Group_by(FFModel &model,
     : Group_by(
           model, inputs.first, inputs.second, params.n, params.alpha, name) {}
 
+void Group_by::init_inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(GROUP_BY_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(Group_by)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         batch_outputs[0]->machine_view.hash());
+  // data
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  // assign
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[1]->region));
+  launcher.add_field(1, FID_DATA);
+
+  // output
+  for (int i = 0; i < n; i++) {
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[i]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[i]->region));
+    launcher.add_field(i + 2, FID_DATA);
+  }
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
 void Group_by::init(FFModel const &ff) {
   assert(check_output_input_weight_same_parallel_is());
   parallel_is = outputs[0]->parallel_is;
@@ -214,7 +262,7 @@ OpMeta *Group_by::init_task(Task const *task,
                             Runtime *runtime) {
   Group_by *gb = (Group_by *)task->args;
   FFHandler handle = *((FFHandler *)task->local_args);
-  GroupByMeta *m = new GroupByMeta(handle, gb->n);
+  GroupByMeta *m = new GroupByMeta(handle, gb->n, gb->alpha);
   m->profiling = gb->profiling;
   return m;
 }
@@ -226,7 +274,7 @@ void Group_by::forward(FFModel const &ff) {
   set_argumentmap_for_forward(ff, argmap);
   IndexLauncher launcher(GROUP_BY_FWD_TASK_ID,
                          parallel_is,
-                         TaskArgument(this, sizeof(Group_by)),
+                         TaskArgument(NULL, 0),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
@@ -268,10 +316,11 @@ void Group_by::inference(FFModel const &ff,
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
-  size_t machine_view_hash = mv ? mv->hash() : outputs[0]->machine_view.hash();
+  size_t machine_view_hash =
+      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
   IndexLauncher launcher(GROUP_BY_FWD_TASK_ID,
                          parallel_is,
-                         TaskArgument(this, sizeof(Group_by)),
+                         TaskArgument(NULL, 0),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
@@ -311,12 +360,7 @@ void Group_by::forward_task(Task const *task,
                             std::vector<PhysicalRegion> const &regions,
                             Context ctx,
                             Runtime *runtime) {
-  // Get n, alpha
-  Group_by const *gb = (Group_by *)task->args;
-  int n = gb->n;
-  float alpha = gb->alpha;
-
-  assert((int)regions.size() == n + 2);
+  int n = (int)regions.size() - 2;
   assert((int)task->regions.size() == n + 2);
 
   GroupByMeta const *m = *((GroupByMeta **)task->local_args);
@@ -343,7 +387,6 @@ void Group_by::forward_task(Task const *task,
   // Each entry in the "outputs" vector points to the Legion tensor that will
   // contain the tockens dispatched to the corresponding expert
   float *outputs[n];
-  int exp_output_rows = (int)ceil(alpha * k / n * batch_size);
   for (int i = 0; i < n; i++) {
     Domain out_domain = runtime->get_index_space_domain(
         ctx, task->regions[i + 2].region.get_index_space());
@@ -352,7 +395,6 @@ void Group_by::forward_task(Task const *task,
 
     coord_t output_rows = out_domain.hi()[1] - out_domain.lo()[1] + 1;
     coord_t output_cols = out_domain.hi()[0] - out_domain.lo()[0] + 1;
-    assert((int)output_rows == exp_output_rows);
     assert(output_cols == input_cols);
   }
 
@@ -362,7 +404,6 @@ void Group_by::forward_task(Task const *task,
                                    outputs,
                                    n,
                                    k,
-                                   alpha,
                                    batch_size,
                                    data_dim);
 }
@@ -374,7 +415,7 @@ void Group_by::backward(FFModel const &ff) {
   set_argumentmap_for_backward(ff, argmap);
   IndexLauncher launcher(GROUP_BY_BWD_TASK_ID,
                          parallel_is,
-                         TaskArgument(this, sizeof(Group_by)),
+                         TaskArgument(NULL, 0),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
@@ -414,13 +455,9 @@ void Group_by::backward_task(Task const *task,
                              std::vector<PhysicalRegion> const &regions,
                              Context ctx,
                              Runtime *runtime) {
-  // Get n, alpha
   GroupByMeta const *m = *((GroupByMeta **)task->local_args);
-  Group_by const *gb = (Group_by *)task->args;
-  int n = gb->n;
-  float alpha = gb->alpha;
 
-  assert((int)regions.size() == n + 2);
+  int n = (int)regions.size() - 2;
   assert((int)task->regions.size() == n + 2);
 
   // get input and assign regions
@@ -442,7 +479,6 @@ void Group_by::backward_task(Task const *task,
 
   // get output
   float *output_grads[n];
-  int exp_output_rows = (int)ceil(alpha * k / n * batch_size);
   for (int i = 0; i < n; i++) {
     Domain out_domain = runtime->get_index_space_domain(
         ctx, task->regions[i + 2].region.get_index_space());
@@ -451,7 +487,6 @@ void Group_by::backward_task(Task const *task,
 
     coord_t output_rows = out_domain.hi()[1] - out_domain.lo()[1] + 1;
     coord_t output_cols = out_domain.hi()[0] - out_domain.lo()[0] + 1;
-    assert((int)output_rows == exp_output_rows);
     assert(output_cols == input_cols);
   }
 
@@ -461,7 +496,6 @@ void Group_by::backward_task(Task const *task,
                                     output_grads,
                                     n,
                                     k,
-                                    alpha,
                                     batch_size,
                                     data_dim);
 }
@@ -512,7 +546,7 @@ bool Group_by::measure_operator_cost(Simulator *sim,
     }
   }
 
-  GroupByMeta *m = new GroupByMeta(sim->handler, n);
+  GroupByMeta *m = new GroupByMeta(sim->handler, n, alpha);
 
   // allocate
   sim->free_all();
@@ -546,15 +580,8 @@ bool Group_by::measure_operator_cost(Simulator *sim,
   int data_dim = in_domain.hi()[0] - in_domain.lo()[0] + 1;
 
   forward = [&] {
-    forward_kernel_wrapper(m,
-                           input_ptr,
-                           assign_ptr,
-                           output_ptrs,
-                           n,
-                           k,
-                           alpha,
-                           batch_size,
-                           data_dim);
+    forward_kernel_wrapper(
+        m, input_ptr, assign_ptr, output_ptrs, n, k, batch_size, data_dim);
   };
 
   inner_measure_operator_cost(sim, forward, backward, cost_metrics);
diff --git a/src/ops/group_by.cpp b/src/ops/group_by.cpp
index f45e9092a5..51bcd7d7b4 100644
--- a/src/ops/group_by.cpp
+++ b/src/ops/group_by.cpp
@@ -118,16 +118,17 @@ __global__ void
 }
 
 /*static*/
-void Group_by::forward_kernel_wrapper(
-    GroupByMeta const *m,
-    float const *input,
-    int const *exp_assign,
-    float **outputs,
-    int n,       // num experts
-    int k,       // chosen experts
-    float alpha, // factor additional memory assigned
-    int batch_size,
-    int data_dim) {
+void Group_by::forward_kernel_wrapper(GroupByMeta const *m,
+                                      float const *input,
+                                      int const *exp_assign,
+                                      float **outputs,
+                                      int n, // num experts
+                                      int k, // chosen experts
+                                      int batch_size,
+                                      int data_dim) {
+
+  float alpha = m->alpha;
+
   // TODO: why cublas/cudnn stream is needed here?
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
@@ -151,16 +152,17 @@ void Group_by::forward_kernel_wrapper(
                      data_dim);
 }
 
-void Group_by::backward_kernel_wrapper(
-    GroupByMeta const *m,
-    float *input_grad,
-    int const *exp_assign,
-    float **output_grads,
-    int n,       // num experts
-    int k,       // chosen experts
-    float alpha, // factor additional memory assigned
-    int batch_size,
-    int data_dim) {
+void Group_by::backward_kernel_wrapper(GroupByMeta const *m,
+                                       float *input_grad,
+                                       int const *exp_assign,
+                                       float **output_grads,
+                                       int n, // num experts
+                                       int k, // chosen experts
+                                       int batch_size,
+                                       int data_dim) {
+
+  float alpha = m->alpha;
+
   // TODO: why cublas/cudnn stream is needed here
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
@@ -186,7 +188,8 @@ void Group_by::backward_kernel_wrapper(
                      data_dim);
 }
 
-GroupByMeta::GroupByMeta(FFHandler handler, int n) : OpMeta(handler) {
+GroupByMeta::GroupByMeta(FFHandler handler, int n, float _alpha)
+    : OpMeta(handler), alpha(_alpha) {
   checkCUDA(hipMalloc(&dev_region_ptrs, n * sizeof(float *)));
 }
 GroupByMeta::~GroupByMeta(void) {
diff --git a/src/ops/group_by.cu b/src/ops/group_by.cu
index ee0b18337c..0ed09e20b3 100644
--- a/src/ops/group_by.cu
+++ b/src/ops/group_by.cu
@@ -106,17 +106,18 @@ __global__ void
 }
 
 /*static*/
-void Group_by::forward_kernel_wrapper(
-    GroupByMeta const *m,
-    float const *input,
-    int const *exp_assign,
-    float **outputs,
-    int n,       // num experts
-    int k,       // chosen experts
-    float alpha, // factor additional memory assigned
-    int batch_size,
-    int data_dim) {
+void Group_by::forward_kernel_wrapper(GroupByMeta const *m,
+                                      float const *input,
+                                      int const *exp_assign,
+                                      float **outputs,
+                                      int n, // num experts
+                                      int k, // chosen experts
+                                      int batch_size,
+                                      int data_dim) {
   // TODO: why cublas/cudnn stream is needed here?
+
+  float alpha = m->alpha;
+
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   cudaEvent_t t_start, t_end;
@@ -148,16 +149,17 @@ void Group_by::forward_kernel_wrapper(
   }
 }
 
-void Group_by::backward_kernel_wrapper(
-    GroupByMeta const *m,
-    float *input_grad,
-    int const *exp_assign,
-    float **output_grads,
-    int n,       // num experts
-    int k,       // chosen experts
-    float alpha, // factor additional memory assigned
-    int batch_size,
-    int data_dim) {
+void Group_by::backward_kernel_wrapper(GroupByMeta const *m,
+                                       float *input_grad,
+                                       int const *exp_assign,
+                                       float **output_grads,
+                                       int n, // num experts
+                                       int k, // chosen experts
+                                       int batch_size,
+                                       int data_dim) {
+
+  float alpha = m->alpha;
+
   // TODO: why cublas/cudnn stream is needed here
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
@@ -196,7 +198,8 @@ void Group_by::backward_kernel_wrapper(
   }
 }
 
-GroupByMeta::GroupByMeta(FFHandler handler, int n) : OpMeta(handler) {
+GroupByMeta::GroupByMeta(FFHandler handler, int n, float _alpha)
+    : OpMeta(handler), alpha(_alpha) {
   checkCUDA(cudaMalloc(&dev_region_ptrs, n * sizeof(float *)));
 }
 GroupByMeta::~GroupByMeta(void) {
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index bec6f7d651..11b1185b1c 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -194,6 +194,41 @@ LayerNorm::LayerNorm(FFModel &model,
   return;
 }
 
+void LayerNorm::init_inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(LAYERNORM_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(LayerNorm)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         batch_outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
 void LayerNorm::init(FFModel const &ff) {
   assert(check_output_input_weight_same_parallel_is());
   parallel_is = outputs[0]->parallel_is;
@@ -286,7 +321,8 @@ void LayerNorm::inference(FFModel const &ff,
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
   set_argumentmap_for_forward(ff, argmap);
-  size_t machine_view_hash = mv ? mv->hash() : outputs[0]->machine_view.hash();
+  size_t machine_view_hash =
+      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
   IndexLauncher launcher(LAYERNORM_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index 0e09e20e44..fe9a3925a7 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -254,6 +254,56 @@ void Linear::init(FFModel const &ff) {
   set_opmeta_from_futuremap(ff, fm);
 }
 
+void Linear::init_inference(FFModel const &ff,
+                            std::vector<ParallelTensor> const &batch_inputs,
+                            std::vector<ParallelTensor> const &batch_outputs) {
+  assert(check_output_input_weight_same_parallel_is());
+  // assert(check_output_input_weight_same_machine_view());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(LINEAR_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(Linear)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         batch_outputs[0]->machine_view.hash());
+  // launcher.add_region_requirement(
+  //     RegionRequirement(input_lps[0], 0/*projection id*/,
+  //                       READ_ONLY, EXCLUSIVE, inputs[0]->region));
+  // launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(1, FID_DATA);
+  // launcher.add_region_requirement(
+  //     RegionRequirement(weights[1]->part, 0/*projection id*/,
+  //                       READ_ONLY, EXCLUSIVE, weights[1]->region));
+  // launcher.add_field(3, FID_DATA);
+  if (ff.config.computationMode == COMP_MODE_TRAINING) {
+    // Add inputs[0].region_grad to avoid Legion warning
+    // launcher.add_region_requirement(
+    //    RegionRequirement(input_grad_lps[0], 0/*projection id*/,
+    //        WRITE_ONLY, EXCLUSIVE, inputs[0].region_grad));
+    // launcher.add_field(2, FID_DATA);
+  }
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
 /*
   regions[0](O): output
   regions[1](I): kernel
@@ -375,7 +425,8 @@ void Linear::inference(FFModel const &ff,
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
   set_argumentmap_for_forward(ff, argmap);
-  size_t machine_view_hash = mv ? mv->hash() : outputs[0]->machine_view.hash();
+  size_t machine_view_hash =
+      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
   IndexLauncher launcher(LINEAR_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(nullptr, 0),
diff --git a/src/ops/noop.cc b/src/ops/noop.cc
index 94fff30553..91e890ed9f 100644
--- a/src/ops/noop.cc
+++ b/src/ops/noop.cc
@@ -24,6 +24,7 @@ using Legion::coord_t;
 using Legion::Domain;
 using Legion::FutureMap;
 using Legion::IndexLauncher;
+using Legion::IndexSpace;
 using Legion::InlineLauncher;
 using Legion::LogicalPartition;
 using Legion::LogicalRegion;
@@ -94,8 +95,90 @@ OpMeta *NoOp::init_task(Task const *task,
   return m;
 }
 
+void NoOp::init_inference(FFModel const &ff,
+                          std::vector<ParallelTensor> const &batch_inputs,
+                          std::vector<ParallelTensor> const &batch_outputs) {
+  parallel_is = batch_outputs[0]->parallel_is;
+  assert(parallel_is != IndexSpace::NO_SPACE);
+  if (op_type == OP_INPUT && batch_outputs[0]->initializer != nullptr) {
+    ConstantInitializer *initializer =
+        (ConstantInitializer *)batch_outputs[0]->initializer;
+    Runtime *runtime = ff.config.lg_hlr;
+    Context ctx = ff.config.lg_ctx;
+    ArgumentMap argmap;
+    IndexLauncher launcher(
+        CONSTANT_INIT_TASK_ID,
+        parallel_is,
+        TaskArgument(initializer, sizeof(ConstantInitializer)),
+        argmap,
+        Predicate::TRUE_PRED,
+        false /*must*/,
+        0 /*mapper_id*/,
+        batch_outputs[0]->machine_view.hash());
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[0]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[0]->region));
+    launcher.add_field(0, FID_DATA);
+    runtime->execute_index_space(ctx, launcher);
+  } else if (op_type == OP_INPUT) {
+    // For OP_INPUT, initialize tensor to zero
+    assert(batch_outputs[0]->region != LogicalRegion::NO_REGION);
+    if (batch_outputs[0]->part == LogicalPartition::NO_PART) {
+      return;
+    }
+    ConstantInitializer *initializer = NULL;
+    if (batch_outputs[0]->data_type == DT_FLOAT) {
+      initializer = new ConstantInitializer(0.0f);
+    } else if (batch_outputs[0]->data_type == DT_INT64) {
+      initializer = new ConstantInitializer((int64_t)0);
+    } else if (batch_outputs[0]->data_type == DT_INT32) {
+      initializer = new ConstantInitializer((int)0);
+    }
+    Runtime *runtime = ff.config.lg_hlr;
+    Context ctx = ff.config.lg_ctx;
+    ArgumentMap argmap;
+    IndexLauncher launcher(
+        CONSTANT_INIT_TASK_ID,
+        parallel_is,
+        TaskArgument(initializer, sizeof(ConstantInitializer)),
+        argmap,
+        Predicate::TRUE_PRED,
+        false /*must*/,
+        0 /*mapper_id*/,
+        batch_outputs[0]->machine_view.hash());
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[0]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[0]->region));
+    launcher.add_field(0, FID_DATA);
+    runtime->execute_index_space(ctx, launcher);
+  } else if (op_type == OP_WEIGHT) {
+    ArgumentMap argmap;
+    Context ctx = ff.config.lg_ctx;
+    Runtime *runtime = ff.config.lg_hlr;
+    set_argumentmap_for_init(ff, argmap);
+    IndexLauncher launcher(NOOP_INIT_TASK_ID,
+                           parallel_is,
+                           TaskArgument(NULL, 0),
+                           argmap,
+                           Predicate::TRUE_PRED,
+                           false /*must*/,
+                           0 /*mapper_id*/,
+                           batch_outputs[0]->machine_view.hash());
+    FutureMap fm = runtime->execute_index_space(ctx, launcher);
+    fm.wait_all_results();
+    set_opmeta_from_futuremap(ff, fm);
+  }
+}
+
 void NoOp::init(FFModel const &ff) {
   parallel_is = outputs[0]->parallel_is;
+  assert(parallel_is != IndexSpace::NO_SPACE);
   if (op_type == OP_INPUT && outputs[0]->initializer != nullptr) {
     ConstantInitializer *initializer =
         (ConstantInitializer *)outputs[0]->initializer;
@@ -172,6 +255,11 @@ void NoOp::init(FFModel const &ff) {
 
 void NoOp::forward(FFModel const &ff) {}
 
+void NoOp::inference(FFModel const &ff,
+                     std::vector<ParallelTensor> const &batch_inputs,
+                     std::vector<ParallelTensor> const &batch_outputs,
+                     MachineView const *mv) {}
+
 void NoOp::backward(FFModel const &ff) {}
 
 bool NoOp::measure_operator_cost(Simulator *sim,
diff --git a/src/ops/softmax.cc b/src/ops/softmax.cc
index 029b20afd1..b07ae0ad68 100644
--- a/src/ops/softmax.cc
+++ b/src/ops/softmax.cc
@@ -115,6 +115,40 @@ Softmax::Softmax(FFModel &model,
                  char const *name)
     : Softmax(model, input, params.dim, name) {}
 
+void Softmax::init_inference(FFModel const &ff,
+                             std::vector<ParallelTensor> const &batch_inputs,
+                             std::vector<ParallelTensor> const &batch_outputs) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(SOFTMAX_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(Softmax)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         batch_outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_DISCARD,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
 void Softmax::init(FFModel const &ff) {
   assert(check_output_input_weight_same_parallel_is());
   parallel_is = outputs[0]->parallel_is;
@@ -188,6 +222,39 @@ OpMeta *Softmax::init_task(Task const *task,
   return m;
 }
 
+void Softmax::inference(FFModel const &ff,
+                        std::vector<ParallelTensor> const &batch_inputs,
+                        std::vector<ParallelTensor> const &batch_outputs,
+                        MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_forward(ff, argmap);
+  size_t machine_view_hash =
+      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  IndexLauncher launcher(SOFTMAX_FWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  runtime->execute_index_space(ctx, launcher);
+}
+
 void Softmax::forward(FFModel const &ff) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
diff --git a/src/ops/topk.cc b/src/ops/topk.cc
index ec6da77a31..b260902cd7 100644
--- a/src/ops/topk.cc
+++ b/src/ops/topk.cc
@@ -136,6 +136,46 @@ TopK::TopK(FFModel &model,
            char const *name)
     : TopK(model, input, params.k, params.sorted, name) {}
 
+void TopK::init_inference(FFModel const &ff,
+                          std::vector<ParallelTensor> const &batch_inputs,
+                          std::vector<ParallelTensor> const &batch_outputs) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(TOPK_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(TopK)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         batch_outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[1]->region));
+  launcher.add_field(2, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
 void TopK::init(FFModel const &ff) {
   assert(check_output_input_weight_same_parallel_is());
   parallel_is = outputs[0]->parallel_is;
@@ -228,7 +268,8 @@ void TopK::inference(FFModel const &ff,
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
   set_argumentmap_for_forward(ff, argmap);
-  size_t machine_view_hash = mv ? mv->hash() : outputs[0]->machine_view.hash();
+  size_t machine_view_hash =
+      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
   IndexLauncher launcher(TOPK_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
diff --git a/src/parallel_ops/partition.cc b/src/parallel_ops/partition.cc
index 3ff02db766..6f808a3978 100644
--- a/src/parallel_ops/partition.cc
+++ b/src/parallel_ops/partition.cc
@@ -101,6 +101,43 @@ OpMeta *Repartition::init_task(Task const *task,
   return nullptr;
 }
 
+void Repartition::init_inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs) {
+  ArgumentMap argmap;
+  parallel_is = batch_outputs[0]->parallel_is;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  IndexLauncher launcher(REPARTITION_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(nullptr, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         batch_outputs[0]->machine_view.hash());
+  assert(inference_input_lps.find(batch_inputs[0]) !=
+         inference_input_lps.end());
+  launcher.add_region_requirement(
+      RegionRequirement(inference_input_lps[batch_inputs[0]],
+                        0 /*projection id*/,
+                        READ_ONLY,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+}
+
 void Repartition::init(FFModel const &ff) {
   ArgumentMap argmap;
   parallel_is = outputs[0]->parallel_is;
@@ -130,6 +167,7 @@ void Repartition::init(FFModel const &ff) {
 }
 
 void Repartition::create_input_partition(FFModel &ff) {
+  assert(ff.config.computationMode == COMP_MODE_TRAINING);
   assert(outputs[0]->part != LogicalPartition::NO_PART);
   assert(inputs[0]->part != LogicalPartition::NO_PART);
   ff.create_disjoint_partition(outputs[0]->num_dims,
@@ -144,6 +182,57 @@ void Repartition::create_input_partition(FFModel &ff) {
                                output_grad_lp);
 }
 
+void Repartition::create_input_partition_inference(
+    FFModel &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs) {
+  assert(ff.config.computationMode == COMP_MODE_INFERENCE);
+  assert(batch_outputs[0]->part != LogicalPartition::NO_PART);
+  assert(batch_inputs[0]->part != LogicalPartition::NO_PART);
+  ff.create_disjoint_partition(batch_outputs[0]->num_dims,
+                               batch_outputs[0]->dims,
+                               batch_outputs[0]->parallel_is,
+                               batch_inputs[0]->region,
+                               inference_input_lps[batch_inputs[0]]);
+}
+
+void Repartition::inference(FFModel const &ff,
+                            std::vector<ParallelTensor> const &batch_inputs,
+                            std::vector<ParallelTensor> const &batch_outputs,
+                            MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  assert(batch_inputs[0]->data_type == batch_outputs[0]->data_type);
+  DataType data_type = batch_inputs[0]->data_type;
+  size_t machine_view_hash =
+      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  IndexLauncher launcher(REPARTITION_FWD_TASK_ID,
+                         batch_outputs[0]->parallel_is,
+                         TaskArgument(&data_type, sizeof(DataType)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(
+      RegionRequirement(inference_input_lps[batch_inputs[0]],
+                        0 /*projection id*/,
+                        READ_ONLY,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  runtime->execute_index_space(ctx, launcher);
+}
+
 void Repartition::forward(FFModel const &ff) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index be572848be..8f926da316 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/inference.h"
+#include "flexflow/parallel_ops/parallel_op.h"
 
 namespace FlexFlow {
 
@@ -57,17 +58,60 @@ void InferenceManager::compile_model_and_allocate_buffer(void) {
   }
 }
 
+void InferenceManager::init_operators_inference() {
+  for (int index = 0; index < max_num_inflight_batches; index++) {
+    for (size_t o = 0; o < model->operators.size(); o++) {
+      Op *op = model->operators[o];
+      if (op->op_type == OP_WEIGHT) {
+        continue;
+      }
+      std::vector<ParallelTensor> inputs(op->numInputs);
+      std::vector<ParallelTensor> outputs(op->numOutputs);
+      for (int i = 0; i < op->numInputs; i++) {
+        assert(op->inputs[i] != nullptr);
+        assert(op->inputs[i]->parallel_is != IndexSpace::NO_SPACE);
+        assert(tensor_buffer[op->inputs[i]].size() > index);
+        inputs[i] = tensor_buffer[op->inputs[i]][index];
+        assert(inputs[i]->parallel_is != IndexSpace::NO_SPACE);
+      }
+      for (int i = 0; i < op->numOutputs; i++) {
+        assert(op->outputs[i] != nullptr);
+        assert(op->outputs[i]->parallel_is != IndexSpace::NO_SPACE);
+        assert(tensor_buffer[op->outputs[i]].size() > index);
+        outputs[i] = tensor_buffer[op->outputs[i]][index];
+        assert(outputs[i]->parallel_is != IndexSpace::NO_SPACE);
+      }
+      if (op->is_parallel_op()) {
+        ((ParallelOp *)op)
+            ->create_input_partition_inference(*model, inputs, outputs);
+      }
+      op->init_inference(*model, inputs, outputs);
+    }
+  }
+}
+
 void InferenceManager::inference(int index) {
   assert(index < max_num_inflight_batches);
   for (size_t o = 0; o < model->operators.size(); o++) {
     Op *op = model->operators[o];
+    if (op->op_type == OP_WEIGHT) {
+      continue;
+    }
     std::vector<ParallelTensor> inputs(op->numInputs);
     std::vector<ParallelTensor> outputs(op->numOutputs);
     for (int i = 0; i < op->numInputs; i++) {
+      assert(op->inputs[i] != nullptr);
+      assert(op->inputs[i]->parallel_is != IndexSpace::NO_SPACE);
+      assert(tensor_buffer[op->inputs[i]].size() > index);
       inputs[i] = tensor_buffer[op->inputs[i]][index];
+      assert(inputs[i]->parallel_is != IndexSpace::NO_SPACE);
     }
     for (int i = 0; i < op->numOutputs; i++) {
+      assert(op->outputs[i] != nullptr);
+      assert(op->outputs[i]->parallel_is != IndexSpace::NO_SPACE);
+      assert(tensor_buffer[op->outputs[i]].size() > index);
       outputs[i] = tensor_buffer[op->outputs[i]][index];
+      assert(outputs[i]->parallel_is != IndexSpace::NO_SPACE);
     }
     op->inference(*model, inputs, outputs);
   }
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index e0fc25d1ad..6419a2d61f 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -2925,8 +2925,10 @@ void FFModel::compile(LossType loss_type,
     //   // Output tensor
     //   map_tensor(op->outputs[i], op);
     // }
-    if (op->is_parallel_op()) {
-      ((ParallelOp *)op)->create_input_partition(*this);
+    if (config.computationMode == COMP_MODE_TRAINING) {
+      if (op->is_parallel_op()) {
+        ((ParallelOp *)op)->create_input_partition(*this);
+      }
     }
     // op->map_output_tensors(*this);
   }
@@ -3114,9 +3116,11 @@ void FFModel::compile(LossType loss_type,
       assert(false && "Unsupported dim");
     }
   }
-  // init optimizer
-  assert(optimizer != NULL);
-  optimizer->init();
+  if (config.computationMode == COMP_MODE_TRAINING) {
+    // init optimizer
+    assert(optimizer != NULL);
+    optimizer->init();
+  }
 
 #ifdef FF_USE_NCCL
   if (config.computationMode == COMP_MODE_TRAINING) {
@@ -3783,6 +3787,13 @@ void register_flexflow_internal_tasks() {
     Runtime::preregister_task_variant<Experts::backward_task>(
         registrar, "Experts Backward Task");
   }
+  {
+    TaskVariantRegistrar registrar(EXPERTS_INF_TASK_ID, "Experts Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<Experts::inference_task>(
+        registrar, "Experts Inference Task");
+  }
   // Cast
   {
     TaskVariantRegistrar registrar(CAST_INIT_TASK_ID, "Cast Init");

From cf64baa327103504e9d2c30c5b90e76bc9c403c6 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 5 Feb 2023 20:45:17 +0000
Subject: [PATCH 056/344] fix LayerNorm dimensions error

---
 src/ops/layer_norm.cc | 26 +++++++++++++++++++++-----
 1 file changed, 21 insertions(+), 5 deletions(-)

diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index 11b1185b1c..8d8a8c5980 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -177,12 +177,28 @@ LayerNorm::LayerNorm(FFModel &model,
       _input->num_dims, _input->dims, _input->data_type, this);
   assert(check_output_input_weight_parallel_dims(allocate_weights));
   ParallelDim output_dims[MAX_TENSOR_DIM];
-  int M = 1;
-  for (int i = 0; i < axes.size(); i++) {
-    M *= inputs[0]->dims[inputs[0]->num_dims - 1 - axes[i]].size;
+  int degree_product = 1;
+  effective_num_elements = 1;
+  effective_batch_size = 1;
+  for (int i = 0; i < inputs[0]->num_dims; i++) {
+    degree_product *= inputs[0]->dims[i].degree;
+    bool found = false;
+    for (int j = 0; j < axes.size(); j++) {
+      if (i == inputs[0]->num_dims - 1 - axes[j]) {
+        found = true;
+        break;
+      }
+    }
+    if (found) {
+      effective_num_elements *=
+          inputs[0]->dims[i].size / inputs[0]->dims[i].degree;
+    } else {
+      effective_batch_size *=
+          inputs[0]->dims[i].size / inputs[0]->dims[i].degree;
+    }
   }
-  effective_num_elements = M;
-  effective_batch_size = inputs[0]->get_volume() / M;
+  assert(effective_num_elements * effective_batch_size * degree_product ==
+         inputs[0]->get_volume());
   if (numWeights > 0 && allocate_weights) {
     int kernel_dims = 2;
     assert(false);

From 373da006cf99cdb8e7e36beb3cd1d551c11a0fc6 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 5 Feb 2023 16:23:44 -0500
Subject: [PATCH 057/344] Revert "fix LayerNorm dimensions error". The issue
 will be fixed when we update the mapping to prevent FlexFlow from
 partitioning the dimensions within each block of requests

This reverts commit cf64baa327103504e9d2c30c5b90e76bc9c403c6.
---
 src/ops/layer_norm.cc | 26 +++++---------------------
 1 file changed, 5 insertions(+), 21 deletions(-)

diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index 8d8a8c5980..11b1185b1c 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -177,28 +177,12 @@ LayerNorm::LayerNorm(FFModel &model,
       _input->num_dims, _input->dims, _input->data_type, this);
   assert(check_output_input_weight_parallel_dims(allocate_weights));
   ParallelDim output_dims[MAX_TENSOR_DIM];
-  int degree_product = 1;
-  effective_num_elements = 1;
-  effective_batch_size = 1;
-  for (int i = 0; i < inputs[0]->num_dims; i++) {
-    degree_product *= inputs[0]->dims[i].degree;
-    bool found = false;
-    for (int j = 0; j < axes.size(); j++) {
-      if (i == inputs[0]->num_dims - 1 - axes[j]) {
-        found = true;
-        break;
-      }
-    }
-    if (found) {
-      effective_num_elements *=
-          inputs[0]->dims[i].size / inputs[0]->dims[i].degree;
-    } else {
-      effective_batch_size *=
-          inputs[0]->dims[i].size / inputs[0]->dims[i].degree;
-    }
+  int M = 1;
+  for (int i = 0; i < axes.size(); i++) {
+    M *= inputs[0]->dims[inputs[0]->num_dims - 1 - axes[i]].size;
   }
-  assert(effective_num_elements * effective_batch_size * degree_product ==
-         inputs[0]->get_volume());
+  effective_num_elements = M;
+  effective_batch_size = inputs[0]->get_volume() / M;
   if (numWeights > 0 && allocate_weights) {
     int kernel_dims = 2;
     assert(false);

From 2ed8913887d872216b33b6e44fdfddcc4df7de81 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sat, 11 Feb 2023 00:14:26 -0500
Subject: [PATCH 058/344] [Inference][Experts] - New experts operator (except
 for the kernel) (#627)

* removed obsolete code

* add weights

* fix

* fix

* fix

* bug fix

* added functions to hopefully fix parallel_is

* fixed bugs
---
 include/flexflow/ops/experts.h        |  24 +-
 include/flexflow/ops/experts_params.h |  55 ++-
 src/ops/experts.cc                    | 535 ++++++++++++++++++++++----
 src/ops/experts.cpp                   | 124 +-----
 src/ops/experts.cu                    | 125 ++----
 src/runtime/graph.cc                  |   2 +-
 src/runtime/model.cc                  |   1 +
 src/runtime/substitution.cc           |   2 +-
 8 files changed, 579 insertions(+), 289 deletions(-)

diff --git a/include/flexflow/ops/experts.h b/include/flexflow/ops/experts.h
index 190e76d865..57d6153d0e 100644
--- a/include/flexflow/ops/experts.h
+++ b/include/flexflow/ops/experts.h
@@ -10,12 +10,16 @@ class ExpertsMeta : public OpMeta {
   ExpertsMeta(FFHandler handler,
               int _num_experts,
               int _experts_start_idx,
-              float _alpha);
+              float _alpha,
+              bool _use_bias,
+              ActiMode _activation);
   ~ExpertsMeta(void);
+  float const **dev_weights;
   int num_experts;
   int experts_start_idx;
   float alpha;
-  float **dev_region_ptrs;
+  bool use_bias;
+  ActiMode activation;
 };
 
 // definitions for the CUDA kernel
@@ -29,8 +33,10 @@ class Experts : public Op {
   Experts(FFModel &model,
           Params const &params,
           Input const &inputs,
+          bool allocate_weights = false,
           char const *name = nullptr);
   Experts(FFModel &model,
+          LayerID const &layer_guid,
           ParallelTensor const *inputs,
           int _num_experts,
           int _experts_start_idx,
@@ -38,6 +44,9 @@ class Experts : public Op {
           float _alpha,
           int _experts_num_layers,
           int _experts_internal_dim_size,
+          bool _use_bias,
+          ActiMode _activation,
+          bool allocate_weights,
           char const *name = nullptr);
   static Op *
       create_operator_from_layer(FFModel &model,
@@ -70,10 +79,11 @@ class Experts : public Op {
                            Legion::Context ctx,
                            Legion::Runtime *runtime);
   static void forward_kernel_wrapper(ExpertsMeta const *m,
-                                     float const *acc_input_ptr,
-                                     int const *acc_indices_ptr,
-                                     float const *acc_topk_gate_preds_ptr,
-                                     float **outputs,
+                                     float const *input,
+                                     int const *indices,
+                                     float const *topk_gate_preds,
+                                     float *output,
+                                     float const **weights,
                                      int chosen_experts,
                                      int batch_size,
                                      int out_dim);
@@ -96,6 +106,8 @@ class Experts : public Op {
   float alpha;
   int experts_num_layers;
   int experts_internal_dim_size;
+  bool use_bias;
+  ActiMode activation;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/ops/experts_params.h b/include/flexflow/ops/experts_params.h
index 20a65a06f8..d5b4676f0e 100644
--- a/include/flexflow/ops/experts_params.h
+++ b/include/flexflow/ops/experts_params.h
@@ -1,17 +1,70 @@
 #pragma once
 
+#include "flexflow/operator.h"
 #include "flexflow/parallel_tensor.h"
 
 namespace FlexFlow {
 
 struct ExpertsParams {
-  bool is_valid(std::vector<ParallelTensorShape> const &) const;
+  LayerID layer_guid;
   int num_experts;
   int experts_start_idx;
   int experts_output_dim_size;
   float alpha;
   int experts_num_layers;
   int experts_internal_dim_size;
+  bool use_bias;
+  ActiMode activation;
+
+  bool is_valid(std::vector<ParallelTensorShape> const &) const;
+  void solve_dims(const ParallelTensor input,
+                  ParallelDim output_dims[MAX_TENSOR_DIM],
+                  int *output_ndims,
+                  ParallelDim kernel_dims[MAX_TENSOR_DIM],
+                  int *kernel_ndims,
+                  ParallelDim bias_dims[MAX_TENSOR_DIM],
+                  int *bias_ndims) const;
+  void solve_dims(ParallelTensorShape const &input_shape,
+                  ParallelTensorShape &output_shape,
+                  ParallelTensorShape &kernel_shape,
+                  ParallelTensorShape &bias_shape) const;
+  void solve_dims(ParallelTensorShape const &input_shape,
+                  ParallelDim output_dims[MAX_TENSOR_DIM],
+                  int *output_ndims,
+                  ParallelDim kernel_dims[MAX_TENSOR_DIM],
+                  int *kernel_ndims,
+                  ParallelDim bias_dims[MAX_TENSOR_DIM],
+                  int *bias_ndims) const;
+  void construct_mappings(std::vector<ParallelDimMappingRecord> &,
+                          ParallelTensorShape const &) const;
+
+  enum NamedDimensions {
+    INPUT_CHANNEL,
+    INPUT_SAMPLE,
+    INPUT_REPLICA,
+    OUTPUT_CHANNEL,
+    OUTPUT_SAMPLE,
+    OUTPUT_REPLICA,
+    KERNEL_CHANNEL_IN,
+    KERNEL_CHANNEL_OUT,
+    BIAS_CHANNEL_OUT
+  };
+
+  std::unordered_map<NamedDimensions, int>
+      get_dimension_names(ParallelTensorShape const &input_name) const;
+
+private:
+  void mark_replica_dims(ParallelTensorShape const &input_shape,
+                         ParallelDim output_dims[MAX_TENSOR_DIM],
+                         ParallelDim kernel_dims[MAX_TENSOR_DIM],
+                         ParallelDim bias_dims[MAX_TENSOR_DIM]) const;
+  void calculate_nonreplica_dim_sizes(ParallelTensorShape const &input_shape,
+                                      ParallelDim output_dims[MAX_TENSOR_DIM],
+                                      int *output_ndims,
+                                      ParallelDim kernel_dims[MAX_TENSOR_DIM],
+                                      int *kernel_ndims,
+                                      ParallelDim bias_dims[MAX_TENSOR_DIM],
+                                      int *bias_ndims) const;
 };
 
 bool operator==(ExpertsParams const &, ExpertsParams const &);
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index b5dbfae0b1..9c60a5e212 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -35,6 +35,9 @@ using Legion::TaskArgument;
 using Legion::TaskLauncher;
 using PCG::Node;
 
+static constexpr int KERNEL_IDX = 0;
+static constexpr int BIAS_IDX = 1;
+
 // For now, we use one input and one output per expert
 Tensor FFModel::experts(Tensor const *inputs,
                         int num_experts,
@@ -63,31 +66,51 @@ Tensor FFModel::experts(Tensor const *inputs,
   assert(experts_num_layers == 1 && "Multi-layer experts not implemented yet.");
   assert(experts_num_layers == 1 || experts_internal_dim_size > 0);
 
-  Tensor fused_experts = this->dense(
-      inputs[0], num_experts * experts_output_dim_size, AC_MODE_RELU);
-  fused_experts = this->softmax(fused_experts);
-
-  Tensor const layer_inputs[3] = {fused_experts, inputs[1], inputs[2]};
+  // parameters for the FFN implementing the experts. We can make these
+  // FFModel::experts(...) function parameters if needed.
+  bool use_bias = false;
+  ActiMode activation = AC_MODE_RELU;
 
   Layer *e = new Layer(this,
                        OP_EXPERTS,
                        DT_FLOAT,
                        name,
                        3 /*inputs*/,
-                       0 /*weights*/,
-                       num_experts /*outputs*/,
-                       layer_inputs);
-
+                       num_experts * (1 + use_bias) /*weights*/,
+                       1 /*outputs*/,
+                       inputs);
   {
     int dims[MAX_TENSOR_DIM];
     for (int i = 1; i < num_dims; i++) {
       dims[i] = inputs[0]->dims[i];
     }
     dims[0] = experts_output_dim_size;
-    for (int i = 0; i < num_experts; i++) {
-      e->outputs[i] = create_tensor_legion_ordering(
-          num_dims, dims, DT_FLOAT, e, 0, true /*create_grad*/);
-      assert(e->outputs[i] != nullptr);
+    e->outputs[0] = create_tensor_legion_ordering(
+        num_dims, dims, DT_FLOAT, e, 0, true /*create_grad*/);
+    assert(e->outputs[0] != nullptr);
+  }
+  for (int i = 0; i < num_experts; i++) {
+    {
+      int dims[2] = {inputs[0]->dims[0], experts_output_dim_size};
+      e->weights[i * (1 + use_bias)] =
+          create_weight_legion_ordering(2,
+                                        dims,
+                                        DT_FLOAT,
+                                        e,
+                                        true /*create_grad*/,
+                                        nullptr,
+                                        CHOSEN_SYNC_TYPE);
+    }
+    if (use_bias) {
+      int dims[1] = {experts_output_dim_size};
+      e->weights[i * (1 + use_bias) + use_bias] =
+          create_weight_legion_ordering(1,
+                                        dims,
+                                        DT_FLOAT,
+                                        e,
+                                        true /*create_grad*/,
+                                        nullptr,
+                                        CHOSEN_SYNC_TYPE);
     }
   }
 
@@ -97,13 +120,11 @@ Tensor FFModel::experts(Tensor const *inputs,
   e->add_float_property("alpha", alpha);
   e->add_int_property("experts_num_layers", experts_num_layers);
   e->add_int_property("experts_internal_dim_size", experts_internal_dim_size);
+  e->add_int_property("use_bias", use_bias);
+  e->add_int_property("activation", activation);
   layers.push_back(e);
 
-  Tensor ret = e->outputs[0];
-  for (int i = 1; i < num_experts; i++) {
-    this->add(ret, e->outputs[i], /*inplace_a*/ true);
-  }
-  return ret;
+  return e->outputs[0];
 }
 
 Op *Experts::create_operator_from_layer(
@@ -124,7 +145,12 @@ Op *Experts::create_operator_from_layer(
   int experts_num_layers = value;
   layer->get_int_property("experts_internal_dim_size", value);
   int experts_internal_dim_size = value;
+  layer->get_int_property("use_bias", value);
+  bool use_bias = (bool)value;
+  layer->get_int_property("activation", value);
+  ActiMode activation = (ActiMode)value;
   return new Experts(model,
+                     layer->layer_guid,
                      inputs.data(),
                      num_experts,
                      experts_start_idx,
@@ -132,17 +158,23 @@ Op *Experts::create_operator_from_layer(
                      alpha,
                      experts_num_layers,
                      experts_internal_dim_size,
+                     use_bias,
+                     activation,
+                     false /*allocate_weights*/,
                      layer->name);
 }
 
 ExpertsParams Experts::get_params() const {
   ExpertsParams params;
+  params.layer_guid = this->layer_guid;
   params.num_experts = num_experts;
   params.experts_start_idx = experts_start_idx;
   params.experts_output_dim_size = experts_output_dim_size;
   params.alpha = alpha;
   params.experts_num_layers = experts_num_layers;
   params.experts_internal_dim_size = experts_internal_dim_size;
+  params.use_bias = use_bias;
+  params.activation = activation;
   return params;
 }
 
@@ -182,10 +214,6 @@ bool ExpertsParams::is_valid(
     printf("Data type of the third input to the Experts layer is wrong!\n");
     return false;
   }
-  if (inputs[0].dims[0].size != num_experts * experts_output_dim_size) {
-    printf("Dimension 0 of input tensor 1 to the Experts layer is wrong.\n");
-    return false;
-  }
   if (inputs[1].dims[0] != inputs[2].dims[0]) {
     printf(
         "Dimension mismatch between indices and topk_gate_preds tensors passed "
@@ -204,20 +232,23 @@ bool ExpertsParams::is_valid(
 }
 
 bool operator==(ExpertsParams const &lhs, ExpertsParams const &rhs) {
-  return lhs.num_experts == rhs.num_experts &&
+  return lhs.layer_guid == rhs.layer_guid &&
+         lhs.num_experts == rhs.num_experts &&
          lhs.experts_start_idx == rhs.experts_start_idx &&
          lhs.experts_output_dim_size == rhs.experts_output_dim_size &&
          lhs.alpha == rhs.alpha &&
          lhs.experts_num_layers == rhs.experts_num_layers &&
-         lhs.experts_internal_dim_size == rhs.experts_internal_dim_size;
+         lhs.experts_internal_dim_size == rhs.experts_internal_dim_size &&
+         lhs.use_bias == rhs.use_bias && lhs.activation == rhs.activation;
 }
 
 Experts::Experts(FFModel &model,
                  ExpertsParams const &params,
-                 // std::pair<ParallelTensor, ParallelTensor> const &inputs,
                  std::vector<ParallelTensor> const &inputs,
+                 bool allocate_weights,
                  char const *name)
     : Experts(model,
+              params.layer_guid,
               inputs.data(),
               params.num_experts,
               params.experts_start_idx,
@@ -225,9 +256,13 @@ Experts::Experts(FFModel &model,
               params.alpha,
               params.experts_num_layers,
               params.experts_internal_dim_size,
+              params.use_bias,
+              params.activation,
+              allocate_weights,
               name) {}
 
 Experts::Experts(FFModel &model,
+                 LayerID const &_layer_guid,
                  ParallelTensor const *inputs,
                  int _num_experts,
                  int _experts_start_idx,
@@ -235,31 +270,37 @@ Experts::Experts(FFModel &model,
                  float _alpha,
                  int _experts_num_layers,
                  int _experts_internal_dim_size,
+                 bool _use_bias,
+                 ActiMode _activation,
+                 bool allocate_weights,
                  char const *name)
     : Op(model,
          OP_EXPERTS,
          DT_FLOAT,
          name,
          3 /*inputs*/,
-         0 /*weights*/,
-         _num_experts /*outputs*/,
+         _num_experts * (1 + _use_bias) /*weights*/,
+         1 /*outputs*/,
          inputs),
       num_experts(_num_experts), experts_start_idx(_experts_start_idx),
       experts_output_dim_size(_experts_output_dim_size), alpha(_alpha),
       experts_num_layers(_experts_num_layers),
-      experts_internal_dim_size(_experts_internal_dim_size) {
+      experts_internal_dim_size(_experts_internal_dim_size),
+      use_bias(_use_bias), activation(_activation) {
+
+  // overwrite layer_guid
+  layer_guid = _layer_guid;
 
   assert(num_experts > 0);
   assert(numInputs == 3);
-  assert(numOutputs == num_experts);
+  assert(numOutputs == 1);
+  assert(numWeights == num_experts * (1 + use_bias));
 
   assert(inputs[0] != nullptr);
   int num_dims = inputs[0]->num_dims;
   assert(inputs[1]->num_dims == num_dims);
   assert(inputs[2]->num_dims == num_dims);
 
-  int out_dim = num_experts * experts_output_dim_size;
-  assert(inputs[0]->dims[0].size == out_dim);
   int topk = inputs[1]->dims[0].size;
   assert(inputs[2]->dims[0].size == topk);
 
@@ -278,28 +319,74 @@ Experts::Experts(FFModel &model,
   assert(inputs[1]->dims[0].degree == 1);
   assert(inputs[2]->dims[0].degree == 1);
 
-  ParallelDim dims[MAX_TENSOR_DIM];
+  ParallelDim out_dims[MAX_TENSOR_DIM];
   for (int i = 0; i < num_dims; i++) {
-    dims[i] = inputs[0]->dims[i];
+    out_dims[i] = inputs[0]->dims[i];
   }
-  dims[0].size = experts_output_dim_size;
-  // numOutputs = num_experts;
-  // numWeights = 0;
-  for (int i = 0; i < num_experts; i++) {
-    outputs[i] = model.create_parallel_tensor_legion_ordering(
-        num_dims, dims, inputs[0]->data_type, this, i /*owner_idx*/);
-    assert(outputs[i] != nullptr);
+  out_dims[0].size = experts_output_dim_size;
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      num_dims, out_dims, inputs[0]->data_type, this, 0 /*owner_idx*/);
+  assert(outputs[0] != nullptr);
+
+  // auto dimension_names =
+  // this->get_params().get_dimension_names(inputs[0]->get_shape());
+  ParallelTensorShape input_shape = inputs[0]->get_shape();
+  ParallelTensorShape output_shape, kernel_shape, bias_shape;
+  ExpertsParams params = this->get_params();
+  params.construct_mappings(*this->parallel_dims_mapping, input_shape);
+  params.solve_dims(input_shape, output_shape, kernel_shape, bias_shape);
+
+  if (allocate_weights) {
+#ifdef USE_NCCL
+    ParameterSyncType comm_type = ParameterSyncType::NCCL;
+#else
+    ParameterSyncType comm_type = ParameterSyncType::PS;
+#endif
+    for (int i = 0; i < num_experts; i++) {
+      Initializer *kernel_initializer = new GlorotUniform(std::rand() /*seed*/);
+      {
+        // ParallelDim dims[2] = {inputs[0]->dims[0], out_dims[0]};
+        weights[i * (1 + use_bias)] =
+            model.create_parallel_weight_legion_ordering(
+                kernel_shape.num_dims, // 2,
+                kernel_shape.dims,     // dims,
+                DT_FLOAT,
+                NULL /*owner_op*/,
+                true /*create_grad*/,
+                kernel_initializer,
+                comm_type);
+        assert(weights[i * (1 + use_bias)] != nullptr);
+      }
+      if (use_bias) {
+        Initializer *bias_initializer = new ZeroInitializer();
+        ParallelDim dims[1] = {out_dims[0]};
+        weights[i * (1 + use_bias) + use_bias] =
+            model.create_parallel_weight_legion_ordering(
+                bias_shape.num_dims, // 1,
+                bias_shape.dims,     // dims,
+                DT_FLOAT,
+                NULL /*owner_op*/,
+                true /*create_grad*/,
+                bias_initializer,
+                comm_type);
+        assert(weights[i * (1 + use_bias) + use_bias] != nullptr);
+      }
+    }
   }
+  assert(check_output_input_weight_parallel_dims(allocate_weights));
 }
 
 void Experts::serialize(Legion::Serializer &sez) const {
   ExpertsParams params = get_params();
+  sez.serialize(params.layer_guid.id);
   sez.serialize(params.num_experts);
   sez.serialize(params.experts_start_idx);
   sez.serialize(params.experts_output_dim_size);
   sez.serialize(params.alpha);
   sez.serialize(params.experts_num_layers);
   sez.serialize(params.experts_internal_dim_size);
+  sez.serialize(params.use_bias);
+  sez.serialize(params.activation);
 }
 
 using PCG::Node;
@@ -310,22 +397,32 @@ Node Experts::deserialize(FFModel &ff,
   int num_experts, experts_start_idx, experts_output_dim_size,
       experts_num_layers, experts_internal_dim_size;
   float alpha;
+  ActiMode activation;
+  bool use_bias;
+  size_t id;
+  dez.deserialize(id);
+  LayerID layer_guid(id);
   dez.deserialize(num_experts);
   dez.deserialize(experts_start_idx);
   dez.deserialize(experts_output_dim_size);
   dez.deserialize(alpha);
   dez.deserialize(experts_num_layers);
   dez.deserialize(experts_internal_dim_size);
+  dez.deserialize(use_bias);
+  dez.deserialize(activation);
 
   assert(num_inputs == 3);
 
   ExpertsParams params;
+  params.layer_guid = layer_guid;
   params.num_experts = num_experts;
   params.experts_start_idx = experts_start_idx;
   params.experts_output_dim_size = experts_output_dim_size;
   params.alpha = alpha;
   params.experts_num_layers = experts_num_layers;
   params.experts_internal_dim_size = experts_internal_dim_size;
+  params.use_bias = use_bias;
+  params.activation = activation;
 
   return ff.get_or_create_node<Experts>(inputs, params);
 }
@@ -368,14 +465,29 @@ void Experts::init_inference(FFModel const &ff,
                                                     EXCLUSIVE,
                                                     batch_inputs[2]->region));
   launcher.add_field(2, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(3, FID_DATA);
   for (int i = 0; i < num_experts; i++) {
     launcher.add_region_requirement(
-        RegionRequirement(batch_outputs[i]->part,
+        RegionRequirement(weights[i * (1 + use_bias)]->part,
                           0 /*projection id*/,
-                          WRITE_ONLY,
+                          READ_ONLY,
                           EXCLUSIVE,
-                          batch_outputs[i]->region));
-    launcher.add_field(i + 3, FID_DATA);
+                          weights[i * (1 + use_bias)]->region));
+    launcher.add_field(4 + i * (1 + use_bias), FID_DATA);
+    if (use_bias) {
+      launcher.add_region_requirement(
+          RegionRequirement(weights[i * (1 + use_bias) + use_bias]->part,
+                            0 /*projection id*/,
+                            READ_ONLY,
+                            EXCLUSIVE,
+                            weights[i * (1 + use_bias) + use_bias]->region));
+      launcher.add_field(4 + i * (1 + use_bias) + use_bias, FID_DATA);
+    }
   }
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
@@ -418,13 +530,29 @@ void Experts::init(FFModel const &ff) {
                                                     EXCLUSIVE,
                                                     inputs[2]->region));
   launcher.add_field(2, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(3, FID_DATA);
   for (int i = 0; i < num_experts; i++) {
-    launcher.add_region_requirement(RegionRequirement(outputs[i]->part,
-                                                      0 /*projection id*/,
-                                                      WRITE_ONLY,
-                                                      EXCLUSIVE,
-                                                      outputs[i]->region));
-    launcher.add_field(i + 3, FID_DATA);
+    launcher.add_region_requirement(
+        RegionRequirement(weights[i * (1 + use_bias)]->part,
+                          0 /*projection id*/,
+                          READ_ONLY,
+                          EXCLUSIVE,
+                          weights[i * (1 + use_bias)]->region));
+    launcher.add_field(4 + i * (1 + use_bias), FID_DATA);
+    if (use_bias) {
+      launcher.add_region_requirement(
+          RegionRequirement(weights[i * (1 + use_bias) + use_bias]->part,
+                            0 /*projection id*/,
+                            READ_ONLY,
+                            EXCLUSIVE,
+                            weights[i * (1 + use_bias) + use_bias]->region));
+      launcher.add_field(4 + i * (1 + use_bias) + use_bias, FID_DATA);
+    }
   }
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
@@ -437,8 +565,12 @@ OpMeta *Experts::init_task(Task const *task,
                            Runtime *runtime) {
   Experts const *exp = (Experts *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
-  ExpertsMeta *m = new ExpertsMeta(
-      handle, exp->num_experts, exp->experts_start_idx, exp->alpha);
+  ExpertsMeta *m = new ExpertsMeta(handle,
+                                   exp->num_experts,
+                                   exp->experts_start_idx,
+                                   exp->alpha,
+                                   exp->use_bias,
+                                   exp->activation);
   m->profiling = exp->profiling;
   return m;
 }
@@ -478,15 +610,31 @@ void Experts::forward(FFModel const &ff) {
                                                     EXCLUSIVE,
                                                     inputs[2]->region));
   launcher.add_field(2, FID_DATA);
+  // expert output per token (only the chosen experts have non-zero
+  // contributions)
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(3, FID_DATA);
   for (int i = 0; i < num_experts; i++) {
-    // expert output per token (only the chosen experts have non-zero
-    // contributions)
-    launcher.add_region_requirement(RegionRequirement(outputs[i]->part,
-                                                      0 /*projection id*/,
-                                                      WRITE_ONLY,
-                                                      EXCLUSIVE,
-                                                      outputs[i]->region));
-    launcher.add_field(i + 3, FID_DATA);
+    launcher.add_region_requirement(
+        RegionRequirement(weights[i * (1 + use_bias)]->part,
+                          0 /*projection id*/,
+                          READ_ONLY,
+                          EXCLUSIVE,
+                          weights[i * (1 + use_bias)]->region));
+    launcher.add_field(4 + i * (1 + use_bias), FID_DATA);
+    if (use_bias) {
+      launcher.add_region_requirement(
+          RegionRequirement(weights[i * (1 + use_bias) + use_bias]->part,
+                            0 /*projection id*/,
+                            READ_ONLY,
+                            EXCLUSIVE,
+                            weights[i * (1 + use_bias) + use_bias]->region));
+      launcher.add_field(4 + i * (1 + use_bias) + use_bias, FID_DATA);
+    }
   }
   runtime->execute_index_space(ctx, launcher);
 }
@@ -530,16 +678,31 @@ void Experts::inference(FFModel const &ff,
                                                     EXCLUSIVE,
                                                     batch_inputs[2]->region));
   launcher.add_field(2, FID_DATA);
+  // expert output per token (only the chosen experts have non-zero
+  // contributions)
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(3, FID_DATA);
   for (int i = 0; i < num_experts; i++) {
-    // expert output per token (only the chosen experts have non-zero
-    // contributions)
     launcher.add_region_requirement(
-        RegionRequirement(batch_outputs[i]->part,
+        RegionRequirement(weights[i * (1 + use_bias)]->part,
                           0 /*projection id*/,
-                          WRITE_ONLY,
+                          READ_ONLY,
                           EXCLUSIVE,
-                          batch_outputs[i]->region));
-    launcher.add_field(i + 3, FID_DATA);
+                          weights[i * (1 + use_bias)]->region));
+    launcher.add_field(4 + i * (1 + use_bias), FID_DATA);
+    if (use_bias) {
+      launcher.add_region_requirement(
+          RegionRequirement(weights[i * (1 + use_bias) + use_bias]->part,
+                            0 /*projection id*/,
+                            READ_ONLY,
+                            EXCLUSIVE,
+                            weights[i * (1 + use_bias) + use_bias]->region));
+      launcher.add_field(4 + i * (1 + use_bias) + use_bias, FID_DATA);
+    }
   }
   runtime->execute_index_space(ctx, launcher);
 }
@@ -549,17 +712,24 @@ void Experts::inference_task(Task const *task,
                              Context ctx,
                              Runtime *runtime) {
   assert(regions.size() == task->regions.size());
-  int num_experts = regions.size() - 3;
 
   ExpertsMeta const *m = *((ExpertsMeta **)task->local_args);
 
-  // get input, indices, topk_gate_preds
+  int num_experts = m->num_experts;
+  bool use_bias = m->use_bias;
+  assert(regions.size() - 4 == num_experts * (1 + use_bias));
+
+  // get input, indices, topk_gate_preds, outputs
   float const *input_ptr = helperGetTensorPointerRO<float>(
       regions[0], task->regions[0], FID_DATA, ctx, runtime);
   int const *indices_ptr = helperGetTensorPointerRO<int>(
       regions[1], task->regions[1], FID_DATA, ctx, runtime);
   float const *topk_gate_pred_ptr = helperGetTensorPointerRO<float>(
       regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  float *output_ptr = helperGetTensorPointerWO<float>(
+      regions[3], task->regions[3], FID_DATA, ctx, runtime);
+  assert(input_ptr != nullptr && indices_ptr != nullptr &&
+         topk_gate_pred_ptr != nullptr && output_ptr != nullptr);
 
   Domain input_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
@@ -567,21 +737,25 @@ void Experts::inference_task(Task const *task,
       ctx, task->regions[1].region.get_index_space());
   Domain topk_gate_pred_domain = runtime->get_index_space_domain(
       ctx, task->regions[2].region.get_index_space());
+  Domain output_domain = runtime->get_index_space_domain(
+      ctx, task->regions[3].region.get_index_space());
 
   int input_dims = input_domain.get_dim();
   int indices_dims = indices_domain.get_dim();
   int topk_gate_pred_dims = topk_gate_pred_domain.get_dim();
+  int output_dims = output_domain.get_dim();
   assert(input_dims == indices_dims);
   assert(indices_dims == topk_gate_pred_dims);
+  assert(input_dims == output_dims);
 
   int replica_dim = input_dims - 1;
   int samples_index = input_dims - 2;
 
-  coord_t out_dim =
-      (input_domain.hi()[0] - input_domain.lo()[0] + 1) / num_experts;
+  coord_t data_dim = input_domain.hi()[0] - input_domain.lo()[0] + 1;
   coord_t batch_size =
       input_domain.hi()[samples_index] - input_domain.lo()[samples_index] + 1;
   coord_t chosen_experts = indices_domain.hi()[0] - indices_domain.lo()[0];
+  coord_t out_dim = output_domain.hi()[0] - output_domain.lo()[0] + 1;
   assert(chosen_experts ==
          topk_gate_pred_domain.hi()[0] - topk_gate_pred_domain.lo()[0]);
 
@@ -601,26 +775,51 @@ void Experts::inference_task(Task const *task,
       num_experts <= MAX_EXPERTS_PER_BLOCK &&
       "number of experts exceeds MAX_EXPERTS_PER_BLOCK defined in experts.h");
 
-  float *outputs[num_experts];
+  for (int j = 1; j < input_dims; j++) {
+    int a = input_domain.hi()[j] - input_domain.lo()[j] + 1;
+    int b = output_domain.hi()[j] - output_domain.lo()[j] + 1;
+    assert(a == b);
+  }
+
+  // get weights
+  float const *weights_ptrs[num_experts * (1 + use_bias)];
   for (int i = 0; i < num_experts; i++) {
-    Domain output_domain = runtime->get_index_space_domain(
-        ctx, task->regions[3 + i].region.get_index_space());
-    assert((output_domain.hi()[0] - output_domain.lo()[0] + 1) == out_dim);
-    for (int j = 1; j < input_dims; j++) {
-      int a = input_domain.hi()[j] - input_domain.lo()[j] + 1;
-      int b = output_domain.hi()[j] - output_domain.lo()[j] + 1;
-      assert(a == b);
+    weights_ptrs[i * (1 + use_bias)] =
+        helperGetTensorPointerRO<float>(regions[4 + i * (1 + use_bias)],
+                                        task->regions[4 + i * (1 + use_bias)],
+                                        FID_DATA,
+                                        ctx,
+                                        runtime);
+    Domain weights_domain = runtime->get_index_space_domain(
+        ctx, task->regions[4 + i * (1 + use_bias)].region.get_index_space());
+    int weights_dims = weights_domain.get_dim();
+    assert(weights_dims == input_dims);
+    assert(weights_domain.hi()[0] - weights_domain.lo()[0] + 1 == data_dim);
+    assert(weights_domain.hi()[1] - weights_domain.lo()[1] + 1 == out_dim);
+    if (use_bias) {
+      weights_ptrs[i * (1 + use_bias) + use_bias] =
+          helperGetTensorPointerRO<float>(
+              regions[4 + i * (1 + use_bias) + use_bias],
+              task->regions[4 + i * (1 + use_bias) + use_bias],
+              FID_DATA,
+              ctx,
+              runtime);
+      Domain bias_domain = runtime->get_index_space_domain(
+          ctx,
+          task->regions[4 + i * (1 + use_bias) + use_bias]
+              .region.get_index_space());
+      int bias_dims = bias_domain.get_dim();
+      assert(bias_dims == 1);
+      assert(bias_domain.hi()[0] - bias_domain.lo()[0] + 1 == out_dim);
     }
-    outputs[i] = helperGetTensorPointerWO<float>(
-        regions[3 + i], task->regions[3 + i], FID_DATA, ctx, runtime);
-    assert(outputs[i] != nullptr);
   }
 
   Experts::forward_kernel_wrapper(m,
                                   input_ptr,
                                   indices_ptr,
                                   topk_gate_pred_ptr,
-                                  outputs,
+                                  output_ptr,
+                                  weights_ptrs,
                                   chosen_experts,
                                   batch_size,
                                   out_dim);
@@ -656,18 +855,190 @@ bool Experts::measure_operator_cost(Simulator *sim,
   return false;
 }
 
+void ExpertsParams::solve_dims(const ParallelTensor input,
+                               ParallelDim output_dims[MAX_TENSOR_DIM],
+                               int *output_ndims,
+                               ParallelDim kernel_dims[MAX_TENSOR_DIM],
+                               int *kernel_ndims,
+                               ParallelDim bias_dims[MAX_TENSOR_DIM],
+                               int *bias_ndims) const {
+  this->solve_dims(input->get_shape(),
+                   output_dims,
+                   output_ndims,
+                   kernel_dims,
+                   kernel_ndims,
+                   bias_dims,
+                   bias_ndims);
+}
+
+void ExpertsParams::solve_dims(ParallelTensorShape const &input_shape,
+                               ParallelTensorShape &output_shape,
+                               ParallelTensorShape &kernel_shape,
+                               ParallelTensorShape &bias_shape) const {
+  this->solve_dims(input_shape,
+                   output_shape.dims,
+                   &output_shape.num_dims,
+                   kernel_shape.dims,
+                   &kernel_shape.num_dims,
+                   bias_shape.dims,
+                   &bias_shape.num_dims);
+}
+
+void ExpertsParams::solve_dims(ParallelTensorShape const &input_shape,
+                               ParallelDim output_dims[MAX_TENSOR_DIM],
+                               int *output_ndims,
+                               ParallelDim kernel_dims[MAX_TENSOR_DIM],
+                               int *kernel_ndims,
+                               ParallelDim bias_dims[MAX_TENSOR_DIM],
+                               int *bias_ndims) const {
+  assert((output_dims == nullptr) == (output_ndims == nullptr));
+  assert((kernel_dims == nullptr) == (kernel_ndims == nullptr));
+  assert((bias_dims == nullptr) == (bias_ndims == nullptr));
+
+  std::vector<ParallelDimMappingRecord> mapping;
+  this->construct_mappings(mapping, input_shape);
+  this->mark_replica_dims(input_shape, output_dims, kernel_dims, bias_dims);
+
+  solve_parallel_dim_mappings(
+      mapping, {input_shape.dims}, {kernel_dims, bias_dims}, {output_dims});
+
+  this->calculate_nonreplica_dim_sizes(input_shape,
+                                       output_dims,
+                                       output_ndims,
+                                       kernel_dims,
+                                       kernel_ndims,
+                                       bias_dims,
+                                       bias_ndims);
+}
+
+std::unordered_map<ExpertsParams::NamedDimensions, int>
+    ExpertsParams::get_dimension_names(
+        ParallelTensorShape const &input_shape) const {
+  int num_dims = input_shape.num_dims;
+
+  return {{INPUT_CHANNEL, 0},
+          {INPUT_SAMPLE, num_dims - 2},
+          {INPUT_REPLICA, num_dims - 1},
+          {OUTPUT_CHANNEL, 0},
+          {OUTPUT_SAMPLE, num_dims - 2},
+          {OUTPUT_REPLICA, num_dims - 1},
+          {KERNEL_CHANNEL_IN, 0},
+          {KERNEL_CHANNEL_OUT, 1},
+          {BIAS_CHANNEL_OUT, 0}};
+}
+
+void ExpertsParams::calculate_nonreplica_dim_sizes(
+    ParallelTensorShape const &input_shape,
+    ParallelDim output_dims[MAX_TENSOR_DIM],
+    int *output_ndims,
+    ParallelDim kernel_dims[MAX_TENSOR_DIM],
+    int *kernel_ndims,
+    ParallelDim bias_dims[MAX_TENSOR_DIM],
+    int *bias_ndims) const {
+  auto dimension_names = this->get_dimension_names(input_shape);
+  int num_dims = input_shape.num_dims;
+
+  if (output_dims != nullptr) {
+    for (int i = 1; i < input_shape.num_dims - 1; i++) {
+      output_dims[i].size = input_shape.dims[i].size;
+    }
+    output_dims[dimension_names.at(OUTPUT_CHANNEL)].size =
+        experts_output_dim_size;
+    *output_ndims = num_dims;
+  }
+  if (kernel_dims != nullptr) {
+    kernel_dims[dimension_names.at(KERNEL_CHANNEL_IN)].size =
+        input_shape.dims[INPUT_CHANNEL].size /
+        input_shape.dims[INPUT_CHANNEL].degree;
+    kernel_dims[dimension_names.at(KERNEL_CHANNEL_OUT)].size =
+        experts_output_dim_size;
+    *kernel_ndims = num_dims;
+  }
+  if (bias_dims != nullptr) {
+    bias_dims[dimension_names.at(BIAS_CHANNEL_OUT)].size =
+        experts_output_dim_size;
+    *bias_ndims = num_dims;
+  }
+}
+
+void ExpertsParams::mark_replica_dims(
+    ParallelTensorShape const &input_shape,
+    ParallelDim output_dims[MAX_TENSOR_DIM],
+    ParallelDim kernel_dims[MAX_TENSOR_DIM],
+    ParallelDim bias_dims[MAX_TENSOR_DIM]) const {
+  int num_dims = input_shape.num_dims;
+  auto dimension_names = this->get_dimension_names(input_shape);
+  if (output_dims != nullptr) {
+    output_dims[dimension_names.at(OUTPUT_REPLICA)].is_replica_dim = true;
+  }
+  if (kernel_dims != nullptr) {
+    for (int i = 2; i < num_dims; i++) {
+      kernel_dims[i].is_replica_dim = true;
+    }
+  }
+  if (bias_dims != nullptr) {
+    for (int i = 1; i < num_dims; i++) {
+      bias_dims[i].is_replica_dim = true;
+    }
+  }
+}
+
+void ExpertsParams::construct_mappings(
+    std::vector<ParallelDimMappingRecord> &mappings,
+    ParallelTensorShape const &input_shape) const {
+  std::unordered_map<NamedDimensions, int> dimension_names =
+      this->get_dimension_names(input_shape);
+
+  Op::construct_output_parallel_dims(
+      mappings,
+      {{dimension_names.at(INPUT_CHANNEL), dimension_names.at(OUTPUT_REPLICA)},
+       {dimension_names.at(INPUT_REPLICA),
+        dimension_names.at(OUTPUT_CHANNEL)}});
+  for (int i = 1; i < input_shape.num_dims - 1; i++) {
+    Op::construct_output_parallel_dims(mappings, i, i);
+  }
+
+  Op::construct_weight_parallel_dims(mappings,
+                                     {{dimension_names.at(INPUT_CHANNEL),
+                                       dimension_names.at(KERNEL_CHANNEL_IN)},
+                                      {dimension_names.at(INPUT_REPLICA),
+                                       dimension_names.at(KERNEL_CHANNEL_OUT)}},
+                                     0 /*input_idx*/,
+                                     KERNEL_IDX);
+  // map a bunch of replica dimensions for the unnamed dimensions in the input
+  for (int i = 1; i < input_shape.num_dims - 1; i++) {
+    Op::construct_weight_parallel_dims(
+        mappings, i, i + 1, 0 /*input_idx*/, KERNEL_IDX);
+  }
+
+  Op::construct_weight_parallel_dims(mappings,
+                                     {
+                                         {dimension_names.at(INPUT_REPLICA),
+                                          dimension_names.at(BIAS_CHANNEL_OUT)},
+                                     },
+                                     0 /*input_idx*/,
+                                     BIAS_IDX);
+  for (int i = 0; i < input_shape.num_dims - 1; i++) {
+    Op::construct_weight_parallel_dims(
+        mappings, i, i + 1, 0 /*input_idx*/, BIAS_IDX);
+  }
+}
+
 }; // namespace FlexFlow
 
 namespace std {
 size_t hash<FlexFlow::ExpertsParams>::operator()(
     FlexFlow::ExpertsParams const &params) const {
   size_t key = 0;
+  hash_combine(key, params.layer_guid.id);
   hash_combine(key, params.num_experts);
   hash_combine(key, params.experts_start_idx);
   hash_combine(key, params.experts_output_dim_size);
   hash_combine(key, params.alpha);
   hash_combine(key, params.experts_num_layers);
   hash_combine(key, params.experts_internal_dim_size);
+  hash_combine(key, params.use_bias);
+  hash_combine(key, params.activation);
   return key;
 }
 }; // namespace std
diff --git a/src/ops/experts.cpp b/src/ops/experts.cpp
index 92fb1e6e13..081f814400 100644
--- a/src/ops/experts.cpp
+++ b/src/ops/experts.cpp
@@ -19,77 +19,13 @@
 
 namespace FlexFlow {
 
-__global__ void experts_forward_kernel(float const *input,
-                                       int const *indices,
-                                       float const *topk_gate_preds,
-                                       float **outputs,
-                                       int num_experts,
-                                       int experts_start_idx,
-                                       int chosen_experts,
-                                       int expert_capacity,
-                                       int batch_size,
-                                       int out_dim) {
-  // shared at the block level
-  __shared__ float token_assigned[MAX_BATCH_SIZE][MAX_EXPERTS_PER_BLOCK];
-
-  // initialize the token assignments to 0
-  CUDA_KERNEL_LOOP(i, MAX_BATCH_SIZE * MAX_EXPERTS_PER_BLOCK) {
-    int token_index = i / MAX_EXPERTS_PER_BLOCK;
-    int expert_index = i % MAX_EXPERTS_PER_BLOCK;
-    token_assigned[token_index][expert_index] = 0.0f;
-  }
-
-  __syncthreads();
-
-  // Compute token assignments, single thread per block
-  if (threadIdx.x == 0) {
-    int token_count[MAX_EXPERTS_PER_BLOCK] = {0};
-    for (int i = 0; i < chosen_experts * batch_size; i++) {
-      // Get the token index, between 0 and batch_size
-      int token_index = i / chosen_experts;
-      // Get global index (indices[i]) of expert to which the token is assigned,
-      // and compute the local index (expert_index) of the expert within the
-      // block of fused experts
-      int expert_index = indices[i] - experts_start_idx;
-      // check if the token is assigned to an expert in this block, and if so,
-      // whether the expert still has capacity not that since each expert is
-      // assigned to only one block, it is safe to reason about expert capacity
-      // locally
-      if (expert_index >= 0 && expert_index < num_experts &&
-          token_count[expert_index] < expert_capacity) {
-        token_assigned[token_index][expert_index] = topk_gate_preds[i];
-        token_count[expert_index]++;
-      } else {
-      }
-    }
-  }
-
-  __syncthreads();
-
-  // compute output
-  CUDA_KERNEL_LOOP(i, num_experts * batch_size * out_dim) {
-    // output indexing:
-    // i = expert_index*(batch_size*out_dim) + token_index*out_dim + dim_index
-    // input indexing:
-    // i = token_index * (num_experts * out_dim) + expert_index * out_dim +
-    // dim_index
-    int expert_index = i / (batch_size * out_dim);
-    // int token_index = (i - expert_index*(batch_size*out_dim)) / out_dim;
-    int token_index = (i % (batch_size * out_dim)) / out_dim;
-    // int dim_index = i - expert_index*(batch_size*out_dim) -
-    // token_index*out_dim;
-    int dim_index = i % out_dim;
-    outputs[expert_index][token_index * out_dim + dim_index] =
-        input[i] * token_assigned[token_index][expert_index];
-  }
-}
-
 /*static*/
 void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                      float const *input,
                                      int const *indices,
                                      float const *topk_gate_preds,
-                                     float **outputs,
+                                     float *output,
+                                     float const **weights,
                                      int chosen_experts,
                                      int batch_size,
                                      int out_dim) {
@@ -99,55 +35,33 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
   int expert_capacity =
       ceil(m->alpha * chosen_experts / m->num_experts * batch_size);
 
-  //   cudaEvent_t t_start, t_end;
-  //   if (m->profiling) {
-  //     cudaEventCreate(&t_start);
-  //     cudaEventCreate(&t_end);
-  //     cudaEventRecord(t_start, stream);
-  //   }
-  hipMemcpy(m->dev_region_ptrs,
-            outputs,
-            m->num_experts * sizeof(float *),
-            hipMemcpyHostToDevice);
+  int num_experts = m->num_experts;
+  // int expert_start_index = experts_start_idx;
+  bool use_bias = m->use_bias;
+  // ActiMode activation = m->activation;
 
-  hipLaunchKernelGGL(
-      experts_forward_kernel,
-      GET_BLOCKS(batch_size * m->num_experts * out_dim),
-      min(CUDA_NUM_THREADS, (int)(batch_size * m->num_experts * out_dim)),
-      0,
-      stream,
-      input,
-      indices,
-      topk_gate_preds,
-      m->dev_region_ptrs,
-      m->num_experts,
-      m->experts_start_idx,
-      chosen_experts,
-      expert_capacity,
-      batch_size,
-      out_dim);
+  hipMemcpy(m->dev_weights,
+            weights,
+            num_experts * (1 + use_bias) * sizeof(float *),
+            hipMemcpyHostToDevice);
 
-  // if (m->profiling) {
-  //     cudaEventRecord(t_end, stream);
-  //     checkCUDA(cudaEventSynchronize(t_end));
-  //     float elapsed = 0;
-  //     checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
-  //     cudaEventDestroy(t_start);
-  //     cudaEventDestroy(t_end);
-  //     printf("[Experts] forward time = %.2lfms\n", elapsed);
-  // }
+  // TODO: write the HIP version of the kernel after finishing the CUDA kernel
 }
 
 ExpertsMeta::ExpertsMeta(FFHandler handler,
                          int _num_experts,
                          int _experts_start_idx,
-                         float _alpha)
+                         float _alpha,
+                         bool _use_bias,
+                         ActiMode _activation)
     : OpMeta(handler), num_experts(_num_experts),
-      experts_start_idx(_experts_start_idx), alpha(_alpha) {
-  checkCUDA(hipMalloc(&dev_region_ptrs, num_experts * sizeof(float *)));
+      experts_start_idx(_experts_start_idx), alpha(_alpha), use_bias(_use_bias),
+      activation(_activation) {
+  checkCUDA(
+      hipMalloc(&dev_weights, num_experts * (1 + use_bias) * sizeof(float *)));
 }
 ExpertsMeta::~ExpertsMeta(void) {
-  checkCUDA(hipFree(&dev_region_ptrs));
+  checkCUDA(hipFree(&dev_weights));
 }
 
 }; // namespace FlexFlow
diff --git a/src/ops/experts.cu b/src/ops/experts.cu
index 769b96e5ae..342de3ef65 100644
--- a/src/ops/experts.cu
+++ b/src/ops/experts.cu
@@ -18,88 +18,27 @@
 
 namespace FlexFlow {
 
-__global__ void experts_forward_kernel(float const *input,
-                                       int const *indices,
-                                       float const *topk_gate_preds,
-                                       float **outputs,
-                                       int num_experts,
-                                       int experts_start_idx,
-                                       int chosen_experts,
-                                       int expert_capacity,
-                                       int batch_size,
-                                       int out_dim) {
-  // shared at the block level
-  __shared__ float token_assigned[MAX_BATCH_SIZE][MAX_EXPERTS_PER_BLOCK];
-
-  // initialize the token assignments to 0
-  CUDA_KERNEL_LOOP(i, MAX_BATCH_SIZE * MAX_EXPERTS_PER_BLOCK) {
-    int token_index = i / MAX_EXPERTS_PER_BLOCK;
-    int expert_index = i % MAX_EXPERTS_PER_BLOCK;
-    token_assigned[token_index][expert_index] = 0.0f;
-  }
-
-  __syncthreads();
-
-  // Compute token assignments, single thread per block
-  if (threadIdx.x == 0) {
-    int token_count[MAX_EXPERTS_PER_BLOCK] = {0};
-    for (int i = 0; i < chosen_experts * batch_size; i++) {
-      // Get the token index, between 0 and batch_size
-      int token_index = i / chosen_experts;
-      // Get global index (indices[i]) of expert to which the token is assigned,
-      // and compute the local index (expert_index) of the expert within the
-      // block of fused experts
-      int expert_index = indices[i] - experts_start_idx;
-      // check if the token is assigned to an expert in this block, and if so,
-      // whether the expert still has capacity not that since each expert is
-      // assigned to only one block, it is safe to reason about expert capacity
-      // locally
-      if (expert_index >= 0 && expert_index < num_experts &&
-          token_count[expert_index] < expert_capacity) {
-        token_assigned[token_index][expert_index] = topk_gate_preds[i];
-        token_count[expert_index]++;
-      } else {
-      }
-    }
-  }
-
-  __syncthreads();
-
-  // compute output
-  CUDA_KERNEL_LOOP(i, num_experts * batch_size * out_dim) {
-    // output indexing:
-    // i = expert_index*(batch_size*out_dim) + token_index*out_dim + dim_index
-    // input indexing:
-    // i = token_index * (num_experts * out_dim) + expert_index * out_dim +
-    // dim_index
-    int expert_index = i / (batch_size * out_dim);
-    // int token_index = (i - expert_index*(batch_size*out_dim)) / out_dim;
-    int token_index = (i % (batch_size * out_dim)) / out_dim;
-    // int dim_index = i - expert_index*(batch_size*out_dim) -
-    // token_index*out_dim;
-    int dim_index = i % out_dim;
-    outputs[expert_index][token_index * out_dim + dim_index] =
-        input[i] * token_assigned[token_index][expert_index];
-  }
-}
-
 /*static*/
 void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                      float const *input,
                                      int const *indices,
                                      float const *topk_gate_preds,
-                                     float **outputs,
+                                     float *output,
+                                     float const **weights,
                                      int chosen_experts,
                                      int batch_size,
                                      int out_dim) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
-  // checkCUDA(cublasSetStream(m->handle.blas, stream));
-  // checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
 
   int expert_capacity =
       ceil(m->alpha * chosen_experts / m->num_experts * batch_size);
 
+  int num_experts = m->num_experts;
+  // int expert_start_index = experts_start_idx;
+  bool use_bias = m->use_bias;
+  // ActiMode activation = m->activation;
+
   cudaEvent_t t_start, t_end;
   if (m->profiling) {
     cudaEventCreate(&t_start);
@@ -107,27 +46,23 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
     cudaEventRecord(t_start, stream);
   }
 
-  // call forward_kernel
-  cudaMemcpyAsync(m->dev_region_ptrs,
-                  outputs,
-                  m->num_experts * sizeof(float *),
-                  cudaMemcpyHostToDevice,
-                  stream);
-
-  experts_forward_kernel<<<GET_BLOCKS(batch_size * m->num_experts * out_dim),
-                           min(CUDA_NUM_THREADS,
-                               (int)(batch_size * m->num_experts * out_dim)),
-                           0,
-                           stream>>>(input,
-                                     indices,
-                                     topk_gate_preds,
-                                     m->dev_region_ptrs,
-                                     m->num_experts,
-                                     m->experts_start_idx,
-                                     chosen_experts,
-                                     expert_capacity,
-                                     batch_size,
-                                     out_dim);
+  cudaMemcpy(m->dev_weights,
+             weights,
+             num_experts * (1 + use_bias) * sizeof(float *),
+             cudaMemcpyHostToDevice);
+
+  /** TODO: launch one or more kernel(s) to do the following:
+   * 1. sort the tokens by expert to which they are assigned. This will require
+   * replicating tokens when chosen_experts > 1
+   * 2. matrix multiply (you can use cublasGemmEx) each slice of tokens with the
+   * corresponding expert's weights tensor. Add the bias.
+   *      - you can obtain the slice by selecting the tokens between the index
+   * where the expert i starts and min(i+expert_capacity, index where expert i+1
+   * starts)
+   * 3. reorder the outputs by token, and aggregate the outputs of multiple
+   * experts for the same token by computing an average weighted by the
+   * appropriate coefficient from the topk_gate_preds matrix.
+   */
 
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
@@ -143,13 +78,17 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
 ExpertsMeta::ExpertsMeta(FFHandler handler,
                          int _num_experts,
                          int _experts_start_idx,
-                         float _alpha)
+                         float _alpha,
+                         bool _use_bias,
+                         ActiMode _activation)
     : OpMeta(handler), num_experts(_num_experts),
-      experts_start_idx(_experts_start_idx), alpha(_alpha) {
-  checkCUDA(cudaMalloc(&dev_region_ptrs, num_experts * sizeof(float *)));
+      experts_start_idx(_experts_start_idx), alpha(_alpha), use_bias(_use_bias),
+      activation(_activation) {
+  checkCUDA(
+      cudaMalloc(&dev_weights, num_experts * (1 + use_bias) * sizeof(float *)));
 }
 ExpertsMeta::~ExpertsMeta(void) {
-  checkCUDA(cudaFree(&dev_region_ptrs));
+  checkCUDA(cudaFree(&dev_weights));
 }
 
 }; // namespace FlexFlow
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index 699b98cd5a..66accf7195 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -1756,7 +1756,7 @@ GraphOptimalViewSerialized
   }
   assert(node_idx == best_graph->inEdges.size());
   // Second, serialize optimal machine view
-  printf("opotimal_views.size = %zu\n", optimal_views.size());
+  printf("optimal_views.size = %zu\n", optimal_views.size());
   sez.serialize(optimal_views.size());
   for (auto const &it : optimal_views) {
     sez.serialize((size_t)98765432); // safe guard
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 6419a2d61f..dc746dd7f4 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -1682,6 +1682,7 @@ void FFModel::map_weight_with_dim(ParallelTensor weight,
   switch (parallel_op->op_type) {
     case OP_LINEAR:
     case OP_EMBEDDING:
+    case OP_EXPERTS:
     case OP_MULTIHEAD_ATTENTION: {
       switch (tdim) {
 #define DIMFUNC(TDIM)                                                          \
diff --git a/src/runtime/substitution.cc b/src/runtime/substitution.cc
index d528fd6345..884472d204 100644
--- a/src/runtime/substitution.cc
+++ b/src/runtime/substitution.cc
@@ -3169,7 +3169,7 @@ bool FFModel::convert_graph_to_operators(
         Experts *exp = (Experts *)node.ptr;
         ExpertsParams params = exp->get_params();
         new_op = new Experts(
-            *this, params, {std::begin(inputs), std::end(inputs)}, NULL);
+            *this, params, {std::begin(inputs), std::end(inputs)}, true);
         break;
       }
       case OP_SPLIT: {

From 4f8f4a9df01f4a038ad5207c11a0576ad13e4b9c Mon Sep 17 00:00:00 2001
From: Rae Wong <33883582+yingyee0111@users.noreply.github.com>
Date: Mon, 13 Feb 2023 01:47:13 -0500
Subject: [PATCH 059/344] Explicit operator placement on devices (#619)

* first step

* linting

* Revert "linting"

This reverts commit 45c56c2a67d3ced1fd82c286e69fb7fe719809ef.

* Revert "first step"

This reverts commit badb8793bd47913614d340ba5e6b5f0fc36adaff.

* use only one device per operator

* linting

* round robin allocation

* debugging

* fix device placement for batches in same operator

* fixed tracing issue, initializing on right device

* fixed CUDNN_STATUS_MAPPING_ERROR for init

* fixed remaining bugs

---------

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
Co-authored-by: Rae Wong <rae@ip-172-31-10-138.us-east-2.compute.internal>
---
 CMakeLists.txt                                |   6 +-
 .../cpp/inference/mixture_of_experts/moe.cc   |  16 ++-
 include/flexflow/inference.h                  |   2 +
 include/flexflow/operator.h                   |  13 ++-
 include/flexflow/ops/aggregate.h              |   3 +-
 include/flexflow/ops/aggregate_spec.h         |   3 +-
 include/flexflow/ops/attention.h              |   3 +-
 include/flexflow/ops/element_binary.h         |   3 +-
 include/flexflow/ops/experts.h                |   3 +-
 include/flexflow/ops/groupby.h                |   3 +-
 include/flexflow/ops/layer_norm.h             |   3 +-
 include/flexflow/ops/linear.h                 |   3 +-
 include/flexflow/ops/noop.h                   |   3 +-
 include/flexflow/ops/softmax.h                |   3 +-
 include/flexflow/ops/topk.h                   |   3 +-
 include/flexflow/parallel_ops/partition.h     |   3 +-
 src/ops/aggregate.cc                          |  25 +++--
 src/ops/aggregate_spec.cc                     |  20 ++--
 src/ops/attention.cc                          |  21 ++--
 src/ops/element_binary.cc                     |  20 ++--
 src/ops/experts.cc                            |  22 ++--
 src/ops/group_by.cc                           |  18 +--
 src/ops/layer_norm.cc                         |  25 +++--
 src/ops/linear.cc                             |  20 ++--
 src/ops/noop.cc                               |  15 ++-
 src/ops/softmax.cc                            |  20 ++--
 src/ops/topk.cc                               |  20 ++--
 src/parallel_ops/partition.cc                 |   9 +-
 src/runtime/graph.cc                          |  12 ++
 src/runtime/inference_manager.cc              | 105 ++++++++++++------
 src/runtime/model.cc                          |  93 +++++++++++++++-
 31 files changed, 378 insertions(+), 140 deletions(-)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index b6a8fcec4e..8c27008b58 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -378,9 +378,9 @@ if(FF_BUILD_MLP_UNIFY OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/MLP_Unify)
 endif()
 
-if(FF_BUILD_MLP_UNIFY OR FF_BUILD_ALL_INFERENCE_EXAMPLES)
-  add_subdirectory(examples/cpp/inference/MLP_Unify)
-endif()
+# if(FF_BUILD_MLP_UNIFY OR FF_BUILD_ALL_INFERENCE_EXAMPLES)
+#   add_subdirectory(examples/cpp/inference/MLP_Unify)
+# endif()
 
 if(FF_BUILD_SPLIT_TEST OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/split_test)
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index 918f04d0b7..8dc0842e98 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -160,19 +160,25 @@ void FlexFlow::top_level_task(Task const *task,
 
   int index = 0;
   int processed_requests = 0;
+  int num_devices = ffConfig.workersPerNode * ffConfig.numNodes;
   Generator data_generator(
       total_requests, request_tensor_size, poisson_distribution, lambda);
+
   // data_loader.reset();
   while (processed_requests < total_requests) {
     vector<vector<double>> req = data_generator.get_requests();
-    int iterations = req.size();
+    int nreqs = req.size();
+    int iterations = (nreqs % num_requests_per_batch == 0)
+                         ? (nreqs / num_requests_per_batch)
+                         : (nreqs / num_requests_per_batch) + 1;
     for (int iter = 0; iter < iterations; iter++) {
       // data_loader.next_batch(ff);
-      runtime->begin_trace(ctx, 111 /*trace_id*/);
-      im.inference((index++) % num_inflight_batches);
-      runtime->end_trace(ctx, 111 /*trace_id*/);
+      runtime->begin_trace(ctx, 111 + index % num_devices /*trace_id*/);
+      im.inference(index);
+      runtime->end_trace(ctx, 111 + index % num_devices /*trace_id*/);
+      index++;
     }
-    processed_requests += iterations;
+    processed_requests += nreqs;
   }
 
   ///////////////////////////////////////////////////////////////////////////////////
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index bb2a70e8a8..dacf6b3f28 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -35,6 +35,8 @@ class InferenceManager {
   FFModel *model;
   int max_num_requests_per_batch;
   int max_num_inflight_batches;
+  int num_devices;
+  std::vector<MachineView> machine_views;
 };
 
 } // namespace FlexFlow
diff --git a/include/flexflow/operator.h b/include/flexflow/operator.h
index 280df29f83..a76ad9a018 100644
--- a/include/flexflow/operator.h
+++ b/include/flexflow/operator.h
@@ -187,7 +187,8 @@ class Op {
   virtual void init(FFModel const &) = 0;
   virtual void init_inference(FFModel const &,
                               std::vector<ParallelTensor> const &,
-                              std::vector<ParallelTensor> const &) {
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) {
     assert(false);
   };
   virtual void forward(FFModel const &) = 0;
@@ -254,12 +255,21 @@ class Op {
 #endif
 protected:
   void set_argumentmap_for_init(FFModel const &ff, Legion::ArgumentMap &argmap);
+  void set_argumentmap_for_init_inference(FFModel const &ff,
+                                          Legion::ArgumentMap &argmap,
+                                          MachineView const *view);
   void set_argumentmap_for_forward(FFModel const &ff,
                                    Legion::ArgumentMap &argmap);
+  void set_argumentmap_for_inference(FFModel const &ff,
+                                     Legion::ArgumentMap &argmap,
+                                     MachineView const *view);
   void set_argumentmap_for_backward(FFModel const &ff,
                                     Legion::ArgumentMap &argmap);
   void set_opmeta_from_futuremap(FFModel const &ff,
                                  Legion::FutureMap const &fm);
+  void set_opmeta_from_futuremap_inference(FFModel const &ff,
+                                           Legion::FutureMap const &fm,
+                                           MachineView const *view);
   void solve_parallel_dim_mappings(
       std::vector<ParallelDim const *> const &inputs,
       std::vector<ParallelDim *> const &weights,
@@ -279,6 +289,7 @@ class Op {
   ParallelParameter weights[MAX_NUM_WEIGHTS];
   bool trainableInputs[MAX_NUM_INPUTS];
   OpMeta *meta[MAX_NUM_WORKERS];
+  std::map<size_t, OpMeta *[MAX_NUM_WORKERS]> inference_meta;
   int numInputs, numWeights, numOutputs;
   bool profiling;
 #ifdef FF_USE_NCCL
diff --git a/include/flexflow/ops/aggregate.h b/include/flexflow/ops/aggregate.h
index 4d6aaeccb9..098e10d8e8 100644
--- a/include/flexflow/ops/aggregate.h
+++ b/include/flexflow/ops/aggregate.h
@@ -37,7 +37,8 @@ class Aggregate : public Op {
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
                       std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &) override;
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void inference(FFModel const &,
                  std::vector<ParallelTensor> const &,
diff --git a/include/flexflow/ops/aggregate_spec.h b/include/flexflow/ops/aggregate_spec.h
index 2792ce58a4..a80606d761 100644
--- a/include/flexflow/ops/aggregate_spec.h
+++ b/include/flexflow/ops/aggregate_spec.h
@@ -29,7 +29,8 @@ class AggregateSpec : public Op {
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
                       std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &) override;
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void inference(FFModel const &,
                  std::vector<ParallelTensor> const &,
diff --git a/include/flexflow/ops/attention.h b/include/flexflow/ops/attention.h
index 684e29e910..baf4c06d48 100644
--- a/include/flexflow/ops/attention.h
+++ b/include/flexflow/ops/attention.h
@@ -66,7 +66,8 @@ class MultiHeadAttention : public Op {
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
                       std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &) override;
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   void inference(FFModel const &,
diff --git a/include/flexflow/ops/element_binary.h b/include/flexflow/ops/element_binary.h
index 1116519e8c..6e7edce223 100644
--- a/include/flexflow/ops/element_binary.h
+++ b/include/flexflow/ops/element_binary.h
@@ -27,7 +27,8 @@ class ElementBinary : public Op {
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
                       std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &) override;
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   void inference(FFModel const &,
diff --git a/include/flexflow/ops/experts.h b/include/flexflow/ops/experts.h
index 57d6153d0e..cd66618a07 100644
--- a/include/flexflow/ops/experts.h
+++ b/include/flexflow/ops/experts.h
@@ -56,7 +56,8 @@ class Experts : public Op {
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
                       std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &) override;
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   void inference(FFModel const &,
diff --git a/include/flexflow/ops/groupby.h b/include/flexflow/ops/groupby.h
index 0b8a001f67..0acc241a9b 100644
--- a/include/flexflow/ops/groupby.h
+++ b/include/flexflow/ops/groupby.h
@@ -36,7 +36,8 @@ class Group_by : public Op {
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
                       std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &) override;
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   void inference(FFModel const &,
diff --git a/include/flexflow/ops/layer_norm.h b/include/flexflow/ops/layer_norm.h
index 3a81fe50f1..dac230e410 100644
--- a/include/flexflow/ops/layer_norm.h
+++ b/include/flexflow/ops/layer_norm.h
@@ -26,7 +26,8 @@ class LayerNorm : public Op {
   void init(FFModel const &);
   void init_inference(FFModel const &,
                       std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &) override;
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void forward(FFModel const &);
   void backward(FFModel const &);
   void inference(FFModel const &,
diff --git a/include/flexflow/ops/linear.h b/include/flexflow/ops/linear.h
index fb2767a590..ccd5724dc5 100644
--- a/include/flexflow/ops/linear.h
+++ b/include/flexflow/ops/linear.h
@@ -37,7 +37,8 @@ class Linear : public Op {
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
                       std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &) override;
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   void inference(FFModel const &,
diff --git a/include/flexflow/ops/noop.h b/include/flexflow/ops/noop.h
index 688ab083df..a38d2945ca 100644
--- a/include/flexflow/ops/noop.h
+++ b/include/flexflow/ops/noop.h
@@ -19,7 +19,8 @@ class NoOp : public Op {
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
                       std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &) override;
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void inference(FFModel const &,
                  std::vector<ParallelTensor> const &,
diff --git a/include/flexflow/ops/softmax.h b/include/flexflow/ops/softmax.h
index c1d3ebdba2..de9ad56b45 100644
--- a/include/flexflow/ops/softmax.h
+++ b/include/flexflow/ops/softmax.h
@@ -23,7 +23,8 @@ class Softmax : public Op {
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
                       std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &) override;
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void inference(FFModel const &,
                  std::vector<ParallelTensor> const &,
diff --git a/include/flexflow/ops/topk.h b/include/flexflow/ops/topk.h
index 9c82930822..5e8b515672 100644
--- a/include/flexflow/ops/topk.h
+++ b/include/flexflow/ops/topk.h
@@ -30,7 +30,8 @@ class TopK : public Op {
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
                       std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &) override;
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   void inference(FFModel const &,
diff --git a/include/flexflow/parallel_ops/partition.h b/include/flexflow/parallel_ops/partition.h
index d940841eb4..f25bc83276 100644
--- a/include/flexflow/parallel_ops/partition.h
+++ b/include/flexflow/parallel_ops/partition.h
@@ -31,7 +31,8 @@ class Repartition : public ParallelOp {
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
                       std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &) override;
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void inference(FFModel const &,
                  std::vector<ParallelTensor> const &,
diff --git a/src/ops/aggregate.cc b/src/ops/aggregate.cc
index 458a58b3fe..02fc971768 100644
--- a/src/ops/aggregate.cc
+++ b/src/ops/aggregate.cc
@@ -182,16 +182,18 @@ Node Aggregate::deserialize(FFModel &ff,
   return ff.get_or_create_node<Aggregate>(inputs, params);
 }
 
-void Aggregate::init_inference(
-    FFModel const &ff,
-    std::vector<ParallelTensor> const &batch_inputs,
-    std::vector<ParallelTensor> const &batch_outputs) {
+void Aggregate::init_inference(FFModel const &ff,
+                               std::vector<ParallelTensor> const &batch_inputs,
+                               std::vector<ParallelTensor> const &batch_outputs,
+                               MachineView const *mv) {
   assert(check_output_input_weight_same_parallel_is());
   parallel_is = batch_outputs[0]->parallel_is;
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
-  set_argumentmap_for_init(ff, argmap);
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, view);
   IndexLauncher launcher(AGGREGATE_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(Aggregate)),
@@ -199,10 +201,10 @@ void Aggregate::init_inference(
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
-                         batch_outputs[0]->machine_view.hash());
+                         machine_view_hash);
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap(ff, fm);
+  set_opmeta_from_futuremap_inference(ff, fm, view);
 }
 
 void Aggregate::init(FFModel const &ff) {
@@ -289,9 +291,12 @@ void Aggregate::inference(FFModel const &ff,
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
-  set_argumentmap_for_init(ff, argmap);
-  parallel_is = outputs[0]->parallel_is;
-  size_t machine_view_hash = mv ? mv->hash() : outputs[0]->machine_view.hash();
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, view);
+  size_t machine_view_hash = view->hash();
+  /* std::cout << "Aggregate op machine_view: " << *(MachineView const *)mv
+            << std::endl; */
   IndexLauncher launcher(AGGREGATE_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(nullptr, 0),
diff --git a/src/ops/aggregate_spec.cc b/src/ops/aggregate_spec.cc
index a206610095..21d429594e 100644
--- a/src/ops/aggregate_spec.cc
+++ b/src/ops/aggregate_spec.cc
@@ -158,13 +158,16 @@ AggregateSpec::AggregateSpec(FFModel &model,
 void AggregateSpec::init_inference(
     FFModel const &ff,
     std::vector<ParallelTensor> const &batch_inputs,
-    std::vector<ParallelTensor> const &batch_outputs) {
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
   assert(check_output_input_weight_same_parallel_is());
   parallel_is = batch_outputs[0]->parallel_is;
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
-  set_argumentmap_for_init(ff, argmap);
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, view);
   IndexLauncher launcher(AGG_SPEC_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(AggregateSpec)),
@@ -172,10 +175,10 @@ void AggregateSpec::init_inference(
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
-                         batch_outputs[0]->machine_view.hash());
+                         machine_view_hash);
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap(ff, fm);
+  set_opmeta_from_futuremap_inference(ff, fm, view);
 }
 
 void AggregateSpec::init(FFModel const &ff) {
@@ -262,9 +265,12 @@ void AggregateSpec::inference(FFModel const &ff,
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
-  set_argumentmap_for_init(ff, argmap);
-  parallel_is = outputs[0]->parallel_is;
-  size_t machine_view_hash = mv ? mv->hash() : outputs[0]->machine_view.hash();
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, view);
+  size_t machine_view_hash = view->hash();
+  /* std::cout << "AggregateSpec op machine_view: " << *(MachineView const *)mv
+            << std::endl; */
   IndexLauncher launcher(AGG_SPEC_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
diff --git a/src/ops/attention.cc b/src/ops/attention.cc
index 8f5043e49e..e04440d77e 100644
--- a/src/ops/attention.cc
+++ b/src/ops/attention.cc
@@ -375,13 +375,16 @@ MultiHeadAttention::MultiHeadAttention(
 void MultiHeadAttention::init_inference(
     FFModel const &ff,
     std::vector<ParallelTensor> const &batch_inputs,
-    std::vector<ParallelTensor> const &batch_outputs) {
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
   assert(check_output_input_weight_same_parallel_is());
   parallel_is = batch_outputs[0]->parallel_is;
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
-  set_argumentmap_for_init(ff, argmap);
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, view);
   IndexLauncher launcher(ATTENTION_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(MultiHeadAttention)),
@@ -389,7 +392,7 @@ void MultiHeadAttention::init_inference(
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
-                         batch_outputs[0]->machine_view.hash());
+                         machine_view_hash);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
@@ -422,7 +425,7 @@ void MultiHeadAttention::init_inference(
   launcher.add_field(4, FID_DATA);
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap(ff, fm);
+  set_opmeta_from_futuremap_inference(ff, fm, view);
 }
 
 void MultiHeadAttention::init(FFModel const &ff) {
@@ -584,10 +587,14 @@ void MultiHeadAttention::inference(
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
-  set_argumentmap_for_forward(ff, argmap);
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, view);
+  size_t machine_view_hash = view->hash();
+  /* std::cout << "MultiHeadAttention op machine_view: " << *(MachineView const
+     *)mv
+            << std::endl; */
   int idx = 0;
-  size_t machine_view_hash =
-      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
   IndexLauncher launcher(ATTENTION_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
diff --git a/src/ops/element_binary.cc b/src/ops/element_binary.cc
index ab4df2826a..acd7f4fdca 100644
--- a/src/ops/element_binary.cc
+++ b/src/ops/element_binary.cc
@@ -249,7 +249,8 @@ void ElementBinary::do_inplace_output(void) {
 void ElementBinary::init_inference(
     FFModel const &ff,
     std::vector<ParallelTensor> const &batch_inputs,
-    std::vector<ParallelTensor> const &batch_outputs) {
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
   // Check if we have the same oprands
   has_same_operands = (batch_inputs[0]->region == batch_inputs[1]->region);
   assert(check_output_input_weight_same_parallel_is());
@@ -257,7 +258,9 @@ void ElementBinary::init_inference(
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
-  set_argumentmap_for_init(ff, argmap);
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, view);
   IndexLauncher launcher(ELEMENTBINARY_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(ElementBinary)),
@@ -265,7 +268,7 @@ void ElementBinary::init_inference(
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
-                         batch_outputs[0]->machine_view.hash());
+                         machine_view_hash);
   int rid = 0;
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
@@ -308,7 +311,7 @@ void ElementBinary::init_inference(
   //}
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap(ff, fm);
+  set_opmeta_from_futuremap_inference(ff, fm, view);
 }
 
 void ElementBinary::init(FFModel const &ff) {
@@ -496,9 +499,12 @@ void ElementBinary::inference(FFModel const &ff,
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
-  set_argumentmap_for_forward(ff, argmap);
-  size_t machine_view_hash =
-      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, view);
+  size_t machine_view_hash = view->hash();
+  /* std::cout << "ElementBinary op machine_view: " << *(MachineView const *)mv
+            << std::endl; */
   IndexLauncher launcher(ELEMENTBINARY_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index 9c60a5e212..afd7bff3c9 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -429,13 +429,16 @@ Node Experts::deserialize(FFModel &ff,
 
 void Experts::init_inference(FFModel const &ff,
                              std::vector<ParallelTensor> const &batch_inputs,
-                             std::vector<ParallelTensor> const &batch_outputs) {
+                             std::vector<ParallelTensor> const &batch_outputs,
+                             MachineView const *mv) {
   assert(check_output_input_weight_same_parallel_is());
   parallel_is = batch_outputs[0]->parallel_is;
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
-  set_argumentmap_for_init(ff, argmap);
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, view);
   IndexLauncher launcher(EXPERTS_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(Experts)),
@@ -443,7 +446,7 @@ void Experts::init_inference(FFModel const &ff,
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
-                         batch_outputs[0]->machine_view.hash());
+                         machine_view_hash);
   // expert predictions
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
@@ -491,7 +494,7 @@ void Experts::init_inference(FFModel const &ff,
   }
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap(ff, fm);
+  set_opmeta_from_futuremap_inference(ff, fm, view);
 }
 
 void Experts::init(FFModel const &ff) {
@@ -646,9 +649,12 @@ void Experts::inference(FFModel const &ff,
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
-  set_argumentmap_for_forward(ff, argmap);
-  size_t machine_view_hash =
-      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, view);
+  size_t machine_view_hash = view->hash();
+  /* std::cout << "Experts op machine_view: " << *(MachineView const *)mv
+            << std::endl; */
   IndexLauncher launcher(EXPERTS_INF_TASK_ID,
                          parallel_is,
                          TaskArgument(nullptr, 0),
@@ -813,7 +819,7 @@ void Experts::inference_task(Task const *task,
       assert(bias_domain.hi()[0] - bias_domain.lo()[0] + 1 == out_dim);
     }
   }
-
+  return;
   Experts::forward_kernel_wrapper(m,
                                   input_ptr,
                                   indices_ptr,
diff --git a/src/ops/group_by.cc b/src/ops/group_by.cc
index f6e05945a6..e5d720ba31 100644
--- a/src/ops/group_by.cc
+++ b/src/ops/group_by.cc
@@ -164,16 +164,18 @@ Group_by::Group_by(FFModel &model,
     : Group_by(
           model, inputs.first, inputs.second, params.n, params.alpha, name) {}
 
-void Group_by::init_inference(
-    FFModel const &ff,
-    std::vector<ParallelTensor> const &batch_inputs,
-    std::vector<ParallelTensor> const &batch_outputs) {
+void Group_by::init_inference(FFModel const &ff,
+                              std::vector<ParallelTensor> const &batch_inputs,
+                              std::vector<ParallelTensor> const &batch_outputs,
+                              MachineView const *mv) {
   assert(check_output_input_weight_same_parallel_is());
   parallel_is = batch_outputs[0]->parallel_is;
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
-  set_argumentmap_for_init(ff, argmap);
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, view);
   IndexLauncher launcher(GROUP_BY_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(Group_by)),
@@ -181,7 +183,7 @@ void Group_by::init_inference(
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
-                         batch_outputs[0]->machine_view.hash());
+                         machine_view_hash);
   // data
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
@@ -209,7 +211,7 @@ void Group_by::init_inference(
   }
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap(ff, fm);
+  set_opmeta_from_futuremap_inference(ff, fm, view);
 }
 
 void Group_by::init(FFModel const &ff) {
@@ -318,6 +320,8 @@ void Group_by::inference(FFModel const &ff,
   Runtime *runtime = ff.config.lg_hlr;
   size_t machine_view_hash =
       mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  /* std::cout << "GroupBy op machine_view: " << *(MachineView const *)mv
+            << std::endl; */
   IndexLauncher launcher(GROUP_BY_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index 11b1185b1c..56c2bec1fc 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -194,16 +194,18 @@ LayerNorm::LayerNorm(FFModel &model,
   return;
 }
 
-void LayerNorm::init_inference(
-    FFModel const &ff,
-    std::vector<ParallelTensor> const &batch_inputs,
-    std::vector<ParallelTensor> const &batch_outputs) {
+void LayerNorm::init_inference(FFModel const &ff,
+                               std::vector<ParallelTensor> const &batch_inputs,
+                               std::vector<ParallelTensor> const &batch_outputs,
+                               MachineView const *mv) {
   assert(check_output_input_weight_same_parallel_is());
   parallel_is = batch_outputs[0]->parallel_is;
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
-  set_argumentmap_for_init(ff, argmap);
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, view);
   IndexLauncher launcher(LAYERNORM_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(LayerNorm)),
@@ -211,7 +213,7 @@ void LayerNorm::init_inference(
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
-                         batch_outputs[0]->machine_view.hash());
+                         machine_view_hash);
   launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
                                                     0 /*projection id*/,
                                                     WRITE_ONLY,
@@ -226,7 +228,7 @@ void LayerNorm::init_inference(
   launcher.add_field(1, FID_DATA);
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap(ff, fm);
+  set_opmeta_from_futuremap_inference(ff, fm, view);
 }
 
 void LayerNorm::init(FFModel const &ff) {
@@ -320,9 +322,12 @@ void LayerNorm::inference(FFModel const &ff,
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
-  set_argumentmap_for_forward(ff, argmap);
-  size_t machine_view_hash =
-      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, view);
+  size_t machine_view_hash = view->hash();
+  /* std::cout << "LayerNorm op machine_view: " << *(MachineView const *)mv
+            << std::endl; */
   IndexLauncher launcher(LAYERNORM_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index fe9a3925a7..c7308bae15 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -256,14 +256,17 @@ void Linear::init(FFModel const &ff) {
 
 void Linear::init_inference(FFModel const &ff,
                             std::vector<ParallelTensor> const &batch_inputs,
-                            std::vector<ParallelTensor> const &batch_outputs) {
+                            std::vector<ParallelTensor> const &batch_outputs,
+                            MachineView const *mv) {
   assert(check_output_input_weight_same_parallel_is());
   // assert(check_output_input_weight_same_machine_view());
   parallel_is = batch_outputs[0]->parallel_is;
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
-  set_argumentmap_for_init(ff, argmap);
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, view);
   IndexLauncher launcher(LINEAR_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(Linear)),
@@ -271,7 +274,7 @@ void Linear::init_inference(FFModel const &ff,
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
-                         batch_outputs[0]->machine_view.hash());
+                         machine_view_hash);
   // launcher.add_region_requirement(
   //     RegionRequirement(input_lps[0], 0/*projection id*/,
   //                       READ_ONLY, EXCLUSIVE, inputs[0]->region));
@@ -301,7 +304,7 @@ void Linear::init_inference(FFModel const &ff,
   }
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap(ff, fm);
+  set_opmeta_from_futuremap_inference(ff, fm, view);
 }
 
 /*
@@ -424,9 +427,12 @@ void Linear::inference(FFModel const &ff,
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
-  set_argumentmap_for_forward(ff, argmap);
-  size_t machine_view_hash =
-      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, view);
+  size_t machine_view_hash = view->hash();
+  /* std::cout << "Linear op machine_view: " << *(MachineView const *)mv
+            << std::endl; */
   IndexLauncher launcher(LINEAR_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(nullptr, 0),
diff --git a/src/ops/noop.cc b/src/ops/noop.cc
index 91e890ed9f..46968acb03 100644
--- a/src/ops/noop.cc
+++ b/src/ops/noop.cc
@@ -97,9 +97,12 @@ OpMeta *NoOp::init_task(Task const *task,
 
 void NoOp::init_inference(FFModel const &ff,
                           std::vector<ParallelTensor> const &batch_inputs,
-                          std::vector<ParallelTensor> const &batch_outputs) {
+                          std::vector<ParallelTensor> const &batch_outputs,
+                          MachineView const *mv) {
   parallel_is = batch_outputs[0]->parallel_is;
   assert(parallel_is != IndexSpace::NO_SPACE);
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
   if (op_type == OP_INPUT && batch_outputs[0]->initializer != nullptr) {
     ConstantInitializer *initializer =
         (ConstantInitializer *)batch_outputs[0]->initializer;
@@ -114,7 +117,7 @@ void NoOp::init_inference(FFModel const &ff,
         Predicate::TRUE_PRED,
         false /*must*/,
         0 /*mapper_id*/,
-        batch_outputs[0]->machine_view.hash());
+        machine_view_hash);
     launcher.add_region_requirement(
         RegionRequirement(batch_outputs[0]->part,
                           0 /*projection id*/,
@@ -148,7 +151,7 @@ void NoOp::init_inference(FFModel const &ff,
         Predicate::TRUE_PRED,
         false /*must*/,
         0 /*mapper_id*/,
-        batch_outputs[0]->machine_view.hash());
+        machine_view_hash);
     launcher.add_region_requirement(
         RegionRequirement(batch_outputs[0]->part,
                           0 /*projection id*/,
@@ -161,7 +164,7 @@ void NoOp::init_inference(FFModel const &ff,
     ArgumentMap argmap;
     Context ctx = ff.config.lg_ctx;
     Runtime *runtime = ff.config.lg_hlr;
-    set_argumentmap_for_init(ff, argmap);
+    set_argumentmap_for_init_inference(ff, argmap, view);
     IndexLauncher launcher(NOOP_INIT_TASK_ID,
                            parallel_is,
                            TaskArgument(NULL, 0),
@@ -169,10 +172,10 @@ void NoOp::init_inference(FFModel const &ff,
                            Predicate::TRUE_PRED,
                            false /*must*/,
                            0 /*mapper_id*/,
-                           batch_outputs[0]->machine_view.hash());
+                           machine_view_hash);
     FutureMap fm = runtime->execute_index_space(ctx, launcher);
     fm.wait_all_results();
-    set_opmeta_from_futuremap(ff, fm);
+    set_opmeta_from_futuremap_inference(ff, fm, view);
   }
 }
 
diff --git a/src/ops/softmax.cc b/src/ops/softmax.cc
index b07ae0ad68..389cd8a678 100644
--- a/src/ops/softmax.cc
+++ b/src/ops/softmax.cc
@@ -117,13 +117,16 @@ Softmax::Softmax(FFModel &model,
 
 void Softmax::init_inference(FFModel const &ff,
                              std::vector<ParallelTensor> const &batch_inputs,
-                             std::vector<ParallelTensor> const &batch_outputs) {
+                             std::vector<ParallelTensor> const &batch_outputs,
+                             MachineView const *mv) {
   assert(check_output_input_weight_same_parallel_is());
   parallel_is = batch_outputs[0]->parallel_is;
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
-  set_argumentmap_for_init(ff, argmap);
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, view);
   IndexLauncher launcher(SOFTMAX_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(Softmax)),
@@ -131,7 +134,7 @@ void Softmax::init_inference(FFModel const &ff,
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
-                         batch_outputs[0]->machine_view.hash());
+                         machine_view_hash);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
@@ -146,7 +149,7 @@ void Softmax::init_inference(FFModel const &ff,
   launcher.add_field(1, FID_DATA);
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap(ff, fm);
+  set_opmeta_from_futuremap_inference(ff, fm, view);
 }
 
 void Softmax::init(FFModel const &ff) {
@@ -229,9 +232,12 @@ void Softmax::inference(FFModel const &ff,
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
-  set_argumentmap_for_forward(ff, argmap);
-  size_t machine_view_hash =
-      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, view);
+  size_t machine_view_hash = view->hash();
+  /* std::cout << "Softmax op machine_view: " << *(MachineView const *)mv
+            << std::endl; */
   IndexLauncher launcher(SOFTMAX_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
diff --git a/src/ops/topk.cc b/src/ops/topk.cc
index b260902cd7..3763514685 100644
--- a/src/ops/topk.cc
+++ b/src/ops/topk.cc
@@ -138,13 +138,16 @@ TopK::TopK(FFModel &model,
 
 void TopK::init_inference(FFModel const &ff,
                           std::vector<ParallelTensor> const &batch_inputs,
-                          std::vector<ParallelTensor> const &batch_outputs) {
+                          std::vector<ParallelTensor> const &batch_outputs,
+                          MachineView const *mv) {
   assert(check_output_input_weight_same_parallel_is());
   parallel_is = batch_outputs[0]->parallel_is;
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
-  set_argumentmap_for_init(ff, argmap);
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, view);
   IndexLauncher launcher(TOPK_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(TopK)),
@@ -152,7 +155,7 @@ void TopK::init_inference(FFModel const &ff,
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
-                         batch_outputs[0]->machine_view.hash());
+                         machine_view_hash);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
@@ -173,7 +176,7 @@ void TopK::init_inference(FFModel const &ff,
   launcher.add_field(2, FID_DATA);
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap(ff, fm);
+  set_opmeta_from_futuremap_inference(ff, fm, view);
 }
 
 void TopK::init(FFModel const &ff) {
@@ -267,9 +270,12 @@ void TopK::inference(FFModel const &ff,
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
-  set_argumentmap_for_forward(ff, argmap);
-  size_t machine_view_hash =
-      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, view);
+  size_t machine_view_hash = view->hash();
+  /* std::cout << "TopK op machine_view: " << *(MachineView const *)mv
+            << std::endl; */
   IndexLauncher launcher(TOPK_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
diff --git a/src/parallel_ops/partition.cc b/src/parallel_ops/partition.cc
index 6f808a3978..7fdf9a8e4a 100644
--- a/src/parallel_ops/partition.cc
+++ b/src/parallel_ops/partition.cc
@@ -104,13 +104,16 @@ OpMeta *Repartition::init_task(Task const *task,
 void Repartition::init_inference(
     FFModel const &ff,
     std::vector<ParallelTensor> const &batch_inputs,
-    std::vector<ParallelTensor> const &batch_outputs) {
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
   ArgumentMap argmap;
   parallel_is = batch_outputs[0]->parallel_is;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
   assert(numOutputs == 1);
   assert(numInputs == 1);
+  size_t machine_view_hash =
+      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
   IndexLauncher launcher(REPARTITION_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(nullptr, 0),
@@ -118,7 +121,7 @@ void Repartition::init_inference(
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
-                         batch_outputs[0]->machine_view.hash());
+                         machine_view_hash);
   assert(inference_input_lps.find(batch_inputs[0]) !=
          inference_input_lps.end());
   launcher.add_region_requirement(
@@ -209,6 +212,8 @@ void Repartition::inference(FFModel const &ff,
   DataType data_type = batch_inputs[0]->data_type;
   size_t machine_view_hash =
       mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  /* std::cout << "Partition op machine_view: " << *(MachineView const *)mv
+            << std::endl; */
   IndexLauncher launcher(REPARTITION_FWD_TASK_ID,
                          batch_outputs[0]->parallel_is,
                          TaskArgument(&data_type, sizeof(DataType)),
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index 66accf7195..47f8ac9d09 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -1798,6 +1798,18 @@ void FFModel::register_all_machine_views(
       valid_views.push_back(view);
     }
   }
+  // No-parallelism views
+  for (int i = 1; i <= num_nodes * gpus_per_node; i++) {
+    if (num_nodes * gpus_per_node % i == 0) {
+      MachineView view;
+      view.device_type = MachineView::GPU;
+      view.ndims = 1;
+      view.dim[0] = i;
+      view.stride[0] = 0;
+      view.start_device_id = 0;
+      valid_views.push_back(view);
+    }
+  }
   // Two-dimensional views
   /* for (int i = 1; i <= num_nodes; i++) { */
   /*   for (int j = 1; j <= gpus_per_node; j++) { */
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 8f926da316..e3e4bd9b07 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -24,7 +24,19 @@ InferenceManager::InferenceManager(FFModel *_model,
                                    int _max_num_requests_per_batch,
                                    int _max_num_inflight_batches)
     : model(_model), max_num_requests_per_batch(_max_num_requests_per_batch),
-      max_num_inflight_batches(_max_num_inflight_batches) {}
+      max_num_inflight_batches(_max_num_inflight_batches) {
+  // populate array of valid single-device machine views
+  num_devices = model->config.workersPerNode * model->config.numNodes;
+  for (int i = 0; i < num_devices; i++) {
+    MachineView view;
+    view.device_type = MachineView::GPU;
+    view.ndims = 1;
+    view.dim[0] = 1;
+    view.stride[0] = 0;
+    view.start_device_id = i;
+    machine_views.push_back(view);
+  }
+}
 
 void InferenceManager::compile_model_and_allocate_buffer(void) {
   std::vector<MetricsType> metrics;
@@ -59,61 +71,88 @@ void InferenceManager::compile_model_and_allocate_buffer(void) {
 }
 
 void InferenceManager::init_operators_inference() {
-  for (int index = 0; index < max_num_inflight_batches; index++) {
-    for (size_t o = 0; o < model->operators.size(); o++) {
-      Op *op = model->operators[o];
-      if (op->op_type == OP_WEIGHT) {
-        continue;
-      }
-      std::vector<ParallelTensor> inputs(op->numInputs);
-      std::vector<ParallelTensor> outputs(op->numOutputs);
-      for (int i = 0; i < op->numInputs; i++) {
-        assert(op->inputs[i] != nullptr);
-        assert(op->inputs[i]->parallel_is != IndexSpace::NO_SPACE);
-        assert(tensor_buffer[op->inputs[i]].size() > index);
-        inputs[i] = tensor_buffer[op->inputs[i]][index];
-        assert(inputs[i]->parallel_is != IndexSpace::NO_SPACE);
-      }
-      for (int i = 0; i < op->numOutputs; i++) {
-        assert(op->outputs[i] != nullptr);
-        assert(op->outputs[i]->parallel_is != IndexSpace::NO_SPACE);
-        assert(tensor_buffer[op->outputs[i]].size() > index);
-        outputs[i] = tensor_buffer[op->outputs[i]][index];
-        assert(outputs[i]->parallel_is != IndexSpace::NO_SPACE);
+  for (int batch_index = 0; batch_index < max_num_inflight_batches;
+       batch_index++) {
+    for (int device_index = 0; device_index < num_devices; device_index++) {
+      // int fused_experts_index = 0;
+      for (size_t o = 0; o < model->operators.size(); o++) {
+        Op *op = model->operators[o];
+        if (op->op_type == OP_WEIGHT) {
+          continue;
+        }
+        MachineView *view;
+        // if (op->op_type == OP_EXPERTS) {
+        //   if (fused_experts_index != device_index) {
+        //     fused_experts_index++;
+        //     continue;
+        //   }
+        //   view = &machine_views[fused_experts_index];
+        //   fused_experts_index++;
+        // } else {
+        view = &machine_views[device_index];
+        //}
+        std::vector<ParallelTensor> inputs(op->numInputs);
+        std::vector<ParallelTensor> outputs(op->numOutputs);
+        for (int i = 0; i < op->numInputs; i++) {
+          assert(op->inputs[i] != nullptr);
+          assert(op->inputs[i]->parallel_is != IndexSpace::NO_SPACE);
+          assert(tensor_buffer[op->inputs[i]].size() > batch_index);
+          inputs[i] = tensor_buffer[op->inputs[i]][batch_index];
+          assert(inputs[i]->parallel_is != IndexSpace::NO_SPACE);
+        }
+        for (int i = 0; i < op->numOutputs; i++) {
+          assert(op->outputs[i] != nullptr);
+          assert(op->outputs[i]->parallel_is != IndexSpace::NO_SPACE);
+          assert(tensor_buffer[op->outputs[i]].size() > batch_index);
+          outputs[i] = tensor_buffer[op->outputs[i]][batch_index];
+          assert(outputs[i]->parallel_is != IndexSpace::NO_SPACE);
+        }
+        if (op->is_parallel_op()) {
+          ((ParallelOp *)op)
+              ->create_input_partition_inference(*model, inputs, outputs);
+        }
+        op->init_inference(*model, inputs, outputs, view);
       }
-      if (op->is_parallel_op()) {
-        ((ParallelOp *)op)
-            ->create_input_partition_inference(*model, inputs, outputs);
-      }
-      op->init_inference(*model, inputs, outputs);
     }
   }
 }
 
 void InferenceManager::inference(int index) {
-  assert(index < max_num_inflight_batches);
+  int batch_index = index % max_num_inflight_batches;
+  int device_index = index % num_devices;
+  int expert_device_index = 0;
   for (size_t o = 0; o < model->operators.size(); o++) {
     Op *op = model->operators[o];
     if (op->op_type == OP_WEIGHT) {
       continue;
     }
+
+    MachineView *view;
+    if (op->op_type == OP_EXPERTS) {
+      view = &machine_views[expert_device_index];
+      expert_device_index = (expert_device_index + 1) % num_devices;
+    } else {
+      // pick mv w startdeviceid = device_index
+      view = &machine_views[device_index];
+    }
+
     std::vector<ParallelTensor> inputs(op->numInputs);
     std::vector<ParallelTensor> outputs(op->numOutputs);
     for (int i = 0; i < op->numInputs; i++) {
       assert(op->inputs[i] != nullptr);
       assert(op->inputs[i]->parallel_is != IndexSpace::NO_SPACE);
-      assert(tensor_buffer[op->inputs[i]].size() > index);
-      inputs[i] = tensor_buffer[op->inputs[i]][index];
+      assert(tensor_buffer[op->inputs[i]].size() > batch_index);
+      inputs[i] = tensor_buffer[op->inputs[i]][batch_index];
       assert(inputs[i]->parallel_is != IndexSpace::NO_SPACE);
     }
     for (int i = 0; i < op->numOutputs; i++) {
       assert(op->outputs[i] != nullptr);
       assert(op->outputs[i]->parallel_is != IndexSpace::NO_SPACE);
-      assert(tensor_buffer[op->outputs[i]].size() > index);
-      outputs[i] = tensor_buffer[op->outputs[i]][index];
+      assert(tensor_buffer[op->outputs[i]].size() > batch_index);
+      outputs[i] = tensor_buffer[op->outputs[i]][batch_index];
       assert(outputs[i]->parallel_is != IndexSpace::NO_SPACE);
     }
-    op->inference(*model, inputs, outputs);
+    op->inference(*model, inputs, outputs, view);
   }
 };
 
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index dc746dd7f4..39368ba9b0 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -975,6 +975,49 @@ void Op::set_argumentmap_for_init(FFModel const &ff, ArgumentMap &argmap) {
   }
 }
 
+void Op::set_argumentmap_for_init_inference(FFModel const &ff,
+                                            ArgumentMap &argmap,
+                                            MachineView const *view) {
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  Domain domain = runtime->get_index_space_domain(ctx, this->parallel_is);
+  switch (domain.get_dim()) {
+#ifdef FF_USE_NCCL
+#define DIMFUNC(DIM)                                                           \
+  case DIM: {                                                                  \
+    Rect<DIM> rect = domain;                                                   \
+    int idx = 0;                                                               \
+    for (PointInRectIterator<DIM> it(rect); it(); it++) {                      \
+      FFHandler handle = ff.handlers[view->get_device_id(*it)];                \
+      if (ff.config.computationMode == COMP_MODE_TRAINING &&                   \
+          op_type == OP_WEIGHT) {                                              \
+        ncclComm_t *nccl_comms = ff.find_nccl_comms(*view);                    \
+        handle.ncclComm = nccl_comms[idx++];                                   \
+      }                                                                        \
+      argmap.set_point(*it, TaskArgument(&handle, sizeof(FFHandler)));         \
+    }                                                                          \
+    break;                                                                     \
+  }
+    LEGION_FOREACH_N(DIMFUNC)
+#undef DIMFUNC
+#else
+#define DIMFUNC(DIM)                                                           \
+  case DIM: {                                                                  \
+    Rect<DIM> rect = domain;                                                   \
+    for (PointInRectIterator<DIM> it(rect); it(); it++) {                      \
+      FFHandler handle = ff.handlers[view->get_device_id(*it)];                \
+      argmap.set_point(*it, TaskArgument(&handle, sizeof(FFHandler)));         \
+    }                                                                          \
+    break;                                                                     \
+  }
+    LEGION_FOREACH_N(DIMFUNC)
+#undef DIMFUNC
+#endif
+    default:
+      assert(false);
+  }
+}
+
 void Op::set_opmeta_from_futuremap(FFModel const &ff, FutureMap const &fm) {
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
@@ -996,6 +1039,29 @@ void Op::set_opmeta_from_futuremap(FFModel const &ff, FutureMap const &fm) {
   }
 }
 
+void Op::set_opmeta_from_futuremap_inference(FFModel const &ff,
+                                             FutureMap const &fm,
+                                             MachineView const *view) {
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  Domain domain = runtime->get_index_space_domain(ctx, parallel_is);
+  switch (domain.get_dim()) {
+#define DIMFUNC(DIM)                                                           \
+  case DIM: {                                                                  \
+    Rect<DIM> rect = domain;                                                   \
+    int idx = 0;                                                               \
+    for (PointInRectIterator<DIM> it(rect); it(); it++) {                      \
+      inference_meta[view->hash()][idx++] = fm.get_result<OpMeta *>(*it);      \
+    }                                                                          \
+    break;                                                                     \
+  }
+    LEGION_FOREACH_N(DIMFUNC)
+#undef DIMFUNC
+    default:
+      assert(false);
+  }
+}
+
 void Op::set_argumentmap_for_forward(FFModel const &ff, ArgumentMap &argmap) {
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
@@ -1018,6 +1084,30 @@ void Op::set_argumentmap_for_forward(FFModel const &ff, ArgumentMap &argmap) {
   }
 }
 
+void Op::set_argumentmap_for_inference(FFModel const &ff,
+                                       ArgumentMap &argmap,
+                                       MachineView const *view) {
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  Domain domain = runtime->get_index_space_domain(ctx, parallel_is);
+  switch (domain.get_dim()) {
+#define DIMFUNC(DIM)                                                           \
+  case DIM: {                                                                  \
+    Rect<DIM> rect = domain;                                                   \
+    int idx = 0;                                                               \
+    for (PointInRectIterator<DIM> it(rect); it(); it++) {                      \
+      OpMeta *mp = inference_meta[view->hash()][idx++];                        \
+      argmap.set_point(*it, TaskArgument(&mp, sizeof(OpMeta *)));              \
+    }                                                                          \
+    break;                                                                     \
+  }
+    LEGION_FOREACH_N(DIMFUNC)
+#undef DIMFUNC
+    default:
+      assert(false);
+  }
+}
+
 void Op::set_argumentmap_for_backward(FFModel const &ff, ArgumentMap &argmap) {
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
@@ -2631,7 +2721,8 @@ Op *FFModel::create_operator_from_layer(
       assert(tensor->parallel_tensor == nullptr);
       tensor->parallel_tensor = pt;
       // start from data parllel tensor
-      if (config.only_data_parallel) {
+      if (config.only_data_parallel &&
+          config.computationMode == COMP_MODE_TRAINING) {
         Repartition *part = new Repartition(
             *this, pt, num_dims - 1, config.numNodes * config.workersPerNode);
         operators.push_back(part);

From b23a1dcba62dc99dd8bc05751fc4f0e8663a5275 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 20 Feb 2023 21:14:38 -0500
Subject: [PATCH 060/344] [Inference] - Updated dataloader & integrated with
 data generator (#630)

* integration of data generator with data loader

* bug fixes

* fixes

* add infernece moe to c++  test

* workflow fix
---
 .github/workflows/gpu-ci.yml                  |   3 +
 CMakeLists.txt                                |   6 +-
 config/config.linux                           |   2 +-
 .../cpp/inference/MLP_Unify/CMakeLists.txt    |  15 -
 examples/cpp/inference/MLP_Unify/Makefile     |  39 --
 examples/cpp/inference/MLP_Unify/mlp.cc       | 146 ------
 examples/cpp/inference/MLP_Unify/mlp.h        |  61 ---
 examples/cpp/inference/data_generator.cc      | 103 +++++
 examples/cpp/inference/data_generator.cpp     |  47 +-
 examples/cpp/inference/data_generator.h       | 137 ++----
 .../mixture_of_experts/CMakeLists.txt         |   6 +-
 .../cpp/inference/mixture_of_experts/Makefile |   4 +-
 .../mixture_of_experts/dataloader.cc          | 388 ++++++++++++++++
 .../mixture_of_experts/dataloader.cu          | 115 +++++
 .../cpp/inference/mixture_of_experts/moe.cc   | 416 ++----------------
 .../cpp/inference/mixture_of_experts/moe.cu   |  78 ----
 .../cpp/inference/mixture_of_experts/moe.h    |  71 ++-
 src/loss_functions/loss_functions.cu          |  14 +-
 src/runtime/inference_manager.cc              |   4 +
 tests/cpp_gpu_tests.sh                        |   4 +
 20 files changed, 778 insertions(+), 881 deletions(-)
 delete mode 100644 examples/cpp/inference/MLP_Unify/CMakeLists.txt
 delete mode 100644 examples/cpp/inference/MLP_Unify/Makefile
 delete mode 100644 examples/cpp/inference/MLP_Unify/mlp.cc
 delete mode 100644 examples/cpp/inference/MLP_Unify/mlp.h
 create mode 100644 examples/cpp/inference/data_generator.cc
 create mode 100644 examples/cpp/inference/mixture_of_experts/dataloader.cc
 create mode 100644 examples/cpp/inference/mixture_of_experts/dataloader.cu
 delete mode 100644 examples/cpp/inference/mixture_of_experts/moe.cu

diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index 13b9fbb6f0..2a46e7d498 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -62,6 +62,7 @@ jobs:
         run: |
           export PATH=/opt/conda/bin:$PATH
           export FF_HOME=$(pwd)
+          export FF_USE_PREBUILT_LEGION=OFF #remove this after fixing python path issue in Legion
           mkdir build
           cd build
           ../config/config.linux
@@ -77,6 +78,7 @@ jobs:
         run: |
           export PATH=/opt/conda/bin:$PATH
           export FF_HOME=$(pwd)
+          export FF_USE_PREBUILT_LEGION=OFF #remove this after fixing python path issue in Legion
           cd build
           ../config/config.linux
           make install
@@ -108,6 +110,7 @@ jobs:
           export PATH=/opt/conda/bin:$PATH
           export FF_HOME=$(pwd)
           export FF_BUILD_ALL_EXAMPLES=ON
+          export FF_USE_PREBUILT_LEGION=OFF #remove this after fixing python path issue in Legion
           pip install . --verbose
 
       - name: Check FlexFlow Python interface (pip)
diff --git a/CMakeLists.txt b/CMakeLists.txt
index 8c27008b58..10542011df 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -378,10 +378,6 @@ if(FF_BUILD_MLP_UNIFY OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/MLP_Unify)
 endif()
 
-# if(FF_BUILD_MLP_UNIFY OR FF_BUILD_ALL_INFERENCE_EXAMPLES)
-#   add_subdirectory(examples/cpp/inference/MLP_Unify)
-# endif()
-
 if(FF_BUILD_SPLIT_TEST OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/split_test)
 endif()
@@ -421,7 +417,7 @@ if(FF_BUILD_MOE OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/mixture_of_experts)
 endif()
 
-if(FF_BUILD_MOE OR FF_BUILD_ALL_INFERENCE_EXAMPLES)
+if(FF_BUILD_MOE OR FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/inference/mixture_of_experts)
 endif()
 
diff --git a/config/config.linux b/config/config.linux
index 28cf7c2fe1..86e8f8b647 100755
--- a/config/config.linux
+++ b/config/config.linux
@@ -46,7 +46,7 @@ FF_BUILD_UNIT_TESTS=${FF_BUILD_UNIT_TESTS:-OFF}
 
 # use precompiled NCCL and Legion libraries, where available
 FF_USE_PREBUILT_NCCL=${FF_USE_PREBUILT_NCCL:-ON}
-FF_USE_PREBUILT_LEGION=${FF_USE_PREBUILT_LEGION:-ON}
+FF_USE_PREBUILT_LEGION=${FF_USE_PREBUILT_LEGION:-OFF}
 # use the flag below to use both the NCCL and Legion pre-built libraries.
 # when the flag below is set to ON, the two flags above are ignored.
 FF_USE_ALL_PREBUILT_LIBRARIES=${FF_USE_ALL_PREBUILT_LIBRARIES:-OFF}
diff --git a/examples/cpp/inference/MLP_Unify/CMakeLists.txt b/examples/cpp/inference/MLP_Unify/CMakeLists.txt
deleted file mode 100644
index e83d292efc..0000000000
--- a/examples/cpp/inference/MLP_Unify/CMakeLists.txt
+++ /dev/null
@@ -1,15 +0,0 @@
-cmake_minimum_required(VERSION 3.10)
-
-project(FlexFlowExampleInference_MLPUnify)
-set(project_target mlp_inference_unify)
-
-set(CPU_SRC
-  ${FLEXFLOW_CPP_DRV_SRC}
-  mlp.cc
-  mlp.h
-  ../data_generator.h)
-
-cuda_add_executable(${project_target} ${CPU_SRC})
-target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/examples/cpp/inference)
-target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
-target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
diff --git a/examples/cpp/inference/MLP_Unify/Makefile b/examples/cpp/inference/MLP_Unify/Makefile
deleted file mode 100644
index 9798c4f18a..0000000000
--- a/examples/cpp/inference/MLP_Unify/Makefile
+++ /dev/null
@@ -1,39 +0,0 @@
-# Copyright 2021 CMU, Facebook, LANL, MIT, and Stanford (alphabetical)
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-#     http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-#
-
-# Flags for directing the runtime makefile what to include
-DEBUG           ?= 1		# Include debugging symbols
-MAX_DIM         ?= 5		# Maximum number of dimensions
-OUTPUT_LEVEL    ?= LEVEL_DEBUG	# Compile time logging level
-USE_CUDA        ?= 0		# Include CUDA support (requires CUDA)
-USE_GASNET      ?= 0		# Include GASNet support (requires GASNet)
-USE_HDF         ?= 0		# Include HDF5 support (requires HDF5)
-ALT_MAPPERS     ?= 0		# Include alternative mappers (not recommended)
-USE_HIP         ?= 1		# Include HIP support (requires HIP)
-HIP_TARGET      ?= ROCM
-USE_GPU_REDUCTIONS ?= 0
-
-# Put the binary file name here
-OUTFILE		?= mlp_inference
-# List all the application source files here
-GEN_SRC		= mlp.cc
-GEN_GPU_SRC	=
-GEN_HIP_SRC     =
-
-ifndef FF_HOME
-$(error FF_HOME variable is not defined, aborting build)
-endif
-
-include $(FF_HOME)/FlexFlow.mk
diff --git a/examples/cpp/inference/MLP_Unify/mlp.cc b/examples/cpp/inference/MLP_Unify/mlp.cc
deleted file mode 100644
index 7631af0445..0000000000
--- a/examples/cpp/inference/MLP_Unify/mlp.cc
+++ /dev/null
@@ -1,146 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "mlp.h"
-#include "data_generator.h"
-#include "flexflow/inference.h"
-#include <fstream>
-#include <sstream>
-#include <string>
-
-using namespace Legion;
-using namespace FlexFlow;
-
-Tensor create_mlp(FFModel *model,
-                  MLPConfig const *mlpConfig,
-                  Tensor const &input1,
-                  Tensor const &input2) {
-  Tensor t1 = input1, t2 = input2;
-  for (int i = 0; i < mlpConfig->hidden_dims.size(); i++) {
-    int const dims[] = {mlpConfig->hidden_dims[i], t1->dims[0]};
-    ActiMode acti_mode =
-        (i + 1 == mlpConfig->hidden_dims.size()) ? AC_MODE_NONE : AC_MODE_RELU;
-    t1 = model->dense(t1, mlpConfig->hidden_dims[i], acti_mode, false);
-    t2 = model->dense(t2, mlpConfig->hidden_dims[i], acti_mode, false);
-  }
-  Tensor t = model->add(t1, t2);
-  return model->softmax(t);
-}
-
-void FlexFlow::top_level_task(Task const *task,
-                              std::vector<PhysicalRegion> const &regions,
-                              Context ctx,
-                              Runtime *runtime) {
-
-  // Inference parameters
-  int total_requests =
-      256; // total number of requests processed as part of the simulation
-  int request_tensor_size = 4; // request tensor dimensions
-  bool poisson_distribution = true;
-  double lambda = 25; // average number of request arrivals per second
-  int num_requests_per_batch = 5;
-  int num_inflight_batches = 10;
-
-  // MLP parameters
-  int embedding_size = 1024;
-  int sequence_length = 512;
-  std::vector<int> hidden_dims = {
-      8192, 8192, 8192, 8192, 8192, 8192, 8192, 8192};
-
-  FFConfig ffConfig;
-  ffConfig.batchSize = 1;
-  {
-    fprintf(stderr,
-            "batchSize(%d) workersPerNodes(%d) numNodes(%d)\n",
-            ffConfig.batchSize,
-            ffConfig.workersPerNode,
-            ffConfig.numNodes);
-  }
-  FFModel ff(ffConfig);
-  MLPConfig mlpConfig(embedding_size, sequence_length, hidden_dims);
-  {
-    stringstream hd;
-    hd << '{';
-    for (int i = 0; i < hidden_dims.size(); i++) {
-      if (i != 0) {
-        hd << ",";
-      }
-      hd << hidden_dims[i];
-    }
-    hd << '}';
-    fprintf(stderr,
-            "embedding_size(%d) sequence_length(%d) hidden_dims(%s)\n",
-            mlpConfig.embedding_size,
-            mlpConfig.sequence_length,
-            hd.str().c_str());
-  }
-
-  Tensor input1, input2;
-  {
-    int const dims[] = {total_requests,
-                        mlpConfig.sequence_length * mlpConfig.embedding_size};
-    input1 = ff.create_tensor<2>(dims, DT_FLOAT);
-    input2 = ff.create_tensor<2>(dims, DT_FLOAT);
-  }
-  Tensor t = create_mlp(&ff, &mlpConfig, input1, input2);
-
-  InferenceManager im(&ff, num_requests_per_batch, num_inflight_batches);
-  // im.compile_model_and_allocate_buffer();
-  ff.init_operators();
-
-  // Start timer
-  {
-    runtime->issue_execution_fence(ctx);
-    TimingLauncher timer(MEASURE_MICRO_SECONDS);
-    Future future = runtime->issue_timing_measurement(ctx, timer);
-    future.get_void_result();
-  }
-  double ts_start = Realm::Clock::current_time_in_microseconds();
-
-  ///////////////////////////////////////////////////////////////////////////////////
-
-  // Main loop, processing requests as they come (from the generator)
-  int index = 0;
-  int processed_requests = 0;
-  Generator data_generator(
-      total_requests, request_tensor_size, poisson_distribution, lambda);
-  while (processed_requests < total_requests) {
-    vector<vector<double>> req = data_generator.get_requests();
-    int iterations = req.size();
-    for (int iter = 0; iter < iterations; iter++) {
-      runtime->begin_trace(ctx, 111 /*trace_id*/);
-      im.inference((index++) % num_inflight_batches);
-      runtime->end_trace(ctx, 111 /*trace_id*/);
-    }
-    processed_requests += iterations;
-  }
-
-  ///////////////////////////////////////////////////////////////////////////////////
-
-  // End timer
-  {
-    runtime->issue_execution_fence(ctx);
-    TimingLauncher timer(MEASURE_MICRO_SECONDS);
-    Future future = runtime->issue_timing_measurement(ctx, timer);
-    future.get_void_result();
-  }
-  double ts_end = Realm::Clock::current_time_in_microseconds();
-  double run_time = 1e-6 * (ts_end - ts_start);
-  printf("ELAPSED TIME = %.4fs, THROUGHPUT = %.2f samples/s\n",
-         run_time,
-         ffConfig.batchSize * 128 * ffConfig.epochs / run_time);
-}
-
-void FlexFlow::register_custom_tasks() {}
diff --git a/examples/cpp/inference/MLP_Unify/mlp.h b/examples/cpp/inference/MLP_Unify/mlp.h
deleted file mode 100644
index 7cd2f30430..0000000000
--- a/examples/cpp/inference/MLP_Unify/mlp.h
+++ /dev/null
@@ -1,61 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "flexflow/inference.h"
-#include "flexflow/model.h"
-using namespace Legion;
-using namespace std;
-using namespace FlexFlow;
-
-#define MAX_NUM_SAMPLES 1024000
-
-struct MLPConfig {
-  MLPConfig(void);
-  MLPConfig(int embedding_size,
-            int sequence_length,
-            std::vector<int> hidden_dims)
-      : embedding_size(embedding_size), sequence_length(sequence_length),
-        hidden_dims(hidden_dims) {}
-
-  int embedding_size, sequence_length;
-  std::vector<int> hidden_dims;
-};
-
-class DataLoader {
-public:
-  DataLoader(FFModel &ff,
-             MLPConfig const &mlpConfig,
-             InferenceManager const *im,
-             Tensor input);
-  /*static void load_input(Task const *task,
-                         std::vector<PhysicalRegion> const &regions,
-                         Context ctx,
-                         Runtime *runtime);*/
-  static void load_entire_dataset(Task const *task,
-                                  std::vector<PhysicalRegion> const &regions,
-                                  Context ctx,
-                                  Runtime *runtime);
-  void next_batch(FFModel &);
-  void reset(void);
-
-public:
-  int num_samples, next_index;
-  Tensor full_input, batch_input;
-};
-
-struct SampleIdxs {
-  int num_samples;
-  int idxs[MAX_NUM_SAMPLES];
-};
\ No newline at end of file
diff --git a/examples/cpp/inference/data_generator.cc b/examples/cpp/inference/data_generator.cc
new file mode 100644
index 0000000000..ec168f6f51
--- /dev/null
+++ b/examples/cpp/inference/data_generator.cc
@@ -0,0 +1,103 @@
+#include "data_generator.h"
+#include <algorithm>
+#include <iostream>
+#include <vector>
+using namespace std;
+
+DataGenerator::DataGenerator(size_t _num_requests,
+                             size_t _token_dim,
+                             size_t _sequence_length,
+                             bool _poisson_distr,
+                             double _lambda)
+    : num_requests(_num_requests), token_dim(_token_dim),
+      sequence_length(_sequence_length), poisson_distr(_poisson_distr),
+      lambda(_lambda), timer_started(false) {
+  generate_arrival_times();
+};
+
+void DataGenerator::generate_requests(float *req_ptr,
+                                      int *label_ptr,
+                                      int num_labels) {
+  assert(req_ptr != nullptr);
+  /* for (size_t i=0; i<num_requests; i++) {
+    for (size_t j=0; j<sequence_length; j++) {
+      for (size_t k=0; k<token_dim; k++) {
+        req_ptr[i * sequence_length + j] = (float)std::rand()/RAND_MAX;
+      }
+    }
+  } */
+  random_device rnd_device;
+  mt19937 mersenne_engine{rnd_device()};
+
+  uniform_real_distribution<float> float_dist{0, 1.0};
+  auto gen = [&float_dist, &mersenne_engine]() {
+    return float_dist(mersenne_engine);
+  };
+  std::generate(
+      req_ptr, req_ptr + token_dim * sequence_length * num_requests, gen);
+
+  if (label_ptr != nullptr) {
+    assert(num_labels > 0);
+    /* for (size_t i=0; i<num_requests; i++) {
+      for (size_t j=0; j<sequence_length; j++) {
+        label_ptr[i * sequence_length + j] = std::rand() % num_labels;
+      }
+    } */
+    uniform_int_distribution<int> int_dist{0, num_labels};
+    auto gen_label = [&int_dist, &mersenne_engine]() {
+      return int_dist(mersenne_engine);
+    };
+    std::generate(
+        label_ptr, label_ptr + sequence_length * num_requests, gen_label);
+  }
+};
+
+void DataGenerator::generate_arrival_times(void) {
+  // set up a uniform number generator with range [0,1)
+  random_device rnd;
+  mt19937 gen(rnd());
+  uniform_real_distribution<double> dist{0, 1.0};
+  double cur_arrival = 0; // assume first request comes in at time 0
+
+  for (size_t i = 0; i < num_requests; i++) {
+    arrivals.push_back(cur_arrival);
+    if (poisson_distr) {
+      double u = dist(gen);
+      double interval = -(1 / lambda) * log(1 - u) * 1000;
+      cur_arrival += interval;
+    } else {
+      cur_arrival += (1000 / lambda);
+    }
+  }
+  // cout << "Arrivals : [";
+  // copy(arrivals.begin(), arrivals.end(), ostream_iterator<int>(cout, " "));
+  // cout << "]" << endl;
+};
+
+void DataGenerator::start_timer(void) {
+  arrivals_ptr = arrivals.begin();
+  start_time = Clock::now();
+  timer_started = true;
+};
+
+size_t DataGenerator::get_requests(void) {
+  if (!timer_started) {
+    std::cout << "Warning: tried to get number of requests before the timer "
+                 "was started."
+              << std::endl;
+    return 0;
+  }
+  Clock::time_point cur_time = Clock::now();
+  size_t ms_from_start =
+      chrono::duration_cast<milliseconds>(cur_time - start_time).count();
+  vector<double>::iterator new_arrivals_ptr =
+      upper_bound(arrivals_ptr, arrivals.end(), ms_from_start);
+  size_t received_requests = new_arrivals_ptr - arrivals_ptr;
+  arrivals_ptr = new_arrivals_ptr;
+  if (received_requests > 0) {
+    std::cout << "received " << received_requests
+              << " request(s) by arrival time +" << ms_from_start << "ms"
+              << "\n";
+  }
+  return received_requests;
+}
diff --git a/examples/cpp/inference/data_generator.cpp b/examples/cpp/inference/data_generator.cpp
index 7429fdb159..9aeb9b49a9 100644
--- a/examples/cpp/inference/data_generator.cpp
+++ b/examples/cpp/inference/data_generator.cpp
@@ -12,26 +12,49 @@
 #include <unistd.h>
 using namespace std;
 
-// This is for running the dataloader standalone
+// This is for testing the request generator standalone
 int main(int argc, char const *argv[]) {
-  // insert code here...
-  cout << "Hello, World!\n";
-  Generator data_generator(10, 4, true, 1);
 
-  vector<vector<double>> req0 = data_generator.get_requests();
-  print_requests(req0);
+  cout << "Starting the Data DataGenerator!\n";
+
+  // DataGenerator parameters
+  size_t total_requests = 256;
+  size_t token_dim = 16;
+  size_t sequence_length = 20;
+  bool use_poisson_distr = true;
+  // average number of request arrivals per second
+  double lambda = 25;
+  int label_dims = 10;
+
+  float *requests = (float *)calloc(
+      token_dim * sequence_length * total_requests, sizeof(float));
+  int *labels = (int *)calloc(sequence_length * total_requests, sizeof(int));
+
+  DataGenerator data_generator(
+      total_requests, token_dim, sequence_length, use_poisson_distr, lambda);
+  data_generator.generate_requests(requests, labels, label_dims);
+  data_generator.start_timer();
+
+  size_t received_requests = data_generator.get_requests();
+  std::cout << "t=0ms: received " << received_requests << std::endl;
 
   this_thread::sleep_for(milliseconds(1200));
-  vector<vector<double>> req1200 = data_generator.get_requests();
-  print_requests(req1200);
+  received_requests = data_generator.get_requests();
+  std::cout << "t=1200ms: received " << received_requests << std::endl;
 
   this_thread::sleep_for(milliseconds(10));
-  vector<vector<double>> req1210 = data_generator.get_requests();
-  print_requests(req1210);
+  received_requests = data_generator.get_requests();
+  std::cout << "t=1210ms: received " << received_requests << std::endl;
 
   this_thread::sleep_for(milliseconds(4000));
-  vector<vector<double>> req5210 = data_generator.get_requests();
-  print_requests(req5210);
+  received_requests = data_generator.get_requests();
+  std::cout << "t=5210ms: received " << received_requests << std::endl;
+  this_thread::sleep_for(milliseconds(5000));
+  received_requests = data_generator.get_requests();
+  std::cout << "t=10210ms: received " << received_requests << std::endl;
+
+  free(requests);
+  free(labels);
 
   return 0;
 }
diff --git a/examples/cpp/inference/data_generator.h b/examples/cpp/inference/data_generator.h
index 98af050a98..e651881902 100644
--- a/examples/cpp/inference/data_generator.h
+++ b/examples/cpp/inference/data_generator.h
@@ -1,6 +1,9 @@
+#pragma once
+#include <cassert>
 #include <chrono>
 #include <ctime>
 #include <iostream>
+#include <iterator>
 #include <math.h>
 #include <random>
 #include <thread>
@@ -9,109 +12,39 @@ using namespace std;
 typedef std::chrono::high_resolution_clock Clock;
 typedef std::chrono::milliseconds milliseconds;
 
-class Generator {
+class DataGenerator {
 public:
-  size_t num_requests; // total number of requests
-  size_t tensor_size;  // dimension of one request tensor
-  bool poisson;        // false implied uniform distribution
-  double lambda;       // mean #num of arrivals per sec
-
-  Generator(size_t req, size_t tensor, bool poi, double lamb) {
-    num_requests = req;
-    tensor_size = tensor;
-    poisson = poi;
-    lambda = lamb;
-    compute_distribution();
-    arrivals_ptr = arrivals.begin();
-    timer_started = false;
-  }
-
-  vector<vector<double>> get_requests(void); // function to retrieve requests
+  DataGenerator(size_t _num_requests,
+                size_t _token_dim,
+                size_t _sequence_length,
+                bool _poisson_distr,
+                double _lambda);
+
+  // Generate random requests by filling each token with random data. For now,
+  // assume all requests have the same sequence length. Also generate random
+  // labels (if label_ptr != nullptr and num_labels >0).
+  void generate_requests(float *req_ptr,
+                         int *label_ptr = nullptr,
+                         int num_labels = 0);
+  void start_timer(void);
+  // Get number of requests that have arrived since the last time this function
+  // was called
+  size_t get_requests(void);
 
 private:
-  bool timer_started; // tracks if start time has been initiated
-  Clock::time_point
-      start_time; // time when get_requests() is called for the first time
-  vector<double> arrivals; // arrival times (ms) generated based on distribution
-  vector<double>::iterator arrivals_ptr; // next request to output
-
-  void compute_distribution(void);        // populate arrivals
-  vector<double> get_random_tensor(void); // generate a random tensor
-};
-
-void Generator::compute_distribution(void) {
-  // set up uniform number generator [0,1)
-  random_device rnd;
-  mt19937 gen(rnd());
-  uniform_real_distribution<double> dist{0, 1.0};
-  double cur_arrival = 0; // assume first request comes in at time 0
-
-  for (size_t i = 0; i < num_requests; i++) {
-    arrivals.push_back(cur_arrival);
-    cout << "arrival time " << i << ": +" << cur_arrival << "ms \n";
-
-    if (poisson) {
-      double u = dist(gen);
-      double interval = -(1 / lambda) * log(1 - u) * 1000;
-      cur_arrival += interval;
-    } else {
-      cur_arrival += (1000 / lambda);
-    }
-  }
-  return;
-};
-
-vector<vector<double>> Generator::get_requests(void) {
-  Clock::time_point cur_time = Clock::now();
-  vector<vector<double>> requests;
-  if (!timer_started) {
-    // simply return one request and start timer for the first call
-    start_time = Clock::now();
-    timer_started = true;
-    arrivals_ptr++;
-    requests.push_back(get_random_tensor());
-    return requests;
-  }
-
-  // output requests till we reach current timestamp
-  milliseconds ms_from_start =
-      chrono::duration_cast<milliseconds>(cur_time - start_time);
-  while (arrivals_ptr < arrivals.end() &&
-         ms_from_start.count() >= *arrivals_ptr) {
-    cout << "request at arrival time +" << *arrivals_ptr << "\n";
-    requests.push_back(get_random_tensor());
-    arrivals_ptr++;
-  }
-  return requests;
-};
-
-// template <class ForwardIt, class Generator>
-// void generate(ForwardIt first, ForwardIt last, Generator gen) {
-//   while (first != last) {
-//     *first++ = gen();
-//   }
-// }
-
-vector<double> Generator::get_random_tensor(void) {
-  random_device rnd_device;
-  mt19937 mersenne_engine{rnd_device()};
-  uniform_real_distribution<double> dist{0, 1.0}; // state distribution
-
-  auto gen = [&dist, &mersenne_engine]() { return dist(mersenne_engine); };
-
-  vector<double> vec(tensor_size);
-  generate(begin(vec), end(vec), gen);
-  return vec;
-};
-
-// for debugging
-void print_requests(vector<vector<double>> req) {
-  cout << "printing requests\n";
-  for (vector<double> v : req) {
-    for (double e : v) {
-      cout << e << ",";
-    }
-    cout << "\n";
-  }
-  cout << "\n";
+  // Compute the arrival times of each request and save them in the arrivals
+  // vector.
+  void generate_arrival_times(void);
+
+  size_t num_requests;    // total number of requests
+  size_t token_dim;       // embedding dim of each token
+  size_t sequence_length; // dimension of one request tensor
+  bool poisson_distr;     // false implies uniform distribution
+  double lambda;          // mean #num of arrivals per sec
+  bool timer_started;     // whether timer was initiated
+  // time when get_requests() is called for the first time
+  Clock::time_point start_time;
+  // arrival times (ms) generated based on distribution
+  vector<double> arrivals;
+  vector<double>::iterator arrivals_ptr;
 };
diff --git a/examples/cpp/inference/mixture_of_experts/CMakeLists.txt b/examples/cpp/inference/mixture_of_experts/CMakeLists.txt
index ee1c063b18..81c4c184b4 100644
--- a/examples/cpp/inference/mixture_of_experts/CMakeLists.txt
+++ b/examples/cpp/inference/mixture_of_experts/CMakeLists.txt
@@ -6,11 +6,11 @@ set(project_target inference_moe)
 set(CPU_SRC
   ${FLEXFLOW_CPP_DRV_SRC}
   moe.cc
-  moe.h
-  ../data_generator.h)
+  dataloader.cc
+  ../data_generator.cc)
 
 set(GPU_SRC
-  moe.cu)
+  dataloader.cu)
 
 cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
 target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
diff --git a/examples/cpp/inference/mixture_of_experts/Makefile b/examples/cpp/inference/mixture_of_experts/Makefile
index a9eb401850..15fbf25b9a 100644
--- a/examples/cpp/inference/mixture_of_experts/Makefile
+++ b/examples/cpp/inference/mixture_of_experts/Makefile
@@ -25,8 +25,8 @@ ALT_MAPPERS     ?= 0		# Include alternative mappers (not recommended)
 # Put the binary file name here
 OUTFILE		?= inference_moe
 # List all the application source files here
-GEN_SRC		= moe.cc
-GEN_GPU_SRC	= moe.cu
+GEN_SRC		= moe.cc dataloader.cc ../data_generator.cc
+GEN_GPU_SRC	= dataloader.cu
 
 ifndef FF_HOME
 $(error FF_HOME variable is not defined, aborting build)
diff --git a/examples/cpp/inference/mixture_of_experts/dataloader.cc b/examples/cpp/inference/mixture_of_experts/dataloader.cc
new file mode 100644
index 0000000000..557fe4e095
--- /dev/null
+++ b/examples/cpp/inference/mixture_of_experts/dataloader.cc
@@ -0,0 +1,388 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/inference.h"
+#include "moe.h"
+#include <cstdlib>
+#include <fstream>
+#include <iostream>
+#include <sstream>
+#include <string>
+#include <unistd.h>
+
+using namespace Legion;
+
+DataLoader::DataLoader(FFModel &ff,
+                       MoeConfig const &moeConfig,
+                       DataGenerator &data_generator,
+                       ParallelTensor input,
+                       ParallelTensor label) {
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+
+  int numdims = input->num_dims;
+  int replica_idx = numdims - 1;
+  int batch_idx = numdims - 2;
+  num_samples = moeConfig.total_requests;
+
+  // Create full input
+  {
+    batch_input = input;
+
+    ParallelDim dims[numdims];
+    for (int i = 0; i < numdims; i++) {
+      dims[i].size = input->dims[i].size;
+      dims[i].degree = 1;
+      dims[i].parallel_idx = -1;
+      dims[i].is_replica_dim = input->dims[i].is_replica_dim;
+      // Assume only the first dim can be the replica dim
+      assert(i == replica_idx || (!dims[i].is_replica_dim));
+    }
+    assert(dims[batch_idx].size == ff.config.batchSize);
+    dims[batch_idx].size = num_samples;
+
+    full_input =
+        ff.create_parallel_tensor_legion_ordering(numdims, dims, DT_FLOAT);
+    ff.map_tensor(full_input, NULL /*parallel_op*/);
+  }
+
+  // Create full label
+  {
+    assert(label->num_dims == numdims);
+    batch_label = label;
+
+    ParallelDim dims[numdims];
+    for (int i = 0; i < numdims; i++) {
+      dims[i].size = label->dims[i].size;
+      dims[i].degree = 1;
+      dims[i].parallel_idx = -1;
+      dims[i].is_replica_dim = label->dims[i].is_replica_dim;
+      // Assume only the last dim can be the replica dim
+      assert(i == replica_idx || (!dims[i].is_replica_dim));
+    }
+    assert(dims[batch_idx].size == ff.config.batchSize);
+    // replace batch size with number of samples
+    dims[batch_idx].size = num_samples;
+
+    full_label =
+        ff.create_parallel_tensor_legion_ordering(numdims, dims, DT_INT32);
+    ff.map_tensor(full_label, NULL /*parallel_op*/);
+  }
+
+  // Load entire dataset
+  // TODO: Use index launcher instead of task launcher
+  assert(full_input != nullptr && "full_input is nullptr");
+  assert(full_label != nullptr && "full_label is nullptr");
+
+  DataLoaderInput dataloader_input = {moeConfig, data_generator};
+  DataLoaderInput const *ptr = &dataloader_input;
+
+  TaskLauncher launcher(CUSTOM_CPU_TASK_ID_1,
+                        TaskArgument(ptr, sizeof(DataLoaderInput)));
+  // regions[0]: full_input
+  launcher.add_region_requirement(RegionRequirement(full_input->region,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    full_input->region,
+                                                    MAP_TO_ZC_MEMORY));
+  launcher.add_field(0, FID_DATA);
+  // regions[1]: full_label
+  launcher.add_region_requirement(RegionRequirement(full_label->region,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    full_label->region,
+                                                    MAP_TO_ZC_MEMORY));
+  launcher.add_field(1, FID_DATA);
+
+  runtime->execute_task(ctx, launcher);
+  reset();
+}
+
+// =================================================
+//                    Load data
+// =================================================
+
+void read_cifar100(float *input_ptr, int *label_ptr) {
+  std::ifstream file;
+  file.open("train.bin", std::ios::in | std::ios::binary | std::ios::ate);
+  if (!file) {
+    std::cout << "Error opening CIFAR100 train data file" << std::endl;
+    assert(false);
+  }
+
+  file.seekg(0, std::ios::beg);
+
+  // each sample: <1 x coarse label><1 x fine label><3072 x pixel>
+  for (std::size_t i = 0; i < MAX_NUM_SAMPLES; i++) {
+    unsigned char temp = 0;
+    file.read((char *)&temp, sizeof(temp)); // coarse label, skip
+    file.read((char *)&temp, sizeof(temp));
+    label_ptr[i] = temp;
+    for (std::size_t j = 0; j < 3072; ++j) {
+      file.read((char *)&temp, sizeof(temp));
+      input_ptr[i * 3072 + j] = (float)temp / 255.0f;
+    }
+  }
+
+  file.close();
+}
+
+int reverseInt(int i) {
+  unsigned char c1, c2, c3, c4;
+
+  c1 = i & 255;
+  c2 = (i >> 8) & 255;
+  c3 = (i >> 16) & 255;
+  c4 = (i >> 24) & 255;
+
+  return ((int)c1 << 24) + ((int)c2 << 16) + ((int)c3 << 8) + c4;
+}
+
+/* NOTE: Download files from http://yann.lecun.com/exdb/mnist/ and unpack to
+the current working directory */
+void read_mnist(float *input_ptr, int *label_ptr) {
+  // read inputs
+  std::ifstream input("train-images-idx3-ubyte", std::ios::binary);
+  if (input.is_open()) {
+    int magic_number = 0;
+    int number_of_images = 0;
+    int n_rows = 0;
+    int n_cols = 0;
+    input.read((char *)&magic_number, sizeof(magic_number));
+    magic_number = reverseInt(magic_number);
+    input.read((char *)&number_of_images, sizeof(number_of_images));
+    number_of_images = reverseInt(number_of_images);
+    input.read((char *)&n_rows, sizeof(n_rows));
+    n_rows = reverseInt(n_rows);
+    input.read((char *)&n_cols, sizeof(n_cols));
+    n_cols = reverseInt(n_cols);
+
+    for (int i = 0; i < number_of_images; i++) {
+      for (int r = 0; r < n_rows; r++) {
+        for (int c = 0; c < n_cols; c++) {
+          unsigned char temp = 0;
+          input.read((char *)&temp, sizeof(temp));
+          input_ptr[i * n_rows * n_cols + r * n_cols + c] =
+              (float)temp / 255.0f;
+        }
+      }
+    }
+  } else {
+    std::cout << "Error opening MNIST input data file" << std::endl;
+    assert(false);
+  }
+
+  // read labels
+  std::ifstream labels("train-labels-idx1-ubyte", std::ios::binary);
+  if (labels.is_open()) {
+    int magic_number = 0;
+    int number_of_images = 0;
+    labels.read((char *)&magic_number, sizeof(magic_number));
+    magic_number = reverseInt(magic_number);
+    labels.read((char *)&number_of_images, sizeof(number_of_images));
+    number_of_images = reverseInt(number_of_images);
+
+    for (int i = 0; i < number_of_images; i++) {
+      unsigned char temp = 0;
+      labels.read((char *)&temp, sizeof(temp));
+      label_ptr[i] = temp;
+    }
+  } else {
+    std::cout << "Error opening MNIST label data file" << std::endl;
+    assert(false);
+  }
+}
+
+void DataLoader::load_entire_dataset(Task const *task,
+                                     std::vector<PhysicalRegion> const &regions,
+                                     Context ctx,
+                                     Runtime *runtime) {
+  DataLoaderInput const input_struct = *((DataLoaderInput *)task->args);
+  MoeConfig const &conf = input_struct._moeConfig;
+  DataGenerator &datagen = input_struct._data_generator;
+  assert(regions.size() == 2);
+  assert(task->regions.size() == regions.size());
+
+  // get input and label pointer
+  float *input_ptr = helperGetTensorPointerWO<float>(
+      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  int *label_ptr = helperGetTensorPointerWO<int>(
+      regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  Domain input_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  Domain label_domain = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+  int input_dims = input_domain.get_dim();
+  for (int i = 0; i < input_dims; i++) {
+    int input_dim = input_domain.hi()[i] - input_domain.lo()[i] + 1;
+    int label_dim = label_domain.hi()[i] - label_domain.lo()[i] + 1;
+    assert(i == 0 || input_dim == label_dim);
+  }
+
+  if (conf.dataset_path.length() == 0) {
+    printf("Input dataset path is empty, using random input samples\n");
+    datagen.generate_requests(input_ptr, label_ptr, conf.num_labels);
+  } else {
+    // here, you can call `read_cifar100(input_ptr, label_ptr);` instead or load
+    // another dataset using the dataset_path from the MoeConfig object
+    // read_mnist(input_ptr, label_ptr);
+    // log_app.print("finish loading MNIST data\n");
+  }
+}
+
+void DataLoader::next_batch(FFModel &ff, size_t received_requests) {
+  if (received_requests == 0) {
+    return;
+  }
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  // Load input
+  {
+    Domain domain =
+        runtime->get_index_space_domain(ctx, batch_input->parallel_is);
+    ArgumentMap argmap;
+    int counter = 0;
+    // current limitation of the dataloader: only the batch dimension can be
+    // partitioned
+    int input_dims = batch_input->num_dims;
+    for (int i = 0; i < input_dims; i++) {
+      if (i != input_dims - 2) {
+        assert(batch_input->dims[i].degree == 1 &&
+               "Dataloader only supports batch size partitions");
+      }
+    }
+    int batch_size = batch_input->dims[input_dims - 2].size;
+    int n_partitions = batch_input->dims[input_dims - 2].degree;
+    assert(ff.config.batchSize % batch_size == 0);
+    assert(batch_size % n_partitions == 0);
+    for (Domain::DomainPointIterator it(domain); it; it++) {
+      SampleIdxs meta;
+      int requests_left = received_requests - counter;
+      meta.num_samples = std::min(batch_size / n_partitions, requests_left);
+      for (int i = 0; i < meta.num_samples; i++) {
+        meta.idxs[i] = next_index + counter;
+        counter++;
+      }
+      argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
+    }
+    assert(counter == received_requests);
+    IndexLauncher launcher(CUSTOM_GPU_TASK_ID_1,
+                           batch_input->parallel_is,
+                           TaskArgument(NULL, 0),
+                           argmap,
+                           Predicate::TRUE_PRED,
+                           false /*must*/,
+                           0 /*mapper_id*/,
+                           batch_input->machine_view.hash());
+    launcher.add_region_requirement(RegionRequirement(full_input->region,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      full_input->region,
+                                                      MAP_TO_ZC_MEMORY));
+    launcher.add_field(0, FID_DATA);
+    launcher.add_region_requirement(RegionRequirement(batch_input->part,
+                                                      0 /*projection id*/,
+                                                      WRITE_ONLY,
+                                                      EXCLUSIVE,
+                                                      batch_input->region));
+    launcher.add_field(1, FID_DATA);
+    runtime->execute_index_space(ctx, launcher);
+  }
+  // Load label
+  {
+    Domain domain =
+        runtime->get_index_space_domain(ctx, batch_label->parallel_is);
+    ArgumentMap argmap;
+    int counter = 0;
+    // current limitation of the dataloader: only the batch dimension can be
+    // partitioned
+    int label_dims = batch_label->num_dims;
+    // assert(batch_label->dims[label_dims - 1].degree == 1);
+    for (int i = 0; i < label_dims; i++) {
+      assert(batch_label->dims[i].degree == 1 &&
+             "Dataloader only supports batch size partitions");
+    }
+    int batch_size = batch_label->dims[label_dims - 2].size;
+    int n_partitions = batch_label->dims[label_dims - 2].degree;
+    assert(ff.config.batchSize % batch_size == 0);
+    assert(batch_size % n_partitions == 0);
+    for (Domain::DomainPointIterator it(domain); it; it++) {
+      SampleIdxs meta;
+      int requests_left = received_requests - counter;
+      meta.num_samples = std::min(batch_size / n_partitions, requests_left);
+      for (int i = 0; i < meta.num_samples; i++) {
+        meta.idxs[i] = next_index + counter;
+        counter++;
+      }
+      argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
+    }
+    assert(counter == received_requests);
+    IndexLauncher launcher(CUSTOM_GPU_TASK_ID_2,
+                           batch_label->parallel_is,
+                           TaskArgument(NULL, 0),
+                           argmap,
+                           Predicate::TRUE_PRED,
+                           false /*must*/,
+                           0 /*mapper_id*/,
+                           batch_label->machine_view.hash());
+    launcher.add_region_requirement(RegionRequirement(full_label->region,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      full_label->region,
+                                                      MAP_TO_ZC_MEMORY));
+    launcher.add_field(0, FID_DATA);
+    launcher.add_region_requirement(RegionRequirement(batch_label->part,
+                                                      0 /*projection id*/,
+                                                      WRITE_ONLY,
+                                                      EXCLUSIVE,
+                                                      batch_label->region));
+    launcher.add_field(1, FID_DATA);
+    runtime->execute_index_space(ctx, launcher);
+  }
+  next_index += received_requests;
+}
+
+void DataLoader::reset() {
+  next_index = 0;
+}
+
+void FlexFlow::register_custom_tasks() {
+  // Load entire dataset
+  {
+    TaskVariantRegistrar registrar(CUSTOM_CPU_TASK_ID_1, "Load Entire Dataset");
+    registrar.add_constraint(ProcessorConstraint(Processor::LOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<DataLoader::load_entire_dataset>(
+        registrar, "Load Entire Dataset Task");
+  }
+  // Load input
+  {
+    TaskVariantRegistrar registrar(CUSTOM_GPU_TASK_ID_1, "Load Inputs");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<DataLoader::load_input>(
+        registrar, "Load Input Task");
+  }
+  // Load label
+  {
+    TaskVariantRegistrar registrar(CUSTOM_GPU_TASK_ID_2, "Load Labels");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<DataLoader::load_label>(
+        registrar, "Load Label Task");
+  }
+}
diff --git a/examples/cpp/inference/mixture_of_experts/dataloader.cu b/examples/cpp/inference/mixture_of_experts/dataloader.cu
new file mode 100644
index 0000000000..2e234e9b32
--- /dev/null
+++ b/examples/cpp/inference/mixture_of_experts/dataloader.cu
@@ -0,0 +1,115 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/utils/cuda_helper.h"
+#include "moe.h"
+
+void DataLoader::load_input(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+  SampleIdxs *meta = (SampleIdxs *)task->local_args;
+  float const *full_input_ptr = helperGetTensorPointerRO<float>(
+      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  float *batch_input_ptr = helperGetTensorPointerWO<float>(
+      regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  Domain full_input_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  Domain batch_input_domain = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+
+  coord_t token_dim =
+      batch_input_domain.hi()[0] - batch_input_domain.lo()[0] + 1;
+  coord_t sequence_length =
+      batch_input_domain.hi()[1] - batch_input_domain.lo()[1] + 1;
+  coord_t batch_size =
+      batch_input_domain.hi()[2] - batch_input_domain.lo()[2] + 1;
+
+  // FIXME: currently assume continous indices
+  assert(meta->num_samples <= batch_size);
+  for (int i = 1; i < meta->num_samples; i++) {
+    assert(meta->idxs[i] == meta->idxs[0] + i);
+  }
+  // pad inputs if needed (this is really only useful for debugging)
+  if (meta->num_samples < batch_size) {
+    checkCUDA(cudaMemset(batch_input_ptr +
+                             token_dim * sequence_length * meta->num_samples,
+                         0,
+                         token_dim * sequence_length *
+                             (batch_size - meta->num_samples) * sizeof(float)));
+  }
+  coord_t start_idx = meta->idxs[0];
+  assert(batch_input_domain.get_volume() % token_dim * sequence_length *
+             batch_size ==
+         0);
+  assert(batch_input_domain.get_volume() % batch_size == 0);
+  size_t size_to_copy =
+      (batch_input_domain.get_volume() / batch_size) * meta->num_samples;
+  float const *input_zc =
+      full_input_ptr + start_idx * token_dim * sequence_length;
+  copy_kernel<<<GET_BLOCKS(size_to_copy), CUDA_NUM_THREADS>>>(
+      batch_input_ptr, input_zc, size_to_copy);
+  checkCUDA(cudaDeviceSynchronize());
+}
+
+void DataLoader::load_label(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+  SampleIdxs *meta = (SampleIdxs *)task->local_args;
+  int const *full_label_ptr = helperGetTensorPointerRO<int>(
+      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  int *batch_label_ptr = helperGetTensorPointerWO<int>(
+      regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  Domain full_label_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  Domain batch_label_domain = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+  coord_t label_dim =
+      batch_label_domain.hi()[0] - batch_label_domain.lo()[0] + 1;
+  coord_t sequence_length =
+      batch_label_domain.hi()[1] - batch_label_domain.lo()[1] + 1;
+  coord_t batch_size =
+      batch_label_domain.hi()[2] - batch_label_domain.lo()[2] + 1;
+  // FIXME: currently assume continous indices
+  assert(meta->num_samples <= batch_size);
+  for (int i = 1; i < meta->num_samples; i++) {
+    assert(meta->idxs[i] == meta->idxs[0] + i);
+  }
+  if (meta->num_samples < batch_size) {
+    checkCUDA(cudaMemset(batch_label_ptr +
+                             label_dim * sequence_length * meta->num_samples,
+                         0,
+                         label_dim * sequence_length *
+                             (batch_size - meta->num_samples) * sizeof(int)));
+  }
+  assert(batch_label_domain.get_volume() % label_dim * sequence_length *
+             batch_size ==
+         0);
+  assert(batch_label_domain.get_volume() % batch_size == 0);
+  coord_t start_idx = meta->idxs[0];
+  size_t size_to_copy =
+      (batch_label_domain.get_volume() / batch_size) * meta->num_samples;
+  int const *input_zc =
+      full_label_ptr + start_idx * label_dim * sequence_length;
+  copy_kernel<<<GET_BLOCKS(size_to_copy), CUDA_NUM_THREADS>>>(
+      batch_label_ptr, input_zc, size_to_copy);
+  checkCUDA(cudaDeviceSynchronize());
+}
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index 8dc0842e98..0fd4b32d26 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -14,7 +14,6 @@
  */
 
 #include "moe.h"
-#include "data_generator.h"
 #include "flexflow/inference.h"
 #include <cstdlib>
 #include <fstream>
@@ -96,17 +95,7 @@ void FlexFlow::top_level_task(Task const *task,
                               std::vector<PhysicalRegion> const &regions,
                               Context ctx,
                               Runtime *runtime) {
-  // Inference parameters
-  int total_requests =
-      256; // total number of requests processed as part of the simulation
-  int request_tensor_size = 4; // request tensor dimensions
-  bool poisson_distribution = true;
-  double lambda = 25; // average number of request arrivals per second
-  int num_requests_per_batch = 5;
-  int num_inflight_batches = 10;
-
-  //-----------------------------------------------------------------
-
+  //----------------------- Initial configurations ------------------------
   MoeConfig moeConfig;
   FFConfig ffConfig;
   ffConfig.batchSize = moeConfig.batch_size;
@@ -122,32 +111,37 @@ void FlexFlow::top_level_task(Task const *task,
   }
   FFModel ff(ffConfig);
 
+  //----------------------- Create inputs --------------------------------
   Tensor input;
   {
     int const dims[] = {
-        ffConfig.batchSize, moeConfig.sequence_length, DATA_DIMS};
+        ffConfig.batchSize, moeConfig.sequence_length, moeConfig.token_dim};
     input = ff.create_tensor<3>(dims, DT_FLOAT);
   }
 
-  //-----------------------------------------------------------------
-
+  //----------------------- Define the model ------------------------------
   Tensor t = create_moe_encoder(&ff, &moeConfig, input);
   // Tensor t = create_moe(&ff, &moeConfig, input);
-  t = ff.dense(t, OUT_DIM, AC_MODE_RELU);
+  t = ff.dense(t, moeConfig.out_dim, AC_MODE_RELU);
 
-  InferenceManager im(&ff, num_requests_per_batch, num_inflight_batches);
+  //------------------- Initialize the inference manager ------------------
+  InferenceManager im(
+      &ff, moeConfig.batch_size, moeConfig.num_inflight_batches);
   im.compile_model_and_allocate_buffer();
   im.init_operators_inference();
 
-  // Data Loader
-  /* ParallelTensor input_pt, label_pt;
+  //------------ Initialize the data loader and data generator ------------
+  DataGenerator data_generator(moeConfig.total_requests,
+                               moeConfig.token_dim,
+                               moeConfig.sequence_length,
+                               moeConfig.poisson_distribution,
+                               moeConfig.arrival_rate);
+  ParallelTensor input_pt, label_pt;
   ff.get_parallel_tensor_from_tensor(input, input_pt);
   ff.get_parallel_tensor_from_tensor(ff.label_tensor, label_pt);
-  DataLoader data_loader(ff, moeConfig, input_pt, label_pt); */
+  DataLoader data_loader(ff, moeConfig, data_generator, input_pt, label_pt);
 
-  //-----------------------------------------------------------------
-
-  // Start timer
+  //----------------------- Start timer -----------------------------------
   {
     runtime->issue_execution_fence(ctx);
     TimingLauncher timer(MEASURE_MICRO_SECONDS);
@@ -156,34 +150,29 @@ void FlexFlow::top_level_task(Task const *task,
   }
   double ts_start = Realm::Clock::current_time_in_microseconds();
 
-  ///////////////////////////////////////////////////////////////////////////////////
-
+  //----------------------- Begin inference! -------------------------------
   int index = 0;
   int processed_requests = 0;
   int num_devices = ffConfig.workersPerNode * ffConfig.numNodes;
-  Generator data_generator(
-      total_requests, request_tensor_size, poisson_distribution, lambda);
-
-  // data_loader.reset();
-  while (processed_requests < total_requests) {
-    vector<vector<double>> req = data_generator.get_requests();
-    int nreqs = req.size();
-    int iterations = (nreqs % num_requests_per_batch == 0)
-                         ? (nreqs / num_requests_per_batch)
-                         : (nreqs / num_requests_per_batch) + 1;
+  data_loader.reset();
+  data_generator.start_timer();
+  while (processed_requests < moeConfig.total_requests) {
+    size_t received_requests = data_generator.get_requests();
+    int iterations = (received_requests % moeConfig.batch_size == 0)
+                         ? (received_requests / moeConfig.batch_size)
+                         : (received_requests / moeConfig.batch_size) + 1;
     for (int iter = 0; iter < iterations; iter++) {
-      // data_loader.next_batch(ff);
+      data_loader.next_batch(ff, received_requests);
       runtime->begin_trace(ctx, 111 + index % num_devices /*trace_id*/);
       im.inference(index);
       runtime->end_trace(ctx, 111 + index % num_devices /*trace_id*/);
       index++;
     }
-    processed_requests += nreqs;
+    processed_requests += received_requests;
   }
+  //----------------------- End of inference! ------------------------------
 
-  ///////////////////////////////////////////////////////////////////////////////////
-
-  // End timer
+  //----------------------- Stop timer -------------------------------------
   {
     runtime->issue_execution_fence(ctx);
     TimingLauncher timer(MEASURE_MICRO_SECONDS);
@@ -192,350 +181,7 @@ void FlexFlow::top_level_task(Task const *task,
   }
   double ts_end = Realm::Clock::current_time_in_microseconds();
   double run_time = 1e-6 * (ts_end - ts_start);
-  printf("ELAPSED TIME = %.4fs, THROUGHPUT = %.2f samples/s\n",
+  printf("ELAPSED TIME = %.4fs, THROUGHPUT = %.2f requests/s\n",
          run_time,
-         TRAIN_SAMPLES * ffConfig.epochs / run_time);
-}
-
-DataLoader::DataLoader(FFModel &ff,
-                       MoeConfig const &moe,
-                       ParallelTensor input,
-                       ParallelTensor label) {
-  num_samples = NUM_SAMPLES;
-
-  Context ctx = ff.config.lg_ctx;
-  Runtime *runtime = ff.config.lg_hlr;
-
-  // Create full input
-  {
-    // Input has dimensions (batch_size, data_dims), which in legion ordering
-    // becomes (data_dims, batch_size). The corresponding parallel tensor will
-    // thus have dimensions (data_dims, batch_size, replica_dim). The dimensions
-    // of the full_input tensor can be obtained by replacing the batch_size with
-    // the num_samples: (data_dims, num_samples, replica_dim)
-    assert(input->num_dims == 3); // two dimensions + the replica dimension
-    batch_input = input;
-
-    ParallelDim dims[3];
-    for (int i = 0; i < 3; i++) {
-      dims[i].size = input->dims[i].size;
-      dims[i].degree = 1;
-      dims[i].parallel_idx = -1;
-      dims[i].is_replica_dim = input->dims[i].is_replica_dim;
-      // Assume only the first dim can be the replica dim
-      assert(i == 2 || (!dims[i].is_replica_dim));
-    }
-    dims[1].size = num_samples;
-
-    full_input = ff.create_parallel_tensor_legion_ordering(3, dims, DT_FLOAT);
-    ff.map_tensor(full_input, NULL /*parallel_op*/);
-  }
-
-  // Create full label
-  {
-    assert(label->num_dims == LABEL_DIM + 2);
-    batch_label = label;
-
-    ParallelDim dims[LABEL_DIM + 2];
-    for (int i = 0; i < LABEL_DIM + 2; i++) {
-      dims[i].size = label->dims[i].size;
-      dims[i].degree = 1;
-      dims[i].parallel_idx = -1;
-      dims[i].is_replica_dim = label->dims[i].is_replica_dim;
-      // Assume only the last dim can be the replica dim
-      assert(i == LABEL_DIM + 1 || (!dims[i].is_replica_dim));
-    }
-    assert(dims[LABEL_DIM].size == ff.config.batchSize);
-    // replace batch size with number of samples
-    dims[LABEL_DIM].size = num_samples;
-
-    full_label = ff.create_parallel_tensor_legion_ordering(
-        LABEL_DIM + 2, dims, DT_INT32);
-    ff.map_tensor(full_label, NULL /*parallel_op*/);
-  }
-
-  // Load entire dataset
-  // TODO: Use index launcher instead of task launcher
-  assert(full_input != nullptr && "full_input is nullptr");
-
-  MoeConfig const *ptr = &moe;
-  TaskLauncher launcher(CUSTOM_CPU_TASK_ID_1,
-                        TaskArgument(&ptr, sizeof(MoeConfig *)));
-  // regions[0]: full_input
-  launcher.add_region_requirement(RegionRequirement(full_input->region,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    full_input->region,
-                                                    MAP_TO_ZC_MEMORY));
-  launcher.add_field(0, FID_DATA);
-  // regions[1]: full_label
-  launcher.add_region_requirement(RegionRequirement(full_label->region,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    full_label->region,
-                                                    MAP_TO_ZC_MEMORY));
-  launcher.add_field(1, FID_DATA);
-
-  runtime->execute_task(ctx, launcher);
-  reset();
-  next_batch(ff);
-}
-
-// =================================================
-//                    Load data
-// =================================================
-
-void read_cifar100(float *input_ptr, int *label_ptr) {
-  std::ifstream file;
-  file.open("train.bin", std::ios::in | std::ios::binary | std::ios::ate);
-  if (!file) {
-    std::cout << "Error opening CIFAR100 train data file" << std::endl;
-    assert(false);
-  }
-
-  file.seekg(0, std::ios::beg);
-
-  // each sample: <1 x coarse label><1 x fine label><3072 x pixel>
-  for (std::size_t i = 0; i < NUM_SAMPLES; i++) {
-    unsigned char temp = 0;
-    file.read((char *)&temp, sizeof(temp)); // coarse label, skip
-    file.read((char *)&temp, sizeof(temp));
-    label_ptr[i] = temp;
-    for (std::size_t j = 0; j < 3072; ++j) {
-      file.read((char *)&temp, sizeof(temp));
-      input_ptr[i * 3072 + j] = (float)temp / 255.0f;
-    }
-  }
-
-  file.close();
-}
-
-int reverseInt(int i) {
-  unsigned char c1, c2, c3, c4;
-
-  c1 = i & 255;
-  c2 = (i >> 8) & 255;
-  c3 = (i >> 16) & 255;
-  c4 = (i >> 24) & 255;
-
-  return ((int)c1 << 24) + ((int)c2 << 16) + ((int)c3 << 8) + c4;
-}
-
-/* NOTE: Download files from http://yann.lecun.com/exdb/mnist/ and unpack to
-the current working directory */
-void read_mnist(float *input_ptr, int *label_ptr) {
-  // read inputs
-  std::ifstream input("train-images-idx3-ubyte", std::ios::binary);
-  if (input.is_open()) {
-    int magic_number = 0;
-    int number_of_images = 0;
-    int n_rows = 0;
-    int n_cols = 0;
-    input.read((char *)&magic_number, sizeof(magic_number));
-    magic_number = reverseInt(magic_number);
-    input.read((char *)&number_of_images, sizeof(number_of_images));
-    number_of_images = reverseInt(number_of_images);
-    input.read((char *)&n_rows, sizeof(n_rows));
-    n_rows = reverseInt(n_rows);
-    input.read((char *)&n_cols, sizeof(n_cols));
-    n_cols = reverseInt(n_cols);
-
-    for (int i = 0; i < number_of_images; i++) {
-      for (int r = 0; r < n_rows; r++) {
-        for (int c = 0; c < n_cols; c++) {
-          unsigned char temp = 0;
-          input.read((char *)&temp, sizeof(temp));
-          input_ptr[i * n_rows * n_cols + r * n_cols + c] =
-              (float)temp / 255.0f;
-        }
-      }
-    }
-  } else {
-    std::cout << "Error opening MNIST input data file" << std::endl;
-    assert(false);
-  }
-
-  // read labels
-  std::ifstream labels("train-labels-idx1-ubyte", std::ios::binary);
-  if (labels.is_open()) {
-    int magic_number = 0;
-    int number_of_images = 0;
-    labels.read((char *)&magic_number, sizeof(magic_number));
-    magic_number = reverseInt(magic_number);
-    labels.read((char *)&number_of_images, sizeof(number_of_images));
-    number_of_images = reverseInt(number_of_images);
-
-    for (int i = 0; i < number_of_images; i++) {
-      unsigned char temp = 0;
-      labels.read((char *)&temp, sizeof(temp));
-      label_ptr[i] = temp;
-    }
-  } else {
-    std::cout << "Error opening MNIST label data file" << std::endl;
-    assert(false);
-  }
-}
-
-void DataLoader::load_entire_dataset(Task const *task,
-                                     std::vector<PhysicalRegion> const &regions,
-                                     Context ctx,
-                                     Runtime *runtime) {
-  // const MoeConfig* conf = *((MoeConfig**)task->args);
-  assert(regions.size() == 2);
-  assert(task->regions.size() == regions.size());
-
-  // get input and label pointer
-  AccessorWO<float, 3> const acc_input(regions[0], FID_DATA);
-  AccessorWO<int, LABEL_DIM + 2> const acc_label(regions[1], FID_DATA);
-  Rect<3> rect_input = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  assert(acc_input.accessor.is_dense_arbitrary(rect_input));
-  Rect<LABEL_DIM + 2> rect_label = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  assert(acc_label.accessor.is_dense_arbitrary(rect_label));
-  float *input_ptr = acc_input.ptr(rect_input.lo);
-  int *label_ptr = acc_label.ptr(rect_label.lo);
-  int num_samples = rect_input.hi[1] - rect_input.lo[1] + 1;
-  assert(rect_label.hi[1] - rect_label.lo[1] + 1 == num_samples);
-
-  // here, you can call `read_cifar100(input_ptr, label_ptr);` instead or load
-  // another dataset using the dataset_path from the MoeConfig object
-  read_mnist(input_ptr, label_ptr);
-  log_app.print("finish loading MNIST data\n");
-}
-
-void DataLoader::next_batch(FFModel &ff) {
-  Context ctx = ff.config.lg_ctx;
-  Runtime *runtime = ff.config.lg_hlr;
-  // Load input
-  {
-    Domain domain =
-        runtime->get_index_space_domain(ctx, batch_input->parallel_is);
-    ArgumentMap argmap;
-    int idx = next_index;
-    // current limitation of the dataloader: only the batch dimension can be
-    // partitioned
-    int input_dims = batch_input->num_dims;
-    for (int i = 0; i < input_dims; i++) {
-      if (i != input_dims - 2) {
-        assert(batch_input->dims[i].degree == 1 &&
-               "Dataloader only supports batch size partitions");
-      }
-    }
-    int batch_size = batch_input->dims[input_dims - 2].size;
-    int n_partitions = batch_input->dims[input_dims - 2].degree;
-    assert(ff.config.batchSize % batch_size == 0);
-    assert(batch_size % n_partitions == 0);
-    for (Domain::DomainPointIterator it(domain); it; it++) {
-      SampleIdxs meta;
-      meta.num_samples = batch_size / n_partitions;
-      for (int i = 0; i < meta.num_samples; i++) {
-        meta.idxs[i] = idx++;
-      }
-      argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
-    }
-    IndexLauncher launcher(CUSTOM_GPU_TASK_ID_1,
-                           batch_input->parallel_is,
-                           TaskArgument(NULL, 0),
-                           argmap,
-                           Predicate::TRUE_PRED,
-                           false /*must*/,
-                           0 /*mapper_id*/,
-                           batch_input->machine_view.hash());
-    launcher.add_region_requirement(RegionRequirement(full_input->region,
-                                                      0 /*projection id*/,
-                                                      READ_ONLY,
-                                                      EXCLUSIVE,
-                                                      full_input->region,
-                                                      MAP_TO_ZC_MEMORY));
-    launcher.add_field(0, FID_DATA);
-    launcher.add_region_requirement(RegionRequirement(batch_input->part,
-                                                      0 /*projection id*/,
-                                                      WRITE_ONLY,
-                                                      EXCLUSIVE,
-                                                      batch_input->region));
-    launcher.add_field(1, FID_DATA);
-    runtime->execute_index_space(ctx, launcher);
-  }
-  // Load label
-  {
-    Domain domain =
-        runtime->get_index_space_domain(ctx, batch_label->parallel_is);
-    ArgumentMap argmap;
-    int idx = next_index;
-    // current limitation of the dataloader: only the batch dimension can be
-    // partitioned
-    int label_dims = batch_label->num_dims;
-    assert(batch_label->dims[label_dims - 1].degree == 1);
-    for (int i = 0; i < LABEL_DIM; i++) {
-      assert(batch_label->dims[i].degree == 1 &&
-             "Dataloader only supports batch size partitions");
-    }
-    int batch_size = batch_label->dims[label_dims - 2].size;
-    int n_partitions = batch_label->dims[label_dims - 2].degree;
-    assert(ff.config.batchSize % batch_size == 0);
-    assert(batch_size % n_partitions == 0);
-    for (Domain::DomainPointIterator it(domain); it; it++) {
-      SampleIdxs meta;
-      meta.num_samples = batch_size / n_partitions;
-      for (int i = 0; i < meta.num_samples; i++) {
-        meta.idxs[i] = idx++;
-      }
-      argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
-    }
-    IndexLauncher launcher(CUSTOM_GPU_TASK_ID_2,
-                           batch_label->parallel_is,
-                           TaskArgument(NULL, 0),
-                           argmap,
-                           Predicate::TRUE_PRED,
-                           false /*must*/,
-                           0 /*mapper_id*/,
-                           batch_label->machine_view.hash());
-    launcher.add_region_requirement(RegionRequirement(full_label->region,
-                                                      0 /*projection id*/,
-                                                      READ_ONLY,
-                                                      EXCLUSIVE,
-                                                      full_label->region,
-                                                      MAP_TO_ZC_MEMORY));
-    launcher.add_field(0, FID_DATA);
-    launcher.add_region_requirement(RegionRequirement(batch_label->part,
-                                                      0 /*projection id*/,
-                                                      WRITE_ONLY,
-                                                      EXCLUSIVE,
-                                                      batch_label->region));
-    launcher.add_field(1, FID_DATA);
-    runtime->execute_index_space(ctx, launcher);
-  }
-  next_index += ff.config.batchSize;
-}
-
-void DataLoader::reset() {
-  next_index = 0;
-}
-
-void FlexFlow::register_custom_tasks() {
-  // Load entire dataset
-  {
-    TaskVariantRegistrar registrar(CUSTOM_CPU_TASK_ID_1, "Load Entire Dataset");
-    registrar.add_constraint(ProcessorConstraint(Processor::LOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<DataLoader::load_entire_dataset>(
-        registrar, "Load Entire Dataset Task");
-  }
-  // Load input
-  {
-    TaskVariantRegistrar registrar(CUSTOM_GPU_TASK_ID_1, "Load Inputs");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<DataLoader::load_input>(
-        registrar, "Load Input Task");
-  }
-  // Load label
-  {
-    TaskVariantRegistrar registrar(CUSTOM_GPU_TASK_ID_2, "Load Labels");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<DataLoader::load_label>(
-        registrar, "Load Label Task");
-  }
+         moeConfig.total_requests / run_time);
 }
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cu b/examples/cpp/inference/mixture_of_experts/moe.cu
deleted file mode 100644
index ae1e5aca30..0000000000
--- a/examples/cpp/inference/mixture_of_experts/moe.cu
+++ /dev/null
@@ -1,78 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "flexflow/utils/cuda_helper.h"
-#include "moe.h"
-
-void DataLoader::load_input(Task const *task,
-                            std::vector<PhysicalRegion> const &regions,
-                            Context ctx,
-                            Runtime *runtime) {
-  assert(regions.size() == 2);
-  assert(task->regions.size() == 2);
-  SampleIdxs *meta = (SampleIdxs *)task->local_args;
-  TensorAccessorR<float, 3> acc_full_input(
-      regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  TensorAccessorW<float, 3> acc_batch_input(regions[1],
-                                            task->regions[1],
-                                            FID_DATA,
-                                            ctx,
-                                            runtime,
-                                            false /*readOutput*/);
-
-  coord_t batch_size =
-      acc_batch_input.rect.hi[1] - acc_batch_input.rect.lo[1] + 1;
-  coord_t sample_dim =
-      acc_batch_input.rect.hi[0] - acc_batch_input.rect.lo[0] + 1;
-
-  // FIXME: currently assume continous indices
-  assert(batch_size == meta->num_samples);
-  for (int i = 1; i < batch_size; i++) {
-    assert(meta->idxs[i] == meta->idxs[0] + i);
-  }
-  coord_t start_idx = meta->idxs[0];
-  float const *input_zc = acc_full_input.ptr + start_idx * sample_dim;
-  copy_kernel<<<GET_BLOCKS(acc_batch_input.rect.volume()), CUDA_NUM_THREADS>>>(
-      acc_batch_input.ptr, input_zc, acc_batch_input.rect.volume());
-  checkCUDA(cudaDeviceSynchronize());
-}
-
-void DataLoader::load_label(Task const *task,
-                            std::vector<PhysicalRegion> const &regions,
-                            Context ctx,
-                            Runtime *runtime) {
-  assert(regions.size() == 2);
-  assert(task->regions.size() == 2);
-  SampleIdxs *meta = (SampleIdxs *)task->local_args;
-  TensorAccessorR<int, LABEL_DIM + 2> acc_full_label(
-      regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  TensorAccessorW<int, LABEL_DIM + 2> acc_batch_label(regions[1],
-                                                      task->regions[1],
-                                                      FID_DATA,
-                                                      ctx,
-                                                      runtime,
-                                                      false /*readOutput*/);
-  coord_t batch_size =
-      acc_batch_label.rect.hi[1] - acc_batch_label.rect.lo[1] + 1;
-  // FIXME: currently assume continous indices
-  assert(batch_size == meta->num_samples);
-  for (int i = 1; i < meta->num_samples; i++) {
-    assert(meta->idxs[i] == meta->idxs[0] + i);
-  }
-  int const *input_zc = acc_full_label.ptr + meta->idxs[0];
-  copy_kernel<<<GET_BLOCKS(acc_batch_label.rect.volume()), CUDA_NUM_THREADS>>>(
-      acc_batch_label.ptr, input_zc, acc_batch_label.rect.volume());
-  checkCUDA(cudaDeviceSynchronize());
-}
diff --git a/examples/cpp/inference/mixture_of_experts/moe.h b/examples/cpp/inference/mixture_of_experts/moe.h
index 2df988f530..56feb775e8 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.h
+++ b/examples/cpp/inference/mixture_of_experts/moe.h
@@ -13,16 +13,11 @@
  * limitations under the License.
  */
 
+#include "data_generator.h"
 #include "flexflow/model.h"
 #define MAX_NUM_SAMPLES 1000
-#define NUM_SAMPLES 1000
-#define TRAIN_SAMPLES 1000
-#define TEST_SAMPLES 00000
 #define MNIST_DIMS 28 * 28
-#define CIFAR_DIMS 3 * 32 * 32
-#define DATA_DIMS MNIST_DIMS
-#define OUT_DIM 10
-#define LABEL_DIM 1
+#define DATA_DIM MNIST_DIMS
 
 using namespace Legion;
 using namespace std;
@@ -30,45 +25,69 @@ using namespace FlexFlow;
 
 struct MoeConfig {
   MoeConfig(void) {
-    // MoE layer
+    //----------------------- Input/output data ------------------------
+    token_dim = DATA_DIM;
+    sequence_length = 10;
+    batch_size = 32;
+    out_dim = 15;
+    num_labels = out_dim;
+    //----------------------- Inference parameters ---------------------
+    // total number of requests processed as part of the simulation
+    total_requests = 256;
+    poisson_distribution = true;
+    // average number of request arrivals per second
+    arrival_rate = 25;
+    num_inflight_batches = 10;
+    //----------------------- MoE layer --------------------------------
     // total number of experts
     num_exp = 128;
     // number of experts in each block of fused experts
     experts_per_block = 32;
     // number of experts to route each token to
     num_select = 2;
-    alpha = 2.0f;
-    lambda = 0.04f;
-    hidden_size = DATA_DIMS;
-    batch_size = 32;
-    sequence_length = 10;
+    // expert capacity parameters
+    alpha = 2.0f;   // factor overhead tensor size for imbalance
+    lambda = 0.04f; // multiplier for load balance term
+    // expert hidden size
+    hidden_size = DATA_DIM;
+    //----------------------- Rest of model parameters ------------------
     // Encoder layer
     num_attention_heads = 16;
     attention_kdim = attention_vdim = hidden_size / num_attention_heads;
-    num_encoder_layers = 1; //
+    num_encoder_layers = 1;
   }
+
+  // Input/output data
+  int token_dim;
+  int sequence_length;
+  int batch_size;
+  int out_dim;
+  int num_labels;
+  std::string dataset_path;
+  // Inference parameters
+  int total_requests;
+  bool poisson_distribution;
+  double arrival_rate;
+  int num_inflight_batches;
   // MoE layer
   int num_exp;
-  int num_select;
   int experts_per_block;
-  float alpha;  // factor overhead tensor size for imbalance
-  float lambda; // multiplier for load balance term
+  int num_select;
+  float alpha;
+  float lambda;
   int hidden_size;
-  int batch_size;
-  int sequence_length;
-  // Encoder layer
+  // Model parameters
   int num_attention_heads;
   int attention_kdim;
   int attention_vdim;
   int num_encoder_layers;
-  // Dataset
-  std::string dataset_path;
 };
 
 class DataLoader {
 public:
   DataLoader(FFModel &ff,
-             MoeConfig const &moe,
+             MoeConfig const &moeConfig,
+             DataGenerator &data_generator,
              ParallelTensor input,
              ParallelTensor label);
   static void load_input(Task const *task,
@@ -83,13 +102,17 @@ class DataLoader {
                                   std::vector<PhysicalRegion> const &regions,
                                   Context ctx,
                                   Runtime *runtime);
-  void next_batch(FFModel &);
+  void next_batch(FFModel &, size_t);
   void reset(void);
 
 public:
   int num_samples, next_index;
   FlexFlow::ParallelTensor full_input, batch_input;
   FlexFlow::ParallelTensor full_label, batch_label;
+  struct DataLoaderInput {
+    MoeConfig const &_moeConfig;
+    DataGenerator &_data_generator;
+  };
 };
 
 struct SampleIdxs {
diff --git a/src/loss_functions/loss_functions.cu b/src/loss_functions/loss_functions.cu
index 01766347b0..f78311980c 100644
--- a/src/loss_functions/loss_functions.cu
+++ b/src/loss_functions/loss_functions.cu
@@ -122,19 +122,17 @@ void Loss::mean_squared_error_avg_loss_backward_kernel_wrapper(
       logit_grad_ptr, logit_grad_volume, 0, scale_factor);
 }
 
-void Loss::identity_loss_backward_kernel_wrapper(
-    float *loss_grad_ptr,
-    float const *loss_ptr,
-    size_t loss_volume,
-    size_t loss_grad_volume,
-    float scale_factor) {
+void Loss::identity_loss_backward_kernel_wrapper(float *loss_grad_ptr,
+                                                 float const *loss_ptr,
+                                                 size_t loss_volume,
+                                                 size_t loss_grad_volume,
+                                                 float scale_factor) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   identity_loss_backward<<<GET_BLOCKS(loss_volume),
                            CUDA_NUM_THREADS,
                            0,
-                           stream>>>(
-      loss_grad_ptr, loss_ptr, loss_volume);
+                           stream>>>(loss_grad_ptr, loss_ptr, loss_volume);
   // Scale logit gradients by loss->scale_factor
   scale_kernel<<<GET_BLOCKS(loss_grad_volume), CUDA_NUM_THREADS, 0, stream>>>(
       loss_grad_ptr, loss_grad_volume, 0, scale_factor);
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index e3e4bd9b07..541cf34976 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -148,6 +148,10 @@ void InferenceManager::inference(int index) {
     for (int i = 0; i < op->numOutputs; i++) {
       assert(op->outputs[i] != nullptr);
       assert(op->outputs[i]->parallel_is != IndexSpace::NO_SPACE);
+      if (op->op_type == OP_INPUT &&
+          tensor_buffer[op->outputs[i]].size() == 0) {
+        continue;
+      }
       assert(tensor_buffer[op->outputs[i]].size() > batch_index);
       outputs[i] = tensor_buffer[op->outputs[i]][batch_index];
       assert(outputs[i]->parallel_is != IndexSpace::NO_SPACE);
diff --git a/tests/cpp_gpu_tests.sh b/tests/cpp_gpu_tests.sh
index 2c4b189046..3645544b44 100755
--- a/tests/cpp_gpu_tests.sh
+++ b/tests/cpp_gpu_tests.sh
@@ -45,6 +45,8 @@ if [[ -f "$FF_HOME/build/examples/cpp/AlexNet/alexnet" ]]; then
 	# TODO: fix split tests
 	# "$FF_HOME"/build/examples/cpp/split_test/split_test -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
 	# "$FF_HOME"/build/examples/cpp/split_test_2/split_test_2 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
+	# Inference examples
+	"$FF_HOME"/build/examples/cpp/inference/mixture_of_experts/inference_moe -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
 else
 	python_packages=$(python -c "from distutils import sysconfig; print(sysconfig.get_python_lib(plat_specific=False,standard_lib=False))")
 	OLD_PATH="$PATH"
@@ -73,6 +75,8 @@ else
 			# TODO: fix split tests 
 			# split_test -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
 			# split_test_2 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
+			# Inference examples
+			inference_moe -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
 		fi
 	done
 	export PATH="$OLD_PATH"

From 0315bbfdc79a9cf6870589ea85e60846e67fd11b Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Fri, 24 Feb 2023 16:27:29 +0000
Subject: [PATCH 061/344] [IncMultiHeadSelfAttention] initial implementation

---
 include/flexflow/ffconst.h                    |   1 +
 include/flexflow/model.h                      |  19 +
 include/flexflow/operator_params.h            |   2 +
 .../ops/inc_multihead_self_attention.h        | 129 ++++
 .../ops/inc_multihead_self_attention_params.h |  30 +
 src/ops/inc_multihead_self_attention.cc       | 692 ++++++++++++++++++
 src/ops/inc_multihead_self_attention.cu       | 267 +++++++
 src/runtime/model.cc                          |  26 +
 8 files changed, 1166 insertions(+)
 create mode 100644 include/flexflow/ops/inc_multihead_self_attention.h
 create mode 100644 include/flexflow/ops/inc_multihead_self_attention_params.h
 create mode 100644 src/ops/inc_multihead_self_attention.cc
 create mode 100644 src/ops/inc_multihead_self_attention.cu

diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index ee0b007a8e..2ccf4a0eb1 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -146,6 +146,7 @@ enum OperatorType {
   OP_LAYERNORM,
   OP_EXPERTS,
   OP_GATHER, // https://pytorch.org/docs/stable/generated/torch.gather.html
+  OP_INC_MULTIHEAD_SELF_ATTENTION,
   // Parallel Ops
   OP_REPARTITION,
   OP_COMBINE,
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 2c460e507a..041d8c507d 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -136,6 +136,10 @@ enum TaskIDs {
   ATTENTION_INIT_TASK_ID,
   ATTENTION_FWD_TASK_ID,
   ATTENTION_BWD_TASK_ID,
+  INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
+  INC_MULTIHEAD_SELF_ATTENTION_FWD_TASK_ID,
+  INC_MULTIHEAD_SELF_ATTENTION_BWD_TASK_ID,
+  INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
   MSELOSS_BWD_TASK_ID,
   FUSEDOP_INIT_TASK_ID,
   FUSEDOP_FWD_TASK_ID,
@@ -269,6 +273,7 @@ class Group_by;
 class LayerNorm;
 class Linear;
 class MultiHeadAttention;
+class IncMultiHeadSelfAttention;
 class Pool2D;
 class Reduce;
 class Reshape;
@@ -564,6 +569,17 @@ class FFModel {
                              bool add_zero_attn = false,
                              Initializer *kernel_initializer = NULL,
                              char const *name = NULL);
+  Tensor inc_multihead_self_attention(const Tensor input,
+                                      int embed_dim,
+                                      int num_heads,
+                                      int kdim = 0,
+                                      int vdim = 0,
+                                      float dropout = 0.0f,
+                                      bool bias = true,
+                                      bool add_bias_kv = false,
+                                      bool add_zero_attn = false,
+                                      Initializer *kernel_initializer = NULL,
+                                      char const *name = NULL);
   Tensor create_tensor_legion_ordering(int num_dim,
                                        int const dims[],
                                        DataType data_type,
@@ -910,6 +926,9 @@ class FFModel {
                                               ParallelTensorShape>,
                                    MultiHeadAttentionParams>,
                          MultiHeadAttention *>,
+      std::unordered_map<
+          std::pair<ParallelTensorShape, IncMultiHeadSelfAttentionParams>,
+          IncMultiHeadSelfAttention *>,
       std::unordered_map<std::pair<ParallelTensorShape, ReduceParams>,
                          Reduce *>,
       std::unordered_map<std::pair<ParallelTensorShape, ReshapeParams>,
diff --git a/include/flexflow/operator_params.h b/include/flexflow/operator_params.h
index 0297f690f5..899921a758 100644
--- a/include/flexflow/operator_params.h
+++ b/include/flexflow/operator_params.h
@@ -16,6 +16,7 @@
 #include "flexflow/ops/flat_params.h"
 #include "flexflow/ops/gather_params.h"
 #include "flexflow/ops/groupby_params.h"
+#include "flexflow/ops/inc_multihead_self_attention_params.h"
 #include "flexflow/ops/layer_norm_params.h"
 #include "flexflow/ops/linear_params.h"
 #include "flexflow/ops/pool_2d_params.h"
@@ -52,6 +53,7 @@ using OperatorParameters = mp::variant<AggregateParams,
                                        LayerNormParams,
                                        LinearParams,
                                        MultiHeadAttentionParams,
+                                       IncMultiHeadSelfAttentionParams,
                                        Pool2DParams,
                                        ReduceParams,
                                        ReshapeParams,
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
new file mode 100644
index 0000000000..0b1572f2ca
--- /dev/null
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -0,0 +1,129 @@
+#ifndef _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_H
+#define _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_H
+
+
+#include "flexflow/device.h"
+#include "flexflow/fftype.h"
+#include "flexflow/layer.h"
+#include "flexflow/node.h"
+#include "flexflow/op_meta.h"
+#include "flexflow/operator.h"
+#include "flexflow/ops/inc_multihead_self_attention_params.h"
+
+namespace FlexFlow {
+
+class IncMultiHeadSelfAttentionMeta;
+
+class IncMultiHeadSelfAttention : public Op {
+public:
+  using Params = IncMultiHeadSelfAttentionParams;
+  using Input = ParallelTensor;
+
+  IncMultiHeadSelfAttention(FFModel &model,
+                     LayerID const &layer_guid,
+                     const ParallelTensor _input,
+                     int _embed_dim,
+                     int _num_heads,
+                     int _kdim,
+                     int _vdim,
+                     float _dropout,
+                     bool _bias,
+                     bool _add_bias_kv,
+                     bool _add_zero_attn,
+                     bool allocate_weights,
+                     char const *name);
+  IncMultiHeadSelfAttention(FFModel &model,
+                     const ParallelTensor _input,
+                     const ParallelTensor _weight,
+                     int _embed_dim,
+                     int _num_heads,
+                     int _kdim,
+                     int _vdim,
+                     float _dropout,
+                     bool _bias,
+                     bool _add_bias_kv,
+                     bool _add_zero_attn,
+                     bool allocate_weights,
+                     char const *name);
+  IncMultiHeadSelfAttention(FFModel &model,
+                     IncMultiHeadSelfAttention const &other,
+                     const ParallelTensor input,
+                     bool allocate_weights);
+  IncMultiHeadSelfAttention(FFModel &model,
+                     Params const &params,
+                     Input const &inputs,
+                     bool allocate_weights = false,
+                     char const *name = nullptr);
+  static Op *
+      create_operator_from_layer(FFModel &model,
+                                 Layer const *layer,
+                                 std::vector<ParallelTensor> const &inputs);
+  void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
+  void forward(FFModel const &) override;
+  void backward(FFModel const &) override;
+  void inference(FFModel const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &,
+                 MachineView const *mv = nullptr) override;
+  void print_layer(FFModel const &model) override {
+    assert(0);
+  }
+  bool get_int_parameter(PMParameter, int *) const override;
+
+  static OpMeta *init_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
+  bool measure_operator_cost(Simulator *sim,
+                             MachineView const &mv,
+                             CostMetrics &cost_metrics) const override;
+  static void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
+                               float const *input_ptr,
+                               float const *weight_ptr,
+                               float *output_ptr,
+                               ffStream_t stream);
+  static void inference_kernel_wrapper(IncMultiHeadSelfAttentionMeta const *m,
+                                     float const *input_ptr,
+                                     float const *weight_ptr,
+                                     float *output_ptr);
+  Params get_params() const;
+public:
+  int num_heads;
+  float dropout;
+  bool bias;
+  bool add_bias_kv, add_zero_attn;
+  int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
+  int qoSeqLength, kvSeqLength;
+};
+
+class IncMultiHeadSelfAttentionMeta : public OpMeta {
+public:
+  IncMultiHeadSelfAttentionMeta(FFHandler handler,
+                         IncMultiHeadSelfAttention const *attn,
+                         Legion::Memory gpu_mem,
+                         int num_samples,
+                         int num_heads);
+  ~IncMultiHeadSelfAttentionMeta(void);
+
+public:
+  Realm::RegionInstance reserveInst;
+  size_t weightSize, reserveSpaceSize;
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+  cudnnAttnDescriptor_t attnDesc;
+  cudnnSeqDataDescriptor_t qDesc, kDesc, vDesc, oDesc;
+#endif
+  int *devQoSeqArray, *devKvSeqArray, *loWinIdx, *hiWinIdx;
+  void *reserveSpace;
+};
+
+}; // namespace FlexFlow
+
+#endif // _FLEXFLOW_ATTENTION_H
diff --git a/include/flexflow/ops/inc_multihead_self_attention_params.h b/include/flexflow/ops/inc_multihead_self_attention_params.h
new file mode 100644
index 0000000000..e7535dc23d
--- /dev/null
+++ b/include/flexflow/ops/inc_multihead_self_attention_params.h
@@ -0,0 +1,30 @@
+#ifndef _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_PARAMS_H
+#define _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_PARAMS_H
+
+#include "flexflow/fftype.h"
+#include "flexflow/parallel_tensor.h"
+
+namespace FlexFlow {
+
+struct IncMultiHeadSelfAttentionParams {
+  LayerID layer_guid;
+  int embed_dim, num_heads, kdim, vdim;
+  float dropout;
+  bool bias, add_bias_kv, add_zero_attn;
+
+  bool is_valid(ParallelTensorShape const &) const;
+};
+
+bool operator==(IncMultiHeadSelfAttentionParams const &,
+                IncMultiHeadSelfAttentionParams const &);
+
+} // namespace FlexFlow
+
+namespace std {
+template <>
+struct hash<FlexFlow::IncMultiHeadSelfAttentionParams> {
+  size_t operator()(FlexFlow::IncMultiHeadSelfAttentionParams const &) const;
+};
+} // namespace std
+
+#endif // _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_PARAMS_H
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
new file mode 100644
index 0000000000..329254fb74
--- /dev/null
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -0,0 +1,692 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/inc_multihead_self_attention.h"
+#include "flexflow/model.h"
+#include "flexflow/utils/hash_utils.h"
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::ArgumentMap;
+using Legion::Context;
+using Legion::coord_t;
+using Legion::Domain;
+using Legion::FutureMap;
+using Legion::IndexLauncher;
+using Legion::Machine;
+using Legion::Memory;
+using Legion::PhysicalRegion;
+using Legion::Predicate;
+using Legion::Rect;
+using Legion::RegionRequirement;
+using Legion::Runtime;
+using Legion::Task;
+using Legion::TaskArgument;
+using Legion::TaskLauncher;
+
+bool IncMultiHeadSelfAttentionParams::is_valid(ParallelTensorShape const &input) const {
+  bool is_valid = input.is_valid();
+  return is_valid;
+}
+
+Tensor FFModel::inc_multihead_self_attention(const Tensor input,
+                                             int embed_dim,
+                                             int num_heads,
+                                             int kdim,
+                                             int vdim,
+                                             float dropout,
+                                             bool bias,
+                                             bool add_bias_kv,
+                                             bool add_zero_attn,
+                                             Initializer *kernel_initializer,
+                                             char const *name) {
+  // Currently assume that 
+  Layer *li = new Layer(this,
+                        OP_INC_MULTIHEAD_SELF_ATTENTION,
+                        DT_FLOAT,
+                        name,
+                        1 /*inputs*/,
+                        1 /*weights*/,
+                        1 /*outputs*/,
+                        input);
+  {
+    int numdims = input->num_dims;
+    int dims[MAX_TENSOR_DIM];
+    for (int i = 0; i < numdims; i++) {
+      dims[i] = input->dims[i];
+    }
+    dims[0] = embed_dim;
+    li->outputs[0] = create_tensor_legion_ordering(
+        numdims, dims, DT_FLOAT, li, 0, true /*create_grad*/);
+  }
+  {
+    // Compute weight size
+    int qProjSize = kdim, kProjSize = kdim, vProjSize = kdim,
+        oProjSize = embed_dim;
+    int qSize = input->dims[0], kSize = input->dims[0], vSize = input->dims[0];
+    int qParas = qProjSize * qSize;
+    int kParas = kProjSize * kSize;
+    int vParas = vProjSize * vSize;
+    int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
+    int dims[2] = {qParas + kParas + vParas + oParas, num_heads};
+    li->weights[0] = create_weight_legion_ordering(2,
+                                                   dims,
+                                                   DT_FLOAT,
+                                                   li,
+                                                   true /*create_grad*/,
+                                                   kernel_initializer,
+                                                   CHOSEN_SYNC_TYPE);
+  }
+  li->data_type = DT_FLOAT;
+  li->add_int_property("embed_dim", embed_dim);
+  li->add_int_property("num_heads", num_heads);
+  li->add_int_property("kdim", kdim);
+  li->add_int_property("vdim", vdim);
+  li->add_int_property("bias", bias);
+  li->add_int_property("add_bias_kv", add_bias_kv);
+  li->add_int_property("add_zero_attn", add_zero_attn);
+  li->add_float_property("dropout", dropout);
+  layers.push_back(li);
+  return li->outputs[0];
+}
+
+Op *IncMultiHeadSelfAttention::create_operator_from_layer(
+    FFModel &model,
+    Layer const *layer,
+    std::vector<ParallelTensor> const &inputs) {
+  long long value;
+  layer->get_int_property("embed_dim", value);
+  int embed_dim = value;
+  layer->get_int_property("num_heads", value);
+  int num_heads = value;
+  layer->get_int_property("kdim", value);
+  int kdim = value;
+  layer->get_int_property("vdim", value);
+  int vdim = value;
+  float dropout;
+  layer->get_float_property("dropout", dropout);
+  layer->get_int_property("bias", value);
+  bool bias = (bool)value;
+  layer->get_int_property("add_bias_kv", value);
+  bool add_bias_kv = (bool)value;
+  layer->get_int_property("add_zero_attn", value);
+  bool add_zero_attn = (bool)value;
+  return new IncMultiHeadSelfAttention(model,
+                                       layer->layer_guid,
+                                       inputs[0],
+                                       embed_dim,
+                                       num_heads,
+                                       kdim,
+                                       vdim,
+                                       dropout,
+                                       bias,
+                                       add_bias_kv,
+                                       add_zero_attn,
+                                       false /*allocate_weights*/,
+                                       layer->name);
+}
+
+IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(FFModel &model,
+                                                     LayerID const &_layer_guid,
+                                                     const ParallelTensor _input,
+                                                     int _embed_dim,
+                                                     int _num_heads,
+                                                     int _kdim,
+                                                     int _vdim,
+                                                     float _dropout,
+                                                     bool _bias,
+                                                     bool _add_bias_kv,
+                                                     bool _add_zero_attn,
+                                                     bool allocate_weights,
+                                                     char const *name)
+    // Initializer* _bias_initializer)
+    : Op(model,
+         OP_MULTIHEAD_ATTENTION,
+         DT_FLOAT,
+         name,
+         1 /*inputs*/,
+         1 /*weights*/,
+         1 /*outputs*/,
+         _input),
+      num_heads(_num_heads), dropout(_dropout), bias(_bias),
+      add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      qSize(_input->dims[0].size), kSize(_input->dims[0].size),
+      vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
+      vProjSize(_vdim), oProjSize(_embed_dim),
+      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size)
+{
+  // overwrite layer_guid
+  layer_guid = _layer_guid;
+
+  numOutputs = 1;
+  int numdim = _input->num_dims;
+  ParallelDim dims[MAX_TENSOR_DIM];
+  for (int i = 0; i < numdim; i++) {
+    dims[i] = _input->dims[i];
+  }
+  dims[0].size = _embed_dim;
+  // Currently require no parallelism along this dim
+  assert(dims[0].degree == 1);
+  if (allocate_weights) {
+    // Create weight tensor
+    int num_dims = inputs[0]->num_dims;
+    // Compute weight size
+    int qParas = this->qProjSize * this->qSize;
+    int kParas = this->kProjSize * this->kSize;
+    int vParas = this->vProjSize * this->vSize;
+    int oParas =
+        this->oProjSize * (this->vProjSize > 0 ? this->vProjSize : this->vSize);
+    ParallelDim dims[3];
+    dims[0] = inputs[0]->dims[num_dims - 2];
+    dims[0].size = dims[0].degree;
+    dims[1] = inputs[0]->dims[num_dims - 1];
+    dims[1].size = this->num_heads;
+    dims[2].size = qParas + kParas + vParas + oParas;
+    dims[2].degree = 1;
+    dims[2].parallel_idx = -1;
+    int seed = std::rand();
+    Initializer *initializer = new GlorotUniform(seed);
+#ifdef USE_NCCL
+    ParameterSyncType comm_type = ParameterSyncType::NCCL;
+#else
+    ParameterSyncType comm_type = ParameterSyncType::PS;
+#endif
+    weights[0] = model.create_parallel_weight<3>(dims,
+                                                 DT_FLOAT,
+                                                 NULL /*owner_op*/,
+                                                 true /*create_grad*/,
+                                                 initializer,
+                                                 comm_type);
+  }
+
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      _input->num_dims, dims, DT_FLOAT, this);
+  /* for (int i = 0; i < numdim; i++) { */
+  /*   register_output_input_parallel_dims(outputs[0], i, inputs[0], i); */
+  /* } */
+  /* // Check correctness */
+  /* assert(check_output_input_weight_parallel_dims()); */
+}
+
+IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(FFModel &model,
+                                                     const ParallelTensor _input,
+                                                     const ParallelTensor _weight,
+                                                     int _embed_dim,
+                                                     int _num_heads,
+                                                     int _kdim,
+                                                     int _vdim,
+                                                     float _dropout,
+                                                     bool _bias,
+                                                     bool _add_bias_kv,
+                                                     bool _add_zero_attn,
+                                                     bool allocate_weights,
+                                                     char const *name)
+    // Initializer* _bias_initializer)
+    : Op(model,
+         OP_INC_MULTIHEAD_SELF_ATTENTION,
+         DT_FLOAT,
+         name,
+         1 /*inputs*/,
+         1 /*weights*/,
+         1 /*outputs*/,
+         _input,
+         _weight),
+      num_heads(_num_heads), dropout(_dropout), bias(_bias),
+      add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      qSize(_input->dims[0].size), kSize(_input->dims[0].size),
+      vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
+      vProjSize(_vdim), oProjSize(_embed_dim),
+      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size)
+// bias_initializer(_bias_initializer)
+{
+  numOutputs = 1;
+  int numdim = _input->num_dims;
+  ParallelDim dims[MAX_TENSOR_DIM];
+  for (int i = 0; i < numdim; i++) {
+    dims[i] = _input->dims[i];
+  }
+  dims[0].size = _embed_dim;
+  // Currently require no parallelism along this dim
+  assert(dims[0].degree == 1);
+  if (allocate_weights) {
+    // Create weight tensor
+    int num_dims = inputs[0]->num_dims;
+    // Compute weight size
+    int qParas = this->qProjSize * this->qSize;
+    int kParas = this->kProjSize * this->kSize;
+    int vParas = this->vProjSize * this->vSize;
+    int oParas =
+        this->oProjSize * (this->vProjSize > 0 ? this->vProjSize : this->vSize);
+    ParallelDim dims[3];
+    dims[0] = inputs[0]->dims[num_dims - 2];
+    dims[0].size = dims[0].degree;
+    dims[1] = inputs[0]->dims[num_dims - 1];
+    dims[1].size = this->num_heads;
+    dims[2].size = qParas + kParas + vParas + oParas;
+    int seed = std::rand();
+    Initializer *initializer = new GlorotUniform(seed);
+#ifdef USE_NCCL
+    ParameterSyncType comm_type = ParameterSyncType::NCCL;
+#else
+    ParameterSyncType comm_type = ParameterSyncType::PS;
+#endif
+    weights[0] = model.create_parallel_weight<3>(dims,
+                                                 DT_FLOAT,
+                                                 NULL /*owner_op*/,
+                                                 true /*create_grad*/,
+                                                 initializer,
+                                                 comm_type);
+  }
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      _input->num_dims, dims, DT_FLOAT, this);
+
+  /* for (int i = 0; i < numdim; i++) { */
+  /*   register_output_input_parallel_dims(outputs[0], i, inputs[0], i); */
+  /* } */
+  /* register_output_weight_parallel_dims(outputs[0], numdim-1, _weight, 1); */
+  /* register_output_weight_parallel_dims(outputs[0], numdim-2, _weight, 2); */
+  // Check correctness
+  /* assert(check_output_input_weight_parallel_dims()); */
+}
+
+IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(FFModel &model,
+                                       IncMultiHeadSelfAttention const &other,
+                                       const ParallelTensor input,
+                                       bool allocate_weights)
+    : IncMultiHeadSelfAttention(model,
+                         other.layer_guid,
+                         input,
+                         other.oProjSize,
+                         other.num_heads,
+                         other.qProjSize,
+                         other.vProjSize,
+                         other.dropout,
+                         other.bias,
+                         other.add_bias_kv,
+                         other.add_zero_attn,
+                         allocate_weights,
+                         other.name) {}
+
+IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
+    FFModel &model,
+    IncMultiHeadSelfAttentionParams const &params,
+    ParallelTensor const &input,
+    bool allocate_weights,
+    char const *name)
+    : IncMultiHeadSelfAttention(model,
+                         params.layer_guid,
+                         input,
+                         params.embed_dim,
+                         params.num_heads,
+                         params.kdim,
+                         params.vdim,
+                         params.dropout,
+                         params.bias,
+                         params.add_bias_kv,
+                         params.add_zero_attn,
+                         allocate_weights,
+                         name) {}
+
+void IncMultiHeadSelfAttention::init_inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, view);
+  IndexLauncher launcher(INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(IncMultiHeadSelfAttention)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, view);
+}
+
+void IncMultiHeadSelfAttention::init(FFModel const &ff) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(IncMultiHeadSelfAttention)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
+/*
+  regions[0](I): input
+  regions[1](I): weight
+  regions[2](O): output
+*/
+OpMeta *
+    IncMultiHeadSelfAttention::init_task(Task const *task,
+                                  std::vector<PhysicalRegion> const &regions,
+                                  Context ctx,
+                                  Runtime *runtime) {
+  IncMultiHeadSelfAttention const *attn = (IncMultiHeadSelfAttention *)task->args;
+  FFHandler handle = *((FFHandler const *)task->local_args);
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      DT_FLOAT, regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
+      DT_FLOAT, regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      DT_FLOAT, regions[2], task->regions[2], FID_DATA, ctx, runtime);
+
+  int num_samples = input.domain.hi()[2] - input.domain.lo()[2] + 1;
+  assert(attn->qoSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
+  assert(attn->kvSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
+  int num_heads = weight.domain.hi()[1] - weight.domain.lo()[1] + 1;
+  assert(attn->oProjSize == output.domain.hi()[0] - output.domain.lo()[0] + 1);
+
+  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                       .only_kind(Memory::GPU_FB_MEM)
+                       .best_affinity_to(task->target_proc)
+                       .first();
+  IncMultiHeadSelfAttentionMeta *m =
+      new IncMultiHeadSelfAttentionMeta(handle, attn, gpu_mem, num_samples, num_heads);
+  m->profiling = attn->profiling;
+  assert(weight.domain.get_volume() * sizeof(float) == m->weightSize);
+  return m;
+}
+
+void IncMultiHeadSelfAttention::forward(FFModel const &ff) {
+  // IncMultiHeadSelfAttention doesn't support forward
+  assert(false);
+}
+
+void IncMultiHeadSelfAttention::inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, view);
+  size_t machine_view_hash = view->hash();
+  /* std::cout << "IncMultiHeadSelfAttention op machine_view: " << *(MachineView const
+     *)mv
+            << std::endl; */
+  int idx = 0;
+  IndexLauncher launcher(INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(idx++, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(idx++, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(idx++, FID_DATA);
+  runtime->execute_index_space(ctx, launcher);
+}
+
+/*
+  regions[0](I): input
+  regions[3](I): weight
+  regions[4](O): output
+*/
+void IncMultiHeadSelfAttention::inference_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  assert(regions.size() == 3);
+  assert(task->regions.size() == regions.size());
+  // const IncMultiHeadSelfAttention* attn = (IncMultiHeadSelfAttention*) task->args;
+  IncMultiHeadSelfAttentionMeta const *m =
+      *((IncMultiHeadSelfAttentionMeta **)task->local_args);
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
+      m->weight_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+
+  IncMultiHeadSelfAttention::inference_kernel_wrapper(m,
+                                             input.get_float_ptr(),
+                                             weight.get_float_ptr(),
+                                             output.get_float_ptr());
+}
+
+void IncMultiHeadSelfAttention::backward(FFModel const &ff) {
+  // IncMultiHeadSelfAttention does not support backward
+  assert(false);
+}
+
+bool IncMultiHeadSelfAttention::get_int_parameter(PMParameter para, int *value) const {
+  switch (para) {
+    case PM_NUM_HEADS:
+      *value = num_heads;
+      return true;
+    default:
+      return Op::get_int_parameter(para, value);
+  }
+}
+
+bool IncMultiHeadSelfAttention::measure_operator_cost(
+    Simulator *sim, MachineView const &mv, CostMetrics &cost_metrics) const {
+  ParallelTensorBase sub_output, sub_input;
+  if (!inputs[0]->get_sub_tensor(mv, sub_input)) {
+    return false;
+  }
+  if (!outputs[0]->get_sub_tensor(mv, sub_output)) {
+    return false;
+  }
+  // Currently assume only data parallel
+  size_t num_weights = 0;
+  {
+    // Compute weight size
+    int qSize = sub_input.dims[0].size;
+    int kSize = sub_input.dims[0].size;
+    int vSize = sub_input.dims[0].size;
+    int qParas = qProjSize * qSize;
+    int kParas = kProjSize * kSize;
+    int vParas = vProjSize * vSize;
+    int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
+    num_weights = num_heads * (qParas + kParas + vParas + oParas);
+  }
+  assert(sub_input.num_dims == 4);
+  int num_samples = sub_input.dims[2].size;
+
+  IncMultiHeadSelfAttentionMeta *m = new IncMultiHeadSelfAttentionMeta(
+      sim->handler, this, sim->memory, num_samples, num_heads);
+
+  // allocate tensors in simulator
+  sim->free_all();
+  float const *input_ptr =
+      (float const *)sim->allocate(sub_input.get_volume(), DT_FLOAT);
+  cost_metrics.inputs_memory += cost_metrics.total_mem_diff_from(sim->offset);
+
+  float *output_ptr = (float *)sim->allocate(sub_output.get_volume(), DT_FLOAT);
+  assert(output_ptr != NULL);
+  cost_metrics.outputs_memory += cost_metrics.total_mem_diff_from(sim->offset);
+
+  float const *weight_ptr = (float const *)sim->allocate(num_weights, DT_FLOAT);
+  cost_metrics.weights_memory += cost_metrics.total_mem_diff_from(sim->offset);
+
+  assert(m->profiling == false);
+
+  std::function<void()> forward, backward;
+  forward = [&] {
+    inference_kernel_wrapper(
+        m, input_ptr, weight_ptr, output_ptr);
+  };
+  if (sim->computationMode == COMP_MODE_TRAINING) {
+    // IncMultiHeadSelfAttention does not support training
+    assert(false);
+  }
+
+  inner_measure_operator_cost(sim, forward, backward, cost_metrics);
+
+  if (sim->computationMode == COMP_MODE_TRAINING) {
+    printf("[Measure IncMultiHeadSelfAttention] query(%d %d %d) key(%d %d %d) "
+           "value(%d %d %d) output(%d %d %d)"
+           "forward_time(%.4lf) backward_time(%.4lf)\n",
+           sub_input.dims[2].size,
+           sub_input.dims[1].size,
+           sub_input.dims[0].size,
+           sub_input.dims[2].size,
+           sub_input.dims[1].size,
+           sub_input.dims[0].size,
+           sub_input.dims[2].size,
+           sub_input.dims[1].size,
+           sub_input.dims[0].size,
+           sub_output.dims[2].size,
+           sub_output.dims[1].size,
+           sub_output.dims[0].size,
+           cost_metrics.forward_time,
+           cost_metrics.backward_time);
+  } else {
+    printf("[Measure IncMultiHeadSelfAttention] query(%d %d %d) key(%d %d %d) "
+           "value(%d %d %d) output(%d %d %d)"
+           "forward_time(%.4lf)\n",
+           sub_input.dims[2].size,
+           sub_input.dims[1].size,
+           sub_input.dims[0].size,
+           sub_input.dims[2].size,
+           sub_input.dims[1].size,
+           sub_input.dims[0].size,
+           sub_input.dims[2].size,
+           sub_input.dims[1].size,
+           sub_input.dims[0].size,
+           sub_output.dims[2].size,
+           sub_output.dims[1].size,
+           sub_output.dims[0].size,
+           cost_metrics.forward_time);
+  }
+  // Free multiheadattentionmeta
+  delete m;
+  return true;
+}
+
+using PCG::Node;
+
+bool operator==(IncMultiHeadSelfAttentionParams const &lhs,
+                IncMultiHeadSelfAttentionParams const &rhs) {
+  return lhs.layer_guid == rhs.layer_guid && lhs.embed_dim == rhs.embed_dim &&
+         lhs.num_heads == rhs.num_heads && lhs.kdim == rhs.kdim &&
+         lhs.vdim == rhs.vdim && lhs.dropout == rhs.dropout &&
+         lhs.bias == rhs.bias && lhs.add_bias_kv == rhs.add_bias_kv &&
+         lhs.add_zero_attn == rhs.add_zero_attn;
+}
+
+IncMultiHeadSelfAttentionParams IncMultiHeadSelfAttention::get_params() const {
+  IncMultiHeadSelfAttentionParams params;
+  params.layer_guid = this->layer_guid;
+  params.embed_dim = this->oProjSize;
+  params.num_heads = this->num_heads;
+  params.kdim = this->kProjSize;
+  params.vdim = this->vProjSize;
+  params.dropout = this->dropout;
+  params.bias = this->bias;
+  params.add_bias_kv = this->add_bias_kv;
+  params.add_zero_attn = this->add_zero_attn;
+  return params;
+}
+
+}; // namespace FlexFlow
+
+namespace std {
+size_t hash<FlexFlow::IncMultiHeadSelfAttentionParams>::operator()(
+    FlexFlow::IncMultiHeadSelfAttentionParams const &params) const {
+  size_t key = 0;
+  hash_combine(key, params.layer_guid.id);
+  hash_combine(key, params.embed_dim);
+  hash_combine(key, params.num_heads);
+  hash_combine(key, params.kdim);
+  hash_combine(key, params.vdim);
+  hash_combine(key, params.dropout);
+  hash_combine(key, params.bias);
+  hash_combine(key, params.add_bias_kv);
+  hash_combine(key, params.add_zero_attn);
+  return key;
+}
+}; // namespace std
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
new file mode 100644
index 0000000000..b903a6f073
--- /dev/null
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -0,0 +1,267 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/inc_multihead_self_attention.h"
+#include "flexflow/utils/cuda_helper.h"
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::coord_t;
+using Legion::Memory;
+
+/*static*/
+void IncMultiHeadSelfAttention::inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
+                                        float const *input_ptr,
+                                        float const *weight_ptr,
+                                        float *output_ptr,
+                                        cudaStream_t stream) {
+  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
+
+  checkCUDNN(cudnnMultiHeadAttnForward(m->handle.dnn,
+                                       m->attnDesc,
+                                       -1,
+                                       m->loWinIdx,
+                                       m->hiWinIdx,
+                                       m->devQoSeqArray,
+                                       m->devKvSeqArray,
+                                       m->qDesc,
+                                       input_ptr,
+                                       NULL /*residual*/,
+                                       m->kDesc,
+                                       input_ptr,
+                                       m->vDesc,
+                                       input_ptr,
+                                       m->oDesc,
+                                       output_ptr,
+                                       m->weightSize,
+                                       weight_ptr,
+                                       m->handle.workSpaceSize,
+                                       m->handle.workSpace,
+                                       m->reserveSpaceSize,
+                                       m->reserveSpace));
+}
+
+/*static*/
+void IncMultiHeadSelfAttention::inference_kernel_wrapper(IncMultiHeadSelfAttentionMeta const *m,
+                                                float const *input_ptr,
+                                                float const *weight_ptr,
+                                                float *output_ptr) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+  IncMultiHeadSelfAttention::inference_kernel(
+      m, input_ptr, weight_ptr, output_ptr, stream);
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("IncMultiHeadSelfAttention forward time = %.2fms\n", elapsed);
+    // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
+    // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
+    // acc_output.rect, "[Attention:forward:output]");
+  }
+}
+
+IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(FFHandler handler,
+                                               IncMultiHeadSelfAttention const *attn,
+                                               Memory gpu_mem,
+                                               int num_samples,
+                                               int num_heads)
+    : OpMeta(handler) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  checkCUDNN(cudnnSetStream(handler.dnn, stream));
+
+  checkCUDNN(cudnnCreateAttnDescriptor(&attnDesc));
+  checkCUDNN(cudnnCreateSeqDataDescriptor(&qDesc));
+  checkCUDNN(cudnnCreateSeqDataDescriptor(&kDesc));
+  checkCUDNN(cudnnCreateSeqDataDescriptor(&vDesc));
+  checkCUDNN(cudnnCreateSeqDataDescriptor(&oDesc));
+  // Currently do not support adding bias to key/value projection
+  assert(!attn->add_bias_kv);
+  cudnnAttnQueryMap_t attnMode = CUDNN_ATTN_QUERYMAP_ALL_TO_ONE;
+  // Assume no beam search for now
+  int maxBeamSize = 1;
+  // printf("batchSize(%d) qSize(%d) kSize(%d) vSize(%d) qProjSize(%d)
+  // kProjSize(%d)\n",
+  //     num_samples, attn->qSize, attn->kSize, attn->vSize, attn->qProjSize,
+  //     attn->kProjSize);
+  // printf("vProjSize(%d) oProjSize(%d) qoSeqLength(%d) kvSeqLength(%d)\n",
+  //     attn->vProjSize, attn->oProjSize, attn->qoSeqLength,
+  //     attn->kvSeqLength);
+  cudnnMathType_t math_type;
+  if (handle.allowTensorOpMathConversion) {
+    math_type = CUDNN_TENSOR_OP_MATH_ALLOW_CONVERSION;
+  } else {
+    math_type = CUDNN_TENSOR_OP_MATH;
+  }
+  checkCUDNN(cudnnSetAttnDescriptor(attnDesc,
+                                    attnMode,
+                                    num_heads,
+                                    1.0f /*smScalar*/,
+                                    CUDNN_DATA_FLOAT,
+                                    CUDNN_DATA_FLOAT,
+                                    math_type,
+                                    NULL /*attnDropoutDesc*/,
+                                    NULL /*postDropoutDesc*/,
+                                    attn->qSize,
+                                    attn->kSize,
+                                    attn->vSize,
+                                    attn->qProjSize,
+                                    attn->kProjSize,
+                                    attn->vProjSize,
+                                    attn->oProjSize,
+                                    attn->qoSeqLength,
+                                    attn->kvSeqLength,
+                                    num_samples,
+                                    maxBeamSize));
+  size_t workSpaceSize;
+  checkCUDNN(cudnnGetMultiHeadAttnBuffers(
+      handler.dnn, attnDesc, &weightSize, &workSpaceSize, &reserveSpaceSize));
+  assert(workSpaceSize <= handler.workSpaceSize);
+  // printf("weightSize(%zu) workSpaceSize(%zu) reserveSpaceSize(%zu)\n",
+  // weightSize, workSpaceSize, reserveSpaceSize);
+  int dimA[CUDNN_SEQDATA_DIM_COUNT];
+  cudnnSeqDataAxis_t axes[CUDNN_SEQDATA_DIM_COUNT];
+  assert(CUDNN_SEQDATA_DIM_COUNT == 4);
+  axes[3] = CUDNN_SEQDATA_VECT_DIM; // 3 = nbDims-1
+  axes[2] = CUDNN_SEQDATA_BEAM_DIM;
+  axes[1] = CUDNN_SEQDATA_TIME_DIM;
+  axes[0] = CUDNN_SEQDATA_BATCH_DIM;
+  int *qoSeqArray = (int *)malloc(sizeof(int) * num_samples);
+  int *kvSeqArray = (int *)malloc(sizeof(int) * num_samples);
+  for (int i = 0; i < num_samples; i++) {
+    qoSeqArray[i] = attn->qoSeqLength;
+    kvSeqArray[i] = attn->kvSeqLength;
+  }
+  // Set qDesc
+  {
+    dimA[CUDNN_SEQDATA_BEAM_DIM] = 1;
+    dimA[CUDNN_SEQDATA_BATCH_DIM] = num_samples;
+    dimA[CUDNN_SEQDATA_TIME_DIM] = attn->qoSeqLength;
+    dimA[CUDNN_SEQDATA_VECT_DIM] = attn->qSize;
+    checkCUDNN(cudnnSetSeqDataDescriptor(qDesc,
+                                         CUDNN_DATA_FLOAT,
+                                         CUDNN_SEQDATA_DIM_COUNT,
+                                         dimA,
+                                         axes,
+                                         num_samples,
+                                         qoSeqArray,
+                                         NULL));
+  }
+  // Set kDesc
+  {
+    dimA[CUDNN_SEQDATA_BEAM_DIM] = 1;
+    dimA[CUDNN_SEQDATA_BATCH_DIM] = num_samples;
+    dimA[CUDNN_SEQDATA_TIME_DIM] = attn->kvSeqLength;
+    dimA[CUDNN_SEQDATA_VECT_DIM] = attn->kSize;
+    checkCUDNN(cudnnSetSeqDataDescriptor(kDesc,
+                                         CUDNN_DATA_FLOAT,
+                                         CUDNN_SEQDATA_DIM_COUNT,
+                                         dimA,
+                                         axes,
+                                         num_samples,
+                                         kvSeqArray,
+                                         NULL));
+  }
+  // Set vDesc
+  {
+    dimA[CUDNN_SEQDATA_BEAM_DIM] = 1;
+    dimA[CUDNN_SEQDATA_BATCH_DIM] = num_samples;
+    dimA[CUDNN_SEQDATA_TIME_DIM] = attn->kvSeqLength;
+    dimA[CUDNN_SEQDATA_VECT_DIM] = attn->vSize;
+    checkCUDNN(cudnnSetSeqDataDescriptor(vDesc,
+                                         CUDNN_DATA_FLOAT,
+                                         CUDNN_SEQDATA_DIM_COUNT,
+                                         dimA,
+                                         axes,
+                                         num_samples,
+                                         kvSeqArray,
+                                         NULL));
+  }
+  // Set oDesc
+  {
+    dimA[CUDNN_SEQDATA_BEAM_DIM] = 1;
+    dimA[CUDNN_SEQDATA_BATCH_DIM] = num_samples;
+    dimA[CUDNN_SEQDATA_TIME_DIM] = attn->qoSeqLength;
+    dimA[CUDNN_SEQDATA_VECT_DIM] = attn->oProjSize;
+    checkCUDNN(cudnnSetSeqDataDescriptor(oDesc,
+                                         CUDNN_DATA_FLOAT,
+                                         CUDNN_SEQDATA_DIM_COUNT,
+                                         dimA,
+                                         axes,
+                                         num_samples,
+                                         qoSeqArray,
+                                         NULL));
+  }
+  // allocate memory for the seqArray and reserve space
+  {
+    size_t totalSize = reserveSpaceSize + sizeof(int) * num_samples * 2;
+    Realm::Rect<1, coord_t> bounds(Realm::Point<1, coord_t>(0),
+                                   Realm::Point<1, coord_t>(totalSize - 1));
+    std::vector<size_t> field_sizes;
+    field_sizes.push_back(sizeof(char));
+    Realm::RegionInstance::create_instance(reserveInst,
+                                           gpu_mem,
+                                           bounds,
+                                           field_sizes,
+                                           0,
+                                           Realm::ProfilingRequestSet())
+        .wait();
+    devQoSeqArray = (int *)reserveInst.pointer_untyped(0, sizeof(char));
+    checkCUDA(cudaMemcpy(devQoSeqArray,
+                         qoSeqArray,
+                         sizeof(int) * num_samples,
+                         cudaMemcpyHostToDevice));
+    devKvSeqArray = (int *)devQoSeqArray + num_samples;
+    checkCUDA(cudaMemcpy(devKvSeqArray,
+                         kvSeqArray,
+                         sizeof(int) * num_samples,
+                         cudaMemcpyHostToDevice));
+    reserveSpace = (int *)devKvSeqArray + num_samples;
+  }
+  // allocate memory for loWinIdx/hiWinIdx
+  loWinIdx = (int *)malloc(sizeof(int) * attn->qoSeqLength);
+  hiWinIdx = (int *)malloc(sizeof(int) * attn->qoSeqLength);
+  for (int i = 0; i < attn->qoSeqLength; i++) {
+    loWinIdx[i] = 0;
+    hiWinIdx[i] = attn->kvSeqLength;
+  }
+  free(qoSeqArray);
+  free(kvSeqArray);
+}
+
+IncMultiHeadSelfAttentionMeta::~IncMultiHeadSelfAttentionMeta(void) {
+  reserveInst.destroy();
+  free(loWinIdx);
+  free(hiWinIdx);
+  checkCUDNN(cudnnDestroyAttnDescriptor(attnDesc));
+  checkCUDNN(cudnnDestroySeqDataDescriptor(qDesc));
+  checkCUDNN(cudnnDestroySeqDataDescriptor(kDesc));
+  checkCUDNN(cudnnDestroySeqDataDescriptor(vDesc));
+  checkCUDNN(cudnnDestroySeqDataDescriptor(oDesc));
+}
+
+}; // namespace FlexFlow
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 4fdc1f9819..ee274dc427 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -40,6 +40,7 @@
 #include "flexflow/ops/fused.h"
 #include "flexflow/ops/gather.h"
 #include "flexflow/ops/groupby.h"
+#include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ops/layer_norm.h"
 #include "flexflow/ops/linear.h"
 #include "flexflow/ops/noop.h"
@@ -2736,6 +2737,12 @@ Op *FFModel::create_operator_from_layer(
       operators.push_back(op);
       return op;
     }
+    case OP_INC_MULTIHEAD_SELF_ATTENTION: {
+      Op *op = IncMultiHeadSelfAttention::create_operator_from_layer(
+          *this, layer, inputs);
+      operators.push_back(op);
+      return op;
+    }
     case OP_BATCHMATMUL: {
       Op *op = BatchMatmul::create_operator_from_layer(*this, layer, inputs);
       operators.push_back(op);
@@ -4491,6 +4498,25 @@ void register_flexflow_internal_tasks() {
     Runtime::preregister_task_variant<MultiHeadAttention::backward_task>(
         registrar, "MultiHeadAttention Backward Task");
   }
+  // MultiHeadAttention task
+  {
+    TaskVariantRegistrar registrar(INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
+                                   "IncMultiHeadSelfAttention Init");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<OpMeta *,
+                                      IncMultiHeadSelfAttention::init_task>(
+        registrar, "IncMultiHeadSelfAttention Init Task");
+  }
+  {
+    TaskVariantRegistrar registrar(INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
+                                   "IncMultiHeadSelfAttention Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<
+        IncMultiHeadSelfAttention::inference_task>(
+        registrar, "IncMultiHeadSelfAttention Inference Task");
+  }
   // NoOp
   {
     TaskVariantRegistrar registrar(NOOP_INIT_TASK_ID, "Weight NCCL Init");

From 8c0fe63cd2c4d0c33ba652b2b5030743a57872c9 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Mon, 27 Feb 2023 09:43:46 -0600
Subject: [PATCH 062/344] [IncMultiHeadSelfAttention] initial implementation
 (#639)

---
 include/flexflow/ffconst.h                    |   1 +
 include/flexflow/model.h                      |  19 +
 include/flexflow/operator_params.h            |   2 +
 .../ops/inc_multihead_self_attention.h        | 129 ++++
 .../ops/inc_multihead_self_attention_params.h |  30 +
 src/ops/inc_multihead_self_attention.cc       | 692 ++++++++++++++++++
 src/ops/inc_multihead_self_attention.cu       | 267 +++++++
 src/runtime/model.cc                          |  26 +
 8 files changed, 1166 insertions(+)
 create mode 100644 include/flexflow/ops/inc_multihead_self_attention.h
 create mode 100644 include/flexflow/ops/inc_multihead_self_attention_params.h
 create mode 100644 src/ops/inc_multihead_self_attention.cc
 create mode 100644 src/ops/inc_multihead_self_attention.cu

diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index ee0b007a8e..2ccf4a0eb1 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -146,6 +146,7 @@ enum OperatorType {
   OP_LAYERNORM,
   OP_EXPERTS,
   OP_GATHER, // https://pytorch.org/docs/stable/generated/torch.gather.html
+  OP_INC_MULTIHEAD_SELF_ATTENTION,
   // Parallel Ops
   OP_REPARTITION,
   OP_COMBINE,
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 2c460e507a..041d8c507d 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -136,6 +136,10 @@ enum TaskIDs {
   ATTENTION_INIT_TASK_ID,
   ATTENTION_FWD_TASK_ID,
   ATTENTION_BWD_TASK_ID,
+  INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
+  INC_MULTIHEAD_SELF_ATTENTION_FWD_TASK_ID,
+  INC_MULTIHEAD_SELF_ATTENTION_BWD_TASK_ID,
+  INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
   MSELOSS_BWD_TASK_ID,
   FUSEDOP_INIT_TASK_ID,
   FUSEDOP_FWD_TASK_ID,
@@ -269,6 +273,7 @@ class Group_by;
 class LayerNorm;
 class Linear;
 class MultiHeadAttention;
+class IncMultiHeadSelfAttention;
 class Pool2D;
 class Reduce;
 class Reshape;
@@ -564,6 +569,17 @@ class FFModel {
                              bool add_zero_attn = false,
                              Initializer *kernel_initializer = NULL,
                              char const *name = NULL);
+  Tensor inc_multihead_self_attention(const Tensor input,
+                                      int embed_dim,
+                                      int num_heads,
+                                      int kdim = 0,
+                                      int vdim = 0,
+                                      float dropout = 0.0f,
+                                      bool bias = true,
+                                      bool add_bias_kv = false,
+                                      bool add_zero_attn = false,
+                                      Initializer *kernel_initializer = NULL,
+                                      char const *name = NULL);
   Tensor create_tensor_legion_ordering(int num_dim,
                                        int const dims[],
                                        DataType data_type,
@@ -910,6 +926,9 @@ class FFModel {
                                               ParallelTensorShape>,
                                    MultiHeadAttentionParams>,
                          MultiHeadAttention *>,
+      std::unordered_map<
+          std::pair<ParallelTensorShape, IncMultiHeadSelfAttentionParams>,
+          IncMultiHeadSelfAttention *>,
       std::unordered_map<std::pair<ParallelTensorShape, ReduceParams>,
                          Reduce *>,
       std::unordered_map<std::pair<ParallelTensorShape, ReshapeParams>,
diff --git a/include/flexflow/operator_params.h b/include/flexflow/operator_params.h
index 0297f690f5..899921a758 100644
--- a/include/flexflow/operator_params.h
+++ b/include/flexflow/operator_params.h
@@ -16,6 +16,7 @@
 #include "flexflow/ops/flat_params.h"
 #include "flexflow/ops/gather_params.h"
 #include "flexflow/ops/groupby_params.h"
+#include "flexflow/ops/inc_multihead_self_attention_params.h"
 #include "flexflow/ops/layer_norm_params.h"
 #include "flexflow/ops/linear_params.h"
 #include "flexflow/ops/pool_2d_params.h"
@@ -52,6 +53,7 @@ using OperatorParameters = mp::variant<AggregateParams,
                                        LayerNormParams,
                                        LinearParams,
                                        MultiHeadAttentionParams,
+                                       IncMultiHeadSelfAttentionParams,
                                        Pool2DParams,
                                        ReduceParams,
                                        ReshapeParams,
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
new file mode 100644
index 0000000000..0b1572f2ca
--- /dev/null
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -0,0 +1,129 @@
+#ifndef _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_H
+#define _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_H
+
+
+#include "flexflow/device.h"
+#include "flexflow/fftype.h"
+#include "flexflow/layer.h"
+#include "flexflow/node.h"
+#include "flexflow/op_meta.h"
+#include "flexflow/operator.h"
+#include "flexflow/ops/inc_multihead_self_attention_params.h"
+
+namespace FlexFlow {
+
+class IncMultiHeadSelfAttentionMeta;
+
+class IncMultiHeadSelfAttention : public Op {
+public:
+  using Params = IncMultiHeadSelfAttentionParams;
+  using Input = ParallelTensor;
+
+  IncMultiHeadSelfAttention(FFModel &model,
+                     LayerID const &layer_guid,
+                     const ParallelTensor _input,
+                     int _embed_dim,
+                     int _num_heads,
+                     int _kdim,
+                     int _vdim,
+                     float _dropout,
+                     bool _bias,
+                     bool _add_bias_kv,
+                     bool _add_zero_attn,
+                     bool allocate_weights,
+                     char const *name);
+  IncMultiHeadSelfAttention(FFModel &model,
+                     const ParallelTensor _input,
+                     const ParallelTensor _weight,
+                     int _embed_dim,
+                     int _num_heads,
+                     int _kdim,
+                     int _vdim,
+                     float _dropout,
+                     bool _bias,
+                     bool _add_bias_kv,
+                     bool _add_zero_attn,
+                     bool allocate_weights,
+                     char const *name);
+  IncMultiHeadSelfAttention(FFModel &model,
+                     IncMultiHeadSelfAttention const &other,
+                     const ParallelTensor input,
+                     bool allocate_weights);
+  IncMultiHeadSelfAttention(FFModel &model,
+                     Params const &params,
+                     Input const &inputs,
+                     bool allocate_weights = false,
+                     char const *name = nullptr);
+  static Op *
+      create_operator_from_layer(FFModel &model,
+                                 Layer const *layer,
+                                 std::vector<ParallelTensor> const &inputs);
+  void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
+  void forward(FFModel const &) override;
+  void backward(FFModel const &) override;
+  void inference(FFModel const &,
+                 std::vector<ParallelTensor> const &,
+                 std::vector<ParallelTensor> const &,
+                 MachineView const *mv = nullptr) override;
+  void print_layer(FFModel const &model) override {
+    assert(0);
+  }
+  bool get_int_parameter(PMParameter, int *) const override;
+
+  static OpMeta *init_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
+  bool measure_operator_cost(Simulator *sim,
+                             MachineView const &mv,
+                             CostMetrics &cost_metrics) const override;
+  static void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
+                               float const *input_ptr,
+                               float const *weight_ptr,
+                               float *output_ptr,
+                               ffStream_t stream);
+  static void inference_kernel_wrapper(IncMultiHeadSelfAttentionMeta const *m,
+                                     float const *input_ptr,
+                                     float const *weight_ptr,
+                                     float *output_ptr);
+  Params get_params() const;
+public:
+  int num_heads;
+  float dropout;
+  bool bias;
+  bool add_bias_kv, add_zero_attn;
+  int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
+  int qoSeqLength, kvSeqLength;
+};
+
+class IncMultiHeadSelfAttentionMeta : public OpMeta {
+public:
+  IncMultiHeadSelfAttentionMeta(FFHandler handler,
+                         IncMultiHeadSelfAttention const *attn,
+                         Legion::Memory gpu_mem,
+                         int num_samples,
+                         int num_heads);
+  ~IncMultiHeadSelfAttentionMeta(void);
+
+public:
+  Realm::RegionInstance reserveInst;
+  size_t weightSize, reserveSpaceSize;
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+  cudnnAttnDescriptor_t attnDesc;
+  cudnnSeqDataDescriptor_t qDesc, kDesc, vDesc, oDesc;
+#endif
+  int *devQoSeqArray, *devKvSeqArray, *loWinIdx, *hiWinIdx;
+  void *reserveSpace;
+};
+
+}; // namespace FlexFlow
+
+#endif // _FLEXFLOW_ATTENTION_H
diff --git a/include/flexflow/ops/inc_multihead_self_attention_params.h b/include/flexflow/ops/inc_multihead_self_attention_params.h
new file mode 100644
index 0000000000..e7535dc23d
--- /dev/null
+++ b/include/flexflow/ops/inc_multihead_self_attention_params.h
@@ -0,0 +1,30 @@
+#ifndef _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_PARAMS_H
+#define _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_PARAMS_H
+
+#include "flexflow/fftype.h"
+#include "flexflow/parallel_tensor.h"
+
+namespace FlexFlow {
+
+struct IncMultiHeadSelfAttentionParams {
+  LayerID layer_guid;
+  int embed_dim, num_heads, kdim, vdim;
+  float dropout;
+  bool bias, add_bias_kv, add_zero_attn;
+
+  bool is_valid(ParallelTensorShape const &) const;
+};
+
+bool operator==(IncMultiHeadSelfAttentionParams const &,
+                IncMultiHeadSelfAttentionParams const &);
+
+} // namespace FlexFlow
+
+namespace std {
+template <>
+struct hash<FlexFlow::IncMultiHeadSelfAttentionParams> {
+  size_t operator()(FlexFlow::IncMultiHeadSelfAttentionParams const &) const;
+};
+} // namespace std
+
+#endif // _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_PARAMS_H
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
new file mode 100644
index 0000000000..329254fb74
--- /dev/null
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -0,0 +1,692 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/inc_multihead_self_attention.h"
+#include "flexflow/model.h"
+#include "flexflow/utils/hash_utils.h"
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::ArgumentMap;
+using Legion::Context;
+using Legion::coord_t;
+using Legion::Domain;
+using Legion::FutureMap;
+using Legion::IndexLauncher;
+using Legion::Machine;
+using Legion::Memory;
+using Legion::PhysicalRegion;
+using Legion::Predicate;
+using Legion::Rect;
+using Legion::RegionRequirement;
+using Legion::Runtime;
+using Legion::Task;
+using Legion::TaskArgument;
+using Legion::TaskLauncher;
+
+bool IncMultiHeadSelfAttentionParams::is_valid(ParallelTensorShape const &input) const {
+  bool is_valid = input.is_valid();
+  return is_valid;
+}
+
+Tensor FFModel::inc_multihead_self_attention(const Tensor input,
+                                             int embed_dim,
+                                             int num_heads,
+                                             int kdim,
+                                             int vdim,
+                                             float dropout,
+                                             bool bias,
+                                             bool add_bias_kv,
+                                             bool add_zero_attn,
+                                             Initializer *kernel_initializer,
+                                             char const *name) {
+  // Currently assume that 
+  Layer *li = new Layer(this,
+                        OP_INC_MULTIHEAD_SELF_ATTENTION,
+                        DT_FLOAT,
+                        name,
+                        1 /*inputs*/,
+                        1 /*weights*/,
+                        1 /*outputs*/,
+                        input);
+  {
+    int numdims = input->num_dims;
+    int dims[MAX_TENSOR_DIM];
+    for (int i = 0; i < numdims; i++) {
+      dims[i] = input->dims[i];
+    }
+    dims[0] = embed_dim;
+    li->outputs[0] = create_tensor_legion_ordering(
+        numdims, dims, DT_FLOAT, li, 0, true /*create_grad*/);
+  }
+  {
+    // Compute weight size
+    int qProjSize = kdim, kProjSize = kdim, vProjSize = kdim,
+        oProjSize = embed_dim;
+    int qSize = input->dims[0], kSize = input->dims[0], vSize = input->dims[0];
+    int qParas = qProjSize * qSize;
+    int kParas = kProjSize * kSize;
+    int vParas = vProjSize * vSize;
+    int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
+    int dims[2] = {qParas + kParas + vParas + oParas, num_heads};
+    li->weights[0] = create_weight_legion_ordering(2,
+                                                   dims,
+                                                   DT_FLOAT,
+                                                   li,
+                                                   true /*create_grad*/,
+                                                   kernel_initializer,
+                                                   CHOSEN_SYNC_TYPE);
+  }
+  li->data_type = DT_FLOAT;
+  li->add_int_property("embed_dim", embed_dim);
+  li->add_int_property("num_heads", num_heads);
+  li->add_int_property("kdim", kdim);
+  li->add_int_property("vdim", vdim);
+  li->add_int_property("bias", bias);
+  li->add_int_property("add_bias_kv", add_bias_kv);
+  li->add_int_property("add_zero_attn", add_zero_attn);
+  li->add_float_property("dropout", dropout);
+  layers.push_back(li);
+  return li->outputs[0];
+}
+
+Op *IncMultiHeadSelfAttention::create_operator_from_layer(
+    FFModel &model,
+    Layer const *layer,
+    std::vector<ParallelTensor> const &inputs) {
+  long long value;
+  layer->get_int_property("embed_dim", value);
+  int embed_dim = value;
+  layer->get_int_property("num_heads", value);
+  int num_heads = value;
+  layer->get_int_property("kdim", value);
+  int kdim = value;
+  layer->get_int_property("vdim", value);
+  int vdim = value;
+  float dropout;
+  layer->get_float_property("dropout", dropout);
+  layer->get_int_property("bias", value);
+  bool bias = (bool)value;
+  layer->get_int_property("add_bias_kv", value);
+  bool add_bias_kv = (bool)value;
+  layer->get_int_property("add_zero_attn", value);
+  bool add_zero_attn = (bool)value;
+  return new IncMultiHeadSelfAttention(model,
+                                       layer->layer_guid,
+                                       inputs[0],
+                                       embed_dim,
+                                       num_heads,
+                                       kdim,
+                                       vdim,
+                                       dropout,
+                                       bias,
+                                       add_bias_kv,
+                                       add_zero_attn,
+                                       false /*allocate_weights*/,
+                                       layer->name);
+}
+
+IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(FFModel &model,
+                                                     LayerID const &_layer_guid,
+                                                     const ParallelTensor _input,
+                                                     int _embed_dim,
+                                                     int _num_heads,
+                                                     int _kdim,
+                                                     int _vdim,
+                                                     float _dropout,
+                                                     bool _bias,
+                                                     bool _add_bias_kv,
+                                                     bool _add_zero_attn,
+                                                     bool allocate_weights,
+                                                     char const *name)
+    // Initializer* _bias_initializer)
+    : Op(model,
+         OP_MULTIHEAD_ATTENTION,
+         DT_FLOAT,
+         name,
+         1 /*inputs*/,
+         1 /*weights*/,
+         1 /*outputs*/,
+         _input),
+      num_heads(_num_heads), dropout(_dropout), bias(_bias),
+      add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      qSize(_input->dims[0].size), kSize(_input->dims[0].size),
+      vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
+      vProjSize(_vdim), oProjSize(_embed_dim),
+      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size)
+{
+  // overwrite layer_guid
+  layer_guid = _layer_guid;
+
+  numOutputs = 1;
+  int numdim = _input->num_dims;
+  ParallelDim dims[MAX_TENSOR_DIM];
+  for (int i = 0; i < numdim; i++) {
+    dims[i] = _input->dims[i];
+  }
+  dims[0].size = _embed_dim;
+  // Currently require no parallelism along this dim
+  assert(dims[0].degree == 1);
+  if (allocate_weights) {
+    // Create weight tensor
+    int num_dims = inputs[0]->num_dims;
+    // Compute weight size
+    int qParas = this->qProjSize * this->qSize;
+    int kParas = this->kProjSize * this->kSize;
+    int vParas = this->vProjSize * this->vSize;
+    int oParas =
+        this->oProjSize * (this->vProjSize > 0 ? this->vProjSize : this->vSize);
+    ParallelDim dims[3];
+    dims[0] = inputs[0]->dims[num_dims - 2];
+    dims[0].size = dims[0].degree;
+    dims[1] = inputs[0]->dims[num_dims - 1];
+    dims[1].size = this->num_heads;
+    dims[2].size = qParas + kParas + vParas + oParas;
+    dims[2].degree = 1;
+    dims[2].parallel_idx = -1;
+    int seed = std::rand();
+    Initializer *initializer = new GlorotUniform(seed);
+#ifdef USE_NCCL
+    ParameterSyncType comm_type = ParameterSyncType::NCCL;
+#else
+    ParameterSyncType comm_type = ParameterSyncType::PS;
+#endif
+    weights[0] = model.create_parallel_weight<3>(dims,
+                                                 DT_FLOAT,
+                                                 NULL /*owner_op*/,
+                                                 true /*create_grad*/,
+                                                 initializer,
+                                                 comm_type);
+  }
+
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      _input->num_dims, dims, DT_FLOAT, this);
+  /* for (int i = 0; i < numdim; i++) { */
+  /*   register_output_input_parallel_dims(outputs[0], i, inputs[0], i); */
+  /* } */
+  /* // Check correctness */
+  /* assert(check_output_input_weight_parallel_dims()); */
+}
+
+IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(FFModel &model,
+                                                     const ParallelTensor _input,
+                                                     const ParallelTensor _weight,
+                                                     int _embed_dim,
+                                                     int _num_heads,
+                                                     int _kdim,
+                                                     int _vdim,
+                                                     float _dropout,
+                                                     bool _bias,
+                                                     bool _add_bias_kv,
+                                                     bool _add_zero_attn,
+                                                     bool allocate_weights,
+                                                     char const *name)
+    // Initializer* _bias_initializer)
+    : Op(model,
+         OP_INC_MULTIHEAD_SELF_ATTENTION,
+         DT_FLOAT,
+         name,
+         1 /*inputs*/,
+         1 /*weights*/,
+         1 /*outputs*/,
+         _input,
+         _weight),
+      num_heads(_num_heads), dropout(_dropout), bias(_bias),
+      add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      qSize(_input->dims[0].size), kSize(_input->dims[0].size),
+      vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
+      vProjSize(_vdim), oProjSize(_embed_dim),
+      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size)
+// bias_initializer(_bias_initializer)
+{
+  numOutputs = 1;
+  int numdim = _input->num_dims;
+  ParallelDim dims[MAX_TENSOR_DIM];
+  for (int i = 0; i < numdim; i++) {
+    dims[i] = _input->dims[i];
+  }
+  dims[0].size = _embed_dim;
+  // Currently require no parallelism along this dim
+  assert(dims[0].degree == 1);
+  if (allocate_weights) {
+    // Create weight tensor
+    int num_dims = inputs[0]->num_dims;
+    // Compute weight size
+    int qParas = this->qProjSize * this->qSize;
+    int kParas = this->kProjSize * this->kSize;
+    int vParas = this->vProjSize * this->vSize;
+    int oParas =
+        this->oProjSize * (this->vProjSize > 0 ? this->vProjSize : this->vSize);
+    ParallelDim dims[3];
+    dims[0] = inputs[0]->dims[num_dims - 2];
+    dims[0].size = dims[0].degree;
+    dims[1] = inputs[0]->dims[num_dims - 1];
+    dims[1].size = this->num_heads;
+    dims[2].size = qParas + kParas + vParas + oParas;
+    int seed = std::rand();
+    Initializer *initializer = new GlorotUniform(seed);
+#ifdef USE_NCCL
+    ParameterSyncType comm_type = ParameterSyncType::NCCL;
+#else
+    ParameterSyncType comm_type = ParameterSyncType::PS;
+#endif
+    weights[0] = model.create_parallel_weight<3>(dims,
+                                                 DT_FLOAT,
+                                                 NULL /*owner_op*/,
+                                                 true /*create_grad*/,
+                                                 initializer,
+                                                 comm_type);
+  }
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      _input->num_dims, dims, DT_FLOAT, this);
+
+  /* for (int i = 0; i < numdim; i++) { */
+  /*   register_output_input_parallel_dims(outputs[0], i, inputs[0], i); */
+  /* } */
+  /* register_output_weight_parallel_dims(outputs[0], numdim-1, _weight, 1); */
+  /* register_output_weight_parallel_dims(outputs[0], numdim-2, _weight, 2); */
+  // Check correctness
+  /* assert(check_output_input_weight_parallel_dims()); */
+}
+
+IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(FFModel &model,
+                                       IncMultiHeadSelfAttention const &other,
+                                       const ParallelTensor input,
+                                       bool allocate_weights)
+    : IncMultiHeadSelfAttention(model,
+                         other.layer_guid,
+                         input,
+                         other.oProjSize,
+                         other.num_heads,
+                         other.qProjSize,
+                         other.vProjSize,
+                         other.dropout,
+                         other.bias,
+                         other.add_bias_kv,
+                         other.add_zero_attn,
+                         allocate_weights,
+                         other.name) {}
+
+IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
+    FFModel &model,
+    IncMultiHeadSelfAttentionParams const &params,
+    ParallelTensor const &input,
+    bool allocate_weights,
+    char const *name)
+    : IncMultiHeadSelfAttention(model,
+                         params.layer_guid,
+                         input,
+                         params.embed_dim,
+                         params.num_heads,
+                         params.kdim,
+                         params.vdim,
+                         params.dropout,
+                         params.bias,
+                         params.add_bias_kv,
+                         params.add_zero_attn,
+                         allocate_weights,
+                         name) {}
+
+void IncMultiHeadSelfAttention::init_inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, view);
+  IndexLauncher launcher(INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(IncMultiHeadSelfAttention)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, view);
+}
+
+void IncMultiHeadSelfAttention::init(FFModel const &ff) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(IncMultiHeadSelfAttention)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
+/*
+  regions[0](I): input
+  regions[1](I): weight
+  regions[2](O): output
+*/
+OpMeta *
+    IncMultiHeadSelfAttention::init_task(Task const *task,
+                                  std::vector<PhysicalRegion> const &regions,
+                                  Context ctx,
+                                  Runtime *runtime) {
+  IncMultiHeadSelfAttention const *attn = (IncMultiHeadSelfAttention *)task->args;
+  FFHandler handle = *((FFHandler const *)task->local_args);
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      DT_FLOAT, regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
+      DT_FLOAT, regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      DT_FLOAT, regions[2], task->regions[2], FID_DATA, ctx, runtime);
+
+  int num_samples = input.domain.hi()[2] - input.domain.lo()[2] + 1;
+  assert(attn->qoSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
+  assert(attn->kvSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
+  int num_heads = weight.domain.hi()[1] - weight.domain.lo()[1] + 1;
+  assert(attn->oProjSize == output.domain.hi()[0] - output.domain.lo()[0] + 1);
+
+  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                       .only_kind(Memory::GPU_FB_MEM)
+                       .best_affinity_to(task->target_proc)
+                       .first();
+  IncMultiHeadSelfAttentionMeta *m =
+      new IncMultiHeadSelfAttentionMeta(handle, attn, gpu_mem, num_samples, num_heads);
+  m->profiling = attn->profiling;
+  assert(weight.domain.get_volume() * sizeof(float) == m->weightSize);
+  return m;
+}
+
+void IncMultiHeadSelfAttention::forward(FFModel const &ff) {
+  // IncMultiHeadSelfAttention doesn't support forward
+  assert(false);
+}
+
+void IncMultiHeadSelfAttention::inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, view);
+  size_t machine_view_hash = view->hash();
+  /* std::cout << "IncMultiHeadSelfAttention op machine_view: " << *(MachineView const
+     *)mv
+            << std::endl; */
+  int idx = 0;
+  IndexLauncher launcher(INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(idx++, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(idx++, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(idx++, FID_DATA);
+  runtime->execute_index_space(ctx, launcher);
+}
+
+/*
+  regions[0](I): input
+  regions[3](I): weight
+  regions[4](O): output
+*/
+void IncMultiHeadSelfAttention::inference_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  assert(regions.size() == 3);
+  assert(task->regions.size() == regions.size());
+  // const IncMultiHeadSelfAttention* attn = (IncMultiHeadSelfAttention*) task->args;
+  IncMultiHeadSelfAttentionMeta const *m =
+      *((IncMultiHeadSelfAttentionMeta **)task->local_args);
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
+      m->weight_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+
+  IncMultiHeadSelfAttention::inference_kernel_wrapper(m,
+                                             input.get_float_ptr(),
+                                             weight.get_float_ptr(),
+                                             output.get_float_ptr());
+}
+
+void IncMultiHeadSelfAttention::backward(FFModel const &ff) {
+  // IncMultiHeadSelfAttention does not support backward
+  assert(false);
+}
+
+bool IncMultiHeadSelfAttention::get_int_parameter(PMParameter para, int *value) const {
+  switch (para) {
+    case PM_NUM_HEADS:
+      *value = num_heads;
+      return true;
+    default:
+      return Op::get_int_parameter(para, value);
+  }
+}
+
+bool IncMultiHeadSelfAttention::measure_operator_cost(
+    Simulator *sim, MachineView const &mv, CostMetrics &cost_metrics) const {
+  ParallelTensorBase sub_output, sub_input;
+  if (!inputs[0]->get_sub_tensor(mv, sub_input)) {
+    return false;
+  }
+  if (!outputs[0]->get_sub_tensor(mv, sub_output)) {
+    return false;
+  }
+  // Currently assume only data parallel
+  size_t num_weights = 0;
+  {
+    // Compute weight size
+    int qSize = sub_input.dims[0].size;
+    int kSize = sub_input.dims[0].size;
+    int vSize = sub_input.dims[0].size;
+    int qParas = qProjSize * qSize;
+    int kParas = kProjSize * kSize;
+    int vParas = vProjSize * vSize;
+    int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
+    num_weights = num_heads * (qParas + kParas + vParas + oParas);
+  }
+  assert(sub_input.num_dims == 4);
+  int num_samples = sub_input.dims[2].size;
+
+  IncMultiHeadSelfAttentionMeta *m = new IncMultiHeadSelfAttentionMeta(
+      sim->handler, this, sim->memory, num_samples, num_heads);
+
+  // allocate tensors in simulator
+  sim->free_all();
+  float const *input_ptr =
+      (float const *)sim->allocate(sub_input.get_volume(), DT_FLOAT);
+  cost_metrics.inputs_memory += cost_metrics.total_mem_diff_from(sim->offset);
+
+  float *output_ptr = (float *)sim->allocate(sub_output.get_volume(), DT_FLOAT);
+  assert(output_ptr != NULL);
+  cost_metrics.outputs_memory += cost_metrics.total_mem_diff_from(sim->offset);
+
+  float const *weight_ptr = (float const *)sim->allocate(num_weights, DT_FLOAT);
+  cost_metrics.weights_memory += cost_metrics.total_mem_diff_from(sim->offset);
+
+  assert(m->profiling == false);
+
+  std::function<void()> forward, backward;
+  forward = [&] {
+    inference_kernel_wrapper(
+        m, input_ptr, weight_ptr, output_ptr);
+  };
+  if (sim->computationMode == COMP_MODE_TRAINING) {
+    // IncMultiHeadSelfAttention does not support training
+    assert(false);
+  }
+
+  inner_measure_operator_cost(sim, forward, backward, cost_metrics);
+
+  if (sim->computationMode == COMP_MODE_TRAINING) {
+    printf("[Measure IncMultiHeadSelfAttention] query(%d %d %d) key(%d %d %d) "
+           "value(%d %d %d) output(%d %d %d)"
+           "forward_time(%.4lf) backward_time(%.4lf)\n",
+           sub_input.dims[2].size,
+           sub_input.dims[1].size,
+           sub_input.dims[0].size,
+           sub_input.dims[2].size,
+           sub_input.dims[1].size,
+           sub_input.dims[0].size,
+           sub_input.dims[2].size,
+           sub_input.dims[1].size,
+           sub_input.dims[0].size,
+           sub_output.dims[2].size,
+           sub_output.dims[1].size,
+           sub_output.dims[0].size,
+           cost_metrics.forward_time,
+           cost_metrics.backward_time);
+  } else {
+    printf("[Measure IncMultiHeadSelfAttention] query(%d %d %d) key(%d %d %d) "
+           "value(%d %d %d) output(%d %d %d)"
+           "forward_time(%.4lf)\n",
+           sub_input.dims[2].size,
+           sub_input.dims[1].size,
+           sub_input.dims[0].size,
+           sub_input.dims[2].size,
+           sub_input.dims[1].size,
+           sub_input.dims[0].size,
+           sub_input.dims[2].size,
+           sub_input.dims[1].size,
+           sub_input.dims[0].size,
+           sub_output.dims[2].size,
+           sub_output.dims[1].size,
+           sub_output.dims[0].size,
+           cost_metrics.forward_time);
+  }
+  // Free multiheadattentionmeta
+  delete m;
+  return true;
+}
+
+using PCG::Node;
+
+bool operator==(IncMultiHeadSelfAttentionParams const &lhs,
+                IncMultiHeadSelfAttentionParams const &rhs) {
+  return lhs.layer_guid == rhs.layer_guid && lhs.embed_dim == rhs.embed_dim &&
+         lhs.num_heads == rhs.num_heads && lhs.kdim == rhs.kdim &&
+         lhs.vdim == rhs.vdim && lhs.dropout == rhs.dropout &&
+         lhs.bias == rhs.bias && lhs.add_bias_kv == rhs.add_bias_kv &&
+         lhs.add_zero_attn == rhs.add_zero_attn;
+}
+
+IncMultiHeadSelfAttentionParams IncMultiHeadSelfAttention::get_params() const {
+  IncMultiHeadSelfAttentionParams params;
+  params.layer_guid = this->layer_guid;
+  params.embed_dim = this->oProjSize;
+  params.num_heads = this->num_heads;
+  params.kdim = this->kProjSize;
+  params.vdim = this->vProjSize;
+  params.dropout = this->dropout;
+  params.bias = this->bias;
+  params.add_bias_kv = this->add_bias_kv;
+  params.add_zero_attn = this->add_zero_attn;
+  return params;
+}
+
+}; // namespace FlexFlow
+
+namespace std {
+size_t hash<FlexFlow::IncMultiHeadSelfAttentionParams>::operator()(
+    FlexFlow::IncMultiHeadSelfAttentionParams const &params) const {
+  size_t key = 0;
+  hash_combine(key, params.layer_guid.id);
+  hash_combine(key, params.embed_dim);
+  hash_combine(key, params.num_heads);
+  hash_combine(key, params.kdim);
+  hash_combine(key, params.vdim);
+  hash_combine(key, params.dropout);
+  hash_combine(key, params.bias);
+  hash_combine(key, params.add_bias_kv);
+  hash_combine(key, params.add_zero_attn);
+  return key;
+}
+}; // namespace std
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
new file mode 100644
index 0000000000..b903a6f073
--- /dev/null
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -0,0 +1,267 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/inc_multihead_self_attention.h"
+#include "flexflow/utils/cuda_helper.h"
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::coord_t;
+using Legion::Memory;
+
+/*static*/
+void IncMultiHeadSelfAttention::inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
+                                        float const *input_ptr,
+                                        float const *weight_ptr,
+                                        float *output_ptr,
+                                        cudaStream_t stream) {
+  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
+
+  checkCUDNN(cudnnMultiHeadAttnForward(m->handle.dnn,
+                                       m->attnDesc,
+                                       -1,
+                                       m->loWinIdx,
+                                       m->hiWinIdx,
+                                       m->devQoSeqArray,
+                                       m->devKvSeqArray,
+                                       m->qDesc,
+                                       input_ptr,
+                                       NULL /*residual*/,
+                                       m->kDesc,
+                                       input_ptr,
+                                       m->vDesc,
+                                       input_ptr,
+                                       m->oDesc,
+                                       output_ptr,
+                                       m->weightSize,
+                                       weight_ptr,
+                                       m->handle.workSpaceSize,
+                                       m->handle.workSpace,
+                                       m->reserveSpaceSize,
+                                       m->reserveSpace));
+}
+
+/*static*/
+void IncMultiHeadSelfAttention::inference_kernel_wrapper(IncMultiHeadSelfAttentionMeta const *m,
+                                                float const *input_ptr,
+                                                float const *weight_ptr,
+                                                float *output_ptr) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+  IncMultiHeadSelfAttention::inference_kernel(
+      m, input_ptr, weight_ptr, output_ptr, stream);
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("IncMultiHeadSelfAttention forward time = %.2fms\n", elapsed);
+    // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
+    // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
+    // acc_output.rect, "[Attention:forward:output]");
+  }
+}
+
+IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(FFHandler handler,
+                                               IncMultiHeadSelfAttention const *attn,
+                                               Memory gpu_mem,
+                                               int num_samples,
+                                               int num_heads)
+    : OpMeta(handler) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  checkCUDNN(cudnnSetStream(handler.dnn, stream));
+
+  checkCUDNN(cudnnCreateAttnDescriptor(&attnDesc));
+  checkCUDNN(cudnnCreateSeqDataDescriptor(&qDesc));
+  checkCUDNN(cudnnCreateSeqDataDescriptor(&kDesc));
+  checkCUDNN(cudnnCreateSeqDataDescriptor(&vDesc));
+  checkCUDNN(cudnnCreateSeqDataDescriptor(&oDesc));
+  // Currently do not support adding bias to key/value projection
+  assert(!attn->add_bias_kv);
+  cudnnAttnQueryMap_t attnMode = CUDNN_ATTN_QUERYMAP_ALL_TO_ONE;
+  // Assume no beam search for now
+  int maxBeamSize = 1;
+  // printf("batchSize(%d) qSize(%d) kSize(%d) vSize(%d) qProjSize(%d)
+  // kProjSize(%d)\n",
+  //     num_samples, attn->qSize, attn->kSize, attn->vSize, attn->qProjSize,
+  //     attn->kProjSize);
+  // printf("vProjSize(%d) oProjSize(%d) qoSeqLength(%d) kvSeqLength(%d)\n",
+  //     attn->vProjSize, attn->oProjSize, attn->qoSeqLength,
+  //     attn->kvSeqLength);
+  cudnnMathType_t math_type;
+  if (handle.allowTensorOpMathConversion) {
+    math_type = CUDNN_TENSOR_OP_MATH_ALLOW_CONVERSION;
+  } else {
+    math_type = CUDNN_TENSOR_OP_MATH;
+  }
+  checkCUDNN(cudnnSetAttnDescriptor(attnDesc,
+                                    attnMode,
+                                    num_heads,
+                                    1.0f /*smScalar*/,
+                                    CUDNN_DATA_FLOAT,
+                                    CUDNN_DATA_FLOAT,
+                                    math_type,
+                                    NULL /*attnDropoutDesc*/,
+                                    NULL /*postDropoutDesc*/,
+                                    attn->qSize,
+                                    attn->kSize,
+                                    attn->vSize,
+                                    attn->qProjSize,
+                                    attn->kProjSize,
+                                    attn->vProjSize,
+                                    attn->oProjSize,
+                                    attn->qoSeqLength,
+                                    attn->kvSeqLength,
+                                    num_samples,
+                                    maxBeamSize));
+  size_t workSpaceSize;
+  checkCUDNN(cudnnGetMultiHeadAttnBuffers(
+      handler.dnn, attnDesc, &weightSize, &workSpaceSize, &reserveSpaceSize));
+  assert(workSpaceSize <= handler.workSpaceSize);
+  // printf("weightSize(%zu) workSpaceSize(%zu) reserveSpaceSize(%zu)\n",
+  // weightSize, workSpaceSize, reserveSpaceSize);
+  int dimA[CUDNN_SEQDATA_DIM_COUNT];
+  cudnnSeqDataAxis_t axes[CUDNN_SEQDATA_DIM_COUNT];
+  assert(CUDNN_SEQDATA_DIM_COUNT == 4);
+  axes[3] = CUDNN_SEQDATA_VECT_DIM; // 3 = nbDims-1
+  axes[2] = CUDNN_SEQDATA_BEAM_DIM;
+  axes[1] = CUDNN_SEQDATA_TIME_DIM;
+  axes[0] = CUDNN_SEQDATA_BATCH_DIM;
+  int *qoSeqArray = (int *)malloc(sizeof(int) * num_samples);
+  int *kvSeqArray = (int *)malloc(sizeof(int) * num_samples);
+  for (int i = 0; i < num_samples; i++) {
+    qoSeqArray[i] = attn->qoSeqLength;
+    kvSeqArray[i] = attn->kvSeqLength;
+  }
+  // Set qDesc
+  {
+    dimA[CUDNN_SEQDATA_BEAM_DIM] = 1;
+    dimA[CUDNN_SEQDATA_BATCH_DIM] = num_samples;
+    dimA[CUDNN_SEQDATA_TIME_DIM] = attn->qoSeqLength;
+    dimA[CUDNN_SEQDATA_VECT_DIM] = attn->qSize;
+    checkCUDNN(cudnnSetSeqDataDescriptor(qDesc,
+                                         CUDNN_DATA_FLOAT,
+                                         CUDNN_SEQDATA_DIM_COUNT,
+                                         dimA,
+                                         axes,
+                                         num_samples,
+                                         qoSeqArray,
+                                         NULL));
+  }
+  // Set kDesc
+  {
+    dimA[CUDNN_SEQDATA_BEAM_DIM] = 1;
+    dimA[CUDNN_SEQDATA_BATCH_DIM] = num_samples;
+    dimA[CUDNN_SEQDATA_TIME_DIM] = attn->kvSeqLength;
+    dimA[CUDNN_SEQDATA_VECT_DIM] = attn->kSize;
+    checkCUDNN(cudnnSetSeqDataDescriptor(kDesc,
+                                         CUDNN_DATA_FLOAT,
+                                         CUDNN_SEQDATA_DIM_COUNT,
+                                         dimA,
+                                         axes,
+                                         num_samples,
+                                         kvSeqArray,
+                                         NULL));
+  }
+  // Set vDesc
+  {
+    dimA[CUDNN_SEQDATA_BEAM_DIM] = 1;
+    dimA[CUDNN_SEQDATA_BATCH_DIM] = num_samples;
+    dimA[CUDNN_SEQDATA_TIME_DIM] = attn->kvSeqLength;
+    dimA[CUDNN_SEQDATA_VECT_DIM] = attn->vSize;
+    checkCUDNN(cudnnSetSeqDataDescriptor(vDesc,
+                                         CUDNN_DATA_FLOAT,
+                                         CUDNN_SEQDATA_DIM_COUNT,
+                                         dimA,
+                                         axes,
+                                         num_samples,
+                                         kvSeqArray,
+                                         NULL));
+  }
+  // Set oDesc
+  {
+    dimA[CUDNN_SEQDATA_BEAM_DIM] = 1;
+    dimA[CUDNN_SEQDATA_BATCH_DIM] = num_samples;
+    dimA[CUDNN_SEQDATA_TIME_DIM] = attn->qoSeqLength;
+    dimA[CUDNN_SEQDATA_VECT_DIM] = attn->oProjSize;
+    checkCUDNN(cudnnSetSeqDataDescriptor(oDesc,
+                                         CUDNN_DATA_FLOAT,
+                                         CUDNN_SEQDATA_DIM_COUNT,
+                                         dimA,
+                                         axes,
+                                         num_samples,
+                                         qoSeqArray,
+                                         NULL));
+  }
+  // allocate memory for the seqArray and reserve space
+  {
+    size_t totalSize = reserveSpaceSize + sizeof(int) * num_samples * 2;
+    Realm::Rect<1, coord_t> bounds(Realm::Point<1, coord_t>(0),
+                                   Realm::Point<1, coord_t>(totalSize - 1));
+    std::vector<size_t> field_sizes;
+    field_sizes.push_back(sizeof(char));
+    Realm::RegionInstance::create_instance(reserveInst,
+                                           gpu_mem,
+                                           bounds,
+                                           field_sizes,
+                                           0,
+                                           Realm::ProfilingRequestSet())
+        .wait();
+    devQoSeqArray = (int *)reserveInst.pointer_untyped(0, sizeof(char));
+    checkCUDA(cudaMemcpy(devQoSeqArray,
+                         qoSeqArray,
+                         sizeof(int) * num_samples,
+                         cudaMemcpyHostToDevice));
+    devKvSeqArray = (int *)devQoSeqArray + num_samples;
+    checkCUDA(cudaMemcpy(devKvSeqArray,
+                         kvSeqArray,
+                         sizeof(int) * num_samples,
+                         cudaMemcpyHostToDevice));
+    reserveSpace = (int *)devKvSeqArray + num_samples;
+  }
+  // allocate memory for loWinIdx/hiWinIdx
+  loWinIdx = (int *)malloc(sizeof(int) * attn->qoSeqLength);
+  hiWinIdx = (int *)malloc(sizeof(int) * attn->qoSeqLength);
+  for (int i = 0; i < attn->qoSeqLength; i++) {
+    loWinIdx[i] = 0;
+    hiWinIdx[i] = attn->kvSeqLength;
+  }
+  free(qoSeqArray);
+  free(kvSeqArray);
+}
+
+IncMultiHeadSelfAttentionMeta::~IncMultiHeadSelfAttentionMeta(void) {
+  reserveInst.destroy();
+  free(loWinIdx);
+  free(hiWinIdx);
+  checkCUDNN(cudnnDestroyAttnDescriptor(attnDesc));
+  checkCUDNN(cudnnDestroySeqDataDescriptor(qDesc));
+  checkCUDNN(cudnnDestroySeqDataDescriptor(kDesc));
+  checkCUDNN(cudnnDestroySeqDataDescriptor(vDesc));
+  checkCUDNN(cudnnDestroySeqDataDescriptor(oDesc));
+}
+
+}; // namespace FlexFlow
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 4fdc1f9819..ee274dc427 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -40,6 +40,7 @@
 #include "flexflow/ops/fused.h"
 #include "flexflow/ops/gather.h"
 #include "flexflow/ops/groupby.h"
+#include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ops/layer_norm.h"
 #include "flexflow/ops/linear.h"
 #include "flexflow/ops/noop.h"
@@ -2736,6 +2737,12 @@ Op *FFModel::create_operator_from_layer(
       operators.push_back(op);
       return op;
     }
+    case OP_INC_MULTIHEAD_SELF_ATTENTION: {
+      Op *op = IncMultiHeadSelfAttention::create_operator_from_layer(
+          *this, layer, inputs);
+      operators.push_back(op);
+      return op;
+    }
     case OP_BATCHMATMUL: {
       Op *op = BatchMatmul::create_operator_from_layer(*this, layer, inputs);
       operators.push_back(op);
@@ -4491,6 +4498,25 @@ void register_flexflow_internal_tasks() {
     Runtime::preregister_task_variant<MultiHeadAttention::backward_task>(
         registrar, "MultiHeadAttention Backward Task");
   }
+  // MultiHeadAttention task
+  {
+    TaskVariantRegistrar registrar(INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
+                                   "IncMultiHeadSelfAttention Init");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<OpMeta *,
+                                      IncMultiHeadSelfAttention::init_task>(
+        registrar, "IncMultiHeadSelfAttention Init Task");
+  }
+  {
+    TaskVariantRegistrar registrar(INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
+                                   "IncMultiHeadSelfAttention Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<
+        IncMultiHeadSelfAttention::inference_task>(
+        registrar, "IncMultiHeadSelfAttention Inference Task");
+  }
   // NoOp
   {
     TaskVariantRegistrar registrar(NOOP_INIT_TASK_ID, "Weight NCCL Init");

From 9e696370cdfc8427309282a51a9b7100c979841d Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Mon, 27 Feb 2023 16:48:19 +0000
Subject: [PATCH 063/344] interface update

---
 include/flexflow/operator.h             | 3 +++
 src/ops/aggregate.cc                    | 2 ++
 src/ops/aggregate_spec.cc               | 2 ++
 src/ops/attention.cc                    | 2 ++
 src/ops/element_binary.cc               | 2 ++
 src/ops/experts.cc                      | 2 ++
 src/ops/group_by.cc                     | 2 ++
 src/ops/inc_multihead_self_attention.cc | 7 +++----
 8 files changed, 18 insertions(+), 4 deletions(-)

diff --git a/include/flexflow/operator.h b/include/flexflow/operator.h
index a76ad9a018..985ef4374f 100644
--- a/include/flexflow/operator.h
+++ b/include/flexflow/operator.h
@@ -3,6 +3,7 @@
 
 #include "flexflow/fftype.h"
 #include "flexflow/machine_view.h"
+#include "flexflow/batch_config.h"
 #include "flexflow/parallel_tensor.h"
 #include "flexflow/utils/dot/record_formatter.h"
 #include <vector>
@@ -186,6 +187,7 @@ class Op {
   // Pure virtual functions that must be implemented
   virtual void init(FFModel const &) = 0;
   virtual void init_inference(FFModel const &,
+                              BatchConfig const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) {
@@ -195,6 +197,7 @@ class Op {
   virtual void backward(FFModel const &) = 0;
   // Pure virtual functions for inference
   virtual void inference(FFModel const &,
+                         BatchConfig const &,
                          std::vector<ParallelTensor> const &,
                          std::vector<ParallelTensor> const &,
                          MachineView const *mv = nullptr) {
diff --git a/src/ops/aggregate.cc b/src/ops/aggregate.cc
index 02fc971768..e8bab41ce9 100644
--- a/src/ops/aggregate.cc
+++ b/src/ops/aggregate.cc
@@ -183,6 +183,7 @@ Node Aggregate::deserialize(FFModel &ff,
 }
 
 void Aggregate::init_inference(FFModel const &ff,
+                               BatchConfig const &bc,
                                std::vector<ParallelTensor> const &batch_inputs,
                                std::vector<ParallelTensor> const &batch_outputs,
                                MachineView const *mv) {
@@ -285,6 +286,7 @@ void Aggregate::forward(FFModel const &ff) {
 }
 
 void Aggregate::inference(FFModel const &ff,
+                          BatchConfig const &bc,
                           std::vector<ParallelTensor> const &batch_inputs,
                           std::vector<ParallelTensor> const &batch_outputs,
                           MachineView const *mv) {
diff --git a/src/ops/aggregate_spec.cc b/src/ops/aggregate_spec.cc
index 21d429594e..a4720a669b 100644
--- a/src/ops/aggregate_spec.cc
+++ b/src/ops/aggregate_spec.cc
@@ -157,6 +157,7 @@ AggregateSpec::AggregateSpec(FFModel &model,
 
 void AggregateSpec::init_inference(
     FFModel const &ff,
+    BatchConfig const &bc,
     std::vector<ParallelTensor> const &batch_inputs,
     std::vector<ParallelTensor> const &batch_outputs,
     MachineView const *mv) {
@@ -259,6 +260,7 @@ void AggregateSpec::forward(FFModel const &ff) {
 }
 
 void AggregateSpec::inference(FFModel const &ff,
+    BatchConfig const &bc,
                               std::vector<ParallelTensor> const &batch_inputs,
                               std::vector<ParallelTensor> const &batch_outputs,
                               MachineView const *mv) {
diff --git a/src/ops/attention.cc b/src/ops/attention.cc
index e04440d77e..ec24eaae94 100644
--- a/src/ops/attention.cc
+++ b/src/ops/attention.cc
@@ -374,6 +374,7 @@ MultiHeadAttention::MultiHeadAttention(
 
 void MultiHeadAttention::init_inference(
     FFModel const &ff,
+    BatchConfig const &bc,
     std::vector<ParallelTensor> const &batch_inputs,
     std::vector<ParallelTensor> const &batch_outputs,
     MachineView const *mv) {
@@ -581,6 +582,7 @@ void MultiHeadAttention::forward(FFModel const &ff) {
 
 void MultiHeadAttention::inference(
     FFModel const &ff,
+    BatchConfig const &bc,
     std::vector<ParallelTensor> const &batch_inputs,
     std::vector<ParallelTensor> const &batch_outputs,
     MachineView const *mv) {
diff --git a/src/ops/element_binary.cc b/src/ops/element_binary.cc
index 2260a1e32a..9758225b3e 100644
--- a/src/ops/element_binary.cc
+++ b/src/ops/element_binary.cc
@@ -262,6 +262,7 @@ void ElementBinary::do_inplace_output(void) {
 
 void ElementBinary::init_inference(
     FFModel const &ff,
+    BatchConfig const &bc,
     std::vector<ParallelTensor> const &batch_inputs,
     std::vector<ParallelTensor> const &batch_outputs,
     MachineView const *mv) {
@@ -507,6 +508,7 @@ void ElementBinary::forward(FFModel const &ff) {
 }
 
 void ElementBinary::inference(FFModel const &ff,
+    BatchConfig const &bc,
                               std::vector<ParallelTensor> const &batch_inputs,
                               std::vector<ParallelTensor> const &batch_outputs,
                               MachineView const *mv) {
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index afd7bff3c9..d4a72f5dff 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -428,6 +428,7 @@ Node Experts::deserialize(FFModel &ff,
 }
 
 void Experts::init_inference(FFModel const &ff,
+    BatchConfig const &bc,
                              std::vector<ParallelTensor> const &batch_inputs,
                              std::vector<ParallelTensor> const &batch_outputs,
                              MachineView const *mv) {
@@ -643,6 +644,7 @@ void Experts::forward(FFModel const &ff) {
 }
 
 void Experts::inference(FFModel const &ff,
+    BatchConfig const &bc,
                         std::vector<ParallelTensor> const &batch_inputs,
                         std::vector<ParallelTensor> const &batch_outputs,
                         MachineView const *mv) {
diff --git a/src/ops/group_by.cc b/src/ops/group_by.cc
index e5d720ba31..faeafb9f05 100644
--- a/src/ops/group_by.cc
+++ b/src/ops/group_by.cc
@@ -165,6 +165,7 @@ Group_by::Group_by(FFModel &model,
           model, inputs.first, inputs.second, params.n, params.alpha, name) {}
 
 void Group_by::init_inference(FFModel const &ff,
+    BatchConfig const &bc,
                               std::vector<ParallelTensor> const &batch_inputs,
                               std::vector<ParallelTensor> const &batch_outputs,
                               MachineView const *mv) {
@@ -312,6 +313,7 @@ void Group_by::forward(FFModel const &ff) {
 }
 
 void Group_by::inference(FFModel const &ff,
+    BatchConfig const &bc,
                          std::vector<ParallelTensor> const &batch_inputs,
                          std::vector<ParallelTensor> const &batch_outputs,
                          MachineView const *mv) {
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index 329254fb74..6b5910c711 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -342,6 +342,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
 
 void IncMultiHeadSelfAttention::init_inference(
     FFModel const &ff,
+    BatchConfig const &bc,
     std::vector<ParallelTensor> const &batch_inputs,
     std::vector<ParallelTensor> const &batch_outputs,
     MachineView const *mv) {
@@ -465,6 +466,7 @@ void IncMultiHeadSelfAttention::forward(FFModel const &ff) {
 
 void IncMultiHeadSelfAttention::inference(
     FFModel const &ff,
+    BatchConfig const &bc,
     std::vector<ParallelTensor> const &batch_inputs,
     std::vector<ParallelTensor> const &batch_outputs,
     MachineView const *mv) {
@@ -475,13 +477,10 @@ void IncMultiHeadSelfAttention::inference(
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
   set_argumentmap_for_inference(ff, argmap, view);
   size_t machine_view_hash = view->hash();
-  /* std::cout << "IncMultiHeadSelfAttention op machine_view: " << *(MachineView const
-     *)mv
-            << std::endl; */
   int idx = 0;
   IndexLauncher launcher(INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
                          parallel_is,
-                         TaskArgument(NULL, 0),
+                         TaskArgument(&bc, sizeof(BatchConfig)),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,

From 52e257d031b2fd66b2b4cee414d5da8533d1ef5c Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Tue, 28 Feb 2023 01:31:33 +0000
Subject: [PATCH 064/344] checkpoint

---
 CMakeLists.txt                                |   1 +
 config/config.linux                           |   2 +-
 examples/cpp/inference/data_generator.cc      |  37 +-
 examples/cpp/inference/data_generator.h       |   4 +-
 .../cpp/inference/mixture_of_experts/moe.cc   |   3 +-
 .../cpp/inference/transformers/dataloader.cc  | 388 ++++++++++++++++++
 .../cpp/inference/transformers/dataloader.cu  | 115 ++++++
 .../inference/transformers/transformers.cc    | 185 +++++++++
 .../cpp/inference/transformers/transformers.h | 123 ++++++
 include/flexflow/batch_config.h               |  47 +++
 include/flexflow/inference.h                  |   3 +-
 include/flexflow/operator.h                   |   4 +-
 include/flexflow/ops/aggregate.h              |   5 +-
 include/flexflow/ops/aggregate_spec.h         |   5 +-
 include/flexflow/ops/attention.h              |   5 +-
 include/flexflow/ops/element_binary.h         |   5 +-
 include/flexflow/ops/experts.h                |   5 +-
 include/flexflow/ops/groupby.h                |   5 +-
 .../ops/inc_multihead_self_attention.h        |   5 +-
 include/flexflow/ops/layer_norm.h             |   5 +-
 include/flexflow/ops/linear.h                 |   5 +-
 include/flexflow/ops/noop.h                   |   3 +
 include/flexflow/ops/softmax.h                |   5 +-
 include/flexflow/ops/topk.h                   |   5 +-
 include/flexflow/parallel_ops/partition.h     |   3 +
 src/ops/aggregate.cc                          |   4 +-
 src/ops/aggregate_spec.cc                     |   4 +-
 src/ops/attention.cc                          |   4 +-
 src/ops/element_binary.cc                     |   4 +-
 src/ops/experts.cc                            |   4 +-
 src/ops/group_by.cc                           |   4 +-
 src/ops/inc_multihead_self_attention.cc       |   4 +-
 src/ops/layer_norm.cc                         |   6 +-
 src/ops/linear.cc                             |   6 +-
 src/ops/noop.cc                               |   4 +-
 src/ops/softmax.cc                            |   6 +-
 src/ops/topk.cc                               |   6 +-
 src/parallel_ops/partition.cc                 |   2 +
 src/runtime/inference_manager.cc              |   9 +-
 39 files changed, 995 insertions(+), 45 deletions(-)
 create mode 100644 examples/cpp/inference/transformers/dataloader.cc
 create mode 100644 examples/cpp/inference/transformers/dataloader.cu
 create mode 100644 examples/cpp/inference/transformers/transformers.cc
 create mode 100644 examples/cpp/inference/transformers/transformers.h
 create mode 100644 include/flexflow/batch_config.h

diff --git a/CMakeLists.txt b/CMakeLists.txt
index 10542011df..8be1c10ce8 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -419,6 +419,7 @@ endif()
 
 if(FF_BUILD_MOE OR FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/inference/mixture_of_experts)
+  add_subdirectory(examples/cpp/inference/transformers)
 endif()
 
 # installation
diff --git a/config/config.linux b/config/config.linux
index 86e8f8b647..940757f9e8 100755
--- a/config/config.linux
+++ b/config/config.linux
@@ -39,7 +39,7 @@ FF_GASNET_CONDUIT=${FF_GASNET_CONDUIT:-ibv}
 
 # build C++ examples
 FF_BUILD_ALL_EXAMPLES=${FF_BUILD_ALL_EXAMPLES:-OFF}
-FF_BUILD_ALL_INFERENCE_EXAMPLES=${FF_BUILD_ALL_INFERENCE_EXAMPLES:-OFF}
+FF_BUILD_ALL_INFERENCE_EXAMPLES=${FF_BUILD_ALL_INFERENCE_EXAMPLES:-ON}
 
 # build C++ unit tests
 FF_BUILD_UNIT_TESTS=${FF_BUILD_UNIT_TESTS:-OFF}
diff --git a/examples/cpp/inference/data_generator.cc b/examples/cpp/inference/data_generator.cc
index ec168f6f51..16efe57e3f 100644
--- a/examples/cpp/inference/data_generator.cc
+++ b/examples/cpp/inference/data_generator.cc
@@ -11,7 +11,7 @@ DataGenerator::DataGenerator(size_t _num_requests,
                              double _lambda)
     : num_requests(_num_requests), token_dim(_token_dim),
       sequence_length(_sequence_length), poisson_distr(_poisson_distr),
-      lambda(_lambda), timer_started(false) {
+      lambda(_lambda), timer_started(false), global_unique_id(1000000) {
   generate_arrival_times();
 };
 
@@ -80,7 +80,7 @@ void DataGenerator::start_timer(void) {
   timer_started = true;
 };
 
-size_t DataGenerator::get_requests(void) {
+size_t DataGenerator::get_requests(size_t max_num_requests, std::vector<std::pair<size_t, std::vector<int> > >&prompts) {
   if (!timer_started) {
     std::cout << "Warning: tried to get number of requests before the timer "
                  "was started."
@@ -99,5 +99,38 @@ size_t DataGenerator::get_requests(void) {
               << " request(s) by arrival time +" << ms_from_start << "ms"
               << "\n";
   }
+
+  for (size_t i = 0; i < received_requests; i++) {
+    int length = std::rand() % 10 + 5;
+    std::vector<int> prompt;
+    for (int j = 0; j < length; j++)
+      prompt.push_back(j + 1000);
+    prompts.push_back(std::make_pair(global_unique_id++, prompt));
+  }
+  assert(prompts.size() == received_requests);
   return received_requests;
 }
+
+size_t DataGenerator::get_requests() {
+  if (!timer_started) {
+    std::cout << "Warning: tried to get number of requests before the timer "
+                 "was started."
+              << std::endl;
+    return 0;
+  }
+  Clock::time_point cur_time = Clock::now();
+  size_t ms_from_start =
+      chrono::duration_cast<milliseconds>(cur_time - start_time).count();
+  vector<double>::iterator new_arrivals_ptr =
+      upper_bound(arrivals_ptr, arrivals.end(), ms_from_start);
+  size_t received_requests = new_arrivals_ptr - arrivals_ptr;
+  arrivals_ptr = new_arrivals_ptr;
+  if (received_requests > 0) {
+    std::cout << "received " << received_requests
+              << " request(s) by arrival time +" << ms_from_start << "ms"
+              << "\n";
+  }
+
+  return received_requests;
+}
+
diff --git a/examples/cpp/inference/data_generator.h b/examples/cpp/inference/data_generator.h
index e651881902..93bb565c41 100644
--- a/examples/cpp/inference/data_generator.h
+++ b/examples/cpp/inference/data_generator.h
@@ -29,7 +29,8 @@ class DataGenerator {
   void start_timer(void);
   // Get number of requests that have arrived since the last time this function
   // was called
-  size_t get_requests(void);
+  size_t get_requests(size_t max_num_requests, std::vector<std::pair<size_t, std::vector<int> > > &prompts);
+  size_t get_requests();
 
 private:
   // Compute the arrival times of each request and save them in the arrivals
@@ -42,6 +43,7 @@ class DataGenerator {
   bool poisson_distr;     // false implies uniform distribution
   double lambda;          // mean #num of arrivals per sec
   bool timer_started;     // whether timer was initiated
+  size_t global_unique_id; // guid for requests
   // time when get_requests() is called for the first time
   Clock::time_point start_time;
   // arrival times (ms) generated based on distribution
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index 0fd4b32d26..726ef5f7ff 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -156,6 +156,7 @@ void FlexFlow::top_level_task(Task const *task,
   int num_devices = ffConfig.workersPerNode * ffConfig.numNodes;
   data_loader.reset();
   data_generator.start_timer();
+  BatchConfig bc;
   while (processed_requests < moeConfig.total_requests) {
     size_t received_requests = data_generator.get_requests();
     int iterations = (received_requests % moeConfig.batch_size == 0)
@@ -164,7 +165,7 @@ void FlexFlow::top_level_task(Task const *task,
     for (int iter = 0; iter < iterations; iter++) {
       data_loader.next_batch(ff, received_requests);
       runtime->begin_trace(ctx, 111 + index % num_devices /*trace_id*/);
-      im.inference(index);
+      im.inference(index, bc);
       runtime->end_trace(ctx, 111 + index % num_devices /*trace_id*/);
       index++;
     }
diff --git a/examples/cpp/inference/transformers/dataloader.cc b/examples/cpp/inference/transformers/dataloader.cc
new file mode 100644
index 0000000000..a61598299e
--- /dev/null
+++ b/examples/cpp/inference/transformers/dataloader.cc
@@ -0,0 +1,388 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/inference.h"
+#include "transformers.h"
+#include <cstdlib>
+#include <fstream>
+#include <iostream>
+#include <sstream>
+#include <string>
+#include <unistd.h>
+
+using namespace Legion;
+
+DataLoader::DataLoader(FFModel &ff,
+                       MoeConfig const &moeConfig,
+                       DataGenerator &data_generator,
+                       ParallelTensor input,
+                       ParallelTensor label) {
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+
+  int numdims = input->num_dims;
+  int replica_idx = numdims - 1;
+  int batch_idx = numdims - 2;
+  num_samples = moeConfig.total_requests;
+
+  // Create full input
+  {
+    batch_input = input;
+
+    ParallelDim dims[numdims];
+    for (int i = 0; i < numdims; i++) {
+      dims[i].size = input->dims[i].size;
+      dims[i].degree = 1;
+      dims[i].parallel_idx = -1;
+      dims[i].is_replica_dim = input->dims[i].is_replica_dim;
+      // Assume only the first dim can be the replica dim
+      assert(i == replica_idx || (!dims[i].is_replica_dim));
+    }
+    assert(dims[batch_idx].size == ff.config.batchSize);
+    dims[batch_idx].size = num_samples;
+
+    full_input =
+        ff.create_parallel_tensor_legion_ordering(numdims, dims, DT_FLOAT);
+    ff.map_tensor(full_input, NULL /*parallel_op*/);
+  }
+
+  // Create full label
+  {
+    assert(label->num_dims == numdims);
+    batch_label = label;
+
+    ParallelDim dims[numdims];
+    for (int i = 0; i < numdims; i++) {
+      dims[i].size = label->dims[i].size;
+      dims[i].degree = 1;
+      dims[i].parallel_idx = -1;
+      dims[i].is_replica_dim = label->dims[i].is_replica_dim;
+      // Assume only the last dim can be the replica dim
+      assert(i == replica_idx || (!dims[i].is_replica_dim));
+    }
+    assert(dims[batch_idx].size == ff.config.batchSize);
+    // replace batch size with number of samples
+    dims[batch_idx].size = num_samples;
+
+    full_label =
+        ff.create_parallel_tensor_legion_ordering(numdims, dims, DT_INT32);
+    ff.map_tensor(full_label, NULL /*parallel_op*/);
+  }
+
+  // Load entire dataset
+  // TODO: Use index launcher instead of task launcher
+  assert(full_input != nullptr && "full_input is nullptr");
+  assert(full_label != nullptr && "full_label is nullptr");
+
+  DataLoaderInput dataloader_input = {moeConfig, data_generator};
+  DataLoaderInput const *ptr = &dataloader_input;
+
+  TaskLauncher launcher(CUSTOM_CPU_TASK_ID_1,
+                        TaskArgument(ptr, sizeof(DataLoaderInput)));
+  // regions[0]: full_input
+  launcher.add_region_requirement(RegionRequirement(full_input->region,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    full_input->region,
+                                                    MAP_TO_ZC_MEMORY));
+  launcher.add_field(0, FID_DATA);
+  // regions[1]: full_label
+  launcher.add_region_requirement(RegionRequirement(full_label->region,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    full_label->region,
+                                                    MAP_TO_ZC_MEMORY));
+  launcher.add_field(1, FID_DATA);
+
+  runtime->execute_task(ctx, launcher);
+  reset();
+}
+
+// =================================================
+//                    Load data
+// =================================================
+
+void read_cifar100(float *input_ptr, int *label_ptr) {
+  std::ifstream file;
+  file.open("train.bin", std::ios::in | std::ios::binary | std::ios::ate);
+  if (!file) {
+    std::cout << "Error opening CIFAR100 train data file" << std::endl;
+    assert(false);
+  }
+
+  file.seekg(0, std::ios::beg);
+
+  // each sample: <1 x coarse label><1 x fine label><3072 x pixel>
+  for (std::size_t i = 0; i < MAX_NUM_SAMPLES; i++) {
+    unsigned char temp = 0;
+    file.read((char *)&temp, sizeof(temp)); // coarse label, skip
+    file.read((char *)&temp, sizeof(temp));
+    label_ptr[i] = temp;
+    for (std::size_t j = 0; j < 3072; ++j) {
+      file.read((char *)&temp, sizeof(temp));
+      input_ptr[i * 3072 + j] = (float)temp / 255.0f;
+    }
+  }
+
+  file.close();
+}
+
+int reverseInt(int i) {
+  unsigned char c1, c2, c3, c4;
+
+  c1 = i & 255;
+  c2 = (i >> 8) & 255;
+  c3 = (i >> 16) & 255;
+  c4 = (i >> 24) & 255;
+
+  return ((int)c1 << 24) + ((int)c2 << 16) + ((int)c3 << 8) + c4;
+}
+
+/* NOTE: Download files from http://yann.lecun.com/exdb/mnist/ and unpack to
+the current working directory */
+void read_mnist(float *input_ptr, int *label_ptr) {
+  // read inputs
+  std::ifstream input("train-images-idx3-ubyte", std::ios::binary);
+  if (input.is_open()) {
+    int magic_number = 0;
+    int number_of_images = 0;
+    int n_rows = 0;
+    int n_cols = 0;
+    input.read((char *)&magic_number, sizeof(magic_number));
+    magic_number = reverseInt(magic_number);
+    input.read((char *)&number_of_images, sizeof(number_of_images));
+    number_of_images = reverseInt(number_of_images);
+    input.read((char *)&n_rows, sizeof(n_rows));
+    n_rows = reverseInt(n_rows);
+    input.read((char *)&n_cols, sizeof(n_cols));
+    n_cols = reverseInt(n_cols);
+
+    for (int i = 0; i < number_of_images; i++) {
+      for (int r = 0; r < n_rows; r++) {
+        for (int c = 0; c < n_cols; c++) {
+          unsigned char temp = 0;
+          input.read((char *)&temp, sizeof(temp));
+          input_ptr[i * n_rows * n_cols + r * n_cols + c] =
+              (float)temp / 255.0f;
+        }
+      }
+    }
+  } else {
+    std::cout << "Error opening MNIST input data file" << std::endl;
+    assert(false);
+  }
+
+  // read labels
+  std::ifstream labels("train-labels-idx1-ubyte", std::ios::binary);
+  if (labels.is_open()) {
+    int magic_number = 0;
+    int number_of_images = 0;
+    labels.read((char *)&magic_number, sizeof(magic_number));
+    magic_number = reverseInt(magic_number);
+    labels.read((char *)&number_of_images, sizeof(number_of_images));
+    number_of_images = reverseInt(number_of_images);
+
+    for (int i = 0; i < number_of_images; i++) {
+      unsigned char temp = 0;
+      labels.read((char *)&temp, sizeof(temp));
+      label_ptr[i] = temp;
+    }
+  } else {
+    std::cout << "Error opening MNIST label data file" << std::endl;
+    assert(false);
+  }
+}
+
+void DataLoader::load_entire_dataset(Task const *task,
+                                     std::vector<PhysicalRegion> const &regions,
+                                     Context ctx,
+                                     Runtime *runtime) {
+  DataLoaderInput const input_struct = *((DataLoaderInput *)task->args);
+  MoeConfig const &conf = input_struct._moeConfig;
+  DataGenerator &datagen = input_struct._data_generator;
+  assert(regions.size() == 2);
+  assert(task->regions.size() == regions.size());
+
+  // get input and label pointer
+  float *input_ptr = helperGetTensorPointerWO<float>(
+      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  int *label_ptr = helperGetTensorPointerWO<int>(
+      regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  Domain input_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  Domain label_domain = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+  int input_dims = input_domain.get_dim();
+  for (int i = 0; i < input_dims; i++) {
+    int input_dim = input_domain.hi()[i] - input_domain.lo()[i] + 1;
+    int label_dim = label_domain.hi()[i] - label_domain.lo()[i] + 1;
+    assert(i == 0 || input_dim == label_dim);
+  }
+
+  if (conf.dataset_path.length() == 0) {
+    printf("Input dataset path is empty, using random input samples\n");
+    datagen.generate_requests(input_ptr, label_ptr, conf.num_labels);
+  } else {
+    // here, you can call `read_cifar100(input_ptr, label_ptr);` instead or load
+    // another dataset using the dataset_path from the MoeConfig object
+    // read_mnist(input_ptr, label_ptr);
+    // log_app.print("finish loading MNIST data\n");
+  }
+}
+
+void DataLoader::next_batch(FFModel &ff, size_t received_requests) {
+  if (received_requests == 0) {
+    return;
+  }
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  // Load input
+  {
+    Domain domain =
+        runtime->get_index_space_domain(ctx, batch_input->parallel_is);
+    ArgumentMap argmap;
+    int counter = 0;
+    // current limitation of the dataloader: only the batch dimension can be
+    // partitioned
+    int input_dims = batch_input->num_dims;
+    for (int i = 0; i < input_dims; i++) {
+      if (i != input_dims - 2) {
+        assert(batch_input->dims[i].degree == 1 &&
+               "Dataloader only supports batch size partitions");
+      }
+    }
+    int batch_size = batch_input->dims[input_dims - 2].size;
+    int n_partitions = batch_input->dims[input_dims - 2].degree;
+    assert(ff.config.batchSize % batch_size == 0);
+    assert(batch_size % n_partitions == 0);
+    for (Domain::DomainPointIterator it(domain); it; it++) {
+      SampleIdxs meta;
+      int requests_left = received_requests - counter;
+      meta.num_samples = std::min(batch_size / n_partitions, requests_left);
+      for (int i = 0; i < meta.num_samples; i++) {
+        meta.idxs[i] = next_index + counter;
+        counter++;
+      }
+      argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
+    }
+    assert(counter == received_requests);
+    IndexLauncher launcher(CUSTOM_GPU_TASK_ID_1,
+                           batch_input->parallel_is,
+                           TaskArgument(NULL, 0),
+                           argmap,
+                           Predicate::TRUE_PRED,
+                           false /*must*/,
+                           0 /*mapper_id*/,
+                           batch_input->machine_view.hash());
+    launcher.add_region_requirement(RegionRequirement(full_input->region,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      full_input->region,
+                                                      MAP_TO_ZC_MEMORY));
+    launcher.add_field(0, FID_DATA);
+    launcher.add_region_requirement(RegionRequirement(batch_input->part,
+                                                      0 /*projection id*/,
+                                                      WRITE_ONLY,
+                                                      EXCLUSIVE,
+                                                      batch_input->region));
+    launcher.add_field(1, FID_DATA);
+    runtime->execute_index_space(ctx, launcher);
+  }
+  // Load label
+  {
+    Domain domain =
+        runtime->get_index_space_domain(ctx, batch_label->parallel_is);
+    ArgumentMap argmap;
+    int counter = 0;
+    // current limitation of the dataloader: only the batch dimension can be
+    // partitioned
+    int label_dims = batch_label->num_dims;
+    // assert(batch_label->dims[label_dims - 1].degree == 1);
+    for (int i = 0; i < label_dims; i++) {
+      assert(batch_label->dims[i].degree == 1 &&
+             "Dataloader only supports batch size partitions");
+    }
+    int batch_size = batch_label->dims[label_dims - 2].size;
+    int n_partitions = batch_label->dims[label_dims - 2].degree;
+    assert(ff.config.batchSize % batch_size == 0);
+    assert(batch_size % n_partitions == 0);
+    for (Domain::DomainPointIterator it(domain); it; it++) {
+      SampleIdxs meta;
+      int requests_left = received_requests - counter;
+      meta.num_samples = std::min(batch_size / n_partitions, requests_left);
+      for (int i = 0; i < meta.num_samples; i++) {
+        meta.idxs[i] = next_index + counter;
+        counter++;
+      }
+      argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
+    }
+    assert(counter == received_requests);
+    IndexLauncher launcher(CUSTOM_GPU_TASK_ID_2,
+                           batch_label->parallel_is,
+                           TaskArgument(NULL, 0),
+                           argmap,
+                           Predicate::TRUE_PRED,
+                           false /*must*/,
+                           0 /*mapper_id*/,
+                           batch_label->machine_view.hash());
+    launcher.add_region_requirement(RegionRequirement(full_label->region,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      full_label->region,
+                                                      MAP_TO_ZC_MEMORY));
+    launcher.add_field(0, FID_DATA);
+    launcher.add_region_requirement(RegionRequirement(batch_label->part,
+                                                      0 /*projection id*/,
+                                                      WRITE_ONLY,
+                                                      EXCLUSIVE,
+                                                      batch_label->region));
+    launcher.add_field(1, FID_DATA);
+    runtime->execute_index_space(ctx, launcher);
+  }
+  next_index += received_requests;
+}
+
+void DataLoader::reset() {
+  next_index = 0;
+}
+
+void FlexFlow::register_custom_tasks() {
+  // Load entire dataset
+  {
+    TaskVariantRegistrar registrar(CUSTOM_CPU_TASK_ID_1, "Load Entire Dataset");
+    registrar.add_constraint(ProcessorConstraint(Processor::LOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<DataLoader::load_entire_dataset>(
+        registrar, "Load Entire Dataset Task");
+  }
+  // Load input
+  {
+    TaskVariantRegistrar registrar(CUSTOM_GPU_TASK_ID_1, "Load Inputs");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<DataLoader::load_input>(
+        registrar, "Load Input Task");
+  }
+  // Load label
+  {
+    TaskVariantRegistrar registrar(CUSTOM_GPU_TASK_ID_2, "Load Labels");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<DataLoader::load_label>(
+        registrar, "Load Label Task");
+  }
+}
diff --git a/examples/cpp/inference/transformers/dataloader.cu b/examples/cpp/inference/transformers/dataloader.cu
new file mode 100644
index 0000000000..4624b562e9
--- /dev/null
+++ b/examples/cpp/inference/transformers/dataloader.cu
@@ -0,0 +1,115 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/utils/cuda_helper.h"
+#include "transformers.h"
+
+void DataLoader::load_input(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+  SampleIdxs *meta = (SampleIdxs *)task->local_args;
+  float const *full_input_ptr = helperGetTensorPointerRO<float>(
+      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  float *batch_input_ptr = helperGetTensorPointerWO<float>(
+      regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  Domain full_input_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  Domain batch_input_domain = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+
+  coord_t token_dim =
+      batch_input_domain.hi()[0] - batch_input_domain.lo()[0] + 1;
+  coord_t sequence_length =
+      batch_input_domain.hi()[1] - batch_input_domain.lo()[1] + 1;
+  coord_t batch_size =
+      batch_input_domain.hi()[2] - batch_input_domain.lo()[2] + 1;
+
+  // FIXME: currently assume continous indices
+  assert(meta->num_samples <= batch_size);
+  for (int i = 1; i < meta->num_samples; i++) {
+    assert(meta->idxs[i] == meta->idxs[0] + i);
+  }
+  // pad inputs if needed (this is really only useful for debugging)
+  if (meta->num_samples < batch_size) {
+    checkCUDA(cudaMemset(batch_input_ptr +
+                             token_dim * sequence_length * meta->num_samples,
+                         0,
+                         token_dim * sequence_length *
+                             (batch_size - meta->num_samples) * sizeof(float)));
+  }
+  coord_t start_idx = meta->idxs[0];
+  assert(batch_input_domain.get_volume() % token_dim * sequence_length *
+             batch_size ==
+         0);
+  assert(batch_input_domain.get_volume() % batch_size == 0);
+  size_t size_to_copy =
+      (batch_input_domain.get_volume() / batch_size) * meta->num_samples;
+  float const *input_zc =
+      full_input_ptr + start_idx * token_dim * sequence_length;
+  copy_kernel<<<GET_BLOCKS(size_to_copy), CUDA_NUM_THREADS>>>(
+      batch_input_ptr, input_zc, size_to_copy);
+  checkCUDA(cudaDeviceSynchronize());
+}
+
+void DataLoader::load_label(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+  SampleIdxs *meta = (SampleIdxs *)task->local_args;
+  int const *full_label_ptr = helperGetTensorPointerRO<int>(
+      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  int *batch_label_ptr = helperGetTensorPointerWO<int>(
+      regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  Domain full_label_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  Domain batch_label_domain = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+  coord_t label_dim =
+      batch_label_domain.hi()[0] - batch_label_domain.lo()[0] + 1;
+  coord_t sequence_length =
+      batch_label_domain.hi()[1] - batch_label_domain.lo()[1] + 1;
+  coord_t batch_size =
+      batch_label_domain.hi()[2] - batch_label_domain.lo()[2] + 1;
+  // FIXME: currently assume continous indices
+  assert(meta->num_samples <= batch_size);
+  for (int i = 1; i < meta->num_samples; i++) {
+    assert(meta->idxs[i] == meta->idxs[0] + i);
+  }
+  if (meta->num_samples < batch_size) {
+    checkCUDA(cudaMemset(batch_label_ptr +
+                             label_dim * sequence_length * meta->num_samples,
+                         0,
+                         label_dim * sequence_length *
+                             (batch_size - meta->num_samples) * sizeof(int)));
+  }
+  assert(batch_label_domain.get_volume() % label_dim * sequence_length *
+             batch_size ==
+         0);
+  assert(batch_label_domain.get_volume() % batch_size == 0);
+  coord_t start_idx = meta->idxs[0];
+  size_t size_to_copy =
+      (batch_label_domain.get_volume() / batch_size) * meta->num_samples;
+  int const *input_zc =
+      full_label_ptr + start_idx * label_dim * sequence_length;
+  copy_kernel<<<GET_BLOCKS(size_to_copy), CUDA_NUM_THREADS>>>(
+      batch_label_ptr, input_zc, size_to_copy);
+  checkCUDA(cudaDeviceSynchronize());
+}
diff --git a/examples/cpp/inference/transformers/transformers.cc b/examples/cpp/inference/transformers/transformers.cc
new file mode 100644
index 0000000000..27e438037e
--- /dev/null
+++ b/examples/cpp/inference/transformers/transformers.cc
@@ -0,0 +1,185 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "transformers.h"
+#include "flexflow/inference.h"
+#include <cstdlib>
+#include <fstream>
+#include <iostream>
+#include <sstream>
+#include <string>
+#include <unistd.h>
+
+using namespace Legion;
+
+LegionRuntime::Logger::Category log_app("Transformers");
+
+void parse_input_args(char **argv, int argc, MoeConfig &config) {
+  for (int i = 1; i < argc; i++) {
+    if (!strcmp(argv[i], "--dataset")) {
+      config.dataset_path = std::string(argv[++i]);
+      continue;
+    }
+  }
+}
+
+Tensor create_inc_multihead_attention_decoder(FFModel *model,
+                                MoeConfig const *moeConfig,
+                                Tensor const &input) {
+  std::vector<int> axes{0};
+  Tensor t = model->inc_multihead_self_attention(input,
+                                              moeConfig->hidden_size,
+                                              moeConfig->num_attention_heads,
+                                              moeConfig->attention_kdim,
+                                              moeConfig->attention_vdim);
+
+  t = model->layer_norm(model->add(t, input), axes, true, 1e-05);
+  Tensor x = model->dense(model->dense(t, moeConfig->hidden_size, AC_MODE_RELU, false /*bias*/),
+                          moeConfig->hidden_size,
+                          AC_MODE_NONE,
+                          false /*bias*/);
+  t = model->layer_norm(model->add(x, t), axes, true, 1e-05);
+  return t;
+}
+
+void FlexFlow::top_level_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  //----------------------- Initial configurations ------------------------
+  MoeConfig moeConfig;
+  FFConfig ffConfig;
+  ffConfig.batchSize = moeConfig.batch_size;
+  {
+    InputArgs const &command_args = HighLevelRuntime::get_input_args();
+    char **argv = command_args.argv;
+    int argc = command_args.argc;
+    parse_input_args(argv, argc, moeConfig);
+    log_app.print("batchSize(%d) workersPerNodes(%d) numNodes(%d)",
+                  ffConfig.batchSize,
+                  ffConfig.workersPerNode,
+                  ffConfig.numNodes);
+  }
+  FFModel ff(ffConfig);
+
+  //----------------------- Create inputs --------------------------------
+  Tensor input;
+  {
+    int const dims[] = {BatchConfig::MAX_NUM_TOKENS, moeConfig.token_dim};
+    input = ff.create_tensor<2>(dims, DT_FLOAT);
+  }
+
+  //----------------------- Define the model ------------------------------
+  Tensor t = input;
+  for (int i = 0; i < moeConfig.num_layers; i++) {
+    t = create_inc_multihead_attention_decoder(&ff, &moeConfig, input);
+  }
+  t = ff.dense(t, moeConfig.out_dim, AC_MODE_RELU);
+  t = ff.softmax(t);
+
+  //------------------- Initialize the inference manager ------------------
+  InferenceManager im(
+      &ff, moeConfig.batch_size, moeConfig.num_inflight_batches);
+  im.compile_model_and_allocate_buffer();
+  im.init_operators_inference();
+
+  //------------ Initialize the data loader and data generator ------------
+  DataGenerator data_generator(moeConfig.total_requests,
+                               moeConfig.token_dim,
+                               moeConfig.sequence_length,
+                               moeConfig.poisson_distribution,
+                               moeConfig.arrival_rate);
+  ParallelTensor input_pt, label_pt;
+  ff.get_parallel_tensor_from_tensor(input, input_pt);
+  ff.get_parallel_tensor_from_tensor(ff.label_tensor, label_pt);
+  DataLoader data_loader(ff, moeConfig, data_generator, input_pt, label_pt);
+
+  //----------------------- Start timer -----------------------------------
+  {
+    runtime->issue_execution_fence(ctx);
+    TimingLauncher timer(MEASURE_MICRO_SECONDS);
+    Future future = runtime->issue_timing_measurement(ctx, timer);
+    future.get_void_result();
+  }
+  double ts_start = Realm::Clock::current_time_in_microseconds();
+
+  //----------------------- Begin inference! -------------------------------
+  int index = 0;
+  int processed_requests = 0;
+  int num_devices = ffConfig.workersPerNode * ffConfig.numNodes;
+  data_loader.reset();
+  data_generator.start_timer();
+  std::map<int, Future> future_handlers;
+  std::map<int, BatchConfig*> batch_configs;
+  while (processed_requests < moeConfig.total_requests) {
+    for (int bid = 0; bid < im.max_num_inflight_batches; bid++) {
+      if (future_handlers.find(bid) == future_handlers.end()) {
+        std::vector<std::pair<size_t, std::vector<int> > > prompts;
+        assert(im.max_num_requests_per_batch <= BatchConfig::MAX_NUM_REQUESTS);
+        data_generator.get_requests(im.max_num_requests_per_batch, prompts);
+        assert((int)prompts.size() < im.max_num_requests_per_batch);
+        //TODO: loading data
+        BatchConfig* bc = new BatchConfig();
+        for (const auto & prompt : prompts) {
+          assert(bc->register_new_request(prompt.first, prompt.second.size()));
+        }
+        bc->prepare_next_batch();
+        runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
+        FutureMap fm = im.inference(bid, *bc);
+        runtime->end_trace(ctx, 111 + bid % num_devices /*trace_id*/);
+        assert(fm.get_future_map_domain().get_volume() == 1);
+        Future future = fm.get_future(0);
+        future_handlers[bid] = future;
+        batch_configs[bid] = bc;
+      } else {
+        Future future = future_handlers[bid];
+        if (!future.is_ready(true/*subscribe*/)) {
+          continue;
+        }
+        InferenceResult ir = future.get_result<InferenceResult>();
+        BatchConfig* bc = batch_configs[bid];
+        processed_requests += bc->update_results(ir);
+        int available_slots = BatchConfig::MAX_NUM_REQUESTS - bc->num_processing_requests();
+        std::vector<std::pair<size_t, std::vector<int> > > prompts;
+        data_generator.get_requests(available_slots, prompts);
+        processed_requests += prompts.size();
+        for (const auto& prompt : prompts) {
+          assert(bc->register_new_request(prompt.first, prompt.second.size()));
+        }
+        bc->prepare_next_batch();
+        runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
+        FutureMap fm = im.inference(bid, *bc);
+        runtime->end_trace(ctx, 111 + bid % num_devices /*trace_id*/);
+        assert(fm.get_future_map_domain().get_volume() == 1);
+        future_handlers[bid] = fm.get_future(0);
+        batch_configs[bid] = bc;
+      }
+    }
+  }
+  //----------------------- End of inference! ------------------------------
+
+  //----------------------- Stop timer -------------------------------------
+  {
+    runtime->issue_execution_fence(ctx);
+    TimingLauncher timer(MEASURE_MICRO_SECONDS);
+    Future future = runtime->issue_timing_measurement(ctx, timer);
+    future.get_void_result();
+  }
+  double ts_end = Realm::Clock::current_time_in_microseconds();
+  double run_time = 1e-6 * (ts_end - ts_start);
+  printf("ELAPSED TIME = %.4fs, THROUGHPUT = %.2f requests/s\n",
+         run_time,
+         moeConfig.total_requests / run_time);
+}
diff --git a/examples/cpp/inference/transformers/transformers.h b/examples/cpp/inference/transformers/transformers.h
new file mode 100644
index 0000000000..3c09f64055
--- /dev/null
+++ b/examples/cpp/inference/transformers/transformers.h
@@ -0,0 +1,123 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "data_generator.h"
+#include "flexflow/model.h"
+#define MAX_NUM_SAMPLES 1000
+#define MNIST_DIMS 28 * 28
+#define DATA_DIM MNIST_DIMS
+
+using namespace Legion;
+using namespace std;
+using namespace FlexFlow;
+
+struct MoeConfig {
+  MoeConfig(void) {
+    //----------------------- Input/output data ------------------------
+    token_dim = DATA_DIM;
+    sequence_length = 10;
+    batch_size = 32;
+    out_dim = 15;
+    num_labels = out_dim;
+    num_layers = 12;
+    //----------------------- Inference parameters ---------------------
+    // total number of requests processed as part of the simulation
+    total_requests = 256;
+    poisson_distribution = true;
+    // average number of request arrivals per second
+    arrival_rate = 25;
+    num_inflight_batches = 10;
+    //----------------------- MoE layer --------------------------------
+    // total number of experts
+    num_exp = 128;
+    // number of experts in each block of fused experts
+    experts_per_block = 32;
+    // number of experts to route each token to
+    num_select = 2;
+    // expert capacity parameters
+    alpha = 2.0f;   // factor overhead tensor size for imbalance
+    lambda = 0.04f; // multiplier for load balance term
+    // expert hidden size
+    hidden_size = DATA_DIM;
+    //----------------------- Rest of model parameters ------------------
+    // Encoder layer
+    num_attention_heads = 16;
+    attention_kdim = attention_vdim = hidden_size / num_attention_heads;
+    num_encoder_layers = 1;
+  }
+
+  // Input/output data
+  int token_dim;
+  int sequence_length;
+  int batch_size;
+  int out_dim;
+  int num_labels;
+  int num_layers;
+  std::string dataset_path;
+  // Inference parameters
+  int total_requests;
+  bool poisson_distribution;
+  double arrival_rate;
+  int num_inflight_batches;
+  // MoE layer
+  int num_exp;
+  int experts_per_block;
+  int num_select;
+  float alpha;
+  float lambda;
+  int hidden_size;
+  // Model parameters
+  int num_attention_heads;
+  int attention_kdim;
+  int attention_vdim;
+  int num_encoder_layers;
+};
+
+class DataLoader {
+public:
+  DataLoader(FFModel &ff,
+             MoeConfig const &moeConfig,
+             DataGenerator &data_generator,
+             ParallelTensor input,
+             ParallelTensor label);
+  static void load_input(Task const *task,
+                         std::vector<PhysicalRegion> const &regions,
+                         Context ctx,
+                         Runtime *runtime);
+  static void load_label(Task const *task,
+                         std::vector<PhysicalRegion> const &regions,
+                         Context ctx,
+                         Runtime *runtime);
+  static void load_entire_dataset(Task const *task,
+                                  std::vector<PhysicalRegion> const &regions,
+                                  Context ctx,
+                                  Runtime *runtime);
+  void next_batch(FFModel &, size_t);
+  void reset(void);
+
+public:
+  int num_samples, next_index;
+  FlexFlow::ParallelTensor full_input, batch_input;
+  FlexFlow::ParallelTensor full_label, batch_label;
+  struct DataLoaderInput {
+    MoeConfig const &_moeConfig;
+    DataGenerator &_data_generator;
+  };
+};
+
+struct SampleIdxs {
+  int num_samples;
+  int idxs[MAX_NUM_SAMPLES];
+};
diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
new file mode 100644
index 0000000000..4e781392b1
--- /dev/null
+++ b/include/flexflow/batch_config.h
@@ -0,0 +1,47 @@
+/* Copyright 2023 CMU, Stanford, Facebook, LANL
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#pragma once
+
+#include <cstdlib>
+
+
+namespace FlexFlow {
+
+struct InferenceResult {
+  static const int MAX_NUM_TOKENS = 1024;
+  int results[MAX_NUM_TOKENS];
+};
+
+class BatchConfig {
+public:
+  BatchConfig();
+  bool register_new_request(int guid, int length);
+  void prepare_next_batch();
+  int update_results(InferenceResult const &ir);
+  int num_processing_requests();
+  static const int MAX_NUM_REQUESTS = 256;
+  static const int MAX_NUM_TOKENS = InferenceResult::MAX_NUM_TOKENS;
+  static const int MAX_SEQUENCE_LENGTH = 1024;
+  // These are set by update
+  int token_start_idx[MAX_NUM_REQUESTS];
+  int token_last_available_idx[MAX_NUM_REQUESTS];
+  int num_processing_tokens[MAX_NUM_REQUESTS];
+  size_t request_guid[MAX_NUM_REQUESTS];
+  // This is set by the app
+  bool request_completed[MAX_NUM_REQUESTS];
+};
+
+}; // namespace FlexFlow
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index dacf6b3f28..9529052ac7 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -16,6 +16,7 @@
 #pragma once
 
 #include "flexflow/model.h"
+#include "flexflow/batch_config.h"
 
 namespace FlexFlow {
 
@@ -28,7 +29,7 @@ class InferenceManager {
                    int max_num_inflight_batches);
   void compile_model_and_allocate_buffer(void);
   void init_operators_inference();
-  void inference(int index);
+  Legion::FutureMap inference(int index, BatchConfig const &bc);
 
 public:
   std::unordered_map<ParallelTensor, std::vector<ParallelTensor>> tensor_buffer;
diff --git a/include/flexflow/operator.h b/include/flexflow/operator.h
index 985ef4374f..94bd19c927 100644
--- a/include/flexflow/operator.h
+++ b/include/flexflow/operator.h
@@ -3,9 +3,9 @@
 
 #include "flexflow/fftype.h"
 #include "flexflow/machine_view.h"
-#include "flexflow/batch_config.h"
 #include "flexflow/parallel_tensor.h"
 #include "flexflow/utils/dot/record_formatter.h"
+#include "flexflow/batch_config.h"
 #include <vector>
 
 namespace FlexFlow {
@@ -196,7 +196,7 @@ class Op {
   virtual void forward(FFModel const &) = 0;
   virtual void backward(FFModel const &) = 0;
   // Pure virtual functions for inference
-  virtual void inference(FFModel const &,
+  virtual Legion::FutureMap inference(FFModel const &,
                          BatchConfig const &,
                          std::vector<ParallelTensor> const &,
                          std::vector<ParallelTensor> const &,
diff --git a/include/flexflow/ops/aggregate.h b/include/flexflow/ops/aggregate.h
index 098e10d8e8..56f84308c2 100644
--- a/include/flexflow/ops/aggregate.h
+++ b/include/flexflow/ops/aggregate.h
@@ -3,6 +3,7 @@
 
 #include "flexflow/model.h"
 #include "flexflow/ops/aggregate_params.h"
+#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -36,11 +37,13 @@ class Aggregate : public Op {
             char const *name = nullptr);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
+                 BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
-  void inference(FFModel const &,
+  Legion::FutureMap inference(FFModel const &,
+                 BatchConfig const &,
                  std::vector<ParallelTensor> const &,
                  std::vector<ParallelTensor> const &,
                  MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/aggregate_spec.h b/include/flexflow/ops/aggregate_spec.h
index a80606d761..f48a5f95ee 100644
--- a/include/flexflow/ops/aggregate_spec.h
+++ b/include/flexflow/ops/aggregate_spec.h
@@ -3,6 +3,7 @@
 
 #include "flexflow/model.h"
 #include "flexflow/ops/aggregate_spec_params.h"
+#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -28,11 +29,13 @@ class AggregateSpec : public Op {
                 char const *name);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
+                 BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
-  void inference(FFModel const &,
+  Legion::FutureMap inference(FFModel const &,
+                 BatchConfig const &,
                  std::vector<ParallelTensor> const &,
                  std::vector<ParallelTensor> const &,
                  MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/attention.h b/include/flexflow/ops/attention.h
index baf4c06d48..88457756c5 100644
--- a/include/flexflow/ops/attention.h
+++ b/include/flexflow/ops/attention.h
@@ -8,6 +8,7 @@
 #include "flexflow/op_meta.h"
 #include "flexflow/operator.h"
 #include "flexflow/ops/attention_params.h"
+#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -65,12 +66,14 @@ class MultiHeadAttention : public Op {
                                  std::vector<ParallelTensor> const &inputs);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
+                 BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
-  void inference(FFModel const &,
+  Legion::FutureMap inference(FFModel const &,
+                 BatchConfig const &,
                  std::vector<ParallelTensor> const &,
                  std::vector<ParallelTensor> const &,
                  MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/element_binary.h b/include/flexflow/ops/element_binary.h
index 6e7edce223..351685f140 100644
--- a/include/flexflow/ops/element_binary.h
+++ b/include/flexflow/ops/element_binary.h
@@ -5,6 +5,7 @@
 #include "flexflow/node.h"
 #include "flexflow/operator.h"
 #include "flexflow/ops/element_binary_params.h"
+#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -26,12 +27,14 @@ class ElementBinary : public Op {
                 bool inplace_a = false);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
+                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
-  void inference(FFModel const &,
+  Legion::FutureMap inference(FFModel const &,
+                      BatchConfig const &,
                  std::vector<ParallelTensor> const &,
                  std::vector<ParallelTensor> const &,
                  MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/experts.h b/include/flexflow/ops/experts.h
index cd66618a07..dd15ca5019 100644
--- a/include/flexflow/ops/experts.h
+++ b/include/flexflow/ops/experts.h
@@ -2,6 +2,7 @@
 
 #include "flexflow/model.h"
 #include "flexflow/ops/experts_params.h"
+#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -55,12 +56,14 @@ class Experts : public Op {
 
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
+                 BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
-  void inference(FFModel const &,
+  Legion::FutureMap inference(FFModel const &,
+                 BatchConfig const &,
                  std::vector<ParallelTensor> const &,
                  std::vector<ParallelTensor> const &,
                  MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/groupby.h b/include/flexflow/ops/groupby.h
index 0acc241a9b..bdfdeea669 100644
--- a/include/flexflow/ops/groupby.h
+++ b/include/flexflow/ops/groupby.h
@@ -4,6 +4,7 @@
 #include "flexflow/model.h"
 #include "flexflow/node.h"
 #include "flexflow/ops/groupby_params.h"
+#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -35,12 +36,14 @@ class Group_by : public Op {
            char const *name = nullptr);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
+                 BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
-  void inference(FFModel const &,
+  Legion::FutureMap inference(FFModel const &,
+                 BatchConfig const &,
                  std::vector<ParallelTensor> const &,
                  std::vector<ParallelTensor> const &,
                  MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index 0b1572f2ca..7390d127a9 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -9,6 +9,7 @@
 #include "flexflow/op_meta.h"
 #include "flexflow/operator.h"
 #include "flexflow/ops/inc_multihead_self_attention_params.h"
+#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -60,12 +61,14 @@ class IncMultiHeadSelfAttention : public Op {
                                  std::vector<ParallelTensor> const &inputs);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
+                 BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
-  void inference(FFModel const &,
+  Legion::FutureMap inference(FFModel const &,
+                 BatchConfig const &,
                  std::vector<ParallelTensor> const &,
                  std::vector<ParallelTensor> const &,
                  MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/layer_norm.h b/include/flexflow/ops/layer_norm.h
index dac230e410..9c7bb6f31a 100644
--- a/include/flexflow/ops/layer_norm.h
+++ b/include/flexflow/ops/layer_norm.h
@@ -1,6 +1,7 @@
 #pragma once
 
 #include "flexflow/model.h"
+#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -25,12 +26,14 @@ class LayerNorm : public Op {
             char const *name);
   void init(FFModel const &);
   void init_inference(FFModel const &,
+                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &);
   void backward(FFModel const &);
-  void inference(FFModel const &,
+  Legion::FutureMap inference(FFModel const &,
+                      BatchConfig const &,
                  std::vector<ParallelTensor> const &,
                  std::vector<ParallelTensor> const &,
                  MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/linear.h b/include/flexflow/ops/linear.h
index ccd5724dc5..df4772831b 100644
--- a/include/flexflow/ops/linear.h
+++ b/include/flexflow/ops/linear.h
@@ -4,6 +4,7 @@
 #include "flexflow/node.h"
 #include "flexflow/operator.h"
 #include "flexflow/ops/linear_params.h"
+#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -36,12 +37,14 @@ class Linear : public Op {
 
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
+                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
-  void inference(FFModel const &,
+  Legion::FutureMap inference(FFModel const &,
+                      BatchConfig const &,
                  std::vector<ParallelTensor> const &,
                  std::vector<ParallelTensor> const &,
                  MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/noop.h b/include/flexflow/ops/noop.h
index a38d2945ca..7ca55463fd 100644
--- a/include/flexflow/ops/noop.h
+++ b/include/flexflow/ops/noop.h
@@ -2,6 +2,7 @@
 #define _FLEXFLOW_NOOP_H
 
 #include "flexflow/model.h"
+#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -18,11 +19,13 @@ class NoOp : public Op {
        char const *name = NULL);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
+                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void inference(FFModel const &,
+                      BatchConfig const &,
                  std::vector<ParallelTensor> const &,
                  std::vector<ParallelTensor> const &,
                  MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/softmax.h b/include/flexflow/ops/softmax.h
index de9ad56b45..7dfd372451 100644
--- a/include/flexflow/ops/softmax.h
+++ b/include/flexflow/ops/softmax.h
@@ -5,6 +5,7 @@
 #include "flexflow/node.h"
 #include "flexflow/operator.h"
 #include "flexflow/ops/softmax_params.h"
+#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -22,11 +23,13 @@ class Softmax : public Op {
           char const *name = nullptr);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
+                 BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
-  void inference(FFModel const &,
+  Legion::FutureMap inference(FFModel const &,
+                 BatchConfig const &,
                  std::vector<ParallelTensor> const &,
                  std::vector<ParallelTensor> const &,
                  MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/topk.h b/include/flexflow/ops/topk.h
index 5e8b515672..8d1bf010c3 100644
--- a/include/flexflow/ops/topk.h
+++ b/include/flexflow/ops/topk.h
@@ -4,6 +4,7 @@
 #include "flexflow/model.h"
 #include "flexflow/node.h"
 #include "flexflow/ops/topk_params.h"
+#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -29,12 +30,14 @@ class TopK : public Op {
        char const *name = nullptr);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
+                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
-  void inference(FFModel const &,
+  Legion::FutureMap inference(FFModel const &,
+                      BatchConfig const &,
                  std::vector<ParallelTensor> const &,
                  std::vector<ParallelTensor> const &,
                  MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/parallel_ops/partition.h b/include/flexflow/parallel_ops/partition.h
index f25bc83276..919446b0ab 100644
--- a/include/flexflow/parallel_ops/partition.h
+++ b/include/flexflow/parallel_ops/partition.h
@@ -6,6 +6,7 @@
 #include "flexflow/operator.h"
 #include "flexflow/parallel_ops/partition_params.h"
 #include "parallel_op.h"
+#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -30,11 +31,13 @@ class Repartition : public ParallelOp {
       std::vector<ParallelTensor> const &batch_outputs) override;
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
+                      BatchConfig const & bc,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void inference(FFModel const &,
+                      BatchConfig const & bc,
                  std::vector<ParallelTensor> const &,
                  std::vector<ParallelTensor> const &,
                  MachineView const *mv = nullptr) override;
diff --git a/src/ops/aggregate.cc b/src/ops/aggregate.cc
index e8bab41ce9..1556a93c78 100644
--- a/src/ops/aggregate.cc
+++ b/src/ops/aggregate.cc
@@ -285,7 +285,7 @@ void Aggregate::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-void Aggregate::inference(FFModel const &ff,
+FutureMap Aggregate::inference(FFModel const &ff,
                           BatchConfig const &bc,
                           std::vector<ParallelTensor> const &batch_inputs,
                           std::vector<ParallelTensor> const &batch_outputs,
@@ -338,7 +338,7 @@ void Aggregate::inference(FFModel const &ff,
                                                     EXCLUSIVE,
                                                     batch_outputs[0]->region));
   launcher.add_field(n + 2, FID_DATA);
-  runtime->execute_index_space(ctx, launcher);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 void Aggregate::forward_task(Task const *task,
diff --git a/src/ops/aggregate_spec.cc b/src/ops/aggregate_spec.cc
index a4720a669b..a255f2ed5f 100644
--- a/src/ops/aggregate_spec.cc
+++ b/src/ops/aggregate_spec.cc
@@ -259,7 +259,7 @@ void AggregateSpec::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-void AggregateSpec::inference(FFModel const &ff,
+FutureMap AggregateSpec::inference(FFModel const &ff,
     BatchConfig const &bc,
                               std::vector<ParallelTensor> const &batch_inputs,
                               std::vector<ParallelTensor> const &batch_outputs,
@@ -312,7 +312,7 @@ void AggregateSpec::inference(FFModel const &ff,
                                                     EXCLUSIVE,
                                                     batch_outputs[0]->region));
   launcher.add_field(n + 2, FID_DATA);
-  runtime->execute_index_space(ctx, launcher);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 void AggregateSpec::forward_task(Task const *task,
diff --git a/src/ops/attention.cc b/src/ops/attention.cc
index ec24eaae94..f0195c95d6 100644
--- a/src/ops/attention.cc
+++ b/src/ops/attention.cc
@@ -580,7 +580,7 @@ void MultiHeadAttention::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-void MultiHeadAttention::inference(
+FutureMap MultiHeadAttention::inference(
     FFModel const &ff,
     BatchConfig const &bc,
     std::vector<ParallelTensor> const &batch_inputs,
@@ -635,7 +635,7 @@ void MultiHeadAttention::inference(
                                                     EXCLUSIVE,
                                                     batch_outputs[0]->region));
   launcher.add_field(4, FID_DATA);
-  runtime->execute_index_space(ctx, launcher);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 /*
diff --git a/src/ops/element_binary.cc b/src/ops/element_binary.cc
index 9758225b3e..e1cc3d04c4 100644
--- a/src/ops/element_binary.cc
+++ b/src/ops/element_binary.cc
@@ -507,7 +507,7 @@ void ElementBinary::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-void ElementBinary::inference(FFModel const &ff,
+FutureMap ElementBinary::inference(FFModel const &ff,
     BatchConfig const &bc,
                               std::vector<ParallelTensor> const &batch_inputs,
                               std::vector<ParallelTensor> const &batch_outputs,
@@ -581,7 +581,7 @@ void ElementBinary::inference(FFModel const &ff,
       launcher.add_field(2, FID_DATA);
     }
   }
-  runtime->execute_index_space(ctx, launcher);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 /*
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index d4a72f5dff..1abf834551 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -643,7 +643,7 @@ void Experts::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-void Experts::inference(FFModel const &ff,
+FutureMap Experts::inference(FFModel const &ff,
     BatchConfig const &bc,
                         std::vector<ParallelTensor> const &batch_inputs,
                         std::vector<ParallelTensor> const &batch_outputs,
@@ -712,7 +712,7 @@ void Experts::inference(FFModel const &ff,
       launcher.add_field(4 + i * (1 + use_bias) + use_bias, FID_DATA);
     }
   }
-  runtime->execute_index_space(ctx, launcher);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 void Experts::inference_task(Task const *task,
diff --git a/src/ops/group_by.cc b/src/ops/group_by.cc
index faeafb9f05..bfdb05bfe7 100644
--- a/src/ops/group_by.cc
+++ b/src/ops/group_by.cc
@@ -312,7 +312,7 @@ void Group_by::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-void Group_by::inference(FFModel const &ff,
+FutureMap Group_by::inference(FFModel const &ff,
     BatchConfig const &bc,
                          std::vector<ParallelTensor> const &batch_inputs,
                          std::vector<ParallelTensor> const &batch_outputs,
@@ -359,7 +359,7 @@ void Group_by::inference(FFModel const &ff,
     launcher.add_field(i + 2, FID_DATA);
   }
 
-  runtime->execute_index_space(ctx, launcher);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 void Group_by::forward_task(Task const *task,
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index 6b5910c711..d938cd1b4c 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -464,7 +464,7 @@ void IncMultiHeadSelfAttention::forward(FFModel const &ff) {
   assert(false);
 }
 
-void IncMultiHeadSelfAttention::inference(
+FutureMap IncMultiHeadSelfAttention::inference(
     FFModel const &ff,
     BatchConfig const &bc,
     std::vector<ParallelTensor> const &batch_inputs,
@@ -504,7 +504,7 @@ void IncMultiHeadSelfAttention::inference(
                                                     EXCLUSIVE,
                                                     batch_outputs[0]->region));
   launcher.add_field(idx++, FID_DATA);
-  runtime->execute_index_space(ctx, launcher);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 /*
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index 56c2bec1fc..b2716cb24d 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -195,6 +195,7 @@ LayerNorm::LayerNorm(FFModel &model,
 }
 
 void LayerNorm::init_inference(FFModel const &ff,
+                      BatchConfig const & bc,
                                std::vector<ParallelTensor> const &batch_inputs,
                                std::vector<ParallelTensor> const &batch_outputs,
                                MachineView const *mv) {
@@ -315,7 +316,8 @@ void LayerNorm::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-void LayerNorm::inference(FFModel const &ff,
+FutureMap LayerNorm::inference(FFModel const &ff,
+                      BatchConfig const & bc,
                           std::vector<ParallelTensor> const &batch_inputs,
                           std::vector<ParallelTensor> const &batch_outputs,
                           MachineView const *mv) {
@@ -362,7 +364,7 @@ void LayerNorm::inference(FFModel const &ff,
                                                       weights[1]->region));
     launcher.add_field(3, FID_DATA);
   }
-  runtime->execute_index_space(ctx, launcher);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 /*
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index c7308bae15..f91da55762 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -255,6 +255,7 @@ void Linear::init(FFModel const &ff) {
 }
 
 void Linear::init_inference(FFModel const &ff,
+                      BatchConfig const & bc,
                             std::vector<ParallelTensor> const &batch_inputs,
                             std::vector<ParallelTensor> const &batch_outputs,
                             MachineView const *mv) {
@@ -420,7 +421,8 @@ void Linear::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-void Linear::inference(FFModel const &ff,
+FutureMap Linear::inference(FFModel const &ff,
+                      BatchConfig const & bc,
                        std::vector<ParallelTensor> const &batch_inputs,
                        std::vector<ParallelTensor> const &batch_outputs,
                        MachineView const *mv) {
@@ -467,7 +469,7 @@ void Linear::inference(FFModel const &ff,
                                                       weights[1]->region));
     launcher.add_field(3, FID_DATA);
   }
-  runtime->execute_index_space(ctx, launcher);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 void Linear::forward_task(Task const *task,
diff --git a/src/ops/noop.cc b/src/ops/noop.cc
index 46968acb03..7ad714a4c4 100644
--- a/src/ops/noop.cc
+++ b/src/ops/noop.cc
@@ -96,6 +96,7 @@ OpMeta *NoOp::init_task(Task const *task,
 }
 
 void NoOp::init_inference(FFModel const &ff,
+                      BatchConfig const & bc,
                           std::vector<ParallelTensor> const &batch_inputs,
                           std::vector<ParallelTensor> const &batch_outputs,
                           MachineView const *mv) {
@@ -258,7 +259,8 @@ void NoOp::init(FFModel const &ff) {
 
 void NoOp::forward(FFModel const &ff) {}
 
-void NoOp::inference(FFModel const &ff,
+FutureMap NoOp::inference(FFModel const &ff,
+                      BatchConfig const & bc,
                      std::vector<ParallelTensor> const &batch_inputs,
                      std::vector<ParallelTensor> const &batch_outputs,
                      MachineView const *mv) {}
diff --git a/src/ops/softmax.cc b/src/ops/softmax.cc
index 389cd8a678..3bdb8b4f8d 100644
--- a/src/ops/softmax.cc
+++ b/src/ops/softmax.cc
@@ -116,6 +116,7 @@ Softmax::Softmax(FFModel &model,
     : Softmax(model, input, params.dim, name) {}
 
 void Softmax::init_inference(FFModel const &ff,
+                      BatchConfig const & bc,
                              std::vector<ParallelTensor> const &batch_inputs,
                              std::vector<ParallelTensor> const &batch_outputs,
                              MachineView const *mv) {
@@ -225,7 +226,8 @@ OpMeta *Softmax::init_task(Task const *task,
   return m;
 }
 
-void Softmax::inference(FFModel const &ff,
+FutureMap Softmax::inference(FFModel const &ff,
+                      BatchConfig const & bc,
                         std::vector<ParallelTensor> const &batch_inputs,
                         std::vector<ParallelTensor> const &batch_outputs,
                         MachineView const *mv) {
@@ -286,7 +288,7 @@ void Softmax::forward(FFModel const &ff) {
                                                     EXCLUSIVE,
                                                     outputs[0]->region));
   launcher.add_field(1, FID_DATA);
-  runtime->execute_index_space(ctx, launcher);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 void Softmax::forward_task(Task const *task,
diff --git a/src/ops/topk.cc b/src/ops/topk.cc
index 3763514685..26aa6aeeb5 100644
--- a/src/ops/topk.cc
+++ b/src/ops/topk.cc
@@ -137,6 +137,7 @@ TopK::TopK(FFModel &model,
     : TopK(model, input, params.k, params.sorted, name) {}
 
 void TopK::init_inference(FFModel const &ff,
+                      BatchConfig const & bc,
                           std::vector<ParallelTensor> const &batch_inputs,
                           std::vector<ParallelTensor> const &batch_outputs,
                           MachineView const *mv) {
@@ -263,7 +264,8 @@ void TopK::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-void TopK::inference(FFModel const &ff,
+FutureMap TopK::inference(FFModel const &ff,
+                      BatchConfig const & bc,
                      std::vector<ParallelTensor> const &batch_inputs,
                      std::vector<ParallelTensor> const &batch_outputs,
                      MachineView const *mv) {
@@ -302,7 +304,7 @@ void TopK::inference(FFModel const &ff,
                                                     EXCLUSIVE,
                                                     batch_outputs[1]->region));
   launcher.add_field(2, FID_DATA);
-  runtime->execute_index_space(ctx, launcher);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 void TopK::forward_task(Task const *task,
diff --git a/src/parallel_ops/partition.cc b/src/parallel_ops/partition.cc
index 7fdf9a8e4a..3e9ef7eac6 100644
--- a/src/parallel_ops/partition.cc
+++ b/src/parallel_ops/partition.cc
@@ -103,6 +103,7 @@ OpMeta *Repartition::init_task(Task const *task,
 
 void Repartition::init_inference(
     FFModel const &ff,
+                      BatchConfig const & bc,
     std::vector<ParallelTensor> const &batch_inputs,
     std::vector<ParallelTensor> const &batch_outputs,
     MachineView const *mv) {
@@ -200,6 +201,7 @@ void Repartition::create_input_partition_inference(
 }
 
 void Repartition::inference(FFModel const &ff,
+                      BatchConfig const & bc,
                             std::vector<ParallelTensor> const &batch_inputs,
                             std::vector<ParallelTensor> const &batch_outputs,
                             MachineView const *mv) {
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 541cf34976..a5b846dbdb 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -111,16 +111,18 @@ void InferenceManager::init_operators_inference() {
           ((ParallelOp *)op)
               ->create_input_partition_inference(*model, inputs, outputs);
         }
-        op->init_inference(*model, inputs, outputs, view);
+        BatchConfig bc;
+        op->init_inference(*model, bc, inputs, outputs, view);
       }
     }
   }
 }
 
-void InferenceManager::inference(int index) {
+FutureMap InferenceManager::inference(int index, BatchConfig const &bc) {
   int batch_index = index % max_num_inflight_batches;
   int device_index = index % num_devices;
   int expert_device_index = 0;
+  FutureMap fm;
   for (size_t o = 0; o < model->operators.size(); o++) {
     Op *op = model->operators[o];
     if (op->op_type == OP_WEIGHT) {
@@ -156,8 +158,9 @@ void InferenceManager::inference(int index) {
       outputs[i] = tensor_buffer[op->outputs[i]][batch_index];
       assert(outputs[i]->parallel_is != IndexSpace::NO_SPACE);
     }
-    op->inference(*model, inputs, outputs, view);
+    fm = op->inference(*model, bc, inputs, outputs, view);
   }
+  return fm;
 };
 
 }; // namespace FlexFlow

From b6ed7639f6632ad69ff71209cfc89e576424ecd4 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Tue, 28 Feb 2023 01:38:17 +0000
Subject: [PATCH 065/344] format

---
 examples/cpp/inference/data_generator.cc      |   8 +-
 examples/cpp/inference/data_generator.h       |  16 +-
 .../inference/transformers/transformers.cc    |  42 ++---
 include/flexflow/batch_config.h               |   9 +-
 include/flexflow/inference.h                  |   2 +-
 include/flexflow/operator.h                   |  10 +-
 include/flexflow/ops/aggregate.h              |  12 +-
 include/flexflow/ops/aggregate_spec.h         |  12 +-
 include/flexflow/ops/attention.h              |  12 +-
 include/flexflow/ops/element_binary.h         |  10 +-
 include/flexflow/ops/experts.h                |  12 +-
 include/flexflow/ops/groupby.h                |  12 +-
 .../ops/inc_multihead_self_attention.h        |  90 +++++------
 include/flexflow/ops/layer_norm.h             |  10 +-
 include/flexflow/ops/linear.h                 |  10 +-
 include/flexflow/ops/noop.h                   |  12 +-
 include/flexflow/ops/softmax.h                |  12 +-
 include/flexflow/ops/topk.h                   |  10 +-
 include/flexflow/parallel_ops/partition.h     |  14 +-
 src/ops/aggregate.cc                          |   8 +-
 src/ops/aggregate_spec.cc                     |  11 +-
 src/ops/element_binary.cc                     |  11 +-
 src/ops/experts.cc                            |  10 +-
 src/ops/group_by.cc                           |  10 +-
 src/ops/inc_multihead_self_attention.cc       | 151 +++++++++---------
 src/ops/inc_multihead_self_attention.cu       |  31 ++--
 src/ops/layer_norm.cc                         |  10 +-
 src/ops/linear.cc                             |  10 +-
 src/ops/noop.cc                               |  13 +-
 src/ops/softmax.cc                            |  14 +-
 src/ops/topk.cc                               |  10 +-
 src/parallel_ops/partition.cc                 |  15 +-
 32 files changed, 318 insertions(+), 301 deletions(-)

diff --git a/examples/cpp/inference/data_generator.cc b/examples/cpp/inference/data_generator.cc
index 16efe57e3f..3e8daa7d41 100644
--- a/examples/cpp/inference/data_generator.cc
+++ b/examples/cpp/inference/data_generator.cc
@@ -80,7 +80,9 @@ void DataGenerator::start_timer(void) {
   timer_started = true;
 };
 
-size_t DataGenerator::get_requests(size_t max_num_requests, std::vector<std::pair<size_t, std::vector<int> > >&prompts) {
+size_t DataGenerator::get_requests(
+    size_t max_num_requests,
+    std::vector<std::pair<size_t, std::vector<int>>> &prompts) {
   if (!timer_started) {
     std::cout << "Warning: tried to get number of requests before the timer "
                  "was started."
@@ -103,8 +105,9 @@ size_t DataGenerator::get_requests(size_t max_num_requests, std::vector<std::pai
   for (size_t i = 0; i < received_requests; i++) {
     int length = std::rand() % 10 + 5;
     std::vector<int> prompt;
-    for (int j = 0; j < length; j++)
+    for (int j = 0; j < length; j++) {
       prompt.push_back(j + 1000);
+    }
     prompts.push_back(std::make_pair(global_unique_id++, prompt));
   }
   assert(prompts.size() == received_requests);
@@ -133,4 +136,3 @@ size_t DataGenerator::get_requests() {
 
   return received_requests;
 }
-
diff --git a/examples/cpp/inference/data_generator.h b/examples/cpp/inference/data_generator.h
index 93bb565c41..777c7cadd7 100644
--- a/examples/cpp/inference/data_generator.h
+++ b/examples/cpp/inference/data_generator.h
@@ -29,7 +29,9 @@ class DataGenerator {
   void start_timer(void);
   // Get number of requests that have arrived since the last time this function
   // was called
-  size_t get_requests(size_t max_num_requests, std::vector<std::pair<size_t, std::vector<int> > > &prompts);
+  size_t
+      get_requests(size_t max_num_requests,
+                   std::vector<std::pair<size_t, std::vector<int>>> &prompts);
   size_t get_requests();
 
 private:
@@ -37,12 +39,12 @@ class DataGenerator {
   // vector.
   void generate_arrival_times(void);
 
-  size_t num_requests;    // total number of requests
-  size_t token_dim;       // embedding dim of each token
-  size_t sequence_length; // dimension of one request tensor
-  bool poisson_distr;     // false implies uniform distribution
-  double lambda;          // mean #num of arrivals per sec
-  bool timer_started;     // whether timer was initiated
+  size_t num_requests;     // total number of requests
+  size_t token_dim;        // embedding dim of each token
+  size_t sequence_length;  // dimension of one request tensor
+  bool poisson_distr;      // false implies uniform distribution
+  double lambda;           // mean #num of arrivals per sec
+  bool timer_started;      // whether timer was initiated
   size_t global_unique_id; // guid for requests
   // time when get_requests() is called for the first time
   Clock::time_point start_time;
diff --git a/examples/cpp/inference/transformers/transformers.cc b/examples/cpp/inference/transformers/transformers.cc
index 27e438037e..ab9f485517 100644
--- a/examples/cpp/inference/transformers/transformers.cc
+++ b/examples/cpp/inference/transformers/transformers.cc
@@ -36,20 +36,21 @@ void parse_input_args(char **argv, int argc, MoeConfig &config) {
 }
 
 Tensor create_inc_multihead_attention_decoder(FFModel *model,
-                                MoeConfig const *moeConfig,
-                                Tensor const &input) {
+                                              MoeConfig const *moeConfig,
+                                              Tensor const &input) {
   std::vector<int> axes{0};
   Tensor t = model->inc_multihead_self_attention(input,
-                                              moeConfig->hidden_size,
-                                              moeConfig->num_attention_heads,
-                                              moeConfig->attention_kdim,
-                                              moeConfig->attention_vdim);
+                                                 moeConfig->hidden_size,
+                                                 moeConfig->num_attention_heads,
+                                                 moeConfig->attention_kdim,
+                                                 moeConfig->attention_vdim);
 
   t = model->layer_norm(model->add(t, input), axes, true, 1e-05);
-  Tensor x = model->dense(model->dense(t, moeConfig->hidden_size, AC_MODE_RELU, false /*bias*/),
-                          moeConfig->hidden_size,
-                          AC_MODE_NONE,
-                          false /*bias*/);
+  Tensor x = model->dense(
+      model->dense(t, moeConfig->hidden_size, AC_MODE_RELU, false /*bias*/),
+      moeConfig->hidden_size,
+      AC_MODE_NONE,
+      false /*bias*/);
   t = model->layer_norm(model->add(x, t), axes, true, 1e-05);
   return t;
 }
@@ -122,17 +123,17 @@ void FlexFlow::top_level_task(Task const *task,
   data_loader.reset();
   data_generator.start_timer();
   std::map<int, Future> future_handlers;
-  std::map<int, BatchConfig*> batch_configs;
+  std::map<int, BatchConfig *> batch_configs;
   while (processed_requests < moeConfig.total_requests) {
     for (int bid = 0; bid < im.max_num_inflight_batches; bid++) {
       if (future_handlers.find(bid) == future_handlers.end()) {
-        std::vector<std::pair<size_t, std::vector<int> > > prompts;
+        std::vector<std::pair<size_t, std::vector<int>>> prompts;
         assert(im.max_num_requests_per_batch <= BatchConfig::MAX_NUM_REQUESTS);
         data_generator.get_requests(im.max_num_requests_per_batch, prompts);
         assert((int)prompts.size() < im.max_num_requests_per_batch);
-        //TODO: loading data
-        BatchConfig* bc = new BatchConfig();
-        for (const auto & prompt : prompts) {
+        // TODO: loading data
+        BatchConfig *bc = new BatchConfig();
+        for (auto const &prompt : prompts) {
           assert(bc->register_new_request(prompt.first, prompt.second.size()));
         }
         bc->prepare_next_batch();
@@ -145,17 +146,18 @@ void FlexFlow::top_level_task(Task const *task,
         batch_configs[bid] = bc;
       } else {
         Future future = future_handlers[bid];
-        if (!future.is_ready(true/*subscribe*/)) {
+        if (!future.is_ready(true /*subscribe*/)) {
           continue;
         }
         InferenceResult ir = future.get_result<InferenceResult>();
-        BatchConfig* bc = batch_configs[bid];
+        BatchConfig *bc = batch_configs[bid];
         processed_requests += bc->update_results(ir);
-        int available_slots = BatchConfig::MAX_NUM_REQUESTS - bc->num_processing_requests();
-        std::vector<std::pair<size_t, std::vector<int> > > prompts;
+        int available_slots =
+            BatchConfig::MAX_NUM_REQUESTS - bc->num_processing_requests();
+        std::vector<std::pair<size_t, std::vector<int>>> prompts;
         data_generator.get_requests(available_slots, prompts);
         processed_requests += prompts.size();
-        for (const auto& prompt : prompts) {
+        for (auto const &prompt : prompts) {
           assert(bc->register_new_request(prompt.first, prompt.second.size()));
         }
         bc->prepare_next_batch();
diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 4e781392b1..648406f2de 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -17,11 +17,10 @@
 
 #include <cstdlib>
 
-
 namespace FlexFlow {
 
 struct InferenceResult {
-  static const int MAX_NUM_TOKENS = 1024;
+  static int const MAX_NUM_TOKENS = 1024;
   int results[MAX_NUM_TOKENS];
 };
 
@@ -32,9 +31,9 @@ class BatchConfig {
   void prepare_next_batch();
   int update_results(InferenceResult const &ir);
   int num_processing_requests();
-  static const int MAX_NUM_REQUESTS = 256;
-  static const int MAX_NUM_TOKENS = InferenceResult::MAX_NUM_TOKENS;
-  static const int MAX_SEQUENCE_LENGTH = 1024;
+  static int const MAX_NUM_REQUESTS = 256;
+  static int const MAX_NUM_TOKENS = InferenceResult::MAX_NUM_TOKENS;
+  static int const MAX_SEQUENCE_LENGTH = 1024;
   // These are set by update
   int token_start_idx[MAX_NUM_REQUESTS];
   int token_last_available_idx[MAX_NUM_REQUESTS];
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index 9529052ac7..92aa8f5d21 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -15,8 +15,8 @@
 
 #pragma once
 
-#include "flexflow/model.h"
 #include "flexflow/batch_config.h"
+#include "flexflow/model.h"
 
 namespace FlexFlow {
 
diff --git a/include/flexflow/operator.h b/include/flexflow/operator.h
index 94bd19c927..1690e0e3f3 100644
--- a/include/flexflow/operator.h
+++ b/include/flexflow/operator.h
@@ -1,11 +1,11 @@
 #ifndef _OPERATOR_H
 #define _OPERATOR_H
 
+#include "flexflow/batch_config.h"
 #include "flexflow/fftype.h"
 #include "flexflow/machine_view.h"
 #include "flexflow/parallel_tensor.h"
 #include "flexflow/utils/dot/record_formatter.h"
-#include "flexflow/batch_config.h"
 #include <vector>
 
 namespace FlexFlow {
@@ -197,10 +197,10 @@ class Op {
   virtual void backward(FFModel const &) = 0;
   // Pure virtual functions for inference
   virtual Legion::FutureMap inference(FFModel const &,
-                         BatchConfig const &,
-                         std::vector<ParallelTensor> const &,
-                         std::vector<ParallelTensor> const &,
-                         MachineView const *mv = nullptr) {
+                                      BatchConfig const &,
+                                      std::vector<ParallelTensor> const &,
+                                      std::vector<ParallelTensor> const &,
+                                      MachineView const *mv = nullptr) {
     assert(false);
   };
   virtual void print_layer(FFModel const &model) = 0;
diff --git a/include/flexflow/ops/aggregate.h b/include/flexflow/ops/aggregate.h
index 56f84308c2..27b9981ddd 100644
--- a/include/flexflow/ops/aggregate.h
+++ b/include/flexflow/ops/aggregate.h
@@ -1,9 +1,9 @@
 #ifndef _FLEXFLOW_AGGREGATE_H_
 #define _FLEXFLOW_AGGREGATE_H_
 
+#include "flexflow/inference.h"
 #include "flexflow/model.h"
 #include "flexflow/ops/aggregate_params.h"
-#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -37,16 +37,16 @@ class Aggregate : public Op {
             char const *name = nullptr);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
-                 BatchConfig const &,
+                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                 BatchConfig const &,
-                 std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &,
-                 MachineView const *mv = nullptr) override;
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
   void backward(FFModel const &) override;
   void print_layer(FFModel const &model) override {
     assert(0);
diff --git a/include/flexflow/ops/aggregate_spec.h b/include/flexflow/ops/aggregate_spec.h
index f48a5f95ee..ce1ceb34d6 100644
--- a/include/flexflow/ops/aggregate_spec.h
+++ b/include/flexflow/ops/aggregate_spec.h
@@ -1,9 +1,9 @@
 #ifndef _FLEXFLOW_AGGREGATE_SPEC_H_
 #define _FLEXFLOW_AGGREGATE_SPEC_H_
 
+#include "flexflow/inference.h"
 #include "flexflow/model.h"
 #include "flexflow/ops/aggregate_spec_params.h"
-#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -29,16 +29,16 @@ class AggregateSpec : public Op {
                 char const *name);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
-                 BatchConfig const &,
+                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                 BatchConfig const &,
-                 std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &,
-                 MachineView const *mv = nullptr) override;
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
   void backward(FFModel const &) override;
   void print_layer(FFModel const &model) override {
     assert(0);
diff --git a/include/flexflow/ops/attention.h b/include/flexflow/ops/attention.h
index 88457756c5..c3146ad38b 100644
--- a/include/flexflow/ops/attention.h
+++ b/include/flexflow/ops/attention.h
@@ -3,12 +3,12 @@
 
 #include "flexflow/device.h"
 #include "flexflow/fftype.h"
+#include "flexflow/inference.h"
 #include "flexflow/layer.h"
 #include "flexflow/node.h"
 #include "flexflow/op_meta.h"
 #include "flexflow/operator.h"
 #include "flexflow/ops/attention_params.h"
-#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -66,17 +66,17 @@ class MultiHeadAttention : public Op {
                                  std::vector<ParallelTensor> const &inputs);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
-                 BatchConfig const &,
+                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                 BatchConfig const &,
-                 std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &,
-                 MachineView const *mv = nullptr) override;
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
diff --git a/include/flexflow/ops/element_binary.h b/include/flexflow/ops/element_binary.h
index 351685f140..5a14acb80b 100644
--- a/include/flexflow/ops/element_binary.h
+++ b/include/flexflow/ops/element_binary.h
@@ -1,11 +1,11 @@
 #ifndef _FLEXFLOW_ELEMENT_BINARY_H
 #define _FLEXFLOW_ELEMENT_BINARY_H
 
+#include "flexflow/inference.h"
 #include "flexflow/layer.h"
 #include "flexflow/node.h"
 #include "flexflow/operator.h"
 #include "flexflow/ops/element_binary_params.h"
-#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -34,10 +34,10 @@ class ElementBinary : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                      BatchConfig const &,
-                 std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &,
-                 MachineView const *mv = nullptr) override;
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
diff --git a/include/flexflow/ops/experts.h b/include/flexflow/ops/experts.h
index dd15ca5019..74c24c5a19 100644
--- a/include/flexflow/ops/experts.h
+++ b/include/flexflow/ops/experts.h
@@ -1,8 +1,8 @@
 #pragma once
 
+#include "flexflow/inference.h"
 #include "flexflow/model.h"
 #include "flexflow/ops/experts_params.h"
-#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -56,17 +56,17 @@ class Experts : public Op {
 
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
-                 BatchConfig const &,
+                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                 BatchConfig const &,
-                 std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &,
-                 MachineView const *mv = nullptr) override;
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override;
   void serialize(Legion::Serializer &) const override;
   static PCG::Node deserialize(FFModel &ff,
diff --git a/include/flexflow/ops/groupby.h b/include/flexflow/ops/groupby.h
index bdfdeea669..bef61dc755 100644
--- a/include/flexflow/ops/groupby.h
+++ b/include/flexflow/ops/groupby.h
@@ -1,10 +1,10 @@
 #ifndef _FLEXFLOW_GROUPBY_H_
 #define _FLEXFLOW_GROUPBY_H_
 
+#include "flexflow/inference.h"
 #include "flexflow/model.h"
 #include "flexflow/node.h"
 #include "flexflow/ops/groupby_params.h"
-#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -36,17 +36,17 @@ class Group_by : public Op {
            char const *name = nullptr);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
-                 BatchConfig const &,
+                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                 BatchConfig const &,
-                 std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &,
-                 MachineView const *mv = nullptr) override;
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index 7390d127a9..4f2dc80635 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -1,15 +1,14 @@
 #ifndef _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_H
 #define _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_H
 
-
 #include "flexflow/device.h"
 #include "flexflow/fftype.h"
+#include "flexflow/inference.h"
 #include "flexflow/layer.h"
 #include "flexflow/node.h"
 #include "flexflow/op_meta.h"
 #include "flexflow/operator.h"
 #include "flexflow/ops/inc_multihead_self_attention_params.h"
-#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -21,57 +20,57 @@ class IncMultiHeadSelfAttention : public Op {
   using Input = ParallelTensor;
 
   IncMultiHeadSelfAttention(FFModel &model,
-                     LayerID const &layer_guid,
-                     const ParallelTensor _input,
-                     int _embed_dim,
-                     int _num_heads,
-                     int _kdim,
-                     int _vdim,
-                     float _dropout,
-                     bool _bias,
-                     bool _add_bias_kv,
-                     bool _add_zero_attn,
-                     bool allocate_weights,
-                     char const *name);
+                            LayerID const &layer_guid,
+                            const ParallelTensor _input,
+                            int _embed_dim,
+                            int _num_heads,
+                            int _kdim,
+                            int _vdim,
+                            float _dropout,
+                            bool _bias,
+                            bool _add_bias_kv,
+                            bool _add_zero_attn,
+                            bool allocate_weights,
+                            char const *name);
   IncMultiHeadSelfAttention(FFModel &model,
-                     const ParallelTensor _input,
-                     const ParallelTensor _weight,
-                     int _embed_dim,
-                     int _num_heads,
-                     int _kdim,
-                     int _vdim,
-                     float _dropout,
-                     bool _bias,
-                     bool _add_bias_kv,
-                     bool _add_zero_attn,
-                     bool allocate_weights,
-                     char const *name);
+                            const ParallelTensor _input,
+                            const ParallelTensor _weight,
+                            int _embed_dim,
+                            int _num_heads,
+                            int _kdim,
+                            int _vdim,
+                            float _dropout,
+                            bool _bias,
+                            bool _add_bias_kv,
+                            bool _add_zero_attn,
+                            bool allocate_weights,
+                            char const *name);
   IncMultiHeadSelfAttention(FFModel &model,
-                     IncMultiHeadSelfAttention const &other,
-                     const ParallelTensor input,
-                     bool allocate_weights);
+                            IncMultiHeadSelfAttention const &other,
+                            const ParallelTensor input,
+                            bool allocate_weights);
   IncMultiHeadSelfAttention(FFModel &model,
-                     Params const &params,
-                     Input const &inputs,
-                     bool allocate_weights = false,
-                     char const *name = nullptr);
+                            Params const &params,
+                            Input const &inputs,
+                            bool allocate_weights = false,
+                            char const *name = nullptr);
   static Op *
       create_operator_from_layer(FFModel &model,
                                  Layer const *layer,
                                  std::vector<ParallelTensor> const &inputs);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
-                 BatchConfig const &,
+                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                 BatchConfig const &,
-                 std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &,
-                 MachineView const *mv = nullptr) override;
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
@@ -94,10 +93,11 @@ class IncMultiHeadSelfAttention : public Op {
                                float *output_ptr,
                                ffStream_t stream);
   static void inference_kernel_wrapper(IncMultiHeadSelfAttentionMeta const *m,
-                                     float const *input_ptr,
-                                     float const *weight_ptr,
-                                     float *output_ptr);
+                                       float const *input_ptr,
+                                       float const *weight_ptr,
+                                       float *output_ptr);
   Params get_params() const;
+
 public:
   int num_heads;
   float dropout;
@@ -110,10 +110,10 @@ class IncMultiHeadSelfAttention : public Op {
 class IncMultiHeadSelfAttentionMeta : public OpMeta {
 public:
   IncMultiHeadSelfAttentionMeta(FFHandler handler,
-                         IncMultiHeadSelfAttention const *attn,
-                         Legion::Memory gpu_mem,
-                         int num_samples,
-                         int num_heads);
+                                IncMultiHeadSelfAttention const *attn,
+                                Legion::Memory gpu_mem,
+                                int num_samples,
+                                int num_heads);
   ~IncMultiHeadSelfAttentionMeta(void);
 
 public:
diff --git a/include/flexflow/ops/layer_norm.h b/include/flexflow/ops/layer_norm.h
index 9c7bb6f31a..284f42a716 100644
--- a/include/flexflow/ops/layer_norm.h
+++ b/include/flexflow/ops/layer_norm.h
@@ -1,7 +1,7 @@
 #pragma once
 
-#include "flexflow/model.h"
 #include "flexflow/inference.h"
+#include "flexflow/model.h"
 
 namespace FlexFlow {
 
@@ -33,10 +33,10 @@ class LayerNorm : public Op {
   void forward(FFModel const &);
   void backward(FFModel const &);
   Legion::FutureMap inference(FFModel const &,
-                      BatchConfig const &,
-                 std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &,
-                 MachineView const *mv = nullptr) override;
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) {
     assert(0);
   }
diff --git a/include/flexflow/ops/linear.h b/include/flexflow/ops/linear.h
index df4772831b..b0af71e610 100644
--- a/include/flexflow/ops/linear.h
+++ b/include/flexflow/ops/linear.h
@@ -1,10 +1,10 @@
 #ifndef _FLEXFLOW_LINEAR_H
 #define _FLEXFLOW_LINEAR_H
 
+#include "flexflow/inference.h"
 #include "flexflow/node.h"
 #include "flexflow/operator.h"
 #include "flexflow/ops/linear_params.h"
-#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -44,10 +44,10 @@ class Linear : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                      BatchConfig const &,
-                 std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &,
-                 MachineView const *mv = nullptr) override;
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override;
   bool get_int_parameter(PMParameter, int *) const override;
   static Op *
diff --git a/include/flexflow/ops/noop.h b/include/flexflow/ops/noop.h
index 7ca55463fd..91ccc15094 100644
--- a/include/flexflow/ops/noop.h
+++ b/include/flexflow/ops/noop.h
@@ -1,8 +1,8 @@
 #ifndef _FLEXFLOW_NOOP_H
 #define _FLEXFLOW_NOOP_H
 
-#include "flexflow/model.h"
 #include "flexflow/inference.h"
+#include "flexflow/model.h"
 
 namespace FlexFlow {
 
@@ -24,11 +24,11 @@ class NoOp : public Op {
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
-  void inference(FFModel const &,
-                      BatchConfig const &,
-                 std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &,
-                 MachineView const *mv = nullptr) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
   void backward(FFModel const &) override;
   void print_layer(FFModel const &model) override {
     assert(0);
diff --git a/include/flexflow/ops/softmax.h b/include/flexflow/ops/softmax.h
index 7dfd372451..a8be3b98d5 100644
--- a/include/flexflow/ops/softmax.h
+++ b/include/flexflow/ops/softmax.h
@@ -1,11 +1,11 @@
 #ifndef _FLEXFLOW_SOFTMAX_H
 #define _FLEXFLOW_SOFTMAX_H
 
+#include "flexflow/inference.h"
 #include "flexflow/layer.h"
 #include "flexflow/node.h"
 #include "flexflow/operator.h"
 #include "flexflow/ops/softmax_params.h"
-#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -23,16 +23,16 @@ class Softmax : public Op {
           char const *name = nullptr);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
-                 BatchConfig const &,
+                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                 BatchConfig const &,
-                 std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &,
-                 MachineView const *mv = nullptr) override;
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
   void backward(FFModel const &) override;
   bool get_int_parameter(PMParameter, int *) const override;
   void print_layer(FFModel const &model) override {
diff --git a/include/flexflow/ops/topk.h b/include/flexflow/ops/topk.h
index 8d1bf010c3..138c11b4d7 100644
--- a/include/flexflow/ops/topk.h
+++ b/include/flexflow/ops/topk.h
@@ -1,10 +1,10 @@
 #ifndef _FLEXFLOW_TOPK_H_
 #define _FLEXFLOW_TOPK_H_
 
+#include "flexflow/inference.h"
 #include "flexflow/model.h"
 #include "flexflow/node.h"
 #include "flexflow/ops/topk_params.h"
-#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -37,10 +37,10 @@ class TopK : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                      BatchConfig const &,
-                 std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &,
-                 MachineView const *mv = nullptr) override;
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
diff --git a/include/flexflow/parallel_ops/partition.h b/include/flexflow/parallel_ops/partition.h
index 919446b0ab..1658759411 100644
--- a/include/flexflow/parallel_ops/partition.h
+++ b/include/flexflow/parallel_ops/partition.h
@@ -1,12 +1,12 @@
 #ifndef _FLEXFLOW_PARTITION_H
 #define _FLEXFLOW_PARTITION_H
 
+#include "flexflow/inference.h"
 #include "flexflow/layer.h"
 #include "flexflow/node.h"
 #include "flexflow/operator.h"
 #include "flexflow/parallel_ops/partition_params.h"
 #include "parallel_op.h"
-#include "flexflow/inference.h"
 
 namespace FlexFlow {
 
@@ -31,16 +31,16 @@ class Repartition : public ParallelOp {
       std::vector<ParallelTensor> const &batch_outputs) override;
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
-                      BatchConfig const & bc,
+                      BatchConfig const &bc,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
-  void inference(FFModel const &,
-                      BatchConfig const & bc,
-                 std::vector<ParallelTensor> const &,
-                 std::vector<ParallelTensor> const &,
-                 MachineView const *mv = nullptr) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfig const &bc,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
   void backward(FFModel const &) override;
   bool get_int_parameter(PMParameter, int *) const override;
   bool append_parallel_op_info(
diff --git a/src/ops/aggregate.cc b/src/ops/aggregate.cc
index 1556a93c78..12ab38efad 100644
--- a/src/ops/aggregate.cc
+++ b/src/ops/aggregate.cc
@@ -286,10 +286,10 @@ void Aggregate::forward(FFModel const &ff) {
 }
 
 FutureMap Aggregate::inference(FFModel const &ff,
-                          BatchConfig const &bc,
-                          std::vector<ParallelTensor> const &batch_inputs,
-                          std::vector<ParallelTensor> const &batch_outputs,
-                          MachineView const *mv) {
+                               BatchConfig const &bc,
+                               std::vector<ParallelTensor> const &batch_inputs,
+                               std::vector<ParallelTensor> const &batch_outputs,
+                               MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
diff --git a/src/ops/aggregate_spec.cc b/src/ops/aggregate_spec.cc
index a255f2ed5f..b5c3551cb3 100644
--- a/src/ops/aggregate_spec.cc
+++ b/src/ops/aggregate_spec.cc
@@ -259,11 +259,12 @@ void AggregateSpec::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-FutureMap AggregateSpec::inference(FFModel const &ff,
-    BatchConfig const &bc,
-                              std::vector<ParallelTensor> const &batch_inputs,
-                              std::vector<ParallelTensor> const &batch_outputs,
-                              MachineView const *mv) {
+FutureMap
+    AggregateSpec::inference(FFModel const &ff,
+                             BatchConfig const &bc,
+                             std::vector<ParallelTensor> const &batch_inputs,
+                             std::vector<ParallelTensor> const &batch_outputs,
+                             MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
diff --git a/src/ops/element_binary.cc b/src/ops/element_binary.cc
index e1cc3d04c4..01f68919bd 100644
--- a/src/ops/element_binary.cc
+++ b/src/ops/element_binary.cc
@@ -507,11 +507,12 @@ void ElementBinary::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
-FutureMap ElementBinary::inference(FFModel const &ff,
-    BatchConfig const &bc,
-                              std::vector<ParallelTensor> const &batch_inputs,
-                              std::vector<ParallelTensor> const &batch_outputs,
-                              MachineView const *mv) {
+FutureMap
+    ElementBinary::inference(FFModel const &ff,
+                             BatchConfig const &bc,
+                             std::vector<ParallelTensor> const &batch_inputs,
+                             std::vector<ParallelTensor> const &batch_outputs,
+                             MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index 1abf834551..37954f67ad 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -428,7 +428,7 @@ Node Experts::deserialize(FFModel &ff,
 }
 
 void Experts::init_inference(FFModel const &ff,
-    BatchConfig const &bc,
+                             BatchConfig const &bc,
                              std::vector<ParallelTensor> const &batch_inputs,
                              std::vector<ParallelTensor> const &batch_outputs,
                              MachineView const *mv) {
@@ -644,10 +644,10 @@ void Experts::forward(FFModel const &ff) {
 }
 
 FutureMap Experts::inference(FFModel const &ff,
-    BatchConfig const &bc,
-                        std::vector<ParallelTensor> const &batch_inputs,
-                        std::vector<ParallelTensor> const &batch_outputs,
-                        MachineView const *mv) {
+                             BatchConfig const &bc,
+                             std::vector<ParallelTensor> const &batch_inputs,
+                             std::vector<ParallelTensor> const &batch_outputs,
+                             MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
diff --git a/src/ops/group_by.cc b/src/ops/group_by.cc
index bfdb05bfe7..ae274a1672 100644
--- a/src/ops/group_by.cc
+++ b/src/ops/group_by.cc
@@ -165,7 +165,7 @@ Group_by::Group_by(FFModel &model,
           model, inputs.first, inputs.second, params.n, params.alpha, name) {}
 
 void Group_by::init_inference(FFModel const &ff,
-    BatchConfig const &bc,
+                              BatchConfig const &bc,
                               std::vector<ParallelTensor> const &batch_inputs,
                               std::vector<ParallelTensor> const &batch_outputs,
                               MachineView const *mv) {
@@ -313,10 +313,10 @@ void Group_by::forward(FFModel const &ff) {
 }
 
 FutureMap Group_by::inference(FFModel const &ff,
-    BatchConfig const &bc,
-                         std::vector<ParallelTensor> const &batch_inputs,
-                         std::vector<ParallelTensor> const &batch_outputs,
-                         MachineView const *mv) {
+                              BatchConfig const &bc,
+                              std::vector<ParallelTensor> const &batch_inputs,
+                              std::vector<ParallelTensor> const &batch_outputs,
+                              MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index d938cd1b4c..1111e35f8e 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -37,7 +37,8 @@ using Legion::Task;
 using Legion::TaskArgument;
 using Legion::TaskLauncher;
 
-bool IncMultiHeadSelfAttentionParams::is_valid(ParallelTensorShape const &input) const {
+bool IncMultiHeadSelfAttentionParams::is_valid(
+    ParallelTensorShape const &input) const {
   bool is_valid = input.is_valid();
   return is_valid;
 }
@@ -53,7 +54,7 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
                                              bool add_zero_attn,
                                              Initializer *kernel_initializer,
                                              char const *name) {
-  // Currently assume that 
+  // Currently assume that
   Layer *li = new Layer(this,
                         OP_INC_MULTIHEAD_SELF_ATTENTION,
                         DT_FLOAT,
@@ -139,19 +140,20 @@ Op *IncMultiHeadSelfAttention::create_operator_from_layer(
                                        layer->name);
 }
 
-IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(FFModel &model,
-                                                     LayerID const &_layer_guid,
-                                                     const ParallelTensor _input,
-                                                     int _embed_dim,
-                                                     int _num_heads,
-                                                     int _kdim,
-                                                     int _vdim,
-                                                     float _dropout,
-                                                     bool _bias,
-                                                     bool _add_bias_kv,
-                                                     bool _add_zero_attn,
-                                                     bool allocate_weights,
-                                                     char const *name)
+IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
+    FFModel &model,
+    LayerID const &_layer_guid,
+    const ParallelTensor _input,
+    int _embed_dim,
+    int _num_heads,
+    int _kdim,
+    int _vdim,
+    float _dropout,
+    bool _bias,
+    bool _add_bias_kv,
+    bool _add_zero_attn,
+    bool allocate_weights,
+    char const *name)
     // Initializer* _bias_initializer)
     : Op(model,
          OP_MULTIHEAD_ATTENTION,
@@ -166,8 +168,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(FFModel &model,
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
       vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
       vProjSize(_vdim), oProjSize(_embed_dim),
-      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size)
-{
+      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size) {
   // overwrite layer_guid
   layer_guid = _layer_guid;
 
@@ -221,19 +222,20 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(FFModel &model,
   /* assert(check_output_input_weight_parallel_dims()); */
 }
 
-IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(FFModel &model,
-                                                     const ParallelTensor _input,
-                                                     const ParallelTensor _weight,
-                                                     int _embed_dim,
-                                                     int _num_heads,
-                                                     int _kdim,
-                                                     int _vdim,
-                                                     float _dropout,
-                                                     bool _bias,
-                                                     bool _add_bias_kv,
-                                                     bool _add_zero_attn,
-                                                     bool allocate_weights,
-                                                     char const *name)
+IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
+    FFModel &model,
+    const ParallelTensor _input,
+    const ParallelTensor _weight,
+    int _embed_dim,
+    int _num_heads,
+    int _kdim,
+    int _vdim,
+    float _dropout,
+    bool _bias,
+    bool _add_bias_kv,
+    bool _add_zero_attn,
+    bool allocate_weights,
+    char const *name)
     // Initializer* _bias_initializer)
     : Op(model,
          OP_INC_MULTIHEAD_SELF_ATTENTION,
@@ -302,23 +304,24 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(FFModel &model,
   /* assert(check_output_input_weight_parallel_dims()); */
 }
 
-IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(FFModel &model,
-                                       IncMultiHeadSelfAttention const &other,
-                                       const ParallelTensor input,
-                                       bool allocate_weights)
+IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
+    FFModel &model,
+    IncMultiHeadSelfAttention const &other,
+    const ParallelTensor input,
+    bool allocate_weights)
     : IncMultiHeadSelfAttention(model,
-                         other.layer_guid,
-                         input,
-                         other.oProjSize,
-                         other.num_heads,
-                         other.qProjSize,
-                         other.vProjSize,
-                         other.dropout,
-                         other.bias,
-                         other.add_bias_kv,
-                         other.add_zero_attn,
-                         allocate_weights,
-                         other.name) {}
+                                other.layer_guid,
+                                input,
+                                other.oProjSize,
+                                other.num_heads,
+                                other.qProjSize,
+                                other.vProjSize,
+                                other.dropout,
+                                other.bias,
+                                other.add_bias_kv,
+                                other.add_zero_attn,
+                                allocate_weights,
+                                other.name) {}
 
 IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     FFModel &model,
@@ -327,18 +330,18 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     bool allocate_weights,
     char const *name)
     : IncMultiHeadSelfAttention(model,
-                         params.layer_guid,
-                         input,
-                         params.embed_dim,
-                         params.num_heads,
-                         params.kdim,
-                         params.vdim,
-                         params.dropout,
-                         params.bias,
-                         params.add_bias_kv,
-                         params.add_zero_attn,
-                         allocate_weights,
-                         name) {}
+                                params.layer_guid,
+                                input,
+                                params.embed_dim,
+                                params.num_heads,
+                                params.kdim,
+                                params.vdim,
+                                params.dropout,
+                                params.bias,
+                                params.add_bias_kv,
+                                params.add_zero_attn,
+                                allocate_weights,
+                                name) {}
 
 void IncMultiHeadSelfAttention::init_inference(
     FFModel const &ff,
@@ -428,12 +431,13 @@ void IncMultiHeadSelfAttention::init(FFModel const &ff) {
   regions[1](I): weight
   regions[2](O): output
 */
-OpMeta *
-    IncMultiHeadSelfAttention::init_task(Task const *task,
-                                  std::vector<PhysicalRegion> const &regions,
-                                  Context ctx,
-                                  Runtime *runtime) {
-  IncMultiHeadSelfAttention const *attn = (IncMultiHeadSelfAttention *)task->args;
+OpMeta *IncMultiHeadSelfAttention::init_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  IncMultiHeadSelfAttention const *attn =
+      (IncMultiHeadSelfAttention *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
       DT_FLOAT, regions[0], task->regions[0], FID_DATA, ctx, runtime);
@@ -452,8 +456,8 @@ OpMeta *
                        .only_kind(Memory::GPU_FB_MEM)
                        .best_affinity_to(task->target_proc)
                        .first();
-  IncMultiHeadSelfAttentionMeta *m =
-      new IncMultiHeadSelfAttentionMeta(handle, attn, gpu_mem, num_samples, num_heads);
+  IncMultiHeadSelfAttentionMeta *m = new IncMultiHeadSelfAttentionMeta(
+      handle, attn, gpu_mem, num_samples, num_heads);
   m->profiling = attn->profiling;
   assert(weight.domain.get_volume() * sizeof(float) == m->weightSize);
   return m;
@@ -519,7 +523,8 @@ void IncMultiHeadSelfAttention::inference_task(
     Runtime *runtime) {
   assert(regions.size() == 3);
   assert(task->regions.size() == regions.size());
-  // const IncMultiHeadSelfAttention* attn = (IncMultiHeadSelfAttention*) task->args;
+  // const IncMultiHeadSelfAttention* attn = (IncMultiHeadSelfAttention*)
+  // task->args;
   IncMultiHeadSelfAttentionMeta const *m =
       *((IncMultiHeadSelfAttentionMeta **)task->local_args);
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
@@ -529,10 +534,8 @@ void IncMultiHeadSelfAttention::inference_task(
   GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
       m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
 
-  IncMultiHeadSelfAttention::inference_kernel_wrapper(m,
-                                             input.get_float_ptr(),
-                                             weight.get_float_ptr(),
-                                             output.get_float_ptr());
+  IncMultiHeadSelfAttention::inference_kernel_wrapper(
+      m, input.get_float_ptr(), weight.get_float_ptr(), output.get_float_ptr());
 }
 
 void IncMultiHeadSelfAttention::backward(FFModel const &ff) {
@@ -540,7 +543,8 @@ void IncMultiHeadSelfAttention::backward(FFModel const &ff) {
   assert(false);
 }
 
-bool IncMultiHeadSelfAttention::get_int_parameter(PMParameter para, int *value) const {
+bool IncMultiHeadSelfAttention::get_int_parameter(PMParameter para,
+                                                  int *value) const {
   switch (para) {
     case PM_NUM_HEADS:
       *value = num_heads;
@@ -595,8 +599,7 @@ bool IncMultiHeadSelfAttention::measure_operator_cost(
 
   std::function<void()> forward, backward;
   forward = [&] {
-    inference_kernel_wrapper(
-        m, input_ptr, weight_ptr, output_ptr);
+    inference_kernel_wrapper(m, input_ptr, weight_ptr, output_ptr);
   };
   if (sim->computationMode == COMP_MODE_TRAINING) {
     // IncMultiHeadSelfAttention does not support training
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index b903a6f073..e7439fa7d2 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -23,11 +23,12 @@ using Legion::coord_t;
 using Legion::Memory;
 
 /*static*/
-void IncMultiHeadSelfAttention::inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
-                                        float const *input_ptr,
-                                        float const *weight_ptr,
-                                        float *output_ptr,
-                                        cudaStream_t stream) {
+void IncMultiHeadSelfAttention::inference_kernel(
+    IncMultiHeadSelfAttentionMeta const *m,
+    float const *input_ptr,
+    float const *weight_ptr,
+    float *output_ptr,
+    cudaStream_t stream) {
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
 
   checkCUDNN(cudnnMultiHeadAttnForward(m->handle.dnn,
@@ -55,10 +56,11 @@ void IncMultiHeadSelfAttention::inference_kernel(IncMultiHeadSelfAttentionMeta c
 }
 
 /*static*/
-void IncMultiHeadSelfAttention::inference_kernel_wrapper(IncMultiHeadSelfAttentionMeta const *m,
-                                                float const *input_ptr,
-                                                float const *weight_ptr,
-                                                float *output_ptr) {
+void IncMultiHeadSelfAttention::inference_kernel_wrapper(
+    IncMultiHeadSelfAttentionMeta const *m,
+    float const *input_ptr,
+    float const *weight_ptr,
+    float *output_ptr) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -84,11 +86,12 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(IncMultiHeadSelfAttenti
   }
 }
 
-IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(FFHandler handler,
-                                               IncMultiHeadSelfAttention const *attn,
-                                               Memory gpu_mem,
-                                               int num_samples,
-                                               int num_heads)
+IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
+    FFHandler handler,
+    IncMultiHeadSelfAttention const *attn,
+    Memory gpu_mem,
+    int num_samples,
+    int num_heads)
     : OpMeta(handler) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index b2716cb24d..949da919af 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -195,7 +195,7 @@ LayerNorm::LayerNorm(FFModel &model,
 }
 
 void LayerNorm::init_inference(FFModel const &ff,
-                      BatchConfig const & bc,
+                               BatchConfig const &bc,
                                std::vector<ParallelTensor> const &batch_inputs,
                                std::vector<ParallelTensor> const &batch_outputs,
                                MachineView const *mv) {
@@ -317,10 +317,10 @@ void LayerNorm::forward(FFModel const &ff) {
 }
 
 FutureMap LayerNorm::inference(FFModel const &ff,
-                      BatchConfig const & bc,
-                          std::vector<ParallelTensor> const &batch_inputs,
-                          std::vector<ParallelTensor> const &batch_outputs,
-                          MachineView const *mv) {
+                               BatchConfig const &bc,
+                               std::vector<ParallelTensor> const &batch_inputs,
+                               std::vector<ParallelTensor> const &batch_outputs,
+                               MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index f91da55762..84a962c998 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -255,7 +255,7 @@ void Linear::init(FFModel const &ff) {
 }
 
 void Linear::init_inference(FFModel const &ff,
-                      BatchConfig const & bc,
+                            BatchConfig const &bc,
                             std::vector<ParallelTensor> const &batch_inputs,
                             std::vector<ParallelTensor> const &batch_outputs,
                             MachineView const *mv) {
@@ -422,10 +422,10 @@ void Linear::forward(FFModel const &ff) {
 }
 
 FutureMap Linear::inference(FFModel const &ff,
-                      BatchConfig const & bc,
-                       std::vector<ParallelTensor> const &batch_inputs,
-                       std::vector<ParallelTensor> const &batch_outputs,
-                       MachineView const *mv) {
+                            BatchConfig const &bc,
+                            std::vector<ParallelTensor> const &batch_inputs,
+                            std::vector<ParallelTensor> const &batch_outputs,
+                            MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
diff --git a/src/ops/noop.cc b/src/ops/noop.cc
index 7ad714a4c4..2a2686cabd 100644
--- a/src/ops/noop.cc
+++ b/src/ops/noop.cc
@@ -96,7 +96,7 @@ OpMeta *NoOp::init_task(Task const *task,
 }
 
 void NoOp::init_inference(FFModel const &ff,
-                      BatchConfig const & bc,
+                          BatchConfig const &bc,
                           std::vector<ParallelTensor> const &batch_inputs,
                           std::vector<ParallelTensor> const &batch_outputs,
                           MachineView const *mv) {
@@ -260,10 +260,13 @@ void NoOp::init(FFModel const &ff) {
 void NoOp::forward(FFModel const &ff) {}
 
 FutureMap NoOp::inference(FFModel const &ff,
-                      BatchConfig const & bc,
-                     std::vector<ParallelTensor> const &batch_inputs,
-                     std::vector<ParallelTensor> const &batch_outputs,
-                     MachineView const *mv) {}
+                          BatchConfig const &bc,
+                          std::vector<ParallelTensor> const &batch_inputs,
+                          std::vector<ParallelTensor> const &batch_outputs,
+                          MachineView const *mv) {
+  FutureMap empty;
+  return empty;
+}
 
 void NoOp::backward(FFModel const &ff) {}
 
diff --git a/src/ops/softmax.cc b/src/ops/softmax.cc
index 3bdb8b4f8d..09eea13492 100644
--- a/src/ops/softmax.cc
+++ b/src/ops/softmax.cc
@@ -116,7 +116,7 @@ Softmax::Softmax(FFModel &model,
     : Softmax(model, input, params.dim, name) {}
 
 void Softmax::init_inference(FFModel const &ff,
-                      BatchConfig const & bc,
+                             BatchConfig const &bc,
                              std::vector<ParallelTensor> const &batch_inputs,
                              std::vector<ParallelTensor> const &batch_outputs,
                              MachineView const *mv) {
@@ -227,10 +227,10 @@ OpMeta *Softmax::init_task(Task const *task,
 }
 
 FutureMap Softmax::inference(FFModel const &ff,
-                      BatchConfig const & bc,
-                        std::vector<ParallelTensor> const &batch_inputs,
-                        std::vector<ParallelTensor> const &batch_outputs,
-                        MachineView const *mv) {
+                             BatchConfig const &bc,
+                             std::vector<ParallelTensor> const &batch_inputs,
+                             std::vector<ParallelTensor> const &batch_outputs,
+                             MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
@@ -260,7 +260,7 @@ FutureMap Softmax::inference(FFModel const &ff,
                                                     EXCLUSIVE,
                                                     batch_outputs[0]->region));
   launcher.add_field(1, FID_DATA);
-  runtime->execute_index_space(ctx, launcher);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 void Softmax::forward(FFModel const &ff) {
@@ -288,7 +288,7 @@ void Softmax::forward(FFModel const &ff) {
                                                     EXCLUSIVE,
                                                     outputs[0]->region));
   launcher.add_field(1, FID_DATA);
-  return runtime->execute_index_space(ctx, launcher);
+  runtime->execute_index_space(ctx, launcher);
 }
 
 void Softmax::forward_task(Task const *task,
diff --git a/src/ops/topk.cc b/src/ops/topk.cc
index 26aa6aeeb5..6192010c51 100644
--- a/src/ops/topk.cc
+++ b/src/ops/topk.cc
@@ -137,7 +137,7 @@ TopK::TopK(FFModel &model,
     : TopK(model, input, params.k, params.sorted, name) {}
 
 void TopK::init_inference(FFModel const &ff,
-                      BatchConfig const & bc,
+                          BatchConfig const &bc,
                           std::vector<ParallelTensor> const &batch_inputs,
                           std::vector<ParallelTensor> const &batch_outputs,
                           MachineView const *mv) {
@@ -265,10 +265,10 @@ void TopK::forward(FFModel const &ff) {
 }
 
 FutureMap TopK::inference(FFModel const &ff,
-                      BatchConfig const & bc,
-                     std::vector<ParallelTensor> const &batch_inputs,
-                     std::vector<ParallelTensor> const &batch_outputs,
-                     MachineView const *mv) {
+                          BatchConfig const &bc,
+                          std::vector<ParallelTensor> const &batch_inputs,
+                          std::vector<ParallelTensor> const &batch_outputs,
+                          MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
diff --git a/src/parallel_ops/partition.cc b/src/parallel_ops/partition.cc
index 3e9ef7eac6..464b1cb1e6 100644
--- a/src/parallel_ops/partition.cc
+++ b/src/parallel_ops/partition.cc
@@ -103,7 +103,7 @@ OpMeta *Repartition::init_task(Task const *task,
 
 void Repartition::init_inference(
     FFModel const &ff,
-                      BatchConfig const & bc,
+    BatchConfig const &bc,
     std::vector<ParallelTensor> const &batch_inputs,
     std::vector<ParallelTensor> const &batch_outputs,
     MachineView const *mv) {
@@ -200,11 +200,12 @@ void Repartition::create_input_partition_inference(
                                inference_input_lps[batch_inputs[0]]);
 }
 
-void Repartition::inference(FFModel const &ff,
-                      BatchConfig const & bc,
-                            std::vector<ParallelTensor> const &batch_inputs,
-                            std::vector<ParallelTensor> const &batch_outputs,
-                            MachineView const *mv) {
+FutureMap
+    Repartition::inference(FFModel const &ff,
+                           BatchConfig const &bc,
+                           std::vector<ParallelTensor> const &batch_inputs,
+                           std::vector<ParallelTensor> const &batch_outputs,
+                           MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
@@ -237,7 +238,7 @@ void Repartition::inference(FFModel const &ff,
                                                     EXCLUSIVE,
                                                     batch_outputs[0]->region));
   launcher.add_field(1, FID_DATA);
-  runtime->execute_index_space(ctx, launcher);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 void Repartition::forward(FFModel const &ff) {

From 85b1fc5be50376b76059af1e8b2cc5d4fa73dcbb Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Tue, 28 Feb 2023 03:59:34 +0000
Subject: [PATCH 066/344] bug fixes

---
 .../cpp/inference/transformers/dataloader.cc  |  4 +-
 .../inference/transformers/transformers.cc    |  4 +-
 .../cpp/inference/transformers/transformers.h |  2 +-
 include/flexflow/batch_config.h               |  8 ++--
 include/flexflow/model.h                      |  1 +
 include/flexflow/ops/softmax.h                |  5 +++
 src/ops/inc_multihead_self_attention.cc       |  2 +-
 src/ops/inc_multihead_self_attention.cu       |  2 +-
 src/ops/softmax.cc                            | 25 ++++++++++-
 src/runtime/ffconst_utils.cc                  |  2 +
 src/runtime/graph.cc                          | 44 +++++++++++++++++++
 src/runtime/inference_manager.cc              |  2 +-
 src/runtime/model.cc                          |  7 +++
 src/runtime/operator_params.cc                |  3 ++
 src/runtime/substitution.cc                   |  8 ++++
 15 files changed, 107 insertions(+), 12 deletions(-)

diff --git a/examples/cpp/inference/transformers/dataloader.cc b/examples/cpp/inference/transformers/dataloader.cc
index a61598299e..6a1ccb2338 100644
--- a/examples/cpp/inference/transformers/dataloader.cc
+++ b/examples/cpp/inference/transformers/dataloader.cc
@@ -50,7 +50,7 @@ DataLoader::DataLoader(FFModel &ff,
       // Assume only the first dim can be the replica dim
       assert(i == replica_idx || (!dims[i].is_replica_dim));
     }
-    assert(dims[batch_idx].size == ff.config.batchSize);
+    assert(dims[batch_idx].size == BatchConfig::MAX_NUM_TOKENS);
     dims[batch_idx].size = num_samples;
 
     full_input =
@@ -72,7 +72,7 @@ DataLoader::DataLoader(FFModel &ff,
       // Assume only the last dim can be the replica dim
       assert(i == replica_idx || (!dims[i].is_replica_dim));
     }
-    assert(dims[batch_idx].size == ff.config.batchSize);
+    assert(dims[batch_idx].size == BatchConfig::MAX_NUM_TOKENS);
     // replace batch size with number of samples
     dims[batch_idx].size = num_samples;
 
diff --git a/examples/cpp/inference/transformers/transformers.cc b/examples/cpp/inference/transformers/transformers.cc
index ab9f485517..f67d779e3a 100644
--- a/examples/cpp/inference/transformers/transformers.cc
+++ b/examples/cpp/inference/transformers/transformers.cc
@@ -38,7 +38,7 @@ void parse_input_args(char **argv, int argc, MoeConfig &config) {
 Tensor create_inc_multihead_attention_decoder(FFModel *model,
                                               MoeConfig const *moeConfig,
                                               Tensor const &input) {
-  std::vector<int> axes{0};
+  std::vector<int> axes{1};
   Tensor t = model->inc_multihead_self_attention(input,
                                                  moeConfig->hidden_size,
                                                  moeConfig->num_attention_heads,
@@ -153,7 +153,7 @@ void FlexFlow::top_level_task(Task const *task,
         BatchConfig *bc = batch_configs[bid];
         processed_requests += bc->update_results(ir);
         int available_slots =
-            BatchConfig::MAX_NUM_REQUESTS - bc->num_processing_requests();
+            BatchConfig::MAX_NUM_REQUESTS - bc->num_active_requests();
         std::vector<std::pair<size_t, std::vector<int>>> prompts;
         data_generator.get_requests(available_slots, prompts);
         processed_requests += prompts.size();
diff --git a/examples/cpp/inference/transformers/transformers.h b/examples/cpp/inference/transformers/transformers.h
index 3c09f64055..207a5de56b 100644
--- a/examples/cpp/inference/transformers/transformers.h
+++ b/examples/cpp/inference/transformers/transformers.h
@@ -31,7 +31,7 @@ struct MoeConfig {
     batch_size = 32;
     out_dim = 15;
     num_labels = out_dim;
-    num_layers = 12;
+    num_layers = 1;
     //----------------------- Inference parameters ---------------------
     // total number of requests processed as part of the simulation
     total_requests = 256;
diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 648406f2de..558e7841b5 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -27,19 +27,21 @@ struct InferenceResult {
 class BatchConfig {
 public:
   BatchConfig();
-  bool register_new_request(int guid, int length);
+  bool register_new_request(size_t guid, int length);
   void prepare_next_batch();
   int update_results(InferenceResult const &ir);
-  int num_processing_requests();
+  int num_active_requests();
+  int num_active_tokens();
   static int const MAX_NUM_REQUESTS = 256;
   static int const MAX_NUM_TOKENS = InferenceResult::MAX_NUM_TOKENS;
   static int const MAX_SEQUENCE_LENGTH = 1024;
   // These are set by update
+  int num_tokens, num_requests;
+  bool cached_results;
   int token_start_idx[MAX_NUM_REQUESTS];
   int token_last_available_idx[MAX_NUM_REQUESTS];
   int num_processing_tokens[MAX_NUM_REQUESTS];
   size_t request_guid[MAX_NUM_REQUESTS];
-  // This is set by the app
   bool request_completed[MAX_NUM_REQUESTS];
 };
 
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 041d8c507d..151aff1eaf 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -112,6 +112,7 @@ enum TaskIDs {
   SOFTMAX_INIT_TASK_ID,
   SOFTMAX_FWD_TASK_ID,
   SOFTMAX_BWD_TASK_ID,
+  SOFTMAX_INF_TASK_ID,
   CONCAT_INIT_TASK_ID,
   CONCAT_FWD_TASK_ID,
   CONCAT_BWD_TASK_ID,
diff --git a/include/flexflow/ops/softmax.h b/include/flexflow/ops/softmax.h
index a8be3b98d5..85eecfb744 100644
--- a/include/flexflow/ops/softmax.h
+++ b/include/flexflow/ops/softmax.h
@@ -54,6 +54,11 @@ class Softmax : public Op {
                             std::vector<Legion::PhysicalRegion> const &regions,
                             Legion::Context ctx,
                             Legion::Runtime *runtime);
+  static InferenceResult
+      inference_task(Legion::Task const *task,
+                     std::vector<Legion::PhysicalRegion> const &regions,
+                     Legion::Context ctx,
+                     Legion::Runtime *runtime);
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
                              CostMetrics &cost_metrics) const override;
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index 1111e35f8e..efbf8636de 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -156,7 +156,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     char const *name)
     // Initializer* _bias_initializer)
     : Op(model,
-         OP_MULTIHEAD_ATTENTION,
+         OP_INC_MULTIHEAD_SELF_ATTENTION,
          DT_FLOAT,
          name,
          1 /*inputs*/,
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index e7439fa7d2..048453dd17 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -92,7 +92,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     Memory gpu_mem,
     int num_samples,
     int num_heads)
-    : OpMeta(handler) {
+    : OpMeta(handler, attn) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDNN(cudnnSetStream(handler.dnn, stream));
diff --git a/src/ops/softmax.cc b/src/ops/softmax.cc
index 09eea13492..310c835ab8 100644
--- a/src/ops/softmax.cc
+++ b/src/ops/softmax.cc
@@ -240,7 +240,7 @@ FutureMap Softmax::inference(FFModel const &ff,
   size_t machine_view_hash = view->hash();
   /* std::cout << "Softmax op machine_view: " << *(MachineView const *)mv
             << std::endl; */
-  IndexLauncher launcher(SOFTMAX_FWD_TASK_ID,
+  IndexLauncher launcher(SOFTMAX_INF_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
                          argmap,
@@ -409,6 +409,29 @@ void Softmax::backward_task_with_dim(Task const *task,
       m, acc_input_grad.ptr, acc_output_grad.ptr, acc_input_grad.rect.volume());
 }
 
+InferenceResult
+    Softmax::inference_task(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
+  Domain in_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  switch (in_domain.get_dim()) {
+#define DIMFUNC(DIM)                                                           \
+  case DIM: {                                                                  \
+    forward_task_with_dim<DIM>(task, regions, ctx, runtime);                   \
+    break;                                                                     \
+  }
+    LEGION_FOREACH_N(DIMFUNC)
+#undef DIMFUNC
+    default:
+      assert(false);
+  }
+  // FIXME: replace this with actual result
+  InferenceResult ir;
+  return ir;
+}
+
 bool Softmax::get_int_parameter(PMParameter para, int *value) const {
   switch (para) {
     case PM_SOFTMAX_DIM:
diff --git a/src/runtime/ffconst_utils.cc b/src/runtime/ffconst_utils.cc
index dcf8d7f882..b762ad0dd5 100644
--- a/src/runtime/ffconst_utils.cc
+++ b/src/runtime/ffconst_utils.cc
@@ -143,6 +143,8 @@ std::string get_operator_type_name(OperatorType type) {
       return "PReLU";
     case OP_MULTIHEAD_ATTENTION:
       return "MultiHeadAttention";
+    case OP_INC_MULTIHEAD_SELF_ATTENTION:
+      return "IncMultiHeadSelfAttention";
     case OP_INPUT:
       return "Input";
     case OP_WEIGHT:
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index 0efa3711e0..6434c86ced 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -29,6 +29,7 @@
 #include "flexflow/ops/flat.h"
 #include "flexflow/ops/gather.h"
 #include "flexflow/ops/groupby.h"
+#include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ops/layer_norm.h"
 #include "flexflow/ops/linear.h"
 #include "flexflow/ops/noop.h"
@@ -1714,6 +1715,19 @@ GraphOptimalViewSerialized
         sez.serialize(attn->add_zero_attn);
         break;
       }
+      case OP_INC_MULTIHEAD_SELF_ATTENTION: {
+        IncMultiHeadSelfAttention *attn = (IncMultiHeadSelfAttention *)op;
+        sez.serialize(attn->layer_guid.id);
+        sez.serialize(attn->oProjSize);
+        sez.serialize(attn->num_heads);
+        sez.serialize(attn->qProjSize);
+        sez.serialize(attn->vProjSize);
+        sez.serialize(attn->dropout);
+        sez.serialize(attn->bias);
+        sez.serialize(attn->add_bias_kv);
+        sez.serialize(attn->add_zero_attn);
+        break;
+      }
       case OP_SOFTMAX: {
         Softmax *softmax = (Softmax *)op;
         sez.serialize(softmax->dim);
@@ -2072,6 +2086,36 @@ void FFModel::deserialize_graph_optimal_view(
             {inputs[0], inputs[1], inputs[2]}, params);
         break;
       }
+      case OP_INC_MULTIHEAD_SELF_ATTENTION: {
+        assert(num_inputs == 1);
+        int embed_dim, num_heads, k_dim, v_dim;
+        float dropout;
+        bool bias, add_bias_kv, add_zero_attn;
+        size_t id;
+        dez.deserialize(id);
+        LayerID layer_guid(id);
+        dez.deserialize(embed_dim);
+        dez.deserialize(num_heads);
+        dez.deserialize(k_dim);
+        dez.deserialize(v_dim);
+        dez.deserialize(dropout);
+        dez.deserialize(bias);
+        dez.deserialize(add_bias_kv);
+        dez.deserialize(add_zero_attn);
+
+        IncMultiHeadSelfAttentionParams params;
+        params.embed_dim = embed_dim;
+        params.num_heads = num_heads;
+        params.kdim = k_dim;
+        params.vdim = v_dim;
+        params.dropout = dropout;
+        params.bias = bias;
+        params.add_bias_kv = add_bias_kv;
+        params.add_zero_attn = add_zero_attn;
+        params.layer_guid = layer_guid;
+        node = get_or_create_node<IncMultiHeadSelfAttention>(inputs[0], params);
+        break;
+      }
       case OP_TOPK: {
         node = TopK::deserialize(*this, dez, inputs, num_inputs);
         break;
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index a5b846dbdb..5c8be135a4 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -125,7 +125,7 @@ FutureMap InferenceManager::inference(int index, BatchConfig const &bc) {
   FutureMap fm;
   for (size_t o = 0; o < model->operators.size(); o++) {
     Op *op = model->operators[o];
-    if (op->op_type == OP_WEIGHT) {
+    if (op->op_type == OP_WEIGHT || op->op_type == OP_INPUT) {
       continue;
     }
 
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index ee274dc427..6ecac694ee 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -4286,6 +4286,13 @@ void register_flexflow_internal_tasks() {
     Runtime::preregister_task_variant<Softmax::backward_task>(
         registrar, "softmax_bwd_task");
   }
+  {
+    TaskVariantRegistrar registrar(SOFTMAX_INF_TASK_ID, "softmax_inf_task");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<InferenceResult, Softmax::inference_task>(
+        registrar, "softmax_inf_task");
+  }
   // compute Loss
   {
     TaskVariantRegistrar registrar(LOSS_BWD_TASK_ID, "Loss Backward");
diff --git a/src/runtime/operator_params.cc b/src/runtime/operator_params.cc
index 41dd37dec7..69f28ca680 100644
--- a/src/runtime/operator_params.cc
+++ b/src/runtime/operator_params.cc
@@ -15,6 +15,7 @@
 #include "flexflow/ops/flat.h"
 #include "flexflow/ops/gather.h"
 #include "flexflow/ops/groupby.h"
+#include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ops/layer_norm.h"
 #include "flexflow/ops/linear.h"
 #include "flexflow/ops/mean.h"
@@ -78,6 +79,8 @@ tl::optional<OperatorParameters> get_op_parameters(Op const *op) {
       return ((Gather *)op)->get_params();
     case OP_MULTIHEAD_ATTENTION:
       return ((MultiHeadAttention *)op)->get_params();
+    case OP_INC_MULTIHEAD_SELF_ATTENTION:
+      return ((IncMultiHeadSelfAttention *)op)->get_params();
     case OP_LAYERNORM:
       return ((LayerNorm *)op)->get_params();
     case OP_REDUCE_SUM:
diff --git a/src/runtime/substitution.cc b/src/runtime/substitution.cc
index 7751bd48de..508697d941 100644
--- a/src/runtime/substitution.cc
+++ b/src/runtime/substitution.cc
@@ -28,6 +28,7 @@
 #include "flexflow/ops/embedding.h"
 #include "flexflow/ops/experts.h"
 #include "flexflow/ops/flat.h"
+#include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ops/linear.h"
 #include "flexflow/ops/noop.h"
 #include "flexflow/ops/pool_2d.h"
@@ -3222,6 +3223,13 @@ bool FFModel::convert_graph_to_operators(
         break;
         break;
       }
+      case OP_INC_MULTIHEAD_SELF_ATTENTION: {
+        assert(inList.size() == 1);
+        IncMultiHeadSelfAttention *attn = (IncMultiHeadSelfAttention *)node.ptr;
+        new_op = new IncMultiHeadSelfAttention(*this, *attn, inputs[0], true);
+        break;
+        break;
+      }
       case OP_SOFTMAX: {
         assert(inList.size() == 1);
         Softmax *softmax = (Softmax *)node.ptr;

From 579bb0a78b79344d3e138f78489d75e244036118 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 28 Feb 2023 21:20:00 -0500
Subject: [PATCH 067/344] formatting

---
 .../ops/inc_multihead_self_attention.h        |  78 ++++-----
 src/ops/inc_multihead_self_attention.cc       | 154 +++++++++---------
 src/ops/inc_multihead_self_attention.cu       |  31 ++--
 3 files changed, 135 insertions(+), 128 deletions(-)

diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index 0b1572f2ca..07be210cd3 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -1,7 +1,6 @@
 #ifndef _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_H
 #define _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_H
 
-
 #include "flexflow/device.h"
 #include "flexflow/fftype.h"
 #include "flexflow/layer.h"
@@ -20,40 +19,40 @@ class IncMultiHeadSelfAttention : public Op {
   using Input = ParallelTensor;
 
   IncMultiHeadSelfAttention(FFModel &model,
-                     LayerID const &layer_guid,
-                     const ParallelTensor _input,
-                     int _embed_dim,
-                     int _num_heads,
-                     int _kdim,
-                     int _vdim,
-                     float _dropout,
-                     bool _bias,
-                     bool _add_bias_kv,
-                     bool _add_zero_attn,
-                     bool allocate_weights,
-                     char const *name);
+                            LayerID const &layer_guid,
+                            const ParallelTensor _input,
+                            int _embed_dim,
+                            int _num_heads,
+                            int _kdim,
+                            int _vdim,
+                            float _dropout,
+                            bool _bias,
+                            bool _add_bias_kv,
+                            bool _add_zero_attn,
+                            bool allocate_weights,
+                            char const *name);
   IncMultiHeadSelfAttention(FFModel &model,
-                     const ParallelTensor _input,
-                     const ParallelTensor _weight,
-                     int _embed_dim,
-                     int _num_heads,
-                     int _kdim,
-                     int _vdim,
-                     float _dropout,
-                     bool _bias,
-                     bool _add_bias_kv,
-                     bool _add_zero_attn,
-                     bool allocate_weights,
-                     char const *name);
+                            const ParallelTensor _input,
+                            const ParallelTensor _weight,
+                            int _embed_dim,
+                            int _num_heads,
+                            int _kdim,
+                            int _vdim,
+                            float _dropout,
+                            bool _bias,
+                            bool _add_bias_kv,
+                            bool _add_zero_attn,
+                            bool allocate_weights,
+                            char const *name);
   IncMultiHeadSelfAttention(FFModel &model,
-                     IncMultiHeadSelfAttention const &other,
-                     const ParallelTensor input,
-                     bool allocate_weights);
+                            IncMultiHeadSelfAttention const &other,
+                            const ParallelTensor input,
+                            bool allocate_weights);
   IncMultiHeadSelfAttention(FFModel &model,
-                     Params const &params,
-                     Input const &inputs,
-                     bool allocate_weights = false,
-                     char const *name = nullptr);
+                            Params const &params,
+                            Input const &inputs,
+                            bool allocate_weights = false,
+                            char const *name = nullptr);
   static Op *
       create_operator_from_layer(FFModel &model,
                                  Layer const *layer,
@@ -91,10 +90,11 @@ class IncMultiHeadSelfAttention : public Op {
                                float *output_ptr,
                                ffStream_t stream);
   static void inference_kernel_wrapper(IncMultiHeadSelfAttentionMeta const *m,
-                                     float const *input_ptr,
-                                     float const *weight_ptr,
-                                     float *output_ptr);
+                                       float const *input_ptr,
+                                       float const *weight_ptr,
+                                       float *output_ptr);
   Params get_params() const;
+
 public:
   int num_heads;
   float dropout;
@@ -107,10 +107,10 @@ class IncMultiHeadSelfAttention : public Op {
 class IncMultiHeadSelfAttentionMeta : public OpMeta {
 public:
   IncMultiHeadSelfAttentionMeta(FFHandler handler,
-                         IncMultiHeadSelfAttention const *attn,
-                         Legion::Memory gpu_mem,
-                         int num_samples,
-                         int num_heads);
+                                IncMultiHeadSelfAttention const *attn,
+                                Legion::Memory gpu_mem,
+                                int num_samples,
+                                int num_heads);
   ~IncMultiHeadSelfAttentionMeta(void);
 
 public:
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index 329254fb74..2a45efe735 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -37,7 +37,8 @@ using Legion::Task;
 using Legion::TaskArgument;
 using Legion::TaskLauncher;
 
-bool IncMultiHeadSelfAttentionParams::is_valid(ParallelTensorShape const &input) const {
+bool IncMultiHeadSelfAttentionParams::is_valid(
+    ParallelTensorShape const &input) const {
   bool is_valid = input.is_valid();
   return is_valid;
 }
@@ -53,7 +54,7 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
                                              bool add_zero_attn,
                                              Initializer *kernel_initializer,
                                              char const *name) {
-  // Currently assume that 
+  // Currently assume that
   Layer *li = new Layer(this,
                         OP_INC_MULTIHEAD_SELF_ATTENTION,
                         DT_FLOAT,
@@ -139,19 +140,20 @@ Op *IncMultiHeadSelfAttention::create_operator_from_layer(
                                        layer->name);
 }
 
-IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(FFModel &model,
-                                                     LayerID const &_layer_guid,
-                                                     const ParallelTensor _input,
-                                                     int _embed_dim,
-                                                     int _num_heads,
-                                                     int _kdim,
-                                                     int _vdim,
-                                                     float _dropout,
-                                                     bool _bias,
-                                                     bool _add_bias_kv,
-                                                     bool _add_zero_attn,
-                                                     bool allocate_weights,
-                                                     char const *name)
+IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
+    FFModel &model,
+    LayerID const &_layer_guid,
+    const ParallelTensor _input,
+    int _embed_dim,
+    int _num_heads,
+    int _kdim,
+    int _vdim,
+    float _dropout,
+    bool _bias,
+    bool _add_bias_kv,
+    bool _add_zero_attn,
+    bool allocate_weights,
+    char const *name)
     // Initializer* _bias_initializer)
     : Op(model,
          OP_MULTIHEAD_ATTENTION,
@@ -166,8 +168,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(FFModel &model,
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
       vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
       vProjSize(_vdim), oProjSize(_embed_dim),
-      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size)
-{
+      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size) {
   // overwrite layer_guid
   layer_guid = _layer_guid;
 
@@ -221,19 +222,20 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(FFModel &model,
   /* assert(check_output_input_weight_parallel_dims()); */
 }
 
-IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(FFModel &model,
-                                                     const ParallelTensor _input,
-                                                     const ParallelTensor _weight,
-                                                     int _embed_dim,
-                                                     int _num_heads,
-                                                     int _kdim,
-                                                     int _vdim,
-                                                     float _dropout,
-                                                     bool _bias,
-                                                     bool _add_bias_kv,
-                                                     bool _add_zero_attn,
-                                                     bool allocate_weights,
-                                                     char const *name)
+IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
+    FFModel &model,
+    const ParallelTensor _input,
+    const ParallelTensor _weight,
+    int _embed_dim,
+    int _num_heads,
+    int _kdim,
+    int _vdim,
+    float _dropout,
+    bool _bias,
+    bool _add_bias_kv,
+    bool _add_zero_attn,
+    bool allocate_weights,
+    char const *name)
     // Initializer* _bias_initializer)
     : Op(model,
          OP_INC_MULTIHEAD_SELF_ATTENTION,
@@ -302,23 +304,24 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(FFModel &model,
   /* assert(check_output_input_weight_parallel_dims()); */
 }
 
-IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(FFModel &model,
-                                       IncMultiHeadSelfAttention const &other,
-                                       const ParallelTensor input,
-                                       bool allocate_weights)
+IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
+    FFModel &model,
+    IncMultiHeadSelfAttention const &other,
+    const ParallelTensor input,
+    bool allocate_weights)
     : IncMultiHeadSelfAttention(model,
-                         other.layer_guid,
-                         input,
-                         other.oProjSize,
-                         other.num_heads,
-                         other.qProjSize,
-                         other.vProjSize,
-                         other.dropout,
-                         other.bias,
-                         other.add_bias_kv,
-                         other.add_zero_attn,
-                         allocate_weights,
-                         other.name) {}
+                                other.layer_guid,
+                                input,
+                                other.oProjSize,
+                                other.num_heads,
+                                other.qProjSize,
+                                other.vProjSize,
+                                other.dropout,
+                                other.bias,
+                                other.add_bias_kv,
+                                other.add_zero_attn,
+                                allocate_weights,
+                                other.name) {}
 
 IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     FFModel &model,
@@ -327,18 +330,18 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     bool allocate_weights,
     char const *name)
     : IncMultiHeadSelfAttention(model,
-                         params.layer_guid,
-                         input,
-                         params.embed_dim,
-                         params.num_heads,
-                         params.kdim,
-                         params.vdim,
-                         params.dropout,
-                         params.bias,
-                         params.add_bias_kv,
-                         params.add_zero_attn,
-                         allocate_weights,
-                         name) {}
+                                params.layer_guid,
+                                input,
+                                params.embed_dim,
+                                params.num_heads,
+                                params.kdim,
+                                params.vdim,
+                                params.dropout,
+                                params.bias,
+                                params.add_bias_kv,
+                                params.add_zero_attn,
+                                allocate_weights,
+                                name) {}
 
 void IncMultiHeadSelfAttention::init_inference(
     FFModel const &ff,
@@ -427,12 +430,13 @@ void IncMultiHeadSelfAttention::init(FFModel const &ff) {
   regions[1](I): weight
   regions[2](O): output
 */
-OpMeta *
-    IncMultiHeadSelfAttention::init_task(Task const *task,
-                                  std::vector<PhysicalRegion> const &regions,
-                                  Context ctx,
-                                  Runtime *runtime) {
-  IncMultiHeadSelfAttention const *attn = (IncMultiHeadSelfAttention *)task->args;
+OpMeta *IncMultiHeadSelfAttention::init_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  IncMultiHeadSelfAttention const *attn =
+      (IncMultiHeadSelfAttention *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
       DT_FLOAT, regions[0], task->regions[0], FID_DATA, ctx, runtime);
@@ -451,8 +455,8 @@ OpMeta *
                        .only_kind(Memory::GPU_FB_MEM)
                        .best_affinity_to(task->target_proc)
                        .first();
-  IncMultiHeadSelfAttentionMeta *m =
-      new IncMultiHeadSelfAttentionMeta(handle, attn, gpu_mem, num_samples, num_heads);
+  IncMultiHeadSelfAttentionMeta *m = new IncMultiHeadSelfAttentionMeta(
+      handle, attn, gpu_mem, num_samples, num_heads);
   m->profiling = attn->profiling;
   assert(weight.domain.get_volume() * sizeof(float) == m->weightSize);
   return m;
@@ -475,7 +479,8 @@ void IncMultiHeadSelfAttention::inference(
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
   set_argumentmap_for_inference(ff, argmap, view);
   size_t machine_view_hash = view->hash();
-  /* std::cout << "IncMultiHeadSelfAttention op machine_view: " << *(MachineView const
+  /* std::cout << "IncMultiHeadSelfAttention op machine_view: " << *(MachineView
+     const
      *)mv
             << std::endl; */
   int idx = 0;
@@ -520,7 +525,8 @@ void IncMultiHeadSelfAttention::inference_task(
     Runtime *runtime) {
   assert(regions.size() == 3);
   assert(task->regions.size() == regions.size());
-  // const IncMultiHeadSelfAttention* attn = (IncMultiHeadSelfAttention*) task->args;
+  // const IncMultiHeadSelfAttention* attn = (IncMultiHeadSelfAttention*)
+  // task->args;
   IncMultiHeadSelfAttentionMeta const *m =
       *((IncMultiHeadSelfAttentionMeta **)task->local_args);
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
@@ -530,10 +536,8 @@ void IncMultiHeadSelfAttention::inference_task(
   GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
       m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
 
-  IncMultiHeadSelfAttention::inference_kernel_wrapper(m,
-                                             input.get_float_ptr(),
-                                             weight.get_float_ptr(),
-                                             output.get_float_ptr());
+  IncMultiHeadSelfAttention::inference_kernel_wrapper(
+      m, input.get_float_ptr(), weight.get_float_ptr(), output.get_float_ptr());
 }
 
 void IncMultiHeadSelfAttention::backward(FFModel const &ff) {
@@ -541,7 +545,8 @@ void IncMultiHeadSelfAttention::backward(FFModel const &ff) {
   assert(false);
 }
 
-bool IncMultiHeadSelfAttention::get_int_parameter(PMParameter para, int *value) const {
+bool IncMultiHeadSelfAttention::get_int_parameter(PMParameter para,
+                                                  int *value) const {
   switch (para) {
     case PM_NUM_HEADS:
       *value = num_heads;
@@ -596,8 +601,7 @@ bool IncMultiHeadSelfAttention::measure_operator_cost(
 
   std::function<void()> forward, backward;
   forward = [&] {
-    inference_kernel_wrapper(
-        m, input_ptr, weight_ptr, output_ptr);
+    inference_kernel_wrapper(m, input_ptr, weight_ptr, output_ptr);
   };
   if (sim->computationMode == COMP_MODE_TRAINING) {
     // IncMultiHeadSelfAttention does not support training
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index b903a6f073..e7439fa7d2 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -23,11 +23,12 @@ using Legion::coord_t;
 using Legion::Memory;
 
 /*static*/
-void IncMultiHeadSelfAttention::inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
-                                        float const *input_ptr,
-                                        float const *weight_ptr,
-                                        float *output_ptr,
-                                        cudaStream_t stream) {
+void IncMultiHeadSelfAttention::inference_kernel(
+    IncMultiHeadSelfAttentionMeta const *m,
+    float const *input_ptr,
+    float const *weight_ptr,
+    float *output_ptr,
+    cudaStream_t stream) {
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
 
   checkCUDNN(cudnnMultiHeadAttnForward(m->handle.dnn,
@@ -55,10 +56,11 @@ void IncMultiHeadSelfAttention::inference_kernel(IncMultiHeadSelfAttentionMeta c
 }
 
 /*static*/
-void IncMultiHeadSelfAttention::inference_kernel_wrapper(IncMultiHeadSelfAttentionMeta const *m,
-                                                float const *input_ptr,
-                                                float const *weight_ptr,
-                                                float *output_ptr) {
+void IncMultiHeadSelfAttention::inference_kernel_wrapper(
+    IncMultiHeadSelfAttentionMeta const *m,
+    float const *input_ptr,
+    float const *weight_ptr,
+    float *output_ptr) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -84,11 +86,12 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(IncMultiHeadSelfAttenti
   }
 }
 
-IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(FFHandler handler,
-                                               IncMultiHeadSelfAttention const *attn,
-                                               Memory gpu_mem,
-                                               int num_samples,
-                                               int num_heads)
+IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
+    FFHandler handler,
+    IncMultiHeadSelfAttention const *attn,
+    Memory gpu_mem,
+    int num_samples,
+    int num_heads)
     : OpMeta(handler) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));

From a412cdf334cae5ed320e154bec91c852898aa5a1 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Thu, 2 Mar 2023 00:58:25 +0000
Subject: [PATCH 068/344] add missing file

---
 src/runtime/batch_config.cc | 132 ++++++++++++++++++++++++++++++++++++
 1 file changed, 132 insertions(+)
 create mode 100644 src/runtime/batch_config.cc

diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
new file mode 100644
index 0000000000..c196c09a23
--- /dev/null
+++ b/src/runtime/batch_config.cc
@@ -0,0 +1,132 @@
+/* Copyright 2023 CMU, Stanford, Facebook, LANL
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/batch_config.h"
+#include <cassert>
+#include "legion.h"
+
+namespace FlexFlow {
+
+LegionRuntime::Logger::Category log_bc("BatchConfig");
+
+BatchConfig::BatchConfig() {
+  cached_results = false;
+  for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
+    token_start_idx[i] = 0;
+    token_last_available_idx[i] = -1;
+    request_completed[i] = true;
+    num_processing_tokens[i] = 0;
+  }
+}
+
+int BatchConfig::update_results(InferenceResult const &ir) {
+  cached_results = false;
+  int t = 0;
+  int completed = 0;
+  for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
+    if (request_completed[i])
+      continue;
+    if (num_processing_tokens[i] == 0)
+      continue;
+    t += num_processing_tokens[i];
+    token_start_idx[i] += num_processing_tokens[i];
+    if (ir.results[t] == 0) { // TODO: replace this with <EOS>
+      log_bc.print("[Done] guid(%zu) final_length(%d)", request_guid[i], token_start_idx[i]);
+      request_completed[i] = true;
+      token_start_idx[i] = 0;
+      token_last_available_idx[i] = -1;
+      num_processing_tokens[i] = 0;
+      completed ++;
+    } else if (token_start_idx[i] >= MAX_SEQUENCE_LENGTH) {
+      //Reach maximum request length
+      log_bc.print("[Done] guid(%zu) final_length(%d)", request_guid[i], token_start_idx[i]);
+      request_completed[i] = true;
+      token_start_idx[i] = 0;
+      token_last_available_idx[i] = -1;
+      num_processing_tokens[i] = 0;
+      completed ++;
+    } else {
+      if (token_start_idx[i] == token_last_available_idx[i] + 1)
+        token_last_available_idx[i] ++;
+      assert(token_start_idx[i] <= token_last_available_idx[i]);
+    }
+    num_processing_tokens[i] = 0;
+  }
+  return completed;
+}
+
+bool BatchConfig::register_new_request(size_t guid, int length) {
+  cached_results = false;
+  for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
+    if (request_completed[i]) {
+      log_bc.print("[NewRequest] guid(%zu) length(%d)", guid, length);
+      token_start_idx[i] = 0;
+      token_last_available_idx[i] = length - 1;
+      request_guid[i] = guid;
+      num_processing_tokens[i] = 0;
+      request_completed[i] = false;
+      return true;
+    }
+  }
+  return false;
+}
+
+void BatchConfig::prepare_next_batch() {
+  cached_results = false;
+  int num_tokens = 0;
+  for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
+    if (request_completed[i])
+      continue;
+    if (num_tokens + token_last_available_idx[i] - token_start_idx[i] + 1 <= MAX_NUM_TOKENS) {
+      num_processing_tokens[i] = token_last_available_idx[i] - token_start_idx[i] + 1;
+    } else {
+      num_processing_tokens[i] = MAX_NUM_TOKENS - num_tokens;
+    }
+    num_tokens += num_processing_tokens[i];
+  }
+  log_bc.print("[NextBatch] num_tokens(%d)", num_tokens);
+}
+
+int BatchConfig::num_active_requests() {
+  if (cached_results)
+    return num_requests;
+  num_requests = 0;
+  num_tokens = 0;
+  for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
+    if (!request_completed[i]) {
+      num_requests ++;
+      num_tokens += num_processing_tokens[i];
+    }
+  }
+  cached_results = true;
+  return num_requests;
+}
+
+int BatchConfig::num_active_tokens() {
+  if (cached_results)
+    return num_tokens;
+  num_requests = 0;
+  num_tokens = 0;
+  for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
+    if (!request_completed[i]) {
+      num_requests ++;
+      num_tokens += num_processing_tokens[i];
+    }
+  }
+  cached_results = true;
+  return num_tokens;
+}
+
+}; // namespace FlexFlow

From 6eb64e67a4a55f11140c4f31af583a7bca3f6dbe Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Thu, 2 Mar 2023 01:16:03 -0600
Subject: [PATCH 069/344] [Inference] implementing incremental inference for
 Transformers (#641)

* [IncMultiHeadSelfAttention] initial implementation

* interface update

* checkpoint

* format

* bug fixes

* added cmake for transformers

---------

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
---
 .github/workflows/build.yml                   |   6 +-
 .github/workflows/gpu-ci.yml                  |   1 +
 config/config.linux                           |   2 +-
 .../cpp/inference/transformers/CMakeLists.txt |  22 ++
 src/ops/inc_multihead_self_attention.cpp      | 252 ++++++++++++++++++
 src/runtime/batch_config.cc                   |  46 ++--
 6 files changed, 309 insertions(+), 20 deletions(-)
 create mode 100644 examples/cpp/inference/transformers/CMakeLists.txt
 create mode 100644 src/ops/inc_multihead_self_attention.cpp

diff --git a/.github/workflows/build.yml b/.github/workflows/build.yml
index 66d59cb95d..2cf1315ea3 100644
--- a/.github/workflows/build.yml
+++ b/.github/workflows/build.yml
@@ -76,7 +76,8 @@ jobs:
           mkdir build
           cd build
           if [[ "${FF_GPU_BACKEND}" == "cuda" ]]; then
-            export FF_BUILD_ALL_EXAMPLES=ON 
+            export FF_BUILD_ALL_EXAMPLES=ON
+            export FF_BUILD_ALL_INFERENCE_EXAMPLES=ON
             export FF_BUILD_UNIT_TESTS=ON
           fi
           ../config/config.linux
@@ -91,7 +92,8 @@ jobs:
           export FF_CUDA_ARCH=70
           cd build
           if [[ "${FF_GPU_BACKEND}" == "cuda" ]]; then
-            export FF_BUILD_ALL_EXAMPLES=ON 
+            export FF_BUILD_ALL_EXAMPLES=ON
+            export FF_BUILD_ALL_INFERENCE_EXAMPLES=ON
             export FF_BUILD_UNIT_TESTS=ON
           fi
           ../config/config.linux
diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index 2a46e7d498..35397839a6 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -110,6 +110,7 @@ jobs:
           export PATH=/opt/conda/bin:$PATH
           export FF_HOME=$(pwd)
           export FF_BUILD_ALL_EXAMPLES=ON
+          export FF_BUILD_ALL_INFERENCE_EXAMPLES=ON
           export FF_USE_PREBUILT_LEGION=OFF #remove this after fixing python path issue in Legion
           pip install . --verbose
 
diff --git a/config/config.linux b/config/config.linux
index 940757f9e8..86e8f8b647 100755
--- a/config/config.linux
+++ b/config/config.linux
@@ -39,7 +39,7 @@ FF_GASNET_CONDUIT=${FF_GASNET_CONDUIT:-ibv}
 
 # build C++ examples
 FF_BUILD_ALL_EXAMPLES=${FF_BUILD_ALL_EXAMPLES:-OFF}
-FF_BUILD_ALL_INFERENCE_EXAMPLES=${FF_BUILD_ALL_INFERENCE_EXAMPLES:-ON}
+FF_BUILD_ALL_INFERENCE_EXAMPLES=${FF_BUILD_ALL_INFERENCE_EXAMPLES:-OFF}
 
 # build C++ unit tests
 FF_BUILD_UNIT_TESTS=${FF_BUILD_UNIT_TESTS:-OFF}
diff --git a/examples/cpp/inference/transformers/CMakeLists.txt b/examples/cpp/inference/transformers/CMakeLists.txt
new file mode 100644
index 0000000000..d52beae3ad
--- /dev/null
+++ b/examples/cpp/inference/transformers/CMakeLists.txt
@@ -0,0 +1,22 @@
+cmake_minimum_required(VERSION 3.10)
+
+project(FlexFlowExample_Transformers)
+set(project_target inference_transformers)
+
+set(CPU_SRC
+  ${FLEXFLOW_CPP_DRV_SRC}
+  transformers.cc
+  dataloader.cc
+  ../data_generator.cc)
+
+set(GPU_SRC
+  dataloader.cu)
+
+cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
+target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
+target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/examples/cpp/inference)
+target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
+
+set(BIN_DEST "bin")
+install(TARGETS ${project_target} DESTINATION ${BIN_DEST})
+
diff --git a/src/ops/inc_multihead_self_attention.cpp b/src/ops/inc_multihead_self_attention.cpp
new file mode 100644
index 0000000000..0903d7fa5d
--- /dev/null
+++ b/src/ops/inc_multihead_self_attention.cpp
@@ -0,0 +1,252 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/inc_multihead_self_attention.h"
+#include "flexflow/utils/hip_helper.h"
+#include <hip/hip_runtime.h>
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::coord_t;
+using Legion::Memory;
+
+/*static*/
+void IncMultiHeadSelfAttention::inference_kernel(
+    IncMultiHeadSelfAttentionMeta const *m,
+    float const *input_ptr,
+    float const *weight_ptr,
+    float *output_ptr,
+    hipStream_t stream) {
+  checkCUDNN(miopenSetStream(m->handle.dnn, stream));
+  handle_unimplemented_hip_kernel(OP_INC_MULTIHEAD_SELF_ATTENTION);
+}
+
+/*static*/
+void IncMultiHeadSelfAttention::inference_kernel_wrapper(
+    IncMultiHeadSelfAttentionMeta const *m,
+    float const *input_ptr,
+    float const *weight_ptr,
+    float *output_ptr) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    hipEventCreate(&t_start);
+    hipEventCreate(&t_end);
+    hipEventRecord(t_start, stream);
+  }
+  IncMultiHeadSelfAttention::inference_kernel(
+      m, input_ptr, weight_ptr, output_ptr, stream);
+  if (m->profiling) {
+    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    hipEventDestroy(t_start);
+    hipEventDestroy(t_end);
+    printf("IncMultiHeadSelfAttention forward time = %.2fms\n", elapsed);
+    // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
+    // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
+    // acc_output.rect, "[Attention:forward:output]");
+  }
+}
+
+IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
+    FFHandler handler,
+    IncMultiHeadSelfAttention const *attn,
+    Memory gpu_mem,
+    int num_samples,
+    int num_heads)
+    : OpMeta(handler, attn) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  checkCUDNN(miopenSetStream(handler.dnn, stream));
+#if 0
+  checkCUDNN(cudnnCreateAttnDescriptor(&attnDesc));
+  checkCUDNN(cudnnCreateSeqDataDescriptor(&qDesc));
+  checkCUDNN(cudnnCreateSeqDataDescriptor(&kDesc));
+  checkCUDNN(cudnnCreateSeqDataDescriptor(&vDesc));
+  checkCUDNN(cudnnCreateSeqDataDescriptor(&oDesc));
+  // Currently do not support adding bias to key/value projection
+  assert(!attn->add_bias_kv);
+  cudnnAttnQueryMap_t attnMode = CUDNN_ATTN_QUERYMAP_ALL_TO_ONE;
+  // Assume no beam search for now
+  int maxBeamSize = 1;
+  // printf("batchSize(%d) qSize(%d) kSize(%d) vSize(%d) qProjSize(%d)
+  // kProjSize(%d)\n",
+  //     num_samples, attn->qSize, attn->kSize, attn->vSize, attn->qProjSize,
+  //     attn->kProjSize);
+  // printf("vProjSize(%d) oProjSize(%d) qoSeqLength(%d) kvSeqLength(%d)\n",
+  //     attn->vProjSize, attn->oProjSize, attn->qoSeqLength,
+  //     attn->kvSeqLength);
+  cudnnMathType_t math_type;
+  if (handle.allowTensorOpMathConversion) {
+    math_type = CUDNN_TENSOR_OP_MATH_ALLOW_CONVERSION;
+  } else {
+    math_type = CUDNN_TENSOR_OP_MATH;
+  }
+  checkCUDNN(cudnnSetAttnDescriptor(attnDesc,
+                                    attnMode,
+                                    num_heads,
+                                    1.0f /*smScalar*/,
+                                    CUDNN_DATA_FLOAT,
+                                    CUDNN_DATA_FLOAT,
+                                    math_type,
+                                    NULL /*attnDropoutDesc*/,
+                                    NULL /*postDropoutDesc*/,
+                                    attn->qSize,
+                                    attn->kSize,
+                                    attn->vSize,
+                                    attn->qProjSize,
+                                    attn->kProjSize,
+                                    attn->vProjSize,
+                                    attn->oProjSize,
+                                    attn->qoSeqLength,
+                                    attn->kvSeqLength,
+                                    num_samples,
+                                    maxBeamSize));
+  size_t workSpaceSize;
+  checkCUDNN(cudnnGetMultiHeadAttnBuffers(
+      handler.dnn, attnDesc, &weightSize, &workSpaceSize, &reserveSpaceSize));
+  assert(workSpaceSize <= handler.workSpaceSize);
+  // printf("weightSize(%zu) workSpaceSize(%zu) reserveSpaceSize(%zu)\n",
+  // weightSize, workSpaceSize, reserveSpaceSize);
+  int dimA[CUDNN_SEQDATA_DIM_COUNT];
+  cudnnSeqDataAxis_t axes[CUDNN_SEQDATA_DIM_COUNT];
+  assert(CUDNN_SEQDATA_DIM_COUNT == 4);
+  axes[3] = CUDNN_SEQDATA_VECT_DIM; // 3 = nbDims-1
+  axes[2] = CUDNN_SEQDATA_BEAM_DIM;
+  axes[1] = CUDNN_SEQDATA_TIME_DIM;
+  axes[0] = CUDNN_SEQDATA_BATCH_DIM;
+  int *qoSeqArray = (int *)malloc(sizeof(int) * num_samples);
+  int *kvSeqArray = (int *)malloc(sizeof(int) * num_samples);
+  for (int i = 0; i < num_samples; i++) {
+    qoSeqArray[i] = attn->qoSeqLength;
+    kvSeqArray[i] = attn->kvSeqLength;
+  }
+  // Set qDesc
+  {
+    dimA[CUDNN_SEQDATA_BEAM_DIM] = 1;
+    dimA[CUDNN_SEQDATA_BATCH_DIM] = num_samples;
+    dimA[CUDNN_SEQDATA_TIME_DIM] = attn->qoSeqLength;
+    dimA[CUDNN_SEQDATA_VECT_DIM] = attn->qSize;
+    checkCUDNN(cudnnSetSeqDataDescriptor(qDesc,
+                                         CUDNN_DATA_FLOAT,
+                                         CUDNN_SEQDATA_DIM_COUNT,
+                                         dimA,
+                                         axes,
+                                         num_samples,
+                                         qoSeqArray,
+                                         NULL));
+  }
+  // Set kDesc
+  {
+    dimA[CUDNN_SEQDATA_BEAM_DIM] = 1;
+    dimA[CUDNN_SEQDATA_BATCH_DIM] = num_samples;
+    dimA[CUDNN_SEQDATA_TIME_DIM] = attn->kvSeqLength;
+    dimA[CUDNN_SEQDATA_VECT_DIM] = attn->kSize;
+    checkCUDNN(cudnnSetSeqDataDescriptor(kDesc,
+                                         CUDNN_DATA_FLOAT,
+                                         CUDNN_SEQDATA_DIM_COUNT,
+                                         dimA,
+                                         axes,
+                                         num_samples,
+                                         kvSeqArray,
+                                         NULL));
+  }
+  // Set vDesc
+  {
+    dimA[CUDNN_SEQDATA_BEAM_DIM] = 1;
+    dimA[CUDNN_SEQDATA_BATCH_DIM] = num_samples;
+    dimA[CUDNN_SEQDATA_TIME_DIM] = attn->kvSeqLength;
+    dimA[CUDNN_SEQDATA_VECT_DIM] = attn->vSize;
+    checkCUDNN(cudnnSetSeqDataDescriptor(vDesc,
+                                         CUDNN_DATA_FLOAT,
+                                         CUDNN_SEQDATA_DIM_COUNT,
+                                         dimA,
+                                         axes,
+                                         num_samples,
+                                         kvSeqArray,
+                                         NULL));
+  }
+  // Set oDesc
+  {
+    dimA[CUDNN_SEQDATA_BEAM_DIM] = 1;
+    dimA[CUDNN_SEQDATA_BATCH_DIM] = num_samples;
+    dimA[CUDNN_SEQDATA_TIME_DIM] = attn->qoSeqLength;
+    dimA[CUDNN_SEQDATA_VECT_DIM] = attn->oProjSize;
+    checkCUDNN(cudnnSetSeqDataDescriptor(oDesc,
+                                         CUDNN_DATA_FLOAT,
+                                         CUDNN_SEQDATA_DIM_COUNT,
+                                         dimA,
+                                         axes,
+                                         num_samples,
+                                         qoSeqArray,
+                                         NULL));
+  }
+  // allocate memory for the seqArray and reserve space
+  {
+    size_t totalSize = reserveSpaceSize + sizeof(int) * num_samples * 2;
+    Realm::Rect<1, coord_t> bounds(Realm::Point<1, coord_t>(0),
+                                   Realm::Point<1, coord_t>(totalSize - 1));
+    std::vector<size_t> field_sizes;
+    field_sizes.push_back(sizeof(char));
+    Realm::RegionInstance::create_instance(reserveInst,
+                                           gpu_mem,
+                                           bounds,
+                                           field_sizes,
+                                           0,
+                                           Realm::ProfilingRequestSet())
+        .wait();
+    devQoSeqArray = (int *)reserveInst.pointer_untyped(0, sizeof(char));
+    checkCUDA(cudaMemcpy(devQoSeqArray,
+                         qoSeqArray,
+                         sizeof(int) * num_samples,
+                         cudaMemcpyHostToDevice));
+    devKvSeqArray = (int *)devQoSeqArray + num_samples;
+    checkCUDA(cudaMemcpy(devKvSeqArray,
+                         kvSeqArray,
+                         sizeof(int) * num_samples,
+                         cudaMemcpyHostToDevice));
+    reserveSpace = (int *)devKvSeqArray + num_samples;
+  }
+  // allocate memory for loWinIdx/hiWinIdx
+  loWinIdx = (int *)malloc(sizeof(int) * attn->qoSeqLength);
+  hiWinIdx = (int *)malloc(sizeof(int) * attn->qoSeqLength);
+  for (int i = 0; i < attn->qoSeqLength; i++) {
+    loWinIdx[i] = 0;
+    hiWinIdx[i] = attn->kvSeqLength;
+  }
+  free(qoSeqArray);
+  free(kvSeqArray);
+#endif
+}
+
+IncMultiHeadSelfAttentionMeta::~IncMultiHeadSelfAttentionMeta(void) {
+#if 0
+  reserveInst.destroy();
+  free(loWinIdx);
+  free(hiWinIdx);
+  checkCUDNN(cudnnDestroyAttnDescriptor(attnDesc));
+  checkCUDNN(cudnnDestroySeqDataDescriptor(qDesc));
+  checkCUDNN(cudnnDestroySeqDataDescriptor(kDesc));
+  checkCUDNN(cudnnDestroySeqDataDescriptor(vDesc));
+  checkCUDNN(cudnnDestroySeqDataDescriptor(oDesc));
+#endif
+}
+
+}; // namespace FlexFlow
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index c196c09a23..99c3a18b63 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -14,8 +14,8 @@
  */
 
 #include "flexflow/batch_config.h"
-#include <cassert>
 #include "legion.h"
+#include <cassert>
 
 namespace FlexFlow {
 
@@ -36,30 +36,37 @@ int BatchConfig::update_results(InferenceResult const &ir) {
   int t = 0;
   int completed = 0;
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
-    if (request_completed[i])
+    if (request_completed[i]) {
       continue;
-    if (num_processing_tokens[i] == 0)
+    }
+    if (num_processing_tokens[i] == 0) {
       continue;
+    }
     t += num_processing_tokens[i];
     token_start_idx[i] += num_processing_tokens[i];
     if (ir.results[t] == 0) { // TODO: replace this with <EOS>
-      log_bc.print("[Done] guid(%zu) final_length(%d)", request_guid[i], token_start_idx[i]);
+      log_bc.print("[Done] guid(%zu) final_length(%d)",
+                   request_guid[i],
+                   token_start_idx[i]);
       request_completed[i] = true;
       token_start_idx[i] = 0;
       token_last_available_idx[i] = -1;
       num_processing_tokens[i] = 0;
-      completed ++;
+      completed++;
     } else if (token_start_idx[i] >= MAX_SEQUENCE_LENGTH) {
-      //Reach maximum request length
-      log_bc.print("[Done] guid(%zu) final_length(%d)", request_guid[i], token_start_idx[i]);
+      // Reach maximum request length
+      log_bc.print("[Done] guid(%zu) final_length(%d)",
+                   request_guid[i],
+                   token_start_idx[i]);
       request_completed[i] = true;
       token_start_idx[i] = 0;
       token_last_available_idx[i] = -1;
       num_processing_tokens[i] = 0;
-      completed ++;
+      completed++;
     } else {
-      if (token_start_idx[i] == token_last_available_idx[i] + 1)
-        token_last_available_idx[i] ++;
+      if (token_start_idx[i] == token_last_available_idx[i] + 1) {
+        token_last_available_idx[i]++;
+      }
       assert(token_start_idx[i] <= token_last_available_idx[i]);
     }
     num_processing_tokens[i] = 0;
@@ -87,10 +94,13 @@ void BatchConfig::prepare_next_batch() {
   cached_results = false;
   int num_tokens = 0;
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
-    if (request_completed[i])
+    if (request_completed[i]) {
       continue;
-    if (num_tokens + token_last_available_idx[i] - token_start_idx[i] + 1 <= MAX_NUM_TOKENS) {
-      num_processing_tokens[i] = token_last_available_idx[i] - token_start_idx[i] + 1;
+    }
+    if (num_tokens + token_last_available_idx[i] - token_start_idx[i] + 1 <=
+        MAX_NUM_TOKENS) {
+      num_processing_tokens[i] =
+          token_last_available_idx[i] - token_start_idx[i] + 1;
     } else {
       num_processing_tokens[i] = MAX_NUM_TOKENS - num_tokens;
     }
@@ -100,13 +110,14 @@ void BatchConfig::prepare_next_batch() {
 }
 
 int BatchConfig::num_active_requests() {
-  if (cached_results)
+  if (cached_results) {
     return num_requests;
+  }
   num_requests = 0;
   num_tokens = 0;
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
     if (!request_completed[i]) {
-      num_requests ++;
+      num_requests++;
       num_tokens += num_processing_tokens[i];
     }
   }
@@ -115,13 +126,14 @@ int BatchConfig::num_active_requests() {
 }
 
 int BatchConfig::num_active_tokens() {
-  if (cached_results)
+  if (cached_results) {
     return num_tokens;
+  }
   num_requests = 0;
   num_tokens = 0;
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
     if (!request_completed[i]) {
-      num_requests ++;
+      num_requests++;
       num_tokens += num_processing_tokens[i];
     }
   }

From 252b34ee288317731512f440a60c63b91f8f8850 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 8 Mar 2023 14:09:55 -0500
Subject: [PATCH 070/344] [Inference] - Add GPT tokenizer (#645)

* add gpt tokenizer

* formatting

* bug fix

* add test

* linting

* fix typo

* renaming

* linting
---
 .github/workflows/gpu-ci.yml                 |   2 +
 examples/cpp/inference/gpt_tokenizer.cc      | 273 +++++++++++++++++++
 examples/cpp/inference/gpt_tokenizer.cpp     |  53 ++++
 examples/cpp/inference/gpt_tokenizer.h       | 210 ++++++++++++++
 examples/cpp/inference/gpt_tokenizer_test.sh |  63 +++++
 5 files changed, 601 insertions(+)
 create mode 100644 examples/cpp/inference/gpt_tokenizer.cc
 create mode 100644 examples/cpp/inference/gpt_tokenizer.cpp
 create mode 100644 examples/cpp/inference/gpt_tokenizer.h
 create mode 100755 examples/cpp/inference/gpt_tokenizer_test.sh

diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index 35397839a6..c660fb2b97 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -128,5 +128,7 @@ jobs:
           export FF_HOME=$(pwd)
           # C++ tests
           ./tests/cpp_gpu_tests.sh 4
+          # GPT tokenizer test
+          ./examples/cpp/inference/gpt_tokenizer_test.sh
           # Python tests
           ./tests/multi_gpu_tests.sh 4
diff --git a/examples/cpp/inference/gpt_tokenizer.cc b/examples/cpp/inference/gpt_tokenizer.cc
new file mode 100644
index 0000000000..c349bfacf3
--- /dev/null
+++ b/examples/cpp/inference/gpt_tokenizer.cc
@@ -0,0 +1,273 @@
+// version 0.1
+// Licensed under the MIT License <http://opensource.org/licenses/MIT>.
+// SPDX-License-Identifier: MIT
+// Copyright (c) 2019-2020 zili wang <wzlnot@gmail.com>.
+
+#include "gpt_tokenizer.h"
+
+using json = nlohmann::json;
+
+// codecvt abandoned in c++17
+std::wstring GPT_Tokenizer::utf8_to_wstring(std::string const &src) {
+  std::wstring_convert<std::codecvt_utf8<wchar_t>, wchar_t> converter;
+  return converter.from_bytes(src);
+};
+
+std::u32string GPT_Tokenizer::utf8_to_utf32(std::string const &src) {
+  std::wstring_convert<std::codecvt_utf8<char32_t>, char32_t> converter;
+  return converter.from_bytes(src);
+};
+
+std::string GPT_Tokenizer::wstring_to_utf8(std::wstring const &src) {
+  std::wstring_convert<std::codecvt_utf8<wchar_t>, wchar_t> converter;
+  return converter.to_bytes(src);
+};
+
+std::string GPT_Tokenizer::utf32_to_utf8(std::u32string const &src) {
+  std::wstring_convert<std::codecvt_utf8<char32_t>, char32_t> converter;
+  return converter.to_bytes(src);
+};
+
+wchar_t *GPT_Tokenizer::bytes_to_unicode() {
+  std::vector<uint64_t> bs;
+  for (auto i = uint64_t(L'!'); i < uint64_t(L'~') + 1; ++i) {
+    bs.push_back(i);
+  }
+  for (auto i = uint64_t(L'¡'); i < uint64_t(L'¬') + 1; ++i) {
+    bs.push_back(i);
+  }
+  for (auto i = uint64_t(L'®'); i < uint64_t(L'ÿ') + 1; ++i) {
+    bs.push_back(i);
+  }
+  std::vector<uint64_t> cs = bs;
+  uint64_t n = 0;
+  for (uint64_t b = 0; b < 256; ++b) {
+    auto p = find(bs.begin(), bs.end(), b);
+    if (p == bs.end()) {
+      bs.push_back(b);
+      cs.push_back(256 + n);
+      n++;
+    }
+  }
+  static wchar_t bytes_mapping[256] = {};
+  for (size_t i = 0; i < 256; i++) {
+    bytes_mapping[i] = i;
+  }
+  for (size_t i = 0; i < bs.size(); i++) {
+    bytes_mapping[bs[i]] = cs[i];
+  }
+  return bytes_mapping;
+}
+
+std::vector<std::string> GPT_Tokenizer::split(std::string const &s,
+                                              std::regex rgx) {
+  std::vector<std::string> elems;
+  std::sregex_token_iterator iter(s.begin(), s.end(), rgx, -1);
+  std::sregex_token_iterator end;
+  while (iter != end) {
+    elems.push_back(*iter);
+    ++iter;
+  }
+  return elems;
+};
+
+std::string GPT_Tokenizer::strip(std::string const &inpt) {
+  if (inpt.length() == 0) {
+    return inpt;
+  }
+  auto start_it = inpt.begin();
+  auto end_it = inpt.rbegin();
+  while (std::isspace(*start_it)) {
+    ++start_it;
+  }
+  if (start_it == inpt.end()) {
+    return "";
+  }
+  while (std::isspace(*end_it)) {
+    ++end_it;
+  }
+  return std::string(start_it, end_it.base());
+}
+
+std::unordered_set<wbigram_pair, hash_pair>
+    GPT_Tokenizer::get_pairs(std::vector<std::wstring> word) {
+  std::unordered_set<wbigram_pair, hash_pair> pairs;
+  std::wstring prev_char = word[0];
+  for (size_t i = 1; i < word.size(); ++i) {
+    pairs.insert(wbigram_pair({prev_char, word[i]}));
+    prev_char = word[i];
+  }
+  return pairs;
+};
+
+void GPT_Tokenizer::load_vocab(std::string const &vocab_file) {
+  std::ifstream file_handle(vocab_file);
+  assert(file_handle.good() && "file not exists");
+  bool discard_first_line = false;
+  if (discard_first_line) {
+    std::string first_line_discard;
+    std::getline(file_handle, first_line_discard); // skip the first line
+  }
+  json vocab_data_ = json::parse(file_handle,
+                                 /*parser_callback_t */ nullptr,
+                                 /*allow_exceptions */ true,
+                                 /*ignore_comments */ true);
+  auto vocab_ = vocab_data_.get<std::unordered_map<std::string, int64_t>>();
+  for (auto item : vocab_) {
+    vocab.insert({item.first, item.second});
+  }
+};
+
+void GPT_Tokenizer::load_merge(std::string const &merge_file) {
+  bpe_ranks.reserve(60000);
+  std::ifstream file_handle(merge_file);
+  assert(file_handle.good() && "file not exists");
+  std::string line;
+  uint32_t curr_idx = 0;
+  std::string version_substring = "#version:";
+  while (getline(file_handle, line)) {
+    if (line.size() == 0 || line.rfind(version_substring, 0) == 0) {
+      continue;
+    }
+    std::vector<std::string> bigrams = split(line);
+    assert(bigrams.size() == 2 && "unk format");
+    wbigram_pair curr(utf8_to_wstring(bigrams[0]), utf8_to_wstring(bigrams[1]));
+    bpe_ranks.insert({curr, curr_idx});
+    curr_idx++;
+  }
+};
+
+std::vector<std::string> GPT_Tokenizer::bpe(std::wstring token) {
+  // bpe use wstring
+  if (cache.find(token) != cache.end()) {
+    return cache[token];
+  }
+  std::vector<std::wstring> wword;
+  for (auto c : token) {
+    wword.push_back(std::wstring(1, c));
+  }
+  std::unordered_set<wbigram_pair, hash_pair> pairs = get_pairs(wword);
+  if (pairs.empty()) {
+    return {wstring_to_utf8(token)};
+  }
+
+  while (true) {
+    auto bigram = pairs.begin();
+    if (pairs.size() > 1) {
+      bigram = std::min_element(
+          pairs.begin(),
+          pairs.end(),
+          [this](wbigram_pair const &a, wbigram_pair const &b) -> bool {
+            if (bpe_ranks.find(a) == bpe_ranks.end()) {
+              return false;
+            }
+            if (bpe_ranks.find(b) == bpe_ranks.end()) {
+              return true;
+            }
+            return bpe_ranks[a] < bpe_ranks[b];
+          });
+    }
+    if (bpe_ranks.find(*bigram) == bpe_ranks.end()) {
+      break;
+    }
+    std::wstring first = bigram->first;
+    std::wstring second = bigram->second;
+    decltype(wword) new_wword;
+
+    auto i = wword.begin();
+    while (i < wword.end()) {
+      auto j = std::find(i, wword.end(), first);
+      if (j == wword.end()) {
+        new_wword.insert(new_wword.end(), i, wword.end());
+        break;
+      }
+      new_wword.insert(new_wword.end(), i, j);
+      i = j;
+      // i <= wword.end
+      if (*i == first && i < wword.end() - 1 && *(i + 1) == second) {
+        new_wword.push_back(first + second);
+        i += 2;
+      } else {
+        new_wword.push_back(*i);
+        i += 1;
+      }
+    }
+    wword = new_wword;
+    if (wword.size() == 1) {
+      break;
+    } else {
+      pairs = get_pairs(wword);
+    }
+  }
+  std::vector<std::string> word;
+  for (auto w : wword) {
+    word.push_back(wstring_to_utf8(w));
+  }
+  if (token.size() < cache_word_max_length && cache.size() < cache_max_size) {
+    cache.insert({token, word});
+  }
+  return word;
+};
+
+std::vector<std::string> GPT_Tokenizer::tokenize(std::string str) {
+  std::vector<std::string> bpe_tokens;
+  std::wstring wstr = utf8_to_wstring(str);
+  std::wsregex_iterator iter(wstr.begin(), wstr.end(), pat);
+  std::wsregex_iterator end;
+  while (iter != end) {
+    std::wstring token;
+    for (char c : wstring_to_utf8(iter->str())) {
+      if (0 > c) {
+        token.push_back(*(bytes_encoder + c + 256));
+      } else {
+        token.push_back(*(bytes_encoder + c));
+      }
+    }
+    if (token.length() > 0) {
+      decltype(bpe_tokens) curr_bpe_tokens = bpe(token);
+      bpe_tokens.insert(
+          bpe_tokens.end(), curr_bpe_tokens.begin(), curr_bpe_tokens.end());
+    }
+    ++iter;
+  }
+  return bpe_tokens;
+}
+
+int64_t GPT_Tokenizer::convert_token_to_id(std::string token) {
+  auto p = vocab.find(token);
+  if (p != vocab.end()) {
+    return vocab[token];
+  } else {
+    return vocab[unk_token];
+  }
+}
+
+void GPT_Tokenizer::encode(std::string str,
+                           size_t max_length,
+                           std::vector<int64_t> *input_ids,
+                           std::vector<int64_t> *mask_ids) {
+  if (not input_ids->empty()) {
+    input_ids->clear();
+  }
+  if (not mask_ids->empty()) {
+    mask_ids->clear();
+  }
+  input_ids->reserve(max_length);
+  mask_ids->reserve(max_length);
+  // input_ids->push_back(vocab[bos_token]);
+  // mask_ids->push_back(1);
+  auto tokens = tokenize(str);
+  for (auto t : tokens) {
+    if (input_ids->size() == max_length - 1) {
+      break;
+    }
+    input_ids->push_back(convert_token_to_id(t));
+    mask_ids->push_back(1);
+  }
+  // input_ids->push_back(vocab[eos_token]);
+  // mask_ids->push_back(1);
+  while (input_ids->size() < max_length) {
+    input_ids->push_back(vocab[pad_token]);
+    mask_ids->push_back(0);
+  }
+}
diff --git a/examples/cpp/inference/gpt_tokenizer.cpp b/examples/cpp/inference/gpt_tokenizer.cpp
new file mode 100644
index 0000000000..cd413e468f
--- /dev/null
+++ b/examples/cpp/inference/gpt_tokenizer.cpp
@@ -0,0 +1,53 @@
+#include "gpt_tokenizer.h"
+
+#include <string>
+
+int main(int argc, char *argv[]) {
+  std::string vocab_file = "./gpt2_bpe/vocab.bpe";
+  std::string merge_file = "./gpt2_bpe/encoder.json";
+
+  GPT_Tokenizer tokenizer(merge_file, vocab_file);
+
+  std::string line;
+  std::vector<std::string> lines;
+  std::ifstream infile("./wikitext-103-raw/wiki.valid.raw");
+  if (!infile) {
+    std::cout << "Error opening input file" << std::endl;
+    return -1;
+  }
+  std::ofstream outfile("./wikitext-103-raw/wiki.valid.bpe.flexflow",
+                        std::ofstream::out);
+  if (!outfile) {
+    std::cout << "Error opening output file" << std::endl;
+    return -1;
+  }
+  while (std::getline(infile, line)) {
+    lines.push_back(line);
+  }
+
+  std::vector<int64_t> input_ids;
+  std::vector<int64_t> mask_ids;
+  for (auto l = lines.begin(); l != lines.end(); ++l) {
+    std::string stripped_line = tokenizer.strip(*l);
+    if (stripped_line.length() == 0) {
+      outfile << *l << std::endl;
+    } else {
+      tokenizer.encode(
+          stripped_line, stripped_line.length(), &input_ids, &mask_ids);
+      bool first = true;
+      for (std::size_t i = 0; i < input_ids.size(); ++i) {
+        if (mask_ids[i]) {
+          if (!first) {
+            outfile << " ";
+          } else {
+            first = false;
+          }
+          outfile << input_ids[i];
+        }
+      }
+      outfile << std::endl;
+      input_ids.clear();
+      mask_ids.clear();
+    }
+  }
+}
diff --git a/examples/cpp/inference/gpt_tokenizer.h b/examples/cpp/inference/gpt_tokenizer.h
new file mode 100644
index 0000000000..9af722df38
--- /dev/null
+++ b/examples/cpp/inference/gpt_tokenizer.h
@@ -0,0 +1,210 @@
+// version 0.1
+// Licensed under the MIT License <http://opensource.org/licenses/MIT>.
+// SPDX-License-Identifier: MIT
+// Copyright (c) 2019-2020 zili wang <wzlnot@gmail.com>.
+
+#include <algorithm>
+#include <cctype>
+#include <codecvt>
+#include <fstream>
+#include <iostream>
+#include <nlohmann/json.hpp>
+#include <regex>
+#include <stdint.h>
+#include <string>
+#include <tuple>
+#include <unordered_map>
+#include <unordered_set>
+#include <utility>
+
+using json = nlohmann::json;
+
+typedef std::pair<std::string, std::string> bigram_pair;
+typedef std::pair<std::wstring, std::wstring> wbigram_pair;
+
+struct hash_pair {
+  template <class T1, class T2>
+  size_t operator()(std::pair<T1, T2> const &p) const {
+    auto hash1 = std::hash<T1>{}(p.first);
+    auto hash2 = std::hash<T2>{}(p.second);
+    return hash1 ^ hash2;
+  }
+};
+
+class GPT_Tokenizer {
+
+public:
+  GPT_Tokenizer(std::string const &vocab_file,
+                std::string const &merge_file,
+                std::string const &bos_token_str = "<s>",
+                const std::string eos_token_str = "</s>",
+                const std::string pad_token_str = "<pad>",
+                const std::string unk_token_str = "<unk>",
+                const std::string mask_token_str = "<mask>") {
+    load_vocab(vocab_file);
+    load_merge(merge_file);
+    bos_token = bos_token_str;
+    eos_token = eos_token_str;
+    pad_token = pad_token_str;
+    unk_token = unk_token_str;
+    mask_token = mask_token_str;
+    bytes_encoder = bytes_to_unicode();
+  };
+  // ~GPT_Tokenizer();
+  std::vector<std::string> bpe(std::wstring token);
+  std::vector<std::string> tokenize(std::string str);
+  int64_t convert_token_to_id(std::string token);
+  void encode(std::string str,
+              size_t max_length,
+              std::vector<int64_t> *input_ids,
+              std::vector<int64_t> *mask_ids);
+  std::string bos_token;
+  std::string eos_token;
+  std::string pad_token;
+  std::string unk_token;
+  std::string mask_token;
+  std::string strip(std::string const &inpt);
+
+private:
+  std::unordered_map<std::string, int64_t> vocab;
+  std::unordered_map<wbigram_pair, uint32_t, hash_pair> bpe_ranks;
+  wchar_t *bytes_to_unicode();
+  wchar_t *bytes_encoder;
+  uint32_t cache_max_size = 500000;
+  uint32_t cache_word_max_length = 30;
+  std::string unicode_letter_expr =
+      "\\u0041-\\u005A\\u0061-\\u007A\\u00AA-\\u00AA\\u00B5-\\u00B5"
+      "\\u00BA-\\u00BA\\u00C0-\\u00D6\\u00D8-\\u00F6\\u00F8-\\u02C1"
+      "\\u02C6-\\u02D1\\u02E0-\\u02E4\\u02EC-\\u02EC\\u02EE-\\u02EE"
+      "\\u0370-\\u0374\\u0376-\\u0377\\u037A-\\u037D\\u037F-\\u037F"
+      "\\u0386-\\u0386\\u0388-\\u038A\\u038C-\\u038C\\u038E-\\u03A1"
+      "\\u03A3-\\u03F5\\u03F7-\\u0481\\u048A-\\u052F\\u0531-\\u0556"
+      "\\u0559-\\u0559\\u0560-\\u0588\\u05D0-\\u05EA\\u05EF-\\u05F2"
+      "\\u0620-\\u064A\\u066E-\\u066F\\u0671-\\u06D3\\u06D5-\\u06D5"
+      "\\u06E5-\\u06E6\\u06EE-\\u06EF\\u06FA-\\u06FC\\u06FF-\\u06FF"
+      "\\u0710-\\u0710\\u0712-\\u072F\\u074D-\\u07A5\\u07B1-\\u07B1"
+      "\\u07CA-\\u07EA\\u07F4-\\u07F5\\u07FA-\\u07FA\\u0800-\\u0815"
+      "\\u081A-\\u081A\\u0824-\\u0824\\u0828-\\u0828\\u0840-\\u0858"
+      "\\u0860-\\u086A\\u08A0-\\u08B4\\u08B6-\\u08C7\\u0904-\\u0939"
+      "\\u093D-\\u093D\\u0950-\\u0950\\u0958-\\u0961\\u0971-\\u0980"
+      "\\u0985-\\u098C\\u098F-\\u0990\\u0993-\\u09A8\\u09AA-\\u09B0"
+      "\\u09B2-\\u09B2\\u09B6-\\u09B9\\u09BD-\\u09BD\\u09CE-\\u09CE"
+      "\\u09DC-\\u09DD\\u09DF-\\u09E1\\u09F0-\\u09F1\\u09FC-\\u09FC"
+      "\\u0A05-\\u0A0A\\u0A0F-\\u0A10\\u0A13-\\u0A28\\u0A2A-\\u0A30"
+      "\\u0A32-\\u0A33\\u0A35-\\u0A36\\u0A38-\\u0A39\\u0A59-\\u0A5C"
+      "\\u0A5E-\\u0A5E\\u0A72-\\u0A74\\u0A85-\\u0A8D\\u0A8F-\\u0A91"
+      "\\u0A93-\\u0AA8\\u0AAA-\\u0AB0\\u0AB2-\\u0AB3\\u0AB5-\\u0AB9"
+      "\\u0ABD-\\u0ABD\\u0AD0-\\u0AD0\\u0AE0-\\u0AE1\\u0AF9-\\u0AF9"
+      "\\u0B05-\\u0B0C\\u0B0F-\\u0B10\\u0B13-\\u0B28\\u0B2A-\\u0B30"
+      "\\u0B32-\\u0B33\\u0B35-\\u0B39\\u0B3D-\\u0B3D\\u0B5C-\\u0B5D"
+      "\\u0B5F-\\u0B61\\u0B71-\\u0B71\\u0B83-\\u0B83\\u0B85-\\u0B8A"
+      "\\u0B8E-\\u0B90\\u0B92-\\u0B95\\u0B99-\\u0B9A\\u0B9C-\\u0B9C"
+      "\\u0B9E-\\u0B9F\\u0BA3-\\u0BA4\\u0BA8-\\u0BAA\\u0BAE-\\u0BB9"
+      "\\u0BD0-\\u0BD0\\u0C05-\\u0C0C\\u0C0E-\\u0C10\\u0C12-\\u0C28"
+      "\\u0C2A-\\u0C39\\u0C3D-\\u0C3D\\u0C58-\\u0C5A\\u0C60-\\u0C61"
+      "\\u0C80-\\u0C80\\u0C85-\\u0C8C\\u0C8E-\\u0C90\\u0C92-\\u0CA8"
+      "\\u0CAA-\\u0CB3\\u0CB5-\\u0CB9\\u0CBD-\\u0CBD\\u0CDE-\\u0CDE"
+      "\\u0CE0-\\u0CE1\\u0CF1-\\u0CF2\\u0D04-\\u0D0C\\u0D0E-\\u0D10"
+      "\\u0D12-\\u0D3A\\u0D3D-\\u0D3D\\u0D4E-\\u0D4E\\u0D54-\\u0D56"
+      "\\u0D5F-\\u0D61\\u0D7A-\\u0D7F\\u0D85-\\u0D96\\u0D9A-\\u0DB1"
+      "\\u0DB3-\\u0DBB\\u0DBD-\\u0DBD\\u0DC0-\\u0DC6\\u0E01-\\u0E30"
+      "\\u0E32-\\u0E33\\u0E40-\\u0E46\\u0E81-\\u0E82\\u0E84-\\u0E84"
+      "\\u0E86-\\u0E8A\\u0E8C-\\u0EA3\\u0EA5-\\u0EA5\\u0EA7-\\u0EB0"
+      "\\u0EB2-\\u0EB3\\u0EBD-\\u0EBD\\u0EC0-\\u0EC4\\u0EC6-\\u0EC6"
+      "\\u0EDC-\\u0EDF\\u0F00-\\u0F00\\u0F40-\\u0F47\\u0F49-\\u0F6C"
+      "\\u0F88-\\u0F8C\\u1000-\\u102A\\u103F-\\u103F\\u1050-\\u1055"
+      "\\u105A-\\u105D\\u1061-\\u1061\\u1065-\\u1066\\u106E-\\u1070"
+      "\\u1075-\\u1081\\u108E-\\u108E\\u10A0-\\u10C5\\u10C7-\\u10C7"
+      "\\u10CD-\\u10CD\\u10D0-\\u10FA\\u10FC-\\u1248\\u124A-\\u124D"
+      "\\u1250-\\u1256\\u1258-\\u1258\\u125A-\\u125D\\u1260-\\u1288"
+      "\\u128A-\\u128D\\u1290-\\u12B0\\u12B2-\\u12B5\\u12B8-\\u12BE"
+      "\\u12C0-\\u12C0\\u12C2-\\u12C5\\u12C8-\\u12D6\\u12D8-\\u1310"
+      "\\u1312-\\u1315\\u1318-\\u135A\\u1380-\\u138F\\u13A0-\\u13F5"
+      "\\u13F8-\\u13FD\\u1401-\\u166C\\u166F-\\u167F\\u1681-\\u169A"
+      "\\u16A0-\\u16EA\\u16F1-\\u16F8\\u1700-\\u170C\\u170E-\\u1711"
+      "\\u1720-\\u1731\\u1740-\\u1751\\u1760-\\u176C\\u176E-\\u1770"
+      "\\u1780-\\u17B3\\u17D7-\\u17D7\\u17DC-\\u17DC\\u1820-\\u1878"
+      "\\u1880-\\u1884\\u1887-\\u18A8\\u18AA-\\u18AA\\u18B0-\\u18F5"
+      "\\u1900-\\u191E\\u1950-\\u196D\\u1970-\\u1974\\u1980-\\u19AB"
+      "\\u19B0-\\u19C9\\u1A00-\\u1A16\\u1A20-\\u1A54\\u1AA7-\\u1AA7"
+      "\\u1B05-\\u1B33\\u1B45-\\u1B4B\\u1B83-\\u1BA0\\u1BAE-\\u1BAF"
+      "\\u1BBA-\\u1BE5\\u1C00-\\u1C23\\u1C4D-\\u1C4F\\u1C5A-\\u1C7D"
+      "\\u1C80-\\u1C88\\u1C90-\\u1CBA\\u1CBD-\\u1CBF\\u1CE9-\\u1CEC"
+      "\\u1CEE-\\u1CF3\\u1CF5-\\u1CF6\\u1CFA-\\u1CFA\\u1D00-\\u1DBF"
+      "\\u1E00-\\u1F15\\u1F18-\\u1F1D\\u1F20-\\u1F45\\u1F48-\\u1F4D"
+      "\\u1F50-\\u1F57\\u1F59-\\u1F59\\u1F5B-\\u1F5B\\u1F5D-\\u1F5D"
+      "\\u1F5F-\\u1F7D\\u1F80-\\u1FB4\\u1FB6-\\u1FBC\\u1FBE-\\u1FBE"
+      "\\u1FC2-\\u1FC4\\u1FC6-\\u1FCC\\u1FD0-\\u1FD3\\u1FD6-\\u1FDB"
+      "\\u1FE0-\\u1FEC\\u1FF2-\\u1FF4\\u1FF6-\\u1FFC\\u2071-\\u2071"
+      "\\u207F-\\u207F\\u2090-\\u209C\\u2102-\\u2102\\u2107-\\u2107"
+      "\\u210A-\\u2113\\u2115-\\u2115\\u2119-\\u211D\\u2124-\\u2124"
+      "\\u2126-\\u2126\\u2128-\\u2128\\u212A-\\u212D\\u212F-\\u2139"
+      "\\u213C-\\u213F\\u2145-\\u2149\\u214E-\\u214E\\u2183-\\u2184"
+      "\\u2C00-\\u2C2E\\u2C30-\\u2C5E\\u2C60-\\u2CE4\\u2CEB-\\u2CEE"
+      "\\u2CF2-\\u2CF3\\u2D00-\\u2D25\\u2D27-\\u2D27\\u2D2D-\\u2D2D"
+      "\\u2D30-\\u2D67\\u2D6F-\\u2D6F\\u2D80-\\u2D96\\u2DA0-\\u2DA6"
+      "\\u2DA8-\\u2DAE\\u2DB0-\\u2DB6\\u2DB8-\\u2DBE\\u2DC0-\\u2DC6"
+      "\\u2DC8-\\u2DCE\\u2DD0-\\u2DD6\\u2DD8-\\u2DDE\\u2E2F-\\u2E2F"
+      "\\u3005-\\u3006\\u3031-\\u3035\\u303B-\\u303C\\u3041-\\u3096"
+      "\\u309D-\\u309F\\u30A1-\\u30FA\\u30FC-\\u30FF\\u3105-\\u312F"
+      "\\u3131-\\u318E\\u31A0-\\u31BF\\u31F0-\\u31FF\\u3400-\\u4DBF"
+      "\\u4E00-\\u9FFC\\uA000-\\uA48C\\uA4D0-\\uA4FD\\uA500-\\uA60C"
+      "\\uA610-\\uA61F\\uA62A-\\uA62B\\uA640-\\uA66E\\uA67F-\\uA69D"
+      "\\uA6A0-\\uA6E5\\uA717-\\uA71F\\uA722-\\uA788\\uA78B-\\uA7BF"
+      "\\uA7C2-\\uA7CA\\uA7F5-\\uA801\\uA803-\\uA805\\uA807-\\uA80A"
+      "\\uA80C-\\uA822\\uA840-\\uA873\\uA882-\\uA8B3\\uA8F2-\\uA8F7"
+      "\\uA8FB-\\uA8FB\\uA8FD-\\uA8FE\\uA90A-\\uA925\\uA930-\\uA946"
+      "\\uA960-\\uA97C\\uA984-\\uA9B2\\uA9CF-\\uA9CF\\uA9E0-\\uA9E4"
+      "\\uA9E6-\\uA9EF\\uA9FA-\\uA9FE\\uAA00-\\uAA28\\uAA40-\\uAA42"
+      "\\uAA44-\\uAA4B\\uAA60-\\uAA76\\uAA7A-\\uAA7A\\uAA7E-\\uAAAF"
+      "\\uAAB1-\\uAAB1\\uAAB5-\\uAAB6\\uAAB9-\\uAABD\\uAAC0-\\uAAC0"
+      "\\uAAC2-\\uAAC2\\uAADB-\\uAADD\\uAAE0-\\uAAEA\\uAAF2-\\uAAF4"
+      "\\uAB01-\\uAB06\\uAB09-\\uAB0E\\uAB11-\\uAB16\\uAB20-\\uAB26"
+      "\\uAB28-\\uAB2E\\uAB30-\\uAB5A\\uAB5C-\\uAB69\\uAB70-\\uABE2"
+      "\\uAC00-\\uD7A3\\uD7B0-\\uD7C6\\uD7CB-\\uD7FB\\uF900-\\uFA6D"
+      "\\uFA70-\\uFAD9\\uFB00-\\uFB06\\uFB13-\\uFB17\\uFB1D-\\uFB1D"
+      "\\uFB1F-\\uFB28\\uFB2A-\\uFB36\\uFB38-\\uFB3C\\uFB3E-\\uFB3E"
+      "\\uFB40-\\uFB41\\uFB43-\\uFB44\\uFB46-\\uFBB1\\uFBD3-\\uFD3D"
+      "\\uFD50-\\uFD8F\\uFD92-\\uFDC7\\uFDF0-\\uFDFB\\uFE70-\\uFE74"
+      "\\uFE76-\\uFEFC\\uFF21-\\uFF3A\\uFF41-\\uFF5A\\uFF66-\\uFFBE"
+      "\\uFFC2-\\uFFC7\\uFFCA-\\uFFCF\\uFFD2-\\uFFD7\\uFFDA-\\uFFDC";
+
+  std::string unicode_number_expr =
+      "\\u0030-\\u0039\\u00B2-\\u00B3\\u00B9-\\u00B9\\u00BC-\\u00BE"
+      "\\u0660-\\u0669\\u06F0-\\u06F9\\u07C0-\\u07C9\\u0966-\\u096F"
+      "\\u09E6-\\u09EF\\u09F4-\\u09F9\\u0A66-\\u0A6F\\u0AE6-\\u0AEF"
+      "\\u0B66-\\u0B6F\\u0B72-\\u0B77\\u0BE6-\\u0BF2\\u0C66-\\u0C6F"
+      "\\u0C78-\\u0C7E\\u0CE6-\\u0CEF\\u0D58-\\u0D5E\\u0D66-\\u0D78"
+      "\\u0DE6-\\u0DEF\\u0E50-\\u0E59\\u0ED0-\\u0ED9\\u0F20-\\u0F33"
+      "\\u1040-\\u1049\\u1090-\\u1099\\u1369-\\u137C\\u16EE-\\u16F0"
+      "\\u17E0-\\u17E9\\u17F0-\\u17F9\\u1810-\\u1819\\u1946-\\u194F"
+      "\\u19D0-\\u19DA\\u1A80-\\u1A89\\u1A90-\\u1A99\\u1B50-\\u1B59"
+      "\\u1BB0-\\u1BB9\\u1C40-\\u1C49\\u1C50-\\u1C59\\u2070-\\u2070"
+      "\\u2074-\\u2079\\u2080-\\u2089\\u2150-\\u2182\\u2185-\\u2189"
+      "\\u2460-\\u249B\\u24EA-\\u24FF\\u2776-\\u2793\\u2CFD-\\u2CFD"
+      "\\u3007-\\u3007\\u3021-\\u3029\\u3038-\\u303A\\u3192-\\u3195"
+      "\\u3220-\\u3229\\u3248-\\u324F\\u3251-\\u325F\\u3280-\\u3289"
+      "\\u32B1-\\u32BF\\uA620-\\uA629\\uA6E6-\\uA6EF\\uA830-\\uA835"
+      "\\uA8D0-\\uA8D9\\uA900-\\uA909\\uA9D0-\\uA9D9\\uA9F0-\\uA9F9"
+      "\\uAA50-\\uAA59\\uABF0-\\uABF9\\uFF10-\\uFF19";
+
+  std::wstring wpat_expr = utf8_to_wstring(
+      "'s|'t|'re|'ve|'m|'ll|'d| ?[" + unicode_letter_expr + "]+| ?[" +
+      unicode_number_expr + "]+| ?[^\\s" + unicode_letter_expr +
+      unicode_number_expr + "]+|\\s+(?!\\S)|\\s+");
+
+  const std::wregex pat = std::wregex(wpat_expr);
+  std::unordered_map<std::wstring, std::vector<std::string>> cache;
+  void load_vocab(std::string const &vocab_file);
+  void load_merge(std::string const &merge_file);
+
+  std::unordered_set<wbigram_pair, hash_pair>
+      get_pairs(std::vector<std::wstring> word);
+  std::wstring utf8_to_wstring(std::string const &src);
+  std::u32string utf8_to_utf32(std::string const &src);
+  std::string wstring_to_utf8(std::wstring const &src);
+  std::string utf32_to_utf8(std::u32string const &src);
+
+  std::vector<std::string> split(std::string const &s,
+                                 std::regex rgx = std::regex("\\s+"));
+};
diff --git a/examples/cpp/inference/gpt_tokenizer_test.sh b/examples/cpp/inference/gpt_tokenizer_test.sh
new file mode 100755
index 0000000000..8f7660bfe4
--- /dev/null
+++ b/examples/cpp/inference/gpt_tokenizer_test.sh
@@ -0,0 +1,63 @@
+#! /usr/bin/env bash
+set -x
+set -e
+
+cleanup() {
+	rm -rf wikitext-103-raw-v1.zip wikitext-103-raw gpt2_bpe gpt_tokenizer pytokenizer.py bpe.py
+}
+
+# Cd into directory holding this script
+cd "${BASH_SOURCE[0]%/*}"
+
+# Clean up before test (just in case)
+cleanup
+
+# Compile the FlexFlow C++ tokenizer stand-alone
+g++ -std=c++11 -I../../../deps/json/include -o gpt_tokenizer gpt_tokenizer.cpp gpt_tokenizer.cc
+chmod +x gpt_tokenizer
+
+# Download and inflate wikitext dataset
+wget https://s3.amazonaws.com/research.metamind.io/wikitext/wikitext-103-raw-v1.zip
+unzip wikitext-103-raw-v1.zip
+rm wikitext-103-raw-v1.zip
+
+# Download GPT-2 BPE vocab and merges files
+mkdir -p gpt2_bpe
+wget -O gpt2_bpe/encoder.json https://dl.fbaipublicfiles.com/fairseq/gpt2_bpe/encoder.json
+wget -O gpt2_bpe/vocab.bpe https://dl.fbaipublicfiles.com/fairseq/gpt2_bpe/vocab.bpe
+
+# Download minGPT bpe tokenizer for comparison
+wget -O bpe.py https://raw.githubusercontent.com/karpathy/minGPT/master/mingpt/bpe.py
+chmod +x bpe.py
+
+# Run the FlexFlow C++ tokenizer
+./gpt_tokenizer
+
+# Run the minGPT tokenizer
+cat << EOF > pytokenizer.py
+#!/usr/bin/env python
+from bpe import BPETokenizer
+
+tokenizer = BPETokenizer()
+inp="./wikitext-103-raw/wiki.valid.raw"
+outp="./wikitext-103-raw/wiki.valid.bpe.minGPT"
+with open(inp, "r") as infile:
+    with open(outp, "w+") as outfile:
+        for l in infile.readlines():
+            if len(l.strip()) == 0:
+                outfile.write(l)
+            else:
+                out = tokenizer(l.strip()).tolist()[0]
+                out = [str(x) for x in out]
+                out = " ".join(out)
+                outfile.write(out)
+                outfile.write("\n")
+EOF
+chmod +x pytokenizer.py
+./pytokenizer.py
+
+# Check that the outputs match
+diff ./wikitext-103-raw/wiki.valid.bpe.flexflow ./wikitext-103-raw/wiki.valid.bpe.minGPT
+
+# Clean up after test
+cleanup

From 01417084227f21c99b88b86f78ea733848ecaa0f Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 10 Mar 2023 18:20:29 -0500
Subject: [PATCH 071/344] [MoE][Experts] - New `Experts` CUDA kernel
 implementation (#612)

* backup of initial kernel code

* Fix some thrust related compiling error.

* bug fixing, added more stuff to ExpertsMeta

* added cuda kernel for token replication

* added notes

* debug

* updates

* Fixed bugs.

* bug fix

* linting

* Add CublasGemmBatched skeleton.

* add comments

* Update experts kernel to Cublas GemmBatchedEx solution.

* Add out_dim to Experts.

* Update experts.cu with aggreation results.

* parallelized preparation of gemm arrays with exp capacity

* fix typo, remove unused functions

* added weights pointer copy

* Pushed debugging codes.

* fixed several bugs

* bug fix

* more fixes

* fixed batch gemm

* finished basic version of aggregation

* Apply bias to GemmBatchedEx.

* Apply activation to experts kernel.

* Reformat code in experts.cu

* moved thrust functions on legion stream

* fixed bug in activation computation

* hip rocm build fix

* linting

* fix

* computing all activations at once

---------

Co-authored-by: Zeyu Wang <zeyu@ip-172-31-10-138.us-east-2.compute.internal>
Co-authored-by: Zeyu Wang <zwang86@huskers.unl.edu>
---
 .../mixture_of_experts/dataloader.cc          |  91 ---
 include/flexflow/ops/experts.h                |  44 ++
 include/flexflow/utils/cuda_helper.h          |   4 +-
 src/ops/experts.cc                            |  46 +-
 src/ops/experts.cpp                           |  34 +-
 src/ops/experts.cu                            | 613 +++++++++++++++++-
 src/runtime/cuda_helper.cu                    |  28 +
 7 files changed, 706 insertions(+), 154 deletions(-)

diff --git a/examples/cpp/inference/mixture_of_experts/dataloader.cc b/examples/cpp/inference/mixture_of_experts/dataloader.cc
index 557fe4e095..af32cfe98b 100644
--- a/examples/cpp/inference/mixture_of_experts/dataloader.cc
+++ b/examples/cpp/inference/mixture_of_experts/dataloader.cc
@@ -114,97 +114,6 @@ DataLoader::DataLoader(FFModel &ff,
 //                    Load data
 // =================================================
 
-void read_cifar100(float *input_ptr, int *label_ptr) {
-  std::ifstream file;
-  file.open("train.bin", std::ios::in | std::ios::binary | std::ios::ate);
-  if (!file) {
-    std::cout << "Error opening CIFAR100 train data file" << std::endl;
-    assert(false);
-  }
-
-  file.seekg(0, std::ios::beg);
-
-  // each sample: <1 x coarse label><1 x fine label><3072 x pixel>
-  for (std::size_t i = 0; i < MAX_NUM_SAMPLES; i++) {
-    unsigned char temp = 0;
-    file.read((char *)&temp, sizeof(temp)); // coarse label, skip
-    file.read((char *)&temp, sizeof(temp));
-    label_ptr[i] = temp;
-    for (std::size_t j = 0; j < 3072; ++j) {
-      file.read((char *)&temp, sizeof(temp));
-      input_ptr[i * 3072 + j] = (float)temp / 255.0f;
-    }
-  }
-
-  file.close();
-}
-
-int reverseInt(int i) {
-  unsigned char c1, c2, c3, c4;
-
-  c1 = i & 255;
-  c2 = (i >> 8) & 255;
-  c3 = (i >> 16) & 255;
-  c4 = (i >> 24) & 255;
-
-  return ((int)c1 << 24) + ((int)c2 << 16) + ((int)c3 << 8) + c4;
-}
-
-/* NOTE: Download files from http://yann.lecun.com/exdb/mnist/ and unpack to
-the current working directory */
-void read_mnist(float *input_ptr, int *label_ptr) {
-  // read inputs
-  std::ifstream input("train-images-idx3-ubyte", std::ios::binary);
-  if (input.is_open()) {
-    int magic_number = 0;
-    int number_of_images = 0;
-    int n_rows = 0;
-    int n_cols = 0;
-    input.read((char *)&magic_number, sizeof(magic_number));
-    magic_number = reverseInt(magic_number);
-    input.read((char *)&number_of_images, sizeof(number_of_images));
-    number_of_images = reverseInt(number_of_images);
-    input.read((char *)&n_rows, sizeof(n_rows));
-    n_rows = reverseInt(n_rows);
-    input.read((char *)&n_cols, sizeof(n_cols));
-    n_cols = reverseInt(n_cols);
-
-    for (int i = 0; i < number_of_images; i++) {
-      for (int r = 0; r < n_rows; r++) {
-        for (int c = 0; c < n_cols; c++) {
-          unsigned char temp = 0;
-          input.read((char *)&temp, sizeof(temp));
-          input_ptr[i * n_rows * n_cols + r * n_cols + c] =
-              (float)temp / 255.0f;
-        }
-      }
-    }
-  } else {
-    std::cout << "Error opening MNIST input data file" << std::endl;
-    assert(false);
-  }
-
-  // read labels
-  std::ifstream labels("train-labels-idx1-ubyte", std::ios::binary);
-  if (labels.is_open()) {
-    int magic_number = 0;
-    int number_of_images = 0;
-    labels.read((char *)&magic_number, sizeof(magic_number));
-    magic_number = reverseInt(magic_number);
-    labels.read((char *)&number_of_images, sizeof(number_of_images));
-    number_of_images = reverseInt(number_of_images);
-
-    for (int i = 0; i < number_of_images; i++) {
-      unsigned char temp = 0;
-      labels.read((char *)&temp, sizeof(temp));
-      label_ptr[i] = temp;
-    }
-  } else {
-    std::cout << "Error opening MNIST label data file" << std::endl;
-    assert(false);
-  }
-}
-
 void DataLoader::load_entire_dataset(Task const *task,
                                      std::vector<PhysicalRegion> const &regions,
                                      Context ctx,
diff --git a/include/flexflow/ops/experts.h b/include/flexflow/ops/experts.h
index 74c24c5a19..58640ec085 100644
--- a/include/flexflow/ops/experts.h
+++ b/include/flexflow/ops/experts.h
@@ -11,16 +11,56 @@ class ExpertsMeta : public OpMeta {
   ExpertsMeta(FFHandler handler,
               int _num_experts,
               int _experts_start_idx,
+              int _data_dim,
+              int _out_dim,
+              int _effective_batch_size,
+              int _num_chosen_experts,
               float _alpha,
               bool _use_bias,
               ActiMode _activation);
   ~ExpertsMeta(void);
+
+  // Thrust helper arrays
+  int *sorted_indices;
+  int *original_indices;
+  int *non_zero_expert_labels;
+  int *temp_sequence;
+  int *exp_local_label_to_index;
+  int *expert_start_indexes;
+  int *num_assignments_per_expert; // numbers of tokes assigned to each expert.
+                                   // Values may exceed the expert capacity
+  int *capped_num_assignments_per_expert;
+  int *destination_start_indices;
+  float const **token_idx_array;
   float const **dev_weights;
+  float const **weight_idx_array;
+  float const **coefficient_idx_array;
+  float **output_idx_array;
+  float const **bias_idx_array;
+  float const *one_ptr;
+  float const **one_ptr_array;
+
+  // array of arrays to store cublasGemmBatchedEx outputs before aggregation
+  float **batch_outputs;
+  float **dev_batch_outputs;
+
   int num_experts;
   int experts_start_idx;
+  int data_dim;
+  int out_dim;
+  int effective_batch_size;
+  int num_chosen_experts;
+  int expert_capacity;
   float alpha;
   bool use_bias;
   ActiMode activation;
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+  cudnnTensorDescriptor_t resultTensorDesc;
+  cudnnActivationDescriptor_t actiDesc;
+#else
+  miopenTensorDescriptor_t resultTensorDesc;
+  miopenActivationDescriptor_t actiDesc;
+#endif
 };
 
 // definitions for the CUDA kernel
@@ -107,6 +147,10 @@ class Experts : public Op {
   int num_experts;
   int experts_start_idx;
   int experts_output_dim_size;
+  int data_dim;
+  int out_dim;
+  int effective_batch_size;
+  int num_chosen_experts;
   float alpha;
   int experts_num_layers;
   int experts_internal_dim_size;
diff --git a/include/flexflow/utils/cuda_helper.h b/include/flexflow/utils/cuda_helper.h
index 46e323b186..78e21ccd9f 100644
--- a/include/flexflow/utils/cuda_helper.h
+++ b/include/flexflow/utils/cuda_helper.h
@@ -137,6 +137,8 @@ cudnnStatus_t cudnnSetTensorDescriptorFromDomain(cudnnTensorDescriptor_t tensor,
                                                  Legion::Domain domain);
 
 cudaDataType_t ff_to_cuda_datatype(DataType type);
-
 cudnnDataType_t ff_to_cudnn_datatype(DataType type);
+
+cudaDataType_t cudnn_to_cuda_datatype(cudnnDataType_t type);
+cudnnDataType_t cuda_to_cudnn_datatype(cudaDataType_t type);
 #endif
\ No newline at end of file
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index 37954f67ad..b57874ac35 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -68,7 +68,7 @@ Tensor FFModel::experts(Tensor const *inputs,
 
   // parameters for the FFN implementing the experts. We can make these
   // FFModel::experts(...) function parameters if needed.
-  bool use_bias = false;
+  bool use_bias = true;
   ActiMode activation = AC_MODE_RELU;
 
   Layer *e = new Layer(this,
@@ -291,34 +291,44 @@ Experts::Experts(FFModel &model,
   // overwrite layer_guid
   layer_guid = _layer_guid;
 
+  // Check number of inputs, output, weights
   assert(num_experts > 0);
   assert(numInputs == 3);
   assert(numOutputs == 1);
   assert(numWeights == num_experts * (1 + use_bias));
 
-  assert(inputs[0] != nullptr);
+  // Check input dimensions
   int num_dims = inputs[0]->num_dims;
+  int topk = inputs[1]->dims[0].size;
+  assert(inputs[0] != nullptr);
   assert(inputs[1]->num_dims == num_dims);
   assert(inputs[2]->num_dims == num_dims);
-
-  int topk = inputs[1]->dims[0].size;
   assert(inputs[2]->dims[0].size == topk);
-
   for (int i = 1; i < num_dims; i++) {
     assert(inputs[0]->dims[i] == inputs[1]->dims[i]);
     assert(inputs[1]->dims[i] == inputs[2]->dims[i]);
   }
-
-  assert(inputs[1]->data_type == DT_INT32 || inputs[1]->data_type == DT_INT64);
-  assert(experts_num_layers == 1 && "Multi-layer experts not implemented yet.");
-  assert(experts_num_layers == 1 || experts_internal_dim_size > 0);
-
   // Assume that we don't parallelize the channel dim of input
   // nor the expert_assigned dim of indices
   assert(inputs[0]->dims[0].degree == 1);
   assert(inputs[1]->dims[0].degree == 1);
   assert(inputs[2]->dims[0].degree == 1);
+  // check data type of indices input
+  assert(inputs[1]->data_type == DT_INT32 || inputs[1]->data_type == DT_INT64);
+  assert(experts_num_layers == 1 && "Multi-layer experts not implemented yet.");
+  assert(experts_num_layers == 1 || experts_internal_dim_size > 0);
 
+  // save the token embedding dimension (data_dim) and the effective batch size
+  data_dim = inputs[0]->dims[0].size;
+  effective_batch_size = 1;
+  for (int i = 1; i <= num_dims - 2; i++) {
+    effective_batch_size *= inputs[0]->dims[i].size;
+  }
+  num_chosen_experts = topk;
+
+  out_dim = _experts_output_dim_size;
+
+  // Create the parallel tensor for the output
   ParallelDim out_dims[MAX_TENSOR_DIM];
   for (int i = 0; i < num_dims; i++) {
     out_dims[i] = inputs[0]->dims[i];
@@ -572,6 +582,10 @@ OpMeta *Experts::init_task(Task const *task,
   ExpertsMeta *m = new ExpertsMeta(handle,
                                    exp->num_experts,
                                    exp->experts_start_idx,
+                                   exp->data_dim,
+                                   exp->out_dim,
+                                   exp->effective_batch_size,
+                                   exp->num_chosen_experts,
                                    exp->alpha,
                                    exp->use_bias,
                                    exp->activation);
@@ -762,10 +776,13 @@ void Experts::inference_task(Task const *task,
   coord_t data_dim = input_domain.hi()[0] - input_domain.lo()[0] + 1;
   coord_t batch_size =
       input_domain.hi()[samples_index] - input_domain.lo()[samples_index] + 1;
-  coord_t chosen_experts = indices_domain.hi()[0] - indices_domain.lo()[0];
+  coord_t chosen_experts = indices_domain.hi()[0] - indices_domain.lo()[0] + 1;
   coord_t out_dim = output_domain.hi()[0] - output_domain.lo()[0] + 1;
+  assert(data_dim == m->data_dim);
+  assert(out_dim == m->out_dim);
+  assert(chosen_experts == m->num_chosen_experts);
   assert(chosen_experts ==
-         topk_gate_pred_domain.hi()[0] - topk_gate_pred_domain.lo()[0]);
+         topk_gate_pred_domain.hi()[0] - topk_gate_pred_domain.lo()[0] + 1);
 
   for (int i = 1; i < input_dims; i++) {
     int a = input_domain.hi()[i] - input_domain.lo()[i] + 1;
@@ -776,6 +793,7 @@ void Experts::inference_task(Task const *task,
       batch_size *= a;
     }
   }
+  assert(batch_size == m->effective_batch_size);
 
   assert(batch_size <= MAX_BATCH_SIZE &&
          "batch size exceeds MAX_BATCH_SIZE defined in experts.h");
@@ -817,11 +835,11 @@ void Experts::inference_task(Task const *task,
           task->regions[4 + i * (1 + use_bias) + use_bias]
               .region.get_index_space());
       int bias_dims = bias_domain.get_dim();
-      assert(bias_dims == 1);
+      assert(bias_dims == 4);
       assert(bias_domain.hi()[0] - bias_domain.lo()[0] + 1 == out_dim);
     }
   }
-  return;
+
   Experts::forward_kernel_wrapper(m,
                                   input_ptr,
                                   indices_ptr,
diff --git a/src/ops/experts.cpp b/src/ops/experts.cpp
index 081f814400..3e8bebb4f0 100644
--- a/src/ops/experts.cpp
+++ b/src/ops/experts.cpp
@@ -29,39 +29,25 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                      int chosen_experts,
                                      int batch_size,
                                      int out_dim) {
-  hipStream_t stream;
-  checkCUDA(get_legion_stream(&stream));
-
-  int expert_capacity =
-      ceil(m->alpha * chosen_experts / m->num_experts * batch_size);
-
-  int num_experts = m->num_experts;
-  // int expert_start_index = experts_start_idx;
-  bool use_bias = m->use_bias;
-  // ActiMode activation = m->activation;
-
-  hipMemcpy(m->dev_weights,
-            weights,
-            num_experts * (1 + use_bias) * sizeof(float *),
-            hipMemcpyHostToDevice);
-
   // TODO: write the HIP version of the kernel after finishing the CUDA kernel
+  handle_unimplemented_hip_kernel(OP_EXPERTS);
 }
 
 ExpertsMeta::ExpertsMeta(FFHandler handler,
                          int _num_experts,
                          int _experts_start_idx,
+                         int _data_dim,
+                         int _out_dim,
+                         int _effective_batch_size,
+                         int _num_chosen_experts,
                          float _alpha,
                          bool _use_bias,
                          ActiMode _activation)
     : OpMeta(handler), num_experts(_num_experts),
-      experts_start_idx(_experts_start_idx), alpha(_alpha), use_bias(_use_bias),
-      activation(_activation) {
-  checkCUDA(
-      hipMalloc(&dev_weights, num_experts * (1 + use_bias) * sizeof(float *)));
-}
-ExpertsMeta::~ExpertsMeta(void) {
-  checkCUDA(hipFree(&dev_weights));
-}
+      experts_start_idx(_experts_start_idx), data_dim(_data_dim),
+      out_dim(_out_dim), effective_batch_size(_effective_batch_size),
+      num_chosen_experts(_num_chosen_experts), alpha(_alpha),
+      use_bias(_use_bias), activation(_activation) {}
+ExpertsMeta::~ExpertsMeta(void) {}
 
 }; // namespace FlexFlow
diff --git a/src/ops/experts.cu b/src/ops/experts.cu
index 342de3ef65..c74c77b399 100644
--- a/src/ops/experts.cu
+++ b/src/ops/experts.cu
@@ -15,9 +15,360 @@
 
 #include "flexflow/ops/experts.h"
 #include "flexflow/utils/cuda_helper.h"
+#include <cublas_v2.h>
+#include <cuda_runtime.h>
+
+// Thrust-related headers
+#define THRUST_IGNORE_DEPRECATED_CPP_DIALECT 1
+#include <thrust/binary_search.h>
+#include <thrust/copy.h>
+#include <thrust/device_ptr.h>
+#include <thrust/device_vector.h>
+#include <thrust/execution_policy.h>
+#include <thrust/functional.h>
+#include <thrust/sequence.h>
+#include <thrust/sort.h>
+#include <thrust/transform.h>
+#include <thrust/unique.h>
+
+#include <chrono>
+#include <thread>
 
 namespace FlexFlow {
 
+struct exceeds_expert_capacity {
+  int _expert_capacity;
+  exceeds_expert_capacity(int expert_capacity)
+      : _expert_capacity(expert_capacity){};
+  __host__ __device__ bool operator()(int x) {
+    return x > _expert_capacity;
+  }
+};
+
+void experts_forward_thrust_wrapper(ExpertsMeta const *m,
+                                    int const *indices,
+                                    int num_indices,
+                                    int experts_start_idx,
+                                    int num_experts_per_block,
+                                    int expert_capacity,
+                                    int *lb_index,
+                                    int *ub_index,
+                                    int *num_valid_assignments,
+                                    int *non_zero_experts_count,
+                                    int *start_indexes,
+                                    int *gemm_batch_count,
+                                    ffStream_t stream) {
+  // sort the indices and coefficients by expert. Keep track of the original
+  // position of each index/coefficient using the original_indices array
+  thrust::device_ptr<int const> thrust_indices =
+      thrust::device_pointer_cast(indices);
+  thrust::device_ptr<int> sorted_indices =
+      thrust::device_pointer_cast(m->sorted_indices);
+  thrust::copy(thrust::cuda::par.on(stream),
+               thrust_indices,
+               thrust_indices + num_indices,
+               sorted_indices);
+
+  thrust::device_ptr<int> original_indices =
+      thrust::device_pointer_cast(m->original_indices);
+  thrust::sequence(thrust::cuda::par.on(stream),
+                   original_indices,
+                   original_indices + num_indices);
+
+  thrust::stable_sort_by_key(thrust::cuda::par.on(stream),
+                             sorted_indices,
+                             sorted_indices + num_indices,
+                             original_indices);
+
+  // get lower and upper bound of indices corresponding to experts in the block
+  thrust::device_ptr<int> lb = thrust::lower_bound(thrust::cuda::par.on(stream),
+                                                   sorted_indices,
+                                                   sorted_indices + num_indices,
+                                                   experts_start_idx);
+  thrust::device_ptr<int> ub =
+      thrust::upper_bound(thrust::cuda::par.on(stream),
+                          sorted_indices,
+                          sorted_indices + num_indices,
+                          experts_start_idx + num_experts_per_block);
+
+  *lb_index = lb - sorted_indices;
+  *ub_index = ub - sorted_indices;
+  *num_valid_assignments = (*ub_index) - (*lb_index);
+  if ((*num_valid_assignments) == 0) {
+    return;
+  }
+
+  // create "exp_local_label_to_index", a mapping from local expert label to its
+  // non-zero expert index
+  thrust::device_ptr<int> non_zero_expert_labels =
+      thrust::device_pointer_cast(m->non_zero_expert_labels);
+  thrust::device_ptr<int> non_zero_expert_labels_end = thrust::unique_copy(
+      thrust::cuda::par.on(stream), lb, ub, non_zero_expert_labels);
+  *non_zero_experts_count = non_zero_expert_labels_end - non_zero_expert_labels;
+
+  using namespace thrust::placeholders;
+  thrust::for_each(thrust::cuda::par.on(stream),
+                   non_zero_expert_labels,
+                   non_zero_expert_labels + (*non_zero_experts_count),
+                   _1 -=
+                   experts_start_idx); // convert global indexes to local ones
+
+  thrust::device_ptr<int> temp_sequence =
+      thrust::device_pointer_cast(m->temp_sequence);
+  thrust::sequence(thrust::cuda::par.on(stream),
+                   temp_sequence,
+                   temp_sequence + (*non_zero_experts_count));
+
+  thrust::device_ptr<int> exp_local_label_to_index =
+      thrust::device_pointer_cast(m->exp_local_label_to_index);
+  thrust::scatter(thrust::cuda::par.on(stream),
+                  temp_sequence,
+                  temp_sequence + (*non_zero_experts_count),
+                  non_zero_expert_labels,
+                  exp_local_label_to_index);
+
+  // get local start index (within lower/upper bound) for each expert receiving
+  // non-zero tokens
+  thrust::device_ptr<int> expert_start_indexes =
+      thrust::device_pointer_cast(m->expert_start_indexes);
+  thrust::sequence(thrust::cuda::par.on(stream),
+                   expert_start_indexes,
+                   expert_start_indexes + (*num_valid_assignments));
+  *start_indexes = (thrust::unique_by_key_copy(thrust::cuda::par.on(stream),
+                                               lb,
+                                               ub,
+                                               expert_start_indexes,
+                                               temp_sequence,
+                                               expert_start_indexes))
+                       .first -
+                   temp_sequence;
+  assert((*start_indexes) == (*non_zero_experts_count));
+
+  // append ub_index
+  expert_start_indexes[(*start_indexes)] = (*ub_index);
+
+  // get number of token assignment to each expert
+  thrust::device_ptr<int> num_assignments_per_expert =
+      thrust::device_pointer_cast(m->num_assignments_per_expert);
+  thrust::transform(thrust::cuda::par.on(stream),
+                    expert_start_indexes + 1,
+                    expert_start_indexes + (*non_zero_experts_count) + 1,
+                    expert_start_indexes,
+                    num_assignments_per_expert,
+                    thrust::minus<int>());
+
+  // build destination_start_index array, telling us the first slot that belongs
+  // to each expert in the destination array (after factoring in expert
+  // capacity)
+  thrust::device_ptr<int> destination_start_indices =
+      thrust::device_pointer_cast(m->destination_start_indices);
+  thrust::replace_copy_if(thrust::cuda::par.on(stream),
+                          num_assignments_per_expert,
+                          num_assignments_per_expert +
+                              (*non_zero_experts_count),
+                          destination_start_indices,
+                          exceeds_expert_capacity(expert_capacity),
+                          expert_capacity);
+
+  cudaMemcpyAsync(m->capped_num_assignments_per_expert,
+                  m->destination_start_indices,
+                  (*non_zero_experts_count) * sizeof(int),
+                  cudaMemcpyDeviceToHost,
+                  stream);
+
+  *gemm_batch_count =
+      thrust::reduce(thrust::cuda::par.on(stream),
+                     destination_start_indices,
+                     destination_start_indices + (*non_zero_experts_count));
+
+  thrust::exclusive_scan(thrust::cuda::par.on(stream),
+                         destination_start_indices,
+                         destination_start_indices + (*non_zero_experts_count),
+                         destination_start_indices,
+                         0);
+}
+
+__global__ void experts_forward_prepare_kernel(
+    int num_valid_assignments,
+    int expert_capacity,
+    int lb_index,
+    int experts_start_idx,
+    int num_experts_per_block,
+    int num_chosen_experts,
+    int data_dim,
+    int out_dim,
+    bool use_bias,
+    int *sorted_indices,
+    int *expert_start_indexes,
+    int *exp_local_label_to_index,
+    int *destination_start_indices,
+    int *original_indices,
+    float const *input, // @In: Tokens' values (in_dim, batch_size)
+    float *output,
+    float const **token_idx_array,  // @Out: Barray for GemmBatchedEx
+    float const **weights,          // @In: Experts' weights
+    float const **weight_idx_array, // @Out: Aarray for GemmBatchedEx
+    float const **bias_idx_array,   // @Out: Experts' bias
+    float const *coefficients,      // @In: topk_gate_predss coefficients tensor
+                                    // (num_chosen_experts, batch_size)
+    float const **coefficient_idx_array, // @Out: Barray for Aggregation
+    float **output_idx_array) {
+
+  CUDA_KERNEL_LOOP(i, num_valid_assignments) {
+    int global_expert_label = sorted_indices[lb_index + i];
+    assert(global_expert_label >= experts_start_idx &&
+           global_expert_label < experts_start_idx + num_experts_per_block);
+    int local_expert_label = global_expert_label - experts_start_idx;
+    int expert_index = exp_local_label_to_index[local_expert_label];
+    int within_expert_offset = i - expert_start_indexes[expert_index];
+    if (within_expert_offset < expert_capacity) {
+      int rev_idx = original_indices[i + lb_index];
+      int token_idx = (rev_idx / num_chosen_experts);
+
+      token_idx_array[destination_start_indices[expert_index] +
+                      within_expert_offset] = &input[token_idx * data_dim];
+      weight_idx_array[destination_start_indices[expert_index] +
+                       within_expert_offset] =
+          weights[local_expert_label * (1 + use_bias)];
+      if (use_bias) {
+        bias_idx_array[destination_start_indices[expert_index] +
+                       within_expert_offset] =
+            weights[local_expert_label * (1 + use_bias) + use_bias];
+      }
+      coefficient_idx_array[destination_start_indices[expert_index] +
+                            within_expert_offset] = &coefficients[rev_idx];
+      output_idx_array[destination_start_indices[expert_index] +
+                       within_expert_offset] = &output[token_idx * out_dim];
+    }
+  }
+}
+
+bool use_activation(ActiMode mode) {
+  switch (mode) {
+    case AC_MODE_RELU:
+    case AC_MODE_SIGMOID:
+    case AC_MODE_TANH:
+      return true;
+    case AC_MODE_NONE:
+      return false;
+    default:
+      assert(0);
+      break;
+  }
+  return false;
+}
+
+void experts_forward_GemmBatched_kernel(ExpertsMeta const *m,
+                                        void const **weights_ptr,
+                                        void const **input_ptr,
+                                        void **results_ptr,
+                                        void const **bias_ptr,
+                                        ActiMode activation,
+                                        int in_dim,
+                                        int out_dim,
+                                        int num_tokens,
+                                        int num_chosen_experts,
+                                        int gemm_batch_count,
+                                        int non_zero_experts_count,
+                                        ffStream_t stream) {
+
+  checkCUDA(cublasSetStream(m->handle.blas, stream));
+  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
+
+  float alpha = 1.0f, beta = 0.0f;
+
+  // cudaDataType_t input_type = ff_to_cuda_datatype(m->input_type);
+  // cudaDataType_t weight_type = ff_to_cuda_datatype(m->weight_type);
+  // cudaDataType_t output_type = ff_to_cuda_datatype(m->output_type);
+  cudaDataType_t input_type = CUDA_R_32F;
+  cudaDataType_t weight_type = CUDA_R_32F;
+  cudaDataType_t output_type = CUDA_R_32F;
+
+  cublasComputeType_t compute_type = CUBLAS_COMPUTE_32F;
+
+  checkCUDA(cublasGemmBatchedEx(
+      m->handle.blas,
+      CUBLAS_OP_T, // Tranpose Weight, shape (in_dim, out_dim) => (out_dim,
+                   // in_dim)
+      CUBLAS_OP_N, // Input_token, shape (in_dim, 1)
+      out_dim,     // num_row of (A, C) = out_dim
+      1,           // num_col of (B, C) = 1
+      in_dim,      // num_col of A and num_rows of B = in_dim
+      &alpha,
+      weights_ptr, // Aarray (num_tokens * chosen_experts, in_dim, out_dim)
+      weight_type,
+      in_dim,    // Leading Dimension of weight before transpose
+      input_ptr, // Barray (num_tokens * chosen_experts, in_dim, 1)
+      input_type,
+      in_dim, // Leading Dimension of input_token
+      &beta,
+      results_ptr, // Carray (num_tokens * chosen_experts, out_dim, 1)
+      output_type,
+      out_dim,          // Leading Dimension of output
+      gemm_batch_count, // Total submatrixes
+      compute_type,
+      CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
+  // TODO 2: bias and activations
+  if (m->use_bias) {
+    checkCUDA(cublasGemmBatchedEx(
+        m->handle.blas,
+        CUBLAS_OP_T, // Bias, shape (out_dim, 1)
+        CUBLAS_OP_N, // Coefficient, shape (1, 1)
+        out_dim,     // num_row of (A, C) = out_dim
+        1,           // num_col of (B, C) = 1
+        1,           // num_col of A and num_rows of B = 1
+        &alpha,
+        bias_ptr, // bias tensor (out_dim, 1)
+        weight_type,
+        out_dim,                         // Leading Dimension of bias tensor
+        (void const **)m->one_ptr_array, // all-one tensor (1, 1)
+        CUDA_R_32F,
+        1, // Leading Dimension of all-one tensor
+        &alpha,
+        results_ptr, // Carray (num_tokens * chosen_experts, out_dim, 1)
+        output_type,
+        out_dim,          // Leading Dimension of output
+        gemm_batch_count, // Total submatrixs
+        compute_type,
+        CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+  }
+
+  if (use_activation(activation)) {
+    checkCUDNN(cudnnActivationForward(m->handle.dnn,
+                                      m->actiDesc,
+                                      &alpha,
+                                      m->resultTensorDesc,
+                                      m->batch_outputs[0],
+                                      &beta,
+                                      m->resultTensorDesc,
+                                      m->batch_outputs[0]));
+  }
+}
+
+__global__ void experts_forward_aggregate_kernel(int num_tokens,
+                                                 int gemm_batch_count,
+                                                 int out_dim,
+                                                 float *output,
+                                                 float **results_ptr,
+                                                 float const **coefficient_ptr,
+                                                 float **output_ptr) {
+
+  CUDA_KERNEL_LOOP(i, num_tokens * out_dim) {
+    output[i] = 0.0f;
+  }
+
+  __syncthreads();
+
+  CUDA_KERNEL_LOOP(i, gemm_batch_count * out_dim) {
+    int token_index = i / out_dim;
+    int emb_index = i % out_dim;
+    float res =
+        results_ptr[token_index][emb_index] * (*coefficient_ptr[token_index]);
+    atomicAdd(output_ptr[token_index] + emb_index, res);
+  }
+}
+
 /*static*/
 void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                      float const *input,
@@ -31,14 +382,6 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
-  int expert_capacity =
-      ceil(m->alpha * chosen_experts / m->num_experts * batch_size);
-
-  int num_experts = m->num_experts;
-  // int expert_start_index = experts_start_idx;
-  bool use_bias = m->use_bias;
-  // ActiMode activation = m->activation;
-
   cudaEvent_t t_start, t_end;
   if (m->profiling) {
     cudaEventCreate(&t_start);
@@ -46,23 +389,116 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
     cudaEventRecord(t_start, stream);
   }
 
+  int num_experts_per_block = m->num_experts;
+  int experts_start_idx = m->experts_start_idx;
+  bool use_bias = m->use_bias;
+  ActiMode activation = m->activation;
+  int data_dim = m->data_dim;
+  int num_chosen_experts = m->num_chosen_experts;
+  int num_tokens = m->effective_batch_size;
+  int expert_capacity = m->expert_capacity;
+
+  assert(chosen_experts == num_chosen_experts);
+  assert(num_tokens == batch_size);
+  assert(out_dim == m->out_dim);
+
+  // TODO: remove this once we condense all weights in a single tensor
+  // currently each weight matrix is placed on GPU by Legion, but the array
+  // holding the pointers to each weight matrix is on CPU
   cudaMemcpy(m->dev_weights,
              weights,
-             num_experts * (1 + use_bias) * sizeof(float *),
+             num_experts_per_block * (1 + use_bias) * sizeof(float *),
              cudaMemcpyHostToDevice);
 
-  /** TODO: launch one or more kernel(s) to do the following:
-   * 1. sort the tokens by expert to which they are assigned. This will require
-   * replicating tokens when chosen_experts > 1
-   * 2. matrix multiply (you can use cublasGemmEx) each slice of tokens with the
-   * corresponding expert's weights tensor. Add the bias.
-   *      - you can obtain the slice by selecting the tokens between the index
-   * where the expert i starts and min(i+expert_capacity, index where expert i+1
-   * starts)
-   * 3. reorder the outputs by token, and aggregate the outputs of multiple
-   * experts for the same token by computing an average weighted by the
-   * appropriate coefficient from the topk_gate_preds matrix.
-   */
+  int num_indices = num_tokens * num_chosen_experts;
+  // values below are set by Thrust in the experts_forward_thrust_wrapper
+  // function
+  int lb_index = 0;
+  int ub_index = 0;
+  int num_valid_assignments = 0;
+  int non_zero_experts_count = 0;
+  int start_indexes = 0;
+  int gemm_batch_count = 0;
+
+  experts_forward_thrust_wrapper(m,
+                                 indices,
+                                 num_indices,
+                                 experts_start_idx,
+                                 num_experts_per_block,
+                                 expert_capacity,
+                                 &lb_index,
+                                 &ub_index,
+                                 &num_valid_assignments,
+                                 &non_zero_experts_count,
+                                 &start_indexes,
+                                 &gemm_batch_count,
+                                 stream);
+
+  cudaStreamSynchronize(stream);
+
+  if (num_valid_assignments == 0) {
+    return;
+  }
+
+  experts_forward_prepare_kernel<<<GET_BLOCKS(num_valid_assignments),
+                                   min(CUDA_NUM_THREADS,
+                                       (int)num_valid_assignments),
+                                   0,
+                                   stream>>>(num_valid_assignments,
+                                             expert_capacity,
+                                             lb_index,
+                                             experts_start_idx,
+                                             num_experts_per_block,
+                                             num_chosen_experts,
+                                             data_dim,
+                                             out_dim,
+                                             use_bias,
+                                             m->sorted_indices,
+                                             m->expert_start_indexes,
+                                             m->exp_local_label_to_index,
+                                             m->destination_start_indices,
+                                             m->original_indices,
+                                             input,
+                                             output,
+                                             m->token_idx_array,
+                                             m->dev_weights,
+                                             m->weight_idx_array,
+                                             m->bias_idx_array,
+                                             topk_gate_preds,
+                                             m->coefficient_idx_array,
+                                             m->output_idx_array);
+
+  cudaStreamSynchronize(stream);
+
+  experts_forward_GemmBatched_kernel(m,
+                                     (void const **)m->weight_idx_array,
+                                     (void const **)m->token_idx_array,
+                                     (void **)m->dev_batch_outputs,
+                                     (void const **)m->bias_idx_array,
+                                     activation,
+                                     data_dim,
+                                     out_dim,
+                                     num_tokens,
+                                     num_chosen_experts,
+                                     gemm_batch_count,
+                                     non_zero_experts_count,
+                                     stream);
+
+  cudaStreamSynchronize(stream);
+
+  int aggregation_parallelism =
+      std::max(num_tokens, gemm_batch_count) * out_dim;
+  experts_forward_aggregate_kernel<<<GET_BLOCKS(aggregation_parallelism),
+                                     min(CUDA_NUM_THREADS,
+                                         (int)aggregation_parallelism),
+                                     0,
+                                     stream>>>(num_tokens,
+                                               gemm_batch_count,
+                                               out_dim,
+                                               output,
+                                               m->dev_batch_outputs,
+                                               m->coefficient_idx_array,
+                                               m->output_idx_array);
 
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
@@ -78,17 +514,146 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
 ExpertsMeta::ExpertsMeta(FFHandler handler,
                          int _num_experts,
                          int _experts_start_idx,
+                         int _data_dim,
+                         int _out_dim,
+                         int _effective_batch_size,
+                         int _num_chosen_experts,
                          float _alpha,
                          bool _use_bias,
                          ActiMode _activation)
     : OpMeta(handler), num_experts(_num_experts),
-      experts_start_idx(_experts_start_idx), alpha(_alpha), use_bias(_use_bias),
-      activation(_activation) {
+      experts_start_idx(_experts_start_idx), data_dim(_data_dim),
+      out_dim(_out_dim), effective_batch_size(_effective_batch_size),
+      num_chosen_experts(_num_chosen_experts), alpha(_alpha),
+      use_bias(_use_bias), activation(_activation) {
+  expert_capacity =
+      ceil(alpha * num_chosen_experts / num_experts * effective_batch_size);
+
+  checkCUDA(
+      cudaMalloc(&sorted_indices,
+                 num_chosen_experts * effective_batch_size * sizeof(int)));
+  checkCUDA(
+      cudaMalloc(&original_indices,
+                 num_chosen_experts * effective_batch_size * sizeof(int)));
+  checkCUDA(cudaMalloc(&non_zero_expert_labels, num_experts * sizeof(int)));
+  checkCUDA(cudaMalloc(
+      &temp_sequence,
+      std::max(num_experts, num_chosen_experts * effective_batch_size) *
+          sizeof(int)));
+  checkCUDA(cudaMalloc(&exp_local_label_to_index, num_experts * sizeof(int)));
+  // expert_start_indexes needs one more slot to save the upper bound index
+  checkCUDA(cudaMalloc(&expert_start_indexes, (num_experts + 1) * sizeof(int)));
+  checkCUDA(cudaMalloc(&num_assignments_per_expert, num_experts * sizeof(int)));
+  capped_num_assignments_per_expert = (int *)malloc(num_experts * sizeof(int));
+  checkCUDA(cudaMalloc(&destination_start_indices, num_experts * sizeof(int)));
+
+  checkCUDA(
+      cudaMalloc(&token_idx_array,
+                 num_chosen_experts * effective_batch_size * sizeof(float *)));
   checkCUDA(
       cudaMalloc(&dev_weights, num_experts * (1 + use_bias) * sizeof(float *)));
+  checkCUDA(
+      cudaMalloc(&weight_idx_array,
+                 num_chosen_experts * effective_batch_size * sizeof(float *)));
+  checkCUDA(
+      cudaMalloc(&bias_idx_array,
+                 num_chosen_experts * effective_batch_size * sizeof(float *)));
+  checkCUDA(
+      cudaMalloc(&coefficient_idx_array,
+                 num_chosen_experts * effective_batch_size * sizeof(float *)));
+  checkCUDA(
+      cudaMalloc(&output_idx_array,
+                 num_chosen_experts * effective_batch_size * sizeof(float *)));
+  batch_outputs = new float *[num_chosen_experts * effective_batch_size];
+  checkCUDA(cudaMalloc(&batch_outputs[0],
+                       out_dim * num_chosen_experts * effective_batch_size *
+                           sizeof(float)));
+  for (int i = 1; i < num_chosen_experts * effective_batch_size; i++) {
+    batch_outputs[i] = batch_outputs[i - 1] + out_dim * sizeof(float);
+  }
+  checkCUDA(
+      cudaMalloc(&dev_batch_outputs,
+                 num_chosen_experts * effective_batch_size * sizeof(float *)));
+  checkCUDA(
+      cudaMemcpy(dev_batch_outputs,
+                 batch_outputs,
+                 num_chosen_experts * effective_batch_size * sizeof(float *),
+                 cudaMemcpyHostToDevice));
+  // Bias
+  float *dram_one_ptr = (float *)malloc(sizeof(float) * 1);
+  for (int i = 0; i < 1; i++) {
+    dram_one_ptr[i] = 1.0f;
+  }
+  float *fb_one_ptr;
+  checkCUDA(cudaMalloc(&fb_one_ptr, sizeof(float) * 1));
+  checkCUDA(cudaMemcpy(
+      fb_one_ptr, dram_one_ptr, sizeof(float) * 1, cudaMemcpyHostToDevice));
+  one_ptr = (float const *)fb_one_ptr;
+  free((void *)dram_one_ptr);
+  checkCUDA(
+      cudaMalloc(&one_ptr_array,
+                 num_chosen_experts * effective_batch_size * sizeof(float *)));
+  for (int i = 0; i < num_chosen_experts * effective_batch_size; i++) {
+    checkCUDA(cudaMemcpy(&one_ptr_array[i],
+                         &fb_one_ptr,
+                         sizeof(float *),
+                         cudaMemcpyHostToDevice));
+  }
+  // Activation
+  checkCUDNN(cudnnCreateActivationDescriptor(&actiDesc));
+  checkCUDNN(cudnnCreateTensorDescriptor(&resultTensorDesc));
+  if (use_activation(activation)) {
+    cudnnActivationMode_t mode;
+    switch (activation) {
+      case AC_MODE_RELU:
+        mode = CUDNN_ACTIVATION_RELU;
+        break;
+      case AC_MODE_SIGMOID:
+        mode = CUDNN_ACTIVATION_SIGMOID;
+        break;
+      default:
+        // Unsupported activation mode
+        assert(false);
+    }
+    checkCUDNN(
+        cudnnSetActivationDescriptor(actiDesc, mode, CUDNN_PROPAGATE_NAN, 0.0));
+    checkCUDNN(
+        cudnnSetTensor4dDescriptor(resultTensorDesc,
+                                   CUDNN_TENSOR_NCHW,
+                                   // CUDNN_DATA_FLOAT,
+                                   cuda_to_cudnn_datatype(CUDA_R_32F),
+                                   num_chosen_experts * effective_batch_size,
+                                   out_dim,
+                                   1,
+                                   1));
+  }
 }
 ExpertsMeta::~ExpertsMeta(void) {
-  checkCUDA(cudaFree(&dev_weights));
+
+  checkCUDA(cudaFree(sorted_indices));
+  checkCUDA(cudaFree(original_indices));
+  checkCUDA(cudaFree(non_zero_expert_labels));
+  checkCUDA(cudaFree(temp_sequence));
+  checkCUDA(cudaFree(exp_local_label_to_index));
+  checkCUDA(cudaFree(expert_start_indexes));
+  checkCUDA(cudaFree(num_assignments_per_expert));
+  free(capped_num_assignments_per_expert);
+  checkCUDA(cudaFree(destination_start_indices));
+  checkCUDA(cudaFree(token_idx_array));
+  checkCUDA(cudaFree(dev_weights));
+  checkCUDA(cudaFree(weight_idx_array));
+  checkCUDA(cudaFree(coefficient_idx_array));
+  checkCUDA(cudaFree(output_idx_array));
+  checkCUDA(cudaFree(dev_batch_outputs));
+  checkCUDA(cudaFree(bias_idx_array));
+  checkCUDA(cudaFree(batch_outputs[0]));
+  delete[] batch_outputs;
+  // Bias
+  checkCUDA(cudaFree((void *)one_ptr));
+  checkCUDA(cudaFree((void *)one_ptr_array));
+  // Activation
+  checkCUDNN(cudnnDestroyActivationDescriptor(actiDesc));
+  checkCUDNN(cudnnDestroyTensorDescriptor(resultTensorDesc));
 }
 
 }; // namespace FlexFlow
diff --git a/src/runtime/cuda_helper.cu b/src/runtime/cuda_helper.cu
index 53e61b90d9..1da2e492ed 100644
--- a/src/runtime/cuda_helper.cu
+++ b/src/runtime/cuda_helper.cu
@@ -318,6 +318,34 @@ cudaDataType_t ff_to_cuda_datatype(DataType type) {
   return CUDA_R_32F;
 }
 
+cudaDataType_t cudnn_to_cuda_datatype(cudnnDataType_t type) {
+  switch (type) {
+    case CUDNN_DATA_FLOAT:
+      return CUDA_R_32F;
+    case CUDNN_DATA_DOUBLE:
+      return CUDA_R_64F;
+    case CUDNN_DATA_INT32:
+      return CUDA_R_32I;
+    default:
+      assert(false && "Unsupported cuda data type");
+  }
+  return CUDA_R_32F;
+}
+
+cudnnDataType_t cuda_to_cudnn_datatype(cudaDataType_t type) {
+  switch (type) {
+    case CUDA_R_32F:
+      return CUDNN_DATA_FLOAT;
+    case CUDA_R_64F:
+      return CUDNN_DATA_DOUBLE;
+    case CUDA_R_32I:
+      return CUDNN_DATA_INT32;
+    default:
+      assert(false && "Unsupported cudnn data type");
+  }
+  return CUDNN_DATA_FLOAT;
+}
+
 template __global__ void
     assign_kernel<half>(half *ptr, coord_t size, half value);
 template __global__ void

From 9c879159090b77e3cd19f7f493733e7ac08ae6f1 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Fri, 10 Mar 2023 23:32:19 +0000
Subject: [PATCH 072/344] [BatchConfig] make num_active_requests and
 num_activate_tokens const functions

---
 include/flexflow/batch_config.h |  5 ++--
 src/runtime/batch_config.cc     | 44 +++++++++++++++++++--------------
 2 files changed, 28 insertions(+), 21 deletions(-)

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 558e7841b5..c2a77cf3d6 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -30,8 +30,9 @@ class BatchConfig {
   bool register_new_request(size_t guid, int length);
   void prepare_next_batch();
   int update_results(InferenceResult const &ir);
-  int num_active_requests();
-  int num_active_tokens();
+  bool update_num_active_requests_tokens();
+  int num_active_requests() const;
+  int num_active_tokens() const;
   static int const MAX_NUM_REQUESTS = 256;
   static int const MAX_NUM_TOKENS = InferenceResult::MAX_NUM_TOKENS;
   static int const MAX_SEQUENCE_LENGTH = 1024;
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index 99c3a18b63..936590905b 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -29,6 +29,7 @@ BatchConfig::BatchConfig() {
     request_completed[i] = true;
     num_processing_tokens[i] = 0;
   }
+  update_num_active_requests_tokens();
 }
 
 int BatchConfig::update_results(InferenceResult const &ir) {
@@ -71,6 +72,7 @@ int BatchConfig::update_results(InferenceResult const &ir) {
     }
     num_processing_tokens[i] = 0;
   }
+  update_num_active_requests_tokens();
   return completed;
 }
 
@@ -84,15 +86,17 @@ bool BatchConfig::register_new_request(size_t guid, int length) {
       request_guid[i] = guid;
       num_processing_tokens[i] = 0;
       request_completed[i] = false;
+      update_num_active_requests_tokens();
       return true;
     }
   }
+  update_num_active_requests_tokens();
   return false;
 }
 
 void BatchConfig::prepare_next_batch() {
   cached_results = false;
-  int num_tokens = 0;
+  int count = 0;
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
     if (request_completed[i]) {
       continue;
@@ -104,15 +108,13 @@ void BatchConfig::prepare_next_batch() {
     } else {
       num_processing_tokens[i] = MAX_NUM_TOKENS - num_tokens;
     }
-    num_tokens += num_processing_tokens[i];
+    count += num_processing_tokens[i];
   }
-  log_bc.print("[NextBatch] num_tokens(%d)", num_tokens);
+  update_num_active_requests_tokens();
+  log_bc.print("[NextBatch] num_tokens(%d)", count);
 }
 
-int BatchConfig::num_active_requests() {
-  if (cached_results) {
-    return num_requests;
-  }
+bool BatchConfig::update_num_active_requests_tokens() {
   num_requests = 0;
   num_tokens = 0;
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
@@ -122,23 +124,27 @@ int BatchConfig::num_active_requests() {
     }
   }
   cached_results = true;
-  return num_requests;
+  return true;
 }
 
-int BatchConfig::num_active_tokens() {
+int BatchConfig::num_active_requests() const {
   if (cached_results) {
-    return num_tokens;
+    return num_requests;
+  } else {
+    assert(false &&
+           "some BatchConfig functions updated requests but didn't call "
+           "update_num_active_requests_tokens() before exit");
   }
-  num_requests = 0;
-  num_tokens = 0;
-  for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
-    if (!request_completed[i]) {
-      num_requests++;
-      num_tokens += num_processing_tokens[i];
-    }
+}
+
+int BatchConfig::num_active_tokens() const {
+  if (cached_results) {
+    return num_tokens;
+  } else {
+    assert(false &&
+           "some BatchConfig functions updated requests but didn't call "
+           "update_num_active_requests_tokens() before exit");
   }
-  cached_results = true;
-  return num_tokens;
 }
 
 }; // namespace FlexFlow

From 0f8ce7682eeeb1e5b970c30d2896fbec5edada08 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 10 Mar 2023 19:00:04 -0500
Subject: [PATCH 073/344] removed unnecessary array

---
 src/ops/experts.cu | 10 ----------
 1 file changed, 10 deletions(-)

diff --git a/src/ops/experts.cu b/src/ops/experts.cu
index c74c77b399..803d6da6c4 100644
--- a/src/ops/experts.cu
+++ b/src/ops/experts.cu
@@ -170,12 +170,6 @@ void experts_forward_thrust_wrapper(ExpertsMeta const *m,
                           exceeds_expert_capacity(expert_capacity),
                           expert_capacity);
 
-  cudaMemcpyAsync(m->capped_num_assignments_per_expert,
-                  m->destination_start_indices,
-                  (*non_zero_experts_count) * sizeof(int),
-                  cudaMemcpyDeviceToHost,
-                  stream);
-
   *gemm_batch_count =
       thrust::reduce(thrust::cuda::par.on(stream),
                      destination_start_indices,
@@ -269,7 +263,6 @@ void experts_forward_GemmBatched_kernel(ExpertsMeta const *m,
                                         int num_tokens,
                                         int num_chosen_experts,
                                         int gemm_batch_count,
-                                        int non_zero_experts_count,
                                         ffStream_t stream) {
 
   checkCUDA(cublasSetStream(m->handle.blas, stream));
@@ -481,7 +474,6 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                      num_tokens,
                                      num_chosen_experts,
                                      gemm_batch_count,
-                                     non_zero_experts_count,
                                      stream);
 
   cudaStreamSynchronize(stream);
@@ -544,7 +536,6 @@ ExpertsMeta::ExpertsMeta(FFHandler handler,
   // expert_start_indexes needs one more slot to save the upper bound index
   checkCUDA(cudaMalloc(&expert_start_indexes, (num_experts + 1) * sizeof(int)));
   checkCUDA(cudaMalloc(&num_assignments_per_expert, num_experts * sizeof(int)));
-  capped_num_assignments_per_expert = (int *)malloc(num_experts * sizeof(int));
   checkCUDA(cudaMalloc(&destination_start_indices, num_experts * sizeof(int)));
 
   checkCUDA(
@@ -637,7 +628,6 @@ ExpertsMeta::~ExpertsMeta(void) {
   checkCUDA(cudaFree(exp_local_label_to_index));
   checkCUDA(cudaFree(expert_start_indexes));
   checkCUDA(cudaFree(num_assignments_per_expert));
-  free(capped_num_assignments_per_expert);
   checkCUDA(cudaFree(destination_start_indices));
   checkCUDA(cudaFree(token_idx_array));
   checkCUDA(cudaFree(dev_weights));

From 41343bb00afee0672b1d1d8798581c96facb99d2 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sat, 18 Mar 2023 04:06:13 -0400
Subject: [PATCH 074/344] [Inference] - Load data using BatchConfig (#656)

* update dataloader, inference loop

* fix

* linting

* fixes

* update dataloader, remove duplicate files

* fix bugs

* fix

* backup

* revert inf manager changes

* backup

* bakcup

* bug fix
---
 examples/cpp/inference/data_generator.cc      | 187 +++++----
 examples/cpp/inference/data_generator.cpp     |  50 ++-
 examples/cpp/inference/data_generator.h       |  62 ++-
 examples/cpp/inference/dataloader.cc          | 187 +++++++++
 examples/cpp/inference/dataloader.cu          | 108 +++++
 examples/cpp/inference/dataloader.h           |  61 +++
 examples/cpp/inference/gpt_tokenizer.cpp      |  15 +
 examples/cpp/inference/inference_config.h     |  69 ++++
 .../mixture_of_experts/CMakeLists.txt         |   7 +-
 .../mixture_of_experts/dataloader.cc          | 297 --------------
 .../mixture_of_experts/dataloader.cu          | 115 ------
 .../cpp/inference/mixture_of_experts/moe.cc   | 104 +++--
 .../cpp/inference/mixture_of_experts/moe.h    |  90 +---
 .../cpp/inference/transformers/CMakeLists.txt |   7 +-
 .../cpp/inference/transformers/dataloader.cc  | 388 ------------------
 .../cpp/inference/transformers/dataloader.cu  | 115 ------
 .../inference/transformers/transformers.cc    | 145 ++++---
 .../cpp/inference/transformers/transformers.h | 110 +----
 include/flexflow/batch_config.h               |  12 +-
 include/flexflow/operator.h                   |   1 -
 include/flexflow/ops/aggregate.h              |   1 -
 include/flexflow/ops/aggregate_spec.h         |   1 -
 include/flexflow/ops/attention.h              |   1 -
 include/flexflow/ops/element_binary.h         |   1 -
 include/flexflow/ops/experts.h                |   3 +-
 include/flexflow/ops/groupby.h                |   1 -
 .../ops/inc_multihead_self_attention.h        |   1 -
 include/flexflow/ops/layer_norm.h             |   1 -
 include/flexflow/ops/linear.h                 |   1 -
 include/flexflow/ops/noop.h                   |   1 -
 include/flexflow/ops/softmax.h                |   1 -
 include/flexflow/ops/topk.h                   |   1 -
 include/flexflow/parallel_ops/partition.h     |   1 -
 src/ops/aggregate.cc                          |   1 -
 src/ops/aggregate_spec.cc                     |   1 -
 src/ops/attention.cc                          |   1 -
 src/ops/element_binary.cc                     |   1 -
 src/ops/experts.cc                            |   1 -
 src/ops/group_by.cc                           |   1 -
 src/ops/inc_multihead_self_attention.cc       |   1 -
 src/ops/layer_norm.cc                         |   1 -
 src/ops/linear.cc                             |   1 -
 src/ops/noop.cc                               |   1 -
 src/ops/softmax.cc                            |   1 -
 src/ops/topk.cc                               |   1 -
 src/parallel_ops/partition.cc                 |   1 -
 src/runtime/batch_config.cc                   |   3 +-
 src/runtime/inference_manager.cc              |   3 +-
 48 files changed, 805 insertions(+), 1359 deletions(-)
 create mode 100644 examples/cpp/inference/dataloader.cc
 create mode 100644 examples/cpp/inference/dataloader.cu
 create mode 100644 examples/cpp/inference/dataloader.h
 create mode 100644 examples/cpp/inference/inference_config.h
 delete mode 100644 examples/cpp/inference/mixture_of_experts/dataloader.cc
 delete mode 100644 examples/cpp/inference/mixture_of_experts/dataloader.cu
 delete mode 100644 examples/cpp/inference/transformers/dataloader.cc
 delete mode 100644 examples/cpp/inference/transformers/dataloader.cu

diff --git a/examples/cpp/inference/data_generator.cc b/examples/cpp/inference/data_generator.cc
index 3e8daa7d41..961052537e 100644
--- a/examples/cpp/inference/data_generator.cc
+++ b/examples/cpp/inference/data_generator.cc
@@ -1,3 +1,18 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
 #include "data_generator.h"
 #include <algorithm>
 #include <iostream>
@@ -6,133 +21,133 @@ using namespace std;
 
 DataGenerator::DataGenerator(size_t _num_requests,
                              size_t _token_dim,
-                             size_t _sequence_length,
+                             size_t _min_input_tokens,
+                             size_t _max_input_tokens,
+                             size_t _min_tokens_to_generate,
+                             size_t _max_tokens_to_generate,
                              bool _poisson_distr,
                              double _lambda)
     : num_requests(_num_requests), token_dim(_token_dim),
-      sequence_length(_sequence_length), poisson_distr(_poisson_distr),
-      lambda(_lambda), timer_started(false), global_unique_id(1000000) {
-  generate_arrival_times();
-};
-
-void DataGenerator::generate_requests(float *req_ptr,
-                                      int *label_ptr,
-                                      int num_labels) {
-  assert(req_ptr != nullptr);
-  /* for (size_t i=0; i<num_requests; i++) {
-    for (size_t j=0; j<sequence_length; j++) {
-      for (size_t k=0; k<token_dim; k++) {
-        req_ptr[i * sequence_length + j] = (float)std::rand()/RAND_MAX;
-      }
-    }
-  } */
-  random_device rnd_device;
-  mt19937 mersenne_engine{rnd_device()};
-
-  uniform_real_distribution<float> float_dist{0, 1.0};
-  auto gen = [&float_dist, &mersenne_engine]() {
-    return float_dist(mersenne_engine);
-  };
-  std::generate(
-      req_ptr, req_ptr + token_dim * sequence_length * num_requests, gen);
-
-  if (label_ptr != nullptr) {
-    assert(num_labels > 0);
-    /* for (size_t i=0; i<num_requests; i++) {
-      for (size_t j=0; j<sequence_length; j++) {
-        label_ptr[i * sequence_length + j] = std::rand() % num_labels;
-      }
-    } */
-    uniform_int_distribution<int> int_dist{0, num_labels};
-    auto gen_label = [&int_dist, &mersenne_engine]() {
-      return int_dist(mersenne_engine);
-    };
-    std::generate(
-        label_ptr, label_ptr + sequence_length * num_requests, gen_label);
-  }
+      min_input_tokens(_min_input_tokens), max_input_tokens(_max_input_tokens),
+      min_tokens_to_generate(_min_tokens_to_generate),
+      max_tokens_to_generate(_max_tokens_to_generate),
+      poisson_distr(_poisson_distr), lambda(_lambda), timer_started(false) {
+  generate_requests_meta();
 };
 
-void DataGenerator::generate_arrival_times(void) {
-  // set up a uniform number generator with range [0,1)
-  random_device rnd;
-  mt19937 gen(rnd());
-  uniform_real_distribution<double> dist{0, 1.0};
+// generate each request's arrival time and sequence length
+void DataGenerator::generate_requests_meta() {
+  random_device rnd1, rnd2, rnd3;
+  mt19937 gen1(rnd1()), gen2(rnd2()), gen3(rnd3());
+  // set up a uniform number generator with range [0,1) (in seconds) for the
+  // arrival times
+  uniform_real_distribution<double> dist1{0, 1.0};
   double cur_arrival = 0; // assume first request comes in at time 0
+  // set up a uniform number generator for the initial/generated sequence length
+  uniform_int_distribution<unsigned long> dist2{min_input_tokens,
+                                                max_input_tokens};
+  uniform_int_distribution<unsigned long> dist3{min_tokens_to_generate,
+                                                max_tokens_to_generate};
+  size_t cur_seq_len = dist2(gen2);
+  size_t tokens_to_generate = dist3(gen3);
 
   for (size_t i = 0; i < num_requests; i++) {
     arrivals.push_back(cur_arrival);
     if (poisson_distr) {
-      double u = dist(gen);
+      double u = dist1(gen1);
       double interval = -(1 / lambda) * log(1 - u) * 1000;
       cur_arrival += interval;
     } else {
       cur_arrival += (1000 / lambda);
     }
+    seq_lengths.push_back(std::make_pair(cur_seq_len, tokens_to_generate));
+    cur_seq_len = dist2(gen2);
+    tokens_to_generate = dist3(gen3);
   }
   // cout << "Arrivals : [";
   // copy(arrivals.begin(), arrivals.end(), ostream_iterator<int>(cout, " "));
   // cout << "]" << endl;
 };
 
+void DataGenerator::generate_requests(float *req_ptr) {
+  assert(req_ptr != nullptr);
+  /* for (size_t i=0; i<num_requests; i++) {
+    for (size_t j=0; j<max_sequence_length; j++) {
+      for (size_t k=0; k<token_dim; k++) {
+        req_ptr[i * max_sequence_length + j] = (float)std::rand()/RAND_MAX;
+      }
+    }
+  } */
+  // faster generation assuming req_ptr points to a tensor with contiguous
+  // memory of size token_dim * max_input_tokens * num_requests, enough to
+  // contain all requests data
+  random_device rnd_device;
+  mt19937 mersenne_engine{rnd_device()};
+
+  uniform_real_distribution<float> float_dist{0, 1.0};
+  auto gen = [&float_dist, &mersenne_engine]() {
+    return float_dist(mersenne_engine);
+  };
+  std::generate(
+      req_ptr, req_ptr + token_dim * max_input_tokens * num_requests, gen);
+};
+
 void DataGenerator::start_timer(void) {
   arrivals_ptr = arrivals.begin();
   start_time = Clock::now();
   timer_started = true;
 };
 
-size_t DataGenerator::get_requests(
-    size_t max_num_requests,
-    std::vector<std::pair<size_t, std::vector<int>>> &prompts) {
+// In non-incremental mode, the number of requests we want is limited by the
+// tensor's batch size. As long as each request has a length that is shorter
+// than the tensor's max sequence length, we do not need to impose any
+// additional requirement on the max number of tokens across requests. We can
+// thus pass max_tokens = max_requests * tensor max sequence length as a
+// placeholder. In incremental mode, the max number of requests is only limited
+// by the BatchConfig request capacity (for storing each request's metadata),
+// whereas the total number number of tokens across requests will be limited by
+// the tensor's batch_size * sequence length.
+std::pair<size_t, size_t> DataGenerator::get_requests(size_t max_requests,
+                                                      size_t max_tokens) {
   if (!timer_started) {
     std::cout << "Warning: tried to get number of requests before the timer "
                  "was started."
               << std::endl;
-    return 0;
+    return std::make_pair(0, 0);
   }
   Clock::time_point cur_time = Clock::now();
   size_t ms_from_start =
       chrono::duration_cast<milliseconds>(cur_time - start_time).count();
-  vector<double>::iterator new_arrivals_ptr =
+  std::vector<double>::iterator new_arrivals_ptr =
       upper_bound(arrivals_ptr, arrivals.end(), ms_from_start);
-  size_t received_requests = new_arrivals_ptr - arrivals_ptr;
-  arrivals_ptr = new_arrivals_ptr;
-  if (received_requests > 0) {
-    std::cout << "received " << received_requests
-              << " request(s) by arrival time +" << ms_from_start << "ms"
-              << "\n";
-  }
-
-  for (size_t i = 0; i < received_requests; i++) {
-    int length = std::rand() % 10 + 5;
-    std::vector<int> prompt;
-    for (int j = 0; j < length; j++) {
-      prompt.push_back(j + 1000);
+  // number of new requests received
+  size_t received_requests = 0;
+  // id of first received request
+  size_t first_request_guid = arrivals_ptr - arrivals.begin();
+  size_t new_tokens = 0;
+  for (size_t j = 0;
+       j < std::min((size_t)(new_arrivals_ptr - arrivals_ptr), max_requests) &&
+       new_tokens < max_tokens;
+       j++) {
+    if (seq_lengths[first_request_guid + j].first <= max_tokens - new_tokens) {
+      received_requests++;
+      new_tokens += seq_lengths[first_request_guid + j].first;
     }
-    prompts.push_back(std::make_pair(global_unique_id++, prompt));
   }
-  assert(prompts.size() == received_requests);
-  return received_requests;
-}
+  std::advance(arrivals_ptr, received_requests);
 
-size_t DataGenerator::get_requests() {
-  if (!timer_started) {
-    std::cout << "Warning: tried to get number of requests before the timer "
-                 "was started."
-              << std::endl;
-    return 0;
-  }
-  Clock::time_point cur_time = Clock::now();
-  size_t ms_from_start =
-      chrono::duration_cast<milliseconds>(cur_time - start_time).count();
-  vector<double>::iterator new_arrivals_ptr =
-      upper_bound(arrivals_ptr, arrivals.end(), ms_from_start);
-  size_t received_requests = new_arrivals_ptr - arrivals_ptr;
-  arrivals_ptr = new_arrivals_ptr;
-  if (received_requests > 0) {
+  /* if (received_requests > 0) {
     std::cout << "received " << received_requests
               << " request(s) by arrival time +" << ms_from_start << "ms"
               << "\n";
-  }
+  } */
+
+  return std::make_pair(first_request_guid, received_requests);
+}
 
-  return received_requests;
+std::pair<size_t, size_t> DataGenerator::get_request_length(size_t guid) {
+  assert(seq_lengths.size() >
+         guid); // make sure the guid is valid (seq_lengths has an entry for the
+                // sequence with given guid)
+  return seq_lengths[guid];
 }
diff --git a/examples/cpp/inference/data_generator.cpp b/examples/cpp/inference/data_generator.cpp
index 9aeb9b49a9..4201e36915 100644
--- a/examples/cpp/inference/data_generator.cpp
+++ b/examples/cpp/inference/data_generator.cpp
@@ -18,43 +18,63 @@ int main(int argc, char const *argv[]) {
   cout << "Starting the Data DataGenerator!\n";
 
   // DataGenerator parameters
-  size_t total_requests = 256;
+  size_t total_requests = 2560;
   size_t token_dim = 16;
-  size_t sequence_length = 20;
+  size_t max_sequence_length = 512 + 128;
   bool use_poisson_distr = true;
   // average number of request arrivals per second
-  double lambda = 25;
-  int label_dims = 10;
+  double lambda = 250;
+
+  size_t min_input_tokens = 32, max_input_tokens = 512,
+         min_tokens_to_generate = 1, max_tokens_to_generate = 128;
 
   float *requests = (float *)calloc(
-      token_dim * sequence_length * total_requests, sizeof(float));
-  int *labels = (int *)calloc(sequence_length * total_requests, sizeof(int));
+      token_dim * max_sequence_length * total_requests, sizeof(float));
 
-  DataGenerator data_generator(
-      total_requests, token_dim, sequence_length, use_poisson_distr, lambda);
-  data_generator.generate_requests(requests, labels, label_dims);
+  DataGenerator data_generator(total_requests,
+                               token_dim,
+                               min_input_tokens,
+                               max_input_tokens,
+                               min_tokens_to_generate,
+                               max_tokens_to_generate,
+                               use_poisson_distr,
+                               lambda);
+  data_generator.generate_requests(requests);
   data_generator.start_timer();
 
-  size_t received_requests = data_generator.get_requests();
+  size_t received_requests = 0;
+  std::pair<size_t, size_t> reqs = data_generator.get_requests(0, 0);
+  size_t guid = reqs.first;
+  assert(reqs.second == 0);
+  this_thread::sleep_for(milliseconds(50));
+
+  reqs = data_generator.get_requests(2560, 2560 * (512));
+  received_requests += reqs.second;
   std::cout << "t=0ms: received " << received_requests << std::endl;
 
   this_thread::sleep_for(milliseconds(1200));
-  received_requests = data_generator.get_requests();
+  reqs = data_generator.get_requests(2560, 2560 * (512));
+  received_requests += reqs.second;
   std::cout << "t=1200ms: received " << received_requests << std::endl;
 
   this_thread::sleep_for(milliseconds(10));
-  received_requests = data_generator.get_requests();
+  reqs = data_generator.get_requests(2560, 2560 * (512));
+  received_requests += reqs.second;
   std::cout << "t=1210ms: received " << received_requests << std::endl;
 
   this_thread::sleep_for(milliseconds(4000));
-  received_requests = data_generator.get_requests();
+  reqs = data_generator.get_requests(2560, 2560 * (512));
+  received_requests += reqs.second;
   std::cout << "t=5210ms: received " << received_requests << std::endl;
   this_thread::sleep_for(milliseconds(5000));
-  received_requests = data_generator.get_requests();
+
+  reqs = data_generator.get_requests(2560, 2560 * (512));
+  received_requests += reqs.second;
   std::cout << "t=10210ms: received " << received_requests << std::endl;
 
   free(requests);
-  free(labels);
+
+  assert(received_requests == total_requests);
 
   return 0;
 }
diff --git a/examples/cpp/inference/data_generator.h b/examples/cpp/inference/data_generator.h
index 777c7cadd7..d83df8e1fe 100644
--- a/examples/cpp/inference/data_generator.h
+++ b/examples/cpp/inference/data_generator.h
@@ -1,4 +1,20 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
 #pragma once
+
 #include <cassert>
 #include <chrono>
 #include <ctime>
@@ -8,7 +24,9 @@
 #include <random>
 #include <thread>
 #include <unistd.h>
+
 using namespace std;
+
 typedef std::chrono::high_resolution_clock Clock;
 typedef std::chrono::milliseconds milliseconds;
 
@@ -16,39 +34,45 @@ class DataGenerator {
 public:
   DataGenerator(size_t _num_requests,
                 size_t _token_dim,
-                size_t _sequence_length,
+                size_t _min_input_tokens,
+                size_t _max_input_tokens,
+                size_t _min_tokens_to_generate,
+                size_t _max_tokens_to_generate,
                 bool _poisson_distr,
                 double _lambda);
 
   // Generate random requests by filling each token with random data. For now,
   // assume all requests have the same sequence length. Also generate random
   // labels (if label_ptr != nullptr and num_labels >0).
-  void generate_requests(float *req_ptr,
-                         int *label_ptr = nullptr,
-                         int num_labels = 0);
+  void generate_requests(float *req_ptr);
   void start_timer(void);
   // Get number of requests that have arrived since the last time this function
   // was called
-  size_t
-      get_requests(size_t max_num_requests,
-                   std::vector<std::pair<size_t, std::vector<int>>> &prompts);
-  size_t get_requests();
+  std::pair<size_t, size_t> get_requests(size_t max_requests,
+                                         size_t max_tokens);
+  std::pair<size_t, size_t> get_request_length(size_t guid);
+  // size_t max_sequence_length; // dimension of one request tensor
 
 private:
   // Compute the arrival times of each request and save them in the arrivals
   // vector.
-  void generate_arrival_times(void);
-
-  size_t num_requests;     // total number of requests
-  size_t token_dim;        // embedding dim of each token
-  size_t sequence_length;  // dimension of one request tensor
-  bool poisson_distr;      // false implies uniform distribution
-  double lambda;           // mean #num of arrivals per sec
-  bool timer_started;      // whether timer was initiated
-  size_t global_unique_id; // guid for requests
+  // void generate_arrival_times(void);
+  void generate_requests_meta();
+
+  size_t num_requests; // total number of requests
+  size_t token_dim;    // embedding dim of each token
+  size_t min_input_tokens;
+  size_t max_input_tokens;
+  size_t min_tokens_to_generate;
+  size_t max_tokens_to_generate;
+  bool poisson_distr; // false implies uniform distribution
+  double lambda;      // mean #num of arrivals per sec
+  bool timer_started; // whether timer was initiated
   // time when get_requests() is called for the first time
   Clock::time_point start_time;
   // arrival times (ms) generated based on distribution
-  vector<double> arrivals;
-  vector<double>::iterator arrivals_ptr;
+  std::vector<double> arrivals;
+  std::vector<double>::iterator arrivals_ptr;
+  // sequence lengths generated based on uniform distribution
+  std::vector<std::pair<size_t, size_t>> seq_lengths;
 };
diff --git a/examples/cpp/inference/dataloader.cc b/examples/cpp/inference/dataloader.cc
new file mode 100644
index 0000000000..ae7cb5ccd0
--- /dev/null
+++ b/examples/cpp/inference/dataloader.cc
@@ -0,0 +1,187 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "dataloader.h"
+#include "flexflow/inference.h"
+#include "inference_config.h"
+
+using namespace Legion;
+
+DataLoader::DataLoader(FFModel &ff,
+                       InferenceConfig const &inferenceConfig,
+                       DataGenerator &data_generator,
+                       ParallelTensor input) {
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+
+  int numdims = input->num_dims;
+  int replica_idx = numdims - 1;
+  int batch_idx = numdims - 2;
+  num_samples = inferenceConfig.total_requests;
+
+  // Create full input
+  {
+    batch_input = input;
+
+    ParallelDim dims[numdims];
+    for (int i = 0; i < numdims; i++) {
+      dims[i].size = input->dims[i].size;
+      dims[i].degree = 1;
+      dims[i].parallel_idx = -1;
+      dims[i].is_replica_dim = input->dims[i].is_replica_dim;
+      // Assume only the first dim can be the replica dim
+      assert(i == replica_idx || (!dims[i].is_replica_dim));
+    }
+    assert(dims[batch_idx].size == inferenceConfig.batch_size);
+    dims[batch_idx].size = num_samples;
+
+    full_input =
+        ff.create_parallel_tensor_legion_ordering(numdims, dims, DT_FLOAT);
+    ff.map_tensor(full_input, NULL /*parallel_op*/);
+  }
+
+  // Load entire dataset
+  // TODO: Use index launcher instead of task launcher
+  assert(full_input != nullptr && "full_input is nullptr");
+
+  DataLoaderInput dataloader_input = {inferenceConfig, data_generator};
+  DataLoaderInput const *ptr = &dataloader_input;
+
+  TaskLauncher launcher(CUSTOM_CPU_TASK_ID_1,
+                        TaskArgument(ptr, sizeof(DataLoaderInput)));
+  // regions[0]: full_input
+  launcher.add_region_requirement(RegionRequirement(full_input->region,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    full_input->region,
+                                                    MAP_TO_ZC_MEMORY));
+  launcher.add_field(0, FID_DATA);
+
+  runtime->execute_task(ctx, launcher);
+}
+
+void DataLoader::load_entire_dataset(Task const *task,
+                                     std::vector<PhysicalRegion> const &regions,
+                                     Context ctx,
+                                     Runtime *runtime) {
+  DataLoaderInput const input_struct = *((DataLoaderInput *)task->args);
+  InferenceConfig const &conf = input_struct._inferenceConfig;
+  DataGenerator &datagen = input_struct._data_generator;
+  assert(regions.size() == 1);
+  assert(task->regions.size() == regions.size());
+
+  // get input pointer
+  float *input_ptr = helperGetTensorPointerWO<float>(
+      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  Domain input_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  int input_dims = input_domain.get_dim();
+  for (int i = 0; i < input_dims; i++) {
+    int input_dim = input_domain.hi()[i] - input_domain.lo()[i] + 1;
+  }
+
+  if (conf.dataset_path.length() == 0) {
+    printf("Input dataset path is empty, using random input samples\n");
+    datagen.generate_requests(input_ptr);
+  } else {
+    // Load specific dataset
+  }
+}
+
+void DataLoader::next_batch(FFModel &ff, BatchConfig *bc) {
+  size_t num_active_tokens = bc->num_active_tokens();
+  if (num_active_tokens == 0) {
+    return;
+  }
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  // Load input
+  {
+    Domain domain =
+        runtime->get_index_space_domain(ctx, batch_input->parallel_is);
+    ArgumentMap argmap;
+    // No partitioning of the batch input token in inference mode
+    int input_dims = batch_input->num_dims;
+    for (int i = 0; i < input_dims; i++) {
+      assert(batch_input->dims[i].degree == 1 &&
+             "Dataloader does not support input token partitioning in "
+             "inference mode");
+    }
+    int batch_size = batch_input->dims[input_dims - 2].size;
+    int seq_len = batch_input->dims[input_dims - 3].size;
+    assert(ff.config.batchSize == batch_size &&
+           batch_size * seq_len >= num_active_tokens);
+    for (Domain::DomainPointIterator it(domain); it; it++) {
+      SampleIdxs meta;
+      meta.num_samples = num_active_tokens;
+      meta.incremental_mode = bc->incremental_mode;
+      int token_index = 0;
+      for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
+        if (bc->request_completed[i]) {
+          continue;
+        } else {
+          for (int j = 0; j < bc->num_processing_tokens[i]; j++) {
+            meta.guids[token_index] = bc->request_guid[i];
+            meta.idxs[token_index] = bc->token_start_idx[i] + j;
+            token_index++;
+          }
+        }
+      }
+      assert(token_index == num_active_tokens);
+      argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
+    }
+    IndexLauncher launcher(CUSTOM_GPU_TASK_ID_1,
+                           batch_input->parallel_is,
+                           TaskArgument(NULL, 0),
+                           argmap,
+                           Predicate::TRUE_PRED,
+                           false /*must*/,
+                           0 /*mapper_id*/,
+                           batch_input->machine_view.hash());
+    launcher.add_region_requirement(RegionRequirement(full_input->region,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      full_input->region,
+                                                      MAP_TO_ZC_MEMORY));
+    launcher.add_field(0, FID_DATA);
+    launcher.add_region_requirement(RegionRequirement(batch_input->part,
+                                                      0 /*projection id*/,
+                                                      WRITE_ONLY,
+                                                      EXCLUSIVE,
+                                                      batch_input->region));
+    launcher.add_field(1, FID_DATA);
+    runtime->execute_index_space(ctx, launcher);
+  }
+}
+
+void FlexFlow::register_custom_tasks() {
+  // Load entire dataset
+  {
+    TaskVariantRegistrar registrar(CUSTOM_CPU_TASK_ID_1, "Load Entire Dataset");
+    registrar.add_constraint(ProcessorConstraint(Processor::LOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<DataLoader::load_entire_dataset>(
+        registrar, "Load Entire Dataset Task");
+  }
+  // Load input
+  {
+    TaskVariantRegistrar registrar(CUSTOM_GPU_TASK_ID_1, "Load Inputs");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<DataLoader::load_input>(
+        registrar, "Load Input Task");
+  }
+}
diff --git a/examples/cpp/inference/dataloader.cu b/examples/cpp/inference/dataloader.cu
new file mode 100644
index 0000000000..6f8c6c19ad
--- /dev/null
+++ b/examples/cpp/inference/dataloader.cu
@@ -0,0 +1,108 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "dataloader.h"
+#include "flexflow/utils/cuda_helper.h"
+
+void DataLoader::load_input(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+  SampleIdxs *meta = (SampleIdxs *)task->local_args;
+  if (meta->num_samples == 0) {
+    return;
+  }
+  float const *full_input_ptr = helperGetTensorPointerRO<float>(
+      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  float *batch_input_ptr = helperGetTensorPointerWO<float>(
+      regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  Domain full_input_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  Domain batch_input_domain = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+
+  coord_t token_dim =
+      batch_input_domain.hi()[0] - batch_input_domain.lo()[0] + 1;
+  coord_t sequence_length =
+      batch_input_domain.hi()[1] - batch_input_domain.lo()[1] + 1;
+  coord_t batch_size =
+      batch_input_domain.hi()[2] - batch_input_domain.lo()[2] + 1;
+  coord_t full_input_sequence_length =
+      full_input_domain.hi()[1] - full_input_domain.lo()[1] + 1;
+  assert(sequence_length == full_input_sequence_length);
+
+  // Currently assume continous indices
+  assert(meta->num_samples <= batch_size * sequence_length);
+  for (int i = 1; i < meta->num_samples; i++) {
+    if (meta->guids[i] == meta->guids[i - 1]) {
+      assert(meta->idxs[i] == meta->idxs[i - 1] + 1);
+    }
+  }
+  // keep things simple for now
+  assert(batch_input_domain.get_volume() ==
+         batch_size * sequence_length * token_dim);
+
+  // pad inputs if needed (this is really only useful for debugging)
+  checkCUDA(cudaMemset(
+      batch_input_ptr, 0, batch_input_domain.get_volume() * sizeof(float)));
+
+  if (!meta->incremental_mode) {
+    size_t num_requests = 0;
+    size_t guid;
+    for (size_t i = 0; i < meta->num_samples; i++) {
+      if (i == 0 || meta->guids[i] != guid) {
+        guid = meta->guids[0];
+        num_requests++;
+      }
+    }
+
+    coord_t start_idx = meta->guids[0];
+    assert(batch_input_domain.get_volume() % batch_size == 0);
+    size_t size_to_copy = token_dim * sequence_length * num_requests;
+    float const *input_zc =
+        full_input_ptr + start_idx * token_dim * sequence_length;
+    copy_kernel<<<GET_BLOCKS(size_to_copy), CUDA_NUM_THREADS>>>(
+        batch_input_ptr, input_zc, size_to_copy);
+    checkCUDA(cudaDeviceSynchronize());
+    return;
+  }
+
+  size_t guid = meta->guids[0];
+  size_t start_idx = meta->idxs[0];
+  size_t dst_idx = 0;
+  size_t total_tokens = 0;
+  for (size_t i = 1; i <= meta->num_samples; i++) {
+    if (i == meta->num_samples || meta->guids[i] != guid) {
+      size_t size_to_copy = token_dim * (meta->idxs[i - 1] - start_idx + 1);
+      total_tokens += size_to_copy / token_dim;
+      float const *input_zc = full_input_ptr +
+                              (guid * token_dim * sequence_length) +
+                              start_idx * token_dim;
+      float *dst_ptr = batch_input_ptr + dst_idx * token_dim;
+      copy_kernel<<<GET_BLOCKS(size_to_copy), CUDA_NUM_THREADS>>>(
+          dst_ptr, input_zc, size_to_copy);
+      if (i < meta->num_samples) {
+        guid = meta->guids[i];
+        start_idx = meta->idxs[i];
+      }
+      dst_idx = i;
+    }
+  }
+  assert(total_tokens == meta->num_samples);
+  checkCUDA(cudaDeviceSynchronize());
+}
diff --git a/examples/cpp/inference/dataloader.h b/examples/cpp/inference/dataloader.h
new file mode 100644
index 0000000000..e67176d801
--- /dev/null
+++ b/examples/cpp/inference/dataloader.h
@@ -0,0 +1,61 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+#pragma once
+
+#include "data_generator.h"
+#include "flexflow/model.h"
+#include "inference_config.h"
+
+#include <cstdlib>
+#include <fstream>
+#include <iostream>
+#include <sstream>
+#include <string>
+#include <unistd.h>
+
+using namespace Legion;
+using namespace FlexFlow;
+
+class DataLoader {
+public:
+  DataLoader(FFModel &ff,
+             InferenceConfig const &inferenceConfig,
+             DataGenerator &data_generator,
+             ParallelTensor input);
+  static void load_input(Task const *task,
+                         std::vector<PhysicalRegion> const &regions,
+                         Context ctx,
+                         Runtime *runtime);
+  static void load_entire_dataset(Task const *task,
+                                  std::vector<PhysicalRegion> const &regions,
+                                  Context ctx,
+                                  Runtime *runtime);
+  void next_batch(FFModel &, BatchConfig *);
+
+public:
+  size_t num_samples;
+  FlexFlow::ParallelTensor full_input, batch_input;
+  struct DataLoaderInput {
+    InferenceConfig const &_inferenceConfig;
+    DataGenerator &_data_generator;
+  };
+};
+
+struct SampleIdxs {
+  bool incremental_mode;
+  size_t num_samples;
+  size_t idxs[MAX_SEQ_LEN];  // the id of each token within its request
+  size_t guids[MAX_SEQ_LEN]; // the guid of the request each token belongs to
+};
\ No newline at end of file
diff --git a/examples/cpp/inference/gpt_tokenizer.cpp b/examples/cpp/inference/gpt_tokenizer.cpp
index cd413e468f..2d9b521fca 100644
--- a/examples/cpp/inference/gpt_tokenizer.cpp
+++ b/examples/cpp/inference/gpt_tokenizer.cpp
@@ -1,3 +1,18 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
 #include "gpt_tokenizer.h"
 
 #include <string>
diff --git a/examples/cpp/inference/inference_config.h b/examples/cpp/inference/inference_config.h
new file mode 100644
index 0000000000..cbd0a082e2
--- /dev/null
+++ b/examples/cpp/inference/inference_config.h
@@ -0,0 +1,69 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+#pragma once
+
+#include <string>
+
+#define MAX_SEQ_LEN 1024
+#define BATCH_SIZE 2
+#define MNIST_DIMS 28 * 28
+#define DATA_DIM MNIST_DIMS
+
+struct InferenceConfig {
+  InferenceConfig(void) {
+    //----------------------- Input/output data ------------------------
+    token_dim = DATA_DIM;
+    sequence_length = MAX_SEQ_LEN;
+    batch_size = BATCH_SIZE;
+    out_dim = 15;
+    num_labels = out_dim;
+    num_layers = 1;
+    //----------------------- Inference parameters ---------------------
+    // total number of requests processed as part of the simulation
+    total_requests = 2560;
+    poisson_distribution = true;
+    // average number of request arrivals per second
+    arrival_rate = 250;
+    num_inflight_batches = 5;
+    incremental_mode = false;
+    //----------------------- Rest of model parameters ------------------
+    hidden_size = DATA_DIM;
+    // Encoder layer
+    num_attention_heads = 16;
+    attention_kdim = attention_vdim = hidden_size / num_attention_heads;
+    num_encoder_layers = 1;
+  }
+
+  // Input/output data
+  int token_dim;
+  int sequence_length;
+  int batch_size;
+  int out_dim;
+  int num_labels;
+  int num_layers;
+  std::string dataset_path;
+  // Inference parameters
+  int total_requests;
+  bool poisson_distribution;
+  double arrival_rate;
+  int num_inflight_batches;
+  bool incremental_mode;
+  // Model parameters
+  int hidden_size;
+  int num_attention_heads;
+  int attention_kdim;
+  int attention_vdim;
+  int num_encoder_layers;
+};
diff --git a/examples/cpp/inference/mixture_of_experts/CMakeLists.txt b/examples/cpp/inference/mixture_of_experts/CMakeLists.txt
index 81c4c184b4..ecfe29b793 100644
--- a/examples/cpp/inference/mixture_of_experts/CMakeLists.txt
+++ b/examples/cpp/inference/mixture_of_experts/CMakeLists.txt
@@ -6,11 +6,12 @@ set(project_target inference_moe)
 set(CPU_SRC
   ${FLEXFLOW_CPP_DRV_SRC}
   moe.cc
-  dataloader.cc
-  ../data_generator.cc)
+  ../dataloader.cc
+  ../data_generator.cc
+  ../gpt_tokenizer.cc)
 
 set(GPU_SRC
-  dataloader.cu)
+  ../dataloader.cu)
 
 cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
 target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
diff --git a/examples/cpp/inference/mixture_of_experts/dataloader.cc b/examples/cpp/inference/mixture_of_experts/dataloader.cc
deleted file mode 100644
index af32cfe98b..0000000000
--- a/examples/cpp/inference/mixture_of_experts/dataloader.cc
+++ /dev/null
@@ -1,297 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "flexflow/inference.h"
-#include "moe.h"
-#include <cstdlib>
-#include <fstream>
-#include <iostream>
-#include <sstream>
-#include <string>
-#include <unistd.h>
-
-using namespace Legion;
-
-DataLoader::DataLoader(FFModel &ff,
-                       MoeConfig const &moeConfig,
-                       DataGenerator &data_generator,
-                       ParallelTensor input,
-                       ParallelTensor label) {
-  Context ctx = ff.config.lg_ctx;
-  Runtime *runtime = ff.config.lg_hlr;
-
-  int numdims = input->num_dims;
-  int replica_idx = numdims - 1;
-  int batch_idx = numdims - 2;
-  num_samples = moeConfig.total_requests;
-
-  // Create full input
-  {
-    batch_input = input;
-
-    ParallelDim dims[numdims];
-    for (int i = 0; i < numdims; i++) {
-      dims[i].size = input->dims[i].size;
-      dims[i].degree = 1;
-      dims[i].parallel_idx = -1;
-      dims[i].is_replica_dim = input->dims[i].is_replica_dim;
-      // Assume only the first dim can be the replica dim
-      assert(i == replica_idx || (!dims[i].is_replica_dim));
-    }
-    assert(dims[batch_idx].size == ff.config.batchSize);
-    dims[batch_idx].size = num_samples;
-
-    full_input =
-        ff.create_parallel_tensor_legion_ordering(numdims, dims, DT_FLOAT);
-    ff.map_tensor(full_input, NULL /*parallel_op*/);
-  }
-
-  // Create full label
-  {
-    assert(label->num_dims == numdims);
-    batch_label = label;
-
-    ParallelDim dims[numdims];
-    for (int i = 0; i < numdims; i++) {
-      dims[i].size = label->dims[i].size;
-      dims[i].degree = 1;
-      dims[i].parallel_idx = -1;
-      dims[i].is_replica_dim = label->dims[i].is_replica_dim;
-      // Assume only the last dim can be the replica dim
-      assert(i == replica_idx || (!dims[i].is_replica_dim));
-    }
-    assert(dims[batch_idx].size == ff.config.batchSize);
-    // replace batch size with number of samples
-    dims[batch_idx].size = num_samples;
-
-    full_label =
-        ff.create_parallel_tensor_legion_ordering(numdims, dims, DT_INT32);
-    ff.map_tensor(full_label, NULL /*parallel_op*/);
-  }
-
-  // Load entire dataset
-  // TODO: Use index launcher instead of task launcher
-  assert(full_input != nullptr && "full_input is nullptr");
-  assert(full_label != nullptr && "full_label is nullptr");
-
-  DataLoaderInput dataloader_input = {moeConfig, data_generator};
-  DataLoaderInput const *ptr = &dataloader_input;
-
-  TaskLauncher launcher(CUSTOM_CPU_TASK_ID_1,
-                        TaskArgument(ptr, sizeof(DataLoaderInput)));
-  // regions[0]: full_input
-  launcher.add_region_requirement(RegionRequirement(full_input->region,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    full_input->region,
-                                                    MAP_TO_ZC_MEMORY));
-  launcher.add_field(0, FID_DATA);
-  // regions[1]: full_label
-  launcher.add_region_requirement(RegionRequirement(full_label->region,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    full_label->region,
-                                                    MAP_TO_ZC_MEMORY));
-  launcher.add_field(1, FID_DATA);
-
-  runtime->execute_task(ctx, launcher);
-  reset();
-}
-
-// =================================================
-//                    Load data
-// =================================================
-
-void DataLoader::load_entire_dataset(Task const *task,
-                                     std::vector<PhysicalRegion> const &regions,
-                                     Context ctx,
-                                     Runtime *runtime) {
-  DataLoaderInput const input_struct = *((DataLoaderInput *)task->args);
-  MoeConfig const &conf = input_struct._moeConfig;
-  DataGenerator &datagen = input_struct._data_generator;
-  assert(regions.size() == 2);
-  assert(task->regions.size() == regions.size());
-
-  // get input and label pointer
-  float *input_ptr = helperGetTensorPointerWO<float>(
-      regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  int *label_ptr = helperGetTensorPointerWO<int>(
-      regions[1], task->regions[1], FID_DATA, ctx, runtime);
-  Domain input_domain = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  Domain label_domain = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  int input_dims = input_domain.get_dim();
-  for (int i = 0; i < input_dims; i++) {
-    int input_dim = input_domain.hi()[i] - input_domain.lo()[i] + 1;
-    int label_dim = label_domain.hi()[i] - label_domain.lo()[i] + 1;
-    assert(i == 0 || input_dim == label_dim);
-  }
-
-  if (conf.dataset_path.length() == 0) {
-    printf("Input dataset path is empty, using random input samples\n");
-    datagen.generate_requests(input_ptr, label_ptr, conf.num_labels);
-  } else {
-    // here, you can call `read_cifar100(input_ptr, label_ptr);` instead or load
-    // another dataset using the dataset_path from the MoeConfig object
-    // read_mnist(input_ptr, label_ptr);
-    // log_app.print("finish loading MNIST data\n");
-  }
-}
-
-void DataLoader::next_batch(FFModel &ff, size_t received_requests) {
-  if (received_requests == 0) {
-    return;
-  }
-  Context ctx = ff.config.lg_ctx;
-  Runtime *runtime = ff.config.lg_hlr;
-  // Load input
-  {
-    Domain domain =
-        runtime->get_index_space_domain(ctx, batch_input->parallel_is);
-    ArgumentMap argmap;
-    int counter = 0;
-    // current limitation of the dataloader: only the batch dimension can be
-    // partitioned
-    int input_dims = batch_input->num_dims;
-    for (int i = 0; i < input_dims; i++) {
-      if (i != input_dims - 2) {
-        assert(batch_input->dims[i].degree == 1 &&
-               "Dataloader only supports batch size partitions");
-      }
-    }
-    int batch_size = batch_input->dims[input_dims - 2].size;
-    int n_partitions = batch_input->dims[input_dims - 2].degree;
-    assert(ff.config.batchSize % batch_size == 0);
-    assert(batch_size % n_partitions == 0);
-    for (Domain::DomainPointIterator it(domain); it; it++) {
-      SampleIdxs meta;
-      int requests_left = received_requests - counter;
-      meta.num_samples = std::min(batch_size / n_partitions, requests_left);
-      for (int i = 0; i < meta.num_samples; i++) {
-        meta.idxs[i] = next_index + counter;
-        counter++;
-      }
-      argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
-    }
-    assert(counter == received_requests);
-    IndexLauncher launcher(CUSTOM_GPU_TASK_ID_1,
-                           batch_input->parallel_is,
-                           TaskArgument(NULL, 0),
-                           argmap,
-                           Predicate::TRUE_PRED,
-                           false /*must*/,
-                           0 /*mapper_id*/,
-                           batch_input->machine_view.hash());
-    launcher.add_region_requirement(RegionRequirement(full_input->region,
-                                                      0 /*projection id*/,
-                                                      READ_ONLY,
-                                                      EXCLUSIVE,
-                                                      full_input->region,
-                                                      MAP_TO_ZC_MEMORY));
-    launcher.add_field(0, FID_DATA);
-    launcher.add_region_requirement(RegionRequirement(batch_input->part,
-                                                      0 /*projection id*/,
-                                                      WRITE_ONLY,
-                                                      EXCLUSIVE,
-                                                      batch_input->region));
-    launcher.add_field(1, FID_DATA);
-    runtime->execute_index_space(ctx, launcher);
-  }
-  // Load label
-  {
-    Domain domain =
-        runtime->get_index_space_domain(ctx, batch_label->parallel_is);
-    ArgumentMap argmap;
-    int counter = 0;
-    // current limitation of the dataloader: only the batch dimension can be
-    // partitioned
-    int label_dims = batch_label->num_dims;
-    // assert(batch_label->dims[label_dims - 1].degree == 1);
-    for (int i = 0; i < label_dims; i++) {
-      assert(batch_label->dims[i].degree == 1 &&
-             "Dataloader only supports batch size partitions");
-    }
-    int batch_size = batch_label->dims[label_dims - 2].size;
-    int n_partitions = batch_label->dims[label_dims - 2].degree;
-    assert(ff.config.batchSize % batch_size == 0);
-    assert(batch_size % n_partitions == 0);
-    for (Domain::DomainPointIterator it(domain); it; it++) {
-      SampleIdxs meta;
-      int requests_left = received_requests - counter;
-      meta.num_samples = std::min(batch_size / n_partitions, requests_left);
-      for (int i = 0; i < meta.num_samples; i++) {
-        meta.idxs[i] = next_index + counter;
-        counter++;
-      }
-      argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
-    }
-    assert(counter == received_requests);
-    IndexLauncher launcher(CUSTOM_GPU_TASK_ID_2,
-                           batch_label->parallel_is,
-                           TaskArgument(NULL, 0),
-                           argmap,
-                           Predicate::TRUE_PRED,
-                           false /*must*/,
-                           0 /*mapper_id*/,
-                           batch_label->machine_view.hash());
-    launcher.add_region_requirement(RegionRequirement(full_label->region,
-                                                      0 /*projection id*/,
-                                                      READ_ONLY,
-                                                      EXCLUSIVE,
-                                                      full_label->region,
-                                                      MAP_TO_ZC_MEMORY));
-    launcher.add_field(0, FID_DATA);
-    launcher.add_region_requirement(RegionRequirement(batch_label->part,
-                                                      0 /*projection id*/,
-                                                      WRITE_ONLY,
-                                                      EXCLUSIVE,
-                                                      batch_label->region));
-    launcher.add_field(1, FID_DATA);
-    runtime->execute_index_space(ctx, launcher);
-  }
-  next_index += received_requests;
-}
-
-void DataLoader::reset() {
-  next_index = 0;
-}
-
-void FlexFlow::register_custom_tasks() {
-  // Load entire dataset
-  {
-    TaskVariantRegistrar registrar(CUSTOM_CPU_TASK_ID_1, "Load Entire Dataset");
-    registrar.add_constraint(ProcessorConstraint(Processor::LOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<DataLoader::load_entire_dataset>(
-        registrar, "Load Entire Dataset Task");
-  }
-  // Load input
-  {
-    TaskVariantRegistrar registrar(CUSTOM_GPU_TASK_ID_1, "Load Inputs");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<DataLoader::load_input>(
-        registrar, "Load Input Task");
-  }
-  // Load label
-  {
-    TaskVariantRegistrar registrar(CUSTOM_GPU_TASK_ID_2, "Load Labels");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<DataLoader::load_label>(
-        registrar, "Load Label Task");
-  }
-}
diff --git a/examples/cpp/inference/mixture_of_experts/dataloader.cu b/examples/cpp/inference/mixture_of_experts/dataloader.cu
deleted file mode 100644
index 2e234e9b32..0000000000
--- a/examples/cpp/inference/mixture_of_experts/dataloader.cu
+++ /dev/null
@@ -1,115 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "flexflow/utils/cuda_helper.h"
-#include "moe.h"
-
-void DataLoader::load_input(Task const *task,
-                            std::vector<PhysicalRegion> const &regions,
-                            Context ctx,
-                            Runtime *runtime) {
-  assert(regions.size() == 2);
-  assert(task->regions.size() == 2);
-  SampleIdxs *meta = (SampleIdxs *)task->local_args;
-  float const *full_input_ptr = helperGetTensorPointerRO<float>(
-      regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  float *batch_input_ptr = helperGetTensorPointerWO<float>(
-      regions[1], task->regions[1], FID_DATA, ctx, runtime);
-
-  Domain full_input_domain = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  Domain batch_input_domain = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-
-  coord_t token_dim =
-      batch_input_domain.hi()[0] - batch_input_domain.lo()[0] + 1;
-  coord_t sequence_length =
-      batch_input_domain.hi()[1] - batch_input_domain.lo()[1] + 1;
-  coord_t batch_size =
-      batch_input_domain.hi()[2] - batch_input_domain.lo()[2] + 1;
-
-  // FIXME: currently assume continous indices
-  assert(meta->num_samples <= batch_size);
-  for (int i = 1; i < meta->num_samples; i++) {
-    assert(meta->idxs[i] == meta->idxs[0] + i);
-  }
-  // pad inputs if needed (this is really only useful for debugging)
-  if (meta->num_samples < batch_size) {
-    checkCUDA(cudaMemset(batch_input_ptr +
-                             token_dim * sequence_length * meta->num_samples,
-                         0,
-                         token_dim * sequence_length *
-                             (batch_size - meta->num_samples) * sizeof(float)));
-  }
-  coord_t start_idx = meta->idxs[0];
-  assert(batch_input_domain.get_volume() % token_dim * sequence_length *
-             batch_size ==
-         0);
-  assert(batch_input_domain.get_volume() % batch_size == 0);
-  size_t size_to_copy =
-      (batch_input_domain.get_volume() / batch_size) * meta->num_samples;
-  float const *input_zc =
-      full_input_ptr + start_idx * token_dim * sequence_length;
-  copy_kernel<<<GET_BLOCKS(size_to_copy), CUDA_NUM_THREADS>>>(
-      batch_input_ptr, input_zc, size_to_copy);
-  checkCUDA(cudaDeviceSynchronize());
-}
-
-void DataLoader::load_label(Task const *task,
-                            std::vector<PhysicalRegion> const &regions,
-                            Context ctx,
-                            Runtime *runtime) {
-  assert(regions.size() == 2);
-  assert(task->regions.size() == 2);
-  SampleIdxs *meta = (SampleIdxs *)task->local_args;
-  int const *full_label_ptr = helperGetTensorPointerRO<int>(
-      regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  int *batch_label_ptr = helperGetTensorPointerWO<int>(
-      regions[1], task->regions[1], FID_DATA, ctx, runtime);
-  Domain full_label_domain = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  Domain batch_label_domain = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  coord_t label_dim =
-      batch_label_domain.hi()[0] - batch_label_domain.lo()[0] + 1;
-  coord_t sequence_length =
-      batch_label_domain.hi()[1] - batch_label_domain.lo()[1] + 1;
-  coord_t batch_size =
-      batch_label_domain.hi()[2] - batch_label_domain.lo()[2] + 1;
-  // FIXME: currently assume continous indices
-  assert(meta->num_samples <= batch_size);
-  for (int i = 1; i < meta->num_samples; i++) {
-    assert(meta->idxs[i] == meta->idxs[0] + i);
-  }
-  if (meta->num_samples < batch_size) {
-    checkCUDA(cudaMemset(batch_label_ptr +
-                             label_dim * sequence_length * meta->num_samples,
-                         0,
-                         label_dim * sequence_length *
-                             (batch_size - meta->num_samples) * sizeof(int)));
-  }
-  assert(batch_label_domain.get_volume() % label_dim * sequence_length *
-             batch_size ==
-         0);
-  assert(batch_label_domain.get_volume() % batch_size == 0);
-  coord_t start_idx = meta->idxs[0];
-  size_t size_to_copy =
-      (batch_label_domain.get_volume() / batch_size) * meta->num_samples;
-  int const *input_zc =
-      full_label_ptr + start_idx * label_dim * sequence_length;
-  copy_kernel<<<GET_BLOCKS(size_to_copy), CUDA_NUM_THREADS>>>(
-      batch_label_ptr, input_zc, size_to_copy);
-  checkCUDA(cudaDeviceSynchronize());
-}
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index 726ef5f7ff..a7e96da03a 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -73,18 +73,21 @@ Tensor create_moe_encoder(FFModel *model,
   std::vector<int> axes = {0, 1, 2};
   Tensor x = input;
   for (int i = 0; i < moeConfig->num_encoder_layers; i++) {
-    x = model->layer_norm(
-        model->add(model->multihead_attention(x,
-                                              x,
-                                              x,
-                                              moeConfig->hidden_size,
-                                              moeConfig->num_attention_heads,
-                                              moeConfig->attention_kdim,
-                                              moeConfig->attention_vdim),
-                   x),
-        axes,
-        true,
-        1e-05);
+    Tensor t = moeConfig->incremental_mode
+                   ? model->inc_multihead_self_attention(
+                         x,
+                         moeConfig->hidden_size,
+                         moeConfig->num_attention_heads,
+                         moeConfig->attention_kdim,
+                         moeConfig->attention_vdim)
+                   : model->multihead_attention(x,
+                                                x,
+                                                x,
+                                                moeConfig->hidden_size,
+                                                moeConfig->num_attention_heads,
+                                                moeConfig->attention_kdim,
+                                                moeConfig->attention_vdim);
+    x = model->layer_norm(model->add(t, x), axes, true, 1e-05);
     x = model->layer_norm(
         model->add(create_moe(model, moeConfig, x), x), axes, true, 1e-05);
   }
@@ -123,6 +126,7 @@ void FlexFlow::top_level_task(Task const *task,
   Tensor t = create_moe_encoder(&ff, &moeConfig, input);
   // Tensor t = create_moe(&ff, &moeConfig, input);
   t = ff.dense(t, moeConfig.out_dim, AC_MODE_RELU);
+  t = ff.softmax(t);
 
   //------------------- Initialize the inference manager ------------------
   InferenceManager im(
@@ -131,15 +135,19 @@ void FlexFlow::top_level_task(Task const *task,
   im.init_operators_inference();
 
   //------------ Initialize the data loader and data generator ------------
+  size_t min_input_tokens = 32, max_input_tokens = 512,
+         min_tokens_to_generate = 1, max_tokens_to_generate = 128;
   DataGenerator data_generator(moeConfig.total_requests,
                                moeConfig.token_dim,
-                               moeConfig.sequence_length,
+                               min_input_tokens,
+                               max_input_tokens,
+                               min_tokens_to_generate,
+                               max_tokens_to_generate,
                                moeConfig.poisson_distribution,
                                moeConfig.arrival_rate);
-  ParallelTensor input_pt, label_pt;
+  ParallelTensor input_pt;
   ff.get_parallel_tensor_from_tensor(input, input_pt);
-  ff.get_parallel_tensor_from_tensor(ff.label_tensor, label_pt);
-  DataLoader data_loader(ff, moeConfig, data_generator, input_pt, label_pt);
+  DataLoader data_loader(ff, moeConfig, data_generator, input_pt);
 
   //----------------------- Start timer -----------------------------------
   {
@@ -154,22 +162,60 @@ void FlexFlow::top_level_task(Task const *task,
   int index = 0;
   int processed_requests = 0;
   int num_devices = ffConfig.workersPerNode * ffConfig.numNodes;
-  data_loader.reset();
   data_generator.start_timer();
-  BatchConfig bc;
+  std::map<int, Future> future_handlers;
+  std::map<int, BatchConfig *> batch_configs;
+  std::pair<size_t, size_t> new_prompts;
+  BatchConfig *bc = nullptr;
+
+  // simulation loop. For deployment, we will use a while(true)
   while (processed_requests < moeConfig.total_requests) {
-    size_t received_requests = data_generator.get_requests();
-    int iterations = (received_requests % moeConfig.batch_size == 0)
-                         ? (received_requests / moeConfig.batch_size)
-                         : (received_requests / moeConfig.batch_size) + 1;
-    for (int iter = 0; iter < iterations; iter++) {
-      data_loader.next_batch(ff, received_requests);
-      runtime->begin_trace(ctx, 111 + index % num_devices /*trace_id*/);
-      im.inference(index, bc);
-      runtime->end_trace(ctx, 111 + index % num_devices /*trace_id*/);
-      index++;
+    for (int bid = 0; bid < im.max_num_requests_per_batch; bid++) {
+      if (future_handlers.find(bid) == future_handlers.end()) {
+        size_t max_reqs = moeConfig.incremental_mode
+                              ? bc->MAX_NUM_REQUESTS
+                              : im.max_num_requests_per_batch;
+        size_t max_tkns = moeConfig.sequence_length * moeConfig.batch_size;
+        new_prompts = data_generator.get_requests(max_reqs, max_tkns);
+        assert(new_prompts.second <= BatchConfig::MAX_NUM_REQUESTS);
+        bc = new BatchConfig(moeConfig.incremental_mode);
+      } else {
+        Future future = future_handlers[bid];
+        if (!future.is_ready(true /*subscribe*/)) {
+          continue;
+        }
+        InferenceResult ir = future.get_result<InferenceResult>();
+        bc = batch_configs[bid];
+        processed_requests += bc->update_results(ir);
+        size_t max_reqs = moeConfig.incremental_mode
+                              ? bc->MAX_NUM_REQUESTS - bc->num_active_requests()
+                              : im.max_num_requests_per_batch;
+        size_t max_tkns =
+            moeConfig.sequence_length * moeConfig.batch_size -
+            (moeConfig.incremental_mode ? bc->num_active_tokens() : 0);
+        new_prompts = data_generator.get_requests(max_reqs, max_tkns);
+      }
+      for (size_t i = 0; i < new_prompts.second; i++) {
+        size_t guid = new_prompts.first + i;
+        std::pair<size_t, size_t> seq_lens =
+            data_generator.get_request_length(guid);
+        assert(seq_lens.first >= min_input_tokens &&
+               seq_lens.first <= max_input_tokens &&
+               seq_lens.second >= min_tokens_to_generate &&
+               seq_lens.second <= max_tokens_to_generate);
+        assert(bc->register_new_request(guid, seq_lens.first));
+      }
+      bc->prepare_next_batch();
+      // TODO: loading data
+      data_loader.next_batch(ff, bc);
+
+      runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
+      FutureMap fm = im.inference(bid, *bc);
+      runtime->end_trace(ctx, 111 + bid % num_devices /*trace_id*/);
+      assert(fm.get_future_map_domain().get_volume() == 1);
+      future_handlers[bid] = fm.get_future(0);
+      batch_configs[bid] = bc;
     }
-    processed_requests += received_requests;
   }
   //----------------------- End of inference! ------------------------------
 
diff --git a/examples/cpp/inference/mixture_of_experts/moe.h b/examples/cpp/inference/mixture_of_experts/moe.h
index 56feb775e8..183229bc07 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.h
+++ b/examples/cpp/inference/mixture_of_experts/moe.h
@@ -13,31 +13,13 @@
  * limitations under the License.
  */
 
-#include "data_generator.h"
-#include "flexflow/model.h"
-#define MAX_NUM_SAMPLES 1000
-#define MNIST_DIMS 28 * 28
-#define DATA_DIM MNIST_DIMS
+#pragma once
 
-using namespace Legion;
-using namespace std;
-using namespace FlexFlow;
+#include "dataloader.h"
+#include "inference_config.h"
 
-struct MoeConfig {
-  MoeConfig(void) {
-    //----------------------- Input/output data ------------------------
-    token_dim = DATA_DIM;
-    sequence_length = 10;
-    batch_size = 32;
-    out_dim = 15;
-    num_labels = out_dim;
-    //----------------------- Inference parameters ---------------------
-    // total number of requests processed as part of the simulation
-    total_requests = 256;
-    poisson_distribution = true;
-    // average number of request arrivals per second
-    arrival_rate = 25;
-    num_inflight_batches = 10;
+struct MoeConfig : InferenceConfig {
+  MoeConfig(void) : InferenceConfig() {
     //----------------------- MoE layer --------------------------------
     // total number of experts
     num_exp = 128;
@@ -50,72 +32,12 @@ struct MoeConfig {
     lambda = 0.04f; // multiplier for load balance term
     // expert hidden size
     hidden_size = DATA_DIM;
-    //----------------------- Rest of model parameters ------------------
-    // Encoder layer
-    num_attention_heads = 16;
-    attention_kdim = attention_vdim = hidden_size / num_attention_heads;
-    num_encoder_layers = 1;
   }
 
-  // Input/output data
-  int token_dim;
-  int sequence_length;
-  int batch_size;
-  int out_dim;
-  int num_labels;
-  std::string dataset_path;
-  // Inference parameters
-  int total_requests;
-  bool poisson_distribution;
-  double arrival_rate;
-  int num_inflight_batches;
   // MoE layer
   int num_exp;
   int experts_per_block;
   int num_select;
   float alpha;
   float lambda;
-  int hidden_size;
-  // Model parameters
-  int num_attention_heads;
-  int attention_kdim;
-  int attention_vdim;
-  int num_encoder_layers;
-};
-
-class DataLoader {
-public:
-  DataLoader(FFModel &ff,
-             MoeConfig const &moeConfig,
-             DataGenerator &data_generator,
-             ParallelTensor input,
-             ParallelTensor label);
-  static void load_input(Task const *task,
-                         std::vector<PhysicalRegion> const &regions,
-                         Context ctx,
-                         Runtime *runtime);
-  static void load_label(Task const *task,
-                         std::vector<PhysicalRegion> const &regions,
-                         Context ctx,
-                         Runtime *runtime);
-  static void load_entire_dataset(Task const *task,
-                                  std::vector<PhysicalRegion> const &regions,
-                                  Context ctx,
-                                  Runtime *runtime);
-  void next_batch(FFModel &, size_t);
-  void reset(void);
-
-public:
-  int num_samples, next_index;
-  FlexFlow::ParallelTensor full_input, batch_input;
-  FlexFlow::ParallelTensor full_label, batch_label;
-  struct DataLoaderInput {
-    MoeConfig const &_moeConfig;
-    DataGenerator &_data_generator;
-  };
-};
-
-struct SampleIdxs {
-  int num_samples;
-  int idxs[MAX_NUM_SAMPLES];
-};
+};
\ No newline at end of file
diff --git a/examples/cpp/inference/transformers/CMakeLists.txt b/examples/cpp/inference/transformers/CMakeLists.txt
index d52beae3ad..e3cabdc324 100644
--- a/examples/cpp/inference/transformers/CMakeLists.txt
+++ b/examples/cpp/inference/transformers/CMakeLists.txt
@@ -6,11 +6,12 @@ set(project_target inference_transformers)
 set(CPU_SRC
   ${FLEXFLOW_CPP_DRV_SRC}
   transformers.cc
-  dataloader.cc
-  ../data_generator.cc)
+  ../dataloader.cc
+  ../data_generator.cc
+  ../gpt_tokenizer.cc)
 
 set(GPU_SRC
-  dataloader.cu)
+  ../dataloader.cu)
 
 cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
 target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
diff --git a/examples/cpp/inference/transformers/dataloader.cc b/examples/cpp/inference/transformers/dataloader.cc
deleted file mode 100644
index 6a1ccb2338..0000000000
--- a/examples/cpp/inference/transformers/dataloader.cc
+++ /dev/null
@@ -1,388 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "flexflow/inference.h"
-#include "transformers.h"
-#include <cstdlib>
-#include <fstream>
-#include <iostream>
-#include <sstream>
-#include <string>
-#include <unistd.h>
-
-using namespace Legion;
-
-DataLoader::DataLoader(FFModel &ff,
-                       MoeConfig const &moeConfig,
-                       DataGenerator &data_generator,
-                       ParallelTensor input,
-                       ParallelTensor label) {
-  Context ctx = ff.config.lg_ctx;
-  Runtime *runtime = ff.config.lg_hlr;
-
-  int numdims = input->num_dims;
-  int replica_idx = numdims - 1;
-  int batch_idx = numdims - 2;
-  num_samples = moeConfig.total_requests;
-
-  // Create full input
-  {
-    batch_input = input;
-
-    ParallelDim dims[numdims];
-    for (int i = 0; i < numdims; i++) {
-      dims[i].size = input->dims[i].size;
-      dims[i].degree = 1;
-      dims[i].parallel_idx = -1;
-      dims[i].is_replica_dim = input->dims[i].is_replica_dim;
-      // Assume only the first dim can be the replica dim
-      assert(i == replica_idx || (!dims[i].is_replica_dim));
-    }
-    assert(dims[batch_idx].size == BatchConfig::MAX_NUM_TOKENS);
-    dims[batch_idx].size = num_samples;
-
-    full_input =
-        ff.create_parallel_tensor_legion_ordering(numdims, dims, DT_FLOAT);
-    ff.map_tensor(full_input, NULL /*parallel_op*/);
-  }
-
-  // Create full label
-  {
-    assert(label->num_dims == numdims);
-    batch_label = label;
-
-    ParallelDim dims[numdims];
-    for (int i = 0; i < numdims; i++) {
-      dims[i].size = label->dims[i].size;
-      dims[i].degree = 1;
-      dims[i].parallel_idx = -1;
-      dims[i].is_replica_dim = label->dims[i].is_replica_dim;
-      // Assume only the last dim can be the replica dim
-      assert(i == replica_idx || (!dims[i].is_replica_dim));
-    }
-    assert(dims[batch_idx].size == BatchConfig::MAX_NUM_TOKENS);
-    // replace batch size with number of samples
-    dims[batch_idx].size = num_samples;
-
-    full_label =
-        ff.create_parallel_tensor_legion_ordering(numdims, dims, DT_INT32);
-    ff.map_tensor(full_label, NULL /*parallel_op*/);
-  }
-
-  // Load entire dataset
-  // TODO: Use index launcher instead of task launcher
-  assert(full_input != nullptr && "full_input is nullptr");
-  assert(full_label != nullptr && "full_label is nullptr");
-
-  DataLoaderInput dataloader_input = {moeConfig, data_generator};
-  DataLoaderInput const *ptr = &dataloader_input;
-
-  TaskLauncher launcher(CUSTOM_CPU_TASK_ID_1,
-                        TaskArgument(ptr, sizeof(DataLoaderInput)));
-  // regions[0]: full_input
-  launcher.add_region_requirement(RegionRequirement(full_input->region,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    full_input->region,
-                                                    MAP_TO_ZC_MEMORY));
-  launcher.add_field(0, FID_DATA);
-  // regions[1]: full_label
-  launcher.add_region_requirement(RegionRequirement(full_label->region,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    full_label->region,
-                                                    MAP_TO_ZC_MEMORY));
-  launcher.add_field(1, FID_DATA);
-
-  runtime->execute_task(ctx, launcher);
-  reset();
-}
-
-// =================================================
-//                    Load data
-// =================================================
-
-void read_cifar100(float *input_ptr, int *label_ptr) {
-  std::ifstream file;
-  file.open("train.bin", std::ios::in | std::ios::binary | std::ios::ate);
-  if (!file) {
-    std::cout << "Error opening CIFAR100 train data file" << std::endl;
-    assert(false);
-  }
-
-  file.seekg(0, std::ios::beg);
-
-  // each sample: <1 x coarse label><1 x fine label><3072 x pixel>
-  for (std::size_t i = 0; i < MAX_NUM_SAMPLES; i++) {
-    unsigned char temp = 0;
-    file.read((char *)&temp, sizeof(temp)); // coarse label, skip
-    file.read((char *)&temp, sizeof(temp));
-    label_ptr[i] = temp;
-    for (std::size_t j = 0; j < 3072; ++j) {
-      file.read((char *)&temp, sizeof(temp));
-      input_ptr[i * 3072 + j] = (float)temp / 255.0f;
-    }
-  }
-
-  file.close();
-}
-
-int reverseInt(int i) {
-  unsigned char c1, c2, c3, c4;
-
-  c1 = i & 255;
-  c2 = (i >> 8) & 255;
-  c3 = (i >> 16) & 255;
-  c4 = (i >> 24) & 255;
-
-  return ((int)c1 << 24) + ((int)c2 << 16) + ((int)c3 << 8) + c4;
-}
-
-/* NOTE: Download files from http://yann.lecun.com/exdb/mnist/ and unpack to
-the current working directory */
-void read_mnist(float *input_ptr, int *label_ptr) {
-  // read inputs
-  std::ifstream input("train-images-idx3-ubyte", std::ios::binary);
-  if (input.is_open()) {
-    int magic_number = 0;
-    int number_of_images = 0;
-    int n_rows = 0;
-    int n_cols = 0;
-    input.read((char *)&magic_number, sizeof(magic_number));
-    magic_number = reverseInt(magic_number);
-    input.read((char *)&number_of_images, sizeof(number_of_images));
-    number_of_images = reverseInt(number_of_images);
-    input.read((char *)&n_rows, sizeof(n_rows));
-    n_rows = reverseInt(n_rows);
-    input.read((char *)&n_cols, sizeof(n_cols));
-    n_cols = reverseInt(n_cols);
-
-    for (int i = 0; i < number_of_images; i++) {
-      for (int r = 0; r < n_rows; r++) {
-        for (int c = 0; c < n_cols; c++) {
-          unsigned char temp = 0;
-          input.read((char *)&temp, sizeof(temp));
-          input_ptr[i * n_rows * n_cols + r * n_cols + c] =
-              (float)temp / 255.0f;
-        }
-      }
-    }
-  } else {
-    std::cout << "Error opening MNIST input data file" << std::endl;
-    assert(false);
-  }
-
-  // read labels
-  std::ifstream labels("train-labels-idx1-ubyte", std::ios::binary);
-  if (labels.is_open()) {
-    int magic_number = 0;
-    int number_of_images = 0;
-    labels.read((char *)&magic_number, sizeof(magic_number));
-    magic_number = reverseInt(magic_number);
-    labels.read((char *)&number_of_images, sizeof(number_of_images));
-    number_of_images = reverseInt(number_of_images);
-
-    for (int i = 0; i < number_of_images; i++) {
-      unsigned char temp = 0;
-      labels.read((char *)&temp, sizeof(temp));
-      label_ptr[i] = temp;
-    }
-  } else {
-    std::cout << "Error opening MNIST label data file" << std::endl;
-    assert(false);
-  }
-}
-
-void DataLoader::load_entire_dataset(Task const *task,
-                                     std::vector<PhysicalRegion> const &regions,
-                                     Context ctx,
-                                     Runtime *runtime) {
-  DataLoaderInput const input_struct = *((DataLoaderInput *)task->args);
-  MoeConfig const &conf = input_struct._moeConfig;
-  DataGenerator &datagen = input_struct._data_generator;
-  assert(regions.size() == 2);
-  assert(task->regions.size() == regions.size());
-
-  // get input and label pointer
-  float *input_ptr = helperGetTensorPointerWO<float>(
-      regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  int *label_ptr = helperGetTensorPointerWO<int>(
-      regions[1], task->regions[1], FID_DATA, ctx, runtime);
-  Domain input_domain = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  Domain label_domain = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  int input_dims = input_domain.get_dim();
-  for (int i = 0; i < input_dims; i++) {
-    int input_dim = input_domain.hi()[i] - input_domain.lo()[i] + 1;
-    int label_dim = label_domain.hi()[i] - label_domain.lo()[i] + 1;
-    assert(i == 0 || input_dim == label_dim);
-  }
-
-  if (conf.dataset_path.length() == 0) {
-    printf("Input dataset path is empty, using random input samples\n");
-    datagen.generate_requests(input_ptr, label_ptr, conf.num_labels);
-  } else {
-    // here, you can call `read_cifar100(input_ptr, label_ptr);` instead or load
-    // another dataset using the dataset_path from the MoeConfig object
-    // read_mnist(input_ptr, label_ptr);
-    // log_app.print("finish loading MNIST data\n");
-  }
-}
-
-void DataLoader::next_batch(FFModel &ff, size_t received_requests) {
-  if (received_requests == 0) {
-    return;
-  }
-  Context ctx = ff.config.lg_ctx;
-  Runtime *runtime = ff.config.lg_hlr;
-  // Load input
-  {
-    Domain domain =
-        runtime->get_index_space_domain(ctx, batch_input->parallel_is);
-    ArgumentMap argmap;
-    int counter = 0;
-    // current limitation of the dataloader: only the batch dimension can be
-    // partitioned
-    int input_dims = batch_input->num_dims;
-    for (int i = 0; i < input_dims; i++) {
-      if (i != input_dims - 2) {
-        assert(batch_input->dims[i].degree == 1 &&
-               "Dataloader only supports batch size partitions");
-      }
-    }
-    int batch_size = batch_input->dims[input_dims - 2].size;
-    int n_partitions = batch_input->dims[input_dims - 2].degree;
-    assert(ff.config.batchSize % batch_size == 0);
-    assert(batch_size % n_partitions == 0);
-    for (Domain::DomainPointIterator it(domain); it; it++) {
-      SampleIdxs meta;
-      int requests_left = received_requests - counter;
-      meta.num_samples = std::min(batch_size / n_partitions, requests_left);
-      for (int i = 0; i < meta.num_samples; i++) {
-        meta.idxs[i] = next_index + counter;
-        counter++;
-      }
-      argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
-    }
-    assert(counter == received_requests);
-    IndexLauncher launcher(CUSTOM_GPU_TASK_ID_1,
-                           batch_input->parallel_is,
-                           TaskArgument(NULL, 0),
-                           argmap,
-                           Predicate::TRUE_PRED,
-                           false /*must*/,
-                           0 /*mapper_id*/,
-                           batch_input->machine_view.hash());
-    launcher.add_region_requirement(RegionRequirement(full_input->region,
-                                                      0 /*projection id*/,
-                                                      READ_ONLY,
-                                                      EXCLUSIVE,
-                                                      full_input->region,
-                                                      MAP_TO_ZC_MEMORY));
-    launcher.add_field(0, FID_DATA);
-    launcher.add_region_requirement(RegionRequirement(batch_input->part,
-                                                      0 /*projection id*/,
-                                                      WRITE_ONLY,
-                                                      EXCLUSIVE,
-                                                      batch_input->region));
-    launcher.add_field(1, FID_DATA);
-    runtime->execute_index_space(ctx, launcher);
-  }
-  // Load label
-  {
-    Domain domain =
-        runtime->get_index_space_domain(ctx, batch_label->parallel_is);
-    ArgumentMap argmap;
-    int counter = 0;
-    // current limitation of the dataloader: only the batch dimension can be
-    // partitioned
-    int label_dims = batch_label->num_dims;
-    // assert(batch_label->dims[label_dims - 1].degree == 1);
-    for (int i = 0; i < label_dims; i++) {
-      assert(batch_label->dims[i].degree == 1 &&
-             "Dataloader only supports batch size partitions");
-    }
-    int batch_size = batch_label->dims[label_dims - 2].size;
-    int n_partitions = batch_label->dims[label_dims - 2].degree;
-    assert(ff.config.batchSize % batch_size == 0);
-    assert(batch_size % n_partitions == 0);
-    for (Domain::DomainPointIterator it(domain); it; it++) {
-      SampleIdxs meta;
-      int requests_left = received_requests - counter;
-      meta.num_samples = std::min(batch_size / n_partitions, requests_left);
-      for (int i = 0; i < meta.num_samples; i++) {
-        meta.idxs[i] = next_index + counter;
-        counter++;
-      }
-      argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
-    }
-    assert(counter == received_requests);
-    IndexLauncher launcher(CUSTOM_GPU_TASK_ID_2,
-                           batch_label->parallel_is,
-                           TaskArgument(NULL, 0),
-                           argmap,
-                           Predicate::TRUE_PRED,
-                           false /*must*/,
-                           0 /*mapper_id*/,
-                           batch_label->machine_view.hash());
-    launcher.add_region_requirement(RegionRequirement(full_label->region,
-                                                      0 /*projection id*/,
-                                                      READ_ONLY,
-                                                      EXCLUSIVE,
-                                                      full_label->region,
-                                                      MAP_TO_ZC_MEMORY));
-    launcher.add_field(0, FID_DATA);
-    launcher.add_region_requirement(RegionRequirement(batch_label->part,
-                                                      0 /*projection id*/,
-                                                      WRITE_ONLY,
-                                                      EXCLUSIVE,
-                                                      batch_label->region));
-    launcher.add_field(1, FID_DATA);
-    runtime->execute_index_space(ctx, launcher);
-  }
-  next_index += received_requests;
-}
-
-void DataLoader::reset() {
-  next_index = 0;
-}
-
-void FlexFlow::register_custom_tasks() {
-  // Load entire dataset
-  {
-    TaskVariantRegistrar registrar(CUSTOM_CPU_TASK_ID_1, "Load Entire Dataset");
-    registrar.add_constraint(ProcessorConstraint(Processor::LOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<DataLoader::load_entire_dataset>(
-        registrar, "Load Entire Dataset Task");
-  }
-  // Load input
-  {
-    TaskVariantRegistrar registrar(CUSTOM_GPU_TASK_ID_1, "Load Inputs");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<DataLoader::load_input>(
-        registrar, "Load Input Task");
-  }
-  // Load label
-  {
-    TaskVariantRegistrar registrar(CUSTOM_GPU_TASK_ID_2, "Load Labels");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<DataLoader::load_label>(
-        registrar, "Load Label Task");
-  }
-}
diff --git a/examples/cpp/inference/transformers/dataloader.cu b/examples/cpp/inference/transformers/dataloader.cu
deleted file mode 100644
index 4624b562e9..0000000000
--- a/examples/cpp/inference/transformers/dataloader.cu
+++ /dev/null
@@ -1,115 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "flexflow/utils/cuda_helper.h"
-#include "transformers.h"
-
-void DataLoader::load_input(Task const *task,
-                            std::vector<PhysicalRegion> const &regions,
-                            Context ctx,
-                            Runtime *runtime) {
-  assert(regions.size() == 2);
-  assert(task->regions.size() == 2);
-  SampleIdxs *meta = (SampleIdxs *)task->local_args;
-  float const *full_input_ptr = helperGetTensorPointerRO<float>(
-      regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  float *batch_input_ptr = helperGetTensorPointerWO<float>(
-      regions[1], task->regions[1], FID_DATA, ctx, runtime);
-
-  Domain full_input_domain = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  Domain batch_input_domain = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-
-  coord_t token_dim =
-      batch_input_domain.hi()[0] - batch_input_domain.lo()[0] + 1;
-  coord_t sequence_length =
-      batch_input_domain.hi()[1] - batch_input_domain.lo()[1] + 1;
-  coord_t batch_size =
-      batch_input_domain.hi()[2] - batch_input_domain.lo()[2] + 1;
-
-  // FIXME: currently assume continous indices
-  assert(meta->num_samples <= batch_size);
-  for (int i = 1; i < meta->num_samples; i++) {
-    assert(meta->idxs[i] == meta->idxs[0] + i);
-  }
-  // pad inputs if needed (this is really only useful for debugging)
-  if (meta->num_samples < batch_size) {
-    checkCUDA(cudaMemset(batch_input_ptr +
-                             token_dim * sequence_length * meta->num_samples,
-                         0,
-                         token_dim * sequence_length *
-                             (batch_size - meta->num_samples) * sizeof(float)));
-  }
-  coord_t start_idx = meta->idxs[0];
-  assert(batch_input_domain.get_volume() % token_dim * sequence_length *
-             batch_size ==
-         0);
-  assert(batch_input_domain.get_volume() % batch_size == 0);
-  size_t size_to_copy =
-      (batch_input_domain.get_volume() / batch_size) * meta->num_samples;
-  float const *input_zc =
-      full_input_ptr + start_idx * token_dim * sequence_length;
-  copy_kernel<<<GET_BLOCKS(size_to_copy), CUDA_NUM_THREADS>>>(
-      batch_input_ptr, input_zc, size_to_copy);
-  checkCUDA(cudaDeviceSynchronize());
-}
-
-void DataLoader::load_label(Task const *task,
-                            std::vector<PhysicalRegion> const &regions,
-                            Context ctx,
-                            Runtime *runtime) {
-  assert(regions.size() == 2);
-  assert(task->regions.size() == 2);
-  SampleIdxs *meta = (SampleIdxs *)task->local_args;
-  int const *full_label_ptr = helperGetTensorPointerRO<int>(
-      regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  int *batch_label_ptr = helperGetTensorPointerWO<int>(
-      regions[1], task->regions[1], FID_DATA, ctx, runtime);
-  Domain full_label_domain = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  Domain batch_label_domain = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  coord_t label_dim =
-      batch_label_domain.hi()[0] - batch_label_domain.lo()[0] + 1;
-  coord_t sequence_length =
-      batch_label_domain.hi()[1] - batch_label_domain.lo()[1] + 1;
-  coord_t batch_size =
-      batch_label_domain.hi()[2] - batch_label_domain.lo()[2] + 1;
-  // FIXME: currently assume continous indices
-  assert(meta->num_samples <= batch_size);
-  for (int i = 1; i < meta->num_samples; i++) {
-    assert(meta->idxs[i] == meta->idxs[0] + i);
-  }
-  if (meta->num_samples < batch_size) {
-    checkCUDA(cudaMemset(batch_label_ptr +
-                             label_dim * sequence_length * meta->num_samples,
-                         0,
-                         label_dim * sequence_length *
-                             (batch_size - meta->num_samples) * sizeof(int)));
-  }
-  assert(batch_label_domain.get_volume() % label_dim * sequence_length *
-             batch_size ==
-         0);
-  assert(batch_label_domain.get_volume() % batch_size == 0);
-  coord_t start_idx = meta->idxs[0];
-  size_t size_to_copy =
-      (batch_label_domain.get_volume() / batch_size) * meta->num_samples;
-  int const *input_zc =
-      full_label_ptr + start_idx * label_dim * sequence_length;
-  copy_kernel<<<GET_BLOCKS(size_to_copy), CUDA_NUM_THREADS>>>(
-      batch_label_ptr, input_zc, size_to_copy);
-  checkCUDA(cudaDeviceSynchronize());
-}
diff --git a/examples/cpp/inference/transformers/transformers.cc b/examples/cpp/inference/transformers/transformers.cc
index f67d779e3a..45d676fe3c 100644
--- a/examples/cpp/inference/transformers/transformers.cc
+++ b/examples/cpp/inference/transformers/transformers.cc
@@ -26,7 +26,7 @@ using namespace Legion;
 
 LegionRuntime::Logger::Category log_app("Transformers");
 
-void parse_input_args(char **argv, int argc, MoeConfig &config) {
+void parse_input_args(char **argv, int argc, TransformerConfig &config) {
   for (int i = 1; i < argc; i++) {
     if (!strcmp(argv[i], "--dataset")) {
       config.dataset_path = std::string(argv[++i]);
@@ -35,20 +35,23 @@ void parse_input_args(char **argv, int argc, MoeConfig &config) {
   }
 }
 
-Tensor create_inc_multihead_attention_decoder(FFModel *model,
-                                              MoeConfig const *moeConfig,
-                                              Tensor const &input) {
+Tensor create_inc_multihead_attention_decoder(
+    FFModel *model,
+    TransformerConfig const *transformerConfig,
+    Tensor const &input) {
   std::vector<int> axes{1};
-  Tensor t = model->inc_multihead_self_attention(input,
-                                                 moeConfig->hidden_size,
-                                                 moeConfig->num_attention_heads,
-                                                 moeConfig->attention_kdim,
-                                                 moeConfig->attention_vdim);
+  Tensor t = model->inc_multihead_self_attention(
+      input,
+      transformerConfig->hidden_size,
+      transformerConfig->num_attention_heads,
+      transformerConfig->attention_kdim,
+      transformerConfig->attention_vdim);
 
   t = model->layer_norm(model->add(t, input), axes, true, 1e-05);
   Tensor x = model->dense(
-      model->dense(t, moeConfig->hidden_size, AC_MODE_RELU, false /*bias*/),
-      moeConfig->hidden_size,
+      model->dense(
+          t, transformerConfig->hidden_size, AC_MODE_RELU, false /*bias*/),
+      transformerConfig->hidden_size,
       AC_MODE_NONE,
       false /*bias*/);
   t = model->layer_norm(model->add(x, t), axes, true, 1e-05);
@@ -60,14 +63,14 @@ void FlexFlow::top_level_task(Task const *task,
                               Context ctx,
                               Runtime *runtime) {
   //----------------------- Initial configurations ------------------------
-  MoeConfig moeConfig;
+  TransformerConfig transformerConfig;
   FFConfig ffConfig;
-  ffConfig.batchSize = moeConfig.batch_size;
+  ffConfig.batchSize = transformerConfig.batch_size;
   {
     InputArgs const &command_args = HighLevelRuntime::get_input_args();
     char **argv = command_args.argv;
     int argc = command_args.argc;
-    parse_input_args(argv, argc, moeConfig);
+    parse_input_args(argv, argc, transformerConfig);
     log_app.print("batchSize(%d) workersPerNodes(%d) numNodes(%d)",
                   ffConfig.batchSize,
                   ffConfig.workersPerNode,
@@ -78,34 +81,40 @@ void FlexFlow::top_level_task(Task const *task,
   //----------------------- Create inputs --------------------------------
   Tensor input;
   {
-    int const dims[] = {BatchConfig::MAX_NUM_TOKENS, moeConfig.token_dim};
+    int const dims[] = {BatchConfig::MAX_NUM_TOKENS,
+                        transformerConfig.token_dim};
     input = ff.create_tensor<2>(dims, DT_FLOAT);
   }
 
   //----------------------- Define the model ------------------------------
   Tensor t = input;
-  for (int i = 0; i < moeConfig.num_layers; i++) {
-    t = create_inc_multihead_attention_decoder(&ff, &moeConfig, input);
+  for (int i = 0; i < transformerConfig.num_layers; i++) {
+    t = create_inc_multihead_attention_decoder(&ff, &transformerConfig, input);
   }
-  t = ff.dense(t, moeConfig.out_dim, AC_MODE_RELU);
+  t = ff.dense(t, transformerConfig.out_dim, AC_MODE_RELU);
   t = ff.softmax(t);
 
   //------------------- Initialize the inference manager ------------------
-  InferenceManager im(
-      &ff, moeConfig.batch_size, moeConfig.num_inflight_batches);
+  InferenceManager im(&ff,
+                      transformerConfig.batch_size,
+                      transformerConfig.num_inflight_batches);
   im.compile_model_and_allocate_buffer();
   im.init_operators_inference();
 
   //------------ Initialize the data loader and data generator ------------
-  DataGenerator data_generator(moeConfig.total_requests,
-                               moeConfig.token_dim,
-                               moeConfig.sequence_length,
-                               moeConfig.poisson_distribution,
-                               moeConfig.arrival_rate);
-  ParallelTensor input_pt, label_pt;
+  size_t min_input_tokens = 32, max_input_tokens = 512,
+         min_tokens_to_generate = 1, max_tokens_to_generate = 128;
+  DataGenerator data_generator(transformerConfig.total_requests,
+                               transformerConfig.token_dim,
+                               min_input_tokens,
+                               max_input_tokens,
+                               min_tokens_to_generate,
+                               max_tokens_to_generate,
+                               transformerConfig.poisson_distribution,
+                               transformerConfig.arrival_rate);
+  ParallelTensor input_pt;
   ff.get_parallel_tensor_from_tensor(input, input_pt);
-  ff.get_parallel_tensor_from_tensor(ff.label_tensor, label_pt);
-  DataLoader data_loader(ff, moeConfig, data_generator, input_pt, label_pt);
+  DataLoader data_loader(ff, transformerConfig, data_generator, input_pt);
 
   //----------------------- Start timer -----------------------------------
   {
@@ -120,54 +129,60 @@ void FlexFlow::top_level_task(Task const *task,
   int index = 0;
   int processed_requests = 0;
   int num_devices = ffConfig.workersPerNode * ffConfig.numNodes;
-  data_loader.reset();
   data_generator.start_timer();
   std::map<int, Future> future_handlers;
   std::map<int, BatchConfig *> batch_configs;
-  while (processed_requests < moeConfig.total_requests) {
-    for (int bid = 0; bid < im.max_num_inflight_batches; bid++) {
+  std::pair<size_t, size_t> new_prompts;
+  BatchConfig *bc = nullptr;
+
+  // simulation loop. For deployment, we will use a while(true)
+  while (processed_requests < transformerConfig.total_requests) {
+    for (int bid = 0; bid < im.max_num_requests_per_batch; bid++) {
       if (future_handlers.find(bid) == future_handlers.end()) {
-        std::vector<std::pair<size_t, std::vector<int>>> prompts;
-        assert(im.max_num_requests_per_batch <= BatchConfig::MAX_NUM_REQUESTS);
-        data_generator.get_requests(im.max_num_requests_per_batch, prompts);
-        assert((int)prompts.size() < im.max_num_requests_per_batch);
-        // TODO: loading data
-        BatchConfig *bc = new BatchConfig();
-        for (auto const &prompt : prompts) {
-          assert(bc->register_new_request(prompt.first, prompt.second.size()));
-        }
-        bc->prepare_next_batch();
-        runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
-        FutureMap fm = im.inference(bid, *bc);
-        runtime->end_trace(ctx, 111 + bid % num_devices /*trace_id*/);
-        assert(fm.get_future_map_domain().get_volume() == 1);
-        Future future = fm.get_future(0);
-        future_handlers[bid] = future;
-        batch_configs[bid] = bc;
+        size_t max_reqs = transformerConfig.incremental_mode
+                              ? bc->MAX_NUM_REQUESTS
+                              : im.max_num_requests_per_batch;
+        size_t max_tkns =
+            transformerConfig.sequence_length * transformerConfig.batch_size;
+        new_prompts = data_generator.get_requests(max_reqs, max_tkns);
+        assert(new_prompts.second <= BatchConfig::MAX_NUM_REQUESTS);
+        bc = new BatchConfig(transformerConfig.incremental_mode);
       } else {
         Future future = future_handlers[bid];
         if (!future.is_ready(true /*subscribe*/)) {
           continue;
         }
         InferenceResult ir = future.get_result<InferenceResult>();
-        BatchConfig *bc = batch_configs[bid];
+        bc = batch_configs[bid];
         processed_requests += bc->update_results(ir);
-        int available_slots =
-            BatchConfig::MAX_NUM_REQUESTS - bc->num_active_requests();
-        std::vector<std::pair<size_t, std::vector<int>>> prompts;
-        data_generator.get_requests(available_slots, prompts);
-        processed_requests += prompts.size();
-        for (auto const &prompt : prompts) {
-          assert(bc->register_new_request(prompt.first, prompt.second.size()));
-        }
-        bc->prepare_next_batch();
-        runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
-        FutureMap fm = im.inference(bid, *bc);
-        runtime->end_trace(ctx, 111 + bid % num_devices /*trace_id*/);
-        assert(fm.get_future_map_domain().get_volume() == 1);
-        future_handlers[bid] = fm.get_future(0);
-        batch_configs[bid] = bc;
+        size_t max_reqs = transformerConfig.incremental_mode
+                              ? bc->MAX_NUM_REQUESTS - bc->num_active_requests()
+                              : im.max_num_requests_per_batch;
+        size_t max_tkns =
+            transformerConfig.sequence_length * transformerConfig.batch_size -
+            (transformerConfig.incremental_mode ? bc->num_active_tokens() : 0);
+        new_prompts = data_generator.get_requests(max_reqs, max_tkns);
       }
+      for (size_t i = 0; i < new_prompts.second; i++) {
+        size_t guid = new_prompts.first + i;
+        std::pair<size_t, size_t> seq_lens =
+            data_generator.get_request_length(guid);
+        assert(seq_lens.first >= min_input_tokens &&
+               seq_lens.first <= max_input_tokens &&
+               seq_lens.second >= min_tokens_to_generate &&
+               seq_lens.second <= max_tokens_to_generate);
+        assert(bc->register_new_request(guid, seq_lens.first));
+      }
+      bc->prepare_next_batch();
+      // TODO: loading data
+      data_loader.next_batch(ff, bc);
+
+      runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
+      FutureMap fm = im.inference(bid, *bc);
+      runtime->end_trace(ctx, 111 + bid % num_devices /*trace_id*/);
+      assert(fm.get_future_map_domain().get_volume() == 1);
+      future_handlers[bid] = fm.get_future(0);
+      batch_configs[bid] = bc;
     }
   }
   //----------------------- End of inference! ------------------------------
@@ -183,5 +198,5 @@ void FlexFlow::top_level_task(Task const *task,
   double run_time = 1e-6 * (ts_end - ts_start);
   printf("ELAPSED TIME = %.4fs, THROUGHPUT = %.2f requests/s\n",
          run_time,
-         moeConfig.total_requests / run_time);
+         transformerConfig.total_requests / run_time);
 }
diff --git a/examples/cpp/inference/transformers/transformers.h b/examples/cpp/inference/transformers/transformers.h
index 207a5de56b..0957bd33bb 100644
--- a/examples/cpp/inference/transformers/transformers.h
+++ b/examples/cpp/inference/transformers/transformers.h
@@ -13,111 +13,11 @@
  * limitations under the License.
  */
 
-#include "data_generator.h"
-#include "flexflow/model.h"
-#define MAX_NUM_SAMPLES 1000
-#define MNIST_DIMS 28 * 28
-#define DATA_DIM MNIST_DIMS
+#pragma once
 
-using namespace Legion;
-using namespace std;
-using namespace FlexFlow;
+#include "dataloader.h"
+#include "inference_config.h"
 
-struct MoeConfig {
-  MoeConfig(void) {
-    //----------------------- Input/output data ------------------------
-    token_dim = DATA_DIM;
-    sequence_length = 10;
-    batch_size = 32;
-    out_dim = 15;
-    num_labels = out_dim;
-    num_layers = 1;
-    //----------------------- Inference parameters ---------------------
-    // total number of requests processed as part of the simulation
-    total_requests = 256;
-    poisson_distribution = true;
-    // average number of request arrivals per second
-    arrival_rate = 25;
-    num_inflight_batches = 10;
-    //----------------------- MoE layer --------------------------------
-    // total number of experts
-    num_exp = 128;
-    // number of experts in each block of fused experts
-    experts_per_block = 32;
-    // number of experts to route each token to
-    num_select = 2;
-    // expert capacity parameters
-    alpha = 2.0f;   // factor overhead tensor size for imbalance
-    lambda = 0.04f; // multiplier for load balance term
-    // expert hidden size
-    hidden_size = DATA_DIM;
-    //----------------------- Rest of model parameters ------------------
-    // Encoder layer
-    num_attention_heads = 16;
-    attention_kdim = attention_vdim = hidden_size / num_attention_heads;
-    num_encoder_layers = 1;
-  }
-
-  // Input/output data
-  int token_dim;
-  int sequence_length;
-  int batch_size;
-  int out_dim;
-  int num_labels;
-  int num_layers;
-  std::string dataset_path;
-  // Inference parameters
-  int total_requests;
-  bool poisson_distribution;
-  double arrival_rate;
-  int num_inflight_batches;
-  // MoE layer
-  int num_exp;
-  int experts_per_block;
-  int num_select;
-  float alpha;
-  float lambda;
-  int hidden_size;
-  // Model parameters
-  int num_attention_heads;
-  int attention_kdim;
-  int attention_vdim;
-  int num_encoder_layers;
-};
-
-class DataLoader {
-public:
-  DataLoader(FFModel &ff,
-             MoeConfig const &moeConfig,
-             DataGenerator &data_generator,
-             ParallelTensor input,
-             ParallelTensor label);
-  static void load_input(Task const *task,
-                         std::vector<PhysicalRegion> const &regions,
-                         Context ctx,
-                         Runtime *runtime);
-  static void load_label(Task const *task,
-                         std::vector<PhysicalRegion> const &regions,
-                         Context ctx,
-                         Runtime *runtime);
-  static void load_entire_dataset(Task const *task,
-                                  std::vector<PhysicalRegion> const &regions,
-                                  Context ctx,
-                                  Runtime *runtime);
-  void next_batch(FFModel &, size_t);
-  void reset(void);
-
-public:
-  int num_samples, next_index;
-  FlexFlow::ParallelTensor full_input, batch_input;
-  FlexFlow::ParallelTensor full_label, batch_label;
-  struct DataLoaderInput {
-    MoeConfig const &_moeConfig;
-    DataGenerator &_data_generator;
-  };
-};
-
-struct SampleIdxs {
-  int num_samples;
-  int idxs[MAX_NUM_SAMPLES];
+struct TransformerConfig : InferenceConfig {
+  TransformerConfig(void) : InferenceConfig() {}
 };
diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index c2a77cf3d6..c5dd2ac90f 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -16,26 +16,29 @@
 #pragma once
 
 #include <cstdlib>
+#define MAX_SEQ_LEN 1024
+#define BATCH_SIZE 2
+#define MAX_REQUESTS 256
 
 namespace FlexFlow {
 
 struct InferenceResult {
-  static int const MAX_NUM_TOKENS = 1024;
+  static int const MAX_NUM_TOKENS = MAX_SEQ_LEN * BATCH_SIZE;
   int results[MAX_NUM_TOKENS];
 };
 
 class BatchConfig {
 public:
-  BatchConfig();
+  BatchConfig(bool _incremental_mode);
   bool register_new_request(size_t guid, int length);
   void prepare_next_batch();
   int update_results(InferenceResult const &ir);
   bool update_num_active_requests_tokens();
   int num_active_requests() const;
   int num_active_tokens() const;
-  static int const MAX_NUM_REQUESTS = 256;
+  static int const MAX_NUM_REQUESTS = MAX_REQUESTS;
   static int const MAX_NUM_TOKENS = InferenceResult::MAX_NUM_TOKENS;
-  static int const MAX_SEQUENCE_LENGTH = 1024;
+  static int const MAX_SEQUENCE_LENGTH = MAX_SEQ_LEN;
   // These are set by update
   int num_tokens, num_requests;
   bool cached_results;
@@ -44,6 +47,7 @@ class BatchConfig {
   int num_processing_tokens[MAX_NUM_REQUESTS];
   size_t request_guid[MAX_NUM_REQUESTS];
   bool request_completed[MAX_NUM_REQUESTS];
+  bool incremental_mode;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/operator.h b/include/flexflow/operator.h
index 1690e0e3f3..56d4176e10 100644
--- a/include/flexflow/operator.h
+++ b/include/flexflow/operator.h
@@ -187,7 +187,6 @@ class Op {
   // Pure virtual functions that must be implemented
   virtual void init(FFModel const &) = 0;
   virtual void init_inference(FFModel const &,
-                              BatchConfig const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) {
diff --git a/include/flexflow/ops/aggregate.h b/include/flexflow/ops/aggregate.h
index 27b9981ddd..9200c4b123 100644
--- a/include/flexflow/ops/aggregate.h
+++ b/include/flexflow/ops/aggregate.h
@@ -37,7 +37,6 @@ class Aggregate : public Op {
             char const *name = nullptr);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
-                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/aggregate_spec.h b/include/flexflow/ops/aggregate_spec.h
index ce1ceb34d6..2c17674181 100644
--- a/include/flexflow/ops/aggregate_spec.h
+++ b/include/flexflow/ops/aggregate_spec.h
@@ -29,7 +29,6 @@ class AggregateSpec : public Op {
                 char const *name);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
-                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/attention.h b/include/flexflow/ops/attention.h
index c3146ad38b..3f4c14593f 100644
--- a/include/flexflow/ops/attention.h
+++ b/include/flexflow/ops/attention.h
@@ -66,7 +66,6 @@ class MultiHeadAttention : public Op {
                                  std::vector<ParallelTensor> const &inputs);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
-                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/element_binary.h b/include/flexflow/ops/element_binary.h
index 5a14acb80b..9c2e6c1252 100644
--- a/include/flexflow/ops/element_binary.h
+++ b/include/flexflow/ops/element_binary.h
@@ -27,7 +27,6 @@ class ElementBinary : public Op {
                 bool inplace_a = false);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
-                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/experts.h b/include/flexflow/ops/experts.h
index 58640ec085..e75a14089c 100644
--- a/include/flexflow/ops/experts.h
+++ b/include/flexflow/ops/experts.h
@@ -64,7 +64,7 @@ class ExpertsMeta : public OpMeta {
 };
 
 // definitions for the CUDA kernel
-#define MAX_BATCH_SIZE 32 * 10
+#define MAX_BATCH_SIZE 1024 * 2 // 32 * 10
 #define MAX_EXPERTS_PER_BLOCK 32
 
 class Experts : public Op {
@@ -96,7 +96,6 @@ class Experts : public Op {
 
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
-                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/groupby.h b/include/flexflow/ops/groupby.h
index bef61dc755..ae421751c3 100644
--- a/include/flexflow/ops/groupby.h
+++ b/include/flexflow/ops/groupby.h
@@ -36,7 +36,6 @@ class Group_by : public Op {
            char const *name = nullptr);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
-                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index 4f2dc80635..c60f2089cc 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -60,7 +60,6 @@ class IncMultiHeadSelfAttention : public Op {
                                  std::vector<ParallelTensor> const &inputs);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
-                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/layer_norm.h b/include/flexflow/ops/layer_norm.h
index 284f42a716..60987471b2 100644
--- a/include/flexflow/ops/layer_norm.h
+++ b/include/flexflow/ops/layer_norm.h
@@ -26,7 +26,6 @@ class LayerNorm : public Op {
             char const *name);
   void init(FFModel const &);
   void init_inference(FFModel const &,
-                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/linear.h b/include/flexflow/ops/linear.h
index b0af71e610..666d9228ab 100644
--- a/include/flexflow/ops/linear.h
+++ b/include/flexflow/ops/linear.h
@@ -37,7 +37,6 @@ class Linear : public Op {
 
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
-                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/noop.h b/include/flexflow/ops/noop.h
index 91ccc15094..add4150e85 100644
--- a/include/flexflow/ops/noop.h
+++ b/include/flexflow/ops/noop.h
@@ -19,7 +19,6 @@ class NoOp : public Op {
        char const *name = NULL);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
-                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/softmax.h b/include/flexflow/ops/softmax.h
index 85eecfb744..04f1283f89 100644
--- a/include/flexflow/ops/softmax.h
+++ b/include/flexflow/ops/softmax.h
@@ -23,7 +23,6 @@ class Softmax : public Op {
           char const *name = nullptr);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
-                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/topk.h b/include/flexflow/ops/topk.h
index 138c11b4d7..ec3691ea11 100644
--- a/include/flexflow/ops/topk.h
+++ b/include/flexflow/ops/topk.h
@@ -30,7 +30,6 @@ class TopK : public Op {
        char const *name = nullptr);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
-                      BatchConfig const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/parallel_ops/partition.h b/include/flexflow/parallel_ops/partition.h
index 1658759411..21eda315ed 100644
--- a/include/flexflow/parallel_ops/partition.h
+++ b/include/flexflow/parallel_ops/partition.h
@@ -31,7 +31,6 @@ class Repartition : public ParallelOp {
       std::vector<ParallelTensor> const &batch_outputs) override;
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
-                      BatchConfig const &bc,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
diff --git a/src/ops/aggregate.cc b/src/ops/aggregate.cc
index 12ab38efad..304331f485 100644
--- a/src/ops/aggregate.cc
+++ b/src/ops/aggregate.cc
@@ -183,7 +183,6 @@ Node Aggregate::deserialize(FFModel &ff,
 }
 
 void Aggregate::init_inference(FFModel const &ff,
-                               BatchConfig const &bc,
                                std::vector<ParallelTensor> const &batch_inputs,
                                std::vector<ParallelTensor> const &batch_outputs,
                                MachineView const *mv) {
diff --git a/src/ops/aggregate_spec.cc b/src/ops/aggregate_spec.cc
index b5c3551cb3..e076695a2f 100644
--- a/src/ops/aggregate_spec.cc
+++ b/src/ops/aggregate_spec.cc
@@ -157,7 +157,6 @@ AggregateSpec::AggregateSpec(FFModel &model,
 
 void AggregateSpec::init_inference(
     FFModel const &ff,
-    BatchConfig const &bc,
     std::vector<ParallelTensor> const &batch_inputs,
     std::vector<ParallelTensor> const &batch_outputs,
     MachineView const *mv) {
diff --git a/src/ops/attention.cc b/src/ops/attention.cc
index f0195c95d6..75923e8da2 100644
--- a/src/ops/attention.cc
+++ b/src/ops/attention.cc
@@ -374,7 +374,6 @@ MultiHeadAttention::MultiHeadAttention(
 
 void MultiHeadAttention::init_inference(
     FFModel const &ff,
-    BatchConfig const &bc,
     std::vector<ParallelTensor> const &batch_inputs,
     std::vector<ParallelTensor> const &batch_outputs,
     MachineView const *mv) {
diff --git a/src/ops/element_binary.cc b/src/ops/element_binary.cc
index 01f68919bd..11d5ff6012 100644
--- a/src/ops/element_binary.cc
+++ b/src/ops/element_binary.cc
@@ -262,7 +262,6 @@ void ElementBinary::do_inplace_output(void) {
 
 void ElementBinary::init_inference(
     FFModel const &ff,
-    BatchConfig const &bc,
     std::vector<ParallelTensor> const &batch_inputs,
     std::vector<ParallelTensor> const &batch_outputs,
     MachineView const *mv) {
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index b57874ac35..60a9948ec0 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -438,7 +438,6 @@ Node Experts::deserialize(FFModel &ff,
 }
 
 void Experts::init_inference(FFModel const &ff,
-                             BatchConfig const &bc,
                              std::vector<ParallelTensor> const &batch_inputs,
                              std::vector<ParallelTensor> const &batch_outputs,
                              MachineView const *mv) {
diff --git a/src/ops/group_by.cc b/src/ops/group_by.cc
index ae274a1672..53c78538e2 100644
--- a/src/ops/group_by.cc
+++ b/src/ops/group_by.cc
@@ -165,7 +165,6 @@ Group_by::Group_by(FFModel &model,
           model, inputs.first, inputs.second, params.n, params.alpha, name) {}
 
 void Group_by::init_inference(FFModel const &ff,
-                              BatchConfig const &bc,
                               std::vector<ParallelTensor> const &batch_inputs,
                               std::vector<ParallelTensor> const &batch_outputs,
                               MachineView const *mv) {
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index efbf8636de..fc423caea3 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -345,7 +345,6 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
 
 void IncMultiHeadSelfAttention::init_inference(
     FFModel const &ff,
-    BatchConfig const &bc,
     std::vector<ParallelTensor> const &batch_inputs,
     std::vector<ParallelTensor> const &batch_outputs,
     MachineView const *mv) {
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index dfd89c1fe6..4f0703dcc6 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -195,7 +195,6 @@ LayerNorm::LayerNorm(FFModel &model,
 }
 
 void LayerNorm::init_inference(FFModel const &ff,
-                               BatchConfig const &bc,
                                std::vector<ParallelTensor> const &batch_inputs,
                                std::vector<ParallelTensor> const &batch_outputs,
                                MachineView const *mv) {
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index 84a962c998..381110a4d3 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -255,7 +255,6 @@ void Linear::init(FFModel const &ff) {
 }
 
 void Linear::init_inference(FFModel const &ff,
-                            BatchConfig const &bc,
                             std::vector<ParallelTensor> const &batch_inputs,
                             std::vector<ParallelTensor> const &batch_outputs,
                             MachineView const *mv) {
diff --git a/src/ops/noop.cc b/src/ops/noop.cc
index 2a2686cabd..d35d5d48b7 100644
--- a/src/ops/noop.cc
+++ b/src/ops/noop.cc
@@ -96,7 +96,6 @@ OpMeta *NoOp::init_task(Task const *task,
 }
 
 void NoOp::init_inference(FFModel const &ff,
-                          BatchConfig const &bc,
                           std::vector<ParallelTensor> const &batch_inputs,
                           std::vector<ParallelTensor> const &batch_outputs,
                           MachineView const *mv) {
diff --git a/src/ops/softmax.cc b/src/ops/softmax.cc
index 310c835ab8..9543e34a90 100644
--- a/src/ops/softmax.cc
+++ b/src/ops/softmax.cc
@@ -116,7 +116,6 @@ Softmax::Softmax(FFModel &model,
     : Softmax(model, input, params.dim, name) {}
 
 void Softmax::init_inference(FFModel const &ff,
-                             BatchConfig const &bc,
                              std::vector<ParallelTensor> const &batch_inputs,
                              std::vector<ParallelTensor> const &batch_outputs,
                              MachineView const *mv) {
diff --git a/src/ops/topk.cc b/src/ops/topk.cc
index 6192010c51..5cefe955b1 100644
--- a/src/ops/topk.cc
+++ b/src/ops/topk.cc
@@ -137,7 +137,6 @@ TopK::TopK(FFModel &model,
     : TopK(model, input, params.k, params.sorted, name) {}
 
 void TopK::init_inference(FFModel const &ff,
-                          BatchConfig const &bc,
                           std::vector<ParallelTensor> const &batch_inputs,
                           std::vector<ParallelTensor> const &batch_outputs,
                           MachineView const *mv) {
diff --git a/src/parallel_ops/partition.cc b/src/parallel_ops/partition.cc
index 49ae3222f0..aaa28b7576 100644
--- a/src/parallel_ops/partition.cc
+++ b/src/parallel_ops/partition.cc
@@ -103,7 +103,6 @@ OpMeta *Repartition::init_task(Task const *task,
 
 void Repartition::init_inference(
     FFModel const &ff,
-    BatchConfig const &bc,
     std::vector<ParallelTensor> const &batch_inputs,
     std::vector<ParallelTensor> const &batch_outputs,
     MachineView const *mv) {
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index 936590905b..d58204b7c3 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -21,7 +21,8 @@ namespace FlexFlow {
 
 LegionRuntime::Logger::Category log_bc("BatchConfig");
 
-BatchConfig::BatchConfig() {
+BatchConfig::BatchConfig(bool _incremental_mode)
+    : incremental_mode(_incremental_mode) {
   cached_results = false;
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
     token_start_idx[i] = 0;
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 5c8be135a4..dcb6e9e67d 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -111,8 +111,7 @@ void InferenceManager::init_operators_inference() {
           ((ParallelOp *)op)
               ->create_input_partition_inference(*model, inputs, outputs);
         }
-        BatchConfig bc;
-        op->init_inference(*model, bc, inputs, outputs, view);
+        op->init_inference(*model, inputs, outputs, view);
       }
     }
   }

From 61f53ba5d8bc1b4729f0981a811b712baf753df6 Mon Sep 17 00:00:00 2001
From: daiyaanarfeen <marfeen@andrew.cmu.edu>
Date: Sun, 19 Mar 2023 10:02:14 -0700
Subject: [PATCH 075/344] [Tensor Equal] ParallelTensor comparison (#613)

* [Tensor Equal] Task signature

* Tensor Equal task implementation

* linting

* Revert "linting"

This reverts commit b9762f65697e6490386cd6cca5071b8d4afad1b4.

* linting

---------

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
---
 include/flexflow/model.h           |  2 +
 include/flexflow/parallel_tensor.h | 14 +++++++
 scripts/format.sh                  |  2 +-
 src/mapper/mapper.cc               |  5 +++
 src/runtime/model.cc               |  9 +++++
 src/runtime/parallel_tensor.cc     | 62 ++++++++++++++++++++++++++++++
 6 files changed, 93 insertions(+), 1 deletion(-)

diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 4d55f574b2..35b2c13d40 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -225,6 +225,8 @@ enum TaskIDs {
   // Make sure PYTHON_TOP_LEVEL_TASK_ID is
   // consistent with python/main.cc
   PYTHON_TOP_LEVEL_TASK_ID = 11111,
+  // Tensor Equal Task
+  TENSOR_EQUAL_TASK_ID,
 };
 
 enum ShardingID {
diff --git a/include/flexflow/parallel_tensor.h b/include/flexflow/parallel_tensor.h
index db77b49030..d06ecd7bac 100644
--- a/include/flexflow/parallel_tensor.h
+++ b/include/flexflow/parallel_tensor.h
@@ -169,6 +169,20 @@ struct ParallelTensorBase {
   bool get_tensor(FFModel const *model, T *data, bool get_parameters);
   ParallelTensorShape get_shape() const;
 
+  template <typename T>
+  bool tensor_equal(FFConfig &config, ParallelTensorBase &tensor);
+  static bool
+      tensor_equal_task(Legion::Task const *task,
+                        std::vector<Legion::PhysicalRegion> const &regions,
+                        Legion::Context ctx,
+                        Legion::Runtime *runtime);
+  template <int NDIM>
+  static bool tensor_equal_task_with_dim(
+      Legion::Task const *task,
+      std::vector<Legion::PhysicalRegion> const &regions,
+      Legion::Context ctx,
+      Legion::Runtime *runtime);
+
 private:
   template <typename T>
   bool get_input_sub_tensor_via_mappings(ParallelConfig const &pc,
diff --git a/scripts/format.sh b/scripts/format.sh
index 6340a33864..bf13948955 100755
--- a/scripts/format.sh
+++ b/scripts/format.sh
@@ -67,5 +67,5 @@ if [[ ! -e $CLANG_FORMAT_PATH ]]; then
   chmod u+x "$CLANG_FORMAT_PATH"
 fi
 
-mapfile -t FILES < <(git ls-files | grep -E '\.(h|cc|cpp|cu)$')
+mapfile -t FILES < <(git ls-files | grep -E '\.(h|cc|cpp|cu)$' | grep -v '^triton')
 "$CLANG_FORMAT_PATH" -i "${FILES[@]}"
diff --git a/src/mapper/mapper.cc b/src/mapper/mapper.cc
index f89c9b4e63..a0b3dba3ff 100644
--- a/src/mapper/mapper.cc
+++ b/src/mapper/mapper.cc
@@ -362,6 +362,11 @@ void FFMapper::select_task_options(const MapperContext ctx,
     }
   }
 
+  if (task.task_id == TENSOR_EQUAL_TASK_ID) {
+    output.initial_proc = all_cpus[0];
+    return;
+  }
+
   // Assert that all single tasks should be handled and returned before
   // So task must be an indextask
   if (!task.is_index_space) {
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 5086d7bb3f..7fcf1ef61f 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -4792,6 +4792,15 @@ void register_flexflow_internal_tasks() {
     Runtime::preregister_task_variant<UtilityTasks::dummy_task>(
         registrar, "Weights Prefetch Task");
   }
+  // Tensor Equal task
+  {
+    TaskVariantRegistrar registrar(TENSOR_EQUAL_TASK_ID, "Tensor Equal");
+    registrar.add_constraint(ProcessorConstraint(Processor::LOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<bool,
+                                      ParallelTensorBase::tensor_equal_task>(
+        registrar, "Tensor Equal Task");
+  }
 }
 
 // template instantiations
diff --git a/src/runtime/parallel_tensor.cc b/src/runtime/parallel_tensor.cc
index 963ad8af73..a64d118fbc 100644
--- a/src/runtime/parallel_tensor.cc
+++ b/src/runtime/parallel_tensor.cc
@@ -747,6 +747,64 @@ bool ParallelTensorBase::get_tensor(FFModel const *ff,
   return true;
 }
 
+template <typename T>
+bool ParallelTensorBase::tensor_equal(FFConfig &config,
+                                      ParallelTensorBase &tensor) {
+  Context ctx = config.lg_ctx;
+  Runtime *runtime = config.lg_hlr;
+  TaskLauncher launcher(TENSOR_EQUAL_TASK_ID,
+                        TaskArgument(&num_dims, sizeof(num_dims)));
+  launcher.add_region_requirement(
+      RegionRequirement(region, READ_ONLY, EXCLUSIVE, region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(
+      RegionRequirement(tensor.region, READ_ONLY, EXCLUSIVE, tensor.region));
+  launcher.add_field(1, FID_DATA);
+  Future result = runtime->execute_task(ctx, launcher);
+  bool equals = result.get_result<bool>();
+}
+
+bool ParallelTensorBase::tensor_equal_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  assert(regions.size() == 2);
+  int dim = *(int const *)task->args;
+  switch (dim) {
+#define DIMFUNC(DIM)                                                           \
+  case DIM:                                                                    \
+    return tensor_equal_task_with_dim<DIM>(task, regions, ctx, runtime);
+    LEGION_FOREACH_N(DIMFUNC)
+#undef DIMFUNC
+    default:
+      assert(false);
+  }
+  assert(false);
+}
+
+template <int NDIM>
+bool ParallelTensorBase::tensor_equal_task_with_dim(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  TensorAccessorR<float, NDIM> acc1(
+      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  TensorAccessorR<float, NDIM> acc2(
+      regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  float const *data1 = acc1.ptr;
+  float const *data2 = acc2.ptr;
+  bool equal = true;
+  for (int i = 0; i < acc1.rect.volume(); i++) {
+    if (data1[i] != data2[i]) {
+      equal = false;
+      break;
+    }
+  }
+  return equal;
+}
+
 template float *ParallelTensorBase::get_raw_ptr<float>(FFConfig &config);
 template int32_t *ParallelTensorBase::get_raw_ptr<int32_t>(FFConfig &config);
 
@@ -796,6 +854,10 @@ template bool ParallelTensorBase::get_tensor<int64_t>(FFModel const *ff,
                                                       int64_t *data,
                                                       bool get_gradients);
 
+template bool
+    ParallelTensorBase::tensor_equal<float>(FFConfig &config,
+                                            ParallelTensorBase &tensor);
+
 template bool TensorBase::get_output_parallel_tensor<float>(FFModel const *ff,
                                                             float *data,
                                                             bool get_gradients);

From 5b21ae8f167c9bde5f564d39a4dcde2824d7b0ea Mon Sep 17 00:00:00 2001
From: zwang86 <46699021+zwang86@users.noreply.github.com>
Date: Fri, 24 Mar 2023 16:19:44 -0400
Subject: [PATCH 076/344] [MoE][Experts] Fixed bug and verified experts kernel
 (#661)

* Fixed bug with bias in experts kernel.

* Removed debug output and formatted code.
---
 src/ops/experts.cc | 180 +++++++++++++++++++++++++++++++++++++++++++++
 src/ops/experts.cu |   6 +-
 2 files changed, 185 insertions(+), 1 deletion(-)

diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index 60a9948ec0..bfe3e73ee1 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/ops/experts.h"
+#include "flexflow/utils/cuda_helper.h"
 #include "legion/legion_utilities.h"
 
 namespace FlexFlow {
@@ -37,6 +38,7 @@ using PCG::Node;
 
 static constexpr int KERNEL_IDX = 0;
 static constexpr int BIAS_IDX = 1;
+static bool DEBUG_MODE = false;
 
 // For now, we use one input and one output per expert
 Tensor FFModel::experts(Tensor const *inputs,
@@ -839,6 +841,140 @@ void Experts::inference_task(Task const *task,
     }
   }
 
+  if (DEBUG_MODE) {
+    std::cout << "forward_kernel_wrapper" << std::endl
+              << "-------------------------------" << std::endl;
+    std::cout << m->data_dim << std::endl;
+    std::cout << m->out_dim << std::endl;
+    std::cout << m->num_chosen_experts << std::endl;
+    std::cout << m->effective_batch_size << std::endl;
+    std::cout << m->num_experts << std::endl;
+    std::cout << m->use_bias << std::endl;
+
+    /* ----------------Input Token--------------*/
+    float *cpu_input_ptr = new float[data_dim];
+    checkCUDA(cudaMemcpy(cpu_input_ptr,
+                         input_ptr,
+                         data_dim * sizeof(float),
+                         cudaMemcpyDeviceToHost));
+
+    srand(42);
+    float cpu_sum = 0;
+    for (int i = 0; i < data_dim; i++) {
+      // cpu_input_ptr[i] = (float)rand() / (float)RAND_MAX;
+      cpu_input_ptr[i] = float(i) / (float)data_dim;
+      cpu_sum += cpu_input_ptr[i];
+    }
+    std::cout << "[CPU] Token 0 sum = " << cpu_sum << std::endl;
+    std::cout << "Total token number = " << batch_size << std::endl;
+    for (int i = 0; i < batch_size; i++) {
+      checkCUDA(cudaMemcpy((float *)(input_ptr + i * data_dim),
+                           cpu_input_ptr,
+                           data_dim * sizeof(float),
+                           cudaMemcpyHostToDevice));
+    }
+    free(cpu_input_ptr);
+
+    /* ----------------indices--------------*/
+    int *cpu_indices_ptr = new int[chosen_experts * batch_size];
+    checkCUDA(cudaMemcpy(cpu_indices_ptr,
+                         indices_ptr,
+                         chosen_experts * batch_size * sizeof(int),
+                         cudaMemcpyDeviceToHost));
+    for (int i = 0; i < chosen_experts * 10; i++) {
+      if (i % 2 == 1) {
+        cpu_indices_ptr[i] += chosen_experts;
+      }
+    }
+    checkCUDA(cudaMemcpy((int *)indices_ptr,
+                         cpu_indices_ptr,
+                         chosen_experts * batch_size * sizeof(int),
+                         cudaMemcpyHostToDevice));
+    free(cpu_indices_ptr);
+
+    /* ----------------coefficient--------------*/
+    float *cpu_topk_gate_pred_ptr = new float[chosen_experts * batch_size];
+    checkCUDA(cudaMemcpy(cpu_topk_gate_pred_ptr,
+                         topk_gate_pred_ptr,
+                         chosen_experts * batch_size * sizeof(float),
+                         cudaMemcpyDeviceToHost));
+    for (int i = 0; i < chosen_experts * batch_size; i++) {
+      if (i % 2 == 0) {
+        cpu_topk_gate_pred_ptr[i] = 0.5;
+      } else {
+        cpu_topk_gate_pred_ptr[i] = 0.1;
+      }
+    }
+    checkCUDA(cudaMemcpy((float *)topk_gate_pred_ptr,
+                         cpu_topk_gate_pred_ptr,
+                         chosen_experts * batch_size * sizeof(float),
+                         cudaMemcpyHostToDevice));
+    free(cpu_topk_gate_pred_ptr);
+
+    /* ----------------Expert Weights--------------*/
+    float *cpu_experts_1 = new float[data_dim * out_dim];
+    float *cpu_experts_2 = new float[data_dim * out_dim];
+    checkCUDA(cudaMemcpy(cpu_experts_1,
+                         weights_ptrs[0],
+                         data_dim * out_dim * sizeof(float),
+                         cudaMemcpyDeviceToHost));
+    checkCUDA(cudaMemcpy(cpu_experts_2,
+                         weights_ptrs[2],
+                         data_dim * out_dim * sizeof(float),
+                         cudaMemcpyDeviceToHost));
+    cpu_sum = 0;
+    for (int i = 0; i < data_dim * out_dim; i++) {
+      cpu_experts_1[i] = float(i) / float(data_dim * out_dim);
+      cpu_sum += cpu_experts_1[i];
+    }
+    std::cout << "[CPU] Experts 0 weights sum = " << cpu_sum << std::endl;
+
+    for (int i = 0; i < data_dim * out_dim; i++) {
+      cpu_experts_2[i] =
+          float(data_dim * out_dim - i) / float(data_dim * out_dim);
+      cpu_sum += cpu_experts_2[i];
+    }
+    std::cout << "[CPU] Experts 1 weights sum = " << cpu_sum << std::endl;
+
+    for (int i = 0; i < num_experts; i++) {
+      if (i % 2 == 0) {
+        checkCUDA(cudaMemcpy((float *)weights_ptrs[i * (1 + use_bias)],
+                             cpu_experts_1,
+                             data_dim * out_dim * sizeof(float),
+                             cudaMemcpyHostToDevice));
+      } else {
+        checkCUDA(cudaMemcpy((float *)weights_ptrs[i * (1 + use_bias)],
+                             cpu_experts_2,
+                             data_dim * out_dim * sizeof(float),
+                             cudaMemcpyHostToDevice));
+      }
+    }
+    free(cpu_experts_1);
+    free(cpu_experts_2);
+
+    /* ----------------Expert Bias--------------*/
+    if (use_bias) {
+      float *bias_experts_1 = new float[out_dim];
+      checkCUDA(cudaMemcpy(bias_experts_1,
+                           weights_ptrs[1],
+                           out_dim * sizeof(float),
+                           cudaMemcpyDeviceToHost));
+      cpu_sum = 0;
+      for (int i = 0; i < out_dim; i++) {
+        cpu_sum += bias_experts_1[i];
+        // bias_experts_1[i] = 1.0f;
+      }
+      std::cout << "[CPU] Bias 0 sum = " << cpu_sum << std::endl;
+      for (int i = 0; i < num_experts; i++) {
+        checkCUDA(cudaMemcpy((float *)weights_ptrs[i * (1 + use_bias) + 1],
+                             bias_experts_1,
+                             out_dim * sizeof(float),
+                             cudaMemcpyHostToDevice));
+      }
+      free(bias_experts_1);
+    }
+  }
+
   Experts::forward_kernel_wrapper(m,
                                   input_ptr,
                                   indices_ptr,
@@ -848,6 +984,50 @@ void Experts::inference_task(Task const *task,
                                   chosen_experts,
                                   batch_size,
                                   out_dim);
+
+  if (DEBUG_MODE) {
+    /* ----------------Output after computation--------------*/
+    float *cpu_output_ptr = new float[batch_size * out_dim];
+    float cpu_sum = 0;
+    checkCUDA(cudaMemcpy(cpu_output_ptr,
+                         output_ptr,
+                         batch_size * out_dim * sizeof(float),
+                         cudaMemcpyDeviceToHost));
+    for (int j = 0; j < batch_size * out_dim; j += out_dim) {
+      cpu_sum = 0;
+      for (int i = 0; i < out_dim; i++) {
+        cpu_sum += cpu_output_ptr[j + i];
+      }
+      // if ((j/out_dim) < 50) std::cout << "[CPU] output " << (j/out_dim) << "
+      // sum = " << cpu_sum << std::endl;
+      if (cpu_sum > 0.0f) {
+        std::cout << "[CPU] output " << (j / out_dim) << " sum = " << cpu_sum
+                  << std::endl;
+      }
+    }
+    std::cout << "[CPU] output 0's 10th element = " << cpu_output_ptr[10]
+              << std::endl;
+    std::cout << "[CPU] output 0's 99th element = " << cpu_output_ptr[99]
+              << std::endl;
+    std::cout << "[CPU] output 0's 123th element = " << cpu_output_ptr[123]
+              << std::endl;
+
+    /* refrence output */
+    /*
+     * Input token sum = 391.5
+     * Expert 0 weights sum = 307327.5
+     * Expert 1 weights sum = 307328.47
+     *  ------------------
+     * experts 0's reulst = 153533.1
+     * experts 1's reulst = 153402.9
+     * Aggreated Result = 92106.836
+     * 10th element = 41.28053
+     * 99th element = 59.057823
+     * 123th element = 63.8517
+     */
+
+    free(cpu_output_ptr);
+  }
 }
 
 void Experts::forward_task(Task const *task,
diff --git a/src/ops/experts.cu b/src/ops/experts.cu
index 803d6da6c4..3cd86ed56b 100644
--- a/src/ops/experts.cu
+++ b/src/ops/experts.cu
@@ -306,7 +306,7 @@ void experts_forward_GemmBatched_kernel(ExpertsMeta const *m,
   if (m->use_bias) {
     checkCUDA(cublasGemmBatchedEx(
         m->handle.blas,
-        CUBLAS_OP_T, // Bias, shape (out_dim, 1)
+        CUBLAS_OP_N, // Bias, shape (out_dim, 1)
         CUBLAS_OP_N, // Coefficient, shape (1, 1)
         out_dim,     // num_row of (A, C) = out_dim
         1,           // num_col of (B, C) = 1
@@ -559,6 +559,10 @@ ExpertsMeta::ExpertsMeta(FFHandler handler,
   checkCUDA(cudaMalloc(&batch_outputs[0],
                        out_dim * num_chosen_experts * effective_batch_size *
                            sizeof(float)));
+  checkCUDA(cudaMemset(batch_outputs[0],
+                       0,
+                       out_dim * num_chosen_experts * effective_batch_size *
+                           sizeof(float)));
   for (int i = 1; i < num_chosen_experts * effective_batch_size; i++) {
     batch_outputs[i] = batch_outputs[i - 1] + out_dim * sizeof(float);
   }

From c1d52bc908e411eaec8232e53fa2959dc699f658 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 24 Mar 2023 16:26:18 -0400
Subject: [PATCH 077/344] maybe fix

---
 conda/flexflow-cpu.yml | 7 +++----
 1 file changed, 3 insertions(+), 4 deletions(-)

diff --git a/conda/flexflow-cpu.yml b/conda/flexflow-cpu.yml
index e4e614b265..6bd9d6d663 100644
--- a/conda/flexflow-cpu.yml
+++ b/conda/flexflow-cpu.yml
@@ -12,9 +12,8 @@ dependencies:
   - pytest
   - pip
   - pip:
-    - --extra-index-url https://download.pytorch.org/whl/cpu
     - qualname>=0.1.0
     - keras_preprocessing>=1.1.2
-    - torch==1.13.1+cpu
-    - torchaudio==0.13.1+cpu
-    - torchvision
+    - torch --index-url https://download.pytorch.org/whl/cpu
+    - torchaudio --index-url https://download.pytorch.org/whl/cpu
+    - torchvision --index-url https://download.pytorch.org/whl/cpu

From d2b97a199cd630f6afa11b1bc461b30c619d75d3 Mon Sep 17 00:00:00 2001
From: zwang86 <46699021+zwang86@users.noreply.github.com>
Date: Sun, 26 Mar 2023 04:55:46 -0400
Subject: [PATCH 078/344] [Inference] - Incremental MHA implementation for
 autoregressive inference demo (#647)

* Initial commit.

* kvCache member of IncMultiHeadSelfAttentionMeta allocated after cudnn buffers / before reserveSpace; comment out measure_operator_cost

* add qkv projection operation

* bug fixing and formatting

* Add request_token_id struct.

* store output of QKV into key and value caches

* [kvStore] bug fix

* Fix bugs with BatchConfig prepare_next_batch.

* Update fixation on BatchConfig.

* remove clutter

* linting

* Update request_id assignment logic.

* illegal memory address fix

* minor bug fixes

* copy rid/tid stuct to device

* added support for multi-heads in kv caching

* linting

* reduced num_inflight_batches

* iter loop fix

* implemented attention first matmul and softmax

* finished all kernels

* linting

* fix

* fix compilation bugs

* fix hip build error

* linting

* bug fix

* further debugging

* fix dataloader-inference bug. now tensors are no longer filled with 0.

* add function to download tensors to gpu. start implementing mha ops check

* add templates decl

* typo

* link with c++ torch for debugging

* backup

* load weights

* linting

* fixed bugs, more progress in C++ mha check impl

* finished validating all the way to k/v caching. fixed several bugs

* update

* fixed config

* fix

* fix bug, implement q*t matmul in c++

* fixed several bugs, finished verifying up to right before softmax

* memory release

* fix softmax

* verified matmul by v

* fixed bugs in output projection

* ptr check/free

* synch thread, add flag to turn on/off checking

* fix libtorch settings

* ci fix

* fix transformer example

* fix

* bug fix

* fix dimension in c++ k/v cache

* fix cache

* cleanup

* fix comments

* bug fixes for incremental phase

* more bug fixing

* fix bugs

* add transformer test to CI

* nit

* fixed bugs in expert layer

---------

Co-authored-by: Daiyaan <marfeen@andrew.cmu.edu>
Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
Co-authored-by: Daiyaan Arfeen <daiyaanarfeen@cmu.edu>
---
 CMakeLists.txt                                |  26 +-
 config/config.inc                             |  15 +-
 config/config.linux                           |  13 +-
 examples/cpp/inference/data_generator.cc      |   7 +
 examples/cpp/inference/dataloader.cc          |  69 +-
 examples/cpp/inference/dataloader.cu          |  49 +-
 examples/cpp/inference/dataloader.h           |  15 +-
 examples/cpp/inference/inference_config.h     |  18 +-
 .../cpp/inference/mixture_of_experts/moe.cc   |  47 +-
 .../inference/transformers/transformers.cc    |  76 +-
 .../cpp/inference/transformers/transformers.h |   4 +-
 include/flexflow/batch_config.h               |  48 +-
 include/flexflow/model.h                      |   2 +-
 include/flexflow/ops/experts.h                |   1 +
 .../ops/inc_multihead_self_attention.h        |  33 +-
 include/flexflow/utils/cuda_helper.h          |   3 +
 src/ops/experts.cc                            |   8 +-
 src/ops/experts.cpp                           |   1 +
 src/ops/experts.cu                            |  62 +-
 src/ops/inc_multihead_self_attention.cc       | 841 ++++++++++++++++--
 src/ops/inc_multihead_self_attention.cpp      | 192 +---
 src/ops/inc_multihead_self_attention.cu       | 722 +++++++++++----
 src/runtime/batch_config.cc                   | 128 ++-
 src/runtime/cuda_helper.cu                    |  23 +
 tests/cpp_gpu_tests.sh                        |   2 +
 25 files changed, 1739 insertions(+), 666 deletions(-)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index 8be1c10ce8..392377bf68 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -14,6 +14,15 @@ set(CMAKE_MODULE_PATH ${CMAKE_MODULE_PATH} ${CMAKE_CURRENT_LIST_DIR}/cmake)
 set(FLEXFLOW_ROOT ${CMAKE_CURRENT_LIST_DIR})
 set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -UNDEBUG")
 
+option(INFERENCE_TESTS "Run inference tests" OFF)
+set(LIBTORCH_PATH "${CMAKE_CURRENT_SOURCE_DIR}/../libtorch" CACHE STRING "LibTorch Path")
+if (INFERENCE_TESTS)
+  find_package(Torch REQUIRED PATHS ${LIBTORCH_PATH} NO_DEFAULT_PATH)
+  set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} ${TORCH_CXX_FLAGS}")
+  message(STATUS "LIBTORCH_PATH: ${LIBTORCH_PATH}")
+  message(STATUS "TORCH_LIBRARIES: ${TORCH_LIBRARIES}")
+endif()
+
 # Set a default build type if none was specified
 set(default_build_type "Debug")
 if(NOT CMAKE_BUILD_TYPE AND NOT CMAKE_CONFIGURATION_TYPES)
@@ -85,10 +94,10 @@ set(LD_FLAGS $ENV{LD_FLAGS})
 
 # Set global FLAGS
 list(APPEND CC_FLAGS
-  -std=c++11)
+  -std=c++14)
 
 list(APPEND NVCC_FLAGS
-  -std=c++11)
+  -std=c++14)
 
 add_compile_options(${CC_FLAGS})
 set(CUDA_NVCC_FLAGS ${CUDA_NVCC_FLAGS} ${NVCC_FLAGS})
@@ -135,6 +144,14 @@ if(FF_USE_NCCL)
     -DFF_USE_NCCL)
 endif()
 
+# Inference tests
+if(INFERENCE_TESTS)
+  list(APPEND FF_CC_FLAGS
+    -DINFERENCE_TESTS)
+  list(APPEND FF_NVCC_FLAGS
+    -DINFERENCE_TESTS)
+endif()
+
 # Legion
 include(legion)
 
@@ -321,6 +338,11 @@ if(FF_USE_NCCL)
   add_dependencies(flexflow ${NCCL_NAME})
 endif()
 
+if (INFERENCE_TESTS)
+  target_link_libraries(flexflow "${TORCH_LIBRARIES}")
+  set_property(TARGET flexflow PROPERTY CXX_STANDARD 14)
+endif()
+
 # build binary
 option(FF_BUILD_RESNET "build resnet example" OFF)
 option(FF_BUILD_RESNEXT "build resnext example" OFF)
diff --git a/config/config.inc b/config/config.inc
index 2308b8b66b..c9eb554cb4 100644
--- a/config/config.inc
+++ b/config/config.inc
@@ -27,6 +27,19 @@ if [ -n "$INSTALL_DIR" ]; then
   SET_INSTALL_DIR="-DCMAKE_INSTALL_PREFIX=${INSTALL_DIR}"
 fi
 
+if [ "$INFERENCE_TESTS" = "ON" ]; then
+  SET_INFERENCE_TESTS="-DINFERENCE_TESTS=ON"
+else
+  SET_INFERENCE_TESTS="-DINFERENCE_TESTS=OFF"
+fi
+
+#set cmake prefix path dir
+if [ -n "$LIBTORCH_PATH" ]; then
+  SET_LIBTORCH_PATH="-DLIBTORCH_PATH=${LIBTORCH_PATH}"
+else
+  SET_LIBTORCH_PATH=""
+fi
+
 # set build type
 if [ -n "$BUILD_TYPE" ]; then
   SET_BUILD="-DCMAKE_BUILD_TYPE=${BUILD_TYPE}"
@@ -189,7 +202,7 @@ if [ -n "$FF_GPU_BACKEND" ]; then
   fi
 fi
 
-CMAKE_FLAGS="-DCUDA_USE_STATIC_CUDA_RUNTIME=OFF ${SET_CC} ${SET_CXX} ${SET_INSTALL_DIR} ${SET_BUILD} ${SET_CUDA_ARCH} ${SET_CUDA} ${SET_CUDNN} ${SET_PYTHON} ${SET_NCCL} ${SET_GASNET} ${SET_EXAMPLES} ${SET_INFERENCE_EXAMPLES} ${SET_USE_PREBUILT_LEGION} ${SET_USE_PREBUILT_NCCL} ${SET_USE_ALL_PREBUILT_LIBRARIES} ${SET_BUILD_UNIT_TESTS} ${SET_AVX2} ${SET_MAX_DIM} ${SET_ROCM_PATH} ${SET_FF_GPU_BACKEND}"
+CMAKE_FLAGS="-DCUDA_USE_STATIC_CUDA_RUNTIME=OFF ${SET_CC} ${SET_CXX} ${SET_INSTALL_DIR} ${SET_INFERENCE_TESTS} ${SET_LIBTORCH_PATH} ${SET_BUILD} ${SET_CUDA_ARCH} ${SET_CUDA} ${SET_CUDNN} ${SET_PYTHON} ${SET_NCCL} ${SET_GASNET} ${SET_EXAMPLES} ${SET_INFERENCE_EXAMPLES} ${SET_USE_PREBUILT_LEGION} ${SET_USE_PREBUILT_NCCL} ${SET_USE_ALL_PREBUILT_LIBRARIES} ${SET_BUILD_UNIT_TESTS} ${SET_AVX2} ${SET_MAX_DIM} ${SET_ROCM_PATH} ${SET_FF_GPU_BACKEND}"
 
 function run_cmake() {
 SRC_LOCATION=${SRC_LOCATION:=`dirname $0`/../}
diff --git a/config/config.linux b/config/config.linux
index 86e8f8b647..614a671e44 100755
--- a/config/config.linux
+++ b/config/config.linux
@@ -1,5 +1,4 @@
 #!/bin/bash
-
 # set the CC and CXX, usually it is not needed as cmake can detect it
 # set CC and CXX to mpicc and mpic++ when enable gasnet
 # CC=mpicc
@@ -16,6 +15,18 @@
 # set build type
 BUILD_TYPE=${BUILD_TYPE:-Release}
 
+INFERENCE_TESTS=${INFERENCE_TESTS:-OFF}
+LIBTORCH_PATH=${LIBTORCH_PATH:-"$(realpath ../..)/libtorch"}
+if [[ "$INFERENCE_TESTS" == "ON" && ! -d "$LIBTORCH_PATH" ]]; then
+    cwd="$(pwd)"
+    cd ../..
+    wget https://download.pytorch.org/libtorch/nightly/cpu/libtorch-shared-with-deps-latest.zip
+    unzip libtorch-shared-with-deps-latest.zip
+    rm libtorch-shared-with-deps-latest.zip
+    LIBTORCH_PATH="$(pwd)/libtorch"
+    cd "$cwd"
+fi
+
 # set CUDA Arch to the desired GPU architecture(s) to target (e.g. pass "FF_CUDA_ARCH=60" for Pascal). 
 # To pass more than one value, separate architecture numbers with a comma (e.g. FF_CUDA_ARCH=70,75).
 # Alternatively, set "FF_CUDA_ARCH=autodetect" to build FlexFlow for all architectures detected on the machine,
diff --git a/examples/cpp/inference/data_generator.cc b/examples/cpp/inference/data_generator.cc
index 961052537e..f691247485 100644
--- a/examples/cpp/inference/data_generator.cc
+++ b/examples/cpp/inference/data_generator.cc
@@ -14,6 +14,7 @@
  */
 
 #include "data_generator.h"
+#include "flexflow/batch_config.h"
 #include <algorithm>
 #include <iostream>
 #include <vector>
@@ -32,6 +33,9 @@ DataGenerator::DataGenerator(size_t _num_requests,
       min_tokens_to_generate(_min_tokens_to_generate),
       max_tokens_to_generate(_max_tokens_to_generate),
       poisson_distr(_poisson_distr), lambda(_lambda), timer_started(false) {
+  assert(max_input_tokens >= min_input_tokens);
+  assert(max_tokens_to_generate >= min_tokens_to_generate);
+  assert(max_input_tokens + max_tokens_to_generate <= MAX_SEQ_LEN);
   generate_requests_meta();
 };
 
@@ -109,6 +113,7 @@ void DataGenerator::start_timer(void) {
 // the tensor's batch_size * sequence length.
 std::pair<size_t, size_t> DataGenerator::get_requests(size_t max_requests,
                                                       size_t max_tokens) {
+  // printf("\nget_requests(%lu, %lu)\n\n", max_requests, max_tokens);
   if (!timer_started) {
     std::cout << "Warning: tried to get number of requests before the timer "
                  "was started."
@@ -132,6 +137,8 @@ std::pair<size_t, size_t> DataGenerator::get_requests(size_t max_requests,
     if (seq_lengths[first_request_guid + j].first <= max_tokens - new_tokens) {
       received_requests++;
       new_tokens += seq_lengths[first_request_guid + j].first;
+    } else {
+      break;
     }
   }
   std::advance(arrivals_ptr, received_requests);
diff --git a/examples/cpp/inference/dataloader.cc b/examples/cpp/inference/dataloader.cc
index ae7cb5ccd0..fba9e24129 100644
--- a/examples/cpp/inference/dataloader.cc
+++ b/examples/cpp/inference/dataloader.cc
@@ -22,11 +22,21 @@ using namespace Legion;
 DataLoader::DataLoader(FFModel &ff,
                        InferenceConfig const &inferenceConfig,
                        DataGenerator &data_generator,
-                       ParallelTensor input) {
+                       std::vector<ParallelTensor> input) {
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
 
-  int numdims = input->num_dims;
+  assert(input.size() > 0);
+  int numdims = input[0]->num_dims;
+  for (int i = 1; i < input.size(); i++) {
+    assert(input[i]->num_dims == numdims);
+    for (int j = 0; j < numdims; j++) {
+      assert(input[i]->dims[j].size == input[0]->dims[j].size);
+      assert(input[i]->dims[j].degree == input[0]->dims[j].degree);
+      assert(input[i]->dims[j].parallel_idx == input[0]->dims[j].parallel_idx);
+    }
+  }
+
   int replica_idx = numdims - 1;
   int batch_idx = numdims - 2;
   num_samples = inferenceConfig.total_requests;
@@ -37,10 +47,10 @@ DataLoader::DataLoader(FFModel &ff,
 
     ParallelDim dims[numdims];
     for (int i = 0; i < numdims; i++) {
-      dims[i].size = input->dims[i].size;
+      dims[i].size = input[0]->dims[i].size;
       dims[i].degree = 1;
       dims[i].parallel_idx = -1;
-      dims[i].is_replica_dim = input->dims[i].is_replica_dim;
+      dims[i].is_replica_dim = input[0]->dims[i].is_replica_dim;
       // Assume only the first dim can be the replica dim
       assert(i == replica_idx || (!dims[i].is_replica_dim));
     }
@@ -100,56 +110,46 @@ void DataLoader::load_entire_dataset(Task const *task,
   }
 }
 
-void DataLoader::next_batch(FFModel &ff, BatchConfig *bc) {
+void DataLoader::next_batch(FFModel &ff, int bid, BatchConfig *bc) {
   size_t num_active_tokens = bc->num_active_tokens();
   if (num_active_tokens == 0) {
     return;
   }
+  assert(bid < batch_input.size());
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
   // Load input
   {
     Domain domain =
-        runtime->get_index_space_domain(ctx, batch_input->parallel_is);
+        runtime->get_index_space_domain(ctx, batch_input[bid]->parallel_is);
     ArgumentMap argmap;
     // No partitioning of the batch input token in inference mode
-    int input_dims = batch_input->num_dims;
+    int input_dims = batch_input[bid]->num_dims;
     for (int i = 0; i < input_dims; i++) {
-      assert(batch_input->dims[i].degree == 1 &&
+      assert(batch_input[bid]->dims[i].degree == 1 &&
              "Dataloader does not support input token partitioning in "
              "inference mode");
     }
-    int batch_size = batch_input->dims[input_dims - 2].size;
-    int seq_len = batch_input->dims[input_dims - 3].size;
+    int batch_size = batch_input[bid]->dims[input_dims - 2].size;
+    int seq_len = batch_input[bid]->dims[input_dims - 3].size;
+    /* printf("ff.config.batchSize: %i, batch_size: %i, seq_len: %i,
+       num_active_tokens: %i\n", ff.config.batchSize, batch_size, seq_len,
+       num_active_tokens); */
     assert(ff.config.batchSize == batch_size &&
            batch_size * seq_len >= num_active_tokens);
     for (Domain::DomainPointIterator it(domain); it; it++) {
-      SampleIdxs meta;
-      meta.num_samples = num_active_tokens;
-      meta.incremental_mode = bc->incremental_mode;
-      int token_index = 0;
-      for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
-        if (bc->request_completed[i]) {
-          continue;
-        } else {
-          for (int j = 0; j < bc->num_processing_tokens[i]; j++) {
-            meta.guids[token_index] = bc->request_guid[i];
-            meta.idxs[token_index] = bc->token_start_idx[i] + j;
-            token_index++;
-          }
-        }
-      }
-      assert(token_index == num_active_tokens);
-      argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
+      // SampleIdxs meta = bc->token2ids;
+      argmap.set_point(
+          *it, TaskArgument(&bc->token2ids, sizeof(BatchConfig::SampleIdxs)));
     }
     IndexLauncher launcher(CUSTOM_GPU_TASK_ID_1,
-                           batch_input->parallel_is,
+                           batch_input[bid]->parallel_is,
                            TaskArgument(NULL, 0),
                            argmap,
                            Predicate::TRUE_PRED,
                            false /*must*/,
                            0 /*mapper_id*/,
-                           batch_input->machine_view.hash());
+                           batch_input[bid]->machine_view.hash());
     launcher.add_region_requirement(RegionRequirement(full_input->region,
                                                       0 /*projection id*/,
                                                       READ_ONLY,
@@ -157,11 +157,12 @@ void DataLoader::next_batch(FFModel &ff, BatchConfig *bc) {
                                                       full_input->region,
                                                       MAP_TO_ZC_MEMORY));
     launcher.add_field(0, FID_DATA);
-    launcher.add_region_requirement(RegionRequirement(batch_input->part,
-                                                      0 /*projection id*/,
-                                                      WRITE_ONLY,
-                                                      EXCLUSIVE,
-                                                      batch_input->region));
+    launcher.add_region_requirement(
+        RegionRequirement(batch_input[bid]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_input[bid]->region));
     launcher.add_field(1, FID_DATA);
     runtime->execute_index_space(ctx, launcher);
   }
diff --git a/examples/cpp/inference/dataloader.cu b/examples/cpp/inference/dataloader.cu
index 6f8c6c19ad..0668fd949d 100644
--- a/examples/cpp/inference/dataloader.cu
+++ b/examples/cpp/inference/dataloader.cu
@@ -22,7 +22,7 @@ void DataLoader::load_input(Task const *task,
                             Runtime *runtime) {
   assert(regions.size() == 2);
   assert(task->regions.size() == 2);
-  SampleIdxs *meta = (SampleIdxs *)task->local_args;
+  BatchConfig::SampleIdxs *meta = (BatchConfig::SampleIdxs *)task->local_args;
   if (meta->num_samples == 0) {
     return;
   }
@@ -42,15 +42,23 @@ void DataLoader::load_input(Task const *task,
       batch_input_domain.hi()[1] - batch_input_domain.lo()[1] + 1;
   coord_t batch_size =
       batch_input_domain.hi()[2] - batch_input_domain.lo()[2] + 1;
+
+  coord_t full_input_token_dim =
+      batch_input_domain.hi()[0] - batch_input_domain.lo()[0] + 1;
   coord_t full_input_sequence_length =
-      full_input_domain.hi()[1] - full_input_domain.lo()[1] + 1;
+      batch_input_domain.hi()[1] - batch_input_domain.lo()[1] + 1;
+  coord_t full_input_batch_size =
+      batch_input_domain.hi()[2] - batch_input_domain.lo()[2] + 1;
+  assert(token_dim == full_input_token_dim);
   assert(sequence_length == full_input_sequence_length);
+  assert(batch_size <= full_input_batch_size);
 
   // Currently assume continous indices
   assert(meta->num_samples <= batch_size * sequence_length);
   for (int i = 1; i < meta->num_samples; i++) {
     if (meta->guids[i] == meta->guids[i - 1]) {
-      assert(meta->idxs[i] == meta->idxs[i - 1] + 1);
+      assert(meta->token_indexes[i].token_position ==
+             meta->token_indexes[i - 1].token_position + 1);
     }
   }
   // keep things simple for now
@@ -61,34 +69,15 @@ void DataLoader::load_input(Task const *task,
   checkCUDA(cudaMemset(
       batch_input_ptr, 0, batch_input_domain.get_volume() * sizeof(float)));
 
-  if (!meta->incremental_mode) {
-    size_t num_requests = 0;
-    size_t guid;
-    for (size_t i = 0; i < meta->num_samples; i++) {
-      if (i == 0 || meta->guids[i] != guid) {
-        guid = meta->guids[0];
-        num_requests++;
-      }
-    }
-
-    coord_t start_idx = meta->guids[0];
-    assert(batch_input_domain.get_volume() % batch_size == 0);
-    size_t size_to_copy = token_dim * sequence_length * num_requests;
-    float const *input_zc =
-        full_input_ptr + start_idx * token_dim * sequence_length;
-    copy_kernel<<<GET_BLOCKS(size_to_copy), CUDA_NUM_THREADS>>>(
-        batch_input_ptr, input_zc, size_to_copy);
-    checkCUDA(cudaDeviceSynchronize());
-    return;
-  }
-
   size_t guid = meta->guids[0];
-  size_t start_idx = meta->idxs[0];
+  size_t start_idx = meta->token_indexes[0].token_position;
   size_t dst_idx = 0;
   size_t total_tokens = 0;
   for (size_t i = 1; i <= meta->num_samples; i++) {
     if (i == meta->num_samples || meta->guids[i] != guid) {
-      size_t size_to_copy = token_dim * (meta->idxs[i - 1] - start_idx + 1);
+      size_t size_to_copy =
+          token_dim *
+          (meta->token_indexes[i - 1].token_position - start_idx + 1);
       total_tokens += size_to_copy / token_dim;
       float const *input_zc = full_input_ptr +
                               (guid * token_dim * sequence_length) +
@@ -98,11 +87,17 @@ void DataLoader::load_input(Task const *task,
           dst_ptr, input_zc, size_to_copy);
       if (i < meta->num_samples) {
         guid = meta->guids[i];
-        start_idx = meta->idxs[i];
+        start_idx = meta->token_indexes[i].token_position;
       }
       dst_idx = i;
     }
   }
   assert(total_tokens == meta->num_samples);
+  /*printf("token_dim: %lli, sequence_length: %lli, batch_size: %lli\n",
+  token_dim, sequence_length, batch_size); printf("total_tokens: %lu\n",
+  total_tokens); printf("guid: %lu\n", guid);
+  print_tensor<float>(batch_input_ptr,
+                      batch_input_domain.get_volume(),
+                      "[BatchInput]");*/
   checkCUDA(cudaDeviceSynchronize());
 }
diff --git a/examples/cpp/inference/dataloader.h b/examples/cpp/inference/dataloader.h
index e67176d801..b95108aa35 100644
--- a/examples/cpp/inference/dataloader.h
+++ b/examples/cpp/inference/dataloader.h
@@ -15,6 +15,7 @@
 #pragma once
 
 #include "data_generator.h"
+#include "flexflow/batch_config.h"
 #include "flexflow/model.h"
 #include "inference_config.h"
 
@@ -33,7 +34,7 @@ class DataLoader {
   DataLoader(FFModel &ff,
              InferenceConfig const &inferenceConfig,
              DataGenerator &data_generator,
-             ParallelTensor input);
+             std::vector<ParallelTensor> input);
   static void load_input(Task const *task,
                          std::vector<PhysicalRegion> const &regions,
                          Context ctx,
@@ -42,20 +43,14 @@ class DataLoader {
                                   std::vector<PhysicalRegion> const &regions,
                                   Context ctx,
                                   Runtime *runtime);
-  void next_batch(FFModel &, BatchConfig *);
+  void next_batch(FFModel &, int, BatchConfig *);
 
 public:
   size_t num_samples;
-  FlexFlow::ParallelTensor full_input, batch_input;
+  ParallelTensor full_input;
+  std::vector<ParallelTensor> batch_input;
   struct DataLoaderInput {
     InferenceConfig const &_inferenceConfig;
     DataGenerator &_data_generator;
   };
 };
-
-struct SampleIdxs {
-  bool incremental_mode;
-  size_t num_samples;
-  size_t idxs[MAX_SEQ_LEN];  // the id of each token within its request
-  size_t guids[MAX_SEQ_LEN]; // the guid of the request each token belongs to
-};
\ No newline at end of file
diff --git a/examples/cpp/inference/inference_config.h b/examples/cpp/inference/inference_config.h
index cbd0a082e2..c96d5b9b54 100644
--- a/examples/cpp/inference/inference_config.h
+++ b/examples/cpp/inference/inference_config.h
@@ -16,10 +16,12 @@
 
 #include <string>
 
-#define MAX_SEQ_LEN 1024
+// #define MAX_SEQ_LEN 1024
+#define MAX_SEQ_LEN 20
 #define BATCH_SIZE 2
-#define MNIST_DIMS 28 * 28
-#define DATA_DIM MNIST_DIMS
+// #define MNIST_DIMS 28 * 28
+// #define DATA_DIM MNIST_DIMS
+#define DATA_DIM 3
 
 struct InferenceConfig {
   InferenceConfig(void) {
@@ -27,7 +29,7 @@ struct InferenceConfig {
     token_dim = DATA_DIM;
     sequence_length = MAX_SEQ_LEN;
     batch_size = BATCH_SIZE;
-    out_dim = 15;
+    out_dim = 3;
     num_labels = out_dim;
     num_layers = 1;
     //----------------------- Inference parameters ---------------------
@@ -36,12 +38,12 @@ struct InferenceConfig {
     poisson_distribution = true;
     // average number of request arrivals per second
     arrival_rate = 250;
-    num_inflight_batches = 5;
-    incremental_mode = false;
+    num_inflight_batches = 4;
+    incremental_mode = true;
     //----------------------- Rest of model parameters ------------------
-    hidden_size = DATA_DIM;
+    hidden_size = 12;
     // Encoder layer
-    num_attention_heads = 16;
+    num_attention_heads = 3;
     attention_kdim = attention_vdim = hidden_size / num_attention_heads;
     num_encoder_layers = 1;
   }
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index a7e96da03a..c923013a88 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -135,8 +135,11 @@ void FlexFlow::top_level_task(Task const *task,
   im.init_operators_inference();
 
   //------------ Initialize the data loader and data generator ------------
-  size_t min_input_tokens = 32, max_input_tokens = 512,
-         min_tokens_to_generate = 1, max_tokens_to_generate = 128;
+  /*size_t min_input_tokens = 32, max_input_tokens = 512,
+         min_tokens_to_generate = 1, max_tokens_to_generate = 128;*/
+  size_t min_input_tokens = 5, max_input_tokens = 10,
+         min_tokens_to_generate = 1,
+         max_tokens_to_generate = MAX_SEQ_LEN - max_input_tokens;
   DataGenerator data_generator(moeConfig.total_requests,
                                moeConfig.token_dim,
                                min_input_tokens,
@@ -147,7 +150,10 @@ void FlexFlow::top_level_task(Task const *task,
                                moeConfig.arrival_rate);
   ParallelTensor input_pt;
   ff.get_parallel_tensor_from_tensor(input, input_pt);
-  DataLoader data_loader(ff, moeConfig, data_generator, input_pt);
+  assert(im.tensor_buffer.find(input_pt) != im.tensor_buffer.end());
+  assert(im.tensor_buffer[input_pt].size() == im.max_num_inflight_batches);
+  DataLoader data_loader(
+      ff, moeConfig, data_generator, im.tensor_buffer[input_pt]);
 
   //----------------------- Start timer -----------------------------------
   {
@@ -168,17 +174,18 @@ void FlexFlow::top_level_task(Task const *task,
   std::pair<size_t, size_t> new_prompts;
   BatchConfig *bc = nullptr;
 
+  assert(im.max_num_requests_per_batch == moeConfig.batch_size);
+
   // simulation loop. For deployment, we will use a while(true)
   while (processed_requests < moeConfig.total_requests) {
-    for (int bid = 0; bid < im.max_num_requests_per_batch; bid++) {
+    for (int bid = 0; bid < im.max_num_inflight_batches; bid++) {
+      size_t max_reqs, max_tkns;
       if (future_handlers.find(bid) == future_handlers.end()) {
-        size_t max_reqs = moeConfig.incremental_mode
-                              ? bc->MAX_NUM_REQUESTS
-                              : im.max_num_requests_per_batch;
-        size_t max_tkns = moeConfig.sequence_length * moeConfig.batch_size;
+        max_reqs = moeConfig.incremental_mode ? bc->MAX_NUM_REQUESTS
+                                              : im.max_num_requests_per_batch;
+        max_tkns = moeConfig.sequence_length * moeConfig.batch_size;
         new_prompts = data_generator.get_requests(max_reqs, max_tkns);
-        assert(new_prompts.second <= BatchConfig::MAX_NUM_REQUESTS);
-        bc = new BatchConfig(moeConfig.incremental_mode);
+        bc = new BatchConfig();
       } else {
         Future future = future_handlers[bid];
         if (!future.is_ready(true /*subscribe*/)) {
@@ -187,14 +194,17 @@ void FlexFlow::top_level_task(Task const *task,
         InferenceResult ir = future.get_result<InferenceResult>();
         bc = batch_configs[bid];
         processed_requests += bc->update_results(ir);
-        size_t max_reqs = moeConfig.incremental_mode
-                              ? bc->MAX_NUM_REQUESTS - bc->num_active_requests()
-                              : im.max_num_requests_per_batch;
-        size_t max_tkns =
-            moeConfig.sequence_length * moeConfig.batch_size -
-            (moeConfig.incremental_mode ? bc->num_active_tokens() : 0);
+        max_reqs = moeConfig.incremental_mode
+                       ? bc->MAX_NUM_REQUESTS - bc->num_active_requests()
+                       : im.max_num_requests_per_batch;
+        max_tkns = moeConfig.sequence_length * moeConfig.batch_size -
+                   (moeConfig.incremental_mode ? bc->num_active_tokens() : 0);
         new_prompts = data_generator.get_requests(max_reqs, max_tkns);
       }
+      assert(new_prompts.second <= max_reqs);
+      if (bc->num_active_tokens() == 0 && new_prompts.second == 0) {
+        continue;
+      }
       for (size_t i = 0; i < new_prompts.second; i++) {
         size_t guid = new_prompts.first + i;
         std::pair<size_t, size_t> seq_lens =
@@ -203,11 +213,10 @@ void FlexFlow::top_level_task(Task const *task,
                seq_lens.first <= max_input_tokens &&
                seq_lens.second >= min_tokens_to_generate &&
                seq_lens.second <= max_tokens_to_generate);
-        assert(bc->register_new_request(guid, seq_lens.first));
+        assert(bc->register_new_request(guid, seq_lens.first, seq_lens.second));
       }
       bc->prepare_next_batch();
-      // TODO: loading data
-      data_loader.next_batch(ff, bc);
+      data_loader.next_batch(ff, bid, bc);
 
       runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
       FutureMap fm = im.inference(bid, *bc);
diff --git a/examples/cpp/inference/transformers/transformers.cc b/examples/cpp/inference/transformers/transformers.cc
index 45d676fe3c..da8b872387 100644
--- a/examples/cpp/inference/transformers/transformers.cc
+++ b/examples/cpp/inference/transformers/transformers.cc
@@ -39,14 +39,22 @@ Tensor create_inc_multihead_attention_decoder(
     FFModel *model,
     TransformerConfig const *transformerConfig,
     Tensor const &input) {
-  std::vector<int> axes{1};
-  Tensor t = model->inc_multihead_self_attention(
-      input,
-      transformerConfig->hidden_size,
-      transformerConfig->num_attention_heads,
-      transformerConfig->attention_kdim,
-      transformerConfig->attention_vdim);
-
+  std::vector<int> axes{2};
+  Tensor t =
+      transformerConfig->incremental_mode
+          ? model->inc_multihead_self_attention(
+                input,
+                transformerConfig->hidden_size,
+                transformerConfig->num_attention_heads,
+                transformerConfig->attention_kdim,
+                transformerConfig->attention_vdim)
+          : model->multihead_attention(input,
+                                       input,
+                                       input,
+                                       transformerConfig->hidden_size,
+                                       transformerConfig->num_attention_heads,
+                                       transformerConfig->attention_kdim,
+                                       transformerConfig->attention_vdim);
   t = model->layer_norm(model->add(t, input), axes, true, 1e-05);
   Tensor x = model->dense(
       model->dense(
@@ -81,9 +89,10 @@ void FlexFlow::top_level_task(Task const *task,
   //----------------------- Create inputs --------------------------------
   Tensor input;
   {
-    int const dims[] = {BatchConfig::MAX_NUM_TOKENS,
+    int const dims[] = {ffConfig.batchSize,
+                        transformerConfig.sequence_length,
                         transformerConfig.token_dim};
-    input = ff.create_tensor<2>(dims, DT_FLOAT);
+    input = ff.create_tensor<3>(dims, DT_FLOAT);
   }
 
   //----------------------- Define the model ------------------------------
@@ -102,8 +111,11 @@ void FlexFlow::top_level_task(Task const *task,
   im.init_operators_inference();
 
   //------------ Initialize the data loader and data generator ------------
-  size_t min_input_tokens = 32, max_input_tokens = 512,
-         min_tokens_to_generate = 1, max_tokens_to_generate = 128;
+  /* size_t min_input_tokens = 32, max_input_tokens = 512,
+         min_tokens_to_generate = 1, max_tokens_to_generate = 128; */
+  size_t min_input_tokens = 5, max_input_tokens = 10,
+         min_tokens_to_generate = 1,
+         max_tokens_to_generate = MAX_SEQ_LEN - max_input_tokens;
   DataGenerator data_generator(transformerConfig.total_requests,
                                transformerConfig.token_dim,
                                min_input_tokens,
@@ -114,7 +126,10 @@ void FlexFlow::top_level_task(Task const *task,
                                transformerConfig.arrival_rate);
   ParallelTensor input_pt;
   ff.get_parallel_tensor_from_tensor(input, input_pt);
-  DataLoader data_loader(ff, transformerConfig, data_generator, input_pt);
+  assert(im.tensor_buffer.find(input_pt) != im.tensor_buffer.end());
+  assert(im.tensor_buffer[input_pt].size() == im.max_num_inflight_batches);
+  DataLoader data_loader(
+      ff, transformerConfig, data_generator, im.tensor_buffer[input_pt]);
 
   //----------------------- Start timer -----------------------------------
   {
@@ -125,6 +140,7 @@ void FlexFlow::top_level_task(Task const *task,
   }
   double ts_start = Realm::Clock::current_time_in_microseconds();
 
+  //----------------------- Begin inference! -------------------------------
   //----------------------- Begin inference! -------------------------------
   int index = 0;
   int processed_requests = 0;
@@ -135,18 +151,21 @@ void FlexFlow::top_level_task(Task const *task,
   std::pair<size_t, size_t> new_prompts;
   BatchConfig *bc = nullptr;
 
+  assert(im.max_num_requests_per_batch == transformerConfig.batch_size);
+  // assert(transformerConfig.batch_size <= BatchConfig::MAX_NUM_REQUESTS);
+
   // simulation loop. For deployment, we will use a while(true)
   while (processed_requests < transformerConfig.total_requests) {
-    for (int bid = 0; bid < im.max_num_requests_per_batch; bid++) {
+    for (int bid = 0; bid < im.max_num_inflight_batches; bid++) {
+      size_t max_reqs, max_tkns;
       if (future_handlers.find(bid) == future_handlers.end()) {
-        size_t max_reqs = transformerConfig.incremental_mode
-                              ? bc->MAX_NUM_REQUESTS
-                              : im.max_num_requests_per_batch;
-        size_t max_tkns =
+        max_reqs = transformerConfig.incremental_mode
+                       ? bc->MAX_NUM_REQUESTS
+                       : im.max_num_requests_per_batch;
+        max_tkns =
             transformerConfig.sequence_length * transformerConfig.batch_size;
         new_prompts = data_generator.get_requests(max_reqs, max_tkns);
-        assert(new_prompts.second <= BatchConfig::MAX_NUM_REQUESTS);
-        bc = new BatchConfig(transformerConfig.incremental_mode);
+        bc = new BatchConfig();
       } else {
         Future future = future_handlers[bid];
         if (!future.is_ready(true /*subscribe*/)) {
@@ -155,14 +174,18 @@ void FlexFlow::top_level_task(Task const *task,
         InferenceResult ir = future.get_result<InferenceResult>();
         bc = batch_configs[bid];
         processed_requests += bc->update_results(ir);
-        size_t max_reqs = transformerConfig.incremental_mode
-                              ? bc->MAX_NUM_REQUESTS - bc->num_active_requests()
-                              : im.max_num_requests_per_batch;
-        size_t max_tkns =
+        max_reqs = transformerConfig.incremental_mode
+                       ? bc->MAX_NUM_REQUESTS - bc->num_active_requests()
+                       : im.max_num_requests_per_batch;
+        max_tkns =
             transformerConfig.sequence_length * transformerConfig.batch_size -
             (transformerConfig.incremental_mode ? bc->num_active_tokens() : 0);
         new_prompts = data_generator.get_requests(max_reqs, max_tkns);
       }
+      assert(new_prompts.second <= max_reqs);
+      if (bc->num_active_tokens() == 0 && new_prompts.second == 0) {
+        continue;
+      }
       for (size_t i = 0; i < new_prompts.second; i++) {
         size_t guid = new_prompts.first + i;
         std::pair<size_t, size_t> seq_lens =
@@ -171,11 +194,10 @@ void FlexFlow::top_level_task(Task const *task,
                seq_lens.first <= max_input_tokens &&
                seq_lens.second >= min_tokens_to_generate &&
                seq_lens.second <= max_tokens_to_generate);
-        assert(bc->register_new_request(guid, seq_lens.first));
+        assert(bc->register_new_request(guid, seq_lens.first, seq_lens.second));
       }
       bc->prepare_next_batch();
-      // TODO: loading data
-      data_loader.next_batch(ff, bc);
+      data_loader.next_batch(ff, bid, bc);
 
       runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
       FutureMap fm = im.inference(bid, *bc);
diff --git a/examples/cpp/inference/transformers/transformers.h b/examples/cpp/inference/transformers/transformers.h
index 0957bd33bb..fe474e7949 100644
--- a/examples/cpp/inference/transformers/transformers.h
+++ b/examples/cpp/inference/transformers/transformers.h
@@ -19,5 +19,7 @@
 #include "inference_config.h"
 
 struct TransformerConfig : InferenceConfig {
-  TransformerConfig(void) : InferenceConfig() {}
+  TransformerConfig(void) : InferenceConfig() {
+    hidden_size = DATA_DIM;
+  }
 };
diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index c5dd2ac90f..4d4aec7054 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -16,7 +16,10 @@
 #pragma once
 
 #include <cstdlib>
-#define MAX_SEQ_LEN 1024
+
+// #define MAX_SEQ_LEN 1024
+// #define BATCH_SIZE 2
+#define MAX_SEQ_LEN 20
 #define BATCH_SIZE 2
 #define MAX_REQUESTS 256
 
@@ -29,25 +32,50 @@ struct InferenceResult {
 
 class BatchConfig {
 public:
-  BatchConfig(bool _incremental_mode);
-  bool register_new_request(size_t guid, int length);
+  BatchConfig();
+  bool register_new_request(size_t guid,
+                            int initial_length,
+                            int tokens_to_generate);
   void prepare_next_batch();
   int update_results(InferenceResult const &ir);
-  bool update_num_active_requests_tokens();
+  void update_num_active_requests_tokens();
   int num_active_requests() const;
   int num_active_tokens() const;
+  void print() const;
   static int const MAX_NUM_REQUESTS = MAX_REQUESTS;
   static int const MAX_NUM_TOKENS = InferenceResult::MAX_NUM_TOKENS;
-  static int const MAX_SEQUENCE_LENGTH = MAX_SEQ_LEN;
-  // These are set by update
+  // static int const MAX_SEQUENCE_LENGTH = MAX_SEQ_LEN;
+  //  These are set by update
   int num_tokens, num_requests;
   bool cached_results;
-  int token_start_idx[MAX_NUM_REQUESTS];
-  int token_last_available_idx[MAX_NUM_REQUESTS];
-  int num_processing_tokens[MAX_NUM_REQUESTS];
+  int token_start_idx[MAX_NUM_REQUESTS]; // index of first token in a request
+                                         // that should be processed in the
+                                         // current batch/iteration
+  int token_last_available_idx
+      [MAX_NUM_REQUESTS]; // last valid token index in a request. This includes
+                          // both the prompt and generated tokens
+  int num_processing_tokens[MAX_NUM_REQUESTS]; // a request's number of tokens
+                                               // being processed in the current
+                                               // batch/iteration
+  size_t max_sequence_length[MAX_NUM_REQUESTS];
+
+  struct token_idxs {
+    size_t request_index;  // the index within the BatchConfig of the request
+                           // that the token belongs to
+    size_t token_position; // the index indicating the position of each token
+                           // within its request
+  };
+
+  struct SampleIdxs {
+    size_t num_samples;
+    size_t guids[InferenceResult::MAX_NUM_TOKENS]; // the guid of the request
+                                                   // each token belongs to
+    token_idxs token_indexes[InferenceResult::MAX_NUM_TOKENS];
+  };
+
+  SampleIdxs token2ids;
   size_t request_guid[MAX_NUM_REQUESTS];
   bool request_completed[MAX_NUM_REQUESTS];
-  bool incremental_mode;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 35b2c13d40..6e8effcb27 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -723,7 +723,7 @@ class FFModel {
 
     std::pair<typename ToShape<typename T::Input>::type, Params> key{
         input_shapes, params};
-    auto &cache = get<std::unordered_map<
+    auto &cache = FlexFlow::get<std::unordered_map<
         std::pair<typename ToShape<typename T::Input>::type, Params>,
         T *>>(this->cached_ops);
     auto const &it = cache.find(key);
diff --git a/include/flexflow/ops/experts.h b/include/flexflow/ops/experts.h
index e75a14089c..0f51187c78 100644
--- a/include/flexflow/ops/experts.h
+++ b/include/flexflow/ops/experts.h
@@ -127,6 +127,7 @@ class Experts : public Op {
                                      float const *topk_gate_preds,
                                      float *output,
                                      float const **weights,
+                                     int num_active_tokens,
                                      int chosen_experts,
                                      int batch_size,
                                      int out_dim);
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index c60f2089cc..cfdb415354 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -9,6 +9,8 @@
 #include "flexflow/op_meta.h"
 #include "flexflow/operator.h"
 #include "flexflow/ops/inc_multihead_self_attention_params.h"
+#include "math.h"
+#include <cfloat>
 
 namespace FlexFlow {
 
@@ -86,12 +88,8 @@ class IncMultiHeadSelfAttention : public Op {
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &mv,
                              CostMetrics &cost_metrics) const override;
-  static void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
-                               float const *input_ptr,
-                               float const *weight_ptr,
-                               float *output_ptr,
-                               ffStream_t stream);
   static void inference_kernel_wrapper(IncMultiHeadSelfAttentionMeta const *m,
+                                       BatchConfig const *bc,
                                        float const *input_ptr,
                                        float const *weight_ptr,
                                        float *output_ptr);
@@ -110,20 +108,31 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
 public:
   IncMultiHeadSelfAttentionMeta(FFHandler handler,
                                 IncMultiHeadSelfAttention const *attn,
+                                float const *weight_ptr,
                                 Legion::Memory gpu_mem,
                                 int num_samples,
-                                int num_heads);
+                                int _num_heads);
   ~IncMultiHeadSelfAttentionMeta(void);
 
 public:
   Realm::RegionInstance reserveInst;
-  size_t weightSize, reserveSpaceSize;
-#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
-  cudnnAttnDescriptor_t attnDesc;
-  cudnnSeqDataDescriptor_t qDesc, kDesc, vDesc, oDesc;
+  size_t weights_params, weightSize, reserveSpaceSize;
+  int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
+  int num_heads;
+#ifdef INFERENCE_TESTS
+  float *kcache, *vcache;
 #endif
-  int *devQoSeqArray, *devKvSeqArray, *loWinIdx, *hiWinIdx;
-  void *reserveSpace;
+  /*#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+    cudnnAttnDescriptor_t attnDesc;
+    cudnnSeqDataDescriptor_t qDesc, kDesc, vDesc, oDesc;
+  #endif*/
+  // int *devQoSeqArray, *devKvSeqArray, *loWinIdx, *hiWinIdx, *kvCache;
+  float *devQKVProjArray, *keyCache, *valueCache;
+  float *qk_prods, *qk_prods_softmax;
+  float *attn_heads, *W_out_contiguous;
+  // void *reserveSpace;
+
+  BatchConfig::token_idxs *dev_token2ids;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/utils/cuda_helper.h b/include/flexflow/utils/cuda_helper.h
index 78e21ccd9f..a2e3e4fcdc 100644
--- a/include/flexflow/utils/cuda_helper.h
+++ b/include/flexflow/utils/cuda_helper.h
@@ -133,6 +133,9 @@ __host__ void updateGAS(float *para_ptr,
 template <typename T>
 void print_tensor(T const *ptr, size_t num_elements, char const *prefix);
 
+template <typename T>
+T *download_tensor(T const *ptr, size_t num_elements);
+
 cudnnStatus_t cudnnSetTensorDescriptorFromDomain(cudnnTensorDescriptor_t tensor,
                                                  Legion::Domain domain);
 
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index bfe3e73ee1..6d6c55d07b 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -672,9 +672,10 @@ FutureMap Experts::inference(FFModel const &ff,
   size_t machine_view_hash = view->hash();
   /* std::cout << "Experts op machine_view: " << *(MachineView const *)mv
             << std::endl; */
+  int num_active_tokens = bc.num_active_tokens();
   IndexLauncher launcher(EXPERTS_INF_TASK_ID,
                          parallel_is,
-                         TaskArgument(nullptr, 0),
+                         TaskArgument(&num_active_tokens, sizeof(int)),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
@@ -737,6 +738,10 @@ void Experts::inference_task(Task const *task,
   assert(regions.size() == task->regions.size());
 
   ExpertsMeta const *m = *((ExpertsMeta **)task->local_args);
+  int num_active_tokens = *(int *)task->args;
+  if (num_active_tokens == 0) {
+    return;
+  }
 
   int num_experts = m->num_experts;
   bool use_bias = m->use_bias;
@@ -981,6 +986,7 @@ void Experts::inference_task(Task const *task,
                                   topk_gate_pred_ptr,
                                   output_ptr,
                                   weights_ptrs,
+                                  num_active_tokens,
                                   chosen_experts,
                                   batch_size,
                                   out_dim);
diff --git a/src/ops/experts.cpp b/src/ops/experts.cpp
index 3e8bebb4f0..787c6e2d88 100644
--- a/src/ops/experts.cpp
+++ b/src/ops/experts.cpp
@@ -26,6 +26,7 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                      float const *topk_gate_preds,
                                      float *output,
                                      float const **weights,
+                                     int num_active_tokens,
                                      int chosen_experts,
                                      int batch_size,
                                      int out_dim) {
diff --git a/src/ops/experts.cu b/src/ops/experts.cu
index 3cd86ed56b..67b9d875c7 100644
--- a/src/ops/experts.cu
+++ b/src/ops/experts.cu
@@ -89,7 +89,7 @@ void experts_forward_thrust_wrapper(ExpertsMeta const *m,
       thrust::upper_bound(thrust::cuda::par.on(stream),
                           sorted_indices,
                           sorted_indices + num_indices,
-                          experts_start_idx + num_experts_per_block);
+                          experts_start_idx + num_experts_per_block - 1);
 
   *lb_index = lb - sorted_indices;
   *ub_index = ub - sorted_indices;
@@ -369,6 +369,7 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                      float const *topk_gate_preds,
                                      float *output,
                                      float const **weights,
+                                     int num_active_tokens,
                                      int chosen_experts,
                                      int batch_size,
                                      int out_dim) {
@@ -382,17 +383,22 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
     cudaEventRecord(t_start, stream);
   }
 
+  assert(num_active_tokens > 0);
+  assert(num_active_tokens <= m->effective_batch_size);
+  assert(m->effective_batch_size == batch_size);
+
   int num_experts_per_block = m->num_experts;
   int experts_start_idx = m->experts_start_idx;
   bool use_bias = m->use_bias;
   ActiMode activation = m->activation;
   int data_dim = m->data_dim;
   int num_chosen_experts = m->num_chosen_experts;
-  int num_tokens = m->effective_batch_size;
+  // int num_tokens = m->effective_batch_size;
+  int num_tokens = num_active_tokens;
   int expert_capacity = m->expert_capacity;
 
   assert(chosen_experts == num_chosen_experts);
-  assert(num_tokens == batch_size);
+  // assert(num_tokens == batch_size);
   assert(out_dim == m->out_dim);
 
   // TODO: remove this once we condense all weights in a single tensor
@@ -463,34 +469,34 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
 
   cudaStreamSynchronize(stream);
 
-  experts_forward_GemmBatched_kernel(m,
-                                     (void const **)m->weight_idx_array,
-                                     (void const **)m->token_idx_array,
-                                     (void **)m->dev_batch_outputs,
-                                     (void const **)m->bias_idx_array,
-                                     activation,
-                                     data_dim,
-                                     out_dim,
-                                     num_tokens,
-                                     num_chosen_experts,
-                                     gemm_batch_count,
-                                     stream);
+  // experts_forward_GemmBatched_kernel(m,
+  //                                    (void const **)m->weight_idx_array,
+  //                                    (void const **)m->token_idx_array,
+  //                                    (void **)m->dev_batch_outputs,
+  //                                    (void const **)m->bias_idx_array,
+  //                                    activation,
+  //                                    data_dim,
+  //                                    out_dim,
+  //                                    num_tokens,
+  //                                    num_chosen_experts,
+  //                                    gemm_batch_count,
+  //                                    stream);
 
   cudaStreamSynchronize(stream);
 
-  int aggregation_parallelism =
-      std::max(num_tokens, gemm_batch_count) * out_dim;
-  experts_forward_aggregate_kernel<<<GET_BLOCKS(aggregation_parallelism),
-                                     min(CUDA_NUM_THREADS,
-                                         (int)aggregation_parallelism),
-                                     0,
-                                     stream>>>(num_tokens,
-                                               gemm_batch_count,
-                                               out_dim,
-                                               output,
-                                               m->dev_batch_outputs,
-                                               m->coefficient_idx_array,
-                                               m->output_idx_array);
+  // int aggregation_parallelism =
+  //     std::max(num_tokens, gemm_batch_count) * out_dim;
+  // experts_forward_aggregate_kernel<<<GET_BLOCKS(aggregation_parallelism),
+  //                                    min(CUDA_NUM_THREADS,
+  //                                        (int)aggregation_parallelism),
+  //                                    0,
+  //                                    stream>>>(num_tokens,
+  //                                              gemm_batch_count,
+  //                                              out_dim,
+  //                                              output,
+  //                                              m->dev_batch_outputs,
+  //                                              m->coefficient_idx_array,
+  //                                              m->output_idx_array);
 
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index fc423caea3..1b91d3b6a0 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -15,7 +15,12 @@
 
 #include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/model.h"
+#include "flexflow/utils/cuda_helper.h"
 #include "flexflow/utils/hash_utils.h"
+#ifdef INFERENCE_TESTS
+#include <torch/torch.h>
+using namespace at::indexing;
+#endif
 
 namespace FlexFlow {
 
@@ -438,6 +443,7 @@ OpMeta *IncMultiHeadSelfAttention::init_task(
   IncMultiHeadSelfAttention const *attn =
       (IncMultiHeadSelfAttention *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
+
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
       DT_FLOAT, regions[0], task->regions[0], FID_DATA, ctx, runtime);
   GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
@@ -456,7 +462,7 @@ OpMeta *IncMultiHeadSelfAttention::init_task(
                        .best_affinity_to(task->target_proc)
                        .first();
   IncMultiHeadSelfAttentionMeta *m = new IncMultiHeadSelfAttentionMeta(
-      handle, attn, gpu_mem, num_samples, num_heads);
+      handle, attn, weight.get_float_ptr(), gpu_mem, num_samples, num_heads);
   m->profiling = attn->profiling;
   assert(weight.domain.get_volume() * sizeof(float) == m->weightSize);
   return m;
@@ -481,6 +487,10 @@ FutureMap IncMultiHeadSelfAttention::inference(
   set_argumentmap_for_inference(ff, argmap, view);
   size_t machine_view_hash = view->hash();
   int idx = 0;
+
+  printf("BatchConfig, num_tokens: %d, num_requests: %d\n",
+         bc.num_tokens,
+         bc.num_requests);
   IndexLauncher launcher(INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
                          parallel_is,
                          TaskArgument(&bc, sizeof(BatchConfig)),
@@ -522,10 +532,11 @@ void IncMultiHeadSelfAttention::inference_task(
     Runtime *runtime) {
   assert(regions.size() == 3);
   assert(task->regions.size() == regions.size());
-  // const IncMultiHeadSelfAttention* attn = (IncMultiHeadSelfAttention*)
-  // task->args;
+
+  BatchConfig const *bc = (BatchConfig *)task->args;
   IncMultiHeadSelfAttentionMeta const *m =
       *((IncMultiHeadSelfAttentionMeta **)task->local_args);
+
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
   GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
@@ -533,8 +544,736 @@ void IncMultiHeadSelfAttention::inference_task(
   GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
       m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
 
-  IncMultiHeadSelfAttention::inference_kernel_wrapper(
-      m, input.get_float_ptr(), weight.get_float_ptr(), output.get_float_ptr());
+  Domain input_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  Domain weight_domain = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+  Domain output_domain = runtime->get_index_space_domain(
+      ctx, task->regions[2].region.get_index_space());
+
+  assert(input_domain.get_dim() == 4);
+  assert(weight_domain.get_dim() == 3);
+  assert(output_domain.get_dim() == 4);
+  /* print_tensor<float>(input.get_float_ptr(),
+                      input_domain.get_volume(),
+                      "[Attention:forward:query]"); */
+
+  IncMultiHeadSelfAttention::inference_kernel_wrapper(m,
+                                                      bc,
+                                                      input.get_float_ptr(),
+                                                      weight.get_float_ptr(),
+                                                      output.get_float_ptr());
+#ifdef INFERENCE_TESTS
+  printf("Checking IncMultiHeadSelfAttention computations...\n");
+
+  // =============================================================================
+  //  Load input/output/weights and parse general configs
+  // =============================================================================
+
+  float *input_cpu =
+      download_tensor<float>(input.get_float_ptr(), input_domain.get_volume());
+  assert(input_cpu != nullptr);
+  float *weight_cpu = download_tensor<float>(weight.get_float_ptr(),
+                                             weight_domain.get_volume());
+  assert(weight_cpu != nullptr);
+  float *output_cpu = download_tensor<float>(output.get_float_ptr(),
+                                             output_domain.get_volume());
+  assert(output_cpu != nullptr);
+
+  // Input tensor dimensions
+  coord_t data_dim = input_domain.hi()[0] - input_domain.lo()[0] + 1;
+  coord_t max_sequence_length = input_domain.hi()[1] - input_domain.lo()[1] + 1;
+  coord_t batch_size = input_domain.hi()[2] - input_domain.lo()[2] + 1;
+  coord_t replica_dim = input_domain.hi()[3] - input_domain.lo()[3] + 1;
+  assert(replica_dim == 1);
+
+  size_t effective_batch_size = max_sequence_length * batch_size;
+  float inputs_arr[data_dim][effective_batch_size] = {0};
+  for (size_t i = 0; i < data_dim * bc->num_active_tokens(); i++) {
+    size_t data_index = i % data_dim;
+    size_t token_index = i / data_dim;
+    assert(data_index < data_dim);
+    assert(token_index < effective_batch_size);
+    inputs_arr[data_index][token_index] = input_cpu[i];
+  }
+  torch::Tensor torch_input = torch::from_blob(
+      inputs_arr, {data_dim, (long int)effective_batch_size}, torch::kFloat32);
+
+  // Weight tensor dimensions
+  coord_t all_weight_params = weight_domain.hi()[0] - weight_domain.lo()[0] + 1;
+  coord_t num_heads = weight_domain.hi()[1] - weight_domain.lo()[1] + 1;
+  replica_dim = weight_domain.hi()[2] - weight_domain.lo()[2] + 1;
+  size_t qParas = m->qProjSize * m->qSize;
+  size_t kParas = m->kProjSize * m->kSize;
+  size_t vParas = m->vProjSize * m->vSize;
+  size_t oParas = m->oProjSize * (m->vProjSize > 0 ? m->vProjSize : m->vSize);
+
+  assert(all_weight_params == qParas + kParas + vParas + oParas);
+  assert(num_heads == m->num_heads);
+  assert(replica_dim == 1);
+
+  assert(m->qSize == m->kSize && m->kSize == m->vSize);
+  // printf("m->qSize: %i\n", m->qSize);
+  //  keep things simple for now
+  assert(m->qProjSize == m->kProjSize && m->kProjSize == m->vProjSize);
+  long int proj_sum = m->qProjSize + m->kProjSize + m->vProjSize;
+  // load weight manually because Torch can't easily read a tensor serialized in
+  // column-major order.
+
+  // printf("m->kProjSize: %i, BatchConfig::MAX_NUM_TOKENS: %i, "
+  //     "bc->num_active_tokens(): %i, num_heads: %lli,
+  //     BatchConfig::MAX_NUM_REQUESTS: %i, " "bc->num_active_requests(): %i\n",
+  //     m->kProjSize, BatchConfig::MAX_NUM_TOKENS, bc->num_active_tokens(),
+  //     num_heads, BatchConfig::MAX_NUM_REQUESTS, bc->num_active_requests());
+  // for (int t=0; t < bc->num_active_tokens(); t++) {
+  //   printf("token %i has request_index: %li and token_position: %li\n",
+  //   t, bc->token2ids.token_indexes[t].request_index,
+  //   bc->token2ids.token_indexes[t].token_position);
+  // }
+
+  // =============================================================================
+  //  Load the output tensor (with CUDA results), and create a Torch tensor
+  // =============================================================================
+
+  float output_cuda[m->oProjSize][effective_batch_size] = {0};
+  for (int i = 0; i < m->oProjSize * effective_batch_size; i++) {
+    int row_idx = i % m->oProjSize;
+    int col_idx = i / m->oProjSize;
+    assert(row_idx < m->oProjSize && col_idx < effective_batch_size);
+    output_cuda[row_idx][col_idx] = output_cpu[i];
+  }
+  torch::Tensor torch_out_cuda =
+      torch::from_blob(output_cuda,
+                       {m->oProjSize, (int64_t)effective_batch_size},
+                       torch::kFloat32);
+
+  // =============================================================================
+  //  Load the Q/K/V projection weights, and create a Torch tensor
+  // =============================================================================
+
+  float w_qkv[m->qSize][m->qProjSize][3][num_heads];
+  memset(&w_qkv,
+         0,
+         m->qSize * m->qProjSize * 3 * num_heads *
+             sizeof(float)); // assuming that 0.0f is encoded as all zero bytes
+  assert(w_qkv[0][0][0][0] == 0.0f);
+
+  for (int h = 0; h < num_heads; h++) {
+    for (size_t i = 0; i < m->qProjSize * m->qSize; i++) {
+      size_t row_index = i % m->qSize;
+      size_t column_index = i / m->qSize;
+      // Q
+      w_qkv[row_index][column_index][0][h] =
+          weight_cpu[all_weight_params * h + m->qSize * column_index +
+                     row_index];
+      // K
+      w_qkv[row_index][column_index][1][h] =
+          weight_cpu[all_weight_params * h + m->qProjSize * m->qSize +
+                     m->qSize * column_index + row_index];
+      // V
+      w_qkv[row_index][column_index][2][h] =
+          weight_cpu[all_weight_params * h + 2 * m->qProjSize * m->qSize +
+                     m->qSize * column_index + row_index];
+    }
+  }
+  // convert weights to torch tensor
+  torch::Tensor torch_w_qkv = torch::from_blob(
+      w_qkv, {m->qSize, m->qProjSize, 3, num_heads}, torch::kFloat32);
+
+  /* std::cout << "Torch projection weights size: " << torch_w_qkv.sizes()
+            << std::endl;
+  std::cout << "Torch input size: " << torch_input.sizes() << std::endl;
+  std::cout << "Number of active tokens: " << bc->num_active_tokens()
+            << std::endl; */
+  // std::cout << "torch_w_qkv:" << std::endl << torch_w_qkv << std::endl;
+
+  // =============================================================================
+  //  Compute the Q/K/V projections, and compare the results with CUDA
+  // =============================================================================
+
+  //  ----------------------- C++ computations & checks ------------------------
+  torch::Tensor qkv_projs = torch::einsum(
+      "ijkl,im->jmkl",
+      {torch_w_qkv,
+       torch_input.index({Slice(), Slice(0, bc->num_active_tokens())})});
+  // std::cout << "qkv_projs size: " << qkv_projs.sizes() << std::endl;
+  assert(qkv_projs.sizes()[0] == m->qProjSize);
+  assert(qkv_projs.sizes()[1] == bc->num_active_tokens() &&
+         qkv_projs.sizes()[1] <= effective_batch_size);
+  assert(qkv_projs.sizes()[2] == 3);
+  assert(qkv_projs.sizes()[3] == num_heads);
+
+  //  ----------------------- Loading CUDA results for this step ---------------
+  float *QKVProjArray_cpu = download_tensor<float>(m->devQKVProjArray,
+                                                   BatchConfig::MAX_NUM_TOKENS *
+                                                       proj_sum * m->num_heads);
+  assert(QKVProjArray_cpu != nullptr);
+
+  float QKVProjArray_converted[m->qProjSize][bc->num_active_tokens()][3]
+                              [num_heads];
+  memset(&QKVProjArray_converted,
+         0,
+         m->qProjSize * bc->num_active_tokens() * 3 * num_heads *
+             sizeof(float)); // assuming that 0.0f is encoded as all zero bytes
+
+  // skip over padding at the end of QKVProjArray_cpu
+  // convert from column order to 3D matrix because torch cannot automatically
+  // import matrices flattened in column order
+  for (size_t i = 0; i < proj_sum * bc->num_active_tokens() * num_heads; i++) {
+    size_t proj_size_index = i % m->qProjSize;
+    size_t head_index = i / (proj_sum * bc->num_active_tokens());
+    size_t token_index =
+        ((i - head_index * proj_sum * bc->num_active_tokens()) / m->qProjSize) %
+        bc->num_active_tokens();
+    size_t qkv_offset = (i - head_index * proj_sum * bc->num_active_tokens()) /
+                        (m->qProjSize * bc->num_active_tokens());
+    assert(proj_size_index < proj_sum);
+    assert(head_index < num_heads);
+    assert(token_index < bc->num_active_tokens());
+    assert(qkv_offset < 3);
+    QKVProjArray_converted[proj_size_index][token_index][qkv_offset]
+                          [head_index] = QKVProjArray_cpu[i];
+  }
+  torch::Tensor QKVProjArray_torch =
+      torch::from_blob(QKVProjArray_converted,
+                       {m->qProjSize, bc->num_active_tokens(), 3, num_heads},
+                       torch::kFloat32);
+
+  //  ----------------------- Comparing C++ & CUDA results ---------------------
+  // std::cout << "QKVProjArray_torch" << std::endl;
+  // for (int i=0; i<num_heads; i++) {
+  //   for (int j=0; j<3; j++) {
+  //     std::cout << QKVProjArray_torch.index({Slice(), Slice(), j, i}) <<
+  //     std::endl;
+  //   }
+  // }
+  // std::cout << "qkv_projs" << std::endl;
+  // for (int i=0; i<num_heads; i++) {
+  //   for (int j=0; j<3; j++) {
+  //     std::cout << qkv_projs.index({Slice(), Slice(), j, i}) << std::endl;
+  //   }
+  // }
+  assert(torch::allclose(QKVProjArray_torch, qkv_projs, 1e-05, 1e-05));
+
+  // =============================================================================
+  //  Store the K/V projections into the cache
+  // =============================================================================
+
+  //  ----------------------- C++ operations & checks --------------------------
+  // Store projections into k/v cache arrays
+  for (size_t h = 0; h < num_heads; h++) {
+    for (size_t t = 0; t < bc->num_active_tokens(); t++) {
+      for (size_t d = 0; d < m->kProjSize; d++) {
+        size_t kcache_idx =
+            d * MAX_SEQ_LEN * m->num_heads * BatchConfig::MAX_NUM_REQUESTS +
+            bc->token2ids.token_indexes[t].token_position * m->num_heads *
+                BatchConfig::MAX_NUM_REQUESTS +
+            h * BatchConfig::MAX_NUM_REQUESTS +
+            bc->token2ids.token_indexes[t].request_index;
+        m->kcache[kcache_idx] =
+            qkv_projs.index({(int64_t)d, (int64_t)t, 1, (int64_t)h})
+                .item<float>();
+      }
+      for (size_t d = 0; d < m->vProjSize; d++) {
+        size_t vcache_idx =
+            d * MAX_SEQ_LEN * m->num_heads * BatchConfig::MAX_NUM_REQUESTS +
+            bc->token2ids.token_indexes[t].token_position * m->num_heads *
+                BatchConfig::MAX_NUM_REQUESTS +
+            h * BatchConfig::MAX_NUM_REQUESTS +
+            bc->token2ids.token_indexes[t].request_index;
+        m->vcache[vcache_idx] =
+            qkv_projs.index({(int64_t)d, (int64_t)t, 2, (int64_t)h})
+                .item<float>();
+      }
+    }
+  }
+  // Create torch tensors from the arrays
+  torch::Tensor K_t = torch::from_blob(
+      m->kcache,
+      {m->kProjSize, MAX_SEQ_LEN, num_heads, BatchConfig::MAX_NUM_REQUESTS},
+      torch::kFloat32);
+  torch::Tensor V_t = torch::from_blob(
+      m->vcache,
+      {m->vProjSize, MAX_SEQ_LEN, num_heads, BatchConfig::MAX_NUM_REQUESTS},
+      torch::kFloat32);
+
+  // Compute useful indices
+  std::vector<size_t> req_idxs;
+  std::vector<size_t> r_first_idx;
+  std::vector<size_t> r_num_tokens;
+  for (size_t t = 0; t < bc->num_active_tokens(); t++) {
+    size_t rid = bc->token2ids.token_indexes[t].request_index;
+    if (req_idxs.size() == 0 || req_idxs[req_idxs.size() - 1] != rid) {
+      req_idxs.push_back(rid);
+      r_first_idx.push_back(t);
+      r_num_tokens.push_back(1);
+    } else {
+      r_num_tokens[r_num_tokens.size() - 1]++;
+    }
+    assert(req_idxs.size() == r_first_idx.size() &&
+           r_first_idx.size() == r_num_tokens.size());
+  }
+  assert(req_idxs.size() == bc->num_active_requests());
+  assert(std::accumulate(r_num_tokens.begin(),
+                         r_num_tokens.end(),
+                         decltype(r_num_tokens)::value_type(0)) ==
+         bc->num_active_tokens());
+
+  //  ----------------------- Loading CUDA results for this step ---------------
+  float *keyCache_cpu =
+      download_tensor<float>(m->keyCache,
+                             m->num_heads * m->kProjSize *
+                                 BatchConfig::MAX_NUM_REQUESTS * MAX_SEQ_LEN);
+  float *valueCache_cpu =
+      download_tensor<float>(m->valueCache,
+                             m->num_heads * m->vProjSize *
+                                 BatchConfig::MAX_NUM_REQUESTS * MAX_SEQ_LEN);
+  assert(keyCache_cpu != nullptr);
+  assert(valueCache_cpu != nullptr);
+
+  float *kcache_cuda = (float *)calloc(
+      m->kProjSize * MAX_SEQ_LEN * m->num_heads * BatchConfig::MAX_NUM_REQUESTS,
+      sizeof(float));
+  float *vcache_cuda = (float *)calloc(
+      m->vProjSize * MAX_SEQ_LEN * m->num_heads * BatchConfig::MAX_NUM_REQUESTS,
+      sizeof(float));
+  int index = 0;
+  for (int i = 0; i < m->kProjSize; i++) {
+    for (int j = 0; j < MAX_SEQ_LEN; j++) {
+      for (int k = 0; k < m->num_heads; k++) {
+        for (int l = 0; l < BatchConfig::MAX_NUM_REQUESTS; l++) {
+          int col_major_index = l * m->kProjSize * MAX_SEQ_LEN * m->num_heads +
+                                k * m->kProjSize * MAX_SEQ_LEN +
+                                j * m->kProjSize + i;
+          kcache_cuda[index++] = keyCache_cpu[col_major_index];
+        }
+      }
+    }
+  }
+  index = 0;
+  for (int i = 0; i < m->vProjSize; i++) {
+    for (int j = 0; j < MAX_SEQ_LEN; j++) {
+      for (int k = 0; k < m->num_heads; k++) {
+        for (int l = 0; l < BatchConfig::MAX_NUM_REQUESTS; l++) {
+          int col_major_index = l * m->vProjSize * MAX_SEQ_LEN * m->num_heads +
+                                k * m->vProjSize * MAX_SEQ_LEN +
+                                j * m->vProjSize + i;
+          vcache_cuda[index++] = valueCache_cpu[col_major_index];
+        }
+      }
+    }
+  }
+  torch::Tensor K_t_cuda = torch::from_blob(
+      kcache_cuda,
+      {m->kProjSize, MAX_SEQ_LEN, num_heads, BatchConfig::MAX_NUM_REQUESTS},
+      torch::kFloat32);
+  torch::Tensor V_t_cuda = torch::from_blob(
+      vcache_cuda,
+      {m->vProjSize, MAX_SEQ_LEN, num_heads, BatchConfig::MAX_NUM_REQUESTS},
+      torch::kFloat32);
+
+  //  ----------------------- Comparing C++ & CUDA results ---------------------
+
+  // std::cout << "kcache differences:" << std::endl;
+  // for (int i=0; i < bc->num_active_requests() + 1; i++) {
+  //   for (int j=0; j < num_heads; j++) {
+  //     for (int l=0; l < m->kProjSize; l++) {
+  //       for (int k=0; k < MAX_SEQ_LEN; k++) {
+  //         size_t kcache_idx =
+  //           l * MAX_SEQ_LEN * num_heads * BatchConfig::MAX_NUM_REQUESTS +
+  //           k * num_heads * BatchConfig::MAX_NUM_REQUESTS +
+  //           j * BatchConfig::MAX_NUM_REQUESTS +
+  //           i;
+  //           if ( abs(m->kcache[kcache_idx] - keyCache_cpu[
+  //               i * m->kProjSize * MAX_SEQ_LEN * num_heads +
+  //               j * m->kProjSize * MAX_SEQ_LEN +
+  //               k * m->kProjSize +
+  //               l
+  //           ]) > 0.00001) {
+  //             printf("req: %i (rid: %i), head: %i, data_dim: %i, token_pos:
+  //             %i\n",
+  //                   i, req_idxs[i], j, l, k);
+  //           }
+  //       }
+  //     }
+  //   }
+  // }
+
+  //  std::cout << "keyCache from CUDA:" << std::endl;
+  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
+  //    for (int j=0; j<num_heads; j++) {
+  //     for (int l=0; l<m->kProjSize; l++) {
+  //       for (int k=0; k< MAX_SEQ_LEN; k++) {
+  //         printf("%f ",
+  //           keyCache_cpu[i * m->kProjSize * MAX_SEQ_LEN * num_heads +
+  //               j * m->kProjSize * MAX_SEQ_LEN +
+  //               k * m->kProjSize +
+  //               l
+  //         ]);
+  //       }
+  //       printf("\n");
+  //     }
+  //     printf("\n");
+  //    }
+  //    printf("\n");
+  //  }
+
+  //  std::cout << "valueCache from CUDA:" << std::endl;
+  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
+  //    for (int j=0; j<num_heads; j++) {
+  //       for (int l=0; l<m->vProjSize; l++) {
+  //         for (int k=0; k< MAX_SEQ_LEN; k++) {
+  //           printf("%f ",
+  //             valueCache_cpu[
+  //                 i * m->vProjSize * MAX_SEQ_LEN * num_heads +
+  //                 j * m->vProjSize * MAX_SEQ_LEN +
+  //                 k * m->vProjSize +
+  //             l]);
+  //         }
+  //         printf("\n");
+  //       }
+  //       printf("\n");
+  //    }
+  //    printf("\n");
+  //  }
+
+  //  printf("\n");
+
+  //  std::cout << "C++ kcache:" << std::endl;
+  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
+  //    for (int j=0; j < num_heads; j++) {
+  //       for (int l=0; l < m->kProjSize; l++) {
+  //         for (int k=0; k < MAX_SEQ_LEN; k++) {
+  //           size_t kcache_idx =
+  //             l * MAX_SEQ_LEN * num_heads * BatchConfig::MAX_NUM_REQUESTS +
+  //             k * num_heads * BatchConfig::MAX_NUM_REQUESTS +
+  //             j * BatchConfig::MAX_NUM_REQUESTS +
+  //             i;
+  //           printf("%f ", m->kcache[kcache_idx]);
+  //         }
+  //         printf("\n");
+  //       }
+  //       printf("\n");
+  //    }
+  //    printf("\n");
+  //  }
+
+  //  std::cout << "C++ vcache:" << std::endl;
+  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
+  //    for (int j=0; j<num_heads; j++) {
+  //       for (int l=0; l<m->vProjSize; l++) {
+  //         for (int k=0; k< MAX_SEQ_LEN; k++) {
+  //             size_t vcache_idx =
+  //               l * MAX_SEQ_LEN * num_heads * BatchConfig::MAX_NUM_REQUESTS +
+  //               k * num_heads * BatchConfig::MAX_NUM_REQUESTS +
+  //               j * BatchConfig::MAX_NUM_REQUESTS +
+  //               i;
+  //             printf("%f ", m->vcache[vcache_idx]);
+  //         }
+  //         printf("\n");
+  //       }
+  //       printf("\n");
+  //    }
+  //    printf("\n");
+  //  }
+
+  assert(torch::allclose(K_t_cuda, K_t, 1e-05, 1e-05));
+  assert(torch::allclose(V_t_cuda, V_t, 1e-05, 1e-05));
+  free(kcache_cuda);
+  free(vcache_cuda);
+
+  // =============================================================================
+  //  Load the W_out projection weights
+  // =============================================================================
+
+  //  ----------------------- C++ operations & checks --------------------------
+  float w_out[m->vProjSize][m->num_heads][m->oProjSize] = {0};
+  for (int h = 0; h < num_heads; h++) {
+    for (int v = 0; v < m->vProjSize; v++) {
+      for (int o = 0; o < m->oProjSize; o++) {
+        w_out[v][h][o] =
+            weight_cpu[all_weight_params * h + 3 * m->qProjSize * m->qSize +
+                       m->vProjSize * o + v];
+      }
+    }
+  }
+  // convert weights to torch tensor
+  torch::Tensor torch_w_out = torch::from_blob(
+      w_out, {m->vProjSize, m->num_heads, m->oProjSize}, torch::kFloat32);
+
+  //  ----------------------- Loading CUDA results for this step ---------------
+  float *w_out_cuda = download_tensor<float>(
+      m->W_out_contiguous, m->vProjSize * m->oProjSize * m->num_heads);
+  assert(w_out_cuda != nullptr);
+  float converted_wout_tensor[m->vProjSize][m->num_heads][m->oProjSize] = {0};
+  for (int i = 0; i < m->vProjSize * m->num_heads * m->oProjSize; i++) {
+    int row_index = i % m->vProjSize;
+    int col_index = (i / m->vProjSize) % m->num_heads;
+    int depth_index = i / (m->vProjSize * m->num_heads);
+    assert(row_index < m->vProjSize && col_index < m->num_heads &&
+           depth_index < m->oProjSize);
+    converted_wout_tensor[row_index][col_index][depth_index] = w_out_cuda[i];
+  }
+  torch::Tensor w_out_cuda_tensor =
+      torch::from_blob(converted_wout_tensor,
+                       {m->vProjSize, m->num_heads, m->oProjSize},
+                       torch::kFloat32);
+
+  //  ----------------------- Comparing C++ & CUDA results ---------------------
+  assert(torch::allclose(w_out_cuda_tensor, torch_w_out, 1e-05, 1e-05));
+
+  // =============================================================================
+  //  Compute the softmax(QK^T/sqrt(d_k))V product, request by request
+  // =============================================================================
+
+  //  ----------------------- C++ initialization steps -------------------------
+  torch::Tensor Q_projs = qkv_projs.index({Slice(), Slice(), 0, Slice()})
+                              .reshape({qkv_projs.sizes()[0],
+                                        qkv_projs.sizes()[1],
+                                        qkv_projs.sizes()[3]});
+
+  torch::Tensor qk_products[bc->num_active_requests()];
+  torch::Tensor qk_softmax[bc->num_active_requests()];
+  torch::Tensor attn_heads[bc->num_active_requests()];
+
+  torch::Tensor cpp_output =
+      torch::zeros({m->oProjSize, bc->num_active_tokens()});
+
+  //  ----------------------- Loading CUDA results for this step ---------------
+  float *qk_prods_cpu = download_tensor<float>(
+      m->qk_prods,
+      BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_NUM_TOKENS * num_heads);
+  assert(qk_prods_cpu != nullptr);
+
+  float *qk_prods_softmax_cpu = download_tensor<float>(
+      m->qk_prods_softmax,
+      BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_NUM_TOKENS * num_heads);
+  assert(qk_prods_softmax_cpu != nullptr);
+
+  float *attn_heads_cpu = download_tensor<float>(
+      m->attn_heads, BatchConfig::MAX_NUM_TOKENS * m->num_heads * m->vProjSize);
+  assert(attn_heads_cpu != nullptr);
+
+  //  ----------------------- Main loop (request by request) -------------------
+  size_t qk_prods_cpu_offset = 0;
+
+  for (size_t r = 0; r < bc->num_active_requests(); r++) {
+    // Compute pre-request parameters
+    size_t num_new_tokens = r_num_tokens[r];
+    int64_t rid = (int64_t)(req_idxs[r]);
+    int64_t num_tokens_received_so_far =
+        (int64_t)(bc->token_last_available_idx[rid] + 1);
+    // printf("num_new_tokens: %lu, bc->num_processing_tokens[rid]: %i, rid:
+    // %li\n",
+    //         num_new_tokens, bc->num_processing_tokens[rid], rid);
+    assert(num_new_tokens == bc->num_processing_tokens[rid]);
+    assert(num_tokens_received_so_far >= (int64_t)num_new_tokens);
+
+    //  ----------------------- C++ computations -------------------------------
+    // Get the slice of the Q projection tensor with the tokens in the current
+    // request
+    torch::Tensor Q_req =
+        Q_projs.index({Slice(),
+                       Slice(r_first_idx[r], r_first_idx[r] + num_new_tokens),
+                       Slice()});
+    // std::cout << "Q_req.sizes(): " << Q_req.sizes() << std::endl;
+    assert(Q_req.sizes()[0] == m->qProjSize);
+    assert(Q_req.sizes()[1] == num_new_tokens);
+    assert(Q_req.sizes()[2] == num_heads);
+
+    /*printf("\n------------ QK multiplication (C++) -------------\n");
+    printf("Request r=%lu. num_new_tokens: %lu, num_tokens_received_so_far: %li,
+    rid: %li, Qproj slice: (%i, %i)\n", r, num_new_tokens,
+    num_tokens_received_so_far, rid, r_first_idx[r], r_first_idx[r] +
+    num_new_tokens);
+
+    std::cout << "Q_req matrix (idk dims):" << std::endl <<
+    Q_req.index({Slice(), Slice(), 0}) << std::endl << std::endl; std::cout <<
+    "K_t matrix (ilk dims):" << std::endl << K_t.index({Slice(), Slice(0,
+    num_tokens_received_so_far), 0, rid}) << std::endl << std::endl; std::cout
+    << "C++ alpha: " << (1.0f / sqrt(m->kProjSize)) << std::endl;*/
+
+    // Compute (Q*K^T)/sqrt(d_k) matmul
+    qk_products[r] =
+        torch::einsum("ijk,ilk->jlk",
+                      {Q_req,
+                       K_t.index({Slice(),
+                                  Slice(0, num_tokens_received_so_far),
+                                  Slice(),
+                                  rid})}) *
+        (1.0f / sqrt(m->kProjSize));
+
+    // Set entries above diagonal to -inf to make attention causal.
+    for (int h = 0; h < num_heads; h++) {
+      qk_products[r].index(
+          {Slice(), Slice(num_tokens_received_so_far - num_new_tokens), h}) =
+          qk_products[r]
+              .index({Slice(),
+                      Slice(num_tokens_received_so_far - num_new_tokens),
+                      h})
+              .tril() +
+          torch::full({(int64_t)num_new_tokens, (int64_t)num_new_tokens},
+                      -INFINITY)
+              .triu()
+              .fill_diagonal_(0);
+    }
+    // Compute softmax for each request block
+    qk_softmax[r] = torch::softmax(qk_products[r], -2);
+    assert(qk_softmax[r].sizes()[0] == num_new_tokens);
+    assert(qk_softmax[r].sizes()[1] == num_tokens_received_so_far);
+    assert(qk_softmax[r].sizes()[2] == m->num_heads);
+
+    //  ------------------- Loading CUDA results for this step ---------------
+    float converted_qk_prod[num_new_tokens][num_tokens_received_so_far]
+                           [num_heads] = {0};
+    float converted_qk_prod_softmax[num_new_tokens][num_tokens_received_so_far]
+                                   [num_heads] = {0};
+    for (size_t i = 0;
+         i < num_new_tokens * num_tokens_received_so_far * num_heads;
+         i++) {
+      size_t new_t_idx = i % num_new_tokens;
+      size_t all_t_idx = (i / num_new_tokens) % num_tokens_received_so_far;
+      size_t head_idx = i / (num_new_tokens * num_tokens_received_so_far);
+      assert(new_t_idx < num_new_tokens &&
+             all_t_idx < num_tokens_received_so_far && head_idx < num_heads);
+      converted_qk_prod[new_t_idx][all_t_idx][head_idx] =
+          qk_prods_cpu[i + qk_prods_cpu_offset];
+      converted_qk_prod_softmax[new_t_idx][all_t_idx][head_idx] =
+          qk_prods_softmax_cpu[i + qk_prods_cpu_offset];
+    }
+    torch::Tensor qk_prods_cuda = torch::from_blob(
+        converted_qk_prod,
+        {(int64_t)num_new_tokens, num_tokens_received_so_far, num_heads},
+        torch::kFloat32);
+    torch::Tensor qk_prods_softmax_cuda = torch::from_blob(
+        converted_qk_prod_softmax,
+        {(int64_t)num_new_tokens, num_tokens_received_so_far, num_heads},
+        torch::kFloat32);
+
+    //  ------------------- Comparing C++ & CUDA results ------------------
+    /* std::cout << "C++:" <<std::endl;
+    for (int h=0; h<num_heads; h++) {
+      std::cout << qk_products[r].index({Slice(), Slice(), h}) << std::endl;
+    }
+    std::cout << "CUDA:" <<std::endl;
+    for (int h=0; h<num_heads; h++) {
+      std::cout << qk_prods_cuda.index({Slice(), Slice(), h}) << std::endl;
+    } */
+    /* //
+    std::cout << "C++:" <<std::endl;
+    for (int h=0; h<num_heads; h++) {
+      std::cout << qk_softmax[r].index({Slice(), Slice(), h}) << std::endl;
+    }
+    std::cout << "CUDA:" <<std::endl;
+    for (int h=0; h<num_heads; h++) {
+      std::cout << qk_prods_softmax_cuda.index({Slice(), Slice(), h}) <<
+    std::endl;
+    } */
+    // std::cout << "C++ tril:" <<std::endl;
+    // for (int h=0; h<num_heads; h++) {
+    //   std::cout << qk_products[r].tril().index({Slice(), Slice(), h}) <<
+    //   std::endl;
+    // }
+    assert(torch::allclose(qk_prods_cuda, qk_products[r], 1e-05, 1e-05));
+    assert(torch::allclose(qk_prods_softmax_cuda, qk_softmax[r], 1e-05, 1e-05));
+
+    //  --------------------- C++ computations --------------------------
+    // Multiply softmax results by V
+    assert(
+        V_t.index({Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})
+            .sizes()[0] == m->vProjSize);
+    assert(
+        V_t.index({Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})
+            .sizes()[1] == num_tokens_received_so_far);
+    assert(
+        V_t.index({Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})
+            .sizes()[2] == m->num_heads);
+    attn_heads[r] = torch::einsum(
+        "ijk,ljk->ilk",
+        {qk_softmax[r],
+         V_t.index(
+             {Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})});
+    assert(attn_heads[r].sizes()[0] == num_new_tokens);
+    assert(attn_heads[r].sizes()[1] == m->vProjSize);
+    assert(attn_heads[r].sizes()[2] == m->num_heads);
+
+    //  ------------------- Loading CUDA results for this step  ---------------
+    float converted_attn_heads_cpu[num_new_tokens][m->vProjSize][m->num_heads] =
+        {0};
+    for (int i = 0; i < num_new_tokens * m->vProjSize * m->num_heads; i++) {
+      int token_ix = i % num_new_tokens;
+      int vproj_idx = (i / num_new_tokens) % m->vProjSize;
+      int head_idx = i / (num_new_tokens * m->vProjSize);
+      assert(token_ix < num_new_tokens && vproj_idx < m->vProjSize &&
+             head_idx < m->num_heads);
+      converted_attn_heads_cpu[token_ix][vproj_idx][head_idx] =
+          attn_heads_cpu[r_first_idx[r] * m->vProjSize * m->num_heads + i];
+    }
+    torch::Tensor converted_attn_heads_cuda =
+        torch::from_blob(converted_attn_heads_cpu,
+                         {(int64_t)num_new_tokens, m->vProjSize, m->num_heads},
+                         torch::kFloat32);
+
+    //  -------------------- Comparing C++ & CUDA results -------------------
+    /* std::cout << "CUDA attn head for req " << r << ":" <<std::endl;
+    for (int h=0; h<m->num_heads; h++) {
+      std::cout << converted_attn_heads_cuda.index({Slice(), Slice(), h}) <<
+    std::endl;
+    }
+    std::cout << "C++ attn head for req " << r << ":" <<std::endl;
+    for (int h=0; h<m->num_heads; h++) {
+      std::cout << attn_heads[r].index({Slice(), Slice(), h}) << std::endl;
+    } */
+    assert(torch::allclose(
+        converted_attn_heads_cuda, attn_heads[r], 1e-05, 1e-05));
+
+    //  ----------------------- C++ computations ----------------------------
+    // Compute output values by projecting all heads to output space
+    cpp_output.index(
+        {Slice(),
+         Slice(r_first_idx[r], r_first_idx[r] + (int64_t)num_new_tokens)}) =
+        torch::einsum("jkl,ijk->li", {torch_w_out, attn_heads[r]});
+
+    // increment main loop's auxiliary index
+    qk_prods_cpu_offset +=
+        num_new_tokens * num_tokens_received_so_far * num_heads;
+  }
+
+  //  ----------------------- Comparing C++ & CUDA results ---------------------
+  /* std::cout << "C++:" <<std::endl;
+  for (int i=0; i<m->oProjSize; i++) {
+    std::cout << cpp_output.index({i, Slice()}) << std::endl;
+  }
+  std::cout << "CUDA:" <<std::endl;
+  for (int i=0; i<m->oProjSize; i++) {
+    std::cout << torch_out_cuda.index({i, Slice(0,
+  (int64_t)bc->num_active_tokens())}) << std::endl;
+  } */
+
+  assert(torch::allclose(
+      torch_out_cuda.index(
+          {Slice(), Slice(0, (int64_t)bc->num_active_tokens())}),
+      cpp_output,
+      1e-05,
+      1e-05));
+
+  // =============================================================================
+  //  Cleanup
+  // =============================================================================
+
+  checkCUDA(cudaFreeHost(input_cpu));
+  checkCUDA(cudaFreeHost(weight_cpu));
+  checkCUDA(cudaFreeHost(output_cpu));
+  checkCUDA(cudaFreeHost(QKVProjArray_cpu));
+  checkCUDA(cudaFreeHost(keyCache_cpu));
+  checkCUDA(cudaFreeHost(valueCache_cpu));
+  checkCUDA(cudaFreeHost(qk_prods_cpu));
+  checkCUDA(cudaFreeHost(qk_prods_softmax_cpu));
+  checkCUDA(cudaFreeHost(attn_heads_cpu));
+  checkCUDA(cudaFreeHost(w_out_cuda));
+  // assert(false && "All good if you see this assert failure! :)");
+#endif
+  // Done with INFERENCE_TESTS block
 }
 
 void IncMultiHeadSelfAttention::backward(FFModel const &ff) {
@@ -555,97 +1294,7 @@ bool IncMultiHeadSelfAttention::get_int_parameter(PMParameter para,
 
 bool IncMultiHeadSelfAttention::measure_operator_cost(
     Simulator *sim, MachineView const &mv, CostMetrics &cost_metrics) const {
-  ParallelTensorBase sub_output, sub_input;
-  if (!inputs[0]->get_sub_tensor(mv, sub_input)) {
-    return false;
-  }
-  if (!outputs[0]->get_sub_tensor(mv, sub_output)) {
-    return false;
-  }
-  // Currently assume only data parallel
-  size_t num_weights = 0;
-  {
-    // Compute weight size
-    int qSize = sub_input.dims[0].size;
-    int kSize = sub_input.dims[0].size;
-    int vSize = sub_input.dims[0].size;
-    int qParas = qProjSize * qSize;
-    int kParas = kProjSize * kSize;
-    int vParas = vProjSize * vSize;
-    int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
-    num_weights = num_heads * (qParas + kParas + vParas + oParas);
-  }
-  assert(sub_input.num_dims == 4);
-  int num_samples = sub_input.dims[2].size;
-
-  IncMultiHeadSelfAttentionMeta *m = new IncMultiHeadSelfAttentionMeta(
-      sim->handler, this, sim->memory, num_samples, num_heads);
-
-  // allocate tensors in simulator
-  sim->free_all();
-  float const *input_ptr =
-      (float const *)sim->allocate(sub_input.get_volume(), DT_FLOAT);
-  cost_metrics.inputs_memory += cost_metrics.total_mem_diff_from(sim->offset);
-
-  float *output_ptr = (float *)sim->allocate(sub_output.get_volume(), DT_FLOAT);
-  assert(output_ptr != NULL);
-  cost_metrics.outputs_memory += cost_metrics.total_mem_diff_from(sim->offset);
-
-  float const *weight_ptr = (float const *)sim->allocate(num_weights, DT_FLOAT);
-  cost_metrics.weights_memory += cost_metrics.total_mem_diff_from(sim->offset);
-
-  assert(m->profiling == false);
-
-  std::function<void()> forward, backward;
-  forward = [&] {
-    inference_kernel_wrapper(m, input_ptr, weight_ptr, output_ptr);
-  };
-  if (sim->computationMode == COMP_MODE_TRAINING) {
-    // IncMultiHeadSelfAttention does not support training
-    assert(false);
-  }
-
-  inner_measure_operator_cost(sim, forward, backward, cost_metrics);
-
-  if (sim->computationMode == COMP_MODE_TRAINING) {
-    printf("[Measure IncMultiHeadSelfAttention] query(%d %d %d) key(%d %d %d) "
-           "value(%d %d %d) output(%d %d %d)"
-           "forward_time(%.4lf) backward_time(%.4lf)\n",
-           sub_input.dims[2].size,
-           sub_input.dims[1].size,
-           sub_input.dims[0].size,
-           sub_input.dims[2].size,
-           sub_input.dims[1].size,
-           sub_input.dims[0].size,
-           sub_input.dims[2].size,
-           sub_input.dims[1].size,
-           sub_input.dims[0].size,
-           sub_output.dims[2].size,
-           sub_output.dims[1].size,
-           sub_output.dims[0].size,
-           cost_metrics.forward_time,
-           cost_metrics.backward_time);
-  } else {
-    printf("[Measure IncMultiHeadSelfAttention] query(%d %d %d) key(%d %d %d) "
-           "value(%d %d %d) output(%d %d %d)"
-           "forward_time(%.4lf)\n",
-           sub_input.dims[2].size,
-           sub_input.dims[1].size,
-           sub_input.dims[0].size,
-           sub_input.dims[2].size,
-           sub_input.dims[1].size,
-           sub_input.dims[0].size,
-           sub_input.dims[2].size,
-           sub_input.dims[1].size,
-           sub_input.dims[0].size,
-           sub_output.dims[2].size,
-           sub_output.dims[1].size,
-           sub_output.dims[0].size,
-           cost_metrics.forward_time);
-  }
-  // Free multiheadattentionmeta
-  delete m;
-  return true;
+  return false;
 }
 
 using PCG::Node;
diff --git a/src/ops/inc_multihead_self_attention.cpp b/src/ops/inc_multihead_self_attention.cpp
index 0903d7fa5d..12ab8ae30c 100644
--- a/src/ops/inc_multihead_self_attention.cpp
+++ b/src/ops/inc_multihead_self_attention.cpp
@@ -23,20 +23,10 @@ namespace FlexFlow {
 using Legion::coord_t;
 using Legion::Memory;
 
-/*static*/
-void IncMultiHeadSelfAttention::inference_kernel(
-    IncMultiHeadSelfAttentionMeta const *m,
-    float const *input_ptr,
-    float const *weight_ptr,
-    float *output_ptr,
-    hipStream_t stream) {
-  checkCUDNN(miopenSetStream(m->handle.dnn, stream));
-  handle_unimplemented_hip_kernel(OP_INC_MULTIHEAD_SELF_ATTENTION);
-}
-
 /*static*/
 void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     IncMultiHeadSelfAttentionMeta const *m,
+    BatchConfig const *bc,
     float const *input_ptr,
     float const *weight_ptr,
     float *output_ptr) {
@@ -49,8 +39,9 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     hipEventCreate(&t_end);
     hipEventRecord(t_start, stream);
   }
-  IncMultiHeadSelfAttention::inference_kernel(
-      m, input_ptr, weight_ptr, output_ptr, stream);
+
+  handle_unimplemented_hip_kernel(OP_INC_MULTIHEAD_SELF_ATTENTION);
+
   if (m->profiling) {
     hipEventRecord(t_end, stream);
     checkCUDA(hipEventSynchronize(t_end));
@@ -68,185 +59,16 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
 IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     FFHandler handler,
     IncMultiHeadSelfAttention const *attn,
+    float const *weight_ptr,
     Memory gpu_mem,
     int num_samples,
-    int num_heads)
+    int _num_heads)
     : OpMeta(handler, attn) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDNN(miopenSetStream(handler.dnn, stream));
-#if 0
-  checkCUDNN(cudnnCreateAttnDescriptor(&attnDesc));
-  checkCUDNN(cudnnCreateSeqDataDescriptor(&qDesc));
-  checkCUDNN(cudnnCreateSeqDataDescriptor(&kDesc));
-  checkCUDNN(cudnnCreateSeqDataDescriptor(&vDesc));
-  checkCUDNN(cudnnCreateSeqDataDescriptor(&oDesc));
-  // Currently do not support adding bias to key/value projection
-  assert(!attn->add_bias_kv);
-  cudnnAttnQueryMap_t attnMode = CUDNN_ATTN_QUERYMAP_ALL_TO_ONE;
-  // Assume no beam search for now
-  int maxBeamSize = 1;
-  // printf("batchSize(%d) qSize(%d) kSize(%d) vSize(%d) qProjSize(%d)
-  // kProjSize(%d)\n",
-  //     num_samples, attn->qSize, attn->kSize, attn->vSize, attn->qProjSize,
-  //     attn->kProjSize);
-  // printf("vProjSize(%d) oProjSize(%d) qoSeqLength(%d) kvSeqLength(%d)\n",
-  //     attn->vProjSize, attn->oProjSize, attn->qoSeqLength,
-  //     attn->kvSeqLength);
-  cudnnMathType_t math_type;
-  if (handle.allowTensorOpMathConversion) {
-    math_type = CUDNN_TENSOR_OP_MATH_ALLOW_CONVERSION;
-  } else {
-    math_type = CUDNN_TENSOR_OP_MATH;
-  }
-  checkCUDNN(cudnnSetAttnDescriptor(attnDesc,
-                                    attnMode,
-                                    num_heads,
-                                    1.0f /*smScalar*/,
-                                    CUDNN_DATA_FLOAT,
-                                    CUDNN_DATA_FLOAT,
-                                    math_type,
-                                    NULL /*attnDropoutDesc*/,
-                                    NULL /*postDropoutDesc*/,
-                                    attn->qSize,
-                                    attn->kSize,
-                                    attn->vSize,
-                                    attn->qProjSize,
-                                    attn->kProjSize,
-                                    attn->vProjSize,
-                                    attn->oProjSize,
-                                    attn->qoSeqLength,
-                                    attn->kvSeqLength,
-                                    num_samples,
-                                    maxBeamSize));
-  size_t workSpaceSize;
-  checkCUDNN(cudnnGetMultiHeadAttnBuffers(
-      handler.dnn, attnDesc, &weightSize, &workSpaceSize, &reserveSpaceSize));
-  assert(workSpaceSize <= handler.workSpaceSize);
-  // printf("weightSize(%zu) workSpaceSize(%zu) reserveSpaceSize(%zu)\n",
-  // weightSize, workSpaceSize, reserveSpaceSize);
-  int dimA[CUDNN_SEQDATA_DIM_COUNT];
-  cudnnSeqDataAxis_t axes[CUDNN_SEQDATA_DIM_COUNT];
-  assert(CUDNN_SEQDATA_DIM_COUNT == 4);
-  axes[3] = CUDNN_SEQDATA_VECT_DIM; // 3 = nbDims-1
-  axes[2] = CUDNN_SEQDATA_BEAM_DIM;
-  axes[1] = CUDNN_SEQDATA_TIME_DIM;
-  axes[0] = CUDNN_SEQDATA_BATCH_DIM;
-  int *qoSeqArray = (int *)malloc(sizeof(int) * num_samples);
-  int *kvSeqArray = (int *)malloc(sizeof(int) * num_samples);
-  for (int i = 0; i < num_samples; i++) {
-    qoSeqArray[i] = attn->qoSeqLength;
-    kvSeqArray[i] = attn->kvSeqLength;
-  }
-  // Set qDesc
-  {
-    dimA[CUDNN_SEQDATA_BEAM_DIM] = 1;
-    dimA[CUDNN_SEQDATA_BATCH_DIM] = num_samples;
-    dimA[CUDNN_SEQDATA_TIME_DIM] = attn->qoSeqLength;
-    dimA[CUDNN_SEQDATA_VECT_DIM] = attn->qSize;
-    checkCUDNN(cudnnSetSeqDataDescriptor(qDesc,
-                                         CUDNN_DATA_FLOAT,
-                                         CUDNN_SEQDATA_DIM_COUNT,
-                                         dimA,
-                                         axes,
-                                         num_samples,
-                                         qoSeqArray,
-                                         NULL));
-  }
-  // Set kDesc
-  {
-    dimA[CUDNN_SEQDATA_BEAM_DIM] = 1;
-    dimA[CUDNN_SEQDATA_BATCH_DIM] = num_samples;
-    dimA[CUDNN_SEQDATA_TIME_DIM] = attn->kvSeqLength;
-    dimA[CUDNN_SEQDATA_VECT_DIM] = attn->kSize;
-    checkCUDNN(cudnnSetSeqDataDescriptor(kDesc,
-                                         CUDNN_DATA_FLOAT,
-                                         CUDNN_SEQDATA_DIM_COUNT,
-                                         dimA,
-                                         axes,
-                                         num_samples,
-                                         kvSeqArray,
-                                         NULL));
-  }
-  // Set vDesc
-  {
-    dimA[CUDNN_SEQDATA_BEAM_DIM] = 1;
-    dimA[CUDNN_SEQDATA_BATCH_DIM] = num_samples;
-    dimA[CUDNN_SEQDATA_TIME_DIM] = attn->kvSeqLength;
-    dimA[CUDNN_SEQDATA_VECT_DIM] = attn->vSize;
-    checkCUDNN(cudnnSetSeqDataDescriptor(vDesc,
-                                         CUDNN_DATA_FLOAT,
-                                         CUDNN_SEQDATA_DIM_COUNT,
-                                         dimA,
-                                         axes,
-                                         num_samples,
-                                         kvSeqArray,
-                                         NULL));
-  }
-  // Set oDesc
-  {
-    dimA[CUDNN_SEQDATA_BEAM_DIM] = 1;
-    dimA[CUDNN_SEQDATA_BATCH_DIM] = num_samples;
-    dimA[CUDNN_SEQDATA_TIME_DIM] = attn->qoSeqLength;
-    dimA[CUDNN_SEQDATA_VECT_DIM] = attn->oProjSize;
-    checkCUDNN(cudnnSetSeqDataDescriptor(oDesc,
-                                         CUDNN_DATA_FLOAT,
-                                         CUDNN_SEQDATA_DIM_COUNT,
-                                         dimA,
-                                         axes,
-                                         num_samples,
-                                         qoSeqArray,
-                                         NULL));
-  }
-  // allocate memory for the seqArray and reserve space
-  {
-    size_t totalSize = reserveSpaceSize + sizeof(int) * num_samples * 2;
-    Realm::Rect<1, coord_t> bounds(Realm::Point<1, coord_t>(0),
-                                   Realm::Point<1, coord_t>(totalSize - 1));
-    std::vector<size_t> field_sizes;
-    field_sizes.push_back(sizeof(char));
-    Realm::RegionInstance::create_instance(reserveInst,
-                                           gpu_mem,
-                                           bounds,
-                                           field_sizes,
-                                           0,
-                                           Realm::ProfilingRequestSet())
-        .wait();
-    devQoSeqArray = (int *)reserveInst.pointer_untyped(0, sizeof(char));
-    checkCUDA(cudaMemcpy(devQoSeqArray,
-                         qoSeqArray,
-                         sizeof(int) * num_samples,
-                         cudaMemcpyHostToDevice));
-    devKvSeqArray = (int *)devQoSeqArray + num_samples;
-    checkCUDA(cudaMemcpy(devKvSeqArray,
-                         kvSeqArray,
-                         sizeof(int) * num_samples,
-                         cudaMemcpyHostToDevice));
-    reserveSpace = (int *)devKvSeqArray + num_samples;
-  }
-  // allocate memory for loWinIdx/hiWinIdx
-  loWinIdx = (int *)malloc(sizeof(int) * attn->qoSeqLength);
-  hiWinIdx = (int *)malloc(sizeof(int) * attn->qoSeqLength);
-  for (int i = 0; i < attn->qoSeqLength; i++) {
-    loWinIdx[i] = 0;
-    hiWinIdx[i] = attn->kvSeqLength;
-  }
-  free(qoSeqArray);
-  free(kvSeqArray);
-#endif
 }
 
-IncMultiHeadSelfAttentionMeta::~IncMultiHeadSelfAttentionMeta(void) {
-#if 0
-  reserveInst.destroy();
-  free(loWinIdx);
-  free(hiWinIdx);
-  checkCUDNN(cudnnDestroyAttnDescriptor(attnDesc));
-  checkCUDNN(cudnnDestroySeqDataDescriptor(qDesc));
-  checkCUDNN(cudnnDestroySeqDataDescriptor(kDesc));
-  checkCUDNN(cudnnDestroySeqDataDescriptor(vDesc));
-  checkCUDNN(cudnnDestroySeqDataDescriptor(oDesc));
-#endif
-}
+IncMultiHeadSelfAttentionMeta::~IncMultiHeadSelfAttentionMeta(void) {}
 
 }; // namespace FlexFlow
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 048453dd17..4c3e123aa3 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -22,42 +22,467 @@ namespace FlexFlow {
 using Legion::coord_t;
 using Legion::Memory;
 
-/*static*/
-void IncMultiHeadSelfAttention::inference_kernel(
-    IncMultiHeadSelfAttentionMeta const *m,
-    float const *input_ptr,
-    float const *weight_ptr,
-    float *output_ptr,
-    cudaStream_t stream) {
+__global__ void build_w_out_tensor(float const *weight_ptr,
+                                   float *contiguous_weight_ptr,
+                                   int vProjSize,
+                                   int oProjSize,
+                                   int num_heads,
+                                   int qkv_weight_block_size) {
+  CUDA_KERNEL_LOOP(i, vProjSize * oProjSize * num_heads) {
+    int row_idx = i % vProjSize;
+    int col_idx = (i / vProjSize) % oProjSize;
+    int head_idx = i / (vProjSize * oProjSize);
+    contiguous_weight_ptr[col_idx * vProjSize * num_heads +
+                          head_idx * vProjSize + row_idx] =
+        weight_ptr[head_idx * (qkv_weight_block_size + vProjSize * oProjSize) +
+                   qkv_weight_block_size + col_idx * vProjSize + row_idx];
+  }
+}
+
+void inference_kernel1(IncMultiHeadSelfAttentionMeta const *m,
+                       BatchConfig const *bc,
+                       float const *input_ptr,
+                       float const *weight_ptr,
+                       float *output_ptr,
+                       cudaStream_t stream) {
+
+  checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
 
-  checkCUDNN(cudnnMultiHeadAttnForward(m->handle.dnn,
-                                       m->attnDesc,
-                                       -1,
-                                       m->loWinIdx,
-                                       m->hiWinIdx,
-                                       m->devQoSeqArray,
-                                       m->devKvSeqArray,
-                                       m->qDesc,
+  float alpha = 1.0f, beta = 0.0f;
+  assert(m->qSize == m->vSize && m->qSize == m->kSize);
+  cudaDataType_t data_type = ff_to_cuda_datatype(DT_FLOAT);
+#if CUDA_VERSION >= 11000
+  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
+  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+#else
+  cudaDataType_t compute_type = CUDA_R_32F;
+#endif
+  // Compute (W^T)x matmul: einsum(ijkl,im->jmkl)
+  // Weights: qSize x qProjSize x 3 x num_heads
+  // Input: qSize x num_tokens
+  // Output >>> qProjSize x num_tokens x 3 x num_heads
+  int m_q = m->qProjSize;
+  int m_k = m->kProjSize;
+  int m_v = m->vProjSize;
+  assert(m_q == m_k && m_k == m_v); // keep things simple for now
+  int n = bc->num_active_tokens();
+  int k = m->qSize;
+  int lda = k, ldb = k, ldc_q = m_q, ldc_k = m_k, ldc_v = m_v;
+  size_t strideA =
+      m->weights_params; // need to also skip over all the parameters for each
+                         // head, plus the unused W_o weights
+  size_t strideB = 0;    // input stays the same for all heads.
+  size_t strideC =
+      (m_q + m_k + m_v) * n; // size of the output block for each head.
+  // Q
+  checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                       CUBLAS_OP_T,
+                                       CUBLAS_OP_N,
+                                       m_q,
+                                       n,
+                                       k,
+                                       &alpha,
+                                       weight_ptr,
+                                       data_type,
+                                       lda,
+                                       strideA,
                                        input_ptr,
-                                       NULL /*residual*/,
-                                       m->kDesc,
+                                       data_type,
+                                       ldb,
+                                       strideB,
+                                       &beta,
+                                       output_ptr,
+                                       data_type,
+                                       ldc_q,
+                                       strideC,
+                                       m->num_heads,
+                                       compute_type,
+                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+  // K
+  checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                       CUBLAS_OP_T,
+                                       CUBLAS_OP_N,
+                                       m_k,
+                                       n,
+                                       k,
+                                       &alpha,
+                                       weight_ptr + m_q * k,
+                                       data_type,
+                                       lda,
+                                       strideA,
                                        input_ptr,
-                                       m->vDesc,
+                                       data_type,
+                                       ldb,
+                                       strideB,
+                                       &beta,
+                                       output_ptr + m_q * n,
+                                       data_type,
+                                       ldc_k,
+                                       strideC,
+                                       m->num_heads,
+                                       compute_type,
+                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+  // V
+  checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                       CUBLAS_OP_T,
+                                       CUBLAS_OP_N,
+                                       m_v,
+                                       n,
+                                       k,
+                                       &alpha,
+                                       weight_ptr + (m_q + m_k) * k,
+                                       data_type,
+                                       lda,
+                                       strideA,
                                        input_ptr,
-                                       m->oDesc,
-                                       output_ptr,
-                                       m->weightSize,
-                                       weight_ptr,
-                                       m->handle.workSpaceSize,
-                                       m->handle.workSpace,
-                                       m->reserveSpaceSize,
-                                       m->reserveSpace));
+                                       data_type,
+                                       ldb,
+                                       strideB,
+                                       &beta,
+                                       output_ptr + (m_q + m_k) * n,
+                                       data_type,
+                                       ldc_v,
+                                       strideC,
+                                       m->num_heads,
+                                       compute_type,
+                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+}
+
+__global__ void store_kv_cache(float const *devQKVProjArray,
+                               float *cache_ptr,
+                               BatchConfig::token_idxs const *id_map,
+                               int qProjSize,
+                               int kProjSize,
+                               int vProjSize,
+                               int num_tokens,
+                               int num_heads,
+                               int max_seq_len,
+                               bool k_cache) {
+  CUDA_KERNEL_LOOP(i,
+                   num_tokens * (k_cache ? kProjSize : vProjSize) * num_heads) {
+    int proj_size = k_cache ? kProjSize : vProjSize;
+    int head_idx = i / (num_tokens * proj_size);
+    int token_idx = (i - head_idx * (num_tokens * proj_size)) / proj_size;
+    int data_idx = i % proj_size;
+
+    int qkv_block_size = (qProjSize + kProjSize + vProjSize) * num_tokens;
+    int current_head_block_size =
+        num_tokens * (k_cache ? qProjSize : qProjSize + kProjSize);
+    float val =
+        devQKVProjArray[head_idx * qkv_block_size + current_head_block_size +
+                        token_idx * proj_size + data_idx];
+
+    int const req_id = id_map[token_idx].request_index;
+    int const tok_id = id_map[token_idx].token_position;
+
+    cache_ptr[req_id * (num_heads * max_seq_len * proj_size) +
+              head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
+              data_idx] = val;
+  }
+}
+
+void inference_kernel2(IncMultiHeadSelfAttentionMeta const *m,
+                       BatchConfig const *bc,
+                       cudaStream_t stream) {
+  int num_tokens = bc->num_active_tokens();
+  if (num_tokens > 0) {
+    int parallelism = m->kProjSize * num_tokens * m->num_heads;
+    store_kv_cache<<<GET_BLOCKS(parallelism),
+                     min(CUDA_NUM_THREADS, parallelism),
+                     0,
+                     stream>>>(m->devQKVProjArray,
+                               m->keyCache,
+                               m->dev_token2ids,
+                               m->qProjSize,
+                               m->kProjSize,
+                               m->vProjSize,
+                               num_tokens,
+                               m->num_heads,
+                               MAX_SEQ_LEN,
+                               /* k_cache = */ true);
+    parallelism = m->vProjSize * num_tokens * m->num_heads;
+    store_kv_cache<<<GET_BLOCKS(parallelism),
+                     min(CUDA_NUM_THREADS, parallelism),
+                     0,
+                     stream>>>(m->devQKVProjArray,
+                               m->valueCache,
+                               m->dev_token2ids,
+                               m->qProjSize,
+                               m->kProjSize,
+                               m->vProjSize,
+                               num_tokens,
+                               m->num_heads,
+                               MAX_SEQ_LEN,
+                               /* k_cache = */ false);
+  }
+}
+
+__global__ void fill_entries_above_diagonal(float *matrix,
+                                            size_t num_rows,
+                                            size_t num_cols,
+                                            size_t num_heads,
+                                            size_t entries_above_diagonal,
+                                            float value) {
+  CUDA_KERNEL_LOOP(i, entries_above_diagonal * num_heads) {
+    size_t head_idx = i / entries_above_diagonal;
+    size_t entry_idx = i % entries_above_diagonal;
+    size_t y = (-1 + sqrt(8 * (float)entry_idx + 1)) / 2;
+    size_t x = entry_idx - y * (y + 1) / 2;
+    y += (num_cols - num_rows) + 1;
+    matrix[head_idx * num_rows * num_cols + num_cols * y + x] = value;
+  }
+}
+
+void inference_kernel3(IncMultiHeadSelfAttentionMeta const *m,
+                       BatchConfig const *bc,
+                       float *output_ptr,
+                       cudaStream_t stream) {
+  checkCUDA(cublasSetStream(m->handle.blas, stream));
+  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
+  cudaDataType_t cublas_data_type = ff_to_cuda_datatype(DT_FLOAT);
+#if CUDA_VERSION >= 11000
+  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
+  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+#else
+  cudaDataType_t compute_type = CUDA_R_32F;
+#endif
+  // int num_requests = bc->num_active_requests();
+  int num_tokens = bc->num_active_tokens();
+  int tokens_previous_requests = 0;
+  int tokens_prev_requests_squares = 0;
+  int qkv_block_size =
+      (m->qProjSize + m->kProjSize + m->vProjSize) * num_tokens;
+  int kt_block_size = m->kProjSize * MAX_SEQ_LEN;
+  int kt_req_block_size = kt_block_size * m->num_heads;
+  int vt_block_size = m->vProjSize * MAX_SEQ_LEN;
+  int vt_req_block_size = vt_block_size * m->num_heads;
+  assert(m->qProjSize == m->kProjSize);
+
+  for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    int num_new_tokens = bc->num_processing_tokens[i];
+    int total_tokens = bc->token_last_available_idx[i] + 1;
+
+    // Compute (QK^T/sqrt(d_k))
+    int m_ = num_new_tokens;
+    int n = total_tokens;
+    int k = m->qProjSize;
+    int lda = k, ldb = k, ldc = m_;
+    int strideA = qkv_block_size;
+    int strideB = kt_block_size;
+    int strideC = num_new_tokens * total_tokens;
+    float alpha = 1.0f / (float)sqrt(m->kProjSize), beta = 0.0f;
+    // To get A, skip over Q entries from previous requests (same head)
+    void const *A = (void const *)(m->devQKVProjArray +
+                                   tokens_previous_requests * m->qProjSize);
+    // To get B, skip over K entries from previous requests (all heads +
+    // padding)
+    void const *B = (void const *)(m->keyCache + i * kt_req_block_size);
+    // To get C, skip over QK^T products from previous requests
+    void *C =
+        (void *)(m->qk_prods + m->num_heads * tokens_prev_requests_squares);
+
+    /*printf("\n------------ QK multiplication (CUDA) -------------\n");
+    printf("req: %i, num_new_tokens: %i, total_tokens: %i,
+    tokens_previous_requests: %i, tokens_prev_requests_squares: %i\n", i,
+    num_new_tokens, total_tokens, tokens_previous_requests,
+    tokens_prev_requests_squares); printf("About to multiply the following
+    matrices (printing only first head):\n"); printf("A:\n"); float
+    *QKVProjArray_cpu = download_tensor<float>(m->devQKVProjArray,
+    BatchConfig::MAX_NUM_TOKENS * (m->qProjSize + m->kProjSize + m->vProjSize) *
+    m->num_heads); assert(QKVProjArray_cpu != nullptr); float *keyCache_cpu =
+      download_tensor<float>(m->keyCache,
+                             m->num_heads * m->kProjSize *
+                                 BatchConfig::MAX_NUM_REQUESTS * MAX_SEQ_LEN);
+    assert(keyCache_cpu != nullptr);
+    for (int aaa=0; aaa < m->qProjSize; aaa++) {
+      for (int bbb=0; bbb<num_new_tokens; bbb++) {
+        printf("%f ", QKVProjArray_cpu[(tokens_previous_requests + bbb) *
+    m->qProjSize + aaa]);
+      }
+      printf("\n");
+    }
+    printf("B:\n");
+    for (int aaa=0; aaa < m->kProjSize; aaa++) {
+      for (int bbb=0; bbb < total_tokens; bbb++) {
+        printf("%f ", keyCache_cpu[i * kt_req_block_size + bbb*m->kProjSize +
+    aaa]);
+      }
+      printf("\n");
+    }
+    checkCUDA(cudaFreeHost(QKVProjArray_cpu));
+    checkCUDA(cudaFreeHost(keyCache_cpu));
+    printf("------------------------------------------------------------\n");
+    printf("CUDA alpha: %f", alpha);*/
+
+    checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                         CUBLAS_OP_T,
+                                         CUBLAS_OP_N,
+                                         m_,
+                                         n,
+                                         k,
+                                         &alpha,
+                                         A,
+                                         cublas_data_type,
+                                         lda,
+                                         strideA,
+                                         B,
+                                         cublas_data_type,
+                                         ldb,
+                                         strideB,
+                                         &beta,
+                                         C,
+                                         cublas_data_type,
+                                         ldc,
+                                         strideC,
+                                         m->num_heads,
+                                         compute_type,
+                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
+    // Fill all elements above diagonal in qk prods with -inf to force
+    // causal attention.
+    assert(num_new_tokens <= total_tokens);
+    size_t entries_above_diagonal = num_new_tokens * (num_new_tokens - 1) / 2;
+    if (entries_above_diagonal > 0) {
+      size_t parallelism = m->num_heads * entries_above_diagonal;
+      fill_entries_above_diagonal<<<GET_BLOCKS(parallelism),
+                                    min((size_t)CUDA_NUM_THREADS, parallelism),
+                                    0,
+                                    stream>>>((float *)C,
+                                              num_new_tokens,
+                                              total_tokens,
+                                              m->num_heads,
+                                              entries_above_diagonal,
+                                              -INFINITY);
+    }
+    // Compute Softmax(QK^T/sqrt(d_k))
+    cudnnTensorDescriptor_t qk_tensor;
+    checkCUDNN(cudnnCreateTensorDescriptor(&qk_tensor));
+    // Before modifying the parameters below, make sure to read the following
+    // description of the CUDNN_TENSOR_NCHW tensor layout, from
+    // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#cudnnTensorFormat_t:
+    // This tensor format specifies that the data is laid out in the following
+    // order: batch size, feature maps, rows, columns. The strides are
+    // implicitly defined in such a way that the data are contiguous in memory
+    // with no padding between images, feature maps, rows, and columns; the
+    // columns are the inner dimension and the images are the outermost
+    // dimension.
+    int n_param = m->num_heads;
+    int c_param = total_tokens;
+    int h_param = 1;
+    int w_param = num_new_tokens;
+    checkCUDNN(cudnnSetTensor4dDescriptor(qk_tensor,
+                                          CUDNN_TENSOR_NCHW,
+                                          CUDNN_DATA_FLOAT,
+                                          n_param,
+                                          c_param,
+                                          h_param,
+                                          w_param));
+    alpha = 1.0f, beta = 0.0f;
+    void *C_softmax = (void *)(m->qk_prods_softmax +
+                               m->num_heads * tokens_prev_requests_squares);
+    // The softmax operation below is executed according to the
+    // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
+    // softmax operation is computed per spatial location (H,W) per image (N)
+    // across dimension C.
+    checkCUDNN(cudnnSoftmaxForward(m->handle.dnn,
+                                   CUDNN_SOFTMAX_ACCURATE,
+                                   CUDNN_SOFTMAX_MODE_CHANNEL,
+                                   &alpha,
+                                   qk_tensor,
+                                   (void *)((float *)C),
+                                   &beta,
+                                   qk_tensor,
+                                   (void *)((float *)C_softmax)));
+
+    // Matmul softmax(QK^T/sqrt(d_k)) by V
+    alpha = 1.0f, beta = 0.0f;
+    m_ = num_new_tokens;
+    n = m->vProjSize;
+    k = total_tokens;
+    lda = m_, ldb = n, ldc = m_;
+    strideA = num_new_tokens * total_tokens;
+    strideB = vt_block_size;
+    strideC = num_new_tokens * m->vProjSize;
+    // To get A, skip over softmax(QK^T/sqrt(d_k)) entries from previous
+    // requests (all heads)
+    A = (void const *)C_softmax;
+    // To get B, skip over V^T entries from previous requests (all heads +
+    // padding)
+    B = (void const *)(m->valueCache + i * vt_req_block_size);
+    // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
+    // requests
+    C = (void *)(m->attn_heads +
+                 tokens_previous_requests * m->num_heads * m->vProjSize);
+
+    checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                         CUBLAS_OP_N,
+                                         CUBLAS_OP_T,
+                                         m_,
+                                         n,
+                                         k,
+                                         &alpha,
+                                         A,
+                                         cublas_data_type,
+                                         lda,
+                                         strideA,
+                                         B,
+                                         cublas_data_type,
+                                         ldb,
+                                         strideB,
+                                         &beta,
+                                         C,
+                                         cublas_data_type,
+                                         ldc,
+                                         strideC,
+                                         m->num_heads,
+                                         compute_type,
+                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
+    // Project to output, save result directly on output tensor
+    alpha = 1.0f, beta = 0.0f;
+    m_ = m->oProjSize;
+    k = m->vProjSize * m->num_heads;
+    n = num_new_tokens;
+    lda = k, ldb = n, ldc = m_;
+    A = (void const *)m->W_out_contiguous;
+    B = (void const *)C;
+    C = (void *)(output_ptr + tokens_previous_requests * m->oProjSize);
+
+    checkCUDA(cublasGemmEx(m->handle.blas,
+                           CUBLAS_OP_T,
+                           CUBLAS_OP_T,
+                           m_,
+                           n,
+                           k,
+                           &alpha,
+                           A,
+                           cublas_data_type,
+                           lda,
+                           B,
+                           cublas_data_type,
+                           ldb,
+                           &beta,
+                           C,
+                           cublas_data_type,
+                           ldc,
+                           compute_type,
+                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
+    tokens_previous_requests += num_new_tokens;
+    tokens_prev_requests_squares += num_new_tokens * total_tokens;
+  }
+
+  assert(tokens_previous_requests == num_tokens);
 }
 
 /*static*/
 void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     IncMultiHeadSelfAttentionMeta const *m,
+    BatchConfig const *bc,
     float const *input_ptr,
     float const *weight_ptr,
     float *output_ptr) {
@@ -70,8 +495,24 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     cudaEventCreate(&t_end);
     cudaEventRecord(t_start, stream);
   }
-  IncMultiHeadSelfAttention::inference_kernel(
-      m, input_ptr, weight_ptr, output_ptr, stream);
+  cudaDeviceSynchronize();
+  // phase 1: Implement kernel to compute KQV for input tokens
+  inference_kernel1(m, bc, input_ptr, weight_ptr, m->devQKVProjArray, stream);
+  cudaDeviceSynchronize();
+  // phase 2: Update key/val cache
+  cudaMemcpyAsync(m->dev_token2ids,
+                  &(bc->token2ids.token_indexes),
+                  bc->MAX_NUM_TOKENS * sizeof(BatchConfig::token_idxs),
+                  cudaMemcpyHostToDevice,
+                  stream);
+  cudaDeviceSynchronize();
+  inference_kernel2(m, bc, stream);
+  cudaDeviceSynchronize();
+  // phase 3: Compute attention score
+  // 3 kernels for pahse 3: matmul1 - softmax - matmal2
+  inference_kernel3(m, bc, output_ptr, stream);
+  cudaDeviceSynchronize();
+
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
     checkCUDA(cudaEventSynchronize(t_end));
@@ -89,139 +530,67 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
 IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     FFHandler handler,
     IncMultiHeadSelfAttention const *attn,
+    float const *weight_ptr,
     Memory gpu_mem,
     int num_samples,
-    int num_heads)
+    int _num_heads)
     : OpMeta(handler, attn) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
-  checkCUDNN(cudnnSetStream(handler.dnn, stream));
+  // checkCUDNN(cudnnSetStream(handler.dnn, stream));
+
+  qSize = attn->qSize;
+  kSize = attn->kSize;
+  vSize = attn->vSize;
+  // assume dimensions match for now
+  assert(qSize == kSize);
+  assert(kSize == vSize);
+  qProjSize = attn->qProjSize;
+  kProjSize = attn->kProjSize;
+  assert(qProjSize == kProjSize); // required for attention QK^T matmul
+  vProjSize = attn->vProjSize;
+  oProjSize = attn->oProjSize;
+  num_heads = _num_heads;
+  weights_params = (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize +
+                    oProjSize * (vProjSize > 0 ? vProjSize : vSize));
+  weightSize = weights_params * num_heads * sizeof(float);
 
-  checkCUDNN(cudnnCreateAttnDescriptor(&attnDesc));
-  checkCUDNN(cudnnCreateSeqDataDescriptor(&qDesc));
-  checkCUDNN(cudnnCreateSeqDataDescriptor(&kDesc));
-  checkCUDNN(cudnnCreateSeqDataDescriptor(&vDesc));
-  checkCUDNN(cudnnCreateSeqDataDescriptor(&oDesc));
   // Currently do not support adding bias to key/value projection
   assert(!attn->add_bias_kv);
-  cudnnAttnQueryMap_t attnMode = CUDNN_ATTN_QUERYMAP_ALL_TO_ONE;
-  // Assume no beam search for now
-  int maxBeamSize = 1;
-  // printf("batchSize(%d) qSize(%d) kSize(%d) vSize(%d) qProjSize(%d)
-  // kProjSize(%d)\n",
-  //     num_samples, attn->qSize, attn->kSize, attn->vSize, attn->qProjSize,
-  //     attn->kProjSize);
-  // printf("vProjSize(%d) oProjSize(%d) qoSeqLength(%d) kvSeqLength(%d)\n",
-  //     attn->vProjSize, attn->oProjSize, attn->qoSeqLength,
-  //     attn->kvSeqLength);
-  cudnnMathType_t math_type;
-  if (handle.allowTensorOpMathConversion) {
-    math_type = CUDNN_TENSOR_OP_MATH_ALLOW_CONVERSION;
-  } else {
-    math_type = CUDNN_TENSOR_OP_MATH;
-  }
-  checkCUDNN(cudnnSetAttnDescriptor(attnDesc,
-                                    attnMode,
-                                    num_heads,
-                                    1.0f /*smScalar*/,
-                                    CUDNN_DATA_FLOAT,
-                                    CUDNN_DATA_FLOAT,
-                                    math_type,
-                                    NULL /*attnDropoutDesc*/,
-                                    NULL /*postDropoutDesc*/,
-                                    attn->qSize,
-                                    attn->kSize,
-                                    attn->vSize,
-                                    attn->qProjSize,
-                                    attn->kProjSize,
-                                    attn->vProjSize,
-                                    attn->oProjSize,
-                                    attn->qoSeqLength,
-                                    attn->kvSeqLength,
-                                    num_samples,
-                                    maxBeamSize));
-  size_t workSpaceSize;
-  checkCUDNN(cudnnGetMultiHeadAttnBuffers(
-      handler.dnn, attnDesc, &weightSize, &workSpaceSize, &reserveSpaceSize));
-  assert(workSpaceSize <= handler.workSpaceSize);
-  // printf("weightSize(%zu) workSpaceSize(%zu) reserveSpaceSize(%zu)\n",
-  // weightSize, workSpaceSize, reserveSpaceSize);
-  int dimA[CUDNN_SEQDATA_DIM_COUNT];
-  cudnnSeqDataAxis_t axes[CUDNN_SEQDATA_DIM_COUNT];
-  assert(CUDNN_SEQDATA_DIM_COUNT == 4);
-  axes[3] = CUDNN_SEQDATA_VECT_DIM; // 3 = nbDims-1
-  axes[2] = CUDNN_SEQDATA_BEAM_DIM;
-  axes[1] = CUDNN_SEQDATA_TIME_DIM;
-  axes[0] = CUDNN_SEQDATA_BATCH_DIM;
-  int *qoSeqArray = (int *)malloc(sizeof(int) * num_samples);
-  int *kvSeqArray = (int *)malloc(sizeof(int) * num_samples);
-  for (int i = 0; i < num_samples; i++) {
-    qoSeqArray[i] = attn->qoSeqLength;
-    kvSeqArray[i] = attn->kvSeqLength;
-  }
-  // Set qDesc
-  {
-    dimA[CUDNN_SEQDATA_BEAM_DIM] = 1;
-    dimA[CUDNN_SEQDATA_BATCH_DIM] = num_samples;
-    dimA[CUDNN_SEQDATA_TIME_DIM] = attn->qoSeqLength;
-    dimA[CUDNN_SEQDATA_VECT_DIM] = attn->qSize;
-    checkCUDNN(cudnnSetSeqDataDescriptor(qDesc,
-                                         CUDNN_DATA_FLOAT,
-                                         CUDNN_SEQDATA_DIM_COUNT,
-                                         dimA,
-                                         axes,
-                                         num_samples,
-                                         qoSeqArray,
-                                         NULL));
-  }
-  // Set kDesc
-  {
-    dimA[CUDNN_SEQDATA_BEAM_DIM] = 1;
-    dimA[CUDNN_SEQDATA_BATCH_DIM] = num_samples;
-    dimA[CUDNN_SEQDATA_TIME_DIM] = attn->kvSeqLength;
-    dimA[CUDNN_SEQDATA_VECT_DIM] = attn->kSize;
-    checkCUDNN(cudnnSetSeqDataDescriptor(kDesc,
-                                         CUDNN_DATA_FLOAT,
-                                         CUDNN_SEQDATA_DIM_COUNT,
-                                         dimA,
-                                         axes,
-                                         num_samples,
-                                         kvSeqArray,
-                                         NULL));
-  }
-  // Set vDesc
-  {
-    dimA[CUDNN_SEQDATA_BEAM_DIM] = 1;
-    dimA[CUDNN_SEQDATA_BATCH_DIM] = num_samples;
-    dimA[CUDNN_SEQDATA_TIME_DIM] = attn->kvSeqLength;
-    dimA[CUDNN_SEQDATA_VECT_DIM] = attn->vSize;
-    checkCUDNN(cudnnSetSeqDataDescriptor(vDesc,
-                                         CUDNN_DATA_FLOAT,
-                                         CUDNN_SEQDATA_DIM_COUNT,
-                                         dimA,
-                                         axes,
-                                         num_samples,
-                                         kvSeqArray,
-                                         NULL));
-  }
-  // Set oDesc
-  {
-    dimA[CUDNN_SEQDATA_BEAM_DIM] = 1;
-    dimA[CUDNN_SEQDATA_BATCH_DIM] = num_samples;
-    dimA[CUDNN_SEQDATA_TIME_DIM] = attn->qoSeqLength;
-    dimA[CUDNN_SEQDATA_VECT_DIM] = attn->oProjSize;
-    checkCUDNN(cudnnSetSeqDataDescriptor(oDesc,
-                                         CUDNN_DATA_FLOAT,
-                                         CUDNN_SEQDATA_DIM_COUNT,
-                                         dimA,
-                                         axes,
-                                         num_samples,
-                                         qoSeqArray,
-                                         NULL));
-  }
+
+#ifdef INFERENCE_TESTS
+  kcache = (float *)calloc(kProjSize * MAX_SEQ_LEN * num_heads *
+                               BatchConfig::MAX_NUM_REQUESTS,
+                           sizeof(float));
+  vcache = (float *)calloc(vProjSize * MAX_SEQ_LEN * num_heads *
+                               BatchConfig::MAX_NUM_REQUESTS,
+                           sizeof(float));
+#endif
+
   // allocate memory for the seqArray and reserve space
   {
-    size_t totalSize = reserveSpaceSize + sizeof(int) * num_samples * 2;
+    size_t qkv_proj_dim = qProjSize + kProjSize + vProjSize;
+    size_t qkv_max_proj_size =
+        BatchConfig::MAX_NUM_TOKENS * qkv_proj_dim * num_heads;
+    size_t key_cache_size =
+        num_heads * kProjSize * BatchConfig::MAX_NUM_REQUESTS * MAX_SEQ_LEN;
+    size_t value_cache_size =
+        num_heads * vProjSize * BatchConfig::MAX_NUM_REQUESTS * MAX_SEQ_LEN;
+    size_t token2ids_size = BatchConfig::MAX_NUM_TOKENS;
+    size_t qk_prod_size =
+        BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_NUM_TOKENS * num_heads;
+    size_t attn_heads_size =
+        BatchConfig::MAX_NUM_TOKENS * num_heads * vProjSize;
+    size_t W_out_block_size = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
+    size_t W_out_contiguous_size = W_out_block_size * num_heads;
+    size_t totalSize =
+        (qkv_max_proj_size + key_cache_size + value_cache_size +
+         2 * qk_prod_size + attn_heads_size + W_out_contiguous_size) *
+            sizeof(float) +
+        token2ids_size *
+            sizeof(BatchConfig::token_idxs); // more components will
+                                             // be added here later
+
     Realm::Rect<1, coord_t> bounds(Realm::Point<1, coord_t>(0),
                                    Realm::Point<1, coord_t>(totalSize - 1));
     std::vector<size_t> field_sizes;
@@ -233,38 +602,35 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
                                            0,
                                            Realm::ProfilingRequestSet())
         .wait();
-    devQoSeqArray = (int *)reserveInst.pointer_untyped(0, sizeof(char));
-    checkCUDA(cudaMemcpy(devQoSeqArray,
-                         qoSeqArray,
-                         sizeof(int) * num_samples,
-                         cudaMemcpyHostToDevice));
-    devKvSeqArray = (int *)devQoSeqArray + num_samples;
-    checkCUDA(cudaMemcpy(devKvSeqArray,
-                         kvSeqArray,
-                         sizeof(int) * num_samples,
-                         cudaMemcpyHostToDevice));
-    reserveSpace = (int *)devKvSeqArray + num_samples;
-  }
-  // allocate memory for loWinIdx/hiWinIdx
-  loWinIdx = (int *)malloc(sizeof(int) * attn->qoSeqLength);
-  hiWinIdx = (int *)malloc(sizeof(int) * attn->qoSeqLength);
-  for (int i = 0; i < attn->qoSeqLength; i++) {
-    loWinIdx[i] = 0;
-    hiWinIdx[i] = attn->kvSeqLength;
+    devQKVProjArray = (float *)reserveInst.pointer_untyped(0, sizeof(char));
+    keyCache = (float *)devQKVProjArray + qkv_max_proj_size;
+    valueCache = (float *)keyCache + key_cache_size;
+    dev_token2ids = (BatchConfig::token_idxs *)(valueCache + value_cache_size);
+    qk_prods = (float *)(dev_token2ids + token2ids_size);
+    qk_prods_softmax = (float *)(qk_prods + qk_prod_size);
+    attn_heads = (float *)qk_prods_softmax + qk_prod_size;
+    W_out_contiguous = (float *)attn_heads + attn_heads_size;
+    int parallelism = vProjSize * oProjSize * num_heads;
+    build_w_out_tensor<<<GET_BLOCKS(parallelism),
+                         min(CUDA_NUM_THREADS, parallelism),
+                         0,
+                         stream>>>(
+        weight_ptr,
+        W_out_contiguous,
+        vProjSize,
+        oProjSize,
+        num_heads,
+        (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize));
   }
-  free(qoSeqArray);
-  free(kvSeqArray);
+  cudaStreamSynchronize(stream);
 }
 
 IncMultiHeadSelfAttentionMeta::~IncMultiHeadSelfAttentionMeta(void) {
   reserveInst.destroy();
-  free(loWinIdx);
-  free(hiWinIdx);
-  checkCUDNN(cudnnDestroyAttnDescriptor(attnDesc));
-  checkCUDNN(cudnnDestroySeqDataDescriptor(qDesc));
-  checkCUDNN(cudnnDestroySeqDataDescriptor(kDesc));
-  checkCUDNN(cudnnDestroySeqDataDescriptor(vDesc));
-  checkCUDNN(cudnnDestroySeqDataDescriptor(oDesc));
+#ifdef INFERENCE_TESTS
+  free(kcache);
+  free(vcache);
+#endif
 }
 
 }; // namespace FlexFlow
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index d58204b7c3..c1c9ca8f40 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -16,47 +16,47 @@
 #include "flexflow/batch_config.h"
 #include "legion.h"
 #include <cassert>
+#include <climits>
 
 namespace FlexFlow {
 
 LegionRuntime::Logger::Category log_bc("BatchConfig");
 
-BatchConfig::BatchConfig(bool _incremental_mode)
-    : incremental_mode(_incremental_mode) {
+BatchConfig::BatchConfig() {
   cached_results = false;
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
     token_start_idx[i] = 0;
     token_last_available_idx[i] = -1;
     request_completed[i] = true;
     num_processing_tokens[i] = 0;
+    max_sequence_length[i] = 0;
+  }
+  token2ids.num_samples = 0;
+  for (int i = 0; i < MAX_NUM_TOKENS; i++) {
+    token2ids.guids[i] = SIZE_MAX;
+    token2ids.token_indexes[i].request_index = SIZE_MAX;
+    token2ids.token_indexes[i].token_position = SIZE_MAX;
   }
   update_num_active_requests_tokens();
 }
 
 int BatchConfig::update_results(InferenceResult const &ir) {
   cached_results = false;
-  int t = 0;
+  // int tokens_processed = 0;
   int completed = 0;
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
     if (request_completed[i]) {
       continue;
     }
-    if (num_processing_tokens[i] == 0) {
-      continue;
-    }
-    t += num_processing_tokens[i];
+    assert(num_processing_tokens[i] > 0);
+    // if (num_processing_tokens[i] == 0) {
+    //   continue;
+    // }
+    // tokens_processed += num_processing_tokens[i];
     token_start_idx[i] += num_processing_tokens[i];
-    if (ir.results[t] == 0) { // TODO: replace this with <EOS>
-      log_bc.print("[Done] guid(%zu) final_length(%d)",
-                   request_guid[i],
-                   token_start_idx[i]);
-      request_completed[i] = true;
-      token_start_idx[i] = 0;
-      token_last_available_idx[i] = -1;
-      num_processing_tokens[i] = 0;
-      completed++;
-    } else if (token_start_idx[i] >= MAX_SEQUENCE_LENGTH) {
-      // Reach maximum request length
+    if (token_start_idx[i] >= max_sequence_length[i]
+        // || ir.results[t] == 0 TODO: replace this with <EOS>
+    ) {
       log_bc.print("[Done] guid(%zu) final_length(%d)",
                    request_guid[i],
                    token_start_idx[i]);
@@ -68,22 +68,28 @@ int BatchConfig::update_results(InferenceResult const &ir) {
     } else {
       if (token_start_idx[i] == token_last_available_idx[i] + 1) {
         token_last_available_idx[i]++;
+        num_processing_tokens[i] = 1; // incremental phase
+      } else {
+        assert(false);
       }
       assert(token_start_idx[i] <= token_last_available_idx[i]);
     }
-    num_processing_tokens[i] = 0;
   }
   update_num_active_requests_tokens();
   return completed;
 }
 
-bool BatchConfig::register_new_request(size_t guid, int length) {
+bool BatchConfig::register_new_request(size_t guid,
+                                       int initial_length,
+                                       int tokens_to_generate) {
   cached_results = false;
+  assert(initial_length > 0 && tokens_to_generate > 0);
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
     if (request_completed[i]) {
-      log_bc.print("[NewRequest] guid(%zu) length(%d)", guid, length);
+      log_bc.print("[NewRequest] guid(%zu) length(%d)", guid, initial_length);
       token_start_idx[i] = 0;
-      token_last_available_idx[i] = length - 1;
+      token_last_available_idx[i] = initial_length - 1;
+      max_sequence_length[i] = initial_length + tokens_to_generate;
       request_guid[i] = guid;
       num_processing_tokens[i] = 0;
       request_completed[i] = false;
@@ -115,17 +121,23 @@ void BatchConfig::prepare_next_batch() {
   log_bc.print("[NextBatch] num_tokens(%d)", count);
 }
 
-bool BatchConfig::update_num_active_requests_tokens() {
+void BatchConfig::update_num_active_requests_tokens() {
   num_requests = 0;
   num_tokens = 0;
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
     if (!request_completed[i]) {
       num_requests++;
-      num_tokens += num_processing_tokens[i];
+      for (int j = 0; j < num_processing_tokens[i]; j++) {
+        token2ids.guids[num_tokens] = request_guid[i];
+        token2ids.token_indexes[num_tokens].token_position =
+            token_start_idx[i] + j;
+        token2ids.token_indexes[num_tokens].request_index = i;
+        num_tokens++;
+      }
     }
   }
+  token2ids.num_samples = num_tokens;
   cached_results = true;
-  return true;
 }
 
 int BatchConfig::num_active_requests() const {
@@ -148,4 +160,70 @@ int BatchConfig::num_active_tokens() const {
   }
 }
 
+void BatchConfig::print() const {
+  printf("--------------------------BatchConfig--------------------------\n");
+  printf("num_tokens: %i, num_requests: %i, cached_results: %i\n",
+         num_tokens,
+         num_requests,
+         cached_results);
+
+  printf("requests_completed: ");
+  for (int i = 0; i < num_requests; i++) {
+    printf("%i ", request_completed[i]);
+  }
+  printf("\n");
+
+  printf("token_start_idx: ");
+  for (int i = 0; i < num_requests; i++) {
+    printf("%i ", token_start_idx[i]);
+  }
+  printf("\n");
+
+  printf("token_last_available_idx: ");
+  for (int i = 0; i < num_requests; i++) {
+    printf("%i ", token_last_available_idx[i]);
+  }
+  printf("\n");
+
+  printf("num_processing_tokens: ");
+  for (int i = 0; i < num_requests; i++) {
+    printf("%i ", num_processing_tokens[i]);
+  }
+  printf("\n");
+
+  printf("max_sequence_length: ");
+  for (int i = 0; i < num_requests; i++) {
+    printf("%lu ", max_sequence_length[i]);
+  }
+  printf("\n");
+
+  printf("request_guid: ");
+  for (int i = 0; i < num_requests; i++) {
+    printf("%lu ", request_guid[i]);
+  }
+  printf("\n");
+
+  printf("token2ids.num_samples:%lu\n", token2ids.num_samples);
+
+  printf("token2ids.guids: ");
+  for (int i = 0; i < num_tokens; i++) {
+    printf("%lu ", token2ids.guids[i]);
+  }
+  printf("\n");
+
+  printf("token2ids.token_indexes[i].request_index: ");
+  for (int i = 0; i < num_tokens; i++) {
+    printf("%lu ", token2ids.token_indexes[i].request_index);
+  }
+  printf("\n");
+
+  printf("token2ids.token_indexes[i].token_position: ");
+  for (int i = 0; i < num_tokens; i++) {
+    printf("%lu ", token2ids.token_indexes[i].token_position);
+  }
+  printf("\n");
+  printf("---------------------------------------------------------------------"
+         "---------\n");
+}
+
 }; // namespace FlexFlow
diff --git a/src/runtime/cuda_helper.cu b/src/runtime/cuda_helper.cu
index 1da2e492ed..47b0ff74b4 100644
--- a/src/runtime/cuda_helper.cu
+++ b/src/runtime/cuda_helper.cu
@@ -224,6 +224,20 @@ __host__ void
   checkCUDA(cudaFreeHost(host_ptr));
 }
 
+template <typename T>
+__host__ T *download_tensor(T const *ptr, size_t num_elements) {
+  // device synchronize to make sure the data are ready
+  // checkCUDA(cudaDeviceSynchronize());
+  T *host_ptr;
+  checkCUDA(cudaHostAlloc(&host_ptr,
+                          sizeof(T) * num_elements,
+                          cudaHostAllocPortable | cudaHostAllocMapped));
+  checkCUDA(cudaMemcpy(
+      host_ptr, ptr, sizeof(T) * num_elements, cudaMemcpyDeviceToHost));
+  // checkCUDA(cudaDeviceSynchronize());
+  return host_ptr;
+}
+
 cudnnStatus_t cudnnSetTensorDescriptorFromDomain(cudnnTensorDescriptor_t tensor,
                                                  Domain domain) {
   int dims[MAX_TENSOR_DIM];
@@ -398,3 +412,12 @@ template __host__ void
     print_tensor<int32_t>(int32_t const *ptr, size_t rect, char const *prefix);
 template __host__ void
     print_tensor<int64_t>(int64_t const *ptr, size_t rect, char const *prefix);
+
+template __host__ float *download_tensor<float>(float const *ptr,
+                                                size_t num_elements);
+template __host__ double *download_tensor<double>(double const *ptr,
+                                                  size_t num_elements);
+template __host__ int32_t *download_tensor<int32_t>(int32_t const *ptr,
+                                                    size_t num_elements);
+template __host__ int64_t *download_tensor<int64_t>(int64_t const *ptr,
+                                                    size_t num_elements);
\ No newline at end of file
diff --git a/tests/cpp_gpu_tests.sh b/tests/cpp_gpu_tests.sh
index 3645544b44..ea4dc6b5b9 100755
--- a/tests/cpp_gpu_tests.sh
+++ b/tests/cpp_gpu_tests.sh
@@ -47,6 +47,7 @@ if [[ -f "$FF_HOME/build/examples/cpp/AlexNet/alexnet" ]]; then
 	# "$FF_HOME"/build/examples/cpp/split_test_2/split_test_2 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
 	# Inference examples
 	"$FF_HOME"/build/examples/cpp/inference/mixture_of_experts/inference_moe -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
+	"$FF_HOME"/build/examples/cpp/inference/transformers/inference_transformers -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
 else
 	python_packages=$(python -c "from distutils import sysconfig; print(sysconfig.get_python_lib(plat_specific=False,standard_lib=False))")
 	OLD_PATH="$PATH"
@@ -77,6 +78,7 @@ else
 			# split_test_2 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
 			# Inference examples
 			inference_moe -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
+			inference_transformers -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
 		fi
 	done
 	export PATH="$OLD_PATH"

From 96cf5f371795830b00001b1f84ec877e26d3445e Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 26 Mar 2023 13:34:13 -0400
Subject: [PATCH 079/344] hip_rocm fix

---
 CMakeLists.txt | 8 ++++++++
 1 file changed, 8 insertions(+)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index 392377bf68..ab8bb471b8 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -93,11 +93,19 @@ set(NVCC_FLAGS $ENV{NVCC_FLAGS})
 set(LD_FLAGS $ENV{LD_FLAGS})
 
 # Set global FLAGS
+if(INFERENCE_TESTS)
 list(APPEND CC_FLAGS
   -std=c++14)
 
 list(APPEND NVCC_FLAGS
   -std=c++14)
+else()
+  list(APPEND CC_FLAGS
+  -std=c++11)
+
+list(APPEND NVCC_FLAGS
+  -std=c++11)
+endif()
 
 add_compile_options(${CC_FLAGS})
 set(CUDA_NVCC_FLAGS ${CUDA_NVCC_FLAGS} ${NVCC_FLAGS})

From 193a7ae511f9f85175a28b7b024547e8e0bc6a70 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 26 Mar 2023 13:39:01 -0400
Subject: [PATCH 080/344] hip rocm fix 2

---
 src/ops/experts.cc | 11 ++++++++---
 1 file changed, 8 insertions(+), 3 deletions(-)

diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index 6d6c55d07b..2186f18370 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -14,7 +14,9 @@
  */
 
 #include "flexflow/ops/experts.h"
+#ifdef INFERENCE_TESTS
 #include "flexflow/utils/cuda_helper.h"
+#endif
 #include "legion/legion_utilities.h"
 
 namespace FlexFlow {
@@ -38,7 +40,9 @@ using PCG::Node;
 
 static constexpr int KERNEL_IDX = 0;
 static constexpr int BIAS_IDX = 1;
+#ifdef INFERENCE_TESTS
 static bool DEBUG_MODE = false;
+#endif
 
 // For now, we use one input and one output per expert
 Tensor FFModel::experts(Tensor const *inputs,
@@ -845,7 +849,7 @@ void Experts::inference_task(Task const *task,
       assert(bias_domain.hi()[0] - bias_domain.lo()[0] + 1 == out_dim);
     }
   }
-
+#ifdef INFERENCE_TESTS
   if (DEBUG_MODE) {
     std::cout << "forward_kernel_wrapper" << std::endl
               << "-------------------------------" << std::endl;
@@ -979,7 +983,7 @@ void Experts::inference_task(Task const *task,
       free(bias_experts_1);
     }
   }
-
+#endif
   Experts::forward_kernel_wrapper(m,
                                   input_ptr,
                                   indices_ptr,
@@ -990,7 +994,7 @@ void Experts::inference_task(Task const *task,
                                   chosen_experts,
                                   batch_size,
                                   out_dim);
-
+#ifdef INFERENCE_TESTS
   if (DEBUG_MODE) {
     /* ----------------Output after computation--------------*/
     float *cpu_output_ptr = new float[batch_size * out_dim];
@@ -1034,6 +1038,7 @@ void Experts::inference_task(Task const *task,
 
     free(cpu_output_ptr);
   }
+#endif
 }
 
 void Experts::forward_task(Task const *task,

From d4a41586f059fb29551bac5e4805ad47d0969eb9 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 28 Mar 2023 01:05:45 -0400
Subject: [PATCH 081/344] [Inference] Fused experts kernel bug fix (#663)

* fix bug in thrust kernel

* fix

* commenting everything back in

* cleanup

* increase num_inflight_batches

* restore transformers file
---
 examples/cpp/inference/inference_config.h | 18 ++---
 include/flexflow/batch_config.h           |  2 +-
 src/ops/experts.cu                        | 85 ++++++++++++++---------
 3 files changed, 63 insertions(+), 42 deletions(-)

diff --git a/examples/cpp/inference/inference_config.h b/examples/cpp/inference/inference_config.h
index c96d5b9b54..7214cf42a2 100644
--- a/examples/cpp/inference/inference_config.h
+++ b/examples/cpp/inference/inference_config.h
@@ -18,10 +18,10 @@
 
 // #define MAX_SEQ_LEN 1024
 #define MAX_SEQ_LEN 20
-#define BATCH_SIZE 2
-// #define MNIST_DIMS 28 * 28
-// #define DATA_DIM MNIST_DIMS
-#define DATA_DIM 3
+#define BATCH_SIZE 32
+#define MNIST_DIMS 28 * 28
+#define DATA_DIM MNIST_DIMS
+// #define DATA_DIM 3
 
 struct InferenceConfig {
   InferenceConfig(void) {
@@ -29,9 +29,9 @@ struct InferenceConfig {
     token_dim = DATA_DIM;
     sequence_length = MAX_SEQ_LEN;
     batch_size = BATCH_SIZE;
-    out_dim = 3;
+    out_dim = DATA_DIM;
     num_labels = out_dim;
-    num_layers = 1;
+    num_layers = 3;
     //----------------------- Inference parameters ---------------------
     // total number of requests processed as part of the simulation
     total_requests = 2560;
@@ -41,11 +41,11 @@ struct InferenceConfig {
     num_inflight_batches = 4;
     incremental_mode = true;
     //----------------------- Rest of model parameters ------------------
-    hidden_size = 12;
+    hidden_size = DATA_DIM;
     // Encoder layer
-    num_attention_heads = 3;
+    num_attention_heads = 16;
     attention_kdim = attention_vdim = hidden_size / num_attention_heads;
-    num_encoder_layers = 1;
+    num_encoder_layers = 3;
   }
 
   // Input/output data
diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 4d4aec7054..ac12b11dd0 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -20,7 +20,7 @@
 // #define MAX_SEQ_LEN 1024
 // #define BATCH_SIZE 2
 #define MAX_SEQ_LEN 20
-#define BATCH_SIZE 2
+#define BATCH_SIZE 32
 #define MAX_REQUESTS 256
 
 namespace FlexFlow {
diff --git a/src/ops/experts.cu b/src/ops/experts.cu
index 67b9d875c7..e51545ffdb 100644
--- a/src/ops/experts.cu
+++ b/src/ops/experts.cu
@@ -80,7 +80,8 @@ void experts_forward_thrust_wrapper(ExpertsMeta const *m,
                              sorted_indices + num_indices,
                              original_indices);
 
-  // get lower and upper bound of indices corresponding to experts in the block
+  // get lower and upper bound of token->expert assignments corresponding to
+  // experts in the block
   thrust::device_ptr<int> lb = thrust::lower_bound(thrust::cuda::par.on(stream),
                                                    sorted_indices,
                                                    sorted_indices + num_indices,
@@ -90,28 +91,34 @@ void experts_forward_thrust_wrapper(ExpertsMeta const *m,
                           sorted_indices,
                           sorted_indices + num_indices,
                           experts_start_idx + num_experts_per_block - 1);
-
+  // lowest index in the sorted indices array corresponding to an expert within
+  // the block
   *lb_index = lb - sorted_indices;
+  // 1 + largest index in the sorted indices array corresponding to an expert
+  // within the block
   *ub_index = ub - sorted_indices;
   *num_valid_assignments = (*ub_index) - (*lb_index);
   if ((*num_valid_assignments) == 0) {
     return;
   }
 
-  // create "exp_local_label_to_index", a mapping from local expert label to its
-  // non-zero expert index
   thrust::device_ptr<int> non_zero_expert_labels =
       thrust::device_pointer_cast(m->non_zero_expert_labels);
+  // non_zero_expert_labels: a list of global labels of the experts in this
+  // block receiving nonzero tokens
   thrust::device_ptr<int> non_zero_expert_labels_end = thrust::unique_copy(
       thrust::cuda::par.on(stream), lb, ub, non_zero_expert_labels);
+  // number of experts in this block receiving at least one token
   *non_zero_experts_count = non_zero_expert_labels_end - non_zero_expert_labels;
 
   using namespace thrust::placeholders;
+  // convert global labels to local labelling (e.g. expert 65->index 65-64=1 in
+  // block containing experts 64-96) by substracting the experts_start_idx,
+  // inplace.
   thrust::for_each(thrust::cuda::par.on(stream),
                    non_zero_expert_labels,
                    non_zero_expert_labels + (*non_zero_experts_count),
-                   _1 -=
-                   experts_start_idx); // convert global indexes to local ones
+                   _1 -= experts_start_idx);
 
   thrust::device_ptr<int> temp_sequence =
       thrust::device_pointer_cast(m->temp_sequence);
@@ -119,6 +126,9 @@ void experts_forward_thrust_wrapper(ExpertsMeta const *m,
                    temp_sequence,
                    temp_sequence + (*non_zero_experts_count));
 
+  // create "exp_local_label_to_index", a mapping from local expert label to its
+  // non-zero expert index (i.e. expert with index i is the i-th expert in the
+  // block to receive at least 1 token)
   thrust::device_ptr<int> exp_local_label_to_index =
       thrust::device_pointer_cast(m->exp_local_label_to_index);
   thrust::scatter(thrust::cuda::par.on(stream),
@@ -145,7 +155,7 @@ void experts_forward_thrust_wrapper(ExpertsMeta const *m,
   assert((*start_indexes) == (*non_zero_experts_count));
 
   // append ub_index
-  expert_start_indexes[(*start_indexes)] = (*ub_index);
+  expert_start_indexes[(*start_indexes)] = (*ub_index) - (*lb_index);
 
   // get number of token assignment to each expert
   thrust::device_ptr<int> num_assignments_per_expert =
@@ -435,6 +445,17 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
 
   cudaStreamSynchronize(stream);
 
+  assert(ub_index - lb_index == num_valid_assignments);
+  assert(num_valid_assignments >= non_zero_experts_count);
+  assert(non_zero_experts_count <= num_experts_per_block);
+  if (non_zero_experts_count == 0) {
+    assert(num_valid_assignments == 0 && gemm_batch_count == 0);
+  } else {
+    assert(num_valid_assignments > 0 && gemm_batch_count > 0);
+  }
+  assert(num_valid_assignments <= num_indices);
+  assert(gemm_batch_count <= num_valid_assignments);
+
   if (num_valid_assignments == 0) {
     return;
   }
@@ -469,34 +490,34 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
 
   cudaStreamSynchronize(stream);
 
-  // experts_forward_GemmBatched_kernel(m,
-  //                                    (void const **)m->weight_idx_array,
-  //                                    (void const **)m->token_idx_array,
-  //                                    (void **)m->dev_batch_outputs,
-  //                                    (void const **)m->bias_idx_array,
-  //                                    activation,
-  //                                    data_dim,
-  //                                    out_dim,
-  //                                    num_tokens,
-  //                                    num_chosen_experts,
-  //                                    gemm_batch_count,
-  //                                    stream);
+  experts_forward_GemmBatched_kernel(m,
+                                     (void const **)m->weight_idx_array,
+                                     (void const **)m->token_idx_array,
+                                     (void **)m->dev_batch_outputs,
+                                     (void const **)m->bias_idx_array,
+                                     activation,
+                                     data_dim,
+                                     out_dim,
+                                     num_tokens,
+                                     num_chosen_experts,
+                                     gemm_batch_count,
+                                     stream);
 
   cudaStreamSynchronize(stream);
 
-  // int aggregation_parallelism =
-  //     std::max(num_tokens, gemm_batch_count) * out_dim;
-  // experts_forward_aggregate_kernel<<<GET_BLOCKS(aggregation_parallelism),
-  //                                    min(CUDA_NUM_THREADS,
-  //                                        (int)aggregation_parallelism),
-  //                                    0,
-  //                                    stream>>>(num_tokens,
-  //                                              gemm_batch_count,
-  //                                              out_dim,
-  //                                              output,
-  //                                              m->dev_batch_outputs,
-  //                                              m->coefficient_idx_array,
-  //                                              m->output_idx_array);
+  int aggregation_parallelism =
+      std::max(num_tokens, gemm_batch_count) * out_dim;
+  experts_forward_aggregate_kernel<<<GET_BLOCKS(aggregation_parallelism),
+                                     min(CUDA_NUM_THREADS,
+                                         (int)aggregation_parallelism),
+                                     0,
+                                     stream>>>(num_tokens,
+                                               gemm_batch_count,
+                                               out_dim,
+                                               output,
+                                               m->dev_batch_outputs,
+                                               m->coefficient_idx_array,
+                                               m->output_idx_array);
 
   if (m->profiling) {
     cudaEventRecord(t_end, stream);

From ad4a60ff5c3f35fec35a0797bf1f4fd6d7721d7b Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 28 Mar 2023 14:14:12 -0400
Subject: [PATCH 082/344] fix

---
 examples/cpp/inference/transformers/transformers.cc | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/examples/cpp/inference/transformers/transformers.cc b/examples/cpp/inference/transformers/transformers.cc
index da8b872387..217e5583fb 100644
--- a/examples/cpp/inference/transformers/transformers.cc
+++ b/examples/cpp/inference/transformers/transformers.cc
@@ -98,7 +98,7 @@ void FlexFlow::top_level_task(Task const *task,
   //----------------------- Define the model ------------------------------
   Tensor t = input;
   for (int i = 0; i < transformerConfig.num_layers; i++) {
-    t = create_inc_multihead_attention_decoder(&ff, &transformerConfig, input);
+    t = create_inc_multihead_attention_decoder(&ff, &transformerConfig, t);
   }
   t = ff.dense(t, transformerConfig.out_dim, AC_MODE_RELU);
   t = ff.softmax(t);

From bf34ba9abc4d5c5e74faac28fa66aaf48175e7fb Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 28 Mar 2023 20:20:24 +0000
Subject: [PATCH 083/344] fixed legion warning

---
 examples/cpp/inference/mixture_of_experts/moe.cc    | 3 ++-
 examples/cpp/inference/transformers/transformers.cc | 3 ++-
 2 files changed, 4 insertions(+), 2 deletions(-)

diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index c923013a88..f6d483cffa 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -216,11 +216,12 @@ void FlexFlow::top_level_task(Task const *task,
         assert(bc->register_new_request(guid, seq_lens.first, seq_lens.second));
       }
       bc->prepare_next_batch();
-      data_loader.next_batch(ff, bid, bc);
 
       runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
+      data_loader.next_batch(ff, bid, bc);
       FutureMap fm = im.inference(bid, *bc);
       runtime->end_trace(ctx, 111 + bid % num_devices /*trace_id*/);
+
       assert(fm.get_future_map_domain().get_volume() == 1);
       future_handlers[bid] = fm.get_future(0);
       batch_configs[bid] = bc;
diff --git a/examples/cpp/inference/transformers/transformers.cc b/examples/cpp/inference/transformers/transformers.cc
index 217e5583fb..797a2c1958 100644
--- a/examples/cpp/inference/transformers/transformers.cc
+++ b/examples/cpp/inference/transformers/transformers.cc
@@ -197,11 +197,12 @@ void FlexFlow::top_level_task(Task const *task,
         assert(bc->register_new_request(guid, seq_lens.first, seq_lens.second));
       }
       bc->prepare_next_batch();
-      data_loader.next_batch(ff, bid, bc);
 
       runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
+      data_loader.next_batch(ff, bid, bc);
       FutureMap fm = im.inference(bid, *bc);
       runtime->end_trace(ctx, 111 + bid % num_devices /*trace_id*/);
+
       assert(fm.get_future_map_domain().get_volume() == 1);
       future_handlers[bid] = fm.get_future(0);
       batch_configs[bid] = bc;

From 75a5b9036fa73dbcec5f379a25935417276154c6 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 29 Mar 2023 04:10:33 +0000
Subject: [PATCH 084/344] various updates

---
 examples/cpp/inference/dataloader.cc                |  6 ++++--
 examples/cpp/inference/dataloader.h                 |  2 +-
 examples/cpp/inference/mixture_of_experts/moe.cc    |  7 ++++---
 examples/cpp/inference/transformers/transformers.cc |  7 ++++---
 include/flexflow/inference.h                        |  1 +
 src/ops/inc_multihead_self_attention.cu             |  9 ++++-----
 src/runtime/inference_manager.cc                    | 11 +++++++++--
 7 files changed, 27 insertions(+), 16 deletions(-)

diff --git a/examples/cpp/inference/dataloader.cc b/examples/cpp/inference/dataloader.cc
index fba9e24129..80ce078508 100644
--- a/examples/cpp/inference/dataloader.cc
+++ b/examples/cpp/inference/dataloader.cc
@@ -110,7 +110,7 @@ void DataLoader::load_entire_dataset(Task const *task,
   }
 }
 
-void DataLoader::next_batch(FFModel &ff, int bid, BatchConfig *bc) {
+void DataLoader::next_batch(FFModel &ff, int bid, BatchConfig *bc, MachineView const *mv) {
   size_t num_active_tokens = bc->num_active_tokens();
   if (num_active_tokens == 0) {
     return;
@@ -142,6 +142,8 @@ void DataLoader::next_batch(FFModel &ff, int bid, BatchConfig *bc) {
       argmap.set_point(
           *it, TaskArgument(&bc->token2ids, sizeof(BatchConfig::SampleIdxs)));
     }
+    MachineView const *view = mv ? mv : &batch_input[bid]->machine_view;
+    size_t machine_view_hash = view->hash();
     IndexLauncher launcher(CUSTOM_GPU_TASK_ID_1,
                            batch_input[bid]->parallel_is,
                            TaskArgument(NULL, 0),
@@ -149,7 +151,7 @@ void DataLoader::next_batch(FFModel &ff, int bid, BatchConfig *bc) {
                            Predicate::TRUE_PRED,
                            false /*must*/,
                            0 /*mapper_id*/,
-                           batch_input[bid]->machine_view.hash());
+                           machine_view_hash);
     launcher.add_region_requirement(RegionRequirement(full_input->region,
                                                       0 /*projection id*/,
                                                       READ_ONLY,
diff --git a/examples/cpp/inference/dataloader.h b/examples/cpp/inference/dataloader.h
index b95108aa35..f3e9a989de 100644
--- a/examples/cpp/inference/dataloader.h
+++ b/examples/cpp/inference/dataloader.h
@@ -43,7 +43,7 @@ class DataLoader {
                                   std::vector<PhysicalRegion> const &regions,
                                   Context ctx,
                                   Runtime *runtime);
-  void next_batch(FFModel &, int, BatchConfig *);
+  void next_batch(FFModel &ff, int bid, BatchConfig *bc, MachineView const *mv = nullptr);
 
 public:
   size_t num_samples;
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index f6d483cffa..d96ab74295 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -216,11 +216,12 @@ void FlexFlow::top_level_task(Task const *task,
         assert(bc->register_new_request(guid, seq_lens.first, seq_lens.second));
       }
       bc->prepare_next_batch();
+      MachineView *view = im.get_machine_view(bid % im.num_devices);
 
-      runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
-      data_loader.next_batch(ff, bid, bc);
+      //runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
+      data_loader.next_batch(ff, bid, bc, view);
       FutureMap fm = im.inference(bid, *bc);
-      runtime->end_trace(ctx, 111 + bid % num_devices /*trace_id*/);
+      //runtime->end_trace(ctx, 111 + bid % num_devices /*trace_id*/);
 
       assert(fm.get_future_map_domain().get_volume() == 1);
       future_handlers[bid] = fm.get_future(0);
diff --git a/examples/cpp/inference/transformers/transformers.cc b/examples/cpp/inference/transformers/transformers.cc
index 797a2c1958..a85ca02b10 100644
--- a/examples/cpp/inference/transformers/transformers.cc
+++ b/examples/cpp/inference/transformers/transformers.cc
@@ -197,11 +197,12 @@ void FlexFlow::top_level_task(Task const *task,
         assert(bc->register_new_request(guid, seq_lens.first, seq_lens.second));
       }
       bc->prepare_next_batch();
+      MachineView *view = im.get_machine_view(bid % im.num_devices);
 
-      runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
-      data_loader.next_batch(ff, bid, bc);
+      //runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
+      data_loader.next_batch(ff, bid, bc, view);
       FutureMap fm = im.inference(bid, *bc);
-      runtime->end_trace(ctx, 111 + bid % num_devices /*trace_id*/);
+      //runtime->end_trace(ctx, 111 + bid % num_devices /*trace_id*/);
 
       assert(fm.get_future_map_domain().get_volume() == 1);
       future_handlers[bid] = fm.get_future(0);
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index 92aa8f5d21..87cc80e055 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -29,6 +29,7 @@ class InferenceManager {
                    int max_num_inflight_batches);
   void compile_model_and_allocate_buffer(void);
   void init_operators_inference();
+  MachineView *get_machine_view(int mv_id);
   Legion::FutureMap inference(int index, BatchConfig const &bc);
 
 public:
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 4c3e123aa3..e802647db5 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -495,23 +495,22 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     cudaEventCreate(&t_end);
     cudaEventRecord(t_start, stream);
   }
-  cudaDeviceSynchronize();
+
   // phase 1: Implement kernel to compute KQV for input tokens
   inference_kernel1(m, bc, input_ptr, weight_ptr, m->devQKVProjArray, stream);
-  cudaDeviceSynchronize();
+
   // phase 2: Update key/val cache
   cudaMemcpyAsync(m->dev_token2ids,
                   &(bc->token2ids.token_indexes),
                   bc->MAX_NUM_TOKENS * sizeof(BatchConfig::token_idxs),
                   cudaMemcpyHostToDevice,
                   stream);
-  cudaDeviceSynchronize();
+
   inference_kernel2(m, bc, stream);
-  cudaDeviceSynchronize();
+
   // phase 3: Compute attention score
   // 3 kernels for pahse 3: matmul1 - softmax - matmal2
   inference_kernel3(m, bc, output_ptr, stream);
-  cudaDeviceSynchronize();
 
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index dcb6e9e67d..33707ea83d 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -117,6 +117,11 @@ void InferenceManager::init_operators_inference() {
   }
 }
 
+MachineView *InferenceManager::get_machine_view(int mv_id) {
+  assert(mv_id >= 0 && mv_id < machine_views.size());
+  return &machine_views[mv_id];
+}
+
 FutureMap InferenceManager::inference(int index, BatchConfig const &bc) {
   int batch_index = index % max_num_inflight_batches;
   int device_index = index % num_devices;
@@ -130,11 +135,13 @@ FutureMap InferenceManager::inference(int index, BatchConfig const &bc) {
 
     MachineView *view;
     if (op->op_type == OP_EXPERTS) {
-      view = &machine_views[expert_device_index];
+      view = get_machine_view(expert_device_index);
+      //view = &machine_views[expert_device_index];
       expert_device_index = (expert_device_index + 1) % num_devices;
     } else {
       // pick mv w startdeviceid = device_index
-      view = &machine_views[device_index];
+      //view = &machine_views[device_index];
+      view = get_machine_view(device_index);
     }
 
     std::vector<ParallelTensor> inputs(op->numInputs);

From a0bbfcb754de2d38a6ec57a02ecda08e6434421c Mon Sep 17 00:00:00 2001
From: zwang86 <46699021+zwang86@users.noreply.github.com>
Date: Wed, 29 Mar 2023 21:59:37 -0400
Subject: [PATCH 085/344] Fixed parallel tensor equals. (#665)

---
 examples/cpp/inference/dataloader.cc                | 5 ++++-
 examples/cpp/inference/dataloader.h                 | 5 ++++-
 examples/cpp/inference/mixture_of_experts/moe.cc    | 4 ++--
 examples/cpp/inference/transformers/transformers.cc | 4 ++--
 src/ops/experts.cu                                  | 7 +++++++
 src/runtime/inference_manager.cc                    | 4 ++--
 src/runtime/parallel_tensor.cc                      | 1 +
 7 files changed, 22 insertions(+), 8 deletions(-)

diff --git a/examples/cpp/inference/dataloader.cc b/examples/cpp/inference/dataloader.cc
index 80ce078508..2de6648b12 100644
--- a/examples/cpp/inference/dataloader.cc
+++ b/examples/cpp/inference/dataloader.cc
@@ -110,7 +110,10 @@ void DataLoader::load_entire_dataset(Task const *task,
   }
 }
 
-void DataLoader::next_batch(FFModel &ff, int bid, BatchConfig *bc, MachineView const *mv) {
+void DataLoader::next_batch(FFModel &ff,
+                            int bid,
+                            BatchConfig *bc,
+                            MachineView const *mv) {
   size_t num_active_tokens = bc->num_active_tokens();
   if (num_active_tokens == 0) {
     return;
diff --git a/examples/cpp/inference/dataloader.h b/examples/cpp/inference/dataloader.h
index f3e9a989de..59c5e8b119 100644
--- a/examples/cpp/inference/dataloader.h
+++ b/examples/cpp/inference/dataloader.h
@@ -43,7 +43,10 @@ class DataLoader {
                                   std::vector<PhysicalRegion> const &regions,
                                   Context ctx,
                                   Runtime *runtime);
-  void next_batch(FFModel &ff, int bid, BatchConfig *bc, MachineView const *mv = nullptr);
+  void next_batch(FFModel &ff,
+                  int bid,
+                  BatchConfig *bc,
+                  MachineView const *mv = nullptr);
 
 public:
   size_t num_samples;
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index d96ab74295..e35f998be3 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -218,10 +218,10 @@ void FlexFlow::top_level_task(Task const *task,
       bc->prepare_next_batch();
       MachineView *view = im.get_machine_view(bid % im.num_devices);
 
-      //runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
+      // runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
       data_loader.next_batch(ff, bid, bc, view);
       FutureMap fm = im.inference(bid, *bc);
-      //runtime->end_trace(ctx, 111 + bid % num_devices /*trace_id*/);
+      // runtime->end_trace(ctx, 111 + bid % num_devices /*trace_id*/);
 
       assert(fm.get_future_map_domain().get_volume() == 1);
       future_handlers[bid] = fm.get_future(0);
diff --git a/examples/cpp/inference/transformers/transformers.cc b/examples/cpp/inference/transformers/transformers.cc
index a85ca02b10..98a0bc5be4 100644
--- a/examples/cpp/inference/transformers/transformers.cc
+++ b/examples/cpp/inference/transformers/transformers.cc
@@ -199,10 +199,10 @@ void FlexFlow::top_level_task(Task const *task,
       bc->prepare_next_batch();
       MachineView *view = im.get_machine_view(bid % im.num_devices);
 
-      //runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
+      // runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
       data_loader.next_batch(ff, bid, bc, view);
       FutureMap fm = im.inference(bid, *bc);
-      //runtime->end_trace(ctx, 111 + bid % num_devices /*trace_id*/);
+      // runtime->end_trace(ctx, 111 + bid % num_devices /*trace_id*/);
 
       assert(fm.get_future_map_domain().get_volume() == 1);
       future_handlers[bid] = fm.get_future(0);
diff --git a/src/ops/experts.cu b/src/ops/experts.cu
index e51545ffdb..c4c5620cff 100644
--- a/src/ops/experts.cu
+++ b/src/ops/experts.cu
@@ -457,6 +457,13 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
   assert(gemm_batch_count <= num_valid_assignments);
 
   if (num_valid_assignments == 0) {
+    if (m->profiling) {
+      cudaEventRecord(t_end, stream);
+      cudaEventSynchronize(t_end);
+      float milliseconds = 0;
+      cudaEventElapsedTime(&milliseconds, t_start, t_end);
+      printf("forward_kernel_wrapper: %f ms\n", milliseconds);
+    }
     return;
   }
 
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 33707ea83d..ba62357411 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -136,11 +136,11 @@ FutureMap InferenceManager::inference(int index, BatchConfig const &bc) {
     MachineView *view;
     if (op->op_type == OP_EXPERTS) {
       view = get_machine_view(expert_device_index);
-      //view = &machine_views[expert_device_index];
+      // view = &machine_views[expert_device_index];
       expert_device_index = (expert_device_index + 1) % num_devices;
     } else {
       // pick mv w startdeviceid = device_index
-      //view = &machine_views[device_index];
+      // view = &machine_views[device_index];
       view = get_machine_view(device_index);
     }
 
diff --git a/src/runtime/parallel_tensor.cc b/src/runtime/parallel_tensor.cc
index a64d118fbc..3ad2f17f0c 100644
--- a/src/runtime/parallel_tensor.cc
+++ b/src/runtime/parallel_tensor.cc
@@ -762,6 +762,7 @@ bool ParallelTensorBase::tensor_equal(FFConfig &config,
   launcher.add_field(1, FID_DATA);
   Future result = runtime->execute_task(ctx, launcher);
   bool equals = result.get_result<bool>();
+  return equals;
 }
 
 bool ParallelTensorBase::tensor_equal_task(

From ccc06ec6f5a6e1a92879e28a9d2c0b2590b5827d Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 31 Mar 2023 01:03:52 -0400
Subject: [PATCH 086/344] [Inference] - Pass generated tokens to next batch
 (#666)

* add single output topk operator

* saving results in InferenceResult struct

* storing output

* bug fixing

* undo triton file change

* fix
---
 examples/cpp/inference/data_generator.cc      |  19 +-
 examples/cpp/inference/data_generator.cpp     |   8 +-
 examples/cpp/inference/data_generator.h       |  12 +-
 examples/cpp/inference/dataloader.cc          |  67 ++-
 examples/cpp/inference/dataloader.cu          | 108 +++--
 examples/cpp/inference/dataloader.h           |   9 +
 examples/cpp/inference/inference_config.h     |   8 +
 .../cpp/inference/mixture_of_experts/moe.cc   |  24 +-
 .../inference/transformers/transformers.cc    |  25 +-
 include/flexflow/batch_config.h               |   4 +-
 include/flexflow/ffconst.h                    |   1 +
 include/flexflow/model.h                      |  10 +
 include/flexflow/operator_params.h            |   2 +
 include/flexflow/ops/arg_topk.h               |  97 ++++
 include/flexflow/ops/arg_topk_params.h        |  25 +
 include/flexflow/ops/embedding.h              |   9 +
 include/flexflow/utils/cuda_helper.h          |   3 +
 src/ops/arg_topk.cc                           | 386 +++++++++++++++
 src/ops/arg_topk.cpp                          | 450 ++++++++++++++++++
 src/ops/arg_topk.cu                           | 446 +++++++++++++++++
 src/ops/embedding.cc                          |  87 ++++
 src/runtime/batch_config.cc                   |  19 +-
 src/runtime/cuda_helper.cu                    |  24 +-
 src/runtime/ffconst_utils.cc                  |   2 +
 src/runtime/graph.cc                          |   5 +
 src/runtime/hip_helper.cpp                    |  45 ++
 src/runtime/model.cc                          |  21 +
 27 files changed, 1829 insertions(+), 87 deletions(-)
 create mode 100644 include/flexflow/ops/arg_topk.h
 create mode 100644 include/flexflow/ops/arg_topk_params.h
 create mode 100644 src/ops/arg_topk.cc
 create mode 100644 src/ops/arg_topk.cpp
 create mode 100644 src/ops/arg_topk.cu

diff --git a/examples/cpp/inference/data_generator.cc b/examples/cpp/inference/data_generator.cc
index f691247485..69ed577822 100644
--- a/examples/cpp/inference/data_generator.cc
+++ b/examples/cpp/inference/data_generator.cc
@@ -21,14 +21,14 @@
 using namespace std;
 
 DataGenerator::DataGenerator(size_t _num_requests,
-                             size_t _token_dim,
+                             size_t _vocab_size,
                              size_t _min_input_tokens,
                              size_t _max_input_tokens,
                              size_t _min_tokens_to_generate,
                              size_t _max_tokens_to_generate,
                              bool _poisson_distr,
                              double _lambda)
-    : num_requests(_num_requests), token_dim(_token_dim),
+    : num_requests(_num_requests), vocab_size(_vocab_size),
       min_input_tokens(_min_input_tokens), max_input_tokens(_max_input_tokens),
       min_tokens_to_generate(_min_tokens_to_generate),
       max_tokens_to_generate(_max_tokens_to_generate),
@@ -73,7 +73,7 @@ void DataGenerator::generate_requests_meta() {
   // cout << "]" << endl;
 };
 
-void DataGenerator::generate_requests(float *req_ptr) {
+void DataGenerator::generate_requests(int *req_ptr) {
   assert(req_ptr != nullptr);
   /* for (size_t i=0; i<num_requests; i++) {
     for (size_t j=0; j<max_sequence_length; j++) {
@@ -88,12 +88,15 @@ void DataGenerator::generate_requests(float *req_ptr) {
   random_device rnd_device;
   mt19937 mersenne_engine{rnd_device()};
 
-  uniform_real_distribution<float> float_dist{0, 1.0};
-  auto gen = [&float_dist, &mersenne_engine]() {
-    return float_dist(mersenne_engine);
+  // uniform_real_distribution<float> float_dist{0, 1.0};
+  //  auto gen = [&float_dist, &mersenne_engine]() {
+  //    return float_dist(mersenne_engine);
+  //  };
+  std::uniform_int_distribution<int> int_dist(0, vocab_size - 1);
+  auto gen = [&int_dist, &mersenne_engine]() {
+    return int_dist(mersenne_engine);
   };
-  std::generate(
-      req_ptr, req_ptr + token_dim * max_input_tokens * num_requests, gen);
+  std::generate(req_ptr, req_ptr + max_input_tokens * num_requests, gen);
 };
 
 void DataGenerator::start_timer(void) {
diff --git a/examples/cpp/inference/data_generator.cpp b/examples/cpp/inference/data_generator.cpp
index 4201e36915..765e9813b9 100644
--- a/examples/cpp/inference/data_generator.cpp
+++ b/examples/cpp/inference/data_generator.cpp
@@ -19,7 +19,7 @@ int main(int argc, char const *argv[]) {
 
   // DataGenerator parameters
   size_t total_requests = 2560;
-  size_t token_dim = 16;
+  size_t vocab_size = 50257;
   size_t max_sequence_length = 512 + 128;
   bool use_poisson_distr = true;
   // average number of request arrivals per second
@@ -28,11 +28,11 @@ int main(int argc, char const *argv[]) {
   size_t min_input_tokens = 32, max_input_tokens = 512,
          min_tokens_to_generate = 1, max_tokens_to_generate = 128;
 
-  float *requests = (float *)calloc(
-      token_dim * max_sequence_length * total_requests, sizeof(float));
+  int *requests =
+      (int *)calloc(max_sequence_length * total_requests, sizeof(int));
 
   DataGenerator data_generator(total_requests,
-                               token_dim,
+                               vocab_size,
                                min_input_tokens,
                                max_input_tokens,
                                min_tokens_to_generate,
diff --git a/examples/cpp/inference/data_generator.h b/examples/cpp/inference/data_generator.h
index d83df8e1fe..3ba3007123 100644
--- a/examples/cpp/inference/data_generator.h
+++ b/examples/cpp/inference/data_generator.h
@@ -33,7 +33,7 @@ typedef std::chrono::milliseconds milliseconds;
 class DataGenerator {
 public:
   DataGenerator(size_t _num_requests,
-                size_t _token_dim,
+                size_t _vocab_size,
                 size_t _min_input_tokens,
                 size_t _max_input_tokens,
                 size_t _min_tokens_to_generate,
@@ -41,17 +41,15 @@ class DataGenerator {
                 bool _poisson_distr,
                 double _lambda);
 
-  // Generate random requests by filling each token with random data. For now,
-  // assume all requests have the same sequence length. Also generate random
-  // labels (if label_ptr != nullptr and num_labels >0).
-  void generate_requests(float *req_ptr);
+  // Generate random requests by filling each tensor with random tokens. For
+  // now, assume all requests have the same sequence length.
+  void generate_requests(int *req_ptr);
   void start_timer(void);
   // Get number of requests that have arrived since the last time this function
   // was called
   std::pair<size_t, size_t> get_requests(size_t max_requests,
                                          size_t max_tokens);
   std::pair<size_t, size_t> get_request_length(size_t guid);
-  // size_t max_sequence_length; // dimension of one request tensor
 
 private:
   // Compute the arrival times of each request and save them in the arrivals
@@ -60,7 +58,7 @@ class DataGenerator {
   void generate_requests_meta();
 
   size_t num_requests; // total number of requests
-  size_t token_dim;    // embedding dim of each token
+  size_t vocab_size;   // number of words in the vocab
   size_t min_input_tokens;
   size_t max_input_tokens;
   size_t min_tokens_to_generate;
diff --git a/examples/cpp/inference/dataloader.cc b/examples/cpp/inference/dataloader.cc
index 2de6648b12..36f99718c3 100644
--- a/examples/cpp/inference/dataloader.cc
+++ b/examples/cpp/inference/dataloader.cc
@@ -58,7 +58,7 @@ DataLoader::DataLoader(FFModel &ff,
     dims[batch_idx].size = num_samples;
 
     full_input =
-        ff.create_parallel_tensor_legion_ordering(numdims, dims, DT_FLOAT);
+        ff.create_parallel_tensor_legion_ordering(numdims, dims, DT_INT32);
     ff.map_tensor(full_input, NULL /*parallel_op*/);
   }
 
@@ -93,7 +93,7 @@ void DataLoader::load_entire_dataset(Task const *task,
   assert(task->regions.size() == regions.size());
 
   // get input pointer
-  float *input_ptr = helperGetTensorPointerWO<float>(
+  int *input_ptr = helperGetTensorPointerWO<int>(
       regions[0], task->regions[0], FID_DATA, ctx, runtime);
   Domain input_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
@@ -113,6 +113,7 @@ void DataLoader::load_entire_dataset(Task const *task,
 void DataLoader::next_batch(FFModel &ff,
                             int bid,
                             BatchConfig *bc,
+                            std::map<size_t, int> &batch_predictions,
                             MachineView const *mv) {
   size_t num_active_tokens = bc->num_active_tokens();
   if (num_active_tokens == 0) {
@@ -140,16 +141,23 @@ void DataLoader::next_batch(FFModel &ff,
        num_active_tokens); */
     assert(ff.config.batchSize == batch_size &&
            batch_size * seq_len >= num_active_tokens);
-    for (Domain::DomainPointIterator it(domain); it; it++) {
-      // SampleIdxs meta = bc->token2ids;
-      argmap.set_point(
-          *it, TaskArgument(&bc->token2ids, sizeof(BatchConfig::SampleIdxs)));
-    }
+
+    /* std::cout << "About to call next_batch function..." << std::endl;
+    bc->print();
+    std::cout << "batch_predictions: ";
+    for (const auto& elem : batch_predictions){
+        std::cout << elem.first << ":" << elem.second << ", ";
+    } */
+    DataLoaderNextBatchInput next_batch_input = {bc->token2ids,
+                                                 batch_predictions};
+    DataLoaderNextBatchInput const *ptr = &next_batch_input;
+    size_t next_batch_input_sz = sizeof(next_batch_input);
+    assert(ptr->prev_batch_preds.size() == batch_predictions.size());
     MachineView const *view = mv ? mv : &batch_input[bid]->machine_view;
     size_t machine_view_hash = view->hash();
     IndexLauncher launcher(CUSTOM_GPU_TASK_ID_1,
                            batch_input[bid]->parallel_is,
-                           TaskArgument(NULL, 0),
+                           TaskArgument(ptr, next_batch_input_sz),
                            argmap,
                            Predicate::TRUE_PRED,
                            false /*must*/,
@@ -173,6 +181,49 @@ void DataLoader::next_batch(FFModel &ff,
   }
 }
 
+void DataLoader::store_outputs(BatchConfig *bc,
+                               InferenceResult const &ir,
+                               std::map<size_t, int> &batch_predictions) {
+  assert(bc->token2ids.num_samples == bc->num_active_tokens() &&
+         bc->token2ids.num_samples <= bc->MAX_NUM_TOKENS);
+  batch_predictions.clear();
+  // bc->print();
+  for (size_t i = 0; i < bc->token2ids.num_samples; i++) {
+    if (i == bc->token2ids.num_samples - 1 ||
+        bc->token2ids.guids[i] != bc->token2ids.guids[i + 1]) {
+      assert(bc->token2ids.token_indexes[i].token_position ==
+             bc->token_last_available_idx[bc->token2ids.token_indexes[i]
+                                              .request_index]);
+      if (outputs.find(bc->token2ids.guids[i]) == outputs.end()) {
+        std::vector<int> v{ir.results[i]};
+        outputs[bc->token2ids.guids[i]] = v;
+      } else {
+        outputs[bc->token2ids.guids[i]].push_back(ir.results[i]);
+      }
+      /* std::cout << "outputs: ";
+      for(const auto& elem : outputs){
+        std::cout << elem.first << ": [";
+        for (const auto &vel : elem.second) {
+          std::cout << vel << " ";
+        }
+        std::cout << "]" << std::endl;
+      } */
+      // std::cout << "outputs[bc->token2ids.guids[i]].size(): " <<
+      // outputs[bc->token2ids.guids[i]].size() << std::endl; std::cout << "i: "
+      // << i << std::endl; std::cout <<
+      // "bc->token2ids.token_indexes[i].token_position: " <<
+      // bc->token2ids.token_indexes[i].token_position << std::endl; std::cout
+      // << "bc->token2ids.token_indexes[i].initial_length: " <<
+      // bc->token2ids.token_indexes[i].initial_length << std::endl;
+      assert(outputs[bc->token2ids.guids[i]].size() ==
+             (bc->token2ids.token_indexes[i].token_position + 1) -
+                 (bc->token2ids.token_indexes[i].initial_length - 1));
+      batch_predictions[bc->token2ids.guids[i]] = ir.results[i];
+    }
+  }
+  assert(batch_predictions.size() == bc->num_active_requests());
+}
+
 void FlexFlow::register_custom_tasks() {
   // Load entire dataset
   {
diff --git a/examples/cpp/inference/dataloader.cu b/examples/cpp/inference/dataloader.cu
index 0668fd949d..71dc14db49 100644
--- a/examples/cpp/inference/dataloader.cu
+++ b/examples/cpp/inference/dataloader.cu
@@ -22,13 +22,18 @@ void DataLoader::load_input(Task const *task,
                             Runtime *runtime) {
   assert(regions.size() == 2);
   assert(task->regions.size() == 2);
-  BatchConfig::SampleIdxs *meta = (BatchConfig::SampleIdxs *)task->local_args;
-  if (meta->num_samples == 0) {
+
+  DataLoaderNextBatchInput const input_struct =
+      *((DataLoaderNextBatchInput *)task->args);
+  BatchConfig::SampleIdxs const &meta = input_struct.meta;
+  std::map<size_t, int> const &prev_batch_preds = input_struct.prev_batch_preds;
+
+  if (meta.num_samples == 0) {
     return;
   }
-  float const *full_input_ptr = helperGetTensorPointerRO<float>(
+  int const *full_input_ptr = helperGetTensorPointerRO<int>(
       regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  float *batch_input_ptr = helperGetTensorPointerWO<float>(
+  int *batch_input_ptr = helperGetTensorPointerWO<int>(
       regions[1], task->regions[1], FID_DATA, ctx, runtime);
 
   Domain full_input_domain = runtime->get_index_space_domain(
@@ -36,67 +41,90 @@ void DataLoader::load_input(Task const *task,
   Domain batch_input_domain = runtime->get_index_space_domain(
       ctx, task->regions[1].region.get_index_space());
 
-  coord_t token_dim =
-      batch_input_domain.hi()[0] - batch_input_domain.lo()[0] + 1;
   coord_t sequence_length =
-      batch_input_domain.hi()[1] - batch_input_domain.lo()[1] + 1;
+      batch_input_domain.hi()[0] - batch_input_domain.lo()[0] + 1;
   coord_t batch_size =
-      batch_input_domain.hi()[2] - batch_input_domain.lo()[2] + 1;
+      batch_input_domain.hi()[1] - batch_input_domain.lo()[1] + 1;
 
-  coord_t full_input_token_dim =
-      batch_input_domain.hi()[0] - batch_input_domain.lo()[0] + 1;
   coord_t full_input_sequence_length =
-      batch_input_domain.hi()[1] - batch_input_domain.lo()[1] + 1;
+      batch_input_domain.hi()[0] - batch_input_domain.lo()[0] + 1;
   coord_t full_input_batch_size =
-      batch_input_domain.hi()[2] - batch_input_domain.lo()[2] + 1;
-  assert(token_dim == full_input_token_dim);
+      batch_input_domain.hi()[1] - batch_input_domain.lo()[1] + 1;
+
   assert(sequence_length == full_input_sequence_length);
   assert(batch_size <= full_input_batch_size);
 
   // Currently assume continous indices
-  assert(meta->num_samples <= batch_size * sequence_length);
-  for (int i = 1; i < meta->num_samples; i++) {
-    if (meta->guids[i] == meta->guids[i - 1]) {
-      assert(meta->token_indexes[i].token_position ==
-             meta->token_indexes[i - 1].token_position + 1);
+  assert(meta.num_samples <= batch_size * sequence_length);
+  for (int i = 1; i < meta.num_samples; i++) {
+    if (meta.guids[i] == meta.guids[i - 1]) {
+      assert(meta.token_indexes[i].token_position ==
+             meta.token_indexes[i - 1].token_position + 1);
     }
   }
   // keep things simple for now
-  assert(batch_input_domain.get_volume() ==
-         batch_size * sequence_length * token_dim);
+  assert(batch_input_domain.get_volume() == batch_size * sequence_length);
 
   // pad inputs if needed (this is really only useful for debugging)
   checkCUDA(cudaMemset(
-      batch_input_ptr, 0, batch_input_domain.get_volume() * sizeof(float)));
+      batch_input_ptr, 0, batch_input_domain.get_volume() * sizeof(int)));
 
-  size_t guid = meta->guids[0];
-  size_t start_idx = meta->token_indexes[0].token_position;
+  size_t guid = meta.guids[0];
+  size_t start_idx = meta.token_indexes[0].token_position;
   size_t dst_idx = 0;
   size_t total_tokens = 0;
-  for (size_t i = 1; i <= meta->num_samples; i++) {
-    if (i == meta->num_samples || meta->guids[i] != guid) {
-      size_t size_to_copy =
-          token_dim *
-          (meta->token_indexes[i - 1].token_position - start_idx + 1);
-      total_tokens += size_to_copy / token_dim;
-      float const *input_zc = full_input_ptr +
-                              (guid * token_dim * sequence_length) +
-                              start_idx * token_dim;
-      float *dst_ptr = batch_input_ptr + dst_idx * token_dim;
-      copy_kernel<<<GET_BLOCKS(size_to_copy), CUDA_NUM_THREADS>>>(
-          dst_ptr, input_zc, size_to_copy);
-      if (i < meta->num_samples) {
-        guid = meta->guids[i];
-        start_idx = meta->token_indexes[i].token_position;
+  for (size_t i = 1; i <= meta.num_samples; i++) {
+    if (i == meta.num_samples || meta.guids[i] != guid) {
+
+      size_t tokens_to_copy =
+          (meta.token_indexes[i - 1].token_position - start_idx + 1);
+      // size_t size_to_copy = token_dim * tokens_to_copy;
+      assert(tokens_to_copy > 0);
+      if (tokens_to_copy > 1 || meta.token_indexes[i - 1].token_position <
+                                    meta.token_indexes[i - 1].initial_length) {
+        // initialization phase
+        assert(meta.token_indexes[i - 1].token_position <
+               meta.token_indexes[i - 1].initial_length);
+        int const *input_zc =
+            full_input_ptr + (guid * sequence_length) + start_idx;
+        int *dst_ptr = batch_input_ptr + dst_idx;
+        copy_kernel<<<GET_BLOCKS(tokens_to_copy), CUDA_NUM_THREADS>>>(
+            dst_ptr, input_zc, tokens_to_copy);
+      } else {
+        // incremental phase
+        assert(meta.token_indexes[i - 1].token_position >=
+               meta.token_indexes[i - 1].initial_length);
+        assert(tokens_to_copy == 1);
+
+        /* std::cout << "Looking for guid: " << guid << std::endl;
+        std::cout << "prev_batch_preds: ";
+        for (const auto& elem : prev_batch_preds){
+            std::cout << elem.first << ":" << elem.second << ", ";
+        }
+        std::cout << std::endl; */
+        assert(prev_batch_preds.find(guid) != prev_batch_preds.end());
+        int token = prev_batch_preds.at(guid);
+        int *dst_ptr = batch_input_ptr + dst_idx;
+        cudaMemcpy(dst_ptr, &token, 1, cudaMemcpyHostToDevice);
+        // copy_kernel<<<GET_BLOCKS(tokens_to_copy),
+        // CUDA_NUM_THREADS>>>(dst_ptr, &token, tokens_to_copy);
+        //  cudaMemcpyAsync(batch_input_ptr + dst_idx * token_dim, &token, 1,
+        //  cudaMemcpyHostToDevice);
+      }
+      total_tokens += tokens_to_copy;
+
+      if (i < meta.num_samples) {
+        guid = meta.guids[i];
+        start_idx = meta.token_indexes[i].token_position;
       }
       dst_idx = i;
     }
   }
-  assert(total_tokens == meta->num_samples);
+  assert(total_tokens == meta.num_samples);
   /*printf("token_dim: %lli, sequence_length: %lli, batch_size: %lli\n",
   token_dim, sequence_length, batch_size); printf("total_tokens: %lu\n",
   total_tokens); printf("guid: %lu\n", guid);
-  print_tensor<float>(batch_input_ptr,
+  print_tensor<int>(batch_input_ptr,
                       batch_input_domain.get_volume(),
                       "[BatchInput]");*/
   checkCUDA(cudaDeviceSynchronize());
diff --git a/examples/cpp/inference/dataloader.h b/examples/cpp/inference/dataloader.h
index 59c5e8b119..afb45801d1 100644
--- a/examples/cpp/inference/dataloader.h
+++ b/examples/cpp/inference/dataloader.h
@@ -46,14 +46,23 @@ class DataLoader {
   void next_batch(FFModel &ff,
                   int bid,
                   BatchConfig *bc,
+                  std::map<size_t, int> &batch_predictions,
                   MachineView const *mv = nullptr);
+  void store_outputs(BatchConfig *bc,
+                     InferenceResult const &ir,
+                     std::map<size_t, int> &batch_predictions);
 
 public:
   size_t num_samples;
   ParallelTensor full_input;
   std::vector<ParallelTensor> batch_input;
+  std::map<size_t, std::vector<int>> outputs;
   struct DataLoaderInput {
     InferenceConfig const &_inferenceConfig;
     DataGenerator &_data_generator;
   };
+  struct DataLoaderNextBatchInput {
+    BatchConfig::SampleIdxs const &meta;
+    std::map<size_t, int> const &prev_batch_preds;
+  };
 };
diff --git a/examples/cpp/inference/inference_config.h b/examples/cpp/inference/inference_config.h
index 7214cf42a2..8301640e45 100644
--- a/examples/cpp/inference/inference_config.h
+++ b/examples/cpp/inference/inference_config.h
@@ -32,6 +32,10 @@ struct InferenceConfig {
     out_dim = DATA_DIM;
     num_labels = out_dim;
     num_layers = 3;
+
+    vocab_size = 50257;
+    block_size = 1024;
+
     //----------------------- Inference parameters ---------------------
     // total number of requests processed as part of the simulation
     total_requests = 2560;
@@ -55,6 +59,10 @@ struct InferenceConfig {
   int out_dim;
   int num_labels;
   int num_layers;
+
+  int vocab_size;
+  int block_size;
+
   std::string dataset_path;
   // Inference parameters
   int total_requests;
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index e35f998be3..5ebd23a4c7 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -117,16 +117,26 @@ void FlexFlow::top_level_task(Task const *task,
   //----------------------- Create inputs --------------------------------
   Tensor input;
   {
-    int const dims[] = {
-        ffConfig.batchSize, moeConfig.sequence_length, moeConfig.token_dim};
-    input = ff.create_tensor<3>(dims, DT_FLOAT);
+    int const dims[] = {ffConfig.batchSize, moeConfig.sequence_length};
+    input = ff.create_tensor<2>(dims, DT_INT32);
   }
+  Tensor t = input;
+  Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
+  t = ff.embedding(t,
+                   moeConfig.vocab_size,
+                   moeConfig.token_dim,
+                   AGGR_MODE_NONE,
+                   DT_FLOAT,
+                   NULL,
+                   embed_init);
 
   //----------------------- Define the model ------------------------------
-  Tensor t = create_moe_encoder(&ff, &moeConfig, input);
+  t = create_moe_encoder(&ff, &moeConfig, t);
   // Tensor t = create_moe(&ff, &moeConfig, input);
   t = ff.dense(t, moeConfig.out_dim, AC_MODE_RELU);
   t = ff.softmax(t);
+  // select most likely next token
+  Tensor output = ff.arg_top_k(t, /*k=*/1, /*sorted=*/false);
 
   //------------------- Initialize the inference manager ------------------
   InferenceManager im(
@@ -141,7 +151,7 @@ void FlexFlow::top_level_task(Task const *task,
          min_tokens_to_generate = 1,
          max_tokens_to_generate = MAX_SEQ_LEN - max_input_tokens;
   DataGenerator data_generator(moeConfig.total_requests,
-                               moeConfig.token_dim,
+                               moeConfig.vocab_size,
                                min_input_tokens,
                                max_input_tokens,
                                min_tokens_to_generate,
@@ -173,6 +183,7 @@ void FlexFlow::top_level_task(Task const *task,
   std::map<int, BatchConfig *> batch_configs;
   std::pair<size_t, size_t> new_prompts;
   BatchConfig *bc = nullptr;
+  std::map<size_t, int> batch_predictions[im.max_num_inflight_batches];
 
   assert(im.max_num_requests_per_batch == moeConfig.batch_size);
 
@@ -193,6 +204,7 @@ void FlexFlow::top_level_task(Task const *task,
         }
         InferenceResult ir = future.get_result<InferenceResult>();
         bc = batch_configs[bid];
+        data_loader.store_outputs(bc, ir, batch_predictions[bid]);
         processed_requests += bc->update_results(ir);
         max_reqs = moeConfig.incremental_mode
                        ? bc->MAX_NUM_REQUESTS - bc->num_active_requests()
@@ -219,7 +231,7 @@ void FlexFlow::top_level_task(Task const *task,
       MachineView *view = im.get_machine_view(bid % im.num_devices);
 
       // runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
-      data_loader.next_batch(ff, bid, bc, view);
+      data_loader.next_batch(ff, bid, bc, batch_predictions[bid], view);
       FutureMap fm = im.inference(bid, *bc);
       // runtime->end_trace(ctx, 111 + bid % num_devices /*trace_id*/);
 
diff --git a/examples/cpp/inference/transformers/transformers.cc b/examples/cpp/inference/transformers/transformers.cc
index 98a0bc5be4..14414bb8f1 100644
--- a/examples/cpp/inference/transformers/transformers.cc
+++ b/examples/cpp/inference/transformers/transformers.cc
@@ -89,19 +89,29 @@ void FlexFlow::top_level_task(Task const *task,
   //----------------------- Create inputs --------------------------------
   Tensor input;
   {
-    int const dims[] = {ffConfig.batchSize,
-                        transformerConfig.sequence_length,
-                        transformerConfig.token_dim};
-    input = ff.create_tensor<3>(dims, DT_FLOAT);
+    int const dims[] = {ffConfig.batchSize, transformerConfig.sequence_length};
+    input = ff.create_tensor<2>(dims, DT_INT32);
   }
 
   //----------------------- Define the model ------------------------------
   Tensor t = input;
+
+  Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
+  t = ff.embedding(t,
+                   transformerConfig.vocab_size,
+                   transformerConfig.token_dim,
+                   AGGR_MODE_NONE,
+                   DT_FLOAT,
+                   NULL,
+                   embed_init);
+
   for (int i = 0; i < transformerConfig.num_layers; i++) {
     t = create_inc_multihead_attention_decoder(&ff, &transformerConfig, t);
   }
   t = ff.dense(t, transformerConfig.out_dim, AC_MODE_RELU);
   t = ff.softmax(t);
+  // select most likely next token
+  Tensor output = ff.arg_top_k(t, /*k=*/1, false);
 
   //------------------- Initialize the inference manager ------------------
   InferenceManager im(&ff,
@@ -117,7 +127,7 @@ void FlexFlow::top_level_task(Task const *task,
          min_tokens_to_generate = 1,
          max_tokens_to_generate = MAX_SEQ_LEN - max_input_tokens;
   DataGenerator data_generator(transformerConfig.total_requests,
-                               transformerConfig.token_dim,
+                               transformerConfig.vocab_size,
                                min_input_tokens,
                                max_input_tokens,
                                min_tokens_to_generate,
@@ -140,7 +150,6 @@ void FlexFlow::top_level_task(Task const *task,
   }
   double ts_start = Realm::Clock::current_time_in_microseconds();
 
-  //----------------------- Begin inference! -------------------------------
   //----------------------- Begin inference! -------------------------------
   int index = 0;
   int processed_requests = 0;
@@ -150,6 +159,7 @@ void FlexFlow::top_level_task(Task const *task,
   std::map<int, BatchConfig *> batch_configs;
   std::pair<size_t, size_t> new_prompts;
   BatchConfig *bc = nullptr;
+  std::map<size_t, int> batch_predictions[im.max_num_inflight_batches];
 
   assert(im.max_num_requests_per_batch == transformerConfig.batch_size);
   // assert(transformerConfig.batch_size <= BatchConfig::MAX_NUM_REQUESTS);
@@ -173,6 +183,7 @@ void FlexFlow::top_level_task(Task const *task,
         }
         InferenceResult ir = future.get_result<InferenceResult>();
         bc = batch_configs[bid];
+        data_loader.store_outputs(bc, ir, batch_predictions[bid]);
         processed_requests += bc->update_results(ir);
         max_reqs = transformerConfig.incremental_mode
                        ? bc->MAX_NUM_REQUESTS - bc->num_active_requests()
@@ -200,7 +211,7 @@ void FlexFlow::top_level_task(Task const *task,
       MachineView *view = im.get_machine_view(bid % im.num_devices);
 
       // runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
-      data_loader.next_batch(ff, bid, bc, view);
+      data_loader.next_batch(ff, bid, bc, batch_predictions[bid], view);
       FutureMap fm = im.inference(bid, *bc);
       // runtime->end_trace(ctx, 111 + bid % num_devices /*trace_id*/);
 
diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index ac12b11dd0..05f6e062d6 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -34,7 +34,7 @@ class BatchConfig {
 public:
   BatchConfig();
   bool register_new_request(size_t guid,
-                            int initial_length,
+                            int initial_len,
                             int tokens_to_generate);
   void prepare_next_batch();
   int update_results(InferenceResult const &ir);
@@ -57,6 +57,7 @@ class BatchConfig {
   int num_processing_tokens[MAX_NUM_REQUESTS]; // a request's number of tokens
                                                // being processed in the current
                                                // batch/iteration
+  size_t initial_length[MAX_NUM_REQUESTS];
   size_t max_sequence_length[MAX_NUM_REQUESTS];
 
   struct token_idxs {
@@ -64,6 +65,7 @@ class BatchConfig {
                            // that the token belongs to
     size_t token_position; // the index indicating the position of each token
                            // within its request
+    size_t initial_length;
   };
 
   struct SampleIdxs {
diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index 2ccf4a0eb1..c698191811 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -123,6 +123,7 @@ enum OperatorType {
   OP_SHAPE, // https://github.com/onnx/onnx/blob/master/docs/Operators.md#Shape
   OP_SIZE,  // https://github.com/onnx/onnx/blob/master/docs/Operators.md#Size
   OP_TOPK,  // https://github.com/onnx/onnx/blob/master/docs/Operators.md#TopK
+  OP_ARG_TOPK,
   OP_WHERE, // https://github.com/onnx/onnx/blob/master/docs/Operators.md#Where
   OP_CEIL,  // https://github.com/onnx/onnx/blob/master/docs/Operators.md#Ceil
   OP_CAST,  // https://github.com/onnx/onnx/blob/master/docs/Operators.md#Cast
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 6e8effcb27..da26d54af2 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -132,6 +132,8 @@ enum TaskIDs {
   TOPK_INIT_TASK_ID,
   TOPK_FWD_TASK_ID,
   TOPK_BWD_TASK_ID,
+  ARG_TOPK_INIT_TASK_ID,
+  ARG_TOPK_INF_TASK_ID,
   TRANSPOSE_INIT_TASK_ID,
   TRANSPOSE_FWD_TASK_ID,
   TRANSPOSE_BWD_TASK_ID,
@@ -284,6 +286,7 @@ class Reshape;
 class Softmax;
 class Split;
 class TopK;
+class ArgTopK;
 class Transpose;
 class Combine;
 class Repartition;
@@ -560,6 +563,11 @@ class FFModel {
              int k,
              bool sorted,
              char const *name = NULL);
+  Tensor arg_top_k(const Tensor input,
+                   // Tensor *outputs,
+                   int k,
+                   bool sorted,
+                   char const *name = NULL);
   Tensor multihead_attention(const Tensor query,
                              const Tensor key,
                              const Tensor value,
@@ -953,6 +961,8 @@ class FFModel {
       std::unordered_map<std::pair<ParallelTensorShape, SoftmaxParams>,
                          Softmax *>,
       std::unordered_map<std::pair<ParallelTensorShape, TopKParams>, TopK *>,
+      std::unordered_map<std::pair<ParallelTensorShape, ArgTopKParams>,
+                         ArgTopK *>,
       std::unordered_map<std::pair<ParallelTensorShape, TransposeParams>,
                          Transpose *>,
       std::unordered_map<std::pair<ParallelTensorShape, RepartitionParams>,
diff --git a/include/flexflow/operator_params.h b/include/flexflow/operator_params.h
index 899921a758..340cc38659 100644
--- a/include/flexflow/operator_params.h
+++ b/include/flexflow/operator_params.h
@@ -3,6 +3,7 @@
 
 #include "flexflow/ops/aggregate_params.h"
 #include "flexflow/ops/aggregate_spec_params.h"
+#include "flexflow/ops/arg_topk_params.h"
 #include "flexflow/ops/attention_params.h"
 #include "flexflow/ops/batch_matmul_params.h"
 #include "flexflow/ops/cast_params.h"
@@ -59,6 +60,7 @@ using OperatorParameters = mp::variant<AggregateParams,
                                        ReshapeParams,
                                        SplitParams,
                                        TopKParams,
+                                       ArgTopKParams,
                                        SoftmaxParams,
                                        TransposeParams,
                                        RepartitionParams,
diff --git a/include/flexflow/ops/arg_topk.h b/include/flexflow/ops/arg_topk.h
new file mode 100644
index 0000000000..4195efd142
--- /dev/null
+++ b/include/flexflow/ops/arg_topk.h
@@ -0,0 +1,97 @@
+#ifndef _FLEXFLOW_ARG_TOPK_H_
+#define _FLEXFLOW_ARG_TOPK_H_
+
+#include "flexflow/inference.h"
+#include "flexflow/model.h"
+#include "flexflow/node.h"
+#include "flexflow/ops/arg_topk_params.h"
+
+namespace FlexFlow {
+
+class ArgTopKMeta : public OpMeta {
+public:
+  ArgTopKMeta(FFHandler handle);
+  bool sorted;
+};
+
+class ArgTopK : public Op {
+public:
+  using Params = ArgTopKParams;
+  using Input = ParallelTensor;
+  ArgTopK(FFModel &model,
+          const ParallelTensor input,
+          int k,
+          bool sorted,
+          char const *name);
+  ArgTopK(FFModel &model, ArgTopK const &other, const ParallelTensor input);
+  ArgTopK(FFModel &model,
+          Params const &params,
+          Input const input,
+          char const *name = nullptr);
+  void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
+  void forward(FFModel const &) override;
+  void backward(FFModel const &) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
+  void print_layer(FFModel const &model) override {
+    assert(0);
+  }
+  static Op *
+      create_operator_from_layer(FFModel &model,
+                                 Layer const *layer,
+                                 std::vector<ParallelTensor> const &inputs);
+
+  static OpMeta *init_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static InferenceResult
+      inference_task(Legion::Task const *task,
+                     std::vector<Legion::PhysicalRegion> const &regions,
+                     Legion::Context ctx,
+                     Legion::Runtime *runtime);
+  void serialize(Legion::Serializer &s) const override;
+  static PCG::Node deserialize(FFModel &ff,
+                               Legion::Deserializer &d,
+                               ParallelTensor inputs[],
+                               int num_inputs);
+  Op *materialize(FFModel &ff,
+                  ParallelTensor inputs[],
+                  int num_inputs) const override;
+  bool measure_operator_cost(Simulator *sim,
+                             MachineView const &pc,
+                             CostMetrics &cost_metrics) const override;
+  static void forward_kernel(ArgTopKMeta const *m,
+                             float const *input_ptr,
+                             // float *output_ptr,
+                             int *indices_ptr,
+                             size_t batch_size,
+                             int length,
+                             int k,
+                             bool sorted,
+                             ffStream_t stream);
+  static void forward_kernel_wrapper(ArgTopKMeta const *m,
+                                     float const *input_ptr,
+                                     // float *output_ptr,
+                                     int *indices_ptr,
+                                     size_t batch_size,
+                                     int length,
+                                     int k,
+                                     bool sorted);
+  Params get_params() const;
+
+public:
+  int k;
+  bool sorted;
+};
+
+}; // namespace FlexFlow
+
+#endif
diff --git a/include/flexflow/ops/arg_topk_params.h b/include/flexflow/ops/arg_topk_params.h
new file mode 100644
index 0000000000..ca88a5b9be
--- /dev/null
+++ b/include/flexflow/ops/arg_topk_params.h
@@ -0,0 +1,25 @@
+#ifndef _FLEXFLOW_ARG_TOPK_PARAMS_H
+#define _FLEXFLOW_ARG_TOPK_PARAMS_H
+
+#include "flexflow/ffconst.h"
+#include "flexflow/parallel_tensor.h"
+
+namespace FlexFlow {
+
+struct ArgTopKParams {
+  int k;
+  bool sorted;
+  bool is_valid(ParallelTensorShape const &) const;
+};
+bool operator==(ArgTopKParams const &, ArgTopKParams const &);
+
+} // namespace FlexFlow
+
+namespace std {
+template <>
+struct hash<FlexFlow::ArgTopKParams> {
+  size_t operator()(FlexFlow::ArgTopKParams const &) const;
+};
+} // namespace std
+
+#endif // _FLEXFLOW_ARG_TOPK_PARAMS_H
diff --git a/include/flexflow/ops/embedding.h b/include/flexflow/ops/embedding.h
index 91caf06af0..bd7c15b2fe 100644
--- a/include/flexflow/ops/embedding.h
+++ b/include/flexflow/ops/embedding.h
@@ -49,8 +49,17 @@ class Embedding : public Op {
             bool allocate_weights = false,
             char const *name = nullptr);
   void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
   // void update(const FFModel&);
   void print_layer(FFModel const &model) override {
     assert(0);
diff --git a/include/flexflow/utils/cuda_helper.h b/include/flexflow/utils/cuda_helper.h
index a2e3e4fcdc..4271919911 100644
--- a/include/flexflow/utils/cuda_helper.h
+++ b/include/flexflow/utils/cuda_helper.h
@@ -136,6 +136,9 @@ void print_tensor(T const *ptr, size_t num_elements, char const *prefix);
 template <typename T>
 T *download_tensor(T const *ptr, size_t num_elements);
 
+template <typename T>
+bool download_tensor(T const *ptr, T *dst, size_t num_elements);
+
 cudnnStatus_t cudnnSetTensorDescriptorFromDomain(cudnnTensorDescriptor_t tensor,
                                                  Legion::Domain domain);
 
diff --git a/src/ops/arg_topk.cc b/src/ops/arg_topk.cc
new file mode 100644
index 0000000000..35bb80a2b9
--- /dev/null
+++ b/src/ops/arg_topk.cc
@@ -0,0 +1,386 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/arg_topk.h"
+#include "flexflow/model.h"
+#include "flexflow/utils/hash_utils.h"
+#include "legion/legion_utilities.h"
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+#include "flexflow/utils/cuda_helper.h"
+#else
+#include "flexflow/utils/hip_helper.h"
+#endif
+
+namespace FlexFlow {
+// declare Legion names
+using Legion::ArgumentMap;
+using Legion::Context;
+using Legion::coord_t;
+using Legion::Domain;
+using Legion::FutureMap;
+using Legion::IndexLauncher;
+using Legion::InlineLauncher;
+using Legion::Machine;
+using Legion::Memory;
+using Legion::PhysicalRegion;
+using Legion::Predicate;
+using Legion::Rect;
+using Legion::RegionRequirement;
+using Legion::Runtime;
+using Legion::Task;
+using Legion::TaskArgument;
+using Legion::TaskLauncher;
+using PCG::Node;
+
+// For an input tensor, computes the top k entries in each row
+// (resp. vector along the last dimension). Thus,
+// values.shape = indices.shape = input.shape[:-1] + [k]
+Tensor FFModel::arg_top_k(const Tensor input,
+                          int k,
+                          bool sorted,
+                          char const *name) {
+  Layer *li = new Layer(this,
+                        OP_ARG_TOPK,
+                        input->data_type,
+                        name,
+                        1 /*inputs*/,
+                        0 /*weights*/,
+                        1 /*outputs*/,
+                        input);
+  {
+    int numdims = input->num_dims;
+    int dims[MAX_TENSOR_DIM];
+    for (int i = 0; i < numdims; i++) {
+      dims[i] = input->dims[i];
+    }
+    dims[0] = k;
+    // li->outputs[0] = create_tensor_legion_ordering(
+    //     numdims, dims, input->data_type, li, 0, true /*create_grad*/);
+    li->outputs[0] = create_tensor_legion_ordering(
+        numdims, dims, DT_INT32, li, 0, false /*create_grad*/);
+  }
+  li->add_int_property("k", k);
+  li->add_int_property("sorted", sorted);
+  layers.push_back(li);
+  // outputs[0] = li->outputs[0];
+  // outputs[1] = li->outputs[1];
+  return li->outputs[0];
+}
+
+Op *ArgTopK::create_operator_from_layer(
+    FFModel &model,
+    Layer const *layer,
+    std::vector<ParallelTensor> const &inputs) {
+  long long value;
+  layer->get_int_property("k", value);
+  int k = value;
+  layer->get_int_property("sorted", value);
+  bool sorted = (bool)value;
+  return new ArgTopK(model, inputs[0], k, sorted, layer->name);
+}
+
+ArgTopKParams ArgTopK::get_params() const {
+  ArgTopKParams params;
+  params.k = this->k;
+  params.sorted = this->sorted;
+  return params;
+}
+
+bool ArgTopKParams::is_valid(ParallelTensorShape const &) const {
+  // topk is always valid
+  return true;
+}
+
+bool operator==(ArgTopKParams const &lhs, ArgTopKParams const &rhs) {
+  return lhs.k == rhs.k && lhs.sorted == rhs.sorted;
+}
+
+ArgTopK::ArgTopK(FFModel &model,
+                 const ParallelTensor _input,
+                 int _k,
+                 bool _sorted,
+                 char const *name)
+    : Op(model,
+         OP_ARG_TOPK,
+         _input->data_type,
+         name,
+         1 /*inputs*/,
+         0 /*weights*/,
+         1 /*outputs*/,
+         _input),
+      k(_k), sorted(_sorted) {
+  int numdim = inputs[0]->num_dims;
+  ParallelDim dims[MAX_TENSOR_DIM];
+  for (int i = 0; i < numdim; i++) {
+    dims[i] = inputs[0]->dims[i];
+  }
+  dims[0].size = k;
+  assert(inputs[0]->dims[0].degree == 1);
+  assert(inputs[0]->dims[0].parallel_idx == -1);
+  //   outputs[0] = model.create_parallel_tensor_legion_ordering(
+  //       numdim, dims, _input->data_type, this, 0 /*owner_idx*/);
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      numdim, dims, DT_INT32, this, 0 /*owner_idx*/);
+}
+
+ArgTopK::ArgTopK(FFModel &model,
+                 ArgTopK const &other,
+                 const ParallelTensor input)
+    : ArgTopK(model, input, other.k, other.sorted, other.name) {}
+
+ArgTopK::ArgTopK(FFModel &model,
+                 ArgTopKParams const &params,
+                 const ParallelTensor input,
+                 char const *name)
+    : ArgTopK(model, input, params.k, params.sorted, name) {}
+
+void ArgTopK::init_inference(FFModel const &ff,
+                             std::vector<ParallelTensor> const &batch_inputs,
+                             std::vector<ParallelTensor> const &batch_outputs,
+                             MachineView const *mv) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, view);
+  IndexLauncher launcher(ARG_TOPK_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(ArgTopK)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  //   launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
+  //                                                     0 /*projection id*/,
+  //                                                     WRITE_ONLY,
+  //                                                     EXCLUSIVE,
+  //                                                     batch_outputs[1]->region));
+  //   launcher.add_field(2, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, view);
+}
+
+void ArgTopK::init(FFModel const &ff) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(ARG_TOPK_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(ArgTopK)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  //   launcher.add_region_requirement(RegionRequirement(outputs[1]->part,
+  //                                                     0 /*projection id*/,
+  //                                                     WRITE_ONLY,
+  //                                                     EXCLUSIVE,
+  //                                                     outputs[1]->region));
+  //   launcher.add_field(2, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
+OpMeta *ArgTopK::init_task(Task const *task,
+                           std::vector<PhysicalRegion> const &regions,
+                           Context ctx,
+                           Runtime *runtime) {
+  ArgTopK *topk = (ArgTopK *)task->args;
+  FFHandler handle = *((FFHandler *)task->local_args);
+  ArgTopKMeta *m = new ArgTopKMeta(handle);
+  m->profiling = topk->profiling;
+  m->sorted = topk->sorted;
+  return m;
+}
+
+void ArgTopK::forward(FFModel const &ff) {
+  // ArgTopK does not support forward
+  assert(false);
+}
+
+FutureMap ArgTopK::inference(FFModel const &ff,
+                             BatchConfig const &bc,
+                             std::vector<ParallelTensor> const &batch_inputs,
+                             std::vector<ParallelTensor> const &batch_outputs,
+                             MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, view);
+  size_t machine_view_hash = view->hash();
+  /* std::cout << "ArgTopK op machine_view: " << *(MachineView const *)mv
+            << std::endl; */
+  IndexLauncher launcher(ARG_TOPK_INF_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  //   launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
+  //                                                     0 /*projection id*/,
+  //                                                     WRITE_ONLY,
+  //                                                     EXCLUSIVE,
+  //                                                     batch_outputs[1]->region));
+  //   launcher.add_field(2, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+InferenceResult
+    ArgTopK::inference_task(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+  // const ArgTopK* topk = (const ArgTopK*) task->args;
+  ArgTopKMeta const *m = *((ArgTopKMeta **)task->local_args);
+  Domain in1_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  //   Domain out1_domain = runtime->get_index_space_domain(
+  //       ctx, task->regions[1].region.get_index_space());
+  Domain out2_domain = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+  int numdims = in1_domain.get_dim();
+  assert(out2_domain.get_dim() == numdims);
+
+  int in_cols = in1_domain.hi()[0] - in1_domain.lo()[0] + 1;
+  // int out1_cols = out1_domain.hi()[0] - out1_domain.lo()[0] + 1;
+  int out2_cols = out2_domain.hi()[0] - out2_domain.lo()[0] + 1;
+
+  // assert(out1_domain == out2_domain);
+  for (int i = 1; i < in1_domain.get_dim(); i++) {
+    assert(in1_domain.lo()[i] == out2_domain.lo()[i]);
+    assert(in1_domain.hi()[i] == out2_domain.hi()[i]);
+  }
+  float const *in_ptr = helperGetTensorPointerRO<float>(
+      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  //   float *value_ptr = helperGetTensorPointerWO<float>(
+  //       regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  int *index_ptr = helperGetTensorPointerWO<int>(
+      regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  int length = in1_domain.hi()[0] - in1_domain.lo()[0] + 1;
+  int k =
+      out2_domain.hi()[0] - out2_domain.lo()[0] + 1; /*TODO: This prints to 5*/
+  size_t batch_size = in1_domain.get_volume() / length;
+  assert(out2_domain.get_volume() / k == batch_size);
+
+  ArgTopK::forward_kernel_wrapper(
+      m, in_ptr, index_ptr, batch_size, length, k, m->sorted);
+
+  InferenceResult ir;
+  download_tensor<int>(index_ptr, ir.results, batch_size);
+  return ir;
+}
+
+void ArgTopK::backward(FFModel const &ff) {
+  // ArgTopK does not support backward
+  assert(false);
+}
+
+void ArgTopK::serialize(Legion::Serializer &sez) const {
+  sez.serialize(this->k);
+  sez.serialize(this->sorted);
+}
+
+Node ArgTopK::deserialize(FFModel &ff,
+                          Legion::Deserializer &dez,
+                          ParallelTensor inputs[],
+                          int num_inputs) {
+  assert(num_inputs == 1);
+  int k;
+  bool sorted;
+  dez.deserialize(k);
+  dez.deserialize(sorted);
+  ArgTopKParams params;
+  params.k = k;
+  params.sorted = sorted;
+  return ff.get_or_create_node<ArgTopK>(inputs[0], params);
+}
+
+Op *ArgTopK::materialize(FFModel &ff,
+                         ParallelTensor inputs[],
+                         int num_inputs) const {
+  ArgTopKParams params = get_params();
+  return new ArgTopK(ff, params, inputs[0], this->name);
+}
+
+bool ArgTopK::measure_operator_cost(Simulator *sim,
+                                    MachineView const &mv,
+                                    CostMetrics &cost_metrics) const {
+  return false;
+}
+
+}; // namespace FlexFlow
+
+namespace std {
+size_t hash<FlexFlow::ArgTopKParams>::operator()(
+    FlexFlow::ArgTopKParams const &params) const {
+  size_t key = 0;
+  hash_combine(key, params.k);
+  hash_combine(key, params.sorted);
+  return key;
+}
+}; // namespace std
diff --git a/src/ops/arg_topk.cpp b/src/ops/arg_topk.cpp
new file mode 100644
index 0000000000..cc43967894
--- /dev/null
+++ b/src/ops/arg_topk.cpp
@@ -0,0 +1,450 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/arg_topk.h"
+#include "flexflow/utils/hip_helper.h"
+#include <hip/hip_runtime.h>
+
+namespace FlexFlow {
+// declare Legion names
+using Legion::coord_t;
+
+enum class HeapType { kMinHeap, kMaxHeap };
+enum class PreferIndices { kLower, kHigher };
+
+template <typename T>
+struct Entry {
+  int index;
+  T value;
+};
+
+template <typename T>
+struct LinearData {
+  typedef Entry<T> Entry;
+
+  __device__ Entry &operator[](std::size_t index) const {
+    return data[index];
+  }
+
+  __device__ int get_index(int i) const {
+    return data[i].index;
+  }
+  __device__ T get_value(int i) const {
+    return data[i].value;
+  }
+
+  Entry *const data;
+};
+
+template <typename T>
+struct IndirectLinearData {
+  typedef Entry<T> Entry;
+
+  __device__ Entry &operator[](std::size_t index) const {
+    return data[index];
+  }
+
+  __device__ int get_index(int i) const {
+    return backing_data[data[i].index].index;
+  }
+  __device__ T get_value(int i) const {
+    return data[i].value;
+  }
+
+  Entry *const data;
+  Entry *const backing_data;
+};
+
+template <typename T>
+struct StridedData {
+  typedef Entry<T> Entry;
+
+  __device__ Entry &operator[](std::size_t index) const {
+    return data[index * blockDim.x + threadIdx.x];
+  }
+
+  __device__ int get_index(int i) const {
+    return (*this)[i].index;
+  }
+  __device__ T get_value(int i) const {
+    return (*this)[i].value;
+  }
+
+  Entry *const data;
+};
+
+// A heap of Entry<T> that can either work as a min-heap or as a max-heap.
+template <HeapType heapType,
+          PreferIndices preferIndices,
+          template <typename>
+          class Data,
+          typename T>
+struct IndexedHeap {
+  typedef typename Data<T>::Entry Entry;
+  Data<T> const data;
+  __device__ IndexedHeap(Data<T> const &d) : data(d) {}
+
+  __device__ bool is_above(int left, int right) {
+    T left_value = data.get_value(left);
+    T right_value = data.get_value(right);
+    if (left_value == right_value) {
+      if (preferIndices == PreferIndices::kLower) {
+        return data.get_index(left) < data.get_index(right);
+      } else {
+        return data.get_index(left) > data.get_index(right);
+      }
+    }
+    if (heapType == HeapType::kMinHeap) {
+      return left_value < right_value;
+    } else {
+      return left_value > right_value;
+    }
+  }
+
+  __device__ void assign(int i, Entry const &entry) {
+    data[i] = entry;
+  }
+
+  __device__ void push_up(int i) {
+    int child = i;
+    int parent;
+    for (; child > 0; child = parent) {
+      parent = (child - 1) / 2;
+      if (!is_above(child, parent)) {
+        // Heap property satisfied.
+        break;
+      }
+      swap(child, parent);
+    }
+  }
+
+  __device__ void swap(int a, int b) {
+    auto tmp = data[b];
+    data[b] = data[a];
+    data[a] = tmp;
+  }
+
+  __device__ void push_root_down(int k) {
+    push_down(0, k);
+  }
+
+  // MAX-HEAPIFY in Cormen
+  __device__ void push_down(int node, int k) {
+    while (true) {
+      int const left = 2 * node + 1;
+      int const right = left + 1;
+      int smallest = node;
+      if (left < k && is_above(left, smallest)) {
+        smallest = left;
+      }
+      if (right < k && is_above(right, smallest)) {
+        smallest = right;
+      }
+      if (smallest == node) {
+        break;
+      }
+      swap(smallest, node);
+      node = smallest;
+    }
+  }
+
+  // BUILD-MAX-HEAPIFY in Cormen
+  __device__ void build(int k) {
+    for (int node = (k - 1) / 2; node >= 0; node--) {
+      push_down(node, k);
+    }
+  }
+
+  // HEAP-EXTRACT-MAX in Cormen
+  __device__ void remove_root(int k) {
+    data[0] = data[k - 1];
+    push_root_down(k - 1);
+  }
+
+  // in-place HEAPSORT in Cormen
+  // This method destroys the heap property.
+  __device__ void sort(int k) {
+    for (int slot = k - 1; slot > 0; slot--) {
+      // This is like remove_root but we insert the element at the end.
+      swap(slot, 0);
+      // Heap is now an element smaller.
+      push_root_down(/*k=*/slot);
+    }
+  }
+
+  __device__ void replace_root(Entry const &entry, int k) {
+    data[0] = entry;
+    push_root_down(k);
+  }
+
+  __device__ Entry const &root() {
+    return data[0];
+  }
+};
+
+template <HeapType heapType,
+          PreferIndices preferIndices,
+          template <typename>
+          class Data,
+          typename T>
+__device__ IndexedHeap<heapType, preferIndices, Data, T>
+    make_indexed_heap(typename Data<T>::Entry *data) {
+  return IndexedHeap<heapType, preferIndices, Data, T>{Data<T>{data}};
+}
+
+// heapArgTopK walks over [input, input+length) with `step_size` stride starting
+// at `start_index`. It builds a top-`k` heap that is stored in `heap_entries`
+// using `Accessor` to access elements in `heap_entries`. If sorted=true, the
+// elements will be sorted at the end.
+template <typename T, template <typename> class Data = LinearData>
+__device__ void heapArgTopK(T const *__restrict__ input,
+                            int length,
+                            int k,
+                            Entry<T> *__restrict__ heap_entries,
+                            bool sorted = false,
+                            int start_index = 0,
+                            int step_size = 1) {
+  assert(k <= length);
+
+  auto heap =
+      make_indexed_heap<HeapType::kMinHeap, PreferIndices::kHigher, Data, T>(
+          heap_entries);
+
+  int heap_end_index = start_index + k * step_size;
+  if (heap_end_index > length) {
+    heap_end_index = length;
+  }
+  // Initialize the min-heap.
+  for (int index = start_index, slot = 0; index < heap_end_index;
+       index += step_size, slot++) {
+    heap.assign(slot, {index, input[index]});
+  }
+
+  heap.build(k);
+
+  // Now iterate over the remaining items.
+  // If an item is smaller than the min element, it is not amongst the top k.
+  // Otherwise, replace the min element with it and push upwards.
+  for (int index = heap_end_index; index < length; index += step_size) {
+    // We prefer elements with lower indices. This is given here.
+    // Later elements automatically have higher indices, so can be discarded.
+    if (input[index] > heap.root().value) {
+      // This element should replace the min.
+      heap.replace_root({index, input[index]}, k);
+    }
+  }
+
+  // Sort if wanted.
+  if (sorted) {
+    heap.sort(k);
+  }
+}
+
+// mergeShards performs a top-k merge on `num_shards` many sorted streams that
+// are sorted and stored in `entries` in a strided way:
+// |s_1 1st|s_2 1st|...s_{num_shards} 1st|s_1 2nd|s_2 2nd|...
+// The overall top k elements are written to `top_k_values` and their indices
+// to top_k_indices.
+// `top_k_heap` is used as temporary storage for the merge heap.
+template <typename T>
+__device__ void mergeShards(int num_shards,
+                            int k,
+                            Entry<T> *__restrict__ entries,
+                            Entry<T> *__restrict__ top_k_heap,
+                            // T *top_k_values,
+                            int *top_k_indices) {
+  // If k < num_shards, we can use a min-heap with k elements to get the top k
+  // of the sorted blocks.
+  // If k > num_shards, we can initialize a min-heap with the top element from
+  // each sorted block.
+  int const heap_size = k < num_shards ? k : num_shards;
+
+  // Min-heap part.
+  {
+    auto min_heap = IndexedHeap<HeapType::kMinHeap,
+                                PreferIndices::kHigher,
+                                IndirectLinearData,
+                                T>{IndirectLinearData<T>{top_k_heap, entries}};
+    // Initialize the heap as a min-heap.
+    for (int slot = 0; slot < heap_size; slot++) {
+      min_heap.assign(slot, {slot, entries[slot].value});
+    }
+    min_heap.build(heap_size);
+
+    // Now perform top k with the remaining shards (if num_shards > heap_size).
+    for (int shard = heap_size; shard < num_shards; shard++) {
+      auto const entry = entries[shard];
+      auto const root = min_heap.root();
+      if (entry.value < root.value) {
+        continue;
+      }
+      if (entry.value == root.value &&
+          entry.index > entries[root.index].index) {
+        continue;
+      }
+      // This element should replace the min.
+      min_heap.replace_root({shard, entry.value}, heap_size);
+    }
+  }
+
+  // Max-part.
+  {
+    // Turn the min-heap into a max-heap in-place.
+    auto max_heap = IndexedHeap<HeapType::kMaxHeap,
+                                PreferIndices::kLower,
+                                IndirectLinearData,
+                                T>{IndirectLinearData<T>{top_k_heap, entries}};
+    // Heapify into a max heap.
+    max_heap.build(heap_size);
+
+    // Now extract the minimum k-1 times.
+    // k is treated specially.
+    int const last_k = k - 1;
+    for (int rank = 0; rank < last_k; rank++) {
+      Entry<T> const &max_element = max_heap.root();
+      // top_k_values[rank] = max_element.value;
+      int shard_index = max_element.index;
+      top_k_indices[rank] = entries[shard_index].index;
+      int next_shard_index = shard_index + num_shards;
+      // For rank < k-1, each top k heap still contains at least 1 element,
+      // so we can draw a replacement.
+      max_heap.replace_root({next_shard_index, entries[next_shard_index].value},
+                            heap_size);
+    }
+
+    // rank == last_k.
+    Entry<T> const &max_element = max_heap.root();
+    // top_k_values[last_k] = max_element.value;
+    int shard_index = max_element.index;
+    top_k_indices[last_k] = entries[shard_index].index;
+  }
+}
+
+template <typename T>
+__global__ void arg_topk_forward_kernel(T const *__restrict__ input,
+                                        size_t shared_memory_size,
+                                        int length,
+                                        int k,
+                                        bool sorted,
+                                        // T *__restrict__ output,
+                                        int *__restrict__ indices) {
+  __shared__ char shared_memory[48 << 10];
+  int const batch_index = blockIdx.x;
+  T const *batch_input = input + batch_index * length;
+  int const thread_index = threadIdx.x;
+  int const thread_count = blockDim.x;
+  Entry<T> *shared_entries = (Entry<T> *)shared_memory;
+  heapArgTopK<T, StridedData>(
+      batch_input, length, k, shared_entries, true, thread_index, thread_count);
+  __syncthreads();
+  if (thread_index == 0) {
+    int const offset = batch_index * k;
+    // auto batch_output = output + offset;
+    auto batch_indices = indices + offset;
+    Entry<T> *top_k_heap = shared_entries + thread_count * k;
+    mergeShards(thread_count,
+                k,
+                shared_entries,
+                top_k_heap,
+                // batch_output,
+                batch_indices);
+  }
+}
+
+/*static*/
+void ArgTopK::forward_kernel(ArgTopKMeta const *m,
+                             float const *input_ptr,
+                             // float *output_ptr,
+                             int *indices_ptr,
+                             size_t batch_size,
+                             int length,
+                             int k,
+                             bool sorted,
+                             hipStream_t stream) {
+  // Adopted from TensorFlow's ArgTopK implementation
+  // https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/kernels/topk_op_gpu.h
+  int num_shards = 0;
+  {
+    constexpr auto shared_memory_size = 48 << 10;
+    auto const heap_size = k * sizeof(Entry<float>);
+    // shared_memory_size = (num_shards + 1) * heap_size <=>
+    num_shards = shared_memory_size / heap_size - 1;
+    assert(num_shards > 0);
+    if (num_shards > CUDA_NUM_THREADS) {
+      num_shards = CUDA_NUM_THREADS;
+    }
+  }
+  // We are limited by the amount of shared memory we have per block.
+  size_t shared_memory_size = (num_shards + 1) * k * sizeof(Entry<float>);
+  // size_t num_blocks = (batch_size + num_shards - 1) / num_shards;
+  size_t num_blocks = batch_size;
+  assert(num_shards >= (size_t)k);
+  num_shards = k;
+  hipLaunchKernelGGL(arg_topk_forward_kernel,
+                     num_blocks,
+                     num_shards,
+                     0,
+                     stream,
+                     input_ptr,
+                     shared_memory_size,
+                     length,
+                     k,
+                     sorted,
+                     // output_ptr,
+                     indices_ptr);
+}
+
+/*static*/
+void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
+                                     float const *input_ptr,
+                                     // float *output_ptr,
+                                     int *indices_ptr,
+                                     size_t batch_size,
+                                     int length,
+                                     int k,
+                                     bool sorted) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    hipEventCreate(&t_start);
+    hipEventCreate(&t_end);
+    hipEventRecord(t_start, stream);
+  }
+
+  ArgTopK::forward_kernel(m,
+                          input_ptr,
+                          // output_ptr,
+                          indices_ptr,
+                          batch_size,
+                          length,
+                          k,
+                          sorted,
+                          stream);
+
+  if (m->profiling) {
+    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    hipEventDestroy(t_start);
+    hipEventDestroy(t_end);
+  }
+}
+
+ArgTopKMeta::ArgTopKMeta(FFHandler handler) : OpMeta(handler) {}
+
+}; // namespace FlexFlow
diff --git a/src/ops/arg_topk.cu b/src/ops/arg_topk.cu
new file mode 100644
index 0000000000..82fc113d4f
--- /dev/null
+++ b/src/ops/arg_topk.cu
@@ -0,0 +1,446 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/arg_topk.h"
+#include "flexflow/utils/cuda_helper.h"
+
+namespace FlexFlow {
+// declare Legion names
+using Legion::coord_t;
+
+enum class HeapType { kMinHeap, kMaxHeap };
+enum class PreferIndices { kLower, kHigher };
+
+template <typename T>
+struct Entry {
+  int index;
+  T value;
+};
+
+template <typename T>
+struct LinearData {
+  typedef Entry<T> Entry;
+
+  __device__ Entry &operator[](std::size_t index) const {
+    return data[index];
+  }
+
+  __device__ int get_index(int i) const {
+    return data[i].index;
+  }
+  __device__ T get_value(int i) const {
+    return data[i].value;
+  }
+
+  Entry *const data;
+};
+
+template <typename T>
+struct IndirectLinearData {
+  typedef Entry<T> Entry;
+
+  __device__ Entry &operator[](std::size_t index) const {
+    return data[index];
+  }
+
+  __device__ int get_index(int i) const {
+    return backing_data[data[i].index].index;
+  }
+  __device__ T get_value(int i) const {
+    return data[i].value;
+  }
+
+  Entry *const data;
+  Entry *const backing_data;
+};
+
+template <typename T>
+struct StridedData {
+  typedef Entry<T> Entry;
+
+  __device__ Entry &operator[](std::size_t index) const {
+    return data[index * blockDim.x + threadIdx.x];
+  }
+
+  __device__ int get_index(int i) const {
+    return (*this)[i].index;
+  }
+  __device__ T get_value(int i) const {
+    return (*this)[i].value;
+  }
+
+  Entry *const data;
+};
+
+// A heap of Entry<T> that can either work as a min-heap or as a max-heap.
+template <HeapType heapType,
+          PreferIndices preferIndices,
+          template <typename>
+          class Data,
+          typename T>
+struct IndexedHeap {
+  typedef typename Data<T>::Entry Entry;
+  Data<T> const data;
+  __device__ IndexedHeap(Data<T> const &d) : data(d) {}
+
+  __device__ bool is_above(int left, int right) {
+    T left_value = data.get_value(left);
+    T right_value = data.get_value(right);
+    if (left_value == right_value) {
+      if (preferIndices == PreferIndices::kLower) {
+        return data.get_index(left) < data.get_index(right);
+      } else {
+        return data.get_index(left) > data.get_index(right);
+      }
+    }
+    if (heapType == HeapType::kMinHeap) {
+      return left_value < right_value;
+    } else {
+      return left_value > right_value;
+    }
+  }
+
+  __device__ void assign(int i, Entry const &entry) {
+    data[i] = entry;
+  }
+
+  __device__ void push_up(int i) {
+    int child = i;
+    int parent;
+    for (; child > 0; child = parent) {
+      parent = (child - 1) / 2;
+      if (!is_above(child, parent)) {
+        // Heap property satisfied.
+        break;
+      }
+      swap(child, parent);
+    }
+  }
+
+  __device__ void swap(int a, int b) {
+    auto tmp = data[b];
+    data[b] = data[a];
+    data[a] = tmp;
+  }
+
+  __device__ void push_root_down(int k) {
+    push_down(0, k);
+  }
+
+  // MAX-HEAPIFY in Cormen
+  __device__ void push_down(int node, int k) {
+    while (true) {
+      int const left = 2 * node + 1;
+      int const right = left + 1;
+      int smallest = node;
+      if (left < k && is_above(left, smallest)) {
+        smallest = left;
+      }
+      if (right < k && is_above(right, smallest)) {
+        smallest = right;
+      }
+      if (smallest == node) {
+        break;
+      }
+      swap(smallest, node);
+      node = smallest;
+    }
+  }
+
+  // BUILD-MAX-HEAPIFY in Cormen
+  __device__ void build(int k) {
+    for (int node = (k - 1) / 2; node >= 0; node--) {
+      push_down(node, k);
+    }
+  }
+
+  // HEAP-EXTRACT-MAX in Cormen
+  __device__ void remove_root(int k) {
+    data[0] = data[k - 1];
+    push_root_down(k - 1);
+  }
+
+  // in-place HEAPSORT in Cormen
+  // This method destroys the heap property.
+  __device__ void sort(int k) {
+    for (int slot = k - 1; slot > 0; slot--) {
+      // This is like remove_root but we insert the element at the end.
+      swap(slot, 0);
+      // Heap is now an element smaller.
+      push_root_down(/*k=*/slot);
+    }
+  }
+
+  __device__ void replace_root(Entry const &entry, int k) {
+    data[0] = entry;
+    push_root_down(k);
+  }
+
+  __device__ Entry const &root() {
+    return data[0];
+  }
+};
+
+template <HeapType heapType,
+          PreferIndices preferIndices,
+          template <typename>
+          class Data,
+          typename T>
+__device__ IndexedHeap<heapType, preferIndices, Data, T>
+    make_indexed_heap(typename Data<T>::Entry *data) {
+  return IndexedHeap<heapType, preferIndices, Data, T>{Data<T>{data}};
+}
+
+// heapArgTopK walks over [input, input+length) with `step_size` stride starting
+// at `start_index`. It builds a top-`k` heap that is stored in `heap_entries`
+// using `Accessor` to access elements in `heap_entries`. If sorted=true, the
+// elements will be sorted at the end.
+template <typename T, template <typename> class Data = LinearData>
+__device__ void heapArgTopK(T const *__restrict__ input,
+                            int length,
+                            int k,
+                            Entry<T> *__restrict__ heap_entries,
+                            bool sorted = false,
+                            int start_index = 0,
+                            int step_size = 1) {
+  assert(k <= length);
+
+  auto heap =
+      make_indexed_heap<HeapType::kMinHeap, PreferIndices::kHigher, Data, T>(
+          heap_entries);
+
+  int heap_end_index = start_index + k * step_size;
+  if (heap_end_index > length) {
+    heap_end_index = length;
+  }
+  // Initialize the min-heap.
+  for (int index = start_index, slot = 0; index < heap_end_index;
+       index += step_size, slot++) {
+    heap.assign(slot, {index, input[index]});
+  }
+
+  heap.build(k);
+
+  // Now iterate over the remaining items.
+  // If an item is smaller than the min element, it is not amongst the top k.
+  // Otherwise, replace the min element with it and push upwards.
+  for (int index = heap_end_index; index < length; index += step_size) {
+    // We prefer elements with lower indices. This is given here.
+    // Later elements automatically have higher indices, so can be discarded.
+    if (input[index] > heap.root().value) {
+      // This element should replace the min.
+      heap.replace_root({index, input[index]}, k);
+    }
+  }
+
+  // Sort if wanted.
+  if (sorted) {
+    heap.sort(k);
+  }
+}
+
+// mergeShards performs a top-k merge on `num_shards` many sorted streams that
+// are sorted and stored in `entries` in a strided way:
+// |s_1 1st|s_2 1st|...s_{num_shards} 1st|s_1 2nd|s_2 2nd|...
+// The overall top k elements are written to `top_k_values` and their indices
+// to top_k_indices.
+// `top_k_heap` is used as temporary storage for the merge heap.
+template <typename T>
+__device__ void mergeShards(int num_shards,
+                            int k,
+                            Entry<T> *__restrict__ entries,
+                            Entry<T> *__restrict__ top_k_heap,
+                            // T *top_k_values,
+                            int *top_k_indices) {
+  // If k < num_shards, we can use a min-heap with k elements to get the top k
+  // of the sorted blocks.
+  // If k > num_shards, we can initialize a min-heap with the top element from
+  // each sorted block.
+  int const heap_size = k < num_shards ? k : num_shards;
+
+  // Min-heap part.
+  {
+    auto min_heap = IndexedHeap<HeapType::kMinHeap,
+                                PreferIndices::kHigher,
+                                IndirectLinearData,
+                                T>{IndirectLinearData<T>{top_k_heap, entries}};
+    // Initialize the heap as a min-heap.
+    for (int slot = 0; slot < heap_size; slot++) {
+      min_heap.assign(slot, {slot, entries[slot].value});
+    }
+    min_heap.build(heap_size);
+
+    // Now perform top k with the remaining shards (if num_shards > heap_size).
+    for (int shard = heap_size; shard < num_shards; shard++) {
+      auto const entry = entries[shard];
+      auto const root = min_heap.root();
+      if (entry.value < root.value) {
+        continue;
+      }
+      if (entry.value == root.value &&
+          entry.index > entries[root.index].index) {
+        continue;
+      }
+      // This element should replace the min.
+      min_heap.replace_root({shard, entry.value}, heap_size);
+    }
+  }
+
+  // Max-part.
+  {
+    // Turn the min-heap into a max-heap in-place.
+    auto max_heap = IndexedHeap<HeapType::kMaxHeap,
+                                PreferIndices::kLower,
+                                IndirectLinearData,
+                                T>{IndirectLinearData<T>{top_k_heap, entries}};
+    // Heapify into a max heap.
+    max_heap.build(heap_size);
+
+    // Now extract the minimum k-1 times.
+    // k is treated specially.
+    int const last_k = k - 1;
+    for (int rank = 0; rank < last_k; rank++) {
+      Entry<T> const &max_element = max_heap.root();
+      // top_k_values[rank] = max_element.value;
+      int shard_index = max_element.index;
+      top_k_indices[rank] = entries[shard_index].index;
+      int next_shard_index = shard_index + num_shards;
+      // For rank < k-1, each top k heap still contains at least 1 element,
+      // so we can draw a replacement.
+      max_heap.replace_root({next_shard_index, entries[next_shard_index].value},
+                            heap_size);
+    }
+
+    // rank == last_k.
+    Entry<T> const &max_element = max_heap.root();
+    // top_k_values[last_k] = max_element.value;
+    int shard_index = max_element.index;
+    top_k_indices[last_k] = entries[shard_index].index;
+  }
+}
+
+template <typename T>
+__global__ void arg_topk_forward_kernel(T const *__restrict__ input,
+                                        size_t shared_memory_size,
+                                        int length,
+                                        int k,
+                                        bool sorted,
+                                        // T *__restrict__ output,
+                                        int *__restrict__ indices) {
+  __shared__ char shared_memory[48 << 10];
+  int const batch_index = blockIdx.x;
+  T const *batch_input = input + batch_index * length;
+  int const thread_index = threadIdx.x;
+  int const thread_count = blockDim.x;
+  Entry<T> *shared_entries = (Entry<T> *)shared_memory;
+  heapArgTopK<T, StridedData>(
+      batch_input, length, k, shared_entries, true, thread_index, thread_count);
+  __syncthreads();
+  if (thread_index == 0) {
+    int const offset = batch_index * k;
+    // auto batch_output = output + offset;
+    auto batch_indices = indices + offset;
+    Entry<T> *top_k_heap = shared_entries + thread_count * k;
+    mergeShards(thread_count,
+                k,
+                shared_entries,
+                top_k_heap,
+                // batch_output,
+                batch_indices);
+  }
+}
+
+/*static*/
+void ArgTopK::forward_kernel(ArgTopKMeta const *m,
+                             float const *input_ptr,
+                             // float *output_ptr,
+                             int *indices_ptr,
+                             size_t batch_size,
+                             int length,
+                             int k,
+                             bool sorted,
+                             cudaStream_t stream) {
+  // Adopted from TensorFlow's ArgTopK implementation
+  // https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/kernels/topk_op_gpu.h
+  int num_shards = 0;
+  {
+    constexpr auto shared_memory_size = 48 << 10;
+    auto const heap_size = k * sizeof(Entry<float>);
+    // shared_memory_size = (num_shards + 1) * heap_size <=>
+    num_shards = shared_memory_size / heap_size - 1;
+    assert(num_shards > 0);
+    if (num_shards > CUDA_NUM_THREADS) {
+      num_shards = CUDA_NUM_THREADS;
+    }
+  }
+  // We are limited by the amount of shared memory we have per block.
+  size_t shared_memory_size = (num_shards + 1) * k * sizeof(Entry<float>);
+  // size_t num_blocks = (batch_size + num_shards - 1) / num_shards;
+  size_t num_blocks = batch_size;
+  assert(num_shards >= (size_t)k);
+  num_shards = k;
+  arg_topk_forward_kernel<<<num_blocks, num_shards, 0, stream>>>(
+      input_ptr,
+      shared_memory_size,
+      length,
+      k,
+      sorted,
+      // output_ptr,
+      indices_ptr);
+}
+
+/*static*/
+void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
+                                     float const *input_ptr,
+                                     // float *output_ptr,
+                                     int *indices_ptr,
+                                     size_t batch_size,
+                                     int length,
+                                     int k,
+                                     bool sorted) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+
+  ArgTopK::forward_kernel(m,
+                          input_ptr,
+                          // output_ptr,
+                          indices_ptr,
+                          batch_size,
+                          length,
+                          k,
+                          sorted,
+                          stream);
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[ArgTopK] forward time = %.2lfms\n", elapsed);
+  }
+}
+
+ArgTopKMeta::ArgTopKMeta(FFHandler handler) : OpMeta(handler) {}
+
+}; // namespace FlexFlow
diff --git a/src/ops/embedding.cc b/src/ops/embedding.cc
index 3b53213b91..8dca314c2e 100644
--- a/src/ops/embedding.cc
+++ b/src/ops/embedding.cc
@@ -369,6 +369,46 @@ void Embedding::init(FFModel const &ff) {
   set_opmeta_from_futuremap(ff, fm);
 }
 
+void Embedding::init_inference(FFModel const &ff,
+                               std::vector<ParallelTensor> const &batch_inputs,
+                               std::vector<ParallelTensor> const &batch_outputs,
+                               MachineView const *mv) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, view);
+
+  IndexLauncher launcher(EMBED_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(Embedding)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  // regions[2]: weight
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(1, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, view);
+}
+
 OpMeta *Embedding::init_task(Task const *task,
                              std::vector<PhysicalRegion> const &regions,
                              Context ctx,
@@ -419,6 +459,53 @@ void Embedding::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
+FutureMap Embedding::inference(FFModel const &ff,
+                               BatchConfig const &bc,
+                               std::vector<ParallelTensor> const &batch_inputs,
+                               std::vector<ParallelTensor> const &batch_outputs,
+                               MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, view);
+  size_t machine_view_hash = view->hash();
+
+  IndexLauncher launcher(EMBED_FWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  // regions[0]: input
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  // regions[1]: output
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region,
+                                                    MAP_TO_ZC_MEMORY));
+  launcher.add_field(1, FID_DATA);
+  // regions[2]: weight
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(2, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
 /*
   regions[0](I): input
   regions[1](O): output
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index c1c9ca8f40..093e7d6de3 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -30,12 +30,14 @@ BatchConfig::BatchConfig() {
     request_completed[i] = true;
     num_processing_tokens[i] = 0;
     max_sequence_length[i] = 0;
+    initial_length[i] = 0;
   }
   token2ids.num_samples = 0;
   for (int i = 0; i < MAX_NUM_TOKENS; i++) {
     token2ids.guids[i] = SIZE_MAX;
     token2ids.token_indexes[i].request_index = SIZE_MAX;
     token2ids.token_indexes[i].token_position = SIZE_MAX;
+    token2ids.token_indexes[i].initial_length = SIZE_MAX;
   }
   update_num_active_requests_tokens();
 }
@@ -80,16 +82,17 @@ int BatchConfig::update_results(InferenceResult const &ir) {
 }
 
 bool BatchConfig::register_new_request(size_t guid,
-                                       int initial_length,
+                                       int initial_len,
                                        int tokens_to_generate) {
   cached_results = false;
-  assert(initial_length > 0 && tokens_to_generate > 0);
+  assert(initial_len > 0 && tokens_to_generate > 0);
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
     if (request_completed[i]) {
-      log_bc.print("[NewRequest] guid(%zu) length(%d)", guid, initial_length);
+      log_bc.print("[NewRequest] guid(%zu) length(%d)", guid, initial_len);
       token_start_idx[i] = 0;
-      token_last_available_idx[i] = initial_length - 1;
-      max_sequence_length[i] = initial_length + tokens_to_generate;
+      token_last_available_idx[i] = initial_len - 1;
+      max_sequence_length[i] = initial_len + tokens_to_generate;
+      initial_length[i] = initial_len;
       request_guid[i] = guid;
       num_processing_tokens[i] = 0;
       request_completed[i] = false;
@@ -132,6 +135,7 @@ void BatchConfig::update_num_active_requests_tokens() {
         token2ids.token_indexes[num_tokens].token_position =
             token_start_idx[i] + j;
         token2ids.token_indexes[num_tokens].request_index = i;
+        token2ids.token_indexes[num_tokens].initial_length = initial_length[i];
         num_tokens++;
       }
     }
@@ -221,6 +225,11 @@ void BatchConfig::print() const {
   for (int i = 0; i < num_tokens; i++) {
     printf("%lu ", token2ids.token_indexes[i].token_position);
   }
+
+  printf("token2ids.token_indexes[i].initial_length: ");
+  for (int i = 0; i < num_tokens; i++) {
+    printf("%lu ", token2ids.token_indexes[i].initial_length);
+  }
   printf("\n");
   printf("---------------------------------------------------------------------"
          "---------\n");
diff --git a/src/runtime/cuda_helper.cu b/src/runtime/cuda_helper.cu
index 47b0ff74b4..edd5b18e0f 100644
--- a/src/runtime/cuda_helper.cu
+++ b/src/runtime/cuda_helper.cu
@@ -238,6 +238,17 @@ __host__ T *download_tensor(T const *ptr, size_t num_elements) {
   return host_ptr;
 }
 
+template <typename T>
+__host__ bool download_tensor(T const *ptr, T *dst, size_t num_elements) {
+  // device synchronize to make sure the data are ready
+  // checkCUDA(cudaDeviceSynchronize());
+  assert(dst != nullptr);
+  checkCUDA(
+      cudaMemcpy(dst, ptr, sizeof(T) * num_elements, cudaMemcpyDeviceToHost));
+  // checkCUDA(cudaDeviceSynchronize());
+  return true;
+}
+
 cudnnStatus_t cudnnSetTensorDescriptorFromDomain(cudnnTensorDescriptor_t tensor,
                                                  Domain domain) {
   int dims[MAX_TENSOR_DIM];
@@ -420,4 +431,15 @@ template __host__ double *download_tensor<double>(double const *ptr,
 template __host__ int32_t *download_tensor<int32_t>(int32_t const *ptr,
                                                     size_t num_elements);
 template __host__ int64_t *download_tensor<int64_t>(int64_t const *ptr,
-                                                    size_t num_elements);
\ No newline at end of file
+                                                    size_t num_elements);
+template __host__ bool
+    download_tensor<float>(float const *ptr, float *dst, size_t num_elements);
+template __host__ bool download_tensor<double>(double const *ptr,
+                                               double *dst,
+                                               size_t num_elements);
+template __host__ bool download_tensor<int32_t>(int32_t const *ptr,
+                                                int32_t *dst,
+                                                size_t num_elements);
+template __host__ bool download_tensor<int64_t>(int64_t const *ptr,
+                                                int64_t *dst,
+                                                size_t num_elements);
\ No newline at end of file
diff --git a/src/runtime/ffconst_utils.cc b/src/runtime/ffconst_utils.cc
index b762ad0dd5..7c9a68f3b5 100644
--- a/src/runtime/ffconst_utils.cc
+++ b/src/runtime/ffconst_utils.cc
@@ -113,6 +113,8 @@ std::string get_operator_type_name(OperatorType type) {
       return "Size";
     case OP_TOPK:
       return "TopK";
+    case OP_ARG_TOPK:
+      return "ArgTopK";
     case OP_WHERE:
       return "Where";
     case OP_CEIL:
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index 2ac815be6c..700da55eda 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -16,6 +16,7 @@
 #include "flexflow/dominators.h"
 #include "flexflow/ffconst_utils.h"
 #include "flexflow/ops/aggregate.h"
+#include "flexflow/ops/arg_topk.h"
 #include "flexflow/ops/attention.h"
 #include "flexflow/ops/batch_matmul.h"
 #include "flexflow/ops/cast.h"
@@ -2664,6 +2665,10 @@ void FFModel::deserialize_graph_optimal_view(
         node = TopK::deserialize(*this, dez, inputs, num_inputs);
         break;
       }
+      case OP_ARG_TOPK: {
+        node = ArgTopK::deserialize(*this, dez, inputs, num_inputs);
+        break;
+      }
       case OP_GROUP_BY: {
         node = Group_by::deserialize(*this, dez, inputs, num_inputs);
         break;
diff --git a/src/runtime/hip_helper.cpp b/src/runtime/hip_helper.cpp
index 215b635291..d6355def9a 100644
--- a/src/runtime/hip_helper.cpp
+++ b/src/runtime/hip_helper.cpp
@@ -248,6 +248,31 @@ __host__ void
   checkCUDA(hipHostFree(host_ptr));
 }
 
+template <typename T>
+__host__ T *download_tensor(T const *ptr, size_t num_elements) {
+  // device synchronize to make sure the data are ready
+  // checkCUDA(hipDeviceSynchronize());
+  T *host_ptr;
+  checkCUDA(hipHostMalloc(&host_ptr,
+                          sizeof(T) * num_elements,
+                          hipHostMallocPortable | hipHostMallocMapped));
+  checkCUDA(hipMemcpy(
+      host_ptr, ptr, sizeof(T) * num_elements, hipMemcpyDeviceToHost));
+  // checkCUDA(hipDeviceSynchronize());
+  return host_ptr;
+}
+
+template <typename T>
+__host__ bool download_tensor(T const *ptr, T *dst, size_t num_elements) {
+  // device synchronize to make sure the data are ready
+  // checkCUDA(hipDeviceSynchronize());
+  assert(dst != nullptr);
+  checkCUDA(
+      hipMemcpy(dst, ptr, sizeof(T) * num_elements, hipMemcpyDeviceToHost));
+  // checkCUDA(hipDeviceSynchronize());
+  return true;
+}
+
 miopenStatus_t
     cudnnSetTensorDescriptorFromDomain(miopenTensorDescriptor_t tensor,
                                        Domain domain) {
@@ -382,3 +407,23 @@ template __host__ void
     print_tensor<int32_t>(int32_t const *ptr, size_t rect, char const *prefix);
 template __host__ void
     print_tensor<int64_t>(int64_t const *ptr, size_t rect, char const *prefix);
+
+template __host__ float *download_tensor<float>(float const *ptr,
+                                                size_t num_elements);
+template __host__ double *download_tensor<double>(double const *ptr,
+                                                  size_t num_elements);
+template __host__ int32_t *download_tensor<int32_t>(int32_t const *ptr,
+                                                    size_t num_elements);
+template __host__ int64_t *download_tensor<int64_t>(int64_t const *ptr,
+                                                    size_t num_elements);
+template __host__ bool
+    download_tensor<float>(float const *ptr, float *dst, size_t num_elements);
+template __host__ bool download_tensor<double>(double const *ptr,
+                                               double *dst,
+                                               size_t num_elements);
+template __host__ bool download_tensor<int32_t>(int32_t const *ptr,
+                                                int32_t *dst,
+                                                size_t num_elements);
+template __host__ bool download_tensor<int64_t>(int64_t const *ptr,
+                                                int64_t *dst,
+                                                size_t num_elements);
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 7fcf1ef61f..30fa45e251 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -24,6 +24,7 @@
 #include "flexflow/mapper.h"
 #include "flexflow/ops/aggregate.h"
 #include "flexflow/ops/aggregate_spec.h"
+#include "flexflow/ops/arg_topk.h"
 #include "flexflow/ops/attention.h"
 #include "flexflow/ops/batch_matmul.h"
 #include "flexflow/ops/batch_norm.h"
@@ -2862,6 +2863,11 @@ Op *FFModel::create_operator_from_layer(
       operators.push_back(op);
       return op;
     }
+    case OP_ARG_TOPK: {
+      Op *op = ArgTopK::create_operator_from_layer(*this, layer, inputs);
+      operators.push_back(op);
+      return op;
+    }
     case OP_GROUP_BY: {
       Op *op = Group_by::create_operator_from_layer(*this, layer, inputs);
       operators.push_back(op);
@@ -4473,6 +4479,21 @@ void register_flexflow_internal_tasks() {
     Runtime::preregister_task_variant<TopK::backward_task>(
         registrar, "TopK Backward Task");
   }
+  // ArgTopk task
+  {
+    TaskVariantRegistrar registrar(ARG_TOPK_INIT_TASK_ID, "ArgTopK Init");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<OpMeta *, ArgTopK::init_task>(
+        registrar, "ArgTopK Init Task");
+  }
+  {
+    TaskVariantRegistrar registrar(ARG_TOPK_INF_TASK_ID, "ArgTopK Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<InferenceResult, ArgTopK::inference_task>(
+        registrar, "ArgTopK Inference Task");
+  }
   // Transpose task
   {
     TaskVariantRegistrar registrar(TRANSPOSE_INIT_TASK_ID, "Transpose Init");

From 81fa7a81688da03693aefcf1269bd20636fdb3da Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Sun, 2 Apr 2023 11:40:02 -0500
Subject: [PATCH 087/344] [Inference init] create multiple OpMeta, one for each
 batch (#668)

* [Inference init] create multiple OpMeta, one for each batch

* minor fix

* linting

---------

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
---
 include/flexflow/operator.h             |   8 +-
 src/ops/aggregate.cc                    |   6 +-
 src/ops/aggregate_spec.cc               |   6 +-
 src/ops/arg_topk.cc                     |   6 +-
 src/ops/attention.cc                    |   6 +-
 src/ops/element_binary.cc               |   6 +-
 src/ops/embedding.cc                    |   6 +-
 src/ops/experts.cc                      |   6 +-
 src/ops/group_by.cc                     |   5 +-
 src/ops/inc_multihead_self_attention.cc |   6 +-
 src/ops/inc_multihead_self_attention.cu |   2 +-
 src/ops/layer_norm.cc                   |   6 +-
 src/ops/linear.cc                       |   6 +-
 src/ops/noop.cc                         |   4 +-
 src/ops/softmax.cc                      |   6 +-
 src/ops/topk.cc                         |   6 +-
 src/runtime/inference_manager.cc        | 113 +++++++++++++-----------
 src/runtime/model.cc                    |  17 ++--
 18 files changed, 116 insertions(+), 105 deletions(-)

diff --git a/include/flexflow/operator.h b/include/flexflow/operator.h
index 56d4176e10..122850ec05 100644
--- a/include/flexflow/operator.h
+++ b/include/flexflow/operator.h
@@ -259,19 +259,19 @@ class Op {
   void set_argumentmap_for_init(FFModel const &ff, Legion::ArgumentMap &argmap);
   void set_argumentmap_for_init_inference(FFModel const &ff,
                                           Legion::ArgumentMap &argmap,
-                                          MachineView const *view);
+                                          ParallelTensor const output0);
   void set_argumentmap_for_forward(FFModel const &ff,
                                    Legion::ArgumentMap &argmap);
   void set_argumentmap_for_inference(FFModel const &ff,
                                      Legion::ArgumentMap &argmap,
-                                     MachineView const *view);
+                                     ParallelTensor const output0);
   void set_argumentmap_for_backward(FFModel const &ff,
                                     Legion::ArgumentMap &argmap);
   void set_opmeta_from_futuremap(FFModel const &ff,
                                  Legion::FutureMap const &fm);
   void set_opmeta_from_futuremap_inference(FFModel const &ff,
                                            Legion::FutureMap const &fm,
-                                           MachineView const *view);
+                                           ParallelTensor const output0);
   void solve_parallel_dim_mappings(
       std::vector<ParallelDim const *> const &inputs,
       std::vector<ParallelDim *> const &weights,
@@ -291,7 +291,7 @@ class Op {
   ParallelParameter weights[MAX_NUM_WEIGHTS];
   bool trainableInputs[MAX_NUM_INPUTS];
   OpMeta *meta[MAX_NUM_WORKERS];
-  std::map<size_t, OpMeta *[MAX_NUM_WORKERS]> inference_meta;
+  std::map<ParallelTensor, OpMeta *[MAX_NUM_WORKERS]> inference_meta;
   int numInputs, numWeights, numOutputs;
   bool profiling;
 #ifdef FF_USE_NCCL
diff --git a/src/ops/aggregate.cc b/src/ops/aggregate.cc
index 304331f485..bb3eaf8f52 100644
--- a/src/ops/aggregate.cc
+++ b/src/ops/aggregate.cc
@@ -193,7 +193,7 @@ void Aggregate::init_inference(FFModel const &ff,
   Runtime *runtime = ff.config.lg_hlr;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
   size_t machine_view_hash = view->hash();
-  set_argumentmap_for_init_inference(ff, argmap, view);
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
   IndexLauncher launcher(AGGREGATE_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(Aggregate)),
@@ -204,7 +204,7 @@ void Aggregate::init_inference(FFModel const &ff,
                          machine_view_hash);
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap_inference(ff, fm, view);
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
 }
 
 void Aggregate::init(FFModel const &ff) {
@@ -294,7 +294,7 @@ FutureMap Aggregate::inference(FFModel const &ff,
   Runtime *runtime = ff.config.lg_hlr;
   parallel_is = batch_outputs[0]->parallel_is;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
-  set_argumentmap_for_inference(ff, argmap, view);
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
   /* std::cout << "Aggregate op machine_view: " << *(MachineView const *)mv
             << std::endl; */
diff --git a/src/ops/aggregate_spec.cc b/src/ops/aggregate_spec.cc
index e076695a2f..5ec8ab6857 100644
--- a/src/ops/aggregate_spec.cc
+++ b/src/ops/aggregate_spec.cc
@@ -167,7 +167,7 @@ void AggregateSpec::init_inference(
   Runtime *runtime = ff.config.lg_hlr;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
   size_t machine_view_hash = view->hash();
-  set_argumentmap_for_init_inference(ff, argmap, view);
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
   IndexLauncher launcher(AGG_SPEC_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(AggregateSpec)),
@@ -178,7 +178,7 @@ void AggregateSpec::init_inference(
                          machine_view_hash);
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap_inference(ff, fm, view);
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
 }
 
 void AggregateSpec::init(FFModel const &ff) {
@@ -269,7 +269,7 @@ FutureMap
   Runtime *runtime = ff.config.lg_hlr;
   parallel_is = batch_outputs[0]->parallel_is;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
-  set_argumentmap_for_inference(ff, argmap, view);
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
   /* std::cout << "AggregateSpec op machine_view: " << *(MachineView const *)mv
             << std::endl; */
diff --git a/src/ops/arg_topk.cc b/src/ops/arg_topk.cc
index 35bb80a2b9..8cfc4c38d4 100644
--- a/src/ops/arg_topk.cc
+++ b/src/ops/arg_topk.cc
@@ -157,7 +157,7 @@ void ArgTopK::init_inference(FFModel const &ff,
   Runtime *runtime = ff.config.lg_hlr;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
   size_t machine_view_hash = view->hash();
-  set_argumentmap_for_init_inference(ff, argmap, view);
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
   IndexLauncher launcher(ARG_TOPK_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(ArgTopK)),
@@ -186,7 +186,7 @@ void ArgTopK::init_inference(FFModel const &ff,
   //   launcher.add_field(2, FID_DATA);
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap_inference(ff, fm, view);
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
 }
 
 void ArgTopK::init(FFModel const &ff) {
@@ -254,7 +254,7 @@ FutureMap ArgTopK::inference(FFModel const &ff,
   Runtime *runtime = ff.config.lg_hlr;
   parallel_is = batch_outputs[0]->parallel_is;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
-  set_argumentmap_for_inference(ff, argmap, view);
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
   /* std::cout << "ArgTopK op machine_view: " << *(MachineView const *)mv
             << std::endl; */
diff --git a/src/ops/attention.cc b/src/ops/attention.cc
index 75923e8da2..7af6cb8697 100644
--- a/src/ops/attention.cc
+++ b/src/ops/attention.cc
@@ -384,7 +384,7 @@ void MultiHeadAttention::init_inference(
   Runtime *runtime = ff.config.lg_hlr;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
   size_t machine_view_hash = view->hash();
-  set_argumentmap_for_init_inference(ff, argmap, view);
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
   IndexLauncher launcher(ATTENTION_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(MultiHeadAttention)),
@@ -425,7 +425,7 @@ void MultiHeadAttention::init_inference(
   launcher.add_field(4, FID_DATA);
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap_inference(ff, fm, view);
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
 }
 
 void MultiHeadAttention::init(FFModel const &ff) {
@@ -590,7 +590,7 @@ FutureMap MultiHeadAttention::inference(
   Runtime *runtime = ff.config.lg_hlr;
   parallel_is = batch_outputs[0]->parallel_is;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
-  set_argumentmap_for_inference(ff, argmap, view);
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
   /* std::cout << "MultiHeadAttention op machine_view: " << *(MachineView const
      *)mv
diff --git a/src/ops/element_binary.cc b/src/ops/element_binary.cc
index 11d5ff6012..4e5d640c08 100644
--- a/src/ops/element_binary.cc
+++ b/src/ops/element_binary.cc
@@ -274,7 +274,7 @@ void ElementBinary::init_inference(
   Runtime *runtime = ff.config.lg_hlr;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
   size_t machine_view_hash = view->hash();
-  set_argumentmap_for_init_inference(ff, argmap, view);
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
   IndexLauncher launcher(ELEMENTBINARY_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(ElementBinary)),
@@ -325,7 +325,7 @@ void ElementBinary::init_inference(
   //}
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap_inference(ff, fm, view);
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
 }
 
 void ElementBinary::init(FFModel const &ff) {
@@ -517,7 +517,7 @@ FutureMap
   Runtime *runtime = ff.config.lg_hlr;
   parallel_is = batch_outputs[0]->parallel_is;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
-  set_argumentmap_for_inference(ff, argmap, view);
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
   /* std::cout << "ElementBinary op machine_view: " << *(MachineView const *)mv
             << std::endl; */
diff --git a/src/ops/embedding.cc b/src/ops/embedding.cc
index 8dca314c2e..06186d969f 100644
--- a/src/ops/embedding.cc
+++ b/src/ops/embedding.cc
@@ -380,7 +380,7 @@ void Embedding::init_inference(FFModel const &ff,
   Runtime *runtime = ff.config.lg_hlr;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
   size_t machine_view_hash = view->hash();
-  set_argumentmap_for_init_inference(ff, argmap, view);
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
 
   IndexLauncher launcher(EMBED_INIT_TASK_ID,
                          parallel_is,
@@ -406,7 +406,7 @@ void Embedding::init_inference(FFModel const &ff,
   launcher.add_field(1, FID_DATA);
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap_inference(ff, fm, view);
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
 }
 
 OpMeta *Embedding::init_task(Task const *task,
@@ -470,7 +470,7 @@ FutureMap Embedding::inference(FFModel const &ff,
 
   parallel_is = batch_outputs[0]->parallel_is;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
-  set_argumentmap_for_inference(ff, argmap, view);
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
 
   IndexLauncher launcher(EMBED_FWD_TASK_ID,
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index 2186f18370..983c682bd6 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -454,7 +454,7 @@ void Experts::init_inference(FFModel const &ff,
   Runtime *runtime = ff.config.lg_hlr;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
   size_t machine_view_hash = view->hash();
-  set_argumentmap_for_init_inference(ff, argmap, view);
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
   IndexLauncher launcher(EXPERTS_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(Experts)),
@@ -510,7 +510,7 @@ void Experts::init_inference(FFModel const &ff,
   }
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap_inference(ff, fm, view);
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
 }
 
 void Experts::init(FFModel const &ff) {
@@ -672,7 +672,7 @@ FutureMap Experts::inference(FFModel const &ff,
   Runtime *runtime = ff.config.lg_hlr;
   parallel_is = batch_outputs[0]->parallel_is;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
-  set_argumentmap_for_inference(ff, argmap, view);
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
   /* std::cout << "Experts op machine_view: " << *(MachineView const *)mv
             << std::endl; */
diff --git a/src/ops/group_by.cc b/src/ops/group_by.cc
index 53c78538e2..c805b5fb29 100644
--- a/src/ops/group_by.cc
+++ b/src/ops/group_by.cc
@@ -175,7 +175,7 @@ void Group_by::init_inference(FFModel const &ff,
   Runtime *runtime = ff.config.lg_hlr;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
   size_t machine_view_hash = view->hash();
-  set_argumentmap_for_init_inference(ff, argmap, view);
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
   IndexLauncher launcher(GROUP_BY_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(Group_by)),
@@ -211,7 +211,7 @@ void Group_by::init_inference(FFModel const &ff,
   }
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap_inference(ff, fm, view);
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
 }
 
 void Group_by::init(FFModel const &ff) {
@@ -319,6 +319,7 @@ FutureMap Group_by::inference(FFModel const &ff,
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash =
       mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
   /* std::cout << "GroupBy op machine_view: " << *(MachineView const *)mv
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index 1b91d3b6a0..a46ad1e6a6 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -360,7 +360,7 @@ void IncMultiHeadSelfAttention::init_inference(
   Runtime *runtime = ff.config.lg_hlr;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
   size_t machine_view_hash = view->hash();
-  set_argumentmap_for_init_inference(ff, argmap, view);
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
   IndexLauncher launcher(INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(IncMultiHeadSelfAttention)),
@@ -389,7 +389,7 @@ void IncMultiHeadSelfAttention::init_inference(
   launcher.add_field(2, FID_DATA);
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap_inference(ff, fm, view);
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
 }
 
 void IncMultiHeadSelfAttention::init(FFModel const &ff) {
@@ -484,7 +484,7 @@ FutureMap IncMultiHeadSelfAttention::inference(
   Runtime *runtime = ff.config.lg_hlr;
   parallel_is = batch_outputs[0]->parallel_is;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
-  set_argumentmap_for_inference(ff, argmap, view);
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
   int idx = 0;
 
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index e802647db5..fda69bb3b9 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -536,7 +536,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     : OpMeta(handler, attn) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
-  // checkCUDNN(cudnnSetStream(handler.dnn, stream));
+  checkCUDNN(cudnnSetStream(handler.dnn, stream));
 
   qSize = attn->qSize;
   kSize = attn->kSize;
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index 4f0703dcc6..de511812bc 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -205,7 +205,7 @@ void LayerNorm::init_inference(FFModel const &ff,
   Runtime *runtime = ff.config.lg_hlr;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
   size_t machine_view_hash = view->hash();
-  set_argumentmap_for_init_inference(ff, argmap, view);
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
   IndexLauncher launcher(LAYERNORM_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(LayerNorm)),
@@ -228,7 +228,7 @@ void LayerNorm::init_inference(FFModel const &ff,
   launcher.add_field(1, FID_DATA);
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap_inference(ff, fm, view);
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
 }
 
 void LayerNorm::init(FFModel const &ff) {
@@ -325,7 +325,7 @@ FutureMap LayerNorm::inference(FFModel const &ff,
   Runtime *runtime = ff.config.lg_hlr;
   parallel_is = batch_outputs[0]->parallel_is;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
-  set_argumentmap_for_inference(ff, argmap, view);
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
   /* std::cout << "LayerNorm op machine_view: " << *(MachineView const *)mv
             << std::endl; */
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index 381110a4d3..3b19bf6586 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -266,7 +266,7 @@ void Linear::init_inference(FFModel const &ff,
   Runtime *runtime = ff.config.lg_hlr;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
   size_t machine_view_hash = view->hash();
-  set_argumentmap_for_init_inference(ff, argmap, view);
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
   IndexLauncher launcher(LINEAR_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(Linear)),
@@ -304,7 +304,7 @@ void Linear::init_inference(FFModel const &ff,
   }
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap_inference(ff, fm, view);
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
 }
 
 /*
@@ -430,7 +430,7 @@ FutureMap Linear::inference(FFModel const &ff,
   Runtime *runtime = ff.config.lg_hlr;
   parallel_is = batch_outputs[0]->parallel_is;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
-  set_argumentmap_for_inference(ff, argmap, view);
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
   /* std::cout << "Linear op machine_view: " << *(MachineView const *)mv
             << std::endl; */
diff --git a/src/ops/noop.cc b/src/ops/noop.cc
index d35d5d48b7..2b54bdf302 100644
--- a/src/ops/noop.cc
+++ b/src/ops/noop.cc
@@ -164,7 +164,7 @@ void NoOp::init_inference(FFModel const &ff,
     ArgumentMap argmap;
     Context ctx = ff.config.lg_ctx;
     Runtime *runtime = ff.config.lg_hlr;
-    set_argumentmap_for_init_inference(ff, argmap, view);
+    set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
     IndexLauncher launcher(NOOP_INIT_TASK_ID,
                            parallel_is,
                            TaskArgument(NULL, 0),
@@ -175,7 +175,7 @@ void NoOp::init_inference(FFModel const &ff,
                            machine_view_hash);
     FutureMap fm = runtime->execute_index_space(ctx, launcher);
     fm.wait_all_results();
-    set_opmeta_from_futuremap_inference(ff, fm, view);
+    set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
   }
 }
 
diff --git a/src/ops/softmax.cc b/src/ops/softmax.cc
index 9543e34a90..304fa7b418 100644
--- a/src/ops/softmax.cc
+++ b/src/ops/softmax.cc
@@ -126,7 +126,7 @@ void Softmax::init_inference(FFModel const &ff,
   Runtime *runtime = ff.config.lg_hlr;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
   size_t machine_view_hash = view->hash();
-  set_argumentmap_for_init_inference(ff, argmap, view);
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
   IndexLauncher launcher(SOFTMAX_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(Softmax)),
@@ -149,7 +149,7 @@ void Softmax::init_inference(FFModel const &ff,
   launcher.add_field(1, FID_DATA);
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap_inference(ff, fm, view);
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
 }
 
 void Softmax::init(FFModel const &ff) {
@@ -235,7 +235,7 @@ FutureMap Softmax::inference(FFModel const &ff,
   Runtime *runtime = ff.config.lg_hlr;
   parallel_is = batch_outputs[0]->parallel_is;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
-  set_argumentmap_for_inference(ff, argmap, view);
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
   /* std::cout << "Softmax op machine_view: " << *(MachineView const *)mv
             << std::endl; */
diff --git a/src/ops/topk.cc b/src/ops/topk.cc
index 5cefe955b1..45fdb7a3db 100644
--- a/src/ops/topk.cc
+++ b/src/ops/topk.cc
@@ -147,7 +147,7 @@ void TopK::init_inference(FFModel const &ff,
   Runtime *runtime = ff.config.lg_hlr;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
   size_t machine_view_hash = view->hash();
-  set_argumentmap_for_init_inference(ff, argmap, view);
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
   IndexLauncher launcher(TOPK_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(TopK)),
@@ -176,7 +176,7 @@ void TopK::init_inference(FFModel const &ff,
   launcher.add_field(2, FID_DATA);
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
-  set_opmeta_from_futuremap_inference(ff, fm, view);
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
 }
 
 void TopK::init(FFModel const &ff) {
@@ -273,7 +273,7 @@ FutureMap TopK::inference(FFModel const &ff,
   Runtime *runtime = ff.config.lg_hlr;
   parallel_is = batch_outputs[0]->parallel_is;
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
-  set_argumentmap_for_inference(ff, argmap, view);
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
   /* std::cout << "TopK op machine_view: " << *(MachineView const *)mv
             << std::endl; */
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index ba62357411..09bbbefbe0 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -68,51 +68,71 @@ void InferenceManager::compile_model_and_allocate_buffer(void) {
       tensor_buffer[pt_base] = list;
     }
   }
+  // Set machine_view for batch_tensors in the tensor_buffer
+  for (int batch_index = 0; batch_index < max_num_inflight_batches;
+       batch_index++) {
+    int expert_device_index = 0;
+    int device_index = batch_index % num_devices;
+    for (size_t o = 0; o < model->operators.size(); o++) {
+      Op *op = model->operators[o];
+      if (op->op_type == OP_WEIGHT) {
+        continue;
+      }
+      MachineView *view;
+      if (op->op_type == OP_EXPERTS) {
+        view = get_machine_view(expert_device_index);
+        // view = &machine_views[expert_device_index];
+        expert_device_index = (expert_device_index + 1) % num_devices;
+      } else {
+        // pick mv w startdeviceid = device_index
+        // view = &machine_views[device_index];
+        view = get_machine_view(device_index);
+      }
+      for (int i = 0; i < op->numOutputs; i++) {
+        tensor_buffer[op->outputs[i]][batch_index]->machine_view = *view;
+        Domain part_domain =
+            runtime->get_index_space_domain(ctx, op->outputs[i]->parallel_is);
+        assert(view->get_domain() == part_domain);
+      }
+    }
+  }
 }
 
 void InferenceManager::init_operators_inference() {
   for (int batch_index = 0; batch_index < max_num_inflight_batches;
        batch_index++) {
-    for (int device_index = 0; device_index < num_devices; device_index++) {
-      // int fused_experts_index = 0;
-      for (size_t o = 0; o < model->operators.size(); o++) {
-        Op *op = model->operators[o];
-        if (op->op_type == OP_WEIGHT) {
-          continue;
-        }
-        MachineView *view;
-        // if (op->op_type == OP_EXPERTS) {
-        //   if (fused_experts_index != device_index) {
-        //     fused_experts_index++;
-        //     continue;
-        //   }
-        //   view = &machine_views[fused_experts_index];
-        //   fused_experts_index++;
-        // } else {
-        view = &machine_views[device_index];
-        //}
-        std::vector<ParallelTensor> inputs(op->numInputs);
-        std::vector<ParallelTensor> outputs(op->numOutputs);
-        for (int i = 0; i < op->numInputs; i++) {
-          assert(op->inputs[i] != nullptr);
-          assert(op->inputs[i]->parallel_is != IndexSpace::NO_SPACE);
-          assert(tensor_buffer[op->inputs[i]].size() > batch_index);
-          inputs[i] = tensor_buffer[op->inputs[i]][batch_index];
-          assert(inputs[i]->parallel_is != IndexSpace::NO_SPACE);
-        }
-        for (int i = 0; i < op->numOutputs; i++) {
-          assert(op->outputs[i] != nullptr);
-          assert(op->outputs[i]->parallel_is != IndexSpace::NO_SPACE);
-          assert(tensor_buffer[op->outputs[i]].size() > batch_index);
-          outputs[i] = tensor_buffer[op->outputs[i]][batch_index];
-          assert(outputs[i]->parallel_is != IndexSpace::NO_SPACE);
-        }
-        if (op->is_parallel_op()) {
-          ((ParallelOp *)op)
-              ->create_input_partition_inference(*model, inputs, outputs);
+    int expert_device_index = 0;
+    int device_index = batch_index % num_devices;
+    for (size_t o = 0; o < model->operators.size(); o++) {
+      Op *op = model->operators[o];
+      if (op->op_type == OP_WEIGHT) {
+        continue;
+      }
+      std::vector<ParallelTensor> inputs(op->numInputs);
+      std::vector<ParallelTensor> outputs(op->numOutputs);
+      for (int i = 0; i < op->numInputs; i++) {
+        assert(op->inputs[i] != nullptr);
+        assert(op->inputs[i]->parallel_is != IndexSpace::NO_SPACE);
+        assert(tensor_buffer[op->inputs[i]].size() > batch_index);
+        inputs[i] = tensor_buffer[op->inputs[i]][batch_index];
+        assert(inputs[i]->parallel_is != IndexSpace::NO_SPACE);
+      }
+      assert(op->numOutputs > 0);
+      for (int i = 0; i < op->numOutputs; i++) {
+        assert(op->outputs[i] != nullptr);
+        assert(op->outputs[i]->parallel_is != IndexSpace::NO_SPACE);
+        assert(tensor_buffer[op->outputs[i]].size() > batch_index);
+        outputs[i] = tensor_buffer[op->outputs[i]][batch_index];
+        if (i > 0) {
+          assert(outputs[0]->machine_view == outputs[i]->machine_view);
         }
-        op->init_inference(*model, inputs, outputs, view);
+        assert(outputs[i]->parallel_is != IndexSpace::NO_SPACE);
+      }
+      if (op->is_parallel_op()) {
+        ((ParallelOp *)op)
+            ->create_input_partition_inference(*model, inputs, outputs);
       }
+      op->init_inference(*model, inputs, outputs);
     }
   }
 }
@@ -123,9 +143,9 @@ MachineView *InferenceManager::get_machine_view(int mv_id) {
 }
 
 FutureMap InferenceManager::inference(int index, BatchConfig const &bc) {
+  // We currently assume that the index-th batch will be placed
+  // on the device_index-th device (except for the experts layers)
   int batch_index = index % max_num_inflight_batches;
-  int device_index = index % num_devices;
-  int expert_device_index = 0;
   FutureMap fm;
   for (size_t o = 0; o < model->operators.size(); o++) {
     Op *op = model->operators[o];
@@ -133,17 +153,6 @@ FutureMap InferenceManager::inference(int index, BatchConfig const &bc) {
       continue;
     }
 
-    MachineView *view;
-    if (op->op_type == OP_EXPERTS) {
-      view = get_machine_view(expert_device_index);
-      // view = &machine_views[expert_device_index];
-      expert_device_index = (expert_device_index + 1) % num_devices;
-    } else {
-      // pick mv w startdeviceid = device_index
-      // view = &machine_views[device_index];
-      view = get_machine_view(device_index);
-    }
-
     std::vector<ParallelTensor> inputs(op->numInputs);
     std::vector<ParallelTensor> outputs(op->numOutputs);
     for (int i = 0; i < op->numInputs; i++) {
@@ -164,7 +173,7 @@ FutureMap InferenceManager::inference(int index, BatchConfig const &bc) {
       outputs[i] = tensor_buffer[op->outputs[i]][batch_index];
       assert(outputs[i]->parallel_is != IndexSpace::NO_SPACE);
     }
-    fm = op->inference(*model, bc, inputs, outputs, view);
+    fm = op->inference(*model, bc, inputs, outputs);
   }
   return fm;
 };
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 30fa45e251..12a14d808d 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -980,10 +980,11 @@ void Op::set_argumentmap_for_init(FFModel const &ff, ArgumentMap &argmap) {
 
 void Op::set_argumentmap_for_init_inference(FFModel const &ff,
                                             ArgumentMap &argmap,
-                                            MachineView const *view) {
+                                            ParallelTensor const output0) {
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
   Domain domain = runtime->get_index_space_domain(ctx, this->parallel_is);
+  MachineView const view = output0->machine_view;
   switch (domain.get_dim()) {
 #ifdef FF_USE_NCCL
 #define DIMFUNC(DIM)                                                           \
@@ -991,10 +992,10 @@ void Op::set_argumentmap_for_init_inference(FFModel const &ff,
     Rect<DIM> rect = domain;                                                   \
     int idx = 0;                                                               \
     for (PointInRectIterator<DIM> it(rect); it(); it++) {                      \
-      FFHandler handle = ff.handlers[view->get_device_id(*it)];                \
+      FFHandler handle = ff.handlers[view.get_device_id(*it)];                 \
       if (ff.config.computationMode == COMP_MODE_TRAINING &&                   \
           op_type == OP_WEIGHT) {                                              \
-        ncclComm_t *nccl_comms = ff.find_nccl_comms(*view);                    \
+        ncclComm_t *nccl_comms = ff.find_nccl_comms(view);                     \
         handle.ncclComm = nccl_comms[idx++];                                   \
       }                                                                        \
       argmap.set_point(*it, TaskArgument(&handle, sizeof(FFHandler)));         \
@@ -1008,7 +1009,7 @@ void Op::set_argumentmap_for_init_inference(FFModel const &ff,
   case DIM: {                                                                  \
     Rect<DIM> rect = domain;                                                   \
     for (PointInRectIterator<DIM> it(rect); it(); it++) {                      \
-      FFHandler handle = ff.handlers[view->get_device_id(*it)];                \
+      FFHandler handle = ff.handlers[view.get_device_id(*it)];                 \
       argmap.set_point(*it, TaskArgument(&handle, sizeof(FFHandler)));         \
     }                                                                          \
     break;                                                                     \
@@ -1044,7 +1045,7 @@ void Op::set_opmeta_from_futuremap(FFModel const &ff, FutureMap const &fm) {
 
 void Op::set_opmeta_from_futuremap_inference(FFModel const &ff,
                                              FutureMap const &fm,
-                                             MachineView const *view) {
+                                             ParallelTensor const output) {
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
   Domain domain = runtime->get_index_space_domain(ctx, parallel_is);
@@ -1054,7 +1055,7 @@ void Op::set_opmeta_from_futuremap_inference(FFModel const &ff,
     Rect<DIM> rect = domain;                                                   \
     int idx = 0;                                                               \
     for (PointInRectIterator<DIM> it(rect); it(); it++) {                      \
-      inference_meta[view->hash()][idx++] = fm.get_result<OpMeta *>(*it);      \
+      inference_meta[output][idx++] = fm.get_result<OpMeta *>(*it);            \
     }                                                                          \
     break;                                                                     \
   }
@@ -1089,7 +1090,7 @@ void Op::set_argumentmap_for_forward(FFModel const &ff, ArgumentMap &argmap) {
 
 void Op::set_argumentmap_for_inference(FFModel const &ff,
                                        ArgumentMap &argmap,
-                                       MachineView const *view) {
+                                       ParallelTensor const output) {
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
   Domain domain = runtime->get_index_space_domain(ctx, parallel_is);
@@ -1099,7 +1100,7 @@ void Op::set_argumentmap_for_inference(FFModel const &ff,
     Rect<DIM> rect = domain;                                                   \
     int idx = 0;                                                               \
     for (PointInRectIterator<DIM> it(rect); it(); it++) {                      \
-      OpMeta *mp = inference_meta[view->hash()][idx++];                        \
+      OpMeta *mp = inference_meta[output][idx++];                              \
       argmap.set_point(*it, TaskArgument(&mp, sizeof(OpMeta *)));              \
     }                                                                          \
     break;                                                                     \

From 71072dde57aa2edaf1c39421780b5a6798928ec4 Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Mon, 3 Apr 2023 11:05:52 -0400
Subject: [PATCH 088/344] [IncMHA] - Reload the output projection weight after
 setting it, fix the index (#671)

* reload the weight if set_tensor, fix the index

* add flag for just loading once
---
 .../ops/inc_multihead_self_attention.h        |  1 +
 src/ops/inc_multihead_self_attention.cu       | 22 ++++++++++++++++---
 2 files changed, 20 insertions(+), 3 deletions(-)

diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index cfdb415354..e21c741196 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -119,6 +119,7 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
   size_t weights_params, weightSize, reserveSpaceSize;
   int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
   int num_heads;
+  bool has_load_weights;
 #ifdef INFERENCE_TESTS
   float *kcache, *vcache;
 #endif
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index fda69bb3b9..61d2b06b93 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -32,8 +32,7 @@ __global__ void build_w_out_tensor(float const *weight_ptr,
     int row_idx = i % vProjSize;
     int col_idx = (i / vProjSize) % oProjSize;
     int head_idx = i / (vProjSize * oProjSize);
-    contiguous_weight_ptr[col_idx * vProjSize * num_heads +
-                          head_idx * vProjSize + row_idx] =
+    contiguous_weight_ptr[i] =
         weight_ptr[head_idx * (qkv_weight_block_size + vProjSize * oProjSize) +
                    qkv_weight_block_size + col_idx * vProjSize + row_idx];
   }
@@ -495,6 +494,23 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     cudaEventCreate(&t_end);
     cudaEventRecord(t_start, stream);
   }
+  // reload the weight_o
+
+  if (!m->has_load_weights) {
+    int parallelism = m->vProjSize * m->oProjSize * m->num_heads;
+    build_w_out_tensor<<<GET_BLOCKS(parallelism),
+                         min(CUDA_NUM_THREADS, parallelism),
+                         0,
+                         stream>>>(weight_ptr,
+                                   m->W_out_contiguous,
+                                   m->vProjSize,
+                                   m->oProjSize,
+                                   m->num_heads,
+                                   (m->qSize * m->qProjSize +
+                                    m->kSize * m->kProjSize +
+                                    m->vSize * m->vProjSize));
+    m->has_load_weights = true;
+  }
 
   // phase 1: Implement kernel to compute KQV for input tokens
   inference_kernel1(m, bc, input_ptr, weight_ptr, m->devQKVProjArray, stream);
@@ -553,7 +569,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   weights_params = (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize +
                     oProjSize * (vProjSize > 0 ? vProjSize : vSize));
   weightSize = weights_params * num_heads * sizeof(float);
-
+  has_load_weights = false;
   // Currently do not support adding bias to key/value projection
   assert(!attn->add_bias_kv);
 

From ea4c6f455bfaf15918ae5d314b1e44c56badeca0 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 3 Apr 2023 11:24:43 -0400
Subject: [PATCH 089/344] fix

---
 include/flexflow/ops/inc_multihead_self_attention.h | 2 +-
 src/ops/inc_multihead_self_attention.cu             | 7 ++++---
 2 files changed, 5 insertions(+), 4 deletions(-)

diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index e21c741196..716a2563cd 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -119,7 +119,7 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
   size_t weights_params, weightSize, reserveSpaceSize;
   int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
   int num_heads;
-  bool has_load_weights;
+  bool *has_load_weights;
 #ifdef INFERENCE_TESTS
   float *kcache, *vcache;
 #endif
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 61d2b06b93..7c422a8a0e 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -496,7 +496,7 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
   }
   // reload the weight_o
 
-  if (!m->has_load_weights) {
+  if (!(*m->has_load_weights)) {
     int parallelism = m->vProjSize * m->oProjSize * m->num_heads;
     build_w_out_tensor<<<GET_BLOCKS(parallelism),
                          min(CUDA_NUM_THREADS, parallelism),
@@ -509,7 +509,7 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
                                    (m->qSize * m->qProjSize +
                                     m->kSize * m->kProjSize +
                                     m->vSize * m->vProjSize));
-    m->has_load_weights = true;
+    *m->has_load_weights = true;
   }
 
   // phase 1: Implement kernel to compute KQV for input tokens
@@ -569,7 +569,8 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   weights_params = (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize +
                     oProjSize * (vProjSize > 0 ? vProjSize : vSize));
   weightSize = weights_params * num_heads * sizeof(float);
-  has_load_weights = false;
+  has_load_weights = (bool *)calloc(1, sizeof(bool));
+  *has_load_weights = false;
   // Currently do not support adding bias to key/value projection
   assert(!attn->add_bias_kv);
 

From 9efeb0199a7baf115e244f6375feb69751e61e9d Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 5 Apr 2023 21:18:07 +0000
Subject: [PATCH 090/344] fix graph.cc issue with large number of layers

---
 CMakeLists.txt      | 8 ++++++--
 config/config.inc   | 7 ++++++-
 config/config.linux | 3 +++
 3 files changed, 15 insertions(+), 3 deletions(-)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index ab8bb471b8..d61798f4e8 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -83,6 +83,7 @@ set(FF_MAX_DIM "4" CACHE STRING "Maximum dimention of tensors")
 
 # option for legion
 option(FF_USE_EXTERNAL_LEGION "Use pre-installed Legion" OFF)
+set(LEGION_MAX_RETURN_SIZE "32768" CACHE STRING "Maximum Legion return size")
 
 set(FLEXFLOW_EXT_LIBRARIES "")
 set(FLEXFLOW_INCLUDE_DIRS "")
@@ -206,9 +207,11 @@ if (CMAKE_BUILD_TYPE STREQUAL "Debug")
 endif()
 
 message(STATUS "FlexFlow MAX_DIM: ${FF_MAX_DIM}")
+message(STATUS "LEGION_MAX_RETURN_SIZE: ${LEGION_MAX_RETURN_SIZE}")
 
 list(APPEND FF_CC_FLAGS
-  -DMAX_TENSOR_DIM=${FF_MAX_DIM})
+  -DMAX_TENSOR_DIM=${FF_MAX_DIM}
+  -DLEGION_MAX_RETURN_SIZE=${LEGION_MAX_RETURN_SIZE})
 
 if(FF_USE_AVX2)
   list(APPEND FF_CC_FLAGS
@@ -218,7 +221,8 @@ endif()
 
 list(APPEND FF_NVCC_FLAGS
   -Wno-deprecated-gpu-targets
-  -DMAX_TENSOR_DIM=${FF_MAX_DIM})
+  -DMAX_TENSOR_DIM=${FF_MAX_DIM}
+  -DLEGION_MAX_RETURN_SIZE=${LEGION_MAX_RETURN_SIZE})
 
 list(APPEND FF_LD_FLAGS
   -lrt
diff --git a/config/config.inc b/config/config.inc
index c9eb554cb4..0384b87b20 100644
--- a/config/config.inc
+++ b/config/config.inc
@@ -159,6 +159,11 @@ if [ -n "$FF_MAX_DIM" ]; then
   SET_MAX_DIM="-DFF_MAX_DIM=${FF_MAX_DIM}"
 fi
 
+#set LEGION_MAX_RETURN_SIZE
+if [ -n "$LEGION_MAX_RETURN_SIZE" ]; then
+  SET_LEGION_MAX_RETURN_SIZE="-DLEGION_MAX_RETURN_SIZE=${LEGION_MAX_RETURN_SIZE}"
+fi
+
 # set ROCM path
 if [ -n "$ROCM_PATH" ]; then
   SET_ROCM_PATH="-DROCM_PATH=${ROCM_PATH}"
@@ -202,7 +207,7 @@ if [ -n "$FF_GPU_BACKEND" ]; then
   fi
 fi
 
-CMAKE_FLAGS="-DCUDA_USE_STATIC_CUDA_RUNTIME=OFF ${SET_CC} ${SET_CXX} ${SET_INSTALL_DIR} ${SET_INFERENCE_TESTS} ${SET_LIBTORCH_PATH} ${SET_BUILD} ${SET_CUDA_ARCH} ${SET_CUDA} ${SET_CUDNN} ${SET_PYTHON} ${SET_NCCL} ${SET_GASNET} ${SET_EXAMPLES} ${SET_INFERENCE_EXAMPLES} ${SET_USE_PREBUILT_LEGION} ${SET_USE_PREBUILT_NCCL} ${SET_USE_ALL_PREBUILT_LIBRARIES} ${SET_BUILD_UNIT_TESTS} ${SET_AVX2} ${SET_MAX_DIM} ${SET_ROCM_PATH} ${SET_FF_GPU_BACKEND}"
+CMAKE_FLAGS="-DCUDA_USE_STATIC_CUDA_RUNTIME=OFF ${SET_CC} ${SET_CXX} ${SET_INSTALL_DIR} ${SET_INFERENCE_TESTS} ${SET_LIBTORCH_PATH} ${SET_BUILD} ${SET_CUDA_ARCH} ${SET_CUDA} ${SET_CUDNN} ${SET_PYTHON} ${SET_NCCL} ${SET_GASNET} ${SET_EXAMPLES} ${SET_INFERENCE_EXAMPLES} ${SET_USE_PREBUILT_LEGION} ${SET_USE_PREBUILT_NCCL} ${SET_USE_ALL_PREBUILT_LIBRARIES} ${SET_BUILD_UNIT_TESTS} ${SET_AVX2} ${SET_MAX_DIM} ${SET_LEGION_MAX_RETURN_SIZE} ${SET_ROCM_PATH} ${SET_FF_GPU_BACKEND}"
 
 function run_cmake() {
 SRC_LOCATION=${SRC_LOCATION:=`dirname $0`/../}
diff --git a/config/config.linux b/config/config.linux
index 614a671e44..3c029b85ee 100755
--- a/config/config.linux
+++ b/config/config.linux
@@ -68,6 +68,9 @@ FF_USE_AVX2=${FF_USE_AVX2:-OFF}
 # set MAX_DIM
 FF_MAX_DIM=${FF_MAX_DIM:-5}
 
+# set LEGION_MAX_RETURN_SIZE
+LEGION_MAX_RETURN_SIZE=${LEGION_MAX_RETURN_SIZE:-65536}
+
 # set ROCM path
 ROCM_PATH=${ROCM_PATH:-"/opt/rocm"}
 

From 0f64663bec21317c5eb7259630dac6c4d3a3c088 Mon Sep 17 00:00:00 2001
From: zwang86 <46699021+zwang86@users.noreply.github.com>
Date: Thu, 6 Apr 2023 16:25:39 -0400
Subject: [PATCH 091/344] [Missing Operators] Add inference rms norm op (#672)

* init

* fix

* fix

* fix

* Add norm helper and update RMSNormMeta.

* Finish basic logic of rms norm.

* fix dimensions for rms input and weights.

* Format code.

* Fix rms logic.

* Minor fixation.

* Remove deprecated Legion names.

* Logic fixation.

---------

Co-authored-by: xinhaoc <chengxh_98@163.com>
---
 include/flexflow/ffconst.h                    |   1 +
 include/flexflow/model.h                      |   8 +
 include/flexflow/operator_params.h            |   2 +
 .../flexflow/ops/kernels/rms_norm_kernels.h   |  49 +++
 include/flexflow/ops/rms_norm.h               |  74 ++++
 include/flexflow/ops/rms_norm_params.h        |  26 ++
 src/ops/kernels/rms_norm_kernels.cu           | 167 ++++++++
 src/ops/rms_norm.cc                           | 377 ++++++++++++++++++
 src/runtime/graph.cc                          |   5 +
 src/runtime/operator_params.cc                |   3 +
 10 files changed, 712 insertions(+)
 create mode 100644 include/flexflow/ops/kernels/rms_norm_kernels.h
 create mode 100644 include/flexflow/ops/rms_norm.h
 create mode 100644 include/flexflow/ops/rms_norm_params.h
 create mode 100644 src/ops/kernels/rms_norm_kernels.cu
 create mode 100644 src/ops/rms_norm.cc

diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index c698191811..d244fb3ac6 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -147,6 +147,7 @@ enum OperatorType {
   OP_LAYERNORM,
   OP_EXPERTS,
   OP_GATHER, // https://pytorch.org/docs/stable/generated/torch.gather.html
+  OP_RMS_NORM,
   OP_INC_MULTIHEAD_SELF_ATTENTION,
   // Parallel Ops
   OP_REPARTITION,
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index da26d54af2..6873ce5e43 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -140,6 +140,8 @@ enum TaskIDs {
   ATTENTION_INIT_TASK_ID,
   ATTENTION_FWD_TASK_ID,
   ATTENTION_BWD_TASK_ID,
+  RMSNROM_INIT_TASK_ID,
+  RMSNROM_FWD_TASK_ID,
   INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
   INC_MULTIHEAD_SELF_ATTENTION_FWD_TASK_ID,
   INC_MULTIHEAD_SELF_ATTENTION_BWD_TASK_ID,
@@ -288,6 +290,7 @@ class Split;
 class TopK;
 class ArgTopK;
 class Transpose;
+class RMSNorm;
 class Combine;
 class Repartition;
 class Reduction;
@@ -499,6 +502,9 @@ class FFModel {
                       int a_seq_length_dim = -1,
                       int b_seq_length_dim = -1,
                       char const *name = nullptr);
+  // Add a root mean square layer
+  Tensor
+      rms_norm(const Tensor input, float eps, int dim, char const *name = NULL);
   // Add a dense layer
   Tensor dense(const Tensor input,
                int outDim,
@@ -965,6 +971,8 @@ class FFModel {
                          ArgTopK *>,
       std::unordered_map<std::pair<ParallelTensorShape, TransposeParams>,
                          Transpose *>,
+      std::unordered_map<std::pair<ParallelTensorShape, RMSNormParams>,
+                         RMSNorm *>,
       std::unordered_map<std::pair<ParallelTensorShape, RepartitionParams>,
                          Repartition *>,
       std::unordered_map<std::pair<ParallelTensorShape, ReplicateParams>,
diff --git a/include/flexflow/operator_params.h b/include/flexflow/operator_params.h
index 340cc38659..f949fe3e4c 100644
--- a/include/flexflow/operator_params.h
+++ b/include/flexflow/operator_params.h
@@ -23,6 +23,7 @@
 #include "flexflow/ops/pool_2d_params.h"
 #include "flexflow/ops/reduce_params.h"
 #include "flexflow/ops/reshape_params.h"
+#include "flexflow/ops/rms_norm_params.h"
 #include "flexflow/ops/softmax_params.h"
 #include "flexflow/ops/split_params.h"
 #include "flexflow/ops/topk_params.h"
@@ -55,6 +56,7 @@ using OperatorParameters = mp::variant<AggregateParams,
                                        LinearParams,
                                        MultiHeadAttentionParams,
                                        IncMultiHeadSelfAttentionParams,
+                                       RMSNormParams,
                                        Pool2DParams,
                                        ReduceParams,
                                        ReshapeParams,
diff --git a/include/flexflow/ops/kernels/rms_norm_kernels.h b/include/flexflow/ops/kernels/rms_norm_kernels.h
new file mode 100644
index 0000000000..5673880dcb
--- /dev/null
+++ b/include/flexflow/ops/kernels/rms_norm_kernels.h
@@ -0,0 +1,49 @@
+#ifndef _FLEXFLOW_OPS_KERNELS_RMSNORM_KERNELS_H
+#define _FLEXFLOW_OPS_KERNELS_RMSNORM_KERNELS_H
+
+#include "flexflow/accessor.h"
+#include "flexflow/device.h"
+#include "flexflow/fftype.h"
+#include "flexflow/op_meta.h"
+
+namespace FlexFlow {
+using Legion::coord_t;
+
+class RMSNorm;
+
+class RMSNormMeta : public OpMeta {
+public:
+  RMSNormMeta(FFHandler handler, RMSNorm const *rms);
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+  cudnnTensorDescriptor_t inputTensor, outputTensor;
+  cudnnReduceTensorDescriptor_t reduceDesc;
+#else
+  miopenTensorDescriptor_t inputTensor, outputTensor;
+  miopenReduceTensorDescriptor_t reduceDesc;
+#endif
+
+public:
+  float eps;
+  float *rms_ptr;
+  float *norm_ptr;
+
+  float alpha;
+  float beta;
+
+  int in_dim;
+  int batch_size;
+  int num_elements;
+  char op_name[MAX_OPNAME];
+};
+
+namespace Kernels {
+namespace RMSNorm {
+void forward_kernel_wrapper(RMSNormMeta const *m,
+                            GenericTensorAccessorR const &input,
+                            GenericTensorAccessorR const &weight,
+                            GenericTensorAccessorW const &output);
+} // namespace RMSNorm
+} // namespace Kernels
+} // namespace FlexFlow
+
+#endif // _FLEXFLOW_OPS_KERNELS_RMSNORM_KERNELS_H
\ No newline at end of file
diff --git a/include/flexflow/ops/rms_norm.h b/include/flexflow/ops/rms_norm.h
new file mode 100644
index 0000000000..4100baadcf
--- /dev/null
+++ b/include/flexflow/ops/rms_norm.h
@@ -0,0 +1,74 @@
+#ifndef _FLEXFLOW_RMS_NORM_H
+#define _FLEXFLOW_RMS_NORM_H
+
+#include "flexflow/inference.h"
+#include "flexflow/model.h"
+#include "flexflow/ops/rms_norm_params.h"
+
+namespace FlexFlow {
+
+class RMSNormMeta;
+
+class RMSNorm : public Op {
+public:
+  using Params = RMSNormParams;
+  using Input = ParallelTensor;
+  RMSNorm(FFModel &model,
+          LayerID const &_layer_guid,
+          const ParallelTensor _input,
+          float _eps,
+          char const *name);
+  RMSNorm(FFModel &model,
+          RMSNormParams const &params,
+          ParallelTensor input,
+          char const *name = nullptr);
+  void init(FFModel const &);
+  void forward(FFModel const &);
+  void backward(FFModel const &);
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
+  void print_layer(FFModel const &model) {
+    assert(0);
+  }
+
+  static Op *
+      create_operator_from_layer(FFModel &model,
+                                 Layer const *layer,
+                                 std::vector<ParallelTensor> const &inputs);
+  void serialize(Legion::Serializer &) const override;
+  static PCG::Node deserialize(FFModel &ff,
+                               Legion::Deserializer &d,
+                               ParallelTensor inputs[],
+                               int num_inputs);
+  Op *materialize(FFModel &ff,
+                  ParallelTensor inputs[],
+                  int num_inputs) const override;
+  RMSNormParams get_params() const;
+
+  static OpMeta *init_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static void forward_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  bool measure_operator_cost(Simulator *sim,
+                             MachineView const &pc,
+                             CostMetrics &cost_metrics) const;
+
+public:
+  float eps;
+  char op_name[MAX_OPNAME];
+  int effective_batch_size;
+  int data_dim;
+};
+} // namespace FlexFlow
+#endif // _FLEXFLOW_RMS_NORM_H
\ No newline at end of file
diff --git a/include/flexflow/ops/rms_norm_params.h b/include/flexflow/ops/rms_norm_params.h
new file mode 100644
index 0000000000..c5d71f71ce
--- /dev/null
+++ b/include/flexflow/ops/rms_norm_params.h
@@ -0,0 +1,26 @@
+#ifndef _FLEXFLOW_RMSNORM_PARAMS_H
+#define _FLEXFLOW_RMSNORM_PARAMS_H
+
+#include "flexflow/parallel_tensor.h"
+
+namespace FlexFlow {
+
+struct RMSNormParams {
+  LayerID layer_guid;
+  float eps;
+
+  bool is_valid(ParallelTensorShape const &) const;
+};
+
+bool operator==(RMSNormParams const &, RMSNormParams const &);
+
+} // namespace FlexFlow
+
+namespace std {
+template <>
+struct hash<FlexFlow::RMSNormParams> {
+  size_t operator()(FlexFlow::RMSNormParams const &) const;
+};
+} // namespace std
+
+#endif // _FLEXFLOW_RMSNORM_PARAMS_H
\ No newline at end of file
diff --git a/src/ops/kernels/rms_norm_kernels.cu b/src/ops/kernels/rms_norm_kernels.cu
new file mode 100644
index 0000000000..5fa13d064a
--- /dev/null
+++ b/src/ops/kernels/rms_norm_kernels.cu
@@ -0,0 +1,167 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/kernels/rms_norm_kernels.h"
+#include "flexflow/ops/rms_norm.h"
+#include "flexflow/utils/cuda_helper.h"
+#include <cublas_v2.h>
+
+namespace FlexFlow {
+// declare Legion names
+using Legion::coord_t;
+
+#define C10_WARP_SIZE 32
+constexpr int kCUDABlockReduceNumThreads = 512;
+constexpr int kCUDANumThreads = 256;
+
+RMSNormMeta::RMSNormMeta(FFHandler handler, RMSNorm const *rms)
+    : OpMeta(handler, rms) {
+  eps = rms->eps;
+  alpha = 1.0f;
+  beta = 0.0f;
+
+  in_dim = rms->data_dim;
+  batch_size = rms->effective_batch_size;
+  num_elements = in_dim * batch_size;
+
+  checkCUDA(cudaMalloc(&rms_ptr, batch_size * sizeof(float)));
+  checkCUDA(cudaMalloc(&norm_ptr, num_elements * sizeof(float)));
+}
+
+namespace Kernels {
+namespace RMSNorm {
+
+template <typename T>
+__device__ __forceinline__ T WARP_SHFL_DOWN(T value,
+                                            unsigned int delta,
+                                            int width = warpSize,
+                                            unsigned int mask = 0xffffffff) {
+#ifndef __HIP_PLATFORM_HCC__
+  return __shfl_down_sync(mask, value, delta, width);
+#else
+  return __shfl_down(value, delta, width);
+#endif
+}
+
+template <typename T>
+__inline__ __device__ T WarpReduceSum(T val) {
+#pragma unroll
+  for (int offset = (C10_WARP_SIZE >> 1); offset > 0; offset >>= 1) {
+    val += WARP_SHFL_DOWN(val, offset);
+  }
+  return val;
+}
+
+template <typename T>
+__inline__ __device__ T BlockReduceSum(T val, T *shared) {
+  int const lid = threadIdx.x % C10_WARP_SIZE;
+  int const wid = threadIdx.x / C10_WARP_SIZE;
+  val = WarpReduceSum(val);
+  __syncthreads();
+  if (lid == 0) {
+    shared[wid] = val;
+  }
+  __syncthreads();
+  val = (threadIdx.x < blockDim.x / C10_WARP_SIZE) ? shared[lid] : 0;
+  if (wid == 0) {
+    val = WarpReduceSum(val);
+  }
+  return val;
+}
+
+template <typename T>
+__global__ void
+    RowwiseRootMeanSquareKernel(int64_t N, T eps, T const *X, T *rms) {
+  __shared__ T v_shared[C10_WARP_SIZE];
+  const int64_t i = blockIdx.x;
+  T sum = 0;
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
+    const int64_t index = i * N + j;
+    sum += static_cast<T>(X[index]) * static_cast<T>(X[index]);
+  }
+  sum = BlockReduceSum<T>(sum, v_shared); // use BlockReduceSum() to sum X_ij^2
+  if (threadIdx.x == 0) {
+    rms[i] = sqrt((static_cast<T>(N) / sum) + static_cast<T>(eps));
+  }
+}
+
+template <typename T>
+__global__ void NormKernel(int64_t N, T const *X, T const *rstd, T *Y) {
+  using T_ACC = T;
+  const int64_t i = blockIdx.x;
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
+    const int64_t index = i * N + j;
+    Y[index] = static_cast<T_ACC>(X[index]) * static_cast<T_ACC>(rstd[i]);
+  }
+}
+
+void forward_kernel_wrapper(RMSNormMeta const *m,
+                            GenericTensorAccessorR const &input,
+                            GenericTensorAccessorR const &weight,
+                            GenericTensorAccessorW const &output) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+
+  RowwiseRootMeanSquareKernel<float>
+      <<<m->batch_size, kCUDABlockReduceNumThreads, 0, stream>>>(
+          m->in_dim, m->eps, input.get_float_ptr(), m->rms_ptr);
+  NormKernel<float><<<m->batch_size, kCUDANumThreads, 0, stream>>>(
+      m->in_dim, input.get_float_ptr(), m->rms_ptr, m->norm_ptr);
+
+  checkCUDA(cublasGemmEx(
+      m->handle.blas,
+      CUBLAS_OP_T, // transpose weight (column major)
+      CUBLAS_OP_N,
+      m->in_dim,
+      m->batch_size,
+      m->in_dim,
+      &(m->alpha),
+      weight.get_float_ptr(), // weight, shape (in_dim, in_dim)
+      CUDA_R_32F,
+      m->in_dim,
+      m->norm_ptr, // norm, shape (in_dim, batch_size)
+      CUDA_R_32F,
+      m->in_dim,
+      &(m->beta),
+      output
+          .get_float_ptr(), // output, shape (in_dim, batch_size), same as norm
+      CUDA_R_32F,
+      m->in_dim,
+      CUDA_R_32F,
+      CUBLAS_GEMM_DFALT_TENSOR_OP));
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[RMSNorm] forward time (CF) = %.2fms\n", elapsed);
+    print_tensor<float>(input.get_float_ptr(), 32, "[RMSNorm:forward:input]");
+    print_tensor<float>(output.get_float_ptr(), 32, "[RMSNorm:forward:output]");
+  }
+}
+
+} // namespace RMSNorm
+} // namespace Kernels
+} // namespace FlexFlow
\ No newline at end of file
diff --git a/src/ops/rms_norm.cc b/src/ops/rms_norm.cc
new file mode 100644
index 0000000000..3d8daa4389
--- /dev/null
+++ b/src/ops/rms_norm.cc
@@ -0,0 +1,377 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/rms_norm.h"
+#include "flexflow/model.h"
+#include "flexflow/ops/kernels/rms_norm_kernels.h"
+#include "flexflow/utils/hash_utils.h"
+#include "legion/legion_utilities.h"
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::ArgumentMap;
+using Legion::Context;
+using Legion::Domain;
+using Legion::FutureMap;
+using Legion::IndexLauncher;
+using Legion::PhysicalRegion;
+using Legion::Predicate;
+using Legion::Rect;
+using Legion::RegionRequirement;
+using Legion::Runtime;
+using Legion::Task;
+using Legion::TaskArgument;
+using Legion::TaskLauncher;
+
+using namespace FlexFlow::Kernels::RMSNorm;
+
+bool operator==(RMSNormParams const &lhs, RMSNormParams const &rhs) {
+  return lhs.layer_guid == rhs.layer_guid && lhs.eps == rhs.eps;
+}
+
+bool RMSNormParams::is_valid(ParallelTensorShape const &input) const {
+  return input.is_valid();
+}
+
+RMSNormParams RMSNorm::get_params() const {
+  RMSNormParams params;
+  params.layer_guid = this->layer_guid;
+  params.eps = this->eps;
+  return params;
+}
+
+Tensor FFModel::rms_norm(const Tensor input,
+                         float eps,
+                         int dim,
+                         char const *name) {
+  Layer *rm = new Layer(this,
+                        OP_RMS_NORM,
+                        DT_FLOAT,
+                        name,
+                        1 /*inputs*/,
+                        1 /*weights*/,
+                        1 /*outputs*/,
+                        input);
+  rm->outputs[0] = create_tensor_legion_ordering(
+      input->num_dims, input->dims, DT_FLOAT, rm, 0, true /*create_grad*/);
+
+  // weights
+  int weight_dims[1] = {input->dims[input->num_dims - 1]};
+  rm->weights[0] = create_weight_legion_ordering(1,
+                                                 weight_dims,
+                                                 DT_FLOAT,
+                                                 rm,
+                                                 true /*create_grad*/,
+                                                 nullptr,
+                                                 CHOSEN_SYNC_TYPE);
+  rm->add_float_property("eps", eps);
+  layers.push_back(rm);
+  return rm->outputs[0];
+}
+
+Op *RMSNorm::create_operator_from_layer(
+    FFModel &model,
+    Layer const *layer,
+    std::vector<ParallelTensor> const &inputs) {
+  float eps;
+  layer->get_float_property("eps", eps);
+  return new RMSNorm(model, layer->layer_guid, inputs[0], eps, layer->name);
+}
+
+RMSNorm::RMSNorm(FFModel &model,
+                 RMSNormParams const &params,
+                 ParallelTensor const input,
+                 char const *name)
+    : RMSNorm(model, params.layer_guid, input, params.eps, name) {}
+
+RMSNorm::RMSNorm(FFModel &model,
+                 LayerID const &_layer_guid,
+                 const ParallelTensor _input,
+                 float _eps,
+                 char const *name)
+    : Op(model,
+         OP_RMS_NORM,
+         _input->data_type,
+         name,
+         1 /*num of inputs tensor */,
+         1 /*num of weights tensor */,
+         1 /*onum of utputs tensor */,
+         _input) {
+
+  inputs[0] = _input;
+
+  int num_dims = _input->num_dims;
+  data_dim = _input->dims[0].size;
+  effective_batch_size = 1;
+  for (int i = 1; i <= num_dims - 2; i++) {
+    effective_batch_size *= _input->dims[i].size;
+  }
+
+  // output has the same parallel dims as input
+  ParallelDim output_dims[MAX_TENSOR_DIM];
+  ParallelDim weight_dims[MAX_TENSOR_DIM];
+  for (int i = 0; i < _input->num_dims; i++) {
+    output_dims[i] = _input->dims[i];
+    weight_dims[i] = _input->dims[i];
+    weight_dims[i].size = 1;
+  }
+
+  // weights should have the shape of (data_dim, data_dim)
+  weight_dims[0].size = _input->dims[0].size;
+  weight_dims[1].size = _input->dims[0].size;
+
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      _input->num_dims, output_dims, _input->data_type, this);
+
+  // weights
+  Initializer *kernel_initializer = new GlorotUniform(std::rand() /*seed*/);
+
+  // TODO: weight dims check
+  weights[0] =
+      model.create_parallel_weight_legion_ordering(_input->num_dims,
+                                                   weight_dims,
+                                                   _input->data_type,
+                                                   this /*owner_op*/,
+                                                   true /*create_grad*/,
+                                                   kernel_initializer,
+                                                   CHOSEN_SYNC_TYPE);
+}
+
+void RMSNorm::init(FFModel const &ff) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(RMSNROM_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(RMSNorm)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
+void RMSNorm::init_inference(FFModel const &ff,
+                             std::vector<ParallelTensor> const &batch_inputs,
+                             std::vector<ParallelTensor> const &batch_outputs,
+                             MachineView const *mv) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
+
+  IndexLauncher launcher(RMSNROM_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(RMSNorm)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
+}
+
+OpMeta *RMSNorm::init_task(Task const *task,
+                           std::vector<PhysicalRegion> const &regions,
+                           Context ctx,
+                           Runtime *runtime) {
+  RMSNorm *rn = (RMSNorm *)task->args;
+  FFHandler handle = *((FFHandler const *)task->local_args);
+  RMSNormMeta *meta = new RMSNormMeta(handle, rn);
+  return meta;
+}
+
+void RMSNorm::forward(FFModel const &ff) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_forward(ff, argmap);
+  IndexLauncher launcher(RMSNROM_FWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(2, FID_DATA);
+  runtime->execute_index_space(ctx, launcher);
+}
+
+FutureMap RMSNorm::inference(FFModel const &ff,
+                             BatchConfig const &bc,
+                             std::vector<ParallelTensor> const &batch_inputs,
+                             std::vector<ParallelTensor> const &batch_outputs,
+                             MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+
+  IndexLauncher launcher(RMSNROM_FWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(2, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+/*
+  regions[0](I): input
+  regions[1](O): output
+  regions[2](I/O): weight
+*/
+void RMSNorm::forward_task(Task const *task,
+                           std::vector<PhysicalRegion> const &regions,
+                           Context ctx,
+                           Runtime *runtime) {
+  assert(task->regions.size() == 3);
+  assert(regions.size() == 3);
+  RMSNormMeta const *m = *((RMSNormMeta **)task->local_args);
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
+      m->input_type[1], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  forward_kernel_wrapper(m, input, weight, output);
+}
+
+void RMSNorm::serialize(Legion::Serializer &sez) const {
+  sez.serialize(this->layer_guid.id);
+  sez.serialize(this->eps);
+}
+
+using PCG::Node;
+/*static*/
+Node RMSNorm::deserialize(FFModel &ff,
+                          Legion::Deserializer &dez,
+                          ParallelTensor inputs[],
+                          int num_inputs) {
+  assert(num_inputs == 1);
+  float eps;
+  size_t id;
+  dez.deserialize(id);
+  LayerID layer_guid(id);
+  dez.deserialize(eps);
+
+  RMSNormParams params;
+  params.layer_guid = layer_guid;
+  params.eps = eps;
+  return ff.get_or_create_node<RMSNorm>(inputs[0], params);
+}
+
+Op *RMSNorm::materialize(FFModel &ff,
+                         ParallelTensor inputs[],
+                         int num_inputs) const {
+  RMSNormParams params = get_params();
+  return new RMSNorm(ff, params, inputs[0], this->name);
+}
+
+void RMSNorm::backward(FFModel const &ff) {}
+
+bool RMSNorm::measure_operator_cost(Simulator *sim,
+                                    MachineView const &mv,
+                                    CostMetrics &cost_metrics) const {
+  return false;
+}
+
+} // namespace FlexFlow
+namespace std {
+size_t hash<FlexFlow::RMSNormParams>::operator()(
+    FlexFlow::RMSNormParams const &params) const {
+  size_t key = 0;
+  hash_combine(key, params.eps);
+  return key;
+}
+}; // namespace std
\ No newline at end of file
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index 700da55eda..432467bbcf 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -37,6 +37,7 @@
 #include "flexflow/ops/pool_2d.h"
 #include "flexflow/ops/reduce.h"
 #include "flexflow/ops/reshape.h"
+#include "flexflow/ops/rms_norm.h"
 #include "flexflow/ops/softmax.h"
 #include "flexflow/ops/split.h"
 #include "flexflow/ops/topk.h"
@@ -2712,6 +2713,10 @@ void FFModel::deserialize_graph_optimal_view(
         node = Transpose::deserialize(*this, dez, inputs, num_inputs);
         break;
       }
+      case OP_RMS_NORM: {
+        node = RMSNorm::deserialize(*this, dez, inputs, num_inputs);
+        break;
+      }
       case OP_COMBINE: {
         assert(num_inputs == 1);
         int combine_dim, combine_degree;
diff --git a/src/runtime/operator_params.cc b/src/runtime/operator_params.cc
index 69f28ca680..201a6449c2 100644
--- a/src/runtime/operator_params.cc
+++ b/src/runtime/operator_params.cc
@@ -24,6 +24,7 @@
 #include "flexflow/ops/reduce.h"
 #include "flexflow/ops/reshape.h"
 #include "flexflow/ops/reverse.h"
+#include "flexflow/ops/rms_norm.h"
 #include "flexflow/ops/softmax.h"
 #include "flexflow/ops/split.h"
 #include "flexflow/ops/topk.h"
@@ -113,6 +114,8 @@ tl::optional<OperatorParameters> get_op_parameters(Op const *op) {
       return ((Aggregate *)op)->get_params();
     case OP_AGG_SPEC:
       return ((AggregateSpec *)op)->get_params();
+    case OP_RMS_NORM:
+      return ((RMSNorm *)op)->get_params();
 
       // TODO: implement the get_params() function for the operators below and
       // uncomment the lines below

From 26249657aeb1ba9441038a9e247109c8a028dc22 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 6 Apr 2023 17:11:04 -0400
Subject: [PATCH 092/344] [Inference][Experts] - Add comprehensive testing to
 fused Experts operator, and fix bugs (#678)

* added checks, fixed bugs

* linting

* bug fix

* finished bug fixing, commented out tests

* cleanup
---
 examples/cpp/inference/inference_config.h |   4 +-
 src/ops/experts.cu                        | 570 +++++++++++++++++++++-
 2 files changed, 566 insertions(+), 8 deletions(-)

diff --git a/examples/cpp/inference/inference_config.h b/examples/cpp/inference/inference_config.h
index 8301640e45..53811dd99f 100644
--- a/examples/cpp/inference/inference_config.h
+++ b/examples/cpp/inference/inference_config.h
@@ -31,7 +31,7 @@ struct InferenceConfig {
     batch_size = BATCH_SIZE;
     out_dim = DATA_DIM;
     num_labels = out_dim;
-    num_layers = 3;
+    num_layers = 12;
 
     vocab_size = 50257;
     block_size = 1024;
@@ -49,7 +49,7 @@ struct InferenceConfig {
     // Encoder layer
     num_attention_heads = 16;
     attention_kdim = attention_vdim = hidden_size / num_attention_heads;
-    num_encoder_layers = 3;
+    num_encoder_layers = 12;
   }
 
   // Input/output data
diff --git a/src/ops/experts.cu b/src/ops/experts.cu
index c4c5620cff..1a81d9118c 100644
--- a/src/ops/experts.cu
+++ b/src/ops/experts.cu
@@ -443,7 +443,244 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                  &gemm_batch_count,
                                  stream);
 
-  cudaStreamSynchronize(stream);
+  checkCUDA(cudaStreamSynchronize(stream));
+
+#ifdef INFERENCE_TESTS
+  // Checking
+  // 1. check that m->sorted_indices contains indices sorted
+  int *indices_cpu = download_tensor<int>(indices, num_indices);
+  // assert(indices_cpu != nullptr);
+  std::vector<int> indices_vec(indices_cpu, indices_cpu + num_indices);
+  std::vector<int> indices_vec_sorted(indices_vec.size());
+  std::copy(indices_vec.begin(), indices_vec.end(), indices_vec_sorted.begin());
+  std::stable_sort(indices_vec_sorted.begin(), indices_vec_sorted.end());
+
+  int *thrust_sorted_indices_cpu = download_tensor<int>(
+      m->sorted_indices, m->num_chosen_experts * m->effective_batch_size);
+  // assert(thrust_sorted_indices_cpu != nullptr);
+  std::vector<int> thrust_sorted_indices_vec(
+      thrust_sorted_indices_cpu, thrust_sorted_indices_cpu + num_indices);
+  for (int i = 0; i < num_indices; i++) {
+    if (indices_vec_sorted[i] != thrust_sorted_indices_vec[i]) {
+      printf("i=%i\n", i);
+      printf("indices: ");
+      std::copy(indices_vec.begin(),
+                indices_vec.end(),
+                std::ostream_iterator<int>(std::cout, " "));
+      std::cout << std::endl;
+      printf("indices_vec_sorted: ");
+      std::copy(indices_vec_sorted.begin(),
+                indices_vec_sorted.end(),
+                std::ostream_iterator<int>(std::cout, " "));
+      std::cout << std::endl;
+      printf("thrust_sorted_indices_vec: ");
+      std::copy(thrust_sorted_indices_vec.begin(),
+                thrust_sorted_indices_vec.end(),
+                std::ostream_iterator<int>(std::cout, " "));
+      std::cout << std::endl;
+    }
+    assert(indices_vec_sorted[i] == thrust_sorted_indices_vec[i]);
+  }
+  // 2. check that indices[m->original_indices[i]] = i
+  int *thrust_original_indices_cpu = download_tensor<int>(
+      m->original_indices, m->num_chosen_experts * m->effective_batch_size);
+  // assert(thrust_original_indices_cpu != nullptr);
+  std::vector<int> thrust_original_indices_vec(
+      thrust_original_indices_cpu, thrust_original_indices_cpu + num_indices);
+  for (int i = 0; i < num_indices; i++) {
+    assert(indices_vec[thrust_original_indices_vec[i]] ==
+           thrust_sorted_indices_vec[i]);
+  }
+
+  // 3. check that lb_index is the index of the first element greater or equal
+  // to expert_start_idx
+  // 4. check that ub_index is greater than last, or outside array
+  std::vector<int>::iterator low, up;
+  low = std::lower_bound(
+      indices_vec_sorted.begin(), indices_vec_sorted.end(), experts_start_idx);
+  up = std::upper_bound(indices_vec_sorted.begin(),
+                        indices_vec_sorted.end(),
+                        experts_start_idx + num_experts_per_block - 1);
+  int lb_index_check = low - indices_vec_sorted.begin(),
+      ub_index_check = up - indices_vec_sorted.begin();
+
+  if (lb_index_check != lb_index || ub_index_check != ub_index) {
+    printf("experts_start_idx: %i, num_experts_per_block: %i, lb_index: %i, "
+           "lb_index_check: %i, ub_index: %i, ub_index_check: %i\n",
+           experts_start_idx,
+           num_experts_per_block,
+           lb_index,
+           lb_index_check,
+           ub_index,
+           ub_index_check);
+    printf("indices_vec_sorted: ");
+    std::copy(indices_vec_sorted.begin(),
+              indices_vec_sorted.end(),
+              std::ostream_iterator<int>(std::cout, " "));
+    std::cout << std::endl;
+  }
+  assert(lb_index_check == lb_index);
+  assert(ub_index_check == ub_index);
+
+  // 5. compute num_valid_assignments manually, and check that is equal to value
+  // computed in thrust
+  int num_valid_assignments_manual = ub_index_check - lb_index_check;
+  assert(num_valid_assignments_manual == num_valid_assignments);
+
+  // 6. check m->non_zero_expert_labels, *non_zero_experts_count
+  std::set<int> non_zero_experts_check;
+  for (int i = 0; i < num_indices; i++) {
+    if (indices_vec_sorted[i] >= experts_start_idx &&
+        indices_vec_sorted[i] < experts_start_idx + num_experts_per_block) {
+      non_zero_experts_check.insert(indices_vec_sorted[i]);
+    }
+  }
+  assert(non_zero_experts_count == non_zero_experts_check.size());
+  // 7. check exp_local_label_to_index
+  int *non_zero_expert_labels_cpu =
+      download_tensor<int>(m->non_zero_expert_labels, non_zero_experts_count);
+  // assert(non_zero_expert_labels_cpu != nullptr);
+  std::vector<int> non_zero_expert_labels_vec(non_zero_expert_labels_cpu,
+                                              non_zero_expert_labels_cpu +
+                                                  non_zero_experts_count);
+  assert(std::is_sorted(non_zero_expert_labels_vec.begin(),
+                        non_zero_expert_labels_vec.end()));
+  std::vector<int> non_zero_experts_check_vec;
+  for (auto el : non_zero_experts_check) {
+    non_zero_experts_check_vec.push_back(el - experts_start_idx);
+  }
+  assert(std::is_sorted(non_zero_experts_check_vec.begin(),
+                        non_zero_experts_check_vec.end()));
+  assert(non_zero_expert_labels_vec == non_zero_experts_check_vec);
+
+  int *exp_local_label_to_index =
+      download_tensor<int>(m->exp_local_label_to_index, non_zero_experts_count);
+  // assert(exp_local_label_to_index != nullptr);
+  std::vector<int> exp_local_label_to_index_vec(exp_local_label_to_index,
+                                                exp_local_label_to_index +
+                                                    non_zero_experts_count);
+  int z = 0;
+  for (int i = 0; i < non_zero_experts_count; i++) {
+    if (non_zero_experts_check.find(i) != non_zero_experts_check.end()) {
+      assert(exp_local_label_to_index_vec[i] == z);
+      z++;
+    }
+  }
+
+  // 8. Check expert_start_indexes
+  int *expert_start_indices_thrust =
+      download_tensor<int>(m->expert_start_indexes, non_zero_experts_count + 1);
+  // assert(expert_start_indices_thrust != nullptr);
+  std::vector<int> expert_start_indices_thrust_vec(
+      expert_start_indices_thrust,
+      expert_start_indices_thrust + non_zero_experts_count + 1);
+  std::vector<int> expert_start_indices_cpu;
+  std::set<int> exp_label;
+
+  std::vector<int> num_assignments_per_expert_cpu;
+
+  for (int i = lb_index; i < ub_index; i++) {
+    assert(indices_vec_sorted[i] >= experts_start_idx &&
+           indices_vec_sorted[i] < experts_start_idx + num_experts_per_block);
+    if (exp_label.find(indices_vec_sorted[i]) == exp_label.end()) {
+      exp_label.insert(indices_vec_sorted[i]);
+      expert_start_indices_cpu.push_back(i - lb_index);
+
+      num_assignments_per_expert_cpu.push_back(1);
+    } else {
+      num_assignments_per_expert_cpu[num_assignments_per_expert_cpu.size() -
+                                     1] += 1;
+    }
+  }
+  expert_start_indices_cpu.push_back(ub_index - lb_index);
+  assert(num_assignments_per_expert_cpu.size() == non_zero_experts_count);
+  /* std::cout << "indices_vec_sorted: ";
+  for (int i=lb_index; i<ub_index; i++) {
+    std::cout << indices_vec_sorted[i] << " ";
+  }
+  std::cout << "expert_start_indices_cpu: ";
+  for (int i=0; i<expert_start_indices_cpu.size(); i++) {
+    std::cout << expert_start_indices_cpu[i] << " ";
+  }
+  std::cout << std::endl;
+  std::cout << "expert_start_indices_thrust_vec: ";
+  for (int i=0; i<expert_start_indices_thrust_vec.size(); i++) {
+    std::cout << expert_start_indices_thrust_vec[i] << " ";
+  }
+  std::cout << std::endl; */
+  assert(std::is_sorted(expert_start_indices_cpu.begin(),
+                        expert_start_indices_cpu.end()));
+  assert(expert_start_indices_cpu == expert_start_indices_thrust_vec);
+
+  int *num_assignments_per_expert_thrust =
+      (int *)calloc(non_zero_experts_count, sizeof(int));
+  assert(num_assignments_per_expert_thrust != nullptr);
+  assert(download_tensor<int>(m->num_assignments_per_expert,
+                              num_assignments_per_expert_thrust,
+                              non_zero_experts_count));
+  assert(num_assignments_per_expert_thrust != nullptr);
+  std::vector<int> num_assignments_per_expert_thrust_vec(
+      num_assignments_per_expert_thrust,
+      num_assignments_per_expert_thrust + non_zero_experts_count);
+  assert(num_assignments_per_expert_cpu ==
+         num_assignments_per_expert_thrust_vec);
+
+  int *destination_start_indices_thrust =
+      (int *)calloc(non_zero_experts_count, sizeof(int));
+  assert(destination_start_indices_thrust != nullptr);
+  assert(download_tensor<int>(m->destination_start_indices,
+                              destination_start_indices_thrust,
+                              non_zero_experts_count));
+  assert(destination_start_indices_thrust != nullptr);
+  std::vector<int> destination_start_indices_thrust_vec(
+      destination_start_indices_thrust,
+      destination_start_indices_thrust + non_zero_experts_count);
+  std::vector<int> destination_start_indices_cpu;
+  int gemm_batch_count_cpu = 0;
+  for (int i = 0; i < num_assignments_per_expert_cpu.size(); i++) {
+    if (i == 0) {
+      destination_start_indices_cpu.push_back(0);
+    } else {
+      destination_start_indices_cpu.push_back(
+          std::min(expert_capacity, num_assignments_per_expert_cpu[i - 1]));
+    }
+  }
+  for (int i = 0; i < num_assignments_per_expert_cpu.size(); i++) {
+    gemm_batch_count_cpu +=
+        std::min(expert_capacity, num_assignments_per_expert_cpu[i]);
+  }
+  for (int i = 1; i < destination_start_indices_cpu.size(); i++) {
+    destination_start_indices_cpu[i] += destination_start_indices_cpu[i - 1];
+  }
+  /*
+  std::cout << "destination_start_indices_cpu: ";
+  for (int i=0; i<destination_start_indices_cpu.size(); i++) {
+    std::cout << destination_start_indices_cpu[i] << " ";
+  }
+  std::cout << std::endl;
+  std::cout << "destination_start_indices_thrust_vec: ";
+  for (int i=0; i<destination_start_indices_thrust_vec.size(); i++) {
+    std::cout << destination_start_indices_thrust_vec[i] << " ";
+  }
+  std::cout << std::endl; */
+  assert(destination_start_indices_cpu == destination_start_indices_thrust_vec);
+  assert(gemm_batch_count == gemm_batch_count_cpu);
+
+  checkCUDA(cudaFreeHost(thrust_sorted_indices_cpu));
+  checkCUDA(cudaFreeHost(thrust_original_indices_cpu));
+  checkCUDA(cudaFreeHost(non_zero_expert_labels_cpu));
+  checkCUDA(cudaFreeHost(exp_local_label_to_index));
+  checkCUDA(cudaFreeHost(expert_start_indices_thrust));
+  free(num_assignments_per_expert_thrust);
+  free(destination_start_indices_thrust);
+
+  non_zero_experts_check_vec.clear();
+  non_zero_experts_check_vec.shrink_to_fit();
+  expert_start_indices_cpu.clear();
+  expert_start_indices_cpu.shrink_to_fit();
+  destination_start_indices_cpu.clear();
+  destination_start_indices_cpu.shrink_to_fit();
+#endif
 
   assert(ub_index - lb_index == num_valid_assignments);
   assert(num_valid_assignments >= non_zero_experts_count);
@@ -495,7 +732,324 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                              m->coefficient_idx_array,
                                              m->output_idx_array);
 
-  cudaStreamSynchronize(stream);
+  checkCUDA(cudaStreamSynchronize(stream));
+
+#ifdef INFERENCE_TESTS
+  std::vector<float const *> token_ptrs, weight_ptrs, bias_ptrs,
+      coefficient_ptrs;
+  std::vector<float *> output_ptrs;
+  std::map<int, int> num_t_per_exp;
+  for (int i = 0; i < num_indices; i++) {
+    int global_exp_label = indices_vec[i];
+
+    if (global_exp_label >= experts_start_idx &&
+        global_exp_label < experts_start_idx + num_experts_per_block &&
+        (num_t_per_exp.find(global_exp_label) == num_t_per_exp.end() ||
+         num_t_per_exp[global_exp_label] < expert_capacity)) {
+      if (num_t_per_exp.find(global_exp_label) == num_t_per_exp.end()) {
+        num_t_per_exp[global_exp_label] = 1;
+      } else {
+        num_t_per_exp[global_exp_label] = num_t_per_exp[global_exp_label] + 1;
+      }
+      int token_idx = i / num_chosen_experts;
+      // std::cout << "Push back token_idx (" << token_idx << ") * data_dim ("
+      // << data_dim << "): " << token_idx*data_dim << std::endl;
+
+      token_ptrs.push_back(&input[token_idx * data_dim]);
+      coefficient_ptrs.push_back(&topk_gate_preds[i]);
+      int local_exp_label = global_exp_label - experts_start_idx;
+      weight_ptrs.push_back(weights[local_exp_label * (1 + use_bias)]);
+      output_ptrs.push_back(&output[token_idx * out_dim]);
+      if (use_bias) {
+        bias_ptrs.push_back(
+            weights[local_exp_label * (1 + use_bias) + use_bias]);
+      }
+    }
+  }
+
+  int i = 0, s = 0;
+  for (auto it : num_t_per_exp) {
+    int num_t = it.second;
+    s += num_t;
+    /* if (num_assignments_per_expert_cpu[i] != num_t) {
+      std::cout << "num_assignments_per_expert_cpu: ";
+      for (int j=0; j<num_assignments_per_expert_cpu.size(); j++) {
+        std::cout << num_assignments_per_expert_cpu[j] << " ";
+      }
+      std::cout << std::endl;
+      std::cout << "num_t_per_exp: ";
+      for (auto it2 : num_t_per_exp) {
+        std::cout << "(" << it2.first << ", " << it2.second << ") ";
+      }
+      std::cout << std::endl;
+      std::cout << "expert capacity: " << expert_capacity << std::endl;
+    }
+    assert(num_assignments_per_expert_cpu[i] == num_t); */
+    i++;
+  }
+  assert(s == gemm_batch_count);
+  assert(token_ptrs.size() == gemm_batch_count &&
+         weight_ptrs.size() == gemm_batch_count &&
+         coefficient_ptrs.size() == gemm_batch_count &&
+         output_ptrs.size() == gemm_batch_count);
+  if (use_bias) {
+    assert(bias_ptrs.size() == gemm_batch_count);
+  }
+
+  std::vector<float const *> token_ptrs_sorted(token_ptrs.size()),
+      weight_ptrs_sorted(weight_ptrs.size()),
+      bias_ptrs_sorted(bias_ptrs.size()),
+      coefficient_ptrs_sorted(coefficient_ptrs.size());
+  std::vector<float *> output_ptrs_sorted(output_ptrs.size());
+  std::copy(token_ptrs.begin(), token_ptrs.end(), token_ptrs_sorted.begin());
+  std::sort(token_ptrs_sorted.begin(), token_ptrs_sorted.end());
+  std::copy(weight_ptrs.begin(), weight_ptrs.end(), weight_ptrs_sorted.begin());
+  std::sort(weight_ptrs_sorted.begin(), weight_ptrs_sorted.end());
+  std::copy(bias_ptrs.begin(), bias_ptrs.end(), bias_ptrs_sorted.begin());
+  std::sort(bias_ptrs_sorted.begin(), bias_ptrs_sorted.end());
+  std::copy(coefficient_ptrs.begin(),
+            coefficient_ptrs.end(),
+            coefficient_ptrs_sorted.begin());
+  std::sort(coefficient_ptrs_sorted.begin(), coefficient_ptrs_sorted.end());
+  std::copy(output_ptrs.begin(), output_ptrs.end(), output_ptrs_sorted.begin());
+  std::sort(output_ptrs_sorted.begin(), output_ptrs_sorted.end());
+
+  // Download
+  float const **token_idx_array_thrust =
+      (float const **)calloc(gemm_batch_count, sizeof(float const *));
+  assert(token_idx_array_thrust);
+  checkCUDA(cudaMemcpy(token_idx_array_thrust,
+                       m->token_idx_array,
+                       sizeof(float const *) * gemm_batch_count,
+                       cudaMemcpyDeviceToHost));
+  std::vector<float const *> token_idx_array_thrust_vec(
+      token_idx_array_thrust, token_idx_array_thrust + gemm_batch_count);
+  float const **weight_idx_array_thrust =
+      (float const **)calloc(gemm_batch_count, sizeof(float const *));
+  assert(weight_idx_array_thrust);
+  checkCUDA(cudaMemcpy(weight_idx_array_thrust,
+                       m->weight_idx_array,
+                       sizeof(float const *) * gemm_batch_count,
+                       cudaMemcpyDeviceToHost));
+  std::vector<float const *> weight_idx_array_thrust_vec(
+      weight_idx_array_thrust, weight_idx_array_thrust + gemm_batch_count);
+  float const **coefficient_idx_array_thrust =
+      (float const **)calloc(gemm_batch_count, sizeof(float const *));
+  assert(coefficient_idx_array_thrust);
+  checkCUDA(cudaMemcpy(coefficient_idx_array_thrust,
+                       m->coefficient_idx_array,
+                       sizeof(float const *) * gemm_batch_count,
+                       cudaMemcpyDeviceToHost));
+  std::vector<float const *> coefficient_idx_array_thrust_vec(
+      coefficient_idx_array_thrust,
+      coefficient_idx_array_thrust + gemm_batch_count);
+  float const **bias_idx_array_thrust =
+      (float const **)calloc(gemm_batch_count, sizeof(float const *));
+  assert(bias_idx_array_thrust);
+  if (use_bias) {
+    checkCUDA(cudaMemcpy(bias_idx_array_thrust,
+                         m->bias_idx_array,
+                         sizeof(float const *) * gemm_batch_count,
+                         cudaMemcpyDeviceToHost));
+  }
+  std::vector<float const *> bias_idx_array_thrust_vec(
+      bias_idx_array_thrust, bias_idx_array_thrust + gemm_batch_count);
+  float **output_idx_array_thrust =
+      (float **)calloc(gemm_batch_count, sizeof(float *));
+  assert(output_idx_array_thrust);
+  checkCUDA(cudaMemcpy(output_idx_array_thrust,
+                       m->output_idx_array,
+                       sizeof(float *) * gemm_batch_count,
+                       cudaMemcpyDeviceToHost));
+  std::vector<float *> output_idx_array_thrust_vec(
+      output_idx_array_thrust, output_idx_array_thrust + gemm_batch_count);
+
+  std::vector<float const *> token_idx_array_thrust_vec_sorted(
+      token_idx_array_thrust_vec.size()),
+      weight_idx_array_thrust_vec_sorted(weight_idx_array_thrust_vec.size()),
+      coefficient_idx_array_thrust_vec_sorted(
+          coefficient_idx_array_thrust_vec.size()),
+      bias_idx_array_thrust_vec_sorted(bias_idx_array_thrust_vec.size());
+  std::vector<float *> output_idx_array_thrust_vec_sorted(
+      output_idx_array_thrust_vec.size());
+  std::copy(token_idx_array_thrust_vec.begin(),
+            token_idx_array_thrust_vec.end(),
+            token_idx_array_thrust_vec_sorted.begin());
+  std::sort(token_idx_array_thrust_vec_sorted.begin(),
+            token_idx_array_thrust_vec_sorted.end());
+  std::copy(weight_idx_array_thrust_vec.begin(),
+            weight_idx_array_thrust_vec.end(),
+            weight_idx_array_thrust_vec_sorted.begin());
+  std::sort(weight_idx_array_thrust_vec_sorted.begin(),
+            weight_idx_array_thrust_vec_sorted.end());
+  std::copy(coefficient_idx_array_thrust_vec.begin(),
+            coefficient_idx_array_thrust_vec.end(),
+            coefficient_idx_array_thrust_vec_sorted.begin());
+  std::sort(coefficient_idx_array_thrust_vec_sorted.begin(),
+            coefficient_idx_array_thrust_vec_sorted.end());
+  std::copy(bias_idx_array_thrust_vec.begin(),
+            bias_idx_array_thrust_vec.end(),
+            bias_idx_array_thrust_vec_sorted.begin());
+  std::sort(bias_idx_array_thrust_vec_sorted.begin(),
+            bias_idx_array_thrust_vec_sorted.end());
+  std::copy(output_idx_array_thrust_vec.begin(),
+            output_idx_array_thrust_vec.end(),
+            output_idx_array_thrust_vec_sorted.begin());
+  std::sort(output_idx_array_thrust_vec_sorted.begin(),
+            output_idx_array_thrust_vec_sorted.end());
+
+  if (token_ptrs_sorted != token_idx_array_thrust_vec_sorted) {
+    std::cout << "token_ptrs: ";
+    for (int i = 0; i < token_ptrs_sorted.size(); i++) {
+      std::cout << token_ptrs_sorted[i] << " ";
+    }
+    std::cout << std::endl;
+    std::cout << "token_idx_array_thrust_vec: ";
+    for (int i = 0; i < token_idx_array_thrust_vec_sorted.size(); i++) {
+      std::cout << token_idx_array_thrust_vec_sorted[i] << " ";
+    }
+    std::cout << std::endl;
+    std::cout << "Input: " << input << std::endl;
+    std::cout << "data_dim: " << data_dim << std::endl;
+    std::cout << "out_dim: " << out_dim << std::endl;
+    std::cout << "expert_start_idx: " << experts_start_idx << std::endl;
+    std::cout << "indices: ";
+    for (int i = 0; i < indices_vec.size(); i++) {
+      std::cout << indices_vec[i] << " ";
+    }
+    std::cout << std::endl;
+    std::cout << "indices_vec_sorted: ";
+    for (int i = 0; i < indices_vec_sorted.size(); i++) {
+      std::cout << indices_vec_sorted[i] << " ";
+    }
+    std::cout << std::endl;
+  }
+  assert(token_ptrs_sorted == token_idx_array_thrust_vec_sorted);
+  assert(weight_ptrs_sorted == weight_idx_array_thrust_vec_sorted);
+  if (coefficient_ptrs_sorted != coefficient_idx_array_thrust_vec_sorted) {
+    std::cout << "coefficient_ptrs_sorted: ";
+    for (int i = 0; i < coefficient_ptrs_sorted.size(); i++) {
+      std::cout << coefficient_ptrs_sorted[i] << " ";
+    }
+    std::cout << std::endl;
+    std::cout << "coefficient_idx_array_thrust_vec_sorted: ";
+    for (int i = 0; i < coefficient_idx_array_thrust_vec_sorted.size(); i++) {
+      std::cout << coefficient_idx_array_thrust_vec_sorted[i] << " ";
+    }
+    std::cout << std::endl;
+    std::cout << "topk_gate_preds: " << topk_gate_preds << std::endl;
+    std::cout << "data_dim: " << data_dim << std::endl;
+    std::cout << "out_dim: " << out_dim << std::endl;
+    std::cout << "expert_start_idx: " << experts_start_idx << std::endl;
+    std::cout << "indices: ";
+    for (int i = 0; i < indices_vec.size(); i++) {
+      std::cout << indices_vec[i] << " ";
+    }
+    std::cout << std::endl;
+    std::cout << "indices_vec_sorted: ";
+    for (int i = 0; i < indices_vec_sorted.size(); i++) {
+      std::cout << indices_vec_sorted[i] << " ";
+    }
+    std::cout << std::endl;
+  }
+  assert(coefficient_ptrs_sorted == coefficient_idx_array_thrust_vec_sorted);
+  if (use_bias) {
+    assert(bias_ptrs_sorted == bias_idx_array_thrust_vec_sorted);
+  }
+  assert(output_ptrs_sorted == output_idx_array_thrust_vec_sorted);
+
+  assert(token_ptrs_sorted.size() == gemm_batch_count &&
+         weight_ptrs_sorted.size() == gemm_batch_count &&
+         coefficient_ptrs_sorted.size() == gemm_batch_count &&
+         (!use_bias || bias_ptrs_sorted.size() == gemm_batch_count) &&
+         output_ptrs_sorted.size() == gemm_batch_count);
+
+  for (int i = 0; i < token_ptrs_sorted.size(); i++) {
+    assert(token_ptrs_sorted[i]);
+    assert(weight_ptrs_sorted[i]);
+    assert(coefficient_ptrs_sorted[i]);
+    if (use_bias) {
+      assert(bias_ptrs_sorted[i]);
+    }
+    assert(output_ptrs_sorted[i]);
+  }
+
+  free(token_idx_array_thrust);
+  free(weight_idx_array_thrust);
+  free(coefficient_idx_array_thrust);
+  free(bias_idx_array_thrust);
+  free(output_idx_array_thrust);
+
+  checkCUDA(cudaFreeHost(indices_cpu));
+  indices_vec.clear();
+  indices_vec.shrink_to_fit();
+  indices_vec_sorted.clear();
+  indices_vec_sorted.shrink_to_fit();
+  num_assignments_per_expert_cpu.clear();
+  num_assignments_per_expert_cpu.shrink_to_fit();
+
+  token_ptrs.clear();
+  token_ptrs.shrink_to_fit();
+  token_ptrs_sorted.clear();
+  token_ptrs_sorted.shrink_to_fit();
+  weight_ptrs.clear();
+  weight_ptrs.shrink_to_fit();
+  weight_ptrs_sorted.clear();
+  weight_ptrs_sorted.shrink_to_fit();
+  bias_ptrs.clear();
+  bias_ptrs.shrink_to_fit();
+  bias_ptrs_sorted.clear();
+  bias_ptrs_sorted.shrink_to_fit();
+  coefficient_ptrs.clear();
+  coefficient_ptrs.shrink_to_fit();
+  output_ptrs.clear();
+  output_ptrs.shrink_to_fit();
+  output_ptrs_sorted.clear();
+  output_ptrs_sorted.shrink_to_fit();
+
+  token_idx_array_thrust_vec_sorted.clear();
+  token_idx_array_thrust_vec_sorted.shrink_to_fit();
+  weight_idx_array_thrust_vec_sorted.clear();
+  weight_idx_array_thrust_vec_sorted.shrink_to_fit();
+  coefficient_idx_array_thrust_vec_sorted.clear();
+  coefficient_idx_array_thrust_vec_sorted.shrink_to_fit();
+  bias_idx_array_thrust_vec_sorted.clear();
+  bias_idx_array_thrust_vec_sorted.shrink_to_fit();
+  output_idx_array_thrust_vec_sorted.clear();
+  output_idx_array_thrust_vec_sorted.shrink_to_fit();
+
+  // Check batch output pointers
+  assert(gemm_batch_count <= m->effective_batch_size);
+  float **dev_batch_outputs_cuda = (float **)calloc(
+      num_chosen_experts * m->effective_batch_size, sizeof(float *));
+  assert(dev_batch_outputs_cuda);
+  checkCUDA(
+      cudaMemcpy(dev_batch_outputs_cuda,
+                 m->dev_batch_outputs,
+                 sizeof(float *) * num_chosen_experts * m->effective_batch_size,
+                 cudaMemcpyDeviceToHost));
+  std::vector<float *> dev_batch_outputs_cuda_vec(
+      dev_batch_outputs_cuda,
+      dev_batch_outputs_cuda + num_chosen_experts * m->effective_batch_size);
+
+  std::vector<float *> batch_outputs_host_vec(
+      m->batch_outputs,
+      m->batch_outputs + num_chosen_experts * m->effective_batch_size);
+  assert(batch_outputs_host_vec == dev_batch_outputs_cuda_vec);
+
+  /* std::cout << "dev_batch_outputs_cuda_vec[i]: ";
+  for (int i=0; i<dev_batch_outputs_cuda_vec.size(); i++) {
+    assert(dev_batch_outputs_cuda_vec[i]);
+    if (i>0) {
+      assert(dev_batch_outputs_cuda_vec[i] == dev_batch_outputs_cuda_vec[i-1] +
+  out_dim);
+    }
+    std::cout << dev_batch_outputs_cuda_vec[i] << " ";
+  }
+  std::cout << std::endl; */
+
+  free(dev_batch_outputs_cuda);
+#endif
 
   experts_forward_GemmBatched_kernel(m,
                                      (void const **)m->weight_idx_array,
@@ -510,7 +1064,7 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                      gemm_batch_count,
                                      stream);
 
-  cudaStreamSynchronize(stream);
+  checkCUDA(cudaStreamSynchronize(stream));
 
   int aggregation_parallelism =
       std::max(num_tokens, gemm_batch_count) * out_dim;
@@ -567,8 +1121,12 @@ ExpertsMeta::ExpertsMeta(FFHandler handler,
       std::max(num_experts, num_chosen_experts * effective_batch_size) *
           sizeof(int)));
   checkCUDA(cudaMalloc(&exp_local_label_to_index, num_experts * sizeof(int)));
-  // expert_start_indexes needs one more slot to save the upper bound index
-  checkCUDA(cudaMalloc(&expert_start_indexes, (num_experts + 1) * sizeof(int)));
+  // expert_start_indexes needs one more slot to save the upper bound index.
+  // Initial sequence can require more space, though.
+  checkCUDA(cudaMalloc(
+      &expert_start_indexes,
+      std::max(num_experts + 1, num_chosen_experts * effective_batch_size) *
+          sizeof(int)));
   checkCUDA(cudaMalloc(&num_assignments_per_expert, num_experts * sizeof(int)));
   checkCUDA(cudaMalloc(&destination_start_indices, num_experts * sizeof(int)));
 
@@ -598,7 +1156,7 @@ ExpertsMeta::ExpertsMeta(FFHandler handler,
                        out_dim * num_chosen_experts * effective_batch_size *
                            sizeof(float)));
   for (int i = 1; i < num_chosen_experts * effective_batch_size; i++) {
-    batch_outputs[i] = batch_outputs[i - 1] + out_dim * sizeof(float);
+    batch_outputs[i] = batch_outputs[i - 1] + out_dim;
   }
   checkCUDA(
       cudaMalloc(&dev_batch_outputs,

From aa8175e84ef58af1d570c29d86e995cd8742b6a0 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 7 Apr 2023 14:05:48 +0000
Subject: [PATCH 093/344] comment out stream sync

---
 src/ops/experts.cu | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/src/ops/experts.cu b/src/ops/experts.cu
index 1a81d9118c..4b16e176d8 100644
--- a/src/ops/experts.cu
+++ b/src/ops/experts.cu
@@ -443,7 +443,7 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                  &gemm_batch_count,
                                  stream);
 
-  checkCUDA(cudaStreamSynchronize(stream));
+  //checkCUDA(cudaStreamSynchronize(stream));
 
 #ifdef INFERENCE_TESTS
   // Checking
@@ -732,7 +732,7 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                              m->coefficient_idx_array,
                                              m->output_idx_array);
 
-  checkCUDA(cudaStreamSynchronize(stream));
+  //checkCUDA(cudaStreamSynchronize(stream));
 
 #ifdef INFERENCE_TESTS
   std::vector<float const *> token_ptrs, weight_ptrs, bias_ptrs,
@@ -1064,7 +1064,7 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                      gemm_batch_count,
                                      stream);
 
-  checkCUDA(cudaStreamSynchronize(stream));
+  //checkCUDA(cudaStreamSynchronize(stream));
 
   int aggregation_parallelism =
       std::max(num_tokens, gemm_batch_count) * out_dim;

From f842844f07b1d5e2b7537ab0eff0242db713f69f Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 7 Apr 2023 13:56:24 -0400
Subject: [PATCH 094/344] [Inference][MoE] - Use single weight for all fused
 experts (#679)

* use one weight for all experts

* bug fix

* bug fix
---
 include/flexflow/ops/experts.h        |   3 +-
 include/flexflow/ops/experts_params.h |   4 +-
 src/ops/experts.cc                    | 273 +++++++++++---------------
 src/ops/experts.cpp                   |   3 +-
 src/ops/experts.cu                    |  36 ++--
 5 files changed, 140 insertions(+), 179 deletions(-)

diff --git a/include/flexflow/ops/experts.h b/include/flexflow/ops/experts.h
index 0f51187c78..7f110c79b6 100644
--- a/include/flexflow/ops/experts.h
+++ b/include/flexflow/ops/experts.h
@@ -126,7 +126,8 @@ class Experts : public Op {
                                      int const *indices,
                                      float const *topk_gate_preds,
                                      float *output,
-                                     float const **weights,
+                                     float const *weights,
+                                     float const *biases,
                                      int num_active_tokens,
                                      int chosen_experts,
                                      int batch_size,
diff --git a/include/flexflow/ops/experts_params.h b/include/flexflow/ops/experts_params.h
index d5b4676f0e..e5aa2f1ebb 100644
--- a/include/flexflow/ops/experts_params.h
+++ b/include/flexflow/ops/experts_params.h
@@ -47,7 +47,9 @@ struct ExpertsParams {
     OUTPUT_REPLICA,
     KERNEL_CHANNEL_IN,
     KERNEL_CHANNEL_OUT,
-    BIAS_CHANNEL_OUT
+    KERNEL_NUM_EXPERTS,
+    BIAS_CHANNEL_OUT,
+    BIAS_NUM_EXPERTS,
   };
 
   std::unordered_map<NamedDimensions, int>
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index 983c682bd6..6eaa3be943 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -82,7 +82,7 @@ Tensor FFModel::experts(Tensor const *inputs,
                        DT_FLOAT,
                        name,
                        3 /*inputs*/,
-                       num_experts * (1 + use_bias) /*weights*/,
+                       (1 + use_bias) /*weights*/,
                        1 /*outputs*/,
                        inputs);
   {
@@ -95,29 +95,15 @@ Tensor FFModel::experts(Tensor const *inputs,
         num_dims, dims, DT_FLOAT, e, 0, true /*create_grad*/);
     assert(e->outputs[0] != nullptr);
   }
-  for (int i = 0; i < num_experts; i++) {
-    {
-      int dims[2] = {inputs[0]->dims[0], experts_output_dim_size};
-      e->weights[i * (1 + use_bias)] =
-          create_weight_legion_ordering(2,
-                                        dims,
-                                        DT_FLOAT,
-                                        e,
-                                        true /*create_grad*/,
-                                        nullptr,
-                                        CHOSEN_SYNC_TYPE);
-    }
-    if (use_bias) {
-      int dims[1] = {experts_output_dim_size};
-      e->weights[i * (1 + use_bias) + use_bias] =
-          create_weight_legion_ordering(1,
-                                        dims,
-                                        DT_FLOAT,
-                                        e,
-                                        true /*create_grad*/,
-                                        nullptr,
-                                        CHOSEN_SYNC_TYPE);
-    }
+  {
+    int dims[3] = {inputs[0]->dims[0], experts_output_dim_size, num_experts};
+    e->weights[0] = create_weight_legion_ordering(
+        3, dims, DT_FLOAT, e, true /*create_grad*/, nullptr, CHOSEN_SYNC_TYPE);
+  }
+  if (use_bias) {
+    int dims[2] = {experts_output_dim_size, num_experts};
+    e->weights[1] = create_weight_legion_ordering(
+        2, dims, DT_FLOAT, e, true /*create_grad*/, nullptr, CHOSEN_SYNC_TYPE);
   }
 
   e->add_int_property("num_experts", num_experts);
@@ -285,7 +271,7 @@ Experts::Experts(FFModel &model,
          DT_FLOAT,
          name,
          3 /*inputs*/,
-         _num_experts * (1 + _use_bias) /*weights*/,
+         (1 + _use_bias) /*weights*/,
          1 /*outputs*/,
          inputs),
       num_experts(_num_experts), experts_start_idx(_experts_start_idx),
@@ -301,7 +287,7 @@ Experts::Experts(FFModel &model,
   assert(num_experts > 0);
   assert(numInputs == 3);
   assert(numOutputs == 1);
-  assert(numWeights == num_experts * (1 + use_bias));
+  assert(numWeights == (1 + use_bias));
 
   // Check input dimensions
   int num_dims = inputs[0]->num_dims;
@@ -358,35 +344,31 @@ Experts::Experts(FFModel &model,
 #else
     ParameterSyncType comm_type = ParameterSyncType::PS;
 #endif
-    for (int i = 0; i < num_experts; i++) {
+    {
       Initializer *kernel_initializer = new GlorotUniform(std::rand() /*seed*/);
-      {
-        // ParallelDim dims[2] = {inputs[0]->dims[0], out_dims[0]};
-        weights[i * (1 + use_bias)] =
-            model.create_parallel_weight_legion_ordering(
-                kernel_shape.num_dims, // 2,
-                kernel_shape.dims,     // dims,
-                DT_FLOAT,
-                NULL /*owner_op*/,
-                true /*create_grad*/,
-                kernel_initializer,
-                comm_type);
-        assert(weights[i * (1 + use_bias)] != nullptr);
-      }
-      if (use_bias) {
-        Initializer *bias_initializer = new ZeroInitializer();
-        ParallelDim dims[1] = {out_dims[0]};
-        weights[i * (1 + use_bias) + use_bias] =
-            model.create_parallel_weight_legion_ordering(
-                bias_shape.num_dims, // 1,
-                bias_shape.dims,     // dims,
-                DT_FLOAT,
-                NULL /*owner_op*/,
-                true /*create_grad*/,
-                bias_initializer,
-                comm_type);
-        assert(weights[i * (1 + use_bias) + use_bias] != nullptr);
-      }
+      assert(kernel_shape.dims[2].size == num_experts);
+      weights[0] = model.create_parallel_weight_legion_ordering(
+          kernel_shape.num_dims, // 3,
+          kernel_shape.dims,     // dims,
+          DT_FLOAT,
+          NULL /*owner_op*/,
+          true /*create_grad*/,
+          kernel_initializer,
+          comm_type);
+      assert(weights[0] != nullptr);
+    }
+    if (use_bias) {
+      Initializer *bias_initializer = new ZeroInitializer();
+      assert(bias_shape.dims[1].size == num_experts);
+      weights[1] = model.create_parallel_weight_legion_ordering(
+          bias_shape.num_dims, // 1,
+          bias_shape.dims,     // dims,
+          DT_FLOAT,
+          NULL /*owner_op*/,
+          true /*create_grad*/,
+          bias_initializer,
+          comm_type);
+      assert(weights[1] != nullptr);
     }
   }
   assert(check_output_input_weight_parallel_dims(allocate_weights));
@@ -490,23 +472,19 @@ void Experts::init_inference(FFModel const &ff,
                                                     EXCLUSIVE,
                                                     batch_outputs[0]->region));
   launcher.add_field(3, FID_DATA);
-  for (int i = 0; i < num_experts; i++) {
-    launcher.add_region_requirement(
-        RegionRequirement(weights[i * (1 + use_bias)]->part,
-                          0 /*projection id*/,
-                          READ_ONLY,
-                          EXCLUSIVE,
-                          weights[i * (1 + use_bias)]->region));
-    launcher.add_field(4 + i * (1 + use_bias), FID_DATA);
-    if (use_bias) {
-      launcher.add_region_requirement(
-          RegionRequirement(weights[i * (1 + use_bias) + use_bias]->part,
-                            0 /*projection id*/,
-                            READ_ONLY,
-                            EXCLUSIVE,
-                            weights[i * (1 + use_bias) + use_bias]->region));
-      launcher.add_field(4 + i * (1 + use_bias) + use_bias, FID_DATA);
-    }
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(4, FID_DATA);
+  if (use_bias) {
+    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[1]->region));
+    launcher.add_field(5, FID_DATA);
   }
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
@@ -555,23 +533,19 @@ void Experts::init(FFModel const &ff) {
                                                     EXCLUSIVE,
                                                     outputs[0]->region));
   launcher.add_field(3, FID_DATA);
-  for (int i = 0; i < num_experts; i++) {
-    launcher.add_region_requirement(
-        RegionRequirement(weights[i * (1 + use_bias)]->part,
-                          0 /*projection id*/,
-                          READ_ONLY,
-                          EXCLUSIVE,
-                          weights[i * (1 + use_bias)]->region));
-    launcher.add_field(4 + i * (1 + use_bias), FID_DATA);
-    if (use_bias) {
-      launcher.add_region_requirement(
-          RegionRequirement(weights[i * (1 + use_bias) + use_bias]->part,
-                            0 /*projection id*/,
-                            READ_ONLY,
-                            EXCLUSIVE,
-                            weights[i * (1 + use_bias) + use_bias]->region));
-      launcher.add_field(4 + i * (1 + use_bias) + use_bias, FID_DATA);
-    }
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(4, FID_DATA);
+  if (use_bias) {
+    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[1]->region));
+    launcher.add_field(5, FID_DATA);
   }
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
@@ -641,23 +615,19 @@ void Experts::forward(FFModel const &ff) {
                                                     EXCLUSIVE,
                                                     outputs[0]->region));
   launcher.add_field(3, FID_DATA);
-  for (int i = 0; i < num_experts; i++) {
-    launcher.add_region_requirement(
-        RegionRequirement(weights[i * (1 + use_bias)]->part,
-                          0 /*projection id*/,
-                          READ_ONLY,
-                          EXCLUSIVE,
-                          weights[i * (1 + use_bias)]->region));
-    launcher.add_field(4 + i * (1 + use_bias), FID_DATA);
-    if (use_bias) {
-      launcher.add_region_requirement(
-          RegionRequirement(weights[i * (1 + use_bias) + use_bias]->part,
-                            0 /*projection id*/,
-                            READ_ONLY,
-                            EXCLUSIVE,
-                            weights[i * (1 + use_bias) + use_bias]->region));
-      launcher.add_field(4 + i * (1 + use_bias) + use_bias, FID_DATA);
-    }
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(4, FID_DATA);
+  if (use_bias) {
+    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[1]->region));
+    launcher.add_field(5, FID_DATA);
   }
   runtime->execute_index_space(ctx, launcher);
 }
@@ -714,23 +684,19 @@ FutureMap Experts::inference(FFModel const &ff,
                                                     EXCLUSIVE,
                                                     batch_outputs[0]->region));
   launcher.add_field(3, FID_DATA);
-  for (int i = 0; i < num_experts; i++) {
-    launcher.add_region_requirement(
-        RegionRequirement(weights[i * (1 + use_bias)]->part,
-                          0 /*projection id*/,
-                          READ_ONLY,
-                          EXCLUSIVE,
-                          weights[i * (1 + use_bias)]->region));
-    launcher.add_field(4 + i * (1 + use_bias), FID_DATA);
-    if (use_bias) {
-      launcher.add_region_requirement(
-          RegionRequirement(weights[i * (1 + use_bias) + use_bias]->part,
-                            0 /*projection id*/,
-                            READ_ONLY,
-                            EXCLUSIVE,
-                            weights[i * (1 + use_bias) + use_bias]->region));
-      launcher.add_field(4 + i * (1 + use_bias) + use_bias, FID_DATA);
-    }
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(4, FID_DATA);
+  if (use_bias) {
+    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[1]->region));
+    launcher.add_field(5, FID_DATA);
   }
   return runtime->execute_index_space(ctx, launcher);
 }
@@ -749,7 +715,7 @@ void Experts::inference_task(Task const *task,
 
   int num_experts = m->num_experts;
   bool use_bias = m->use_bias;
-  assert(regions.size() - 4 == num_experts * (1 + use_bias));
+  assert(regions.size() - 4 == (1 + use_bias));
 
   // get input, indices, topk_gate_preds, outputs
   float const *input_ptr = helperGetTensorPointerRO<float>(
@@ -818,37 +784,29 @@ void Experts::inference_task(Task const *task,
   }
 
   // get weights
-  float const *weights_ptrs[num_experts * (1 + use_bias)];
-  for (int i = 0; i < num_experts; i++) {
-    weights_ptrs[i * (1 + use_bias)] =
-        helperGetTensorPointerRO<float>(regions[4 + i * (1 + use_bias)],
-                                        task->regions[4 + i * (1 + use_bias)],
-                                        FID_DATA,
-                                        ctx,
-                                        runtime);
-    Domain weights_domain = runtime->get_index_space_domain(
-        ctx, task->regions[4 + i * (1 + use_bias)].region.get_index_space());
-    int weights_dims = weights_domain.get_dim();
-    assert(weights_dims == input_dims);
-    assert(weights_domain.hi()[0] - weights_domain.lo()[0] + 1 == data_dim);
-    assert(weights_domain.hi()[1] - weights_domain.lo()[1] + 1 == out_dim);
-    if (use_bias) {
-      weights_ptrs[i * (1 + use_bias) + use_bias] =
-          helperGetTensorPointerRO<float>(
-              regions[4 + i * (1 + use_bias) + use_bias],
-              task->regions[4 + i * (1 + use_bias) + use_bias],
-              FID_DATA,
-              ctx,
-              runtime);
-      Domain bias_domain = runtime->get_index_space_domain(
-          ctx,
-          task->regions[4 + i * (1 + use_bias) + use_bias]
-              .region.get_index_space());
-      int bias_dims = bias_domain.get_dim();
-      assert(bias_dims == 4);
-      assert(bias_domain.hi()[0] - bias_domain.lo()[0] + 1 == out_dim);
-    }
+  float const *weights_ptr = helperGetTensorPointerRO<float>(
+      regions[4], task->regions[4], FID_DATA, ctx, runtime);
+  assert(weights_ptr != nullptr);
+  Domain weights_domain = runtime->get_index_space_domain(
+      ctx, task->regions[4].region.get_index_space());
+  int weights_dims = weights_domain.get_dim();
+  assert(weights_dims == input_dims);
+  assert(weights_domain.hi()[0] - weights_domain.lo()[0] + 1 == data_dim);
+  assert(weights_domain.hi()[1] - weights_domain.lo()[1] + 1 == out_dim);
+  assert(weights_domain.hi()[2] - weights_domain.lo()[2] + 1 == num_experts);
+
+  float const *bias_ptr = nullptr;
+  if (use_bias) {
+    bias_ptr = helperGetTensorPointerRO<float>(
+        regions[5], task->regions[5], FID_DATA, ctx, runtime);
+    Domain bias_domain = runtime->get_index_space_domain(
+        ctx, task->regions[5].region.get_index_space());
+    int bias_dims = bias_domain.get_dim();
+    assert(bias_dims == 4);
+    assert(bias_domain.hi()[0] - bias_domain.lo()[0] + 1 == out_dim);
+    assert(bias_domain.hi()[1] - bias_domain.lo()[1] + 1 == num_experts);
   }
+
 #ifdef INFERENCE_TESTS
   if (DEBUG_MODE) {
     std::cout << "forward_kernel_wrapper" << std::endl
@@ -989,7 +947,8 @@ void Experts::inference_task(Task const *task,
                                   indices_ptr,
                                   topk_gate_pred_ptr,
                                   output_ptr,
-                                  weights_ptrs,
+                                  weights_ptr,
+                                  bias_ptr,
                                   num_active_tokens,
                                   chosen_experts,
                                   batch_size,
@@ -1140,7 +1099,9 @@ std::unordered_map<ExpertsParams::NamedDimensions, int>
           {OUTPUT_REPLICA, num_dims - 1},
           {KERNEL_CHANNEL_IN, 0},
           {KERNEL_CHANNEL_OUT, 1},
-          {BIAS_CHANNEL_OUT, 0}};
+          {KERNEL_NUM_EXPERTS, 2},
+          {BIAS_CHANNEL_OUT, 0},
+          {BIAS_NUM_EXPERTS, 1}};
 }
 
 void ExpertsParams::calculate_nonreplica_dim_sizes(
@@ -1168,11 +1129,13 @@ void ExpertsParams::calculate_nonreplica_dim_sizes(
         input_shape.dims[INPUT_CHANNEL].degree;
     kernel_dims[dimension_names.at(KERNEL_CHANNEL_OUT)].size =
         experts_output_dim_size;
+    kernel_dims[dimension_names.at(KERNEL_NUM_EXPERTS)].size = num_experts;
     *kernel_ndims = num_dims;
   }
   if (bias_dims != nullptr) {
     bias_dims[dimension_names.at(BIAS_CHANNEL_OUT)].size =
         experts_output_dim_size;
+    bias_dims[dimension_names.at(BIAS_NUM_EXPERTS)].size = num_experts;
     *bias_ndims = num_dims;
   }
 }
diff --git a/src/ops/experts.cpp b/src/ops/experts.cpp
index 787c6e2d88..88456ac66c 100644
--- a/src/ops/experts.cpp
+++ b/src/ops/experts.cpp
@@ -25,7 +25,8 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                      int const *indices,
                                      float const *topk_gate_preds,
                                      float *output,
-                                     float const **weights,
+                                     float const *weights,
+                                     float const *biases,
                                      int num_active_tokens,
                                      int chosen_experts,
                                      int batch_size,
diff --git a/src/ops/experts.cu b/src/ops/experts.cu
index 4b16e176d8..82f128fd1b 100644
--- a/src/ops/experts.cu
+++ b/src/ops/experts.cu
@@ -210,7 +210,8 @@ __global__ void experts_forward_prepare_kernel(
     float const *input, // @In: Tokens' values (in_dim, batch_size)
     float *output,
     float const **token_idx_array,  // @Out: Barray for GemmBatchedEx
-    float const **weights,          // @In: Experts' weights
+    float const *weights,           // @In: Experts' weights
+    float const *biases,            // @In: Experts' biases
     float const **weight_idx_array, // @Out: Aarray for GemmBatchedEx
     float const **bias_idx_array,   // @Out: Experts' bias
     float const *coefficients,      // @In: topk_gate_predss coefficients tensor
@@ -233,11 +234,11 @@ __global__ void experts_forward_prepare_kernel(
                       within_expert_offset] = &input[token_idx * data_dim];
       weight_idx_array[destination_start_indices[expert_index] +
                        within_expert_offset] =
-          weights[local_expert_label * (1 + use_bias)];
+          &weights[local_expert_label * data_dim * out_dim];
       if (use_bias) {
         bias_idx_array[destination_start_indices[expert_index] +
                        within_expert_offset] =
-            weights[local_expert_label * (1 + use_bias) + use_bias];
+            &biases[local_expert_label * out_dim];
       }
       coefficient_idx_array[destination_start_indices[expert_index] +
                             within_expert_offset] = &coefficients[rev_idx];
@@ -378,7 +379,8 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                      int const *indices,
                                      float const *topk_gate_preds,
                                      float *output,
-                                     float const **weights,
+                                     float const *weights,
+                                     float const *biases,
                                      int num_active_tokens,
                                      int chosen_experts,
                                      int batch_size,
@@ -411,13 +413,8 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
   // assert(num_tokens == batch_size);
   assert(out_dim == m->out_dim);
 
-  // TODO: remove this once we condense all weights in a single tensor
-  // currently each weight matrix is placed on GPU by Legion, but the array
-  // holding the pointers to each weight matrix is on CPU
-  cudaMemcpy(m->dev_weights,
-             weights,
-             num_experts_per_block * (1 + use_bias) * sizeof(float *),
-             cudaMemcpyHostToDevice);
+  assert(weights != nullptr);
+  assert(use_bias == (biases != nullptr));
 
   int num_indices = num_tokens * num_chosen_experts;
   // values below are set by Thrust in the experts_forward_thrust_wrapper
@@ -443,7 +440,7 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                  &gemm_batch_count,
                                  stream);
 
-  //checkCUDA(cudaStreamSynchronize(stream));
+  // checkCUDA(cudaStreamSynchronize(stream));
 
 #ifdef INFERENCE_TESTS
   // Checking
@@ -725,14 +722,15 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                              input,
                                              output,
                                              m->token_idx_array,
-                                             m->dev_weights,
+                                             weights,
+                                             biases,
                                              m->weight_idx_array,
                                              m->bias_idx_array,
                                              topk_gate_preds,
                                              m->coefficient_idx_array,
                                              m->output_idx_array);
 
-  //checkCUDA(cudaStreamSynchronize(stream));
+  // checkCUDA(cudaStreamSynchronize(stream));
 
 #ifdef INFERENCE_TESTS
   std::vector<float const *> token_ptrs, weight_ptrs, bias_ptrs,
@@ -758,11 +756,10 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
       token_ptrs.push_back(&input[token_idx * data_dim]);
       coefficient_ptrs.push_back(&topk_gate_preds[i]);
       int local_exp_label = global_exp_label - experts_start_idx;
-      weight_ptrs.push_back(weights[local_exp_label * (1 + use_bias)]);
+      weight_ptrs.push_back(&weights[local_exp_label * (out_dim * data_dim)]);
       output_ptrs.push_back(&output[token_idx * out_dim]);
       if (use_bias) {
-        bias_ptrs.push_back(
-            weights[local_exp_label * (1 + use_bias) + use_bias]);
+        bias_ptrs.push_back(&biases[local_exp_label * out_dim]);
       }
     }
   }
@@ -1064,7 +1061,7 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                      gemm_batch_count,
                                      stream);
 
-  //checkCUDA(cudaStreamSynchronize(stream));
+  // checkCUDA(cudaStreamSynchronize(stream));
 
   int aggregation_parallelism =
       std::max(num_tokens, gemm_batch_count) * out_dim;
@@ -1133,8 +1130,6 @@ ExpertsMeta::ExpertsMeta(FFHandler handler,
   checkCUDA(
       cudaMalloc(&token_idx_array,
                  num_chosen_experts * effective_batch_size * sizeof(float *)));
-  checkCUDA(
-      cudaMalloc(&dev_weights, num_experts * (1 + use_bias) * sizeof(float *)));
   checkCUDA(
       cudaMalloc(&weight_idx_array,
                  num_chosen_experts * effective_batch_size * sizeof(float *)));
@@ -1226,7 +1221,6 @@ ExpertsMeta::~ExpertsMeta(void) {
   checkCUDA(cudaFree(num_assignments_per_expert));
   checkCUDA(cudaFree(destination_start_indices));
   checkCUDA(cudaFree(token_idx_array));
-  checkCUDA(cudaFree(dev_weights));
   checkCUDA(cudaFree(weight_idx_array));
   checkCUDA(cudaFree(coefficient_idx_array));
   checkCUDA(cudaFree(output_idx_array));

From b74fa4f473b4eb9a8f437d725ea523c0d5846549 Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Sat, 15 Apr 2023 23:52:52 -0400
Subject: [PATCH 095/344] LLaMA model (#662)

* llama init

* fix

* load input seperately

* fix load input index

* fix code format

* fix

* fix

* inference for element_unary and embedding

* inference

* fix inference

* try to run inference

* add inference cast

* fix rms norm, inc_mha

* remove debug print

* c format

* format

* format

* fix format

* del

* fix

* split inference

* fix

* format

* fix

* fix

* fix rocm

* rocm

* fix

---------

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
---
 CMakeLists.txt                                |   4 +
 examples/cpp/inference/LLAMA/CMakeLists.txt   |  21 +
 examples/cpp/inference/LLAMA/Makefile         |  39 ++
 examples/cpp/inference/LLAMA/dataloader.cc    | 301 +++++++++++++++
 examples/cpp/inference/LLAMA/dataloader.cu    | 112 ++++++
 examples/cpp/inference/LLAMA/llama.cc         | 259 +++++++++++++
 examples/cpp/inference/LLAMA/llama.h          | 107 ++++++
 examples/cpp/inference/dataloader.cu          |   2 +-
 include/flexflow/model.h                      |   1 +
 include/flexflow/ops/cast.h                   |   9 +
 include/flexflow/ops/element_unary.h          |   9 +
 .../ops/inc_multihead_self_attention.h        |   7 +-
 .../ops/inc_multihead_self_attention_params.h |   2 +-
 include/flexflow/ops/rms_norm.h               |  10 +-
 include/flexflow/ops/rms_norm_params.h        |   2 +-
 include/flexflow/ops/split.h                  |   9 +
 include/flexflow/substitution_loader.h        | 180 ++++-----
 include/flexflow/utils/cuda_helper.h          |   9 +
 include/flexflow/utils/hip_helper.h           |   6 +
 python/flexflow/core/flexflow_cffi.py         |  59 ++-
 python/flexflow/type.py                       |   1 +
 python/flexflow_c.cc                          |  31 ++
 python/flexflow_c.h                           |  14 +
 src/ops/cast.cc                               |  74 ++++
 src/ops/element_unary.cc                      | 100 +++++
 src/ops/embedding.cc                          |   1 -
 src/ops/inc_multihead_self_attention.cc       |  26 +-
 src/ops/inc_multihead_self_attention.cu       | 157 +++++---
 src/ops/kernels/rms_norm_kernels.cpp          |  59 +++
 src/ops/kernels/rms_norm_kernels.cu           |  61 +--
 src/ops/rms_norm.cc                           | 109 ++++--
 src/ops/split.cc                              |  80 ++++
 src/runtime/cuda_helper.cu                    |  50 ++-
 src/runtime/ffconst_utils.cc                  |   2 +
 src/runtime/graph.cc                          |   5 +-
 src/runtime/model.cc                          |  24 ++
 src/runtime/substitution.cc                   |   8 +
 triton/src/model.cc                           | 358 +++++++++---------
 triton/src/types.h                            |   1 +
 39 files changed, 1930 insertions(+), 379 deletions(-)
 create mode 100644 examples/cpp/inference/LLAMA/CMakeLists.txt
 create mode 100644 examples/cpp/inference/LLAMA/Makefile
 create mode 100644 examples/cpp/inference/LLAMA/dataloader.cc
 create mode 100644 examples/cpp/inference/LLAMA/dataloader.cu
 create mode 100644 examples/cpp/inference/LLAMA/llama.cc
 create mode 100644 examples/cpp/inference/LLAMA/llama.h
 create mode 100644 src/ops/kernels/rms_norm_kernels.cpp

diff --git a/CMakeLists.txt b/CMakeLists.txt
index d61798f4e8..6c73eed895 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -456,6 +456,10 @@ if(FF_BUILD_MOE OR FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/inference/transformers)
 endif()
 
+if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
+  add_subdirectory(examples/cpp/inference/LLAMA)
+endif()
+
 # installation
 set(INCLUDE_DEST "include")
 set(LIB_DEST "lib")
diff --git a/examples/cpp/inference/LLAMA/CMakeLists.txt b/examples/cpp/inference/LLAMA/CMakeLists.txt
new file mode 100644
index 0000000000..48e9322af8
--- /dev/null
+++ b/examples/cpp/inference/LLAMA/CMakeLists.txt
@@ -0,0 +1,21 @@
+cmake_minimum_required(VERSION 3.10)
+
+project(FlexFlowExample_LLAMA)
+set(project_target LLAMA)
+
+
+set(CPU_SRC
+  ${FLEXFLOW_CPP_DRV_SRC}
+  llama.cc
+  llama.h
+  dataloader.cc)
+
+set(GPU_SRC
+dataloader.cu)
+
+cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
+target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
+target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
+
+set(BIN_DEST "bin")
+install(TARGETS ${project_target} DESTINATION ${BIN_DEST})
diff --git a/examples/cpp/inference/LLAMA/Makefile b/examples/cpp/inference/LLAMA/Makefile
new file mode 100644
index 0000000000..4249443f7d
--- /dev/null
+++ b/examples/cpp/inference/LLAMA/Makefile
@@ -0,0 +1,39 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+#
+
+# Flags for directing the runtime makefile what to include
+DEBUG           ?= 0		# Include debugging symbols
+MAX_DIM         ?= 4		# Maximum number of dimensions
+OUTPUT_LEVEL    ?= LEVEL_DEBUG	# Compile time logging level
+USE_CUDA        ?= 1		# Include CUDA support (requires CUDA)
+USE_GASNET      ?= 0		# Include GASNet support (requires GASNet)
+USE_HDF         ?= 1		# Include HDF5 support (requires HDF5)
+ALT_MAPPERS     ?= 0		# Include alternative mappers (not recommended)
+
+# Put the binary file name here
+OUTFILE		?= llama
+# List all the application source files here
+GEN_SRC		= llama.cc dataloader.cc 
+GEN_GPU_SRC	= dataloader.cu 
+ifndef CUDA_HOME
+CUDA_HOME = $(patsubst %/bin/nvcc,%,$(shell which nvcc | head -1))
+endif
+
+
+ifndef FF_HOME
+$(error FF_HOME variable is not defined, aborting build)
+endif
+
+include $(FF_HOME)/FlexFlow.mk
diff --git a/examples/cpp/inference/LLAMA/dataloader.cc b/examples/cpp/inference/LLAMA/dataloader.cc
new file mode 100644
index 0000000000..a09230029f
--- /dev/null
+++ b/examples/cpp/inference/LLAMA/dataloader.cc
@@ -0,0 +1,301 @@
+#include "llama.h"
+#include <random>
+
+using namespace Legion;
+
+DataLoader::DataLoader(FFModel &ff,
+                       LLAMAConfig const *llamaconfig,
+                       ParallelTensor const &input) {
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  num_samples = llamaconfig->sentence_len;
+
+  {
+    batch_input = input;
+    int num_dims = input->num_dims;
+
+    ParallelDim dims[num_dims];
+    for (int i = 0; i < num_dims; i++) {
+      if (i == 0) {
+        dims[i].size = 1;
+      } else {
+        dims[i].size = input->dims[i].size;
+      }
+
+      dims[i].degree = 1;
+      dims[i].parallel_idx = -1;
+      dims[i].is_replica_dim = input->dims[i].is_replica_dim;
+      // Assume only the first dim can be the replica dim
+      assert(i == num_dims - 1 || (!dims[i].is_replica_dim));
+    }
+    dims[num_dims - 1].size = num_samples;
+    full_input =
+        ff.create_parallel_tensor_legion_ordering(num_dims, dims, DT_INT64);
+    assert(full_input != nullptr && "full_input is nullptr");
+    ff.map_tensor(full_input, NULL /*parallel_op*/);
+  }
+
+  size_t llamaconfig_size = sizeof(llamaconfig);
+  std::cout << "llama config dataloader: " << llamaconfig->input_path;
+
+  // Load entire dataset
+  TaskLauncher launcher(CUSTOM_CPU_TASK_ID_1,
+                        TaskArgument(llamaconfig, llamaconfig_size));
+  // regions[1]: full_input
+  launcher.add_region_requirement(RegionRequirement(full_input->region,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    full_input->region,
+                                                    MAP_TO_FB_MEMORY));
+  launcher.add_field(0, FID_DATA);
+  runtime->execute_task(ctx, launcher);
+}
+
+void DataLoader::load_entire_dataset(Task const *task,
+                                     std::vector<PhysicalRegion> const &regions,
+                                     Context ctx,
+                                     Runtime *runtime) {
+  assert(regions.size() == 1);
+  assert(task->regions.size() == 1);
+  LLAMAConfig const *llamaconfig = (LLAMAConfig *)task->args;
+
+  AccessorWO<long, 3> const acc_input(regions[0], FID_DATA);
+  Rect<3> rect_input = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  assert(acc_input.accessor.is_dense_arbitrary(rect_input));
+
+  long *input_ptr = acc_input.ptr(rect_input.lo);
+  std::cout << "load entire dataset" << rect_input.volume();
+
+  // load from file
+  load_from_file(input_ptr,
+                 rect_input.volume(),
+                 "/home/ubuntu/FlexFlow/examples/cpp/inference/LLAMA/tokens/"
+                 "llama_demo_tokens");
+}
+
+void DataLoader::next_batch(FFModel &ff,
+                            BatchConfig *bc,
+                            std::map<size_t, long> &batch_predictions) {
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  // Load Input
+  {
+    Domain domain =
+        runtime->get_index_space_domain(ctx, batch_input->parallel_is);
+    ArgumentMap argmap;
+    // int idx = next_index;
+    // for (Domain::DomainPointIterator it(domain); it; it++) {
+    //   SampleIdxs meta;
+    //   assert(ff.config.batchSize % batch_input->dims[1].size == 0);
+    //   meta.num_samples = ff.config.batchSize / batch_input->dims[2].size;
+    //   for (int i = 0; i < meta.num_samples; i++) {
+    //     meta.idxs[i] = idx++;
+    //     meta.token_idx = next_token_idx;
+    //     meta.batch_idx = next_batch_index;
+    //   }
+
+    //   argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
+    // }
+
+    DataLoaderNextBatchInput next_batch_input = {bc->token2ids,
+                                                 batch_predictions};
+    DataLoaderNextBatchInput const *ptr = &next_batch_input;
+    size_t next_batch_input_sz = sizeof(next_batch_input);
+    assert(ptr->prev_batch_preds.size() == batch_predictions.size());
+
+    std::cout << "next batch internal" << std::endl;
+    IndexLauncher launcher(CUSTOM_GPU_TASK_ID_1,
+                           batch_input->parallel_is,
+                           TaskArgument(ptr, next_batch_input_sz),
+                           argmap,
+                           Predicate::TRUE_PRED,
+                           false /*must*/,
+                           0 /*mapper_id*/,
+                           batch_input->machine_view.hash());
+    launcher.add_region_requirement(RegionRequirement(full_input->region,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      full_input->region,
+                                                      MAP_TO_ZC_MEMORY));
+    launcher.add_field(0, FID_DATA);
+    launcher.add_region_requirement(RegionRequirement(batch_input->part,
+                                                      0 /*projection id*/,
+                                                      WRITE_ONLY,
+                                                      EXCLUSIVE,
+                                                      batch_input->region));
+    launcher.add_field(1, FID_DATA);
+
+    runtime->execute_index_space(ctx, launcher);
+  }
+  // progress next_index
+  next_index += ff.config.batchSize;
+  next_token_idx += 1;
+}
+
+void DataLoader::reset() {
+  next_index = 0;
+  next_token_idx = 0;
+  next_batch_index = 0;
+}
+
+template <typename T>
+void DataLoader::load_from_file(T *ptr, size_t size, std::string filename) {
+
+  std::cout << "load from file: " << filename << std::endl;
+  std::ifstream in(filename, std::ios::in | std::ios::binary);
+  std::vector<T> host_array(size);
+  size_t loaded_data_size = sizeof(T) * size;
+  in.seekg(0, in.end);
+  in.seekg(0, in.beg);
+  in.read((char *)host_array.data(), loaded_data_size);
+
+  size_t in_get_size = in.gcount();
+  // std::cout << "size seee" << std::endl;
+  // std::cout << loaded_data_size << std::endl;
+  // std::cout << in_get_size << std::endl;
+  if (in_get_size != loaded_data_size) {
+    std::cout << "load data error";
+    return;
+  }
+
+  // std::cout << "finish loading input";
+  assert(size == host_array.size());
+
+  // normal
+  long data_index = 0;
+  for (auto v : host_array) {
+    ptr[data_index++] = v;
+  }
+  in.close();
+}
+
+template <typename T>
+void DataLoader::load_attention_weights(T *ptr,
+                                        size_t size,
+                                        std::string layer_name,
+                                        std::string weight_path) {
+
+  std::string q_file = weight_path +
+                       layer_name.substr(0, layer_name.find("attention")) +
+                       "attention_wq_weight";
+  std::string k_file = weight_path +
+                       layer_name.substr(0, layer_name.find("attention")) +
+                       "attention_wk_weight";
+  std::string v_file = weight_path +
+                       layer_name.substr(0, layer_name.find("attention")) +
+                       "attention_wv_weight";
+  std::string o_file = weight_path +
+                       layer_name.substr(0, layer_name.find("attention")) +
+                       "attention_wo_weight";
+  std::vector<std::string> weight_files = {q_file, k_file, v_file, o_file};
+
+  size_t index = 0;
+  int file_index = 0;
+
+  // q, k, v, o -> 0, 1, 2, 3
+  for (auto file : weight_files) {
+    std::cout << "file name and index: " << file << "->" << file_index << "\n";
+    size_t partial_size = size / 4;
+    std::ifstream in(file, std::ios::in | std::ios::binary);
+    std::vector<T> host_array(partial_size);
+    size_t loaded_data_size = sizeof(T) * partial_size;
+    in.seekg(0, in.end);
+    in.seekg(0, in.beg);
+    in.read((char *)host_array.data(), loaded_data_size);
+    size_t in_get_size = in.gcount();
+
+    if (in_get_size != loaded_data_size) {
+      std::cout << "load data error";
+      return;
+    }
+    assert(partial_size == host_array.size());
+
+    size_t one_head_size = 4096 * 128;
+    size_t data_index = 0;
+
+    for (int i = 0; i < 32; i++) {
+      size_t start_index = i * one_head_size * 4 + file_index * one_head_size;
+      // if (file_index == 3) {
+      //   printf("print wo start index %d, data %.10f\n",
+      //          start_index,
+      //          host_array.at(data_index));
+      // }
+      for (size_t j = start_index; j < start_index + one_head_size; j++) {
+        ptr[j] = host_array.at(data_index);
+        data_index += 1;
+      }
+    }
+    file_index++;
+
+    in.close();
+    index++;
+  }
+}
+
+void DataLoader::store_outputs(BatchConfig *bc,
+                               InferenceResult const &ir,
+                               std::map<size_t, long> &batch_predictions) {
+  assert(bc->token2ids.num_samples == bc->num_active_tokens() &&
+         bc->token2ids.num_samples <= bc->MAX_NUM_TOKENS);
+
+  std::cout << "store outputs...." << std::endl;
+  batch_predictions.clear();
+  size_t guid = bc->token2ids.guids[0];
+  size_t start_idx = bc->token2ids.token_indexes[0].token_position;
+
+  for (size_t i = 0; i <= bc->token2ids.num_samples; i++) {
+    if (i == bc->token2ids.num_samples || bc->token2ids.guids[i] != guid) {
+      // see how many tokens has been put to model in this req
+      // to get the index of the final token
+      int result_index =
+          bc->token2ids.token_indexes[i - 1].token_position - start_idx;
+      batch_predictions[guid] = ir.results[i - 1];
+      std::cout << "i: " << i << ", dds-" << guid << ", result index"
+                << result_index << ", result value: " << batch_predictions[guid]
+                << "\n";
+
+      if (i < bc->token2ids.num_samples) {
+        guid = bc->token2ids.guids[i];
+        start_idx = bc->token2ids.token_indexes[i].token_position;
+      }
+    }
+  }
+  // bc->print();
+  // for (size_t i = 0; i < bc->num_active_requests(); i++) {
+  //   batch_predictions[i] = ir.results[i];
+  //   std::cout << "i: " << i << ", ith pred: " << i
+  //             << ", value: " << batch_predictions[i]
+  //             << std::endl;
+  // }
+  assert(batch_predictions.size() == bc->num_active_requests());
+}
+
+template void DataLoader::load_attention_weights<float>(
+    float *ptr, size_t size, std::string layer_name, std::string weight_path);
+template void DataLoader::load_from_file<long>(long *ptr,
+                                               size_t size,
+                                               std::string filename);
+template void DataLoader::load_from_file<float>(float *ptr,
+                                                size_t size,
+                                                std::string filename);
+
+void FlexFlow::register_custom_tasks() {
+  // Load entire dataset
+  {
+    TaskVariantRegistrar registrar(CUSTOM_CPU_TASK_ID_1, "Load Entire Dataset");
+    registrar.add_constraint(ProcessorConstraint(Processor::LOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<DataLoader::load_entire_dataset>(
+        registrar, "Load Entire Dataset Task");
+  }
+  // Load input
+  {
+    TaskVariantRegistrar registrar(CUSTOM_GPU_TASK_ID_1, "Load Inputs");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<DataLoader::load_input>(
+        registrar, "Load Inputs Task");
+  }
+}
diff --git a/examples/cpp/inference/LLAMA/dataloader.cu b/examples/cpp/inference/LLAMA/dataloader.cu
new file mode 100644
index 0000000000..f2480c8592
--- /dev/null
+++ b/examples/cpp/inference/LLAMA/dataloader.cu
@@ -0,0 +1,112 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/utils/cuda_helper.h"
+#include "llama.h"
+
+void DataLoader::load_input(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
+
+  LLAMAConfig llamaconfig;
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+  //   SampleIdxs *meta = (SampleIdxs *)task->local_args;
+
+  DataLoaderNextBatchInput const input_struct =
+      *((DataLoaderNextBatchInput *)task->args);
+  BatchConfig::SampleIdxs const &meta = input_struct.meta;
+  std::map<size_t, long> const &prev_batch_preds =
+      input_struct.prev_batch_preds;
+
+  TensorAccessorR<long, 3> full_input(
+      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  TensorAccessorW<long, 3> batch_input(regions[1],
+                                       task->regions[1],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime,
+                                       false /*readOutput*/);
+  Domain full_input_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  Domain batch_input_domain = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+
+  coord_t sequence_length =
+      batch_input_domain.hi()[0] - batch_input_domain.lo()[0] + 1;
+  coord_t batch_size =
+      batch_input_domain.hi()[1] - batch_input_domain.lo()[1] + 1;
+
+  // copy 1 token from each batch
+  //  FIXME: currently assume continous indices
+  size_t guid = meta.guids[0];
+  size_t start_idx = meta.token_indexes[0].token_position;
+  size_t dst_idx = 0;
+
+  std::cout << "num samples " << meta.num_samples << "\n";
+
+  for (size_t i = 0; i <= meta.num_samples; i++) {
+
+    // if the first token in one request
+    if (i == meta.num_samples || meta.guids[i] != guid) {
+      size_t tokens_to_copy =
+          (meta.token_indexes[i - 1].token_position - start_idx + 1);
+      std::cout << "size to copy:  " << tokens_to_copy << "\n";
+
+      if (tokens_to_copy > 1 || meta.token_indexes[i - 1].token_position <
+                                    meta.token_indexes[i - 1].initial_length) {
+        // token pos < init length, the init length is the input sentence length
+        // so this is the initial input, load from file.
+
+        size_t copy_start_index = guid * llamaconfig.sentence_len;
+        std::cout << "copy index:  " << copy_start_index << "\n";
+        copy_kernel<<<GET_BLOCKS(tokens_to_copy), CUDA_NUM_THREADS>>>(
+            batch_input.ptr + dst_idx,
+            full_input.ptr + copy_start_index,
+            tokens_to_copy);
+
+        std::cout << "------------req---------------: " << guid << "\n";
+        if (guid == 0) {
+          std::cout << "guid: " << meta.guids[i] << ", i: " << i << std::endl;
+        }
+        for (int i = 0; i < 8; i++) {
+          std::cout << "value: " << full_input.ptr[copy_start_index + i]
+                    << std::endl;
+        }
+        std::cout << "dst index: " << dst_idx << "\n";
+
+      } else {
+        // for token by token generating, get token from the previous inference.
+
+        long token = prev_batch_preds.at(guid);
+        std::cout << "next iter  " << meta.token_indexes[i - 1].token_position
+                  << ", dst_idx: " << dst_idx << ", token:" << token << "\n";
+        long *dst_ptr = batch_input.ptr + dst_idx;
+
+        cudaMemcpy(dst_ptr, &token, sizeof(long), cudaMemcpyHostToDevice);
+      }
+
+      // update for next req
+      if (i < meta.num_samples) {
+        guid = meta.guids[i];
+        start_idx = meta.token_indexes[i].token_position;
+      }
+      dst_idx = i;
+    }
+  }
+
+  std::cout << "load input finished....." << std::endl;
+}
diff --git a/examples/cpp/inference/LLAMA/llama.cc b/examples/cpp/inference/LLAMA/llama.cc
new file mode 100644
index 0000000000..3d745d8bd5
--- /dev/null
+++ b/examples/cpp/inference/LLAMA/llama.cc
@@ -0,0 +1,259 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "llama.h"
+#include "flexflow/inference.h"
+
+using namespace Legion;
+
+LegionRuntime::Logger::Category log_app("llama");
+
+void parse_input_args(char **argv, int argc, LLAMAConfig &config) {
+  for (int i = 1; i < argc; i++) {
+
+    // input
+    if (!strcmp(argv[i], "--dataset")) {
+      config.input_path = std::string(argv[++i]);
+      continue;
+    }
+
+    // weights
+    if (!strcmp(argv[i], "--weights")) {
+      config.weight_file_path = std::string(argv[++i]);
+      continue;
+    }
+  }
+}
+
+void FlexFlow::top_level_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  FFConfig ffconfig;
+  LLAMAConfig llamaConfig;
+  FFModel ff(ffconfig);
+  std::unordered_map<std::string, Layer *> weights_layers;
+
+  // InputArgs const &command_args = HighLevelRuntime::get_input_args();
+  // char **argv = command_args.argv;
+  // int argc = command_args.argc;
+  // parse_input_args(argv, argc, llamaConfig);
+
+  std::cout << "print llama config: " << llamaConfig.input_path << "-->"
+            << llamaConfig.batchSize;
+
+  //------------------------------ build the model --------------------------
+  Tensor input;
+  {
+    int const token_dims[] = {llamaConfig.batchSize, llamaConfig.max_seq_len};
+    input = ff.create_tensor<2>(token_dims, DT_INT64);
+  }
+
+  Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
+  Tensor token = ff.embedding(input,
+                              llamaConfig.vocab_size,
+                              llamaConfig.dim,
+                              AGGR_MODE_NONE,
+                              DT_FLOAT,
+                              NULL,
+                              embed_init);
+  Layer *embedding = ff.layers.back();
+  weights_layers.emplace("tok_embeddings_weight", embedding);
+
+  // std::cout << "------token shape";
+  // std::cout << token->num_dims << "------\n";
+  // for (int i = 0; i < token->num_dims; i++) {
+  //   std::cout << token->dims[i] << "------\n";
+  // }
+
+  // n transformer blocks impl
+  for (int i = 0; i < 1; i++) {
+    // step 1: attention
+    std::vector<int> axes = {2};
+    Tensor att_norm = ff.rms_norm(token, llamaConfig.norm_eps, llamaConfig.dim);
+    Layer *attention_norm = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) +
+                               "_attention_norm_weight",
+                           attention_norm);
+    Tensor mha =
+        ff.inc_multihead_self_attention(att_norm,
+                                        llamaConfig.dim,
+                                        llamaConfig.n_heads,
+                                        llamaConfig.dim / llamaConfig.n_heads,
+                                        llamaConfig.dim / llamaConfig.n_heads,
+                                        0.0f,
+                                        true,
+                                        false,
+                                        false,
+                                        NULL,
+                                        true);
+    Layer *attention_layer = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) + "_attention_weight",
+                           attention_layer);
+    token = ff.add(token, mha);
+
+    // step 2: SILU activaion
+    Tensor ff_norm = ff.rms_norm(token, llamaConfig.norm_eps, llamaConfig.dim);
+    Layer *ffn_layer = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) + "_ffn_norm_weight",
+                           ffn_layer);
+
+    Tensor w1 = ff.dense(ff_norm, llamaConfig.hidden_dim, AC_MODE_NONE, false);
+    Layer *w1_layer = ff.layers.back();
+    weights_layers.emplace(
+        "layers_" + std::to_string(i) + "_feed_forward_w1_weight", w1_layer);
+
+    Tensor w3 = ff.dense(ff_norm, llamaConfig.hidden_dim, AC_MODE_NONE, false);
+    Layer *w3_layer = ff.layers.back();
+    weights_layers.emplace(
+        "layers_" + std::to_string(i) + "_feed_forward_w3_weight", w3_layer);
+
+    Tensor sigmoid = ff.sigmoid(w1);
+    Tensor silu = ff.multiply(w1, sigmoid);
+    Tensor multi = ff.multiply(silu, w3);
+
+    Tensor w2 = ff.dense(multi, llamaConfig.dim, AC_MODE_NONE, false);
+    Layer *w2_layer = ff.layers.back();
+    weights_layers.emplace(
+        "layers_" + std::to_string(i) + "_feed_forward_w2_weight", w2_layer);
+    token = ff.add(token, w2);
+  }
+
+  // final normalization and linear
+  std::vector<int> axes = {2};
+  token = ff.rms_norm(token, 1e-6, 4096);
+  Layer *final_norm = ff.layers.back();
+  weights_layers.emplace("norm_weight", final_norm);
+  Tensor dense = ff.dense(token, llamaConfig.vocab_size, AC_MODE_NONE, false);
+  Layer *final_linear = ff.layers.back();
+  weights_layers.emplace("output_weight", final_linear);
+  Tensor output = ff.arg_top_k(dense, /*k=*/1, false);
+
+  //------------------- compile the model --------------------------------
+  std::cout << "------start compile ----------" << std::endl;
+  InferenceManager im(&ff, llamaConfig.batchSize, 1);
+  im.compile_model_and_allocate_buffer();
+
+  std::cout << "------init ops----------" << std::endl;
+  im.init_operators_inference();
+  std::cout << "------model compiled and init ----------" << std::endl;
+
+  //------------------------------ load inputs --------------------------
+  std::cout << "------create dataloaders ----------" << std::endl;
+  // read prompt into input
+  ParallelTensor input_pt;
+  ff.get_parallel_tensor_from_tensor(input, input_pt);
+  assert(im.tensor_buffer.find(input_pt) != im.tensor_buffer.end());
+  std::cout << im.tensor_buffer[input_pt].size() << std::endl;
+  DataLoader loader(ff, &llamaConfig, im.tensor_buffer[input_pt].at(0));
+
+  //------------------------------ load weights---------------------------
+  for (auto &v : weights_layers) {
+    Tensor weight = v.second->weights[0];
+    std::cout << "weights layer: " << v.first << "\n";
+
+    if (weight == NULL) {
+      std::cout << "op no weights : " << v.first << "\n";
+      continue;
+    }
+
+    size_t volume = 1;
+    std::vector<int> dims_vec;
+    for (int i = 0; i < weight->num_dims; i++) {
+      dims_vec.push_back(weight->dims[i]);
+      volume *= weight->dims[i];
+    }
+
+    assert(weight->data_type == DT_FLOAT);
+    float *data = (float *)malloc(sizeof(float) * volume);
+
+    if (v.first.find("attention_w") != std::string::npos) {
+      loader.load_attention_weights(
+          data, volume, v.first, llamaConfig.weight_file_path);
+
+    } else {
+      loader.load_from_file(
+          data, volume, llamaConfig.weight_file_path + v.first);
+      if (v.first.find("attention_norm") != std::string::npos) {
+        // std::cout << "norm weight data" << std::endl;
+        // for (int i = 0; i < 100; i++) {
+        //   std::cout << data[i] << ", ";
+        // }
+      }
+    }
+
+    ParallelTensor weight_pt;
+    ff.get_parallel_tensor_from_tensor(weight, weight_pt);
+    weight_pt->set_tensor<float>(&ff, dims_vec, data);
+  }
+  std::cout << "------load wieght finished----------" << std::endl;
+
+  //------------------------------ do inference---------------------------
+  int processed_requests = 0;
+  std::map<int, Future> future_handlers;
+  std::map<int, BatchConfig *> batch_configs;
+  BatchConfig *bc = nullptr;
+  std::map<size_t, long> batch_predictions[1];
+  loader.reset();
+
+  bool new_req = true;
+
+  while (processed_requests < llamaConfig.sentence_len) {
+    int bid = 0;
+    size_t max_reqs, max_tkns;
+    if (future_handlers.find(bid) == future_handlers.end()) {
+      bc = new BatchConfig();
+    } else {
+      // have luanched this bid
+      Future future = future_handlers[bid];
+      if (!future.is_ready(true /*subscribe*/)) {
+        continue;
+      } else {
+        std::cout << "future is ready...." << std::endl;
+      }
+      // process end
+      InferenceResult ir = future.get_result<InferenceResult>();
+      bc = batch_configs[bid];
+
+      std::cout << "store outputs start...." << std::endl;
+      loader.store_outputs(bc, ir, batch_predictions[bid]);
+      processed_requests += bc->update_results(ir);
+
+      if (!new_req) {
+        break;
+      }
+      new_req = false;
+    }
+    // batch cofig register 5 reqs
+    // init length relate to the min_prompt_size for llama
+    if (new_req) {
+      for (int i = 0; i < llamaConfig.batchSize; i++) {
+        assert(bc->register_new_request(i, llamaConfig.max_seq_len, 347));
+      }
+    }
+
+    bc->prepare_next_batch();
+    std::cout << "new tokens: " << bc->num_active_tokens();
+    loader.next_batch(ff, bc, batch_predictions[bid]);
+
+    FutureMap fm = im.inference(bid, *bc);
+    assert(fm.get_future_map_domain().get_volume() == 1);
+    future_handlers[bid] = fm.get_future(0);
+    batch_configs[bid] = bc;
+  }
+
+  // float* data
+  std::cout << "----------inference finished--------------" << std::endl;
+}
diff --git a/examples/cpp/inference/LLAMA/llama.h b/examples/cpp/inference/LLAMA/llama.h
new file mode 100644
index 0000000000..17300f6d0d
--- /dev/null
+++ b/examples/cpp/inference/LLAMA/llama.h
@@ -0,0 +1,107 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/model.h"
+#define MAX_NUM_SAMPLES 65536
+#define MAX_TOKEN_LEN 32000
+
+using namespace Legion;
+using namespace FlexFlow;
+
+struct LLAMAConfig {
+  LLAMAConfig(void) {
+    // todo read from config/param file
+    n_layers = 32;
+    vocab_size = 32000;
+    n_heads = 32;
+    dim = 4096;
+    multiple_of = 256;
+    norm_eps = 1e-6;
+    total_sentence = 5;
+    sentence_len = 347;
+    max_gen_length = 256;
+    batchSize = 5;
+    total_requests = 2560;
+    incremental_mode = true;
+    sequence_length = MAX_SEQ_LEN;
+    max_seq_len = 8;
+
+    // todo from args
+    weight_file_path =
+        "/home/ubuntu/FlexFlow/examples/cpp/inference/LLAMA/weights/";
+    input_path = "/home/ubuntu/FlexFlow/examples/cpp/inference/LLAMA/tokens/"
+                 "llama_demo_tokens";
+
+    // hidden dim
+    hidden_dim = 4 * dim;
+    hidden_dim = int(2 * hidden_dim / 3);
+    hidden_dim =
+        multiple_of * int((hidden_dim + multiple_of - 1) / multiple_of);
+  }
+  int n_heads, n_layers, vocab_size, dim, multiple_of, hidden_dim,
+      total_sentence, sentence_len, batchSize, total_requests, incremental_mode,
+      sequence_length, max_gen_length, max_seq_len;
+  float norm_eps;
+  std::string weight_file_path;
+  std::string input_path;
+};
+
+class DataLoader {
+public:
+  DataLoader(FFModel &ff,
+             LLAMAConfig const *llamaconfig,
+             ParallelTensor const &input);
+  void next_batch(FFModel &ff,
+                  BatchConfig *bc,
+                  std::map<size_t, long> &batch_predictions);
+  void reset();
+  static void load_entire_dataset(Task const *task,
+                                  std::vector<PhysicalRegion> const &regions,
+                                  Context ctx,
+                                  Runtime *runtime);
+  static void load_input(Task const *task,
+                         std::vector<PhysicalRegion> const &regions,
+                         Context ctx,
+                         Runtime *runtime);
+
+  template <typename T>
+  static void load_from_file(T *ptr, size_t size, std::string filename);
+
+  template <typename T>
+  static void load_attention_weights(T *ptr,
+                                     size_t size,
+                                     std::string layer_name,
+                                     std::string weight_path);
+  void store_outputs(BatchConfig *bc,
+                     InferenceResult const &ir,
+                     std::map<size_t, long> &batch_predictions);
+
+public:
+  int num_samples, next_index, next_token_idx, next_batch_index;
+  std::map<size_t, std::vector<int>> outputs;
+  FlexFlow::ParallelTensor full_input, batch_input;
+};
+
+struct SampleIdxs {
+  int num_samples;
+  int idxs[MAX_NUM_SAMPLES];
+  int token_idx;
+  int batch_idx;
+};
+
+struct DataLoaderNextBatchInput {
+  BatchConfig::SampleIdxs const &meta;
+  std::map<size_t, long> const &prev_batch_preds;
+};
diff --git a/examples/cpp/inference/dataloader.cu b/examples/cpp/inference/dataloader.cu
index 71dc14db49..8dcb8c3ab7 100644
--- a/examples/cpp/inference/dataloader.cu
+++ b/examples/cpp/inference/dataloader.cu
@@ -105,7 +105,7 @@ void DataLoader::load_input(Task const *task,
         assert(prev_batch_preds.find(guid) != prev_batch_preds.end());
         int token = prev_batch_preds.at(guid);
         int *dst_ptr = batch_input_ptr + dst_idx;
-        cudaMemcpy(dst_ptr, &token, 1, cudaMemcpyHostToDevice);
+        cudaMemcpy(dst_ptr, &token, sizeof(int), cudaMemcpyHostToDevice);
         // copy_kernel<<<GET_BLOCKS(tokens_to_copy),
         // CUDA_NUM_THREADS>>>(dst_ptr, &token, tokens_to_copy);
         //  cudaMemcpyAsync(batch_input_ptr + dst_idx * token_dim, &token, 1,
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 6873ce5e43..40080c9840 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -597,6 +597,7 @@ class FFModel {
                                       bool add_bias_kv = false,
                                       bool add_zero_attn = false,
                                       Initializer *kernel_initializer = NULL,
+                                      bool apply_rotary_embedding = false,
                                       char const *name = NULL);
   Tensor create_tensor_legion_ordering(int num_dim,
                                        int const dims[],
diff --git a/include/flexflow/ops/cast.h b/include/flexflow/ops/cast.h
index 2d69b9469e..b1e078f60e 100644
--- a/include/flexflow/ops/cast.h
+++ b/include/flexflow/ops/cast.h
@@ -35,8 +35,17 @@ class Cast : public Op {
        Input const &input,
        char const *name = nullptr);
   void init(FFModel const &);
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void forward(FFModel const &);
   void backward(FFModel const &);
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) {
     assert(0);
   }
diff --git a/include/flexflow/ops/element_unary.h b/include/flexflow/ops/element_unary.h
index 42ab25aaf8..e60084fc78 100644
--- a/include/flexflow/ops/element_unary.h
+++ b/include/flexflow/ops/element_unary.h
@@ -44,8 +44,17 @@ class ElementUnary : public Op {
                Input const x,
                char const *name = nullptr);
   void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index 716a2563cd..8daafd8565 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -11,6 +11,7 @@
 #include "flexflow/ops/inc_multihead_self_attention_params.h"
 #include "math.h"
 #include <cfloat>
+#include <complex>
 
 namespace FlexFlow {
 
@@ -32,6 +33,7 @@ class IncMultiHeadSelfAttention : public Op {
                             bool _bias,
                             bool _add_bias_kv,
                             bool _add_zero_attn,
+                            bool _apply_rotary_embedding,
                             bool allocate_weights,
                             char const *name);
   IncMultiHeadSelfAttention(FFModel &model,
@@ -45,6 +47,7 @@ class IncMultiHeadSelfAttention : public Op {
                             bool _bias,
                             bool _add_bias_kv,
                             bool _add_zero_attn,
+                            bool _apply_rotary_embedding,
                             bool allocate_weights,
                             char const *name);
   IncMultiHeadSelfAttention(FFModel &model,
@@ -88,6 +91,7 @@ class IncMultiHeadSelfAttention : public Op {
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &mv,
                              CostMetrics &cost_metrics) const override;
+
   static void inference_kernel_wrapper(IncMultiHeadSelfAttentionMeta const *m,
                                        BatchConfig const *bc,
                                        float const *input_ptr,
@@ -99,7 +103,7 @@ class IncMultiHeadSelfAttention : public Op {
   int num_heads;
   float dropout;
   bool bias;
-  bool add_bias_kv, add_zero_attn;
+  bool add_bias_kv, add_zero_attn, apply_rotary_embedding;
   int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
   int qoSeqLength, kvSeqLength;
 };
@@ -120,6 +124,7 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
   int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
   int num_heads;
   bool *has_load_weights;
+  bool *apply_rotary_embedding;
 #ifdef INFERENCE_TESTS
   float *kcache, *vcache;
 #endif
diff --git a/include/flexflow/ops/inc_multihead_self_attention_params.h b/include/flexflow/ops/inc_multihead_self_attention_params.h
index e7535dc23d..d263bc741a 100644
--- a/include/flexflow/ops/inc_multihead_self_attention_params.h
+++ b/include/flexflow/ops/inc_multihead_self_attention_params.h
@@ -10,7 +10,7 @@ struct IncMultiHeadSelfAttentionParams {
   LayerID layer_guid;
   int embed_dim, num_heads, kdim, vdim;
   float dropout;
-  bool bias, add_bias_kv, add_zero_attn;
+  bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding;
 
   bool is_valid(ParallelTensorShape const &) const;
 };
diff --git a/include/flexflow/ops/rms_norm.h b/include/flexflow/ops/rms_norm.h
index 4100baadcf..db18ebdd39 100644
--- a/include/flexflow/ops/rms_norm.h
+++ b/include/flexflow/ops/rms_norm.h
@@ -17,11 +17,19 @@ class RMSNorm : public Op {
           LayerID const &_layer_guid,
           const ParallelTensor _input,
           float _eps,
+          int dim,
+          bool allocate_weights,
           char const *name);
   RMSNorm(FFModel &model,
           RMSNormParams const &params,
           ParallelTensor input,
+          bool allocate_weights,
           char const *name = nullptr);
+
+  RMSNorm(FFModel &model,
+          RMSNorm const &other,
+          const ParallelTensor input,
+          bool allocate_weights);
   void init(FFModel const &);
   void forward(FFModel const &);
   void backward(FFModel const &);
@@ -68,7 +76,7 @@ class RMSNorm : public Op {
   float eps;
   char op_name[MAX_OPNAME];
   int effective_batch_size;
-  int data_dim;
+  int dim, data_dim;
 };
 } // namespace FlexFlow
 #endif // _FLEXFLOW_RMS_NORM_H
\ No newline at end of file
diff --git a/include/flexflow/ops/rms_norm_params.h b/include/flexflow/ops/rms_norm_params.h
index c5d71f71ce..82a459009a 100644
--- a/include/flexflow/ops/rms_norm_params.h
+++ b/include/flexflow/ops/rms_norm_params.h
@@ -8,7 +8,7 @@ namespace FlexFlow {
 struct RMSNormParams {
   LayerID layer_guid;
   float eps;
-
+  int dim;
   bool is_valid(ParallelTensorShape const &) const;
 };
 
diff --git a/include/flexflow/ops/split.h b/include/flexflow/ops/split.h
index 633268ffbf..cd40d73e18 100644
--- a/include/flexflow/ops/split.h
+++ b/include/flexflow/ops/split.h
@@ -22,6 +22,15 @@ class Split : public Op {
         const Input input,
         char const *name = nullptr);
   void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   void print_layer(FFModel const &model) override {
diff --git a/include/flexflow/substitution_loader.h b/include/flexflow/substitution_loader.h
index 9f9db223f2..776fe2c78e 100644
--- a/include/flexflow/substitution_loader.h
+++ b/include/flexflow/substitution_loader.h
@@ -41,95 +41,97 @@ NLOHMANN_JSON_SERIALIZE_ENUM(PMParameter,
                               {PM_PARALLEL_DEGREE, "PM_PARALLEL_DEGREE"},
                               {PM_PAD, "PM_PAD"}})
 
-NLOHMANN_JSON_SERIALIZE_ENUM(OperatorType,
-                             {{OP_INVALID, nullptr},
-                              {OP_NOOP, "OP_NOOP"},
-                              {OP_CONV2D, "OP_CONV2D"},
-                              {OP_DROPOUT, "OP_DROPOUT"},
-                              {OP_LINEAR, "OP_LINEAR"},
-                              {OP_BATCHMATMUL, "OP_BATCHMATMUL"},
-                              {OP_POOL2D, "OP_POOL2D_MAX"},
-                              {OP_SCALAR_MULTIPLY, "OP_SCALAR_MULTIPLY"},
-                              {OP_SCALAR_ADD, "OP_SCALAR_ADD"},
-                              {OP_SCALAR_FLOOR_DIV, "OP_SCALAR_FLOOR_DIV"},
-                              {OP_SCALAR_TRUE_DIV, "OP_SCALAR_TRUE_DIV"},
-                              {OP_SCALAR_SUB, "OP_SCALAR_SUB"},
-                              {OP_RELU, "OP_RELU"},
-                              {OP_IDENTITY, "OP_IDENTITY"},
-                              {OP_SIGMOID, "OP_SIGMOID"},
-                              {OP_TANH, "OP_TANH"},
-                              {OP_ELU, "OP_ELU"},
-                              {OP_FLAT, "OP_FLAT"},
-                              {OP_SOFTMAX, "OP_SOFTMAX"},
-                              {OP_BATCHNORM, "OP_BATCHNORM"},
-                              {OP_CONCAT, "OP_CONCAT"},
-                              {OP_SPLIT, "OP_SPLIT"},
-                              {OP_EMBEDDING, "OP_EMBEDDING"},
-                              {OP_GROUP_BY, "OP_GROUP_BY"},
-                              {OP_CACHE, "OP_CACHE"},
-                              {OP_AGGREGATE, "OP_AGGREGATE"},
-                              {OP_AGG_SPEC, "OP_AGG_SPEC"},
-                              {OP_RESHAPE, "OP_RESHAPE"},
-                              {OP_REVERSE, "OP_REVERSE"},
-                              {OP_TRANSPOSE, "OP_TRANSPOSE"},
-                              {OP_EW_ADD, "OP_EW_ADD"},
-                              {OP_EW_MUL, "OP_EW_MUL"},
-                              {OP_MATMUL, "OP_MATMUL"},
-                              {OP_MUL, "OP_MUL"},
-                              {OP_ENLARGE, "OP_ENLARGE"},
-                              {OP_MERGE_GCONV, "OP_MERGE_GCONV"},
-                              {OP_CONSTANT_IMM, "OP_CONSTANT_IMM"},
-                              {OP_CONSTANT_ICONV, "OP_CONSTANT_ICONV"},
-                              {OP_CONSTANT_ONE, "OP_CONSTANT_ONE"},
-                              {OP_CONSTANT_POOL, "OP_CONSTANT_POOL"},
-                              {OP_SQUEEZE, "OP_SQUEEZE"},
-                              {OP_UNSQUEEZE, "OP_UNSQUEEZE"},
-                              {OP_EW_SUB, "OP_EW_SUB"},
-                              {OP_EW_DIV, "OP_EW_DIV"},
-                              {OP_EW_EQUAL, "OP_EW_EQUAL"},
-                              {OP_EW_GREATER, "OP_EW_GREATER"},
-                              {OP_EW_LESS, "OP_EW_LESS"},
-                              {OP_EW_MAX, "OP_EW_MAX"},
-                              {OP_EW_MIN, "OP_EW_MIN"},
-                              {OP_REDUCE_ARGMAX, "OP_REDUCE_ARGMAX"},
-                              {OP_REDUCE_ARGMIN, "OP_REDUCE_ARGMIN"},
-                              {OP_REDUCE_MAX, "OP_REDUCE_MAX"},
-                              {OP_REDUCE_MEAN, "OP_REDUCE_MEAN"},
-                              {OP_REDUCE_MIN, "OP_REDUCE_MIN"},
-                              {OP_REDUCE_PROD, "OP_REDUCE_PROD"},
-                              {OP_REDUCE_SUM, "OP_REDUCE_SUM"},
-                              {OP_PAD, "OP_PAD"},
-                              {OP_SHAPE, "OP_SHAPE"},
-                              {OP_SIZE, "OP_SIZE"},
-                              {OP_TOPK, "OP_TOPK"},
-                              {OP_WHERE, "OP_WHERE"},
-                              {OP_CEIL, "OP_CEIL"},
-                              {OP_CAST, "OP_CAST"},
-                              {OP_EXP, "OP_EXP"},
-                              {OP_ROUND, "OP_ROUND"},
-                              {OP_LOG, "OP_LOG"},
-                              {OP_LOGICAL_NOT, "OP_LOGICAL_NOT"},
-                              {OP_SQRT, "OP_SQRT"},
-                              {OP_SIN, "OP_SIN"},
-                              {OP_COS, "OP_COS"},
-                              {OP_LEAKYRELU, "OP_LEAKYRELU"},
-                              {OP_SLICE, "OP_SLICE"},
-                              {OP_RESIZE, "OP_RESIZE"},
-                              {OP_PRELU, "OP_PRELU"},
-                              {OP_GELU, "OP_GELU"},
-                              {OP_MULTIHEAD_ATTENTION,
-                               "OP_MULTIHEAD_ATTENTION"},
-                              {OP_FUSED, "OP_FUSED"},
-                              {OP_RSQRT, "OP_RSQRT"},
-                              {OP_POW, "OP_POW"},
-                              {OP_MEAN, "OP_MEAN"},
-                              {OP_LAYERNORM, "OP_LAYERNORM"},
-                              {OP_REPARTITION, "OP_PARTITION"},
-                              {OP_COMBINE, "OP_COMBINE"},
-                              {OP_REPLICATE, "OP_REPLICATE"},
-                              {OP_REDUCTION, "OP_REDUCE"},
-                              {OP_PIPELINE, "OP_PIPELINE"},
-                              {OP_FUSED_PARALLEL, "OP_FUSED_PARALLEL"}})
+NLOHMANN_JSON_SERIALIZE_ENUM(
+    OperatorType,
+    {{OP_INVALID, nullptr},
+     {OP_NOOP, "OP_NOOP"},
+     {OP_CONV2D, "OP_CONV2D"},
+     {OP_DROPOUT, "OP_DROPOUT"},
+     {OP_LINEAR, "OP_LINEAR"},
+     {OP_BATCHMATMUL, "OP_BATCHMATMUL"},
+     {OP_POOL2D, "OP_POOL2D_MAX"},
+     {OP_SCALAR_MULTIPLY, "OP_SCALAR_MULTIPLY"},
+     {OP_SCALAR_ADD, "OP_SCALAR_ADD"},
+     {OP_SCALAR_FLOOR_DIV, "OP_SCALAR_FLOOR_DIV"},
+     {OP_SCALAR_TRUE_DIV, "OP_SCALAR_TRUE_DIV"},
+     {OP_SCALAR_SUB, "OP_SCALAR_SUB"},
+     {OP_RELU, "OP_RELU"},
+     {OP_IDENTITY, "OP_IDENTITY"},
+     {OP_SIGMOID, "OP_SIGMOID"},
+     {OP_TANH, "OP_TANH"},
+     {OP_ELU, "OP_ELU"},
+     {OP_FLAT, "OP_FLAT"},
+     {OP_SOFTMAX, "OP_SOFTMAX"},
+     {OP_BATCHNORM, "OP_BATCHNORM"},
+     {OP_CONCAT, "OP_CONCAT"},
+     {OP_SPLIT, "OP_SPLIT"},
+     {OP_EMBEDDING, "OP_EMBEDDING"},
+     {OP_GROUP_BY, "OP_GROUP_BY"},
+     {OP_CACHE, "OP_CACHE"},
+     {OP_AGGREGATE, "OP_AGGREGATE"},
+     {OP_AGG_SPEC, "OP_AGG_SPEC"},
+     {OP_RESHAPE, "OP_RESHAPE"},
+     {OP_REVERSE, "OP_REVERSE"},
+     {OP_TRANSPOSE, "OP_TRANSPOSE"},
+     {OP_EW_ADD, "OP_EW_ADD"},
+     {OP_EW_MUL, "OP_EW_MUL"},
+     {OP_MATMUL, "OP_MATMUL"},
+     {OP_MUL, "OP_MUL"},
+     {OP_ENLARGE, "OP_ENLARGE"},
+     {OP_MERGE_GCONV, "OP_MERGE_GCONV"},
+     {OP_CONSTANT_IMM, "OP_CONSTANT_IMM"},
+     {OP_CONSTANT_ICONV, "OP_CONSTANT_ICONV"},
+     {OP_CONSTANT_ONE, "OP_CONSTANT_ONE"},
+     {OP_CONSTANT_POOL, "OP_CONSTANT_POOL"},
+     {OP_SQUEEZE, "OP_SQUEEZE"},
+     {OP_UNSQUEEZE, "OP_UNSQUEEZE"},
+     {OP_EW_SUB, "OP_EW_SUB"},
+     {OP_EW_DIV, "OP_EW_DIV"},
+     {OP_EW_EQUAL, "OP_EW_EQUAL"},
+     {OP_EW_GREATER, "OP_EW_GREATER"},
+     {OP_EW_LESS, "OP_EW_LESS"},
+     {OP_EW_MAX, "OP_EW_MAX"},
+     {OP_EW_MIN, "OP_EW_MIN"},
+     {OP_REDUCE_ARGMAX, "OP_REDUCE_ARGMAX"},
+     {OP_REDUCE_ARGMIN, "OP_REDUCE_ARGMIN"},
+     {OP_REDUCE_MAX, "OP_REDUCE_MAX"},
+     {OP_REDUCE_MEAN, "OP_REDUCE_MEAN"},
+     {OP_REDUCE_MIN, "OP_REDUCE_MIN"},
+     {OP_REDUCE_PROD, "OP_REDUCE_PROD"},
+     {OP_REDUCE_SUM, "OP_REDUCE_SUM"},
+     {OP_PAD, "OP_PAD"},
+     {OP_SHAPE, "OP_SHAPE"},
+     {OP_SIZE, "OP_SIZE"},
+     {OP_TOPK, "OP_TOPK"},
+     {OP_WHERE, "OP_WHERE"},
+     {OP_CEIL, "OP_CEIL"},
+     {OP_CAST, "OP_CAST"},
+     {OP_EXP, "OP_EXP"},
+     {OP_ROUND, "OP_ROUND"},
+     {OP_LOG, "OP_LOG"},
+     {OP_LOGICAL_NOT, "OP_LOGICAL_NOT"},
+     {OP_SQRT, "OP_SQRT"},
+     {OP_SIN, "OP_SIN"},
+     {OP_COS, "OP_COS"},
+     {OP_LEAKYRELU, "OP_LEAKYRELU"},
+     {OP_SLICE, "OP_SLICE"},
+     {OP_RESIZE, "OP_RESIZE"},
+     {OP_PRELU, "OP_PRELU"},
+     {OP_GELU, "OP_GELU"},
+     {OP_MULTIHEAD_ATTENTION, "OP_MULTIHEAD_ATTENTION"},
+     {OP_INC_MULTIHEAD_SELF_ATTENTION, "OP_INC_MULTIHEAD_SELF_ATTENTION"},
+     {OP_FUSED, "OP_FUSED"},
+     {OP_RSQRT, "OP_RSQRT"},
+     {OP_POW, "OP_POW"},
+     {OP_MEAN, "OP_MEAN"},
+     {OP_LAYERNORM, "OP_LAYERNORM"},
+     {OP_RMS_NORM, "OP_RMS_NORM"},
+     {OP_REPARTITION, "OP_PARTITION"},
+     {OP_COMBINE, "OP_COMBINE"},
+     {OP_REPLICATE, "OP_REPLICATE"},
+     {OP_REDUCTION, "OP_REDUCE"},
+     {OP_PIPELINE, "OP_PIPELINE"},
+     {OP_FUSED_PARALLEL, "OP_FUSED_PARALLEL"}})
 
 namespace FlexFlow {
 namespace substitution_loader {
diff --git a/include/flexflow/utils/cuda_helper.h b/include/flexflow/utils/cuda_helper.h
index 4271919911..2ea7227879 100644
--- a/include/flexflow/utils/cuda_helper.h
+++ b/include/flexflow/utils/cuda_helper.h
@@ -82,6 +82,12 @@ __global__ void assign_kernel(DT *ptr, Legion::coord_t size, DT value);
 template <typename DT>
 __global__ void copy_kernel(DT *dst, const DT *src, Legion::coord_t size);
 
+template <typename DT>
+__global__ void copy_kernel_discrete(DT *dst,
+                                     const DT *src,
+                                     Legion::coord_t size,
+                                     size_t *index);
+
 template <typename T>
 __global__ void add_kernel(T *data_ptr, T const *grad_ptr, size_t size);
 
@@ -133,6 +139,9 @@ __host__ void updateGAS(float *para_ptr,
 template <typename T>
 void print_tensor(T const *ptr, size_t num_elements, char const *prefix);
 
+template <typename T>
+void save_tensor(T const *ptr, size_t num_elements, char const *file_name);
+
 template <typename T>
 T *download_tensor(T const *ptr, size_t num_elements);
 
diff --git a/include/flexflow/utils/hip_helper.h b/include/flexflow/utils/hip_helper.h
index 6970832231..f78102c0fe 100644
--- a/include/flexflow/utils/hip_helper.h
+++ b/include/flexflow/utils/hip_helper.h
@@ -133,6 +133,12 @@ __host__ void updateGAS(float *para_ptr,
 template <typename T>
 void print_tensor(T const *ptr, size_t num_elements, char const *prefix);
 
+template <typename T>
+T *download_tensor(T const *ptr, size_t num_elements);
+
+template <typename T>
+bool download_tensor(T const *ptr, T *dst, size_t num_elements);
+
 miopenStatus_t
     cudnnSetTensorDescriptorFromDomain(miopenTensorDescriptor_t tensor,
                                        Legion::Domain domain);
diff --git a/python/flexflow/core/flexflow_cffi.py b/python/flexflow/core/flexflow_cffi.py
index 42339d781c..3c7ea11160 100644
--- a/python/flexflow/core/flexflow_cffi.py
+++ b/python/flexflow/core/flexflow_cffi.py
@@ -427,6 +427,13 @@ class MultiHeadAttention(Op):
   def __init__(self, handle, idx=None, name=None):
     super(MultiHeadAttention, self).__init__(handle, idx, name)
 
+# -----------------------------------------------------------------------
+# Increamental MultiHeadAttention
+# -----------------------------------------------------------------------
+class IncMultiHeadAttention(Op):
+  def __init__(self, handle, idx=None, name=None):
+    super(IncMultiHeadAttention, self).__init__(handle, idx, name)
+
 # -----------------------------------------------------------------------
 # flexflow_op_t handle to Op
 # -----------------------------------------------------------------------
@@ -506,7 +513,9 @@ def convert_op_handle_to_op(op_type, handle, idx=None, name=None):
   elif op_type == OpType.REVERSE:
     return Reverse(handle, idx, name)
   elif op_type == OpType.MULTIHEAD_ATTENTION:
-    return Reverse(handle, idx, name)
+    return MultiHeadAttention(handle, idx, name)
+  elif op_type == OpType.INC_MULTIHEAD_ATTENTION:
+        return MultiHeadAttention(handle, idx, name)
   elif op_type == OpType.RSQRT:
     return Rsqrt(handle, idx, name)
   elif op_type == OpType.POW:
@@ -1950,7 +1959,55 @@ def multihead_attention(self, query, key, value,
     handle = ffc.flexflow_model_add_multihead_attention(self.handle, query.handle, key.handle, value.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, kernel_init_handle, c_name)
     self.add_layer(OpType.MULTIHEAD_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.MULTIHEAD_ATTENTION)
+  def inc_multihead_attention(self, input, 
+                          embed_dim, num_heads, 
+                          kdim=0, vdim=0, dropout=0.0, 
+                          bias=True, add_bias_kv=False, add_zero_attn=False, 
+                          kernel_initializer=None, name=None):
+    """Defines the MultiHead Attention operation as described in Attention Is All You Need 
+    which takes in the tensors :attr:`query`, :attr:`key`, and :attr:`value`, 
+    and returns the dot-product attention between them:.
+             
+    :param input: the input Tensor.
+    :type query: Tensor
 
+    :param embed_dim: total dimension of the model
+    :type embed_dim: int
+                          
+    :param num_heads: Number of attention heads.
+    :type num_heads: int
+                          
+    :param kdim: total number of features in key. Default is 0
+    :type kdim: int
+                          
+    :param vdim: total number of features in value. Default is 0
+    :type vdim: int
+                          
+    :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
+    :type dropout: float(0-1)
+                          
+    :param bias: Whether the dense layers use bias vectors. Default is True.
+    :type bias: bool
+                          
+    :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
+    :type add_bias_kv: bool
+                          
+    :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
+    :type add_zero_attn: bool
+    
+    :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+    :type kernel_initializer: Initializer
+             
+    :param name: the name of the layer. Default is None.
+    :type name: string
+
+    :returns:  Tensor -- the output tensor.
+    """     
+    c_name = get_c_name(name)                 
+    kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+    handle = ffc.flexflow_model_add_inc_multihead_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, kernel_init_handle, c_name)
+    self.add_layer(OpType.INC_MULTIHEAD_ATTENTION, name)
+    return Tensor(handle, owner_op_type=OpType.INC_MULTIHEAD_ATTENTION)
   def reset_metrics(self):
     """Reset performance metrics.
              
diff --git a/python/flexflow/type.py b/python/flexflow/type.py
index c647f9fdb7..51e93f15e3 100644
--- a/python/flexflow/type.py
+++ b/python/flexflow/type.py
@@ -87,6 +87,7 @@ class OpType(Enum):
   MAX = 2053
   MIN = 2054
   MULTIHEAD_ATTENTION = 2060
+  INC_MULTIHEAD_ATTENTION = 2061
   GETITEM = 2070
   GETATTR = 2080
   EXPAND = 2081
diff --git a/python/flexflow_c.cc b/python/flexflow_c.cc
index 74a5da6ce1..0535aeba85 100644
--- a/python/flexflow_c.cc
+++ b/python/flexflow_c.cc
@@ -997,6 +997,37 @@ flexflow_tensor_t flexflow_model_add_multihead_attention(
   return FFCObjectWrapper::wrap(tensor);
 }
 
+flexflow_tensor_t flexflow_model_add_inc_multihead_attention(
+    flexflow_model_t handle_,
+    const flexflow_tensor_t input_,
+    int embed_dim,
+    int num_heads,
+    int kdim,
+    int vdim,
+    float dropout,
+    bool bias,
+    bool add_bias_kv,
+    bool add_zero_attn,
+    flexflow_initializer_t kernel_initializer_,
+    char const *name) {
+  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
+  Tensor input = FFCObjectWrapper::unwrap(input_);
+  Initializer *kernel_initializer =
+      FFCObjectWrapper::unwrap(kernel_initializer_);
+  Tensor tensor = handle->inc_multihead_self_attention(input,
+                                                       embed_dim,
+                                                       num_heads,
+                                                       kdim,
+                                                       vdim,
+                                                       dropout,
+                                                       bias,
+                                                       add_bias_kv,
+                                                       add_zero_attn,
+                                                       kernel_initializer,
+                                                       name);
+  return FFCObjectWrapper::wrap(tensor);
+}
+
 void flexflow_model_set_sgd_optimizer(flexflow_model_t handle_,
                                       flexflow_sgd_optimizer_t optimizer_) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
diff --git a/python/flexflow_c.h b/python/flexflow_c.h
index fb64c78fd2..26a184b2c2 100644
--- a/python/flexflow_c.h
+++ b/python/flexflow_c.h
@@ -369,6 +369,20 @@ flexflow_tensor_t flexflow_model_add_multihead_attention(
     flexflow_initializer_t kernel_initializer,
     char const *name);
 
+flexflow_tensor_t flexflow_model_add_inc_multihead_attention(
+    flexflow_model_t handle_,
+    const flexflow_tensor_t input_,
+    int embed_dim,
+    int num_heads,
+    int kdim,
+    int vdim,
+    float dropout,
+    bool bias,
+    bool add_bias_kv,
+    bool add_zero_attn,
+    flexflow_initializer_t kernel_initializer_,
+    char const *name);
+
 void flexflow_model_set_sgd_optimizer(flexflow_model_t handle,
                                       flexflow_sgd_optimizer_t optimizer);
 
diff --git a/src/ops/cast.cc b/src/ops/cast.cc
index 25f8e168b1..3adf85a435 100644
--- a/src/ops/cast.cc
+++ b/src/ops/cast.cc
@@ -146,6 +146,44 @@ void Cast::init(FFModel const &ff) {
   set_opmeta_from_futuremap(ff, fm);
 }
 
+void Cast::init_inference(FFModel const &ff,
+                          std::vector<ParallelTensor> const &batch_inputs,
+                          std::vector<ParallelTensor> const &batch_outputs,
+                          MachineView const *mv) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
+
+  IndexLauncher launcher(CAST_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(Cast)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
+}
+
 OpMeta *Cast::init_task(Task const *task,
                         std::vector<PhysicalRegion> const &regions,
                         Context ctx,
@@ -186,6 +224,42 @@ void Cast::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
+FutureMap Cast::inference(FFModel const &ff,
+                          BatchConfig const &bc,
+                          std::vector<ParallelTensor> const &batch_inputs,
+                          std::vector<ParallelTensor> const &batch_outputs,
+                          MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+
+  IndexLauncher launcher(CAST_FWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, false),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
 template <typename IDT>
 void Cast::forward_task_with_1_type(Task const *task,
                                     std::vector<PhysicalRegion> const &regions,
diff --git a/src/ops/element_unary.cc b/src/ops/element_unary.cc
index 60112bfdc9..6326feb7db 100644
--- a/src/ops/element_unary.cc
+++ b/src/ops/element_unary.cc
@@ -285,6 +285,56 @@ void ElementUnary::init(FFModel const &ff) {
   set_opmeta_from_futuremap(ff, fm);
 }
 
+void ElementUnary::init_inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher init_launcher(ELEMENTUNARY_INIT_TASK_ID,
+                              parallel_is,
+                              TaskArgument(this, sizeof(ElementUnary)),
+                              argmap,
+                              Predicate::TRUE_PRED,
+                              false /*must*/,
+                              0 /*mapper_id*/,
+                              machine_view_hash);
+  if (!inplace) {
+    init_launcher.add_region_requirement(
+        RegionRequirement(batch_inputs[0]->part,
+                          0 /*projection id*/,
+                          READ_ONLY,
+                          EXCLUSIVE,
+                          batch_inputs[0]->region));
+    init_launcher.add_field(0, FID_DATA);
+    init_launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[0]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[0]->region));
+    init_launcher.add_field(1, FID_DATA);
+  } else {
+    init_launcher.add_region_requirement(
+        RegionRequirement(batch_inputs[0]->part,
+                          0 /*projection id*/,
+                          READ_WRITE,
+                          EXCLUSIVE,
+                          batch_inputs[0]->region));
+    init_launcher.add_field(0, FID_DATA);
+  }
+  FutureMap fm = runtime->execute_index_space(ctx, init_launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
+}
+
 OpMeta *ElementUnary::init_task(Task const *task,
                                 std::vector<PhysicalRegion> const &regions,
                                 Context ctx,
@@ -355,6 +405,56 @@ void ElementUnary::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
+FutureMap
+    ElementUnary::inference(FFModel const &ff,
+                            BatchConfig const &bc,
+                            std::vector<ParallelTensor> const &batch_inputs,
+                            std::vector<ParallelTensor> const &batch_outputs,
+                            MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+
+  IndexLauncher launcher(ELEMENTUNARY_FWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  if (inplace) {
+    assert(batch_outputs[0]->part == batch_inputs[0]->part);
+    assert(batch_outputs[0]->region == batch_inputs[0]->region);
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[0]->part,
+                          0 /*projection id*/,
+                          READ_WRITE,
+                          EXCLUSIVE,
+                          batch_outputs[0]->region));
+    launcher.add_field(0, FID_DATA);
+  } else {
+    launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      batch_inputs[0]->region));
+    launcher.add_field(0, FID_DATA);
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[0]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[0]->region));
+    launcher.add_field(1, FID_DATA);
+  }
+  return runtime->execute_index_space(ctx, launcher);
+}
+
 void ElementUnary::forward_task(Task const *task,
                                 std::vector<PhysicalRegion> const &regions,
                                 Context ctx,
diff --git a/src/ops/embedding.cc b/src/ops/embedding.cc
index 06186d969f..832e3e3deb 100644
--- a/src/ops/embedding.cc
+++ b/src/ops/embedding.cc
@@ -381,7 +381,6 @@ void Embedding::init_inference(FFModel const &ff,
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
   size_t machine_view_hash = view->hash();
   set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
-
   IndexLauncher launcher(EMBED_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(Embedding)),
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index a46ad1e6a6..8b2850a91c 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -15,8 +15,13 @@
 
 #include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/model.h"
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
 #include "flexflow/utils/cuda_helper.h"
+#else
+#include "flexflow/utils/hip_helper.h"
+#endif
 #include "flexflow/utils/hash_utils.h"
+#include "legion/legion_utilities.h"
 #ifdef INFERENCE_TESTS
 #include <torch/torch.h>
 using namespace at::indexing;
@@ -41,6 +46,7 @@ using Legion::Runtime;
 using Legion::Task;
 using Legion::TaskArgument;
 using Legion::TaskLauncher;
+using PCG::Node;
 
 bool IncMultiHeadSelfAttentionParams::is_valid(
     ParallelTensorShape const &input) const {
@@ -58,6 +64,7 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
                                              bool add_bias_kv,
                                              bool add_zero_attn,
                                              Initializer *kernel_initializer,
+                                             bool apply_rotary_embedding,
                                              char const *name) {
   // Currently assume that
   Layer *li = new Layer(this,
@@ -105,6 +112,7 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
   li->add_int_property("add_bias_kv", add_bias_kv);
   li->add_int_property("add_zero_attn", add_zero_attn);
   li->add_float_property("dropout", dropout);
+  li->add_int_property("apply_rotary_embedding", apply_rotary_embedding);
   layers.push_back(li);
   return li->outputs[0];
 }
@@ -130,6 +138,8 @@ Op *IncMultiHeadSelfAttention::create_operator_from_layer(
   bool add_bias_kv = (bool)value;
   layer->get_int_property("add_zero_attn", value);
   bool add_zero_attn = (bool)value;
+  layer->get_int_property("apply_rotary_embedding", value);
+  bool apply_rotary_embedding = (bool)value;
   return new IncMultiHeadSelfAttention(model,
                                        layer->layer_guid,
                                        inputs[0],
@@ -141,6 +151,7 @@ Op *IncMultiHeadSelfAttention::create_operator_from_layer(
                                        bias,
                                        add_bias_kv,
                                        add_zero_attn,
+                                       apply_rotary_embedding,
                                        false /*allocate_weights*/,
                                        layer->name);
 }
@@ -157,6 +168,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     bool _bias,
     bool _add_bias_kv,
     bool _add_zero_attn,
+    bool _apply_rotary_embedding,
     bool allocate_weights,
     char const *name)
     // Initializer* _bias_initializer)
@@ -170,6 +182,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
          _input),
       num_heads(_num_heads), dropout(_dropout), bias(_bias),
       add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      apply_rotary_embedding(_apply_rotary_embedding),
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
       vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
       vProjSize(_vdim), oProjSize(_embed_dim),
@@ -239,6 +252,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     bool _bias,
     bool _add_bias_kv,
     bool _add_zero_attn,
+    bool _apply_rotary_embedding,
     bool allocate_weights,
     char const *name)
     // Initializer* _bias_initializer)
@@ -253,6 +267,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
          _weight),
       num_heads(_num_heads), dropout(_dropout), bias(_bias),
       add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      apply_rotary_embedding(_apply_rotary_embedding),
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
       vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
       vProjSize(_vdim), oProjSize(_embed_dim),
@@ -325,6 +340,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
                                 other.bias,
                                 other.add_bias_kv,
                                 other.add_zero_attn,
+                                other.apply_rotary_embedding,
                                 allocate_weights,
                                 other.name) {}
 
@@ -345,6 +361,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
                                 params.bias,
                                 params.add_bias_kv,
                                 params.add_zero_attn,
+                                params.apply_rotary_embedding,
                                 allocate_weights,
                                 name) {}
 
@@ -487,7 +504,6 @@ FutureMap IncMultiHeadSelfAttention::inference(
   set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
   int idx = 0;
-
   printf("BatchConfig, num_tokens: %d, num_requests: %d\n",
          bc.num_tokens,
          bc.num_requests);
@@ -554,6 +570,7 @@ void IncMultiHeadSelfAttention::inference_task(
   assert(input_domain.get_dim() == 4);
   assert(weight_domain.get_dim() == 3);
   assert(output_domain.get_dim() == 4);
+
   /* print_tensor<float>(input.get_float_ptr(),
                       input_domain.get_volume(),
                       "[Attention:forward:query]"); */
@@ -1297,15 +1314,14 @@ bool IncMultiHeadSelfAttention::measure_operator_cost(
   return false;
 }
 
-using PCG::Node;
-
 bool operator==(IncMultiHeadSelfAttentionParams const &lhs,
                 IncMultiHeadSelfAttentionParams const &rhs) {
   return lhs.layer_guid == rhs.layer_guid && lhs.embed_dim == rhs.embed_dim &&
          lhs.num_heads == rhs.num_heads && lhs.kdim == rhs.kdim &&
          lhs.vdim == rhs.vdim && lhs.dropout == rhs.dropout &&
          lhs.bias == rhs.bias && lhs.add_bias_kv == rhs.add_bias_kv &&
-         lhs.add_zero_attn == rhs.add_zero_attn;
+         lhs.add_zero_attn == rhs.add_zero_attn &&
+         lhs.apply_rotary_embedding == rhs.apply_rotary_embedding;
 }
 
 IncMultiHeadSelfAttentionParams IncMultiHeadSelfAttention::get_params() const {
@@ -1319,6 +1335,7 @@ IncMultiHeadSelfAttentionParams IncMultiHeadSelfAttention::get_params() const {
   params.bias = this->bias;
   params.add_bias_kv = this->add_bias_kv;
   params.add_zero_attn = this->add_zero_attn;
+  params.apply_rotary_embedding = this->apply_rotary_embedding;
   return params;
 }
 
@@ -1337,6 +1354,7 @@ size_t hash<FlexFlow::IncMultiHeadSelfAttentionParams>::operator()(
   hash_combine(key, params.bias);
   hash_combine(key, params.add_bias_kv);
   hash_combine(key, params.add_zero_attn);
+  hash_combine(key, params.apply_rotary_embedding);
   return key;
 }
 }; // namespace std
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 7c422a8a0e..8b53f047c0 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -12,7 +12,9 @@
  * See the License for the specific language governing permissions and
  * limitations under the License.
  */
-
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+#include "cuComplex.h"
+#endif
 #include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/utils/cuda_helper.h"
 
@@ -38,6 +40,65 @@ __global__ void build_w_out_tensor(float const *weight_ptr,
   }
 }
 
+__global__ void apply_rotary_embedding(float *input_ptr,
+                                       cuFloatComplex *complex_input,
+                                       BatchConfig::token_idxs const *id_map,
+                                       int qProjSize,
+                                       int kProjSize,
+                                       int num_heads,
+                                       int num_tokens,
+                                       int q_block_size,
+                                       int k_block_size,
+                                       int v_block_size,
+                                       bool q_tensor) {
+  int proj_size = q_tensor ? qProjSize : kProjSize;
+  CUDA_KERNEL_LOOP(i, num_tokens * proj_size * num_heads / 2) {
+    // create complex number
+    int head_idx = i / (num_tokens * proj_size / 2);
+    int idx = i % (num_tokens * proj_size / 2);
+    int real_part_index =
+        idx * 2 + head_idx * (q_block_size + k_block_size + v_block_size) +
+        (q_tensor ? 0 : q_block_size);
+    int complex_part_index = real_part_index + 1;
+
+    complex_input[i] = {input_ptr[real_part_index],
+                        input_ptr[complex_part_index]};
+
+    // get the freq_cis: shape 1 * (qProjSize/2) = 1 * 64
+    // apply a Cartesian coordinate transformation
+    // multiple with input & /copy back to q/k
+
+    // get position of token
+    //  int head_idx = i / (num_tokens * proj_size);
+    int token_idx =
+        (i - head_idx * (num_tokens * proj_size / 2)) / (proj_size / 2);
+    size_t pos = id_map[token_idx].token_position;
+
+    // float before_real = complex_input[i].x, before_complex =
+    // complex_input[i].y;
+
+    int pos_i = i % (proj_size / 2);
+    float freq = pos * (1.0 / pow(10000.0, (float)2 * pos_i / proj_size));
+    cuFloatComplex complex_pos = {cos(freq), sin(freq)};
+
+    complex_input[i] = cuCmulf(complex_input[i], complex_pos);
+    input_ptr[real_part_index] = complex_input[i].x;
+    input_ptr[real_part_index + 1] = complex_input[i].y;
+
+    // if (i % 64 == 1 && head_idx == 0) {
+    //   printf("head id: %d, tokenid: %d, pospospos:->  %d, before real part
+    //   %f, "
+    //          "before complex part: %f, real part: %f,"
+    //          "complext part: %f,  freq_cis real: %f, freq_cis commplexx
+    //          %f\n", head_idx, token_idx, pos, before_real, before_complex,
+    //          complex_input[i].x,
+    //          complex_input[i].y,
+    //          complex_pos.x,
+    //          complex_pos.y);
+    // }
+  }
+}
+
 void inference_kernel1(IncMultiHeadSelfAttentionMeta const *m,
                        BatchConfig const *bc,
                        float const *input_ptr,
@@ -47,7 +108,6 @@ void inference_kernel1(IncMultiHeadSelfAttentionMeta const *m,
 
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
-
   float alpha = 1.0f, beta = 0.0f;
   assert(m->qSize == m->vSize && m->qSize == m->kSize);
   cudaDataType_t data_type = ff_to_cuda_datatype(DT_FLOAT);
@@ -98,7 +158,7 @@ void inference_kernel1(IncMultiHeadSelfAttentionMeta const *m,
                                        m->num_heads,
                                        compute_type,
                                        CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-  // K
+
   checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                        CUBLAS_OP_T,
                                        CUBLAS_OP_N,
@@ -146,6 +206,50 @@ void inference_kernel1(IncMultiHeadSelfAttentionMeta const *m,
                                        m->num_heads,
                                        compute_type,
                                        CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
+  // apply rotary emmmbedding for k and v
+  // step1 change the k, v to complex tensor
+  int num_tokens = bc->num_active_tokens();
+  int parallelism = m->kProjSize * num_tokens * m->num_heads;
+  int q_block_size = m->qProjSize * num_tokens;
+  int k_block_size = m->kProjSize * num_tokens;
+  int v_block_size = m->vProjSize * num_tokens;
+  cuFloatComplex *complex_input;
+  if (*m->apply_rotary_embedding) {
+    checkCUDA(cudaMalloc(&complex_input,
+                         num_tokens * m->qProjSize * m->num_heads *
+                             sizeof(cuFloatComplex *) / 2));
+    /*q*/
+    apply_rotary_embedding<<<GET_BLOCKS(parallelism),
+                             min(CUDA_NUM_THREADS, parallelism),
+                             0,
+                             stream>>>(output_ptr,
+                                       complex_input,
+                                       m->dev_token2ids,
+                                       m->qProjSize,
+                                       m->kProjSize,
+                                       m->num_heads,
+                                       num_tokens,
+                                       q_block_size,
+                                       k_block_size,
+                                       v_block_size,
+                                       true);
+    /*k*/
+    apply_rotary_embedding<<<GET_BLOCKS(parallelism),
+                             min(CUDA_NUM_THREADS, parallelism),
+                             0,
+                             stream>>>(output_ptr,
+                                       complex_input,
+                                       m->dev_token2ids,
+                                       m->qProjSize,
+                                       m->kProjSize,
+                                       m->num_heads,
+                                       num_tokens,
+                                       q_block_size,
+                                       k_block_size,
+                                       v_block_size,
+                                       false);
+  }
 }
 
 __global__ void store_kv_cache(float const *devQKVProjArray,
@@ -171,7 +275,6 @@ __global__ void store_kv_cache(float const *devQKVProjArray,
     float val =
         devQKVProjArray[head_idx * qkv_block_size + current_head_block_size +
                         token_idx * proj_size + data_idx];
-
     int const req_id = id_map[token_idx].request_index;
     int const tok_id = id_map[token_idx].token_position;
 
@@ -200,6 +303,7 @@ void inference_kernel2(IncMultiHeadSelfAttentionMeta const *m,
                                m->num_heads,
                                MAX_SEQ_LEN,
                                /* k_cache = */ true);
+
     parallelism = m->vProjSize * num_tokens * m->num_heads;
     store_kv_cache<<<GET_BLOCKS(parallelism),
                      min(CUDA_NUM_THREADS, parallelism),
@@ -264,7 +368,6 @@ void inference_kernel3(IncMultiHeadSelfAttentionMeta const *m,
     }
     int num_new_tokens = bc->num_processing_tokens[i];
     int total_tokens = bc->token_last_available_idx[i] + 1;
-
     // Compute (QK^T/sqrt(d_k))
     int m_ = num_new_tokens;
     int n = total_tokens;
@@ -273,6 +376,7 @@ void inference_kernel3(IncMultiHeadSelfAttentionMeta const *m,
     int strideA = qkv_block_size;
     int strideB = kt_block_size;
     int strideC = num_new_tokens * total_tokens;
+
     float alpha = 1.0f / (float)sqrt(m->kProjSize), beta = 0.0f;
     // To get A, skip over Q entries from previous requests (same head)
     void const *A = (void const *)(m->devQKVProjArray +
@@ -284,39 +388,6 @@ void inference_kernel3(IncMultiHeadSelfAttentionMeta const *m,
     void *C =
         (void *)(m->qk_prods + m->num_heads * tokens_prev_requests_squares);
 
-    /*printf("\n------------ QK multiplication (CUDA) -------------\n");
-    printf("req: %i, num_new_tokens: %i, total_tokens: %i,
-    tokens_previous_requests: %i, tokens_prev_requests_squares: %i\n", i,
-    num_new_tokens, total_tokens, tokens_previous_requests,
-    tokens_prev_requests_squares); printf("About to multiply the following
-    matrices (printing only first head):\n"); printf("A:\n"); float
-    *QKVProjArray_cpu = download_tensor<float>(m->devQKVProjArray,
-    BatchConfig::MAX_NUM_TOKENS * (m->qProjSize + m->kProjSize + m->vProjSize) *
-    m->num_heads); assert(QKVProjArray_cpu != nullptr); float *keyCache_cpu =
-      download_tensor<float>(m->keyCache,
-                             m->num_heads * m->kProjSize *
-                                 BatchConfig::MAX_NUM_REQUESTS * MAX_SEQ_LEN);
-    assert(keyCache_cpu != nullptr);
-    for (int aaa=0; aaa < m->qProjSize; aaa++) {
-      for (int bbb=0; bbb<num_new_tokens; bbb++) {
-        printf("%f ", QKVProjArray_cpu[(tokens_previous_requests + bbb) *
-    m->qProjSize + aaa]);
-      }
-      printf("\n");
-    }
-    printf("B:\n");
-    for (int aaa=0; aaa < m->kProjSize; aaa++) {
-      for (int bbb=0; bbb < total_tokens; bbb++) {
-        printf("%f ", keyCache_cpu[i * kt_req_block_size + bbb*m->kProjSize +
-    aaa]);
-      }
-      printf("\n");
-    }
-    checkCUDA(cudaFreeHost(QKVProjArray_cpu));
-    checkCUDA(cudaFreeHost(keyCache_cpu));
-    printf("------------------------------------------------------------\n");
-    printf("CUDA alpha: %f", alpha);*/
-
     checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                          CUBLAS_OP_T,
                                          CUBLAS_OP_N,
@@ -340,7 +411,6 @@ void inference_kernel3(IncMultiHeadSelfAttentionMeta const *m,
                                          m->num_heads,
                                          compute_type,
                                          CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-
     // Fill all elements above diagonal in qk prods with -inf to force
     // causal attention.
     assert(num_new_tokens <= total_tokens);
@@ -396,7 +466,6 @@ void inference_kernel3(IncMultiHeadSelfAttentionMeta const *m,
                                    &beta,
                                    qk_tensor,
                                    (void *)((float *)C_softmax)));
-
     // Matmul softmax(QK^T/sqrt(d_k)) by V
     alpha = 1.0f, beta = 0.0f;
     m_ = num_new_tokens;
@@ -440,7 +509,6 @@ void inference_kernel3(IncMultiHeadSelfAttentionMeta const *m,
                                          m->num_heads,
                                          compute_type,
                                          CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-
     // Project to output, save result directly on output tensor
     alpha = 1.0f, beta = 0.0f;
     m_ = m->oProjSize;
@@ -470,7 +538,6 @@ void inference_kernel3(IncMultiHeadSelfAttentionMeta const *m,
                            ldc,
                            compute_type,
                            CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-
     tokens_previous_requests += num_new_tokens;
     tokens_prev_requests_squares += num_new_tokens * total_tokens;
   }
@@ -494,6 +561,7 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     cudaEventCreate(&t_end);
     cudaEventRecord(t_start, stream);
   }
+
   // reload the weight_o
 
   if (!(*m->has_load_weights)) {
@@ -511,7 +579,6 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
                                     m->vSize * m->vProjSize));
     *m->has_load_weights = true;
   }
-
   // phase 1: Implement kernel to compute KQV for input tokens
   inference_kernel1(m, bc, input_ptr, weight_ptr, m->devQKVProjArray, stream);
 
@@ -565,12 +632,15 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   assert(qProjSize == kProjSize); // required for attention QK^T matmul
   vProjSize = attn->vProjSize;
   oProjSize = attn->oProjSize;
+
   num_heads = _num_heads;
   weights_params = (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize +
                     oProjSize * (vProjSize > 0 ? vProjSize : vSize));
   weightSize = weights_params * num_heads * sizeof(float);
   has_load_weights = (bool *)calloc(1, sizeof(bool));
   *has_load_weights = false;
+  apply_rotary_embedding = (bool *)calloc(1, sizeof(bool));
+  *apply_rotary_embedding = attn->apply_rotary_embedding;
   // Currently do not support adding bias to key/value projection
   assert(!attn->add_bias_kv);
 
@@ -638,6 +708,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
         num_heads,
         (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize));
   }
+
   cudaStreamSynchronize(stream);
 }
 
diff --git a/src/ops/kernels/rms_norm_kernels.cpp b/src/ops/kernels/rms_norm_kernels.cpp
new file mode 100644
index 0000000000..5de12b3f1f
--- /dev/null
+++ b/src/ops/kernels/rms_norm_kernels.cpp
@@ -0,0 +1,59 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/kernels/rms_norm_kernels.h"
+#include "flexflow/ops/rms_norm.h"
+#include "flexflow/utils/hip_helper.h"
+#include <hip/hip_runtime.h>
+
+namespace FlexFlow {
+// declare Legion names
+using Legion::coord_t;
+
+RMSNormMeta::RMSNormMeta(FFHandler handler, RMSNorm const *rms)
+    : OpMeta(handler, rms) {}
+
+namespace Kernels {
+namespace RMSNorm {
+
+void forward_kernel_wrapper(RMSNormMeta const *m,
+                            GenericTensorAccessorR const &input,
+                            GenericTensorAccessorR const &weight,
+                            GenericTensorAccessorW const &output) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    hipEventCreate(&t_start);
+    hipEventCreate(&t_end);
+    hipEventRecord(t_start, stream);
+  }
+
+  handle_unimplemented_hip_kernel(OP_RMS_NORM);
+
+  if (m->profiling) {
+    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    hipEventDestroy(t_start);
+    hipEventDestroy(t_end);
+  }
+}
+
+} // namespace RMSNorm
+} // namespace Kernels
+} // namespace FlexFlow
diff --git a/src/ops/kernels/rms_norm_kernels.cu b/src/ops/kernels/rms_norm_kernels.cu
index 5fa13d064a..f7945b316d 100644
--- a/src/ops/kernels/rms_norm_kernels.cu
+++ b/src/ops/kernels/rms_norm_kernels.cu
@@ -74,7 +74,7 @@ __inline__ __device__ T BlockReduceSum(T val, T *shared) {
     shared[wid] = val;
   }
   __syncthreads();
-  val = (threadIdx.x < blockDim.x / C10_WARP_SIZE) ? shared[lid] : 0;
+  val = (threadIdx.x < (blockDim.x / C10_WARP_SIZE)) ? shared[lid] : T(0);
   if (wid == 0) {
     val = WarpReduceSum(val);
   }
@@ -92,8 +92,18 @@ __global__ void
     sum += static_cast<T>(X[index]) * static_cast<T>(X[index]);
   }
   sum = BlockReduceSum<T>(sum, v_shared); // use BlockReduceSum() to sum X_ij^2
+
   if (threadIdx.x == 0) {
-    rms[i] = sqrt((static_cast<T>(N) / sum) + static_cast<T>(eps));
+    rms[i] = rsqrt((sum / static_cast<T>(N)) + static_cast<T>(eps));
+    // printf("index: %d, rms norm mean value: %.15f, rms norm sum value: "
+    //        "%.20f, eps: %f, value: %.20f, num:%d, num2: %d\n",
+    //        i,
+    //        sum / static_cast<T>(N),
+    //        sum,
+    //        static_cast<T>(eps),
+    //        rms[i],
+    //        blockDim.x,
+    //        warpSize);
   }
 }
 
@@ -107,13 +117,23 @@ __global__ void NormKernel(int64_t N, T const *X, T const *rstd, T *Y) {
   }
 }
 
+__global__ void elewise_apply_weights(int64_t batch_size,
+                                      int64_t in_dim,
+                                      float const *norm,
+                                      float const *weights,
+                                      float *output) {
+  CUDA_KERNEL_LOOP(i, batch_size * in_dim) {
+    output[i] = norm[i] * weights[i % in_dim];
+  }
+}
+
 void forward_kernel_wrapper(RMSNormMeta const *m,
                             GenericTensorAccessorR const &input,
                             GenericTensorAccessorR const &weight,
                             GenericTensorAccessorW const &output) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
-
+  int parallelism = m->batch_size * m->in_dim;
   cudaEvent_t t_start, t_end;
   if (m->profiling) {
     cudaEventCreate(&t_start);
@@ -124,31 +144,18 @@ void forward_kernel_wrapper(RMSNormMeta const *m,
   RowwiseRootMeanSquareKernel<float>
       <<<m->batch_size, kCUDABlockReduceNumThreads, 0, stream>>>(
           m->in_dim, m->eps, input.get_float_ptr(), m->rms_ptr);
+
   NormKernel<float><<<m->batch_size, kCUDANumThreads, 0, stream>>>(
       m->in_dim, input.get_float_ptr(), m->rms_ptr, m->norm_ptr);
 
-  checkCUDA(cublasGemmEx(
-      m->handle.blas,
-      CUBLAS_OP_T, // transpose weight (column major)
-      CUBLAS_OP_N,
-      m->in_dim,
-      m->batch_size,
-      m->in_dim,
-      &(m->alpha),
-      weight.get_float_ptr(), // weight, shape (in_dim, in_dim)
-      CUDA_R_32F,
-      m->in_dim,
-      m->norm_ptr, // norm, shape (in_dim, batch_size)
-      CUDA_R_32F,
-      m->in_dim,
-      &(m->beta),
-      output
-          .get_float_ptr(), // output, shape (in_dim, batch_size), same as norm
-      CUDA_R_32F,
-      m->in_dim,
-      CUDA_R_32F,
-      CUBLAS_GEMM_DFALT_TENSOR_OP));
-
+  elewise_apply_weights<<<GET_BLOCKS(parallelism),
+                          min(CUDA_NUM_THREADS, parallelism),
+                          0,
+                          stream>>>(m->batch_size,
+                                    m->in_dim,
+                                    m->norm_ptr,
+                                    weight.get_float_ptr(),
+                                    output.get_float_ptr());
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
     checkCUDA(cudaEventSynchronize(t_end));
@@ -157,11 +164,9 @@ void forward_kernel_wrapper(RMSNormMeta const *m,
     cudaEventDestroy(t_start);
     cudaEventDestroy(t_end);
     printf("[RMSNorm] forward time (CF) = %.2fms\n", elapsed);
-    print_tensor<float>(input.get_float_ptr(), 32, "[RMSNorm:forward:input]");
-    print_tensor<float>(output.get_float_ptr(), 32, "[RMSNorm:forward:output]");
   }
 }
 
 } // namespace RMSNorm
 } // namespace Kernels
-} // namespace FlexFlow
\ No newline at end of file
+} // namespace FlexFlow
diff --git a/src/ops/rms_norm.cc b/src/ops/rms_norm.cc
index 3d8daa4389..5e02160b7c 100644
--- a/src/ops/rms_norm.cc
+++ b/src/ops/rms_norm.cc
@@ -50,6 +50,7 @@ RMSNormParams RMSNorm::get_params() const {
   RMSNormParams params;
   params.layer_guid = this->layer_guid;
   params.eps = this->eps;
+  params.dim = this->dim;
   return params;
 }
 
@@ -69,7 +70,7 @@ Tensor FFModel::rms_norm(const Tensor input,
       input->num_dims, input->dims, DT_FLOAT, rm, 0, true /*create_grad*/);
 
   // weights
-  int weight_dims[1] = {input->dims[input->num_dims - 1]};
+  int weight_dims[1] = {dim};
   rm->weights[0] = create_weight_legion_ordering(1,
                                                  weight_dims,
                                                  DT_FLOAT,
@@ -77,7 +78,9 @@ Tensor FFModel::rms_norm(const Tensor input,
                                                  true /*create_grad*/,
                                                  nullptr,
                                                  CHOSEN_SYNC_TYPE);
+
   rm->add_float_property("eps", eps);
+  rm->add_int_property("dim", dim);
   layers.push_back(rm);
   return rm->outputs[0];
 }
@@ -88,19 +91,44 @@ Op *RMSNorm::create_operator_from_layer(
     std::vector<ParallelTensor> const &inputs) {
   float eps;
   layer->get_float_property("eps", eps);
-  return new RMSNorm(model, layer->layer_guid, inputs[0], eps, layer->name);
+  long long value;
+  layer->get_int_property("dim", value);
+  int dim = value;
+
+  return new RMSNorm(
+      model, layer->layer_guid, inputs[0], eps, dim, false, layer->name);
 }
 
 RMSNorm::RMSNorm(FFModel &model,
                  RMSNormParams const &params,
                  ParallelTensor const input,
+                 bool allocate_weights = false,
                  char const *name)
-    : RMSNorm(model, params.layer_guid, input, params.eps, name) {}
+    : RMSNorm(model,
+              params.layer_guid,
+              input,
+              params.eps,
+              params.dim,
+              allocate_weights,
+              name) {}
 
+RMSNorm::RMSNorm(FFModel &model,
+                 RMSNorm const &other,
+                 const ParallelTensor input,
+                 bool allocate_weights)
+    : RMSNorm(model,
+              other.layer_guid,
+              input,
+              other.eps,
+              other.dim,
+              allocate_weights,
+              other.name) {}
 RMSNorm::RMSNorm(FFModel &model,
                  LayerID const &_layer_guid,
                  const ParallelTensor _input,
                  float _eps,
+                 int dim,
+                 bool allocate_weights,
                  char const *name)
     : Op(model,
          OP_RMS_NORM,
@@ -110,10 +138,11 @@ RMSNorm::RMSNorm(FFModel &model,
          1 /*num of weights tensor */,
          1 /*onum of utputs tensor */,
          _input) {
-
+  eps = _eps;
   inputs[0] = _input;
-
+  layer_guid = _layer_guid;
   int num_dims = _input->num_dims;
+  this->dim = dim;
   data_dim = _input->dims[0].size;
   effective_batch_size = 1;
   for (int i = 1; i <= num_dims - 2; i++) {
@@ -122,32 +151,32 @@ RMSNorm::RMSNorm(FFModel &model,
 
   // output has the same parallel dims as input
   ParallelDim output_dims[MAX_TENSOR_DIM];
-  ParallelDim weight_dims[MAX_TENSOR_DIM];
   for (int i = 0; i < _input->num_dims; i++) {
     output_dims[i] = _input->dims[i];
-    weight_dims[i] = _input->dims[i];
-    weight_dims[i].size = 1;
   }
-
-  // weights should have the shape of (data_dim, data_dim)
-  weight_dims[0].size = _input->dims[0].size;
-  weight_dims[1].size = _input->dims[0].size;
-
   outputs[0] = model.create_parallel_tensor_legion_ordering(
       _input->num_dims, output_dims, _input->data_type, this);
 
-  // weights
-  Initializer *kernel_initializer = new GlorotUniform(std::rand() /*seed*/);
-
-  // TODO: weight dims check
-  weights[0] =
-      model.create_parallel_weight_legion_ordering(_input->num_dims,
-                                                   weight_dims,
-                                                   _input->data_type,
-                                                   this /*owner_op*/,
-                                                   true /*create_grad*/,
-                                                   kernel_initializer,
-                                                   CHOSEN_SYNC_TYPE);
+  if (allocate_weights) {
+    // weights should have the shape of (data_dim, data_dim)
+    ParallelDim new_weight_dims[MAX_TENSOR_DIM];
+
+    new_weight_dims[0] = _input->dims[_input->num_dims - 1];
+    new_weight_dims[1].size = dim;
+    new_weight_dims[1].degree = 1;
+    new_weight_dims[1].parallel_idx = -1;
+
+    // weights
+    Initializer *kernel_initializer = new GlorotUniform(std::rand() /*seed*/);
+    weights[0] =
+        model.create_parallel_weight_legion_ordering(2,
+                                                     new_weight_dims,
+                                                     _input->data_type,
+                                                     NULL /*owner_op*/,
+                                                     false /*create_grad*/,
+                                                     kernel_initializer,
+                                                     CHOSEN_SYNC_TYPE);
+  }
 }
 
 void RMSNorm::init(FFModel const &ff) {
@@ -177,6 +206,13 @@ void RMSNorm::init(FFModel const &ff) {
                                                     EXCLUSIVE,
                                                     inputs[0]->region));
   launcher.add_field(1, FID_DATA);
+
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(2, FID_DATA);
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
   set_opmeta_from_futuremap(ff, fm);
@@ -215,6 +251,13 @@ void RMSNorm::init_inference(FFModel const &ff,
                                                     EXCLUSIVE,
                                                     batch_inputs[0]->region));
   launcher.add_field(1, FID_DATA);
+
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(2, FID_DATA);
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
   set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
@@ -319,17 +362,18 @@ void RMSNorm::forward_task(Task const *task,
   assert(regions.size() == 3);
   RMSNormMeta const *m = *((RMSNormMeta **)task->local_args);
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
-      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
-      m->input_type[1], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+      DT_FLOAT, regions[0], task->regions[0], FID_DATA, ctx, runtime);
   GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
-      m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+      DT_FLOAT, regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
+      DT_FLOAT, regions[2], task->regions[2], FID_DATA, ctx, runtime);
   forward_kernel_wrapper(m, input, weight, output);
 }
 
 void RMSNorm::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->eps);
+  sez.serialize(this->dim);
 }
 
 using PCG::Node;
@@ -341,13 +385,16 @@ Node RMSNorm::deserialize(FFModel &ff,
   assert(num_inputs == 1);
   float eps;
   size_t id;
+  int dim;
   dez.deserialize(id);
+
   LayerID layer_guid(id);
   dez.deserialize(eps);
-
+  dez.deserialize(dim);
   RMSNormParams params;
   params.layer_guid = layer_guid;
   params.eps = eps;
+  params.dim = dim;
   return ff.get_or_create_node<RMSNorm>(inputs[0], params);
 }
 
@@ -372,6 +419,8 @@ size_t hash<FlexFlow::RMSNormParams>::operator()(
     FlexFlow::RMSNormParams const &params) const {
   size_t key = 0;
   hash_combine(key, params.eps);
+  hash_combine(key, params.layer_guid.id);
+  hash_combine(key, params.dim);
   return key;
 }
 }; // namespace std
\ No newline at end of file
diff --git a/src/ops/split.cc b/src/ops/split.cc
index 4f60cb96f0..a9a5000f3d 100644
--- a/src/ops/split.cc
+++ b/src/ops/split.cc
@@ -170,6 +170,47 @@ void Split::init(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
+void Split::init_inference(FFModel const &ff,
+                           std::vector<ParallelTensor> const &batch_inputs,
+                           std::vector<ParallelTensor> const &batch_outputs,
+                           MachineView const *mv) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
+
+  IndexLauncher launcher(SPLIT_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(Split)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  for (int i = 0; i < numOutputs; i++) {
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[i]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[i]->region));
+    launcher.add_field(i + 1, FID_DATA);
+  }
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
+}
+
 OpMeta *Split::init_task(Task const *task,
                          std::vector<PhysicalRegion> const &regions,
                          Context ctx,
@@ -205,6 +246,45 @@ void Split::forward(FFModel const &ff) {
   }
   runtime->execute_index_space(ctx, launcher);
 }
+FutureMap Split::inference(FFModel const &ff,
+                           BatchConfig const &bc,
+                           std::vector<ParallelTensor> const &batch_inputs,
+                           std::vector<ParallelTensor> const &batch_outputs,
+                           MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+
+  IndexLauncher launcher(SPLIT_FWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(Split)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  for (int i = 0; i < numOutputs; i++) {
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[i]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[i]->region));
+    launcher.add_field(i + 1, FID_DATA);
+  }
+  return runtime->execute_index_space(ctx, launcher);
+}
 
 void calc_block_size(coord_t &num_blks,
                      coord_t &blk_size,
diff --git a/src/runtime/cuda_helper.cu b/src/runtime/cuda_helper.cu
index edd5b18e0f..7dc0adeb38 100644
--- a/src/runtime/cuda_helper.cu
+++ b/src/runtime/cuda_helper.cu
@@ -62,6 +62,14 @@ __global__ void copy_kernel(DT *dst, const DT *src, coord_t size) {
   }
 }
 
+template <typename DT>
+__global__ void
+    copy_kernel_discrete(DT *dst, const DT *src, coord_t size, size_t *index) {
+  CUDA_KERNEL_LOOP(i, size) {
+    dst[i] = src[index[i]];
+  }
+}
+
 template <typename DT>
 __global__ void reluBackward(DT *grad_ptr, const DT *output, size_t n) {
   CUDA_KERNEL_LOOP(i, n) {
@@ -215,8 +223,8 @@ __host__ void
   int idx = 0;
   printf("%s", prefix);
   for (idx = 0; idx < num_elements; idx++) {
-    printf(" %.4lf", (float)host_ptr[idx]);
-    if (idx >= 16) {
+    printf(" %.20lf", (float)host_ptr[idx]);
+    if (idx >= 50) {
       break;
     }
   }
@@ -224,6 +232,29 @@ __host__ void
   checkCUDA(cudaFreeHost(host_ptr));
 }
 
+template <typename T>
+__host__ void
+    save_tensor(T const *ptr, size_t num_elements, char const *file_name) {
+  // device synchronize to make sure the data are ready
+  // checkCUDA(cudaDeviceSynchronize());
+  T *host_ptr;
+  checkCUDA(cudaHostAlloc(&host_ptr,
+                          sizeof(T) * num_elements,
+                          cudaHostAllocPortable | cudaHostAllocMapped));
+  checkCUDA(cudaMemcpy(
+      host_ptr, ptr, sizeof(T) * num_elements, cudaMemcpyDeviceToHost));
+  // checkCUDA(cudaDeviceSynchronize());
+
+  FILE *tensor_file;
+  tensor_file = fopen(file_name, "w");
+  for (unsigned i = 0; i < num_elements; i++) {
+    fprintf(tensor_file, "%.20f, ", (float)host_ptr[i]);
+  }
+
+  fclose(tensor_file);
+  checkCUDA(cudaFreeHost(host_ptr));
+}
+
 template <typename T>
 __host__ T *download_tensor(T const *ptr, size_t num_elements) {
   // device synchronize to make sure the data are ready
@@ -398,6 +429,15 @@ template __global__ void
 template __global__ void
     copy_kernel<int64_t>(int64_t *dst, int64_t const *src, coord_t size);
 
+template __global__ void copy_kernel_discrete<float>(float *dst,
+                                                     float const *src,
+                                                     coord_t size,
+                                                     size_t *index);
+template __global__ void copy_kernel_discrete<int64_t>(int64_t *dst,
+                                                       int64_t const *src,
+                                                       coord_t size,
+                                                       size_t *index);
+
 template __global__ void apply_add_with_scale<float>(float *data_ptr,
                                                      float const *grad_ptr,
                                                      size_t size,
@@ -424,6 +464,12 @@ template __host__ void
 template __host__ void
     print_tensor<int64_t>(int64_t const *ptr, size_t rect, char const *prefix);
 
+template __host__ void
+    save_tensor<float>(float const *ptr, size_t rect, char const *file_name);
+template __host__ void save_tensor<int64_t>(int64_t const *ptr,
+                                            size_t rect,
+                                            char const *file_name);
+
 template __host__ float *download_tensor<float>(float const *ptr,
                                                 size_t num_elements);
 template __host__ double *download_tensor<double>(double const *ptr,
diff --git a/src/runtime/ffconst_utils.cc b/src/runtime/ffconst_utils.cc
index 7c9a68f3b5..b02150d153 100644
--- a/src/runtime/ffconst_utils.cc
+++ b/src/runtime/ffconst_utils.cc
@@ -163,6 +163,8 @@ std::string get_operator_type_name(OperatorType type) {
       return "Mean";
     case OP_LAYERNORM:
       return "LayerNorm";
+    case OP_RMS_NORM:
+      return "RMSNorm";
     case OP_IDENTITY:
       return "Identity";
     // Parallel Ops
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index 432467bbcf..866dcd3505 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -2271,6 +2271,7 @@ GraphOptimalViewSerialized
         sez.serialize(attn->bias);
         sez.serialize(attn->add_bias_kv);
         sez.serialize(attn->add_zero_attn);
+        sez.serialize(attn->apply_rotary_embedding);
         break;
       }
       case OP_SOFTMAX: {
@@ -2636,7 +2637,7 @@ void FFModel::deserialize_graph_optimal_view(
         assert(num_inputs == 1);
         int embed_dim, num_heads, k_dim, v_dim;
         float dropout;
-        bool bias, add_bias_kv, add_zero_attn;
+        bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding;
         size_t id;
         dez.deserialize(id);
         LayerID layer_guid(id);
@@ -2648,6 +2649,7 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(bias);
         dez.deserialize(add_bias_kv);
         dez.deserialize(add_zero_attn);
+        dez.deserialize(apply_rotary_embedding);
 
         IncMultiHeadSelfAttentionParams params;
         params.embed_dim = embed_dim;
@@ -2659,6 +2661,7 @@ void FFModel::deserialize_graph_optimal_view(
         params.add_bias_kv = add_bias_kv;
         params.add_zero_attn = add_zero_attn;
         params.layer_guid = layer_guid;
+        params.apply_rotary_embedding = apply_rotary_embedding;
         node = get_or_create_node<IncMultiHeadSelfAttention>(inputs[0], params);
         break;
       }
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 12a14d808d..915688f3c8 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -49,6 +49,7 @@
 #include "flexflow/ops/reduce.h"
 #include "flexflow/ops/reshape.h"
 #include "flexflow/ops/reverse.h"
+#include "flexflow/ops/rms_norm.h"
 #include "flexflow/ops/softmax.h"
 #include "flexflow/ops/split.h"
 #include "flexflow/ops/topk.h"
@@ -1581,6 +1582,7 @@ ParallelParameter FFModel::create_parallel_weight(const ParallelDim dims[],
   for (int i = 0; i < NDIM; i++) {
     p->dims[i] = dims[NDIM - 1 - i];
   }
+
   assert(p->get_volume() > 0);
   assert(p->check_valid());
   return p;
@@ -2824,6 +2826,11 @@ Op *FFModel::create_operator_from_layer(
       operators.push_back(op);
       return op;
     }
+    case OP_RMS_NORM: {
+      Op *op = RMSNorm::create_operator_from_layer(*this, layer, inputs);
+      operators.push_back(op);
+      return op;
+    }
     case OP_LINEAR: {
       Op *op = Linear::create_operator_from_layer(*this, layer, inputs);
       operators.push_back(op);
@@ -3032,6 +3039,7 @@ void FFModel::compile(LossType loss_type,
 
   for (size_t l = 0; l < operators.size(); l++) {
     Op *op = operators[l];
+
     for (int i = 0; i < op->numInputs; i++) {
       assert(op->inputs[i]->owner_op != NULL);
     }
@@ -3040,6 +3048,7 @@ void FFModel::compile(LossType loss_type,
       assert(op->weights[i]->region != LogicalRegion::NO_REGION);
       parameters.push_back(op->weights[i]);
     }
+
     op->map_output_tensors(*this);
     // for (int i = 0; i < op->numOutputs; i++) {
     //   // Output tensor
@@ -4235,6 +4244,21 @@ void register_flexflow_internal_tasks() {
     Runtime::preregister_task_variant<LayerNorm::forward_task>(
         registrar, "layernorm_fwd_task");
   }
+  // rms norm task
+  {
+    TaskVariantRegistrar registrar(RMSNROM_INIT_TASK_ID, "rmsnorm_init_task");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<OpMeta *, RMSNorm::init_task>(
+        registrar, "rmsnorm_init_task");
+  }
+  {
+    TaskVariantRegistrar registrar(RMSNROM_FWD_TASK_ID, "rmsnorm_fwd_task");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<RMSNorm::forward_task>(
+        registrar, "rmsnorm_fwd_task");
+  }
   {
     TaskVariantRegistrar registrar(LAYERNORM_BWD_TASK_ID, "layernorm_bwd_task");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
diff --git a/src/runtime/substitution.cc b/src/runtime/substitution.cc
index 0cdb8be30b..df2f8b05b3 100644
--- a/src/runtime/substitution.cc
+++ b/src/runtime/substitution.cc
@@ -32,6 +32,7 @@
 #include "flexflow/ops/linear.h"
 #include "flexflow/ops/noop.h"
 #include "flexflow/ops/pool_2d.h"
+#include "flexflow/ops/rms_norm.h"
 #include "flexflow/ops/softmax.h"
 #include "flexflow/ops/split.h"
 #include "flexflow/parallel_ops/combine.h"
@@ -3715,6 +3716,13 @@ bool FFModel::convert_graph_to_operators(
         break;
         break;
       }
+      case OP_RMS_NORM: {
+        assert(inList.size() == 1);
+        RMSNorm *rms = (RMSNorm *)node.ptr;
+        new_op = new RMSNorm(*this, *rms, inputs[0], true);
+        break;
+        break;
+      }
       case OP_SOFTMAX: {
         assert(inList.size() == 1);
         Softmax *softmax = (Softmax *)node.ptr;
diff --git a/triton/src/model.cc b/triton/src/model.cc
index a61b207bdd..6d5da30bea 100644
--- a/triton/src/model.cc
+++ b/triton/src/model.cc
@@ -22,20 +22,22 @@
 
 using namespace Legion;
 
-namespace triton { namespace backend { namespace legion {
-
-TRITONSERVER_Error*
-LegionModelState::Create(
-    TRITONBACKEND_Model* triton_model, const std::string& name,
-    uint64_t version, LegionTritonRuntime* runtime, LegionModelState** state)
-{
+namespace triton {
+namespace backend {
+namespace legion {
+
+TRITONSERVER_Error *LegionModelState::Create(TRITONBACKEND_Model *triton_model,
+                                             std::string const &name,
+                                             uint64_t version,
+                                             LegionTritonRuntime *runtime,
+                                             LegionModelState **state) {
   std::unique_ptr<LegionModelState> lstate;
   try {
     lstate.reset(new LegionModelState(triton_model, runtime, name, version));
-  }
-  catch (const BackendModelException& ex) {
+  } catch (BackendModelException const &ex) {
     RETURN_ERROR_IF_TRUE(
-        ex.err_ == nullptr, TRITONSERVER_ERROR_INTERNAL,
+        ex.err_ == nullptr,
+        TRITONSERVER_ERROR_INTERNAL,
         std::string("unexpected nullptr in BackendModelException"));
     RETURN_IF_ERROR(ex.err_);
   }
@@ -45,15 +47,15 @@ LegionModelState::Create(
 
   // Auto-complete the configuration if requested...
   bool auto_complete_config = false;
-  RETURN_IF_ERROR(TRITONBACKEND_ModelAutoCompleteConfig(
-      triton_model, &auto_complete_config));
+  RETURN_IF_ERROR(TRITONBACKEND_ModelAutoCompleteConfig(triton_model,
+                                                        &auto_complete_config));
   if (auto_complete_config) {
     RETURN_IF_ERROR(lstate->AutoCompleteConfig());
 
     triton::common::TritonJson::WriteBuffer json_buffer;
     lstate->ModelConfig().Write(&json_buffer);
 
-    TRITONSERVER_Message* message;
+    TRITONSERVER_Message *message;
     RETURN_IF_ERROR(TRITONSERVER_MessageNewFromSerializedJson(
         &message, json_buffer.Base(), json_buffer.Size()));
     RETURN_IF_ERROR(TRITONBACKEND_ModelSetConfig(
@@ -62,21 +64,21 @@ LegionModelState::Create(
   RETURN_IF_ERROR(lstate->ValidateModelConfig());
   *state = lstate.release();
   runtime->RecordModel(*state);
-  return nullptr;  // success
+  return nullptr; // success
 }
 
-LegionModelState::~LegionModelState(void)
-{
+LegionModelState::~LegionModelState(void) {
   FreeLayers();
-  for (auto& input : inputs_) delete input.second;
-  if (strategy_)
+  for (auto &input : inputs_) {
+    delete input.second;
+  }
+  if (strategy_) {
     delete strategy_;
+  }
   runtime_->RemoveModel(this);
 }
 
-TRITONSERVER_Error*
-LegionModelState::LoadModel()
-{
+TRITONSERVER_Error *LegionModelState::LoadModel() {
   // TODO: load files based on the default / cc file name that may be set
   // in model config
   auto model_path = JoinPath({RepositoryPath(), std::to_string(Version())});
@@ -87,12 +89,16 @@ LegionModelState::LoadModel()
   // load the ONNX model description as a list of layers
   // with tensor dependences between then and put them in layers_
   RETURN_IF_ERROR(OnnxParser::LoadModel(
-      [this](
-          Realm::Processor::Kind kind) -> const std::vector<Realm::Processor>& {
+      [this](Realm::Processor::Kind kind)
+          -> std::vector<Realm::Processor> const & {
         return runtime_->FindLocalProcessors(kind);
       },
-      this, strategy_, JoinPath({model_path, "model.onnx"}), &inputs_,
-      &outputs_, &layers_));
+      this,
+      strategy_,
+      JoinPath({model_path, "model.onnx"}),
+      &inputs_,
+      &outputs_,
+      &layers_));
   RETURN_IF_ERROR(SetOutputInfos());
 
   // Should have the same number of layers in both cases
@@ -107,18 +113,14 @@ LegionModelState::LoadModel()
   return nullptr;
 }
 
-unsigned
-LegionModelState::ReserveInstance(void)
-{
+unsigned LegionModelState::ReserveInstance(void) {
   AutoLock<true> lock(lock_);
   unsigned result = instances_.size();
   instances_.resize(result + 1, nullptr);
   return result;
 }
 
-void
-LegionModelState::RecordInstance(LegionModelInstance* instance)
-{
+void LegionModelState::RecordInstance(LegionModelInstance *instance) {
   assert(instance->model_state_ == this);
   AutoLock<true> lock(lock_, false /*exclusive*/);
   assert(instance->index_ < instances_.size());
@@ -126,27 +128,30 @@ LegionModelState::RecordInstance(LegionModelInstance* instance)
   instances_[instance->index_] = instance;
 }
 
-void
-LegionModelState::initialize(
-    LegionModelInstance* instance, const unsigned instance_index,
-    Runtime* runtime, Context ctx, MapperID mapper)
-{
+void LegionModelState::initialize(LegionModelInstance *instance,
+                                  unsigned const instance_index,
+                                  Runtime *runtime,
+                                  Context ctx,
+                                  MapperID mapper) {
   // First create logical regions for all the input tensors
-  for (auto& input : inputs_) instance->create_tensor_region(input.second);
+  for (auto &input : inputs_) {
+    instance->create_tensor_region(input.second);
+  }
 
-  for (auto layer : layers_)
+  for (auto layer : layers_) {
     layer->initialize(instance, instance_index, runtime, ctx, mapper);
+  }
 }
 
-void
-LegionModelState::forward(
-    LegionModelInstance* instance, const unsigned instance_index,
-    Runtime* runtime, Context ctx, MapperID mapper,
-    const std::vector<InputTensor>& inputs,
-    const std::vector<OutputTensor>& outputs,
-    std::vector<uint64_t>& compute_input_end_ns,
-    std::vector<uint64_t>& compute_output_start_ns)
-{
+void LegionModelState::forward(LegionModelInstance *instance,
+                               unsigned const instance_index,
+                               Runtime *runtime,
+                               Context ctx,
+                               MapperID mapper,
+                               std::vector<InputTensor> const &inputs,
+                               std::vector<OutputTensor> const &outputs,
+                               std::vector<uint64_t> &compute_input_end_ns,
+                               std::vector<uint64_t> &compute_output_start_ns) {
   assert(inputs.size() == inputs_.size());
   assert(outputs.size() == outputs_.size());
   // Attach the external memory allocations to the logical regions for the
@@ -154,34 +159,40 @@ LegionModelState::forward(
   const std::vector<FieldID> fields(1, FID_DATA);
   std::vector<PhysicalRegion> input_regions(inputs.size());
   for (unsigned idx = 0; idx < inputs.size(); idx++) {
-    const InputTensor& input = inputs[idx];
+    InputTensor const &input = inputs[idx];
     assert(input.buffers_.size() == 1);
     assert(input.buffer_locations_.size() == 1);
     assert(input.buffer_memories_.size() == 1);
     assert(input.strides_.size() == inputs_[idx].second->bounds.size());
     LogicalRegion region = inputs_[idx].second->region[instance_index];
-    AttachLauncher launcher(
-        LEGION_EXTERNAL_INSTANCE, region, region, false /*restricted*/,
-        false /*mapped*/);
-    launcher.attach_array_soa(
-        const_cast<void*>(input.buffers_[0]), false /*not column major*/,
-        fields, input.buffer_memories_[0]);
+    AttachLauncher launcher(LEGION_EXTERNAL_INSTANCE,
+                            region,
+                            region,
+                            false /*restricted*/,
+                            false /*mapped*/);
+    launcher.attach_array_soa(const_cast<void *>(input.buffers_[0]),
+                              false /*not column major*/,
+                              fields,
+                              input.buffer_memories_[0]);
     input_regions[idx] = runtime->attach_external_resource(ctx, launcher);
   }
   std::vector<PhysicalRegion> output_regions(outputs.size());
   for (unsigned idx = 0; idx < outputs.size(); idx++) {
-    const OutputTensor& output = outputs[idx];
+    OutputTensor const &output = outputs[idx];
     assert(output.buffers_.size() == 1);
     assert(output.buffer_locations_.size() == 1);
     assert(output.buffer_memories_.size() == 1);
     assert(output.strides_.size() == outputs_[idx].second->bounds.size());
     LogicalRegion region = outputs_[idx].second->region[instance_index];
-    AttachLauncher launcher(
-        LEGION_EXTERNAL_INSTANCE, region, region, false /*restricted*/,
-        false /*mapped*/);
-    launcher.attach_array_soa(
-        output.buffers_[0], false /*not column major*/, fields,
-        output.buffer_memories_[0]);
+    AttachLauncher launcher(LEGION_EXTERNAL_INSTANCE,
+                            region,
+                            region,
+                            false /*restricted*/,
+                            false /*mapped*/);
+    launcher.attach_array_soa(output.buffers_[0],
+                              false /*not column major*/,
+                              fields,
+                              output.buffer_memories_[0]);
     output_regions[idx] = runtime->attach_external_resource(ctx, launcher);
   }
   // Execution fence for timing operation
@@ -191,45 +202,50 @@ LegionModelState::forward(
 
   // We can trace the execution of this model since it should be the same
   runtime->begin_trace(ctx, 0 /*only ever have one trace*/);
-  for (auto layer : layers_)
+  for (auto layer : layers_) {
     layer->forward(instance, instance_index, runtime, ctx, mapper);
+  }
   runtime->end_trace(ctx, 0 /*only ever have one trace*/);
 
   // Execution fence for timing operation
   runtime->issue_execution_fence(ctx);
   Future stop = runtime->issue_timing_measurement(ctx, timing_launcher);
   // Detach the external memory allocations
-  for (unsigned idx = 0; idx < input_regions.size(); idx++)
+  for (unsigned idx = 0; idx < input_regions.size(); idx++) {
     runtime->detach_external_resource(ctx, input_regions[idx], false /*flush*/);
-  for (unsigned idx = 0; idx < output_regions.size(); idx++)
+  }
+  for (unsigned idx = 0; idx < output_regions.size(); idx++) {
     runtime->detach_external_resource(ctx, output_regions[idx], true /*flush*/);
+  }
 
   const uint64_t start_time = start.get_result<long long>();
-  for (unsigned idx = 0; idx < compute_input_end_ns.size(); idx++)
+  for (unsigned idx = 0; idx < compute_input_end_ns.size(); idx++) {
     compute_input_end_ns[idx] = start_time;
+  }
 
   const uint64_t stop_time = stop.get_result<long long>();
-  for (unsigned idx = 0; idx < compute_output_start_ns.size(); idx++)
+  for (unsigned idx = 0; idx < compute_output_start_ns.size(); idx++) {
     compute_output_start_ns[idx] = stop_time;
+  }
 
   // Wait for everything to be done before we return
   Future done = runtime->issue_execution_fence(ctx);
   done.wait();
 }
 
-void
-LegionModelState::finalize(
-    LegionModelInstance* instance, const unsigned instance_index,
-    Runtime* runtime, Context ctx, MapperID mapper)
-{
-  for (auto layer : layers_)
+void LegionModelState::finalize(LegionModelInstance *instance,
+                                unsigned const instance_index,
+                                Runtime *runtime,
+                                Context ctx,
+                                MapperID mapper) {
+  for (auto layer : layers_) {
     layer->finalize(instance, instance_index, runtime, ctx, mapper);
+  }
 }
 
-LegionModelInstance*
-LegionModelState::FindInstance(
-    unsigned instance_index, bool external, bool need_lock)
-{
+LegionModelInstance *LegionModelState::FindInstance(unsigned instance_index,
+                                                    bool external,
+                                                    bool need_lock) {
   if (need_lock) {
     if (external) {
       AutoLock<true> lock(lock_, false /*exclusive*/);
@@ -243,23 +259,17 @@ LegionModelState::FindInstance(
   return instances_[instance_index];
 }
 
-const PartitionStrategy*
-LegionModelState::GetStrategy(void) const
-{
+PartitionStrategy const *LegionModelState::GetStrategy(void) const {
   assert(strategy_ != nullptr);
   return strategy_;
 }
 
-TRITONSERVER_Error*
-LegionModelState::AutoCompleteConfig()
-{
+TRITONSERVER_Error *LegionModelState::AutoCompleteConfig() {
   // FIXME: Check with the FFModel
-  return nullptr;  // success
+  return nullptr; // success
 }
 
-TRITONSERVER_Error*
-LegionModelState::ValidateModelConfig()
-{
+TRITONSERVER_Error *LegionModelState::ValidateModelConfig() {
   // Constraints that apply to models in general
   {
     triton::common::TritonJson::Value igs;
@@ -295,8 +305,8 @@ LegionModelState::ValidateModelConfig()
 
   {
     // Build a map from name to tensors of the model for easy lookup
-    std::map<std::string, Tensor*> tensors;
-    for (const auto& io : inputs_) {
+    std::map<std::string, Tensor *> tensors;
+    for (auto const &io : inputs_) {
       tensors.emplace(io.first, io.second);
     }
 
@@ -306,10 +316,10 @@ LegionModelState::ValidateModelConfig()
     if (ios.ArraySize() != tensors.size()) {
       return TRITONSERVER_ErrorNew(
           TRITONSERVER_ERROR_INVALID_ARG,
-          (std::string(
-               "configuration for model '" + Name() + "' specifies " +
-               std::to_string(ios.ArraySize()) + " inputs, the model has " +
-               std::to_string(tensors.size()))
+          (std::string("configuration for model '" + Name() + "' specifies " +
+                       std::to_string(ios.ArraySize()) +
+                       " inputs, the model has " +
+                       std::to_string(tensors.size()))
                .c_str()));
     }
 
@@ -322,10 +332,11 @@ LegionModelState::ValidateModelConfig()
       // Check datatypes
       std::string io_dtype;
       RETURN_IF_ERROR(io.MemberAsString("data_type", &io_dtype));
-      RETURN_ERROR_IF_TRUE(
-          (io_dtype == "TYPE_STRING"), TRITONSERVER_ERROR_INVALID_ARG,
-          std::string("unsupported datatype '") + io_dtype + "' for tensor '" +
-              io_name + "' for model '" + Name() + "'");
+      RETURN_ERROR_IF_TRUE((io_dtype == "TYPE_STRING"),
+                           TRITONSERVER_ERROR_INVALID_ARG,
+                           std::string("unsupported datatype '") + io_dtype +
+                               "' for tensor '" + io_name + "' for model '" +
+                               Name() + "'");
       // If a reshape is provided for the input then use that when
       // validating that the model matches what is expected.
       std::vector<int64_t> dims;
@@ -335,11 +346,12 @@ LegionModelState::ValidateModelConfig()
       } else {
         RETURN_IF_ERROR(ParseShape(io, "dims", &dims));
       }
-      for (const auto dim : dims) {
+      for (auto const dim : dims) {
         RETURN_ERROR_IF_TRUE(
-            (dim == WILDCARD_DIM), TRITONSERVER_ERROR_INVALID_ARG,
-            std::string(
-                "dynamic tensor is not supported for model '" + Name() + "'"));
+            (dim == WILDCARD_DIM),
+            TRITONSERVER_ERROR_INVALID_ARG,
+            std::string("dynamic tensor is not supported for model '" + Name() +
+                        "'"));
       }
 
       // Check the properties against the corresponding tensor
@@ -347,28 +359,26 @@ LegionModelState::ValidateModelConfig()
       if (it == tensors.end()) {
         return TRITONSERVER_ErrorNew(
             TRITONSERVER_ERROR_INVALID_ARG,
-            (std::string(
-                 "configuration for model '" + Name() + "' specifies tensor '" +
-                 io_name + "' which is not found in the model")
+            (std::string("configuration for model '" + Name() +
+                         "' specifies tensor '" + io_name +
+                         "' which is not found in the model")
                  .c_str()));
       }
-      const auto& tensor = it->second;
+      auto const &tensor = it->second;
       if (ToDataType(ModelConfigDataTypeToTritonServerDataType(io_dtype)) !=
           tensor->type) {
         return TRITONSERVER_ErrorNew(
             TRITONSERVER_ERROR_INVALID_ARG,
-            (std::string(
-                 "configuration for model '" + Name() + "' specifies tensor '" +
-                 io_name + "' with type '" + io_dtype +
-                 "', the tensor in the model has type '" +
-                 DataTypeString(tensor->type) + "'")
+            (std::string("configuration for model '" + Name() +
+                         "' specifies tensor '" + io_name + "' with type '" +
+                         io_dtype + "', the tensor in the model has type '" +
+                         DataTypeString(tensor->type) + "'")
                  .c_str()));
       } else if (tensor->type == DT_NONE) {
         return TRITONSERVER_ErrorNew(
             TRITONSERVER_ERROR_INVALID_ARG,
-            (std::string(
-                 "tensor '" + io_name + "' in the model '" + Name() +
-                 "' has unknown type")
+            (std::string("tensor '" + io_name + "' in the model '" + Name() +
+                         "' has unknown type")
                  .c_str()));
       }
       if (max_batch_size_ != 0) {
@@ -376,17 +386,17 @@ LegionModelState::ValidateModelConfig()
       }
       // put tensor's bound in int64_t to utilize backend common utilities
       std::vector<int64_t> tensor_bounds;
-      for (const auto bound : tensor->bounds) {
+      for (auto const bound : tensor->bounds) {
         tensor_bounds.emplace_back(bound);
       }
       if (dims != tensor_bounds) {
         return TRITONSERVER_ErrorNew(
             TRITONSERVER_ERROR_INVALID_ARG,
-            (std::string(
-                 "configuration for model '" + Name() + "' specifies tensor '" +
-                 io_name + "' with full shape " + ShapeToString(dims) +
-                 ", the tensor in the model has shape " +
-                 ShapeToString(tensor_bounds))
+            (std::string("configuration for model '" + Name() +
+                         "' specifies tensor '" + io_name +
+                         "' with full shape " + ShapeToString(dims) +
+                         ", the tensor in the model has shape " +
+                         ShapeToString(tensor_bounds))
                  .c_str()));
       }
     }
@@ -395,8 +405,8 @@ LegionModelState::ValidateModelConfig()
   // Outputs
   {
     // Build a map from name to tensors of the model for easy lookup
-    std::map<std::string, Tensor*> tensors;
-    for (const auto& io : outputs_) {
+    std::map<std::string, Tensor *> tensors;
+    for (auto const &io : outputs_) {
       tensors.emplace(io.first, io.second);
     }
 
@@ -407,10 +417,10 @@ LegionModelState::ValidateModelConfig()
     if (ios.ArraySize() > tensors.size()) {
       return TRITONSERVER_ErrorNew(
           TRITONSERVER_ERROR_INVALID_ARG,
-          (std::string(
-               "configuration for model '" + Name() + "' specifies " +
-               std::to_string(ios.ArraySize()) + " outputs, the model has " +
-               std::to_string(tensors.size()))
+          (std::string("configuration for model '" + Name() + "' specifies " +
+                       std::to_string(ios.ArraySize()) +
+                       " outputs, the model has " +
+                       std::to_string(tensors.size()))
                .c_str()));
     }
 
@@ -422,10 +432,11 @@ LegionModelState::ValidateModelConfig()
       // Check datatypes
       std::string io_dtype;
       RETURN_IF_ERROR(io.MemberAsString("data_type", &io_dtype));
-      RETURN_ERROR_IF_TRUE(
-          (io_dtype == "TYPE_STRING"), TRITONSERVER_ERROR_INVALID_ARG,
-          std::string("unsupported datatype '") + io_dtype + "' for tensor '" +
-              io_name + "' for model '" + Name() + "'");
+      RETURN_ERROR_IF_TRUE((io_dtype == "TYPE_STRING"),
+                           TRITONSERVER_ERROR_INVALID_ARG,
+                           std::string("unsupported datatype '") + io_dtype +
+                               "' for tensor '" + io_name + "' for model '" +
+                               Name() + "'");
       // If a reshape is provided for the input then use that when
       // validating that the model matches what is expected.
       std::vector<int64_t> dims;
@@ -435,11 +446,12 @@ LegionModelState::ValidateModelConfig()
       } else {
         RETURN_IF_ERROR(ParseShape(io, "dims", &dims));
       }
-      for (const auto dim : dims) {
+      for (auto const dim : dims) {
         RETURN_ERROR_IF_TRUE(
-            (dim == WILDCARD_DIM), TRITONSERVER_ERROR_INVALID_ARG,
-            std::string(
-                "dynamic tensor is not supported for model '" + Name() + "'"));
+            (dim == WILDCARD_DIM),
+            TRITONSERVER_ERROR_INVALID_ARG,
+            std::string("dynamic tensor is not supported for model '" + Name() +
+                        "'"));
       }
 
       // Check the properties against the corresponding tensor
@@ -447,28 +459,26 @@ LegionModelState::ValidateModelConfig()
       if (it == tensors.end()) {
         return TRITONSERVER_ErrorNew(
             TRITONSERVER_ERROR_INVALID_ARG,
-            (std::string(
-                 "configuration for model '" + Name() + "' specifies tensor '" +
-                 io_name + "' which is not found in the model")
+            (std::string("configuration for model '" + Name() +
+                         "' specifies tensor '" + io_name +
+                         "' which is not found in the model")
                  .c_str()));
       }
-      const auto& tensor = it->second;
+      auto const &tensor = it->second;
       if (ToDataType(ModelConfigDataTypeToTritonServerDataType(io_dtype)) !=
           tensor->type) {
         return TRITONSERVER_ErrorNew(
             TRITONSERVER_ERROR_INVALID_ARG,
-            (std::string(
-                 "configuration for model '" + Name() + "' specifies tensor '" +
-                 io_name + "' with type '" + io_dtype +
-                 "', the tensor in the model has type '" +
-                 DataTypeString(tensor->type) + "'")
+            (std::string("configuration for model '" + Name() +
+                         "' specifies tensor '" + io_name + "' with type '" +
+                         io_dtype + "', the tensor in the model has type '" +
+                         DataTypeString(tensor->type) + "'")
                  .c_str()));
       } else if (tensor->type == DT_NONE) {
         return TRITONSERVER_ErrorNew(
             TRITONSERVER_ERROR_INVALID_ARG,
-            (std::string(
-                 "tensor '" + io_name + "' in the model '" + Name() +
-                 "' has unknown type")
+            (std::string("tensor '" + io_name + "' in the model '" + Name() +
+                         "' has unknown type")
                  .c_str()));
       }
       if (max_batch_size_ != 0) {
@@ -476,80 +486,78 @@ LegionModelState::ValidateModelConfig()
       }
       // put tensor's bound in int64_t to utilize backend common utilities
       std::vector<int64_t> tensor_bounds;
-      for (const auto bound : tensor->bounds) {
+      for (auto const bound : tensor->bounds) {
         tensor_bounds.emplace_back(bound);
       }
       if (dims != tensor_bounds) {
         return TRITONSERVER_ErrorNew(
             TRITONSERVER_ERROR_INVALID_ARG,
-            (std::string(
-                 "configuration for model '" + Name() + "' specifies tensor '" +
-                 io_name + "' with full shape " + ShapeToString(dims) +
-                 ", the tensor in the model has shape " +
-                 ShapeToString(tensor_bounds))
+            (std::string("configuration for model '" + Name() +
+                         "' specifies tensor '" + io_name +
+                         "' with full shape " + ShapeToString(dims) +
+                         ", the tensor in the model has shape " +
+                         ShapeToString(tensor_bounds))
                  .c_str()));
       }
     }
   }
-  return nullptr;  // success
+  return nullptr; // success
 }
 
-TRITONSERVER_Error*
-LegionModelState::SetOutputInfos()
-{
-  for (const auto& output : outputs_) {
+TRITONSERVER_Error *LegionModelState::SetOutputInfos() {
+  for (auto const &output : outputs_) {
     std::vector<int64_t> tensor_bounds;
-    for (const auto bound : output.second->bounds) {
+    for (auto const bound : output.second->bounds) {
       tensor_bounds.emplace_back(bound);
     }
     auto triton_dtype = ToTritonDataType(output.second->type);
     output_infos_.emplace_back(output.first, triton_dtype, tensor_bounds);
   }
-  return nullptr;  // success
+  return nullptr; // success
 }
 
-void
-LegionModelState::LoadLayers(void) const
-{
+void LegionModelState::LoadLayers(void) const {
   std::vector<Realm::Event> loaded_events;
   for (unsigned idx1 = 0; idx1 < layers_.size(); idx1++) {
-    Operator* op = layers_[idx1];
-    const LayerStrategy* config = strategy_->layers[idx1];
+    Operator *op = layers_[idx1];
+    LayerStrategy const *config = strategy_->layers[idx1];
     for (unsigned idx2 = 0; idx2 < config->nProcs; idx2++) {
       Realm::Processor proc = config->local_processors[idx2];
       loaded_events.push_back(runtime_->LoadLayer(proc, op));
     }
   }
   const Realm::Event wait_on = Realm::Event::merge_events(loaded_events);
-  if (wait_on.exists() && !wait_on.has_triggered())
+  if (wait_on.exists() && !wait_on.has_triggered()) {
     wait_on.external_wait();
+  }
 }
 
-void
-LegionModelState::FuseLayers(void)
-{
+void LegionModelState::FuseLayers(void) {
   // FIXME: add support for layer fusion
 }
 
-void
-LegionModelState::FreeLayers(void) const
-{
+void LegionModelState::FreeLayers(void) const {
   std::vector<Realm::Event> freed_events;
   for (unsigned idx1 = 0; idx1 < layers_.size(); idx1++) {
-    Operator* op = layers_[idx1];
-    const LayerStrategy* config = strategy_->layers[idx1];
+    Operator *op = layers_[idx1];
+    LayerStrategy const *config = strategy_->layers[idx1];
     for (unsigned idx2 = 0; idx2 < config->nProcs; idx2++) {
       Realm::Processor proc = config->local_processors[idx2];
       freed_events.push_back(runtime_->FreeLayer(proc, op));
     }
   }
   const Realm::Event wait_on = Realm::Event::merge_events(freed_events);
-  if (wait_on.exists() && !wait_on.has_triggered())
+  if (wait_on.exists() && !wait_on.has_triggered()) {
     wait_on.external_wait();
+  }
   // Delete layers back to front
-  for (std::vector<Operator*>::const_reverse_iterator it = layers_.rbegin();
-       it != layers_.rend(); it++)
+  for (std::vector<Operator *>::const_reverse_iterator it = layers_.rbegin();
+       it != layers_.rend();
+       it++) {
     delete (*it);
+  }
 }
 
-}}}  // namespace triton::backend::legion
+} // namespace legion
+} // namespace backend
+} // namespace triton
diff --git a/triton/src/types.h b/triton/src/types.h
index a034d5f685..b964f3455c 100644
--- a/triton/src/types.h
+++ b/triton/src/types.h
@@ -151,6 +151,7 @@ enum OperatorType {
   OP_PRELU,  // https://github.com/onnx/onnx/blob/master/docs/Operators.md#PRelu
   OP_GELU,
   OP_MULTIHEAD_ATTENTION,
+  OP_INC_MULTIHEAD_SELF_ATTENTION,
   OP_FUSED,  // Fused operator type for internal fusion optimizations
   // Parallel Ops
   OP_REPARTITION,

From 6f64c76c0c20f7c1554974450c42c63f099c62d4 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 16 Apr 2023 21:26:25 -0400
Subject: [PATCH 096/344] [LayerNorm] - Add support for element-wise affine
 mode (#683)

* impl elementwise affine

* fix

* fix2
---
 examples/cpp/inference/inference_config.h     |   2 +-
 .../inference/transformers/transformers.cc    |   2 +-
 include/flexflow/batch_config.h               |   2 +-
 src/ops/layer_norm.cc                         | 107 +++++++++++++++---
 4 files changed, 93 insertions(+), 20 deletions(-)

diff --git a/examples/cpp/inference/inference_config.h b/examples/cpp/inference/inference_config.h
index 53811dd99f..8b393336cc 100644
--- a/examples/cpp/inference/inference_config.h
+++ b/examples/cpp/inference/inference_config.h
@@ -18,7 +18,7 @@
 
 // #define MAX_SEQ_LEN 1024
 #define MAX_SEQ_LEN 20
-#define BATCH_SIZE 32
+#define BATCH_SIZE 16
 #define MNIST_DIMS 28 * 28
 #define DATA_DIM MNIST_DIMS
 // #define DATA_DIM 3
diff --git a/examples/cpp/inference/transformers/transformers.cc b/examples/cpp/inference/transformers/transformers.cc
index 14414bb8f1..233b1dcaa1 100644
--- a/examples/cpp/inference/transformers/transformers.cc
+++ b/examples/cpp/inference/transformers/transformers.cc
@@ -39,7 +39,7 @@ Tensor create_inc_multihead_attention_decoder(
     FFModel *model,
     TransformerConfig const *transformerConfig,
     Tensor const &input) {
-  std::vector<int> axes{2};
+  std::vector<int> axes{0};
   Tensor t =
       transformerConfig->incremental_mode
           ? model->inc_multihead_self_attention(
diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 05f6e062d6..17ed9d18e8 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -20,7 +20,7 @@
 // #define MAX_SEQ_LEN 1024
 // #define BATCH_SIZE 2
 #define MAX_SEQ_LEN 20
-#define BATCH_SIZE 32
+#define BATCH_SIZE 16
 #define MAX_REQUESTS 256
 
 namespace FlexFlow {
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index de511812bc..5103920413 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -62,9 +62,25 @@ Tensor FFModel::layer_norm(const Tensor input,
                            bool elementwise_affine,
                            float eps,
                            char const *name) {
-  // FIXME: currently disable elementwise_affine
-  elementwise_affine = false;
-  // axes must be the last axes.size() dimensions
+  // In PyTorch, axes must be the sizes of the last axes.size() dimensions of
+  // the input tensor. However, since the tensor dimensions are reversed in
+  // FlexFlow (batch size is the last dimension), we require that axes must be
+  // the sizes of the FIRST axes.size() dimensions of the input tensor.
+
+  // Another difference is that in PyTorch, the axes vector should contain the
+  // sizes of the dimensions with respect to which you want to compute the
+  // layernorm. In FlexFlow, instead, axes should contain the INDICES of the
+  // dimensions in question. We do this because the size of a dimension might be
+  // different when splitting a tensor in model parallelism.
+  assert(
+      axes.size() <= input->num_dims &&
+      "number of axes must be less than tensor dimensions"); // input does not
+                                                             // have replica
+                                                             // dimension here
+  for (int i = 0; i < axes.size(); i++) {
+    assert(axes[i] == i && "axes must be the first axes.size() dimensions");
+  }
+#ifdef DEADCODE
   for (int i = 0; i < axes.size(); i++) {
     bool found = false;
     for (int j = 0; j < axes.size(); j++) {
@@ -76,6 +92,7 @@ Tensor FFModel::layer_norm(const Tensor input,
       assert(false && "axes must be the last axes.size() dimensions");
     }
   }
+#endif
   int num_weights = elementwise_affine ? 2 : 0;
   Layer *ln = new Layer(this,
                         OP_LAYERNORM,
@@ -92,19 +109,19 @@ Tensor FFModel::layer_norm(const Tensor input,
                                                  0,
                                                  true /*create_grad*/);
   if (num_weights == 2) {
-    int M = 1;
-    for (int i = 0; i < axes.size(); i++) {
-      M *= input->dims[input->num_dims - 1 - axes[i]];
+    int numdims = axes.size();
+    int dims[numdims];
+    for (int i = 0; i < numdims; i++) {
+      dims[i] = input->dims[axes[i]];
     }
-    int dims[1] = {M};
-    ln->weights[0] = create_weight_legion_ordering(1,
+    ln->weights[0] = create_weight_legion_ordering(numdims,
                                                    dims,
                                                    input->data_type,
                                                    ln,
                                                    true /*create_grad*/,
                                                    nullptr,
                                                    CHOSEN_SYNC_TYPE);
-    ln->weights[1] = create_weight_legion_ordering(1,
+    ln->weights[1] = create_weight_legion_ordering(numdims,
                                                    dims,
                                                    input->data_type,
                                                    ln,
@@ -179,19 +196,41 @@ LayerNorm::LayerNorm(FFModel &model,
   ParallelDim output_dims[MAX_TENSOR_DIM];
   int M = 1;
   for (int i = 0; i < axes.size(); i++) {
-    M *= inputs[0]->dims[inputs[0]->num_dims - 1 - axes[i]].size;
+    M *= inputs[0]->dims[axes[i]].size;
   }
   effective_num_elements = M;
   effective_batch_size = inputs[0]->get_volume() / M;
+  assert(elementwise_affine == (numWeights == 2));
   if (numWeights > 0 && allocate_weights) {
-    int kernel_dims = 2;
-    assert(false);
-    // weights[0] = model.create_parallel_weight_legion_ordering(
-    //     kernel_dims,
-  } else {
-    // do nothing
+    ParallelDim dims[axes.size()];
+    for (int i = 0; i < axes.size(); i++) {
+      dims[i] = inputs[0]->dims[i];
+    }
+    int seed = std::rand();
+    Initializer *gamma_initializer = new UniformInitializer(seed, 1.0f, 1.0f);
+    Initializer *beta_initializer = new UniformInitializer(seed, 0.0f, 0.0f);
+#ifdef USE_NCCL
+    ParameterSyncType comm_type = ParameterSyncType::NCCL;
+#else
+    ParameterSyncType comm_type = ParameterSyncType::PS;
+#endif
+    weights[0] =
+        model.create_parallel_weight_legion_ordering(axes.size(),
+                                                     dims,
+                                                     DT_FLOAT,
+                                                     NULL /*owner_op*/,
+                                                     true /*create_grad*/,
+                                                     gamma_initializer,
+                                                     comm_type);
+    weights[1] =
+        model.create_parallel_weight_legion_ordering(axes.size(),
+                                                     dims,
+                                                     DT_FLOAT,
+                                                     NULL /*owner_op*/,
+                                                     true /*create_grad*/,
+                                                     beta_initializer,
+                                                     comm_type);
   }
-  return;
 }
 
 void LayerNorm::init_inference(FFModel const &ff,
@@ -226,6 +265,20 @@ void LayerNorm::init_inference(FFModel const &ff,
                                                     EXCLUSIVE,
                                                     batch_inputs[0]->region));
   launcher.add_field(1, FID_DATA);
+  if (elementwise_affine) {
+    launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[0]->region));
+    launcher.add_field(2, FID_DATA);
+    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[1]->region));
+    launcher.add_field(3, FID_DATA);
+  }
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
   set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
@@ -258,6 +311,20 @@ void LayerNorm::init(FFModel const &ff) {
                                                     EXCLUSIVE,
                                                     inputs[0]->region));
   launcher.add_field(1, FID_DATA);
+  if (elementwise_affine) {
+    launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[0]->region));
+    launcher.add_field(2, FID_DATA);
+    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[1]->region));
+    launcher.add_field(3, FID_DATA);
+  }
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
   set_opmeta_from_futuremap(ff, fm);
@@ -403,6 +470,12 @@ void LayerNorm::forward_task(Task const *task,
         regions[3], task->regions[3], FID_DATA, ctx, runtime);
     assert(gamma_domain == beta_domain);
     assert(gamma_domain.get_volume() == m->effective_num_elements);
+    int numdims = gamma_domain.get_dim();
+    for (int i = 0; i < numdims; i++) {
+      int g_d = gamma_domain.hi()[i] - gamma_domain.lo()[i] + 1;
+      int in_d = in_domain.hi()[i] - in_domain.lo()[i] + 1;
+      assert(g_d == in_d);
+    }
   } else {
     assert(regions.size() == 2);
   }

From d48763a0fb36c970b2e95ac2623645288650f41d Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 17 Apr 2023 18:16:16 -0400
Subject: [PATCH 097/344] [MoE-GPT] - Implement two-layer experts (#684)

* first commit

* removed unnecessary stuff

* update pointers

* more progress

* bug fix

* bug fix

* hip_rocm bug fix
---
 include/flexflow/ops/experts.h        |  22 +-
 include/flexflow/ops/experts_params.h |  50 ----
 src/ops/experts.cc                    | 283 ++++++--------------
 src/ops/experts.cpp                   |   6 +-
 src/ops/experts.cu                    | 358 ++++++++++++++++++++------
 5 files changed, 377 insertions(+), 342 deletions(-)

diff --git a/include/flexflow/ops/experts.h b/include/flexflow/ops/experts.h
index 7f110c79b6..c0a6c107aa 100644
--- a/include/flexflow/ops/experts.h
+++ b/include/flexflow/ops/experts.h
@@ -13,6 +13,8 @@ class ExpertsMeta : public OpMeta {
               int _experts_start_idx,
               int _data_dim,
               int _out_dim,
+              int _experts_num_layers,
+              int _experts_internal_dim_size,
               int _effective_batch_size,
               int _num_chosen_experts,
               float _alpha,
@@ -33,21 +35,27 @@ class ExpertsMeta : public OpMeta {
   int *destination_start_indices;
   float const **token_idx_array;
   float const **dev_weights;
-  float const **weight_idx_array;
+  float const **weight_idx_array1;
+  float const **weight_idx_array2;
   float const **coefficient_idx_array;
   float **output_idx_array;
-  float const **bias_idx_array;
+  float const **bias_idx_array1;
+  float const **bias_idx_array2;
   float const *one_ptr;
   float const **one_ptr_array;
 
   // array of arrays to store cublasGemmBatchedEx outputs before aggregation
-  float **batch_outputs;
-  float **dev_batch_outputs;
+  float **batch_outputs1;
+  float **batch_outputs2;
+  float **dev_batch_outputs1;
+  float **dev_batch_outputs2;
 
   int num_experts;
   int experts_start_idx;
   int data_dim;
   int out_dim;
+  int experts_num_layers;
+  int experts_internal_dim_size;
   int effective_batch_size;
   int num_chosen_experts;
   int expert_capacity;
@@ -55,11 +63,13 @@ class ExpertsMeta : public OpMeta {
   bool use_bias;
   ActiMode activation;
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
-  cudnnTensorDescriptor_t resultTensorDesc;
   cudnnActivationDescriptor_t actiDesc;
+  cudnnTensorDescriptor_t resultTensorDesc1;
+  cudnnTensorDescriptor_t resultTensorDesc2;
 #else
-  miopenTensorDescriptor_t resultTensorDesc;
   miopenActivationDescriptor_t actiDesc;
+  miopenTensorDescriptor_t resultTensorDesc1;
+  miopenTensorDescriptor_t resultTensorDesc2;
 #endif
 };
 
diff --git a/include/flexflow/ops/experts_params.h b/include/flexflow/ops/experts_params.h
index e5aa2f1ebb..b6ba88a96e 100644
--- a/include/flexflow/ops/experts_params.h
+++ b/include/flexflow/ops/experts_params.h
@@ -17,56 +17,6 @@ struct ExpertsParams {
   ActiMode activation;
 
   bool is_valid(std::vector<ParallelTensorShape> const &) const;
-  void solve_dims(const ParallelTensor input,
-                  ParallelDim output_dims[MAX_TENSOR_DIM],
-                  int *output_ndims,
-                  ParallelDim kernel_dims[MAX_TENSOR_DIM],
-                  int *kernel_ndims,
-                  ParallelDim bias_dims[MAX_TENSOR_DIM],
-                  int *bias_ndims) const;
-  void solve_dims(ParallelTensorShape const &input_shape,
-                  ParallelTensorShape &output_shape,
-                  ParallelTensorShape &kernel_shape,
-                  ParallelTensorShape &bias_shape) const;
-  void solve_dims(ParallelTensorShape const &input_shape,
-                  ParallelDim output_dims[MAX_TENSOR_DIM],
-                  int *output_ndims,
-                  ParallelDim kernel_dims[MAX_TENSOR_DIM],
-                  int *kernel_ndims,
-                  ParallelDim bias_dims[MAX_TENSOR_DIM],
-                  int *bias_ndims) const;
-  void construct_mappings(std::vector<ParallelDimMappingRecord> &,
-                          ParallelTensorShape const &) const;
-
-  enum NamedDimensions {
-    INPUT_CHANNEL,
-    INPUT_SAMPLE,
-    INPUT_REPLICA,
-    OUTPUT_CHANNEL,
-    OUTPUT_SAMPLE,
-    OUTPUT_REPLICA,
-    KERNEL_CHANNEL_IN,
-    KERNEL_CHANNEL_OUT,
-    KERNEL_NUM_EXPERTS,
-    BIAS_CHANNEL_OUT,
-    BIAS_NUM_EXPERTS,
-  };
-
-  std::unordered_map<NamedDimensions, int>
-      get_dimension_names(ParallelTensorShape const &input_name) const;
-
-private:
-  void mark_replica_dims(ParallelTensorShape const &input_shape,
-                         ParallelDim output_dims[MAX_TENSOR_DIM],
-                         ParallelDim kernel_dims[MAX_TENSOR_DIM],
-                         ParallelDim bias_dims[MAX_TENSOR_DIM]) const;
-  void calculate_nonreplica_dim_sizes(ParallelTensorShape const &input_shape,
-                                      ParallelDim output_dims[MAX_TENSOR_DIM],
-                                      int *output_ndims,
-                                      ParallelDim kernel_dims[MAX_TENSOR_DIM],
-                                      int *kernel_ndims,
-                                      ParallelDim bias_dims[MAX_TENSOR_DIM],
-                                      int *bias_ndims) const;
 };
 
 bool operator==(ExpertsParams const &, ExpertsParams const &);
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index 6eaa3be943..5fa6404ff0 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -69,7 +69,8 @@ Tensor FFModel::experts(Tensor const *inputs,
 
   assert(inputs[1]->data_type == DT_INT32 || inputs[1]->data_type == DT_INT64);
 
-  assert(experts_num_layers == 1 && "Multi-layer experts not implemented yet.");
+  assert(experts_num_layers >= 1);
+  assert(experts_num_layers <= 2 && "Multi-layer experts not implemented yet.");
   assert(experts_num_layers == 1 || experts_internal_dim_size > 0);
 
   // parameters for the FFN implementing the experts. We can make these
@@ -96,12 +97,19 @@ Tensor FFModel::experts(Tensor const *inputs,
     assert(e->outputs[0] != nullptr);
   }
   {
-    int dims[3] = {inputs[0]->dims[0], experts_output_dim_size, num_experts};
+    int nparams = (experts_num_layers == 1)
+                      ? (inputs[0]->dims[0] * experts_output_dim_size)
+                      : experts_internal_dim_size *
+                            (inputs[0]->dims[0] + experts_output_dim_size);
+    int dims[2] = {nparams, num_experts};
     e->weights[0] = create_weight_legion_ordering(
-        3, dims, DT_FLOAT, e, true /*create_grad*/, nullptr, CHOSEN_SYNC_TYPE);
+        2, dims, DT_FLOAT, e, true /*create_grad*/, nullptr, CHOSEN_SYNC_TYPE);
   }
   if (use_bias) {
-    int dims[2] = {experts_output_dim_size, num_experts};
+    int nparams = (experts_num_layers == 1)
+                      ? experts_output_dim_size
+                      : (experts_internal_dim_size + experts_output_dim_size);
+    int dims[2] = {nparams, num_experts};
     e->weights[1] = create_weight_legion_ordering(
         2, dims, DT_FLOAT, e, true /*create_grad*/, nullptr, CHOSEN_SYNC_TYPE);
   }
@@ -307,7 +315,8 @@ Experts::Experts(FFModel &model,
   assert(inputs[2]->dims[0].degree == 1);
   // check data type of indices input
   assert(inputs[1]->data_type == DT_INT32 || inputs[1]->data_type == DT_INT64);
-  assert(experts_num_layers == 1 && "Multi-layer experts not implemented yet.");
+  assert(experts_num_layers >= 1);
+  assert(experts_num_layers <= 2 && "Multi-layer experts not implemented yet.");
   assert(experts_num_layers == 1 || experts_internal_dim_size > 0);
 
   // save the token embedding dimension (data_dim) and the effective batch size
@@ -330,14 +339,6 @@ Experts::Experts(FFModel &model,
       num_dims, out_dims, inputs[0]->data_type, this, 0 /*owner_idx*/);
   assert(outputs[0] != nullptr);
 
-  // auto dimension_names =
-  // this->get_params().get_dimension_names(inputs[0]->get_shape());
-  ParallelTensorShape input_shape = inputs[0]->get_shape();
-  ParallelTensorShape output_shape, kernel_shape, bias_shape;
-  ExpertsParams params = this->get_params();
-  params.construct_mappings(*this->parallel_dims_mapping, input_shape);
-  params.solve_dims(input_shape, output_shape, kernel_shape, bias_shape);
-
   if (allocate_weights) {
 #ifdef USE_NCCL
     ParameterSyncType comm_type = ParameterSyncType::NCCL;
@@ -345,29 +346,52 @@ Experts::Experts(FFModel &model,
     ParameterSyncType comm_type = ParameterSyncType::PS;
 #endif
     {
+      ParallelDim dims[3];
+      int nparams = (experts_num_layers == 1)
+                        ? (data_dim * experts_output_dim_size)
+                        : experts_internal_dim_size *
+                              (data_dim + experts_output_dim_size);
+      dims[0].size = nparams;
+      dims[0].degree = 1;
+      dims[0].parallel_idx = -1;
+      dims[1] = inputs[0]->dims[num_dims - 1];
+      dims[1].size = num_experts;
+      dims[2] = inputs[0]->dims[num_dims - 2];
+      dims[2].size = dims[0].degree;
       Initializer *kernel_initializer = new GlorotUniform(std::rand() /*seed*/);
-      assert(kernel_shape.dims[2].size == num_experts);
-      weights[0] = model.create_parallel_weight_legion_ordering(
-          kernel_shape.num_dims, // 3,
-          kernel_shape.dims,     // dims,
-          DT_FLOAT,
-          NULL /*owner_op*/,
-          true /*create_grad*/,
-          kernel_initializer,
-          comm_type);
+      // assert(kernel_shape.dims[2].size == num_experts);
+      weights[0] =
+          model.create_parallel_weight_legion_ordering(3,
+                                                       dims,
+                                                       DT_FLOAT,
+                                                       NULL /*owner_op*/,
+                                                       true /*create_grad*/,
+                                                       kernel_initializer,
+                                                       comm_type);
       assert(weights[0] != nullptr);
     }
     if (use_bias) {
       Initializer *bias_initializer = new ZeroInitializer();
-      assert(bias_shape.dims[1].size == num_experts);
-      weights[1] = model.create_parallel_weight_legion_ordering(
-          bias_shape.num_dims, // 1,
-          bias_shape.dims,     // dims,
-          DT_FLOAT,
-          NULL /*owner_op*/,
-          true /*create_grad*/,
-          bias_initializer,
-          comm_type);
+      // assert(bias_shape.dims[1].size == num_experts);
+      ParallelDim dims[3];
+      int nparams = (experts_num_layers == 1)
+                        ? experts_output_dim_size
+                        : (experts_internal_dim_size + experts_output_dim_size);
+      dims[0].size = nparams;
+      dims[0].degree = 1;
+      dims[0].parallel_idx = -1;
+      dims[1] = inputs[0]->dims[num_dims - 1];
+      dims[1].size = num_experts;
+      dims[2] = inputs[0]->dims[num_dims - 2];
+      dims[2].size = dims[0].degree;
+      weights[1] =
+          model.create_parallel_weight_legion_ordering(3,
+                                                       dims,
+                                                       DT_FLOAT,
+                                                       NULL /*owner_op*/,
+                                                       true /*create_grad*/,
+                                                       bias_initializer,
+                                                       comm_type);
       assert(weights[1] != nullptr);
     }
   }
@@ -563,6 +587,8 @@ OpMeta *Experts::init_task(Task const *task,
                                    exp->experts_start_idx,
                                    exp->data_dim,
                                    exp->out_dim,
+                                   exp->experts_num_layers,
+                                   exp->experts_internal_dim_size,
                                    exp->effective_batch_size,
                                    exp->num_chosen_experts,
                                    exp->alpha,
@@ -754,6 +780,8 @@ void Experts::inference_task(Task const *task,
       input_domain.hi()[samples_index] - input_domain.lo()[samples_index] + 1;
   coord_t chosen_experts = indices_domain.hi()[0] - indices_domain.lo()[0] + 1;
   coord_t out_dim = output_domain.hi()[0] - output_domain.lo()[0] + 1;
+  coord_t num_replicas =
+      input_domain.hi()[replica_dim] - input_domain.lo()[replica_dim] + 1;
   assert(data_dim == m->data_dim);
   assert(out_dim == m->out_dim);
   assert(chosen_experts == m->num_chosen_experts);
@@ -790,10 +818,14 @@ void Experts::inference_task(Task const *task,
   Domain weights_domain = runtime->get_index_space_domain(
       ctx, task->regions[4].region.get_index_space());
   int weights_dims = weights_domain.get_dim();
-  assert(weights_dims == input_dims);
-  assert(weights_domain.hi()[0] - weights_domain.lo()[0] + 1 == data_dim);
-  assert(weights_domain.hi()[1] - weights_domain.lo()[1] + 1 == out_dim);
-  assert(weights_domain.hi()[2] - weights_domain.lo()[2] + 1 == num_experts);
+  assert(weights_dims == 3);
+  int nparams_weight =
+      (m->experts_num_layers == 1)
+          ? (data_dim * out_dim)
+          : m->experts_internal_dim_size * (data_dim + out_dim);
+  assert(weights_domain.hi()[0] - weights_domain.lo()[0] + 1 == nparams_weight);
+  assert(weights_domain.hi()[1] - weights_domain.lo()[1] + 1 == num_experts);
+  assert(weights_domain.hi()[2] - weights_domain.lo()[2] + 1 == num_replicas);
 
   float const *bias_ptr = nullptr;
   if (use_bias) {
@@ -802,9 +834,13 @@ void Experts::inference_task(Task const *task,
     Domain bias_domain = runtime->get_index_space_domain(
         ctx, task->regions[5].region.get_index_space());
     int bias_dims = bias_domain.get_dim();
-    assert(bias_dims == 4);
-    assert(bias_domain.hi()[0] - bias_domain.lo()[0] + 1 == out_dim);
+    assert(bias_dims == 3);
+    int nparams_bias = (m->experts_num_layers == 1)
+                           ? out_dim
+                           : (m->experts_internal_dim_size + out_dim);
+    assert(bias_domain.hi()[0] - bias_domain.lo()[0] + 1 == nparams_bias);
     assert(bias_domain.hi()[1] - bias_domain.lo()[1] + 1 == num_experts);
+    assert(bias_domain.hi()[2] - bias_domain.lo()[2] + 1 == num_replicas);
   }
 
 #ifdef INFERENCE_TESTS
@@ -1030,179 +1066,6 @@ bool Experts::measure_operator_cost(Simulator *sim,
   return false;
 }
 
-void ExpertsParams::solve_dims(const ParallelTensor input,
-                               ParallelDim output_dims[MAX_TENSOR_DIM],
-                               int *output_ndims,
-                               ParallelDim kernel_dims[MAX_TENSOR_DIM],
-                               int *kernel_ndims,
-                               ParallelDim bias_dims[MAX_TENSOR_DIM],
-                               int *bias_ndims) const {
-  this->solve_dims(input->get_shape(),
-                   output_dims,
-                   output_ndims,
-                   kernel_dims,
-                   kernel_ndims,
-                   bias_dims,
-                   bias_ndims);
-}
-
-void ExpertsParams::solve_dims(ParallelTensorShape const &input_shape,
-                               ParallelTensorShape &output_shape,
-                               ParallelTensorShape &kernel_shape,
-                               ParallelTensorShape &bias_shape) const {
-  this->solve_dims(input_shape,
-                   output_shape.dims,
-                   &output_shape.num_dims,
-                   kernel_shape.dims,
-                   &kernel_shape.num_dims,
-                   bias_shape.dims,
-                   &bias_shape.num_dims);
-}
-
-void ExpertsParams::solve_dims(ParallelTensorShape const &input_shape,
-                               ParallelDim output_dims[MAX_TENSOR_DIM],
-                               int *output_ndims,
-                               ParallelDim kernel_dims[MAX_TENSOR_DIM],
-                               int *kernel_ndims,
-                               ParallelDim bias_dims[MAX_TENSOR_DIM],
-                               int *bias_ndims) const {
-  assert((output_dims == nullptr) == (output_ndims == nullptr));
-  assert((kernel_dims == nullptr) == (kernel_ndims == nullptr));
-  assert((bias_dims == nullptr) == (bias_ndims == nullptr));
-
-  std::vector<ParallelDimMappingRecord> mapping;
-  this->construct_mappings(mapping, input_shape);
-  this->mark_replica_dims(input_shape, output_dims, kernel_dims, bias_dims);
-
-  solve_parallel_dim_mappings(
-      mapping, {input_shape.dims}, {kernel_dims, bias_dims}, {output_dims});
-
-  this->calculate_nonreplica_dim_sizes(input_shape,
-                                       output_dims,
-                                       output_ndims,
-                                       kernel_dims,
-                                       kernel_ndims,
-                                       bias_dims,
-                                       bias_ndims);
-}
-
-std::unordered_map<ExpertsParams::NamedDimensions, int>
-    ExpertsParams::get_dimension_names(
-        ParallelTensorShape const &input_shape) const {
-  int num_dims = input_shape.num_dims;
-
-  return {{INPUT_CHANNEL, 0},
-          {INPUT_SAMPLE, num_dims - 2},
-          {INPUT_REPLICA, num_dims - 1},
-          {OUTPUT_CHANNEL, 0},
-          {OUTPUT_SAMPLE, num_dims - 2},
-          {OUTPUT_REPLICA, num_dims - 1},
-          {KERNEL_CHANNEL_IN, 0},
-          {KERNEL_CHANNEL_OUT, 1},
-          {KERNEL_NUM_EXPERTS, 2},
-          {BIAS_CHANNEL_OUT, 0},
-          {BIAS_NUM_EXPERTS, 1}};
-}
-
-void ExpertsParams::calculate_nonreplica_dim_sizes(
-    ParallelTensorShape const &input_shape,
-    ParallelDim output_dims[MAX_TENSOR_DIM],
-    int *output_ndims,
-    ParallelDim kernel_dims[MAX_TENSOR_DIM],
-    int *kernel_ndims,
-    ParallelDim bias_dims[MAX_TENSOR_DIM],
-    int *bias_ndims) const {
-  auto dimension_names = this->get_dimension_names(input_shape);
-  int num_dims = input_shape.num_dims;
-
-  if (output_dims != nullptr) {
-    for (int i = 1; i < input_shape.num_dims - 1; i++) {
-      output_dims[i].size = input_shape.dims[i].size;
-    }
-    output_dims[dimension_names.at(OUTPUT_CHANNEL)].size =
-        experts_output_dim_size;
-    *output_ndims = num_dims;
-  }
-  if (kernel_dims != nullptr) {
-    kernel_dims[dimension_names.at(KERNEL_CHANNEL_IN)].size =
-        input_shape.dims[INPUT_CHANNEL].size /
-        input_shape.dims[INPUT_CHANNEL].degree;
-    kernel_dims[dimension_names.at(KERNEL_CHANNEL_OUT)].size =
-        experts_output_dim_size;
-    kernel_dims[dimension_names.at(KERNEL_NUM_EXPERTS)].size = num_experts;
-    *kernel_ndims = num_dims;
-  }
-  if (bias_dims != nullptr) {
-    bias_dims[dimension_names.at(BIAS_CHANNEL_OUT)].size =
-        experts_output_dim_size;
-    bias_dims[dimension_names.at(BIAS_NUM_EXPERTS)].size = num_experts;
-    *bias_ndims = num_dims;
-  }
-}
-
-void ExpertsParams::mark_replica_dims(
-    ParallelTensorShape const &input_shape,
-    ParallelDim output_dims[MAX_TENSOR_DIM],
-    ParallelDim kernel_dims[MAX_TENSOR_DIM],
-    ParallelDim bias_dims[MAX_TENSOR_DIM]) const {
-  int num_dims = input_shape.num_dims;
-  auto dimension_names = this->get_dimension_names(input_shape);
-  if (output_dims != nullptr) {
-    output_dims[dimension_names.at(OUTPUT_REPLICA)].is_replica_dim = true;
-  }
-  if (kernel_dims != nullptr) {
-    for (int i = 2; i < num_dims; i++) {
-      kernel_dims[i].is_replica_dim = true;
-    }
-  }
-  if (bias_dims != nullptr) {
-    for (int i = 1; i < num_dims; i++) {
-      bias_dims[i].is_replica_dim = true;
-    }
-  }
-}
-
-void ExpertsParams::construct_mappings(
-    std::vector<ParallelDimMappingRecord> &mappings,
-    ParallelTensorShape const &input_shape) const {
-  std::unordered_map<NamedDimensions, int> dimension_names =
-      this->get_dimension_names(input_shape);
-
-  Op::construct_output_parallel_dims(
-      mappings,
-      {{dimension_names.at(INPUT_CHANNEL), dimension_names.at(OUTPUT_REPLICA)},
-       {dimension_names.at(INPUT_REPLICA),
-        dimension_names.at(OUTPUT_CHANNEL)}});
-  for (int i = 1; i < input_shape.num_dims - 1; i++) {
-    Op::construct_output_parallel_dims(mappings, i, i);
-  }
-
-  Op::construct_weight_parallel_dims(mappings,
-                                     {{dimension_names.at(INPUT_CHANNEL),
-                                       dimension_names.at(KERNEL_CHANNEL_IN)},
-                                      {dimension_names.at(INPUT_REPLICA),
-                                       dimension_names.at(KERNEL_CHANNEL_OUT)}},
-                                     0 /*input_idx*/,
-                                     KERNEL_IDX);
-  // map a bunch of replica dimensions for the unnamed dimensions in the input
-  for (int i = 1; i < input_shape.num_dims - 1; i++) {
-    Op::construct_weight_parallel_dims(
-        mappings, i, i + 1, 0 /*input_idx*/, KERNEL_IDX);
-  }
-
-  Op::construct_weight_parallel_dims(mappings,
-                                     {
-                                         {dimension_names.at(INPUT_REPLICA),
-                                          dimension_names.at(BIAS_CHANNEL_OUT)},
-                                     },
-                                     0 /*input_idx*/,
-                                     BIAS_IDX);
-  for (int i = 0; i < input_shape.num_dims - 1; i++) {
-    Op::construct_weight_parallel_dims(
-        mappings, i, i + 1, 0 /*input_idx*/, BIAS_IDX);
-  }
-}
-
 }; // namespace FlexFlow
 
 namespace std {
diff --git a/src/ops/experts.cpp b/src/ops/experts.cpp
index 88456ac66c..c06f02a647 100644
--- a/src/ops/experts.cpp
+++ b/src/ops/experts.cpp
@@ -40,6 +40,8 @@ ExpertsMeta::ExpertsMeta(FFHandler handler,
                          int _experts_start_idx,
                          int _data_dim,
                          int _out_dim,
+                         int _experts_num_layers,
+                         int _experts_internal_dim_size,
                          int _effective_batch_size,
                          int _num_chosen_experts,
                          float _alpha,
@@ -47,7 +49,9 @@ ExpertsMeta::ExpertsMeta(FFHandler handler,
                          ActiMode _activation)
     : OpMeta(handler), num_experts(_num_experts),
       experts_start_idx(_experts_start_idx), data_dim(_data_dim),
-      out_dim(_out_dim), effective_batch_size(_effective_batch_size),
+      out_dim(_out_dim), experts_num_layers(_experts_num_layers),
+      experts_internal_dim_size(_experts_internal_dim_size),
+      effective_batch_size(_effective_batch_size),
       num_chosen_experts(_num_chosen_experts), alpha(_alpha),
       use_bias(_use_bias), activation(_activation) {}
 ExpertsMeta::~ExpertsMeta(void) {}
diff --git a/src/ops/experts.cu b/src/ops/experts.cu
index 82f128fd1b..c5f79446a1 100644
--- a/src/ops/experts.cu
+++ b/src/ops/experts.cu
@@ -201,6 +201,8 @@ __global__ void experts_forward_prepare_kernel(
     int num_chosen_experts,
     int data_dim,
     int out_dim,
+    int experts_num_layers,
+    int experts_internal_dim_size,
     bool use_bias,
     int *sorted_indices,
     int *expert_start_indexes,
@@ -209,13 +211,15 @@ __global__ void experts_forward_prepare_kernel(
     int *original_indices,
     float const *input, // @In: Tokens' values (in_dim, batch_size)
     float *output,
-    float const **token_idx_array,  // @Out: Barray for GemmBatchedEx
-    float const *weights,           // @In: Experts' weights
-    float const *biases,            // @In: Experts' biases
-    float const **weight_idx_array, // @Out: Aarray for GemmBatchedEx
-    float const **bias_idx_array,   // @Out: Experts' bias
-    float const *coefficients,      // @In: topk_gate_predss coefficients tensor
-                                    // (num_chosen_experts, batch_size)
+    float const **token_idx_array,   // @Out: Barray for GemmBatchedEx
+    float const *weights,            // @In: Experts' weights
+    float const *biases,             // @In: Experts' biases
+    float const **weight_idx_array1, // @Out: Aarray for GemmBatchedEx
+    float const **weight_idx_array2,
+    float const **bias_idx_array1, // @Out: Experts' bias
+    float const **bias_idx_array2,
+    float const *coefficients, // @In: topk_gate_predss coefficients tensor
+                               // (num_chosen_experts, batch_size)
     float const **coefficient_idx_array, // @Out: Barray for Aggregation
     float **output_idx_array) {
 
@@ -226,19 +230,38 @@ __global__ void experts_forward_prepare_kernel(
     int local_expert_label = global_expert_label - experts_start_idx;
     int expert_index = exp_local_label_to_index[local_expert_label];
     int within_expert_offset = i - expert_start_indexes[expert_index];
+    int weight_params_count =
+        experts_num_layers == 1
+            ? data_dim * out_dim
+            : experts_internal_dim_size * (data_dim + out_dim);
     if (within_expert_offset < expert_capacity) {
       int rev_idx = original_indices[i + lb_index];
       int token_idx = (rev_idx / num_chosen_experts);
 
       token_idx_array[destination_start_indices[expert_index] +
                       within_expert_offset] = &input[token_idx * data_dim];
-      weight_idx_array[destination_start_indices[expert_index] +
-                       within_expert_offset] =
-          &weights[local_expert_label * data_dim * out_dim];
+      weight_idx_array1[destination_start_indices[expert_index] +
+                        within_expert_offset] =
+          &weights[local_expert_label * weight_params_count];
+      if (experts_num_layers == 2) {
+        weight_idx_array2[destination_start_indices[expert_index] +
+                          within_expert_offset] =
+            &weights[local_expert_label * weight_params_count +
+                     (data_dim * experts_internal_dim_size)];
+      }
       if (use_bias) {
-        bias_idx_array[destination_start_indices[expert_index] +
-                       within_expert_offset] =
-            &biases[local_expert_label * out_dim];
+        int bias_params_count = (experts_num_layers == 1)
+                                    ? out_dim
+                                    : (experts_internal_dim_size + out_dim);
+        bias_idx_array1[destination_start_indices[expert_index] +
+                        within_expert_offset] =
+            &biases[local_expert_label * bias_params_count];
+        if (experts_num_layers == 2) {
+          bias_idx_array2[destination_start_indices[expert_index] +
+                          within_expert_offset] =
+              &biases[local_expert_label * bias_params_count +
+                      experts_internal_dim_size];
+        }
       }
       coefficient_idx_array[destination_start_indices[expert_index] +
                             within_expert_offset] = &coefficients[rev_idx];
@@ -264,13 +287,18 @@ bool use_activation(ActiMode mode) {
 }
 
 void experts_forward_GemmBatched_kernel(ExpertsMeta const *m,
-                                        void const **weights_ptr,
+                                        void const **weights_ptr1,
+                                        void const **weights_ptr2,
                                         void const **input_ptr,
-                                        void **results_ptr,
-                                        void const **bias_ptr,
+                                        void **results_ptr1,
+                                        void **results_ptr2,
+                                        void const **bias_ptr1,
+                                        void const **bias_ptr2,
                                         ActiMode activation,
                                         int in_dim,
                                         int out_dim,
+                                        int experts_num_layers,
+                                        int experts_internal_dim_size,
                                         int num_tokens,
                                         int num_chosen_experts,
                                         int gemm_batch_count,
@@ -290,63 +318,169 @@ void experts_forward_GemmBatched_kernel(ExpertsMeta const *m,
 
   cublasComputeType_t compute_type = CUBLAS_COMPUTE_32F;
 
+  int m_ = out_dim;
+  int n = 1;
+  int k = in_dim;
+  void const **A = weights_ptr1;
+  void const **B = input_ptr;
+  void **C = results_ptr1;
+  int lda = in_dim;
+  int ldb = in_dim;
+  int ldc = out_dim;
+  if (experts_num_layers == 2) {
+    m_ = ldc = experts_internal_dim_size;
+  }
   checkCUDA(cublasGemmBatchedEx(
       m->handle.blas,
       CUBLAS_OP_T, // Tranpose Weight, shape (in_dim, out_dim) => (out_dim,
                    // in_dim)
       CUBLAS_OP_N, // Input_token, shape (in_dim, 1)
-      out_dim,     // num_row of (A, C) = out_dim
-      1,           // num_col of (B, C) = 1
-      in_dim,      // num_col of A and num_rows of B = in_dim
+      m_,          // num_row of (A, C) = out_dim
+      n,           // num_col of (B, C) = 1
+      k,           // num_col of A and num_rows of B = in_dim
       &alpha,
-      weights_ptr, // Aarray (num_tokens * chosen_experts, in_dim, out_dim)
+      A, // Aarray (num_tokens * chosen_experts, in_dim, out_dim)
       weight_type,
-      in_dim,    // Leading Dimension of weight before transpose
-      input_ptr, // Barray (num_tokens * chosen_experts, in_dim, 1)
+      lda, // Leading Dimension of weight before transpose
+      B,   // Barray (num_tokens * chosen_experts, in_dim, 1)
       input_type,
-      in_dim, // Leading Dimension of input_token
+      ldb, // Leading Dimension of input_token
       &beta,
-      results_ptr, // Carray (num_tokens * chosen_experts, out_dim, 1)
+      C, // Carray (num_tokens * chosen_experts, out_dim, 1)
       output_type,
-      out_dim,          // Leading Dimension of output
+      ldc,              // Leading Dimension of output
       gemm_batch_count, // Total submatrixes
       compute_type,
       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
 
-  // TODO 2: bias and activations
   if (m->use_bias) {
+    m_ = out_dim;
+    n = 1;
+    k = 1;
+    A = bias_ptr1;
+    B = (void const **)m->one_ptr_array;
+    C = results_ptr1;
+    lda = out_dim;
+    ldb = 1;
+    ldc = out_dim;
+    if (experts_num_layers == 2) {
+      m_ = lda = ldc = experts_internal_dim_size;
+    }
+    alpha = 1.0f, beta = 0.0f;
     checkCUDA(cublasGemmBatchedEx(
         m->handle.blas,
         CUBLAS_OP_N, // Bias, shape (out_dim, 1)
         CUBLAS_OP_N, // Coefficient, shape (1, 1)
-        out_dim,     // num_row of (A, C) = out_dim
-        1,           // num_col of (B, C) = 1
-        1,           // num_col of A and num_rows of B = 1
+        m_,          // num_row of (A, C) = out_dim
+        n,           // num_col of (B, C) = 1
+        k,           // num_col of A and num_rows of B = 1
         &alpha,
-        bias_ptr, // bias tensor (out_dim, 1)
+        A, // bias tensor (out_dim, 1)
         weight_type,
-        out_dim,                         // Leading Dimension of bias tensor
-        (void const **)m->one_ptr_array, // all-one tensor (1, 1)
+        lda, // Leading Dimension of bias tensor
+        B,   // all-one tensor (1, 1)
         CUDA_R_32F,
-        1, // Leading Dimension of all-one tensor
+        ldb, // Leading Dimension of all-one tensor
         &alpha,
-        results_ptr, // Carray (num_tokens * chosen_experts, out_dim, 1)
+        C, // Carray (num_tokens * chosen_experts, out_dim, 1)
         output_type,
-        out_dim,          // Leading Dimension of output
+        ldc,              // Leading Dimension of output
         gemm_batch_count, // Total submatrixs
         compute_type,
         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
   }
 
   if (use_activation(activation)) {
+    alpha = 1.0f, beta = 0.0f;
     checkCUDNN(cudnnActivationForward(m->handle.dnn,
                                       m->actiDesc,
                                       &alpha,
-                                      m->resultTensorDesc,
-                                      m->batch_outputs[0],
+                                      m->resultTensorDesc1,
+                                      m->batch_outputs1[0],
                                       &beta,
-                                      m->resultTensorDesc,
-                                      m->batch_outputs[0]));
+                                      m->resultTensorDesc1,
+                                      m->batch_outputs1[0]));
+  }
+
+  if (experts_num_layers == 2) {
+    m_ = out_dim;
+    n = 1;
+    k = experts_internal_dim_size;
+    A = weights_ptr2;
+    B = (void const **)results_ptr1;
+    C = results_ptr2;
+    lda = experts_internal_dim_size;
+    ldb = experts_internal_dim_size;
+    ldc = out_dim;
+    alpha = 1.0f, beta = 0.0f;
+    checkCUDA(cublasGemmBatchedEx(
+        m->handle.blas,
+        CUBLAS_OP_T, // Tranpose Weight, shape (in_dim, out_dim) => (out_dim,
+                     // in_dim)
+        CUBLAS_OP_N, // Input_token, shape (in_dim, 1)
+        m_,          // num_row of (A, C) = out_dim
+        n,           // num_col of (B, C) = 1
+        k,           // num_col of A and num_rows of B = in_dim
+        &alpha,
+        A, // Aarray (num_tokens * chosen_experts, in_dim, out_dim)
+        weight_type,
+        lda, // Leading Dimension of weight before transpose
+        B,   // Barray (num_tokens * chosen_experts, in_dim, 1)
+        input_type,
+        ldb, // Leading Dimension of input_token
+        &beta,
+        C, // Carray (num_tokens * chosen_experts, out_dim, 1)
+        output_type,
+        ldc,              // Leading Dimension of output
+        gemm_batch_count, // Total submatrixes
+        compute_type,
+        CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
+    if (m->use_bias) {
+      m_ = out_dim;
+      n = 1;
+      k = 1;
+      A = bias_ptr2;
+      B = (void const **)m->one_ptr_array;
+      C = results_ptr2;
+      lda = out_dim;
+      ldb = 1;
+      ldc = out_dim;
+      alpha = 1.0f, beta = 0.0f;
+      checkCUDA(cublasGemmBatchedEx(
+          m->handle.blas,
+          CUBLAS_OP_N, // Bias, shape (out_dim, 1)
+          CUBLAS_OP_N, // Coefficient, shape (1, 1)
+          m_,          // num_row of (A, C) = out_dim
+          n,           // num_col of (B, C) = 1
+          k,           // num_col of A and num_rows of B = 1
+          &alpha,
+          A, // bias tensor (out_dim, 1)
+          weight_type,
+          lda, // Leading Dimension of bias tensor
+          B,   // all-one tensor (1, 1)
+          CUDA_R_32F,
+          ldb, // Leading Dimension of all-one tensor
+          &alpha,
+          C, // Carray (num_tokens * chosen_experts, out_dim, 1)
+          output_type,
+          ldc,              // Leading Dimension of output
+          gemm_batch_count, // Total submatrixs
+          compute_type,
+          CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+    }
+
+    if (use_activation(activation)) {
+      alpha = 1.0f, beta = 0.0f;
+      checkCUDNN(cudnnActivationForward(m->handle.dnn,
+                                        m->actiDesc,
+                                        &alpha,
+                                        m->resultTensorDesc2,
+                                        m->batch_outputs2[0],
+                                        &beta,
+                                        m->resultTensorDesc2,
+                                        m->batch_outputs2[0]));
+    }
   }
 }
 
@@ -713,6 +847,8 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                              num_chosen_experts,
                                              data_dim,
                                              out_dim,
+                                             m->experts_num_layers,
+                                             m->experts_internal_dim_size,
                                              use_bias,
                                              m->sorted_indices,
                                              m->expert_start_indexes,
@@ -724,8 +860,10 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                              m->token_idx_array,
                                              weights,
                                              biases,
-                                             m->weight_idx_array,
-                                             m->bias_idx_array,
+                                             m->weight_idx_array1,
+                                             m->weight_idx_array2,
+                                             m->bias_idx_array1,
+                                             m->bias_idx_array2,
                                              topk_gate_preds,
                                              m->coefficient_idx_array,
                                              m->output_idx_array);
@@ -1049,13 +1187,18 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
 #endif
 
   experts_forward_GemmBatched_kernel(m,
-                                     (void const **)m->weight_idx_array,
+                                     (void const **)m->weight_idx_array1,
+                                     (void const **)m->weight_idx_array2,
                                      (void const **)m->token_idx_array,
-                                     (void **)m->dev_batch_outputs,
-                                     (void const **)m->bias_idx_array,
+                                     (void **)m->dev_batch_outputs1,
+                                     (void **)m->dev_batch_outputs2,
+                                     (void const **)m->bias_idx_array1,
+                                     (void const **)m->bias_idx_array2,
                                      activation,
                                      data_dim,
                                      out_dim,
+                                     m->experts_num_layers,
+                                     m->experts_internal_dim_size,
                                      num_tokens,
                                      num_chosen_experts,
                                      gemm_batch_count,
@@ -1073,7 +1216,9 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                                gemm_batch_count,
                                                out_dim,
                                                output,
-                                               m->dev_batch_outputs,
+                                               m->experts_num_layers == 1
+                                                   ? m->dev_batch_outputs1
+                                                   : m->dev_batch_outputs2,
                                                m->coefficient_idx_array,
                                                m->output_idx_array);
 
@@ -1093,6 +1238,8 @@ ExpertsMeta::ExpertsMeta(FFHandler handler,
                          int _experts_start_idx,
                          int _data_dim,
                          int _out_dim,
+                         int _experts_num_layers,
+                         int _experts_internal_dim_size,
                          int _effective_batch_size,
                          int _num_chosen_experts,
                          float _alpha,
@@ -1100,7 +1247,9 @@ ExpertsMeta::ExpertsMeta(FFHandler handler,
                          ActiMode _activation)
     : OpMeta(handler), num_experts(_num_experts),
       experts_start_idx(_experts_start_idx), data_dim(_data_dim),
-      out_dim(_out_dim), effective_batch_size(_effective_batch_size),
+      out_dim(_out_dim), experts_num_layers(_experts_num_layers),
+      experts_internal_dim_size(_experts_internal_dim_size),
+      effective_batch_size(_effective_batch_size),
       num_chosen_experts(_num_chosen_experts), alpha(_alpha),
       use_bias(_use_bias), activation(_activation) {
   expert_capacity =
@@ -1131,10 +1280,10 @@ ExpertsMeta::ExpertsMeta(FFHandler handler,
       cudaMalloc(&token_idx_array,
                  num_chosen_experts * effective_batch_size * sizeof(float *)));
   checkCUDA(
-      cudaMalloc(&weight_idx_array,
+      cudaMalloc(&weight_idx_array1,
                  num_chosen_experts * effective_batch_size * sizeof(float *)));
   checkCUDA(
-      cudaMalloc(&bias_idx_array,
+      cudaMalloc(&bias_idx_array1,
                  num_chosen_experts * effective_batch_size * sizeof(float *)));
   checkCUDA(
       cudaMalloc(&coefficient_idx_array,
@@ -1142,25 +1291,54 @@ ExpertsMeta::ExpertsMeta(FFHandler handler,
   checkCUDA(
       cudaMalloc(&output_idx_array,
                  num_chosen_experts * effective_batch_size * sizeof(float *)));
-  batch_outputs = new float *[num_chosen_experts * effective_batch_size];
-  checkCUDA(cudaMalloc(&batch_outputs[0],
-                       out_dim * num_chosen_experts * effective_batch_size *
-                           sizeof(float)));
-  checkCUDA(cudaMemset(batch_outputs[0],
+  batch_outputs1 = new float *[num_chosen_experts * effective_batch_size];
+  int batch_outputs1_dim =
+      (experts_num_layers == 1) ? out_dim : experts_internal_dim_size;
+  checkCUDA(cudaMalloc(&batch_outputs1[0],
+                       batch_outputs1_dim * num_chosen_experts *
+                           effective_batch_size * sizeof(float)));
+  checkCUDA(cudaMemset(batch_outputs1[0],
                        0,
-                       out_dim * num_chosen_experts * effective_batch_size *
-                           sizeof(float)));
+                       batch_outputs1_dim * num_chosen_experts *
+                           effective_batch_size * sizeof(float)));
   for (int i = 1; i < num_chosen_experts * effective_batch_size; i++) {
-    batch_outputs[i] = batch_outputs[i - 1] + out_dim;
+    batch_outputs1[i] = batch_outputs1[i - 1] + batch_outputs1_dim;
   }
   checkCUDA(
-      cudaMalloc(&dev_batch_outputs,
+      cudaMalloc(&dev_batch_outputs1,
                  num_chosen_experts * effective_batch_size * sizeof(float *)));
   checkCUDA(
-      cudaMemcpy(dev_batch_outputs,
-                 batch_outputs,
+      cudaMemcpy(dev_batch_outputs1,
+                 batch_outputs1,
                  num_chosen_experts * effective_batch_size * sizeof(float *),
                  cudaMemcpyHostToDevice));
+  if (experts_num_layers == 2) {
+    checkCUDA(cudaMalloc(&weight_idx_array2,
+                         num_chosen_experts * effective_batch_size *
+                             sizeof(float *)));
+    checkCUDA(cudaMalloc(&bias_idx_array2,
+                         num_chosen_experts * effective_batch_size *
+                             sizeof(float *)));
+    batch_outputs2 = new float *[num_chosen_experts * effective_batch_size];
+    checkCUDA(cudaMalloc(&batch_outputs2[0],
+                         out_dim * num_chosen_experts * effective_batch_size *
+                             sizeof(float)));
+    checkCUDA(cudaMemset(batch_outputs2[0],
+                         0,
+                         out_dim * num_chosen_experts * effective_batch_size *
+                             sizeof(float)));
+    for (int i = 1; i < num_chosen_experts * effective_batch_size; i++) {
+      batch_outputs2[i] = batch_outputs2[i - 1] + out_dim;
+    }
+    checkCUDA(cudaMalloc(&dev_batch_outputs2,
+                         num_chosen_experts * effective_batch_size *
+                             sizeof(float *)));
+    checkCUDA(
+        cudaMemcpy(dev_batch_outputs2,
+                   batch_outputs2,
+                   num_chosen_experts * effective_batch_size * sizeof(float *),
+                   cudaMemcpyHostToDevice));
+  }
   // Bias
   float *dram_one_ptr = (float *)malloc(sizeof(float) * 1);
   for (int i = 0; i < 1; i++) {
@@ -1183,7 +1361,10 @@ ExpertsMeta::ExpertsMeta(FFHandler handler,
   }
   // Activation
   checkCUDNN(cudnnCreateActivationDescriptor(&actiDesc));
-  checkCUDNN(cudnnCreateTensorDescriptor(&resultTensorDesc));
+  checkCUDNN(cudnnCreateTensorDescriptor(&resultTensorDesc1));
+  if (experts_num_layers == 2) {
+    checkCUDNN(cudnnCreateTensorDescriptor(&resultTensorDesc2));
+  }
   if (use_activation(activation)) {
     cudnnActivationMode_t mode;
     switch (activation) {
@@ -1199,15 +1380,36 @@ ExpertsMeta::ExpertsMeta(FFHandler handler,
     }
     checkCUDNN(
         cudnnSetActivationDescriptor(actiDesc, mode, CUDNN_PROPAGATE_NAN, 0.0));
-    checkCUDNN(
-        cudnnSetTensor4dDescriptor(resultTensorDesc,
-                                   CUDNN_TENSOR_NCHW,
-                                   // CUDNN_DATA_FLOAT,
-                                   cuda_to_cudnn_datatype(CUDA_R_32F),
-                                   num_chosen_experts * effective_batch_size,
-                                   out_dim,
-                                   1,
-                                   1));
+    if (experts_num_layers == 1) {
+      checkCUDNN(
+          cudnnSetTensor4dDescriptor(resultTensorDesc1,
+                                     CUDNN_TENSOR_NCHW,
+                                     // CUDNN_DATA_FLOAT,
+                                     cuda_to_cudnn_datatype(CUDA_R_32F),
+                                     num_chosen_experts * effective_batch_size,
+                                     out_dim,
+                                     1,
+                                     1));
+    } else {
+      checkCUDNN(
+          cudnnSetTensor4dDescriptor(resultTensorDesc1,
+                                     CUDNN_TENSOR_NCHW,
+                                     // CUDNN_DATA_FLOAT,
+                                     cuda_to_cudnn_datatype(CUDA_R_32F),
+                                     num_chosen_experts * effective_batch_size,
+                                     experts_internal_dim_size,
+                                     1,
+                                     1));
+      checkCUDNN(
+          cudnnSetTensor4dDescriptor(resultTensorDesc2,
+                                     CUDNN_TENSOR_NCHW,
+                                     // CUDNN_DATA_FLOAT,
+                                     cuda_to_cudnn_datatype(CUDA_R_32F),
+                                     num_chosen_experts * effective_batch_size,
+                                     out_dim,
+                                     1,
+                                     1));
+    }
   }
 }
 ExpertsMeta::~ExpertsMeta(void) {
@@ -1221,19 +1423,25 @@ ExpertsMeta::~ExpertsMeta(void) {
   checkCUDA(cudaFree(num_assignments_per_expert));
   checkCUDA(cudaFree(destination_start_indices));
   checkCUDA(cudaFree(token_idx_array));
-  checkCUDA(cudaFree(weight_idx_array));
+  checkCUDA(cudaFree(weight_idx_array1));
+  checkCUDA(cudaFree(weight_idx_array2));
   checkCUDA(cudaFree(coefficient_idx_array));
   checkCUDA(cudaFree(output_idx_array));
-  checkCUDA(cudaFree(dev_batch_outputs));
-  checkCUDA(cudaFree(bias_idx_array));
-  checkCUDA(cudaFree(batch_outputs[0]));
-  delete[] batch_outputs;
+  checkCUDA(cudaFree(dev_batch_outputs1));
+  checkCUDA(cudaFree(dev_batch_outputs2));
+  checkCUDA(cudaFree(bias_idx_array1));
+  checkCUDA(cudaFree(bias_idx_array2));
+  checkCUDA(cudaFree(batch_outputs1[0]));
+  checkCUDA(cudaFree(batch_outputs2[0]));
+  delete[] batch_outputs1;
+  delete[] batch_outputs2;
   // Bias
   checkCUDA(cudaFree((void *)one_ptr));
   checkCUDA(cudaFree((void *)one_ptr_array));
   // Activation
   checkCUDNN(cudnnDestroyActivationDescriptor(actiDesc));
-  checkCUDNN(cudnnDestroyTensorDescriptor(resultTensorDesc));
+  checkCUDNN(cudnnDestroyTensorDescriptor(resultTensorDesc1));
+  checkCUDNN(cudnnDestroyTensorDescriptor(resultTensorDesc2));
 }
 
 }; // namespace FlexFlow

From 1d6d03a94d484a5005bec2534c075d4c6f2634c5 Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Sat, 29 Apr 2023 21:58:08 -0400
Subject: [PATCH 098/344] new batch (#695)

* new batch

* v2 dataloader for testing new batchconfig in llama

* finish the change and test

* finish impl + debugging

* value field in PerTokenInfo

* fix

* cleanup

* fix bug

* Update cpp_gpu_tests.sh

---------

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
Co-authored-by: Gabriele Oliaro <ict@gabrieleoliaro.it>
---
 examples/cpp/inference/LLAMA/dataloader.cc    |  63 +++----
 examples/cpp/inference/LLAMA/dataloader.cu    |  47 +++--
 examples/cpp/inference/LLAMA/llama.h          |   4 +-
 examples/cpp/inference/dataloader.cc          |  57 ++----
 examples/cpp/inference/dataloader.cu          |  66 +++----
 examples/cpp/inference/dataloader.h           |   2 +-
 include/flexflow/batch_config.h               |  38 ++--
 .../ops/inc_multihead_self_attention.h        |   4 +-
 src/ops/inc_multihead_self_attention.cu       |  72 ++++----
 src/runtime/batch_config.cc                   | 174 +++++-------------
 src/runtime/inference_manager.cc              |   1 +
 tests/cpp_gpu_tests.sh                        |   1 +
 12 files changed, 201 insertions(+), 328 deletions(-)

diff --git a/examples/cpp/inference/LLAMA/dataloader.cc b/examples/cpp/inference/LLAMA/dataloader.cc
index a09230029f..fa69324a96 100644
--- a/examples/cpp/inference/LLAMA/dataloader.cc
+++ b/examples/cpp/inference/LLAMA/dataloader.cc
@@ -1,3 +1,4 @@
+
 #include "llama.h"
 #include <random>
 
@@ -84,22 +85,8 @@ void DataLoader::next_batch(FFModel &ff,
     Domain domain =
         runtime->get_index_space_domain(ctx, batch_input->parallel_is);
     ArgumentMap argmap;
-    // int idx = next_index;
-    // for (Domain::DomainPointIterator it(domain); it; it++) {
-    //   SampleIdxs meta;
-    //   assert(ff.config.batchSize % batch_input->dims[1].size == 0);
-    //   meta.num_samples = ff.config.batchSize / batch_input->dims[2].size;
-    //   for (int i = 0; i < meta.num_samples; i++) {
-    //     meta.idxs[i] = idx++;
-    //     meta.token_idx = next_token_idx;
-    //     meta.batch_idx = next_batch_index;
-    //   }
-
-    //   argmap.set_point(*it, TaskArgument(&meta, sizeof(SampleIdxs)));
-    // }
-
-    DataLoaderNextBatchInput next_batch_input = {bc->token2ids,
-                                                 batch_predictions};
+
+    DataLoaderNextBatchInput next_batch_input = {bc, batch_predictions};
     DataLoaderNextBatchInput const *ptr = &next_batch_input;
     size_t next_batch_input_sz = sizeof(next_batch_input);
     assert(ptr->prev_batch_preds.size() == batch_predictions.size());
@@ -217,11 +204,6 @@ void DataLoader::load_attention_weights(T *ptr,
 
     for (int i = 0; i < 32; i++) {
       size_t start_index = i * one_head_size * 4 + file_index * one_head_size;
-      // if (file_index == 3) {
-      //   printf("print wo start index %d, data %.10f\n",
-      //          start_index,
-      //          host_array.at(data_index));
-      // }
       for (size_t j = start_index; j < start_index + one_head_size; j++) {
         ptr[j] = host_array.at(data_index);
         data_index += 1;
@@ -237,38 +219,35 @@ void DataLoader::load_attention_weights(T *ptr,
 void DataLoader::store_outputs(BatchConfig *bc,
                                InferenceResult const &ir,
                                std::map<size_t, long> &batch_predictions) {
-  assert(bc->token2ids.num_samples == bc->num_active_tokens() &&
-         bc->token2ids.num_samples <= bc->MAX_NUM_TOKENS);
 
   std::cout << "store outputs...." << std::endl;
   batch_predictions.clear();
-  size_t guid = bc->token2ids.guids[0];
-  size_t start_idx = bc->token2ids.token_indexes[0].token_position;
-
-  for (size_t i = 0; i <= bc->token2ids.num_samples; i++) {
-    if (i == bc->token2ids.num_samples || bc->token2ids.guids[i] != guid) {
-      // see how many tokens has been put to model in this req
-      // to get the index of the final token
-      int result_index =
-          bc->token2ids.token_indexes[i - 1].token_position - start_idx;
+
+  // size_t guid = bc->tokensInfo[0].guid;
+  size_t guid = bc->requestsInfo[bc->tokensInfo[0].request_index].guid;
+
+  size_t start_idx = bc->tokensInfo[0].abs_depth_in_request;
+
+  // only store the last token of each req
+  for (size_t i = 0; i <= bc->num_active_tokens(); i++) {
+    size_t current_guid =
+        bc->requestsInfo[bc->tokensInfo[i].request_index].guid;
+    if (i == bc->num_active_tokens() || current_guid != guid) {
+
+      int result_index = bc->tokensInfo[i - 1].abs_depth_in_request - start_idx;
       batch_predictions[guid] = ir.results[i - 1];
+
       std::cout << "i: " << i << ", dds-" << guid << ", result index"
                 << result_index << ", result value: " << batch_predictions[guid]
                 << "\n";
 
-      if (i < bc->token2ids.num_samples) {
-        guid = bc->token2ids.guids[i];
-        start_idx = bc->token2ids.token_indexes[i].token_position;
+      if (i < bc->num_active_tokens()) {
+        guid = bc->requestsInfo[bc->tokensInfo[i].request_index].guid;
+        start_idx = bc->tokensInfo[i].abs_depth_in_request;
       }
     }
   }
-  // bc->print();
-  // for (size_t i = 0; i < bc->num_active_requests(); i++) {
-  //   batch_predictions[i] = ir.results[i];
-  //   std::cout << "i: " << i << ", ith pred: " << i
-  //             << ", value: " << batch_predictions[i]
-  //             << std::endl;
-  // }
+
   assert(batch_predictions.size() == bc->num_active_requests());
 }
 
diff --git a/examples/cpp/inference/LLAMA/dataloader.cu b/examples/cpp/inference/LLAMA/dataloader.cu
index f2480c8592..4fea090b63 100644
--- a/examples/cpp/inference/LLAMA/dataloader.cu
+++ b/examples/cpp/inference/LLAMA/dataloader.cu
@@ -24,11 +24,11 @@ void DataLoader::load_input(Task const *task,
   LLAMAConfig llamaconfig;
   assert(regions.size() == 2);
   assert(task->regions.size() == 2);
-  //   SampleIdxs *meta = (SampleIdxs *)task->local_args;
 
   DataLoaderNextBatchInput const input_struct =
       *((DataLoaderNextBatchInput *)task->args);
-  BatchConfig::SampleIdxs const &meta = input_struct.meta;
+  BatchConfig *bc = input_struct.bc;
+
   std::map<size_t, long> const &prev_batch_preds =
       input_struct.prev_batch_preds;
 
@@ -50,38 +50,33 @@ void DataLoader::load_input(Task const *task,
   coord_t batch_size =
       batch_input_domain.hi()[1] - batch_input_domain.lo()[1] + 1;
 
-  // copy 1 token from each batch
-  //  FIXME: currently assume continous indices
-  size_t guid = meta.guids[0];
-  size_t start_idx = meta.token_indexes[0].token_position;
+  size_t guid = bc->requestsInfo[bc->tokensInfo[0].request_index].guid;
+  size_t start_idx = bc->tokensInfo[0].abs_depth_in_request;
   size_t dst_idx = 0;
 
-  std::cout << "num samples " << meta.num_samples << "\n";
-
-  for (size_t i = 0; i <= meta.num_samples; i++) {
-
-    // if the first token in one request
-    if (i == meta.num_samples || meta.guids[i] != guid) {
+  for (int i = 0; i <= bc->num_active_tokens(); i++) {
+    size_t current_guid =
+        bc->requestsInfo[bc->tokensInfo[i].request_index].guid;
+    if (i == bc->num_active_tokens() || current_guid != guid) {
       size_t tokens_to_copy =
-          (meta.token_indexes[i - 1].token_position - start_idx + 1);
-      std::cout << "size to copy:  " << tokens_to_copy << "\n";
+          (bc->tokensInfo[i - 1].abs_depth_in_request - start_idx + 1);
+
+      size_t request_index = bc->tokensInfo[i - 1].request_index;
+      size_t token_start_offset =
+          bc->requestsInfo[request_index].token_start_offset;
 
-      if (tokens_to_copy > 1 || meta.token_indexes[i - 1].token_position <
-                                    meta.token_indexes[i - 1].initial_length) {
+      std::cout << "size to copy:  " << tokens_to_copy
+                << ", start offset: " << token_start_offset << "\n";
+      if (tokens_to_copy > 1 || token_start_offset == 0) {
         // token pos < init length, the init length is the input sentence length
         // so this is the initial input, load from file.
-
         size_t copy_start_index = guid * llamaconfig.sentence_len;
         std::cout << "copy index:  " << copy_start_index << "\n";
         copy_kernel<<<GET_BLOCKS(tokens_to_copy), CUDA_NUM_THREADS>>>(
             batch_input.ptr + dst_idx,
             full_input.ptr + copy_start_index,
             tokens_to_copy);
-
         std::cout << "------------req---------------: " << guid << "\n";
-        if (guid == 0) {
-          std::cout << "guid: " << meta.guids[i] << ", i: " << i << std::endl;
-        }
         for (int i = 0; i < 8; i++) {
           std::cout << "value: " << full_input.ptr[copy_start_index + i]
                     << std::endl;
@@ -92,17 +87,17 @@ void DataLoader::load_input(Task const *task,
         // for token by token generating, get token from the previous inference.
 
         long token = prev_batch_preds.at(guid);
-        std::cout << "next iter  " << meta.token_indexes[i - 1].token_position
+
+        std::cout << "next iter  " << bc->tokensInfo[i - 1].abs_depth_in_request
                   << ", dst_idx: " << dst_idx << ", token:" << token << "\n";
         long *dst_ptr = batch_input.ptr + dst_idx;
 
         cudaMemcpy(dst_ptr, &token, sizeof(long), cudaMemcpyHostToDevice);
       }
 
-      // update for next req
-      if (i < meta.num_samples) {
-        guid = meta.guids[i];
-        start_idx = meta.token_indexes[i].token_position;
+      if (i < bc->num_active_tokens()) {
+        guid = bc->requestsInfo[bc->tokensInfo[i].request_index].guid;
+        start_idx = bc->tokensInfo[i].abs_depth_in_request;
       }
       dst_idx = i;
     }
diff --git a/examples/cpp/inference/LLAMA/llama.h b/examples/cpp/inference/LLAMA/llama.h
index 17300f6d0d..978eb2bf10 100644
--- a/examples/cpp/inference/LLAMA/llama.h
+++ b/examples/cpp/inference/LLAMA/llama.h
@@ -13,6 +13,7 @@
  * limitations under the License.
  */
 
+#include "flexflow/inference.h"
 #include "flexflow/model.h"
 #define MAX_NUM_SAMPLES 65536
 #define MAX_TOKEN_LEN 32000
@@ -102,6 +103,7 @@ struct SampleIdxs {
 };
 
 struct DataLoaderNextBatchInput {
-  BatchConfig::SampleIdxs const &meta;
+  // BatchConfig::SampleIdxs const &meta;
+  BatchConfig *bc;
   std::map<size_t, long> const &prev_batch_preds;
 };
diff --git a/examples/cpp/inference/dataloader.cc b/examples/cpp/inference/dataloader.cc
index 36f99718c3..67bcbdb648 100644
--- a/examples/cpp/inference/dataloader.cc
+++ b/examples/cpp/inference/dataloader.cc
@@ -136,20 +136,11 @@ void DataLoader::next_batch(FFModel &ff,
     }
     int batch_size = batch_input[bid]->dims[input_dims - 2].size;
     int seq_len = batch_input[bid]->dims[input_dims - 3].size;
-    /* printf("ff.config.batchSize: %i, batch_size: %i, seq_len: %i,
-       num_active_tokens: %i\n", ff.config.batchSize, batch_size, seq_len,
-       num_active_tokens); */
+
     assert(ff.config.batchSize == batch_size &&
            batch_size * seq_len >= num_active_tokens);
 
-    /* std::cout << "About to call next_batch function..." << std::endl;
-    bc->print();
-    std::cout << "batch_predictions: ";
-    for (const auto& elem : batch_predictions){
-        std::cout << elem.first << ":" << elem.second << ", ";
-    } */
-    DataLoaderNextBatchInput next_batch_input = {bc->token2ids,
-                                                 batch_predictions};
+    DataLoaderNextBatchInput next_batch_input = {bc, batch_predictions};
     DataLoaderNextBatchInput const *ptr = &next_batch_input;
     size_t next_batch_input_sz = sizeof(next_batch_input);
     assert(ptr->prev_batch_preds.size() == batch_predictions.size());
@@ -184,41 +175,23 @@ void DataLoader::next_batch(FFModel &ff,
 void DataLoader::store_outputs(BatchConfig *bc,
                                InferenceResult const &ir,
                                std::map<size_t, int> &batch_predictions) {
-  assert(bc->token2ids.num_samples == bc->num_active_tokens() &&
-         bc->token2ids.num_samples <= bc->MAX_NUM_TOKENS);
+  assert((bc->num_active_tokens() == 0) == (bc->num_active_requests() == 0));
+  if (bc->num_active_tokens() == 0) {
+    return;
+  }
+  // there is no num_samples, replace it with num_active_tokens
   batch_predictions.clear();
-  // bc->print();
-  for (size_t i = 0; i < bc->token2ids.num_samples; i++) {
-    if (i == bc->token2ids.num_samples - 1 ||
-        bc->token2ids.guids[i] != bc->token2ids.guids[i + 1]) {
-      assert(bc->token2ids.token_indexes[i].token_position ==
-             bc->token_last_available_idx[bc->token2ids.token_indexes[i]
-                                              .request_index]);
-      if (outputs.find(bc->token2ids.guids[i]) == outputs.end()) {
+  for (size_t i = 0; i < bc->num_active_tokens(); i++) {
+    size_t guid = bc->requestsInfo[bc->tokensInfo[i].request_index].guid;
+    if (i == bc->num_active_tokens() - 1 ||
+        guid != bc->requestsInfo[bc->tokensInfo[i + 1].request_index].guid) {
+      if (outputs.find(guid) == outputs.end()) {
         std::vector<int> v{ir.results[i]};
-        outputs[bc->token2ids.guids[i]] = v;
+        outputs[guid] = v;
       } else {
-        outputs[bc->token2ids.guids[i]].push_back(ir.results[i]);
+        outputs[guid].push_back(ir.results[i]);
       }
-      /* std::cout << "outputs: ";
-      for(const auto& elem : outputs){
-        std::cout << elem.first << ": [";
-        for (const auto &vel : elem.second) {
-          std::cout << vel << " ";
-        }
-        std::cout << "]" << std::endl;
-      } */
-      // std::cout << "outputs[bc->token2ids.guids[i]].size(): " <<
-      // outputs[bc->token2ids.guids[i]].size() << std::endl; std::cout << "i: "
-      // << i << std::endl; std::cout <<
-      // "bc->token2ids.token_indexes[i].token_position: " <<
-      // bc->token2ids.token_indexes[i].token_position << std::endl; std::cout
-      // << "bc->token2ids.token_indexes[i].initial_length: " <<
-      // bc->token2ids.token_indexes[i].initial_length << std::endl;
-      assert(outputs[bc->token2ids.guids[i]].size() ==
-             (bc->token2ids.token_indexes[i].token_position + 1) -
-                 (bc->token2ids.token_indexes[i].initial_length - 1));
-      batch_predictions[bc->token2ids.guids[i]] = ir.results[i];
+      batch_predictions[guid] = ir.results[i];
     }
   }
   assert(batch_predictions.size() == bc->num_active_requests());
diff --git a/examples/cpp/inference/dataloader.cu b/examples/cpp/inference/dataloader.cu
index 8dcb8c3ab7..80c53f175a 100644
--- a/examples/cpp/inference/dataloader.cu
+++ b/examples/cpp/inference/dataloader.cu
@@ -25,10 +25,13 @@ void DataLoader::load_input(Task const *task,
 
   DataLoaderNextBatchInput const input_struct =
       *((DataLoaderNextBatchInput *)task->args);
-  BatchConfig::SampleIdxs const &meta = input_struct.meta;
+
+  BatchConfig *bc = input_struct.bc;
+  BatchConfig::PerRequestInfo *requestInfo = bc->requestsInfo;
+  BatchConfig::PerTokenInfo *tokensInfo = bc->tokensInfo;
   std::map<size_t, int> const &prev_batch_preds = input_struct.prev_batch_preds;
 
-  if (meta.num_samples == 0) {
+  if (bc->num_active_tokens() == 0) {
     return;
   }
   int const *full_input_ptr = helperGetTensorPointerRO<int>(
@@ -55,11 +58,13 @@ void DataLoader::load_input(Task const *task,
   assert(batch_size <= full_input_batch_size);
 
   // Currently assume continous indices
-  assert(meta.num_samples <= batch_size * sequence_length);
-  for (int i = 1; i < meta.num_samples; i++) {
-    if (meta.guids[i] == meta.guids[i - 1]) {
-      assert(meta.token_indexes[i].token_position ==
-             meta.token_indexes[i - 1].token_position + 1);
+  assert(bc->num_active_tokens() <= batch_size * sequence_length);
+  for (int i = 1; i < bc->num_active_tokens(); i++) {
+    size_t prev_guid = requestInfo[tokensInfo[i - 1].request_index].guid;
+    size_t guid = requestInfo[tokensInfo[i].request_index].guid;
+    if (guid == prev_guid) {
+      assert(tokensInfo[i].abs_depth_in_request ==
+             tokensInfo[i - 1].abs_depth_in_request + 1);
     }
   }
   // keep things simple for now
@@ -69,22 +74,28 @@ void DataLoader::load_input(Task const *task,
   checkCUDA(cudaMemset(
       batch_input_ptr, 0, batch_input_domain.get_volume() * sizeof(int)));
 
-  size_t guid = meta.guids[0];
-  size_t start_idx = meta.token_indexes[0].token_position;
+  size_t guid = requestInfo[tokensInfo[0].request_index].guid;
+  size_t start_idx = tokensInfo[0].abs_depth_in_request;
   size_t dst_idx = 0;
   size_t total_tokens = 0;
-  for (size_t i = 1; i <= meta.num_samples; i++) {
-    if (i == meta.num_samples || meta.guids[i] != guid) {
+
+  for (size_t i = 1; i <= bc->num_active_tokens(); i++) {
+    size_t current_guid = requestInfo[tokensInfo[i].request_index].guid;
+    if (i == bc->num_active_tokens() || current_guid != guid) {
 
       size_t tokens_to_copy =
-          (meta.token_indexes[i - 1].token_position - start_idx + 1);
-      // size_t size_to_copy = token_dim * tokens_to_copy;
+          (tokensInfo[i - 1].abs_depth_in_request - start_idx + 1);
       assert(tokens_to_copy > 0);
-      if (tokens_to_copy > 1 || meta.token_indexes[i - 1].token_position <
-                                    meta.token_indexes[i - 1].initial_length) {
+
+      size_t request_index = tokensInfo[i - 1].request_index;
+      size_t token_start_offset =
+          bc->requestsInfo[request_index].token_start_offset;
+      size_t num_processing_tokens =
+          bc->requestsInfo[request_index].num_tokens_in_batch;
+      if (tokens_to_copy > 1 || token_start_offset == 0) {
         // initialization phase
-        assert(meta.token_indexes[i - 1].token_position <
-               meta.token_indexes[i - 1].initial_length);
+        assert(tokensInfo[i - 1].abs_depth_in_request <
+               (token_start_offset + num_processing_tokens));
         int const *input_zc =
             full_input_ptr + (guid * sequence_length) + start_idx;
         int *dst_ptr = batch_input_ptr + dst_idx;
@@ -92,35 +103,24 @@ void DataLoader::load_input(Task const *task,
             dst_ptr, input_zc, tokens_to_copy);
       } else {
         // incremental phase
-        assert(meta.token_indexes[i - 1].token_position >=
-               meta.token_indexes[i - 1].initial_length);
+        assert(tokensInfo[i - 1].abs_depth_in_request >= token_start_offset);
         assert(tokens_to_copy == 1);
 
-        /* std::cout << "Looking for guid: " << guid << std::endl;
-        std::cout << "prev_batch_preds: ";
-        for (const auto& elem : prev_batch_preds){
-            std::cout << elem.first << ":" << elem.second << ", ";
-        }
-        std::cout << std::endl; */
         assert(prev_batch_preds.find(guid) != prev_batch_preds.end());
         int token = prev_batch_preds.at(guid);
         int *dst_ptr = batch_input_ptr + dst_idx;
         cudaMemcpy(dst_ptr, &token, sizeof(int), cudaMemcpyHostToDevice);
-        // copy_kernel<<<GET_BLOCKS(tokens_to_copy),
-        // CUDA_NUM_THREADS>>>(dst_ptr, &token, tokens_to_copy);
-        //  cudaMemcpyAsync(batch_input_ptr + dst_idx * token_dim, &token, 1,
-        //  cudaMemcpyHostToDevice);
       }
       total_tokens += tokens_to_copy;
 
-      if (i < meta.num_samples) {
-        guid = meta.guids[i];
-        start_idx = meta.token_indexes[i].token_position;
+      if (i < bc->num_active_tokens()) {
+        guid = bc->requestsInfo[bc->tokensInfo[i].request_index].guid;
+        start_idx = tokensInfo[i].abs_depth_in_request;
       }
       dst_idx = i;
     }
   }
-  assert(total_tokens == meta.num_samples);
+  assert(total_tokens == bc->num_active_tokens());
   /*printf("token_dim: %lli, sequence_length: %lli, batch_size: %lli\n",
   token_dim, sequence_length, batch_size); printf("total_tokens: %lu\n",
   total_tokens); printf("guid: %lu\n", guid);
diff --git a/examples/cpp/inference/dataloader.h b/examples/cpp/inference/dataloader.h
index afb45801d1..c77c70502a 100644
--- a/examples/cpp/inference/dataloader.h
+++ b/examples/cpp/inference/dataloader.h
@@ -62,7 +62,7 @@ class DataLoader {
     DataGenerator &_data_generator;
   };
   struct DataLoaderNextBatchInput {
-    BatchConfig::SampleIdxs const &meta;
+    BatchConfig *bc;
     std::map<size_t, int> const &prev_batch_preds;
   };
 };
diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 17ed9d18e8..674fac4ced 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -44,39 +44,25 @@ class BatchConfig {
   void print() const;
   static int const MAX_NUM_REQUESTS = MAX_REQUESTS;
   static int const MAX_NUM_TOKENS = InferenceResult::MAX_NUM_TOKENS;
-  // static int const MAX_SEQUENCE_LENGTH = MAX_SEQ_LEN;
+
   //  These are set by update
   int num_tokens, num_requests;
   bool cached_results;
-  int token_start_idx[MAX_NUM_REQUESTS]; // index of first token in a request
-                                         // that should be processed in the
-                                         // current batch/iteration
-  int token_last_available_idx
-      [MAX_NUM_REQUESTS]; // last valid token index in a request. This includes
-                          // both the prompt and generated tokens
-  int num_processing_tokens[MAX_NUM_REQUESTS]; // a request's number of tokens
-                                               // being processed in the current
-                                               // batch/iteration
-  size_t initial_length[MAX_NUM_REQUESTS];
-  size_t max_sequence_length[MAX_NUM_REQUESTS];
 
-  struct token_idxs {
-    size_t request_index;  // the index within the BatchConfig of the request
-                           // that the token belongs to
-    size_t token_position; // the index indicating the position of each token
-                           // within its request
-    size_t initial_length;
+  struct PerRequestInfo {
+    size_t token_start_offset;
+    size_t num_tokens_in_batch;
+    size_t guid;
   };
-
-  struct SampleIdxs {
-    size_t num_samples;
-    size_t guids[InferenceResult::MAX_NUM_TOKENS]; // the guid of the request
-                                                   // each token belongs to
-    token_idxs token_indexes[InferenceResult::MAX_NUM_TOKENS];
+  struct PerTokenInfo {
+    size_t abs_depth_in_request;
+    size_t request_index;
+    size_t value;
   };
+  PerRequestInfo requestsInfo[MAX_NUM_REQUESTS];
+  PerTokenInfo tokensInfo[MAX_NUM_TOKENS];
 
-  SampleIdxs token2ids;
-  size_t request_guid[MAX_NUM_REQUESTS];
+  size_t max_sequence_length[MAX_NUM_REQUESTS];
   bool request_completed[MAX_NUM_REQUESTS];
 };
 
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index 8daafd8565..e781da9cf5 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -138,7 +138,9 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
   float *attn_heads, *W_out_contiguous;
   // void *reserveSpace;
 
-  BatchConfig::token_idxs *dev_token2ids;
+  // BatchConfig::token_idxs *dev_token2ids;
+
+  BatchConfig::PerTokenInfo *token_infos;
 };
 
 }; // namespace FlexFlow
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 8b53f047c0..0fdecfe6d6 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -40,17 +40,18 @@ __global__ void build_w_out_tensor(float const *weight_ptr,
   }
 }
 
-__global__ void apply_rotary_embedding(float *input_ptr,
-                                       cuFloatComplex *complex_input,
-                                       BatchConfig::token_idxs const *id_map,
-                                       int qProjSize,
-                                       int kProjSize,
-                                       int num_heads,
-                                       int num_tokens,
-                                       int q_block_size,
-                                       int k_block_size,
-                                       int v_block_size,
-                                       bool q_tensor) {
+__global__ void
+    apply_rotary_embedding(float *input_ptr,
+                           cuFloatComplex *complex_input,
+                           BatchConfig::PerTokenInfo const *tokenInfos,
+                           int qProjSize,
+                           int kProjSize,
+                           int num_heads,
+                           int num_tokens,
+                           int q_block_size,
+                           int k_block_size,
+                           int v_block_size,
+                           bool q_tensor) {
   int proj_size = q_tensor ? qProjSize : kProjSize;
   CUDA_KERNEL_LOOP(i, num_tokens * proj_size * num_heads / 2) {
     // create complex number
@@ -72,7 +73,8 @@ __global__ void apply_rotary_embedding(float *input_ptr,
     //  int head_idx = i / (num_tokens * proj_size);
     int token_idx =
         (i - head_idx * (num_tokens * proj_size / 2)) / (proj_size / 2);
-    size_t pos = id_map[token_idx].token_position;
+    // size_t pos = id_map[token_idx].token_position;
+    size_t pos = tokenInfos[token_idx].abs_depth_in_request;
 
     // float before_real = complex_input[i].x, before_complex =
     // complex_input[i].y;
@@ -225,7 +227,7 @@ void inference_kernel1(IncMultiHeadSelfAttentionMeta const *m,
                              0,
                              stream>>>(output_ptr,
                                        complex_input,
-                                       m->dev_token2ids,
+                                       m->token_infos,
                                        m->qProjSize,
                                        m->kProjSize,
                                        m->num_heads,
@@ -240,7 +242,7 @@ void inference_kernel1(IncMultiHeadSelfAttentionMeta const *m,
                              0,
                              stream>>>(output_ptr,
                                        complex_input,
-                                       m->dev_token2ids,
+                                       m->token_infos,
                                        m->qProjSize,
                                        m->kProjSize,
                                        m->num_heads,
@@ -254,7 +256,7 @@ void inference_kernel1(IncMultiHeadSelfAttentionMeta const *m,
 
 __global__ void store_kv_cache(float const *devQKVProjArray,
                                float *cache_ptr,
-                               BatchConfig::token_idxs const *id_map,
+                               BatchConfig::PerTokenInfo const *tokenInfos,
                                int qProjSize,
                                int kProjSize,
                                int vProjSize,
@@ -275,8 +277,10 @@ __global__ void store_kv_cache(float const *devQKVProjArray,
     float val =
         devQKVProjArray[head_idx * qkv_block_size + current_head_block_size +
                         token_idx * proj_size + data_idx];
-    int const req_id = id_map[token_idx].request_index;
-    int const tok_id = id_map[token_idx].token_position;
+    // int const req_id = id_map[token_idx].request_index;
+    // int const tok_id = id_map[token_idx].token_position;
+    int const req_id = tokenInfos[token_idx].request_index;
+    int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
 
     cache_ptr[req_id * (num_heads * max_seq_len * proj_size) +
               head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
@@ -295,7 +299,7 @@ void inference_kernel2(IncMultiHeadSelfAttentionMeta const *m,
                      0,
                      stream>>>(m->devQKVProjArray,
                                m->keyCache,
-                               m->dev_token2ids,
+                               m->token_infos,
                                m->qProjSize,
                                m->kProjSize,
                                m->vProjSize,
@@ -310,7 +314,7 @@ void inference_kernel2(IncMultiHeadSelfAttentionMeta const *m,
                      0,
                      stream>>>(m->devQKVProjArray,
                                m->valueCache,
-                               m->dev_token2ids,
+                               m->token_infos,
                                m->qProjSize,
                                m->kProjSize,
                                m->vProjSize,
@@ -366,8 +370,10 @@ void inference_kernel3(IncMultiHeadSelfAttentionMeta const *m,
     if (bc->request_completed[i]) {
       continue;
     }
-    int num_new_tokens = bc->num_processing_tokens[i];
-    int total_tokens = bc->token_last_available_idx[i] + 1;
+    int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+    int total_tokens = bc->requestsInfo[i].token_start_offset +
+                       bc->requestsInfo[i].num_tokens_in_batch;
+    // bc->token_last_available_idx[i] + 1;
     // Compute (QK^T/sqrt(d_k))
     int m_ = num_new_tokens;
     int n = total_tokens;
@@ -579,16 +585,16 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
                                     m->vSize * m->vProjSize));
     *m->has_load_weights = true;
   }
+  // here because we need postion info in infernece 1
+  cudaMemcpyAsync(m->token_infos,
+                  &(bc->tokensInfo),
+                  bc->MAX_NUM_TOKENS * sizeof(BatchConfig::PerTokenInfo),
+                  cudaMemcpyHostToDevice,
+                  stream);
   // phase 1: Implement kernel to compute KQV for input tokens
   inference_kernel1(m, bc, input_ptr, weight_ptr, m->devQKVProjArray, stream);
 
   // phase 2: Update key/val cache
-  cudaMemcpyAsync(m->dev_token2ids,
-                  &(bc->token2ids.token_indexes),
-                  bc->MAX_NUM_TOKENS * sizeof(BatchConfig::token_idxs),
-                  cudaMemcpyHostToDevice,
-                  stream);
-
   inference_kernel2(m, bc, stream);
 
   // phase 3: Compute attention score
@@ -662,7 +668,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
         num_heads * kProjSize * BatchConfig::MAX_NUM_REQUESTS * MAX_SEQ_LEN;
     size_t value_cache_size =
         num_heads * vProjSize * BatchConfig::MAX_NUM_REQUESTS * MAX_SEQ_LEN;
-    size_t token2ids_size = BatchConfig::MAX_NUM_TOKENS;
+    size_t tokeninfo_size = BatchConfig::MAX_NUM_TOKENS;
     size_t qk_prod_size =
         BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_NUM_TOKENS * num_heads;
     size_t attn_heads_size =
@@ -673,9 +679,9 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
         (qkv_max_proj_size + key_cache_size + value_cache_size +
          2 * qk_prod_size + attn_heads_size + W_out_contiguous_size) *
             sizeof(float) +
-        token2ids_size *
-            sizeof(BatchConfig::token_idxs); // more components will
-                                             // be added here later
+        tokeninfo_size *
+            sizeof(BatchConfig::PerTokenInfo); // more components will
+                                               // be added here later
 
     Realm::Rect<1, coord_t> bounds(Realm::Point<1, coord_t>(0),
                                    Realm::Point<1, coord_t>(totalSize - 1));
@@ -691,8 +697,8 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     devQKVProjArray = (float *)reserveInst.pointer_untyped(0, sizeof(char));
     keyCache = (float *)devQKVProjArray + qkv_max_proj_size;
     valueCache = (float *)keyCache + key_cache_size;
-    dev_token2ids = (BatchConfig::token_idxs *)(valueCache + value_cache_size);
-    qk_prods = (float *)(dev_token2ids + token2ids_size);
+    token_infos = (BatchConfig::PerTokenInfo *)(valueCache + value_cache_size);
+    qk_prods = (float *)(token_infos + tokeninfo_size);
     qk_prods_softmax = (float *)(qk_prods + qk_prod_size);
     attn_heads = (float *)qk_prods_softmax + qk_prod_size;
     W_out_contiguous = (float *)attn_heads + attn_heads_size;
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index 093e7d6de3..01c1df551c 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -25,56 +25,41 @@ LegionRuntime::Logger::Category log_bc("BatchConfig");
 BatchConfig::BatchConfig() {
   cached_results = false;
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
-    token_start_idx[i] = 0;
-    token_last_available_idx[i] = -1;
+    requestsInfo[i].token_start_offset = 0;
+    requestsInfo[i].num_tokens_in_batch = 0;
     request_completed[i] = true;
-    num_processing_tokens[i] = 0;
-    max_sequence_length[i] = 0;
-    initial_length[i] = 0;
   }
-  token2ids.num_samples = 0;
   for (int i = 0; i < MAX_NUM_TOKENS; i++) {
-    token2ids.guids[i] = SIZE_MAX;
-    token2ids.token_indexes[i].request_index = SIZE_MAX;
-    token2ids.token_indexes[i].token_position = SIZE_MAX;
-    token2ids.token_indexes[i].initial_length = SIZE_MAX;
+    tokensInfo[i].abs_depth_in_request = SIZE_MAX;
+    tokensInfo[i].request_index = SIZE_MAX;
+    tokensInfo[i].value = SIZE_MAX;
   }
   update_num_active_requests_tokens();
 }
 
 int BatchConfig::update_results(InferenceResult const &ir) {
   cached_results = false;
-  // int tokens_processed = 0;
   int completed = 0;
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
     if (request_completed[i]) {
       continue;
     }
-    assert(num_processing_tokens[i] > 0);
-    // if (num_processing_tokens[i] == 0) {
-    //   continue;
-    // }
-    // tokens_processed += num_processing_tokens[i];
-    token_start_idx[i] += num_processing_tokens[i];
-    if (token_start_idx[i] >= max_sequence_length[i]
+    assert(requestsInfo[i].num_tokens_in_batch > 0);
+    int processed_tokens = requestsInfo[i].token_start_offset +
+                           requestsInfo[i].num_tokens_in_batch;
+    if (processed_tokens >= max_sequence_length[i]
         // || ir.results[t] == 0 TODO: replace this with <EOS>
     ) {
       log_bc.print("[Done] guid(%zu) final_length(%d)",
-                   request_guid[i],
-                   token_start_idx[i]);
+                   requestsInfo[i].guid,
+                   processed_tokens);
       request_completed[i] = true;
-      token_start_idx[i] = 0;
-      token_last_available_idx[i] = -1;
-      num_processing_tokens[i] = 0;
+      requestsInfo[i].num_tokens_in_batch = 0;
+      requestsInfo[i].token_start_offset = 0;
       completed++;
     } else {
-      if (token_start_idx[i] == token_last_available_idx[i] + 1) {
-        token_last_available_idx[i]++;
-        num_processing_tokens[i] = 1; // incremental phase
-      } else {
-        assert(false);
-      }
-      assert(token_start_idx[i] <= token_last_available_idx[i]);
+      requestsInfo[i].token_start_offset += requestsInfo[i].num_tokens_in_batch;
+      requestsInfo[i].num_tokens_in_batch = 1;
     }
   }
   update_num_active_requests_tokens();
@@ -89,12 +74,10 @@ bool BatchConfig::register_new_request(size_t guid,
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
     if (request_completed[i]) {
       log_bc.print("[NewRequest] guid(%zu) length(%d)", guid, initial_len);
-      token_start_idx[i] = 0;
-      token_last_available_idx[i] = initial_len - 1;
+      requestsInfo[i].token_start_offset = 0;
+      requestsInfo[i].num_tokens_in_batch = initial_len;
+      requestsInfo[i].guid = guid;
       max_sequence_length[i] = initial_len + tokens_to_generate;
-      initial_length[i] = initial_len;
-      request_guid[i] = guid;
-      num_processing_tokens[i] = 0;
       request_completed[i] = false;
       update_num_active_requests_tokens();
       return true;
@@ -105,23 +88,9 @@ bool BatchConfig::register_new_request(size_t guid,
 }
 
 void BatchConfig::prepare_next_batch() {
-  cached_results = false;
-  int count = 0;
-  for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
-    if (request_completed[i]) {
-      continue;
-    }
-    if (num_tokens + token_last_available_idx[i] - token_start_idx[i] + 1 <=
-        MAX_NUM_TOKENS) {
-      num_processing_tokens[i] =
-          token_last_available_idx[i] - token_start_idx[i] + 1;
-    } else {
-      num_processing_tokens[i] = MAX_NUM_TOKENS - num_tokens;
-    }
-    count += num_processing_tokens[i];
-  }
-  update_num_active_requests_tokens();
-  log_bc.print("[NextBatch] num_tokens(%d)", count);
+  assert(cached_results);
+  assert(num_requests > 0 && num_tokens > 0);
+  log_bc.print("[NextBatch] num_tokens(%d)", num_tokens);
 }
 
 void BatchConfig::update_num_active_requests_tokens() {
@@ -130,17 +99,14 @@ void BatchConfig::update_num_active_requests_tokens() {
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
     if (!request_completed[i]) {
       num_requests++;
-      for (int j = 0; j < num_processing_tokens[i]; j++) {
-        token2ids.guids[num_tokens] = request_guid[i];
-        token2ids.token_indexes[num_tokens].token_position =
-            token_start_idx[i] + j;
-        token2ids.token_indexes[num_tokens].request_index = i;
-        token2ids.token_indexes[num_tokens].initial_length = initial_length[i];
+      for (int j = 0; j < requestsInfo[i].num_tokens_in_batch; j++) {
+        int start_idx = requestsInfo[i].token_start_offset;
+        tokensInfo[num_tokens].abs_depth_in_request = start_idx + j;
+        tokensInfo[num_tokens].request_index = i;
         num_tokens++;
       }
     }
   }
-  token2ids.num_samples = num_tokens;
   cached_results = true;
 }
 
@@ -150,7 +116,7 @@ int BatchConfig::num_active_requests() const {
   } else {
     assert(false &&
            "some BatchConfig functions updated requests but didn't call "
-           "update_num_active_requests_tokens() before exit");
+           "() before exit");
   }
 }
 
@@ -165,74 +131,36 @@ int BatchConfig::num_active_tokens() const {
 }
 
 void BatchConfig::print() const {
-  printf("--------------------------BatchConfig--------------------------\n");
-  printf("num_tokens: %i, num_requests: %i, cached_results: %i\n",
-         num_tokens,
-         num_requests,
-         cached_results);
-
-  printf("requests_completed: ");
-  for (int i = 0; i < num_requests; i++) {
-    printf("%i ", request_completed[i]);
-  }
-  printf("\n");
-
-  printf("token_start_idx: ");
-  for (int i = 0; i < num_requests; i++) {
-    printf("%i ", token_start_idx[i]);
-  }
-  printf("\n");
-
-  printf("token_last_available_idx: ");
-  for (int i = 0; i < num_requests; i++) {
-    printf("%i ", token_last_available_idx[i]);
-  }
-  printf("\n");
+  std::cout << "Max number of requests: " << MAX_NUM_REQUESTS << std::endl;
+  std::cout << "Max number of tokens: " << MAX_NUM_TOKENS << std::endl;
+  std::cout << "Number of tokens: " << num_tokens << std::endl;
+  std::cout << "Number of requests: " << num_requests << std::endl;
+  std::cout << "Cached results: " << cached_results << std::endl;
 
-  printf("num_processing_tokens: ");
-  for (int i = 0; i < num_requests; i++) {
-    printf("%i ", num_processing_tokens[i]);
-  }
-  printf("\n");
-
-  printf("max_sequence_length: ");
-  for (int i = 0; i < num_requests; i++) {
-    printf("%lu ", max_sequence_length[i]);
-  }
-  printf("\n");
-
-  printf("request_guid: ");
-  for (int i = 0; i < num_requests; i++) {
-    printf("%lu ", request_guid[i]);
-  }
-  printf("\n");
-
-  printf("token2ids.num_samples:%lu\n", token2ids.num_samples);
-
-  printf("token2ids.guids: ");
-  for (int i = 0; i < num_tokens; i++) {
-    printf("%lu ", token2ids.guids[i]);
-  }
-  printf("\n");
-
-  printf("token2ids.token_indexes[i].request_index: ");
-  for (int i = 0; i < num_tokens; i++) {
-    printf("%lu ", token2ids.token_indexes[i].request_index);
-  }
-  printf("\n");
-
-  printf("token2ids.token_indexes[i].token_position: ");
-  for (int i = 0; i < num_tokens; i++) {
-    printf("%lu ", token2ids.token_indexes[i].token_position);
+  std::cout << "Per-request info:\n";
+  for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
+    if (!request_completed[i]) {
+      std::cout << "  Request " << i << ":\n";
+      std::cout << "    Token start offset: "
+                << requestsInfo[i].token_start_offset << std::endl;
+      std::cout << "    Number of tokens in batch: "
+                << requestsInfo[i].num_tokens_in_batch << std::endl;
+      std::cout << "    GUID: " << requestsInfo[i].guid << std::endl;
+      std::cout << "    Max sequence length: " << max_sequence_length[i]
+                << std::endl;
+      std::cout << "    Request completed: " << request_completed[i]
+                << std::endl;
+    }
   }
 
-  printf("token2ids.token_indexes[i].initial_length: ");
+  std::cout << "Per-token info:\n";
   for (int i = 0; i < num_tokens; i++) {
-    printf("%lu ", token2ids.token_indexes[i].initial_length);
+    std::cout << "  Token " << i << ":\n";
+    std::cout << "    Absolute depth in request: "
+              << tokensInfo[i].abs_depth_in_request << std::endl;
+    std::cout << "    Request index: " << tokensInfo[i].request_index
+              << std::endl;
   }
-  printf("\n");
-  printf("---------------------------------------------------------------------"
-         "---------\n");
 }
 
 }; // namespace FlexFlow
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 09bbbefbe0..60294d4a75 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -143,6 +143,7 @@ MachineView *InferenceManager::get_machine_view(int mv_id) {
 }
 
 FutureMap InferenceManager::inference(int index, BatchConfig const &bc) {
+  assert(bc.num_active_tokens() > 0 && bc.num_active_requests() > 0);
   // We currently assume that the index-th batch will be placed
   // on the device_index-th device (except for the experts layers)
   int batch_index = index % max_num_inflight_batches;
diff --git a/tests/cpp_gpu_tests.sh b/tests/cpp_gpu_tests.sh
index ea4dc6b5b9..591b0e82be 100755
--- a/tests/cpp_gpu_tests.sh
+++ b/tests/cpp_gpu_tests.sh
@@ -1,5 +1,6 @@
 #! /usr/bin/env bash
 set -e
+set -x
 
 # Cd into directory holding this script
 cd "${BASH_SOURCE[0]%/*}"

From 089aaf5cf38499c200818f3fbe9e90ffaeb525fd Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 30 Apr 2023 05:13:41 -0400
Subject: [PATCH 099/344] [Inference] - Update tests and Fix bugs discovered by
 Inference tests (#698)

---
 src/ops/experts.cc                      | 156 ++++++++++++++++------
 src/ops/experts.cu                      |  10 +-
 src/ops/inc_multihead_self_attention.cc | 168 +++++++++++++++---------
 src/ops/inc_multihead_self_attention.cu |   9 +-
 4 files changed, 232 insertions(+), 111 deletions(-)

diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index 5fa6404ff0..8ec77131a9 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -828,6 +828,7 @@ void Experts::inference_task(Task const *task,
   assert(weights_domain.hi()[2] - weights_domain.lo()[2] + 1 == num_replicas);
 
   float const *bias_ptr = nullptr;
+  int nparams_bias = -1;
   if (use_bias) {
     bias_ptr = helperGetTensorPointerRO<float>(
         regions[5], task->regions[5], FID_DATA, ctx, runtime);
@@ -835,9 +836,9 @@ void Experts::inference_task(Task const *task,
         ctx, task->regions[5].region.get_index_space());
     int bias_dims = bias_domain.get_dim();
     assert(bias_dims == 3);
-    int nparams_bias = (m->experts_num_layers == 1)
-                           ? out_dim
-                           : (m->experts_internal_dim_size + out_dim);
+    nparams_bias = (m->experts_num_layers == 1)
+                       ? out_dim
+                       : (m->experts_internal_dim_size + out_dim);
     assert(bias_domain.hi()[0] - bias_domain.lo()[0] + 1 == nparams_bias);
     assert(bias_domain.hi()[1] - bias_domain.lo()[1] + 1 == num_experts);
     assert(bias_domain.hi()[2] - bias_domain.lo()[2] + 1 == num_replicas);
@@ -851,6 +852,8 @@ void Experts::inference_task(Task const *task,
     std::cout << m->out_dim << std::endl;
     std::cout << m->num_chosen_experts << std::endl;
     std::cout << m->effective_batch_size << std::endl;
+    std::cout << m->experts_num_layers << std::endl;
+    std::cout << m->experts_internal_dim_size << std::endl;
     std::cout << m->num_experts << std::endl;
     std::cout << m->use_bias << std::endl;
 
@@ -915,66 +918,137 @@ void Experts::inference_task(Task const *task,
     free(cpu_topk_gate_pred_ptr);
 
     /* ----------------Expert Weights--------------*/
-    float *cpu_experts_1 = new float[data_dim * out_dim];
-    float *cpu_experts_2 = new float[data_dim * out_dim];
-    checkCUDA(cudaMemcpy(cpu_experts_1,
-                         weights_ptrs[0],
-                         data_dim * out_dim * sizeof(float),
+    assert(m->experts_num_layers == 2 || m->experts_num_layers == 1);
+    size_t layer0_size = m->experts_num_layers == 1
+                             ? data_dim * out_dim
+                             : data_dim * m->experts_internal_dim_size;
+    size_t layer1_size = m->experts_internal_dim_size * out_dim;
+    float *cpu_experts_0_layer0 = new float[layer0_size];
+    float *cpu_experts_1_layer0 = new float[layer0_size];
+    float *cpu_experts_0_layer1 =
+        m->experts_num_layers == 1 ? nullptr : new float[layer1_size];
+    float *cpu_experts_1_layer1 =
+        m->experts_num_layers == 1 ? nullptr : new float[layer1_size];
+    /*checkCUDA(cudaMemcpy(cpu_experts_0_layer0,
+                         weights_ptr,
+                         layer0_size * sizeof(float),
                          cudaMemcpyDeviceToHost));
-    checkCUDA(cudaMemcpy(cpu_experts_2,
-                         weights_ptrs[2],
-                         data_dim * out_dim * sizeof(float),
+    checkCUDA(cudaMemcpy(cpu_experts_1_layer0,
+                         weights_ptr[nparams_weight],
+                         layer0_size * sizeof(float),
                          cudaMemcpyDeviceToHost));
+    if (m->experts_num_layers == 2) {
+      checkCUDA(cudaMemcpy(cpu_experts_0_layer1,
+                         weights_ptr[layer0_size],
+                         layer1_size * sizeof(float),
+                         cudaMemcpyDeviceToHost));
+      checkCUDA(cudaMemcpy(cpu_experts_1_layer1,
+                           weights_ptr[nparams_weight + layer0_size],
+                           layer1_size * sizeof(float),
+                           cudaMemcpyDeviceToHost));
+    }*/
     cpu_sum = 0;
-    for (int i = 0; i < data_dim * out_dim; i++) {
-      cpu_experts_1[i] = float(i) / float(data_dim * out_dim);
-      cpu_sum += cpu_experts_1[i];
+    for (int i = 0; i < layer0_size; i++) {
+      cpu_experts_0_layer0[i] = float(i) / float(nparams_weight);
+      cpu_sum += cpu_experts_0_layer0[i];
+    }
+    if (m->experts_num_layers == 2) {
+      for (int i = 0; i < layer1_size; i++) {
+        cpu_experts_0_layer1[i] =
+            float(layer0_size + i) / float(nparams_weight);
+        cpu_sum += cpu_experts_0_layer1[i];
+      }
     }
     std::cout << "[CPU] Experts 0 weights sum = " << cpu_sum << std::endl;
 
-    for (int i = 0; i < data_dim * out_dim; i++) {
-      cpu_experts_2[i] =
-          float(data_dim * out_dim - i) / float(data_dim * out_dim);
-      cpu_sum += cpu_experts_2[i];
+    cpu_sum = 0;
+    for (int i = 0; i < layer0_size; i++) {
+      cpu_experts_1_layer0[i] =
+          float(nparams_weight - i) / float(nparams_weight);
+      assert(cpu_experts_1_layer0[i] > 0);
+      cpu_sum += cpu_experts_1_layer0[i];
+    }
+    if (m->experts_num_layers == 2) {
+      for (int i = 0; i < layer1_size; i++) {
+        cpu_experts_1_layer1[i] =
+            float(nparams_weight - layer0_size + i) / float(nparams_weight);
+        assert(cpu_experts_1_layer1[i] > 0);
+        cpu_sum += cpu_experts_1_layer1[i];
+      }
     }
     std::cout << "[CPU] Experts 1 weights sum = " << cpu_sum << std::endl;
 
     for (int i = 0; i < num_experts; i++) {
-      if (i % 2 == 0) {
-        checkCUDA(cudaMemcpy((float *)weights_ptrs[i * (1 + use_bias)],
-                             cpu_experts_1,
-                             data_dim * out_dim * sizeof(float),
-                             cudaMemcpyHostToDevice));
-      } else {
-        checkCUDA(cudaMemcpy((float *)weights_ptrs[i * (1 + use_bias)],
-                             cpu_experts_2,
-                             data_dim * out_dim * sizeof(float),
-                             cudaMemcpyHostToDevice));
+      // first layer
+      checkCUDA(
+          cudaMemcpy((float *)&weights_ptr[nparams_weight * i],
+                     i % 2 == 0 ? cpu_experts_0_layer0 : cpu_experts_1_layer0,
+                     layer0_size * sizeof(float),
+                     cudaMemcpyHostToDevice));
+      // second layer
+      if (m->experts_num_layers == 2) {
+        checkCUDA(
+            cudaMemcpy((float *)&weights_ptr[nparams_weight * i + layer0_size],
+                       i % 2 == 0 ? cpu_experts_0_layer1 : cpu_experts_1_layer1,
+                       layer1_size * sizeof(float),
+                       cudaMemcpyHostToDevice));
       }
     }
-    free(cpu_experts_1);
-    free(cpu_experts_2);
+    free(cpu_experts_0_layer0);
+    free(cpu_experts_1_layer0);
+    free(cpu_experts_0_layer1);
+    free(cpu_experts_1_layer1);
 
     /* ----------------Expert Bias--------------*/
     if (use_bias) {
-      float *bias_experts_1 = new float[out_dim];
-      checkCUDA(cudaMemcpy(bias_experts_1,
-                           weights_ptrs[1],
-                           out_dim * sizeof(float),
+      size_t layer0_size =
+          m->experts_num_layers == 1 ? out_dim : m->experts_internal_dim_size;
+      size_t layer1_size = out_dim;
+      float *bias_experts_0_layer0 = new float[layer0_size];
+      float *bias_experts_0_layer1 =
+          m->experts_num_layers == 1 ? nullptr : new float[layer1_size];
+
+      checkCUDA(cudaMemcpy(bias_experts_0_layer0,
+                           bias_ptr,
+                           layer0_size * sizeof(float),
                            cudaMemcpyDeviceToHost));
       cpu_sum = 0;
-      for (int i = 0; i < out_dim; i++) {
-        cpu_sum += bias_experts_1[i];
+      for (int i = 0; i < layer0_size; i++) {
+        cpu_sum += bias_experts_0_layer0[i];
         // bias_experts_1[i] = 1.0f;
       }
-      std::cout << "[CPU] Bias 0 sum = " << cpu_sum << std::endl;
+      std::cout << "[CPU] Bias expert 0 (layer 0) sum = " << cpu_sum
+                << std::endl;
+
+      if (m->experts_num_layers == 2) {
+        checkCUDA(cudaMemcpy(bias_experts_0_layer1,
+                             (float *)&bias_ptr[layer0_size],
+                             layer1_size * sizeof(float),
+                             cudaMemcpyDeviceToHost));
+        cpu_sum = 0;
+        for (int i = 0; i < layer1_size; i++) {
+          cpu_sum += bias_experts_0_layer1[i];
+          // bias_experts_1[i] = 1.0f;
+        }
+        std::cout << "[CPU] Bias expert 0 (layer 1) sum = " << cpu_sum
+                  << std::endl;
+      }
+
       for (int i = 0; i < num_experts; i++) {
-        checkCUDA(cudaMemcpy((float *)weights_ptrs[i * (1 + use_bias) + 1],
-                             bias_experts_1,
-                             out_dim * sizeof(float),
+        checkCUDA(cudaMemcpy((float *)&bias_ptr[nparams_bias * i],
+                             bias_experts_0_layer0,
+                             layer0_size * sizeof(float),
                              cudaMemcpyHostToDevice));
+        if (m->experts_num_layers == 2) {
+          checkCUDA(
+              cudaMemcpy((float *)&bias_ptr[nparams_bias * i + layer0_size],
+                         bias_experts_0_layer1,
+                         layer1_size * sizeof(float),
+                         cudaMemcpyHostToDevice));
+        }
       }
-      free(bias_experts_1);
+      free(bias_experts_0_layer0);
+      free(bias_experts_0_layer1);
     }
   }
 #endif
diff --git a/src/ops/experts.cu b/src/ops/experts.cu
index c5f79446a1..ce15cdff55 100644
--- a/src/ops/experts.cu
+++ b/src/ops/experts.cu
@@ -963,7 +963,7 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
       (float const **)calloc(gemm_batch_count, sizeof(float const *));
   assert(weight_idx_array_thrust);
   checkCUDA(cudaMemcpy(weight_idx_array_thrust,
-                       m->weight_idx_array,
+                       m->weight_idx_array1,
                        sizeof(float const *) * gemm_batch_count,
                        cudaMemcpyDeviceToHost));
   std::vector<float const *> weight_idx_array_thrust_vec(
@@ -983,7 +983,7 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
   assert(bias_idx_array_thrust);
   if (use_bias) {
     checkCUDA(cudaMemcpy(bias_idx_array_thrust,
-                         m->bias_idx_array,
+                         m->bias_idx_array1,
                          sizeof(float const *) * gemm_batch_count,
                          cudaMemcpyDeviceToHost));
   }
@@ -1160,7 +1160,7 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
   assert(dev_batch_outputs_cuda);
   checkCUDA(
       cudaMemcpy(dev_batch_outputs_cuda,
-                 m->dev_batch_outputs,
+                 m->dev_batch_outputs1,
                  sizeof(float *) * num_chosen_experts * m->effective_batch_size,
                  cudaMemcpyDeviceToHost));
   std::vector<float *> dev_batch_outputs_cuda_vec(
@@ -1168,8 +1168,8 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
       dev_batch_outputs_cuda + num_chosen_experts * m->effective_batch_size);
 
   std::vector<float *> batch_outputs_host_vec(
-      m->batch_outputs,
-      m->batch_outputs + num_chosen_experts * m->effective_batch_size);
+      m->batch_outputs1,
+      m->batch_outputs1 + num_chosen_experts * m->effective_batch_size);
   assert(batch_outputs_host_vec == dev_batch_outputs_cuda_vec);
 
   /* std::cout << "dev_batch_outputs_cuda_vec[i]: ";
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index 8b2850a91c..a0674eddb6 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -583,6 +583,26 @@ void IncMultiHeadSelfAttention::inference_task(
 #ifdef INFERENCE_TESTS
   printf("Checking IncMultiHeadSelfAttention computations...\n");
 
+  // =============================================================================
+  //  Define helper functions to handle row-major arrays
+  // =============================================================================
+
+  auto set_value_row_major = [](float *arr,
+                                std::vector<int> const &shape,
+                                std::vector<int> const &indices,
+                                float value) -> void {
+    int offset = 0;
+    for (int i = 0; i < shape.size(); i++) {
+      int index = indices[i];
+      int stride = 1;
+      for (int j = i + 1; j < shape.size(); j++) {
+        stride *= shape[j];
+      }
+      offset += index * stride;
+    }
+    *(arr + offset) = value;
+  };
+
   // =============================================================================
   //  Load input/output/weights and parse general configs
   // =============================================================================
@@ -667,35 +687,40 @@ void IncMultiHeadSelfAttention::inference_task(
   // =============================================================================
   //  Load the Q/K/V projection weights, and create a Torch tensor
   // =============================================================================
-
-  float w_qkv[m->qSize][m->qProjSize][3][num_heads];
-  memset(&w_qkv,
-         0,
-         m->qSize * m->qProjSize * 3 * num_heads *
-             sizeof(float)); // assuming that 0.0f is encoded as all zero bytes
-  assert(w_qkv[0][0][0][0] == 0.0f);
+  std::vector<int> w_qkv_shape = {m->qSize, m->qProjSize, 3, (int)num_heads};
+  float *w_qkv =
+      (float *)calloc(m->qSize * m->qProjSize * 3 * num_heads, sizeof(float));
+  assert(w_qkv[0] == 0.0f);
 
   for (int h = 0; h < num_heads; h++) {
     for (size_t i = 0; i < m->qProjSize * m->qSize; i++) {
-      size_t row_index = i % m->qSize;
-      size_t column_index = i / m->qSize;
+      int row_index = i % m->qSize;
+      int column_index = i / m->qSize;
       // Q
-      w_qkv[row_index][column_index][0][h] =
-          weight_cpu[all_weight_params * h + m->qSize * column_index +
-                     row_index];
+      set_value_row_major(w_qkv,
+                          w_qkv_shape,
+                          {row_index, column_index, 0, h},
+                          weight_cpu[all_weight_params * h +
+                                     m->qSize * column_index + row_index]);
       // K
-      w_qkv[row_index][column_index][1][h] =
+      set_value_row_major(
+          w_qkv,
+          w_qkv_shape,
+          {row_index, column_index, 1, h},
           weight_cpu[all_weight_params * h + m->qProjSize * m->qSize +
-                     m->qSize * column_index + row_index];
+                     m->qSize * column_index + row_index]);
       // V
-      w_qkv[row_index][column_index][2][h] =
+      set_value_row_major(
+          w_qkv,
+          w_qkv_shape,
+          {row_index, column_index, 2, h},
           weight_cpu[all_weight_params * h + 2 * m->qProjSize * m->qSize +
-                     m->qSize * column_index + row_index];
+                     m->qSize * column_index + row_index]);
     }
   }
   // convert weights to torch tensor
   torch::Tensor torch_w_qkv = torch::from_blob(
-      w_qkv, {m->qSize, m->qProjSize, 3, num_heads}, torch::kFloat32);
+      w_qkv, {m->qSize, m->qProjSize, 3, (int)num_heads}, torch::kFloat32);
 
   /* std::cout << "Torch projection weights size: " << torch_w_qkv.sizes()
             << std::endl;
@@ -719,6 +744,7 @@ void IncMultiHeadSelfAttention::inference_task(
          qkv_projs.sizes()[1] <= effective_batch_size);
   assert(qkv_projs.sizes()[2] == 3);
   assert(qkv_projs.sizes()[3] == num_heads);
+  free(w_qkv);
 
   //  ----------------------- Loading CUDA results for this step ---------------
   float *QKVProjArray_cpu = download_tensor<float>(m->devQKVProjArray,
@@ -726,30 +752,30 @@ void IncMultiHeadSelfAttention::inference_task(
                                                        proj_sum * m->num_heads);
   assert(QKVProjArray_cpu != nullptr);
 
-  float QKVProjArray_converted[m->qProjSize][bc->num_active_tokens()][3]
-                              [num_heads];
-  memset(&QKVProjArray_converted,
-         0,
-         m->qProjSize * bc->num_active_tokens() * 3 * num_heads *
-             sizeof(float)); // assuming that 0.0f is encoded as all zero bytes
+  std::vector<int> QKVProjArray_converted_shape = {
+      m->qProjSize, bc->num_active_tokens(), 3, (int)num_heads};
+  float *QKVProjArray_converted = (float *)calloc(
+      m->qProjSize * bc->num_active_tokens() * 3 * num_heads, sizeof(float));
 
   // skip over padding at the end of QKVProjArray_cpu
   // convert from column order to 3D matrix because torch cannot automatically
   // import matrices flattened in column order
   for (size_t i = 0; i < proj_sum * bc->num_active_tokens() * num_heads; i++) {
-    size_t proj_size_index = i % m->qProjSize;
-    size_t head_index = i / (proj_sum * bc->num_active_tokens());
-    size_t token_index =
+    int proj_size_index = i % m->qProjSize;
+    int head_index = i / (proj_sum * bc->num_active_tokens());
+    int token_index =
         ((i - head_index * proj_sum * bc->num_active_tokens()) / m->qProjSize) %
         bc->num_active_tokens();
-    size_t qkv_offset = (i - head_index * proj_sum * bc->num_active_tokens()) /
-                        (m->qProjSize * bc->num_active_tokens());
+    int qkv_offset = (i - head_index * proj_sum * bc->num_active_tokens()) /
+                     (m->qProjSize * bc->num_active_tokens());
     assert(proj_size_index < proj_sum);
     assert(head_index < num_heads);
     assert(token_index < bc->num_active_tokens());
     assert(qkv_offset < 3);
-    QKVProjArray_converted[proj_size_index][token_index][qkv_offset]
-                          [head_index] = QKVProjArray_cpu[i];
+    set_value_row_major(QKVProjArray_converted,
+                        QKVProjArray_converted_shape,
+                        {proj_size_index, token_index, qkv_offset, head_index},
+                        QKVProjArray_cpu[i]);
   }
   torch::Tensor QKVProjArray_torch =
       torch::from_blob(QKVProjArray_converted,
@@ -771,6 +797,7 @@ void IncMultiHeadSelfAttention::inference_task(
   //   }
   // }
   assert(torch::allclose(QKVProjArray_torch, qkv_projs, 1e-05, 1e-05));
+  free(QKVProjArray_converted);
 
   // =============================================================================
   //  Store the K/V projections into the cache
@@ -783,10 +810,9 @@ void IncMultiHeadSelfAttention::inference_task(
       for (size_t d = 0; d < m->kProjSize; d++) {
         size_t kcache_idx =
             d * MAX_SEQ_LEN * m->num_heads * BatchConfig::MAX_NUM_REQUESTS +
-            bc->token2ids.token_indexes[t].token_position * m->num_heads *
+            bc->tokensInfo[t].abs_depth_in_request * m->num_heads *
                 BatchConfig::MAX_NUM_REQUESTS +
-            h * BatchConfig::MAX_NUM_REQUESTS +
-            bc->token2ids.token_indexes[t].request_index;
+            h * BatchConfig::MAX_NUM_REQUESTS + bc->tokensInfo[t].request_index;
         m->kcache[kcache_idx] =
             qkv_projs.index({(int64_t)d, (int64_t)t, 1, (int64_t)h})
                 .item<float>();
@@ -794,10 +820,9 @@ void IncMultiHeadSelfAttention::inference_task(
       for (size_t d = 0; d < m->vProjSize; d++) {
         size_t vcache_idx =
             d * MAX_SEQ_LEN * m->num_heads * BatchConfig::MAX_NUM_REQUESTS +
-            bc->token2ids.token_indexes[t].token_position * m->num_heads *
+            bc->tokensInfo[t].abs_depth_in_request * m->num_heads *
                 BatchConfig::MAX_NUM_REQUESTS +
-            h * BatchConfig::MAX_NUM_REQUESTS +
-            bc->token2ids.token_indexes[t].request_index;
+            h * BatchConfig::MAX_NUM_REQUESTS + bc->tokensInfo[t].request_index;
         m->vcache[vcache_idx] =
             qkv_projs.index({(int64_t)d, (int64_t)t, 2, (int64_t)h})
                 .item<float>();
@@ -819,7 +844,7 @@ void IncMultiHeadSelfAttention::inference_task(
   std::vector<size_t> r_first_idx;
   std::vector<size_t> r_num_tokens;
   for (size_t t = 0; t < bc->num_active_tokens(); t++) {
-    size_t rid = bc->token2ids.token_indexes[t].request_index;
+    size_t rid = bc->tokensInfo[t].request_index;
     if (req_idxs.size() == 0 || req_idxs[req_idxs.size() - 1] != rid) {
       req_idxs.push_back(rid);
       r_first_idx.push_back(t);
@@ -1004,13 +1029,19 @@ void IncMultiHeadSelfAttention::inference_task(
   // =============================================================================
 
   //  ----------------------- C++ operations & checks --------------------------
-  float w_out[m->vProjSize][m->num_heads][m->oProjSize] = {0};
+  float *w_out = (float *)calloc(m->vProjSize * m->num_heads * m->oProjSize,
+                                 sizeof(float));
+  std::vector<int> w_out_shape = {m->vProjSize, m->num_heads, m->oProjSize};
+  assert(m->qProjSize == m->kProjSize && m->kProjSize == m->vProjSize);
   for (int h = 0; h < num_heads; h++) {
     for (int v = 0; v < m->vProjSize; v++) {
       for (int o = 0; o < m->oProjSize; o++) {
-        w_out[v][h][o] =
+        set_value_row_major(
+            w_out,
+            w_out_shape,
+            {v, h, o},
             weight_cpu[all_weight_params * h + 3 * m->qProjSize * m->qSize +
-                       m->vProjSize * o + v];
+                       m->vProjSize * o + v]);
       }
     }
   }
@@ -1022,14 +1053,21 @@ void IncMultiHeadSelfAttention::inference_task(
   float *w_out_cuda = download_tensor<float>(
       m->W_out_contiguous, m->vProjSize * m->oProjSize * m->num_heads);
   assert(w_out_cuda != nullptr);
-  float converted_wout_tensor[m->vProjSize][m->num_heads][m->oProjSize] = {0};
+  float *converted_wout_tensor = (float *)calloc(
+      m->vProjSize * m->num_heads * m->oProjSize, sizeof(float));
+  std::vector<int> converted_wout_tensor_shape = {
+      m->vProjSize, m->num_heads, m->oProjSize};
+
   for (int i = 0; i < m->vProjSize * m->num_heads * m->oProjSize; i++) {
-    int row_index = i % m->vProjSize;
-    int col_index = (i / m->vProjSize) % m->num_heads;
-    int depth_index = i / (m->vProjSize * m->num_heads);
-    assert(row_index < m->vProjSize && col_index < m->num_heads &&
-           depth_index < m->oProjSize);
-    converted_wout_tensor[row_index][col_index][depth_index] = w_out_cuda[i];
+    int v_idx = i % m->vProjSize;
+    int h_idx = (i / m->vProjSize) % m->num_heads;
+    int o_idx = i / (m->vProjSize * m->num_heads);
+    assert(v_idx < m->vProjSize && h_idx < m->num_heads &&
+           o_idx < m->oProjSize);
+    set_value_row_major(converted_wout_tensor,
+                        converted_wout_tensor_shape,
+                        {v_idx, h_idx, o_idx},
+                        w_out_cuda[i]);
   }
   torch::Tensor w_out_cuda_tensor =
       torch::from_blob(converted_wout_tensor,
@@ -1038,6 +1076,7 @@ void IncMultiHeadSelfAttention::inference_task(
 
   //  ----------------------- Comparing C++ & CUDA results ---------------------
   assert(torch::allclose(w_out_cuda_tensor, torch_w_out, 1e-05, 1e-05));
+  free(converted_wout_tensor);
 
   // =============================================================================
   //  Compute the softmax(QK^T/sqrt(d_k))V product, request by request
@@ -1079,11 +1118,9 @@ void IncMultiHeadSelfAttention::inference_task(
     size_t num_new_tokens = r_num_tokens[r];
     int64_t rid = (int64_t)(req_idxs[r]);
     int64_t num_tokens_received_so_far =
-        (int64_t)(bc->token_last_available_idx[rid] + 1);
-    // printf("num_new_tokens: %lu, bc->num_processing_tokens[rid]: %i, rid:
-    // %li\n",
-    //         num_new_tokens, bc->num_processing_tokens[rid], rid);
-    assert(num_new_tokens == bc->num_processing_tokens[rid]);
+        (int64_t)(bc->requestsInfo[rid].token_start_offset +
+                  bc->requestsInfo[rid].num_tokens_in_batch);
+    assert(num_new_tokens == bc->requestsInfo[rid].num_tokens_in_batch);
     assert(num_tokens_received_so_far >= (int64_t)num_new_tokens);
 
     //  ----------------------- C++ computations -------------------------------
@@ -1141,10 +1178,13 @@ void IncMultiHeadSelfAttention::inference_task(
     assert(qk_softmax[r].sizes()[2] == m->num_heads);
 
     //  ------------------- Loading CUDA results for this step ---------------
-    float converted_qk_prod[num_new_tokens][num_tokens_received_so_far]
-                           [num_heads] = {0};
-    float converted_qk_prod_softmax[num_new_tokens][num_tokens_received_so_far]
-                                   [num_heads] = {0};
+    float *converted_qk_prod = (float *)calloc(
+        num_new_tokens * num_tokens_received_so_far * num_heads, sizeof(float));
+    float *converted_qk_prod_softmax = (float *)calloc(
+        num_new_tokens * num_tokens_received_so_far * num_heads, sizeof(float));
+    std::vector<int> converted_qk_prod_shape = {
+        (int)num_new_tokens, (int)num_tokens_received_so_far, (int)num_heads};
+
     for (size_t i = 0;
          i < num_new_tokens * num_tokens_received_so_far * num_heads;
          i++) {
@@ -1153,10 +1193,14 @@ void IncMultiHeadSelfAttention::inference_task(
       size_t head_idx = i / (num_new_tokens * num_tokens_received_so_far);
       assert(new_t_idx < num_new_tokens &&
              all_t_idx < num_tokens_received_so_far && head_idx < num_heads);
-      converted_qk_prod[new_t_idx][all_t_idx][head_idx] =
-          qk_prods_cpu[i + qk_prods_cpu_offset];
-      converted_qk_prod_softmax[new_t_idx][all_t_idx][head_idx] =
-          qk_prods_softmax_cpu[i + qk_prods_cpu_offset];
+      set_value_row_major(converted_qk_prod,
+                          converted_qk_prod_shape,
+                          {(int)new_t_idx, (int)all_t_idx, (int)head_idx},
+                          qk_prods_cpu[i + qk_prods_cpu_offset]);
+      set_value_row_major(converted_qk_prod_softmax,
+                          converted_qk_prod_shape,
+                          {(int)new_t_idx, (int)all_t_idx, (int)head_idx},
+                          qk_prods_softmax_cpu[i + qk_prods_cpu_offset]);
     }
     torch::Tensor qk_prods_cuda = torch::from_blob(
         converted_qk_prod,
@@ -1193,6 +1237,8 @@ void IncMultiHeadSelfAttention::inference_task(
     // }
     assert(torch::allclose(qk_prods_cuda, qk_products[r], 1e-05, 1e-05));
     assert(torch::allclose(qk_prods_softmax_cuda, qk_softmax[r], 1e-05, 1e-05));
+    free(converted_qk_prod);
+    free(converted_qk_prod_softmax);
 
     //  --------------------- C++ computations --------------------------
     // Multiply softmax results by V
@@ -1277,7 +1323,7 @@ void IncMultiHeadSelfAttention::inference_task(
   // =============================================================================
   //  Cleanup
   // =============================================================================
-
+  free(w_out);
   checkCUDA(cudaFreeHost(input_cpu));
   checkCUDA(cudaFreeHost(weight_cpu));
   checkCUDA(cudaFreeHost(output_cpu));
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 0fdecfe6d6..d2af3fa8e1 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -31,12 +31,13 @@ __global__ void build_w_out_tensor(float const *weight_ptr,
                                    int num_heads,
                                    int qkv_weight_block_size) {
   CUDA_KERNEL_LOOP(i, vProjSize * oProjSize * num_heads) {
-    int row_idx = i % vProjSize;
-    int col_idx = (i / vProjSize) % oProjSize;
+    int v_idx = i % vProjSize;
+    int o_idx = (i / vProjSize) % oProjSize;
     int head_idx = i / (vProjSize * oProjSize);
-    contiguous_weight_ptr[i] =
+    contiguous_weight_ptr[o_idx * vProjSize * num_heads + head_idx * vProjSize +
+                          v_idx] =
         weight_ptr[head_idx * (qkv_weight_block_size + vProjSize * oProjSize) +
-                   qkv_weight_block_size + col_idx * vProjSize + row_idx];
+                   qkv_weight_block_size + o_idx * vProjSize + v_idx];
   }
 }
 

From 41aa96a7f8bfa496a3b37d2de92da3fcd79c1e6f Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Sun, 30 Apr 2023 14:53:19 -0500
Subject: [PATCH 100/344] Add a RequestManager to manage all requests and set
 BatchConfig for each inference batch (#697)

* Support multiple FFModels in a single top_level_task

* initial implementation

* initial implementation

* [RequestManager] more work

* [RequestManager] initial implementation done

* bug fix
---
 examples/cpp/inference/LLAMA/dataloader.cc    |  12 +-
 examples/cpp/inference/LLAMA/dataloader.cu    |  25 ++--
 examples/cpp/inference/LLAMA/llama.cc         |  65 ++++----
 examples/cpp/inference/dataloader.cc          |  11 +-
 examples/cpp/inference/dataloader.cu          |  28 ++--
 .../cpp/inference/mixture_of_experts/moe.cc   |   2 +-
 .../inference/transformers/transformers.cc    |   2 +-
 include/flexflow/batch_config.h               |  40 ++---
 include/flexflow/inference.h                  |  31 ++++
 include/flexflow/model.h                      |   3 +
 include/flexflow/runtime.h                    |  31 ++++
 src/ops/arg_topk.cc                           |   2 +-
 src/ops/inc_multihead_self_attention.cc       |   2 +-
 src/runtime/batch_config.cc                   |  84 ++++++-----
 src/runtime/inference_manager.cc              |  34 ++++-
 src/runtime/model.cc                          |  81 ++++++----
 src/runtime/request_manager.cc                | 139 ++++++++++++++++++
 src/runtime/request_manager.cu                |  50 +++++++
 18 files changed, 486 insertions(+), 156 deletions(-)
 create mode 100644 include/flexflow/runtime.h
 create mode 100644 src/runtime/request_manager.cc
 create mode 100644 src/runtime/request_manager.cu

diff --git a/examples/cpp/inference/LLAMA/dataloader.cc b/examples/cpp/inference/LLAMA/dataloader.cc
index fa69324a96..1370d3f724 100644
--- a/examples/cpp/inference/LLAMA/dataloader.cc
+++ b/examples/cpp/inference/LLAMA/dataloader.cc
@@ -224,25 +224,25 @@ void DataLoader::store_outputs(BatchConfig *bc,
   batch_predictions.clear();
 
   // size_t guid = bc->tokensInfo[0].guid;
-  size_t guid = bc->requestsInfo[bc->tokensInfo[0].request_index].guid;
+  auto guid = bc->requestsInfo[bc->tokensInfo[0].request_index].request_guid;
 
-  size_t start_idx = bc->tokensInfo[0].abs_depth_in_request;
+  int start_idx = bc->tokensInfo[0].abs_depth_in_request;
 
   // only store the last token of each req
   for (size_t i = 0; i <= bc->num_active_tokens(); i++) {
-    size_t current_guid =
-        bc->requestsInfo[bc->tokensInfo[i].request_index].guid;
+    auto current_guid =
+        bc->requestsInfo[bc->tokensInfo[i].request_index].request_guid;
     if (i == bc->num_active_tokens() || current_guid != guid) {
 
       int result_index = bc->tokensInfo[i - 1].abs_depth_in_request - start_idx;
-      batch_predictions[guid] = ir.results[i - 1];
+      batch_predictions[guid] = ir.token_ids[i - 1];
 
       std::cout << "i: " << i << ", dds-" << guid << ", result index"
                 << result_index << ", result value: " << batch_predictions[guid]
                 << "\n";
 
       if (i < bc->num_active_tokens()) {
-        guid = bc->requestsInfo[bc->tokensInfo[i].request_index].guid;
+        guid = bc->requestsInfo[bc->tokensInfo[i].request_index].request_guid;
         start_idx = bc->tokensInfo[i].abs_depth_in_request;
       }
     }
diff --git a/examples/cpp/inference/LLAMA/dataloader.cu b/examples/cpp/inference/LLAMA/dataloader.cu
index 4fea090b63..e32e3ddc33 100644
--- a/examples/cpp/inference/LLAMA/dataloader.cu
+++ b/examples/cpp/inference/LLAMA/dataloader.cu
@@ -50,19 +50,19 @@ void DataLoader::load_input(Task const *task,
   coord_t batch_size =
       batch_input_domain.hi()[1] - batch_input_domain.lo()[1] + 1;
 
-  size_t guid = bc->requestsInfo[bc->tokensInfo[0].request_index].guid;
-  size_t start_idx = bc->tokensInfo[0].abs_depth_in_request;
-  size_t dst_idx = 0;
+  auto guid = bc->requestsInfo[bc->tokensInfo[0].request_index].request_guid;
+  int start_idx = bc->tokensInfo[0].abs_depth_in_request;
+  int dst_idx = 0;
 
   for (int i = 0; i <= bc->num_active_tokens(); i++) {
-    size_t current_guid =
-        bc->requestsInfo[bc->tokensInfo[i].request_index].guid;
+    auto current_guid =
+        bc->requestsInfo[bc->tokensInfo[i].request_index].request_guid;
     if (i == bc->num_active_tokens() || current_guid != guid) {
-      size_t tokens_to_copy =
+      int tokens_to_copy =
           (bc->tokensInfo[i - 1].abs_depth_in_request - start_idx + 1);
 
-      size_t request_index = bc->tokensInfo[i - 1].request_index;
-      size_t token_start_offset =
+      int request_index = bc->tokensInfo[i - 1].request_index;
+      int token_start_offset =
           bc->requestsInfo[request_index].token_start_offset;
 
       std::cout << "size to copy:  " << tokens_to_copy
@@ -70,7 +70,7 @@ void DataLoader::load_input(Task const *task,
       if (tokens_to_copy > 1 || token_start_offset == 0) {
         // token pos < init length, the init length is the input sentence length
         // so this is the initial input, load from file.
-        size_t copy_start_index = guid * llamaconfig.sentence_len;
+        int copy_start_index = guid * llamaconfig.sentence_len;
         std::cout << "copy index:  " << copy_start_index << "\n";
         copy_kernel<<<GET_BLOCKS(tokens_to_copy), CUDA_NUM_THREADS>>>(
             batch_input.ptr + dst_idx,
@@ -92,11 +92,14 @@ void DataLoader::load_input(Task const *task,
                   << ", dst_idx: " << dst_idx << ", token:" << token << "\n";
         long *dst_ptr = batch_input.ptr + dst_idx;
 
-        cudaMemcpy(dst_ptr, &token, sizeof(long), cudaMemcpyHostToDevice);
+        cudaMemcpy(dst_ptr,
+                   &token,
+                   sizeof(FlexFlow::RequestManager::TokenId),
+                   cudaMemcpyHostToDevice);
       }
 
       if (i < bc->num_active_tokens()) {
-        guid = bc->requestsInfo[bc->tokensInfo[i].request_index].guid;
+        guid = bc->requestsInfo[bc->tokensInfo[i].request_index].request_guid;
         start_idx = bc->tokensInfo[i].abs_depth_in_request;
       }
       dst_idx = i;
diff --git a/examples/cpp/inference/LLAMA/llama.cc b/examples/cpp/inference/LLAMA/llama.cc
index 3d745d8bd5..f05526ce9b 100644
--- a/examples/cpp/inference/LLAMA/llama.cc
+++ b/examples/cpp/inference/LLAMA/llama.cc
@@ -58,7 +58,7 @@ void FlexFlow::top_level_task(Task const *task,
   Tensor input;
   {
     int const token_dims[] = {llamaConfig.batchSize, llamaConfig.max_seq_len};
-    input = ff.create_tensor<2>(token_dims, DT_INT64);
+    input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
 
   Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
@@ -79,7 +79,7 @@ void FlexFlow::top_level_task(Task const *task,
   // }
 
   // n transformer blocks impl
-  for (int i = 0; i < 1; i++) {
+  for (int i = 0; i < 10; i++) {
     // step 1: attention
     std::vector<int> axes = {2};
     Tensor att_norm = ff.rms_norm(token, llamaConfig.norm_eps, llamaConfig.dim);
@@ -145,6 +145,7 @@ void FlexFlow::top_level_task(Task const *task,
   std::cout << "------start compile ----------" << std::endl;
   InferenceManager im(&ff, llamaConfig.batchSize, 1);
   im.compile_model_and_allocate_buffer();
+  RequestManager rm;
 
   std::cout << "------init ops----------" << std::endl;
   im.init_operators_inference();
@@ -203,18 +204,36 @@ void FlexFlow::top_level_task(Task const *task,
   //------------------------------ do inference---------------------------
   int processed_requests = 0;
   std::map<int, Future> future_handlers;
-  std::map<int, BatchConfig *> batch_configs;
-  BatchConfig *bc = nullptr;
+  std::map<int, BatchConfig> batch_configs;
   std::map<size_t, long> batch_predictions[1];
   loader.reset();
 
-  bool new_req = true;
+  for (int i = 0; i < llamaConfig.batchSize; i++) {
+    std::vector<BatchConfig::TokenId> tokens{
+        0,
+        0,
+        0,
+        0,
+        0,
+        0,
+        0,
+        0
+    };
+    rm.register_new_request(tokens, 347);
+  }
 
   while (processed_requests < llamaConfig.sentence_len) {
     int bid = 0;
     size_t max_reqs, max_tkns;
     if (future_handlers.find(bid) == future_handlers.end()) {
-      bc = new BatchConfig();
+      BatchConfig bc;
+      InferenceResult ir;
+      bc = rm.prepare_next_batch(bc, ir);
+      std::cout << "new tokens: " << bc.num_tokens;
+      FutureMap fm = im.inference(bid, bc);
+      assert(fm.get_future_map_domain().get_volume() == 1);
+      future_handlers[bid] = fm.get_future(0);
+      batch_configs[bid] = bc;
     } else {
       // have luanched this bid
       Future future = future_handlers[bid];
@@ -225,33 +244,15 @@ void FlexFlow::top_level_task(Task const *task,
       }
       // process end
       InferenceResult ir = future.get_result<InferenceResult>();
-      bc = batch_configs[bid];
-
-      std::cout << "store outputs start...." << std::endl;
-      loader.store_outputs(bc, ir, batch_predictions[bid]);
-      processed_requests += bc->update_results(ir);
-
-      if (!new_req) {
-        break;
-      }
-      new_req = false;
+      BatchConfig bc = batch_configs[bid];
+      processed_requests += bc.num_tokens;
+      bc = rm.prepare_next_batch(bc, ir);
+      std::cout << "new tokens: " << bc.num_tokens;
+      FutureMap fm = im.inference(bid, bc);
+      assert(fm.get_future_map_domain().get_volume() == 1);
+      future_handlers[bid] = fm.get_future(0);
+      batch_configs[bid] = bc;
     }
-    // batch cofig register 5 reqs
-    // init length relate to the min_prompt_size for llama
-    if (new_req) {
-      for (int i = 0; i < llamaConfig.batchSize; i++) {
-        assert(bc->register_new_request(i, llamaConfig.max_seq_len, 347));
-      }
-    }
-
-    bc->prepare_next_batch();
-    std::cout << "new tokens: " << bc->num_active_tokens();
-    loader.next_batch(ff, bc, batch_predictions[bid]);
-
-    FutureMap fm = im.inference(bid, *bc);
-    assert(fm.get_future_map_domain().get_volume() == 1);
-    future_handlers[bid] = fm.get_future(0);
-    batch_configs[bid] = bc;
   }
 
   // float* data
diff --git a/examples/cpp/inference/dataloader.cc b/examples/cpp/inference/dataloader.cc
index 67bcbdb648..ce49086a92 100644
--- a/examples/cpp/inference/dataloader.cc
+++ b/examples/cpp/inference/dataloader.cc
@@ -182,16 +182,17 @@ void DataLoader::store_outputs(BatchConfig *bc,
   // there is no num_samples, replace it with num_active_tokens
   batch_predictions.clear();
   for (size_t i = 0; i < bc->num_active_tokens(); i++) {
-    size_t guid = bc->requestsInfo[bc->tokensInfo[i].request_index].guid;
+    auto guid = bc->requestsInfo[bc->tokensInfo[i].request_index].request_guid;
     if (i == bc->num_active_tokens() - 1 ||
-        guid != bc->requestsInfo[bc->tokensInfo[i + 1].request_index].guid) {
+        guid != bc->requestsInfo[bc->tokensInfo[i + 1].request_index]
+                    .request_guid) {
       if (outputs.find(guid) == outputs.end()) {
-        std::vector<int> v{ir.results[i]};
+        std::vector<int> v{ir.token_ids[i]};
         outputs[guid] = v;
       } else {
-        outputs[guid].push_back(ir.results[i]);
+        outputs[guid].push_back(ir.token_ids[i]);
       }
-      batch_predictions[guid] = ir.results[i];
+      batch_predictions[guid] = ir.token_ids[i];
     }
   }
   assert(batch_predictions.size() == bc->num_active_requests());
diff --git a/examples/cpp/inference/dataloader.cu b/examples/cpp/inference/dataloader.cu
index 80c53f175a..7fb3478020 100644
--- a/examples/cpp/inference/dataloader.cu
+++ b/examples/cpp/inference/dataloader.cu
@@ -14,6 +14,7 @@
  */
 
 #include "dataloader.h"
+#include "flexflow/inference.h"
 #include "flexflow/utils/cuda_helper.h"
 
 void DataLoader::load_input(Task const *task,
@@ -60,8 +61,8 @@ void DataLoader::load_input(Task const *task,
   // Currently assume continous indices
   assert(bc->num_active_tokens() <= batch_size * sequence_length);
   for (int i = 1; i < bc->num_active_tokens(); i++) {
-    size_t prev_guid = requestInfo[tokensInfo[i - 1].request_index].guid;
-    size_t guid = requestInfo[tokensInfo[i].request_index].guid;
+    auto prev_guid = requestInfo[tokensInfo[i - 1].request_index].request_guid;
+    auto guid = requestInfo[tokensInfo[i].request_index].request_guid;
     if (guid == prev_guid) {
       assert(tokensInfo[i].abs_depth_in_request ==
              tokensInfo[i - 1].abs_depth_in_request + 1);
@@ -74,23 +75,23 @@ void DataLoader::load_input(Task const *task,
   checkCUDA(cudaMemset(
       batch_input_ptr, 0, batch_input_domain.get_volume() * sizeof(int)));
 
-  size_t guid = requestInfo[tokensInfo[0].request_index].guid;
-  size_t start_idx = tokensInfo[0].abs_depth_in_request;
-  size_t dst_idx = 0;
-  size_t total_tokens = 0;
+  auto guid = requestInfo[tokensInfo[0].request_index].request_guid;
+  int start_idx = tokensInfo[0].abs_depth_in_request;
+  int dst_idx = 0;
+  int total_tokens = 0;
 
   for (size_t i = 1; i <= bc->num_active_tokens(); i++) {
-    size_t current_guid = requestInfo[tokensInfo[i].request_index].guid;
+    auto current_guid = requestInfo[tokensInfo[i].request_index].request_guid;
     if (i == bc->num_active_tokens() || current_guid != guid) {
 
       size_t tokens_to_copy =
           (tokensInfo[i - 1].abs_depth_in_request - start_idx + 1);
       assert(tokens_to_copy > 0);
 
-      size_t request_index = tokensInfo[i - 1].request_index;
-      size_t token_start_offset =
+      int request_index = tokensInfo[i - 1].request_index;
+      int token_start_offset =
           bc->requestsInfo[request_index].token_start_offset;
-      size_t num_processing_tokens =
+      int num_processing_tokens =
           bc->requestsInfo[request_index].num_tokens_in_batch;
       if (tokens_to_copy > 1 || token_start_offset == 0) {
         // initialization phase
@@ -109,12 +110,15 @@ void DataLoader::load_input(Task const *task,
         assert(prev_batch_preds.find(guid) != prev_batch_preds.end());
         int token = prev_batch_preds.at(guid);
         int *dst_ptr = batch_input_ptr + dst_idx;
-        cudaMemcpy(dst_ptr, &token, sizeof(int), cudaMemcpyHostToDevice);
+        cudaMemcpy(dst_ptr,
+                   &token,
+                   sizeof(FlexFlow::RequestManager::TokenId),
+                   cudaMemcpyHostToDevice);
       }
       total_tokens += tokens_to_copy;
 
       if (i < bc->num_active_tokens()) {
-        guid = bc->requestsInfo[bc->tokensInfo[i].request_index].guid;
+        guid = bc->requestsInfo[bc->tokensInfo[i].request_index].request_guid;
         start_idx = tokensInfo[i].abs_depth_in_request;
       }
       dst_idx = i;
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index 5ebd23a4c7..b3a9b4941a 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -205,7 +205,7 @@ void FlexFlow::top_level_task(Task const *task,
         InferenceResult ir = future.get_result<InferenceResult>();
         bc = batch_configs[bid];
         data_loader.store_outputs(bc, ir, batch_predictions[bid]);
-        processed_requests += bc->update_results(ir);
+        processed_requests += bc->update_results(&ir);
         max_reqs = moeConfig.incremental_mode
                        ? bc->MAX_NUM_REQUESTS - bc->num_active_requests()
                        : im.max_num_requests_per_batch;
diff --git a/examples/cpp/inference/transformers/transformers.cc b/examples/cpp/inference/transformers/transformers.cc
index 233b1dcaa1..8a8c0cb53e 100644
--- a/examples/cpp/inference/transformers/transformers.cc
+++ b/examples/cpp/inference/transformers/transformers.cc
@@ -184,7 +184,7 @@ void FlexFlow::top_level_task(Task const *task,
         InferenceResult ir = future.get_result<InferenceResult>();
         bc = batch_configs[bid];
         data_loader.store_outputs(bc, ir, batch_predictions[bid]);
-        processed_requests += bc->update_results(ir);
+        processed_requests += bc->update_results(&ir);
         max_reqs = transformerConfig.incremental_mode
                        ? bc->MAX_NUM_REQUESTS - bc->num_active_requests()
                        : im.max_num_requests_per_batch;
diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 674fac4ced..a397be28c3 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -20,50 +20,54 @@
 // #define MAX_SEQ_LEN 1024
 // #define BATCH_SIZE 2
 #define MAX_SEQ_LEN 20
-#define BATCH_SIZE 16
-#define MAX_REQUESTS 256
+// #define BATCH_SIZE 16
+// #define MAX_REQUESTS 256
 
 namespace FlexFlow {
 
-struct InferenceResult {
-  static int const MAX_NUM_TOKENS = MAX_SEQ_LEN * BATCH_SIZE;
-  int results[MAX_NUM_TOKENS];
-};
+class InferenceResult;
 
 class BatchConfig {
 public:
+  using RequestGuid = size_t;
+  using TokenId = int;
   BatchConfig();
   bool register_new_request(size_t guid,
                             int initial_len,
                             int tokens_to_generate);
   void prepare_next_batch();
-  int update_results(InferenceResult const &ir);
+  int update_results(InferenceResult const *ir);
   void update_num_active_requests_tokens();
   int num_active_requests() const;
   int num_active_tokens() const;
   void print() const;
-  static int const MAX_NUM_REQUESTS = MAX_REQUESTS;
-  static int const MAX_NUM_TOKENS = InferenceResult::MAX_NUM_TOKENS;
+  static int const MAX_NUM_REQUESTS = 8;
+  static int const MAX_NUM_TOKENS = 64;
 
   //  These are set by update
-  int num_tokens, num_requests;
-  bool cached_results;
+  int num_tokens;
 
   struct PerRequestInfo {
-    size_t token_start_offset;
-    size_t num_tokens_in_batch;
-    size_t guid;
+    int token_start_offset;
+    int num_tokens_in_batch;
+    int max_sequence_length;
+    RequestGuid request_guid;
   };
   struct PerTokenInfo {
-    size_t abs_depth_in_request;
-    size_t request_index;
-    size_t value;
+    int abs_depth_in_request;
+    int request_index;
+    TokenId token_id;
   };
   PerRequestInfo requestsInfo[MAX_NUM_REQUESTS];
   PerTokenInfo tokensInfo[MAX_NUM_TOKENS];
 
-  size_t max_sequence_length[MAX_NUM_REQUESTS];
+  // size_t max_sequence_length[MAX_NUM_REQUESTS];
   bool request_completed[MAX_NUM_REQUESTS];
 };
 
+struct InferenceResult {
+  static int const MAX_NUM_TOKENS = BatchConfig::MAX_NUM_TOKENS;
+  BatchConfig::TokenId token_ids[MAX_NUM_TOKENS];
+};
+
 }; // namespace FlexFlow
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index 87cc80e055..0415d85d11 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -17,6 +17,7 @@
 
 #include "flexflow/batch_config.h"
 #include "flexflow/model.h"
+#include <mutex>
 
 namespace FlexFlow {
 
@@ -31,6 +32,8 @@ class InferenceManager {
   void init_operators_inference();
   MachineView *get_machine_view(int mv_id);
   Legion::FutureMap inference(int index, BatchConfig const &bc);
+  void load_input_tokens_from_batch_config(BatchConfig const &bc,
+                                           ParallelTensor const input);
 
 public:
   std::unordered_map<ParallelTensor, std::vector<ParallelTensor>> tensor_buffer;
@@ -41,4 +44,32 @@ class InferenceManager {
   std::vector<MachineView> machine_views;
 };
 
+struct Request {
+  BatchConfig::RequestGuid guid;
+  int max_sequence_length;
+  std::vector<BatchConfig::TokenId> tokens;
+};
+
+class RequestManager {
+public:
+  using RequestGuid = BatchConfig::RequestGuid;
+  using TokenId = BatchConfig::TokenId;
+  RequestManager();
+  RequestGuid register_new_request(std::vector<TokenId> const &prompt,
+                                   int max_sequence_length);
+  BatchConfig prepare_next_batch(BatchConfig const &bc,
+                                 InferenceResult const &result);
+  static void
+      load_tokens_task(Legion::Task const *task,
+                       std::vector<Legion::PhysicalRegion> const &regions,
+                       Legion::Context ctx,
+                       Legion::Runtime *runtime);
+
+private:
+  std::queue<Request> pending_request_queue;
+  std::unordered_map<RequestGuid, Request> running_request_queue;
+  std::mutex request_queue_mutex;
+  RequestGuid next_available_guid;
+};
+
 } // namespace FlexFlow
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 40080c9840..d797158530 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -30,6 +30,7 @@
 #include "optimizer.h"
 #include "parallel_tensor.h"
 #include "recompile.h"
+#include "runtime.h"
 #include "simulator.h"
 #include "tensor.h"
 #include "tl/optional.hpp"
@@ -206,6 +207,8 @@ enum TaskIDs {
   FUSED_PARALLELOP_INIT_TASK_ID,
   FUSED_PARALLELOP_FWD_TASK_ID,
   FUSED_PARALLELOP_BWD_TASK_ID,
+  // InferenceManager & RequestManager
+  RM_LOAD_TOKENS_TASK_ID,
   // Custom tasks
   CUSTOM_GPU_TASK_ID_FIRST,
   CUSTOM_GPU_TASK_ID_1,
diff --git a/include/flexflow/runtime.h b/include/flexflow/runtime.h
new file mode 100644
index 0000000000..e1371300ec
--- /dev/null
+++ b/include/flexflow/runtime.h
@@ -0,0 +1,31 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#ifndef _FLEXFLOW_RUNTIME_H_
+#define _FLEXFLOW_RUNTIME_H_
+
+#include "config.h"
+
+namespace FlexFlow {
+
+class FFRuntime {
+public:
+  FFRuntime(FFConfig &config);
+  FFHandler handlers[MAX_NUM_WORKERS];
+};
+
+} // namespace FlexFlow
+
+#endif // _FLEXFLOW_RUNTIME_H_
diff --git a/src/ops/arg_topk.cc b/src/ops/arg_topk.cc
index 8cfc4c38d4..5636b7b924 100644
--- a/src/ops/arg_topk.cc
+++ b/src/ops/arg_topk.cc
@@ -331,7 +331,7 @@ InferenceResult
       m, in_ptr, index_ptr, batch_size, length, k, m->sorted);
 
   InferenceResult ir;
-  download_tensor<int>(index_ptr, ir.results, batch_size);
+  download_tensor<BatchConfig::TokenId>(index_ptr, ir.token_ids, batch_size);
   return ir;
 }
 
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index a0674eddb6..8976703c6f 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -506,7 +506,7 @@ FutureMap IncMultiHeadSelfAttention::inference(
   int idx = 0;
   printf("BatchConfig, num_tokens: %d, num_requests: %d\n",
          bc.num_tokens,
-         bc.num_requests);
+         bc.num_active_requests());
   IndexLauncher launcher(INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
                          parallel_is,
                          TaskArgument(&bc, sizeof(BatchConfig)),
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index 01c1df551c..7412a184c6 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -23,22 +23,22 @@ namespace FlexFlow {
 LegionRuntime::Logger::Category log_bc("BatchConfig");
 
 BatchConfig::BatchConfig() {
-  cached_results = false;
+  num_tokens = 0;
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
     requestsInfo[i].token_start_offset = 0;
     requestsInfo[i].num_tokens_in_batch = 0;
     request_completed[i] = true;
   }
   for (int i = 0; i < MAX_NUM_TOKENS; i++) {
-    tokensInfo[i].abs_depth_in_request = SIZE_MAX;
-    tokensInfo[i].request_index = SIZE_MAX;
-    tokensInfo[i].value = SIZE_MAX;
+    tokensInfo[i].abs_depth_in_request = -1;
+    tokensInfo[i].request_index = -1;
+    tokensInfo[i].token_id = -1;
   }
-  update_num_active_requests_tokens();
 }
 
-int BatchConfig::update_results(InferenceResult const &ir) {
-  cached_results = false;
+// Deprecated API; should use RequestManager::update_batch
+int BatchConfig::update_results(InferenceResult const *ir) {
+  assert(false);
   int completed = 0;
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
     if (request_completed[i]) {
@@ -47,11 +47,11 @@ int BatchConfig::update_results(InferenceResult const &ir) {
     assert(requestsInfo[i].num_tokens_in_batch > 0);
     int processed_tokens = requestsInfo[i].token_start_offset +
                            requestsInfo[i].num_tokens_in_batch;
-    if (processed_tokens >= max_sequence_length[i]
+    if (processed_tokens >= requestsInfo[i].max_sequence_length
         // || ir.results[t] == 0 TODO: replace this with <EOS>
     ) {
       log_bc.print("[Done] guid(%zu) final_length(%d)",
-                   requestsInfo[i].guid,
+                   requestsInfo[i].request_guid,
                    processed_tokens);
       request_completed[i] = true;
       requestsInfo[i].num_tokens_in_batch = 0;
@@ -62,22 +62,23 @@ int BatchConfig::update_results(InferenceResult const &ir) {
       requestsInfo[i].num_tokens_in_batch = 1;
     }
   }
-  update_num_active_requests_tokens();
   return completed;
 }
 
+// Deprecated API; RequestManager::new_batch and RequestManager::update_batch
+// automatically register new requests.
 bool BatchConfig::register_new_request(size_t guid,
                                        int initial_len,
                                        int tokens_to_generate) {
-  cached_results = false;
+  assert(false);
   assert(initial_len > 0 && tokens_to_generate > 0);
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
     if (request_completed[i]) {
       log_bc.print("[NewRequest] guid(%zu) length(%d)", guid, initial_len);
       requestsInfo[i].token_start_offset = 0;
       requestsInfo[i].num_tokens_in_batch = initial_len;
-      requestsInfo[i].guid = guid;
-      max_sequence_length[i] = initial_len + tokens_to_generate;
+      requestsInfo[i].request_guid = guid;
+      requestsInfo[i].max_sequence_length = initial_len + tokens_to_generate;
       request_completed[i] = false;
       update_num_active_requests_tokens();
       return true;
@@ -87,55 +88,63 @@ bool BatchConfig::register_new_request(size_t guid,
   return false;
 }
 
+// Deprecated API
 void BatchConfig::prepare_next_batch() {
-  assert(cached_results);
-  assert(num_requests > 0 && num_tokens > 0);
+  assert(false);
+  assert(num_tokens > 0);
   log_bc.print("[NextBatch] num_tokens(%d)", num_tokens);
 }
 
+// Deprecated API; cannot use this since we need to
+// add token_id, which is missing in this API
 void BatchConfig::update_num_active_requests_tokens() {
-  num_requests = 0;
+  assert(false);
   num_tokens = 0;
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
     if (!request_completed[i]) {
-      num_requests++;
+      int start_idx = requestsInfo[i].token_start_offset;
       for (int j = 0; j < requestsInfo[i].num_tokens_in_batch; j++) {
-        int start_idx = requestsInfo[i].token_start_offset;
         tokensInfo[num_tokens].abs_depth_in_request = start_idx + j;
         tokensInfo[num_tokens].request_index = i;
         num_tokens++;
       }
     }
   }
-  cached_results = true;
 }
 
 int BatchConfig::num_active_requests() const {
-  if (cached_results) {
-    return num_requests;
-  } else {
-    assert(false &&
-           "some BatchConfig functions updated requests but didn't call "
-           "() before exit");
+  int num_requests = 0;
+  for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
+    if (!request_completed[i]) {
+      num_requests++;
+    }
   }
+  return num_requests;
+  // if (cached_results) {
+  //   return num_requests;
+  // } else {
+  //   assert(false &&
+  //          "some BatchConfig functions updated requests but didn't call "
+  //          "() before exit");
+  // }
 }
 
 int BatchConfig::num_active_tokens() const {
-  if (cached_results) {
-    return num_tokens;
-  } else {
-    assert(false &&
-           "some BatchConfig functions updated requests but didn't call "
-           "update_num_active_requests_tokens() before exit");
-  }
+  // if (cached_results) {
+  return num_tokens;
+  //} else {
+  //  assert(false &&
+  //         "some BatchConfig functions updated requests but didn't call "
+  //         "update_num_active_requests_tokens() before exit");
+  //}
 }
 
 void BatchConfig::print() const {
   std::cout << "Max number of requests: " << MAX_NUM_REQUESTS << std::endl;
   std::cout << "Max number of tokens: " << MAX_NUM_TOKENS << std::endl;
   std::cout << "Number of tokens: " << num_tokens << std::endl;
-  std::cout << "Number of requests: " << num_requests << std::endl;
-  std::cout << "Cached results: " << cached_results << std::endl;
+  std::cout << "Number of requests: " << num_active_requests() << std::endl;
+  // std::cout << "Cached results: " << cached_results << std::endl;
 
   std::cout << "Per-request info:\n";
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
@@ -145,9 +154,9 @@ void BatchConfig::print() const {
                 << requestsInfo[i].token_start_offset << std::endl;
       std::cout << "    Number of tokens in batch: "
                 << requestsInfo[i].num_tokens_in_batch << std::endl;
-      std::cout << "    GUID: " << requestsInfo[i].guid << std::endl;
-      std::cout << "    Max sequence length: " << max_sequence_length[i]
-                << std::endl;
+      std::cout << "    GUID: " << requestsInfo[i].request_guid << std::endl;
+      std::cout << "    Max sequence length: "
+                << requestsInfo[i].max_sequence_length << std::endl;
       std::cout << "    Request completed: " << request_completed[i]
                 << std::endl;
     }
@@ -160,6 +169,7 @@ void BatchConfig::print() const {
               << tokensInfo[i].abs_depth_in_request << std::endl;
     std::cout << "    Request index: " << tokensInfo[i].request_index
               << std::endl;
+    std::cout << "    Token id: " << tokensInfo[i].token_id << std::endl;
   }
 }
 
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 60294d4a75..a65fa184f8 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -1,4 +1,4 @@
-/* Copyright 2022 CMU, Stanford, Facebook, LANL
+/* Copyright 2023 CMU, Stanford, Facebook, LANL
  *
  * Licensed under the Apache License, Version 2.0 (the "License");
  * you may not use this file except in compliance with the License.
@@ -148,11 +148,21 @@ FutureMap InferenceManager::inference(int index, BatchConfig const &bc) {
   // on the device_index-th device (except for the experts layers)
   int batch_index = index % max_num_inflight_batches;
   FutureMap fm;
+  bool found_input_operator = false;
   for (size_t o = 0; o < model->operators.size(); o++) {
     Op *op = model->operators[o];
-    if (op->op_type == OP_WEIGHT || op->op_type == OP_INPUT) {
+    if (op->op_type == OP_WEIGHT) {
       continue;
     }
+    if (op->op_type == OP_INPUT) {
+      //FIXME: this is a hack, should be replace with an input ParallelTensor
+      if (found_input_operator)
+        continue;
+      found_input_operator = true;
+      assert(op->numOutputs == 1);
+      ParallelTensor pt = tensor_buffer[op->outputs[0]][batch_index];
+      load_input_tokens_from_batch_config(bc, pt);
+    }
 
     std::vector<ParallelTensor> inputs(op->numInputs);
     std::vector<ParallelTensor> outputs(op->numOutputs);
@@ -179,4 +189,24 @@ FutureMap InferenceManager::inference(int index, BatchConfig const &bc) {
   return fm;
 };
 
+void InferenceManager::load_input_tokens_from_batch_config(
+    BatchConfig const &bc, ParallelTensor const input) {
+  Context ctx = model->config.lg_ctx;
+  Runtime *runtime = model->config.lg_hlr;
+  size_t machine_view_hash = input->machine_view.hash();
+  ArgumentMap argmap;
+  IndexLauncher launcher(RM_LOAD_TOKENS_TASK_ID,
+                         input->parallel_is,
+                         TaskArgument(&bc, sizeof(BatchConfig)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(
+      input->part, 0 /*projection id*/, WRITE_ONLY, EXCLUSIVE, input->region));
+  launcher.add_field(0, FID_DATA);
+  runtime->execute_index_space(ctx, launcher);
+}
+
 }; // namespace FlexFlow
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 915688f3c8..328d4cc3af 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -1252,37 +1252,9 @@ OpMeta::OpMeta(FFHandler _handle, Op const *op) : OpMeta(_handle) {
   }
 }
 
-FFModel::FFModel(FFConfig &_config)
-    : op_global_guid(OP_GUID_FIRST_VALID),
-      layer_global_guid(LAYER_GUID_FIRST_VALID),
-      tensor_global_guid(TENSOR_GUID_FIRST_VALID),
-      parallel_tensor_global_guid(PARALLEL_TENSOR_GUID_FIRST_VALID),
-      node_global_guid(NODE_GUID_FIRST_VALID), config(_config), optimizer(NULL),
-      loss_op(NULL), metrics_op(NULL), simulator(NULL) {
-  this->search = new PCG::SearchHelper(this);
-  this->graph_search = new PCG::GraphSearchHelper(this);
-
+FFRuntime::FFRuntime(FFConfig &config) {
   Runtime *runtime = config.lg_hlr;
   Context ctx = config.lg_ctx;
-  // Register machine views
-  register_all_machine_views(config.numNodes,
-                             config.workersPerNode,
-                             config.cpusPerNode,
-                             all_valid_views);
-  metrics_input = -1;
-  // Load strategy file
-  // Create field space
-  {
-    FieldAllocator allocator =
-        runtime->create_field_allocator(ctx, config.field_space);
-    allocator.allocate_field(sizeof(float), FID_DATA);
-  }
-  // Build training dataset
-  // if (config.datasetPath.length() == 0) {
-  //  dataLoader = NULL;
-  //} else {
-  //  dataLoader = new DataLoader(config.datasetPath);
-  //}
 
   ArgumentMap argmap;
   Rect<1> task_rect(Point<1>(0),
@@ -1316,6 +1288,48 @@ FFModel::FFModel(FFConfig &_config)
   }
 }
 
+FFRuntime *ffruntime_singleton = nullptr;
+
+FFModel::FFModel(FFConfig &_config)
+    : op_global_guid(OP_GUID_FIRST_VALID),
+      layer_global_guid(LAYER_GUID_FIRST_VALID),
+      tensor_global_guid(TENSOR_GUID_FIRST_VALID),
+      parallel_tensor_global_guid(PARALLEL_TENSOR_GUID_FIRST_VALID),
+      node_global_guid(NODE_GUID_FIRST_VALID), config(_config), optimizer(NULL),
+      loss_op(NULL), metrics_op(NULL), simulator(NULL) {
+  this->search = new PCG::SearchHelper(this);
+  this->graph_search = new PCG::GraphSearchHelper(this);
+
+  if (ffruntime_singleton == nullptr) {
+    ffruntime_singleton = new FFRuntime(_config);
+  }
+
+  Runtime *runtime = config.lg_hlr;
+  Context ctx = config.lg_ctx;
+  // Register machine views
+  register_all_machine_views(config.numNodes,
+                             config.workersPerNode,
+                             config.cpusPerNode,
+                             all_valid_views);
+  metrics_input = -1;
+  // Load strategy file
+  // Create field space
+  {
+    FieldAllocator allocator =
+        runtime->create_field_allocator(ctx, config.field_space);
+    allocator.allocate_field(sizeof(float), FID_DATA);
+  }
+  // Build training dataset
+  // if (config.datasetPath.length() == 0) {
+  //  dataLoader = NULL;
+  //} else {
+  //  dataLoader = new DataLoader(config.datasetPath);
+  //}
+  for (int idx = 0; idx < config.workersPerNode * config.numNodes; idx++) {
+    handlers[idx] = ffruntime_singleton->handlers[idx];
+  }
+}
+
 void FFModel::clear_graph_search_cache() {
   this->graph_search->clear_cache();
   this->search->clear_cache();
@@ -3853,6 +3867,15 @@ void register_flexflow_internal_tasks() {
     Runtime::preregister_task_variant<FFHandler, UtilityTasks::init_cuda_task>(
         registrar, "cuda_init_task");
   }
+  // RequestManager load_tokens
+  {
+    TaskVariantRegistrar registrar(RM_LOAD_TOKENS_TASK_ID,
+                                   "RequestManager Load Tokens");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<RequestManager::load_tokens_task>(
+        registrar, "RequestManager Load Tokens Task");
+  }
   // ElementUnary task
   {
     TaskVariantRegistrar registrar(ELEMENTUNARY_INIT_TASK_ID,
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
new file mode 100644
index 0000000000..7374d36bfa
--- /dev/null
+++ b/src/runtime/request_manager.cc
@@ -0,0 +1,139 @@
+/* Copyright 2023 CMU, Stanford, Facebook, LANL
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/inference.h"
+#include "flexflow/parallel_ops/parallel_op.h"
+
+namespace FlexFlow {
+
+using namespace Legion;
+
+LegionRuntime::Logger::Category log_req_mgr("RequestManager");
+
+RequestManager::RequestManager() : next_available_guid(1000000) {}
+
+RequestManager::RequestGuid
+    RequestManager::register_new_request(std::vector<TokenId> const &prompt,
+                                         int max_sequence_length) {
+  const std::lock_guard<std::mutex> lock(request_queue_mutex);
+
+  // Add a new request
+  Request request;
+  request.guid = next_available_guid++;
+  request.max_sequence_length = max_sequence_length;
+  request.tokens = prompt;
+
+  pending_request_queue.push(request);
+  return request.guid;
+}
+
+BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
+                                               InferenceResult const &result) {
+  const std::lock_guard<std::mutex> lock(request_queue_mutex);
+  // Step 1: use result to update requests
+  for (int i = 0; i < old_bc.num_tokens; i++) {
+    size_t guid =
+        old_bc.requestsInfo[old_bc.tokensInfo[i].request_index].request_guid;
+    Request &request = running_request_queue[guid];
+    if (old_bc.tokensInfo[i].abs_depth_in_request + 1 < request.tokens.size()) {
+      // This is a prompt token
+      continue;
+    } else {
+      assert(old_bc.tokensInfo[i].abs_depth_in_request + 1 ==
+             request.tokens.size());
+      // This is a decoding token
+      request.tokens.push_back(result.token_ids[i]);
+    }
+  }
+  // Step 2: preparing the next batch for existing requests
+  BatchConfig new_bc;
+  for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
+    if (old_bc.request_completed[i]) {
+      continue;
+    }
+    assert(old_bc.requestsInfo[i].num_tokens_in_batch > 0);
+    Request &request =
+        running_request_queue[old_bc.requestsInfo[i].request_guid];
+    int processed_tokens = old_bc.requestsInfo[i].token_start_offset +
+                           old_bc.requestsInfo[i].num_tokens_in_batch;
+    assert(processed_tokens < request.tokens.size());
+    if (request.tokens.size() >= old_bc.requestsInfo[i].max_sequence_length
+        // || ir.results[t] == 0 TODO: replace this with <EOS>
+    ) {
+      log_req_mgr.print("[Done] guid(%zu) final_length(%zu)",
+                        old_bc.requestsInfo[i].request_guid,
+                        request.tokens.size());
+    } else {
+      new_bc.request_completed[i] = false;
+      new_bc.requestsInfo[i].token_start_offset = processed_tokens;
+      new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
+      new_bc.requestsInfo[i].max_sequence_length =
+          old_bc.requestsInfo[i].max_sequence_length;
+      if (new_bc.requestsInfo[i].token_start_offset + 1 ==
+          request.tokens.size()) {
+        // Incremental phase
+        new_bc.requestsInfo[i].num_tokens_in_batch = 1;
+      } else {
+        // Prompt phase
+        new_bc.requestsInfo[i].num_tokens_in_batch =
+            std::min(BatchConfig::MAX_NUM_TOKENS - new_bc.num_tokens,
+                     (int)request.tokens.size() -
+                         new_bc.requestsInfo[i].token_start_offset);
+      }
+      for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
+        int depth = new_bc.requestsInfo[i].token_start_offset + j;
+        new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
+        new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = depth;
+        assert(depth < request.tokens.size());
+        new_bc.tokensInfo[new_bc.num_tokens].token_id = request.tokens[depth];
+        new_bc.num_tokens++;
+      }
+    }
+  }
+  // Step 3: add new requests to the next batch
+  for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
+    if (new_bc.request_completed[i]) {
+      if (!pending_request_queue.empty() &&
+          new_bc.num_tokens < BatchConfig::MAX_NUM_TOKENS) {
+        Request const &new_request = pending_request_queue.front();
+        pending_request_queue.pop();
+        running_request_queue[new_request.guid] = new_request;
+        new_bc.requestsInfo[i].token_start_offset = 0;
+        new_bc.requestsInfo[i].request_guid = new_request.guid;
+        new_bc.requestsInfo[i].num_tokens_in_batch =
+            std::min(BatchConfig::MAX_NUM_TOKENS - new_bc.num_tokens,
+                     (int)new_request.tokens.size());
+        new_bc.requestsInfo[i].max_sequence_length =
+            new_request.max_sequence_length;
+        new_bc.request_completed[i] = false;
+        for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
+          int depth = new_bc.requestsInfo[i].token_start_offset + j;
+          new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
+          new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = depth;
+          assert(depth < new_request.tokens.size());
+          new_bc.tokensInfo[new_bc.num_tokens].token_id =
+              new_request.tokens[depth];
+          new_bc.num_tokens++;
+        }
+        if (new_bc.num_tokens == BatchConfig::MAX_NUM_TOKENS) {
+          break;
+        }
+      }
+    }
+  }
+  return new_bc;
+}
+
+}; // namespace FlexFlow
diff --git a/src/runtime/request_manager.cu b/src/runtime/request_manager.cu
new file mode 100644
index 0000000000..32e872125c
--- /dev/null
+++ b/src/runtime/request_manager.cu
@@ -0,0 +1,50 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/inference.h"
+#include "flexflow/utils/cuda_helper.h"
+
+namespace FlexFlow {
+
+using namespace Legion;
+
+void RequestManager::load_tokens_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  assert(regions.size() == 1);
+  assert(task->regions.size() == 1);
+
+  BatchConfig const batch_config = *((BatchConfig *)task->args);
+  BatchConfig::TokenId dram_copy[BatchConfig::MAX_NUM_TOKENS];
+  for (int i = 0; i < batch_config.num_tokens; i++) {
+    dram_copy[i] = batch_config.tokensInfo[i].token_id;
+  }
+  TokenId *fb_ptr = helperGetTensorPointerWO<TokenId>(
+      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  Domain domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  assert(batch_config.num_tokens <= domain.get_volume());
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  checkCUDA(cudaMemcpyAsync(fb_ptr,
+                            dram_copy,
+                            sizeof(TokenId) * batch_config.num_tokens,
+                            cudaMemcpyHostToDevice,
+                            stream));
+}
+
+}; // namespace FlexFlow

From dbaa1f0e999f5dd59b38255d3c8d4d09a28d3c09 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 30 Apr 2023 22:27:19 -0400
Subject: [PATCH 101/344] add llama to CI, comment out other tests

---
 examples/cpp/inference/LLAMA/llama.cc | 11 +----------
 src/runtime/inference_manager.cc      |  5 +++--
 tests/cpp_gpu_tests.sh                | 10 ++++++----
 3 files changed, 10 insertions(+), 16 deletions(-)

diff --git a/examples/cpp/inference/LLAMA/llama.cc b/examples/cpp/inference/LLAMA/llama.cc
index f05526ce9b..910d3e84b3 100644
--- a/examples/cpp/inference/LLAMA/llama.cc
+++ b/examples/cpp/inference/LLAMA/llama.cc
@@ -209,16 +209,7 @@ void FlexFlow::top_level_task(Task const *task,
   loader.reset();
 
   for (int i = 0; i < llamaConfig.batchSize; i++) {
-    std::vector<BatchConfig::TokenId> tokens{
-        0,
-        0,
-        0,
-        0,
-        0,
-        0,
-        0,
-        0
-    };
+    std::vector<BatchConfig::TokenId> tokens{0, 0, 0, 0, 0, 0, 0, 0};
     rm.register_new_request(tokens, 347);
   }
 
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index a65fa184f8..5aeee2609c 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -155,9 +155,10 @@ FutureMap InferenceManager::inference(int index, BatchConfig const &bc) {
       continue;
     }
     if (op->op_type == OP_INPUT) {
-      //FIXME: this is a hack, should be replace with an input ParallelTensor
-      if (found_input_operator)
+      // FIXME: this is a hack, should be replace with an input ParallelTensor
+      if (found_input_operator) {
         continue;
+      }
       found_input_operator = true;
       assert(op->numOutputs == 1);
       ParallelTensor pt = tensor_buffer[op->outputs[0]][batch_index];
diff --git a/tests/cpp_gpu_tests.sh b/tests/cpp_gpu_tests.sh
index 591b0e82be..fbf33cc04d 100755
--- a/tests/cpp_gpu_tests.sh
+++ b/tests/cpp_gpu_tests.sh
@@ -47,8 +47,9 @@ if [[ -f "$FF_HOME/build/examples/cpp/AlexNet/alexnet" ]]; then
 	# "$FF_HOME"/build/examples/cpp/split_test/split_test -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
 	# "$FF_HOME"/build/examples/cpp/split_test_2/split_test_2 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
 	# Inference examples
-	"$FF_HOME"/build/examples/cpp/inference/mixture_of_experts/inference_moe -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
-	"$FF_HOME"/build/examples/cpp/inference/transformers/inference_transformers -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
+	"$FF_HOME"/build/examples/cpp/inference/LLAMA/LLAMA -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
+	#"$FF_HOME"/build/examples/cpp/inference/mixture_of_experts/inference_moe -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
+	#"$FF_HOME"/build/examples/cpp/inference/transformers/inference_transformers -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
 else
 	python_packages=$(python -c "from distutils import sysconfig; print(sysconfig.get_python_lib(plat_specific=False,standard_lib=False))")
 	OLD_PATH="$PATH"
@@ -78,8 +79,9 @@ else
 			# split_test -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
 			# split_test_2 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
 			# Inference examples
-			inference_moe -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
-			inference_transformers -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
+			LLAMA -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
+			#inference_moe -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
+			#inference_transformers -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
 		fi
 	done
 	export PATH="$OLD_PATH"

From 91750d8d79a49aaaaff42841b0e778f6242dccd0 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Mon, 1 May 2023 20:11:52 -0500
Subject: [PATCH 102/344] Support multi-GPU inference (#699)

* Support multiple FFModels in a single top_level_task

* initial implementation

* initial implementation

* [RequestManager] more work

* [RequestManager] initial implementation done

* bug fix

* Support multi-GPU inference

* .

* fix machine view (#702)

---------

Co-authored-by: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
---
 examples/cpp/inference/LLAMA/dataloader.cc    |  38 +--
 examples/cpp/inference/LLAMA/llama.cc         |  40 ++-
 examples/cpp/inference/LLAMA/llama.h          |   2 +-
 .../cpp/inference/mixture_of_experts/moe.cc   |  13 +-
 .../inference/transformers/transformers.cc    |  13 +-
 include/flexflow/inference.h                  |  12 +-
 include/flexflow/model.h                      |   1 +
 src/ops/kernels/embedding_kernels.cu          |   2 +-
 src/ops/rms_norm.cc                           |   2 +-
 src/runtime/batch_config.cc                   |   6 +-
 src/runtime/inference_manager.cc              | 314 +++++++++++++++++-
 src/runtime/model.cc                          |   6 +-
 src/runtime/parallel_tensor.cc                |   4 +-
 src/runtime/request_manager.cc                |   2 +-
 14 files changed, 391 insertions(+), 64 deletions(-)

diff --git a/examples/cpp/inference/LLAMA/dataloader.cc b/examples/cpp/inference/LLAMA/dataloader.cc
index 1370d3f724..1bfadde559 100644
--- a/examples/cpp/inference/LLAMA/dataloader.cc
+++ b/examples/cpp/inference/LLAMA/dataloader.cc
@@ -29,27 +29,27 @@ DataLoader::DataLoader(FFModel &ff,
       // Assume only the first dim can be the replica dim
       assert(i == num_dims - 1 || (!dims[i].is_replica_dim));
     }
-    dims[num_dims - 1].size = num_samples;
-    full_input =
-        ff.create_parallel_tensor_legion_ordering(num_dims, dims, DT_INT64);
-    assert(full_input != nullptr && "full_input is nullptr");
-    ff.map_tensor(full_input, NULL /*parallel_op*/);
+    // dims[num_dims - 1].size = num_samples;
+    // full_input =
+    //     ff.create_parallel_tensor_legion_ordering(num_dims, dims, DT_INT64);
+    // assert(full_input != nullptr && "full_input is nullptr");
+    // ff.map_tensor(full_input, NULL /*parallel_op*/);
   }
 
-  size_t llamaconfig_size = sizeof(llamaconfig);
-  std::cout << "llama config dataloader: " << llamaconfig->input_path;
-
-  // Load entire dataset
-  TaskLauncher launcher(CUSTOM_CPU_TASK_ID_1,
-                        TaskArgument(llamaconfig, llamaconfig_size));
-  // regions[1]: full_input
-  launcher.add_region_requirement(RegionRequirement(full_input->region,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    full_input->region,
-                                                    MAP_TO_FB_MEMORY));
-  launcher.add_field(0, FID_DATA);
-  runtime->execute_task(ctx, launcher);
+  // size_t llamaconfig_size = sizeof(llamaconfig);
+  // std::cout << "llama config dataloader: " << llamaconfig->input_path;
+
+  // // Load entire dataset
+  // TaskLauncher launcher(CUSTOM_CPU_TASK_ID_1,
+  //                      TaskArgument(llamaconfig, llamaconfig_size));
+  // // regions[1]: full_input
+  // launcher.add_region_requirement(RegionRequirement(full_input->region,
+  //                                                  WRITE_ONLY,
+  //                                                  EXCLUSIVE,
+  //                                                  full_input->region,
+  //                                                  MAP_TO_FB_MEMORY));
+  // launcher.add_field(0, FID_DATA);
+  // runtime->execute_task(ctx, launcher);
 }
 
 void DataLoader::load_entire_dataset(Task const *task,
diff --git a/examples/cpp/inference/LLAMA/llama.cc b/examples/cpp/inference/LLAMA/llama.cc
index 910d3e84b3..321f870a8f 100644
--- a/examples/cpp/inference/LLAMA/llama.cc
+++ b/examples/cpp/inference/LLAMA/llama.cc
@@ -44,6 +44,20 @@ void FlexFlow::top_level_task(Task const *task,
   FFConfig ffconfig;
   LLAMAConfig llamaConfig;
   FFModel ff(ffconfig);
+  //------------------------------compute machine views ------------------
+  int num_devices = ffconfig.workersPerNode * ffconfig.numNodes;
+  std::vector<MachineView> machine_views;
+  for (int i = 0; i < num_devices; i++) {
+    MachineView view;
+    view.device_type = MachineView::GPU;
+    view.ndims = 1;
+    view.dim[0] = 1;
+    view.stride[0] = 0;
+    view.start_device_id = i;
+    machine_views.push_back(view);
+  }
+
+  std::unordered_map<Tensor, std::vector<MachineView>> mapping;
   std::unordered_map<std::string, Layer *> weights_layers;
 
   // InputArgs const &command_args = HighLevelRuntime::get_input_args();
@@ -60,6 +74,7 @@ void FlexFlow::top_level_task(Task const *task,
     int const token_dims[] = {llamaConfig.batchSize, llamaConfig.max_seq_len};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
+  mapping[input].push_back(machine_views[0]);
 
   Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
   Tensor token = ff.embedding(input,
@@ -79,11 +94,19 @@ void FlexFlow::top_level_task(Task const *task,
   // }
 
   // n transformer blocks impl
-  for (int i = 0; i < 10; i++) {
+  int num_transformer_layers_per_gpu = (32 + num_devices - 1) / num_devices;
+  for (int i = 0; i < 32; i++) {
     // step 1: attention
     std::vector<int> axes = {2};
     Tensor att_norm = ff.rms_norm(token, llamaConfig.norm_eps, llamaConfig.dim);
     Layer *attention_norm = ff.layers.back();
+    if (i % num_transformer_layers_per_gpu == 0) {
+      // Map att_norm to the next GPU
+      // since the size of att_norm is minimum across
+      // all tensors
+      mapping[att_norm].push_back(
+          machine_views[i / num_transformer_layers_per_gpu]);
+    }
     weights_layers.emplace("layers_" + std::to_string(i) +
                                "_attention_norm_weight",
                            attention_norm);
@@ -144,13 +167,9 @@ void FlexFlow::top_level_task(Task const *task,
   //------------------- compile the model --------------------------------
   std::cout << "------start compile ----------" << std::endl;
   InferenceManager im(&ff, llamaConfig.batchSize, 1);
-  im.compile_model_and_allocate_buffer();
+  im.compile_model_and_allocate_buffer(&ff, mapping);
   RequestManager rm;
 
-  std::cout << "------init ops----------" << std::endl;
-  im.init_operators_inference();
-  std::cout << "------model compiled and init ----------" << std::endl;
-
   //------------------------------ load inputs --------------------------
   std::cout << "------create dataloaders ----------" << std::endl;
   // read prompt into input
@@ -198,8 +217,13 @@ void FlexFlow::top_level_task(Task const *task,
     ParallelTensor weight_pt;
     ff.get_parallel_tensor_from_tensor(weight, weight_pt);
     weight_pt->set_tensor<float>(&ff, dims_vec, data);
+    delete data;
   }
   std::cout << "------load wieght finished----------" << std::endl;
+  //------------------------------ init operators ------------------------
+  std::cout << "------init ops----------" << std::endl;
+  im.init_operators_inference(&ff);
+  std::cout << "------model compiled and init ----------" << std::endl;
 
   //------------------------------ do inference---------------------------
   int processed_requests = 0;
@@ -221,7 +245,7 @@ void FlexFlow::top_level_task(Task const *task,
       InferenceResult ir;
       bc = rm.prepare_next_batch(bc, ir);
       std::cout << "new tokens: " << bc.num_tokens;
-      FutureMap fm = im.inference(bid, bc);
+      FutureMap fm = im.inference(&ff, bid, bc);
       assert(fm.get_future_map_domain().get_volume() == 1);
       future_handlers[bid] = fm.get_future(0);
       batch_configs[bid] = bc;
@@ -239,7 +263,7 @@ void FlexFlow::top_level_task(Task const *task,
       processed_requests += bc.num_tokens;
       bc = rm.prepare_next_batch(bc, ir);
       std::cout << "new tokens: " << bc.num_tokens;
-      FutureMap fm = im.inference(bid, bc);
+      FutureMap fm = im.inference(&ff, bid, bc);
       assert(fm.get_future_map_domain().get_volume() == 1);
       future_handlers[bid] = fm.get_future(0);
       batch_configs[bid] = bc;
diff --git a/examples/cpp/inference/LLAMA/llama.h b/examples/cpp/inference/LLAMA/llama.h
index 978eb2bf10..75b7d3ff1b 100644
--- a/examples/cpp/inference/LLAMA/llama.h
+++ b/examples/cpp/inference/LLAMA/llama.h
@@ -41,7 +41,7 @@ struct LLAMAConfig {
 
     // todo from args
     weight_file_path =
-        "/home/ubuntu/FlexFlow/examples/cpp/inference/LLAMA/weights/";
+        "/home/ubuntu/FlexFlow_Inference/examples/cpp/inference/LLAMA/weights/";
     input_path = "/home/ubuntu/FlexFlow/examples/cpp/inference/LLAMA/tokens/"
                  "llama_demo_tokens";
 
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index b3a9b4941a..22752db39a 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -141,8 +141,9 @@ void FlexFlow::top_level_task(Task const *task,
   //------------------- Initialize the inference manager ------------------
   InferenceManager im(
       &ff, moeConfig.batch_size, moeConfig.num_inflight_batches);
-  im.compile_model_and_allocate_buffer();
-  im.init_operators_inference();
+  std::unordered_map<Tensor, std::vector<MachineView>> mapping;
+  im.compile_model_and_allocate_buffer(&ff, mapping);
+  im.init_operators_inference(&ff);
 
   //------------ Initialize the data loader and data generator ------------
   /*size_t min_input_tokens = 32, max_input_tokens = 512,
@@ -185,7 +186,7 @@ void FlexFlow::top_level_task(Task const *task,
   BatchConfig *bc = nullptr;
   std::map<size_t, int> batch_predictions[im.max_num_inflight_batches];
 
-  assert(im.max_num_requests_per_batch == moeConfig.batch_size);
+  assert(im.max_num_tokens_per_batch == moeConfig.batch_size);
 
   // simulation loop. For deployment, we will use a while(true)
   while (processed_requests < moeConfig.total_requests) {
@@ -193,7 +194,7 @@ void FlexFlow::top_level_task(Task const *task,
       size_t max_reqs, max_tkns;
       if (future_handlers.find(bid) == future_handlers.end()) {
         max_reqs = moeConfig.incremental_mode ? bc->MAX_NUM_REQUESTS
-                                              : im.max_num_requests_per_batch;
+                                              : im.max_num_tokens_per_batch;
         max_tkns = moeConfig.sequence_length * moeConfig.batch_size;
         new_prompts = data_generator.get_requests(max_reqs, max_tkns);
         bc = new BatchConfig();
@@ -208,7 +209,7 @@ void FlexFlow::top_level_task(Task const *task,
         processed_requests += bc->update_results(&ir);
         max_reqs = moeConfig.incremental_mode
                        ? bc->MAX_NUM_REQUESTS - bc->num_active_requests()
-                       : im.max_num_requests_per_batch;
+                       : im.max_num_tokens_per_batch;
         max_tkns = moeConfig.sequence_length * moeConfig.batch_size -
                    (moeConfig.incremental_mode ? bc->num_active_tokens() : 0);
         new_prompts = data_generator.get_requests(max_reqs, max_tkns);
@@ -232,7 +233,7 @@ void FlexFlow::top_level_task(Task const *task,
 
       // runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
       data_loader.next_batch(ff, bid, bc, batch_predictions[bid], view);
-      FutureMap fm = im.inference(bid, *bc);
+      FutureMap fm = im.inference(&ff, bid, *bc);
       // runtime->end_trace(ctx, 111 + bid % num_devices /*trace_id*/);
 
       assert(fm.get_future_map_domain().get_volume() == 1);
diff --git a/examples/cpp/inference/transformers/transformers.cc b/examples/cpp/inference/transformers/transformers.cc
index 8a8c0cb53e..860fd23fe4 100644
--- a/examples/cpp/inference/transformers/transformers.cc
+++ b/examples/cpp/inference/transformers/transformers.cc
@@ -117,8 +117,9 @@ void FlexFlow::top_level_task(Task const *task,
   InferenceManager im(&ff,
                       transformerConfig.batch_size,
                       transformerConfig.num_inflight_batches);
-  im.compile_model_and_allocate_buffer();
-  im.init_operators_inference();
+  std::unordered_map<Tensor, std::vector<MachineView>> mapping;
+  im.compile_model_and_allocate_buffer(&ff, mapping);
+  im.init_operators_inference(&ff);
 
   //------------ Initialize the data loader and data generator ------------
   /* size_t min_input_tokens = 32, max_input_tokens = 512,
@@ -161,7 +162,7 @@ void FlexFlow::top_level_task(Task const *task,
   BatchConfig *bc = nullptr;
   std::map<size_t, int> batch_predictions[im.max_num_inflight_batches];
 
-  assert(im.max_num_requests_per_batch == transformerConfig.batch_size);
+  assert(im.max_num_tokens_per_batch == transformerConfig.batch_size);
   // assert(transformerConfig.batch_size <= BatchConfig::MAX_NUM_REQUESTS);
 
   // simulation loop. For deployment, we will use a while(true)
@@ -171,7 +172,7 @@ void FlexFlow::top_level_task(Task const *task,
       if (future_handlers.find(bid) == future_handlers.end()) {
         max_reqs = transformerConfig.incremental_mode
                        ? bc->MAX_NUM_REQUESTS
-                       : im.max_num_requests_per_batch;
+                       : im.max_num_tokens_per_batch;
         max_tkns =
             transformerConfig.sequence_length * transformerConfig.batch_size;
         new_prompts = data_generator.get_requests(max_reqs, max_tkns);
@@ -187,7 +188,7 @@ void FlexFlow::top_level_task(Task const *task,
         processed_requests += bc->update_results(&ir);
         max_reqs = transformerConfig.incremental_mode
                        ? bc->MAX_NUM_REQUESTS - bc->num_active_requests()
-                       : im.max_num_requests_per_batch;
+                       : im.max_num_tokens_per_batch;
         max_tkns =
             transformerConfig.sequence_length * transformerConfig.batch_size -
             (transformerConfig.incremental_mode ? bc->num_active_tokens() : 0);
@@ -212,7 +213,7 @@ void FlexFlow::top_level_task(Task const *task,
 
       // runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
       data_loader.next_batch(ff, bid, bc, batch_predictions[bid], view);
-      FutureMap fm = im.inference(bid, *bc);
+      FutureMap fm = im.inference(&ff, bid, *bc);
       // runtime->end_trace(ctx, 111 + bid % num_devices /*trace_id*/);
 
       assert(fm.get_future_map_domain().get_volume() == 1);
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index 0415d85d11..0079a570b7 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -26,19 +26,21 @@ class FFModel;
 class InferenceManager {
 public:
   InferenceManager(FFModel *_model,
-                   int max_num_requests_per_batch,
+                   int max_num_tokens_per_batch,
                    int max_num_inflight_batches);
-  void compile_model_and_allocate_buffer(void);
-  void init_operators_inference();
+  void compile_model_and_allocate_buffer(
+      FFModel *model,
+      std::unordered_map<Tensor, std::vector<MachineView>> const &mapping);
+  void init_operators_inference(FFModel *model);
   MachineView *get_machine_view(int mv_id);
-  Legion::FutureMap inference(int index, BatchConfig const &bc);
+  Legion::FutureMap inference(FFModel *model, int index, BatchConfig const &bc);
   void load_input_tokens_from_batch_config(BatchConfig const &bc,
                                            ParallelTensor const input);
 
 public:
   std::unordered_map<ParallelTensor, std::vector<ParallelTensor>> tensor_buffer;
   FFModel *model;
-  int max_num_requests_per_batch;
+  int max_num_tokens_per_batch;
   int max_num_inflight_batches;
   int num_devices;
   std::vector<MachineView> machine_views;
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index d797158530..3cd5e2036e 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -837,6 +837,7 @@ class FFModel {
                LossType loss_type,
                std::vector<MetricsType> const &metrics,
                CompMode comp_mode = COMP_MODE_TRAINING);
+  void compile_inference();
   void graph_optimize(size_t budget,
                       bool only_data_parallel,
                       std::unique_ptr<PCG::Graph> &best_graph,
diff --git a/src/ops/kernels/embedding_kernels.cu b/src/ops/kernels/embedding_kernels.cu
index 65f3089409..22d8161ff1 100644
--- a/src/ops/kernels/embedding_kernels.cu
+++ b/src/ops/kernels/embedding_kernels.cu
@@ -60,7 +60,7 @@ void forward_kernel_wrapper(EmbeddingMeta const *m,
                                m->aggr,
                                output.domain.get_volume(),
                                stream);
-    } else if (weight.data_type == DT_HALF) {
+    } else if (weight.data_type == DT_DOUBLE) {
       Internal::forward_kernel(input.get_int32_ptr(),
                                output.get_double_ptr(),
                                weight.get_double_ptr(),
diff --git a/src/ops/rms_norm.cc b/src/ops/rms_norm.cc
index 5e02160b7c..57578f5793 100644
--- a/src/ops/rms_norm.cc
+++ b/src/ops/rms_norm.cc
@@ -238,7 +238,7 @@ void RMSNorm::init_inference(FFModel const &ff,
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
-                         outputs[0]->machine_view.hash());
+                         machine_view_hash);
   launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
                                                     0 /*projection id*/,
                                                     WRITE_ONLY,
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index 7412a184c6..5a41962a13 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -30,9 +30,9 @@ BatchConfig::BatchConfig() {
     request_completed[i] = true;
   }
   for (int i = 0; i < MAX_NUM_TOKENS; i++) {
-    tokensInfo[i].abs_depth_in_request = -1;
-    tokensInfo[i].request_index = -1;
-    tokensInfo[i].token_id = -1;
+    tokensInfo[i].abs_depth_in_request = 0;
+    tokensInfo[i].request_index = 0;
+    tokensInfo[i].token_id = 0;
   }
 }
 
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 5aeee2609c..a7da765391 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -13,7 +13,12 @@
  * limitations under the License.
  */
 
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/graph.h"
 #include "flexflow/inference.h"
+#include "flexflow/model.h"
+#include "flexflow/ops/fused.h"
+#include "flexflow/ops/noop.h"
 #include "flexflow/parallel_ops/parallel_op.h"
 
 namespace FlexFlow {
@@ -21,9 +26,9 @@ namespace FlexFlow {
 using namespace Legion;
 
 InferenceManager::InferenceManager(FFModel *_model,
-                                   int _max_num_requests_per_batch,
+                                   int _max_num_tokens_per_batch,
                                    int _max_num_inflight_batches)
-    : model(_model), max_num_requests_per_batch(_max_num_requests_per_batch),
+    : model(_model), max_num_tokens_per_batch(_max_num_tokens_per_batch),
       max_num_inflight_batches(_max_num_inflight_batches) {
   // populate array of valid single-device machine views
   num_devices = model->config.workersPerNode * model->config.numNodes;
@@ -38,18 +43,56 @@ InferenceManager::InferenceManager(FFModel *_model,
   }
 }
 
-void InferenceManager::compile_model_and_allocate_buffer(void) {
-  std::vector<MetricsType> metrics;
-  model->config.batchSize = max_num_requests_per_batch;
-  model->compile(
-      LOSS_MEAN_SQUARED_ERROR_AVG_REDUCE, metrics, COMP_MODE_INFERENCE);
+void InferenceManager::compile_model_and_allocate_buffer(
+    FFModel *model,
+    std::unordered_map<Tensor, std::vector<MachineView>> const
+        &tensor_mapping) {
+  model->config.batchSize = max_num_tokens_per_batch;
+  model->compile_inference();
   Context ctx = model->config.lg_ctx;
   Runtime *runtime = model->config.lg_hlr;
+
+  std::unordered_map<Op const *, std::vector<MachineView>> mapping;
+  for (auto const &it : tensor_mapping) {
+    ParallelTensor pt;
+    model->get_parallel_tensor_from_tensor(it.first, pt);
+    assert(pt->owner_op != nullptr);
+    mapping[pt->owner_op] = it.second;
+  }
   for (auto const &op : model->operators) {
     // Skip weight operators
     if (op->op_type == OP_WEIGHT) {
       continue;
     }
+    // Get machine views
+    std::vector<MachineView> machine_views;
+    if (mapping.find(op) != mapping.end()) {
+      machine_views = mapping[op];
+      assert(machine_views.size() == max_num_inflight_batches);
+    } else {
+      // Mapping the current operator using the same machine
+      // view as the inputs
+      assert(op->numInputs > 0);
+      for (int j = 0; j < max_num_inflight_batches; j++) {
+        MachineView mv = tensor_buffer[op->inputs[0]][j]->machine_view;
+        for (int k = 1; k < op->numInputs; k++) {
+          if (mv != tensor_buffer[op->inputs[k]][j]->machine_view) {
+            fprintf(stderr,
+                    "[Warning] a potentially unnecessary "
+                    " inter-GPU copy of size %zu\n",
+                    op->inputs[k]->get_volume());
+            // Heuristics: we use the mv with a larger start_device_id
+            // to promote load balancing
+            if (mv.start_device_id <
+                tensor_buffer[op->inputs[k]][j]->machine_view.start_device_id) {
+              mv = tensor_buffer[op->inputs[k]][j]->machine_view;
+            }
+          }
+        }
+        machine_views.push_back(mv);
+      }
+      assert(machine_views.size() == max_num_inflight_batches);
+    }
     for (int i = 0; i < op->numOutputs; i++) {
       ParallelTensor pt_base = op->outputs[i];
       assert(tensor_buffer.find(pt_base) == tensor_buffer.end());
@@ -63,11 +106,17 @@ void InferenceManager::compile_model_and_allocate_buffer(void) {
                                            pt_base->region.get_field_space());
         pt->part = runtime->get_logical_partition(
             ctx, pt->region, pt_base->part.get_index_partition());
+        pt->machine_view = machine_views[j];
+        Domain part_domain =
+            runtime->get_index_space_domain(ctx, pt_base->parallel_is);
+        assert(pt->machine_view.get_domain() == part_domain);
         list.push_back(pt);
       }
+      assert(tensor_buffer.find(pt_base) == tensor_buffer.end());
       tensor_buffer[pt_base] = list;
     }
   }
+#ifdef DEADCODE
   // Set machine_view for batch_tensors in the tensor_buffer
   for (int batch_index = 0; batch_index < max_num_inflight_batches;
        batch_index++) {
@@ -96,9 +145,10 @@ void InferenceManager::compile_model_and_allocate_buffer(void) {
       }
     }
   }
+#endif
 }
 
-void InferenceManager::init_operators_inference() {
+void InferenceManager::init_operators_inference(FFModel *model) {
   for (int batch_index = 0; batch_index < max_num_inflight_batches;
        batch_index++) {
     int expert_device_index = 0;
@@ -137,12 +187,16 @@ void InferenceManager::init_operators_inference() {
   }
 }
 
+// Deprecated API
 MachineView *InferenceManager::get_machine_view(int mv_id) {
+  assert(false);
   assert(mv_id >= 0 && mv_id < machine_views.size());
   return &machine_views[mv_id];
 }
 
-FutureMap InferenceManager::inference(int index, BatchConfig const &bc) {
+FutureMap InferenceManager::inference(FFModel *model,
+                                      int index,
+                                      BatchConfig const &bc) {
   assert(bc.num_active_tokens() > 0 && bc.num_active_requests() > 0);
   // We currently assume that the index-th batch will be placed
   // on the device_index-th device (except for the experts layers)
@@ -210,4 +264,246 @@ void InferenceManager::load_input_tokens_from_batch_config(
   runtime->execute_index_space(ctx, launcher);
 }
 
+void FFModel::compile_inference() {
+  Context ctx = config.lg_ctx;
+  Runtime *runtime = config.lg_hlr;
+  config.computationMode = COMP_MODE_INFERENCE;
+  {
+    fprintf(
+        stderr,
+        "Note: inference currently only supports data/pipeline parallel.\n");
+  }
+  create_operators_from_layers();
+  // Launch the graph optimize task
+  {
+    FFModel *model = this;
+    TaskLauncher launcher(GRAPH_OPTIMIZE_TASK_ID,
+                          TaskArgument(&model, sizeof(FFModel *)));
+    Future future = runtime->execute_task(ctx, launcher);
+
+    PCG::GraphOptimalViewSerialized ret =
+        future.get_result<PCG::GraphOptimalViewSerialized>();
+    Deserializer dez(ret.data, ret.total_bytes);
+    // Reconstruct operators
+    PCG::Graph *best_graph = new PCG::Graph(this);
+    std::unordered_map<PCG::Node, MachineView> optimal_views;
+    deserialize_graph_optimal_view(dez, best_graph, optimal_views);
+    operators.clear();
+    convert_graph_to_operators(best_graph, optimal_views);
+    best_graph->print_dot();
+    delete best_graph;
+    for (auto const &layer : layers) {
+      // map inputs to parallel tensor
+      if (layer->op_type == OP_INPUT) {
+        Tensor tensor = layer->outputs[0];
+        ParallelTensor parallel_tensor = nullptr;
+        for (auto const &op : operators) {
+          if (op->op_type == OP_INPUT) {
+            NoOp *noop = (NoOp *)op;
+            if (noop->input_tensor_guid == tensor->tensor_guid) {
+              parallel_tensor = op->outputs[0];
+            }
+          }
+        }
+        assert(parallel_tensor != nullptr);
+        tensor->parallel_tensor = parallel_tensor;
+      }
+      // map weights to parallel_tensor
+      for (int i = 0; i < layer->numWeights; i++) {
+        assert(layer->weights[i] != nullptr);
+        Tensor weight = layer->weights[i];
+        ParallelTensor parallel_weight = nullptr;
+        for (auto const &op : operators) {
+          if (op->layer_guid == layer->layer_guid) {
+            assert(op->op_type == layer->op_type);
+            assert(op->numWeights == layer->numWeights);
+            parallel_weight = op->weights[i];
+          }
+        }
+        assert(parallel_weight != nullptr);
+        weight->parallel_tensor = parallel_weight;
+      }
+    }
+  }
+  loss_op = nullptr;
+  metrics_op = nullptr;
+  // Perform inplace optimizations
+  if (config.enable_inplace_optimizations) {
+    for (size_t l = 1; l < operators.size(); l++) {
+      if (operators[l]->can_inplace_output()) {
+        // Assume outputs[0] is inplace with inputs[0]
+        assert(operators[l]->numOutputs == 1);
+        if (operators[l]->inputs[0]->owner_op != NULL) {
+          // int dim1 = operators[l]->outputs[0]->num_dims;
+          // int dim2 = operators[l]->inputs[0]->num_dims;
+          MachineView view1 = operators[l]->outputs[0]->machine_view;
+          MachineView view2 = operators[l]->inputs[0]->machine_view;
+          if (view1 == view2) {
+            // Check no others also need operators[l]->inputs[0]
+            bool found = false;
+            for (size_t i = 0; i < operators.size(); i++) {
+              if (i == l) {
+                continue;
+              }
+              for (int j = 0; j < operators[i]->numInputs; j++) {
+                if ((operators[i]->inputs[j]->owner_op ==
+                     operators[l]->inputs[0]->owner_op) &&
+                    (operators[i]->inputs[j]->owner_idx ==
+                     operators[l]->inputs[0]->owner_idx)) {
+                  found = true;
+                }
+              }
+            }
+            if (!found) {
+              // Perform inplace
+              operators[l]->do_inplace_output();
+            }
+          }
+        }
+      }
+    }
+  }
+
+  for (size_t l = 0; l < operators.size(); l++) {
+    Op *op = operators[l];
+
+    for (int i = 0; i < op->numInputs; i++) {
+      assert(op->inputs[i]->owner_op != NULL);
+    }
+    for (int i = 0; i < op->numWeights; i++) {
+      assert(op->weights[i]->owner_op != NULL);
+      assert(op->weights[i]->region != LogicalRegion::NO_REGION);
+      parameters.push_back(op->weights[i]);
+    }
+    op->map_output_tensors(*this);
+  }
+
+  // Check correctness
+  for (size_t l = 0; l < operators.size(); l++) {
+    Op *op = operators[l];
+    for (int i = 0; i < op->numOutputs; i++) {
+      assert(op->outputs[i]->owner_op == op);
+      assert(op->outputs[i]->owner_idx == i);
+      assert(op->outputs[i]->parallel_tensor_guid != 0);
+    }
+  }
+  // Perform fusion optimizations
+  if (config.perform_fusion) {
+    fprintf(stderr, "Applying fusion optimizations during compilation...\n");
+    fprintf(stderr, "%zu operators before fusion...\n", operators.size());
+    std::vector<Op *> new_operators;
+    std::vector<Op *> old_operators = operators;
+    while (apply_fusion(operators, new_operators)) {
+      for (size_t i = 0; i < new_operators.size(); i++) {
+        for (int idx = 0; idx < new_operators[i]->numInputs; idx++) {
+          for (size_t j = i + 1; j < new_operators.size(); j++) {
+            if (new_operators[i]->inputs[idx]->owner_op == new_operators[j]) {
+              assert(false);
+            }
+          }
+        }
+      }
+      operators = new_operators;
+    }
+    // Check integrity
+    for (size_t l = 0; l < operators.size(); l++) {
+      if (operators[l]->op_type == OP_FUSED) {
+        FusedOp *fused = (FusedOp *)operators[l];
+        int ioff = 0, woff = 0, ooff = 0;
+        for (int op = 0; op < fused->numOperators; op++) {
+          Op *old_op = fused->operators[op];
+          for (int i = 0; i < fused->op_num_inputs[op]; i++) {
+            int my_off = fused->op_input_idx[i + ioff];
+            if (fused->op_input_source[i + ioff] == FusedOp::SOURCE_INPUT) {
+              assert(fused->inputs[my_off]->region ==
+                     old_op->inputs[i]->region);
+            } else if (fused->op_input_source[i + ioff] ==
+                       FusedOp::SOURCE_OUTPUT) {
+              assert(fused->outputs[my_off]->region ==
+                     old_op->inputs[i]->region);
+            } else {
+              assert(false);
+            }
+          }
+          for (int i = 0; i < fused->op_num_weights[op]; i++) {
+            int my_off = fused->op_weight_idx[i + woff];
+            assert(fused->op_weight_source[i + woff] == FusedOp::SOURCE_WEIGHT);
+            assert(fused->weights[my_off]->region ==
+                   old_op->weights[i]->region);
+          }
+          for (int i = 0; i < fused->op_num_outputs[op]; i++) {
+            int my_off = fused->op_output_idx[i + ooff];
+            assert(fused->op_output_source[i + ooff] == FusedOp::SOURCE_OUTPUT);
+            assert(fused->outputs[my_off]->region ==
+                   old_op->outputs[i]->region);
+          }
+          ioff += fused->op_num_inputs[op];
+          woff += fused->op_num_weights[op];
+          ooff += fused->op_num_outputs[op];
+        }
+      } else {
+        bool found = false;
+        for (size_t i = 0; i < old_operators.size(); i++) {
+          if (old_operators[i] == operators[l]) {
+            assert(!found);
+            found = true;
+          }
+        }
+        assert(found);
+      }
+    }
+    fprintf(stderr, "%zu operators after fusion...\n", operators.size());
+    for (size_t i = 0; i < operators.size(); i++) {
+      Op *op = operators[i];
+      printf("operator[%zu]: type(%s) guid(%lu)\n",
+             i,
+             get_operator_type_name(operators[i]->op_type).c_str(),
+             operators[i]->op_guid);
+      for (int j = 0; j < op->numInputs; j++) {
+        LogicalRegion handle = op->inputs[j]->region;
+        printf("\tinputs[%d] region(%d,%d,%d)\n",
+               j,
+               handle.get_index_space().get_id(),
+               handle.get_field_space().get_id(),
+               handle.get_tree_id());
+      }
+      for (int j = 0; j < op->numOutputs; j++) {
+        LogicalRegion handle = op->outputs[j]->region;
+        printf("\toutputs[%d] region(%d,%d,%d)\n",
+               j,
+               handle.get_index_space().get_id(),
+               handle.get_field_space().get_id(),
+               handle.get_tree_id());
+      }
+      for (int j = 0; j < op->numWeights; j++) {
+        LogicalRegion handle = op->weights[j]->region;
+        printf("\tweights[%d] region(%d,%d,%d)\n",
+               j,
+               handle.get_index_space().get_id(),
+               handle.get_field_space().get_id(),
+               handle.get_tree_id());
+      }
+    }
+  }
+  for (size_t i = 0; i < operators.size(); i++) {
+    Op *op = operators[i];
+    printf("operator[%zu]: type(%d)\n", i, operators[i]->op_type);
+    for (int j = 0; j < op->numInputs; j++) {
+      LogicalRegion handle = op->inputs[j]->region;
+      printf("\tinputs[%d] region(%d,%d,%d)\n",
+             j,
+             handle.get_index_space().get_id(),
+             handle.get_field_space().get_id(),
+             handle.get_tree_id());
+    }
+    for (int j = 0; j < op->numOutputs; j++) {
+      LogicalRegion handle = op->outputs[j]->region;
+      printf("\toutputs[%d] region(%d,%d,%d)\n",
+             j,
+             handle.get_index_space().get_id(),
+             handle.get_field_space().get_id(),
+             handle.get_tree_id());
+    }
+  }
+}
 }; // namespace FlexFlow
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 328d4cc3af..12d3bbb18f 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -1759,8 +1759,10 @@ void FFModel::map_tensor_with_dim2(ParallelTensor tensor,
           runtime->get_logical_partition(ctx, tensor->region_grad, ip);
     }
   }
-  // Step 3: initialize the tensor
-  if (tensor->initializer != NULL) {
+  // Step 3: initialize the tensor; don't randomly initialize weights
+  // for inference
+  if (tensor->initializer != NULL &&
+      config.computationMode == COMP_MODE_TRAINING) {
     tensor->initializer->init(this, tensor);
   }
 }
diff --git a/src/runtime/parallel_tensor.cc b/src/runtime/parallel_tensor.cc
index 3ad2f17f0c..2147ac69b3 100644
--- a/src/runtime/parallel_tensor.cc
+++ b/src/runtime/parallel_tensor.cc
@@ -667,7 +667,7 @@ bool ParallelTensorBase::set_tensor(FFModel const *ff,
   for (size_t i = 0; i < dim_sizes.size(); i++) {
     volume = volume * dim_sizes[i];
   }
-  RegionRequirement req(region, READ_WRITE, EXCLUSIVE, region);
+  RegionRequirement req(region, WRITE_ONLY, EXCLUSIVE, region);
   req.add_field(FID_DATA);
   InlineLauncher launcher(req);
   PhysicalRegion pr = runtime->map_region(ctx, launcher);
@@ -675,7 +675,7 @@ bool ParallelTensorBase::set_tensor(FFModel const *ff,
   switch (num_dims) {
 #define DIMFUNC(DIM)                                                           \
   case DIM: {                                                                  \
-    TensorAccessorW<T, DIM> acc(pr, req, FID_DATA, ctx, runtime, true);        \
+    TensorAccessorW<T, DIM> acc(pr, req, FID_DATA, ctx, runtime, false);       \
     assert(acc.rect.volume() == volume * num_replicas);                        \
     T *ptr = acc.ptr;                                                          \
     for (size_t i = 0; i < num_replicas; i++) {                                \
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 7374d36bfa..7f5bc89648 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -107,7 +107,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
     if (new_bc.request_completed[i]) {
       if (!pending_request_queue.empty() &&
           new_bc.num_tokens < BatchConfig::MAX_NUM_TOKENS) {
-        Request const &new_request = pending_request_queue.front();
+        Request new_request = pending_request_queue.front();
         pending_request_queue.pop();
         running_request_queue[new_request.guid] = new_request;
         new_bc.requestsInfo[i].token_start_offset = 0;

From 49bdead9c551ef8848a90e2c2bfbdecc9cea53cf Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 4 May 2023 18:06:29 -0400
Subject: [PATCH 103/344] [Inference] - Fix small issues (#705)

* add check for num cpus in CI

* fix hip rocm compilation issue
---
 src/runtime/request_manager.cpp | 51 +++++++++++++++++++++++++++++++++
 tests/cpp_gpu_tests.sh          |  9 ++++--
 2 files changed, 58 insertions(+), 2 deletions(-)
 create mode 100644 src/runtime/request_manager.cpp

diff --git a/src/runtime/request_manager.cpp b/src/runtime/request_manager.cpp
new file mode 100644
index 0000000000..87e86087fe
--- /dev/null
+++ b/src/runtime/request_manager.cpp
@@ -0,0 +1,51 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/inference.h"
+#include "flexflow/utils/hip_helper.h"
+#include <hip/hip_runtime.h>
+
+namespace FlexFlow {
+
+using namespace Legion;
+
+void RequestManager::load_tokens_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  assert(regions.size() == 1);
+  assert(task->regions.size() == 1);
+
+  BatchConfig const batch_config = *((BatchConfig *)task->args);
+  BatchConfig::TokenId dram_copy[BatchConfig::MAX_NUM_TOKENS];
+  for (int i = 0; i < batch_config.num_tokens; i++) {
+    dram_copy[i] = batch_config.tokensInfo[i].token_id;
+  }
+  TokenId *fb_ptr = helperGetTensorPointerWO<TokenId>(
+      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  Domain domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  assert(batch_config.num_tokens <= domain.get_volume());
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  checkCUDA(hipMemcpyAsync(fb_ptr,
+                           dram_copy,
+                           sizeof(TokenId) * batch_config.num_tokens,
+                           hipMemcpyHostToDevice,
+                           stream));
+}
+
+}; // namespace FlexFlow
diff --git a/tests/cpp_gpu_tests.sh b/tests/cpp_gpu_tests.sh
index fbf33cc04d..634a199ea7 100755
--- a/tests/cpp_gpu_tests.sh
+++ b/tests/cpp_gpu_tests.sh
@@ -11,6 +11,9 @@ BATCHSIZE=$((GPUS * 64))
 FSIZE=14048
 ZSIZE=12192
 
+GPU_AVAILABLE=$(nvidia-smi --query-gpu=name --format=csv,noheader | wc -l)
+if [ $(( GPUS )) -gt $(( GPU_AVAILABLE )) ]; then echo "The test requires $GPUS GPUs, but only $GPU_AVAILABLE are available. Try reducing the number of nodes, or the number of gpus/node." ; exit; fi
+
 remove_mnist() {
 	rm -f train-images-idx3-ubyte.gz train-labels-idx1-ubyte.gz train-images-idx3-ubyte train-labels-idx1-ubyte
 }
@@ -47,7 +50,8 @@ if [[ -f "$FF_HOME/build/examples/cpp/AlexNet/alexnet" ]]; then
 	# "$FF_HOME"/build/examples/cpp/split_test/split_test -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
 	# "$FF_HOME"/build/examples/cpp/split_test_2/split_test_2 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
 	# Inference examples
-	"$FF_HOME"/build/examples/cpp/inference/LLAMA/LLAMA -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
+	if [ $(( GPU_AVAILABLE )) -lt $(( 4 )) ]; then echo "Skipping LLAMA test because it requires 4 GPUs, but only $GPU_AVAILABLE are available. " ; exit 1; fi
+	"$FF_HOME"/build/examples/cpp/inference/LLAMA/LLAMA -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize 30000 --only-data-parallel
 	#"$FF_HOME"/build/examples/cpp/inference/mixture_of_experts/inference_moe -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
 	#"$FF_HOME"/build/examples/cpp/inference/transformers/inference_transformers -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
 else
@@ -79,7 +83,8 @@ else
 			# split_test -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
 			# split_test_2 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
 			# Inference examples
-			LLAMA -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
+			if [ $(( GPU_AVAILABLE )) -lt $(( 4 )) ]; then echo "Skipping LLAMA test because it requires 4 GPUs, but only $GPU_AVAILABLE are available. " ; exit 1; fi
+			LLAMA -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize 30000 --only-data-parallel
 			#inference_moe -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
 			#inference_transformers -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
 		fi

From 527d6d285bdbc41c2974e9b6e581e0c4de74a6ee Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 4 May 2023 21:42:35 -0400
Subject: [PATCH 104/344] [Inference] - Token Verification (#703)

* newlines

* initial commit

* implement kernel to update key/value cache for each tree branch

* fix indexing of requests slots

* phase out num_tree_branches

* commit mechanism
---
 examples/cpp/inference/LLAMA/dataloader.cc    |    2 +-
 examples/cpp/inference/LLAMA/llama.cc         |    4 +-
 include/flexflow/batch_config.h               |   18 +
 include/flexflow/ffconst.h                    |    1 +
 include/flexflow/model.h                      |   21 +
 include/flexflow/operator_params.h            |    2 +
 include/flexflow/ops/inc_mha_verify.h         |  143 ++
 include/flexflow/ops/inc_mha_verify_params.h  |   31 +
 .../ops/inc_multihead_self_attention.h        |    9 -
 src/ops/inc_mha_verify.cc                     | 1439 +++++++++++++++++
 src/ops/inc_mha_verify.cpp                    |   75 +
 src/ops/inc_mha_verify.cu                     |  942 +++++++++++
 src/runtime/batch_config.cc                   |   18 +
 src/runtime/ffconst_utils.cc                  |    2 +
 src/runtime/graph.cc                          |   49 +
 src/runtime/model.cc                          |   28 +
 src/runtime/operator_params.cc                |    3 +
 src/runtime/substitution.cc                   |   10 +-
 18 files changed, 2783 insertions(+), 14 deletions(-)
 create mode 100644 include/flexflow/ops/inc_mha_verify.h
 create mode 100644 include/flexflow/ops/inc_mha_verify_params.h
 create mode 100644 src/ops/inc_mha_verify.cc
 create mode 100644 src/ops/inc_mha_verify.cpp
 create mode 100644 src/ops/inc_mha_verify.cu

diff --git a/examples/cpp/inference/LLAMA/dataloader.cc b/examples/cpp/inference/LLAMA/dataloader.cc
index 1bfadde559..13de5b5b64 100644
--- a/examples/cpp/inference/LLAMA/dataloader.cc
+++ b/examples/cpp/inference/LLAMA/dataloader.cc
@@ -143,7 +143,7 @@ void DataLoader::load_from_file(T *ptr, size_t size, std::string filename) {
   // std::cout << loaded_data_size << std::endl;
   // std::cout << in_get_size << std::endl;
   if (in_get_size != loaded_data_size) {
-    std::cout << "load data error";
+    std::cout << "load data error" << std::endl;
     return;
   }
 
diff --git a/examples/cpp/inference/LLAMA/llama.cc b/examples/cpp/inference/LLAMA/llama.cc
index 321f870a8f..a4924f5406 100644
--- a/examples/cpp/inference/LLAMA/llama.cc
+++ b/examples/cpp/inference/LLAMA/llama.cc
@@ -244,7 +244,7 @@ void FlexFlow::top_level_task(Task const *task,
       BatchConfig bc;
       InferenceResult ir;
       bc = rm.prepare_next_batch(bc, ir);
-      std::cout << "new tokens: " << bc.num_tokens;
+      std::cout << "new tokens: " << bc.num_tokens << std::endl;
       FutureMap fm = im.inference(&ff, bid, bc);
       assert(fm.get_future_map_domain().get_volume() == 1);
       future_handlers[bid] = fm.get_future(0);
@@ -262,7 +262,7 @@ void FlexFlow::top_level_task(Task const *task,
       BatchConfig bc = batch_configs[bid];
       processed_requests += bc.num_tokens;
       bc = rm.prepare_next_batch(bc, ir);
-      std::cout << "new tokens: " << bc.num_tokens;
+      std::cout << "new tokens: " << bc.num_tokens << std::endl;
       FutureMap fm = im.inference(&ff, bid, bc);
       assert(fm.get_future_map_domain().get_volume() == 1);
       future_handlers[bid] = fm.get_future(0);
diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index a397be28c3..d4150d6c51 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -65,6 +65,24 @@ class BatchConfig {
   bool request_completed[MAX_NUM_REQUESTS];
 };
 
+class TreeVerifyBatchConfig : public BatchConfig {
+public:
+  struct PerTokenInfo : BatchConfig::PerTokenInfo {
+    int tree_branch_idx;
+  };
+  struct CommittedTokensInfo {
+    int token_index;   // the index of the token in the previous batch
+    int request_index; // request index in the batch
+    int token_depth;   // position of the token in the request's sequence
+  };
+
+  void compute_tree_branch_indexes();
+
+  int num_tokens_to_commit;
+  CommittedTokensInfo commited_tokens[MAX_NUM_TOKENS];
+  PerTokenInfo tokensInfo[MAX_NUM_TOKENS];
+};
+
 struct InferenceResult {
   static int const MAX_NUM_TOKENS = BatchConfig::MAX_NUM_TOKENS;
   BatchConfig::TokenId token_ids[MAX_NUM_TOKENS];
diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index d244fb3ac6..a64944ab30 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -149,6 +149,7 @@ enum OperatorType {
   OP_GATHER, // https://pytorch.org/docs/stable/generated/torch.gather.html
   OP_RMS_NORM,
   OP_INC_MULTIHEAD_SELF_ATTENTION,
+  OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY,
   // Parallel Ops
   OP_REPARTITION,
   OP_COMBINE,
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 3cd5e2036e..c213af9ac8 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -147,6 +147,10 @@ enum TaskIDs {
   INC_MULTIHEAD_SELF_ATTENTION_FWD_TASK_ID,
   INC_MULTIHEAD_SELF_ATTENTION_BWD_TASK_ID,
   INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
+  INC_MULTIHEAD_SELF_ATTENTION_VERIFY_INIT_TASK_ID,
+  INC_MULTIHEAD_SELF_ATTENTION_VERIFY_FWD_TASK_ID,
+  INC_MULTIHEAD_SELF_ATTENTION_VERIFY_BWD_TASK_ID,
+  INC_MULTIHEAD_SELF_ATTENTION_VERIFY_INF_TASK_ID,
   MSELOSS_BWD_TASK_ID,
   FUSEDOP_INIT_TASK_ID,
   FUSEDOP_FWD_TASK_ID,
@@ -285,6 +289,7 @@ class LayerNorm;
 class Linear;
 class MultiHeadAttention;
 class IncMultiHeadSelfAttention;
+class IncMultiHeadSelfAttentionVerify;
 class Pool2D;
 class Reduce;
 class Reshape;
@@ -602,6 +607,19 @@ class FFModel {
                                       Initializer *kernel_initializer = NULL,
                                       bool apply_rotary_embedding = false,
                                       char const *name = NULL);
+  Tensor inc_multihead_self_attention_verify(
+      const Tensor input,
+      int embed_dim,
+      int num_heads,
+      int kdim = 0,
+      int vdim = 0,
+      float dropout = 0.0f,
+      bool bias = true,
+      bool add_bias_kv = false,
+      bool add_zero_attn = false,
+      Initializer *kernel_initializer = NULL,
+      bool apply_rotary_embedding = false,
+      char const *name = NULL);
   Tensor create_tensor_legion_ordering(int num_dim,
                                        int const dims[],
                                        DataType data_type,
@@ -964,6 +982,9 @@ class FFModel {
       std::unordered_map<
           std::pair<ParallelTensorShape, IncMultiHeadSelfAttentionParams>,
           IncMultiHeadSelfAttention *>,
+      std::unordered_map<
+          std::pair<ParallelTensorShape, IncMultiHeadSelfAttentionVerifyParams>,
+          IncMultiHeadSelfAttentionVerify *>,
       std::unordered_map<std::pair<ParallelTensorShape, ReduceParams>,
                          Reduce *>,
       std::unordered_map<std::pair<ParallelTensorShape, ReshapeParams>,
diff --git a/include/flexflow/operator_params.h b/include/flexflow/operator_params.h
index f949fe3e4c..ad0e15ce46 100644
--- a/include/flexflow/operator_params.h
+++ b/include/flexflow/operator_params.h
@@ -17,6 +17,7 @@
 #include "flexflow/ops/flat_params.h"
 #include "flexflow/ops/gather_params.h"
 #include "flexflow/ops/groupby_params.h"
+#include "flexflow/ops/inc_mha_verify_params.h"
 #include "flexflow/ops/inc_multihead_self_attention_params.h"
 #include "flexflow/ops/layer_norm_params.h"
 #include "flexflow/ops/linear_params.h"
@@ -56,6 +57,7 @@ using OperatorParameters = mp::variant<AggregateParams,
                                        LinearParams,
                                        MultiHeadAttentionParams,
                                        IncMultiHeadSelfAttentionParams,
+                                       IncMultiHeadSelfAttentionVerifyParams,
                                        RMSNormParams,
                                        Pool2DParams,
                                        ReduceParams,
diff --git a/include/flexflow/ops/inc_mha_verify.h b/include/flexflow/ops/inc_mha_verify.h
new file mode 100644
index 0000000000..58be2fe204
--- /dev/null
+++ b/include/flexflow/ops/inc_mha_verify.h
@@ -0,0 +1,143 @@
+#ifndef _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_VERIFY_H
+#define _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_VERIFY_H
+
+#include "flexflow/device.h"
+#include "flexflow/fftype.h"
+#include "flexflow/inference.h"
+#include "flexflow/layer.h"
+#include "flexflow/node.h"
+#include "flexflow/op_meta.h"
+#include "flexflow/operator.h"
+#include "flexflow/ops/inc_multihead_self_attention_params.h"
+#include "math.h"
+#include <cfloat>
+#include <complex>
+
+namespace FlexFlow {
+
+class IncMultiHeadSelfAttentionVerifyMeta;
+
+class IncMultiHeadSelfAttentionVerify : public Op {
+public:
+  using Params = IncMultiHeadSelfAttentionVerifyParams;
+  using Input = ParallelTensor;
+
+  IncMultiHeadSelfAttentionVerify(FFModel &model,
+                                  LayerID const &layer_guid,
+                                  const ParallelTensor _input,
+                                  int _embed_dim,
+                                  int _num_heads,
+                                  int _kdim,
+                                  int _vdim,
+                                  float _dropout,
+                                  bool _bias,
+                                  bool _add_bias_kv,
+                                  bool _add_zero_attn,
+                                  bool _apply_rotary_embedding,
+                                  bool allocate_weights,
+                                  char const *name);
+  IncMultiHeadSelfAttentionVerify(FFModel &model,
+                                  const ParallelTensor _input,
+                                  const ParallelTensor _weight,
+                                  int _embed_dim,
+                                  int _num_heads,
+                                  int _kdim,
+                                  int _vdim,
+                                  float _dropout,
+                                  bool _bias,
+                                  bool _add_bias_kv,
+                                  bool _add_zero_attn,
+                                  bool _apply_rotary_embedding,
+                                  bool allocate_weights,
+                                  char const *name);
+  IncMultiHeadSelfAttentionVerify(FFModel &model,
+                                  IncMultiHeadSelfAttentionVerify const &other,
+                                  const ParallelTensor input,
+                                  bool allocate_weights);
+  IncMultiHeadSelfAttentionVerify(FFModel &model,
+                                  Params const &params,
+                                  Input const &inputs,
+                                  bool allocate_weights = false,
+                                  char const *name = nullptr);
+  static Op *
+      create_operator_from_layer(FFModel &model,
+                                 Layer const *layer,
+                                 std::vector<ParallelTensor> const &inputs);
+  void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
+  void forward(FFModel const &) override;
+  void backward(FFModel const &) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
+  void print_layer(FFModel const &model) override {
+    assert(0);
+  }
+  bool get_int_parameter(PMParameter, int *) const override;
+
+  static OpMeta *init_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
+  bool measure_operator_cost(Simulator *sim,
+                             MachineView const &mv,
+                             CostMetrics &cost_metrics) const override;
+
+  static void
+      inference_kernel_wrapper(IncMultiHeadSelfAttentionVerifyMeta const *m,
+                               TreeVerifyBatchConfig const *bc,
+                               float const *input_ptr,
+                               float const *weight_ptr,
+                               float *output_ptr);
+  Params get_params() const;
+
+public:
+  int num_heads;
+  float dropout;
+  bool bias;
+  bool add_bias_kv, add_zero_attn, apply_rotary_embedding;
+  int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
+  int qoSeqLength, kvSeqLength;
+};
+
+class IncMultiHeadSelfAttentionVerifyMeta : public OpMeta {
+public:
+  IncMultiHeadSelfAttentionVerifyMeta(
+      FFHandler handler,
+      IncMultiHeadSelfAttentionVerify const *attn,
+      float const *weight_ptr,
+      Legion::Memory gpu_mem,
+      int num_samples,
+      int _num_heads);
+  ~IncMultiHeadSelfAttentionVerifyMeta(void);
+
+public:
+  Realm::RegionInstance reserveInst;
+  size_t weights_params, weightSize, reserveSpaceSize;
+  int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
+  int num_heads;
+  bool *has_load_weights;
+  bool *apply_rotary_embedding;
+#ifdef INFERENCE_TESTS
+  float *kcache, *vcache;
+#endif
+  float *devQKVProjArray, *keyCache, *valueCache;
+  float *qk_prods, *qk_prods_softmax;
+  float *attn_heads, *W_out_contiguous;
+
+  TreeVerifyBatchConfig::PerTokenInfo *token_infos;
+  TreeVerifyBatchConfig::CommittedTokensInfo *committed_token_infos;
+};
+
+}; // namespace FlexFlow
+
+#endif // _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_VERIFY_H
diff --git a/include/flexflow/ops/inc_mha_verify_params.h b/include/flexflow/ops/inc_mha_verify_params.h
new file mode 100644
index 0000000000..51ead7b283
--- /dev/null
+++ b/include/flexflow/ops/inc_mha_verify_params.h
@@ -0,0 +1,31 @@
+#ifndef _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_VERIFY_PARAMS_H
+#define _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_VERIFY_PARAMS_H
+
+#include "flexflow/fftype.h"
+#include "flexflow/parallel_tensor.h"
+
+namespace FlexFlow {
+
+struct IncMultiHeadSelfAttentionVerifyParams {
+  LayerID layer_guid;
+  int embed_dim, num_heads, kdim, vdim;
+  float dropout;
+  bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding;
+
+  bool is_valid(ParallelTensorShape const &) const;
+};
+
+bool operator==(IncMultiHeadSelfAttentionVerifyParams const &,
+                IncMultiHeadSelfAttentionVerifyParams const &);
+
+} // namespace FlexFlow
+
+namespace std {
+template <>
+struct hash<FlexFlow::IncMultiHeadSelfAttentionVerifyParams> {
+  size_t
+      operator()(FlexFlow::IncMultiHeadSelfAttentionVerifyParams const &) const;
+};
+} // namespace std
+
+#endif // _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_VERIFY_PARAMS_H
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index e781da9cf5..5db5e0c3c1 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -128,18 +128,9 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
 #ifdef INFERENCE_TESTS
   float *kcache, *vcache;
 #endif
-  /*#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
-    cudnnAttnDescriptor_t attnDesc;
-    cudnnSeqDataDescriptor_t qDesc, kDesc, vDesc, oDesc;
-  #endif*/
-  // int *devQoSeqArray, *devKvSeqArray, *loWinIdx, *hiWinIdx, *kvCache;
   float *devQKVProjArray, *keyCache, *valueCache;
   float *qk_prods, *qk_prods_softmax;
   float *attn_heads, *W_out_contiguous;
-  // void *reserveSpace;
-
-  // BatchConfig::token_idxs *dev_token2ids;
-
   BatchConfig::PerTokenInfo *token_infos;
 };
 
diff --git a/src/ops/inc_mha_verify.cc b/src/ops/inc_mha_verify.cc
new file mode 100644
index 0000000000..228c0d224a
--- /dev/null
+++ b/src/ops/inc_mha_verify.cc
@@ -0,0 +1,1439 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/inc_mha_verify.h"
+#include "flexflow/model.h"
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+#include "flexflow/utils/cuda_helper.h"
+#else
+#include "flexflow/utils/hip_helper.h"
+#endif
+#include "flexflow/utils/hash_utils.h"
+#include "legion/legion_utilities.h"
+#ifdef INFERENCE_TESTS
+#include <torch/torch.h>
+using namespace at::indexing;
+#endif
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::ArgumentMap;
+using Legion::Context;
+using Legion::coord_t;
+using Legion::Domain;
+using Legion::FutureMap;
+using Legion::IndexLauncher;
+using Legion::Machine;
+using Legion::Memory;
+using Legion::PhysicalRegion;
+using Legion::Predicate;
+using Legion::Rect;
+using Legion::RegionRequirement;
+using Legion::Runtime;
+using Legion::Task;
+using Legion::TaskArgument;
+using Legion::TaskLauncher;
+using PCG::Node;
+
+bool IncMultiHeadSelfAttentionVerifyParams::is_valid(
+    ParallelTensorShape const &input) const {
+  bool is_valid = input.is_valid();
+  return is_valid;
+}
+
+Tensor FFModel::inc_multihead_self_attention_verify(
+    const Tensor input,
+    int embed_dim,
+    int num_heads,
+    int kdim,
+    int vdim,
+    float dropout,
+    bool bias,
+    bool add_bias_kv,
+    bool add_zero_attn,
+    Initializer *kernel_initializer,
+    bool apply_rotary_embedding,
+    char const *name) {
+  // Currently assume that
+  Layer *li = new Layer(this,
+                        OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY,
+                        DT_FLOAT,
+                        name,
+                        1 /*inputs*/,
+                        1 /*weights*/,
+                        1 /*outputs*/,
+                        input);
+  {
+    int numdims = input->num_dims;
+    int dims[MAX_TENSOR_DIM];
+    for (int i = 0; i < numdims; i++) {
+      dims[i] = input->dims[i];
+    }
+    dims[0] = embed_dim;
+    li->outputs[0] = create_tensor_legion_ordering(
+        numdims, dims, DT_FLOAT, li, 0, true /*create_grad*/);
+  }
+  {
+    // Compute weight size
+    int qProjSize = kdim, kProjSize = kdim, vProjSize = kdim,
+        oProjSize = embed_dim;
+    int qSize = input->dims[0], kSize = input->dims[0], vSize = input->dims[0];
+    int qParas = qProjSize * qSize;
+    int kParas = kProjSize * kSize;
+    int vParas = vProjSize * vSize;
+    int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
+    int dims[2] = {qParas + kParas + vParas + oParas, num_heads};
+    li->weights[0] = create_weight_legion_ordering(2,
+                                                   dims,
+                                                   DT_FLOAT,
+                                                   li,
+                                                   true /*create_grad*/,
+                                                   kernel_initializer,
+                                                   CHOSEN_SYNC_TYPE);
+  }
+  li->data_type = DT_FLOAT;
+  li->add_int_property("embed_dim", embed_dim);
+  li->add_int_property("num_heads", num_heads);
+  li->add_int_property("kdim", kdim);
+  li->add_int_property("vdim", vdim);
+  li->add_int_property("bias", bias);
+  li->add_int_property("add_bias_kv", add_bias_kv);
+  li->add_int_property("add_zero_attn", add_zero_attn);
+  li->add_float_property("dropout", dropout);
+  li->add_int_property("apply_rotary_embedding", apply_rotary_embedding);
+  layers.push_back(li);
+  return li->outputs[0];
+}
+
+Op *IncMultiHeadSelfAttentionVerify::create_operator_from_layer(
+    FFModel &model,
+    Layer const *layer,
+    std::vector<ParallelTensor> const &inputs) {
+  long long value;
+  layer->get_int_property("embed_dim", value);
+  int embed_dim = value;
+  layer->get_int_property("num_heads", value);
+  int num_heads = value;
+  layer->get_int_property("kdim", value);
+  int kdim = value;
+  layer->get_int_property("vdim", value);
+  int vdim = value;
+  float dropout;
+  layer->get_float_property("dropout", dropout);
+  layer->get_int_property("bias", value);
+  bool bias = (bool)value;
+  layer->get_int_property("add_bias_kv", value);
+  bool add_bias_kv = (bool)value;
+  layer->get_int_property("add_zero_attn", value);
+  bool add_zero_attn = (bool)value;
+  layer->get_int_property("apply_rotary_embedding", value);
+  bool apply_rotary_embedding = (bool)value;
+  return new IncMultiHeadSelfAttentionVerify(model,
+                                             layer->layer_guid,
+                                             inputs[0],
+                                             embed_dim,
+                                             num_heads,
+                                             kdim,
+                                             vdim,
+                                             dropout,
+                                             bias,
+                                             add_bias_kv,
+                                             add_zero_attn,
+                                             apply_rotary_embedding,
+                                             false /*allocate_weights*/,
+                                             layer->name);
+}
+
+IncMultiHeadSelfAttentionVerify::IncMultiHeadSelfAttentionVerify(
+    FFModel &model,
+    LayerID const &_layer_guid,
+    const ParallelTensor _input,
+    int _embed_dim,
+    int _num_heads,
+    int _kdim,
+    int _vdim,
+    float _dropout,
+    bool _bias,
+    bool _add_bias_kv,
+    bool _add_zero_attn,
+    bool _apply_rotary_embedding,
+    bool allocate_weights,
+    char const *name)
+    // Initializer* _bias_initializer)
+    : Op(model,
+         OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY,
+         DT_FLOAT,
+         name,
+         1 /*inputs*/,
+         1 /*weights*/,
+         1 /*outputs*/,
+         _input),
+      num_heads(_num_heads), dropout(_dropout), bias(_bias),
+      add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      apply_rotary_embedding(_apply_rotary_embedding),
+      qSize(_input->dims[0].size), kSize(_input->dims[0].size),
+      vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
+      vProjSize(_vdim), oProjSize(_embed_dim),
+      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size) {
+  // overwrite layer_guid
+  layer_guid = _layer_guid;
+
+  numOutputs = 1;
+  int numdim = _input->num_dims;
+  ParallelDim dims[MAX_TENSOR_DIM];
+  for (int i = 0; i < numdim; i++) {
+    dims[i] = _input->dims[i];
+  }
+  dims[0].size = _embed_dim;
+  // Currently require no parallelism along this dim
+  assert(dims[0].degree == 1);
+  if (allocate_weights) {
+    // Create weight tensor
+    int num_dims = inputs[0]->num_dims;
+    // Compute weight size
+    int qParas = this->qProjSize * this->qSize;
+    int kParas = this->kProjSize * this->kSize;
+    int vParas = this->vProjSize * this->vSize;
+    int oParas =
+        this->oProjSize * (this->vProjSize > 0 ? this->vProjSize : this->vSize);
+    ParallelDim dims[3];
+    dims[0] = inputs[0]->dims[num_dims - 2];
+    dims[0].size = dims[0].degree;
+    dims[1] = inputs[0]->dims[num_dims - 1];
+    dims[1].size = this->num_heads;
+    dims[2].size = qParas + kParas + vParas + oParas;
+    dims[2].degree = 1;
+    dims[2].parallel_idx = -1;
+    int seed = std::rand();
+    Initializer *initializer = new GlorotUniform(seed);
+#ifdef USE_NCCL
+    ParameterSyncType comm_type = ParameterSyncType::NCCL;
+#else
+    ParameterSyncType comm_type = ParameterSyncType::PS;
+#endif
+    weights[0] = model.create_parallel_weight<3>(dims,
+                                                 DT_FLOAT,
+                                                 NULL /*owner_op*/,
+                                                 true /*create_grad*/,
+                                                 initializer,
+                                                 comm_type);
+  }
+
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      _input->num_dims, dims, DT_FLOAT, this);
+  /* for (int i = 0; i < numdim; i++) { */
+  /*   register_output_input_parallel_dims(outputs[0], i, inputs[0], i); */
+  /* } */
+  /* // Check correctness */
+  /* assert(check_output_input_weight_parallel_dims()); */
+}
+
+IncMultiHeadSelfAttentionVerify::IncMultiHeadSelfAttentionVerify(
+    FFModel &model,
+    const ParallelTensor _input,
+    const ParallelTensor _weight,
+    int _embed_dim,
+    int _num_heads,
+    int _kdim,
+    int _vdim,
+    float _dropout,
+    bool _bias,
+    bool _add_bias_kv,
+    bool _add_zero_attn,
+    bool _apply_rotary_embedding,
+    bool allocate_weights,
+    char const *name)
+    // Initializer* _bias_initializer)
+    : Op(model,
+         OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY,
+         DT_FLOAT,
+         name,
+         1 /*inputs*/,
+         1 /*weights*/,
+         1 /*outputs*/,
+         _input,
+         _weight),
+      num_heads(_num_heads), dropout(_dropout), bias(_bias),
+      add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      apply_rotary_embedding(_apply_rotary_embedding),
+      qSize(_input->dims[0].size), kSize(_input->dims[0].size),
+      vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
+      vProjSize(_vdim), oProjSize(_embed_dim),
+      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size)
+// bias_initializer(_bias_initializer)
+{
+  numOutputs = 1;
+  int numdim = _input->num_dims;
+  ParallelDim dims[MAX_TENSOR_DIM];
+  for (int i = 0; i < numdim; i++) {
+    dims[i] = _input->dims[i];
+  }
+  dims[0].size = _embed_dim;
+  // Currently require no parallelism along this dim
+  assert(dims[0].degree == 1);
+  if (allocate_weights) {
+    // Create weight tensor
+    int num_dims = inputs[0]->num_dims;
+    // Compute weight size
+    int qParas = this->qProjSize * this->qSize;
+    int kParas = this->kProjSize * this->kSize;
+    int vParas = this->vProjSize * this->vSize;
+    int oParas =
+        this->oProjSize * (this->vProjSize > 0 ? this->vProjSize : this->vSize);
+    ParallelDim dims[3];
+    dims[0] = inputs[0]->dims[num_dims - 2];
+    dims[0].size = dims[0].degree;
+    dims[1] = inputs[0]->dims[num_dims - 1];
+    dims[1].size = this->num_heads;
+    dims[2].size = qParas + kParas + vParas + oParas;
+    int seed = std::rand();
+    Initializer *initializer = new GlorotUniform(seed);
+#ifdef USE_NCCL
+    ParameterSyncType comm_type = ParameterSyncType::NCCL;
+#else
+    ParameterSyncType comm_type = ParameterSyncType::PS;
+#endif
+    weights[0] = model.create_parallel_weight<3>(dims,
+                                                 DT_FLOAT,
+                                                 NULL /*owner_op*/,
+                                                 true /*create_grad*/,
+                                                 initializer,
+                                                 comm_type);
+  }
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      _input->num_dims, dims, DT_FLOAT, this);
+
+  /* for (int i = 0; i < numdim; i++) { */
+  /*   register_output_input_parallel_dims(outputs[0], i, inputs[0], i); */
+  /* } */
+  /* register_output_weight_parallel_dims(outputs[0], numdim-1, _weight, 1); */
+  /* register_output_weight_parallel_dims(outputs[0], numdim-2, _weight, 2); */
+  // Check correctness
+  /* assert(check_output_input_weight_parallel_dims()); */
+}
+
+IncMultiHeadSelfAttentionVerify::IncMultiHeadSelfAttentionVerify(
+    FFModel &model,
+    IncMultiHeadSelfAttentionVerify const &other,
+    const ParallelTensor input,
+    bool allocate_weights)
+    : IncMultiHeadSelfAttentionVerify(model,
+                                      other.layer_guid,
+                                      input,
+                                      other.oProjSize,
+                                      other.num_heads,
+                                      other.qProjSize,
+                                      other.vProjSize,
+                                      other.dropout,
+                                      other.bias,
+                                      other.add_bias_kv,
+                                      other.add_zero_attn,
+                                      other.apply_rotary_embedding,
+                                      allocate_weights,
+                                      other.name) {}
+
+IncMultiHeadSelfAttentionVerify::IncMultiHeadSelfAttentionVerify(
+    FFModel &model,
+    IncMultiHeadSelfAttentionVerifyParams const &params,
+    ParallelTensor const &input,
+    bool allocate_weights,
+    char const *name)
+    : IncMultiHeadSelfAttentionVerify(model,
+                                      params.layer_guid,
+                                      input,
+                                      params.embed_dim,
+                                      params.num_heads,
+                                      params.kdim,
+                                      params.vdim,
+                                      params.dropout,
+                                      params.bias,
+                                      params.add_bias_kv,
+                                      params.add_zero_attn,
+                                      params.apply_rotary_embedding,
+                                      allocate_weights,
+                                      name) {}
+
+void IncMultiHeadSelfAttentionVerify::init_inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher launcher(
+      INC_MULTIHEAD_SELF_ATTENTION_VERIFY_INIT_TASK_ID,
+      parallel_is,
+      TaskArgument(this, sizeof(IncMultiHeadSelfAttentionVerify)),
+      argmap,
+      Predicate::TRUE_PRED,
+      false /*must*/,
+      0 /*mapper_id*/,
+      machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
+}
+
+void IncMultiHeadSelfAttentionVerify::init(FFModel const &ff) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(
+      INC_MULTIHEAD_SELF_ATTENTION_VERIFY_INIT_TASK_ID,
+      parallel_is,
+      TaskArgument(this, sizeof(IncMultiHeadSelfAttentionVerify)),
+      argmap,
+      Predicate::TRUE_PRED,
+      false /*must*/,
+      0 /*mapper_id*/,
+      outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
+/*
+  regions[0](I): input
+  regions[1](I): weight
+  regions[2](O): output
+*/
+OpMeta *IncMultiHeadSelfAttentionVerify::init_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  IncMultiHeadSelfAttentionVerify const *attn =
+      (IncMultiHeadSelfAttentionVerify *)task->args;
+  FFHandler handle = *((FFHandler const *)task->local_args);
+
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      DT_FLOAT, regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
+      DT_FLOAT, regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      DT_FLOAT, regions[2], task->regions[2], FID_DATA, ctx, runtime);
+
+  int num_samples = input.domain.hi()[2] - input.domain.lo()[2] + 1;
+  assert(attn->qoSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
+  assert(attn->kvSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
+  int num_heads = weight.domain.hi()[1] - weight.domain.lo()[1] + 1;
+  assert(attn->oProjSize == output.domain.hi()[0] - output.domain.lo()[0] + 1);
+
+  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                       .only_kind(Memory::GPU_FB_MEM)
+                       .best_affinity_to(task->target_proc)
+                       .first();
+  IncMultiHeadSelfAttentionVerifyMeta *m =
+      new IncMultiHeadSelfAttentionVerifyMeta(handle,
+                                              attn,
+                                              weight.get_float_ptr(),
+                                              gpu_mem,
+                                              num_samples,
+                                              num_heads);
+  m->profiling = attn->profiling;
+  assert(weight.domain.get_volume() * sizeof(float) == m->weightSize);
+  return m;
+}
+
+void IncMultiHeadSelfAttentionVerify::forward(FFModel const &ff) {
+  // IncMultiHeadSelfAttentionVerify doesn't support forward
+  assert(false);
+}
+
+FutureMap IncMultiHeadSelfAttentionVerify::inference(
+    FFModel const &ff,
+    BatchConfig const &bc,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+  int idx = 0;
+  printf("TreeVerifyBatchConfig, num_tokens: %d, num_requests: %d\n",
+         bc.num_tokens,
+         bc.num_active_requests());
+  IndexLauncher launcher(INC_MULTIHEAD_SELF_ATTENTION_VERIFY_INF_TASK_ID,
+                         parallel_is,
+                         TaskArgument(&bc, sizeof(TreeVerifyBatchConfig)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(idx++, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(idx++, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(idx++, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+/*
+  regions[0](I): input
+  regions[3](I): weight
+  regions[4](O): output
+*/
+void IncMultiHeadSelfAttentionVerify::inference_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  assert(regions.size() == 3);
+  assert(task->regions.size() == regions.size());
+
+  TreeVerifyBatchConfig const *bc = (TreeVerifyBatchConfig *)task->args;
+  IncMultiHeadSelfAttentionVerifyMeta const *m =
+      *((IncMultiHeadSelfAttentionVerifyMeta **)task->local_args);
+
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
+      m->weight_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+
+  Domain input_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  Domain weight_domain = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+  Domain output_domain = runtime->get_index_space_domain(
+      ctx, task->regions[2].region.get_index_space());
+
+  assert(input_domain.get_dim() == 4);
+  assert(weight_domain.get_dim() == 3);
+  assert(output_domain.get_dim() == 4);
+
+  /* print_tensor<float>(input.get_float_ptr(),
+                      input_domain.get_volume(),
+                      "[Attention:forward:query]"); */
+
+  IncMultiHeadSelfAttentionVerify::inference_kernel_wrapper(
+      m,
+      bc,
+      input.get_float_ptr(),
+      weight.get_float_ptr(),
+      output.get_float_ptr());
+#ifdef INFERENCE_TESTS
+  printf("Checking IncMultiHeadSelfAttentionVerify computations...\n");
+
+  // =============================================================================
+  //  Define helper functions to handle row-major arrays
+  // =============================================================================
+
+  auto set_value_row_major = [](float *arr,
+                                std::vector<int> const &shape,
+                                std::vector<int> const &indices,
+                                float value) -> void {
+    int offset = 0;
+    for (int i = 0; i < shape.size(); i++) {
+      int index = indices[i];
+      int stride = 1;
+      for (int j = i + 1; j < shape.size(); j++) {
+        stride *= shape[j];
+      }
+      offset += index * stride;
+    }
+    *(arr + offset) = value;
+  };
+
+  // =============================================================================
+  //  Load input/output/weights and parse general configs
+  // =============================================================================
+
+  float *input_cpu =
+      download_tensor<float>(input.get_float_ptr(), input_domain.get_volume());
+  assert(input_cpu != nullptr);
+  float *weight_cpu = download_tensor<float>(weight.get_float_ptr(),
+                                             weight_domain.get_volume());
+  assert(weight_cpu != nullptr);
+  float *output_cpu = download_tensor<float>(output.get_float_ptr(),
+                                             output_domain.get_volume());
+  assert(output_cpu != nullptr);
+
+  // Input tensor dimensions
+  coord_t data_dim = input_domain.hi()[0] - input_domain.lo()[0] + 1;
+  coord_t max_sequence_length = input_domain.hi()[1] - input_domain.lo()[1] + 1;
+  coord_t batch_size = input_domain.hi()[2] - input_domain.lo()[2] + 1;
+  coord_t replica_dim = input_domain.hi()[3] - input_domain.lo()[3] + 1;
+  assert(replica_dim == 1);
+
+  size_t effective_batch_size = max_sequence_length * batch_size;
+  float inputs_arr[data_dim][effective_batch_size] = {0};
+  for (size_t i = 0; i < data_dim * bc->num_active_tokens(); i++) {
+    size_t data_index = i % data_dim;
+    size_t token_index = i / data_dim;
+    assert(data_index < data_dim);
+    assert(token_index < effective_batch_size);
+    inputs_arr[data_index][token_index] = input_cpu[i];
+  }
+  torch::Tensor torch_input = torch::from_blob(
+      inputs_arr, {data_dim, (long int)effective_batch_size}, torch::kFloat32);
+
+  // Weight tensor dimensions
+  coord_t all_weight_params = weight_domain.hi()[0] - weight_domain.lo()[0] + 1;
+  coord_t num_heads = weight_domain.hi()[1] - weight_domain.lo()[1] + 1;
+  replica_dim = weight_domain.hi()[2] - weight_domain.lo()[2] + 1;
+  size_t qParas = m->qProjSize * m->qSize;
+  size_t kParas = m->kProjSize * m->kSize;
+  size_t vParas = m->vProjSize * m->vSize;
+  size_t oParas = m->oProjSize * (m->vProjSize > 0 ? m->vProjSize : m->vSize);
+
+  assert(all_weight_params == qParas + kParas + vParas + oParas);
+  assert(num_heads == m->num_heads);
+  assert(replica_dim == 1);
+
+  assert(m->qSize == m->kSize && m->kSize == m->vSize);
+  // printf("m->qSize: %i\n", m->qSize);
+  //  keep things simple for now
+  assert(m->qProjSize == m->kProjSize && m->kProjSize == m->vProjSize);
+  long int proj_sum = m->qProjSize + m->kProjSize + m->vProjSize;
+  // load weight manually because Torch can't easily read a tensor serialized in
+  // column-major order.
+
+  // printf("m->kProjSize: %i, TreeVerifyBatchConfig::MAX_NUM_TOKENS: %i, "
+  //     "bc->num_active_tokens(): %i, num_heads: %lli,
+  //     TreeVerifyBatchConfig::MAX_NUM_REQUESTS: %i, "
+  //     "bc->num_active_requests(): %i\n", m->kProjSize,
+  //     TreeVerifyBatchConfig::MAX_NUM_TOKENS, bc->num_active_tokens(),
+  //     num_heads, TreeVerifyBatchConfig::MAX_NUM_REQUESTS,
+  //     bc->num_active_requests());
+  // for (int t=0; t < bc->num_active_tokens(); t++) {
+  //   printf("token %i has request_index: %li and token_position: %li\n",
+  //   t, bc->token2ids.token_indexes[t].request_index,
+  //   bc->token2ids.token_indexes[t].token_position);
+  // }
+
+  // =============================================================================
+  //  Load the output tensor (with CUDA results), and create a Torch tensor
+  // =============================================================================
+
+  float output_cuda[m->oProjSize][effective_batch_size] = {0};
+  for (int i = 0; i < m->oProjSize * effective_batch_size; i++) {
+    int row_idx = i % m->oProjSize;
+    int col_idx = i / m->oProjSize;
+    assert(row_idx < m->oProjSize && col_idx < effective_batch_size);
+    output_cuda[row_idx][col_idx] = output_cpu[i];
+  }
+  torch::Tensor torch_out_cuda =
+      torch::from_blob(output_cuda,
+                       {m->oProjSize, (int64_t)effective_batch_size},
+                       torch::kFloat32);
+
+  // =============================================================================
+  //  Load the Q/K/V projection weights, and create a Torch tensor
+  // =============================================================================
+  std::vector<int> w_qkv_shape = {m->qSize, m->qProjSize, 3, (int)num_heads};
+  float *w_qkv =
+      (float *)calloc(m->qSize * m->qProjSize * 3 * num_heads, sizeof(float));
+  assert(w_qkv[0] == 0.0f);
+
+  for (int h = 0; h < num_heads; h++) {
+    for (size_t i = 0; i < m->qProjSize * m->qSize; i++) {
+      int row_index = i % m->qSize;
+      int column_index = i / m->qSize;
+      // Q
+      set_value_row_major(w_qkv,
+                          w_qkv_shape,
+                          {row_index, column_index, 0, h},
+                          weight_cpu[all_weight_params * h +
+                                     m->qSize * column_index + row_index]);
+      // K
+      set_value_row_major(
+          w_qkv,
+          w_qkv_shape,
+          {row_index, column_index, 1, h},
+          weight_cpu[all_weight_params * h + m->qProjSize * m->qSize +
+                     m->qSize * column_index + row_index]);
+      // V
+      set_value_row_major(
+          w_qkv,
+          w_qkv_shape,
+          {row_index, column_index, 2, h},
+          weight_cpu[all_weight_params * h + 2 * m->qProjSize * m->qSize +
+                     m->qSize * column_index + row_index]);
+    }
+  }
+  // convert weights to torch tensor
+  torch::Tensor torch_w_qkv = torch::from_blob(
+      w_qkv, {m->qSize, m->qProjSize, 3, (int)num_heads}, torch::kFloat32);
+
+  /* std::cout << "Torch projection weights size: " << torch_w_qkv.sizes()
+            << std::endl;
+  std::cout << "Torch input size: " << torch_input.sizes() << std::endl;
+  std::cout << "Number of active tokens: " << bc->num_active_tokens()
+            << std::endl; */
+  // std::cout << "torch_w_qkv:" << std::endl << torch_w_qkv << std::endl;
+
+  // =============================================================================
+  //  Compute the Q/K/V projections, and compare the results with CUDA
+  // =============================================================================
+
+  //  ----------------------- C++ computations & checks ------------------------
+  torch::Tensor qkv_projs = torch::einsum(
+      "ijkl,im->jmkl",
+      {torch_w_qkv,
+       torch_input.index({Slice(), Slice(0, bc->num_active_tokens())})});
+  // std::cout << "qkv_projs size: " << qkv_projs.sizes() << std::endl;
+  assert(qkv_projs.sizes()[0] == m->qProjSize);
+  assert(qkv_projs.sizes()[1] == bc->num_active_tokens() &&
+         qkv_projs.sizes()[1] <= effective_batch_size);
+  assert(qkv_projs.sizes()[2] == 3);
+  assert(qkv_projs.sizes()[3] == num_heads);
+  free(w_qkv);
+
+  //  ----------------------- Loading CUDA results for this step ---------------
+  float *QKVProjArray_cpu = download_tensor<float>(
+      m->devQKVProjArray,
+      TreeVerifyBatchConfig::MAX_NUM_TOKENS * proj_sum * m->num_heads);
+  assert(QKVProjArray_cpu != nullptr);
+
+  std::vector<int> QKVProjArray_converted_shape = {
+      m->qProjSize, bc->num_active_tokens(), 3, (int)num_heads};
+  float *QKVProjArray_converted = (float *)calloc(
+      m->qProjSize * bc->num_active_tokens() * 3 * num_heads, sizeof(float));
+
+  // skip over padding at the end of QKVProjArray_cpu
+  // convert from column order to 3D matrix because torch cannot automatically
+  // import matrices flattened in column order
+  for (size_t i = 0; i < proj_sum * bc->num_active_tokens() * num_heads; i++) {
+    int proj_size_index = i % m->qProjSize;
+    int head_index = i / (proj_sum * bc->num_active_tokens());
+    int token_index =
+        ((i - head_index * proj_sum * bc->num_active_tokens()) / m->qProjSize) %
+        bc->num_active_tokens();
+    int qkv_offset = (i - head_index * proj_sum * bc->num_active_tokens()) /
+                     (m->qProjSize * bc->num_active_tokens());
+    assert(proj_size_index < proj_sum);
+    assert(head_index < num_heads);
+    assert(token_index < bc->num_active_tokens());
+    assert(qkv_offset < 3);
+    set_value_row_major(QKVProjArray_converted,
+                        QKVProjArray_converted_shape,
+                        {proj_size_index, token_index, qkv_offset, head_index},
+                        QKVProjArray_cpu[i]);
+  }
+  torch::Tensor QKVProjArray_torch =
+      torch::from_blob(QKVProjArray_converted,
+                       {m->qProjSize, bc->num_active_tokens(), 3, num_heads},
+                       torch::kFloat32);
+
+  //  ----------------------- Comparing C++ & CUDA results ---------------------
+  // std::cout << "QKVProjArray_torch" << std::endl;
+  // for (int i=0; i<num_heads; i++) {
+  //   for (int j=0; j<3; j++) {
+  //     std::cout << QKVProjArray_torch.index({Slice(), Slice(), j, i}) <<
+  //     std::endl;
+  //   }
+  // }
+  // std::cout << "qkv_projs" << std::endl;
+  // for (int i=0; i<num_heads; i++) {
+  //   for (int j=0; j<3; j++) {
+  //     std::cout << qkv_projs.index({Slice(), Slice(), j, i}) << std::endl;
+  //   }
+  // }
+  assert(torch::allclose(QKVProjArray_torch, qkv_projs, 1e-05, 1e-05));
+  free(QKVProjArray_converted);
+
+  // =============================================================================
+  //  Store the K/V projections into the cache
+  // =============================================================================
+
+  //  ----------------------- C++ operations & checks --------------------------
+  // Store projections into k/v cache arrays
+  for (size_t h = 0; h < num_heads; h++) {
+    for (size_t t = 0; t < bc->num_active_tokens(); t++) {
+      for (size_t d = 0; d < m->kProjSize; d++) {
+        size_t kcache_idx = d * MAX_SEQ_LEN * m->num_heads *
+                                TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
+                            bc->tokensInfo[t].abs_depth_in_request *
+                                m->num_heads *
+                                TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
+                            h * TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
+                            bc->tokensInfo[t].request_index;
+        m->kcache[kcache_idx] =
+            qkv_projs.index({(int64_t)d, (int64_t)t, 1, (int64_t)h})
+                .item<float>();
+      }
+      for (size_t d = 0; d < m->vProjSize; d++) {
+        size_t vcache_idx = d * MAX_SEQ_LEN * m->num_heads *
+                                TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
+                            bc->tokensInfo[t].abs_depth_in_request *
+                                m->num_heads *
+                                TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
+                            h * TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
+                            bc->tokensInfo[t].request_index;
+        m->vcache[vcache_idx] =
+            qkv_projs.index({(int64_t)d, (int64_t)t, 2, (int64_t)h})
+                .item<float>();
+      }
+    }
+  }
+  // Create torch tensors from the arrays
+  torch::Tensor K_t =
+      torch::from_blob(m->kcache,
+                       {m->kProjSize,
+                        MAX_SEQ_LEN,
+                        num_heads,
+                        TreeVerifyBatchConfig::MAX_NUM_REQUESTS},
+                       torch::kFloat32);
+  torch::Tensor V_t =
+      torch::from_blob(m->vcache,
+                       {m->vProjSize,
+                        MAX_SEQ_LEN,
+                        num_heads,
+                        TreeVerifyBatchConfig::MAX_NUM_REQUESTS},
+                       torch::kFloat32);
+
+  // Compute useful indices
+  std::vector<size_t> req_idxs;
+  std::vector<size_t> r_first_idx;
+  std::vector<size_t> r_num_tokens;
+  for (size_t t = 0; t < bc->num_active_tokens(); t++) {
+    size_t rid = bc->tokensInfo[t].request_index;
+    if (req_idxs.size() == 0 || req_idxs[req_idxs.size() - 1] != rid) {
+      req_idxs.push_back(rid);
+      r_first_idx.push_back(t);
+      r_num_tokens.push_back(1);
+    } else {
+      r_num_tokens[r_num_tokens.size() - 1]++;
+    }
+    assert(req_idxs.size() == r_first_idx.size() &&
+           r_first_idx.size() == r_num_tokens.size());
+  }
+  assert(req_idxs.size() == bc->num_active_requests());
+  assert(std::accumulate(r_num_tokens.begin(),
+                         r_num_tokens.end(),
+                         decltype(r_num_tokens)::value_type(0)) ==
+         bc->num_active_tokens());
+
+  //  ----------------------- Loading CUDA results for this step ---------------
+  float *keyCache_cpu = download_tensor<float>(
+      m->keyCache,
+      m->num_heads * m->kProjSize * TreeVerifyBatchConfig::MAX_NUM_REQUESTS *
+          MAX_SEQ_LEN);
+  float *valueCache_cpu = download_tensor<float>(
+      m->valueCache,
+      m->num_heads * m->vProjSize * TreeVerifyBatchConfig::MAX_NUM_REQUESTS *
+          MAX_SEQ_LEN);
+  assert(keyCache_cpu != nullptr);
+  assert(valueCache_cpu != nullptr);
+
+  float *kcache_cuda =
+      (float *)calloc(m->kProjSize * MAX_SEQ_LEN * m->num_heads *
+                          TreeVerifyBatchConfig::MAX_NUM_REQUESTS,
+                      sizeof(float));
+  float *vcache_cuda =
+      (float *)calloc(m->vProjSize * MAX_SEQ_LEN * m->num_heads *
+                          TreeVerifyBatchConfig::MAX_NUM_REQUESTS,
+                      sizeof(float));
+  int index = 0;
+  for (int i = 0; i < m->kProjSize; i++) {
+    for (int j = 0; j < MAX_SEQ_LEN; j++) {
+      for (int k = 0; k < m->num_heads; k++) {
+        for (int l = 0; l < TreeVerifyBatchConfig::MAX_NUM_REQUESTS; l++) {
+          int col_major_index = l * m->kProjSize * MAX_SEQ_LEN * m->num_heads +
+                                k * m->kProjSize * MAX_SEQ_LEN +
+                                j * m->kProjSize + i;
+          kcache_cuda[index++] = keyCache_cpu[col_major_index];
+        }
+      }
+    }
+  }
+  index = 0;
+  for (int i = 0; i < m->vProjSize; i++) {
+    for (int j = 0; j < MAX_SEQ_LEN; j++) {
+      for (int k = 0; k < m->num_heads; k++) {
+        for (int l = 0; l < TreeVerifyBatchConfig::MAX_NUM_REQUESTS; l++) {
+          int col_major_index = l * m->vProjSize * MAX_SEQ_LEN * m->num_heads +
+                                k * m->vProjSize * MAX_SEQ_LEN +
+                                j * m->vProjSize + i;
+          vcache_cuda[index++] = valueCache_cpu[col_major_index];
+        }
+      }
+    }
+  }
+  torch::Tensor K_t_cuda =
+      torch::from_blob(kcache_cuda,
+                       {m->kProjSize,
+                        MAX_SEQ_LEN,
+                        num_heads,
+                        TreeVerifyBatchConfig::MAX_NUM_REQUESTS},
+                       torch::kFloat32);
+  torch::Tensor V_t_cuda =
+      torch::from_blob(vcache_cuda,
+                       {m->vProjSize,
+                        MAX_SEQ_LEN,
+                        num_heads,
+                        TreeVerifyBatchConfig::MAX_NUM_REQUESTS},
+                       torch::kFloat32);
+
+  //  ----------------------- Comparing C++ & CUDA results ---------------------
+
+  // std::cout << "kcache differences:" << std::endl;
+  // for (int i=0; i < bc->num_active_requests() + 1; i++) {
+  //   for (int j=0; j < num_heads; j++) {
+  //     for (int l=0; l < m->kProjSize; l++) {
+  //       for (int k=0; k < MAX_SEQ_LEN; k++) {
+  //         size_t kcache_idx =
+  //           l * MAX_SEQ_LEN * num_heads *
+  //           TreeVerifyBatchConfig::MAX_NUM_REQUESTS + k * num_heads *
+  //           TreeVerifyBatchConfig::MAX_NUM_REQUESTS + j *
+  //           TreeVerifyBatchConfig::MAX_NUM_REQUESTS + i; if (
+  //           abs(m->kcache[kcache_idx] - keyCache_cpu[
+  //               i * m->kProjSize * MAX_SEQ_LEN * num_heads +
+  //               j * m->kProjSize * MAX_SEQ_LEN +
+  //               k * m->kProjSize +
+  //               l
+  //           ]) > 0.00001) {
+  //             printf("req: %i (rid: %i), head: %i, data_dim: %i, token_pos:
+  //             %i\n",
+  //                   i, req_idxs[i], j, l, k);
+  //           }
+  //       }
+  //     }
+  //   }
+  // }
+
+  //  std::cout << "keyCache from CUDA:" << std::endl;
+  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
+  //    for (int j=0; j<num_heads; j++) {
+  //     for (int l=0; l<m->kProjSize; l++) {
+  //       for (int k=0; k< MAX_SEQ_LEN; k++) {
+  //         printf("%f ",
+  //           keyCache_cpu[i * m->kProjSize * MAX_SEQ_LEN * num_heads +
+  //               j * m->kProjSize * MAX_SEQ_LEN +
+  //               k * m->kProjSize +
+  //               l
+  //         ]);
+  //       }
+  //       printf("\n");
+  //     }
+  //     printf("\n");
+  //    }
+  //    printf("\n");
+  //  }
+
+  //  std::cout << "valueCache from CUDA:" << std::endl;
+  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
+  //    for (int j=0; j<num_heads; j++) {
+  //       for (int l=0; l<m->vProjSize; l++) {
+  //         for (int k=0; k< MAX_SEQ_LEN; k++) {
+  //           printf("%f ",
+  //             valueCache_cpu[
+  //                 i * m->vProjSize * MAX_SEQ_LEN * num_heads +
+  //                 j * m->vProjSize * MAX_SEQ_LEN +
+  //                 k * m->vProjSize +
+  //             l]);
+  //         }
+  //         printf("\n");
+  //       }
+  //       printf("\n");
+  //    }
+  //    printf("\n");
+  //  }
+
+  //  printf("\n");
+
+  //  std::cout << "C++ kcache:" << std::endl;
+  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
+  //    for (int j=0; j < num_heads; j++) {
+  //       for (int l=0; l < m->kProjSize; l++) {
+  //         for (int k=0; k < MAX_SEQ_LEN; k++) {
+  //           size_t kcache_idx =
+  //             l * MAX_SEQ_LEN * num_heads *
+  //             TreeVerifyBatchConfig::MAX_NUM_REQUESTS + k * num_heads *
+  //             TreeVerifyBatchConfig::MAX_NUM_REQUESTS + j *
+  //             TreeVerifyBatchConfig::MAX_NUM_REQUESTS + i;
+  //           printf("%f ", m->kcache[kcache_idx]);
+  //         }
+  //         printf("\n");
+  //       }
+  //       printf("\n");
+  //    }
+  //    printf("\n");
+  //  }
+
+  //  std::cout << "C++ vcache:" << std::endl;
+  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
+  //    for (int j=0; j<num_heads; j++) {
+  //       for (int l=0; l<m->vProjSize; l++) {
+  //         for (int k=0; k< MAX_SEQ_LEN; k++) {
+  //             size_t vcache_idx =
+  //               l * MAX_SEQ_LEN * num_heads *
+  //               TreeVerifyBatchConfig::MAX_NUM_REQUESTS + k * num_heads *
+  //               TreeVerifyBatchConfig::MAX_NUM_REQUESTS + j *
+  //               TreeVerifyBatchConfig::MAX_NUM_REQUESTS + i;
+  //             printf("%f ", m->vcache[vcache_idx]);
+  //         }
+  //         printf("\n");
+  //       }
+  //       printf("\n");
+  //    }
+  //    printf("\n");
+  //  }
+
+  assert(torch::allclose(K_t_cuda, K_t, 1e-05, 1e-05));
+  assert(torch::allclose(V_t_cuda, V_t, 1e-05, 1e-05));
+  free(kcache_cuda);
+  free(vcache_cuda);
+
+  // =============================================================================
+  //  Load the W_out projection weights
+  // =============================================================================
+
+  //  ----------------------- C++ operations & checks --------------------------
+  float *w_out = (float *)calloc(m->vProjSize * m->num_heads * m->oProjSize,
+                                 sizeof(float));
+  std::vector<int> w_out_shape = {m->vProjSize, m->num_heads, m->oProjSize};
+  assert(m->qProjSize == m->kProjSize && m->kProjSize == m->vProjSize);
+  for (int h = 0; h < num_heads; h++) {
+    for (int v = 0; v < m->vProjSize; v++) {
+      for (int o = 0; o < m->oProjSize; o++) {
+        set_value_row_major(
+            w_out,
+            w_out_shape,
+            {v, h, o},
+            weight_cpu[all_weight_params * h + 3 * m->qProjSize * m->qSize +
+                       m->vProjSize * o + v]);
+      }
+    }
+  }
+  // convert weights to torch tensor
+  torch::Tensor torch_w_out = torch::from_blob(
+      w_out, {m->vProjSize, m->num_heads, m->oProjSize}, torch::kFloat32);
+
+  //  ----------------------- Loading CUDA results for this step ---------------
+  float *w_out_cuda = download_tensor<float>(
+      m->W_out_contiguous, m->vProjSize * m->oProjSize * m->num_heads);
+  assert(w_out_cuda != nullptr);
+  float *converted_wout_tensor = (float *)calloc(
+      m->vProjSize * m->num_heads * m->oProjSize, sizeof(float));
+  std::vector<int> converted_wout_tensor_shape = {
+      m->vProjSize, m->num_heads, m->oProjSize};
+
+  for (int i = 0; i < m->vProjSize * m->num_heads * m->oProjSize; i++) {
+    int v_idx = i % m->vProjSize;
+    int h_idx = (i / m->vProjSize) % m->num_heads;
+    int o_idx = i / (m->vProjSize * m->num_heads);
+    assert(v_idx < m->vProjSize && h_idx < m->num_heads &&
+           o_idx < m->oProjSize);
+    set_value_row_major(converted_wout_tensor,
+                        converted_wout_tensor_shape,
+                        {v_idx, h_idx, o_idx},
+                        w_out_cuda[i]);
+  }
+  torch::Tensor w_out_cuda_tensor =
+      torch::from_blob(converted_wout_tensor,
+                       {m->vProjSize, m->num_heads, m->oProjSize},
+                       torch::kFloat32);
+
+  //  ----------------------- Comparing C++ & CUDA results ---------------------
+  assert(torch::allclose(w_out_cuda_tensor, torch_w_out, 1e-05, 1e-05));
+  free(converted_wout_tensor);
+
+  // =============================================================================
+  //  Compute the softmax(QK^T/sqrt(d_k))V product, request by request
+  // =============================================================================
+
+  //  ----------------------- C++ initialization steps -------------------------
+  torch::Tensor Q_projs = qkv_projs.index({Slice(), Slice(), 0, Slice()})
+                              .reshape({qkv_projs.sizes()[0],
+                                        qkv_projs.sizes()[1],
+                                        qkv_projs.sizes()[3]});
+
+  torch::Tensor qk_products[bc->num_active_requests()];
+  torch::Tensor qk_softmax[bc->num_active_requests()];
+  torch::Tensor attn_heads[bc->num_active_requests()];
+
+  torch::Tensor cpp_output =
+      torch::zeros({m->oProjSize, bc->num_active_tokens()});
+
+  //  ----------------------- Loading CUDA results for this step ---------------
+  float *qk_prods_cpu = download_tensor<float>(
+      m->qk_prods,
+      TreeVerifyBatchConfig::MAX_NUM_TOKENS *
+          TreeVerifyBatchConfig::MAX_NUM_TOKENS * num_heads);
+  assert(qk_prods_cpu != nullptr);
+
+  float *qk_prods_softmax_cpu = download_tensor<float>(
+      m->qk_prods_softmax,
+      TreeVerifyBatchConfig::MAX_NUM_TOKENS *
+          TreeVerifyBatchConfig::MAX_NUM_TOKENS * num_heads);
+  assert(qk_prods_softmax_cpu != nullptr);
+
+  float *attn_heads_cpu = download_tensor<float>(
+      m->attn_heads,
+      TreeVerifyBatchConfig::MAX_NUM_TOKENS * m->num_heads * m->vProjSize);
+  assert(attn_heads_cpu != nullptr);
+
+  //  ----------------------- Main loop (request by request) -------------------
+  size_t qk_prods_cpu_offset = 0;
+
+  for (size_t r = 0; r < bc->num_active_requests(); r++) {
+    // Compute pre-request parameters
+    size_t num_new_tokens = r_num_tokens[r];
+    int64_t rid = (int64_t)(req_idxs[r]);
+    int64_t num_tokens_received_so_far =
+        (int64_t)(bc->requestsInfo[rid].token_start_offset +
+                  bc->requestsInfo[rid].num_tokens_in_batch);
+    assert(num_new_tokens == bc->requestsInfo[rid].num_tokens_in_batch);
+    assert(num_tokens_received_so_far >= (int64_t)num_new_tokens);
+
+    //  ----------------------- C++ computations -------------------------------
+    // Get the slice of the Q projection tensor with the tokens in the current
+    // request
+    torch::Tensor Q_req =
+        Q_projs.index({Slice(),
+                       Slice(r_first_idx[r], r_first_idx[r] + num_new_tokens),
+                       Slice()});
+    // std::cout << "Q_req.sizes(): " << Q_req.sizes() << std::endl;
+    assert(Q_req.sizes()[0] == m->qProjSize);
+    assert(Q_req.sizes()[1] == num_new_tokens);
+    assert(Q_req.sizes()[2] == num_heads);
+
+    /*printf("\n------------ QK multiplication (C++) -------------\n");
+    printf("Request r=%lu. num_new_tokens: %lu, num_tokens_received_so_far: %li,
+    rid: %li, Qproj slice: (%i, %i)\n", r, num_new_tokens,
+    num_tokens_received_so_far, rid, r_first_idx[r], r_first_idx[r] +
+    num_new_tokens);
+
+    std::cout << "Q_req matrix (idk dims):" << std::endl <<
+    Q_req.index({Slice(), Slice(), 0}) << std::endl << std::endl; std::cout <<
+    "K_t matrix (ilk dims):" << std::endl << K_t.index({Slice(), Slice(0,
+    num_tokens_received_so_far), 0, rid}) << std::endl << std::endl; std::cout
+    << "C++ alpha: " << (1.0f / sqrt(m->kProjSize)) << std::endl;*/
+
+    // Compute (Q*K^T)/sqrt(d_k) matmul
+    qk_products[r] =
+        torch::einsum("ijk,ilk->jlk",
+                      {Q_req,
+                       K_t.index({Slice(),
+                                  Slice(0, num_tokens_received_so_far),
+                                  Slice(),
+                                  rid})}) *
+        (1.0f / sqrt(m->kProjSize));
+
+    // Set entries above diagonal to -inf to make attention causal.
+    for (int h = 0; h < num_heads; h++) {
+      qk_products[r].index(
+          {Slice(), Slice(num_tokens_received_so_far - num_new_tokens), h}) =
+          qk_products[r]
+              .index({Slice(),
+                      Slice(num_tokens_received_so_far - num_new_tokens),
+                      h})
+              .tril() +
+          torch::full({(int64_t)num_new_tokens, (int64_t)num_new_tokens},
+                      -INFINITY)
+              .triu()
+              .fill_diagonal_(0);
+    }
+    // Compute softmax for each request block
+    qk_softmax[r] = torch::softmax(qk_products[r], -2);
+    assert(qk_softmax[r].sizes()[0] == num_new_tokens);
+    assert(qk_softmax[r].sizes()[1] == num_tokens_received_so_far);
+    assert(qk_softmax[r].sizes()[2] == m->num_heads);
+
+    //  ------------------- Loading CUDA results for this step ---------------
+    float *converted_qk_prod = (float *)calloc(
+        num_new_tokens * num_tokens_received_so_far * num_heads, sizeof(float));
+    float *converted_qk_prod_softmax = (float *)calloc(
+        num_new_tokens * num_tokens_received_so_far * num_heads, sizeof(float));
+    std::vector<int> converted_qk_prod_shape = {
+        (int)num_new_tokens, (int)num_tokens_received_so_far, (int)num_heads};
+
+    for (size_t i = 0;
+         i < num_new_tokens * num_tokens_received_so_far * num_heads;
+         i++) {
+      size_t new_t_idx = i % num_new_tokens;
+      size_t all_t_idx = (i / num_new_tokens) % num_tokens_received_so_far;
+      size_t head_idx = i / (num_new_tokens * num_tokens_received_so_far);
+      assert(new_t_idx < num_new_tokens &&
+             all_t_idx < num_tokens_received_so_far && head_idx < num_heads);
+      set_value_row_major(converted_qk_prod,
+                          converted_qk_prod_shape,
+                          {(int)new_t_idx, (int)all_t_idx, (int)head_idx},
+                          qk_prods_cpu[i + qk_prods_cpu_offset]);
+      set_value_row_major(converted_qk_prod_softmax,
+                          converted_qk_prod_shape,
+                          {(int)new_t_idx, (int)all_t_idx, (int)head_idx},
+                          qk_prods_softmax_cpu[i + qk_prods_cpu_offset]);
+    }
+    torch::Tensor qk_prods_cuda = torch::from_blob(
+        converted_qk_prod,
+        {(int64_t)num_new_tokens, num_tokens_received_so_far, num_heads},
+        torch::kFloat32);
+    torch::Tensor qk_prods_softmax_cuda = torch::from_blob(
+        converted_qk_prod_softmax,
+        {(int64_t)num_new_tokens, num_tokens_received_so_far, num_heads},
+        torch::kFloat32);
+
+    //  ------------------- Comparing C++ & CUDA results ------------------
+    /* std::cout << "C++:" <<std::endl;
+    for (int h=0; h<num_heads; h++) {
+      std::cout << qk_products[r].index({Slice(), Slice(), h}) << std::endl;
+    }
+    std::cout << "CUDA:" <<std::endl;
+    for (int h=0; h<num_heads; h++) {
+      std::cout << qk_prods_cuda.index({Slice(), Slice(), h}) << std::endl;
+    } */
+    /* //
+    std::cout << "C++:" <<std::endl;
+    for (int h=0; h<num_heads; h++) {
+      std::cout << qk_softmax[r].index({Slice(), Slice(), h}) << std::endl;
+    }
+    std::cout << "CUDA:" <<std::endl;
+    for (int h=0; h<num_heads; h++) {
+      std::cout << qk_prods_softmax_cuda.index({Slice(), Slice(), h}) <<
+    std::endl;
+    } */
+    // std::cout << "C++ tril:" <<std::endl;
+    // for (int h=0; h<num_heads; h++) {
+    //   std::cout << qk_products[r].tril().index({Slice(), Slice(), h}) <<
+    //   std::endl;
+    // }
+    assert(torch::allclose(qk_prods_cuda, qk_products[r], 1e-05, 1e-05));
+    assert(torch::allclose(qk_prods_softmax_cuda, qk_softmax[r], 1e-05, 1e-05));
+    free(converted_qk_prod);
+    free(converted_qk_prod_softmax);
+
+    //  --------------------- C++ computations --------------------------
+    // Multiply softmax results by V
+    assert(
+        V_t.index({Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})
+            .sizes()[0] == m->vProjSize);
+    assert(
+        V_t.index({Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})
+            .sizes()[1] == num_tokens_received_so_far);
+    assert(
+        V_t.index({Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})
+            .sizes()[2] == m->num_heads);
+    attn_heads[r] = torch::einsum(
+        "ijk,ljk->ilk",
+        {qk_softmax[r],
+         V_t.index(
+             {Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})});
+    assert(attn_heads[r].sizes()[0] == num_new_tokens);
+    assert(attn_heads[r].sizes()[1] == m->vProjSize);
+    assert(attn_heads[r].sizes()[2] == m->num_heads);
+
+    //  ------------------- Loading CUDA results for this step  ---------------
+    float converted_attn_heads_cpu[num_new_tokens][m->vProjSize][m->num_heads] =
+        {0};
+    for (int i = 0; i < num_new_tokens * m->vProjSize * m->num_heads; i++) {
+      int token_ix = i % num_new_tokens;
+      int vproj_idx = (i / num_new_tokens) % m->vProjSize;
+      int head_idx = i / (num_new_tokens * m->vProjSize);
+      assert(token_ix < num_new_tokens && vproj_idx < m->vProjSize &&
+             head_idx < m->num_heads);
+      converted_attn_heads_cpu[token_ix][vproj_idx][head_idx] =
+          attn_heads_cpu[r_first_idx[r] * m->vProjSize * m->num_heads + i];
+    }
+    torch::Tensor converted_attn_heads_cuda =
+        torch::from_blob(converted_attn_heads_cpu,
+                         {(int64_t)num_new_tokens, m->vProjSize, m->num_heads},
+                         torch::kFloat32);
+
+    //  -------------------- Comparing C++ & CUDA results -------------------
+    /* std::cout << "CUDA attn head for req " << r << ":" <<std::endl;
+    for (int h=0; h<m->num_heads; h++) {
+      std::cout << converted_attn_heads_cuda.index({Slice(), Slice(), h}) <<
+    std::endl;
+    }
+    std::cout << "C++ attn head for req " << r << ":" <<std::endl;
+    for (int h=0; h<m->num_heads; h++) {
+      std::cout << attn_heads[r].index({Slice(), Slice(), h}) << std::endl;
+    } */
+    assert(torch::allclose(
+        converted_attn_heads_cuda, attn_heads[r], 1e-05, 1e-05));
+
+    //  ----------------------- C++ computations ----------------------------
+    // Compute output values by projecting all heads to output space
+    cpp_output.index(
+        {Slice(),
+         Slice(r_first_idx[r], r_first_idx[r] + (int64_t)num_new_tokens)}) =
+        torch::einsum("jkl,ijk->li", {torch_w_out, attn_heads[r]});
+
+    // increment main loop's auxiliary index
+    qk_prods_cpu_offset +=
+        num_new_tokens * num_tokens_received_so_far * num_heads;
+  }
+
+  //  ----------------------- Comparing C++ & CUDA results ---------------------
+  /* std::cout << "C++:" <<std::endl;
+  for (int i=0; i<m->oProjSize; i++) {
+    std::cout << cpp_output.index({i, Slice()}) << std::endl;
+  }
+  std::cout << "CUDA:" <<std::endl;
+  for (int i=0; i<m->oProjSize; i++) {
+    std::cout << torch_out_cuda.index({i, Slice(0,
+  (int64_t)bc->num_active_tokens())}) << std::endl;
+  } */
+
+  assert(torch::allclose(
+      torch_out_cuda.index(
+          {Slice(), Slice(0, (int64_t)bc->num_active_tokens())}),
+      cpp_output,
+      1e-05,
+      1e-05));
+
+  // =============================================================================
+  //  Cleanup
+  // =============================================================================
+  free(w_out);
+  checkCUDA(cudaFreeHost(input_cpu));
+  checkCUDA(cudaFreeHost(weight_cpu));
+  checkCUDA(cudaFreeHost(output_cpu));
+  checkCUDA(cudaFreeHost(QKVProjArray_cpu));
+  checkCUDA(cudaFreeHost(keyCache_cpu));
+  checkCUDA(cudaFreeHost(valueCache_cpu));
+  checkCUDA(cudaFreeHost(qk_prods_cpu));
+  checkCUDA(cudaFreeHost(qk_prods_softmax_cpu));
+  checkCUDA(cudaFreeHost(attn_heads_cpu));
+  checkCUDA(cudaFreeHost(w_out_cuda));
+  // assert(false && "All good if you see this assert failure! :)");
+#endif
+  // Done with INFERENCE_TESTS block
+}
+
+void IncMultiHeadSelfAttentionVerify::backward(FFModel const &ff) {
+  // IncMultiHeadSelfAttentionVerify does not support backward
+  assert(false);
+}
+
+bool IncMultiHeadSelfAttentionVerify::get_int_parameter(PMParameter para,
+                                                        int *value) const {
+  switch (para) {
+    case PM_NUM_HEADS:
+      *value = num_heads;
+      return true;
+    default:
+      return Op::get_int_parameter(para, value);
+  }
+}
+
+bool IncMultiHeadSelfAttentionVerify::measure_operator_cost(
+    Simulator *sim, MachineView const &mv, CostMetrics &cost_metrics) const {
+  return false;
+}
+
+bool operator==(IncMultiHeadSelfAttentionVerifyParams const &lhs,
+                IncMultiHeadSelfAttentionVerifyParams const &rhs) {
+  return lhs.layer_guid == rhs.layer_guid && lhs.embed_dim == rhs.embed_dim &&
+         lhs.num_heads == rhs.num_heads && lhs.kdim == rhs.kdim &&
+         lhs.vdim == rhs.vdim && lhs.dropout == rhs.dropout &&
+         lhs.bias == rhs.bias && lhs.add_bias_kv == rhs.add_bias_kv &&
+         lhs.add_zero_attn == rhs.add_zero_attn &&
+         lhs.apply_rotary_embedding == rhs.apply_rotary_embedding;
+}
+
+IncMultiHeadSelfAttentionVerifyParams
+    IncMultiHeadSelfAttentionVerify::get_params() const {
+  IncMultiHeadSelfAttentionVerifyParams params;
+  params.layer_guid = this->layer_guid;
+  params.embed_dim = this->oProjSize;
+  params.num_heads = this->num_heads;
+  params.kdim = this->kProjSize;
+  params.vdim = this->vProjSize;
+  params.dropout = this->dropout;
+  params.bias = this->bias;
+  params.add_bias_kv = this->add_bias_kv;
+  params.add_zero_attn = this->add_zero_attn;
+  params.apply_rotary_embedding = this->apply_rotary_embedding;
+  return params;
+}
+
+}; // namespace FlexFlow
+
+namespace std {
+size_t hash<FlexFlow::IncMultiHeadSelfAttentionVerifyParams>::operator()(
+    FlexFlow::IncMultiHeadSelfAttentionVerifyParams const &params) const {
+  size_t key = 0;
+  hash_combine(key, params.layer_guid.id);
+  hash_combine(key, params.embed_dim);
+  hash_combine(key, params.num_heads);
+  hash_combine(key, params.kdim);
+  hash_combine(key, params.vdim);
+  hash_combine(key, params.dropout);
+  hash_combine(key, params.bias);
+  hash_combine(key, params.add_bias_kv);
+  hash_combine(key, params.add_zero_attn);
+  hash_combine(key, params.apply_rotary_embedding);
+  return key;
+}
+}; // namespace std
diff --git a/src/ops/inc_mha_verify.cpp b/src/ops/inc_mha_verify.cpp
new file mode 100644
index 0000000000..42dccfd6cc
--- /dev/null
+++ b/src/ops/inc_mha_verify.cpp
@@ -0,0 +1,75 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/inc_mha_verify.h"
+#include "flexflow/utils/hip_helper.h"
+#include <hip/hip_runtime.h>
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::coord_t;
+using Legion::Memory;
+
+/*static*/
+void IncMultiHeadSelfAttentionVerify::inference_kernel_wrapper(
+    IncMultiHeadSelfAttentionVerifyMeta const *m,
+    TreeVerifyBatchConfig const *bc,
+    float const *input_ptr,
+    float const *weight_ptr,
+    float *output_ptr) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    hipEventCreate(&t_start);
+    hipEventCreate(&t_end);
+    hipEventRecord(t_start, stream);
+  }
+
+  handle_unimplemented_hip_kernel(OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY);
+
+  if (m->profiling) {
+    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    hipEventDestroy(t_start);
+    hipEventDestroy(t_end);
+    printf("IncMultiHeadSelfAttentionVerify forward time = %.2fms\n", elapsed);
+    // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
+    // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
+    // acc_output.rect, "[Attention:forward:output]");
+  }
+}
+
+IncMultiHeadSelfAttentionVerifyMeta::IncMultiHeadSelfAttentionVerifyMeta(
+    FFHandler handler,
+    IncMultiHeadSelfAttentionVerify const *attn,
+    float const *weight_ptr,
+    Memory gpu_mem,
+    int num_samples,
+    int _num_heads)
+    : OpMeta(handler, attn) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  checkCUDNN(miopenSetStream(handler.dnn, stream));
+}
+
+IncMultiHeadSelfAttentionVerifyMeta::~IncMultiHeadSelfAttentionVerifyMeta(
+    void) {}
+
+}; // namespace FlexFlow
diff --git a/src/ops/inc_mha_verify.cu b/src/ops/inc_mha_verify.cu
new file mode 100644
index 0000000000..c841addde9
--- /dev/null
+++ b/src/ops/inc_mha_verify.cu
@@ -0,0 +1,942 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+#include "cuComplex.h"
+#endif
+#include "flexflow/ops/inc_mha_verify.h"
+#include "flexflow/utils/cuda_helper.h"
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::coord_t;
+using Legion::Memory;
+
+__global__ void mha_verify_build_w_out_tensor(float const *weight_ptr,
+                                              float *contiguous_weight_ptr,
+                                              int vProjSize,
+                                              int oProjSize,
+                                              int num_heads,
+                                              int qkv_weight_block_size) {
+  CUDA_KERNEL_LOOP(i, vProjSize * oProjSize * num_heads) {
+    int v_idx = i % vProjSize;
+    int o_idx = (i / vProjSize) % oProjSize;
+    int head_idx = i / (vProjSize * oProjSize);
+    contiguous_weight_ptr[o_idx * vProjSize * num_heads + head_idx * vProjSize +
+                          v_idx] =
+        weight_ptr[head_idx * (qkv_weight_block_size + vProjSize * oProjSize) +
+                   qkv_weight_block_size + o_idx * vProjSize + v_idx];
+  }
+}
+
+__global__ void commit_tokens_kernel(
+    float const *devQKVProjArray,
+    float *cache_ptr,
+    TreeVerifyBatchConfig::CommittedTokensInfo const *committedTokenInfos,
+    int qProjSize,
+    int kProjSize,
+    int vProjSize,
+    int num_tokens,
+    int num_heads,
+    int max_seq_len,
+    bool k_cache) {
+
+  CUDA_KERNEL_LOOP(i,
+                   num_tokens * (k_cache ? kProjSize : vProjSize) * num_heads) {
+    int proj_size = k_cache ? kProjSize : vProjSize;
+    int data_idx = i % proj_size;
+    int head_idx = i / (num_tokens * proj_size);
+    int token_idx = (i - head_idx * (num_tokens * proj_size)) / proj_size;
+    token_idx = committedTokenInfos[token_idx].token_index;
+
+    int qkv_block_size = (qProjSize + kProjSize + vProjSize) * num_tokens;
+    int current_head_block_size =
+        num_tokens * (k_cache ? qProjSize : qProjSize + kProjSize);
+    float val =
+        devQKVProjArray[head_idx * qkv_block_size + current_head_block_size +
+                        token_idx * proj_size + data_idx];
+    // int const req_id = id_map[token_idx].request_index;
+    // int const tok_id = id_map[token_idx].token_position;
+    int const req_id = committedTokenInfos[token_idx].request_index;
+    int const tok_id = committedTokenInfos[token_idx].token_depth;
+
+    cache_ptr[req_id * (num_heads * max_seq_len * proj_size) +
+              head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
+              data_idx] = val;
+  }
+}
+
+void commit_tokens(IncMultiHeadSelfAttentionVerifyMeta const *m,
+                   TreeVerifyBatchConfig const *bc,
+                   cudaStream_t stream) {
+  int num_tokens_to_commit = bc->num_tokens_to_commit;
+  if (num_tokens_to_commit > 0) {
+    int parallelism = m->kProjSize * num_tokens_to_commit * m->num_heads;
+    commit_tokens_kernel<<<GET_BLOCKS(parallelism),
+                           min(CUDA_NUM_THREADS, parallelism),
+                           0,
+                           stream>>>(m->devQKVProjArray,
+                                     m->keyCache,
+                                     m->committed_token_infos,
+                                     m->qProjSize,
+                                     m->kProjSize,
+                                     m->vProjSize,
+                                     num_tokens_to_commit,
+                                     m->num_heads,
+                                     MAX_SEQ_LEN,
+                                     /* k_cache = */ true);
+
+    parallelism = m->vProjSize * num_tokens_to_commit * m->num_heads;
+    commit_tokens_kernel<<<GET_BLOCKS(parallelism),
+                           min(CUDA_NUM_THREADS, parallelism),
+                           0,
+                           stream>>>(m->devQKVProjArray,
+                                     m->valueCache,
+                                     m->committed_token_infos,
+                                     m->qProjSize,
+                                     m->kProjSize,
+                                     m->vProjSize,
+                                     num_tokens_to_commit,
+                                     m->num_heads,
+                                     MAX_SEQ_LEN,
+                                     /* k_cache = */ false);
+  }
+}
+
+__global__ void mha_verify_apply_rotary_embedding(
+    float *input_ptr,
+    cuFloatComplex *complex_input,
+    TreeVerifyBatchConfig::PerTokenInfo const *tokenInfos,
+    int qProjSize,
+    int kProjSize,
+    int num_heads,
+    int num_tokens,
+    int q_block_size,
+    int k_block_size,
+    int v_block_size,
+    bool q_tensor) {
+  int proj_size = q_tensor ? qProjSize : kProjSize;
+  CUDA_KERNEL_LOOP(i, num_tokens * proj_size * num_heads / 2) {
+    // create complex number
+    int head_idx = i / (num_tokens * proj_size / 2);
+    int idx = i % (num_tokens * proj_size / 2);
+    int real_part_index =
+        idx * 2 + head_idx * (q_block_size + k_block_size + v_block_size) +
+        (q_tensor ? 0 : q_block_size);
+    int complex_part_index = real_part_index + 1;
+
+    complex_input[i] = {input_ptr[real_part_index],
+                        input_ptr[complex_part_index]};
+
+    // get the freq_cis: shape 1 * (qProjSize/2) = 1 * 64
+    // apply a Cartesian coordinate transformation
+    // multiple with input & /copy back to q/k
+
+    // get position of token
+    //  int head_idx = i / (num_tokens * proj_size);
+    int token_idx =
+        (i - head_idx * (num_tokens * proj_size / 2)) / (proj_size / 2);
+    // size_t pos = id_map[token_idx].token_position;
+    size_t pos = tokenInfos[token_idx].abs_depth_in_request;
+
+    // float before_real = complex_input[i].x, before_complex =
+    // complex_input[i].y;
+
+    int pos_i = i % (proj_size / 2);
+    float freq = pos * (1.0 / pow(10000.0, (float)2 * pos_i / proj_size));
+    cuFloatComplex complex_pos = {cos(freq), sin(freq)};
+
+    complex_input[i] = cuCmulf(complex_input[i], complex_pos);
+    input_ptr[real_part_index] = complex_input[i].x;
+    input_ptr[real_part_index + 1] = complex_input[i].y;
+
+    // if (i % 64 == 1 && head_idx == 0) {
+    //   printf("head id: %d, tokenid: %d, pospospos:->  %d, before real part
+    //   %f, "
+    //          "before complex part: %f, real part: %f,"
+    //          "complext part: %f,  freq_cis real: %f, freq_cis commplexx
+    //          %f\n", head_idx, token_idx, pos, before_real, before_complex,
+    //          complex_input[i].x,
+    //          complex_input[i].y,
+    //          complex_pos.x,
+    //          complex_pos.y);
+    // }
+  }
+}
+
+void inference_kernel1(IncMultiHeadSelfAttentionVerifyMeta const *m,
+                       TreeVerifyBatchConfig const *bc,
+                       float const *input_ptr,
+                       float const *weight_ptr,
+                       float *output_ptr,
+                       cudaStream_t stream) {
+
+  checkCUDA(cublasSetStream(m->handle.blas, stream));
+  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
+  float alpha = 1.0f, beta = 0.0f;
+  assert(m->qSize == m->vSize && m->qSize == m->kSize);
+  cudaDataType_t data_type = ff_to_cuda_datatype(DT_FLOAT);
+#if CUDA_VERSION >= 11000
+  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
+  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+#else
+  cudaDataType_t compute_type = CUDA_R_32F;
+#endif
+  // Compute (W^T)x matmul: einsum(ijkl,im->jmkl)
+  // Weights: qSize x qProjSize x 3 x num_heads
+  // Input: qSize x num_tokens
+  // Output >>> qProjSize x num_tokens x 3 x num_heads
+  int m_q = m->qProjSize;
+  int m_k = m->kProjSize;
+  int m_v = m->vProjSize;
+  assert(m_q == m_k && m_k == m_v); // keep things simple for now
+  int n = bc->num_active_tokens();
+  int k = m->qSize;
+  int lda = k, ldb = k, ldc_q = m_q, ldc_k = m_k, ldc_v = m_v;
+  size_t strideA =
+      m->weights_params; // need to also skip over all the parameters for each
+                         // head, plus the unused W_o weights
+  size_t strideB = 0;    // input stays the same for all heads.
+  size_t strideC =
+      (m_q + m_k + m_v) * n; // size of the output block for each head.
+  // Q
+  checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                       CUBLAS_OP_T,
+                                       CUBLAS_OP_N,
+                                       m_q,
+                                       n,
+                                       k,
+                                       &alpha,
+                                       weight_ptr,
+                                       data_type,
+                                       lda,
+                                       strideA,
+                                       input_ptr,
+                                       data_type,
+                                       ldb,
+                                       strideB,
+                                       &beta,
+                                       output_ptr,
+                                       data_type,
+                                       ldc_q,
+                                       strideC,
+                                       m->num_heads,
+                                       compute_type,
+                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
+  checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                       CUBLAS_OP_T,
+                                       CUBLAS_OP_N,
+                                       m_k,
+                                       n,
+                                       k,
+                                       &alpha,
+                                       weight_ptr + m_q * k,
+                                       data_type,
+                                       lda,
+                                       strideA,
+                                       input_ptr,
+                                       data_type,
+                                       ldb,
+                                       strideB,
+                                       &beta,
+                                       output_ptr + m_q * n,
+                                       data_type,
+                                       ldc_k,
+                                       strideC,
+                                       m->num_heads,
+                                       compute_type,
+                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+  // V
+  checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                       CUBLAS_OP_T,
+                                       CUBLAS_OP_N,
+                                       m_v,
+                                       n,
+                                       k,
+                                       &alpha,
+                                       weight_ptr + (m_q + m_k) * k,
+                                       data_type,
+                                       lda,
+                                       strideA,
+                                       input_ptr,
+                                       data_type,
+                                       ldb,
+                                       strideB,
+                                       &beta,
+                                       output_ptr + (m_q + m_k) * n,
+                                       data_type,
+                                       ldc_v,
+                                       strideC,
+                                       m->num_heads,
+                                       compute_type,
+                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
+  // apply rotary emmmbedding for k and v
+  // step1 change the k, v to complex tensor
+  int num_tokens = bc->num_active_tokens();
+  int parallelism = m->kProjSize * num_tokens * m->num_heads;
+  int q_block_size = m->qProjSize * num_tokens;
+  int k_block_size = m->kProjSize * num_tokens;
+  int v_block_size = m->vProjSize * num_tokens;
+  cuFloatComplex *complex_input;
+  if (*m->apply_rotary_embedding) {
+    checkCUDA(cudaMalloc(&complex_input,
+                         num_tokens * m->qProjSize * m->num_heads *
+                             sizeof(cuFloatComplex *) / 2));
+    /*q*/
+    mha_verify_apply_rotary_embedding<<<GET_BLOCKS(parallelism),
+                                        min(CUDA_NUM_THREADS, parallelism),
+                                        0,
+                                        stream>>>(output_ptr,
+                                                  complex_input,
+                                                  m->token_infos,
+                                                  m->qProjSize,
+                                                  m->kProjSize,
+                                                  m->num_heads,
+                                                  num_tokens,
+                                                  q_block_size,
+                                                  k_block_size,
+                                                  v_block_size,
+                                                  true);
+    /*k*/
+    mha_verify_apply_rotary_embedding<<<GET_BLOCKS(parallelism),
+                                        min(CUDA_NUM_THREADS, parallelism),
+                                        0,
+                                        stream>>>(output_ptr,
+                                                  complex_input,
+                                                  m->token_infos,
+                                                  m->qProjSize,
+                                                  m->kProjSize,
+                                                  m->num_heads,
+                                                  num_tokens,
+                                                  q_block_size,
+                                                  k_block_size,
+                                                  v_block_size,
+                                                  false);
+  }
+}
+
+__global__ void initial_store_kv_cache(
+    float const *devQKVProjArray,
+    float *cache_ptr,
+    TreeVerifyBatchConfig::PerTokenInfo const *tokenInfos,
+    int qProjSize,
+    int kProjSize,
+    int vProjSize,
+    int num_tokens,
+    int num_heads,
+    int max_seq_len,
+    bool k_cache) {
+  CUDA_KERNEL_LOOP(i,
+                   num_tokens * (k_cache ? kProjSize : vProjSize) * num_heads) {
+    int proj_size = k_cache ? kProjSize : vProjSize;
+    int head_idx = i / (num_tokens * proj_size);
+    int token_idx = (i - head_idx * (num_tokens * proj_size)) / proj_size;
+    int data_idx = i % proj_size;
+
+    // only store the first branch initially, to avoid overwriting
+    if (tokenInfos[token_idx].tree_branch_idx == 0) {
+      int qkv_block_size = (qProjSize + kProjSize + vProjSize) * num_tokens;
+      int current_head_block_size =
+          num_tokens * (k_cache ? qProjSize : qProjSize + kProjSize);
+      float val =
+          devQKVProjArray[head_idx * qkv_block_size + current_head_block_size +
+                          token_idx * proj_size + data_idx];
+      // int const req_id = id_map[token_idx].request_index;
+      // int const tok_id = id_map[token_idx].token_position;
+      int const req_id = tokenInfos[token_idx].request_index;
+      int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
+
+      cache_ptr[req_id * (num_heads * max_seq_len * proj_size) +
+                head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
+                data_idx] = val;
+    }
+  }
+}
+
+__global__ void update_tree_branch_kv_cache(
+    float const *devQKVProjArray,
+    float *cache_ptr,
+    TreeVerifyBatchConfig::PerTokenInfo const *tokenInfos,
+    int qProjSize,
+    int kProjSize,
+    int vProjSize,
+    int num_tokens_in_branch,
+    int num_tokens_previous_branches,
+    int num_tokens_previous_requests,
+    int total_tokens_in_batch,
+    int num_heads,
+    int max_seq_len,
+    bool k_cache) {
+  CUDA_KERNEL_LOOP(
+      i, num_tokens_in_branch * (k_cache ? kProjSize : vProjSize) * num_heads) {
+    int proj_size = k_cache ? kProjSize : vProjSize;
+    int data_idx = i % proj_size;
+    int token_idx =
+        (i / proj_size) % num_tokens_in_branch; // index in the tree branch
+    int head_idx = i / (proj_size * num_tokens_in_branch);
+
+    token_idx += num_tokens_previous_branches; // get index in the whole request
+    token_idx += num_tokens_previous_requests; // get index in the whole batch
+    int qkv_block_size = (qProjSize + kProjSize + vProjSize) *
+                         total_tokens_in_batch; // skip over previous heads
+    int current_head_block_size =
+        total_tokens_in_batch *
+        (k_cache ? qProjSize
+                 : qProjSize + kProjSize); // skip over Q entries (and K entries
+                                           // if we are working on the V cache)
+    float val =
+        devQKVProjArray[head_idx * qkv_block_size + current_head_block_size +
+                        token_idx * proj_size + data_idx];
+    int const req_id = tokenInfos[token_idx].request_index;
+    int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
+
+    cache_ptr[req_id * (num_heads * max_seq_len * proj_size) +
+              head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
+              data_idx] = val;
+  }
+}
+
+void inference_kernel2(IncMultiHeadSelfAttentionVerifyMeta const *m,
+                       TreeVerifyBatchConfig const *bc,
+                       cudaStream_t stream) {
+  int num_tokens = bc->num_active_tokens();
+  if (num_tokens > 0) {
+    int parallelism = m->kProjSize * num_tokens * m->num_heads;
+    initial_store_kv_cache<<<GET_BLOCKS(parallelism),
+                             min(CUDA_NUM_THREADS, parallelism),
+                             0,
+                             stream>>>(m->devQKVProjArray,
+                                       m->keyCache,
+                                       m->token_infos,
+                                       m->qProjSize,
+                                       m->kProjSize,
+                                       m->vProjSize,
+                                       num_tokens,
+                                       m->num_heads,
+                                       MAX_SEQ_LEN,
+                                       /* k_cache = */ true);
+
+    parallelism = m->vProjSize * num_tokens * m->num_heads;
+    initial_store_kv_cache<<<GET_BLOCKS(parallelism),
+                             min(CUDA_NUM_THREADS, parallelism),
+                             0,
+                             stream>>>(m->devQKVProjArray,
+                                       m->valueCache,
+                                       m->token_infos,
+                                       m->qProjSize,
+                                       m->kProjSize,
+                                       m->vProjSize,
+                                       num_tokens,
+                                       m->num_heads,
+                                       MAX_SEQ_LEN,
+                                       /* k_cache = */ false);
+  }
+}
+
+__global__ void
+    mha_verify_fill_entries_above_diagonal(float *matrix,
+                                           size_t num_rows,
+                                           size_t num_cols,
+                                           size_t num_heads,
+                                           size_t entries_above_diagonal,
+                                           float value) {
+  CUDA_KERNEL_LOOP(i, entries_above_diagonal * num_heads) {
+    size_t head_idx = i / entries_above_diagonal;
+    size_t entry_idx = i % entries_above_diagonal;
+    size_t y = (-1 + sqrt(8 * (float)entry_idx + 1)) / 2;
+    size_t x = entry_idx - y * (y + 1) / 2;
+    y += (num_cols - num_rows) + 1;
+    matrix[head_idx * num_rows * num_cols + num_cols * y + x] = value;
+  }
+}
+
+void inference_kernel3(IncMultiHeadSelfAttentionVerifyMeta const *m,
+                       TreeVerifyBatchConfig const *bc,
+                       float *output_ptr,
+                       cudaStream_t stream) {
+  checkCUDA(cublasSetStream(m->handle.blas, stream));
+  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
+  cudaDataType_t cublas_data_type = ff_to_cuda_datatype(DT_FLOAT);
+#if CUDA_VERSION >= 11000
+  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
+  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+#else
+  cudaDataType_t compute_type = CUDA_R_32F;
+#endif
+  // int num_requests = bc->num_active_requests();
+  int num_tokens = bc->num_active_tokens();
+  int tokens_previous_requests = 0;
+  int tokens_prev_requests_squares = 0;
+  int qkv_block_size =
+      (m->qProjSize + m->kProjSize + m->vProjSize) * num_tokens;
+  int kt_block_size = m->kProjSize * MAX_SEQ_LEN;
+  int kt_req_block_size = kt_block_size * m->num_heads;
+  int vt_block_size = m->vProjSize * MAX_SEQ_LEN;
+  int vt_req_block_size = vt_block_size * m->num_heads;
+  assert(m->qProjSize == m->kProjSize);
+
+  for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+
+    int tokens_previous_tree_branches = 0;
+
+    while (tokens_previous_tree_branches <
+           bc->requestsInfo[i].num_tokens_in_batch) {
+      int tree_branch_idx = bc->tokensInfo[tokens_previous_requests +
+                                           tokens_previous_tree_branches]
+                                .tree_branch_idx;
+      int num_new_tokens = 1;
+      for (int j = tokens_previous_requests + tokens_previous_tree_branches + 1;
+           j <
+           tokens_previous_requests + bc->requestsInfo[i].num_tokens_in_batch;
+           j++) {
+        if (bc->tokensInfo[j].tree_branch_idx != tree_branch_idx) {
+          break;
+        } else {
+          num_new_tokens++;
+        }
+      }
+      int total_tokens = bc->tokensInfo[tokens_previous_requests +
+                                        tokens_previous_tree_branches]
+                             .abs_depth_in_request +
+                         num_new_tokens;
+      assert(num_new_tokens >= 1 && total_tokens >= num_new_tokens);
+
+      if (tree_branch_idx == 0) {
+        assert(bc->tokensInfo[tokens_previous_requests].abs_depth_in_request ==
+               bc->requestsInfo[i].token_start_offset);
+      } else {
+        // update K-V cache
+        int parallelism = m->kProjSize * num_new_tokens * m->num_heads;
+        update_tree_branch_kv_cache<<<GET_BLOCKS(parallelism),
+                                      min(CUDA_NUM_THREADS, parallelism),
+                                      0,
+                                      stream>>>(
+            m->devQKVProjArray,
+            m->keyCache,
+            m->token_infos,
+            m->qProjSize,
+            m->kProjSize,
+            m->vProjSize,
+            num_new_tokens,                // num_tokens_in_branch
+            tokens_previous_tree_branches, // num_tokens_previous_branches
+            tokens_previous_requests,      // num_tokens_previous_requests
+            bc->requestsInfo[i].num_tokens_in_batch, // total_tokens_in_batch
+            m->num_heads,
+            MAX_SEQ_LEN,
+            /* k_cache = */ true);
+
+        parallelism = m->vProjSize * num_new_tokens * m->num_heads;
+        update_tree_branch_kv_cache<<<GET_BLOCKS(parallelism),
+                                      min(CUDA_NUM_THREADS, parallelism),
+                                      0,
+                                      stream>>>(
+            m->devQKVProjArray,
+            m->valueCache,
+            m->token_infos,
+            m->qProjSize,
+            m->kProjSize,
+            m->vProjSize,
+            num_new_tokens,                // num_tokens_in_branch
+            tokens_previous_tree_branches, // num_tokens_previous_branches
+            tokens_previous_requests,      // num_tokens_previous_requests
+            bc->requestsInfo[i].num_tokens_in_batch, // total_tokens_in_batch
+            m->num_heads,
+            MAX_SEQ_LEN,
+            /* k_cache = */ false);
+      }
+
+      // int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+      /* int total_tokens = bc->requestsInfo[i].token_start_offset +
+                        bc->requestsInfo[i].num_tokens_in_batch; */
+      // bc->token_last_available_idx[i] + 1;
+      // Compute (QK^T/sqrt(d_k))
+      int m_ = num_new_tokens;
+      int n = total_tokens;
+      int k = m->qProjSize;
+      int lda = k, ldb = k, ldc = m_;
+      int strideA = qkv_block_size;
+      int strideB = kt_block_size;
+      int strideC = num_new_tokens * total_tokens;
+
+      float alpha = 1.0f / (float)sqrt(m->kProjSize), beta = 0.0f;
+      // To get A, skip over Q entries from previous requests (same head)
+      void const *A = (void const *)(m->devQKVProjArray +
+                                     tokens_previous_requests * m->qProjSize);
+      // To get B, skip over K entries from previous requests (all heads +
+      // padding)
+      void const *B = (void const *)(m->keyCache + i * kt_req_block_size);
+      // To get C, skip over QK^T products from previous requests
+      void *C =
+          (void *)(m->qk_prods + m->num_heads * tokens_prev_requests_squares);
+
+      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                           CUBLAS_OP_T,
+                                           CUBLAS_OP_N,
+                                           m_,
+                                           n,
+                                           k,
+                                           &alpha,
+                                           A,
+                                           cublas_data_type,
+                                           lda,
+                                           strideA,
+                                           B,
+                                           cublas_data_type,
+                                           ldb,
+                                           strideB,
+                                           &beta,
+                                           C,
+                                           cublas_data_type,
+                                           ldc,
+                                           strideC,
+                                           m->num_heads,
+                                           compute_type,
+                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+      // Fill all elements above diagonal in qk prods with -inf to force
+      // causal attention.
+      assert(num_new_tokens <= total_tokens);
+      size_t entries_above_diagonal = num_new_tokens * (num_new_tokens - 1) / 2;
+      if (entries_above_diagonal > 0) {
+        size_t parallelism = m->num_heads * entries_above_diagonal;
+        mha_verify_fill_entries_above_diagonal<<<GET_BLOCKS(parallelism),
+                                                 min((size_t)CUDA_NUM_THREADS,
+                                                     parallelism),
+                                                 0,
+                                                 stream>>>(
+            (float *)C,
+            num_new_tokens,
+            total_tokens,
+            m->num_heads,
+            entries_above_diagonal,
+            -INFINITY);
+      }
+      // Compute Softmax(QK^T/sqrt(d_k))
+      cudnnTensorDescriptor_t qk_tensor;
+      checkCUDNN(cudnnCreateTensorDescriptor(&qk_tensor));
+      // Before modifying the parameters below, make sure to read the following
+      // description of the CUDNN_TENSOR_NCHW tensor layout, from
+      // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#cudnnTensorFormat_t:
+      // This tensor format specifies that the data is laid out in the following
+      // order: batch size, feature maps, rows, columns. The strides are
+      // implicitly defined in such a way that the data are contiguous in memory
+      // with no padding between images, feature maps, rows, and columns; the
+      // columns are the inner dimension and the images are the outermost
+      // dimension.
+      int n_param = m->num_heads;
+      int c_param = total_tokens;
+      int h_param = 1;
+      int w_param = num_new_tokens;
+      checkCUDNN(cudnnSetTensor4dDescriptor(qk_tensor,
+                                            CUDNN_TENSOR_NCHW,
+                                            CUDNN_DATA_FLOAT,
+                                            n_param,
+                                            c_param,
+                                            h_param,
+                                            w_param));
+      alpha = 1.0f, beta = 0.0f;
+      void *C_softmax = (void *)(m->qk_prods_softmax +
+                                 m->num_heads * tokens_prev_requests_squares);
+      // The softmax operation below is executed according to the
+      // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
+      // softmax operation is computed per spatial location (H,W) per image (N)
+      // across dimension C.
+      checkCUDNN(cudnnSoftmaxForward(m->handle.dnn,
+                                     CUDNN_SOFTMAX_ACCURATE,
+                                     CUDNN_SOFTMAX_MODE_CHANNEL,
+                                     &alpha,
+                                     qk_tensor,
+                                     (void *)((float *)C),
+                                     &beta,
+                                     qk_tensor,
+                                     (void *)((float *)C_softmax)));
+      // Matmul softmax(QK^T/sqrt(d_k)) by V
+      alpha = 1.0f, beta = 0.0f;
+      m_ = num_new_tokens;
+      n = m->vProjSize;
+      k = total_tokens;
+      lda = m_, ldb = n, ldc = m_;
+      strideA = num_new_tokens * total_tokens;
+      strideB = vt_block_size;
+      strideC = num_new_tokens * m->vProjSize;
+      // To get A, skip over softmax(QK^T/sqrt(d_k)) entries from previous
+      // requests (all heads)
+      A = (void const *)C_softmax;
+      // To get B, skip over V^T entries from previous requests (all heads +
+      // padding)
+      B = (void const *)(m->valueCache + i * vt_req_block_size);
+      // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
+      // requests
+      C = (void *)(m->attn_heads +
+                   tokens_previous_requests * m->num_heads * m->vProjSize);
+
+      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                           CUBLAS_OP_N,
+                                           CUBLAS_OP_T,
+                                           m_,
+                                           n,
+                                           k,
+                                           &alpha,
+                                           A,
+                                           cublas_data_type,
+                                           lda,
+                                           strideA,
+                                           B,
+                                           cublas_data_type,
+                                           ldb,
+                                           strideB,
+                                           &beta,
+                                           C,
+                                           cublas_data_type,
+                                           ldc,
+                                           strideC,
+                                           m->num_heads,
+                                           compute_type,
+                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+      // Project to output, save result directly on output tensor
+      alpha = 1.0f, beta = 0.0f;
+      m_ = m->oProjSize;
+      k = m->vProjSize * m->num_heads;
+      n = num_new_tokens;
+      lda = k, ldb = n, ldc = m_;
+      A = (void const *)m->W_out_contiguous;
+      B = (void const *)C;
+      C = (void *)(output_ptr + tokens_previous_requests * m->oProjSize);
+
+      checkCUDA(cublasGemmEx(m->handle.blas,
+                             CUBLAS_OP_T,
+                             CUBLAS_OP_T,
+                             m_,
+                             n,
+                             k,
+                             &alpha,
+                             A,
+                             cublas_data_type,
+                             lda,
+                             B,
+                             cublas_data_type,
+                             ldb,
+                             &beta,
+                             C,
+                             cublas_data_type,
+                             ldc,
+                             compute_type,
+                             CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+      tokens_previous_tree_branches += num_new_tokens;
+      tokens_prev_requests_squares += num_new_tokens * total_tokens;
+    }
+    tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
+  }
+
+  assert(tokens_previous_requests == num_tokens);
+}
+
+/*static*/
+void IncMultiHeadSelfAttentionVerify::inference_kernel_wrapper(
+    IncMultiHeadSelfAttentionVerifyMeta const *m,
+    TreeVerifyBatchConfig const *bc,
+    float const *input_ptr,
+    float const *weight_ptr,
+    float *output_ptr) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+
+  // copy committed tokens info to GPU for the commit_tokens kernel
+  cudaMemcpyAsync(m->committed_token_infos,
+                  &(bc->commited_tokens),
+                  bc->MAX_NUM_TOKENS *
+                      sizeof(TreeVerifyBatchConfig::CommittedTokensInfo),
+                  cudaMemcpyHostToDevice,
+                  stream);
+
+  // reload the weight_o
+
+  if (!(*m->has_load_weights)) {
+    int parallelism = m->vProjSize * m->oProjSize * m->num_heads;
+    mha_verify_build_w_out_tensor<<<GET_BLOCKS(parallelism),
+                                    min(CUDA_NUM_THREADS, parallelism),
+                                    0,
+                                    stream>>>(weight_ptr,
+                                              m->W_out_contiguous,
+                                              m->vProjSize,
+                                              m->oProjSize,
+                                              m->num_heads,
+                                              (m->qSize * m->qProjSize +
+                                               m->kSize * m->kProjSize +
+                                               m->vSize * m->vProjSize));
+    *m->has_load_weights = true;
+  }
+  // here because we need postion info in infernece 1
+  cudaMemcpyAsync(m->token_infos,
+                  &(bc->tokensInfo),
+                  bc->MAX_NUM_TOKENS *
+                      sizeof(TreeVerifyBatchConfig::PerTokenInfo),
+                  cudaMemcpyHostToDevice,
+                  stream);
+  // phase 1: Implement kernel to compute KQV for input tokens
+  inference_kernel1(m, bc, input_ptr, weight_ptr, m->devQKVProjArray, stream);
+
+  // phase 2: Update key/val cache
+  inference_kernel2(m, bc, stream);
+
+  // phase 3: Compute attention score
+  // 3 kernels for pahse 3: matmul1 - softmax - matmal2
+  inference_kernel3(m, bc, output_ptr, stream);
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("IncMultiHeadSelfAttentionVerify forward time = %.2fms\n", elapsed);
+    // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
+    // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
+    // acc_output.rect, "[Attention:forward:output]");
+  }
+}
+
+IncMultiHeadSelfAttentionVerifyMeta::IncMultiHeadSelfAttentionVerifyMeta(
+    FFHandler handler,
+    IncMultiHeadSelfAttentionVerify const *attn,
+    float const *weight_ptr,
+    Memory gpu_mem,
+    int num_samples,
+    int _num_heads)
+    : OpMeta(handler, attn) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  checkCUDNN(cudnnSetStream(handler.dnn, stream));
+
+  qSize = attn->qSize;
+  kSize = attn->kSize;
+  vSize = attn->vSize;
+  // assume dimensions match for now
+  assert(qSize == kSize);
+  assert(kSize == vSize);
+  qProjSize = attn->qProjSize;
+  kProjSize = attn->kProjSize;
+  assert(qProjSize == kProjSize); // required for attention QK^T matmul
+  vProjSize = attn->vProjSize;
+  oProjSize = attn->oProjSize;
+
+  num_heads = _num_heads;
+  weights_params = (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize +
+                    oProjSize * (vProjSize > 0 ? vProjSize : vSize));
+  weightSize = weights_params * num_heads * sizeof(float);
+  has_load_weights = (bool *)calloc(1, sizeof(bool));
+  *has_load_weights = false;
+  apply_rotary_embedding = (bool *)calloc(1, sizeof(bool));
+  *apply_rotary_embedding = attn->apply_rotary_embedding;
+  // Currently do not support adding bias to key/value projection
+  assert(!attn->add_bias_kv);
+
+#ifdef INFERENCE_TESTS
+  kcache = (float *)calloc(kProjSize * MAX_SEQ_LEN * num_heads *
+                               TreeVerifyBatchConfig::MAX_NUM_REQUESTS,
+                           sizeof(float));
+  vcache = (float *)calloc(vProjSize * MAX_SEQ_LEN * num_heads *
+                               TreeVerifyBatchConfig::MAX_NUM_REQUESTS,
+                           sizeof(float));
+#endif
+
+  // allocate memory for the seqArray and reserve space
+  {
+    size_t qkv_proj_dim = qProjSize + kProjSize + vProjSize;
+    size_t qkv_max_proj_size =
+        TreeVerifyBatchConfig::MAX_NUM_TOKENS * qkv_proj_dim * num_heads;
+    size_t committed_tokeninfo_size = TreeVerifyBatchConfig::MAX_NUM_TOKENS;
+    size_t key_cache_size = num_heads * kProjSize *
+                            TreeVerifyBatchConfig::MAX_NUM_REQUESTS *
+                            MAX_SEQ_LEN;
+    size_t value_cache_size = num_heads * vProjSize *
+                              TreeVerifyBatchConfig::MAX_NUM_REQUESTS *
+                              MAX_SEQ_LEN;
+    size_t tokeninfo_size = TreeVerifyBatchConfig::MAX_NUM_TOKENS;
+    size_t qk_prod_size = TreeVerifyBatchConfig::MAX_NUM_TOKENS *
+                          TreeVerifyBatchConfig::MAX_NUM_TOKENS * num_heads;
+    size_t attn_heads_size =
+        TreeVerifyBatchConfig::MAX_NUM_TOKENS * num_heads * vProjSize;
+    size_t W_out_block_size = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
+    size_t W_out_contiguous_size = W_out_block_size * num_heads;
+    size_t totalSize =
+        (qkv_max_proj_size + key_cache_size + value_cache_size +
+         2 * qk_prod_size + attn_heads_size + W_out_contiguous_size) *
+            sizeof(float) +
+        tokeninfo_size * sizeof(TreeVerifyBatchConfig::PerTokenInfo) +
+        committed_tokeninfo_size *
+            sizeof(TreeVerifyBatchConfig::CommittedTokensInfo);
+
+    Realm::Rect<1, coord_t> bounds(Realm::Point<1, coord_t>(0),
+                                   Realm::Point<1, coord_t>(totalSize - 1));
+    std::vector<size_t> field_sizes;
+    field_sizes.push_back(sizeof(char));
+    Realm::RegionInstance::create_instance(reserveInst,
+                                           gpu_mem,
+                                           bounds,
+                                           field_sizes,
+                                           0,
+                                           Realm::ProfilingRequestSet())
+        .wait();
+    devQKVProjArray = (float *)reserveInst.pointer_untyped(0, sizeof(char));
+    committed_token_infos =
+        (TreeVerifyBatchConfig::CommittedTokensInfo *)(devQKVProjArray +
+                                                       qkv_max_proj_size);
+    keyCache = (float *)(committed_token_infos + committed_tokeninfo_size);
+    valueCache = (float *)keyCache + key_cache_size;
+    token_infos =
+        (TreeVerifyBatchConfig::PerTokenInfo *)(valueCache + value_cache_size);
+    qk_prods = (float *)(token_infos + tokeninfo_size);
+    qk_prods_softmax = (float *)(qk_prods + qk_prod_size);
+    attn_heads = (float *)qk_prods_softmax + qk_prod_size;
+    W_out_contiguous = (float *)attn_heads + attn_heads_size;
+    int parallelism = vProjSize * oProjSize * num_heads;
+    mha_verify_build_w_out_tensor<<<GET_BLOCKS(parallelism),
+                                    min(CUDA_NUM_THREADS, parallelism),
+                                    0,
+                                    stream>>>(
+        weight_ptr,
+        W_out_contiguous,
+        vProjSize,
+        oProjSize,
+        num_heads,
+        (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize));
+  }
+
+  cudaStreamSynchronize(stream);
+}
+
+IncMultiHeadSelfAttentionVerifyMeta::~IncMultiHeadSelfAttentionVerifyMeta(
+    void) {
+  reserveInst.destroy();
+#ifdef INFERENCE_TESTS
+  free(kcache);
+  free(vcache);
+#endif
+}
+
+}; // namespace FlexFlow
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index 5a41962a13..2f2655f589 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -173,4 +173,22 @@ void BatchConfig::print() const {
   }
 }
 
+void TreeVerifyBatchConfig::compute_tree_branch_indexes() {
+  // Must be called only after setting num_tokens!
+  auto is_first_token_in_request = [&](int token_index) -> bool {
+    if (token_index == 0) {
+      return true; // First entry in tokensInfo is the first in a request.
+    }
+    return tokensInfo[token_index].request_index !=
+           tokensInfo[token_index - 1].request_index;
+  };
+  for (int i = 0; i < num_tokens; i++) {
+    if (is_first_token_in_request(i)) {
+      tokensInfo[i].tree_branch_idx = 0;
+    } else {
+      tokensInfo[i].tree_branch_idx = tokensInfo[i - 1].tree_branch_idx + 1;
+    }
+  }
+}
+
 }; // namespace FlexFlow
diff --git a/src/runtime/ffconst_utils.cc b/src/runtime/ffconst_utils.cc
index b02150d153..01b116c853 100644
--- a/src/runtime/ffconst_utils.cc
+++ b/src/runtime/ffconst_utils.cc
@@ -147,6 +147,8 @@ std::string get_operator_type_name(OperatorType type) {
       return "MultiHeadAttention";
     case OP_INC_MULTIHEAD_SELF_ATTENTION:
       return "IncMultiHeadSelfAttention";
+    case OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY:
+      return "IncMultiHeadSelfAttentionVerify";
     case OP_INPUT:
       return "Input";
     case OP_WEIGHT:
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index 866dcd3505..64ced31579 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -30,6 +30,7 @@
 #include "flexflow/ops/flat.h"
 #include "flexflow/ops/gather.h"
 #include "flexflow/ops/groupby.h"
+#include "flexflow/ops/inc_mha_verify.h"
 #include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ops/layer_norm.h"
 #include "flexflow/ops/linear.h"
@@ -2274,6 +2275,21 @@ GraphOptimalViewSerialized
         sez.serialize(attn->apply_rotary_embedding);
         break;
       }
+      case OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY: {
+        IncMultiHeadSelfAttentionVerify *attn =
+            (IncMultiHeadSelfAttentionVerify *)op;
+        sez.serialize(attn->layer_guid.id);
+        sez.serialize(attn->oProjSize);
+        sez.serialize(attn->num_heads);
+        sez.serialize(attn->qProjSize);
+        sez.serialize(attn->vProjSize);
+        sez.serialize(attn->dropout);
+        sez.serialize(attn->bias);
+        sez.serialize(attn->add_bias_kv);
+        sez.serialize(attn->add_zero_attn);
+        sez.serialize(attn->apply_rotary_embedding);
+        break;
+      }
       case OP_SOFTMAX: {
         Softmax *softmax = (Softmax *)op;
         sez.serialize(softmax->dim);
@@ -2665,6 +2681,39 @@ void FFModel::deserialize_graph_optimal_view(
         node = get_or_create_node<IncMultiHeadSelfAttention>(inputs[0], params);
         break;
       }
+      case OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY: {
+        assert(num_inputs == 1);
+        int embed_dim, num_heads, k_dim, v_dim;
+        float dropout;
+        bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding;
+        size_t id;
+        dez.deserialize(id);
+        LayerID layer_guid(id);
+        dez.deserialize(embed_dim);
+        dez.deserialize(num_heads);
+        dez.deserialize(k_dim);
+        dez.deserialize(v_dim);
+        dez.deserialize(dropout);
+        dez.deserialize(bias);
+        dez.deserialize(add_bias_kv);
+        dez.deserialize(add_zero_attn);
+        dez.deserialize(apply_rotary_embedding);
+
+        IncMultiHeadSelfAttentionVerifyParams params;
+        params.embed_dim = embed_dim;
+        params.num_heads = num_heads;
+        params.kdim = k_dim;
+        params.vdim = v_dim;
+        params.dropout = dropout;
+        params.bias = bias;
+        params.add_bias_kv = add_bias_kv;
+        params.add_zero_attn = add_zero_attn;
+        params.layer_guid = layer_guid;
+        params.apply_rotary_embedding = apply_rotary_embedding;
+        node = get_or_create_node<IncMultiHeadSelfAttentionVerify>(inputs[0],
+                                                                   params);
+        break;
+      }
       case OP_TOPK: {
         node = TopK::deserialize(*this, dez, inputs, num_inputs);
         break;
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 12d3bbb18f..d5c3f05851 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -41,6 +41,7 @@
 #include "flexflow/ops/fused.h"
 #include "flexflow/ops/gather.h"
 #include "flexflow/ops/groupby.h"
+#include "flexflow/ops/inc_mha_verify.h"
 #include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ops/layer_norm.h"
 #include "flexflow/ops/linear.h"
@@ -2768,6 +2769,12 @@ Op *FFModel::create_operator_from_layer(
       operators.push_back(op);
       return op;
     }
+    case OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY: {
+      Op *op = IncMultiHeadSelfAttentionVerify::create_operator_from_layer(
+          *this, layer, inputs);
+      operators.push_back(op);
+      return op;
+    }
     case OP_BATCHMATMUL: {
       Op *op = BatchMatmul::create_operator_from_layer(*this, layer, inputs);
       operators.push_back(op);
@@ -4610,6 +4617,27 @@ void register_flexflow_internal_tasks() {
         IncMultiHeadSelfAttention::inference_task>(
         registrar, "IncMultiHeadSelfAttention Inference Task");
   }
+  {
+    TaskVariantRegistrar registrar(
+        INC_MULTIHEAD_SELF_ATTENTION_VERIFY_INIT_TASK_ID,
+        "IncMultiHeadSelfAttentionVerify Init");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<
+        OpMeta *,
+        IncMultiHeadSelfAttentionVerify::init_task>(
+        registrar, "IncMultiHeadSelfAttentionVerify Init Task");
+  }
+  {
+    TaskVariantRegistrar registrar(
+        INC_MULTIHEAD_SELF_ATTENTION_VERIFY_INF_TASK_ID,
+        "IncMultiHeadSelfAttentionVerify Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<
+        IncMultiHeadSelfAttentionVerify::inference_task>(
+        registrar, "IncMultiHeadSelfAttentionVerify Inference Task");
+  }
   // NoOp
   {
     TaskVariantRegistrar registrar(NOOP_INIT_TASK_ID, "Weight NCCL Init");
diff --git a/src/runtime/operator_params.cc b/src/runtime/operator_params.cc
index 201a6449c2..a968e10c60 100644
--- a/src/runtime/operator_params.cc
+++ b/src/runtime/operator_params.cc
@@ -15,6 +15,7 @@
 #include "flexflow/ops/flat.h"
 #include "flexflow/ops/gather.h"
 #include "flexflow/ops/groupby.h"
+#include "flexflow/ops/inc_mha_verify.h"
 #include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ops/layer_norm.h"
 #include "flexflow/ops/linear.h"
@@ -82,6 +83,8 @@ tl::optional<OperatorParameters> get_op_parameters(Op const *op) {
       return ((MultiHeadAttention *)op)->get_params();
     case OP_INC_MULTIHEAD_SELF_ATTENTION:
       return ((IncMultiHeadSelfAttention *)op)->get_params();
+    case OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY:
+      return ((IncMultiHeadSelfAttentionVerify *)op)->get_params();
     case OP_LAYERNORM:
       return ((LayerNorm *)op)->get_params();
     case OP_REDUCE_SUM:
diff --git a/src/runtime/substitution.cc b/src/runtime/substitution.cc
index df2f8b05b3..c353d8fa16 100644
--- a/src/runtime/substitution.cc
+++ b/src/runtime/substitution.cc
@@ -28,6 +28,7 @@
 #include "flexflow/ops/embedding.h"
 #include "flexflow/ops/experts.h"
 #include "flexflow/ops/flat.h"
+#include "flexflow/ops/inc_mha_verify.h"
 #include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ops/linear.h"
 #include "flexflow/ops/noop.h"
@@ -3707,13 +3708,19 @@ bool FFModel::convert_graph_to_operators(
         new_op = new MultiHeadAttention(
             *this, *attn, inputs[0], inputs[1], inputs[2], true);
         break;
-        break;
       }
       case OP_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(inList.size() == 1);
         IncMultiHeadSelfAttention *attn = (IncMultiHeadSelfAttention *)node.ptr;
         new_op = new IncMultiHeadSelfAttention(*this, *attn, inputs[0], true);
         break;
+      }
+      case OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY: {
+        assert(inList.size() == 1);
+        IncMultiHeadSelfAttentionVerify *attn =
+            (IncMultiHeadSelfAttentionVerify *)node.ptr;
+        new_op =
+            new IncMultiHeadSelfAttentionVerify(*this, *attn, inputs[0], true);
         break;
       }
       case OP_RMS_NORM: {
@@ -3721,7 +3728,6 @@ bool FFModel::convert_graph_to_operators(
         RMSNorm *rms = (RMSNorm *)node.ptr;
         new_op = new RMSNorm(*this, *rms, inputs[0], true);
         break;
-        break;
       }
       case OP_SOFTMAX: {
         assert(inList.size() == 1);

From 7a0ff7aa968f8cf9e3c73b97cec85a656b0b767f Mon Sep 17 00:00:00 2001
From: zwang86 <46699021+zwang86@users.noreply.github.com>
Date: Fri, 5 May 2023 20:45:03 -0400
Subject: [PATCH 105/344] [Inference] Implement Beam Search for small model
 speculative inference (#681)

* Add beam_topK and specu_inc_multihead_self_attention ops to includes.

* topk init not test

* add

* fix beam topk

* fix attention

* fix softmax dim

* Revert "Beam search xinhao"

* fix softmax dimension

* fix beam topk, beam slot

* fix, add placeholder

* fix

* parent id

* add depth

* fix: spec_inc_attn to deal with sub req, naive stealing

* minor fix

* minor fix

* fix

* fix

* move location

* manually change

* manual

* fix

* fix

* fix

* Add BeamSearchBatchConfig draft.

* Add beam_search_batch_config.cc file.

* Update BeamSearchBatchConfig

* 1

* Update.

* Add BeamSearchPerRequestInfo.

* fix bug in build_w_out_tensor kernel

* change kernels

* change request mmanager

* fix everything, add tree

* fix fix fix fix fix

* linting and bug fix

* nit

* removed placeholder (still works)

* restored normal LLAMA

* moved spec_llama back to inference folder

* hip fix

* saved file

* md

* fix

---------

Co-authored-by: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Co-authored-by: xinhaoc <chengxh_98@163.com>
Co-authored-by: Rae Wong <rae@ip-172-31-10-138.us-east-2.compute.internal>
Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
---
 CMakeLists.txt                                |   4 +
 examples/cpp/inference/LLAMA/llama.cc         |   2 +-
 .../cpp/inference/SPEC_LLAMA/CMakeLists.txt   |  20 +
 examples/cpp/inference/SPEC_LLAMA/Makefile    |  39 +
 examples/cpp/inference/SPEC_LLAMA/README.md   |  14 +
 examples/cpp/inference/SPEC_LLAMA/llama.cc    | 308 ++++++
 examples/cpp/inference/SPEC_LLAMA/llama.h     | 111 +++
 examples/cpp/inference/file_loader.cc         | 182 ++++
 examples/cpp/inference/file_loader.h          |  36 +
 include/flexflow/batch_config.h               |  61 +-
 include/flexflow/ffconst.h                    |   2 +
 include/flexflow/inference.h                  |  25 +
 include/flexflow/model.h                      |  31 +
 include/flexflow/operator_params.h            |   4 +
 include/flexflow/ops/beam_topk.h              | 101 ++
 include/flexflow/ops/beam_topk_params.h       |  26 +
 .../ops/spec_inc_multihead_self_attention.h   | 154 +++
 ...spec_inc_multihead_self_attention_params.h |  31 +
 include/flexflow/utils/cuda_helper.h          |  10 +
 src/ops/beam_topk.cc                          | 469 +++++++++
 src/ops/beam_topk.cpp                         | 716 ++++++++++++++
 src/ops/beam_topk.cu                          | 715 ++++++++++++++
 src/ops/inc_multihead_self_attention.cu       |   2 +-
 src/ops/kernels/softmax.cu                    |   3 +-
 src/ops/spec_inc_multihead_self_attention.cc  | 670 +++++++++++++
 src/ops/spec_inc_multihead_self_attention.cpp |  74 ++
 src/ops/spec_inc_multihead_self_attention.cu  | 904 ++++++++++++++++++
 src/runtime/beam_search_batch_config.cc       |  88 ++
 src/runtime/cuda_helper.cu                    |  99 +-
 src/runtime/ffconst_utils.cc                  |   4 +
 src/runtime/graph.cc                          |  54 ++
 src/runtime/inference_manager.cc              |  18 +-
 src/runtime/model.cc                          |  51 +
 src/runtime/operator_params.cc                |   7 +
 src/runtime/request_manager.cc                | 383 ++++++++
 35 files changed, 5404 insertions(+), 14 deletions(-)
 create mode 100644 examples/cpp/inference/SPEC_LLAMA/CMakeLists.txt
 create mode 100644 examples/cpp/inference/SPEC_LLAMA/Makefile
 create mode 100644 examples/cpp/inference/SPEC_LLAMA/README.md
 create mode 100644 examples/cpp/inference/SPEC_LLAMA/llama.cc
 create mode 100644 examples/cpp/inference/SPEC_LLAMA/llama.h
 create mode 100644 examples/cpp/inference/file_loader.cc
 create mode 100644 examples/cpp/inference/file_loader.h
 create mode 100644 include/flexflow/ops/beam_topk.h
 create mode 100644 include/flexflow/ops/beam_topk_params.h
 create mode 100644 include/flexflow/ops/spec_inc_multihead_self_attention.h
 create mode 100644 include/flexflow/ops/spec_inc_multihead_self_attention_params.h
 create mode 100644 src/ops/beam_topk.cc
 create mode 100644 src/ops/beam_topk.cpp
 create mode 100644 src/ops/beam_topk.cu
 create mode 100644 src/ops/spec_inc_multihead_self_attention.cc
 create mode 100644 src/ops/spec_inc_multihead_self_attention.cpp
 create mode 100644 src/ops/spec_inc_multihead_self_attention.cu
 create mode 100644 src/runtime/beam_search_batch_config.cc

diff --git a/CMakeLists.txt b/CMakeLists.txt
index 5b1f963093..8edad77124 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -544,6 +544,10 @@ if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/inference/LLAMA)
 endif()
 
+if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
+  add_subdirectory(examples/cpp/inference/SPEC_LLAMA)
+endif()
+
 # installation
 set(INCLUDE_DEST "include")
 set(LIB_DEST "lib")
diff --git a/examples/cpp/inference/LLAMA/llama.cc b/examples/cpp/inference/LLAMA/llama.cc
index a4924f5406..ac25f70467 100644
--- a/examples/cpp/inference/LLAMA/llama.cc
+++ b/examples/cpp/inference/LLAMA/llama.cc
@@ -66,7 +66,7 @@ void FlexFlow::top_level_task(Task const *task,
   // parse_input_args(argv, argc, llamaConfig);
 
   std::cout << "print llama config: " << llamaConfig.input_path << "-->"
-            << llamaConfig.batchSize;
+            << llamaConfig.batchSize << std::endl;
 
   //------------------------------ build the model --------------------------
   Tensor input;
diff --git a/examples/cpp/inference/SPEC_LLAMA/CMakeLists.txt b/examples/cpp/inference/SPEC_LLAMA/CMakeLists.txt
new file mode 100644
index 0000000000..d6ceb38ff4
--- /dev/null
+++ b/examples/cpp/inference/SPEC_LLAMA/CMakeLists.txt
@@ -0,0 +1,20 @@
+cmake_minimum_required(VERSION 3.10)
+
+project(FlexFlowExample_SPEC_LLAMA)
+set(project_target SPEC_LLAMA)
+
+
+set(CPU_SRC
+  ${FLEXFLOW_CPP_DRV_SRC}
+  llama.cc
+  llama.h
+  ../file_loader.cc)
+
+
+cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
+target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
+target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/examples/cpp/inference)
+target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
+
+set(BIN_DEST "bin")
+install(TARGETS ${project_target} DESTINATION ${BIN_DEST})
diff --git a/examples/cpp/inference/SPEC_LLAMA/Makefile b/examples/cpp/inference/SPEC_LLAMA/Makefile
new file mode 100644
index 0000000000..32e8e1cf3d
--- /dev/null
+++ b/examples/cpp/inference/SPEC_LLAMA/Makefile
@@ -0,0 +1,39 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+#
+
+# Flags for directing the runtime makefile what to include
+DEBUG           ?= 0		# Include debugging symbols
+MAX_DIM         ?= 4		# Maximum number of dimensions
+OUTPUT_LEVEL    ?= LEVEL_DEBUG	# Compile time logging level
+USE_CUDA        ?= 1		# Include CUDA support (requires CUDA)
+USE_GASNET      ?= 0		# Include GASNet support (requires GASNet)
+USE_HDF         ?= 1		# Include HDF5 support (requires HDF5)
+ALT_MAPPERS     ?= 0		# Include alternative mappers (not recommended)
+
+# Put the binary file name here
+OUTFILE		?= spec_llama
+# List all the application source files here
+GEN_SRC		= llama.cc dataloader.cc 
+GEN_GPU_SRC	= dataloader.cu 
+ifndef CUDA_HOME
+CUDA_HOME = $(patsubst %/bin/nvcc,%,$(shell which nvcc | head -1))
+endif
+
+
+ifndef FF_HOME
+$(error FF_HOME variable is not defined, aborting build)
+endif
+
+include $(FF_HOME)/FlexFlow.mk
diff --git a/examples/cpp/inference/SPEC_LLAMA/README.md b/examples/cpp/inference/SPEC_LLAMA/README.md
new file mode 100644
index 0000000000..daccccc249
--- /dev/null
+++ b/examples/cpp/inference/SPEC_LLAMA/README.md
@@ -0,0 +1,14 @@
+# an example of running llama model with beam search
+
+## how to run it?
+1. build the flexflow with FF_BUILD_ALL_INFERENCE_EXAMPLES or FF_BUILD_ALL_EXAMPLES
+2. download the weight and token file from aws s3. 
+```bash
+aws s3 cp s3://catalyst-llama/7B_weights_float.tar.gz FF_HOME/examples/cpp/inference/SPEC_LLAMA/weights
+tar -zxvf 7B_weights_float.tar.gz 
+aws s3 cp s3://catalyst-llama/tokens.tar FF_HOME/examples/cpp/inference/SPEC_LLAMA/tokens
+tar -zxvf tokens.tar
+```
+3. run *SPEC_LLAMA* with `--weights` `--dataset`  `-b 5` `--only-data-parallel`
+4. [expected results](https://github.com/flexflow/FlexFlow/pull/681#issuecomment-1534264054)
+
diff --git a/examples/cpp/inference/SPEC_LLAMA/llama.cc b/examples/cpp/inference/SPEC_LLAMA/llama.cc
new file mode 100644
index 0000000000..0f2095c1ae
--- /dev/null
+++ b/examples/cpp/inference/SPEC_LLAMA/llama.cc
@@ -0,0 +1,308 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "llama.h"
+#include "flexflow/inference.h"
+
+using namespace Legion;
+
+LegionRuntime::Logger::Category log_app("llama");
+
+void parse_input_args(char **argv, int argc, LLAMAConfig &config) {
+  for (int i = 1; i < argc; i++) {
+    // input
+    if (!strcmp(argv[i], "--dataset")) {
+      config.input_path = std::string(argv[++i]);
+      continue;
+    }
+
+    // weights
+    if (!strcmp(argv[i], "--weights")) {
+      config.weight_file_path = std::string(argv[++i]);
+      continue;
+    }
+  }
+}
+
+void FlexFlow::top_level_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  FFConfig ffconfig;
+  LLAMAConfig llamaConfig;
+  FFModel ff(ffconfig);
+  //------------------------------compute machine views ------------------
+  int num_devices = ffconfig.workersPerNode * ffconfig.numNodes;
+  std::vector<MachineView> machine_views;
+  for (int i = 0; i < num_devices; i++) {
+    MachineView view;
+    view.device_type = MachineView::GPU;
+    view.ndims = 1;
+    view.dim[0] = 1;
+    view.stride[0] = 0;
+    view.start_device_id = i;
+    machine_views.push_back(view);
+  }
+
+  std::unordered_map<Tensor, std::vector<MachineView>> mapping;
+  std::unordered_map<std::string, Layer *> weights_layers;
+
+  InputArgs const &command_args = HighLevelRuntime::get_input_args();
+  char **argv = command_args.argv;
+  int argc = command_args.argc;
+  parse_input_args(argv, argc, llamaConfig);
+
+  std::cout << "print llama config: " << llamaConfig.input_path << "-->"
+            << llamaConfig.batchSize << std::endl;
+
+  //------------------------------ build the model --------------------------
+  Tensor input;
+  {
+    int const token_dims[] = {llamaConfig.batchSize, llamaConfig.max_seq_len};
+    input = ff.create_tensor<2>(token_dims, DT_INT32);
+  }
+
+  mapping[input].push_back(machine_views[0]);
+
+  Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
+  Tensor token = ff.embedding(input,
+                              llamaConfig.vocab_size,
+                              llamaConfig.dim,
+                              AGGR_MODE_NONE,
+                              DT_FLOAT,
+                              NULL,
+                              embed_init);
+  Layer *embedding = ff.layers.back();
+  weights_layers.emplace("tok_embeddings_weight", embedding);
+
+  // std::cout << "------token shape";
+  // std::cout << token->num_dims << "------\n";
+  // for (int i = 0; i < token->num_dims; i++) {
+  //   std::cout << token->dims[i] << "------\n";
+  // }
+
+  // n transformer blocks impl
+  int num_transformer_layers_per_gpu = (32 + num_devices - 1) / num_devices;
+
+  for (int i = 0; i < 1; i++) {
+    // step 1: attention
+    std::vector<int> axes = {2};
+    Tensor att_norm = ff.rms_norm(token, llamaConfig.norm_eps, llamaConfig.dim);
+    Layer *attention_norm = ff.layers.back();
+
+    if (i % num_transformer_layers_per_gpu == 0) {
+      // Map att_norm to the next GPU
+      // since the size of att_norm is minimum across
+      // all tensors
+      mapping[att_norm].push_back(
+          machine_views[i / num_transformer_layers_per_gpu]);
+    }
+
+    weights_layers.emplace("layers_" + std::to_string(i) +
+                               "_attention_norm_weight",
+                           attention_norm);
+
+    // std::cout << "------before att shape";
+    // std::cout << att_norm->num_dims << "------\n";
+    // for (int i = 0; i < att_norm->num_dims; i++) {
+    //   std::cout << att_norm->dims[i] << "------\n";
+    // }
+    Tensor mha = ff.spec_inc_multihead_self_attention(
+        att_norm,
+        llamaConfig.dim,
+        llamaConfig.n_heads,
+        llamaConfig.dim / llamaConfig.n_heads,
+        llamaConfig.dim / llamaConfig.n_heads,
+        0.0f,
+        true,
+        false,
+        false,
+        NULL,
+        true);
+    Layer *attention_layer = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) + "_attention_weight",
+                           attention_layer);
+    token = ff.add(token, mha);
+
+    // step 2: SILU activaion
+    Tensor ff_norm = ff.rms_norm(token, llamaConfig.norm_eps, llamaConfig.dim);
+    Layer *ffn_layer = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) + "_ffn_norm_weight",
+                           ffn_layer);
+
+    Tensor w1 = ff.dense(ff_norm, llamaConfig.hidden_dim, AC_MODE_NONE, false);
+    Layer *w1_layer = ff.layers.back();
+    weights_layers.emplace(
+        "layers_" + std::to_string(i) + "_feed_forward_w1_weight", w1_layer);
+
+    Tensor w3 = ff.dense(ff_norm, llamaConfig.hidden_dim, AC_MODE_NONE, false);
+    Layer *w3_layer = ff.layers.back();
+    weights_layers.emplace(
+        "layers_" + std::to_string(i) + "_feed_forward_w3_weight", w3_layer);
+
+    Tensor sigmoid = ff.sigmoid(w1);
+    Tensor silu = ff.multiply(w1, sigmoid);
+    Tensor multi = ff.multiply(silu, w3);
+
+    Tensor w2 = ff.dense(multi, llamaConfig.dim, AC_MODE_NONE, false);
+    Layer *w2_layer = ff.layers.back();
+    weights_layers.emplace(
+        "layers_" + std::to_string(i) + "_feed_forward_w2_weight", w2_layer);
+    token = ff.add(token, w2);
+  }
+
+  // final normalization and linear
+  std::vector<int> axes = {2};
+  token = ff.rms_norm(token, 1e-6, 4096);
+  Layer *final_norm = ff.layers.back();
+  weights_layers.emplace("norm_weight", final_norm);
+
+  Tensor dense = ff.dense(token, llamaConfig.vocab_size, AC_MODE_NONE, false);
+  Layer *final_linear = ff.layers.back();
+  weights_layers.emplace("output_weight", final_linear);
+
+  Tensor softmax = ff.softmax(dense, -1);
+  Tensor output = ff.beam_top_k(softmax, llamaConfig.max_beam_width, false);
+
+  //------------------- compile the model --------------------------------
+  std::cout << "------start compile ----------" << std::endl;
+  InferenceManager im(&ff, llamaConfig.batchSize, 1);
+  im.compile_model_and_allocate_buffer(&ff, mapping);
+  RequestManager rm;
+
+  // std::cout << "------init ops----------" << std::endl;
+  // im.init_operators_inference();
+  // std::cout << "------model compiled and init ----------" << std::endl;
+
+  //------------------------------ load inputs --------------------------
+  std::cout << "------create dataloaders ----------" << std::endl;
+  // read prompt into input
+  ParallelTensor input_pt;
+  ff.get_parallel_tensor_from_tensor(input, input_pt);
+  assert(im.tensor_buffer.find(input_pt) != im.tensor_buffer.end());
+  std::cout << im.tensor_buffer[input_pt].size() << std::endl;
+  // DataLoader loader(ff, &llamaConfig, im.tensor_buffer[input_pt].at(0));
+
+  //------------------------------ load weights---------------------------
+  // for (auto &v : weights_layers) {
+  //   Tensor weight = v.second->weights[0];
+  //   std::cout << "weights layer: " << v.first << "\n";
+
+  //   if (weight == NULL) {
+  //     std::cout << "op no weights : " << v.first << "\n";
+  //     continue;
+  //   }
+
+  //   size_t volume = 1;
+  //   std::vector<int> dims_vec;
+  //   for (int i = 0; i < weight->num_dims; i++) {
+  //     dims_vec.push_back(weight->dims[i]);
+  //     volume *= weight->dims[i];
+  //   }
+
+  //   assert(weight->data_type == DT_FLOAT);
+  //   float *data = (float *)malloc(sizeof(float) * volume);
+
+  //   if (v.first.find("attention_w") != std::string::npos) {
+  //     loader.load_attention_weights(
+  //         data, volume, v.first, llamaConfig.weight_file_path);
+
+  //   } else {
+  //     loader.load_from_file(
+  //         data, volume, llamaConfig.weight_file_path + v.first);
+  //   }
+
+  //   ParallelTensor weight_pt;
+  //   ff.get_parallel_tensor_from_tensor(weight, weight_pt);
+  //   weight_pt->set_tensor<float>(&ff, dims_vec, data);
+  // }
+
+  FileDataLoader fileloader(llamaConfig.input_path,
+                            llamaConfig.weight_file_path);
+  BatchConfig::TokenId *tokens = fileloader.generate_requests(
+      llamaConfig.batchSize, llamaConfig.max_seq_len);
+
+  for (int i = 0; i < 40; i++) {
+    std::cout << tokens[i] << ", ";
+  }
+  for (int i = 0; i < llamaConfig.batchSize; i++) {
+    std::cout << "-------" << std::endl;
+    std::vector<BatchConfig::TokenId> prompt(
+        tokens + i * llamaConfig.max_seq_len,
+        tokens + (i + 1) * llamaConfig.max_seq_len);
+    rm.register_new_request(prompt, llamaConfig.sentence_len);
+  }
+
+  fileloader.load_weights(&ff, weights_layers);
+
+  std::cout << "------load wieght finished----------" << std::endl;
+
+  //------------------------------ do inference, we only have 5 prompts for the
+  // test case, so simplify the batch_configs with 1
+  im.init_operators_inference(&ff);
+  // entry---------------------------
+  int depth = 0;
+  std::map<int, Future> future_handlers;
+  std::map<int, BeamSearchBatchConfig> batch_configs;
+
+  bool new_req = true;
+
+  while (depth < llamaConfig.max_beam_depth) {
+    int bid = 0;
+    if (future_handlers.find(bid) == future_handlers.end()) {
+      BeamSearchBatchConfig bc;
+      BeamInferenceResult ir;
+      bc = rm.prepare_next_batch_beam(bc, ir);
+
+      std::cout << "sub_requests: " << bc.sub_requests[0] << "\n";
+      FutureMap fm = im.inference(&ff, bid, bc);
+      assert(fm.get_future_map_domain().get_volume() == 1);
+      future_handlers[bid] = fm.get_future(0);
+      batch_configs[bid] = bc;
+    } else {
+      // have luanched this bid
+      Future future = future_handlers[bid];
+      if (!future.is_ready(true /*subscribe*/)) {
+        continue;
+      } else {
+        std::cout << "future is ready...." << std::endl;
+      }
+      // process end
+      BeamInferenceResult ir = future.get_result<BeamInferenceResult>();
+      BeamSearchBatchConfig bc = batch_configs[bid];
+      depth = bc.beamRequestsInfo[0].current_depth;
+      bc = rm.prepare_next_batch_beam(bc, ir);
+
+      std::cout << "llama current depth: " << depth << std::endl;
+      std::cout << "sub_requests: " << bc.sub_requests[0] << "\n";
+      FutureMap fm = im.inference(&ff, bid, bc);
+      assert(fm.get_future_map_domain().get_volume() == 1);
+      future_handlers[bid] = fm.get_future(0);
+      batch_configs[bid] = bc;
+
+      // tranverse the tree in dfs order;
+      if (depth >= llamaConfig.max_beam_depth) {
+        std::cout << "tranverse the tree"
+                  << "\n";
+        rm.tranverse_beam_tree(bc);
+      }
+    }
+  }
+
+  // float* data
+  std::cout << "----------inference finished--------------" << std::endl;
+}
+
+void FlexFlow::register_custom_tasks() {}
diff --git a/examples/cpp/inference/SPEC_LLAMA/llama.h b/examples/cpp/inference/SPEC_LLAMA/llama.h
new file mode 100644
index 0000000000..7fce809073
--- /dev/null
+++ b/examples/cpp/inference/SPEC_LLAMA/llama.h
@@ -0,0 +1,111 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+#pragma once
+
+#include "file_loader.h"
+
+using namespace Legion;
+using namespace FlexFlow;
+
+struct LLAMAConfig {
+  LLAMAConfig(void) {
+    // todo read from config/param file
+    n_layers = 32;
+    vocab_size = 32000;
+    n_heads = 32;
+    dim = 4096;
+    multiple_of = 256;
+    norm_eps = 1e-6;
+    total_sentence = 5;
+    sentence_len = 347;
+    max_gen_length = 256;
+    batchSize = 5;
+    total_requests = 2560;
+    incremental_mode = true;
+    sequence_length = MAX_SEQ_LEN;
+    max_seq_len = 8;
+    max_beam_width = 3;
+    max_beam_depth = 3;
+
+    // hidden dim
+    hidden_dim = 4 * dim;
+    hidden_dim = int(2 * hidden_dim / 3);
+    hidden_dim =
+        multiple_of * int((hidden_dim + multiple_of - 1) / multiple_of);
+  }
+  int n_heads, n_layers, vocab_size, dim, multiple_of, hidden_dim,
+      total_sentence, sentence_len, batchSize, total_requests, incremental_mode,
+      sequence_length, max_gen_length, max_seq_len, max_beam_width,
+      max_beam_depth;
+  float norm_eps;
+  std::string weight_file_path;
+  std::string input_path;
+};
+
+// struct Prediction_result{
+//   long tokens[MAX_];
+//   float probs[MAX_BEAM_SIZE];
+//   int parent_ids[MAX_BEAM_SIZE];
+// };
+
+// class DataLoader {
+// public:
+//   DataLoader(FFModel &ff,
+//              LLAMAConfig const *llamaconfig,
+//              ParallelTensor const &input);
+//   void next_batch(FFModel &ff,
+//                   BatchConfig *bc,
+//                   std::map<size_t, Prediction_result> &batch_predictions);
+//   void reset();
+//   static void load_entire_dataset(Task const *task,
+//                                   std::vector<PhysicalRegion> const &regions,
+//                                   Context ctx,
+//                                   Runtime *runtime);
+//   static void load_input(Task const *task,
+//                          std::vector<PhysicalRegion> const &regions,
+//                          Context ctx,
+//                          Runtime *runtime);
+
+//   template <typename T>
+//   static void load_from_file(T *ptr, size_t size, std::string filename);
+
+//   template <typename T>
+//   static void load_attention_weights(T *ptr,
+//                                      size_t size,
+//                                      std::string layer_name,
+//                                      std::string weight_path);
+//   void store_outputs(BatchConfig *bc,
+//                      InferenceResult const &ir,
+//                      std::map<size_t, Prediction_result> &batch_predictions);
+//   void update_beam_slots(BatchConfig *bc, std::map<size_t, Prediction_result>
+//   batch_predictions); void update_beam_tree();
+
+// public:
+//   int num_samples, next_index, next_token_idx, next_batch_index;
+//   std::map<size_t, std::vector<int>> outputs;
+//   FlexFlow::ParallelTensor full_input, batch_input;
+// };
+
+// struct SampleIdxs {
+//   int num_samples;
+//   int idxs[MAX_NUM_SAMPLES];
+//   int token_idx;
+//   int batch_idx;
+// };
+
+// struct DataLoaderNextBatchInput {
+//   BatchConfig const &bc;
+//   std::map<size_t, Prediction_result> const &prev_batch_preds;
+// };
diff --git a/examples/cpp/inference/file_loader.cc b/examples/cpp/inference/file_loader.cc
new file mode 100644
index 0000000000..f9f399b464
--- /dev/null
+++ b/examples/cpp/inference/file_loader.cc
@@ -0,0 +1,182 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "file_loader.h"
+#include "flexflow/inference.h"
+
+#include <vector>
+using namespace std;
+
+FileDataLoader::FileDataLoader(std::string _input_path,
+                               std::string _weight_file_path)
+    : input_path(_input_path), weight_file_path(_weight_file_path){};
+
+BatchConfig::TokenId *FileDataLoader::generate_requests(int num, int length) {
+
+  BatchConfig::TokenId *prompts =
+      (BatchConfig::TokenId *)malloc(sizeof(BatchConfig::TokenId) * 40);
+  std::cout << "load input from file: " << input_path << std::endl;
+  std::ifstream in(input_path, std::ios::in | std::ios::binary);
+  int size = num * length;
+  std::vector<long> host_array(size);
+  size_t loaded_data_size = sizeof(long) * size;
+
+  std::cout << "loaded_data_size: " << loaded_data_size << std::endl;
+  in.seekg(0, in.end);
+  in.seekg(0, in.beg);
+  in.read((char *)host_array.data(), loaded_data_size);
+
+  std::cout << "loaded_data_size: " << loaded_data_size << std::endl;
+
+  size_t in_get_size = in.gcount();
+  if (in_get_size != loaded_data_size) {
+    std::cout << "load data error";
+    return prompts;
+  }
+
+  assert(size == host_array.size());
+
+  int index = 0;
+  int data_index = 0;
+
+  std::cout << "loaded_data_size: " << loaded_data_size << std::endl;
+  std::cout << host_array.size() << "\n";
+  for (auto v : host_array) {
+    prompts[data_index++] = v;
+    std::cout << data_index << ", " << (int)v << "\n";
+  }
+  in.close();
+  return prompts;
+};
+
+void load_attention_weights(float *ptr,
+                            size_t size,
+                            std::string layer_name,
+                            std::string weight_path) {
+  std::string q_file = weight_path +
+                       layer_name.substr(0, layer_name.find("attention")) +
+                       "attention_wq_weight";
+  std::string k_file = weight_path +
+                       layer_name.substr(0, layer_name.find("attention")) +
+                       "attention_wk_weight";
+  std::string v_file = weight_path +
+                       layer_name.substr(0, layer_name.find("attention")) +
+                       "attention_wv_weight";
+  std::string o_file = weight_path +
+                       layer_name.substr(0, layer_name.find("attention")) +
+                       "attention_wo_weight";
+  std::vector<std::string> weight_files = {q_file, k_file, v_file, o_file};
+
+  size_t index = 0;
+  int file_index = 0;
+
+  // q, k, v, o -> 0, 1, 2, 3
+  for (auto file : weight_files) {
+    std::cout << "file name and index: " << file << "->" << file_index << "\n";
+    size_t partial_size = size / 4;
+    std::ifstream in(file, std::ios::in | std::ios::binary);
+    std::vector<float> host_array(partial_size);
+    size_t loaded_data_size = sizeof(float) * partial_size;
+    in.seekg(0, in.end);
+    in.seekg(0, in.beg);
+    in.read((char *)host_array.data(), loaded_data_size);
+    size_t in_get_size = in.gcount();
+
+    if (in_get_size != loaded_data_size) {
+      std::cout << "load data error";
+      return;
+    }
+    assert(partial_size == host_array.size());
+
+    size_t one_head_size = 4096 * 128;
+    size_t data_index = 0;
+
+    for (int i = 0; i < 32; i++) {
+      size_t start_index = i * one_head_size * 4 + file_index * one_head_size;
+      for (size_t j = start_index; j < start_index + one_head_size; j++) {
+        ptr[j] = host_array.at(data_index);
+        data_index += 1;
+      }
+    }
+    file_index++;
+
+    in.close();
+    index++;
+  }
+}
+
+void load_from_file(float *ptr, size_t size, std::string filename) {
+  std::cout << "load from file: " << filename << std::endl;
+  std::ifstream in(filename, std::ios::in | std::ios::binary);
+  std::vector<float> host_array(size);
+  size_t loaded_data_size = sizeof(float) * size;
+  in.seekg(0, in.end);
+  in.seekg(0, in.beg);
+  in.read((char *)host_array.data(), loaded_data_size);
+
+  size_t in_get_size = in.gcount();
+  // std::cout << "size seee" << std::endl;
+  // std::cout << loaded_data_size << std::endl;
+  // std::cout << in_get_size << std::endl;
+  if (in_get_size != loaded_data_size) {
+    std::cout << "load data error";
+    return;
+  }
+
+  // std::cout << "finish loading input";
+  assert(size == host_array.size());
+
+  // normal
+  long data_index = 0;
+  for (auto v : host_array) {
+    ptr[data_index++] = v;
+  }
+  in.close();
+}
+
+void FileDataLoader::load_weights(
+    FFModel *ff, std::unordered_map<std::string, Layer *> weights_layers) {
+
+  for (auto &v : weights_layers) {
+    Tensor weight = v.second->weights[0];
+    std::cout << "weights layer: " << v.first << "\n";
+
+    if (weight == NULL) {
+      std::cout << "op no weights : " << v.first << "\n";
+      continue;
+    }
+
+    size_t volume = 1;
+    std::vector<int> dims_vec;
+    for (int i = 0; i < weight->num_dims; i++) {
+      dims_vec.push_back(weight->dims[i]);
+      volume *= weight->dims[i];
+    }
+
+    assert(weight->data_type == DT_FLOAT);
+    float *data = (float *)malloc(sizeof(float) * volume);
+
+    if (v.first.find("attention_w") != std::string::npos) {
+      load_attention_weights(data, volume, v.first, weight_file_path);
+
+    } else {
+      load_from_file(data, volume, weight_file_path + v.first);
+    }
+
+    ParallelTensor weight_pt;
+    ff->get_parallel_tensor_from_tensor(weight, weight_pt);
+    weight_pt->set_tensor<float>(ff, dims_vec, data);
+  }
+}
diff --git a/examples/cpp/inference/file_loader.h b/examples/cpp/inference/file_loader.h
new file mode 100644
index 0000000000..e1edc3f1a9
--- /dev/null
+++ b/examples/cpp/inference/file_loader.h
@@ -0,0 +1,36 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#pragma once
+
+#include "flexflow/batch_config.h"
+#include "flexflow/model.h"
+
+using namespace std;
+using namespace FlexFlow;
+
+class FileDataLoader {
+public:
+  FileDataLoader(std::string _input_path, std::string _weight_file_path);
+
+  BatchConfig::TokenId *generate_requests(int num, int length);
+
+  void load_weights(FFModel *ff,
+                    std::unordered_map<std::string, Layer *> weights_layers);
+
+private:
+  std::string input_path;
+  std::string weight_file_path;
+};
diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index d4150d6c51..db5ff3d485 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -15,6 +15,7 @@
 
 #pragma once
 
+#include <cstddef>
 #include <cstdlib>
 
 // #define MAX_SEQ_LEN 1024
@@ -26,6 +27,7 @@
 namespace FlexFlow {
 
 class InferenceResult;
+class BeamInferenceResult;
 
 class BatchConfig {
 public:
@@ -48,8 +50,11 @@ class BatchConfig {
   int num_tokens;
 
   struct PerRequestInfo {
-    int token_start_offset;
-    int num_tokens_in_batch;
+    int token_start_offset; // input[token_start_offset * data_dim] is the first
+                            // token
+    int num_tokens_in_batch; // tokens from input[token_start_offset * data_dim
+                             // : (token_start_offset + num_token_in_batch) *
+                             // data_dim]
     int max_sequence_length;
     RequestGuid request_guid;
   };
@@ -88,4 +93,56 @@ struct InferenceResult {
   BatchConfig::TokenId token_ids[MAX_NUM_TOKENS];
 };
 
+class BeamSearchBatchConfig : public BatchConfig {
+public:
+  BeamSearchBatchConfig();
+  BeamSearchBatchConfig(size_t beam_width, size_t target_iterations);
+
+  ~BeamSearchBatchConfig();
+
+  void print() const;
+  bool done() const;
+
+  size_t beam_width;
+  size_t target_iterations;
+  static int const MAX_BEAM_WIDTH = 3;
+  static int const MAX_BEAM_DEPTH = 8;
+
+  struct BeamSearchPerRequestInfo {
+    // int token_start_offset; // input[token_start_offset * data_dim] is the
+    // first token int num_tokens_in_batch; // tokens from
+    // input[token_start_offset * data_dim : (token_start_offset +
+    // num_token_in_batch) * data_dim] int max_sequence_length; RequestGuid
+    // request_guid;
+    bool request_completed;
+    int beam_size; //
+    int current_depth = -1;
+    // int global_depth = -1;
+    int max_depth = MAX_BEAM_DEPTH;
+
+    BatchConfig::TokenId tokens[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
+    float probs[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
+    int parent_id[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
+  };
+
+  struct BeamSearchPerTokenInfo {
+    int sub_request_index;
+  };
+
+  BeamSearchPerRequestInfo beamRequestsInfo[MAX_NUM_REQUESTS];
+  BeamSearchPerTokenInfo beamTokenInfo[MAX_NUM_TOKENS * MAX_BEAM_WIDTH];
+  int sub_requests[MAX_NUM_REQUESTS * MAX_BEAM_WIDTH];
+  // BeamSlot beam_slots[MAX_NUM_REQUESTS];
+
+private:
+  size_t current_iteration;
+};
+
+struct BeamInferenceResult : public InferenceResult {
+  BatchConfig::TokenId
+      token_ids[MAX_NUM_TOKENS * BeamSearchBatchConfig::MAX_BEAM_WIDTH];
+  float probs[MAX_NUM_TOKENS * BeamSearchBatchConfig::MAX_BEAM_WIDTH];
+  int parent_id[MAX_NUM_TOKENS * BeamSearchBatchConfig::MAX_BEAM_WIDTH];
+};
+
 }; // namespace FlexFlow
diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index a64944ab30..86898a1a9b 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -148,6 +148,8 @@ enum OperatorType {
   OP_EXPERTS,
   OP_GATHER, // https://pytorch.org/docs/stable/generated/torch.gather.html
   OP_RMS_NORM,
+  OP_BEAM_TOPK,
+  OP_SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION,
   OP_INC_MULTIHEAD_SELF_ATTENTION,
   OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY,
   // Parallel Ops
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index 0079a570b7..3025d8a748 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -22,6 +22,7 @@
 namespace FlexFlow {
 
 class FFModel;
+class BeamTree;
 
 class InferenceManager {
 public:
@@ -52,6 +53,17 @@ struct Request {
   std::vector<BatchConfig::TokenId> tokens;
 };
 
+// store the result of beam search
+struct BeamTree {
+  struct treeLayer {
+    BeamSearchBatchConfig::TokenId
+        tokens[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
+    int parent_ids[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
+    float probs[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
+  };
+  treeLayer treeLayers[BeamSearchBatchConfig::MAX_BEAM_DEPTH];
+};
+
 class RequestManager {
 public:
   using RequestGuid = BatchConfig::RequestGuid;
@@ -61,6 +73,18 @@ class RequestManager {
                                    int max_sequence_length);
   BatchConfig prepare_next_batch(BatchConfig const &bc,
                                  InferenceResult const &result);
+
+  BeamSearchBatchConfig
+      prepare_next_batch_beam(BeamSearchBatchConfig const &bc,
+                              BeamInferenceResult const &result);
+
+  void store_beam_metadata(BeamSearchBatchConfig const &old_bc,
+                           BeamInferenceResult const &result);
+  void update_beam_metadata(BeamSearchBatchConfig &new_bc,
+                            BeamTree &tree,
+                            int request_index);
+  void tranverse_beam_tree(BeamSearchBatchConfig const &old_bc);
+
   static void
       load_tokens_task(Legion::Task const *task,
                        std::vector<Legion::PhysicalRegion> const &regions,
@@ -72,6 +96,7 @@ class RequestManager {
   std::unordered_map<RequestGuid, Request> running_request_queue;
   std::mutex request_queue_mutex;
   RequestGuid next_available_guid;
+  struct BeamTree beam_trees[BatchConfig::MAX_NUM_REQUESTS];
 };
 
 } // namespace FlexFlow
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index c213af9ac8..70a631f9a8 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -143,6 +143,10 @@ enum TaskIDs {
   ATTENTION_BWD_TASK_ID,
   RMSNROM_INIT_TASK_ID,
   RMSNROM_FWD_TASK_ID,
+  BEAM_TOPK_INIT_TASK_ID,
+  BEAM_TOPK_INF_TASK_ID,
+  SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
+  SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
   INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
   INC_MULTIHEAD_SELF_ATTENTION_FWD_TASK_ID,
   INC_MULTIHEAD_SELF_ATTENTION_BWD_TASK_ID,
@@ -299,6 +303,8 @@ class TopK;
 class ArgTopK;
 class Transpose;
 class RMSNorm;
+class BeamTopK;
+class SpecIncMultiHeadSelfAttention;
 class Combine;
 class Repartition;
 class Reduction;
@@ -513,6 +519,12 @@ class FFModel {
   // Add a root mean square layer
   Tensor
       rms_norm(const Tensor input, float eps, int dim, char const *name = NULL);
+  // Add a beam search top k layer
+  Tensor beam_top_k(const Tensor input,
+                    int max_beam_size,
+                    bool sorted,
+                    char const *name = NULL);
+
   // Add a dense layer
   Tensor dense(const Tensor input,
                int outDim,
@@ -607,6 +619,19 @@ class FFModel {
                                       Initializer *kernel_initializer = NULL,
                                       bool apply_rotary_embedding = false,
                                       char const *name = NULL);
+  Tensor
+      spec_inc_multihead_self_attention(const Tensor input,
+                                        int embed_dim,
+                                        int num_heads,
+                                        int kdim = 0,
+                                        int vdim = 0,
+                                        float dropout = 0.0f,
+                                        bool bias = true,
+                                        bool add_bias_kv = false,
+                                        bool add_zero_attn = false,
+                                        Initializer *kernel_initializer = NULL,
+                                        bool apply_rotary_embedding = false,
+                                        char const *name = NULL);
   Tensor inc_multihead_self_attention_verify(
       const Tensor input,
       int embed_dim,
@@ -620,6 +645,7 @@ class FFModel {
       Initializer *kernel_initializer = NULL,
       bool apply_rotary_embedding = false,
       char const *name = NULL);
+
   Tensor create_tensor_legion_ordering(int num_dim,
                                        int const dims[],
                                        DataType data_type,
@@ -982,6 +1008,11 @@ class FFModel {
       std::unordered_map<
           std::pair<ParallelTensorShape, IncMultiHeadSelfAttentionParams>,
           IncMultiHeadSelfAttention *>,
+      std::unordered_map<std::pair<ParallelTensorShape, BeamTopKParams>,
+                         BeamTopK *>,
+      std::unordered_map<
+          std::pair<ParallelTensorShape, SpecIncMultiHeadSelfAttentionParams>,
+          SpecIncMultiHeadSelfAttention *>,
       std::unordered_map<
           std::pair<ParallelTensorShape, IncMultiHeadSelfAttentionVerifyParams>,
           IncMultiHeadSelfAttentionVerify *>,
diff --git a/include/flexflow/operator_params.h b/include/flexflow/operator_params.h
index ad0e15ce46..a417f6579f 100644
--- a/include/flexflow/operator_params.h
+++ b/include/flexflow/operator_params.h
@@ -6,6 +6,7 @@
 #include "flexflow/ops/arg_topk_params.h"
 #include "flexflow/ops/attention_params.h"
 #include "flexflow/ops/batch_matmul_params.h"
+#include "flexflow/ops/beam_topk_params.h"
 #include "flexflow/ops/cast_params.h"
 #include "flexflow/ops/concat_params.h"
 #include "flexflow/ops/conv_2d_params.h"
@@ -26,6 +27,7 @@
 #include "flexflow/ops/reshape_params.h"
 #include "flexflow/ops/rms_norm_params.h"
 #include "flexflow/ops/softmax_params.h"
+#include "flexflow/ops/spec_inc_multihead_self_attention_params.h"
 #include "flexflow/ops/split_params.h"
 #include "flexflow/ops/topk_params.h"
 #include "flexflow/ops/transpose_params.h"
@@ -57,6 +59,8 @@ using OperatorParameters = mp::variant<AggregateParams,
                                        LinearParams,
                                        MultiHeadAttentionParams,
                                        IncMultiHeadSelfAttentionParams,
+                                       BeamTopKParams,
+                                       SpecIncMultiHeadSelfAttentionParams,
                                        IncMultiHeadSelfAttentionVerifyParams,
                                        RMSNormParams,
                                        Pool2DParams,
diff --git a/include/flexflow/ops/beam_topk.h b/include/flexflow/ops/beam_topk.h
new file mode 100644
index 0000000000..7f8c28d9f8
--- /dev/null
+++ b/include/flexflow/ops/beam_topk.h
@@ -0,0 +1,101 @@
+#ifndef _FLEXFLOW_BEAM_TOPK_H_
+#define _FLEXFLOW_BEAM_TOPK_H_
+
+#include "flexflow/inference.h"
+#include "flexflow/model.h"
+#include "flexflow/node.h"
+#include "flexflow/ops/beam_topk_params.h"
+
+namespace FlexFlow {
+
+class BeamTopKMeta : public OpMeta {
+public:
+  BeamTopKMeta(FFHandler handle);
+  bool sorted;
+  int max_beam_width;
+};
+
+class BeamTopK : public Op {
+public:
+  using Params = BeamTopKParams;
+  using Input = ParallelTensor;
+  BeamTopK(FFModel &model,
+           const ParallelTensor input,
+           LayerID const &_layer_guid,
+           int max_beam_width,
+           bool sorted,
+           char const *name);
+  BeamTopK(FFModel &model, BeamTopK const &other, const ParallelTensor input);
+  BeamTopK(FFModel &model,
+           Params const &params,
+           Input const input,
+           char const *name = nullptr);
+  void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
+  void forward(FFModel const &) override;
+  void backward(FFModel const &) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
+  void print_layer(FFModel const &model) override {
+    assert(0);
+  }
+  static Op *
+      create_operator_from_layer(FFModel &model,
+                                 Layer const *layer,
+                                 std::vector<ParallelTensor> const &inputs);
+
+  static OpMeta *init_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static BeamInferenceResult
+      inference_task(Legion::Task const *task,
+                     std::vector<Legion::PhysicalRegion> const &regions,
+                     Legion::Context ctx,
+                     Legion::Runtime *runtime);
+  void serialize(Legion::Serializer &s) const override;
+  static PCG::Node deserialize(FFModel &ff,
+                               Legion::Deserializer &d,
+                               ParallelTensor inputs[],
+                               int num_inputs);
+  Op *materialize(FFModel &ff,
+                  ParallelTensor inputs[],
+                  int num_inputs) const override;
+  bool measure_operator_cost(Simulator *sim,
+                             MachineView const &pc,
+                             CostMetrics &cost_metrics) const override;
+  static void forward_kernel(BeamTopKMeta const *m,
+                             BeamSearchBatchConfig const *bc,
+                             float const *input_ptr,
+                             float *output_ptr,
+                             int *indices_ptr,
+                             int *parent_ptr,
+                             size_t batch_size,
+                             int length,
+                             bool sorted,
+                             ffStream_t stream);
+  static void forward_kernel_wrapper(BeamTopKMeta const *m,
+                                     BeamSearchBatchConfig const *bc,
+                                     float const *input_ptr,
+                                     float *output_ptr,
+                                     int *indices_ptr,
+                                     int *parent_ptr,
+                                     size_t batch_size,
+                                     int length,
+                                     bool sorted);
+  Params get_params() const;
+
+public:
+  bool sorted;
+  int max_beam_width;
+};
+
+}; // namespace FlexFlow
+
+#endif
diff --git a/include/flexflow/ops/beam_topk_params.h b/include/flexflow/ops/beam_topk_params.h
new file mode 100644
index 0000000000..c217b0f671
--- /dev/null
+++ b/include/flexflow/ops/beam_topk_params.h
@@ -0,0 +1,26 @@
+#ifndef _FLEXFLOW_BEAM_TOPK_PARAMS_H
+#define _FLEXFLOW_BEAM_TOPK_PARAMS_H
+
+#include "flexflow/ffconst.h"
+#include "flexflow/parallel_tensor.h"
+
+namespace FlexFlow {
+
+struct BeamTopKParams {
+  LayerID layer_guid;
+  bool sorted;
+  int max_beam_width;
+  bool is_valid(ParallelTensorShape const &) const;
+};
+bool operator==(BeamTopKParams const &, BeamTopKParams const &);
+
+} // namespace FlexFlow
+
+namespace std {
+template <>
+struct hash<FlexFlow::BeamTopKParams> {
+  size_t operator()(FlexFlow::BeamTopKParams const &) const;
+};
+} // namespace std
+
+#endif // _FLEXFLOW_BEAM_TOPK_PARAMS_H
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention.h b/include/flexflow/ops/spec_inc_multihead_self_attention.h
new file mode 100644
index 0000000000..4df85cd04e
--- /dev/null
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention.h
@@ -0,0 +1,154 @@
+#ifndef _FLEXFLOW_SPEC_INC_MULTIHEAD_SELF_ATTENTION_H
+#define _FLEXFLOW_SPEC_INC_MULTIHEAD_SELF_ATTENTION_H
+
+#include "flexflow/device.h"
+#include "flexflow/fftype.h"
+#include "flexflow/inference.h"
+#include "flexflow/layer.h"
+#include "flexflow/node.h"
+#include "flexflow/op_meta.h"
+#include "flexflow/operator.h"
+#include "flexflow/ops/spec_inc_multihead_self_attention_params.h"
+#include "math.h"
+#include <cfloat>
+#include <complex>
+
+namespace FlexFlow {
+
+class SpecIncMultiHeadSelfAttentionMeta;
+
+class SpecIncMultiHeadSelfAttention : public Op {
+public:
+  using Params = SpecIncMultiHeadSelfAttentionParams;
+  using Input = ParallelTensor;
+
+  SpecIncMultiHeadSelfAttention(FFModel &model,
+                                LayerID const &layer_guid,
+                                const ParallelTensor _input,
+                                int _embed_dim,
+                                int _num_heads,
+                                int _kdim,
+                                int _vdim,
+                                float _dropout,
+                                bool _bias,
+                                bool _add_bias_kv,
+                                bool _add_zero_attn,
+                                bool _apply_rotary_embedding,
+                                bool allocate_weights,
+                                char const *name);
+  SpecIncMultiHeadSelfAttention(FFModel &model,
+                                const ParallelTensor _input,
+                                const ParallelTensor _weight,
+                                int _embed_dim,
+                                int _num_heads,
+                                int _kdim,
+                                int _vdim,
+                                float _dropout,
+                                bool _bias,
+                                bool _add_bias_kv,
+                                bool _add_zero_attn,
+                                bool _apply_rotary_embedding,
+                                bool allocate_weights,
+                                char const *name);
+  SpecIncMultiHeadSelfAttention(FFModel &model,
+                                SpecIncMultiHeadSelfAttention const &other,
+                                const ParallelTensor input,
+                                bool allocate_weights);
+  SpecIncMultiHeadSelfAttention(FFModel &model,
+                                Params const &params,
+                                Input const &inputs,
+                                bool allocate_weights = false,
+                                char const *name = nullptr);
+  static Op *
+      create_operator_from_layer(FFModel &model,
+                                 Layer const *layer,
+                                 std::vector<ParallelTensor> const &inputs);
+  void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
+  void forward(FFModel const &) override;
+  void backward(FFModel const &) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
+  void print_layer(FFModel const &model) override {
+    assert(0);
+  }
+  bool get_int_parameter(PMParameter, int *) const override;
+
+  static OpMeta *init_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
+  Op *materialize(FFModel &ff,
+                  ParallelTensor inputs[],
+                  int num_inputs) const override;
+  bool measure_operator_cost(Simulator *sim,
+                             MachineView const &mv,
+                             CostMetrics &cost_metrics) const override;
+
+  static void
+      inference_kernel_wrapper(SpecIncMultiHeadSelfAttentionMeta const *m,
+                               BeamSearchBatchConfig const *bc,
+                               float const *input_ptr,
+                               float const *weight_ptr,
+                               float *output_ptr);
+  Params get_params() const;
+
+public:
+  int num_heads;
+  float dropout;
+  bool bias;
+  bool add_bias_kv, add_zero_attn, apply_rotary_embedding;
+  int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
+  int qoSeqLength, kvSeqLength;
+};
+
+class SpecIncMultiHeadSelfAttentionMeta : public OpMeta {
+public:
+  SpecIncMultiHeadSelfAttentionMeta(FFHandler handler,
+                                    SpecIncMultiHeadSelfAttention const *attn,
+                                    float const *weight_ptr,
+                                    Legion::Memory gpu_mem,
+                                    int num_samples,
+                                    int _num_heads);
+  ~SpecIncMultiHeadSelfAttentionMeta(void);
+
+public:
+  Realm::RegionInstance reserveInst;
+  size_t weights_params, weightSize, reserveSpaceSize;
+  int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
+  int num_heads;
+  bool *has_load_weights;
+  bool *apply_rotary_embedding;
+#ifdef INFERENCE_TESTS
+  float *kcache, *vcache;
+#endif
+  /*#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+    cudnnAttnDescriptor_t attnDesc;
+    cudnnSeqDataDescriptor_t qDesc, kDesc, vDesc, oDesc;
+  #endif*/
+  // int *devQoSeqArray, *devKvSeqArray, *loWinIdx, *hiWinIdx, *kvCache;
+  float *devQKVProjArray, *keyCache, *valueCache;
+  float *qk_prods, *qk_prods_softmax;
+  float *attn_heads, *W_out_contiguous;
+  // void *reserveSpace;
+
+  // BatchConfig::token_idxs *dev_token2ids;
+  BatchConfig::PerTokenInfo *tokenInfos;
+  BatchConfig::PerRequestInfo *requestInfos;
+  BeamSearchBatchConfig::BeamSearchPerTokenInfo *beamTokenInfos;
+  BeamSearchBatchConfig::BeamSearchPerRequestInfo *beamRequestInfos;
+};
+
+}; // namespace FlexFlow
+
+#endif // _FLEXFLOW_SPEC_INC_MULTIHEAD_SELF_ATTENTION_H
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention_params.h b/include/flexflow/ops/spec_inc_multihead_self_attention_params.h
new file mode 100644
index 0000000000..00e1179a14
--- /dev/null
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention_params.h
@@ -0,0 +1,31 @@
+#ifndef _FLEXFLOW_SPEC_INC_MULTIHEAD_SELF_ATTENTION_PARAMS_H
+#define _FLEXFLOW_SPEC_INC_MULTIHEAD_SELF_ATTENTION_PARAMS_H
+
+#include "flexflow/fftype.h"
+#include "flexflow/parallel_tensor.h"
+
+namespace FlexFlow {
+
+struct SpecIncMultiHeadSelfAttentionParams {
+  LayerID layer_guid;
+  int embed_dim, num_heads, kdim, vdim;
+  float dropout;
+  bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding;
+
+  bool is_valid(ParallelTensorShape const &) const;
+};
+
+bool operator==(SpecIncMultiHeadSelfAttentionParams const &,
+                SpecIncMultiHeadSelfAttentionParams const &);
+
+} // namespace FlexFlow
+
+namespace std {
+template <>
+struct hash<FlexFlow::SpecIncMultiHeadSelfAttentionParams> {
+  size_t
+      operator()(FlexFlow::SpecIncMultiHeadSelfAttentionParams const &) const;
+};
+} // namespace std
+
+#endif // _FLEXFLOW_SPEC_INC_MULTIHEAD_SELF_ATTENTION_PARAMS_H
diff --git a/include/flexflow/utils/cuda_helper.h b/include/flexflow/utils/cuda_helper.h
index 2ea7227879..b82426ac59 100644
--- a/include/flexflow/utils/cuda_helper.h
+++ b/include/flexflow/utils/cuda_helper.h
@@ -138,6 +138,12 @@ __host__ void updateGAS(float *para_ptr,
 
 template <typename T>
 void print_tensor(T const *ptr, size_t num_elements, char const *prefix);
+template <typename T>
+void print_beam_tensor(T const *ptr,
+                       size_t num_elements,
+                       int skip,
+                       int channel,
+                       char const *prefix);
 
 template <typename T>
 void save_tensor(T const *ptr, size_t num_elements, char const *file_name);
@@ -151,6 +157,10 @@ bool download_tensor(T const *ptr, T *dst, size_t num_elements);
 cudnnStatus_t cudnnSetTensorDescriptorFromDomain(cudnnTensorDescriptor_t tensor,
                                                  Legion::Domain domain);
 
+cudnnStatus_t
+    cudnnSetTensorDescriptorFromDomain4SoftMax(cudnnTensorDescriptor_t tensor,
+                                               Legion::Domain domain);
+
 cudaDataType_t ff_to_cuda_datatype(DataType type);
 cudnnDataType_t ff_to_cudnn_datatype(DataType type);
 
diff --git a/src/ops/beam_topk.cc b/src/ops/beam_topk.cc
new file mode 100644
index 0000000000..6a49573538
--- /dev/null
+++ b/src/ops/beam_topk.cc
@@ -0,0 +1,469 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/beam_topk.h"
+#include "flexflow/model.h"
+#include "flexflow/utils/hash_utils.h"
+#include "legion/legion_utilities.h"
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+#include "flexflow/utils/cuda_helper.h"
+#else
+#include "flexflow/utils/hip_helper.h"
+#endif
+
+namespace FlexFlow {
+// declare Legion names
+using Legion::ArgumentMap;
+using Legion::Context;
+using Legion::coord_t;
+using Legion::Domain;
+using Legion::FutureMap;
+using Legion::IndexLauncher;
+using Legion::InlineLauncher;
+using Legion::Machine;
+using Legion::Memory;
+using Legion::PhysicalRegion;
+using Legion::Predicate;
+using Legion::Rect;
+using Legion::RegionRequirement;
+using Legion::Runtime;
+using Legion::Task;
+using Legion::TaskArgument;
+using Legion::TaskLauncher;
+using PCG::Node;
+
+// For an input tensor, computes the top k entries in each row
+// (resp. vector along the last dimension). Thus,
+// values.shape = indices.shape = input.shape[:-1] + [k]
+Tensor FFModel::beam_top_k(const Tensor input,
+                           int max_beam_width,
+                           bool sorted,
+                           char const *name) {
+  Layer *li = new Layer(this,
+                        OP_BEAM_TOPK,
+                        input->data_type,
+                        name,
+                        1 /*inputs*/,
+                        0 /*weights*/,
+                        3 /*outputs*/,
+                        input);
+  {
+    int numdims = input->num_dims;
+
+    int dims[MAX_TENSOR_DIM];
+    for (int i = 0; i < numdims; i++) {
+      dims[i] = input->dims[i];
+    }
+    dims[0] = max_beam_width;
+
+    std::cout << "beam input dimen:" << numdims << "\n";
+    for (int i = 0; i < numdims; i++) {
+      std::cout << input->dims[i] << ", ";
+    }
+
+    // beam width is dynamic
+    li->outputs[0] = create_tensor_legion_ordering(
+        numdims, dims, DT_INT32, li, 0, false /*create_grad*/);
+    li->outputs[1] = create_tensor_legion_ordering(
+        numdims, dims, DT_FLOAT, li, 1, false /*create_grad*/);
+    li->outputs[2] = create_tensor_legion_ordering(
+        numdims, dims, DT_INT32, li, 1, false /*create_grad*/);
+  }
+  li->add_int_property("sorted", sorted);
+  li->add_int_property("max_beam_width", max_beam_width);
+  layers.push_back(li);
+  // outputs[0] = li->outputs[0];
+  // outputs[1] = li->outputs[1];
+  return li->outputs[1];
+}
+
+Op *BeamTopK::create_operator_from_layer(
+    FFModel &model,
+    Layer const *layer,
+    std::vector<ParallelTensor> const &inputs) {
+  long long value;
+  layer->get_int_property("sorted", value);
+  bool sorted = (bool)value;
+  layer->get_int_property("max_beam_width", value);
+  int max_beam_width = value;
+  return new BeamTopK(
+      model, inputs[0], layer->layer_guid, max_beam_width, sorted, layer->name);
+}
+
+BeamTopKParams BeamTopK::get_params() const {
+  BeamTopKParams params;
+  params.layer_guid = this->layer_guid;
+  params.sorted = this->sorted;
+  params.max_beam_width = this->max_beam_width;
+  return params;
+}
+
+bool BeamTopKParams::is_valid(ParallelTensorShape const &) const {
+  // topk is always valid
+  return true;
+}
+
+bool operator==(BeamTopKParams const &lhs, BeamTopKParams const &rhs) {
+  return lhs.layer_guid == rhs.layer_guid && lhs.sorted == rhs.sorted &&
+         lhs.max_beam_width == rhs.max_beam_width;
+}
+
+BeamTopK::BeamTopK(FFModel &model,
+                   const ParallelTensor _input,
+                   LayerID const &_layer_guid,
+                   int _max_beam_width,
+                   bool _sorted,
+                   char const *name)
+    : Op(model,
+         OP_BEAM_TOPK,
+         _input->data_type,
+         name,
+         1 /*inputs*/,
+         0 /*weights*/,
+         3 /*outputs*/,
+         _input) {
+  sorted = _sorted;
+  max_beam_width = _max_beam_width;
+  layer_guid = _layer_guid;
+  int numdim = inputs[0]->num_dims;
+  assert(inputs[0]->dims[0].degree == 1);
+  assert(inputs[0]->dims[0].parallel_idx == -1);
+  //   outputs[0] = model.create_parallel_tensor_legion_ordering(
+  //       numdim, dims, _input->data_type, this, 0 /*owner_idx*/);
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      numdim, inputs[0]->dims, DT_INT32, this, 0 /*owner_idx*/);
+  outputs[1] = model.create_parallel_tensor_legion_ordering(
+      numdim, inputs[0]->dims, _input->data_type, this, 1 /*owner_idx*/);
+  outputs[2] = model.create_parallel_tensor_legion_ordering(
+      numdim, inputs[0]->dims, DT_INT32, this, 2 /*owner_idx*/);
+}
+
+BeamTopK::BeamTopK(FFModel &model,
+                   BeamTopK const &other,
+                   const ParallelTensor input)
+    : BeamTopK(model,
+               input,
+               other.layer_guid,
+               other.max_beam_width,
+               other.sorted,
+               other.name) {}
+
+BeamTopK::BeamTopK(FFModel &model,
+                   BeamTopKParams const &params,
+                   const ParallelTensor input,
+                   char const *name)
+    : BeamTopK(model,
+               input,
+               params.layer_guid,
+               params.max_beam_width,
+               params.sorted,
+               name) {}
+
+void BeamTopK::init_inference(FFModel const &ff,
+                              std::vector<ParallelTensor> const &batch_inputs,
+                              std::vector<ParallelTensor> const &batch_outputs,
+                              MachineView const *mv) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher launcher(BEAM_TOPK_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(BeamTopK)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[1]->region));
+  launcher.add_field(2, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[2]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[2]->region));
+  launcher.add_field(3, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
+}
+
+void BeamTopK::init(FFModel const &ff) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(BEAM_TOPK_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(BeamTopK)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[1]->region));
+  launcher.add_field(2, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[2]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[2]->region));
+  launcher.add_field(3, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
+OpMeta *BeamTopK::init_task(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
+  BeamTopK *topk = (BeamTopK *)task->args;
+  FFHandler handle = *((FFHandler *)task->local_args);
+  BeamTopKMeta *m = new BeamTopKMeta(handle);
+  m->profiling = topk->profiling;
+  m->sorted = topk->sorted;
+  m->max_beam_width = topk->max_beam_width;
+  return m;
+}
+
+void BeamTopK::forward(FFModel const &ff) {
+  assert(false);
+}
+
+FutureMap BeamTopK::inference(FFModel const &ff,
+                              BatchConfig const &bc,
+                              std::vector<ParallelTensor> const &batch_inputs,
+                              std::vector<ParallelTensor> const &batch_outputs,
+                              MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+
+  IndexLauncher launcher(
+      BEAM_TOPK_INF_TASK_ID,
+      parallel_is,
+      TaskArgument(
+          &bc, std::max(sizeof(BatchConfig), sizeof(BeamSearchBatchConfig))),
+      argmap,
+      Predicate::TRUE_PRED,
+      false /*must*/,
+      0 /*mapper_id*/,
+      machine_view_hash);
+
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[1]->region));
+  launcher.add_field(2, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[2]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[2]->region));
+  launcher.add_field(3, FID_DATA);
+
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+BeamInferenceResult
+    BeamTopK::inference_task(Task const *task,
+                             std::vector<PhysicalRegion> const &regions,
+                             Context ctx,
+                             Runtime *runtime) {
+
+  assert(regions.size() == 4);
+  assert(task->regions.size() == 4);
+
+  BeamSearchBatchConfig const *bc = (BeamSearchBatchConfig *)task->args;
+
+  std::cout << "beam search topk inference: "
+            << "\n";
+
+  BeamTopKMeta const *m = *((BeamTopKMeta **)task->local_args);
+  Domain in1_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  //   Domain out1_domain = runtime->get_index_space_domain(
+  //       ctx, task->regions[1].region.get_index_space());
+  Domain out2_domain = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+  int numdims = in1_domain.get_dim();
+
+  float const *in_ptr = helperGetTensorPointerRO<float>(
+      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  //   float *value_ptr = helperGetTensorPointerWO<float>(
+  //       regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  int *index_ptr = helperGetTensorPointerWO<int>(
+      regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  float *value_ptr = helperGetTensorPointerWO<float>(
+      regions[2], task->regions[2], FID_DATA, ctx, runtime);
+
+  int *parent_ptr = helperGetTensorPointerWO<int>(
+      regions[3], task->regions[3], FID_DATA, ctx, runtime);
+  // embedding size: eg. 4096
+  int length = in1_domain.hi()[0] - in1_domain.lo()[0] + 1;
+
+  int k =
+      out2_domain.hi()[0] - out2_domain.lo()[0] + 1; /*TODO: This prints to 5*/
+
+  // total token nums
+  size_t tokens_per_request = in1_domain.hi()[1] - in1_domain.lo()[1] + 1;
+  size_t batch_size = in1_domain.get_volume() / length;
+
+  std::cout << "beam search topk params: " << length << ", " << k << ", "
+            << batch_size << "\n";
+  assert(out2_domain.get_volume() / k == batch_size);
+
+  // std::vector<int> beam_width;
+  // std::unordered_map<size_t, int> sub_requests = bc->sub_requests;
+  // for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
+  //   if (bc->request_completed[i]) {
+  //     continue;
+  //   }
+  //   // add beam width for each main request
+  //   beam_width.push_back(sub_requests[i]);
+  //   std::cout << "sub req num: " <<sub_requests[i] << "\n";
+  // }
+
+  // need meta for: how many sub requests in a main request
+  BeamTopK::forward_kernel_wrapper(m,
+                                   bc,
+                                   in_ptr,
+                                   value_ptr,
+                                   index_ptr,
+                                   parent_ptr,
+                                   batch_size,
+                                   length,
+                                   m->sorted);
+
+  BeamInferenceResult ir;
+
+  download_tensor<int>(index_ptr, ir.token_ids, batch_size * m->max_beam_width);
+  download_tensor<float>(value_ptr, ir.probs, batch_size * m->max_beam_width);
+  download_tensor<int>(
+      parent_ptr, ir.parent_id, batch_size * m->max_beam_width);
+  return ir;
+}
+
+void BeamTopK::backward(FFModel const &ff) {
+  assert(false);
+}
+
+void BeamTopK::serialize(Legion::Serializer &sez) const {
+  sez.serialize(this->layer_guid.id);
+  sez.serialize(this->sorted);
+  sez.serialize(this->max_beam_width);
+}
+
+Node BeamTopK::deserialize(FFModel &ff,
+                           Legion::Deserializer &dez,
+                           ParallelTensor inputs[],
+                           int num_inputs) {
+  assert(num_inputs == 1);
+  bool sorted;
+  size_t id;
+  int max_beam_width;
+  dez.deserialize(id);
+  LayerID layer_guid(id);
+  dez.deserialize(sorted);
+  dez.deserialize(max_beam_width);
+  BeamTopKParams params;
+  params.layer_guid = layer_guid;
+  params.sorted = sorted;
+  params.max_beam_width = max_beam_width;
+  return ff.get_or_create_node<BeamTopK>(inputs[0], params);
+}
+
+Op *BeamTopK::materialize(FFModel &ff,
+                          ParallelTensor inputs[],
+                          int num_inputs) const {
+  BeamTopKParams params = get_params();
+  return new BeamTopK(ff, params, inputs[0], this->name);
+}
+
+bool BeamTopK::measure_operator_cost(Simulator *sim,
+                                     MachineView const &mv,
+                                     CostMetrics &cost_metrics) const {
+  return false;
+}
+
+}; // namespace FlexFlow
+
+namespace std {
+size_t hash<FlexFlow::BeamTopKParams>::operator()(
+    FlexFlow::BeamTopKParams const &params) const {
+  size_t key = 0;
+  hash_combine(key, params.layer_guid.id);
+  hash_combine(key, params.sorted);
+  hash_combine(key, params.max_beam_width);
+  return key;
+}
+}; // namespace std
diff --git a/src/ops/beam_topk.cpp b/src/ops/beam_topk.cpp
new file mode 100644
index 0000000000..7e9421f299
--- /dev/null
+++ b/src/ops/beam_topk.cpp
@@ -0,0 +1,716 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/beam_topk.h"
+#include "flexflow/utils/hip_helper.h"
+#include <hip/hip_runtime.h>
+
+namespace FlexFlow {
+// declare Legion names
+using Legion::coord_t;
+
+enum class HeapType { kMinHeap, kMaxHeap };
+enum class PreferIndices { kLower, kHigher };
+
+template <typename T>
+struct Entry {
+  int index;
+  T value;
+};
+
+template <typename T>
+struct LinearData {
+  typedef Entry<T> Entry;
+
+  __device__ Entry &operator[](std::size_t index) const {
+    return data[index];
+  }
+
+  __device__ int get_index(int i) const {
+    return data[i].index;
+  }
+  __device__ T get_value(int i) const {
+    return data[i].value;
+  }
+
+  Entry *const data;
+};
+
+template <typename T>
+struct IndirectLinearData {
+  typedef Entry<T> Entry;
+
+  __device__ Entry &operator[](std::size_t index) const {
+    return data[index];
+  }
+
+  __device__ int get_index(int i) const {
+    return backing_data[data[i].index].index;
+  }
+  __device__ T get_value(int i) const {
+    return data[i].value;
+  }
+
+  Entry *const data;
+  Entry *const backing_data;
+};
+
+template <typename T>
+struct StridedData {
+  typedef Entry<T> Entry;
+
+  __device__ Entry &operator[](std::size_t index) const {
+    return data[index * blockDim.x + threadIdx.x];
+  }
+
+  __device__ int get_index(int i) const {
+    return (*this)[i].index;
+  }
+  __device__ T get_value(int i) const {
+    return (*this)[i].value;
+  }
+
+  Entry *const data;
+};
+
+// A heap of Entry<T> that can either work as a min-heap or as a max-heap.
+template <HeapType heapType,
+          PreferIndices preferIndices,
+          template <typename>
+          class Data,
+          typename T>
+struct IndexedHeap {
+  typedef typename Data<T>::Entry Entry;
+  Data<T> const data;
+  __device__ IndexedHeap(Data<T> const &d) : data(d) {}
+
+  __device__ bool is_above(int left, int right) {
+    T left_value = data.get_value(left);
+    T right_value = data.get_value(right);
+    if (left_value == right_value) {
+      if (preferIndices == PreferIndices::kLower) {
+        return data.get_index(left) < data.get_index(right);
+      } else {
+        return data.get_index(left) > data.get_index(right);
+      }
+    }
+    if (heapType == HeapType::kMinHeap) {
+      return left_value < right_value;
+    } else {
+      return left_value > right_value;
+    }
+  }
+
+  __device__ void assign(int i, Entry const &entry) {
+    data[i] = entry;
+  }
+
+  __device__ void push_up(int i) {
+    int child = i;
+    int parent;
+    for (; child > 0; child = parent) {
+      parent = (child - 1) / 2;
+      if (!is_above(child, parent)) {
+        // Heap property satisfied.
+        break;
+      }
+      swap(child, parent);
+    }
+  }
+
+  __device__ void swap(int a, int b) {
+    auto tmp = data[b];
+    data[b] = data[a];
+    data[a] = tmp;
+  }
+
+  __device__ void push_root_down(int k) {
+    push_down(0, k);
+  }
+
+  // MAX-HEAPIFY in Cormen
+  __device__ void push_down(int node, int k) {
+    while (true) {
+      int const left = 2 * node + 1;
+      int const right = left + 1;
+      int smallest = node;
+      if (left < k && is_above(left, smallest)) {
+        smallest = left;
+      }
+      if (right < k && is_above(right, smallest)) {
+        smallest = right;
+      }
+      if (smallest == node) {
+        break;
+      }
+      swap(smallest, node);
+      node = smallest;
+    }
+  }
+
+  // BUILD-MAX-HEAPIFY in Cormen
+  __device__ void build(int k) {
+    for (int node = (k - 1) / 2; node >= 0; node--) {
+      push_down(node, k);
+    }
+  }
+
+  // HEAP-EXTRACT-MAX in Cormen
+  __device__ void remove_root(int k) {
+    data[0] = data[k - 1];
+    push_root_down(k - 1);
+  }
+
+  // in-place HEAPSORT in Cormen
+  // This method destroys the heap property.
+  __device__ void sort(int k) {
+    for (int slot = k - 1; slot > 0; slot--) {
+      // This is like remove_root but we insert the element at the end.
+      swap(slot, 0);
+      // Heap is now an element smaller.
+      push_root_down(/*k=*/slot);
+    }
+  }
+
+  __device__ void replace_root(Entry const &entry, int k) {
+    data[0] = entry;
+    push_root_down(k);
+  }
+
+  __device__ Entry const &root() {
+    return data[0];
+  }
+};
+
+template <HeapType heapType,
+          PreferIndices preferIndices,
+          template <typename>
+          class Data,
+          typename T>
+__device__ IndexedHeap<heapType, preferIndices, Data, T>
+    make_indexed_heap(typename Data<T>::Entry *data) {
+  return IndexedHeap<heapType, preferIndices, Data, T>{Data<T>{data}};
+}
+
+// heapBeamTopK walks over [input, input+length) with `step_size` stride
+// starting at `start_index`. It builds a top-`k` heap that is stored in
+// `heap_entries` using `Accessor` to access elements in `heap_entries`. If
+// sorted=true, the elements will be sorted at the end.
+template <typename T, template <typename> class Data = LinearData>
+__device__ void heapBeamTopK(T const *__restrict__ input,
+                             int batch_index,
+                             int length,
+                             int k,
+                             Entry<T> *__restrict__ heap_entries,
+                             bool sorted = false,
+                             int start_index = 0,
+                             int step_size = 1) {
+  assert(k <= length);
+  auto heap =
+      make_indexed_heap<HeapType::kMinHeap, PreferIndices::kHigher, Data, T>(
+          heap_entries);
+
+  int heap_end_index = start_index + k * step_size;
+  if (heap_end_index > length) {
+    heap_end_index = length;
+  }
+  // Initialize the min-heap.
+  for (int index = start_index, slot = 0; index < heap_end_index;
+       index += step_size, slot++) {
+    heap.assign(slot, {index, input[index]});
+  }
+
+  heap.build(k);
+
+  // Now iterate over the remaining items.
+  // If an item is smaller than the min element, it is not amongst the top k.
+  // Otherwise, replace the min element with it and push upwards.
+  for (int index = heap_end_index; index < length; index += step_size) {
+    // We prefer elements with lower indices. This is given here.
+    // Later elements automatically have higher indices, so can be discarded.
+    if (input[index] > heap.root().value) {
+      // This element should replace the min.
+      heap.replace_root({index, input[index]}, k);
+    }
+  }
+
+  // Sort if wanted.
+  if (sorted) {
+    heap.sort(k);
+  }
+
+  // if(batch_index == 0){
+  //   printf("top elemmments: %d, value %.15f\n", start_index,
+  //   heap.root().value);
+  // }
+}
+
+template <typename T>
+__device__ void mergeBeamShards(int num_shards,
+                                int batch_index,
+                                int k,
+                                int max_heap_size,
+                                int request_id,
+                                int *parent_id,
+                                float *probs,
+                                Entry<T> *__restrict__ entries,
+                                Entry<T> *__restrict__ top_k_heap,
+                                T *top_k_values,
+                                int *top_k_indices,
+                                int *top_k_parents) {
+  // If k < num_shards, we can use a min-heap with k elements to get the top k
+  // of the sorted blocks.
+  // If k > num_shards, we can initialize a min-heap with the top element from
+  // each sorted block.
+  int const heap_size = k < num_shards ? k : num_shards;
+  // printf("see value: %f", entries[0].value);
+  // Min-heap part.
+
+  {
+    auto min_heap = IndexedHeap<HeapType::kMinHeap,
+                                PreferIndices::kHigher,
+                                IndirectLinearData,
+                                T>{IndirectLinearData<T>{top_k_heap, entries}};
+    // Initialize the heap as a min-heap.
+    for (int slot = 0; slot < heap_size; slot++) {
+      // int beam = (slot % max_heap_size) / k;
+      float prob = probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+                         ((slot % max_heap_size) / k)];
+      min_heap.assign(slot, {slot, (entries[slot].value * prob)});
+      if (batch_index == 0) {
+        printf("slot %d, value %.15f, prob %15f\n",
+               slot,
+               entries[slot].value,
+               prob);
+      }
+    }
+    min_heap.build(heap_size);
+
+    // Now perform top k with the remaining shards (if num_shards > heap_size).
+    for (int shard = heap_size; shard < num_shards; shard++) {
+      auto const entry = entries[shard];
+      auto const root = min_heap.root();
+
+      float prob = probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+                         ((shard % max_heap_size) / k)];
+      if (batch_index == 0) {
+        printf("shard %d, index %d, value %.15f, prob %.15f\n",
+               shard,
+               entry.index,
+               entry.value,
+               prob);
+      }
+      if (entry.value * prob < root.value) {
+        continue;
+      }
+      if (entry.value * prob == root.value &&
+          entry.index > entries[root.index].index) {
+        continue;
+      }
+      // This element should replace the min.
+      min_heap.replace_root({shard, entry.value * prob}, heap_size);
+    }
+  }
+
+  // Max-part.
+  {
+    // Turn the min-heap into a max-heap in-place.
+    auto max_heap = IndexedHeap<HeapType::kMaxHeap,
+                                PreferIndices::kLower,
+                                IndirectLinearData,
+                                T>{IndirectLinearData<T>{top_k_heap, entries}};
+    // Heapify into a max heap.
+    max_heap.build(heap_size);
+
+    // Now extract the minimum k-1 times.
+    // k is treated specially.
+    int const last_k = k - 1;
+    for (int rank = 0; rank < last_k; rank++) {
+      Entry<T> const &max_element = max_heap.root();
+      top_k_values[rank] = max_element.value;
+      int shard_index = max_element.index;
+      top_k_indices[rank] = entries[shard_index].index;
+      top_k_parents[rank] =
+          parent_id[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+                    ((shard_index % max_heap_size) / k)];
+      int next_shard_index = shard_index + num_shards;
+
+      float prob = probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+                         ((next_shard_index % max_heap_size) / k)];
+      if (batch_index == 0) {
+        printf("next_shard_index %d, value %.15f, prob %.15f\n",
+               next_shard_index,
+               entries[next_shard_index].value,
+               prob);
+      }
+
+      max_heap.replace_root(
+          {next_shard_index, entries[next_shard_index].value * prob},
+          heap_size);
+    }
+
+    // rank == last_k.
+    Entry<T> const &max_element = max_heap.root();
+    top_k_values[last_k] = max_element.value;
+    int shard_index = max_element.index;
+    top_k_indices[last_k] = entries[shard_index].index;
+    top_k_parents[last_k] =
+        parent_id[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+                  ((shard_index % max_heap_size) / k)];
+  }
+}
+
+template <typename T>
+__global__ void
+    mergeSubRequestsKernel(int64_t N, T const *X, T const *rstd, T *Y) {
+  using T_ACC = T;
+  const int64_t i = blockIdx.x;
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
+    const int64_t index = i * N + j;
+    Y[index] = static_cast<T_ACC>(X[index]) * static_cast<T_ACC>(rstd[i]);
+  }
+}
+
+template <typename T>
+__global__ void beam_topk_forward_kernel(T const *__restrict__ input,
+                                         size_t shared_memory_size,
+                                         int length,
+                                         int k,
+                                         int max_heap_size,
+                                         int *parent_ids,
+                                         float *acc_probs,
+                                         int *gpu_block_start_index,
+                                         int *gpu_request_id,
+                                         int *tokens_per_request,
+                                         bool sorted,
+                                         T *__restrict__ output,
+                                         int *__restrict__ indices,
+                                         int *__restrict__ parents,
+                                         bool is_print) {
+  __shared__ char shared_memory[48 << 10];
+  int const batch_index = blockIdx.x;
+  // T const *batch_input = input + batch_index * length;
+  int const thread_index = threadIdx.x;
+  int const thread_count = blockDim.x;
+  int const request_id = gpu_request_id[batch_index];
+  int const token_nums = tokens_per_request[batch_index];
+  Entry<T> *shared_entries = (Entry<T> *)shared_memory;
+
+  int sub_request_id = thread_index / k;
+  // if (is_print) {
+  //   printf("beam kernel: batch_index: %d, thread_index %d, sub_request_id %d,
+  //   "
+  //          "request_id %d, token_nums %d\n",
+  //          batch_index,
+  //          thread_index,
+  //          sub_request_id,
+  //          request_id,
+  //          token_nums);
+  // }
+
+  T const *batch_input = input + gpu_block_start_index[batch_index] +
+                         (sub_request_id * token_nums * length);
+
+  if (batch_index == 0) {
+    printf("request 0 start index: thread index %d, offset %d, batch_input %p, "
+           "acc index %d acc "
+           "prob %f, thread_count %d, request_id %d\n",
+           thread_index,
+           gpu_block_start_index[batch_index] +
+               (sub_request_id * token_nums * length),
+           batch_input,
+           request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH + sub_request_id,
+           acc_probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+                     sub_request_id],
+           thread_count,
+           request_id);
+  }
+  // printf("thread index %d, thread_count %d, batch_index %d\n", thread_index,
+  // thread_count, batch_index);
+  heapBeamTopK<T, StridedData>(batch_input,
+                               batch_index,
+                               length,
+                               k,
+                               shared_entries,
+                               true,
+                               thread_index % k,
+                               k);
+  __syncthreads();
+  // printf("beam thread index %d, thread_count %d, thread index %d, batch_index
+  // "
+  //        "%d, k %d, parent_id %d, acc_prob: %f, sub id: %d, request_id: %d,
+  //        offset: %d, offset2 %d, sub_request_id %d\n", thread_index,
+  //        thread_count,
+  //        thread_index,
+  //        batch_index,
+  //        k,
+  //        parent_ids[request_id * BatchConfig::MAX_NUM_BEAMS +
+  //        sub_request_id], acc_probs[request_id * BatchConfig::MAX_NUM_BEAMS +
+  //        sub_request_id], sub_request_id, request_id,
+  //        gpu_block_start_index[batch_index],
+  //        batch_index * length,
+  //        sub_request_id);
+
+  if (thread_index == 0) {
+    // merge beam_width heaps and store the parent
+    // find which req it belongs to, replace the offset
+    printf("merge heaps, batch index: %d, sub_request_id %d, value %f\n",
+           batch_index,
+           sub_request_id,
+           acc_probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+                     sub_request_id]);
+    int const offset = batch_index * k;
+    auto batch_output = output + offset;
+    auto batch_indices = indices + offset;
+    auto batch_parents = parents + offset;
+    Entry<T> *top_k_heap = shared_entries + thread_count * k;
+
+    // if(batch_index == 0 && is_print){
+    //   for(int i = 0; i < 18; i++){
+    //       printf("see value: %.15f\n", shared_entries[i].value);
+    //   }
+    // }
+
+    // get parent/acc based on the sub request and main request
+    mergeBeamShards(thread_count,
+                    batch_index,
+                    k,
+                    max_heap_size,
+                    request_id,
+                    parent_ids,
+                    acc_probs,
+                    shared_entries,
+                    top_k_heap,
+                    batch_output,
+                    batch_indices,
+                    batch_parents);
+  }
+}
+
+/*static*/
+void BeamTopK::forward_kernel(BeamTopKMeta const *m,
+                              BeamSearchBatchConfig const *bc,
+                              float const *input_ptr,
+                              float *output_ptr,
+                              int *indices_ptr,
+                              int *parent_ptr,
+                              size_t batch_size,
+                              int length,
+                              bool sorted,
+                              hipStream_t stream) {
+  // Adopted from TensorFlow's BeamTopK implementation
+  // https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/kernels/topk_op_gpu.h
+
+  int num_shards = 0;
+  int max_heap_size = 0;
+  int max_beam_width = 0;
+  int req_index = 0;
+
+  // sub request
+  int const *sub_requests = bc->sub_requests;
+
+  // std::vector<BatchConfig::BeamSlot> beam_slots = bc->beam_slots;
+  // assert(bc->beam_slots.size() > 0);
+
+  int beam_num_blocks = 0;
+  std::vector<int> beam_block_start_index;
+  std::vector<int> request_id;
+  std::vector<int> tokens_per_request;
+
+  int block_start_index = 0;
+  int depth =
+      bc->beamRequestsInfo[bc->tokensInfo[0].request_index].current_depth;
+
+  // a data structure for prob, parent_id,
+  int max_total_requests =
+      BeamSearchBatchConfig::MAX_BEAM_WIDTH * bc->num_active_requests();
+  int parent_ids[max_total_requests];
+  float acc_probs[max_total_requests];
+
+  for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    assert(bc->beamRequestsInfo[i].beam_size > 0);
+
+    // int num_new_tokens = bc->num_processing_tokens[i];
+    int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+
+    // get beam size;
+    int beam_size = bc->beamRequestsInfo[i].beam_size;
+
+    // initial request
+    std::cout << "sub_requests: " << i << ", " << sub_requests[i] << "\n";
+    assert(sub_requests[i] > 0);
+    // process sub requests
+    for (int j = 0; j < sub_requests[i]; j++) {
+      parent_ids[req_index * BeamSearchBatchConfig::MAX_BEAM_WIDTH + j] = j;
+      // beam_slots[i].parent_id[j];
+      acc_probs[req_index * BeamSearchBatchConfig::MAX_BEAM_WIDTH + j] =
+          bc->beamRequestsInfo[i].probs[j];
+      std::cout << "probbbb req: " << i << ", sub req probability : "
+                << bc->beamRequestsInfo[i].probs[j] << ", sub request id " << j
+                << ", parent id " << bc->beamRequestsInfo[i].parent_id[j]
+                << ", data inddd"
+                << req_index * BeamSearchBatchConfig::MAX_BEAM_WIDTH + j
+                << "\n";
+    }
+
+    // process tokens
+    for (int k = 0; k < num_new_tokens; k++) {
+      beam_block_start_index.push_back(block_start_index);
+      request_id.push_back(i);
+      tokens_per_request.push_back(num_new_tokens);
+      block_start_index += length;
+      beam_num_blocks++;
+    }
+
+    max_heap_size = std::max(max_heap_size, beam_size * sub_requests[i]);
+    max_beam_width = std::max(max_beam_width, beam_size);
+    req_index += 1;
+    block_start_index += (sub_requests[i] - 1) * num_new_tokens * length;
+  }
+  std::cout << "what index: " << block_start_index
+            << ", block num: " << beam_num_blocks << "\n";
+
+  assert(batch_size >= beam_num_blocks);
+  assert(bc->num_active_requests() == req_index);
+
+  {
+    constexpr auto shared_memory_size = 48 << 10;
+    auto const heap_size = max_heap_size * sizeof(Entry<float>);
+    // shared_memory_size = (num_shards + 1) * heap_size <=>
+    num_shards = shared_memory_size / heap_size - 1;
+    assert(num_shards > 0);
+    if (num_shards > CUDA_NUM_THREADS) {
+      num_shards = CUDA_NUM_THREADS;
+    }
+    std::cout << "maxheap size:  " << max_heap_size << "\n";
+    std::cout << "maxbeam width:  " << max_beam_width
+              << ", heap size: " << heap_size << "\n";
+  }
+  // We are limited by the amount of shared memory we have per block.
+  size_t shared_memory_size =
+      (num_shards + 1) * max_heap_size * sizeof(Entry<float>);
+
+  assert(num_shards >= (size_t)max_heap_size);
+  num_shards = max_heap_size;
+
+  // parent_id, per token
+  int *gpu_parents;
+  // acc_porbs, per token
+  float *gpu_probs;
+  // each block's start index;
+  // one block means the single token in different requests;
+  int *gpu_block_start_index;
+  int *gpu_request_id;
+  int *gpu_tokens_per_request;
+
+  checkCUDA(hipMalloc(&gpu_parents, sizeof(int) * max_total_requests));
+  checkCUDA(hipMalloc(&gpu_probs, sizeof(float) * max_total_requests));
+  checkCUDA(hipMalloc(&gpu_block_start_index, sizeof(int) * beam_num_blocks));
+  checkCUDA(hipMalloc(&gpu_request_id, sizeof(int) * beam_num_blocks));
+  checkCUDA(hipMalloc(&gpu_tokens_per_request, sizeof(int) * beam_num_blocks));
+  checkCUDA(hipMemcpy(gpu_parents,
+                      parent_ids,
+                      sizeof(int) * max_total_requests,
+                      hipMemcpyHostToDevice));
+  checkCUDA(hipMemcpy(gpu_probs,
+                      acc_probs,
+                      sizeof(float) * max_total_requests,
+                      hipMemcpyHostToDevice));
+  checkCUDA(hipMemcpy(gpu_block_start_index,
+                      beam_block_start_index.data(),
+                      sizeof(int) * beam_num_blocks,
+                      hipMemcpyHostToDevice));
+  checkCUDA(hipMemcpy(gpu_request_id,
+                      request_id.data(),
+                      sizeof(int) * beam_num_blocks,
+                      hipMemcpyHostToDevice));
+  checkCUDA(hipMemcpy(gpu_tokens_per_request,
+                      tokens_per_request.data(),
+                      sizeof(int) * beam_num_blocks,
+                      hipMemcpyHostToDevice));
+
+  beam_topk_forward_kernel<<<beam_num_blocks, num_shards, 0, stream>>>(
+      input_ptr,
+      shared_memory_size,
+      length,
+      max_beam_width,
+      max_heap_size,
+      gpu_parents,
+      gpu_probs,
+      gpu_block_start_index,
+      gpu_request_id,
+      gpu_tokens_per_request,
+      sorted,
+      output_ptr,
+      indices_ptr,
+      parent_ptr,
+      depth == 1);
+
+  // merge sub
+}
+
+/*static*/
+void BeamTopK::forward_kernel_wrapper(BeamTopKMeta const *m,
+                                      BeamSearchBatchConfig const *bc,
+                                      float const *input_ptr,
+                                      float *output_ptr,
+                                      int *indices_ptr,
+                                      int *parent_ptr,
+                                      size_t batch_size,
+                                      int length,
+                                      bool sorted) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    hipEventCreate(&t_start);
+    hipEventCreate(&t_end);
+    hipEventRecord(t_start, stream);
+  }
+
+  BeamTopK::forward_kernel(m,
+                           bc,
+                           input_ptr,
+                           output_ptr,
+                           indices_ptr,
+                           parent_ptr,
+                           batch_size,
+                           length,
+                           sorted,
+                           stream);
+
+  if (m->profiling) {
+    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    hipEventDestroy(t_start);
+    hipEventDestroy(t_end);
+    printf("[BeamTopK] forward time = %.2lfms\n", elapsed);
+  }
+  // if(bc->beam_slots.at(0).current_depth == 1){
+  //     print_beam_tensor<float>((float *)input_ptr, 50, 32000, 15, "beam topk
+  //     input"); print_tensor<float>((float *)output_ptr, 50, "beam topk
+  //     output");
+  // }
+}
+
+BeamTopKMeta::BeamTopKMeta(FFHandler handler) : OpMeta(handler) {}
+
+}; // namespace FlexFlow
diff --git a/src/ops/beam_topk.cu b/src/ops/beam_topk.cu
new file mode 100644
index 0000000000..b41b4c2ba4
--- /dev/null
+++ b/src/ops/beam_topk.cu
@@ -0,0 +1,715 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/beam_topk.h"
+#include "flexflow/utils/cuda_helper.h"
+
+namespace FlexFlow {
+// declare Legion names
+using Legion::coord_t;
+
+enum class HeapType { kMinHeap, kMaxHeap };
+enum class PreferIndices { kLower, kHigher };
+
+template <typename T>
+struct Entry {
+  int index;
+  T value;
+};
+
+template <typename T>
+struct LinearData {
+  typedef Entry<T> Entry;
+
+  __device__ Entry &operator[](std::size_t index) const {
+    return data[index];
+  }
+
+  __device__ int get_index(int i) const {
+    return data[i].index;
+  }
+  __device__ T get_value(int i) const {
+    return data[i].value;
+  }
+
+  Entry *const data;
+};
+
+template <typename T>
+struct IndirectLinearData {
+  typedef Entry<T> Entry;
+
+  __device__ Entry &operator[](std::size_t index) const {
+    return data[index];
+  }
+
+  __device__ int get_index(int i) const {
+    return backing_data[data[i].index].index;
+  }
+  __device__ T get_value(int i) const {
+    return data[i].value;
+  }
+
+  Entry *const data;
+  Entry *const backing_data;
+};
+
+template <typename T>
+struct StridedData {
+  typedef Entry<T> Entry;
+
+  __device__ Entry &operator[](std::size_t index) const {
+    return data[index * blockDim.x + threadIdx.x];
+  }
+
+  __device__ int get_index(int i) const {
+    return (*this)[i].index;
+  }
+  __device__ T get_value(int i) const {
+    return (*this)[i].value;
+  }
+
+  Entry *const data;
+};
+
+// A heap of Entry<T> that can either work as a min-heap or as a max-heap.
+template <HeapType heapType,
+          PreferIndices preferIndices,
+          template <typename>
+          class Data,
+          typename T>
+struct IndexedHeap {
+  typedef typename Data<T>::Entry Entry;
+  Data<T> const data;
+  __device__ IndexedHeap(Data<T> const &d) : data(d) {}
+
+  __device__ bool is_above(int left, int right) {
+    T left_value = data.get_value(left);
+    T right_value = data.get_value(right);
+    if (left_value == right_value) {
+      if (preferIndices == PreferIndices::kLower) {
+        return data.get_index(left) < data.get_index(right);
+      } else {
+        return data.get_index(left) > data.get_index(right);
+      }
+    }
+    if (heapType == HeapType::kMinHeap) {
+      return left_value < right_value;
+    } else {
+      return left_value > right_value;
+    }
+  }
+
+  __device__ void assign(int i, Entry const &entry) {
+    data[i] = entry;
+  }
+
+  __device__ void push_up(int i) {
+    int child = i;
+    int parent;
+    for (; child > 0; child = parent) {
+      parent = (child - 1) / 2;
+      if (!is_above(child, parent)) {
+        // Heap property satisfied.
+        break;
+      }
+      swap(child, parent);
+    }
+  }
+
+  __device__ void swap(int a, int b) {
+    auto tmp = data[b];
+    data[b] = data[a];
+    data[a] = tmp;
+  }
+
+  __device__ void push_root_down(int k) {
+    push_down(0, k);
+  }
+
+  // MAX-HEAPIFY in Cormen
+  __device__ void push_down(int node, int k) {
+    while (true) {
+      int const left = 2 * node + 1;
+      int const right = left + 1;
+      int smallest = node;
+      if (left < k && is_above(left, smallest)) {
+        smallest = left;
+      }
+      if (right < k && is_above(right, smallest)) {
+        smallest = right;
+      }
+      if (smallest == node) {
+        break;
+      }
+      swap(smallest, node);
+      node = smallest;
+    }
+  }
+
+  // BUILD-MAX-HEAPIFY in Cormen
+  __device__ void build(int k) {
+    for (int node = (k - 1) / 2; node >= 0; node--) {
+      push_down(node, k);
+    }
+  }
+
+  // HEAP-EXTRACT-MAX in Cormen
+  __device__ void remove_root(int k) {
+    data[0] = data[k - 1];
+    push_root_down(k - 1);
+  }
+
+  // in-place HEAPSORT in Cormen
+  // This method destroys the heap property.
+  __device__ void sort(int k) {
+    for (int slot = k - 1; slot > 0; slot--) {
+      // This is like remove_root but we insert the element at the end.
+      swap(slot, 0);
+      // Heap is now an element smaller.
+      push_root_down(/*k=*/slot);
+    }
+  }
+
+  __device__ void replace_root(Entry const &entry, int k) {
+    data[0] = entry;
+    push_root_down(k);
+  }
+
+  __device__ Entry const &root() {
+    return data[0];
+  }
+};
+
+template <HeapType heapType,
+          PreferIndices preferIndices,
+          template <typename>
+          class Data,
+          typename T>
+__device__ IndexedHeap<heapType, preferIndices, Data, T>
+    make_indexed_heap(typename Data<T>::Entry *data) {
+  return IndexedHeap<heapType, preferIndices, Data, T>{Data<T>{data}};
+}
+
+// heapBeamTopK walks over [input, input+length) with `step_size` stride
+// starting at `start_index`. It builds a top-`k` heap that is stored in
+// `heap_entries` using `Accessor` to access elements in `heap_entries`. If
+// sorted=true, the elements will be sorted at the end.
+template <typename T, template <typename> class Data = LinearData>
+__device__ void heapBeamTopK(T const *__restrict__ input,
+                             int batch_index,
+                             int length,
+                             int k,
+                             Entry<T> *__restrict__ heap_entries,
+                             bool sorted = false,
+                             int start_index = 0,
+                             int step_size = 1) {
+  assert(k <= length);
+  auto heap =
+      make_indexed_heap<HeapType::kMinHeap, PreferIndices::kHigher, Data, T>(
+          heap_entries);
+
+  int heap_end_index = start_index + k * step_size;
+  if (heap_end_index > length) {
+    heap_end_index = length;
+  }
+  // Initialize the min-heap.
+  for (int index = start_index, slot = 0; index < heap_end_index;
+       index += step_size, slot++) {
+    heap.assign(slot, {index, input[index]});
+  }
+
+  heap.build(k);
+
+  // Now iterate over the remaining items.
+  // If an item is smaller than the min element, it is not amongst the top k.
+  // Otherwise, replace the min element with it and push upwards.
+  for (int index = heap_end_index; index < length; index += step_size) {
+    // We prefer elements with lower indices. This is given here.
+    // Later elements automatically have higher indices, so can be discarded.
+    if (input[index] > heap.root().value) {
+      // This element should replace the min.
+      heap.replace_root({index, input[index]}, k);
+    }
+  }
+
+  // Sort if wanted.
+  if (sorted) {
+    heap.sort(k);
+  }
+
+  // if(batch_index == 0){
+  //   printf("top elemmments: %d, value %.15f\n", start_index,
+  //   heap.root().value);
+  // }
+}
+
+template <typename T>
+__device__ void mergeBeamShards(int num_shards,
+                                int batch_index,
+                                int k,
+                                int max_heap_size,
+                                int request_id,
+                                int *parent_id,
+                                float *probs,
+                                Entry<T> *__restrict__ entries,
+                                Entry<T> *__restrict__ top_k_heap,
+                                T *top_k_values,
+                                int *top_k_indices,
+                                int *top_k_parents) {
+  // If k < num_shards, we can use a min-heap with k elements to get the top k
+  // of the sorted blocks.
+  // If k > num_shards, we can initialize a min-heap with the top element from
+  // each sorted block.
+  int const heap_size = k < num_shards ? k : num_shards;
+  // printf("see value: %f", entries[0].value);
+  // Min-heap part.
+
+  {
+    auto min_heap = IndexedHeap<HeapType::kMinHeap,
+                                PreferIndices::kHigher,
+                                IndirectLinearData,
+                                T>{IndirectLinearData<T>{top_k_heap, entries}};
+    // Initialize the heap as a min-heap.
+    for (int slot = 0; slot < heap_size; slot++) {
+      // int beam = (slot % max_heap_size) / k;
+      float prob = probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+                         ((slot % max_heap_size) / k)];
+      min_heap.assign(slot, {slot, (entries[slot].value * prob)});
+      if (batch_index == 0) {
+        printf("slot %d, value %.15f, prob %15f\n",
+               slot,
+               entries[slot].value,
+               prob);
+      }
+    }
+    min_heap.build(heap_size);
+
+    // Now perform top k with the remaining shards (if num_shards > heap_size).
+    for (int shard = heap_size; shard < num_shards; shard++) {
+      auto const entry = entries[shard];
+      auto const root = min_heap.root();
+
+      float prob = probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+                         ((shard % max_heap_size) / k)];
+      if (batch_index == 0) {
+        printf("shard %d, index %d, value %.15f, prob %.15f\n",
+               shard,
+               entry.index,
+               entry.value,
+               prob);
+      }
+      if (entry.value * prob < root.value) {
+        continue;
+      }
+      if (entry.value * prob == root.value &&
+          entry.index > entries[root.index].index) {
+        continue;
+      }
+      // This element should replace the min.
+      min_heap.replace_root({shard, entry.value * prob}, heap_size);
+    }
+  }
+
+  // Max-part.
+  {
+    // Turn the min-heap into a max-heap in-place.
+    auto max_heap = IndexedHeap<HeapType::kMaxHeap,
+                                PreferIndices::kLower,
+                                IndirectLinearData,
+                                T>{IndirectLinearData<T>{top_k_heap, entries}};
+    // Heapify into a max heap.
+    max_heap.build(heap_size);
+
+    // Now extract the minimum k-1 times.
+    // k is treated specially.
+    int const last_k = k - 1;
+    for (int rank = 0; rank < last_k; rank++) {
+      Entry<T> const &max_element = max_heap.root();
+      top_k_values[rank] = max_element.value;
+      int shard_index = max_element.index;
+      top_k_indices[rank] = entries[shard_index].index;
+      top_k_parents[rank] =
+          parent_id[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+                    ((shard_index % max_heap_size) / k)];
+      int next_shard_index = shard_index + num_shards;
+
+      float prob = probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+                         ((next_shard_index % max_heap_size) / k)];
+      if (batch_index == 0) {
+        printf("next_shard_index %d, value %.15f, prob %.15f\n",
+               next_shard_index,
+               entries[next_shard_index].value,
+               prob);
+      }
+
+      max_heap.replace_root(
+          {next_shard_index, entries[next_shard_index].value * prob},
+          heap_size);
+    }
+
+    // rank == last_k.
+    Entry<T> const &max_element = max_heap.root();
+    top_k_values[last_k] = max_element.value;
+    int shard_index = max_element.index;
+    top_k_indices[last_k] = entries[shard_index].index;
+    top_k_parents[last_k] =
+        parent_id[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+                  ((shard_index % max_heap_size) / k)];
+  }
+}
+
+template <typename T>
+__global__ void
+    mergeSubRequestsKernel(int64_t N, T const *X, T const *rstd, T *Y) {
+  using T_ACC = T;
+  const int64_t i = blockIdx.x;
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
+    const int64_t index = i * N + j;
+    Y[index] = static_cast<T_ACC>(X[index]) * static_cast<T_ACC>(rstd[i]);
+  }
+}
+
+template <typename T>
+__global__ void beam_topk_forward_kernel(T const *__restrict__ input,
+                                         size_t shared_memory_size,
+                                         int length,
+                                         int k,
+                                         int max_heap_size,
+                                         int *parent_ids,
+                                         float *acc_probs,
+                                         int *gpu_block_start_index,
+                                         int *gpu_request_id,
+                                         int *tokens_per_request,
+                                         bool sorted,
+                                         T *__restrict__ output,
+                                         int *__restrict__ indices,
+                                         int *__restrict__ parents,
+                                         bool is_print) {
+  __shared__ char shared_memory[48 << 10];
+  int const batch_index = blockIdx.x;
+  // T const *batch_input = input + batch_index * length;
+  int const thread_index = threadIdx.x;
+  int const thread_count = blockDim.x;
+  int const request_id = gpu_request_id[batch_index];
+  int const token_nums = tokens_per_request[batch_index];
+  Entry<T> *shared_entries = (Entry<T> *)shared_memory;
+
+  int sub_request_id = thread_index / k;
+  // if (is_print) {
+  //   printf("beam kernel: batch_index: %d, thread_index %d, sub_request_id %d,
+  //   "
+  //          "request_id %d, token_nums %d\n",
+  //          batch_index,
+  //          thread_index,
+  //          sub_request_id,
+  //          request_id,
+  //          token_nums);
+  // }
+
+  T const *batch_input = input + gpu_block_start_index[batch_index] +
+                         (sub_request_id * token_nums * length);
+
+  if (batch_index == 0) {
+    printf("request 0 start index: thread index %d, offset %d, batch_input %p, "
+           "acc index %d acc "
+           "prob %f, thread_count %d, request_id %d\n",
+           thread_index,
+           gpu_block_start_index[batch_index] +
+               (sub_request_id * token_nums * length),
+           batch_input,
+           request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH + sub_request_id,
+           acc_probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+                     sub_request_id],
+           thread_count,
+           request_id);
+  }
+  // printf("thread index %d, thread_count %d, batch_index %d\n", thread_index,
+  // thread_count, batch_index);
+  heapBeamTopK<T, StridedData>(batch_input,
+                               batch_index,
+                               length,
+                               k,
+                               shared_entries,
+                               true,
+                               thread_index % k,
+                               k);
+  __syncthreads();
+  // printf("beam thread index %d, thread_count %d, thread index %d, batch_index
+  // "
+  //        "%d, k %d, parent_id %d, acc_prob: %f, sub id: %d, request_id: %d,
+  //        offset: %d, offset2 %d, sub_request_id %d\n", thread_index,
+  //        thread_count,
+  //        thread_index,
+  //        batch_index,
+  //        k,
+  //        parent_ids[request_id * BatchConfig::MAX_NUM_BEAMS +
+  //        sub_request_id], acc_probs[request_id * BatchConfig::MAX_NUM_BEAMS +
+  //        sub_request_id], sub_request_id, request_id,
+  //        gpu_block_start_index[batch_index],
+  //        batch_index * length,
+  //        sub_request_id);
+
+  if (thread_index == 0) {
+    // merge beam_width heaps and store the parent
+    // find which req it belongs to, replace the offset
+    printf("merge heaps, batch index: %d, sub_request_id %d, value %f\n",
+           batch_index,
+           sub_request_id,
+           acc_probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+                     sub_request_id]);
+    int const offset = batch_index * k;
+    auto batch_output = output + offset;
+    auto batch_indices = indices + offset;
+    auto batch_parents = parents + offset;
+    Entry<T> *top_k_heap = shared_entries + thread_count * k;
+
+    // if(batch_index == 0 && is_print){
+    //   for(int i = 0; i < 18; i++){
+    //       printf("see value: %.15f\n", shared_entries[i].value);
+    //   }
+    // }
+
+    // get parent/acc based on the sub request and main request
+    mergeBeamShards(thread_count,
+                    batch_index,
+                    k,
+                    max_heap_size,
+                    request_id,
+                    parent_ids,
+                    acc_probs,
+                    shared_entries,
+                    top_k_heap,
+                    batch_output,
+                    batch_indices,
+                    batch_parents);
+  }
+}
+
+/*static*/
+void BeamTopK::forward_kernel(BeamTopKMeta const *m,
+                              BeamSearchBatchConfig const *bc,
+                              float const *input_ptr,
+                              float *output_ptr,
+                              int *indices_ptr,
+                              int *parent_ptr,
+                              size_t batch_size,
+                              int length,
+                              bool sorted,
+                              cudaStream_t stream) {
+  // Adopted from TensorFlow's BeamTopK implementation
+  // https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/kernels/topk_op_gpu.h
+
+  int num_shards = 0;
+  int max_heap_size = 0;
+  int max_beam_width = 0;
+  int req_index = 0;
+
+  // sub request
+  int const *sub_requests = bc->sub_requests;
+
+  // std::vector<BatchConfig::BeamSlot> beam_slots = bc->beam_slots;
+  // assert(bc->beam_slots.size() > 0);
+
+  int beam_num_blocks = 0;
+  std::vector<int> beam_block_start_index;
+  std::vector<int> request_id;
+  std::vector<int> tokens_per_request;
+
+  int block_start_index = 0;
+  int depth =
+      bc->beamRequestsInfo[bc->tokensInfo[0].request_index].current_depth;
+
+  // a data structure for prob, parent_id,
+  int max_total_requests =
+      BeamSearchBatchConfig::MAX_BEAM_WIDTH * bc->num_active_requests();
+  int parent_ids[max_total_requests];
+  float acc_probs[max_total_requests];
+
+  for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    assert(bc->beamRequestsInfo[i].beam_size > 0);
+
+    // int num_new_tokens = bc->num_processing_tokens[i];
+    int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+
+    // get beam size;
+    int beam_size = bc->beamRequestsInfo[i].beam_size;
+
+    // initial request
+    std::cout << "sub_requests: " << i << ", " << sub_requests[i] << "\n";
+    assert(sub_requests[i] > 0);
+    // process sub requests
+    for (int j = 0; j < sub_requests[i]; j++) {
+      parent_ids[req_index * BeamSearchBatchConfig::MAX_BEAM_WIDTH + j] = j;
+      // beam_slots[i].parent_id[j];
+      acc_probs[req_index * BeamSearchBatchConfig::MAX_BEAM_WIDTH + j] =
+          bc->beamRequestsInfo[i].probs[j];
+      std::cout << "probbbb req: " << i << ", sub req probability : "
+                << bc->beamRequestsInfo[i].probs[j] << ", sub request id " << j
+                << ", parent id " << bc->beamRequestsInfo[i].parent_id[j]
+                << ", data inddd"
+                << req_index * BeamSearchBatchConfig::MAX_BEAM_WIDTH + j
+                << "\n";
+    }
+
+    // process tokens
+    for (int k = 0; k < num_new_tokens; k++) {
+      beam_block_start_index.push_back(block_start_index);
+      request_id.push_back(i);
+      tokens_per_request.push_back(num_new_tokens);
+      block_start_index += length;
+      beam_num_blocks++;
+    }
+
+    max_heap_size = std::max(max_heap_size, beam_size * sub_requests[i]);
+    max_beam_width = std::max(max_beam_width, beam_size);
+    req_index += 1;
+    block_start_index += (sub_requests[i] - 1) * num_new_tokens * length;
+  }
+  std::cout << "what index: " << block_start_index
+            << ", block num: " << beam_num_blocks << "\n";
+
+  assert(batch_size >= beam_num_blocks);
+  assert(bc->num_active_requests() == req_index);
+
+  {
+    constexpr auto shared_memory_size = 48 << 10;
+    auto const heap_size = max_heap_size * sizeof(Entry<float>);
+    // shared_memory_size = (num_shards + 1) * heap_size <=>
+    num_shards = shared_memory_size / heap_size - 1;
+    assert(num_shards > 0);
+    if (num_shards > CUDA_NUM_THREADS) {
+      num_shards = CUDA_NUM_THREADS;
+    }
+    std::cout << "maxheap size:  " << max_heap_size << "\n";
+    std::cout << "maxbeam width:  " << max_beam_width
+              << ", heap size: " << heap_size << "\n";
+  }
+  // We are limited by the amount of shared memory we have per block.
+  size_t shared_memory_size =
+      (num_shards + 1) * max_heap_size * sizeof(Entry<float>);
+
+  assert(num_shards >= (size_t)max_heap_size);
+  num_shards = max_heap_size;
+
+  // parent_id, per token
+  int *gpu_parents;
+  // acc_porbs, per token
+  float *gpu_probs;
+  // each block's start index;
+  // one block means the single token in different requests;
+  int *gpu_block_start_index;
+  int *gpu_request_id;
+  int *gpu_tokens_per_request;
+
+  checkCUDA(cudaMalloc(&gpu_parents, sizeof(int) * max_total_requests));
+  checkCUDA(cudaMalloc(&gpu_probs, sizeof(float) * max_total_requests));
+  checkCUDA(cudaMalloc(&gpu_block_start_index, sizeof(int) * beam_num_blocks));
+  checkCUDA(cudaMalloc(&gpu_request_id, sizeof(int) * beam_num_blocks));
+  checkCUDA(cudaMalloc(&gpu_tokens_per_request, sizeof(int) * beam_num_blocks));
+  checkCUDA(cudaMemcpy(gpu_parents,
+                       parent_ids,
+                       sizeof(int) * max_total_requests,
+                       cudaMemcpyHostToDevice));
+  checkCUDA(cudaMemcpy(gpu_probs,
+                       acc_probs,
+                       sizeof(float) * max_total_requests,
+                       cudaMemcpyHostToDevice));
+  checkCUDA(cudaMemcpy(gpu_block_start_index,
+                       beam_block_start_index.data(),
+                       sizeof(int) * beam_num_blocks,
+                       cudaMemcpyHostToDevice));
+  checkCUDA(cudaMemcpy(gpu_request_id,
+                       request_id.data(),
+                       sizeof(int) * beam_num_blocks,
+                       cudaMemcpyHostToDevice));
+  checkCUDA(cudaMemcpy(gpu_tokens_per_request,
+                       tokens_per_request.data(),
+                       sizeof(int) * beam_num_blocks,
+                       cudaMemcpyHostToDevice));
+
+  beam_topk_forward_kernel<<<beam_num_blocks, num_shards, 0, stream>>>(
+      input_ptr,
+      shared_memory_size,
+      length,
+      max_beam_width,
+      max_heap_size,
+      gpu_parents,
+      gpu_probs,
+      gpu_block_start_index,
+      gpu_request_id,
+      gpu_tokens_per_request,
+      sorted,
+      output_ptr,
+      indices_ptr,
+      parent_ptr,
+      depth == 1);
+
+  // merge sub
+}
+
+/*static*/
+void BeamTopK::forward_kernel_wrapper(BeamTopKMeta const *m,
+                                      BeamSearchBatchConfig const *bc,
+                                      float const *input_ptr,
+                                      float *output_ptr,
+                                      int *indices_ptr,
+                                      int *parent_ptr,
+                                      size_t batch_size,
+                                      int length,
+                                      bool sorted) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+
+  BeamTopK::forward_kernel(m,
+                           bc,
+                           input_ptr,
+                           output_ptr,
+                           indices_ptr,
+                           parent_ptr,
+                           batch_size,
+                           length,
+                           sorted,
+                           stream);
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[BeamTopK] forward time = %.2lfms\n", elapsed);
+  }
+  // if(bc->beam_slots.at(0).current_depth == 1){
+  //     print_beam_tensor<float>((float *)input_ptr, 50, 32000, 15, "beam topk
+  //     input"); print_tensor<float>((float *)output_ptr, 50, "beam topk
+  //     output");
+  // }
+}
+
+BeamTopKMeta::BeamTopKMeta(FFHandler handler) : OpMeta(handler) {}
+
+}; // namespace FlexFlow
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index d2af3fa8e1..e2e0e0bc82 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -727,4 +727,4 @@ IncMultiHeadSelfAttentionMeta::~IncMultiHeadSelfAttentionMeta(void) {
 #endif
 }
 
-}; // namespace FlexFlow
+}; // namespace FlexFlow
\ No newline at end of file
diff --git a/src/ops/kernels/softmax.cu b/src/ops/kernels/softmax.cu
index d83d9952c9..c9415a89a2 100644
--- a/src/ops/kernels/softmax.cu
+++ b/src/ops/kernels/softmax.cu
@@ -26,7 +26,8 @@ SoftmaxMeta::SoftmaxMeta(FFHandler handler,
                          Domain const &input_domain)
     : OpMeta(handler) {
   checkCUDNN(cudnnCreateTensorDescriptor(&inputTensor));
-  checkCUDNN(cudnnSetTensorDescriptorFromDomain(inputTensor, input_domain));
+  checkCUDNN(
+      cudnnSetTensorDescriptorFromDomain4SoftMax(inputTensor, input_domain));
   dim = softmax->dim;
   profiling = softmax->profiling;
   std::strcpy(op_name, softmax->name);
diff --git a/src/ops/spec_inc_multihead_self_attention.cc b/src/ops/spec_inc_multihead_self_attention.cc
new file mode 100644
index 0000000000..e365082002
--- /dev/null
+++ b/src/ops/spec_inc_multihead_self_attention.cc
@@ -0,0 +1,670 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/spec_inc_multihead_self_attention.h"
+#include "flexflow/model.h"
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+#include "flexflow/utils/cuda_helper.h"
+#else
+#include "flexflow/utils/hip_helper.h"
+#endif
+#include "flexflow/utils/hash_utils.h"
+#include "legion/legion_utilities.h"
+#ifdef INFERENCE_TESTS
+#include <torch/torch.h>
+using namespace at::indexing;
+#endif
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::ArgumentMap;
+using Legion::Context;
+using Legion::coord_t;
+using Legion::Domain;
+using Legion::FutureMap;
+using Legion::IndexLauncher;
+using Legion::Machine;
+using Legion::Memory;
+using Legion::PhysicalRegion;
+using Legion::Predicate;
+using Legion::Rect;
+using Legion::RegionRequirement;
+using Legion::Runtime;
+using Legion::Task;
+using Legion::TaskArgument;
+using Legion::TaskLauncher;
+using PCG::Node;
+
+bool SpecIncMultiHeadSelfAttentionParams::is_valid(
+    ParallelTensorShape const &input) const {
+  bool is_valid = input.is_valid();
+  return is_valid;
+}
+
+Tensor
+    FFModel::spec_inc_multihead_self_attention(const Tensor input,
+                                               int embed_dim,
+                                               int num_heads,
+                                               int kdim,
+                                               int vdim,
+                                               float dropout,
+                                               bool bias,
+                                               bool add_bias_kv,
+                                               bool add_zero_attn,
+                                               Initializer *kernel_initializer,
+                                               bool apply_rotary_embedding,
+                                               char const *name) {
+  // Currently assume that
+  Layer *li = new Layer(this,
+                        OP_SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION,
+                        DT_FLOAT,
+                        name,
+                        1 /*inputs*/,
+                        1 /*weights*/,
+                        1 /*outputs*/,
+                        input);
+  {
+    int numdims = input->num_dims;
+    int dims[MAX_TENSOR_DIM];
+    for (int i = 0; i < numdims; i++) {
+      dims[i] = input->dims[i];
+    }
+    dims[0] = embed_dim;
+    li->outputs[0] = create_tensor_legion_ordering(
+        numdims, dims, DT_FLOAT, li, 0, true /*create_grad*/);
+  }
+  {
+    // Compute weight size
+    int qProjSize = kdim, kProjSize = kdim, vProjSize = kdim,
+        oProjSize = embed_dim;
+    int qSize = input->dims[0], kSize = input->dims[0], vSize = input->dims[0];
+    int qParas = qProjSize * qSize;
+    int kParas = kProjSize * kSize;
+    int vParas = vProjSize * vSize;
+    int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
+    int dims[2] = {qParas + kParas + vParas + oParas, num_heads};
+    li->weights[0] = create_weight_legion_ordering(2,
+                                                   dims,
+                                                   DT_FLOAT,
+                                                   li,
+                                                   true /*create_grad*/,
+                                                   kernel_initializer,
+                                                   CHOSEN_SYNC_TYPE);
+  }
+  li->data_type = DT_FLOAT;
+  li->add_int_property("embed_dim", embed_dim);
+  li->add_int_property("num_heads", num_heads);
+  li->add_int_property("kdim", kdim);
+  li->add_int_property("vdim", vdim);
+  li->add_int_property("bias", bias);
+  li->add_int_property("add_bias_kv", add_bias_kv);
+  li->add_int_property("add_zero_attn", add_zero_attn);
+  li->add_float_property("dropout", dropout);
+  li->add_int_property("apply_rotary_embedding", apply_rotary_embedding);
+  layers.push_back(li);
+  return li->outputs[0];
+}
+
+Op *SpecIncMultiHeadSelfAttention::create_operator_from_layer(
+    FFModel &model,
+    Layer const *layer,
+    std::vector<ParallelTensor> const &inputs) {
+
+  std::cout << "spec create operator: " << layer->name << "\n";
+  long long value;
+  layer->get_int_property("embed_dim", value);
+  int embed_dim = value;
+  layer->get_int_property("num_heads", value);
+  int num_heads = value;
+  layer->get_int_property("kdim", value);
+  int kdim = value;
+  layer->get_int_property("vdim", value);
+  int vdim = value;
+  float dropout;
+  layer->get_float_property("dropout", dropout);
+  layer->get_int_property("bias", value);
+  bool bias = (bool)value;
+  layer->get_int_property("add_bias_kv", value);
+  bool add_bias_kv = (bool)value;
+  layer->get_int_property("add_zero_attn", value);
+  bool add_zero_attn = (bool)value;
+  layer->get_int_property("apply_rotary_embedding", value);
+  bool apply_rotary_embedding = (bool)value;
+  return new SpecIncMultiHeadSelfAttention(model,
+                                           layer->layer_guid,
+                                           inputs[0],
+                                           embed_dim,
+                                           num_heads,
+                                           kdim,
+                                           vdim,
+                                           dropout,
+                                           bias,
+                                           add_bias_kv,
+                                           add_zero_attn,
+                                           apply_rotary_embedding,
+                                           false /*allocate_weights*/,
+                                           layer->name);
+}
+
+SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
+    FFModel &model,
+    LayerID const &_layer_guid,
+    const ParallelTensor _input,
+    int _embed_dim,
+    int _num_heads,
+    int _kdim,
+    int _vdim,
+    float _dropout,
+    bool _bias,
+    bool _add_bias_kv,
+    bool _add_zero_attn,
+    bool _apply_rotary_embedding,
+    bool allocate_weights,
+    char const *name)
+    // Initializer* _bias_initializer)
+    : Op(model,
+         OP_SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION,
+         DT_FLOAT,
+         name,
+         1 /*inputs*/,
+         1 /*weights*/,
+         1 /*outputs*/,
+         _input),
+      num_heads(_num_heads), dropout(_dropout), bias(_bias),
+      add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      apply_rotary_embedding(_apply_rotary_embedding),
+      qSize(_input->dims[0].size), kSize(_input->dims[0].size),
+      vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
+      vProjSize(_vdim), oProjSize(_embed_dim),
+      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size) {
+  // overwrite layer_guid
+  layer_guid = _layer_guid;
+
+  numOutputs = 1;
+  int numdim = _input->num_dims;
+  ParallelDim dims[MAX_TENSOR_DIM];
+  for (int i = 0; i < numdim; i++) {
+    dims[i] = _input->dims[i];
+  }
+  dims[0].size = _embed_dim;
+  // Currently require no parallelism along this dim
+  assert(dims[0].degree == 1);
+  if (allocate_weights) {
+    // Create weight tensor
+    int num_dims = inputs[0]->num_dims;
+    // Compute weight size
+    int qParas = this->qProjSize * this->qSize;
+    int kParas = this->kProjSize * this->kSize;
+    int vParas = this->vProjSize * this->vSize;
+    int oParas =
+        this->oProjSize * (this->vProjSize > 0 ? this->vProjSize : this->vSize);
+    ParallelDim dims[3];
+    dims[0] = inputs[0]->dims[num_dims - 2];
+    dims[0].size = dims[0].degree;
+    dims[1] = inputs[0]->dims[num_dims - 1];
+    dims[1].size = this->num_heads;
+    dims[2].size = qParas + kParas + vParas + oParas;
+    dims[2].degree = 1;
+    dims[2].parallel_idx = -1;
+    int seed = std::rand();
+    Initializer *initializer = new GlorotUniform(seed);
+#ifdef USE_NCCL
+    ParameterSyncType comm_type = ParameterSyncType::NCCL;
+#else
+    ParameterSyncType comm_type = ParameterSyncType::PS;
+#endif
+    weights[0] = model.create_parallel_weight<3>(dims,
+                                                 DT_FLOAT,
+                                                 NULL /*owner_op*/,
+                                                 true /*create_grad*/,
+                                                 initializer,
+                                                 comm_type);
+  }
+
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      _input->num_dims, dims, DT_FLOAT, this);
+  /* for (int i = 0; i < numdim; i++) { */
+  /*   register_output_input_parallel_dims(outputs[0], i, inputs[0], i); */
+  /* } */
+  /* // Check correctness */
+  /* assert(check_output_input_weight_parallel_dims()); */
+}
+
+SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
+    FFModel &model,
+    const ParallelTensor _input,
+    const ParallelTensor _weight,
+    int _embed_dim,
+    int _num_heads,
+    int _kdim,
+    int _vdim,
+    float _dropout,
+    bool _bias,
+    bool _add_bias_kv,
+    bool _add_zero_attn,
+    bool _apply_rotary_embedding,
+    bool allocate_weights,
+    char const *name)
+    // Initializer* _bias_initializer)
+    : Op(model,
+         OP_SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION,
+         DT_FLOAT,
+         name,
+         1 /*inputs*/,
+         1 /*weights*/,
+         1 /*outputs*/,
+         _input,
+         _weight),
+      num_heads(_num_heads), dropout(_dropout), bias(_bias),
+      add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      apply_rotary_embedding(_apply_rotary_embedding),
+      qSize(_input->dims[0].size), kSize(_input->dims[0].size),
+      vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
+      vProjSize(_vdim), oProjSize(_embed_dim),
+      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size)
+// bias_initializer(_bias_initializer)
+{
+  numOutputs = 1;
+  int numdim = _input->num_dims;
+  ParallelDim dims[MAX_TENSOR_DIM];
+  for (int i = 0; i < numdim; i++) {
+    dims[i] = _input->dims[i];
+  }
+  dims[0].size = _embed_dim;
+  // Currently require no parallelism along this dim
+  assert(dims[0].degree == 1);
+  if (allocate_weights) {
+    // Create weight tensor
+    int num_dims = inputs[0]->num_dims;
+    // Compute weight size
+    int qParas = this->qProjSize * this->qSize;
+    int kParas = this->kProjSize * this->kSize;
+    int vParas = this->vProjSize * this->vSize;
+    int oParas =
+        this->oProjSize * (this->vProjSize > 0 ? this->vProjSize : this->vSize);
+    ParallelDim dims[3];
+    dims[0] = inputs[0]->dims[num_dims - 2];
+    dims[0].size = dims[0].degree;
+    dims[1] = inputs[0]->dims[num_dims - 1];
+    dims[1].size = this->num_heads;
+    dims[2].size = qParas + kParas + vParas + oParas;
+    int seed = std::rand();
+    Initializer *initializer = new GlorotUniform(seed);
+#ifdef USE_NCCL
+    ParameterSyncType comm_type = ParameterSyncType::NCCL;
+#else
+    ParameterSyncType comm_type = ParameterSyncType::PS;
+#endif
+    weights[0] = model.create_parallel_weight<3>(dims,
+                                                 DT_FLOAT,
+                                                 NULL /*owner_op*/,
+                                                 true /*create_grad*/,
+                                                 initializer,
+                                                 comm_type);
+  }
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      _input->num_dims, dims, DT_FLOAT, this);
+
+  /* for (int i = 0; i < numdim; i++) { */
+  /*   register_output_input_parallel_dims(outputs[0], i, inputs[0], i); */
+  /* } */
+  /* register_output_weight_parallel_dims(outputs[0], numdim-1, _weight, 1); */
+  /* register_output_weight_parallel_dims(outputs[0], numdim-2, _weight, 2); */
+  // Check correctness
+  /* assert(check_output_input_weight_parallel_dims()); */
+}
+
+SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
+    FFModel &model,
+    SpecIncMultiHeadSelfAttention const &other,
+    const ParallelTensor input,
+    bool allocate_weights)
+    : SpecIncMultiHeadSelfAttention(model,
+                                    other.layer_guid,
+                                    input,
+                                    other.oProjSize,
+                                    other.num_heads,
+                                    other.qProjSize,
+                                    other.vProjSize,
+                                    other.dropout,
+                                    other.bias,
+                                    other.add_bias_kv,
+                                    other.add_zero_attn,
+                                    other.apply_rotary_embedding,
+                                    allocate_weights,
+                                    other.name) {}
+
+SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
+    FFModel &model,
+    SpecIncMultiHeadSelfAttentionParams const &params,
+    ParallelTensor const &input,
+    bool allocate_weights,
+    char const *name)
+    : SpecIncMultiHeadSelfAttention(model,
+                                    params.layer_guid,
+                                    input,
+                                    params.embed_dim,
+                                    params.num_heads,
+                                    params.kdim,
+                                    params.vdim,
+                                    params.dropout,
+                                    params.bias,
+                                    params.add_bias_kv,
+                                    params.add_zero_attn,
+                                    params.apply_rotary_embedding,
+                                    allocate_weights,
+                                    name) {}
+
+void SpecIncMultiHeadSelfAttention::init_inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher launcher(
+      SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
+      parallel_is,
+      TaskArgument(this, sizeof(SpecIncMultiHeadSelfAttention)),
+      argmap,
+      Predicate::TRUE_PRED,
+      false /*must*/,
+      0 /*mapper_id*/,
+      machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
+}
+
+void SpecIncMultiHeadSelfAttention::init(FFModel const &ff) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(
+      SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
+      parallel_is,
+      TaskArgument(this, sizeof(SpecIncMultiHeadSelfAttention)),
+      argmap,
+      Predicate::TRUE_PRED,
+      false /*must*/,
+      0 /*mapper_id*/,
+      outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
+/*
+  regions[0](I): input
+  regions[1](I): weight
+  regions[2](O): output
+*/
+OpMeta *SpecIncMultiHeadSelfAttention::init_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  SpecIncMultiHeadSelfAttention const *attn =
+      (SpecIncMultiHeadSelfAttention *)task->args;
+  FFHandler handle = *((FFHandler const *)task->local_args);
+
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      DT_FLOAT, regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
+      DT_FLOAT, regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      DT_FLOAT, regions[2], task->regions[2], FID_DATA, ctx, runtime);
+
+  int num_samples = input.domain.hi()[2] - input.domain.lo()[2] + 1;
+  assert(attn->qoSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
+  assert(attn->kvSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
+  int num_heads = weight.domain.hi()[1] - weight.domain.lo()[1] + 1;
+  assert(attn->oProjSize == output.domain.hi()[0] - output.domain.lo()[0] + 1);
+
+  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                       .only_kind(Memory::GPU_FB_MEM)
+                       .best_affinity_to(task->target_proc)
+                       .first();
+  SpecIncMultiHeadSelfAttentionMeta *m = new SpecIncMultiHeadSelfAttentionMeta(
+      handle, attn, weight.get_float_ptr(), gpu_mem, num_samples, num_heads);
+  m->profiling = attn->profiling;
+  assert(weight.domain.get_volume() * sizeof(float) == m->weightSize);
+  return m;
+}
+
+void SpecIncMultiHeadSelfAttention::forward(FFModel const &ff) {
+  // SpecIncMultiHeadSelfAttention doesn't support forward
+  assert(false);
+}
+
+FutureMap SpecIncMultiHeadSelfAttention::inference(
+    FFModel const &ff,
+    BatchConfig const &bc,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+  int idx = 0;
+  IndexLauncher launcher(
+      SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
+      parallel_is,
+      TaskArgument(
+          &bc, std::max(sizeof(BatchConfig), sizeof(BeamSearchBatchConfig))),
+      argmap,
+      Predicate::TRUE_PRED,
+      false /*must*/,
+      0 /*mapper_id*/,
+      machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(idx++, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(idx++, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(idx++, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+/*
+  regions[0](I): input
+  regions[3](I): weight
+  regions[4](O): output
+*/
+void SpecIncMultiHeadSelfAttention::inference_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  assert(regions.size() == 3);
+  assert(task->regions.size() == regions.size());
+
+  BeamSearchBatchConfig const *bc = (BeamSearchBatchConfig *)task->args;
+  SpecIncMultiHeadSelfAttentionMeta const *m =
+      *((SpecIncMultiHeadSelfAttentionMeta **)task->local_args);
+
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
+      m->weight_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+
+  Domain input_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  Domain weight_domain = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+  Domain output_domain = runtime->get_index_space_domain(
+      ctx, task->regions[2].region.get_index_space());
+
+  assert(input_domain.get_dim() == 4);
+  assert(weight_domain.get_dim() == 3);
+  assert(output_domain.get_dim() == 4);
+
+  /* print_tensor<float>(input.get_float_ptr(),
+                      input_domain.get_volume(),
+                      "[Attention:forward:query]"); */
+  SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
+      m,
+      bc,
+      input.get_float_ptr(),
+      weight.get_float_ptr(),
+      output.get_float_ptr());
+
+  // print_tensor<float>(input.get_float_ptr(), 20, "attention input");
+  // print_tensor<float>(output.get_float_ptr(), 20, "attention output");
+  // if(bc->beam_slots.at(0).current_depth == 1){
+  //     print_beam_tensor<float>(input.get_float_ptr(), 50, 4096, 40, "mha topk
+  //     input"); print_beam_tensor<float>(output.get_float_ptr(), 50, 4096, 40,
+  //     "mha topk output");
+  // }
+}
+
+void SpecIncMultiHeadSelfAttention::backward(FFModel const &ff) {
+  // SpecIncMultiHeadSelfAttention does not support backward
+  assert(false);
+}
+
+bool SpecIncMultiHeadSelfAttention::get_int_parameter(PMParameter para,
+                                                      int *value) const {
+  switch (para) {
+    case PM_NUM_HEADS:
+      *value = num_heads;
+      return true;
+    default:
+      return Op::get_int_parameter(para, value);
+  }
+}
+
+Op *SpecIncMultiHeadSelfAttention::materialize(FFModel &ff,
+                                               ParallelTensor inputs[],
+                                               int num_inputs) const {
+  SpecIncMultiHeadSelfAttentionParams params = get_params();
+  return new SpecIncMultiHeadSelfAttention(
+      ff, params, inputs[0], true, this->name);
+}
+
+bool SpecIncMultiHeadSelfAttention::measure_operator_cost(
+    Simulator *sim, MachineView const &mv, CostMetrics &cost_metrics) const {
+  return false;
+}
+
+bool operator==(SpecIncMultiHeadSelfAttentionParams const &lhs,
+                SpecIncMultiHeadSelfAttentionParams const &rhs) {
+  return lhs.layer_guid == rhs.layer_guid && lhs.embed_dim == rhs.embed_dim &&
+         lhs.num_heads == rhs.num_heads && lhs.kdim == rhs.kdim &&
+         lhs.vdim == rhs.vdim && lhs.dropout == rhs.dropout &&
+         lhs.bias == rhs.bias && lhs.add_bias_kv == rhs.add_bias_kv &&
+         lhs.add_zero_attn == rhs.add_zero_attn &&
+         lhs.apply_rotary_embedding == rhs.apply_rotary_embedding;
+}
+
+SpecIncMultiHeadSelfAttentionParams
+    SpecIncMultiHeadSelfAttention::get_params() const {
+  SpecIncMultiHeadSelfAttentionParams params;
+  params.layer_guid = this->layer_guid;
+  params.embed_dim = this->oProjSize;
+  params.num_heads = this->num_heads;
+  params.kdim = this->kProjSize;
+  params.vdim = this->vProjSize;
+  params.dropout = this->dropout;
+  params.bias = this->bias;
+  params.add_bias_kv = this->add_bias_kv;
+  params.add_zero_attn = this->add_zero_attn;
+  params.apply_rotary_embedding = this->apply_rotary_embedding;
+  return params;
+}
+
+}; // namespace FlexFlow
+
+namespace std {
+size_t hash<FlexFlow::SpecIncMultiHeadSelfAttentionParams>::operator()(
+    FlexFlow::SpecIncMultiHeadSelfAttentionParams const &params) const {
+  size_t key = 0;
+  hash_combine(key, params.layer_guid.id);
+  hash_combine(key, params.embed_dim);
+  hash_combine(key, params.num_heads);
+  hash_combine(key, params.kdim);
+  hash_combine(key, params.vdim);
+  hash_combine(key, params.dropout);
+  hash_combine(key, params.bias);
+  hash_combine(key, params.add_bias_kv);
+  hash_combine(key, params.add_zero_attn);
+  hash_combine(key, params.apply_rotary_embedding);
+  return key;
+}
+}; // namespace std
diff --git a/src/ops/spec_inc_multihead_self_attention.cpp b/src/ops/spec_inc_multihead_self_attention.cpp
new file mode 100644
index 0000000000..00335d82fa
--- /dev/null
+++ b/src/ops/spec_inc_multihead_self_attention.cpp
@@ -0,0 +1,74 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/spec_inc_multihead_self_attention.h"
+#include "flexflow/utils/hip_helper.h"
+#include <hip/hip_runtime.h>
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::coord_t;
+using Legion::Memory;
+
+/*static*/
+void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
+    SpecIncMultiHeadSelfAttentionMeta const *m,
+    BeamSearchBatchConfig const *bc,
+    float const *input_ptr,
+    float const *weight_ptr,
+    float *output_ptr) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    hipEventCreate(&t_start);
+    hipEventCreate(&t_end);
+    hipEventRecord(t_start, stream);
+  }
+
+  handle_unimplemented_hip_kernel(OP_INC_MULTIHEAD_SELF_ATTENTION);
+
+  if (m->profiling) {
+    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    hipEventDestroy(t_start);
+    hipEventDestroy(t_end);
+    printf("SpecIncMultiHeadSelfAttention forward time = %.2fms\n", elapsed);
+    // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
+    // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
+    // acc_output.rect, "[Attention:forward:output]");
+  }
+}
+
+SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
+    FFHandler handler,
+    SpecIncMultiHeadSelfAttention const *attn,
+    float const *weight_ptr,
+    Memory gpu_mem,
+    int num_samples,
+    int _num_heads)
+    : OpMeta(handler, attn) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  checkCUDNN(miopenSetStream(handler.dnn, stream));
+}
+
+SpecIncMultiHeadSelfAttentionMeta::~SpecIncMultiHeadSelfAttentionMeta(void) {}
+
+}; // namespace FlexFlow
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
new file mode 100644
index 0000000000..5c2a90e538
--- /dev/null
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -0,0 +1,904 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+#include "cuComplex.h"
+#endif
+#include "flexflow/ops/spec_inc_multihead_self_attention.h"
+#include "flexflow/utils/cuda_helper.h"
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::coord_t;
+using Legion::Memory;
+
+__global__ void spec_build_w_out_tensor(float const *weight_ptr,
+                                        float *contiguous_weight_ptr,
+                                        int vProjSize,
+                                        int oProjSize,
+                                        int num_heads,
+                                        int qkv_weight_block_size) {
+  CUDA_KERNEL_LOOP(i, vProjSize * oProjSize * num_heads) {
+    int v_idx = i % vProjSize;
+    int o_idx = (i / vProjSize) % oProjSize;
+    int head_idx = i / (vProjSize * oProjSize);
+    contiguous_weight_ptr[i] =
+        weight_ptr[head_idx * (qkv_weight_block_size + vProjSize * oProjSize) +
+                   qkv_weight_block_size + o_idx * vProjSize + v_idx];
+  }
+}
+
+__global__ void
+    spec_apply_rotary_embedding(float *input_ptr,
+                                cuFloatComplex *complex_input,
+                                BatchConfig::PerTokenInfo *tokenInfos,
+                                int qProjSize,
+                                int kProjSize,
+                                int num_heads,
+                                int num_tokens,
+                                int q_block_size,
+                                int k_block_size,
+                                int v_block_size,
+                                bool q_tensor) {
+  int proj_size = q_tensor ? qProjSize : kProjSize;
+  CUDA_KERNEL_LOOP(i, num_tokens * proj_size * num_heads / 2) {
+    // create complex number
+    int head_idx = i / (num_tokens * proj_size / 2);
+    int idx = i % (num_tokens * proj_size / 2);
+    int real_part_index =
+        idx * 2 + head_idx * (q_block_size + k_block_size + v_block_size) +
+        (q_tensor ? 0 : q_block_size);
+    int complex_part_index = real_part_index + 1;
+
+    complex_input[i] = {input_ptr[real_part_index],
+                        input_ptr[complex_part_index]};
+
+    // get the freq_cis: shape 1 * (qProjSize/2) = 1 * 64
+    // apply a Cartesian coordinate transformation
+    // multiple with input & /copy back to q/k
+
+    // get position of token
+    //  int head_idx = i / (num_tokens * proj_size);
+    int token_idx =
+        (i - head_idx * (num_tokens * proj_size / 2)) / (proj_size / 2);
+
+    // float before_real = complex_input[i].x, before_complex =
+    // complex_input[i].y;
+
+    size_t pos = tokenInfos[token_idx].abs_depth_in_request;
+    int pos_i = i % (proj_size / 2);
+
+    float freq = pos * (1.0 / pow(10000.0, (float)2 * pos_i / proj_size));
+    cuFloatComplex complex_pos = {cos(freq), sin(freq)};
+
+    complex_input[i] = cuCmulf(complex_input[i], complex_pos);
+    input_ptr[real_part_index] = complex_input[i].x;
+    input_ptr[real_part_index + 1] = complex_input[i].y;
+
+    // if (i % 64 == 1 && head_idx == 0) {
+    //   printf("head id: %d, tokenid: %d, pospospos:->  %d, before real part
+    //   %f, "
+    //          "before complex part: %f, real part: %f,"
+    //          "complext part: %f,  freq_cis real: %f, freq_cis commplexx
+    //          %f\n", head_idx, token_idx, pos, before_real, before_complex,
+    //          complex_input[i].x,
+    //          complex_input[i].y,
+    //          complex_pos.x,
+    //          complex_pos.y);
+    // }
+  }
+}
+
+void inference_kernel1(SpecIncMultiHeadSelfAttentionMeta const *m,
+                       BeamSearchBatchConfig const *bc,
+                       float const *input_ptr,
+                       float const *weight_ptr,
+                       float *output_ptr,
+                       cudaStream_t stream) {
+
+  checkCUDA(cublasSetStream(m->handle.blas, stream));
+  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
+  float alpha = 1.0f, beta = 0.0f;
+  assert(m->qSize == m->vSize && m->qSize == m->kSize);
+  cudaDataType_t data_type = ff_to_cuda_datatype(DT_FLOAT);
+#if CUDA_VERSION >= 11000
+  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
+  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+#else
+  cudaDataType_t compute_type = CUDA_R_32F;
+#endif
+  // Compute (W^T)x matmul: einsum(ijkl,im->jmkl)
+  // Weights: qSize x qProjSize x 3 x num_heads
+  // Input: qSize x num_tokens
+  // Output >>> qProjSize x num_tokens x 3 x num_heads
+  int m_q = m->qProjSize;
+  int m_k = m->kProjSize;
+  int m_v = m->vProjSize;
+  assert(m_q == m_k && m_k == m_v); // keep things simple for now
+  int n = bc->num_active_tokens();
+  int k = m->qSize;
+  int lda = k, ldb = k, ldc_q = m_q, ldc_k = m_k, ldc_v = m_v;
+  size_t strideA =
+      m->weights_params; // need to also skip over all the parameters for each
+                         // head, plus the unused W_o weights
+  size_t strideB = 0;    // input stays the same for all heads.
+  size_t strideC =
+      (m_q + m_k + m_v) * n; // size of the output block for each head.
+  // Q
+  checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                       CUBLAS_OP_T,
+                                       CUBLAS_OP_N,
+                                       m_q,
+                                       n,
+                                       k,
+                                       &alpha,
+                                       weight_ptr,
+                                       data_type,
+                                       lda,
+                                       strideA,
+                                       input_ptr,
+                                       data_type,
+                                       ldb,
+                                       strideB,
+                                       &beta,
+                                       output_ptr,
+                                       data_type,
+                                       ldc_q,
+                                       strideC,
+                                       m->num_heads,
+                                       compute_type,
+                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
+  checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                       CUBLAS_OP_T,
+                                       CUBLAS_OP_N,
+                                       m_k,
+                                       n,
+                                       k,
+                                       &alpha,
+                                       weight_ptr + m_q * k,
+                                       data_type,
+                                       lda,
+                                       strideA,
+                                       input_ptr,
+                                       data_type,
+                                       ldb,
+                                       strideB,
+                                       &beta,
+                                       output_ptr + m_q * n,
+                                       data_type,
+                                       ldc_k,
+                                       strideC,
+                                       m->num_heads,
+                                       compute_type,
+                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+  // V
+  checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                       CUBLAS_OP_T,
+                                       CUBLAS_OP_N,
+                                       m_v,
+                                       n,
+                                       k,
+                                       &alpha,
+                                       weight_ptr + (m_q + m_k) * k,
+                                       data_type,
+                                       lda,
+                                       strideA,
+                                       input_ptr,
+                                       data_type,
+                                       ldb,
+                                       strideB,
+                                       &beta,
+                                       output_ptr + (m_q + m_k) * n,
+                                       data_type,
+                                       ldc_v,
+                                       strideC,
+                                       m->num_heads,
+                                       compute_type,
+                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
+  // apply rotary emmmbedding for k and v
+  // step1 change the k, v to complex tensor
+  int num_tokens = bc->num_active_tokens();
+
+  int parallelism = m->kProjSize * num_tokens * m->num_heads;
+  int q_block_size = m->qProjSize * num_tokens;
+  int k_block_size = m->kProjSize * num_tokens;
+  int v_block_size = m->vProjSize * num_tokens;
+  cuFloatComplex *complex_input;
+
+  // todo xinhao remember to set token index for each beam
+
+  if (*m->apply_rotary_embedding) {
+    checkCUDA(cudaMalloc(&complex_input,
+                         num_tokens * m->qProjSize * m->num_heads *
+                             sizeof(cuFloatComplex *) / 2));
+    /*q*/
+    spec_apply_rotary_embedding<<<GET_BLOCKS(parallelism),
+                                  min(CUDA_NUM_THREADS, parallelism),
+                                  0,
+                                  stream>>>(output_ptr,
+                                            complex_input,
+                                            m->tokenInfos,
+                                            m->qProjSize,
+                                            m->kProjSize,
+                                            m->num_heads,
+                                            num_tokens,
+                                            q_block_size,
+                                            k_block_size,
+                                            v_block_size,
+                                            true);
+    /*k*/
+    spec_apply_rotary_embedding<<<GET_BLOCKS(parallelism),
+                                  min(CUDA_NUM_THREADS, parallelism),
+                                  0,
+                                  stream>>>(output_ptr,
+                                            complex_input,
+                                            m->tokenInfos,
+                                            m->qProjSize,
+                                            m->kProjSize,
+                                            m->num_heads,
+                                            num_tokens,
+                                            q_block_size,
+                                            k_block_size,
+                                            v_block_size,
+                                            false);
+  }
+  checkCUDA(cudaDeviceSynchronize());
+}
+
+__global__ void spec_store_kv_cache(
+    float const *devQKVProjArray,
+    float *cache_ptr,
+    BatchConfig::PerTokenInfo *tokenInfos,
+    BatchConfig::PerRequestInfo *requestInfo,
+    BeamSearchBatchConfig::BeamSearchPerTokenInfo *beamTokenInfos,
+    BeamSearchBatchConfig::BeamSearchPerRequestInfo *beamRequestInfos,
+    int qProjSize,
+    int kProjSize,
+    int vProjSize,
+    int num_tokens,
+    int num_heads,
+    int max_seq_len,
+    int max_beam_width,
+    bool k_cache,
+    bool is_root) {
+  CUDA_KERNEL_LOOP(i,
+                   num_tokens * (k_cache ? kProjSize : vProjSize) * num_heads) {
+    int proj_size = k_cache ? kProjSize : vProjSize;
+    int head_idx = i / (num_tokens * proj_size);
+    int token_idx = (i - head_idx * (num_tokens * proj_size)) / proj_size;
+    int data_idx = i % proj_size;
+
+    int qkv_block_size = (qProjSize + kProjSize + vProjSize) * num_tokens;
+    int current_head_block_size =
+        num_tokens * (k_cache ? qProjSize : qProjSize + kProjSize);
+    float val =
+        devQKVProjArray[head_idx * qkv_block_size + current_head_block_size +
+                        token_idx * proj_size + data_idx];
+
+    // above no need to be changed
+    // int const req_id = id_map[token_idx].request_index;
+    // int const tok_id = id_map[token_idx].token_position;
+    // int const sub_req_id = id_map[token_idx].sub_request_index;
+    // int const parent_id = id_map[token_idx].parent_id;
+    // int const beam_depth = id_map[token_idx].beam_depth;
+    // int const beam_width = id_map[token_idx].beam_width;
+
+    int const req_id = tokenInfos[token_idx].request_index;
+    int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
+    int const sub_req_id = beamTokenInfos[token_idx].sub_request_index;
+    int const parent_id = beamRequestInfos[req_id].parent_id[sub_req_id];
+    int const beam_depth = beamRequestInfos[req_id].current_depth;
+    int const beam_width = beamRequestInfos[req_id].beam_size;
+
+    // new token
+    int new_token_cache_idx = (req_id * max_beam_width + sub_req_id) *
+                                  (num_heads * max_seq_len * proj_size) +
+                              head_idx * (max_seq_len * proj_size) +
+                              tok_id * proj_size + data_idx;
+    cache_ptr[new_token_cache_idx] = val;
+
+    // replica in the root iteration
+    if (beam_depth == 1) {
+      for (int i = 1; i < beam_width; i++) {
+        cache_ptr[(req_id * max_beam_width + i) *
+                      (num_heads * max_seq_len * proj_size) +
+                  head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
+                  data_idx] = val;
+      }
+    }
+
+    // if (head_idx == 0 && beam_depth == 0 && token_idx == 8 && k_cache) {
+    //   // printf("token idx %d\n", token_idx);
+    //   printf("data idx: %d, tok_id %d, new_token_cache_idx %d, parent_id %d,
+    //   "
+    //          "sub_req_id %d, num_tokens %d, kProjSize %d, num_heads %d, val "
+    //          "%f, beam_width %d\n",
+    //          data_idx,
+    //          tok_id,
+    //          new_token_cache_idx,
+    //          parent_id,
+    //          sub_req_id,
+    //          num_tokens,
+    //          kProjSize,
+    //          num_heads,
+    //          val,
+    //          beam_width);
+    // }
+
+    // naive cache stealing
+    if (sub_req_id != parent_id) {
+      if (data_idx == 0 && head_idx == 0 && k_cache) {
+        printf("cache stealing!, depth %d req_id %d sub_req_id %d, parentid "
+               "%d, tok_id %d\n",
+               beam_depth,
+               req_id,
+               sub_req_id,
+               parent_id,
+               tok_id);
+      }
+
+      for (int depth = 0; depth < beam_depth; depth++) {
+        int steal_token_idx = tok_id - beam_depth + depth;
+        int steal_from_idx = (req_id * max_beam_width + parent_id) *
+                                 (num_heads * max_seq_len * proj_size) +
+                             head_idx * (max_seq_len * proj_size) +
+                             steal_token_idx * proj_size + data_idx;
+        int steal_to_idx = (req_id * max_beam_width + sub_req_id) *
+                               (num_heads * max_seq_len * proj_size) +
+                           head_idx * (max_seq_len * proj_size) +
+                           steal_token_idx * proj_size + data_idx;
+        cache_ptr[steal_to_idx] = cache_ptr[steal_from_idx];
+
+        //   if(data_idx == 0 && head_idx == 0 && k_cache && req_id == 1){
+        //     printf("cache stealing kernel!, steal_token_idx %d\n",
+        //     steal_token_idx);
+        // }
+      }
+    }
+
+    // parallel cache stealing not yet implemented
+    // logic shld be
+    // launch spec_store_kv_cache with parallelism * current depth
+    // from the i here, get depth index
+    // if depth index not the current one, check if we need to steal
+    // steal if needed
+
+    // cache stealing theory
+    // identify which sub request does this token come from
+    // for initial token, 0
+    // for other, may 0,0,1/ 0,1,2/ 1,1,1 to get which cache to be reuse and
+    // which to be delete copy beam_size bunch of blocks when sub_req_id ==
+    // parent_id : like 0 -> 0, 1->1, 2->2, do nothing, just append the new k/v
+  }
+}
+
+void inference_kernel2(SpecIncMultiHeadSelfAttentionMeta const *m,
+                       BeamSearchBatchConfig const *bc,
+                       cudaStream_t stream) {
+  int num_tokens = bc->num_active_tokens();
+  int curr_depth = bc->beamRequestsInfo[0].current_depth;
+  printf("curr depth: %d\n", curr_depth);
+  // assert(curr_depth < 3);
+  if (num_tokens > 0) {
+    int parallelism = m->kProjSize * num_tokens * m->num_heads;
+    spec_store_kv_cache<<<GET_BLOCKS(parallelism),
+                          min(CUDA_NUM_THREADS, parallelism),
+                          0,
+                          stream>>>(m->devQKVProjArray,
+                                    m->keyCache,
+                                    m->tokenInfos,
+                                    m->requestInfos,
+                                    m->beamTokenInfos,
+                                    m->beamRequestInfos,
+                                    m->qProjSize,
+                                    m->kProjSize,
+                                    m->vProjSize,
+                                    num_tokens,
+                                    m->num_heads,
+                                    MAX_SEQ_LEN,
+                                    BeamSearchBatchConfig::MAX_BEAM_WIDTH,
+                                    /* k_cache = */ true,
+                                    /*root*/ curr_depth == 0);
+
+    parallelism = m->vProjSize * num_tokens * m->num_heads;
+    spec_store_kv_cache<<<GET_BLOCKS(parallelism),
+                          min(CUDA_NUM_THREADS, parallelism),
+                          0,
+                          stream>>>(m->devQKVProjArray,
+                                    m->valueCache,
+                                    m->tokenInfos,
+                                    m->requestInfos,
+                                    m->beamTokenInfos,
+                                    m->beamRequestInfos,
+                                    m->qProjSize,
+                                    m->kProjSize,
+                                    m->vProjSize,
+                                    num_tokens,
+                                    m->num_heads,
+                                    MAX_SEQ_LEN,
+                                    BeamSearchBatchConfig::MAX_BEAM_WIDTH,
+                                    /* k_cache = */ false,
+                                    /*root*/ curr_depth == 0);
+  }
+}
+
+__global__ void spec_fill_entries_above_diagonal(float *matrix,
+                                                 size_t num_rows,
+                                                 size_t num_cols,
+                                                 size_t num_heads,
+                                                 size_t entries_above_diagonal,
+                                                 float value) {
+  CUDA_KERNEL_LOOP(i, entries_above_diagonal * num_heads) {
+    size_t head_idx = i / entries_above_diagonal;
+    size_t entry_idx = i % entries_above_diagonal;
+    size_t y = (-1 + sqrt(8 * (float)entry_idx + 1)) / 2;
+    size_t x = entry_idx - y * (y + 1) / 2;
+    y += (num_cols - num_rows) + 1;
+    matrix[head_idx * num_rows * num_cols + num_cols * y + x] = value;
+  }
+}
+
+void inference_kernel3(SpecIncMultiHeadSelfAttentionMeta const *m,
+                       BeamSearchBatchConfig const *bc,
+                       float *output_ptr,
+                       cudaStream_t stream) {
+  checkCUDA(cublasSetStream(m->handle.blas, stream));
+  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
+  cudaDataType_t cublas_data_type = ff_to_cuda_datatype(DT_FLOAT);
+#if CUDA_VERSION >= 11000
+  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
+  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+#else
+  cudaDataType_t compute_type = CUDA_R_32F;
+#endif
+  // int num_requests = bc->num_active_requests();
+  int num_tokens = bc->num_active_tokens();
+  int tokens_previous_requests = 0;
+  int tokens_prev_requests_squares = 0;
+  int qkv_block_size =
+      (m->qProjSize + m->kProjSize + m->vProjSize) * num_tokens;
+  int kt_block_size = m->kProjSize * MAX_SEQ_LEN;
+  int kt_req_block_size = kt_block_size * m->num_heads;
+  int vt_block_size = m->vProjSize * MAX_SEQ_LEN;
+  int vt_req_block_size = vt_block_size * m->num_heads;
+  assert(m->qProjSize == m->kProjSize);
+
+  for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    for (int sub_req_id = 0; sub_req_id < bc->sub_requests[i]; sub_req_id++) {
+
+      // int num_new_tokens = bc->num_processing_tokens[i];
+      // int total_tokens = bc->token_last_available_idx[i] + 1;
+
+      int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+      int total_tokens = bc->requestsInfo[i].token_start_offset +
+                         bc->requestsInfo[i].num_tokens_in_batch;
+      // Compute (QK^T/sqrt(d_k))
+      int m_ = num_new_tokens;
+      int n = total_tokens;
+      int k = m->qProjSize;
+      int lda = k, ldb = k, ldc = m_;
+      int strideA = qkv_block_size;
+      int strideB = kt_block_size;
+      int strideC = num_new_tokens * total_tokens;
+
+      float alpha = 1.0f / (float)sqrt(m->kProjSize), beta = 0.0f;
+      // To get A, skip over Q entries from previous requests (same head)
+      void const *A = (void const *)(m->devQKVProjArray +
+                                     tokens_previous_requests * m->qProjSize);
+      // To get B, skip over K entries from previous requests (all heads +
+      // padding)
+      void const *B =
+          (void const *)(m->keyCache + (i * bc->MAX_BEAM_WIDTH + sub_req_id) *
+                                           kt_req_block_size);
+
+      // if (i == 0 && sub_req_id == 0 &&
+      //     bc->beam_slots.at(0).current_depth == 1) {
+      //   int offset = (float *)B - m->keyCache;
+      //   printf("key cache offset %d\n", kt_req_block_size);
+      // }
+      // To get C, skip over QK^T products from previous requests
+      void *C =
+          (void *)(m->qk_prods + m->num_heads * tokens_prev_requests_squares);
+
+      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                           CUBLAS_OP_T,
+                                           CUBLAS_OP_N,
+                                           m_,
+                                           n,
+                                           k,
+                                           &alpha,
+                                           A,
+                                           cublas_data_type,
+                                           lda,
+                                           strideA,
+                                           B,
+                                           cublas_data_type,
+                                           ldb,
+                                           strideB,
+                                           &beta,
+                                           C,
+                                           cublas_data_type,
+                                           ldc,
+                                           strideC,
+                                           m->num_heads,
+                                           compute_type,
+                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+      // Fill all elements above diagonal in qk prods with -inf to force
+      // causal attention.
+      assert(num_new_tokens <= total_tokens);
+      size_t entries_above_diagonal = num_new_tokens * (num_new_tokens - 1) / 2;
+      if (entries_above_diagonal > 0) {
+        size_t parallelism = m->num_heads * entries_above_diagonal;
+        spec_fill_entries_above_diagonal<<<GET_BLOCKS(parallelism),
+                                           min((size_t)CUDA_NUM_THREADS,
+                                               parallelism),
+                                           0,
+                                           stream>>>((float *)C,
+                                                     num_new_tokens,
+                                                     total_tokens,
+                                                     m->num_heads,
+                                                     entries_above_diagonal,
+                                                     -INFINITY);
+      }
+      // Compute Softmax(QK^T/sqrt(d_k))
+      cudnnTensorDescriptor_t qk_tensor;
+      checkCUDNN(cudnnCreateTensorDescriptor(&qk_tensor));
+      // Before modifying the parameters below, make sure to read the following
+      // description of the CUDNN_TENSOR_NCHW tensor layout, from
+      // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#cudnnTensorFormat_t:
+      // This tensor format specifies that the data is laid out in the following
+      // order: batch size, feature maps, rows, columns. The strides are
+      // implicitly defined in such a way that the data are contiguous in memory
+      // with no padding between images, feature maps, rows, and columns; the
+      // columns are the inner dimension and the images are the outermost
+      // dimension.
+      int n_param = m->num_heads;
+      int c_param = total_tokens;
+      int h_param = 1;
+      int w_param = num_new_tokens;
+      checkCUDNN(cudnnSetTensor4dDescriptor(qk_tensor,
+                                            CUDNN_TENSOR_NCHW,
+                                            CUDNN_DATA_FLOAT,
+                                            n_param,
+                                            c_param,
+                                            h_param,
+                                            w_param));
+      alpha = 1.0f, beta = 0.0f;
+      void *C_softmax = (void *)(m->qk_prods_softmax +
+                                 m->num_heads * tokens_prev_requests_squares);
+      // The softmax operation below is executed according to the
+      // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
+      // softmax operation is computed per spatial location (H,W) per image (N)
+      // across dimension C.
+      checkCUDNN(cudnnSoftmaxForward(m->handle.dnn,
+                                     CUDNN_SOFTMAX_ACCURATE,
+                                     CUDNN_SOFTMAX_MODE_CHANNEL,
+                                     &alpha,
+                                     qk_tensor,
+                                     (void *)((float *)C),
+                                     &beta,
+                                     qk_tensor,
+                                     (void *)((float *)C_softmax)));
+      // Matmul softmax(QK^T/sqrt(d_k)) by V
+      alpha = 1.0f, beta = 0.0f;
+      m_ = num_new_tokens;
+      n = m->vProjSize;
+      k = total_tokens;
+      lda = m_, ldb = n, ldc = m_;
+      strideA = num_new_tokens * total_tokens;
+      strideB = vt_block_size;
+      strideC = num_new_tokens * m->vProjSize;
+      // To get A, skip over softmax(QK^T/sqrt(d_k)) entries from previous
+      // requests (all heads)
+      A = (void const *)C_softmax;
+      // To get B, skip over V^T entries from previous requests (all heads +
+      // padding)
+      B = (void const *)(m->valueCache + (i * bc->MAX_BEAM_WIDTH + sub_req_id) *
+                                             vt_req_block_size);
+      // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
+      // requests
+      C = (void *)(m->attn_heads +
+                   tokens_previous_requests * m->num_heads * m->vProjSize);
+
+      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                           CUBLAS_OP_N,
+                                           CUBLAS_OP_T,
+                                           m_,
+                                           n,
+                                           k,
+                                           &alpha,
+                                           A,
+                                           cublas_data_type,
+                                           lda,
+                                           strideA,
+                                           B,
+                                           cublas_data_type,
+                                           ldb,
+                                           strideB,
+                                           &beta,
+                                           C,
+                                           cublas_data_type,
+                                           ldc,
+                                           strideC,
+                                           m->num_heads,
+                                           compute_type,
+                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+      // Project to output, save result directly on output tensor
+      alpha = 1.0f, beta = 0.0f;
+      m_ = m->oProjSize;
+      k = m->vProjSize * m->num_heads;
+      n = num_new_tokens;
+      lda = k, ldb = n, ldc = m_;
+      A = (void const *)m->W_out_contiguous;
+      B = (void const *)C;
+      C = (void *)(output_ptr + tokens_previous_requests * m->oProjSize);
+
+      checkCUDA(cublasGemmEx(m->handle.blas,
+                             CUBLAS_OP_T,
+                             CUBLAS_OP_T,
+                             m_,
+                             n,
+                             k,
+                             &alpha,
+                             A,
+                             cublas_data_type,
+                             lda,
+                             B,
+                             cublas_data_type,
+                             ldb,
+                             &beta,
+                             C,
+                             cublas_data_type,
+                             ldc,
+                             compute_type,
+                             CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+      tokens_previous_requests += num_new_tokens;
+      tokens_prev_requests_squares += num_new_tokens * total_tokens;
+    }
+  }
+
+  assert(tokens_previous_requests == num_tokens);
+}
+
+/*static*/
+void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
+    SpecIncMultiHeadSelfAttentionMeta const *m,
+    BeamSearchBatchConfig const *bc,
+    float const *input_ptr,
+    float const *weight_ptr,
+    float *output_ptr) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+
+  // reload the weight_o
+
+  if (!(*m->has_load_weights)) {
+    int parallelism = m->vProjSize * m->oProjSize * m->num_heads;
+    spec_build_w_out_tensor<<<GET_BLOCKS(parallelism),
+                              min(CUDA_NUM_THREADS, parallelism),
+                              0,
+                              stream>>>(weight_ptr,
+                                        m->W_out_contiguous,
+                                        m->vProjSize,
+                                        m->oProjSize,
+                                        m->num_heads,
+                                        (m->qSize * m->qProjSize +
+                                         m->kSize * m->kProjSize +
+                                         m->vSize * m->vProjSize));
+    *m->has_load_weights = true;
+  }
+
+  // here because we need postion info in infernece 1
+  cudaMemcpyAsync(m->tokenInfos,
+                  &(bc->tokensInfo),
+                  bc->MAX_NUM_TOKENS * bc->MAX_BEAM_WIDTH *
+                      sizeof(BatchConfig::PerTokenInfo),
+                  cudaMemcpyHostToDevice,
+                  stream);
+  cudaMemcpyAsync(m->requestInfos,
+                  &(bc->requestsInfo),
+                  bc->MAX_NUM_REQUESTS * sizeof(BatchConfig::PerRequestInfo),
+                  cudaMemcpyHostToDevice,
+                  stream);
+  cudaMemcpyAsync(m->beamTokenInfos,
+                  &(bc->beamTokenInfo),
+                  bc->MAX_NUM_TOKENS * bc->MAX_BEAM_WIDTH *
+                      sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo),
+                  cudaMemcpyHostToDevice,
+                  stream);
+  cudaMemcpyAsync(m->beamRequestInfos,
+                  &(bc->beamRequestsInfo),
+                  bc->MAX_NUM_REQUESTS *
+                      sizeof(BeamSearchBatchConfig::BeamSearchPerRequestInfo),
+                  cudaMemcpyHostToDevice,
+                  stream);
+  // phase 1: Implement kernel to compute KQV for input tokens
+  inference_kernel1(m, bc, input_ptr, weight_ptr, m->devQKVProjArray, stream);
+  // phase 2: Update key/val cache
+  inference_kernel2(m, bc, stream);
+
+  // phase 3: Compute attention score
+  // 3 kernels for pahse 3: matmul1 - softmax - matmal2
+  inference_kernel3(m, bc, output_ptr, stream);
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("SpecIncMultiHeadSelfAttention forward time = %.2fms\n", elapsed);
+    // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
+    // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
+    // acc_output.rect, "[Attention:forward:output]");
+  }
+}
+
+SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
+    FFHandler handler,
+    SpecIncMultiHeadSelfAttention const *attn,
+    float const *weight_ptr,
+    Memory gpu_mem,
+    int num_samples,
+    int _num_heads)
+    : OpMeta(handler, attn) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  checkCUDNN(cudnnSetStream(handler.dnn, stream));
+
+  qSize = attn->qSize;
+  kSize = attn->kSize;
+  vSize = attn->vSize;
+  // assume dimensions match for now
+  assert(qSize == kSize);
+  assert(kSize == vSize);
+  qProjSize = attn->qProjSize;
+  kProjSize = attn->kProjSize;
+  assert(qProjSize == kProjSize); // required for attention QK^T matmul
+  vProjSize = attn->vProjSize;
+  oProjSize = attn->oProjSize;
+
+  // print params;
+
+  num_heads = _num_heads;
+  weights_params = (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize +
+                    oProjSize * (vProjSize > 0 ? vProjSize : vSize));
+  weightSize = weights_params * num_heads * sizeof(float);
+  has_load_weights = (bool *)calloc(1, sizeof(bool));
+  *has_load_weights = false;
+  apply_rotary_embedding = (bool *)calloc(1, sizeof(bool));
+  *apply_rotary_embedding = attn->apply_rotary_embedding;
+  // Currently do not support adding bias to key/value projection
+  assert(!attn->add_bias_kv);
+
+#ifdef INFERENCE_TESTS
+  kcache = (float *)calloc(kProjSize * MAX_SEQ_LEN * num_heads *
+                               BeamSearchBatchConfig::MAX_NUM_REQUESTS,
+                           sizeof(float));
+  vcache = (float *)calloc(vProjSize * MAX_SEQ_LEN * num_heads *
+                               BeamSearchBatchConfig::MAX_NUM_REQUESTS,
+                           sizeof(float));
+#endif
+
+  // allocate memory for the seqArray and reserve space
+  {
+    size_t qkv_proj_dim = qProjSize + kProjSize + vProjSize;
+    size_t qkv_max_proj_size =
+        BeamSearchBatchConfig::MAX_NUM_TOKENS * qkv_proj_dim * num_heads;
+    size_t key_cache_size = num_heads * kProjSize *
+                            BeamSearchBatchConfig::MAX_NUM_REQUESTS *
+                            MAX_SEQ_LEN * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+    size_t value_cache_size =
+        num_heads * vProjSize * BeamSearchBatchConfig::MAX_NUM_REQUESTS *
+        MAX_SEQ_LEN * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+
+    // size_t token2ids_size = BatchConfig::MAX_NUM_TOKENS;
+    size_t tokeninfo_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
+                            BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+
+    size_t beam_tokeninfo_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
+                                 BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+
+    size_t requestinfo_size = BeamSearchBatchConfig::MAX_NUM_REQUESTS;
+    size_t beam_requestinfo_size = BeamSearchBatchConfig::MAX_NUM_REQUESTS;
+
+    size_t qk_prod_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
+                          BeamSearchBatchConfig::MAX_NUM_TOKENS * num_heads;
+    size_t attn_heads_size =
+        BeamSearchBatchConfig::MAX_NUM_TOKENS * num_heads * vProjSize;
+    size_t W_out_block_size = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
+    size_t W_out_contiguous_size = W_out_block_size * num_heads;
+    size_t totalSize =
+        (qkv_max_proj_size + key_cache_size + value_cache_size +
+         2 * qk_prod_size + attn_heads_size + W_out_contiguous_size) *
+            sizeof(float) +
+        tokeninfo_size * sizeof(BatchConfig::PerTokenInfo) +
+        requestinfo_size * sizeof(BatchConfig::PerRequestInfo) +
+        beam_tokeninfo_size *
+            sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo) +
+        beam_requestinfo_size *
+            sizeof(BeamSearchBatchConfig::
+                       BeamSearchPerRequestInfo); // more components will
+                                                  // be added here later
+
+    Realm::Rect<1, coord_t> bounds(Realm::Point<1, coord_t>(0),
+                                   Realm::Point<1, coord_t>(totalSize - 1));
+    std::vector<size_t> field_sizes;
+    field_sizes.push_back(sizeof(char));
+    Realm::RegionInstance::create_instance(reserveInst,
+                                           gpu_mem,
+                                           bounds,
+                                           field_sizes,
+                                           0,
+                                           Realm::ProfilingRequestSet())
+        .wait();
+    devQKVProjArray = (float *)reserveInst.pointer_untyped(0, sizeof(char));
+    keyCache = (float *)devQKVProjArray + qkv_max_proj_size;
+    valueCache = (float *)keyCache + key_cache_size;
+    // dev_token2ids = (BatchConfig::token_idxs *)(valueCache +
+    // value_cache_size);
+
+    tokenInfos = (BatchConfig::PerTokenInfo *)(valueCache + value_cache_size);
+    beamTokenInfos =
+        (BeamSearchBatchConfig::BeamSearchPerTokenInfo *)(tokenInfos +
+                                                          tokeninfo_size);
+    requestInfos =
+        (BatchConfig::PerRequestInfo *)(beamTokenInfos + beam_tokeninfo_size);
+    beamRequestInfos =
+        (BeamSearchBatchConfig::BeamSearchPerRequestInfo *)(requestInfos +
+                                                            requestinfo_size);
+
+    qk_prods = (float *)(beamRequestInfos + beam_requestinfo_size);
+    qk_prods_softmax = (float *)(qk_prods + qk_prod_size);
+    attn_heads = (float *)qk_prods_softmax + qk_prod_size;
+    W_out_contiguous = (float *)attn_heads + attn_heads_size;
+    int parallelism = vProjSize * oProjSize * num_heads;
+    spec_build_w_out_tensor<<<GET_BLOCKS(parallelism),
+                              min(CUDA_NUM_THREADS, parallelism),
+                              0,
+                              stream>>>(
+        weight_ptr,
+        W_out_contiguous,
+        vProjSize,
+        oProjSize,
+        num_heads,
+        (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize));
+  }
+
+  cudaStreamSynchronize(stream);
+}
+
+SpecIncMultiHeadSelfAttentionMeta::~SpecIncMultiHeadSelfAttentionMeta(void) {
+  reserveInst.destroy();
+#ifdef INFERENCE_TESTS
+  free(kcache);
+  free(vcache);
+#endif
+}
+
+}; // namespace FlexFlow
diff --git a/src/runtime/beam_search_batch_config.cc b/src/runtime/beam_search_batch_config.cc
new file mode 100644
index 0000000000..0bb5084d83
--- /dev/null
+++ b/src/runtime/beam_search_batch_config.cc
@@ -0,0 +1,88 @@
+/* Copyright 2023 CMU, Stanford, Facebook, LANL
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/batch_config.h"
+#include "legion.h"
+#include <cassert>
+#include <climits>
+
+#define DEFAULT_BEAM_WIDTH 1
+#define DEFAULT_TARGET_ITERATIONS 3
+
+namespace FlexFlow {
+
+LegionRuntime::Logger::Category log_beam_bc("BeamSearchBatchConfig");
+
+BeamSearchBatchConfig::BeamSearchBatchConfig() : BatchConfig() {
+  this->beam_width = DEFAULT_BEAM_WIDTH;
+  this->target_iterations = DEFAULT_TARGET_ITERATIONS;
+  current_iteration = 0;
+}
+
+BeamSearchBatchConfig::BeamSearchBatchConfig(size_t beam_width,
+                                             size_t target_iterations)
+    : BatchConfig() {
+  this->beam_width = beam_width;
+  this->target_iterations = target_iterations;
+  current_iteration = 0;
+}
+
+BeamSearchBatchConfig::~BeamSearchBatchConfig() {}
+
+bool BeamSearchBatchConfig::done() const {
+  assert(current_iteration <= target_iterations);
+  return current_iteration == target_iterations;
+}
+
+void BeamSearchBatchConfig::print() const {
+  std::cout << "Max number of requests: " << MAX_NUM_REQUESTS << std::endl;
+  std::cout << "Max number of tokens: " << MAX_NUM_TOKENS << std::endl;
+  std::cout << "Number of tokens: " << num_tokens << std::endl;
+  std::cout << "Number of requests: " << num_active_requests() << std::endl;
+  std::cout << "Beam width: " << beam_width << std::endl;
+  std::cout << "Target Iterations" << target_iterations << std::endl;
+  std::cout << "Current Iterations" << current_iteration << std::endl;
+
+  std::cout << "Per-request info:\n";
+  for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
+    if (!request_completed[i]) {
+      std::cout << "  Request " << i << ":\n";
+      std::cout << "    Token start offset: "
+                << requestsInfo[i].token_start_offset << std::endl;
+      std::cout << "    Number of tokens in batch: "
+                << requestsInfo[i].num_tokens_in_batch << std::endl;
+      std::cout << "    GUID: " << requestsInfo[i].request_guid << std::endl;
+      std::cout << "    Max sequence length: "
+                << requestsInfo[i].max_sequence_length << std::endl;
+      std::cout << "    Request completed: " << request_completed[i]
+                << std::endl;
+    }
+  }
+
+  std::cout << "Per-token info:\n";
+  for (int i = 0; i < num_tokens; i++) {
+    std::cout << "  Token " << i << ":\n";
+    std::cout << "    Absolute depth in request: "
+              << tokensInfo[i].abs_depth_in_request << std::endl;
+    std::cout << "    Request index: " << tokensInfo[i].request_index
+              << std::endl;
+    std::cout << "    Token id: " << tokensInfo[i].token_id << std::endl;
+    // std::cout << "    Parent token id: " << tokensInfo[i].parent_token_id <<
+    // std::endl; std::cout << "    Accumulated log prob: "
+    //           << tokensInfo[i].cum_log_prob << std::endl;
+  }
+}
+
+}; // namespace FlexFlow
\ No newline at end of file
diff --git a/src/runtime/cuda_helper.cu b/src/runtime/cuda_helper.cu
index 7dc0adeb38..2fcf0e096a 100644
--- a/src/runtime/cuda_helper.cu
+++ b/src/runtime/cuda_helper.cu
@@ -224,7 +224,7 @@ __host__ void
   printf("%s", prefix);
   for (idx = 0; idx < num_elements; idx++) {
     printf(" %.20lf", (float)host_ptr[idx]);
-    if (idx >= 50) {
+    if (idx >= 100) {
       break;
     }
   }
@@ -232,6 +232,37 @@ __host__ void
   checkCUDA(cudaFreeHost(host_ptr));
 }
 
+template <typename T>
+__host__ void print_beam_tensor(T const *ptr,
+                                size_t num_elements,
+                                int skip,
+                                int channel,
+                                char const *prefix) {
+  // device synchronize to make sure the data are ready
+  // checkCUDA(cudaDeviceSynchronize());
+  T *host_ptr;
+  checkCUDA(cudaHostAlloc(&host_ptr,
+                          sizeof(T) * channel * skip,
+                          cudaHostAllocPortable | cudaHostAllocMapped));
+  checkCUDA(cudaMemcpy(
+      host_ptr, ptr, sizeof(T) * channel * skip, cudaMemcpyDeviceToHost));
+  // checkCUDA(cudaDeviceSynchronize());
+  int idx = 0;
+  printf("%s", prefix);
+
+  for (int i = 0; i < channel; i += 1) {
+    for (idx = 0; idx < num_elements; idx++) {
+      printf(" %.20lf", (float)host_ptr[idx + i * skip]);
+      if (idx >= 100) {
+        break;
+      }
+    }
+    printf("\n-----***********------\n");
+  }
+
+  checkCUDA(cudaFreeHost(host_ptr));
+}
+
 template <typename T>
 __host__ void
     save_tensor(T const *ptr, size_t num_elements, char const *file_name) {
@@ -279,6 +310,56 @@ __host__ bool download_tensor(T const *ptr, T *dst, size_t num_elements) {
   // checkCUDA(cudaDeviceSynchronize());
   return true;
 }
+cudnnStatus_t
+    cudnnSetTensorDescriptorFromDomain4SoftMax(cudnnTensorDescriptor_t tensor,
+                                               Domain domain) {
+  int dims[MAX_TENSOR_DIM];
+  switch (domain.get_dim()) {
+    case 1: {
+      Rect<1> rect = domain;
+      dims[0] = rect.hi[0] - rect.lo[0] + 1;
+      return cudnnSetTensor4dDescriptor(
+          tensor, CUDNN_TENSOR_NCHW, CUDNN_DATA_FLOAT, dims[0], 1, 1, 1);
+    }
+    case 2: {
+      Rect<2> rect = domain;
+      dims[0] = rect.hi[0] - rect.lo[0] + 1;
+      dims[1] = rect.hi[1] - rect.lo[1] + 1;
+      return cudnnSetTensor4dDescriptor(
+          tensor, CUDNN_TENSOR_NCHW, CUDNN_DATA_FLOAT, dims[1], dims[0], 1, 1);
+    }
+    case 3: {
+      Rect<3> rect = domain;
+      dims[0] = rect.hi[0] - rect.lo[0] + 1;
+      dims[1] = rect.hi[1] - rect.lo[1] + 1;
+      dims[2] = rect.hi[2] - rect.lo[2] + 1;
+      return cudnnSetTensor4dDescriptor(tensor,
+                                        CUDNN_TENSOR_NCHW,
+                                        CUDNN_DATA_FLOAT,
+                                        dims[2] * dims[1],
+                                        dims[0],
+                                        1,
+                                        1);
+    }
+    case 4: {
+      Rect<4> rect = domain;
+      dims[0] = rect.hi[0] - rect.lo[0] + 1;
+      dims[1] = rect.hi[1] - rect.lo[1] + 1;
+      dims[2] = rect.hi[2] - rect.lo[2] + 1;
+      dims[3] = rect.hi[3] - rect.lo[3] + 1;
+      return cudnnSetTensor4dDescriptor(tensor,
+                                        CUDNN_TENSOR_NCHW,
+                                        CUDNN_DATA_FLOAT,
+                                        dims[3] * dims[2] * dims[1],
+                                        dims[0],
+                                        1,
+                                        1);
+    }
+    default:
+      assert(false && "Unsupported dim number");
+  }
+  return CUDNN_STATUS_BAD_PARAM;
+}
 
 cudnnStatus_t cudnnSetTensorDescriptorFromDomain(cudnnTensorDescriptor_t tensor,
                                                  Domain domain) {
@@ -464,6 +545,22 @@ template __host__ void
 template __host__ void
     print_tensor<int64_t>(int64_t const *ptr, size_t rect, char const *prefix);
 
+template __host__ void print_beam_tensor<float>(float const *ptr,
+                                                size_t num_elements,
+                                                int skip,
+                                                int channel,
+                                                char const *prefix);
+template __host__ void print_beam_tensor<int32_t>(int32_t const *ptr,
+                                                  size_t num_elements,
+                                                  int skip,
+                                                  int channel,
+                                                  char const *prefix);
+template __host__ void print_beam_tensor<int64_t>(int64_t const *ptr,
+                                                  size_t num_elements,
+                                                  int skip,
+                                                  int channel,
+                                                  char const *prefix);
+
 template __host__ void
     save_tensor<float>(float const *ptr, size_t rect, char const *file_name);
 template __host__ void save_tensor<int64_t>(int64_t const *ptr,
diff --git a/src/runtime/ffconst_utils.cc b/src/runtime/ffconst_utils.cc
index 01b116c853..8c2096b694 100644
--- a/src/runtime/ffconst_utils.cc
+++ b/src/runtime/ffconst_utils.cc
@@ -115,6 +115,8 @@ std::string get_operator_type_name(OperatorType type) {
       return "TopK";
     case OP_ARG_TOPK:
       return "ArgTopK";
+    case OP_BEAM_TOPK:
+      return "BeamTopK";
     case OP_WHERE:
       return "Where";
     case OP_CEIL:
@@ -147,6 +149,8 @@ std::string get_operator_type_name(OperatorType type) {
       return "MultiHeadAttention";
     case OP_INC_MULTIHEAD_SELF_ATTENTION:
       return "IncMultiHeadSelfAttention";
+    case OP_SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION:
+      return "SpeculativeIncMultiHeadSelfAttention";
     case OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY:
       return "IncMultiHeadSelfAttentionVerify";
     case OP_INPUT:
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index 64ced31579..81fa9e4595 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -19,6 +19,7 @@
 #include "flexflow/ops/arg_topk.h"
 #include "flexflow/ops/attention.h"
 #include "flexflow/ops/batch_matmul.h"
+#include "flexflow/ops/beam_topk.h"
 #include "flexflow/ops/cast.h"
 #include "flexflow/ops/concat.h"
 #include "flexflow/ops/conv_2d.h"
@@ -40,6 +41,7 @@
 #include "flexflow/ops/reshape.h"
 #include "flexflow/ops/rms_norm.h"
 #include "flexflow/ops/softmax.h"
+#include "flexflow/ops/spec_inc_multihead_self_attention.h"
 #include "flexflow/ops/split.h"
 #include "flexflow/ops/topk.h"
 #include "flexflow/ops/transpose.h"
@@ -2275,6 +2277,21 @@ GraphOptimalViewSerialized
         sez.serialize(attn->apply_rotary_embedding);
         break;
       }
+      case OP_SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION: {
+        SpecIncMultiHeadSelfAttention *attn =
+            (SpecIncMultiHeadSelfAttention *)op;
+        sez.serialize(attn->layer_guid.id);
+        sez.serialize(attn->oProjSize);
+        sez.serialize(attn->num_heads);
+        sez.serialize(attn->qProjSize);
+        sez.serialize(attn->vProjSize);
+        sez.serialize(attn->dropout);
+        sez.serialize(attn->bias);
+        sez.serialize(attn->add_bias_kv);
+        sez.serialize(attn->add_zero_attn);
+        sez.serialize(attn->apply_rotary_embedding);
+        break;
+      }
       case OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY: {
         IncMultiHeadSelfAttentionVerify *attn =
             (IncMultiHeadSelfAttentionVerify *)op;
@@ -2681,6 +2698,39 @@ void FFModel::deserialize_graph_optimal_view(
         node = get_or_create_node<IncMultiHeadSelfAttention>(inputs[0], params);
         break;
       }
+      case OP_SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION: {
+        assert(num_inputs == 1);
+        int embed_dim, num_heads, k_dim, v_dim;
+        float dropout;
+        bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding;
+        size_t id;
+        dez.deserialize(id);
+        LayerID layer_guid(id);
+        dez.deserialize(embed_dim);
+        dez.deserialize(num_heads);
+        dez.deserialize(k_dim);
+        dez.deserialize(v_dim);
+        dez.deserialize(dropout);
+        dez.deserialize(bias);
+        dez.deserialize(add_bias_kv);
+        dez.deserialize(add_zero_attn);
+        dez.deserialize(apply_rotary_embedding);
+
+        SpecIncMultiHeadSelfAttentionParams params;
+        params.embed_dim = embed_dim;
+        params.num_heads = num_heads;
+        params.kdim = k_dim;
+        params.vdim = v_dim;
+        params.dropout = dropout;
+        params.bias = bias;
+        params.add_bias_kv = add_bias_kv;
+        params.add_zero_attn = add_zero_attn;
+        params.layer_guid = layer_guid;
+        params.apply_rotary_embedding = apply_rotary_embedding;
+        node = get_or_create_node<SpecIncMultiHeadSelfAttention>(inputs[0],
+                                                                 params);
+        break;
+      }
       case OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY: {
         assert(num_inputs == 1);
         int embed_dim, num_heads, k_dim, v_dim;
@@ -2722,6 +2772,10 @@ void FFModel::deserialize_graph_optimal_view(
         node = ArgTopK::deserialize(*this, dez, inputs, num_inputs);
         break;
       }
+      case OP_BEAM_TOPK: {
+        node = BeamTopK::deserialize(*this, dez, inputs, num_inputs);
+        break;
+      }
       case OP_GROUP_BY: {
         node = Group_by::deserialize(*this, dez, inputs, num_inputs);
         break;
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index a7da765391..e9fe33f22e 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -250,14 +250,16 @@ void InferenceManager::load_input_tokens_from_batch_config(
   Runtime *runtime = model->config.lg_hlr;
   size_t machine_view_hash = input->machine_view.hash();
   ArgumentMap argmap;
-  IndexLauncher launcher(RM_LOAD_TOKENS_TASK_ID,
-                         input->parallel_is,
-                         TaskArgument(&bc, sizeof(BatchConfig)),
-                         argmap,
-                         Predicate::TRUE_PRED,
-                         false /*must*/,
-                         0 /*mapper_id*/,
-                         machine_view_hash);
+  IndexLauncher launcher(
+      RM_LOAD_TOKENS_TASK_ID,
+      input->parallel_is,
+      TaskArgument(
+          &bc, std::max(sizeof(BeamSearchBatchConfig), sizeof(BatchConfig))),
+      argmap,
+      Predicate::TRUE_PRED,
+      false /*must*/,
+      0 /*mapper_id*/,
+      machine_view_hash);
   launcher.add_region_requirement(RegionRequirement(
       input->part, 0 /*projection id*/, WRITE_ONLY, EXCLUSIVE, input->region));
   launcher.add_field(0, FID_DATA);
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index d5c3f05851..4b8bb032d8 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -28,6 +28,7 @@
 #include "flexflow/ops/attention.h"
 #include "flexflow/ops/batch_matmul.h"
 #include "flexflow/ops/batch_norm.h"
+#include "flexflow/ops/beam_topk.h"
 #include "flexflow/ops/cache.h"
 #include "flexflow/ops/cast.h"
 #include "flexflow/ops/concat.h"
@@ -52,6 +53,7 @@
 #include "flexflow/ops/reverse.h"
 #include "flexflow/ops/rms_norm.h"
 #include "flexflow/ops/softmax.h"
+#include "flexflow/ops/spec_inc_multihead_self_attention.h"
 #include "flexflow/ops/split.h"
 #include "flexflow/ops/topk.h"
 #include "flexflow/ops/transpose.h"
@@ -2763,6 +2765,12 @@ Op *FFModel::create_operator_from_layer(
       operators.push_back(op);
       return op;
     }
+    case OP_SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION: {
+      Op *op = SpecIncMultiHeadSelfAttention::create_operator_from_layer(
+          *this, layer, inputs);
+      operators.push_back(op);
+      return op;
+    }
     case OP_INC_MULTIHEAD_SELF_ATTENTION: {
       Op *op = IncMultiHeadSelfAttention::create_operator_from_layer(
           *this, layer, inputs);
@@ -2899,6 +2907,11 @@ Op *FFModel::create_operator_from_layer(
       operators.push_back(op);
       return op;
     }
+    case OP_BEAM_TOPK: {
+      Op *op = BeamTopK::create_operator_from_layer(*this, layer, inputs);
+      operators.push_back(op);
+      return op;
+    }
     case OP_GROUP_BY: {
       Op *op = Group_by::create_operator_from_layer(*this, layer, inputs);
       operators.push_back(op);
@@ -3003,6 +3016,7 @@ void FFModel::compile(LossType loss_type,
         ParallelTensor parallel_weight = nullptr;
         for (auto const &op : operators) {
           if (op->layer_guid == layer->layer_guid) {
+            std::cout << "opopop: " << op->name << "\n";
             assert(op->op_type == layer->op_type);
             assert(op->numWeights == layer->numWeights);
             parallel_weight = op->weights[i];
@@ -4551,6 +4565,22 @@ void register_flexflow_internal_tasks() {
     Runtime::preregister_task_variant<InferenceResult, ArgTopK::inference_task>(
         registrar, "ArgTopK Inference Task");
   }
+  // BeamTopk task
+  {
+    TaskVariantRegistrar registrar(BEAM_TOPK_INIT_TASK_ID, "BeamTopK Init");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<OpMeta *, BeamTopK::init_task>(
+        registrar, "BeamTopK Init Task");
+  }
+  {
+    TaskVariantRegistrar registrar(BEAM_TOPK_INF_TASK_ID, "BeamTopK Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<BeamInferenceResult,
+                                      BeamTopK::inference_task>(
+        registrar, "BeamTopK Inference Task");
+  }
   // Transpose task
   {
     TaskVariantRegistrar registrar(TRANSPOSE_INIT_TASK_ID, "Transpose Init");
@@ -4617,6 +4647,27 @@ void register_flexflow_internal_tasks() {
         IncMultiHeadSelfAttention::inference_task>(
         registrar, "IncMultiHeadSelfAttention Inference Task");
   }
+  // speculative MultiHeadAttention task
+  {
+    TaskVariantRegistrar registrar(
+        SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
+        "Speculative IncMultiHeadSelfAttention Init");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<OpMeta *,
+                                      SpecIncMultiHeadSelfAttention::init_task>(
+        registrar, "Speculative IncMultiHeadSelfAttention Init Task");
+  }
+  {
+    TaskVariantRegistrar registrar(
+        SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
+        "Speculative IncMultiHeadSelfAttention Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<
+        SpecIncMultiHeadSelfAttention::inference_task>(
+        registrar, "Speculative IncMultiHeadSelfAttention Inference Task");
+  }
   {
     TaskVariantRegistrar registrar(
         INC_MULTIHEAD_SELF_ATTENTION_VERIFY_INIT_TASK_ID,
diff --git a/src/runtime/operator_params.cc b/src/runtime/operator_params.cc
index a968e10c60..19b6ac6b04 100644
--- a/src/runtime/operator_params.cc
+++ b/src/runtime/operator_params.cc
@@ -1,9 +1,11 @@
 #include "flexflow/operator_params.h"
 #include "flexflow/ops/aggregate.h"
 #include "flexflow/ops/aggregate_spec.h"
+#include "flexflow/ops/arg_topk.h"
 #include "flexflow/ops/attention.h"
 #include "flexflow/ops/batch_matmul.h"
 #include "flexflow/ops/batch_norm.h"
+#include "flexflow/ops/beam_topk.h"
 #include "flexflow/ops/cache.h"
 #include "flexflow/ops/cast.h"
 #include "flexflow/ops/concat.h"
@@ -27,6 +29,7 @@
 #include "flexflow/ops/reverse.h"
 #include "flexflow/ops/rms_norm.h"
 #include "flexflow/ops/softmax.h"
+#include "flexflow/ops/spec_inc_multihead_self_attention.h"
 #include "flexflow/ops/split.h"
 #include "flexflow/ops/topk.h"
 #include "flexflow/ops/transpose.h"
@@ -119,6 +122,10 @@ tl::optional<OperatorParameters> get_op_parameters(Op const *op) {
       return ((AggregateSpec *)op)->get_params();
     case OP_RMS_NORM:
       return ((RMSNorm *)op)->get_params();
+    case OP_ARG_TOPK:
+      return ((ArgTopK *)op)->get_params();
+    case OP_BEAM_TOPK:
+      return ((BeamTopK *)op)->get_params();
 
       // TODO: implement the get_params() function for the operators below and
       // uncomment the lines below
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 7f5bc89648..810be3df1f 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -36,6 +36,8 @@ RequestManager::RequestGuid
   request.tokens = prompt;
 
   pending_request_queue.push(request);
+
+  std::cout << "new req: " << request.tokens.size() << std::endl;
   return request.guid;
 }
 
@@ -136,4 +138,385 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
   return new_bc;
 }
 
+//-------beam search specific functions
+
+// update beam search metadata
+BeamSearchBatchConfig
+    RequestManager::prepare_next_batch_beam(BeamSearchBatchConfig const &old_bc,
+                                            BeamInferenceResult const &result) {
+  const std::lock_guard<std::mutex> lock(request_queue_mutex);
+  std::cout << "print all results"
+            << "\n";
+  for (int i = 0; i < 40; i++) {
+    std::cout << result.token_ids[i] << ", ";
+  }
+  // Step 1: register first batch
+  BeamSearchBatchConfig new_bc;
+  // Step 2: preparing the next batch for existing requests
+
+  // store results
+  std::cout << "depthhhhhhh: " << old_bc.beamRequestsInfo[0].current_depth
+            << "\n";
+  store_beam_metadata(old_bc, result);
+
+  for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
+    if (old_bc.request_completed[i]) {
+      continue;
+    }
+    assert(old_bc.requestsInfo[i].num_tokens_in_batch > 0);
+    Request &request =
+        running_request_queue[old_bc.requestsInfo[i].request_guid];
+    int processed_tokens = old_bc.requestsInfo[i].token_start_offset +
+                           old_bc.requestsInfo[i].num_tokens_in_batch;
+
+    // std::cout << "processed tokens" << processed_tokens << ", "
+    //           << request.tokens.size() << "\n";
+    // assert(processed_tokens < request.tokens.size());
+    if (processed_tokens >
+        old_bc.beamRequestsInfo[i].max_depth + request.tokens.size()
+        // || ir.results[t] == 0 TODO: replace this with <EOS>
+        // std::cout<<"aaaaaaa"<<"\n";
+    ) {
+      log_req_mgr.print("[Done] guid(%zu) final_length(%i) request_length(%zu)",
+                        old_bc.requestsInfo[i].request_guid,
+                        processed_tokens,
+                        request.tokens.size());
+    } else {
+
+      std::cout << "num tokens: " << old_bc.num_tokens << ", "
+                << new_bc.num_tokens;
+      new_bc.request_completed[i] = false;
+      new_bc.requestsInfo[i].token_start_offset = processed_tokens;
+      new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
+      new_bc.requestsInfo[i].max_sequence_length =
+          old_bc.requestsInfo[i].max_sequence_length;
+
+      // update the beam search metadata
+      // how many sub request in current request
+      new_bc.sub_requests[i] = old_bc.beamRequestsInfo[i].beam_size;
+      // update the parentid, accumalated_probs, depth, and token_ids
+      new_bc.beamRequestsInfo[i].current_depth =
+          old_bc.beamRequestsInfo[i].current_depth + 1;
+      new_bc.beamRequestsInfo[i].beam_size =
+          old_bc.beamRequestsInfo[i].beam_size;
+
+      // do the slot exchange to minimize the cache exchange in kernel.
+      std::cout << "update metadata" << std::endl;
+      update_beam_metadata(new_bc, beam_trees[i], i);
+
+      if (new_bc.requestsInfo[i].token_start_offset + 1 >=
+          request.tokens.size()) {
+        // Incremental phase
+        new_bc.requestsInfo[i].num_tokens_in_batch = 1;
+      } else {
+        // Prompt phase
+        new_bc.requestsInfo[i].num_tokens_in_batch =
+            std::min(BatchConfig::MAX_NUM_TOKENS - new_bc.num_tokens,
+                     (int)request.tokens.size() -
+                         new_bc.requestsInfo[i].token_start_offset);
+      }
+
+      // register more tokens due to the beam width
+      for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
+        int depth = new_bc.requestsInfo[i].token_start_offset + j;
+        for (int k = 0; k < new_bc.sub_requests[i]; k++) {
+          new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
+          new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = depth;
+
+          // get value from requestinfo
+          new_bc.tokensInfo[new_bc.num_tokens].token_id =
+              new_bc.beamRequestsInfo[i].tokens[k];
+          // request.tokens[depth];
+          new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = k;
+          new_bc.num_tokens++;
+        }
+      }
+    }
+  }
+
+  for (int i = 0; i < BeamSearchBatchConfig::MAX_NUM_REQUESTS; i++) {
+    if (new_bc.request_completed[i]) {
+      if (!pending_request_queue.empty() &&
+          new_bc.num_tokens < BeamSearchBatchConfig::MAX_NUM_TOKENS) {
+        Request new_request = pending_request_queue.front();
+        pending_request_queue.pop();
+        running_request_queue[new_request.guid] = new_request;
+        new_bc.requestsInfo[i].token_start_offset = 0;
+        new_bc.requestsInfo[i].request_guid = new_request.guid;
+        new_bc.requestsInfo[i].num_tokens_in_batch =
+            std::min(BeamSearchBatchConfig::MAX_NUM_TOKENS - new_bc.num_tokens,
+                     (int)new_request.tokens.size());
+        new_bc.requestsInfo[i].max_sequence_length =
+            new_request.max_sequence_length;
+
+        // init the beam search metadata per request
+        new_bc.beamRequestsInfo[i].beam_size =
+            BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+        new_bc.beamRequestsInfo[i].current_depth = 1;
+        for (int j = 0; j < BeamSearchBatchConfig::MAX_BEAM_WIDTH; j++) {
+          new_bc.beamRequestsInfo[i].parent_id[j] = 0;
+          new_bc.beamRequestsInfo[i].probs[j] = 1;
+        }
+
+        new_bc.request_completed[i] = false;
+        new_bc.sub_requests[i] = 1;
+
+        for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
+          int depth = new_bc.requestsInfo[i].token_start_offset + j;
+          new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
+          new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = depth;
+          assert(depth < new_request.tokens.size());
+          new_bc.tokensInfo[new_bc.num_tokens].token_id =
+              new_request.tokens[depth];
+
+          // beam search meta data, indicate which sub request this token
+          // belongs to, init to 0;
+          new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = 0;
+          new_bc.num_tokens++;
+        }
+        if (new_bc.num_tokens == BatchConfig::MAX_NUM_TOKENS) {
+          break;
+        }
+      }
+    }
+  }
+  return new_bc;
+}
+
+void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
+                                         BeamInferenceResult const &result) {
+  // step1 store the outputs
+  if (old_bc.num_tokens <= 0) {
+    return;
+  }
+  auto guid =
+      old_bc.requestsInfo[old_bc.tokensInfo[0].request_index].request_guid;
+  auto start_idx = old_bc.tokensInfo[0].abs_depth_in_request;
+  int result_index = 0;
+  std::cout << "store num tokens" << old_bc.num_tokens << "\n";
+  for (int i = 0; i <= old_bc.num_tokens; i++) {
+    int request_index = old_bc.tokensInfo[i].request_index;
+    if (i == old_bc.num_tokens ||
+        old_bc.requestsInfo[request_index].request_guid != guid) {
+      // see how many tokens has been put to model in this req
+      // to get the index of the final token
+      // every token will get (beam_width) results
+      int beam_width =
+          old_bc.beamRequestsInfo[old_bc.tokensInfo[i].request_index].beam_size;
+
+      result_index +=
+          (old_bc.tokensInfo[i - 1].abs_depth_in_request - start_idx) *
+          beam_width;
+
+      std::cout << "i = " << i << ", result index = " << result_index
+                << ",value: " << result.token_ids[result_index] << "\n";
+
+      int index = old_bc.tokensInfo[i - 1].request_index;
+      int beam_size = old_bc.beamRequestsInfo[index].beam_size;
+      int depth = old_bc.beamRequestsInfo[index].current_depth;
+
+      if (depth == 1) {
+        // store the last input into the tree;
+        std::cout << "try to store the input"
+                  << "\n";
+        Request &request =
+            running_request_queue[old_bc.requestsInfo[index].request_guid];
+        beam_trees[index].treeLayers[depth - 1].tokens[0] =
+            request.tokens.at(request.tokens.size() - 1);
+        beam_trees[index].treeLayers[depth - 1].probs[0] = 1;
+        beam_trees[index].treeLayers[depth - 1].parent_ids[0] = -1;
+        std::cout << "store the previous last token to the tree root"
+                  << request.tokens.at(request.tokens.size() - 1) << "\n";
+      }
+
+      for (int beam_id = 0; beam_id < beam_width; beam_id++) {
+        beam_trees[index].treeLayers[depth].tokens[beam_id] =
+            result.token_ids[result_index];
+        beam_trees[index].treeLayers[depth].probs[beam_id] =
+            result.probs[result_index];
+        beam_trees[index].treeLayers[depth].parent_ids[beam_id] =
+            result.parent_id[result_index];
+
+        std::cout << "tree value: " << depth << "token: "
+                  << beam_trees[index].treeLayers[depth].tokens[beam_id]
+                  << "result tokens: " << result.token_ids[result_index];
+        result_index += 1;
+      }
+
+      if (i < old_bc.num_tokens) {
+        guid = old_bc.requestsInfo[request_index].request_guid;
+        start_idx = old_bc.tokensInfo[i].abs_depth_in_request;
+      }
+    }
+  }
+}
+
+// for updating the beam search metadata in requests in incremental phase
+void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
+                                          BeamTree &tree,
+                                          int request_index) {
+
+  // do the exchange
+  if (new_bc.request_completed[request_index]) {
+    assert(false);
+  }
+  int depth = new_bc.beamRequestsInfo[request_index].current_depth - 1;
+  int beam_size = new_bc.beamRequestsInfo[request_index].beam_size;
+
+  // std::cout << "-----------before parent id exchange-----------" <<
+  // std::endl; for (int j = 0; j < beam_size; j++) {
+  //   std::cout << "after request id: " << request_index << "beam id = " << j
+  //             << "parnt: "
+  //             << new_bc.beamRequestsInfo[request_index].parent_id[j]
+  //             << "token: " <<
+  //             new_bc.beamRequestsInfo[request_index].tokens[j]
+  //             << "probs: " << new_bc.beamRequestsInfo[request_index].probs[j]
+  //             << std::endl;
+  //   // std::fixed << std::setprecision(15)<<
+  // }
+  if (new_bc.beamRequestsInfo[request_index].current_depth == 1) {
+    for (int j = 0; j < beam_size; j++) {
+      new_bc.beamRequestsInfo[request_index].parent_id[j] = j;
+      new_bc.beamRequestsInfo[request_index].probs[j] =
+          tree.treeLayers[depth].probs[j];
+      new_bc.beamRequestsInfo[request_index].tokens[j] =
+          tree.treeLayers[depth].tokens[j];
+    }
+  } else {
+    std::set<int> parents;
+    std::set<int> childs;
+    // cache stealing
+    for (int j = 0; j < beam_size; j++) {
+      int parent_id = tree.treeLayers[depth].parent_ids[j];
+      if (childs.find(parent_id) == childs.end()) {
+        // copy beam slot
+        new_bc.beamRequestsInfo[request_index].parent_id[parent_id] =
+            tree.treeLayers[depth].parent_ids[j];
+        new_bc.beamRequestsInfo[request_index].probs[parent_id] =
+            tree.treeLayers[depth].probs[j];
+        new_bc.beamRequestsInfo[request_index].tokens[parent_id] =
+            tree.treeLayers[depth].tokens[j];
+        parents.emplace(j);
+        childs.emplace(parent_id);
+      }
+    }
+    if (parents.size() < beam_size) {
+      for (int j = 0; j < beam_size; j++) {
+        if (parents.find(j) == parents.end()) {
+          // this slot has not been assigned
+          // find the smallest not assigned child and put in
+          std::cout << "request_index" << request_index << ", miss slot: " << j
+                    << "\n";
+          for (int k = 0; k < beam_size; k++) {
+            if (childs.find(k) == childs.end()) {
+              // parent -> j to child k;
+              new_bc.beamRequestsInfo[request_index].parent_id[k] =
+                  tree.treeLayers[depth].parent_ids[j];
+              new_bc.beamRequestsInfo[request_index].probs[k] =
+                  tree.treeLayers[depth].probs[j];
+              new_bc.beamRequestsInfo[request_index].tokens[k] =
+                  tree.treeLayers[depth].tokens[j];
+              parents.emplace(j);
+              childs.emplace(k);
+              break;
+            }
+          }
+        }
+      }
+    }
+  }
+  std::cout << "-----------after parent id exchange-----------" << std::endl;
+  for (int j = 0; j < beam_size; j++) {
+    std::cout << "after request id: " << request_index << "beam id = " << j
+              << "parnt: "
+              << new_bc.beamRequestsInfo[request_index].parent_id[j]
+              << "token: " << new_bc.beamRequestsInfo[request_index].tokens[j]
+              << "probs: " << new_bc.beamRequestsInfo[request_index].probs[j]
+              << std::endl;
+  }
+}
+
+bool PreOrder(BeamTree tree,
+              int max_depth,
+              int current_depth,
+              int beam_width,
+              int id,
+              std::vector<std::pair<BeamSearchBatchConfig::TokenId, int>>
+                  &serializedTree) {
+  // terminate
+  if (current_depth >= max_depth) {
+    serializedTree.push_back(std::make_pair(
+        tree.treeLayers[current_depth].tokens[id], current_depth));
+    std::cout << "last tokens: " << tree.treeLayers[current_depth].tokens[id]
+              << "\n";
+    std::cout << "return true"
+              << "\n";
+    return true;
+  }
+
+  // add to tree;
+  // std::cout<<"node: " << current_depth << ", id: " <<
+  serializedTree.push_back(
+      std::make_pair(tree.treeLayers[current_depth].tokens[id], current_depth));
+  std::cout << "push something: " << tree.treeLayers[current_depth].tokens[id]
+            << ", " << current_depth << std::endl;
+  int index = serializedTree.size() - 1;
+  int next_layers = current_depth + 1;
+
+  bool flag = false;
+  // recursion
+  for (int i = 0; i < beam_width; i++) {
+    int child_id = i;
+    int child_parent = tree.treeLayers[next_layers].parent_ids[i];
+
+    // for all childs, do preOrder
+    if (child_parent == id) {
+      std::cout << "current depth: " << current_depth << ", child_parent, "
+                << child_parent << ", child_id, " << child_id << "\n";
+      bool res = PreOrder(tree,
+                          max_depth,
+                          current_depth + 1,
+                          beam_width,
+                          child_id,
+                          serializedTree);
+      flag = flag || res;
+    }
+  }
+  if (!flag) {
+    // no child for this token, delete it
+    std::cout << "delete a node: " << tree.treeLayers[current_depth].tokens[id]
+              << ", " << current_depth << std::endl;
+    serializedTree.erase(serializedTree.begin() + index);
+  }
+  return flag;
+}
+
+void RequestManager::tranverse_beam_tree(BeamSearchBatchConfig const &old_bc) {
+  for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
+    if (old_bc.request_completed[i]) {
+      continue;
+    }
+    // if(i != 0){
+    //   continue;
+    // }
+
+    int depth = old_bc.beamRequestsInfo[i].current_depth;
+    int beam_width = old_bc.beamRequestsInfo[i].beam_size;
+    BeamTree tree = beam_trees[i];
+
+    // token, index
+    // todo make this one global for different stages
+    std::vector<std::pair<BeamSearchBatchConfig::TokenId, int>> serializedTree;
+    PreOrder(
+        tree, 3, 0, old_bc.beamRequestsInfo[i].beam_size, 0, serializedTree);
+
+    // print it
+    std::cout << "print tree, " << i << "\n";
+    for (int k = 0; k < serializedTree.size(); k++) {
+      std::cout << "token id: " << serializedTree.at(k).first
+                << ", depth: " << serializedTree.at(k).second << "\n";
+    }
+  }
+}
+
 }; // namespace FlexFlow

From 82a44a9fdead80b46979c635bb78c51811b36243 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Sun, 7 May 2023 18:57:15 -0500
Subject: [PATCH 106/344] Fix bugs in tree-based incremental multi-head
 attention (#710)

* Support multiple FFModels in a single top_level_task

* rename operators and bug fixes

* format

* add missing files

---------

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
---
 examples/cpp/inference/LLAMA/llama.h          |   3 +-
 examples/cpp/inference/SPEC_LLAMA/llama.cc    |   2 +-
 examples/cpp/inference/SPEC_LLAMA/llama.h     |   3 +-
 examples/cpp/inference/data_generator.cc      |   4 +-
 examples/cpp/inference/inference_config.h     |   4 +-
 include/flexflow/batch_config.h               |   2 +-
 include/flexflow/ffconst.h                    |   4 +-
 include/flexflow/model.h                      |  16 +-
 include/flexflow/operator_params.h            |   4 +-
 ....h => tree_inc_multihead_self_attention.h} |  99 +++--
 ...ree_inc_multihead_self_attention_params.h} |  10 +-
 src/ops/inc_multihead_self_attention.cu       |  66 ++-
 src/ops/spec_inc_multihead_self_attention.cc  |  12 +-
 src/ops/spec_inc_multihead_self_attention.cpp |   2 +-
 src/ops/spec_inc_multihead_self_attention.cu  |  20 +-
 ...c => tree_inc_multihead_self_attention.cc} | 181 ++++-----
 ... => tree_inc_multihead_self_attention.cpp} |  17 +-
 ...u => tree_inc_multihead_self_attention.cu} | 376 +++++++-----------
 src/runtime/ffconst_utils.cc                  |   8 +-
 src/runtime/graph.cc                          |  20 +-
 src/runtime/model.cc                          |  31 +-
 src/runtime/operator_params.cc                |   6 +-
 src/runtime/substitution.cc                   |  10 +-
 23 files changed, 394 insertions(+), 506 deletions(-)
 rename include/flexflow/ops/{inc_mha_verify.h => tree_inc_multihead_self_attention.h} (55%)
 rename include/flexflow/ops/{inc_mha_verify_params.h => tree_inc_multihead_self_attention_params.h} (64%)
 rename src/ops/{inc_mha_verify.cc => tree_inc_multihead_self_attention.cc} (91%)
 rename src/ops/{inc_mha_verify.cpp => tree_inc_multihead_self_attention.cpp} (78%)
 rename src/ops/{inc_mha_verify.cu => tree_inc_multihead_self_attention.cu} (70%)

diff --git a/examples/cpp/inference/LLAMA/llama.h b/examples/cpp/inference/LLAMA/llama.h
index 75b7d3ff1b..0ae8d57d5b 100644
--- a/examples/cpp/inference/LLAMA/llama.h
+++ b/examples/cpp/inference/LLAMA/llama.h
@@ -13,6 +13,7 @@
  * limitations under the License.
  */
 
+#include "flexflow/batch_config.h"
 #include "flexflow/inference.h"
 #include "flexflow/model.h"
 #define MAX_NUM_SAMPLES 65536
@@ -36,7 +37,7 @@ struct LLAMAConfig {
     batchSize = 5;
     total_requests = 2560;
     incremental_mode = true;
-    sequence_length = MAX_SEQ_LEN;
+    sequence_length = BatchConfig::MAX_SEQ_LENGTH;
     max_seq_len = 8;
 
     // todo from args
diff --git a/examples/cpp/inference/SPEC_LLAMA/llama.cc b/examples/cpp/inference/SPEC_LLAMA/llama.cc
index 0f2095c1ae..ae5c4948e7 100644
--- a/examples/cpp/inference/SPEC_LLAMA/llama.cc
+++ b/examples/cpp/inference/SPEC_LLAMA/llama.cc
@@ -96,7 +96,7 @@ void FlexFlow::top_level_task(Task const *task,
   // n transformer blocks impl
   int num_transformer_layers_per_gpu = (32 + num_devices - 1) / num_devices;
 
-  for (int i = 0; i < 1; i++) {
+  for (int i = 0; i < 32; i++) {
     // step 1: attention
     std::vector<int> axes = {2};
     Tensor att_norm = ff.rms_norm(token, llamaConfig.norm_eps, llamaConfig.dim);
diff --git a/examples/cpp/inference/SPEC_LLAMA/llama.h b/examples/cpp/inference/SPEC_LLAMA/llama.h
index 7fce809073..d2a96e70a5 100644
--- a/examples/cpp/inference/SPEC_LLAMA/llama.h
+++ b/examples/cpp/inference/SPEC_LLAMA/llama.h
@@ -15,6 +15,7 @@
 #pragma once
 
 #include "file_loader.h"
+#include "flexflow/batch_config.h"
 
 using namespace Legion;
 using namespace FlexFlow;
@@ -34,7 +35,7 @@ struct LLAMAConfig {
     batchSize = 5;
     total_requests = 2560;
     incremental_mode = true;
-    sequence_length = MAX_SEQ_LEN;
+    sequence_length = BatchConfig::MAX_SEQ_LENGTH;
     max_seq_len = 8;
     max_beam_width = 3;
     max_beam_depth = 3;
diff --git a/examples/cpp/inference/data_generator.cc b/examples/cpp/inference/data_generator.cc
index 69ed577822..9d8fe1b7be 100644
--- a/examples/cpp/inference/data_generator.cc
+++ b/examples/cpp/inference/data_generator.cc
@@ -19,6 +19,7 @@
 #include <iostream>
 #include <vector>
 using namespace std;
+using namespace FlexFlow;
 
 DataGenerator::DataGenerator(size_t _num_requests,
                              size_t _vocab_size,
@@ -35,7 +36,8 @@ DataGenerator::DataGenerator(size_t _num_requests,
       poisson_distr(_poisson_distr), lambda(_lambda), timer_started(false) {
   assert(max_input_tokens >= min_input_tokens);
   assert(max_tokens_to_generate >= min_tokens_to_generate);
-  assert(max_input_tokens + max_tokens_to_generate <= MAX_SEQ_LEN);
+  assert(max_input_tokens + max_tokens_to_generate <=
+         BatchConfig::MAX_SEQ_LENGTH);
   generate_requests_meta();
 };
 
diff --git a/examples/cpp/inference/inference_config.h b/examples/cpp/inference/inference_config.h
index 8b393336cc..c6cdd5da6c 100644
--- a/examples/cpp/inference/inference_config.h
+++ b/examples/cpp/inference/inference_config.h
@@ -14,10 +14,10 @@
  */
 #pragma once
 
+#include "flexflow/batch_config.h"
 #include <string>
-
 // #define MAX_SEQ_LEN 1024
-#define MAX_SEQ_LEN 20
+static int const MAX_SEQ_LEN = FlexFlow::BatchConfig::MAX_SEQ_LENGTH;
 #define BATCH_SIZE 16
 #define MNIST_DIMS 28 * 28
 #define DATA_DIM MNIST_DIMS
diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index db5ff3d485..461643e755 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -20,7 +20,6 @@
 
 // #define MAX_SEQ_LEN 1024
 // #define BATCH_SIZE 2
-#define MAX_SEQ_LEN 20
 // #define BATCH_SIZE 16
 // #define MAX_REQUESTS 256
 
@@ -45,6 +44,7 @@ class BatchConfig {
   void print() const;
   static int const MAX_NUM_REQUESTS = 8;
   static int const MAX_NUM_TOKENS = 64;
+  static int const MAX_SEQ_LENGTH = 512;
 
   //  These are set by update
   int num_tokens;
diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index 86898a1a9b..e6a4eb6f3c 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -149,9 +149,9 @@ enum OperatorType {
   OP_GATHER, // https://pytorch.org/docs/stable/generated/torch.gather.html
   OP_RMS_NORM,
   OP_BEAM_TOPK,
-  OP_SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION,
   OP_INC_MULTIHEAD_SELF_ATTENTION,
-  OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY,
+  OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION,
+  OP_TREE_INC_MULTIHEAD_SELF_ATTENTION,
   // Parallel Ops
   OP_REPARTITION,
   OP_COMBINE,
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 70a631f9a8..caf6229300 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -145,16 +145,14 @@ enum TaskIDs {
   RMSNROM_FWD_TASK_ID,
   BEAM_TOPK_INIT_TASK_ID,
   BEAM_TOPK_INF_TASK_ID,
-  SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
-  SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
   INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
   INC_MULTIHEAD_SELF_ATTENTION_FWD_TASK_ID,
   INC_MULTIHEAD_SELF_ATTENTION_BWD_TASK_ID,
   INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
-  INC_MULTIHEAD_SELF_ATTENTION_VERIFY_INIT_TASK_ID,
-  INC_MULTIHEAD_SELF_ATTENTION_VERIFY_FWD_TASK_ID,
-  INC_MULTIHEAD_SELF_ATTENTION_VERIFY_BWD_TASK_ID,
-  INC_MULTIHEAD_SELF_ATTENTION_VERIFY_INF_TASK_ID,
+  SPEC_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
+  SPEC_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
+  TREE_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
+  TREE_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
   MSELOSS_BWD_TASK_ID,
   FUSEDOP_INIT_TASK_ID,
   FUSEDOP_FWD_TASK_ID,
@@ -293,7 +291,7 @@ class LayerNorm;
 class Linear;
 class MultiHeadAttention;
 class IncMultiHeadSelfAttention;
-class IncMultiHeadSelfAttentionVerify;
+class TreeIncMultiHeadSelfAttention;
 class Pool2D;
 class Reduce;
 class Reshape;
@@ -1014,8 +1012,8 @@ class FFModel {
           std::pair<ParallelTensorShape, SpecIncMultiHeadSelfAttentionParams>,
           SpecIncMultiHeadSelfAttention *>,
       std::unordered_map<
-          std::pair<ParallelTensorShape, IncMultiHeadSelfAttentionVerifyParams>,
-          IncMultiHeadSelfAttentionVerify *>,
+          std::pair<ParallelTensorShape, TreeIncMultiHeadSelfAttentionParams>,
+          TreeIncMultiHeadSelfAttention *>,
       std::unordered_map<std::pair<ParallelTensorShape, ReduceParams>,
                          Reduce *>,
       std::unordered_map<std::pair<ParallelTensorShape, ReshapeParams>,
diff --git a/include/flexflow/operator_params.h b/include/flexflow/operator_params.h
index a417f6579f..9549ffc084 100644
--- a/include/flexflow/operator_params.h
+++ b/include/flexflow/operator_params.h
@@ -18,7 +18,6 @@
 #include "flexflow/ops/flat_params.h"
 #include "flexflow/ops/gather_params.h"
 #include "flexflow/ops/groupby_params.h"
-#include "flexflow/ops/inc_mha_verify_params.h"
 #include "flexflow/ops/inc_multihead_self_attention_params.h"
 #include "flexflow/ops/layer_norm_params.h"
 #include "flexflow/ops/linear_params.h"
@@ -31,6 +30,7 @@
 #include "flexflow/ops/split_params.h"
 #include "flexflow/ops/topk_params.h"
 #include "flexflow/ops/transpose_params.h"
+#include "flexflow/ops/tree_inc_multihead_self_attention_params.h"
 #include "flexflow/parallel_ops/combine_params.h"
 #include "flexflow/parallel_ops/fused_parallel_op_params.h"
 #include "flexflow/parallel_ops/partition_params.h"
@@ -61,7 +61,7 @@ using OperatorParameters = mp::variant<AggregateParams,
                                        IncMultiHeadSelfAttentionParams,
                                        BeamTopKParams,
                                        SpecIncMultiHeadSelfAttentionParams,
-                                       IncMultiHeadSelfAttentionVerifyParams,
+                                       TreeIncMultiHeadSelfAttentionParams,
                                        RMSNormParams,
                                        Pool2DParams,
                                        ReduceParams,
diff --git a/include/flexflow/ops/inc_mha_verify.h b/include/flexflow/ops/tree_inc_multihead_self_attention.h
similarity index 55%
rename from include/flexflow/ops/inc_mha_verify.h
rename to include/flexflow/ops/tree_inc_multihead_self_attention.h
index 58be2fe204..c1af4c0086 100644
--- a/include/flexflow/ops/inc_mha_verify.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention.h
@@ -15,50 +15,50 @@
 
 namespace FlexFlow {
 
-class IncMultiHeadSelfAttentionVerifyMeta;
+class TreeIncMultiHeadSelfAttentionMeta;
 
-class IncMultiHeadSelfAttentionVerify : public Op {
+class TreeIncMultiHeadSelfAttention : public Op {
 public:
-  using Params = IncMultiHeadSelfAttentionVerifyParams;
+  using Params = TreeIncMultiHeadSelfAttentionParams;
   using Input = ParallelTensor;
 
-  IncMultiHeadSelfAttentionVerify(FFModel &model,
-                                  LayerID const &layer_guid,
-                                  const ParallelTensor _input,
-                                  int _embed_dim,
-                                  int _num_heads,
-                                  int _kdim,
-                                  int _vdim,
-                                  float _dropout,
-                                  bool _bias,
-                                  bool _add_bias_kv,
-                                  bool _add_zero_attn,
-                                  bool _apply_rotary_embedding,
-                                  bool allocate_weights,
-                                  char const *name);
-  IncMultiHeadSelfAttentionVerify(FFModel &model,
-                                  const ParallelTensor _input,
-                                  const ParallelTensor _weight,
-                                  int _embed_dim,
-                                  int _num_heads,
-                                  int _kdim,
-                                  int _vdim,
-                                  float _dropout,
-                                  bool _bias,
-                                  bool _add_bias_kv,
-                                  bool _add_zero_attn,
-                                  bool _apply_rotary_embedding,
-                                  bool allocate_weights,
-                                  char const *name);
-  IncMultiHeadSelfAttentionVerify(FFModel &model,
-                                  IncMultiHeadSelfAttentionVerify const &other,
-                                  const ParallelTensor input,
-                                  bool allocate_weights);
-  IncMultiHeadSelfAttentionVerify(FFModel &model,
-                                  Params const &params,
-                                  Input const &inputs,
-                                  bool allocate_weights = false,
-                                  char const *name = nullptr);
+  TreeIncMultiHeadSelfAttention(FFModel &model,
+                                LayerID const &layer_guid,
+                                const ParallelTensor _input,
+                                int _embed_dim,
+                                int _num_heads,
+                                int _kdim,
+                                int _vdim,
+                                float _dropout,
+                                bool _bias,
+                                bool _add_bias_kv,
+                                bool _add_zero_attn,
+                                bool _apply_rotary_embedding,
+                                bool allocate_weights,
+                                char const *name);
+  TreeIncMultiHeadSelfAttention(FFModel &model,
+                                const ParallelTensor _input,
+                                const ParallelTensor _weight,
+                                int _embed_dim,
+                                int _num_heads,
+                                int _kdim,
+                                int _vdim,
+                                float _dropout,
+                                bool _bias,
+                                bool _add_bias_kv,
+                                bool _add_zero_attn,
+                                bool _apply_rotary_embedding,
+                                bool allocate_weights,
+                                char const *name);
+  TreeIncMultiHeadSelfAttention(FFModel &model,
+                                TreeIncMultiHeadSelfAttention const &other,
+                                const ParallelTensor input,
+                                bool allocate_weights);
+  TreeIncMultiHeadSelfAttention(FFModel &model,
+                                Params const &params,
+                                Input const &inputs,
+                                bool allocate_weights = false,
+                                char const *name = nullptr);
   static Op *
       create_operator_from_layer(FFModel &model,
                                  Layer const *layer,
@@ -93,7 +93,7 @@ class IncMultiHeadSelfAttentionVerify : public Op {
                              CostMetrics &cost_metrics) const override;
 
   static void
-      inference_kernel_wrapper(IncMultiHeadSelfAttentionVerifyMeta const *m,
+      inference_kernel_wrapper(TreeIncMultiHeadSelfAttentionMeta const *m,
                                TreeVerifyBatchConfig const *bc,
                                float const *input_ptr,
                                float const *weight_ptr,
@@ -109,16 +109,15 @@ class IncMultiHeadSelfAttentionVerify : public Op {
   int qoSeqLength, kvSeqLength;
 };
 
-class IncMultiHeadSelfAttentionVerifyMeta : public OpMeta {
+class TreeIncMultiHeadSelfAttentionMeta : public OpMeta {
 public:
-  IncMultiHeadSelfAttentionVerifyMeta(
-      FFHandler handler,
-      IncMultiHeadSelfAttentionVerify const *attn,
-      float const *weight_ptr,
-      Legion::Memory gpu_mem,
-      int num_samples,
-      int _num_heads);
-  ~IncMultiHeadSelfAttentionVerifyMeta(void);
+  TreeIncMultiHeadSelfAttentionMeta(FFHandler handler,
+                                    TreeIncMultiHeadSelfAttention const *attn,
+                                    float const *weight_ptr,
+                                    Legion::Memory gpu_mem,
+                                    int num_samples,
+                                    int _num_heads);
+  ~TreeIncMultiHeadSelfAttentionMeta(void);
 
 public:
   Realm::RegionInstance reserveInst;
diff --git a/include/flexflow/ops/inc_mha_verify_params.h b/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
similarity index 64%
rename from include/flexflow/ops/inc_mha_verify_params.h
rename to include/flexflow/ops/tree_inc_multihead_self_attention_params.h
index 51ead7b283..7a4a258850 100644
--- a/include/flexflow/ops/inc_mha_verify_params.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
@@ -6,7 +6,7 @@
 
 namespace FlexFlow {
 
-struct IncMultiHeadSelfAttentionVerifyParams {
+struct TreeIncMultiHeadSelfAttentionParams {
   LayerID layer_guid;
   int embed_dim, num_heads, kdim, vdim;
   float dropout;
@@ -15,16 +15,16 @@ struct IncMultiHeadSelfAttentionVerifyParams {
   bool is_valid(ParallelTensorShape const &) const;
 };
 
-bool operator==(IncMultiHeadSelfAttentionVerifyParams const &,
-                IncMultiHeadSelfAttentionVerifyParams const &);
+bool operator==(TreeIncMultiHeadSelfAttentionParams const &,
+                TreeIncMultiHeadSelfAttentionParams const &);
 
 } // namespace FlexFlow
 
 namespace std {
 template <>
-struct hash<FlexFlow::IncMultiHeadSelfAttentionVerifyParams> {
+struct hash<FlexFlow::TreeIncMultiHeadSelfAttentionParams> {
   size_t
-      operator()(FlexFlow::IncMultiHeadSelfAttentionVerifyParams const &) const;
+      operator()(FlexFlow::TreeIncMultiHeadSelfAttentionParams const &) const;
 };
 } // namespace std
 
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index e2e0e0bc82..f68bec459b 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -102,12 +102,12 @@ __global__ void
   }
 }
 
-void inference_kernel1(IncMultiHeadSelfAttentionMeta const *m,
-                       BatchConfig const *bc,
-                       float const *input_ptr,
-                       float const *weight_ptr,
-                       float *output_ptr,
-                       cudaStream_t stream) {
+void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
+                        BatchConfig const *bc,
+                        float const *input_ptr,
+                        float const *weight_ptr,
+                        float *output_ptr,
+                        cudaStream_t stream) {
 
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
@@ -289,9 +289,9 @@ __global__ void store_kv_cache(float const *devQKVProjArray,
   }
 }
 
-void inference_kernel2(IncMultiHeadSelfAttentionMeta const *m,
-                       BatchConfig const *bc,
-                       cudaStream_t stream) {
+void update_kv_cache_kernel(IncMultiHeadSelfAttentionMeta const *m,
+                            BatchConfig const *bc,
+                            cudaStream_t stream) {
   int num_tokens = bc->num_active_tokens();
   if (num_tokens > 0) {
     int parallelism = m->kProjSize * num_tokens * m->num_heads;
@@ -306,7 +306,7 @@ void inference_kernel2(IncMultiHeadSelfAttentionMeta const *m,
                                m->vProjSize,
                                num_tokens,
                                m->num_heads,
-                               MAX_SEQ_LEN,
+                               BatchConfig::MAX_SEQ_LENGTH,
                                /* k_cache = */ true);
 
     parallelism = m->vProjSize * num_tokens * m->num_heads;
@@ -321,7 +321,7 @@ void inference_kernel2(IncMultiHeadSelfAttentionMeta const *m,
                                m->vProjSize,
                                num_tokens,
                                m->num_heads,
-                               MAX_SEQ_LEN,
+                               BatchConfig::MAX_SEQ_LENGTH,
                                /* k_cache = */ false);
   }
 }
@@ -342,10 +342,10 @@ __global__ void fill_entries_above_diagonal(float *matrix,
   }
 }
 
-void inference_kernel3(IncMultiHeadSelfAttentionMeta const *m,
-                       BatchConfig const *bc,
-                       float *output_ptr,
-                       cudaStream_t stream) {
+void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
+                              BatchConfig const *bc,
+                              float *output_ptr,
+                              cudaStream_t stream) {
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
   cudaDataType_t cublas_data_type = ff_to_cuda_datatype(DT_FLOAT);
@@ -358,12 +358,11 @@ void inference_kernel3(IncMultiHeadSelfAttentionMeta const *m,
   // int num_requests = bc->num_active_requests();
   int num_tokens = bc->num_active_tokens();
   int tokens_previous_requests = 0;
-  int tokens_prev_requests_squares = 0;
   int qkv_block_size =
       (m->qProjSize + m->kProjSize + m->vProjSize) * num_tokens;
-  int kt_block_size = m->kProjSize * MAX_SEQ_LEN;
+  int kt_block_size = m->kProjSize * BatchConfig::MAX_SEQ_LENGTH;
   int kt_req_block_size = kt_block_size * m->num_heads;
-  int vt_block_size = m->vProjSize * MAX_SEQ_LEN;
+  int vt_block_size = m->vProjSize * BatchConfig::MAX_SEQ_LENGTH;
   int vt_req_block_size = vt_block_size * m->num_heads;
   assert(m->qProjSize == m->kProjSize);
 
@@ -392,8 +391,7 @@ void inference_kernel3(IncMultiHeadSelfAttentionMeta const *m,
     // padding)
     void const *B = (void const *)(m->keyCache + i * kt_req_block_size);
     // To get C, skip over QK^T products from previous requests
-    void *C =
-        (void *)(m->qk_prods + m->num_heads * tokens_prev_requests_squares);
+    void *C = (void *)(m->qk_prods);
 
     checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                          CUBLAS_OP_T,
@@ -458,8 +456,7 @@ void inference_kernel3(IncMultiHeadSelfAttentionMeta const *m,
                                           h_param,
                                           w_param));
     alpha = 1.0f, beta = 0.0f;
-    void *C_softmax = (void *)(m->qk_prods_softmax +
-                               m->num_heads * tokens_prev_requests_squares);
+    void *C_softmax = (void *)(m->qk_prods_softmax);
     // The softmax operation below is executed according to the
     // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
     // softmax operation is computed per spatial location (H,W) per image (N)
@@ -546,7 +543,6 @@ void inference_kernel3(IncMultiHeadSelfAttentionMeta const *m,
                            compute_type,
                            CUBLAS_GEMM_DEFAULT_TENSOR_OP));
     tokens_previous_requests += num_new_tokens;
-    tokens_prev_requests_squares += num_new_tokens * total_tokens;
   }
 
   assert(tokens_previous_requests == num_tokens);
@@ -593,14 +589,14 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
                   cudaMemcpyHostToDevice,
                   stream);
   // phase 1: Implement kernel to compute KQV for input tokens
-  inference_kernel1(m, bc, input_ptr, weight_ptr, m->devQKVProjArray, stream);
+  compute_qkv_kernel(m, bc, input_ptr, weight_ptr, m->devQKVProjArray, stream);
 
   // phase 2: Update key/val cache
-  inference_kernel2(m, bc, stream);
+  update_kv_cache_kernel(m, bc, stream);
 
   // phase 3: Compute attention score
   // 3 kernels for pahse 3: matmul1 - softmax - matmal2
-  inference_kernel3(m, bc, output_ptr, stream);
+  compute_attention_kernel(m, bc, output_ptr, stream);
 
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
@@ -652,10 +648,10 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   assert(!attn->add_bias_kv);
 
 #ifdef INFERENCE_TESTS
-  kcache = (float *)calloc(kProjSize * MAX_SEQ_LEN * num_heads *
+  kcache = (float *)calloc(kProjSize * BatchConfig::MAX_SEQ_LENGTH * num_heads *
                                BatchConfig::MAX_NUM_REQUESTS,
                            sizeof(float));
-  vcache = (float *)calloc(vProjSize * MAX_SEQ_LEN * num_heads *
+  vcache = (float *)calloc(vProjSize * BatchConfig::MAX_SEQ_LENGTH * num_heads *
                                BatchConfig::MAX_NUM_REQUESTS,
                            sizeof(float));
 #endif
@@ -665,13 +661,15 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     size_t qkv_proj_dim = qProjSize + kProjSize + vProjSize;
     size_t qkv_max_proj_size =
         BatchConfig::MAX_NUM_TOKENS * qkv_proj_dim * num_heads;
-    size_t key_cache_size =
-        num_heads * kProjSize * BatchConfig::MAX_NUM_REQUESTS * MAX_SEQ_LEN;
-    size_t value_cache_size =
-        num_heads * vProjSize * BatchConfig::MAX_NUM_REQUESTS * MAX_SEQ_LEN;
+    size_t key_cache_size = num_heads * kProjSize *
+                            BatchConfig::MAX_NUM_REQUESTS *
+                            BatchConfig::MAX_SEQ_LENGTH;
+    size_t value_cache_size = num_heads * vProjSize *
+                              BatchConfig::MAX_NUM_REQUESTS *
+                              BatchConfig::MAX_SEQ_LENGTH;
     size_t tokeninfo_size = BatchConfig::MAX_NUM_TOKENS;
     size_t qk_prod_size =
-        BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_NUM_TOKENS * num_heads;
+        BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_SEQ_LENGTH * num_heads;
     size_t attn_heads_size =
         BatchConfig::MAX_NUM_TOKENS * num_heads * vProjSize;
     size_t W_out_block_size = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
@@ -727,4 +725,4 @@ IncMultiHeadSelfAttentionMeta::~IncMultiHeadSelfAttentionMeta(void) {
 #endif
 }
 
-}; // namespace FlexFlow
\ No newline at end of file
+}; // namespace FlexFlow
diff --git a/src/ops/spec_inc_multihead_self_attention.cc b/src/ops/spec_inc_multihead_self_attention.cc
index e365082002..11911a9ba3 100644
--- a/src/ops/spec_inc_multihead_self_attention.cc
+++ b/src/ops/spec_inc_multihead_self_attention.cc
@@ -69,7 +69,7 @@ Tensor
                                                char const *name) {
   // Currently assume that
   Layer *li = new Layer(this,
-                        OP_SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION,
+                        OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION,
                         DT_FLOAT,
                         name,
                         1 /*inputs*/,
@@ -176,7 +176,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     char const *name)
     // Initializer* _bias_initializer)
     : Op(model,
-         OP_SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION,
+         OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION,
          DT_FLOAT,
          name,
          1 /*inputs*/,
@@ -260,7 +260,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     char const *name)
     // Initializer* _bias_initializer)
     : Op(model,
-         OP_SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION,
+         OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION,
          DT_FLOAT,
          name,
          1 /*inputs*/,
@@ -382,7 +382,7 @@ void SpecIncMultiHeadSelfAttention::init_inference(
   size_t machine_view_hash = view->hash();
   set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
   IndexLauncher launcher(
-      SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
+      SPEC_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
       parallel_is,
       TaskArgument(this, sizeof(SpecIncMultiHeadSelfAttention)),
       argmap,
@@ -421,7 +421,7 @@ void SpecIncMultiHeadSelfAttention::init(FFModel const &ff) {
   Runtime *runtime = ff.config.lg_hlr;
   set_argumentmap_for_init(ff, argmap);
   IndexLauncher launcher(
-      SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
+      SPEC_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
       parallel_is,
       TaskArgument(this, sizeof(SpecIncMultiHeadSelfAttention)),
       argmap,
@@ -510,7 +510,7 @@ FutureMap SpecIncMultiHeadSelfAttention::inference(
   size_t machine_view_hash = view->hash();
   int idx = 0;
   IndexLauncher launcher(
-      SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
+      SPEC_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
       parallel_is,
       TaskArgument(
           &bc, std::max(sizeof(BatchConfig), sizeof(BeamSearchBatchConfig))),
diff --git a/src/ops/spec_inc_multihead_self_attention.cpp b/src/ops/spec_inc_multihead_self_attention.cpp
index 00335d82fa..37305a83b0 100644
--- a/src/ops/spec_inc_multihead_self_attention.cpp
+++ b/src/ops/spec_inc_multihead_self_attention.cpp
@@ -40,7 +40,7 @@ void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
     hipEventRecord(t_start, stream);
   }
 
-  handle_unimplemented_hip_kernel(OP_INC_MULTIHEAD_SELF_ATTENTION);
+  handle_unimplemented_hip_kernel(OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION);
 
   if (m->profiling) {
     hipEventRecord(t_end, stream);
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 5c2a90e538..dc1d861b08 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -409,7 +409,7 @@ void inference_kernel2(SpecIncMultiHeadSelfAttentionMeta const *m,
                                     m->vProjSize,
                                     num_tokens,
                                     m->num_heads,
-                                    MAX_SEQ_LEN,
+                                    BatchConfig::MAX_SEQ_LENGTH,
                                     BeamSearchBatchConfig::MAX_BEAM_WIDTH,
                                     /* k_cache = */ true,
                                     /*root*/ curr_depth == 0);
@@ -429,7 +429,7 @@ void inference_kernel2(SpecIncMultiHeadSelfAttentionMeta const *m,
                                     m->vProjSize,
                                     num_tokens,
                                     m->num_heads,
-                                    MAX_SEQ_LEN,
+                                    BatchConfig::MAX_SEQ_LENGTH,
                                     BeamSearchBatchConfig::MAX_BEAM_WIDTH,
                                     /* k_cache = */ false,
                                     /*root*/ curr_depth == 0);
@@ -471,9 +471,9 @@ void inference_kernel3(SpecIncMultiHeadSelfAttentionMeta const *m,
   int tokens_prev_requests_squares = 0;
   int qkv_block_size =
       (m->qProjSize + m->kProjSize + m->vProjSize) * num_tokens;
-  int kt_block_size = m->kProjSize * MAX_SEQ_LEN;
+  int kt_block_size = m->kProjSize * BatchConfig::MAX_SEQ_LENGTH;
   int kt_req_block_size = kt_block_size * m->num_heads;
-  int vt_block_size = m->vProjSize * MAX_SEQ_LEN;
+  int vt_block_size = m->vProjSize * BatchConfig::MAX_SEQ_LENGTH;
   int vt_req_block_size = vt_block_size * m->num_heads;
   assert(m->qProjSize == m->kProjSize);
 
@@ -797,10 +797,10 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
   assert(!attn->add_bias_kv);
 
 #ifdef INFERENCE_TESTS
-  kcache = (float *)calloc(kProjSize * MAX_SEQ_LEN * num_heads *
+  kcache = (float *)calloc(kProjSize * BatchConfig::MAX_SEQ_LENGTH * num_heads *
                                BeamSearchBatchConfig::MAX_NUM_REQUESTS,
                            sizeof(float));
-  vcache = (float *)calloc(vProjSize * MAX_SEQ_LEN * num_heads *
+  vcache = (float *)calloc(vProjSize * BatchConfig::MAX_SEQ_LENGTH * num_heads *
                                BeamSearchBatchConfig::MAX_NUM_REQUESTS,
                            sizeof(float));
 #endif
@@ -810,12 +810,12 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
     size_t qkv_proj_dim = qProjSize + kProjSize + vProjSize;
     size_t qkv_max_proj_size =
         BeamSearchBatchConfig::MAX_NUM_TOKENS * qkv_proj_dim * num_heads;
-    size_t key_cache_size = num_heads * kProjSize *
-                            BeamSearchBatchConfig::MAX_NUM_REQUESTS *
-                            MAX_SEQ_LEN * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+    size_t key_cache_size =
+        num_heads * kProjSize * BeamSearchBatchConfig::MAX_NUM_REQUESTS *
+        BatchConfig::MAX_SEQ_LENGTH * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
     size_t value_cache_size =
         num_heads * vProjSize * BeamSearchBatchConfig::MAX_NUM_REQUESTS *
-        MAX_SEQ_LEN * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+        BatchConfig::MAX_SEQ_LENGTH * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
 
     // size_t token2ids_size = BatchConfig::MAX_NUM_TOKENS;
     size_t tokeninfo_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
diff --git a/src/ops/inc_mha_verify.cc b/src/ops/tree_inc_multihead_self_attention.cc
similarity index 91%
rename from src/ops/inc_mha_verify.cc
rename to src/ops/tree_inc_multihead_self_attention.cc
index 228c0d224a..eec59c9247 100644
--- a/src/ops/inc_mha_verify.cc
+++ b/src/ops/tree_inc_multihead_self_attention.cc
@@ -13,7 +13,7 @@
  * limitations under the License.
  */
 
-#include "flexflow/ops/inc_mha_verify.h"
+#include "flexflow/ops/tree_inc_multihead_self_attention.h"
 #include "flexflow/model.h"
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
 #include "flexflow/utils/cuda_helper.h"
@@ -48,7 +48,7 @@ using Legion::TaskArgument;
 using Legion::TaskLauncher;
 using PCG::Node;
 
-bool IncMultiHeadSelfAttentionVerifyParams::is_valid(
+bool TreeIncMultiHeadSelfAttentionParams::is_valid(
     ParallelTensorShape const &input) const {
   bool is_valid = input.is_valid();
   return is_valid;
@@ -69,7 +69,7 @@ Tensor FFModel::inc_multihead_self_attention_verify(
     char const *name) {
   // Currently assume that
   Layer *li = new Layer(this,
-                        OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY,
+                        OP_TREE_INC_MULTIHEAD_SELF_ATTENTION,
                         DT_FLOAT,
                         name,
                         1 /*inputs*/,
@@ -118,7 +118,7 @@ Tensor FFModel::inc_multihead_self_attention_verify(
   return li->outputs[0];
 }
 
-Op *IncMultiHeadSelfAttentionVerify::create_operator_from_layer(
+Op *TreeIncMultiHeadSelfAttention::create_operator_from_layer(
     FFModel &model,
     Layer const *layer,
     std::vector<ParallelTensor> const &inputs) {
@@ -141,23 +141,23 @@ Op *IncMultiHeadSelfAttentionVerify::create_operator_from_layer(
   bool add_zero_attn = (bool)value;
   layer->get_int_property("apply_rotary_embedding", value);
   bool apply_rotary_embedding = (bool)value;
-  return new IncMultiHeadSelfAttentionVerify(model,
-                                             layer->layer_guid,
-                                             inputs[0],
-                                             embed_dim,
-                                             num_heads,
-                                             kdim,
-                                             vdim,
-                                             dropout,
-                                             bias,
-                                             add_bias_kv,
-                                             add_zero_attn,
-                                             apply_rotary_embedding,
-                                             false /*allocate_weights*/,
-                                             layer->name);
+  return new TreeIncMultiHeadSelfAttention(model,
+                                           layer->layer_guid,
+                                           inputs[0],
+                                           embed_dim,
+                                           num_heads,
+                                           kdim,
+                                           vdim,
+                                           dropout,
+                                           bias,
+                                           add_bias_kv,
+                                           add_zero_attn,
+                                           apply_rotary_embedding,
+                                           false /*allocate_weights*/,
+                                           layer->name);
 }
 
-IncMultiHeadSelfAttentionVerify::IncMultiHeadSelfAttentionVerify(
+TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     FFModel &model,
     LayerID const &_layer_guid,
     const ParallelTensor _input,
@@ -174,7 +174,7 @@ IncMultiHeadSelfAttentionVerify::IncMultiHeadSelfAttentionVerify(
     char const *name)
     // Initializer* _bias_initializer)
     : Op(model,
-         OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY,
+         OP_TREE_INC_MULTIHEAD_SELF_ATTENTION,
          DT_FLOAT,
          name,
          1 /*inputs*/,
@@ -241,7 +241,7 @@ IncMultiHeadSelfAttentionVerify::IncMultiHeadSelfAttentionVerify(
   /* assert(check_output_input_weight_parallel_dims()); */
 }
 
-IncMultiHeadSelfAttentionVerify::IncMultiHeadSelfAttentionVerify(
+TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     FFModel &model,
     const ParallelTensor _input,
     const ParallelTensor _weight,
@@ -258,7 +258,7 @@ IncMultiHeadSelfAttentionVerify::IncMultiHeadSelfAttentionVerify(
     char const *name)
     // Initializer* _bias_initializer)
     : Op(model,
-         OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY,
+         OP_TREE_INC_MULTIHEAD_SELF_ATTENTION,
          DT_FLOAT,
          name,
          1 /*inputs*/,
@@ -325,48 +325,48 @@ IncMultiHeadSelfAttentionVerify::IncMultiHeadSelfAttentionVerify(
   /* assert(check_output_input_weight_parallel_dims()); */
 }
 
-IncMultiHeadSelfAttentionVerify::IncMultiHeadSelfAttentionVerify(
+TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     FFModel &model,
-    IncMultiHeadSelfAttentionVerify const &other,
+    TreeIncMultiHeadSelfAttention const &other,
     const ParallelTensor input,
     bool allocate_weights)
-    : IncMultiHeadSelfAttentionVerify(model,
-                                      other.layer_guid,
-                                      input,
-                                      other.oProjSize,
-                                      other.num_heads,
-                                      other.qProjSize,
-                                      other.vProjSize,
-                                      other.dropout,
-                                      other.bias,
-                                      other.add_bias_kv,
-                                      other.add_zero_attn,
-                                      other.apply_rotary_embedding,
-                                      allocate_weights,
-                                      other.name) {}
-
-IncMultiHeadSelfAttentionVerify::IncMultiHeadSelfAttentionVerify(
+    : TreeIncMultiHeadSelfAttention(model,
+                                    other.layer_guid,
+                                    input,
+                                    other.oProjSize,
+                                    other.num_heads,
+                                    other.qProjSize,
+                                    other.vProjSize,
+                                    other.dropout,
+                                    other.bias,
+                                    other.add_bias_kv,
+                                    other.add_zero_attn,
+                                    other.apply_rotary_embedding,
+                                    allocate_weights,
+                                    other.name) {}
+
+TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     FFModel &model,
-    IncMultiHeadSelfAttentionVerifyParams const &params,
+    TreeIncMultiHeadSelfAttentionParams const &params,
     ParallelTensor const &input,
     bool allocate_weights,
     char const *name)
-    : IncMultiHeadSelfAttentionVerify(model,
-                                      params.layer_guid,
-                                      input,
-                                      params.embed_dim,
-                                      params.num_heads,
-                                      params.kdim,
-                                      params.vdim,
-                                      params.dropout,
-                                      params.bias,
-                                      params.add_bias_kv,
-                                      params.add_zero_attn,
-                                      params.apply_rotary_embedding,
-                                      allocate_weights,
-                                      name) {}
-
-void IncMultiHeadSelfAttentionVerify::init_inference(
+    : TreeIncMultiHeadSelfAttention(model,
+                                    params.layer_guid,
+                                    input,
+                                    params.embed_dim,
+                                    params.num_heads,
+                                    params.kdim,
+                                    params.vdim,
+                                    params.dropout,
+                                    params.bias,
+                                    params.add_bias_kv,
+                                    params.add_zero_attn,
+                                    params.apply_rotary_embedding,
+                                    allocate_weights,
+                                    name) {}
+
+void TreeIncMultiHeadSelfAttention::init_inference(
     FFModel const &ff,
     std::vector<ParallelTensor> const &batch_inputs,
     std::vector<ParallelTensor> const &batch_outputs,
@@ -380,9 +380,9 @@ void IncMultiHeadSelfAttentionVerify::init_inference(
   size_t machine_view_hash = view->hash();
   set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
   IndexLauncher launcher(
-      INC_MULTIHEAD_SELF_ATTENTION_VERIFY_INIT_TASK_ID,
+      TREE_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
       parallel_is,
-      TaskArgument(this, sizeof(IncMultiHeadSelfAttentionVerify)),
+      TaskArgument(this, sizeof(TreeIncMultiHeadSelfAttention)),
       argmap,
       Predicate::TRUE_PRED,
       false /*must*/,
@@ -411,7 +411,7 @@ void IncMultiHeadSelfAttentionVerify::init_inference(
   set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
 }
 
-void IncMultiHeadSelfAttentionVerify::init(FFModel const &ff) {
+void TreeIncMultiHeadSelfAttention::init(FFModel const &ff) {
   assert(check_output_input_weight_same_parallel_is());
   parallel_is = outputs[0]->parallel_is;
   ArgumentMap argmap;
@@ -419,9 +419,9 @@ void IncMultiHeadSelfAttentionVerify::init(FFModel const &ff) {
   Runtime *runtime = ff.config.lg_hlr;
   set_argumentmap_for_init(ff, argmap);
   IndexLauncher launcher(
-      INC_MULTIHEAD_SELF_ATTENTION_VERIFY_INIT_TASK_ID,
+      TREE_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
       parallel_is,
-      TaskArgument(this, sizeof(IncMultiHeadSelfAttentionVerify)),
+      TaskArgument(this, sizeof(TreeIncMultiHeadSelfAttention)),
       argmap,
       Predicate::TRUE_PRED,
       false /*must*/,
@@ -455,13 +455,13 @@ void IncMultiHeadSelfAttentionVerify::init(FFModel const &ff) {
   regions[1](I): weight
   regions[2](O): output
 */
-OpMeta *IncMultiHeadSelfAttentionVerify::init_task(
+OpMeta *TreeIncMultiHeadSelfAttention::init_task(
     Task const *task,
     std::vector<PhysicalRegion> const &regions,
     Context ctx,
     Runtime *runtime) {
-  IncMultiHeadSelfAttentionVerify const *attn =
-      (IncMultiHeadSelfAttentionVerify *)task->args;
+  TreeIncMultiHeadSelfAttention const *attn =
+      (TreeIncMultiHeadSelfAttention *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
 
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
@@ -481,24 +481,19 @@ OpMeta *IncMultiHeadSelfAttentionVerify::init_task(
                        .only_kind(Memory::GPU_FB_MEM)
                        .best_affinity_to(task->target_proc)
                        .first();
-  IncMultiHeadSelfAttentionVerifyMeta *m =
-      new IncMultiHeadSelfAttentionVerifyMeta(handle,
-                                              attn,
-                                              weight.get_float_ptr(),
-                                              gpu_mem,
-                                              num_samples,
-                                              num_heads);
+  TreeIncMultiHeadSelfAttentionMeta *m = new TreeIncMultiHeadSelfAttentionMeta(
+      handle, attn, weight.get_float_ptr(), gpu_mem, num_samples, num_heads);
   m->profiling = attn->profiling;
   assert(weight.domain.get_volume() * sizeof(float) == m->weightSize);
   return m;
 }
 
-void IncMultiHeadSelfAttentionVerify::forward(FFModel const &ff) {
-  // IncMultiHeadSelfAttentionVerify doesn't support forward
+void TreeIncMultiHeadSelfAttention::forward(FFModel const &ff) {
+  // TreeIncMultiHeadSelfAttention doesn't support forward
   assert(false);
 }
 
-FutureMap IncMultiHeadSelfAttentionVerify::inference(
+FutureMap TreeIncMultiHeadSelfAttention::inference(
     FFModel const &ff,
     BatchConfig const &bc,
     std::vector<ParallelTensor> const &batch_inputs,
@@ -515,7 +510,7 @@ FutureMap IncMultiHeadSelfAttentionVerify::inference(
   printf("TreeVerifyBatchConfig, num_tokens: %d, num_requests: %d\n",
          bc.num_tokens,
          bc.num_active_requests());
-  IndexLauncher launcher(INC_MULTIHEAD_SELF_ATTENTION_VERIFY_INF_TASK_ID,
+  IndexLauncher launcher(TREE_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
                          parallel_is,
                          TaskArgument(&bc, sizeof(TreeVerifyBatchConfig)),
                          argmap,
@@ -549,7 +544,7 @@ FutureMap IncMultiHeadSelfAttentionVerify::inference(
   regions[3](I): weight
   regions[4](O): output
 */
-void IncMultiHeadSelfAttentionVerify::inference_task(
+void TreeIncMultiHeadSelfAttention::inference_task(
     Task const *task,
     std::vector<PhysicalRegion> const &regions,
     Context ctx,
@@ -558,8 +553,8 @@ void IncMultiHeadSelfAttentionVerify::inference_task(
   assert(task->regions.size() == regions.size());
 
   TreeVerifyBatchConfig const *bc = (TreeVerifyBatchConfig *)task->args;
-  IncMultiHeadSelfAttentionVerifyMeta const *m =
-      *((IncMultiHeadSelfAttentionVerifyMeta **)task->local_args);
+  TreeIncMultiHeadSelfAttentionMeta const *m =
+      *((TreeIncMultiHeadSelfAttentionMeta **)task->local_args);
 
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
@@ -583,14 +578,14 @@ void IncMultiHeadSelfAttentionVerify::inference_task(
                       input_domain.get_volume(),
                       "[Attention:forward:query]"); */
 
-  IncMultiHeadSelfAttentionVerify::inference_kernel_wrapper(
+  TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
       m,
       bc,
       input.get_float_ptr(),
       weight.get_float_ptr(),
       output.get_float_ptr());
 #ifdef INFERENCE_TESTS
-  printf("Checking IncMultiHeadSelfAttentionVerify computations...\n");
+  printf("Checking TreeIncMultiHeadSelfAttention computations...\n");
 
   // =============================================================================
   //  Define helper functions to handle row-major arrays
@@ -1371,13 +1366,13 @@ void IncMultiHeadSelfAttentionVerify::inference_task(
   // Done with INFERENCE_TESTS block
 }
 
-void IncMultiHeadSelfAttentionVerify::backward(FFModel const &ff) {
-  // IncMultiHeadSelfAttentionVerify does not support backward
+void TreeIncMultiHeadSelfAttention::backward(FFModel const &ff) {
+  // TreeIncMultiHeadSelfAttention does not support backward
   assert(false);
 }
 
-bool IncMultiHeadSelfAttentionVerify::get_int_parameter(PMParameter para,
-                                                        int *value) const {
+bool TreeIncMultiHeadSelfAttention::get_int_parameter(PMParameter para,
+                                                      int *value) const {
   switch (para) {
     case PM_NUM_HEADS:
       *value = num_heads;
@@ -1387,13 +1382,13 @@ bool IncMultiHeadSelfAttentionVerify::get_int_parameter(PMParameter para,
   }
 }
 
-bool IncMultiHeadSelfAttentionVerify::measure_operator_cost(
+bool TreeIncMultiHeadSelfAttention::measure_operator_cost(
     Simulator *sim, MachineView const &mv, CostMetrics &cost_metrics) const {
   return false;
 }
 
-bool operator==(IncMultiHeadSelfAttentionVerifyParams const &lhs,
-                IncMultiHeadSelfAttentionVerifyParams const &rhs) {
+bool operator==(TreeIncMultiHeadSelfAttentionParams const &lhs,
+                TreeIncMultiHeadSelfAttentionParams const &rhs) {
   return lhs.layer_guid == rhs.layer_guid && lhs.embed_dim == rhs.embed_dim &&
          lhs.num_heads == rhs.num_heads && lhs.kdim == rhs.kdim &&
          lhs.vdim == rhs.vdim && lhs.dropout == rhs.dropout &&
@@ -1402,9 +1397,9 @@ bool operator==(IncMultiHeadSelfAttentionVerifyParams const &lhs,
          lhs.apply_rotary_embedding == rhs.apply_rotary_embedding;
 }
 
-IncMultiHeadSelfAttentionVerifyParams
-    IncMultiHeadSelfAttentionVerify::get_params() const {
-  IncMultiHeadSelfAttentionVerifyParams params;
+TreeIncMultiHeadSelfAttentionParams
+    TreeIncMultiHeadSelfAttention::get_params() const {
+  TreeIncMultiHeadSelfAttentionParams params;
   params.layer_guid = this->layer_guid;
   params.embed_dim = this->oProjSize;
   params.num_heads = this->num_heads;
@@ -1421,8 +1416,8 @@ IncMultiHeadSelfAttentionVerifyParams
 }; // namespace FlexFlow
 
 namespace std {
-size_t hash<FlexFlow::IncMultiHeadSelfAttentionVerifyParams>::operator()(
-    FlexFlow::IncMultiHeadSelfAttentionVerifyParams const &params) const {
+size_t hash<FlexFlow::TreeIncMultiHeadSelfAttentionParams>::operator()(
+    FlexFlow::TreeIncMultiHeadSelfAttentionParams const &params) const {
   size_t key = 0;
   hash_combine(key, params.layer_guid.id);
   hash_combine(key, params.embed_dim);
diff --git a/src/ops/inc_mha_verify.cpp b/src/ops/tree_inc_multihead_self_attention.cpp
similarity index 78%
rename from src/ops/inc_mha_verify.cpp
rename to src/ops/tree_inc_multihead_self_attention.cpp
index 42dccfd6cc..5e3fc240d5 100644
--- a/src/ops/inc_mha_verify.cpp
+++ b/src/ops/tree_inc_multihead_self_attention.cpp
@@ -13,7 +13,7 @@
  * limitations under the License.
  */
 
-#include "flexflow/ops/inc_mha_verify.h"
+#include "flexflow/ops/tree_inc_multihead_self_attention.h"
 #include "flexflow/utils/hip_helper.h"
 #include <hip/hip_runtime.h>
 
@@ -24,8 +24,8 @@ using Legion::coord_t;
 using Legion::Memory;
 
 /*static*/
-void IncMultiHeadSelfAttentionVerify::inference_kernel_wrapper(
-    IncMultiHeadSelfAttentionVerifyMeta const *m,
+void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
+    TreeIncMultiHeadSelfAttentionMeta const *m,
     TreeVerifyBatchConfig const *bc,
     float const *input_ptr,
     float const *weight_ptr,
@@ -40,7 +40,7 @@ void IncMultiHeadSelfAttentionVerify::inference_kernel_wrapper(
     hipEventRecord(t_start, stream);
   }
 
-  handle_unimplemented_hip_kernel(OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY);
+  handle_unimplemented_hip_kernel(OP_TREE_INC_MULTIHEAD_SELF_ATTENTION);
 
   if (m->profiling) {
     hipEventRecord(t_end, stream);
@@ -49,16 +49,16 @@ void IncMultiHeadSelfAttentionVerify::inference_kernel_wrapper(
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
     hipEventDestroy(t_start);
     hipEventDestroy(t_end);
-    printf("IncMultiHeadSelfAttentionVerify forward time = %.2fms\n", elapsed);
+    printf("TreeIncMultiHeadSelfAttention forward time = %.2fms\n", elapsed);
     // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
     // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
     // acc_output.rect, "[Attention:forward:output]");
   }
 }
 
-IncMultiHeadSelfAttentionVerifyMeta::IncMultiHeadSelfAttentionVerifyMeta(
+TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
     FFHandler handler,
-    IncMultiHeadSelfAttentionVerify const *attn,
+    TreeIncMultiHeadSelfAttention const *attn,
     float const *weight_ptr,
     Memory gpu_mem,
     int num_samples,
@@ -69,7 +69,6 @@ IncMultiHeadSelfAttentionVerifyMeta::IncMultiHeadSelfAttentionVerifyMeta(
   checkCUDNN(miopenSetStream(handler.dnn, stream));
 }
 
-IncMultiHeadSelfAttentionVerifyMeta::~IncMultiHeadSelfAttentionVerifyMeta(
-    void) {}
+TreeIncMultiHeadSelfAttentionMeta::~TreeIncMultiHeadSelfAttentionMeta(void) {}
 
 }; // namespace FlexFlow
diff --git a/src/ops/inc_mha_verify.cu b/src/ops/tree_inc_multihead_self_attention.cu
similarity index 70%
rename from src/ops/inc_mha_verify.cu
rename to src/ops/tree_inc_multihead_self_attention.cu
index c841addde9..c9b85f96b8 100644
--- a/src/ops/inc_mha_verify.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -15,7 +15,7 @@
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
 #include "cuComplex.h"
 #endif
-#include "flexflow/ops/inc_mha_verify.h"
+#include "flexflow/ops/tree_inc_multihead_self_attention.h"
 #include "flexflow/utils/cuda_helper.h"
 
 namespace FlexFlow {
@@ -24,12 +24,12 @@ namespace FlexFlow {
 using Legion::coord_t;
 using Legion::Memory;
 
-__global__ void mha_verify_build_w_out_tensor(float const *weight_ptr,
-                                              float *contiguous_weight_ptr,
-                                              int vProjSize,
-                                              int oProjSize,
-                                              int num_heads,
-                                              int qkv_weight_block_size) {
+__global__ void tree_build_w_out_tensor(float const *weight_ptr,
+                                        float *contiguous_weight_ptr,
+                                        int vProjSize,
+                                        int oProjSize,
+                                        int num_heads,
+                                        int qkv_weight_block_size) {
   CUDA_KERNEL_LOOP(i, vProjSize * oProjSize * num_heads) {
     int v_idx = i % vProjSize;
     int o_idx = (i / vProjSize) % oProjSize;
@@ -78,7 +78,7 @@ __global__ void commit_tokens_kernel(
   }
 }
 
-void commit_tokens(IncMultiHeadSelfAttentionVerifyMeta const *m,
+void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
                    TreeVerifyBatchConfig const *bc,
                    cudaStream_t stream) {
   int num_tokens_to_commit = bc->num_tokens_to_commit;
@@ -95,7 +95,7 @@ void commit_tokens(IncMultiHeadSelfAttentionVerifyMeta const *m,
                                      m->vProjSize,
                                      num_tokens_to_commit,
                                      m->num_heads,
-                                     MAX_SEQ_LEN,
+                                     BatchConfig::MAX_SEQ_LENGTH,
                                      /* k_cache = */ true);
 
     parallelism = m->vProjSize * num_tokens_to_commit * m->num_heads;
@@ -110,12 +110,12 @@ void commit_tokens(IncMultiHeadSelfAttentionVerifyMeta const *m,
                                      m->vProjSize,
                                      num_tokens_to_commit,
                                      m->num_heads,
-                                     MAX_SEQ_LEN,
+                                     BatchConfig::MAX_SEQ_LENGTH,
                                      /* k_cache = */ false);
   }
 }
 
-__global__ void mha_verify_apply_rotary_embedding(
+__global__ void tree_apply_rotary_embedding(
     float *input_ptr,
     cuFloatComplex *complex_input,
     TreeVerifyBatchConfig::PerTokenInfo const *tokenInfos,
@@ -176,13 +176,12 @@ __global__ void mha_verify_apply_rotary_embedding(
   }
 }
 
-void inference_kernel1(IncMultiHeadSelfAttentionVerifyMeta const *m,
-                       TreeVerifyBatchConfig const *bc,
-                       float const *input_ptr,
-                       float const *weight_ptr,
-                       float *output_ptr,
-                       cudaStream_t stream) {
-
+void compute_qkv_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
+                        TreeVerifyBatchConfig const *bc,
+                        float const *input_ptr,
+                        float const *weight_ptr,
+                        float *output_ptr,
+                        cudaStream_t stream) {
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
   float alpha = 1.0f, beta = 0.0f;
@@ -235,7 +234,6 @@ void inference_kernel1(IncMultiHeadSelfAttentionVerifyMeta const *m,
                                        m->num_heads,
                                        compute_type,
                                        CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-
   checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                        CUBLAS_OP_T,
                                        CUBLAS_OP_N,
@@ -283,7 +281,6 @@ void inference_kernel1(IncMultiHeadSelfAttentionVerifyMeta const *m,
                                        m->num_heads,
                                        compute_type,
                                        CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-
   // apply rotary emmmbedding for k and v
   // step1 change the k, v to complex tensor
   int num_tokens = bc->num_active_tokens();
@@ -297,73 +294,35 @@ void inference_kernel1(IncMultiHeadSelfAttentionVerifyMeta const *m,
                          num_tokens * m->qProjSize * m->num_heads *
                              sizeof(cuFloatComplex *) / 2));
     /*q*/
-    mha_verify_apply_rotary_embedding<<<GET_BLOCKS(parallelism),
-                                        min(CUDA_NUM_THREADS, parallelism),
-                                        0,
-                                        stream>>>(output_ptr,
-                                                  complex_input,
-                                                  m->token_infos,
-                                                  m->qProjSize,
-                                                  m->kProjSize,
-                                                  m->num_heads,
-                                                  num_tokens,
-                                                  q_block_size,
-                                                  k_block_size,
-                                                  v_block_size,
-                                                  true);
+    tree_apply_rotary_embedding<<<GET_BLOCKS(parallelism),
+                                  min(CUDA_NUM_THREADS, parallelism),
+                                  0,
+                                  stream>>>(output_ptr,
+                                            complex_input,
+                                            m->token_infos,
+                                            m->qProjSize,
+                                            m->kProjSize,
+                                            m->num_heads,
+                                            num_tokens,
+                                            q_block_size,
+                                            k_block_size,
+                                            v_block_size,
+                                            true);
     /*k*/
-    mha_verify_apply_rotary_embedding<<<GET_BLOCKS(parallelism),
-                                        min(CUDA_NUM_THREADS, parallelism),
-                                        0,
-                                        stream>>>(output_ptr,
-                                                  complex_input,
-                                                  m->token_infos,
-                                                  m->qProjSize,
-                                                  m->kProjSize,
-                                                  m->num_heads,
-                                                  num_tokens,
-                                                  q_block_size,
-                                                  k_block_size,
-                                                  v_block_size,
-                                                  false);
-  }
-}
-
-__global__ void initial_store_kv_cache(
-    float const *devQKVProjArray,
-    float *cache_ptr,
-    TreeVerifyBatchConfig::PerTokenInfo const *tokenInfos,
-    int qProjSize,
-    int kProjSize,
-    int vProjSize,
-    int num_tokens,
-    int num_heads,
-    int max_seq_len,
-    bool k_cache) {
-  CUDA_KERNEL_LOOP(i,
-                   num_tokens * (k_cache ? kProjSize : vProjSize) * num_heads) {
-    int proj_size = k_cache ? kProjSize : vProjSize;
-    int head_idx = i / (num_tokens * proj_size);
-    int token_idx = (i - head_idx * (num_tokens * proj_size)) / proj_size;
-    int data_idx = i % proj_size;
-
-    // only store the first branch initially, to avoid overwriting
-    if (tokenInfos[token_idx].tree_branch_idx == 0) {
-      int qkv_block_size = (qProjSize + kProjSize + vProjSize) * num_tokens;
-      int current_head_block_size =
-          num_tokens * (k_cache ? qProjSize : qProjSize + kProjSize);
-      float val =
-          devQKVProjArray[head_idx * qkv_block_size + current_head_block_size +
-                          token_idx * proj_size + data_idx];
-      // int const req_id = id_map[token_idx].request_index;
-      // int const tok_id = id_map[token_idx].token_position;
-      int const req_id = tokenInfos[token_idx].request_index;
-      int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
-
-      cache_ptr[req_id * (num_heads * max_seq_len * proj_size) +
-                head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
-                data_idx] = val;
-    }
+    tree_apply_rotary_embedding<<<GET_BLOCKS(parallelism),
+                                  min(CUDA_NUM_THREADS, parallelism),
+                                  0,
+                                  stream>>>(output_ptr,
+                                            complex_input,
+                                            m->token_infos,
+                                            m->qProjSize,
+                                            m->kProjSize,
+                                            m->num_heads,
+                                            num_tokens,
+                                            q_block_size,
+                                            k_block_size,
+                                            v_block_size,
+                                            false);
   }
 }
 
@@ -375,8 +334,7 @@ __global__ void update_tree_branch_kv_cache(
     int kProjSize,
     int vProjSize,
     int num_tokens_in_branch,
-    int num_tokens_previous_branches,
-    int num_tokens_previous_requests,
+    int processed_tokens_in_batch,
     int total_tokens_in_batch,
     int num_heads,
     int max_seq_len,
@@ -389,8 +347,7 @@ __global__ void update_tree_branch_kv_cache(
         (i / proj_size) % num_tokens_in_branch; // index in the tree branch
     int head_idx = i / (proj_size * num_tokens_in_branch);
 
-    token_idx += num_tokens_previous_branches; // get index in the whole request
-    token_idx += num_tokens_previous_requests; // get index in the whole batch
+    token_idx += processed_tokens_in_batch; // get index in the whole batch
     int qkv_block_size = (qProjSize + kProjSize + vProjSize) *
                          total_tokens_in_batch; // skip over previous heads
     int current_head_block_size =
@@ -410,50 +367,12 @@ __global__ void update_tree_branch_kv_cache(
   }
 }
 
-void inference_kernel2(IncMultiHeadSelfAttentionVerifyMeta const *m,
-                       TreeVerifyBatchConfig const *bc,
-                       cudaStream_t stream) {
-  int num_tokens = bc->num_active_tokens();
-  if (num_tokens > 0) {
-    int parallelism = m->kProjSize * num_tokens * m->num_heads;
-    initial_store_kv_cache<<<GET_BLOCKS(parallelism),
-                             min(CUDA_NUM_THREADS, parallelism),
-                             0,
-                             stream>>>(m->devQKVProjArray,
-                                       m->keyCache,
-                                       m->token_infos,
-                                       m->qProjSize,
-                                       m->kProjSize,
-                                       m->vProjSize,
-                                       num_tokens,
-                                       m->num_heads,
-                                       MAX_SEQ_LEN,
-                                       /* k_cache = */ true);
-
-    parallelism = m->vProjSize * num_tokens * m->num_heads;
-    initial_store_kv_cache<<<GET_BLOCKS(parallelism),
-                             min(CUDA_NUM_THREADS, parallelism),
-                             0,
-                             stream>>>(m->devQKVProjArray,
-                                       m->valueCache,
-                                       m->token_infos,
-                                       m->qProjSize,
-                                       m->kProjSize,
-                                       m->vProjSize,
-                                       num_tokens,
-                                       m->num_heads,
-                                       MAX_SEQ_LEN,
-                                       /* k_cache = */ false);
-  }
-}
-
-__global__ void
-    mha_verify_fill_entries_above_diagonal(float *matrix,
-                                           size_t num_rows,
-                                           size_t num_cols,
-                                           size_t num_heads,
-                                           size_t entries_above_diagonal,
-                                           float value) {
+__global__ void tree_fill_entries_above_diagonal(float *matrix,
+                                                 size_t num_rows,
+                                                 size_t num_cols,
+                                                 size_t num_heads,
+                                                 size_t entries_above_diagonal,
+                                                 float value) {
   CUDA_KERNEL_LOOP(i, entries_above_diagonal * num_heads) {
     size_t head_idx = i / entries_above_diagonal;
     size_t entry_idx = i % entries_above_diagonal;
@@ -464,10 +383,10 @@ __global__ void
   }
 }
 
-void inference_kernel3(IncMultiHeadSelfAttentionVerifyMeta const *m,
-                       TreeVerifyBatchConfig const *bc,
-                       float *output_ptr,
-                       cudaStream_t stream) {
+void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
+                              TreeVerifyBatchConfig const *bc,
+                              float *output_ptr,
+                              cudaStream_t stream) {
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
   cudaDataType_t cublas_data_type = ff_to_cuda_datatype(DT_FLOAT);
@@ -478,14 +397,12 @@ void inference_kernel3(IncMultiHeadSelfAttentionVerifyMeta const *m,
   cudaDataType_t compute_type = CUDA_R_32F;
 #endif
   // int num_requests = bc->num_active_requests();
-  int num_tokens = bc->num_active_tokens();
-  int tokens_previous_requests = 0;
-  int tokens_prev_requests_squares = 0;
+  int processed_tokens_in_batch = 0;
   int qkv_block_size =
-      (m->qProjSize + m->kProjSize + m->vProjSize) * num_tokens;
-  int kt_block_size = m->kProjSize * MAX_SEQ_LEN;
+      (m->qProjSize + m->kProjSize + m->vProjSize) * bc->num_active_tokens();
+  int kt_block_size = m->kProjSize * BatchConfig::MAX_SEQ_LENGTH;
   int kt_req_block_size = kt_block_size * m->num_heads;
-  int vt_block_size = m->vProjSize * MAX_SEQ_LEN;
+  int vt_block_size = m->vProjSize * BatchConfig::MAX_SEQ_LENGTH;
   int vt_req_block_size = vt_block_size * m->num_heads;
   assert(m->qProjSize == m->kProjSize);
 
@@ -493,35 +410,21 @@ void inference_kernel3(IncMultiHeadSelfAttentionVerifyMeta const *m,
     if (bc->request_completed[i]) {
       continue;
     }
-
-    int tokens_previous_tree_branches = 0;
-
-    while (tokens_previous_tree_branches <
-           bc->requestsInfo[i].num_tokens_in_batch) {
-      int tree_branch_idx = bc->tokensInfo[tokens_previous_requests +
-                                           tokens_previous_tree_branches]
-                                .tree_branch_idx;
+    int last_token_idx_of_the_request =
+        processed_tokens_in_batch + bc->requestsInfo[i].num_tokens_in_batch - 1;
+    while (processed_tokens_in_batch <= last_token_idx_of_the_request) {
       int num_new_tokens = 1;
-      for (int j = tokens_previous_requests + tokens_previous_tree_branches + 1;
-           j <
-           tokens_previous_requests + bc->requestsInfo[i].num_tokens_in_batch;
-           j++) {
-        if (bc->tokensInfo[j].tree_branch_idx != tree_branch_idx) {
-          break;
-        } else {
-          num_new_tokens++;
-        }
+      int j = num_new_tokens + processed_tokens_in_batch;
+      while ((j + 1 <= last_token_idx_of_the_request) &&
+             (bc->tokensInfo[j].abs_depth_in_request + 1 ==
+              bc->tokensInfo[j + 1].abs_depth_in_request)) {
+        j++;
+        num_new_tokens++;
       }
-      int total_tokens = bc->tokensInfo[tokens_previous_requests +
-                                        tokens_previous_tree_branches]
-                             .abs_depth_in_request +
-                         num_new_tokens;
-      assert(num_new_tokens >= 1 && total_tokens >= num_new_tokens);
-
-      if (tree_branch_idx == 0) {
-        assert(bc->tokensInfo[tokens_previous_requests].abs_depth_in_request ==
-               bc->requestsInfo[i].token_start_offset);
-      } else {
+
+      int total_tokens_in_request = bc->tokensInfo[j].abs_depth_in_request + 1;
+      assert(num_new_tokens >= 1 && total_tokens_in_request >= num_new_tokens);
+      {
         // update K-V cache
         int parallelism = m->kProjSize * num_new_tokens * m->num_heads;
         update_tree_branch_kv_cache<<<GET_BLOCKS(parallelism),
@@ -534,12 +437,11 @@ void inference_kernel3(IncMultiHeadSelfAttentionVerifyMeta const *m,
             m->qProjSize,
             m->kProjSize,
             m->vProjSize,
-            num_new_tokens,                // num_tokens_in_branch
-            tokens_previous_tree_branches, // num_tokens_previous_branches
-            tokens_previous_requests,      // num_tokens_previous_requests
+            num_new_tokens,            // num_tokens_in_branch
+            processed_tokens_in_batch, // num_processed_tokens_in_batch
             bc->requestsInfo[i].num_tokens_in_batch, // total_tokens_in_batch
             m->num_heads,
-            MAX_SEQ_LEN,
+            BatchConfig::MAX_SEQ_LENGTH,
             /* k_cache = */ true);
 
         parallelism = m->vProjSize * num_new_tokens * m->num_heads;
@@ -553,38 +455,33 @@ void inference_kernel3(IncMultiHeadSelfAttentionVerifyMeta const *m,
             m->qProjSize,
             m->kProjSize,
             m->vProjSize,
-            num_new_tokens,                // num_tokens_in_branch
-            tokens_previous_tree_branches, // num_tokens_previous_branches
-            tokens_previous_requests,      // num_tokens_previous_requests
+            num_new_tokens,            // num_tokens_in_branch
+            processed_tokens_in_batch, // num_processed_tokens_in_batch
             bc->requestsInfo[i].num_tokens_in_batch, // total_tokens_in_batch
             m->num_heads,
-            MAX_SEQ_LEN,
+            BatchConfig::MAX_SEQ_LENGTH,
             /* k_cache = */ false);
       }
 
-      // int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
-      /* int total_tokens = bc->requestsInfo[i].token_start_offset +
-                        bc->requestsInfo[i].num_tokens_in_batch; */
       // bc->token_last_available_idx[i] + 1;
       // Compute (QK^T/sqrt(d_k))
       int m_ = num_new_tokens;
-      int n = total_tokens;
+      int n = total_tokens_in_request;
       int k = m->qProjSize;
       int lda = k, ldb = k, ldc = m_;
       int strideA = qkv_block_size;
       int strideB = kt_block_size;
-      int strideC = num_new_tokens * total_tokens;
+      int strideC = num_new_tokens * total_tokens_in_request;
 
       float alpha = 1.0f / (float)sqrt(m->kProjSize), beta = 0.0f;
       // To get A, skip over Q entries from previous requests (same head)
       void const *A = (void const *)(m->devQKVProjArray +
-                                     tokens_previous_requests * m->qProjSize);
+                                     processed_tokens_in_batch * m->qProjSize);
       // To get B, skip over K entries from previous requests (all heads +
       // padding)
       void const *B = (void const *)(m->keyCache + i * kt_req_block_size);
       // To get C, skip over QK^T products from previous requests
-      void *C =
-          (void *)(m->qk_prods + m->num_heads * tokens_prev_requests_squares);
+      void *C = (void *)(m->qk_prods);
 
       checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                            CUBLAS_OP_T,
@@ -611,21 +508,20 @@ void inference_kernel3(IncMultiHeadSelfAttentionVerifyMeta const *m,
                                            CUBLAS_GEMM_DEFAULT_TENSOR_OP));
       // Fill all elements above diagonal in qk prods with -inf to force
       // causal attention.
-      assert(num_new_tokens <= total_tokens);
+      assert(num_new_tokens <= total_tokens_in_request);
       size_t entries_above_diagonal = num_new_tokens * (num_new_tokens - 1) / 2;
       if (entries_above_diagonal > 0) {
         size_t parallelism = m->num_heads * entries_above_diagonal;
-        mha_verify_fill_entries_above_diagonal<<<GET_BLOCKS(parallelism),
-                                                 min((size_t)CUDA_NUM_THREADS,
-                                                     parallelism),
-                                                 0,
-                                                 stream>>>(
-            (float *)C,
-            num_new_tokens,
-            total_tokens,
-            m->num_heads,
-            entries_above_diagonal,
-            -INFINITY);
+        tree_fill_entries_above_diagonal<<<GET_BLOCKS(parallelism),
+                                           min((size_t)CUDA_NUM_THREADS,
+                                               parallelism),
+                                           0,
+                                           stream>>>((float *)C,
+                                                     num_new_tokens,
+                                                     total_tokens_in_request,
+                                                     m->num_heads,
+                                                     entries_above_diagonal,
+                                                     -INFINITY);
       }
       // Compute Softmax(QK^T/sqrt(d_k))
       cudnnTensorDescriptor_t qk_tensor;
@@ -640,7 +536,7 @@ void inference_kernel3(IncMultiHeadSelfAttentionVerifyMeta const *m,
       // columns are the inner dimension and the images are the outermost
       // dimension.
       int n_param = m->num_heads;
-      int c_param = total_tokens;
+      int c_param = total_tokens_in_request;
       int h_param = 1;
       int w_param = num_new_tokens;
       checkCUDNN(cudnnSetTensor4dDescriptor(qk_tensor,
@@ -651,8 +547,7 @@ void inference_kernel3(IncMultiHeadSelfAttentionVerifyMeta const *m,
                                             h_param,
                                             w_param));
       alpha = 1.0f, beta = 0.0f;
-      void *C_softmax = (void *)(m->qk_prods_softmax +
-                                 m->num_heads * tokens_prev_requests_squares);
+      void *C_softmax = (void *)(m->qk_prods_softmax);
       // The softmax operation below is executed according to the
       // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
       // softmax operation is computed per spatial location (H,W) per image (N)
@@ -670,9 +565,9 @@ void inference_kernel3(IncMultiHeadSelfAttentionVerifyMeta const *m,
       alpha = 1.0f, beta = 0.0f;
       m_ = num_new_tokens;
       n = m->vProjSize;
-      k = total_tokens;
+      k = total_tokens_in_request;
       lda = m_, ldb = n, ldc = m_;
-      strideA = num_new_tokens * total_tokens;
+      strideA = num_new_tokens * total_tokens_in_request;
       strideB = vt_block_size;
       strideC = num_new_tokens * m->vProjSize;
       // To get A, skip over softmax(QK^T/sqrt(d_k)) entries from previous
@@ -684,7 +579,7 @@ void inference_kernel3(IncMultiHeadSelfAttentionVerifyMeta const *m,
       // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
       // requests
       C = (void *)(m->attn_heads +
-                   tokens_previous_requests * m->num_heads * m->vProjSize);
+                   processed_tokens_in_batch * m->num_heads * m->vProjSize);
 
       checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                            CUBLAS_OP_N,
@@ -717,7 +612,7 @@ void inference_kernel3(IncMultiHeadSelfAttentionVerifyMeta const *m,
       lda = k, ldb = n, ldc = m_;
       A = (void const *)m->W_out_contiguous;
       B = (void const *)C;
-      C = (void *)(output_ptr + tokens_previous_requests * m->oProjSize);
+      C = (void *)(output_ptr + processed_tokens_in_batch * m->oProjSize);
 
       checkCUDA(cublasGemmEx(m->handle.blas,
                              CUBLAS_OP_T,
@@ -738,18 +633,19 @@ void inference_kernel3(IncMultiHeadSelfAttentionVerifyMeta const *m,
                              ldc,
                              compute_type,
                              CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-      tokens_previous_tree_branches += num_new_tokens;
-      tokens_prev_requests_squares += num_new_tokens * total_tokens;
+      processed_tokens_in_batch += num_new_tokens;
     }
-    tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
+    // Before moving to the next request
+    // check that we have finished all tokens of the request
+    assert(last_token_idx_of_the_request + 1 == processed_tokens_in_batch);
   }
 
-  assert(tokens_previous_requests == num_tokens);
+  assert(processed_tokens_in_batch == bc->num_active_tokens());
 }
 
 /*static*/
-void IncMultiHeadSelfAttentionVerify::inference_kernel_wrapper(
-    IncMultiHeadSelfAttentionVerifyMeta const *m,
+void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
+    TreeIncMultiHeadSelfAttentionMeta const *m,
     TreeVerifyBatchConfig const *bc,
     float const *input_ptr,
     float const *weight_ptr,
@@ -776,17 +672,17 @@ void IncMultiHeadSelfAttentionVerify::inference_kernel_wrapper(
 
   if (!(*m->has_load_weights)) {
     int parallelism = m->vProjSize * m->oProjSize * m->num_heads;
-    mha_verify_build_w_out_tensor<<<GET_BLOCKS(parallelism),
-                                    min(CUDA_NUM_THREADS, parallelism),
-                                    0,
-                                    stream>>>(weight_ptr,
-                                              m->W_out_contiguous,
-                                              m->vProjSize,
-                                              m->oProjSize,
-                                              m->num_heads,
-                                              (m->qSize * m->qProjSize +
-                                               m->kSize * m->kProjSize +
-                                               m->vSize * m->vProjSize));
+    tree_build_w_out_tensor<<<GET_BLOCKS(parallelism),
+                              min(CUDA_NUM_THREADS, parallelism),
+                              0,
+                              stream>>>(weight_ptr,
+                                        m->W_out_contiguous,
+                                        m->vProjSize,
+                                        m->oProjSize,
+                                        m->num_heads,
+                                        (m->qSize * m->qProjSize +
+                                         m->kSize * m->kProjSize +
+                                         m->vSize * m->vProjSize));
     *m->has_load_weights = true;
   }
   // here because we need postion info in infernece 1
@@ -797,14 +693,15 @@ void IncMultiHeadSelfAttentionVerify::inference_kernel_wrapper(
                   cudaMemcpyHostToDevice,
                   stream);
   // phase 1: Implement kernel to compute KQV for input tokens
-  inference_kernel1(m, bc, input_ptr, weight_ptr, m->devQKVProjArray, stream);
+  compute_qkv_kernel(m, bc, input_ptr, weight_ptr, m->devQKVProjArray, stream);
 
-  // phase 2: Update key/val cache
-  inference_kernel2(m, bc, stream);
+  // phase 2: No need to update key/val cache
+  // IncMultiHeadSelfAttention::update_kv_cache_kernel(
+  //    m, bc, stream);
 
   // phase 3: Compute attention score
   // 3 kernels for pahse 3: matmul1 - softmax - matmal2
-  inference_kernel3(m, bc, output_ptr, stream);
+  compute_attention_kernel(m, bc, output_ptr, stream);
 
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
@@ -813,16 +710,16 @@ void IncMultiHeadSelfAttentionVerify::inference_kernel_wrapper(
     checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
     cudaEventDestroy(t_start);
     cudaEventDestroy(t_end);
-    printf("IncMultiHeadSelfAttentionVerify forward time = %.2fms\n", elapsed);
+    printf("TreeIncMultiHeadSelfAttention forward time = %.2fms\n", elapsed);
     // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
     // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
     // acc_output.rect, "[Attention:forward:output]");
   }
 }
 
-IncMultiHeadSelfAttentionVerifyMeta::IncMultiHeadSelfAttentionVerifyMeta(
+TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
     FFHandler handler,
-    IncMultiHeadSelfAttentionVerify const *attn,
+    TreeIncMultiHeadSelfAttention const *attn,
     float const *weight_ptr,
     Memory gpu_mem,
     int num_samples,
@@ -856,10 +753,10 @@ IncMultiHeadSelfAttentionVerifyMeta::IncMultiHeadSelfAttentionVerifyMeta(
   assert(!attn->add_bias_kv);
 
 #ifdef INFERENCE_TESTS
-  kcache = (float *)calloc(kProjSize * MAX_SEQ_LEN * num_heads *
+  kcache = (float *)calloc(kProjSize * BatchConfig::MAX_SEQ_LENGTH * num_heads *
                                TreeVerifyBatchConfig::MAX_NUM_REQUESTS,
                            sizeof(float));
-  vcache = (float *)calloc(vProjSize * MAX_SEQ_LEN * num_heads *
+  vcache = (float *)calloc(vProjSize * BatchConfig::MAX_SEQ_LENGTH * num_heads *
                                TreeVerifyBatchConfig::MAX_NUM_REQUESTS,
                            sizeof(float));
 #endif
@@ -872,10 +769,10 @@ IncMultiHeadSelfAttentionVerifyMeta::IncMultiHeadSelfAttentionVerifyMeta(
     size_t committed_tokeninfo_size = TreeVerifyBatchConfig::MAX_NUM_TOKENS;
     size_t key_cache_size = num_heads * kProjSize *
                             TreeVerifyBatchConfig::MAX_NUM_REQUESTS *
-                            MAX_SEQ_LEN;
+                            BatchConfig::MAX_SEQ_LENGTH;
     size_t value_cache_size = num_heads * vProjSize *
                               TreeVerifyBatchConfig::MAX_NUM_REQUESTS *
-                              MAX_SEQ_LEN;
+                              BatchConfig::MAX_SEQ_LENGTH;
     size_t tokeninfo_size = TreeVerifyBatchConfig::MAX_NUM_TOKENS;
     size_t qk_prod_size = TreeVerifyBatchConfig::MAX_NUM_TOKENS *
                           TreeVerifyBatchConfig::MAX_NUM_TOKENS * num_heads;
@@ -915,10 +812,10 @@ IncMultiHeadSelfAttentionVerifyMeta::IncMultiHeadSelfAttentionVerifyMeta(
     attn_heads = (float *)qk_prods_softmax + qk_prod_size;
     W_out_contiguous = (float *)attn_heads + attn_heads_size;
     int parallelism = vProjSize * oProjSize * num_heads;
-    mha_verify_build_w_out_tensor<<<GET_BLOCKS(parallelism),
-                                    min(CUDA_NUM_THREADS, parallelism),
-                                    0,
-                                    stream>>>(
+    tree_build_w_out_tensor<<<GET_BLOCKS(parallelism),
+                              min(CUDA_NUM_THREADS, parallelism),
+                              0,
+                              stream>>>(
         weight_ptr,
         W_out_contiguous,
         vProjSize,
@@ -930,8 +827,7 @@ IncMultiHeadSelfAttentionVerifyMeta::IncMultiHeadSelfAttentionVerifyMeta(
   cudaStreamSynchronize(stream);
 }
 
-IncMultiHeadSelfAttentionVerifyMeta::~IncMultiHeadSelfAttentionVerifyMeta(
-    void) {
+TreeIncMultiHeadSelfAttentionMeta::~TreeIncMultiHeadSelfAttentionMeta(void) {
   reserveInst.destroy();
 #ifdef INFERENCE_TESTS
   free(kcache);
diff --git a/src/runtime/ffconst_utils.cc b/src/runtime/ffconst_utils.cc
index 8c2096b694..39e797ea42 100644
--- a/src/runtime/ffconst_utils.cc
+++ b/src/runtime/ffconst_utils.cc
@@ -149,10 +149,10 @@ std::string get_operator_type_name(OperatorType type) {
       return "MultiHeadAttention";
     case OP_INC_MULTIHEAD_SELF_ATTENTION:
       return "IncMultiHeadSelfAttention";
-    case OP_SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION:
-      return "SpeculativeIncMultiHeadSelfAttention";
-    case OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY:
-      return "IncMultiHeadSelfAttentionVerify";
+    case OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION:
+      return "SpecIncMultiHeadSelfAttention";
+    case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION:
+      return "TreeIncMultiHeadSelfAttention";
     case OP_INPUT:
       return "Input";
     case OP_WEIGHT:
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index 81fa9e4595..2a382f0d71 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -31,7 +31,6 @@
 #include "flexflow/ops/flat.h"
 #include "flexflow/ops/gather.h"
 #include "flexflow/ops/groupby.h"
-#include "flexflow/ops/inc_mha_verify.h"
 #include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ops/layer_norm.h"
 #include "flexflow/ops/linear.h"
@@ -45,6 +44,7 @@
 #include "flexflow/ops/split.h"
 #include "flexflow/ops/topk.h"
 #include "flexflow/ops/transpose.h"
+#include "flexflow/ops/tree_inc_multihead_self_attention.h"
 #include "flexflow/parallel_ops/combine.h"
 #include "flexflow/parallel_ops/fused_parallel_op.h"
 #include "flexflow/parallel_ops/partition.h"
@@ -2277,7 +2277,7 @@ GraphOptimalViewSerialized
         sez.serialize(attn->apply_rotary_embedding);
         break;
       }
-      case OP_SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION: {
+      case OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION: {
         SpecIncMultiHeadSelfAttention *attn =
             (SpecIncMultiHeadSelfAttention *)op;
         sez.serialize(attn->layer_guid.id);
@@ -2292,9 +2292,9 @@ GraphOptimalViewSerialized
         sez.serialize(attn->apply_rotary_embedding);
         break;
       }
-      case OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY: {
-        IncMultiHeadSelfAttentionVerify *attn =
-            (IncMultiHeadSelfAttentionVerify *)op;
+      case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION: {
+        TreeIncMultiHeadSelfAttention *attn =
+            (TreeIncMultiHeadSelfAttention *)op;
         sez.serialize(attn->layer_guid.id);
         sez.serialize(attn->oProjSize);
         sez.serialize(attn->num_heads);
@@ -2698,7 +2698,7 @@ void FFModel::deserialize_graph_optimal_view(
         node = get_or_create_node<IncMultiHeadSelfAttention>(inputs[0], params);
         break;
       }
-      case OP_SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION: {
+      case OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(num_inputs == 1);
         int embed_dim, num_heads, k_dim, v_dim;
         float dropout;
@@ -2731,7 +2731,7 @@ void FFModel::deserialize_graph_optimal_view(
                                                                  params);
         break;
       }
-      case OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY: {
+      case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(num_inputs == 1);
         int embed_dim, num_heads, k_dim, v_dim;
         float dropout;
@@ -2749,7 +2749,7 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(add_zero_attn);
         dez.deserialize(apply_rotary_embedding);
 
-        IncMultiHeadSelfAttentionVerifyParams params;
+        TreeIncMultiHeadSelfAttentionParams params;
         params.embed_dim = embed_dim;
         params.num_heads = num_heads;
         params.kdim = k_dim;
@@ -2760,8 +2760,8 @@ void FFModel::deserialize_graph_optimal_view(
         params.add_zero_attn = add_zero_attn;
         params.layer_guid = layer_guid;
         params.apply_rotary_embedding = apply_rotary_embedding;
-        node = get_or_create_node<IncMultiHeadSelfAttentionVerify>(inputs[0],
-                                                                   params);
+        node = get_or_create_node<TreeIncMultiHeadSelfAttention>(inputs[0],
+                                                                 params);
         break;
       }
       case OP_TOPK: {
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 4b8bb032d8..f3e8664161 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -42,7 +42,6 @@
 #include "flexflow/ops/fused.h"
 #include "flexflow/ops/gather.h"
 #include "flexflow/ops/groupby.h"
-#include "flexflow/ops/inc_mha_verify.h"
 #include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ops/layer_norm.h"
 #include "flexflow/ops/linear.h"
@@ -57,6 +56,7 @@
 #include "flexflow/ops/split.h"
 #include "flexflow/ops/topk.h"
 #include "flexflow/ops/transpose.h"
+#include "flexflow/ops/tree_inc_multihead_self_attention.h"
 #include "flexflow/parallel_ops/combine.h"
 #include "flexflow/parallel_ops/fused_parallel_op.h"
 #include "flexflow/parallel_ops/partition.h"
@@ -2765,7 +2765,7 @@ Op *FFModel::create_operator_from_layer(
       operators.push_back(op);
       return op;
     }
-    case OP_SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION: {
+    case OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION: {
       Op *op = SpecIncMultiHeadSelfAttention::create_operator_from_layer(
           *this, layer, inputs);
       operators.push_back(op);
@@ -2777,8 +2777,8 @@ Op *FFModel::create_operator_from_layer(
       operators.push_back(op);
       return op;
     }
-    case OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY: {
-      Op *op = IncMultiHeadSelfAttentionVerify::create_operator_from_layer(
+    case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION: {
+      Op *op = TreeIncMultiHeadSelfAttention::create_operator_from_layer(
           *this, layer, inputs);
       operators.push_back(op);
       return op;
@@ -4650,7 +4650,7 @@ void register_flexflow_internal_tasks() {
   // speculative MultiHeadAttention task
   {
     TaskVariantRegistrar registrar(
-        SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
+        SPEC_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
         "Speculative IncMultiHeadSelfAttention Init");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
@@ -4660,7 +4660,7 @@ void register_flexflow_internal_tasks() {
   }
   {
     TaskVariantRegistrar registrar(
-        SPECULATIVE_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
+        SPEC_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
         "Speculative IncMultiHeadSelfAttention Inference");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
@@ -4670,24 +4670,23 @@ void register_flexflow_internal_tasks() {
   }
   {
     TaskVariantRegistrar registrar(
-        INC_MULTIHEAD_SELF_ATTENTION_VERIFY_INIT_TASK_ID,
-        "IncMultiHeadSelfAttentionVerify Init");
+        TREE_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
+        "TreeIncMultiHeadSelfAttention Init");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<
-        OpMeta *,
-        IncMultiHeadSelfAttentionVerify::init_task>(
-        registrar, "IncMultiHeadSelfAttentionVerify Init Task");
+    Runtime::preregister_task_variant<OpMeta *,
+                                      TreeIncMultiHeadSelfAttention::init_task>(
+        registrar, "TreeIncMultiHeadSelfAttention Init Task");
   }
   {
     TaskVariantRegistrar registrar(
-        INC_MULTIHEAD_SELF_ATTENTION_VERIFY_INF_TASK_ID,
-        "IncMultiHeadSelfAttentionVerify Inference");
+        TREE_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
+        "TreeIncMultiHeadSelfAttention Inference");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
     Runtime::preregister_task_variant<
-        IncMultiHeadSelfAttentionVerify::inference_task>(
-        registrar, "IncMultiHeadSelfAttentionVerify Inference Task");
+        TreeIncMultiHeadSelfAttention::inference_task>(
+        registrar, "TreeIncMultiHeadSelfAttention Inference Task");
   }
   // NoOp
   {
diff --git a/src/runtime/operator_params.cc b/src/runtime/operator_params.cc
index 19b6ac6b04..cd5e68d750 100644
--- a/src/runtime/operator_params.cc
+++ b/src/runtime/operator_params.cc
@@ -17,7 +17,6 @@
 #include "flexflow/ops/flat.h"
 #include "flexflow/ops/gather.h"
 #include "flexflow/ops/groupby.h"
-#include "flexflow/ops/inc_mha_verify.h"
 #include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ops/layer_norm.h"
 #include "flexflow/ops/linear.h"
@@ -33,6 +32,7 @@
 #include "flexflow/ops/split.h"
 #include "flexflow/ops/topk.h"
 #include "flexflow/ops/transpose.h"
+#include "flexflow/ops/tree_inc_multihead_self_attention.h"
 #include "flexflow/parallel_ops/combine.h"
 #include "flexflow/parallel_ops/fused_parallel_op.h"
 #include "flexflow/parallel_ops/partition.h"
@@ -86,8 +86,8 @@ tl::optional<OperatorParameters> get_op_parameters(Op const *op) {
       return ((MultiHeadAttention *)op)->get_params();
     case OP_INC_MULTIHEAD_SELF_ATTENTION:
       return ((IncMultiHeadSelfAttention *)op)->get_params();
-    case OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY:
-      return ((IncMultiHeadSelfAttentionVerify *)op)->get_params();
+    case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION:
+      return ((TreeIncMultiHeadSelfAttention *)op)->get_params();
     case OP_LAYERNORM:
       return ((LayerNorm *)op)->get_params();
     case OP_REDUCE_SUM:
diff --git a/src/runtime/substitution.cc b/src/runtime/substitution.cc
index c353d8fa16..0c2a2e3f84 100644
--- a/src/runtime/substitution.cc
+++ b/src/runtime/substitution.cc
@@ -28,7 +28,6 @@
 #include "flexflow/ops/embedding.h"
 #include "flexflow/ops/experts.h"
 #include "flexflow/ops/flat.h"
-#include "flexflow/ops/inc_mha_verify.h"
 #include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ops/linear.h"
 #include "flexflow/ops/noop.h"
@@ -36,6 +35,7 @@
 #include "flexflow/ops/rms_norm.h"
 #include "flexflow/ops/softmax.h"
 #include "flexflow/ops/split.h"
+#include "flexflow/ops/tree_inc_multihead_self_attention.h"
 #include "flexflow/parallel_ops/combine.h"
 #include "flexflow/parallel_ops/fused_parallel_op.h"
 #include "flexflow/parallel_ops/partition.h"
@@ -3715,12 +3715,12 @@ bool FFModel::convert_graph_to_operators(
         new_op = new IncMultiHeadSelfAttention(*this, *attn, inputs[0], true);
         break;
       }
-      case OP_INC_MULTIHEAD_SELF_ATTENTION_VERIFY: {
+      case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(inList.size() == 1);
-        IncMultiHeadSelfAttentionVerify *attn =
-            (IncMultiHeadSelfAttentionVerify *)node.ptr;
+        TreeIncMultiHeadSelfAttention *attn =
+            (TreeIncMultiHeadSelfAttention *)node.ptr;
         new_op =
-            new IncMultiHeadSelfAttentionVerify(*this, *attn, inputs[0], true);
+            new TreeIncMultiHeadSelfAttention(*this, *attn, inputs[0], true);
         break;
       }
       case OP_RMS_NORM: {

From 577cec87a1d9ce782583a693fcd58187feed5679 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Mon, 8 May 2023 13:23:59 -0500
Subject: [PATCH 107/344] Support multiple FFModels in inference (#713)

* Support multiple FFModels in a single top_level_task

* rename operators and bug fixes

* format

* add missing files

* rocm fix

* Support multiple FFModels for speculative inference

* add missing files

* format

---------

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
---
 examples/cpp/inference/LLAMA/llama.cc         |   2 +-
 .../cpp/inference/SPEC_LLAMA/CMakeLists.txt   |   4 +-
 examples/cpp/inference/SPEC_LLAMA/llama.cc    | 333 ++++++------------
 examples/cpp/inference/SPEC_LLAMA/llama.h     | 112 ------
 .../cpp/inference/mixture_of_experts/moe.cc   |   2 +-
 examples/cpp/inference/models/llama.cc        | 206 +++++++++++
 examples/cpp/inference/models/llama.h         |  67 ++++
 .../inference/transformers/transformers.cc    |   2 +-
 include/flexflow/batch_config.h               |  11 +-
 include/flexflow/config.h                     |   2 +-
 include/flexflow/ffconst.h                    |   6 +
 include/flexflow/inference.h                  |   9 +-
 src/ops/tree_inc_multihead_self_attention.cu  |   3 +-
 src/runtime/batch_config.cc                   |   2 +
 src/runtime/cuda_helper.cu                    |   2 +-
 src/runtime/inference_manager.cc              |  10 +-
 src/runtime/model.cc                          |  12 +-
 src/runtime/request_manager.cc                |  48 ++-
 18 files changed, 468 insertions(+), 365 deletions(-)
 delete mode 100644 examples/cpp/inference/SPEC_LLAMA/llama.h
 create mode 100644 examples/cpp/inference/models/llama.cc
 create mode 100644 examples/cpp/inference/models/llama.h

diff --git a/examples/cpp/inference/LLAMA/llama.cc b/examples/cpp/inference/LLAMA/llama.cc
index ac25f70467..d4f17b3d9b 100644
--- a/examples/cpp/inference/LLAMA/llama.cc
+++ b/examples/cpp/inference/LLAMA/llama.cc
@@ -166,7 +166,7 @@ void FlexFlow::top_level_task(Task const *task,
 
   //------------------- compile the model --------------------------------
   std::cout << "------start compile ----------" << std::endl;
-  InferenceManager im(&ff, llamaConfig.batchSize, 1);
+  InferenceManager im(ff.config, llamaConfig.batchSize, 1);
   im.compile_model_and_allocate_buffer(&ff, mapping);
   RequestManager rm;
 
diff --git a/examples/cpp/inference/SPEC_LLAMA/CMakeLists.txt b/examples/cpp/inference/SPEC_LLAMA/CMakeLists.txt
index d6ceb38ff4..f273a385ea 100644
--- a/examples/cpp/inference/SPEC_LLAMA/CMakeLists.txt
+++ b/examples/cpp/inference/SPEC_LLAMA/CMakeLists.txt
@@ -7,8 +7,8 @@ set(project_target SPEC_LLAMA)
 set(CPU_SRC
   ${FLEXFLOW_CPP_DRV_SRC}
   llama.cc
-  llama.h
-  ../file_loader.cc)
+  ../file_loader.cc
+  ../models/llama.cc)
 
 
 cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
diff --git a/examples/cpp/inference/SPEC_LLAMA/llama.cc b/examples/cpp/inference/SPEC_LLAMA/llama.cc
index ae5c4948e7..6cdc44f339 100644
--- a/examples/cpp/inference/SPEC_LLAMA/llama.cc
+++ b/examples/cpp/inference/SPEC_LLAMA/llama.cc
@@ -13,14 +13,14 @@
  * limitations under the License.
  */
 
-#include "llama.h"
+#include "models/llama.h"
 #include "flexflow/inference.h"
 
 using namespace Legion;
 
 LegionRuntime::Logger::Category log_app("llama");
 
-void parse_input_args(char **argv, int argc, LLAMAConfig &config) {
+void parse_input_args(char **argv, int argc, LLAMA::Config &config) {
   for (int i = 1; i < argc; i++) {
     // input
     if (!strcmp(argv[i], "--dataset")) {
@@ -41,239 +41,48 @@ void FlexFlow::top_level_task(Task const *task,
                               Context ctx,
                               Runtime *runtime) {
   FFConfig ffconfig;
-  LLAMAConfig llamaConfig;
-  FFModel ff(ffconfig);
-  //------------------------------compute machine views ------------------
-  int num_devices = ffconfig.workersPerNode * ffconfig.numNodes;
-  std::vector<MachineView> machine_views;
-  for (int i = 0; i < num_devices; i++) {
-    MachineView view;
-    view.device_type = MachineView::GPU;
-    view.ndims = 1;
-    view.dim[0] = 1;
-    view.stride[0] = 0;
-    view.start_device_id = i;
-    machine_views.push_back(view);
-  }
-
-  std::unordered_map<Tensor, std::vector<MachineView>> mapping;
-  std::unordered_map<std::string, Layer *> weights_layers;
+  LLAMA::Config llama_config;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
   char **argv = command_args.argv;
   int argc = command_args.argc;
-  parse_input_args(argv, argc, llamaConfig);
-
-  std::cout << "print llama config: " << llamaConfig.input_path << "-->"
-            << llamaConfig.batchSize << std::endl;
-
-  //------------------------------ build the model --------------------------
-  Tensor input;
-  {
-    int const token_dims[] = {llamaConfig.batchSize, llamaConfig.max_seq_len};
-    input = ff.create_tensor<2>(token_dims, DT_INT32);
-  }
-
-  mapping[input].push_back(machine_views[0]);
-
-  Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
-  Tensor token = ff.embedding(input,
-                              llamaConfig.vocab_size,
-                              llamaConfig.dim,
-                              AGGR_MODE_NONE,
-                              DT_FLOAT,
-                              NULL,
-                              embed_init);
-  Layer *embedding = ff.layers.back();
-  weights_layers.emplace("tok_embeddings_weight", embedding);
-
-  // std::cout << "------token shape";
-  // std::cout << token->num_dims << "------\n";
-  // for (int i = 0; i < token->num_dims; i++) {
-  //   std::cout << token->dims[i] << "------\n";
-  // }
-
-  // n transformer blocks impl
-  int num_transformer_layers_per_gpu = (32 + num_devices - 1) / num_devices;
-
-  for (int i = 0; i < 32; i++) {
-    // step 1: attention
-    std::vector<int> axes = {2};
-    Tensor att_norm = ff.rms_norm(token, llamaConfig.norm_eps, llamaConfig.dim);
-    Layer *attention_norm = ff.layers.back();
-
-    if (i % num_transformer_layers_per_gpu == 0) {
-      // Map att_norm to the next GPU
-      // since the size of att_norm is minimum across
-      // all tensors
-      mapping[att_norm].push_back(
-          machine_views[i / num_transformer_layers_per_gpu]);
-    }
-
-    weights_layers.emplace("layers_" + std::to_string(i) +
-                               "_attention_norm_weight",
-                           attention_norm);
-
-    // std::cout << "------before att shape";
-    // std::cout << att_norm->num_dims << "------\n";
-    // for (int i = 0; i < att_norm->num_dims; i++) {
-    //   std::cout << att_norm->dims[i] << "------\n";
-    // }
-    Tensor mha = ff.spec_inc_multihead_self_attention(
-        att_norm,
-        llamaConfig.dim,
-        llamaConfig.n_heads,
-        llamaConfig.dim / llamaConfig.n_heads,
-        llamaConfig.dim / llamaConfig.n_heads,
-        0.0f,
-        true,
-        false,
-        false,
-        NULL,
-        true);
-    Layer *attention_layer = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) + "_attention_weight",
-                           attention_layer);
-    token = ff.add(token, mha);
-
-    // step 2: SILU activaion
-    Tensor ff_norm = ff.rms_norm(token, llamaConfig.norm_eps, llamaConfig.dim);
-    Layer *ffn_layer = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) + "_ffn_norm_weight",
-                           ffn_layer);
-
-    Tensor w1 = ff.dense(ff_norm, llamaConfig.hidden_dim, AC_MODE_NONE, false);
-    Layer *w1_layer = ff.layers.back();
-    weights_layers.emplace(
-        "layers_" + std::to_string(i) + "_feed_forward_w1_weight", w1_layer);
-
-    Tensor w3 = ff.dense(ff_norm, llamaConfig.hidden_dim, AC_MODE_NONE, false);
-    Layer *w3_layer = ff.layers.back();
-    weights_layers.emplace(
-        "layers_" + std::to_string(i) + "_feed_forward_w3_weight", w3_layer);
-
-    Tensor sigmoid = ff.sigmoid(w1);
-    Tensor silu = ff.multiply(w1, sigmoid);
-    Tensor multi = ff.multiply(silu, w3);
-
-    Tensor w2 = ff.dense(multi, llamaConfig.dim, AC_MODE_NONE, false);
-    Layer *w2_layer = ff.layers.back();
-    weights_layers.emplace(
-        "layers_" + std::to_string(i) + "_feed_forward_w2_weight", w2_layer);
-    token = ff.add(token, w2);
-  }
-
-  // final normalization and linear
-  std::vector<int> axes = {2};
-  token = ff.rms_norm(token, 1e-6, 4096);
-  Layer *final_norm = ff.layers.back();
-  weights_layers.emplace("norm_weight", final_norm);
-
-  Tensor dense = ff.dense(token, llamaConfig.vocab_size, AC_MODE_NONE, false);
-  Layer *final_linear = ff.layers.back();
-  weights_layers.emplace("output_weight", final_linear);
-
-  Tensor softmax = ff.softmax(dense, -1);
-  Tensor output = ff.beam_top_k(softmax, llamaConfig.max_beam_width, false);
-
-  //------------------- compile the model --------------------------------
-  std::cout << "------start compile ----------" << std::endl;
-  InferenceManager im(&ff, llamaConfig.batchSize, 1);
-  im.compile_model_and_allocate_buffer(&ff, mapping);
+  parse_input_args(argv, argc, llama_config);
+  InferenceManager im(ffconfig, llama_config.batchSize, 1);
   RequestManager rm;
+  // Add a single request
+  std::vector<BatchConfig::TokenId> prompt{
+      1, 306, 4658, 278, 6593, 310, 2834, 338};
+  rm.register_new_request(prompt, llama_config.sentence_len);
 
-  // std::cout << "------init ops----------" << std::endl;
-  // im.init_operators_inference();
-  // std::cout << "------model compiled and init ----------" << std::endl;
-
-  //------------------------------ load inputs --------------------------
-  std::cout << "------create dataloaders ----------" << std::endl;
-  // read prompt into input
-  ParallelTensor input_pt;
-  ff.get_parallel_tensor_from_tensor(input, input_pt);
-  assert(im.tensor_buffer.find(input_pt) != im.tensor_buffer.end());
-  std::cout << im.tensor_buffer[input_pt].size() << std::endl;
-  // DataLoader loader(ff, &llamaConfig, im.tensor_buffer[input_pt].at(0));
+  FFModel beam_model(ffconfig), tree_model(ffconfig), inc_model(ffconfig);
+  LLAMA::create_llama_model(beam_model, im, llama_config, 1, BEAM_SEARCH_MODE);
+  LLAMA::create_llama_model(tree_model, im, llama_config, 1, TREE_VERIFY_MODE);
+  LLAMA::create_llama_model(inc_model, im, llama_config, 1, INC_DECODING_MODE);
 
-  //------------------------------ load weights---------------------------
-  // for (auto &v : weights_layers) {
-  //   Tensor weight = v.second->weights[0];
-  //   std::cout << "weights layer: " << v.first << "\n";
-
-  //   if (weight == NULL) {
-  //     std::cout << "op no weights : " << v.first << "\n";
-  //     continue;
-  //   }
-
-  //   size_t volume = 1;
-  //   std::vector<int> dims_vec;
-  //   for (int i = 0; i < weight->num_dims; i++) {
-  //     dims_vec.push_back(weight->dims[i]);
-  //     volume *= weight->dims[i];
-  //   }
-
-  //   assert(weight->data_type == DT_FLOAT);
-  //   float *data = (float *)malloc(sizeof(float) * volume);
-
-  //   if (v.first.find("attention_w") != std::string::npos) {
-  //     loader.load_attention_weights(
-  //         data, volume, v.first, llamaConfig.weight_file_path);
-
-  //   } else {
-  //     loader.load_from_file(
-  //         data, volume, llamaConfig.weight_file_path + v.first);
-  //   }
-
-  //   ParallelTensor weight_pt;
-  //   ff.get_parallel_tensor_from_tensor(weight, weight_pt);
-  //   weight_pt->set_tensor<float>(&ff, dims_vec, data);
-  // }
-
-  FileDataLoader fileloader(llamaConfig.input_path,
-                            llamaConfig.weight_file_path);
-  BatchConfig::TokenId *tokens = fileloader.generate_requests(
-      llamaConfig.batchSize, llamaConfig.max_seq_len);
-
-  for (int i = 0; i < 40; i++) {
-    std::cout << tokens[i] << ", ";
-  }
-  for (int i = 0; i < llamaConfig.batchSize; i++) {
-    std::cout << "-------" << std::endl;
-    std::vector<BatchConfig::TokenId> prompt(
-        tokens + i * llamaConfig.max_seq_len,
-        tokens + (i + 1) * llamaConfig.max_seq_len);
-    rm.register_new_request(prompt, llamaConfig.sentence_len);
-  }
-
-  fileloader.load_weights(&ff, weights_layers);
-
-  std::cout << "------load wieght finished----------" << std::endl;
-
-  //------------------------------ do inference, we only have 5 prompts for the
-  // test case, so simplify the batch_configs with 1
-  im.init_operators_inference(&ff);
   // entry---------------------------
   int depth = 0;
-  std::map<int, Future> future_handlers;
-  std::map<int, BeamSearchBatchConfig> batch_configs;
+  std::map<int, Future> beam_future_handlers, tree_future_handler;
+  std::map<int, BeamSearchBatchConfig> beam_batch_configs;
+  std::map<int, TreeVerifyBatchConfig> tree_batch_configs;
 
   bool new_req = true;
+  TreeVerifyBatchConfig tree_bc;
 
-  while (depth < llamaConfig.max_beam_depth) {
+  while (depth < llama_config.max_beam_depth) {
     int bid = 0;
-    if (future_handlers.find(bid) == future_handlers.end()) {
+    if (beam_future_handlers.find(bid) == beam_future_handlers.end()) {
       BeamSearchBatchConfig bc;
       BeamInferenceResult ir;
       bc = rm.prepare_next_batch_beam(bc, ir);
 
       std::cout << "sub_requests: " << bc.sub_requests[0] << "\n";
-      FutureMap fm = im.inference(&ff, bid, bc);
+      FutureMap fm = im.inference(&beam_model, bid, bc);
       assert(fm.get_future_map_domain().get_volume() == 1);
-      future_handlers[bid] = fm.get_future(0);
-      batch_configs[bid] = bc;
+      beam_future_handlers[bid] = fm.get_future(0);
+      beam_batch_configs[bid] = bc;
     } else {
       // have luanched this bid
-      Future future = future_handlers[bid];
+      Future future = beam_future_handlers[bid];
       if (!future.is_ready(true /*subscribe*/)) {
         continue;
       } else {
@@ -281,26 +90,106 @@ void FlexFlow::top_level_task(Task const *task,
       }
       // process end
       BeamInferenceResult ir = future.get_result<BeamInferenceResult>();
-      BeamSearchBatchConfig bc = batch_configs[bid];
+      BeamSearchBatchConfig bc = beam_batch_configs[bid];
       depth = bc.beamRequestsInfo[0].current_depth;
       bc = rm.prepare_next_batch_beam(bc, ir);
 
       std::cout << "llama current depth: " << depth << std::endl;
       std::cout << "sub_requests: " << bc.sub_requests[0] << "\n";
-      FutureMap fm = im.inference(&ff, bid, bc);
+      FutureMap fm = im.inference(&beam_model, bid, bc);
       assert(fm.get_future_map_domain().get_volume() == 1);
-      future_handlers[bid] = fm.get_future(0);
-      batch_configs[bid] = bc;
+      beam_future_handlers[bid] = fm.get_future(0);
+      beam_batch_configs[bid] = bc;
 
       // tranverse the tree in dfs order;
-      if (depth >= llamaConfig.max_beam_depth) {
-        std::cout << "tranverse the tree"
-                  << "\n";
-        rm.tranverse_beam_tree(bc);
+      if (depth >= llama_config.max_beam_depth) {
+        // std::cout << "tranverse the tree"
+        //           << "\n";
+        // rm.tranverse_beam_tree(bc);
+        tree_bc = rm.convert_beam_to_tree_batch_config(bc);
       }
     }
   }
 
+  // original
+  {
+    std::vector<BatchConfig::TokenId> tokens{1,
+                                             306,
+                                             4658,
+                                             278,
+                                             6593,
+                                             310,
+                                             2834,
+                                             338,
+                                             593,
+                                             595,
+                                             17252,
+                                             5031,
+                                             993,
+                                             616,
+                                             368,
+                                             2302};
+    BatchConfig bc;
+    bc.num_tokens = 16;
+    bc.requestsInfo[0].num_tokens_in_batch = bc.num_tokens;
+    bc.requestsInfo[0].token_start_offset = 0;
+    bc.requestsInfo[0].max_sequence_length = 347;
+    bc.requestsInfo[0].request_guid = 1000000;
+    bc.request_completed[0] = false;
+    for (int i = 0; i < bc.num_tokens; i++) {
+      bc.tokensInfo[i].token_id = tokens[i];
+      bc.tokensInfo[i].abs_depth_in_request = i;
+      bc.tokensInfo[i].request_index = 0;
+    }
+    FutureMap fm = im.inference(&inc_model, 0, bc);
+    assert(fm.get_future_map_domain().get_volume() == 1);
+    Future future = fm.get_future(0);
+    InferenceResult ir = future.get_result<InferenceResult>();
+    for (int i = 0; i < bc.num_tokens; i++) {
+      printf("decoding_tokens[%d] = %d\n", i, ir.token_ids[i]);
+    }
+  }
+
+  // verification
+  {
+    std::vector<BatchConfig::TokenId> tokens{1,
+                                             306,
+                                             4658,
+                                             278,
+                                             6593,
+                                             310,
+                                             2834,
+                                             338,
+                                             593,
+                                             595,
+                                             17252,
+                                             5031,
+                                             993,
+                                             616,
+                                             368,
+                                             2302};
+    tree_bc.num_tokens = 16;
+    tree_bc.requestsInfo[0].num_tokens_in_batch = tree_bc.num_tokens;
+    for (int i = 0; i < tree_bc.num_tokens; i++) {
+      tree_bc.tokensInfo[i].token_id = tokens[i];
+      tree_bc.tokensInfo[i].abs_depth_in_request = i;
+      tree_bc.tokensInfo[i].request_index = 0;
+    }
+    FutureMap fm = im.inference(&tree_model, 0, tree_bc);
+    assert(fm.get_future_map_domain().get_volume() == 1);
+    Future future = fm.get_future(0);
+    InferenceResult ir = future.get_result<InferenceResult>();
+    for (int i = 0; i < tree_bc.num_tokens; i++) {
+      printf("verify_tokens[%d] = %d\n", i, ir.token_ids[i]);
+    }
+  }
+
+  // Execution fence
+  {
+    Future future = runtime->issue_execution_fence(ctx);
+    future.get_void_result();
+  }
+
   // float* data
   std::cout << "----------inference finished--------------" << std::endl;
 }
diff --git a/examples/cpp/inference/SPEC_LLAMA/llama.h b/examples/cpp/inference/SPEC_LLAMA/llama.h
deleted file mode 100644
index d2a96e70a5..0000000000
--- a/examples/cpp/inference/SPEC_LLAMA/llama.h
+++ /dev/null
@@ -1,112 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-#pragma once
-
-#include "file_loader.h"
-#include "flexflow/batch_config.h"
-
-using namespace Legion;
-using namespace FlexFlow;
-
-struct LLAMAConfig {
-  LLAMAConfig(void) {
-    // todo read from config/param file
-    n_layers = 32;
-    vocab_size = 32000;
-    n_heads = 32;
-    dim = 4096;
-    multiple_of = 256;
-    norm_eps = 1e-6;
-    total_sentence = 5;
-    sentence_len = 347;
-    max_gen_length = 256;
-    batchSize = 5;
-    total_requests = 2560;
-    incremental_mode = true;
-    sequence_length = BatchConfig::MAX_SEQ_LENGTH;
-    max_seq_len = 8;
-    max_beam_width = 3;
-    max_beam_depth = 3;
-
-    // hidden dim
-    hidden_dim = 4 * dim;
-    hidden_dim = int(2 * hidden_dim / 3);
-    hidden_dim =
-        multiple_of * int((hidden_dim + multiple_of - 1) / multiple_of);
-  }
-  int n_heads, n_layers, vocab_size, dim, multiple_of, hidden_dim,
-      total_sentence, sentence_len, batchSize, total_requests, incremental_mode,
-      sequence_length, max_gen_length, max_seq_len, max_beam_width,
-      max_beam_depth;
-  float norm_eps;
-  std::string weight_file_path;
-  std::string input_path;
-};
-
-// struct Prediction_result{
-//   long tokens[MAX_];
-//   float probs[MAX_BEAM_SIZE];
-//   int parent_ids[MAX_BEAM_SIZE];
-// };
-
-// class DataLoader {
-// public:
-//   DataLoader(FFModel &ff,
-//              LLAMAConfig const *llamaconfig,
-//              ParallelTensor const &input);
-//   void next_batch(FFModel &ff,
-//                   BatchConfig *bc,
-//                   std::map<size_t, Prediction_result> &batch_predictions);
-//   void reset();
-//   static void load_entire_dataset(Task const *task,
-//                                   std::vector<PhysicalRegion> const &regions,
-//                                   Context ctx,
-//                                   Runtime *runtime);
-//   static void load_input(Task const *task,
-//                          std::vector<PhysicalRegion> const &regions,
-//                          Context ctx,
-//                          Runtime *runtime);
-
-//   template <typename T>
-//   static void load_from_file(T *ptr, size_t size, std::string filename);
-
-//   template <typename T>
-//   static void load_attention_weights(T *ptr,
-//                                      size_t size,
-//                                      std::string layer_name,
-//                                      std::string weight_path);
-//   void store_outputs(BatchConfig *bc,
-//                      InferenceResult const &ir,
-//                      std::map<size_t, Prediction_result> &batch_predictions);
-//   void update_beam_slots(BatchConfig *bc, std::map<size_t, Prediction_result>
-//   batch_predictions); void update_beam_tree();
-
-// public:
-//   int num_samples, next_index, next_token_idx, next_batch_index;
-//   std::map<size_t, std::vector<int>> outputs;
-//   FlexFlow::ParallelTensor full_input, batch_input;
-// };
-
-// struct SampleIdxs {
-//   int num_samples;
-//   int idxs[MAX_NUM_SAMPLES];
-//   int token_idx;
-//   int batch_idx;
-// };
-
-// struct DataLoaderNextBatchInput {
-//   BatchConfig const &bc;
-//   std::map<size_t, Prediction_result> const &prev_batch_preds;
-// };
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index 22752db39a..0c94452ec1 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -140,7 +140,7 @@ void FlexFlow::top_level_task(Task const *task,
 
   //------------------- Initialize the inference manager ------------------
   InferenceManager im(
-      &ff, moeConfig.batch_size, moeConfig.num_inflight_batches);
+      ff.config, moeConfig.batch_size, moeConfig.num_inflight_batches);
   std::unordered_map<Tensor, std::vector<MachineView>> mapping;
   im.compile_model_and_allocate_buffer(&ff, mapping);
   im.init_operators_inference(&ff);
diff --git a/examples/cpp/inference/models/llama.cc b/examples/cpp/inference/models/llama.cc
new file mode 100644
index 0000000000..ad1743125d
--- /dev/null
+++ b/examples/cpp/inference/models/llama.cc
@@ -0,0 +1,206 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "llama.h"
+
+namespace FlexFlow {
+
+using namespace Legion;
+
+void LLAMA::create_llama_model(FFModel &ff,
+                               InferenceManager &im,
+                               Config const &llama_config,
+                               int num_pipeline_stages,
+                               InferenceMode mode) {
+  //------------------------------compute machine views ------------------
+  int num_devices = ff.config.workersPerNode * ff.config.numNodes;
+  std::vector<MachineView> machine_views;
+  for (int i = 0; i < num_devices; i++) {
+    MachineView view;
+    view.device_type = MachineView::GPU;
+    view.ndims = 1;
+    view.dim[0] = 1;
+    view.stride[0] = 0;
+    view.start_device_id = i;
+    machine_views.push_back(view);
+  }
+
+  std::unordered_map<Tensor, std::vector<MachineView>> mapping;
+  std::unordered_map<std::string, Layer *> weights_layers;
+
+  std::cout << "print llama config: " << llama_config.input_path << "-->"
+            << llama_config.batchSize << std::endl;
+
+  Tensor input;
+  {
+    int const token_dims[] = {llama_config.batchSize, llama_config.max_seq_len};
+    input = ff.create_tensor<2>(token_dims, DT_INT32);
+  }
+  mapping[input].push_back(machine_views[0]);
+
+  Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
+  Tensor token = ff.embedding(input,
+                              llama_config.vocab_size,
+                              llama_config.dim,
+                              AGGR_MODE_NONE,
+                              DT_FLOAT,
+                              NULL,
+                              embed_init);
+  Layer *embedding = ff.layers.back();
+  weights_layers.emplace("tok_embeddings_weight", embedding);
+
+  int num_transformer_layers_per_stage =
+      (32 + num_pipeline_stages - 1) / num_pipeline_stages;
+
+  for (int i = 0; i < 1; i++) {
+    // step 1: attention
+    std::vector<int> axes = {2};
+    Tensor att_norm =
+        ff.rms_norm(token, llama_config.norm_eps, llama_config.dim);
+    Layer *attention_norm = ff.layers.back();
+
+    if (i % num_transformer_layers_per_stage == 0) {
+      // Map att_norm to the next GPU
+      // since the size of att_norm is minimum across
+      // all tensors
+      mapping[att_norm].push_back(
+          machine_views[i / num_transformer_layers_per_stage]);
+    }
+
+    weights_layers.emplace("layers_" + std::to_string(i) +
+                               "_attention_norm_weight",
+                           attention_norm);
+
+    // std::cout << "------before att shape";
+    // std::cout << att_norm->num_dims << "------\n";
+    // for (int i = 0; i < att_norm->num_dims; i++) {
+    //   std::cout << att_norm->dims[i] << "------\n";
+    // }
+    Tensor mha;
+    switch (mode) {
+      case BEAM_SEARCH_MODE: {
+        mha = ff.spec_inc_multihead_self_attention(
+            att_norm,
+            llama_config.dim,
+            llama_config.n_heads,
+            llama_config.dim / llama_config.n_heads,
+            llama_config.dim / llama_config.n_heads,
+            0.0f,
+            true,
+            false,
+            false,
+            NULL,
+            true);
+        break;
+      }
+      case TREE_VERIFY_MODE: {
+        mha = ff.inc_multihead_self_attention_verify(
+            att_norm,
+            llama_config.dim,
+            llama_config.n_heads,
+            llama_config.dim / llama_config.n_heads,
+            llama_config.dim / llama_config.n_heads,
+            0.0f,    /*dropout*/
+            true,    /*bias*/
+            false,   /*add_bias_kv*/
+            false,   /*add_zero_attn*/
+            nullptr, /*kernel_initializer*/
+            true     /*apply_rotary_embedding*/
+        );
+        break;
+      }
+      case INC_DECODING_MODE: {
+        mha = ff.inc_multihead_self_attention(
+            att_norm,
+            llama_config.dim,
+            llama_config.n_heads,
+            llama_config.dim / llama_config.n_heads,
+            llama_config.dim / llama_config.n_heads,
+            0.0f,    /*dropout*/
+            true,    /*bias*/
+            false,   /*add_bias_kv*/
+            false,   /*add_zero_attn*/
+            nullptr, /*kernel_initializer*/
+            true     /*apply_rotary_embedding*/
+        );
+        break;
+      }
+      default: {
+        assert(false);
+      }
+    }
+    Layer *attention_layer = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) + "_attention_weight",
+                           attention_layer);
+    token = ff.add(token, mha);
+
+    // step 2: SILU activaion
+    Tensor ff_norm =
+        ff.rms_norm(token, llama_config.norm_eps, llama_config.dim);
+    Layer *ffn_layer = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) + "_ffn_norm_weight",
+                           ffn_layer);
+
+    Tensor w1 = ff.dense(ff_norm, llama_config.hidden_dim, AC_MODE_NONE, false);
+    Layer *w1_layer = ff.layers.back();
+    weights_layers.emplace(
+        "layers_" + std::to_string(i) + "_feed_forward_w1_weight", w1_layer);
+
+    Tensor w3 = ff.dense(ff_norm, llama_config.hidden_dim, AC_MODE_NONE, false);
+    Layer *w3_layer = ff.layers.back();
+    weights_layers.emplace(
+        "layers_" + std::to_string(i) + "_feed_forward_w3_weight", w3_layer);
+
+    Tensor sigmoid = ff.sigmoid(w1);
+    Tensor silu = ff.multiply(w1, sigmoid);
+    Tensor multi = ff.multiply(silu, w3);
+
+    Tensor w2 = ff.dense(multi, llama_config.dim, AC_MODE_NONE, false);
+    Layer *w2_layer = ff.layers.back();
+    weights_layers.emplace(
+        "layers_" + std::to_string(i) + "_feed_forward_w2_weight", w2_layer);
+    token = ff.add(token, w2);
+  }
+  // final normalization and linear
+  std::vector<int> axes = {2};
+  token = ff.rms_norm(token, 1e-6, 4096);
+  Layer *final_norm = ff.layers.back();
+  weights_layers.emplace("norm_weight", final_norm);
+
+  Tensor dense = ff.dense(token, llama_config.vocab_size, AC_MODE_NONE, false);
+  Layer *final_linear = ff.layers.back();
+  weights_layers.emplace("output_weight", final_linear);
+
+  Tensor output;
+  if (mode == BEAM_SEARCH_MODE) {
+    Tensor softmax = ff.softmax(dense, -1);
+    output = ff.beam_top_k(softmax, llama_config.max_beam_width, false);
+  } else {
+    output = ff.arg_top_k(dense, /*k=*/1, false);
+  }
+
+  // Compile the model
+  std::cout << "------start compile ----------" << std::endl;
+  im.compile_model_and_allocate_buffer(&ff, mapping);
+  FileDataLoader fileloader(llama_config.input_path,
+                            llama_config.weight_file_path);
+  fileloader.load_weights(&ff, weights_layers);
+  std::cout << "------load wieght finished----------" << std::endl;
+
+  // init operators
+  im.init_operators_inference(&ff);
+}
+
+}; // namespace FlexFlow
diff --git a/examples/cpp/inference/models/llama.h b/examples/cpp/inference/models/llama.h
new file mode 100644
index 0000000000..612a28967e
--- /dev/null
+++ b/examples/cpp/inference/models/llama.h
@@ -0,0 +1,67 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+#pragma once
+
+#include "file_loader.h"
+#include "flexflow/batch_config.h"
+#include "flexflow/inference.h"
+
+namespace FlexFlow {
+
+class LLAMA {
+public:
+  struct Config {
+    Config(void) {
+      // todo read from config/param file
+      n_layers = 32;
+      vocab_size = 32000;
+      n_heads = 32;
+      dim = 4096;
+      multiple_of = 256;
+      norm_eps = 1e-6;
+      total_sentence = 5;
+      sentence_len = 347;
+      max_gen_length = 256;
+      batchSize = 5;
+      total_requests = 2560;
+      incremental_mode = true;
+      sequence_length = BatchConfig::MAX_SEQ_LENGTH;
+      max_seq_len = 8;
+      max_beam_width = 1;
+      max_beam_depth = 8;
+
+      // hidden dim
+      hidden_dim = 4 * dim;
+      hidden_dim = int(2 * hidden_dim / 3);
+      hidden_dim =
+          multiple_of * int((hidden_dim + multiple_of - 1) / multiple_of);
+    }
+    int n_heads, n_layers, vocab_size, dim, multiple_of, hidden_dim,
+        total_sentence, sentence_len, batchSize, total_requests,
+        incremental_mode, sequence_length, max_gen_length, max_seq_len,
+        max_beam_width, max_beam_depth;
+    float norm_eps;
+    std::string weight_file_path;
+    std::string input_path;
+  };
+
+  static void create_llama_model(FFModel &ff,
+                                 InferenceManager &im,
+                                 Config const &llama_config,
+                                 int num_pipeline_stages,
+                                 InferenceMode mode);
+};
+
+}; // namespace FlexFlow
diff --git a/examples/cpp/inference/transformers/transformers.cc b/examples/cpp/inference/transformers/transformers.cc
index 860fd23fe4..d416fdca3c 100644
--- a/examples/cpp/inference/transformers/transformers.cc
+++ b/examples/cpp/inference/transformers/transformers.cc
@@ -114,7 +114,7 @@ void FlexFlow::top_level_task(Task const *task,
   Tensor output = ff.arg_top_k(t, /*k=*/1, false);
 
   //------------------- Initialize the inference manager ------------------
-  InferenceManager im(&ff,
+  InferenceManager im(ff.config,
                       transformerConfig.batch_size,
                       transformerConfig.num_inflight_batches);
   std::unordered_map<Tensor, std::vector<MachineView>> mapping;
diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 461643e755..55bad9237a 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -72,20 +72,19 @@ class BatchConfig {
 
 class TreeVerifyBatchConfig : public BatchConfig {
 public:
-  struct PerTokenInfo : BatchConfig::PerTokenInfo {
-    int tree_branch_idx;
-  };
+  // struct PerTokenInfo : BatchConfig::PerTokenInfo {
+  //   int tree_branch_idx;
+  // };
   struct CommittedTokensInfo {
     int token_index;   // the index of the token in the previous batch
     int request_index; // request index in the batch
     int token_depth;   // position of the token in the request's sequence
   };
 
-  void compute_tree_branch_indexes();
+  // void compute_tree_branch_indexes();
 
   int num_tokens_to_commit;
   CommittedTokensInfo commited_tokens[MAX_NUM_TOKENS];
-  PerTokenInfo tokensInfo[MAX_NUM_TOKENS];
 };
 
 struct InferenceResult {
@@ -105,7 +104,7 @@ class BeamSearchBatchConfig : public BatchConfig {
 
   size_t beam_width;
   size_t target_iterations;
-  static int const MAX_BEAM_WIDTH = 3;
+  static int const MAX_BEAM_WIDTH = 1;
   static int const MAX_BEAM_DEPTH = 8;
 
   struct BeamSearchPerRequestInfo {
diff --git a/include/flexflow/config.h b/include/flexflow/config.h
index d82b1377c7..c8a9f50aa2 100644
--- a/include/flexflow/config.h
+++ b/include/flexflow/config.h
@@ -122,7 +122,7 @@ class FFConfig {
   size_t workSpaceSize;
   Legion::Context lg_ctx;
   Legion::Runtime *lg_hlr;
-  Legion::FieldSpace field_space;
+  // Legion::FieldSpace field_space;
   bool syntheticInput, profiling, perform_fusion;
   size_t simulator_work_space_size;
   size_t search_budget;
diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index e6a4eb6f3c..6bcfb66927 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -58,6 +58,12 @@ enum MetricsType {
   METRICS_MEAN_ABSOLUTE_ERROR = 1032,
 };
 
+enum InferenceMode {
+  INC_DECODING_MODE = 2001,
+  BEAM_SEARCH_MODE = 2002,
+  TREE_VERIFY_MODE = 2003,
+};
+
 // This is consistent with TASO's OpType
 // https://github.com/jiazhihao/TASO/blob/master/include/taso/ops.h#L75-L138
 enum OperatorType {
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index 3025d8a748..623b8ffd32 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -26,7 +26,7 @@ class BeamTree;
 
 class InferenceManager {
 public:
-  InferenceManager(FFModel *_model,
+  InferenceManager(FFConfig const &config,
                    int max_num_tokens_per_batch,
                    int max_num_inflight_batches);
   void compile_model_and_allocate_buffer(
@@ -39,8 +39,8 @@ class InferenceManager {
                                            ParallelTensor const input);
 
 public:
+  FFConfig ff_config;
   std::unordered_map<ParallelTensor, std::vector<ParallelTensor>> tensor_buffer;
-  FFModel *model;
   int max_num_tokens_per_batch;
   int max_num_inflight_batches;
   int num_devices;
@@ -69,6 +69,7 @@ class RequestManager {
   using RequestGuid = BatchConfig::RequestGuid;
   using TokenId = BatchConfig::TokenId;
   RequestManager();
+  size_t get_num_processed_requests();
   RequestGuid register_new_request(std::vector<TokenId> const &prompt,
                                    int max_sequence_length);
   BatchConfig prepare_next_batch(BatchConfig const &bc,
@@ -84,7 +85,8 @@ class RequestManager {
                             BeamTree &tree,
                             int request_index);
   void tranverse_beam_tree(BeamSearchBatchConfig const &old_bc);
-
+  TreeVerifyBatchConfig
+      convert_beam_to_tree_batch_config(BeamSearchBatchConfig const &beam_bc);
   static void
       load_tokens_task(Legion::Task const *task,
                        std::vector<Legion::PhysicalRegion> const &regions,
@@ -97,6 +99,7 @@ class RequestManager {
   std::mutex request_queue_mutex;
   RequestGuid next_available_guid;
   struct BeamTree beam_trees[BatchConfig::MAX_NUM_REQUESTS];
+  size_t num_processed_requests;
 };
 
 } // namespace FlexFlow
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index c9b85f96b8..d2b9f63401 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -414,7 +414,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
         processed_tokens_in_batch + bc->requestsInfo[i].num_tokens_in_batch - 1;
     while (processed_tokens_in_batch <= last_token_idx_of_the_request) {
       int num_new_tokens = 1;
-      int j = num_new_tokens + processed_tokens_in_batch;
+      int j = processed_tokens_in_batch;
       while ((j + 1 <= last_token_idx_of_the_request) &&
              (bc->tokensInfo[j].abs_depth_in_request + 1 ==
               bc->tokensInfo[j + 1].abs_depth_in_request)) {
@@ -506,6 +506,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                                            m->num_heads,
                                            compute_type,
                                            CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
       // Fill all elements above diagonal in qk prods with -inf to force
       // causal attention.
       assert(num_new_tokens <= total_tokens_in_request);
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index 2f2655f589..2bed8f14c0 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -173,6 +173,7 @@ void BatchConfig::print() const {
   }
 }
 
+#ifdef DEADCODE
 void TreeVerifyBatchConfig::compute_tree_branch_indexes() {
   // Must be called only after setting num_tokens!
   auto is_first_token_in_request = [&](int token_index) -> bool {
@@ -190,5 +191,6 @@ void TreeVerifyBatchConfig::compute_tree_branch_indexes() {
     }
   }
 }
+#endif
 
 }; // namespace FlexFlow
diff --git a/src/runtime/cuda_helper.cu b/src/runtime/cuda_helper.cu
index 2fcf0e096a..f4c39c6b0b 100644
--- a/src/runtime/cuda_helper.cu
+++ b/src/runtime/cuda_helper.cu
@@ -585,4 +585,4 @@ template __host__ bool download_tensor<int32_t>(int32_t const *ptr,
                                                 size_t num_elements);
 template __host__ bool download_tensor<int64_t>(int64_t const *ptr,
                                                 int64_t *dst,
-                                                size_t num_elements);
\ No newline at end of file
+                                                size_t num_elements);
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index e9fe33f22e..25d6e2a00e 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -25,13 +25,13 @@ namespace FlexFlow {
 
 using namespace Legion;
 
-InferenceManager::InferenceManager(FFModel *_model,
+InferenceManager::InferenceManager(FFConfig const &_config,
                                    int _max_num_tokens_per_batch,
                                    int _max_num_inflight_batches)
-    : model(_model), max_num_tokens_per_batch(_max_num_tokens_per_batch),
+    : ff_config(_config), max_num_tokens_per_batch(_max_num_tokens_per_batch),
       max_num_inflight_batches(_max_num_inflight_batches) {
   // populate array of valid single-device machine views
-  num_devices = model->config.workersPerNode * model->config.numNodes;
+  num_devices = ff_config.workersPerNode * ff_config.numNodes;
   for (int i = 0; i < num_devices; i++) {
     MachineView view;
     view.device_type = MachineView::GPU;
@@ -246,8 +246,8 @@ FutureMap InferenceManager::inference(FFModel *model,
 
 void InferenceManager::load_input_tokens_from_batch_config(
     BatchConfig const &bc, ParallelTensor const input) {
-  Context ctx = model->config.lg_ctx;
-  Runtime *runtime = model->config.lg_hlr;
+  Context ctx = ff_config.lg_ctx;
+  Runtime *runtime = ff_config.lg_hlr;
   size_t machine_view_hash = input->machine_view.hash();
   ArgumentMap argmap;
   IndexLauncher launcher(
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index f3e8664161..38bb7b8333 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -1317,11 +1317,11 @@ FFModel::FFModel(FFConfig &_config)
   metrics_input = -1;
   // Load strategy file
   // Create field space
-  {
-    FieldAllocator allocator =
-        runtime->create_field_allocator(ctx, config.field_space);
-    allocator.allocate_field(sizeof(float), FID_DATA);
-  }
+  //{
+  //  FieldAllocator allocator =
+  //      runtime->create_field_allocator(ctx, config.field_space);
+  //  allocator.allocate_field(sizeof(float), FID_DATA);
+  //}
   // Build training dataset
   // if (config.datasetPath.length() == 0) {
   //  dataLoader = NULL;
@@ -3712,7 +3712,7 @@ FFConfig::FFConfig() {
   Runtime *runtime = Runtime::get_runtime();
   lg_hlr = runtime;
   lg_ctx = Runtime::get_context();
-  field_space = runtime->create_field_space(lg_ctx);
+  // field_space = runtime->create_field_space(lg_ctx);
 }
 
 void FFConfig::parse_args(char **argv, int argc) {
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 810be3df1f..149bc18ec7 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -22,7 +22,8 @@ using namespace Legion;
 
 LegionRuntime::Logger::Category log_req_mgr("RequestManager");
 
-RequestManager::RequestManager() : next_available_guid(1000000) {}
+RequestManager::RequestManager()
+    : next_available_guid(1000000), num_processed_requests(0) {}
 
 RequestManager::RequestGuid
     RequestManager::register_new_request(std::vector<TokenId> const &prompt,
@@ -41,6 +42,10 @@ RequestManager::RequestGuid
   return request.guid;
 }
 
+size_t RequestManager::get_num_processed_requests() {
+  return num_processed_requests;
+}
+
 BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
                                                InferenceResult const &result) {
   const std::lock_guard<std::mutex> lock(request_queue_mutex);
@@ -436,7 +441,7 @@ void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
   }
 }
 
-bool PreOrder(BeamTree tree,
+bool PreOrder(BeamTree const &tree,
               int max_depth,
               int current_depth,
               int beam_width,
@@ -491,6 +496,43 @@ bool PreOrder(BeamTree tree,
   return flag;
 }
 
+TreeVerifyBatchConfig RequestManager::convert_beam_to_tree_batch_config(
+    BeamSearchBatchConfig const &beam_bc) {
+  TreeVerifyBatchConfig tree_bc;
+  for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
+    if (beam_bc.request_completed[i]) {
+      continue;
+    }
+    // We don't modify requests during the conversion
+    tree_bc.request_completed[i] = beam_bc.request_completed[i];
+    BeamTree const &tree = beam_trees[i];
+    // token, index
+    // todo make this one global for different stages
+    std::vector<std::pair<BeamSearchBatchConfig::TokenId, int>> serializedTree;
+    PreOrder(tree,
+             beam_bc.beamRequestsInfo[i].max_depth,
+             0,
+             beam_bc.beamRequestsInfo[i].beam_size,
+             0,
+             serializedTree);
+    tree_bc.requestsInfo[i].request_guid = beam_bc.requestsInfo[i].request_guid;
+    tree_bc.requestsInfo[i].max_sequence_length =
+        beam_bc.requestsInfo[i].max_sequence_length;
+    tree_bc.requestsInfo[i].token_start_offset = serializedTree[0].second;
+    tree_bc.requestsInfo[i].num_tokens_in_batch = 0;
+    for (int k = 0; k < serializedTree.size(); k++) {
+      assert(tree_bc.num_tokens < BatchConfig::MAX_NUM_TOKENS);
+      tree_bc.tokensInfo[tree_bc.num_tokens].request_index = i;
+      tree_bc.tokensInfo[tree_bc.num_tokens].abs_depth_in_request =
+          serializedTree[k].second;
+      tree_bc.tokensInfo[tree_bc.num_tokens].token_id = serializedTree[k].first;
+      tree_bc.num_tokens++;
+      tree_bc.requestsInfo[i].num_tokens_in_batch++;
+    }
+  }
+  return tree_bc;
+}
+
 void RequestManager::tranverse_beam_tree(BeamSearchBatchConfig const &old_bc) {
   for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
     if (old_bc.request_completed[i]) {
@@ -502,7 +544,7 @@ void RequestManager::tranverse_beam_tree(BeamSearchBatchConfig const &old_bc) {
 
     int depth = old_bc.beamRequestsInfo[i].current_depth;
     int beam_width = old_bc.beamRequestsInfo[i].beam_size;
-    BeamTree tree = beam_trees[i];
+    BeamTree const &tree = beam_trees[i];
 
     // token, index
     // todo make this one global for different stages

From 21a2dd7c763f7efab3b63b7554fbafba5175a157 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 8 May 2023 21:17:04 +0000
Subject: [PATCH 108/344] fix

---
 examples/cpp/inference/file_loader.cc | 58 ++++++++++++++++++---------
 examples/cpp/inference/file_loader.h  |  5 ++-
 2 files changed, 44 insertions(+), 19 deletions(-)

diff --git a/examples/cpp/inference/file_loader.cc b/examples/cpp/inference/file_loader.cc
index f9f399b464..57baf05694 100644
--- a/examples/cpp/inference/file_loader.cc
+++ b/examples/cpp/inference/file_loader.cc
@@ -20,8 +20,10 @@
 using namespace std;
 
 FileDataLoader::FileDataLoader(std::string _input_path,
-                               std::string _weight_file_path)
-    : input_path(_input_path), weight_file_path(_weight_file_path){};
+                               std::string _weight_file_path,
+                               int _num_heads)
+    : input_path(_input_path), weight_file_path(_weight_file_path),
+      num_heads(_num_heads){};
 
 BatchConfig::TokenId *FileDataLoader::generate_requests(int num, int length) {
 
@@ -61,8 +63,9 @@ BatchConfig::TokenId *FileDataLoader::generate_requests(int num, int length) {
   return prompts;
 };
 
-void load_attention_weights(float *ptr,
-                            size_t size,
+void load_attention_weights(float *dst_ptr,
+                            size_t total_weights_size,
+                            int num_heads,
                             std::string layer_name,
                             std::string weight_path) {
   std::string q_file = weight_path +
@@ -80,12 +83,12 @@ void load_attention_weights(float *ptr,
   std::vector<std::string> weight_files = {q_file, k_file, v_file, o_file};
 
   size_t index = 0;
-  int file_index = 0;
+  int weight_index = 0; // {q, k, v, o} -> {0, 1, 2, 3}
 
-  // q, k, v, o -> 0, 1, 2, 3
   for (auto file : weight_files) {
-    std::cout << "file name and index: " << file << "->" << file_index << "\n";
-    size_t partial_size = size / 4;
+    std::cout << "file name and index: " << file << "->" << weight_index
+              << "\n";
+    size_t partial_size = total_weights_size / 4;
     std::ifstream in(file, std::ios::in | std::ios::binary);
     std::vector<float> host_array(partial_size);
     size_t loaded_data_size = sizeof(float) * partial_size;
@@ -100,17 +103,35 @@ void load_attention_weights(float *ptr,
     }
     assert(partial_size == host_array.size());
 
-    size_t one_head_size = 4096 * 128;
-    size_t data_index = 0;
-
-    for (int i = 0; i < 32; i++) {
-      size_t start_index = i * one_head_size * 4 + file_index * one_head_size;
-      for (size_t j = start_index; j < start_index + one_head_size; j++) {
-        ptr[j] = host_array.at(data_index);
-        data_index += 1;
+    size_t hidden_dim = 4096;
+    size_t qkv_inner_dim = 128;
+    size_t single_proj_size =
+        hidden_dim *
+        qkv_inner_dim; // size of each of Q,K,V,O weights for a single head
+    size_t one_head_size =
+        single_proj_size * 4; // size of Q+K+V+O weights for a single head
+    size_t checkpoint_idx, flexflow_idx;
+
+    for (int i = 0; i < num_heads * single_proj_size; i++) {
+      int checkpoint_row_idx = i % hidden_dim;
+      int checkpoint_column_idx = (i / hidden_dim) % qkv_inner_dim;
+      int head_idx = i / single_proj_size;
+      checkpoint_idx = head_idx * one_head_size +
+                       weight_index * single_proj_size +
+                       checkpoint_column_idx * hidden_dim + checkpoint_row_idx;
+      if (weight_index < 3) {
+        // if this is the Q,K or V weight
+        flexflow_idx = checkpoint_idx;
+      } else {
+        // if this is the output projection weight
+        flexflow_idx =
+            head_idx * one_head_size + weight_index * single_proj_size +
+            checkpoint_row_idx * qkv_inner_dim + checkpoint_column_idx;
       }
+      dst_ptr[flexflow_idx] = host_array.at(checkpoint_idx);
     }
-    file_index++;
+
+    weight_index++;
 
     in.close();
     index++;
@@ -169,7 +190,8 @@ void FileDataLoader::load_weights(
     float *data = (float *)malloc(sizeof(float) * volume);
 
     if (v.first.find("attention_w") != std::string::npos) {
-      load_attention_weights(data, volume, v.first, weight_file_path);
+      load_attention_weights(
+          data, volume, num_heads, v.first, weight_file_path);
 
     } else {
       load_from_file(data, volume, weight_file_path + v.first);
diff --git a/examples/cpp/inference/file_loader.h b/examples/cpp/inference/file_loader.h
index e1edc3f1a9..1005729ddd 100644
--- a/examples/cpp/inference/file_loader.h
+++ b/examples/cpp/inference/file_loader.h
@@ -23,7 +23,9 @@ using namespace FlexFlow;
 
 class FileDataLoader {
 public:
-  FileDataLoader(std::string _input_path, std::string _weight_file_path);
+  FileDataLoader(std::string _input_path,
+                 std::string _weight_file_path,
+                 int _num_heads = 32);
 
   BatchConfig::TokenId *generate_requests(int num, int length);
 
@@ -31,6 +33,7 @@ class FileDataLoader {
                     std::unordered_map<std::string, Layer *> weights_layers);
 
 private:
+  int num_heads;
   std::string input_path;
   std::string weight_file_path;
 };

From a7cc9b19615c2c2f385ed9f4b6ef52b67a421061 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 8 May 2023 21:34:49 +0000
Subject: [PATCH 109/344] more fixes

---
 examples/cpp/inference/LLAMA/dataloader.cc | 73 ++++++++++++++--------
 examples/cpp/inference/LLAMA/llama.cc      |  9 ++-
 examples/cpp/inference/LLAMA/llama.h       |  7 ++-
 examples/cpp/inference/file_loader.cc      | 28 ++++++---
 examples/cpp/inference/file_loader.h       |  5 +-
 examples/cpp/inference/models/llama.cc     |  5 +-
 6 files changed, 86 insertions(+), 41 deletions(-)

diff --git a/examples/cpp/inference/LLAMA/dataloader.cc b/examples/cpp/inference/LLAMA/dataloader.cc
index 13de5b5b64..1a99ac0099 100644
--- a/examples/cpp/inference/LLAMA/dataloader.cc
+++ b/examples/cpp/inference/LLAMA/dataloader.cc
@@ -37,7 +37,8 @@ DataLoader::DataLoader(FFModel &ff,
   }
 
   // size_t llamaconfig_size = sizeof(llamaconfig);
-  // std::cout << "llama config dataloader: " << llamaconfig->input_path;
+  // std::cout << "llama config dataloader: " << llamaconfig->input_path <<
+  // std::endl;
 
   // // Load entire dataset
   // TaskLauncher launcher(CUSTOM_CPU_TASK_ID_1,
@@ -66,7 +67,7 @@ void DataLoader::load_entire_dataset(Task const *task,
   assert(acc_input.accessor.is_dense_arbitrary(rect_input));
 
   long *input_ptr = acc_input.ptr(rect_input.lo);
-  std::cout << "load entire dataset" << rect_input.volume();
+  std::cout << "load entire dataset" << rect_input.volume() << std::endl;
 
   // load from file
   load_from_file(input_ptr,
@@ -129,7 +130,6 @@ void DataLoader::reset() {
 
 template <typename T>
 void DataLoader::load_from_file(T *ptr, size_t size, std::string filename) {
-
   std::cout << "load from file: " << filename << std::endl;
   std::ifstream in(filename, std::ios::in | std::ios::binary);
   std::vector<T> host_array(size);
@@ -159,8 +159,11 @@ void DataLoader::load_from_file(T *ptr, size_t size, std::string filename) {
 }
 
 template <typename T>
-void DataLoader::load_attention_weights(T *ptr,
-                                        size_t size,
+void DataLoader::load_attention_weights(T *dst_ptr,
+                                        size_t total_weights_size,
+                                        int num_heads,
+                                        size_t hidden_dim,
+                                        size_t qkv_inner_dim,
                                         std::string layer_name,
                                         std::string weight_path) {
 
@@ -178,41 +181,55 @@ void DataLoader::load_attention_weights(T *ptr,
                        "attention_wo_weight";
   std::vector<std::string> weight_files = {q_file, k_file, v_file, o_file};
 
-  size_t index = 0;
-  int file_index = 0;
+  int weight_index = 0; // {q, k, v, o} -> {0, 1, 2, 3}
 
-  // q, k, v, o -> 0, 1, 2, 3
   for (auto file : weight_files) {
-    std::cout << "file name and index: " << file << "->" << file_index << "\n";
-    size_t partial_size = size / 4;
+    std::cout << "file name and index: " << file << "->" << weight_index
+              << "\n";
+    size_t partial_size = total_weights_size / 4;
     std::ifstream in(file, std::ios::in | std::ios::binary);
-    std::vector<T> host_array(partial_size);
-    size_t loaded_data_size = sizeof(T) * partial_size;
+    std::vector<float> host_array(partial_size);
+    size_t loaded_data_size = sizeof(float) * partial_size;
     in.seekg(0, in.end);
     in.seekg(0, in.beg);
     in.read((char *)host_array.data(), loaded_data_size);
     size_t in_get_size = in.gcount();
 
     if (in_get_size != loaded_data_size) {
-      std::cout << "load data error";
+      std::cout << "load data error" << std::endl;
       return;
     }
     assert(partial_size == host_array.size());
 
-    size_t one_head_size = 4096 * 128;
-    size_t data_index = 0;
-
-    for (int i = 0; i < 32; i++) {
-      size_t start_index = i * one_head_size * 4 + file_index * one_head_size;
-      for (size_t j = start_index; j < start_index + one_head_size; j++) {
-        ptr[j] = host_array.at(data_index);
-        data_index += 1;
+    size_t single_proj_size =
+        hidden_dim *
+        qkv_inner_dim; // size of each of Q,K,V,O weights for a single head
+    size_t one_head_size =
+        single_proj_size * 4; // size of Q+K+V+O weights for a single head
+    size_t checkpoint_idx, flexflow_idx;
+
+    for (int i = 0; i < num_heads * single_proj_size; i++) {
+      int checkpoint_row_idx = i % hidden_dim;
+      int checkpoint_column_idx = (i / hidden_dim) % qkv_inner_dim;
+      int head_idx = i / single_proj_size;
+      checkpoint_idx = head_idx * one_head_size +
+                       weight_index * single_proj_size +
+                       checkpoint_column_idx * hidden_dim + checkpoint_row_idx;
+      if (weight_index < 3) {
+        // if this is the Q,K or V weight
+        flexflow_idx = checkpoint_idx;
+      } else {
+        // if this is the output projection weight
+        flexflow_idx =
+            head_idx * one_head_size + weight_index * single_proj_size +
+            checkpoint_row_idx * qkv_inner_dim + checkpoint_column_idx;
       }
+      dst_ptr[flexflow_idx] = host_array.at(checkpoint_idx);
     }
-    file_index++;
+
+    weight_index++;
 
     in.close();
-    index++;
   }
 }
 
@@ -251,8 +268,14 @@ void DataLoader::store_outputs(BatchConfig *bc,
   assert(batch_predictions.size() == bc->num_active_requests());
 }
 
-template void DataLoader::load_attention_weights<float>(
-    float *ptr, size_t size, std::string layer_name, std::string weight_path);
+template void
+    DataLoader::load_attention_weights<float>(float *dst_ptr,
+                                              size_t total_weights_size,
+                                              int num_heads,
+                                              size_t hidden_dim,
+                                              size_t qkv_inner_dim,
+                                              std::string layer_name,
+                                              std::string weight_path);
 template void DataLoader::load_from_file<long>(long *ptr,
                                                size_t size,
                                                std::string filename);
diff --git a/examples/cpp/inference/LLAMA/llama.cc b/examples/cpp/inference/LLAMA/llama.cc
index d4f17b3d9b..6d714ba2fa 100644
--- a/examples/cpp/inference/LLAMA/llama.cc
+++ b/examples/cpp/inference/LLAMA/llama.cc
@@ -200,8 +200,13 @@ void FlexFlow::top_level_task(Task const *task,
     float *data = (float *)malloc(sizeof(float) * volume);
 
     if (v.first.find("attention_w") != std::string::npos) {
-      loader.load_attention_weights(
-          data, volume, v.first, llamaConfig.weight_file_path);
+      loader.load_attention_weights(data,
+                                    volume,
+                                    llamaConfig.n_heads,
+                                    llamaConfig.dim,
+                                    llamaConfig.dim / llamaConfig.n_heads,
+                                    v.first,
+                                    llamaConfig.weight_file_path);
 
     } else {
       loader.load_from_file(
diff --git a/examples/cpp/inference/LLAMA/llama.h b/examples/cpp/inference/LLAMA/llama.h
index 0ae8d57d5b..04cde4a73c 100644
--- a/examples/cpp/inference/LLAMA/llama.h
+++ b/examples/cpp/inference/LLAMA/llama.h
@@ -82,8 +82,11 @@ class DataLoader {
   static void load_from_file(T *ptr, size_t size, std::string filename);
 
   template <typename T>
-  static void load_attention_weights(T *ptr,
-                                     size_t size,
+  static void load_attention_weights(T *dst_ptr,
+                                     size_t total_weights_size,
+                                     int num_heads,
+                                     size_t hidden_dim,
+                                     size_t qkv_inner_dim,
                                      std::string layer_name,
                                      std::string weight_path);
   void store_outputs(BatchConfig *bc,
diff --git a/examples/cpp/inference/file_loader.cc b/examples/cpp/inference/file_loader.cc
index 57baf05694..8241b920ad 100644
--- a/examples/cpp/inference/file_loader.cc
+++ b/examples/cpp/inference/file_loader.cc
@@ -21,9 +21,12 @@ using namespace std;
 
 FileDataLoader::FileDataLoader(std::string _input_path,
                                std::string _weight_file_path,
-                               int _num_heads)
+                               int _num_heads,
+                               size_t _hidden_dim,
+                               size_t _qkv_inner_dim)
     : input_path(_input_path), weight_file_path(_weight_file_path),
-      num_heads(_num_heads){};
+      num_heads(_num_heads), hidden_dim(_hidden_dim),
+      qkv_inner_dim(_qkv_inner_dim){};
 
 BatchConfig::TokenId *FileDataLoader::generate_requests(int num, int length) {
 
@@ -44,7 +47,7 @@ BatchConfig::TokenId *FileDataLoader::generate_requests(int num, int length) {
 
   size_t in_get_size = in.gcount();
   if (in_get_size != loaded_data_size) {
-    std::cout << "load data error";
+    std::cout << "load data error" << std::endl;
     return prompts;
   }
 
@@ -66,6 +69,8 @@ BatchConfig::TokenId *FileDataLoader::generate_requests(int num, int length) {
 void load_attention_weights(float *dst_ptr,
                             size_t total_weights_size,
                             int num_heads,
+                            size_t hidden_dim,
+                            size_t qkv_inner_dim,
                             std::string layer_name,
                             std::string weight_path) {
   std::string q_file = weight_path +
@@ -98,13 +103,11 @@ void load_attention_weights(float *dst_ptr,
     size_t in_get_size = in.gcount();
 
     if (in_get_size != loaded_data_size) {
-      std::cout << "load data error";
+      std::cout << "load data error" << std::endl;
       return;
     }
     assert(partial_size == host_array.size());
 
-    size_t hidden_dim = 4096;
-    size_t qkv_inner_dim = 128;
     size_t single_proj_size =
         hidden_dim *
         qkv_inner_dim; // size of each of Q,K,V,O weights for a single head
@@ -152,11 +155,11 @@ void load_from_file(float *ptr, size_t size, std::string filename) {
   // std::cout << loaded_data_size << std::endl;
   // std::cout << in_get_size << std::endl;
   if (in_get_size != loaded_data_size) {
-    std::cout << "load data error";
+    std::cout << "load data error" << std::endl;
     return;
   }
 
-  // std::cout << "finish loading input";
+  // std::cout << "finish loading input" << std::endl;
   assert(size == host_array.size());
 
   // normal
@@ -190,8 +193,13 @@ void FileDataLoader::load_weights(
     float *data = (float *)malloc(sizeof(float) * volume);
 
     if (v.first.find("attention_w") != std::string::npos) {
-      load_attention_weights(
-          data, volume, num_heads, v.first, weight_file_path);
+      load_attention_weights(data,
+                             volume,
+                             num_heads,
+                             hidden_dim,
+                             qkv_inner_dim,
+                             v.first,
+                             weight_file_path);
 
     } else {
       load_from_file(data, volume, weight_file_path + v.first);
diff --git a/examples/cpp/inference/file_loader.h b/examples/cpp/inference/file_loader.h
index 1005729ddd..7d03b3ac82 100644
--- a/examples/cpp/inference/file_loader.h
+++ b/examples/cpp/inference/file_loader.h
@@ -25,7 +25,9 @@ class FileDataLoader {
 public:
   FileDataLoader(std::string _input_path,
                  std::string _weight_file_path,
-                 int _num_heads = 32);
+                 int _num_heads,
+                 size_t _hidden_dim,
+                 size_t _qkv_inner_dim);
 
   BatchConfig::TokenId *generate_requests(int num, int length);
 
@@ -34,6 +36,7 @@ class FileDataLoader {
 
 private:
   int num_heads;
+  size_t hidden_dim, qkv_inner_dim;
   std::string input_path;
   std::string weight_file_path;
 };
diff --git a/examples/cpp/inference/models/llama.cc b/examples/cpp/inference/models/llama.cc
index ad1743125d..efd5c18b6e 100644
--- a/examples/cpp/inference/models/llama.cc
+++ b/examples/cpp/inference/models/llama.cc
@@ -195,7 +195,10 @@ void LLAMA::create_llama_model(FFModel &ff,
   std::cout << "------start compile ----------" << std::endl;
   im.compile_model_and_allocate_buffer(&ff, mapping);
   FileDataLoader fileloader(llama_config.input_path,
-                            llama_config.weight_file_path);
+                            llama_config.weight_file_path,
+                            llama_config.n_heads,
+                            llama_config.dim,
+                            llama_config.dim / llama_config.n_heads);
   fileloader.load_weights(&ff, weights_layers);
   std::cout << "------load wieght finished----------" << std::endl;
 

From 77ee93ad26c06b738a7e6b0b41a58d27622f7ff7 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 8 May 2023 21:38:26 +0000
Subject: [PATCH 110/344] fix

---
 examples/cpp/inference/LLAMA/dataloader.cc | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/examples/cpp/inference/LLAMA/dataloader.cc b/examples/cpp/inference/LLAMA/dataloader.cc
index 1a99ac0099..a2a0e48561 100644
--- a/examples/cpp/inference/LLAMA/dataloader.cc
+++ b/examples/cpp/inference/LLAMA/dataloader.cc
@@ -188,8 +188,8 @@ void DataLoader::load_attention_weights(T *dst_ptr,
               << "\n";
     size_t partial_size = total_weights_size / 4;
     std::ifstream in(file, std::ios::in | std::ios::binary);
-    std::vector<float> host_array(partial_size);
-    size_t loaded_data_size = sizeof(float) * partial_size;
+    std::vector<T> host_array(partial_size);
+    size_t loaded_data_size = sizeof(T) * partial_size;
     in.seekg(0, in.end);
     in.seekg(0, in.beg);
     in.read((char *)host_array.data(), loaded_data_size);

From b70b5b6c9999674c4e1c28c010a37ddd7492eb85 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 8 May 2023 23:27:04 +0000
Subject: [PATCH 111/344] fix

---
 examples/cpp/inference/LLAMA/dataloader.cc |  6 ++++
 examples/cpp/inference/LLAMA/llama.h       |  2 +-
 examples/cpp/inference/file_loader.cc      | 40 ++++++++++------------
 3 files changed, 26 insertions(+), 22 deletions(-)

diff --git a/examples/cpp/inference/LLAMA/dataloader.cc b/examples/cpp/inference/LLAMA/dataloader.cc
index a2a0e48561..eab168a452 100644
--- a/examples/cpp/inference/LLAMA/dataloader.cc
+++ b/examples/cpp/inference/LLAMA/dataloader.cc
@@ -208,6 +208,12 @@ void DataLoader::load_attention_weights(T *dst_ptr,
         single_proj_size * 4; // size of Q+K+V+O weights for a single head
     size_t checkpoint_idx, flexflow_idx;
 
+    assert(total_weights_size == one_head_size);
+    assert(partial_size == single_proj_size);
+
+    std::cout << "host_array.size(): " << host_array.size() << std::endl;
+    std::cout << "single_proj_size: " << single_proj_size << std::endl;
+
     for (int i = 0; i < num_heads * single_proj_size; i++) {
       int checkpoint_row_idx = i % hidden_dim;
       int checkpoint_column_idx = (i / hidden_dim) % qkv_inner_dim;
diff --git a/examples/cpp/inference/LLAMA/llama.h b/examples/cpp/inference/LLAMA/llama.h
index 04cde4a73c..7584c26aa4 100644
--- a/examples/cpp/inference/LLAMA/llama.h
+++ b/examples/cpp/inference/LLAMA/llama.h
@@ -42,7 +42,7 @@ struct LLAMAConfig {
 
     // todo from args
     weight_file_path =
-        "/home/ubuntu/FlexFlow_Inference/examples/cpp/inference/LLAMA/weights/";
+        "/home/ubuntu/FlexFlow/examples/cpp/inference/LLAMA/weights/";
     input_path = "/home/ubuntu/FlexFlow/examples/cpp/inference/LLAMA/tokens/"
                  "llama_demo_tokens";
 
diff --git a/examples/cpp/inference/file_loader.cc b/examples/cpp/inference/file_loader.cc
index 8241b920ad..820ffb17df 100644
--- a/examples/cpp/inference/file_loader.cc
+++ b/examples/cpp/inference/file_loader.cc
@@ -67,7 +67,6 @@ BatchConfig::TokenId *FileDataLoader::generate_requests(int num, int length) {
 };
 
 void load_attention_weights(float *dst_ptr,
-                            size_t total_weights_size,
                             int num_heads,
                             size_t hidden_dim,
                             size_t qkv_inner_dim,
@@ -87,16 +86,21 @@ void load_attention_weights(float *dst_ptr,
                        "attention_wo_weight";
   std::vector<std::string> weight_files = {q_file, k_file, v_file, o_file};
 
-  size_t index = 0;
   int weight_index = 0; // {q, k, v, o} -> {0, 1, 2, 3}
+  size_t single_proj_size =
+      hidden_dim *
+      qkv_inner_dim; // size of each of Q,K,V,O weights for a single head
+  size_t one_head_size =
+      single_proj_size * 4; // size of Q+K+V+O weights for a single head
+  size_t one_weight_file_size =
+      num_heads * single_proj_size; // size of each of Q/K/V/O for all heads
 
   for (auto file : weight_files) {
     std::cout << "file name and index: " << file << "->" << weight_index
               << "\n";
-    size_t partial_size = total_weights_size / 4;
     std::ifstream in(file, std::ios::in | std::ios::binary);
-    std::vector<float> host_array(partial_size);
-    size_t loaded_data_size = sizeof(float) * partial_size;
+    std::vector<float> host_array(one_weight_file_size);
+    size_t loaded_data_size = sizeof(float) * one_weight_file_size;
     in.seekg(0, in.end);
     in.seekg(0, in.beg);
     in.read((char *)host_array.data(), loaded_data_size);
@@ -106,38 +110,30 @@ void load_attention_weights(float *dst_ptr,
       std::cout << "load data error" << std::endl;
       return;
     }
-    assert(partial_size == host_array.size());
+    assert(one_weight_file_size == host_array.size());
 
-    size_t single_proj_size =
-        hidden_dim *
-        qkv_inner_dim; // size of each of Q,K,V,O weights for a single head
-    size_t one_head_size =
-        single_proj_size * 4; // size of Q+K+V+O weights for a single head
-    size_t checkpoint_idx, flexflow_idx;
-
-    for (int i = 0; i < num_heads * single_proj_size; i++) {
+    size_t flexflow_idx;
+    for (int i = 0; i < one_weight_file_size; i++) {
       int checkpoint_row_idx = i % hidden_dim;
       int checkpoint_column_idx = (i / hidden_dim) % qkv_inner_dim;
       int head_idx = i / single_proj_size;
-      checkpoint_idx = head_idx * one_head_size +
-                       weight_index * single_proj_size +
-                       checkpoint_column_idx * hidden_dim + checkpoint_row_idx;
       if (weight_index < 3) {
         // if this is the Q,K or V weight
-        flexflow_idx = checkpoint_idx;
+        flexflow_idx =
+            head_idx * one_head_size + weight_index * single_proj_size +
+            checkpoint_column_idx * qkv_inner_dim + checkpoint_row_idx;
       } else {
         // if this is the output projection weight
         flexflow_idx =
             head_idx * one_head_size + weight_index * single_proj_size +
             checkpoint_row_idx * qkv_inner_dim + checkpoint_column_idx;
       }
-      dst_ptr[flexflow_idx] = host_array.at(checkpoint_idx);
+      dst_ptr[flexflow_idx] = host_array.at(i);
     }
 
     weight_index++;
 
     in.close();
-    index++;
   }
 }
 
@@ -193,8 +189,10 @@ void FileDataLoader::load_weights(
     float *data = (float *)malloc(sizeof(float) * volume);
 
     if (v.first.find("attention_w") != std::string::npos) {
+      assert(dims_vec[0] = hidden_dim * qkv_inner_dim * 4);
+      assert(dims_vec[1] = num_heads);
+      assert(volume == dims_vec[0] * dims_vec[1]);
       load_attention_weights(data,
-                             volume,
                              num_heads,
                              hidden_dim,
                              qkv_inner_dim,

From c19244b539df13e0bcbe2937dee0c901d8e3424d Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 8 May 2023 23:43:21 +0000
Subject: [PATCH 112/344] update

---
 examples/cpp/inference/.gitignore          |  1 +
 examples/cpp/inference/LLAMA/dataloader.cc | 41 +++++++++-------------
 examples/cpp/inference/LLAMA/llama.cc      |  5 ++-
 examples/cpp/inference/LLAMA/llama.h       |  1 -
 4 files changed, 21 insertions(+), 27 deletions(-)
 create mode 100644 examples/cpp/inference/.gitignore

diff --git a/examples/cpp/inference/.gitignore b/examples/cpp/inference/.gitignore
new file mode 100644
index 0000000000..05424f2a4c
--- /dev/null
+++ b/examples/cpp/inference/.gitignore
@@ -0,0 +1 @@
+weights
diff --git a/examples/cpp/inference/LLAMA/dataloader.cc b/examples/cpp/inference/LLAMA/dataloader.cc
index eab168a452..8eabc0a464 100644
--- a/examples/cpp/inference/LLAMA/dataloader.cc
+++ b/examples/cpp/inference/LLAMA/dataloader.cc
@@ -160,7 +160,6 @@ void DataLoader::load_from_file(T *ptr, size_t size, std::string filename) {
 
 template <typename T>
 void DataLoader::load_attention_weights(T *dst_ptr,
-                                        size_t total_weights_size,
                                         int num_heads,
                                         size_t hidden_dim,
                                         size_t qkv_inner_dim,
@@ -182,14 +181,20 @@ void DataLoader::load_attention_weights(T *dst_ptr,
   std::vector<std::string> weight_files = {q_file, k_file, v_file, o_file};
 
   int weight_index = 0; // {q, k, v, o} -> {0, 1, 2, 3}
+  size_t single_proj_size =
+      hidden_dim *
+      qkv_inner_dim; // size of each of Q,K,V,O weights for a single head
+  size_t one_head_size =
+      single_proj_size * 4; // size of Q+K+V+O weights for a single head
+  size_t one_weight_file_size =
+      num_heads * single_proj_size; // size of each of Q/K/V/O for all heads
 
   for (auto file : weight_files) {
     std::cout << "file name and index: " << file << "->" << weight_index
               << "\n";
-    size_t partial_size = total_weights_size / 4;
     std::ifstream in(file, std::ios::in | std::ios::binary);
-    std::vector<T> host_array(partial_size);
-    size_t loaded_data_size = sizeof(T) * partial_size;
+    std::vector<T> host_array(one_weight_file_size);
+    size_t loaded_data_size = sizeof(T) * one_weight_file_size;
     in.seekg(0, in.end);
     in.seekg(0, in.beg);
     in.read((char *)host_array.data(), loaded_data_size);
@@ -199,38 +204,25 @@ void DataLoader::load_attention_weights(T *dst_ptr,
       std::cout << "load data error" << std::endl;
       return;
     }
-    assert(partial_size == host_array.size());
+    assert(one_weight_file_size == host_array.size());
 
-    size_t single_proj_size =
-        hidden_dim *
-        qkv_inner_dim; // size of each of Q,K,V,O weights for a single head
-    size_t one_head_size =
-        single_proj_size * 4; // size of Q+K+V+O weights for a single head
-    size_t checkpoint_idx, flexflow_idx;
-
-    assert(total_weights_size == one_head_size);
-    assert(partial_size == single_proj_size);
-
-    std::cout << "host_array.size(): " << host_array.size() << std::endl;
-    std::cout << "single_proj_size: " << single_proj_size << std::endl;
-
-    for (int i = 0; i < num_heads * single_proj_size; i++) {
+    size_t flexflow_idx;
+    for (int i = 0; i < one_weight_file_size; i++) {
       int checkpoint_row_idx = i % hidden_dim;
       int checkpoint_column_idx = (i / hidden_dim) % qkv_inner_dim;
       int head_idx = i / single_proj_size;
-      checkpoint_idx = head_idx * one_head_size +
-                       weight_index * single_proj_size +
-                       checkpoint_column_idx * hidden_dim + checkpoint_row_idx;
       if (weight_index < 3) {
         // if this is the Q,K or V weight
-        flexflow_idx = checkpoint_idx;
+        flexflow_idx =
+            head_idx * one_head_size + weight_index * single_proj_size +
+            checkpoint_column_idx * qkv_inner_dim + checkpoint_row_idx;
       } else {
         // if this is the output projection weight
         flexflow_idx =
             head_idx * one_head_size + weight_index * single_proj_size +
             checkpoint_row_idx * qkv_inner_dim + checkpoint_column_idx;
       }
-      dst_ptr[flexflow_idx] = host_array.at(checkpoint_idx);
+      dst_ptr[flexflow_idx] = host_array.at(i);
     }
 
     weight_index++;
@@ -276,7 +268,6 @@ void DataLoader::store_outputs(BatchConfig *bc,
 
 template void
     DataLoader::load_attention_weights<float>(float *dst_ptr,
-                                              size_t total_weights_size,
                                               int num_heads,
                                               size_t hidden_dim,
                                               size_t qkv_inner_dim,
diff --git a/examples/cpp/inference/LLAMA/llama.cc b/examples/cpp/inference/LLAMA/llama.cc
index 6d714ba2fa..5724a91859 100644
--- a/examples/cpp/inference/LLAMA/llama.cc
+++ b/examples/cpp/inference/LLAMA/llama.cc
@@ -200,8 +200,11 @@ void FlexFlow::top_level_task(Task const *task,
     float *data = (float *)malloc(sizeof(float) * volume);
 
     if (v.first.find("attention_w") != std::string::npos) {
+      assert(dims_vec[0] =
+                 llamaConfig.dim * (llamaConfig.dim / llamaConfig.n_heads) * 4);
+      assert(dims_vec[1] = llamaConfig.n_heads);
+      assert(volume == dims_vec[0] * dims_vec[1]);
       loader.load_attention_weights(data,
-                                    volume,
                                     llamaConfig.n_heads,
                                     llamaConfig.dim,
                                     llamaConfig.dim / llamaConfig.n_heads,
diff --git a/examples/cpp/inference/LLAMA/llama.h b/examples/cpp/inference/LLAMA/llama.h
index 7584c26aa4..cfa9345c04 100644
--- a/examples/cpp/inference/LLAMA/llama.h
+++ b/examples/cpp/inference/LLAMA/llama.h
@@ -83,7 +83,6 @@ class DataLoader {
 
   template <typename T>
   static void load_attention_weights(T *dst_ptr,
-                                     size_t total_weights_size,
                                      int num_heads,
                                      size_t hidden_dim,
                                      size_t qkv_inner_dim,

From 7ef5bd7a49d057bfc989ab66d387a0eb69378eaa Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 8 May 2023 23:47:46 +0000
Subject: [PATCH 113/344] fix

---
 src/ops/spec_inc_multihead_self_attention.cu | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index dc1d861b08..97e91460a6 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -34,7 +34,8 @@ __global__ void spec_build_w_out_tensor(float const *weight_ptr,
     int v_idx = i % vProjSize;
     int o_idx = (i / vProjSize) % oProjSize;
     int head_idx = i / (vProjSize * oProjSize);
-    contiguous_weight_ptr[i] =
+    contiguous_weight_ptr[o_idx * vProjSize * num_heads + head_idx * vProjSize +
+                          v_idx] =
         weight_ptr[head_idx * (qkv_weight_block_size + vProjSize * oProjSize) +
                    qkv_weight_block_size + o_idx * vProjSize + v_idx];
   }

From 7ae43ee5bac448ba6d44135fca4d4336de701480 Mon Sep 17 00:00:00 2001
From: xinhaoc <chengxh_98@163.com>
Date: Tue, 9 May 2023 01:17:27 +0000
Subject: [PATCH 114/344] fix

---
 examples/cpp/inference/file_loader.cc        | 2 +-
 src/ops/spec_inc_multihead_self_attention.cu | 5 +++--
 2 files changed, 4 insertions(+), 3 deletions(-)

diff --git a/examples/cpp/inference/file_loader.cc b/examples/cpp/inference/file_loader.cc
index 820ffb17df..277d7fd2f6 100644
--- a/examples/cpp/inference/file_loader.cc
+++ b/examples/cpp/inference/file_loader.cc
@@ -121,7 +121,7 @@ void load_attention_weights(float *dst_ptr,
         // if this is the Q,K or V weight
         flexflow_idx =
             head_idx * one_head_size + weight_index * single_proj_size +
-            checkpoint_column_idx * qkv_inner_dim + checkpoint_row_idx;
+            checkpoint_column_idx * hidden_dim + checkpoint_row_idx;
       } else {
         // if this is the output projection weight
         flexflow_idx =
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 97e91460a6..6efd8b8874 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -31,11 +31,12 @@ __global__ void spec_build_w_out_tensor(float const *weight_ptr,
                                         int num_heads,
                                         int qkv_weight_block_size) {
   CUDA_KERNEL_LOOP(i, vProjSize * oProjSize * num_heads) {
+    // vProjSize = 128, oProjSize = 4096
     int v_idx = i % vProjSize;
     int o_idx = (i / vProjSize) % oProjSize;
     int head_idx = i / (vProjSize * oProjSize);
-    contiguous_weight_ptr[o_idx * vProjSize * num_heads + head_idx * vProjSize +
-                          v_idx] =
+    contiguous_weight_ptr[head_idx * vProjSize * oProjSize + v_idx * oProjSize +
+                          o_idx] =
         weight_ptr[head_idx * (qkv_weight_block_size + vProjSize * oProjSize) +
                    qkv_weight_block_size + o_idx * vProjSize + v_idx];
   }

From d045e3e5cddb7fe97f2299ac22ac54266e36fd39 Mon Sep 17 00:00:00 2001
From: xinhaoc <chengxh_98@163.com>
Date: Tue, 9 May 2023 01:20:02 +0000
Subject: [PATCH 115/344] format

---
 examples/cpp/inference/file_loader.cc | 8 ++++----
 1 file changed, 4 insertions(+), 4 deletions(-)

diff --git a/examples/cpp/inference/file_loader.cc b/examples/cpp/inference/file_loader.cc
index 277d7fd2f6..07cfd0dccf 100644
--- a/examples/cpp/inference/file_loader.cc
+++ b/examples/cpp/inference/file_loader.cc
@@ -89,7 +89,7 @@ void load_attention_weights(float *dst_ptr,
   int weight_index = 0; // {q, k, v, o} -> {0, 1, 2, 3}
   size_t single_proj_size =
       hidden_dim *
-      qkv_inner_dim; // size of each of Q,K,V,O weights for a single head
+      qkv_inner_dim;        // size of each of Q,K,V,O weights for a single head
   size_t one_head_size =
       single_proj_size * 4; // size of Q+K+V+O weights for a single head
   size_t one_weight_file_size =
@@ -119,9 +119,9 @@ void load_attention_weights(float *dst_ptr,
       int head_idx = i / single_proj_size;
       if (weight_index < 3) {
         // if this is the Q,K or V weight
-        flexflow_idx =
-            head_idx * one_head_size + weight_index * single_proj_size +
-            checkpoint_column_idx * hidden_dim + checkpoint_row_idx;
+        flexflow_idx = head_idx * one_head_size +
+                       weight_index * single_proj_size +
+                       checkpoint_column_idx * hidden_dim + checkpoint_row_idx;
       } else {
         // if this is the output projection weight
         flexflow_idx =

From 2d54c32a9acdbf07fc86e097f8109821d1025f25 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 9 May 2023 06:15:53 +0000
Subject: [PATCH 116/344] cleanup

---
 examples/cpp/inference/LLAMA/dataloader.cc   | 66 +++++++-------------
 examples/cpp/inference/LLAMA/llama.cc        |  8 +--
 examples/cpp/inference/LLAMA/llama.h         |  6 +-
 examples/cpp/inference/file_loader.cc        | 65 +++++++------------
 src/ops/inc_multihead_self_attention.cu      |  9 ++-
 src/ops/spec_inc_multihead_self_attention.cu | 10 ++-
 src/ops/tree_inc_multihead_self_attention.cu |  9 ++-
 7 files changed, 60 insertions(+), 113 deletions(-)

diff --git a/examples/cpp/inference/LLAMA/dataloader.cc b/examples/cpp/inference/LLAMA/dataloader.cc
index 8eabc0a464..21557b9c94 100644
--- a/examples/cpp/inference/LLAMA/dataloader.cc
+++ b/examples/cpp/inference/LLAMA/dataloader.cc
@@ -159,10 +159,8 @@ void DataLoader::load_from_file(T *ptr, size_t size, std::string filename) {
 }
 
 template <typename T>
-void DataLoader::load_attention_weights(T *dst_ptr,
-                                        int num_heads,
-                                        size_t hidden_dim,
-                                        size_t qkv_inner_dim,
+void DataLoader::load_attention_weights(T *ptr,
+                                        size_t size,
                                         std::string layer_name,
                                         std::string weight_path) {
 
@@ -180,52 +178,37 @@ void DataLoader::load_attention_weights(T *dst_ptr,
                        "attention_wo_weight";
   std::vector<std::string> weight_files = {q_file, k_file, v_file, o_file};
 
-  int weight_index = 0; // {q, k, v, o} -> {0, 1, 2, 3}
-  size_t single_proj_size =
-      hidden_dim *
-      qkv_inner_dim; // size of each of Q,K,V,O weights for a single head
-  size_t one_head_size =
-      single_proj_size * 4; // size of Q+K+V+O weights for a single head
-  size_t one_weight_file_size =
-      num_heads * single_proj_size; // size of each of Q/K/V/O for all heads
+  int file_index = 0;
 
+  // q, k, v, o -> 0, 1, 2, 3
   for (auto file : weight_files) {
-    std::cout << "file name and index: " << file << "->" << weight_index
-              << "\n";
+    std::cout << "file name and index: " << file << "->" << file_index << "\n";
+    size_t partial_size = size / 4;
     std::ifstream in(file, std::ios::in | std::ios::binary);
-    std::vector<T> host_array(one_weight_file_size);
-    size_t loaded_data_size = sizeof(T) * one_weight_file_size;
+    std::vector<T> host_array(partial_size);
+    size_t loaded_data_size = sizeof(T) * partial_size;
     in.seekg(0, in.end);
     in.seekg(0, in.beg);
     in.read((char *)host_array.data(), loaded_data_size);
     size_t in_get_size = in.gcount();
 
     if (in_get_size != loaded_data_size) {
-      std::cout << "load data error" << std::endl;
+      std::cout << "load data error";
       return;
     }
-    assert(one_weight_file_size == host_array.size());
-
-    size_t flexflow_idx;
-    for (int i = 0; i < one_weight_file_size; i++) {
-      int checkpoint_row_idx = i % hidden_dim;
-      int checkpoint_column_idx = (i / hidden_dim) % qkv_inner_dim;
-      int head_idx = i / single_proj_size;
-      if (weight_index < 3) {
-        // if this is the Q,K or V weight
-        flexflow_idx =
-            head_idx * one_head_size + weight_index * single_proj_size +
-            checkpoint_column_idx * qkv_inner_dim + checkpoint_row_idx;
-      } else {
-        // if this is the output projection weight
-        flexflow_idx =
-            head_idx * one_head_size + weight_index * single_proj_size +
-            checkpoint_row_idx * qkv_inner_dim + checkpoint_column_idx;
+    assert(partial_size == host_array.size());
+
+    size_t one_head_size = 4096 * 128;
+    size_t data_index = 0;
+
+    for (int i = 0; i < 32; i++) {
+      size_t start_index = i * one_head_size * 4 + file_index * one_head_size;
+      for (size_t j = start_index; j < start_index + one_head_size; j++) {
+        ptr[j] = host_array.at(data_index);
+        data_index += 1;
       }
-      dst_ptr[flexflow_idx] = host_array.at(i);
     }
-
-    weight_index++;
+    file_index++;
 
     in.close();
   }
@@ -266,13 +249,8 @@ void DataLoader::store_outputs(BatchConfig *bc,
   assert(batch_predictions.size() == bc->num_active_requests());
 }
 
-template void
-    DataLoader::load_attention_weights<float>(float *dst_ptr,
-                                              int num_heads,
-                                              size_t hidden_dim,
-                                              size_t qkv_inner_dim,
-                                              std::string layer_name,
-                                              std::string weight_path);
+template void DataLoader::load_attention_weights<float>(
+    float *ptr, size_t size, std::string layer_name, std::string weight_path);
 template void DataLoader::load_from_file<long>(long *ptr,
                                                size_t size,
                                                std::string filename);
diff --git a/examples/cpp/inference/LLAMA/llama.cc b/examples/cpp/inference/LLAMA/llama.cc
index 5724a91859..383a93397b 100644
--- a/examples/cpp/inference/LLAMA/llama.cc
+++ b/examples/cpp/inference/LLAMA/llama.cc
@@ -204,12 +204,8 @@ void FlexFlow::top_level_task(Task const *task,
                  llamaConfig.dim * (llamaConfig.dim / llamaConfig.n_heads) * 4);
       assert(dims_vec[1] = llamaConfig.n_heads);
       assert(volume == dims_vec[0] * dims_vec[1]);
-      loader.load_attention_weights(data,
-                                    llamaConfig.n_heads,
-                                    llamaConfig.dim,
-                                    llamaConfig.dim / llamaConfig.n_heads,
-                                    v.first,
-                                    llamaConfig.weight_file_path);
+      loader.load_attention_weights(
+          data, volume, v.first, llamaConfig.weight_file_path);
 
     } else {
       loader.load_from_file(
diff --git a/examples/cpp/inference/LLAMA/llama.h b/examples/cpp/inference/LLAMA/llama.h
index cfa9345c04..f2302b25ae 100644
--- a/examples/cpp/inference/LLAMA/llama.h
+++ b/examples/cpp/inference/LLAMA/llama.h
@@ -82,10 +82,8 @@ class DataLoader {
   static void load_from_file(T *ptr, size_t size, std::string filename);
 
   template <typename T>
-  static void load_attention_weights(T *dst_ptr,
-                                     int num_heads,
-                                     size_t hidden_dim,
-                                     size_t qkv_inner_dim,
+  static void load_attention_weights(T *ptr,
+                                     size_t size,
                                      std::string layer_name,
                                      std::string weight_path);
   void store_outputs(BatchConfig *bc,
diff --git a/examples/cpp/inference/file_loader.cc b/examples/cpp/inference/file_loader.cc
index 07cfd0dccf..e0ca8cc105 100644
--- a/examples/cpp/inference/file_loader.cc
+++ b/examples/cpp/inference/file_loader.cc
@@ -66,12 +66,11 @@ BatchConfig::TokenId *FileDataLoader::generate_requests(int num, int length) {
   return prompts;
 };
 
-void load_attention_weights(float *dst_ptr,
-                            int num_heads,
-                            size_t hidden_dim,
-                            size_t qkv_inner_dim,
+void load_attention_weights(float *ptr,
+                            size_t size,
                             std::string layer_name,
                             std::string weight_path) {
+
   std::string q_file = weight_path +
                        layer_name.substr(0, layer_name.find("attention")) +
                        "attention_wq_weight";
@@ -86,52 +85,37 @@ void load_attention_weights(float *dst_ptr,
                        "attention_wo_weight";
   std::vector<std::string> weight_files = {q_file, k_file, v_file, o_file};
 
-  int weight_index = 0; // {q, k, v, o} -> {0, 1, 2, 3}
-  size_t single_proj_size =
-      hidden_dim *
-      qkv_inner_dim;        // size of each of Q,K,V,O weights for a single head
-  size_t one_head_size =
-      single_proj_size * 4; // size of Q+K+V+O weights for a single head
-  size_t one_weight_file_size =
-      num_heads * single_proj_size; // size of each of Q/K/V/O for all heads
+  int file_index = 0;
 
+  // q, k, v, o -> 0, 1, 2, 3
   for (auto file : weight_files) {
-    std::cout << "file name and index: " << file << "->" << weight_index
-              << "\n";
+    std::cout << "file name and index: " << file << "->" << file_index << "\n";
+    size_t partial_size = size / 4;
     std::ifstream in(file, std::ios::in | std::ios::binary);
-    std::vector<float> host_array(one_weight_file_size);
-    size_t loaded_data_size = sizeof(float) * one_weight_file_size;
+    std::vector<float> host_array(partial_size);
+    size_t loaded_data_size = sizeof(float) * partial_size;
     in.seekg(0, in.end);
     in.seekg(0, in.beg);
     in.read((char *)host_array.data(), loaded_data_size);
     size_t in_get_size = in.gcount();
 
     if (in_get_size != loaded_data_size) {
-      std::cout << "load data error" << std::endl;
+      std::cout << "load data error";
       return;
     }
-    assert(one_weight_file_size == host_array.size());
-
-    size_t flexflow_idx;
-    for (int i = 0; i < one_weight_file_size; i++) {
-      int checkpoint_row_idx = i % hidden_dim;
-      int checkpoint_column_idx = (i / hidden_dim) % qkv_inner_dim;
-      int head_idx = i / single_proj_size;
-      if (weight_index < 3) {
-        // if this is the Q,K or V weight
-        flexflow_idx = head_idx * one_head_size +
-                       weight_index * single_proj_size +
-                       checkpoint_column_idx * hidden_dim + checkpoint_row_idx;
-      } else {
-        // if this is the output projection weight
-        flexflow_idx =
-            head_idx * one_head_size + weight_index * single_proj_size +
-            checkpoint_row_idx * qkv_inner_dim + checkpoint_column_idx;
+    assert(partial_size == host_array.size());
+
+    size_t one_head_size = 4096 * 128;
+    size_t data_index = 0;
+
+    for (int i = 0; i < 32; i++) {
+      size_t start_index = i * one_head_size * 4 + file_index * one_head_size;
+      for (size_t j = start_index; j < start_index + one_head_size; j++) {
+        ptr[j] = host_array.at(data_index);
+        data_index += 1;
       }
-      dst_ptr[flexflow_idx] = host_array.at(i);
     }
-
-    weight_index++;
+    file_index++;
 
     in.close();
   }
@@ -192,12 +176,7 @@ void FileDataLoader::load_weights(
       assert(dims_vec[0] = hidden_dim * qkv_inner_dim * 4);
       assert(dims_vec[1] = num_heads);
       assert(volume == dims_vec[0] * dims_vec[1]);
-      load_attention_weights(data,
-                             num_heads,
-                             hidden_dim,
-                             qkv_inner_dim,
-                             v.first,
-                             weight_file_path);
+      load_attention_weights(data, volume, v.first, weight_file_path);
 
     } else {
       load_from_file(data, volume, weight_file_path + v.first);
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index f68bec459b..5997a3d48d 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -31,13 +31,12 @@ __global__ void build_w_out_tensor(float const *weight_ptr,
                                    int num_heads,
                                    int qkv_weight_block_size) {
   CUDA_KERNEL_LOOP(i, vProjSize * oProjSize * num_heads) {
-    int v_idx = i % vProjSize;
-    int o_idx = (i / vProjSize) % oProjSize;
+    int row_idx = i % vProjSize;
+    int col_idx = (i / vProjSize) % oProjSize;
     int head_idx = i / (vProjSize * oProjSize);
-    contiguous_weight_ptr[o_idx * vProjSize * num_heads + head_idx * vProjSize +
-                          v_idx] =
+    contiguous_weight_ptr[i] =
         weight_ptr[head_idx * (qkv_weight_block_size + vProjSize * oProjSize) +
-                   qkv_weight_block_size + o_idx * vProjSize + v_idx];
+                   qkv_weight_block_size + col_idx * vProjSize + row_idx];
   }
 }
 
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 6efd8b8874..42f647f670 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -31,14 +31,12 @@ __global__ void spec_build_w_out_tensor(float const *weight_ptr,
                                         int num_heads,
                                         int qkv_weight_block_size) {
   CUDA_KERNEL_LOOP(i, vProjSize * oProjSize * num_heads) {
-    // vProjSize = 128, oProjSize = 4096
-    int v_idx = i % vProjSize;
-    int o_idx = (i / vProjSize) % oProjSize;
+    int row_idx = i % vProjSize;
+    int col_idx = (i / vProjSize) % oProjSize;
     int head_idx = i / (vProjSize * oProjSize);
-    contiguous_weight_ptr[head_idx * vProjSize * oProjSize + v_idx * oProjSize +
-                          o_idx] =
+    contiguous_weight_ptr[i] =
         weight_ptr[head_idx * (qkv_weight_block_size + vProjSize * oProjSize) +
-                   qkv_weight_block_size + o_idx * vProjSize + v_idx];
+                   qkv_weight_block_size + col_idx * vProjSize + row_idx];
   }
 }
 
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index d2b9f63401..1d45ecaf14 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -31,13 +31,12 @@ __global__ void tree_build_w_out_tensor(float const *weight_ptr,
                                         int num_heads,
                                         int qkv_weight_block_size) {
   CUDA_KERNEL_LOOP(i, vProjSize * oProjSize * num_heads) {
-    int v_idx = i % vProjSize;
-    int o_idx = (i / vProjSize) % oProjSize;
+    int row_idx = i % vProjSize;
+    int col_idx = (i / vProjSize) % oProjSize;
     int head_idx = i / (vProjSize * oProjSize);
-    contiguous_weight_ptr[o_idx * vProjSize * num_heads + head_idx * vProjSize +
-                          v_idx] =
+    contiguous_weight_ptr[i] =
         weight_ptr[head_idx * (qkv_weight_block_size + vProjSize * oProjSize) +
-                   qkv_weight_block_size + o_idx * vProjSize + v_idx];
+                   qkv_weight_block_size + col_idx * vProjSize + row_idx];
   }
 }
 

From 2c88a9a5c51d9d32fc606a049064608b8f90cd21 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 9 May 2023 06:21:34 +0000
Subject: [PATCH 117/344] removed magic numbers

---
 examples/cpp/inference/LLAMA/dataloader.cc | 15 +++++++++++----
 examples/cpp/inference/LLAMA/llama.cc      |  8 ++++++--
 examples/cpp/inference/LLAMA/llama.h       |  2 ++
 examples/cpp/inference/file_loader.cc      |  9 ++++++---
 4 files changed, 25 insertions(+), 9 deletions(-)

diff --git a/examples/cpp/inference/LLAMA/dataloader.cc b/examples/cpp/inference/LLAMA/dataloader.cc
index 21557b9c94..7f2cfe3577 100644
--- a/examples/cpp/inference/LLAMA/dataloader.cc
+++ b/examples/cpp/inference/LLAMA/dataloader.cc
@@ -161,6 +161,8 @@ void DataLoader::load_from_file(T *ptr, size_t size, std::string filename) {
 template <typename T>
 void DataLoader::load_attention_weights(T *ptr,
                                         size_t size,
+                                        int hidden_dim,
+                                        int num_heads,
                                         std::string layer_name,
                                         std::string weight_path) {
 
@@ -198,10 +200,10 @@ void DataLoader::load_attention_weights(T *ptr,
     }
     assert(partial_size == host_array.size());
 
-    size_t one_head_size = 4096 * 128;
+    size_t one_head_size = hidden_dim * (hidden_dim / num_heads);
     size_t data_index = 0;
 
-    for (int i = 0; i < 32; i++) {
+    for (int i = 0; i < num_heads; i++) {
       size_t start_index = i * one_head_size * 4 + file_index * one_head_size;
       for (size_t j = start_index; j < start_index + one_head_size; j++) {
         ptr[j] = host_array.at(data_index);
@@ -249,8 +251,13 @@ void DataLoader::store_outputs(BatchConfig *bc,
   assert(batch_predictions.size() == bc->num_active_requests());
 }
 
-template void DataLoader::load_attention_weights<float>(
-    float *ptr, size_t size, std::string layer_name, std::string weight_path);
+template void
+    DataLoader::load_attention_weights<float>(float *ptr,
+                                              size_t size,
+                                              int hidden_dim,
+                                              int num_heads,
+                                              std::string layer_name,
+                                              std::string weight_path);
 template void DataLoader::load_from_file<long>(long *ptr,
                                                size_t size,
                                                std::string filename);
diff --git a/examples/cpp/inference/LLAMA/llama.cc b/examples/cpp/inference/LLAMA/llama.cc
index 383a93397b..de374459cb 100644
--- a/examples/cpp/inference/LLAMA/llama.cc
+++ b/examples/cpp/inference/LLAMA/llama.cc
@@ -204,8 +204,12 @@ void FlexFlow::top_level_task(Task const *task,
                  llamaConfig.dim * (llamaConfig.dim / llamaConfig.n_heads) * 4);
       assert(dims_vec[1] = llamaConfig.n_heads);
       assert(volume == dims_vec[0] * dims_vec[1]);
-      loader.load_attention_weights(
-          data, volume, v.first, llamaConfig.weight_file_path);
+      loader.load_attention_weights(data,
+                                    volume,
+                                    llamaConfig.dim,
+                                    llamaConfig.n_heads,
+                                    v.first,
+                                    llamaConfig.weight_file_path);
 
     } else {
       loader.load_from_file(
diff --git a/examples/cpp/inference/LLAMA/llama.h b/examples/cpp/inference/LLAMA/llama.h
index f2302b25ae..6bf30cb19c 100644
--- a/examples/cpp/inference/LLAMA/llama.h
+++ b/examples/cpp/inference/LLAMA/llama.h
@@ -84,6 +84,8 @@ class DataLoader {
   template <typename T>
   static void load_attention_weights(T *ptr,
                                      size_t size,
+                                     int hidden_dim,
+                                     int num_heads,
                                      std::string layer_name,
                                      std::string weight_path);
   void store_outputs(BatchConfig *bc,
diff --git a/examples/cpp/inference/file_loader.cc b/examples/cpp/inference/file_loader.cc
index e0ca8cc105..deed6ba985 100644
--- a/examples/cpp/inference/file_loader.cc
+++ b/examples/cpp/inference/file_loader.cc
@@ -68,6 +68,8 @@ BatchConfig::TokenId *FileDataLoader::generate_requests(int num, int length) {
 
 void load_attention_weights(float *ptr,
                             size_t size,
+                            int hidden_dim,
+                            int num_heads,
                             std::string layer_name,
                             std::string weight_path) {
 
@@ -105,10 +107,10 @@ void load_attention_weights(float *ptr,
     }
     assert(partial_size == host_array.size());
 
-    size_t one_head_size = 4096 * 128;
+    size_t one_head_size = hidden_dim * (hidden_dim / num_heads);
     size_t data_index = 0;
 
-    for (int i = 0; i < 32; i++) {
+    for (int i = 0; i < num_heads; i++) {
       size_t start_index = i * one_head_size * 4 + file_index * one_head_size;
       for (size_t j = start_index; j < start_index + one_head_size; j++) {
         ptr[j] = host_array.at(data_index);
@@ -176,7 +178,8 @@ void FileDataLoader::load_weights(
       assert(dims_vec[0] = hidden_dim * qkv_inner_dim * 4);
       assert(dims_vec[1] = num_heads);
       assert(volume == dims_vec[0] * dims_vec[1]);
-      load_attention_weights(data, volume, v.first, weight_file_path);
+      load_attention_weights(
+          data, volume, hidden_dim, num_heads, v.first, weight_file_path);
 
     } else {
       load_from_file(data, volume, weight_file_path + v.first);

From 4efea836dfe6142db9ad292c0627d599fa71d006 Mon Sep 17 00:00:00 2001
From: zwang86 <46699021+zwang86@users.noreply.github.com>
Date: Wed, 10 May 2023 11:13:26 -0400
Subject: [PATCH 118/344] [Inference] Prepare batch for speculative inference
 (#714)

* Modify

* Verify results tree with input tree
.

* Beam_init

* VerifyTreeBatchConfig init.

* Fix

* Add committed_tokens, results splits.

* Fix, pass compiling.

* Duplicate spec_llama example for testing pipeline.

* Add prompt token in the first verify iteration.

* Update BeamInferenceResult.

* edited example files

* added debugging prints

* Match one iterations.

* Adjust tree depth.

* refactor example for iteration looping

* Fix, now run with multipile iterations.

* Merge conflict.

* Fix num_tokens_to_commit.

* Format code.

---------

Co-authored-by: User <yingyee0111@gmail.com>
Co-authored-by: Rae Wong <rae@ip-172-31-10-138.us-east-2.compute.internal>
---
 CMakeLists.txt                                |   4 +
 .../spec_verify_pipeline/CMakeLists.txt       |  20 +
 .../inference/spec_verify_pipeline/Makefile   |  39 ++
 .../inference/spec_verify_pipeline/README.md  |  14 +
 .../inference/spec_verify_pipeline/llama.cc   | 287 ++++++++++
 .../spec_verify_pipeline/llama_rae.cc         | 246 ++++++++
 include/flexflow/batch_config.h               |  19 +-
 include/flexflow/inference.h                  |  45 +-
 src/runtime/batch_config.cc                   |   2 +
 src/runtime/inference_manager.cc              |   5 +
 src/runtime/request_manager.cc                | 529 ++++++++++++++++--
 11 files changed, 1134 insertions(+), 76 deletions(-)
 create mode 100644 examples/cpp/inference/spec_verify_pipeline/CMakeLists.txt
 create mode 100644 examples/cpp/inference/spec_verify_pipeline/Makefile
 create mode 100644 examples/cpp/inference/spec_verify_pipeline/README.md
 create mode 100644 examples/cpp/inference/spec_verify_pipeline/llama.cc
 create mode 100644 examples/cpp/inference/spec_verify_pipeline/llama_rae.cc

diff --git a/CMakeLists.txt b/CMakeLists.txt
index 8edad77124..59f3453f1e 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -548,6 +548,10 @@ if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/inference/SPEC_LLAMA)
 endif()
 
+if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
+  add_subdirectory(examples/cpp/inference/spec_verify_pipeline)
+endif()
+
 # installation
 set(INCLUDE_DEST "include")
 set(LIB_DEST "lib")
diff --git a/examples/cpp/inference/spec_verify_pipeline/CMakeLists.txt b/examples/cpp/inference/spec_verify_pipeline/CMakeLists.txt
new file mode 100644
index 0000000000..f93189af36
--- /dev/null
+++ b/examples/cpp/inference/spec_verify_pipeline/CMakeLists.txt
@@ -0,0 +1,20 @@
+cmake_minimum_required(VERSION 3.10)
+
+project(FlexFlowExample_spec_verify_pipeline)
+set(project_target spec_verify_pipeline)
+
+
+set(CPU_SRC
+  ${FLEXFLOW_CPP_DRV_SRC}
+  llama.cc
+  ../file_loader.cc
+  ../models/llama.cc)
+
+
+cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
+target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
+target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/examples/cpp/inference)
+target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
+
+set(BIN_DEST "bin")
+install(TARGETS ${project_target} DESTINATION ${BIN_DEST})
diff --git a/examples/cpp/inference/spec_verify_pipeline/Makefile b/examples/cpp/inference/spec_verify_pipeline/Makefile
new file mode 100644
index 0000000000..130d52a7ee
--- /dev/null
+++ b/examples/cpp/inference/spec_verify_pipeline/Makefile
@@ -0,0 +1,39 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+#
+
+# Flags for directing the runtime makefile what to include
+DEBUG           ?= 0		# Include debugging symbols
+MAX_DIM         ?= 4		# Maximum number of dimensions
+OUTPUT_LEVEL    ?= LEVEL_DEBUG	# Compile time logging level
+USE_CUDA        ?= 1		# Include CUDA support (requires CUDA)
+USE_GASNET      ?= 0		# Include GASNet support (requires GASNet)
+USE_HDF         ?= 1		# Include HDF5 support (requires HDF5)
+ALT_MAPPERS     ?= 0		# Include alternative mappers (not recommended)
+
+# Put the binary file name here
+OUTFILE		?= spec_verify_pipeline
+# List all the application source files here
+GEN_SRC		= llama.cc dataloader.cc 
+GEN_GPU_SRC	= dataloader.cu 
+ifndef CUDA_HOME
+CUDA_HOME = $(patsubst %/bin/nvcc,%,$(shell which nvcc | head -1))
+endif
+
+
+ifndef FF_HOME
+$(error FF_HOME variable is not defined, aborting build)
+endif
+
+include $(FF_HOME)/FlexFlow.mk
diff --git a/examples/cpp/inference/spec_verify_pipeline/README.md b/examples/cpp/inference/spec_verify_pipeline/README.md
new file mode 100644
index 0000000000..4a112ba45f
--- /dev/null
+++ b/examples/cpp/inference/spec_verify_pipeline/README.md
@@ -0,0 +1,14 @@
+# an example of running llama model with beam search
+
+## how to run it?
+1. build the flexflow with FF_BUILD_ALL_INFERENCE_EXAMPLES or FF_BUILD_ALL_EXAMPLES
+2. download the weight and token file from aws s3. 
+```bash
+aws s3 cp s3://catalyst-llama/7B_weights_float.tar.gz FF_HOME/examples/cpp/inference/spec_verify_pipeline/weights
+tar -zxvf 7B_weights_float.tar.gz 
+aws s3 cp s3://catalyst-llama/tokens.tar FF_HOME/examples/cpp/inference/spec_verify_pipeline/tokens
+tar -zxvf tokens.tar
+```
+3. run *spec_verify_pipeline* with `--weights` `--dataset`  `-b 5` `--only-data-parallel`
+4. [expected results](https://github.com/flexflow/FlexFlow/pull/681#issuecomment-1534264054)
+
diff --git a/examples/cpp/inference/spec_verify_pipeline/llama.cc b/examples/cpp/inference/spec_verify_pipeline/llama.cc
new file mode 100644
index 0000000000..b00fc522f1
--- /dev/null
+++ b/examples/cpp/inference/spec_verify_pipeline/llama.cc
@@ -0,0 +1,287 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "models/llama.h"
+#include "flexflow/inference.h"
+
+using namespace Legion;
+
+LegionRuntime::Logger::Category log_app("llama");
+
+void parse_input_args(char **argv, int argc, LLAMA::Config &config) {
+  for (int i = 1; i < argc; i++) {
+    // input
+    if (!strcmp(argv[i], "--dataset")) {
+      config.input_path = std::string(argv[++i]);
+      continue;
+    }
+
+    // weights
+    if (!strcmp(argv[i], "--weights")) {
+      config.weight_file_path = std::string(argv[++i]);
+      continue;
+    }
+  }
+}
+
+void FlexFlow::top_level_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  FFConfig ffconfig;
+  LLAMA::Config llama_config;
+
+  InputArgs const &command_args = HighLevelRuntime::get_input_args();
+  char **argv = command_args.argv;
+  int argc = command_args.argc;
+  parse_input_args(argv, argc, llama_config);
+  InferenceManager im(ffconfig, llama_config.batchSize, 1);
+  RequestManager rm;
+  // Add a single request
+  std::vector<BatchConfig::TokenId> prompt{
+      1, 306, 4658, 278, 6593, 310, 2834, 338};
+  rm.register_new_request(prompt, llama_config.sentence_len);
+
+  FFModel beam_model(ffconfig), tree_model(ffconfig), inc_model(ffconfig);
+  LLAMA::create_llama_model(beam_model, im, llama_config, 1, BEAM_SEARCH_MODE);
+  LLAMA::create_llama_model(tree_model, im, llama_config, 1, TREE_VERIFY_MODE);
+  LLAMA::create_llama_model(inc_model, im, llama_config, 1, INC_DECODING_MODE);
+
+  // entry---------------------------
+  int depth = 0;
+  std::map<int, Future> beam_future_handlers, tree_future_handler;
+  std::map<int, BeamSearchBatchConfig> beam_batch_configs;
+  std::map<int, TreeVerifyBatchConfig> tree_batch_configs;
+
+  bool new_req = true;
+  TreeVerifyBatchConfig tree_bc;
+
+  int iteration = 0;
+
+  while (depth < llama_config.max_beam_depth) {
+    int bid = 0;
+    if (beam_future_handlers.find(bid) == beam_future_handlers.end()) {
+      BeamSearchBatchConfig bc;
+      InferenceResult ir;
+      bc = rm.prepare_next_batch_init(tree_bc, ir);
+
+      std::cout << "sub_requests: " << bc.sub_requests[0] << "\n";
+      FutureMap fm = im.inference(&beam_model, bid, bc);
+      assert(fm.get_future_map_domain().get_volume() == 1);
+      beam_future_handlers[bid] = fm.get_future(0);
+      beam_batch_configs[bid] = bc;
+    } else {
+      // have luanched this bid
+      Future future = beam_future_handlers[bid];
+      if (!future.is_ready(true /*subscribe*/)) {
+        continue;
+      } else {
+        std::cout << "future is ready...." << std::endl;
+      }
+      // process end
+      BeamInferenceResult ir = future.get_result<BeamInferenceResult>();
+      BeamSearchBatchConfig bc = beam_batch_configs[bid];
+      depth = bc.beamRequestsInfo[0].current_depth;
+      bc = rm.prepare_next_batch_beam(bc, ir);
+
+      std::cout << "llama current depth: " << depth << std::endl;
+      std::cout << "sub_requests: " << bc.sub_requests[0] << "\n";
+      FutureMap fm = im.inference(&beam_model, bid, bc);
+      assert(fm.get_future_map_domain().get_volume() == 1);
+      beam_future_handlers[bid] = fm.get_future(0);
+      beam_batch_configs[bid] = bc;
+
+      // tranverse the tree in dfs order;
+      if (depth >= llama_config.max_beam_depth) {
+
+        printf("\n\n ------Final Beam Search Batch------\n");
+        printf("[Beam] num_tokens: %d\n", bc.num_tokens);
+        for (int i = 0; i < bc.num_tokens; i++) {
+          std::cout << "[Token] Request Index: "
+                    << bc.tokensInfo[i].request_index
+                    << ", Abs Depth: " << bc.tokensInfo[i].abs_depth_in_request
+                    << ", Token Id: " << bc.tokensInfo[i].token_id << "\n";
+        }
+
+        // printf("\n\n prepare tree_bc from final beam search bc\n");
+        tree_bc = rm.prepare_next_batch_verify(bc);
+
+        printf("\n\n\n ------Tree Verify Batch-------\n");
+        // should have the same content as the hardcoded verification block
+        // below right now, it only contains the prompt need to add in the beam
+        // search result
+
+        printf("[Verify] num_tokens : %d\n", tree_bc.num_tokens);
+        printf("[Verify] num_tokens_in_batch: %d\n",
+               tree_bc.requestsInfo[0].num_tokens_in_batch);
+        printf("------------------------------\n");
+
+        for (int i = 0; i < tree_bc.num_tokens; i++) {
+          std::cout << "[Token] Request Index: "
+                    << tree_bc.tokensInfo[i].request_index << ", Abs Depth: "
+                    << tree_bc.tokensInfo[i].abs_depth_in_request
+                    << ", Token Id: " << tree_bc.tokensInfo[i].token_id << "\n";
+        }
+
+        printf("\n\n ------Commit Verified Tokens-------\n");
+        for (int i = 0; i < tree_bc.num_tokens_to_commit; i++) {
+          std::cout << "[Commit] Request Index: "
+                    << tree_bc.commited_tokens[i].request_index
+                    << ", Abs Depth: " << tree_bc.commited_tokens[i].token_depth
+                    << ", Token Index in batch: "
+                    << tree_bc.commited_tokens[i].token_index << "\n";
+        }
+
+        FutureMap fm = im.inference(&tree_model, 0, tree_bc);
+        assert(fm.get_future_map_domain().get_volume() == 1);
+        Future future = fm.get_future(0);
+        InferenceResult ir = future.get_result<InferenceResult>();
+        for (int i = 0; i < tree_bc.num_tokens; i++) {
+          if (i == 7) {
+            std::cout << "------------------\n";
+          }
+          printf("verify_tokens[%d] = %d\n", i, ir.token_ids[i]);
+        }
+
+        std::cout << "------Init New Beam Search Batch------\n";
+        bc = rm.prepare_next_batch_init(tree_bc, ir);
+        std::cout << "[Init] num_tokens: " << bc.num_tokens << "\n";
+        for (int i = 0; i < bc.num_tokens; i++) {
+          std::cout << "[Token] Request Index: "
+                    << bc.tokensInfo[i].request_index
+                    << ", Abs Depth: " << bc.tokensInfo[i].abs_depth_in_request
+                    << ", Token Id: " << bc.tokensInfo[i].token_id << "\n";
+        }
+        std::cout << "Batch Depth: " << bc.beamRequestsInfo[0].current_depth
+                  << "\n";
+
+        iteration++;
+
+        if (iteration < 4) {
+          std::cout << "\n\n~~~~~~~~~~teration " << iteration << "~~~~~~~~~~\n";
+          depth = bc.beamRequestsInfo[0].current_depth;
+          fm = im.inference(&beam_model, bid, bc);
+          assert(fm.get_future_map_domain().get_volume() == 1);
+          beam_future_handlers[bid] = fm.get_future(0);
+          beam_batch_configs[bid] = bc;
+        } else {
+          break;
+        }
+      }
+    }
+  }
+
+  // // original
+  // {
+  //   std::vector<BatchConfig::TokenId> tokens{1,
+  //                                            306,
+  //                                            4658,
+  //                                            278,
+  //                                            6593,
+  //                                            310,
+  //                                            2834,
+  //                                            338,
+  //                                            593,
+  //                                            595,
+  //                                            17252,
+  //                                            5031,
+  //                                            993,
+  //                                            616,
+  //                                            368,
+  //                                            2302,
+  //                                            3204,
+  //                                            29131,
+  //                                            2976,
+  //                                            11285,
+  //                                            8930,
+  //                                            635,
+  //                                            8519,
+  //                                            593,
+  //                                            595};
+  //   BatchConfig bc;
+  //   bc.num_tokens = 25;
+  //   bc.requestsInfo[0].num_tokens_in_batch = bc.num_tokens;
+  //   bc.requestsInfo[0].token_start_offset = 0;
+  //   bc.requestsInfo[0].max_sequence_length = 347;
+  //   bc.requestsInfo[0].request_guid = 1000000;
+  //   bc.request_completed[0] = false;
+  //   for (int i = 0; i < bc.num_tokens; i++) {
+  //     bc.tokensInfo[i].token_id = tokens[i];
+  //     bc.tokensInfo[i].abs_depth_in_request = i;
+  //     bc.tokensInfo[i].request_index = 0;
+  //   }
+  //   FutureMap fm = im.inference(&inc_model, 0, bc);
+  //   assert(fm.get_future_map_domain().get_volume() == 1);
+  //   Future future = fm.get_future(0);
+  //   InferenceResult ir = future.get_result<InferenceResult>();
+  //   for (int i = 0; i < bc.num_tokens; i++) {
+  //     printf("decoding_tokens[%d] = %d\n", i, ir.token_ids[i]);
+  //   }
+  // }
+
+  // // verification
+  // {
+  //   std::vector<BatchConfig::TokenId> tokens{1,
+  //                                            306,
+  //                                            4658,
+  //                                            278,
+  //                                            6593,
+  //                                            310,
+  //                                            2834,
+  //                                            338,
+  //                                            593,
+  //                                            595,
+  //                                            17252,
+  //                                            5031,
+  //                                            993,
+  //                                            616,
+  //                                            368,
+  //                                            2302,
+  //                                            3204,
+  //                                            29131,
+  //                                            2976,
+  //                                            11285,
+  //                                            8930,
+  //                                            635,
+  //                                            8519,
+  //                                            593,
+  //                                            595};
+  //   tree_bc.num_tokens = 25;
+  //   tree_bc.requestsInfo[0].num_tokens_in_batch = tree_bc.num_tokens;
+  //   for (int i = 0; i < tree_bc.num_tokens; i++) {
+  //     tree_bc.tokensInfo[i].token_id = tokens[i];
+  //     tree_bc.tokensInfo[i].abs_depth_in_request = i;
+  //     tree_bc.tokensInfo[i].request_index = 0;
+  //   }
+  //   FutureMap fm = im.inference(&tree_model, 0, tree_bc);
+  //   assert(fm.get_future_map_domain().get_volume() == 1);
+  //   Future future = fm.get_future(0);
+  //   InferenceResult ir = future.get_result<InferenceResult>();
+  //   for (int i = 0; i < tree_bc.num_tokens; i++) {
+  //     printf("verify_tokens[%d] = %d\n", i, ir.token_ids[i]);
+  //   }
+  // }
+
+  // Execution fence
+  {
+    Future future = runtime->issue_execution_fence(ctx);
+    future.get_void_result();
+  }
+
+  // float* data
+  std::cout << "----------inference finished--------------" << std::endl;
+}
+
+void FlexFlow::register_custom_tasks() {}
diff --git a/examples/cpp/inference/spec_verify_pipeline/llama_rae.cc b/examples/cpp/inference/spec_verify_pipeline/llama_rae.cc
new file mode 100644
index 0000000000..7116c4bf21
--- /dev/null
+++ b/examples/cpp/inference/spec_verify_pipeline/llama_rae.cc
@@ -0,0 +1,246 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/inference.h"
+#include "models/llama.h"
+
+using namespace Legion;
+
+LegionRuntime::Logger::Category log_app("llama");
+
+void parse_input_args(char **argv, int argc, LLAMA::Config &config) {
+  for (int i = 1; i < argc; i++) {
+    // input
+    if (!strcmp(argv[i], "--dataset")) {
+      config.input_path = std::string(argv[++i]);
+      continue;
+    }
+
+    // weights
+    if (!strcmp(argv[i], "--weights")) {
+      config.weight_file_path = std::string(argv[++i]);
+      continue;
+    }
+  }
+}
+
+void FlexFlow::top_level_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  FFConfig ffconfig;
+  LLAMA::Config llama_config;
+
+  InputArgs const &command_args = HighLevelRuntime::get_input_args();
+  char **argv = command_args.argv;
+  int argc = command_args.argc;
+  parse_input_args(argv, argc, llama_config);
+  InferenceManager im(ffconfig, llama_config.batchSize, 1);
+  RequestManager rm;
+  // Add a single request
+  std::vector<BatchConfig::TokenId> prompt{
+      1, 306, 4658, 278, 6593, 310, 2834, 338};
+  rm.register_new_request(prompt, llama_config.sentence_len);
+
+  FFModel beam_model(ffconfig), tree_model(ffconfig), inc_model(ffconfig);
+  LLAMA::create_llama_model(beam_model, im, llama_config, 1, BEAM_SEARCH_MODE);
+  LLAMA::create_llama_model(tree_model, im, llama_config, 1, TREE_VERIFY_MODE);
+  // LLAMA::create_llama_model(inc_model, im, llama_config, 1,
+  // INC_DECODING_MODE);
+
+  // entry---------------------------
+  int abs_depth = 0;
+  std::map<int, Future> beam_future_handlers, tree_future_handler;
+  std::map<int, BeamSearchBatchConfig> beam_batch_configs;
+  std::map<int, TreeVerifyBatchConfig> tree_batch_configs;
+
+  bool new_req = true;
+  TreeVerifyBatchConfig tree_bc;
+  InferenceResult ir;
+  int num_iterations = 2;
+
+  for (int itr = 0; itr < num_iterations; itr++) {
+    printf("\n\n ITERATION %d \n\n", itr);
+
+    // first iteration of beam search, calling prepare_next_batch_init
+    int beam_search_depth = 0;
+    int bid = 0;
+    BeamSearchBatchConfig bc;
+    bc = rm.prepare_next_batch_init(tree_bc, ir);
+
+    printf("\n\n init beam search bc\n");
+    printf("bc.num_tokens: %d\n", bc.num_tokens);
+    for (int i = 0; i < bc.num_tokens; i++) {
+      printf("bc.tokensInfo[%d].token_id: %d\n", i, bc.tokensInfo[i].token_id);
+      printf("bc.tokensInfo[%d].abs_depth_in_request: %d\n",
+             i,
+             bc.tokensInfo[i].abs_depth_in_request);
+      printf("bc.tokensInfo[%d].request_index: %d\n",
+             i,
+             bc.tokensInfo[i].request_index);
+    }
+
+    std::cout << "sub_requests: " << bc.sub_requests[0] << "\n";
+    FutureMap fm = im.inference(&beam_model, bid, bc);
+    assert(fm.get_future_map_domain().get_volume() == 1);
+    beam_future_handlers[bid] = fm.get_future(0);
+    beam_batch_configs[bid] = bc;
+
+    // subsequent iterations of beam search
+    while (beam_search_depth < llama_config.max_beam_depth) {
+      // have luanched this bid
+      Future future = beam_future_handlers[bid];
+      if (!future.is_ready(true /*subscribe*/)) {
+        continue;
+      } else {
+        std::cout << "future is ready...." << std::endl;
+      }
+      // process end
+      BeamInferenceResult ir_beam = future.get_result<BeamInferenceResult>();
+      BeamSearchBatchConfig bc = beam_batch_configs[bid];
+      abs_depth = bc.beamRequestsInfo[0].current_depth;
+      bc = rm.prepare_next_batch_beam(bc, ir_beam);
+
+      std::cout << "llama current depth: " << abs_depth << std::endl;
+      std::cout << "sub_requests: " << bc.sub_requests[0] << "\n";
+      FutureMap fm = im.inference(&beam_model, bid, bc);
+      assert(fm.get_future_map_domain().get_volume() == 1);
+      beam_future_handlers[bid] = fm.get_future(0);
+      beam_batch_configs[bid] = bc;
+      beam_search_depth++;
+    }
+
+    // verify
+    printf("\n\n ------Final Beam Search Batch------\n");
+    printf("[Beam] num_tokens: %d\n", bc.num_tokens);
+    for (int i = 0; i < bc.num_tokens; i++) {
+      std::cout << "[Token] Request Index: " << bc.tokensInfo[i].request_index
+                << ", Abs Depth: " << bc.tokensInfo[i].abs_depth_in_request
+                << ", Token Id: " << bc.tokensInfo[i].token_id << "\n";
+    }
+
+    printf("\n\n prepare tree_bc from final beam search bc\n");
+    tree_bc = rm.prepare_next_batch_verify(bc);
+
+    printf("\n\n\n t------Tree Verify Batch-------\n");
+    // should have the same content as the hardcoded verification block below
+    // right now, it only contains the prompt
+    // need to add in the beam search result
+
+    printf("[Verify] num_tokens : %d\n", tree_bc.num_tokens);
+    printf("[Verify] num_tokens_in_batch: %d\n",
+           tree_bc.requestsInfo[0].num_tokens_in_batch);
+    printf("------------------------------\n");
+
+    for (int i = 0; i < tree_bc.num_tokens; i++) {
+      std::cout << "[Token] Request Index: "
+                << tree_bc.tokensInfo[i].request_index
+                << ", Abs Depth: " << tree_bc.tokensInfo[i].abs_depth_in_request
+                << ", Token Id: " << tree_bc.tokensInfo[i].token_id << "\n";
+    }
+
+    fm = im.inference(&tree_model, 0, tree_bc);
+    assert(fm.get_future_map_domain().get_volume() == 1);
+    Future future = fm.get_future(0);
+    ir = future.get_result<InferenceResult>();
+    for (int i = 0; i < tree_bc.num_tokens; i++) {
+      printf("verify_tokens[%d] = %d\n", i, ir.token_ids[i]);
+    }
+  }
+
+  // // original
+  // {
+  //   std::vector<BatchConfig::TokenId> tokens{1,
+  //                                            306,
+  //                                            4658,
+  //                                            278,
+  //                                            6593,
+  //                                            310,
+  //                                            2834,
+  //                                            338,
+  //                                            593,
+  //                                            595,
+  //                                            17252,
+  //                                            5031,
+  //                                            993,
+  //                                            616,
+  //                                            368,
+  //                                            2302};
+  //   BatchConfig bc;
+  //   bc.num_tokens = 16;
+  //   bc.requestsInfo[0].num_tokens_in_batch = bc.num_tokens;
+  //   bc.requestsInfo[0].token_start_offset = 0;
+  //   bc.requestsInfo[0].max_sequence_length = 347;
+  //   bc.requestsInfo[0].request_guid = 1000000;
+  //   bc.request_completed[0] = false;
+  //   for (int i = 0; i < bc.num_tokens; i++) {
+  //     bc.tokensInfo[i].token_id = tokens[i];
+  //     bc.tokensInfo[i].abs_depth_in_request = i;
+  //     bc.tokensInfo[i].request_index = 0;
+  //   }
+  //   FutureMap fm = im.inference(&inc_model, 0, bc);
+  //   assert(fm.get_future_map_domain().get_volume() == 1);
+  //   Future future = fm.get_future(0);
+  //   InferenceResult ir = future.get_result<InferenceResult>();
+  //   for (int i = 0; i < bc.num_tokens; i++) {
+  //     printf("decoding_tokens[%d] = %d\n", i, ir.token_ids[i]);
+  //   }
+  // }
+
+  // // verification
+  // {
+  //   std::vector<BatchConfig::TokenId> tokens{1,
+  //                                            306,
+  //                                            4658,
+  //                                            278,
+  //                                            6593,
+  //                                            310,
+  //                                            2834,
+  //                                            338,
+  //                                            593,
+  //                                            595,
+  //                                            17252,
+  //                                            5031,
+  //                                            993,
+  //                                            616,
+  //                                            368,
+  //                                            2302};
+  //   tree_bc.num_tokens = 16;
+  //   tree_bc.requestsInfo[0].num_tokens_in_batch = tree_bc.num_tokens;
+  //   for (int i = 0; i < tree_bc.num_tokens; i++) {
+  //     tree_bc.tokensInfo[i].token_id = tokens[i];
+  //     tree_bc.tokensInfo[i].abs_depth_in_request = i;
+  //     tree_bc.tokensInfo[i].request_index = 0;
+  //   }
+  //   FutureMap fm = im.inference(&tree_model, 0, tree_bc);
+  //   assert(fm.get_future_map_domain().get_volume() == 1);
+  //   Future future = fm.get_future(0);
+  //   InferenceResult ir = future.get_result<InferenceResult>();
+  //   for (int i = 0; i < tree_bc.num_tokens; i++) {
+  //     printf("verify_tokens[%d] = %d\n", i, ir.token_ids[i]);
+  //   }
+  // }
+
+  // Execution fence
+  {
+    Future future = runtime->issue_execution_fence(ctx);
+    future.get_void_result();
+  }
+
+  // float* data
+  std::cout << "----------inference finished--------------" << std::endl;
+}
+
+void FlexFlow::register_custom_tasks() {}
diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 55bad9237a..8c6fa41f2e 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -50,11 +50,8 @@ class BatchConfig {
   int num_tokens;
 
   struct PerRequestInfo {
-    int token_start_offset; // input[token_start_offset * data_dim] is the first
-                            // token
-    int num_tokens_in_batch; // tokens from input[token_start_offset * data_dim
-                             // : (token_start_offset + num_token_in_batch) *
-                             // data_dim]
+    int token_start_offset;
+    int num_tokens_in_batch;
     int max_sequence_length;
     RequestGuid request_guid;
   };
@@ -108,15 +105,9 @@ class BeamSearchBatchConfig : public BatchConfig {
   static int const MAX_BEAM_DEPTH = 8;
 
   struct BeamSearchPerRequestInfo {
-    // int token_start_offset; // input[token_start_offset * data_dim] is the
-    // first token int num_tokens_in_batch; // tokens from
-    // input[token_start_offset * data_dim : (token_start_offset +
-    // num_token_in_batch) * data_dim] int max_sequence_length; RequestGuid
-    // request_guid;
     bool request_completed;
-    int beam_size; //
+    int beam_size;
     int current_depth = -1;
-    // int global_depth = -1;
     int max_depth = MAX_BEAM_DEPTH;
 
     BatchConfig::TokenId tokens[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
@@ -130,6 +121,7 @@ class BeamSearchBatchConfig : public BatchConfig {
 
   BeamSearchPerRequestInfo beamRequestsInfo[MAX_NUM_REQUESTS];
   BeamSearchPerTokenInfo beamTokenInfo[MAX_NUM_TOKENS * MAX_BEAM_WIDTH];
+  // why is this == MAX_NUM_REQUESTS * MAX_BEAM_WIDTH?
   int sub_requests[MAX_NUM_REQUESTS * MAX_BEAM_WIDTH];
   // BeamSlot beam_slots[MAX_NUM_REQUESTS];
 
@@ -137,7 +129,8 @@ class BeamSearchBatchConfig : public BatchConfig {
   size_t current_iteration;
 };
 
-struct BeamInferenceResult : public InferenceResult {
+struct BeamInferenceResult {
+  static int const MAX_NUM_TOKENS = BatchConfig::MAX_NUM_TOKENS;
   BatchConfig::TokenId
       token_ids[MAX_NUM_TOKENS * BeamSearchBatchConfig::MAX_BEAM_WIDTH];
   float probs[MAX_NUM_TOKENS * BeamSearchBatchConfig::MAX_BEAM_WIDTH];
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index 623b8ffd32..bbeaf67821 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -50,6 +50,7 @@ class InferenceManager {
 struct Request {
   BatchConfig::RequestGuid guid;
   int max_sequence_length;
+  int initial_len;
   std::vector<BatchConfig::TokenId> tokens;
 };
 
@@ -61,9 +62,15 @@ struct BeamTree {
     int parent_ids[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
     float probs[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
   };
-  treeLayer treeLayers[BeamSearchBatchConfig::MAX_BEAM_DEPTH];
+  treeLayer treeLayers[BeamSearchBatchConfig::MAX_BEAM_DEPTH + 1];
 };
 
+// struct BeamTree_v2 {
+//   std::vector<BatchConfig::TokenId> tokens;
+//   std::vector<int> parent_ids;
+//   std::vector<float> probs;
+// };
+
 class RequestManager {
 public:
   using RequestGuid = BatchConfig::RequestGuid;
@@ -74,19 +81,38 @@ class RequestManager {
                                    int max_sequence_length);
   BatchConfig prepare_next_batch(BatchConfig const &bc,
                                  InferenceResult const &result);
-
   BeamSearchBatchConfig
-      prepare_next_batch_beam(BeamSearchBatchConfig const &bc,
+      prepare_next_batch_beam(BeamSearchBatchConfig const &old_bc,
                               BeamInferenceResult const &result);
 
+  BeamSearchBatchConfig
+      prepare_next_batch_init(TreeVerifyBatchConfig const &old_bc,
+                              InferenceResult const &result);
+
+  TreeVerifyBatchConfig
+      prepare_next_batch_verify(BeamSearchBatchConfig const &old_bc);
+
   void store_beam_metadata(BeamSearchBatchConfig const &old_bc,
                            BeamInferenceResult const &result);
   void update_beam_metadata(BeamSearchBatchConfig &new_bc,
                             BeamTree &tree,
                             int request_index);
-  void tranverse_beam_tree(BeamSearchBatchConfig const &old_bc);
+
+  std::vector<std::pair<BatchConfig::TokenId, int>>
+      traverse_beam_tree(BeamSearchBatchConfig const &old_bc,
+                         int request_index,
+                         int token_start_offset);
+
+  std::vector<std::pair<BatchConfig::TokenId, int>> traverse_verify_tree(
+      size_t guid,
+      std::vector<std::pair<BatchConfig::TokenId, int>> const
+          &inputSerializedTree,
+      std::vector<std::pair<BatchConfig::TokenId, int>> const
+          &outputSerializedTree);
+
   TreeVerifyBatchConfig
       convert_beam_to_tree_batch_config(BeamSearchBatchConfig const &beam_bc);
+
   static void
       load_tokens_task(Legion::Task const *task,
                        std::vector<Legion::PhysicalRegion> const &regions,
@@ -98,7 +124,18 @@ class RequestManager {
   std::unordered_map<RequestGuid, Request> running_request_queue;
   std::mutex request_queue_mutex;
   RequestGuid next_available_guid;
+
   struct BeamTree beam_trees[BatchConfig::MAX_NUM_REQUESTS];
+
+  std::unordered_map<RequestGuid,
+                     std::vector<std::pair<BatchConfig::TokenId, int>>>
+      dfs_tree_inputs;
+
+  // std::unordered_map<RequestGuid, BeamTree_v2> beam_trees_v2;
+  // TODO: cache config info for Verify/Beam exchange: Beam Width, Beam Depth,
+  // Commited Tokens
+  std::unordered_map<RequestGuid, std::vector<std::pair<int, int>>>
+      committed_tokens;
   size_t num_processed_requests;
 };
 
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index 2bed8f14c0..d6b1c5bed9 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -117,6 +117,8 @@ int BatchConfig::num_active_requests() const {
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
     if (!request_completed[i]) {
       num_requests++;
+      // } else {
+      //   std::cout << "request " << i << " is completed" << std::endl;
     }
   }
   return num_requests;
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 25d6e2a00e..15ae8e3aa3 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -197,6 +197,11 @@ MachineView *InferenceManager::get_machine_view(int mv_id) {
 FutureMap InferenceManager::inference(FFModel *model,
                                       int index,
                                       BatchConfig const &bc) {
+  std::cout << "InferenceManager::inference" << index << std::endl;
+  std::cout << "num_active_tokens = " << bc.num_active_tokens()
+            << ", num_active_requests = " << bc.num_active_requests()
+            << std::endl;
+
   assert(bc.num_active_tokens() > 0 && bc.num_active_requests() > 0);
   // We currently assume that the index-th batch will be placed
   // on the device_index-th device (except for the experts layers)
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 149bc18ec7..fb445fbec6 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -15,6 +15,8 @@
 
 #include "flexflow/inference.h"
 #include "flexflow/parallel_ops/parallel_op.h"
+#include <new>
+#include <stdexcept>
 
 namespace FlexFlow {
 
@@ -34,6 +36,7 @@ RequestManager::RequestGuid
   Request request;
   request.guid = next_available_guid++;
   request.max_sequence_length = max_sequence_length;
+  request.initial_len = prompt.size();
   request.tokens = prompt;
 
   pending_request_queue.push(request);
@@ -143,27 +146,28 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
   return new_bc;
 }
 
-//-------beam search specific functions
+/* ----- Speculative Inference Specific functions ----- */
 
 // update beam search metadata
 BeamSearchBatchConfig
     RequestManager::prepare_next_batch_beam(BeamSearchBatchConfig const &old_bc,
                                             BeamInferenceResult const &result) {
   const std::lock_guard<std::mutex> lock(request_queue_mutex);
+
   std::cout << "print all results"
             << "\n";
   for (int i = 0; i < 40; i++) {
     std::cout << result.token_ids[i] << ", ";
   }
-  // Step 1: register first batch
-  BeamSearchBatchConfig new_bc;
-  // Step 2: preparing the next batch for existing requests
+  std::cout << "Current Beam Depth: "
+            << old_bc.beamRequestsInfo[0].current_depth << "\n";
 
-  // store results
-  std::cout << "depthhhhhhh: " << old_bc.beamRequestsInfo[0].current_depth
-            << "\n";
+  // Step 1: Store result to the beam tree struct
   store_beam_metadata(old_bc, result);
 
+  // Step 2: preparing the next batch for existing requests
+  BeamSearchBatchConfig new_bc;
+
   for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
     if (old_bc.request_completed[i]) {
       continue;
@@ -174,20 +178,22 @@ BeamSearchBatchConfig
     int processed_tokens = old_bc.requestsInfo[i].token_start_offset +
                            old_bc.requestsInfo[i].num_tokens_in_batch;
 
-    // std::cout << "processed tokens" << processed_tokens << ", "
-    //           << request.tokens.size() << "\n";
     // assert(processed_tokens < request.tokens.size());
+    std::cout << "\nprocessed_tokens: " << processed_tokens << "\n";
     if (processed_tokens >
         old_bc.beamRequestsInfo[i].max_depth + request.tokens.size()
         // || ir.results[t] == 0 TODO: replace this with <EOS>
-        // std::cout<<"aaaaaaa"<<"\n";
     ) {
-      log_req_mgr.print("[Done] guid(%zu) final_length(%i) request_length(%zu)",
+      log_req_mgr.print("[Done] guid(%zu) with spec_tree_depth(%d)",
                         old_bc.requestsInfo[i].request_guid,
-                        processed_tokens,
-                        request.tokens.size());
+                        old_bc.beamRequestsInfo[i].max_depth);
+      // new_bc.request_completed[i] = true;
+      new_bc.request_completed[i] = false;
+      new_bc.requestsInfo[i].token_start_offset = processed_tokens;
+      new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
+      new_bc.requestsInfo[i].max_sequence_length =
+          old_bc.requestsInfo[i].max_sequence_length;
     } else {
-
       std::cout << "num tokens: " << old_bc.num_tokens << ", "
                 << new_bc.num_tokens;
       new_bc.request_completed[i] = false;
@@ -198,6 +204,7 @@ BeamSearchBatchConfig
 
       // update the beam search metadata
       // how many sub request in current request
+      // why is sub_requests has MAX_NUM_REQUESTS * MAX_BEAM_WIDTH entries?
       new_bc.sub_requests[i] = old_bc.beamRequestsInfo[i].beam_size;
       // update the parentid, accumalated_probs, depth, and token_ids
       new_bc.beamRequestsInfo[i].current_depth =
@@ -238,7 +245,146 @@ BeamSearchBatchConfig
       }
     }
   }
+  return new_bc;
+}
+
+BeamSearchBatchConfig
+    RequestManager::prepare_next_batch_init(TreeVerifyBatchConfig const &old_bc,
+                                            InferenceResult const &result) {
+  const std::lock_guard<std::mutex> lock(request_queue_mutex);
+
+  // Step 1: use result to update requests
+  BeamSearchBatchConfig new_bc;
+  new_bc.num_tokens = 0;
+  int result_index = 0;
+
+  std::cout << "11111111" << std::endl;
+
+  for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
+    if (old_bc.request_completed[i]) {
+      continue;
+    }
+    size_t guid = old_bc.requestsInfo[i].request_guid;
+    Request &request = running_request_queue[guid];
+
+    printf("req %d\n", i);
+
+    // Verify this: get verified tokens from result
+    std::vector<std::pair<BatchConfig::TokenId, int>> tree_outputs =
+        std::vector<std::pair<BatchConfig::TokenId, int>>();
+
+    assert(old_bc.num_tokens > 0);
+
+    std::cout << "222222222" << std::endl;
+
+    int start_depth = old_bc.tokensInfo[result_index].abs_depth_in_request;
+    if (committed_tokens.find(guid) == committed_tokens.end()) {
+      committed_tokens[guid] = std::vector<std::pair<int, int>>();
+    } else {
+      committed_tokens.at(guid).clear();
+    }
+    while (result_index < old_bc.num_tokens &&
+           old_bc.tokensInfo[result_index].request_index == i) {
+      int root_abs_depth = request.tokens.size() - 1;
+      if (old_bc.tokensInfo[result_index].abs_depth_in_request >=
+          root_abs_depth) {
+        tree_outputs.push_back(std::make_pair(
+            result.token_ids[result_index],
+            old_bc.tokensInfo[result_index].abs_depth_in_request + 1));
+
+        committed_tokens.at(guid).push_back(
+            std::make_pair(old_bc.tokensInfo[result_index].abs_depth_in_request,
+                           result_index));
+
+        std::cout << "Index with old_bacth: " << result_index << std::endl;
+        printf("  Input: [%d] %d ---> [%d] %d \n",
+               old_bc.tokensInfo[result_index].abs_depth_in_request,
+               old_bc.tokensInfo[result_index].token_id,
+               tree_outputs.back().second,
+               tree_outputs.back().first);
+        // std::cout << "  Input: " << old_bc.tokensInfo[result_index].token_id
+        // << ""
+        //   << old_bc.tokensInfo[result_index].abs_depth_in_request <<
+        //   std::endl;
+        // std::cout << "  Result: " << result.token_ids[result_index] << ",
+        // depth: "
+        //   << old_bc.tokensInfo[result_index].abs_depth_in_request + 1 <<
+        //   std::endl;
+      }
+      result_index++;
+    }
+
+    std::cout << "333333333333" << std::endl;
+
+    std::vector<std::pair<BatchConfig::TokenId, int>> verified_tokens =
+        traverse_verify_tree(guid, dfs_tree_inputs.at(guid), tree_outputs);
+
+    // check if the request is finished
+    if (verified_tokens.size() + request.tokens.size() >=
+        request.max_sequence_length) {
+      // Append all verified tokens to the request
+      for (int j = 0; j < verified_tokens.size(); j++) {
+        request.tokens.push_back(verified_tokens[j].first);
+      }
+
+      log_req_mgr.print("[Done] guid(%zu) with final length(%zu)",
+                        request.guid,
+                        request.tokens.size());
+
+      new_bc.request_completed[i] = true;
+
+      beam_trees[i] = BeamTree{};
+      dfs_tree_inputs.erase(
+          request.guid); // delete the old input tree from cache
+      continue;
+    }
+
+    new_bc.request_completed[i] = false;
+
+    // Normal Reuqest Info
+    new_bc.requestsInfo[i].token_start_offset = verified_tokens.front().second;
+    new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
+    new_bc.requestsInfo[i].max_sequence_length =
+        old_bc.requestsInfo[i].max_sequence_length;
+    new_bc.requestsInfo[i].num_tokens_in_batch = verified_tokens.size();
+
+    // TODO: Beam Request Info, missing from VerifyTreeBatchConfig
+    new_bc.beamRequestsInfo[i].current_depth = 1;
+    new_bc.beamRequestsInfo[i].beam_size =
+        BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+    new_bc.beamRequestsInfo[i].max_depth =
+        BeamSearchBatchConfig::MAX_BEAM_DEPTH;
+    new_bc.beamRequestsInfo[i].request_completed = false;
+    for (int j = 0; j < BeamSearchBatchConfig::MAX_BEAM_WIDTH; j++) {
+      new_bc.beamRequestsInfo[i].parent_id[j] = 0;
+      new_bc.beamRequestsInfo[i].probs[j] = 1;
+    }
+
+    new_bc.sub_requests[i] = 1;
+
+    // Token Info
+    for (int j = 0; j < verified_tokens.size(); j++) {
+      auto token = verified_tokens.at(j);
+
+      // Normal Token Info
+      new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
+      new_bc.tokensInfo[new_bc.num_tokens].token_id = token.first;
+      new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = token.second;
+
+      // Beam Token Info
+      new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = 0;
+      new_bc.num_tokens++;
+
+      // Add verified token to request's token list
+      request.tokens.push_back(token.first);
+
+      if (new_bc.num_tokens == BatchConfig::MAX_NUM_TOKENS) {
+        break;
+      }
+    }
+  }
 
+  // Step 2: Initialize new request
   for (int i = 0; i < BeamSearchBatchConfig::MAX_NUM_REQUESTS; i++) {
     if (new_bc.request_completed[i]) {
       if (!pending_request_queue.empty() &&
@@ -288,6 +434,171 @@ BeamSearchBatchConfig
   return new_bc;
 }
 
+TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
+    BeamSearchBatchConfig const &old_bc) {
+  const std::lock_guard<std::mutex> lock(request_queue_mutex);
+
+  TreeVerifyBatchConfig new_bc;
+  new_bc.num_tokens_to_commit = 0;
+  new_bc.num_tokens = 0;
+
+  for (int i = 0; i < TreeVerifyBatchConfig::MAX_NUM_REQUESTS; i++) {
+    if (old_bc.request_completed[i]) {
+      continue;
+    }
+    size_t guid = old_bc.requestsInfo[i].request_guid;
+    Request &request = running_request_queue[guid];
+
+    // Get the dfs tree
+    std::vector<std::pair<BatchConfig::TokenId, int>> dfs_tree_inputs =
+        traverse_beam_tree(old_bc, i, request.tokens.size() - 1);
+
+    std::cout << "11111" << std::endl;
+    std::cout << "Request Tokens Size: " << request.tokens.size() << std::endl;
+    for (int k = 0; k < request.tokens.size(); k++) {
+      std::cout << k << ": " << request.tokens[k] << std::endl;
+    }
+
+    // Normal Request Info
+    new_bc.requestsInfo[i].token_start_offset = dfs_tree_inputs.front().second;
+    new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
+    new_bc.requestsInfo[i].max_sequence_length =
+        old_bc.requestsInfo[i].max_sequence_length;
+    // TODO: Check this
+    new_bc.requestsInfo[i].num_tokens_in_batch = 0;
+
+    new_bc.request_completed[i] = false;
+
+    // TODO: Add prompt token first in first verify iteration
+    if (request.tokens.size() == request.initial_len) {
+      for (int j = 0; j < request.initial_len; j++) {
+        new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
+        new_bc.tokensInfo[new_bc.num_tokens].token_id = request.tokens[j];
+        new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = j;
+
+        new_bc.num_tokens++;
+        new_bc.requestsInfo[i].num_tokens_in_batch++;
+      }
+      if (new_bc.num_tokens == BatchConfig::MAX_NUM_TOKENS) {
+        assert(false);
+        break;
+      }
+
+      new_bc.requestsInfo[i].token_start_offset = 0;
+    } else {
+      // Only add the last committed token
+      new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
+      new_bc.tokensInfo[new_bc.num_tokens].token_id = request.tokens.back();
+      new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request =
+          request.tokens.size() - 1;
+
+      new_bc.num_tokens++;
+      new_bc.requestsInfo[i].num_tokens_in_batch++;
+
+      if (new_bc.num_tokens == BatchConfig::MAX_NUM_TOKENS) {
+        assert(false);
+        break;
+      }
+
+      new_bc.requestsInfo[i].token_start_offset = request.tokens.size() - 1;
+    }
+
+    std::cout << "dfs_tree_inputs.size(): " << dfs_tree_inputs.size()
+              << std::endl;
+
+    // add prompt to the dfs tree
+    if (committed_tokens.find(guid) != committed_tokens.end()) {
+      // std::cout << "committed_tokens.size(): " <<
+      // committed_tokens.at(guid).size() << std::endl; std::cout <<
+      // "dfs_tree_inputs.at(0).second: " << dfs_tree_inputs.at(0).second <<
+      // std::endl; std::cout << "request.initial_len: " << request.initial_len
+      // << std::endl;
+      if (dfs_tree_inputs.at(0).second ==
+          request.initial_len + committed_tokens.at(guid).size() - 1) {
+        for (int j = 0; j < request.initial_len; j++) {
+          new_bc.commited_tokens[new_bc.num_tokens_to_commit].token_index = j;
+          new_bc.commited_tokens[new_bc.num_tokens_to_commit].request_index = i;
+          new_bc.commited_tokens[new_bc.num_tokens_to_commit].token_depth = j;
+          std::cout << new_bc.num_tokens_to_commit
+                    << "- committed_token.token_depth: " << j
+                    << ", token_index: " << j << std::endl;
+          new_bc.num_tokens_to_commit++;
+        }
+      } else {
+        // only add the root token
+        auto committed_token = committed_tokens.at(guid).at(0);
+        new_bc.commited_tokens[new_bc.num_tokens_to_commit].token_index =
+            committed_token.second;
+        new_bc.commited_tokens[new_bc.num_tokens_to_commit].request_index = i;
+        new_bc.commited_tokens[new_bc.num_tokens_to_commit].token_depth =
+            committed_token.first;
+        std::cout << new_bc.num_tokens_to_commit
+                  << "- committed_token.token_depth: " << committed_token.first
+                  << ", token_index: " << committed_token.second << std::endl;
+        new_bc.num_tokens_to_commit++;
+      }
+
+      std::cout << "new_bc.num_tokens_to_commit: "
+                << new_bc.num_tokens_to_commit << std::endl;
+    }
+
+    // Token Info
+    for (int j = 1; j < dfs_tree_inputs.size(); j++) {
+      auto token = dfs_tree_inputs.at(j);
+
+      std::cout << "[" << j << "] Token: " << token.first
+                << ", Depth:" << token.second << std::endl;
+
+      // Normal Token Info
+      new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
+      new_bc.tokensInfo[new_bc.num_tokens].token_id = token.first;
+      new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = token.second;
+
+      // TODO: Add committed token info
+      std::cout << "committed_tokens.size(): " << new_bc.num_tokens_to_commit
+                << std::endl;
+
+      if (committed_tokens.find(guid) != committed_tokens.end()) {
+        // if (j == 1) {
+        //   auto committed_token = committed_tokens.at(guid).at(0);
+        //   new_bc.commited_tokens[new_bc.num_tokens_to_commit].token_index =
+        //   committed_token.second;
+        //   new_bc.commited_tokens[new_bc.num_tokens_to_commit].request_index =
+        //   i; new_bc.commited_tokens[new_bc.num_tokens_to_commit].token_depth
+        //   = committed_token.first; std:: cout << new_bc.num_tokens_to_commit
+        //   << "- committed_token.token_depth: " << committed_token.first <<
+        //     ", token_index: " << committed_token.second << std::endl;
+        //   new_bc.num_tokens_to_commit++;
+        // }
+        if (j < committed_tokens.at(guid).size()) {
+          auto committed_token = committed_tokens.at(guid).at(j);
+          new_bc.commited_tokens[new_bc.num_tokens_to_commit].token_index =
+              committed_token.second;
+          new_bc.commited_tokens[new_bc.num_tokens_to_commit].request_index = i;
+          new_bc.commited_tokens[new_bc.num_tokens_to_commit].token_depth =
+              committed_token.first;
+          std::cout << new_bc.num_tokens_to_commit
+                    << "- committed_token.token_depth: "
+                    << committed_token.first
+                    << ", token_index: " << committed_token.second << std::endl;
+          new_bc.num_tokens_to_commit++;
+        }
+      }
+      std::cout << "new_bc.num_tokens_to_commit: "
+                << new_bc.num_tokens_to_commit << std::endl;
+
+      new_bc.num_tokens++;
+      new_bc.requestsInfo[i].num_tokens_in_batch++;
+
+      if (new_bc.num_tokens == BatchConfig::MAX_NUM_TOKENS) {
+        break;
+      }
+    }
+  }
+
+  return new_bc;
+}
+
 void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
                                          BeamInferenceResult const &result) {
   // step1 store the outputs
@@ -296,25 +607,30 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
   }
   auto guid =
       old_bc.requestsInfo[old_bc.tokensInfo[0].request_index].request_guid;
-  auto start_idx = old_bc.tokensInfo[0].abs_depth_in_request;
+  auto start_depth = old_bc.tokensInfo[0].abs_depth_in_request;
   int result_index = 0;
-  std::cout << "store num tokens" << old_bc.num_tokens << "\n";
+
+  std::cout << "Store total of " << old_bc.num_tokens
+            << " tokens in the current batch.\n";
+
   for (int i = 0; i <= old_bc.num_tokens; i++) {
     int request_index = old_bc.tokensInfo[i].request_index;
+
+    // End of the request
     if (i == old_bc.num_tokens ||
         old_bc.requestsInfo[request_index].request_guid != guid) {
-      // see how many tokens has been put to model in this req
-      // to get the index of the final token
-      // every token will get (beam_width) results
-      int beam_width =
-          old_bc.beamRequestsInfo[old_bc.tokensInfo[i].request_index].beam_size;
 
+      // Each token yields (beam_width) results
+      int beam_width = old_bc.beamRequestsInfo[request_index].beam_size;
+
+      // Count tokens sent to model in this request to find the final token's
+      // index
       result_index +=
-          (old_bc.tokensInfo[i - 1].abs_depth_in_request - start_idx) *
+          (old_bc.tokensInfo[i - 1].abs_depth_in_request - start_depth) *
           beam_width;
 
       std::cout << "i = " << i << ", result index = " << result_index
-                << ",value: " << result.token_ids[result_index] << "\n";
+                << ", value: " << result.token_ids[result_index] << "\n";
 
       int index = old_bc.tokensInfo[i - 1].request_index;
       int beam_size = old_bc.beamRequestsInfo[index].beam_size;
@@ -326,12 +642,11 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
                   << "\n";
         Request &request =
             running_request_queue[old_bc.requestsInfo[index].request_guid];
-        beam_trees[index].treeLayers[depth - 1].tokens[0] =
-            request.tokens.at(request.tokens.size() - 1);
-        beam_trees[index].treeLayers[depth - 1].probs[0] = 1;
-        beam_trees[index].treeLayers[depth - 1].parent_ids[0] = -1;
-        std::cout << "store the previous last token to the tree root"
-                  << request.tokens.at(request.tokens.size() - 1) << "\n";
+        beam_trees[index].treeLayers[0].tokens[0] = request.tokens.back();
+        beam_trees[index].treeLayers[0].probs[0] = 1;
+        beam_trees[index].treeLayers[0].parent_ids[0] = -1;
+        std::cout << "Store the previous last token to the tree root: "
+                  << request.tokens.back() << "\n";
       }
 
       for (int beam_id = 0; beam_id < beam_width; beam_id++) {
@@ -348,9 +663,10 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
         result_index += 1;
       }
 
+      // update the guid and start_depth for current request
       if (i < old_bc.num_tokens) {
         guid = old_bc.requestsInfo[request_index].request_guid;
-        start_idx = old_bc.tokensInfo[i].abs_depth_in_request;
+        start_depth = old_bc.tokensInfo[i].abs_depth_in_request;
       }
     }
   }
@@ -379,13 +695,15 @@ void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
   //             << std::endl;
   //   // std::fixed << std::setprecision(15)<<
   // }
-  if (new_bc.beamRequestsInfo[request_index].current_depth == 1) {
+
+  if (new_bc.beamRequestsInfo[request_index].current_depth ==
+      1) { // TODO: check if this is correct
     for (int j = 0; j < beam_size; j++) {
       new_bc.beamRequestsInfo[request_index].parent_id[j] = j;
       new_bc.beamRequestsInfo[request_index].probs[j] =
-          tree.treeLayers[depth].probs[j];
+          tree.treeLayers[depth].probs[j]; // ?
       new_bc.beamRequestsInfo[request_index].tokens[j] =
-          tree.treeLayers[depth].tokens[j];
+          tree.treeLayers[depth].tokens[j]; // ?
     }
   } else {
     std::set<int> parents;
@@ -487,12 +805,13 @@ bool PreOrder(BeamTree const &tree,
       flag = flag || res;
     }
   }
-  if (!flag) {
-    // no child for this token, delete it
-    std::cout << "delete a node: " << tree.treeLayers[current_depth].tokens[id]
-              << ", " << current_depth << std::endl;
-    serializedTree.erase(serializedTree.begin() + index);
-  }
+  // if (!flag) {
+  //   // no child for this token, delete it
+  //   std::cout << "delete a node: " <<
+  //   tree.treeLayers[current_depth].tokens[id]
+  //             << ", " << current_depth << std::endl;
+  //   serializedTree.erase(serializedTree.begin() + index);
+  // }
   return flag;
 }
 
@@ -533,32 +852,124 @@ TreeVerifyBatchConfig RequestManager::convert_beam_to_tree_batch_config(
   return tree_bc;
 }
 
-void RequestManager::tranverse_beam_tree(BeamSearchBatchConfig const &old_bc) {
-  for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
-    if (old_bc.request_completed[i]) {
+std::vector<std::pair<BatchConfig::TokenId, int>>
+    RequestManager::traverse_verify_tree(
+        size_t guid,
+        std::vector<std::pair<BatchConfig::TokenId, int>> const
+            &inputSerializedTree,
+        std::vector<std::pair<BatchConfig::TokenId, int>> const
+            &outputSerializedTree) {
+  std::vector<std::pair<BeamSearchBatchConfig::TokenId, int>> verifiedTree;
+  // verifiedTree.push_back(inputSerializedTree.at(0));
+  std::vector<std::pair<int, int>> new_committed_tokens =
+      std::vector<std::pair<int, int>>();
+
+  std::cout << "Input size: " << inputSerializedTree.size() << std::endl;
+  std::cout << "Output size: " << outputSerializedTree.size() << std::endl;
+
+  std::cout << "========Input============" << std::endl;
+  for (auto const &pair : inputSerializedTree) {
+    std::cout << "(" << pair.first << ", " << pair.second << ")" << std::endl;
+  }
+  std::cout << "========Output============" << std::endl;
+  for (auto const &pair : outputSerializedTree) {
+    std::cout << "(" << pair.first << ", " << pair.second << ")" << std::endl;
+  }
+  std::cout << "========Committed============" << std::endl;
+  for (auto const &pair : committed_tokens.at(guid)) {
+    std::cout << "(" << pair.first << ", " << pair.second << ")" << std::endl;
+  }
+
+  assert(inputSerializedTree.size() == outputSerializedTree.size());
+
+  for (int i = 0; i < inputSerializedTree.size(); i++) {
+    auto input = inputSerializedTree.at(i);
+    auto output = outputSerializedTree.at(i);
+
+    if (i == 0) {
+      verifiedTree.push_back(output);
+      new_committed_tokens.push_back(std::make_pair(
+          input.second,
+          committed_tokens.at(guid).at(i).second)); // <input_abs_depth,
+                                                    // input_index_in_batch>
+      std::cout << committed_tokens.at(guid).at(i).first << ", "
+                << committed_tokens.at(guid).at(i).second << std::endl;
+      std::cout << input.first << ", " << input.second << std::endl;
+
+      assert(committed_tokens.at(guid).at(i).first == input.second);
       continue;
     }
-    // if(i != 0){
-    //   continue;
-    // }
 
-    int depth = old_bc.beamRequestsInfo[i].current_depth;
-    int beam_width = old_bc.beamRequestsInfo[i].beam_size;
-    BeamTree const &tree = beam_trees[i];
+    if (input.first == verifiedTree.back().first &&
+        input.second == verifiedTree.back().second) {
+      verifiedTree.push_back(output);
+      new_committed_tokens.push_back(std::make_pair(
+          input.second,
+          committed_tokens.at(guid).at(i).second)); // <input_abs_depth,
+                                                    // input_index_in_batch>
+      assert(committed_tokens.at(guid).at(i).first == input.second);
+    }
+  }
+  committed_tokens[guid] = new_committed_tokens;
+  std::cout << "========Verified============" << std::endl;
+  for (auto const &pair : verifiedTree) {
+    std::cout << "(" << pair.first << ", " << pair.second << ")" << std::endl;
+  }
 
-    // token, index
-    // todo make this one global for different stages
-    std::vector<std::pair<BeamSearchBatchConfig::TokenId, int>> serializedTree;
-    PreOrder(
-        tree, 3, 0, old_bc.beamRequestsInfo[i].beam_size, 0, serializedTree);
+  std::cout << "========New Committed============" << std::endl;
+  for (auto const &pair : committed_tokens.at(guid)) {
+    std::cout << "(" << pair.first << ", " << pair.second << ")" << std::endl;
+  }
 
-    // print it
-    std::cout << "print tree, " << i << "\n";
-    for (int k = 0; k < serializedTree.size(); k++) {
-      std::cout << "token id: " << serializedTree.at(k).first
-                << ", depth: " << serializedTree.at(k).second << "\n";
-    }
+  return verifiedTree;
+}
+
+std::vector<std::pair<BatchConfig::TokenId, int>>
+    RequestManager::traverse_beam_tree(BeamSearchBatchConfig const &old_bc,
+                                       int request_index,
+                                       int token_start_offset) {
+
+  std::cout << "[Traverse Beam Tree] request_index: " << request_index << "\n";
+  std::cout << "[Traverse Beam Tree] max_depth: "
+            << old_bc.beamRequestsInfo[request_index].max_depth << "\n";
+  std::cout << "[Traverse Beam Tree] current_depth: "
+            << old_bc.beamRequestsInfo[request_index].current_depth << "\n";
+  std::cout << "[Traverse Beam Tree] beam_width: "
+            << old_bc.beamRequestsInfo[request_index].beam_size << "\n";
+  BeamTree tree = beam_trees[request_index];
+
+  // token, index
+  // todo make this one global for different stages
+  std::vector<std::pair<BatchConfig::TokenId, int>> serializedTree;
+  PreOrder(tree,
+           old_bc.beamRequestsInfo[request_index].max_depth,
+           0,
+           old_bc.beamRequestsInfo[request_index].beam_size,
+           0,
+           serializedTree);
+
+  // print it
+  std::cout << "Print serialized tree, " << request_index << "\n";
+  std::cout << serializedTree.size() << "\n";
+  for (int k = 0; k < serializedTree.size(); k++) {
+    serializedTree.at(k).second += token_start_offset;
+    std::cout << "token id: " << serializedTree.at(k).first
+              << ", depth: " << serializedTree.at(k).second << "\n";
+  }
+  std::cout << "Done printing serialized tree, "
+            << old_bc.requestsInfo[request_index].request_guid << "\n";
+
+  if (dfs_tree_inputs.find(old_bc.requestsInfo[request_index].request_guid) !=
+      dfs_tree_inputs.end()) {
+    dfs_tree_inputs[old_bc.requestsInfo[request_index].request_guid] =
+        serializedTree;
+  } else {
+    dfs_tree_inputs.insert(std::make_pair(
+        old_bc.requestsInfo[request_index].request_guid, serializedTree));
   }
+
+  return serializedTree;
+  // }
 }
 
 }; // namespace FlexFlow

From 0bf4fa9ac0d9ceb045063a8b696ae0dc195a2802 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Wed, 10 May 2023 19:57:14 -0500
Subject: [PATCH 119/344] Tree verify bug fix (#719)

* Support multiple FFModels in a single top_level_task

* [TreeVerifyMHA] bug fixes
---
 .../ops/tree_inc_multihead_self_attention.h   | 12 +--
 src/ops/tree_inc_multihead_self_attention.cc  |  2 +-
 src/ops/tree_inc_multihead_self_attention.cu  | 91 +++++++++++--------
 3 files changed, 60 insertions(+), 45 deletions(-)

diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention.h b/include/flexflow/ops/tree_inc_multihead_self_attention.h
index c1af4c0086..61e7b69fe9 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention.h
@@ -92,12 +92,11 @@ class TreeIncMultiHeadSelfAttention : public Op {
                              MachineView const &mv,
                              CostMetrics &cost_metrics) const override;
 
-  static void
-      inference_kernel_wrapper(TreeIncMultiHeadSelfAttentionMeta const *m,
-                               TreeVerifyBatchConfig const *bc,
-                               float const *input_ptr,
-                               float const *weight_ptr,
-                               float *output_ptr);
+  static void inference_kernel_wrapper(TreeIncMultiHeadSelfAttentionMeta *m,
+                                       TreeVerifyBatchConfig const *bc,
+                                       float const *input_ptr,
+                                       float const *weight_ptr,
+                                       float *output_ptr);
   Params get_params() const;
 
 public:
@@ -124,6 +123,7 @@ class TreeIncMultiHeadSelfAttentionMeta : public OpMeta {
   size_t weights_params, weightSize, reserveSpaceSize;
   int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
   int num_heads;
+  int num_active_tokens;
   bool *has_load_weights;
   bool *apply_rotary_embedding;
 #ifdef INFERENCE_TESTS
diff --git a/src/ops/tree_inc_multihead_self_attention.cc b/src/ops/tree_inc_multihead_self_attention.cc
index eec59c9247..96e2541872 100644
--- a/src/ops/tree_inc_multihead_self_attention.cc
+++ b/src/ops/tree_inc_multihead_self_attention.cc
@@ -553,7 +553,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   assert(task->regions.size() == regions.size());
 
   TreeVerifyBatchConfig const *bc = (TreeVerifyBatchConfig *)task->args;
-  TreeIncMultiHeadSelfAttentionMeta const *m =
+  TreeIncMultiHeadSelfAttentionMeta *m =
       *((TreeIncMultiHeadSelfAttentionMeta **)task->local_args);
 
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index 1d45ecaf14..39a7ceaca3 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -47,29 +47,33 @@ __global__ void commit_tokens_kernel(
     int qProjSize,
     int kProjSize,
     int vProjSize,
-    int num_tokens,
+    int num_tokens_to_commit,
+    int num_active_tokens_in_last_batch,
     int num_heads,
     int max_seq_len,
     bool k_cache) {
 
-  CUDA_KERNEL_LOOP(i,
-                   num_tokens * (k_cache ? kProjSize : vProjSize) * num_heads) {
+  CUDA_KERNEL_LOOP(
+      i, num_tokens_to_commit * (k_cache ? kProjSize : vProjSize) * num_heads) {
     int proj_size = k_cache ? kProjSize : vProjSize;
     int data_idx = i % proj_size;
-    int head_idx = i / (num_tokens * proj_size);
-    int token_idx = (i - head_idx * (num_tokens * proj_size)) / proj_size;
-    token_idx = committedTokenInfos[token_idx].token_index;
-
-    int qkv_block_size = (qProjSize + kProjSize + vProjSize) * num_tokens;
-    int current_head_block_size =
-        num_tokens * (k_cache ? qProjSize : qProjSize + kProjSize);
+    int head_idx = i / (num_tokens_to_commit * proj_size);
+    int token_pos =
+        (i - head_idx * (num_tokens_to_commit * proj_size)) / proj_size;
+    int token_idx_in_last_batch = committedTokenInfos[token_pos].token_index;
+    assert(token_idx_in_last_batch < num_active_tokens_in_last_batch);
+
+    int qkv_block_size =
+        (qProjSize + kProjSize + vProjSize) * num_active_tokens_in_last_batch;
+    int current_head_block_size = num_active_tokens_in_last_batch *
+                                  (k_cache ? qProjSize : qProjSize + kProjSize);
     float val =
         devQKVProjArray[head_idx * qkv_block_size + current_head_block_size +
-                        token_idx * proj_size + data_idx];
+                        token_idx_in_last_batch * proj_size + data_idx];
     // int const req_id = id_map[token_idx].request_index;
     // int const tok_id = id_map[token_idx].token_position;
-    int const req_id = committedTokenInfos[token_idx].request_index;
-    int const tok_id = committedTokenInfos[token_idx].token_depth;
+    int const req_id = committedTokenInfos[token_pos].request_index;
+    int const tok_id = committedTokenInfos[token_pos].token_depth;
 
     cache_ptr[req_id * (num_heads * max_seq_len * proj_size) +
               head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
@@ -86,31 +90,35 @@ void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
     commit_tokens_kernel<<<GET_BLOCKS(parallelism),
                            min(CUDA_NUM_THREADS, parallelism),
                            0,
-                           stream>>>(m->devQKVProjArray,
-                                     m->keyCache,
-                                     m->committed_token_infos,
-                                     m->qProjSize,
-                                     m->kProjSize,
-                                     m->vProjSize,
-                                     num_tokens_to_commit,
-                                     m->num_heads,
-                                     BatchConfig::MAX_SEQ_LENGTH,
-                                     /* k_cache = */ true);
+                           stream>>>(
+        m->devQKVProjArray,
+        m->keyCache,
+        m->committed_token_infos,
+        m->qProjSize,
+        m->kProjSize,
+        m->vProjSize,
+        num_tokens_to_commit,
+        m->num_active_tokens, // number of active tokens in previous batch
+        m->num_heads,
+        BatchConfig::MAX_SEQ_LENGTH,
+        /* k_cache = */ true);
 
     parallelism = m->vProjSize * num_tokens_to_commit * m->num_heads;
     commit_tokens_kernel<<<GET_BLOCKS(parallelism),
                            min(CUDA_NUM_THREADS, parallelism),
                            0,
-                           stream>>>(m->devQKVProjArray,
-                                     m->valueCache,
-                                     m->committed_token_infos,
-                                     m->qProjSize,
-                                     m->kProjSize,
-                                     m->vProjSize,
-                                     num_tokens_to_commit,
-                                     m->num_heads,
-                                     BatchConfig::MAX_SEQ_LENGTH,
-                                     /* k_cache = */ false);
+                           stream>>>(
+        m->devQKVProjArray,
+        m->valueCache,
+        m->committed_token_infos,
+        m->qProjSize,
+        m->kProjSize,
+        m->vProjSize,
+        num_tokens_to_commit,
+        m->num_active_tokens, // number of active tokens in previous batch
+        m->num_heads,
+        BatchConfig::MAX_SEQ_LENGTH,
+        /* k_cache = */ false);
   }
 }
 
@@ -438,7 +446,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
             m->vProjSize,
             num_new_tokens,            // num_tokens_in_branch
             processed_tokens_in_batch, // num_processed_tokens_in_batch
-            bc->requestsInfo[i].num_tokens_in_batch, // total_tokens_in_batch
+            m->num_active_tokens,      // total_tokens_in_batch
             m->num_heads,
             BatchConfig::MAX_SEQ_LENGTH,
             /* k_cache = */ true);
@@ -456,7 +464,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
             m->vProjSize,
             num_new_tokens,            // num_tokens_in_branch
             processed_tokens_in_batch, // num_processed_tokens_in_batch
-            bc->requestsInfo[i].num_tokens_in_batch, // total_tokens_in_batch
+            m->num_active_tokens,      // total_tokens_in_batch
             m->num_heads,
             BatchConfig::MAX_SEQ_LENGTH,
             /* k_cache = */ false);
@@ -645,7 +653,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
 
 /*static*/
 void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
-    TreeIncMultiHeadSelfAttentionMeta const *m,
+    TreeIncMultiHeadSelfAttentionMeta *m,
     TreeVerifyBatchConfig const *bc,
     float const *input_ptr,
     float const *weight_ptr,
@@ -661,15 +669,22 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
   }
 
   // copy committed tokens info to GPU for the commit_tokens kernel
+  // Note that m->num_active_tokens stores the number of active
+  // tokens in the previous batch, which is needed for committing
+  // keys/values to the key-value cache
   cudaMemcpyAsync(m->committed_token_infos,
                   &(bc->commited_tokens),
                   bc->MAX_NUM_TOKENS *
                       sizeof(TreeVerifyBatchConfig::CommittedTokensInfo),
                   cudaMemcpyHostToDevice,
                   stream);
+  commit_tokens(m, bc, stream);
 
-  // reload the weight_o
+  // After commit we update m->num_active_tokens to be the number of active
+  // tokens for the current batch
+  m->num_active_tokens = bc->num_active_tokens();
 
+  // reload the weight_o
   if (!(*m->has_load_weights)) {
     int parallelism = m->vProjSize * m->oProjSize * m->num_heads;
     tree_build_w_out_tensor<<<GET_BLOCKS(parallelism),
@@ -724,7 +739,7 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
     Memory gpu_mem,
     int num_samples,
     int _num_heads)
-    : OpMeta(handler, attn) {
+    : OpMeta(handler, attn), num_active_tokens(0) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDNN(cudnnSetStream(handler.dnn, stream));

From b5b1375ce6b616ce5edefd829bc6093123d12fad Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Wed, 10 May 2023 23:07:32 -0400
Subject: [PATCH 120/344] [Inference] opt model (#717)

* init

* fix

* code

* clean up

* fix

* fix, add md

* format

* hip_roc

* add comment
---
 CMakeLists.txt                                |   4 +
 examples/cpp/inference/LLAMA/llama.cc         |   2 +-
 examples/cpp/inference/file_loader.cc         | 184 ++++++++++++---
 examples/cpp/inference/file_loader.h          |   7 +
 examples/cpp/inference/models/llama.cc        |   6 +-
 examples/cpp/inference/opt/CMakeLists.txt     |  21 ++
 examples/cpp/inference/opt/Makefile           |  38 +++
 examples/cpp/inference/opt/README.md          |  45 ++++
 examples/cpp/inference/opt/opt.cc             | 222 ++++++++++++++++++
 examples/cpp/inference/opt/opt.h              |  66 ++++++
 examples/cpp/inference/opt/opt_baseline.py    |  23 ++
 include/flexflow/inference.h                  |   6 +
 include/flexflow/model.h                      |   6 +-
 .../ops/inc_multihead_self_attention.h        |  18 +-
 .../ops/inc_multihead_self_attention_params.h |   5 +-
 src/ops/inc_multihead_self_attention.cc       | 143 ++++++++++-
 src/ops/inc_multihead_self_attention.cpp      |   3 +-
 src/ops/inc_multihead_self_attention.cu       |  94 +++++++-
 src/runtime/graph.cc                          |  14 +-
 src/runtime/inference_manager.cc              |  41 +++-
 src/runtime/model.cc                          |   9 +
 src/runtime/request_manager.cc                |   6 +
 src/runtime/request_manager.cpp               |  27 +++
 src/runtime/request_manager.cu                |  29 +++
 24 files changed, 953 insertions(+), 66 deletions(-)
 create mode 100644 examples/cpp/inference/opt/CMakeLists.txt
 create mode 100644 examples/cpp/inference/opt/Makefile
 create mode 100644 examples/cpp/inference/opt/README.md
 create mode 100644 examples/cpp/inference/opt/opt.cc
 create mode 100644 examples/cpp/inference/opt/opt.h
 create mode 100644 examples/cpp/inference/opt/opt_baseline.py

diff --git a/CMakeLists.txt b/CMakeLists.txt
index 59f3453f1e..ff6e90f200 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -548,6 +548,10 @@ if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/inference/SPEC_LLAMA)
 endif()
 
+if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
+  add_subdirectory(examples/cpp/inference/opt)
+endif()
+
 if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/inference/spec_verify_pipeline)
 endif()
diff --git a/examples/cpp/inference/LLAMA/llama.cc b/examples/cpp/inference/LLAMA/llama.cc
index de374459cb..8ca5cfe98e 100644
--- a/examples/cpp/inference/LLAMA/llama.cc
+++ b/examples/cpp/inference/LLAMA/llama.cc
@@ -117,7 +117,7 @@ void FlexFlow::top_level_task(Task const *task,
                                         llamaConfig.dim / llamaConfig.n_heads,
                                         llamaConfig.dim / llamaConfig.n_heads,
                                         0.0f,
-                                        true,
+                                        false,
                                         false,
                                         false,
                                         NULL,
diff --git a/examples/cpp/inference/file_loader.cc b/examples/cpp/inference/file_loader.cc
index deed6ba985..15b88455e5 100644
--- a/examples/cpp/inference/file_loader.cc
+++ b/examples/cpp/inference/file_loader.cc
@@ -19,6 +19,8 @@
 #include <vector>
 using namespace std;
 
+using namespace Legion;
+
 FileDataLoader::FileDataLoader(std::string _input_path,
                                std::string _weight_file_path,
                                int _num_heads,
@@ -66,13 +68,68 @@ BatchConfig::TokenId *FileDataLoader::generate_requests(int num, int length) {
   return prompts;
 };
 
+void load_attention_bias(float *ptr,
+                         int num_heads,
+                         size_t hidden_dim,
+                         size_t qkv_inner_dim,
+                         std::string layer_name,
+                         std::string weight_path) {
+  std::string q_file = weight_path +
+                       layer_name.substr(0, layer_name.find("attention")) +
+                       "attention_wq_bias";
+  std::string k_file = weight_path +
+                       layer_name.substr(0, layer_name.find("attention")) +
+                       "attention_wk_bias";
+  std::string v_file = weight_path +
+                       layer_name.substr(0, layer_name.find("attention")) +
+                       "attention_wv_bias";
+  std::string o_file = weight_path +
+                       layer_name.substr(0, layer_name.find("attention")) +
+                       "attention_wo_bias";
+  std::vector<std::string> bias_files = {q_file, k_file, v_file, o_file};
+
+  int file_index = 0;
+
+  for (auto file : bias_files) {
+    size_t partial_size = hidden_dim;
+    std::cout << "partial_size in bias" << partial_size << ", file: " << file
+              << "\n";
+    std::ifstream in(file, std::ios::in | std::ios::binary);
+    std::vector<float> host_array(partial_size);
+    size_t loaded_data_size = sizeof(float) * partial_size;
+    in.seekg(0, in.end);
+    in.seekg(0, in.beg);
+    in.read((char *)host_array.data(), loaded_data_size);
+    size_t in_get_size = in.gcount();
+
+    if (in_get_size != loaded_data_size) {
+      std::cout << "load bias data error";
+      return;
+    }
+    assert(partial_size == host_array.size());
+
+    size_t data_index = 0;
+
+    for (int i = 0; i < hidden_dim; i++) {
+      ptr[file_index * hidden_dim + i] = host_array.at(data_index);
+      data_index++;
+    }
+
+    file_index++;
+
+    in.close();
+  }
+}
+
 void load_attention_weights(float *ptr,
-                            size_t size,
-                            int hidden_dim,
                             int num_heads,
+                            size_t hidden_dim,
+                            size_t qkv_inner_dim,
                             std::string layer_name,
-                            std::string weight_path) {
-
+                            std::string weight_path,
+                            size_t volume) {
+  // layers_0_attention_wq_weight
+  // layers_0_self_attn_q_proj_weight
   std::string q_file = weight_path +
                        layer_name.substr(0, layer_name.find("attention")) +
                        "attention_wq_weight";
@@ -89,10 +146,20 @@ void load_attention_weights(float *ptr,
 
   int file_index = 0;
 
+  size_t single_proj_size =
+      hidden_dim *
+      qkv_inner_dim; // size of each of Q,K,V,O weights for a single head
+  size_t one_weight_file_size =
+      num_heads * single_proj_size; // size of each of Q/K/V/O for all heads
+
   // q, k, v, o -> 0, 1, 2, 3
   for (auto file : weight_files) {
     std::cout << "file name and index: " << file << "->" << file_index << "\n";
-    size_t partial_size = size / 4;
+    size_t partial_size = one_weight_file_size;
+
+    std::cout << "partial_size weight " << partial_size << ", " << volume
+              << ", " << hidden_dim << ", " << qkv_inner_dim << ", "
+              << num_heads << "\n";
     std::ifstream in(file, std::ios::in | std::ios::binary);
     std::vector<float> host_array(partial_size);
     size_t loaded_data_size = sizeof(float) * partial_size;
@@ -137,7 +204,8 @@ void load_from_file(float *ptr, size_t size, std::string filename) {
   // std::cout << loaded_data_size << std::endl;
   // std::cout << in_get_size << std::endl;
   if (in_get_size != loaded_data_size) {
-    std::cout << "load data error" << std::endl;
+    std::cout << "load weight data error " << in_get_size << ", "
+              << loaded_data_size << ", " << sizeof(float) << std::endl;
     return;
   }
 
@@ -152,41 +220,93 @@ void load_from_file(float *ptr, size_t size, std::string filename) {
   in.close();
 }
 
+void FileDataLoader::load_positions(FFModel *ff,
+                                    Tensor pt,
+                                    ParallelTensor position_pt,
+                                    int max_seq_length,
+                                    int offset) {
+  std::cout << "load positions" << std::endl;
+  size_t volume = 1;
+  std::vector<int> dims_vec;
+  for (int i = 0; i < pt->num_dims; i++) {
+    // std::cout<< pt->dims[i] << "\n";
+    volume *= pt->dims[i];
+    dims_vec.push_back(pt->dims[i]);
+    std::cout << dims_vec.at(dims_vec.size() - 1) << ", ";
+  }
+
+  // load data;
+  int *data = (int *)malloc(sizeof(int) * volume);
+  for (int i = 0; i < volume; i++) {
+    data[i] = i % max_seq_length + offset;
+    std::cout << data[i] << ", ";
+  }
+  // set tensor
+
+  // ParallelTensor position_pt;
+
+  // ff->get_parallel_tensor_from_tensor(pt, position_pt);
+  position_pt->set_tensor<int>(ff, dims_vec, data);
+}
+
 void FileDataLoader::load_weights(
     FFModel *ff, std::unordered_map<std::string, Layer *> weights_layers) {
 
   for (auto &v : weights_layers) {
-    Tensor weight = v.second->weights[0];
-    std::cout << "weights layer: " << v.first << "\n";
 
-    if (weight == NULL) {
-      std::cout << "op no weights : " << v.first << "\n";
-      continue;
-    }
+    int weights_num = v.second->numWeights;
+    std::cout << "weight layer: " << v.first << ", num" << weights_num << "\n";
 
-    size_t volume = 1;
-    std::vector<int> dims_vec;
-    for (int i = 0; i < weight->num_dims; i++) {
-      dims_vec.push_back(weight->dims[i]);
-      volume *= weight->dims[i];
-    }
+    for (int i = 0; i < weights_num; i++) {
+      Tensor weight = v.second->weights[i];
+      if (weight == NULL) {
+        std::cout << "op no weights : " << v.first << "\n";
+        continue;
+      }
 
-    assert(weight->data_type == DT_FLOAT);
-    float *data = (float *)malloc(sizeof(float) * volume);
+      size_t volume = 1;
+      std::vector<int> dims_vec;
+      for (int i = 0; i < weight->num_dims; i++) {
+        dims_vec.push_back(weight->dims[i]);
+        volume *= weight->dims[i];
+      }
+      std::cout << "load weights volume: " << volume << std::endl;
 
-    if (v.first.find("attention_w") != std::string::npos) {
-      assert(dims_vec[0] = hidden_dim * qkv_inner_dim * 4);
-      assert(dims_vec[1] = num_heads);
-      assert(volume == dims_vec[0] * dims_vec[1]);
-      load_attention_weights(
-          data, volume, hidden_dim, num_heads, v.first, weight_file_path);
+      assert(weight->data_type == DT_FLOAT);
+      float *data = (float *)malloc(sizeof(float) * volume);
 
-    } else {
-      load_from_file(data, volume, weight_file_path + v.first);
-    }
+      if (v.first.find("attention_w") != std::string::npos) {
+        std::cout << "load weights bias: " << volume << "\n";
+        if (i == 0) {
+          load_attention_weights(data,
+                                 num_heads,
+                                 hidden_dim,
+                                 qkv_inner_dim,
+                                 v.first,
+                                 weight_file_path,
+                                 volume);
+        } else {
+          load_attention_bias(data,
+                              num_heads,
+                              hidden_dim,
+                              qkv_inner_dim,
+                              v.first,
+                              weight_file_path);
+        }
 
-    ParallelTensor weight_pt;
-    ff->get_parallel_tensor_from_tensor(weight, weight_pt);
-    weight_pt->set_tensor<float>(ff, dims_vec, data);
+      } else {
+        std::string file_path = v.first;
+        if (i > 0) {
+          int index = v.first.find("_weight");
+          assert(index != std::string::npos);
+          file_path = v.first.substr(0, index) + "_bias";
+        }
+        load_from_file(data, volume, weight_file_path + file_path);
+      }
+
+      ParallelTensor weight_pt;
+      ff->get_parallel_tensor_from_tensor(weight, weight_pt);
+      weight_pt->set_tensor<float>(ff, dims_vec, data);
+    }
   }
 }
diff --git a/examples/cpp/inference/file_loader.h b/examples/cpp/inference/file_loader.h
index 7d03b3ac82..06714293da 100644
--- a/examples/cpp/inference/file_loader.h
+++ b/examples/cpp/inference/file_loader.h
@@ -16,6 +16,7 @@
 #pragma once
 
 #include "flexflow/batch_config.h"
+#include "flexflow/inference.h"
 #include "flexflow/model.h"
 
 using namespace std;
@@ -34,6 +35,12 @@ class FileDataLoader {
   void load_weights(FFModel *ff,
                     std::unordered_map<std::string, Layer *> weights_layers);
 
+  void load_positions(FFModel *ff,
+                      Tensor pt,
+                      ParallelTensor position_pt,
+                      int max_seq_length,
+                      int offset);
+
 private:
   int num_heads;
   size_t hidden_dim, qkv_inner_dim;
diff --git a/examples/cpp/inference/models/llama.cc b/examples/cpp/inference/models/llama.cc
index efd5c18b6e..d2374c8c8f 100644
--- a/examples/cpp/inference/models/llama.cc
+++ b/examples/cpp/inference/models/llama.cc
@@ -98,7 +98,7 @@ void LLAMA::create_llama_model(FFModel &ff,
             llama_config.dim / llama_config.n_heads,
             llama_config.dim / llama_config.n_heads,
             0.0f,
-            true,
+            false,
             false,
             false,
             NULL,
@@ -113,7 +113,7 @@ void LLAMA::create_llama_model(FFModel &ff,
             llama_config.dim / llama_config.n_heads,
             llama_config.dim / llama_config.n_heads,
             0.0f,    /*dropout*/
-            true,    /*bias*/
+            false,   /*bias*/
             false,   /*add_bias_kv*/
             false,   /*add_zero_attn*/
             nullptr, /*kernel_initializer*/
@@ -129,7 +129,7 @@ void LLAMA::create_llama_model(FFModel &ff,
             llama_config.dim / llama_config.n_heads,
             llama_config.dim / llama_config.n_heads,
             0.0f,    /*dropout*/
-            true,    /*bias*/
+            false,   /*bias*/
             false,   /*add_bias_kv*/
             false,   /*add_zero_attn*/
             nullptr, /*kernel_initializer*/
diff --git a/examples/cpp/inference/opt/CMakeLists.txt b/examples/cpp/inference/opt/CMakeLists.txt
new file mode 100644
index 0000000000..2a392dce35
--- /dev/null
+++ b/examples/cpp/inference/opt/CMakeLists.txt
@@ -0,0 +1,21 @@
+cmake_minimum_required(VERSION 3.10)
+
+project(FlexFlowExample_OPT)
+set(project_target OPT)
+
+
+set(CPU_SRC
+  ${FLEXFLOW_CPP_DRV_SRC}
+  opt.cc
+  opt.h
+  ../file_loader.cc)
+
+
+
+cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
+target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
+target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/examples/cpp/inference)
+target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
+
+set(BIN_DEST "bin")
+install(TARGETS ${project_target} DESTINATION ${BIN_DEST})
diff --git a/examples/cpp/inference/opt/Makefile b/examples/cpp/inference/opt/Makefile
new file mode 100644
index 0000000000..afe13d305a
--- /dev/null
+++ b/examples/cpp/inference/opt/Makefile
@@ -0,0 +1,38 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+#
+
+# Flags for directing the runtime makefile what to include
+DEBUG           ?= 0		# Include debugging symbols
+MAX_DIM         ?= 4		# Maximum number of dimensions
+OUTPUT_LEVEL    ?= LEVEL_DEBUG	# Compile time logging level
+USE_CUDA        ?= 1		# Include CUDA support (requires CUDA)
+USE_GASNET      ?= 0		# Include GASNet support (requires GASNet)
+USE_HDF         ?= 1		# Include HDF5 support (requires HDF5)
+ALT_MAPPERS     ?= 0		# Include alternative mappers (not recommended)
+
+# Put the binary file name here
+OUTFILE		?= opt
+# List all the application source files here
+GEN_SRC		= opt.cc 
+ifndef CUDA_HOME
+CUDA_HOME = $(patsubst %/bin/nvcc,%,$(shell which nvcc | head -1))
+endif
+
+
+ifndef FF_HOME
+$(error FF_HOME variable is not defined, aborting build)
+endif
+
+include $(FF_HOME)/FlexFlow.mk
diff --git a/examples/cpp/inference/opt/README.md b/examples/cpp/inference/opt/README.md
new file mode 100644
index 0000000000..8a7bd10ee5
--- /dev/null
+++ b/examples/cpp/inference/opt/README.md
@@ -0,0 +1,45 @@
+# an example of running opt model
+## how to run?
+1. build the flexflow with FF_BUILD_ALL_INFERENCE_EXAMPLES or FF_BUILD_ALL_EXAMPLES
+2. download the weight and token file from aws s3. 
+```bash
+aws s3 cp s3://catalyst-llama/opt_125m_native.tar.gz FF_HOME/examples/cpp/inference/opt/weights
+
+tar -zxvf opt_125m_native.tar.gz
+```
+3. run *OPT* with `--weights` `--dataset` `--only-data-parallel`
+4. run examples/cpp/inference/opt/opt_baseline.py
+5. if get same result, it should be fine
+
+## code structure: 
+1. use two inputs, token & position, the position input should be after the token input
+2. for the attention model, set scaling_query = true, scaling_factor = 0.125 and qk_prod_scaling = false,
+all other models should set scaling_query = false and qk_prod_scaling = true
+## opt default configuration from huggingface opt-125m
+```python
+OPTConfig {
+  "_remove_final_layer_norm": false,
+  "activation_function": "relu",
+  "attention_dropout": 0.0,
+  "bos_token_id": 2,
+  "do_layer_norm_before": true,
+  "dropout": 0.1,
+  "enable_bias": true,
+  "eos_token_id": 2,
+  "ffn_dim": 3072,
+  "hidden_size": 768,
+  "init_std": 0.02,
+  "layer_norm_elementwise_affine": true,
+  "layerdrop": 0.0,
+  "max_position_embeddings": 2048,
+  "model_type": "opt",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "transformers_version": "4.27.2",
+  "use_cache": true,
+  "vocab_size": 50272,
+  "word_embed_proj_dim": 768
+}
+```
+
diff --git a/examples/cpp/inference/opt/opt.cc b/examples/cpp/inference/opt/opt.cc
new file mode 100644
index 0000000000..c2932df926
--- /dev/null
+++ b/examples/cpp/inference/opt/opt.cc
@@ -0,0 +1,222 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "opt.h"
+#include "flexflow/inference.h"
+#include <cmath>
+
+using namespace Legion;
+
+LegionRuntime::Logger::Category log_app("opt");
+
+void FlexFlow::top_level_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  FFConfig ffconfig;
+  OptConfig optConfig;
+  FFModel ff(ffconfig);
+  //------------------------------compute machine views ------------------
+  int num_devices = ffconfig.workersPerNode * ffconfig.numNodes;
+  std::vector<MachineView> machine_views;
+  for (int i = 0; i < num_devices; i++) {
+    MachineView view;
+    view.device_type = MachineView::GPU;
+    view.ndims = 1;
+    view.dim[0] = 1;
+    view.stride[0] = 0;
+    view.start_device_id = i;
+    machine_views.push_back(view);
+  }
+
+  std::unordered_map<Tensor, std::vector<MachineView>> mapping;
+  std::unordered_map<std::string, Layer *> weights_layers;
+
+  //------------------------------ build the model --------------------------
+  Tensor input;
+  Tensor position_input;
+  {
+    int const token_dims[] = {1, 9};
+    input = ff.create_tensor<2>(token_dims, DT_INT32);
+    position_input = ff.create_tensor<2>(token_dims, DT_INT32);
+  }
+
+  mapping[input].push_back(machine_views[0]);
+  mapping[position_input].push_back(machine_views[0]);
+
+  Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
+  std::vector<int> axes = {0};
+
+  Tensor token = ff.embedding(input,
+                              optConfig.vocab_size,
+                              optConfig.word_embed_proj_dim,
+                              AGGR_MODE_NONE,
+                              DT_FLOAT,
+                              NULL,
+                              embed_init);
+  Layer *embedding = ff.layers.back();
+
+  weights_layers.emplace("embed_tokens_weight", embedding);
+
+  Tensor positional_embedding = ff.embedding(position_input,
+                                             optConfig.max_position_embeddings,
+                                             optConfig.hidden_size,
+                                             AGGR_MODE_NONE,
+                                             DT_FLOAT,
+                                             NULL,
+                                             embed_init);
+  Layer *pos_embedding = ff.layers.back();
+  weights_layers.emplace("embed_positions_weight", pos_embedding);
+
+  Tensor residual = ff.add(token, positional_embedding);
+
+  int num_transformer_layers_per_gpu = (32 + num_devices - 1) / num_devices;
+
+  for (int i = 0; i < optConfig.num_hidden_layers; i++) {
+    // 125m, 1.7B, ..., 175B applies layer norm BEFORE attention,
+    // 350m applies layer norm AFTER attention
+    // https://github.com/huggingface/transformers/blob/main/src/transformers/models/opt/modeling_opt.py#LL324C1-L325C1
+    // this version is before normalization
+
+    Tensor hidden_states = ff.layer_norm(
+        residual, axes, optConfig.layer_norm_elementwise_affine, 1e-05);
+    Layer *self_attn_layer_norm = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) +
+                               "_self_attn_layer_norm_weight",
+                           self_attn_layer_norm);
+    if (i % num_transformer_layers_per_gpu == 0) {
+      mapping[hidden_states].push_back(
+          machine_views[i / num_transformer_layers_per_gpu]);
+    }
+
+    Tensor mha = ff.inc_multihead_self_attention(
+        hidden_states,
+        optConfig.hidden_size,
+        optConfig.num_attention_heads,
+        optConfig.hidden_size / optConfig.num_attention_heads,
+        optConfig.hidden_size / optConfig.num_attention_heads,
+        0.0f,
+        true,
+        false,
+        false,
+        NULL,
+        false,
+        /*scaling query*/ true,
+        /*sacling factor*/
+        pow((optConfig.hidden_size / optConfig.num_attention_heads), -0.5),
+        /*qk_prod_scaling*/ false);
+
+    Layer *attention_layer = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) + "_attention_weight",
+                           attention_layer);
+    Tensor added = ff.add(mha, residual);
+
+    Tensor final_norm = ff.layer_norm(
+        added, axes, optConfig.layer_norm_elementwise_affine, 1e-05);
+    Layer *final_layer_norm = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) +
+                               "_final_layer_norm_weight",
+                           final_layer_norm);
+
+    //--------linear fc1 fc2 ----------
+    Tensor fc1 = ff.dense(final_norm, optConfig.ffn_dim, AC_MODE_NONE, true);
+    Layer *fc1_linear = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) + "_fc1_weight",
+                           fc1_linear);
+    Tensor activation = ff.relu(fc1, false);
+
+    Tensor fc2 =
+        ff.dense(activation, optConfig.hidden_size, AC_MODE_NONE, true);
+    Layer *fc2_linear = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) + "_fc2_weight",
+                           fc2_linear);
+    residual = ff.add(added, fc2);
+  }
+
+  // final
+  Tensor all_final_norm = ff.layer_norm(
+      residual, axes, optConfig.layer_norm_elementwise_affine, 1e-05);
+  Layer *all_final_norm_layer = ff.layers.back();
+  weights_layers.emplace("final_layer_norm_weight", all_final_norm_layer);
+
+  Tensor lm_head =
+      ff.dense(all_final_norm, optConfig.vocab_size, AC_MODE_NONE, false);
+  Layer *lm_head_layer = ff.layers.back();
+  weights_layers.emplace("embed_tokens_weight_lm_head", lm_head_layer);
+
+  Tensor output = ff.arg_top_k(lm_head, /*k=*/1, false);
+  //------------------- compile the model --------------------------------
+  std::cout << "------start compile ----------" << std::endl;
+  InferenceManager im(ffconfig, 1, 1);
+  im.compile_model_and_allocate_buffer(&ff, mapping);
+  RequestManager rm;
+
+  ParallelTensor input_pt;
+  ff.get_parallel_tensor_from_tensor(input, input_pt);
+  assert(im.tensor_buffer.find(input_pt) != im.tensor_buffer.end());
+
+  ParallelTensor pos_pt;
+  ff.get_parallel_tensor_from_tensor(position_input, pos_pt);
+  assert(im.tensor_buffer.find(pos_pt) != im.tensor_buffer.end());
+
+  //-------------------load weights and inputs------------------
+  FileDataLoader fileloader(optConfig.input_path,
+                            optConfig.weight_file_path,
+                            optConfig.num_attention_heads,
+                            optConfig.hidden_size,
+                            optConfig.hidden_size /
+                                optConfig.num_attention_heads);
+  //"Today is a beautiful day and I want"
+  std::vector<int> prompt = {2, 5625, 16, 10, 2721, 183, 8, 38, 236};
+  rm.register_new_request(prompt, 20);
+  fileloader.load_weights(&ff, weights_layers);
+
+  im.init_operators_inference(&ff);
+  int depth = 0;
+  std::map<int, Future> future_handlers;
+  std::map<int, BatchConfig> batch_configs;
+  int sentence_length = 9;
+  while (true) {
+    int bid = 0;
+    if (future_handlers.find(bid) == future_handlers.end()) {
+      BatchConfig bc;
+      InferenceResult ir;
+      bc = rm.prepare_next_batch(bc, ir);
+      FutureMap fm = im.inference(&ff, bid, bc);
+      assert(fm.get_future_map_domain().get_volume() == 1);
+      future_handlers[bid] = fm.get_future(0);
+      batch_configs[bid] = bc;
+    } else {
+      Future future = future_handlers[bid];
+      if (!future.is_ready(true /*subscribe*/)) {
+        continue;
+      } else {
+        std::cout << "future is ready...." << std::endl;
+      }
+      // process end
+      InferenceResult ir = future.get_result<InferenceResult>();
+      BatchConfig bc = batch_configs[bid];
+      bc = rm.prepare_next_batch(bc, ir);
+      sentence_length += bc.num_tokens;
+      FutureMap fm = im.inference(&ff, bid, bc);
+      assert(fm.get_future_map_domain().get_volume() == 1);
+      future_handlers[bid] = fm.get_future(0);
+      batch_configs[bid] = bc;
+    }
+  }
+  std::cout << "----------inference finished--------------" << std::endl;
+}
+
+void FlexFlow::register_custom_tasks() {}
diff --git a/examples/cpp/inference/opt/opt.h b/examples/cpp/inference/opt/opt.h
new file mode 100644
index 0000000000..d581b73df9
--- /dev/null
+++ b/examples/cpp/inference/opt/opt.h
@@ -0,0 +1,66 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#pragma once
+
+#include "file_loader.h"
+#include "inference_config.h"
+// # OPTConfig {
+// #   "_remove_final_layer_norm": false,
+// #   "activation_function": "relu",
+// #   "attention_dropout": 0.0,
+// #   "bos_token_id": 2,
+// #   "do_layer_norm_before": true,
+// #   "dropout": 0.1,
+// #   "enable_bias": true,
+// #   "eos_token_id": 2,
+// #   "ffn_dim": 3072,
+// #   "hidden_size": 768,
+// #   "init_std": 0.02,
+// #   "layer_norm_elementwise_affine": true,
+// #   "layerdrop": 0.0,
+// #   "max_position_embeddings": 2048,
+// #   "model_type": "opt",
+// #   "num_attention_heads": 12,
+// #   "num_hidden_layers": 12,
+// #   "pad_token_id": 1,
+// #   "transformers_version": "4.27.2",
+// #   "use_cache": true,
+// #   "vocab_size": 50272,
+// #   "word_embed_proj_dim": 768
+// # }
+struct OptConfig : InferenceConfig {
+  OptConfig(void) : InferenceConfig() {
+    vocab_size = 50272, word_embed_proj_dim = 768, hidden_size = 768;
+    max_position_embeddings = 2048;
+    layer_norm_elementwise_affine = true;
+    num_attention_heads = 12;
+    dropout = 0.1;
+    seed = 3;
+    ffn_dim = 3072;
+    num_hidden_layers = 12;
+    weight_file_path =
+        "/home/ubuntu/FlexFlow/examples/cpp/inference/opt/weights/";
+  }
+  int word_embed_proj_dim;
+  std::string input_path;
+  std::string weight_file_path;
+  int max_position_embeddings;
+  bool layer_norm_elementwise_affine;
+  float dropout;
+  unsigned long long seed;
+  int ffn_dim;
+  int num_hidden_layers;
+};
diff --git a/examples/cpp/inference/opt/opt_baseline.py b/examples/cpp/inference/opt/opt_baseline.py
new file mode 100644
index 0000000000..5574af259a
--- /dev/null
+++ b/examples/cpp/inference/opt/opt_baseline.py
@@ -0,0 +1,23 @@
+from transformers import OPTConfig, OPTForCausalLM, GPT2Tokenizer
+
+model_id = "facebook/opt-125m"
+tokenizer = GPT2Tokenizer.from_pretrained(model_id)
+model = OPTForCausalLM.from_pretrained(model_id)
+
+prompts = [
+            "Today is a beautiful day and I want",
+        ]
+
+for prompt in prompts:
+    input_ids = tokenizer(prompt, return_tensors="pt", padding=True).input_ids
+    print(input_ids)
+    generated_ids = model.generate(input_ids, max_length=20)
+    generated_string = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)
+    print(generated_ids)
+    print(generated_string)
+
+#get same results with this and opt.cc
+
+# tensor([[   2, 5625,   16,   10, 2721,  183,    8,   38,  236,    7,  458,   19,
+        #    47,    5, 2770,  527,    9,  127,   78,  655]])
+# 2, 5625, 16, 10, 2721, 183, 8, 38, 236, 7, 458, 19, 47, 5, 2770, 527, 9, 127, 78, 655
\ No newline at end of file
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index bbeaf67821..ed5c6c3aa0 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -37,6 +37,7 @@ class InferenceManager {
   Legion::FutureMap inference(FFModel *model, int index, BatchConfig const &bc);
   void load_input_tokens_from_batch_config(BatchConfig const &bc,
                                            ParallelTensor const input);
+  void load_positions(BatchConfig const &bc, ParallelTensor position_input);
 
 public:
   FFConfig ff_config;
@@ -118,6 +119,11 @@ class RequestManager {
                        std::vector<Legion::PhysicalRegion> const &regions,
                        Legion::Context ctx,
                        Legion::Runtime *runtime);
+  static void
+      load_positions_task(Legion::Task const *task,
+                          std::vector<Legion::PhysicalRegion> const &regions,
+                          Legion::Context ctx,
+                          Legion::Runtime *runtime);
 
 private:
   std::queue<Request> pending_request_queue;
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index caf6229300..a246cf37c3 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -215,6 +215,7 @@ enum TaskIDs {
   FUSED_PARALLELOP_BWD_TASK_ID,
   // InferenceManager & RequestManager
   RM_LOAD_TOKENS_TASK_ID,
+  RM_LOAD_POSITION_TASK_ID,
   // Custom tasks
   CUSTOM_GPU_TASK_ID_FIRST,
   CUSTOM_GPU_TASK_ID_1,
@@ -611,11 +612,14 @@ class FFModel {
                                       int kdim = 0,
                                       int vdim = 0,
                                       float dropout = 0.0f,
-                                      bool bias = true,
+                                      bool bias = false,
                                       bool add_bias_kv = false,
                                       bool add_zero_attn = false,
                                       Initializer *kernel_initializer = NULL,
                                       bool apply_rotary_embedding = false,
+                                      bool scaling_query = false,
+                                      float scaling_factor = 1.0f,
+                                      bool qk_prod_scaling = true,
                                       char const *name = NULL);
   Tensor
       spec_inc_multihead_self_attention(const Tensor input,
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index 5db5e0c3c1..410c30abd9 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -34,6 +34,9 @@ class IncMultiHeadSelfAttention : public Op {
                             bool _add_bias_kv,
                             bool _add_zero_attn,
                             bool _apply_rotary_embedding,
+                            bool _scaling_query,
+                            float _scaling_factor,
+                            bool _qk_prod_scaling,
                             bool allocate_weights,
                             char const *name);
   IncMultiHeadSelfAttention(FFModel &model,
@@ -48,6 +51,9 @@ class IncMultiHeadSelfAttention : public Op {
                             bool _add_bias_kv,
                             bool _add_zero_attn,
                             bool _apply_rotary_embedding,
+                            bool _scaling_query,
+                            float _scaling_factor,
+                            bool _qk_prod_scaling,
                             bool allocate_weights,
                             char const *name);
   IncMultiHeadSelfAttention(FFModel &model,
@@ -96,14 +102,16 @@ class IncMultiHeadSelfAttention : public Op {
                                        BatchConfig const *bc,
                                        float const *input_ptr,
                                        float const *weight_ptr,
-                                       float *output_ptr);
+                                       float *output_ptr,
+                                       float const *bias_ptr);
   Params get_params() const;
 
 public:
   int num_heads;
-  float dropout;
+  float dropout, scaling_factor;
   bool bias;
-  bool add_bias_kv, add_zero_attn, apply_rotary_embedding;
+  bool add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
+      qk_prod_scaling;
   int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
   int qoSeqLength, kvSeqLength;
 };
@@ -125,6 +133,10 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
   int num_heads;
   bool *has_load_weights;
   bool *apply_rotary_embedding;
+  bool *bias;
+  bool *scaling_query;
+  bool *qk_prod_scaling;
+  float scaling_factor;
 #ifdef INFERENCE_TESTS
   float *kcache, *vcache;
 #endif
diff --git a/include/flexflow/ops/inc_multihead_self_attention_params.h b/include/flexflow/ops/inc_multihead_self_attention_params.h
index d263bc741a..66aed3bf3b 100644
--- a/include/flexflow/ops/inc_multihead_self_attention_params.h
+++ b/include/flexflow/ops/inc_multihead_self_attention_params.h
@@ -9,8 +9,9 @@ namespace FlexFlow {
 struct IncMultiHeadSelfAttentionParams {
   LayerID layer_guid;
   int embed_dim, num_heads, kdim, vdim;
-  float dropout;
-  bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding;
+  float dropout, scaling_factor;
+  bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
+      qk_prod_scaling;
 
   bool is_valid(ParallelTensorShape const &) const;
 };
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index 8976703c6f..bc96e2a587 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -65,14 +65,18 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
                                              bool add_zero_attn,
                                              Initializer *kernel_initializer,
                                              bool apply_rotary_embedding,
+                                             bool scaling_query,
+                                             float scaling_factor,
+                                             bool qk_prod_scaling,
                                              char const *name) {
+  int weight_num = bias ? 2 : 1;
   // Currently assume that
   Layer *li = new Layer(this,
                         OP_INC_MULTIHEAD_SELF_ATTENTION,
                         DT_FLOAT,
                         name,
                         1 /*inputs*/,
-                        1 /*weights*/,
+                        weight_num /*weights*/,
                         1 /*outputs*/,
                         input);
   {
@@ -103,6 +107,17 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
                                                    kernel_initializer,
                                                    CHOSEN_SYNC_TYPE);
   }
+  if (bias) {
+    // q, k, v, o
+    int dims[1] = {embed_dim * 4};
+    li->weights[1] = create_weight_legion_ordering(1,
+                                                   dims,
+                                                   DT_FLOAT,
+                                                   li,
+                                                   true /*create_grad*/,
+                                                   kernel_initializer,
+                                                   CHOSEN_SYNC_TYPE);
+  }
   li->data_type = DT_FLOAT;
   li->add_int_property("embed_dim", embed_dim);
   li->add_int_property("num_heads", num_heads);
@@ -113,7 +128,11 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
   li->add_int_property("add_zero_attn", add_zero_attn);
   li->add_float_property("dropout", dropout);
   li->add_int_property("apply_rotary_embedding", apply_rotary_embedding);
+  li->add_int_property("scaling_query", scaling_query);
+  li->add_float_property("scaling_factor", scaling_factor);
+  li->add_int_property("qk_prod_scaling", qk_prod_scaling);
   layers.push_back(li);
+
   return li->outputs[0];
 }
 
@@ -140,6 +159,13 @@ Op *IncMultiHeadSelfAttention::create_operator_from_layer(
   bool add_zero_attn = (bool)value;
   layer->get_int_property("apply_rotary_embedding", value);
   bool apply_rotary_embedding = (bool)value;
+  layer->get_int_property("scaling_query", value);
+  bool scaling_query = (bool)value;
+  float scaling_factor;
+  layer->get_float_property("scaling_factor", scaling_factor);
+  layer->get_int_property("qk_prod_scaling", value);
+  bool qk_prod_scaling = (bool)value;
+
   return new IncMultiHeadSelfAttention(model,
                                        layer->layer_guid,
                                        inputs[0],
@@ -152,6 +178,9 @@ Op *IncMultiHeadSelfAttention::create_operator_from_layer(
                                        add_bias_kv,
                                        add_zero_attn,
                                        apply_rotary_embedding,
+                                       scaling_query,
+                                       scaling_factor,
+                                       qk_prod_scaling,
                                        false /*allocate_weights*/,
                                        layer->name);
 }
@@ -169,6 +198,9 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     bool _add_bias_kv,
     bool _add_zero_attn,
     bool _apply_rotary_embedding,
+    bool _scaling_query,
+    float _scaling_factor,
+    bool _qk_prod_scaling,
     bool allocate_weights,
     char const *name)
     // Initializer* _bias_initializer)
@@ -177,7 +209,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
          DT_FLOAT,
          name,
          1 /*inputs*/,
-         1 /*weights*/,
+         (_bias ? 2 : 1), /*weights*/
          1 /*outputs*/,
          _input),
       num_heads(_num_heads), dropout(_dropout), bias(_bias),
@@ -186,7 +218,9 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
       vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
       vProjSize(_vdim), oProjSize(_embed_dim),
-      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size) {
+      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
+      scaling_query(_scaling_query), scaling_factor(_scaling_factor),
+      qk_prod_scaling(_qk_prod_scaling) {
   // overwrite layer_guid
   layer_guid = _layer_guid;
 
@@ -230,6 +264,26 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
                                                  initializer,
                                                  comm_type);
   }
+  if (bias) {
+    ParallelDim dims[2];
+    int num_dims = inputs[0]->num_dims;
+    dims[0] = inputs[0]->dims[num_dims - 1];
+    dims[0].size = dims[0].degree;
+    dims[1].size = oProjSize * 4;
+    dims[1].degree = 1;
+    dims[1].parallel_idx = -1;
+#ifdef USE_NCCL
+    ParameterSyncType comm_type = ParameterSyncType::NCCL;
+#else
+    ParameterSyncType comm_type = ParameterSyncType::PS;
+#endif
+    weights[1] = model.create_parallel_weight<2>(dims,
+                                                 DT_FLOAT,
+                                                 NULL /*owner_op*/,
+                                                 true /*create_grad*/,
+                                                 NULL,
+                                                 comm_type);
+  }
 
   outputs[0] = model.create_parallel_tensor_legion_ordering(
       _input->num_dims, dims, DT_FLOAT, this);
@@ -253,6 +307,9 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     bool _add_bias_kv,
     bool _add_zero_attn,
     bool _apply_rotary_embedding,
+    bool _scaling_query,
+    float _scaling_factor,
+    bool _qk_prod_scaling,
     bool allocate_weights,
     char const *name)
     // Initializer* _bias_initializer)
@@ -261,7 +318,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
          DT_FLOAT,
          name,
          1 /*inputs*/,
-         1 /*weights*/,
+         (_bias ? 2 : 1), /*weights*/
          1 /*outputs*/,
          _input,
          _weight),
@@ -271,7 +328,9 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
       vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
       vProjSize(_vdim), oProjSize(_embed_dim),
-      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size)
+      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
+      scaling_query(_scaling_query), scaling_factor(_scaling_factor),
+      qk_prod_scaling(_qk_prod_scaling)
 // bias_initializer(_bias_initializer)
 {
   numOutputs = 1;
@@ -312,6 +371,24 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
                                                  initializer,
                                                  comm_type);
   }
+  if (bias) {
+    ParallelDim dims[2];
+    int num_dims = inputs[0]->num_dims;
+    dims[0] = inputs[0]->dims[num_dims - 1];
+    dims[0].size = dims[0].degree;
+    dims[1].size = oProjSize * 4;
+#ifdef USE_NCCL
+    ParameterSyncType comm_type = ParameterSyncType::NCCL;
+#else
+    ParameterSyncType comm_type = ParameterSyncType::PS;
+#endif
+    weights[1] = model.create_parallel_weight<2>(dims,
+                                                 DT_FLOAT,
+                                                 NULL /*owner_op*/,
+                                                 true /*create_grad*/,
+                                                 NULL,
+                                                 comm_type);
+  }
   outputs[0] = model.create_parallel_tensor_legion_ordering(
       _input->num_dims, dims, DT_FLOAT, this);
 
@@ -341,6 +418,9 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
                                 other.add_bias_kv,
                                 other.add_zero_attn,
                                 other.apply_rotary_embedding,
+                                other.scaling_query,
+                                other.scaling_factor,
+                                other.qk_prod_scaling,
                                 allocate_weights,
                                 other.name) {}
 
@@ -362,6 +442,9 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
                                 params.add_bias_kv,
                                 params.add_zero_attn,
                                 params.apply_rotary_embedding,
+                                params.scaling_query,
+                                params.scaling_factor,
+                                params.qk_prod_scaling,
                                 allocate_weights,
                                 name) {}
 
@@ -457,6 +540,7 @@ OpMeta *IncMultiHeadSelfAttention::init_task(
     std::vector<PhysicalRegion> const &regions,
     Context ctx,
     Runtime *runtime) {
+
   IncMultiHeadSelfAttention const *attn =
       (IncMultiHeadSelfAttention *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
@@ -480,6 +564,7 @@ OpMeta *IncMultiHeadSelfAttention::init_task(
                        .first();
   IncMultiHeadSelfAttentionMeta *m = new IncMultiHeadSelfAttentionMeta(
       handle, attn, weight.get_float_ptr(), gpu_mem, num_samples, num_heads);
+
   m->profiling = attn->profiling;
   assert(weight.domain.get_volume() * sizeof(float) == m->weightSize);
   return m;
@@ -533,6 +618,15 @@ FutureMap IncMultiHeadSelfAttention::inference(
                                                     EXCLUSIVE,
                                                     batch_outputs[0]->region));
   launcher.add_field(idx++, FID_DATA);
+
+  if (bias) {
+    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[1]->region));
+    launcher.add_field(idx++, FID_DATA);
+  }
   return runtime->execute_index_space(ctx, launcher);
 }
 
@@ -546,13 +640,17 @@ void IncMultiHeadSelfAttention::inference_task(
     std::vector<PhysicalRegion> const &regions,
     Context ctx,
     Runtime *runtime) {
-  assert(regions.size() == 3);
+
   assert(task->regions.size() == regions.size());
 
+  float const *bias_ptr = NULL;
+
   BatchConfig const *bc = (BatchConfig *)task->args;
   IncMultiHeadSelfAttentionMeta const *m =
       *((IncMultiHeadSelfAttentionMeta **)task->local_args);
 
+  assert((*m->bias ? regions.size() == 4 : regions.size() == 3));
+
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
   GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
@@ -560,6 +658,20 @@ void IncMultiHeadSelfAttention::inference_task(
   GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
       m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
 
+  if (*m->bias) {
+    GenericTensorAccessorR biases =
+        helperGetGenericTensorAccessorRO(m->weight_type[1],
+                                         regions[3],
+                                         task->regions[3],
+                                         FID_DATA,
+                                         ctx,
+                                         runtime);
+    Domain bias_domain = runtime->get_index_space_domain(
+        ctx, task->regions[3].region.get_index_space());
+    assert(bias_domain.get_dim() == 2);
+    bias_ptr = biases.get_float_ptr();
+  }
+
   Domain input_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
   Domain weight_domain = runtime->get_index_space_domain(
@@ -571,15 +683,12 @@ void IncMultiHeadSelfAttention::inference_task(
   assert(weight_domain.get_dim() == 3);
   assert(output_domain.get_dim() == 4);
 
-  /* print_tensor<float>(input.get_float_ptr(),
-                      input_domain.get_volume(),
-                      "[Attention:forward:query]"); */
-
   IncMultiHeadSelfAttention::inference_kernel_wrapper(m,
                                                       bc,
                                                       input.get_float_ptr(),
                                                       weight.get_float_ptr(),
-                                                      output.get_float_ptr());
+                                                      output.get_float_ptr(),
+                                                      bias_ptr);
 #ifdef INFERENCE_TESTS
   printf("Checking IncMultiHeadSelfAttention computations...\n");
 
@@ -1367,7 +1476,10 @@ bool operator==(IncMultiHeadSelfAttentionParams const &lhs,
          lhs.vdim == rhs.vdim && lhs.dropout == rhs.dropout &&
          lhs.bias == rhs.bias && lhs.add_bias_kv == rhs.add_bias_kv &&
          lhs.add_zero_attn == rhs.add_zero_attn &&
-         lhs.apply_rotary_embedding == rhs.apply_rotary_embedding;
+         lhs.apply_rotary_embedding == rhs.apply_rotary_embedding &&
+         lhs.scaling_query == rhs.scaling_query &&
+         lhs.scaling_factor == rhs.scaling_factor &&
+         lhs.qk_prod_scaling == rhs.qk_prod_scaling;
 }
 
 IncMultiHeadSelfAttentionParams IncMultiHeadSelfAttention::get_params() const {
@@ -1382,6 +1494,10 @@ IncMultiHeadSelfAttentionParams IncMultiHeadSelfAttention::get_params() const {
   params.add_bias_kv = this->add_bias_kv;
   params.add_zero_attn = this->add_zero_attn;
   params.apply_rotary_embedding = this->apply_rotary_embedding;
+  params.scaling_query = this->scaling_query;
+  params.scaling_factor = this->scaling_factor;
+  params.qk_prod_scaling = this->qk_prod_scaling;
+
   return params;
 }
 
@@ -1401,6 +1517,9 @@ size_t hash<FlexFlow::IncMultiHeadSelfAttentionParams>::operator()(
   hash_combine(key, params.add_bias_kv);
   hash_combine(key, params.add_zero_attn);
   hash_combine(key, params.apply_rotary_embedding);
+  hash_combine(key, params.scaling_query);
+  hash_combine(key, params.scaling_factor);
+  hash_combine(key, params.qk_prod_scaling);
   return key;
 }
 }; // namespace std
diff --git a/src/ops/inc_multihead_self_attention.cpp b/src/ops/inc_multihead_self_attention.cpp
index 12ab8ae30c..c56e73a266 100644
--- a/src/ops/inc_multihead_self_attention.cpp
+++ b/src/ops/inc_multihead_self_attention.cpp
@@ -29,7 +29,8 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     BatchConfig const *bc,
     float const *input_ptr,
     float const *weight_ptr,
-    float *output_ptr) {
+    float *output_ptr,
+    float const *bias_ptr) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 5997a3d48d..be86f55de4 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -40,6 +40,49 @@ __global__ void build_w_out_tensor(float const *weight_ptr,
   }
 }
 
+__global__ void apply_proj_bias_w(float *input_ptr,
+                                  float const *bias_ptr,
+                                  int num_tokens,
+                                  int oProjSize) {
+  CUDA_KERNEL_LOOP(i, num_tokens * oProjSize) {
+    int bias_idx = 3 * oProjSize + i % oProjSize;
+    input_ptr[i] += bias_ptr[bias_idx];
+  }
+}
+
+__global__ void apply_proj_bias_qkv(float *input_ptr,
+                                    float const *bias_ptr,
+                                    int num_tokens,
+                                    int qProjSize,
+                                    int kProjSize,
+                                    int vProjSize,
+                                    int num_heads,
+                                    bool scaling_query,
+                                    float scaling_factor) {
+  CUDA_KERNEL_LOOP(
+      i, num_tokens * (qProjSize + kProjSize + vProjSize) * num_heads) {
+    // for simplicity, assume q, k, v is in same shape
+    // 0->q, 1->k, 2->v
+    int qkv_index = i / (num_tokens * qProjSize) % 3;
+
+    int head_idx = i / (num_tokens * (qProjSize + kProjSize + vProjSize));
+    int qkv_block_size = (qProjSize + kProjSize + vProjSize) * num_tokens;
+    int q_block_size = qProjSize * num_tokens;
+
+    int idx = i % (num_tokens * (qProjSize));
+
+    int real_part_index =
+        head_idx * qkv_block_size + qkv_index * q_block_size + idx;
+    int bias_idx = qkv_index * qProjSize * num_heads + head_idx * qProjSize +
+                   (idx % qProjSize);
+    input_ptr[real_part_index] += bias_ptr[bias_idx];
+
+    if (scaling_query && qkv_index == 0) {
+      input_ptr[real_part_index] *= scaling_factor;
+    }
+  }
+}
+
 __global__ void
     apply_rotary_embedding(float *input_ptr,
                            cuFloatComplex *complex_input,
@@ -106,6 +149,7 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                         float const *input_ptr,
                         float const *weight_ptr,
                         float *output_ptr,
+                        float const *bias_ptr,
                         cudaStream_t stream) {
 
   checkCUDA(cublasSetStream(m->handle.blas, stream));
@@ -217,6 +261,23 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
   int k_block_size = m->kProjSize * num_tokens;
   int v_block_size = m->vProjSize * num_tokens;
   cuFloatComplex *complex_input;
+
+  // apply bias for q, k, v
+  if (*m->bias) {
+    apply_proj_bias_qkv<<<GET_BLOCKS(parallelism),
+                          min(CUDA_NUM_THREADS, parallelism),
+                          0,
+                          stream>>>(output_ptr,
+                                    bias_ptr,
+                                    num_tokens,
+                                    m->qProjSize,
+                                    m->kProjSize,
+                                    m->vProjSize,
+                                    m->num_heads,
+                                    *m->scaling_query,
+                                    m->scaling_factor);
+  }
+
   if (*m->apply_rotary_embedding) {
     checkCUDA(cudaMalloc(&complex_input,
                          num_tokens * m->qProjSize * m->num_heads *
@@ -344,6 +405,7 @@ __global__ void fill_entries_above_diagonal(float *matrix,
 void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
                               BatchConfig const *bc,
                               float *output_ptr,
+                              float const *bias_ptr,
                               cudaStream_t stream) {
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
@@ -382,7 +444,11 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     int strideB = kt_block_size;
     int strideC = num_new_tokens * total_tokens;
 
-    float alpha = 1.0f / (float)sqrt(m->kProjSize), beta = 0.0f;
+    // a flag of using this scaling alpha
+    float alpha = 1.0f, beta = 0.0f;
+    if (*m->qk_prod_scaling) {
+      alpha = 1.0f / (float)sqrt(m->kProjSize), beta = 0.0f;
+    }
     // To get A, skip over Q entries from previous requests (same head)
     void const *A = (void const *)(m->devQKVProjArray +
                                    tokens_previous_requests * m->qProjSize);
@@ -415,6 +481,7 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                          m->num_heads,
                                          compute_type,
                                          CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
     // Fill all elements above diagonal in qk prods with -inf to force
     // causal attention.
     assert(num_new_tokens <= total_tokens);
@@ -541,9 +608,19 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
                            ldc,
                            compute_type,
                            CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
     tokens_previous_requests += num_new_tokens;
   }
 
+  if (*m->bias) {
+    int parallelism = m->oProjSize * num_tokens;
+    apply_proj_bias_w<<<GET_BLOCKS(parallelism),
+                        min(CUDA_NUM_THREADS, parallelism),
+                        0,
+                        stream>>>(
+        output_ptr, bias_ptr, num_tokens, m->oProjSize);
+  }
+
   assert(tokens_previous_requests == num_tokens);
 }
 
@@ -553,7 +630,8 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     BatchConfig const *bc,
     float const *input_ptr,
     float const *weight_ptr,
-    float *output_ptr) {
+    float *output_ptr,
+    float const *bias_ptr) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -588,14 +666,15 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
                   cudaMemcpyHostToDevice,
                   stream);
   // phase 1: Implement kernel to compute KQV for input tokens
-  compute_qkv_kernel(m, bc, input_ptr, weight_ptr, m->devQKVProjArray, stream);
+  compute_qkv_kernel(
+      m, bc, input_ptr, weight_ptr, m->devQKVProjArray, bias_ptr, stream);
 
   // phase 2: Update key/val cache
   update_kv_cache_kernel(m, bc, stream);
 
   // phase 3: Compute attention score
   // 3 kernels for pahse 3: matmul1 - softmax - matmal2
-  compute_attention_kernel(m, bc, output_ptr, stream);
+  compute_attention_kernel(m, bc, output_ptr, bias_ptr, stream);
 
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
@@ -643,6 +722,13 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   *has_load_weights = false;
   apply_rotary_embedding = (bool *)calloc(1, sizeof(bool));
   *apply_rotary_embedding = attn->apply_rotary_embedding;
+  bias = (bool *)calloc(1, sizeof(bool));
+  *bias = attn->bias;
+  scaling_query = (bool *)calloc(1, sizeof(bool));
+  *scaling_query = attn->scaling_query;
+  scaling_factor = attn->scaling_factor;
+  qk_prod_scaling = (bool *)calloc(1, sizeof(bool));
+  *qk_prod_scaling = attn->qk_prod_scaling;
   // Currently do not support adding bias to key/value projection
   assert(!attn->add_bias_kv);
 
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index 2a382f0d71..baf1b24f5d 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -2275,6 +2275,9 @@ GraphOptimalViewSerialized
         sez.serialize(attn->add_bias_kv);
         sez.serialize(attn->add_zero_attn);
         sez.serialize(attn->apply_rotary_embedding);
+        sez.serialize(attn->scaling_query);
+        sez.serialize(attn->scaling_factor);
+        sez.serialize(attn->qk_prod_scaling);
         break;
       }
       case OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION: {
@@ -2669,8 +2672,9 @@ void FFModel::deserialize_graph_optimal_view(
       case OP_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(num_inputs == 1);
         int embed_dim, num_heads, k_dim, v_dim;
-        float dropout;
-        bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding;
+        float dropout, scaling_factor;
+        bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
+            scaling_query, qk_prod_scaling;
         size_t id;
         dez.deserialize(id);
         LayerID layer_guid(id);
@@ -2683,6 +2687,9 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(add_bias_kv);
         dez.deserialize(add_zero_attn);
         dez.deserialize(apply_rotary_embedding);
+        dez.deserialize(scaling_query);
+        dez.deserialize(scaling_factor);
+        dez.deserialize(qk_prod_scaling);
 
         IncMultiHeadSelfAttentionParams params;
         params.embed_dim = embed_dim;
@@ -2695,6 +2702,9 @@ void FFModel::deserialize_graph_optimal_view(
         params.add_zero_attn = add_zero_attn;
         params.layer_guid = layer_guid;
         params.apply_rotary_embedding = apply_rotary_embedding;
+        params.scaling_query = scaling_query;
+        params.scaling_factor = scaling_factor;
+        params.qk_prod_scaling = qk_prod_scaling;
         node = get_or_create_node<IncMultiHeadSelfAttention>(inputs[0], params);
         break;
       }
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 15ae8e3aa3..63a5bb6540 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -216,12 +216,18 @@ FutureMap InferenceManager::inference(FFModel *model,
     if (op->op_type == OP_INPUT) {
       // FIXME: this is a hack, should be replace with an input ParallelTensor
       if (found_input_operator) {
-        continue;
+        // there is another input for position embedding;
+        // now only used in opt model, this input should be init after token
+        // input.
+        assert(op->numOutputs == 1);
+        ParallelTensor pt = tensor_buffer[op->outputs[0]][batch_index];
+        load_positions(bc, pt);
+      } else {
+        found_input_operator = true;
+        assert(op->numOutputs == 1);
+        ParallelTensor pt = tensor_buffer[op->outputs[0]][batch_index];
+        load_input_tokens_from_batch_config(bc, pt);
       }
-      found_input_operator = true;
-      assert(op->numOutputs == 1);
-      ParallelTensor pt = tensor_buffer[op->outputs[0]][batch_index];
-      load_input_tokens_from_batch_config(bc, pt);
     }
 
     std::vector<ParallelTensor> inputs(op->numInputs);
@@ -271,6 +277,31 @@ void InferenceManager::load_input_tokens_from_batch_config(
   runtime->execute_index_space(ctx, launcher);
 }
 
+void InferenceManager::load_positions(BatchConfig const &bc,
+                                      ParallelTensor position_input) {
+  Context ctx = ff_config.lg_ctx;
+  Runtime *runtime = ff_config.lg_hlr;
+  size_t machine_view_hash = position_input->machine_view.hash();
+  ArgumentMap argmap;
+  IndexLauncher launcher(
+      RM_LOAD_POSITION_TASK_ID,
+      position_input->parallel_is,
+      TaskArgument(
+          &bc, std::max(sizeof(BeamSearchBatchConfig), sizeof(BatchConfig))),
+      argmap,
+      Predicate::TRUE_PRED,
+      false /*must*/,
+      0 /*mapper_id*/,
+      machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(position_input->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    position_input->region));
+  launcher.add_field(0, FID_DATA);
+  runtime->execute_index_space(ctx, launcher);
+}
+
 void FFModel::compile_inference() {
   Context ctx = config.lg_ctx;
   Runtime *runtime = config.lg_hlr;
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 38bb7b8333..562b09e411 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -3899,6 +3899,15 @@ void register_flexflow_internal_tasks() {
     Runtime::preregister_task_variant<RequestManager::load_tokens_task>(
         registrar, "RequestManager Load Tokens Task");
   }
+  // RequestManager load position tokens
+  {
+    TaskVariantRegistrar registrar(RM_LOAD_POSITION_TASK_ID,
+                                   "RequestManager Load Position tokens");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<RequestManager::load_positions_task>(
+        registrar, "RequestManager Load Position Tokens Task");
+  }
   // ElementUnary task
   {
     TaskVariantRegistrar registrar(ELEMENTUNARY_INIT_TASK_ID,
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index fb445fbec6..5b256d5bb7 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -64,6 +64,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
       assert(old_bc.tokensInfo[i].abs_depth_in_request + 1 ==
              request.tokens.size());
       // This is a decoding token
+      std::cout << "token is: " << result.token_ids[i];
       request.tokens.push_back(result.token_ids[i]);
     }
   }
@@ -85,6 +86,10 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
       log_req_mgr.print("[Done] guid(%zu) final_length(%zu)",
                         old_bc.requestsInfo[i].request_guid,
                         request.tokens.size());
+      std::cout << "print results: " << std::endl;
+      for (int i = 0; i < request.tokens.size(); i++) {
+        std::cout << request.tokens.at(i) << ", ";
+      }
     } else {
       new_bc.request_completed[i] = false;
       new_bc.requestsInfo[i].token_start_offset = processed_tokens;
@@ -839,6 +844,7 @@ TreeVerifyBatchConfig RequestManager::convert_beam_to_tree_batch_config(
         beam_bc.requestsInfo[i].max_sequence_length;
     tree_bc.requestsInfo[i].token_start_offset = serializedTree[0].second;
     tree_bc.requestsInfo[i].num_tokens_in_batch = 0;
+
     for (int k = 0; k < serializedTree.size(); k++) {
       assert(tree_bc.num_tokens < BatchConfig::MAX_NUM_TOKENS);
       tree_bc.tokensInfo[tree_bc.num_tokens].request_index = i;
diff --git a/src/runtime/request_manager.cpp b/src/runtime/request_manager.cpp
index 87e86087fe..ffbdac68cd 100644
--- a/src/runtime/request_manager.cpp
+++ b/src/runtime/request_manager.cpp
@@ -48,4 +48,31 @@ void RequestManager::load_tokens_task(
                            stream));
 }
 
+void RequestManager::load_positions_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  assert(regions.size() == 1);
+  assert(task->regions.size() == 1);
+  BatchConfig const batch_config = *((BatchConfig *)task->args);
+  int offset = 2;
+  int *pos_ptr = helperGetTensorPointerWO<int>(
+      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  Domain domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  int dram_copy[BatchConfig::MAX_NUM_TOKENS];
+
+  for (int i = 0; i < batch_config.num_tokens; i++) {
+    dram_copy[i] = batch_config.tokensInfo[i].abs_depth_in_request + offset;
+  }
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  checkCUDA(hipMemcpyAsync(pos_ptr,
+                           dram_copy,
+                           sizeof(int) * batch_config.num_tokens,
+                           hipMemcpyHostToDevice,
+                           stream));
+}
+
 }; // namespace FlexFlow
diff --git a/src/runtime/request_manager.cu b/src/runtime/request_manager.cu
index 32e872125c..c1bd02494f 100644
--- a/src/runtime/request_manager.cu
+++ b/src/runtime/request_manager.cu
@@ -47,4 +47,33 @@ void RequestManager::load_tokens_task(
                             stream));
 }
 
+void RequestManager::load_positions_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  assert(regions.size() == 1);
+  assert(task->regions.size() == 1);
+
+  BatchConfig const batch_config = *((BatchConfig *)task->args);
+  int offset = 2;
+  int *pos_ptr = helperGetTensorPointerWO<int>(
+      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  Domain domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  int dram_copy[BatchConfig::MAX_NUM_TOKENS];
+
+  for (int i = 0; i < batch_config.num_tokens; i++) {
+    dram_copy[i] = batch_config.tokensInfo[i].abs_depth_in_request + offset;
+  }
+
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  checkCUDA(cudaMemcpyAsync(pos_ptr,
+                            dram_copy,
+                            sizeof(int) * batch_config.num_tokens,
+                            cudaMemcpyHostToDevice,
+                            stream));
+}
+
 }; // namespace FlexFlow

From b2d6d9a9221a40c305eb570a06f22ead239a734f Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Thu, 11 May 2023 11:01:06 -0500
Subject: [PATCH 121/344] TreeIncMHA and SpecIncMHA bug fixes (#720)

* Support multiple FFModels in a single top_level_task

* [TreeVerifyMHA] bug fixes

* bug fixes

* TreeIncMHA and SpecIncMHA bug fixes

* fomat.

---------

Co-authored-by: xinhaoc <chengxh_98@163.com>
---
 examples/cpp/inference/models/llama.cc        |  2 +-
 examples/cpp/inference/models/llama.h         | 11 +--
 .../inference/spec_verify_pipeline/llama.cc   | 96 +------------------
 include/flexflow/batch_config.h               |  2 +-
 src/ops/spec_inc_multihead_self_attention.cu  | 25 +++--
 src/ops/tree_inc_multihead_self_attention.cu  | 25 +++--
 src/runtime/request_manager.cu                |  1 +
 7 files changed, 32 insertions(+), 130 deletions(-)

diff --git a/examples/cpp/inference/models/llama.cc b/examples/cpp/inference/models/llama.cc
index d2374c8c8f..46f83f8198 100644
--- a/examples/cpp/inference/models/llama.cc
+++ b/examples/cpp/inference/models/llama.cc
@@ -45,7 +45,7 @@ void LLAMA::create_llama_model(FFModel &ff,
 
   Tensor input;
   {
-    int const token_dims[] = {llama_config.batchSize, llama_config.max_seq_len};
+    int const token_dims[] = {BatchConfig::MAX_NUM_TOKENS, 1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
   mapping[input].push_back(machine_views[0]);
diff --git a/examples/cpp/inference/models/llama.h b/examples/cpp/inference/models/llama.h
index 612a28967e..8c7d464936 100644
--- a/examples/cpp/inference/models/llama.h
+++ b/examples/cpp/inference/models/llama.h
@@ -31,16 +31,14 @@ class LLAMA {
       dim = 4096;
       multiple_of = 256;
       norm_eps = 1e-6;
-      total_sentence = 5;
       sentence_len = 347;
-      max_gen_length = 256;
       batchSize = 5;
       total_requests = 2560;
       incremental_mode = true;
       sequence_length = BatchConfig::MAX_SEQ_LENGTH;
-      max_seq_len = 8;
+      max_seq_len = BatchConfig::MAX_NUM_TOKENS;
       max_beam_width = 1;
-      max_beam_depth = 8;
+      max_beam_depth = 4;
 
       // hidden dim
       hidden_dim = 4 * dim;
@@ -49,9 +47,8 @@ class LLAMA {
           multiple_of * int((hidden_dim + multiple_of - 1) / multiple_of);
     }
     int n_heads, n_layers, vocab_size, dim, multiple_of, hidden_dim,
-        total_sentence, sentence_len, batchSize, total_requests,
-        incremental_mode, sequence_length, max_gen_length, max_seq_len,
-        max_beam_width, max_beam_depth;
+        sentence_len, batchSize, total_requests, incremental_mode,
+        sequence_length, max_seq_len, max_beam_width, max_beam_depth;
     float norm_eps;
     std::string weight_file_path;
     std::string input_path;
diff --git a/examples/cpp/inference/spec_verify_pipeline/llama.cc b/examples/cpp/inference/spec_verify_pipeline/llama.cc
index b00fc522f1..a2a8e1ea2f 100644
--- a/examples/cpp/inference/spec_verify_pipeline/llama.cc
+++ b/examples/cpp/inference/spec_verify_pipeline/llama.cc
@@ -54,10 +54,11 @@ void FlexFlow::top_level_task(Task const *task,
       1, 306, 4658, 278, 6593, 310, 2834, 338};
   rm.register_new_request(prompt, llama_config.sentence_len);
 
-  FFModel beam_model(ffconfig), tree_model(ffconfig), inc_model(ffconfig);
+  FFModel beam_model(ffconfig), tree_model(ffconfig);
   LLAMA::create_llama_model(beam_model, im, llama_config, 1, BEAM_SEARCH_MODE);
   LLAMA::create_llama_model(tree_model, im, llama_config, 1, TREE_VERIFY_MODE);
-  LLAMA::create_llama_model(inc_model, im, llama_config, 1, INC_DECODING_MODE);
+  // LLAMA::create_llama_model(inc_model, im, llama_config, 1,
+  // INC_DECODING_MODE);
 
   // entry---------------------------
   int depth = 0;
@@ -183,97 +184,6 @@ void FlexFlow::top_level_task(Task const *task,
     }
   }
 
-  // // original
-  // {
-  //   std::vector<BatchConfig::TokenId> tokens{1,
-  //                                            306,
-  //                                            4658,
-  //                                            278,
-  //                                            6593,
-  //                                            310,
-  //                                            2834,
-  //                                            338,
-  //                                            593,
-  //                                            595,
-  //                                            17252,
-  //                                            5031,
-  //                                            993,
-  //                                            616,
-  //                                            368,
-  //                                            2302,
-  //                                            3204,
-  //                                            29131,
-  //                                            2976,
-  //                                            11285,
-  //                                            8930,
-  //                                            635,
-  //                                            8519,
-  //                                            593,
-  //                                            595};
-  //   BatchConfig bc;
-  //   bc.num_tokens = 25;
-  //   bc.requestsInfo[0].num_tokens_in_batch = bc.num_tokens;
-  //   bc.requestsInfo[0].token_start_offset = 0;
-  //   bc.requestsInfo[0].max_sequence_length = 347;
-  //   bc.requestsInfo[0].request_guid = 1000000;
-  //   bc.request_completed[0] = false;
-  //   for (int i = 0; i < bc.num_tokens; i++) {
-  //     bc.tokensInfo[i].token_id = tokens[i];
-  //     bc.tokensInfo[i].abs_depth_in_request = i;
-  //     bc.tokensInfo[i].request_index = 0;
-  //   }
-  //   FutureMap fm = im.inference(&inc_model, 0, bc);
-  //   assert(fm.get_future_map_domain().get_volume() == 1);
-  //   Future future = fm.get_future(0);
-  //   InferenceResult ir = future.get_result<InferenceResult>();
-  //   for (int i = 0; i < bc.num_tokens; i++) {
-  //     printf("decoding_tokens[%d] = %d\n", i, ir.token_ids[i]);
-  //   }
-  // }
-
-  // // verification
-  // {
-  //   std::vector<BatchConfig::TokenId> tokens{1,
-  //                                            306,
-  //                                            4658,
-  //                                            278,
-  //                                            6593,
-  //                                            310,
-  //                                            2834,
-  //                                            338,
-  //                                            593,
-  //                                            595,
-  //                                            17252,
-  //                                            5031,
-  //                                            993,
-  //                                            616,
-  //                                            368,
-  //                                            2302,
-  //                                            3204,
-  //                                            29131,
-  //                                            2976,
-  //                                            11285,
-  //                                            8930,
-  //                                            635,
-  //                                            8519,
-  //                                            593,
-  //                                            595};
-  //   tree_bc.num_tokens = 25;
-  //   tree_bc.requestsInfo[0].num_tokens_in_batch = tree_bc.num_tokens;
-  //   for (int i = 0; i < tree_bc.num_tokens; i++) {
-  //     tree_bc.tokensInfo[i].token_id = tokens[i];
-  //     tree_bc.tokensInfo[i].abs_depth_in_request = i;
-  //     tree_bc.tokensInfo[i].request_index = 0;
-  //   }
-  //   FutureMap fm = im.inference(&tree_model, 0, tree_bc);
-  //   assert(fm.get_future_map_domain().get_volume() == 1);
-  //   Future future = fm.get_future(0);
-  //   InferenceResult ir = future.get_result<InferenceResult>();
-  //   for (int i = 0; i < tree_bc.num_tokens; i++) {
-  //     printf("verify_tokens[%d] = %d\n", i, ir.token_ids[i]);
-  //   }
-  // }
-
   // Execution fence
   {
     Future future = runtime->issue_execution_fence(ctx);
diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 8c6fa41f2e..bd109eecd0 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -102,7 +102,7 @@ class BeamSearchBatchConfig : public BatchConfig {
   size_t beam_width;
   size_t target_iterations;
   static int const MAX_BEAM_WIDTH = 1;
-  static int const MAX_BEAM_DEPTH = 8;
+  static int const MAX_BEAM_DEPTH = 4;
 
   struct BeamSearchPerRequestInfo {
     bool request_completed;
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 42f647f670..ee1c6e389b 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -437,18 +437,17 @@ void inference_kernel2(SpecIncMultiHeadSelfAttentionMeta const *m,
 }
 
 __global__ void spec_fill_entries_above_diagonal(float *matrix,
-                                                 size_t num_rows,
-                                                 size_t num_cols,
+                                                 size_t new_tokens,
+                                                 size_t total_tokens_in_request,
                                                  size_t num_heads,
-                                                 size_t entries_above_diagonal,
                                                  float value) {
-  CUDA_KERNEL_LOOP(i, entries_above_diagonal * num_heads) {
-    size_t head_idx = i / entries_above_diagonal;
-    size_t entry_idx = i % entries_above_diagonal;
-    size_t y = (-1 + sqrt(8 * (float)entry_idx + 1)) / 2;
-    size_t x = entry_idx - y * (y + 1) / 2;
-    y += (num_cols - num_rows) + 1;
-    matrix[head_idx * num_rows * num_cols + num_cols * y + x] = value;
+  CUDA_KERNEL_LOOP(i, new_tokens * total_tokens_in_request * num_heads) {
+    //size_t head_idx = i / (new_tokens * total_tokens_in_request);
+    size_t src_idx = (i / new_tokens) % total_tokens_in_request;
+    size_t dst_idx = i % new_tokens + total_tokens_in_request - new_tokens;
+    // Casual Mask
+    if (src_idx > dst_idx)
+      matrix[i] = value;
   }
 }
 
@@ -543,9 +542,8 @@ void inference_kernel3(SpecIncMultiHeadSelfAttentionMeta const *m,
       // Fill all elements above diagonal in qk prods with -inf to force
       // causal attention.
       assert(num_new_tokens <= total_tokens);
-      size_t entries_above_diagonal = num_new_tokens * (num_new_tokens - 1) / 2;
-      if (entries_above_diagonal > 0) {
-        size_t parallelism = m->num_heads * entries_above_diagonal;
+      if (num_new_tokens > 1) {
+        size_t parallelism = m->num_heads * num_new_tokens * total_tokens;
         spec_fill_entries_above_diagonal<<<GET_BLOCKS(parallelism),
                                            min((size_t)CUDA_NUM_THREADS,
                                                parallelism),
@@ -554,7 +552,6 @@ void inference_kernel3(SpecIncMultiHeadSelfAttentionMeta const *m,
                                                      num_new_tokens,
                                                      total_tokens,
                                                      m->num_heads,
-                                                     entries_above_diagonal,
                                                      -INFINITY);
       }
       // Compute Softmax(QK^T/sqrt(d_k))
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index 39a7ceaca3..452a1be7b2 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -375,18 +375,17 @@ __global__ void update_tree_branch_kv_cache(
 }
 
 __global__ void tree_fill_entries_above_diagonal(float *matrix,
-                                                 size_t num_rows,
-                                                 size_t num_cols,
+                                                 size_t new_tokens,
+                                                 size_t total_tokens_in_request,
                                                  size_t num_heads,
-                                                 size_t entries_above_diagonal,
                                                  float value) {
-  CUDA_KERNEL_LOOP(i, entries_above_diagonal * num_heads) {
-    size_t head_idx = i / entries_above_diagonal;
-    size_t entry_idx = i % entries_above_diagonal;
-    size_t y = (-1 + sqrt(8 * (float)entry_idx + 1)) / 2;
-    size_t x = entry_idx - y * (y + 1) / 2;
-    y += (num_cols - num_rows) + 1;
-    matrix[head_idx * num_rows * num_cols + num_cols * y + x] = value;
+  CUDA_KERNEL_LOOP(i, new_tokens * total_tokens_in_request * num_heads) {
+    //size_t head_idx = i / (new_tokens * total_tokens_in_request);
+    size_t src_idx = (i / new_tokens) % total_tokens_in_request;
+    size_t dst_idx = i % new_tokens + total_tokens_in_request - new_tokens;
+    // Casual Mask
+    if (src_idx > dst_idx)
+      matrix[i] = value;
   }
 }
 
@@ -517,9 +516,8 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       // Fill all elements above diagonal in qk prods with -inf to force
       // causal attention.
       assert(num_new_tokens <= total_tokens_in_request);
-      size_t entries_above_diagonal = num_new_tokens * (num_new_tokens - 1) / 2;
-      if (entries_above_diagonal > 0) {
-        size_t parallelism = m->num_heads * entries_above_diagonal;
+      if (num_new_tokens > 1) {
+        size_t parallelism = m->num_heads * num_new_tokens * total_tokens_in_request;
         tree_fill_entries_above_diagonal<<<GET_BLOCKS(parallelism),
                                            min((size_t)CUDA_NUM_THREADS,
                                                parallelism),
@@ -528,7 +526,6 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                                                      num_new_tokens,
                                                      total_tokens_in_request,
                                                      m->num_heads,
-                                                     entries_above_diagonal,
                                                      -INFINITY);
       }
       // Compute Softmax(QK^T/sqrt(d_k))
diff --git a/src/runtime/request_manager.cu b/src/runtime/request_manager.cu
index c1bd02494f..a50ca5ad95 100644
--- a/src/runtime/request_manager.cu
+++ b/src/runtime/request_manager.cu
@@ -30,6 +30,7 @@ void RequestManager::load_tokens_task(
 
   BatchConfig const batch_config = *((BatchConfig *)task->args);
   BatchConfig::TokenId dram_copy[BatchConfig::MAX_NUM_TOKENS];
+  assert(batch_config.num_tokens <= BatchConfig::MAX_NUM_TOKENS);
   for (int i = 0; i < batch_config.num_tokens; i++) {
     dram_copy[i] = batch_config.tokensInfo[i].token_id;
   }

From f779d894d6f45641c7fd53e444d32a96bd7c5954 Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Thu, 11 May 2023 23:33:27 -0400
Subject: [PATCH 122/344] [inference] serving opt pipeline (#722)

* serving opt pipeline

* format
---
 CMakeLists.txt                                |   6 +-
 .../CMakeLists.txt                            |   4 +-
 .../Makefile                                  |   4 +-
 .../README.md                                 |   0
 .../llama.cc                                  |   0
 .../llama_rae.cc                              |   0
 examples/cpp/inference/models/llama.cc        |   5 -
 examples/cpp/inference/models/opt.cc          | 229 ++++++++++++++++++
 examples/cpp/inference/models/opt.h           |  65 +++++
 examples/cpp/inference/opt/opt.cc             |  20 +-
 examples/cpp/inference/opt/opt.h              |  26 --
 examples/cpp/inference/opt/opt_baseline.py    |  10 +-
 .../opt_spec_pipeline/CMakeLists.txt          |  20 ++
 .../cpp/inference/opt_spec_pipeline/Makefile  |  37 +++
 .../opt_spec_pipeline/opt_pipeline.cc         | 189 +++++++++++++++
 include/flexflow/model.h                      |  10 +-
 .../ops/spec_inc_multihead_self_attention.h   |  18 +-
 ...spec_inc_multihead_self_attention_params.h |   5 +-
 .../ops/tree_inc_multihead_self_attention.h   |  18 +-
 ...tree_inc_multihead_self_attention_params.h |   5 +-
 src/ops/spec_inc_multihead_self_attention.cc  | 134 +++++++++-
 src/ops/spec_inc_multihead_self_attention.cpp |   3 +-
 src/ops/spec_inc_multihead_self_attention.cu  | 132 +++++++---
 src/ops/tree_inc_multihead_self_attention.cc  | 129 +++++++++-
 src/ops/tree_inc_multihead_self_attention.cpp |   3 +-
 src/ops/tree_inc_multihead_self_attention.cu  | 100 +++++++-
 src/runtime/graph.cc                          |  28 ++-
 27 files changed, 1083 insertions(+), 117 deletions(-)
 rename examples/cpp/inference/{spec_verify_pipeline => llama_spec_pipeline}/CMakeLists.txt (87%)
 rename examples/cpp/inference/{spec_verify_pipeline => llama_spec_pipeline}/Makefile (93%)
 rename examples/cpp/inference/{spec_verify_pipeline => llama_spec_pipeline}/README.md (100%)
 rename examples/cpp/inference/{spec_verify_pipeline => llama_spec_pipeline}/llama.cc (100%)
 rename examples/cpp/inference/{spec_verify_pipeline => llama_spec_pipeline}/llama_rae.cc (100%)
 create mode 100644 examples/cpp/inference/models/opt.cc
 create mode 100644 examples/cpp/inference/models/opt.h
 create mode 100644 examples/cpp/inference/opt_spec_pipeline/CMakeLists.txt
 create mode 100644 examples/cpp/inference/opt_spec_pipeline/Makefile
 create mode 100644 examples/cpp/inference/opt_spec_pipeline/opt_pipeline.cc

diff --git a/CMakeLists.txt b/CMakeLists.txt
index ff6e90f200..45e4dfb328 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -553,7 +553,11 @@ if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
 endif()
 
 if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/inference/spec_verify_pipeline)
+  add_subdirectory(examples/cpp/inference/llama_spec_pipeline)
+endif()
+
+if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
+  add_subdirectory(examples/cpp/inference/opt_spec_pipeline)
 endif()
 
 # installation
diff --git a/examples/cpp/inference/spec_verify_pipeline/CMakeLists.txt b/examples/cpp/inference/llama_spec_pipeline/CMakeLists.txt
similarity index 87%
rename from examples/cpp/inference/spec_verify_pipeline/CMakeLists.txt
rename to examples/cpp/inference/llama_spec_pipeline/CMakeLists.txt
index f93189af36..aeb3d8891b 100644
--- a/examples/cpp/inference/spec_verify_pipeline/CMakeLists.txt
+++ b/examples/cpp/inference/llama_spec_pipeline/CMakeLists.txt
@@ -1,7 +1,7 @@
 cmake_minimum_required(VERSION 3.10)
 
-project(FlexFlowExample_spec_verify_pipeline)
-set(project_target spec_verify_pipeline)
+project(FlexFlowExample_llama_pipeline)
+set(project_target llama_pipeline)
 
 
 set(CPU_SRC
diff --git a/examples/cpp/inference/spec_verify_pipeline/Makefile b/examples/cpp/inference/llama_spec_pipeline/Makefile
similarity index 93%
rename from examples/cpp/inference/spec_verify_pipeline/Makefile
rename to examples/cpp/inference/llama_spec_pipeline/Makefile
index 130d52a7ee..0e4b79f51f 100644
--- a/examples/cpp/inference/spec_verify_pipeline/Makefile
+++ b/examples/cpp/inference/llama_spec_pipeline/Makefile
@@ -23,10 +23,8 @@ USE_HDF         ?= 1		# Include HDF5 support (requires HDF5)
 ALT_MAPPERS     ?= 0		# Include alternative mappers (not recommended)
 
 # Put the binary file name here
-OUTFILE		?= spec_verify_pipeline
+OUTFILE		?= llama_pipeline
 # List all the application source files here
-GEN_SRC		= llama.cc dataloader.cc 
-GEN_GPU_SRC	= dataloader.cu 
 ifndef CUDA_HOME
 CUDA_HOME = $(patsubst %/bin/nvcc,%,$(shell which nvcc | head -1))
 endif
diff --git a/examples/cpp/inference/spec_verify_pipeline/README.md b/examples/cpp/inference/llama_spec_pipeline/README.md
similarity index 100%
rename from examples/cpp/inference/spec_verify_pipeline/README.md
rename to examples/cpp/inference/llama_spec_pipeline/README.md
diff --git a/examples/cpp/inference/spec_verify_pipeline/llama.cc b/examples/cpp/inference/llama_spec_pipeline/llama.cc
similarity index 100%
rename from examples/cpp/inference/spec_verify_pipeline/llama.cc
rename to examples/cpp/inference/llama_spec_pipeline/llama.cc
diff --git a/examples/cpp/inference/spec_verify_pipeline/llama_rae.cc b/examples/cpp/inference/llama_spec_pipeline/llama_rae.cc
similarity index 100%
rename from examples/cpp/inference/spec_verify_pipeline/llama_rae.cc
rename to examples/cpp/inference/llama_spec_pipeline/llama_rae.cc
diff --git a/examples/cpp/inference/models/llama.cc b/examples/cpp/inference/models/llama.cc
index 46f83f8198..7686ba746d 100644
--- a/examples/cpp/inference/models/llama.cc
+++ b/examples/cpp/inference/models/llama.cc
@@ -83,11 +83,6 @@ void LLAMA::create_llama_model(FFModel &ff,
                                "_attention_norm_weight",
                            attention_norm);
 
-    // std::cout << "------before att shape";
-    // std::cout << att_norm->num_dims << "------\n";
-    // for (int i = 0; i < att_norm->num_dims; i++) {
-    //   std::cout << att_norm->dims[i] << "------\n";
-    // }
     Tensor mha;
     switch (mode) {
       case BEAM_SEARCH_MODE: {
diff --git a/examples/cpp/inference/models/opt.cc b/examples/cpp/inference/models/opt.cc
new file mode 100644
index 0000000000..52d1ed6a84
--- /dev/null
+++ b/examples/cpp/inference/models/opt.cc
@@ -0,0 +1,229 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "opt.h"
+
+namespace FlexFlow {
+
+using namespace Legion;
+
+void OPT::create_opt_model(FFModel &ff,
+                           InferenceManager &im,
+                           Config const &opt_config,
+                           int num_pipeline_stages,
+                           InferenceMode mode) {
+  //------------------------------compute machine views ------------------
+  int num_devices = ff.config.workersPerNode * ff.config.numNodes;
+  std::vector<MachineView> machine_views;
+  for (int i = 0; i < num_devices; i++) {
+    MachineView view;
+    view.device_type = MachineView::GPU;
+    view.ndims = 1;
+    view.dim[0] = 1;
+    view.stride[0] = 0;
+    view.start_device_id = i;
+    machine_views.push_back(view);
+  }
+
+  std::unordered_map<Tensor, std::vector<MachineView>> mapping;
+  std::unordered_map<std::string, Layer *> weights_layers;
+
+  //------------------------------ build the model --------------------------
+  Tensor input;
+  Tensor position_input;
+  {
+    int const token_dims[] = {BatchConfig::MAX_NUM_TOKENS, 1};
+    input = ff.create_tensor<2>(token_dims, DT_INT32);
+    position_input = ff.create_tensor<2>(token_dims, DT_INT32);
+  }
+  mapping[input].push_back(machine_views[0]);
+  mapping[position_input].push_back(machine_views[0]);
+
+  Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
+  std::vector<int> axes = {0};
+
+  Tensor token = ff.embedding(input,
+                              opt_config.vocab_size,
+                              opt_config.word_embed_proj_dim,
+                              AGGR_MODE_NONE,
+                              DT_FLOAT,
+                              NULL,
+                              embed_init);
+  Layer *embedding = ff.layers.back();
+
+  weights_layers.emplace("embed_tokens_weight", embedding);
+
+  Tensor positional_embedding = ff.embedding(position_input,
+                                             opt_config.max_position_embeddings,
+                                             opt_config.hidden_size,
+                                             AGGR_MODE_NONE,
+                                             DT_FLOAT,
+                                             NULL,
+                                             embed_init);
+  Layer *pos_embedding = ff.layers.back();
+  weights_layers.emplace("embed_positions_weight", pos_embedding);
+
+  Tensor residual = ff.add(token, positional_embedding);
+
+  int num_transformer_layers_per_stage =
+      (32 + num_pipeline_stages - 1) / num_pipeline_stages;
+
+  for (int i = 0; i < opt_config.num_hidden_layers; i++) {
+    // 125m, 1.7B, ..., 175B applies layer norm BEFORE attention,
+    // 350m applies layer norm AFTER attention
+    // https://github.com/huggingface/transformers/blob/main/src/transformers/models/opt/modeling_opt.py#LL324C1-L325C1
+    // this version is before normalization
+
+    Tensor hidden_states = ff.layer_norm(
+        residual, axes, opt_config.layer_norm_elementwise_affine, 1e-05);
+    Layer *self_attn_layer_norm = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) +
+                               "_self_attn_layer_norm_weight",
+                           self_attn_layer_norm);
+
+    if (i % num_transformer_layers_per_stage == 0) {
+      mapping[hidden_states].push_back(
+          machine_views[i / num_transformer_layers_per_stage]);
+    }
+
+    Tensor mha;
+    switch (mode) {
+      case BEAM_SEARCH_MODE: {
+        mha = ff.spec_inc_multihead_self_attention(
+            hidden_states,
+            opt_config.hidden_size,
+            opt_config.num_attention_heads,
+            opt_config.hidden_size / opt_config.num_attention_heads,
+            opt_config.hidden_size / opt_config.num_attention_heads,
+            0.0f,
+            true,
+            false,
+            false,
+            NULL,
+            false,
+            /*scaling query*/ true,
+            /*sacling factor*/
+            pow((opt_config.hidden_size / opt_config.num_attention_heads),
+                -0.5),
+            /*qk_prod_scaling*/ false);
+        break;
+      }
+      case TREE_VERIFY_MODE: {
+        mha = ff.inc_multihead_self_attention_verify(
+            hidden_states,
+            opt_config.hidden_size,
+            opt_config.num_attention_heads,
+            opt_config.hidden_size / opt_config.num_attention_heads,
+            opt_config.hidden_size / opt_config.num_attention_heads,
+            0.0f,
+            true,
+            false,
+            false,
+            NULL,
+            false,
+            /*scaling query*/ true,
+            /*sacling factor*/
+            pow((opt_config.hidden_size / opt_config.num_attention_heads),
+                -0.5),
+            /*qk_prod_scaling*/ false);
+        break;
+      }
+      case INC_DECODING_MODE: {
+        mha = ff.inc_multihead_self_attention(
+            hidden_states,
+            opt_config.hidden_size,
+            opt_config.num_attention_heads,
+            opt_config.hidden_size / opt_config.num_attention_heads,
+            opt_config.hidden_size / opt_config.num_attention_heads,
+            0.0f,
+            true,
+            false,
+            false,
+            NULL,
+            false,
+            /*scaling query*/ true,
+            /*sacling factor*/
+            pow((opt_config.hidden_size / opt_config.num_attention_heads),
+                -0.5),
+            /*qk_prod_scaling*/ false);
+        break;
+      }
+      default: {
+        assert(false);
+      }
+    }
+
+    Layer *attention_layer = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) + "_attention_weight",
+                           attention_layer);
+
+    Tensor added = ff.add(mha, residual);
+
+    Tensor final_norm = ff.layer_norm(
+        added, axes, opt_config.layer_norm_elementwise_affine, 1e-05);
+    Layer *final_layer_norm = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) +
+                               "_final_layer_norm_weight",
+                           final_layer_norm);
+
+    //--------linear fc1 fc2 ----------
+    Tensor fc1 = ff.dense(final_norm, opt_config.ffn_dim, AC_MODE_NONE, true);
+    Layer *fc1_linear = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) + "_fc1_weight",
+                           fc1_linear);
+    Tensor activation = ff.relu(fc1, false);
+
+    Tensor fc2 =
+        ff.dense(activation, opt_config.hidden_size, AC_MODE_NONE, true);
+    Layer *fc2_linear = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) + "_fc2_weight",
+                           fc2_linear);
+    residual = ff.add(added, fc2);
+  }
+
+  // final
+  Tensor all_final_norm = ff.layer_norm(
+      residual, axes, opt_config.layer_norm_elementwise_affine, 1e-05);
+  Layer *all_final_norm_layer = ff.layers.back();
+  weights_layers.emplace("final_layer_norm_weight", all_final_norm_layer);
+
+  Tensor lm_head =
+      ff.dense(all_final_norm, opt_config.vocab_size, AC_MODE_NONE, false);
+  Layer *lm_head_layer = ff.layers.back();
+  weights_layers.emplace("embed_tokens_weight_lm_head", lm_head_layer);
+
+  Tensor output;
+  if (mode == BEAM_SEARCH_MODE) {
+    Tensor softmax = ff.softmax(lm_head, -1);
+    output = ff.beam_top_k(softmax, opt_config.max_beam_width, false);
+  } else {
+    output = ff.arg_top_k(lm_head, /*k=*/1, false);
+  }
+
+  //------------------- compile the model --------------------------------
+  std::cout << "------start compile ----------" << std::endl;
+  im.compile_model_and_allocate_buffer(&ff, mapping);
+  FileDataLoader fileloader(opt_config.input_path,
+                            opt_config.weight_file_path,
+                            opt_config.num_attention_heads,
+                            opt_config.hidden_size,
+                            opt_config.hidden_size /
+                                opt_config.num_attention_heads);
+  fileloader.load_weights(&ff, weights_layers);
+  std::cout << "------load wieght finished----------" << std::endl;
+  im.init_operators_inference(&ff);
+}
+
+}; // namespace FlexFlow
diff --git a/examples/cpp/inference/models/opt.h b/examples/cpp/inference/models/opt.h
new file mode 100644
index 0000000000..11ae888eba
--- /dev/null
+++ b/examples/cpp/inference/models/opt.h
@@ -0,0 +1,65 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+#pragma once
+
+#include "file_loader.h"
+#include "flexflow/batch_config.h"
+#include "flexflow/inference.h"
+
+namespace FlexFlow {
+
+class OPT {
+public:
+  struct Config {
+    Config(void) {
+      vocab_size = 50272, word_embed_proj_dim = 768, hidden_size = 768;
+      max_position_embeddings = 2048;
+      layer_norm_elementwise_affine = true;
+      num_attention_heads = 12;
+      dropout = 0.1;
+      seed = 3;
+      ffn_dim = 3072;
+      num_hidden_layers = 12;
+      max_beam_width = 1;
+      batchSize = 8;
+      sentence_len = 100;
+      max_beam_depth = 4;
+    }
+    int vocab_size;
+    int word_embed_proj_dim;
+    int hidden_size;
+    int num_attention_heads;
+    std::string input_path;
+    std::string weight_file_path;
+    int max_position_embeddings;
+    bool layer_norm_elementwise_affine;
+    float dropout;
+    unsigned long long seed;
+    int ffn_dim;
+    int num_hidden_layers;
+    int max_beam_width;
+    int batchSize;
+    int sentence_len;
+    int max_beam_depth;
+  };
+
+  static void create_opt_model(FFModel &ff,
+                               InferenceManager &im,
+                               Config const &opt_config,
+                               int num_pipeline_stages,
+                               InferenceMode mode);
+};
+
+}; // namespace FlexFlow
diff --git a/examples/cpp/inference/opt/opt.cc b/examples/cpp/inference/opt/opt.cc
index c2932df926..453633c383 100644
--- a/examples/cpp/inference/opt/opt.cc
+++ b/examples/cpp/inference/opt/opt.cc
@@ -21,6 +21,16 @@ using namespace Legion;
 
 LegionRuntime::Logger::Category log_app("opt");
 
+void parse_input_args(char **argv, int argc, OptConfig &config) {
+  for (int i = 1; i < argc; i++) {
+    // weights
+    if (!strcmp(argv[i], "--weights")) {
+      config.weight_file_path = std::string(argv[++i]);
+      continue;
+    }
+  }
+}
+
 void FlexFlow::top_level_task(Task const *task,
                               std::vector<PhysicalRegion> const &regions,
                               Context ctx,
@@ -28,6 +38,12 @@ void FlexFlow::top_level_task(Task const *task,
   FFConfig ffconfig;
   OptConfig optConfig;
   FFModel ff(ffconfig);
+
+  InputArgs const &command_args = HighLevelRuntime::get_input_args();
+  char **argv = command_args.argv;
+  int argc = command_args.argc;
+  parse_input_args(argv, argc, optConfig);
+
   //------------------------------compute machine views ------------------
   int num_devices = ffconfig.workersPerNode * ffconfig.numNodes;
   std::vector<MachineView> machine_views;
@@ -48,7 +64,7 @@ void FlexFlow::top_level_task(Task const *task,
   Tensor input;
   Tensor position_input;
   {
-    int const token_dims[] = {1, 9};
+    int const token_dims[] = {BatchConfig::MAX_NUM_TOKENS, 1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
     position_input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
@@ -180,7 +196,7 @@ void FlexFlow::top_level_task(Task const *task,
                                 optConfig.num_attention_heads);
   //"Today is a beautiful day and I want"
   std::vector<int> prompt = {2, 5625, 16, 10, 2721, 183, 8, 38, 236};
-  rm.register_new_request(prompt, 20);
+  rm.register_new_request(prompt, 30);
   fileloader.load_weights(&ff, weights_layers);
 
   im.init_operators_inference(&ff);
diff --git a/examples/cpp/inference/opt/opt.h b/examples/cpp/inference/opt/opt.h
index d581b73df9..6b9a45f2d5 100644
--- a/examples/cpp/inference/opt/opt.h
+++ b/examples/cpp/inference/opt/opt.h
@@ -17,30 +17,6 @@
 
 #include "file_loader.h"
 #include "inference_config.h"
-// # OPTConfig {
-// #   "_remove_final_layer_norm": false,
-// #   "activation_function": "relu",
-// #   "attention_dropout": 0.0,
-// #   "bos_token_id": 2,
-// #   "do_layer_norm_before": true,
-// #   "dropout": 0.1,
-// #   "enable_bias": true,
-// #   "eos_token_id": 2,
-// #   "ffn_dim": 3072,
-// #   "hidden_size": 768,
-// #   "init_std": 0.02,
-// #   "layer_norm_elementwise_affine": true,
-// #   "layerdrop": 0.0,
-// #   "max_position_embeddings": 2048,
-// #   "model_type": "opt",
-// #   "num_attention_heads": 12,
-// #   "num_hidden_layers": 12,
-// #   "pad_token_id": 1,
-// #   "transformers_version": "4.27.2",
-// #   "use_cache": true,
-// #   "vocab_size": 50272,
-// #   "word_embed_proj_dim": 768
-// # }
 struct OptConfig : InferenceConfig {
   OptConfig(void) : InferenceConfig() {
     vocab_size = 50272, word_embed_proj_dim = 768, hidden_size = 768;
@@ -51,8 +27,6 @@ struct OptConfig : InferenceConfig {
     seed = 3;
     ffn_dim = 3072;
     num_hidden_layers = 12;
-    weight_file_path =
-        "/home/ubuntu/FlexFlow/examples/cpp/inference/opt/weights/";
   }
   int word_embed_proj_dim;
   std::string input_path;
diff --git a/examples/cpp/inference/opt/opt_baseline.py b/examples/cpp/inference/opt/opt_baseline.py
index 5574af259a..3e8d7499f0 100644
--- a/examples/cpp/inference/opt/opt_baseline.py
+++ b/examples/cpp/inference/opt/opt_baseline.py
@@ -11,13 +11,13 @@
 for prompt in prompts:
     input_ids = tokenizer(prompt, return_tensors="pt", padding=True).input_ids
     print(input_ids)
-    generated_ids = model.generate(input_ids, max_length=20)
+    generated_ids = model.generate(input_ids, max_length=30)
     generated_string = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)
     print(generated_ids)
     print(generated_string)
 
 #get same results with this and opt.cc
-
-# tensor([[   2, 5625,   16,   10, 2721,  183,    8,   38,  236,    7,  458,   19,
-        #    47,    5, 2770,  527,    9,  127,   78,  655]])
-# 2, 5625, 16, 10, 2721, 183, 8, 38, 236, 7, 458, 19, 47, 5, 2770, 527, 9, 127, 78, 655
\ No newline at end of file
+# tensor([[    2,  5625,    16,    10,  2721,   183,     8,    38,   236,     7,
+#            458,    19,    47,     5,  2770,   527,     9,   127,    78,   655,
+#           1805,     7,     5,  4105,     4, 50118,   100,    21,    98,  2283]])
+# 2, 5625, 16, 10, 2721, 183, 8, 38, 236, 7, 458, 19, 47, 5, 2770, 527, 9, 127, 78, 655, 1805, 7, 5, 4105, 4, 50118, 100, 21, 98, 2283,
\ No newline at end of file
diff --git a/examples/cpp/inference/opt_spec_pipeline/CMakeLists.txt b/examples/cpp/inference/opt_spec_pipeline/CMakeLists.txt
new file mode 100644
index 0000000000..7bab587713
--- /dev/null
+++ b/examples/cpp/inference/opt_spec_pipeline/CMakeLists.txt
@@ -0,0 +1,20 @@
+cmake_minimum_required(VERSION 3.10)
+
+project(FlexFlowExample_opt_pipeline)
+set(project_target opt_pipeline)
+
+
+set(CPU_SRC
+  ${FLEXFLOW_CPP_DRV_SRC}
+  opt_pipeline.cc
+  ../file_loader.cc
+  ../models/opt.cc)
+
+
+cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
+target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
+target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/examples/cpp/inference)
+target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
+
+set(BIN_DEST "bin")
+install(TARGETS ${project_target} DESTINATION ${BIN_DEST})
diff --git a/examples/cpp/inference/opt_spec_pipeline/Makefile b/examples/cpp/inference/opt_spec_pipeline/Makefile
new file mode 100644
index 0000000000..b4a7866073
--- /dev/null
+++ b/examples/cpp/inference/opt_spec_pipeline/Makefile
@@ -0,0 +1,37 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+#
+
+# Flags for directing the runtime makefile what to include
+DEBUG           ?= 0		# Include debugging symbols
+MAX_DIM         ?= 4		# Maximum number of dimensions
+OUTPUT_LEVEL    ?= LEVEL_DEBUG	# Compile time logging level
+USE_CUDA        ?= 1		# Include CUDA support (requires CUDA)
+USE_GASNET      ?= 0		# Include GASNet support (requires GASNet)
+USE_HDF         ?= 1		# Include HDF5 support (requires HDF5)
+ALT_MAPPERS     ?= 0		# Include alternative mappers (not recommended)
+
+# Put the binary file name here
+OUTFILE		?= opt_pipeline
+# List all the application source files here
+ifndef CUDA_HOME
+CUDA_HOME = $(patsubst %/bin/nvcc,%,$(shell which nvcc | head -1))
+endif
+
+
+ifndef FF_HOME
+$(error FF_HOME variable is not defined, aborting build)
+endif
+
+include $(FF_HOME)/FlexFlow.mk
diff --git a/examples/cpp/inference/opt_spec_pipeline/opt_pipeline.cc b/examples/cpp/inference/opt_spec_pipeline/opt_pipeline.cc
new file mode 100644
index 0000000000..a1f50e230d
--- /dev/null
+++ b/examples/cpp/inference/opt_spec_pipeline/opt_pipeline.cc
@@ -0,0 +1,189 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/inference.h"
+#include "models/opt.h"
+
+using namespace Legion;
+
+LegionRuntime::Logger::Category log_app("opt");
+
+void parse_input_args(char **argv, int argc, OPT::Config &config) {
+  for (int i = 1; i < argc; i++) {
+    // weights
+    if (!strcmp(argv[i], "--weights")) {
+      config.weight_file_path = std::string(argv[++i]);
+      continue;
+    }
+  }
+}
+
+void FlexFlow::top_level_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  FFConfig ffconfig;
+  OPT::Config opt_config;
+
+  InputArgs const &command_args = HighLevelRuntime::get_input_args();
+  char **argv = command_args.argv;
+  int argc = command_args.argc;
+  parse_input_args(argv, argc, opt_config);
+  InferenceManager im(ffconfig, opt_config.batchSize, 1);
+  RequestManager rm;
+  // Add a single request
+  std::vector<BatchConfig::TokenId> prompt = {
+      2, 5625, 16, 10, 2721, 183, 8, 38, 236};
+  rm.register_new_request(prompt, opt_config.sentence_len);
+
+  FFModel beam_model(ffconfig), tree_model(ffconfig);
+  OPT::create_opt_model(beam_model, im, opt_config, 1, BEAM_SEARCH_MODE);
+  OPT::create_opt_model(tree_model, im, opt_config, 1, TREE_VERIFY_MODE);
+
+  // entry---------------------------
+  int depth = 0;
+  std::map<int, Future> beam_future_handlers, tree_future_handler;
+  std::map<int, BeamSearchBatchConfig> beam_batch_configs;
+  std::map<int, TreeVerifyBatchConfig> tree_batch_configs;
+
+  bool new_req = true;
+  TreeVerifyBatchConfig tree_bc;
+
+  int iteration = 0;
+
+  while (depth < opt_config.max_beam_depth) {
+    int bid = 0;
+    if (beam_future_handlers.find(bid) == beam_future_handlers.end()) {
+      BeamSearchBatchConfig bc;
+      InferenceResult ir;
+      bc = rm.prepare_next_batch_init(tree_bc, ir);
+
+      std::cout << "sub_requests: " << bc.sub_requests[0] << "\n";
+      FutureMap fm = im.inference(&beam_model, bid, bc);
+      assert(fm.get_future_map_domain().get_volume() == 1);
+      beam_future_handlers[bid] = fm.get_future(0);
+      beam_batch_configs[bid] = bc;
+    } else {
+      // have luanched this bid
+      Future future = beam_future_handlers[bid];
+      if (!future.is_ready(true /*subscribe*/)) {
+        continue;
+      } else {
+        std::cout << "future is ready...." << std::endl;
+      }
+      // process end
+      BeamInferenceResult ir = future.get_result<BeamInferenceResult>();
+      BeamSearchBatchConfig bc = beam_batch_configs[bid];
+      depth = bc.beamRequestsInfo[0].current_depth;
+      bc = rm.prepare_next_batch_beam(bc, ir);
+
+      std::cout << "opt current depth: " << depth << std::endl;
+      std::cout << "sub_requests: " << bc.sub_requests[0] << "\n";
+      FutureMap fm = im.inference(&beam_model, bid, bc);
+      assert(fm.get_future_map_domain().get_volume() == 1);
+      beam_future_handlers[bid] = fm.get_future(0);
+      beam_batch_configs[bid] = bc;
+
+      // tranverse the tree in dfs order;
+      if (depth >= opt_config.max_beam_depth) {
+
+        printf("\n\n ------Final Beam Search Batch------\n");
+        printf("[Beam] num_tokens: %d\n", bc.num_tokens);
+        for (int i = 0; i < bc.num_tokens; i++) {
+          std::cout << "[Token] Request Index: "
+                    << bc.tokensInfo[i].request_index
+                    << ", Abs Depth: " << bc.tokensInfo[i].abs_depth_in_request
+                    << ", Token Id: " << bc.tokensInfo[i].token_id << "\n";
+        }
+
+        // printf("\n\n prepare tree_bc from final beam search bc\n");
+        tree_bc = rm.prepare_next_batch_verify(bc);
+
+        printf("\n\n\n ------Tree Verify Batch-------\n");
+        // should have the same content as the hardcoded verification block
+        // below right now, it only contains the prompt need to add in the beam
+        // search result
+
+        printf("[Verify] num_tokens : %d\n", tree_bc.num_tokens);
+        printf("[Verify] num_tokens_in_batch: %d\n",
+               tree_bc.requestsInfo[0].num_tokens_in_batch);
+        printf("------------------------------\n");
+
+        for (int i = 0; i < tree_bc.num_tokens; i++) {
+          std::cout << "[Token] Request Index: "
+                    << tree_bc.tokensInfo[i].request_index << ", Abs Depth: "
+                    << tree_bc.tokensInfo[i].abs_depth_in_request
+                    << ", Token Id: " << tree_bc.tokensInfo[i].token_id << "\n";
+        }
+
+        printf("\n\n ------Commit Verified Tokens-------\n");
+        for (int i = 0; i < tree_bc.num_tokens_to_commit; i++) {
+          std::cout << "[Commit] Request Index: "
+                    << tree_bc.commited_tokens[i].request_index
+                    << ", Abs Depth: " << tree_bc.commited_tokens[i].token_depth
+                    << ", Token Index in batch: "
+                    << tree_bc.commited_tokens[i].token_index << "\n";
+        }
+
+        FutureMap fm = im.inference(&tree_model, 0, tree_bc);
+        assert(fm.get_future_map_domain().get_volume() == 1);
+        Future future = fm.get_future(0);
+        InferenceResult ir = future.get_result<InferenceResult>();
+        for (int i = 0; i < tree_bc.num_tokens; i++) {
+          if (i == 7) {
+            std::cout << "------------------\n";
+          }
+          printf("verify_tokens[%d] = %d\n", i, ir.token_ids[i]);
+        }
+
+        std::cout << "------Init New Beam Search Batch------\n";
+        bc = rm.prepare_next_batch_init(tree_bc, ir);
+        std::cout << "[Init] num_tokens: " << bc.num_tokens << "\n";
+        for (int i = 0; i < bc.num_tokens; i++) {
+          std::cout << "[Token] Request Index: "
+                    << bc.tokensInfo[i].request_index
+                    << ", Abs Depth: " << bc.tokensInfo[i].abs_depth_in_request
+                    << ", Token Id: " << bc.tokensInfo[i].token_id << "\n";
+        }
+        std::cout << "Batch Depth: " << bc.beamRequestsInfo[0].current_depth
+                  << "\n";
+
+        iteration++;
+
+        if (iteration < 4) {
+          std::cout << "\n\n~~~~~~~~~~teration " << iteration << "~~~~~~~~~~\n";
+          depth = bc.beamRequestsInfo[0].current_depth;
+          fm = im.inference(&beam_model, bid, bc);
+          assert(fm.get_future_map_domain().get_volume() == 1);
+          beam_future_handlers[bid] = fm.get_future(0);
+          beam_batch_configs[bid] = bc;
+        } else {
+          break;
+        }
+      }
+    }
+  }
+
+  // Execution fence
+  {
+    Future future = runtime->issue_execution_fence(ctx);
+    future.get_void_result();
+  }
+
+  // float* data
+  std::cout << "----------inference finished--------------" << std::endl;
+}
+
+void FlexFlow::register_custom_tasks() {}
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index a246cf37c3..e406b1af29 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -628,11 +628,14 @@ class FFModel {
                                         int kdim = 0,
                                         int vdim = 0,
                                         float dropout = 0.0f,
-                                        bool bias = true,
+                                        bool bias = false,
                                         bool add_bias_kv = false,
                                         bool add_zero_attn = false,
                                         Initializer *kernel_initializer = NULL,
                                         bool apply_rotary_embedding = false,
+                                        bool scaling_query = false,
+                                        float scaling_factor = 1.0f,
+                                        bool qk_prod_scaling = true,
                                         char const *name = NULL);
   Tensor inc_multihead_self_attention_verify(
       const Tensor input,
@@ -641,11 +644,14 @@ class FFModel {
       int kdim = 0,
       int vdim = 0,
       float dropout = 0.0f,
-      bool bias = true,
+      bool bias = false,
       bool add_bias_kv = false,
       bool add_zero_attn = false,
       Initializer *kernel_initializer = NULL,
       bool apply_rotary_embedding = false,
+      bool scaling_query = false,
+      float scaling_factor = 1.0f,
+      bool qk_prod_scaling = true,
       char const *name = NULL);
 
   Tensor create_tensor_legion_ordering(int num_dim,
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention.h b/include/flexflow/ops/spec_inc_multihead_self_attention.h
index 4df85cd04e..4acab0a6ab 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention.h
@@ -34,6 +34,9 @@ class SpecIncMultiHeadSelfAttention : public Op {
                                 bool _add_bias_kv,
                                 bool _add_zero_attn,
                                 bool _apply_rotary_embedding,
+                                bool _scaling_query,
+                                float _scaling_factor,
+                                bool _qk_prod_scaling,
                                 bool allocate_weights,
                                 char const *name);
   SpecIncMultiHeadSelfAttention(FFModel &model,
@@ -48,6 +51,9 @@ class SpecIncMultiHeadSelfAttention : public Op {
                                 bool _add_bias_kv,
                                 bool _add_zero_attn,
                                 bool _apply_rotary_embedding,
+                                bool _scaling_query,
+                                float _scaling_factor,
+                                bool _qk_prod_scaling,
                                 bool allocate_weights,
                                 char const *name);
   SpecIncMultiHeadSelfAttention(FFModel &model,
@@ -100,14 +106,16 @@ class SpecIncMultiHeadSelfAttention : public Op {
                                BeamSearchBatchConfig const *bc,
                                float const *input_ptr,
                                float const *weight_ptr,
-                               float *output_ptr);
+                               float *output_ptr,
+                               float const *bias_ptr);
   Params get_params() const;
 
 public:
   int num_heads;
-  float dropout;
+  float dropout, scaling_factor;
   bool bias;
-  bool add_bias_kv, add_zero_attn, apply_rotary_embedding;
+  bool add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
+      qk_prod_scaling;
   int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
   int qoSeqLength, kvSeqLength;
 };
@@ -129,6 +137,10 @@ class SpecIncMultiHeadSelfAttentionMeta : public OpMeta {
   int num_heads;
   bool *has_load_weights;
   bool *apply_rotary_embedding;
+  bool *bias;
+  bool *scaling_query;
+  bool *qk_prod_scaling;
+  float scaling_factor;
 #ifdef INFERENCE_TESTS
   float *kcache, *vcache;
 #endif
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention_params.h b/include/flexflow/ops/spec_inc_multihead_self_attention_params.h
index 00e1179a14..5995e95fe1 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention_params.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention_params.h
@@ -9,8 +9,9 @@ namespace FlexFlow {
 struct SpecIncMultiHeadSelfAttentionParams {
   LayerID layer_guid;
   int embed_dim, num_heads, kdim, vdim;
-  float dropout;
-  bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding;
+  float dropout, scaling_factor;
+  bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
+      qk_prod_scaling;
 
   bool is_valid(ParallelTensorShape const &) const;
 };
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention.h b/include/flexflow/ops/tree_inc_multihead_self_attention.h
index 61e7b69fe9..0e54bd50d0 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention.h
@@ -34,6 +34,9 @@ class TreeIncMultiHeadSelfAttention : public Op {
                                 bool _add_bias_kv,
                                 bool _add_zero_attn,
                                 bool _apply_rotary_embedding,
+                                bool _scaling_query,
+                                float _scaling_factor,
+                                bool _qk_prod_scaling,
                                 bool allocate_weights,
                                 char const *name);
   TreeIncMultiHeadSelfAttention(FFModel &model,
@@ -48,6 +51,9 @@ class TreeIncMultiHeadSelfAttention : public Op {
                                 bool _add_bias_kv,
                                 bool _add_zero_attn,
                                 bool _apply_rotary_embedding,
+                                bool _scaling_query,
+                                float _scaling_factor,
+                                bool _qk_prod_scaling,
                                 bool allocate_weights,
                                 char const *name);
   TreeIncMultiHeadSelfAttention(FFModel &model,
@@ -96,14 +102,16 @@ class TreeIncMultiHeadSelfAttention : public Op {
                                        TreeVerifyBatchConfig const *bc,
                                        float const *input_ptr,
                                        float const *weight_ptr,
-                                       float *output_ptr);
+                                       float *output_ptr,
+                                       float const *bias_ptr);
   Params get_params() const;
 
 public:
   int num_heads;
-  float dropout;
+  float dropout, scaling_factor;
   bool bias;
-  bool add_bias_kv, add_zero_attn, apply_rotary_embedding;
+  bool add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
+      qk_prod_scaling;
   int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
   int qoSeqLength, kvSeqLength;
 };
@@ -126,6 +134,10 @@ class TreeIncMultiHeadSelfAttentionMeta : public OpMeta {
   int num_active_tokens;
   bool *has_load_weights;
   bool *apply_rotary_embedding;
+  bool *bias;
+  bool *scaling_query;
+  bool *qk_prod_scaling;
+  float scaling_factor;
 #ifdef INFERENCE_TESTS
   float *kcache, *vcache;
 #endif
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention_params.h b/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
index 7a4a258850..f8fbac7e8e 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
@@ -9,8 +9,9 @@ namespace FlexFlow {
 struct TreeIncMultiHeadSelfAttentionParams {
   LayerID layer_guid;
   int embed_dim, num_heads, kdim, vdim;
-  float dropout;
-  bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding;
+  float dropout, scaling_factor;
+  bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
+      qk_prod_scaling;
 
   bool is_valid(ParallelTensorShape const &) const;
 };
diff --git a/src/ops/spec_inc_multihead_self_attention.cc b/src/ops/spec_inc_multihead_self_attention.cc
index 11911a9ba3..a764fbe8fa 100644
--- a/src/ops/spec_inc_multihead_self_attention.cc
+++ b/src/ops/spec_inc_multihead_self_attention.cc
@@ -66,14 +66,18 @@ Tensor
                                                bool add_zero_attn,
                                                Initializer *kernel_initializer,
                                                bool apply_rotary_embedding,
+                                               bool scaling_query,
+                                               float scaling_factor,
+                                               bool qk_prod_scaling,
                                                char const *name) {
   // Currently assume that
+  int weight_num = bias ? 2 : 1;
   Layer *li = new Layer(this,
                         OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION,
                         DT_FLOAT,
                         name,
                         1 /*inputs*/,
-                        1 /*weights*/,
+                        weight_num /*weights*/,
                         1 /*outputs*/,
                         input);
   {
@@ -104,6 +108,17 @@ Tensor
                                                    kernel_initializer,
                                                    CHOSEN_SYNC_TYPE);
   }
+  if (bias) {
+    // q, k, v, o
+    int dims[1] = {embed_dim * 4};
+    li->weights[1] = create_weight_legion_ordering(1,
+                                                   dims,
+                                                   DT_FLOAT,
+                                                   li,
+                                                   true /*create_grad*/,
+                                                   kernel_initializer,
+                                                   CHOSEN_SYNC_TYPE);
+  }
   li->data_type = DT_FLOAT;
   li->add_int_property("embed_dim", embed_dim);
   li->add_int_property("num_heads", num_heads);
@@ -114,6 +129,9 @@ Tensor
   li->add_int_property("add_zero_attn", add_zero_attn);
   li->add_float_property("dropout", dropout);
   li->add_int_property("apply_rotary_embedding", apply_rotary_embedding);
+  li->add_int_property("scaling_query", scaling_query);
+  li->add_float_property("scaling_factor", scaling_factor);
+  li->add_int_property("qk_prod_scaling", qk_prod_scaling);
   layers.push_back(li);
   return li->outputs[0];
 }
@@ -143,6 +161,12 @@ Op *SpecIncMultiHeadSelfAttention::create_operator_from_layer(
   bool add_zero_attn = (bool)value;
   layer->get_int_property("apply_rotary_embedding", value);
   bool apply_rotary_embedding = (bool)value;
+  layer->get_int_property("scaling_query", value);
+  bool scaling_query = (bool)value;
+  float scaling_factor;
+  layer->get_float_property("scaling_factor", scaling_factor);
+  layer->get_int_property("qk_prod_scaling", value);
+  bool qk_prod_scaling = (bool)value;
   return new SpecIncMultiHeadSelfAttention(model,
                                            layer->layer_guid,
                                            inputs[0],
@@ -155,6 +179,9 @@ Op *SpecIncMultiHeadSelfAttention::create_operator_from_layer(
                                            add_bias_kv,
                                            add_zero_attn,
                                            apply_rotary_embedding,
+                                           scaling_query,
+                                           scaling_factor,
+                                           qk_prod_scaling,
                                            false /*allocate_weights*/,
                                            layer->name);
 }
@@ -172,6 +199,9 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     bool _add_bias_kv,
     bool _add_zero_attn,
     bool _apply_rotary_embedding,
+    bool _scaling_query,
+    float _scaling_factor,
+    bool _qk_prod_scaling,
     bool allocate_weights,
     char const *name)
     // Initializer* _bias_initializer)
@@ -180,7 +210,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
          DT_FLOAT,
          name,
          1 /*inputs*/,
-         1 /*weights*/,
+         (_bias ? 2 : 1) /*weights*/,
          1 /*outputs*/,
          _input),
       num_heads(_num_heads), dropout(_dropout), bias(_bias),
@@ -189,7 +219,9 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
       vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
       vProjSize(_vdim), oProjSize(_embed_dim),
-      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size) {
+      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
+      scaling_query(_scaling_query), scaling_factor(_scaling_factor),
+      qk_prod_scaling(_qk_prod_scaling) {
   // overwrite layer_guid
   layer_guid = _layer_guid;
 
@@ -233,7 +265,26 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
                                                  initializer,
                                                  comm_type);
   }
-
+  if (bias) {
+    ParallelDim dims[2];
+    int num_dims = inputs[0]->num_dims;
+    dims[0] = inputs[0]->dims[num_dims - 1];
+    dims[0].size = dims[0].degree;
+    dims[1].size = oProjSize * 4;
+    dims[1].degree = 1;
+    dims[1].parallel_idx = -1;
+#ifdef USE_NCCL
+    ParameterSyncType comm_type = ParameterSyncType::NCCL;
+#else
+    ParameterSyncType comm_type = ParameterSyncType::PS;
+#endif
+    weights[1] = model.create_parallel_weight<2>(dims,
+                                                 DT_FLOAT,
+                                                 NULL /*owner_op*/,
+                                                 true /*create_grad*/,
+                                                 NULL,
+                                                 comm_type);
+  }
   outputs[0] = model.create_parallel_tensor_legion_ordering(
       _input->num_dims, dims, DT_FLOAT, this);
   /* for (int i = 0; i < numdim; i++) { */
@@ -256,6 +307,9 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     bool _add_bias_kv,
     bool _add_zero_attn,
     bool _apply_rotary_embedding,
+    bool _scaling_query,
+    float _scaling_factor,
+    bool _qk_prod_scaling,
     bool allocate_weights,
     char const *name)
     // Initializer* _bias_initializer)
@@ -264,7 +318,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
          DT_FLOAT,
          name,
          1 /*inputs*/,
-         1 /*weights*/,
+         (_bias ? 2 : 1) /*weights*/,
          1 /*outputs*/,
          _input,
          _weight),
@@ -274,7 +328,9 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
       vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
       vProjSize(_vdim), oProjSize(_embed_dim),
-      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size)
+      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
+      scaling_query(_scaling_query), scaling_factor(_scaling_factor),
+      qk_prod_scaling(_qk_prod_scaling)
 // bias_initializer(_bias_initializer)
 {
   numOutputs = 1;
@@ -315,6 +371,24 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
                                                  initializer,
                                                  comm_type);
   }
+  if (bias) {
+    ParallelDim dims[2];
+    int num_dims = inputs[0]->num_dims;
+    dims[0] = inputs[0]->dims[num_dims - 1];
+    dims[0].size = dims[0].degree;
+    dims[1].size = oProjSize * 4;
+#ifdef USE_NCCL
+    ParameterSyncType comm_type = ParameterSyncType::NCCL;
+#else
+    ParameterSyncType comm_type = ParameterSyncType::PS;
+#endif
+    weights[1] = model.create_parallel_weight<2>(dims,
+                                                 DT_FLOAT,
+                                                 NULL /*owner_op*/,
+                                                 true /*create_grad*/,
+                                                 NULL,
+                                                 comm_type);
+  }
   outputs[0] = model.create_parallel_tensor_legion_ordering(
       _input->num_dims, dims, DT_FLOAT, this);
 
@@ -344,6 +418,9 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
                                     other.add_bias_kv,
                                     other.add_zero_attn,
                                     other.apply_rotary_embedding,
+                                    other.scaling_query,
+                                    other.scaling_factor,
+                                    other.qk_prod_scaling,
                                     allocate_weights,
                                     other.name) {}
 
@@ -365,6 +442,9 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
                                     params.add_bias_kv,
                                     params.add_zero_attn,
                                     params.apply_rotary_embedding,
+                                    params.scaling_query,
+                                    params.scaling_factor,
+                                    params.qk_prod_scaling,
                                     allocate_weights,
                                     name) {}
 
@@ -537,6 +617,15 @@ FutureMap SpecIncMultiHeadSelfAttention::inference(
                                                     EXCLUSIVE,
                                                     batch_outputs[0]->region));
   launcher.add_field(idx++, FID_DATA);
+
+  if (bias) {
+    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[1]->region));
+    launcher.add_field(idx++, FID_DATA);
+  }
   return runtime->execute_index_space(ctx, launcher);
 }
 
@@ -550,12 +639,13 @@ void SpecIncMultiHeadSelfAttention::inference_task(
     std::vector<PhysicalRegion> const &regions,
     Context ctx,
     Runtime *runtime) {
-  assert(regions.size() == 3);
   assert(task->regions.size() == regions.size());
+  float const *bias_ptr = NULL;
 
   BeamSearchBatchConfig const *bc = (BeamSearchBatchConfig *)task->args;
   SpecIncMultiHeadSelfAttentionMeta const *m =
       *((SpecIncMultiHeadSelfAttentionMeta **)task->local_args);
+  assert((*m->bias ? regions.size() == 4 : regions.size() == 3));
 
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
@@ -564,6 +654,19 @@ void SpecIncMultiHeadSelfAttention::inference_task(
   GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
       m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
 
+  if (*m->bias) {
+    GenericTensorAccessorR biases =
+        helperGetGenericTensorAccessorRO(m->weight_type[1],
+                                         regions[3],
+                                         task->regions[3],
+                                         FID_DATA,
+                                         ctx,
+                                         runtime);
+    Domain bias_domain = runtime->get_index_space_domain(
+        ctx, task->regions[3].region.get_index_space());
+    assert(bias_domain.get_dim() == 2);
+    bias_ptr = biases.get_float_ptr();
+  }
   Domain input_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
   Domain weight_domain = runtime->get_index_space_domain(
@@ -575,15 +678,13 @@ void SpecIncMultiHeadSelfAttention::inference_task(
   assert(weight_domain.get_dim() == 3);
   assert(output_domain.get_dim() == 4);
 
-  /* print_tensor<float>(input.get_float_ptr(),
-                      input_domain.get_volume(),
-                      "[Attention:forward:query]"); */
   SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
       m,
       bc,
       input.get_float_ptr(),
       weight.get_float_ptr(),
-      output.get_float_ptr());
+      output.get_float_ptr(),
+      bias_ptr);
 
   // print_tensor<float>(input.get_float_ptr(), 20, "attention input");
   // print_tensor<float>(output.get_float_ptr(), 20, "attention output");
@@ -630,7 +731,10 @@ bool operator==(SpecIncMultiHeadSelfAttentionParams const &lhs,
          lhs.vdim == rhs.vdim && lhs.dropout == rhs.dropout &&
          lhs.bias == rhs.bias && lhs.add_bias_kv == rhs.add_bias_kv &&
          lhs.add_zero_attn == rhs.add_zero_attn &&
-         lhs.apply_rotary_embedding == rhs.apply_rotary_embedding;
+         lhs.apply_rotary_embedding == rhs.apply_rotary_embedding &&
+         lhs.scaling_query == rhs.scaling_query &&
+         lhs.scaling_factor == rhs.scaling_factor &&
+         lhs.qk_prod_scaling == rhs.qk_prod_scaling;
 }
 
 SpecIncMultiHeadSelfAttentionParams
@@ -646,6 +750,9 @@ SpecIncMultiHeadSelfAttentionParams
   params.add_bias_kv = this->add_bias_kv;
   params.add_zero_attn = this->add_zero_attn;
   params.apply_rotary_embedding = this->apply_rotary_embedding;
+  params.scaling_query = this->scaling_query;
+  params.scaling_factor = this->scaling_factor;
+  params.qk_prod_scaling = this->qk_prod_scaling;
   return params;
 }
 
@@ -665,6 +772,9 @@ size_t hash<FlexFlow::SpecIncMultiHeadSelfAttentionParams>::operator()(
   hash_combine(key, params.add_bias_kv);
   hash_combine(key, params.add_zero_attn);
   hash_combine(key, params.apply_rotary_embedding);
+  hash_combine(key, params.scaling_query);
+  hash_combine(key, params.scaling_factor);
+  hash_combine(key, params.qk_prod_scaling);
   return key;
 }
 }; // namespace std
diff --git a/src/ops/spec_inc_multihead_self_attention.cpp b/src/ops/spec_inc_multihead_self_attention.cpp
index 37305a83b0..765891ed53 100644
--- a/src/ops/spec_inc_multihead_self_attention.cpp
+++ b/src/ops/spec_inc_multihead_self_attention.cpp
@@ -29,7 +29,8 @@ void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
     BeamSearchBatchConfig const *bc,
     float const *input_ptr,
     float const *weight_ptr,
-    float *output_ptr) {
+    float *output_ptr,
+    float const *bias_ptr) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index ee1c6e389b..062ef4af03 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -40,6 +40,49 @@ __global__ void spec_build_w_out_tensor(float const *weight_ptr,
   }
 }
 
+__global__ void spec_apply_proj_bias_w(float *input_ptr,
+                                       float const *bias_ptr,
+                                       int num_tokens,
+                                       int oProjSize) {
+  CUDA_KERNEL_LOOP(i, num_tokens * oProjSize) {
+    int bias_idx = 3 * oProjSize + i % oProjSize;
+    input_ptr[i] += bias_ptr[bias_idx];
+  }
+}
+
+__global__ void spec_apply_proj_bias_qkv(float *input_ptr,
+                                         float const *bias_ptr,
+                                         int num_tokens,
+                                         int qProjSize,
+                                         int kProjSize,
+                                         int vProjSize,
+                                         int num_heads,
+                                         bool scaling_query,
+                                         float scaling_factor) {
+  CUDA_KERNEL_LOOP(
+      i, num_tokens * (qProjSize + kProjSize + vProjSize) * num_heads) {
+    // for simplicity, assume q, k, v is in same shape
+    // 0->q, 1->k, 2->v
+    int qkv_index = i / (num_tokens * qProjSize) % 3;
+
+    int head_idx = i / (num_tokens * (qProjSize + kProjSize + vProjSize));
+    int qkv_block_size = (qProjSize + kProjSize + vProjSize) * num_tokens;
+    int q_block_size = qProjSize * num_tokens;
+
+    int idx = i % (num_tokens * (qProjSize));
+
+    int real_part_index =
+        head_idx * qkv_block_size + qkv_index * q_block_size + idx;
+    int bias_idx = qkv_index * qProjSize * num_heads + head_idx * qProjSize +
+                   (idx % qProjSize);
+    input_ptr[real_part_index] += bias_ptr[bias_idx];
+
+    if (scaling_query && qkv_index == 0) {
+      input_ptr[real_part_index] *= scaling_factor;
+    }
+  }
+}
+
 __global__ void
     spec_apply_rotary_embedding(float *input_ptr,
                                 cuFloatComplex *complex_input,
@@ -101,12 +144,13 @@ __global__ void
   }
 }
 
-void inference_kernel1(SpecIncMultiHeadSelfAttentionMeta const *m,
-                       BeamSearchBatchConfig const *bc,
-                       float const *input_ptr,
-                       float const *weight_ptr,
-                       float *output_ptr,
-                       cudaStream_t stream) {
+void compute_qkv_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
+                        BeamSearchBatchConfig const *bc,
+                        float const *input_ptr,
+                        float const *weight_ptr,
+                        float *output_ptr,
+                        float const *bias_ptr,
+                        cudaStream_t stream) {
 
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
@@ -219,7 +263,21 @@ void inference_kernel1(SpecIncMultiHeadSelfAttentionMeta const *m,
   int v_block_size = m->vProjSize * num_tokens;
   cuFloatComplex *complex_input;
 
-  // todo xinhao remember to set token index for each beam
+  // apply bias for q, k, v
+  if (*m->bias) {
+    spec_apply_proj_bias_qkv<<<GET_BLOCKS(parallelism),
+                               min(CUDA_NUM_THREADS, parallelism),
+                               0,
+                               stream>>>(output_ptr,
+                                         bias_ptr,
+                                         num_tokens,
+                                         m->qProjSize,
+                                         m->kProjSize,
+                                         m->vProjSize,
+                                         m->num_heads,
+                                         *m->scaling_query,
+                                         m->scaling_factor);
+  }
 
   if (*m->apply_rotary_embedding) {
     checkCUDA(cudaMalloc(&complex_input,
@@ -386,12 +444,12 @@ __global__ void spec_store_kv_cache(
   }
 }
 
-void inference_kernel2(SpecIncMultiHeadSelfAttentionMeta const *m,
-                       BeamSearchBatchConfig const *bc,
-                       cudaStream_t stream) {
+void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
+                            BeamSearchBatchConfig const *bc,
+                            cudaStream_t stream) {
   int num_tokens = bc->num_active_tokens();
   int curr_depth = bc->beamRequestsInfo[0].current_depth;
-  printf("curr depth: %d\n", curr_depth);
+  // printf("curr depth: %d\n", curr_depth);
   // assert(curr_depth < 3);
   if (num_tokens > 0) {
     int parallelism = m->kProjSize * num_tokens * m->num_heads;
@@ -442,19 +500,21 @@ __global__ void spec_fill_entries_above_diagonal(float *matrix,
                                                  size_t num_heads,
                                                  float value) {
   CUDA_KERNEL_LOOP(i, new_tokens * total_tokens_in_request * num_heads) {
-    //size_t head_idx = i / (new_tokens * total_tokens_in_request);
+    // size_t head_idx = i / (new_tokens * total_tokens_in_request);
     size_t src_idx = (i / new_tokens) % total_tokens_in_request;
     size_t dst_idx = i % new_tokens + total_tokens_in_request - new_tokens;
     // Casual Mask
-    if (src_idx > dst_idx)
+    if (src_idx > dst_idx) {
       matrix[i] = value;
+    }
   }
 }
 
-void inference_kernel3(SpecIncMultiHeadSelfAttentionMeta const *m,
-                       BeamSearchBatchConfig const *bc,
-                       float *output_ptr,
-                       cudaStream_t stream) {
+void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
+                              BeamSearchBatchConfig const *bc,
+                              float *output_ptr,
+                              float const *bias_ptr,
+                              cudaStream_t stream) {
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
   cudaDataType_t cublas_data_type = ff_to_cuda_datatype(DT_FLOAT);
@@ -497,7 +557,11 @@ void inference_kernel3(SpecIncMultiHeadSelfAttentionMeta const *m,
       int strideB = kt_block_size;
       int strideC = num_new_tokens * total_tokens;
 
-      float alpha = 1.0f / (float)sqrt(m->kProjSize), beta = 0.0f;
+      // a flag of using this scaling alpha
+      float alpha = 1.0f, beta = 0.0f;
+      if (*m->qk_prod_scaling) {
+        alpha = 1.0f / (float)sqrt(m->kProjSize), beta = 0.0f;
+      }
       // To get A, skip over Q entries from previous requests (same head)
       void const *A = (void const *)(m->devQKVProjArray +
                                      tokens_previous_requests * m->qProjSize);
@@ -548,11 +612,8 @@ void inference_kernel3(SpecIncMultiHeadSelfAttentionMeta const *m,
                                            min((size_t)CUDA_NUM_THREADS,
                                                parallelism),
                                            0,
-                                           stream>>>((float *)C,
-                                                     num_new_tokens,
-                                                     total_tokens,
-                                                     m->num_heads,
-                                                     -INFINITY);
+                                           stream>>>(
+            (float *)C, num_new_tokens, total_tokens, m->num_heads, -INFINITY);
       }
       // Compute Softmax(QK^T/sqrt(d_k))
       cudnnTensorDescriptor_t qk_tensor;
@@ -669,6 +730,14 @@ void inference_kernel3(SpecIncMultiHeadSelfAttentionMeta const *m,
       tokens_previous_requests += num_new_tokens;
       tokens_prev_requests_squares += num_new_tokens * total_tokens;
     }
+    if (*m->bias) {
+      int parallelism = m->oProjSize * num_tokens;
+      spec_apply_proj_bias_w<<<GET_BLOCKS(parallelism),
+                               min(CUDA_NUM_THREADS, parallelism),
+                               0,
+                               stream>>>(
+          output_ptr, bias_ptr, num_tokens, m->oProjSize);
+    }
   }
 
   assert(tokens_previous_requests == num_tokens);
@@ -680,7 +749,8 @@ void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
     BeamSearchBatchConfig const *bc,
     float const *input_ptr,
     float const *weight_ptr,
-    float *output_ptr) {
+    float *output_ptr,
+    float const *bias_ptr) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -734,13 +804,14 @@ void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
                   cudaMemcpyHostToDevice,
                   stream);
   // phase 1: Implement kernel to compute KQV for input tokens
-  inference_kernel1(m, bc, input_ptr, weight_ptr, m->devQKVProjArray, stream);
+  compute_qkv_kernel(
+      m, bc, input_ptr, weight_ptr, m->devQKVProjArray, bias_ptr, stream);
   // phase 2: Update key/val cache
-  inference_kernel2(m, bc, stream);
+  update_kv_cache_kernel(m, bc, stream);
 
   // phase 3: Compute attention score
   // 3 kernels for pahse 3: matmul1 - softmax - matmal2
-  inference_kernel3(m, bc, output_ptr, stream);
+  compute_attention_kernel(m, bc, output_ptr, bias_ptr, stream);
 
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
@@ -790,6 +861,13 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
   *has_load_weights = false;
   apply_rotary_embedding = (bool *)calloc(1, sizeof(bool));
   *apply_rotary_embedding = attn->apply_rotary_embedding;
+  bias = (bool *)calloc(1, sizeof(bool));
+  *bias = attn->bias;
+  scaling_query = (bool *)calloc(1, sizeof(bool));
+  *scaling_query = attn->scaling_query;
+  scaling_factor = attn->scaling_factor;
+  qk_prod_scaling = (bool *)calloc(1, sizeof(bool));
+  *qk_prod_scaling = attn->qk_prod_scaling;
   // Currently do not support adding bias to key/value projection
   assert(!attn->add_bias_kv);
 
diff --git a/src/ops/tree_inc_multihead_self_attention.cc b/src/ops/tree_inc_multihead_self_attention.cc
index 96e2541872..11c8e22e86 100644
--- a/src/ops/tree_inc_multihead_self_attention.cc
+++ b/src/ops/tree_inc_multihead_self_attention.cc
@@ -66,14 +66,18 @@ Tensor FFModel::inc_multihead_self_attention_verify(
     bool add_zero_attn,
     Initializer *kernel_initializer,
     bool apply_rotary_embedding,
+    bool scaling_query,
+    float scaling_factor,
+    bool qk_prod_scaling,
     char const *name) {
+  int weight_num = bias ? 2 : 1;
   // Currently assume that
   Layer *li = new Layer(this,
                         OP_TREE_INC_MULTIHEAD_SELF_ATTENTION,
                         DT_FLOAT,
                         name,
                         1 /*inputs*/,
-                        1 /*weights*/,
+                        weight_num /*weights*/,
                         1 /*outputs*/,
                         input);
   {
@@ -104,6 +108,17 @@ Tensor FFModel::inc_multihead_self_attention_verify(
                                                    kernel_initializer,
                                                    CHOSEN_SYNC_TYPE);
   }
+  if (bias) {
+    // q, k, v, o
+    int dims[1] = {embed_dim * 4};
+    li->weights[1] = create_weight_legion_ordering(1,
+                                                   dims,
+                                                   DT_FLOAT,
+                                                   li,
+                                                   true /*create_grad*/,
+                                                   kernel_initializer,
+                                                   CHOSEN_SYNC_TYPE);
+  }
   li->data_type = DT_FLOAT;
   li->add_int_property("embed_dim", embed_dim);
   li->add_int_property("num_heads", num_heads);
@@ -114,6 +129,9 @@ Tensor FFModel::inc_multihead_self_attention_verify(
   li->add_int_property("add_zero_attn", add_zero_attn);
   li->add_float_property("dropout", dropout);
   li->add_int_property("apply_rotary_embedding", apply_rotary_embedding);
+  li->add_int_property("scaling_query", scaling_query);
+  li->add_float_property("scaling_factor", scaling_factor);
+  li->add_int_property("qk_prod_scaling", qk_prod_scaling);
   layers.push_back(li);
   return li->outputs[0];
 }
@@ -141,6 +159,12 @@ Op *TreeIncMultiHeadSelfAttention::create_operator_from_layer(
   bool add_zero_attn = (bool)value;
   layer->get_int_property("apply_rotary_embedding", value);
   bool apply_rotary_embedding = (bool)value;
+  layer->get_int_property("scaling_query", value);
+  bool scaling_query = (bool)value;
+  float scaling_factor;
+  layer->get_float_property("scaling_factor", scaling_factor);
+  layer->get_int_property("qk_prod_scaling", value);
+  bool qk_prod_scaling = (bool)value;
   return new TreeIncMultiHeadSelfAttention(model,
                                            layer->layer_guid,
                                            inputs[0],
@@ -153,6 +177,9 @@ Op *TreeIncMultiHeadSelfAttention::create_operator_from_layer(
                                            add_bias_kv,
                                            add_zero_attn,
                                            apply_rotary_embedding,
+                                           scaling_query,
+                                           scaling_factor,
+                                           qk_prod_scaling,
                                            false /*allocate_weights*/,
                                            layer->name);
 }
@@ -170,6 +197,9 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     bool _add_bias_kv,
     bool _add_zero_attn,
     bool _apply_rotary_embedding,
+    bool _scaling_query,
+    float _scaling_factor,
+    bool _qk_prod_scaling,
     bool allocate_weights,
     char const *name)
     // Initializer* _bias_initializer)
@@ -178,7 +208,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
          DT_FLOAT,
          name,
          1 /*inputs*/,
-         1 /*weights*/,
+         (_bias ? 2 : 1) /*weights*/,
          1 /*outputs*/,
          _input),
       num_heads(_num_heads), dropout(_dropout), bias(_bias),
@@ -187,7 +217,9 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
       vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
       vProjSize(_vdim), oProjSize(_embed_dim),
-      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size) {
+      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
+      scaling_query(_scaling_query), scaling_factor(_scaling_factor),
+      qk_prod_scaling(_qk_prod_scaling) {
   // overwrite layer_guid
   layer_guid = _layer_guid;
 
@@ -231,6 +263,26 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
                                                  initializer,
                                                  comm_type);
   }
+  if (bias) {
+    ParallelDim dims[2];
+    int num_dims = inputs[0]->num_dims;
+    dims[0] = inputs[0]->dims[num_dims - 1];
+    dims[0].size = dims[0].degree;
+    dims[1].size = oProjSize * 4;
+    dims[1].degree = 1;
+    dims[1].parallel_idx = -1;
+#ifdef USE_NCCL
+    ParameterSyncType comm_type = ParameterSyncType::NCCL;
+#else
+    ParameterSyncType comm_type = ParameterSyncType::PS;
+#endif
+    weights[1] = model.create_parallel_weight<2>(dims,
+                                                 DT_FLOAT,
+                                                 NULL /*owner_op*/,
+                                                 true /*create_grad*/,
+                                                 NULL,
+                                                 comm_type);
+  }
 
   outputs[0] = model.create_parallel_tensor_legion_ordering(
       _input->num_dims, dims, DT_FLOAT, this);
@@ -254,6 +306,9 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     bool _add_bias_kv,
     bool _add_zero_attn,
     bool _apply_rotary_embedding,
+    bool _scaling_query,
+    float _scaling_factor,
+    bool _qk_prod_scaling,
     bool allocate_weights,
     char const *name)
     // Initializer* _bias_initializer)
@@ -262,7 +317,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
          DT_FLOAT,
          name,
          1 /*inputs*/,
-         1 /*weights*/,
+         (_bias ? 2 : 1) /*weights*/,
          1 /*outputs*/,
          _input,
          _weight),
@@ -272,7 +327,9 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
       vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
       vProjSize(_vdim), oProjSize(_embed_dim),
-      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size)
+      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
+      scaling_query(_scaling_query), scaling_factor(_scaling_factor),
+      qk_prod_scaling(_qk_prod_scaling)
 // bias_initializer(_bias_initializer)
 {
   numOutputs = 1;
@@ -313,6 +370,24 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
                                                  initializer,
                                                  comm_type);
   }
+  if (bias) {
+    ParallelDim dims[2];
+    int num_dims = inputs[0]->num_dims;
+    dims[0] = inputs[0]->dims[num_dims - 1];
+    dims[0].size = dims[0].degree;
+    dims[1].size = oProjSize * 4;
+#ifdef USE_NCCL
+    ParameterSyncType comm_type = ParameterSyncType::NCCL;
+#else
+    ParameterSyncType comm_type = ParameterSyncType::PS;
+#endif
+    weights[1] = model.create_parallel_weight<2>(dims,
+                                                 DT_FLOAT,
+                                                 NULL /*owner_op*/,
+                                                 true /*create_grad*/,
+                                                 NULL,
+                                                 comm_type);
+  }
   outputs[0] = model.create_parallel_tensor_legion_ordering(
       _input->num_dims, dims, DT_FLOAT, this);
 
@@ -342,6 +417,9 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
                                     other.add_bias_kv,
                                     other.add_zero_attn,
                                     other.apply_rotary_embedding,
+                                    other.scaling_query,
+                                    other.scaling_factor,
+                                    other.qk_prod_scaling,
                                     allocate_weights,
                                     other.name) {}
 
@@ -363,6 +441,9 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
                                     params.add_bias_kv,
                                     params.add_zero_attn,
                                     params.apply_rotary_embedding,
+                                    params.scaling_query,
+                                    params.scaling_factor,
+                                    params.qk_prod_scaling,
                                     allocate_weights,
                                     name) {}
 
@@ -536,6 +617,14 @@ FutureMap TreeIncMultiHeadSelfAttention::inference(
                                                     EXCLUSIVE,
                                                     batch_outputs[0]->region));
   launcher.add_field(idx++, FID_DATA);
+  if (bias) {
+    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[1]->region));
+    launcher.add_field(idx++, FID_DATA);
+  }
   return runtime->execute_index_space(ctx, launcher);
 }
 
@@ -549,12 +638,13 @@ void TreeIncMultiHeadSelfAttention::inference_task(
     std::vector<PhysicalRegion> const &regions,
     Context ctx,
     Runtime *runtime) {
-  assert(regions.size() == 3);
   assert(task->regions.size() == regions.size());
+  float const *bias_ptr = NULL;
 
   TreeVerifyBatchConfig const *bc = (TreeVerifyBatchConfig *)task->args;
   TreeIncMultiHeadSelfAttentionMeta *m =
       *((TreeIncMultiHeadSelfAttentionMeta **)task->local_args);
+  assert((*m->bias ? regions.size() == 4 : regions.size() == 3));
 
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
@@ -562,6 +652,19 @@ void TreeIncMultiHeadSelfAttention::inference_task(
       m->weight_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
   GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
       m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  if (*m->bias) {
+    GenericTensorAccessorR biases =
+        helperGetGenericTensorAccessorRO(m->weight_type[1],
+                                         regions[3],
+                                         task->regions[3],
+                                         FID_DATA,
+                                         ctx,
+                                         runtime);
+    Domain bias_domain = runtime->get_index_space_domain(
+        ctx, task->regions[3].region.get_index_space());
+    assert(bias_domain.get_dim() == 2);
+    bias_ptr = biases.get_float_ptr();
+  }
 
   Domain input_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
@@ -583,7 +686,8 @@ void TreeIncMultiHeadSelfAttention::inference_task(
       bc,
       input.get_float_ptr(),
       weight.get_float_ptr(),
-      output.get_float_ptr());
+      output.get_float_ptr(),
+      bias_ptr);
 #ifdef INFERENCE_TESTS
   printf("Checking TreeIncMultiHeadSelfAttention computations...\n");
 
@@ -1394,7 +1498,10 @@ bool operator==(TreeIncMultiHeadSelfAttentionParams const &lhs,
          lhs.vdim == rhs.vdim && lhs.dropout == rhs.dropout &&
          lhs.bias == rhs.bias && lhs.add_bias_kv == rhs.add_bias_kv &&
          lhs.add_zero_attn == rhs.add_zero_attn &&
-         lhs.apply_rotary_embedding == rhs.apply_rotary_embedding;
+         lhs.apply_rotary_embedding == rhs.apply_rotary_embedding &&
+         lhs.scaling_query == rhs.scaling_query &&
+         lhs.scaling_factor == rhs.scaling_factor &&
+         lhs.qk_prod_scaling == rhs.qk_prod_scaling;
 }
 
 TreeIncMultiHeadSelfAttentionParams
@@ -1410,6 +1517,9 @@ TreeIncMultiHeadSelfAttentionParams
   params.add_bias_kv = this->add_bias_kv;
   params.add_zero_attn = this->add_zero_attn;
   params.apply_rotary_embedding = this->apply_rotary_embedding;
+  params.scaling_query = this->scaling_query;
+  params.scaling_factor = this->scaling_factor;
+  params.qk_prod_scaling = this->qk_prod_scaling;
   return params;
 }
 
@@ -1429,6 +1539,9 @@ size_t hash<FlexFlow::TreeIncMultiHeadSelfAttentionParams>::operator()(
   hash_combine(key, params.add_bias_kv);
   hash_combine(key, params.add_zero_attn);
   hash_combine(key, params.apply_rotary_embedding);
+  hash_combine(key, params.scaling_query);
+  hash_combine(key, params.scaling_factor);
+  hash_combine(key, params.qk_prod_scaling);
   return key;
 }
 }; // namespace std
diff --git a/src/ops/tree_inc_multihead_self_attention.cpp b/src/ops/tree_inc_multihead_self_attention.cpp
index 5e3fc240d5..f478e13660 100644
--- a/src/ops/tree_inc_multihead_self_attention.cpp
+++ b/src/ops/tree_inc_multihead_self_attention.cpp
@@ -29,7 +29,8 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
     TreeVerifyBatchConfig const *bc,
     float const *input_ptr,
     float const *weight_ptr,
-    float *output_ptr) {
+    float *output_ptr,
+    float const *bias_ptr) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index 452a1be7b2..86b857a7f9 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -40,6 +40,49 @@ __global__ void tree_build_w_out_tensor(float const *weight_ptr,
   }
 }
 
+__global__ void tree_apply_proj_bias_w(float *input_ptr,
+                                       float const *bias_ptr,
+                                       int num_tokens,
+                                       int oProjSize) {
+  CUDA_KERNEL_LOOP(i, num_tokens * oProjSize) {
+    int bias_idx = 3 * oProjSize + i % oProjSize;
+    input_ptr[i] += bias_ptr[bias_idx];
+  }
+}
+
+__global__ void tree_apply_proj_bias_qkv(float *input_ptr,
+                                         float const *bias_ptr,
+                                         int num_tokens,
+                                         int qProjSize,
+                                         int kProjSize,
+                                         int vProjSize,
+                                         int num_heads,
+                                         bool scaling_query,
+                                         float scaling_factor) {
+  CUDA_KERNEL_LOOP(
+      i, num_tokens * (qProjSize + kProjSize + vProjSize) * num_heads) {
+    // for simplicity, assume q, k, v is in same shape
+    // 0->q, 1->k, 2->v
+    int qkv_index = i / (num_tokens * qProjSize) % 3;
+
+    int head_idx = i / (num_tokens * (qProjSize + kProjSize + vProjSize));
+    int qkv_block_size = (qProjSize + kProjSize + vProjSize) * num_tokens;
+    int q_block_size = qProjSize * num_tokens;
+
+    int idx = i % (num_tokens * (qProjSize));
+
+    int real_part_index =
+        head_idx * qkv_block_size + qkv_index * q_block_size + idx;
+    int bias_idx = qkv_index * qProjSize * num_heads + head_idx * qProjSize +
+                   (idx % qProjSize);
+    input_ptr[real_part_index] += bias_ptr[bias_idx];
+
+    if (scaling_query && qkv_index == 0) {
+      input_ptr[real_part_index] *= scaling_factor;
+    }
+  }
+}
+
 __global__ void commit_tokens_kernel(
     float const *devQKVProjArray,
     float *cache_ptr,
@@ -188,6 +231,7 @@ void compute_qkv_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                         float const *input_ptr,
                         float const *weight_ptr,
                         float *output_ptr,
+                        float const *bias_ptr,
                         cudaStream_t stream) {
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
@@ -296,6 +340,22 @@ void compute_qkv_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
   int k_block_size = m->kProjSize * num_tokens;
   int v_block_size = m->vProjSize * num_tokens;
   cuFloatComplex *complex_input;
+
+  // apply bias for q, k, v
+  if (*m->bias) {
+    tree_apply_proj_bias_qkv<<<GET_BLOCKS(parallelism),
+                               min(CUDA_NUM_THREADS, parallelism),
+                               0,
+                               stream>>>(output_ptr,
+                                         bias_ptr,
+                                         num_tokens,
+                                         m->qProjSize,
+                                         m->kProjSize,
+                                         m->vProjSize,
+                                         m->num_heads,
+                                         *m->scaling_query,
+                                         m->scaling_factor);
+  }
   if (*m->apply_rotary_embedding) {
     checkCUDA(cudaMalloc(&complex_input,
                          num_tokens * m->qProjSize * m->num_heads *
@@ -354,7 +414,7 @@ __global__ void update_tree_branch_kv_cache(
         (i / proj_size) % num_tokens_in_branch; // index in the tree branch
     int head_idx = i / (proj_size * num_tokens_in_branch);
 
-    token_idx += processed_tokens_in_batch; // get index in the whole batch
+    token_idx += processed_tokens_in_batch;     // get index in the whole batch
     int qkv_block_size = (qProjSize + kProjSize + vProjSize) *
                          total_tokens_in_batch; // skip over previous heads
     int current_head_block_size =
@@ -380,18 +440,20 @@ __global__ void tree_fill_entries_above_diagonal(float *matrix,
                                                  size_t num_heads,
                                                  float value) {
   CUDA_KERNEL_LOOP(i, new_tokens * total_tokens_in_request * num_heads) {
-    //size_t head_idx = i / (new_tokens * total_tokens_in_request);
+    // size_t head_idx = i / (new_tokens * total_tokens_in_request);
     size_t src_idx = (i / new_tokens) % total_tokens_in_request;
     size_t dst_idx = i % new_tokens + total_tokens_in_request - new_tokens;
     // Casual Mask
-    if (src_idx > dst_idx)
+    if (src_idx > dst_idx) {
       matrix[i] = value;
+    }
   }
 }
 
 void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                               TreeVerifyBatchConfig const *bc,
                               float *output_ptr,
+                              float const *bias_ptr,
                               cudaStream_t stream) {
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
@@ -479,7 +541,11 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       int strideB = kt_block_size;
       int strideC = num_new_tokens * total_tokens_in_request;
 
-      float alpha = 1.0f / (float)sqrt(m->kProjSize), beta = 0.0f;
+      // a flag of using this scaling alpha
+      float alpha = 1.0f, beta = 0.0f;
+      if (*m->qk_prod_scaling) {
+        alpha = 1.0f / (float)sqrt(m->kProjSize), beta = 0.0f;
+      }
       // To get A, skip over Q entries from previous requests (same head)
       void const *A = (void const *)(m->devQKVProjArray +
                                      processed_tokens_in_batch * m->qProjSize);
@@ -517,7 +583,8 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       // causal attention.
       assert(num_new_tokens <= total_tokens_in_request);
       if (num_new_tokens > 1) {
-        size_t parallelism = m->num_heads * num_new_tokens * total_tokens_in_request;
+        size_t parallelism =
+            m->num_heads * num_new_tokens * total_tokens_in_request;
         tree_fill_entries_above_diagonal<<<GET_BLOCKS(parallelism),
                                            min((size_t)CUDA_NUM_THREADS,
                                                parallelism),
@@ -644,6 +711,14 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
     // check that we have finished all tokens of the request
     assert(last_token_idx_of_the_request + 1 == processed_tokens_in_batch);
   }
+  if (*m->bias) {
+    int parallelism = m->oProjSize * processed_tokens_in_batch;
+    tree_apply_proj_bias_w<<<GET_BLOCKS(parallelism),
+                             min(CUDA_NUM_THREADS, parallelism),
+                             0,
+                             stream>>>(
+        output_ptr, bias_ptr, processed_tokens_in_batch, m->oProjSize);
+  }
 
   assert(processed_tokens_in_batch == bc->num_active_tokens());
 }
@@ -654,7 +729,8 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
     TreeVerifyBatchConfig const *bc,
     float const *input_ptr,
     float const *weight_ptr,
-    float *output_ptr) {
+    float *output_ptr,
+    float const *bias_ptr) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -705,7 +781,8 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
                   cudaMemcpyHostToDevice,
                   stream);
   // phase 1: Implement kernel to compute KQV for input tokens
-  compute_qkv_kernel(m, bc, input_ptr, weight_ptr, m->devQKVProjArray, stream);
+  compute_qkv_kernel(
+      m, bc, input_ptr, weight_ptr, m->devQKVProjArray, bias_ptr, stream);
 
   // phase 2: No need to update key/val cache
   // IncMultiHeadSelfAttention::update_kv_cache_kernel(
@@ -713,7 +790,7 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
 
   // phase 3: Compute attention score
   // 3 kernels for pahse 3: matmul1 - softmax - matmal2
-  compute_attention_kernel(m, bc, output_ptr, stream);
+  compute_attention_kernel(m, bc, output_ptr, bias_ptr, stream);
 
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
@@ -761,6 +838,13 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
   *has_load_weights = false;
   apply_rotary_embedding = (bool *)calloc(1, sizeof(bool));
   *apply_rotary_embedding = attn->apply_rotary_embedding;
+  bias = (bool *)calloc(1, sizeof(bool));
+  *bias = attn->bias;
+  scaling_query = (bool *)calloc(1, sizeof(bool));
+  *scaling_query = attn->scaling_query;
+  scaling_factor = attn->scaling_factor;
+  qk_prod_scaling = (bool *)calloc(1, sizeof(bool));
+  *qk_prod_scaling = attn->qk_prod_scaling;
   // Currently do not support adding bias to key/value projection
   assert(!attn->add_bias_kv);
 
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index baf1b24f5d..bcead0bfaf 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -2293,6 +2293,9 @@ GraphOptimalViewSerialized
         sez.serialize(attn->add_bias_kv);
         sez.serialize(attn->add_zero_attn);
         sez.serialize(attn->apply_rotary_embedding);
+        sez.serialize(attn->scaling_query);
+        sez.serialize(attn->scaling_factor);
+        sez.serialize(attn->qk_prod_scaling);
         break;
       }
       case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION: {
@@ -2308,6 +2311,9 @@ GraphOptimalViewSerialized
         sez.serialize(attn->add_bias_kv);
         sez.serialize(attn->add_zero_attn);
         sez.serialize(attn->apply_rotary_embedding);
+        sez.serialize(attn->scaling_query);
+        sez.serialize(attn->scaling_factor);
+        sez.serialize(attn->qk_prod_scaling);
         break;
       }
       case OP_SOFTMAX: {
@@ -2711,8 +2717,9 @@ void FFModel::deserialize_graph_optimal_view(
       case OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(num_inputs == 1);
         int embed_dim, num_heads, k_dim, v_dim;
-        float dropout;
-        bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding;
+        float dropout, scaling_factor;
+        bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
+            scaling_query, qk_prod_scaling;
         size_t id;
         dez.deserialize(id);
         LayerID layer_guid(id);
@@ -2725,6 +2732,9 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(add_bias_kv);
         dez.deserialize(add_zero_attn);
         dez.deserialize(apply_rotary_embedding);
+        dez.deserialize(scaling_query);
+        dez.deserialize(scaling_factor);
+        dez.deserialize(qk_prod_scaling);
 
         SpecIncMultiHeadSelfAttentionParams params;
         params.embed_dim = embed_dim;
@@ -2737,6 +2747,9 @@ void FFModel::deserialize_graph_optimal_view(
         params.add_zero_attn = add_zero_attn;
         params.layer_guid = layer_guid;
         params.apply_rotary_embedding = apply_rotary_embedding;
+        params.scaling_query = scaling_query;
+        params.scaling_factor = scaling_factor;
+        params.qk_prod_scaling = qk_prod_scaling;
         node = get_or_create_node<SpecIncMultiHeadSelfAttention>(inputs[0],
                                                                  params);
         break;
@@ -2744,8 +2757,9 @@ void FFModel::deserialize_graph_optimal_view(
       case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(num_inputs == 1);
         int embed_dim, num_heads, k_dim, v_dim;
-        float dropout;
-        bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding;
+        float dropout, scaling_factor;
+        bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
+            scaling_query, qk_prod_scaling;
         size_t id;
         dez.deserialize(id);
         LayerID layer_guid(id);
@@ -2758,6 +2772,9 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(add_bias_kv);
         dez.deserialize(add_zero_attn);
         dez.deserialize(apply_rotary_embedding);
+        dez.deserialize(scaling_query);
+        dez.deserialize(scaling_factor);
+        dez.deserialize(qk_prod_scaling);
 
         TreeIncMultiHeadSelfAttentionParams params;
         params.embed_dim = embed_dim;
@@ -2770,6 +2787,9 @@ void FFModel::deserialize_graph_optimal_view(
         params.add_zero_attn = add_zero_attn;
         params.layer_guid = layer_guid;
         params.apply_rotary_embedding = apply_rotary_embedding;
+        params.scaling_query = scaling_query;
+        params.scaling_factor = scaling_factor;
+        params.qk_prod_scaling = qk_prod_scaling;
         node = get_or_create_node<TreeIncMultiHeadSelfAttention>(inputs[0],
                                                                  params);
         break;

From c08b1a067dee6974894153a0e15f3f9ed0a06f7e Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 15 May 2023 02:58:54 +0800
Subject: [PATCH 123/344] add opt tokenizer functionality in C++ tokenizer
 (#727)

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 examples/cpp/inference/gpt_tokenizer.cc      |  4 ++
 examples/cpp/inference/gpt_tokenizer.cpp     | 13 +++--
 examples/cpp/inference/gpt_tokenizer.h       |  7 ++-
 examples/cpp/inference/gpt_tokenizer_test.sh | 52 ++++++++++++++++++--
 4 files changed, 67 insertions(+), 9 deletions(-)

diff --git a/examples/cpp/inference/gpt_tokenizer.cc b/examples/cpp/inference/gpt_tokenizer.cc
index c349bfacf3..437c4aa551 100644
--- a/examples/cpp/inference/gpt_tokenizer.cc
+++ b/examples/cpp/inference/gpt_tokenizer.cc
@@ -270,4 +270,8 @@ void GPT_Tokenizer::encode(std::string str,
     input_ids->push_back(vocab[pad_token]);
     mask_ids->push_back(0);
   }
+  if (mode == OPT) {
+    mask_ids->insert(mask_ids->begin(), 1);
+    input_ids->insert(input_ids->begin(), 2);
+  }
 }
diff --git a/examples/cpp/inference/gpt_tokenizer.cpp b/examples/cpp/inference/gpt_tokenizer.cpp
index 2d9b521fca..0691145113 100644
--- a/examples/cpp/inference/gpt_tokenizer.cpp
+++ b/examples/cpp/inference/gpt_tokenizer.cpp
@@ -18,10 +18,15 @@
 #include <string>
 
 int main(int argc, char *argv[]) {
-  std::string vocab_file = "./gpt2_bpe/vocab.bpe";
-  std::string merge_file = "./gpt2_bpe/encoder.json";
+  if (argc != 2 || (strcmp(argv[1], "gpt-2") && strcmp(argv[1], "opt") )) {
+    fprintf(stderr, "Usage: %s <gpt-2|opt>\n", argv[0]);
+    return 1;
+  }
+  tokenizer_mode mode = strcmp(argv[1], "gpt-2") == 0 ? GPT2 : OPT;
+  std::string vocab_file = mode == GPT2 ? "./gpt2_bpe/vocab.bpe" : "opt_bpe/vocab.bpe";
+  std::string merge_file = mode == GPT2 ? "./gpt2_bpe/encoder.json" : "opt_bpe/encoder.json";
 
-  GPT_Tokenizer tokenizer(merge_file, vocab_file);
+  GPT_Tokenizer tokenizer(mode, merge_file, vocab_file);
 
   std::string line;
   std::vector<std::string> lines;
@@ -30,7 +35,7 @@ int main(int argc, char *argv[]) {
     std::cout << "Error opening input file" << std::endl;
     return -1;
   }
-  std::ofstream outfile("./wikitext-103-raw/wiki.valid.bpe.flexflow",
+  std::ofstream outfile(mode == GPT2 ? "./wikitext-103-raw/wiki.valid.bpe.flexflow.gpt2" : "./wikitext-103-raw/wiki.valid.bpe.flexflow.opt",
                         std::ofstream::out);
   if (!outfile) {
     std::cout << "Error opening output file" << std::endl;
diff --git a/examples/cpp/inference/gpt_tokenizer.h b/examples/cpp/inference/gpt_tokenizer.h
index 9af722df38..476b47fee1 100644
--- a/examples/cpp/inference/gpt_tokenizer.h
+++ b/examples/cpp/inference/gpt_tokenizer.h
@@ -31,16 +31,20 @@ struct hash_pair {
   }
 };
 
+enum tokenizer_mode { GPT2, OPT };
+
 class GPT_Tokenizer {
 
 public:
-  GPT_Tokenizer(std::string const &vocab_file,
+  GPT_Tokenizer(tokenizer_mode mode_,
+                std::string const &vocab_file,
                 std::string const &merge_file,
                 std::string const &bos_token_str = "<s>",
                 const std::string eos_token_str = "</s>",
                 const std::string pad_token_str = "<pad>",
                 const std::string unk_token_str = "<unk>",
                 const std::string mask_token_str = "<mask>") {
+    mode = mode_;
     load_vocab(vocab_file);
     load_merge(merge_file);
     bos_token = bos_token_str;
@@ -58,6 +62,7 @@ class GPT_Tokenizer {
               size_t max_length,
               std::vector<int64_t> *input_ids,
               std::vector<int64_t> *mask_ids);
+  tokenizer_mode mode;
   std::string bos_token;
   std::string eos_token;
   std::string pad_token;
diff --git a/examples/cpp/inference/gpt_tokenizer_test.sh b/examples/cpp/inference/gpt_tokenizer_test.sh
index 8f7660bfe4..26f3f71a05 100755
--- a/examples/cpp/inference/gpt_tokenizer_test.sh
+++ b/examples/cpp/inference/gpt_tokenizer_test.sh
@@ -3,7 +3,7 @@ set -x
 set -e
 
 cleanup() {
-	rm -rf wikitext-103-raw-v1.zip wikitext-103-raw gpt2_bpe gpt_tokenizer pytokenizer.py bpe.py
+	rm -rf wikitext-103-raw-v1.zip wikitext-103-raw gpt2_bpe opt_bpe gpt_tokenizer pytokenizer.py bpe.py hf_tokenizer.py 
 }
 
 # Cd into directory holding this script
@@ -21,6 +21,10 @@ wget https://s3.amazonaws.com/research.metamind.io/wikitext/wikitext-103-raw-v1.
 unzip wikitext-103-raw-v1.zip
 rm wikitext-103-raw-v1.zip
 
+###############################################################################################
+##################################### GPT-2 tests #############################################
+###############################################################################################
+
 # Download GPT-2 BPE vocab and merges files
 mkdir -p gpt2_bpe
 wget -O gpt2_bpe/encoder.json https://dl.fbaipublicfiles.com/fairseq/gpt2_bpe/encoder.json
@@ -30,8 +34,8 @@ wget -O gpt2_bpe/vocab.bpe https://dl.fbaipublicfiles.com/fairseq/gpt2_bpe/vocab
 wget -O bpe.py https://raw.githubusercontent.com/karpathy/minGPT/master/mingpt/bpe.py
 chmod +x bpe.py
 
-# Run the FlexFlow C++ tokenizer
-./gpt_tokenizer
+# Run the FlexFlow C++ tokenizer (standard GPT-2)
+./gpt_tokenizer gpt-2
 
 # Run the minGPT tokenizer
 cat << EOF > pytokenizer.py
@@ -57,7 +61,47 @@ chmod +x pytokenizer.py
 ./pytokenizer.py
 
 # Check that the outputs match
-diff ./wikitext-103-raw/wiki.valid.bpe.flexflow ./wikitext-103-raw/wiki.valid.bpe.minGPT
+diff ./wikitext-103-raw/wiki.valid.bpe.flexflow.gpt2 ./wikitext-103-raw/wiki.valid.bpe.minGPT
+
+###############################################################################################
+##################################### OPT tests ###############################################
+###############################################################################################
+
+# Download OPT vocab and merge files
+mkdir -p opt_bpe
+wget -O opt_bpe/encoder.json https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-vocab.json
+wget -O opt_bpe/vocab.bpe https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-merges.txt
+
+# Run the FlexFlow C++ tokenizer (OPT)
+./gpt_tokenizer opt
+
+# Run the Huggingface tokenizer
+pip3 install transformers
+cat << EOF > hf_tokenizer.py
+#!/usr/bin/env python
+from transformers import GPT2Tokenizer
+model_id = "facebook/opt-125m"
+tokenizer = GPT2Tokenizer.from_pretrained(model_id)
+inp="./wikitext-103-raw/wiki.valid.raw"
+outp="./wikitext-103-raw/wiki.valid.bpe.OPT"
+with open(inp, "r") as infile:
+    with open(outp, "w+") as outfile:
+        for l in infile.readlines():
+            if len(l.strip()) == 0:
+                outfile.write(l)
+            else:
+                input_ids = tokenizer(l.strip(), return_tensors="pt", padding=False).input_ids
+                out = input_ids.tolist()[0]
+                out = [str(x) for x in out]
+                out = " ".join(out)
+                outfile.write(out)
+                outfile.write("\n")
+EOF
+chmod +x hf_tokenizer.py
+./hf_tokenizer.py
+
+# Check that the outputs match
+diff ./wikitext-103-raw/wiki.valid.bpe.flexflow.opt ./wikitext-103-raw/wiki.valid.bpe.OPT
 
 # Clean up after test
 cleanup

From ebb5f8ea6e8eff1e97f98f727f79541c7298e2ee Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Sun, 14 May 2023 15:06:09 -0400
Subject: [PATCH 124/344] code (#726)

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 src/ops/inc_multihead_self_attention.cu      | 26 ++++++-----------
 src/ops/spec_inc_multihead_self_attention.cu | 30 +++++++-------------
 src/ops/tree_inc_multihead_self_attention.cu | 26 ++++++-----------
 3 files changed, 29 insertions(+), 53 deletions(-)

diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index be86f55de4..fc7c8a7446 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -100,10 +100,14 @@ __global__ void
     // create complex number
     int head_idx = i / (num_tokens * proj_size / 2);
     int idx = i % (num_tokens * proj_size / 2);
+    int token_idx =
+        (i - head_idx * (num_tokens * proj_size / 2)) / (proj_size / 2);
+
     int real_part_index =
-        idx * 2 + head_idx * (q_block_size + k_block_size + v_block_size) +
+        idx + token_idx * (proj_size / 2) +
+        head_idx * (q_block_size + k_block_size + v_block_size) +
         (q_tensor ? 0 : q_block_size);
-    int complex_part_index = real_part_index + 1;
+    int complex_part_index = real_part_index + (proj_size / 2);
 
     complex_input[i] = {input_ptr[real_part_index],
                         input_ptr[complex_part_index]};
@@ -114,8 +118,7 @@ __global__ void
 
     // get position of token
     //  int head_idx = i / (num_tokens * proj_size);
-    int token_idx =
-        (i - head_idx * (num_tokens * proj_size / 2)) / (proj_size / 2);
+
     // size_t pos = id_map[token_idx].token_position;
     size_t pos = tokenInfos[token_idx].abs_depth_in_request;
 
@@ -127,20 +130,9 @@ __global__ void
     cuFloatComplex complex_pos = {cos(freq), sin(freq)};
 
     complex_input[i] = cuCmulf(complex_input[i], complex_pos);
+
     input_ptr[real_part_index] = complex_input[i].x;
-    input_ptr[real_part_index + 1] = complex_input[i].y;
-
-    // if (i % 64 == 1 && head_idx == 0) {
-    //   printf("head id: %d, tokenid: %d, pospospos:->  %d, before real part
-    //   %f, "
-    //          "before complex part: %f, real part: %f,"
-    //          "complext part: %f,  freq_cis real: %f, freq_cis commplexx
-    //          %f\n", head_idx, token_idx, pos, before_real, before_complex,
-    //          complex_input[i].x,
-    //          complex_input[i].y,
-    //          complex_pos.x,
-    //          complex_pos.y);
-    // }
+    input_ptr[complex_part_index] = complex_input[i].y;
   }
 }
 
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 062ef4af03..5850666f56 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -100,10 +100,14 @@ __global__ void
     // create complex number
     int head_idx = i / (num_tokens * proj_size / 2);
     int idx = i % (num_tokens * proj_size / 2);
+    int token_idx =
+        (i - head_idx * (num_tokens * proj_size / 2)) / (proj_size / 2);
+
     int real_part_index =
-        idx * 2 + head_idx * (q_block_size + k_block_size + v_block_size) +
+        idx + token_idx * (proj_size / 2) +
+        head_idx * (q_block_size + k_block_size + v_block_size) +
         (q_tensor ? 0 : q_block_size);
-    int complex_part_index = real_part_index + 1;
+    int complex_part_index = real_part_index + (proj_size / 2);
 
     complex_input[i] = {input_ptr[real_part_index],
                         input_ptr[complex_part_index]};
@@ -114,33 +118,21 @@ __global__ void
 
     // get position of token
     //  int head_idx = i / (num_tokens * proj_size);
-    int token_idx =
-        (i - head_idx * (num_tokens * proj_size / 2)) / (proj_size / 2);
+
+    // size_t pos = id_map[token_idx].token_position;
+    size_t pos = tokenInfos[token_idx].abs_depth_in_request;
 
     // float before_real = complex_input[i].x, before_complex =
     // complex_input[i].y;
 
-    size_t pos = tokenInfos[token_idx].abs_depth_in_request;
     int pos_i = i % (proj_size / 2);
-
     float freq = pos * (1.0 / pow(10000.0, (float)2 * pos_i / proj_size));
     cuFloatComplex complex_pos = {cos(freq), sin(freq)};
 
     complex_input[i] = cuCmulf(complex_input[i], complex_pos);
+
     input_ptr[real_part_index] = complex_input[i].x;
-    input_ptr[real_part_index + 1] = complex_input[i].y;
-
-    // if (i % 64 == 1 && head_idx == 0) {
-    //   printf("head id: %d, tokenid: %d, pospospos:->  %d, before real part
-    //   %f, "
-    //          "before complex part: %f, real part: %f,"
-    //          "complext part: %f,  freq_cis real: %f, freq_cis commplexx
-    //          %f\n", head_idx, token_idx, pos, before_real, before_complex,
-    //          complex_input[i].x,
-    //          complex_input[i].y,
-    //          complex_pos.x,
-    //          complex_pos.y);
-    // }
+    input_ptr[complex_part_index] = complex_input[i].y;
   }
 }
 
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index 86b857a7f9..eb586d858d 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -182,10 +182,14 @@ __global__ void tree_apply_rotary_embedding(
     // create complex number
     int head_idx = i / (num_tokens * proj_size / 2);
     int idx = i % (num_tokens * proj_size / 2);
+    int token_idx =
+        (i - head_idx * (num_tokens * proj_size / 2)) / (proj_size / 2);
+
     int real_part_index =
-        idx * 2 + head_idx * (q_block_size + k_block_size + v_block_size) +
+        idx + token_idx * (proj_size / 2) +
+        head_idx * (q_block_size + k_block_size + v_block_size) +
         (q_tensor ? 0 : q_block_size);
-    int complex_part_index = real_part_index + 1;
+    int complex_part_index = real_part_index + (proj_size / 2);
 
     complex_input[i] = {input_ptr[real_part_index],
                         input_ptr[complex_part_index]};
@@ -196,8 +200,7 @@ __global__ void tree_apply_rotary_embedding(
 
     // get position of token
     //  int head_idx = i / (num_tokens * proj_size);
-    int token_idx =
-        (i - head_idx * (num_tokens * proj_size / 2)) / (proj_size / 2);
+
     // size_t pos = id_map[token_idx].token_position;
     size_t pos = tokenInfos[token_idx].abs_depth_in_request;
 
@@ -209,20 +212,9 @@ __global__ void tree_apply_rotary_embedding(
     cuFloatComplex complex_pos = {cos(freq), sin(freq)};
 
     complex_input[i] = cuCmulf(complex_input[i], complex_pos);
+
     input_ptr[real_part_index] = complex_input[i].x;
-    input_ptr[real_part_index + 1] = complex_input[i].y;
-
-    // if (i % 64 == 1 && head_idx == 0) {
-    //   printf("head id: %d, tokenid: %d, pospospos:->  %d, before real part
-    //   %f, "
-    //          "before complex part: %f, real part: %f,"
-    //          "complext part: %f,  freq_cis real: %f, freq_cis commplexx
-    //          %f\n", head_idx, token_idx, pos, before_real, before_complex,
-    //          complex_input[i].x,
-    //          complex_input[i].y,
-    //          complex_pos.x,
-    //          complex_pos.y);
-    // }
+    input_ptr[complex_part_index] = complex_input[i].y;
   }
 }
 

From 86ec73a6e6ec3ccfffd5d3ba53c9a86dd13af1e2 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 14 May 2023 20:02:39 -0400
Subject: [PATCH 125/344] fix CI

---
 examples/cpp/inference/gpt_tokenizer.cpp      | 12 ++++++++----
 examples/cpp/inference/gpt_tokenizer_test.sh  |  2 +-
 src/ops/tree_inc_multihead_self_attention.cpp |  2 +-
 src/ops/tree_inc_multihead_self_attention.cu  |  2 +-
 4 files changed, 11 insertions(+), 7 deletions(-)

diff --git a/examples/cpp/inference/gpt_tokenizer.cpp b/examples/cpp/inference/gpt_tokenizer.cpp
index 0691145113..a8f188e171 100644
--- a/examples/cpp/inference/gpt_tokenizer.cpp
+++ b/examples/cpp/inference/gpt_tokenizer.cpp
@@ -18,13 +18,15 @@
 #include <string>
 
 int main(int argc, char *argv[]) {
-  if (argc != 2 || (strcmp(argv[1], "gpt-2") && strcmp(argv[1], "opt") )) {
+  if (argc != 2 || (strcmp(argv[1], "gpt-2") && strcmp(argv[1], "opt"))) {
     fprintf(stderr, "Usage: %s <gpt-2|opt>\n", argv[0]);
     return 1;
   }
   tokenizer_mode mode = strcmp(argv[1], "gpt-2") == 0 ? GPT2 : OPT;
-  std::string vocab_file = mode == GPT2 ? "./gpt2_bpe/vocab.bpe" : "opt_bpe/vocab.bpe";
-  std::string merge_file = mode == GPT2 ? "./gpt2_bpe/encoder.json" : "opt_bpe/encoder.json";
+  std::string vocab_file =
+      mode == GPT2 ? "./gpt2_bpe/vocab.bpe" : "opt_bpe/vocab.bpe";
+  std::string merge_file =
+      mode == GPT2 ? "./gpt2_bpe/encoder.json" : "opt_bpe/encoder.json";
 
   GPT_Tokenizer tokenizer(mode, merge_file, vocab_file);
 
@@ -35,7 +37,9 @@ int main(int argc, char *argv[]) {
     std::cout << "Error opening input file" << std::endl;
     return -1;
   }
-  std::ofstream outfile(mode == GPT2 ? "./wikitext-103-raw/wiki.valid.bpe.flexflow.gpt2" : "./wikitext-103-raw/wiki.valid.bpe.flexflow.opt",
+  std::ofstream outfile(mode == GPT2
+                            ? "./wikitext-103-raw/wiki.valid.bpe.flexflow.gpt2"
+                            : "./wikitext-103-raw/wiki.valid.bpe.flexflow.opt",
                         std::ofstream::out);
   if (!outfile) {
     std::cout << "Error opening output file" << std::endl;
diff --git a/examples/cpp/inference/gpt_tokenizer_test.sh b/examples/cpp/inference/gpt_tokenizer_test.sh
index 26f3f71a05..b336dd05ff 100755
--- a/examples/cpp/inference/gpt_tokenizer_test.sh
+++ b/examples/cpp/inference/gpt_tokenizer_test.sh
@@ -80,7 +80,7 @@ pip3 install transformers
 cat << EOF > hf_tokenizer.py
 #!/usr/bin/env python
 from transformers import GPT2Tokenizer
-model_id = "facebook/opt-125m"
+model_id = "facebook/opt-6.7b"
 tokenizer = GPT2Tokenizer.from_pretrained(model_id)
 inp="./wikitext-103-raw/wiki.valid.raw"
 outp="./wikitext-103-raw/wiki.valid.bpe.OPT"
diff --git a/src/ops/tree_inc_multihead_self_attention.cpp b/src/ops/tree_inc_multihead_self_attention.cpp
index f478e13660..28285b72ce 100644
--- a/src/ops/tree_inc_multihead_self_attention.cpp
+++ b/src/ops/tree_inc_multihead_self_attention.cpp
@@ -25,7 +25,7 @@ using Legion::Memory;
 
 /*static*/
 void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
-    TreeIncMultiHeadSelfAttentionMeta const *m,
+    TreeIncMultiHeadSelfAttentionMeta *m,
     TreeVerifyBatchConfig const *bc,
     float const *input_ptr,
     float const *weight_ptr,
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index eb586d858d..ef474193ef 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -406,7 +406,7 @@ __global__ void update_tree_branch_kv_cache(
         (i / proj_size) % num_tokens_in_branch; // index in the tree branch
     int head_idx = i / (proj_size * num_tokens_in_branch);
 
-    token_idx += processed_tokens_in_batch;     // get index in the whole batch
+    token_idx += processed_tokens_in_batch; // get index in the whole batch
     int qkv_block_size = (qProjSize + kProjSize + vProjSize) *
                          total_tokens_in_batch; // skip over previous heads
     int current_head_block_size =

From 8423610f42653acfaddbf37bc7f0f4321ce544bb Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Sun, 14 May 2023 21:07:11 -0400
Subject: [PATCH 126/344] Kernel bug fix (#728)

* complex into metadata

* topk

* format

---------

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 include/flexflow/ops/beam_topk.h              |  5 ++
 .../ops/inc_multihead_self_attention.h        |  1 +
 .../ops/spec_inc_multihead_self_attention.h   |  1 +
 .../ops/tree_inc_multihead_self_attention.h   |  1 +
 src/ops/beam_topk.cu                          | 56 ++++++++-----------
 src/ops/inc_multihead_self_attention.cu       | 18 +++---
 src/ops/spec_inc_multihead_self_attention.cu  | 19 +++----
 src/ops/tree_inc_multihead_self_attention.cu  | 16 +++---
 8 files changed, 57 insertions(+), 60 deletions(-)

diff --git a/include/flexflow/ops/beam_topk.h b/include/flexflow/ops/beam_topk.h
index 7f8c28d9f8..9fc0be22f4 100644
--- a/include/flexflow/ops/beam_topk.h
+++ b/include/flexflow/ops/beam_topk.h
@@ -13,6 +13,11 @@ class BeamTopKMeta : public OpMeta {
   BeamTopKMeta(FFHandler handle);
   bool sorted;
   int max_beam_width;
+  int *parent_ids;
+  float *acc_probs;
+  int *block_start_index;
+  int *request_id;
+  int *tokens_per_request;
 };
 
 class BeamTopK : public Op {
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index 410c30abd9..4721086ec0 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -144,6 +144,7 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
   float *qk_prods, *qk_prods_softmax;
   float *attn_heads, *W_out_contiguous;
   BatchConfig::PerTokenInfo *token_infos;
+  cuFloatComplex *complex_input;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention.h b/include/flexflow/ops/spec_inc_multihead_self_attention.h
index 4acab0a6ab..30e122278a 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention.h
@@ -152,6 +152,7 @@ class SpecIncMultiHeadSelfAttentionMeta : public OpMeta {
   float *devQKVProjArray, *keyCache, *valueCache;
   float *qk_prods, *qk_prods_softmax;
   float *attn_heads, *W_out_contiguous;
+  cuFloatComplex *complex_input;
   // void *reserveSpace;
 
   // BatchConfig::token_idxs *dev_token2ids;
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention.h b/include/flexflow/ops/tree_inc_multihead_self_attention.h
index 0e54bd50d0..fce4998e5d 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention.h
@@ -144,6 +144,7 @@ class TreeIncMultiHeadSelfAttentionMeta : public OpMeta {
   float *devQKVProjArray, *keyCache, *valueCache;
   float *qk_prods, *qk_prods_softmax;
   float *attn_heads, *W_out_contiguous;
+  cuFloatComplex *complex_input;
 
   TreeVerifyBatchConfig::PerTokenInfo *token_infos;
   TreeVerifyBatchConfig::CommittedTokensInfo *committed_token_infos;
diff --git a/src/ops/beam_topk.cu b/src/ops/beam_topk.cu
index b41b4c2ba4..b6fccb68ba 100644
--- a/src/ops/beam_topk.cu
+++ b/src/ops/beam_topk.cu
@@ -607,38 +607,23 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
   assert(num_shards >= (size_t)max_heap_size);
   num_shards = max_heap_size;
 
-  // parent_id, per token
-  int *gpu_parents;
-  // acc_porbs, per token
-  float *gpu_probs;
-  // each block's start index;
-  // one block means the single token in different requests;
-  int *gpu_block_start_index;
-  int *gpu_request_id;
-  int *gpu_tokens_per_request;
-
-  checkCUDA(cudaMalloc(&gpu_parents, sizeof(int) * max_total_requests));
-  checkCUDA(cudaMalloc(&gpu_probs, sizeof(float) * max_total_requests));
-  checkCUDA(cudaMalloc(&gpu_block_start_index, sizeof(int) * beam_num_blocks));
-  checkCUDA(cudaMalloc(&gpu_request_id, sizeof(int) * beam_num_blocks));
-  checkCUDA(cudaMalloc(&gpu_tokens_per_request, sizeof(int) * beam_num_blocks));
-  checkCUDA(cudaMemcpy(gpu_parents,
+  checkCUDA(cudaMemcpy(m->parent_ids,
                        parent_ids,
                        sizeof(int) * max_total_requests,
                        cudaMemcpyHostToDevice));
-  checkCUDA(cudaMemcpy(gpu_probs,
+  checkCUDA(cudaMemcpy(m->acc_probs,
                        acc_probs,
                        sizeof(float) * max_total_requests,
                        cudaMemcpyHostToDevice));
-  checkCUDA(cudaMemcpy(gpu_block_start_index,
+  checkCUDA(cudaMemcpy(m->block_start_index,
                        beam_block_start_index.data(),
                        sizeof(int) * beam_num_blocks,
                        cudaMemcpyHostToDevice));
-  checkCUDA(cudaMemcpy(gpu_request_id,
+  checkCUDA(cudaMemcpy(m->request_id,
                        request_id.data(),
                        sizeof(int) * beam_num_blocks,
                        cudaMemcpyHostToDevice));
-  checkCUDA(cudaMemcpy(gpu_tokens_per_request,
+  checkCUDA(cudaMemcpy(m->tokens_per_request,
                        tokens_per_request.data(),
                        sizeof(int) * beam_num_blocks,
                        cudaMemcpyHostToDevice));
@@ -649,11 +634,11 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
       length,
       max_beam_width,
       max_heap_size,
-      gpu_parents,
-      gpu_probs,
-      gpu_block_start_index,
-      gpu_request_id,
-      gpu_tokens_per_request,
+      m->parent_ids,
+      m->acc_probs,
+      m->block_start_index,
+      m->request_id,
+      m->tokens_per_request,
       sorted,
       output_ptr,
       indices_ptr,
@@ -703,13 +688,20 @@ void BeamTopK::forward_kernel_wrapper(BeamTopKMeta const *m,
     cudaEventDestroy(t_end);
     printf("[BeamTopK] forward time = %.2lfms\n", elapsed);
   }
-  // if(bc->beam_slots.at(0).current_depth == 1){
-  //     print_beam_tensor<float>((float *)input_ptr, 50, 32000, 15, "beam topk
-  //     input"); print_tensor<float>((float *)output_ptr, 50, "beam topk
-  //     output");
-  // }
 }
 
-BeamTopKMeta::BeamTopKMeta(FFHandler handler) : OpMeta(handler) {}
-
+BeamTopKMeta::BeamTopKMeta(FFHandler handler) : OpMeta(handler) {
+  checkCUDA(cudaMalloc(&parent_ids,
+                       sizeof(int) * BeamSearchBatchConfig::MAX_BEAM_WIDTH *
+                           BeamSearchBatchConfig::MAX_NUM_REQUESTS));
+  checkCUDA(cudaMalloc(&acc_probs,
+                       sizeof(float) * BeamSearchBatchConfig::MAX_BEAM_WIDTH *
+                           BeamSearchBatchConfig::MAX_NUM_REQUESTS));
+  checkCUDA(cudaMalloc(&block_start_index,
+                       sizeof(int) * BeamSearchBatchConfig::MAX_NUM_REQUESTS));
+  checkCUDA(cudaMalloc(&request_id,
+                       sizeof(int) * BeamSearchBatchConfig::MAX_NUM_REQUESTS));
+  checkCUDA(cudaMalloc(&tokens_per_request,
+                       sizeof(int) * BeamSearchBatchConfig::MAX_NUM_REQUESTS));
+}
 }; // namespace FlexFlow
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index fc7c8a7446..099e54305c 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -124,7 +124,6 @@ __global__ void
 
     // float before_real = complex_input[i].x, before_complex =
     // complex_input[i].y;
-
     int pos_i = i % (proj_size / 2);
     float freq = pos * (1.0 / pow(10000.0, (float)2 * pos_i / proj_size));
     cuFloatComplex complex_pos = {cos(freq), sin(freq)};
@@ -252,8 +251,6 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
   int q_block_size = m->qProjSize * num_tokens;
   int k_block_size = m->kProjSize * num_tokens;
   int v_block_size = m->vProjSize * num_tokens;
-  cuFloatComplex *complex_input;
-
   // apply bias for q, k, v
   if (*m->bias) {
     apply_proj_bias_qkv<<<GET_BLOCKS(parallelism),
@@ -271,15 +268,12 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
   }
 
   if (*m->apply_rotary_embedding) {
-    checkCUDA(cudaMalloc(&complex_input,
-                         num_tokens * m->qProjSize * m->num_heads *
-                             sizeof(cuFloatComplex *) / 2));
     /*q*/
     apply_rotary_embedding<<<GET_BLOCKS(parallelism),
                              min(CUDA_NUM_THREADS, parallelism),
                              0,
                              stream>>>(output_ptr,
-                                       complex_input,
+                                       m->complex_input,
                                        m->token_infos,
                                        m->qProjSize,
                                        m->kProjSize,
@@ -294,7 +288,7 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                              min(CUDA_NUM_THREADS, parallelism),
                              0,
                              stream>>>(output_ptr,
-                                       complex_input,
+                                       m->complex_input,
                                        m->token_infos,
                                        m->qProjSize,
                                        m->kProjSize,
@@ -751,12 +745,14 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
         BatchConfig::MAX_NUM_TOKENS * num_heads * vProjSize;
     size_t W_out_block_size = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
     size_t W_out_contiguous_size = W_out_block_size * num_heads;
+    size_t complex_size =
+        (BatchConfig::MAX_NUM_TOKENS * qProjSize * num_heads) / 2;
     size_t totalSize =
         (qkv_max_proj_size + key_cache_size + value_cache_size +
          2 * qk_prod_size + attn_heads_size + W_out_contiguous_size) *
             sizeof(float) +
-        tokeninfo_size *
-            sizeof(BatchConfig::PerTokenInfo); // more components will
+        tokeninfo_size * sizeof(BatchConfig::PerTokenInfo) +
+        complex_size * sizeof(cuFloatComplex); // more components will
                                                // be added here later
 
     Realm::Rect<1, coord_t> bounds(Realm::Point<1, coord_t>(0),
@@ -778,6 +774,8 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     qk_prods_softmax = (float *)(qk_prods + qk_prod_size);
     attn_heads = (float *)qk_prods_softmax + qk_prod_size;
     W_out_contiguous = (float *)attn_heads + attn_heads_size;
+    complex_input =
+        (cuFloatComplex *)(W_out_contiguous + W_out_contiguous_size);
     int parallelism = vProjSize * oProjSize * num_heads;
     build_w_out_tensor<<<GET_BLOCKS(parallelism),
                          min(CUDA_NUM_THREADS, parallelism),
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 5850666f56..ec13569665 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -253,8 +253,6 @@ void compute_qkv_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   int q_block_size = m->qProjSize * num_tokens;
   int k_block_size = m->kProjSize * num_tokens;
   int v_block_size = m->vProjSize * num_tokens;
-  cuFloatComplex *complex_input;
-
   // apply bias for q, k, v
   if (*m->bias) {
     spec_apply_proj_bias_qkv<<<GET_BLOCKS(parallelism),
@@ -272,15 +270,12 @@ void compute_qkv_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   }
 
   if (*m->apply_rotary_embedding) {
-    checkCUDA(cudaMalloc(&complex_input,
-                         num_tokens * m->qProjSize * m->num_heads *
-                             sizeof(cuFloatComplex *) / 2));
     /*q*/
     spec_apply_rotary_embedding<<<GET_BLOCKS(parallelism),
                                   min(CUDA_NUM_THREADS, parallelism),
                                   0,
                                   stream>>>(output_ptr,
-                                            complex_input,
+                                            m->complex_input,
                                             m->tokenInfos,
                                             m->qProjSize,
                                             m->kProjSize,
@@ -295,7 +290,7 @@ void compute_qkv_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                                   min(CUDA_NUM_THREADS, parallelism),
                                   0,
                                   stream>>>(output_ptr,
-                                            complex_input,
+                                            m->complex_input,
                                             m->tokenInfos,
                                             m->qProjSize,
                                             m->kProjSize,
@@ -900,6 +895,8 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
         BeamSearchBatchConfig::MAX_NUM_TOKENS * num_heads * vProjSize;
     size_t W_out_block_size = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
     size_t W_out_contiguous_size = W_out_block_size * num_heads;
+    size_t complex_size =
+        (BeamSearchBatchConfig::MAX_NUM_TOKENS * qProjSize * num_heads) / 2;
     size_t totalSize =
         (qkv_max_proj_size + key_cache_size + value_cache_size +
          2 * qk_prod_size + attn_heads_size + W_out_contiguous_size) *
@@ -909,9 +906,9 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
         beam_tokeninfo_size *
             sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo) +
         beam_requestinfo_size *
-            sizeof(BeamSearchBatchConfig::
-                       BeamSearchPerRequestInfo); // more components will
-                                                  // be added here later
+            sizeof(BeamSearchBatchConfig::BeamSearchPerRequestInfo) +
+        complex_size * sizeof(cuFloatComplex); // more components will
+                                               // be added here later
 
     Realm::Rect<1, coord_t> bounds(Realm::Point<1, coord_t>(0),
                                    Realm::Point<1, coord_t>(totalSize - 1));
@@ -944,6 +941,8 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
     qk_prods_softmax = (float *)(qk_prods + qk_prod_size);
     attn_heads = (float *)qk_prods_softmax + qk_prod_size;
     W_out_contiguous = (float *)attn_heads + attn_heads_size;
+    complex_input =
+        (cuFloatComplex *)(W_out_contiguous + W_out_contiguous_size);
     int parallelism = vProjSize * oProjSize * num_heads;
     spec_build_w_out_tensor<<<GET_BLOCKS(parallelism),
                               min(CUDA_NUM_THREADS, parallelism),
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index ef474193ef..c2864cc181 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -331,8 +331,6 @@ void compute_qkv_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
   int q_block_size = m->qProjSize * num_tokens;
   int k_block_size = m->kProjSize * num_tokens;
   int v_block_size = m->vProjSize * num_tokens;
-  cuFloatComplex *complex_input;
-
   // apply bias for q, k, v
   if (*m->bias) {
     tree_apply_proj_bias_qkv<<<GET_BLOCKS(parallelism),
@@ -349,15 +347,12 @@ void compute_qkv_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                                          m->scaling_factor);
   }
   if (*m->apply_rotary_embedding) {
-    checkCUDA(cudaMalloc(&complex_input,
-                         num_tokens * m->qProjSize * m->num_heads *
-                             sizeof(cuFloatComplex *) / 2));
     /*q*/
     tree_apply_rotary_embedding<<<GET_BLOCKS(parallelism),
                                   min(CUDA_NUM_THREADS, parallelism),
                                   0,
                                   stream>>>(output_ptr,
-                                            complex_input,
+                                            m->complex_input,
                                             m->token_infos,
                                             m->qProjSize,
                                             m->kProjSize,
@@ -372,7 +367,7 @@ void compute_qkv_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                                   min(CUDA_NUM_THREADS, parallelism),
                                   0,
                                   stream>>>(output_ptr,
-                                            complex_input,
+                                            m->complex_input,
                                             m->token_infos,
                                             m->qProjSize,
                                             m->kProjSize,
@@ -868,13 +863,16 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
         TreeVerifyBatchConfig::MAX_NUM_TOKENS * num_heads * vProjSize;
     size_t W_out_block_size = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
     size_t W_out_contiguous_size = W_out_block_size * num_heads;
+    size_t complex_size =
+        (TreeVerifyBatchConfig::MAX_NUM_TOKENS * qProjSize * num_heads) / 2;
     size_t totalSize =
         (qkv_max_proj_size + key_cache_size + value_cache_size +
          2 * qk_prod_size + attn_heads_size + W_out_contiguous_size) *
             sizeof(float) +
         tokeninfo_size * sizeof(TreeVerifyBatchConfig::PerTokenInfo) +
         committed_tokeninfo_size *
-            sizeof(TreeVerifyBatchConfig::CommittedTokensInfo);
+            sizeof(TreeVerifyBatchConfig::CommittedTokensInfo) +
+        complex_size * sizeof(cuFloatComplex);
 
     Realm::Rect<1, coord_t> bounds(Realm::Point<1, coord_t>(0),
                                    Realm::Point<1, coord_t>(totalSize - 1));
@@ -899,6 +897,8 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
     qk_prods_softmax = (float *)(qk_prods + qk_prod_size);
     attn_heads = (float *)qk_prods_softmax + qk_prod_size;
     W_out_contiguous = (float *)attn_heads + attn_heads_size;
+    complex_input =
+        (cuFloatComplex *)(W_out_contiguous + W_out_contiguous_size);
     int parallelism = vProjSize * oProjSize * num_heads;
     tree_build_w_out_tensor<<<GET_BLOCKS(parallelism),
                               min(CUDA_NUM_THREADS, parallelism),

From c9b2c5dd317efe7c7defc2c7a6d900d02ddb3f1d Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 15 May 2023 11:24:29 -0400
Subject: [PATCH 127/344] add decoder for gpt tokenizer

---
 examples/cpp/inference/gpt_tokenizer.cc  | 46 ++++++++++++++++++++++++
 examples/cpp/inference/gpt_tokenizer.cpp |  2 ++
 examples/cpp/inference/gpt_tokenizer.h   |  6 ++++
 3 files changed, 54 insertions(+)

diff --git a/examples/cpp/inference/gpt_tokenizer.cc b/examples/cpp/inference/gpt_tokenizer.cc
index 437c4aa551..1cb2bc1111 100644
--- a/examples/cpp/inference/gpt_tokenizer.cc
+++ b/examples/cpp/inference/gpt_tokenizer.cc
@@ -59,6 +59,12 @@ wchar_t *GPT_Tokenizer::bytes_to_unicode() {
   return bytes_mapping;
 }
 
+void GPT_Tokenizer::unicode_to_bytes() {
+  for (int i = 0; i < 256; i++) {
+    bytes_decoder[bytes_encoder[i]] = (char)i;
+  }
+}
+
 std::vector<std::string> GPT_Tokenizer::split(std::string const &s,
                                               std::regex rgx) {
   std::vector<std::string> elems;
@@ -115,6 +121,7 @@ void GPT_Tokenizer::load_vocab(std::string const &vocab_file) {
   auto vocab_ = vocab_data_.get<std::unordered_map<std::string, int64_t>>();
   for (auto item : vocab_) {
     vocab.insert({item.first, item.second});
+    inverse_vocab.insert({item.second, item.first});
   }
 };
 
@@ -275,3 +282,42 @@ void GPT_Tokenizer::encode(std::string str,
     input_ids->insert(input_ids->begin(), 2);
   }
 }
+
+std::string GPT_Tokenizer::decode(std::vector<int64_t> input_ids,
+                                  std::vector<int64_t> mask_ids) {
+  // look up each number in encoder.json dictionary
+  std::ostringstream oss;
+  int index = 0;
+  for (auto const &id : input_ids) {
+    if (index == 0) {
+      if (mode == OPT) {
+        assert(id == 2);
+        index++;
+        continue;
+      }
+    }
+    if (!mask_ids[index]) {
+      index++;
+      continue;
+    }
+    auto it = inverse_vocab.find(id);
+    if (it != inverse_vocab.end()) {
+      oss << it->second;
+    } else {
+      // Handle the case when the integer is not found in the inverse_vocab map.
+      // You can choose to ignore it, skip it, or handle it differently based on
+      // your requirements.
+      assert(false);
+    }
+    index++;
+  }
+  std::string concatenated_tokens = oss.str();
+  // apply byte_decoder to each character in the input_ids string, then decode
+  // as utf-8
+  std::wstring wstr = utf8_to_wstring(concatenated_tokens);
+  std::string result;
+  for (wchar_t ch : wstr) {
+    result += bytes_decoder[ch];
+  }
+  return result;
+}
diff --git a/examples/cpp/inference/gpt_tokenizer.cpp b/examples/cpp/inference/gpt_tokenizer.cpp
index a8f188e171..8712f0e6b6 100644
--- a/examples/cpp/inference/gpt_tokenizer.cpp
+++ b/examples/cpp/inference/gpt_tokenizer.cpp
@@ -70,6 +70,8 @@ int main(int argc, char *argv[]) {
         }
       }
       outfile << std::endl;
+      std::string decoded_line = tokenizer.decode(input_ids, mask_ids);
+      assert(decoded_line == stripped_line);
       input_ids.clear();
       mask_ids.clear();
     }
diff --git a/examples/cpp/inference/gpt_tokenizer.h b/examples/cpp/inference/gpt_tokenizer.h
index 476b47fee1..701436076a 100644
--- a/examples/cpp/inference/gpt_tokenizer.h
+++ b/examples/cpp/inference/gpt_tokenizer.h
@@ -53,6 +53,7 @@ class GPT_Tokenizer {
     unk_token = unk_token_str;
     mask_token = mask_token_str;
     bytes_encoder = bytes_to_unicode();
+    unicode_to_bytes();
   };
   // ~GPT_Tokenizer();
   std::vector<std::string> bpe(std::wstring token);
@@ -62,6 +63,8 @@ class GPT_Tokenizer {
               size_t max_length,
               std::vector<int64_t> *input_ids,
               std::vector<int64_t> *mask_ids);
+  std::string decode(std::vector<int64_t> input_ids,
+                     std::vector<int64_t> mask_ids);
   tokenizer_mode mode;
   std::string bos_token;
   std::string eos_token;
@@ -72,9 +75,12 @@ class GPT_Tokenizer {
 
 private:
   std::unordered_map<std::string, int64_t> vocab;
+  std::unordered_map<int64_t, std::string> inverse_vocab;
   std::unordered_map<wbigram_pair, uint32_t, hash_pair> bpe_ranks;
   wchar_t *bytes_to_unicode();
+  void unicode_to_bytes();
   wchar_t *bytes_encoder;
+  std::unordered_map<wchar_t, char> bytes_decoder;
   uint32_t cache_max_size = 500000;
   uint32_t cache_word_max_length = 30;
   std::string unicode_letter_expr =

From 555aa33837593cb0a725771b3f988f3ecc6d3fcb Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Mon, 15 May 2023 23:03:39 -0500
Subject: [PATCH 128/344] Spec infer demo (#724)

* Support multiple FFModels in a single top_level_task

* [TreeVerifyMHA] bug fixes

* bug fixes

* TreeIncMHA and SpecIncMHA bug fixes

* fomat.

* .

* add sentence piece tokenizer

* format

* prepare spec_infer demo

* prettier prints

* make the llama model work

* add small model config

* enable speculative inference for spec_infer

* fix

* rename

* fix one of the bugs

* fix

* del

* attempt to fix ci

* integrated gpt/opt tokenizer

* integrate opt tokenizer with pipeline

* .

* format

* move files

* Update README.md

* add an overview figure

* update images

* Update README.md

* Update README.md

* Update README.md

* Update README.md

* Update README.md

* add tokenizer in readme

* fix

* fix

* fix

* Update README.md

* Update README.md

* add gif

* add weights to readme, clean some print

* Update README.md

* update demo

* Update README.md

* Update README.md

* remove outdate file

* Update README.md

* Update README.md

* .

---------

Co-authored-by: xinhaoc <chengxh_98@163.com>
Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
Co-authored-by: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
---
 .github/README.md                             |  98 +++++
 .github/workflows/build.yml                   |   4 +
 .gitmodules                                   |   3 +
 CMakeLists.txt                                |  22 +-
 config/config.linux                           |   2 +-
 deps/sentencepiece                            |   1 +
 examples/cpp/inference/LLAMA/CMakeLists.txt   |   8 +-
 examples/cpp/inference/LLAMA/llama.cc         | 325 ++++-----------
 examples/cpp/inference/LLAMA/llama.h          | 112 -----
 examples/cpp/inference/SPEC_LLAMA/README.md   |  14 -
 examples/cpp/inference/SPEC_LLAMA/llama.cc    | 197 ---------
 .../llama_spec_pipeline/CMakeLists.txt        |   6 +-
 .../inference/llama_spec_pipeline/llama.cc    |  69 +++-
 .../mixture_of_experts/CMakeLists.txt         |   2 +-
 examples/cpp/inference/opt/CMakeLists.txt     |   3 +-
 .../opt_spec_pipeline/CMakeLists.txt          |   6 +-
 .../opt_spec_pipeline/opt_pipeline.cc         |  24 +-
 .../cpp/inference/transformers/CMakeLists.txt |   2 +-
 img/overview.png                              | Bin 0 -> 209735 bytes
 img/performance.png                           | Bin 0 -> 18951 bytes
 img/spec_infer_demo.gif                       | Bin 0 -> 4302606 bytes
 include/flexflow/batch_config.h               |  16 +-
 include/flexflow/inference.h                  |  21 +-
 include/flexflow/tokenizers.h                 | 103 +++++
 .../cpp/inference => include}/gpt_tokenizer.h |  14 +-
 .../inference => inference}/file_loader.cc    |  29 --
 .../cpp/inference => inference}/file_loader.h |   0
 .../inference => inference}/models/llama.cc   |  49 ++-
 .../inference => inference}/models/llama.h    |  25 +-
 .../cpp/inference => inference}/models/opt.cc |   0
 .../cpp/inference => inference}/models/opt.h  |  22 +-
 .../spec_infer}/CMakeLists.txt                |  12 +-
 inference/spec_infer/MODEL_WEIGHTS.md         |  27 ++
 .../spec_infer}/Makefile                      |   4 +-
 inference/spec_infer/spec_infer.cc            | 151 +++++++
 src/ops/beam_topk.cc                          |   8 +-
 src/ops/beam_topk.cu                          |  72 ++--
 src/ops/inc_multihead_self_attention.cc       |   8 +-
 src/ops/spec_inc_multihead_self_attention.cu  |  16 +-
 src/ops/tree_inc_multihead_self_attention.cc  |   9 +-
 src/ops/tree_inc_multihead_self_attention.cu  |   4 +-
 src/runtime/batch_config.cc                   |   7 +-
 src/runtime/beam_search_batch_config.cc       |   6 +-
 .../runtime}/gpt_tokenizer.cc                 |  26 +-
 src/runtime/inference_manager.cc              |  10 +-
 src/runtime/model.cc                          |  22 +-
 src/runtime/request_manager.cc                | 388 ++++++++++++------
 src/runtime/tree_verify_batch_config.cc       |  33 ++
 .../cpp/inference => tests}/gpt_tokenizer.cpp |   4 +-
 .../inference => tests}/gpt_tokenizer_test.sh |   2 +-
 50 files changed, 1104 insertions(+), 882 deletions(-)
 create mode 100644 .github/README.md
 create mode 160000 deps/sentencepiece
 delete mode 100644 examples/cpp/inference/LLAMA/llama.h
 delete mode 100644 examples/cpp/inference/SPEC_LLAMA/README.md
 delete mode 100644 examples/cpp/inference/SPEC_LLAMA/llama.cc
 create mode 100644 img/overview.png
 create mode 100644 img/performance.png
 create mode 100644 img/spec_infer_demo.gif
 create mode 100644 include/flexflow/tokenizers.h
 rename {examples/cpp/inference => include}/gpt_tokenizer.h (96%)
 rename {examples/cpp/inference => inference}/file_loader.cc (86%)
 rename {examples/cpp/inference => inference}/file_loader.h (100%)
 rename {examples/cpp/inference => inference}/models/llama.cc (83%)
 rename {examples/cpp/inference => inference}/models/llama.h (65%)
 rename {examples/cpp/inference => inference}/models/opt.cc (100%)
 rename {examples/cpp/inference => inference}/models/opt.h (85%)
 rename {examples/cpp/inference/SPEC_LLAMA => inference/spec_infer}/CMakeLists.txt (79%)
 create mode 100644 inference/spec_infer/MODEL_WEIGHTS.md
 rename {examples/cpp/inference/SPEC_LLAMA => inference/spec_infer}/Makefile (94%)
 create mode 100644 inference/spec_infer/spec_infer.cc
 rename {examples/cpp/inference => src/runtime}/gpt_tokenizer.cc (93%)
 create mode 100644 src/runtime/tree_verify_batch_config.cc
 rename {examples/cpp/inference => tests}/gpt_tokenizer.cpp (97%)
 rename {examples/cpp/inference => tests}/gpt_tokenizer_test.sh (96%)

diff --git a/.github/README.md b/.github/README.md
new file mode 100644
index 0000000000..fdc52c53c4
--- /dev/null
+++ b/.github/README.md
@@ -0,0 +1,98 @@
+# SpecInfer
+![build](https://github.com/flexflow/flexflow/workflows/build/badge.svg?branch=master) ![gpu tests](https://github.com/flexflow/flexflow/workflows/gpu-ci/badge.svg?branch=master) ![multinode gpu tests](https://github.com/flexflow/flexflow/workflows/multinode-test/badge.svg?branch=master) ![docker](https://github.com/flexflow/flexflow/workflows/docker-build/badge.svg?branch=master) ![pip](https://github.com/flexflow/flexflow/workflows/pip-install/badge.svg?branch=master) ![shell-check](https://github.com/flexflow/flexflow/workflows/Shell%20Check/badge.svg?branch=master) ![clang-format](https://github.com/flexflow/flexflow/workflows/clang-format%20Check/badge.svg?branch=master) [![Documentation Status](https://readthedocs.org/projects/flexflow/badge/?version=latest)](https://flexflow.readthedocs.io/en/latest/?badge=latest)
+
+<p align="center">
+<img src="../img/spec_infer_demo.gif" alt="A SpecInfer Demo" width="630"/>
+</p>
+
+## What is SpecInfer
+
+<p align="center">
+<img src="../img/overview.png" alt="An overview of SpecInfer" width="620"/>
+</p>
+  
+The high computational and memory requirements of generative large language
+models (LLMs) make it challenging to serve them quickly and cheaply. 
+SpecInfer is an open-source distributed multi-GPU system that accelerates generative LLM
+inference with __speculative inference__ and __token tree verification__. A key insight
+behind SpecInfer is to combine various collectively boost-tuned small speculative
+models (SSMs) to jointly predict the LLM’s outputs; the predictions are organized as a
+token tree, whose nodes each represent a candidate token sequence. The correctness
+of all candidate token sequences represented by a token tree is verified against the
+LLM’s output in parallel using a novel tree-based parallel decoding mechanism.
+SpecInfer uses an LLM as a token tree verifier instead of an incremental decoder,
+which largely reduces the end-to-end inference latency and computational requirement
+for serving generative LLMs while provably preserving model quality.
+
+<p align="center">
+<img src="../img/performance.png" alt="Performance comparison" height="320"/>
+</p>
+
+## Install SpecInfer
+SpecInfer is built on top of FlexFlow. You can install SpecInfer by building the inference branch of FlexFlow. Please read the [instructions](INSTALL.md) for installing FlexFlow from source code. If you would like to quickly try SpecInfer, we also provide pre-built Docker packages ([flexflow-cuda](https://github.com/flexflow/FlexFlow/pkgs/container/flexflow-cuda) with a CUDA backend, [flexflow-hip_rocm](https://github.com/flexflow/FlexFlow/pkgs/container/flexflow-hip_rocm) with a HIP-ROCM backend) with all dependencies pre-installed (N.B.: currently, the CUDA pre-built containers are only fully compatible with host machines that have CUDA 11.7 installed), together with [Dockerfiles](./docker) if you wish to build the containers manually. 
+
+## Run SpecInfer
+The source code of the SpecInfer pipeline is available at [this folder](../inference/spec_infer/). The SpecInfer executable will be available at `/build_dir/inference/spec_infer/spec_infer` at compilation. You can use the following command-line arguments to run SpecInfer:
+
+* `-ll:gpu`: number of GPU processors to use on each node for serving an LLM (default: 0)
+* `-ll:fsize`: size of device memory on each GPU in MB
+* `-ll:zsize`: size of zero-copy memory (pinned DRAM with direct GPU access) in MB. SpecInfer keeps a replica of the LLM parameters on zero-copy memory, and therefore requires that the zero-copy memory is sufficient for storing the LLM parameters.
+* `-llm-weight`: path to the folder that stores the LLM weights
+* `-ssm-weight`: path to the folder that stores the small speculative models' weights. You can use multiple `-ssm-weight`s in the command line to launch multiple SSMs.
+* `-tokenizer`: path to the tokenizer file (see [Tokenizers](#tokenizers) for preparing a tokenizer for SpecInfer).
+* `-prompt`: (optional) path to the prompt file. SpecInfer expects a json format file for prompts, all of which will be served by SpecInfer. In addition, users can also use the following API for registering requests:
+
+```c++
+class RequestManager {
+  RequestGuid register_new_request(std::string const &prompt, int max_sequence_length);
+}
+```
+For example, you can use the following command line to serve a LLaMA-6B or LLaMA-13B model on 4 GPUs and use two collectively boost-tuned LLaMA-190M models for speculative inference.
+
+```bash
+./inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-weight /path/to/llm/weights -ssm-weight /path/to/ssm1/weights -smm-weight /path/to/ssm2/weights -tokenizer /path/to/tokenizer.model -prompt /path/to/prompt.json
+```
+
+### Tokenizers
+SpecInfer supports two tokenizers:
+
+* The SentencePiece tokenizer is used to support the LLaMA model family (e.g., LLaMA-6B, LLaMA-13B, and LLaMA-190M in our demo). We used the pretrained sentence piece tokenizer from Hugging Face (model id: [decapoda-research/llama-7b-hf](https://huggingface.co/decapoda-research/llama-7b-hf/blob/main/tokenizer.model)).
+* The GPT2 tokenizer is used to support the Open Pre-trained Transformer model family (e.g., OPT-13B and OPT-125M). To use it, download the [vocab](https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-vocab.json) and [merges](https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-merges.txt) files and pass the folder containing them as a parameter. 
+
+### LLM Weights
+The weight files using in our demo is extracted from HuggingFace, and stored in our AWS S3 bucket.
+
+|  Model   | Model id on Hugging Face  | Storage Location |
+|  :----  | :----  | :----  |
+| LLaMA-7B | decapoda-research/llama-7b-hf | s3://catalyst-llama/Flexflow_LLM_weights/LLAMA/llama_7B_weights.tar.gz |
+| LLaMA-190M  | Bingsu/llama-190m-arch | s3://catalyst-llama/Flexflow_LLM_weights/LLAMA/llama_190m_weights.tar.gz |
+| OPT-6.7B  | facebook/opt-6.7b | s3://catalyst-llama/Flexflow_LLM_weights/OPT/opt_6B_weights.tar.gz |
+| OPT-125M  | facebook/opt-125m | s3://catalyst-llama/Flexflow_LLM_weights/OPT/opt_125m_native.tar.gz |
+
+You can use [this script](../inference/spec_infer/MODEL_WEIGHTS.md) to convert the weights of a HuggingFace LLM to the SpecInfer weight format.
+
+### Prompt Datasets
+We have evaluated SpecInfer on the following prompts datasets: [Chatbot instruction prompts](https://specinfer.s3.us-east-2.amazonaws.com/prompts/chatbot.json), [ChatGPT Prompts](https://specinfer.s3.us-east-2.amazonaws.com/prompts/chatgpt.json), [WebQA](https://specinfer.s3.us-east-2.amazonaws.com/prompts/webqa.json), [Alpaca](https://specinfer.s3.us-east-2.amazonaws.com/prompts/alpaca.json), and [PIQA](https://specinfer.s3.us-east-2.amazonaws.com/prompts/piqa.json).
+
+## Difference between SpecInfer and HuggingFace Assistant Model
+
+There are two major differences between the two systems.
+
+* First, the HuggingFace assistant model produces a single candidate token sequence during speculation, while SpecInfer generates and verifies a speculated token tree, whose tokens each represent a candidate token sequence. To deal with the more complex verification task, SpecInfer includes a number of systems and algorithmic optimizations to quickly and efficiently verify all tokens of a token tree in parallel.
+ 
+* Second, instead of considering a single assistant model, SpecInfer combines a variety of collectively boost-tuned small speculative models (SSMs) to jointly predict the LLM's outputs. We observe that using multiple boost-tuned SSMs is critical for improving speculative performance.
+
+## TODOs
+
+SpecInfer is under active development. We currently focus on the following tasks and strongly welcome all contributions to SpecInfer from bug fixes to new features and extensions.
+
+* Low-precision and mixed-precision support. The current version uses single-precision floating points for computing tree attention. We are actively working on support half-precision floating points, and int4 and int8 quantizations.
+* Offloading-based generative LLM inference. Another promising avenue for future work is using speculative inference and token tree verification to reduce the end-to-end inference for offloading-based generative LLM inference. A potential application of this technique is enabling a single commodity GPU to serve LLMs for latency critical tasks. 
+
+## Acknowledgements
+This project is initiated by members from CMU, Stanford, and UCSD. We will be continuing developing and supporting SpecInfer and the underlying FlexFlow runtime system. The following paper describes design, implementation, and key optimizations of SpecInfer.
+
+* Xupeng Miao*, Gabriele Oliaro*, Zhihao Zhang*, Xinhao Cheng, Zeyu Wang, Rae Ying Yee Wong, Zhuoming Chen, Daiyaan Arfeen, Reyna Abhyankar, and Zhihao Jia. [SpecInfer: Accelerating Generative LLM Serving with Speculative Inference and Token Tree Verification]().
+
+## License
+Both SpecInfer and FlexFlow use Apache License 2.0.
diff --git a/.github/workflows/build.yml b/.github/workflows/build.yml
index fe77492f19..9abd9c9a78 100644
--- a/.github/workflows/build.yml
+++ b/.github/workflows/build.yml
@@ -79,6 +79,10 @@ jobs:
             export FF_BUILD_ALL_EXAMPLES=ON
             export FF_BUILD_ALL_INFERENCE_EXAMPLES=ON
             export FF_BUILD_UNIT_TESTS=ON
+          else 
+            export FF_BUILD_ALL_EXAMPLES=OFF
+            export FF_BUILD_ALL_INFERENCE_EXAMPLES=OFF
+            export FF_BUILD_UNIT_TESTS=OFF
           fi
           ../config/config.linux
           make -j $n_build_cores
diff --git a/.gitmodules b/.gitmodules
index b8419fda94..82a77864f2 100644
--- a/.gitmodules
+++ b/.gitmodules
@@ -19,3 +19,6 @@
 [submodule "deps/json"]
 	path = deps/json
 	url = https://github.com/nlohmann/json.git
+[submodule "deps/sentencepiece"]
+	path = deps/sentencepiece
+	url = https://github.com/google/sentencepiece.git
diff --git a/CMakeLists.txt b/CMakeLists.txt
index 45e4dfb328..d48fe22846 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -180,16 +180,16 @@ set(LD_FLAGS $ENV{LD_FLAGS})
 # Set global FLAGS
 if(INFERENCE_TESTS)
 list(APPEND CC_FLAGS
-  -std=c++14)
+  -std=c++17)
 
 list(APPEND NVCC_FLAGS
-  -std=c++14)
+  -std=c++17)
 else()
-  list(APPEND CC_FLAGS
-  -std=c++11)
+list(APPEND CC_FLAGS
+  -std=c++17)
 
 list(APPEND NVCC_FLAGS
-  -std=c++11)
+  -std=c++17)
 endif()
 
 add_compile_options(${CC_FLAGS})
@@ -440,6 +440,7 @@ if (INFERENCE_TESTS)
 endif()
 
 # build binary
+option(FF_BUILD_SENTENCEPIECE "build sentencepiece for LLM serving" ON)
 option(FF_BUILD_RESNET "build resnet example" OFF)
 option(FF_BUILD_RESNEXT "build resnext example" OFF)
 option(FF_BUILD_ALEXNET "build alexnet example" OFF)
@@ -474,6 +475,12 @@ if(FF_BUILD_VISUALIZATION_TOOL)
   add_subdirectory(tools/substitutions_to_dot)
 endif()
 
+if(FF_BUILD_SENTENCEPIECE OR FF_BUILD_ALL_INFERENCE_EXAMPLES)
+  add_subdirectory(deps/sentencepiece sentencepiece EXCLUDE_FROM_ALL)
+  target_include_directories(flexflow PUBLIC deps/sentencepiece/src)
+  target_link_libraries(flexflow sentencepiece)
+endif()
+
 # Python
 if(FF_USE_PYTHON)
   add_subdirectory(deps/pybind11)
@@ -544,16 +551,13 @@ if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/inference/LLAMA)
 endif()
 
-if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/inference/SPEC_LLAMA)
-endif()
-
 if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/inference/opt)
 endif()
 
 if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/inference/llama_spec_pipeline)
+  add_subdirectory(inference/spec_infer)
 endif()
 
 if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
diff --git a/config/config.linux b/config/config.linux
index 93bce07657..5de72ed06f 100755
--- a/config/config.linux
+++ b/config/config.linux
@@ -53,7 +53,7 @@ FF_UCX_URL=${FF_UCX_URL:-""}
 
 # build C++ examples
 FF_BUILD_ALL_EXAMPLES=${FF_BUILD_ALL_EXAMPLES:-OFF}
-FF_BUILD_ALL_INFERENCE_EXAMPLES=${FF_BUILD_ALL_INFERENCE_EXAMPLES:-OFF}
+FF_BUILD_ALL_INFERENCE_EXAMPLES=${FF_BUILD_ALL_INFERENCE_EXAMPLES:-ON}
 
 # build C++ unit tests
 FF_BUILD_UNIT_TESTS=${FF_BUILD_UNIT_TESTS:-OFF}
diff --git a/deps/sentencepiece b/deps/sentencepiece
new file mode 160000
index 0000000000..3863f7648e
--- /dev/null
+++ b/deps/sentencepiece
@@ -0,0 +1 @@
+Subproject commit 3863f7648e5d8edb571ac592f3ac4f5f0695275a
diff --git a/examples/cpp/inference/LLAMA/CMakeLists.txt b/examples/cpp/inference/LLAMA/CMakeLists.txt
index 48e9322af8..b31e04b0a5 100644
--- a/examples/cpp/inference/LLAMA/CMakeLists.txt
+++ b/examples/cpp/inference/LLAMA/CMakeLists.txt
@@ -7,14 +7,12 @@ set(project_target LLAMA)
 set(CPU_SRC
   ${FLEXFLOW_CPP_DRV_SRC}
   llama.cc
-  llama.h
-  dataloader.cc)
-
-set(GPU_SRC
-dataloader.cu)
+  ${CMAKE_SOURCE_DIR}/inference/file_loader.cc
+  ${CMAKE_SOURCE_DIR}/inference/models/llama.cc)
 
 cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
 target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
+target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/inference)
 target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
 
 set(BIN_DEST "bin")
diff --git a/examples/cpp/inference/LLAMA/llama.cc b/examples/cpp/inference/LLAMA/llama.cc
index 8ca5cfe98e..8d25eb3a3a 100644
--- a/examples/cpp/inference/LLAMA/llama.cc
+++ b/examples/cpp/inference/LLAMA/llama.cc
@@ -13,25 +13,54 @@
  * limitations under the License.
  */
 
-#include "llama.h"
+#include "models/llama.h"
 #include "flexflow/inference.h"
+#include "flexflow/tokenizers.h"
+#include <nlohmann/json.hpp>
 
 using namespace Legion;
 
 LegionRuntime::Logger::Category log_app("llama");
 
-void parse_input_args(char **argv, int argc, LLAMAConfig &config) {
-  for (int i = 1; i < argc; i++) {
+struct FilePaths {
+  std::string weight1_file_path;
+  std::string weight2_file_path;
+  std::string weight3_file_path;
+  std::string weight4_file_path;
+  std::string prompt_file_path;
+  std::string tokenizer_file_path;
+};
 
-    // input
-    if (!strcmp(argv[i], "--dataset")) {
-      config.input_path = std::string(argv[++i]);
+void parse_input_args(char **argv, int argc, FilePaths &paths) {
+  for (int i = 1; i < argc; i++) {
+    // weights
+    if (!strcmp(argv[i], "--weight1")) {
+      paths.weight1_file_path = std::string(argv[++i]);
+      continue;
+    }
+    // weights
+    if (!strcmp(argv[i], "--weight2")) {
+      paths.weight2_file_path = std::string(argv[++i]);
+      continue;
+    }
+    // weights
+    if (!strcmp(argv[i], "--weight3")) {
+      paths.weight3_file_path = std::string(argv[++i]);
       continue;
     }
-
     // weights
-    if (!strcmp(argv[i], "--weights")) {
-      config.weight_file_path = std::string(argv[++i]);
+    if (!strcmp(argv[i], "--weight4")) {
+      paths.weight4_file_path = std::string(argv[++i]);
+      continue;
+    }
+    // prompts
+    if (!strcmp(argv[i], "--prompt")) {
+      paths.prompt_file_path = std::string(argv[++i]);
+      continue;
+    }
+    // tokenizer
+    if (!strcmp(argv[i], "--tokenizer")) {
+      paths.tokenizer_file_path = std::string(argv[++i]);
       continue;
     }
   }
@@ -42,242 +71,70 @@ void FlexFlow::top_level_task(Task const *task,
                               Context ctx,
                               Runtime *runtime) {
   FFConfig ffconfig;
-  LLAMAConfig llamaConfig;
+  FilePaths file_paths;
   FFModel ff(ffconfig);
-  //------------------------------compute machine views ------------------
-  int num_devices = ffconfig.workersPerNode * ffconfig.numNodes;
-  std::vector<MachineView> machine_views;
-  for (int i = 0; i < num_devices; i++) {
-    MachineView view;
-    view.device_type = MachineView::GPU;
-    view.ndims = 1;
-    view.dim[0] = 1;
-    view.stride[0] = 0;
-    view.start_device_id = i;
-    machine_views.push_back(view);
-  }
-
-  std::unordered_map<Tensor, std::vector<MachineView>> mapping;
-  std::unordered_map<std::string, Layer *> weights_layers;
-
-  // InputArgs const &command_args = HighLevelRuntime::get_input_args();
-  // char **argv = command_args.argv;
-  // int argc = command_args.argc;
-  // parse_input_args(argv, argc, llamaConfig);
-
-  std::cout << "print llama config: " << llamaConfig.input_path << "-->"
-            << llamaConfig.batchSize << std::endl;
 
-  //------------------------------ build the model --------------------------
-  Tensor input;
+  InputArgs const &command_args = HighLevelRuntime::get_input_args();
+  char **argv = command_args.argv;
+  int argc = command_args.argc;
+  parse_input_args(argv, argc, file_paths);
+  SentencePieceTokenizer tokenizer(file_paths.tokenizer_file_path);
+  InferenceManager im(ffconfig, BatchConfig::MAX_NUM_TOKENS, 1);
+  RequestManager rm(&tokenizer);
+  std::string text2 = "I believe the meaning of life is";
+  std::string text3 = "Talk to me as if you are python programming language "
+                      "and want to sell me yourself";
+  std::string text4 = "Write podcast about importance to include ChatGPT into "
+                      "the evening routine.";
+  int total_num_requests = 0;
   {
-    int const token_dims[] = {llamaConfig.batchSize, llamaConfig.max_seq_len};
-    input = ff.create_tensor<2>(token_dims, DT_INT32);
-  }
-  mapping[input].push_back(machine_views[0]);
-
-  Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
-  Tensor token = ff.embedding(input,
-                              llamaConfig.vocab_size,
-                              llamaConfig.dim,
-                              AGGR_MODE_NONE,
-                              DT_FLOAT,
-                              NULL,
-                              embed_init);
-  Layer *embedding = ff.layers.back();
-  weights_layers.emplace("tok_embeddings_weight", embedding);
-
-  // std::cout << "------token shape";
-  // std::cout << token->num_dims << "------\n";
-  // for (int i = 0; i < token->num_dims; i++) {
-  //   std::cout << token->dims[i] << "------\n";
-  // }
-
-  // n transformer blocks impl
-  int num_transformer_layers_per_gpu = (32 + num_devices - 1) / num_devices;
-  for (int i = 0; i < 32; i++) {
-    // step 1: attention
-    std::vector<int> axes = {2};
-    Tensor att_norm = ff.rms_norm(token, llamaConfig.norm_eps, llamaConfig.dim);
-    Layer *attention_norm = ff.layers.back();
-    if (i % num_transformer_layers_per_gpu == 0) {
-      // Map att_norm to the next GPU
-      // since the size of att_norm is minimum across
-      // all tensors
-      mapping[att_norm].push_back(
-          machine_views[i / num_transformer_layers_per_gpu]);
-    }
-    weights_layers.emplace("layers_" + std::to_string(i) +
-                               "_attention_norm_weight",
-                           attention_norm);
-    Tensor mha =
-        ff.inc_multihead_self_attention(att_norm,
-                                        llamaConfig.dim,
-                                        llamaConfig.n_heads,
-                                        llamaConfig.dim / llamaConfig.n_heads,
-                                        llamaConfig.dim / llamaConfig.n_heads,
-                                        0.0f,
-                                        false,
-                                        false,
-                                        false,
-                                        NULL,
-                                        true);
-    Layer *attention_layer = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) + "_attention_weight",
-                           attention_layer);
-    token = ff.add(token, mha);
-
-    // step 2: SILU activaion
-    Tensor ff_norm = ff.rms_norm(token, llamaConfig.norm_eps, llamaConfig.dim);
-    Layer *ffn_layer = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) + "_ffn_norm_weight",
-                           ffn_layer);
-
-    Tensor w1 = ff.dense(ff_norm, llamaConfig.hidden_dim, AC_MODE_NONE, false);
-    Layer *w1_layer = ff.layers.back();
-    weights_layers.emplace(
-        "layers_" + std::to_string(i) + "_feed_forward_w1_weight", w1_layer);
-
-    Tensor w3 = ff.dense(ff_norm, llamaConfig.hidden_dim, AC_MODE_NONE, false);
-    Layer *w3_layer = ff.layers.back();
-    weights_layers.emplace(
-        "layers_" + std::to_string(i) + "_feed_forward_w3_weight", w3_layer);
-
-    Tensor sigmoid = ff.sigmoid(w1);
-    Tensor silu = ff.multiply(w1, sigmoid);
-    Tensor multi = ff.multiply(silu, w3);
-
-    Tensor w2 = ff.dense(multi, llamaConfig.dim, AC_MODE_NONE, false);
-    Layer *w2_layer = ff.layers.back();
-    weights_layers.emplace(
-        "layers_" + std::to_string(i) + "_feed_forward_w2_weight", w2_layer);
-    token = ff.add(token, w2);
-  }
-
-  // final normalization and linear
-  std::vector<int> axes = {2};
-  token = ff.rms_norm(token, 1e-6, 4096);
-  Layer *final_norm = ff.layers.back();
-  weights_layers.emplace("norm_weight", final_norm);
-  Tensor dense = ff.dense(token, llamaConfig.vocab_size, AC_MODE_NONE, false);
-  Layer *final_linear = ff.layers.back();
-  weights_layers.emplace("output_weight", final_linear);
-  Tensor output = ff.arg_top_k(dense, /*k=*/1, false);
-
-  //------------------- compile the model --------------------------------
-  std::cout << "------start compile ----------" << std::endl;
-  InferenceManager im(ff.config, llamaConfig.batchSize, 1);
-  im.compile_model_and_allocate_buffer(&ff, mapping);
-  RequestManager rm;
-
-  //------------------------------ load inputs --------------------------
-  std::cout << "------create dataloaders ----------" << std::endl;
-  // read prompt into input
-  ParallelTensor input_pt;
-  ff.get_parallel_tensor_from_tensor(input, input_pt);
-  assert(im.tensor_buffer.find(input_pt) != im.tensor_buffer.end());
-  std::cout << im.tensor_buffer[input_pt].size() << std::endl;
-  DataLoader loader(ff, &llamaConfig, im.tensor_buffer[input_pt].at(0));
-
-  //------------------------------ load weights---------------------------
-  for (auto &v : weights_layers) {
-    Tensor weight = v.second->weights[0];
-    std::cout << "weights layer: " << v.first << "\n";
-
-    if (weight == NULL) {
-      std::cout << "op no weights : " << v.first << "\n";
-      continue;
-    }
-
-    size_t volume = 1;
-    std::vector<int> dims_vec;
-    for (int i = 0; i < weight->num_dims; i++) {
-      dims_vec.push_back(weight->dims[i]);
-      volume *= weight->dims[i];
-    }
-
-    assert(weight->data_type == DT_FLOAT);
-    float *data = (float *)malloc(sizeof(float) * volume);
-
-    if (v.first.find("attention_w") != std::string::npos) {
-      assert(dims_vec[0] =
-                 llamaConfig.dim * (llamaConfig.dim / llamaConfig.n_heads) * 4);
-      assert(dims_vec[1] = llamaConfig.n_heads);
-      assert(volume == dims_vec[0] * dims_vec[1]);
-      loader.load_attention_weights(data,
-                                    volume,
-                                    llamaConfig.dim,
-                                    llamaConfig.n_heads,
-                                    v.first,
-                                    llamaConfig.weight_file_path);
-
-    } else {
-      loader.load_from_file(
-          data, volume, llamaConfig.weight_file_path + v.first);
-      if (v.first.find("attention_norm") != std::string::npos) {
-        // std::cout << "norm weight data" << std::endl;
-        // for (int i = 0; i < 100; i++) {
-        //   std::cout << data[i] << ", ";
-        // }
+    using json = nlohmann::json;
+    std::ifstream file_handle(file_paths.prompt_file_path);
+    assert(file_handle.good() && "Prompt file does not exist.");
+    json prompt_json = json::parse(file_handle,
+                                   /*parser_callback_t */ nullptr,
+                                   /*allow_exceptions */ true,
+                                   /*ignore_comments */ true);
+    for (auto &prompt : prompt_json) {
+      std::string text = prompt.get<std::string>();
+      printf("Prompt[%d]: %s\n", total_num_requests, text.c_str());
+      total_num_requests++;
+      rm.register_new_request(text, 128 /*max_sequence_length*/);
+      if (total_num_requests == 10) {
+        break;
       }
     }
-
-    ParallelTensor weight_pt;
-    ff.get_parallel_tensor_from_tensor(weight, weight_pt);
-    weight_pt->set_tensor<float>(&ff, dims_vec, data);
-    delete data;
   }
-  std::cout << "------load wieght finished----------" << std::endl;
-  //------------------------------ init operators ------------------------
-  std::cout << "------init ops----------" << std::endl;
-  im.init_operators_inference(&ff);
-  std::cout << "------model compiled and init ----------" << std::endl;
 
-  //------------------------------ do inference---------------------------
-  int processed_requests = 0;
-  std::map<int, Future> future_handlers;
-  std::map<int, BatchConfig> batch_configs;
-  std::map<size_t, long> batch_predictions[1];
-  loader.reset();
-
-  for (int i = 0; i < llamaConfig.batchSize; i++) {
-    std::vector<BatchConfig::TokenId> tokens{0, 0, 0, 0, 0, 0, 0, 0};
-    rm.register_new_request(tokens, 347);
+  FFModel model(ffconfig);
+  LLAMA::create_llama_model(model,
+                            im,
+                            "7b",
+                            file_paths.weight1_file_path,
+                            ffconfig.workersPerNode * ffconfig.numNodes,
+                            INC_DECODING_MODE);
+
+  BatchConfig bc;
+  InferenceResult ir;
+  while (rm.get_num_processed_requests() < total_num_requests) {
+    bc = rm.prepare_next_batch(bc, ir);
+    if (rm.get_num_processed_requests() >= total_num_requests) {
+      break;
+    }
+    FutureMap fm = im.inference(&model, 0, bc);
+    assert(fm.get_future_map_domain().get_volume() == 1);
+    Future future = fm.get_future(0);
+    ir = future.get_result<InferenceResult>();
   }
 
-  while (processed_requests < llamaConfig.sentence_len) {
-    int bid = 0;
-    size_t max_reqs, max_tkns;
-    if (future_handlers.find(bid) == future_handlers.end()) {
-      BatchConfig bc;
-      InferenceResult ir;
-      bc = rm.prepare_next_batch(bc, ir);
-      std::cout << "new tokens: " << bc.num_tokens << std::endl;
-      FutureMap fm = im.inference(&ff, bid, bc);
-      assert(fm.get_future_map_domain().get_volume() == 1);
-      future_handlers[bid] = fm.get_future(0);
-      batch_configs[bid] = bc;
-    } else {
-      // have luanched this bid
-      Future future = future_handlers[bid];
-      if (!future.is_ready(true /*subscribe*/)) {
-        continue;
-      } else {
-        std::cout << "future is ready...." << std::endl;
-      }
-      // process end
-      InferenceResult ir = future.get_result<InferenceResult>();
-      BatchConfig bc = batch_configs[bid];
-      processed_requests += bc.num_tokens;
-      bc = rm.prepare_next_batch(bc, ir);
-      std::cout << "new tokens: " << bc.num_tokens << std::endl;
-      FutureMap fm = im.inference(&ff, bid, bc);
-      assert(fm.get_future_map_domain().get_volume() == 1);
-      future_handlers[bid] = fm.get_future(0);
-      batch_configs[bid] = bc;
-    }
+  // Execution fence
+  {
+    Future future = runtime->issue_execution_fence(ctx);
+    future.get_void_result();
   }
 
   // float* data
   std::cout << "----------inference finished--------------" << std::endl;
 }
+
+void FlexFlow::register_custom_tasks() {}
diff --git a/examples/cpp/inference/LLAMA/llama.h b/examples/cpp/inference/LLAMA/llama.h
deleted file mode 100644
index 6bf30cb19c..0000000000
--- a/examples/cpp/inference/LLAMA/llama.h
+++ /dev/null
@@ -1,112 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "flexflow/batch_config.h"
-#include "flexflow/inference.h"
-#include "flexflow/model.h"
-#define MAX_NUM_SAMPLES 65536
-#define MAX_TOKEN_LEN 32000
-
-using namespace Legion;
-using namespace FlexFlow;
-
-struct LLAMAConfig {
-  LLAMAConfig(void) {
-    // todo read from config/param file
-    n_layers = 32;
-    vocab_size = 32000;
-    n_heads = 32;
-    dim = 4096;
-    multiple_of = 256;
-    norm_eps = 1e-6;
-    total_sentence = 5;
-    sentence_len = 347;
-    max_gen_length = 256;
-    batchSize = 5;
-    total_requests = 2560;
-    incremental_mode = true;
-    sequence_length = BatchConfig::MAX_SEQ_LENGTH;
-    max_seq_len = 8;
-
-    // todo from args
-    weight_file_path =
-        "/home/ubuntu/FlexFlow/examples/cpp/inference/LLAMA/weights/";
-    input_path = "/home/ubuntu/FlexFlow/examples/cpp/inference/LLAMA/tokens/"
-                 "llama_demo_tokens";
-
-    // hidden dim
-    hidden_dim = 4 * dim;
-    hidden_dim = int(2 * hidden_dim / 3);
-    hidden_dim =
-        multiple_of * int((hidden_dim + multiple_of - 1) / multiple_of);
-  }
-  int n_heads, n_layers, vocab_size, dim, multiple_of, hidden_dim,
-      total_sentence, sentence_len, batchSize, total_requests, incremental_mode,
-      sequence_length, max_gen_length, max_seq_len;
-  float norm_eps;
-  std::string weight_file_path;
-  std::string input_path;
-};
-
-class DataLoader {
-public:
-  DataLoader(FFModel &ff,
-             LLAMAConfig const *llamaconfig,
-             ParallelTensor const &input);
-  void next_batch(FFModel &ff,
-                  BatchConfig *bc,
-                  std::map<size_t, long> &batch_predictions);
-  void reset();
-  static void load_entire_dataset(Task const *task,
-                                  std::vector<PhysicalRegion> const &regions,
-                                  Context ctx,
-                                  Runtime *runtime);
-  static void load_input(Task const *task,
-                         std::vector<PhysicalRegion> const &regions,
-                         Context ctx,
-                         Runtime *runtime);
-
-  template <typename T>
-  static void load_from_file(T *ptr, size_t size, std::string filename);
-
-  template <typename T>
-  static void load_attention_weights(T *ptr,
-                                     size_t size,
-                                     int hidden_dim,
-                                     int num_heads,
-                                     std::string layer_name,
-                                     std::string weight_path);
-  void store_outputs(BatchConfig *bc,
-                     InferenceResult const &ir,
-                     std::map<size_t, long> &batch_predictions);
-
-public:
-  int num_samples, next_index, next_token_idx, next_batch_index;
-  std::map<size_t, std::vector<int>> outputs;
-  FlexFlow::ParallelTensor full_input, batch_input;
-};
-
-struct SampleIdxs {
-  int num_samples;
-  int idxs[MAX_NUM_SAMPLES];
-  int token_idx;
-  int batch_idx;
-};
-
-struct DataLoaderNextBatchInput {
-  // BatchConfig::SampleIdxs const &meta;
-  BatchConfig *bc;
-  std::map<size_t, long> const &prev_batch_preds;
-};
diff --git a/examples/cpp/inference/SPEC_LLAMA/README.md b/examples/cpp/inference/SPEC_LLAMA/README.md
deleted file mode 100644
index daccccc249..0000000000
--- a/examples/cpp/inference/SPEC_LLAMA/README.md
+++ /dev/null
@@ -1,14 +0,0 @@
-# an example of running llama model with beam search
-
-## how to run it?
-1. build the flexflow with FF_BUILD_ALL_INFERENCE_EXAMPLES or FF_BUILD_ALL_EXAMPLES
-2. download the weight and token file from aws s3. 
-```bash
-aws s3 cp s3://catalyst-llama/7B_weights_float.tar.gz FF_HOME/examples/cpp/inference/SPEC_LLAMA/weights
-tar -zxvf 7B_weights_float.tar.gz 
-aws s3 cp s3://catalyst-llama/tokens.tar FF_HOME/examples/cpp/inference/SPEC_LLAMA/tokens
-tar -zxvf tokens.tar
-```
-3. run *SPEC_LLAMA* with `--weights` `--dataset`  `-b 5` `--only-data-parallel`
-4. [expected results](https://github.com/flexflow/FlexFlow/pull/681#issuecomment-1534264054)
-
diff --git a/examples/cpp/inference/SPEC_LLAMA/llama.cc b/examples/cpp/inference/SPEC_LLAMA/llama.cc
deleted file mode 100644
index 6cdc44f339..0000000000
--- a/examples/cpp/inference/SPEC_LLAMA/llama.cc
+++ /dev/null
@@ -1,197 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "models/llama.h"
-#include "flexflow/inference.h"
-
-using namespace Legion;
-
-LegionRuntime::Logger::Category log_app("llama");
-
-void parse_input_args(char **argv, int argc, LLAMA::Config &config) {
-  for (int i = 1; i < argc; i++) {
-    // input
-    if (!strcmp(argv[i], "--dataset")) {
-      config.input_path = std::string(argv[++i]);
-      continue;
-    }
-
-    // weights
-    if (!strcmp(argv[i], "--weights")) {
-      config.weight_file_path = std::string(argv[++i]);
-      continue;
-    }
-  }
-}
-
-void FlexFlow::top_level_task(Task const *task,
-                              std::vector<PhysicalRegion> const &regions,
-                              Context ctx,
-                              Runtime *runtime) {
-  FFConfig ffconfig;
-  LLAMA::Config llama_config;
-
-  InputArgs const &command_args = HighLevelRuntime::get_input_args();
-  char **argv = command_args.argv;
-  int argc = command_args.argc;
-  parse_input_args(argv, argc, llama_config);
-  InferenceManager im(ffconfig, llama_config.batchSize, 1);
-  RequestManager rm;
-  // Add a single request
-  std::vector<BatchConfig::TokenId> prompt{
-      1, 306, 4658, 278, 6593, 310, 2834, 338};
-  rm.register_new_request(prompt, llama_config.sentence_len);
-
-  FFModel beam_model(ffconfig), tree_model(ffconfig), inc_model(ffconfig);
-  LLAMA::create_llama_model(beam_model, im, llama_config, 1, BEAM_SEARCH_MODE);
-  LLAMA::create_llama_model(tree_model, im, llama_config, 1, TREE_VERIFY_MODE);
-  LLAMA::create_llama_model(inc_model, im, llama_config, 1, INC_DECODING_MODE);
-
-  // entry---------------------------
-  int depth = 0;
-  std::map<int, Future> beam_future_handlers, tree_future_handler;
-  std::map<int, BeamSearchBatchConfig> beam_batch_configs;
-  std::map<int, TreeVerifyBatchConfig> tree_batch_configs;
-
-  bool new_req = true;
-  TreeVerifyBatchConfig tree_bc;
-
-  while (depth < llama_config.max_beam_depth) {
-    int bid = 0;
-    if (beam_future_handlers.find(bid) == beam_future_handlers.end()) {
-      BeamSearchBatchConfig bc;
-      BeamInferenceResult ir;
-      bc = rm.prepare_next_batch_beam(bc, ir);
-
-      std::cout << "sub_requests: " << bc.sub_requests[0] << "\n";
-      FutureMap fm = im.inference(&beam_model, bid, bc);
-      assert(fm.get_future_map_domain().get_volume() == 1);
-      beam_future_handlers[bid] = fm.get_future(0);
-      beam_batch_configs[bid] = bc;
-    } else {
-      // have luanched this bid
-      Future future = beam_future_handlers[bid];
-      if (!future.is_ready(true /*subscribe*/)) {
-        continue;
-      } else {
-        std::cout << "future is ready...." << std::endl;
-      }
-      // process end
-      BeamInferenceResult ir = future.get_result<BeamInferenceResult>();
-      BeamSearchBatchConfig bc = beam_batch_configs[bid];
-      depth = bc.beamRequestsInfo[0].current_depth;
-      bc = rm.prepare_next_batch_beam(bc, ir);
-
-      std::cout << "llama current depth: " << depth << std::endl;
-      std::cout << "sub_requests: " << bc.sub_requests[0] << "\n";
-      FutureMap fm = im.inference(&beam_model, bid, bc);
-      assert(fm.get_future_map_domain().get_volume() == 1);
-      beam_future_handlers[bid] = fm.get_future(0);
-      beam_batch_configs[bid] = bc;
-
-      // tranverse the tree in dfs order;
-      if (depth >= llama_config.max_beam_depth) {
-        // std::cout << "tranverse the tree"
-        //           << "\n";
-        // rm.tranverse_beam_tree(bc);
-        tree_bc = rm.convert_beam_to_tree_batch_config(bc);
-      }
-    }
-  }
-
-  // original
-  {
-    std::vector<BatchConfig::TokenId> tokens{1,
-                                             306,
-                                             4658,
-                                             278,
-                                             6593,
-                                             310,
-                                             2834,
-                                             338,
-                                             593,
-                                             595,
-                                             17252,
-                                             5031,
-                                             993,
-                                             616,
-                                             368,
-                                             2302};
-    BatchConfig bc;
-    bc.num_tokens = 16;
-    bc.requestsInfo[0].num_tokens_in_batch = bc.num_tokens;
-    bc.requestsInfo[0].token_start_offset = 0;
-    bc.requestsInfo[0].max_sequence_length = 347;
-    bc.requestsInfo[0].request_guid = 1000000;
-    bc.request_completed[0] = false;
-    for (int i = 0; i < bc.num_tokens; i++) {
-      bc.tokensInfo[i].token_id = tokens[i];
-      bc.tokensInfo[i].abs_depth_in_request = i;
-      bc.tokensInfo[i].request_index = 0;
-    }
-    FutureMap fm = im.inference(&inc_model, 0, bc);
-    assert(fm.get_future_map_domain().get_volume() == 1);
-    Future future = fm.get_future(0);
-    InferenceResult ir = future.get_result<InferenceResult>();
-    for (int i = 0; i < bc.num_tokens; i++) {
-      printf("decoding_tokens[%d] = %d\n", i, ir.token_ids[i]);
-    }
-  }
-
-  // verification
-  {
-    std::vector<BatchConfig::TokenId> tokens{1,
-                                             306,
-                                             4658,
-                                             278,
-                                             6593,
-                                             310,
-                                             2834,
-                                             338,
-                                             593,
-                                             595,
-                                             17252,
-                                             5031,
-                                             993,
-                                             616,
-                                             368,
-                                             2302};
-    tree_bc.num_tokens = 16;
-    tree_bc.requestsInfo[0].num_tokens_in_batch = tree_bc.num_tokens;
-    for (int i = 0; i < tree_bc.num_tokens; i++) {
-      tree_bc.tokensInfo[i].token_id = tokens[i];
-      tree_bc.tokensInfo[i].abs_depth_in_request = i;
-      tree_bc.tokensInfo[i].request_index = 0;
-    }
-    FutureMap fm = im.inference(&tree_model, 0, tree_bc);
-    assert(fm.get_future_map_domain().get_volume() == 1);
-    Future future = fm.get_future(0);
-    InferenceResult ir = future.get_result<InferenceResult>();
-    for (int i = 0; i < tree_bc.num_tokens; i++) {
-      printf("verify_tokens[%d] = %d\n", i, ir.token_ids[i]);
-    }
-  }
-
-  // Execution fence
-  {
-    Future future = runtime->issue_execution_fence(ctx);
-    future.get_void_result();
-  }
-
-  // float* data
-  std::cout << "----------inference finished--------------" << std::endl;
-}
-
-void FlexFlow::register_custom_tasks() {}
diff --git a/examples/cpp/inference/llama_spec_pipeline/CMakeLists.txt b/examples/cpp/inference/llama_spec_pipeline/CMakeLists.txt
index aeb3d8891b..4c8b147e10 100644
--- a/examples/cpp/inference/llama_spec_pipeline/CMakeLists.txt
+++ b/examples/cpp/inference/llama_spec_pipeline/CMakeLists.txt
@@ -7,13 +7,13 @@ set(project_target llama_pipeline)
 set(CPU_SRC
   ${FLEXFLOW_CPP_DRV_SRC}
   llama.cc
-  ../file_loader.cc
-  ../models/llama.cc)
+  ${CMAKE_SOURCE_DIR}/inference/file_loader.cc
+  ${CMAKE_SOURCE_DIR}/inference/models/llama.cc)
 
 
 cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
 target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
-target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/examples/cpp/inference)
+target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/inference)
 target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
 
 set(BIN_DEST "bin")
diff --git a/examples/cpp/inference/llama_spec_pipeline/llama.cc b/examples/cpp/inference/llama_spec_pipeline/llama.cc
index a2a8e1ea2f..f149b6c9d6 100644
--- a/examples/cpp/inference/llama_spec_pipeline/llama.cc
+++ b/examples/cpp/inference/llama_spec_pipeline/llama.cc
@@ -15,6 +15,7 @@
 
 #include "models/llama.h"
 #include "flexflow/inference.h"
+#include "flexflow/tokenizers.h"
 
 using namespace Legion;
 
@@ -33,6 +34,12 @@ void parse_input_args(char **argv, int argc, LLAMA::Config &config) {
       config.weight_file_path = std::string(argv[++i]);
       continue;
     }
+
+    // weights
+    if (!strcmp(argv[i], "--tokenizer")) {
+      config.tokenizer_file_path = std::string(argv[++i]);
+      continue;
+    }
   }
 }
 
@@ -47,12 +54,14 @@ void FlexFlow::top_level_task(Task const *task,
   char **argv = command_args.argv;
   int argc = command_args.argc;
   parse_input_args(argv, argc, llama_config);
-  InferenceManager im(ffconfig, llama_config.batchSize, 1);
-  RequestManager rm;
+  SentencePieceTokenizer tokenizer(llama_config.tokenizer_file_path);
+  InferenceManager im(ffconfig, llama_config.max_num_tokens, 1);
+  RequestManager rm(&tokenizer);
   // Add a single request
-  std::vector<BatchConfig::TokenId> prompt{
-      1, 306, 4658, 278, 6593, 310, 2834, 338};
-  rm.register_new_request(prompt, llama_config.sentence_len);
+  // std::vector<BatchConfig::TokenId> prompt{
+  //    1, 306, 4658, 278, 6593, 310, 2834, 338};
+  std::string text2 = "I believe the meaning of life is";
+  rm.register_new_request(text2, llama_config.max_seq_len);
 
   FFModel beam_model(ffconfig), tree_model(ffconfig);
   LLAMA::create_llama_model(beam_model, im, llama_config, 1, BEAM_SEARCH_MODE);
@@ -184,6 +193,56 @@ void FlexFlow::top_level_task(Task const *task,
     }
   }
 
+#ifdef DEADCODE
+  {
+    std::vector<BatchConfig::TokenId> prompt{1,
+                                             306,
+                                             4658,
+                                             278,
+                                             6593,
+                                             310,
+                                             2834,
+                                             338,
+                                             593,
+                                             595,
+                                             17252,
+                                             5031,
+                                             993,
+                                             616};
+    BatchConfig bc;
+    bc.request_completed[0] = false;
+    bc.num_tokens = prompt.size();
+    bc.requestsInfo[0].token_start_offset = 0;
+    bc.requestsInfo[0].num_tokens_in_batch = prompt.size();
+    bc.requestsInfo[0].max_sequence_length = 347;
+    bc.requestsInfo[0].request_guid = 1234;
+    for (size_t i = 0; i < prompt.size(); i++) {
+      bc.tokensInfo[i].abs_depth_in_request = i;
+      bc.tokensInfo[i].request_index = 0;
+      bc.tokensInfo[i].token_id = prompt[i];
+    }
+    FutureMap fm = im.inference(&inc_model, 0, bc);
+    assert(fm.get_future_map_domain().get_volume() == 1);
+    Future future = fm.get_future(0);
+    InferenceResult ir = future.get_result<InferenceResult>();
+    for (int i = 0; i < bc.num_tokens; i++) {
+      printf("decoding_tokens[%d] = %d\n", i, ir.token_ids[i]);
+    }
+    bc.num_tokens = 1;
+    bc.requestsInfo[0].token_start_offset = prompt.size();
+    bc.requestsInfo[0].num_tokens_in_batch = 1;
+    bc.tokensInfo[0].abs_depth_in_request = prompt.size();
+    bc.tokensInfo[0].request_index = 0;
+    bc.tokensInfo[0].token_id = ir.token_ids[prompt.size() - 1];
+    fm = im.inference(&inc_model, 0, bc);
+    assert(fm.get_future_map_domain().get_volume() == 1);
+    future = fm.get_future(0);
+    ir = future.get_result<InferenceResult>();
+    printf("decoding_tokens[%d] = %d\n",
+           bc.tokensInfo[0].abs_depth_in_request,
+           ir.token_ids[0]);
+  }
+#endif
   // Execution fence
   {
     Future future = runtime->issue_execution_fence(ctx);
diff --git a/examples/cpp/inference/mixture_of_experts/CMakeLists.txt b/examples/cpp/inference/mixture_of_experts/CMakeLists.txt
index ecfe29b793..b943623857 100644
--- a/examples/cpp/inference/mixture_of_experts/CMakeLists.txt
+++ b/examples/cpp/inference/mixture_of_experts/CMakeLists.txt
@@ -8,7 +8,7 @@ set(CPU_SRC
   moe.cc
   ../dataloader.cc
   ../data_generator.cc
-  ../gpt_tokenizer.cc)
+  ${FLEXFLOW_ROOT}/src/runtime/gpt_tokenizer.cc)
 
 set(GPU_SRC
   ../dataloader.cu)
diff --git a/examples/cpp/inference/opt/CMakeLists.txt b/examples/cpp/inference/opt/CMakeLists.txt
index 2a392dce35..3156e71f75 100644
--- a/examples/cpp/inference/opt/CMakeLists.txt
+++ b/examples/cpp/inference/opt/CMakeLists.txt
@@ -8,12 +8,13 @@ set(CPU_SRC
   ${FLEXFLOW_CPP_DRV_SRC}
   opt.cc
   opt.h
-  ../file_loader.cc)
+  ${CMAKE_SOURCE_DIR}/inference/file_loader.cc)
 
 
 
 cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
 target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
+target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/inference)
 target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/examples/cpp/inference)
 target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
 
diff --git a/examples/cpp/inference/opt_spec_pipeline/CMakeLists.txt b/examples/cpp/inference/opt_spec_pipeline/CMakeLists.txt
index 7bab587713..d7937d7595 100644
--- a/examples/cpp/inference/opt_spec_pipeline/CMakeLists.txt
+++ b/examples/cpp/inference/opt_spec_pipeline/CMakeLists.txt
@@ -7,13 +7,13 @@ set(project_target opt_pipeline)
 set(CPU_SRC
   ${FLEXFLOW_CPP_DRV_SRC}
   opt_pipeline.cc
-  ../file_loader.cc
-  ../models/opt.cc)
+  ${CMAKE_SOURCE_DIR}/inference/file_loader.cc
+  ${CMAKE_SOURCE_DIR}/inference/models/opt.cc)
 
 
 cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
 target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
-target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/examples/cpp/inference)
+target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/inference)
 target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
 
 set(BIN_DEST "bin")
diff --git a/examples/cpp/inference/opt_spec_pipeline/opt_pipeline.cc b/examples/cpp/inference/opt_spec_pipeline/opt_pipeline.cc
index a1f50e230d..1229ad13c3 100644
--- a/examples/cpp/inference/opt_spec_pipeline/opt_pipeline.cc
+++ b/examples/cpp/inference/opt_spec_pipeline/opt_pipeline.cc
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/inference.h"
+#include "flexflow/tokenizers.h"
 #include "models/opt.h"
 
 using namespace Legion;
@@ -27,6 +28,11 @@ void parse_input_args(char **argv, int argc, OPT::Config &config) {
       config.weight_file_path = std::string(argv[++i]);
       continue;
     }
+    // tokenizer
+    if (!strcmp(argv[i], "--tokenizer")) {
+      config.tokenizer_assets_folder = std::string(argv[++i]);
+      continue;
+    }
   }
 }
 
@@ -35,18 +41,26 @@ void FlexFlow::top_level_task(Task const *task,
                               Context ctx,
                               Runtime *runtime) {
   FFConfig ffconfig;
-  OPT::Config opt_config;
+  OPT::Small_Config opt_config;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
   char **argv = command_args.argv;
   int argc = command_args.argc;
   parse_input_args(argv, argc, opt_config);
+  std::string const vocab_filepath =
+      opt_config.tokenizer_assets_folder + "/gpt2-vocab.json";
+  std::string const merges_filepath =
+      opt_config.tokenizer_assets_folder + "/gpt2-merges.txt";
+  OptTokenizer opt_tokenizer(vocab_filepath, merges_filepath);
   InferenceManager im(ffconfig, opt_config.batchSize, 1);
-  RequestManager rm;
+  RequestManager rm(&opt_tokenizer);
   // Add a single request
-  std::vector<BatchConfig::TokenId> prompt = {
-      2, 5625, 16, 10, 2721, 183, 8, 38, 236};
-  rm.register_new_request(prompt, opt_config.sentence_len);
+  // std::vector<BatchConfig::TokenId> prompt = {
+  //     2, 5625, 16, 10, 2721, 183, 8, 38, 236};
+  // rm.register_new_request(prompt, opt_config.sentence_len);
+  std::string text = "I believe the meaning of life is";
+  rm.register_new_request(text,
+                          opt_config.sentence_len /*max_sequence_length*/);
 
   FFModel beam_model(ffconfig), tree_model(ffconfig);
   OPT::create_opt_model(beam_model, im, opt_config, 1, BEAM_SEARCH_MODE);
diff --git a/examples/cpp/inference/transformers/CMakeLists.txt b/examples/cpp/inference/transformers/CMakeLists.txt
index e3cabdc324..0aa95f1058 100644
--- a/examples/cpp/inference/transformers/CMakeLists.txt
+++ b/examples/cpp/inference/transformers/CMakeLists.txt
@@ -8,7 +8,7 @@ set(CPU_SRC
   transformers.cc
   ../dataloader.cc
   ../data_generator.cc
-  ../gpt_tokenizer.cc)
+  ${FLEXFLOW_ROOT}/src/runtime/gpt_tokenizer.cc)
 
 set(GPU_SRC
   ../dataloader.cu)
diff --git a/img/overview.png b/img/overview.png
new file mode 100644
index 0000000000000000000000000000000000000000..5264e2d41abfccc0a621028b9ba8cc6746cc479e
GIT binary patch
literal 209735
zcmZs@bzB_H(y)!Y1$P#A5AGJ+U4y$5g1ap4?iM@*m*5gy65Mrx1b2den>)#Q&VAnR
zkL5QzGuty=RbACxbv2PHO46uEgh&t&5U8>;l4=kTF!m4-P-zHo;4{SZ=mZcDkhC@u
z5-N5Q(h^SgPOj?CCT135=1!&-YSQBDe0;nR5Oj%V#>Q$gOmxF0n8wD#6O8mot{!R;
z5ix4U0h2wWJyU?;f}x(w3<HBre2mS02pBd(9N+fA9)u#+!{G70lp*9+HMQvEper)K
zq!J4qgNd>6I7EHwm^_l`5h*~Qik@iP2*MN(k_5rr39@d6{0PgK3*&~QHY)*O1$cl?
zm`I1Q<P196mIv0tirSZV0s!ALlJZk3Auc+@3qO1aqlxqfAjqjP%853*`HNYoT6({U
z45nl&QNt0uOuBxD9fJ}RLx3;3g{Jz%he4bdV`_zAiV%pAP1)PC*_{#;w2Ll2UXmVU
z5`+c~{h|??kwp$25-1Ga-^DlbLCQkK3_mmQJ?1tv1Z9w%4l>FJ23T^u7CN$)ii!{n
z;9~>`NT3Y_4EP8V{2>H?zydCS`g;b(z5x2~F;v>Gi+Q($a}W@s5VDeD8lI3xx$wT&
znhS%<-cD47R4|wbR97^bS*E>xc7==WMG<G@i(l}3e8e<*&~Db-%L@V{-u>Xhutl&b
zxdjPKt*wrjH)Pw(kW=lSt>i9c3V2vPbGCzo-J;a#i6Rjp$pJ8-ffyK2;-Ux$|NZ4P
zAym!13@)pY0&B-v@UyjobUdk|$A(|aIRWQ_kq<L9HMOQrI69f{8Dv;^IN{g_<t>|4
z6hX?{B;WX}CqOs(#Y4p@titXK+FbzFZP4QcAb@jI_$y5S=kNx~y-`9p0muo?kJXsr
zpA)U<S@#<#ShPwdb!J1`8Y39?7nhgxLPCbjue&WQEL6qBg1lZ?SXwUIM+=WTxVgI8
zHzx~+m30+@j4B^<lTTIeZYBIB7&gc*9(4T!Ha#SNeWAP{QuB`=c9PkB0ACzEMZZH$
z?B2iLDE4OP&fncYzk5pAP=4y{(Re<kdvOeu_IrBD%*v8Goc~ySIVD2YuDVwuQ4|#&
zT~S^x!<t_4|0AT|5)*~S2*e1D_`v73_x0+>%p7U%IoecK`dk0Z_s7d~5J2+w|5v<!
zWnCT>h!iQOq@;y3*%yXPPeW5$c~h_STNPR4K}khW4D{n=+eLlq{x>W&j-c%=38l${
z%zk<iQa*@(>rO=<ij<V}wa<+`A)jl>w^U5~oSd8(SPsfR3hq%TXl#v`zOgSUnUJR!
zx#q=5$IjN~`7Zd}ePJ^f*9VN-wJ{Gl(SJ|#Z;LpH4s351P|W2|U0q#`F~pYz#!~-Z
zqmqEbMabowZ#x>!f^l;4b>f|wdasY{38T4b(d^4OOFQHy9Zyi(-IlWdEkA1j6vg6e
z4C|%XU*|X9Q74dgXO2NrsX|Iiq~@8{!J*{l%FzehdXFlKC<&80C~H@{uKwFd3*?~W
zYPaN6HMx^ge_#3Pi-^6uUvH(j`$Eg~t??R5O+S@3o<AuGQ@lJa<9}X&0Y(L5bYmkQ
zgA`UhSkc%RpqR-KW@=`ZJ?b^;^+&UYuWFO`$NN9Qwoy=xOx`aa35y7XL|xR6iPtjR
zQnf8Ga3)g!>!r$AA@wafQ;o5Ri51-TCqEQXc<FiF8yWGr{!*4`|Es|CXk{JR3lw`r
zC6-BUA!nr<Yp|N=-8X0$_;97mSUS%~NIUIm|3?MkfuPz7qPXekUwtUheI*Le*xNEp
zac9aSu|MEuLVCj4v&3v`O=O&^0wR8(o{0LCQ~mGmV)VW_`7^$G>7g9g{XyF&>iguX
z!|6K*MCJ%$u(WaNVs9{0HI$0o)P|Ue{_PopW`Y6{xXb!AlgzN8z#V?g4Rv(4O@J?#
z_uT7i-gH?j7Hs09htlD|fpnQ-JhO-~eE!$Mf7^c0Jyiir_RpW52W#y-%sRD!gRw-~
z`47omVgERv0(uPNRO)!QacpX`%DE-cgpo0&vh85s_9yIyEXsAR_vgb%|84C-G@=jz
zc*Wu=Kp@bCTdtOV>!O^FEH&Th1>MpNIrG)8cLcvc56r6Gn?x&7c{D>;VK34S2eC)3
zQDtH47K+&s4;Fo-KLYvliZdaBpFXit)6ynqXJ@<gU}9PnBoO?5YB^%i>JG3RAheWZ
zH)y1g3{8S-`GNndT-N{ea!*PWCVS7lbJzZ#e!0IXVB-u!YRgb}K-ELPSd93$R3XV#
zl)(49;&S}aH#Y)rd)wvoXk?hOrV+uwEk9p-LUQyYp5>0~2*tnqFD^<=DvGGd{`YJ%
z!q283GLAtXhri6th1;9iAshZ!p}5dU^JW+oX`Wv>nXAubMCO7#HXWX63G1}1H~6=|
z&(VTOQ1={+A!xK;;@D}O+Zib@r%PQOTq99d{qi?Lq+lUfZ>08xzf~O3Pg65_Pm}6e
z<ZahqA5;8L-pHm;O@4#sAYZc{#L%ti;__;jW>8(#pWA6qvc{+jgoD`&m5|M_Z<vxT
z+ct!*A}h<D%HOUo>iL@Ql3zc32zfoI7h8DS*7f|Vd9FljEY3++sX}0(To_8=rfA-8
z>Z4{rti?{X*@Mkg%jN8rCroomjkcikD7wQ#*_7II<jw&v|6Bf4Up=Y33$w~&NPE4X
z5UJQW<&K{XFW<V}qE^?Bbu>!yUoE7kczN=4zjtYB6udxlkbXXHR{@nD4hv9qj2<he
zr@H&Sd^j<ZX6Da#8C42+dTgh2*q}io^JI5#+xFk#MRIGPyZov&Dv&7SC>#XB!&S@^
z`xtZ0mC5&ck9PTagcCHfu|SUQXL`$1N8=}_|64!St1w7NNY?8eUf2W#vXpOPRN$*%
zh^(xvkWf%cii(N`{oq{R{qbR&Fgb>6^cP1}<%->Iy6;A|d^xp@G9SN1%31f@d8jM(
zIbPV!WKyu^$OIj?*8%$NqL6K-ZjtF+)>uIrdI}%CV+zplHYUjxN#(wdSk_r?#D7wI
z^Jt0d1y%kK8=qWN*8L@S@W4K|tuloOJ$S9-sd|2PVyO7#QB+#XuZrJ}=VFwGauM6S
zbo$$zNaf{)4apoGO!m&pv)B?7sCPO3bF(Z0H@<l~wjP7yU|e_l)OeS1a>tX?^3VHs
z48scQC|CN9qpEUCcjzQK7m(Lo#{sjYFR<QoHUb~39#{p=12Nf?baXn;J|35aN?*ij
zzO(OlvfW_z$#)>`-%5QulXgq?VY*1%_56$m;TxMlcUQ8}>tzel*kZFoyav%0psRWu
z9i#y7djRYZT2W6qDe;L-#peZzQjra!3b|Rq#|7<KM-a{%vcEBE0vJdIVJ*C%H>vT<
z<W(4<NFm8VCS~xRIIXQdi2*A$*h25&!UoV(ye!{c#uYmi9zp9bJrqPN=LbOFHAiy8
z(FlKBriZjV)n-+(oPKqIhDPflg6J`QbYMQ}6)-v>__j-9k1$S@-Y40?)1A<#`U8<b
zm^Q({SG60NkkqrDfSDp79iY-G`Mi-`>4wVkf>X_AX*@bZ*(7WuE%|$;R`$`OY25O9
zdZ$&eu0{~fp83~356gOOMF><s5b{l>jp7jZvl0=mLSarxe<kXAbH@V$iNQ_g{n7T1
z{_YSGI<FPE>pt;_0il`zg^#x=2%5nzearc&n<V~w7NDYw$cnj(KQVnG6zs+)K;mOI
z|M<RxR0yEto%Fk{vXT8N6<8`*ZhZ)!l~B~|p5200L(drU`S09fBtGh8=eP8qf|IsK
z$+bV{Dk#T^8k>9IXa#*V>|FAZJxalpS!?LUu*+E!EPt6@po@_31-$7|H(LQJm+vrI
z#y6KtjFmqvY3EPxIG_l?6Llzk=xw0!d%<-_Z~z)P63Y$tlE_(K+I|b~2=1S~;C`Ac
zj>B6W%nROyvJv(f?=jG=<~zLmz+mop+j1G}{3Rs7U%bw&jByM8c)4B%x)-j{O$X2Y
z<XVU6Z!aSPG3}>kW^BF{Nxin6rHhJ;w0Tp;TE+nLk0Wyz4}{H%!&9c33QS8Kz+V$F
zxX<M+L4?-Ohg0p{sjmQ?sEceVHQ(rJk73Tg$N~BAWCwe5ef>{B8#TyMC?xXCK6=~n
z*ZxTL)7Bf?E%Y{HNH_;7qfodPIWX^!B-qVPE&U5CZANRF8c+9m=6vl)e|{iatm$Lx
zkf1DIi$JV=F|<&=4{1j!?LiZw&y%oL8h9FOV_9wMHWEC`HUUiy3;RdhJfBq_pew)l
zte&-I0b3wk%XsTNq~j0s3!vpiG?X7+mF^MECoZG4rBH;&syj?LNk8AMyLRRHz<Ozk
z^Nlk%u4E1hi~FGL6EiJj@l?2y7LuK*h&p0|T!MNQ&ihsn#PgPjcYzM|nA>zGWjyq`
z@H6;leIc-q%Q@_NVd<?pYrr@oiL2c7JjwQM@5JeC?s^X?8esiZiIN$ONvcFzZtI3M
zaOW&KqRCVFtP|RC=%@dvtZ-i;myt$Fx<%vK&9~$fx5t8eH1~FIn&XFS2f6jGD5SeC
zq=+N2Z+L4pC$MJFd5{f4Oh_fiYcg#W(j#T=@L#yR$8$l0cO})Rx6Z4qP8A*eUO8q6
zx8^GE$PS!)KZ0iJb8Y>DrI2&65TD#T>jh~sPb5N_dI7u|c++7Ws;#H>m^Td(?&6UI
z7(x``%9{_Tm~+Y(aRGEELkqKl>zjp*H(w%ikgJ&8yKlM&T@e^I6Gu1lp-#qFJFtL+
zs3mCo8zo(MpSRLHUdC<**!K>L2WoTkUzFD<$qnJvk6L{Y)<c`^Uz|<}qxEn3hB9vL
zR&*!IhMY7voQ}|O1)fQ{=A80!I@Xe<a?ixfVjkb{3Qu4jgJ+DWy>J^2p4-@$^{r%Y
z_kDJ<)DH|xrX))LIDKcB6yxNa9EF)O<+3njyeQ)t=OYW{Ul)UBvP8-Et?6Wx_kvWz
z3GF`{pIPN@4899@G@3(ZuQ7TSELYeRv;0hG+<y1dZF)k>c70Z}IBV_Zd<NTzaCmEz
ztz5X-kzMMoV5BKaz9sSLo)o(JcDH=YR7Q|aVrp%?8ZXaaLS}viBnM3R&XF$UjQTjG
ztdq<Fc_{6j_Z=cB6|Rd6oVax(Igi5heE0Y2eScc*$+DoJTE}=|?qvY4u`_bWKEw@J
zq}r8w+QSPi{ok{%O~vaspP2Y<7>8vFu^zY?;Sf-R$m?7b?VmbEaI*H#g`9n7$Yu}c
z_r08b>gpy{{qKAg0)*I&P~XMIdci$T-&9+%gV@~L56I0l6>G>bzt?#0*}AX2gO4PB
zPHME!4YMm)SjvKHJhWwkYY;gh`yxJl$K;E;bLc~Z`uSAItkVl_fgvP$xew3-YH%)@
zaGiRT^`n_INi=WN%keU2{g~&L%<r^T190m!4HRU6E@j<b6+6CWz^Q4t4jD>mi7-N7
zr@I_>6!*{TMfdH=dsla`di{j0vd2}lA^|ab7+myl@P)e!!+*ZZv;CrD1{H%QTu>O}
z6i_J|+J`M3vs8<I$^nTuMlL+~bQRtf$?p_OEM|Npa;-_dSSU6+IrrwdWI$2AB2-FT
z2P(j-{jGrfgnl=Ui?|6JQ0ynCo7*j_TJU^V{zehW;}h7uDj^n-KI2FTkh5gM(p-hP
z&A}CF`+PSh5HA3HCw}pu-?gHeiG0%6wLkojJ@!wW1HfeAL!zUjX9@Xm#}e~R^Kx2^
z^JT7b#d7@(jN(0LLF1G@)~5@s(|bH+Gu@vQ3S%!%OAJrl{NZjm=(Xkwj_h^5Y#;5M
zH{ND@t?r{N5BNQg`JMQB&;X%)2mJOl>UJyi!-Dd4tAolUF?`0XL$sqwjm>(hz7T4R
zB3Yf{P%*o2bL_IAtOC>)xo(t#w|;ai0Wts*ZdG0T<-NH^z}>T1=UKK*U`EJ}co>lb
z{PRzhDF)^Ir|vE@-$AdQ=;4tsio54*S~&wTMCjfU?dUt|bvd*hbj<;e*tAYfo*A>D
zWP);=sSqJOIQ=Fx!{|j1gIxVhA#)(YqNlj2yib6680R7#&&&*1&c>?I$E6UNTsvLL
z)eVHO<)6#%?vG#KzKxdE6oib4wCE-(-Xhn%@ltoEBkQ4jLG7#9`~bOf-&-86vvYJJ
z`_Vgo+gCL$ffuB;boa%64$Z0crJ3C+R{}oL%_Rn5BZxfmWFDPV`_la!&M14se-XnD
zYAKt+bkP&nWE7Ul^RQ=?mw->OYdrjv(6y)Mrv5fkxBA>-Dhrn#I_5C<OSg75u8<C&
z3BOa-KvsQsi2kJqf{|h~%59{j8E({9+&nHsy8zWZ<uj1n>X`s@07(4#`N^`1(TpHe
z$@8|ynYoztbH7fR6#&gfg2VRD!od17j7pQw!ED8Bi_;x6`q<k@#oL_S@!u2rf;dFu
zP26sfpPa!HG)_J5j>f1N3oYr{2a*q~pkmMjIZy9ec!FCd#@6u3D>ygf5$TlL3wZ`f
z1cZAK>ZKAfrRVF`hcLCp9%Paqm0~Lc=UDCzCI;IrQ^#(zLk?s@Qs>>>WqY?z^(vYV
zV&c=~myRV&HJBl1Y=#`ZBtGdq63}T=r1H(x$mv^ecwsth&dkY3;VlonE@$M1#k{Ul
zmE*LbWvY36#xqt{vTp5&B&>ul_(bMzH+OW!5BJt8vUW?;eAbBd&SBr;8xT-5l09xp
zGgQMFsWMs`RtkE}juLiN_=!AL5Hj^Mntv%yzu0V5L8OdiG8HSSMC`_T;31NRa3VuM
zKSK$Emw1k(;)*Y+tIaZypy~>132A1*I?-O2-b5p}5&_cjnR=?s`)t3YKqU2u8^M}&
zAvp9Sr<Qm(q$hslxJ7{HPtGLwrG4t*zJI7-)P2pMl829gdSUTO)<?PUWh>sViovD#
z!FnWSOU^g205~e&T88#`Ubkff#cqD~L{@ITdG=2CnhCgFO9%f7C3X9t?<{x7eS&vZ
zmPGzEvSH4Pg39hoaheKUG`=j;>)bCUu7-0iW*bVx!I78WO2bHe9eK8q4kjagdU+EW
z6F>SaQ3MCV!hF*z9aXYMk54m+_m?=s2j$fbmy#=}WNRbK=Mnm9ZRxVE6}n=^`dYFB
zuXZs<+a+RjyEj=5yyyB;U8goZnN5rzG}19-fPz<b<f1>Gj1T6Dn$BN!lbHSqS{(=x
z#xor?Ejb_mNlVPbC^-wKHaY~TLZYw7AkdBB=Se7{Ip2Lhz5Btft^6$*b>C)W6SJ9b
z=%%hGS)SBiET<vF@Fhg={O2%-XkP)lOaG@;E8O$Nh1#TTHC%Syt-UB^-A!KUT_C#_
zcW`EPu}^HV=$$Kyw~1vu00Dyy<k^etC3e<Gnumc<*JG@o&4Tz*#0-fwZP=|w9ZCn8
zh@7T|*tWFOQ3Vs9l+1G*opJk-Ax;m5R&~zHaPznTwNI8ky>gJ>fY#wv{~#fs3PuqQ
z_ZbBj!rUSI+T{}?9M<JU&~1m=b2;3%<%V8XLA@|I8xxo<i`uNS{!JrJ-iuqFP&`3-
z@r-~f;o`-HA50P|)gxTvvh~E#!k#&tD67Sj?Y$<wa4UeA(o+&Q`dq9TiaI87UkoL4
z?g&2Nj}-KK^)H;PT9+8??`m*Bk3qmx+yLiX0EJD+Eu47NJDtSr7P4p)8(S{dC(&B=
zXvkrb5bj#s9274QXSZuthI2@!p6VFSRlJ}SuTtn<uiN23mtso2UF<i`fdtGO!b-VE
zDPD5%wZ<lqL)(5g;+TX6S>&7_=PL||+;sHl>=>Uas{_CAJLJ*4f<-LZIu0ck=g+Yj
zmdK}LM~e(52a&H%V0C*~XpMJ=NIg!6CrD|a9&&66<Kh7izSu^crg29&{GTn*^}<<D
z{U=qxD-IAK&y%~<MF`Z7y$GS-h`Po}^=v6;Q}&Vvgl^&k;i(*c>PB)?!`^{T$cBr=
zoovTsrTqH&D|#IrM@<+;m3DgdcZH){XP9t>q877<a^3h}<MxYU=20&vG{CXijR}~X
zs|4LbC*_h_o);MWsJAu5MKd>wN{Fb0tDdL+YRG#fMT8eQ-!P}N_7oD!y(c`|SKp0w
z)q^(%z|K@eKbsf>;Ag_mc;~t|<p-9Zc&BE0p9A!>Z!p2WK`C89bz4$tntUx5X(^bk
zXp}0TB@k{>r^NMm7DTxBA<c)|1j3Ot)aNG<|Dn<m4hp{&;KeRzVmdUT!s>YjXc<3o
zGUD#5NeKCpW{hQx6xR3Ls1xV~g5V%pbntsoy`(TRx}1>ZGi7S%DjUDki+STcc;Gag
z6&l{_V+CI2uXISiyOq%}O0}rNs75t0cs@40mgYh|;gCUm|1)q^X?|}kID=9v!M)FV
zk6?B>W1+1L<36J|I9tRguNNAj&DQzY8QnDZ&L~JF3@?rH7A@(uM72Io07tCvJzi?D
z+-Xlg)m2Zss=}X4GdCo5=*8_VZK!l_iZK>GzKnXQLgC_K)XNB$1Gek?-{akx1I9p5
zs6r=_i@Vv<uO~8pPe4F-)Vu79L($Ltx7w-RjjhT3+X{PyLK+FlQgx4#OCe!U^25L{
zD}$f4t#0~)fDmwEu_J&Y@Uoj={q>pLxf$f>asn?w^G?G{g&=jtP!Fc^i>e{L%^?#1
zsI00<GhCUqeyT2TEaSnsl479$vohPf<%t9{<7KF;)hV4rxv+V23Q1ZH+n&Wh9&MbC
ztch5dW!f3`7{#%a8kT<^F&x*?`RU@yp>*mH{1zL6=C`y7llSedqw1$Cd7r*<y^hwi
zM900V67s$huFPTy0GXy{5IQX9`^6?k;L6&r<h!SihSg`f)%1L26;!M~4Y0GcbYdVb
z!^PB~eGGqOYeq>;F+ThGP0JdSwicxi>0UCmTyDrj?tN@?T)2W*wVu!e4bEWLF$OL$
z%DP;p$#QZ+rvznPUNe&i7;Y0{m0f9XA?KYtk~-eF)m6)Vykyb2df%X1!rlO0R*Y=V
z4I-wzc%68=D_3+VJ^Fkgi|~d8>U)$4Q!1d#rn+k~gJyzmNh%u%EH6?xd~Wa$E#CZ5
zCrZ%xxB?O?>aUVSd65b)JM|(AJp9aRn;W>6Q9hDWofGjpJ3NaX)N`{ok_#_fj;7g1
z%Dx;8?TS2j-D`Ny2nk1B6<>WH&Jlm2YNBNMHeT(9P3HcV$F`rG8o^y`TI+VRStF@7
zJ?i8AJ1sx7JzMECP}#Mc7VQFK$J=-K^3h698Zyw{eGqsSMNiA`r~=TYf-<p?JlgL~
ziVd2TBxAUZEgdY$zj)`~8_<+4>Xm(p{pil6r?n@wHN!DI9PMg-hbLIu5d+(TJ6gry
zu+g3R`Dpk<fqQG3*M~MWoHR1sYvwT2RuwL>Rv8Z9s?8;uLzyMXF8paKWkA4KTl|eG
z3+?=|-=Q05bW3H}uHp7UJGPe{)2iRr71dqW&K}5?G22Nb1FR@yNG}dQkma8}{CY8^
zF`VtBd(9HTc?LBNr!`N3I3GmNH*I`o`z<x|Yzdf|*=e2-P&yXsqq&G4T59-qLbHgx
zZ>rIFXNF%*lcE2n)q`@XQ!EU(SHgVGZQ*=Ew<vUmJcmb`mg3FI<JAsBHDVvqqE&|Y
zW9@n#wbR22h8@5f#plY-J@5YW_haV{xkmQ2edCe|){X|%d&04VZrUU%Hhj5aE8^9f
zz4JZ1S7zgfnYP_;El?+9<0t0YoE;`x?I8Dkv&OdxD~%LE18eDYkWA@SiA_HO$T{P*
zIsq=+nBtVLnt6a3y-)&I8Z#FyQGHD{9pTpq@mN?;|Ew^<S!+b@iNlmXS!?kEZkP`J
zH!3TIJ3lt3(dP=(wFw6b*b?B2wnA7{NufNEa{Y}3Qn9y90(EP)AZY@an1@S=m5Ovn
z$&uG{1~@N{4!@rzNu}grDA!noG+^f4Uj~*6Y5#O_wb4P(mQ-RvRz}ee4{bv55=Bck
zwD6KfbM8X&Z2#%zpGRVF2OGkL?`jL<YD5tF!CHbtH-P0hhW2oejUi>fnR{Zv`>x_A
zO3>!lsHwS{23-tYZ!+4D-Afs>t-iEgyZ)m#lPc6Sl8r0c{j*kmRHMWg&3)}4cy*au
z&N<7t3r34`(;=%Vg1HX~`sMw1JdEt)M>sn;rn1EP$#xO7xG1%WD!AdUpxkFpUDUoE
ze}8pmHxTMJ_QgRDpqa_Xy72&y`e@6<gtVmPz&&k(<(uPEFg;8mMqBc`RzjGFuX+7r
z7xgfel3x+T^dBy$#J6pCuLm{jjnCEzpBFtU9durhzZ>hK(WD5!eIAxNI(HSOJu$2t
zAZ!EzaXQ42+@{Y}32Nr%Z>=g^LBLiy;!0&c)4jvY{LG@!uf?XzHLP#TYx#6qAK)ra
z)4X8CBaIPgk@s?RTY<&`!d~GQYM3d;7D{ho64-OU>vPRI&3T@Ex8#@Q65cP<9;Xg@
zFddd4`<8cVq&im#!0%gjH7X}v5CNN2xLI=qFP_SVENkWNz0q{6_-C~F23uRSo#`T@
zFt`h`KVIcE<SYBEtKHP(f6Qi92oeQh1%<euPr;YYeTac!lbCsug%mWR{9XT+XhJzz
zKtC^nk{I4Z!PD5DawB%yIcMydXj@Euu>kpQq!UkM_pR972x3PCvRBiA47s3j)1-^q
zt(9h*Gzh;gH2{`bbqg-sIgOHdGPJ(8yrAJ0xG?Mb6fS0z&Um6tCgFopCSg!X5UxVf
zQO(@W)LV0XF?d0+#lUM7!N3;kyohCI>pG5KPFwvX+d01CZj4Sc6{ylQtm-c_y?R$~
z)A&?OJNF)c_^`L*gy<n80=jC1OVUT<NbmZnNp65{SV427xUPdHJb{2y+TKpcd5B|G
z<anx!uz?#@Gp|~{#RK23ArYGT{Ub^$4<cVOpl{Qn`D9^Yn`1ex{#$Py^qm0jAi|Uc
z=60v_TXr7pTaFGxKwn{!2F<>4(68LBx2Cnh1TbMyY}5?C5A}r7vviTelR~Uk%*F}f
zjo!EfffGUrhP{fc-F1$B3J@8F&F&nfTUW@*yE51+;iI2s6N)Kfht1|1v@)Sxzc4tl
zQ`+~LyGz(GvePCfVKL1^qwn+ES@&~LXkX=pp03pvF_HyIbC@8{at9w@<DW|CYgQ;t
zcsL$bT-WB`0e%w#5`-rv6G()<EEqyL%vFop2HUdrHA#jP57&)iy?E5FXK5mqar|oM
zK)fcEqoVcfMR?LkjA`JV#T0?|ZehX{qT$*T6rV-`NgHf4O$+W;C?pb`1>X>QU71oF
zFbW!|`$;ipEQzeWjyG_6bSvbgxR2vXDe)9K@68iU_c)&#lWd?W6k)3GcsK@7xFy{O
zyXW$aw)ymN&(Ja(@9dsw))2=fzmU#rRyT7}@$7Z2FKwBa-F*!RMX-X3&JGDaRC^cg
z6_+2>ugNue;miu>VmP&Pr^8`-)^o_Dhy?9=sxGNLen=fO6h9WVR%)@Lg<Ux6dIb_;
zEak!}ye$`0|LO%!HZAuTTYT+2#e`c~Rtc&kaznIyC7#`@%vziE9-PX&{=BPO)1{FY
zBE=(SQ5<2iqmk+E#$nP)I+Ia1b0?tP^^tSKs&3~*)il*{Ar8yu_N9A)(RI@<(pTQ_
zlW(nQ4fZ<1mKla9z&jK5;fLE0GI6tIMO2tObZKXAYT{_J)Q-3K86>>Jz0r(1)50Z2
zl*;Hz4j!VBH%9&0+PCof6E*}XaPykGU#|IAX~WudM<uK`J5Ot+#}<(m!g$m)Yr<WZ
z97D-%I5&KhEbf}G_<hugTi&ir+Hy%^yJ2pdK08dW>zAv9W3C~{hIqvA0nr9{Qqq86
ztE4}EzL(MrC)xPmxFA^cvnsWeM<Xd@E2}44@$W<t50X|XLW_`$Ou5tNwiFf__iL-m
zP8J>{-=9L4a|DFkXersE+z-LP;k~lcHXG?S`*&%W_-s8ME>^5WH7Ps2(7N64*LYFN
z1>&y_txtK}=xz21T}|1gX?wpw@Wk}PF2}WIxnkW`(asMWs`kt|Tr|wwMfwP*UO-Hw
z!WSAr=7@5Yqu#l?YG@4h%BSbQ|K3AX{t7duj|k#Jn@jbLc%}*>g2^ixfbG-k&LFhw
z5|0o;dYL4YSCC%PDz=8mSo-VPQgmi0(OsTN7u@AP;u73SBIMg2>Z~G97Cy&kU5qI!
zYt41!=%R?)*y_(!UkMX;hJW@$dn*m1605gCK%%unco3s|Ratr0_`^6wzU9Q}OSQa)
z1vwKL?~VhDy0D}sc^`WZQCX#}sT7mFxl05YgYedacJ7uQ_L&FiZ3Vm!-%@-2mPJao
zt41V&UQ9)e)1|lPK!E|jBzkvkTzG+*qgkGG9Aydx(75`tCu6~kG_`v(GNgmk{Z2m!
z$tioi-gEpqTQI-VW>T~L`A72!6Gv>J5s!!&aa5O<gq5EnhRZk{Yp(Ae+!Tdx{Lz{K
zhVQfQnQxQLz}fli<(ue*j5gLxyx+0ER06=r7|s9gyQs3r(`&^%LEYR8Z+q=N#5EOR
z1`(0&A2}a$BL7Sl5h1Dir26KmCM^>CNCBBl^C`|;xG0<Nq&BAOg?6cq)Dx9RbF!(+
z$3$xaIWj4vl|f%iWkz>;;o){p{Cly#{y?#HAGA)zzUetVRUhn%)#y0{gIW)guQk#3
z<-{h5w4FqdY&XJ!eR37S)0zVD%vFBAZ+h>cNHx<$SPsc#z0dhcP;orB@4Rh7cqC=g
zdl~AkOeWtJF$3ze^FDr?U58j*l~uee98IZtZE-R*-%-4v;$&B&Qj(rKjtv!cU9kSm
zKjHP#s}LZZD?OiWD{h<tx@S@b7O}u`w<A0&^IN6K<MP7F<fVq8`S(UlggcrGxZG!^
z%a_N3)HNh4XI12j#v(v%{|U{;WyW|?5MD4IT21W7LnL-J;Jv1M%$_rkr@<elN_2*1
z^YBo9WMl+1Xmqg5@SuCh#ewsW%ztqSXCRU1^e}@qV88oC!{YTuq@3s*Mn;R21X}zt
zKfWMm(K6wjogyL}To7G6+{^p5HZ=`;zDsp~C#9Q%F)v3sJ`Y%NLUF!)V0OCz^|4<6
z7HVdtJ~Ko`&6se3y$h1hfjP<27)~We#bt&7k>D$rr3&s9MAuI}4TZJUB|NT6-+j3W
zk&@_J4us?aQYtX4Ibb$>XA{SqoxJv6O}1P`BQb{PgsISiWS1vQ(K<?2eW5gicTN_B
zyr=i$Fc?D>d-ZOFvx9kK{^J<PeoYQGxY9XsfAw)TLiGNbIi=1DReNou8G%a+Ctt&g
zX@0Z9g^rd5_1KNY%VjcJ98F4A=ShebLs-F!V1!`-=D=s4>S(LB64iiEFvZPIvLXj<
z%RqJ{8vZ`ADxj!Z@@6_nJ~lPARy6dBl5WN7smJX3V>ZL?a_zFD@H{(Ys55HEzJpTD
zBLlVLPeW?sx%R*^$tvOfa$>q0alv=`nR&#Jc*<myE;ZT8*CvXzEqF_n3{Vby>}PpS
zc;%G_@O+V;uaSAzYP@ASG1P#doq4{%%7dx(&jSJJbalktRfdBbcAqkt{)`-&U+e~r
zf6(sLKiSkK>Of)~>KwPi`cSp?22Nz|LW8*GwQ?f9Bl=`{%@>6q?F;I-`@PN#%#|1i
zp&vJ6q2WnrCslVgXp-~>P)Y$T8%JN(`CK+8_H*#1Q+U<8fER71S`M2gW-Q1CU0Qnw
z*`g4%ipL)NV+<b17yW?o3Fx+Ho$<Q#{gSTuinc2eP;Y$JSOxd;rDPtsW>IwITRD1c
zCakjh;!ZwapiI>we3>}4g#0aAVvs+>gYxos$o~q?)AhnB!wme+2#X>tQmCxGyux^E
zAk;x`zX(&4lk`S9txKZfp}B#uzw<nR^-HCC)r-}rFux1bx2q5VaFIkf6`ner5jyOK
zSXTP^J_gGbcbT8K2?e_NAa3kru)atMp*5>R=%7U6ha^G{4NO9NdCdjhlECir9$fvx
zr@!JHl!xF8vzpA2H5-ci@QU(HIkYA<Dj1E>aLqp78RA(lPN)2{Tu~Q?kOiLSheacI
zdk)_34vragLeT*z!sA@a)dmYmMv0`u*ff8n7he%G><#eHS>%59gSBuin#8Sx9-f$M
zn)V-mVBQjZMX{KZv?BKYPf_@{I8@O8avF{PPu|5IyCys1ALyW=p~36sVI6YL-**9E
zL?PxBp!lx<Q%CmM7txG@Hc)zQd`3K@5)le@sXVdJ_=(kvxep`q@<j!ce)ND!S{%^+
z(kkY*YDG3)TWvYz{~&f*43KwrEfq$(e5}8C5mAy?2;aX(3;IG=WOVA;6Z9n;2=Wpz
zq@%vkJxS)GzD&VRM5kqP^m&$K;j=(2t(+x0?HgHAJZ_lg*9HIlzj015padS5!(k~i
z|3FT&c#sHmo|;zFVP2Ib9~rFxHT+U_$9by>>ESPJo_DHaClU@kNgw`p^LJAPnHVa;
zir(J*%zBLxZ(<3h*xA`9K(o8A|FBz1h|ZoLophvKZ?B9`@nu-KI6Wp4cTR`~);STp
zF@Gx!@;3*A0X2~wh(+tb6dN5~{QbMNUaK>?q1y!4M0P|@=kF+!LkwBNo006AA{ULM
zWb32pFiIN%c0VP8SF*2CV*k}SC2c4f{>MQgr?0wJxl(=)H=1RIg7ygkqJL&9p`srV
z&R(e3$+wyg#JT@*O#jDgO(gy|);NRL?FJn-{(qPMM+7by7`>$~U>ET(4DCO?0^f}f
zuHg3D*#8%B`9DN0xb3gCVCE31&AySomxhfkp;RGLysoa!yG`M@B>&$Z0AL6MMJ+99
zz=-Yi<K1O!XGKYWZ*T8wj}rq11_lnT*P!v`bjPys{&vRW=`a1+Zv^j(^;jH2<L}@S
zeI&Z@F0ujLh!@$$<bZDAg^%?!%W%hUDgSzzci^GFr;)E@wCpmvt5!R|xBbJ6DT%vp
zsFlF;%?T<p>YdT>t#}t6F4RBGOx)dmeG~xvaU8$QbcWn{6gIn4q~py8>Mye<SIi*1
z^$I9m+VqS5L*E}74CBJ8CPKn8M97$1l(*q`W8@pi;3l1dA8EjU!bH`dg$y3HB}e5V
ziodfb)0=+Z-IHheuja7;n*)eI&B3kh?QL~T%<IDxNTz`j^^K8BFd2231);_V``4<#
z@}Ct6+HGJd9G4KNIMhT}oo(ZpeL=H8|BoI;J70a}v)>!flmOS*wI5Vvfjc`ph+g(x
zKewa3SK8h&{d?g2m!YX-1|}zC-90=cgK5J$wJ*e}DJdAE(!2ZnM2zNtQf~is``-~*
z@QnEL{$9=1m7}e#jX*%1lzWi&KV;(HoBmJbyt^=xwS2qjqG<nj?l+kDA1lK_Oi4GX
zZ0-2w$3V|gwB2E!J+uohOtLtV&KfMY-oY$_0LcHbq@X>Co_>)~q!2wY@}+#qXTzud
zS6UOl_?S^7sobQQ6Om&@mP13yE(d;%wwKvlJL~J5Z2RUPzDutUURz>vrE`;jL9@CY
z%SChY|885%crzw!Vn=e9>F)zyLqiSI3%czo5DL6!ip6Ia&#l9>|Hpq5d3fBy4PngI
zX*WFxc3jvkU#u6uUrF67QFR&hXPA_+#&y{C_m;>li{O6G+EV>Lo&K#r=Vc5!I=TX{
z%RN<d^Ahq!FbtzeKUvV)nh_NhMfhkA#$^a`@Ic^NBs&O?)WPj#L_q6X&<C<g`;lX~
zw;C0(?QfAU&QME=9t}nno0ykhr*c0$KPF*vvuL6W%#==l1R(!a;cFr&ySF(qx`-~=
zLY5p-D4iWkIW0Nmf5uHvsSJRVGg(|h!e%mu@3r6kJNKwELEuE!m*{dff!xOxj|RrY
z(02q1y+@JiNiNl+hua5RQvP$HTDd0<-bN;fVZqkPx%g9C=F}h%Q(JLW2fO))zirdV
z0C<=aU6at%RUIv{1O@o0|Ef%UGX<GD&LDWZ&zE6b=EL+6itFvUhj}v13fwk|WOmO@
z9X2}%Q+Nt<R9>E9sz6KeCTDlxZ;$@v)n4;JjdD>63FR93-&rg-*=ZLGzED<meW1RL
zEehCEwo4gW_zDmEt@J5@9W-vLxZJ$kc$64zvybOSc+X}Y@SpMY-%%!1ROl5rM7X-v
zM<wdDI2sBazxn);6$<!rml);Bfe;xX)mXtgI{oQCzURNpKj@xvb8Abi!D^~Bky4sa
zK$TooNl9rCDwD4h;a#UWCeH3|x#WPF(81N`_pXiqzmFG%&}=VL%B_rIwxKAKLL>64
z<@l%|y5HDKNJWABt(1dOm*UUhE}+LeJ3}w*E0_lz{FuR3R-Tmoo!kl)ZJ_<-%${e~
zL2}YkAbmymGRuGul@P}AjW%-+_DE4D>R+_#EBT@LMu0XOtkHBkUzKY5Tq3|s7hSoT
zQ&iXY_pX<S<&Kv~hw8VE1wtDvDr4SjkBxGeot7sKm804NwPW=5qPwowIQ->X@EYg>
z&ClAlGXagu)AP@Eiy!(YdYNoiMv;zl4Gq0Sx8#LC7MHJ`otFv9Hgn}8!P{LI0ytAS
z&`v2ds_Yb+&#!-IB&1H>PQqfd+vluF2y}T7klgM2j0$#SBXOt=Gd42A4xto)F*?01
zVHU8nc#7UAofSF+&(@5#vy%hT1=JP`qUn9ls7r*{Z^2{d!;zld(WiYy<wWi1`2#mF
zz`6W5NjdmAO(<M-){BQQe}dEQ?dK4=D5O}apCoSY-S)ed&+68+oNf^$k3l3=BV`r>
z2mWhJW-nm6L`fP7+KNe#1YJK)_m6l3F`N^?PDf5&p2Xhhb|Sdd;C6&CPQd>z{ZTqV
zHH@VrL|;97oif%!nukd>AP2tj*qlkg(6T;`taN}mK$CwpA;aHXn2dQD@R>PKz6AdL
zcU2oAaBVm!w5j{+UJKc_bA!EE@gvp{y~C6@KiJ9eUna7Gnch_$?KK54ZzO7`27{sP
zV8J;-8^(Y=F&Afrmjmuk-|n#<TE3=vSYnQL+V&2D6)|grN+_}Vb>G&mA!JPW1E-aL
zDcoN3{K74VzVFfTWzTfH^?o`l-M6ATL~eQ}evlPa@>|cw&i*pLXuNN6%K25bq$@cQ
z588;{5-$(bZQgem4mt`if&rbMyC-7Fd#D@?#eVoIySEQg444zIs&3tH>)G|vMea{5
ztWT`O7mbr-?R}eMTFlTo_c$Ut@L2H09f8ZlTNn|9(K%`dP&O;wCoBDXSc@9I5*4Eh
z2nfI-4HGsz$Nf+7F8l==SJ^Ha*_GaY6TclA-IKfV#Dm4l(`&~WwI5)%5RW{v#-q}C
z6;*I!h|*iiMw`qXz>ytX^m(R7_GLzq&^L>)B@_OQFo<lv?#%<sFuxdLb{fG-4=3Q^
zr`V0wSq)&ZAPCc;rbD}lSys6~f+$_x=zu+ngr|Se$g+|)VW@AsR0>_q#UG8Y{j=&X
z#99a-iR#S$HEie$3+cdZTc?ZG9{=Y(>0KPq9+7ztQ<nrd!}`YW{Vn5L$JgcY1X}3r
zG2QWU=kc99NiCm>Qb?*0`W6at-m2}(pH#+oYORzp3*T@rKkOW8q-5JTxfdIui4m<U
zu{qsTM&b*LdCd}=uv0NRQd-as&IE~wsOE9o`0x;#D$2AJ&hEur>Y~UM{@mEueGrP>
zPWKg6-QO6Xuvn4X&jGW{61B4H&6U&l2e?0_1}dLYv2j(v%vQ?ay0tNBH|WXxm3^fE
zsV*yw67B!QipO{S@A$O-<F$LD{?6WV_}ny9>8iDY6`h^gCUOPRqpAfptD8Ti$9qB<
zWK1w%`h+d|sKwB({Ei#rd+d!Omm;$+vzpusTZm4d>`1Bd6WFp3iEOv_l%J)0bMIB+
z5ohcg$8bqL&wTyyiEss*t?EO(p^a}dPjZJFs>8#ki&;|yH(Zph)s1h9Xe5{QqQ`}=
z?VMf7GR?s%(f3c%tUJz$Ywt{7EYYN8%?iI#_!}2Q2HAN(a^sA?8o#yY1t!hTMj>B%
zB|LT!st6=v!Aicj>iw>_3tRXQ90BZQ5`_H)s)IpO>}9`<<<mOU?mD`9J+83L#^d6$
zS>r`YKnko7UK8>5NMeA00hj_zjLwGtQd>~gZ<wU3A`3E*sa1MuQ_p?7JxKk|e&>{_
zkt&fDInH6KBj(X7!7#V2)khWhjfZH0Kc*|pzpa=jnkNjLGaJx}%gosU(z(p2$*oPK
z9_V~Wv|i9eRQUOv^^t$_Y>^jCfD_j@yg@`8KE#-IXKNyHtuVEYSB{>v%J3-Od&RG=
zLo;7;yi}kwXdoO5_-RhMF0oFmhUGr#Udarn07lRxCp@~|A+>ouR8=~hmD-Mllxv`o
z%Plo!<ruD3Xy!NEt>dek1kACsY}-XTQ?Gg;4E1xBPXc0g%V;Ys$$bL=Dd_X{L(Y14
zAQ<=4o)x$>(r!(~^La3Ji&8j{dmDBdf{Z-C7YToiz+ENdV^exm-DZq6eCt`p?m_tQ
za#%M;4+e>Dg75UbHbq~DX?h%gE9DhQcaBx}`1HX5x5}lPB8RcS5U&~+3raB#LXh4q
z2`#_5&o#Ln;41z%Kptd(-R(i^6#pq&$YNiN2E)W8z=Q0C@OGng!5P?0PtUL^_Oa?h
zqpk_ELqB1^H|&yW7FhT~LF(LEN2}z33Z+d%iZ4g8os}G#0NHP>9L@Ff=xAH+>C`{u
z8fG8qj%(XrS4Kd@hg1<opm7_Szy3g<-|V2uR=`XOhZEnv#`j)s)SUbc5nTRvyW#%)
zBw#@8MUCF|l_mrBn-*D}ODr$&298(CPt`E-F(E5+m6+7e9nxUVKAE<I%0EDv83>_a
zkYMJEwhQU&d<4;i7UC9x3<hQ@R_4$dzlqV-zkv=NBG$Plziu;QX*%(#Ssq;1rw95}
z7|^X2gh~;DW`lH~k$-rXW^FU)O4w_;@hXw0mo2=vUo*uO6)u9D!6Oi_q0CWT_J8^0
zbm%zyI`K=X2Aaj;*bs`?FfN&X@Pt3^WYn1WHV5B0@~7|7rz*ko=ZXO;DrNrR#>p<u
zWxZGwI50#L$HSGUIw`^?#Oh$;zC1$c1xyb#>4lrkJJj`Lxv=}>JwAbO<mhH|3zW5F
zucWipSFym`Mr=3WUw&rv7jVCF)emzu%2ahrBY-01zOh?b`ffIX+)`W4Dc*#9%(u#`
zR4ld>Lrcp)AumuWIN1XS=R}-gR3<#TiE5O*JS%7_xJ2A`^Ygjd#3@7r_pp)LL09R#
zyR)pXZ8_gUe|Eva;$P_v@N$v}a$ntFbPk2z*%$vOOPdq+6K6nHKQNm1cr3p=HBHE^
z*!x)5o}fBQKxVPg;NzH_py-SL+3P1^J1AzqM+W}-6P`IHR-w!^As;Mi#|Ple^9}ja
zIjHICfinHuJgbq$i0L=$9UtY&sXhM|-y0|g&s&!!x@aNz>BU1R<>4)YAg`zC73^A!
zrke@ij|Jf1*CgGY@3${;#n(;?ECi*KHqhVT!Xe4w!cFI}hW8#I_hu?xZ&0ZuuTg9*
z-nr($hw4?IJ1*t@+Us)(f30!IuCqEtY96PzI^{%QsyKv9tF}-@s+KB}aE4#VS9_c<
zSUf=JIp1UUVGIX70Sj67taK4fZ*l>g3f;B=R5pE2OmQd`?+{F&S-C5th@T(qnn-2S
z$me?~-YBR<zW-GN_6r|U`J|txd6#&$2HxS*@cuHs9QEhN&`$X@5!XcTr|a(@8o_kI
zEQ6<DC~AkyghY%E82q4~Z}s$4r}C)|Mc;yH@m2DA1bNQ%!Owb3yqY|l6{x*}o@2#a
zL-RS(zroEc7p8=l-}}Z3yfZFVddVC&;=@HJ^Tgir7LBN=z}YKt)7ci9z1*|Xh#+ZJ
zHa<rR_Z69A7yh|F6s`m9@^L6unHRJL^NBvyqg3GvT;|+wzq`6s*Z!JBK$(J3juyP(
z9N)OdMu#t0i}_+GuD=nG^1QjR2IedGpH5W|$DPjDg4v)$JP3@~K5eqy2uG=0#&wXF
zeVv@LnrTMQFX$#EE9<bUH8j>hr+&}xdi>3w(dp9{Lg%P1Pt52Xat4v9oA`V+6H05^
z|H*49;X#$H_m|qU)q&+R68-XXA!KbCD%3bgg?{lQe}g81Vm>_KRV$VRlNkP+*$9`M
zO%GUPHdfUtQVCu25p~CFf$o5i3qB`VosEVc13|g(JSR+%>^D-EZ$#o<7mwE)cuT|=
z?jBQgPtgli2#AFt<(J#EI^XSF=0AxE?Z)X}y!zlgEOq6z0N!RMJ!*NoCwN0w`O)SZ
z+>^C3kri4HpJtnct&cEjozMURNF$i9O-DSUa`_ZI&<U&H*KYGF)1X;nHlCd#F6?>h
z@1-SPvk@+5igA%;;O!&Y@LV8q<#+6m@jsuc$(bu>*JumNjL2w=<Mx@T7}Bhk?Y-jG
z&@&j{$Tb3Ou%tmPK0x;&cQC$_QNxYKv2?R=p|U><K*+;GJert(%6h4k{A9fY+8!jA
zOi#pg9fg_u9!*n;0XSQ_IH61#+g1W6HU-O@Bh>f0s<MF#D#IHRyw&?)3`TRf(1I<(
zkc3wm2_<;8a5vwrd=mGDfnPMvIZkljoANchk*F@>!=jrtfHvZ}<B@mCZWNcSR{8|n
zVbU>=xRf(es#IIETnwOXAR)6lqVp4gwgh6MT&%l}o@)c-pjpZaI-IA}4dJhgu|?>d
zVTvbhs!Vb=T&*|EUR17Qq`@oK@lN8vZ9#W?v4zSx_&=D4uj3#8nDLmFmm?M#E;O`x
zc;*uHR61HwsLE^8a|zu~UFyLL=D)zQvFpVtua;Q9;@4L{?ld<7sx&(;JZm$%f|eyR
z1iJ2&=Y$g&+fZBE6|6yKx<dOj)GRdB51NMRm;UBP|5;Z2lP!2{3El}D86RJ^-sv+F
z42x{N+UlZ7%9^CnheLL<>v<6MHSlX5<#4w{jGVFVjJvnh@K6wKn<vNeT@rm0u4BR{
z31n`cfESt5!M)i`_`Q&_N%bu)BQa*1!+kfzNGq?<l4Y~5mjNrpJM+!h%Y_^PI*U^p
z>cz#QuZ_+<$5Zs^LEU?+O3eH>B{k_v-17%H6ka(*p{Ybjwq#WotD)}+j2kPCV{{v3
zw^wNjnIt2ZXaju-jF|go1F;aZKca34cp31~mOQAWzEJP<yq|;Ft#r3BGtl;A0$fqs
z;$Eu!{a*mtZrQxHe6sMG>Jj8;_H0BauRL=A_UQ9P>Tk`OYQCB=IXjm=MKGosht!fq
z&`FO9I_TXB0fn&ioF|i@-zc92*Krf0OX;#Qzo5itUgGHtz=c|oPmK*OSe2W%tcduf
zxkbkmqD*QQF{fnON+^*caM#-78WC?DZJ$(h#BDDUA@*Sk=9~pL9dRX1W?aaHu>qQj
zj!;cxhDpr1b1%PiRQGj^2w)T@-HeyHm(<Dm9Q8!Q?je|I*aqK)OA)ojY<}4u-$!Pp
z@d?KmdmP7}3<XL0(bQ=JPO-N9rTIcn055TrAcU>=81@+NkzUc#ef~6h3+>c{jf<Sf
zh-hMtpe-SjeWNq|AW4_oWE?W81bn_%<EeOmfI~c)r*AkC+3f?ag?hV2I)lJ5sY9Mk
zx<=?kDuoFM>%sErGn^BrZ<&jTIoV3t{Mi3)M~{KoB#%c@1@E9A+@kL-4SlJVzAJxx
z^fe3X%xukH*9iD70p8@S8M@T^0L$3BXFgBxu;q)#hEmHWDk`f@rS5=mIFg$B&XG75
zgk4A|lZABXIXNd+-P?h#z0#ZPD9t$3>aBAR;R_P2OU*A`OJGmwuoLpR7nFQHGQnDZ
z@x=|9{M2s1*KwLK>9-WJ&wpXJK~hGp1q<m()gu9cXrwAD?SliTJFu)F4XYn)<#{9A
zkRced;@q+HhWboQA;=1WNx-E$YrB1`Tx?TR2fdQFSAW2M^5{C4!E8C<P(~k#HY0o}
z{H-VLg~N;(Yt4HkCt}ZCV~lub2I`(Otz%wdq;ScGWq#K_Jp>BNkU*7OF}BdQvs(zn
z6#W~1`Q3~lZN<St!*SN}?-anQ{4HYR&6<haem&w{VuAOck$i&bAbZ93wSv+I*_HBE
zOE<heuOO*=zT4Eqn%O33rXL-vZ>O)x<(_~h^<$I9mlz2A0n?Wu{h{?2{j_vDrvC<?
z%3nFr4WZ5Z3~B@9z^EyM8%hF_5-)m7^;-Dh?nC7Psa&5##-qEd$h$IE)Cz(bB0+m&
zex6r*TPEsQy>POHKI>Q5+)Xxd20k9$xCiY(yCjd`umO%SMMV`;RN>EVXmsr4UuO{j
zN1qZplkM&w=4N?^@BXI7tdU@R{ru?pz&m7CM~BemYAZ%YuD1nI9{1apVFIjgtrpxo
z7kZQ|N#Oj3{c0bw)8_&)5LI6d7FL~>#~t2H<Rrr&TBK&?<@uPY7+L-RdQ{QQ`J1E#
z)e(B6Mk;<*G^u&&%?6kC;iPX%x6r#J;9s7D`ak*?l5BK{!)yD?hm>`U2ZW}gXHBf|
z@}no3tfaG6u+_Y$tSLCjg%|j2)8GJHWgF!TS^DVXg$cAA-(IEmf9JepC07lJPi6DP
z4{Np#o%{!DhXyzi`kBEm27@MopUsnr*A|2E!ZQ$&9ZoYa;r}D-EyLmnv#wp--CaU(
zcXtQ`cXti$?(XjH?(Xg$+zC#w0FC?CnQ!KucjlaPoge(6xw@+9r>dU4*IM^xG~a%k
zpb?Z+a2CXReN*u;Q-R<HJht(H2uid(Ki0f1xvs6ohY6S&{scgd`4bJ2nZLDo!CZdR
ztAN0#U&(*t1T6R8J>uPRVTCtCub)GH_qpjoJc+NYMED*?3f8|n6R;&Dq5f&G9^7Xx
z8G12rw9s<-d8s?n5|0ibI$l_0!p2g3+i-OZcfzAw-u{?ay!ehP&u{0Q*y%8fdvQAl
zP5(s}FAPh#zF~wC=;MK9v~qH7c@x`z`BFhI0+;ZH8`?`+FZ_ddvcL{0<ETv8gSxPX
zEP4QsNa&hmpjmvnUus9F^#O5D3_sZA4a>l<Tn&;L9tsul3);rM)}A+q)3`QJ6=($6
zpX3e@SkO%lOTm>^VBibnH`*wFMUFz9Jt0K1wN!l7l;}0SE*$6}siwdAB}f%9LZuSA
z;E`mH@moR$hK>DiZ_C=U?CZ(Dz#2j@=`c%@^_q`>9GYs-Tu3GajTxh`S~le*mo=gS
zWJ1RFmVppF7c_Qn=`BFo#+UkP89F{1V30gU?}70%GEeO4FhJ4V7}pF1E<yjeQQuH}
z9UA$U(3$g2i%#yF)JEGKddlI`+DgjOL$s3(yW5Wp&FTRt9P7bFiE2wQm{b2WSO~mB
zVa@kGd>U(zSV<vxQNR|kdqsK}E-a$n-8=wK3G}JGH*8P`OCgMtHj{jXQ}rd;?ca#$
zmXhUtKVe7-$0ib@@~h@!pBx^kRp&3?_&wY{KGO6wD?l^+vrSf_W%h->`V+GG{h$mn
zt|5HyAjYeB#vk5dRh_X?N=Q<u>vhv3l}3nem?U~63;IMAcUF|JDCQe5R8dJe=uWeR
zB!Y6XAiRDo_(!lz<eVY9TK#C#!N1AefHoxw5;KFNn?sgdGBgYlLC*oD%%Js&<SL$C
zl!zoyXjC<WWHQ?Qj1nuJ4vf9~;=|p4gyh(;*50&=*lUWwkN_C_tz^OOmRRYwuR;rV
zX2A1$H}XI^akN<WN|qwY_OTYU(O@c3x(zQdUS>H&0+y-xE<U6}`=%UkzAb;uU)v-@
z#2fr!SU-skc6vE(V|~Z$5m%e~BhDLvW^GJYTms(kxV*ZQ|6+%5#lR$YByqV9&+@IU
z5>X-9D(N<D|C&`VASx#?o~weAcVN~im$gmPnH5cHHbyLQ!ucjk|Nhf9r3osfbYI<D
zmc9##Ep{Y{A7X*K;yU5JuZePMie`WrDs1I=l_GNC!A=>oOpahp*bA#qn%lI4TCLX|
z`%?db{IMxbln@CQHfmeG@Jq~2U5iE#3VyN$mQ%D)9DeSuC7*m{B<C@G{7>gye!Hpx
zrqrQLBVfKrL7E{A!4Aa+hMmXh*qlQg@!Vwe#TV9aE|s;kx0L3ppA6C{#_fl;Y7JGO
zlV|^~N03Q14>nxtUV5kgWBDFvfC5%HKhq&SH4Uw74c2v*$0v-c<&<iM0T&X#|Cl*8
zR;hxVj)&#-Bk=Kg{Uq{37FaHcqGy=}zo)MP9#A^t&!LyoI-6D#TZz0cPzrY|3J~{b
z*TUq&&tc5nHSaonkXpEn*@(;P00biUbiq@*o-cr2!{wX#F@I{l59eCyaAQc#)5%52
z6t<H&l(2Ydicrypi;Ui0jk*(;yjZ4hy_p}Mk33#vA(grqO(>x>`c$;F)o`e-t2T4W
z!1guuL+a?;?4{x!Y{|OI6Mpb5Fx8`6QHV2(=wT2#`!d;{cK;rPB9AkSV#6aQ<>zWr
znXzVdKHf6cO3$69_4(-)gl^|{<kbAO8tMg>8)7bV^d@c!#J13n#T;%J0qHfA^{LY9
zpAMf?NTP3N&VrcSzW;6kLV;2et)-2Qj3_!gv(f9c$Jcfo<KfSo+0EA}Ls4<Q^(LLH
z&oBn`q+uN@eE&A`wO;b>`8>$DeDQg;$$V1P71?pZSiRCGUs!S)*Ljp)zPvT8!~0Q<
zVSs<1wDu4B4_pMG0Z8H;TVQZclCgqv-EXFM<~MePhA8)h*+qK9+tRPZEGW~i)oxG5
zD7sUE#(imK>|fs^E^vcr6oalZt*o<>5{1sO-_=$92StL{5VG$C0Y~*H$xwm=q-@Wn
zlL~tmnv2FFN5UizP04d*Q{+j}#gn6QlV)Po4HQaUb1>+_`xe2F1tM|$i-v-^bg3%K
zvpWyRN02%x2qn9h9u2#AWVrNyL}AcYLa(4E1H7(z4#_KONU7-)NsF92h{{)6<+V3Y
z91G16s%LV&RxSzlqPywF$sqQi_EU(e&wDKg%fdwo6lG__q*c!e#D7B<Xrow@P_2fj
zj^V5ltYWO<_p!4xUklk{tAvOs>BERW$PkA$Me&Alg;d2;d)eT7c95+SjRjk!j(tyd
zusOT+wfTLU_6`eb1vX`_E0Uqp462t$sXZ~<DgXR$6*wF3zw}JPV9zBSOw5wR&GxP?
zbq|wqME?QW$s3MhLlDJrqi@tvBs|>qvJZlmE0i2rWLx7rhg8XsIrDR$)f?u7g4Lzl
zWADUXO9+Ppb_ylF-X17!D`dnpq)<UtD%m0(c2=T9*@ln36;Qt79^8CSR%IK7x_Rg3
zmB${Z)O;{9>dT7G0ONCCg6HS}le6BM$_n=tE|Kap4ir8DRQ_Fd#iZgs)l1AEM{SYl
z9Vjp{)eaFR$z>vP&#Vm@=KeNpHPtNNnzrSX*6Oq@LEb@JJpolhJJ}~8@7pHQ_+4JD
ztgDLWY$km|V;!eA+wAB7Xb1_3>dpiE;<y*f1K@?w>oDVOqto=l!*HtppS9Ogs*tcS
z=u8%8+!r!3S~!l`w=r)ZObHWHQ)*^obAE?dZ_lKX7hk7dczuojicbWEKlE2$`NAHd
zUQ@c#gEd<!^f%X{*&^CwLT0tx;b<u~OVR3i-3nm{uSqT=JpxaIIX>_}&FY4)Y|A!E
zk2VE8eW_{q4AiZ8LRj*<s0;xCA0$YN+<>`96&nkq9<q%8g!=rCb{-SzPoDm3U`RL@
z)_n~aBtt(bM@=oxI5w`7!eDNzvL$*agAP>WuIxlSGvpT`2K&OJ{+pYs5gyX<yIIpI
zQ#lZE1GL!^?2i=2gtME8urU5pQT!{`zd`^2PX*XsSqH*q%5B*MNL>%Ly5ve;(bt@(
ze|6#J@_G^U;EFE^-l8~gxCVaX;OZ$kYklIF=|7*}DlN4aT^t1aN*rM`+eCYNGcRaU
zs)$n$PbwI6xZ+6Q;MmNn<a1m2?GBy!1~A22Je-onbVFLs1*}-;$9W1W%R-Uy4&o{M
zI<A0O?q^b;*o3}?Zn@(uq5wQt4#~5%bc9@bX6$V(yRbuaJh>D8cio=*E6FiQHJxp4
z%Lb_2Z}meu4Unq(!~Y>GRZ{rt#J25t($?s9rFM6B|K5*cELGR{N#Wz?uiE)(d08r(
zHNLu<#^c(on=xPc{N1PeQb6G2$=Gv0g7U|&UZ15}UEa=<T(2Md!x5A&bPpUN13@`?
z{PI*JyL;+?xQQ^f%Y-4aL}ra2=5AM&fu8=8zA#!f#AbnGUH#dD!^<ivps<j=B{=Nq
zQX??5n8Ov8-C7;Y1s0SE!(nCiYa0AkXF0@9gDu7#AhE4ml)XYZw~=dq_Qxey>~e!g
z*D<ZKxKfbw?ryDfr1?@*T2B?DqrUZG7(97IRY3b5&!Q)?)h`gPPP4NAdr3-T{={GX
z`adjAsfjJEvrC=TZ8aQ?)rPPdQS9TIWJa<>df@B-svQHAh5u=>a0<K!(1eujbIG0f
zn3<U^be!Z?@mcl00i=1npO|E`IAR=~oKBPEtxtrS-Fm6E0{TkyJx|HKWG#ETIbJoo
z-I=$&Z)eyH2O&IfXE;x{-F}r+D3>WID4@g;3-+#znQaRL1+?<T^zSQC_{%2@=tKs{
zS?xU7R`!WQ#ILP`9krf+cxnrk7<N@OEKY_xZq=&T@%4MMXeWs37b|b*YX7dFsh@v_
ze%zgBJ>w-WFuL7U+PJms^a8hWs>J1bmQ%nyGV@;#c#Llg-(^^hYh(2(`ad*%7TG)j
zUDb$6srmv>s`G8XjjXp#RTc9It*j4nT0v25qnPAB3@2nx|56?@SpouBu{e$vt>T@6
zsGRP8D{A$6b0gv~30<->Gba%Fy*UJ)$ohCrv5muKx&nX;OUd1xtLJ`2`|$X<)KR_n
zamVX!5T0=<%D{M|WkwSNb6yobA!vT2$Bam}Q#rU3*jH7rgsE6PxH>|+nELklk!=K0
zcUGNVMOSD5n)tNIk{xB*6IHWJ*&}o7uwO{AoWUb+PgiB4t@~QJGUPR+H?ml%v4lBS
z8GC86y0_86<yEhz?AfTRvWE0nEtNBXO1zvwpG&1P55x#9+noJ;*?-gNS|wba8ky0(
zSI)Z15QY8{V=3D|G!$eumn%yq5zF?X6o}~9!ewN>)zY6}#%_tebhAX8&Cav?ZRzPc
zQ(rPn_&a;~H)q2`h5xzA0u}@NAAkAD6Y@AS4dW5qsjBOiKxF0lzC`@Bg}Lo`P`3P-
z56txjd_Tx0^1c=h411xi>n`keY;0^yR+rP#!n@q+P;MFewd#%%30-778eL$X=ac$y
zu`UXaMW^ru^(BYhD%DbZ(+3CI%p59L%<t_6TG#WmM5<c&bgk=8r*s4XKBsLl@bsye
zp|dEze*Jm9H&kJ@T6=fdhS?)_;e2(ypQGO^^h_CBl}&gfEs($Fz*-*cw0-e$Y-+iE
z#dqd4rn8JKBE0YC75A6c1({J%+2bchcMnWFMEekGyr5pbpCV35%aUL}u-qbF$!y!X
zN8hdl<J;`J^FJizC5YI};>h;cdZ-~bw)K9dpW!2Jci{d0si}{<X>j~IGw%n`bmHz;
zx0ri%th`?;sBwK$SW95G{4hNg-FkYX4SSN@X@%HeG_)s|hDMaj)1?J9{%y!Jd%(bF
zQ$k(|$T+DWp^X8C-U@fx1mp!u1F8OUlqA%AMJISa6bqB8(uiHUchxNYR#bHgID*vp
zJaNOIx5YiYZIBpVqaBlwlaK}+gT-}kWOg1n33YBd;FOCJjj&?gsEnT6!}wc(W(cZ3
zCn3(>w|U79KPWqH9;k>|pFSR|X3UEj6&ZfXzxw%vy=sg;t}we?6)YUbhtU(cRd}r|
z0x1!HEqhOiU5b*c14{>?l;cg+^)fDe=s?^MuYix-RqV@_K$(c`m#wSzPoTQjpe)L4
z=(nK&x}qbFWvKVJQ@6m4jb5wX*L7S)(*VRBhybPY(ET*u@?PTivL4~CCjr@mY)O7Q
z-_${9-RiDn3o<f)KFe$G;PP5oSdJG_m&F&V^B!QPO2yjjpPs2(lz5a%mp-S7p(@|R
zqV=s)i+ZMP-BYD~w+dpIn`&-EhIE3$e>s(SzWRG3z?_5=v1WV;)zb^(=gg}mQ4y0+
ze|u$3oT})oml!G#4Z{e(+-$=)3Z)1lV4|j`K083<+!CTyuT{Ct^LfDCgLHCnA&23X
zyoOgitSHMZygy%EbXnDv_<XxX=D(e01u`r2$&Z&@i7mray9c6RR;tpDgsC5V-kuy>
z5Rmz<g&+r@PGYcQ2{BC^h+IrPEXKIz&*JD3Aprf2;J_@4DLDzmxBFsazW9(wQNssV
zE#5~pEMhqYU`3E%ZXgY0KW$nLJsGa5J5`w0HED=>_yZP_s6s|y!m&5v@7lsg!mkI?
z>Zw%zg3%;Mv#X$frTios^6=kGxE1gn0zVk?L^p=3BMir?I@u}~s{x|JN`hU0b`&==
z8besaaPDqjL_cU<exJXFL?`m?OXur3`SCJSuQR63vn}q?SW9l@Np44AY%3_S^<7-?
zWT!vqnPlU2==|;~>(SmfX-@SDg=l52FY1k~Q(^jO5oSkdoEgFpG*rO87G(yGWs&M_
zTAKRgNqCZ{Q@zFwxKyuYHoFp5df5`XMZP2p1?iM*3VM`&gR~<dAOun}LXbOxfwU+x
z7$G1@#OSi@Oltg0?74<YFf48lY0_-q>sdFxs*({*P)9}TmAtDF--(3LEFEAZHfLZ8
z{WmZjYjJ;pZ?Sgpi<YtK%pC~dDO^wos^>K#xx4SCt)hND;=F>Nc@007S=I4xdnjj_
zhp`CA{s_Wk<S=H94(@|(eB3Ou?f&6R+5HD(#~r#ZbJ@w3B3#b4SJ>HmQK<;I$T-7d
z3BvLYUWeGUCqbMjrR={9b&4ON+vOE22LpS8jX8qd-woeq3-WErDz1t<-iUSYYu)eN
zB^O%$$7f~_2Xk0TUO8Z<XnRb(=C!zHs-%Q=|9ie@aH5|T%0st)7WMT{*Hv;ov-`CH
z9<xy}pm@M_h3EpsB9%^4<o)%r4EUp*#-I!1VY=(1oWtFT?DZ~`9blNZ*=nQA@HpOr
z4y*`L&+ni7f7a{!y{Bw6TPT+q#cZJVky1MlKNNqD+APm~5xo!^{1sETJ#!A1Vh%5s
zEd1Cb0SpN)n?+oZf?Xlwj3Qop!k#V3dti`Yz+$-|orD{TE*NTndM)=ifru-U@Celp
z_~WlsK5ANKy0Fcb8WgDk@cF2KrEB7rM}AbKG7vWt?x>8mlurKf__!>vyZrM@XWhnE
zi*x;8lOaU%wd}RN41TLrg|AWU*J^=Bd6G(C>KsuFJES(6-5u%?dZI)hDj}mnOMwQ)
zHYmgxj95*rK6lBaYrkDp8_MBxKYLw>xf{$Eeo6>%4mP-^2gCaiJd}RlRHJDqeb-c1
zemtkkwQA=iS>v+w>hnusS!XS~D#osm{e)jKv$)tx1UhQii67Bv{4gtDkzk7riL!O@
zjaGpY6SZ}}xFzn+#Z537SRz7EBCg|-27V#MMoha1Y+{&ZH}3r)Tu}sfHFBW#W`S|V
z>WqBV{dKNzp^?q?Fs}0zZ!=&5_5!h48<zWel$s?Xv$IA9pA+;R{^SSUuL_!TMDlij
zzhd~QC0SM_s%%?5fwSW&bJev}_7aZQ&o`M6VM5JEUc>_vvmMeS+q~9U-PHd8bgogL
zpr8oBU^jBm!6P6v>sjA6#l^*G#X9cVn@i-iUNnpmDH|cK2vZ63UX~bF^>}0yy)xMu
z=dPXrcWy#S6taZ@;Lw#2!&E$Ai|6+oFcFoEw|1*3A?d)V%9q3MK$B7|iSrNX?Veo7
zYz0eH;|c2Gv~vq!mz^dW4&0J{<+sbR#aDQ)&Ov%UqihXt;qdRW)sHqhmysiQ=~;D0
zov9dFlh)@7DVM~WP}4t@(~~Cl6_CvEhk=Y=h1c&}*Z8L%!QulzUZN7Lm%7j{9KL%)
z!kAc1^9>YoPAc6>KQL1kPu-+CGPqS+>EY#bSVl=(m&@_a$Tpl=`O?sWv?t7zGrg*o
zb(Xr9`Q@(0^s32*V}`3+Im80e^|wW}1dA~YM?2$8psWjD3{tgOyd4xHrrOv(v*Y#}
zOYnzF-ycQe6#Tdd(ooAF{|JF>jb;%eW0=^~u(y!T2pN28(BRFN*Vn2~dHZmw`hhq$
zBWGjdD!I-QzdO8_t=Q_9)Yk6X@R@Db9&45sd~as*OAXO10ngU;X5qK$aCQ#HHoAYX
zX#d&57ljxc98^KVb22{67LLWP4jND{9ahQ3ooZ}qVy;LaRgZ1e?Q*Rk;Nthvg7S4~
zLEi4WSIL{2&R|uI#Y<)y6F`lG4C0g(#pOe57EX6K3Le-XaRq8c5{5ye<p+yXx7>AM
zEu;xns-d8j>nel0cof<9Ec`ewj*afk=g`~a+0&R~b~#+Fr2N04riRJfwSE)Oykz@m
zwJPfoJViGiZ2(vk@2x{BxF3-r7|zd}fEU(JMNHz0`vhNutPPstO%!7*_jrvkcwAbW
zX(14?-b}0ukCK@cpCTaWY@e&XNA4k-W8AN}rnz0?NQgz>_@ptocg4uSh0i6A63Cm(
zl%t3is75#HdQI`0>lWS2xv(|qf}-#bgDfa0U^Aa3P{n}javRnDr~T~Zp0;nGVQWKS
z<#i5vu1(KdN|5*UdIoPHAp2c=oj<m8<r^BpX3tWi$p0$$k<f8CtZ{5Mnj?@1sF2Bp
zo=_3a4RUjHlM@Ul9s}lx{oa`0KVGlWYYbqDL_(+~F0$-;6=!x&!K&hX%44T?uG@fs
zKqMkQN#GX0?k3)KC=?L`71c2K+o=s4y!?!^JNuK1qnTY4;5=Y>K(aD&i-gIYvtJvE
z+f=T^&;Z#kRjo%tkykFdN*^&pzEZr56$9+>dH!`(8Ac6-$$&=%s>7S3*C9^JjGn1H
zr0lmWvALY4WZdjb5ZYEOUZt_{?tDiq3l}vo?{!=;Gm}fHdVjKithu)%Dv<qE&btQj
zSuFvB>mZ-Jfh(0v9%&lb`DU-F;^ZXuo1I8D4t`oz?OT{Tl@Rh+<MLj+S6JCh@CkDg
z*-z#Fwq|{%bxg4msk{1ZhWb+^1D~^nV+F4BS;zE0l<IzFFwPx!GXBRcC+9IjH!4!7
z2@llH;BJl}C`6^4d<>3C^7n^LyE|ZAu-NT!OZD|@@d8pkVsQF$m3mcJ!MJ=-rOd|e
zOd!i1ty;ChD^Pi(%kg<wcWFc>Fm`c$y=+@-wpdgdp@m_&>b^y)(Q1h#^0`wK;Y#BO
z=NTUhf>W1HV_1&DH;F_k>o5NUwEn5h?%jMLRe_2KNQeVp&Nmo8nE$w_>WEzGYTjG6
z$R0azJi3qXw4x95)sf7l*INCpA+0$qWTdC@<FNqgBvg!QwID?wHPLS@wogJ8U8EQN
ztKc`itWJ)@z4@_-H)`9R4~(@2PM~p6eZq{?mDIxt%ZrK>)%N1)m5Qk`j3@7X8V(Gx
zQoKM48v!%^Y)CG&%uft~`__g3ZWTM&K^yR(n(SfHc66Ohz&n|b)N}f`nm_8%Tq?Z9
z4R-pbKLXhyHGE^USRf*?KDLi3Z!g-bqM_hyCpY;@Ny+P*>VaADb)j5k1ZCMXn41(E
z4RGm<#~N|FL~u~4Vn=mVTHlz>S!sy4v#|ehWIRpQ*UFrY)Bd(|e==7OOtn;s)X3TM
z1|MY%)mql$TX^E3mnRq~12-mwhR`Dzb(IK$JI7)&ts5N69Idme|Lf5qo8=$o2ZIUK
zQj5{~vw5!5cCOZDv-R%zByTZAU9Vy=5amzc&l1Mor@=K;DfgiwsEL5R3KqW)Z}MG@
zlRRPGaCS*PgrIU(&$}N*e6+zN-6XX-UY9LW&GWn!mjcd$s<NbO7i$ece>zTx?nShd
znZm|m)=|(xokU>)owaDDJ8?bFwySUI5hOU}g=dPuX1pSK=A*+h<=5$v^!)P_<i_#g
zlx{WOneV24YPtnB<vGyZ4-X+sXfUKGx&}r1o5KgN*ja@!=;}zU+9236r@W`+8>8g8
z>YrCoEpUY(lS!*B+}vF>15(5%8FAhN`!dLwXhC8F=h!j@vhc*a(X%CyxPVWRM_4{P
zqfxmNvDv2OsXST?#C^2Ya_8XUb|yk8V;|oag6TcMQ5IUPQ9#mR1fTGBZSHrVH%W!O
z@L><m2&l3t9gQYjtf2;lhXKy7!vl5~u~G^{<@5XUGW!E%P3PK*s{D2%O$F=M7BY!n
zv?02H#5QGE&&SV~)=AaHkgKL8-E*#A3uZ1bC}S^MH()j%ZmDSS4JfPK$duG8#>;2!
zXHN4vinjPGKn|sfrh5-jO50$E4BsEG?w<m#-p_8Tc6FNvO*?IRp%tvZcspxyGgqg)
z4=8tsKbfiZn~Y*7hT<Gm)qo3Pai4=45}mV4?o4%=d7S5edjJ1O@+hQ10GmIm6E=c^
zf=9Z>4_pJj@k3BxP*VOyhi<B&iEA(gBDRvvA!AY}vpN50{WQ(;L}|5JTR7crTnw3o
zxndFVx<+%@?Z^NhVB|1rtqA9&a@_kJ#yvjY6-nRu8oFrM5g3D$m@x>1Ei9suEAdQ>
zaFT#z&mQf!iKN?!Y#PyVR5Yrr+glCdsmhb~NL341MBiP}b5$1ruIW#B7G)TtFqe?V
zw`ditu13|2GoE!#Lbt&4aN|+#{OT_GDoGK^#mLW(u+GN#B3ggdHtoA0DFc+IOY-xY
zN@VLe8iniL8w<h`v<HSfj{=%7eqa(cS{Ai2CCOPbBs-(WC>qLzD@bf*4cjs8OGCZJ
zB835MSPbC54Lh#XOA?w_Bn+$c|Lr2f1Z8Ao#N%-;-`*DO7Y>gn3(W?ympm*lfTm`B
z?AQ7h{d3bA?KX<;N|qdij!KT@8qp7AT_ju^ZRfM8<*+}swyZ!?pZ@zGuj(dNkau5w
z=M16JrJN1hwZ(Gp!h&CJUoN5El9NLV!@(|+$ZvU{j4nG8!M9f3_35EL$SbV6Q45&+
z$k!Vexm|B^QVgn_UnP@dFnY>0uek@;!Uw+BrUgePm%zuUa)*B)S1}xHI5ORPyy*0U
z)Ax%oT4z{!EbY~9ks_WKkUi>rpH-eS*-ncK2z%sz^6Sf`>H`Yn0E*+``YFr6e*y5;
zQ)&c1#3hf2#{HiYI#lFA_E7&BOky`FTs(`D(MpHiMYeyt(akZB^~hTEAPQPXDzd9^
zhC7B6PEq3+fCMFIG?B}ULZNU+h)|{2U1SNQwGFZVlWtxfkIqd7>!9GQj}+#WdfUmS
z1Ie2FTi|YWl@4o05&9H+M>A#in=Kj8HG%Ti906-sVQYI-;4fA0;CyngxZ?F|U;N@_
zv}KeV>F#sA3+*ZQ{PUA#lw;Exhl4fiwb!l#Jp@g>oS;HX%K2GwAx|=PQZ+JOMCA*n
zqeSf1BY$Yd%xHSX%$xq)s@qlFRqyN07>BoBoX=y&&g#j%hhOaD?Yk$xKAwT`dCJcP
z3%s9f`4&Qp{-vO@;K*H2i5Y2oW)~h((!C$`RbSNe1nF#<m|yB)bkh4F0rk?R;Jpc9
zy4WkT#HgufNSQQP-|asGvJxbE-&Pts-rQSG1d~~WT@mGoV`_(vXjb5yg}@)F_H4$p
z@rOJ&e_GQ={5?!26dU4?|9#xQzc@5P?8mDyXs9OuwL(}1vm!>UW?l+!%}v6qhp#Un
zfIH7gf?GIS`S;2GzrKq}8x%x6^Vi|VC6M5I+vf-d=iCzK4d(xkWB#v`*kl8d+cO*r
zoga<qRJa`{C*VLuMHR7466`b87j_H2Z>>4iqWS-MoBp7RfXz0$#ia^mYCgVft>z!3
zl+^x+gD_AK5DHpanIo)j5*l_<n3mA&|NZ%8Ec5;S6r~X9grB?NGWlvRm;Uz${bPr?
zhDkn2XxMX({2cnHwCt#p$<2bAlbWABq~H1K^ng+Q`5~sNyF2SBax;rU8r1bqyXynW
z_Wn4^5A{8``>$@(y@*@QcXZ_I|MykNo(##GvCkx(ANXf|zBd@#-QFuE-ye#ZHT?;B
z7Z;VNFINyJ_D+?<>uR9wC>1?7Y?4aWl15EHJG?0io3`7XziDZfJ7bc%OLuz5+Umz~
zt~+`yq|^1s=KN-DfOanRFVPm1_u#)(p5Adu#z41d#Q4X{vpMFg?~-mxc8Uh;8w9S6
zty^)}Zq;m>k^B}iSOzDv!OC9bVe<0|un7?-soXv5Nu#r7hmnVFi;Jg&tw#%~{w(Yh
zZDJ7H(Y$qj-*7n>a@j^bF1LG=5@o`$<I=24h)$(IO)VAPB6OYi^mV;rrkW^Y9P}hw
z=j@(Sex`Lt1uJwQ)k&d-VflW!5<dW3$Qoz=+PQ2W(mq{To;t+T$c|LAov!QU_0CaG
zryI>>qktbj;>AbG$|0i<ruEramfj+^RSYmf<z9fQQTq2{xMup%&(J>#{CdErR;E)t
z1*VBh6|+*~?Ir+A`=7pP9JV++v7+(d%@cGFr4!kkA2o}9Go?|R>PkXlh?XpG(9{Nx
zcdNMWk~2!_^cHVYYWbOrF-3gOd=rArMyV_p>j}=(i65^3_KAhVcVZJ1N8ei|ktbJW
zBk4@wA5!)yrA+YF;~YKGT36y^J&X{&g>7;OEwpCVr!r~q-wl1DLQ#|s=dzUoP9A*J
zV}T%IW$5p$+OkhsqEt|eH>Uav;;i7r+6!!i&*&Zw+_{kO%;QS^hL}20e3BAael*Xb
z=Yn!Xknhx%2l5zAc0Cg;Hs22>Sbsj_l*3mmq;<nVX3&kT<cw*^S8$@0Z=o|P3st}+
zJMX3U_KcdYC6<ciNKh9KpsSGNw-W`kGmNF$fM95kxuzAXddB8oukcg<xyIVKT~<h1
zxB0HTcghKCAiM*%<9WSdV%T9%2?coV^^w<7OSxC9mxPrv5YoJ4wQU3@5;uB<My&WJ
zS1Z$%(Gfu+=WH~-%ED0TX1qxU&%6A2w9IqZwEphI%Nz@rQY#hmw2h*2iF)wmVk4Fp
zz^J?Sg8!UWDQ2p5`hxLifVVBFDcM*$6U=*VTUMGBS)P$*@q;`AVL~ZBhF9*LJ8K{5
zo$N%TScl#ssly76Uqc!lMKK4!$C?bV--Ju6GB&0q`ePD)==dsyA<pQT2bR?%B(8Pm
zLxSOWzCsVi4?;J`?w|t>a(BJ$w)(qkiLx9cgzaM2eZcjw+tHb~KmcSi_3$hM+?ni!
zEri2kQi&xjHs|G5yVHxZ=@G0q;i7`}<Iq-0zJvV!<Q}jWQK*H~Lf*yFp`5qwg7j#`
zzsi`M>`<9G?Y8XkV|7V2)47`f)Vfx;>zmW@bODFWhQdhXG4ut@xewV3MhijP<PBbo
zBQQZh`@9Bcu@><rmCDMK3D5Cd^dgr%3m1^rS&DBWnu(7szn~9}lRbGLY(rs3A#bO@
zXu95%MxV4$mzzf5aqFd=+pT%S8P`puw)nN-eoBzoEyXeS>7ibkcp-GAFAIa#<)p(&
z8p<nlZ0TjYn5)X-VFq`0MbxdrvF-6mv@dV+tRIl;vXt{g)hSxx%sI3_s$$q$yw0@`
z+pttIZ*JY{6P#{Y)%3bhr&sK}0=+HAqMb}{(Heb9@od$@5+TKL_M??f8@b=}@{jBv
zveSt}U8?vu=~VWN<y5xUlek1*m8+PHL)EI53CD}=QwPqJg}SkL=tl=9n<@Q#|7EtD
zF}L}WZ9nA%shINluG<Tn(1|-YI|>EQH||a^ve`q2i)Qkf8~r|#w?JHlN>+o&^+w0n
z0KToZ#X9jMi49q(i^xoCTcA6#%3{{$DPp$zIadVFrEsH8hD|fJhxhiVV`}wFZuk3J
zx!BAxMU&U-lZLEQ3cb<KxIryvH@teqm~r)f>9Y~nn=@Hit*<W_42JBomP%g;KW#cO
z@ON4{kB+=HH7A1HNc5F8hBCWKbGLl0EE0`o7h30DBDEE}aJzDB)LM^!JwMX|bk%AX
zNuboaOsuxu1x}FR%7*!Asq5rHAea1jw9nm4O@Tq)!jJdY#n~L*iOtO{9@h&=R&zkt
z;M7#D<-_HsL~n1eN^AA0TZ(Q-#`lXz9xOTyp}*l_2Hnn|y8}TpONURk{umN|nL^L+
zQ3{}aUtR(Y5;6(>Wi0`S8ytJ$m0LM|_?wy^wtNq_Uvt-<(gG_vFsoF2jCJe3r26qC
z6hatN{q85~Hya!F^~~SmEGB5dG2X~jUrtz*b~|G&o13Zspp|gD{+dsW30Gy^&MUDh
z|9MaUcvQ1wwm^~AdSKX5%AlGV1)qfKtD{4JNXVl?w37;g4}3O5fg!IV_~l|w$N0+*
z<R?};ZVUD8^?x_=wDCsd0|ZpBJ7yM7DK@(eP<B=$2(*iMODC^jFCG_-ytp{g9xr^&
z=9b(v?=@z~8hZ7S4wl{l#PtY0X`)G6wE8lqqv5i<rnuK1g{hNz3vHDEF7=DAu}TFU
zZN4`-t=I=neeaw{h^*SkBs@Aiz{S7vC#k61XcDd1V71GvR$HBmpetGDszol*k!Q;I
zm5}rN4tBqVkiyez-2x+RvEuzRWH)qQ>SiLn<JP>sV<HPk<+Y)niBP>gUD^o2y502p
z$$0QVt5-wK|1e=k(PZ2Y*^qpE-H7Y#8+I<_nS?kIngbb?lBfl&J;eTT%18|FTSqU~
zNK4y(^$-Jdi5gNs!rzUvMc!=6PbJ(30_8cV!-{#I^yTW~1s#63<XV}<j&n`=;ZX?4
zsF3ec8n-P3H$5XdsSCpd8{fQ+V_MS%+lXY$9)D*woKVw0d(N^Y&?~}mo=K^5%#a~7
z3Iggre#|xxMQGLO_sIdPam=aAJim{O**rmc(NKhf!$T9TW=V5MbE}&k&-=uQxxdx<
z3Y}}2Q)%q@xFjBzJqfVFkUIm~AzHWZH<L)a5&b@07BqD?lNfmy)&4y6`sYGUgFMeR
zmpuQTzS{8<JhC%Hzk^IY`@!qdMX<wqOFsx<Ws415L7X|SJ9aw-g{oN!Grk9o%1v7f
zsbNQ%o#Gxy7+U_6o|JOglJwfGOD9<UP^C4kFoT|g)`d_NTz0>rk$t6kn9`t1pED1e
zp`70d-nYqy@L-!7kIl?ft>{abO_z%S+i}uy-8lW{P&daLcG7rG9xd<d6#>y7v*49{
zM5$yTfpZf&nS9om<^SB`PFs*LKHcHD6tt`AE9tcoF=))PkXY7cXKx@Y9Pf`r0Xs?*
zmOt|Y*vKd-LjO8E0*_*NYfKwovoT3poKKZJPY74#m)5-m+}3#HI^=(K%&e?EUpD<v
zx(|qBvI8Y%;mi$)!lJv8Nx33ci@0v00B)<M+Q@d&N+C`H?WEaJjc8)XUXy(R<Bu6f
zXoq|S60U}>Y71*p)OomeAkv-oDFQh*f*a#a6>_Iwsanq(X|p=YR_|b!5b|Wh8D9N~
zz18>d?TZIQ0Fx+EWutR;_LNn3VhTCkdBK<|pZM0j)K?%OCcdn!?4uc?e%?+~bAHfM
zTQS~M<NwwY|Jt70=UI{5Z<to4g1B8>`%?`WaS?a*KrHzs8m0P(3~Y}kx@p|Megg+K
z-tt*YCw~v%v2_DSB7&{G-HZ|Mvp`fO1LyZGrZXGgov?d9*@KnzN8?(DjH_{T+HRp#
zWd{dC@Oa*p7lZqQOu1+@x}7aWjK&em1HbG1)5S7)$zVr`7(8-|oEp(zOz^btFZV@;
zL(Zv=sUTTEN{;1DH@9kqQi$&>eN#$!$i5Aa^WDir@?i1aZfBHEmp=_Zs|**;K!JMU
zA7jr|Z3yvj9o9Ss;<c{>DDgzzn)konr1X)&K(gPAv9=@QO1r0(Pv)|tmp$XmcJMUD
z&JQt&CHSc$)T!F_ypF92=7h2MPIn)RO00_~=S&4z&eEa@I!8tb{eI4uB(?X}oel#m
z1`D8H0%$JGFgNZje6;NU>}BuAU6OpWUfZr<4M3i;A5_m<lcmLhAbxR(hA?lRdGjRs
zS-0#5hDql;hxWOU+jlycYKq}zf)9>DgfRM~xIXr(e5%F|11ielcgLpce&#~zEI8(E
zIwAA3PN&{_KBVdn*X;*w&StmR))Gj2eojfIpjA@|mQEnj^rs~8#W0X2lw#UDaLq9X
zKmU2ub6#<C9ir0TSN~!8doE7*_+5my{`C(VPtyx;t4{ZTGkR|I7*i#yJ<W4SGNu)s
z#tK>Zgv}pi7_9ta`{z!}6uSGUnWEgng&Hr#!%pJjs}*9Fs8|PLDTCfZy!X*f8S41y
z_mAnb4rh<gZwx1i?g9NQx)CkD0lkeU=Z4N9uMi0E`R9Yvx8VZF4X&~YPzG}u>`o<D
z0q0Pt@D6!Pgls9?_mw{bJczH~vxHFN?or?M57>6)YB=4Yp4SXu0(jU+8{zAL3)M>Z
z+rO7-`#11T&8{w;bQ`tW6)SPgTGVFQM^^r<i%hL%CC4JDM7cjGEPLIM;B*{UNXURU
z8qUSC31S?X5X-i*-+A8@Ca@`#1NM*Z#vE@afkS4>bvmYP5Rs9~x~=C?Ffqwx1%Y0r
z6gm%Ni2hk1BWE#%R{hZZYNy9yDwV$RV^LlZ)i>Vz82}sabbBnj(PWMsL&%#79C0ZQ
zoDd2IyrsqfXZlIFoGqa;jji((i_m_8fnOmW(~*yO96+Pc(9_G#4k>wh#coTre+^&-
zIDG=>6+^ifdNDvig;^LbwPtX3bxGy6xl8)mvnBXe(z??R2{GWts~`x{$9ywHMl4&6
zP>y^$UFg-Iazkt9NZw@+e6<>Hln47lsJz89s-V2(g_pBfNfc9O?Q|(@Ln?Jzf=57w
zqArtOB9G+OAKs~7`ucu+ZY6-x85%^E2l1v$(B!2ts-7|jqRkOv?LP&MNbyc|lxrFK
zM1ZnFZ8yja6Aio>;MC{6y<2U(&TK9@AEHr%fWPQ2>Y4Xfv8Z0K1Q+R)!i=H#<H1b!
zcYv`C?RJ_h&LX&HlU>`102eLoU533Q^5xq;CV)Xp3Iwk^2#FDoatU_<h4vH0+w{|o
ztQdLu;<G|SS2vDlayL4*4at8uL-iLd4tT!8L<alqTH>fgKi)M$&XWxdrg801z1f^3
z@vuus38Kjr=M@}IkjrmOLGnoGC9OUX91r_}AD}A+s!cvhg0OFUr}&a-k2OuO^}=ii
zIr<3sUm4&HU|?E7fj;+IFN*aAMmf5?0f-N6m;rK>dXU3S5akq&u2RV`FO+;LXZU=;
zS;afXh<{dOzZdHtFwo)%QxZgftB|rVCJ-LoTB{yTv+~O35==xGgP^b?`u*7Yoz|r+
zbc@JUOHoK~@bS7IH`(PoMma}32>FTkL`7h(iF=xKOXAS*P`7l;KkYJ1?pfs7wpfoG
z6>sD)mE*bjC*ANQJ<^?3(D%cf*mDDL<(;J;2WMq@s1@7jA-}x|4;L?WC}#TH(S|km
z^grgy*IE*p%?LeZ&wAd{V`Wxtq@u?JOc^aArz&~wlhbG{ITpuX*b<vX-8i_NOyc&W
z1m4=%V_u8yr|I{+@;Y-qSKiJzI>4%W#S||+-41f^?-#c0Yk;>g=9#sXz8tETbZoy+
zp{QiORkf7D!|xO*`IIG??@g10Z9|%ghOVt?RO<0JiKEaNgV^q-(>HoQJA!iHaoWlN
z8EGiec!#X6^PrMVu9sSs`h5a9+)kl1>a{XeYBgy6qgwo}D~2@$+Ob3I*7s-27z6|t
zO7-8C5ta5gWQ_9cE#ow>KrTSSrgQ6d_MeC<jMl+yOTS&snzMX_Cenw}i`kkYPz?CM
zR;3BG{wRNaVRHb6q{1aK$U-4&=}<I;`aMAvZ9#cJ>c2-uBpZ)dwIm+JM3u>aaX7|*
z?rA?HC<-e363LM5FMV8nNKB{~hPbf;uC7XunuW#FMa7ij5qYt{iZ0vwc-&9>w%Te)
zlQ^l9h)phQfVL;%I17uZT-SiyS+W>4wEqHG0;6tj=r<C*8!=cZARapd#ZQ?{WY8&?
z>-p6?g=%%XNJdOI-(^gw3CO72IYWD=2?^lUfFcbK;zZwvW{uB>SS`07fihYT{1Ni(
zk)1aFW(f>uJq$`DBIH9t<ZI7c&aiBybWRGqiRMAzG&&rjFK|}z3rhLPaKeh3NcRaX
zZGO9&CWkn0_x<2vcR$B(5c=MfV0CjCnE}C6Ict@t%p{>4^0mGNnJ$`S<pq*!*C1o`
zM}-&>tyW3I7G)y$L0*fM=jDYVsFgv7n)xnv;#5>o4p==i21rl=flaenpS%etT|^>-
z1RllwN(>vwxhxQ~^6nN3!T|~jY6Q@%NHisu1McfNEcI*G#V8Rg6{5)W+e3vg1<F4N
zz7QaPar&rh&E=cEhl9d$Sr2mtHM>E!dPzos+8=fKhVl-_>ErpPX&yO|+$J`I1yFi8
z`PnubZWjR~e4%PWZ$7Ey@g7L_L`Eh_^kVtzy>U1Sp`dsX*WEq^!x*f!xtW)bcYkXa
zhn3JHDz(^Ieic!OR^SGW8E%SL^C(9^H(03eV4z!tfOHlUO{D|$=p-#$K4QA5J2pAy
zw~m|rXGb_^6-pSrytM4mIF<{6g<S0MfB`IN*46N9mkhCR3cganAgM~Z%q0Oor*cY~
z#j>o-y-#4yl|<>Jo0-0F?t9hif(GE4@t7?=&fJ4XV!y-dypvUS;Y8d%pwT9;th={U
zQ{z40)c}%ptil=)xBjv9MUV6-gYghc_vwQk?vgVI@O)(3gGHkfF2rX|w-$C~tX*s%
zob!Q-MDPYqwU``D#IMzlM-UYr9`8IUHKyV@<O95N(#JAf+QmAg--ar$4cY=UX#6Ql
zRBp{-gu>9o<c8ZYp;k-3GM}ZlD;nlka>2@$z?*|e#OT_`_4kbE$xUc6IyKWmS&`)S
zcAiImAS(W03iDe+6l-9-KX!o%YqT?B+6!iA)Sdpr&S$V%Gqenu=p91l-v|i}QX3yi
zc&|h4_;XlL<2QzJJrtNULAwlYB)Kk5X;ZUpZFI7g0}xrD^9jqZVO&9=Jk}qhl&PC%
zAl~%R!=aL0V<OddL3-Fv!!KFiCVw$y%XeG;MLRWH_p^vkP@2P6DG{S$O9O<sT}=1s
zk&|X(Z)Z;qau>cZw`KP+$SQ|=2V46EvR}M?#?Xkm-Pa2g+{ItMa>@9T_{{$tl`cRg
z;tc-y1rj7{!NzmK2ij*hmu|Vbsy&Z-=d1D&9&plc1XW=w1VbboiYSka2DQPoQg7Hj
z&JMq@urQm&!dF;0NdCj2zAxgDKa;7IO<X}XkB9%+#U;+QIGjqw?fCvPA<<Y)*>|q{
z&}tX_><2zPRESa%=^~X~g1to4&y%iU<fGwn@I(FTuaK&hb-%8DN6IG{R08fuCbip}
zi^PB5ZtsU<DrTj@rDM!D;`d3?qpzK@YH3g}0&oG>wBJ13>o22sAyaWY!iC#uRoZ2a
z*V!bdYF4j|0aO?w9(+9n^k2pR12W96pHP!duTa|7EiT`AD_uRd$zS|6tGmT+k4h$U
z^c=o#4&u3y#Q7_L%I45t?*_(EUwRURuzLoA{NSPmm2t<>=oNT$(rqS@m<nn!!FbIr
zb0TIOB~bv)9dJ++!EY{8qR%CZ3!F_mvev$si9^0ElBQ7N(N0LQT}bE#&uL4i(`#W)
zDIW`hpu7kD^+c$wSK4LK_Vpz(lFRIh8?W>cnOfAt8!ibtOv6=8t~!07bp708zYr<K
zW_x>me|)hkzq<~A<?zApWV<Nu93;C0AExdK3{4M!O}1T0dw^dFRyBtXneqDAY$^K7
zpPu37&nUoM^5#s0zi%nVNKYcb!lEMK4Gs2lCnY9|a6y4SWz9C7g(fB^o3vXj^0Yf9
z18o5^T=ter<)mFYs$n#OoQ%wh<q-V{6c))K7m}UMnZWMPq)9=tBflQ`JmU>P%h&pF
zW{eD`mia27qub*NGI9^V?_P@(a}gf&(ZY8_dR9TQl#-Cili8yjgliZq1if!pTnLkO
z1ltVDWY!&t$zqEuQ=waeAQTu}1pv*35Gi9Di`r-_bL8)8VtPtoQwZ_mn`HKJLndFV
zbqd`+$ZcIg{!~5?P>&cWap%h*3JBx@8%^j|RPEyxP9wuktg(MEX9&L8GlM-jxxR~t
z?B?WK#;q-3XupX22H8If2pe*wSf#_ffSJdVwu9vYNgFSa3z(+%mCL~`j=Ao2L@#@v
z!B?lKtuh=ETs4zpXng!AL%lAW!#;55+~U>Icd=Vx<Bv>HKF1hDe4CfWkf9BYz=n7-
zQrS<dg9GjsME!L_eWZPbt|-S!ShMq(ooC7%gU_XO(a%g-<2leLdA&FR(TJ0{^`sdS
zEf9|D0P%Dq5Qp0M;`S(lmDk|-S#D*$!HJ$`AAoeT)oj=-#%=$hY&6fHKr``T!qFql
zTQ+|O28GcO9qe0C4r=<%p!4&>$IL8767|*5(B|(2TaF4dCrxum2p4SE+AqONE+Jdt
z++%y`oC;`j4JiL&0leLOX4A$BiXl&b#v{?c2PPUZ@~EqQvrSJpAQO7->?;0gO#@*z
z<(?{Gt24R!z7rPBx=cBum+$VI%EikI!31kIpiZ_<ADK5$ixONW(BkP^nqet16|&jC
zy!e_?G{BDK-iCH?diOG7Bw%xe(00QucH84-wk;AVSo5mECSZH@V3Ug)cj6Rta$XQ|
z&bB*ctNOf-cex*Tbxr5jcn;_4@O>tey$Fb9onLQyqzl^fg&1HC$L`9fq@bAO`S_cJ
z`}laZdvDbWz{mU|v;GBGW+a&);&UXI@SfF|5FRfSH=3Htg+qTizScM>6^600H}QuC
zpL2$R+Nw_lEt8RhgPKl9fQS*nK|iP@2Jyd096UPzu4?b0bYDddLW|sb9rktP_X}sc
z_`|fP_5=4TU8;!AoqWr!**9KH=%_CoZDn}Zq|2Vqte|9Y>eY<?QG1*+9kF$=1=p?e
zd1buQkjkAdb21}Cmhf1dvft<mN3TAGh^9-xqX<L;QpRh7r$W2#&e!J|0RXXvJ^sK6
zfCj~HHKQ8+a%T{ET4y4e8p`S-fD8|!T=tLS#71$IX38Tom_NBgQR$Y#=xJ6$bk^4N
z%fQ>LFrI6e{vjzMZ-iiZjZMd|1zq!~9Gk_k3F-2g!x_HK-`OqUv~z+tgWop<ZV9QC
zP|Z3Tz0IdK9*4M~tmTxBY_GUa(Y;sKOHC&Fo|`^oK+)ydU!so$wn(RL!feJ?sKKd2
zV9)!Dz*e)jzP@6~?P5EzEFVyT=$Xk#I#u?}dvP*xbt`z+;`d}d7m<{06rb_8I&z5H
zd?pzHw8FTdiCnpx9AI;PHAtEHS@p3nt5<-(|6b^g;j>!XKF;XB-~qLlC-@XKM+B=4
z>3##v*8aLTO$ux*Hc!{LW;yr;aPVeaV|>jx;z30Fvb<HOyo}UGGedQAZ5H|JMS<yM
zRKAf@mFn|yR{%uNCqp6NkO(1&cn`V2c5}qwu_v|$+T+Y8u2gG^YPZ?`BNhW3>)VtK
z4FCyW@Ac`@s0+#~bvl`SaVEj~mVONkqDkifeG(-rHQHUpNXAMgJ|$4JKnL#vxH1sN
z9&FQ$snq3a!>>Qs;dBDy%@=OpV!O=)G>G*@4mb*lu^;bpjR%+JO?^cP4;XkR&Bot?
z2tFAl;Z1~|?=nX+^o?fN&qedIrtC`N6V|%`*u-s_qKGDp4Mq;C!Q-|&irYMg*b}RH
zKG-<igT%oU{_$TOT@HlBSf1^7Y*{B9%LAKSDHPdT{(U_tkCQzy*I6aZxh6twxrk=F
z*oA?jr#lPn4-SGS7Ns=Y7*2PH<RF&!Q9_dlt-o6Cx7HanBt1s>kyfkERcob3w5f$V
zgsvZ+sgg;bD@2?y_zO5*@4GeqK4q;$B?gM>Ylxc3pLAou_7T308eySmwS>lfzZ9il
zSGLg?yrlTh`LuYP%bsQ{#E}clsnf`M@iVB?uzJhMSYK3)+SDaje+cx$6Arq>TNO&+
znkLy_K91wLZF@;l3D)h|%Y+=X2&X24Q(k4Om!anwTaoywd9z_NTp58+X4-EmgT89<
zPpOgl750~upIO-ht>&zYdFqr@;B&Dr*0P+_w2mtcP~@=o-rsZxwP;g@fRHpVWR?B5
z<SyiD38LmpVlFE^J2{Y;bIGK>svEnJi07BU7Zsc#op|sn3Z$@3B$D54InBXNF!ZkO
zb~Xb$l0KU#gZNnNFf)jF0Tzp;u>Qu=f<ew8LPC59pyi9bK3;&kyJQ;>;U`cXkB{dQ
z$mRs_x4Cs574Fnj!MAJhzwFw)!!&(g(l-)H`P{F+!NAg(vhhXYyLhCMRSb^wm-UF@
zU>pID87vC5&uH>n%mZf@u`j_9*wYv49=7co0%A7LDZ2U}$!N^wNR_pVJt;JIVSBlt
zBoO)V#qa8`I4BF^6N{9S8WYBc$8qC4E_$zlNDVE3hdEDa8U;QQqu46)I0*sJY877L
za^zT!_Dp{&_tm?BX1j-15hG-N|4-;Qn)>dFH5V#$Zu#UqKMhmMyPd~o8xcFO2_`WI
zE4;is9%yBd)aT~dQ*;v0tyCo6&jb`j>_ZqM#ITtJ`-4^}<^U^Zy6}e?B8E|rAA&kw
zm5(1>Nt=XQ$a_eT*!kD3jOB~T<RIAXLZr<dV8lX3ItfMixKbfyJ17b_eHGxQZIlxH
z;PNQLxxRY?tE#8!^d-Qa292AS`gr6(3%F1v%P(Ym#ZE^t=zgtpY$~FJ5;><2GC`lp
zI>g<wFZgP_Guve3_-<%vtnqq5lOPatAhtq|Hfw^>bMTv$a}_+zC8og60y-}4_ZG|L
zLSTn<k#&yGm?I2pWwY9{`TuFmz{Nvp>(lL14oIA4UsB^NpQxDxEk`3Hq$h2Ae|sD5
zgn}59GQbRC+5urg0V5#o1HHzPu23o|MhG4bg~tr^AfcyIBe^}EDN?J^Qfx39iEc`4
zaxtO)IUEbLTA=!_KopF+U96GrVu&PlDOuj<<uf8BB&)EIBRud-&vzVyhyUPr2#Ws+
z1~LFr_tj}b#aGQ7F&2#JckR|Yf8{W^dV9Gi)*U6|agt);q|&B_z{kDskgR6i#yR-l
zoW|~o$;AeQh~9x?)T;IOr-37wU4K%+IERc`>s61K|3lVWaJ3PrZM(sOySo*NyB2pZ
zZpGcbxCMt&tT+@Y?oiwb#ogWAwYYxi{?2>$d)D~_lSyW+$;|Uy_jNPtUvW~F)D1bK
z9gR93A)KJpz&xo!UvEwp84#Sx{}B6h*JOE)MN>1&F3jqVqM+v<R3CecElRK7B0p=x
zXtIWkhrXc7UDGEG1<bO?)R_}ScP<t`v<E>uBXjP0i}9BrSDkf|ghHR&heHROykPJU
zFW`t`H3y;GM%@UH`p;h{iu5_~K{$(jQ|8Plz=~QI+i8Szo0@6d9LupCzawrNo7DAf
zECw=!qy7T9*zWL3$ptl3!FJ@(w&1xDolyhz0tsu!NdmANtd?`lw~!J$;N+N&?H#dI
zyTS_3B;bjNN)ne&MYKyh`wxYh!~-2hh3=0C`idqRA?tzv-VOc({$v0Z?Eo-&cD`Dw
z!tdJ}?K5pf*n71d>+9<`gVb?p4!8i4W`rdwfTJR!m#tzDH$x@kv5EzMn}+$|coK{u
zDy}8L9uA99L_T_lg?a*k`3lw?W(aY!=Waa?7iO;cN+>=YiHd`Qpr@q1&1_?NDuQ}U
z4n6&*QJUvYssLP-VKD@ngdLwq5NTuVJ2m(Sah2dPs2-@c5uxVxYvh2EwLa;+b_=0Y
z+1>IdHL_#mGeBc{P&P`}(h36$W{ajXj`548`D@WtivVi6*b1-E-cYiH*jjpw*aP<y
zr1ZuNqCBC0f%hMnJTO{@F$5b5nV83fP#;`z6m|F+MifbYBlBqgx;n=#t^EJsP_fp4
zx_-fhfi7RpU$IGUtmwn8F}V({8$ygQ3rQ8p*KF1lSAf6S6#5Pes?%{~;ckszV+n9f
z8*%1&&_j&D`bDn_x}WFR#8py4&^Ken?di>BGmuAqt>WSGHkEWx=v7c;Om0c-&?Q$2
ziHeixRH4oJ*|h5fH0NbSjv~B~HHXa|K1T_MwlEF{5R8cSGCLofX7I>@*d!H^s}`~)
zyyAQa=C<bD8j)*UAY4&Xb{2M6k7N}fe>OlWT0r%iZ*9s68>oj(L>kVkh_*>ijK{!%
z?M6?&D<EA7#$9-&r7#9gAyobGGYq}*^4RKh0f~dmuj#oGtw2k+gZP0KCHYwgg&@p8
zXPpqfRBk0+J`W|AG2y4==_<ob-^l?QxYja<2U*~j+ozMUrnJ~-Fb!(EGBQ*Y*~`le
zHmhoP9%aihld%WNk9z@as@s6;ah}QKq6aqJs<+j)ulJV0bz?tX(wHX(?vcgsJ~2Wj
zhUSJze|>^AtVU+8t>yr$>E|`+UEEiL7g=!eEdgJV*S4J7fB6@wk!3^8hZ@K)ZUa+J
z(W5uBfUz+V1}Fy2WF7`O0)fpBU@7={Z(g%}f&%((N8u{}0ItUks^2B-X!nkl4$Cex
zM4(KnfK6+qErg2A-l<+8qQM^CeuIa-Kb{_tl;>=@HftUC>j1(sWW3jBHDOOBfL=ki
zDk>Xsa;b#$KKC=e*G=YV_$mu)7^T;rVKj?1zhf&#z<KawMx!LjJ&{wvL0PF&EF$1d
z?GH|B$pTAaPJW@^eyle<tg7`{%Ga=-k#HVsE0%PnXA?3nuRf;MW;bqJt2zm{{U9D(
z+Nf)lBk8lH`x`#o>iMMWI-}p5SmfTJ9)Y~y{3M3sl~oUbzap7bI+Z-{_&a2wOd8X9
z^lYD(Dj5$4os2O5%#`B;4B6n)bl0mjXc)c}{$6=WXKom|BrptMd;Km{FNHAd=oYzu
zBhc!cmDXJ{|HzG)Y1sZm{rP?bxou&pJBK!r*XU#X8b39Fe7Ny^{Om1tSm-Wz=Jjwp
z8};ku0c!#JFLKEHzDe?+2%r8}JpJ-8^}fROcCnRCAMNb0GID-(<D;Ui!OXE7cD+3_
zt9q0jA17ym6H+5~CjhZi$&#wycNk}|q6sD~57U>*bPRH$gRv?H!Mdp~)(e9PlUj5(
z_MJkMAD&r#aymP)D8|Wo!D2Lzy63C@ft<qOjR9A!k}+&|(Vn}0(GZD(A6$Ehb)OH8
zeq9SSWD@d0k}NN4g99Jt`NenFjf`!;U#(FI{hL5zwC$bWM5*0(I^wnm{%r8CW=zE1
zrTg#XUFZzLS3laVoc*&f+hIHd1cEV`k#ezMF<Gu_<=T~1=tMT`kfZ3t5f6BlgpX+6
zSOn-zbQQQcC&a9k+tf`ztIhIOs~F}~=mW#|K&y44SG71Q&+ELh(?@Gbes6Ti$GknZ
z0X?<#?*E0wAh2aIRPz8)t0bba+c8c=s5ut59VkX1Db3lIJW#J_D59&B&Gftk+rktB
zS?dvdr1)xJoW5?(iyb19>}xP05bG=B;>a9d4dSw_laW1cBayOR@FYj{ZE2~$JBMcj
zp%;B4HOz~|y9+Eau*xfgMax9^QJZKNP}AfyawO)_|LG1nHutIedy{WX4AkOK7ydAX
z<wSd27|MuiSR*-H%a`M^6P)=1YRx0T$-D1Bdb7AwWAc^j`kj;eF#C~Bm3_^(!-xxq
zJ{F14c&5K%_fAspP2Ui~MF<2oRXixCY{p{mRei4{l-y^S`sH<cS}GLimLC4kBCTVp
z8~V(#chsT!BCXqYjq|1B;ANDf#41N(WmfeuvWp+oxno1z$gmpxZI9ZmnEBL&Up1eN
z4b(vXUBoD9n;6z17*hl|<Ztf4zQ1nEKfE~TjUYImnpdVFOAcn825T&(<k9cK#L%zP
zUzYt0;Y!~|%t)afE(MVg$|(R2STcJq4S?K=sU4v<u}rS)rDY*cF5K7>c`F_!T#BJN
z2MKSf;f114{=&7y^({3gPTwqRa3<0oW^@rnvTPVZ5`uvY9)}Yb;3^M%_q|@S)_@}>
zg99f({Y(Z<>1=$@ZYOnuZbhL#LF|TLNA&jmc)=gkoRk@**iVwYpHGczENR^qR;dI1
z3BLZy%Kt9~>l_9I(+j%p${sH_lnZa?0(dA$Kg-Hu{M~+e9LvmUp{{6R{5-nO0S@o*
z?axettTBWc6^C9IEr2jT1qnG5AHeN?Uc?b2?UYwXXK)UH`Iq}M+1CCP+K0v4?IlNT
zM1slcpNmRORsHe_cfmXWJIDtV_=tMpUUQ43>?`UedgDDIMR>Wv)_1p@83`tcTrY4=
zsz*XV$U%zWlb25RXe4PjS)Ihs9w9sf?-?@13(P;n$bt3!(24I!y?m{B?%QOd10hef
z%I!=hQ0#1OO$D|5PubPsYNy>}Pi33rB!de?^CD?e+OB)M!r5Z)$~=(MWYbx0a)vfo
zZi?z|;lLTyG8!NMS?*yH72uOl=|OTN1F-W5cx9pa9Tur=%+4^ju$&AX9rSnQJx_08
z(P0E?a=-WZ;%Ih5#FQcD50Sg^U!#Q<BdS@a**i@XoMH}4{rI)qvB&rM$!;3;UimVO
zo`JB}4HZu>o}!unZ0}s(WM&)}e~L&A6{pMZ_E%F~i9VTVqokA{AXTC@p-f+Xv3UQz
z1+pQpiBHaBm+vF0oFG`cy-Zvj-aO^-&6cNvU_M<-YnHny09Zb@uzoO#+IKW3w+?A<
zvkasF3xJ~;l)J`56T^Pm#j84kW)3`GXng-&nqU&+Xn~tJ)42?lq1HH}<nss1r!0Z5
z;ni~6Vc2Ss9l59#>YihSG!ut4w93~4ty)F>n?j*O-!onC>Fy5EykkpX5fYF=*CzN9
z;Qjf+#3V0cm^Lwgu}3!-go}vR44Z@M{{gvM^k5dMjf!(~DKfZhu>P@9M2sNR`SZ&G
z<^OQViyZs9!OxRBb!a+@RukQcU4eZ?CqpD{o!E8VsdXRAC2XqMC7wUWfBs!fS|Ax?
zX_{p^zK2L|FJOs!aOs@j5yXR3(c*JggF;m1NqjsVr&&)LQY5qyN9m^`VGrkk(oNLN
z&E@6Z4$@SMM1Jq9VH{b%7#Kz=sl>wyH%86Cf()uNJMP_0%Go@c6(R!CheOUp3iW+O
ziQ(ocsF@gS*#<)R0YKp__K3!-T)&_<vo4)6Ee)&9RF4U@m3#o;$BOVtWm6fwRs&+P
z(|vHCouALE>8G~?{nCD|$$pFqG3n;dNly29Nn68#?C?#~>u@=Xb8(Q<(!uEF$h8jp
zRArx%1gAZawecOJ2?g@GLOMN#NyfYcI)}#KGkG~aUrE4@07=F)*`#z3H-R~PsCJ<b
z>nk~o-@0XH3S__w{_gf(g`@DtZ#_UGaBzVHwV-NAaGVUF)A(8^oaF4<go6uN4vBnx
z(uK`VTtsz+Z_6sIQOFg_je)jPQFT7k(tt!-Q;ir6M4rg+^Rcf5fA>vGgERQaYoim+
z{q@h%d6$G5JL<}~)89{1_Uv`J)MJ;BmI;Enp$Zw@M2PY|c{y~WU<CF^`QG0NRF>#l
z9RBmGlkfA`ULM0{tI(VNh8uLdxp(R#f=BH6@-_ds<9)(3`;@Qw?_cf3*6)=C0;t1S
z!Ha9RjNtwzd!g3WXLO_^?u7Q>EH`pb&&-DF|03$5j`JXTFztm5lQkFccTN584+u-R
z8V#ii64S4|?i79O_oA5lPi(lsV`{#qLLSlS-A(>a!65EOK107O;rtTCaz{LoS+@Ky
z!7W0jOA+rp=!z_)i{fwgnyT@y%VTnQHTz3VX&;&^TXxYd1_0;|JxsioP$ug!caZ7N
zPjh^okf&}!s9f58u*j(vp0dk;C!%NyZy;3S*a%t;5Vr>!7Dlih@!WPHFSd?YnF_Kc
zajG@2wbH8DCyj>TZN__KACRMO%mxGgGN9)sno`m8zfrZxwRDQ)W|dgMyAkP&1S;yQ
z+X~+EXj*URA=J-#r+ooRYhaHfqsVWby9hm@1kLo55F{HIqb@VNMpkZ^KCI8&Qv>-&
zuOj}PUE|*ED62n_mV8YabTh01Z5LLd%VL2!yiUlsZa2+ld(^G5U>ee8tqR*6rg@I=
zn0ovQF+&i)*l1VqGyJBD?X+fVyAvtgf>U*!D|-c4>I4Ejr<$VMZ)YxrFu41qmkHix
zEU6Tg4Zn<*!m?q#B0M$M2Xf-lYtQ8EnR$S?tv5OX>QgtAwGXd<Rla1?TipqnS?h+p
zoWt6w2tRZh|Atj)H{XYcuE9|&=0;0TItAFN{5~gLOv>5uf;Yq|pJ`VNwmTv{M9>Lo
z1;gQfd1rS?NV)IV-EX5;iO)})?cX9vR1XYLkQ=Ro_pAihrdNipu9eJ&TFZax4Er%b
zmb>X_HYiYE)>b|{yzt-H0(w2raide|pOK=$ZXp)3#AiCNO?3kP@kzCR+4V0k5Hdnf
zc6LlNaNx489pgNYG}_oqcG(>Xk#?Q}jQ{|t^g}HF_V*`2%dFpV0MO5l`mt&ewM=!`
z6{^Yj2T)XAs+T5NuCEMjA3l^xq^B&w&6mhSEo+={q=_%B!MFw?rfz*Q`+N##hcXf*
zpj{aIS_+MAF3w{A8Z++jG{hD)G9ULU7*@r8!~m=Xd<d~?sBbytsBBda8+exWX};=?
z=}j{KsFQ!pI)0ARko}%>L)|=N0<x0_=j5;EuG;9D=`?)|>DrXKLa(IA#m~myhn+xk
z3E74{udQIO5Wq-5g}g*~A2S1?*(P~D#)7!REpSag7fXlGA`)JmogmhG;$h>qiLspP
z$l*6tC;ea)c|;21ow>4FRKul`3YvjusW}{|nPmG2`P*eok>ERL86oOvb$>m?-s=Ao
zDoTl5aOk^K2K!=$;TghR7E_ohESF43&{GHZ#P$(zmPDM?#$<<b0!-CA!+#`AgKCDU
zhnz()cbOpQa?(>a+-@O(CMU{0`qNtt^Gwx%Ykd{6M&3xou0iWQjLTD#<67+}??=&}
zbUCnjTItUz?sp`r=cQei*cFGUfyYZ{_K%IbT@ZG?EyJ)r<K`c`p4~OFN(s<FoghCs
zFB>5}YbqY~YV?ZP83MjweLidWSiWYn<~?@m_&u6qbzfzFl9Z3fA>nkkiTP}5x>+0M
zQALn!`G4{1)YhvLkP*HjVW6TFPmDEwT0@fzj<uWlqxSXGHz*NNpc!(gogl>@WBgUb
zxixcLvsFj9Wy#;s=&QaI1V1g<ul5Hio!y*^iIZGbYEUPO?xM+^zh+~kvjgv8h0EA?
z{FMm+63;rTTR`{fY+pO1`tD8gsR|4+AUWZp6J6<$94xd}<T&bZtwqcSuB&Rr5v$&x
zWEQ0Fd&nLzr-PjJ!jSD{<B8>}_op_;Aaj-p)npPEC}`^tLfbx=;1k%IvG~Y`@iUxs
z3mK_%*AR|EC=k!B(VHZ&wx%j58X4FUt~ywAHjsiigqXUv540$AK&qEB1>=Nh+)(Q{
z63S2^(;3Jy<$Tk0*u~?eQ+H6$MfED&ghmp}xw~OWqxZ&=jcZwJY!<T^wyxPC)%j_A
z>yzVAOH99-3_-qnrrh<dlz<?(+z+t#_D4m^gtLw-WsqlK7o0&BBd^#E^K#6cnhisg
zW6@fe3RPz9TvS@%<v0|;`*xL`p&u_O9BaLuv5ym9JGmIxJcc@4Biw*C37o*SFd^#j
z%-3-sgf0oPpM#4Q`WYgynyaCQl8RK{^3|9zY}S!J!kE5fxpexEJOW;}A(WJZYlzz8
z_td#oG+M}2-W6&6%JG*+iTCrhiv9C~z4C()LhvT>KO;z%fai~<CSLc`#RN-8U8SMn
z{lmIF{{&>ul~7&HN_kz@)|>vR(SAuB`{U;V$T~{}(g64P@Sp-ociKSoAhqXZJUee9
zPcyK?6BAR=0j*Z_!{Jh2WP8x6%KGj3ojKS31F63XG0aruEPds3K0T1b@q944q7XHg
z(jE?TU`*@U%)W<S#s3vDNqg7PW{msIx-n8G0x@EhPJs3f`x|ooSZY_#m+w<b6^kqL
z1!;AP65U$s+<F;f$K!UEjcUB)&BFyR&MpoRibrYwN7Zywrm_O#x)c#cY6&tvi%J9<
zX-UBAlSaNYYMqqP>SILwWmuE<x;>FE`p>7o#PSDXCe9%rSC6q8Jm*)ok#Kuq8~2v)
zYMau37`Dimr2kpvfl%rah9sZx$-^S&LxU>Ou_J>0xFbbu*S3HbRa+&*Arc_eD-s^}
zm76B>c+{E8Ou?S`)HOUd0AiVr_A*@X-YL!@LJB6p4rA)W@dhr37wjUeCkx7F!07`X
z@($tO@uhjLL*#Q30&CNFf9E57Q>{R!#=FL5KVxS)0D7X2_(H6_=n(^K6?$mgfWksD
z?dd?O(w^8g8QFK79kIW@XieC!2owllB1xXMQGH40xb3O-=2$3eM%Db5n_C3nuUd7{
zQRGX6kl&<=bSRzzAdJ$cALitd9nso$OjWD|->r&`Cy}ZMZt^8W0_7r7$KtJE&KpMT
z-2tML#j-UzJz?DEo0qpPyFWL{;O+$nOWmVea+IgqWT006HBa}tkOw1=U|GfBm~N5l
z%WUQa+a>w!35IcBSW-6lM*sj>E6r){2VxDraU9V84y?%ji<uYLAa3~7fboQ0%cHe?
z(Y)^gp_d!YM${Q1S(OV&uLu_eAa06qktTQk`z$qadC~?48j%A=IT0j>O9EUL^|iZ1
z4^?@%`0VwXP&7{b#fB0ySM+T|*m$JvfYn4w`>=d*^R^P(=)TRCiYGo$LDmM!!QG*L
z=+>Xzp$RTU(@j!>`DXQbMAYa)E8)miQ9;zE)&hlM@5?z|T5*oz;q1yfV!SB_j{%gj
z_0htM#8Vsp^Ab2eD5VT8Ou$atMQ1(`m1uHzDDem)8M_(fyzAKcrzZFo6H_=qzMy;2
zx`UEcx&v9d{A#zqeeQaHjRQgy6JwbIo>d@?IKklic01UK`9wxb=bA9>(s9s`MytE>
zBW|_D`lktQ?i2ZL-p5iAOI4Kyh_#aWDMBlc3YWNf?~Q(~EaGkTS4cDUN^_8Bx>H%X
zL2)L5dy<FZse%*(Z(cA98kVWH1k;CD>xI;odPB3+mz`}7lJ(`^zws*K0fR{=d|-Qr
z^L9&1M)$u^08M<tO~$zw-GGhMnlG8<Hx3O{%wmmpfSoZ2Iimu>`{?-ibdK?niAf;a
zw2pwlajGra=Ki<+_{e<&dw$Jwo7hWZlwYFvY^9F3jy(_g89hXte8JtHU9yEH<oE|5
ze5O-e<xi!}zoJQ`qqRNUh{kH4kt)zIs0hvx1gttH{K!p4qiYh^c!V**LkW|ERiAPW
zg-#Z^ZIe6sn#Y6i5zbi%F13yyYTwfG837NQMWH^%L?ly<P5Dw5L!LINRcF6Ym!oiH
zQeZvKBl#a#`#6hHVRxs<1mh)l%fn%WagFmd@;{z3O}P)T*ZDv9bGxjFi~JeTMQYoM
zghNBGf0bC}ZL>LJa=xH36lBIT!xD>zcZa;UsFe1TmLAW9xYj!WtT4_HBzq|~;ku?v
zy8?|p>o8GVxp#x?W$cQrW?UeRJ%7k7zk|I^M+PDw9d)M$j6)dW>x)$VDKGstlUCcY
z7e!pa7f~|QNrD$f&4*87_^~>rgbQ1TJfcv5WrBxOqlZ#KMzMe#9Nz@$m5zR}tcgst
zhn#R9Wti1&mwJS=&Xa69j`iiTB$S(hT2x4w<b?sNk3i#(M*}bM&F!iNjiex=X3f@P
z(#X#3Au##qg4tb_+fm(W_so1Pe@T#3G~QHSG(Kc+s02Nqo0gVF@bs_~hnT{9UZ3Jp
zGlXVE%waBD)Xr@;U-0<%U}h-sBj?#f6{;disTJaS7NDFIQ?Tc6ZC`E66$-5y8^3*-
zUm&pis*X0zxi>W7w?)TrgxeIUr=OZ~^4{q+noQ}fF<?z!uQECACGC)#W)kL#xBbe+
zo%C-rTUmMO)9;BCyYRPAPrCKOeaR=dK#{V>Oa&`Pk*~j)6vu9jB#D4dWt>0yH|+cI
z9?Qm-emPk!SM4<z!9*^;{y(7y;W_}%6Eh>@y`9d*19sc)sIem%!B&RuJwp~ek`an<
z?iD*~%P{TqW+5O|;<J3rxf8N63`<a5W?*s=g(-?`s{gmpUGo_)>E;Z841_(gk0ysT
zPw79WURs;nT(0aJ15D)u!1Ph8?V~2;Oq$_aSRgV$rd<Mj-#00tuc$MNZP_H`N|9)A
z>>fEaO-#vTRdA3QkL(Q{N@ueEcKTOeF9{7{Z5AjN<IAu^)iU(0J{0YopLjaOfL(RS
zk>^E?r%`gJrw2mXR?v`PoR|NNjXE2De+~BjLXq&!gbkMF(Z57DA9!Hvhaa6&_a&%t
z8MEhnnWwDz<`yPOzFDvOpQB(=#Wka}yVhq73)vp<wjQc_Er`BIP?@LCyhCo$VmEYY
z)e^=gDNA#j9#+pHg2Z>D2MFItgyf}Q+PkrNofGMdgUp7r!?%T5)H=~1^B`4_obPoj
zhXd4mUJ{XxI8{zd?P^461umnON;-$djWOzY$N!rS;exoueoNEqH?zeMa!OZcZ1qGS
z|BHuk9zrU8zwY#-{+^bTmCenUiIe{XK*%MEgmfc+&iXX<aJ6&P8-@L^V-zaNc#p$&
zmQF6(-RgLfcQiKH{bXJ)Q!L7uZfa_3w%yyUOsx><^)A!y(IECsQ1{`(RyKKy2b89d
zW!hyFDa0J!HYwbX$FE*M?^PvPm9CtcZcHX762IQ1K~wg=ul-b%ZE#PWWv-B+_kx;~
z`f=$+K`Ym`LnhHP;l~qKO}&^<BnE+gwa~xC56UijfXJ6&X>lD8Bpib8PgbG7dIjGm
z_<8%Ovj{Q<RvqoUeKGu7^nc?aWS&Hwd(NM)20SpRc}!ij8x9as6@Nlu09dzB8?i!-
zqlP3Am`wdc+!NKG_g|E0P34=8ha9qHy|jZxFweQe<WKsAa>JWzEYfuz0fS<a1GRDY
zA9bKe)9#^8_=2d&P9z|a>SDW}8*%QsPM0XxL%H#h0`19=SV$zq_r-YYd*xPqip`oR
zWQcG2cynOi+8zkgZ9AB_0x&MU^4%EWg{gWRTcmr`QZwV#*w>>9zW)0mtidk4e$dmo
zd!Tib*juQS4!%K5QiQd!V1Re12t6msqqtVDzRIXqT{dK(#mLVV8{FVMt8ULd7frSB
zO7U9t7O!iM$)&prw!0x#rXhC6Q8<|yHTr5fCU|u|IFV9p!tAROR(!5|WX7>Sn$ZIN
zu;Y{d#3T7G+!jD-(B=FS2?r^UK`7i!PhgXa+k24982{*UXv1ny=}ew<j{F*xo9vA`
zlX~9M;&=M6xH%a@UQ=2t<!)})`(>_%Wbcn;qv6epA)6YYLpOLXK2pbJewRxpU*mha
zoRs8u|IG@QStX_9qi;0A6(~`Ws<cc2!;RkKxP2!hmt$;JeVan*-d6gQyi2c=QOZ-k
z<P5es`3e$Lrb$ra89#w`vn>QznE4ZJj9;6|CbA2+>!C2&VOgj)$6e?C4rDhH6l?zE
zNrTjM*A;!fK#xh}Z-~*Az5tu5g_~@AEmIk<K=`mlbikncljj@0=zuQgtY)8pW-PSB
z3nwj9ZM5;?y!1&_B)^0Q2Fl7ZOP@`?zMkfxqjnH?8L4wnIDl<}-iFVfry;#QL7uyA
z!u@0MawhQ!9J6SP>mCO;v!I~9egvd)*j!{afBfeZR3gI`1RXefaM@=vKU!<!oh#Ff
zR+)!DMjuWVtMr<xNV>fL(w;5VMfAs#DqM8jll?QUQc+R;s}F(&BW&A~szs8%Prh~f
zKdU|8ot66DpQpQSw_mONHiIuLEVTHvf7)LessQVl8od&55adPp>Fp%-tL@$b4o0^s
zs%K?NHw$0C$LFJoqZDL5wLN|hmt8r)t|s(CdI+*Ka-{k}18a$CYEvjD{5+++=o2yp
zT?tW}4ae=DzOyccH9j(p4*tI@Hx?8WDkU%)WDTKnXq{7y%Eyc$SG8x)(TvY;E!2Gs
z*hgT}<`8e0%k1)LGuSX!;}o~kB7(<zXwC2H3INUb*pngAsB=<?-A&no_!)pjFK4MB
zetCKNvaR`hpRNat%(sE_`)%))*k+-AAuKr8G?h}Lv8UYCkpUx8GDE1<U>t5@0!g`U
z?nB7O2>h5t29@!*3+YI1x3RYzwJb69$MhLU<XwZiyNCvmy3-ZF;%K1h8(Z)P_gFz-
zI{h!*agNdMswsg^FgMP)>Z@t`cYM>c43qXI2(8lU&m7C(PD*<&H92w@Re@dwBLesg
z$@-X1vXT`ezq6!vnvBSavL1Q@#sL6_oLObCsPcwrRD2Z2=jse<a5`^b91PPnqpqqx
zY~1TpSSM2b*5I}>p%?N8fFI>8r(R`_l{4zC7iXblOlM9!ew!R+T8|QPx5Z7E9V7Zr
z;PuvbV=T+)q`+(Ubecw*%1RsPk@<S=(w-yZSYWr(mb_{%s--A<<k;tNBD;fMqM0G1
zg_u)$j1h!rO(`^bag39+3H}BnO($8E?s{d4K|HcBO$kI3{L*aprD)EAbaEY~Cz-Y@
zQ#8v+-O=-eZ<y-0F!ezo`)0p3d?lKp-~Nzy`3U{bt<`C2AZQ1wrQyoed?7bDo&4oe
z(M)wae2$GN=hS<`*^mQj_5^lCZv)EV0)t`8YaQ)x&<@7B5s{89P&(=d#iGQav8<{c
zrOR1%DFBB{MHp3Y57&7eb;v<uD;~m!8w1Aa$BEqBO*mjp`9!%=wN`R`xdG$p$8(&2
z#kTY)*w|DatnF<culGja7DW-XK<qUILAfLnON|c1ki4rFA2sC3w@N=9!p6|d^M)TO
zR<3-BC~fb5HWq_1-TOhKFb%2P8Vq4(L4gw#F4wNcdkgh@G%qpsT0C-($6Byd$bfAG
zhq^<9(J<c5ACH-7nUrxy@IVwX>shRnC#sad>l&O0uqmz<YtY__+S)>K6eHH1jNlVA
zo~csAo<n0<5FBjYDm17Ytgp1qAe=?4=wxhT+8t8KMMijA_noqRN#6h6^L=M1#F{KL
z)y#O`w-m;KPQMDRtY9(Z9f3}xsKcVxOwN9fd^L(Zvr~ad(^K(W*&P@#gh#FP0iRYH
zg@*fxA%t$?dNTl}t?mME5-?yg^!uK8f7N`QM`slr20y_RFHVdE&Q#f-FI~F8UWx%j
z$)!?TkS;LpeW{2?#4nwdUHuudL^MnmB~%}l$HQt7ot>?52A2h?LZQrfRHfXC>y$NN
zZbeRW&F;?RN#s3=)~>RjuUaY<=}dkLIe~JuLZCGREC=yWl=vVoS+yD+GDUm{N)D{K
zv$+}9U*;&vbiU*I7jaP(FEI8i|7psGi6^9_yAfZ5w`M&9pLIA|c2VN@@oq9wn3+VO
z=An#J1%BHL4#(=1X==gmG<C?H9#7nzkR&Ag#cSJg<XuQ%Gm&`!lu3);2*kh`-q^^2
zJO(AS2~kjpDhe}d)}Ho6!DpAlAv|WS42=?P$dLt9v5@brjYSH>{uR|m2GYcAfX8-Q
zYpZDti&;A0Ro)NU)Z?m@KdqXBc(_~9-T1oNIHBviS&Mh&p|NEymKC_mHS&H?(%g(q
zhVZO9t+G3hXjn>b%xa%+A{h>1$h;<3YL<%<+Z`#Aiui2fkcxPRt2u5I{pjv1HLN^-
zf{!n~xjTokPQ>Q0d1|`ZY96}z+nzq#8FOSs4P1#_OeU@Md8PeQ_eSn>eI-+>y93lJ
z$C)hJ7|@#G&!9k$2*h(yC7+l@%NJ8AGDC9&)R(>#n30PiYFDd<G-lD$?D3E;w`RQf
zxznDY@z5yn+)&#YkIk^Q%a<=Wr9AcYh;t?<{Pc?!&bZ|FF0uO~6QY2VFUHzIp#>Wr
z6_+EZR2Qi8$HpCI?CaZu{c>*A4P(#O@Dqlow5`sch8xZ90+sp=vC9pPpEZ|m$4FhB
z=mHi<`&Kk)^S)7BE4F+NNgJ$>R`RZwOy^c9QK5vss`+h9-WlhR5De#jF9<^SGtO63
z=YZJYpzNGc@OWfB_l9xR<?2rB8e*9UV?25X2BI}l^Gv$;kX0)c5%u#{Y2HjU2_kJM
zs<t-o>E>Ptp+0H&Lo5<e$g(E1Fg!F-iXLd?ahp$ZC*4HqM}G*xs%H2)lDj6CaPwn#
zvX!a)%bNY6)y384twqJ_Kd6#c#<$4bDd0VV7Z}b`>}VNO$g<y^je<eEz*XI%-iV>2
za^dQ_UNNrH`J768jMM(UL}+J9j?!&C_GEHL^Etx@*+2vk7YGjFn0XA!3cyzpSdEHX
zJ(nS07p**1))*MrNB*unEFMp&P8Ir$LJMVYRWNhvoiSW~N0TkW(28W7EkILK1#KK6
zoDU#Ye}$AGa%(;^F+-u`WqA|GB35k}f^gTG{L7l<pk5dZiyexnL_w$vMFk28+l^r%
z`(L5#OeaZlCmcyLP4;rGm<yR=IB_8?hYAt6?IRssB&|}0q(sCqQzu*v6!sM)|55?@
z+oP`F9qk7tJ=ew2Oddb0G6iuTuu9J)3K<oF#EYy#L%!h@^|=)tDGNaI=4D)t3fk2)
z(?LBi&h%eG$s7`%Ej2YmCZr80l(YR2w}KvCX<1PNQX5YfrGBBzpDxvKsQ<OlVv0Kv
zZB`5u`9SP>zWS^CB2dzf*YQ{L18hL&>aRagVRVmp*rpdcGGQ-DfnRqEd;*LbQsi-v
z^L!dEI!=`u;O}X{M6%V|;gd%~nXWH>(y>{R5wY31)C0;(u#0J*SRKe!wSgn(<O1}Z
zJKm8IyDy%+uPo@ce%6n18}jdLv+AEh3SZZ~;#i~y2AOV~C#)tHF`X0wdcNLOeKhP6
zJK=p-m}Ah+t;H;4wlun4A-|dMSQ~I|3J5vO5lJzJmRfLFmp2N$r!FLF<^c%$xAvH6
zltJE&Yl}yJO8mut|6#Mys-(vR&6AF$x5P*4{dwJincQY~-gm!8nRX`77k#qo6~0u7
zB_QI9YU*6i(2FYi2|$u;wwE0>G&B?eKE}k+dAy*Y03%lHQVHa{rt;&*>474QcI*$c
zfmlTN*l**<WuG)2i&DH;sjuf8vPFXmm8bIVTI$mnW)l2|;c&gX$4q2PkZNG27XBq(
zZb+0&?kUVv@oxH`=XjWKP^4%Z>~9!U9yjOnJ}CEl{<>C_wTdOI7pbtYOs!SKc4Mex
zOu<_=1TkCVP=s_Aj2pliAeQ+!F(v#-*!vEL_nAQ?mhhxZ{{FtN5=BdDO5h#qo*O{!
z>`*HOzJ=+`_+yV-*gMOuIY6SjzV{Y0WGnGXZ4B(iC{b@!btlLvUv_d#-=NUwP*%|?
zGPj25P0PVLK$EjV<~W2l^-|h=D}sfc#{i`C*)^%QS?JcJ?Oi}pUJWtu(lF^~M-^Eq
z@WO_imP(a{bFtCDw-q-K)kGHl2{aVc_nRLJgDALloN1LttuM;*@~v`|g2)+q785}|
zH<C@lux?9ZjDb`;x@)V;j&oJea7dG5nM1po?3_h+b_xsDxz7sKGoQ$u^WvU=$C~uP
zf-at7KKL9zrXDrHLGEQ>%L`p5y_Sq86rapVR*!0<grVc%<_eCjLOLd{(DAIU!OhRN
z`YvQ|0fd~+k6gJ^4?atEq&dz?Rdy61(d+AqKSxEWE3UvhlSOW<UoLMCG}?S{{S&+_
zyO!JFD-E0EfL{#+8Yj30CqLG^?PaOvOipjS;p85k3X{4tv``(-SI|yykX*d<nx%t@
zPJIhh{e6z38Z|&xZ`kPs?t8Yh6I^Dv%kN?5esSv*<k|j4Z8nSstt1MM-xV)Zi}J5^
z7VwXdV4AHbR*$ernfq;p14WGF5+_Ezzc7m`Tuxf&>eg9`)B4?=>M|I7;Ux%u#)KW9
zFf=qwN=u_Vd1!Lp5`TKW=o;d~;aM%gFd4?vZM0ASV7FNFi)l?Y!bM<zH2pt01&F~z
z2hNTy$eN(Ax0%V)VFZvlK=f@D?-s<T6X`6$DBn<%3u;ij2@L!lJ!E%o`)$q@O8Do>
z4YuCTdXt6BKUy;a8KNyl45@6s!>XcCRQuwhFKt%yE47XYrh{mV?_f@ilf8+O>AH)_
z?CJ<4O2@EqlCgduuZ7MLC=)0s2~fnEAkW7hDLP*6X3>@xM1Df1fs)-eF))ua-WIu9
zHF+bQlX?3#ve~5yJ9d|JAp6CsaXxH(3)+(Icf?x)I~PKdW+-#>0WQ+PJ+B)jsbPUz
zz9gAcEsB4bOPUje(qDvIT&*_gaC_o7Fv%^KH3qyo9p*B@w8`&{SlW^a=UFK|O6tpy
zIb0!Vmg)%4T&>o-@M}d(`d$I<i87sR@@zzHj3?eC1l#=Mt*#c$TfEpkW^`ym2Cbga
z@=)Jj6e40tipf)$@`Fx)B<R7i=sCaBk?2I8>#(P@9PUU&yc<a9Es2-g^!T*w;naIH
zi^3r3u&P!-M#kM!ie4$NnHTs|KP&<f9^UTY&20Aa_ys{TV=2GnL8k*twkX~P77l4S
zJ^bt2tqNg4J)v@rEfbuP1oqh9C%-7u3ON2`IIMq{t8F<<#f4rhG3y^`J*`DhL7G0e
z^?YdO)FUS<Zt^6aFPdUcg%hmhtxhqV0SRzT7AuoK-OMQ4fI(2uy%fE?`l(>MnG#j%
zQY?Me$dr0ZRFQka%d}7KWpZE`Z$Pj8MrW3B2U<V|M0IqMiE3&Rin!74T{pYbV5e=n
z*4m(OEJ|F7=w$<r1~?;$&^R~QE>vYL7eKNum=9hUTSy57wd&vnObpc+YEn{j;lzn_
z0h-u<?gQ0e3{)iO&xsIyg)2^}cfIdE#=hYZRSGU-3R4?Bj4eKCtDJek5ea2#h@h{H
z!py~#45M9D!rX<SkIg9b+$dQqziD-qOuZ7SH=t(d8{1v>CuHJrwZBii7G-kh%PuAD
z7c$d^G|=U-t8k<aEC@K2r^e9?a_rlnc4^d5fjIoWTHfk=gdC6SGvKC~^JZ5*{pfu~
za1`r@?xZMGb{+yuA~LB*v%Erhyd)X+C1;_i+@!d*Hc<#Wb%i>woAYP|a{U;XLywtI
zmA$OsEX5fcYkr&|Re#1TDCOJbuMKK97w%FI9LEw)$MDEeXu5W=@*|72&%eke1rS1g
zhp5TEG5`3QVA7M}X_n>EYdYV@AN%&zdh4U97)&`$CtrG*#0_(^D=EZI5<eV*j`1Y%
zl_lPS_#3@HG1<cWMIfqq#|YEUnOCCul|S?r8<cPH)%w3k8m!AQ<=8dZS96nwo;J0g
z;+wibU_SrTWG{ZS6O2o25<%DRRdwEuOPA9ctw~3zJl9~7S4&rpuv8@6Xaa6Nb{3J3
zjV5`%F>3&%t5G^X@D`Ty?t|P`Sc(2`l5YP|9kvrx<f7=*uaaLi8Ip_h!Y&e?h>9ZU
zFE#h!|D3YSU(G-mV4dp~`EN08f52vlUta(Ey?%e+UQ#c${QI$hoMjMT4}SlB0H*8|
z8Rl%pPAV09Mk6(G3?eqAH1-1c!-dR1_IrI#zYvVv$g`pPYJG6mP)JroCV|a{boW0b
z24dCOd7v&9tK9Jx@OrMtDmPk_#q~VThrbg1R4-a>n{31`rsgc<UPVAfEJCuNM)6cd
z3CYcDJkM44%h`T&(yvD2F45yuCu&IORh98LUH|w>_{`S4(CbbF+B4P+$QHGnCy^+W
zP?+wu*_cePQ=NwY!fPi!pqxe7+`)jj85B<g1}@nD?GiYmYpbN;7&J(Gwo9KbguUUM
zi_mD<Pf2YF+*!&YhII%kH%8Ih-Rvk}(szF6XYjIeFlEV5w;KPwrx#E*QT0tJO?e<`
zv!l^$LHJvjk0w)=<F&6Uwh~OEH3b(}(!Xkl38DL+@uz>*;Hnf9AWm#683ZStSqd&*
zP}=`W4B0^vLqQ{$d2I9wxc@6Iq?*j97r`(vjWtzfOg{^8k0}me(2QWz1SvoY1t|xw
zvi8unw-iy?mP?jTB%s9DtYvVDA^yWewn>C!lt219bQG>h@aVDmjW5G6+aiUq1)731
z(oz{~p#mttc7OrJS=aIaNX0NQSBZ=|S}1f>I<!oJMB3-ss)I%Z1Rwg*voJRXlJ6^g
zb(3McI^|U35=EE5Y$EF+B|JeGG5CF=67?lCe&fv~xfC;EN}7wN2f?$S0=H2!J(2@?
z<fngK1Tr`{4@ywu;?;%Lljn3|CqdauKS?+<pe6~b`53x}lFNrF!bWD77C=}?0ABpm
zn0eVi!3vv@E6;PJ*gXI6i?rsD9mj0}WuBn{UU5INKOc5bf=oYdx!Rw_pH_$(A;v^^
zyu$agg`uOAW|;AP)_9*o9tU(rB_kOE?yKgA2#rXxUzO7zHodFbLooM6fE}kKK_f|M
zPf7}OjlZPq4n_u{>394~%26c~mw%|`D!x#Rs*ia#gn?d^l$Mr9_yZa1MLU(Z)QRgj
zrKN}QbnxmKvs5;22%`eNTCe{i&g|NtE{6^LbB@|I5>aMi)AjO(-*Jx_5j=7sx1sd<
z-S|@+;RsHnB`EH8pl2hmQ|Kan5-N>=`_1jk+X0b_OiPcA@%ehbg3Qz98t)m;Muabz
zo%Tl`1;LO0qVMdfJJxp79YGaTDOs0&+JXWdI>6}_t&JTi(e)>X?A^Qdz4VQ!Ys|N4
z;)|Jm2Z2)Wou|>2zX<+sb0k~WVx$Cz_AmbIgkL^vnY~qFzRT3?H+LK3-oW99Cpe)O
z8BPd>+52>hdYu*=nXb7ABrCB#hM)jaY0sy?;mj+AoAH~b>H2${!q=mTaWkQ;T`6|H
z=Pz(R&pj@Jk!zItL;`PyMNSy!QFjwJco=S1r#7=i-q`#=5d11%TUriP_A?dGQrK?|
z>iSo;lhNODKa!@i>voWTj^8C(cNrkW4wOgm(82G=m9^Mn2wV_I^YS5n2OGh3gD*Zd
z7J*;kpzhHIbrYOk@HuVfU!=qbk!rBPQ)ZPJGxtVHDfQv+Up$T}A+ChynkrGX)pD7p
z>N)J$DyxzFCXt6wu@dW}3t40U(o=>YZC%_0<O^9p3}7Q@IXZ831A1m=SYAl`>`Wto
zPeL0p`z$ZIqJOeZkCDJd7R3iQQ<}~O>W@pc9!uyxxdSy`&CrbjW$-Y9?9lTiW?uXF
zW>vK??=LiMS}(V}SzDc5TjXm(uxw8wx^9}TP~wJ%clFI&?q<;qiB@0hc1y@7hSISI
zRPKufj%V6@;ryLWcaQ2X5B6LGw*<TG!mZe8vG*r_e!!Eh!)LNox#G#`a+JoO@ag#r
z?PVjoj(XC-8xg2@K=9DsZ6OZm?@2x$xgsBGe7e6FUwa`V`3UxhhT+*H5hv!F;xaA=
z0?H^{ry-)t!MHUA6Z(+*WGtON3KSjy3W&HS90)dJDwI$D!GVEA3`Y3>h0%1^*0L&l
znwg6lwX5`PY&}!_A&#Yl_;o<BKI;7JaUkm_Oe*?PYk7itkF<Q4Tz0UNkPA$kR8}Gs
zFR+J(eUqD@c_%#r%DK?-0*RkR-=;lHSvrbA!NKhDVc{8-*P_F=8XZBz3@WOLJ;9S5
zi2Z$p*|3gg3qF+^L=gTW*l+Qv&fo|94Mnq(Db;4Xq42IcmxhskzURTwf>LFYf4fNB
zS}WUPvLwaF@cQiB=lyP<9uv2k!4KTeF*8m*Wko}m<c~`kEL)vWY2eDCv|>2I<941f
z1QF^WO`N=dZd8OVFs^s)Z(%6K+3m@#&Hffb;=Ti2HKtUQXim?ucwh=&_bpj!yR(vb
z0W*#BZ;mST0mWP7<N+_6w8o)Gsi&R>qx2FZczl&xd>Msz$wBvvKi$*38qhZfK2D>X
zbovLqXUM9>6#Wk6*Q?JON9iUNe`iRLgjQMn%UkRBUW=gwSBw!6zX55kr9y&W{>XIS
zto&$(;OvD@WJP98OWFjYNWh4u^j;<&7DFbB8gdvZ34S*`JR0`vEwpS50RE;PSjHCG
zNXD;u-sE#gh9;u|Pr=e4%pn)qs3{&kXHKfAsm*fJ-zB(E>zn6!B?i<J_|m=78LK}3
z4^jNan|Ig4@mo(pbax%xHRPz|9P#6vm>-vqcXk|fLQ%eTJGf>m#j(ftSI`4DY9av_
zh|Sn4u})&-gdXqbUH{_(2;DFi&iUwjS1d%VjkT)ErcyP(%T8OPln~^Oc}INk#=MGs
z;m>6#e2Pg58!XmS=MSvK9WZ%}L}&P-Biy^`nj3Y(4Y)+n`WRnJ=m!XI07C;q=yl4C
zFT(=>fQiXI*rTny(9UlGP{JP(0O`_k?k0w)SqgBgl>pnHf~55G>YIMzfxSIw{-m1&
zlL=-YSgSk{8#l!|BKQBEA70gOmebEx=A4uLkbGf1mxqS=nJ&TuKtMfQiDpP)ghBg4
zi+R7}LBpZqmH3QxXO4>^I>A9<;YD)K`@{#Vs%h?Nq0GZz+IZ@CW9gQMnl3dU{`UP7
zM4cx!y-J>{*7J$G)Hn6BD~gs3WX7W0EcFc@7Z+nDv76=+#zqS+kE-bfrer($ifMgh
z0!vmlYTJ+5iCx7l0)Ug-mEjWyJ$pEEE=9o!j1M{>9UQ;<DdNT=p9Am5?w^iAI>AJ9
z_zXBm0{aw_Bw~c50s(iAhYF#cs0v&+b^zKXdQQtg<(ba(j}s?q_S{;Xip{IhSN21Z
z_xR^$UFlvg1_3NElWM_lwqAx_5#3`LpJ0Rj{;lq$!LyQmmt4`p8M{cxC+R+Z&Iu^|
z#9gMElijMjZ`OX%w-An`1H-7en!kA*)%yyDJwR_Y-b@^(y^f^Ki*h3po&8|;nWzT~
zY7;CqhzI3tCJ$COL#j}<F;I<Q7+ET$lJF=Z33Z7TXxB87+`4vOj5%O_Z7jqEK?Tsb
zYsIEaZ~0%~|426ktND16GU~K{P04Fg@=~SMm<@tt#uf{Q8ifn430T~>vKR@@YrPEy
zekabUt?fheQG$r9zQ)+W1>otyf<FJ6*0h()pg~=>IrcG^JKQIwm}#7iK*mF^TZRVc
z3@eS=nlg98{DP7^4@u6i9qpA{;)W{}-)T`JzK!tf5tYbT_nb<$I4G*U#1t`JM4)vV
zEqB5LS~=sF>Q;VhmbQO%E0vr~zZ>(*9x^CXwsM3czh%?(59Q}7`b?noj7CPQQ@WY&
zf4?3Ay;z~&5j+207o$5gvzPBVe~=?<y^vkqPETnZXn6Ip<Lx?{b}eRfPVZYjtz@kp
z=p%J6fftO5>8i}dpRgr@W^_IV0xulX?2yhEF|_p@-VJi4z?Tj~L!SX}0CH@2obapo
zICjYO{W^hY_1zJrmUJ?4!(Pw~cLs-9W2l=H@v_K@9+(IuQklVBgh<{o5kl+aQ?@Yj
z1XY{wFn4V+2LSQVKta9PYIfb+UE?_eSp)%srwLIc^2GCMfHRCSIo%m1gE#owKsT?H
zJT{f^Jyfc*7rqm>-`k~Yc_BK`BwO8_upi3X?nslwIP$`AEjvqHE#$FR^(dUxH8zbP
zgLkZe`2Mrj$v26pTF2v!9EE+$W&dx?l-U+F*v6<-H@W10{4ptJ?VRG0IwPO=%ZJQL
zy%T}Zwm=I>^|Ze`SWxzW@a|(--6kc%=O7)D+&nGiJL4L9VfC!#a64{54V-HXa|6YD
zr5=j{V6+1sEzw>5{W8I4`-YG|^x!VTXwgVWq9(=)4_0+H`+V{<sD14jy%uf`_dFtC
zwj?0y`>Z0t5IA5?z7^f$1{Xo}d7rekP9VOD#NU*++TLoUe(U`{T`+U1%6%j-=^5)B
z<nT#k;@k8QVmsfa5A?=T<NMv<EBt1=<Jj>N-XGFh3YcfQgWG%QA%C={?$VrqUM>5v
zU2mhbv2MzZt7l9QDp)(7Ab&$*U`N<bJ1|iA&7OR@H^mpdm5YSuSxlr4e*0xogk8@z
z_VhW3Pc9@83~Et)PDQyp)Iz0ZvEY9IoYVEDh`)ela|oFtaI~WXiW?#Gihm+T#($Q7
zNQ(6WT+3a_b=A#>qJW`8x>;BW%Sm6u0%Z)Ns+uw^ts|qKK!(R3;&YFKPv-|K85(x|
zeb35t$~E0Tj#7l_RY}-38V|8x;px`&E$nYCIg9$kVn6tT&CMUA2agF=G@kL1eDufQ
zCb=+IJh}0x=M3#21$JFg8h8Ju_t5H*2D2GPkUd)Zq-6<ko^R)|r_Cx{Zzdk<HIx%N
z1)D8q0B{h;ePTgDItT*rVS%lny$kQ%xa`)c*z*S{5JG%MMa?$XD_mg6>H{f{F412Y
zoQtP>8;Agr@ct6ldu{M4WnZrMZznh48L~cE+C;szJS^Z&E0<paE-#Gm4-<*kwV$#G
z8F81UE#M-|fJ^kdLj&ZvELfrV5#TVi+J}XWmYg%Z`?8Co&zp2Au_3W)x!oc+5*W>7
z0xn-xjikFolD=3qdv)KQ2<kzL9WRtp-m~gAQ{axICJ5p$#sI6nyq~X9lfMAS-<=**
zgmgmc(MLo92N~*lPvzWdwmWx}<lyE+`*ei($Ejl9s1;j1AeC`TK8OMoz2PVPxfb1W
z(sUeMfsU>O;Z@M7$R(l0l(=^bK%$V0f`@@bQHF)yIgt!bMwA?j_o>Xm0T+?BVL@Wu
z&;71JmFKZ_b11O$UNz$C_Y$`Z$!Q-C=-ljjM*=Q2OxSkEw2-Mc0u0dSDXL4Y(C_T>
zY$!f*0iua@YDJi!Q{#qD%Wi6-e<3gQR3V?e{0pWy>%(|J@z`fjQVx++v)GM80!%cp
zS`gFA?<Jj<3PiGap){ITztxDB-&Mq1Wix8+B(^Ilg@63yYx&<+s=F%4OP~O1f_U^z
zjtZ&(Gm4s;qY)N-`O5^<CMpp5Z$e00Nk_n76@{%z-n3~{`qZ^WPna1X#0<a@9%9}w
z!4{W)@<6Apg+d2&PKLnf%g8MC;F_1VtB%@OZKzaGY~-bBgu7}@Q6u=Lf)hcQ{rOu^
z@1RNb$&3x-`3wLIJI9NK?Jg)2-tcRp8)<Z7L%TT%B~JH?h~LYHHAVT9THG`%dZE}~
zq&*L0s>Y~y^o+c7(x-04V21rd-gWBcDe#%uC1XcRpy#wUBAbjZ&Fl3u!yo0SR(#BF
zgqz2o8g~I0QSsXbIX>bvGbu|2Q0`gAVHR<@)k^QDW@WRNsxG%MmyH*jm`J8IMXDXk
zTpqgux(H2Y^diO6j!T^iW#M*Or9UWHY=GwxyD0aknkPJ%0rKZ-=yHD+V8pliJUXC_
zZ%z}@4_*PL6U0-+CHlo;x(_@_>-B~I%{5MPIltSA0*G%h&Cj@2G3TFe%J`EqzQ(+y
z+q{Ya?Y(vfe|5kxOGnif1@7#mb!z}nW4At)*`;S=lA*P8V=#61n9yyGg9lu^8%04}
z4jRh(;i9tkOaM<Jwz%+)JYe7b>9?;mhj+vmbEG2^yQK^{r`_IBGq|fz=SVqGpOl+Z
zjWH@<4+sWRZ~%^MiKuFNm*F7M#t&}N1oHoft+xz_qgmQOg9H|b1a}D#+!tLmcyM<J
z?(Xgh1b2tv?(P!YU4py2+g)Bc=Y03xU$g8Cy*<_4rB799zl%(6(1fb^@Qxp52<^-s
zd*}yCl%3~0$SyX3-YE&8M+Ei|0SxZ_Md-U!NuxH@Ehwz8%8t0M*be4CSw+`154-xz
z6M@s8(Pyg__)s`E8s&y;A7Po0H4)IZrGy)qEi}+z0BiJ6yr02^K`TqeZ%p4kF&8l?
zm71ifbT$~iW0gKx6l*Vg3T@MQDh4-T>U+<p>P)cwQa{9xve~p;TS^+^D>)#0_SDur
zrX~6%{n*32>l-3kO-G**txFx*B3=n4iR*<6AVDe5fg+tUDV&cOZvf816U#ka=;*+u
zn=o=}Qd;Q0^=)}#ao>dv_D7Mubs>KE4wma*zI*{RBEhJ~e?d636z6Wd#D;MM2;reA
zht!olEPNvqm<P<EX}re-VRKNQ^(gWh#v^C`mNgpD>R(U%i0Hh~f_wrsqw;v|7T+5&
z892bA^p2L3ShXt+9!dw$HFh%jC+iE=$=zHcCwqqy1QyS*4_=VEPODY5BHV?dO+$eR
zy^X5^BtiuVJ_(G!0mh2<H9O)5eH;_T4<m98s1S&*jIzVfH-%q-v~s-sWLL)Tgv%n)
z^eHBF4uON77cMFBtVTT*w8v1kbo}zD<G?Z<Zb@kTZl}yJ)Gr)RIzJA^F0r1!iq1od
zf4nta+r{u6VDm$mdaZUQSd)v@y3M=Q7Ng|fYsI1xK&J@_(K`C&1t8k6zDIXgLB%Km
z+=PdOkY@T#x}Sc!id=EuY~NiTu7ab|h>@~m7^|vgu?8ijrQHs<?jo0x)jD{#ZnpSI
z4|$)Yirp@Iu>{v!<|Y`oOQvux;RN`tYMhaiWG5M^e@|)b37(bKZy{P6*B)UU6HWIL
zHVs*CE=a3hw3Q0L^XsX_3Ftv14LY@7)m}D*2&SAhTy!Q_s9bZ!9R0Ofaf<oeOKADw
zL><ejN(U7c8X7`?AAC9b2*Du^?z9;EO<(^yAgt-J4=Jv_z1<5<bM7o^)_pEtX4X;l
zW{Ct+Mbj>8kl61lZuQP+F;EZy^crKYTU6LIgAKcTCj;y9UboVh7L=R?GPw6KU16Z)
z{3%W*v+}a`F}Yh!_$x;0%wiv;%GA98H?a;P(znr2FP%KhmGSpoQXs1xERXv%Y8c<~
zAGe@_IV7eMnx$C*-9NweU2Jg&_gAK3jRI#6@J_wHJfaXN%Zx>JVTH=mwLmXKpz;RP
zoWHu>Q7u+DHp910@qCMffY+v0MIGH9W*v7}7!_Pf(DV)_C7;0jj!8!=eK<Am93XXX
z6O{aO*h2kcSHhDGmE`Va+HenLvv+8m*dt7_FOas2r^1@S?W+B@$YEr>v<soDgfYP0
z;dolWa_n`3J9jLH_ssh)ob=PyOR!Oa*7AHc)Go`S#|c~7*^Rk9uPo`G9j}a<wyjn!
z$g^SYp1ImI_nWB_=bb{V{;r!!CiJmnom!kxB~&C1tTX>&9I+vU@^rD+vgLxCO?E8O
z79DR^Q6gk#E^;NBvX!jL_d<CrKLx7U@PLQa6{e4fs{-1Y-T{QO#!Z!WA<ATf@hY*!
zc5J(Wh?W&n8qNh+0Of!JdYwjfSGKN0q*Vo>ss5!??-#AtC8%Lp*i}oHvFrT_B_*}H
zp%21sCfB}HHB%IzyN0et_g(1&Tu9~@@3Hp0iZqtfk8z$wmDPr(`mxS`?UR4DOUVx(
zaa>^Z>{9YL`yWgz!SYu9swTKJn{D!g0gLY1qJ##2kZgs?AMek;E6;Zb5?iPkIRT)4
z($>RyC`eC!QHZYAJoTkLK-@7bG~AVKML`EC1pBnuM9WPCk*W!cAe`Wa2)>%*8bP)3
ztAJy*rJ1+7E3H$yhY7qn|B(t+bkw=oQ!ZA~Z{U}JEDXQ*9b%X`LHVN4!OQ&p7elAs
z%D+lg&vYk3v3kjkJfR=#v7xjjU(^dnSI_Ie$|E%79%(^&lFaK*ohY0_sq)`dTYD>J
znOC-o7L3CLyy#ZKGUqo);A3y$)i9$9+Hv?+2in$A0$lwII#$sF5c<I|2*54NOp|T0
zrArRMj)gSCX!1}N&5+_9!Kn2fJKg<BjCx8ycwZ($FO3YTf#;zDIq3_Wdus;*OfoM3
zsrewjT3yoQa|YHdjn}<;u7KD6fM}w}Vt$uF9?t_}Yo`H97eUkwK6G?&b8#2cr@53<
z2H9Vwd{upY4Bk(_7r|X!B&mXaWPG{F`&f+#ah&X9GhxfV@_W}h=|h8X9pilQ(L}y$
z`}7gqR?in{rZ98#0Gs-f@gJi89lh7*@$UJBhv;I)ZBMA91UXwyx>Ae=Ff6PAnS!*0
zraKI~wpZUQ8Ggd$^n>bG_+>ymGZhV9k2Ccv`6#^i68j#d_nuizFZ(FC7Cs)0TTM$d
zj;IC?$$XeavLgPZ4<lRC4vyjGtJRK@-im!?ts5W6)lsA>Q(UdYXd+HO$=h>tG*Cwq
zs(%XtUbK+Z*d9vP79Wly6e8rW!%)4~dqGhPz-|{FtIWI!qT^NstYwe2{o3&lhWZS9
zL15Z^?%Zf|W#e`~;ylyF_o`OP>X&&9{j|CGJ7g}2<gAJg0D$!KAtnZ2Mm|8KdACLh
ziK?IWXQ^PTsfU;XV&nGHrOh(%+(ccmd61NC)#VNBAr~@}obV9_lJf|rTGUXPEB8WC
z`ctqfI5}Of22>DCdqb<IAvu#W_DBs1C1<9dlP%e<aMT>qJspy%Vf+jz+|OFN(^1Ch
zJHNemI*v;y{LRAZxRzVt_H5*M#OExfNQhk|JL9dI*i~~|w0wXh)6CW>bA;VNh+wbn
zs=hyy$wzCGv8}k;PJ6EqCDPyT7s#x6aN2UuwO!~-IZtd}QPEE9#i7;DkeDN=%&2<J
z_g#K0<FaVdppz6uW{kw__;(hvnE224M1sF`*)>7o3boEEp**xt7pl7T8oL}1N3Cih
z-+g(7b$v3_KY8=qI#Mue_Qzpa=ewZ&1k(THlc58qxkSNyIN@+FBQ`)zhapB55W~go
z3AeT4N9h~Sv<=|Z!@%#Vk5};M#sdT)>a!sUu2>5CW1zifz%$t(&JHtLNJWEQfxJ5r
z5GwlFijJs5oWpui#KNHddiSCrO-WcRMj0@~&xjYgn#u3&W^w^CLxcBBan^R1j^gBO
zVH_D5$z_~HakW@{o(_71?9BZ^ZN3@lJcTy?Qr2*?rrFzQyR!B|9mZY;Vnb?DyVK}`
zLhL~v4IVzK-W7bDH_3$v+9bwDr3X~Ota}l&6MqjM_6!Od_LTWL2ba64sa@%o)>KDo
zVa*yt7z8s3YiQF(k_veCA1~Nn_T#$a^?B+*&=dcRFh=5HKf}sy#U5L&C;;`<oW;L2
zkTu2Qwlu_~iw$E{6uYf?)%yuqn91lYPpw*;@@ok=v0J!9Kzh9%)^tdvM7z9SIzYm-
zUHI&q;DNmd!x^aCdX3K<`1#id$QKlw_C#aKSsft}c8}Y2xtQOpoIkMyH;E6{*MC%K
zG5s%BO{RfFZb{_wSM*1~q|Ic~?|sWiJWLIxn{;DHVHW#=e4D}(-1QhyT5T<feDv^y
z!_~H74u8nz_weVUfm|v{>6S*iGz{<hJOP)Tufdaypgzl2^Lq$DrMYHP^==j&a;3`+
zz<qm?e^}nsq7FmIlcY5)vpHwIkXJRrKV{T2?kfSUron-CV>}2<$7gujcIN8QMo~=-
z-*OU|)~!VB7Sufv&6t=aXrA%gC>o-d_tY0~yX%*G7JQ%n(Yst-ayJ4yuSN>7?`)~6
z-BnIbV(w@2ybb#?$VM!X@0dF=)9R@C;u}Odo2n)b@B3F@twRB9-7N3(#3*PG8f{q?
z1G7gz|Ms?QsUDtJ0WCweVZ`D0F}(<HAqZPfx)Y=a`IObRh*Ztx{Vpu8ss@lb@Ld&5
zXz4AcM`!2)^TS$LLXjbakPh+Fi=iF!dcUn-{G<(UFh7u@q8{OUllF4+UNH0r{e=*v
zL2g9Tax^RG53oH1nBAX4+gl$}V}=Z5**&!^IuML++x(%k6lo94aCsnsXMPV363Oac
zZ+FfRU2djX0~%8~3K7h^n7&h*udv<yjHGlCoi=Qs&=oK<S>Vw&K;=q{{<ZUNqY@>8
z2;rMhx3ksdO<G6=?w|IEhc?}lL>A0uR6|R%rK|PV&zomXA<a*`2Oih{m?*G4tEbNU
zqyFH|^CG^-?&^PxERoile9WVah%Nl?QxOeM`Mb?SoHX4<Lrl9F3mB2%0*u14NLbN#
z315_n6*7aTevJ7h@A~Qyc)-?G?Gle7p%UM@&pE9K>Mlnf-F%b(5Flb%7uJfJgfv40
zX*%r-Vlc-QBX-fp#dY|GIOV)~T4gulcC96h{YkLZrp=6_i$xkCjLpLMvM!C96%_?*
zoWd)jg$INb`nl`F7A8-ukEeqo$MwmI5|KzD2F%Ufakn+H*T)IUvX4JRBNVtX>C5h)
zCl1seyslP>OkX!#xA3OoM0l$ECwGR6+Vy6&Vlx~Pxxz98C&(xgXMz+z{HuyWLp<^m
zM}T&P1O-jNHAUZ&YuG*u&wu)4BhlZ$k<91KyX<i};u!99`DegGKT_<Rfv&LnXCZ9W
z2dA@`eY*=}YnieYh&*NXA`gX+KoKN)_*z_Obv!+PK3c);UYXP!o)XkD#%Dff+kQnE
z$aVSEZ?!Y2=yW!}M&c?=eZAq6qQg)tV7q!n6k?3t|E(Q^wVq5k)Q;|U6uzfOkqAO5
zaQhbpGFe<8fQ+%%B5Ia9Q^;DsDV`ZDe#U>I@!xe}5w(aPKZYynNdhv2j6S){8c<kS
z_p-!fA^a<%{*hGRi!LW*q~jarB!qBWokiS1HTRl+IIBQ!v-SbAok;tMS1A@#u4fHg
zTp!2S)_w9#!p&1c0vx%jJmUtHVL-?x(k4``$M!wU)PJk;c)n8B(!ZXjj>th)%)%(`
zi*2wp*&qK)-WW8-9~A=Xr++pdOC{z%(Q9S0T6iouVRiLx@ntBYLMLNEj<31g7m6m&
zWg6D}HPLx0NMSW9#YCs*!O)8%hX7{U|MIO0Xb9nXe%5j9n3|Q|%uj~@sEGeR7e*wA
zPXQO#*Gg*EatgWEH@CO>R0?^r3G~J+mD95&IoD-K7z>pD732S<(VI~B^SK9@sQua*
zO)Iwk;yMrg{{6(!LUmzFi>7yG9g+t4ze|Z0<{ALRAX@=}EC~?d-l>Z5fjXckFVDDW
zx>js8tY+xj|9i;4)P=W2@Pv*H4x1R^vIA1VP8DG<*P&ZDKznIE!G^VMh=jC1xiwui
zahssG--flPrn^5Mo9RQyT^?whPDNI#Oa!Vdm(aK`Tu)!NgzlYs&lOc&w%^6~E<3P~
zxab+xHZ8(lvAx8LUwO;46&y!93xG>p(LQ+MIN~!VbD`i0C8;f3-#9*Q1uHFtQv6Xj
zZbZ_kQ_y^MF<WxyNaKiekZz<~a+bHz<O|u}q>Pcyu-9|~K+cN1+r=5}iwu7@-A#YK
z2BKu0hC^-4(6E8BXRGET?0ItZ`5s&cF6;-_+^0>~Ow6WS-#uUSW$fZ75d2>%%nEmW
zx_NKfx~Zf7Z5d6>T*|LwclAZA{(1M+WOJ4vHacFwaNAH(S-A`|Im7c(zm`eMbLlyx
zV!?fl(a`p*7UxHf_rie=S3Oh@cI#tBM{|5nzxq?ky`KVs)=O%oyj2jO&M%`EamD*{
zx!y|L6hzPv8YDiKY*d`WxoBg9qlNV;Ia>xwKoD8+s9m#*fCm?O+$0OL=}F7jDAjEb
zLUlnwLn1x_!T$7qtbO<pvOvcoV2#Iq1D1+BH@D`tBg-viwfdAeW3%w!sfSZDCASim
zd~~(z*EcuYS#Id6mGQPaFSJ+f90gu?1K@Oq9%!MC0Me?hbBhpFWb{P4?(mB`=6_Cy
zFNIJ?4y|0B*dfSfk%vn`O?qYhI0Z3acGgzfiqL&xIBRfF;^O)|Z-IeVygL|CmmvUu
zvDTT-&>;O<M77?O#&W4L1uo6*;_^BxqdieHi$tJkn9rPD{`7=vnar7;{k^`O85iAy
zCnq?%CW&&`ZqAPS5TM6IOaWkZhK_%EW&mC8v0j|ns3>s8y2OU#^G*E8C*Q<^z5?VJ
zgWK0ptOg_Q72l9>cGmOJ?Tqgqd<t*#vtWgT^e0MQ{q!u6|KGJ8=Ky@}+S!}Po(99-
z+;-EPO}YZ$9B(W_YgQl#+~yWC@GFoY!Mxhu057<{67+f}<j_5{IqjtQh2y%2RCgNr
z#d@`~J9c0N&KJU~=I-$Q!zPnl)O5XybE#_W?P~n9l+4R2`djDh$9DC*(DaHzWm#UZ
z@{R6`h>WDxs>h;*&8Io?Zr8)kOr0ey3{eA>1Irhk0<211qk#0PJ?FH$c>j<70}Zi6
zytcNM$^4~JiBl*OYy0G#3_?x>H5FB1y>ZU<iDR%Mn;0^KR|fJEN6LjXL0P>urwIsp
z4P#Ald;enf6{KO^y`rtXwR0eGe;;@?sBt=@feEXnr5UT;zbK`lsMauMz1*mAY+X@>
z4rX(3kmDCV^$>{Zu&Z<rVcnwChv-LE6jRZ9@Q^d8s!iW8Fl=4W5tC&BaOl+x(7;yC
zAIdyjLDD5<go743*|8J<F*p2tm;f&B?h0;hTvF*gYC3;%?$E*fNLsVWhktR4lJWqS
z9IsB87|0bu+TE>4*?;4(oQ5*4hrC}f@^E`1u&$RSL8f=yTgtlmJLwv}AwE71tx8%C
z0^u>n(L6KM=lPo-zog*1bw6UOHP?5Q$|%n47bWmfX5yEzjWxW`np#@Zjj5e;7fOfh
zg~LAWFXvc|94Y9+%MU*0emGc$xw3kT;?xY2fduTGs5z4V!?;NxDbRpohpiXhSPM2B
zlMedCYoiE5>^g2CsE~1EejR{aZ0F78tBWJ&!aNT1U?<D{bJ*8z61kVJEe7M<M4r-E
znxH6RW=)025Bfx41t+<y$T39`8@(%wxQENFXS_Et`HBQEkMGOzA`J}-^Z9%oqj+vg
zroD0(BDAqCA`DH2IVGEcfE5NZOF#g<XP3hZWlg-!>(WVBx(*J>sH$B`A5q}pKR&9z
zB#JKdS5gbHNw@mMm^{%r>6)F0z!I5p(I}=qPO0-ld%m1`Ub4Nr0fm_z*Qo%S{XUu1
z?DS=>nCj|}1RSyaD7@!9*MzQA#viGQlratYPu2#GqWM%N*U9<{q{J8<*M65I5|4jC
zwQ&YpQfdZ+_Z!U_CQQb>LZ8<HXy{GhreZh&kkr+SXCzP<9}d~Av&+5ik|sH-74sWz
zKHO052LCHh-UL?IcOO!V%ud~(;_BA=vSz%7YvdJ2!DIW&Nn<QHQ^LzR3HHDOgz~mH
zWD5L3V3hB(+tdY7dnOJo#UCJ7bY#)v-gyk`dflt6fL>Nx2}-c)`hW#EW4876JVD|+
zMn-E3&$Xd}5UR;2fTId~9s^4!Gp|DbmKPafI0u+TLfgMw%PAw-OAk;KT3e)H$c@b8
z-xjY+t+i;m$Ms@~x&431!a9L>$z3R*E7a%9F}??6biJuEEpBov`{UZV1C;4H-<lQ5
zIr^gG$RqPS00$@ML_=ur_$r@wA&(vph-Ytl-$1x-I`u<;;_He#?DNBn=mF~YHUjsX
z3Ffw>IYiTD1|n{C&p!iws6fY=ZLBD$*N-2e)!`vG8Hgm&N{(Zr;&SExI3MDRs+&E=
zGm9pP9*PhHDMI}GApz+I<K$51UII$WHM3zqhqeFfw0z?i;BMFwZ?%5tG#ubO#zRRh
zD*C~C1*OU;jA8~!>1~-zdP(_reDIuo3KnV~P~t)~(3p-mWfKJEjIN^tOE%HO7C0Mg
z?8jcrgv)W9;R0*n^s+XX;q}L$M)0!KN$!aOtoqOoS9^J*#}^my<Uo(h+Rc=63xhqs
zjz$1+>6TK0j^?(jnt%}O4H?5r8Y-Am{PFM~01^L8U2Z)x*JZ~2p92RENs;TpuYOwP
zhhOYa!p8hx2~(?eu>t@Pr^3m|n&YMy2%5+v=s}V|K~i?CmaEGdAlN$D%Cld-c(u)h
zUmwq;i69ev(WpE9rRNWedS%xG?VBf<Syd%(NF@~FDul3hSw|s`q}*)8Iqi$AAob{S
zVt(~!xG|u_e3PLyQn`Fpv--OSCNwS*guzC!>xrAIo6Tp1>p&0B)!=0R=k|eHSqU@T
z;0DZb4F*1?%L<P=C}<cy)>UK?5~2S&j2a}mAN2fdR%YvbkXuWab86<^LDDFfXVX|W
zi8j{j@ZNZsVd0fl2`}5+D&An)sALfUV*Fa~dbzLm=lITIW-A>!`!7F#;`n|;$nyn-
z@4AXB{Cy_?Ge4l$H_H?3tmuvayL4D_AOZUg53`TxjRi=*s(wX_MBq!Dj(7+x<*roQ
zUz%KDuq!XAC@V`7jd~R>@_KwXUk&GVcb?^ZGz=ylp9c_MUHw+G-;ZNo<<38BJ&Z5*
zOqM5TLt$TGi^Grnk~v6CGdAAg)w);tx>9~De`;k_c6CEDws(txfpJ)GDD>}MGl7SO
zkFd<&IyH*)uh#HiRzWwAy8>PImr4c03`sx;bZDc=21rRuBh#r?`1Jn75dxPWDzh&U
zJ52ND^4-wURyW2`K*9gNy1bbql{F0Hcno-H^K!jkC5KeXC`_he?e0Dd4-CjPwylEB
z-L4ydW-OA@-D0iMZCsVLqXCj3+tz~x0xs_Rh<<ssx}ypT>AJXSq?mTi;;1du62yD@
z`OKi5tzBJ<>7Di?D10}-!yWD0ie-H++t`o?t1Zea2B^b8*3_xOqcs219|+#o@MZ=g
zQ-f}94GK)|dmI<eFwY@ykab|?QcXaw^1_Gqb4hw7il_OUmc{1c@y<?O70)(C>Z7Na
zxD+M33f4>6+5OnMY`=%{6e@4nX>dk4ifcpT91m?q%DXo+ME=&$c9TNk>Z~|L7kV=H
zFZLJ~%HP?^wzW{k;QGbcykfJ()4X79+>OKn_lpGlJPTw<g}97N{#!|TaP@^la*H<u
z%XS|U!)SY{t{D{==8)HeLiCFV#_Pcnhnx^phFNV@qBC7)$*SeJpxShvOmnpYDCd2~
zuHB9OL+li-AP<MIRPdcKPU!%1_LyIz0xR9+yVw0DL$b#lUG3<GZ?m=10|y}C!$)Xb
zDBl5RsT^L=;S1C0^0S3<eqctMr27p~iM{Ii?*8cI__*%DpRAiRDFb<prx_1nH{3cc
z<7_*A)CyFHRO5E<W*<9&s_AbNXzLHH^~*M4O}&TC)AM^1wbg_0*L__w_xUT8vyo~p
zf1aA}G`PH|e+1b#6st~=$;QSB2AWb9wtOz%hb1HX>y%~6q3WW@iBj5K6wnXIYRpL!
z^41=|E$}j_Pp~<Q@o3K7oy#*eh8~oyfIgyW>u+@!$d6?Wv1exeHvYVhlg9^2Itvh<
z?r7SMYF}LN+#aG{-(oljkjkR(9$2%3QP_%>Ws$ED*nU|E9U~nukfe)1&<B<T@xStd
z!psnGAn>@nCuD^T$iD2JgK6`>_FM%$q-y)uG_JVThcP#<Vp_RgCo<F4Fky*7xc{$x
z`?u{ztjh~I*xfsS06r7$9(=+`=Gs&i1ZfUaC7)@SoQmY7Q7dpDgLbooW*SXRjl=27
zir{KI^Q!#b3#ZXq${!#=Vv@*e|C(yDbC^v_!DQ==TZcPX+Y&UU9xNy+xIrbBe2fHF
zilhRV>}F+$nkXmvrNm<Vcg~w=vR{L;81+1rETd+d+g?f>hkp<0uqj2Sn3huH5(soy
zKqHO`serXZQzv~TjAajh2MyZ1(3|CFq5u4PYE0Ha^F55lbhw`3tq)K!)+;)sdJJ9!
zk1)YfAd?Agd{ihkfo^29V%|-7p;4{#jIpB-Mj#jTx!{LyOei-W5659Yoh5vF(C+tC
z$(bM8_k{b=3E1gmj#@&aim`Z@<~Ge$zhY~G#T;wZs?j+4wx6a)e=N48NS6`1wW^e+
zvaLp;4$jRbpc1}U2ncI$=aWie4r~H<)3DY7TPs@D!OC2F9~b0mV-q}nwpR#m9qs7l
z#^>S)bT~j)El48mZ0(2>3Pk0x%Ss}ZS2%6$9SO#58^*dCunS)iXh~8nkONqeAp>#p
zlQ^c)fV>lFrL%=PUsZ(X4Z!W2EytR>%#J05{Cqe82KXywMfbm_>8z}zoAah2NYpX^
zvZL}8%_}T+I!9_=YJcp;A{_BV2Jt=!*FNK|Hl#44Sd`SE5C!pE;JkOlDOqIz)8Qe;
zmwih!`ZUUkH_;6V4hcDPj|9tn=Fl^E?mjDHSAHkIyui**E83h{8d}mjLZr1JprzYf
zMo|6~&a|hqrG*C`4lWCv3RajSTks2z@>Zc1<POX?D$A&>5mrC-o!YSlh&GN;go(pA
z;^YW^S(C`9vxW-1{n2N|B#<eNDz;FoejSRZ)}0>_j|d~f1I3N<>k4H4*|m>Pa9$NM
zZ@L!ScZ&N($+Dw)f}t+>_pvEbz)g7mR_PGc^O`dCz!(KPjcbAF@lZ3dE-hpd9CslH
zr4|OtF^07TTX6#3)3`@*{SO$Bkbc3CV?^pyov7|S=i_2{oA23jiK$8Vc#c%()R{-5
z{QxQw={@0Z71#j28Al{ed%HtU!^1zFYA8Z(;W^_r%dKKsma`=cyT*=Rww`{L!+hth
z%39Q3^0ZmADPS>a16R|~>oPhq7?hF7xl4$jxB3D!bG=L*h^;!7xv=^uv<tdRpTQgi
z;+C;438M9L+D6WfOc)Lwu)87$-V&MDCZ(@j!CHFC%-ux7u6%mMK6C}DT1HOFhKjyx
zB7AML3!Y3e^`1zZzJ3rb1@2yKK&qebVN;I`{YuPAP^d4a&?vPu6+>mjg!lurbTQ`Y
z)L<qqBSLb2GS@Gb;QUAT`H0GYry$kZSF?R8FRV@N+J|IOk=x=~JU~|k`yRQyQGJ1B
zJ9kT$Jgn6WX$V%JLlFAls)DIb3v5L3w%mCZeWv^My>qjll6iDKD^as-N=bpr@KGl=
z!!GrMiiadY?;jI8Jb3|BuqUdA|Kw%eawb4$=>&cDR8TURJKt*FCv-j~i*g%(S-82)
z-9LzzF=crRG)6_q{g)#m@Q9GNPhgS5-9;gIh(fKFCcv{NEaj_vyPI!#`D>UT*L6N{
zIasw8#q=wx3BWgiuU*jqY0$CpWIZTk>FO?zol@>)ANsoWJE2#t)MIq-Up_+<3uxw-
z7as}vhypRV($lU0sja!WhRDyNDl&tsw<s7H^My*gTko5`NB3(O?cWXr5$lctQkDE!
zzQuwMb6SG~gm2A&j5O;v=pC%{u!G@~AofBSa1*hg(RDADUi$J1sEla75=Ix!9@o^{
z<m3fJX;$nYJ;zFFgNc2nbE;fJg-Ey5I<Fg^PBH=Tv=O0+KR3P3p?r4TrJm86GbbWZ
zIek~`ybOGSf!~|Y_&$)8rqe#CSGH?rtlFwzDvMemxYpm!H@Uv8QzT<K)}92p(49wB
z`k5vWeo9*2RZd$0S?J*}r%49|fWz%hZeZVkYjESF%opuoo9~YL;`@n}qIdf7W3=&C
zXHPAxS6OP_+K86s3~NPCs!srL5ICfQ)9vcBK%dciSKxIxoN24G=Y>J5;nBTrJ>H9`
zZyHPi$;s1>BiGp@<ftEUVcYS&_3VdU<w&OxV9PBa_e3o}Z|XS@2mSl|e5B!aErtWv
zC4{2wub4fW?8dl;m4M1bVqHmSc$R3BAwSCf`GX84cH%z$jq-Z&1k||`K396zpf8oq
zMogCXTR4mDcVyz%mLF?!<&b>4h7A^P?n51P&v|NT8kS@aoHjQX^<1(37A6%CkiOm4
zB(EfM3M*}FTf?M>C+oIbD|xLGpmn{xqVDTdRTT#7Q)+lzdj|JCO(O?9d0AAGuh2H5
zq(ZSNDJg9l#uiE!F>-HSjlzr;lQPrR+Jy}f?~dtP)m{DM55}OX3-_Cvdr3n)xa|~%
z@^O=5caVwako%$FJ3_XkAI<x$2=6E@?_&aMX?|##7vLSb)_`<&_YG;j{2Ik8XH9nU
zdV<C{i<v_@1$`ADc$8Nyk3t_W<8FL}`7k;00}gVBRCWOJM2sk7h)|!Zd9G^wy4@pO
zrC?`K$Bx~xafie{1z41hm(kr#_!?g~?CDeWp>ATr+dDG`?=^G$M2IS}JBJ5SaNze;
z@RA*45eU4Pss0^F@YEw?S$<ca;!22*J9etAuDZ(<dm6H1ngY4<i;n&=8Y&1O$1`j%
zuCjk(Tz=LaSK8XZ`ewJ8n<O6Fx~~G?cqMSLPoJbH1tUw%iVF#D7!#YGE=^BQ|G+EN
zwDd-(>*{SJEEyf#t2G|3eyWuZuZiWD1h5Gnf-amKTv5d`?*^n2NxoHCQbTV44pdZ5
z)F{PO+;^Aui1%woDXv>pCL#^i7Fa<eFd0i=keyvG4Pfne0aK(7Oj!o4a`&HI4;m^d
zg=ObW_wT17MftLOa)}hWPKoTq#M($j1tQ<nV*U=Y&wgAw&&2Bw)D(X^s>fXbch}9S
z_{*N3k8jnsR$uMxkV06S>`m6TEHotaRQQC`32-r~flYc;p8>2N-drx=6TU2VSu%_C
zJ!w?sIUzI92k$v2tlfS#>g#ntLk_i+aV`9X04n20h}Fb0be03R5JDya)1kzLpK3G2
z7C(>3$J4ng%}8=jHAFFfnd)Q4%NII9M>diWmoW$<H~OtDY|r=OV2$hiF$6<A=LgvM
z<PO3yXq#F!YEsNz?FY13P&<V1Uy(gIvsZ=DdH3Y)>}=VxF$zilej!~dNZw_UsF-GU
z^4Bxk`)eFYE6YW;d4q{UsMz{lqL7AjCA)}&SzT8ua3F&0?R~cTPqy)AC*+6I-j_73
zK7Df3mx_9t`k@$U7chu$iEeA}XZ=!*Y(>$&H;N9r`w*J18Ji~3PYWTGAzgN2RPXAs
zT_5XdKp9+rmD&G-mAD+PTuJ<lPQrsYdwH|VNjv=1&eVf~!r&!SJ9AtFTe4B=a5q+7
zz`-5Y1*<7Y0tzm!8@Weu6LxQNkya9pXGD2<)Gz~dkLNlakL3){6mim$E^~~|29FW2
zuM$f(g8>aGyxDLJ0frdot4+{bpMq-)&h9<W`W8Iso8(@(bt)Q&SSyaFjN{?~%=ZDR
zYf`aI?il11*o~nHMAvB?-PHO^Jg;y?v^2S+b6@LKg-kXzZsp&*JM?I|AiQ_lvpm1E
zAtd3MV$Z{KG!`(Ev|!KJbfrX*-SR=WH*{URL!1@tsvSyd{RnF(MunJDADY163N5<y
z8*+ALDPvK`A=pjNqhCJo$lrKyX#X^LvoiEy<%RWL)LDKh{;B?T&eg%~QNpZSZN=@Y
z$Kp}m-~z&F1|_}HHLSGTkCvqxwr0B0jT53B`Nb8-L8u(C?qSkA;<kFZeHq)5lp%IQ
zD6UoBFjoRZq}fj8`KrM;yUzAd+deP>xv@E~qf=n;p7%(YV~u{9ZMlL$p?)Yd)MVz+
zx!BB~Fj<B-HK)V(mD4sJWX%3JS`)mQT;;<!3fMC|sL5^l%d{Ioh8P34ao@;Oq1sRB
z>(4&~Tzo%J-^GWIILY+uPNBM(Wgnoc(X;ET$cp}hxX4?+zB*Ah$0sOeF_jo(0K$O<
z?l&Jf_JwYtVdwE;RpzZpL$xl9r;`;d&o5mYS~fyZe!ud>Q~ma-_tzttMtEgoT`2%B
z=NsEw5YBzA#<eAqmh$xMrWdi3!jSmHACIqvbx2~q41hP5X%m9$5LLHy<ZJ>m0ZZd?
zn&K;rVRL%VQ+06k%DxX*-~V%|$ov<Sb`iSXVLTi;rwwV4-bc<gNbTV?jIYe~Bb$eq
zG+n*zo($WC->kU%6LZjj<4tFw2PReu4{k|3I;cQxy-Lh5sntv*c6@w-ftWFz7Tw(U
z3kL+DryVz->AKuk0ZRCw(`t${OX-xrue6=x>9xH<u3a9a-0G~rn)SUcL0OA)tB?9|
z=Z5%;Ax295dE^cIi#|>WRDzSZ^Xqx<^IkBOejS?y6TI$rQT;wIqGgzhn2dv?WY6G#
zHnwNyx9Q?<YED5DEx*<<S_|76?8#B;RTlQ+&mN4fG`&<f^+2lco!3lSn?hW-h<^f_
zY(aM=lrjM+69g?ysH>B5=lAi<1HwALGJ@G6IF2x$jA|2cBq3MdCY;~q@_qEITXoFI
zb2Q28B`ZuZ)xqc2iA%61WY-wy$~f{THnG*}rmSy@$~HRwh9z3Ww|8x3`rRDs11OT4
zmff~OV`Hq~y7Ln|>GS0e^draLyvXDgOyS28nf%KdcW`mp%wh$<paG8;YZW$tWo6gR
z52Q7}N*IHG1%=h)ra~yYa9P%Nih&J~|Mjr`^OsYokGWV0slK%53$YS&<HoY<cU+oO
z)JX6d<xYxdmmFQ$0TuY}nC2Jf?eBV9{8mxyT6v*QH60w+|IIS*LPy}Kue{RX?-5oZ
zUOp&hzD@trjJ`&trK^vHW3b>tzQ74uLQ>LnG?fz_4^Jbl!gh=D^yTG6ar9*K8fVgN
zw~F1D4GyotvC|Rs?To|gf<Q&*R>}@>!K*|M@Ef(72)g9Pna#z|ny;G0?vqlwV;lyC
z#HEnCnWe$8eMsCTicw(d?(W*8BDVxW5rR$%clabO<l;`<)b#aQEe5K&+7nk7JOYa}
z`?X@uD>bylMb+J+QvW)Cd>|dkM@9Quu$N^c@&sBC+w96lOV!FgE%c|xUw$hERGV{@
z>;mr9+?=s|g_D!G)Mr!l?Gx3quGMuls8&3Cq;x8RzUA`rbXOY%482ViOYhN25cNF-
zfUrbAD}R?@#TTp<pbU{h%MaGIe|BBU&}5e)hx);FN_`Q=d*}<<7?kbpRmQAMiay6s
z2m3p`F)(#Oa$Z$(SJs41okIV$iL01xdQJ|RonDNyw+iA}6~zW+o1EYqRY(-N`^$);
zocxy`L%i!^A;+nil(K=^yJ<XPkzIfTuEeef?GF6{MLAsKJ&Uc;m%wV5G@Y+<Pmi$!
zdYWJ+QIXI@Q@iiZdq@;M6)}@|a~-I$9&}N`<h1gS^4uJ=9m#-@v-nYOQ}dc!bZ~L=
z&^teogsT)nzml02b|g}3wKdC0V6~@H94lE*Riw@`;vKX+!9r_$G(&iETZ)wbi6I0t
z-zA%ow8fo&v~!s}RDJAG#q-hFapwp_>~ArAbix$gWC5sCuTBdB=twpVOrBgUcgI_H
z(Dp_n*%rv-ygnHR=fSl0CAoma#J)4U{5jC0i&Jq75~=LUUt_;x!?g&6GCN>m6~xGK
z`kiA?hU;syw~K};X`mB<!7MBP?9qc2rXj_V;x&?W!?4+SW_0cM(ZQ;3{>r7*h0D<D
zi@0ai@dElVbMz)Dmg#){jutk@%n>yMlDtKW9rMJDM>}J4zl{vQQTv0SMzC86Crmwv
z`Y!?Rh-z~KuPc+>=x|UhT5yK_%FBX->bhxu;I+yHnqHM~>O!W_<ekFsgZaE#@5lcG
z@0JKs4MGcRWKuQbe126&e)Z8v0sC;xH%Iky5-GMX>q|1ZwN}}OKt%VAB^XD><@>f0
z4jMJ`QC}yLl2{^xjvD;~s8{2!Is+Q<a=kA|#=HK5Jo$-HbLlLjG3J;|=NmbKW0hs^
z^<wG{btD$gQb=>SG(8dy)Kgvy9ox^`bSQuOK;^SPmpSM!rF(y@morm*Eb3H#Aj(kd
z#RCU|;vM4qNin7kD<F+eBka*l^?BrtCH+bk?q0GLI}kthCqvLKn$n>OMT)x)^o=?h
z^<uITekg_x9x2eaj>`eJ9|Tzqccy-Xh5OY%%V<J@_;mVsKpLKZjK}8^8)EP9fS*@~
z5;YIvYsoEo??l)yScj6l_$4Mml;hiJv$hgK2L4Sdlqpmik%APNdDRE!!Xl8hyY}lc
zQ!QO-OLld*B>lihj=#6ZuVdh&=jktJjP3{+{y%C%;bkvLgZHp=AG-Yz{JLkW((Bv#
zIVknq6LUB!^?s;H`Ijs_46q#Z&C`?+Ag!HB+q3KekzBV}gcnl_Kj&L!fMg0Efyq2b
zVI|^=5A{V$z8R^G4O><*OH3u1X#Ml`mnlg`I-xbdh%)srh3@PH5u;BA<MRH}A8El3
zj#ww%P~j0UBN~6v;Tx~*WcMBqtM0L3n0y>nnXaXIoaYs8=$PtNgi@<M_wSn)B8y}b
zB77PCc1)zuN4)(HDu!05V`3zflyY=uyg)vrVSQVK%-k#-_lF3n8t_vxT==iyPZFxX
z+}ALs9Y3#Hw+r^KggDNvSZm9j!b$Q@#;_64r+rzr^3Viv(0%0=2=*?17%5r!(P=D$
zdHbFTN=Ox5n=v92(5jug*!h~YsKT$w2Y+nO8?3G+)W@+9CPE!}6TS=0#=uB5r8Xj9
z-k#+wR^*U$<~@BV{Q}M+)=D?>0~m$f;2pF#5~=*<oNs-;S#ntO2~R6Fm;XELIpf$M
zeC%v@x%T@R_8~BzGe^qOKuQedvKrs?o%0%N9sLT#0ma80|Hd37dfX*m@2JTlOh&CT
z&w0{Ly`N*U;}`)j-;wN*3`X)?BWRSdWk5?;1p06KK<9Fh+Sf&0>1M2Sa&s8z$8oby
zsa~03HE3){5}{%#i~Y%oa&u}t4`&cq_K91DMQJ_l?X}-)Ak^$Vj?0Vae$wUi0Ydxc
zFmPO4CXz<zvr~5YOo66QRYseS5wdd1)SR}!Wa-U(RURN}7Y8LBiKSUI8!_llO46<`
z%qOc%TJRTS=1rQ9-s+b|?cFqE>d?&nxM8SpC%ma+*@Z?ClEw4)2e5H24G(E+N7g&h
zKw@*C_Z7#wTR5eo=ZUKpsAc?t>6XBB>uqQ<bB|xNW28nW9y#g%h~Im_T9(UQfN{x#
z?CA7_L-V=!^zMmDVIQ50+~Ud1k!3alQb@B!bQ5Lhk9GkzHL$PLPUa|kI_<S!jIiYX
z!$<E{^<8LXPK2C_{4l0GPOOe%SO!(yU4dOiwp<3vKN)A9pP2o->|xe*8F@?&+)wca
zH}m>>jK}t~+X$kB$}*7?R<Z@1{hKrLL*jQ1TYO6<ygWVY1N8qJJJ=aXIm}Q%kUZ3S
zHCQMfg`DhFHbCnAd1Wg^ct1@#xkIa#?M{kN)jLVqi=EO1PWgGD<sk+RlUTA=!4MJ=
zn}eN~oUUpl$8^0WaHdny{kXaiED1H07;64ZB(d)ixFy9?T0>WgMP{!Wt~o<9PV_y-
zL-ri|Bza^n#Z!_EMu`1Sksc~~z$>BtK`mR)gx*x2rb+}afqag%Gz@&-r|?ug)>qsd
zD=8K17Ht&%YwK-A4%O1rda)<epjGvL+spk2e&&k{xT`-cT~+8;XH2$CbcHQ-F+e<i
zxDvO-3T7rry>56wgoN!omsl>l+@doY!P6Iv_HWwj#}VqHXgEam<Xa4)@^lTZEsr0;
zF6`1%4L1FN`f}`+_$8bqrOarQkc&arg}1w8qHWem(#6@{K0ArUSl+{<#fvMXf@v0n
z^9BuK9&6QJ)n{2^46dmpSIh1+hWq<{Qq*a2X?dl{EzKy+zt!%PURaF^7LrG^;U?xq
z1M5DS*D$F`EbjFu>nPfvl~iJ?WrvM@nCy)=2m|uki>1Vi&6>C*N-WMNmrV2;j@F75
zheq-Ujp3R{v8g}CM*{08zyl;pECSTBNhnYMQTJxQ@K5mxr%1yznSKAc*CUS?#ISeR
zS&bVMsoAYRAH*8W#1)<#JdzZ`+=ZZ=5*$Y5X`1uX?B}b{6*MAbck+%lp*fUUKq%LI
zhqrnnTL_7!mYR}F4cp=z+dT7&=<G?MLcV;v*YnlKBEhe(jVnlCCuF0OT&tn_hJb=t
zN-wcF>(3DqOAD!46MgWGFhvBfYBm)DIRLRfmhrRY3)^ZKxh1YY_=SwXYi<s{o57j$
zEvMr7-&z1t`jKplcVEF9gIO(mU60muN)=2FdWAA!bpqkpr;E0S?~I?#W7yRBb|Qgc
z!r-4_jju8NVGx#LT`|d6;ObwhNA@o*!u)-*eMLxTO_E)qgY1n8Un5g=0HGK3J2nN+
z5`DsC)R}?bkK{i4mnal+E6a*o1<5gEq?1f+jUJl^ofR$0howxaNR^68jY5fQ+<3oo
z1&dkcJ+HQwIhsB+$A2lJHW)rQPT?hOF4y}j*4xa>c{pkqwt$ohj0k!;rGYQ{Fi<0s
zQfJbQJ(<TefNL3^_s^7B;%ZF4zEOq=fjp8e2(o)bty(0-S?d%j3K%B-_D<jjXy1rK
zl_RAe4JOD>FhQWe1eriJotl3mh(4Gg3%#V~H7{UV;iiBIIuE|}VE}j7^GxW{bhyM@
z72D1aCa~onP$lboNEp9|b$|L91jy5uCmeNNOYGn;px<gVA7g>}lpkr18QK&AXI1R-
zlmdjFuf5M>tFC3F(^_M`PAE=w{bDriwiE(<-7hxULOPMrY<W_$@BdzV5|^TuEebxh
z6)5)gmdkC8n^pO4;A24{g6uD%eyZ)<Vls11rXZ!;_p&ue+H_-e9R-vU0PkuXp+#08
zc)O3NPUcbd<68c_ri)eo2!1~~aO(ne@cU8di>LI0_xJhRlkdS#mh(>Lu|=`r5;}s1
z05AJy(W!b)oT){X$l)BAyoGOrfN#;ol}zl={ks9`ggeIF^G4GV0eA*^!e&+&={<gr
zxkpT!!+P>!yQR!Ec4VEYATzLk5u?%`98U{jk%=)DLoctVq$%xbdJw?1Oa$g-(i^jx
z*Ps?AJBIBe+%66x?)Z+WX4CA#6PCvm!;;vWL};Wds~2&Edosd`YGEn|7tzL;8P9kJ
zX>%{u&1O^{<JHYg)<>Zh#a5@A?sOQ8B>nt}=ytPUydQ*TmHG1gXx@jr{d~4@%eicY
z78)A9iQU*BvJXxzj2!Zs(zq?syf!JGBCnq+9Pw6`TrO>NR$EM<y0(`g%)BmN7BMVo
zI^Nh8^*`~9^XOVEsxfb}ke$WA1{zvylLywA-hc+fkgwgo-Z2OxHL0>q#2SRH<3}P}
zg9k>_d|8vmX0xFs(7dRm_WQ|Aw@}@S3TyeewU}Yr_aquO*sAjtYrD-fv1ti+A+x6K
zr)M9^;*BdxwdB5ak;LO=dA>B(YFS-MNC^}E<Bu7>$<YWRmBjl#r+f%!&=^h+4+nzc
zHF!4Y*ubOqEX!+<hy4db!f~pXdeA9++znm;y_Zi4808bRqrGI?fM4!?tn9VnsQP2~
zebsmE-u2_6&+^V1WO#~}&%m1Uom#-0opU>}8Ff{!O$#~a{?COkgM4WPWpJL>?#Y5&
zxA}P#=7@bRb|a*Vm1|7PwKPp1F^uvQC6_G+V<fwsj&0pPdS_h9P|E&kc(6V@wmo8|
z_$vUT4h4zPQsz@pVQiuS8j!bN$#qRiwXKPqBa&l7QG2c~^h{HKEgp0Wtd;ADwA~uH
z4K;kvSz~dad(FKR^U;lXD6Y}y@MeTSMPX)WXec`}5;d94JYE7m(3S(#y|ceB4lehZ
zTTxNr))!Q>0*louRf+Yrq&}4jmVN9VCHGWKNMJcATILI^LJ?3+Z7V`_alItK^65QK
zuGQHPyuDJ<Bt$A?Dfo=|_^RGSrjzYm<?-Ex#!3xvtH{Y}5-mPXai=yl@Au>Wl+pv9
zeHi4b5ia!2KUwZTh}4~(DpD+LE;jZL5snjK@A2*0M7SfFNv*Rn4>LgOxD7k$`s&S^
zYw;LUAx5(^Jynrj50U{N&rEArFA22SQ%GttP6^k1WVzWWkm3OKCD<cw3;etUhnQ`x
zKg^Iv;|eV-3t#+%Wt=a+6ScgBwXBxQHY@MU4%PzB58Hx0j=5TtJW=eW@nu&#XT@gU
zp|}vPtA{%z<Tmar#wPt-PGu?w&-+T}QayHX&ibj>1iFfj&3xS3Gl(*PYgoAm`!QCl
z7`?OgHotKOyc1aP6g@W!j}sX_4ma#eExcgqG&7^ap~&@-pm-Zar?^^LE-keMkQ2#4
z#2C92;f`lTv?9s$lD(OA{Kca0(izKmeT{!RnF~P6;nSzL)#6va&?`I+g6blWpP5xa
zN0JLSScXI^BCy`+LfalXkcX^Z)Qyk9i6B{xdh45x<N{J2b8YWu$ELksp(cCdS!U=V
z6`hz}zo=c$H8aR9AJVX@7SOqO;vYhi9BB0hcpO;*Roiz2=XL$q#PLLpRh-PtxvE5<
zS}9EZhec$sgVbmo>t_=RPiv!q`Ss<Bm8r%G&V9*?B}zkh^s#Fr6Y2xFNQy#}FptU6
zVD7GnX9~3eVH9d1tKQz*HuuR=y5u!%Fce-9=#vLlB+kL#sMCNMXcn0z{X`V-DWJFz
zEO9i0=15Wd!I6>athc8s(<B#5l(&#p!{jsEwe#P;V#1AnW15|s5v5NeQDH8sWC39}
za|!<@G@6sFji50G7WM&>vcTx}SQW6Q9Kh>a@?(vyg&e%^>2Nd@rc1*r<VfVOzX}V#
zk4reb$YS4Fi<iR5`BU^Dl`gdY+y^w8Q{G2dm(y5DlQ^btDIMT3H%s}h=Yk&2&Zef%
z(VM(3cOy899nR!ArY-@-g+54mX@CORd1i6z(Fm2)v;~>S%BxfM=MW>RV5@pj@w?AH
z=P1;GKiYWQ5uQ9B2**iGF7r*F$rk^4vnO+|+hv<8>z8Jpkh-&vd`p<1`xto!)BAC|
znbOtU6FsuIYB|Qh()g9vlYHB@H_D2gx9miy=J|sDZy!G~K=q^Vub-brZ5(|DLobzj
zX^5nykUhE0lS-HBXE`jFr7cP1{sM<;DJKfab@ysmmW-rTRN|rnO#nF~L37sn7#Gd=
zh3Ct_z0M~Jw#hu=YYrsOEBgzxkLKX;Wc3VbW)x7&bje@e#GHDGosE&$^2Y1hZ;}uG
zh&8h?nCzKd0h)gi|M^k!O}U3A5pri1UL0;o+n{eAqvtU{f=lVe4n+lq`Bs4ur2hbI
z!SIAyG@!)j{r`nDHz^2_mO7uDKP!`4;2Iy4R%01N;9hThXddp!HH`2x<I;Tn4Gm$B
zI$kBZzTegw#g>RtC0e`BvPj?Vzq3Z?m<$795YaV6h$J%yPERS2CJ}bWul_0iFZAmz
zcm?j^dWfT=qhn{!{pceN_WPCzJQPGnN4xcf)vU+{Vw&>;=IxstB7vhM=_9aTaSF9a
zGjre940WDo9^G@BlqU`}fRifJ%_er(4&s^A_h#eX2iP{Lmd7)ZBn5&ks(BD(-|KVw
z8rx3`fj3yDt`>AlYbzB9l%}bvd4)vNCGuM68#b<;jr&>eVf_u+5Fh=P=wj_=Sok0E
zyfFb9VO_9lq_ID2xCkC*936me=XRi#F`Std;VJ$pKuX~WE@w>nyN`GP64-H>A)R@b
zkf4r4og;_&e*r%KM(kvuqk&Jo`>DG{oyX4)<aP#9wE|OoA5i!npX>(;)KUM6{_OFO
zhg9Sd{13XV+qApqfAK=7(6}PHQz<di{xuD@F>yx9-E27le_4_{B&dHpvC~wqL7}V7
z@)_bRu2Or%24SwU5_AF`pP<q8z}QZlY-%KzHG=HHBzZt#OjhXTUofz|ca(<zlb)mW
zzZfc|P2!lhfbA05J1JgGYeDx2Oe%z>ZaPqnJai@%kA5#=(@wIv$@J$m{4i3B#ai?H
z9!oHc`Y^B;)3o*QSQZ)nZy3{OX!t1^IaBRCLZpoT@U5)_Y2l=NxWYJd7OJVcJB~)T
zit!q6OK;@=Cath)Kud5`o9ivY!5_`b@CCD^Hc(uSV-9jQh59q5a(>&ev%5r^ChCJB
z941SJCs9Q6XHdAMpMmd(1xxC2vVYO6^Yilu0b$wMWcQDc3a+k=Z8ny8(X-7!MT3mL
z$W|vx3}(M?>3^Q0-5C$Q9{Nr48`1X;SLI{Z;EHiMUpF^m&X!=eJ}$@o3euut&k3UZ
zW$~|?><(S^(Yc88uJ$lDL$defy5>1swD4A|e0*SrPxfMVoAqj<`u5ZJ4b|6&<7qHL
zU{GRSgo^uxLgS0Y9_%MPKYoNS9iNc!#1EGt$KEAHgD1o)2~BM;qhOdvnMPH}jV?II
zO3%9xTtCS~F*Ar@U(lT!lf3Op?*E@G3p1h2Pn1%}PP)g*o~!NBylA%QOa}O29w#c>
zYU(}d9ip!fztm@rdI%Jw(<GSA=M-cIb=B|hek&@+%Fq+8%nS~^k*fd?A_jo>miXgt
zV)y0m^O{KkY3YWTozBklReH1ub#^piMVx@4t<;F=T5S-Oje@uK1<fG;FB-lb5J*(O
z0dpc)*EjvGk0lQd3Mt;jWXDvKnxoRkojt-%9|!dnkDz}F50&v*+$F@8?jd9ci*~_z
zMImu;ro%N^CLkp>6<@tV7XsWkDu~PZMAP`MOr&ZS&VOKUHpr03;nG{fi)_i9T+NYW
zjV46qo(arh{xYR&L(&2rL4byP7zH){L<6%*lHSQ0@YMED&&;Oc>0RuRl;RVjt5fm`
zF-@i|JT~bC>zaU`eS5e1-M(;XEEr1BcqPu8U=UnLL!q(+cs_pop5TlR3NYKqlgW_2
z+#M@VsHprK3N?{5cwv+cME-xMddK*<!meL9YHZs^<D{_~+iGmvwi<h4+iYyxb{gA0
z)BCxf^PczP<iq?Xd+%%Qwf<V1T^DzRYH6-*hAc0GkGTg7<0k_EBCA2ou@wP+K3k7S
z-k#T}|108~gbwIMnzR!uNX`SE2tg-tpa#L+0&;ej;p#J0B-=LkcvpQsUO=G46-%Zt
z)5uH1`$t*_m$g*t==Ypkd8*sCGM<ueZu8|pi4-yPf?&_&Wc0s<oHsW&uVklqVH!V;
zCNN1Afo2rE`KHYzuKr5L)5q>b_k1WlVg6nNVAg1juij*U6wceQS$8|tppI*IVRDVf
z?U-4+aPIJ=yyEf=5;BI#>SC)g6Yy^S_lnPOqeyJk|7LltDxhDoUw>PK173YLVrx|2
zw>V+XnA~F&w9-3OWs7yF`LeVo>%H&Y-7a7h4VVzWe}ZVXm&j#FegAIO**~pRD8^<8
z^vZ-`b<1NEiQ+?XRj)FnWf5?pH~dKTULR0cM^Rsl%nbu>+^sY6j;VP`Pgr6s9wAX@
zYrm^mLX&fC)_}nOkwKJgnY9~7{Xa$*{~n-R=tlVr0wdDDWc^>M2Ob_uuw8J*;&DjA
z(j^lvak7IF{Gw`3-r`4*V1dU#ZB_TAJU6)}DWD(#8R8Up^7{T2DYVq@!~^`V%@<qe
zm=jZk{IDyzty{tBK9nZsXgO$Sen)W~39p~djxxx#a1b%{U%!=_zZdv7>(E>V;$0ZZ
zu!NsN?{HtC;EU?+UQ`gp$p`vJBU6t_mBDhB@@Qv9x262EJ^~+3!6yp0H`LoRfvM2W
zm12wIrTeex^~D3oO!&qp>-maCTIj}K|EhE-Mtd}~<e3e;l#<wgPU0C^Tu!D0kgJK0
zTG#9~IC~;x&<YeRk-j8`%29B1PIN9x*`ap%PXRZdgwEtrmZXW&%}+Q8noOt#<pK{d
z{CB~akp9OoND(aF`=c~$1h@pHSSDRqr_H%{m>a>OGk!=`=Kp(7my>}gzRtbVBi=Do
z`wH^^-=|oN*gx#JEXqvrvnyF8#RWh+KJmpz!}vWHsP=oP>1#w2``zOzDs|UzattKE
zM_`q`MtNM)>SNE@ngB^y5C8%&4-XG?R8(PLuJ>ZB&i`vYq`d%q+CLyjo=v*f3O2xo
z7(U_wQ2*z)0*@mI^2+-x{1}&mf18YZIM5pKU&#nDbXuU`>#ZA&-EcxVtywAC$B#c@
zZY)JGKC2T!8Oc-0%?10(ND3u%CFVqUAABBnN^3y+zI=Oyxg~SnPiTyJOrBrZ#&bBw
z$@+?u5v9>#D&uC8YuFg5c%MUIlI;KYfMnqH09~-ovpgAPq#w{oo2?4<e>uc)YX0|>
z{P(Z`A3s8{KRl@pW{Bv{pX6h!x2&p|4a=sdC=D<fafD>Ydq^vEA)T(Dtu?+3qeE#X
z&$-g7oXE7*lQC7#fS9j42A%h<<~77|exck&QlKHg2zX+uFg?;+b%>dq$1)Cf2>R-p
zFU}2lS)l(jivrt%9*ut%i8A{CSR{T|kskj0n;gpZ1$#=k9u6HpX%3;$2w5>F1|fS+
zhakCsVgcSA`;teGcX54!NTbxq=wyKq#4bV*`gZ8wy%Q1O`vLEg#j8EPuyo2nB`G-}
zF-q<YoMepD-I`-UX;uyy=yv^Y6?90+cD%Kv)MSsFwcNC7K}}9o*w!|SGgAo8dZ#hL
z{!6@rhAAEMsd%tc*<PD5AG&}7Y$E>ivjJfLsf3ZXMe@MUwIpEQpq7=6O}@l06*osl
zsY<u9X~(5$3`V`BHvjyCx~Z_H^v{m>#6*ZbGI@XhD)0~Is((k5TK(ia8#q^js0G3*
z4>`PH?`y8gYu4@jUVu5*&v9HEQOn7tiy<oN!eM*%=K8*0S`QPd__hxq7-l8)sS|Gh
zG{+red*%yp-LoeQ<L28fHK#|jPg|Pkz)|qi3D~H>h6D~xrH{dm@ivP3P4H9_{CR~q
z6(F0ix@xIWK#WDZc=FT#o;OimQd8J`v@Ik4^_c)fgywrJh~@%_wsI@`wab>XY7~Gt
z^n=YvDDlh&vH~eRa8Dw|@e2K~*4nKbvj6eav;Ym);N17cJux3Jd18~j_9UbGaE4na
zWGaekOZcJmMwL(jA5jANeA^wu$gDuG&pA#2A*X;SR%cVF=k|RmACmIW|2+-RV5X!B
zDOoZYAzTNTWzrD)m}^~IDXxB>^aSrGvdPJ1Z?de^wey0aDJqUy_C^;yu?-k`flV4u
z8QJ;>>31$ROgIo%nLr*qKgq@qXq6r>T}SxZH(L^Iba>oMa<Yy+1q()k1^{<k6!&*`
ziIeb&E7(8XX*f~J6FfzoNL?_t1qr(ojrB?o&&XAN#xHexqdnb}aEIDlBoF0}0x)X3
zCdCM&$OMcpoEO;w|4wez=qZKe`82#mnPIF#)Bq3~E(?Kj7ROz#qRVG(E8(qgpzY#4
z0S}JxBx944vI1&{2Fjy)Z2!^xeSVuuEnlkzzLoo<w$-g|{>Rv@-XQ%#550mO02G;2
z5J4FWCf-dKD@gBSl7cLoic^_!?;jf*NGs_8iyhE3r6F+$Y~6vKG>zx;B7=z*3(~*C
z2Xciw-Aa<VU${F!Y2mdr6QK%Mc5$3hIy_K<VcIJHqw~bA;AWhwITh9SD-NiflKJ?&
zODR9P+zws;(6uSK(ve<`;3)$NZGhlL7VsL)3CRBv*68nr6K}|;ola5U?>ef$q7jgM
zVp?D&2N1Jl*7*g^mClY?UDaW2NHG^wQz45}rFY=m4bfgGG}%+S-~L4C2Hxy4GK(EP
z@HsJ7_dR%zXEd$5K9?l7TVe!H`|R5x&|Y$&@fGX;9d|@HXvkrsw5+uE=DyK(X4tJ?
z$~NnNr<*7Mf<`K7o|(0ipYASl4IPCFe)JY+dgx1cyth%8mD^N!kFkO<?Ye&{hzbH5
z6P=5Nk0@L$KMaAr_xdLkBN-bJsIj|I7BFQS$fbzbcA4o|PueZK1Ke4Xo2`-^4Ze@c
zn(fsBJ?v7Bb1J6XS8>$0(WgK84VVu$iy6X9LhpP@98SMYi$UE$G!S2)AKoF586E`f
zc~(%xQmK6ij%t53D%Q+d8xi{tCZOptb_g3$0|j{@kA$)_dbON%V^Vp-pA7Ta#_Q|P
z#=O8czdkP5x3H!7ZGXDx^5ARYG|InLDn+;<jn@TjYa{y;VN49~Fza!3f~~5yi_GUi
zP3_klV4C1(-Vbc2_M@AY?Rj6hoIzN;W^vIi)mByF3gl?Y)5jT3H@Ew5&kfl>FTSUh
zuG#C)!S)Sd7hHZykODJCN5vZcH4w!`MGsR_D^t~8S4y;ufKxJy)7NoA%@;m2-aiLu
zvjMPa=c}KC(g%Z4G#7_B6YF`32Y)a0)Y0m<#h{b0u&9M0qiB#>-Cerg32(2F^7_ZS
z3(?Lh1big4zM`VVNGI3mzyh+M$`{7hCPj^+(c~*088b~dgu(|kPq!Xkce%OSXL`JJ
z^Zi}<eiYpcfsw$F4wEtczVgDqKQ!)lgrKFPrM|hcLl**1fLz839__Q=M7rQt@%W8t
zR-(C;-l&fSUDz=ERfnNhCMvkj%&832IXXbMyce$z5{W~SKsPc$&`QIWJ}>aYc0Y0z
zn1(_{&r}372Aj4*F%33`B}1#v!2?(Ts%m^I&d&UJ*#Snx>XxB80SdG5NF$XDp_hNL
zDzVVS1g?2G*wn#0iKgSQ`$hhF(X9S?Pqn19?A&M1f#jPj&aeEh{eS?MBe;MJc@VB2
ziyw`+4uDpinw@9q(l|51RoRTceAU>x1YGu!>l?XtSa@0A|75Mjc4glx%PYYqikQJ<
zjaXu3TP7cf1VQWH03pN55$x_`xl_9^<PzXzRRXg(V#^hl`bC|wDPZtir}&%yYo&Kx
zSUE|cB>UVP1$w7l8;~O_x_UC!Kzr9i*+*A;rf}-?RB=E!GgN#xz;1LjEUz&4s`v2G
z`WB|7|Ca520kemPC;#!e#u3Sd+0OLQ2oRCf#Z0aT;m)Q9jvF^khppv~&JWYx(VA7w
z4roW4Vn-oB8=~ios0)8nc~$pPtNh@u83i3uhxcP2I88x^*#@u0wNH%_&hS2w&I4Ki
zG6!3nDH9eFV<e7e`Yy?;Z85Zp+Hp13H~PTz^wy|uvm$5Xli@L)?kk^$WK0p(ECA3L
z4h*0}5BMjNN7)R**SucF7HOtD?nS@5O1X9C^6*Dwm<yrC@yuRWPD!~bBR-@C&MrG|
zzY`l%n+VwN3=H%%*0LAT7fj;TzK==lDHImavPoUk&iQ@U?NaHDhd0SI7%LJBrJ-{n
znfy;Ul;{d}#$^>n;X^1DykQr~uWuqhl+VK}s0+tIqSAJNI%cW$ZpnBkcQC}*n7vHr
z#jq4f+KlvT5orPCw*|lV`}NIOWvRQw)yE?}c_9MN8&Z1pcp>80gOgT7TKfE+{G)oN
z>yryQjAr6tSXQ~S9NVX^7eDkZufn-!>dEOjBX~DS0wK&%xU%t4#`1zbEC_-<??Ejh
zFk(3tM4JL5E8oMXs-!wQf+}BMFod+*?=LN97HEQksCGc=*K6@y=>n>L#dA2y?q5eg
zd5N@a6D;Dd0e!)t(d1;fuS7|zgB}r-(Ylcswg3lJ02!ld^7wwuaaeE8ErCyj%xzF-
ziC3s-#jGDDg9#lSOl@$#BfYSoKAAbdSwXy6k%5+|=Z&JYm9Xn0M&lij<A%*-Eq!_Z
zhib_Yg_`ku;r@AYdh4DxMqlSmbbHy6&9vggh?Vwbp^53giTW6t7=Nr{o~hssVdwht
zU{V?eClibZVMj(jCxJE0mNXGfA`^h)4wn$?$Wi9ELN}Zo_+o$oZ-cLQ!+v3KvjrS*
zXJ!Qimc<Exi$H=8nL7H`=Igq<NzHuScPBjyW~u{(Bv$Z6g296WeDb;J?DVS;^giKv
zI-dC=v7K>DoVc*;1e&Un<K2XEi-73QE)J{d4Eypgkpi)k1M`K*CY^Rysg0q<WFx3E
z=6}#Z2~P!4-~2;#C2mZkgT{h$w<oM9V(Sd;hx<42xaI3p=8{%yjO)p6C;`zhuC~^O
z$DiVq_;NIm=|#(n`JixND=7P_ILCYEUk@UOd!=g&VH%=J_Eg66mg&_i*QhhXsm|F_
z+;ebmZ9t1Hx)+rGSG=FE!VjF!ux<+BdHnzfpVFfTq<D4vLQ+f1s36rS#(qfSc2yGp
zZa?!DlGEfiJF*L)4T5&}YG-KmY37=$TOF5k2?8Q`zZt3cYy`LK<-~K4+|o<;!77C7
zBVgv?pq8qG?QHPKciO6iIX!(Mn?yW4?ngE6&z-IFG5Ko!)nOOSOULKUnQI*!zI|yI
z8;I{cFu^~iVNQ6P4&@JN;-@()UucFGCrSSzv0!(D6Wa$+K;yY@d$dHT{Y)V>O-oWV
zXh4)Zb?ZmwT(y0H?s=>7d54HR<^eSOJZ1tz`zPVZ<z2s!E^XiU$`8pXSkZwkv=fS;
zyG`#d0y^8PZ9#^)7r&X>T3z77^=Hw2=NYx-N-{d%Ew|R&o{P*%VdlKtT<BnMs+S;k
zboxUqHzAiZK84fTMbd?z1MImC`j%fMscrMLmxd_*PK(2i-*$n`mAra>Pib({HlLke
zc3}HSwV#%`k`D@OY01e2$tFi7rx&L<!hDtAHICs>{5zM!sQ78fEl|aS9hPMAfFNMy
zWA%1@d3;=XRbfid?+C2)Kv_F*doY{X6n<oM^dcGu;(Or@JfwE-F2&)YSxAOuMh^h1
zy69KeX!n80rt;p}SX!IiYLd`tgsOlV&ah}-O7p*bqp9yc8sYFAPZ+ncvqcjPCOIxm
z(b)4~i1Bk0kt^}brM2OF0#hbF$=jAy9M7N2$#R2r>;lTS)$H8U@wA3uy5uvJ_LWqb
z6-#1x4ke!Dle*$-nY$4Xfkg;s{Dn7Q4&%e}%iI9h0!oFW@k=GR=}v)ey+h^#i*KT|
z!j;W%u2s>aazeR~V8mdY9Z!C=3nNtZXb66PsVY46D6XT2Kd<!EJ0IJ24I+=-e4|m=
zE{Bu&&Q`P;gnV)Yb<yjsSS2Wa35fAM*5OWc*K7_Bh$gJL-rSo67(G%N%=K~BgC~|?
zabEgIpCcF;rpXf~GSeo(49J|qMEbq6`qCcv!d+ldn>+z5tAx^KqC`ufHXbrzBSiV2
zsIWvgM%asRRc`ZOLEVpS+^-A{|Aac%73gVh73PJu)(BCi0HsX|_u(+NZopKi0Mkgp
z*_*7SX6NsN8+Un<tUaCVeTl#ca<UCGfEuhU02(5ggk&B#zig}Mem63$QHuvz^S}20
zli8oltND8~MfdbtYN+2uUU$DoSr=%Al7&7vJXDmBfSv@fM*)$t>S9|ZnQ&mp8WK>|
zfCYDW)Ow-$hLl)uR77eu^PQIoNKW-)Z#)Nvs}qL_;b<+>T@^H+mlee0hHg=2%Z&BZ
z#}XCN$CM3^&)E0!UG=(o7+@4YBgY8?bmfdZ{~km5z0k0u8EG6F%r@?ir>?G3OAfB#
z#^BH#3atoc;)H5wv73UE!oIRG(PKl&dTQE?`vv+pAz#Br6n3@nOX6+&r2(@}3emp2
z#oaAU5a^7ua3)=Tn66;R$}Q>3J$LOErT^UwO>;<V^Dw$1Ft+r^BJNnu-3`F%D`D$1
zz0gLwp3I89?VAmOaxll(9uOKHObM-3%u1bLhBb?Y+R!JRI2#CU02qgU^k)nS6tjMF
zIWOq2NUD}s#m4SaMUb?e5RpMHMFQo$K5<)DZnXT{sgjaYG`H)Tey!l6YVBzaWE^bP
zy4e0vOVL4sy+XkvSsykW&Fb#!o?%U_&CgtiuD&cHC>#bK-w&?0IGimv8IxMijeuf4
zU-o)PjJ$SnRYmY4Hse8p>*oin^~p#EDdj-HJF)*lUEmtydCccK@^)pmf$i{xwYp@u
z1=0<#AVwDiW7W^^<>RCpBE4k9Kd<tFs17uo4e}0Aa^bqU>u!*w4yjH6LS;H+c5Tt!
zdM6M5GY+m#%@WpFbsxvl@=SHham6Iy@?h@h`a;RW036T#TIA^-4ohDC-8Lc|B-iQR
zNA~bflyXg#L<QE3v=Cs1?KGr7BOKz#Euv^_+Z3&QYz&Z5ELwN@dnGtr*Rn!U3{A7p
z6^2b5zKw$9SJ;>hn`Rv{6-C(<RieWb$8$XwU;^~cZZ&-gw;>jPy73n9lfuI+vlNPj
zrbcn44E9|D8Sj(ffEl&PneR##UiOwwCaula9N}0xYj+yH!dQ8TLjACe%tAdt7K3@2
z|5IzJ5GZuy8;IWDR#|dI{tt!I^9uqNv8sq;KZmKMZS?_p$vN{%wRs||atYP8vI>WP
z$51Xur+vA7l|WMTAHs$Q4DUKPIG6!0h&G={V_x{vAa`BXj0v<!<H_fc#9%PH<G<9#
zB{R^+4q7_JUa88u={s!ywI$JkLeT}3O;Be3fyGG#X7VlC1~U_X=tw4CGk54Z%Hij3
z6hfSOYzCE2#MJ1OOav3qF0zl{Gazs^2mMfispP{H_hb=^pgEf}HVRliN*P9>mV&~Z
zo)1;J=p>hKsTKaqP`EH847<kSK1@10gX{|=g-A&2H-U)`iFnW%2^-Ea-}I!HB%XXc
z=ZP$FQGE6$9aU|u;o;wcr~(-E5^u^ah+RB?z3HnS$H&af{#;_W<M-ZrxS;n@jT;3}
z$tetXp-(VkOXwN@nX6~9fKYt0DpsP_J911!)g*q!^5I#76mHE$gA8hxurKkI0Tb8$
zDQIN_#Ia|P!DcfN&S&bU7eAzdQb!J?lWHqoiTt>KK@UT+#Xv-SSycw;vJdnpAX5N%
zMACBcBxq|4ixHU|#5n|G`N~T>&Q(_LFCU{NAbtzL{Ff0kH$SiXd*S~Vc2H#SkL8+#
z&iMUtwwN=Oyg&J&of}0kg6LkkQ-l*NZUDHhD^69`RVvKR-Nz2c4(3HSDJsVz*ofSu
z?Y#ar{gKP-s@7p2<*5z@|FuuG%49|vo-4AS&+G0i+zp_L&D*hSk9Q=qfX=aA2lk!l
z#IP|FK%AXZLuO^CJ=M!F2VgFtib?gB(d0oE*z!BYMal}akm=rtO&*Z2A%pk^Pi#Kk
z(|877f1;X{Lfr?MzP;4NE^3v(#?zNAxI#?M(s~Ed852Y5^W$8ZtV9up5b2-QE;_`Y
zuKgTpz_qB7%uA!x$tn?rV+0+FuhmhG3kZ%jvO&ary>*WH8cUAIJM|Rq>}cJd{%DkJ
z=-=a9OeFFQ2SU1n^Q1d}|BC%@{DC04fsys=@n66a&zEyPpw{l^8)YZ<siNHg!Y_Xx
zGVW6KN!u_v59uquf+A9=h<z=J>yVP;>(E|)_cQaK@Eyi+d}0ktg>*q7rbBrQDu7fG
zvv79)3HIvKDb9C(dhboZ98CtCy3t|~Ck!;+1;9YETNI}Rog|XuI?LiDv{t&G?T}bY
zOyC70x!yhZFJFPhw4gF%=wPv_Ek0tI#}4tPyP#^M%W*V9>zPMY8c?d{8U)gz1g!k{
z%KxD2$|ymDSIM=(S6UIGw}cU}Xw0*iF^(z>#~(>wac9=^tw4kwII_Tk8ee2{yU_k=
z&5RaP434gA_-BYDd57r_6g;N~gBAi#excV6s(VbTwO=}n_OuQHhmuasre~Y9j5N6e
z$#7*XQ90)IZV7)N%ZEWpsAl;}H$ylR<@o@je;-L6WW+&)cbI_xohO``74d>ND}#*0
z+Xi53Hv)O3E6j5-vqk<VKFJ$FIIc)+2jK9afmlBly7k76tg>&X-8ObVi5UiL5+R@v
zp?kJB=cwG^3dj{F4;aqe$0mImI%P<U>{n4wmF&%jjgU3#iHIJy0#Rrn6$_lEfoWdq
zMGrB!99^2d-=eWJWH*yc*(1d8>3OT=GNtkp5|ngmRz(kXFXiG<3^?#aUFE(PnHej|
zs6Yg0HmWP*%Zk!qU>qomelu%w+`Ai-5XYP0F?&|2+)0f&9W}cOipD2YlDJ@OO&1Y3
zU5c&8A>_?t#YWEn@7svO8Ih|@5N)LUF#&l(Fb;cLnq+5*Jm*$inM6Cq^vtVf24&V2
z??gf6hJ-kNr*=Z5!`nGB2;57Z&Wv?|3kqr%HR(T-h(6m?pvjul@Tj!3?L~b<&7fBo
zi5i=gJ2%G?35`_5W7icU929h)WnywPGq}7Z*Rt)7u<2Lg11<K|=w8+)_INd~EFh<C
z<KHR{DPF#yQ-yDz=j8miCi&wRnKiqc(fVT7awrnl?<%@~D0!|e1klS`fL76^4lwqi
zoLu<WYQQp+ZtUyF8)>j15|wHicp1(72d6s%Ng1Q_$xvWdqs<@kcfPM<x;rnc{b}}j
z{Chq#S=b4bZZF-}@{zYhi5%6u%RXZX3AhH@P!EEXUTr)FFpw&5R((T)f6L4d9}YI^
zI7hEL4;Wg`fiw7`zV);01jqU8L496Yp5Ho=zjC=0JP{usd9ZJ^%ch-0a%Wl=Z`Y>Z
zC6bF(eJUboVlAm6uDpJaR4%n6aSRJfxt*DldROHvy5TZ~mTv3^oI*NkQD`ljgsj<P
zu>BJfC6+ppXyAg*x~n*le5dh_3n=yPhmUMvEe&qM!N*}VOc)y7g;&LeC;)X4N0hDD
z`I^2SpIwwK0=Oa>2WTUT+(w;C@Xr!xYVa($2H6ItaN4fQp<U(3kq8CcueT5-=G4Uc
zqK~V+OS9@`ilP|Un9pJnoj!4fAxv1^lF27VHC$>2CN`kG+`3S6Py({k_|qej8@P4;
zPMIyXMc;!wIh-4#Cf~RTHVCL!=Lz_|3j5GAFce+(4=Diy0{QMvGs?fDzhf6+*d#mw
z!}i6VWc>nRY_QfouddKBaSan4cC-|x_EHa_O{94S`|h}rRMm+D9<l;+JJGDLEsR5C
zAxWbDk*yVCAb>>ZMWhQpKu7<2i#dI+-oAwx_Z22Wq>LQ0`5`nhNm5Ns%~piaCdS*_
z+dOb9dMR*G=0o2<2Ij$ar4Nz+?NmFsq<L75`~(Isj@?bpBlurr&bQ~6ITNF4JEeNa
zIG$TH6<*Q7iUhl@`8ie^rXD>8UF!!bP*5=I`ez6m#LzGxxv0Cq;S2U6UT5|j1u1L#
zdYhZhf%D>XS9T~F2Co+37gE~~&CJ0{Ll`*w1}sVUX%thBFzg^aOe2%?rUVClxGdw;
z{meqLgP$g2I7J;`H1Yk^l~2^L`wKUhT_o><IxY4b#WqgkJsA`>+hS5%pGYQIEAlZW
zArofFiXI-{R9Q^1S?>c+!_qoIo$ZzC$fE3v3G;ptdetY=ak)R&6H2*dFH69l&tx2x
zqfKzQbv!EAT@+V2v(RWF96C!`vIBeI(5gnWFOsow#@etv09&X_M$7ybc-W7Z%mPxI
zv6rh@EApyULFup0u)m!zu+fCf3xymAa6|^NxbBnYuKVojaqSs&RY$&FE&^|FP<`I-
zMMfv%Ap*+2LL@HcW_bBpcwx*}6f&f{-|~x5Z9O?^VIOtrCM5C;C&#I6t{`dkqe;Zw
z8|tzg^krEw{~}&+W%j-OHqfD*dK})eku`YkETyJXRR2arX`$Wl=RaxyjVO2wi%Gxb
zCH^NMu~3A7v2wG)ly^?nzR)y`^`y&AFYp4)K+urX#W!6qo_=AES=$!h_(G?&&EKg@
zys)!pAqDn!=BN<2x3|>f<iVzsfT9Fp17u5fOmy_0z<sEHzo7~YRuBKzH9L0ER>XSj
zk0IYHB=v(UM~7)D{fUM_?+@T#vfF1n<=mhV;F0G05Y94xN^|uu854ZkTBGTITQK|;
zRe)PCu;$<b;y?msyr52GK`ls2OT)j_8TP-Hb+6Rr66ceO{<N4YltPKy;>im^g(gY9
z*Zp$ZGEI?{5JsI_h0Dmw^0*t@%;I#KZhzWfWw~5*`?F5X#g+@+I5AlzG<P1iFX2nX
z0xF!Qr9o%^Q}EdOD6&$E-Aa03v=cTd9NgW}WL&t?dRV#&@k8-|a#h9G1=B<zAl5zZ
z`J1&SxdT>gBn)qmWz!Xv>!MXZHY-NLftU_A4T-%-mxE*K0?u_|E9lNlUvT7{n!&hf
zA;tKri_`3utE9ZFQa6_~<(o4Bbitc`YnI;ygiSqiUwkqk=JiJo37wXAW#Le;)Wo3C
z-qxe;&9@P;tI~23KsCHrVrK<QST%Ce^Kq6sN~8tFy6a`~OO(2Vy?JZLO|Mz~`%_NT
z#Yv0hhv_%SKW#t8>$goM-Z&T@A`8@`DHk?>+wp@cD2sbKpAaLQy_tuVpL>~l()w?R
zIQo8AOGY84I2#JPTl5Cp8%amPr&zV8NCt2F-Vg-8<O#L2fZJfVl?7Bqa0VXkg>Emn
zY+QdjjEEKQXYb*=wRn6w1Adf@eNsk)w|lW8BTO4b7EDia0q&+(i?*e%^AP6FXOZF-
znW^;q_usmGq_p^7$}+XNWIc|b@BQ+H>6lMWVe0H}P@Q--@zwHptj;qP!Nm}gG9V+H
zy{E7rQFXIiLxtR1#$x!O4u&=F7GW=QKRb>0qNWcjA_oe|Vc@z+Y^$dX)h|p-6Lw*o
zuVTZ0hYkWLE^WUX`a*4?;HLKDd_}oSO!ZT<S^x0LsK`Dy8;GVZQ=3%#m5HD1kR-0y
z6h(LBooxJ!<$?^OKo7o!L%6uv!wjB~K9|&2CidWOx$rLN4k!w0SU6)=s<bAcF#i&u
zouK7lQ($p@FJd`cxZpr9i?Wd_e0sM{bA0K0)w@A<(y?^KrQdpjhn%f2in&V7m0T(7
zbo4kg<m&bYr2Y2RiC4-1VAzyXTbGc<8ypVpA|xc`gGa%%DoDFga`h6x>&z)3gQcL-
zrUSRKpCYV>ld&Le+Vojn-2Z_C;qOELG3`-kd!e=SbCf4Y)m|cviI;_jOY^3f?Y7Eo
z`~e+ttL(nfxlFU5tu19*rxp0i@`j}x`dwulYAlw^|FBsc(;*?^P;a(7C$&(?rubJZ
z8=sUv+)h<YA3eXq&Z}qJpH6TcvTG3B6_9B38{xVEF?IIqzq?SE({5dd?1M~dr?W6y
z@i#Cqj`sr=5&i9q{@L$>*=N0Z!iZUc_hX;6zM;l-0?a$lQbSJ)mVwQrQ$%P2?q4S4
z!!X6u+QI4+1YRtl;if--g$S{U)Qfe{F5)%Oxx|r^v1_JQA(OvoYG}Z&)CuQLpR2Ko
z5_d><aBtVVW&n_*twXmWpY~EfvE8uQ^%n$-W(B2WT2JY61g7af#3U5tuZNyKk9w@I
zGD@%<XSNpi&ez2@GTes2RBC^H*fA$?t629??!N0LPqoi^GY`e!{`-<Y=D8AT8Wx2Q
zUA2!`!NKGaW+fzsu}N)iQNP*=>1#T_%2=`ioEFscT@ZF69Cnk@rRF$4EGx+aIZZG2
z{?r>EYH4;jB0OWxCD+|Bx!bnBR>C0ES+M#g4$>`AUx&S&)Uoca*4;jf^e4x&|9x3D
zxymbmrg;XgVLT&+M>uAESF~6v4XD&&l1?Uxol3%KFn(L35Z<q(MvdV2yZL}$ZL~>+
zHQN0XZD3u;X9mI<ii(0m;io_7{j!EIhMWi5<KqD%!t?j@&rjELzEXJn6q1%Hgrx0O
z>#pa88?_QesCzZ7TIXc2Xy@GI3h%ekFI(n`Tg#Hlr&(-P(4)wvg7$?=Zurf~q%$ZE
zS~7-Rv9w>?En0KEn|t$CN&J(qS@-dR6HS|RD75J0E?xrUgjJpaXNPJ#)A%6qX6yVr
z^$w|be)6f(cz$SaRQx|f*`M%xrn2q_uQx2KvqwBGXj5=V5~Rp(<mzzy#~#-8TR??P
z5&6-j#gRZvY+uRT#vu{DKFNkaCVs2k!Pa0|AxC78+=m+o<@j9}>taCgZGW9>Ykpn%
z!7}9@6$N!>!4u5LQ~KS<5H^xr+fVyLQQ#aLM48Gb>K!p87?sFLTmR~Kt<nhKeV<X|
z6+CMDd_Vvi(RZOB$K{<qlSGE)MwSS??)_yA-lR|;;8JTwBIeChE6(?ub-W(<%;)pd
z!E}BwK4QPuu7KMwk%QmO*Ik?q3=L@k(;?NX*Qu{SezJtLY;2t9(FoE&=n6`X(#%vu
z$aueKdR)AeJRF((d_Z|d4?PKWu8Gw2Lq4XCemyno*6;=dUuDXxf8Esprk{NrJ{cJ#
zWB!mFEq&6azxcC<UfiOFkVTOXiyQi;QN?7tFvTW+7gsqh<J*h<)NEUT&`+dwSY|9M
z3+#Csw2>yq&laLgQ&!$DC>*^`9q81&>HiBqtcBBzBuBt_(~C9eHX^;ZY4g+MxV|n{
z3}HhJygHhP#<$1j>M>PIC$vutyYlIA(hh|g2H*XlD^H_+A@0C>=BPP3*$A}wuA13V
ziR-avrSV@SR)Iu7hpD9jYLZhq0$ac>S_n?r+O0tFLajUQm%c_lD#g4=?&f~i2%sQ6
zWr&gY;(M0ae`}Vl=^dLn=x<|yhs4!Y_60D=;=PQO?zX88%6Gj8`M%hI5}qd}8w@&r
zYP|Rm_#+2oH%0yR$D>qhh5dNTKZLD)IStcG8b*Ap$MVMB<aUcQsaU3~!LP=}`c^9$
z8o+X2XLd;bo5ac8a7K{q3LF9L3R8!C=h@al1R5-)Vg^azgGDW0J|LDv)?wdXU>Kl1
z)z^MhcchyPms(9NPhds`WzslPn$PThUzkH!i}P_#2fIKrB1)=;D*_rIH0LxzcDsEl
zI+tfNcz2Lr7Z4Bt*Qb2y>;(dXsCJHIt&}Tk=v){~uu6&}d85=aZEnDk#S@Qr6f4!&
z#JUISi{C=2a|>Ywf96)U42C3$G?I+KN^!sP{pOMzdl!mgTHPQjteit$F2TPl3OyD9
zQl?TiRTA!MaL}$)JCIGGro6u%0QbAqtI+icYGCNbl#;lgS$)yQv(x36N5&%v*?qUk
zJVb#^mrgQ`^^t%(!RWYun3w7e^zzn=_{VABgyj8L`pX-syHeW7a^jZqp%Jo?bPf6v
z>vO!>0=rc1%EW|<&KDy4xylCx=t^y`+9V!b4<$7Oz9=@@I<2+d8=@b+k7VFc_>@bq
z=1I2uCjxtn%0yLXn`;7vlb?$JkKP5DjvqC%L8UQn43gi%lksZ*z|QTRr74#ch!1zu
z#w#-KL4V98#_0Oy_;HG~xmeaf{dT%vB=mHdJ9$|4fWxp`QBSlD&E{v{Wq85LtB3Hj
z^i)yT=MT7;OUUj2k`iN+NV~hP9IcRj431b(vW1YE*|kyXp6>U+psVxYe2<k-bF3tX
z7%bhU814R{rzDe`8hrL?xsKZ1Sqlg4(-8%dL4FM%pP3BOt@s<alopp5O18VKJtPnC
zSB(?&K5)n^@MxNzk~&u(u_dHMM>J(2oUXiEjnHk{&_(o<|F;jTWiF|eV0;+_1O&8)
zbqa&Fn!aB8(%V4?5*)n|ue%olgn<cw7-sW$8*rWZ8L)LNqs;3*r@vE9|Hl{@qg&dc
zsu5aIB^}2cT<^Tdo&GxhD;dzNee_5>J}TfhiRQ=_*LpWIo5<qUt7Ng+QARthYMR|m
zM4s_Wr$k7&1{;j#mrHa1m}8c=FuBS%k9Uvvmt}N~eQ1ue7CjHS<|<w4D^la$wJ}&9
zro^11&oY4uqwd{$qICTquGK4y*&jjl0Crgi)nhn=pkD$Po=7NPQJ|KbtON8}Z;9Tw
zTW8R4B9%45JkDk_6{h<s1XAiEmuF;WU$3&C&xc-{Lhm2uEF13)2<#tIu#E=7{CIAR
zW%G9=H>Zx>ERlZ#lY-A>$@lnLPN^aWVJ#g(jE8}DM2ZD<ua)ftx(jMpSXH&a#cj0S
zB{4UVXXjh0R;g2@7WLn?Z@j-Xr4!?8B-@X=F>`$7qojin$L_*CNj4KH^iAkGo^1o5
zIlFe~3v}1a`dJ_>WCTMkFSO7?wK*-Aj=3yYFP$uY9Md>6Du;w(H031!;g#$^(fMic
zJQbmXcQBK(=!l;l`Uxg+^Cqu+-(MgObp#m*E&_R<d<WG+%U|)?*<N8~zFBM&DJ|v)
z#*uKduCG?|IzrrX8>@HFKF!}_rsEZQc<H=8`E8jm_~-G2mU>cGLevmqPh>O8xPl~<
zedLWOajRs(Yq@O-&+`@SE<U&83USkws~<287M*Dk%6R0Bqb9gza#?B{qCX~^w@R+N
zs0OP3VXdMaEPly$jh4iq4H?7~&3K6RF}cGmBV{_3Y<+2rHCDj6y&C<@oiaRBMD9G!
znbcVn)x8nq9G0gO%Uh8~l)IrcgrF0T#yvDo3x2$QAU~LbrCYO4WEN~4C!I3Vi3*`x
z8_W2THS#~@+82QdorkeD^q1=DNENQ}1crblr2S}ZnFjgy+yNb)ShEOM%l7<F#a)G=
za|MitGv>$f(g4SKkeshHk}+7<MoOjtXQUn(qU1oR>A-=srFNh!=@YvlSK%0@FL@K_
zk7{e$3AjV!wSRp$EsmV^@m&<ipkU(__W88gWpPh5_784Ip?`M)@W1bn|E`~Uiiwj3
zRX>cSpgSmXkPoL2t|sku=w~AH?1?iAB}QndVLI^7h4irNuv(m`k#0FJi3f(caV<i{
z96n%WtC{F}|8+3dc+qw+wO*~$=J$3Ad~dPJ8T(~qVDP;PC9oD+KblfTNTv&3*3@t@
zU932<pa9HI*ZtMOWn^_#u`7!o?qR@6)Pw^bzdDok@Ok2@TVemc?1F;PXhL8rJGS!I
za<G9ZE@SNH!0nb`q$OISbw4JS8M}MN!UZ#!e>B$*o26c8;bQW*TU2WU(-KM~8RR!y
zm&gsP><nxa>gJJCLzAoDuW)8E+AAw0rX6)ZGuOh>Zh(t45nnYE68w{Q8^%*5JH3e1
zk<`fri#g>z9rH<l$i~2?4wN!UMn!?u$XAk5P6axoMNF`>F;2>aA87O%6#_{8nn7Ml
zqorMbYAzzf1@mhfmk`MfZ(w>GmOv1#(7U|xDbe$#9JG$te+R>Wu%qc1>dxj@7K0}w
zMmSyU9K8E&kbLi2pgv(#5L#iCanxk9`s)+?g^}<5hu`9TYq}D^Wl2QG3UhL3W4DY2
zCmx>zbGekO+GR`>WRM)OI84s=rd(4b+tXSlCN6iw<XLmSKuMpn!vr`PbT=HS>V1KR
zOM5_X`J92o%mmq=m4{gBT?!oR=h@STpag19^D}Gld->&qX&$5OgSz^8(uM~4g&M9b
z4-<Lr6zlfR_s`Hz^=GD@e6Yb~%fLiL%mJ4YuYOFk_>@}PxW6Wa7E<<Ppc!XD2uG53
ze44XSi0{4rbWh^yOP10~6AHOgH}0W1eE8Xo>-6gi{-bQRo(eFXlpB;0cVmknXi{Bi
zR`xPiWx$g>C{IT7{lpjNjMcKIG@yPNL<r}0b>oMdAZlN=f63oAHbO4N@6~Ur8@qhx
z5i>M_oZ`Nos%Z@67jVksU5TRR%%HmpQ=3ERyYNPe1(3gSTk+WR&CIA!P*7fv1Y$Iw
z*mOo_@#a0TloVTNmbzS||9G=2gq-u<?EM@h5xJ&pVLCtRT-KclV&}C*Qul=ALZo&c
zFPV8}f#)kVwW1@42MzI$c3cb-hl@4a0d-&Q3WB}PGY}#R-&HdEVC*rMP!J0g>nfw|
zn#|cRnF7uckh|UMZqjGjZA=W=L$%*w)t_mA+X6)N@-YHV7)e9)CI2@IVB4qq@$kuP
za)^PO7#5!$S0hnf(=>*JhAPAW?|x_YCwS8wGNB8B0Xha`Z9tKT2pRu#<TFDCZSiw9
z0tGw27z^k@T3TVBM8Lj4y|kzv7g=iaI}JY{k(eojUjJUp<`l$nVs--kV$Zgr+5lU}
z(xWZ3kAx~n<lZKYLC+AxceYU!P)F}wbq#_F#%hE$|ASTxCC4SqlD2Euis+=RnPjc^
z<&OZ#Vj0noRu`D=8}$HGh+Y}hh=mpN2v}~K_z@0={XWI(r(fW`4OQIL0)G;0sZ|f=
z-R6G{Tvt!Yjq&X7*Z3(ce;g^B`eRwrun;e%m=StOh{5CJ`a`O@y}o}_r4tH2+Ir6E
z`sUe0ZZKs~Y5>u33m<Z~Q0S&R4~~B@qSfvm1F&nfy4<fR8NFr4gO{JTn~yTq@79IQ
zT)LVtBID*zyEwdx+wwMpomF?#Np5yGB=kY^W)I!sfrl$FziZ6X9q#_j?vh@h<ML<O
z8Jg~L<d2SsR=>NAl8+sAXjsZo>BB37#{kdupi5E<54EQ$4nqFHP9r20O2}uH5fM*9
zTd^5E4~2ok!gsm>aKqUC<Oazp!rT1%JpfFU#B3!ipLj4@2YJ-?uQ)@oci4nyp91FQ
zB>t=Mg~585bZ$9P1<+PzNEWQ0>-ZnC;w$dn=KgFR2Rih$tCHg-{KI!r!bK8Jc7~>!
z9Uh!vkiUt3<1$(9*v<&XgJjG}ocVB4b3I|}{KBuR-$eCh8INl^=;*keB2WLiOVTEs
z!cqD;jV3~J1Ro+sFX}Zy`JA9_>2a#YYq7&Z7nz(~bZc**0e)eNi=*t9O}1Q%>b)}p
zbJ(PWeu>*G{vEpQQ#%MPC=->fn9ae(LD)PcQH$>{|JOL^X<Sv+q)l%k^|g>f8bvX2
zM5q~dG$CvNW&b0)QG6(J^jIVrIldS*j9T;j^u@AYSm?)i@N%GBGPipl#J1bS;vIB!
zn~HG{C2%w5kwJWVv63!cvs3%U1pI(vUYI6uKg%B-pBDV#X$mrMO*0VKL0vww2$E0K
zTAx2@>P`@L@(Au@?%^1ObCu`6ZtAgE-6zuGrK#|eMuPLkolj0^U=nb#g47Gie}+cx
zx%7<rQMxlu$gmoy2<NoAvN-svB8L*61cM}Vz#Ts#=N2CO({FYy>$!{Ja$YB=-(gbc
z27yrisYfK>BWd`{nBtc*rTl>WV@5J1+l|&Mtj!cAu-SY~0ysyWB$tHzvVh`lvZ}Hv
zcMGhBSilZV*FIM5t8{Ha3!FyBi=#;71agi(ojQ1fTvOMolR*(jcvC_+t4_)W_foeW
zj(beJ$^Kq8SDA$Te~XfCrr@`U{t*4tITKy>$C)Zp*SC<c-uV_Gf{770)zNTWa`~%8
zGp6{t-Ec%@gW`Il7XEJ#bvMD@QhfzV?Pwm&K2XtTYe{^wCj_I*FL~NoSFiGXV%x0J
zrk&Zo*7*$1Yh~y8oZi3R%n~mB#Ee@1ZdAs9&R3?^EfR9(c<>@ZOO`5r#*a~LH-w18
zZr@^&Yc8+pY&PBG>D595L^R({yzHpwcB`OSS71}0N9TPN4Maq%1=cl;Fq1Y=K^O^P
zC;z;<oKXvsaZ_r1u6N2?F5bsYU93w)naU=WOvjGY{+w;KT?i9?cj!Ik6ZwuU_atyV
zaeuY=kkW9zyCxbD1cemR!5iw>cU1|N0RO~X#V87H)Mz9VLijCC46WHN1%dMZY*m%t
z_lf-??lWt(B{D--Lr)UMdM1wSTDVzG$=kTsOU$RM=#qYLGam>g1|sgwKB8Z2qP}vr
zxS*TnNQq!#$K!^S`ycqgNPM$3HDXj-#82wgDMgD?46jw8bf;EIoUcnRhHq?Kv5)9J
z4Rg(-dY>v|JQWJlJoP17_zg(8MjR|B^1=iq#vNPTF~yBM^_RQIG<2>F%*yvzV@7Af
z$a4x6X5@ec)e^y3siET4^emqdG0g_%MI^%#|G0D$Te4mu1#SdUepg5Z11rMx-vi%q
zq@g*P%d5Ip{Y9eS3`sLeL$Jdo;UD}<t!Q?6@3AiT?%qfASzXAp6V+Yk!!@0j4>Ows
zfQ<cR@R#?(D56VyZ>_oBDXDP<FTnt$b-Nnn8#HO<Jp7S1&#}azotvCu?7G?$DqL)+
zVS=}qOixq42PvYrE)H}Qn}|7jh$bakAJ{#Ka`AO_-K{lg^EGt`-T-V~j)jDcuIBHB
z_FbN`W24`EkFmj3;BGkC;w-2}1NfT6bQNiuTK!}#az*D|vRP_M`+4#d2Q^4VuW>E3
zzdWzzr75GFI@JsztRtW9Sip1#=QD09JJ@qmco5Vf?!FhVk2h|0c0HHml8W*#?KWx7
z9d?H7t(ETOjf)b>pvdVD#p@M&$EaStq7vnR818fn=KuKv&3+uoVYi`R^BkZq42QCV
zXd2Az{hq|FHoPt!ufFuHCJGEe|9uWGG`%<!>9j_zQZw#n&%+tU#n3X!YHAuzNal~P
zr$e_9PgUg*vAC}QMz=UkD-v|AmF2;4b=6YLbzb}DR^GQYFWStA9QN6emT>xCU0OG`
z_Fs0y^4Yu(REwAbtoK2yO(QxYc_>nhcvUtRI&h;(A!9d4>UkGdOUYs)IpVNOsYRf3
zwJaECRg8pQnz)Er#9iRo7*EAI=+ufE)ft)^Q6d*&382{#1GRz}eF|x9hKd}Z13q#Z
zvm8+7%4@<#zrUylv{*np3Q25aEv4ED{h7Hi@_>4b3qxqg`J^*l;=hm@BS!S%Jz+=2
zV25DFWRy#;sw~l*pc0|qX3=b3P9LPq-uvSy9K{rI7iucDMz;sz$Zw|=aF?DGcdqwV
z=P`(-KG7K}uLIt$lm(GQI0T;Yk?tXdr;(<V$we6HNCXhMoIDYIe|ms<s<<WA6%eUR
zsyB9F7NS+vq*nh*M(Q5Xt6^v2_d*s)6h9tK-BwYZLo26Jip~*Qv9t&esS5f*B5mY~
zt{xA_ElEvu6RG=2P(%{bbSgd0{Do!~ELrbIPJk#hqI`YxMNaV=N-iEYy6E#IF`%h4
zf*xScIg!dh=!KQ3!^M{*Rp5t_HzkL5B(Y7iKG^;?5;;R)L`2&PN$U3g-N33_Q6Hfl
z5bx{+T1l;AwxSrkP542_{HsM!BZ+&g?YxPvf*jIY14Gif10Xpm-ZkKMTQ!igsYuc$
z_L&o;JS;tNm^gykCj02kjC-X`_j8+8nF`un^!X%vm{z$v+K0gpVFt!<Zy=)H=grl}
z47dd_Ha3>D<qv_IBoJo)8?>@Xn|<w=eltnM0(oL0sqnH@vfVRsOOwE@i_0lyq63Q%
z75C^9TK=2yUd|v3SCVR60s4|jm0k$1_|M;)>Z~<`qBTvhpg`3$A)A^GBF7VqyQ8_}
z$gsdXEjwB48hD;td0t+_a2b(e+G0YYn}NIAcjee#<O$)lMdlYeo{Z$}Y}vUAZ8PJ-
zwKAmxer`g|0Krx+Bm;xcU5K?E?cTdE5@dKk_uHZt706^VkleKR5MR{$))`?TU7t^y
z<RV%YZmmlKW--d%@uA)=-Kr5r?FQYDtgMxrScUB(iW8a$$B$zUN!a#CRm&_YsH~hc
ziVECtXTJ3Z6lGR819;b}W}jrLk&9R1<G|nyFcFH|iLP}F#%uS7Ap-KLuiRk#)ku}p
zrorBMsBF4g+gp@oyhbksfE-qhYv=4!KG*)CvQ50J)sAd0)uG<l*pe=Q<SmJzUX&o~
z3uZ)71h%>ym4JeTp+-C5Wh(8Cs&8OIsPGJk6B<Xvm|~}u@je_=v*#1EKaD>LOe!vu
zg6>fwoYBQLulms|=E*?Vjhczzyp06a>z{0&0yJB#lVLLqA4{TIF=I1-6itzVY_tsX
zm3v!!7+{tPA@LO{S+EwypH#^@2t8b_%6hD9oS)I&KV;U{2=(?V)x-$t?ar#B`b2~0
z@}J+BB~#5`3q6&~xQh~SKD-|3`2}e_^WIm?Tg7zcBRn=Kx2r||&L**fk2+;NSL6z>
zWuICN(b1r>+}7Bt*zZL3aLq|0WkdO`7*ZPOgwG2aZ@b)}BOo^t@}tCElpX|==dC$u
z1rEdnxlUZzvD-v|8r9{LoMx}hQuhJZublI&aAYWI8E`{i09jrQX&6)aO%RPP<|0h`
zJVG`h832uhN5H9}C@y;iiu(Xy!wwZKHb85P#kk~SAQ6k1_SOD{+noCS>U*ieN5i8v
zd3LNX#WGfB#hmv#=b3W#M}tcR1rTVKUWvGvJ53)oJUlMW)){Y7PA+u-(>25ND+8%n
zSdl<B$Vqt(%4YYZRn5Pu?Pv!?o>$D5$fvfsoJmb*^QpQeVTc8-j*d!JO<^ub7C*#v
zda89?{*gS_Qh4dZZwGQThjZtv7U3()w+s_B$<6RY?=%q+qp!?yXS-SIIm%@v;MKZ`
zpk%{iIjr649ZY56gVPLJ;c;r}EmH*O?zg*G+hwY&M?&c3e70Vs>oDpCP!CsC<rb@z
z%)$;6`ra9%J`(fNd04Ok@L(L|-Ia+@`u%ZH<{JloFE)AHVUW79UfktaZcHIhKpr6}
zUR==h>9c<&qe$rrb;Dx4?GN`=onrq%)Rh@E>Oo@3G;Q1<<OZjW7Dpm-9F$%gYN=l5
zS9gnEeDWCwEq@q>6=&(4P8><OO@%437NXk0AZ{I1w78?OH;+*Ylg-OK+7_f)bn@PT
z0gkD4p187wl$aK*tt}4_PsuFoWev`^#&!oCT(<qruJxec9}SkiQ?G}e2V)F2^7Cy9
z&PmSK1fTCLLObKr(dTI!wbduW-4&NSMmKsONizxlcNM(7sQn?g{WkZX-KQLlwq>Z+
z{U{c}Xel9cdmJ`BLxxg&gtY94od!@LsADdrhO_Tkk5ZNUA(i3T*4r|k>SDirgiwWW
zc|1<1PrVBHM`7+ZR%TgpYitwjAZ^ikjDrhGfO4VrMQN+h<s&@C7&O#x%FsR4K&FfP
zo}icogF(k--YbmI-P;16<9#zuB(f~)4os(sBl332xvDZsR{*^MTY1(&cXhM}Ncz4W
zNLmVf9lyTPg%7#-e4JgqzX3BYXGoX)$W9-P2ekCur*@6nR9E5MZ96~4oXWXR0WPya
zGuOC#91S8j8kUb&F+Mt-_DeQzV~uCsavw_E4@A|^y^lov#T_Ik4D8QcUAKd7tmI%m
zoYwMq>scM`ugwXkHm_sRMi~x7`WpGJSfdqcQ&O6SCPsACBNKaSQc>Se0iql~l-;3=
ze~OpJTyG7&#9dH{L!59!`IwbULM(F>mmN^+taf<nVm!^7$B3t4^RcJ%jZ=#u9F%|#
zHwP`|#dUWhFJ~K3a2?Ck@mT}O%2ZHR`5i?@X%1e!8!TOho~Y%&FIOo1s+<B3NoT%v
zNP0Kk=Xig*c5M7PEcRw@yByDAY23k-_j^B%RS0@yhaJzvO>9=6-Bp+DstupoCC2|2
z#V@_hiMgACytw*HyQ)H2>*5Gt8c1WAVE4trAEplzL2}i=sp+ftj1S7)R53Y8gZ2F$
zVKt(b*DvCL(WTtvZd$&g)KJ_miJ1_8y>$9aT>xj`b0Ngzk_m<P=M-<=@UyeS;j)e+
zg(hSHsmNayCNrN?pFim0=Tni0Z_c@b_rQ&;$1MRi=D#9{qbSJ<Haqr^UVLsGF;WIp
zww;ros*Zx3-o{4qz*QA-$&McFk~#UGWghW)>E)nL-1V=0SZpWyN3`xz@%eVC_Oso8
zCY!84b~<ilv*Bdor4G#Zi)4$P>gi#BzuzMP5fPC?!&PJeaD)y|DGgfn&cr=}L;_c0
zk`xf(Cy)iDxXS$>0Qx`$ze&EES=vag&I2Vqs-2`W76(Ebg1WK>zW{j^iYo+e?pR>S
z)N0cU*IKOHIKE9TZCW7iZF-8MX9I*g*`j(A#S6h~3t=aBNpk3AHIA&v>qv*aLtUHp
z@D$=hPe~e!cGc@hhN+cUnjx$y8|b>@v7!PRoGA(Ma(?YhcswB;9=;3{rct-D6B~RV
zRYC3pAaiibDp|aIjq-j;0U}QT_Cd@Y_utz`KSW+jM|Z53{fCYU`J%1@oF%C>(?s{^
zauayfPGGpzag-<cx)0|tl!_c!9pU}a9RRTge$rcK>2E(NU_k?gwK|IX{_?X=h?Z8H
zb&$-Mb7F&fb;So6<8ll8dTjgc`>LHsa`)}<ILbY*YR3)VbN7YEIDSoD9`}SIg{OWU
z5Eg1E|E*b~ylD*QU#+hjx9(70k@@MB<iq@4e_ym*@pawPp`GFvB3~E1ofz6`s3XI6
zi@Qy4yM_aw6h9E5n_fDOMTJCErJH#)@J0uMvV|<M#$4{;+g=*n`vmaN{5|!G+aD5%
zM_xQ8DaiEZ(x8Rd)u=1g@G`Y=2KbtS(9SE8hRjqH8+#|Q#XLejCrOEyYVNi4&1N8c
zGUUW=keOcskC&ae__h^CgojooQ3UJZ*Cahj7xGw@#%3H#$!ma|HHrRv#r?jQ#lFS8
zl63WWu^QpCjT!FU1g;Asyl&~KTaagOVd`O`fh_O<nps%oSv(^pNhK%9>!4@HL3!=I
zWnV#c+)}s%cQ9jDtua#o+PtN*gK7X<2{uvas-i9&foEe*`y(#s0#d5)mkfA0GHbBC
zmyVLbuu?VW9{Cr~!#Z%#@Yvn5ogd(p5)&cer*=w8Ot?7KX)bQfZuL~YarS@;+apls
zShxAzqB7$+3!woMOtxyaC078A+_IKU6FMrurtM49rDnT(OQrcEKff-)2iJ>t=RwkJ
zM8$R4ES14m(n??Z-zV@68VM5QCOH6tzQZ3wsMT@t_N;--Hoqf`;O4`5SqwE9?v2Oh
zeIyB3(KN5-BrP6&Ph9G?P)(DhH!p7(lIAiTsyLDgfaUt3O>*&{xnkkyF7^67CSDzi
zf1Qw^GZ>yg;fPC)4ZQ}irkYsUyQr?E0yyQ%1_rWI16-F#FCKnshopfx!WLy}bnGwQ
z?e7C8jBAeXq&VX;JSW2ch+J4V7X-(buyT%&2LN7~n3f9n7-(2i&TUf|oLq57=5VaQ
zo8t!AOnmPf3%-uVISU$my0~?T_-~jePW4+$*Y}qg94Y!{G}4Lh{!AB^)c^Cp^L@Z9
zdd<c&j2b8%4KNh)(!Yx(6t3`DsqrezmEazQ2AU-Z+)Zs9#G_R&sn>f{i4xr=$G|Iz
zL^a_0N&p|m$%S7_dVB=9Sw@LhrvV6k3Kk2HBNO}%*!j1F9^Hg_$V_VYd`N1w<043=
zq{KxdW0cN_U?#=5;45+pJOb&+9%l-#OP9u7rSaf#cLbm-Wn};H-}t*++_G3)n{<)R
zZ_P72RA$>dJ{l%*foG-Z=>LgN|FLD(uCbxYse!0{e@QCtwI0LXRRf?2a3_l}Jb(Q&
zjU~U3D00S}UH+X!o;!eR+e~@rH+%GbT!WUX{mk@KJm1WLhw^_Ci{CLrAWZ?rbb03w
zv2pd3;6oeb%wJzi$Jb}c`IXa@!At&}218$xhQnWxlfQq6?2u97bMKQv&Jgmh*w<<(
z?I-*MAlDmNBvWO_heNPPp|fvlbr~v+9(Xm!mv_55SePD{mp9K-TrSaQgCyTvsA~t?
z#j#G)9QEDlhqTBb30m-`ICXwloH~?TL_=Zw#qV^(3$0a%Tm6CK)M*6C)<4@^rA<$Z
zkCyYRrc1x6yH!}MR`0dlE3yAa6*bX+>K<+PUHQIu@?+{*nHkJ9+4uDm;FD~sfUqM!
zzb5y9zts>F3puh`F0P-2-}MAJ`s-WjH}B-5voEwdjPG}c2IAu4#2wKgQ>ILjH{N(d
z4O)5F#K5h6?%cW3w{Kr*)F}VeCu3UgyW@va5k^Vwo3$Ias%%#D=CMNP#+nWPBK$xX
z4&aMbZDzWvD8f~R&@=lb6&@++cYri-P1^z?0Crx!;!+9|H6Jj%+TSbAc)$oJl7H=j
zN`=jvu{F|YS8v)`TpP4eMh{o8V*(N46@EpMW5OhG+ftC~WQcc{K_v#-B!mZ{FU_Un
zgsBqdw-2w~5*2V7X}QDUbps=j3V}Z9w1j5}Y~o+Ges$~r_^bP`$`bJ5X97OyVve-n
zHN?rMxp=hbCNA|`BKuUTBu0gbEx3e?V$^_91GuJO$T0jUBRxejLF(-TAjYF*cL_he
zSK_W;kmUGSbxqkI8<ZWwmOYx@gSo;(QWN7~1f{{l#sXlZWwAkNeh0}|dAzn~wE}C%
zixY;qiK~#zViSB|16G?;#2Q>wNdS=DTlNy49uLB!1YAw#)>8YPAut+jBpF$**e?p_
zvqW%K(b!823(^7Ui3!SkC<61ebAxtbVQr&~IeHzMz(BMF=ao^68mP(|pdlU$9-Hbz
z-_Z~APQV&{CHZV5MqHBv2-!0S`G3>V?}Jj|v|RmfF?jvzNWB41tFuo1@v#K%Tqd>d
z8K#J{No33gRt;cD1=yN|diH<&lmc3P2S1Mmo|%fviWMXxG?E}q_~||3;N4gnKJc3O
zubv^N!6DNAm7kPHPu+fFR9k14O;Mpf>Vv_b+ttCM=T>|VWBOOAfrVuPPSF=npx;Z?
z9AZ#aiELW9)PkqY_Y(ByL=_(8+*!Bq6Mt@(*fr`_B5f2@NqSPeWa62Y;CT3{T@tu!
zxwJ(%S-<agDn6S8cw(RV>nl7@AprsAYfa2;?4<RxU(1mhuV}mO%6DF8(EuuQb2_zo
z?mMx>;wQZ!%}7U(i%0Uxw#DLwuvUf}x;N`8*AJ}2^Q#fCxhsD}c??<sHW3jK3c;B(
zXHJ2DjV^z#GKuo2%DBs@fs)ezxqZlUbLiMf_0nqgM7rVLtvbuXU#ICwm9=B#`JM*S
z;h;Th#U$*kp2Ma%{UJcX6{f@%{YnL}(fU-)-3y@uUU=9@Qy~Vt!I)viOG}l@a#r@1
z$|aNOwNu~%OR(eW?iI>-qqkZ~c-jyUI=|)@WW{<;YP9U8UgXh<54#3q@iHF9z-ts8
zE{Wi<$i%8z8Xh9lgB;U#1Gr&0h6%#&ERovN%+?X9eBH#-rMfs^WzDvFU9oekiPbtw
zHO?5U-d)AYd`)->837yZmtcIqTQ$JznI3m>p@9;G@T2I<1WK>N&AqWAA@=Sv1P|=y
z07$bvY~anpYcC<>id<d$x5Qq-YB*A7yZST{M|c@B10FNdG0kpKCGyfqxxRn3q$H*A
zvR2?LrX+4jGQ9q->|Cib$Jtnb-{?lDw14^&X+CPA^7`RK5O(f}T;4cOvfu^e;N3_)
z2uH$mFB$U&y@yp*AcN;v&#d}c8H{#b^(E;BxZ404+aViO19;zAJGmFN>&Eg%4OAKp
zBn2GB{nApHnW!uz;NL$a6+mjcmw!~@h-{MpK+wK53a|;s0u8~MI=vs2=3_omU1Hc2
z0h`=ng8f}TTqc%wPI7tE?>P>qfjHT#+k?{T=`YlNhVvwZ1*mNr#dZ5WuD1PG|ES*c
z`cqIHB#k9lQ?va5Y5U?db-J|^xE}%7l$KaH)ex^Ire=dSsp8W0F=2);+j<?82U2OZ
z%X%#UUNhU?=|x{C5Ug#smk7y+35F94t9Rei_%57tbfZSw{<x2v%(3ro{E#2uMg0-@
z3*5OJd}9xaQ@xfs)RS~0NUu{H7c5Xj2In|#{BZYZfKCeEe*3NT>eWj>Xa(357GY;v
zZ=)DBP!<|kG5;48`a}+m^A|3wj8t9-gX-U_yPov4Ec#K{Hn_rD6QN2e5lz9FqRfNB
zo_b3;3oC1}uifO9{iU&kD<}o=>(uM{fTYFUkmw7?K%mNW+5l~^+5(G6>U19ta49Eu
zM^XDoz$M|*5jimZRXiYc7LVp#!7<TT9I=wmS8gG|#8rKr1%{&lxEOAh*BJO<K~J6N
zD}D$A+a)nr5wo$e5>pT^8^x%ByHx`WCrFG814wfM>9F@o)RpsMl98mYDe^s~zymE5
zJXW><JFB^Qi4_baN-B(^L_AQ^E6yYnJQ65t3Xj4V7=g0gN?osRO*_IvudUePVUyvO
zg%xvzS*2%yU>$X;*%N<ksv$H297ZYd^vgh&LhjE%0nRxjK_|G(FooE_^KuTLZ;E=j
z1;B%FD)Q|x%L2oqRDG%=I`2G&wWeW(Ga=|K!obt;%0MX94F&!-x_><CFMPiXJ3eE%
zs;7agJC>@9Lv}TMD$U?x4zCu+wnNISzmfijRa>VQ>VOn}NP}k{GrdumX^K*_5Zp3t
zo|~e;8kX<&(TW^AH8!rb0QgMeAtmJ6ix0k}eJs>_L3L>3C`>;K)mR}5nLD^kt!&UH
z6LVH-=tadpWY@G;A!{gpu}*K!!*>-6@Ww%32^aQG{Pw<BIk-vVhu+rjH*VzAKz@K1
zOEGNK9tl5={rV<&fO;rz8trU?lJt0`@ZMz$-bka|of=@)?pI!U1rZlF=`<8zQ&@GB
zMq2N}wrwnTcWHniBE4+*stjVTLXF6yP_=|?_YJ`L;J<dZ0cevZS9h!s_r~qS0XH6U
zTil6|Y&bnFQIR2sfm_EE#K4R_x5J9P18!K>t{w<ia8e-)rdYk_s=q#K6>e&&Nr{r0
z0;3LwT}o^OR?R~t9weM`AR0}&5h7VQM#ABYOcP1NBxn?)2JTi3Bu9rKbl{ML9Nz+<
z<}7p2DUgIfi6-0z1-T^Q8cMlwP1~*Bak=Tk6S;!`55+Vy1>p{UsPi<!8uv&|WSnwu
z+DUAXW#o2}0bnH~Ii46Wz!mU);oT0`y=&tRFv{#D7Qjl(#gmc>pb5?6fi^?PwW9-W
zfY?IFw?$)uea}R;L)K(4BvnTDN4Gy6nawirVmV9>%5yIj^T(aeWd;qE*(QyrG!Uti
zQ^P1_qXCBcoSgT8E<JQ50c_Ia5n2>*L_CI+ouN%HJ}YqV)$a9hjxR<F1tGr;`D$Dc
zqNqs<LZI>z8$63>Vx23bnVt&_%hW_&$3<K?E2s|klfp0+O&F?G7NYdi?QscRJy|su
zcWR521z^L*48a<HriT(2&03HDQo@dH6?=rBS=u`b`TE?NbY>9+qUSgJssiQkhxdl0
z%ZJ6rr|r#W$5QS`UVs-pYe;;}7x|bHLa(UsTup!W$jC|_C(lmzOI(n@k&~>HzoW`l
zeUSj0(n#yw;k8+~z|&!z)vIi}Gxpc00lfw?Qd8u{g`-G68>Wm7{edEG@Wx^RS2$)p
zae}8wMG!j$+B^f$W)5P-j{_h<76uFR>=^UB&7z|An}$|Ow)JP4jMeYJGm?aqqv5EC
z9!ppRS6(!9m&OLXY7h#=V+?nI$4w^Y5EjCMyo%gp`&^A@z3d?kO`U1SBStZ5;O^5v
zG7OB%TNg|4k^k_}o$XPReN`x~s9Y)`IKs%oyd-ydUSs6$GQrgrhcL&u-~fq7=#=k(
zCjhkGT%pZfmo6LBQ3>3;7T$X)$U1{`;niHkchEE9-VhJh2xlM>`kB9flJJu|)ioV?
z@hHZyMXJLa&zd2S2xD@p-4Gr_M=>YeYAS&9otTXB2vTza|Dd1h4O@hpt*hB7UN7@v
zgmbaB@{~>!=agsjcU{}p_pejLsvI~&MrcrXd}DTn2h3uRtyhM=sR8FmX@7YHVy^D^
zOFUZlg;$2lEzOa~gFGn7Q6Y+8IQH5(@&9|eDyMlG+;UPm>|j4B<ZfZ+9s+i!7wZ6&
z((F#^jX;UsyF|!cgUL<Thl>Xkz-<Ozpt2N#{TJ5!tblQn<MMm!@##8btxb~Sv)_@v
zQ?|>MZHpujo@We$JN(ltDs0Lb2^`8>xB#4y7%hRnjuV%jPfE2$-EmJS{U^fQfLF-j
zjVc6?TtB1~sMUE0_?fQj_19q71Ub9xTctbd*QH_m@>ZR({R*T31=!F?ER2*!T5sq2
ztqRk$u}nE?V8@;Vu!Ym5Pxo6>(3NAiDpb>H@Zz`vuM-J50}h*fteishn8t+}!UODE
z_Ny>}4ZCfJ&<J|k1Rx_y5?0;Gb7ALER~b}=7*>&rs8w>#Nd{`<t(Cw`2437YIHWhc
z*a$e0ZxI@Ortlaj<TQ87`NkdPqk&cHH_M~rUzK??zL8PG?k}HCRH0VG{q{>JJZl(U
z#Ouf0!bZ$3ElTXcmCq6MT1iVy6cenhhaB6C>?uu<!KrV)T1-KB(y0|QBqJ^y;E;(}
z0C275)j(XqiKDH;TOz!nW}Ds;fpn+}KtedhrGI8C5VlVDVc_1fK&S+=N9AgT^8~$h
zOyK=!gV2I>@L#3C%fJ-iZtf}C)YKBd5)7a+c!<x{P2<N(rU9nnC3guuI$DqaR{drw
zx_1-9D`JnXlbWMGEj4W?gajbd({{xf=Z36l6z?7*B@n!K2SGgCc+{K1P^Bn@N!>WJ
zPx0C~*J~{yAO=4<|089bUf%q>n1ers+*$;2N@F262_(hrCp|-)d|DPtAMEE<fDwKG
z=se&(NNyfA0pV=Dw{M|pDq0~+S8u64_)T#i^g7b7pOl1iJMr2j31@eTL+gP>tLzR-
zTf<v&(CpK<)N*<Ae1x>=`ckL&Xz&q@zNJiQ?nsTiCK;I5al_Dk7o5ZK%%=buZi9P`
z+g3Fif?VEOLY7SuOAlXh?e&yYYoPm`mS+D9>+bN{ulQ{zt6dt`+qFHb^!l^+tS=p2
z`5C0d@dzm{TR_gRpT_Nqp#dg@a&T|}N2ktvPysehPEImm!USpDxZoB2>MeVg_$V%{
z{Y6dAo}Gpu6`ya3*I$t;T(y3aoV##Y-z5upDL6YhBHIzUS-R=>SEP*%Tei!CV_#5R
z`u_6|W&GH(os27zE(+?4Ic@}Q&ALbuvJ%m=qxb@&#l}Wl>NY8U6{U10J#89~cnPaJ
ziDC&*iDbWJB}${&YAuX*X{<41qQSr?#TKbSPcEGzX)(B|S0VZS=Q;B8+y!Dzx1wB<
zoRT8F?&&OZfBZVvk@EexefNH`v9^|u?Ft6!gG0j=Si|1FF!2Kw8d=-xrb~SJj-v9l
zPOg`Ta|iVVyw(V#al#y9Vdnw>lvhjfh0nwUL+P`Ug7ms1=;R7(7QmaZ(+9+}O)ow8
zlDicXAk<b4&XNp%29k{vNHW1+dMs)Wv^*yrzh`Y)<-4sT`VDl4AW;h13cqkd(hX2t
zj))vLo-KRfVYnYwGu^QwoGeiwRt`SALGj*bpbh7fM5F`1aq&3%+FND4Vw;skXbi^(
zUliXVFM-H%L}lrArR^t)Rud5}SiM#6QUMf7LotaL4v1MbXBe%e_l$jg|5^}-uN7;A
z=h54O;#jAdw0&Wk`2G2b?Ehx0+D8zEnU*MZ`aB8{c^kavc1Q%W(s?mcRF8*b&*u*T
zunARV3iC$;ceS$ooL_h&+v3Z;MGuuW+3*}~o9~8o)B*u}$l*;$>5WiQcv9Cy{|Ve2
zoAs9BzA`+oG`86n+q$jQ%l*Cyl93Qy8qE}|PKH9+)oM_zb4%i+g!6k9h(!R6z@)kv
z;eMyv=4WnWmdCz~#3<EdYUl+CS^hDAus6h^rS7*_5`8I59ftQcmd{InMzE$ZnylJo
z@=fdQ>gp=rfB!wm_ZZWizm!H=?@Jr!N*Y|A9Wb$1b--r)>+ef^LP8D&6Zy5Zu@-MH
zPua0{iBz+_nIbPo!P|V;weOI;_P<Z0x|^%4UN{RzT*(;IM^E^PB}k9b5qh$G%?24a
z=3%T_=3dLZP3P`{!{*ku;?w<sDnC*JQ+$<_@J4!P=3@RmVc3)v+)f#rZfa(QRTh-x
zjXQ@=PX6at^dpzAT$7;S5V5zbhB?FrPnb6~Nxg=IGoY;E$j-e7<-sRkK-ij@Z25bk
zG;5syL!PU%qqJ<+SWftz6?=O-1!`BEkyO5(q+`W89<JBvsSF!57w^vZOSM`)k{%hV
z?)$td?nL;@GsE|4*`T#Jde)PG%?l(gGY#a%!2ny56nL6f{p4S1^~jrYb<aAvb^xh-
z@eC3j;3rr1u951EI)Fo=n#6}*Lw35A3J@~GZ`=mi?dlDCL7b2cimAJ=BAhBCK1vVh
zurCZNt<k!V_yVvcznCH=$2DQ?<R;ZzYKZ^(*^1+epbf7Tx}Qe}oRPo-n^dMcdi7Km
zNrGWZ0D-AujZ*p=AV8Q1Vrv(WYa0rmV;L^R5Gis{<TlI<%a--FA{%Zuv{ahqGwl6y
z&*fXUN2^}K7x_A9i1MDS33b%@?fELyh;sqSS}BJ0-Og*H)5N)2b^7;KPk*W3Hr(hx
zZJ*&s{dQsMV2bdBu&Zh=V`}DeE2gURtqQ@@rEjQ&Hq5Fyl~7H0UX8t1!#l6!4r*Y^
zb1m(8LDgj99(eWFXB4TgBd!If&JT$>7A(qJ%3FWsJ$_^Rh1WpQta=p;ZZy^luil&`
zU0s|MU_(%)Q~TBuAD;+=<c!3`#mU9XS7p-Vsq)pNcZ&sxFq_hu^A{u`F;Td>ZdXEp
z&07=3%i-gvBr!2bmjC{9vHF%%3sv(|20{R0ula-gGE#3i6nCTyQ?PcfiIAf@#jT>;
z&Pzm^+^EZ^5W>($@yy(=Bi4v(Cr6DLtSpVd^mgYI<~R+|WDt=aU-UIx*R3Qy9xGC4
zBNJ}3Obc3-#L3Z7euF2CMXqbUzE8#a{UjwPEAZFW)&?2Jkm;)cp$q8VjVol+ww=<u
zTW19Z6j0oF=r$Ulk;!X-#J;9h)!+@-N&J@ms4^wd`=%rS8v=&5o(-hM$XAd_Zk3o|
zH8TTzRH^W~$uFB6SHY{fdt;TcgIdAn?}8a*g7&UM-~7>6TS*MNCNbA9Dy-EKPb?1J
z4aLQ$nOxhqQLY_Y2V&$fES}~ZfrUNz0kA5bgFgrTv%uKxk;1!X+ddMzK0tZ%@Jzl4
zd<1O%Ln7gc<a6&B08jOAqgCVKyHNuq2&Fh0gwqi8+xN|rQm5A=ic2Z<_*SVXSyj_w
zLM1uqwA6U;qjLSas^#-ML%^q^XWBXef@ylWFl{x{c?a!XEtfX^Ce;B7TZ2^DC>37=
zOo?vatdBT#8YO17l?RZo_?k8Lu&gvtB*3Pk+<?kTIi=N3pYB~`&U9U<LimkHY1E;Q
zq##qq_C5RWxJlmpN>b>lvuxf^C0S*atScQHHWxPiE?L)4>&bJAGf;kemPlvo)cRg&
zIPmG>R8g+y*t*t~%l|Ev3;!;X`u#>D#Gqi{#@VNZG#vV(1mK*^<Y@3;q-PsnhQH&R
z1fc~FE_ZMT%rLB~WTq#J6~b^VoN7qjUJr?V6(cw|1(4p*x1P8<=M6+9B_+$zlYUay
z+e<uadgM^y#miSDG(1A?>DW%~kBo|zv;G&QafABeg8ELM^Or+MPpJ8+U8@$-wpH^S
z=W8EW?g)V0(C`~lqq>`T*YcEht(zCwV~~c=-h)T9YQ?Uat;EGAsJ`fT=Gq7e3zt0y
z4$IYR!SFV+h38H~Y1^`yKJJ&r1Fl|^>mi{kw2DO4yY?TFGv_Xd1H5;7V?OrsteLCU
zs`W9E+0xQe#3T#X2ttKOV3`~ff$&Ybi<it;O#yo_b4nJnhzQy+NkDKDylax8!lW9q
zz7-@H$w>fDvOpM){^8Q6w?g>Y1FCQQ%w-~mPw}0AP6pZtJH1De!UEwTbQ5smtiddD
z<Xf<J&pU+990Z~^9<{{`UXdB#3ed)%1<)rM?V157A`zq!uqo&pyL*qN#OOR1`K)zj
z={Lg6F4d4JiU|jp4aqgMll=F;0Z1JmpD$2Zmf9nCjeYZe%JZiz+pS7%xi!5<uKu@J
z4*&R)%96y)S2f!YKq~R_1;Hwcj&ESDCijqI?TQ!5PaS39e&>u#TO~!*92ax}_o(O+
zCk0N$q6)(bNk&Y*C!-iOV5os20XD|8-iE3xnQeDh7a7>Em;4QW8@d1(0xk@n`f=8L
zS+RD5(CFfmZ0GiE<onM*fFV;&b%4ePU)ocra_`22XDR?73hOh><NnU1$;w!n@a$M=
zSl>s!o<37fo<2wC0~PkP6`=|=>Rx>FL%A4mMb*JSiD-Z6Z!=(w<-MAq^_5{$$yiCx
z-PiqxkIDO=eT$WHQ&}<pms<=u_WPx`{!bZ}|M%7_N+)cWVHDG6{VslI&Z`G@8j;UG
z`KUZPau^RQNkrD7$Dey$t_O$8vfqD_UHcBo%z29>48|h|MvkBr^MBUsOgpb6-%ZUd
z#JOHeNq{k6rda^RXn@~?72Jj^`ifIQLu+*ZI0^sm1v&NCcXIJIzzq$&S{?2aS7d|<
zIf__z5E3RJ1i~yU6+daF;)XGXxP?qjr}-I|RGen;;WuWES5_9xJ4>vn*QhOSND=JO
zqAN1cI4WbXs(INI^nHB%^)y+yY?WA9S&ILm|MW$pqGP1jkVn+D`ootW$peG$ld&&O
zRKQD9f*!4!$;!2xBsdhA&!B(KBeSM{AtQ$l($~Q-+Bg623)#4J2LO>U6<)(Rhv1R5
zwUzANupHibiL!O)UfHr^kE$mP+$MVfm>fTKlfZD~(1GguT()Yxyz$}ZDr}04uxzs?
z4P@i8`T8~uH<qkiD_?&96GFof7J_+zZP)auE<Sa<W&M)5`q0oG_dg^_$tm*oE8`Wo
zbL`Yv%nuPtCn-n+?YC!>)UEAhSap@!W>ynZ6Wl8}s_bjY@LrR9usp`^TobJ<_u-IM
zg?3o~o&`XNLhyxRD(OP6yW5GSor3~(GC*!`W^N^M@Twv4B5MJRBlgv6;Zk;hQ5-JS
zK!8qXUxGHKCb_}f?3UR{7Rp2D)njIYN1vO+%Pz$oI43IupfO^ljAGP49vX0M+zG~%
zlWcppKfJhxBK&Ev@(!~Ai7mz21>i5PlhoLVatCZ^s4_cLt;eV2F%sjh!fJp9G+!i)
zC17U@uRx>R)Bw4BNXDICDB8`E<+DZasFDI}ID$(XW`lES54f6kl<0s+!0op{M+{!K
z@8cy}x3RLyuK@+v1Ox;~>(;Gh#*7&<a^%Q-M^zeWz4LACE;+!}?GvZZs?m~&Q+qI`
zAvEgAm*l|F<B|@e#Tf=rTztGNTE1FV{j*sv!0_VgaOZm;kc5OJiG=Y*;c9fJ{=@Ou
zse4$xffe&@s~1YsMmoL-8dm<70_5u-W(rrPV`AeJ31}MHGsA=IzQadl#NYw4Zu2&Y
zfcK9kZ0q=`Gg70^t$<CAz9O|UiIj8ql_3t70<H=@irDtY@4l{8t=`ve+$t;AZNjR!
zg&xdVzxh9T<=u~9FouhxgS`r;xO^p0o_*~-1>TGvp^M2TFmvqWX}J*<B?Cu2DfAME
z#<<AqK_iYvUkK{(t)~OIax`2*AL#P$+rNA!SQ<q8e|fuvMp81>(Ac6Rfy1I8;3g8`
zQ!!W0NWFfKiBIo`#0M*s@!(^KMF>Pf@FhvW*piV+hO3oXcvwn9=$S4%gU;Gg85$7h
z!HgZudShYlAS6_+=H>}P$hz>RsV}xJ9yldac@+3>_(Oq1ZjE#vB_%W3@~wr}AAj?4
zaXOu|H&)>AsOh1*RvBi(d7xh1+BrH(UMlj#TnP-4D6r8hfuYN5haM~BucA0RIUv*$
zSvv@Ld^A~l+|x;MWznb|JbIk$M>r;d*jfO3n>T4Fp<xjc7I8zp*sn*QeN}~Ps>-te
zyba*kQ0VQ#a8QE91bp29WXEDW(J`^GyXjYPs~k9TT!BSwgVL>Y2ecWXuJr=|h#wjE
ziY%EkU4>KGf#-)hnDo^&HOG>di(olD8wuFF{LV+RcF~+$8>u3D65xqaSTc0pgP7(z
z89*BiK7O`fT3fuQ!4t+3yfUeYaruHahAQJ?Lc)z8!(Dl9J0LR@xhfPOWNs<ZmyUzi
zX0@1Rq>7za6Y;)h5D1c;l(FQ5w7Mn$$ZG(A4TSNO9vg;53thEpR=|9p46mM~NPs);
zp0~6|P95@TWRc|90JI^#!+FHEW<#-u2aZvU8puln4DIPRbvHaMQpG$wMYaieq4a5}
zF)#A>seqfjDk#H!3Fmf;g^QP1y45MeR;zAP<lL!@U=2g|=~bzvCoj%7#Ah&iCldT9
zu4I5K%oNv3es!>)oP#L@$0`yJRB^{#l=EtK)Gdb9>@c7xry0vuK@IS^iy5N$EU$?I
zZ1~{K^ie6`J}F2V41HOxP8U?hc<lBXppoEr)?a0JY1?bCo}b~B@lWbcCMZE(8j=t{
zGJ3F#9X(Q(t^P-Tn)?UBM$%;F?+fLvm&dCR1OhFV4DN>zoS<Q)NhTQ532115jg}tl
z+=WYG1F~bvS0BA2AAd6q{5px+X|itdT;=VOfPG(1{aLlCKbUKyuze+o=;r@+!DDEn
zy!zZzIl>%%oc%itv^W*A(7j6s6~Zv;sTWmCb-ZiI^shb^dw3PS_|}KY`1@+=FUYLb
zUEExBt6Btl$YXE`fDSn_S~YJ11FpTyU%V2$J9)3P<{HKwedNPiT<~RFAF=31@vFi$
zs&nagt`5*4Z<qeuwP(UwNkMo+MHUUXVYpQLai5EgQ#SC2mB{e@Ya~)-Xz2?V)3(U!
zR6_wSrfqt{NHkTe-2`h=8Qw%A3jhSYZYaF*o5PdC1ZjCKY;2X=Hzzvk!~}I`z~GBP
zh(qL=!xC~5DM!;1r7D3n)B(YiA)}wsgT34r58(E{HH)RVJT@edbphwrNAPxgY}9a>
zF?+sz^wm`8*+c@bT~~n3-vC%OFPVY;ddr+2ChNnH2+W>3b542jJ^J8K1pw0+_d9!D
zmGN+Q6L&Wq;a@sH-huslvD?zMQ+o+Mb3knme|)@b+qF+^=l+w1-@pqK-&a6YeE?C5
z0nBJ~+&u#xRP*bBBgd3i&%M37>rZEhXT7@KGH2RXD!hvxMh6k{6@Yo8s!ArjRuT~6
zqq}Ad5Q;noOj2J9M^~xdteXTM+XgQe0A@I)dh@Q5g1L?SRMnAPg)Z>P080!3k36b_
zQJW!2496nyQ^12hiGiyl%bq3<ATB0QYmyi(?g%~bz%d%dhT`4jesOQoQLb!TDuIVL
zX3x9mEauSExCjZ@u}qqPoLCVKXP-!2!~?9ket0wHh@43lteriiexK3e-uxb9!7Dv*
z-*5~iu}!kpG-T$f=&7YkVyqRV4jP?&X<~=4C>`;0JTi7&634pD6nC0-yu99Hj;t0E
ztQzI+)BwFePR^eM9<VD)0nFf4f6%i+?~T(-CQBIR_%81)0ul60^4;qoe?Plyib^j{
zLfrGKew54L>)|3CfyinAv)jHn9if2rRdzat@uVlmtIU9r@Q~KTrNPZbv6z5Ua(4N5
z;0MFK9rppRdxlH1N8iWXY$-cG8is6Pk4eDR1(J*fKBm4thq6%@j!4U=C&RO8uvTS-
zf9Eq!CV?g{aO5FeI80AY(35NDE<)06hE<k?WME+;zkZZN{l+><R|9r-b`pUFNW%!3
zn|GW-v|So$y*s=%3lDSYl_ou6A=Gr+BFyOYz?kRs;RCh3Jmp6K5)4tIL_|iZ6>hGK
z59rcfzWwxlwZBEvM)LQ%jdB6J6C3{Bt^k|e|14GE06)T@S_vS8tKoBg_(~4~F(XU+
zHZ9fphJP5Y@c!#B$!jk>tvD<u|L_YyyEuIju9Wk29HhuhKTeP+FQH+^)%d*nx)OaQ
zM~2qdm&QFIM^2nlAr=gsdiDu~V?fAR;eRnedC|O#GBmgsAcTYOH0<X8G(|s#DbU5k
z&%CS*HG2H??QxI3TLd26T%Bdo+poz}kBw4<rSliBP%HKNLZ!5knnVtpKO`yOsHENr
zU;}Hz2H^p&Z3jq$`<^JJ-j;o}G}dah?=SWHK5`SRVK?v{r@`t=4h@h?8|TP{EejAD
zQAZqW`6{j%8@C!_4JLn67*Lil>Y$ukI*)rKmSfT+6%P#=Q6Z8T6)wpUAqqf?z3#6<
zGE6g)L28T?!U%~f*krw>`bx1w7pekFRTJoy*H3Z91zDOHCN-dMPgMmuZs=u~ig_Rw
zo_>@if3H>77DI`CnEa6*tl=?wuk`MwGr-??X`Jvy0^uiLdQ*iV&6+k@+O%lOqPK{a
z;jW-;bmuW&XaMt=hezna8dkP?;cV#&(B|6p5Lvr%ix>hnbuibioIg_^{>0Eq0yb4y
z(lIwB;hJE0VL`tL9<y<FQxDVD;C~78+X;>rJYVDC(;Ec7m$v^U7VxBUZPXU!sw38Z
zjU+@y<a<3aScx7s$<YzW6qN`-RhI##FuEogxlhkgxU7@J4)Z~7u!eQ;Vc!PfC!Spq
zl5%>#qygL^fW*9WOamTv{6EDv!HigT)x9u3BuJ$HQ3>3)R_9@(O#~RYIaYP;k#(wi
ztM2e7vMo#(D@>VA6RWOgScOsYZ8}2Zwb28w$kCZ^;P)OTzJp)5%^9VCI5qN`q=sD<
zyT&&G>(X!4*g{3oKqf*)PyF`2@>*;)4mJViwYb2u0B77(7nxf9^2Xm37}I#<M18j}
zZ~k3*juEVh556e=tEMY*<=Wjx3c;D!tEZKx4No{W>un(zLkT;vUA@!?{24U+v;yfF
zj(cG0cmT?F(scCu>U{D6@j0*FfTtxs<g%Rl^J8(U*GhTS?4R<qn%6DtoH2)Qtq_0>
z7aT8dny1E>jLd{wfUwLCf#i4zj`%J73~ArDLPt?*EUm|V4REWDQU~`PojFl%oY|+&
zHOIZsrC~ei@ajx;JQykC&n)>$ZSzl?=cb5r{nq-=+D3%m9=W=6DZ;V#Dvv4F<K1JF
zG#K)Noc#SmMey%)?~@9Qi@AIf1p5u8{e+*y_BI@HTK&fNimibn0XC(P*4w#$tBS3m
zQs^CxD~1fw_%Sy(lUB`|NUv_4^(~RSlbkU$ShnvzAgy~2(jTJ{LJ37U6NTiSd=Ug9
zV8e6hU7~T^s6u)CY2Cc3yzunn%BZ7pMem-g2#qi_Zt^(omR$^+$gi(Kx%$d%FYGJB
zmuCO5M8-ZcLK%5K&;3(@Mok*}>bYzFg(nX6#H?52UVB&HZfq=!MHr$CZ@7+>#)d)z
z^>KIu5UineM~KAJ*mi{%4!v|rQ_RdQ)QW=%QrTK&^EeczJ&wWB+D2>(>0QG%Nc7w5
ze|d9!6sHe&dQKL+x(?6%KdfY5RX1!sP=gih{DclOjA}5+Oh$H?bCMK%POihCVyJ_u
z6$pbZZ4rZ94c802X%Nmr9ttHeLNnn;n+{^(v;+V)AXa6l1MEum+s0wVf0K^73Nlvn
z>sMviPauUJaRgR1p(h=|&f*G*do{3zb(lh-oLe&Sppud8-E`s76;(Ysq8J8QmO@?~
z0ygv#)PQcSeR|zlkysbP@J~Z|^3jocu!j4|>qEiMqsmGmJYg~bW~xCJa1of}H{;#)
z0dcI;SkC-4MXi{c;;L~3Hy55VCHnjktR5!HmCb)j!{IL}eO(5?nwHI%mX`uK7o;KG
zbV^KQkpLUkWsi`?+X?3ZYscyUky=am2?8`cgHVwP0GcET#lBF#y^3>$^F&5+3_Oj%
zQG=KEopX%V2)A-;(5BLXHMi4`@p##3p#GroQnw!#oN{^JlwA*Uwv_0<U+kLoR$dV~
zj~GAQ4H{sG9{G0Y{pH%YGeD3UQWGGJCN92h#idb4<=Ikiz%wd)X6)6o5`FO)$do6k
zV)PcH5L|I<-aR{9=|Q!Rf0&Y;UL)H-7=$)DN%O})(jU`2Dg*xgL)}Z-z5JuFO-lHw
zT@ti!jRI`=nQ78Hzco*GfA)~XT{|xwU!SEw2Zpbfw{WrH;I!u@0l*T$5QfBE*}4$m
z2skn!9Jee*k^lfe07*naR6oI(aKByR(|@c2axSc$2{7wT>H5J^RmOkyPZHs`TN*y_
zD(<h%louXJ$~7TbbG`eXQe(fmeF>gvQ?x_+_oxd;(U0+B<L0dZ8tV7-;xF}4FNqOB
zLXajLUR4g>jnUR?;=g)^D#MiYMydQ7xcP)%n6WUlBp*J3!knI0nG0)w0jin=;<h0`
z1AX%<QswrMIQY}|C+fK!$i;B@*hyqnX`#kSGEjyhG0caaFx=LJh7rRO=!J79;)7Lj
z)=gpf14)RBBSq;eSI(as`zUxPK38B1Nk|#8vG33^u|}NUlL-6L!n9Z~g<KPc<0n@J
zL!)d^UNaoEesdhH07PlRy1w|ZY`9&>VbgHHlR6HDJMe5^-*54j&<2#xyD7$Pt%Vrn
zQ>H9;U*54o62gPTtK$HjM@<1hP40ftTZZ6@0BF&KE~cq?nIuH2UAfh(56i%LJe73-
zSAZFoB}|ddl;K(Q5aYorC<OT&9pRM)o~yh>^R&_4wKDw7-<qLl_IzeGD5D)y<xo`V
zmM9p6V6#qg){(ulRNwUdM$>r_#OkSNb9IfpJ%*y4tFO=SU=`UWv9}3A19gyPE`?-|
zQQg{MXxf0#Hz7P&d8}muc;?*V-LAic;vq0A9eiN?>H$h8MTDx5O=X;#q~;$Qg*r?C
zq9)_v)~-gK($OeEq4?aKIy%rM10lkKR|c~9QAmo+dBIQ%Y8xJU3}>y3auBQ6TnYCb
z@{)LW8&MgDP-XgDkvKOp;BjV(H1<ZhJ2k*?m^ui3q8H7!clwG4Qjpi_HCmAaYZ{?v
z#{O@g5_;7%0+?`R+d>suNiuDUYm+Vt@L@<)(B4&2>z-jMoXQsW35phmNiIQ#o-(8-
zw`gHfrx$*qKa>UzG-mtL#HZgF<uS?o3He)WTs_rdA0}_DNV&aVSo5>;OlteWRP=42
z>PHkpzZh;tiN1USo;6#fZvU~Oc`A_{|I)^}k`Q(kU{`Gw>P6d`UNg)%mOEO7AP~dU
zZk*jO1Z?t>W3%5D6L^(&`*5k4XM376OP!&lCB}+Zw+BJ~tkX5a$`Zl?42u}IE3pO?
zU{lzK)zV1o%^x*Wcsc-eyjuVprmE$t@T7NMlb7E9P^FuF=i{%`Dmhnt3CdJM8S>FE
zWJwDxF#Mfq{14hbLu1TvTRUD_?}mMS{e@?8cnWE48uoSg{rAeZGiIq!DQ3W8*cH?5
zGOXg^5jSI1wH14kqAs32U8^d`JI}390t2`tbYBv6l$Tx-BSV!-c#n7HAZ#LkkD8+N
zk060Estm2H+f+c{!5p4SwK@(|{kXV!0m3_I)D@wU+q6+x4qE^yrI7c<P~Jjzr;xDX
zb00Ak_9<j<W6ErL)7A2<VOaew+XQ&XC&l#1T$Q>L@vPwiFG5>IO6-3*AV*aMv$ZUF
zzV+(nICeLFu!Lutg)Oq9rD8=-p`98mcT*b#Ju~nC?T?i~-@(s{2Oijy5aMYC?>*ZZ
z-g0)`EX5IHg=@;A{U9*~5bFQWZ1vEs2TX5Phb_*9+<_2JCl{6ZDaYXw`oP~&(v9m9
zg_Yr3e^Lg(jQ+AW*r)XY#}WbfL|*m-$Q*}kRJR%(TG5L5o)m=)X&`D($NXlLve7^?
zbRG|4eCLMk^(3kJwR~;QD&>9a2(s+56l<?$5`AEKSvF~GtAc5u>BAuM2azqkT!Ig7
zP}$7t0vu`f=m)B&1P`3xK^gGxe5u{@A?5W#&{qRuxDeU><5dz2UK@Iq5d68aZIRFx
zbZ_3RP@|=1Bh#Sg=4R16a9D|@y{o=1Tld=f?TWBLz{!jpYXH3Rk|_TpYIo?7&7y5H
z1d76Y69Jn#eIHX^MFhtjYBv?{?hmR^CNm4&qPZ$uz#no{CIbAa*<p|#tjVjmjcYBv
zcNC8^HMr&_l~;M=zKW{>ateR&!3Xl-gAYp2o;_7ZRa}9OkB=g^88u25N|N6YnAZE+
zp1<=uY}{W&4Gg}oj{-OtYH$*nqJEvfNY&7`RdaCw;Sj^7X3YLW$X#RjYSy@c-XPJM
zr13&w`frku8j5DT815^nZNt8jN5`<A+|J!shHpGFVu)IuKXd*9GDB@tT^Tx{pW?mH
z`qi&jHx+_Gj+}_d$Xn`lp{J3~BG67Lm-n*hgWlFCmk}1NQIZKa8Tx#o!J1o5$D*~D
zUuo)$>4Dwhrc07xD?5bjps}*}zVho+dF|H#Q-%>S;~F!keen4dS&vL`nukeo`o`<n
z1ztT&=iRVlAC+}ZtB39E+ILX<sNOlJStGoS8L8HQTSgORt2=$pU;B8=JNw8?SbS;H
zuzp>sQC&w|J^A~ebDXaOqTmXSIdRB<zS=2w?Yli(;yu70W$)pQP(d?*pP6|Aml?Qd
zl9AELf6cFA1%SuY+EyIB8cEc}lad-8szM7*5Hru~%Kx9aSTzjE)3b)4C|}m#opP?*
zL_9hSK|Q4juA7PlfF#^TRVbt-9KS5^;^(}Cw+)6&s&aTY1*<YaO-m5`8^x%B!e}7u
z<PO<C<tcqwM1JRRG4eQ8#u>U$)?!_&iKJXVo9DG&)_pOySAH6B@@XlppZ!L9f4v1E
zP#qNDLQf1$$hSm7;eB5{4o}2H5CA`_9a8Tk*QUqKJ?}4;F7GbDd}*dUatsR*7+_|;
zyoBV#1TZ{W_m$e<ThU&X#Tzi@ik~<)Xq$sXJSFyqeyAA;!Kcu(g`gB)zJs5a7EgYr
zz#1NNgQpVp&%`|`u@NeDH_4W@Y^p3%kgyLFrcT#{-(l|1DJw^}900PS4!8>!DK#Bc
z=6Bld)2C0D!-o&+hoP2U2^cszIpugD)|W8YFsAi3P(}%De*XTOa^$$5N_kB#mqGn{
zsW71-1N+J^zb#OilStJ0{8Nvq8}G4Gr)BP+e<?%j@V2%3UeH5@ArVZ|J?6RB<;(wj
zTcy?gVdgyP-@BX8`{hm~6BqsA<0qA8470M_mrX`WzKEjsb<9J<<qwbnUk$phcsH01
zSmT}1`ZyZK;O~o;DMIBj&%dDvP<`rnE5hQ{8@9-TrGLx%CBF$XN|lf3R%$b0<z%GZ
z8gE)sePSjPW;?1ZppBkerjQCS0}-7G!Y)j+IVDPRq)a`0X61CXA`u^cUFnfTr4}$m
z?<Q%|sDa|NB2d%3>%HRP<|e^mVJhvt1@vwRgcL<DBL?3mf3M%9NX66fJMA@Ov^XO)
ziv;9x$Wldb8WI3&95YNSPQaGH5$8H)!DEIf5|h)wzkF<Gj^?%B{3&FXYT13DMBIpy
z1v96r`Hal@AHhR$?28i>0r|jDPpYg>TX*giN3_8UhVw<go?Ua)c{hGA1D{X*K97ha
zGA{-0U8lm6@&hgz@|1~HLBAE#5dwt_YapqNMrJ5}KlG$Y0fF!tc;R5u%M+}je)&9M
z<5XQ7YP6MFodydtK9!bmzG3}M9+)5(*8VD4rsm>|6=M^4bCH-a2_ApBJ%G5X>EPK=
zoB$>zf=n|0nm=Ox8;S3|;2*HXZ^tM`4U~`uXvnsC{(F#*)-9nL3tx>HKv%xfBCd#~
zd)c>N_?{X|mWBpGkN>BLa_ay<Ac1fSvhI<9o<y~VB<|H)^~Ui=;7>WHxNhuf*4KB(
zZ_yVD6rh)mCCG~DS;o}dhJ?E;%=t3}nfF4EZb3O$MfmOoPaS%fc=s47fxA}-LpK|b
zdQ*9QFr<hCyyUg1=wfDJt<SQ>z6S1GCgA{VnN^VD(xAP1x5hn>U{ro$1-&#JK0$#w
z7uNj(GUp$KWW$94u1vE%aT1Z?kfQPC;KrO^bH@EuPy;$&`9coNnAW?Hipr;$wwg_Y
zMiYh=Onh;i{O_}G<O)cCnIe13-wRZxqklI4hfF8IvUJsY*#<*|9s-e3G0IDzMUzHa
z73#f5myXf^VOGp|vIkk09(dw;r1wr%#GK6dq6zm=4EvxR%kMoU1u3iH?eqDR8L9}w
zm9Cvaf3k&HnbvRG25==r-&al}<e{Nqkh`xW9`4z#ll-w{r3(8Zr%!`=b+zi$JB_;;
zUw<mY$Bb9?jDP)qVsBSXjfaLOL&h|(BA$>8_c0n3WhHEi>G`gJuO-CMg)?ZWG);oc
z`0&6=1K1Q*2`=@TiANi7WPn|t+2Yb*z>A)=xw!BRc`6_(T;dvjgII9~A+MR0lX7cy
zKt_+MAXW%VaYgEFf+NfZm!A*>Ca}qDZUl5g!y}|NuE7r`zAUeQ@R{O`a&mA`r)R>t
zCGeX;5+DPywXsp2dn6qu=t3c9)E_^8Cr?j!8+9L%u<&pR1PIG(o*r;k;F;1w8(E&-
zI17HAD((9Wg%O=4JN6t<W!>FerFZu(ERsVQIz>R3oL#);87>-l{kpzPADr{+_g}~x
z7z4o^W}#x+<iqNAZwHkvkKh4?I%50ezcLi=WBItac*EUQZkwy5)v-FqY&PMi55UFS
zT6c})F;aTkkn@JKsrG=#eH4-i6RgR9s?AbarI-!Q*{5t$8=E4-ldErQaTxa*02@oO
zMo3d8<`VBtgOs5VbYO#UTH!oEAgNxTQAktXL#>!{&f%&uJ^-x2HNZkfsWKYKKsbgO
zejk(!@SqikV}{Qa{EcW~B6%r??eH4QYr%rXZeiqhX?RI~YF@+)W>&SDN^;O?BVbdQ
zFQAH*u>}uICP4S&bKb*mU*~mC?voZ{Kgsbs;ysh$P<{(O1rN)Z99kgY!Vsvd$PlPK
z<C4U<5eRJ!rQxtw6tI72`ip9}MKvezk`7keB-w5I!Zh*w^Ap+s%~-Y1u4X-9ma5!h
z3cy_pmD1jGmnrMd&bYTQ<KXGVlhrdSGh7k$(!>e8Gz@n<4RDM1B6>8%hg_1t9ZLaF
zy{+!KJ0}fCwyUAw1nQ)~veY<T$dn~AVdW)JAb#e2MIeo2(FDXyanBCiwM@*x6U4=c
zxS;d8Q;oN*yi`~v_Z11S$xW10B{fotgX)76)YpPS<iR02;wr5vW-j5X^Hz}X)~r!o
z8B}!lKeTnVOoNBa3Z%eRsdVw+(Ac-W4C>!oo*DCycDi~e!R|kQ{iXmPrn~0KHI1dN
z9ox!Rlit;reQ@YNIRt{^+<nj&$hF~9+gk{z7_P!I>yn|6y!i08HMjJ&NrSxm%5%T^
z=v~Eq!G2Cd`ry2To<Rh!7#7CNQZyFWHq(?phIG7bS~gRsF&hp6t3dE*bjN#{2ySwj
zAhL}@CI;A(r6#nK$jy+yfmCWumr2E3y=XGxWe~A-meAwdCF;r<EaS%`lZ!3{hG~Jh
zn!v0t1*=&H?yw9Ee1<rXFqI^27RUhOSf_>5Xx#%wWOHTIm&xEtxsgxadqW<8mkZ|#
zM~9ma5P3Db^tTzZ8JXA4`d?Ha2mu@drwnN%fWx%il=(kTQDqwA+BFn<$!uQnhvLD}
zt~(wlATn>px9VCZc{;P$5oGbIRYN+oX{A6`!+MwrF7V_YmDMibYM=sMTQ+Sh9on`s
zET*=#z8D_p)ULJRN0n8M{n-n^=*qS0XwMd5m<^>Z_AyhICOg;trMR+kpFeD1e_69=
z_8n!^(%PuV?=(6IFq4R~M(dtPd!3*_GhQ#*SWJ%YYx9i;)EFMrjv4OLwn^wq1Hb_Z
z1n7B44?!B4+*g`HqukWVL*I^>Scn}`lY4f&U&2lv6pNHd1<KfaH4u-My^*m>1MaL;
zx?A?GwEI|^<2TlQQv(b&sMF^$mHj3e9#kD(`&G^@|4vB2+4AYh`ZU2INB@<e-G562
zR{9CF&<LwPaGccXJz7=9kOLZFA>gK9=z<l%K9YvEd+8>p9z&j(jyLr9HULA`%7cKb
z>@<{jd^kk?{#hAAN=WKzD1}YKOYRUF%{0)+1=4i%|Fd@$@KK!2d*Z~6;3R<rcXux}
zN}-fe_fl%me$@V7+pq40x>IONy-=gH6fN%V7F<J!yYZiAE_=BgcgaOA0yFt-*4};P
z*}c8nXJ?-IuUyxbb=h04C4|i`3h3w<X=JY+-Cpw$fLBfL|9&sOpO88m*Eqy{t#woI
z-Ee|6YWy1Vy^+I~EDb`qm_Qb$v3Cau26&cO-z$+edf=;b2$_m<IU^ywbU<JlR=2}I
z!h||N8o}Gduq!@ny=7D!P1`LT2r@VX3qELYcXxMp3GVI=gS$iU-~{*J7Tf{^cXxL^
zllytUbHC47->+V?)~xQX>bh+2U3D#6(Mm6*)J`9+Nez5Wnb3*x6t3eC^1!(dSLb-q
zP|nC*Z4`eBIVW5(X7^#u8D{dE`^vi+2tw2i1+a*Qpj=$G`T6znVtD}noN^Ae$3h1e
z_P)Z0x}3y##bK=E^EA9>?(gdF=~PqQdbr@ydB5QfEQ*Y5<vO<4LL4_qnizLYSYtur
z+d7`<ezJy_&18=WMZ^)N)5f@6slktBnf98*Th|i}<GD`DGaca?bsKGKzf5|s*_d0O
zZP`zmHJg37QZE@a=m&IHy3A-yDxWPDWQ`Ba6~sDs_h1*67*MjA-Oq`y(mTtO{>huW
zssBRt_`omC-IU806<gyb&TDE)mV}@T+jg<+Ek&e;;U3SmudA6E96_hy2fV#N0_JXT
z@8Hczg2q1Li8&vwGlq#{*B^XYx}VelHB<QJG*!->D~jn-UUsX?t5`ZE5Il{X@4qTK
zH4xI3fO}X&@Cu$8qis58St9AHUI4<E+af~3XC95!m`p~v-h71Di{-EBU)ZOTT)*lL
z)8!$H={Y5tpi-TG9&z$PMxe_5dfq{Xg)xvh%y`Ef#33)X*!j~yWvrKoJQIF;T0NvP
z!-oT5;|$yVdEixCLkzoIEz^0RasNDs7fa<7h@uX7zd$Zi02&Hw^%cytG*h`9f09q&
ziCx!i{sf^2@;rHal(TX?6^$fhmyeZ*+$`+lG3ASocq2nbf|>wqbN1R#Hv8U2$8$c|
z*{z&&bN_rJl6vL2d1X6^*(N1J2w3EEt}~gpbU(fpbI@jaq?hWW(T~as<%pi4AVspz
zc6%L`?DLL>E22}$#h9G(%BIini}KGiIh*O$*#AVBC{s6<<W1!^cZ|Vrr!6Js`YskK
z$Q;(Tx4#!oI1VRYyBecnxxJ*qLj>XDU!2V?+Ijm8<5@2?`x|AeI#9Jj3XFcoGao!|
z_<<axB#;Vmk3?R%EF(UB%@`xL8O`bVrp=NNOsivsjRi?XMTLQdC7$#}p*RBl%g6=@
zGA1f22}z|yo-VZpO(O_i{&@8?f$C*9eKfk_dTWKDVy3j9Od4uMbA|c)BwNKtH2drE
z2A1bgjz6dn9r5F^T9zK=^PK`+rH0iX{OU9M&~Gf9JbO{BeLQ=wVHi&JGD-u*!({QR
z4WfufR<y#tH&kt7GZ%BSiwUl^Gbtqzj*2=5depm15?r}Kvf{vfDN=X8bGk-xh^BNE
z<|vdtP-8puOp%?iDkwiby*!vLKND`WUY`*F3FZa5NO3i#wO;ofOyugDD+D6Gbz~@H
zmhj3?WgUzc@~*{`;=_Srj0QEvKh>4|xm8e}89hrJ2g+6;**8D)-$%7Wgx&YfG30I~
z-w$%3%gO|qL)xs<K64WQ6C!2$+V<z0f6+kd^Id2Lge^p-RTZGWKz{01mfBO}h;;g-
zg`dSorYnOZuco}(+GR#sbC+FPA%!(MZ$)F}zyCve4#Sx{-xm;9lsJ~u@snwh#p4Uk
z635-h!V+>2*IxA`rOyTuM)%~0c+>?x=R}XI*<+tK-(huv)=D$t4^n|rNff`k13!)v
zVD}DSp<B=!)ow&Lto11ExAp3<Y7s|;%6wj_|AP^D1>Bf8d_8ifI%3z(dAiYj25fXf
zr76n-9jW^!b~A2@D)eMVr`bDqkotmy8fofk74{<o>e0Gy5m9DtN}G~1Rk+rJ&nobC
zRla;*;7FVxY_2~Z+{fKJ(mzN&J7I5pOGN9&GhgxF)KlqN-WB#rKRe{wA`e!iu(0|3
z#6HJHLAXMZiF<=@*YRV>Yp~WHUMo0;a7c70)!>4FgogZuh8~GQ8FD*@x4~Jx(<!*D
z7_yT0#JQi*tlDdwGO1qdk@fIoh**1%L@4iGMIdq>CS1JnC?<fxdxrQUM&0;sO&GFh
zcyIxaN?4l#wte=|s`sg$7OJ4+I|vS4)4%?rIRuqGRz0*~jq6bAlgj=96M4$Az_SWk
zztxm+3y2|EwUhQ4X`TgCUrGfT89-u)0<leK)K9ofvp?iE`2nkdzNVs(Q=ZQ5eLPA@
z{_oVFUX-l{FqWy|LuN>s7ctAog+~5Zt^F47OMYvDD2C!cl^;zS`$xN8#`6i=%H#nQ
zf{hcMK*CWWX9UAlxYTIsS@A6T3pC?3Z)d?j7Sh2dWBsdWGlYW*QTwwi52mlw&ZuZ<
zf!TEJVi_o=AV807*N3)hHOgd&%`JTjDkzPhePV_S4h|GfX8@R62(%oO2@xy<;F%ZR
z@-w=Bvsi$tNo)~7z~t^jbqC0Bc`DL-Nbp5w{l>0TK~sb(XMh~`i3@miM0D~*qQ57k
zoetw5xrA+sLbdihp54ZT5X<ud1`ticRm6N0VUH`XL%i#i6mX92lTaxyM_?=0BNd~E
zQZxe8uHHNv*CC$bX-d}9yLkL|rybx9`-aqI(4=-JAn>*tIaTFDVHYWbt*hK+#bzZo
zocT^wmVTxIg%M~K`yod!;it^$mZ%^A@8!aw-^xnc9x&chmpG|B{ksDLL*G@P3cp8d
zloB#haF;Zoc~?rpO{UM|hZY*vToZ%P)cNdO5yqmuiI{4c>)-#d2?95}+0o)fHGrRg
zsI#B~B5l4bsv=LkYxjpF(7|gH){H%<Frye>s&&CAkw8Yrd!ce_Rp_J*9l9m36*s`>
z;T<Rfy%DG1xUHso7Qt=X8n&O)v=%%XOpdu4{pgPkXN_&Mc?im32-$1>GwLQdT>`L_
zp)erC1kp;JpyE-ffxzyp%UMi5czF2lm)nCXqp5UJr@(11Qa&TO`VZ<G5+mFTf&Ttg
zmaFq`)ZiB;2Rb+mBU(c1Ga1<;tnQA^xOluXIeCzj&<NCf>v@(>8~^<fxWqN?XD)|w
z4ys>DJYh8oHs^+_T3TB(RaS9ZO@^vKHi{V$C1Ne;gtUCQFQM($9N!V;KO&1r+QbcZ
z?Nuo2WiUPlsCW3W*zPoRIPz$W_!ZD=Q9bN$nF){`jWrd4rr2gpE$40xSEqDEf0}6s
zNXpT7B*oIdr^HwJjAu4G?v)cHRu0tVY^AQgTG#K1(T&6k=<71AmH@z$9zdcfhsszd
z>ib}nZ_!bBEB+qu`fG^LsJe@dt&(HF*{P5BvG<o#8jnF<jXLHv48d&~*t`VC#Xnf~
zYxv&~aS!(HRN6l<yi0Z#^umA|+8lXOGwTv%J*pRIAu;Dl)eFH-kr&yRs#~|X&&`#2
z1&>jET8yW%_7k=K2+9>z*7xSy7zL%I{N^-8ZFf9?U^OiRO^i=3E?%b1M1l}C-5n!>
zMVN-xolv2HJfExJ^kb@6``au7L!$k){?58x={VDoIQR=Hf|uk`aDdQ)X7Mc+3SL;-
z!HA~|4QFL@pKV&b;VXSwoku1WtJNrqeNE1IpwnDw7!71(cSwMsxG=5l%M&!Qb)GvW
z(?c;lfqG_U4hhG^O~SC<Jzl3zP92v>#5a;Wz^p8kyv<XZ+vJ-t_j=8JI5oMo6-CgW
zf_Z&fc!N(`!8xs-p6Kljt3Md&*z4knv+cEpaHAo(*)s;+zbeW7eL?VIfFV(&?uD`J
zfbHZifkB>`-JQ7apsDTpnQ_?gv^{t*+l0yHM!Vz)9uTDf<Yk3O?NM+ToL1IK$7|{F
zLmaiPFA@BE_E~nnNi%}A#c96Uxk6rxZ|2ClXQdGM3Dih|S<$RZzx3I3{5_I1UqC_M
zno8W7yHqVtm#v3r@|s?%gr3aV#JaH{^(%~%JZ;h{^;-Y$s{s|u<0--ZM?QS9x69XQ
zxY|zz857{fZ9+A8??`*eIl^fjxsMcaCMov>KE8FFTm2#U+YD?0(qG#xLldNk_n0_y
zGWkWz-LWdV<n;gpr-eS<Ze4cld=oH}i6zaR*k0knMOJ9ZQ$FtqG}5Q3Vejg>b!(so
zCyn4WBEF&P$8TChp^R&8$X)NuMzCHJ;503lk#5y|D3g8euhAf%wSrWsk4DJ>xzC9{
z7dT8>Hr&6iIXUoS<<=4!ypr?4x0w*>R+mgRiQslQKy^J?NZ@}uAjReLYFH)YB&~FJ
zP=#$f<uVQvh(fu4T$f#9zLg3>)qQyz2X9-R<!ONMtc~<{+;W^aNSZ4H-z+8I13H^l
znG^{v90O0^MR7Ygog{FI<A|jiZMQ2Sp54#DY1nQ{J2*M}lXc{sDQj9L6Q=}Tha(an
z^l6p)29#zo@6&(T&~#xheJ4@mhSFW(8)l(Rtdl<@K6e<bS52wHq^kr!=dTr_0e~Sq
z%%Yy2n4eCB7j~{Q$qM5}Mn<Tc2*6)t4IJo3Mkn%M_(C<bi=q4J-QOoMxa*BW3T<T<
zngg#mRRoX9f|)T9g3eUI&qsg^47ixX;5*STUq6kM#*6dsvp9O}pLaUvs@wSzx!jrM
z#4<x&>1!(qUNh2h0S3Vq<?FXjk@!w5C1%J}zR>c#kc(l;3ImEa7qDfH>q_!AQa`GO
z0l*Fp7n|govSD+j=PK}fV}FG7^Yg>N#+D!?B;4DCH!{|zF@mt{pjkp5%NFON?ZrX;
zT|5oIGe$JBeL^iB1I;AY_>&f8^UMCkDRYV4p7}%155<f=ITi7z-edy}pJM+=n>wN-
z3Z({@c}sWV%F*R^eR^4P;`=9z#nhkz9<J4bVor}}Z<Jno=B-#2vn!mD$zl34)Kzx~
zpo7gXdl#SGb9~4ZkTw#LJ4AHp9wJ2lLGdBQc*dQ3=ZIw%9@erawtUUT*(uFE97=A$
z*HQJ|3B<S8#0evvpE$)1mE|W<O?tj)rGHA<iq3SEeR&Q9C*v27AIb&D@V=QoIm06V
zA(0mpoD4%3{6mci!2?K+tZ@Wyz2<o>pB--uI#xf@xsxWyV&7wggk#Da2gx~z(!krS
zWVJsoDgMX+WbwGi_T|d|UVPOV`xuVz!%`w1!&t3x3+d<bG;2w#qINH~?9LB)={+w+
zI+g5jdr{aeK0frPQq`bu;(P~sL73fovj3FbC~lJ&@zdsStH|zOK_7T+w)Xs$3&Ol@
zcI{m*axG_X>UgYgIO&rojvreTCkkT=D1eHs29a!>mF{w!I7@>^!QFfI1}PJQ^}swK
zm8*TKJRuBd)@YJ-?#-uoHDCFZ8?s!Y02O(H{ABcJs>gmI=}pwY9duaAxDM-Cu#XKD
zT*}yP*ei%2`GAYR_$?^2p<wFZPIiOU{PI~Cd*NvA{M&TyNrQ<rXG``LSDDaD;Hi%Q
zr=m)0)vGF0R#1S1BHyrGY7&MFVW4Z)bSMkW>g6kqi_0P6a8t|GAG{D3Ti-ta?8U-4
zJw!+^{zwQ3cPdEmqyzBUBi#Dq=XB)IS`^X#R(P8qt4hGd8`bWEKC;sACtoycM@?)$
z(z8K*TnPNR4FkcghwD1nk`Q%gen^kceIGTiE?;>CDEno#PtYdV&3Tf4kB^4EJPL8f
z_tEpc24$@a*$Sc61PiVr2a|=oEUsEp#<0ye#Bq&MtudYEN+gysQhp~lN48cVRyw7k
zY!5MGXb3La-Lsk4Gg&DSni7ngSP}$5vs)@O>f9!?F3df<>Y=qvp)npVoRlVj<aXk9
z4yJ+*F<f^$W=kj8@T*F@n#-@e{#+}i99S=7b3;yH`0ZtwA1ql{7eRcKbz&7>V6~hU
z?YHIS<BR&$jbqsnWvl2;4Ve=DL3n#<_3e8@`0QjE@MG-R_Z?E`ncu6)*`E~lubdW>
zNX03(RI5XYeWU^SmqSMO_&MIN^X(j310LmG^u%%%lkq+)AU0mJ0B<wptko({=-J|c
z3w3A}8F-78NS|XiV#=x?RFG;hg23Z1joWakzveF&`K&#(B`#$*3Yp>H6lx#RE17@$
zpmGw*E-?o7?Z`1Eaca74E0#yC)+v92=e79!<D(AM?M=cp&~bN+6MUka?P9R7wu|v<
z`9!py(Ll&G@)S~JH+1X=7aQidQ<C?&V5=2LB*!;y0+>1&%^BSJcZAA5FMj$4mh$Z~
zd4P$z`3x+Pk6=PVf*2fL_zxIpXeB#4yV_S*@CM+oc(d7&f|$e`TSpWm3qwaUHTw?E
z3_!(f6AA}eQF(4}_io@@IF;L=w6kYBG;@e*1^^$V_E={YaipG3oCwYP_sDdhDI-S+
zD`xRJy%Q8d(9>Lu$=70X=x=b}=5{bqwF}d$C?Wq~LR5Dz&E`EbW=u%{I0vv%InD1Y
zie|T;)4PY6ykk*)CFt#d4%#)a@@<eP_!JJj)@t*_>Y825IGLc2%kVV|(w4OnlRuVI
zhST$k3DWZp<@4!URTNcAqJmZ+rLxg=<4`+)6az5Az&1TW|4msp!Kw`<LdfAAA=*Zx
zFwS!^!^LVF@-5p<E#Y)PTIxB*iJO4{vS|WVUpQ-XEDfAQE*AV`3u!#nD4b5b!=|dB
z`5RZD0+lTn{>Hv$iDCyzkt*grG5M$}RSl?(kl-@<u3aWXd)&mu=YgGwKIgj;DXsxx
zHCbWcar$G7XAcCR?5Y}D=^zGNugMatVGp9%0RoCKJVrnNH6o*DV!52PPtzuMSw__v
z0RwdOk+5ppxHFF-aRC~F;o<9emV5Oo=woXf7ro%}J*?x|slOiTiIxe$e*^ZjJC;N<
z&_R=S^%WB6upt&UMd2|?b^$d`WbM4`2*W~!KC;Gg@jZ|Osojd6{TK`fMA;5;uQ8Ks
zsC99f{vwQj23*R-Wz|c718QA#quQBKgbxwGLU*<gRqOul?UH!c)O>-=MtaHMCuvKK
zcD*Y<yAN+5Tw_zBulp-3it_!t4>43L(^cXf-mc5vShi0JPRs_tRu){qowZK0`W-L}
zgt{<eDb&Kwh_=fVE?<!8@5TFaIAk}n8O8`wB_4xK+BFV$m+T-};{;S+A;YtjS0r5D
zJj}>W2m%%`CO}-%CCe-dckx1>Rr2R$W$p?$<0<57?NFFk{Q^lg4zXo#+jObXLn*oG
zvP?$+`O;XBU(!CIoW>t^e<yl$-lAAM-3Saur3T=(d3$PjgP0$346pKp!e`i}<9HnP
zb63+_kYdmJH|0)*`t(_aDkKUZ$M<^*@h}3fQHLg_OI|8iolpRzaq*$ao=yzpm9Hs5
zUV8rei$|@*G>6e9bEC4+MRK`((tlGc7aQ(a-z0WF)*iFw%}w1Ezf9Oe@i5dHSN>N1
z8)DCgI(cANp7#Tcvb?r(LMwPu3v0j@5h;iU1*(yfmi}%zQ~W!gSfo@e3QG)LvkJW2
z?%x)3;d$2b1|8spYHbwKFay6u22d52XB5WTE*x83Gsc@~OX4HgX5Fw*-20vMxp;XS
zNn(PcqYk!!GHRcN%U8x+)x)4cc7;wB>EuiwJ2F;ey@}=Mi{mLgMjbTK+sz^SxC$fs
zL}$TS^@a}=FkP?uS}~)B;|pJgNU1CovS{??F6?*C%M1F9gZ12y1H_G+KU3XkpT5)~
zg-twU8F-T04@-t)p5vgwn~f8$+*gdpL^xdLQ2`v`cVxA3rLAH<{cd$XH+?Pm97*^F
zWIN+IdVy@+{Vvg+5^}$d<tzUazkF-!NWR41R|=5TI?t<TTvN6TZZYt3$)^3(wK@AV
zP(t>CbKln=ynGUyU-;^VGD|>CVtDNH8TQu;Ux<$|o^m!aMXjoFTZw--?b5P+@{H#q
zTKH-!D7N}drTwKoX)@7WlN1guwsnh;`1go@y>ndje*B=XfBGjp*Op_o2or|}F^i}z
zX!TR|4t&0Tv!58qBI}Ra$KO2{_x9c|S)@VZPHK%xfXtQ_&TpKKBy!o@jheloS@Cnv
z-7A*8y)X_i*asnCxCEOS^5T1sYO`_v0a0%;S>Xu2`Y&R&?*<8ST%VMGm05D}RT_nF
zHzAgNiou^yR@1_T;liIz9t#=+nji+jJh6CaHkbnR02{P&7hugZ8{1ZVG493Q`kaSL
zCW#^e>cs^d@Wo;PD#;rfDq8CuMxRqE%w00wX!<uF=y2m}VZUq9hqoLyR)?UB?#l}|
zKT0!hbY`IWCt&GVJ`&KT0_ncm@J<!<hS+Wa`O{u{O0&S_joW2rdJ=#8VmbNR{Rm4e
z??YgX3{m0sx@=)ZlDA2eef`>t;g+`Xg^>Dp@eYZra~LAx@7A(|3{$a7JVX*{<Aq7b
z@A-srzLqSajfJn+l)5R*w7d%EPlquiwx;BRN?*s!xEqZKZ+-95tTOfJcn)cQoodqi
zhMgrBxOx1(Z+K2?E`zYvOi8N=lt}*#8!xCPwcz3D`MXdm$zr2B(2NpP<H#Bu308${
z7b8Rph7f;fUX9<=Gi9b8->)fSoxml99NdaAo*o*Ol1YAWE^HW3Wi2fCONggN<!T(k
zQ4R@%fLo{jH0|=%m-^dYMKWpFcmQbe5?>@G@(nQ@?6EkZAw0GN0qjGDzbBWP1BWvk
zg}2BY4=^PEn9R-hx>y`CY_%d2yRZb#6w;w{?kc2Z`rSb#jiJJ^hj1>!2eYo<qi#V3
zg^E#cW|S6#{U2uB2mPB_yjMtqY%ikSqW%PTlfg*){$aMQ93$KPtLsDjcbwGGO@k?o
zveohuo4Pgo<Tk}Us%0$6(oA>J-BB6M+_)CK9|s%l)n)rh>xvXfS5je3DyMTDhhwpr
zSI=0&znbn0DEGfp4+d70!@gxu=v^39e;arm43`+c#O%6`N|Z}>dqO49e<AIe*%PjN
z_4joX>Z}l)JA*@~hz|=3dvt;Or@#=J@k;v;f2Iya4S;CZx-+lFkQF5zYc%W6rJem1
z$d8=F<<SP;$1hvbT+Ntve{snXrkYWwCgv=uR&Xs`E{NJAGcaupv&JHRB<>tC069qc
zJQqQElWxQ$=rK79Kh3%aBg(A-RsIR$B|Y>kE1xfHlG%?jcNGaGtMSTssj$S9#2<z3
zSq^~jFP}jJ6??GJK&sFgmTZCwoqACW83eN^Sb;<+)FUg4N74gyNf~Msmzu|f*eBjN
z8|>Yi?~okq@=I?gwIVb!jv3qZ_s=VkF-H{^09q{H)U_?lEW|bWT#_MWw1aF;QDVy<
zx10KVnmrk~Uxo>G)HuEg!>;#TQ;x2tw6=pQPpT9)1Z@5#gG4)E1r%s}Z<45pUttpH
z{Y=xCgl%E0RdEWXN33Z(F@ecvlSMmkIiIWE&MV%Yy<z(?I8BAwdsP@6nL$e4URw~z
z-M4g8bP>oQDH)Hk<8N7lGP)1Ye+L&ek{RHt6Q|8I$HRe!z<@1E#2G~zGJnbT>B95;
zmlkeE|EN2PclXY&iPCFTT84ovk=|XDDAvQQ-CrE4K+-pr23*iw+o!V0a@(e^Bk;eh
z1Wt01V19jj%i@cY%PE3;W}l8dH^|2-AWX3MDDf1-v`H9P_lD0M+YkL`QCe)lLi_y4
zhq}=oTy3rq-#&_~<*t86VMoEvN2S7-H<jm@5S2fIQ;{|VG5k7Tr%iJF0OEc<a+J2Y
z>*h)uv|q_c4}3!;T(iNM-VNgXM7$AHL*YLmyFF1gZ1p!kVnG!gLYuC@EmOa)V}9tY
z`HdkAZvEE)j1Pe?q$}<l^-l}z5us-tA^VCy-9YDAmu_Np!gQG<1oH)zO;XCv7Bv^N
z4}=Or+rsEJivR1I3Xj2PCyC+@A(<ez7;{Yi1&!HoQkYfAblTI6mqXRAXUw|cIls|5
zHY2Xr4RLAhdzzmPFuWNnjQ2H~cNldPd}c^RgB9fOZfS}`0X)N`rTRrE_T8iY+4B^B
zX-}Y#Bo2Y}<t6_$h}L{rfXC&ivd?}m!aE=dHG;MvU>{WD_6llmxY6hP=|`Wv*p!US
z@KhC^+;bR%0DzJzaZD;g(bRvQ&>S&l9;`7Q^*4<x+nwF4nm3t2qmXU(eWi62tBZ~Q
zE`m_3QqVc?l%YYD>#x#3mO=9Dqv?;{1!q{&OiR)Lo7hiigg)x4J9w(IJnZUh(JfPd
zxDjMe8D}8c6EB9Ya-()XEOVOplwISGUg>x2HeyZ!X9f};mS%hX0z%R)!)F4c8g7Mp
zbOm77bB87f2(FB$1}J?~iNW^R28yFY_6!f+4V&owDDihts>GqNc+n&pyfU-*jjjU2
zc7o#~A8?h8UMLXJ5y5SZvqNE#T^v54*d%z1fngBP;YFmDGID<$-6RjngcWAwl)QW`
zQsO|D(KU(v(T?HkU${vvHo#!?O>GU<-1S4gqTfr?i!f7My!g)grW1Es=D13%<pfGk
zvFloDlF;K~ahSTFRdF<_4%KV77yOBjT4TV6oRn3f>|&FSq)C`UxsBfqo+HLSI9c24
zZ#<?;9LFN^duS9nUt*qP=%*1tk|GOTgx;Oq$1rP3U*^V&FCgZxWm4@LPBZsIDj;xX
zPmW-z4maHBIf4b3K+Z#$?RsvtsGLK%@k|LK_G#-#Uo>wX7Oo5ca2gxGRMeAN9}O**
z#q>O@GfaXw(0J{pN>*7Yq$E{8ct3J{{q5^+|NiMYhX3^GQI6Oem3j#b2#783cV{t>
zWr%1!>--)hCRP;`{6NeLPXUrsR78y-63EeRveB~f4z+fz4RI*}18J&UkbtsYJX_h>
zwi+Is3Oa~SgHr>JyU}Q7#D<-lf8eWhG&R%yW?tWgx?_Iz5HFbn?t4OTzJ`bcFjKD|
z^Lv2S@t1vMs4FpW-w1c+f!c82s9Ut#A+1#89Xh1Zv#W!Mt&$=G`T*&@Lj?5trwCq9
zb^A~XceHVQ)QKFE#FN}|R4wyJJM(6Wjb1&W@z{+cLV3gp=TEg1dWhx*q3)5JIKhf#
zl?MFdP-5(2h@E9MEV5TF*%wTkZM-0<1WX2lFVCn!P;sTI$T&f42Y%$<dv_`8FoPPe
z^bAh&wpk2=pSxhc#dt`H_FUIhqyK~wxZAkjUx(VQePek2m53rirX`Hq#abt8lbD$y
zjfUUZ_&%uss)76ZsTdAj{Lpbw=7fV;KIkIQNS97RfO@n_cJ1WpXQ@T~NokP(zszfD
zq2fUhDtmr@{>=o>xuRXwX*{5ydP4Fa=GEtu6ZzS=g#?(4BH6%)Y8Synr68@3cGmu_
z{g*c=CJlISMrBGj^n5W!(dRhC=f~;iMtytfQ>;8fJNQeGo`ded)CDAzGUp}aS`!`?
z#_I2~{G~zlH{$z_?x7~}BsG48MgH6)ME^vef;J6LgA?##Z`PNEf0&DD(CBaPsGBVN
zxry8P!SS>rxqheDKl{vIgADn?*Z1q`x(n!6sE}KC)IefQphk3p6~R0!bL(DxiS5AR
zHpTbC4@tq-onLDYsw08PREuzN-<m^2-4jgPA1wKu+C6#nUof<dSW$L9OEa5HuCl*s
z-JL9|D=S_55qrSTo!si2;Xo7X0?QFUE~;hA0r0|j4nTiN&y;GLvkQ;LynnD<@U-Ls
zY69{~q!`onivIjvZoLv8zGeZ!Dwd558}Uzi9t|Q6YJPLIC*0d>HZ?z8khz!#x?0>W
zGJ}%rAGhG(1kP{$*B7ak$(Mt?(%VVO3mswc^jHq%??PJ=wAU~E$qAJb_8a;K=<^_9
z-yVb9CRr^fT|5s&%I7^xwWuL*zHf1=XfRv12P`nrCM6{UF>uKch6v-?7*V=_YwD#+
zI7@Y3LYkO6T9{%(BpH~Ma8on&N}ZjPMT$2n<N6`b);h(}E-#qW5hwADSG|xAL)j{r
zl9F=97&7qc)G@u|*et}4*Si!VTU%PRiAauPZ<d2y9}q`nIZbIJ0d<~5xbzEzwb`*G
zmG@xrz`~+V)A;kEtMz2{IjW`_+kZ%pzwFgtYGDvn^Zu;k<~&IRAdm>Aiz7up;Ha|u
zKIKMM)CnJ3xi2HQJeup2^{wur7%%YdI-<!m&I|GGxVD}XSov<x+(jPT!3*Y*Oj<&_
zlnkgs82R@Ju4Jt+D%24XXg#rHuQqDC^+XLQKM)lHpn^7`op;uWV*0=YvGk`T!FA}p
z5eDmT`hF<Z)6p9?ivE#|OuQz7OP`y-MnlCzp7XVtKEHD2O~(4m`Y$g|f9YaM(pT>-
z;-nJ9MBL;ZwxkhL!MW~lH3NvOHmESBpP!JOT{#}J1${n8VE7z^RHR-*kqzjONkf0x
z>CwK5hw6Eds+rTIgvEfBGDPV-F=~}snqR)lWn^3)A=cde51;X$X)y=J6IUG$lEtp$
z+*)Tx1{44`V%jbp_70fDxyS?p#j%8$Y;o$0TI&^CO(CIZ+b%({BO{C!p2;S$h5;AK
z2Z-AIylJZTre}j6+Z_oJQ4o*s2yjYnndXiy20_7@o*JgPD$aduJ`jgT$8Pw-B^(T7
z2OTyqrHr)0pS6uAR!nSx?sqRE#H#qr(81=ieK~!<jw#yTU9;|<ywRTZIBRp0hj&?*
z7PAO>4<<CojOiL|g{HG~?>Vw{Cy@!DrJ_;au$YDl)3ztIzkxHQDXIzi#)HcqsA{YN
zzT>yg$9^YNu(ie@hMuyI!UIDlmYV8UT3VuJwA{|J(~-HF*VsrNyY^V3^quRRj7KB2
zS!QqK$gkW3mIts7&DW=9BWz0*M?X>7!;lHS#}e>NOAz^r7D!;LB{ZGn72h_Aill)(
z(SK(0KbJrRScrBi2};$cjDjme%t;iT(8oX4B(2yU&mAX^)}>rgF=kgHe-g+ARK!=9
z(1<vuIf4TsGFa5szKX>42D7xZFcZ%l58D^U7ES8Yp~!QU!MRv$HYcaxPePVxgbzjw
znVr0Di_A?vDEBg4?5#B0fx9bg1S?xw7}17tu5y4hnb<u>fj?xM!vx4pX2#^@lAG@r
zUr;T$)DLtF5oO*vvS!dTS@{zli+{19;5iK8o1im~;b*<G32k65viEU80Tu!Rx--3b
zKf8NBun5oP%;>!B!hW^4@_kMEi_3}~m6xZicD2)?40glpLkd@1d|d!j$*R?(MY9<l
zQPQ|2zwcWJXbu79=#k4mBR_LGm&Viz98S3jdk={ZMaP8yY5I9+d6!y>zcqd^7{Y$e
zcqg|sn2Q}xE8c1~0R_a#(vE(L3y0N-U2N7@xq=6v#o^e5h05$duVL1~9NXIYiKn8}
z!yr$GT>qlgDguWn#Ub3}L(V(8rOVgR6S?cO6`GX=Z}JLP`^#|0-J9#0JNI_k<23@B
z9l(uad?5Ti+6s$JMigFBjjTn}&r7PM=Rw%44r=k6Yt+4zkxe~Rk=W&*%HW&;`KK6E
zO2~(;T5vmWu37tdsfUVzi+%O*uV?NoZ@PF!rk}0VaO?btMUvArhy&?Ba{Pl0#J;NP
zsYRSqk9vO^*7l9R>wul|e=iRR2+;g#&Sk16<qv(DG1{5Swc!_-H)=o5QS2ZXl$%8=
zxY?RXNi;GEE5p7f|LY(?Hv0)*P`vVIlq(N(l&g;_UMEJL-Z`T?D7|zS8!kS7XeU;t
z6_g=^WfuogY+SjKiyin0`{AcC`(_4|M$MQlR(bA+YX4H+R+l>79(Q<4m|$U$5D?Yy
z0;AhxA;sVXqnG?DQO6XWa8EI}F~4(_<x9k8@9PBgolV#GT%ysBHlx;Gq|Nxioh&KV
zsWNW9bGGm7Jo#H3YfJ)gf>2}1**5~i>=f=aFScPHJGwe1jopj#C{7PC!sY>5D!rUc
zp`h1Hi&gJ?r_}s`S(}H~pmq5|Kl&P%0VBFF$JY6)qzmROh48H>r^tiiv~^RA8BZKA
zBw{A3^`-Pr`j>Q3KDuvAjlxG69YqyCZs05EcBlXvsD$8BCkg{%aUoLbSE?@2kdDG!
zlh8LenU6iN)5Uz=D|v{Z=*kF=t|vLmDLe%7VDzVOW5ZKB|6yIV4tf#Gg$BMoSK8Tg
zw-DLG+7<Ssyr%YhL64xJz>+fi?A|7sBaSNDc+KB^L>tcwjub(pJKACgYOag|0s@gy
zQKTp+=!YTvDb!@rGhP~DGo`-&aM%CqJ5v(|4$0URfb&>{45#SfOk#Tm77oZjWtreR
zk!A`067JKd>&!ci2ium28m>N)lEjqIb(7|fTP`jr`*AQukK3-j<AGcmfJz0x3n%DP
zRv?V$BHXiPiTJqb{QbI*yD&c6AE<?TH+3CxxEJkS!a;{x4a5&R1?HymIv1VTdq<U3
zFNDFWe_q?_+aNHu1v1Br<K&b1=DbO{g`s>V)#rlU_Zu$!^>I%mp1tMVx$7d>zQ*Ku
z<!M(XD`DTHF(H_9kPO$w>(f{E--LGof%+(fNBPENYs%!&=<@?+SY~cU3K^a6nMQuy
zYo<bP1lku!VY6A}fbCFGcPyI;8w2@4t{pHHab2Wb1s#tzw<F_-8PrcZv2hAvo4$oe
zhSXpmSzlM|ac@LY%=s~4dorn!YuX<47N}Sbr~V(9*&0%EN#eh32b|srOMK`DP<X0L
zpjZ=T@eSv&;dr&hvn{NDoh8L^{l%xu>UZvyG0z}$54}b+Fly-W4R}JuFqm9P(V)fv
zS1T+zd#UD+%Ihka11`VGTzRe-{LW!02zogY3);rFLfsMSCV-%VmfEHA4;gN#gz9PQ
zS3267U^-aVl;Jo6pV|Iwh?oXwZAj=x!4UisRQnA<ZBtm#!<wS9HEIxzFbMCSNDioC
zm~mMmjsImR`(}ak1k<r7qoS5D7R{;Y`dMSV&1qUCy+Veg`Zx%jyJf}wRWvyXYoA}Y
z75+c2LRz?+CXapBVE|#fr@rv2)c~zj5-Q$lo>4b=z%`ta^x%&m>_83eTwE>t`4o&8
zdxV=@paWI!m#2;k*lZJ|^uDOhFCG;@XH4d~AXKX1joKu)qYrF`Xlm`Y9AoMN(Y{65
zq&moBsE2H^g9}EFp2arons-%t;VDs3!``rj+<$(xLkf@UK@9Jn?HcO~q~+3#{)%Ba
zyg;T>0k`hDb_CXsc~Q5s<wB<^xj%FtkDJyQdaz(FmeR-z<-O`vE7K>L*cAcjT%;u$
zrj?0-V2Kw8;tCnfQY#;G$SRui;mrVaaxd3bWu>|y!8NS+yFqS*PEIP7sNf~j>do!a
z5Pdr(eCo~8l(mQe_S4UrcBTWq&EB>zv*tom7ZN4fIc9obfC~x&W&MMEN~ZkK6x3BA
zYiO7dZ>b0#bfGNsd*}N7GpsVSusuE-NJ;1b8@=5vet>YRGZvLy_*>0BVuKT6)Z??W
z6jk&XTPloR%os>>R1TTWd)^M%k0IPmdpd@EC%f51Tm|2=`^}Csth>I&k%CzWMuq`k
zDN?#vJW0rAj@-+S>LJM%6D^L~uJ*$R%8JQIJbkvD?!T!@7)gPU8q4Xzi11|(FRbdR
z(|_cP1cjv5>o_t)1$MR$zgf~Xd3`K0z5}TELj<~S!K3aI6#P5xsdI!^ezr5%bOXeD
zsL{)#Iub>FC`fq8nAduNO+=PHN+z><(3Rm&G6cINrRfK|%s2cH)^lpID4sBNFvA0g
z2u|)GUyLQv$DD>eY~Wi=qD=}BOMu6PENr6nJLjGQaZTjV#*jr}4Edd|8~%T10p#RS
z*m4nExJl_{rC>;a>m_=ea?}wMONbbqnwB#k?hZ@hW=!c?9V{>gQZO-d79dCkiuer+
zxawtrGBN@NvHQM#Hs{6d;pTHDub^yy|J;@@lxjN<GL;yBL)6n6+&j3+06E9dDghAc
zSwUI^dY3;??dht$WuYt*t{zXS{(QGK*1{T{+n@F70^=FjB#?`Xi#I*6M2aRRCQ7{n
zn9>_ULdlsryvL_w4Qqyaj-<`(J5C(3qm=vujR8OP@hDhtobz)LUUkz^r@VvK(CPP{
z^LKp(!7R%a3F?4wFOqj$a`GQZotUt@)OkMoKhg)E7>J>(>7qXSBo$Wk_mwqVZXlBs
zFrj~@F~A}1moY@wk-%Jq$yWghN<FPRKi17u3$d2`@hg-RBF!>;=9nD4E3PP*DbLFV
z=O^kz5b^RrE$)@qZyxQ2yq;P(do}TUq!fVK`nQisk~OgAGFDUD<s_$u(AzywHm&dG
zktg=-U)vAb@U^bcvkfnGKlj$em%*6bD5%4~E%uGq$-3&$TV_q|TRP9MfUZCM{#qDw
z_PC(Yu$6K=E&>;AAp+*8;@o_mNh&>$-4>C5YZM|kvwmdJ*`KY;q6g0(0wg^?GC4%D
zCw`dLC!>$*Twmy<bkP~G0$j5GsUiPS*!)!offW<sA4HAFO&P3fK2v!T^gzU6gP~5x
z1DR9hs7LL&+)*Q~A$(}z4~yxvw-&Uci#nki$o&pNh@V9RI_eHjgpx8dsB!E!@>Os}
z1U3VM5&4>wQPYa6j&z#}9Z6oj<h8#hq?I=f1UtiL(Kb5Uq|Dfolh%M$h+IFGdcGp`
zs#H35Sx3<YJGX82T`Ct3Pc4rHZTuos4dkJ*!pB@FqAsH*ClBfE?X|et8D@3d5<L_t
zI};C0^iH|a$5Z={RPo<f94IaFAtMQrR6DJe50z%hfvQ^Qg`KfoE#pU^VwHcN88U&v
z+-zSd{;Nv^K^V7+96}1Kyh0a{Vm?Uvq{DtS{L`ofxNMYM=*sB3Xu{O_?2#tAAZS31
z{3K&DCGo@NN2#N#TNh0MAF)khVxq-TgC(oU5USPh@1>||re9bqo5^uoEB;REf0S4M
z`=W{jDaX*3G`$do7>Z~M4&U*+;XNEO>hu+YlVz>TA<W3;8?+!fUEQpf71@7SDe)OE
zo^1>ZaE117>HqJo1rJdzrV11R_*yN9y~U32$B`Z-Ld}P>1CJC;`wuE$fGN^cUL1qU
zc$FE{vaN}Mi-o@$0X<ZmY-%I$t6x!l3#Y6^Dc71Z&rxPE%)iZC-pqDM7VSKCy*_s0
zOiQH7E=RR_#?WdASD|Sv!EtBbY^ExAEzjo;MtEnE39DAT)cBzrj|>4v_%zQq#mR>#
zOmQy1hTT^yt{j!9K}UJr_O_C_+4EoeXU{AIO#cwhg6ZUOzTeRQPniF|iBu^gl;B*2
z@4bHHdi|X47pMl5@mzUZyEh^+#Ma;KtC}B_>NmH;4t4co!zCpQT)R#nae~JzLbDe;
zqrtFlEcfa?@}FZ~Rd&4Rxax1@-^9filaAktb?1HsF?wpza*(EgWmptpgxZX&x?;8z
zX5p^&WXG)5m!I8i9;>rr{kXs^BHQAQ<a&(p53AUURdfnjAPNeKGq&!y3^FaSl0$jx
zuh{ed|BKv;8$P=;WDMh)aD9A)6uNMJ^lZ2e)6i_-EFSt0pXdwTBn_{%O|TT;#d}Ad
zhLXQy>`iGFOC_Rh@k2k$^VD^&#Y*JyCs)Ju;Jm4wmXf^Jr$+qO&)}o>`v0to3WAY`
z$vVlOshh+YV;RNAZk?be$Iv=n3hVZuBgN%qeZ%pb<3hW5cDQGbl-BdzBTZ-`-G6kI
z;H?{7@Ml5l|08bw$LRlS0GKg?Cv(4)O%+uoq@?~PR<n*LI(0}Uqr<miQpq9+UF071
z-L0?t2orwl3aOJe=1N~xf-EBm-55f^UFbF?7c$V?qZ8xK5}gLRLiwtTOKAp`w>t|;
z-7@*>xOmul7WAsP+CBf$>0a;m-XohQCS~|A&>{=!;5=)(O6U_YMn!`!gT_AfgCSf5
z_0Wml*FWP`ev;E(X_|@%|E~D|dgn;N6yo>{hi`RBlhV)m<82ww5OvTX7(ix&3hdZ&
zCH9tE1<-%4EwHFwJle>bV%3uN+rC8<ZDQZ!TomiM^Zi|#sYyXO;Nzo-=2Hgg00}|X
zeTwWJQhR_O4irWc&$RpKHjOt9Ts|ZuBw$mCk=Q0ED9GaF;c~XlG+#5mGS*VtUZ?Z`
zypQ8QBG&)D<arTq91`{RM}I+QSxn9t0!as&_UE#OF?zy)a5GKMjyA>kjbf;7`~8;g
z2VrUDd9!93VUu*|h@5|x8f_1a*Qa_CAowADkE&>E#XPEMX~BZJYiYrtQklcN*Y4aC
zS>;7|#{36oJ2F}egMJSkr}SHgxn`GmvZL1>M))tR)j~fW0ST$dea$nh)#XsxCM|x>
z`_i9*rYZWbF7m%i)&KbwST6QKpEWR{xM6LofUl2`Ws&N#;e9f0oB$#A$V7iY_}ZGV
zc;dcGCMzhyX*$XB-2Qy@EkK-ZY`0zHNTq%gMe^tZ-P+8VbJnh2KIUiqZtu^al%RO(
zQ9V;F_TFrV3L@{T7L0h2D#D!En=5a!k8|K0-ATRTw&GWk#O{%|7Pn^LV6t@Ip0M0;
zhyT0ZH;!tHlN`F}I07DVf%g}d@pPtOx03~>LO`qpAEr@RSy_YS48_RMP-*y4LoB>F
zkcm9jjc7@dYfLrG#M+%UkF?}2RdtN&Sz&-6)$e<CdR^U*`&*ZX9YRQbD{N#)OPt{b
zlWn5poDAhXA+@yQ@6-aLrZ5U9|ISZf6k*`Ok27>;at_jvIr+}0J%N=dm9Os<E#0I=
z`e`yzhC5253hm0h&vB`zVc74K-#c!#h>F!~q$bUHqFyHa3ps3`pS14!BaC|15wFTt
zOC|YI8n-s_Bsa4L@Iy~D5Wd_Mm`=vTD^?c<FH=&Me^i_A<Oxy&mkNcqgbzpf5=V3z
zIE8h%EM{Y#uC%%>icX0d7))PTFZ$6Hroz!k0rZl0He3A>7z6}#RZ{n>?nE6ATTy%8
z4-XGnopvO>ZhlLQFOSsM_`P}^{rQ1?x@`VQfm%VYh>M+$E+&=1Kt4RvIaN&@Z{ny;
z>3rhj@j+j1PT}m0sBzLb7ol>=q+hU~)<fC&>%`i_`IA9W?g35l!;YpohgQ{-Ib8;|
z2YHEF^k=P~+}r)ZlVtcMr%cva3&OjqF~{D=ohix6V~<M><~ZZ&@5GhMwKZeePIs=G
zL!9ML^}1#kH-i5fQ41xSgDd(jIu4JCTr1xT7c{6Ds~X1!6ej%;a9nl_iW~k#EjwJa
zv9L!<w8uz^%*UOk;O*y`xx%Shem^5nyWrqn2D`+0hED+vv4QN~<w!Uo&bMGh+t$*W
ztx?s2l)7C*Yp$n|nVFkkoVF@vr_Y}#&C9_Ov%xic*x9Vb`qQuM*=|u?jiIe(qlS}m
zxAupko!upgphJPMR~1+^!QHsd(0&2gakpgMU^<Eg4*XNMM{C~aMO@B%Q=5HZ!+*kq
ze+1;5to%%JJ71G45Ra+TT23UFIj9?@FKAx(%Ov#JfEbyaECGR_gefzO{9i6%#l*yv
zmYXQjSd6{3_M)&Eibol`vgWGvWKNfx8Dua`xy`@_JkNG`yI-;&t#|on98n(TjaU>E
z@+Z5$kI*?EJo~Q|r=7jW27Nrj&{-YOi=v_}L}RPcVJ)s-2&T3$=Px-L-L~95Bfl9p
zu%DiB_ZPagmQYnZ#WWbNUHHt6=?-dbB2>Lh(I~+6*Sn#jTYtgs;Jci(n*A~DzPoXm
z&HA_;b{Kf9Uo<C&Aa+7)Ju)O+fb@cMuu>=RILjO{u65>avbZ=OLb@#|@Z+lf1R$?1
z{=b}JU?OV3gPqwl&hOG%iO^(K*t`8*6Dc#wTy8Yg94~y!AFQT=wuQM|Bj0$0b~e!s
zucwZd++F6XLdWw(!azRhT+YSgLO6IdG?n)kn|(#YTJ>f)a_E4fuD7SCs`jf9cyjA0
zLGTQnCbBJb`98Z@Ugvn9^_0`<fPcfFWJdz671OkT0S$5LlE*nx>OS+|kcWKA&-O9P
zvDMmF|42Y$UFXbfOF+Lo6}EM^%rljOV}pW)b6tb_Qm28nEQ4$AIH-LlVsN?{SgV<X
zJ-UtiC&DSbf(qGw^l79ux--~<GA=*Pl*>HTc7!v-q24@|GxhdqVobVOqr;QuqQ+*l
zy)O{jp26T~*-^9BB*t{LX<+lfbyLuNM6EwzvX0ba#Iw=4i&6vj*6?3D087vXyH}Uv
z*bKfUXPN{y#~8epI?byHyUTRotqFI!_JT)STGM(*;4AW;Ks+)!ityv>77cV98mPy_
z6!TqCM+<zKsr#8M5*~XY*kdLU`oB0H9+a#7I5=6XH;Lz30K@@3wgVOdJIC^bf)5Jf
z_`kQh9*;0N?@tu%=lbj4bzP0n2tV`>4vsRR@ZF&DJ)hLG`oH;5MH&0Ozq)I&zY+WF
zAN($8aNHIzS1Caz;53x>+&ep?-&CTUuQm{<H=mZ{SS4F*ir$Xl5^mA=IwZG5*jV?y
zU%i=CQNSe5@q5^WJ=_OBle42Ef5c=~@#<ySz6%ot2vTCRT}nRddiN7Pz(O?cJSzWj
zu$yL3+!G8t%HHt1M1jcbq;?Qw)9VO}LYVA(VHh-shKMa241;v=eBM=}!2bvepb{SP
zd%e|wM@BA25qME_s19c@6nb;N+K~zhLkVZ~piddlf4<^BTDRn+Tjh-Uq&zY8T3}GD
zB~ya7_I=%H*H{*iJ`krE%eK5fv(}gS5WFevQPW;H`1xpXuy>k8g)8|GeW}hK+VrZ=
zI}g0E*m5fJ?B^brv%BKnyuU!n>9a=C7j#lmnAoB<f~vfgc6=|_Bh5=Yp-ns6&?&Xo
zGe)AY5TZBFFlDWEW5s!;o8_)tG#74M5L>>tM2BEw@R5ub@5Q9%1)A;l)67CWU7e6j
z>uLEHD%uvKgw~O^I-8kX&|!Z@FvbR+@I3O*+*ZclCJToT#trFxKTzRQdyNb`*C1vY
zE2vgEp2(@LPS=wtqn_bc-ZyF}qJPB<e~)Nxm$((~J8Wba{5?fDf9;X<(Eidx%o=gx
z$P{4LaRin(I~C>bbuhRVFnbvBdJYbX&oGCXe?01lo7`Qe>15g*H~2J<h%3Rjj5)9(
zTw?xbj_dn;us7}m)x_X#hdsS=ZU<&oT(wyT^*od$JU-E%(#nRmu<E4q{dPHx+peTm
zOkI&u*nH-s;<yt1)9So@zUmUbl`tYtUVwKH^kdlN!r)W@Jt-H6K0<zwsHmks=>=!9
zB;9zq2=VO?lBKL4e_$Q*c!8Eo@$a_+o!zCA-)@vKojVXt=3C>xkC%08W1xNRuqz%j
zP?^)Rz(*Uc1<p3lsJWQt>OAJ`h)-E~?YF%Txqdju(#30e^J;2~wrhDoqnLCSOM}Ce
zs!4JT8ycO_Np-Z{$g<y4EM0%7H(DU*dzX>Jt;4emH1d%uGk^4Xju;pZhqxcw->cp=
zP$|KBJ(&2BOMls_*<njKzIoh}%I7-2zsJA$Tw%=H-P+>Fd8I`Uryx;nptC(?``-lw
zHp;(yMnZ6!z%n_Epb^<)q@d0EN&W)x=47P~uUpXA#ob*ou}Elo8$x9!kw5q#T)zjS
za=kY8j<=^{R<{#Pswm;w+FFt|@6*P4c*{Tsiozjo=e_7zh+at7_q%2LEivP&7DJ=k
zqd%-R3yjx$U~+532^^xvAp5{=vI}g2i;;#1tUqpCbV3Y&>@`_#vSqekX<=IRdp=dh
zFN6(GI<9Jq&GFpBAr9w%Z@(}aY?VL0weNfsA6Nyq)h4b0M!yV^#wp6n$D&GRWMn9t
zfBl-j2T#Z>C<<YKYBaE*$ic{Z@^oBXQr-2YT?3T?s$q)0Zd$f0sP24<wEMY>wbW>h
zttN^mo>@wS-k&Bk0>L9emr4}w|Lq+j39pj!3vm?x%i}wl4ID}$kY8}&BwR~I#m_ef
z_fJeB>;?W^=cDf>M!g2Ka75mt)6I=vYr{SghEi8ZJZi}VA=PwDoH;K!EoFF)oOkMU
zob!5-JpR+>u96Jll+tI>kKrGzc`{wJk5+swKK2BE08M0JuER^Qo-JYj64{lZK&c@r
zjAal|oz%JI^S#|azIm`E($vt{bB$LA$}WlBC%UED=g1knKYokG=|_8dyPSM4Vx^#f
zac@h7%$U+@v7-=}&Eyxc;LI6x$|5>(uc4Qj3AHU;>1||r=;05O`k_nA@MbcNs80i|
zc5-&MSe*#@Bp!S_C)YMA!Y`^PWTvS@5k;OW$4$NuRZ$<v(K~(NfKs>d0o^Hg!UudV
z>@l3sN0I|<WIo9Jt<u-NhmZDI2%wt4QpmCoQFbf(6T|DHB`VkynSwUmg1G(6Tr>2o
zC8#*-6B)G2_IP(to>#68ymtZdhQ)QxyWB~TFDQlKMnF~v+pk%<V;<kEn6#j_PCgq1
zbAB=EL9&p%KORarUM`(k!{6VFBR2p*a8;b!eyY2f962YOy*`3)k0`->3Y@Aeob@=G
z*gx2a&}&E>W{jt&BW=StY$Ioy$=4#n<$=$wwD^fE&zMmk)Ys+opk2eND{$=oO0z=*
zAVg*3G*7tIxiYuJS?#$mNvuLZEp4Gd;+X(#kI?xeNbRYkdh4y26F`02<*H#rzJW8r
z8(TB~Nyba?(=UeUK=*$oAb*RR8qw~{FGl?EmK`bz15@4ed(&Wr7UeFdx3jJz%C5Qj
zbbiRX(@2e*YV$TQ?EYsxWjtT-7bHODV!b)KZ~`N&*2ifWnAHrhraJ<5!g(^Iolr1V
z@Okg%aK?<`|Iqc7VR0;5*TEfz;I6^lox$DRgS$Hf*Wd{R3GVLh?ykYzCAdTQ=A3)Z
zxi|NI@2`29X?nW5s&=i~d#zP?2_g4`Bj0HIbs$}Fq4jXF`J@rg-y0L{Un~mgf#xG}
zp+RU!<S}JI7;*rj<+Sb6Ad#OeGc&VOnNS3f4~HB97SCg&%Xn`;)xMxurBE6JB<WDa
z?SVEyy>Z5*V=`R?O98)vhWs)usN=)h(CrPoi+N+p(7gMeq{{35Cw(hFKYz3l3rr$F
zY`_y3^H7-StG%ED;x6T--AY?7Gr71NgJxu!ngNU14a#te)r$fTfi7!ETs)5lHeuI}
zj8`70r?3bZSmDqr0+3&TwH7gk{rXlnb6%?yLAwtt8lgDO*qZLz5!@a0r7;UtaJ@~(
zPM9m-VW2-V;T5oFu{Nqq^-|ma0OhpnlE7>-s+ZD@wYyGQGNBY^mHv4PDIlzu6^?Qj
zOrIn1nkXFo@S@8ZR-gIe%G3HuB*z<~20pM7do~!4QtA2vd1hJtr^b74Lrq-R^z~Cy
zr&$cNqpoU#8HLf;i?M)4mDD0aVOakvuxT)eB`^pQv&gD1=`WL*>j33Y29&<^%eY^l
zVac*&*i!k@@qn<S7`A^g6xfIn?vME;J->1wpbOf=e|5R*JMf|g><Eq}-_t{)WYDL}
z6%tGz02uesaR6ewng|aw>7w~?@f|AMF=(~>5Vl`!#ttytO|dldGw8pidN4<~?|WJ;
z7e$|LcslTxZ!}B7;@MFBeB#isFbDI=Xg!9ZV7HphZTzmxmZMN9-<pKUjB0)q4QWHU
zdVv|QcGicm_pSK8>VDenj-n-P-D}tVQX9h3^M1%YrSFK29-I<;NFd7n{0qJC;*fZ$
zAF=qkkpga<P}77sil_f@`N!`ZCm1A8(k%?fp&S&lOde3<2G?lwS2tUe&$Qdokc`FK
z0w-L8AEF`pbR9GIW;V4}Z>^!CD?sAx-x4T+pgL4)*)D4t!<sZQU$ZYE8Y_s^n3XCT
z?g82j><@zmik^XPpMF#h2xvq=Ak>!pP;#&XIe;=Wz&{}1WwFh(mM%y)fPmX657zK{
z&3!{kZ?Vy0n)K@Sw%_P8v=Idplj0DZadTf#89Z^q==gZ_ulvrolzVbY%2X9MV|>^R
ze|I@8L`e8HB>=dorAQbu1}T(iLTs#$(HIwWwnFm9E|{GL(~EUxN!B3$z<0G|`xbab
zrF=Pq9$mr@u!Nhu)trz+=zNl-2|MUvj$J3<>xjhGHcP0;M*&))9g8&X&lhiKHPFwS
z-4G&pG1`(qy_R1yaQoY^Fg!jByZKO8&<&pFPR@sj%H+N8AB1oTvG&;c;&z0vP@3aA
znQtLbvY0%^yNqJ&&``dZof;~qZGpYEWTQx-dKk711&(<<aNI~a$b(2ao2WryKhjp|
zwA^np>D!cGYNY!=WW+Ji29-J1$&Wg{@*2psCgVT)x0h}j&c=U+i&GqM4Fuo<94^F#
zh86`V$c&Z{4vv4hOR<BtjM?xE1`tj9xY5>|SLS!5ho%lAPNQvGPo%3o8p1Z$aO|{A
z>S|(RhQ_toL?)c}>uoIDYE=d$fGaI#duEchYO^2FkT_Pu4QgHw-847l+|vs$WD$p>
zrq#L#V1{<!y@pAoRMYViyud`IGQ+_-p%aP`2m1S2A}z~YRP?yMbHdCc8~ZZp<vF+o
zn*rM4M6YweHyuPT{jKXPz``0D^W|xs*Xi4PpCEi~L0CzR_6R41-Vhz~M!w9+Q1F$h
z5A4|mNZf1vuy2lOqW9<m_Ch`}z=rs5RvE%31(2-5Y11S^zv9UR4MrGF85hfn2%`RS
z8E5~IoZ4SQLLOX29w&6M&x{xxlWTT}tQD{L>(?)3F*mn{l&l)Q$^Lw%#vdHvlrnTk
zvAJ$%%fpY|j(fJf`YZWM$S9D#i2T^buS3N?H5ML_AN%!jkH$`2j5cs~rmpvi0}+GF
z#VzT(82e<QH#LI|upe+lVF-<aUaYW+Til@H*o&qtAhrY+2t|p5FNhJxG2(O{UU1B4
z(>>o=zhL)4kKit1+xn-~u<2e8Xwo-gHQLO5W`SNW+MyD>=mnG*W8Z{0X+1QuEs*A*
zwKLiA(3_591}_j3+<rysoJDK&A=l@{CgQ6A@IXXkTEqiaiqb>w=Zm^`g2w_15qoxl
zO#vU9e}07_IEKFnj8WW((ZHZaX+xw1g_n`V)ZS7kvozXVd{}vGSc#yj>b41>5osIJ
zve<(9^0fv2x%nkGRI~ZvCiXKyiZP$cn@37kJ%j@L=%lNqz==gE-HrpKf-(MGg#pNH
z>30$ngB|3B4a#S92YiQ*0dR)1c~WSojn&A0)uFUZIrX0LenC|F1CZBQQ<!VAkuMvU
zKKmjz47xtI^K8Zgh;W?8OSOf;o7hm<f)FAbXZbrEBkFtj*<vc(bCzSt%#f%g))4y_
zRRKw|E-rOxVIW4;TubtrYcNtb9(0B{Yyb=5meQ23P!W1xydfYlbgR2hxlo+rN-*ew
zh3{L`+1)<ztb=T=**N()_lTM*-qc1lx=ziHuo=5BE~YU+NJtSCo6g69UJVt@?|Lnk
ziNR1>q2ZF*(oZneI@oN+#AzpprK3j!ms4q}Nw&2}d5|#7fdIPR{qkSaba6H|rN_+@
zLR?=Q<x%0UF*0YJUo^C@&9~pRFeKf#d=?4o!1}T??wurch<gnFg(X%b!dLGG=R<AB
zIEIfM#yS0{Tb3uJeZ-fbf%h)q#LK*8=Vzo<kxmzR!Vl<dK4ttW4(l3BT5}azjBq|R
zWsRhXLb(2A0l?aPp;nj!-0i_oyVyP7!;vn!kRTuUwh^0ejeH9!qk^?m_Y)A-dwg9G
zBQyAqWx1a`2S6ioidk9Zzmm4n!tW+9i9U6Cm7O{$2Um5ktYi`UIv5B1I5xSc>K5T8
zT&J%U$&O9uaV3r8+8K<+BF&RYVyJUJ*GKIUgDwaU4_8KlvRU}fZoQjK$S<3XmtW$K
zAku~98XO!9`#E4In-Zc2db<yVE;=x1)u(DqM-SWY*U56}gS`W!QrRq(QKRuCp59%W
znq&)$(}SdHHkL;-`CmW4XYh3a2)T$mdwP4t@GL;SAqQ$m3dC`O037IPNZU-gRF3H&
zl<#d2K)UWy=nM{(0$J2?yx`RCT<{+XVs!!XBzZ`N4)oe}ae#(v9_<*UtrsRFg+#w4
z2=JYy5v{EEkKK5o7toriRPnG3JqB5ZU?h4T-+<OT--Yg_Q)XU7JWwG$g<>`h*HMEk
zoIKk1Nz)=>PGK>PLmCnI1jUi@X}?p)%o%GzYlUrV#X|SAP3Z<8Z2|~kJ4o>`di*xk
zASMBa%fKlNAK=hPrc5Wg4`w*JF+LnV;Spj`7)(_li7d=Rk_pl=o9X+WNLJBTk@YlJ
zSd%`f1qK$aY;#4a+qMau0Z_bo#R;CpF`5Q^;y~0VhR}l47IkX2_u)bJdbK_9Wz@cp
z%&QjHM6O7oyPE;0HnwQZA|x|`306!}4>|-GXb?LB%tCBb04$*wOcSg%RQ(Pf_;tnu
z+9p)2Pb$mY7ou+mte4QrrQWGBeL9Cj!|ijeJKwgYOaM$5C18e4_d{k+NrO;^#|==1
zwia0Wnq5BqiJe6xnGnH0wzP33QtHZ(jK>VWmVkL50(lGS%uZUm9`z?ouq8QeoVg?M
z@D>8vGyd#<mIH>bT5gaExe6d9(C>8v=}2HPn~k)Nr{}21HRRa)HnB1|Jdar7dNyUt
zSbT0}!VVG}gfq00i>$9tU_J0Dxrmsw{QT{(mf*rYEaZLqKE%>YB(!r1g0JNLppq(C
zN*RzYKsAs=k9`OSyDdmOmQaq>d?L^9*P}$84KdJ$U!U6MfG8Z-#7kJ(naSypHXPKo
znWE0eIX4n)wBLR`Gm->bPNZ=McWB{>rhIYZqZ!%dhoZ+1stPcl0QpMo0rK=Eya%{w
zN|02MFD;^AiU(v;KS=XvT%e$+B!3i#MH0><-hPHbm?2d`h72TXwq$94>)kPX500`3
z&<Xi?WH8#1s0f$~s9}nlU#24(D!=cBc&BnwuqJBUyNI$qG$Z@UZVMp=@nxOS*Y8Wm
z;|cvGrqI*g;l-V>v?ig(OpOc}G+-=*Wc2;eyG2kKL6t-Ea3y|$$z~>wByK^#>uq7n
ztP+47f~xZyts4A5hCU<QD+Ad=&va5fG@$%TgaB4V#Jj4Ia)LsEJ50>6M?j{H<S8mH
zm*}9Ka=ZTGz31T*=izPTPpoaIJpyK3JYrqCTBvU8UO*@N@!=?GJF!jNcYH(J(C!uR
zl<K&B{Kc-Uai<;ASai61%U-SOxDq^Uqn;)SOhCZa?f2^N^S8qTPok-3K>-HWIaAb~
znDOV4nms|CAB}sy-lLKm>D?s8L+g;t#@IdU;?+Y9`6OqY6u~}1lLyP)_ZZD6IUAg{
zLpSbeKk<d<tBS<W=t`L~DZ}A=<M>N?W82xx&RdxHN{DZwob4?i%EUP=w6@I&2Dw;}
zbM168_r6}xoxS#0$o!!Q_^ot_AQ&vO3e?xvufMKxytyIPV~52G-d8mba$u=5jnf-m
zCPqd)$Mo1tm<O^E@VH2}S=fXa2sJ{BN|Lu~Vwe+4ZI(lBk6x&HfvP2N88R27f#&dh
zRyJCm%T;A4IHkfOBE#CTLp8FViC^kr*U1-fITu{FyYWbbs5CI6kxrgQYLKf9Z?Hsz
z$@&bnmi=LRsqZ$6(N-_`e9#U{`k0{s8SJoCHFaBM#tsM&3|(+41jx6-5eGlGuBR<1
zoS@y9^G)6Ad^{qu2t5M3uKSmPMlUrNXkJeh)T)AXGhU5(Z!xBq764Q6p)t=84+!C$
zI1F00s)}(ppd=80OGrM!r2BS(9l-f5Uz0Vs(%@;Eq2=i6^IRgUhmb)5m&oC&<-|qE
zBuralNh<e~7UMbB>6X^o#ni9g3#zILkQa1F6(9d5SLAst0^K30Yrb&c8B(#20|^(&
z041}U-#Kip8hNL-sVhnF(A(TkafV1mq89Z*G~N5J<z5$xHYQ(d+&_7)Fdf@&bUc)a
ziZ|CxkgQr!uUl0Tdc+a0=F%YH6h+agP8`Ds`{QDo{HV5rSQlsrhdTkuaXW(Ald@=M
zK`FZTcEK)(7g>Q40AXWkYe~=O;h8ukT6X@=z1waPFvxvbXNKUhNMyTXHOMEX9!?}G
zU-=P?uf|fK1N+yprz*n2G(MXkjdZUJ!(R7zxw1+Kp6n4wNO`Dp>edPV-hbwaz({NW
zf#A?E+O+Ins)~Ox{dge^>?>9qMgOIIEs;ys6bJCXM{5Ia-hxkJ17zhi-4E4~I|J?|
z#TIkwSuHO^H~Loci4ag?sbHx~!&^#q2#C#4abdQle&gEznbN0$0Xv)&o?VC|5h{KE
zK14CSsECThCMz@N50PmEP)_7swh}C}Fjf4Qf|i^Cf3_{a&bKP24=gnB>g5vumB~<q
zqyzZ>$~JA-wW8;-nYP#avq+hx3Au?A7$rEtWMbWu_vdAQA1y#rk}QGqZy|LJf2hlT
ze--~61%YtAN*vWlw@6*`?_=$^BcK?mf3PBmp0!UCQY93c|CcS;IIqheeoMbk4gWss
zdW6NcY!`gF5OFrnF+{_~l|FB~M&8@s|L%VH2Ql*hx+~y3aTYFzT2O04$^UtdzaC^l
zRW(BN&;R@9v#bD$Jq1<{Kh%E*zW=^KP?jjt|4-UK>EYs78uzT7&|3EY{gb4Mm#|Gu
zO^P7d7>MPPLW?!M_44vb_^GI@jP4p)@Bh9NAgY7Fzw^C>`vYv`BZwgk|JU<_^qBkr
z07@#TG$Uo-V7DgS8;X>hl|}4)-gRNKSk>KTM>kiYmkO%w8<mZG0ws61i&ad>DsK*_
zMNa76iCxZF4_{qpXOgvtVgCqP7mP=w8gqXAIdyKNi}=)Dypg(}3eI?VU*Kzx`y<HL
z{`kJYk^W;vC(aEgL`4w77N<y~-5OJZuyM`)>aW-5?!}?HPmfp5+}zyzmLU1kz7Hrn
z#MpkL?2ME9>Hg=MZQ?u+hJr4c7k!F=@e?=8R@Qx7&oj6Hk=GmF+jaH^LCBBrb-~F_
zfg3_)51&JRQ9nQJUkzO~>w*Y^pmXM)3-=C0I(gv*@t)R{_&a$)sZgQm<Z&pOsfwi<
zQv`!iQQPG@5(5JRtpP!c6;Lf}5cK$62!)>4`vWCo?mt(hKx6>121BtERX#_8!}`2T
zGF_O^BYx5I%z^r>4T7h3OI?KI6MN{_asLybAM2q#^dH~<ar{vi;VD(fj}`j|_&!#z
zJv5089ZdP?KV#$n(?iuF{Vf(%ZL#WH{~YE2*^~Zk{Vrz6D`#gaLEg3O9tJzY-Tl2C
zMJ@U~SXE9?Z!NYn7kyUQ0St{!=7S0)@*VXrM^B>^agmWS(Re{_n*TMDil|}xK6%jY
zkq>^2EY<m}Hvw|9z*Lx^aPQoFKWYV1#<h@S1<Seek}YTAh5+U5FnxG-v_^&}bI=@N
zESJwKrwGV?#jfh!=Bnk&=eeo>cJ-_Q;<(Issq9yK68DXsQ^`9XqDBv%JyUX8Lt_-;
zHT`l_hw_E?*$Ha!dF+6wGB&S+6^WxXYk}zID}k1??{8B}2`V?!3JPf9`2Quq`un|P
zfjDu7D(bs8O_8_(33Z}gC#9F@_^PQD?WcrJuC5<Y+!b0JAA(N5d&aE)G9wL`Qu^;z
z&R;KgB+&mohpCWUY;zGRSE|c*{Zuz1F|oQF!yr4F9Ic%J$GTjG)>L7Up2P7<LQ(+l
zA9CjZPiO&JqJn}!UAW~V=zc)uo}*jKdzBw|5EhD+s2tV)hZo-<>~ju>IBt&T93cZG
z{x_okc{@}{;3ZMoxOH`>V$ogMXst)>=R}1v&oKqa<zC;y`?E4M;$s_$+Bt3oylxiU
zi+nXrJ`Y;_FX5($5X9lT<n6c9p-4aS+AwKNU%oz|bTJ#GxhlmIA~^pvY}Y)pzBT4+
zn%}1~^JPu7P|hAFk#(iSX0=4cTY52J+ons!=x4<Fk){n|{{RtXrnWD-ekHfw@-uV>
zC#{$qhQ>`-bvm2%FkA7(1nOHpuyZP+v<;EH{r(lr<)^N|?U4tRt2JvLBKx8MdFIJ#
zlQp%gE&r5mmzHe`UX|ves{@1&$F&wN_l>;OdR}{f#x|C>3%2aKzQE1?j~&aNXnV!@
z(DFz@;QfE+7$bo7Kw`r;3Z9x%tRtBu$M^_I5=}RzqYDNKw?t)ir`xCU^D<uo%?qTn
zha-Bcxf9SX96MzVbdDX^N#Cj*FUpAc>oY0*u3_^XrMY^)Do?%_Hd*+oIYfwlt{gcO
zGf*L&N=ZIA6O&v&qwgj^Z%!d>09<54I9D{p?y5C?%CuJ&zDgktj%Ho1nLmndO`N(}
zvY)=~{aF|uI&O<W?WXgb$X|>Z&q16#p!W=3Z?&Aic-8WUm+0?f*$Nr_mIsLf#1p+j
zvQ{nUIV<x$d)zS|kz)MBFp!l#uU-#c2hWom937O!xWT3~gsXwYiM#59&R&5f$1Kq}
zI}_~(FU0KJJ$Q4&pUJDa5~5?H*l3L%>pWMd)L%Vn-N=}iTX-Lz>HZOQGi_S^3$%yn
z(!kQqNzUZaf;Hh*T!F*M8ggYXEllvFc_*Jlquwo~tKIy@mhpdzLjRmU9I8nj7z8tG
ztJK?Wtn|%jnjQN@Ly~W%qcekK>+{pXvmp>VK4`eRN3`4^YsvG~iNK~8h}h?LT_o<C
zsVES9eFaI(zq&i<mCSY!v71d|$V9HRCr+Gd%UwQmFk>>{dtpdTYs7rWoO)8GGh26&
z=68(~)^W)P`MJQl&Yv;G@p*h=NJH;G{83CFd32NbAyF+g$-41a2&q+19^~ifVl~?7
zlDHx(P@T!w_DWsnsS(lfB43P<tpKg%>~`+8%<>9l#k$W-N{bj3F?p&hR=uJj*=ZGW
z@vwZ8J<yI&4@6;15&9hFt_*T51nI=`cS_AwKxUOtoVF6<mADc=>pw-8FpM<6=RnT5
z6QR7990qm*aM^eD<+o17+Ie+J0&6IZP~NxcfKm#Bod$~PZUq1yA0B<niq}fh*$>8w
z=~LotO)FGSrd#F-y@NOVQ`tUYjZ+!DsYB!QK|BqIBK*rp>_jkE#`6n)7Wdt9312gY
zGHB0=<Ys@OPiKWRM^(Q=N$5ZEE8MAuDUx>(0nau(ET9AV8T4oHi%)-g*+TO^1QqV*
zI9du5x-Y$vZFACL7G@0z&8z&d>rEKr2yGdeOA0Vj-zYqA#5ioEzy!MM><&5;lHW^w
zS&bd_+K{a0^U0&z*IL36UjEoi6j`V&UT}7^AmSBOP_+r|La`O>0S6W~mWEhDgxl?N
zB1E6+QXtowB(<TafqDLXnR#D~5GKZsV9#i)-C#-+KRif>A-l8mT;zKudA#&%hLprQ
z#wc@w^YW;6BkwT0q0VI7MwM~LO0yB}_FUh?&NM9AkINlF{YBaw4M8mIWWi1pR38j2
z;A@>5Ky8uwpOHg{y7;Io=(J<bM1IFa$GJxrPm(cUb?Geda}(=6K2m2ZmoWyV^UU_j
zej)e4m|zuwba$~t3mtp<yHuz*_0geSM9OnMzK_Y{dBQiB0o_?c<mwiet4`SlHevuX
z?Rs0#Rm}{-J!861wN8>!lB4}F$6Wi@QO%WVcE9Nl_G4rU8$g~8JLG<5W}~{#H4F?D
zy94^a5?{f!jI{<@<N+Ky1%e7;NiVu4KR&y@DZY=V(L47`jeU!dBAC6_V~Ismi9|(V
z8CF4uP_1&mJE(gN(}<jN^|+jbl=b503DJE_^T+4u*td7Oy~uf4wc&G+dYo<Jx0~cS
ze!D>ti|Jfchp$|YwB60ex6kEKa@kx&mX_oeQRv_d<*7fU%<E~IW~>sIA~|t?*wrT?
z+C&1+=^CHclT6=8848HTXH(yQD|?XNFKryBeQ#FpdqDaJ^(sJ50-pP#JN8Xt<*xi|
z%|oNlo7I!;G`iPAL1UiJHL||P!OG`^)FiT0w~M!LvNvs4Q};R6K~;otEC@d)*oXpA
zm?hJjY5lTN5CoX*2Yar@{icu0uMe~F^uICN?6`5B>dOAK%SafsP1_N~eyTkmQujJ-
zxHs`Zjzu6*`qj}r*J7!0sVH=qOn<U$26%jglzy^~6AZP@|HfuNAA8evTR8<H%^VFC
zx7W~y33eR{N-_dC7Hm!TOlF?(-GYq~S33NV=yh4+?b@~tyU|w&y4SgWty^ctGvl2+
zK6>6zTQ6~e+&=gAX0DK&4+EGhvBO6BD&~htPg-*R2aY$OUf3@su^6K$eJmUe4hB+V
zxuZDU-Zc35&o4{~a4HIPDss?88wA&u!ak~hO$$ja#B%jM^odxhPef*TNxXW@e=Qz=
zQ;zTEoZe^5M6D^n^j@fIGXwuXxF{Wl`6e2cQui7E6GRBdiSSB?k5&sZW758cU>70F
z+f2aYhN4-I<z3T~<Sh>}ODM%P$joSHlrfnUIx5@vwA{$jb@`UnvyAEfTWW?d^K}Qu
zdBs{yt49mIzLl504acc|Ps3Vgy8_&5<&NyKf0dA+`^!V9$C7_m#G#<JB$=}q6aujW
zV$DDje_+pZbdE|YrjqcO8BT9UXQ5)`)_p1p1Orks6a2Y1(%I83KS?-H*tC#Bx+$f3
zQ>;PpvcnXM%D)$8RS2wugry~+4iY)!yBN{i3)|~K`PR)XUB^dfxhH18N=UvL`844w
z;vz5+8~Xj=%nYmY;WEknG=at&5gG(xjdgEDKZ`-FZAVI30Oy#k2LA*h8EVZr-hwKa
zkfEi}uX@YXLo7>+N#+`ybxNK4iaI*dQKje=<*<DpP3#A03f+a|;qN>o(H4DOt(w@4
z-x45jSncN(#9}7LM+;);pW)!9o9yaNAy7?<&x}30K-sVY+UIrY-lsM3aWbA{cOiV7
zvw&nUt)0CsIb#Wa3HRtv+OVVm;fso+#hl7VE-a_)lTZO*d8!Nh598*G-Zb}d6Qm2_
zR4((!gR8^BW}@)*IMc`NDhcjzX%VhwwAdfX%cAa-3TA!;>;Sic>VZ`*!I*{Yz2B#N
z^ngf=fQ!@(V!^v#3d;|T9>YzKkX*70?^xq_oe;zB^3Dt-JS{(?-){cco>sz1c56C=
zf^)R;8)e<!ui@@h7GHIQ)9V=!=da9ZIeS)dreH#x%tkxem-h6S?jkEhFfR^_M-}cv
z937Wr$25(($QFq88(yb1Pz<UN%j8wc60kla{#3jd9tKOI9a>NLO2vNa3kAgt#%i=I
zk9)N&h|YZoJt8HO$V8P8gauf(<JmQHPF9w5F-QK^68UW76~lhq`!ZJ$vOn*8`e8QW
zb4I}An-PUUOnI8=dMp%*K;;_Yr`Ts795DmOMo$Abt3c03BV9!lJeWzIp*Sp}2fw=t
zh^mp}r_9szII;IE*l^w>&|qK6x7AmT*0js!7p&eU8tUq`CFXf()M>WY1G9*Uz0Ywt
zq$Gv!)`#C-evbNhp6`{Pc5^>HEWG|~-#Ev6{CUoM;Ep+c6-_kFv7kCUBBSE1u2zc$
z<(+G?o1vyp(YtsJ4dD|!Yr|U=0o@m?oIy>sTKLQaj}*aVjk={!%h0A(4pCj3)NTnM
zc|CXaYe#1ey@mT;?>-G4EaG$c0m!-@GL|R~tiWxp4o0;JAQ^*^iezWg!k{-13G%yJ
zy$L)fTkyH*rS(F4{duQBO<q+>s!8Z`BrVosv)1_)*kW;gd1Y?2hl31vt(pNm_p^3z
z6yXI?&03NjBdRE|dx|%Yz^`vE3c~EXGKLdAQiT6BV$8Hw)#*C*m=U<Tx>0}Vo-MME
zMJVz%5~MJ?D|#}IYE_yyJR|xDbArJd#~-J!c-^JzO$cTX$F+QFSUEbR3IIStf(Zft
z{jrQ0V5jjbU`C@&WC>3&ceDCOT<SN+uy(?Qs-#cr6+{>~GuJ;GRg2=<ug06l1#7}e
zCZY$q7+wN8pr_$wKcQ#v8r$qI*4)Dis?Zvu;A*a?1l66iQ!b5~#vYlKUW2V|V_X`#
z8lOoIaoG4hyF<R>VDmXX>AfnRspqKRBfIXVau%`Or#b2wo3WAX63vem)kE;7UkITk
z$RoM<%8rNKdaPOrMu~7r=&(!Br%jp(Yzt<7ad0^8&xcAdNRX@5tlV2JzE{##{|XPI
z-QZiTjlzg#Q4NeYWwY)C%9v4F7wd8yx$$JQ8O#g#9+r8Piv|zi{s=$}AUTB&efmgj
zStpJ-BfKJwRDR-gpb7LiA?7QY*#-{_Lx%leYd#ZGqIHT;1HC`OsqA-WB;=v4ZMGH!
zxgs3cLQ?~MU6B2;Wm41La_Xz+*^Z#1rDwI1aohd!L6Ntrff}Md(4fpCez<&oRU<}=
zjd_+!Eq-3zJbMFTl2Vf>9#M_hh7EJ*(9{Z-v8=Xly)JDG0X)#3m>3rJpAX;)DS$a0
z%HlD|et;2y+GA{fmk@BQ8fHa9OXWWJ{_60(ST*Mar&kqMy)!HN3?XX~{PytaOXb+w
z=pa+?TPO<lVCUt4=@{g|ouOP3y!L%#>bJs3Mr*^nG&ck&r-fxX#(A$S&2VO3vZ>a$
zoz7abG39ynhb)Anz*a<}&1!H%S#L~%+y+-uqYsI_@x&iLxeW7K>524Z`iSJJ4Pgp5
zX36C`Qpxfc9|v|-6(5~x!Wc=6`TGZpayx$T=kk0A89hwlw9k#@I)%m@h8(P8{xPej
z@{?mBPF2R&qS`QyFVfFL%l6*n%QosOCEn;U4gqwCsm2b{V27Q}vT^<@`3>Bb2;iMS
zic?%~)fgNy$Q>>vJEq07H;uyg#tXp2G*^0SUzL`T9{hPGM~SumE&2Y(C5V%Pb2wrV
z{XNx;e{4(B6(u(|=`B+1o1e*AD$R!hL|Z}vt9d{V^mp#59|1z<k~(hsEtgF$lBw%v
zzI0FORWYgS5(WR&68^+f9I(MLnIfo3FQGM@K2jLXq2Vyz{KfkwOiMZ)q~}8d=<e4W
z(Rl&wJ~p<apk<_!{P(xGl;P|pZ2hilNJ35~*q?W1)kcSnX-gMKk!N=K$0al)3fv_i
zX9=mM8@v2R<>9Zm%fQ3r?-i3S=|?Z0zeOG%&b$?=0my&4&x@RPJ8KeXfSCu6@EBdR
z2nBpW>5yKd)R+1Gv76@u{Fn;XgfCR-F6`$K7I`k?_XYVJ7lI`1VWnEI=tRHnHp)Cz
zvSR4Z>qyWMw0VtUPyr}-gV@xSDIf0yh7A=^gGFu+7h*$i2qg|`RH6(8iV7sk?+_Z?
z5zdQQn1#qdR5UF64(d~!)mcQdWN~K#0KWVvkH`sE`GY2M=9AmF9~|`nDl)s@x{>$1
z*4n;VPD~8=C3BGKAts-muV!O-L2PTl9l6~mfFkGssey9=z;JhWFj-WlR%8r|#x8ju
zEvw38k{kGu8PQOdQ}0S=gmH``G*xXuz~3cvRErXp9HYk3(^2zVad&BvccTE!{L^}$
zoXf=nM@00o+|Wcmea1?aY2xAv4dn^cZ{ZCT?6S@Pu!J0u?5f~YkDxL);PS&R2BCR9
ztK>?0?VdIKt|+CF>=oO*x}d9PJB_eb!hKF5k}~=&2S^iiD$lP)2~94|<J~})$|;UY
zB$=W&Fb&ar{s`mgek2Vb4^0~Bp489VjowhcyKI>%s%ew0Rmb<akT1JU=$4<#)8g!u
zw<9fj2I6`>*ShSkaH^(TXS9ANfL~Q>aafbI)K7%Bzq&aQ?oSYvl4bZ{|CCYC*`$oc
zEN?uZCr_zCUl5pJ?2;@Nd^x*6ur3y4_eqy=WDXg8xx7mrbqNwOZUhgSd3Dm)D=6dX
zo}Ok5hPux1m7DA<GIdYQT}?Ni&1zgqXbSWTukGpWfMO9!hhKp2Ya>oXnGnVz=761#
zT)k3I0d7cCr$K9+?{%!qVSD94sZ}<+^I6?9?wY96vZFjk$9R(<WZXfgckCsMLUzDq
z?z|g-)6e@{VBl6g-yrB4Pv3AX(GZgdF8|GotakIGbG^;uq$!%6#+Jed(~z5y?TzW&
zx3)lzpIQYGw<pYLq4%9bPFPx)|1}Rm1|Ww5ft?6&Mtz>Gi7J*QTOzebB&s!44tE2S
z)WNLV93f@Qa!_{KoqKJOsU%nLEKAN()?;kitFoOlbJvsBa@kztkctDvg11swyw*=>
z&NxR<n$K|H!{rr=>uO`ql#O}<n0@Ac9o$uFs7Pv4m6rdg>dIh}zmrLlP%nDGaUKpD
z&f9jDQvDiV@Ko5CxzZ^=o)g7v^Z8rcwEJj7TTqY1`*<y--a;I)h-zoa9w@d)g^f6a
zCL!FueD$RH`h^wA#{5ED+V)Q!a%Tog2Y9${G47|EI5gvTjino`UjA7g{`Oe7+z#;L
zDVNr@?O%|NuQA@#PvTJFs4L1-?g+a%_$wKuPhm(lLpJy;+f;#=A<$wp=Y%Skx_XtD
z;%ctVj#P0%vCu2G9D0rGFg=~IYnLq}F0K!A@_~g&WmwjGtG<s!QF(EA2t>UuMDu~e
zf{C{+^8)y?5p$_xnQ_cVx^654Jk>$HZOBTH<}tXd-gH8z54%gf5p6ikA8Vu!qN_@1
z7VZNuV~UR&sy0M8UxPYyA2~kc6R8~aqu#Ok9)56nje^k<99$)uzR|pC+jC5AAiMtG
zKq&wKYX2m3?+`D<639_DeICFeg`l}&p>jXroO2y`MQ6Dhp>TZwuXg?03&3rtTmj8D
z#%2zp65zXRG@vWa9LYEvIdFt=K5uH)BOON=WbgYGdhNzfwU4wf<CorX{*bz>qmPw0
z5Z3eI0q<m%746qUb_RQ@_MP=YDRkgqSzLe5RI^`BcO##e7>?BL5B3-!Zgy-zsOq|8
zx8B!u>0hX8YDGBV*eZyM>ygiqQEC7m23g+xwh+2!!S5;=JLXoPrk-JsR7k1du|Lq`
zLKhv}N^2x$yXpGU(*iUVgI5fWu75@2j-QQuV{KZOBk~sE7am*|xLd$*EF)b$!+mdC
zsTtoO#D#6BKNP-4^{G?}36w<9Dga!W9Os*8BW|hTa2Lbd3!=?C%(4_*=bvsT=_L1W
z*_3hEeUTfj(-k=o!hDTkwcvlu3W%z06cldxb+;gLbEi^ziV<)7zb{=9a)c%RaL(`G
z3kn)XMmBRouZdhEZDv-M5Ef^R_>vsJLJ&4QOpa^<s?WckxN7ewFG_j-{7Q$BEvASK
z2_FYVbW=}_W>AulGM9)dTa!^d!RF<A95a6CxjfCtv8QL~rE;u1gy4*Hc7XgBWVWER
z^3fVyPcfYGrK|M4W3SOoVIj89aQ`5ezi<q2lz0;ZQ>Oi=0g!Uznf)6%foe+D%Z^07
ztg&(_@zls4x5Ns8tcMxQWZC*@hQOtNm-jYDmKO~CImV8oz{=f)3pPZ=%8~g$G3%cQ
z)`A<7Mysrm{P7*s4bBgzXvy(FAT1ejFz9kIQyG1;-l`P2$>9&so*`_`8hJeb^Z$PV
z;lnIY4RTgUA<aeS-=O$+h|I$XZidSN5*Xa<#0oC(E>~4CednI#qrU~oo2b~?>-CqY
zRSFbURY6R!VwDTFcFA4sug{VOC|8JI4hlOknZ9)rT)CtD2xwy+;)SSyu)UffK1Y1g
zj&q0hG@tqbUhwB}6Ee>;uZXZPcr*@cXk5v%1s;bDaG=ObkU>*LNy+domBUuM-D%Ms
zM0GOT1Bvyl>(l0_J&vuVEApT2(^e&1@5A^+jtz*eUdmbpF7UsYOTJo*W{|l42>;ig
z5sO;|c5z70uM>@lJbf3|Kqn>~6dt{j`0*b9j9z$Har~j@PMtA8M_$s@lq{dYH+;~)
z+ScAqO+hhWvj?K3!|l<R>onT!o}5_g>S=3B4-XFynDUdk!e@XU#aikonGgL(nn{4C
z?>0}|Uk}XTX%2cwANnEQpf=V+YcQ2Rk9A@Gdf+<OQ1?&}0euEkR<rC5gfbCd#25IK
z{D%OVp~&cedia0f;_@)yr%!z2-`QnQIVuXqk#Sgp^?h#DX4P02{{uY#4y8c=4jvW}
zo5_EBds|h;ET^}8s)3E<@6+pWz}ea7RrQs`O));GYOBkt&Cl;{3-9h9OB4QF-#y!t
z(I*sWi_wVq?;c(r)diAU4$aQ0)YAmZ(FQS&|8+*40Qmg8nyRk0WQu383&$&Y`Y6AM
zmgkYGvbv}P`|ZtD?#DNW2-xV{rlEE8_keCM8?fDDqy6yZCxRr*-$BfT4#?u2+g_m^
zzv<7_K{^bW$0$1bfwHG*F%Omf-Pg-&B;|D$47I(4M9)y<v_;Y982jwGC>2#bm0~{Y
zxB*2R-npiWK-y-d#)}L#a$i2AaH3pTd{7nauCF++=j$h$Z38(qjAl=dxK0h?c%A^^
zV+%x6n!jJppX-sSvOfk&nS-?HUoBG}4b(TpB;c-(M^0ZI$Y3=e4yknzXFg&nd1H%!
z{hY00DRG#TzA=+hCqjciGCrUF@~I`RvXHTv6$b)>L`7R)xc>uGLV{z|*O{1^=>#8_
z%W&%=^Bdp@{ZL+dn8xhou8*p&x-ghPz#OgDJESw#fR@m{FRiIB+_q=e3}^q@5K~L2
zOy0exAo*%YSeW~rapDfzzu?6oIc!(0*;>W9C8)koRK+#vpn6IluaO}1C423N&U@Bo
zu{D9k>1$CazeOMfSrJ}kY~-<olHpp4$B}SFg<YAYinOIx;gRYH2~WIZLXDF$HM3<B
zsTBi`H?8-s>U2eJry@mVWpPEeYD@x;lNV*WG{0~y<+{}L7QZTgI;1)`;%{*$fJ1om
z5Ap67GKrZs&+DP6D$u|}QBzf|Q)<l9`uo%_Pe`l9_<dPz(lf5Mh^t7aWXUa`l(NgK
zn;fBbim#NBu$61K1o`HfhC+rY$C#K3#?bPGzxX9sJXPc#`?+O@OfKc;(GRgko};qA
zyfPN_v9_kX)0PKmk_wz<Z(gb_QT6yA^>L?s=xnJUzVzn6FMbG1-EKgpv@M)!M|C+0
zaURYTsp|VZ2to!F5LY?vN#B8UDzcje%c;<O^ZC1%1}unX)zk=wFzjKN;0@v0t$x!=
zNUmt-)-4vaU4J9<?n_hKlD?c4v3y#@TSP0M^j=HLvxU*92}AUr+BGj>fO&vXIZq~G
z`wExd4Y!lBdekpE9_DiRpguArSD?n*ktZ{-CQgkrc;qqTTT)h{NXX0njlJ&RP`t%q
z(FVB|{^NTI(FmPu+_;ASyywF)*r8NYbAeVTn?HN3ixK3ArZYt&lgQCbQLjlXmV!HD
zOV&9#&v>?UG5$7ataOvhfsf<6quuT@73JOR)VZv^S*&DdQu7L?(`dCqKe2n3Db?-_
zS*_m@qVZ5t@sWRL$Ye@tk+?H`KNKBP^J9Ft7RFLD^YiY>j=gC8_nk8M#a5U;g?gt;
zX1lLAe>d-6$(JmtKgJXJgNgaSz6fX#?h0wQ%o5z$9+5>##q(}-*{fUaNNYcGIX0wF
zz8YFt$pqEIsN*@>i}Ko%IZm~Nr4HT~x3#5}lxogFzg<^;ceN~`DWy)~xA-H~yWRVU
zPKYn3B5p9arA&fvxhD+TvH0V8dItJ??BO%qWz{n$BED}Pj%z&gB##pRHTPM7gPR49
zuQod$)lLdn3%k~o{+*VX;(_(>epLFgiG8(YqcBymmA0Ay;0>=qm?_Spi%piu)?b4z
zp;K7b@4y#ujZ*Q-%&WO#5u4LI`2ZPm?{s|LCX8Hb6q_R8*t<AdAQ-0RsfZaSzK3b5
zqH98Qb#tRG*U}tF9+92p?;v$<i=+rz`>}xsM2uXCpMGflCohtY0>+Az3Zic&kdl%8
zLA*>qm)r~gtMPd-!0pC{Za$WOKdj(C6dggmOD-;$>Y@@G18tH;rI*^_h@}WZ;;ySH
zX;-afC36hW7j@J|lWC_fY!Qe%E^Bn^tBuc43CV5o{4QB3@kK5Ue42|*ZDmoPd|oY2
zyKvACC-u1$NiabnCP19TpUz%pfj*D_^GR_QSJF!x1ZaKg%NB5(4O&cZ6!Dl+{@v_Z
zWTY2=*bjpU>BlWNhO?+B;!kw{im(p9NT=w_V4`t8;dswBshGLpo{T~&3P~}jsVBr2
zhM|PGe%>!rT8Ah07;AEPh!-(l&li83#FoC>70L}u<@`2>uB<&^84*h;`)f6(Q{&xj
zG@cY0v@8iDiU=O^NrMV8e<Z82t)@v~@M8fe&BAFx99gDO+US>0BP4yTwPVj*S%s9O
z{j{iaHP!IbKnO<OMn&$y33eTc)z`SbIX!HFD!|GncyPfsiQlYVS45-0oN^ZBL{PC6
zq@0~$SNX}R{-uY|w6xKum@VDmRU)`=2I`e!y2CiNJdyL~Vh`)N?<?g*k6XC-RlD<T
z|9#1Vz~iOb^0-NKL(U91&rnlO<OHFiGoPp6YtxZ&{mPU8RtZ3ouI-^)Bn^rosG{kR
z0hiUHr9%CmoD8s4;^WiJ(dqbE@e_5hT&tkojL={2SqGMwcJ>fVrPw;jE+M%t72HQe
zE3+U9%~d0wC`|UzfeKwT$Z(5K^VaA+%u$yuPMzh8PZ0GYdEao-tgCmkCv|!1b`AK|
z9^>2Vj<|}fC?C>RlrrqN6*4W|a4tcZI<KA@=Y)r;J+U>&FXtDx@oT$rSRHLoL4NGo
z`^bIWijoSJ?FcVMd^a3xg8m=YMtcjBYPeoD*lA1^>vsbcR3`T5K5H&WpPAot0D660
zFUdf7z@&_a{sgh#c`>X0YCxEtFX+?;wCfI%Ja%aTF=+2Qh{^A8Si15b@<RrEON7;b
z1zbGj<TEOo*_ABg;^11-&GVO3&eR0{Kpv8dGx-NM0VPDbWP1y8UG<-6|LJD$(h)uh
zDM%~i<;;A7zkxHn>RX|LwE=vncxJ`IN&$W$;YYVL#$dlIb2OCuE`Se?fjg%Lhg<4Y
zCXHxlr1=2>!`s6{84?9?&Es7-+eUFpAyq8Qpjz5-EBo0eLjQ(BW1<E392}f?3b-<(
zBQmTYM+6S5P1RA-X#G&)298<JyviRY(X?o(Lm3=plaO~cpJ)3$CtG}?X>~mITMgD#
z=tXOiG{Diqs%}on+4}{RWJUD_jx^ZJ2SjdGUn4E9hDxJX=*&CxUx~=HjGJvq;{})i
z-|+6~YFFt-{|1b}Fd&f6hNsW+t33R_mLnFBz`0!vGo_K{9Tz@JA_AWFpjjt#CPQTr
zXET8@oK)a)laiJe97e6X5W6?9$#E#5Qvnc-=LLtMv3uzoR-_D<8u*zRQJY`0vVazi
z8B5Or3Qf?pxK&0vvM8q|irp$aP_vYR@*balXDXj`f*i^|&2G!_RB1YO+ZejE+bqt&
zfnX_@_pA?{5bT<WE!gdFTcOjlcAD&Pf;J;hpE>A;B9|l9Q4A*IXlU?fFQIzSqKe7=
z7uRFN(~mvShFk>=Cl}f~Ih>IuoP}X>x~fDVdXHc6laCz8Jp5`V+V(D-5a_OVTc=%N
zVl=JoX}pD*wiMqa6k?wJxjM)UTPLtFxxrY<`)I8)BUgrEwSe!Ne<iy})124Dq1h<l
z&itZ=yN5)DXu64{c1Xn3xwby64D0Xo%rXo($oC*`YDzI8I{E`^&wdb!Ko&@;aW^e<
z6!Q0^@G<Zm8yBcZa^$jXxa_%$#pC2uI8z$1jab9m9hueE7S756#cH`Dmd}@&;+!~=
z3-cAUMy>MY4=p_fY2|6D=tnmL-i<)-k#T)^z{Ui`M4!q5*cPA}apOdZZF&O9v;g1Q
zEsMUw<w#S+uuye!#Up1fOX;AL=aF0*TdKZU(govBW^n1Zz!w%=;2ymPnAO?<>}wnN
zQ~6;x=N+SlY4cbmaIft2yr*|jHHyJX$KkCxKQeif?qyYDvuO&0x0aa30aEW@C5I2>
zsTkh}2SnrXMM4k6awHCpHJ-AA#Ui_FxVJbi*jt`WoMXomBy>MWfNLxOy8V|D*>4t^
ziwvs!<L2M%lSv&7swT@>BvF0uvRsw;VU@_W;&)R@VoD!teA8tq-UGePR;Uu2Y}i?v
zIM(fZF*My5z-r6Gqi#aq%N@M+)MUADfAo6(Yvf=jK|9RPfvD}aUnT9<h6?GFy+z+s
zuPRPz$h0gh=mac-nwZJk?WD5jK=yNdtd>1RBe9AlryQ;?luxZ$fOaVG{#*R{zBQAk
zh9$>5uCyjxJC1ENDqKl=e3>=GinB}56BsRiY^FjMLrFnDK1037l8o6&89m~WPc{!0
zu?Oc*J#j3g&KYfH&;<O~v|C3DX*QW52U11lKp|izqj3x&t0_&lFsz-y;~Yi(t1AFo
z#oh%C6M)cri{1t^YFti&1#k{KIybZCN|~Cx2rm-lSw%{Wgg{|Q0>UfWgdVR~<LUT2
z&2j%abO7Ci7wO)+eAA4Al4E!=nwuCLX%aos@g7m&9KM-R5&lwsi5@itpAgbJT3Xs7
zTt{V#js_IZ$CQ_TKk5(F2b1|b_8MD+^aL#s!n^aagldEmxG*M*Qo~$AyvP+fqZI2x
ztb=QLob#y_OTXBCI`4dTo^Xuq*}k$H{CY`L%G1OG7SP8bg3c-HQNMYL=j(#0e#e{c
zCW^Fv+hDv(WJ7C)x>TH7`J*(I4NA+wf3~vs2K^d4IVd5BJ?{;Px|F8z!5mnrB)tMV
z2pc4h*v9*jcn+9nIlHAe(QtIADWq(Pm}LmT>tVzjCW3KHL7h1}or~Bu?!^RVtVIZ=
z@~H2zGdnn5k>9h+$J3qD!F6zL=aJD9l&h95p>ST{{0XIp_@l0pR>8hIf!1iwC`z&C
zsGsy`#5{l4t>LP<9#$d=KH}HWnJI>$f{pbT7Vq{)Tu#4+ZC7JKks#8?4h2>_*7R=A
zN8dBQ`I6UF1ri(C=`WstVb2(Upq_)D#9{f3(!Y@4W}Dc%ysm{HTB;x^h`bFBGHYy%
z3rg&wP}k3!28hj9oS%CO-Di9Wivqj4h;I*UL0b})t`~eb*)SJ2hDzsa&8!!TnX2eB
zIDEc+%dgbv95)pxY<~%P!#Cepn#iCHQvkJ<%3AJIaa>U@ot>_>vhq1!mV#QE_KORT
zx$*KHMr6Ul=k^8KRYck=EzW~_1wvM2U4CvAjG>54?ek=-JIS7px3J!Cnyle%foxOI
z*%|~R@g8QeI9g}~>ych8)A>k*1k|Ul#^XRHe=dIwBuJC`?vsKKNZ@l-N@<=&B(L_8
zS~{;V%weZ8%Wj0fLMkPyJVgt(6o<CwQrmUEFBcqDA9KhRI-Y*Oe2;CY8*)V)7x!T#
z(dTK_dcb-(h<^gmu&08D3oE><bC*+XMr>V&IiYxG(d}w6{(kaQJs7niq*}76n0})v
z*>lpW{<xwvBm1OqQUwxQotzb{<-Ccc6eDq~ye@rM61xY$Xr#cR18pRUCrRSb|L-gs
z0UTIuTv5!N<I!LEyX!FoNPRNBN!v~ct3&7`=gN){S5W0|34a?yD14NLN?EvxZ@V3r
zVQhX^&Ex<b&u^)!tDM!7N_Ri##D22*@CdC)6(-<{6p@`U7B5{oFghD1ev>Lpse<gt
zpCYb@W9{k?NQ1!vWuK8)=Oe*cQiV|$0Cq>@ciV8KO;t&i%PHV3>?!_nh0}UHfAGAB
z%&h9Ci#F-&`Ew^;EX2{bg9~D<l@a>PW36vqk1?ZfMTwo7j}+xgm-XKbhDoHH8U1=R
z<tKr$yVWZjiiU#T&9QHf$6EDpqVh6JARI{<yq_i|r;7cl<7#7|z`^G3X(Pdyouh{}
zmrG{}`mQQ)OLMCmWAeMm1<!P72eC^fwXHTGZ8)!t_u&B6BHEcZI2?q?!}OYLa2HTl
z6Ss!V5{25Pw;pl^DWxFe(=~-yo&RQ#d1|pa;z%H|s3$DG^)~bgJ<|HeWtX9JeUA1*
zp?BSA1#N8!B4>!?N-SY*0pTKkali1OjbMwX?+I4&N{cx|%n5$#nZ(mnQtcfGg<kzE
z)=*UcXI*lJ4#wI;!OZ*xl*6K;8*@YS;pIm@O8i%B?DC9x_ku%HTH^7pF@u4STf&p&
z)VybtE}o(IK;8+O3Ty9MkQ2{|3jdI1A+#a=2g?wb{Zpk65~thy!l+=?30*<wnH+v)
zH6kPs->x#Nl$6-xCFpH0G^Z9i4`6qI%klNj14tQ`<TlEhIs-Gc?}9W`TCJ}5BP6Fz
z0ED?nr1jV@y(2Woe33IX$0LU|$uWBk_2LLO3Uz8~8Z`98?Q)g&$LN;xTc%)Z+4{^7
zYOY8}ej+2wC$vL2aadEn0Yaa!`}&Ht^)SmoAuZZ=cDXudz2N&%b8sU-*?tG++LRG5
zPcMvwzUhM@gcDTp&&yhKNx_P8nU75wYO|p91kE@Z9i8@54(Ye7&w2DTWntf6Egoqj
zfc@YVS}G{GYF#6O-C$cK8;g)VgDE~`s$`{qujT_dgu0@ta9B)W`Cl%2LAFpY97j=X
z|D>nbK)bLl<uP$P@6NelYPS1}MO-gB`->zeXH_9)*UTexVc+&=4&%kKFuW*m``rpo
z5Td~%1RiuRjiK>n?Rm*8?F<6flGR{@3-jseOBpa&hQL*V9!fb56BlP5rc4tn-iX$m
zhR^4WFp?(6C#O;qeBtUu>BbWWW&J;ImYI4)6;p<o`b6s?8zZ5qd^rrg=_D~FxJ5a@
z*C!UV{UwUA)^DhkE#zt_C2361YcwZkIeVo^a67zomeO22kVAY}XCC8ddKOjhT;b|W
zH>%A*R{EVII5Y)U*`3G~{QXuW0P9DFG!-k8ZxnoG5KLS#CsH_*1;mF!B2M*?F(nK0
z_wkb2BCx_^#NR*ij5j;Nq@ex--blbfUJ6-FO<eP=tUUz;cWN!<e^2LBkcdIAR!*j|
zNx0sh!e!VA_?lDVJk99L*{<$x3SRl*Xlc!z`c?B5kt;3+ggnr7Z8mA+yA9P(-2Db!
z?+S=J6>;aR@y&PPG_-O1rB^ZLV!9I&;A{Cf((GNTDHNDJB&?j1G5zPi3D*wJF##Lq
z(z<!VZ+bY+U%yZ|@i<##`o91}Y0p9+7;(<FK57@nHg+E6IIgQ&EPZXN(dGC#7mTBT
z?8#jJ=j)VPsbUw5s1>sWDT5~sDu2aRQ?W>Of1fGXtH!0Z-;ToETbPd`a{3Ia0DUjm
zSiozuu~;}f^RkkjQLRY^Z4wyoUEwQ#L_xpukPUA*vm$YmIYtu2kak->(TcFrK&V+9
ziCsu+c7fNow9ICh+t+O^)3qWl`*%{r;vAMvt0ow<2e29^$YuN7T;}O7RFnni@@FJ*
z!xp;)E)wE^$6{HuK*G4@55*DU_ppWZ+d~`yBG1hZ3agtezmZhOJLMNcC4I&@wC`eu
zF1=Lia32HE(9&l2<?*ZbQ1_tbfSnT%5g8o!zGAPtvlO=66^yl!Q@9@sX8{)>A46*g
zLbp(CWzq#ao{3+XZ8oOm%7m`tre{qQat!$!NFtG4_+*hxW_R4%qztMS5QN?Rm#_po
zrDE5wB4|RZPzk=yM7FzEbUf(S6BhU0S0%zJX9WSQi|T{JqN#=Qo@f6bS8o{>*S189
z;&gC=JA?$c;NCa{cXtgA!Rg@c5Zt|Sw*(DNaCdii*W20W?DOt@Klwgrdd)Rw&8jg*
zjf#EcDk!g9n`IAg`x-l`hh+)g$uY>UsIk@NQ`fUl0S~Yjjzp={8Ms^s(DnQw*L`W1
zUPGNk>$k8xJss8CJ7<|RmvieM8Oa1krRI0_3F^PnftK(CgSn1h{n!@@@7&nM^%kYA
z*xWW=(U3Xu_-4&a|96J#HQ)|k^BU$zr91vT_0SUJNo_zFSP^a$l^|Gt-GKlX?$|}p
zReNH&PF$~%Y>n)?ST(uh`=U$1UJ8)|Rn-iI#AD!A7fKXS9YYpryDn8^UiTJl_`7!r
zcQ;5mgK5&Ehjr<6bSV1JfPlsRT%vJP0yYOK)HAM$a^N`vl+pH%k^GMo9IIe>Q=-Y>
z`jILI??8#$4o$O}g<+AQMQ~)Z`WRu+2EP#c`AJ@_h~Kg>J_=;AN~@nF>_E_&w}(Qa
zK?mp^mI^6d1|m!!Z>!Y@i^NHNl)msK!#*5_^q_yzMC*yjncfN5qRF|2EQMyMT7p!h
z6V66C>;BTEuY>hIF_?7u8kq4!KP%TBE(vhd1FQ3AmO7NxC|gh7PM;M7DhNR$-C!@)
zPc}K9OsuS3zvqjj=7hi+LrQ6<s6aWT5{iUUg=Ln<E7%A*Hx<bI2c{x3BHR)W0MNjD
zBC|liQV7GU#$+Fvqsd#jZFB(Xf9O;yCPo)H6*}?ozss+U01eC*>KfA$l_+ZKpRFkx
zpxwC{FI$2N-?*M8Hx2i|(9~5P5ECarSF|3OT1h|JjbvpoJlZ%Fet_qxXLIC;I_3*{
z>_gQkX{M*AOQ1&LcbG2>?yhvL=8{L1GxOWhuYtuW*|1ql%O@WAp~LJIiOUQMds3?C
zv4ybw6B0nuP|>mOq|PUVM~Z=aI9Q4R=TUN#Mw0tf<<w=7V3L9hP7ajzs`h)qDYX-;
z_J8s@3$$-=@#bsg-Wq!J&HPftD%Pi*az}Q<{QT9GDc`xgy0RG08%3yShisI&M(^d~
z;Xss{Pwxn7*Bb&D%)r5sb{LHa7cj=X3FE0O*Q{#T#)}lBdViO(ohsJ@+FNfp^mA-P
zAu-asBf|F;;LDhQ%ir-h48#5t-lKo`2bu5oBp+D+8z07%Fb5ci*UKfuReMQ!EHpEm
zr&i7CZ`Q}0sZL@)P<;1-rDbOcuUmCC8Ot=JvMc>d(H9x%i*_8pCZT1|j|PsJ7p`rd
zkrdR*S~3VNPP14Bu#_b(37VZHzz)iY+uK)`SpE!aa7d{Muo&0V5U7}xOt+Kl%c5s$
zjv#G)t&)C&eQ~t-Af0a61}SW8K6b@!07yB;*&kkPt4dU7z#FRPgMRYJ%3>x^6(jYw
zQyzGvIVQ1aY=Idwcfk`bn(}f_U$v<RQ|+A0Ua(}WrQV2?XKP8Uhv+gYpIEl2u3!AU
z<0FSsETz(;qi3**raYz)1eOoGl4OTcMh&>Hm7Cw1AI!CK9A0yb0#!Hj5#_klEmx`Q
zG`^S+3=z~9ayVeHn$wBcXyeY2^S2vL$X5F=f18z!L43-P<@vhYzy;b5{U6Um0__Jn
zYfD~r-$I>HyM@zOLz;n^j8#9!6Z;=IoRbeRdLOsaZr<==!2ho9(MA3ZVM7{&G}yh2
z>y2O2qAv*XS&hM8TUEJ7q~#L=2@z93tsiu*^NhHgin$%3ErboKqc$sTX6G!GU+o~X
zFiRWlk*q3yEl-`|94*87j&dIQ?i|&eIcWFk-hVD|c)5=56PL5BuZ(2vKi5<`azNwP
zDWx@;p>VZ(a%J~)h%j$)Y~r@!Nn;#Q#z3+6wEa<waMr><t-m26QsMmYi!@N;RTjlH
z<~YCJI_(>f@%i;k8lTvdqN^nBs@=i4yjJgjmk<NY#l;1?^(=#SwIOuFh>n>Fi0SEn
zt0Vux@CyS?Rm!40wpqq*OKa_PIaNd0TM1)cXzFtp!(#OrA{wYUs}C*hOZwfLl!xr%
z{xBO&gz9F9!iixOI`d)IW~-5~lC6l9P&Q>W;;#|g-<Ys>(N_N?ft+}xwiDp|b`a>H
zF;s8@Fe{<m{0dtbP`@|eNof>d%|+oF`p9#bUbiF+Lt<D#tJ#r78CdR!%T4?5IjF>d
zgcrR`wEqDGP87bwa+P+(KLXg-UA|=4s8<n7GPFs~r*2O#z&hV916~(_0d*|DCW8fl
ziu%GyarMyMD&0>I{YoMe@wbxq{0%50)eFTo7;vMMaIx*6zMtv)TRT+_`y1NLu7|M4
za#+(J0KdB{3(BQtydDY+8l;FS^k`dathjZ{ga6QUC+wBEXLSo!R8UjJTXWNA8RyRM
z0|7Wgy1iKD=^iAc(c`~abz;oWLSR#+ApdYcC9vNpGi`4#$B5L-U7v9-X~XHbYs3Dq
zUo6AO>X%I|=~Kji-^IL`5P&Fsd;sC!+B(vg%z9cZ<VJPDUQ@DR0%5X0>c#*@Yux#H
ze8Eb$&T@?vht%x4egmVFZj?t2GW)$$C|@U@1m15n>NoyumsaD3D1;ML+}@L=a?tKl
zw`VhL^50dKanD*fVgtlNkm)ie$h;zN{;|y!j_2<BG=b;HE6uSXE3Y<>1V*;^>==Aa
za)B)Gy2fZ#`~w%Ps8mq`k);xOCkvAzOFrqN9HDMU`V|<x7suprpkT)kL{RP*I{saz
zShHS=GFE2hPHmj^hdfp~spkh(D#L7<x8FMSuWq2mXyxAEMk!O)s#WRk3~zTWvOQbE
z#V%`bt<}O(jBeZWLr6&#l1qbIv}yW3agqccQX83{F8^YO82F^IS;$KsbX=?aySuBy
zecv;XxZ)g5ri2J;G1^#sLST`?LdjJFoa=L=6v(04E;i{Fq99rZ#Pk>mf6fpuB8mYX
zMyxNE=ySe<*~5W37X)o5C6`ol$9x%I$K|_SGJo?cEv4h(Q<cqMf(ldaeJQ8=qcL^(
zei)Ahv-@C-XGoXBBE4+aGBJzp8#we`3M=fwZ-R0ZIGA`q!?wSlLop>0|9p3Gw0p6R
z{YN^@Wt}*JLF?Y*hPH|RnJm}x4JXr&ZYk3fJvd+vSznFhxgR=KS#ybrisD9%bQa`o
zDaT!nlX=?TP^OGwAG+^b{CX}n$dGGV9^j_4AK@+@g}!ZF`I0%{{X<me2v8VO@g5%>
ze1X`<vW#Q{I|Oc&9zXn>szZ=B2n+m`uc%Ehqh1e{ANE<~tL8Htp`anF$HkoC-|+X<
z2jGieyxr-I<NY0717}Csti~w(flk0cW?U#%7j@f1@obP3WM}1IFL>`}_WpO&A1HCa
z^m}%4!-OK~r-1d={Wv5NldhsP(aln!ywq4L@&)z<FqnKJyasKG-<7zOHOq+$7|Y$c
z-M5-}D$8Vi7)%>s-0~3eqs6EC@+&X1P+|Z!gb-5~H{2OagqVWMLAu7VCN|W?^$Gvw
z;;{k0*$nxMgrg%4MSJ;a0PB9bO_gma<rk;e{nUsQ0OyZz>xD{xU^WurQ&oF`vh-TS
zt+lbqsTmU=QCm4#23$@2)lgfl5jRMM_5Sdc+MoDlAZ~@{82t!tJM7^lg&`l(<z_(2
zRXUxnj`Wy0zx2~ceEb}yA+xQ9yQ}Eo`i*fS+2kkKJ>3d+PDKb{ppz@ReU43<3T<?_
z2L|W9&zremqCBV}9|r?uvjsER(g<G>Tm;t!IfK**{|kq68(;`gk(f4O{^kCXM4?vS
zp9hx=%V>0jKcjT>gCAO>ivTLhVzMXX3oM#w)MJ$bM+g)Av93Ggco*L-e>u$%SRs7b
zBOC}sej_HR9I?9XgVFj*j(|FaMCB?if5wRsLXMd_FU*|;QVcAe6JYTddf$wAiLO#^
zajE#9YQ!2s8k?Zv{C}wIf3z8N0M#09d+|}N(rp8AJG!^Yl!Px^F8pT7eKYX_pPI#H
zQC(ZaVilG#x>?a(F-!9TopcJDCPT>$g`l>xXWJ=mt0BYV>y!&j7#B3-eB|}EK3Uve
zx{O|ZuMoWh%>9(ac=LbI?yr}@_6T&|+W9&$TLWJS;Rr@y{|Zyk<!g!a{>_E{s&s6_
zpsvLR>wc7cpbrz3`BD6VPdtvD+$x803p3J>_D%EWQUqd$w^v_DCp|(<<$J67q$2r6
zyALqqB9j!#*eh#Rwt%@ZN;(xBBdxUhHHR3MurSbX%8!c<F@}WiWgyx%{wPe=e!9F`
zWsLoK05QLNEW|s7mXkASSS$qiu#F`xC6xoQZ+1JTOj!MYCH3{ZFaRaGG49^&VS=nI
z@a6E7?C8g`azT7u&)~ivi0JGB9;<Ch1#u3s>Oi?kLqyS>TJo}_b<@1~Giq_~OY9!%
zz$(-`oOo^{fdRHwK7|%1ZbK<VKIwx>$n$@N+uYi+oGsU?H|&IQnlLK3sw^%Z-}$G=
z+4~G*G3zZ);U)3I$8_upKj_wDAHMfjeH0tE9H|G#uMgSvDgP{CMI@A%*3f8X!KD-R
zbQOvUl|?KrL4f#k>xa!hKI_;!@1W3O|2go)FsINNiQztij=N+tx%nz#81(LyX8s=q
zz63!C+sOnK{m&lVaA<HB4;Cr6swKNbbI1!akZ`*Q1N|<{3VFIvPB<r%QZXY{_6b)|
zd@D;+_9KKz<<rr*eGvoNKlww-oyL_LIo`j3K_<Fic!nyS3{cw4vj5&9WmYwTPRW1+
zux(=rEoxEHnM+jE_zxdGD-6ZUOIp4am~CGbXC5VT{1au>P8OV0NTvLmwG%$zcN(o>
zYXACaS{_su%UG9bCj9psp~9F`D9y~wY#L43$wxVhVSFWm8@1Dt4qIy%7Pq9Pf#|2B
z({J-8Vru!anhchlrL;Lj*CP_`C;QrlAii#u7t@(46Z(8N&~>b}|ER=-OfZFzj%({e
zO6qSzJn&}6s)^T)d}(I6A;Oxg+;CA{Rl;whzCnI2kSM7=0y8{g)=Mm6em|3tSly?<
z!zZI!LN+6x8zJ)CJ>5H#sk<zYz|A%(+fpr6SC&lX$L}Oc=wwj9y63!;5e8U@`3P6x
zxL3h;3?D<hFOkT0p*;wc74E6E;_|q73UqS@ULMY7x3)N@fksQIsQw<00N;_=;+`Hc
zBmf|%n#EDaHeH3X0tv=8Mri)`MMC|l)3>Yh0;9WEl^0CBTJXtO#A&BEWn}>eUpx4~
z#J&K+>0v0#{3qQQ$A=RlUOxg^PD0atSsj~tk+wz%;HWD0o;I7F;deixhJBXs)ltzJ
z-5eYz+EBzn(-0mAf1kK>j<X+E%s!SeyD%~*RN$*9Txy|#Mk%V!fWe&7?EVlNk#52G
zSw(Wv_xHrMoSe(28C7+b36+9TgQzszGUvSkc~$RIY_-o6s#*g;JF-=!;DpKJR6kj<
za{2-eMSjg~tvKN*Zu5o07fPrYVg+2rzA>NQrY0e|0&1SO7>QtF@NyKH3N2_`2)3Wk
z72}}?MOkI6n%l(VFLvcOEBc$^qt!qx#r1hN`qcBol};7n<PXU4fLw(957xSl609yH
zo}V8i7vxnIDtWy~UBC%!Uw$L>#^eIL|NPyE(89m9;IM_`y)(iUPQX8=T1pb8kXmNY
z2ET()iekf>%KTdDZocrq!i-;aLN)P|P?$V#S$-;_a<gC+GrQcd;Fyd>L`nTZDm(d;
z?eo^=?u7Zd8k>=c6m@2$a!G(99nUX4Oc}LfqeAx358S%Je<)A1;B7zDj7C85S3O@G
zaeW~v@Kkr;#*tb!_EtBwzgP6|esCs}Xcu52&nE4jcA50RjHASYgEU`3!y+i^X83*N
zptM<R)R}Dl`;>@qgO_zF)nD>rSG%KDN;Vw+9Ov`VoJ|Yvc&^wE+gu{Cj|nO&B}f8_
zL;z|{pOfR#i<%sLQY{7H<O_(&xm<l>B92YU>oW}6(KDBY_qa{O@NjR5SI<6tb1Hjt
z2WEN(F0TmC^6CZ_M6LgcBp?5S>B}W~5oW9U{X4yaTX8i$N+S%SLQ&{KOo?KuJeqJF
z8EKE6Ov*7`kcRT5Fq-9{QA~lLti#7xgR>fJ{tb1~;l2hP1)PFViMMhOSyhb$0(OOz
z`2c;T&eufgyB;?7=r#s~A8x}!RN29F(97nC>U1_-fS(Q`umGGbJoZhb8D{ql-+lOv
z^tuO?+i5zJl?<irbe6R5plCz;njF_DpMy~H@d-@LTGMwPo}Q)M#cvX86EX6Sf7PCH
zBII{H`VBscV-$U!wP^O>6=c$)TsHxQKSvz}^_lcvm$xD!moTx~9(wtTpSFo;_wJdb
z*XqJ0MxUA-TZY-mV2U&qKBO7s@Ta&>G=4kU`zsNUBVr2?d^vC#G*7-u-LjiZrwvK&
zc-awH^ti`s_Fk+Cs{Z_elFeUePb?=AaY<Z~Q*k5i=J-ooC4x%(MLvzqW55Td#ZVP}
zwI2$-{VC_h#>Butl+LN&>7wGzk!`|-N_|jGZ1{rB?vi!E@80SuT9G}e3;!S%pRW@R
zYTh!7_T^<!CXQDyWBD>s`NUs)v!3Vzej`)+hUq^WVo)Ly=(-!?m_45(d9b|OUvvBL
zaMPy9f5SUhlALd80=becx3I`ZkYP?x{c2lLW<K@skUc(&Bkd;%t@P>3$G<)ccs#o0
z{usvQy}1f8Ul|ps2^su0rnJ0GM8ocdQt{BCrK+SXMJo7%u?MBtT$6@oP+gzZBS@?M
zyrp9zQ$tW3FQzpZ9Niqv|4?R$5yGVjeq`EWDJ6h38R=>ZF+FGhy~>;g;bPTW4By7A
zgrf4V_JmdLhdl-<McBU(dbe-LL3Ndd`V3U(iwJWgE1U=FXueT`H*j3n1%&$Uf7b>3
zu)CsB=pv;2HlerJl1zBLF#rVSkRco$8-3hRA-Ol@$~hwKR2qCjAm!#z!#Vb<OFm0=
zNx0lNOW1dTvfjQ&&-kz{2g{O}=kLn_S&y3F@Nz7;Q4=_krzi?^T%hhtk8?Pw8+-`Y
z$gUXnDWo6f=kx{HYA!U_Yc_!hxg$S}{|xV0EX`&U58c=pc2^%t;jR|`GKk*`5{s^z
z?oM;9iv*;gGj3oTU)JfgYj)VslE3Bup{(MxW?(IE(LQA`@Et*u$A$B|!uO*arBSW6
zhu=AS^(&P@8t@rc4R1bGDChg(K$<^!FIr`;@FP#OqxiaiJn!O&Ez4g*FTYi4-Q$C~
z5R{Kht5zgo2L@Gj>`p0-BPGu9OPBzo{w_vp4L0}j`&ph}zVYaPB>k^8n*FHa?W-^k
zHQ0`f=wx`r;1M-c2J<8ne!Hw!%h38}D~Rl7qH6>Yn>bM#O3YuMEG0u+GSgd7OB5g%
zFfRs-H|C1vVi^&Dx$=~XAT&p*?q;WjX5-R8r3YSRBzhp|U1nOTbT{v8ODCC~_;O0(
zkDy(l^}G#@$rQgSp30e};dpZZ7LVU+?)5}%vgJasxO1<#8;7Kma>(C+CJHyGRYm7^
zwRbF6mnJ|Yp)y~OXzH*WcolfP_)Dk5IM1BG!^vuke6$Zy0rTCJBbut|Po&m$<(mK~
zC+Ls?(@OUUHjPBuE_#P~hS?@8J-)s1<NHFPNsoRM#g1yryE^Jw*TJ<LShEVx<n9u%
zQu4$cW~<X*1?z84n7dUFa}+VpkKK`UNr<R1O8``ym)CWhRVxm8^igEEb)|r8&QP>7
z_bVebkLEaIYF$xk4W_)TDZBjEDMZch+>y^bHb|+3bUY}fEH`lQH~0gVoqTt51H;Rz
z5Y2D0bcL<lx`xTzdzB&8RZ001)0z#3!)}pSFD;D?UHNdUTNG<FxLQQCz)+)^41~tu
zH>|(aLv)xBBwZiWz7jktw$aE1INmX<mbmflPSkr<(eqF$-!`Lb2AFVIIHU>JbUbpQ
ze{5;+>gRPpC+ClV^t~lI1XEx{@EqaQ%#IOL*;i6&AXg9-P$$Q>p?&WnaVFWDWj2a@
zq!?zge`-p&UPHvDAY?s2lcy)MEQi*&-6Z)MC~7|H1gBo9`{z9%xF!WTB8YHpwai12
zDsaTZ+ht$_8AcsLYNav5wf&}g5K5f5<#cqBed?_t)s;02OVIs8uY7B?XyL2qLfBGC
zLW9kFbD)qCrG<7$iBrYn_g<p<yLl?y`?l1-gd_)>iZ$_tLOL*44wUS)TfFL=H07}B
zd2m+3=kv+?EWKkKYIJ=(JBXq~3nJ_OqB};&W#kN9bkeHK@1VUkopEPdaHcN~|0nFm
zVV~zpp33DYu<i)wD;Ni!w!gTvHKjQvv{<LCxs@fkZkaLn>+I3xx%H|n^@ty|m_gkf
zV_s|K+SS~Fb;(f5(Xa?IolFGH-9716?t^R8r?qp<t#6==FRS;A)&;$6oxtLm7Q`Rq
zZbNwG9haZs(K5w5x9qJHgVS$=-Bc<KEY9M<83o^7TM`;}JLry7?}tNFiwO=zY1G~!
z?>^n7&nFy?MR-Aa%|2H7Vq8Y-Pn7pB;ocd!5CE(0Ux!w1Ip9${GW@Am!J(}Qy)jBn
z>2IAz&LlFwiS96*i5pzL;G6H}R?czF)iaK2Io-6?+(2z1dFuyW6C9}G{4^*Xl2+5=
zvNu4ACfl9%J}FWBPYXl@E`z4wsnJvxFRj<#<mom*Xu4R-c>zMslPIsU9~2e8MJW{D
zTqLi`2!K~cHxzeQdCd75Hegt(Nw(`7M=U9X;}ZHSud|=;=^*;cd`?O`avFY@>zlyq
zRY864LyW&*X4;uGc)5t*=Je-t%!tRnax(ckHq006j-1GsqeE0y&*~7;1{fo!^Y{+h
zu@2<y$6-64sm3=cMBF#=#DmW_>MdqO&6r}YeeEuND}xV(Sj>0i%`5&WtM+|S>gI!W
zDl{h%7Jn!|rfr^jjal)U)z_TNfTBQm?cYdmeqB;P-ch=6=t&m5k0SFLq*7TfUFp_%
zt*?45@5)S&MBQ3cw6=HWYxa(qR8TQm{1T4O`)f6q7ZfwSR0B=V-wjfnzVX?09&e#B
zIT(^2=E-o8UtbAS-LJ5`t^PXV&0b%@`1XurvDq5N0f%~~i@LI={m|HquJ<7D$#hZ|
zEjL|`0N5`72l><jz5J*okgZznswE=5$)hX$)_YXGQd8=SHIPe$|A1MBmb`gmj$>3(
zeUp<4kIC@tM$yCz%x3E{D*H5!dqthZoHHCiWO*oKooVHL1U%c0;rLX_kO#$-)-hf3
zvS^*#oDy=oD0+}gJ|2eoTVtwKPbTrmL6T1vgN>5(d(?MwR$Xhm^0G<&iolNjkC}Y4
z<tw7aDUIJ<D-`5`5<v`&_&wUJ6}A{ev!<wvt~)y|Ro=n=uq}<Q8U+Hvzfqt&iuKtK
z6xPxztnHDN@|o52V0c!RXMIM=06^O!4KJ}L;B&lwJztQ82&8MXuKLIpoBdKc-K-l?
z4r0B2tmc0<bVg=XrwdwuVg@6h`V^AJ%}u`0kMWPV3z`EK2;5Ba;T@NVR--G|rpka|
zwvO-8b*qarlNd`CWRI@7<(5C{j6Q#2{vJBWCjX79ZuS%I5;Cr<pH*R$tqa-ac@9Xk
z+6R6{H9_eU#B{1@Tij)OhM~aj%Y6Nv6X*RcaN@U47I?a1=<66LhU@XzPj%(uvC49q
z@=STIGroLwDrs-nDrE6s@Sw_GNnq(_mQvOE)S2(3@M?vX(q?xwQwB21E(bC;joTm~
z;V)DrK>?L~4B13o%nU`mA0e6r1ejiu-n?$mq#T>iQu&Hr!->pJGoR6Z;jx~RO3MdH
zel1ZN{+}BL(djtkC9)U}Fn*=s-%Q-Gvm(ev^i~8i=BHW#hr%L+GEpc~%4%kxApUzM
z&C(;FdxUC<In<k3ok}5W9=HWtOJ}u<b=XIPk=#E@BQAyBx7a~)Z81T-MLMp%HVeHo
ziEKR{j{brs2`vk*LqWTT798l!4x=`kMzHqRMLLXM%on(Z%yjmKYculALN~Hr_8pPh
z?(L9F+tR?Aq8F~yxRo9m_SSRYo%VA(an0Hi9?(nLsfqO}=_>fnO3j0o<C-!`LyX^y
z;R!D>Q^3ZCbS|a@8aXgyBZbg<pL(OY{#zBFPEkInphS~<30-n0<Df`@A)^hQ<SxJU
zc41GK8%yvJBIi6DB}<eZBV|=L&{O}KVSgOi0P0z2CKlMDcX+#SF?)>c=NC--)#yJ*
z6WyKaw2Ol9GZ@vUDud5r)VO$vrx_y1T%K~#PFJthNV5EaoiO1Oue-cleloc+n~KSq
z?fpnAE+K(rG_@h0@BA~L!WRhGOKR`2WZ^2V)Tmq1H&G#xX7F0dcsXu$9^7Cl+dF+S
zsKekWdEROIS?>$c-Etg3XUYqR94vfc_gt?xuh5{wf=lxk+Rc@#zk7iMMbwz7_Pgwl
zZ^iC}4p(m_)ub3qc!DqRkiPEHfw--q)qE$=oTB%n(dGF&MQ!aZQUfu;Tm;AYR+Xm(
zlbtbXxJ&}%%ZTGID@Dt)0^nui;}0U5Xx@+fJDH|!5I%?W^BL;p-nSAy?>y1$*KW;I
z|0jLc2$%jG=My#!#pl912u_Ta`S>78H#D}3w=45?U$4C3x7a%rFYf1^p#-nMZl;G`
z0rO`y_VZoplOK|O61KzS;<eORkYtRIs6|Kbq&S;A|9B&FFxMnR5acIug}2^Q^;X!m
za?VwJhtmNT)OZQLeL1tFV;;!OVmoEoB*9n-kr2G55{3+ZtMYpMMhYaXMUseV@qg5R
zsn#+enepp#pOD0dx%T_^kkJf!`s}eTO6d(5*5X2DsGhAq@VMi3dBoRgS=)z++pG_o
z`f;qv`!FTa?(LI1dCXoI16MVDq2Qh8O221qwT3vR+_%~==(U#JHi58w{V@nVEvHcf
zdvB_FuX6Xi(L<W-beK6?>5F-7bMVII+5RIV^MHD;VlTm$aLpmX=I(ht-M6gru)L93
zf!fmr`UmgkAo&XI;r>|ZeD5bR-mW=MG;1-GUsoQpUTGC&4&1#U`JO}t2lKi(=hG04
zlHi-d`#i-b=m@>D=jd8ATXip&J&-`b7=ZBRoUb4o&#UU8Vls6Sm4e^2`<aKX72}RZ
zgzDDooET@$Tj>rhTJ?^pi#W5lYgJ$}Lv!Dxnq!2&I&QT5DI>-*{zG=@gO;h)?PJ)t
z+iHhhK{1ls%C$NjpPX)k)`HQoiL=$5Yk{&E0dC*ygU@*SQ7f6XzJ4kLP5lmony-X7
zq}rl0&-@d+!#qyTF*!`2JJwTZi>wO>)YW-+`9#-)n`P{c>B#=vIhTl*d|H)nxmcN)
zP`g3Yp2bzxLGrV2i}_c&F_rF+kLaxu#ZmolmR>g0-Gepp7cb}C3?myy;{_OR&exd1
zOV;~Wv|V&eu97`Oslr`ei&7KLSI1pa$LnR$nWQ<=P(9+9l1?3*RSkIBux%Xd(XmnB
z<=XC$Y=rav!{6DhdHJYh`Z~eNN8{&Gd+>fqlH}GqORCitziM(J&}7sVYG$X*Y*Mnf
z+4Cp+XK=0>yR`?2Om^)9sO;tgE|1q3Vc8OfjE~{P_p+tMCFwvyJ-!=1a|&w*8~Ud2
z5@$YlbLPNdh-e~4Q1cRfka^JZwz*J5IHv{zWaE<~WI-@VIlmP|<<Seh`kh`r8Wub9
z#N7fSc;`FjM=UJZDmwdiKQ3S|>`x^tpul=a&P8y?>cB^7T-4?r0z%I_Wb8@MPtTHB
zFM4CHtBUe7m=DEcGaaA!1JJymxf*zADuFj?5A;Z6?zy@8x8GPe>H|90;;Qs>d+hbM
z{I12sXA5i|<-@S^Z9bDB9!i4wQ5sEB0=esUv3MIUMW;#$`3+Rmawk8U^h>w<<erRU
zJAt#K&-<W|_E0?u2i~W!JbCY&C}~;k>o}StnUSm-2XieyqkCVv&A6Zt<`}>YE8*!c
zGma>c(8OFp=Z#DOH8D*vMT_u9$*@FbQD9TMUVtj+L0m*!$y8+9^;5G$`LUD?kvIz}
zof>PlZ_Ng%G#?~~4Mi@$h{q<FW~+g66vj!U*KXKch@1$l<DcW`7AP%`=-r40B$?oi
zk=(Zy`EFlyq_=^QRWpM>VAMkLkGL#fH0lq|xSWXS6A{sOZ<qt#LEGM*VrBpX&yAqo
z!8i@cxRpMQ1k?bVED|g8gr|Ikr)W;I-2Tuv14H`o`E8=T@2Jd3=Y_@%U})jqj{|Fy
zOY!am0y?={D+h>IG%tgz9=rv`^+Mz}ggxNne=C%BK0q91gu7E)BQo7922H~*M-4aj
zNiCTeVg-iy>mt$r^#YizlOn?c^Ypu3G&nKuWb??jG5h#t>!8zn3F-AI0ZEKDhQ0Rp
zAK{hCvf!Uz-(506nwh2D%+9)s5<(JA%h*&3f?`^43Bp@XdBok1yfSz!qE9iW&Cc{)
zcL@wqJRu{upLm0=Nh$^`0)>KZ$cp%FoefCjgcncUO-SF`q$n_AE|OP@&S5tKEhr$a
zQe^!3r99UQz{opVLAc+LPowsJW{&^*_A$HqD<S_Kb9w$$ayF6uBqr6I(TL-y^yqN|
z=!CafGQ;CktL64Qw|DwS>V22fA8P*K;O9g8ZIbt2THdbk-`eC^8E13%iWIWtyMqaO
zeys3a$NfELXrV&T9qgOvF7wxjnxEceynoT;*IsXJlbF1e<>ZSdXnINl8irl*di0&4
zTGGTrrdY>{uUAQOS|)q1P@sRh-fee2rBQ?HEM%DpU-n@hH!8gcm&gMU?Y|tg=bYlL
z$p+Yg)G1)^PNr>v_)1+vw5Q_7h%wM9J9s{=7+c7@<9w(eQ4#RSZ4Czs0;|r*334us
zh6YnHy2xvfVk4$ym;pq3{UwPJfTfKFtRF18YH>9_0)F+U97pmxYP`B@X4f2jtagHa
z&bM3C14U1YXt`~{x^3U1mNGIOrxh&DXKg7mp!F5+A3>KzZwE70Ryb!)Mbn%d`^7je
zeHtD*=2g*<s#{IHt2nOi9=XYgd~@ZKe^nyy#F*#Jr6KTnQgT>12ey04{!Q9!1&L5l
zCk*50h0s4}wf`HEf1z(%S1|CLPCTkv%y!fW9S<^jjAcZiM#F>BuiP)F&aRhPL0_al
zskNdtXj=Le(I9>1rhf_j`?UrgzxDll$UOvc8vhw#rwFIP8qcL-P>I#SiE2?B?sg*J
zFZdhT=-31~kqcQ$*<G{K1QkxjWQ3AC+<3QL0*8mT6v_SUyja!aXAmlW)hUM_*Xh%}
z%&8JAyZbxxbRq=rqEvj;6E1ZR9`XcaeR%wNqfB)4^}H0Csa+J@zZ-OhLGzsLXjsRI
zhi_p7o5dMS7<uGv+?)>oOE1MR>->7J@4QJgn}}V%dPNDCi*ACBY;h_oImi46?PO*j
z|8C5?WI)AT;MD8wt@tB-gHm40YewhfG-SUvw^l&%GSI>*TRY25pjBU$wHuPj<ZA53
zx%NtZH?36R%9$XzRiYpGP_jricVu*{9=M^Md2vSaoNJ6{>-AvgUD+n_6VdSJtx@zS
z!D-0W^YS@bbPn<_RLx~^rv%BZKV)kbn`goeXm9L085^3T=T2<yU5s#>I4`yApu14E
zF#(IpHcErG@>ZJ-wRe#)#-3Bb9l8n@4=?0?f2v2#MdqCw+35PGPB8)a?1^OGRMcGI
z-d^JeV%~&sNFNI)UXnCD<xv+yH6JBlR|okvV;tb)J+nw>;WNuT$d&sjT)_U_V7<r#
zLWO&dneiCu*Uhs|<~U=2At#FQh$+w!{#D?@9f6pkwMugr2m=hSR?(0O`o;`@Lu~WW
zx;*jXU6gs(9?uq4D5tT|6h?psU;r{v4|V;$L9f<=A@A_^x+H=K;D|09Ic455O%mmB
zA~<=o`T$*d(*KDD0%_6ZON)jPNxnEE*sqWUMnm?Qock?3TLp%-`w?`^>e|G#KFK5Z
zu^!&JM5*zGvdY!2!&G>yQ=b}BR{QoGh}i7)I#~KFYI-&8rzHTl4~fxyTp`f1^Qk)x
z=Oc+ynae#EF2?&HVSDcr&NhRw1E;7D1&2rcAxhjP_?nwV&Y3A6s|%4$Q0=Ec1=I#_
z#js)|fxjjsyM-#cQtjp$0(kjFx2A7TRqQt~T5bkG^elG1m(gLF&TUE&AA;M=qHCL=
z_z^H}V_i&<JK2iQ8e&Rcay6zh{|KSTYXAikKj6EWsv!}5#lPnb2x@OUUKxt6{_V0i
zKr|{qo&lUh-5$U9QN9gEr`_(-iRzKl(x(Ew%P`7d=J>&p1jTz;1d)6n)ioaPKh8X%
zwCur)&l)at1Ene|E4?@mS)(#}okpEk8c#7T&dfk#_lmb*Xw1;q;sm)h<?DO;cVZp(
znvr&^r`T}xU3bk<sd_TE)6A!x&8mPn|BdH`W{smWOHJ4=tRCy0^8<77^Y6j~ib{*L
zTb_{ODAjt7@@M+svFmAzkK$;vINhg~PmU&Mq>j74_VyR)|L~UaJ6<%oQ-bE{w%m;H
z8(k!@y1;B%YCK>xKcR^lMr_^(rpquAv3pOevE$w~D-uM|lL?WgBk1#6w6XL>NDf=?
zBwtrqVUy?^LS8SVWwuaP9#wxtU*oksIGLnA3VS8H>Y3|=uQ4@Tlc7$s$=mtqxIapy
zE9le1Ul?6!^FR-75+M-v+Wxe|uKn<_2-qfps9*!p8m>ZL-;>yvdQACLuN~SNI1;4;
zw7FLKe?onBzMC0S7L#Ild3kyI`j|pgT>UX-_VhUkiJRo&+#7Ggw(d=+vLV1~>d{mm
z<0}nJmLJ8TIPO!Y&hP1*iS@zF1&TIFe2wIqqo0MHBTHExj)yj__tsO*Y@Q3LB|A>)
zGo2r)%F}{~FoE{8+BW#(yp<%m3e@_o%Z|b`nxCxsu@!IA-jr9P&uAVSlmD>w{1Ohx
z_vVe@YKBe*+1}?_Td7}E_72u(w0VGBa<W+hYb-^j{7P_$HN_!FWol(DuR*sFdv$3S
zgZOfSMJ7c-x*Y&loqjhFK+xS#*2}DfmJ3=eeQ530U1_^6T{Kh3?~7T55)mgtpuOiP
z(&}9*fFAQz-1=b;8CmwZ@++7iFh%#dYYa{=oXr}zb-v$0GgAES_z!%X**d@<Z{vd{
zpSP+fv3|J|ys^ZRFHx2u>z?wC-;ZWnp5&)5LF*J5lLUWra5PEH?X%~s%SNBAYMxNp
zZaSx_1hA3#sn(~^s3Qb$7}fCBi%fEVE!&F?9d2}`!8NS;BZGtEXLp@-SOx3!f1@j@
z>7dxCbIRbV-cLbcBoRKd?N%S68}Knnm0%Hgti1MFcBzFO21ug)^|4hL_MQl7YK&-j
ziPyqIr=#F`#f7w-#(JbaOBn(R^WMEgd`B&EO1oW(5<gj?Y$m(S0!3E}0BpN4@^BqH
zRZUt_{P0vQY61|^mA`(a>Fw+LL11*%iAbg>A|hhJBhP~-oU`)5msx{}fBhzmsQhuC
z!2As!aM1)ng(@TCyWow!S}pE^sgDj|Lkv%O+X6m^V920<9$wx8B_i_-kUu+$GYII8
zP$Usxtfb37*DLl;D!A{;;5rf)1IS2Z(3Sq|BUdRK_|;oCMi+*(u!|te8ZeCmdp?kH
zIv$9(RyG>lwVR@tjMrTI)x0FE_Dr0;R$No9`&XElv|JNfMHYtm=0_Jcp#+WJG&Rxk
z8?U}@TJk2x%R*?Sq^@SM2}tjtlCWdtAzf&~U1}uHcPm8uj^O9-{`*C8WD{Ly*+u<!
zK6;5-qXs+GUbj7bG@Kv&f`Z~{V-QIe5v~d4;+}WD9r-0Dqz+Z?svkc!oK1y~WRF)1
zV(m9uqEA|mF4s7ov6gOI=Y<E6v(2l$JT<(1Di9;%aG<NI%CSZC0YkS*l$g=04blnc
zEMWZBkl>e;c7jaGMf@YVPh+k5`+Dvzc9oLWb`R;sW}HH4WEPs5zAJ|qb~w~XMXNhk
zzGvpoN@A1z*qYZ-HMfZ5k2R35*OnfQ!~G7iykoppXiPp5@y!%LD@nry;nIWxe!Yyp
zCyFwm2qMs9wcOHuaD8uJ@`2v5bCqmi%A6nm%D0=ZG-k1or`o~fQYT_9Px%>jY`#f7
zh{2F2M?Icm>$fM`20@hC;SozTa<0;dC8@WcYOlWJfI~p11&E{Sw<2zpx0EF%iOwVE
zQE+Q+V4?}cTNHMSsXZ>5(JO=_E=z*~IR0ybg7Pt?`I=ay`_v=uQSS{u0v}k4FpJT1
zdyc9qeryCu)+cP|(>L3D#^N$xw%>|VfXff)Ddh+)Sw_KrU{XW8x!{5g6QZ6JisH(V
z1#jLikvR+7!~MsGMg^IQI=4~ch6Um~*2Uj02yxEO5XrThdFWG`=fJ{YgkTYGB<|Tt
z%j*?LZCP~)u$o;xxy-8|)X){?^S!H?_8S6)Avkysxuu(ySru@%R2Tcj=|MZgx+-)r
zsrLR(^_vyfL!F`XK+n>=%;>X8L>m$$`{rrBtvBRdMc<r9uBu!7Ycce%GN%jSpp~8u
zCDO-2z@3LlI7fgSs%bNY4+R!o^2L$!byi;>+W0jyjCST`DIDu`pyv8<UfcSSGM<^1
zfEv=Vovlnt|MkxO(i=kl6dl5ZV!5~ZmjBw!Yng6-&a-*+INFoV%P?b3w@Xlo&6VoN
zT6t747_DZ3wC~Ury%A)vsE>dz@Jy@&<&+;ki_hwgyS-m=nVBlJ!Fy8_pWo+Yfe*We
z0-fY|W5|))jLul0r6k3B2<QC51e|h2k{d@e@IpjHrO764@;5rYa}-j<fidK8Fa!mS
zZJybKoNyb$v3=uvU!}nBSMD;lT5t%6F{U&QkoIqG!8P%f`30y3C3yGVb8q@)F#hWA
zYFC8j`Us|&uNw#bRYNqr)<fwtK3J{4qQ%J+qz3K53@ZUMJD1eo2wU0%;khRiOy7R5
zPZEd%$Ij<YU>S&`s>;T%)|rv4G`<5IXV-VMM>g9&yVabEGAiZY+0x+7o}<a*_vN)(
zWB*d@hT{$_RvQqtCF|ztL2H(~H;zfDf1P+I-GbodOXFlRJbOblFvoU0|D#EjTZzeF
z4`5)aK%h1&;D+P#^OwKKQ;brs#ytyMKy^Lm`n1#IiF6>rnNm&pL@w$dl-Rg32(_;{
zmKQU)tFEP7z#^$-3qfa`WA=H|cp2xLM9dJPTHZPe!U**&3~dZncSp#6&DVuyyA8Y#
zip5oNf>b6o<1X4Q=p=d_o@=uyi+mQ*i*C-$-7-UQ8(Og6pjLIV{EX;`5%o!vv?81Z
zAhcJ?cR3@4B>cjv>B4?P91(y&A{=V1c;d_t)&bHY)Kv=ZyZimHn528YWVb`#_q4NS
z*VC67o%vWsM)xeptTd1^1#I`E<bm8LmzLi;ecdjXx_kEMxBM(ZbNYHmBsRUzndx!5
z(0c3qiC<ibuxB3qJG+6`K(ONHRlHb&(aVQ-%(~B+e(=<~h9B)`!qF}jR<OzgoHd(i
z0U7oHZXzFRbUczX8~WX~)D&gCjtXw0ww2lG1<mco@WQ5<vm{OQZwR@P0az%ov_qWo
z1^BvoZq$_;VrY$cjsR?wTvc)#D%1{th_jP?mCxhP%W48XQ`{&>ht(7z+diy~``aHY
ztE21)2?x(jZPtMZQSh?vN+LMA;<8pB!vO)hLdV3`HwsVTIW~=`#CRjoR~T7e$mF5d
zY0F@*7|*;OYu2Y+y2A7R3U7MOxg7QZ+E3ZGcxW2sCLR6Qg`j{wm|_T}6*cp-J2{%q
zx`DH=N`$?~#JS6R)Ay|e=|d3Mz4!=6f%`<s$#v*`VlNVNm5KptYcV9>WOL_p;wO~R
zn<ZTJBpPM(KBw`+E93;Zh{d$%1~nI)y=s|F`BgK75`}sm9!bxc*dO+0g(-0jH)$8-
zYHD`3yk!7sE-{+%$gLjhAl8#{C;YyPWs5y{PfF+=;w`J*s$noDpV;jY)-Le!*Nf5C
zoSbzDnRVuv&!cva2xxsSL_OSdzD_-*GaWVF@XG2vJX8%GmK;DDxwi7h-t{3-C@dP!
z*HIbI_j)SHZBeZiBUoW%-tH=j*|wLL!Hxw9oV_T;HEYHwmUcS5l><KOjgtPY4)qYh
za-Cfvz*;yI&N;#f7b4bdf!@@pER};P;lrpG0c63q8w5Qu4}m4nE_Xyw<@n-Xh@`>w
zl|-+oxh+`!B$Lf6bJ1#PqK$ZZ%F+J0xsO(%0>aOje+<dBoJy`kOH1p6+e4d;XaGN6
zdF?K7s9Q1$e<bS=8kOh1y%4W|2>K<hsEf1f<G>(#dQX3%cmEN2U%yCw%Or@S&UMt&
z;2{<%8+OB~kyFK*3wQr?tYp@x*#~^H&^1yYdC+R#g>P~zGIcY%Td_hp%70g`2Ljj*
z@z(dwqqH97;2@r<$KF<+l1_i}#>Z;kJ)2>A9`<iX=g%|57&_}}b|V?ly)TQJ=&wv$
zIqiWsnq-O`*h`A$1b4uRm~tEXKFEYtY|TFo3eW}oDQ|Ku3*i|gF?h{VPR@RQMv9(e
z4^-JumvF@?=sE62w^dncTX&S+a9(563L<4@VJYZdzFNhC>-991>Wo;O2QsiWo97Rw
z0Y_D9u2r}zTOq8n`m=eYv`z%GZX=3|t@nm&<q>S9wQQTQgIOP0yq5h*X%p&!2>pWD
zQ&-V_jBy2p4vhY{qSl|`Nh@4|2rG}}?<sZ1e1^La<rNJ`UE5zmAL#@Sx$F;C7H_WO
zlFjMcQa!k)e_eDuJj6REwb|_g??3--8c!<MkxG{Tnb~|Fl1d^2>8GFxR0;1!a>r<L
zox7`d97CrgE~U5DdfvG8iRbbOnnqwu&kXU&^?BZvX_J=2WAyTCJT?%1dp>FEyM#Df
zh>^XXe|R~a^-=oRVgbB8RC9(H@k~rl1mhtd-w((nf7WvTRK@jt!B(b<3kQu1*Vu7O
zj&qgV_l5Xv4Zqt7mEwc`v)WV~fO2`@;uGqam^Cvv%CaN(>GuxFm}a2sJgd7ZImto2
z250qc6r{PxI(t{&zAPKHv*p**wvE@lNYs^1PggnMOjzOv1PUl^l?1ofuG(On*<{WR
za^N5zqkDaDU%PiiU~~5<_c~O@>Ee5hAxq^bsnmO2+8dgyGz*Q<>ZD>a^i|1->oG2w
z7{n?Mn`sz0E#x_%TWLXZt3<{8YzxpwLR{D~nlwl%KDV8+O_2m(b`^cT4`K={1cxx4
z0g!d>LRUKqi`@504Oh53LP=fIYv&-5zj{_kw9>%(si}uoa&K5YU9K(JrR{tZYL$E@
zXJuyGCfDp?fjCW5RiR35uBs@Ok7jdN)o!(29+~LK>$5m;!!H0N)p3<>XU}{E$<)aW
zZtAd1BN;`Jp1SI>4h3sms+Ja;+Nxq=Vwy<bC#IxGK|@1h<IZw2W1Nt1A7qn{69W>c
z$V@-?#AHy}q*1=kDh+qAeJ&hvJTA_st$_@J32ChCkFT>8B9mAGw+(5LyVJY8W8nu;
zkfI<PH%(oLGEej#%E3PSAFxunm`AmwVwm4_2aDJ9Ig&(?@Ym^U4dIX;Z@>mb%R@Z2
z1_x#Gt2EkdwPcgv{irAvQ@$l|zHD)t2;keqJf84zA}aU!^9SG=TQpd<W;)n%RkVEC
zefiKlSH>CV!YyQK-R)anF`^BeC<<O*QSYyI+fWIw4%@b&k=l#GJ~|&3;-pfEi2&bL
zm1vefY@rlZVGJ7#P~>@d&KQe-jP&0A<Ef`IXGgEwK`s!`j9xtF4bt}Wt1gV?VC^9P
zEHYZ7ckFlNkL2e&o5caEgf-5%x=2;$5?x*G5|g4f>5n`BsnKf|to!tV5OzlU1@)JA
z#mU<HBjQXp9b3*D{n?ujAJILdqBsKjQcW`1VjBTR*5$d`ji)hvvkUK^7C@&I^qFk<
zzQYp~PK*=%x5`CYQq!>%qWc>mWZ;LZik8sEWO*4NM4basVedZA7mjN=Vf!G@fmC2A
zZA<jlY5uuQr#LfG&md{xD6xUc;B_Ra&{K?kZdD3-$!1kAkt;KY%+N}Ji=|NB_diQ<
z5-lKAATEx)au&OWT)U)42mjmai}Zby+cL|yE#T<@A$)*PO`+PwTpH{$X}Ql>-0|Q@
z&FFHU=k4gj=3diRK#2KEmsU=xH3?HiP>JR&EyU)C4ImbsGP(*ckU_g>IrMuA(Z5Qf
z%%y);tl6<`m^(;l-uFTp-MpWuV;3U@DKQs$<1+;Foh^CMDO0@92`d-9<OmUJEl5KN
zJ<XpS;-gev)b={2ImuWr=Py$C&f!04c9Kf4<kpbn367ps_~p&FND%+($_a;nf-mIg
z7)*l%=_IcsDJG5~A1B519XGm{y^8$=dU3|~vHn%n0Kum}zm4`JY|5YxE47xPiSI*J
zDk+8Y?oy3dKH-O>a^Z~x?<qu0qF^!ko=5!7ZU$S55b(luzdKg{^&p}r`eu7fOjcwW
z<MM(tu%4n0d(z*h?Ge~_+F2(NfqIlE)uE@YFKh2*BxU`0nJ+VdMT!Os9zUf#O89y4
zCn11NWg25N;j-h?7`=$(8MBIT4lRIP;=YOYq@mx-#XRnIzA1XX=<BTM@2b*PRWqbo
zS;RH{Xv^`6vEs^v9kbGobnxb{lfoF1Lb3s39JdKn>94vS5zYziZqwd_H%m%m8P_d!
z<khC{I;ubrA?oL;>Q3p4>H~%%t>}D#55ABw3k}FTsH-QalbT<xo^3^qUr%}yIH|!=
zQQ~%^g7s#4iRHEq(JGD*lQcSX0v#{Ec@|cVT;gR<Mn;H(&%5`Ch{5qyZoWI_=|eNe
z3$O}ArkOC7+h;^Qw5@9zxoSR792PX^ZpV$*b>9~LFGJM-dS69}K%G6ORb!&3O9<2O
zy@QDoh2k>U7w@n-AC-&hu$3C_XiJ$ya9bWlgM6Px6|<1V?bBW1l`fJZ>hr62+bl&w
z>HP>RL=|2pb+L)4WQ;!In4F>uWmKU@^PYx<m-E8AbQIR*P*neOX85nyx}Um)5FlM0
zK{pMeX@>EOet)%wJD*Wyd%IJgcjU&H>vs1Rwtj*&0Mp<7B$vlCm5DybXHXNr_5U{k
z*M|M;cLHhMn6hnJ0e9tT=Q~=8VsK|;6dP^KISuLORwlnhi|U|wvQ&6Ip9t)BG+e~q
zh7QsX(sa<I=Y&!IRoDM(1NI;HSKEl+UUw^!l#<Z}kdcjXsUiQ>|K-_&s4I|RGO_)B
z6nH_j?562)9KJInQ|XIkLMGG#CnvAf`~t0k<(79AUwCQ$pO1BD|HlaPn;XOk)AlO$
z?Yppcv<e1`a8B+)tDI}%|7<+}uOS-{9ViN9`s-*N7E{QQD}X$+$-XP4@yNISzXpK+
zdy~&V&>S>g?~GTKzb|{?yHN7*JXNKdyHy?bz8~Mgmd203HVvRk$F+GLEft~8aoe3f
zred|9?={_rl{W!<l4Z3(oJQ!gOC49&-4S{V^C7;oRi{rd@1etlqJ)Lsb8_q||B0S;
zhRe}2IamdQ(M4|!K9FO^0;J$R{{1CiF`@tdh~n!T96VBQIra5?y_4N>Qw)}!F+CPA
z%?L;6i7;CMJv1Q=`I81hzoQ3nRc+4zn{vkDg8GDSmAlD&`Vk1bwZnSnv`kF7*Tei)
zOM_~L$tgcX;e*_)-p%HFPPeA!GpL{mddwlyo_S&hA%Na}H{P5YYC~saB#Z@NfwXp+
z?sbRgvF~!VULF(T(-q+1dv`YX_YLK0WgqSfzy^g>Os?C<hC_Fz6nbAqnearZ5sAKi
zHDw%12v9JV=4`M!6*;YpqM<w@1YQpIj(1mJa@5zxnhkbR^X>8e;$HZX972h6;U;VI
zUE&x1;*z!!mIa>{`2F`m__5!79DwxR2)y|8^z@H5DBm$no&L8l#g-5o2v7!#u*XA~
z-*bk{n}?D2FH!vEmI?+HXu+F9%!+3h1TC$!sUn~qc);n4+xk~?^=!^(9+l%{v(p~L
z-wY2MO0^9Q5S-pXtdPrY+0V$giqGrj)XTVo!HHTB%KWrQrC3V^@$sQbpx(uPngrjt
ze{D?`E1q8q{QY|$+B>i$wQJ$PzL@7#9mkIGJ%B8mzd4`53Ge%(i?y7B;B>^SeN4{7
z8z~cBw}Jtg+zG6JS!&BV)^a0l+ru#im43v2NfT~z#73;3_x0rUYeL`JR_$;m#?9HO
zi~?{u-KK((#|XtoiD-UzI8~IClr&F`;JumQxtWs-y5HocNce*{-O9R!<v%Nu!%0!?
zqJZ6Y@rN$&8`Xf>R?jj<zga4))HD~=P)fhguOsPNPpw~GZg5$i7N1kuYCcsQ0%U!>
zD1szEsp<-wotb6mg$$K1V@o*U9+%;Zden=+xe{|rhC~~bR!8z{eugo!s2ZmR+Eo6G
z<=3WwS-O*)g1Ge4MhGND8U-Mr=EcThOgOg@*+^3}Ffi;t>}3~e)tS?_Y}Y|{v7#JY
zr5?9PD(DStKGj}gE_dnt&+azl1w8*c#$eQR3|xHh81Ju&%A+T)RL)vpuO|<LB7ZKb
zO!g~^%#1Q4kUdD9+ZS_hbr&el24bPz%<~l-SN8=M1`X0S7Z+<LDTz`E{vWp9GOF!1
z_!h+p?ogyapoQYaU4m2G-QC?Cf)^?7?(Xgm#frPTJ4Ji*{?EGSp0n1?$K*q@@|$O#
znZ5VSW{#2*qjK;7bEBOR^a4!}!fxk};Aas?vJn$Z=b`px!5ntWSTt^rm%Ad(KC$=&
zDOULH&*SM^(+`9bK6-5_rffh+qsF(VB*Vb>xh%_{m6nEvY~bZhKthAi0rDyHdgl?U
zcSxc_Sg+as*rr}@DIY6qjr_yP8T8*VmUO@cua_b{R4dnt!nB-#yKl~}@6W3*3eaL=
zUrC5ukKR`U9GkbVNE1QFmY!<FzrTDj{lj|2h&Q17wpTy_uIsEjb0+Kb>YeQUVpt$w
zXu5$7*|_04=Wb$mCW_8qEXnsjIYFojB$QSA{8m-hWTxXp{=W|cBpK+!G3t*Mj_B)t
zgZd8NFa8p<xZ(Y$l(Hv1MQknh?RN#(y}nKSB9)YAIyN@$r1K%5qEhMqFWt;@z(Lly
zLehmCs&sH|nxMY`|8*~HlWnIHA60m7-du*|@4TV&sZvLjbOZT{ts=A7H=*QefrT2$
z#sA;r^*@Q}zZJ`fWIp7>rO1bnO~i$FjI^|Z0#$016o}>uaLKmszaGPEF>U>xpHSx4
zyU?P^a>xA)XJS5;)_FZlqRz+Li2r{-H82wMula*wd!~Y4y7ocm<!5cBnyIS96a;U*
z<_|dCaM`b0$<=IjlDxr9-Zf~Gnzbn*Tz91srLi-kt?zFd!|qsnm3C%_W)wK-{&bwD
zTV2sFz%D!cWkM-K^WCw5jX+Y8HL1pjh0Y6=Q7y<~yv7}u>&Ygoo=z`2LC3vn$wlSJ
zrDa>wl>nkO&O%VvTPaORImcJ&ACq~4DW7q5z0LzK_s=b)Rr`h$hrhg1V3kG#EHF8m
z90QzWio=9*VvH@0>hRb~&%T@zai#Y3R>{^R@SG|dTA{K#Jnp(UG;JkFO2my>L7sOY
zQBVNNzgGLT@uYNbuK769-*!LX!eg>x3Thkh%!Pv_o0$O_34AMpKD5cVX)@nU`^~oM
zqQGN*IOeZTNEtsXtsxVQm5JsREtym%`kqhEJ0^dG{-J1@Pf<s9|7~%jqqK4R%qQXb
zEGF}l{ZD!=O-=UNi2I?>tnNq`c&s&S#69m-!lm_{t)Q#hi=n5o2Pf1W6D+G*%e)F@
zGJp*YnUl6%2tYc)*YW1J>NRPolf~v3?uK!#eSZ^H^=cH#Vcb96*R;m^cHlVt{=wGd
zVMw^pV4-0>LW4*Jx##9(;X<D<a(6OUB-2H6ses>uuCz^Z19dwy<vK8O2-e6YiB>ct
zY<tu$cQrpM1YktGUVl|Y@$2^JN%EqLDifKD!_vUZC(2zk-r1G;F`;S)Clzt?f3K%Z
zN=%Nl;s5mHN)_&>+nDpF-Ju*%bF!&F@QSDeG|#`Yyfo67F|o#m#u0|vG`s5hp7~59
z$7BIh3|bbIkVweN`pnJCn<2DhLSRJ)Lx4lUm6gZs+4gLOibb<0m$fF*tp_x*HLY+&
zWt!3z5KBqOFKbfo;GOC!s6{#-jpCM5BlT0!k7uWHU^gN7-&eWNe9c<b7HO&^9eDCM
z5VXIus38Q7D+{TJaX@yXdn9)*WbmGjCn)(u+LxeN*c3`V<oCz|{k%On^6L6jL?!1&
zbZw<9z6V~@%M1^vEIeX3*b@H?+vU;JVycN$$P&YqBDtfe{*6lDzw5s&D+lr6Vzs?e
z#>a^2i8oSd)@iV?08hU66>>GjMB9#!lYhQ_d{@*_k6%7o%SS@HTu>`~QAG}PS?+vA
z6>}o=)}|v`zT50igX}tLwxliZu(#k%zkMUiq)0uU8B1m9r;2$ca-#xmM<OY)cB2;{
zz(qRl3}&5UIe+Drj{BUlJDX-9UBC$3?C+qa=G4#hPOodt)|bpCdBG(*A1Z6QvSmz2
za?av#lvGC5_cnj575;qjrZSiv6w*Ash{j-fI(bc($?EAMk^b=_{Ok6$<tyT`zx@_<
z`7DAzE}z#6OV<7?v@cxpXBhsg)-BA?P;aUiCFG|qwM3+y`Q6jx>@;b>#Sh6Tsw*?O
z{iD5dKMfn>bIBFEv9e6VF`s`nYXn1^3Wsckv1D5)<|q9JDo&<X<vZ^%fb8VRz6LA)
z)1$;ufypdOh3V!-KMAlT5`U+DE&xq=eB3-DfQB;Q>9FYxez##RSy2C%(ON1ba^MgV
z=kBHj<sln6S<G@w)|yBHQ|Zjd3Z$gnn3WHbM;w@_L}$mddS-|II(WU_c)DY9l;l4l
z{o38(C(S2I?gYti2x?nwrLw4a9%1~Ftzax(7hB={pL<fl6z)UM5&WU)2@dki|9fLy
zP@xmcr$}L71<345mGP(N{SuDi-0-5(3;cn$BIb9WYoOKi^{3y9bu773q92o<ccy@k
zqbMPBo-E<P`fav6xMGy(V0qPc2d;i^tgLIWTJRsgXw)K!GJ4dJ>)Jrb2U??~(4vh0
z9vMts!6&K>>$VB`2GVVXdxZYiy^HCk8D=}_I@iuRKM5}1$6*c98hFFm+u@Q5q&%(2
zs{Na-?RQmXXLN?%K|~Z6v7xW|kru-*ZBHqd+YzwGS5IVexPyIaR1@1tu=Vt@{H_MA
zRJyC)bJ7jTIHSm}umU-q9L48erDSyWyi@{NdaovUre;S;pNHAuPgtS{Qp>H$IfaUC
z*Ih%W8pN?sMKw(S7OZpjTz%2e9^$y-{*A<Y`lsbe9#czV8DsZmE~nYTApF%B4u^JH
za8*7tl5L2|@17}eTM0E=sAUaO$L$!kZmrcOV*@~)1P0{#yJ<faZ6+7z?q3Nokd1Jj
z)}wqFglPL5-qr59;uF18J1-aWLcZ9*Vc+V@3PC-!)y;XmzP=`;q@)B$BU{gdJBpJZ
zZcdv}S<LIHcsaAWHUDDkb|p&<4TZ27ufGNjmW|v5wXAI>Schyz`~Q~PU!q8i$y)LB
z#!B$konDWu)OKfW^BY5#`ky91mpow1K+%!L-)}1&_cUKmGfcEs1+$mm&fHi^<n=E~
zEC%4><91qrnfY>%^piawd+KU^im;s?^!xRa9Z0m7GOwN`DH;Rkkd)r%?Gy(VNsp=a
zfLI=BI({&b<i&kYs?Pp2RpI5h=ofD93w<pEUs~Avq$uqR>H1=@-`g?t%hm4!xRqbO
z)4zJh>R_4*!30+J^)rV@n3p_Y8ArFL3e$0hMX->=;MODHT&kO)7A9xQsZ@%?MFio!
z1-nngyN)1be}xPi4^GI|Bkm5==4kYO(i6Q#011v@pkcj&`ZJB~v0Py_gPHr*EWUeR
z8lZj)!@F+D`TV11n&b;O8YSw-IA6*9bkEwOyZ<G&30h~No=>M>-x~7cG%bFqS-uFt
z;jp3Mcd&Tir&)x51%`E|5cf}i&ta(B8z+2^cl%4Xk8_5+27>sLxg1rKXln03evUeA
z&CvxODh-Z0cU&9BFk^^F$PV)|gD}AxP($c=P5J?CE~bz4@Y#?8jl=!M5470JderBb
zCHn5UWJ;0Y9iWDv1h62lb-U2=dfIRw>gFv|jn2Of5fyp@z%^aU{j+<GFq_Vh+d~u>
z62v4Kgk{)}&E(|gjnFk#J$*rUV@&i^Z4%CV-8`ulPwA6Csb<kk_}{JG7Z?PI?Uk@s
zY^vYiJxXzz386Bc4VavEXK*li?CVR$LzdYhr6;h1hLe)o#&I@|rN{C~->iFgs3^JD
ze=y5<ZFzWwr|NLpA4<yiG>DS$46Vcrqao$t3Ca@~G5{n3Ipf%I@M|k%Ncu3H;80?_
zg?kwIg+9aZg^VDLejR%Jtct}+4yM|~?eFT%6Ti-fQiSB-Z&|G;n!z8P4-*Q1$iT?5
zevj^G_UJ`Zx7q3q1j84haoK?+jIgiq1HnSVD;nAgEGUF)-?JkF0m_^PXhF!EWVJKo
zOjBG3bds1q2@Q?N?Qc;cJ((5mbRN9sTR=RS0^VZhMEu{vUtBC@ySPO@2_I}T1et&B
zNPO{pYPYq_J7t|3Xl?BC|92yuPZ&p!{K1e`%T0(i4b+$G*FJ$tfkr~8AvRbUtp>`H
ztboATMb4w7{hgS}#d4jp88fQ$QD?~YKePwD^L&L^L8&|KLAVp$<+r8Wq}8|m{oV(H
zPp(+1dV7wH2D8%X|8*<;a9<3S`QP?eRE2Wo!<gs48enQ_XxtF|bd%GY>7=2d!LLf%
z{Py)|_)^tEGn?Z7>e#*E-t4@Bwtv!9zUM6$)G#V={LY?ZacZK4t-=DYe_QPB>_#x0
zTU`^2qvX2WJD?Cw&83UaEJkMH#&%2VvOq_Pmn;)`_k63x<nh>zCufOq(&RHBx7jqI
z0Bn-ZFbDP(m`&Vs8)-kMBs<F5AiooD!ju)5xIp@C*+=@RN^tkLqxB2!aCUWt&2*7U
zn=}UynNWDDV<{p1*LT|Y2|bRH0j7rKsz_AjQ>Ad~gC@=dTx88)Uvktq<j>h+gjPE;
zKRj)-7iwra6|NOHb(D2Ah|WfOxBq}KX>706UqWZT!24TZ?c^=5pwPbOEi&l9X%<)&
zkh<==97wW~{w5XXmMP!<2!yW-i#H;Ny&B?MS3xN;dpJXpFShm!=^wx@Oi}9Lp((W>
z*pMc!uY~;F4%9I5wQV>!Z6i>Cb%vxTG%91eYqH9K2Kpf?@n80Lm`=`ia!6$aG>I>Y
zMp~#3D5^-!gt--}Rur#)wdx<Pq|FY(snyGbJ>&ncLj-lAi`SqcE%H9oI;GMhFx|Z{
zv9J=;NIO8pa{9obP(iRzRJcWfv>mOeP?~Nda!&yKPUhF4=kbU9w~{};qIjh3adYo)
z7=)mMr)e@1`7~!2@PHM?${m~@H5UQg2rJ2l$<QWVZE<xpn5)vm@h(TWc)9+Vg+6P@
z1P@lRfI&0ZnY69PIz)@5W<n3>A~%C!QQc@Le01=y8gnvjBa}&!%=I;^D=fK^w~zFP
z8HG#<>t0>JKwp0W&hJ_UCjHIkqM@q9E`W&jkV#s5UqVqk!X#-p?Et15{H++>o4uDD
z&^p1W?VKA<o+8|E&rf-<TKPE}#2d+FrBognXFd3Y+UW0KPkxW8#~C?PFEH7a>g8p8
zpf~V*?PF!LrLazL3N%U4AcmCQkdXI<V*@}utybfrq7D&NA2Q<DCE;i#$kSPcY<W8q
zA25+EcZO?9y|2FmY5Dv&%-PP$LfC?aLe($QC7jj$zK#E7QywBv*K633PTW6IT3yT;
zWAv!qAx>fV517IZq@@U$AT>0PbEVP^Pc}2tCxFRGrC;x!ji$oAnWp8SmQMi81K=i>
zU&WXoCPY$~Dc|;bZ=&w6LY4Uf-7qzy8)<?uGa~zKwq1izA#oYtQE~fmXLb5*)^LxV
zYQo+*6`N14+k_wIQ={p3%YQE|pZi}CcIYs-LXO5?^=ojlIY#UwQ44YaJ222tAmeaU
ze?fl&^Q7^jTn<_$Gn3(<zByQ<wi)@rrO;}6=C2(xiH{(vUW7*rkr6J+c%zw7B~Iri
z>%jLPpX4Oa>x9FJ>P5e@c*4)AnU8cyQ37q~!9~OzxipnmK@Q~@-J0^UT>Ge&tyc>_
zG!;HAVdnj~wgZ_JJ2RInd>{?1MV&VGZDsHqxRFu)dPYji$AoFN89<sca8tQ|#=w7j
zFn^~wp6?w1TnO2pxTwH{9hUWXzHx_e4Q7MFL6Q&GW1pDCw;S$e+Ppt&wH<)4cZh7(
z$R@ACq$!Bg+R_MZx378rgM@?@FjJY05kf*kXIZEDM2NtX5N|Io4)vj3^(rgR<T7%H
zu5BXr#zy9(OO;g&eYu6`u=WeS_8^|d3re@Xfy0O!vRh<D(hftd3If))3-E74mp`ll
z=T1t0f9tUp<&U|lxk*BL^3pi~xi51+QZ06l6YKh}9+c%^9(ro&56A;mgPX?zx?C*_
z%lLo{0-!7pHo&{pCV(rvPJ(UITv<ZfTCaz_r2Ppnbf>w2q$^qwfQNMuru#bC<02s`
zv$F3e^>O(aw=kGo<LCS$Z9I7h1vh*fd<qh8#qIT{fwXFfSunZKPlx2O>3864@&GI%
zM{Zb+N9bS1!5FMdm_7qUZ)=cfcref3uo?O%sz>1gGsY<HtGy4By_s)APEM*X-^S0@
za(Ll9ktvXXMy;eXSW0}7LWvf}qp9qXBS_N)RhbCy6VE2V!>DUkooPa4FDvC}aY7Gr
z{=fY>M6cKR?A`*=M7dfH^T__)YIGV<MClUte$DCU%i0KQ-;dEjB4rY#80N-243{XF
zu9%%_qb|oV{4Ag%>N}{jRiV;PPtzj*o=Qe%L*l4(HOZ!e;QJAR#v$3FtisBa9~-)W
z913HUG>@V6!fTgx@l)1vyDMEn6>YhAa4oaAxk*O51eE9q9y)P4%l$tW{WfT8(Qk<z
z4K3nP#d3?e4gTjZNlGlcWgpM5Y`J&uMDHm~|Em?HArHWefTxQ|HvOycVlo26+{|X&
zAFh~+;UnyY90hpAE3-|~XbrlZWUBs+@v(PoXk`f@q_1VAIoB!ywP)te&B$2lCd@&j
zwpUY|_x+RiW2=d6+QdJ?@q~l1;~QGh@WyuM)-^rm$W@Sb<gRCz>yLf{9D~9p{kb0Q
zw|--wU>|XL8?BF|CD*6ca*b}HN9Hn4edZ=t;F}TPlQ8SyN$+xOMqwg|W54bX5Mltk
z8$$Y3i^boRV&lgui%x;)DD|v?xPjCYlK^_fN4tNt{dgnUnXAf$(cQQya<41eNVdU+
z!v5Q6Y?byxn#U^_u7N(0J9lvxR{!dxgItLEb|)o+qiair<=(3@3rPD5?p3)Txk`i)
zZ<?&`Xo5<B)gn;d#e5Sch-}^lKUQu}+qwh}*s~q|*&NM`iV9-M#}ch8(LMlyujdbS
z=b$E8kK=$!=&^++Ulbty&lj;Y&XHO5J2yZlZar1p>p%a@8{|TC)Fp=Knzepa3DINh
z{z8Z8p#8uNKZc~6$l!xF<>9<Uk({_9Ynrgqz68W}-eB*RA|}5Ts;Oc32(}0zSrC-T
zvvwvHLyDBFg+1ZgY28`jkMCe_7y^M4L*sL4rH9A7=X!&If5(4UbmzzXp=604ycXyZ
z%+&}31(*DONKiB@y>fJ&)YV<7w2^w||Ial!!wy4ODaLHxC$QQ_mlp|v;gz3e7UzM>
z8R>1j$+9wudwBfX+KZGDuN^o%cv*C@QgBu*FaXw|Z#BFLB$$Q_(~UIBo1WtW9#)Bv
zmu!2|yGJNw6*d~@qe7eZ>$k8czI*F*u9e7{Pv;#Q;BO2G#F3=q7b7=BJJQ!&pyNaV
zRO7%DCDqfO@sn}T)VF<6)z>f@MWs_!V7$!$I5ba&_zkN)RDr?c%f=*TkZVYUz&0dK
zD)qX<l>-Mdu=5O%PxAdb%hx2o#(J74SF4XfAz)Nv^lXrq>%6W_u<Y!YHv^{=0H2Vd
zJ5%bHwa<U4<IfB{x##@}4yJp{T#)GT@$s=Zp2=f#ztowG`{v6=b;gDYBXyEuc^QcT
zn68bV)rK*BS`8j-)EJ-Y`ii@lUq&`E&e6GKg{t<k`ar_tWrmob@~$~JJ!NpQSp~Fz
z;s~mZkmB=hp>XOE%@u}Y$&Xc1)I)Czy|1aw{0~4^zpMY-)f)X08e`lQc1x{-x1`V!
zbII%VtJ`22Y6y)qo2>w$r6exk@JV#`TWRH{OXi{-zud(e-|^m(I9<m<gJ`ZCIn>Uw
z8Htz5FH7a({5w$G`s6nAUZ0^-5@DwaEvvU2ystZvkShn(-xoHI7?p)>LdhhIhS}2{
z1|=+@k|n$<eJ<LE#zBou5gD9}>C+d!h{iViOV@ALF2cwz%iYEVn&HboOlSwJEy!pz
ztFN`vMSJJ50#cUuY8Y`h-cD+|8eeBTz4p?8c=4+*BniXy%l`){<=aeiw#W=~T^eYP
z#%F^|$FLw1U3$KB=sEJ|pz+`QOMSjQKSzp4LV8LUM^iM8qPN9K@)c6Kk1tOQyVp~C
zM+=_ss0kXe%%_V=x_=<kd%54}skkt|q6C3q$rq4{e6qsn_}*;Q&4lpbimf}Hec^nr
z&Wg{T*<4xESqBwPu<(j(BgD()whCLZAUAMf-UuIlNaVlj=08{(0*{mK)v}m`MDDTe
zYLF<Prd4M55HgmYCro1priTiNx?oTGI5T%W^?ye`6r&Z%Krn3ZxG{2ac1{3C=hX<a
zuhP+vQ<sR_-B0cH{3-FDz=eY@rz=A+WVO6@cKO#^B4)9mpIJ0EUsa&5|7Qr@);mK~
zoj<+Nq=nmg=K$CFfF8c-)C&7OKI^+LoKphhpENNt<;S8qmDB{#O5Lx0R-g7ScI6Hy
z{|gE))2ZuudxihyYWEh9rdnENmJ?KqWC5@-W|mFWKPzV2%ljbl%H_Rr3s0w*I1N<%
zEIKMWDL&!Q6(){E#UVL@;(Yi$bP6~rMPLa=<3!$T22XIUaYtdp85v5tu7@zY?97kN
zHj0o3vWk7?Bc$xFa0tcm-rp9m8PmgpyuZy8#gg+gyaeYB3KZkAKT~=#nm@|HsqAd6
zt~|*AKV8_CBZH;IYgy?IrdJ`ijzg0sz9LGDHQC7PdP@VKGH_q`gh9z8+pMWn+*va^
zwVyq^;*$tsVU48iV}r9*`KyUm&UqZ$y~U!W+^ZI*(lL>n?zXvKqS*Uzy@UK&8Fae!
z0e(FYDr?7bt|1}TNyC2H`EUY=fq}<e2wFa_64R{P#H_XGCFJ3PGheDp3aVu0v=&ND
z1nYCD9B`a1aqhLMv0C-IS{h%U{}CI-9i?`5j&c$qxZcs#Q5wv5a398{BvzY_!%A{%
z%IBfwe<nrFjh)o-{l>u@X;hv03p~khpuQBP#p@lXyjGov-5j;b|A?f?;Y3A;xYUj=
zoiw~vviE7#(*_>xlqaGc0iEOd+)0(F5TDw2NE3uxU+gdMpUzSpHsyk%#bK|M+_b-i
zMjbM9q>S;9pXdADbga3-pfo{*ZSP;#O#iix2m2a~ysI*$-^t&swJCq<y101ZuSQlN
zm`n<GzWB`Hr@`wLG-Okx`m;A|%Vt|fv85B3INQU(J&MC`{_-~ID8se>+#yXvog)SQ
zL0;vx>8hHn8~(JLt<%l?lgMFteT_u?Pjo}n0=$SMp=jMrD}jhvS;>~BuqELVo1Aw2
zBUl6O@9D<tJ@#<X9}P7BKzfHOpSl?3HM%E5evpr$2IjcmZC^H<o1_C8S&?5y?A4+9
zrtS{{rV10#wch1=H=Zlt_7K(H?!G5ysUcY%|NW^$_I^j25)P|)niP$QEu5ZSC8sC8
z_7C+eLU~7FVQMp}9<A0H5gXX6iEPNoMRlq6PxG3$TqTgNx=@e8n^*#bOS8#XN}0y`
z^<w|Jd^Ab|F3n_aCYw)3Yc>H#09*F0>jQ<>AikLM$$g>PGidv}asKfTVh@m$n(5{5
z6Sajx3gWjXFOCa=?#Q9VdeQW&F!63$$*cqt<R+sLCesaHk9p$x{=G%fyxP*-Ssn)#
z;gn{w=M)M?(!)w*OJT&3zReK5T|botOngXHh5;$4ZLvzHP4o@zs5Ck3`UhprZRHaV
z#zEx&%)%{l<q4czZ|O@!FSZ_d<=Z)~)GRHdNtUxOiT_BI1fxGb<xg*BPk<HRY?u8a
zn;en3(CU7KQ80fEV@IW3(wVUglj*F#t1A=!ohM)&tD#v|FV|?b^J6bG^!5y)(P%&s
zS&&#>Z!&WbjIo<LdWg5XH8Ch*)_Ms_#Rqzj+C__Uu*&?*;98qY1%CF#+sst6<q^M$
zAlyILp{Js|))W3=#q`+ut5|p&)q4<l(ZY_y+#8Wv+h=03eyw0-VF{w+Bt5`;`Ax57
zO>-%o8RGn=)g}e7rwEXdxu)pzU6@}0$;1Pb`3mj7KU{1kH#qC&K4{BFdQY$Y7RwB&
zRL#DOUg@~GY!`J!GVt)HnA14Iv|l{5{MOCO(on5jQ*HZ6M3Befp3i$)?3$U*$;{Aa
zSy65)#sSxs&+QZ@d8UAuEaAt+8$XvwIxEE0`IqZ}7h9qJ_lK*UX+8ZEBrWH%6Yl+i
zEq0Ao1VTe=<GxLKTA4E#xuocu@7|x>P#<^2;$I*lhN#|BWl3qG$t^lkJK8K3lS!Yw
zwm<jJv1eT8Oj$y1{?AjsZ!4bm`zEHoZEKEF%j;-qM2-Kxn}2~hfl{0d)TN5demecG
zRYS>z+Z}>$|B>7!(XQAt^J;N5)^vZA9vjjU>ul^!rRj7$^3{H(>8(OoFdqwtXC{8M
zJzZ<D=I6P|56LzmtaG&aSxTYAwc$Z!B=1=vHg0y-z{T^A=xPF;0y${dzY<zlpCi`A
zKNxr;mL_$yBb?*<eYVD2RR)jBGB{j&d5@1wuM~cm@x>bR<y}Ee1inZ45=60xNxC^n
ztt;1_6mg(;7I$z)1(S9Zn;=s0NEF=TbpTV8!!P+Y<az!}E7J=5g3C~6pB9BWdJTa|
ztacb^en#=5wmTIQD2&s!?!#U?h+-kV<BSORbb*jhIHE(69y#5z7Q2+V6ed4BD_9W|
zdAU1MQ$0omk0>p-z~dtXc-SKg8yPSfo!m%Ls*gPRt>1zJh`bpPwpfpIbM;Ch6)Zja
z=bZ}AWqf=<ji8*H!x_aNrnD5(eSYa5CF64wvE%ZggpGq4{f)UG^^xRf?iT(<0XaHS
zDn}kGe2Z$EINkD6(NW@kMWe%k;_4vW7l*$+)S<u3S>3%Z>wviDS7Um{w2F=<JiJ2*
ziBN(}Ka5cQwO!))$@9zfIrY69bg1!7syfo0{$vJ`JOKrWseT>{Q6h#YO;<xh^i(p?
zwsyaQrsc_g5Ev`NK_@5b$<#SU+<&B4f6Hwmmff?VaZM8fKlPt7lvs}Od}Q01h&1Tu
z2&r*A-tYS(u!NHGX{uq>1;4^6=GghUoH!vT#eE&3KAMx*vcVmkYR&7*Oy(C2zg;YP
zs%2Tk{^+Xr)n|L}+68#i?av@GMejV-)5(6`QU-&#dCU6=K~(6byFfbXSfz#^-zX`w
zHeY<u%zNweXpDs|CCLPTMe3HdF!Jk9GZiLf$j`CJ<;5t}*9fKxqtVkp-#L6|cXi%>
zRX9k3&T6mzto3K*PJOhm?^ir)6t}1s?@;aHjKVMmSG&VwYr9q0U*6|we+=f6ByoA!
zGl@K4mE~YA`h1H7lqZL4J1l-&7?S|^Pc#1ptvG{*?hQ%75BGSG-<D+mVa#vE2Dik`
zZ$%7<1QB3-*v<cU7l2%tQ}P!~^zR<!$8$o3T+5t!BO_hZt5&D8K>|7de$I3eP5=QF
zE5=k1tUEj74gT4y2}c)+*FT_sC0J}j=-35=R9rc<OOjxZ5&({FH#A~*?x#oIR&|P_
zBezjX9St<B#3YRA_W6Oyae7o{udXsu42wboe4yaxIkesB3ch0;3{zG)cYL6|^z86d
z7Ic&&jb#d<4v;0WfB)2eG`^4IiU3{dXEFp%xJor=AMQNbP{e&3wOMSED)DW&ECFqi
zd}%;vS)T_g>5N}tydFaDdi2OQ$EAfNiGOyzfWI%urB>DZ^mWwKWS}Ff7W(G>eRs*?
zHjcnzV^ffZpH9jowcK*~VE=ILNYEZ@!){|Xnv`Tq<VvLX)G2m~)(O?pv4F8Se8E%(
zQ{9G7>?zhl-k6Kwa6@VGv@2NLVjJ6Bw(su(Jl9h#XRyDvy_2iu7t$8@3OsL~-feDd
z(xflV@;P0?Ow(FY7qIEfj&mVR%%|wUjBHO?%-Az`(Z~oSs0i87eJP!84NnXt8^-TS
zAHXjnD=GRK!hd|oV18d@4*MMiI<w`LM7I8MAEqo4EWY*ua>%ZSA;##_o}ph>?Z8He
zh!I=FvHySu^Y(w@;c?(ovysS@&Q~|DF~UHk!W?nO63ypQK>WaS7{6xMmY*}ix0~)x
zXA;-xeOem&O*mg!Mrp|Y;TDV_y{0BRbQ$%g8NjoB@i1L(+!#r{23YH`|2AraH|G5M
z+;qX-2yz1vgCo*C7G;BW-iaI;H8D9Nse@lyiC467NWUk-GDp>x+52yaMX8aMlo^Xy
zI$SlMYbtTp3+;Yjfq`L>JKm(Buk@!zv<d$vC7(Yq5$!%;Igo)F@yXJJnx38C^~Qk{
zSm%M>q5tU!qzZVDDP-O|S3A+<8GJZ%y5e*=WNd<K9c^srNKFy#)&f4Z8e-9lV<GfC
zV1(@Gs#raHA48d6!^GqZH#hgMl9CcLt*hs|BjpOUs{5J3N+o?jCRazt&t51+Bf#%%
zDKz1*O8UwZe}8`J^g&S^gc`!-kk&a0nery{S`XhAe{$VRviqN0KOKrO%o(@uNJ>jv
z70zLSu=NNCStQ}l_;>{2ORFChrRZ_2GtfaLag0?F!H6CBYk({A!lz_#G~=JDE>}GL
zY17@WIj0$%x%1auxGhimr`P-H^Z)KX3;(8Ka1zvAy`}y)+7<%cY0Y@0CDXO34Qjq*
zI9Wd>`^In!g@X6gp<0S=2Voq6Y<2a{b0@J24e&J9BRLGbnpY@xH3uudMla4Uj+i?C
z3T>X7PV*PS)mU=a|M6okgNnG_7l9q`#6V?7f7^aO&l+oVl=x)3hBLKO2@fZWdb~bi
z5}om}adq#-qOyhh2VFQ#;N7xfrdeUt`tVZHIMmIg<qUtk`bSRA+cebaMpG3asU0(c
z9!?f$g{-)Np+}O(%8>tq*QgMtRo`I?7q6^dkK-_6Z4`6?Pj#4?-pV5KvKy<HK`u<E
zX0H|kZ?l3Uw&vkV2D1{ozSUGuYxQ<BePr|XrzW#J6~V9*K<|~@-c-G48sq25j|-U2
zL0^wcBkYi@HeseoEzoC}j6ZABkYrowhJ%h6qnlsjza}-K83;-#7Od&TAfAaiw<T7K
zBts5>dVSlVY4kj@T<tt#JKMmmFFnDcY8W_fN`ozv_O`D&Eh`HV>g@g)v!c>w9mKpQ
zMpz{`4s{`Kp<4CqdN`d8ee>l9Tpjp^6#(?y^(WUrGxh23r=?m~`~;+~Ap;H^ESkQ$
z2H}_r$Fpc>)0<k&s|+*1%A<r9>OYsT<`xWL=cWx$*rNkzGT|b7X8QrX>0VKm3s=G)
zjGh;Js<?eS5s`rtM4a?0of1jDN&LZuS!~6`?@cyL{@vMln|d#!B<xQ6l0-Z%-zKwo
z)e~w#JXiS?leO{VJPfhK1c8%?A6TCOHy2WN2tT^2;%KT;e<Im!=)yvQv3hZ+xG7_{
zZ(tvF>el)23aUGY8@j5LSCF~JdFq$YWh@8&=qWqkowp04M+9lTRg}j3mO2_O(KOH`
zQ~1p1RBrtVWiWSon50BQ@8pUkm+Y~r{XOw010M#h@?vzQhgj@`HRGIrO)0FT8}BpQ
z(ff%1iy%Jbrql)Ldn!_v_9i>L`W*b2v0=%qg%Fnt=&@=>WR56r#|vjLNA~|DQ7@0s
z&t=^s(4D!CM5!YDb#I_SN8{@gnbh6oV`QB$wnQA*Szts%^aKI+$?b(eGX2`uP<IN%
zslP_3!DrXtUs)l=11}fUmLr>zAPQ*vPgH^&=gqc#6~RqIN?gkS$xXXUPVY`jtPJzY
ztc|e{WAQv5u0(7{ej*{0mP`*uAUVtE&~|iaBhBK|EjrlN$gcR**XR+zMK=^ML`AQL
z+j=j)ed;rG2V7Y9CM0?@znKLbsV~J;dBhXQS~ruF+)wCyTo^L=NgE^)fiYJr7(yGz
zTQTzP42`QOaMSD2VO{)$*P2RaeF5^nII};?VkzD<#y2H1I*h73F2Ljk!>(6<F>gqY
zI&Em+*apn9)4jF>2<l9g5OUPXkzSor=fVSlrg~&gENYm?<hF>9=!LQ}X7;8m#6UH>
zH$vzE@0H0RJrDj3>8@fOj>s<j)xWKq^B0Pfh>&l^<w`tKR9?}@Om*<s58T|nGeE=P
ze2vY<*`yeMg#_?uq)JYM%L2lHuSXg`vTr(X0v(R_sCeir<_jA+YDN47mgr-EUSQDQ
z&2FanMSEVFdNLp`L2_#R<kn=eiG9guBo!P7wM!8n&b=0-N(S=@updchT!qnJfmQ!6
zT0Zzw5P6<o>VuGK`Jb0e@7Ke*b}h{rOhD!#CMEc;7r{NlD4a@+xSC|s*m@&%BLSt%
zyTj1EF)DFaqfc(KQ_0PSHOv+iK#-?gY=X~s6QUMlgxJqfFL`TdWuyM?l8i};V2DE*
z5{Bn-(0~tc@qEUh9siw&u=r?NG|5m^cJY^BY<MB6-_KtefK3M{`<{WbJ)1!!$LWD>
zzOkRoD6aXHsy^^L$eQlGWc^~!5Y-hapubyH^RVsNS`e@BJD+)O^g~ZiPRR+$q9<MA
zyw0&XbU87JUHLgD)^X!$XukH|l;CA9ow3cp_!ewI2QmYUOsaPC{l3GB(Myc(>J6pU
z?QslSWsZOJB1JF8Is}%VRg=s5*o>kaTl<|w{Uyr-zKvbb$A!fcaC`TKPcC#M67#3%
zB0jg{3!g8mJ?{g+R_Y(&R-1SUETUt*&AXIV8_iE)&9@t*MYtQ=jZD(RF-?L+gMc-E
zS5!mju8yXn%Pg(AK;xrQ%8qW4X~UcHf%6+oDaseb*}^}cm+>|sfQsvIaVE+vTs!#;
z;`21zBEdP~Xski@G0;SU^9iU{a0B2S$RDIvK#k6rZ$$MnU1T|h2x3|>nA<ALLKUz8
zO-u$|Uo46`Uw1z_Ik;dO7G1!0xe5nR!Xc*{1-~NPm>W=pajsocm;<|>4!l6yy|31|
z-aPXrEW{Mm{*1izN<RKKQ=(2THZmA;$27w#*&L%?n@pHQ{x(1KcN|mFe4}Tb>}DQ1
zZM=4Z{WS-Qu-=clr{*gf<da6nyf2~z#woS2?%Q+M;A`US1=1%h+lgmz&Y9Ob(;8;v
z%k4VIdsHb_W^y`2Wi#3x2NBMuCpX6O3de-K?cT24*tM)rP{SOB3l2Rz__}zU0nbgA
zas|&FZSqe6^$tVjyW#MuV|(p$l{M<KZPI1J#FebxJ*U6RpU_Hc^v1lJgbn6ouZY60
zz1o@<PczGLdB_Nc^W>!V=SQn1q7V~+7JT#@FTpdpf$EbHr5nOa#r`EX>ty=C)(*3$
zt8?@mDNGuKv4pgOo+SUm8OGg8Wm#?<ym~%MW59qg^8LY@|6zny#7sZv+uVjQRb!bl
z&E7_1)iSu2rQR)VBU6KJ1OgIo+W|@w*uRQ}Bsv)2c|LUKq(9~SI9mFUfv+@G)^W&+
ztkM74VP-qpzZp?Iob?qYLp(8sNFrLh+@;`Bt%v!Ez+rTW%vt~|XvemT_qd5pO~$2c
zZO?e?fQ-K=G1D)tf9it3Q0e-V*ZJgA(=956`=ipJIo|mXtDo21%7R<-Ej!$`uiKsw
zJ4Bd_Sz1ap7$8JQEYl?(CO-&}jlcT0E*rJ9IZtuCpjJs5Da^i2#%J}tZf%eU>e?-^
zY6Bm{TGAFpw(!@m%3Aqeb7uWgq#T~uVt@Nji8P&8cm#1xad{<vyPY=K1F&J41>HAj
z>Q_Aevx!O2^>9!Cop8U4rAF4}f|#ng9|+0(F2XQ&QwjeXwcvr5!eYLc9E)*bS+7HZ
zK=-k#+!g4IPvw@e!mi(j@kG)l)YX9)sepv3*WPS^?;5%zFgS>f5KY48<)(xczL|MZ
zS^Np?&~l-Qv;!lrLFAvE9XpAsY4q}hI`gbhJ6i*m6b}9pJrKHm!44r+w8o9<X<2xM
zJbs*XI`XS(K!O<BFLvj3bVPg3SdTzgVF`xUhgQv}q?ghZzeLw==j01O6myk*Na$10
zU;Wx!00;%$Y*;VI&>TBN$X7Dp5(zqPXG2)kdDLX8+&yM!Z0ETtE&+erS+S@I*9g;4
zS67$XL+gEvh+X1uwgT#tq4w4xc!-|Q#Sq{MMzk?;fnhkhV)n)6FuQ7?$%=`L+>J0r
z>fo~a7*&n=Z9WGgr+tK@*-^ki_b;MPluY55*{v<cF?WynNh6`T22HmB357^1EpK>b
zKSR<!N>hk{Ss3+`Av~z61F0+7OxEXkzRi~pi-$roT}nhhSG+j}ck*4FiY|^|eDK(9
zN1jb#ViN{a`O&)1F+`^P8^SLGkLtfo3J<Wac_q%*_f+`E0-)oPk_wEd=obrBL>AdB
z0spvH&%~j?Jqw$y6Jb$qYEBW89;MZ)ac2<};$MU)IHDH&$NknNwC{08^EPngR6ggg
z=HKpiY1%t|fo*P|B(wQPl>7VG6Fp2Q+uTWHn(Y`g*USXIo<sIX6?!FDclc59T43gT
z_)lv;1G6Hy#nIhlMa8K^T$YRTKCf^zmIUu)oamfOA>W^j=ctnkM^zN)>%)u@<@jXB
zh(d7qy9BoKrve$aB@)hmO>6z!vR0WISOcd8G*}#`O9V8P9nO!D{rwb?J@KG6K1&IN
zBHPz|F1WrJ<%4vN|7@-E1V5U>x>E<9kp8uXfQfY;cBH@>9wIxNZNAdKl(>M*2~IT!
zD82wdfu7V<p55oJm4=DN0T_p#?z<k>-E4Tvpg1g<^W2RBlQqR2dzY?g2O4neaxKE|
z127x26zIjuAber2mqXTdqj2i%H4vUj@aPqju5;X%%hE<Yov*p0?@}Z@OSs_Vhf*=1
zs&xXW+1d=4v?ANKyv?Q{C)|8CVz6Cx75Bm4S*7flQpUiTT^X#dM~R(T(92r8bvH&D
z`dT>0zSzp`bXq?%V!@~smht$6$z}xsG#F5z$#4d7hEe1z2{9hbF}NoylamY;7xo}T
za}d<;?(`8ueof&sQvxP~08vphR&NGZz4BE**Xbw|d(7jC-T^w!8ih`OZx<^Oc|n%&
z?;IkZ1cG1Po{mBiUf$ADr*a}fgd40rGl_Ds)#K-Bh8|0(t_9R`*4Mq)JLCZ7MEN(f
zr|z!{H_s0$azbRRA5(c<-e7QSxY;Ue{53<X%VR+Ao%TKNY8EK5r2JaS15{jGsoDM?
zp6Tq?$zGmqwm|@!)gFcW@e<9rO|`(amJ_k9o?<OqMvS1>7eOiG7rv=7);$14$LWej
z?$#|93ZTSMBe4QU$u3=yda)52n7{0tAgIo9<uP1X-PzpZWx4U$G!LY#r)hiY;Cf&9
zWcCJR;Wi|GUw8FMk{iYIrYg-1hQ3h(V8G&7vJ(d?;SVs1my+Sc;3JH`nQqP`Blva2
zMry=;O3O*aEWKw%EYp0dgHZsWaw1)d6jhEHnOU|b?HsHfIV^A0(dy4jBmKG`h+leU
zrI!R#5k`^_&K)s-oO{XK6T?NbTHAATIN{|fD~EM`acL!Y(wjpSlrz*&<b0?kB<CuY
zJ!j~&!)1V}{1((12uj2uv_Tc~3m2z*PWin%hN%&9Y%w2#o2`?CymSvSC^ZGi*n%DC
zEO)cfjg2DW=q!Xuc>J>egP&<ExrO&Nf!5>`D`2Vb%FLDP!YR-RCB!PR)i;B1OP-h|
zAkuyyMJTz|e4Ws81OUZg*KBPQuv+_$`&1SX`6D&Nc)%A>gQtwWIJEzXRLH|#XPOC%
zh&1&&cK5ZG+8YB@(iaD*L7xo5a`9d6=f$+zZa#gz0dv1#Q<u~#ao-;4Omfo5qFMlV
z8-`=LbR2wf;_K52m3`fW&k(bTLz{>BfZ1O982G<zC9GRAbNLYqzOhrb$dtg5`U2)y
zil*Jb!4!K$o72~rL8|J+g*>eysE>qG+c?BIRE^1UVtR+ugE}zH--~({EJad|b_HY(
z&yX)D?y=T91VPT$_uJ^=Z5Y3>N&5GLy$~ID1C$$G-CI3sG_H@>P`%_vAH%0@m6;FP
zg<DWe2vGCfjl*2OfLTuGf>ymEr+-y+TGSt1!!Hi~`OLh3btSK-M{7Uq<<n5wo#erW
zkB<-GQI1p>6gN`$g}k93?+0T;2qI(3@ylA(FaN5lFQobKV^yldW+AU-2p5!Ts>AgK
zA$?I>8+pi3tYV%pWeQ4A^adYa`-^w0RkiPrg-UF%hEOIFw*^P07WNg078cb=WY75n
zr62cMiVp@Qe({Hi5YELhUwZjn^1JW+AR1|Lwz3722917R+ygz<-?Scixj4eGtU-qQ
z@H97E6m#lMdt*b8<R|bd&Y7l3fa@;N3n}G|8JX#_yiYlhff83LUTfC$r)j&OmI09`
z$4>6Bmu-p4I#f;WxG4fX*am%KX;}>%xU%NGWnM|Zj#FwhjRsAas}LBcqHc4NgyvL-
z#P@cOim2bxzT_too^a#vX$dWZ6BonIbxZXOPg@UxH&$Xe5{QgS8W$*O{2*^hKsU~-
z5sm}={@9G)Xf~(VeVG~LX%YSxXlHDjhs*w#mFfp1F&bMjQJMMDL{Jw{4;X9Ygu$oD
z9tv~<0iqU7jTra&)@^O~Z?92eZd`?i!~658%}=9ZQ!|4-@2PJdo`(+Y$<shb`oi@z
zeo%UQdW^fi*03ssxS{4F^+1=k_ifkl;N#<}#)+DGiBupo-T~OgJ^uvu6ZE_~V6!*Y
z;q@PrS0$+&4xeUtbr5Kh5EF6cWoBK8TLSst7h$X-6v~ivmtQN=ycC1&j8Ci9!^rD;
zeEhNTa2E=?GT)K&jN6e{{tV?-*LN>}6#NNVZmutt5Pa(vGtm^Lz5WHuWm1#=Vzh8V
z+4=l&`0B8fcL$;83dVlVMT-S+cgAh;0yx>`uR_~U+>xP;d|G_}&W4|&O6}>~ldYr5
zU~>@7%>N`1Wb)QNt`?#`T(A^8Zk+SvdoG`fY?I?P4j9Lrbq!%1A%9>(C1v*8%$si(
zL(J}7u>$L<7V&ChFytjctR+0II$7Ua%2j~V%q%d^5q}cfp6uK4o7C?IV?vsBCAy6E
z^%m9-^Y9)HwwSKH^V1X~($k|1p83Ppp1eu)f)*aG%mr=c$rKNs6kfZy+m=p>o(KTb
z(3$YJ(E05%6yN7DzBi%(bu6SRcey^^f{f00?>hwO!+C{lGG2P@kL>aju<G(NTA9c%
zQFjq4?n7AsX4PAyAjr@|!B2WsEtA#_|C>!*EEv;LKb4}-$5Ndye*}&C!|pDYJFNP{
zAKBa-;y|zHSGbtE70sDuSAq+^fD3SozJjNQnyF1F-%$?Ut0hX!?7;SCmd02zS<<;b
z+u8bnj?8J8!Xx9^@le6n=m@QnBu3sb0C5Uq39_TIX>?bbw=txq%@EMlCZ0#Z0_I}k
zs4XE7a`Gj1b=+4-l%R~dU&a<bORM(mDd^YgE2ndGqrf+@+Z<EQ4o;i<CZVL*Z$Myt
z=1g|0pAzJjQTFKOHv{HIhQCgoN9*d?ds0L!TLW<rA)|(My)TNZb%N=xjVgZBfCj%z
zk-lidS1#@O&Jf;^sp&}lik6w0O@FE7(gMYSW*jBP*^wSWpclXI`s@5uiv${RprspU
zSjaCdba-DBT_U)Q9=*TurMGtkYKwnWeRPeK6HaMOna^6=<P{v<klFoTm{@9z@aulw
zjf}<5*{`*Fow@wgOp#Nz+Z99qMN}~7^`NM!q*XanTV5_9OA!SfmbK+Cu>_;#MrEO7
zX&vGt`-`UhSCw*GiI6vKhH|lp{qJn$AUXu>=0cSRW3d&){1)e4p@SmDY=S$m$7Vik
z<-c9gs~*11Z@x381rYMHF;avs#_<t(D9-orMrxzXIL@yj7gTUawrHd=CETj<4(`*2
zV!np;hL0;kY73%UPJH?)L)n3mUDTv4?+|H(ry1l>jr9&|F}#22g|QRlacD1%er;7k
zs{&Jqb&pk^j^EbFeCkcs7|3z4k2@j5_02?zQqKLA+&qtv^_%3@<lX*X%=eBRT%6GI
zSIlflkyrSr#?FPw%%Z2MEgPu3U~deuh{V%0&6Z1enOoAdW!27>`xOF@0ni*pWQZi5
zHNp1Ret~-+YIS4YnK?LZhxO)q45dE-`$1&ua3#!}^*L7`LlwN^`#bHu_IvK9Mi3?s
z&Up>;io#>Y?Hz;{0&}X~4;9wi_0JuKjJ!n7RM%&DEkmt5Oxp8?Y$hu4i|z*kyIZUy
zcRJv<XgV-5u?+i;TcQdWCR1m1F~eU-5CstZQ+p&VcxhnHMn8pq7Y7Fs(}8&c{cAe!
zR#=$t{k#1&ELKlo5MBF+bqMgrc~HZ8#ql>n+8j9&wih?hmK+%DrF?~pf9H9%H{%<U
zNn-tMJbamoEco5M^w1v3T|fxu&yd+w>IX}Q9%v=j{PA8cvj{aUqR%Hh`6@^CPpak&
zceB+0pM>Qv#L=(0h?*R;zGg(aZumL63w0h-?V;z+Gm|Ww>TQwv0v>hjhBaB!M}oi8
z;l2{dvbkD<VxxT}&PBvK1i461cH+K;ox5X1d#IX3D9No(1RW7SF>R|B`qcf7WN*q&
z`x^mB0F&RKeJG>Csi4F{72t5(L}=zq+wqM1<^G)3n8sudS*92?P`Bfv;uB*WELN29
zX(zYI4bDHq#4M6)eHa)bf()jBzJo}Yd1rF<@Y;Jn?+IDRGc7KGT36a_sgdXkufHqY
zyX7vyu>4R*sKMO^_y$8}@j;8>iK~@WEb;7WxlKw5sBmL{v9c^3atsz*xTV&f#3NDF
zq-fNKzHfuTD-DbTFu7;O8?}MgR8bMrxF%>WU*QZ#pYmudB`lm7R7JDM9?s9DJJ2(W
zT*)z=Z!NC=NV6GR$>YVy#Ghh|s37m+xe9BG0j;-(pbW3^^<*1Q+NF~E%y~Os#p|1q
z!igdNmsBPIhHoyoq=D`Di>jxh-^hhk3`1uTu%b`?lJz&~`Ma@+i4LLc9>RplWO2vV
zS}fQj`C2g0eA;Dw@{uY3q!^b|(u#rhm8w$uQyxUn^Ouw@vnhG8b`g72!-7G#qgrcJ
z=_EewOvPHN5AzFqcaP8_7w_tyZ+=Yo$8b!n1E+2qG3Gdnox<}RnZDQBs6@W)9BBQ;
zvKbuvySw>k945Xz!sOhP*>c$%3|7Rmwviy+0arFKk2)Gy`WNjdL-jg(K6<2#bVrnZ
zux);0m0-eM05zOpuwI69xks2CM(RG)8&&rdDF=Z}cIBV19`bUjUm+F*JUh$@si7|G
zpv<%?>lGj%fDWPl@ctQAIA?rgB_rAHJ<w0*g{tfMm`QjVS#wYADqW(AKe){Q=rsh>
zQRkNX16WzU7cFu0O*P`kemPjqacqIhV4Gm2vH`~0M!%z;&&!i*&N&tX2!^xS@J;7w
zwjKahe!ZVAhjmHzw~*gcD0>WCxNC)G4z8v4nD@CI)~Ii2I3k<N3UN5t?(XB6d@<Nw
z6J}e=4Q#`F2vM7GTQs*^=ud)>zBE8!+U7s2EWiz@RNj@!`_%H6x7*{+Oy1OdnTU3K
zW~xZ90-2xzT13(3sB*b|dIOQv&b3y`pUP&4idt^WwrkGm%JDh4d1e6a3iJrTduCEb
zKNsrN7yegCedPPQVnbNoxCUk8;h9=Pjh9}0oJHvKyu}V{Vsuk3N-z(rvvgT1YmC6t
zrV)D5ZAk>>TEnQ_1Kie*;vJ$l74ZJ*Bn(mEOl`7EzNMMsPPqc#?&VWD=<MFXc^g#?
zR#Sv7D<&rfNNr9qzB@e_+r26D{HDoaD{L;ubgo+^032A-r;C{ZqEo&)KH|!`8Aw5B
z9xAGx(0PQiMRHm$Lc+>xE?+7+FyA3wdV`#y0RO|H@U8U$t+0bOd(EZ~*SSnkD+W;Q
z-^$uk!dLHW`A;h$KHBXkUxz&52Nr$<C4O<`rd+3jFV%DXrN>8Uinj=^@QCa&Vo-|w
zHY!S*;HDWpI_w}b;W^!&Wd8U(GrpAVm~2;G!pAvX9I}1aZT8l-LqY$ZgJzagbIc}E
zL3w$Q^%|_x7G@DVuBW(ocxCI1t_!J^67B%<Np>|iVEkI0E!l=Dz4a^|%w}dN30QU_
zslm%uLQT&X&MpyGdG;0~q_=itemX=wTB$;$MM_0qJ}nqCMNcc$e+gBdQ$wba>mLz&
zEu-LCRF}GTe?dFdOJ7>;1kthGP*=Ne`S|nXhOebTN`!l6`gs2za%-<<GBMcHpMn38
z=P&oMX^mI&Ucb0$c^<*bf`;33`+o|HmeH?I=(A;?^*1MHJ{L|@M=$pO4k;E~)<<Pv
zW{6d03cI^X!uGmISil`TNnw_1TdIX>RWBet4mN3!1Dw|!j2zd|_?G#`wRrqLY<+Wh
zUfcF{@WysyJ86<ejcqr!)!4Qg+qP}1v2C-l-R67SbM8I&-rx6Uo;=Ckd#$;~98+U`
z%WT{y>_FJ22hh@V34||Yp>N`btI4~u7T1Y7hr{#>UX1KP(q?iYWucK&4L5)b!7hV#
z3JM=D@7pzwp|!+jHi~aW*&W&iQ^a_tR!rRf%x=e?+VgMm8?N8&4YW_hz7RT|qto^f
zbd|_?L#43dXW<99j88`;Dl6ni1@Pmoi($w@Qb&+`66#FQBfBfO@<rjJN<T(JqXbTN
z!o!=#q6j*ZkmzItV_fF`RHqFQqKJvDYQpB$zVa2xl0%6%vh4mj!1?ubZ!|kp`+~#s
zPST#uA^=a{;4z79IIS|aj|-8QvT<Vj2iRUT(`o}(TFsT+m1~6S-PwGc$R(E|942)a
z7F@J!!Lui!V2paL5ak{~AP`>f_n+9mmwYr(qsCt1Skp;>PJB5#vg)X@mkx|3vFqs!
zq!rM^-;zRp8G7VC+qy6Q?otnI@C*zo#rF2_s}V2}&|X=r)O>CiKG4kH(a$f3G~xmF
z{jaDYidkY{Af4R!PHWD1(bkE25&1f9zV@?y1GX~HGn~%jgWaoDe`m`fTxt3taX-#N
z*=52OdD)uV@a?Cg+te47Dq%ct@GqhplCV{Z-}}@PJngwK4o$x7C7o04Ur(v+6}3_Y
zdr=;C2#fD{1x&Hqn2AMo;g`<c(lA6{b@S#V%+XYH0aM5Gx19$k3*lBVJjqRO#H+rG
zk*yfT5XQTudvjZ{l^#;7KQGK~uz54XS}Ield=v#_Az9D4BY@qM)C<gY=|AuTN)MyN
z5d-|49=geKPDgUBtz~u4?RH{-?o|vNyfz=1%^)Q7T~QbWcm2(t{rW<s+yh$CEmQ<Y
z)z&1r1TNH(^8~i@Z7UJIPXiErMK(~~s2OxmYGg_;2Y(%a%m=TJ$sKyOG?%^6Aw<L7
z%!cpj`Bitdj#kU8VO#7F4AU+!WGHZl_^xLdF)<GDHCo#!GA#hFDT!LI7l0klS&&~z
z&B?dWnq}MXbK1%zm~MQTYbGf(g@J=H9q%vx(36D`e@rwi@I-Wr_9?cPzYJlUv1#>l
zZ9DE_zPb;XzT1_S;I~Z@9R=M^@`#JQaV;Y21lz>+%xK2=t!G|tROi+T=uhWFcQ8gW
z+KjFwT>~WZ!_Gmr*}unCBjr?qq6J($OpPH#wlsa9*#SMaw^{Wh>i}av{LL|OCT%Qu
z9kr_h@L(8;RFd$yu6!(!Btf%cR=bZrz0$phU$ok$B{`irWmiNhSMn|BwnB=;855ko
zgy23||Jq)FX?Q7G{DKz(<@MHYqS10gC6m2g`DKbBX32-1ukZ3*6YTV%3BmlS2l-*~
zdQM-?NjGs<o4U`)Nw>2oB$D7HS@{IouM!Fit`h><$QcHwB45LpHJCq#qZlgWKx+({
zx<3&nmv}YFN-2sT##EGcTUvfG0~_9Ch?BLgX8e}&c$l5JB)6Wjk$^RR1c^CJ>&{Mn
zf#?hWV1ejaA!a~PY)~e6rY={A?5~$k_pTnLR4&%{(FvHf(Vjy*a*=6J(E2<66`Fma
z9|bx`no5xdE_Ef`O0SKb%58+{-@`suya%mwA{O~l+bApsF@_nUmL~9+ORnToF_0(8
z7ky?3;ckmWc|}94ph)h~d2?@YS7tTgVrS5FZKTGxwmcGC%xL41Dlk4G%&Tz9w|4d7
zy=Yj*I9ZBz#?zLyczo;KQLbgt?~&H|(Mir(;hnY4MgZ2udvUkQoPR9s2o_R+S9qHo
zr+!3{6?FxG2t=Uh$1qONX!}(_WU&q7H@_|jo!m)z5~okX?Jf?rcm$(2d&m;cUhLMV
zCGLT!i=IW&1J*at>=Dji4B5tF%21FH%bF>u0V{{BC>d_~&7u?*?pUTDDsVb&Vn{^e
zzF@u_-I+}RnGG7Fe8}gdd<?dzg%2q+0>cR5d(LYu5%WoHwTXBP@nGc`Th0ixfu2Wh
zb3^K7?}R6VKfl(9e%Rj19-PYNtNIGoz<!|MB0m~HIC7UGcg#D@U7I(9<E)S}WR3%K
z9wHUNZv*<_!58X-^vs<CArwV2rsrj9>Owv+3WctN+zEfuIwlweww<Ed=WUvLS?&G&
zW?PMTrtP-BFQPG003Mk2_{scsxxhMaC5&-=FGe(|!h8frg6Qj4!9z;zz0ibxL5on<
zF%>KSMN}!ln#I`zT6O8=D=*jEEJYjDm5?cc7$aoYX2Tn(?@oLaH5Oq#Z7(T~o%B4G
zj*%q<Cqj^<u4X;khc@18qum5)3CbtPenl1WGd=5Z+S71U!9gM9`uRe(<?70t1BMB8
z4-Ui>707H06?JEK@eaC$?sQ>mx0!`!*!ieLT=jRib$jZ`eaolDxNgkqbIyHI20j8R
zG}`NTxY|;!(rhvvRD7hdDL;szvXSi{jxe(HCgjDJkTF^lJPrg~17(~oft$T96!N?K
z0mVv<)fppDMqSJ`pOG??v-2vvgfLf?$g+xjs0^!AVeLv(i5qq1`n{&a_NYg|k(EIz
z0(?KRO<i-v&b41zAWW$I@OeacI@^LT*U;1%+Rh+`O*<gCB%7pJ1^~*Zi_}N@W|={R
z@9qe*eX1o`?skJW5D3PNAA^ZUJ0w2C^V-N{q`wj~0LxV;DpQt1#mQ2~6g%^w7#FCt
zF+k>m47b`h*1I$md9N->#Y`ICPrC@M9UBV{78K4mOY(R&FNqAt(+)XX_+*LGOD0rb
z)a;lS!3>-#IN3Fli<Z5hy`Y4)Lp;V8#8wUeu{~qve84AwbnUg=X(+YY@frb*_SF63
zr~1=krYQU_%V|{PhyDiu(^Q)!5pwLgNGsC0t1(Y?4etS#c5yQATXOLIeeq02DlIju
zSl~8s;Z?({#}|1$3s{(l+)X;m$O<l}4UKxy(Q>(H^gx7fP}PSMuDvyZzt~Od#fKuM
zz5|6)1aXZnW8v=lD@K%*zD{O?W&-Ty;_X;4tdI@0q>$M&*Iwn#+LIiQpWJfo6g8@e
zPXQP+x0fGL&3lTY&cEl~1?}>VPmUBL=@1AZB2Kad-UFk(2s$ID4eoV(bqknK@LA;-
z2V$$h#o1kDsMKj$<QIo45FyMC<uirHfwjGn!9n26{UzPEI?&FqSv_sM)vdrW5vx@e
z9Bx-enT*d0*;b=%mneScVo7$~dML#i*1|li2;D>V#&(9JzK%OO)|Ed5JzJ0othb7i
zYum}zOaZe^?~<)MYb7JYs>5x@VwnbCVloG_Xp=`e=dM209X>#Qn!?9wkBhb;HpV5E
zuQ~mp3ecbP>`{_L*rKhITJd;}H?6+jUwQSeWHtFTiH~;Q>QeRO(C@J=WNd^iScHtI
zV$UoTSCSL_^K>#hUZ`D;{<IMR?Gqz1bB!lvt5VZ|1tx7%UCl>0)*#vCaK-K-Qt3Ck
z%^Uomz&3olEHWzqJjF9ZO(kWuN!cBA-0W?TEv?EAq&hPbLyupzUd;RZQ$Er5!QojX
z4ybjM674}C>noHIXLQc!=o>kF$%Gg!z|sxh&)T~fHSB?2;mMf!%6PtTCe2wiq*BKq
z>xD1P%~~9q!+RBefUybMLI^zAm^AN16Q6E%*H2UzH@DBc-wSYbP+Y}<|M{XE*!+Xa
zWlLCPq+n`RKCbEM+y5aNhJg_eePyT(D&Ejg)BS=;qGU@@z7b*<1j(q1!-2Sxj-0)N
zpMRKWgVXZ4$aZH0M8M3v8QE7=t9g3S04is-hB=Jy)&9F7?P&v*d7;9#tr}RPe)Sa8
zpkt@9-#RKZkuk@x<p&n)9K|4HYcu-Ntq?d>d@K#cEBiQSN-*H??e0MM$ixItAIW9c
zsDVfAe#5~a(yUvz7^vZ~HEQM+i=c|{cSy$#-zN%-q>3-3oo(JPSckYl8NXt+iP>gG
z$;Bq9w1;OaWn2GEC`vLMcC<_tI@W||C_XX3V#V9CrycU}Y$@`^t0~f;nW12;Jz4&{
ze{|ra^ps1|Mj|vS<>p&5KHA5om<!F?zH;nQlNARcN*Pf0T<ri|H`e(Iwfv#$BFxAa
zWaKZfW5cqGK>meNgr_(fuFUo@dToGE2F$JqX(BNs>af9nruY?+_##Gek5X#0hsF%}
z;Y+x+@jS$?!e3|}(vx7fQHo-UFC=LjWX5lT5tzaMSw&+2dOOP_DHKqk$BXGKq4&*;
zhx0kiu>m8SKAHxah?S>~@O+t2U38J?49sBMX@g6)x1`S0m8*l%iz;4MjGE%3Objcl
z2yQ`LE%wRh;q)(vc3Sn%0Ar(rFq8DQU0!&M)NJ^L=(Kgj;bqm75}n##&?5GqnZ<<y
zg%OP|Wkry?DWc_;yt0{15#3x}zkNMmud13^u=C=IuG&`XI`tG<lfOhXbku6En3RWh
zy)8g;=71S}EhJH{$z4r4FF|hU)%n^Q+dll!EN6M9ruEnS%jwp5U4jd9h4@T4ij+1x
z!#BfI`C8+J78tkMrSXmN+09VTAzrCUQC^9orJvGADqeD-Lu~P;Q?D1!k}KZKh(CR`
zrJ{00H~kWlF{d~=vlH;EEpRJ4m6qOw=Lx<J8uZuPosnI4ouPcn)A~##zP?_GFhC)a
z=%IDNA_D*x=)O;7b0iae!*S&kpCbT`VI{H(zPA`sHzX;^?8YhvRI5#^zpkE&j+k&O
zc)y?oLKN7!4nW8<oU57!+B!J}3D8O7tjW0g5g8%TJ|H(kK9kFM0Q{eSh7ZBWLS)5d
z^{;CG`hqL$@f64oz1dBq<wD3UwMdt+!SP*eGvv{iIIJ)K>L8VrDy=bTGON9BRrwd-
zQr6ssgwbr82s5u48H!9FsGvwu4<$S?X-F&L^TMb;7bAgd&WZ*q;@T3^FCC{g+)x_s
z_{_YYNGHxKH&PC~%@a{(WU;z=I%&rA^&!jZGeir<z`3#92ibv4OgG;u3SkSDm6YE?
zzQVw^!V~tIoI!ejYW5!_1Lr!DR+m1BXKK=}Q?G_2`KM;~H>Z92l7~vJtcvsc`X0s5
z7YLXrvM_7pQSAWxBwEA)2QzHJWS2J~l=WbXS5Wl&dj=I7rB;C@L#vF{uXdiDk6Bu(
zY}~HvfiI6(xuL_W!Hjd51iyB@KKsy{_V0G<5R-~LN4{do!<g=Wo$KfvM#Y$1$^S?p
z9HR?|(W|0Ty3XhZ*d~Wy(&8>q#s>`<WMlCTq){q6X`DZ2jvatPGFKJ@0p!7RlyZ8H
zrk)3MB+5K%K>&#Q5UUx?7le9}8<VbLitxdlf@@ZMzJfoyLdKq2tq3#(jC?Lch7F3L
zf?j-ptMp{u_}rOL`8B{-k(9lz(R!TeT%Dw|nar|5K!)AezK=~2sKYSqwk=(U#3mig
zicABlxLI`7y;)r1(@lokoHT!bz-PAQLr8_2fE~|*{KE6lU+?&J^He;5_>%}n(+_Ec
zlzl(-cGuZ~iSD^n^6aF{r3fAi^jdvmO2HH&OwavOY=fogY&p9VYv#!tmaw>GT&Uf_
zVU2^y)I9$6jJJCX3g7XBIg5?k*0Ew}q=7RlJP7@OrRZp{=q}ASnx7qKR(37CXsU`K
z-CBos@o8>Bh(R_*2(KyYZRSKS6o~FBZq(U-<Wm1pLIuj>2;|5jv)Q`owp>fSbeHNb
zeCR9sraIPqO~Y70*?zL7A*E^^&_Q~)4BeMkqe19!0Ph4xP&Slgv~U8=Vu{JG6a6lD
z`0(+h{k|)bk+K;vpyXHsbEU;S{2}<4qhP*vAeWPmAu%u(u6>klBXZux$Wa?A?nX<0
zP94#rh{xe<Qv^@v;)4S#>JoBIFwLF%NmVDyx-G4Y=^T~O_iCXq9w$^=WAoj{CHMtC
z9Zf|?nW7s>=i63yQ(>Ps=atvh!`>|w6RRk4$#imET}NW(K`u)5^i>v;g1vi236xQJ
zdA#I!Q(xGDz<=n!{x!Idi2N-gf{c=q^5*W24582D*W2@anKCUti$13^UgWw$)0Z~O
z)9ABG0|7a?x0F3L<yFL@ImL-AJm@uXRgTPNbuR~;>F0|V%rw&x)uIRxieUemo%zk#
zyO17)2c;2?)~vI)R|T)EZ|t^8FwQ@!2ilh`_199aO2%nup%ix4f<kG_(T4hexoQH{
zmOcw|+7z4y56Q;I{4!b?t^p*m{p?KsbgME!V$sMr1FB8&1vnO0S>~%6DHh)zGU5xY
zEpxvfW+w-+C)m^R9)N|YY;=As%<xS5U%6YefS%!4QuDt@vt@o?4-+01)=-*1m|(t^
zM~V-<#(yY1&&_>;K%&#h=2Qpy0;7pYkNLp`0Y^IW+-Th)vUP{%n5uzUFSK+RQ=tdD
zn~s)>9!VL(FYgRpQvH^CL(el70ya=ao6Yq7!qM%Bg!AF&oRWr?aFX<FO9*0NPsnC@
zZ4FUI4L9oA=Ao=Mp%*;rrD2SJ7;!jyU})iA!d(BcJC2dQ!6A`VwCq7Imbk0obVPo<
z+7=O-ud&}M6GqHUh+#Q_T91mp3J(HM&{Tm4b;1MW*`(Pfew-zZH#9M_cpBmYm2Jv8
zEs)8>a-W4%F}o!YwJ(YXHwcik$XQ)KbN*-(TT-CY;0}|7y)7l;Qa0N?E-(Q0)lH??
z$tY>?3?2_Icg;o4R9GthqmlVrJvaxEMBZaAaJ?f1npSd5vLLC#FxNVzM{pi1SM17}
z5u@M8`?gmkk1N;v=WuInd#R($Lw*|cGNaq^ZVv2JXsdlwTBEto%gs68+=|pt17B`%
zQiJV1adb!*SqOn5nYzOoE6ZMlGBRV*Z!yRJ5iOp_`>iN*d~7BuB~{MRxs+GT#C|W>
zq0T4F)Kc%$e5}0FYaa@s_pWtYYd?HEMLBg*ln~)M6WzN(f!oPf2i_*ae_a<UGtZ|V
zKmIr)mjOeWv;|%~MOeV_?(LV2bnMJ8T1B6{#qb<j=D2dtaW?a%NQ(UiBX&aSf5nr@
zz}f`)18QIp5sRw3Rg95ml)(q9fSQEb3lNJ{>aDk`oUZQm!?W=Nud!a{L~t*`nQL-O
za8=mt<#|74*gGv&pC8Cvjt(hiC|6)MfF;@xB859E*+{LCrSeQO$W)smM2}G2kmGjs
zfO*}xY$*v^Q^l8uR!DO>w*OX!`g?QW{d~K-`P|$}Sx_xHgCl|ZMs>Ay`Hx3$A)HX~
z1+twlbD<?XMr-nkI7_`<FdN%^fwIKp6-)@&fvBJNpe?`MRWThFPHV1h$|z^)h_m{z
zGK8O1&`uF4Elj4Qv*uVVIh4d!qBV9&tSdEsROGA<972CQb*wX=i{~zWm%J}@t*6!|
zSi$-a`~3@DgmZA9E415_fa<-%2#r}aekQ|brpaII?DW;0shF7^XsGEiLDuyqJ`_ws
z+8J7|HTd`)`|F0w-`L->I=dLXy7TwshaxRh+lUrsz`*OUi3?>6ZIUdiG`X8a9t(N`
z8n3RFO1PNllYUEPLIf>Q`!Z7#pH7}bY8Tfyyi(0~zn_Oh{927@^i7j}j-V@mN}H(;
zI{Q!L|6A-fhY!Fan0L1nVQ0a%2UF)xW8)&*o0gR*{0!mdNX{BO61zC>d(RMIK2u8x
z<IY(_yixR_p0>^ks0aUAfgR6QqlQVqi_sZP!a%Sn6+Zp7EdyOf@&hIgr~=DtGd4+~
z>(7__AK~3uXx}5<p^(|0w%nrUy4SqFY+22ppW5vtpf$BtAjMTs2MAjKkIn!7u@T*m
zQ($@B`+VKi*ju>T{O&bvrNL}&X+GP@GQtWMi4I+xzwAgQOJMLK%2F2z`i!SG$(cY~
zA&L5gvDoI_YJsk6vlqBzRNaixVPSC41jeQx@e8+9-&I{7-yVO6%(I$(6Tj6~OOO*G
z7r{9vWx3)b)g@IqSX{P=z+zu!{%Ey^C;9T|^=U31D~@T9d@bRBPv-BpOeD@hL0u@4
z!L_%uD?Q85u=BKCk|4=sr>MW`VJhlH%gfZnrIGC->a>V(BfeXAZr;wlJI_=7EKRM|
z0KiYDh?*#=&8*kafV`e9a`V`s4v?=H8tNilt!=hL&SDdP<nbMm)I?<Z((K&DBixeo
z!fR+nN#`0gZiy4W6yauMQaPImyr|x&{Xg`J|5?i|=<yV$06`(4AE~BU#0Y(d^QDSP
zN(HT}RhN?=>b>F6P-rWMvf%NTPm2@V`P>@LjHJbl*4%|b_O}fUw+iLnQzTZ{>yw{9
z<>twGIM158nC<%#Y1QmV)fw)Z0J}+FEW1{n+N0b8a9Etnoq6iO{_j};Dq^7_|JK_{
zO)oD=<3vGCbYhL19K<`iis_TAMhetJDKjv$7+$G>-IYb7n4A5|0Cr`a%6s7@2ub;Y
zTkp=Q84ky0`7s%JBkR+h2&dOC5Mv`sIDFh=Dr!h3>n`j>pjh!o>2B#CT-JprNk);q
zImrnB$FGoqQ3Ug65?KNbHTM#$TeLMpwDpr_rv<@;?kn|yZJLcx8b`=Lirve#Af`Z)
zN;?Yw*UQj=tU~v<Ba3avwX3t0;gw;aw4?-sH%FYe`Y!^EnkX4jS=b5P$5asSsZiDi
z*IO5o^QZMh!r8(=@lIW2<V5w5WW_hasn}NS4d}6Xu9CX{l%f9@P>7NOtw%XuEH8gD
z`t%(@UZ_psD)?a)$0hr_V0Eyya+4`Mpsg8~qC?BldM<j#MHgp<bEdi4x-B338?lSo
zn%LRpf;ak(zBpIoO}FFmjYJyTxn`aH!zZJ;I{N?LX6VI1o4GDar?W*S(Wx6WM3sfm
zVPIk?l@h9zGEjBs?6jH{qZ1PzeE9M)<mHj}=-Xjc*a`p0=u3`z`iXM>1L^Q=p@>_^
zewW5K-&~2<FrvGIm=3$2CQ3@eHbcmDPcGvqoSE4&KIhMwl9FNfi%At~|LsZtmJmS)
zuy9*qGU!NKTU-BD;Sacf-`mPA*z8E_etr5n+L0#7OgWyn(C&k#{{h%ZojMZ#E000{
z=wUARiXI)`!@nM3iPESCd)e3^m6Bh_yJ|St;bfh6l%YlRip*?gKAM2=QD;R>-sCw-
zm+I|JppLOQhl#EQRt{=;cVY`wuvl*qFYRu%pD)bnV9O4XSbbpUi=6%YVm;)yk^qtL
zp?eR1MKUCnFqA%ttCl$T&`w7@bD(_4{7kjYid`!)3Zn=h4JVdLIEl`vT%-9>juWFZ
z`LOck8v*WZl(?96nA!;M|HlSVLA{6>O(*eguC9<5EL@k5%X`C4WJbQ_4`_CgN=aE@
zLVV1*Oz!yDz>G{|pB9Rt_C2Wo?)2tS9gj6s^uaqYCJvW6wwjp<oR*#*1&0+G?gBVQ
zGtqJhPN5JyeI8fJ_t7gpGzVJXZh3`sHc#e#YSXQU)ydiJsV2mC7#Udr01y#b_XyA1
zt;qNOdfw2#z;o8n=-k}Y*x2N3ZlUd@`M8OTMItL4(<zYjlzBUdiwch{2nNG3M7SUI
z*tORR+WMZsq`N5=V?%kobd6HeKig}r9-5~+VDo(3C}jBMBc2=K2ewAb(<OTw9MlBy
zC%dXkL^P;wFa$iUovFxde#t@nfhwBy$<MWjVY9n5mi?5e{Mw|9Ew5zIm(ML~n4$Fv
zT*XgW*Gd)T7LV~u{eTn@G(9kBUl>MEiXK3UuL%GMWyEA;!dhCV{s<F&n~NwW2G9CH
zr3yM)9T0|yOeh(ifE?ub+%Lzo+3CDNFAtMfHw899M04dEwuOm=-7Rp|<ig>o1O4*T
zFxHC*$M@I}mpE-b<MVi%o(3rJ=hq+ZE<cOj$&kRSTfBdqZvQEM<&1><df??zf`lGU
zrBAyedI$e?ds^Q0-Vp&2E!5cjS8@JB;?joD5FBbX{{?Gm@stqdGYHx=vETmP=N8-Z
z6hyI-meU$*G=100VqwxUokmysa5fCIz50KD*5BVaZw%&6yc{DhXdE>$KAuZY!RsVA
z(?32hZ7U}p>eumRiLT!k01?boTBoTNmR_+Ja7C?bb-bLQZ{xoaKvw;wZmH~WOnw2%
z4KmhDsP*%O!SaHtlxg3QkE{?<md$`tiDg}zNqDR91x<pg$|I-s5TH!TSMb?eldrjL
zL+RB0CJT4w)qG|s$U<x<xzS<zwyH+M>t^78Uy~73h%6_ezo-e5pMWi{^|QNp`tH3-
zAIA0SdT}POeUrTT7VfqOG-LmK)H(*44EvyW=DX6pKq&A&RY{*}y`7!><z|Zj(Xe(5
z>$M!c_zocsAK4(RD~Wt!{>$3e<62{L{mSb!>WFFBYIZN8Z(nCoCISEpH!nH2aV?S~
z{q#&ripq2iW3J<h#=yGTFaMpGA^C=9kj?|%m`C-*t`_?Lw3t6j+Y<vVEGp_>Uk|*3
z%grxNuij_`_3H6)sk~9%Uhfm^5>b8!W&&1lg#A*?Gn+NU>y#yOt{A$C0`B4A{D<4E
z&%1B12cZ$HsUaMPo#r3d;4b!7rOU46D@T?+BfU{uJa1X(hStSrr+o7}X#)-VtZt+=
z>pf5?dU(MYWYQP};R-RtCF-)h_Jwi+`x2-;9z%UZ1S_@m-2SBnU=4dpigNuU_R_Ci
z3T=2~EKqoyT%<Kg9J$T;)qg$`TCt!*)(G9XMSsi2mh~Y+{B5IEnJNPN%Ks`#k=?DO
zV^5NeD))0}nZ+X=>PU}|&TZGQ3^|NIqSj<_>VKV|-#<V~5OH(k_4W1XUGENz`XeZZ
z(9q0Q3ukW<`00fqS$oJ<iTD)(CiO8&A~KXfv&tl68}Cj57n7Sc2h+N{iaxqiNl(aW
zpzOO0=1OHLeFewyUUir<TnVQVL^xEQ`GG@9KTH-T33D{B^kO5P#t(jyR3nhHs4SiN
zzm%*ctS#7q-RZnpjHwzVMk9D>yDohv*T%vaKGqZGM?yDHfnzfH9`MHC=s7jQs%LCY
z`aLahUh`_JmprAolvdulaJ^mKmg|~EZP%?X|EL+p2D3I`tLyod+#HR7@FA&WUbHm}
zv&tQ}qLvd^nK%CwNz@Xx4@ucIE-vI%&$ubiQT@ht^oWccDY>k3giFOR-=~<VZ_Z@m
zB71u_GQQ?`>(LiLg=sbKJ0$bp$OD4L=n5uDz}DD_16v!@M^_L-4jY>%TyXmMaj<SR
zJl9T$&-L0zx7X#p1M-LZr`}*m&neG4xY!KWTR*-X9f?{s*hX?@R<F-*5~H!Cz=a~U
z`zBb9S>-K;_w(gIMvwYX*^N-?$Dy?VA|B@};Tcz>tSiAZxMhyu=j1;5ju8M2IsfIs
z*}5aKINL2EO5%_pn8#@Kt<^een*N8)UvsDWAh48VG3&Bz6yHa$!A--QLrZIS6Fa_&
z`_j?6#uUpw#^lzZbecx#EF%)iX@0!in$^ObY`}t;vqTr5W(gf63l~N?Fxt0Ph)aJc
z+~3jtm`Xgls(53Is!8S6QY0!!`BPRc5;*oXp?HP%ON;k)SWFqQe%8^mE9!4-20^1D
zuQ9p*)Pm{-6BZt>Z}wycZN5}{SCFPD^-B%lvTGxxuTRYV@ZDj$Kti#xYJ6-gh=DIX
zAknz;N{Es+<$5<=&syg?e?00ueP=$DbXRC=T3~0oR*}7Na98vX2ze39U)!|eq#UqU
zTP8){z^eGgMewd9NA!_$HWN^Bs}$g|J7j6nWMWn$sug)as-)$G^zYxf<~Z-`^NW&q
z{g9gR_vGsHXLqI|KwUEwDhBsTWOaJ|uyM%|%fbpOB#py%<$1i*V%c5xAXO9il(}#j
zaP-cr>Xa6ZjRHEVItRzoJRE-bQzV}FL#L5@13qLJM<x~gl?NTWoDQoJPI?@arsk?(
zaS}M76l6SHI9CoGRRm+<*!A*(RQTELD?b>bS8BTEw+Axcq{dS_tbyExcF9}X14G^n
zLC<PQ6`h-_GKz<!mw27moE%{eE0uFKkYvM2=$XS-CbCtttTC~Zblrar^gWE{)22mC
zd_4Wf7Pmc`x0_d*dj{|6n{<XFL1&esWoA$`*P{Trg%iV}CYc)a0fJF{a}yKD2gLiG
zAEnHroe$2I@Z;WIoCU=r+_(83wSCFQ*b>&V<o>wYyI9{iJv4lLgolTR?cLokqz?2w
zA)Vn%(W>Tjqxrc}3bIkFO~UXZvE!qCqJh>DuNa+adDBV>m{36@?7g!K#d$@ZlhDu+
z7msueHZxGeV?lyvBzZ_-Z>)w;(rD$BNL3UB6Z#D9PEIz=0NEU>ISdF%i5fD{LwY(>
zIX5e+CA3gJvJ+|ipMF;@3Q)x4sLmxv03N}<#57v>YUKoOtsf)^&Q$9$9a}1TAG41&
zQTo6yo|zof8)kgTb^HFN4g88=_xQNO5V&O*WuYANE_4`{(lTZ95MI7Q{u7-Zk9vDA
ziC6n`b4u>Bip3tzHUaBUyQt^s7N2$7k|KYbwY(-E!Fvu83aY<Cy<YEPy_NM-HrQP-
z2U=sd=wR8o0Nx3!yk<>q>ne+Rz(MC!ou1+vyR6)xjel!KNx|E2*Hq6X?jcOCu~{^=
zo`n^q$p@eo8OhMtn{hQXLw(kHFzrN!AP85}8ADgqU>24RO#)V!U;$ZuV-wcW7xLeV
z4&Eut>4HBs*iXw6*45gYD0DpXOi{d0n>}BfZ4VaJpHLi5V$4Wk6j_;|2m=0n5T}vA
zs7EA_-FE02V6DsT1y7eMko8q*<ZggMyg(8~fCdc<3ua?u!z4uBTU2x;O){uRx>fl@
zAHjed)$*naFW?1V^uu>gx41T9ThMr2MJh$4aVDXKEUHvz&_gv60TCu7McVF<yPlpm
z2+%!R><NLIbv`ci=*CBDxye!BDxZK=FTcKBu$q2P_At?(@m5@Q@I3A>eKOLkG9-v@
zkB$Rmt720&SfL?e4{oB+B1??YG@KM*x2ql1%aO9p9t{XsI|}cX=?rDcKU==C$yecF
zS~-Sga+&_k1an*fsAv~Gi|>o&K+SnE?Z7~;I@o%5cDpR(-@ZQw6)c@ipFmqmz41%~
z!;&VoSRuQ~ViWG<*@^8dWQQvVWkrJ{lGMuk{Z{hLey38Yd0!4zqA;vIN|7y9nfzjL
zKNY#-#}vyH!JJ{C;8Evz1=;i~9XYB-iyvz+B}$LLD$D>@5K-hAmvY0kvkk@fg~YY)
zkjtcQim29HDq-ca(X_Jt9pg16(`-~S#V<F;n%$V>!#?~oCOF}23j(7{pZ<_ppi2=4
zOHgt>9IHP-Vw)vtve|$R4RtBd_BQ_goge5xF)i=z78M9^U1M0(<%);r%0R*P?{8+m
z+vEU(lE^9^jQn$D$aWJd?}V?{i}N1*Lc*h|wkkifj=l@(CNR@*@F3DkEI^5QVC|IV
zEk_y5P#XTYVgfG`0J3mt$ukOW%L2Aad49`#PtzGFa@Hm>B#x1J34)J}3xgKTYyksr
z$yU!eRa;#ka4KD)c@vas&g&|;8xDm3CWJss$~lo&Dy8A!!H~`5hShGrkDE%0vRUbn
z-EYhFhaDIYxpC;|{e2o4S-|L)kDu||b?xQ23r?R|+}t^d_`$|LN+WB<DvVsBdPcAJ
zT#>_u<Z-iVBEBonkh6M6p;|v)vWTAUIRlw?7MoB0<4k0W_!Fo|I@X}qjr=eCN~Cf8
zf32k+Sfgamx_@Abfw+`R?|y%I0wDd{93>Gwy~y~~=qhZOgIZ1LLi#`eGw@i`gB69T
zLP0|MmzS6C5^q+CfN>~55!r2YXk>sQX|Dk;k`wqvbcYzu&~s&1TCt}`yWv{qA4_Vy
zM7(~Stp_mDY1f?1x)ZrWbW+5j#G5th4W#o+#IO9DGWfMg5xrk%Kkr5nY$C0!sNejY
zNM8gYC!-jf7>Ol3LilqGbCFXxooMLPYWSs9NBR$e*SO0oeWz*YS{J7s$BpYS?&^{b
zIa25cP{m$MXDQO)C3Z+pPY4G}C@<F_W}gMRxlk2P#7$%ijb~D!TW$K9@9`$8PM7sd
z9ThVD%f2MRc--#;!qtdrc<7Zq@wx0lAmQ;~T`muMe|2&}#0Mj6<cf?f*4RuT<{Nzv
zHvyCGv4uHXZ$+cJi<chhAGA$YVmGzkIYy*7Oak7fT5kO@MpfAgOg6<d*nagxy8_j6
z!WDa<Et<no9kSKU&9fq_p^xs>%U>=k#~QV!u@XvFcGAFZU%MX23~IgJjs=Fr<<Qn-
zKUV2k^|zj%9CG=p4gexTK;YQiy{oM}R|WKEop`dz<)UHcdHoOter{ju+kh%Jw<RJY
zY%%!Y-`vz&_!w}5|6ag9%$C0#P{MiGBhbI^71u0d|AnMNvmWmg^IY%vID9YyVF2-*
z<sWnHr|9vI%-ZS>-l_K2mM8q{5ywz|5A-iRd;O+xGZbvsu%3@o7BL>pELGZkCL{I#
z#GPeQdbUqgwhoWT8wEvV{Z*No+wc^46b=KnCDQ^z18hEqe-7*?Q1V`r(FE!m`vXZK
z9l6YOE-(L{K_KA109IKq5#%CV#lEpM$5-{b9Gl1Y=S9ANw37cTRsknMp8xb=eci}k
z#`~A{lgEgG0&7^&#rZjSmp3S64Qv+4A7nEClk}em!=T+>Z*{=X?KQQ?;I~uxw7%zw
z$2yq_#i9jf1@6%oPqvzpCV&^p_TB-@;g%ZQPL##*ujf!)A^XKfOM^&BN!h)<G>*k2
zC&Q^MvN3)ge<%1l2K8rAg9Y_w@<bTDUL2XU$$JOoG4(8Or8iz__qEmyEyoV;Klyz{
zffkrKEJeA5ouS};hIC);fLw9IUO0(o0NT*s!8))K<~vQiy?a7Ip(HO)q@&HaVw>Fs
zes3DbjrM!{_%UDtgM$Ud#lN+LL8R04l}8@3ZCY(#RMs~#u|$sm;M4fieJ`%=h97@N
z=YeJc99BRHCIojGZnuASUo<DS7z+S^q~0-GpaD264-4ZJqILX98!++%5$8jXOuacO
zn2R9^yj~Hv2t|$$z(3t7pjfPvK{%a@ntewTK6=z(M)chped^oa{?iu{pyOkKD4%L0
zhi-FrcD7Tvw7HOj)fM>r_c_^s@p}giZdwsAOa$(p)%wC=Lqij*V%M-{pxMg@@B_03
zj81n@S7WOjF){8^-`MI2euCkhWz4svrT<}8f0o!7X8+(&P}2U(O8<=)nxdkuvvcfa
z`RefKcts781Du1cW5v_^*PEKqZxI2nkC)&Wr;G!3f8k58G|{I|s6IZN0m;c&R4{B(
zNpzq-K0ZP^nwgpHL(3da&Q=|a6!K^QjTfh2Q_)znTTn7yWGfTdC$N(>j-~Hc+>n18
zgCC~|(a9{t2j)7TRtsQh$*=I;GLVfJf7GhpbV=p2^BsTdQGNX<{e`y7L={hi*dnb!
zPk-PdfRiB;5FqO7>(>B9eT{of)?4i4m6VKprFN--;MxPAp`4zrMsr^s_sd@DKngXl
zy*jT`)jJGi=$+}>l>?!@T(Q-_<86m{>(B^DS2XNTWtmF&Ywho%Kwv)IDQ5v$GXGg+
zItDCT;{DG4KD>lPXd*1z!GvG*p9jEa`o@Js<}wt0oC01sj5^HQ434)7Up6+j-^c`-
zi3WXh4n4(tgA&GeDe%QTgN}PtTsVDx9H7>8Z{cdb%MNrzZ<&MOe|F=90#x#@Jj%GB
z*bgYnNQj7Tz)I=#Iy^GjR|BHTlu=yFuBNUY5E+T^dEQ0I6jtw2o)9PJ*f4Twq5qBT
zFK7`W1wxD8Iujb2qWIb)u9`<9K<by#I{yWZoT4sFgV`!Ume9;$vCmeJ5xUi3e(?ky
zx)sjn;a^nqOKz&BI+Uc3JxM}RB3R`vzo0P>lNhbmDS?r%Vy5-8#$SfcNCJl2j28$*
zv_=(aeaWoIPQtJ4Zm%fA6C>WoEoI=CNlDumo8lQK)1|bQ8%}tVl9D<4LN3Y^gq#n(
zV!FL>bGjHqt@iUmu1|jw0Q~$CHK9>akRBc$wsuTeS0LamVmH)bUlrI%)oNnVb`U6X
zIQ;mtov+qYTCe6#T!_g@33#l?W{PqTGf%D)Clm@e?XBTb^5t)zYMMcqnd^WJPmkfn
zK%@hvy~M!wSMsV{q}*<c87W_8zbnD;W851W8$;-9@?x;=IQ)T!PKulaQJ&AAKO9bF
zS1+Nl9geKHHv6?VPvS6x>2RS<)A;pJSnWL55(X3ov4*j^1QyF^s61mZG;q2ixR{vk
zfuN%<jMIKt&*&5uSAq%F(23-MYLBW8_9|WylGQ1itw5i;<Y~pMyPbbkQZ7Z?)c-ds
z{W*Qo{8nHB0s`CT^tbX#sFw2=ez=RUptxIzdI2MXzfajTfgcFEpsp*?YD^B(`(-jQ
zJ+lIQOoB5mu!_{ku15cmkeU8bn0jlF{-D0a`xWf1_8RTV)*MWMT{hI}Sz^5f6%Dl8
zCIu=|E4?rBN$P5?EgD_!mhIml{I~bgpr|pQqj0_Kd=##xTQ<Y4`q*AyvW0xoOjtEW
z++stamjHO1Io%Jcz5TNQB%bwW#>CcILIQic_j^wMBNJT71Du}RX=6)!b0rWR&)-RM
zgvZH76X?TFq74?$D19JDpN0BVth?Mfp!UJ9{&nvEW(Rs;IB0skqK1y1#K0GG3iai4
zua=N-onxXqS@Y2es-FqjzANl>GDubDD6MnSyGV2L@bLpCT>@HDA*MC3DqPVJMJ@fA
ze(K6=l&6+r&-csI+)S=`J8}d*dTRaPzWfL6{&ER9T)!z`RHdx@N9isY?4hOO0-K8j
zm=9c_-Gh~St7_^8WT>A$YH@|>4&~HPZEep0SYZ6z7ay*A^M-`0(tt`6-_wTcO^mXO
zbItRK)Y_hJLl#p*bXfT+JmDZ+vH`slZ9I-yNdM=txImvNqo+sI(zdu!*VHDU*55fx
zxhs~mbd|%6hsKBqmU<i%=fJK=c9^IlZGaHU7HnOGz^%U-p?oz^(a2~%T&`zgf|!s`
ziE}&8;(Qx|DBwj5Bb5=afSBD<aLO+cf@QdwMnJqXU3gEl?C~`-*Kqs!4@~`KYroxL
zCk3O^iIQ54o?lA-7xl|}(<wm(g;*WA&1Fi{AN$nE=!FA*0|8csrhTWTV5=my@4vi=
zRo3Z;A<*7j2;XBB)Rfu}I~!T0EANGfWlfUUZmyZ-b2RFnnay_Q2n<m3X66pD?V<oQ
zlArL-wlE+vnQcigNGdk(N!5V)i0lW_gQeU5v-zv!H4aCzjO@u0tdjnb&LKOSjv_rp
zFiDS592V35G6E_%-|^LvWQ2-+LrdfGldEd%x}|fzfJHrgoCXF+*NKVokSH@yJHP}V
zvfCaRI{GFAEktep>?C{+C^>2tyA?zXzp<e*k~CvC0(K}%rbbX0atXwQ%ZDCG*RX$a
zguhlO=K@8qcM#;#Jir>QXTEP0#8ij#U@c^+FS4@R?=pu{66ppLZJHDe(OGsHn8v?O
z%uEJ-l)U&cbJoC)fog79d7i+Dx4y@8^?m(sNd7lL@P(Nt0ESUtqdNylHCgW#o;18#
zu6FC9iJjkRdZKT4t~y}0k8$AzqPq%_6!$n7K@$OIR`|*U)#Xs?6{Y1aNlOEN6U{%Y
zMo%1&V4zSWoeD;)TE$ZEe5-{J<16<rVT;r+b<Fw{8r{o&Mh&h7A(#4>Kl{f5e!r3L
z1vJoK)2dYXIvh>@ux7bXw*br{F@&7KwKpv4$~Y@!WYY#)EEgdyyFK|g8uq8*WepjC
zLCO&wP8xsqwli&9%#GwNV+HN_{Ai7N#??ts;`kZ&e=!9l9FyMv$6PTSx}-lsKNB8U
zQHle}<tj{nYE7T?Ty+*C8l9ZZR&isW0!Z0(yzN&g^aEpR{A6buE{4WERSLafKwNEu
zv$64a_On-vB+D20I{P_RoietU5;I#={Yh;O_!W%t>+u8dny*7(pY3KC2aduPr;h&T
zODX<cry2E+qyXG+<ER&wKtD@|)#gR!stw*dY;P~%jnmN`D9U!bLq>UWqR9Sa#E1P9
ze=t-SIXWqI{*(ywfzuD%l&#O^^hl*8Lg8mt&``((WQaQgjiu_0gw>sb!aFd<d3Bri
zNX&NqwRK{(`4~JJ(H(`e=}gxem-kQ9`45GUNCbu$kj_WI<ofvR3fx69x{!h>SOLBo
z?7-7kDpCIk>M+)4Yzf=_`Vsk<MA*kL*qr`52-kJkWMW$Sik7U=N!q3ZD+>8Fzzy6D
zO{SoN9dW`sLuo^18Du2xi$F+DSDEZcw8DEF#_p7=x?*v3-IAF{wq)odG<KMB+1c26
z+6N5GgJcgK&RkjCQu^+H!qz`$L5QeFIS+p4BlY+-FK-Lkr3OHWx@_h<1JUJ+ggDm|
z7R&KNi6HIIO-GA0LXu=3u-7eoNC7mHfW(0Mr#$ual#)ecZ4F11aGJ{w@9Gp&V9i)u
zdc)0<{EVX&QYdk@XR?U*&I}h(s7(%1QIR>e-1zZ&;cB$NM*sQ2hWO?MriQWEA4Z=+
z5C}8GlniL7a|XoZdx*hMNj;5gSo_QC867>7O}rJ$zcO2*WMhV}2lx0!*QN(4yZN9x
zR}lk#7PIraJAdNlGx=z_{EoZ+Ej&;{NJk{LShvs%kEa{I2~VSJzPf?=btJoYbXN52
zOUqm>92XJiVZ>7_`L!|sk=<|bYyk#&E?*3U+kwRVU}?VI4#dUO=39?^Nu!5%Qk#fP
zZgWnlX^dw!n>}Oq#EsSMfV)J5UH|FeoezNq%Q?~N&-#1ZnIfBzndK#toDA;B8uaJ+
z8Hb*M8KF{!|D^!Ig1=dGMrLO3*ccozRX{G41Z*Yh&aLRDIx-JKl0s;c@m=fg1bMtL
z$eWDw&^uod+z(_zCsM*MvulpkGcksvC@O=%5mJYniiZ&gIOFR=oIcVA7e#9HOcO-+
z0>w`CPj|X=3kra@@_M6Q93Jt1H39SN-bL79n#Jdl62E#n?PkbLRjpapX@0~i<$5~2
zOx|B3GmBY9-CvV{CP=VN3CyfZ3iO`}!`})(n#`r@1i`HEM8o;a0zj3V)a5BtA!K>?
z#wUz*!B6%CN6h|-gm<ppJ1+g8J2+r5w3EzA$ZyEb2Yq=DK+lCjn)qogP=%a@epE#@
z-eA6npM@>6^c>E#t1!-iUW*-efiW_akAT|!yL8fDTE%~)lDoaLOBz^1s5%+ERP+Y2
zc`*@VoQG_lXPpIhg9&^2{25lpr?<Nuv#&ndvt*v|f1SM$@&5@Co<f>$2q%N<s0`DJ
zMZDOrKJX#!CUsEt<yGL)`h2p2rW?09Q<9D6hP$$p$)FvqK^=7=bz7Pi7`V+t0S4Ia
z{Jwx-E3sb!3jGi|sc)GnC@`OHz0+aa<tl=K#nprQg2$Tu(l1DzM!$q?l5nq+b6j3y
z`Iju$A93+IYw&rqnzXzl$=!Ej8XuC~(#Q)ozfdpB<9cX{r92-WT^+<>BS#yI!5JR)
zrfu+z^oP-$_9OJu{|Kie<$`d=(*#{iYFeHe(u*4DqZa-#C6g`a<zecI-5EqTPA{?*
zw>;m|i_zt3mw9#aY`0+P`gPx98dwZHo`UCz93BP_Uc~h}tw6T?E)Zm+z%G~n0S#iG
z=N8(1A*NBd_9TBmuJ3_#Z2O18Ww@aWoPD4ek{eR2c62**LPP4GH1xlc9YAje0d}^j
zm*X<ira;sZnGspf4thFBkKl+=I42v)2}yY<7lis&@N1p$vhQ5TV#ivNJ45>|*sS2h
z^T$HR0N`sfNDyJHEAZVqXN9Rei$8RV#m(A`MaM4_1!1`5nL?`*xNpT=3FwO)9%Al(
zu#(b^GY$W&Fv5;1D6W=kv1(9~h~~a5E+|2sOq2PMssoO%(pyX^FONg91w|b!m{S3w
zMDH#sm!tfX`KIIKXrD$GqSU&|&~AKnxXG6%wDXv6!kdEo*QBZO0k{!_pA}az^bNvV
zJ@zSG|4Cl|!R!x2poKA1;2GTtaw}DCa<&(I7(#jQQ~gC}kq*|I*vC>c)@N#91euWG
zLS;Z?W=%Nv0JbiV^w;NBOsO5I`#&aDRQL+?!K`$84D2R$wX$6$*hsm3#W9qnvBGv+
z7B4dYh@~-AtyX&CJj)vUDtZ%>>up1>g|b0QP+ro}l0c=M7SCCI=OCz(R19&GFgfD}
z#YI`jR+IuR6@OjA!1f;m1IRaXYyb(|mU;R4#N^~6TZhB9rM~<DReQa7LdYk13RFtr
zcAt>a+iG|v<J{rV+Ugc~!1f0Ocfo>gsBjKcbA?wDSXwG#Yi!wGh+>vP_d5lxs8Sip
zR|-8D8;xmQe)*1gNB3`E#ET5a?sC%+x-N+4itP*B9SzC}qe-;n;cJek3nit-)994n
zM53a_Yq!}+daG-wpt{oxgzop>1pJkN{l^uaFoKdJrEhQRrLbCHj%RW;BQm5Wn@|DH
zaG^eoDlMc@lKXc?U^ulk#=0StI-#(Cf(BE9C__2~&d)h=y!q{l01I5g<OP~8dAXXy
z$Tfq2wK(k#XK7dUbG~{7GU6=mJ0}GZNlu1P_BBRTsaH&|9g4$dVw7U9aNaLy*OEG1
z^H|tHh%<O)U&~%T+gsD(eQ#Y^vH-b1<>(cVhNV+aH`(Y}BSjvLH=Y`4B+0#Lr41q4
z^P>{V)sJgsGYce1!ocHf$L5|1_;#}+e_x`XQqWQ{gA*=a@OA$rTwksVn0%;5Zbi&k
z@!c_8B>BO3O>|lvgWPJ#*D>{<T&@QIpUE#TkL>C(#@hpo0^z;%xqbS{<ukJ3u$LxB
zvGmra;ViWYA0%VgOAZIm`%injVhQIT&6Ovz=DRymU2vCM-d*k)wv!-5d`Ddr$*IcR
z9Y5JOr*J7d<7_;t7dpLlh$b;E!O@aOB4mCnBcf)@*>6+A4wVd?!wMxOeU(+VB#An}
zI_wn$)>a<w$I^T1BJ_m7qR4h*lI7I%y_N5Y-6oBWio$R9!j=?RDY8W;YEKpvYrHQF
z6fnZ0I-k0$x7&Sm0`4ll^aj6Ve||E4@)%pX8i@OmhYJj-Fxulopsbf4%Rm465T=@G
zdydW~o|xsm#VGfSStv^!txw0l2MQ+Q2N;gfjFE*3Z;@-(?+n&IW|HFDg|^%P^WM~)
za1h2K(ERo~8~B6BV_BT#WYNOf0Dhlr9i*Af>&{+Z;^-l?pnrBhEiwfWl+;ALUD;hG
zk`wW;=|O(0J!tea%$`~QH9~e9eHyf_>$!Q9t&Q_(6WCYP*W#APQeQQ=?QM|-;#Rg!
z8+%YnO*JmILxMsp$|^jCgZpd*oDl{E)&n32c^}zfsf&(T^V`0pIreH-#EBaBP_LKO
zHO;cJKBr|S!z83E56pD-=~ExUC*n3Y)PR~+*s3azjZ5^~-SlA7N-2}S$77T0d?Ync
zcCr-u%6I!y8QF;yg#ddMCKwT#si5>$>p#9<uLiLB>`4Bd(xm5Z$fN&C{s4)RRXZUx
zG*qib9|>268fV#w$>W!w=Bo<-av!rhhr^Nz53%J8N7)*JX10Z5C5PzS4NgnL8KhNK
z!odR7TB=Cr%k)F5O-@$2+=?RS7Lpk%*bEa2Fe1)yoIvC+tS+r^5ut$LR7y*ec?A59
zXTjUK%U=Cl0sn(Fq`#wR=!#qyO;2{HaVwe!kP@@VN7xJhRDTyggEbG4Adsih_FXr$
zyU&cwjb*j443V4&3K?;uR!$$LHKc1jKTYW3llC5J-4P!zShsLav_|?NL!Yvt9G8=<
zMLk>n;%WhOd75`BxOppm51jf}E#Y5=A<qlUa#JueB5P@%nhfOLpa7?Ef>z8)&}kSr
zFfa1O<D3r?JbRrlWO`>eVZv_ewtJxR83E>;`=(^Ml#`Mz>Grs1IL|_tt%WdRXp?7w
zEkdV62eS&q@+oV}0bAR}xe{A2w!fxaav8bs(-1xJNK`#xQ`sj2I!!?wQ?5znd2#9z
zhWl;3N1$So(McaFaa#hmVoZCA-^psLC)r_7+d>bz;wLYMu4jEajPW|sgof1l1ST^r
z<Wu572U5fe7-^NwD`h8Eg(U2V&wN}yd=;si#+a(=C$^oZE7YeJyn0C*ur(aYmXAq|
z@Wk<T$%gTdgb7ytPWX<Lr{WW|NAFLIi^;#c!lP$m4lb~_<vX|`MtxuSm9mEm@N1({
z9$In#WYB~gFuWGP!y9qreJlANR`ojwqyQAjX2RlgI{E^mw17B0hlexuig|?siEPiv
zEYxp2Es%LCUc}iOv2wpCw-8fbFkGEs#E6T9p;=~5yU_B&O&?>a%GUiep2}~U5)2RL
z{eMtJHTd?-F!Xiifqm0>ZbkMeQP7dhKsJw4NFW9!*P9QgGSf5PKFH<|N#)B^`vN%f
z_R)mKu*&)c-)Uh<%*6&<fv2@^sMMs85|2pP<)-oNlMECu=wcMY&P&r45g(6$7S8q9
zX^h*g|8mjuY_gFMrdZyv5hO1-MYs@Io4k*4<V(25Px8+%LHs?#smMN-%vu{y`N-{Q
zd^exM1X}$UYOAw)>?bI;u^w2~Ia)C$e_kWDG!sG}F5Ztimo{9QU4q@$tOMnLoN|mR
z|H`TUx6SteyR5lfE&vV=sY>}|%i;)6jTgvQ*jFE19|@3>mps9n6*_*r--AByj@M{a
z<!#8cgX8PIVdFGiKwu?%(P3GNPv>?p{y(n1F|f|A>AJDexM5?Pjh!?$+Sqm)+qP}9
zv2DAtZ9Cu9`+o7f-_Il`=Op{uGka#uT5FR;JGi+)B&(}|25`sd<eBW2%r*@YCvzEP
za-@6SvFwtqp{+bjmj!UE44Dr$yI@w^+Cd?qag^$j)b5gQ1kzQ}ck^<FNuo}l1hx4N
z9de92Zg2_pJ*mVQ%sU_AhOipMvLm?+#<N~mHa8rRS6gjDuGwZ7thW!sRHfsrcm^5u
zYDH`7g~CX?wSCa5Ewg^YIS{1~9S>|RahfU{(q1oYL%6QZ;bx;*iWdw17wG=~x@y-D
z_T;#3l&`k^pwwh3sru>+x6nD3N27oTf~h8e)Iiq+A_6w~4^Ao}H@l`n2??vqh{$>o
zGa|5DY!jJNX4g>H#AuZcRn`2biXEwBSkLi}Cn%>bd3@>5x{&!A+%(o@6QVzEDXU8_
zU}bzVl-S5GFn-`9Fcj8*Kgm~hq#=NyM#<3laW7|fzFZmvT{I%yM9GJLJ$4{io&$#Q
z>#qMQHrM^>DU>b0uNS@kzp&o_`zUo*!PTl6&tIzQTv0Sgh_C#(rH7dG=|WW(6W98w
zJ*bByVyq=`RPHq6!SP~(8|%!t_g!32TRK}|DYmR<{<QP!ieM&<C(u=0CJ4sZp;r3Y
zhtUzCeK*tacCn~4e7IOc)l5-WqjWTV*6G~UGHuF^kffwWMNN4?bU7^6A8%U$8rp*#
zaC_LA|39()Q)J7D0N8j6lOb%mMzex47q8JKIL+}l9V|tBG~K(R(o_<)U9yo_2*vAl
zX1-3UmK@;$WyZn6ZshAR%&CVP%|puB&&8`8F7--AdWeVLh)HP*?-$=+)OW{o7$`)D
zCo^9i)RW`4uSOayHLyV<;@q#I6=rwCpePGrDZc+^8w2R9K!fMM)Hj1GuzZ;G0wmoo
zXP9K~_&yDuttIF0S0n$COtN`EXN>P#O3Cx$dyV=-(KpY}5qAb6X4hex$lJeePI1VM
z?Hm^d9Bwh8F;$8L%i%9qj^TRz2*YJi`W6C?U5cT6`PEv=GnHn`+R%d}S8P1u%!@yc
zcc;6<_LJ*jzQEO*1`S>$p_Cd%Yq|X6XHo>V{%E=+3{8<Ei^0N*uR8+}V}r~DH(U8#
zKyf6TKn-iCzyejpFV0a9hBA2yDhXx0H4a3WN%7*;&zdh}NRg=ea-<X}u@sXC0Rb_{
z!oEs7R>YeVA(lijHBMEw^HlbgEDYyz_-Uhz#@Qi3rycP;lP`bK5uZ}z>e|>hd|HZl
z<?gbP`qjk$MA!J4K?6i;JKM`?2s{ht%f-A!!Z3V_ifD3$+}h1JaXKnRp_}xGbSJHd
zMTX6&eoAi(-_%rv)QB9SSfwNbR`nw?!6SB1dI2P*nZnwL>$KUUIFeh32a4V(=#pfl
z_sXkD&kg;3ZM!M<_lu1TRpXk|eX9eAKV+Yf$7=MH)Wi51V5nIvd#Y)i4nGpgmla1t
zF1kaW6n%urQPh{Y?_dmc3n+gekqQ)Ye=`88BUs&o-G^F|Zj3wJ9QlLGS|NU>M93m~
zz1gDz?Y<`?Vk79NtiMIY>vY7nS{_|*HbmkX8Fj0uZ8@&hwy#}>JboI0w%DW`*ganA
z0<l#p+BNVaF^;A)o5kU`8IO(mf5w|nDN6MFee63%+3{WJa!_EPZvp9kwg_`~8;;$F
zDJO^d0!=cPQ)TJNqZ-~<x%i}rghah=4Et)iLpkN}HobH7UEhi_Rb@IwGs!K<Z!qj~
zj|}MZ2_ySq@@D0FK_elG!?s*VfSFCmHmQ<X8wVfM$}<cSUcY^UC8qu(mdoZ6hl|Pl
zZ&7S^q=UQjo{#PW=0)!mSR~>Syng|(Il{{`Yd77SO1P=YdL${YS~K*=xudL=|AXOE
zpnk2{4`BDggz9wp_-yiJGiQ~*mj^YxDi$2)zIqxtH%ChpJ?@wtX2#@M1yRNs&%@M;
zWNwN5dbSA+#rc#ct;CThL?IR1<*k@2l1zW;$BIu{9Oh~pDuidmPtzF)?SIC_(WsZ#
zHfSqOD9pQq|F;|E2iQij5+CQlGS1$cNPG{fU;Fkj2n?{Fz>9w<IY<dVAw0tWEu8tK
zL8aT%MMnL1;fGp(X74MnhX0?9stCHMZxCRWj%(T7t(BN5G~0nz6&4=uzqF)gEB?J&
zz19FGoPbZOhSnMwA7m4Q`baP5>e!2lwc9rWVSt6|^VOl7m7N&^)~>_7o~1FFk#V#B
zKXAlsG8l~(6#77O)H$`X-oT)s-t=$w!dU<etQ=&v)>5wmwKD-6D00%?f;qs<AO|{*
z@%KMTuvEyK3bhV4zF#_v+bNGz^Q!*;;PVN{6kV^Z2YCis3}-(~Gk5A^b%7*VQqGtK
z@Ui&az{_bYyME`;Yecmcx63q>1N$#Lk$=MqMDMIft~!Pa1B(`3i{n2U3kPv;-mla&
zG>~v`%!kv{s>Z}MI(f`>zyP&4o!{FD`k<x+7q#*4dLn?fbH0GNEKd<2xglvQ?7&+6
zH?!{_G(H=~=ge&~Y_z5EA;7gkCDkEk0T^XSJ2<f9=jRtY60++7T(D<w(9~$1UKfi}
zSpdcZ=78^NSTj`xpK2^GzESXR1^yp^g})ViLZb<$=BgxjmT}9ne#Iqa9RLUa_R4%-
zo+)H)qd);y3H|8W;NP^1^Qhyfsw!mD39Q!KSD&;id4{*&azjIv8AyBsh?dkE_RPPp
zb$0G&S)1(eL;qtZIA-z7%QMnwJ1NoB>8Ft)Pu1ltVB(>nfv>Nx=W3I7i=GhM1_5uX
zB;M5n@Oz!Xd*;<rBsBvfo=AXYbd}y@avi1B;Q2W=J<;G<F*e^nj7SD=O+T>SaDdyl
zT8Xz+tb#G=_a8fhe-M1Zk_TeAL_L@Dz&_6P(4Y=5g6wv?XeWO*>J}vrZdN4A<^_ov
z+*k2`#<Y<H9^q{y|5(Q8<;ioD&g;}c_uO2$$^pBTni~)#{%)kC)t8eQHtbo{)APp&
zTiyS2C;@W4&DR38rP`Nrwb4i2v#v6Eu#BoO2%HS!eUN1SesBX93xI}|jFM#t`YidC
z@D9Uup$&l;iW^ay+b|*3%)TK}tzz>mMVE+$ijox0^U(te4RfPxobqbvKei-;326N9
z{UXxVKI|WmO}+Wk8D<7NG)r^PM)>|P@v>cmdEZEi1_iV{Wu7AbiA>k;UumgfFv^|5
zAn&ojd^#*|jUqeN=`Lp!J^I~=@^<<NuxOSK$IrGx{x|VJ3V)>|#Ou(i6LF?(<(T(t
zH1_vNQ6Cql+z(9$1q17zpI5#@{wGlNL5+;|r{<WUZ<f;iHjUOCxUro8q`|uZ+Tg&j
z3m}BUYOVwbreSFAttG~<`th-Q!jh3)3sJFKSmJKRcus=t)y@PU9R9&oV7}g5+zZ;e
zeM-9=pZuw_j0)DhAj-aTq=&Fd{vQEk7T1+<0&}@mwepp{>eK15dUqRpAlM%KT!C~3
zCpxFY;iuUmS*W-dlNlXStP3qAC6cpiYT)--g>?p}(W7JHKmiVJS<Yt{tiR`n(AUnd
zNF7@DL@JOb2p+BQs>f86toSGjdI^yw%YU3KP^G>+7b06IXDlw%B&5moZhIkyool3@
zZaq=H<&-quQ)8Q$cdR1)=iit1X_!Q*YinbiTv)3M^3F0qZD+Ah<UsM}=EkqOnnA72
znUTU}>CoK(|8E>8fKx<`Ykzo@T;mcL08!rwjfRdHn$D_)FHL}AZc>PlffG_SV&p-i
z=VT~dXXmNm%w=OGhqO<>4n}GE=kluYM3;Y3g@LG?XG!gMV}#0Ad-DI;Ec_XSHq><J
ziIu$2i&kX7h{yR`Z+cRYub5B}wl*;w8*5}blmRFb>ZRRH5OC{gHZq*s&%q#^OF+B<
ze(U=wfQwd(9m>M;q<eE6^;S>jSSr`+fj?W;f8V1M!D?N`@9brwHwSf^p_<(l+7U?*
zQ`_9JWsB{9KK>JG@o#WFtD-KiR-(<_KPO-N2@#GKQ8KeuQOjw}#W+hc<WEj%_X8L~
z#-ZiD=m6@Nzs!NNAGg!xs2zV(Mh42)#ifD|4-k=u>#gZ-dY#BriP*VA2R7x4)uI~a
z*T*a8M<+?}*Y<n=;C`*vJrav0PwZuI7onHU!l^cOViUPet$D5k>i=jYbacQaB+i9s
zTxT`HI}iqCv;&qNS)O21ojJS1$z6qP;AEd_mY3vEEdGu;!JrWRZFdHa9Ow?J@O^;7
zBbd>(9tW}FO)`#krdyI-rso{>BlIRGV-PGL%tUX|THBvC=mRB52KN<~W4V=IU`tc2
z^}x8v?u4e)h;;MpGc-Vn2=%}eL&D;-DI^mbu6pw5<u1RELpV!)2(0YZz1{)fN-E;1
zu~r1(otIdMv=Q+u7c#kjdTV5qS*vdSJnf#5PZA#<3lsh<So5o^@B>KZNWjei-PmYW
zY^NMZE>3VF3VIS!Qv1P-%jXDq-NVy}<rOsEBmV!McK<F#*Az_jqLin==l3(kPe5X{
zA!h`;^U*6Xlz*J{-#W`t#q?reu1JxPlR%~Top+0Q0Fdsw*48u+d?NssEwW*Lb3D2Q
zV%8cFA0Oc<X^DD*_V4SNy*FUz2A?$IsY5~$vkkx0RxN%CNPEf6Fc#u_vXy4fwHD$3
zWyRUV<z~JNp>3QG4w_aM;AhOX@OXT5Fg{tv+VqXJ@~Xy#{|@?+M<FVX?q^2iGL&%@
zuK#eJ)||RBx#mQt#YQ9|+vV<KC4;S!7>D~c=jk^)hzZS>2(K<Q0a2sOM=Cdji~pb>
zWYeM846d?dEVKB$^MK|Abh=g0+XD2y%_GX2Q+X5%Gc%)I;QDfTxTeouFmxN-2;ZE3
zcOj0Z#RB8X-T?E#z6R}`h0Wb;7g9LvBGuN<xmB)gcm3virR8=|E-P&;S2zspzr9W1
zg-U{UxE7sIEgx}EixEI~j}pSx)xZ3q?7=A~+mB97`83+#N$ZILWPg}#Wdgqo`T3Ni
zZP@En7G~C<4HXYW*+>_>xW|Qv4|)pxR_n%3SB^;3B3kV+;oqzj2=8SAkuAl$C|`!-
z=pI!Tj16w_hD2nuMG?-r$3+?oSdL~JgC(8%;(t80&NsgTR^Ri(_KkhdsZSh!85LHj
zvc?A(J@d&*j9Ox^`c0Ks$|^jLTKDXR{EC>bTr+}2lA|NE-sX%<s&6elS3jg+^9^@>
zf$Qj;*<;@_DkXz4t4Ox&2Y5_EvocRwNUG=-1w692aln-J7bjO>a8Jt}I5p_r`H($`
zMZ%{$>M@g#eFl9RFx;=~xJ5<Le2UV*FyN*vIT!-g(<3C16_L#L5$`M<-8Sm_i`zV{
z`U?c~B-rK}8$q?{i>^~m&mQ+qD7Up(?``_}I#WM77+6_BaBlG%`afP)HBNn=;Y^m1
zS2YZO_%D!Yj7I`$$nF`1`w#mHXf~D)MA{d)?n3b1SRy(CZ+t?b{#rUMF2q=NDRK*;
z#B_WpsHvMx8438gM*F~h-m@GbIc?j>jx&Hr5Ieiw)o3djEZyXLW+e!yJ58qRc#>0x
zR+A~@cL&}&dn@{=kt&&e+Q}F7_}+v~(CYK}^w7>$6MFfzQ@)k-=od<!2yFhDQeF4&
zDWh<p-j_iG%50&71+cvXpqN%l__Ws>9UvmY4~z~<U0o7Zvcgxv0HYD~#ftT(yi4q4
zwsTaeVnfBfjz`cn<W0AHoXXVuWwPv6XqPwpv&GBXCibhSUC7j51xbrBE7sXrX^%6F
zFcZ#Bq#7NW;2xYWJ;767Gi0Lh`^ejx1jDb!K3aszx<ongstUR2={lf<3Te=KW$^!C
zfO=>;at4UIi)Y@v(J>ATRw2zEsj>d~);x#gWfy~GH*)xEbE8kas5h%M{S(1QH55Uj
zbati9>u%6l^??mbo#__Hq|9NyqUYSxEfU-2jUZh(KCZ8B4y^-kCLI*k^-`3adlmQq
z5(37n!?%U{pCt@0qi1@-4_dgs^AL{IGRJnbhA*C;_jYK4irHT5d|1nkE`Mf!tkL&X
zrwvzCqImEI!C0j2d^84Hz$M{(*Z-UpWG29LK1<Q!)E+sdZ|tuBX-bsu_FDamlR!2L
zvY55I(Bp>plAf0Y01}U9@SAn)_pd#>gLsE6R@yK%B6yJaDpP5>tx0SEy@g+KT9M97
zv}!*giaQ1Q_`0Hb0a-Hq4BAKXuULYUHBbK~vY3Eys%wBWAPUWpWR;F$pB-Hcl41Dd
z#s-i<8VEG$E~2gh!O3mkWuwo#Nl|U3_8TkQcAWLlN_tZh+`N_Hw3ufsd$Kn+I0a28
zcZZo^wP~d9evJLkuGLi(K%j@QiG&cwYPOn}YSHshOlDffj<H9U$8G3U`GlQ`{Q|kP
ze7LY8)UIwz4V=IKCTc*#v+Gh|UKYaW&<?5mCZ;7VNJxs_-tIvDBP*;0tZ|!J3Bej|
z(BPcBzFLWE<$0>7F%RqMxWYa<Aucdi%7+`bG(p?gLABNoeWeps55Z-Do6`ov0S=$0
zl5l$8Rby9(`QgrjG8U^$;*qO%l6mS<ATu%$;D3#IoA%`8SdiON^qg`~y*SW*BFH93
za6xEWP0fkb1ULWn0se4~9>&cPtA^@-k`3_I*4YhTc0I_l5kao2n{n+$GYaRegmi<^
ztY+cM6q~=f*&?Qyq0W0kxkuGaD&g?lU$9^-L*Dv!E_j7)2|g_!#{R{7{^@MGz|E4q
z(Gu&7Rz#YRGm3vt4-;R6X(I-|mvoT?>|(VbAob6YM&1dZw>BTXiRDJnh4-aSdaXxI
zppX)|n||6)W`z8wu~buEs)!95k0q7t+SuqEz;b{;M#5y&MsO)e7oEfwLo=iZLQofj
z50aRaK-rS6lYIjF@%YP|KdZs!bz6ooGd+SAx+AloavE*q>UAmVDu^G$56kBOy~21!
zmw%C@U=31iEMm6kO}u~h`b=_Bc8JFi($NJ?1Di!KrV#r551Tgk=DJJ^<f4@}@>vP)
zO<eCrw*+<rmhU{s`cDq|btG#5+d;`Tm?wcQG*|^0>CTtT+g)No3_y_(#kXF(YR9t&
zNOz9O0&eg;b&ZbkGH_8%p%bGx*MTa~O24AU#%aCV(7%65lDfh#<pk(Ui^rd_rVmVq
z{=~wJvcEy2ijDQTn-qLx;D;?i*oLrE<8A)xsppL8YMKeK`yUB`tN7+Prr_3mvpFFz
zBP#FDI;3^y2KGAGDXU_X5Y{Z3RVewzxZxB$Ezd#%7Sr;Vbo!Qov!iop?RG9$ttXR;
zArX<>ajw~Cv-#P=a<!ZOl{|)^?9*@Bizj7g@4dafgfukpfX@LuARbkkXmvbUU}fvv
zG}5fmD6Yr400@>gkV0ug;x?us_-w;puJp1x<R52V_@o2B@$u31VRMQ$8={Sm4@=T5
zP~cY`H*7a;R5=TUOX@`!#G@tlkuV`0kOAncr9`xauGJDuz6qX1y`=ZZlA;>gpZO(w
z&a^RrBr3AOi(kOls%oP_B`pgRO-cD^eZs4N-C27h5#ds_46d|Bj57AV^a$hJ#NtB%
ze~@n}Qg+&=_jA1xALP2cuF=-ltMMH){z16*<Ngh-!lPBFT6+?<(<uA{9=mmZHHc*9
z75<481Qqvq`JCk7&=vYT>u<Z8jSl)EyW02R<&YMsyHPW9i}WL<4&PC5xTw?J7>&iQ
zEJ_CK!QUiLS{6rHZ#;XwU;@(BAGl^o9N5s@mf`B<ly1xtd?++-g^>5(%VA&+3Av3b
z2Q|U7>FXMN+WU$kRgn5{IWaczKySa6nJD3FOqbJIqC2s!1MZqJ+FaG6;Ajc)B3MrD
za=9eE2I|eV;cs;r>G<@r$x<&CQrT4CGfb%6Fw_atZW$xJaf=uMaL@Wfv2-+&DBSYr
z+5jy_s(ek@xnbP%+E|{I7NNI*BBwF;Nq<O1<N$r;`qv#yaf?{I&D%IRM#zZk?hz)n
zY(5>%Boy_fvO~x7?`?b%(D?HAkgeakTcwS<JLd%qdR=I?q1^P8IXudQ2D6AD8)S4u
zN0;Zsi&qc%wBdNUX-G-iakZPhP%w69$Lc=R?~K|>5mcRroJW_2<=g`U;8aA&s7ZAA
ziL|t1RAwp__AtYLl09>>e|Q|u_UH91ca@GCZ*C5!sp&v$K80us3z}I@UOmhg>8yaL
zcPCc!3OqKNR`7C~xw+)>eXpBtD3aF1G|x{X3}IWot<$X$&82ozzOI(%Rc3ZWdsbQ~
z_C@=$mzJ~JYp}a4>jFmcg_`uCz@Sg*>HG8;n#K%zl&WJ|8yt!G<|eG}8kw&U4>`w|
zW*iFKP>qeFS<BkfHu&H^WGV^4wu?E=BPKxArc4&?13J>SQK)A{7M|BH*G-zn3ucY9
z)^8g7=?7B4AQA=-Bp_Is`b@w;2_Gu4sz`xIx`qfCL(FheaaGMFJC#cF&+`y{_U3*C
znt8?D8SL2)hyvUH{+YM4EFKS(!YqpJAkdzlM{&tX>+GX?WUCsdu+JP<VCu|!9VoMx
z56GjK@4Gj`G1Xqz#5bb5KQBPHQ{SjZ><!biGBXE6f0eEISbT<FvOO$)O>batIFA~r
z7Dy>FX;sl$KF@q%wgI*L$%a9lJwhL!C#d>e{d@V-C$9#$YKf?d2vYDzHWnMZPfFcZ
zr&A4jc)NzbFE8?bJk$}^1bPMzi<i3`9d%&M_#MmPu>emXu_&S@n01C}flK?-Cq}66
z!U9S^1yC&OwoH5VB82O2mH#2?2gb+8&-`Ys7E!i6JxNFub*ytj|1M{0a;<l?Aev~9
zEF9zH>5Rtv^rkK@71oc7lhj=#Z%PrwR<zt9LXhneEkCo<*g-&jy-1S3-t!>^+tu8`
zb$i6{<Nb(IxyE&;Rcsf%r0yH$`KU9r9B*Ow8W{-b+ywm)dX86%YZR)os#F_~^#IkQ
z-og)gTWJ*T63_`G>J8uSHF5!)-&RO#-Xjxy4gz=_HkcP;mTE2!!NPkn$wCGH&CxDY
z`STP+w+S{+#Q!u~81aIZYpvn!SJa?VM&F^v3WD-wJ(W$)I5&c-hAg{ei*K$Z_dAjX
zK|7li-7<}qtsr^sIGg)a9uzMViaD>lVR7lvT!=mwqL$CggCl059nvWK#avFc%1?G5
zVQ*7KgFWv_{Xce^!ECW=ahWcv!K_(1$SZS_PV*LKu?2J@IQl5&`EG@@(*sL=*dbYL
z!Z;Y_B&j1+0BmSu!!VYmomwW+Tw-<af8re0aXoRQ=qYmdi$=wcXc8MXYos4)*qvr{
z4UNEJ7@-|xKb$a6_HDR0-pNIDCpv}qa!KBTJR|P8ri*E?O6pk!T5OKoWqOKW*OI~A
z{CaA!uOPk(P;%P`93bF*MZ&T3d9YlSNUt)X%LM`WZB)>5ly0R)qJT3I1$`V{#QM$c
zdSW=r0^L9xE1-MM0Sasi!I8EBD^d-Rku{}tm!s#FXV<5F(?{bIc79!RR!hT+&!o~t
zxMJ}y{yllIGdq3p`EE+<PpO%WH4$P23}b*D0f&p#htPV~z<{9Y$$Wx|zLZ{sgLOI0
zxFgl_RMB;3!e?_D+p!jd1+_iH+f6pT?{18PgR&pEiy<aLdgD%B_<{PLYxK%Ph`AO>
z!x{8+swaej%q^Xr^$T@m;eLE7z(hYBct?UV>Se4lHR7wXNRz+&SpFXSUvN`z5S;IG
zv=@nvsVU5FqjBG6`vWTN94I#y=~5G+E$oJcU#x7zD0;=Wj2<(zFr1-&k~g_jv<i+?
z{Wopn;4FmIxIC>2mjdpbWTX|}xlro~JT*UJh6qJ2EJxt(j>hIMsY5xGIx_E-GpdHa
zEi9;YmS=$d#Vsl+3=oc=`C_b#+4fO9PH4yi-?4r?)&(W|n_zkS{#x8*c;c}eIMyqj
zSRBxZupN8#<$kp6)xg5!6go&)509a*NWs_Pd(!1P<s*aJ`+~Y4v6Id=K(Rp4VND^t
zyGG9@D4Z|#=;7)v27N{c$D?SWnqY}yKH|DC$66yAGbrnY=gs<aB2>tu<*~;em6Our
zvUsVXbR|~J{?<p0*~Ni8`Bl8A^p`&J*`hTc6yIyJ_E^1RHdh;OJ*KA`^-HyK90Zo1
zTHerJl3|dr3=Zc)Szgq@x4$Q({BBBYB5@VI$c2z&so0lR;6?OwghE<8BMSq$Gsp5Y
z3luYPmT_QkrpyMA#7jek6B{Ysw#eD9QmU8T+*3uG74*sY{GEV-#x2E*`1!m_TpZD4
zruKrTT%1rTZdgz5kXt}_+x2rD0Sv%c>NoJ(bGt7&6^DcRE|vEbEiTnLHM*Wxdr;3n
z;?xa(8|n=Nls<5z;7A~Sx$tQIPMsT36T*rj1jOS2$$~g;J?S!5+TV>)`On5sxc`AZ
z9oUa;_^Yny?{~&~PY<Et*h-r(<$?NN2|2q>I^`Q>&!|+tX$AoieIp>Z;3O!j1&P#N
z0{LswvX#;<U!Ef;&2{@Y3srXJmX8GQj5r{c&6x{y86y{%mcYkSEr^rUQ!ZoWsS(?j
zSDNUT>qYd*D*pY{knHQSe_uI<_CSSdsa7tZU(h!08^MIM{*RzjN&G898Iwo71DS&v
zda0_QbU@sGoKzPyv<cC2wOZbDgghRQM}Rjf{`+qOi6k;Llx=`+LHxCp3U~o=jN;pm
zn7{w1nNg_N=)WIud)bhyqkj*QI%lvqk}y?ou6j6A5atm4udjm*IjN{Wn0)QoNcksJ
zKkWz}dOI2UbxJ0QA+w=haAh+HN8ccP-&%8nB9!Zs1PLVp&66*6jq%p<+08XQ>_;xF
z>@oJ85NSt6xy9&s3cqrDZM9S@D_K%vY>pybX7DJ~?v8}LiLc?V^4_t66Ypvy%p41d
zq9W?ydN-!t&MYAr9Rg7m8HkQiN8-2=Ifh|P;VYMcl@%mUjl**RH4HyeM-lyiU!EVr
zqYGDp*XK;#nnE<$piMGBH2aB8Q`$eRarWw?oBMET<oD{vWP$2PgIalvtx05v58i3T
zR-gLo3Nb5G<v_k*Qo}lb$lxe5hPlLWo%LBn&Ws3h2;V5<)tBgSc&<9D@@tPFJ!#6u
z>xN=9_ozruo84Q4p`jKyvB_0m??Spw9b<_9s?1|(yGAE({RG<mMotDyqPUjSg%<Cn
zx4N#(fd&vsEIKQonUbbQ_)MgqbZV*hbBD7V8V7r^ab36)?du=otbmn9YoQ{UWK4vQ
z%_MR>I!a2P+*~5%#Y;wD2Zkqi&5Ubz?Iq7LJOp@A71&%YGpaQ`<GHjFu95df<3|lY
zxcJ2uV)T~NL;1B=5HBs7e-#r%za)cq{Y-Imi(U?{ykNxr{0%@tgL_FHEqL1C?f>is
z8%%j{@q!AWa{vz*YP7+fwu;Cw5dB)PH9Y7tGpcu)hp)E)hkS4CV12x&x=|^a-Gfx6
zgE}Ls4aAxOgoivkvIyAT$7_A1&VRRIY6)2;8_fdun1ZG(aGK#8iHT9&{H^9#8?Pf1
z@9M4`?7eX)#%k3R@fr7aLNnQBz5rVl1*!A-=}ACM4U0yr4Qq^mcU<hBemfP_#AiOg
z!^QA7h4u6G;#R7Y0l2CHT{=LqCip?A3_Us`jXGb9CM!X@B&)GXDx3riJhEkjrfnWi
zy#RwCg={m&_LYcF*LJz3D!cMG6tMjGbkdsu$u^ohUsSi&;5qiRD<z^DRD_6)Os5z;
zKX!w~s}#T9^#r0OzDDRrm@0-jIAnc?eDg7qHbN3PkyhKbe^aH!9R-H@$l%jze&#lb
za@4Y$Qlei)?%(uQZ1kP9bGX=b?r9X}@@evgpcKC!2)JJk@e-bK70d3B_gPJp4Ov-B
z5OCzl!4g)t%u*N&<j`8KEmaaoxYOR9FrW&<7pe!90gruB80Mvq9nlh=o!8Sp#7Bn=
zCsU~|%aptK@l|^Mc(~Wwj21<Q#lDbko}VJ%`8^8^0$|o{m>*T)YlCN{nk(OHezV9d
zBD!AF7cUsT@4rgxXWGzZB4wFCXpyrG+A;QP?QG)X8!RZ0-rCUhaU|i)BgBZI+H>`e
zTkDWYQw>6Qs5mZ6S34QCO#(>gpd9dvP`UwhUC@Ke*x9a+OUKFx<UQhNH!aOo`#~S}
z;ruU-KGF^T##b7`$6M$xRL_^afchz$4wXW-?r1#+X6(rdv!(XHPm_oG@wVdg;e?ip
zv$3X;@}K2@a$QOISMQd;c@q71xj3+03iW<Ds3e#O5%SV3C{4&H!--7q%P5cq36%IM
zbu)giOZhm#cfJYm!G%-?q3&0#CtH&HvwiXIg5Hn)2SAnbDG0!tj|X)of@^YS3wjee
z6oP$rw>K(XF6>s~s(-s4AlblEcZ{W9lESg=#crbpif_hkWc5Pb>sEi<LW)ny1Re~I
z1t7e5`Qg~c{MFn|f%H$|x<_kwSn>*M@qq-0JZ%ON9VNd{Qir79+KcCQ^`8v-T$fHw
zQoC4-i!N65WaZtcMhRMJkv+1QAw~ss%9|(T=evCArQXX6k!}O^nEoBuhs{LAyxt+A
zy=5p=Fi0w!dYH`Y97Rq6V>ZwgylBz}t`x$C<0O`|sLmM1s_gzVo_smFi$4d=;OvJ>
zcTg2PgyiUt7yH`KveG~M2_Znx6+7_(zY-N;26uyT9&kI>$`9ISOwk9acaGB#1XGM+
zS&Z%mM5aUrajc0w<1^yz`HWPCWK#qv2#O_zF+$oiczmssbP5v$#g&cp62h%bOds}j
zU``uC{Lk(Q(R;b3i(6OmajB_iB@{(#m>SU&Jo_Liek5p;g8m*r7ZOHNxBFD9vzHbP
zDB|v_Us*z^ckgO#=2vXaM|9o0F2M3$c*up*01<~MQUtXg1e(kZAm`oE=_7-NISkR8
zfFsHm{ekbY|JtF8pB}!7u;$yVLlU?UEq*yTAX`B8S_%RBAQ4K4&tsThRW~L)O$}pW
z07xVI%Wf-j6!mLTd`OolC#46o-}yU@`CjZ(U!5xE614$GKeDeOZ0!s_bYH?)Q#UNX
z*TKNVzIEhW0zq6l5GR~A?Y9yfM!|hdE>-va1M|0<B5NecvQ*lPq=xX8e3e&2Kz}OL
zSCVNXpoO}o22PN?DHFfHl{$;yAf_ol{}FKvI<<;-Yb#ecPSG-gw%_|`yFa%H3EUYs
zK4_|cu%>JEE0R4U0Dke?xpH$XIt2+OXKl$`OWT-EK|kwEK-GeyX(49*A!!&TV;QF(
z^BaeH_fK=m?emj7Pyy@SD621yuRRktotb+pTF||JQaeQ9hGske&?Eu1JX(Z_%-ldk
zTbRzX<dDM>VA_w%#zjJF5YdGm_gKy=64YjFxRuUeQ}_w=yDcRAAr{7ZcFXihW5`G^
zf9(kY*pS3O1ps2F-DoA8jk$fbSPf`BxVpu{viyNNOuA?D)`Kh`v6I|2{a3`-%}6R0
zW^`+lA1TnhB7=DWDUk$jo;!6sc#@})=G8%b#WQ&Abez$;b%Be~k0-~#gDHI~C<qRw
zpXOWz0u~hpFW(NYgxO3F%^yqh+AkZP0g;inClW8GNg}tD%#j`-igFD1CRv`UmC+8~
zV<<LT)&5@Raxp56{P_#HtKMX4DTwl(X<U{zxEQgXh*+GMlkaepL+Otq(WM{LvyiOx
z_vIzqZv5AE!xOZd>8#2IgFw+CjjC2>^4ZySgqP;;c*%|^6Sly77|t6X+mAt=(&Mf#
z8c~GHYY$qZ=@**2Ja-Iu+Dgcx&P7RmuKI_J{v~04-P}1KETYmv6q~g4qwHNr*^<4@
zrc@Wc75I#gg0iH@Z82k8BD-w0wIbjSd%aWoXInQZG6s*Q69G^sp%9YQ$&!Xsn+u&S
zCG$%oXA3u=QRxHvT}wvp=pOxICFTHxfjnfP!sMOd@jr0bIyfV4f}-2-d-<jjq~*$g
z?wZ238QxySwd~^Q1HuJM)T%#Il)gpSS+qYdJzRU{y9>w4#YJVxg^CKYrZ{AtKP`dG
zX8%khtag|+K2&eQ^V%>BW%$;A;+zIErwkfvBIE*z?Z#4EHd-FzNEymjSXhV)Spedw
zoQvStt0z6LBau5!P!`!!WNn9~G=Dg3w;Uam1e3s~2Na<E)_)B$^qOjDFik69*nD`;
zy!~T=8cx^~9z}tKu^>duKAGha{nF-c8k&fwTwz;RV!8Qd36{n!Eeu^5qnkRe107w7
zVl}kfzDy1+82??^4+XzSmqVr6i~aGqN?ov=a55F>_CxwIgC;FM=OXYxvs%sxDyinA
z<L}j9^((Xk$4Mb{bWnr=T_pZYp>u)ohQUm4=TeTxYf8+7ya}31B4tBPHPtXh3ZuFz
ze2`t8eGFol>b0*vfNhOP67S{8pVqvC?JESwJIE{-Z3u;mZa<Dbwq5{U2oO}wnckVc
z=W48>5inR_Kt5C}pPtA_6vk0>pV~=hO=VO@vn+-JVtz+FS30Y5JiDVk!UzxRNttE=
z>j}p@$=U`y-fn5`_B0FoijJG@*3l%?HxTAME?khULlo0<BrGRHeh4MN4E~rCgfr(+
z5Kzd#iadl?KP!2;BxU?WLUG~Vg|f+$=0{5Q9ahv%eMH#ZGuFqNleSG26dKwg0}Liz
zawmTu>hj}5B-G2FW;LepTcTuBSr{Z)4WWq6{KD=Cieos9ibaZ3*9#zry^1>>YOYAm
zer&3v?!#R!iNgQ7whXWGtU$^zM8Atr0rXrfbdeEXiJrX`yy|52GScFbW^9*pV0A6!
zzmn&@jQ?w&;Q#6Gxnd$%d5cZ?x6CV$V)>(2BZ_L~jsP$$0>!fzxGfG9T}Rxe=YEqq
z2+Cr@mIOzJbVcVoVj0=ux9izm`s{v%KfN}gRE1UZ&>?*=%mkh3*rrx4j|uN7CW*pE
zQ7xyXR@oWW7p>h5cQ!@6PuC#s09L|J_^abGg;wv1R5lw-T^~2aEx*_1800Pg?*W4z
zULs?J@e)4Qf|wX@R}daXiVFmnHQdl8cs7;0zHiU_etg91=OCB#ndJ1i*TIr~27^J2
zi*rM~lia)Q0(!_UzmoM=y2uJ(E_U&*10_J84!<}f|DpZ?4LhP#QAWPM_ygbww26fY
zA6@t*>xW(Y{_WO3!-}DIP2?;RT@}7+rX&|9Qw7Nvr!|UY>m>nTz(2(*s}zuXO15-e
zIQ|_MF(8A+#Kdf#p2BNsX=Rfv(WuvgzrMYh8+_6JxXY!GHaE9K0)!+<#d@<1F7zhr
zbv$is+KFl$bVsQ(8llrdqP4G}>K%}#+E)qwUxv{d&lqxQ^azr(Ma{^(>J^Y3$}hJ>
zYd>8eyXYAlVey=n&Wf5%R!IT8J2`O#kC+r46icQN^XpS$f>0{ic$2hn{B3goc5t*p
zaZ%+giY$bLJF=WWs_$zO!5F?&8RRj6BLVbU4}>&puMn$)UP^1@8(dfxBP2Zq_e#>C
z9e|uu_Z)8Y5IGH)rja8gXsfay!5b2F7t)8C$Af!3gv@V;E!QEOLI9#(jPdU##2^v=
zxWlJYFZ;G*dm^1s|LaEeUw#i$vY=aATgVs~kYSkgDi{{UoJ#WYB^0@%N9?^ptxJ8>
zM5l*YmK(vL%!P&f+i_l|8qd3#V;z|^<WK>oa>*#l(VUK^QFEs`s@I6(lM)zNELoAu
z<P)=g)B&HTir!+U!Q|Dqg045jMGfu7ZDf?R7FSn6pPjJbl$!T~60Ac=Dt1e<0r4~6
z-;<H-61aN`|4aPu?@X?8N#X0it-0UxE|K#d`1Udg3B{OT(_Fod35ZBy)_3CDn#uuz
z*w-G&Vdlu|6}i@0#_77w%?Lb0`aKU;XeojZ^?-`v(6xNRDnaMTK|;EtmZ66NtjLAs
zPB?d7`-n$8$<70cDugvvl!K*zhl>9-WCOlnfCok53z?s4dvU}C`)l~6EGeV890oe3
zRS<I&_r?aY*3T%bs(mFf>~}zu3QBtTMTk&w?@IucNA)4&)h9}qxm$P`D0Awcx4Sh-
z+6~TUxb9P?u*@Sa97GocBhvz;?Ua3+83g$KHIl+8J2YrkWQd+$sB4whMR~ve?dFL1
zk**9;=Oku{w`yYqN!gE_|17#5RtRWYq<+qR<xi@aYcW9U`BuJ&I%8E(6+ao+q4edg
z!+d{Dbe{6@VoIUOm#{e2aPvay|C1yF^rbL<;MBN{X55*c6uB#;2!O(%np^|7r;+NT
zlApL+gP^6l@gTj&O%LM*Z$8u&LQ08$b?WWVR-Vb1&3MqI!+qY(iv6OPyY<;46T`AZ
zmP%C$y+qud(pe5x^;jGhFXq04hR%aZIu{{A`hao}N;y1NVaVXPF6J4q5%@d3bs>lu
z)Ka%Ey->N2mburQUa98Kp=qL7W1$FeJ~q$+tUvyjZTHXEvmPdSRV?m@n23l^dpl24
zQ}KJBidoT_ssw*}sA1iaqKB&vp_7-gC_WpSuY7}2O=&|N4Q!5Gmjv7GcYF2GE|PS#
zW0DX-!^xzzqIU(Rb7*VOpXe@}#qFGyBln~KP|5#>!Z8)dNWHLDRjj<8SHFhsjID=D
zK_{b(-jL&9wr7u@iuQj0%@hIXw@3Wu3}<EcrsCx2&K72t!UufP;UYZ<1yWV%CA`ii
zMgM1o&;H9y9!<u#AP(I7cr@l{!~EZ%=2=5=v)j`5-aHG9S)Vm!<|)uuPPrQtxMe9L
zg$PVk57w#f4G&k8-#l#J?nNkQ=#WPXUj$@8pUswCF96a_*kQtT+xu`g5i^%^zKKm&
zJbdi@-9u(pR@N~tTX%Oi!+(*s`*KCKjxa-&teSE`j`&0!KkV~mt0`5*TvW8M1YFKa
z_*BR4<YP)^3v*ANaQ};)=hGtWO+}*sYB9X-X~w8hWKMK;ympc@3Z*k232_Spe``fg
z?VaruHx~yp9i$gx+L(h5$jpH|(mTQ7R6D`q$z{@z6dm{4izZ%txp(OY(|rIQ$(7&y
z3>1UohFJWh-EiS#SCy^#SkXg$OOkR)2It9CklU}vQ;a5uon4_xZja?CUwc)=-sko(
zf*%jw6Fb@FHpv{G)LXExHCy^IJ8`+tplSYHam4E}a0?_HG%ME$hmyy^g8RmNPrsLV
zY;BV$cnLEk`D3({K3RR^=QNnB0v56cXo2`aAyc^CwVx2*vr4K|rrn|z04d}bIbRV5
zw1{;s*$8)4Tq4;EJ~mHK%qjxRv!M_@0FoDRR6I&O6HDq{==B;+QOm<%@K`NUt7-T)
zclV(6uQt?u)0~z>qUH1J$bS(M0J5(%XcS^PWlvzqCjcMHI(Z{nX*?v}UqUQXsa2Np
z7VHOHhXbp$=_*83uh88ah(P~cF+HVDV?x5cL{U8i#{Ab9Swt@!4eCdo2BL-IbVXyl
zXS>Pb%if=|bgm}qN)!RyDFD$9Bs2gfA2-0^{bjEzXE2<WJ7}J7mI+n&Zh}B(y7OW*
zpqjN61GXlR`xix{3AW0%^!KQwDCJ+P)=BL|b`c{um!b*K?rb;O)9;OU_JrT^;_VYS
zOS%X4+8-#W_GLz-2}>0S;fDctvV3X6h3KRSigFprge281w~ImL-vL<S(<}gdj(#MY
z>H;CeCq>NvnM0{s{5Y?&^MTEB89XtO3DEpm>{{cj|1WW&?z=Y?%S=*$AjClEbCK*S
z+S(bl+0W^3&kmEg?M})8YKo6c=p=IJbo^RvJc5BLbM+jm@&pN58bSyZ{#(2)v8qL!
z=?%}>68^Wma)vB{4)m~Lur?hkrKw-~YDU&OZ;^#`5lhvIU)B|&z}r7q+b_^O<-#BG
zYfp|k<k7z?^XVsy*8pzJ*;S$CwGSe#P}^oA9*58AoDWi(ne)xY2^GIl_pfieZRTo!
z?Y^>o4!s^b{Dyp)EiNGXiz!-Fh$isOrTGa?w)igxgeBC%0DYsrmKbZ_)9`}F@xs)w
zO!e+X@L981t-Ze1^Y+OdHR{vXsLI;J@LYlrRvre~iul<W?pEHH9TyINt!83ZK8WeV
z05LYmn_*YBc=WGkM~fvEs-iWMz7g`PMp}Of-T&miH&XsAqgl*7z3f%{D8SGnU$)A0
z0nPO{W^Y-s9x*yv_OXMKz;!btL5Rp3U|TBZja1Tp8P$1*WhL;9=@4l>iP0iJu#yj$
z0YaZ~Ybh13db#o#92oHfh90_hk0;wc%%DO!3+FM-kBUK2NN$pps{#K0z@-i+Ggq?*
zYvk{5UT(&qMk2O-SBVrl!la-Ad(ry3SNs^=VDZkrI^hEH+;VbY6rn`;j03VFe&XDp
zNI@7gooPc;k&qljSc0L5zJ}tEZq1NV`9cfGtB4;jO48m;q!<!dSCzi4Pqd|EW@dgU
zJ)~8ZJSRC_1yUo)dTXCf4+TwD^Wg~YH^2J2aYqpxly$lhH{W;g_MQAmiCZOd5y$sD
z=a>}9IZL5W;p{%k<!yX~_c=OVx_smOSislfgBO$x#V}=!Y^=ER>?rzp|C1E9cXsG^
zz7fmfD;L&_bW8^<jB`iN3VzGdMw$9eQFA?$04|aBL(#bF6zxy-!wH@vvqg0df2uHs
zZ*Csvzdh}IwB}0_hJIreb{gyp(R(8MjZd1LoeG^o-FHj}ar+--Zu9#_I`O8Tt6BZ2
z?N<bk9<DQ9^gJI<8Vt3navJ=_J5GL+o#8AGpBUndwk|f&ef3loe&YeZBcOl8UL?u4
z+G%LK;qN8hnew!*R5khp;q+oh0{gA?0KJ1=WIBv8H|bW_zr*(I3H7z*9d0(PZPm(Z
z4$RM=xqxKMH=l?E8)k%fGU}J4sweL1?xKBa{lgZ9d$$hUNB^MYep9ZpBu}DLd{Bmc
zQW@={zp4c1Tcq7&&*fMjk7Uyjlhx+)7DBh5z}^&C<O3uQfW37y8wcDP4jA2yP1nww
zekpVd|E~Lh#?8d2r9`fws41D_FF+U+(ovFa{i>DchGoIhj1-8+x@7VvwL$82zQh!I
z=?)t-(3?;P8VfX#KLEJgV!A9c1o!I1Ah@sVD!8wnSy#|mJo9qS(aLH|%E|c!zjD$R
z(=7^q9lUIFq*INo)+THY{o#EF@ob0OFwIa;)EDHDA`{cEOY%4Q3k=0TYI8tUvr9nL
z3svffAJJf)`JZ8O0gA*OUz7sG^~80qJ4hH**Y3UgGqSif$v%qOBKB?YljWF`H1>~O
zeAEsYvi!FIxKDZfN%!Qg#8?O8=5Fx^rCrX*Xib5a7J7mhDub=pDxRl1y&lQn*1777
zljNfZPiEgq7_W{_coMNToO_Yz3@(LLhW(vK%62sIzQfAXfTvxu6%!(|KaP-0PPz`^
z2posRAp0p6{Tl3Jp_lUN)VN7m<Ra_GlAGYPO}_MZKvR9t^x)BL5z8si8){K?Xgw?=
zUFWyAYXmu8K`6u1pc}%z_3DSp{aAGK!x9azT5vzljIl|i@Eyc@fSW*tFDUv>&}+iH
zRl>)~Arl?JXL0#p{~B+;Cc$WjOPOi%5yux^;J+X|9R~ITZ~x_sXuI`-SHe^sLwi>m
zlojPO)pO4hGQIy<wKg9KivYpNse&*2-WO{v=Nnzdbk-}vG%R}xzjLwX$Z9tXh{@~q
z-;XCU4{zpQBpI6ygYF5j60S0R{1gkOwWMFEUZQvUmn2;t#n+ubn!#mIw2QG{;bz+@
z9?-BxxU`hODD>$-ges5mMlTF;1(Z6spNyU=UpOzk%GsBvR0&eqMxvM*6Be`S8S&Yg
zo0}`;^F&z>ug??^K!m!G8NlH|gtCb~cSZN4)%g^y@3!kPV6QT|6#G3C4t_R%!umy~
zn3UyVT(a^WbUk3Xwg3~*@Wz$W_KT+}iK}QaAyNvbs{Ntv{92OC+1U=4f}|Nsm0_tI
zMF`Os6BM<(Ka1AE8irny>bvS7^#%8qif8*A>MuQH!AssJhyGWkc|&)uKvJ^FwgQV;
z?n#`^O9?sC`CI-EHaz+~RDaY@vIRhNtuhhL@F+e8Mptuog$zI6Z1dcl=Yl$&6g>TC
ze~{UPL*=T*b~uI}{1zifDC(gdZgu=F(~vSc*|N4qi7J4<OaDzj-tE_Zd%<q(dp7L5
znA%Vo3jPe^gKB|r%3VM4mgSX$Jj|>%JUMg-^`**mG!zeS=(#|(<l{8!+lNBx)9r<=
zK`oBg>SiSJ4lcd~v=$i_RUWh!7j?&DpWC61ju0Z+&PdjI=M;Ld)-1d7WvQ<X2H1wx
zHmTnO@-wOkef%gWaU!-sy_RO-ES%sl2NKg;#o%ppvZ34traRN9+bF*byfxzWq~T4U
z;*sH^bla8EK}pgTWQZM}?gI@~=3cXLN6qIC-A_m(OJ!QOu1&f-E&fw1@EZQT(_Wv$
z+x$y)c2l31!K3h=krRVSojXcvGi4rfS7)WdF_j_8iqA;Wa0t+~NN~y46HB$PQj)IP
zdXW*-88ujYcbz_BFhyHkV%tC4>9xIM9hmvT<8v=Lp0EBvz~h|j$Fjhn(>M$b)8C+)
z2j@S<{@*?G^#z(=XLyAL5G=aZ_330=dtIdpB)Y%HJRrlgoROPT#uYQSAl<bNt=o@A
z5Au{yYJG)9WejJ9j*}Ktyga7}%P#}lfk(}_|E4*jU?@6j=Ls!pJdts1mFkemrM3(z
z#@~t&6rUM{jNL|ZS=x>2XM=ya$kL|ksAIGF`(~o`ku%QlVlEnu%$dp`%o0T?1y+se
zTOabYJg_WU$OC~%LWZ9a9whpcP(-{|Bo^>$+c)QLGY#fI4)VC(7Tn@Rnq_8at1zzR
z!@V8*i769K>&12yz`zZYAB$@!<{4Yw`1DMKSzbf#1`twRgpMT`3n2oATdt*8|BMLr
z{=A`Z{aj8y?^<{ZT17(U>VKp;cd)M@^d~kq>b1m=FsZx2V4E{{TRqba!@_=vGgH$U
zqGaj<*}-6^@WS!8Hk157D-}n~Ifbb905X%z7A5<BjqdsJ`wsDm%@_>TRgyys=3b_e
zUR!bBrG@Hj%P)>$H;ChIESJv?NKXQ{vWss{PZ^sJ;w~MJnw_;99K+D8y>5ov(?N6K
zdE?<<n0K8T`jk-htFNG!`2IV{|HgW)w>P$;9f`*7CYz@I#1M`Kx9(<~H{aL8hECm+
zm5oghx8MV?I9mVORCJNa?p+EBo0wu-iYA^l*A`A_Jkzz?>=`z>s16Y+RpY`30mKml
zH2NfntO+{;n#{8ZWn*Yt;#g|bs<(U7gZ1dkeBwRb)VX4R=_8VKCS6B4vJCHU8p2|G
z8MulxLmxdW7U=jR)Oqf7t9V22v7SHnI=8p0a$6E4yeNYNPFmo|zB&6E(I)Rlm|_h>
zX0Z_s@aH-X(AOj6cd2yqgEHF4Ipb73PyXr&$~|th>j94{LLBOGB-r@e6RhOmyX-(s
zSZqZ<$%N_(l5>=AY<0PW^lfJ$8HVsJ{=|aRLz(oCbM8xnaY=H(7VwZ%5`V>TY7X{p
z+FmXe>uNOiQU=UbEy}S!k-AE85Cn1yo?)>wysMCZFLIMVFS(z;4#%8_k*zGKY{UIt
z;C3qZ;R}fqzIkXU_sBCyUG&7;y#Del(0OtJ+)o-AY^NF~SNG(<&ueeOXjX7+$u?J>
zl%|h5mpDIu)<;ufb;+Sya9vtd26U!m{!-XxeZ$!0nFSqaSY1qs^5nB$=j2EYV4gQn
zPB;BgoZ&E7(D7W}4Y#MRk>p)?<dn`XY3paviYTdADo{v&a3%NioV#sAnnYgMH1*C+
zmEDHcMYt2AmCeImW2f2<NGv2trM&8KGlh_MwMa>pRMVLU+)&!-AnPeWYv^-Z0@nFx
z2<a{d4J4p*grG4Mbhm|vzV7x8gX>QTGD2?0pp)cD7hw(`58pOi_%9me=0gTjq$|x|
z4e-}S>zXKL!gB{hp9o&k$x}``S|DY*u3OMu{pfRplOaOy8H!HdhdL=tCf(f<FO6<U
z?wLQ7jCV^dxyr@vPP|rl^bo^<-s*(ip*FZHafouO-dJx|-wT*+P`;hvwxD`OTzdNN
z4CI6D`{|2cM@$eCbRZ0>Kx86vCZ;jpc4p?4>ZE|5DncgV<uX6+vin8DJ0T*I*rWPa
zm;RyOzdVN1Ht|5#?6!6(F!cL6Vnbk2b}0n07KnzeK#<_9^|yMqDp(+kEMN}EZv*Fc
zrE;%uALTVBOvM<aPX#KXE?>4HO{q25IltrpDzd5XoU1$;{<tV($-CQYvm#CY>u<$f
zsDJKxjiN284ice@VEdZ<K;0?+^ccEL&f0CftywVsl17gL?HL`4uQR09EnE0f*y&8H
z^Yv@F8PfDmc!)F-G$fQA1C%Pam(T}TQ5<;hR@g`zQ+Ijn!nz0=Hg!$;#?MsZhf`_W
zAWB8QG#h1mF(O|=ap^r6C=6@_l8j*Jq^c)SWndAsvo$!|p%;V>aU2Q#^&n256D1ob
zR$PvCxVyT7b;f$8z`GgKiQJL7hY-<adCn=-Glzm98WH{+91>s=5Hbz=frq%_#Yc1+
z8+OO-IMvZ;ye3Wt799LhJ*Qt)@GtASyIYcUf)<;NSYO%NYb0<&?qmYG%lE^uMz{2@
zBcdN#XrOBT7p&j^J%$9No@nQIXKIIiJaG}ut6)!VJO6-aad2B*CR=tm;cOVgZ0t40
zy+f)l%3Lp6mKl?^3|UjQh$d2ara?C%1X`&;z%xw`VEK)EgMev7;qz#0ba*h!H_q$+
zzq+kFnhk7?Q|+?_MO9F$))^z#sfn#jluB(yLm5&bt%DF#QZcqcMy#c_SNj%qs3py)
zZIDJRjVMk~OKd^a8hfME^R)V=J@1^k|9t1%<=lI|^Sj^u{l0U*PZanI6aJkERl)Lg
zX1(H155*-IF;-s%by<1EhWW9qt|guSC;&n_m@f%4oUuNy{?mDuG+i6k5)>7Y(kcp{
z8`{>P%?X)6_$))sQ>2HKx~`U<O|V~Ck681#A`4#>QnBWu)yGB)po>xbweOJK3jLQ+
zX)TQGKkZr-R2KLpgE~sI(q)G}3_n>kui<fUoo>jG%Msa+<?f*FZ~QhhTc`%yVAIIm
zXsRR6nISBqv^HZ8CEYm3e7t5T9<IV6WGTM|uX~fW8sAxDUKAOci4&W^<HZkz5SlU1
zw-@fZ-*V;sp)y#6D$GI=7#5n^)d1t2fq-4AnbC2olUUuca+AfXcz#|c8|g{WN*t`~
zXY04tUtS4ihrL%J-xPp@%ZBG6oQfeqkl8P++Ty#4UbW$rk!b^q%<P0>Ni1<ozj&mi
zus+u-tMLZMCjywzTr_1+s8G2+v$x!3;@)lw0oiUwuxwd_t}^mEsSji;*)F$@=s^R!
zEv4#r3v`vA0^<S!dbk4kcSpO3<_$%aJ<dI?Otb!eV6^0j>Kx{(UB`#pOJzO51|wm~
z%MB|HC%IGe=87Dk<^`(>qEqW+eX1$A)&dH0l*m37Q;52zhU?XdQ{V}kQ404ZbEG!+
zZKIY{3Cq2WIPdj*^K%d__#F2Qsbs^5zwUPXrlc1TbhA%>PuIFLg=F;lQZDI}ETTOm
z{l3COB8dw<Nxsl7&FJe6GMOzQy2?#s4{I_G6aD??#zXTJsEjIf;zvU6!$;vB#T)`~
z8jYIcHVhO*=sr_26phmXXl-E`Z=Tz^EjwP#*uv9XT5%&KZ}}4xj7lkmDPB!{!6qd}
zX_jmaBWW1y3D^UtD2q{pR*)}InGc9#Hp!3nLeNhx>>x2gbxkI?gH6gIH+9xuL^%7$
z`G5B=G%NWzkh~hbnJq$oN^a~hd<j%YY?#UnV5~lBM^)`oT%jA7&2YqTqUw3;7_BZr
z-T+CqpTYMV7($2cls=t=X6PyxYLB{uE7kE`nO#kSjUpBX`|&Ye>hoO73!_l!P~t&3
z5I_NCO@a{F*b<?QpHyIv)yT$cpLvFW{5=R~uuiib&Tjje<&>oA)RSbFLIk>x@MuU~
z8?oWY%LXtA33NI=>9tta+MIvhsr)>>dxp~7q;pqA8<&tV6hx5)D1E)^M`l3#M)<&J
zx+3CYCu<<r<h6{A?S`S+s{evbd0hTEJ7MQ@2w`NrtC~xVWqCp09jbQa3g4R^gA8yh
z$N`#0(1Ydlwj19Rm=8Xn?}?_Dp&!v7v=K-k>^ms!J%%JA^OA{28DsM>@ro-NR&ABN
zkbNn;11WW@JJy3~;**kYB11_Y<EXl_olOz*$J_85z(V_p^G=INBXrpem;~Sjmewib
zi;4OuW@cmi=liX^qmXWHqs9FBjPF8BzV}(^GA(mZnoh-~J9+c}^$Dm|0+DY=jCYd)
zD{jX;j<eILWVejAg@xdCg~Y_gvH$?){jX>{iAia4+#NcLeCVV&N70O^`>FIFV68`I
zuXw#(4|Ig~OxBIUu4O76!N#W(Ew~tNM$)q#6lxq49DXsd=X`rQh_VV9`q_Im|6yU^
zSp&-_a&Tt}W!&=Ya{@%ANM1ENpz+?G*~?(fFwQWfl!Sj#Ks%LkpIBa%{+ZQ3fH^dO
zHHY!U*6^YZ=T^b=a+jJ{567FSq8<*`OHxW>_rd%<^qZff=dCQ!m*Rs)sH$z*`UaW5
z<Ed%+b$MB`nfXsxO;(O}WiH?5rkwI{sV}_X#l-1m^6{n!M2X*EakSr?>YSu4B5hzG
zL|<ROHsWyM*JR2~)YR8Qoyg2DYV(Vc58|s2n3~vI8y}jAIzD=SNsq9jp`p<~nNzLu
ze^b9*7_Fmt>sjB8G48*^{<lE<(rI`h8mDf5Qji}au4-!y_NjxnO{QHj^K9U3%*;d_
zt~Y8k_jN+Ik<R4EBgVQ@1<R!hK=N!s9$D^Dy3fm)z$EWXpz%imrM&O^JO%(u(TT>o
zW4f^`F{kE?RoH!^_rG?FTdwI=!`pJ{J7QkMO4ze(W@~7WgJR!Pn>@Dy1I#X%>_(1^
zV34$=dFieN2|U#-pB6#^?ZDpin5d2X<(RmoYj1-3IQjH)vZ7v`(n@^F6=rZ}ciQ!%
zli|F`F`#FVRD|3}c}fxU0H0E%7wJp($a#HIi!5u<<W%GOVW=lfm{$h*4Y&N968hhJ
s_}MWMvA_R1b{oKc==9G{bx_!hGLjKJT(TBpah)`%x$X5@h)2wS0mjT&F#rGn

literal 0
HcmV?d00001

diff --git a/img/performance.png b/img/performance.png
new file mode 100644
index 0000000000000000000000000000000000000000..a27d26dc198c351fdd0c9370f129465948f50daf
GIT binary patch
literal 18951
zcmeIaWmJ_>+wV(CcQ;5#rzqXhjnZ8LBHi6cNViBREl5arBcVu3cXv1Lxdfm6p7DM-
z=fnB1$Jp-}Fb4Nxtvlwt<`uvHHCLFjq7)i3F)|bs6q<~*genvi^Z@wPLVN^X!Ly@q
z0S8Yk#l@B1h)apvTH89P*%_IbiJICPo2g2Paq#l;Kta*Rniv|YN;A`cH^MeF{QiT9
z0olP-_1(KjRYTvOt$nS7l;5*@vf@&7br%RR7doKe*opDH8oFB%Ke25G474Zopwz0W
zM#TG{P*DC<WTj^`GBg~3sz~gYLl)T~r_`ZgAQ{kyGA4i~Lo~I8E+3)V!7=2<JR>Vh
zi=li?c?}!$BN@(|%YSD{F0>3@#JZq~l5!&@E;FGB>ZmCsJ2y9&F3g7#QC5{nR;1F=
zN7PKk+(R-ffSNr=6;I$e?$il45;ZcCh)`q^UFDV+lQbjJ_%)_6q95i5>bBN}mIQzQ
zRSdC#oMe9^e{@*bKQDt)(x_kq{e)mUnt6M3UzjPI5T^RMU@yT!X|c;X27a)!2P4O0
zrYU2tpa8`P{zim?4z+}W1Ajq-Ut;hJ1qG7@^Y0btfh^en{H+D~C+x9W5EPUMl#GPv
zOE>7<j|g74FRptsgMxnLoX_PTKMu%3{6yJ=_|6YrRHaQgJXoVM06yX96YggCums$T
z!&miwl%KK?5s`<nHb4G~pYip9_0(l`O>SCwHu>W=Ly5KFIY0kugXi^*0N1g6kX)Fu
zv>)944-ED@RJQ~KnSaMmp&8}p5NSkUAU}oyP<VMr(vf0+k3?WzrZgfve6ke|yb&jc
zF!<p-1?=t^F;Ga5A3r4UMmkCk<iAHyNXkY><do3Ze}8b`3fL7yjB)Reu(R4%1n(~;
z0z-$WY?S8LN&j$dk>Fm>e>WwMnbrOjI!xu?T_eYz-(Ly}DTPub*b)Z&^TV~F@aXm*
zE``l5>W4f6M<Yq~@B(-+*#CL3|1UEp5eyp;MaD0Cd9>P*T~tgBnaJN6t!qC%nC<*7
zSFJFWnNA-2=4X`6Zf~FAbtE(B;h6c?4k$k&7He0@vg$XcDAwf*OqVIAOn!Tv?783c
zd^N$1?yo_Jd`FC=5Z13S?ZvJ*8D^w9Gs?rWToeCmVha|)bfTKQm<8_Ns*RP^F3&VP
z5c>D*twV6_pD;#PHR!3RM59P~A0HkbVq;+$B^#HMf{8T}q2%OLby)4A)%s?R7C5D?
z_JUFVO)Z@aUZ2Bs_1m~7O5|;nG=Hr!2M@Y2%b?ETh0FdNORijUlJ#Uo?yGSkMheD(
zr}gQtf2I$GSJ*AKTP9F{gP4zhC)}scpH~kSJ5=-JQ#%nZe&9l%8Kt!+TuHNcba!^<
z2vOzzwPOaF7+yzn7lhmxGR1GNP>yHn9FMk3Tl(gG|FEDDKaB~;W4bDy3PvF??T#dJ
zSn5Qo+i$+U={|OM;CocB`_*aSqgFf=QV>71P@t+S!tbKs%hhCqzJ<2H)%VZmV#dB`
zT$gBpXMwlJAmgKPo%gP>o^PJD)g`C&PryzQ^sFWoaAVKS&!2Rse==YlW8ic7!grYY
z7&UHawLjTxFhejP*`B}8w&gaD1SwzfV};3Kd!Br?YKmTiOCq=_*&k`#xB5_(B7ZKH
zF|^7I{UZrE#K^r4M0ewV?IS%C!X(Jdl5?eH6)nDiQ#&QlcN4AI3gqpvw5Racpz_{N
zVR=5oU^7+O``YQCT?E<7(5h59JHVx-)^%S$^RNWfYp1*iZjXYB!uurF>tZof-8^}#
z5@(5Z`zbbS1{RZ08?N2NS3QS6x94(qH<!7(bq;aVQs}pWDNh65H<<q*_MT7iCVDg9
z+{8N4=zbi8%%wS%{oa--zBsjLccxBFI6cymh<)1U_{Vb@#kb?dsicA)FGD}mreTL^
zAhW3DNy|t}H!+Nrb$g^qU{)JlGhCjhaNAbZs1HyFAE!AA2RpbY{UBf?ML1tsy5xJ#
zZPZ<*s6fm^fRVm8+aOnEHKzI@!Cd)^I?LtOm(mk)>+SIpPSfw0g({yz)b(FP;43(j
z&mj@+z#jSq)0LD)t0<0K)?=@%+|;bju#H5jiP!&_T_fwYfAd7mviV{u0w(wJcu-g_
zS2oeKCyERv7$5ntrvtHP{P%e>MSWrO?U~NyW`5?%xQ^}E(9K7jjpl=7p^iXm!!P)G
zsh<q$on#D!IN-!{1zSiKEehKs{gq-LzldDOs@Bfl<)Mw3AX7YDkJigyZO?V%brkw}
z8y2C|^ccNJjE<U3r&@k%qLgjF@i=OsEgG1-PmCkM(#r3`<Kgq%JJot8qS^W)4>fMB
znmY`=(ho(il3gGD(I|S=qD3JNEN+^XMY}o)SoW8b@LoB#7RG#Iw(Se=3{RB|?>%_S
zsp8<3fmF3UE4P}R8Ap-3{Zt{<GG!{uncDJVotmF|N8Z<GG9RA3b<*w%$BUmZ@YQSj
zrTez<&${p*EHA?fDgBRp&T%bwS8|!tB|6V}eeW8xxYcuI@lx510&c*FP31(_S>}!@
zU*FwcBbWue=;zd!6I1;p|DvwOT_^Q?7JHR~>r3O&7L;Diaz2}dBCTA~u=AU_Pl?vk
zb%Wlwe=gpHR$7lq9<BXgdOl+pSZO(}NWt%RQt7lkCytEETp%3n;;D;H%1gV>*1cKZ
zS`n}vFqkD8IAdLQ+=f80fpG?_Cq*jkew5?1@k?}FugSyN{e0GS^=#U<CmT0n{dU)u
zVjQ;tky-u6hvyULaBB?hss|gNqw6COSlzISw5y6TIuMx%_o&6Q1`gtaEQ#H)bQ;~t
z?WI4sdF#zP5-dBXf7_~olf3wWN_5tI_XAh;^M=9AV86qPM6va3xkl(B(Zr#@qH0T<
z9$$0I{KzU3($(GmbWLfc&8)V;M4jV$eSgQtQ5?JU_RdPw#vddB2*y;WhE?(jiV+$t
z1EW5_WXHC!{zOKb1uN>cr@$O9M++mX<6fMMDCMermOSdjQIgixO=rDYaGgtvexelD
zlexk0#^+K`f9pKlH0o#Z_UU<b38zD+@2eaA3cEw(u;_?ngsGY_CLAxmZ8`VjUDuV4
zu;rB}i9*<cT2=!av8oL&WT}Uf1XtH&&Q^Vk;-O|!k%K3Jh_YA#vE3{>)uWc)x2F?V
zqR-3+2=x?6h3yvnP$`6Tg<B1sFV5$E&3=~|@z4ODRjt0TK_T_$d6Jj7$47qGapcQ*
zC7~hYN61es>RbdJO$Vud=v2okkUZb0M<Y3k^5XL@YJ9f9a_NOWVEJUV$w>U9oGE!s
zyv&>A)jaG`+i#hQn^109_vhn1La8^|%(@33QAwXlJZj>4iO-VGR@yS9M1TUj^ouc|
zju3Xf`Ff9El&KSwy%hm_gKz1gK;`oaxVhv)wfwE8z`J`3Y7q9Q(sqOC|4`H^?#Ve&
zu4%qin4dAs!n-ddFYv}rsp;mZpVMZBN2|g#Og`<Y41w`-_xr2W;#XhPD;!p3n_6KL
zSo9aNR<tWE7LTv=y)g@Dz8<#OnvcF)JhILtSZV2y>XnM`?(f6v&o%TH<FvVv;w#0X
z?)kofK?ipuxQG<^=FgnxzGYX7*QG<<aumN93iE)PW2B5rUjoDMS3Ukhotm#UDodeJ
z&-nyKhcYFQ1fl7pNo*TcY#Mf-5%D_Ys56h*)+yvErWRjCQD9Y~Q?1$-$Iv@gM%4?B
zi-(rn*(X}9zK!KrrYo#7Fw3<{{IGJJE4T8&-EsBj6`E7}2ixWsHGGG;yWYEIE7yM#
z&!xO5FOSv}3*NyAViRLfru6;Nc<z2=Iy)b<-C{BHxCCmyew+0p{@mHT$2LpT{1**2
z_s!ho6QS|h{se~j1jbjgj2d5yJC0WS^C=SC=-aKM9kVTlhGh$J88tP}ZXK&AaKiT&
zrN|TM6w<a=JOpne8*hdqj^@uL8E_Vq0uWZ0a+y}E`J7J=k@1)|cW?HaW53Rl$0JZ|
z6}9ZoHOY0qC!#g!j*P!NUhn_$e4g31`7%!^q+-r-P|#z3Uf5s)i$#WBhh2<<$n^H=
zl+*jl$+y?^yWI?v#q4r0QaC2tiba+1-No|WRXgM1ck1Yk{n|fvXc?Y+yt5jS_zW4s
z?D1#Y6H57k&=GD#9p0<kSM@k&zuk`t^K;eKL!G|w48HC=GLy@d8Cg@^o8oIW>rd1;
zx3NSz@wA$$%@(3)(V|z7-9Y*+Yt-K8FDk(9&a7AeGQ;=Io!9%S@~d++xnO05gfJ}m
zoaR>)a>s)Mzs>j9+AxH0{uJbJ=_t7LSvtO}jOp<>J<&|Z%HrMw6D=O6TMdEdJCnKR
z{FSz==xRy?h5Ah)*Pbl7F=z}bjXCPAb%|0mh`3~Xq2FE)ZZ*>dwFQ|YlE18(afmqN
z9wOnUdyTNwA~}yIKUhGr6%LK(dv}@7Uy`ts)umahj5WK(@3K=MpU$qHS3rQuQg$dM
zL9ccoG}-XFMt`nAeRtbgiqwhsrg80w``+arT|ueamfh-lPUbVRTOE)PP`rH8SbePt
z0>I35v&)U1)Cw#-lH+Hp1wtESoLQ(cp#@ka-O}c(qLaN@9UV$L)BplW@yKMU8P|if
zKp~}N*8rXksm^|Z1oouTqvmEwzPah?E&b=g;vB@EGn$rDF9nTc$-9VQK*q!Vwl#7^
z&Jg`6+?wbKZD)5kvNlq}FB}oyC^rA2PU-gdBt8Tuy_az*Dci8`k@4!cCM_<*Gjrr8
z9hyJMnMy1*HnxyFS=^<-$f<fWv4x+9wO4nlVMC2RcZ23%;V1U&k^4dkDVr4oUgM1S
z^{#;B?3&PR9JHeMpAmx$&&B#9u3=W)+IP=bZ2x$Ecv<XJ)fHi~K~SPwS7ep=r%;Cw
zu|uf+5K4-P&^tbaCV%1fP{czT1;aIEhKl4Fy_y3d$|Fp4QXXX;=2k+-Mk+~Rp0gn<
zi59v&aVPl2V6xk+xd0AaP0GpZD~}$o=Ie&__siYm1N&jk#%S8v^K?F{!9w2ss+|}a
zeZ!oM&^R_@S3;?$lc-wdOIv}S6F<p{XxBZPm)<(tBnQBw^y=6)vw9|2VpVufC|+8g
zMnfMTIAh*&xJfr1^)c;@(@83HFxyK0nraWk3`b)#ltzK=K3EFAD~J}p`z_D8$KytM
zcfId3#yHDt@Z%%(j}J2?S1C&`GxxsmDQ-X8U5SqtPN2{z8NJoEp!K~SBe){0#idtP
ze$;YZy`xg1P^tN=BB;`0OxyfNI+afKP4>v$&dBC)fj!P`j3fo?ns&RBmu}UGnu&+F
zHsKB2$WF1=xAw2jNaJP3{!irZHk3jyiIIC8tw^p8jlyRu%p&$i5S}AGk~dPOB3zpK
zw10HH-!gIgu2uu3NK~i!YpD=#@E@^DPgx_Z_N%8lRqP%6vb8H~M|C+8*~NQBQX5TQ
z{>=I_%=CWX`nJh+*uBGWr%m_n_-8{$&bnH3uXo9Z%_LlM++zY(wOe5gDQeHWVD+KM
zRL7M~eZd^bQ`vfFWV6$1;$IF@P5f2Z2LsO^bBf)pzOQ88!cY@ue~oU=mJ{qR$X?>H
z7V-3OmW!p5oc$MkAkQz?U>`;&*o7{XL&K?a>+(gf{ip9M9+P5#aL~8qkU*~@yEUt2
z5N-FA2bG*t_ex+|PP@vYn76HR=3r0K!Jy&V`HlV7iPq65&g=?)7yMd-YHr{6!R=?#
z=RFxQX7g;Z9?qqT)U~;5C7dTM)K24s<ukc*1cJY57#U@20uGKW5c}X)-@JQ$`<~q-
z!iQ(TQnJaYx%<1Uz(EOqGLzU*B_XBOmuhKe^`d$inmp4I8lyWH_ATPu`P%4K^tHV(
zoF`WOf%fRyu_<Cf$xM~3LxOPrOPwevlDPr2wH=Mo{-T6!0<V9Px?e0x#pxPQ>kYnH
z-WTFpBJP2`&Dg8U_n*HWlMbC8#d@bqaCueA<ZL;4W<9ghJV4ir$D@emJKuOMFTEyX
z9>&9F7H+D7u^tds@xIULmLQtKcRWSDx@pt?i=njFP1PnldnN_HheS9&(^ra%Fvhjz
zeib|dYCeuCI3bq!c=>RJGv;P@!_=oa!G*Nu!^jB}AklPwgA-L4h;{Jpl^X2mwU~(i
zCjqww1MU|&G3p6(u|u*iw7YPnmfPO(NJWv3s|<;SN=Ut^-N&e8r7A41pi~;XVJAb7
zSF=iz^hlvwB!@4O+qlkL_ul81JjzxHms%_MF5xVFSDeF<g~;)Vm^nK}0R9}`Eo&e9
zoK*f|4u(q@mrXmbOq)=iJKE8H3VCt+$|E0V$8~>REh$AhEbJ#PJJC!;fz;-3E^PO=
zE6PV{M$F-C8S3jF(@rMa<<Xij)3<pEM!qny!4>L!fFoy}!$=X~ZHFt=Zxw&c?iwr`
zPQXT9l;f2b$m_A%XFw*h$^?U(%f^A5TWV6Mk|60pXcReAz0t2*ZXC>swm-C{wOpI1
zGk7hOdnv*AMuHwr7K>#^1O~;gC6r&%0D*6Q{uC`CGu0&fMliKE+TME2>mxxBoHXSw
z;^-F*rK^)oYP<E&W&zYY2H&^D;!}z3bG$}#HXb$II|}rTvOW0bZhE%kNpLf8zYrqt
zl*4^tQq0AupacC(q<V?*>_(q;oa6IvS(TO1V7kCX-i?)gaeK!oA58Q(rk8d(PMRC~
zkFLXzTRMapFjGT?;%zwQ=0rj%R4^>#pJ*lPayZ<zYw<c<_#H*32@d`8rRG4r3TxQ#
zd|80?M6iZ%(^ZAnO;MUU|1j1nVP_SkkOJNkkL$;>gIC38Q}IM$$t3;A>gUnNR{qdj
z;Dt6C?e{TFS(1HIRbxTd%QxIo+t~%S4wkyA=Z{h@u-V%!7EF4g%9X|mDC3O)7Zc4D
z(heeRNLMnB&PXnhpU}`blz*-*h$)BPm$wENVt$hOdMf*ODD0JZ4_mkoeaPcB)8X$$
zA-x2>$*(vk6A(zZ{y45Q>PE?t=y*n1tEjTOM!t3TYv1!V8S6LXBzPtfdc5*3$*ayd
zp&eBvfJ*Vv$a@#EcWCxSckxVFd+%q$!-Pfqv2AVwJ_@a}HQAx&x65~YLI1V`uYo=m
zdGgUx-C3M~G2MXS<-BcJ^Pp^lGIM{WK}oIs*%VBx`Z{SMxAu=W{oCgylUq0Oauml-
zH59yb>!ab!mQ=i-zR{D{S@%<mTK2uaM$grX;P)Nh>C@^)JM(UPnUsPSE~PCKM#?*;
z8ZtS;*ibgmlcBU$)`(mD^e^o3`v^$k)a6#0^*yAkrUGQ|gIrs{J=*)73RvXFQuKbw
zdo)P`NKthiE;Hi)eE9#o0TW4>MXs@#<<kO{Z33&FcD>W)<Jedk=d0fMCuVH{@D3Zl
zs4V9i>t24<owOM<biW6?oP_>4Q}kp^wZ>h@mLqxZK~~lW>Z}~s{W%#~$IBzLLcNA+
zND2&6C(6_9iR45k4Z5%%s0WygNDB?Zbtnb}E9@iG82u)XUQnFn0E)+Hw;<A+%$C{k
zQ!1J~QPA`3`_<_-Er5J~(cGZ$A7+5&?0VXMLMWZaSKT3_?q@1+J`dd3pAr!y;Clct
zF}^CwiOA%4wJD*`CKbdpFE{SWv7K*rxZbUio2)RaIwIwFv5sS;MwKOS08Wmkhv*;M
zZo@1~Y;SbhjB8!7Levh)n8%9ZIbQn_|G}nShG_r-JF+Yy@L8<V^J>^PiB$n(GD+5X
zcr0lwXdMRm6hkncj0zu~B`)_wqYRV=Bjd@wEH~><+HCIUbzIvxC@7$Z5R$!qdE8io
z2T)EK1ZT~?kq^pxm|#S$X0JLM(If^nN#9IPv+!pnNo)rCOd~i?6yNo)#*y*6NCW8R
zOnOKCfXlxi0{l3cuS8)v^eI?`A%oXZGEd<H9TpZ={hpx5Nld--_Lk7k9&%6lqE}z&
zQaR1A=|{80L$$j?H{%|J06Iga;IO2nsj4>+bXq@#7;FJy3*}$((;Ls{JUy<E9wGdL
z`mI)wv|Q4x>6+!e-5|>qYaz2>nB6^AZk2_p-s-5V_$2?~L2ghL_e195K5=8c=fuB(
zK!Ex|?nn6jm2*P;XpwRBUGkJNzpl&W<=F`&KYVUStQ9*rEcPn|cs_m+E)9_A>35BW
zmno|c3Wa|HW|@T1ocH;xhYyWctztTl%GPM%=XHfBfI<NiPl|ImBK<cr8Zb%p12(hu
zz2JOK{YPB{2BUks&ur(I*%}W5KuRX|2!otC<Ct+I5sK@{!?5DOF{`9VHrr*OXO_Jl
z%-{}KS?Y=ad35RbNFuHoqnQV*gKoe9_wn;1zeXvYYN@`UKZYjr$xNfWBLvIt%r)s4
z8yi=aYBqEjT|P{9E2UvrJ_U12m03T2-C_tyj_3K_aD%ID-C;M$dx5H>&ibT(vWp!u
zv>dKEFd@^EjiG>Md3ps~2-9o~y!iMqPSy&o*zwkYPn@<7UZ3x~YWUn-9C89cbMCtL
zAhr0#BWiwPFOQS{b9W1mB1TeSzbxs#mil@n)Ax=epqBRGd3zw^3G)AzIDmR2)-+Av
zu}S}_HGU(IQw&u+O~*HErj_jena->B?a<np4-LOx?ysB2Y=#Wi!3k{J#%}@lBWbYA
z%m6J_{i@5$065CUu=$UB>55biOzh>TniA5ZI}u|OlhbElAx|mjo957JZ3$dNKRj3Q
zW5eFcxQz`9h-ZShk_GHi5r3HB0u}1r$l0QBcD;wWEsKMg5bNPWW9z|AAhOrZVNX5z
zyw~yjmG7|~eS92m|2Z9AFqCUMliyZB`Ff_MNw4-#_TqUD&M;zEJXifzrx0L2i5Gf<
zbZ^Fs6-_#i{w)yQ2~(;df7-^!j~}l<U>3+HQl7>?z8^Y&Co03<m@!}jD3TrR%qYh@
zeThu7nHLuqPKESb598}UidmKu%<H`M(%(2;*thx44ga7s49D8p17=a^J~UGQ9pw5I
zFF7e)U;MbgBhg9&Ehk^G(I9~`GJ%lc`%iRRcnXtL$qv2vyWE7+Wk(YNsB?kOtgxLI
zYWp+<)B#6g>ZE^bshEh?^I$;~!oNv*9VDo2fQBNUA)s{~FX*&^`J<}w@ZK^>rGPE%
z{K^)uswmd2t04J)dp^(h;E8KHYVVaF5g0`(!?5;F;~_xO69E#d<6RldG}srnRQ+e)
zmT=6Q9i4qNPn0qe0Ctc%t_2SDj46T*9tGd&zuwnohxM;4f0t(cZ{`Z`Yr!Imi;1Cx
zs648<vRM3o2L%d=C(4hOPK%jzw#-P}zD}1IF~JO&UmbbgvJD1)%KadL6(#e`ac!W&
zdXf`D?SM-3;+JpODf>{V%)fQ|1RL15Vk+m0@nS7%96I?Jz@jWz0Tue}bvmX2!KsM2
zjQ>>9bP32%0G?$woFfy)<8?Oq8b)mwFk9^4W0Ze4<}V_xlhSf?6k(&)-hg2W49+99
zw6>N<P!|8rY_i^|{cRiPy#cx5AQrakR$9b1f;GM;pzpQ_e=g**HD1C5R5vBuZng)x
za{&&9>QxHisN;4?O&<_5;QQT-C<2mb&l+6!_u%N5{|bCyS<_Hqss<xH*}gd0pEqc}
zyLzKlWApJ@FI{gU^uIH)L(U{QivS#(ZPRIz_3tv#1#7Znb~MYW%0h`3mxK7SE{989
zQ@x_eta>+mR)4^<FkS6Soa(&(C5|DJEfyTf{LeS|$KV{4)~UvhfdXq4P_x+G>6#}p
z@Oj$4Z;ZccmWyT4G&pb5eU^M52ZXQwTKna=91bA3w55Hp+wi%&ao_#*5t$2#?$NzN
z3W@>i?HJhBc_A~GSs(5%34X5&J0f;Nzmu&oImM5Bv_RoX@`pu`ZT7mHc@^TTO+V1`
z=T3)BSuaN#>zw01e(lv?m$L_};buW=oP{w^T-tP&CLtvy2XcVhakKTGA5{xgX}w7g
zv*^o7Q}Wv-ra(+o1v<dntuFkMAK0|AG_tP1v0{^ueCbfk6#BS9*z({rMatlq?RBAE
zyec<-!JzRqopmsk>vax@>PNdZ^L=wop0`O@U($4&y(YbHz+w+;UWOW$+&=ysEffcf
zfR3mxnaW`ja!qQo-c4eQTig?dfy@2Rv{c0*kqv*b+@vQ*v)s7e`t5XeB7uRI%03DD
zq&FTh-R}~enl163Xo?9GMbC4Eb~uy~R^2_L17+al;k`5GhCy(#ocQ|j&a^-2$2EHk
z&><mrEust=4gk5vSr6Fx@Watc+9L?qw(#W3I+KO{16_FDhPF281HYUrpUQc~e>2iv
z8Ge~=@oI@@xCb9L@}Flhq=ooNAceAm1T6`y0F=f*hGTKS^taw-^_^^vNTHJp6byP^
zZRSHX<~>odl=(0du;^kBmwUFcDu9YJ`q{L>WtW&<i~J!)@qdX^X8J4Iwb1a{M_$J~
zh*+87eWn!_7Iql*sl|k-4BWMqS%i0rKAOL<wm7-l0<<Mi53_8a+Rimfve!J=v>_3+
zoOVjHEI$Zu5dQ2G@oU0<ko`o*gHdkKq+95Utq>%LGxtkQQ-SgaZr&K4(bd0C(}G3_
zrcKWKfZ&fRPMPDK0+OoHW)trr|4?#dq#Rmk`L_X<^O;QDmB5Pw?`|jLAHyhr;XPYv
z8Gl?@_NbZ~iXaSx&AN>I>1=U?rv1_wyNhU1BM>cyJ{NQ7S)T1o+H?`gYu_Ci@_;G1
zzyj-@S+gw5P+>qMpo)Wm29p`OR(5B$p=KbBn`u(bXwxtL573{s$853;uTQt1#M3DZ
zuRn@cuSn&90Vnv42~N=IC5McpDY}sQI%BB!E0FC4@(C~d-hj+Cpso&h;IYv1o9TxA
z<}d5}?GhyN+RekS3BhOGunisA1WG+azH;Z0w9S`M{qEtkv&$2OI7FaABU++x<pwXf
z(_qTN0F@>Qq=XPz*_mRkhr+iwJ~Z`N9c!R+QlMol6p|@3DB_5=Ju04sw*nc8mE@Uq
z%zB2WA{$p|qQgQ&N?%+J0=S|T;xC#H#2x|@NpK74zEhQ!9$o1mf!j1&1KdJ!P`SEM
zn;930C)Cdj8OL#94rmFRqlNJ<^+G^v(5kh|cKlwJQ~lU)buR1XXNKSx;om)ikJ`#Z
zDSR~VZjP01y@8+}(Dl7MV++8}m8SE#5gVe@wl{~jxn`Y<Nsvg;h@@#8*H!eG+iEn1
zS}JPeM!VXYK{*Am?q5-8JXM|7oClr`aC2_UXiXmPu`nXyg-=J-IE~ujni6L6Gkq8}
zhw@|-87n|R<bE<Fb$VnA8Wa+ny|1?z7`p5HhdGz*{$@LKaLkrQ#;x!PX24<2Ue5ad
zx%Cj;0QJh>C~1z=>Mo2=aegDBB~~^-(hdfzpyhK_7_`uIjqL=}RO9X0^q$!gCY7=_
zAM|||PXRfh%}lKdMp<h*FY^dIM>UAMV<_U+^eBPSlvw@)DzVrlLSKWn<r-+iF&E^1
zl2o7w#TfpKepk8j1S=~?Kmvwl0T(7ofQ)@(X{9&b_#(Oq1l>J37+g2lPceQ(FdV7W
zt9`L#4sOOeTtnj6`3uY6XdH*EsAM9-fcF3s3^L?LXvE)vV1FXOv#>S!Eq_mmQLnxd
zs5^`%Sf+28X|p2B9@{4~|LEYd*YG+h(HcCiQ-Yz1u}9Jz4n@k$+)xs0!KMKnAA_NR
z(MsqSy|vGA-u#6CM5%tXECU0nT>TYh{U=V41asp~u9&bbY?<g%-FOy~I8d5E^60yx
zezqfEVX~me%8`kuOIx@&T&5Kg5*j+Vi+rC{b?;EVOT#g9^csJ10~u{Ds2gq633(%4
zJ&yDj*@OL0UXJiz^4VvQJbMNa8ILjN-2OjZQi{|dk&);>0!}SJR7kVI?tE{S({WAy
zNB6g}&8M2oZ1;Zk0+KjD3XL>+$^Nz8cqx8HKOKQuu0Rd^|3?amBP2xf+@@FyRKr^=
z=|pzgVIwve4@nrv`FrUn|4TXxDL&wlaWUnY7*uoK#j^eLaSQZdBIGgOy?Yk}nsGFI
zNnZp7gACG+#=j#JLoSI~3vRr41#XY8ya>Dd<pQa#zu68L*L40pG`fKn9bo)?K?Yuj
z!TOhXAWmZqMjL%XbKENi38u(9#G8HJKO-j8SvO_hVf9Co*$nocpHhj3Y+&7(^(72N
zgqt*909$wRDlXTqvC-R2Ee7GqqpsGdBji#c0--$ugl$LQ;D*ahq%JR(qfg&Qe3-Zp
zN&TDmQNDybkaq_i9q=pzAbweG<7Wul^=`_gJ$uUt764`?C&&a}3x@k1EVS`4rhi$0
zr-+C(fktA+n<zC9z65oLH*HrLJD3p}7tnD-Yy#GLuGLr(HlDK}3G;^BU#F#vWdXth
zKSOcI2~ff1K#*Ah=HYP@biGjZQOBmPi|i$c?hr-QbR<uK5B0cf-uqnd+@8K4WD`~|
zBJBwi4(ROk;)7$v!?0;jbmpF9dVR`I3}UyWdjY9pppgbLg$)dCx(vmAD?l%dXd?g(
zdWKjZo?6BY7950mA1=KBs3K}`85NZcvS2{U|HhGdfGAq%%HlDB`{~wLJP5AA1ZDt=
zN>eHzdfi>Fa{}jf37QUI*ASvjloMKR&p!AF8Aa9B?98_qfZ9B-$9S~pRX+&ip;VC2
zJ6fn#_1U?xZE>05iDJ6pmk}Jqb5J^oi5UVOGhFpXgGkV$5(Gv8!!-5|V_o<wVG7Xr
zvpMuRbecH=Cz_P^69PuI9O&Y(haOpKI{>9g7Dci9=01*)g_aud{FRTPRwqF4atAr)
z%AdRaKk~05c$YO*Hh~Hh1JM$X*?%J#5!zp$P8gshG3CTS{Vhve!-mY8h3pcg9%iD|
zApp!XJ}Rfzf<J;OXa~B26&}Z|6yU)8j)^KOL9qrJnNB%_08$-8#*TQA&hM(2#{DJ_
z0W~|<13;yZ_zCpEkc6c*{8HX+dK<(6eQDxbWE28c8hc2|hRERWe!OP+;`y6#=G{`_
z+t>^1>1u`bK!(Q~rBC62oSmGMl0pdS%E|$qWJi#Wj}G8plR+whe8mO=@}{EgXn{)i
z=1d3&wA>Z@qA18uiR&q#taYlb3;CB8{m5*s*(X%vo`~2|_i`DdVz)lU94w@qlhF4%
ze9_hu12kqykc{T)#1blOUkbE4_OCh+snpT>OTaM?>57M<kM&{O+Jwvi=kIW`p#l>5
zXspf>3YazzlD2okwU1A3{A#E`5R!L7Jv?}(NCo`_N4ch4dgg^pt(VY-(ogHuTzRC`
zX};gbrMga>oJoR-|AN4^p>CB`;vSC_(U3p7|1h&ob@AM~@H`x<Ewx&n{E+w@hb#t8
z0m$mrcRT0KwH`BRe8sIj4lo_em?cBA9dL7mc+puS-Q>~t0sQE+G3y}%4))g$b+sn1
z(#9xlr?(Z+hM7lj&2b}b^-TTOe+vJ(`J6e%>#!o7@TSa?mX8<KyIjJk{gQ*P7n%Zw
z;N^x}Xe$l^ExUgLcr@+LcEpR8#+(jfzGzWKFDZlJIFbE>ew#S>+@9XaeA!NH=-S36
zdTVQIc2E)#+wOMP-ml#eg0`Bdp^s(q(b!hfj_TrSyA*|4WqmMn;&_E46Yq0Wph7?Y
zZsgf4KpBCL&{o=mQR+uXTRqNp7!15m6BE?Qc0u=5p9LyQX|$FtHLxs#TJmCpmgcO)
zeFj3AcZ-L>R1(2rR^5P`k4Hb3p<Kp99Ix2}EbCOe3!D*qAigIqvP@buK!Isl`9u!~
z<dIFD=i|0?OzOqI>Xy*x0A$n^nL6i2B(&<DMhxjNvEQ4vZP8<ry@6sMAdf2eX4aoK
z>#?X%?sm9TpBoL0Z4s=P!cJv4Cm;<XuK-Nj#dy~@qA%r*XH##60gDq{=ylvOV7KIr
zetAG!4My{H_S1_9IAq8EB$g>U^qwwAA6j(~XiXc5Q2NY01th%8wHMS_%&PCXw*?St
z341u($BS#Q8Y8pD5DV2y($-MtwkJxH`S%;u_>-TxE&RZ8{Kbx&i9C|k&VppB3*+y#
zZQM$kK5D{<=C$8WGhOtG>GGfh!}}`}F?~s-+=0grX0F~(gQzTN>zTg#<nAk2YJJ$q
z)u5!A(tYQyWKnp9lY+*sLd1k*Dk1Z}2FnCm&t$3kIR&W{f^gR)oS{0T-RB!q+pvyo
z>p=<1I%+eV8Wa^FJ7Opo@U<goWVO#vlU9b0qB5~sbUv{!`eH%QYF0{H0*_%URNIu3
zg`lyZLgTF)3a%)Kv$=rB&V_Pzp06~%_d_C`HW7Qa0x~e{6P0#Hq;#3jffQ;Ud!XsW
z`{vuA&`62w2~)=yfe+z^MjlVRNZCjf`|l3NKCH8$%(uk^VenXu(Ih?TGVgL9L31@b
zAA>d&qqbz$dV9l?z#5u;%hy01MA!mxHAQu(J&2$2q-1fo>jKVda_0dS*MVA5$ByIt
zBBdrwi05RYZDvEMEd1(i&1{}<w@yM!tqY3M&uK*5EpUrlE~x%hH?1%O9194yNt#~~
zF+>sb@>@IK+f_~-2D$-Ku&e$ysfPyIWGZ&@MHDbBhKsjE6vYTguOD|?SjqEm&9}5%
z^DGhd$m53%SxdGS+v>@ScQ|%95+j`*MsjpoYfIilHdf_e;9ywD)3z0@&9S74d`Vm&
zt&Br$Lu47;N0dr)gUX^k1$h#&O1yOo=y<B>i30HU39rq%9~e->t9SX&vDv#htu~@X
zggJ0O=Vu8Mm8iNsZzI(dkM-zYY<5J1<KHci#^M(JlLmp5e?sQGjuoh-Z4Vv#ETzI?
zc+Mi&=IaYkGe}a*1I8aef;RSX1<6MaaOaTjn%S=4D&a-GUv4%}l9NoRa?2I~jXHGM
z+Q%tKPmzy~{fH^Bu($$+fuQ8ii)AaU*^IFFb-@Os|JV&BAwcC(KK(oCG0Mo=PmM{s
zJUAy$B)>{e8pG4dNu&=t9-BraalSx#x4ksk*~4aVAlb8zPHpHig;f;X%rFof0^hB+
zKnTl%RvR8T|2o_e32s~G9I%9mZ-k8M#q@wb5HuQQ_oKw=YX8hlsEE@UZVyuJc%s?%
zUGe6EqmjrQsxssNHY96o3iMgI@71kW%3v9}UAO6|N^bTKkdhT@`}W!24peR%42+n^
zNUX7;q~juBvvci!FTgLxz92KgB-bVmfq)9o!6o<>FQ7ug7hnG3LQpkbic)jFo{$Ws
z)Y>8|Yk%rnEaV<O$Jb*U{29w({YdlL#1KZ(JUbI!xD|9(TGqVP<m<^4QCa#yfOEj1
z2S;5UIZicP09wEHmY*ijOCq(yld9u=r(X(JGv8=>Gg8c_fo>CP0s5Yo$@(G(6!|%i
zI{WGKaEVF~s7aAWF;Stk0r_eb<;BYrr4^`FPETls#8(Er61Y2a4hlpcl=A4y^pK0R
z$3vBtYHgunFpH9uv?Ec5r)?s&Kry-K3Ql^WFUFDKx5Nxn_tkx;;bd^%Qq9f`J%Yh!
zj9PihH07=iP+&m~rb~baoLD$?iM*pcM++ua(n~$l;D#x%<V0Z39xw3jBFbXQt%)vV
z!&996>Cg_`d=cW%iCYQ~0`k=t0r<d!U!OWtpmHLRwl)1GGv`$X9qVk_U{XgZ->F4B
zlG{<T97Q0*qwdn5rN@d*D!}q=Yf>kcdvxpeRo!@W%CQQYIub}O{tHOJgb{f`_A3=#
z+?~LtBwEw0rX-l#RBssGRx|JO<(jMffFDp7N)Z3`(Q372jKAMV!erB6?o?8*yyt+r
za6`!>&PohpkkRZ7>2G$&S#rg$RfNEqF<ExfNy5lLUO__d;8<7Pk`+F$y;#769_!hE
zx)WoxGOWgBb8x;&V%obBu=p6Zl^^~cmu&bZg%F7+5oF2nUlMsvT@34X<tde-EW-FJ
zUa{UBwmfAr-!m`G)6yS!2e+e0X$op!w}opwN7}{1yI=zSUwhR7dL^BEt(rpE(n>H$
z>x!~FX$$K-`IQ5_TQ123Grgsp3BxDu<VZYWBHwZ8)D_%7&w14(o?NRTI_*H2LfTV%
zY>cGDzeLmz&I=ncwSC~j^U|MC9pmMUkKmZ138N64{H{W?_YMrC|3gKwz}teB*Fb4x
z(F6O)Pc-lmQNtd~cu!8d)A9oP-wMc295G1V=u<PKu*kTG<TXf<p9PSQhD9D#FaH6U
z0fivwrIGp<bp^?2@)8ZexHvW8rlx7OpNc%xQBX*JezX}r`kuSoT1_6@iM0D1f6@G3
z62l@Nh>Y(OvJ6wnS#DU8Z-@ssIMyT>ZGSH-`N8eTLgodpfx_p)DAPHFGxvXA7MSGg
zfs}0C%D2<%MIcaGlus3Fm6nJuKUMu#!D&KDOXF~)N7sg%RLsvM{yls?1WPFa-%ktn
zBYZG3%FwHG$i2p)pxAdZXBNJ%{s^)EgYAPN1iS>`<&et9Hf4gY@3E31K+o+G+t?KU
zN<mXlg<Ei+=zR*_-0m1RldN;r#Q2-fvcXWjHG;@g4V@@KWd<!iC$uDpn9+c)fM@v~
zCnAlv1_l*UxIi;q?R*<lHF`wT8F+sc7aG8OfuJPHp#Ai~_}k8O<?`EB&ijwjNKxh>
zJNCxW_OA9U-@lz^K^i6r^~#<G2|w+@9AF^A8&qiMKSmGPjT5u*7n*>V{xA41CZLsO
z4gXE*4s*T&rNqf0P^smB&XxnxvN$FU)&|_n2chwM7994Q&rV-gz>W|I00yv_2|~I7
z1Af9V1W`;oFoY9;s9VC5{S+(n-wrHw?6OxVju!`uoFMzz9Q%@-&gU$POu)(v@Nk0H
z<xw5cXsLn00Y?smH-Q%0&0pDpSUEKi=6Z4A)?{mq^J0PEpL7-ASAx3+YRz1ri_~8L
zKRO=n00hx6+`QMbAnn$eZ1HUwEzz0a(%e4>ZLGk^vd^O_gfmunU?1k2k`N-=Ze%uk
zT~;*Q0L4w_WY$|`mz2j&gwJJ%9wg}T#$Dm=<ippX!mtk=0|jZ*Albw9rIDa@P5~qX
zkY8O7qY@dkvob<tZPn8FCrYy4%zvz8hmyx-2zt`-{``-|&ke-z0Z?)E0_5XF24Dj#
z(7+Qp&H6U>EjTiSytRL33bO$almI$idqLa2*pI-?dxMVgQ-a*A_ti;kAOZ$tZ__H+
zUy%fOxvYdl5UU%w{7E^G2>L)hX$l}?9M@~b+qMF&e=AT^rd8cL1+)qi$dj}oYV5r3
zOX$@*2f9pCw5TX+azEM6|2!DVUnx7-`&5Ux=Rab{38f)ZytN0EVaCI1G7JG7Ekv@B
z_W~H^8Q2=vafeU&@Tgqi@Q1STz1Hks_CzF@=&S|``rbjMKzd_Bu$S+Tf&`%%2g+LD
z5%2fQwW0zd&6PlSziEnc2ej3M+_H#3-Cx!mvdu2Lljr`(ND1iZJGRg;_wqM8kkv;}
zX}j+|8KNh^vqrusm=AJ35jZrb=eYOYBENCK(!bX6gSxkc0mvRb@i6=QqxK9aJoDf4
zFmU%B5dZV2|Nqab#N_){z<Er8+6K1lSc2Za2nk8Lu}uP2-54S+^Y5VJas}*KhzAa4
zs)U#s<38>@qK<h<l4}C5QLIVzcB(S=_is%iZmR^)P(A(Ha;o|*6WBABOUmaYz1Mtg
zGuiCjFzAL#^Pop7WBtE4pY3bNUN;Kg8!7~J(wKMe5PLxze<T^dx?~jTW>m+&^?~?z
z5d(2R7L?ykWRB}UOYl~~I>%;^?<@p6#?+JEAv*3npZAIn>Ic|r6>K%)Bkgkr=t*XY
zh5$1&hSL6!m6yzuwyuDRmmG(Tp~dWdLjP;4U>ZTLFw;w;Qi)>D9y+Qvu!E<o_cG$p
zJWkO$y`@637h?#^fq}(+K!*h@_Kkev?5gT{cO8?%rEEaqMdABOL8(d!h7ZbVM=2Z{
zhwQK4!9;@%L}B#`!xApHX<C8^x|aPWODkD!q=L>23YwJhvn}S>GVf%#$gxsC(U{-B
zIin5CQe;rN>`txv2ziD~d(W#Q9}nlsIe^xs=iit#MmxSQ^P{JP1-fx?a9~sTp0@ey
zH=WCZ0thqxaj&y@xFX6`4sa+$&#Y4#K}(2e<_GmBK#f!94TEfD%kw!4uI9<n``Wge
z!2M=?K~eg}4n)B8x!!#~Tay`X$}CvrMtpPub_}inRzF;<#U;0$kk%=eM->g?4-zr4
z^VU-th1ii5U4eK(mQc$$OGM7{#P%R07r+aKLH5q;b5rYMh|l<vUWNNTkK}@Z?=9_|
zy<IVwAxT_!uzPRj+GVb-A6mOxk)d>q`4Ar&UX)xzrW9yLE$neUugE7yr>B9K>+Y+2
zO|`U|4M1;LhPV13$qts=h3R2@Y^%|NSiqg+*UP{b6$SvH68^O#r32RugzGOlAHgFv
zWW5Lpl?J*b3o~9k-9sY@7HICe2Cbtk+LbXtKkNs}Da1|hHTRJVdRUl+2`Qo;h{g+f
zp6xgQUMvT;H*$7XMTUpR0f56PK1z$5`2E9kw)rGM5n~XBl2`=A+C6JPl-MKKI-s+!
zI&+<K&!4dqCqAVJW;j3`Q^}OnJ6S`b5c1MIS|2QxYQ5q|@lH+gS(4zdZQ<ki+g&Q%
z+6-r1$i5p9L3^(tAZkDwl~5-lT0QRN)8CoE5Ax}KhU4yW1UpWm(j!c1D~{I(->`Nk
zP%<4ms7`&+D8=X5Wv3?OMLv&JOa#2Izbz2qqxOvx%X89ZLq2@4U*ToSxZUXoMjLZ^
z_clM;NT{E&)S=`9rUIyP3G`F|)A|ef0*TGzSN!5ofzRy~r{yqBizWXh6t38NV(zCH
zc5Mm%pi2n}w*ZG%;Cknqm5?skIc=M=KMXwbcK{=j=!*da<}~g^bWLd?<C$wsp!N+Q
zKy~Zti+>WmK;FI(4HTRUCz3F?+I-Mbwa3QW-@)OHYGyH8?;O|2e()9~mon`g43xhF
zZAp*43R`zzc<kFmcxTjV5e}9XS^R4~dsfeLKtPM<EN6xrF<iKI0UREtrH-%`PDzsR
z5G5G8EpW_}6rXe$D6?8yV_%*C)eF~+zfZct=hmZc`)k8VL<bNNAiYv)2ww0eP$^W3
zOMb~DqbRT=l#o3rF6Zwyl|ie=m{E#&BmsS=LP_J*))$zGIFQ<BuZ4QTv60oj{<Xyp
zcaEQDVWd0@jKUZ$|8ktZ15iO6z2&ED?|yJSbsVHd&!9>%vfKI1A=vR(8D(1otHAja
zah&I4(l%ceVM<wIEM*KX4JW5cIl+OOwE{ZwhJ<Bz?;F5y+7Zo@9d`3un1Z+aQn~WC
zfvA7x*^Gnn)N;5pcWvT|xt>$6A^p23gQxdy!a1HE+nAUWLn!H2AoVvS#Qib?t$h;{
zlg?z#;41{=Am0UmGlBO>{)BaG39#tI{#TV2Did!?o7PlWq`Y?kns#F74^kA@q6J)c
z%%M;{MJP|7Q5UQWm%=XO6W8T=(CXn#l;CSl{rwbVleMEKv=cz$)GZ2L7fY|iA0;^b
z06GT0fPJ>Cxf?im(5KG{Pj{y$PQfnA>*5-ZItOm+-^yIfuZj}3flqPyqaKsxLFLR)
zs>RApCUso5nfF0=tE($<#yt!<UeN$%_IR!*p#nS*E9;HAKrV2DtlVgWWC^6Mt`d6}
zw5|B&2m6E!La^o<DP)T=RJ0(2!@oT%Am?P@ovmK?le<3K^-jVt=eM<oL2%1#PdCcV
zayl#z4#O>x8Dt;$*Z~8>UT7Ret36?Xhf2gL0py&|WR8TVncQ!Z4EGknX6Sr{uVv3f
z$_SwwCAe+pX5JOm$f|5`60Z5ceR_qYq;2;kKcOaLJAEVP=|#Zm^+NBqKLUA-6uG-Z
zjoYmmitsOXt?Q!aDcPQ|EX<=Q<}#o8VK<vD*FJnos1Ue48A%(0bT4dmiG4$N%4n&`
zdF__vNj^a^F>+lKz@B1=mO0gCr!-hU#b?`6lz<?nm<1$sRxg;aQv5v5<@yB6AGzek
zUm<EzE_sxHoZTqLm{g&TXrD~*yaS2tsN!-KZd$WVfhO3+tJ}wvD0fOyzgN4AuBTC1
z5rR%ubUt*XhJl=X6uqTt&VB2?ksYerSD6?6IXFx`fvRuj%RWNqEAJ0iGe8+244s{Z
zh}-jAh{|h51lswshg-|C3=O0GI&n#1*QOCJAUEIG0+oTHH|V9S-;v#{b3C>-dQ?<n
zAHeyx!Te|XrmA=5SJ2i;+{S9=GG3zQ>NgS9a@_bSw|_$9ywM&t>B;i>XZ^2n3667(
z?rAK9;&ICvG|-P|sK6u>H~-9{p8NKB&U*ZO#xYvpYU6W&5Zg%v!?&-KYHukpe)cbV
zwWAW`+l#a?YYPKub5yY%FwYYCAR}cIZKb}Pf>NxTHL+i^omK)D5aH}s1$(C>CYFG%
zk-hVYHvyZzu9QEQgRLmxlGxfn>gVg1LrRh3OkUBC=RrTPN2d9tEAv&<Sn$FavYB$8
z(QIaTGq>+j=^TB-BEK_e;i+fcU<%246?`WUNpz4TvhLoau)p6sd)&R>Gf`#G;8Id8
zVTh?GTbu7XyPG16XHKk-H@2Tck<pCb7~<ZWDFF8SLAtuWgAMr`Y~i0fUKvFAq<CtG
zHO<i?I}jrP8Z7&YNi{kpn77QdH|~@6hpCnD*kTZ{N1Z!A0TW)NLU5!Na{KNL_PN_U
z3gHxiBEQo7fzVf`U1jCrOioXsBuYB-rs&0&!0ZIWp9TQFscXAk2DBsP6bp=?blttq
z^v*N5h(zE?c#=X%8o1yU*5c7&{oe7p_3x~GiWJKCo{v8NY9nwy`S)z*d+q`nWvXE+
zuAc`8mEq^7-O6Q=T&c-y1QBU09XVS$VYZ;xi&S&N<pdWhH__%fprB!KBK<L%<tw_g
zDEg6;ej;@=7Wj;^p4!<J@&>WmseDPO9i6U{6FiAWy^>j9dXxxyt%uAx#(dX=F!Iz-
zahwVf8u{f}n6nUU3Va05v)EIHUv4Y)_*-HJI*kSn=4ywquIfw%i!z6tfV%R74j8Ww
zI~;z}EV5b41+le!3hAX+<&kP9E=Mc9R|4D)&sAz)8L(^0G~Lk3>Nk;YwAon^2ce%o
z>kUXO^#J0h$D&>Kj;!U@JpK|fM9O^YpkMD)h_1?p;i0VTuuim|zdk;)v!#c=Z?Z)z
zH&4Po|AheS$MUS}ymKKfnjU+<*nr*n&(QgJ>{=gJTET8i6hy-lnk!rOA}m=LVLP)T
zM<Q>YzQ#3TAd&u@yf9iwk7V8G5dVWizO@iA)akacXtZI9u8dyWUG!?bIf#%fybQ$f
zhK{m8kD@xKs}w7;x`etPxsS>>c$6zPI=WEst}5(reE(c$UVBCQby{c!E%OYAiUm6a
z7eKSKa%1+IMSka2e5t0WYqhI6i(wU{RrPAkOpmn+TP2QJ;QD+lEsE8|i9;XvW{iZ|
zYmAcbRwuwgc^03~o7%pSzMv4F57oQID((H<M_Shmdmj%Q*xBResKpnEw?p0g2rX3H
z&I%fB%;zV?rD{icY+9$LG8iftth+;x;v<dtKIzi>@rI{-cy~7!IjTW2aQZ6H)ro?1
zAeVjFBiy5G<N8sL*I}Fez;4%u@(EVac;XC5Kr>``tPGmyH+nC&Xoqc^7AFxu$9W%$
zn3W%4rF<%#aHP6i`RRyT@Fw_0%PwfRFV?VA9kDn4l_jcJ9P+kbKG<?vt|K5;WDC)d
zNTBxn_I!))7Pf59H?-hQUOgJJh~<=Gj;=@EQ<|JZgt%)d?bEecFH@d1^Dq-bzAIxu
z<`vyCjiY?WN0jYMA&_Q_gz`Jy_s7~1LMt-a|AsfQzi$&B4h8wxmEG&F_vJ4-wMg)0
z8A|ukeREe11}LOY7JuqK^b|{iYS@S%vg`g_(i9*O+wAyQcmHOdNKn3auo6bxcPhvH
zw+l1Mhw8E8-*?MWdV{h%55sj$_WpZL*ukmL8w{Br`q!^O@hnfVH*il`TaCaokh!#J
z>fV#g6Hx7^3eBW4-DA@Za4No?fb!b=XV`?a!h6?pY20I#Q1F#0PXG0RTmQh;-gF6b
Ub4Tw%zG_J3g`&h)F~flW1=?|Ev;Y7A

literal 0
HcmV?d00001

diff --git a/img/spec_infer_demo.gif b/img/spec_infer_demo.gif
new file mode 100644
index 0000000000000000000000000000000000000000..c0fda87b7145fe4e8026844257b83773774aaf5d
GIT binary patch
literal 4302606
zcmeF(XHb*f-#GY_o=`&-Az%zex)D)9ilK*UK%|4ANr#}QsDLRbpnxHuf&xZVL@6Rg
zL5iU%-B3h8z<>=A5EK;^Wx0RP&dxKlyZ@P;|GwCApBLAgYv#N-y?nmM#@5<kk3Ry=
zhyDQnBs2<zMx#W8g|Omcl2~yWDap;UG755=loU2^Rl=!k-J+(vRYO%-M?-D9mb#vf
z=I$N320OR!-KA%0xQn!RkA;b$HObi4!qmaqY(Lq;#m>sj$=1uo(a(+2;Uy8|eK5q&
zBlM8xvqPJo`71;Q`g8^=(GDN#I!uTSp>~I<9SaYPk2>5NrE@AKv@eF3cqF{<$WF%b
z=;y}`Stn@x6MLV>8=pOOgnw$^V4}tOq~k+$n+!($5Ys;UT;lLKmrJQ<UZfqoa-K1I
z!ToAF>t&|TSf*DYJ7tvZH<le(lym;omGC>cnI(A_U*$zk6dWlp%obcfdY^k~l6(BY
zjVpp1$6nt`sJ(slO>tt~oqWL^`s2HW)Ay2R%Fj1f6!GrgeE%S$t*ZE4P4?5;yPc0p
z-#yCx_~_Edy30L}E8aiOf8O-qQ&awIbJ4()s^Qk!Pp!A-I!ec$*3Wm|U+TI)+1)tb
zUA^2>CFp%J)6ZM%uYWht_IaRbZn$G*xM_K$ZT@A~;#kkh*t0Jay{l8bE3f&hg8uK*
zL%-jRe1AXw`~B#T*{R>NuYSx;uYQ{O`FZx&m-)5tU)EN?t*@{Dr|SOw{Lhxa)^%Yg
zE7t=SW)v$uT_Oy!k>A#zaEt@U2HOAR{ZBUm=yjlq!I3MuEiAN@rcY<(jkXl5vRyv;
zK~cvAxt-w?oeyq4yNI_qkF%}1)s?M&;GR!c)$N`u#K7)++v?)JYX(Q>Cc3KcJikt2
z2`SpulnmS?XKVU)*W4YtL%C^JU{`zZMX5)1_+)o&>C5}nw)2Yi56i}?Lx=A9_B<?q
z^@#SSyTJZY#biVL*SX1_NB3Vpp~Hlg9O^2k+ft>p{Ceviym`h}wl8$3uX@*$yE9^{
zx4!zrbFRe&CCA4#ABRc~l=}5OuKo0~GO(x6vEkvutGc6~rurHleSXbj32$*~tXqE5
znXPrGzp?)72mVd_>rPFNzkM35j(FYQ)bQi8pzXr?mi^6*Kflfnl^%ND-1PfLgT#xx
z{ZE?z{9c*<^!oXepsV5lsV<<yg+?vTpw&w7R<_c!0v6a^B}kTbGoWCxhYh&Nvd3p{
zB*{TjnW8F}$ur_=<6NewPUPzJ1!D20qI2>`<lbZ$oZ1s8vaNXbrszKSSU|F&Y}ngl
zM*ZBkoSp50AYmQu5;w!fE$rQqo!<pPVmr8%!D43ctagzDeqrzPI{L`U$*x5o-(Rbf
zd2slgN)6^iLHuL2P7%s?+g6ksX)``YErDcyJ#lXfd+WKJw<%lXFf%9>g5iwKO{9j4
zjeKg(aOdrl=QQt`8?;kWNY)9J$s}eCon^@e>*}543?SEKwIhL@LXJsbv&@{(p>1V^
zv}H3a#&9NC?&j_bYGQYUZjps|k1RvWsxnu|;;5N>TKAh}T~Tx^gRQ|L%9}4}n;&6L
z&o{V@r#Y8x!Fp5Vojf3SNf&v`?NyI{4Ol68c`(olzC^+~DJn(CcGIG1{<*C_1`_2e
z>8>I+O1`5;l!{2#-lwELf3=>LbMUQJlKVT&u+6`k=Pfrq{cFdTnYMF53F#PrA#Vyp
z2Xsg?I&sw`w)VsW5+hDRr#0iA7GFs#V&J1v{dZ!O3N!A(yfV~q5TOub@Ib3E^eYOf
zaGt1w+>~f+dH)&o8=fi;9m7*4IJEVxT)bfd(VV`I?D7efMT82jgUsI49H^c*r2?v!
z^<(PXPBHG=<EYd}Dg~&}ucW3VEKBCJND!JaaPBW;>Y@lnpumY+X1wDFmLNC|IqEcB
z-B|DJEN2asa5EVlYBk>b#HRQoM_GCmr4u*JpFp%gW|h|SfGvLaTYBdi^%YU-CLgk7
zyh!p|bY1!RGXgl_xVKWI@M*c<W-D8+^*{T}1lLzP-Hi_If{Gb>6n=N$nUKr^#DSfK
zl9&EthQ2yUlRP<>S&M3@B}ocLa(~c9n8vG)2t<3qV*Iw+EjfJb*)K2x^aI=+4<+dg
zy}Hl&!63xlIM62?aB4jX&sD_UijtMaK9*;iFh%a40y*u<Q%msfyqGw~QTH``Y+XB~
zB<iWAk6>_Hn(U4qA^R^D6=mDf_GLt#KM2R7tzHssjUNaD{SnFQ>}uw!zfjI^lJf3R
zb#xMtJOQT)YVcTxF)<9()Bkhku3frunI{%Br%;rVoxqHl@<p;pz3pZL$Rn8_>68&F
z#$yRWvysAKGbH9Wi1er=B7u}F1YQ_^opwsxBA2IZJl3IOS0u7UJ%4JHtajL!cB1~5
zkN&YPd&3c@<M)f+>BN5Ab8W1GS?k?828ZAcA}Qv3q;Ktx=}PfgzE4lchUa;ZZQZ|f
zDY<L(hUT$#GT6aPxhWEQa(Kne7XAfR<ISW~u-(i~7yNiNLq!RRB8N`HP=pVt1Vc7&
zIXX8*yLi|70fYQ^KvF*VGJbX_)n|Eu25(b;`L+&qXERg;=vi8B8$WygdpDd~tzfVq
z3#$yP5mUhBEx%WHK5q`S=rnIfM+(q^ifG9*MIl)I?o_=+C&?pKg<DmFj3mi~lgii<
zueQL{t$Ea-aVe~d%yOf+_Qf=y*RmV2j0Ukiaas85GUry%Ps;7^N|)f|di0YlwF8n#
z9zOJ`FbX)9c8XE{jtW^p@0Odx90@m5`E}m8DDxpjjf*pQhQL2E4`4Mz*+t~vFXh%P
znYB8jx8Hps>2`;GquJ9`r{ss3DkOrtGB^JlCuF2{?<1qsS*9#{U_V6hp#+u2?7>N<
zL1m(tpxf+bp%8vk5?3tgfONnUJFlmNMH=+y^T&f&n50Te^mS!&MIo_Hw)cEvSLDFm
z-9}9Oyl`W4>#)*sTPBrpKr(VPINqq%%urP-l0&MDM-a~K%i^MOj|GQ5c0JN1-$htX
zL`BGavXiWgJ=T|4k$!*YS*02(($J&zu6fEnTYAe`J3HuS;tbkOqCI4bhK1y4Zs`TZ
zTctKnX=d^aJ*M;+p5oT2O!x5Busex&*Ck)J{r-+MijfR_I-35ntUy)z{5r`b)N<1)
z3fuxa(+BH@OvXui&e>v0jK}cTP`;{OVkM{^DV9VM1+Fp-k+A3c(EYwi?HHwp>>K^+
zDBq%EetNG>g){{#odxg2sH14;<hx(T`THAwy|BaVqPy}_U1U??H1Z|76XuiOZ!ZmN
z3ZwGuA7-1$EGBHUSjYR%r^80Cwmm)0mnw8z2;ZVQj=1`;_EFzLp*}%eAoi&4E4@AX
z+V6>3r$>)p_AMT7_&vFl`Ka-O<L6U72#JGJWR-LWi6muFNq|~4`|g`XM@>wj4`CJL
zez1;&sGtzL$V!V>*|DN0Ghv$5W>?g+>V(K|Fye-%2|Jjww-^`4*GJG|1V5~uX8R1x
zELn~=4&9O8i+3tY?G20mns8z5!(2<a@El0fUy5el?r#|@<GQ=q5wK*unfUqdEZB}B
z#G;qs(<Bm8LjC;3N7?WpcMbMl+Fi3vTT&giorgC~y|BF~kUaLR-;P|vMF%l&nT?o^
zDsh2COsE+{RR!H7Dm<I|A@enmPOb>wk8q=y{Umr-yu9?_lyUa9$I*4h<=zZ<Sfv7?
zW)sYSV(Jn9#&eTb&T&RrL8?=w_pbmxv|)L1<^Ii0a?nTHnPny(24r&;G8Oj9v;Q-d
z?lN=bx}vG^4XfEfzh9BhQl{UPro63DBJf6T<&5n*u_e8IUEwmHKz1JdWuRpqR36eW
zVsBpj;Mc)2zEyqnjVCD&%ty}T&;N=>M7X{A0`sBTC(6KlxJJ3H2|{SaBqEG+(<l?4
zm|cSsZPnY4M<y&mK1z|kteABTo!p|b&54hHpQ0_Z3g3h_>t!BTM4gGSfv$w?-NHk0
zXv|G=T9=2k)_x@Y{Q=43+M3Xr`)L+C@X0<8>Et?G78j~UMI@}4jRzjtL4_V&fd|u}
zy+u$plxi0Bv?!DroD5B(?zszN9pjp~rJm(r)dSdCI-@#|tM#_<?3`xMDn!`9__G06
zt<oaa>6a|(0WA{>N|S0>6LNf~AjY;X^_erOU|kAUU1Sn82(5u(WJh2*0mqB0wT=-D
z<XXvCcjL1GdwQ8$)8f-|peUVy(`VGN=|q#K!Ibz=qcCb(5`uP*fJquXLRZK75)J0F
z{auQnHEpR+b8%3VbHmM4_=zB~OW5<PEa*Tw>_(~(1Y;V49gdd>Mjm;#n(_38$s#KA
z?P}Ql;EZ><nR9iS^P`!ItC>roDzGnRLNfRyY*gvY-s=SXM`a_0gL|vLCP7-Qmp#~@
zcU(;2MpO@>paJj{q6rv8fu9g(8v1WM+CT<RrJ<1lY^5<Ja0E>-<fwRZ)J}5L^Ed<y
z@&fn5mY<vt5*$s#Y<<sc!e#^bIwpHBMrrq0wy7t_nPzHam@_$mkU5Dy&dxcG=P>c;
zePh{)+#Dwjj#(PT^5msa2~O4}n2!d>TEO0K$O&L`oOqYih?kW&BgD^Liu{T5`Uz1T
z%kekleACM|qF+|2N1L#-qsFduFJD&nL?1edBp9N}RFnl34#|NZ#loE`a|!jx03!N$
zrO|OLI;9e6T?um{aZZGBHlOrJGQ9c>lB-;gG~wr^V9~>E2txr}WDM$ozm`aay5_+n
zxkd(b7!{9J<{@G#vy^}4sTrE|T3_wVQ)oGf&N|3(;$AKLiA<p*ta<D~PlO5O+9M6l
zF%6C;9d?+)X<zr`yt|VBUIRxM%UAiCPw2Wzuq_zRW52M467t}-yn@`ZLT7<0i<lp;
z!HKCvr}9sK@Z>i5UsdiZEX7<I@+^3WL8(!ZEXwx7G$TS9bZ|2|sWOK}g+>UjtBh$)
z25?pGDWEkuEllWHk`ti|@dBf+PC*cCUCFfTDHO!1OYq}BRg(=XOuKU1f~&gsR?YI|
zi!&&F&uf2dIb<&mi+?KxkG8*eBZ&<Q-F(aP>g`$y4nv^g#JTm*@CxSR?JcL!<I1<Z
zt`?UMz)XMTP&A8`e<BZZi{msE4&w1KJa$nwTIeT4a*UlOxR}Py0#IZc9<RejpOD8t
zTlc(^DKGy7hW{~|^-XSTA`)LZbMbNN9cX<(mRI^k`Flls@7?mcSA6PT$<=%J9^We)
zzgO|=UZs3#)!xz?uhNI7O6#tcK7L%<I9}TPtCS~S*1ET>-K(tD&g8umJ_Z|w3J7J!
z-TeaF3$41FvV3uE_Mq0o`0BPYj-c#!sAIB!Ib`r6i&OS$JZtLI-KXQYt)7?8-n%n>
zi4Fa72QtIPVy+0}D}JfqWi*U*Xz0az`<LdlzR2TO9y_0PE?EoDVnHjRP$cZr&BRlc
zpSp2+m^&JI_gS$I<SuaJ736TQ9;p3%AmfeOs#O)2R*C81svA{lHayUNRi$EErD}wu
ztP`qLZL813R_T>iC$?1Ue5&3hj5F}&7!r$;TZ*mhIW`e;b`3Rq(rPU1an_hxLY|zP
z5hpdP*4?P~_U3AX2zZgLoISWq(Rz5!`Jv~9hkg-N)K}Hpg{wWaYEDCH)a@TdT~j#z
z>Op+zrqex-Vuh<>gdd%>$DI+rlXz`Y%7r?Hu-pZ$;xzBNnq}nSCFEdQ^(n7%+8E0I
zTD{h3biQ{@p;mqC0O3Vil{FvAUQ$n4MrIE}?`TyevLBaTD5g(8KEA0z(Wv2G&*NJP
zxFaK8HX6mr<0VN0A(gKlEQU8GFd7eQ75DsZU~VN=?A$hTy6NZ)`^N8_<nv8azncW>
z3e7WG&20*oCyknCuQks#G)K5JPxLe|eZuQh!tJRIgQumk<e&Vy7P5uguqzB6LTUPK
z#Dn|r;2fAQ8+IikJBAAPrNEH57D;0sx{PN!#uGPgS@Jgd(GyZ2g%IwowYrw2BWPC7
z%Zk!$)og6l%Gd1r{baejRnNH1-`?bTDd+L!R{it`i2!-fR!1>G%3P+^sIg(lqP=6Y
z-z)EShl%!GW2k+N?b|%>JNb0DC2%McUM}-he@=JM#!-y6BW5_MhhOjer9UuDxcRq%
zgRxBuS$pa(@>C3iB(EW5!r+FL9kj-0+S<?LJfEG&f0nS8LtTR;7(UgBH6X7WckaG>
zN7b04{}Oeow=+k(^^|-=wY^EUPgnj#Jz#d}Hg**xaGD08-!F8k`x~hlcWZifHh)15
zDR-6`_Y~N-I+IFD9eN&X7n^7|);0F%=V_*-cWd0Bv|@TS^AcKYO)jMO_OE5<HTLdZ
z>m8oY9!Nhh<kQE_ztBD*sYB>~j(hy9tncka_7&m&clrH5lQTQt`(Uh3XSr_9`1y*@
z^Y01IcWtg;>XrDC{`~LSbD+qtDSQ6AOyZ9=pEZvpl2E3$aIp-evMox?5l+Wf`_o|l
z9}!}r2>&!BuDsv75|KiJ`_uW)9r%b02~^ZzNEu2R08t*_Bn%?Gjt6=~jz0;41t6Mu
z#cpXpr5*|;UNY5yNwa}C_Oh-3*bBo<9JBX{)^6rQQg~3n29~_RhV(&=C<(3d7Y8HJ
zQaqrlcv+Y>q>_d-Ho0;jk#h!Ltj!+YUq5VRj|N~^b8N)E^kqUN6yOJ`ece8jFQk`W
zF#6h6i6Dx~@yEkm@k1#BggF~=j>HM^<%ItkR_;RWa~w_~q3pQuaLQN;_a)&j%1?j@
z#0~@}j{D&`=PD7FSd_}<m&$45w-V7M8JxHUq#bGa3_w_Nkt&-}Haz$#62~3D?Z5yb
z>}7lbr#KOPLNJlSMT%q~YZef8OCy!*I<IO9MkrW_s|g230qn%l9OKbs9f@=0Q#&JH
z?!{h_0{}|}fP_9rc`XEh1P`TraxAQAM0pJEE;=NWh&Bd5hz|f4?#hRt*c;UY(WRkn
zXaGhB$|n(kKaL|oQs^iQ5uosZ?)&0MB03rXPaTdT5z@E-h#N;yRA5q$#Lxs<c#bLU
z4U7cnO_0A$;AbM5$b$ePM8*lBzIj^8Z+ep$Oq9rxqCiuK5Ik|?7Z4NVs6@}G>vH_5
z0LFifBXQ_NASe3z(`4PkABoQk@3rO;fI3OYgTgAuwJQXGhDf0!Vf1$d4S{mrnDY8&
z6ktP#MZs4^Bml5G<tTqVOjrQ)@UZO_0-PyFv=TzFMV%;kCki%-03t!;JdBzWqKqXh
z2^#wZp(IqK)0{{m3<wbCm7q)>N`?)R>8MOy4#o+-YYLJ#HLmLU@k-%GPsev|neTiG
zAvu4iZ$;0QRJ=m5Ax?&qDO89Y=|g(&RP0~uQQbwK3!mzBIA{P>4TFdfIdWV8$s9>>
z5-5v;Jp#UT5?Yl6wtZa4cjD~p=WCHZ-*1M9IljHuJi`zJHZ=5JD){8Y(WQML*bd#-
z{g?vKpb}~hKzqUGAR1bT1hlYI&rRl1{HA64mv8${5!Nvagp==XE#{nA`ha<|1lXSw
z78i7hV7C9+Tfaro*hLHR+I@>-DcFyyKR+sK41dcUTU~sKqkY5C2XNTWY8p$%{ErT4
zUzj9dOhX3(AWi?KNJ10p=almx!c?>n_^M|6lJN7RP6b@qc6yi7c*y6s@iZt507c>@
zz9UCS6n6f}$05hBDR{`B(=0#nd)S$85nG_tix9o-998h$_H&0-%!)8$<@&|y@IT`!
zn;}>VXEPPJ`Mo<E{h5$9OSlUM><N{-Fu?utz5t^3^P6ft6hVW*C<9CYOlh3x{qK{-
z!3j3!`0JUyw6)|UR95uwk|%<zI%wf_F}O13lYSSZc^^lQ4G15nvz~mR(AK*4b5sSt
zQozS+*WZQt{o;y$D2m~;BGw&@XH_v+bHL+TeCXV&4m<?Y5c;#NslqPp1F&VRJn)`D
z?`=mxkj5wIXhZ2c0HJ@XqK2W~2CP(NPc}9NW{Clys(qY@wZ=*pU_G@{EuPJ66$ZO;
z!KXSqpnF5r)CEUVw`CjPKszLe&b+EEtcLq?q)pvgQC2Ys3xD|0`3g~70wOq@%7E<M
z23LiH^Dheb9gBu=ExI63T;|lu^2l;vXO`;zVxO@u!MzvvC9sFbzJ~B`SY1@}9bX9>
zzI*Wg;mPrD5u*=+pBJzDzWN?DQGe{_RQ}kH7(vTf@t8RnkSX3PBCw>+@<sCv3vAl+
zS_szpJGSfbKGM<cJH%*Wq$IL9JYOiNc;93HQY-UC2yTfwU=?RBD|L#Iu!RmpJm%1_
ze4*7(Y@#Gj1A4QSBz^~Dz??k~p?N{7zK+7+CeWPGPgtSVy^HKsTG3~$MU6ZuRb($+
zoQVWmqpjs5YIaoj9UqFdQ98Y{Y=dV>A0ZPixRyUs$aXzqt6(NaN;#i-{-);Y1e>^X
zZ;7#;_|4qMZKAJ1TA-fzQ%?FtEuEP_hvHctOT&CTzFK2XQTlvOM{%};L-7({sz^s0
zPj^%k-nBwm?>eG?#MxTm*ore*`BI$AlqqS&#bJjk{2UTcl!qK9mk0>Z3cd|L(+2|R
z0q0}i4hp1i$GLe$)P8gGIf{_9^*H^lR&Q6$+6(K=LbKEh{?6ZudV;P+xw-k?ymZ_v
zytMWq*{|TmaqsAcZ{NLX&S$@S9qHNi!zb>3-)^7dua5ojjeqm)*hJi?+8=%iUth%f
zp8Q>#E`*S!0Qd!x2TAb7FGD~@<~H@R3Vmwn5TlDO1S*30MN|llj!(rZY3Fibf5mRx
zOvY%EA>!%@B^ZKg0(qzijU5FJXWra)KU8@7`_GWVpM581pXI0v03cMNSui0Wz<WrM
zsPy$KDi%C?F-}fk<SIkt`CmvNf-vEvH&i+VyDHoS*_gdp9JU(QTywAJ`ONx5hws5|
ziSjc;kDoxEqO}U|$#=T}abGLZK~jFHmva|iM3`?e0ujY4>h+)QZ?P|#@3qSn_pHi{
zW{GeAI|qR9N}Wa8?!8u^NCpr|F~uSb1|90<JK^0Tz9}hw=E6&z<=5GNSTKa72N!N;
zT}X#)r|R2@W96v;$`lV<i@iX&=zzsub>~?T@RU{-9KX84Hqs;G88!IFfvlg(6m!hC
zt(se*`Ob^#(W3w+4<PCT(?<|DSc`bTKyx7kJe~eI4ltgq(jn+d-g^Gk)+aLRbeJ6(
zwEX2Y!y|c4rgR>(<goM}SKi4pzbBkKv5cRF0#ZyY3nD__nG8rKHn!bowFmD)a_!6>
z9fcv@zXTPvmOz-Sv}6!ytbN$|f_Is#OoJ8UrwTRljE7Sklr3ef9c$>iQurp9VA>hl
z0RnKmtsB$aPTdcH$!9SucGI8oArL?!L6Ibg9N?vj;(2m-0x31w-_X?64$fBtH3*)l
zT<$AS1tb(zL<!8gd?h<PfQfK29Q|A3FI&*>A3M(xVoNa4H2S9RG=Rx{C4+adNM-Mc
zIyXP%z38#!!YpLF7?$sYqyX{GS!}wiki6#lN-Z4DWy9&OoF(~2+oQGOeN;jW`+n|x
zdv<3yk_t_0B|T-hrXpaYBo|G9)|aDaygvPAh;Wk*F>c2eKYl~{OWdU%Pdym4m3~T-
zE1lZT5K8k2g5XY~$pNlF72htAW6ly;(uHlNY(1|c=yLvrbr9_Wims>7ND+FRLzt>b
zlnnzi5dvWn;io(R;+`!(A}*KYBnE+lTug3?983H@s=Zj94z97#GHMv++UP(SD%BR2
z5Kn*MTz+?-ar+jPc<Hn9&IMia9}Fjdxz%}T6+~FQKte0+<v@|vBLzCNtV<u}s&f5z
zobuZ>Or9iH6rxemt#}1WSO=>l$ioKQ3$fVxZf9wNXyvSO>G7-wX6-jGHu)S-qYq-B
zq#dtaVZKNj@R5D5^P`?I>!D9C>IR2FJdpde$JHlObUS8M^^-OsRW$&s=MH<db&1V*
zN8u3;rD{Nu1qU~|IHt!5G9lbi=~<7Iinj0wpT5(6E7su^ZxAx#@fwy_b^~!(34NCi
z+b%W!21rJ1u@s;;6SS#@XkMG*r<Zg<YGDi0NUTf84aJqrtK}B7t@mBSqUe%ES2`w~
zoqpS<)(rzoIRF<MU_<olTFw~R5w79)ZV%$NXZ;BV@_^6rm)$N(c@TdkTuB@!s5l>+
zF86#qM{9L`DN$<Tw!6h$ultkJ;;KB=#60tR0acsa-Z{oxX<7?bDtGTmnPF}3D&jVD
zUTOY*RtLYz#sB?&;7H64ODR0_90CZC$iv|fk)@QPDITG7F30O9P?W$Ca%9e_P|`k~
z6Ebm2mn<4gNi$G7bdCWqotlc=aEVQA9#4f3lXH7{1)nFDBXo_~TkReW6XmS1=1bGP
z+FvMUuT)A?h_|dGXDsf|K(_lYjmz+Y(5eRC)Wy)?!ZYm(EvD!AQ1R~Q_O(d00W%;p
z3ihL^2Y0<Z0lvWKa#4HQpWd#!mcqA#;wVpw(FA}AmC(IJdj_`z+cypB?|J7AlCgBK
zF3JT^T@vEnF(HtyM1m<*B7()}kZ2eQfoB#XX}lP$#y#i+O6iX1GIrLJgu)X+h=t1V
zv8-55Yy{+9y;&SGw`^gS3%?g7fTF0R*aM9@3ORK!=3ZXlt;!y)7AlaVLV7n=k4SYM
zOiPf7XcS7_=h_}&N{&V82|~gMB_pFrGFM6ykJsF3+WAuLG-nk+8Ywz(y7~^KsdMK5
z4KH$KClE*C!RB54DT<3g8zms@-H%^HdYr!(gMnSZA)}D9g_3{CCvR=67bQ|ZT5T3s
z<UH?4!7LfYiccfyF69S*bo9JeBGI3clEtOeNw08~Z)IVEj$;qjwd9+roi(=8SSGyz
zqDS0ya{|AJ;_H}~?0#n9V+N@`6V*D!EEFQo>dM$DROwRbJ1?&q!_Y>gyLdsDeZMFg
zOR9L4q*-0+`}gbq?XO;+Q8ueH6McC2Jbs+F{u-ZbK!SxmR^E)2O(nwjgjN_-N?r@C
zc(lseU!96v5j6>ARW^w1S*_Wd_GmXx@tJ_NJC|3?h3$hvh!V-fI;b9B%6N&XRf2oA
z%96+zQ>Rxvs^1rSbDz?@Sy=TxMF%BQVROp?n23j1{LL&RSH4rZ)gf))mUMFs6(xL}
zIZp!muBz4IC+twQ#CAE>z5#O!MyrOl#m<#HO=*i=J{Ie{9hCHpEez5v;%wV?msuD!
zw$V;n7*1H2=3G`<rSIWcnBgqVgRbmZr7O)^SoyRc^<;_zmU+6RZN8;P8dH20YTaw;
zm~+`eA8NN|NfGH#>4K0ZEDsoWc!nkS(Jh@Lt=tnjx(wRIL*cGvR^E|07Lg27x|QF&
zl}9AQrP0bC_Y@!7E=#pK<X|0)v-EVZ3`npJoyf4JwTly(>hUboPV1-%>*#swm^Evf
zh)pcc=7_e<QDd7p2b*I)Hpe4vP9)gGr`w#&w>ed2b9%*^NM!cWo`%lboVg|HIU&Np
zk(t_LmN7Zmfqd47d@holl0Z&PC#U6;&zF(cFEo<Vd&wCS<ji^U#h}hTt2SA<u9u<7
zduEwRp^!^HwwEJquO!&!rrYMF+e(j$Nafn*m34`eAo=sQ*Vk;hB6c@$b~mKSg(}^b
zhPxz4cEyo)cM`hq=-b_KwJRy>&hvpfsMwZIbSGqWsCSCEtbu)kwy-sNAUyMMPFt06
z&ug-MMS^`@y2ZZHbX;9}C9cQRr{{jJ$Rk(#zzO@_*`7L_L+gA?{Tlu8t@MW8cHL1C
zURio&Z?|b=uXwye$An0iwnN{9Lrnyn+RN}wPwyCRZ*%DFk?wKOcI=UJ?2mMO3E%l#
zzlR?u;xZ3uoUq&ntbOxEMuOTWavayECemLeIL>JI*M%qVo9HXXIvhyvlSQ{b3w=7>
zYxyDB=^5MUO|R2}@ts;r>r`t0f%*PV6E@z`&mV#33l96g;gr4_!&gL}Kk;$;(rDF`
zv)|HZ|61?<X^H1Q%B;E*91<JbL)M<(MDu%x_ro12g*SRD-`a%cbhOX+`6p9S*%U+*
zMZ{`Tw`JcMZAa=`e&`Bix|brU<9yVxosH`nwQT>G{8XmaQ7XfEbHTtw?o(O5ox*Kr
z#YtzSU{SA$?kx+>TNPahIxfm4E-H>Ls=h92Q7+pOUDPvNGzwfa%U!gZT(tXKbS7PN
z7hJagaUqHx*r9kpPv^i+lLPvW2iAA_9@rgqU{B%!gNy@)1qb$)A24b<VBB}WWb%ON
z!hwB%4v<7$%@keDbzCh>TrC}4t$barqg-tgUC9})wgs+s<*xQkt`2>!j+3rV3$FYB
zxKcz9Ix8M@(K&d)<e;nL!GpdB-J%Y<Cm!_3IOth$(5w8Qchf<izJtD#2mKZf9{O{T
zD(dF1=oX;k7HHxY<meXc>vlNGEhNz`G{Y^dz%9JoEuzUSvd=AQ(k*(yE#{9KP1HSB
z(fx>y`%x43I7jzmzV64P+)pIB$7i^oEO0+n?tZ$-J)zG%ane0$!Tro1ce<ztL(zk&
z<H0iVNOtr%>+5kY$|EJwBQ?V#t-xdbe7VPkCXe(!kBmu=%mt5&e>~Wto>_{X939VW
z6VDt+&r80Zm!mwdBzop%c;*#&UM=^$*5sMr=UFi6S-9YN{f{SC)a!<#SCNj_O%tzM
zj$XHYy^5o}?j(AZWO&^z@VZy-RodiL*5_3|=~c1db^ni7rKtA<Meiyd?`jk88b|M1
zU+;%e-j5Q!>oUCS3%nnfdp9(BH}-iqO?o#kct82$%@g%$QS@om@o6*hX?OJL@b!5b
z<?}4jr!&K+tH7tb+^46>r?=0iZ_=lK!RPrOAHJyXfTHi9j_;6(@35oq3t!)nDBqWf
zzM~nwV+FqB<-V_)d?)&RCntTU7JS!V|M3-w`b{hP&FJ{OG4Xrr==aXo?|qctheW^G
z48M;Beskr1pPKyU`}`Ir{T3JeKL7Ds5<Rr6c<77Hp|2)~RvZs~^F8!E>d=qGL#r8w
zeij`1RetDq)1kG#Lw_a@{arY;{^t-7qe7IZP+cm_lnQsEBK)YxXeug+iq52B3aLUB
zRN-c-NIz9{iYm5975_`ciup?@`Ah2hOPTshJNe7_`O8N8Z%Xo)%k<w|=r3R4uh8s|
z>-Sfj@>g2)-}2WVFBY&>DS)6GpllkT;uN6j7oZj$uq`P-Ju^U~FhH{+K&v@GyFWl@
zDnNHJVEf+yqFCS#r9eI1z@4Un>-tWCyZi!oM+fdn3N*+JG%O6<TM=l~9BAAhXfhRO
zx)`|cZy-r5$V@57TsO$VG|18^$jUFsIy%TEDTtgIWLp?yR}p029OTd+<Tw@Nv>3Gi
zZxBT+c%yf^=msA!4R&=3KIj+h79H%K6zq{1>{%G>RT1pn9PHB{>^l|gw-|irZ!lHt
zu)osb0NulZriX)^4hQ=kJ{)~GB<XNy=Haly!{HT&BbpCK_8*R#Ivl-tIOgwRnpjAz
zQpgeAkfWv{aZVw}{6daLhnz?XiO&o<Sr~GvBII;)NJ4)|;#5e|V#t}lA#|}&hEga~
zH<V=>n(P#M)-Uv2bZAOaXliC?XIf$C`HIjB&7tZ2p&3)5nTw$p|Aw-~!m^aYIJ#lk
zreQfwVVC^EE=Px5Neau&49hDFyIK);tvM{eKdfLXtZ*^x`rk0FSojU4@FLyto2KEn
zoWgJWg%?MM-$@ED$qc_+7=EuJytFyItUtVbD!gJb{QlqYO0kFsN)c7M5!I#<HBJ$=
zei09&BOWD1)MZB07e+j;h}bxWZ|sj~nu=&%jCk@lf+rT)q7>Px8`)+W+3pnC;TQQd
zI`UakWM^h%S7Bs#<~04kaGTA4$89MaCyW2D6rimC5}?li5uk4WCjvC+KLRxD|GEHW
z{Z9(ePya&!`ssftK)+27|3`qn`acq&3;z+I-~Sb$8}0W0mh>;~{1<ori#z|to&Vy_
ze{tu(xbt7!`7iGL7kB=PJO9O<|Np_AKPAR;(~rsDJ+W*Aj$BmqyeKgk0;)9smRyL}
zWNTU9?eM?`D@!H@W9_+qoX7V{8R(r@_-THLRO~&mvzcY5N{d=-td`)II_yb+vZbKh
zc-CRm>lT-h0Z>$8F#7vXbk<V-02JfIE3*Z=**t_9F|+P*d6t<|)!c<gM~&W9!*?zr
zwTJfXs6>T$(1Yordk?^a+AB<WWGgKE7`tNP>iz7kNQswdTMGPcHrAI7XVT4;DOwqW
zh@o@P%3=4r)kLU2V)++D{1f~^0OE#C?61cU(w*T?RD#a&Y|)S%OuDu*8}&{Zqdsa4
z(Xvu_VN|F5VC_p)02_XOy>ed|-VE1JeIW~GMMw7xK?_{AL0?@{^VYg~<$~D~Omb$Y
zzCyKBkN@Q%Xv}b_@#$LD^qv;=8V=Uj%DXDcm9>QkJ6i0)U_qTor2#Y#0~YkARdwm0
zX1$fChxenTmKfVg6q}wRaU=F3wNz}m{J2rwiD}fkD&OR5b>|!E(qGkO{;p#y)N_pL
zbG+*>pRQlF{%<h$)_-8^%zuNiZ|XVV@joz@@%SGYTUB5FDyy>eZmxpj{~pFx88!TG
zFqT)kzx9(=y8`~{@2Xz=66vrk7NH5c4n@A$kg->rnuHbqk+JoStgPm_3!Hfcxy9ej
zYMY;YxQ6>`|0M2iQ*Y^$rJg6utS5havOvO<E{H13hx1)n4m$rtcz%;;*%R?dUPl&B
zH4mn2Cl?vsqLS8f?m-JKA$zk!OQ(O%R&7pNY^!pboMw8fN+V8Ut=SrXHTeOYy18{{
zq}=YZR>QT{)gCU+xFu1d?Xy<<X|wjZh<4Kn1+sRrUD+nb`F2DvkA!PK(AeH0(c%BI
z{p5`f?}QGlPls%8hex_X3>6uJFTj-Dxg&ffk=GLGBe(VEQ(4@z;7FW~OTn)QxDLQv
zJR%oE)X?ERTX}^_n12>3B*$2fJdwQCd~V{|nS^H@TSLl^<pkK3FdH@{?(Y07+?bcY
z=~_Ztz+4w6QV#lN?@><oJ>zX+w$Ju=HI?FeHg0BWe0pjkyZkXd4;y<LH%zR9a@|_@
z6XRa7L8yHtJk6)u$n0+WMDNM(kPM$}YZ`JxdyFLXjXK~B`3OVq)7?Lj)_lY+cHdi{
z{*lJM$@y%7cK>_h-WNA}O?R9Fl8C8^R@wY49c=GEHa7ep+_|2wnXlc~Cd@}B@-f={
zqB73ok>}|0=Kr#>ON~<I2cL^CbPllwHf(G~{s3NaaKpw*{TbMHvXM|QsF}!7ne<Zg
zeFCcZT7R+=*RclL?gP90jRuT{=ClU($oFaGv2!|yESm;*EwHJ)ff!1bH5<0wcbFo|
zx5>z|>l=1be6iniXbbO(fudAO+ki(@_NlASm2HnEE)Dw^jC?P<lN{MO%o+(-d`ZI%
z#m$fCfR{%S|KYJ+6EC#=jeh07)V%xRA0B)31+!q3mi~N$$1=)C**e7%zFnD$V;ely
zXW^yJ29FIJ`!60#T^PINICNKXT+Da;-a>YC#&~Jd^ZJsp9Rq}T-|@JKvHJzDOzu9d
zEq~Q4$|a1wx}|unN>R#h?Nw*NM0e9fuSs^0&jdbpqR(V<*mrV7XY{$~q|(;Om!dDC
z*8wa}kZnnv3MF#lh*OpT4Z|V#U@!X-rzqIVq1e|?nh@SJv?Uff={r7FK8b6Y{M|Ho
ziUa|CFg=+qOM*c0Fy+liX#m-{<v)5CzT(Ky!h-`Jv-L<2%o6bb2o>YC5b@Lcw$oel
zA&NBgMr1LD1cxY%{aJV|4-srv8azjYh;U!~*8>qJPAGQzXxhxSpQwOtsM6mYd~{1P
z05TOE^Zu6o{U|K}e)zr_6@98_Dybj+PTUs?<0I8JBh5(&R1(?`5BH>^Rl44&{(Pfi
z%1IziZ%#tTap87cWOx#Kzb@yL0O3bOzAt~1u!tapp}k4)*mV-e+LV)6_#uV=K|Swn
zG#9@4FN#8fhm$z5G`Is7rE(HM;=<qQaO|hvYSe#7p`mUjp~JCLq3l^dF5J>@Hl=XZ
zR16`(o>A_CASmyB3P*MnzT5QR-4ijseFZEwZ6m50vf)OPsp#&C4JZpqAaWuX-;hi>
zj=UK}#Z(G!10@1c0PIKz#SN0fhbRi5DKt2W2++h0nhTiy5NR4Zo(*6$0HwUsOnRFl
zKmx%GVGJUL{U`=Dm?S{rr^DG`q8Uo~2ou={;FNa?#06o&d<uZ!0FdG?y3#rCGZ*Lj
z7m0kJYzR@Mp``#+YD2TG3xHGJ=igJG37e5fA{gw4s9?}A{#1w9yoc`mfX-8kL&JUm
zl<IOch=8uN^jZwK)6k(rptGIx(v%Zz%83O)gFOf6^Zo!3c^^(;k$ROt3=h*IExlIy
ztULx3@SHf_Tiw@yPDRULA<Ff$4HY1~AN5x0<8&r64!d%4%hVnK{Fc6L#iJ7_5DW<&
zPy9~!xM0a$QWSh=`f<Xae~<n=qw(a6&X%v6+22<Rf1G~(<6;unEXXNILd()2wp&J8
zqF1EN<{#Z}&G<Y^NCS8ZN0tYa(;!0B1(W`7V;kXPG}xPh#S{t@PUBQ>`JrOFJlzEC
zTHn8_K%CmV{sY8(12lLF7ls6DDj%T^+c$LXYRDNh9RMx-h93RczaN>x1@KDfLosZM
zm;@A9aY_1$(#PqsM2i$w3RU00;70omj3`|37fc|u1t_Fq$AADU0RrKs>G7Q%^vgSf
z`)_#;y?4wvJhu3@{%ae`*6gg9s@L$W^DWy;y20ba9}ko`-*&p~^<wT|nP+YEyYUxV
zL)T3@GF81t=Ets?g2;3<*S{U9AXb5;(HQBMLqT1hFum=N*dDQ1Dn2{dUI|SQB2+SW
zT(k%T6fnVHlVruc4tr3^E#7&$I9&QCB%Q;;$U%uJ6unCp@lGOOozKuQW1%K_0#R0~
zMJj5WQVwmPh%~{`Sg*yIKOl*;h+mG+9Qk!@eyr#3+W6$}6HC(_7q=anT06Po)D|A{
zdMfdBlb@G0y>g6XbsqZp{p4v12AFsaLg)qoGk8|6WJK6mXtW$)TfiYaRGwahM*29Y
zW2p_m^&C-{?R(#fJ^Gvd8LRY5ip-W~7|iPDi=~s#!Qqdg;EiRwqq&f>=5(_KF~^CE
zF^K<6R>^*w*06Fl?u)JZ&7324nx*hhFxBeeBlZj=b{W5QqKK8LEXIHW*(I`s-XE7#
zWl}O2C1hr-k^szj5tyf1%&60$`YUxsqKqJ-z;S&TJ~Pc1MHImRPJE6>C&C#s_Oi06
ztjttx^j)=0vRqgOMq2QOZJU?Mf<YlW=+IqN9#p19V;$o_Q=CC3Lj;~yt7ai#f&tr8
zi9GxCIBoPnJDsLbVGu`|0nl{g*#V{c;p5)(xiw$BX>Bqme2(-e#+XD89Xz33OT9ow
z!SGhxS_OQ^gI#~{RzxSVlobm?R$SH5L*W&9z9x9OD}&_%r%$u&G_f0N9|InX<x}}X
zkI`=&tCj)50+_k@Gz>--?$k+#<1^?(MCo&J8;!J{xf{5ZXiT3KhgkYUa||+}!T!p(
zW-f^DNPYoHHi*Qd<>@rv^?RicyS$H9kDQ9AX!tH~5?3yJI+8(>BcTk$&%YUFp<{2p
zFPx<s5ljrCK8iKBLxTdY8FRm>nF?f6#hdSU+*CCmH!xP)GgyK7oI1<<QQYL+8hC{9
zu#!%1?fUNHTlPdYF>cU)&!10~``i<~&DEf!j2Goc+b&20wDNbAT|mHm75l@ahrj<n
zxN}c)!|)mRzb3oh`xS2c50?G#>TB!bT=i$!k~a-M{+?cHyP|S(p=Zx}!pe~QmOFxu
z6YGhqZ|-o`zI}SMp0xJ$^~1!UzkjTs0pVwpe%Wu4k*)*?x&V*&0MN<X6=;1nWb{oM
zO8t_qFp(Gg*O0poZB~(0C(!|WD_mTg$Pmj<6;sV6AzbJv^;NEO3WX^S-^NDcsj!pE
zg1OaABs|hN)dIKW@~QZJs?q`gQh8=X8XXF_4xj8c!p3MN*YJQW5z7O}hdKy3Iuo_b
zfLsoRRMDsaMxvWZ?*`C~VK>o>0134?i?p1>##O!%Q66Nd%Hy4FRwl&L;>nh3U*cgZ
zw|+h(($%b!4<5MXC1<oP8y2~YKeZ|+*FnzSdBa&-wNma|`0e)HOD)34j{s<MQ;gJa
zh@MR77XnnU&$=B;#FHSWUXmYdcFAf}IlQCxDVZAnNgPKZL1igWGcFA(vSdDNuznkb
z)!%@;6v0-d&0Q>qK{X~Y+bIJi2qY3li45S>Jw+lac*tYPPQ~5$=V)~^%$zhCLtyW*
zw{90zppsyC`tH3!M;tgT2po@v=;w$+pA19bA~P@~o(H{fq07{r3&hm7LWI^}MpBiG
znx6nFTt~PwL4kyb>E%dlwSd3<NT29z7u}eC#Gk_-u;T4PZb5h;`lX)FV+Qm~ByW@W
zRv1JZpV#uXa7X#6gJn$NyaO*J5!#o*&c9pzz6*iOCHio@?Tc&d$TWk9R!taPMhy>0
zo^Or;v)LQLUN~@ec4HXF;~_9E5ILg8Mq){-Dd-YXD|Y*O;W-s(gfvecCP0de#sW`l
zC!L^?>M(Z$4kZHW3wbG7Ic+~UHc&~q6rgXU161for;QjEBflGg6~?I^V+Nzq-N_Yl
zuiieuQL3^<xIih_E5L$@98cW=fnc>E@8z=KtDI6-sl#qfzkQdIf=gdHN_ylG*~HWr
zIyL?+V7K6|5P*szDWCSd(zLp!P6g~8?F+MWm-l%{2q}&FmZN!<LJ9ZwyAtOq3KV+B
z?#mCL>X5COSV{RH?v>4*!0wV7qpu?MPJ*p7a+Ww_L8OA>NZatq)Am9lq(EV8@>c1m
zP<5XjMgF(i-~<F5tVI=9On=;UQceniUFT+}aG^nFyd7A}Wl$0Z_KWkowK5?cXHr8g
z(Z;S{j+8b`s~*kkD^pTFm*=g3=0*7fwEOfCAVgo362)?Vj$A3{w8uEwRa(Pu30&hY
z^=xgNgCQpLvfYg>)r4PC+s!@j83msq@FUaaA$n?3=-9EfBdPQEHug^jAnK-!JeZ*8
zI4RICE}L5bV_xaX+Z|DT@n!OPX^*tb?^#6@b?kVm23s!TnKg3*py(Uj+D!zHkAMi%
z-=+3#{L0nZUGH~>c)uD`x?ell2AeRQZx`jY0Zrg5oa2V~Q>PcUXkZ_WB%_5>H$j(3
z?x%L+0Yz>eid*`uc9?T>UD8lHP_@rPd+wBeiX5eQm+dX5&sldY<w%Jx`t&pFr`Zxa
zBBjV5&x*Jvm@5jCU@NByHd{&|n_s_VBZ^SsIBwqv2jkIz%hp<2DF|+ex`cXrg*dh0
zWVz+_-YyM-Q{MKYQ^$u2GG9b%DH<j4qsqMwYah9$FnJpZ-{SRt@wbbM+PP4uxhy+8
z!KN4>S6LSk+4UB0C3+J|uAt?_=&U`vpY1vVixLubdsvw<lrMU(B~AeeRiOvQ8C21L
zAU5D^KCdV;7zMs7JU*XwyM9M|nvW9F31f~nZn{B|Tsv+PD>AJ0{#Dw|C}51!67g?@
z9um2cOgOp&C|p@T#mW5}CqS*Uoj;p+&Ef$flIj8vJu>p#gdPtCWsj0am3Jgfwvb;#
zR?^e((2bou-whMzNP=hH-r4TGrw~Duf}r_82rq!T)&(dnD@{Z61rTq3+XFeQ4JZK&
zN-k0W%m|#6*ljOU30#+4#4JF|fhnoffA;-7^={R4ts^iOJ-TIs>Rt*{Yn(1@KyT&m
zO3xNXG3a8WIQwfDjk@xy493QwAj>Dg0Q?`F?g61cpliaC_o3OuFOc+4bP<n+yBNtq
zEmOf=&FKr~8m=lcM_a1|FtovCEg=Z0#K4%Xtd9m_XqJN>P?7@>I@@OE?z+w#7?G!M
z9k`9*o5R=_davp5b1(1Gqer_yn`hcA$d90@K*n1eDbT<eV+!r)J9~HS;osMqD~L0?
zeDNfJcFLOO(xG%^)Tm+R>BftJJM~wYEdk0Jscdb1x=1C#sUD(ZOn2{jU{$jjF>2{@
z8lOkW6`~3U-VohgR47cOSKX^iKFMbBw`+1AncPy@Ljn+ziIy?v^)>VGvZtT#wuY(*
zo6%sq)SEg&VKF#i^Hi9AuKZ&T<bwp-g2tj=U_Gk8OwCT)7iwI4<5@nRwcEqIkj8o%
zk-r$h^5I}iLt&>QF?&a~umWK-G)oK5>S}>)uVdPuPuqtluO~2={@FJpS4`AvtS_#S
zms_4@=wGi<u>H=5iKK2?Y|BK}5%|Qe@443OeA}xN@>$7Ua}v-)ZMF-mEJJ_s?Q*c*
z>8^RU?U6KwO^NO8mCkD_8@SW1#9`A-=_@LDh6*<McCVdAWOvED-Tk%hqIvS*NtO!V
zu3EbJA3O`}A4b|gioEy_o|RMDMrLvG$-1QE>WQA6-v21tM<Na_xZZ-)4MoeGZh`FM
zbt}au;{^7dBKPa`p{->OJ&nCMO3$<{Q*IV&r4F^t-FWt=uPi+II_T|jaD1`WUAIQJ
zCKi&>P+PX+V3}j!`5xI>){6<psrD{ee((C52T)?A{VVN$|1UkVq`oO1r}s4vNAm3l
z(~^tg9p98W1%$(&tO4az=AK#D=QXD#k^RfK{a>{Ae>L8}vVl8&_J5Du|07}lYWn`4
z`TKvB?f>2Q5AOUk@q8H$Q(nc);tKYnDK|nP29-|mgSST3FvuthDv^TDpkN9pLgf_U
z4cysB5uK!nEl|Y&P_UxT5{k|nxKql+S-O_Lhgbk9=!YjdTZaFy-d3T>8Q1q8+_~Vq
zAv>j4F;c6}TSNypye;9s;m&Qr6qU1s3cCg+xc`Ma2X!vF=+wICiVkh@g|>@q+EKzH
zV3XGgB{192WL<TpD$kBw$yB02&E)ud(NJAB+?)p8Moi{nlXt!t;*yfLk(ngAvz2P!
zNILXEXRr7Y>}q?zIJv(n-idw7)m~ND;l)FF#~u}RC^?sbFJWyq;47h_`=~5Z2~0AV
zv4_GirX}x9WtgCa+|M4A8HJHUAzE~pBt6+m(XDxfb-fc(NO!d@w{<+``e1h0!OAIQ
z0TbHyP>Bp9sxwKe5Cal}I}0%&CW~X;e5@ERMVK;|l5uqhZA)NB3;Onyu*B6_`k@SC
zyj#L9`@laSs1FnTqFZ-0E$jt`tTS{~WK>+v<IEon>zk_?fbGC0Z>eOiSBW?pV3T8I
z&dXj(CQw;i4|kul{h7fmSu!jeF`VG&c{?)sbuVPHChg3Nmw}UMxxU?r3op-R4Bz?0
zNXhVswzAXWJ4jVR{S%Wj7Dg`yzq}a?v&2J4R`5Aj&%1rYuY3EhcJ?ZHj8w0%?rjLs
zKbZ19yNYtx`%PYzh~_O=*XxPNn^);7WN7<aFG(UJUS=$=4<fnBI9}^*ONOarKumMJ
zTK;relkH10(!wY0FP9J3-b(u*;$7}DAsaf87w>b?!LBHE{4Q^zWnm(G*!A5;gv~p9
zez^}&>>Iq4Ht@}7Bx+L6e$v9jckq&1yNT~$<jD9X`<ENIQ?+`1@X}<b<tXFN^EQ2_
z=?wHt)acX(?$l9BKI;nI)ju--@~Te%N14>QsDE%L!Q7)Dap2mYzR$J&OD5in8@Llu
zROjF>=j&6SJTVvdy3FxExN}l|K9b?z_xksLaHr;gkChA+{EIvPABa2G|G$7cD<XTE
zBYXQJ`=%oM7bBnljpU0(4Jbto>P8KjMh!bfz3__~iH>@i6g8R|HC7lkUJ>=GIclOm
zYH})SeQGi4_1`FgSoE|~^o(xw8`J2wPSNlDqTfeHe@Kd+&5Zt77(G`J{i!*6zCU_l
zDtd7-`t#rDC9#-grI;_eF<(t%R-9tK`Ne#Xj`@)kvzi(6voPjYMa=K!n6>_xKT|P(
z7h~4{#sF~|WD5<tod(-SgYTyy4$+V?{|kHf-PL5`_xt`zB?&E5>4YAtp?3(?&@|En
zRE#1DVxbENdL;y<DWOVH2t}l+p$Y;DB1%)R4p<Ns70U>SI*29b0@QJwnftzfXYI50
zS!?eHz#l9i3CZXE`iAlx2*qTCVoO4CXF_=|gz^oC@;?j}m<|=>hT;Xogyh47SB8mL
zhl#EU6WbIfz9($OfiQ`TFv*fIsWV~H7s6zQ!(<<Z$xVmJbHfON;R^EMiYvpFtizSp
zgsW@{SKSk?b|9RX5w2bmu5l(@^Fp}RaJcrvaGmM!mE3TWV1%xGgx<;suD*4I!I}ue
zO%X<WB8(42m}EqlmPDAHi7>wqVKE$G`7pw2I>MS8K^Ba(k&m=p8EI!7X}>1YVN;~z
zp2$@PA}JY>P9>4fXCk4`NL+^_-5y4+o{n6@jid@jt(A{*Um4|L9p$+u%4<`U_nxSA
z2cmp3qI^rD{LVzJzYw)yIBMg=DF5lGP24D&VDx7B=q)Rw1FWOBu89uZ6uoUv^!5YM
zK^f7(CDA+1M2B36-Z>n->tXcn>F7P&=upAEVe)&!SMH6l-W$1QZ`7u}(R=ppJ+L<>
zV{dH9-ncV+_g&Z<KfE{L;okkzdk=8;f`T!0`54B^m_+Ls=9-wKO)&@e#2h*h6PKJ3
zlTs3sdL}0ALQMK_%;ASIN2X&kxG^lj*i8A@td+6Z*0DKjVskge=Ix0+dLTAGBetL<
zw(v}B(S_J!!?DL7#uiV<mT+U)f^nttab+vx%B|xn*2JCI6j!+??&N{Es*JemlDL{P
zakUrX>W1S^J&Zd&9e0Lj9{PuL+1fnyr?vV2=Q*<3FCgvp1iRl8bbpw%Z|KH16J6dg
zEtX~4H;2f}IPG+b{f~9>^kL_piCSo#JeITd?$O}cqkca&%CiL<?;nqtJs$9PtM+Ya
z$TC+ucOvYESUXo0y@=LUC(hNx{#Y$PU2<#RH6$(5weMTfe%5Q>w`ME@wjbKFe;BqO
z&gVmn?W^t+kYxMvQtcnT<&b0x?U>*7*ZnNn&R;#VjM>f)H!OR$AFsE(x^)R6Z9m>>
zUsi2D{?-M-wsT`w7RD}qw{5R~oVfPOvKfMHKfio1|LO^3+kTmOzVLQw-2CzX=y5YN
zNA~@{*6h#LteryP&(>`5cWZY3n>9;avStgvS+hcaw`R-m|Ft!1`(InLU%y+k4x+H$
zzge@|e_FFG{eQD&y}L)$N^(4%R3vt}r)Vf1cXujBA7)VGN^`aje79!7WU^~KK8akk
zXwB9D+}3_dCD1wmS+gU_6mZd+^;)uKyJu~Lu*cm|GT*FO17}_%#kY&rY|g-UYnF)t
zT|9qSvn@YcvvOV_WX)D%!h0LedY3sW1%g7(@;g}YRbsoSHK|gNHG4%Z$WusLv%*u0
zqO@btnoaP$e+9B;d9R$RV=~a9>qKoAt=SDpQjj%^mw42`z~HnivQnjDcf!#t3Kp%|
znni22plaEg#Vczby{@j@_LZckSyWZOQv-gy%uycnT(V|=bCfS9A$g>-m#o<@1ezRV
z%}xl{vAGHps!P_aEeEn@YgtRytZV8wYu5HBYt~rvyETiDVDY`fE?cwJd{_dZt_red
z>n3LCgt{ebw&G&aRNbOAdmMvt{MnkVTC`@daH2A|fbFbmG>IQrv}V~-K^(}MJ-%$s
zQXPm()+}q;n$_u_F8XH87TDsyTeH=0VPL>c>1S&eg>7#J#lBgyjz6qfLxr3fk)#@X
zB79xaYUU4XR;B8jHOnLr<bJVcw>oG5VW{uctmjYG?3Gk;U0yzy8vE0AS5kknX1y)e
z@-JGmXCQ0Vlfj$w2~=OQX31iU*6hHdHGA#5HEZybHCz1`Yc>h8W?TPe&1PYe{<LPt
z)EBMU28O_YZ_TD%95aFuY`$Bw>M2XsYyfJ>n*I8dHJkavn)P0^X44pdTC*@sIaQ2T
z&OckTWHG70JE~IwsXwe)4EAI~89%T9S+g|<|6<LG3VpX`YanYD*NfR1iVKjXh(Xq@
zkb!fm-kT$0->q5BH*0n-<-0Yz>Q8IdI1{&M&DIj+B@X7`maN%8)Uq|3EtdO>HJg)a
zCGip$zN1^?7i+fWCu_ED*_xHIS+Zu=E?Kj1V%1-)*;1;Vq}if1dq;Fv6=cmer2fU4
z1%!UFX5T{AEP2_QJ^dGJR&mLi6;)ocX0yc-{<LQ67Oh$MA?r*UcG;RWHv9)`wkJt`
z(V9(OvSz)TAZwNZS+n7|C2O`6A^MXw>-ycArD*(W%{qyFvu25l)~q!tNoqfbxhC?T
zt=TD_!9;`zlY>+vD2lFKwq{KrYt|OBW?g?+vqFwA)S@-Z==-ZROG{m}W*L84v#vj^
zSzPR2tXZ*Ntl9iBp+##}n*OiWtcs}Dc%R0SHR~q!7i*R(FQLZ#X3Z-7vo-4tS+kSB
zShHA^3^YeJ`MWiXFHN=hX3cg%)@*~K$ZA5jV5%w;k-2QmLUj3(H5-6}tXaJMcWd_L
zk~LesY|VN#(XijFS$Q@=6kN1so3KBuS<fYFmiBjRHj$2u<*X+{)~wBvHCrI{&6@T4
z*_vG^{oR@cFKT?VW_K-HvrZenS+i;>%hs$v@w+v<0mUVheY0lQFI%&X|7y)DB7>H!
z*`V*%Z0?dZdlIr{kyyx@T?g=F{neWFTDE3mP`_HU1Z>@3t=W@oCu@+g?k8)u7P4jm
z^q<yjBr5W|HCy}Ln$2CZW|Nn!**ZKi^k-`}9Jg%EhW=#DT7#IsShIA@Pu6TXPW;0+
zYc~1s)~q6C*_y5RZq3FnTeBB&%hv3U|A{qQiu;eO+1!7(X4#N6tB-|WM6w}kRu2nV
zvwi^XD+UKyv%3J?H)|G-`-?R@hCcCMTeE)4)@&(S42w%)<)jd@ia1!vn$7+vYu0ti
znhj-Tc`aMB)&F44T0qvUFV6ahHTwd)DVRsGAG?}`p>!c(NYp_p(hIU?`*}jUuqhn#
z6c(1<#pBwA@cPA?h1|iB0yYbKD-mr<MM2hV0HG+G2KU6G5|*slT^y_uhz5VLX0bTP
zn)QOLSuBQ4Lc2oN><g6jPu6VIe`C#JQPd@C)^9@P*pf91QgNk!w`SEbs#Kn1)Rj@o
z)@%Vbmy>gh29N)nHCqf>vnl9BYj$GMnq3`Q!k$3Ip-?G*w`Se3KdjkfBNc287P4k@
zf3ju^ezs<DxNp|%?00Jxi}7EwX8j2S5VB^KaLd+g*+fPeWX;|{mqFGn0k>q${*UL#
zYnSK9LO6XYlJ(a)vP&omnj;@3V5lI5*5w$xI7jB$qKHX&kNr@9tA*ysWjL>{Ix1jP
z1EL*%nIns!^a0G`92vkubL2>9j@-C7N4D;wxKNSF%X4HHkI;4;m9scU-T|PBmgmT2
z=s)MkF!bUac|EEgj{Y`Bu3wxZmn_YZi=a932<B-I?w2`oD1a)5=E$+%=g2O2+%I!v
z2Lkfn=E!w_n<IOXYeWBOj!XrxHA{2k>K}9Dwb=i5jtnk4z5g^vuKRy6M+R{JGDp7g
zzip1}3eAy)Q2(pu$RL#m{60s{{`(wx5UI_^L33nqd5&z3{r`N9ycUo8WsdAh<N0%r
z%tkNHk+B$8Hu_)Z$YuY*965Vrk?Q^DIkGAC-{#2K|MeVsSJ!orn(6vKn<HocM{{I2
z=Eoe_?|<JMnGVg74^3n{k;Y?4S%*mDP9PTXdU1{%LK^qQ=fyyC<OK9~0OvIEmpO6<
z`LA>27fW+wJSO7fe>X=4a9YqDne~@Ba>-9~<e23-axnJC9QpW<IkFD+ALht2JgP6y
zt42^f0=SS+<klJNk2!J{G)ES|9hyO|;qdGbz(I553=TR3&$Bp3K95%Xh~3UYGJnjG
z*-LX|`V3NXH`bSh+(*u0jvzf|Fv^l>`<XxI$ZR&ITmZKZKOV!H3YqynM=t)CIr8~G
z=g7xru*-AgtnYJV&!sssd*s_3dCkb5b7c0&w>dI2@m-uF1Gw~`=E!V3=I?XleamxX
zN#xISWcK$t^2T50$N=tdbL1D_=g2A8U*^amf1M+525>Py&5@zG`0^YX5`>{Sa>m3z
z%#jZ*&5`qGuz${xb+AiwWS&Fc=g1+@9GQd7g67C0*z~12veW-$jx2!tkLJki|7wmr
zf@E|4I!6}7<wJAi(4{%DH4ppy9GOjyg0mdhWQ!kjWcJb=8CiwpH=;Kn3F*p!be8fM
z0C)-mVbB~IGw@GyWbglIj%@R{IdTkuEL@%=lb7bmgU}p#H#A2M6QqVM&XG&Am*>bc
zPT%Ip(3&iJagIE%ObuT_P5*O_jOd==S4#OG&5=)4Yy+3)$S-d1<*$A4W#9bt`_sXa
zu#4LeV(Pe#qP^4IYCufI30Z)ktSX?FtX`kzO`JFgBf$bi00v9FG4FmAKj07~>_)g5
z&7M)DiiT;D7sxLjS<{VtGm{fn_o#O#Z>5mgB!G0p{ywpZR3`iu;b8XySqLW1XF=9%
zaqIeNC*m1Jl|$les*1DL;v8A0d}oFesYf&d5EeAMc*;&77@ngA(CC?B3Qty|Y|-`@
zP#-f!5k`_|_CktBfFu^2*!3inOZtkZpb;<a-Pm$czf;+Ez{o6HfG;#4TWetJW|*x&
zN*{x@BYZR6ZYG}$b0YUg;%rSwco76~G%+2e3IraOw!a;6C{d=5mc2e?%dP9#fR7Ru
z(RV5N3S-0VoSSLa0NNon0RqsUsPSd3YiLi@aKFyrQ@vEHA+Nm~A#3(%?#kZWz2gnH
z7}{mBd>m2wo!uPID|hA_J-f}d6GR2kT2T{c`(!wg;68bJmpe+pPY6sE)ObOjbcRm=
zf&$@>9u6XR==T;lqR9ZCD9S;YPfMF%Y%I(%fUkX!KY9Z@3RmH~3;2|(rl_M)*(unV
z$0j&-(kYP)8}w5Vt}l<tV-B4VM7E7<|6ryT{!r{wyM!%vNA_x_-igD`m!m)JYJK9Z
zF@EM%i@72mJ=%RO5fl8Ly&68-cGB+aktw0I>)n|v>q(DBRRtqEowB-7S(CH7C4;N8
ztqn5N@#jPQEXwTQ=lf^#By=~j^|c7VTzkMDW;@$Ljyj96&1@<#HcSo0T$$5N36M2=
zC2RLs_R+K1DZr@R$5(J)B@{GPEOz1tTDulrwXevIe$r!HgOZlotdcRF*g(%E-Vk4$
zBVWM9PQO|cF4*(?w9`SjnTg$j`8tI#K$#ugrFLPybPds(mXwR1Cu1C0#CMuBly-~_
z-!^LE7HE!)O!*C~prs&6BRI&7P|<>w)TBq{6X=cewi1`A2OALsxJS^TvS-voVIhzB
z3`bEYEi#N?g29LrF73On3179f3y6ITbGteS=flW?j4DtsMTHkn0JfT4NAS9`5$b04
zSXC-rl%&XOlP^jv#xn=7%5cmm@FYH_Q{W9XW8Y+eeB+HCbN?AE$^@c-L-BkvYyj}_
z_)QoDVFoW%F?e@-84_?X#RY~AeQd*^fwq32mW)Ifgut^>_@U1=ySmsoC*W>mDeNe`
zSAjNmIXRNeLdSR#vX8E^&RQjQ@#X+2G1hhKeiZ9`(}W~Cv@f}@Ce#0(^6RbKaL`$9
zQiym{SuOa6>e|#3Ncm3>Ph&pvIMsC%WC0K*SDLK$d2`;dFAU%V2b1IBXe1H%BR|%d
zrg~GeD5x7V!O10h+OT;8r#$mMt_k&JAaIl}xHAW<yBdUrj1*SM!5Gle7;cYD(l3q0
z2jAT)LSR?H30X*tMK=NqcFj5G(2>f34}9$<bhs2<%|f9Pu5N>rSa&rUxdp)&1Ry^|
zV|G?nN0LAQsR%+FMF9TwKD2liMlLR%i_=o5i;HIq1(<!)C1@E0JCB0Fd6O%u;A`or
zAB2wy71$xeUqXv#WjvY$%HGSVPh{-~T3kHWZExi6Lo?u}yU40Gi<4)d3^=vfuHPdm
zQ9L`pSY=nR+C2U0-NSHs7l5c;dgcI%yeb{6J8!W5#`YHF6NZ_&Fh5=qJV0()FzZs4
z+pO;_&}Dmw3`IvQ5Jm;iwjvY+hAm7bcoBAwtk`TPOn1kzb6^-Gnq~^<VJgTY_mM{O
zYvC{ncH7y*SYElxmGIE;ym2p(xy2Dg+=}8LD1cTEtsz=&vbmC};}j@-pB3EbD-b&7
zv^dEOy?Rce8?noz00b<K0;kd`@P&fAXHd7A*1=9uJ?ZFitcoBNw4Da7CmUht0yR|^
z)q;+tdU=-Ok}<f91imCsB=>}%!Rp^qkJnu}R2JiO>i9+S{TaWrBL^W|7^v0&u@({&
zEvmP*m3EbZF!D2zJG`gYYr*=pV#xd270JCC)Eb+p&F9i~kzt(L2d{B#<nbU|N)QXS
ze;WZ2db|)ha!>K%+dv0N6Z;CAZV;B!sPf@ygQYqN%+#idl;lhBHsGD=cE81ow2BG=
zgtpFe2RU-h0j{ECU^k<T_W{bLpUmk)uq$CqOTb)7lE-B|yjCc4Zp#Uam15?Sq8`Cv
z)I2KE{t_Vkx(G&KhoZbayO9qa-|}oBAChO|g<QyXRQJuhBg<L5x_x$H?3u0c&q)Kr
zM~2aGGEIWU@aFy@1H#RYQ4oB@p@3_<46bg-7S0idsRwz5K82^=M%%zXT-v5=Lw6hc
zz3tq7@#N^9cz`at@OU)6A1Qa->jHT3(mrxOAb_6;NkRk063=g=yLNQ63PF3>-&cFd
z(x^tS9Ctd0rV(D<E`;Xl_5I*^Vkq8-RtT(;FxsdzcGpgM2*^F0ashLBPng5Krh`;?
zvt61wY4Q;djnvCy)r~U*+i|uu2Q}R6n_WFNrFDQ^yDu!p8zZ-OS7J}++?N=^H`2dP
zzp$a}dcQ!Ewg6&N9Mq&H%TN@2q$bw4J0y#Vn&O3}W8SQm#)Deqy)Xgx7lnE!?-Z(W
zyYeviv~q!!6je0n>6pQd!4RiWWxfe3O)22_;D>|Bu19fCHrSzaHYsGI*s!40LVZQI
zf#)Jxci^#19)X!XyZbAe2ah;OU_x%z3CE10-VUmYZB7wJ#>{D#7ALB4JFhW1px3vu
z0Q@X(>e_k0q%YATi0KHe3R~fwyr+6<OE2@LUW_p2Wis3(=xj3LiU?UKT^>5c@`}Yo
z+!HI>oHul@<666^D+^g9*{N5gS}>2)ASa_n+wP>L!%2V(&9Iv$OU+l=o{c;pM4vza
z<2O%xv}cmphtoo|Tjr&Yx}3Qbmyd`*z$svsDbr6x0LZrrthX}dRf~QJGCv;XPCQmV
zH*k0jC37|cv3889M5r?nPBxdebyk-w7;L&y-Bhm+I0lIuk5-T-($>T<d>bnO&`M;h
zaPyoN)dwjr!SG_G?g&T{ryTX1XP)Cl+027Pj4>|$EW4F_QQyMTwIlo$({Uce%h>oC
z6bq+cYBWK@s33ozD15Y8e6j=9r49sX?;DWVzQambI(<tdcsw=54Fe)$l7W4U31<)!
zlvn!bqEJsYoF)P%fN1DNXe+3bT;aRrqO~-Ljsf*!nA<jkUT_eHPfiJj&TptFb>|m`
zA9k><OYsE-pl1=#p3bs**=Y60CsXKwku0Hx7&X~v##BqL;PSVE2qIr)h*cYi$4mjg
z*|Zgm!r^n05)uF(jegJoaHRpL8BmNO!7E|p%3;FBDhNU61^Phw$wGy0yA6EVPVcl<
z&BNVDC^s3HC`p>J114rdB+i49&;_2mm%N#Y?#dm4WV%=DfO`i#qMcD!=g=Tiyq?dw
zfrW&=Hwq5sO0{yNsaQZ;@leE0J!qE<z*zY0ignH}!Ov2lV*g1j%>|l@8zD&}eR=MB
zKvo=MGTfCq(*aGzU3+xUggS-=_M$V`vEdw<+(>yWHyk3K15L%}#hsw3I8}uQyf7tg
z_j1nIf`*vVJE5J=YKErbpz_)_7`Md&WSci%`z(nHaw~FCEXZHnif=3B_gE<5B>`jZ
zRw*g0L~^4JrStN!N;0$+pRjB4%qrbU)M{m(B0HB-8tN#hKenQxHC;Z|9dDEwt{-KR
zM-weJq+5>;*H0mByAY?bI+A_z^m!&Z-^><&Y<GcK0f$L?U4*%svT7btGMPfg*p1LH
zTX(4yu$b2QBY7ssNjU8MDAE{{XiAcG^hqRfD)Tu^Jb%7cm6><L8Yez-pC(EPFU?qh
zNq50M99yF(TeNU#E$>Sk<%En?T|h#t<Le-h0za&hl<{^0(R2iH_65?N=)Tg>{Z@_p
zHZypYh{qosrbSo=*DyKpwyp=_#@Z(-bOjYbCF=0XPLBo)cjF~%R*E4{B)|l;1fA#M
z7M8dCZh2TQTC=zQXm#H^+cF0|&yzh}#Jc3?0dnY)HR~lzo(IrzB^rH+>?x!nspt(U
zNv_j#UGG`wH^OM%bJ3cW<<*`C3_*FBDyADPNgj}!9!WHh@e0^jPYq<OU$kcLB=^DG
zP`4zgiEDk}-VzyaNDOxq@7?d~&SiUThpgGBx2RtL^Q00lBHWw$+Zi@eYsxz&u!_2i
z?j*5j&Fb%>2PF_lK?sj8sVkG2F|wmuQ*Vpsd&NW6?3WASvR;q-?aNGldqYm*DiD0q
z_*FfUZwu1k+5ppO{y(v1RmO~HjFQmNM>fb({#0>_{PYaMwAH8b_ww*B*#E$qz3oTF
z$d_s3Qoi6+M(<R1-jmgXBIp6}slQmW7ai!(TO~c(8!kN<=>5r>9Z2#M<=nrp>%P#)
zvNii)q<6!}(+$@xH})K6Yz$ms;&ax`2d=1(GW1~(=e@juMENR)8{zJQ;IrJ-_=fg?
zB)6akilh!|E1cNJtQkRScCCM&FkVJnr;X<g`U1ARxRd?`Ow>+0`1H=}2mTFH{vSWn
z#rr&oK5(ym*v=yQ_(!^871OE@X-}Z<_MkhOB<;Ls<emR;AqnXf1S8>*!V=n5_(TWL
zA9--xc|JvEBIRYLf6SNh7h=4#@BI^xPZU>8G<>F81SP8UAr<gQ4AR?Xo+(IBwI{<W
zv>0atlVnC7iu!LRLsmK)dJ=)n6{N1rzlnVFC~f0}V9>;|n29v6#F8%B@v8CLhu0~6
z1(f9;m-sxMeZVvV6W#D|QmDm;2TT$1)Yhb7)qRiH^N&@gAbAzWMGqxT<l;1Ekn;Nj
zDh*KySLt!hSjBCA1o17zmT~!Q6USQv6u-bUS{~!`JV?pjB0!?16G~4YKtk@eo&ZX?
zwVj&3{v<S;0R!AreN69+n-yb&zQ8b-0}@WGI|gh`JH>SWI$215`caheNM+J9ALh$s
zZ1f6*mgkZOC&jP9geT1P_TRJUyDz~))+8hKN4EwZnQ%3Hnm;np{`;i(sApl&=-Tr>
z!IjSnINJiAZuaI(o}AfMMM`Q}zb(S(&a}g5BDk%??fEVNzp1G01+?c8=TjB%&*QFb
zSIpf`Wj~KTKe7Gbc4XcJDDIUop1P7eoajHL7`6St{&7{uEnN2P+r~$xlJkSqw@uZ|
zAhd4>W#|m5o*plI|0rB+%evJQS>nmrU#F@@kamH=`QqKG&z=NcgTA+5x0V+rt<Ulg
zrh1aPiUoGW^WGLWdcIoRt9bvDa`C{@%G7haAZzxe<-n+T-}aik9n}=XsxHWyeTjiT
zcSDDqF-o<GNvvPCX2qqcEJpLPHLD}YF8*fCo?tP8Z!TH0{;!Ptw!UZG>{_yBU80x<
z)C{t$XYZml`&w3e`#YBBz~UVFbrKvN|KW(c1Nn=k^dFCQF3yqn%a^-m_&;E}CBtQ;
zo=CVX&5^~WEoTznfedc2*!ZXb4s~wV;vD&4mP^cw_oK{*R`M0vOLOG$RL`o>_oO6^
zKDsj=X%8p}r7q2pqj4(uS8sz7hXwZB^h3cf<K7+=4v0(r!*S2Y{WyL6=tuu&5Y-TU
z6-Q2{p9<PtOCTmX<A60)pR7Vpkdhkw{oYgeR3-00K2)+9ovsU-J~<E09Z7XF!12lB
zpp7zqdy)ecE=zh<$wKn(N&Q?oQ$~cs(^=WVnbN*QMGyf!;_M4K>&8yB^?@hZBA)s)
zHaR3}1R+X+a1uUTC7|I16(usxq*5BB2X)PW-BKb*rBAxv5~cS8hxtqDr6S%6g5d-a
zJ+2~eDiwq)m{e)4(v$e(jqwQV)3#K3les!pSjAN6iuKdRYZNT3OC+W?dQTxlgA$Eq
z_Q0;eOsZZ=QYJO~VBS?o1MnR?D3TNt>79QzuBf*hWV&93roZdMl#F-JwP?nijc_sc
z#={?=kSkAi5vN-A%)KKBy#I1|n4L`5#52ns-p9O}o4U;4TaikozN1dvke#0G?g=9X
z87r>~_o5;cz}ME+C7LTD^aL9el%fr{&&k~kr>!WlzCu^*L%3R>rL1}<9y**@2$Mat
z!#fD+eBsXCO&05R;w%M?&(F1=Yj5wcv*->X7^qh6c(u0!VH{I%lTXxNgwp%)BgpOA
zHyf(9+sZiAa~>v~OqZX4dsE&y$iK6-eisrINhx{fN@Pxane#D@^5c1bcB64m0BYm&
zD4UrmuacN2ALqo0w=Jd+_uJZS$&t7cddmxB%+bB2goX1Vbb-(0)x&cN4=(YfcX>P{
zt2Dwy=e<1mQmeP4uzacUn|gIWOdlzs*T%;kE15Q1f%D(Kx8TfM=b1fwSB%%ZK?su*
z*V6Vy8_sti_9Yp2xCPB$+BcuP=F{Vk5mEt3Uh}slrV`im-9I9~P-eXlyDqN$fU!?b
zFS`nfGr);a$CdA0qRR9VO+HZsaasbY3@)%%xtBfvxu=KRvmPZp%JlMq8<G;ZJ*#G#
z1yilLvEG=4kmH}(AX9N3JkUFLn!CW1PfZ#&dT6|__F=+3Ne9uG^%MQm`vwzFy+*LB
zqEB#{<qw?$1h_S5myN>%8XWTqDnf)x$I7Hu9UGuEceyvw#gplhm~joNb0Z8xl;2kM
zu{$+aN<`zd3~~<EtKl7L#me8Tar;nWXqn9Gsad5ymg1@`t>CxH134P&8g{;Tt1^_Y
zxBW(4@SN(kW5m*`&AF+$Y(=?%cORK$s9MQfpD5eH7qlW7o<uo=_X;^|K^fobn1yUH
z2?L&WnWIfRQl!$QN~d<d`k;NkHT?Mvw~y~9HWpNWXz)|ayR9KoNvV<2;_B_`^GdeX
z(Xj~6eRM8M&ExdWk9yCB3XL<ETg!U+*tX`+Vn@}=-Mvd#{=q`!N$hGtSiLZ1gkYP*
z*KL(<QvbL&UHELc&hF19Zzr>jo98zpuB;;-$n`k0`-|C!*LTkjD;tLE_Vp=9r*Sa_
z<_qs${&wZ}$<6@#4{x8}JhO*u_4V_@A9K^wTx$@9Ga=AXQZWPuR-=`W$Zs}JU<x^#
zC?tvb#V8z<+|jCVNH%U>Az2~SL@`CBFh(&|y{1($P5a!uV!G~tiPB-iyD>^fOkcJt
zWmqoEE3s^FrplQPQnAWeP8w~>*=}YZm2=iQo2uk``NgW_`R-^_Il3{9`%xu-bE>Io
zL11C5YGH6qn`+Unb01ZYg$<ah9gn&jt5zKQvQ4cdVd0}1n~pOhmL^HX5zA6E&JoKG
zn=KG4GM&xTPvrW=saF>4IH!K{c-(?|RcWf3M)irpIE|X>nsXYpr_L>C)YT7|X`X7n
z8>e}??d3VmGo1?ynw)N&xmJCz)IP0-evNjm#;azZw3@Cvn`<}U_S>i3GPa{#`|N|b
zPui`IQq6VRo)+%YIrpNbU8nu`bDwlNW(UkycD}#6Z{_)qFWXmM__FY6WfzRsg4B(Y
zjwfBjYIcx%_{~3)E(y6<==O@OkJr5{8PcJ9MRwn3-9Cjh3%!1oqIkUl^;&L+-k^5-
zXT2faK@0t>hWFz2ubIB;&>yz^^jUwzhS$>Ix`T9r!3`(PPJ^3n=3fkMt#z?9yzR9<
z!SIf6NT=a%8~1%N9NnB|X*3pClwfo>xVF>i-mdm9M)$)8EsY;U-AgbYkA2l?{4n9u
z7vl*!ua(K8B<cMok5e?yn>;ye{?%kM)5Xg4Y3};{rq2pO&YM0zzVEB)RB4)(*^3iJ
z`^{cf*Pb_fb*lZV+3Wg2EA!u*@9j5#)As7T`E=)}ujbGbg0;nLuk-<nxBZ$IEatA7
zb1mLocd@p7e|!A_%MW8A7cBpHu#amw|0vDc>f_U*16B(!YA;xQ`n{cN^?7#C+WO1;
zd)x!oUq8OOV9ovViE9lYh+QyY4v4lOz(uOMP<kA?Ks*7dMC``8a~R?s1hjrtH-9)M
zQSLJVV@JFwl*M7HS}5Q=sxFE(aFTT575D;(J(4##2aP%u1R|<>WZ!ZQS$$T(ClW6y
z2-hb&S||!<S6x!kt4~=SuP9nh>{WNKPxbCl6mP8R)ef&u^Z%?U(L=nfn^m8_%|c1)
zX4PfGhWf+1<CSEd5U-fts6P_jp(Hm~b;a^+ea8OJN(6*@pN((>>!5|QqDXb0gI+`C
zk$7cgCG~zM_lB&z4rNvS>VCKIhV0_c%0xT$fwfr;Ih7VF8XnaHUJVVor{h($xB=>e
zzBd~3S~^s8BB}>BzHK;q{<8`xQGIB$aAW>u3st@B>Y+fr#)50{ss`oiSA*Rf3-5HO
z8Z}m5-4)(gH2zuDq(}W)SXSe)XBKK^H><BjH8dW76R&3RM145+Mq}}Z4mGQ}>fwa9
zjU`_{tC0~JBXr>=HrkSCD^fF(q}Nm`kU+Fo(zu@D-c%;uNp#e&xqdjjsa)<0kz%KD
zBQvY1Le)~;*`wx0ZbQ=vodk8)0F9dkH<~JqI@MQ4)Z9G&w&|qR7j<f)#;sD}<|;=^
z4fpJtTPO6It5+vzc$RD2u6A#(@$S^{ZmhX|D!jSY|BHrCkH($)tme9HmYRMyYu4Rq
zZfHKWJ3({96OG^6ZZw~c?$q?3tNE?-ZS$G^Uo>e5&Czb*7S2IStt}$8qrG}9^+yu4
zwkm0k^}Dw;<aKIo)2|)78s5@a{6#CsPV?^dtd^!qF(2qH(8bnf70~i)YlFsMc=&j6
zvH}Rapnx!5P)tNvQd~@0VuhTvq=KA`tvrvig1oAdg1U;5wz}#{O`@K*hLNt0iT+A+
zLp>`~L$aB%ouz4jwW=f8!pY7m!%ooE(Pj<B&fVF;d$p6FyPLl^wbxH*>w2%cjcWB9
zRk!>51a0!YvPtsFX6c;)8~Os|Lbq+|-=-M0oi-4x8nq)JX4kf%UD|Pbg0Ai%T@BMu
z2;V`E-aQ=suk}q97;zI^b(kLWmjLIG`}Y9H``-hcO=H=M7XtpH0H>`i=f7@n`fKz4
z!wjeB?-|a^<qW6ye`$vEVDR0;f6s7U{~wp(K&?&4|7~r4Zf(3Aer|0l*g^oBH~}JY
zLG}kQs#OFB@1@q}{Bmo97x}rhnSu){=TWu@tG)#gg8Dn5r#MpOin4=J;Sx^{o5UHH
z^Q%=(DG56L+1fl~PiC2pPE7LYx6ZH+uksFl8m=$(Xj0IqmGe~4m9*JGz{5ZISwZhr
ziW1Ya?8UR9Rwt;n(P+XxKOS?=(OH1{q52|5i!4dV(Mo6AmL!CC<29;sCR5ZTG9UMA
zDRw`GTAO;|6hckTyKk+H)hIrN?2!&8kt>EK673rSE@gmn2A~W&7^TxvC@JYPi8dQB
zeLZ!GPj%rU*zSuCa!_kiDR>fhX@Jkj(H#M`Hp*#2JdbNM&zu(*#e(jk3McrLB-6BP
z!|#4?ZItlqS%eL2sI_U(dJMHTae9YTcCkxS6(X9lcveJH%?4%OSZQH2LPLdiX`k}!
zNLGnhY;6vD?(BnFo1!bHnycW4#QaT`TAQI>nZ?#d>d_tH6kh#4#X%Vci*Z?^Y_YXz
zTx@O1hL&3!s;cJM>%ppRQo7;V6+`uPTJUbYLkcOOORdfJLke}I93GitORbHh0-FGz
zC9p-CyP)^l)UDH5wxH83_g9#vrlr>A{`c0#@2A#gul90lbA*PFD&S+{pw`9;KHk8G
zr71QK=`x-+&yy}HHZQg|I(>Qvr<xaAn@UXbPpu6`e`v9_(S`@9a_dQHM2pYtfde}4
z_$OpSZwa^ZS1z?S8C^*lP;2v=uRy}w_MLpu`TpsOZ>>$|79ne&;txJumgK97B7iVc
z<y&h*qC9wcBp2I$l`X#1+87~R=K0a6OUK{Ds5L9+;Kh>OGBw~=P##s^S{q}y`p~!5
zCX2vU_@%X}OVSd4^rN-e_ET%KE)8mJ_+8#Yt<Ac$KU*7)pGBC!Vr$b0wKg$Z_;RGX
zH5Xf(BQ){F*5>YFYjYY0_uV{w#L&=WxwXMitMq}Zf3`ODWZNTsxxANuYHbYRD@Jdi
zilA{ZaNBh5(dq;x2}!NR*5*!`pc3)e_$Wnn+s4qnZ3`O=qWWD-@2rkKQ}$Fl?1gdB
z*l9*{&&4qcjP3BfwP{;!ZEBZW8>v!iz6`zn{1}%4G=Fbxy8V#h$fh0!xB)-F=yNCB
zePW|6*OKhpv>C~x_#6{&%IcckoqtHH(va(6a_kFDTq;mpeQNH{)+Qf&vh<<=VC!J7
zW_Bp`Ln?~aC~fllHUuZwK=^xWa}8>3+#PT+0B?Y7kobWzH4%fmP-}Bq{99`yc1tl<
z9be_wlbEVdPuqG|1h4En+aaWtkpgV#HgbYaKtruf6G2|;pfc}LYjf&bYttxR{7Y-2
z%xfnxz#Co&)Be`lXt8BXuAm5KuYGTA)=6_m7|r^lC!T68w>CbDt&IUfb4YQWI{VoB
ztnGK2&CZ(F<l9NRF19uw#G)sl*2Xq%skK?KDKEwmRvaM+|I*qZHzUM+mRp++Qmf=p
zYDfRh>(xd@aMh*O##1%Ann9yCiXZ&5wP{{#ZL$toSCetet<70eN-)~~{;m+QSI%Ob
zu&ApEr_;~qqm_mTJl0){t<43$QK+?PfLa?k?^0{?B2nz8*2e#PYm=<?YikoMzTDc#
zYAv=ljxoJ5=>(K#KGfPQz#c>j`@VF-R#}V@ig-4v_zCo31_ygYvj|BV_O@a^ORY_|
z#SFOJ32JTpzqdAc5ueRaYcs`@hEJ-VyF0R`ec`q<))1u4K&=f0mG)<A;{nn+NgES;
zEc<vFKesll6~DAL9T$ZcTN~|vZ*3gJyv8xwORdc=@xQb-ECq?9P-`>EgECB3`RCRq
zD3c+HVPxFp-bofz^v64ETzZUH>mV0umT2*7Yx9y%QJ2?dv9<ZyJvIWhHg{}Ay{L4d
z)I27lc?<fDpXuc+Hbaz{nsK&vv9)1QzPC1hsLt`*P7O<~&4BL^8MoZp_$alK#ZvO2
z*2W(9qqVsNwKjt2AkgNc;`-CS<<`epWUHOq-D+{F+y=$q6lpYVPjpynZN_B2wKf}|
z)@COO(LVd;-I?;Evfo-8D-K-SvkP(0_u6#yQfqVEE#_NmbM{+nQ>^j5wW)C6DssNH
zHrdOq&2RtO+GHU^q1Gl45&FHgDP|$E%FQ`YYm>9s+W510ib(JmBILL4Z2E7;$}6jF
zSZ-~merjz_!ryH-Q{rHoe{OAz;T*P;BgpU%wKF0xH?)A1R+%OMp#^?xZH&6$5tFEd
z3HT5kp~|DuwA|WE!i$$$o6M!wrWsF+{odLrbvdtw^J=gVUNK3rKeaZFcr1x#+O$2|
zbYhQFYw{H+rsW188p|xV>LHr+dBwLObGAfRHfm=6y|roh*4mu<-r6vhTN`)Y<<=%*
zxwU~KntGBi=gYu(*0z@?Blm6<$i=75C&I6%BTAETy1f5UYg7DBt<BlYbm{J$v-vE3
z-Hd9exaq;d^-$GNadQz1n8G)+a9{Hmi<@W`4y`EV%}Eqcz-X5Ri|HbsRI#-B@jw=i
zB$=&enr+~lZ4{eL;s*1aW~Y^Oua9M!iNaE3=qzpDob$$TlY$)Qwj5na6J)hyCC%8M
z944%g124t-(@+ipCJ_Xb4@q+u!N6$(TfySV>_WZ>z-{P4<-6x?cXDi?@%XppI`(I|
z#vY9^&E6bpb)1fV;4b7Hyf=u0(EvhCyO5bIM2CJ--d0Rz=%Eyr4F``k0&+465Sazo
zrWu6e1jd?U7*)WEU}aVlu$Agqk`u0ib#!k(_GDWjsqHAHR}#zAyrid-K+DSGV4fn(
z(t<5BIqrO3ysp%AYg$2%@3A~K{H!91Em=4-pOyI@aSNO6LCCC=%#IDs-atOC#W}7k
zi5BEWOFlQmR}xSkpJBaesNl*?m$qP3)i5H7=+^Rlbl}P(MEtcBpS&^cYaauW-ya)!
zapXoyj$U=)m}K_*tQ<R_SnmbSaV96X)Fh3CnbWoSXoTPpFmZeF-qkpb5n@d!*&#{4
zDInMENy++%V}U2jGDr0HE3pv+M^IAPCqs`P0J5Qv1+r$49(c0%492w!MaE?(v3O1p
zu<c6NG8Qh0gtCL)_8DUvjAb5*lHAHDhIb!Bghg%W2{YkIobA;&;$R!ds;`1AiG?M!
zz+)Ozlbsr<6i&gFEy!Mza%5^wrb>1a4e4HpD<fNm&LB1bnfe^`p#iKGzQ~(P!<>5p
z-J9g8V8KIK7<tKTPv`8Lb~$ud4(8FG4KGuPOq}q0{HAAzMXq}_ka;Z+o_rHjUClYE
z*Oo_;tV&_wLP#ilY;7P7nL1EKYGaeI2&)Mm{eo(J-~I8Kdxo6xUM(1-(37}K_*q+C
zVLe164XgfKShXLi&-Oq4@(4-2R@bQ(+`(>JsO7J&)c~?zN!Gdf)oz|pIRRD+;IdOD
za5W?Q_R?|r5@oxnD4!%8%$yTS;AqfrJT5CQMB-V|=9Oezk`l%nL}BNJo4VFLS~y~8
zR(n9Iid1kq?HopHg69Nv<^E7}(hK-m4O}r;c%loQL_4E5rg?x{uwu+vD1{w~*X6l!
zuAXczEW7@6b0lsOnH|cm1s}r$foyv(lsAwa2tD!>uv9q0nsh?I&+K#RiUx8Pzs=D~
zsiv(i!l(seF*_&K?~GnSi@q;zcM-0lt3~G()*2|@aBoE&M<?*!S;yI|GN_R%Ye_3)
z^Q*V&7vb*SY~Fvb^}=SP?_gnANULrECJ-<2&Q1*d0)OmfD|Q_ko`u1yo7GORlxUek
zZMd(kI9V(qnuCMuA!-4L{%@1XJY19}YWhk@$ycZWaFN)Y^*#%KVLe{sMVr(7;xPw>
zpN=_{YO*vdJFGRo9dqyjPCIdDo8=y57fT88j|vfY;GetTThcm?)Zz{mV1Ey(k$y^@
z@)6y4PiU<v+{09e!@?M`ar551n^VvM{ki_th1*i{JbF-0<S?SfcI@X1u=G7U`tuN*
zvF-#^`{O*m*XNH6u5zD1t*FJfn`Q-dIf`m-omEjy8(CMyDXu-2cU_Nnr+SYFipQ0c
zweHbTu}mIQLX;zUV|uk=V`zR#8|G+1fsYENIP@ev<x(p4lI>1hwr>G^7N<drh-$bb
ziM)8&WpztP{8<kxAFu!lwsK<+qDFa=EA`!hqm@rCrz@k9Q+h2k+ho@kiPfKnZ$@-E
z;W~VcosS)B^4Pa}TW%uvbrCD+5VE_hvr)&DmUocv^8O+op+9im1k}?Id;|?u0otlV
zcP8|BZa({dXM&Cn?-<yC*9^kPc~*<G4+=e1$3K4&5zE^2@>Sn~oh#p|<5MM1?rDlk
zkr+C)q2w&j(C4v%m%XR}+ECv8v+gr4wg+*?n0UM$t}hFoH&O&8V8wSkI}^=M53PJ(
z1Rc-7eNrmvsug)WC?vY0G!raEZbrFM2a%;Xtx(MzM%jo4uj-DWGb8Fv;J^T%t%_OE
zSH6*9K3_`_^J4PV+paCv1XK;jLVrX(DhvPM^VMd(xVAo|6G6eM@!FKu6`5_O`ZJCy
z$3#Bf6Y}Mz>Xn+|W4nft-ALEg{14%kXB)SM6=Eu9ln?lBnu6a7*1%g_h1-2V?9ssU
zXTezpw^q2d>=#Lw-N@UGxRI5rwe2>+l(aon%tWUP_3RkWp(K4BlHaQijZ<0cb8^Ml
z1A}I=ftT9x4WSo4Z^2Uz;twR;E*{+D&BCtI5|TRmo4D=;ozg3cHm90tr(~jkV{9BV
ze6(1ig@z5v&vLx+^&+p7-)tGHcpx>mLD*{j-I^~_`WuC-&fVq6-fP&HbHwsq%i;9d
z_<QFpWlnb9JFhKvE5Hhtg}EM0IH*b)(X?hO5pLCro;obT?aT0Q-jZf)-n)_aN@vC$
zdx`6^gfCnZ;>BGL6bc@Ue7g5+Hml*qxpHZLesw~XG(p%YlhXF!{;4(atjq>|L^W%C
zp=td5jd9r9@%QT=o=VG<G9`Y}CPYs>^bI)&-#z|xHY+DB``s?l<^&O8t4GGZkLa0?
zr2MmG1Rjk)dL*xttzad3?C>MB-(!Q=$NOy_Ysu9ibRJK@RCKMfb>u`lPdzq1@<d-p
zf+Y9EboG<5>reFh3$9%~YXWO?9M3V<lyDuN6!|!5e@(Vr{b@Bz!bc!Gx&EoI|I-Pf
zNfj&9x;W7lyG4A!<8G^;9n5^@bL|<;>aphd6T7b>>bpg@_&<(1y(0GOqkVGEuU~&I
z^7Xkz{gW80=aJm6Ph^iw8LyrK-^eglw;eexGJN%kyVZ**p%+=Fr!scSrcCgpgw`5c
zojWv}b&NJy;V)5n<YoT&i^1!P=ggjsE)bo=o*8Chvh@)4UmqPKp&GBXg7jC>XJ1K;
zzq;_|<vr+}hC|`Od*{-Ri|pMml2G|ds(5^O_lldRpB)VOz3;r_;zbSNH;=8<gkxWh
z`A$43e)IDDo7dxSUSE6t{LP!UR@3kNr=JK+*QLDqaDF<Gf${-fKM)Wb7@S6yY*!+`
zb}>aA0N$V;&IoX4ASohZ22pk`CxwKH;2`i9W@R4E2(OuqiJg^vIQz-p5@szHfFW$A
z&ie0vB5R76-<>VXm289VGaFraT5bC~c6i+Q;hdHAvs>lAn^cDwaOZLcvC)L0Tj6i1
z3Z7bf-ichp-kf_^DCPf5;Qe}?_da`CkFnpa+mk)h`F@M_2g9-Vr{2FO2oP-7e27(l
z-+lF+8+7R6>IaeHchyuhrX-u+DJAmZ<Ox=5!f=lJ%FJl;`xI8D#|$D!em?!cT;g!%
z!HoIThx2tWJ_zIfa11l?T=S7};kB+)#4*nNu{CWKtn%_REj#wS>0E7Dc3|Q3!^!gY
zSGCrNQ``lkF-?77CSP8(MP#leBYXF>rg_Nw3-a$Bsh<P6Z#R#eJD>6S+VJ~<;m^Zo
za;n2WwyzY$MOEL-$nNKEufEmz@t*wGT_qaho8CP>@HM7w;c3QKy^^%w_K0e`e|o;>
z&E4UzF4gZ}uYCD-5BIZm_JSb38Y!UcGcsYr#ER)`^<mvimTXpDUEy>6u|v9~;qJ-N
z>rYm(6daBy``(yz%2D?^y>;xy)4?N3js}0y|E3(z(&C?58}VH1&A-t9)&m>v-hQ?2
zOvP7lk^c8>3cfA8v*z~i>s!N~UOTb=x7|YpA@AQjsGdSAA3T<hVY-`)kSR%}OpUmc
zt5%yObx-mc6ii<?-s5i57BM!rJ!#kU5!H=%-v!^Qt`0{%kTOu^1>}I!+>~wxAcL6p
zVFBdKYnpl3%Xl(QO@J4tI9UOMy*T`kFH!AxykagNfMd5l+wa@7W10T9(tP#i#r3k9
z33i0tYHN&9pBss_=lE^G{dd&^Os_pVqK5(=iQW*bMi{5SfUCD6ICaxQ*`c;L&888H
zcXGEvtHsddOKkIFgv1ulsnExKY;@Tf_NOxGpzMisyVt3j7#jyR0(FroVD^su+EVrf
z9+PX#4q_6x=)1F*2|_q(rsh`Hry?Xsie)=ijle}1H+&wa_8_G=UCeOTz$}u70+K^M
zQt<@$^`O>U%BQaUu5)xU3B1Jr$w1>GFG4JmYRem?VaK%=;os3kz$peI0A(n3@SxHo
z>44s-eeVK#M<!dlA^UK>XEN06@BpohbUdC)VB&))NjM~$LSq{MfH0ERz1p4*!{gcA
zufDoC2mvi3&`ZW+Oz1oZU@~EBD~dNn(^;%&5H9r@0I^bRgIsAcz=r$ulasyHZO(mv
zkOy5uOY+npl)?ct*wwlzQP!JnE+9dJ0b~L(2PWqc`KTB$e78ASDQ|wWy<|(Psu@7>
zV6Q;W%#OOlC`w|cChT==vEO^vupNPzN3MWWCjyj?yfi5wBLxCHGCA7s@6hGu$pi|f
z?hiVZ+D2p0vxXw*(#C6V_j5fEbmd3ouvaj^%+HFR<EBIH%5mNzp6p3v^V7EzcrW^H
zFFu>N&OdJU_la#AGgimF@Fdx=5l@C(QHlIIM)y?@sd>kTU6xim^|(jLI4DGw#~EZY
zNTD<~zxYH>Z>}+dedwaUTVN7gK=|`^MiWX4J$&LTo3p3L$SC(y6-6Z(p|LU<eHhi?
z_Oj3eivlH%0Ta&GKT-ne@GWc)*K*4wu{)1FbR%}tpIP2*U1OhjJQ}d)`h-fMS@8)>
z;k}=s*5)WzrEl!$hV|;GvNl2~>hUEcEPi#MjvpSwhhba+X%T2&Ss_pridI%K>?uid
z(9aWbuuBvkc9%;w8v#7E2>Z}j7MXdlPLpraYh+6n>b6&kI3M(hA?tcR=J8SK$&u~%
z(vFge)U(-#`xz1jZ1kF$F8+yNf@Tc+%j@UoKR!4iW}3W3?3BdO1=H)He+UWNs1oRm
z$O!<h?tqTVPtA$dh=lIA9K{GD0oRplWJ$>gUSR~{9SulVKmn{!mH>R`K_K7W);YP3
z@NRZ%Hd|7<JxF6k=0#5ziN0GBaJZQOk_U&UoCYbDq<6C!NZ)P=4_$qg=wX^){A0}N
zphEA@G_-equjZ~;m#VFqx#H4Y{phle3uN29Gyvq&P(Y%o_`sDxOzE&IY)6UhBG^%~
z3iL)aQmvv)2+biANSOx(Pr!M2g0|sMw#abttf1>}12F=jJnmrkQN19t(mWIDZLYHT
zL3@G*2Xt%m;5|%Qr(_!j@ZuT#{6XTfab2p7SR@?usItB6yZX9=Bdx?WiT?q1O>E_3
ze%*FB9LE`mIud>~D^XGB0Rv^%>RGApmZGz+hPbQx)!}S78NR#85WusMxgsk7y^ljd
z1^Re_WN~E92_B4n2w>K0zh|`}-eY4F;bCF1`gs(9Or{aK((a&9wnIAZ`~ZBEY+?*k
z2PC@m_Hx8qfe4=3Vi)INmcm<6_uE0SI-;HGU1A;E=>#}=qyJ%V9}hZ?8^Pa&HPuT(
zvZ6im&Sh0b)YCPTZE+s1lVZ^`m$td>yPGm9+PGh_8(>Vh=Iz=+sHEC|-3`Z%2_r?~
zh5M8@L}pX_bQKhX#O;hW-}BsQ+gc6UtKhca>`i_nq=LI_<6ZES`PB;D+7y+hPiQ_-
zT3hW#AD6Y#xxTG8L^Ej@6;&@HeLu7Fo}XB$<K^PdUjX+X<V}y4sKl6c5cbSlCi4Jn
zdW%qNN8zcJ-rKqmF1Kv)Z*nn$JLpLxMm{}W9cLKw_R05EC)LDz=rCKdmY^V0pu;V!
zY^eRwN!J)f$10Te=J<g5sMg*UB7;W~J_ihUNL<m@br7y#;|!X(w)oJX9@g;=6Iq1m
zT1IAg?kQJs1?x7Ippo#SYT{2dYm@kRgSy}(HN3C^d&umzORLlbAb!&xIlUq6Sq=0L
z6)P5Yeh4d}Oa*X-42%SM-3o<z25!RyDi=Tq-zrGeB*5CL^T}|lnR}#tDue#dB2Nb5
zp1GDh#X)gks|j?S2q5qMIydbr3I$56Yy~Vy#fCrvN=gG^JjwdP0@NLRuaQUu=l0gP
z9&JGMw9pA1kguOrlWkKrmZ3_itq8nE-5Yq*zqmJk-Hlyq4z*jbueJD&lYmO0OB-re
z_a@(Ncr`1Igf)A+``v7KWl|yrbYJVob=@VHv805!MeLrfwwyh#u8(oa6tNNUNMMHu
zQp}hL!h|=xvDWpuze1sx&z;4SN2BvftF`UuI~-OR4@dG+$p~*UF0%QMKpu)ul`;eH
zP$q_+uijhiX~~i^Pep2N0;AXjx@IyNCQKVwHe&-QgPODQ-~uv;8A-3B!LQT*;J2Ot
zp)YG@<r^yxS%qOKH27vkIuaB`VqMW#0SbVw2w`bbfM`N115Ww_dqQ&pam}8Al){H}
z5p8$!cNyt^)W%!60x$7|oBV>LQ*`{z2xPZf3nTB$H6Px`sgxsdIaY`ah7BXG8EEMo
zLa`3qyQgyUOVH|T3rUwQdtLa-MXo6q1Aw}TbvFucy>v)@!>HRw@LYYqNtD3xWI-8U
zi71>x$A(;w0}e3l;c+-EUh?3aAhGMpIRTE-MynDLLJN>A3png#k0EG@<ca*<?nBZd
zn)ohQ$Da7at|RdUIq->Q&$Sm&G(L(t==aFb0WX0HYRPm$U6D>6Zxo}MHYT#H>fMFu
zbTIU8I*bGe5yajOo+Psr{5?Q`0%Eje7*rswr!&2_GY#xa$w!$4ok_tXH97D<oRKb^
zMCGYO-wC+qyp1m#r8B{xu#%NrZ8ce_6cSTDU0r(UVs)#flzsB^n~Wpp635FWC9~+T
zc_98ANX0O@2$EHCh*h**GD-r#*(P0MSrvXn`XCTOCLCdPV7Lv8-y*4pw-(U@=CTdx
zJ^;)I=D}vf-=GUrwF*pu-TSm~Y-`N9j)$aN0T8*`6~!X~h=vr#e-vj*0TaQ1J2`2b
z1tTRl_jDP@mmXCyS&^{M!V>y(?lEA1a{F9RdK7D6lBO`l5J@TJX|+I_wEEn082ZFK
z?385nu0ux@_gh4@Cjl#ygHfk3C>*+LD@TTc)SO}XO~A!XuBgkvq^A%{K@AiZ+=PYk
z4P6zpvq6^wvzdTvj@W`jCpuakOCe}h0zkFWsV2l^>3q@qz?YumMxx2ao@cow0fvcF
z`1P@Lw@j;qRDNYb{w9%p-9lqiy-S`kfc*x0hpl!<Jce@XWUPKNZp7X|GvAYCV+%6k
zZ9u=2s)v%Y2a4)oT}Kya<(Opt>YlUcW5&!O2ewFOs|Us}pxzl@&MTE{CeaHIWdvGu
z`0TTy&}tASo&CBRj7yG(?{QWo!*{25zOzNxkl+R}NkZf#zkEdGBty9h<q^u<Cv(L@
zqRo$-7+06nRhQK5dgjJJ;sHKNUnEw?)rCP|U@XL_@u0H=$V;)|o3W;2OpNWV(zY7!
z)x;2kKqn{AnPpYI4+H=N?Yble1S$*8wkxf;5LcWVFXy1F%6&e1+{QJjKr6Yh&bqA4
zf+zuy^u!XX-7sB73@}f7#@K8Mc=oQm5eM?*_vq+3(PM$Bp$eR*un-x-D%BHX&Ie!0
z9So2&u<HwCmNUkho#vThRbtn)FtD5Cfm<m%n@-pO45b*C6k3u{AHoI?{l+3!urMn}
z2S@E(uZFv(kX-lGQ8fukqAZL_%upZS^+KsW?of(bKG}>TP9zRqeLVzqp(T7tZk)X9
zuTAMxD~uFx$~`z8gA98C`>l?EFag(etw<88&bfbe@~)I9{@S?31)oV}2bMxYoRwte
zsV9>b)lvoKM6g~#YSXQ&FDIp5zqZ?N-ioKyaDQi6`I}n|l9O~ahCSf_4}15))YRVa
zdw-=t5|Ca3DuiAGp@^WA(2I!lstAY(iU<}2L<k|l(3GZP0RmD&54|Z(P*g-jL`0;C
z2o|I$Vk2h(y0`9q?d!Vl`^=eV<~-*GWQLiLmCX9D&+p4_8%Vl$rP`jWLt?*D)m?Mj
zt0LBl_h58*R73Qh9nqr%io%$&8yhgA`0xs{SHS{dAq$nFQIe-`xu!>@ry%SZI~<(J
z+^wYJS9?#TA=z-<H?<u){Y~u{WNyHQJHsI*-SRFO4sj-O1{OduCif@1`NA9Dnzh{D
zzV&oen>}6-K_r@Z>eAQ%1pTaQ19ZlYh~mQd&-6hDi3MulQU?(V9-W#28?e#NJI>du
zwm?FN$Pkz%7lu`q=-U89O((JfQ82trxC@Zai_|fzxxa%l;!9lBuOaqPG^;lqJ?dQP
z=vJb$9XxV7z$7ILnAMY<zXBTwM1;8XX(3^q6i}U&Uo=9h5X|Hnq9B8S5OENOM6fyo
z+*C+@J8?fdW!G5B9z*D9R1^os)>bQTJH;N@bC0D7u7;sFb@lTFLLR)X7XrV|sz}^j
zQCc*Wo%<haV;{F~f(X(OrBV*cfu_o1uC6-Ik{FMxhvDX8wJ=QxIhk1blt@4VT=mhR
z+W~P<oOvW1Yr5{r76sizv`?u=bEPLF>iT)MzLk@!)2UMEZHBd8eV|T6VLHzR5$|mu
zykD=47<9ARc0ntl=F_relzA~y7C1jdM&p5iC}8=j6@anZhVKGX3?3EyDrN}Vq%<aM
z8gPCj++j@oLN$J{lcMenJlP<iv7I_n4+y!~2vzdm?<K+j-Kmly9bu}LB<%5Vw_rOm
zoQtR<<=UY#^yLfG+9NhE11WEha-oj8(oCyMM@z9bi!~@)YY>{*(G1~C2kNpW($1Gm
z!1B-BjN;nJW9(63LdSJ<)sdFT_{aHZAEYILOuK<HZdHG+inJw=soSYL31l{tgtrn=
zqgcvzGng*@ss$}tow}8@4CnRX!M9p?-ydDPq2lCA>Yvt>7=wt0?ER`Ukznm6q8s<f
zo{HTw5z|WEkj_`A7RO4h;U-PQB-twrMe75ccD@Knkr$G;_TmQOnKU<~O!{3lAL_0U
znDA7r$ip%Xjtw6&xHjUw3VlgSQv38owyKrws}6M3SMt6&KJkzN<sa-VoQA6{?=zF;
zl+y6FDD&ntoNU71E?Op8QN4Gua7tjJj2M$u7!O<Bm#pSwZdwIl9IBs$v`dFQI2z{!
zOzdiY`KXn|&4AfU$4k%d_gG25W1_UU_(bR6wseF9wY&fWC$#SOmEPcxN%G)e+g$47
zKN2s>wO_vix-lK*m_%}=i5K`nov1#?%h;NRU;1024FV2?NV7SJMCl6fxq6UXTMwj9
zla<X5L}s!%WJ0W{2S`f3#+M)g8hq-EXr~yIS}!^BtS_^^_odL-{^(hhU9)eZbX=&<
zOH^Bb9Q{B66(N=6n>rBZ)ccY<orE`oTZQ<gpY^+x>36xz?@F`Z)gHf$5x>k?zpNEM
zb4GNQ$iW<?gV%Hq=2{)hb3d3LaIj#-Z+klQ(wr|U7G89LDnw%xXp(g_{mO5}g<e2a
zh#aa^I#ji8ZQKvl1{|tew>FuF8q0oIn;RpCnr9ES_`ES<a23}glVf6KHD8rm`4@#y
zjOvGkLj1c{t&RWPwdwzR!H`QHknU#x`%6PT>(l?W{`|7w^#8lN0*3^x-*v6L<qKS&
z{(m>*b9gA`@H24wzxx)+ODR!1-PAUTBoj{2N`fkyO}P+Y5@S$X#=)f`Q#)US>m>+V
zWPr4$rNbOlfeVp}p(t7V&j%NVaztMpoZ^<n5iR|w4Bw1tU!3>*xGB_fgsMb(lyxms
zE}gOoxV<S*S;7Ol3lF!U!ue%QF$}mf@^(-O0%kgAnNATRfCt-APuWmgXyo~kK(__>
zCEqQV2}eE(@Hy1K?n^qd*c1EZ?2$ODpsUV7GHOtL2275NBI!(Kb(k_HP`Kx6%>twH
z_LEx6D5Ab|qMQpxR5JH8Og}veDFMF8`#7?Wex9G>2IeVT^9GkFGERwFNhrZ`)Q6SB
zUEda%+{i_)izwB)BeslaZ7fBS5PkdG5!>ncSj^kco$cZmk=hrbhIq1&v$Z~bHhG$4
zM>}eimE}a37R5{}UX0}y<#P#XpJN<VjQsE+(_u#)3inA>!gq0N%e=M;EWih%PR}zx
zuwU;YRp(@&!&bP1HRQTIrG15}<3TohaAMizI5qG%dC*6K`a$0lak}g{SztP5`uI-0
z;Jr@B{qHL!>u0SmQZ`W?6l8sNr9=2Vq9mO@iZLPl)Aw{a{q=nhZyY42^uo9Ho(Mj2
z6?}#FRwTyM%{?p1#)^7YAeg)K(<xJGc%8mnImMMVmdF|F6nHOq*K%y~kxv5DP~|ix
zk1}V>r%#0@6R~>KGe=HJ$%atgFB2M;?Ylw@#*Z!%f<nueRWv@6xI%-sMt}Smk}i`L
zdmz-j;P@hb5r6TZSB&>n8Dz%ZW9Rh9%4b7!1o_lVkMKrfyb6*+m&y-(dXX<kE%>x-
z6Ed0862_*oXnA}84%6w<Pm^V5j+b1dKs&>#vbY>X7CK{>(c>Q-22Pp<fA!G&dQ<mQ
z(<kqgx}>zT$m1hlo6be=s6W;A>4iCSIZ`Af=Kx$A6Mjo?BJW6e*SR?RE>c%{_`Q~I
z9ZILVN57@)JJrJsPw65ZhM(?xRjZ_Yx_=a@-Fl*=>qUR$X*Rj=!L09b^<>Rfw6Tvj
zb7=JYTuAsx)@dg~NOAAvsB**$y_JWW(6f<fC*58aW(m7t#7qnNK~_ZXuAyR0AMj*L
zaZFYBmHr#f$il8u^RK??Ym$rSro5yP?=K>S6e5=+QBTh?@3A6^AE1{CsGkZVS4>f(
ztW;MhE03b@9JZZ|7F6}0o)hb!^2peh_|A*pN)X<9^sSlA1)g)9dxJiY``Jj^ndj1Z
zez!K;PA<HiS(NFe8JrPGSh!oT*~RFh>fzTP3XNT>v_<xBJ0#yxyv;!<>h(v3L5A0D
zi{sZ~6^E)1J~^8)PD0%_($G{IGCODzr;UEY)6s7HN^yrjE3cA2b9t`aDPivIL%A(E
zjvb)28L3Aq-7XR~m3`i2e8iv!F7YCbzfkpcf05IpTs{Oc^UM|XeaGX4#73hcToz~d
zd{))hw_NZ@?C3;ab<O>vnX(|rA*XI@_Ly|DvxhL<SNKHLyE9HKrph`In`hxCz9Ts0
z1Gnt-*BqDK)~B6{(23ki8G5W|^qRkgRtL6q`aui5jCsQDm}c>3a7$Y33BC^X#POuq
zI*F9;cHR-Qacca|;pSM-+BA<tI$St}Y-lE}lqnBf?s?GKST#7uV>OK0jgH3Ddz{&P
z442c+8QN{VgF}%v-pN@L0yRyAN;P<=?i<8*1+nk<>OksYn8{|i-3$+kpkqJDm?Jhx
z?jBO(gQwBP8p$?<T<lxcp-X-#4f`+d1)sj;yMywM7L4y^Ag=_p`z6VYx3yVZd#wL@
zIyc4Si*MqpwQ<?oN>7qEF6xUr+N~v%6x8J)`24s^PcoT*_&N1j<m4rpcp{wRxCcq4
z2kdsXp`T40*2Rk<Q)}vHa+AP^JLBE8Bu`!>Tri5AtXAt*CCO~M{4~iI8kB5=%hz1E
zi=_9fo)Pr-X&>L~*o{RxdXi$w8sDP%$_Tzl3p5+_WgEF^j^h+)ZHgV<8&qPlNgGTO
zZ0;o)i_AzQ9ou<HF)c?kN2#+eyD(ocJPajGBgr$}rn6(4g$mkL?pgLGss)Nsu`&L|
zWfBH4>4tUrn_S{+V30kt?76vEu1%w=9m<i98?i}(@6KZ9>SE@`peJqIR8Qa>-m_h6
zq4yXEark@bsI6L?{y3P>mlF4TVL3sy&kKo#1f_|lGQoYk_O(YL$IRxC@2BRUJWD(h
z_TpqsuR+F!7}`X8a+L_~c+Hc5*|*4iXVvz)%&|}|_MHA4`~DhQ@m+BVkL=nyD|8xM
zcw%Hb^lc?u+Lzbg(H8OO++Oj{P1Uc)t6zZD=K7AHPp6;t)O<+r?lnBn-hm`pDsOol
z^`!j>j%<2#N!)Mmp6wsrEebTTdE8xycJo0qRY`0yyGujs=<GU;Y#LEFT$h#o4=+Fk
zI?k7oyQ2_z<nA{IJt^Fi9vmjt?$A&?Y~v*0z1u8`%~iDx9lU=J2cM|$oGBYeA_1Wl
zf?#<r16rFvF~@YnIUk3Hdz)vD)mZPL<V<cI=~RlU0o)HDO|@T$?F#KK7UPqFUEAd{
z>0*IOBlxyKhcMm(yCsqQYzFao4sx8kB@)++>D*Gu9d^m1jr}NB<=EJ+NSGo`P$Pui
zJkDt;QB5NVFSkY%CQ+2g<6jm$Iy6)lJWi@WIm3H}9JZ`k8!Iykmnx4@;{LZeGE#yT
zmMJMF`Mur(JN}=w`DtyK{|Bs%4(^~`@zCSS+M2S{IRAYL&z|<x*4Ey@1sp4W_I#nX
zuK7DIFj`@FoTsk-mX6ZV)Z*cns&x%Lr<IOhQ+PgOTh};nLn*kb`1!k|bxkARl|pVR
zjLfIhU7ylX4trEQ^0Bh+#_Vb3@D~cBpZn^Xmu@IWEEbP`U#M$Y`L0ZaDULyS>swiL
z@g&}oF@#!u8%G45ETK4#va4?wXvW8=m5gsVR)14u1y40poZx1r)^|wjs>IoqOz>CL
zcPd4wB<xdsA@r#JmPWJ6*<&RyHZRuS)?HCaidLKy<8A0N(N#@JEt!;3Yq(<-p_+D0
z@ui$y!(GQ_)eBW6FLB2j?zyk1rr%VYQb}#-_R&?l{HSDVOI5@DfC#m#FBD&CJ!<F)
zZdS`&EP17~*zh1?MU4i-P3!YE_QvR{=kS(J8>=-wJR6~&D}kFaw`=UX(5#-XRywou
zSmUG26?M8H?zK&7V}HKxmLj{-*A7*UkIN#ql<dR3ae34@P}{tv>{#iWJ&TP`npd_k
zqH%9Md7B1r>1tG_mcHGu*7UR|LZkW`?wy}q)6hV(Mr~E;yTiwtn9oL5H0p2SW`k0j
zhNpD5Ha;qyJyF&4d^Te1^%uDJp^utImYPAbT>Ad>V$<l#%GOqx(p(hp^)VJb&34|h
zIf~l#agIpM4hg0CSi9>J0xg=i)XL@)k6nKu!qn_CR9Z+*y*??er*+q^Y~g&>^_NPK
zTHX7U7B4-zKBdv3)pM+DF=O%iD_y2mZ?w{fY~CBwCVJcYQp-N%soj{dirm(JP3dEy
z-Hq3dE!zgF%08AJyYa@Ixoz;K(o#k0jki8}+lL;NE!9-rcoz`4efWjar-ny2W`kR{
zk1Upby0LiUeFSs+7)*J&jkkF&Mo)W!w|u!%t$F@zr1qqQ^5;8t%?lT9w`fnPm4Ci}
zta&k$sXc9|{N-V4^M`yro!55dUmjOAe=LjCdAm>f>(fWgOSLUJv&YK6K3{D9)XW5_
zzVf$m-j?NCdb$g#<=<YawS4Z0)ctTx`TLAr%a?%`-KDDX@9&Pad>vuxF5gsMnNMx`
zHl?Tc<x%;{$Eud^vypn=UMMp^KWbT7YSCL+EN6aSY+<f|;E@F!4#PqOXb=%BRGJ1=
z!ooCYFkLL%ga)_5A{=Q5cPxt!jU@of8cbu2z#?O4d%&LWdPl1M|6ben?$@}~s%_I>
zi%b38wz)k$>zbK#W-w{hw#}v5|4ZIBe|0r3HJo{DEbCY~?fi3Ea7FgTvFsC|ZCl9s
zk(gS@3;cUx3bbvD#iyFfawf{+TFbBfk1JE_yzNta=4xoFBWFD{^|7n?x6o8~*^kgv
zPsP6pO)U)G23u2Kp59yyP5o844Sk&&{4_oCZRR=Hnp*z<lW+rV+mZig+kUleE<1m<
zZIl0C+iv}TZ`*wSZrg&}lH`lh;AmOQC8z~X{0`LO8cT!f9c)P&-@WyYl<pvY)wU&3
z2>GkFtp;HF-ZiTLd{=E7G1e?@)wb<fvu!i0w(U+I<)>|%1Z|tunr$=s!?vk|w(a;I
zwr%7W+t!QSlMC9mYIUAlm31UrR_TD;w!2~{T60VVPg=X~*gUJNO_dKi&ixL@updTB
zpIEhRXY9jQZCml}(mDpu8GcW~nr$04-VE9{YvJ(`RnWHe8tm8{ou0xXbZynP)vVgK
zYyIoCtyfy1>EX<(ZCk+Q_g5(5pm%I<i^UyZvu!7Di<RMXO*du!ux(@Owymy%DMtHY
z+lE2gR@=H}+t}lObfkW@ZJ++IZHB^E*mHl_wrX}1O}wrjv~6|Ecms*LHQUx}5Hnr3
zYTM|@^xte-|Eg`<0-XjQDX_i=+P2m;+vc%3Xc)9@^mW_Ti%?jzZCBQ9+sK{w`9Ex1
zXU-qC?XedxAPkrO)wb1uwr%XEZL|E<wpsI2pa=!%6Y%8WPutf2&$jJ40>{VA^0Om#
z@E6;560~g!8+JgA%SulEYTMkjE7ok=P4H$ukp$W{eZ@7~Mq9IO!@t_LnqO_(<KJvs
z5@_4H{$|@UJbtllm)30CNc(@mw%u!gY6+p4{IqRP*KJ$V-)&plAGXbH)wbRH#kRHK
zL<Xp?_5a$o(LmdFL2jBi{*R7SJ*uE^f&;JxZJX=ww(a;Iwrv2kZC;>l!-BSrzHZyl
z@v5`4f7rI+AGYn<AGU4JpSEqM{+ey8#qJf3F<Q56H-6Z*MFHAhY@1QMAx574=;f%t
z+O~mTY}??vZNsnIHkTi^t^YUMRzi>7XuWFNGz3mggSO4<ciZOiSKG$&r)_Kh7q+c`
z-L@?XocYtX)vemLoL_C*wtr#U4A*U2*P3l}8~$P2#Mf=x{BO3+>!)o);{Iye3V+zP
zjCI>aHQo%`HV4{2+O|jQw#|~n@3P*J()nTAy#BOpyVq@7BIbA7#udM6+Y<kUZIfk>
z{?)cwWBy{>I-tC(woT=qZ5su&ZPaz!R{Fbb>;2QVA*KJdZSx0h8~a~un<oXdZ7`j`
z+cs&N_@B0|4-^g~UVqrOw%=`A)0%BF|J}A#uiG})Uu_$aKW^2wdH>b6`TgCt73d?P
z85<Qq+h($6+gvvPux)#OwQW!Sv~8rHw(aD)ZL=c(ux(F%*ftS`pSG=<!W6Ik-L{SX
z8`~DNX4`^(+BVvnZL0)rTlK1K^Q5t6{BGO!tlKsW%by*ob=%g9s{7rxRj%1K&tGg?
zEoj@4ez9$QED=9#TkTKVMq9IOscW{aj!QP|SKB83!?uO}YTNL?+cuS7ZJXVnwk`GV
zwyp1nZDahjZPDwt?dT8NcH+Nc+id=OwvG0mY+EsC+g_~Nwqnq>O|05BFUG2W0d3n!
z#!uU(^1E%T{EKZ1Wi4N`ZDIdx+vpx!J=bkp8`^Wtww=HtT<{73plt)t`83v4(6&XR
z_w@d-ZPkIl*)}iGwk7|tZGOE!Y+LHOZ99%k4LlQ<q+f~uY1<l5wV-VSQ0unsL{f4w
z0hMo#!uz4~LEAR-SKAihk&+HJg4S$XDrnnI{At_L|G~C}1*Yy<w{3DiZ5ti5Z7k>?
zw(TfVdMlDQ^}lS}KL4<7iL@WKtrEXx+wQE|wvxZuw$xv2TVY@Z5lAhtMx?FVHZGK9
z@2YK!p|KVaP)&xYYYcP@Xxn=Kt!?W?RsYSl#r<yEVnEy0h`vV937UiL0c~3=%bC~f
zwk>eYwgs~0CqaW~|H`)I{%PB)J$~4>;-9uHj)C@Hvu!@V+P1mhZQH<4+vc@u+iHma
zCEMmTCRMOz+v4WXC7^A~UbSrjpl!=rwQWJ5Z6p3^+vpx>iW<@}Y1OvX{>8QpAr<FX
z3#^qR*KON2G>v$<pcNYPt8I$|ZJW(6wk>Vdwgs)(HlLri%?G^l6MnO8)xX;|+8?$p
z6dlln&IfH98+zTgmHo7B*M7BaO@Fg(g-D-YZQB7BXwIr_D_ys3PthxbtG4ZA@2YJp
z{hMv8{%_hgmw&Wv_t0k={)KI;q#-q0(aXVXo|k^HZIAwD+oFEAZCottw$1OSZA<KR
zDq6Q~wrjSH|EF!s{?oSAfVS=Fnr+*Hr2S#r64q=RH{0KBo68@zZTjEZHoyO9+lpDa
z1=-eZ+X)Xu{<>|m{l&H=uiCafTnc`_+qSTOZ`&Rty#KIm`D?aq->Pj(|BG!aW_29<
z&9<ffVcXh%+BS<-+g8ylSNk{HM*C^oO8#56E$lD0tq4i~kGAdf-)vhiVyfgHZCmwU
zY#ZaRwyo|D+Xg}Z@7lJUe{0)L|Bq~2@juwMlm91d+pNDpbbyXh>eZRy@Oa*&Q<FPG
zt4I$gt#p&E0}d}pUF+AlY}bsAt$2x##klvpd^MH#O5ji7=0eP{Iy)8faLSG2)zkp8
z{-%oHBVAMEA)l4;b?SC{_LbhqxI)BaBy;wVTsPX>&IINO4|?Jstven&!n<8*`pn3S
z^JfK9t!60hhwn&-C*`@9wQlX{esxJ{GE0{a^lx^}GbbO;q_MqejzL#oo_1AEGV+m;
zG-O@ai)*Ja$}=cak+&3;x1CmRZur0~JzzB+T7H47&2JCka*7X}Ej^dRcgUSL4lk$X
z@lF(cu!#6BferIK;N)1@_=MH$tRtJZ(cz;5uDO2orS}H4xTm*1JTO`|K6CheaQ6Fv
zfco!NFLK53Wok0Wthr<2$sL&)h_X2@(Rm)dc|N`Q#o0Ojta)M3ww2EbKDf*|Ixns#
z>ym_cIV;kjz`dd*a(DZJ5=i5cW_K{P5X8Va<;X?NtVPhqotT5Q^rXe%5n#e%+ujc*
zk&D{z7ej<T7)E{&->dUY?7Hj>*X?`C3_cbfR}s+3dCe_)t~oi;BdME(8umsm`M!Ty
zSovP<!H6GoDKK)XpLY&qaz3J;(%zs>f=sSmbf$O#K7QM|T*Tnz#}K{oOuSA^dExlu
zxijxy#xj><-k`$YFKeJiQ?fo^-kX{>>Ux250x<Y=CF^3W=<pk{w!IC#wvrcJ=Jsq1
z*Fb1r5KNHcQ*5o}VhN(LZVzYk^muix6@IF0bM3X!YkK3STF^e&MXjevY0lrQBG9pK
zzFA&c<_TquFGmV#A@t@x_c2Gm`|bL^DfIi(mhU4EF6U)^9H>ZT59*-$Wqs00ygGB~
z46SpwqL^_w(uqCIz8hS_W)WrKiZ<yNPWHaVE)gAo^B(LSH>7e){c77Pyh^ww_)5k9
zv~87n1xachY1h@fVq|tHotT|`T2&xN(4}zjqmOl@T`kt$S#c?C+Kz6MXO(!6Pwr0M
z&cc9<qAqFKbDo`NS8dx<M)6r^|4FaxWD~Z->8@0BN~xPI$BbuXQf#K1#_QqBMxO@G
z?PS+~>4CY`)y~H-VOUHQ^mtTX+Hz!SIP_Qsw_3y5h}ScwU7~ST=a$FQKD;S1@pxdx
zoGHxTsZwY7XzKa1Pu9;=j-46){!G(6KV3)pz{qgul#>Oqq$vH?-S$mEu#L^B-s9&C
z{TdbD8u&CBcEkxOvqxW|6!X=kr#D{v_WAU;&mVVmt4{O;0q@iGlP|Nt=Lqn`dvSyT
zp5t@+eF7yjtjN$}x%ls@{ed^T4~`qMNvRgnxi|Wn8%j2?U-1UjD`uR_+BtVW3uDSa
zxq{;C2`P6Sa+|)fJXL(oP&{6}@|uuIU}-zj{L49WU}tnnQF7Yl1q;PJMMv)_=8^nj
zB*2bTx2z*~vbgI}OdDDOU!{-O7*O$2T{^*fQb57PEIW?xp<Ubd77veXZq?yvV+8Z_
zbkjadlZ`mlTqTL~X?b?+mp<59sy(i*OWO4DgWZ&Sthj`$B<ZDqtN$g4sjG$5V+ZSf
z=N<ISw$|`l&;lNxaB@GjC-0F<G=H#!$+GOBB%$<l&+DF7PAom-4nHqYWE_yxA+^if
z4S^0o$eHs5WMe4`+F_VDj(|3d1=op!ohS~?+RmGM!cIY#T*BwS=kQhes~`r#VFH6y
zu5Y$DOYKwy#-a{|wzondfwCx0Hc7yPJBQ)>Bo_n68_RA|w8oOMeTic=8}Y&B`v$im
zJ^6*egjihkA(NSrsAEgj7ix|#eSRguR@>m?ARp-Ao{_6q2#MXvGwGGH+e$8tS>TOz
zkxex>L=Y2QQohubZ;yo#L(bF+9iTm$N=n_*4|b$pku{n|_*u;0QrcH#uZ=sbTEra}
z0~&J+9Fz)q6ZKXE*c8z=l-zRjKF}gAEerVFnZcU#YtlkGB#U=k{x;w3a5s!wk#DaQ
zAD$-Lk!wmHG~i9`cZRYZF&}Dtb6$LJUdphO+@!0%ZUKy~XzTlL#|qlg$6lro@Wl5G
zGsYVO-d?$KGv#g5rwGM{;)}s=uvV%+D5AZ+ek4c{r;X-P(OYBLE(wa9<QE5=#~^@5
zHoF*s2sPk>3YU=3pt*rs<gfr99B={WPVnyl;7FQ3zG;XlF8~29CriTl@tfgb2@lu=
z?4wu{R=fy2lDS}LRrVPxfRAEf9O2&zKmhr`R#mz;5uxn?Ju*j3vG+g}(*cw`K!gy+
z_6c;*Sj<UhVC<ku1ftB%RDff#55gpt-G#KS!HJh_5)U0WTkhym*al!jBtzQ(#aH?(
z5W<GyBpB-jGoJj%oChUC;eh+xb|8(D6R3}xRF7iaqz*teTlJBjU$v%akHI99;ZM?+
z0bBY6lvmb#I;W0!`-C_#e=!Ry3Awe)y%=;*hGM%s;;eQPAoO}8aq~(&*{gVXTF0<C
zR?gg_?=97Q_XO|uxh~}Dx%_U5G#9fs>fGl5e#~I&#^)z=G-A{wit9<5_Zv*MhAlc)
zN$xS{A&^o%S|L(TTcOjhs`Ufd0G+W55T^<fG}q|LMRjxba(>vUq6OG+rKjBX`nUoc
zPkwz(!uDMTFs+nH&m#Xxc{2zRqX_}Z9~}^NtRO-=h@p*(lH(j9t!K;HPu`P^<<a|G
zVLfe=&5j`IzNhaLW+!CyL0@SlqPY#YCg?jl-M5`7D#R3>l}yl%m9FrDLWWZVKX2NI
zypDz*i}J{n6_Vw~oAcP^s+Sr$cdoL<@)&?$Qf0q6s1_X*vH7xhgw54I>no;p5M?AY
z+@eF))uQ$Atfg%!bEDBfikh*wxomH@-fT~4;K!ofy8;I`5XvPLG~d{raInumiWGPw
z*2hmzbsb#kF3i8t|498n3d(Fua<e92Zj~H$w@f@~S$&fLK-iuNhX4wR?yS~c1F0RY
zfDWd$-Vy>x=H`|;?N$WjD^i*x@W?0M_eo*=hMz4x2+W@z<*}%=xJYbmkZOy9nnCru
zEBV-;+%GeC?0x2-Xj{GIo%rEhJ8lgMqXhKQqxcWDiMh&(wegA!`fmU~#@{L=#cM7|
zN}^eSt}z}155NubnPiF;%<(?eaeG@bal`H$o*jYh@*<u98`6OHVEr?2PmsvRdO^|%
zSU9N_Yp~%Aa|{T<BQWZU(Jb1eFbvQt-S!MHN9I7;(z8<P=BOgNBtBLKL2RfO;OWa|
z?O2pD#}ap{RZZU3ACPIROdoa7bi893ydXc8WTuD(0hjL4NagEt{k9lA7fqvNMHN<K
z(;*iD-QyR$FddU+oB%3hSP?=X@>Hvx0n*>c*~oh9YXTH5<hTfy*beb<<rP@mYyQRQ
zP0C<k9-ScuaA8R)9(<HzQYh+?dlmrF1Ew<z{{nargU7SMd36C1-*<+O3-v3o`|p(4
z`0lcGE&-ewg$PwPB6dNT(&A2$57Pu>j5zptfc<&gi5}($x>!n_sdCnBNzTI%Mdkw+
zn9RcIKo^^#5vNtbNb@r2DVL->lkHE7qhhZZ@%BrYOR>M=wZ)&5631rm*ycI!aNJ<B
z7`&`ok>ZT%H%Y}4mo2mdc+8#Cq{Q^@NFC>31qI_vwsZD5+#^DyVJLs92Pt^cFkV!9
zP|Gyw%fnJ#X$o(KIbCzYtim|k9Y^9&rcPz+0Kf)5yEiGSUmkB!gNb-d2t)^N;|xfq
zL~bqM+Z%XlG+Lmv=1>ur&|dSra0(1Y_J|hDhuwzlJs$q`yVmgoUHdk@-K2{*Sh(`U
zdO$R*aQA8V57%TYo@pHsu$R<Fmzcp6S-4rZYRjO@HBY~L|01-{RNk%O74!6aC$F$)
zSEM$4=60A%Y}qvYHFN8JX97$B*p-q*gY?{1CkGA!teO!r;?4`vlP<?nJhDHt_0Czh
zVxyo8etx6YR?Z^|vHbR9Q000!Cdp&c!2^Pl-P;N0nTtASr&|Oxzu*-x?TUt4wsxE8
zLdY8w!HaLbSeO9-1Ay3eG-Ep#!i)$3R4<wVfEo&k0d^Q9fknM{h9nr3z#f9;!Vp<(
z1>-M?0n_=W)K;i<i7G(TOCfLS&`SmPDS0YcuA-sr&93yuN;888gMx_g_DYXd@$e0r
z7{FFFR;01j0k6%f)t0>-1xM;X)T)JR>AzFZ0DRlBogvJ<3LCc(TaBjS+pI5gnHlb+
z!xhcoKznY57JyYpIn+mixvH8g?b({`LuwQuGe|2wUeV*ieFh~n%E00SQcm3{6^Y<-
z1`xhPemq4~Rd^e%?$ARxPYA%81WXsVD<p`pDaQ7yq3o~_tKGzlQBYJXlpAboV+$>&
z0faSiVWyrFc?;!nb+=?Je>!k}zWw$WfHegCplF&S4bAIs5z+uuI&oMGf@-~rO#)8n
zLs`uL_9U&eRw#-f%hd`+5DTmajS<TLzabRmOXRqI!MHb%1#7@%XP7b_jY66r$1-kj
z1Nh}pTvaluv`WFdlCqaC3M||-<`QBeLWn#a5Qr~eNk$u0-%#@Hkg{*@UWTjFjnXEm
zJKlCVSf@i>+pK%l`Osk95W;4W{c+q(uc|$@t374#My910qASM%3jt_%KI#K@y<`Ds
z8>CCg+>E%h3CpILeI}d;t(Q1(J?Eo-m;4m~!v|p4iN=G(O`C`sSk%i#13RSQPG<;2
z6DaIAPooOSx@JKM`oO|n1V-?K9N6M(Gwu>cbhYWYQX&;&)BR~|q~<idg$HkjB4`7j
zU0Ah{gQ6uRs`}Q7eD<prvi+@esx@HXeaA52dfIhLk~h_r8lAt7s_&6nZw<Gc=Fp>q
zHUXhweqL#s#58wCKA+sF5P06uBh};uRf`IL0Q5YrZan|CD|?uveKR`UTe5QvL&`S+
zwp?Ubuel?;1<pPew2-y7lu#856EuPY4&x>?HOm2~8j11}xvC6{7FD4110iM2LfV7R
z&^`hcR0qd25az!XP1sRwV3shG#Q}D-_J9_W*r^~TTPdcx5lA=)jw>MIlOgzN!V#65
zGOjsNb7Jc7E*(ObEjuBVAg8*UqB?ECgVo@n6X3`aR)QIvev>2oA(@?`<w{u&H|wt!
ze0;s}$q;p5_o{_7XGC>$kv3Vw6_Bt2?<gFuhnoS>!;=QDz~!jX6dHwz-~4D$0=5xD
zR;uSXOC_m2WsmY8O@{Y`$6Hx`TPKkaTa21se@@RZP)7#ui^R@%v^#YW(&$%M!lFK_
zSSZ+GBnNZ&yK_d+hEshH972GVZ@WM<3&*0MHI;aySae|T^otw^{Cxu=RMr4sIan1x
zB%_f~2MNi^S1ChUr+cd3Y-Kkj9JX=3Y8K>;;yQkP$5?5dJZgJ=FDN2KJ8yGrvM{%<
zfwh{YrRUkY^<^w~^~aHI#;LMWRCNqo!VH#VO>v{cl-@z#6A)(Bk2-o`KISlW<MZ5I
zPn57oMlVe3In}`z8u66f8Q|41*3|7Z5|_1PX7@5#>&cLMVowLqAQ`)rZ&&7Vd)#Du
zDv`wEoCU9kU)ywx6$#+$vF0QIiOs_s-QGM=n=1S`bzv9R_Divi4;-8yr}{pwo|Gh$
zNs!*sm00m~3Lvf?%R2$p$c^UEbbTvd3xp6Cuj6*z&tY{Q`fOqOkQ)MDwlgq{&DQQ?
zH84ww(<OYjc{!28TSB&WhOjgaree3>=5xxxKFJe@W7CZiskTlShz^FV-wL-3jCVsu
zhw__m*@GnQK}PJfgG)HuQO~(iqe)ww$<Gr^lI$$$(PQ3J?Zbn4VT0mt$v1PO1xTcT
z8s~(~06W9McA6}(Fz6_W$}%dZfg=%0Sd@NOwusr&T2&$pNs&QI=&?Cm+1cP?5S7{a
zv{cdNt1G;-vNGF#Q!MXL47o<9JsLVFWtH;qGR4*P^3byV&28)uhigLDjP%3(1s&>f
zj17!KDhL^Z*@_$DtG)XLiCX8*-t#%V0XoDTUE<oB`deBt4y{lOe;eTIdgCyvc}tN4
zgDh?hy-u`Ez8Yn64dDQw9DP9`nI!wssq6fsJI3Q~Sm!Oq2utVG>gnNbv*>Le6jy*f
z=Kipz%AS0K=PYS!Skk%@TK_Qa#$XTJ<kE~qOi8<}_<e_IF%U~GKrEcu0Ysn>OFQ(M
zJrUKFBM2RZ4gwzP0JGx{Eh!t#0jC{!baz!t5@9>L#93tlzD6L0k-n-WxhiE`iSClI
zI&?zJZbZD_nwCuRNC_FDXSi<Z$^o?`$8NZWHW6nbX5LET__m5AE1(s!Lz1sov1Fs2
zL#zs5|9Bls_D;gEKd_|3O`@n2#hRAEYebSoM{(dszN7HpGsc1r+mi3W)nzHpgeM@D
zjIiqfv1Dsk>Lz;hZO!r9hdtRFD7--sH_QQ@)+9Xg5nlGdIn6<`PP~2~M4^?<n%Hr3
zZd{Z_`#?afm9;2Fo5;H?j+)Nfz(ocCh&J*j3`>G=5t%`S24wa&uC99!44zOzR1|)h
zV=2~}P)OM5JAD&cpbdodIm6P4Y&RrW30-C*0%UuDTC2>t?E#08aN_-(eepynzS@co
zz|zH#&Ta(=U@;G-#}D6LPh$~|cEBS(Y7sfc2rjRE;l7u7GG-jCqY;>c>_yFKjC3~Z
zO-~$3SmFdXXabkDhg^!wQZyf^%07)6Xg4+kAakRUD>}Zq^~zk7D!NaM*)@jmd0VYV
z6-ftr2$XyKsG?)99({au!v|&OOg0$Y>ud?{_Ce)^HkfjezpGem!d}1c0>6EV9QXBt
zns%%;cJIbxhcEV$jhub5oXJ40RvMmSw0x79Hcd7nzB}S)!PAPdYlUr@jt*`Fe+xt_
zcXy0RZ^jcH<ud)7XPcaSq1HA=tArBkf7aUnJ_91nh;psxFb;$yll_CBUaw=&$@@_g
zhmWN7k~cVKd2UK%oo>C6^8U)qA@dioyf}V)P5vt2{r!-gA7>A&1SdIrqhy>15C;xx
z`UcSHn=<0(Qs`qQa>=iJp=}xxuw8R9-bdJ9p%j&Z__Fvmi1I2}Llp1{FY$K*Q(oCE
z2XgD_^6U!QJR0Qg5~T95@6|GC7gs^FG0e1=-GMm2kyA#33nlU@u_xlF+)1wTkc6u<
zP>OZq#@Pht)_@>+$`$~s+?$|@KgX03ELaIik&{XM<bG@`bAt*7@)d~@1rUvRDE$q)
z0TO<!2;rwha-maq(w>Yr!5W$n4unVgNl>|ZUMD0Bj50?wQLGqHRn7DG<zXA}D@X4b
zZ9YyeWbvVIppEj0LCwVNcZ3wU*qxF{ZXUS%zR)4HBG<Xu7&?L<1Glc{HJ%<<3XHb0
zj@mg0Z>S<g<4L#i2!3m_X2@HT=91#44_Oct6aTSLGw9HRr7|RH;{zeL>G<Zsgk59X
z$%fR2Hz-2B@ZDz+4zivY<zq2s(OVx!N2Mp+t!MY!wXwV&b@=_s$jBr~^Aj}l=<U>{
zZUQXYP}7wjEz}jox)ILY*b8%NK{!rB1@}@l$NDG?5*feS70L4@eKGvOrImEZ7Uri6
z>d~~lpD)bCaWjsFKOKviUb>%-KpECMk8O1egfvtkFw0Ix%KUa1YQy4L*6r|xW`rFB
zktCXuoVB!~iB_?OU!{i?w}h2E2rC^8D|;VS&J1I4o~jT%Rrv{SQ6F8o>r~C&Q?*A<
z)kU7FKX<Aj>r`XQm+c;L7dg|-iJ>uOpI#E+`}8&K8IX+xWDGr8M3*ci`)$05;w&33
zpm|;?5Q15TxDxopT+#}d$0w%4A27pvIZr<nJ>92#`jOu0{#~aZ?>#+m<n)us(}U+u
zKg~KlRDSwd%jsdK)6A&b7jHx&FF#3m+O*Bpy1hR=bo64V^zgUYScEa~Dmo-$`dq|J
zR>bS_h&Oc+f=HA=eZ*T%l;Bvz9B1UbDD$-wWI-?TLqWvE^2&$EmA6k)m(E3g&Wij}
z!2FoS{Io0T%P8~B186cU)$I@4hWu!m;$?9+*RA5U*&VOfj-~1*jp>)Yy?IhK>#R@A
z<XF(;V#E-Y=zaUs+SBVSLX+1zQlM?C_PU9F0NOSl+`$jBeYqAF!Cs1Q2U4Xt-?sE%
z&1+6N?efugueW%XC`$MYHym7gTT~#C5PtYgu-{<C{)c@TMHk*ZyB@|Se96<B%r94S
z6n`m=dF>%i!jiCAc#F9)hcO<1=d$;{)YjX{p8iE!Bz8*h*O1F9sy}^rW>aBZ74YuM
zmbZf{`ug8(J{=t3cH1wrpK@`lbA?*&h{h>F&4u!yGlE+=KAv2d)<|S;l-O^dVxj~W
z_RBrkG2N}?sAeNM$2#SfdTUf(&ySp?uZBk%8}8Wlqa$^B30b@4;<JF2aeKDYD~}=k
zLHBo_ciYTjL48EB(K6#F^UfY1%blF|wBYdrPTcd%CvHtLg_;L-h0f%K+>1NYjYlTR
zAYK~F3$J&ix?C02;L~>w!&j(WIBp>%jR-q<BKMr7yRT&0^`L1nYT_Vahp<FC^R|KT
zHL2JqaX257DX|iIAdf;ZqVtS|!&*mb1vBYvlym+(H==I_&C5#?pJWdkFwV>1;kbMt
zh$<cD$|H9=9gfoie2mG_MXe-pWed*{oE|-i9Oiv_E0s-cus7EF>h*cq)sEC5_lj>0
z^kat}%8O;H$r?P_6EPdNx4b2X|1G2Zxl_^=1Dt}rqK)KQM@k_%@R-esO(o4U^;c^h
zgH9bjK9;#fsbN5V-oJ6RBUS!1;Oo^A<ZS)!=*8D)<-lckic(8cj+jL&*pUi6GzGot
zo1){G{+`d;m>THM>BK*e<h4^&5GVVucBBLyJOg^$(DZW$QOs$2S3%*ou~eLlD_U4}
zwIfw$Pj~AnQIV5;p!4SAv2FuH^LyMT3OA~oc12kf*PVnumw9w#yx{`F;XS5P!F9DG
zRrd6hx3e0#bhm&{){PgNE|siyq<A0W)9&9bO?!TF@s*iK*w^o$MrC1OM@qjm$9R0b
zBNdrZ{UUjXdtiU6+iaac@oumqb@S|Vt!a-}+^_uHdeA#KvWrFV&x@M^j!PfA>O(<0
z?uIKU>UDb<hm?QSEgfrN8(mQ7o6YN@R{FF}%&m2#OgFccx$R*WPg0o4Cf~iP!8jVP
z5H`%6DR*MGsLmH*$4uR?lQ}kb-F1mxadIxX%qVeQs)NftBv=Z!*hDx%b;Y-tyxWeA
z&^^<Nn2qD24#w{i_m2Cz!JF$#aUXjKLDWq$+l7JUhZ%NV8Hi<&gL#baJFDrFobfh}
z))XAvfK6`lK3SuC$6NsYrszWh6ybF{C*dL0oF<O4T^7ms-~p4K_M|#4>vNr4?MTgg
z*wDw_X9+h<{VL-0DvjSKkva$a#S=8-Bn}SLrMY$l%I^Cx!8h89((Id;RtwapCFLMD
zO1>l+tALwBG*-&;ynxFz^dKLdPoWiyFnlVZzwKekChz+SDJ2qPUTs@-X)Fob^!H^D
zV()xY7eD7^c^6r$nWn_9Dpn{-m1TZ3FsRq;ON4*!BFGjB?mlaK<N_7S^(8oUhsevb
z`Pyb;oHG)7l1H#aK5ylDI|~6-746h%62FlbT906WrY78kZ$28Yd3>A$200+y5gKpk
z+=lM9Gs89SLpu(ea;MiD@_fT4=~q{A*Wk^!zrTr2JnrdI;_a#TLW>mI*DfGs(}#2R
zq)4(aWPzv7`X*87+dB-d)s4~RxUQXXCVvo+z!i!Rg1Ytcv(bAnI~5PgaXI8x(WG~h
z_?u1R@w9fdB@Ll<|4xeNbQC`W`%tn^YnM)LHpg4-eVYTfJ;1Z)a^%yE?GFpu<OrY0
zdhCs`%NXkRMdLUL=`VJMgfi3o8dLUEyp5Aj&N)-TF-h~@$>DZH1-X%EBzY#VZS!pF
z?Ov|O{#t+?CL)l{x&s_n(DE1NImM<r=)pCZc1L<;0Va`Nz^2F`?O+!Y>h1G_Ys^J+
z4+q9e1{!g*9M1Di7L4g;p;o<4CYiy#qVeipEQzupusXzbE8!7;M`Co43wij3bX~o<
z4TY_JF7s>0acoJTzM#m>xDgF;_V5IXpG_zF*0u`*Ce~3K5(q3jVoR*ofNobGk5;mJ
zFkg~p?1pX_8$a;)#-}aHVULTQnqww!I8xt-zrS3i-0>J&GWOc0?&(gWBGxP7`URR5
z@(xjx4&|uxGCG?t?|H+ts?Gsw45GRFOh|(hZ24^{X<<)Fu8CO=-)7|YPyqY~6pK7T
zDJAVsbrQvUa;50J^J3i&bM5s?((270!jC)i=wFI-yYyzKyIhh|5}H2=cyIoiE2huO
zgp*p`o)C7x3I8UcsIIq?(3j+92TsU^EzcnDT6)fq_0iDK{U=@|2nsMru~5$_xz<xJ
zznXo%z;${72WX+I5()g~L~~1yZ0O`{>bc3?uk!b(aMkcU?V8Q2&QsYudG(Tt7-022
z3{}ip^?eH?oLu7l=G0z}E2?bQGD>|8KT8@O@v0j}C>?Z&=QZ7wjU;Hcb6@77D9A#P
zPQ6!m3LN)P@W0I*Y|ilCudG06-|cgc;QsN@!Zz5O4PM0a%?L@BQ<i&j#P8bWe`2?^
zxu@C7FBVw)28XZ6a3gzme^;BKa<st&hkMGPf@W>ZZY8Y)G3V-hjW{e0y^2_zVtt~3
zJF)*V{MdjvqGT*;Wm$MSN<FOq+=#`EievHbb`MEk@n}c(yi&jfz8Bc~K<gy7F+g}r
zjJ>+kmc}Rf10$-TNoFjarP=HUtrlIe{sL7UD1&*kCr@)j2CA$N>c=}@pFq1V!zuo(
z(QdiKo?su+dG4MTb@p~7A3UUQPwJE4k#+&WiZ(IYp<0d?ZdjZQclSkYsJ#ai4~29#
zut8zz!>nUt%;&SnN?H(E*%2$ITKCwL_*oI@y-?>oFmN~<YBy+rJ~60$Vg3=~KJz7A
zVV4Xpum>Htya!S1+%R4c&Sse*GB0r{s{337n{$U)S$cEyzK>kkDDBaTjuy_*@0s5o
zi|f4iaBGzNd@?0uW6KEi^XJclUjj)@LOpeZjr%pP&PU&lkS*4vSiKHpwS&te=37EI
zrmqm@t|%lBMS9IhV;P^aO(YVCZ0W4H>9cG=CsuPz>;vccVKB9E304`WbQs%q$q|z@
zf;-;UBxbak0kB*1k8F14=#S!V6`7eQ7EKZpkL#oBTR+uf+0jPmGLNfT9_;3#-W??N
zsoS!xOd_PG)sZL|ym=Ja5ru9wP@E*9F*GAOL0>(SjS=^tqLn?jhgCf5Vd;Re`q*cT
z5r%%Z?qdde`hoBeVPgOklWzqddAK9ZGgoo!>F&|a&AekM_s^Ghesst%qPoLUXfxUF
z0fi!O8bsa(U3HokWmaTJ)Q-HtxxavPvNMplVUNlA>_dzlaWnAL=d1xJGLF%@(X(UY
z`5avCpupqyjo&k4LU;_q&l%L%D3%QF+{AC?ea2w$K68W72FNw`*qo7GPt1xKn~MiC
zL9DGJdqsT=#xaV#j&=V=yK*9yjeQ)+H_knakYb4w;PK=rF~Ot@2muJ}eSp21hvPMq
zraFYe3PCuRTPwXEje)y4^#tLtPAoCW($atj@2L~Op(<=7XF)dT_QKVQ`wvbK{F9BO
zC$G}l4Zci__O`zZG2ZxDTuFqi7%pj&DQS_Pd!I<t$D~>`OIqH_?PBEWA5XU&k+hnc
zyh?Pi({V5v+!Nw&AozjeG@~Cfm}@1SXR9O?iNTOI<e6go!aAZv)9<@~JTIo2=NKU6
z)P5`X#-+R{=uP9H;BN#n(WB7(f?BYYTWy|OaOaYg{)<wUkn;n^{-meudz$vYbX&^X
zyRzS^<E1P(mGd0pwoI_OPkib<`VK4Qp)2hT_1S%y<XlN)^QVaWTWn6hzuAh3J)<@D
z$SB|U?9{%YoyA)u{qpk<mPsF~%|FyE?SCuZzeoD;K>pzo>42&HfLZAyOZi7uqyt$B
z0y$)Y1PX#gWR6M~995DzrcrQASLV1$!Eq~@6OIKZ++~7&3W5V<P6ij8jF1V5DF`_$
z6MCT_G*c!lzaXqk=2UILsb-n*TLs}gGN%U$PLIe$Ocg}T%0w=KQy4Nt7CMnbHcEgV
zB_d0brjwLpqc!N!y0T;wI@wB=;z*~s%f|T7V*+H)1k=w%$WmkI)U&d&7wEB>vT^zJ
zxH8%JT6%o5Y{D&iLXT|X06lR;_Ush>?5ym$CHlD)*(8?2Bo4V`fx=`Frd*12VTzJm
zszza|u3VZ)VVafPdB?)@?s6A=3NHl6T?{U~7$KJ)Q<#2M?$U+AOPO+)^9wJR$z7=}
zywWUp^;Y549=VKx!i*8Q%&Ef6S-GsG!mJfJ8cPw4Lq1!eC|g86N4h9SN&cEf(KTK9
zT$7?)EBQRfqC9u`e4nEH0QrL8qJju{dQ1`htbE~xqQXr1qWq$wGWp`#qT*)xl3PV3
zJ@TakMWrM1Wm83Ev-0IjMdd5<43=UBheCxwafOINrF3znl0ub6ah0w@wMlWcl|qeU
zagDn|txs`nfI?kxab1K$eN1uvS%roR#SNJXjrqlmWeQET#ZAo$*KaY4ulFe27%09m
zqR>25+&rt$vQ*r%qR`4x(#oOOCQ#BQqS!87(ypX<Q={aju40EtNr#nUr(;Q{yW%aM
zl3M|aw}VS=M<{m1lysd{ymO)CPNw4B{F1w6iuY<u?lmiR-zw?uQM^A;a(_gzXR4%U
zR`J17$%7TeUY62c4%|b5(uX3rKIzgvCEO#8(nq?uev{IEE8Jtp(#P(&0iV)=0Nj({
z(kBtP!I;v)v$&@hN}p!phVn~?%5cwWOTi`g;ajD{J-FusrO!ujBU7a#v$)Zv($N*%
z7)#k0htjw}*|><(gml@2lF|!}vKP8alO|=8R!T1&%U-%GP5G2f1u&If1(&^wP@0Y@
zn?9>FbD?Y|Q|Wbn+3PZ;H??JNnw8$(Dtp_b^lqT+-H6icRN3sT()*>d_bW<sEah_?
z%JTx{^CHR%(&Y<E%8MH1i@M4mOv*o4DSvb<|LCr~<Ws&Bp!_Mg{8NPTa!mR1S>?|c
z%0Fi+f5|WZQl|X1w)|_e^0!;%-+Gk450rl&QC^uUUzt^AE|oJ^lmS)-z=?+lG9aRO
zs0;(DjE8MyfLRH+DFeO>k8olj_TpI%Fj$V@Sx+)pBk{;H4CFaH>LLS`g+~`K(B*ix
zItE({p8Yn1{Q-W%6UK&7JjW{r$9p{ICk7`I&&687#i_zASY5#_s=^~v!K19gyS0K>
zPleC4f^U}!zf%SOUKN1@6#_?81W#57Myg=WRAA1j2wkiY%2E+7s1Pn!*;rSxu|;Lm
z?TSqgR5m}U*gUEt@~T4Qy^83k3Q?vCmbDVgsVXK|DJH5aE>kJ4tSYg!QbJEv(zH@?
zm#UOgrPN+k=>wJ0M^t4_R?0-G%ATo|J*O&nu~IHeRlcB7zFbwIu2P{zRq=ME;saIO
zlS<sEs?w`UrR{-)pOMne|1#uO5a#@+PN|N9=zmO=UNl~<m8P3=fwj_$7X0hMQo4f(
z*epHlWV)U$jdC;ikL6OLpYwXWwDF+YTEA5Bf6y;oGv1c7WbM?L)BXR>c<=tZ@ov2k
z^7o2q{pB<NUV8WEMz6O_{|S2!7AO91c<+qq=Io{B^oK2#|6}j{w!h;;|BcW6P4fdc
z-#)qX`AO@)_1@3^@AKXu<c|G+ko#B2eJtu%$Ss-6_ajoe{3BAjcP&!-WgT)`^Zyzt
zbvEP%Bc(Zf(gIP2+}eMOl)m5uBc=PeZU2mvqO&Jc48Dy?a%%Vg5h>Ljm*mmwXGrll
z*n_ije~pwL1|y{^>yc88crNQDAw#qp0gRNY<#HKjoz86Q#nq+tTPR@e_r>AGzxRQV
z`yCW5*^oB*19F>w1L6p~bMY~Rs<}Y2Q9HoYyl2)7Xm%Ux<yyy?UCbqt^$#GOJ4(bi
zrx@^~z8}3M21ZJ!xC_wLY@8aTiPcCcUpMcMNGTjmbh|3{l5;&$$}{n{$#E#wrbLd*
zjZ5-CKM1+oeA_|DT`O)T7uKK5CPn&iv`dI=EuVm$)n&hfJAIWKr*gx-#9WTF3c1tl
zE$@Jk`&3tH$7J7aLI2}xkUKmEy9&8CkMqDRHfY0n6R=6$wzoGjRv~x$D&%G$d2sEC
zMG9Q<3U40D$v5b#sH#*UEB*1%@8U?Qi&xhmw<%Jp34h#7w0I42>xf|`q5NWF0v#Wi
zVq=PCxqu<jmdoxC`sRoANa;_=9q~(~bgRmGq%?oda5J6#I2#x#&4iA$v7^SMI*=)(
zmmQmuNzxswkb4V!F=o1B6>`@golS?jTTJt3QY837(Avle5OVuLW#yUovFwV**yMYW
zTRv={VNY}ME_2qbLGFS;6D1IGD{|5?S5_mXWq03K{eaw`4S3DKNU2Y&4gm$@2S`S8
zKOnc}YNV8cZki`z)*_|1qHUKqu&zf+x5%Z<2~Z9iD?v}jxK93n+!skWWRBf^Hm@*d
zE*2~Omq@9k30|q~56Dga1#+7v2&fcu>^KNQZqtN6Bc*sRZ5yuDNa<4$a#v4mNZS#m
zyb8JV37FML>4#Ow-NUvXDXr06i<G*fS0kmU=rapEIkGpeH39bt1{qxr8%BPC+~-Nc
zgOw~rT?mdJky1I#Q{~l2DbGG`x&Ig`-FWk<4+OjOC*&>!TcYK}a0!-6&SvILx?rT#
z@<*if<4?$~?*&&yRBwzX9{dq0Re-99<fA;n!(dkN1L(g*O2zas!utmlr(gUDxvA)a
z=Oiwm5ro|G)VQUCENhX{B`{LT$M-W*iU#k1-bJv-&4G~H3=^4ifM0zGgxqH_>ygqX
z43|VGel=2hEMDyXdZhH^{B^$7Na^J^jRV~5tC7;1*u9%$_}JGXrBW<r4ak;c=~PVV
zUm!Ohy9Fk0!_kR0{EtYf+K)&ndS7%iG%3gI>l0BXdvuL97%8<_hur&CA$Lc#GE%|`
z|7WDMfr~71a20Y72$D6U?`={|Sc{Yz7_3D~^8voUL`t#q(U|b{Na-M6Q{-o)lr36*
zEmF!SA1oB@5tWKb`xA0^tU~UiRJ~3Qw)IHqR(-Qr*7Zo~UChr&>0*q`906&Dxd}!}
z^}M*+DHdPANa?~l<aX&0{3TKv{u6SW;r|M`%`xkd(hQZ=Na?OQ3O18Laq9;mw*mBT
zk<w|@z3p(pTn0j!C@#2fJyL4O7j?iEjFg7|gxuEr!Si6G6p6Y_{0(vkj)9O{mgVxF
zkb8G47%6=RMoOvwi@p2)YwFSSeZNu(BtQ~6B81){^bR3_RO!7aO+-=YMMOygNV8A{
zvCyj^z4zXwh=7O!Qbe(UilU-9`R=`EX3xI+%spq%%$+&+_!sa?SUgzyyq_<|l)oNw
zqmTT}ko%y3^^YO9>E9c2*I)J6NJ138fS1>Ge3hP-RsAMl<;-C)ly@Q_?OdVnXk3>P
z(LZ_hQo+|72fEzmsR^ccS2%An_%o-fU-u=hvb3t`T9ekg?#E%TQPYX73Y1t1cM)s&
z@sXCRn!}*Xr+KCsMy{}sPuG4di#669IpQgUvAny6^gdM8wG8~cNngm6P%<ZMvbS!4
zT1T<#ExqwcMdlW-vY$L4;!X1DqZi26ow?vB+A*5;Sr<XWfQ!0f<tewBg*f7S#F?1_
z<zrM61tJzSRyclr>SKYuVb9lRMCc|6OSs`QcKQXhBd&^)UeYJ2_oEzr)GW`DuO0pT
zghgg%flmrN)8uDa-b%6KB@sDOR-Z#nugBIu(XFl&f=hLvV?<exGtj+(F)y=)Uo+;1
z<1JbF{0*-?tHyqGJ&T^C6L_2$saqW$YK?EvcY9TD&8fKvrryS#NqNKkg<ff7P&mTU
zoqm$&-!I>Bcs`9l-Vk`}l2RwzRTFpP$7M{)W&}7MI{(;yz!Fj~kK7D~$JrpC+0l6m
zp@oKJ#Z%NxKEdiq#503zS0FgMX}hHuNGJ)i$>Oy6QT>#ymZqS^c97n<O;jivlH#t?
zny00cM=!!D716IinHG2~N`6k%&&&e9{shr<SLsNPsn(N?MXUah4|<N3GTeprqag+<
zk$LqImh#cAVl1x)B|1Jq6-B+9dyJX(LkCh!(82-xL{!<d0_C%IZ;ccTL>6=iLWCns
zk0I(wQb$JEDth436q%)T?WRJ8{&ZO_ee?Opp;FXr`LIk4K1Ea(9xe?Q&&Wtnt%s$a
z(rWq?Gk~+H{U}*Wk;!;0owKM{OOc}P`R8-SomZ8yo~CQEjl4`-w9m%1m0^<#>9f$%
zwf(0wX<fJ=v<`v3xrTxh3NQ>nwARE~tjfd&;6fr4Fh(d<OT`nz9+wv52X^C~W*CS#
zwYE>lI921ayvTF3acv%h{)m!6zvyYU#6eL}!z^%ig4COl8|VQkRajDi<7GMbq>^-S
z1p)OV0#WO!*7-8&35Qg7p0P#EjdKBdI)qf$rey9jSnoPmvjD2m5Zxa^(lXS(53_32
z*T_Oc6sGC;<`|Un98#>WL&yqBBzX!I4^i!bi!5k(0dg-my`1Dws(46fk0D=?*14|`
z1-#+88iZ1hlxk0yr98@L5hr_~Yc<OdmaYz=XIT1_VP%XW2O(O)DbEWuB-6o_8$#V^
z2yr#TvOJ}Nh+=fQQiD)#^t`C*u67K;V1$D*H>bvOVfRH~d1%z!6Y-NIhCXx_VkS7;
zP&@^%KH-CQEn?3)?es@Cwhz)Eh+_W&%>ZZ9y0LkG+SW@uXvTS}Oi=hKYB?DN^wN~r
z2yt}hpSJaZXEai9IafmcLoa3pXJvu;5i$MRTq44>qxv|md%`o4ZWNW{Pyd(*VtXM*
zyHM4<Gg16OVpJz9m~NoZx+VQy07e|Wm8ck`7qO|9&1&V7CVuY=7q-eWfFl*z8o{{)
zN&3o_cik%Y{+{zk@jOIM9z$CmYAKKDd)}lxj<3iPG|Mp4B=PW*I5<tauHLFxK_j0N
z=X?6d%T`PleZCk22AhOzQ`UHZ!?}`>k0H1RyZPeN@RsTP7LpB!h-h)g6|DKQg6O5e
z_gQ-(z!C>B5?c{aAl}9UP>|N@#kS7H_L0SoImOl{hz|Fx+}gljq8J_bB9^tHFi?r8
z$3=_CqgEBg7rvJSNEDM53T|UU#PK0)awXxz@ROE`R|OF+czAsQ9Z?Wgg-6B%40b8n
zjZ{)-Hl-}d<XA5OL4H#j<WU;I9Yn#wIJ1%d3v$f;<@NG<j~4Cvrs?c(mrl_!oNg`|
z#gx`?Kd@VZzk1A-a2gY-Zl!5SmxG3U6@l8(Iu|_}W@n5u0EU2z^jx2jdApFK@s-59
z$}&9a`BQqM8l~XC2dp!+Q(WY|X)zswMkg8)_oQm2O&anITG;^WeN$N;uCcjZF~pBh
zO+w}eROjQ0>+#4sh6fKw)rS(r4M~=Ft)g2@q}J;Y`X*s}5?A4;wDM>Zegl*paL;JB
zlEtOA7!7HzgDpyMz%NA~em#}98wMu_T_)*&exi~@soN|mVL9cX5D~^%M*c`W%VWju
zWK>gcJqD9os<w$lI7PxWG$2Hc;`6)iS$lC{D<rQmx(XfkN57Uxe~ylx#fGj$p_10G
z%@RfPCOb|oN%Q`o^=oSbdmHM}R~26=nP{NPNc_2w994qb1+nH(7U}jH9mjFGsO@+a
z7ap}cV7s<zf=2QF%M!DI2HP>D1)(%!Cb=8I&|m1Uxr<C8Tp2QwYDGh?ry=QVZB_L&
zS}PR1+m$$w7fX>0TI(vlKiJcd*96tjq;&L^rC6R@3eA2BrXmKXJ|AlaGDt^g!_5|(
zvq<e{2x}AM2{eOa4-E7fcHa_q8r^BFP9IM|=GSQC1IQLUy(_f`dYVw2>{qNA>6kT>
zD%M{M;g51n55A(3LhIk^<T3OTL_AJw75`{-KUFJdse0HB%OX?_%SVRhcd@XgL9N;m
z{0YZYz3o)JnXVPtu!sddm1qq`^gTN^;L;I$#K~5jK3lZ7hM=_^36~v%MCA27z(c@4
zU>SKDh5^th1mto6y|#MsreE=6uaam?NwzWi?SngFA;>?<xX1D^Gj_drlvW8F;haB&
zoSk%AzVc%eL|1rH{gmS|wDxju8@ay)=(9}<6}o2GLZWlsEyyAv19zd)hke#LE!Ig8
z!ybfPTfbdoVpP8W6*IJ53H{m<8Xq9pkK@<Gp^B;Qb<(;;c0G{qPOQ<I=yVh@rV=yf
z1ew3>VS$GD2joFP3^Jc%-R~Z?HW{)xJJe#?XI(KAI8oro1F_}~3x3-vv<yE%M5<4;
zSVz)#q#%pVaWoTh?mwVAL9%OhpBP!D8|HyD_Dp>KXi5h<(`<vRw^U8pg?UZq%E+Oj
zLRtH-O^mrtOq$6}9!?CSaI+nlZ{nD4LP@dI(IJ<i_4cvYJ41eN`*QG*YXszeAEH^X
zSZR8wW}4xf36gdT({5JWIV&BRKf)SF&+rya0q#YEW?1-VYUVH|JX4!;Q{}FvO$2l6
zB|1Npm=c=K+Qjz6F3g&nE^;514+yJLNzje)mSUEPa183<Hu_f50Hyaa>)vDD>mo5f
z#Hw~nq$|g5bLQ+!kmlEs^*wX2=L|*x4QkIh+JT^w+9w88_Ero?^Or&<@A~4$3%shP
zTk^Eje?GY|$z$RE_$T)h+D9h~O-I(%v9&5-+8dP1U$6t^M*W=c!O($&=w&6;+olV|
zEer7#$fFfVO$J<S9unLKX>(r$y<FhZjflC-%K02)s*dq$#^^6yO>Lbyl~JUIS(1`l
z;`boIW+d<gr`X9O-4Gl*LlG-C|7AGt!EAom#YO%$&(`xZP%CADnRKXbfEoYXQE~|j
z|Ba(oZE)S^C!|=XC$Y0fp9N73(TW$J(WfDMk{IqjM^9*>bI-G$n8ak8gfQ<Rvvwh^
zc>x22vQYOjTJ!ivPFb?L5{fgpSn~9t^vdU|fa{U)R!0Vx8dy8HoT|n0t`qw~3lk9@
zmf@~u!4V2v@Y=J3F^Hqrq+k5(HFW8LFW*IbpAI{hF-iQgMx1wW7Y%dB3S}u?^`KKO
z&8aw<Uxf`s5T`F$5ZneUlx}iW_A^w?CfTJ-GqB%#U?@|W18fjaASd2bg4d98J>j7R
z8(fO)+PoOyWt?&tGBf;Q682)cgJubKP0;-14_$NZ!-o%4;4@?Lm)9%Zogzz{HSdd-
zmjp*%8+bU$J*Wy=<e_@hu#%sH_aNx@CdLQ!8iM?6F30fCwg(F6Q<<Dno?0CZN9=%K
zrkmG}{KO`7VfmAzt-}x}aIoS>ihQ3#uO^XPZM30AD0l?aZaPf)(^dczU;Jv&kA-Lk
zeuUDG>y5Kw6#RK5fL6CBzd03eZA<P9hSyrtDeSO3tiqUGvbQir$ETcJc>dbWCEZ2x
zb*ZF*mRNSS4BA-|?K-~gx%2)_DBK_2Q~eD4>^}DFcoSrXu5a3$4up)e(YEe!!CFgR
zR+990Ja(GY=(0}BqVl@zntJ<QrK|15TQcmm-8jDytyLcXo@slzrFl(8SG)E(H>N!!
zSrxhmvjbM3)KsLxZt5nJRY9`l!F%LAdDP^K_qTXZg?HqYbgVux{Zam{B7IQE|0s@W
zKa_8$@{XF>><-{yHR$WwVYtbIYkaI>1FMq)7oM@K@EX;?T5B`~ovtDB_ZqEZLY-jN
zIR0mg8ZCnF`2E#1fevlCwIk%7^9=#<xKB_kn1ONSm!NK178n#o-?%Hp<aTnq;NY7i
z`l=2@?<$lkiDm>tQsxe@kDiE=dvN7TIXKv^@h)A&ei}Ai2@sc5gJ_8vNIO7Ug5mg-
zE2paYuJqp(<kF<C?WLuIiGNB5D+R#$qaBsioG-RWa9)FWN3$I$4?yG&kYw-F+duQD
zZ`)z{Kj}cf&IHn;(AgIbp#1?U%(}ucPiNX!c=zYCZ;E47I8e{0(61)3rA*j3o-aIL
zbo?8%;6F!7|2*Vo-ij2MDHt>rzcNSCKL?lNRU)4FSCLZFY`Ig9{t_u=Yg!5_NjJ~K
z$7SZ+_A^V8ZS<l2zw&yRnW$U5#G{_+@j$`8@xtaGk<yxf8gf&532Uq&^zU3^&kn+4
zTo&HDbzIzkzxiyTdcn;uVD_h^a)8G`BAcww^5UM?NUE?!iR;skrzZXwa=WH@p6<@o
zz4@0&DcRnRF)P%McHB5sLUsF5>-sEsVe5|}xBse&%`R?Uba0O~D~jL3Y7Z5BvMT%Z
z<-WU)L*4P?B`uFSn2k0Dt_wOmT2>2rJ^b^m=(v{P#}Ar)9H&q4e!I9alS=n$Wra%3
zzR_RIxP@?vQxghUqqN$+(71tgO>t-9*avL4Rf*Yt5RPv*);)T_%=$9DuvEVQ9VDjD
zQje)0f>DEDXb~(rn})q(Jm*=_9K4r4?-}A^KG*hj>HEpT_|t9WjRd~R2UQ-;%8(xw
z32vYbxxJEuOk^%qT30XR>DQUcUp&NC;|G`OCd8*EJ|0(HZ@3oE{B&b>vOPd!_L0n9
zrKyG7w~llTHRO}m*Qn1?b`2uBrTPU0`%uZ9MCcK>k26M-1#`2e{BECZvT?@w3?>An
zMqyp$4aHFv2RC_BhfK}T`OHZE8}_cpofYh1!v{OYwL_$o1-{nZMk9-1?5#!5o0I!b
z6BNHu@~ol84eYu><gjOyu<K8z+GbJX&;02(O<ik7LfKp|G*=0_crby=^F%4S1<%hv
z+01y}4A=#m`AjN?%SI2wRNb%a4YH+icX3|jtVArGLVCtp9ync=K7Jte1<dHUYSyfg
z{q(x*P~$DxSbks5ULmE6^QN4w8(1HM0qY(+aMM$hyP-1QHf^HIUebA#RK=v+AeGo@
z%LJXsMDoU-DbA#xOlR9kvyWZNKjYv)c0OB?s)Y2bYCZ8}r>xXI^1Mfv%Mpi@&^=2#
zT?NfY90SvglATp*!n^PLKEsngcpUku0qa<?kJ=k{#uTY<31meDjY&2i295HE<Q#98
z`+68Wt;caWWY*O1#sv*phAMR4CH!Y7`_9$NVG|cQy{^@8QB65BElga$_HC40J{T8P
zykjcEO}-nkbtn8ph!9klvLz$CMnntTU$}DV{mtYnk@8i;U6)>7L_-g{aH;;c(j%sY
zqze$9>rtO)&cZ$_mr*04UEgkj_Jy8SSsx0zgBUrBVEgAygt=EiM-K=-!ZiV=o;avi
zBLng9I$iezKI(}pJ=*C3HEitZd_UDy%UMZNln&>(*tB5r59cq$!OpFrq#GF+$5M=$
z>+(T<i+b8?(|YPqY>)^-U$-$pRaD<}xd{(PU%^YqMhHkHSS3lH<G&J_ZE&<`I?4I&
z8mbvLA}g~O<GSI=d2YL(zhYNg*$ByQH_gscCD5$SA85xlV8C-@L69hxK==Le`mnED
zB5|oa4lMxXzZjCp7zm=*H!FI;<TNTTT^D_004BtyXly28MHFf9GLP6pdm!=|^3Z)h
z68H@~QR`Os2w>qTOpG3n06gMHFY5a))Z`G%szZS3GV#Z9YOc{Yy6d5ua1tIxw7_B{
zan^)NpRw72&$y1Ap#o}m?JR@t+|4l%95NQc+@ADX)fBBAdulFI{P@hy23d8jwdmR|
zE_}h8m6f+3ksG~1|1kEHxaV$-v}NCQXgQ_hN`ST{2~9sJG=f0(!Hs(JIK)TdSlRgz
z)*nBK1VL7{)?fF%&Y!z4GP%LxSRsUZR23|IS^SRu+H4M7yrln3zgh57F)Yru2){PS
znnps#&v`hr35p@;ds#i_>X@APhqzwsnxNUe3t+Xr^z`yEZapMUyKESLtoqz-9^n+7
zO)NkBcD`<%-9sgpX<_-fp4P3*JE5HqPGn{9pU&SG?lXdNmAEs+`@W>>Ez=7^fK92E
zyEx9Fe0@owBdE)s`#2Y2BN?AvyvM|c2OdZLoTelkvqw%BUkP1u{+VOk@g_6!!DZ=`
zD~`{e&MO<!wXvP`D1f=*n)rLsVCybIH{ZZ2U2TRX+x^vBvPA&=M8r9JdP*!OA+%C8
zn=JBz(9QK(0A4JtZyRNre(kk=r+3>%<n!_3FI^5@C%6|cI`ko>jbiciuVHc&ITWv@
zBIl2|5z@N{nV%my^lC-Eq8yzlgzH3f>SzS$$)_e{mQ^!o=ADh(OLM1RU}Yg3#AaL=
zE0iiaz-WEfPpU^FPq6hN!Wi_E7Tik>mk&ClR{JGFEECWVvif-K6S%#5(>x}qlpg(u
z$b=Zwl#M$8pv3~S6iFZuG~Y0;2Y>-2dhIyfVeK(8;L}@zb9V<}YiyVW(0Cll$;9&)
zC&Gl3d=zj8IYrc+jGyq1LG<U6wyvfB=$LeIT?G;D&z=ul1Eha!V@__R-;3E`(0xam
zJQt);e-=cNlN_A|)dwT(QX#<Z+H~+wh5W?SB#o9xg{vn*g-_uDQ=lB}K+?+$#3V?L
zfKs(6pKpptzv3+?PMr1$<m|&Gy6pPSX{sCGXt6$ag`6ew>WuV33e5b#=&@EsSVOaP
zk-3)uYGNo(ay|uSe2~E6Ce|+=<xM9M>oKVLJ)|sM@w{t-=L)qYML&@b^PUh3di?xX
zSc`DyRfdebP9Z$0+VAJAJqtIwFs0GQ_i~`n6=!;#90NLlK!yN$?9F&J2)G7hht`<Y
zQg6CBk@rfxpOfP_t%ZmKNcf(7D8i9IZ!!&W4FQ25MueMh0pNT(0BOMug5e|pRF-47
zzJ(D1dQS6Zu7bC30B8UpK}b$mWY0yW2v%4Fa~|N#L6aj^fy{L<LI~)AU1Or-r@yy-
z%upSTn=V9-02~~ay)XbzLfmbA<1nRulOd2qTeSj0z5!BjyjO}>N7vEl5!PE~-$$b~
zKP#i40Q`~Q5ft#O1yGoJM?&gE5cV`Bs7*!UlY-_z4;)0-GlB#GILjZbaR>@T03C}X
zU4C`^0|u(!Q)oeo+(Rb}O3Pc4c?0hm3b_*+>_8zQUk@?42Zvuw&p`pGz=2G5oP>N0
z$vLIqKy&sY`@{+G_Twf#5A9bm+S&@512&q&5b|bB+q<2v5B+gA1OTmCZ{08MI!$77
z)VejMD$)<b6SO8QwU`=k2MW!+#sJ#^hB1P~`x=0!sCoU+avcE!cnYhex@!s<jKGrC
zQ$_N+njs|YIGIyZ2V+#*hU`ARo@%@UcD1BH2)%r?gyVXuq(=8ff1D#g;%NZ`3C-M4
zz@P^P7bEcms9t%jP0dkIFMLLH1yrFMsRPft6oO$u4MfP62ypg4{n5+INy2uBG7Hri
zB|tG9C@haY9YrH-9kcNRv$LLR=L-U*=&tA~+X{lrg~(ijAP#66-(79K+b~7NL6IJq
zJ^-M$2e4&vRer=X!6X-V+K)*yU&rixYQt}*7AR;0yBPEc!nipBKn&!wqr%4}hx0x5
zI=#Pt9fP#&dA`$Zch0~(%76piM>}kLmImVY9yl*Cpz<1qeZzn!ROnY;GhiJC=O|wI
zlu85o_&{XHD#m${<Qvs+JDA9gf&eutd{$t<vY(e9ga*=Zhp9YxK#&vQyaNLgC^(D`
zbzI{ZKx>|j8dTeW6PLBD2->7;hWGWFoL1E&wlSa6v9X_1agG4*MfJ0;{YoiDNuM!X
zErzbD+KES+1_eRkJfcAZX(tF^UL&rDh^yj`hU31&c^kQ)#ZF$39`*-R%oPGGf~*}W
za3g~k^&oS!k!!Z1_G+wxO&oNawv2{Jw18b#p^zSup(;#cM9G!**+Yz<fcACF8NJoe
zD3>Bb#A2NsA?3>;x>acMV*qIBx*kHZh=@hHld@SR<X53x>#>fiv}t>+W&o)c2^GY*
z{9I2(lo6(Eu^n^ca+PuucZ^*vkM#<f^$)<b#k%k`;AK@axG(N)`zW=vvM7HbO-?NH
zAt#LBZW6|Gdv#8*1=2w_Q=^T-ePeV09KcS{?SPPCKM&VG8#jy~)h7crda(%Ab`a^2
z&2HWO9n5{dDc*7orOLQA2mn<j^Vas&#~ASTjzyU10B8~ut=x%M1Mt96NoZ4jJ600<
z<*i0oJ;duXQP^p!KDpO%w+@VmQ6C_kg#tZ=Q}yi@t}U>xBP7X|p2Z^Iy`T9SPv?1E
zK}vR<vl!weF7|R=qJ|M{vj|lhV&!8+23dk@p<UTKsm?vIhEnMks@8mJu;g`&6`@H!
z5f)>X#=@x~ZWSjy2(xRkUJ;7pD~Fk)ZE(G@0>{&+;`^x<c|_sbSw4Q4$|i(S48X&z
zk8qnyCW?5L!7L*RDP`bGukYQVnK<vPMh>hruV*^rJMfCNi&)xs?;yI47CSr$SOq|?
zbG)-Ql51oE9PJH>u%{T<lQV|9litY^qJLa#Yh#W#4Jvv(?ZEQ^4o|{Pw<Q<C<PxkM
zCv7+fv#g3aJPBiWjAG4v?M5x<PKM?o{N_y}?S1d@TMVW-r%<Fv;?%ccM%xgr5qfD=
z;Zw)w9PZ6qs>=l*7YaGPz*b?eN}DS6R0m#1`J8f)Cqv)?0NhcR*9t^8?XV3kXb&dQ
z?b^wxk$d0fvzyuQ(#J%d0?HfGmGVebu+gBiFPL$+J>n3`)j~qm&_1g%V!NiUh#0YL
zYu7Ro6b+JST#yfRNL_;JWjh3gKBZ%TKnOtlC0!`(aZ4haT(gBZlc1cWj*K+uv@u^I
zEl%3S=1GF!7sXV8drtseelp0t?Z_wjRtSl41A5Pnga&4EpLJT$O4v9jJ}&i!XQp?A
zS+a{6Uj!z$-lG>Rd^%jV(0mW8%?a#&!gN8LUCZo{lqHRy7^tOl(2prDigV063!uhX
zBNg;xu8lC_WNH~lXsN{}xLO^=;A>)Y3$<-EfX4k)7l2l`CLMq7BAn>*G#kcC0$ub-
zl-tH<b6(Z$e>ODjLNyPCeRQFr6J)1d4Fe>UUAorB5`>5V7*-d$em;vibb{|pTHAu)
zjsU!+UMi1-S0%&p06A6~UO|F!s)@6KK2-syKb_!BB{QTb^t&CyL;#39K;UQWz)$F}
z<8HLa62qbjTOM%U2F%b>D;7b5P6G<CG<+T)C`86PlGs9EyKVpmJua39(BYS`{jooS
zf#yMz(M^m&8Sv>k5bZJqF>0s%HgSH&3{8;XKU!((N0Wk^nPokU1e7w;gezd-XoiJa
z%#vGT+jV;TY{-jH)QX#}xS)DPDD1UnI{*M&W$F#4YWz*dyMLzkyh{ze_X6SwO!UL3
zYye5pTn(BXXXD;pbQDNBjD=>KKj;VQgEd@9Bye`;x5kbPzqO%CQY9Oyk`XZ51{#i%
zG*>Z{!)H!L%Qh)AgMy^~-V--kKWy3xPFTui@rIM+(j`g7$<Agy9WcVPXZ<kjdyIsS
z`h)caoUzxTkjg|d&|cX~`)f^`A8B8hFvJg)x&2{K*uEg}IRW!WJ;lk-pW<Iqe2)->
z5k?0T*@#?IvA9xas0XK@-!ECYrRx{E;`~JrCN)0m9SFiMG>4EOaw|!6$VNdXW>E?%
zaZKB5nG8aMh9*dk5wVc%m)kI}H+EP!C&{)0hBNir2#zaoi(wg=qd_Jl&I!^GR9kh#
z%S{o`(RQY>KcEz{^EPFO_NK$p4GoY{GFC`;Z-n34()uF{(iztX5@^~k@KQ(H`UI$k
zNS7VwvRil55mM+THyo-tSV-xLS;iiVWw(EEYd=-N+trm6L$C+^vIXTDkWR#s*pHDO
zDLI#hc{oI9xhD8(`S?iC+rO|JPA2(K7AbZDB{pmn(*v+_Sp`?mjw}Lx-7!}5z}|8Z
z+`PBL2fX#a9K%P7RdB3Go(8Wa(OdCnhQpI0;MN!f3FHXi65=KmpHCpSm{K-sQNFxf
zzCF^ut^o~SCzqf#<ZM%~;fy-5Y0Zkkj!R~)F>~8gt*z~wUwlc&0ABtx!)C6yRv_#B
z!el?})Gg?dj<#aSNr?{KvEwtKfDR*w5q*mM=g?(q^W{mOv+(gXh<#eozMXZAq5a!b
z-E0!G7)f&X4U@97!Y}BaCcp>B9_*MmvSUw|pe#mY(?~nM6%eBcin=3{JT|sN8&Xmh
zXTH1RsSd5Ei0LyY)9b|e7Ubv!oJ;P3NvhUm*JO?{C5^*pMT|D@-#LT8#eqgh?(=}@
zR_Zw0wygR2USU_(U{Z!DU~S~}IgSK4LLLNnArgRH(`ER)27{8`in89#p)r-@zT_d;
z`Y+7J1@E_hYf_v*<c8Xa#z#be3!j_@RUvPg0Dxq3M}DCIgz9$0-1&(ZK<>jMdy!@q
z0x$_T;g|EO4{Kv**K^H|V_Q5|Eiy70<7^cG<8o}{pkhoiH-E_pG(Eg-WJG!1h-i5c
z$Epf7BE?#Z#gPQy%D%gTU;MnBC6J;BThXgbxv*LZCT8j``X>FEe0D#%gb<m)EY-bL
z+c-NWXwx|OFf5QZB4;E3&;*#ByT*~M7kf76&ve2R0*D<7V4Q;iL=|ud(44NH)VdHP
z8`sT|_feGURdChV41a7`(aT3;Rw~Qmb4Mpp3^?rXD)afMa8pO=rtj#xWh~l4+jPC`
zo%_-DxQLEV_oQl_S}5$toT#of+x}mV|MGr+C#=OOFNXcgS?it-BFR|;sHc$`r6-mE
z+$UqcG?QFLS5BB{HYNVzj^GyAn*OSb;|<s8Sk_&(mM^lz*8vpA&|Hhq?uT*KgrsyJ
z5EGslJ{lKsn}f0)v-xsAYj?l&5DIdqJ?AFCHE-CX_uOSpY9Ti`-@A<H`M9pO!xBiT
zN7i+jNwAvwVq}cs2@*q(X7huu;BC@JCBR;W1SSC}BY=qnDg4<A*<S~d0Q%J!o1P9@
zo4bA-;N6o);K-0g(_t@QZxf@x`;>DCCL2t`=8-^zi@b8diVndVJsrqtpl}d6rUgvu
zwOb${g=`=y6M<woU^3F)6<<Wcmf5VaV^tQ<g+VBwZPHQFPe?)>ojZx8g^WpXt-e9K
zA6F^64jz#Np%=sMJsXX;_;&OqGcCRBw3?To3gIjRolkY+?Ezg(l;MxKTcN(6t8;6p
zg6!eDuLmT^4J;NN^d7_2{wY#wgvw%bViL7JhbSM)@)&Tw=af(+Fp?r*m?m}RqtIA}
zghQSFZ2{QBZ28l(mH#y4rbS9i&Fom2P@Dlh29+RIBhdD)7?4OrF!A`x69`hSQP-?9
zoeF>%tct%I?yN0Th7Dk1B>?(9oKOSivIH&>kX2iYA`jkjtryUj<Fh=9rotWAE0C2k
z35kil%S5?vSVkcmB3VpVmXni4BnsUj0NJS^TuK6P6D}>5)5G}CNspOigkNQm5%j@8
z6I-wPd1;{3nF)ZXC=B5888p)bdPvZyfIw9=pdM$#3irNF&vgS*PuDgwkU=0}^4=`e
z`+xZLbNtrFSC1{qx9l#TM8?c8Z{;qsUv7Y=>hDY2j&t-yc;jLi)ems7m`7h{FR?jC
z@L$!Lq$CPWY$_%T^MV^0u*y&RMg^ajv&Bj%J*UuLPz<CbCgcv3rAuZnD+*pJb)3By
znZ2#bB2qdBEfCWv_Z&@8yIcnV^ksSLQgMs<BhvDzSR-!YTj~alhJINGN6;x|^5>kX
zpg+lgZTse9(BTLYHLc&>)yEj_s<`Vj{jwZn?u*i$5LV(LiWVeFw29qiefUkRDAnXF
zi*)*K(JgHH*|sxrr6KM<C2DpRywGEvgW?tC6&!qpRovM|LJxCnO=b5nh<rSFtWC1I
z^LtK8VFiOmWlg<e-(xn`N?ob?iMBpEQFX2dCvXV~Po<jr>c0D#>b(6{!uCDT^i|b*
z&Lx?)*I=Yg)4Mj8H3^Fj4cShWK^NJscNZSW7@r*29hCB~lc(#(VvUkpV3Hm9emMM&
z>;T48Q*MyWW%)%HqeaMQUO+`}(hwt2aae@$1vX$r`~kINn?>9;NN%DpjZ<Or<|9{y
zNAKLy`dB12Lf}I5PXvr)(BI`tr#_7a8Df1E7l)4+n`$Y=coh+h9ywL3Rm{894>vA&
ztjrx_pjh6U##BKM_3?aKoQZ;`tA(zK2dje2jLPov8yp>=jR1(v2*fD6iz{(L=3G>&
z>C8ac$H60wb@`(lHMTP?%eTin6*xREJ$liQn|#G)yYSMD*zus~y%=2kIo)e$v~zFr
zR&caNDqfB-JGPc}m@>^3S%!s3lmWkB%;8@&O;K5&_pBJKg{b<|jV`$jva%lM)xUlj
zd#3gED`jQ>k+_i5SG*m%uq&prEKn;poKk>h&e@>87?&2mMwXYel(ZdY#swy@A_QTr
zDSZM^59I?nytl@Buf&jOFTHgQg=1a!O{D`J(Y9JQ*vJ5KgcYSrJH}(63@|h8se5j`
zL{UwQ_!je0WG$JoDF`@fUIj^%!pCY$Wj~3i(L!E%@1y@V2XoV?_T#?P8E%h}Z@kcJ
z;)i%0gCoZn0TmQa5x_Rk0*m(1C3w;%(gT)gVX(n9CzN2k-J%Ec1F_-2Z+&OQSBXbt
zYLm1+*515wD2RiIkLY6SQm$$W39yup7+j^GlcR)$1jR><t%K68R|<(Jl#d=aPeZ##
z7_(f4Ct1!~uwX0n1-8U;oex*(!mSf<)GLN4lii-o%Ys*BUDaZo@8!c)2}HbSo*ofR
z%pBUV|8}Ba;*@;-?MG1}iiP5nXRPaU<~u}`>&qw42i4zsaVVnNFa9Vnt^V#-(big#
z^4L}V8C~bR=W<S16iggS|Juw*<MQ5s!mPsmUq$P}(7o6VOhX=AON_`;F&!t<0GGWD
z(mV1!ja$E=fW1@f7#nxYwV;MVdOHyVEfdT55&$lsC2qpiHj`1OSb#e&ZhU-c_O?t2
zDv)P^pHLg;bk5^S7kYsGOZbqw<{GM=Q&_A5m-nal&PF3rK^1ec8^pjG$3&^SUo5^=
zKJ;?=Dd8w=+ofDd7b@;+;E1uK4znU=w9L$Q?#wUQ-y>rmN^<#*ch$iD{9c(No@*Ir
zZwY44OCY0V$T8M`yiDE|kYl>z$dgCp)GUh;@tmGYU-n=PGoY7R`u21t&0eS~!Z`7Y
zr+tHu3`db!mg{KS{pS0VjSR`smwa88(kySHT}W}PidHePnz}6Cc0|R_=H*HhvCyX+
ze;*_ZN@A4)V>JO+ldXXE=YK>>l}69lq&VNNYzph^dDsWt!#=I}BCL|Rbdjs%1#8WM
zsL$mO;i4a7kMer5N9}OB4<;;&Tp(lV11}Kg>2W60vsY6h&YDcSCm&kVBBev3@Km(!
zy^Q9t-fX`9K8+I}sa>&+K|cce^_O4NpJ);IA*>%Avs0yBbO9b}IUP@b&fOEITBrWV
z0ChhHIdek@BkU)amVVCRq&u3Tru&@5tg_XuMt0!%3w*q(tA>PMC7XkYTyo|zT3lag
zs25FS=-P$VUsQuDq{xu(9DyiEECzTNZ8O{Er`f*Mow)MrlicMQdC>*^X3{O@^rzqD
z@8Ye-;?0c<F4k<{QT#r`_Ebh@a};~hw|DmbuZHCf^?_{8rN}16+hyWz3p@9my~>-6
z%XRNP6nA%~MM@jnPFzoRyu;D?kjeA1ap#+zL6uW2#q`yIlT~V~hJQp#o2~Dio6L_m
zMQe_Vj?ed;eejmLq%f*{CI9&YlK~T2r1WdSmf!qB-_3Dt$&+U_CJ5oxs26gnDs7jA
zk(5nZr1Z*kRR5uWS^{Sbm`~M+;o+&+4-%Y~?zBkhg|vImAIDdHaVogD<$K^3b&Bg|
z-N32+M=7*ODOIXz?#&29t$^o}mt*TF7Yt!DK#P>FC?}L2^F9dF*i><t6G82L%4cyq
z`&s7uO!9j-*A(5qL`p-iYDUo_rELZ3+96e5T9w{C1`D)EDZKIS_9?y}_KblW`WMIJ
zI}?sBt-q+b&vNg5(9KeDAYUvRR7vh6fSIu&Uwca>U+bx8uDu#bHWy9u(&6d9!SY9>
z^w(ocYFTJ3=~jvxfxV(}WSKdsDOnFqxnGagr<1IXL<Iias-pSjTb4NW;`8kFoc+>*
zE-;(>RiuG3m;^M-+yqg`fWE5raVPjouB^_t`DA@zY@>Spq`+72jh{~=ETJ^j%cB!t
z_^E#d+fKcE_;PAl@}RTqjVu(qxUkG|VQ;|woX4wI-O&c<=-{90(Pw+}UKSkmap80&
zeZgXL6xMT~t&vIo!%=?DRSp~o^o8$_NNGhf`{K$SG<fR?6Ws|~z`5UNG9KQPgumu)
zba%C&<9-yPUt4$SLM;w)b%K{PjY{HUo+D(A#($U_{_%vKxu+-Ja)9}UuA!L8r$8zj
z(?*KP=R9H=u@BKZWPo7JF~z=c?>`_;7pD~@<k2oOFXrReWs*eR;tHM^GKAnv?)IY1
z^|@uBoFYlzQgJL51K%`t9~tu(tmd~)tZ~Xri23Sb5zmcm*P=G^xa9RQylZ1p6bJFx
zdx$l@HWRL<lWaU-Epi`M6qz*9ClJ!d9-_}@yJEgS#l^~kN);Hhq~sXz8X)w3O%P>v
zhlMl1{5VS@fs*s|rcF6l^aj}KUhn-Hk00*@q)JFq@P53a-J{JunkA5r(38CaD(R(&
zV<@tYg)0YrQrWZo0fj0QK{+0xq|i$f+gy&jWXb{Y=oPD@u>#RN6jmuJlN=Os1ZTts
z)#JNcK->Uhd5AJ|NoZ1^#@I{#IWn%Mzz7k8n<$hTvm_$=r0_+0b<;X<Z<!MX_>DeY
zkqyBcvC5uaMoH@`Ve6`C-fHFrQ=CNXVxG}1|7BYNgN}USfJbbZhbd2=p#)T}LWs+r
zi$OS(WJzR1KmOo7uk-LOdXe);l)j|qO`_DPql&_E9lF4I&le3StY+`p-Ck4_`6ara
zQ;6LWuBR*2$FdEQGa_5L_2HY=9D`6t@+kH}r@UbaM9x@|xtmVE0Otx}J+wXbEyeu{
z$b&oEgMG_`$>;Jik+G&XWRFhcix=bFUXRVb6KBCk4$Z$nsg{fzeKu{!@tV4*!yXp>
z>$b|mQbk--yFGhW1D|?`qMA>bdCX-8NZJDAa}>;(9G^L8v31oJN5ht14!fs}k0)=b
zr$mXx_iNm%-a03|t0Dx%c=JVqJgH?bxs<$DFfnFZ1#&|#rDO_EeOXsHwysDN)$4F4
zqGGrs*o`y5o9Lpas)C9VP)YXQyp6H<d)`NsMejwu!q|d@EQ?QG7_j<Cisnf|hX_n$
zQl9nPh+#)NzuqvK7Lt2A`5~0}MKcpuLw1Us;SYg+BoKA>z2mX{@!;`ybL58;eJG&;
z{tYjV>w<zg$Rm~0N6dYQXglHrLB{pv%}2y9wqnr)>Nc^bDE1+Sxu<WexJTNk*NzMo
z9w2#az5MWYUCQaTj96?MlP~$rR{F8m8Q|>;iTQfhe9qi22_GU@KeD#M_I)VYG91`C
zCo&K|B<wg_9PzZ+{56Bzw(!aOr<`vMh!DsuLLgQGnavl(X{L)Mfff^EBN<<DptACE
z((H&}`wQfgTI{=rrMKHg!#@Jk1n{1&xLin|)%!f&`M#KA+YdhWNZ~#B-WDCXVrqfa
z6Gtr&NWOQjc@0|<F>}D!XYXne=n;a@RcuVMNVe1&3Oc*^+RKV+obGgXvG;sFD{DHw
zhakfW`tTDF+btvF%ColkoqHt$F#Q3><wki_B3lt*--w$jidSw#vJ>m@=ynAo+byn6
zzuPw|vc+GYknzov0aIkk@11*{`BMBx(RLD6uU>nHdvIHIwk+YrHU~ULb{EW<0vfp%
zivv(hXb7sO?3z6&j=>M~1SF){EB#KQ*JLETf=dpi*K<fax!W4MEc&+6uku*&bj~U1
z3}TM3zGQ-g-fEBC-ta>oW}i3AjSM@-grF<2653oTBHI>3)$>|k${wQhP&G5`2;viG
zv9`OtoY#C9=8{^wyzmo#GC<~|p&op;A2H95Sn0I*=xjTKl-y?`pZkjpEae$0<r&Yz
zX9v>JtCf%7@12>>O$yxZwRZw(u|0rO-+k!4+hu>#Ok}6JZky;>>9zK{0sdg=Ayj6X
zVvGRuPf))1^t_HNMbAl~F89h5_3$sE!)DHHY8x%g_pCJ>XJTRyDk3mi67K+2yf6A<
zB&zRgeHg>U>f#2t%HHTB`cSJR)Xdue1~Q?ziomKXO%IB_2SP=O$i-F@47|S*g|0s#
z9Ydi#zk$D%Af*Ck_;&&4Qx>PfE--x7MSZ5oB6Lx^GBWg!iMaEO+fH3X+qah08)>)0
z-#^f+(UpE;acKznaHd9bk5|GdKnu)!%ob0D`X{SB41bTC`Y!dVPeKkaGjQSEoB(w3
zed1tR)zgBiH_m>sJrCa&NHH^0`=4@4&oVJEb2{RSWFJ@5#4g{6yb&9{OLt=HEow0r
z|CYy`DTdo~iQPv3#no#Z=K3={>nyL+jprDQp$-OjE#67!Yt#l3&E!~Z77<yN$mZOS
z^0Kdp9|-609~eKZwfM6HR)76c_Ho{yVVPz?B%vSN#6PV@Z^!R<_2w<oGq3ibD`bDX
zs2y9RzrSs~0<LJOGH073ywNq{x(*dHnqsBMH_Qa;5lVlO_a0rBYugSwTAwa;nyE?(
zdMU{TU$h&eIfJ}at9M9|qt+?tC@B6w;Z&dk$Lf_%DkxV^D5^lGed<-B6;uroh5|)I
z28h*jN8<J*;gpcbe1K{<RY7z3lL<mJ@IHu_-Ol?7flsP$3{?6sq+XM*fxsL>R23gQ
zc1DtOhntZDo6U%e5x09Ur)!~T&>ajDth(ZT(+Q4}sJz=<P@&<_V02Sa(E%@|sVj#e
zPVs;UA{IZGk{(@EG@epC?jXY;`WZC`IJ;5qq*~JR$=;XnAAF){#j#&@pP6B))=E~%
zMy1h4N6FT((bhuA&Y{unq>}yVMtgrHhww&+XeGz^M#q~<PFamkxwN;Zjn36dF3pWD
z-Ab;*jjmHlZVQcWD@rF`HJ<pObn<KCNve`NU6VVrvIj?#2cNR1Xp^U`vX@GemyWWx
zVUxFo@+pU=Qzw;uPE(tF{FP6KH=T}F_Kk1yy{UXAtLaRx^4Zd+v(?Ie%}svY%IAig
z&P^$wUuZhNqI}_1(}fSp{$HE?smcL#%>m3RfgH_&d@4br%|Ws%!79zcIw~QC%^?;l
zp$^TVCso2uH;4JFgoihWN2^4{H%Hu5xtP^_F;|6liWyn0a;drbQnyOfaC6j@%H@UT
z%PT5ZUNv9&pc4JHIhv|MqH7^BtCBfd$b704(H4rVYK%%tjE-uoVN0xqYMet$+)34|
zr(3T2tHy`7#7C<p#J42eR87okNz7GEDs4%sR!wehN$ys?Hr#S;O7;3e%k>r28?Rb!
zd{DjlwdE#NHHEG<g_)|B%F&w2r<Nw#nkK83uF{&Wqn2UVO8Yh;)1fu<q}r|1t+)Ku
zvcg-lqSdnFTeEMf-Og&govW5p+L}|XcBi@ZPPf|K;nurTYWEge@2#laf7N>bgIey_
z)?BJu9$i}=vwA*9TRxw9foNNSta_nJTcM76kzrerg?h0=Tk%QtlGAM^{_3USZKcub
zW$|rgH`U9t+RAg)D@xlcs?{Gfw>{`quN-cxoKmk^XscRLfB35H;Rp5VuWi*-^%}bN
z8fJ}Jj`mtUjXKfxI$4c+mG*iajRwQ^1`CZwhxW#k8cnC$oBTDJ!`qvqHCp1^TW)H!
zX0^BGYP6NMw^eJjH&ff&yEQt7+dHN-Iv3hIS2Vg_wRe5c=>FQ?P1We3>*!(D?B(d_
z<<smF?dX%$>{sdN*U=m>>=>}n9CYXyJgGT!x?{*+b2z+XI9hWgzGLL3=4e*OXs+g1
zX~$T#=6G|*c(>-naL2@y=Hx=h<cj8_R~?T&Xik0Yn4)S<({)ZWYt3+U&hTl?igwP*
zYCTrze5|82XV^Jsq4mU}^T|oA`O}^A{#py+oeR-gi}9U{H?^K-bw172S}N^as@8he
z-1)3qYk9bHc}nZ~Lg(`ptrxF4UwqJ7`P#Wc)mo+NT4mN=<LFxB(|#%1^-@-QU8QSX
zM|;DtYr{f&)1hngBvpIsbk~-@_N(x&SJB$r@m<?DwO?m-z0TEsQ`+^WT6?FtYo}ZL
z?QqxIDeZR)UGG-3-@od5|3Ul1*RBs#?OnR=U1ps<j_y4^osXj3A7ynusdRtR(fMrH
z{n<ii-=TZ|q|TSq-Cz85zJ_;yjn+Ac?>@Mx^DV3UTdvOc((dooIzO7be{|~{4tF0;
z>HJ*i{<)&_>s9x!4?5JZ-Bbuvjtrq^SByY=5aW<s${`16PyIv|ar=e{jMuU2N7TYT
zA7H$VQU#4~DPF{$GRc&5Y6|&=^)b7xaAv;YBFky>dm0zNeE!DbYniW?$gUL0dd9lg
z^tN*7ch<AE<u>K^jgf3rKl>_|*0BBWZ08(ny+&^-U1C4)-01hTDf9>X1=rT#*Yk~+
zIQ&m^Ui$WB{|85adv6RqhjJ8WpyyyRmrB?nXOQ=3y0}AA6j!j%<Q=u}FNa(qzB7f!
zS<08WL(e{W;M5%UlRNC()A}<DO_z^^UwGbr@#~kLM<N2&`V%=+uJBw8+8n>F68?)P
zGUWB+a);(CM=yoFd)6BM_1Dp;h`sgEER|^9%aQv#Pn*N3yjP;WeR{pn9L*Pf<>!xY
zU%yiMXg5kcDLr6DO>{4m%{8SLel!Z*hY-G-(#Ig(f$m2sEvNJ|X&s^m&;~rI1K8u5
zm_b%M*VI9Fw<ydI=c&7?LpQk3cVLEjLYGsAc`qMgMsRUFX(IyHHL;^YnXYN0BKM-O
zV`9a3)5avKI<VtXjmv4{GM$Im3H%^W`h@(XCd;Ja6W8=f<>yf>k5o7Braw}D*TFKS
zxxbt~rTz1eWtspxnlVje)MA~{XLHM#Id=3i>#ULRy^L8C=}y+iW=hX99-C|ZWSz4#
zI2u|=`oD}QNxBmD?uvXGDfltT@H#o-9a;Ht%s)Vs*c4<W{ToEd^1a}y`{}E>!PR-0
z&-21+^Rrg-Lt6_nJ{I`>?-C^&wb%RWN<P=cZ8oG2HJ0x;C66>e*lf;z-JJQl<<@@7
z&GEK}TWxp0w5LyX*6wuvXA>pk2hYbpugrW~eYC$e_hWPZ%hqqAM9ikbb+oQ{JPYqN
zcGtMRWb%$`@SEk)`qHUfLJY%ElZLXHLZfsEx3Pxu$EB8qCihGlE1o=XtUvpFtntA@
zwR?ZkQPZZ%r}e&%E8NCuSX6Vs`q(|w=7-PQBR;)(KHglt(oKROdCgjC*7_4zBu`AV
z)UFSw2%6qEYpvTH&sOkzG0|H8YAR1JnfG{G!|TUoHV;lrwl(f7)Od~GKi=N-?paIl
z&Wp+R<_{}9F-Si1j+VXkk#xzEk2+dEy_zmG%{A|A+uvEN_gi_?+5YvzYJW17&!Vg2
zH&ODRMwHb3!$gVSZ=&SCkSMABhlrAe-$coOGos||e=$)q|C=cJ`$UQFza~nix&PY|
zCC|8j6D9wDAWCZfdlMyoHUBQ6#P1&`N^1TsqQvhvQSyI0QPTXIDEUp4{3c3%6D7Zi
zlK)boq~<qK@|!66O_bbK`%RSmCQ5!2CI4|miSz#vM2X*@h>|X)|5BpF@&6;Dr0(BK
zlw|xSO8%pWlBfSy6D5oPTSUp^|CA_E|4o$qA48NF{U%EOnJ6*-UnELQ|6hp`J>`FZ
zDDnP}AWGbS6D9u!QDXF)DEUW-5*FpZPn5X-CQAM@h!WG^M9F_5QNr4_E3*>msj0Ls
zpD;<x^W0DvI?4%P+$T^8afYfSnHwkYB`1VENFbv@7obk@n6`tMv$86gYWA}coY0H%
zHCv5|(VRDc?5-DXV&G_+=@KX7JHZc-pTI!qkyUIXaO`Rg`$Mhwhq2j1ade!38(Z`6
z1C2*KfMf{CsRbtc45W--VheU1w$YT>))<lY(D(J&JnzJ(rZ+SQQ$={Qty-|{IzhJ$
z5WXJJZP&ufXF0;+7W!d{^IkqBY3`ehp&bZckpyW+VNZ2C{+3u-$C!#7a>p-<`*eaq
z1jQc~CmnF7`xm+A*SyLB$VfG&xD6qVewdABvz|eY6TuM%k{ACjRKn`Z%kSHx^!K3>
z>K{_c^0wA{-;`h5e?TSTe}+m(|0__*)P?^ERC4e)P|2fzfl3no8Y+Qy{uwGc_%l=j
z={F}M{|uEx{0mglwMuqNcooDL@YQVde&N5iN{(*JUig1lCGLM~m8>cE|H&#LUK@gK
z{=#hil~qC=@%sx_@@K0={?AqkVLRgUA6ALtKUpPHe^@2!|6-LKy!~sdg!>Px<P--r
z6_j<&$dYE2B>Zcu<f>A_uHdgftP)01goEf+^q;H}4BsC1U#t@3$sRHn8`Q7wmin8#
z$qVLoj++GccBxf=?&dwvGyo-#94%o@>w&M2>MY!vcfmtM2Q&onL3WBHNC0dYqV;Tf
zUHq%{!6lG%^+z3<v)KbsuMjf@pC-YdL0reCo=L`ndvxBWpB4B2bPyAqc#D>(1nq6q
zQx$J4G0oSyBn)e>jAHM^N&0$Z48|q<gs*H^Y!97@zXMbEU8@#>O-Mq^8X@@hI6Uc1
zF(aTf74n^d=`Uyr`ESsY%s<c)`anuTXmRxZU(ga<Aj@B)CF)4a2(ZT@%mjT^w5%|)
zHH*dh%j!QHCM|Ecs{g)WqW?FB3CqF1(=eg_ftZwC<n;(viU0eE$=?_z>omjU;GYZ=
z{I9<<OqTzZVL}MM_ssZ4^EZLBJ4^UDH2~q%m4K1*-OcM&z@Oa^P)?>}=7~?ZY|O7e
z&Ek1l1dF;wS<RP&?i7{DO$ZvL`dJ@33S#*uvIhd3QiVT>m>Vf|p#<mOT+<a&jmJtS
z)!U=Q85fNBTl|o6{KrbItIqCA%vU-yml%<EBo}Kuhts6}zDO-KoL#6pkF;ltgFxUs
z0T@33W(}xoG7t*T6bM}o3XP^BIr!Qry|=`0&H7JWI5uY4$fht71cnAcN8r875Q(m<
z#yAH>8AdvkZ3G^eS)ilP#r9?z?1KA{U7nukwrPhaK@f7LC2s5)5)Nlgz$Hqd0UvJw
zAtcaKsEgbZ35fBtUxwhYsDs#X#3`t5SDjVIGp3kL2)akj6hye{bkd(0z~exCEdjKQ
z<}a%N1{j3rOQwH-D&Z-}jTC1L26L{lU*$U6!XJM$tdT8&KPe)UyZV}{rEYHmCn|a1
z+|01O;#0)}-Nq<>GfTxch;+Qg1aX4KQ3!6_FyOu@l%^8;gg^bb`ZsTvdUt`uE2k$t
zjWaJ)QJ_wZ0o0Eplx$f3m}9fM=Y7Y!?rEE%z6F~MBB#pB*Tip0CGd*`UX2?S_i__A
zajtMIc;%EU1rWdz18S!HVPZi@$0BIjRrHxwd9k9F8c-kTlI}P0vi!&ctF+=A2^LxV
zyA@CLELa0$ljP=YH<;}XaT6Q^uGSF42R{2Seru?Wp=>A`oLD_7(Jn<aP5Lg?Fk@oM
zE}dQ$=Y)NHwp}{CG-Ucr(`mb8erQPOkaXK?&jbGYce6C|<h`|>sjT2wL=hf8cFE3S
zV6IlS2eh+Y*#<k}x+`_PEEEPi$8)&b|8TdL-kIKu6CrS$*b&(KmI3vWxi;r4EQzl=
zvU>CnqC|cikC~90kPB`ZW08Lr73`$A-k~tT+pPJ7LoRC1tGsezFSuNO)>?jcRQ|c*
z+>fpag(r3{mzCz7{HpS&tX4vdAC}VKlZ9imH26g01u<kSIaZ66IVVHwYn??=!07x%
zj*j9NmvzRQSIGVm#td9D(vP`Dur|p!My}V%74iRrz59%6qWj}TKWPw>07+<}g@g_X
zy%?$?fK-v*n-m+Ch>D1)Ng#9)kfwqL1VlwT(jiolqErP%1q4Jz1q4L}IXut*p0n<`
z>y~rh-Ev;dyIC`9?U~(v`|}-B9+0->R0YeN%6x!Kb(LPzcQ{~Y8kN4wpd`%PPc|(7
z^eC*a>2p=i#4dx9mb%NJY;9U-(!|9R<?7>=|7B1H9d{X&p7z*G+OV1?t-41v2VFBD
z5imd3pc>HP^iASsG{{aQ^}YO{=C*`93U{OQnvg<(aC%sqTi?!pd-Ze1r}t^r<(=+T
zbGArOO96@2P@u{WI2yBBY09zhS<AAe#AKUFR%ihSCYKP~td~Xz*klrJW3%MEm}1h<
zbWICUp@ZE3_EF_qh0D}5oh367Eh<d)_D@)XF;T82p+n&}Aye3z8K2Z_qsZY{C{fJ#
z99(HaS=8!+mRa63ih22CN0{T*E>V)!DSqg5V&E1l*&m9<-X7+YcLWP-p*t1m^j@LS
z5klJ%;*)mile~%J*P_O6$oN<_2q&a6%_K6?JqzLtvy*ra0G4KRy`BEkvasMlpGAZ-
zF9|OT>$EmgFRFx_O$v}YhH0{{4V}WZEZm(xA<{d9)z~Xv(Aa!A9_%yEB;0xk@<dq&
z^+BM?KJ0b6v8N^B`u$y^<V=|H3_<JaISc6_qDZ%evnI3yLY#qP_fnv)E9ZF%Fhzo4
z%6($Dfy8q>5FYcJFrw`R5#Lg0#TvSj*6$UzU(pQu^X@5NWv5sPv|0|7Pt<I3H<IPo
z+RbiVX~DHgdp_{V!bcBFEvxjcyVAd2f~pjyGPGdvrsc%0(vI(O%oyRwRZ-QOY^6j{
zV#!Pbwm!U1bJ`0Q*)McUrPNZzIgNyOWZ^pCfu#0L4d2@sVPp6{8Ry}BaiUp8XV=*u
zow;m%-yjkHU81B*^+i=iUD+WMlK0qyofmc0b&pQ+!-&(WFB?be$|G7I`pqW2Y+b9X
zxLijfHVliTrk*T-C;DWlro$h8Efw9n$&^FN!o_(qdDHwJXb_BIqW-Jvvf@BP&$*I*
zbx4M9q$SuF!LvnZ!08*px+NUMfri+Fe!BL(x9Mqqztre4r0H2~eM7H_dieE+(+k@5
zjn6KrpS??Z^U=A!=|!u0M9srDUlh;R7Y#g;wkw7St+`uuG$^RIk_-b%58#&k+)Zvo
zWaN&Ma9uMUQUiAO0lr{4^e+ttgggThYT)wd)A^gUV<2)3B)ve*SUK`6pBRNlxJ@&T
zZ|gPh;mvkF2N24TJcrqlne3D|)r#3;KPMQE>rvNV!A0HFhMqhq>cc3~fSPe-_{^^y
z^gRMTIKLOb&NIvut<|e}lgs+%!hh?H@|syWTd!~s#z6n|nynhM$3%0<km77m+=Q@2
zrnw}4O>?jBVh6wIkWmy%j@`5izZ^`arM=$OX%M#D&a3opGnM{HOV*}AYAKpW@DnEy
z*K%I<JdS<K3W`kgKZC0&JzS(SROWt`ZFk~VxbuNrWanf1A-`wCH;gF9N^f|Z-+ys7
zVcdY~X>BH?N9YsMb$aT<0_U1bl$a%sd=8w`hb42gsgJaI?Yo+GiIT@pDf!?74`Jge
z!uzUkDJGQX{oWb#ORrj~{8D$~9_RJ(U)l`?ej+lMIdn~+|KwMci@%Fr!Tw@Zg~&<=
z>+Tn-M=Ey_R`nI8(U%+6R7LNyp}s)sXxL~;L|rrXlYn;1alxPZxqK%@BAT0D5akj#
z4mt8lX|=qySI~7kgNXqaS)=AQ7O!;Gzuy=$CbdN_YCW&+P_oZUZ6;)NolaeewaZK2
zd&h?qi(gH7*`n-B349Vmgce-xh_JcVfuavM20quXpSb=p<_ZT<Rum+-f3MN2v6EKK
z3(@2X_doCHse5XU*M6XjjSM|C{#iY~{nah8!aetd@GkN4EpBg1%>;R*q9s4~Vactz
zUvC$~OfR2I-%+xAkJ($V0{8!Zd&gK#<681yfYIyFusTocE40%x0viXNOqSC1d4+n~
zemvfLaQ@(dCrQ^*rx!(!e<|y~`1F@4nS0>p7a#Y;NQL%a&+bV!w%Z?z$LF7oS+DK1
z@!lTs+aXO|`TIQNwC>9F_AQd!p0S}jS@C;ywm(%M{v`kXn+1a)zPIoFd&!dWP5bd$
z(ZI#oN$G|C0iWw+o-f?#PZ0yF6Cl5(Kl2H?uX3-O%zUv3gxo|Caywxs3B1RqSIh#l
zF9pIP0=dUo#54k;B(UVf9Yik_`Is<03l`@R_+M~#V?PC&lD8KKf<FSsH)RCC1%k(<
z#AiCucp?_DgM!V?U=<H?#c6{Ic6}@E8rEzf|AW$rGyKPhqK3Cr09G}0XxP(Dg8&ko
zwiYXy{n9eSUtJ(^OhQB0znZcC!c{Z3Rw90}0RNaEeAYi*KGkLZC3zeyy-hV=?j)jV
z9|l<j`!T#}VKcmd-&R)s(3I3*--G#Q<iSoHIjeH&`KL=3Y8=`+N=N~2F0$^UP+nM}
zTfpBWOUm}xrJ}2&)4mL{l={cF&!Po|&1`MVp03kex@EO)BE(+IXo<?%w03T)A=M?I
z^2<Tempate?KF=w2UPCrA7e|t2;5ViV)e#CUo==VWxV>o!(W)c@`j1yJN?AU_hJO5
z;mNzEU*+CRv!I6P(AB$UM>;5qe8kOJKItN=?K4f?SMI{|)eT~9)<xBhb1SiOZq%Y%
zULpOP?`PDC%$AvYOnDnTRB#*^W?G}JCg@fp1i91-u7zDHC|dzZX7!290H%IDwxY4B
znJH-aO!`()|MdJ5Wx+fQRNl3NIFq0WX9=eql*uzYDiXUE-O;`dQh$LX{bup0XIJaa
zTNuhioI-3Kq$n22CmfM?DgtN@J^Pds5jTn}<llRLop;k5k`u9T{N3+glH$i>U$N04
zYt7jseFNP=QzB%cMY;n;54k2xOKdtQq_RYnJNQIlPH}xU4|W#J21EASroJY0n{(&A
z3PWwxLtU^Eq8)u?GEM0?$ni+1G=0I<J=FAs!btaXvFQSPxVgd*O}(^FA(K`~W;tK(
z5Ie%s1k%DESpQu<P}Uu4MrDO-AEpa@(A+xEHT!%QkFn7Gpk}N@<FcmFER9?xEzSq>
zF1)izyV!({ZaPegJmfx8D3%9G-30r;rJY#2MzRbwhjvL!T8mIc+(a$Z2_3|FS}Po+
zJYGV_)1=|FEp(5|zGC`qA+udICS(bxekA5avb|QZ<~*3~U7CquM-?7Ues(Xq_rt~h
zBbQ|Pv6HD*cry`dX9$lgYP~~U*h0l|@hUdP3bDfs`}<y1f`v_yciIX~C@S_X7xcRM
zGCkVC-toiH%PE<v3xZPO3gf`hr^AI>rBDPj1Yt?iRW#!qm0mw0;y02c3ss%mFX8oE
ze2^;^BB+%DlKOJrYKtpt%*01K;jWILHj?hJh9t&6*1pNEY_&G4jaBU4&k;CQfbYJ&
zFs6Q7H7)AcJ<*AKNypNX`qaj`5)76P7IH=P2!9?^a)DNStW%<ISlSC?UUvT*v`eUa
z_s}?VvEgG#C(BVpK(I8(UVbqM+a>6EK%*OQB{GAWTr2)QSd=OOW5O)C;?)AM(#xd#
zEYdyw{fI5Ns`X6PBNw-VU6_P1hdOGOxkJ**3v;b?R#X0{`k=#SPB6x>)SO##yn0cL
z3qKLAkbvEvqxc~le7NzL(s|XT^KtjiT<&NSwV>>}71WzfnXFBV(l7J0Zc&S^K|!tY
z=jz8kX7kv0ep0@MU~_&$Z<xAi+Cwu8yZ3g6-BSFhREN!eT---~K6kcL8kR;VV_HRy
z5CKcIH`sFmYFff-W@Qf)KMs%w0c$B`yGG|DC4&;NV-FsGvc^3_&4XRA-KfD%>D98N
z8FKl#!$YP}vUMP0dRH0}-`YBIKgz`v1XGwfVMbLM5O_E}`sj_}YmBb4g`-8er-as|
z8gWzLHU6Z!{K<f~BrW%kW-AXWz`O6C`H^THn45Yur0u?=a@cW&<-)J`@4h`+q>e83
zR<#TK<a!(|tecMYVu~_4gq1-!9MS2xk7abnqt^22ZWYnSK2iRg`?^E=zuI+{kmU2`
zrm^NqX-93{zYaMo{&?$RFm!)l>v%<G=Oav)1WxV#dKnetT8NF^#9I8?_Xsh;Y@=h$
zj<C?2Ski@4Tmq;%GB%0vMJy}(Us|SPJ6Z*((FnytGJ`aB@9=0s&8hNXGZre?jUhe@
zYgQG=q-osIvxJJBtnmZCIC|ab#;ikHMJQ2J3+l$7BF*=lDwB7VbRndlcC@&<&!Xix
zsc-l-tNh&yjdY6IICdvyJQX_O{fKl>ZS>?9*P^ulcr#PNYyyh^A8*F>%f#2?e>*eC
zY9jsm6)o~*;ozs&cBPrT2T;Z1t?CXx){0wACl0{eCTqdp@lXNsjie(VrJp`fnAONu
z6!~7J@sO3F=!rF3u5u!3ne8$&gPptoX9B$XFL+Qq1yoT&Z3XBjc+8s@S*czU8VYoz
z27N-W8WOW2rsk!w4yrLI|8_RxTVFNrRBBRQRj~;j{?O;{eQfapZI7C!xDNfi;<6IV
zaigtj;TRouUOl~5<5&0+=Fh;EbN04(c*-!??O$jnjSFl?l%wgVOuxA7-M&r~J0qSG
zyRp9W%w`cGp9xinj+Ojb%-_5+Ia>q0oozQbyxtp27z70Jg!<jPEmxlXN{S8J296I6
z({!P<V2gOHZhS_pO@lL{C0zr)W><zHmyLgTJSyF)Ds_)4(@oXbWTCsMd#fHC5sx($
zf~t~pT~~B8u8drhua*<-mMB}<rmk&o>4v;Hu>aH;-;*;Ad*6ImrAo{KuPe`}K1`5&
zs3oaW1AV2fdqr55q^+eHUe@<b&T38GW9^rJb$X-@B}_}+PFvw3)R9j_3!UZE^8#0M
zhFj{`BLGV-O(+6CMK$DUI^L9dmSaCY7C6wYSy{|Y2({ORcKtwJbb=)s`q|;3V<|gl
z%n}?z_pE(ipw)|hcd}zkK0m`h{$28-yi*Nb_9bJ(zIGOM*6f;v&ANrs=~^pNvNtmE
z$eYJ#RQJ*1?4fE=3mvGxkK4l*+cMPh_9e$%UFLw;Q+pAZvT(X1{yc9)#G(LufT&-r
z7BRp$pR}6}6nvg{B-t!5<QL4`Rnn%t<yvr8w?=LKg@1^W`Y%(JHihz+{~=1wfBE?H
z@GB+8KSW7ncEJ(0|B-7$&L0R1dmkM7(4fWomne}w`mpM4r?~OxU$_rHy5!*H`(Qq;
zxPOR}&FSt(n6VS2(r@Hx@ASo`)E`Uk5C0`fAcM}l6V&N+t6Wl(;*P`m&CS$*h>~CF
zWW8No<|u}?&-&!tC+$vbL&iTuiGc%ogWR%-8mE$aD*3w3AkLQ?h5bvEB)|Vn==QJp
zpG3+3Buf4#QS$#%qGad)IYdd;xbuD!kqK8fzpM#&ze^%7JVW!dUU;8q6?y4<?oHN9
z|4Z8<lYwmM-2}X=CZbazS$^45hw?9pzB*EzpZ)6CqgK(^$Lro?zdqTzEjmr_k<OV8
zA2Jbpb9TZn=S{?$OJZ*$7xHu7Mtx}&dl$X&Cg<Jd?QOA{9R>`aJHz5P#m&Zw_~*{X
zNnggzB`Dm^ol8<{!@W<@dz<?{)#NX3KFtz;V?JZQsrW*soBxf4Y`@Fmi@Bk<Z!F$C
z(I);O@7&uPA8udzE55{G<8Lk%UNx2YSd`^|^J7W=Wr<Iv#kX&Mdhn=C;&WNu+nb-u
zTmMQdSN7m<EmsejN`9%G@W1ut@tez%UmJEU{;y46+9bcVY`neot!?|S<O&xilef~z
zzgKFtTO=TFwO9Iz)LNgyoxHVvwRWlRgL?1szCSbBky;<Nl*wNo-M?3QW85tuf8&MU
z73m+7p?C6sygJb?{d4-<yZoPTFYQQg&ah=}Z_Zuai~lvB6>$64mBsuk_}@##cW(dw
z^r#*GXSwd(?LS{zcko*)Ju-K;)`s@VY_CrQ+}Zx|=8DYU&4oL6{{H^bF0-?>@$Syf
z-|Zb421s}Y;Pa$H@MtEV>kL?YlFDm}W??dCpemkby9voL;^Q+s29sujm(j6A;aRwi
zCr#)!nyunGi#RWY28h3)eB!_$K;F&K0ASEzaQyBS&dURb^P-RlX#ogYPymY-6cNIT
zi;76%#7Gi?cu8?0UWz8eD^HYBlq0Gr$f>C)YLJvoNHW@Ls`^^$6desCJ#AA1J*wdz
za}$H$y^8y&#x~}r*USZTECucNndMsTirJPqwj%BhHr~$rOWpAP?v5usta`jLAwF(Q
zA6l88Qk9?LVSmpf0bWl6#Gf3LJRa=Z7mTML3V3=*_VnRE#!=7yql)K_1veeji9B&=
z@B}&P)RDncnnR~`E`=XsMx1;eVHk6sK78Krd89ErD*SmAbvVj&<dXS+SelV5*8lr5
zO`P-Bc(bg8D-((C-x4iyl9-dp9ye2BzFoC_nd&>0>T^3S{^f3>Yudrdw1BDWAuHGa
zFMXQu{}Z3)ZBcYx@y)ej`umbg4fpci-DA$&V|*`-Xu5xU_I~WshuM=4uYP}cv8}vt
zt~`lbargf&QS+hg?owO9kG9;A_Uca^#p9iIKRa)K>VEjMyKt(v@$-|)&wUjeeGlLC
zw=DP9tPWJq47P6$md`!oetp)s`K)STr0d&A>#vc=%i~?^<E_8On^#|SEx&yF>m_$>
z^2yh!f!|YIYp)0YKL*vncYqu|DeFp3M+{s@)wi#*per6NXPakTRoIh^(>XTXS9SNv
zHG+APludQf)9e2~Flm_iHxIP8ZU0%H{rv8Edq}Y`z@t3FfFf{~SKx}J1j}IIrI{E&
zv}Pt&*qt&gf<8py#EM2N6<o%FJ<T!l+19cmilR(&jPdc!*<{TUvBEfsaNPT=l&C%L
z1(iycf-$bpsi0T`(WCR{j1UF$8MLh#c|qgx70y*F_oEBpI{RiruzSZVL$MydT5)I>
z|D%gHdWNj!VqFVAF5YT5S9K^(tCsIWeq>WgGTQNnxH&?HDo)7MDMFjyxm4bfrqPyZ
zfmFkNq}gf9iksWr<>5PHtH8~49W1^Or}}_qy+u!=`WMmTs7))3Sc|8?PU(Pk4^aA#
zNyAOD&M!)fH4B4#c9+R&Wps-0iP!MR-PKQ4#NI>5qXhMD&q2znQ)BIgdFLLGD%wQP
zA{c&U#05b)@nkYBTybu>+5J_bQ<)0d$5A0{9(14D$5`7nX-320q$~5F6vcRSSD!?p
z<IO?hS5x0a4OSWEi*~mw3PFmWG;-VxRw#Q)-Tph!_h<l+>%*N&qoLb=x3%;Vd;i)x
z;%C***zy|_Vg`v>OBqk3>ieW>s87k$Rn&SZtXk*Q2c%&VX=mgksd1myns$>^HCY=h
zekMUNzpRSXa^!nXf?}s;cLJf>*rMVI*pe8i02UzziVeVbWI5_KMSwZOmFyCR=to0l
z?f|LwDVbnxAIEZVYWmN&aXJE=`3T;GpW6AnN4`^AOIFPB6{vY6b0qFI_-!AGFHmVf
zDucB!Ku8BG4_KeL$j~F`#4inO@kZZmf#+Ji8f>>J`IsRm9EmWNnj4;mF~LiuouRZr
zHA{KW;1#`f{uv^REVL=uvURfIQPRCi9?b|JJXx>;ck3UM20!qv3AnS_=V25e0ui?H
zy#3=4*MzF@UIcgmC3)*MF?E%x6zeyiQa2FItAXOk<D8%LUWof9KQF91|7)a@o@(Z>
z7`qUr39jey2Ow0nvDXzDIV^RlLYE<AP}EK-fuMvgIw2~IZjxY`uuv6IfG>}>;p%@g
zX);bXbc0Gy^s4&KjMk@!YLNu(3N6da>QnY!J)YzSMZ+y$R)!j{q5<6(*mt`o&2W%F
zrk$CV{-iRzgdlz%8aVTpfVQ7<K!LpueoNKUGdr7l{)?(V!m(5bP>6|N!xk!c-E9Vj
zsI;O!H~vKeS{AW%9C>t(%F1F%Ojh$$0Xzc0gu(Y&hf6BB8(PLwJ!<L@tcr5p+evH1
zLw@x0jlX?$&pov>c;OIHQMjOX`s1EkQ{}8Wqpqp5AcEs@N7^3YBK=e1$-b)<jA$R8
z8=lrS9{UO$bM2YUZBske0465>F6zjI@%4^Ss5Y$DD28zi-OuWCCcGkbYU6p5Lbix7
zUfIKlXoEEF>dD-Aa*5uK3nfp1C@vA2t-j=v;=B5V4((EYIlqax_e&N7tXWzpMI|Kt
zIK~rLBT4!415$Z(U071;#_FQ7Q<5UYybsKSN(w{;ODl_CDf}R!Yn!6|^`v-s^=+a;
zNHdNscR>?f>fQA|nK%>}@=6FT&t7d2CSOYgZg%LOW1@i5184gQ0r<FBRQn@a0^X0u
zx)I)<u6Rbg*3*~q_NXIpE-{MvXdw_3i`tL-v}@8ZwSOl$6{bFR)Zs``p1=t8ior2$
z;Iu;PKQCo=lw<0QCyN(6&D8skZqN_Y72Zm8$7spRd1!L-HZl&ss57iL;!?V0B1aB@
zq#xrFJ!1x>3RA!$Cs=?j?e1*^L9Ap(__B*|P`j;nuk2Sk_}B9$)zuhWO2^4Na@OT<
z|2vb0w2W+N>l`OVh{psn&xqfg42?9ZGc!;SIzB+HjD&S2?Cs$orJ7~}K0d8Cw@&1>
zm_89E^0^;ZdHUSYrSg;top|Nlqz)TO*L_-id#HRT+g1YdO*05(i|IZr!|cXQ<~~f8
zE_!IyOE*hmYO{o=2#)S>ZHDJ=Ma2bzhq`sP&5wncNfq(n-pQ1gW%)Y7Njp?0<z8ap
zFf3qYZU|xvesdP<^~r{>)Od<;i`P%VTR<5x5F9I3It<gw1LF=4`!f7Dg!TzD54%o&
z-=EZ>M!RTeRW3X%60612$EVE4X<*;~{%ZI@^X~~;K0OBAF~wO_nTKPY#c<&J?ElAG
z#h=TpWPge2GFjr!nk-TC+5UXU=(SRB#IWT5#-tIB5t$LFZ}4JvpS<;FddZ=_>E+PZ
zh~__UR#NM0G7rut$=`j;bHBRfr`oU<<(I6Jx0vNKj(<YN@w-Pracz3EQ^_+I3xB3=
znn^gMC)nk^!(Bt15>Ge0%Am~%HSRHUX3VzTwiHU)xl3!*$%ti1#EP8X-`5al`~;LW
z#j(q@_Jy7Op7Li}xux>8WRQBgOW8qG$QH%S|MdETf}CJNiK~+5YOu9(Fu$nzt50V^
zs5`}6v0xlT+Y^Mi@_~8P+ldDi>Bwh#%ty|ee!)!ne%cK|C@zJoB8WS!9YaZ!jeKeJ
zPVDdZP9fMQ(Gd%NY<hx%svp5f2r6&d5T~3ci%9bBLU|r)bUDjRkzRKbHXL~=Lj{jK
z4s*QU$a2Hy$%<#qyn))~$JQ*ERh0Sms&%7dl!dP%cx8D6r$x@EI1za?9ff61)u+6!
zz^?foLl5!FjwL3URh&PE)o!rx`%t4TZoCBExj{IZ_DN75p$F_!igXO*`$#+0rQNc1
zB7@2V<d*%?!nJyb*{Oe|v1tpD;2h|SG4}ySNKGMfp@xUug?ydG8zPUEf1;t1W@xL!
z)5M@1?Gd>QA$SbCy^4WcU_cgxycX6BLtRab<qj-`n-91|UqC~$0{3t^CVK&dB90u{
zr4v6aJEp{ZL$k=r0e}1sF%I0*ay_QPTq6-p`J)~F21~Zq<k{_+EYqSmHIa_mSA3O)
zKJ=)z2*GrfLfW`C0vqQB(rnQR^o?p%#jp-*-L$Wg3<ELcJi_5m;C9*YCI(ruPo!$)
zznU~c$gb-eCKe7a#?Fy<a<wC}jAV*X`E(vNuu5iT0%Z)A9%}OVd&~gArD}~-#Zu24
zQ@c57Ud1Bstez^su}@IcT?z2Vu2C$GQSK<asT7+8LFA*=s=7jrhgHsnqxW+7+A3KD
zdAc<h&aGrS&8R2R31=g9Fbyb*qptsxgBK^`2Ug;}%#bvKK~pe_O|hxqM4ejUNkJnm
z`t&Tjln#p|_9!V?<$!Y&$e;RB(cNSUEUD1*l2%|+$#rm5CF)Nfyei0`buMW_jNHqy
zajHx`^}jZ0Mq%|Cs5&cjS0uy4%JeqOsm{VE9}UqVz-26udK`~5=c^E=jvhlhen%5R
zS^3ALISgpM#RYp6peUM<3tTIiB9r4kAv&5?rvN@ZE}6oOa4bYwPZBgX&75e+i0g)s
z3y4?WGo2by%uaYCIPFcL5$QU(Y+k+>4WZ3sI^IuvP>tgEx?Bm@uM4_B2{hOjiLfC+
z1?$se#jzXvVD}iP@d=gS6~t3?4t(Uyc`KDHO~b)MXx}2yoWou<g(e}LklO1gQBhbX
zIJcyRbWf9l>$Fz$FlGns8DtSz1~)Uo2sKu0qzbxQ)1)`l@$^xnEW*vp=T4owkaH#{
z2YebH(`72Is6e3_vBmQhMo50FJ^O8t3)Ozu4u}mJM&TTdCWb5Tcsaq$PRqY{<Xfd<
zRM3lwy5Z)L3kJEuPKPp7@_&e9YaQugAXH-{?iD2Ir#R=T)1BL^-fJox_)QL?iGzB@
z5%|p+(k93hIf7`&k;kg#-&MdFrqwl0#X3d>IKq*`l5>ri9KHf&1P1#X*`#k&O(6KM
zAjcqt>XiZ&G;jNGK|8|*lmTxKBoxk`5_aNK1K$?zfB>(=Xi?ZIdZ9{_6tISLHY|4a
zE_RP9_Pkl_d=uUkm~*G<^j{^+-oPTE*`f$giPFIf2co2%9u%MaT|!qaX6h8)z?@al
zJS(DAa{ebzu%m9=8Mq&vr)G_pW)7?6AXDfFk2KSk9mcs_R%w#$zP>a#^V7ZXgZCmO
z!sDqh92|A(rIujV{TglaXOnJE32+a>#nAJJ!}TRkG50DZ9=b{Jei#!^IE;xhbTUrk
z<)9%y6`>w<1dVHCf7IqC9YLSs6AwY%TY*T&m(e(76&%zX8-z`z-kH-6g^6$*I<jb3
zc`wzd8x3JkJbKrp1`&sqjl()VmEAvYwDA5x?`b&YH?ovoQA#Lo;vlOL533m!TdKvi
zNsf6=R~l@|@4<W)wh^nUaXg_W_bQ!Hbtn%Y-)5yu$fv3d4XGc6O{$9VT)eXNGxXj{
z1P?Qu#jseP*ptMnUMMLM3iZ&5jKGyL*LIFcIZ1fgRMt3uf@!^~aOsD8HSri3L1;$B
zr&j`VR@vYVB;E#Hi;g&263|`9cie+d=sItMP8m<AMvf91pX~Ykl^Xs}aKc8_>5kea
zbe!%7JzFDm1%r48a+5;!JE>fMPDrh@a<AurR`gQ*9v>-#TVS`Q3aU}@#$1U5z1Gzb
z<wU)gIg;ESiRij}$~X{}MZMf>P3EE@SHUP=S67O;QR4%hkY+tG<b`_|5hm~V9Qh-f
zflQGzKr^nRFTaYF%GRk5)3H;u3|-&X24pfM8@jX_TwWnfNqo*t$RGy7dj<y5<te7a
z!qBbGNqi}l$kIxqQaZAo!RNm-0}Z1VCx;aqM|tLqq$_t-L5R`5*UwzuleXHUvlor*
zqbeReY*PHEE-<u8%aOA68kSFe^h7)ATtS<VNCwoY8BR>tM+tGGgb1V*xd<tro>Fb>
zfp@;%*X`31E9vE$#Fwj7Tu(KbZsO7CheUHat2H5DBc7WaBkSFGJvf9l%x7v?ybxAA
z7F==#Q<7_gUVeB>c^-+~KnLvOU`E{fI4F}65$f?%5N2-D4eheE#}G4xA;VD5eQ49^
zjwWVTJJ9KxbWT3Sv7O87zfzdLf;@+Yscm&S-)wMBf>@*Z+?u-Fq7tJE{xxZM5VNn)
znsib>foPnDD%%OHRx>N|;6i?T312ZrUq{hm$}r<zkQX-&I-wzF=p5*2g!+1HV4k$I
zZLiC*-gd`M=iRnBSQsV+ah8ZUv)n2##p_><G#qSje#O@Xpo)%*wNY>0{=*x@aBB-3
z>?6aUNI_b-gX?Q{yr84?UC1U!N|q+i;o&>#1*qtA!d)qY{l0@k_F6+*gHKR|(H6`v
z6-+O+q?jz->(l$bxj*(+Z`g7tM-!4>iQK^Q)yoy@4foblk-wUdIt;#M`{LG7wWxwV
z;SoN>GCCf}zXBQ&B92s!V{E0KFK9i#?`zjeb#PXNhoO}99C@8>U4t}voV|IY^ms~l
zGdy<Epz{L_#X^JUnW*w5baqlVt7A-fbqs%1G3JkQ?MjJS*?{ZKaknO<!#1*sI}Y2A
zw4v7;yb<dJ!b_?qEFZZ$MIjyL<ZZun#t#$*KN@c5m>6zPoE(yJ3LM*(nAmMP`Hs9y
zv%RiPg#xQRS_LoNKzE|IUvQmx!J~W{s)ilIg({ABH6>8e5-4K?ArXxNcS1S>CqZ*B
z#mypPE(zn_VC)Pr!Sxu6S8?f$BcYi^2AEf5tyjc@4A_XOCe<r;NU|M55JeOTOAs&d
z5FU;eL|m98HU%}F7=b$J%Z^-!n$hiv<I>C$A!6$Pfk^{KaepK7-k=9f(05J<`wwAq
zZO;lGMCGqQxE%Tbwe&(@=@p66KQ~L04fRmCGsUFCTWastAJMNi@ig`!{Dxu8;QKo!
zLSI_3-%K!(=Ob<g8XOQi2b>IEJqJUmpl8+IZg*Jut^5y|G#zl-@I@!8U(W-*YvN^H
zh)1JIZdp{MX#PVh^)e1HPkV+O{8R>ZLTPc&pDUaf*A+FzV-%(d`isb{^B0n^7p{94
zmtbe*9OnL*IhbyhKRnMf(yx8#eOaK_ZdQZwZKeAqXQEQN%ZDU-D4<EHor9Ia%s1dw
z2)g+(KN4XiM-=hdr}=uR8;nR7@JgF<l70gJ44%90P}R4MO=!asldm}U!h@)=;%B-t
z>*wN<7``s1&;}Gw0@PzTLjU_BT|g#fCj8IKD~Qu@y+2p$MwR0=Pv`-5mqMAJLgSrx
zO_~~>stjJ8&qC#oF!mSS57?nob{ARSeDw3V?nC-`k7Q}0oSUnT_9mfy2bO|9fBjU)
za|X?=c#VC18+&ZvF@y+zI_$uE8p(Dsb>;eCok^GUNT)pag)!=U-hXcYiuYTw3po<U
zTh*b-MXWZZo|wO4azFm7z|wR>{j9o~Y1JDEOmk*31**m40lb6mfKWOs=?el*g~^Va
z{;2#y)X>|n*(s>Ix3u;4I(--LG7&PWWqi{qSX03?Z)rF0;Gf#NtPD_L_2{dn5rm=5
z6dB=&ftexMldpx|;cbRt+)86PuM~K}YMpb;xeG8?0`c{vQG?tU;wb}Tpv6>c_CF>~
z3gJ8SG|bYb>_>QeeN6~xny+O=UcfJ4sc`cb2_3f=VxA4%A))!fkhJkl?6V0KCYNyk
z6^9C2v034b+{nOQ*8@~Y1`rcvOEnKjLk*8++U3v+naf>ya^l8(RUL;W2sF*ZNg@=z
zN*>}BPkjUL3k|Bc6iCPwkxl(>h}I^O8Ipcuo3pdr3@g~?1^qpGIybQ~_aqM1Pfrsx
zQ;3-wX?};_c#(Te1+ym}_2xPH!w~kK0G2KFV>e7XWsNN7IXq()%O|29GC4eJo`4Yq
zC(Di$_Bg0q9xtsu-m8t*qxs8wjn3O-s<@ShOpPws<!XgKEAkp!+`ntmjDD()%XHvq
zUaz{zw``xJ)pFL!%l+e%YZhk3ucQpKh>!H#>rO7bn)vKdd9Wu{!RN*D6syl+)_9!n
zi%;ya9@!Y5mtXx_E^K^Vc>S`%<Ddt9bep74KiHipqH$<?ay7UwUEx59@6=l8;0?V~
zi@s?=huiO%T~qXXwSIK`KGWTeKj&Q7WL4<%k{!Q4Rlcv!yj)y-^ZMthnLREmo{Gvn
ztHSw7!~;&J`M(F%<{rM<8ST~E9zRgh@XQx&J>Pv*&g0p%!P$>bwvQ<dn8>YtGwu{S
z?2rF-VSXf?_rtq)J3G0le-s23vFYqa`OB*;1FyG6&yoW&0>6rF0Io|77P-mq{|8N)
z6*2t9^;IiE%z9O4n?;xgjCkEu+gkRgc6ga|PNw!##WS^Qw&dXCa9j0@WzH2ZITqD+
z+84I46`DP-ss~k`53cQ}ysu4(7o3_O9crc<jXqOfEwekI^{eH&kpXhz=+&J!D7RWg
zvwQZ1g&R;3DG4g+w>DxuR5(6rNAz2F$yK$PMeL{Q)fJoT&+9(j<Kd@m=aFT6?nPDt
zG1c97zqgJ%?D^(ro2qAww3jliD|OZfo?v%34X+JtOeIjoV+ig7Hkmo*3}(b@R>akb
z=S`!if!C+_7VLa0|6|e&$-NH2f$npZ(`*XgoS0b1d{Ym&ov}YOq<dcD$`cqR@bYR;
zU4}%j<00`fIJP7?G}dv`>yq03P4W*gzvqm7y;1JeRgK=P9IXtZwRnfT-h~$qvLB0t
z4q0|PQ@y~Cr)=}issCDVxzaEfA5t<Tm!8TfaWmBj_n$!GGYZ(*I|0{49twG9%oZH=
z2xWR7dyuY&413h*Kk>Qro_o}nkTxI5mq7xnj&5c;#^t!~VSZBUBLjt%ubt~W$=?o2
zZX3Z`-nmDwJ~?7gWVk4s6CK`9s^1EKN<4dWf3w!ltuw>sVwcX2+F7NZG&0(A>D&vS
z^V{b{KgV5)7`#AvpHeCQ(@s1Xu49wK&T#TN-#lNky*Z$ud&^Eko+))<>28kyy1al5
zYf;^3bq+0C^7HS-m1__GMrqf5FpZwSK#ARKleY(LW+d2{`Lm7`v<E$$Qc4!>d(ZtF
z4E*gpX-xIYSa!b;C^|Bcs8QB${bDRJjVV+_sFCt)P_V3IRb^Q2$o}n(>Ha9FF~AJ4
zv294v8RrmaeRtqp&eCfq(mbl^?{;G6+vJZs#371i1=JLh1wW<P2(Hb7FM3*-f=0|~
zP;9tnf`!=#ouY0rK+5ID$V>-`%ah?dmDZVhGYnp7vwaw9Rl1A(oJt!ZLA?+i<B~@c
zC%4e}-#S+9Nx|?|a0=b$-IbKf`(xTmyVjyI;jmS191}IEuGwL2G=iojdd_PYRuMJk
z(HSyl<`oCzZ9wj88Hmv$rR&NC8ygtquE+%SxbN}8nMuh5E0zd)TD-6n3uAo{JeRHW
zz;_g!W8uYvO%;m4t<d0)QRawwkC^x4T;zkyeht#j(f$L^zNB@f!-T3DRsF2zZiQge
zr&@Z4PGd=VALpG7@*^DZk=OH``{9D&R{Qta%n~Pv*5vw4Q`T7`OmJYq<@b&Fg^*BG
zmFGTfXR5vMgERtdvrqf&&tZwPOoV;MJ%@RB?uExf@%h{WWAlDRFN@hC+fOsohP<O$
zg|5X~{LXgqLh(7HwRT9`P^-h*DXQdIF@ae#O!h(4m1m<I0TT;;f=CQ$FoPh#K7#Oo
z-xsz%EUvfIz3<Y^>vsvx_k3+*Wp#@Bs!Hk(AwOBf$(On}=zq#PvA@ITJ)#I@@cE&J
zO`P2DZu%=l9-#xoMbGOEsB;0_-o6EiKx)d4OVNyo^NA&Mr0kwh0z{m=e9yh{(?shl
z3sc3`&l-7(FGe%Q%IQ7$qb|rIxsu0q6(Xa|lOo=^^jR_H2{<WL4vGs|$Wc98yl>GX
zMSSbW9i_9S`{1+`oYXyRUR~+o=6<K?XY#?d3+g$BQ+_M9ADd?tG}t`ZZ?aG^NQ@JY
zmMAtk1m2a^4B7`Lb|QZkzEpj!cIwKNDu*2&92d0s_4)eiv;&kN1uSc^RUl97FP2hr
z8(^svWjf<em~~|?rK{++z<gJ1G5ad76LnF%Mo!?K8GZ{wNCCvsI`=Wp<x1Lg8ZsMw
zSE#pCE7nT!eQgsM0x%ft<{}UZzC(bUI74}q0pP&OeH7`3lK_;1)Q5o}$TUWN6q?BZ
z5&NBQu05eTvI3R?067Ux`)2zdFDWnnJ4NTP?DFEN-*aHWgw@QTKS*BklvO4}`_40|
zB5(LHUcW<QIX8NcfTNd9yujp*qqt-#fPjv4C*^%^L3u9Ej@@e1xo4sh1EPbills8Y
zDO*VMkPd-s%TAmt7E4+`l|@~8!{Y}W<LowBR+)?GB-Fu#eP<h<_vk~fMPm}w5<0Dt
zzou8QhmI2sUI~RRZD<?=#jE*tS`}{6Bz$M(OgsxvQj3@(g?#y-9a)j(zdZ_Md%mNR
zg{Z^`{n}!aBNSH-bmyG{6Xbv5Q&v>dGqz(-sh-QRSYGU??Pj{VApjtx0H9^1r$-#k
z;O{Pc!TO3Rzf=^bCuGpw9tj3;00_ur3Mf#yU|UBPerpa1$5FviMZ5s{78JMHqbjNi
zK;eO7#)bOVj6n?j@1;<&z6dB|x9C8M(4XT;?LWi4s}gbvfO$5-0Y?z;@hveb0R*Vi
z&ltjwF6y;kc*X>nct0vndjkWZ4lqC#z`#DMrqK&U2@n(m1Q0-s(^>%5YBvz}+@|@1
zndW{Ep1BN-LLxvtg`Wxpp8mDW^eK-IKy^Ycen@}B>vsg72nO`i_5jM|Z~!QnEO*?o
zKue*S1Ss(n`R9de1Oga;Lv}Pe9#D@?XCl^1KN`z|AhFWPxrbjbWNO0ZZ=5<P2XN8V
z=b7q3=}g#4kjUc?BmMRC4J`D^)ZS0q-(ub^Hh;ME?FujGTg<cQ4>4^4bQlx>k!xyi
z{D$!_0ndz7*q^HccK7kRQij5);)wRJ&*@M{rpyR~cPU*UkdfZ3H~ELH1^{xynz#PI
z#FZI@#69>6tT~7gP+2L3Hd__~@#`3U4A#XHYc)1u3KRxvD;>XSj5pI>9%~KY!hk;J
zZh^;X9Wx*@HXx7z?qgmFt6v~B-fA{b++s%#?8T25Ep}CV1As|i$Br}<P?a~qEi*xt
z+zU}$i5jR~E_a}mYFNan{H%|E+A3pUice>Yq8XUzR^I_#>=6qrK?}P{B{0qAzGM9Q
zI_;ua0Y{(!7qB9O`~wYTr1W`LU_5Yh!f9Q+LEAl248E%IVY9wNO0ye>2?7|{CB5_C
zF$f4aK&nlv+X!F9*bX*1|K8%jaSO+@Oz~v~HbG51x5Kns(I{Fds1jE}h$$E~ANo^u
zG*+G#rZ00JKx|^r6aYWP=11?N$~DT6JG24DneP|{fT6aG!2%#cdWXzY5JZy&f@}E!
z3>A3BM<ZijD8tnn>lSUOfU|yK$DU5MI(@ux$9IgKUBkjZHC1_PCBw&p&0sjBed@6>
zOtQ61I_T^cY+91y{oV+>*?a22J~A;*eukMjiwG$NpR7fhX4=3cfES<BmCH0;;4})r
zkoIIN9s%|rH<3iMFKoeRNT?IH+S8gL;K_EaWRW*vPMQFUvpZFSxcy-hD8T)*Jvi3^
zw!LYYWIvVySPsJ|xPECm;6$PD1HgQ+HLoVjwgKQlH#XWsoQ@bdaoG?q!)^(}%P}<9
zWL*s2i%$d~(e?^919e3-Av@!YEw*3YKvT;=037<71c53udWG%<IGScc`}Y^xkPTv-
zKO)?eV{b3-o6;?=Og7qy8m9o(z(M3*fB=a0acd#KrD&_NU_0ALpe&hD8Ws!ZHh};K
zk4WvD&*|BppW(Hd)#hO}5CBSH;tgnJNK3qp?dfq-0L>7f40twB08NI7OKiE35z+<v
z^=$LWu^69dn!=PrnUI-pWHneBqSFloLm3Tn2g;0|2duCkOESn*>PQh|@$=ABQOk*6
zpc7s^elu*Aa-2nj(yd8|=j8tWO&h^&oCpq3$nBpLYQ)dN4glTSS}>^%j0c5+w_*E|
zgnS#G$QytjT+i^F83{;$$zK|B+r;?K#Hzrs2P#M8iOw=wY+2U~x$Shf%~9$w1Dr65
z+aT_|s>Q~8^Y~NPB!JCo0ACcpeJc%Ybk3=dF`}y=>fd0b(o#9$t#UvUD!I8g_Bu=m
z00eT|P1OqZ>M{ytlWfymSeg%XG)Hdr!S)P~J)Ie|QpmR39FZ5Vs6v1t%FJT(20u**
zk>5=Z<`jM3HOeb4uZ7QQ6M7&E<;ZqJNN5JUkq_j5A)Vw(o`tC{fdl&>L8VZ$&6vCy
zu=}eClZ|~rdJ3p!ck6!l6IsMy_I0Lb@kZf`V_#nI7eaXG0M85+?*!s?^q8@btv$ow
zjdW8t05y?i1;?H7Dlun683naM6b=JCY~ddX=8rTwtqT)xV4y0QZj2a}$bp>z<ro$E
zXh10gie}2{z105oA{D{5B)kmYnB-H1K&Xrwh#6FKw@j>)CglqAW<YU3U1kQ<(?%wd
z0m7Mz2QeU(FI6Z&)&yWiWP+9qgfCWCK>!|MSe6?D&2Y>OHgQpAfH<Bq1&zDS>binZ
zS~36Z>BOr1L`k`+Crc9*UoxmT#?trn$1zg@niKqBZ{2MSba?96#plvs?~5l60Gi%L
z>7ehvhUV5@4hb-GY84hf?MjH%o`L3)+U$*hM;n*`fCbhBto(cw_<W{@VR#0!G%!&s
zSM-J>kD>YNUPm9#N9<2N0B;(|FS6N02P#mf>EQ^1M*=&Dz}-MQpXlf*y!eY9XAqAk
zz(cK3<1n--Oc;luVh=-mGGLqrq6p~oBSyd(fBbI0fYWJSu*5_Ha1KL4kKLjN`!VE;
z;4lz@dqg;lP!}+QTBQ=nfDSWAuncVuLsFip?Fk5!!Iu00Om4pl2jH#rLVky?p8+cN
z+jcCZTa^NzuQJZR?|}?A?S4&|_4Kwu5D?P{N~kKY@jWnE4PyXz_`x7L@LXEh67$CC
zXyRCYqE`dt#W~bV{t4nkgThC!+3u#@j#XT<sceiQZo0pIJH6ox=A`snh$o}_4@?AL
z$i1LIhhZK|O?lD`mM$BLdv>>rvGedxQvibjCbX`a7+?Jy*j~mc5@8ha0|%CXGHHhC
zOnOwbk6)jUM;Zu3VQ8NWA~@-A#~Q$J@7(LbJn*Vy5^x*oeZaZ}#`PZm14Dep$bN0S
z8~l>+G-$o-ad$GKMz;f`2?&=8>;JH`ZRp|nF#v0Z{UNH17w|0qpbF^C6#6FX$SsOm
zf-S|*;0x5<8mh{O4e^8oQ2at1<MeP4yAz9t@sQ5p*s<23WaU_A4xhy=(lHk@{d?A`
zZcZ1y-;yvl-Q4q!K(jP};=*hx3`GHdWyOC5nqiB8gevm0R_{_T3I()}T?a;YpjHMZ
z@5bo*TSDmXcW(VhpqXK7tPJc5G()=rjr9zo4lrHB_$>vF1v|KCehi3YfIKITLX2y|
z20;`W@9u7SWVJK{a%(}eeY?4}23!xBMx2Zlc=0B614EvF9l(j9xPyMUf^sYYk64Dl
zK1OeySK*HtZ=f|m^N8MJsA{^~+sWQ!V3F~gDL*Oav%tI+lC%d4##6w*4u1Br<x!mh
zC3(d)I(%kELZqz0wd#E8Gmrkm&v*xZrf;jB`Ram!?>-ek;KF)qeS4A@1kfQ5Y7gT(
z4mV639;+s~em0OqH<JGj5O1-1<X&}~KWS-w67T;$p=2qs{4jJTJ>~B}3oK&?iTfB4
z+7d9lU`H`4dT%hGOB0r#MoBZ;g=!-+8N@FC_DAzASC1E{zZGr^P<T4!;m1C++>PH|
z`q|taT7Vy%47^nr<dXIbLO)30YhQ$h5m!U|mD#7&!fZ|}<0E$`U95#orUM$Be6Vcn
zDmV})V7&rLHehr8;~*cHP%-d!dF(B6VgMH`mCWb!5s62~g+F%x_2Zd+L}O+g!wttk
zC4};8hTsjRFJ7K|p6$~#q{%zn0QF>(d;Q^XfI?|{m&|}Cw6%PBS0^`2%KJjfTPlL;
z5JQ#%Ccnsh{9@|RCh(R8Qht(+G$vdFDmKy|x<EShpy-Bh*74^%00X!z`sAg9F?@1u
zae4lj5eUjy&K1Uz7C+tjJfpHzA(C+XLAg~g<dthFOnk;bcqiRlWC6W{`JIij^JGob
z!D|-Ti|`nkC9tD4NZ*zP+5zoRU_(CKRbN>TwFdJdH$rh69(@l&8^W$Pte~#&9W4+I
z(}JH=PY&WT^$lZ-PLCZgDC|ug@th1XUusf2@=fT#e-IkLH-TM#@$_u5=`h|sz%fR~
z-bk)*b^k6xQ_5~nZW;3pmb)^#a*?TMwYKNQ$F%iWpDjDmS3Rk$a7?emxJxY9x_#d0
zlPvF<Rmn3kqSL)<ppVCE$O5l;{IvqmR+Pgw$T9W~c_}buo6Q#e`7-4B%*l^e#$d)v
zfe-xI-7ZkhM2zxxwzl%8e13*{z*!AU*sD#L8-t}9iQCG~6$WB#sW(%AIQySxYa-}0
z@pCNAb1ceAjsH2nl}E2-`8?wj&x7J3Z-}wbQ0G0#E(xs7(by18I;&KSSEwNHr=tsc
zcVNS8Bm*V-r-iRAeDbTI2+Tg_H}?I@e(b}5a~f3sRsfz1o%fB}eRHtV-QSpDv<5?<
z)E_c44^{@?Tn2OoFs$^-Z9cFE55UtHR64u+A_L5ALd~Qr#Q?hls>fSKJZb*;qtG1w
z*?>rGUS$vh$H@ASt|9nc>t#%LGqA&7>2-iG4e@L#(_w2@dSPY&Xj*p>%6J}PjZg;Z
zw4NZQ$Mk*GC*T+Ylgu}J0pCb~hr*P^F}cOZd`sD9Ag@&5ExSX`Q@iJPG9$B3$>!X<
z>fR9JTUn71SSB$nDwPYuHxvhe;dm7~`OoQ4aay1XI^q{o(<VuxUs!vKNw!2VP0``Y
zORI8E0zAW+<fCiB#S+1pYIo~Of-|mbA091hOz}Xea<f|tSdN}Kp|s;zwPWkbqeZqk
zQQe!LRmMx5|C>ouAN~cQC;A_Oh8YI1-2g*J1eJ!_6=-gw(2UO>gzE5uU4Z7Xg<F7F
zcZSI7&i^9NFui#?CLyY~vuz0OYa0I%XgDKdyy3i=zv?W%f}4=Hqk_<0BQ8Th{AO8>
zf&DN46=>**s%YR?2%sr13n*A1dll2Z+j&g>BhYAW48RXU&2D#&G<yriyn&#H8*M>U
z9=`(z{t;-*H~~@uQ2K!m5jN=jou-oaj1^D-b>UxsMuf$u+CYfm59$_<#n>ifN<Nma
z<3Z^y7a;|WXSjXZ!9|2_q7%7>Cjsski<Ub~$h5NPFKe(*?kh|06f{NEWm?PcpTuYc
z%R|PlS+X+ig`3EC2hDiJf5~S$*<Q$S;rG6vknI&-oUD{nx^q5DJumuW7TLzJCs{dj
zIo=apWxtTD^uk6VNh$cItde_Oq_apqqN(%gWq4HeVb|LY+HSe`Lqw2DvHqd`U_hSJ
zdAmuu@QGX-wJwQx0-o-scJ<hAq!dA_GCTYJgQf>D$o;=m%M|%zdam`HjZKNInn7D)
z^yWbauN{zBH`fj(kJ<36^fry-5*?ZL`0n|1YlQ*ti)xQuOSr1_Z=(L3aBB`M6bZ6r
zTvTszZyN2mzv!=^&O)b6cs6akN}h?C`V>|qm%VH!9B;G5fR=Mpg+sMjTMvcp2DX|s
zyD@vc7FtDoe5=$mj%2}Lbl<JjCv{L+guA%h5o@`-teuwdo?o_71(pLr2R{#JuhIsu
zb-ZZNd2aH@Sg41LG|`QzwlLEjwebk89o>)ovi98aDy9o(+h#Z*?bP+^y}E9gNrATc
zXi@THz^(1@VTXsU`mawkZ|hGZXqO(_=i?+FO4bZZ7h9i?4VqWU-y~bu>lUx{zD@il
zX^F`1-j3`ErI{MkXSiJc#mX-VESyt%<n(2K{4z9Dt2V+vMExSUBQD)(SvgcQ^tDCg
z{ubS6!>=y4(`mA~f1atfv?D75SGptv+@w^bGK{RPhYLf5`-J}%DO}goIH>(-8q}ku
zqp)VqujN;@rG1Z5H7I2~PDiWJR_OgI<TV0Rjn=x;VXi=Fp}A=HPd{_g?psORxlx4k
zLtEQNr$h0|$Hi}=Y5cJal;hS6@2Yu%M)~ggrYl(3V;B1=SL!T0@(lUJsDNc3*D2y|
z$tD{UEued7u_?2>@j#MeVJ!RLpeF69a;{B6I!lu}r?7|CCzwG`5*}n?+OgJ%AaqP{
zaUj1<ZjgnhGel!>UdVY<R+v*6tEFz1VwZcvK9dQ-l@X(#CV&J3&nATw5%{t^A==SI
z_}lx+JUV@liNNlC3mcVb3MxGNqJDN-s((3>;wwLfS1}$c=7zCDMz!-oio6;+(khdJ
z@NpJT_Q0LQ+HlsglsUsx;e!c&)=czn{Y#9xV~3KB8IPD0$l^L#OO$2<R@N7b6NW1A
zxIu$Z&W$N1b4k3x42(v$Q%p`|^-cK5e_`*w|C-9Szk#1r0tt|W0HK;tH1trV3!(R3
zR6weN6%h~>H3>zUN)tg50Rd4FDS}jK0g)nAnvE_hDxfGTng^Zc%;>axXYT#p$MYAQ
zANK3)&)#RP_Y&mvCf?i;P<r})+-V(e=T1M`E#tk^2<2QTs>LCIuW1&no05f$>Tox{
zq(6>o$+U{;&*UnzZ<7n&m$<efhQ-7fD!;g12I84>sNHxqCEpqnKB>s5sDt3hPqVao
zc8n!vc{Q61i|tr+V9w5SVh>Y|>V2HCrZ@5%4YL@rORoAJyklO{$@;N4#;z61!BAnR
zx0FRe{#j<I1KEq1Ek^R*R~2F)4?U0a6oF>9o72en*B!C4qUYonz2$>Xg5?-lTqUZX
znKTEbTqb@nX{02vyT3DO-b=YNPYu>%%ZnnlW;bz-!Qyh1_MY>Vri8>tOYCUGY*Mx*
zmyuLjh~CHXV<1W(EdfV*#Db3ot$Xj+E^$FV1|Brz`=CCyr-g8e^JuF=yob4<xgsZ*
zE1Xkl|FE!az}4S2X#%cQ-+wO~(j?%zTcIm^)fi~sSq4m)<C<~f+=xKL6C~|1II6jR
zxXy48vnenf-$=SClL(57C6(4birX5ko-+zltZ3jkv|`c-j`6#D!?77fJaPqN?0YJj
z(2?hk=t+CBFprnRMcv2|c0d?cX+<*@UL5NsJ%+7TZI()rKPDOqUw9LTIX^>}twPs%
z3T7j>SlcQrpd*xL8ne$=&>KUFBjx9uGPENDDEG;c8%g541&ZWkD0pOyBdL)Cq<E^#
z@TRI5LPWyf_Y^PBKwPMjF6roty6IUP_&vTZ1A1m!v_pef2jPUtoGvyoo)tfziI8`1
zmdYnXEQ&~?$2J=%giyo9>UDw*hQlP6HM2~eFW0tqLk}5T-Wv7v>M^(7is=U`Zk0Yt
z>kQt!ow#L3`39-{u1m+_ISrG+k~unDP1**i1%Fe?ZVJ~mY7eK<Nfs|@o3!qfVDh;l
z4QsI}CI|Svaz&HOvy8G4^NqA1<)ns~S|PA#`LmeQ`!w}}O7Gl5#JsLZ8;3~N5aGpy
zyi18f=2se89o-J*m)%M0Q9~=D6sh{QL*22Vb~WQXb&m4re2aq2>Qk*1gnMo5&m;FQ
zOhj|3IjJAoeQs%#eb*Ar_X--~EA)&<0^zf>^Nz#T4Gs_a4Dtz*#HjbgX3XJ@YQ0H?
zfw|tAq5@ag^s~|1^w{)PTF77YUCCacIJ)k>T3_W@e*I<Ia{Uz9N>`lhIpS$54?i)d
z*5xtERUyS_)Erf@bzeC;zNmeE=(({x{-njlrMJ&>xJoAq=)D&N+$a`C&mDLkEF}qw
zV5*p^tsN2Z;DfTypB$QHNT?3N_}qHdWNnEWwJp)zB$A7FN!6V7TD4Pa@C|RowY)-Z
zqjwkY-jA=ey8Ddv__pCYlXqm4+pZn8jhN(GF=^KM8?7687kK4eU`<NfOQgxJCwpJs
zv%dM^MO`opGNNvIT5j@L!!F~bhlTef=013`^4Yzbxb=SSMpRALu5ybdGv){8;fEDx
zPwNgC1_`~ePOOYRqs-_2j4*0PA^>mAWxXw+j+wBxaqnt}VHD#^UChJ|f=wXdCM~mz
z5Qh6`(qxwTTJAr1`}ve*-;P@><HDc~t8gY~*j{z)|7g;TPVP91h`60v#*214j($6O
z3&*5L5r|wWV{JW~(Aj)A{wyw2bCNWLdvg}gMSjRm50k(wUjF-XnY#FtEWQjPf8JPK
zdM1B)mOyVOGTTG&`dD*TgIxEDNi)`t^Wa~|61Kf7B6zQi(cyz>da_Iu;pxR?kBO}I
ztSF-p-P`-^JDo61VAg2S&EtzyB7Z>k>cSCn&Hb_=ivwpsxd%lg^Rgu)vvA~1$)UHb
z(5}A2j-2o7EfEk=G5XL<BQd#8^22yzM;0HOD49MiwA5OndR%s9r6=9|jSJ|0=N-yi
zqtr|S%8#PpqI-f{bgf(Ls*JI<!CnW}H?DRuV^=$&D67Z9XM67QX$5QAAi8O5G*eW|
z(nR#snAU)o`7ju^*(@oDp}v9ZgfdDYuwnj@D8)2t&8acU+YVE1Yf1`Kq29iHr82t*
zOiBmKS?lu7I1%OPx@3ysG2QG=cl``8)3<SQD35#T>rDfoyn;DpVsxqfSc~hEkHRey
zTE!S*Vdp!;tu`a&DaK4`m=*nw^|KDs5r&P37$K9((lFO3|M+crgEbXm;rgO>{s<Ha
zY3w_tkWTZLF;k_q;tLXNU3`of^ug}qWko(+$v&Mmjr{rzsSb_YWI9O*%x#@bDA1+J
zKwP!^6qNbmgS_NjvV1&{3iu|g45)n0DIzS_{%st~?Y8h79SeR~j5YJ7tj%=Uq-Zz}
zg2MY4>4RD;r%Ez6cSYqf(kbi+uo%@*+!>w1O2OU*ORO*vqpOWp#1eW6dbvlyoRfSJ
z%qtDz8Gwo=^V|9Mm>?Pt@79O8a*E!yF!J|tcbsl_S#30$>n6gGFi&fo0gJ^`cx%E5
z_`JkrAKK+D!h(5_M|~0*`U>fZvZ$frB6_J#y82@-67+=J3|Ao#mN<r?1WxY-&m2q~
zph`6H7l2wpO?Yci6oN!M#E|jdD1vK>l+`=(7<^5hA|FLMnmiNLOL34jNQ!RYN3r@n
za|#t9iN2h&B!q20+Q3Z+I}iXRi-AM|$Sp*J1Y^q~b!HFI7aTmYW|Jd3nZQ921P?1+
zNL==fALk8W!zW5!unF}&vR@)5BR@KECiUXXpjg9#v^ds9R~&a9(o78ufJ&Kjo|0{{
zWz*ePB1V>N#OjD!Ecb-hH0(N|Kk@RUx8cprvdy4_&?77DRRL=lA?MXc@)~_9>|%|t
zr6D8+5YM(|cZ>cm%P#+E+UZ*$7K>r?8t{aeE)H>ve=;d0A{RZ>Dd583)S=*(8x*WT
zNkNnbQhq`2#ft+rmr|^Fm8^AZK%~28E{|U<+^=6MlSJ0P6lnY8s_lj{&nJO~QF8tD
z0@9d5hA+jOs|3_kLT_v@#vRLnlEW{?=<A}EnK~<J%sTX9XLOY7&T}TCc{>-JuF62<
zI|S>VtyZYNRMWd{hjtp_?vv>`>h<36GQ)y$(}Js~*!@^n`@)>W?HeVoH*#kRQ92}y
zTxO*ZTi(ynGr;Er#4d)kP~#<7R|o0}kJhKXZ{VDxM(fj76F?mP0`mH_Xxg#NV1~dF
zz!}(Z<6gR<h#pK$RElb4jSqwE=q?{%m`a2RgrBk~0+Zr&6J$9fHjs=+en+JB8g)d2
zv?X&s#O4(Goo-=VE)Um}mQo-<R`^EEqiL-o(E9-hq1#<S1L2zk82n36xp=V1{2;M^
zE88rmXbl5DYBfyq9hYqy7h#MB=nE?`<7NH1MQ42{dRv{JbqGM46;Op0>Zpeu0C`f}
z;1O5^BwIKuLn&JQVET~^)sbxp%<Z3M?h8)0+_FQq&kWd=J|Np#xnuYAvquYs&m#q}
zP`}~FeTk&#=c_4W-8)}`^@gj&+j=Lw=umP;y&n-|rQaiUrnLxjN1<Lvh_wON@Z`?e
zy>4x&yl%Hdyc}vWTmjLz&7%;F?iV0I<vXdnZ|ReaY50Q}9)A#@eFHYWL8v!83c=t^
zo`&n9uhoJ$#AwkndU|5C4}^q~!pql<FSZ0o3(fONbX>l@@5=p{$2S+KvdPm5G8eXB
z3rkwDl#07?&_c*!%xw~h^92){y!lzIQny4pAIUiW5>VVVWV17?kp1~qNpT1Y(8G+L
zf#vRO<v;(Ftr_)zZe?!&yf^#?UD`hg%rWH1A7+U^UsQTxzEE4PB8a|92<&Te{4Kuy
z{axw%#T5M|tZ)~V8B=^FZ@WEsE9Y}rc|oXyZX>0>{*A9?R6i#Dww%bDhUjI-tN{IN
zqCUBp!97Z)P+Pg(eQcJk<xvp6Oxpc^=!7q~pAZMBAHa5FK1j#Qz82u+)@MCUE;p83
zl+^R{qg<n><cKW1mW4cRoHLlC6CSY3giINY0w>4VibN7C^XmDQi;7io+?uGVJe{@G
z#!fzau%h7#45}=NsmCh_RyFG64^^BPHGkZ)Mj=$1j7yWhK~)GTRup)Mm*y<2C-a%v
z2|)@7<Ohp99HRXgil!1fUtknIR({P@zB}?2?{jqK#mFcVals<8qJkCbqWm0gdzl;q
z#zheWb8L6xWDa2GPwIQf?u%GZSfX93(dDT&)gw2{%~EVCjuoHTso&R)s-eSeL7W|q
zxbOzf)IwcEDFbS^ZfXF0Aza;%VIx<%Q8rhRQ$a*dT=#^K`h(V{U<Pr8%pq_TxhX{J
zcX3r4W4!%Octl0E21V;%*r+EFXAC{6pMb_Sah@yfx=S%v1atOtidghnAi@a@KpqEK
z&I6)w%qCn=IAIWYQcI6uH*kJIHGF<C5t<~2eG0!Pq;UgyU#N1Q_G;NTXw^v-Zq+Tb
zeD*6X_&bq`oJ$PLez|GWnXq~tGdX>66f5`k^3^Xa^>?WV$TZE&yfm-}E6lPPP>Up+
zOmWt<+>D*%+C7*VPCr%!PJ|vCRae{^$+|I!^?povzf7T^ltx#*&1#6%&b+vE#<j6)
zCeXl#Gu|e%`e7>O@|t4aSQs}o*T}hd1w=M7Uftd%OfD#M5KWFb6KI55DXCl7&8xp%
zIe=Rx>~!vxx8pp~UW`yLC~6M8Uy)(xVkSdue`M)^6Tf2-z20d(o<lRv?`heA!`w&a
zm~0K*=#ri8?5?`(IV#EajhY!NDX`20zK?5lm<bj_-=n{4Z@AIL)|5*K8Cmlw*ZX?x
z!6@9THy`Q+@yH_~#xXNNC+#Yg@0lBU?}Lgoon#s}Egz?bh09M?rn9_l2ULylXERsr
zACFqJFXYT#TXk+-6;q<hNLn$+sVaBV+l!#46n?Wr1JEtj&93)-++x^sy{aypRlm5A
zt7&?hYvg@1;Nf=5i;Xb><nvXRAE*}|W`FTaw)8eNai&rK_Jva=7fx^8dikMx$(rht
zEwMY0C6@`k1|*Z4;K7If(wF5l%C}UP--y}qfP%}h6-jM<WhrO4(c;1`jjHq2RlE^9
zo-n~H4BCpf^Bz|s+^6ESZL9v((W>Vfb+6wMgTjs8Rj&wW4ZJlCt27(e)HKRzHm$8`
zTBpe{s$p1ZHapccZ_;epQq%Iyr1^VH8ioQ5!pfr*g7%<9Ao)}Rm(ZU2(OeRaS3@vf
zhDQa|f?qCSyp0n?O;VKhVSP+bNUbjqe1qL=o~GzGaCINo7Rxgl`(C|#!{uw8r5DYk
zydURhn`@S)67&|g)&7Fr1;?`e+{|r`mp4`hFTUm8?p*A3Ge!9T&yEdc+lI@7-tp{o
zsoe8upzHweF1OkPZ(c3F<MnrM2xH|{3B~XBY>wqy8@!AU@V=QO;Zz>V_syiar8<?K
zbW8nd4Of@u;@zY!?f1)E-8wL#<ZcSP7OqF1+cmkzQ0O48*I4{aa<8dOEw0a8`Cf9L
zrPg~~zqNtTH<RW+VA3%ElP1mjAqwwxbfkRp7|PFCPvAcKh+6*`$G#!GRUgn%y0~$4
zw6ngbFeci>ejJ-Nq`yWR6JwJ+j=SJ&AmxUMUEe>>Q#oWHcL)>bft$eJbT(AXz#R3n
zpWq)JGF*Edb8L6=gy17*BaQo*<NNw2gx?Gqt^0t9r{N|Etm}>Sgs}<H_LD3ke8a7I
zD<xVVZ5$}j^UcNy*G!5$*#FJO`5SDU>8E3Fp3gj)d-#6t;oF6$b1$DQzgl?tdSP+t
z#qyh1OeS-sfaAaCS+Q}lzS%f$Ud;4e+SGNu_TB61{}metsVE}!yEab8_cqSbS8N=i
zFWERb=6~46Y5Ss$)Ao~%Bct>s8>jnAHV);ZjYB&3xsB8DWgAC9X~o7VPyh@4u8q_E
znT?~fV&ioEhK;jU=}R_F+eaIx`=gE1{n5th{$%5jR&1Q^-?4G(e`e$8{7D-}{>wHF
zz>oYl*f`;lpW8U8pV>GpM}M?&SdRW=<B)y7V&hPM$HtNWvo_A~CmV<I*KM4z->`9X
zeSc}=fR%*dY@5Gg<Iw(+jid0rjpM&!<3#;r<8bi*VB_fgrj3*J$;RpWXyfF3XX8YC
zZ{u+B|I)_E`QFB9Q2d3BqwtxHqxnS}hy0s1&ceUN#^K`s%*N^d(>BgJ-ydw8fZw!n
zqJCxLME{?+aWYnH9P)q6#*zQY#?kzRjT82xjkE7>wsGh`vvI<|YU8jR{gsWA_??ZD
z_!n)Q?*D|1v$8Y&hK<wxos9!#|IWr~`_neg%P-hC-T!tQ2f_ZMjnn<3jkD*^+c*IG
z=QhrbFWNYbf6d03|GJH{@Fg3EmHihs&W#^!95DND**KZs+c+J+VdFG?vvK}08>j6z
zZJdt3X5$2YX5-BL%{C5<{eQy7@&7NgaoYaVHcs2z-(ur*t=KsA|5+Pn{;M|5jsJj+
zll9HU`Gt+M`+FOw`<spPJ2no2{hzdPI{ro*XW^5LQ}8=B&dM*J&uyIU|0Nrz>(@5U
z`Cr>OI=^M(KzG2E{+NxE_LGf6`#l?{?I#;Y@^7?ps9&&g1UG!MasDnFXXEBiHcs+y
z+c+U`{*N{e()X)2PAYNcw{0Aj&A+g5Qh%~>Qon5D?AZLb+c;0szO!*s{~K%^#L<6;
zjRWTY+{Ur_wT(0Wx7j$|U$${*|A37{g)9DO;~<p&bsHyh_g8Hk7XCkF<9Pfr8|T^<
zlHNaU<Lvur;~+QxGd9kRf1`~P{x8`$DE4nQ&Nmz9n~n2-*2eMqX5;*gHV*9{wsGkH
zpp8TOX5;*mHcrSl8|VL^jRW2M$;R;s`Tx_#@%&`t(Ehh=oXG!u8z<2Bqm2{f`_aac
z^!;YzEcHS+|Nm^`=)Btv<NwUY=~}UIvc6*DWa$26<FFq6XyaslvT=BQ|Npje5K7<K
zI66PGak>f+7O`!=uyM$rY#hdljidA8zr@DL`Gt)GQS{RJ$;Qe0_t-e%il1zp?tjR}
z8B_dkvT@qJw{eJyD>jaS!Vfl%rqX#;Q0G@|94^JKySFfkzqD~s{GV)`%zwqk>G<n5
zPR4gOPRA!3hi&sG8z<~f*f?0FKW^jLeAUKbJ^F)<llg~i94!Aw8z=J*+Bn^R%*N62
zU9oX)e#ORtD}KesdHpjRhw`7baS%$$-`hA5f1iz$`nTISSjB(R#(^pR+Qw=7S8SXk
zzhmR1{kv?Owr@7hKWXETzS%fG**IXuuh}@1?`)hqioa*$#C^%e3IA7Z9P(eVam1DW
ztc|1l3mYd^LGZuY#(^sS5gSMAD>e@057;=QPc{zeZ?bVHf62zt`Li|-Na-K4adf}4
zaq|8-8%Od78%OX58%OI)Hjd60ZJbLAq(5onP`+y8z?A+W8%IFt%Qg-}@h{jox_^g_
zBmaNF#?k)F#-aQv8;7B|V&iE3(#ARegN;+K_}6Wm$6vQ`6qNq=Z5-Y2Y#jQZws92x
zWgAEL-)Q3~{COKk@<$to@y*7mX}hA?eyygxPP5}iO-Gkz=U`3e1I=3xYi>Q)?0Q|(
z#nkL(sqN;}>fx>JS*6vxrnXm3t8Z;>-#V>+quPEet=mquw>N1GY^fdCr8T&>cJQ#)
z(2?4q<66TfYlqKjjhwF?xuSLFTJ4=Wt-CjB?{;b38?3$eK<oa)+WXJ79=xu7z|<OL
zxjxFNJ;r-|Y?b!-n(O0o+7oN9Pps3PG`c=%r9I_zeQFa^dwR?D>0R0n_g;T^SbOHk
z^_k<^k4|2HbXNQE`Rk9bXg|4j{Yjnn?2YTQUD{6vuRncoNJ~9Tkr4iD;`(!@_8d#y
z94E6xDNJ5kPm$2{jBDMCwRJDnt$S%y_tI+JqEp@Crgg8j)V<oZ?)Bcf*N4|F9jRM7
zzV6M*x;JOny**#|_R6|<*XrKYty{iPx7@Yv{b1eu2kSmOto!hM9rJY^69QHGX5$<d
zKDdAJ$?&zkOyNVJZ(ckaymoli;Y07=y?OnbxvCz33C7oh*)`D(P;Qs_2Dnftx)C9s
z9^c3&Q-f|oDc_B6;?P<~GtdTt2@I@-CZ-wZ;F8eH;~I)-!TY2qv@rR1)L?E12Hj1#
zA$)Kd(@KaCOl%c7s)@ZRcETm`=IS${*fvsbdSaX8<r-|eblKg+cG=oxYzMhnFsVbK
zQ<JMx>9$K!r^>xhu5UKZ!4G^hnGwRLX0nfJ^FPWt;dbg#-kC%EkMnagPCdSO`8xlT
zg0lOko)p%8;GZpO7Ct>&(y1-*^y+Q5(@)Fq9TIr<&Bpo1Z5+-O8^_p48=IJrJSmoo
zM}KeR41Y6nz8N{~C8Hg6OJ6c_n))hd`<q_&*S_hmo*!tM9lZHwuzq3a#<St}x5G^f
zcRIT6wk+Li@4esl@<Gp=(OZjS{dXq&-%Sm?n!fXHdg#H-$m^N=%a87jKfd?+@z~Pr
z#PrkgnP(F#aL(ho=@mHV*}{_*J7;0>`FD2Ct2c}PK|5!~$SMA2<a}=AM4vfjRd@aU
zyO(269(2`t=i&f3X_N|O!y6n%tj;GGc;RM7!vNXR(QurjYBx7}vub8IPw-6EAw1Yw
z4<nXhEW*8-ho*<o+`cpxOU~oXj^q!(PaIX<zjlIiP2P+b#vVHC8Lr0THyNbCmNl73
zSsoSR)a;+jJZj|VHx;00IOdIA*I(p=b#jr9MBBOfO{X<?8jFV8XFr-gT@h5gIa2;A
z>%%i4Rpqg0>sNewY>GO3gk;4WwBFf+g$>r^hGcs)8T?aQq_T*bo!L3K&>mB9M)K8;
z+<lRf7b(We{xLdkIsTD4)pOKv{eFO1(Qe!hgmfCLTLF%Z&*a31>uy6hGYUlH6C1f%
z)qXN^0#TeQ8RL+Gl4D{Pf7r<B{bb|}1R$giPwK|4K0<10<&U;D?Ib?ab}=E-3otS&
zZT2WOsUt%g)`h3+3vTMX|Iprgc?d1qir*DaL0^A+y{3iO^1;+vc+B&okz*{{Njx!|
zctfzFRj^d2|D%ypA&8Y}JbF>8TS|)A^GK@FP+mc$dd0|50;~PZ$hkpgL=j3g^{?Cj
z8xY;a!Q4c5-k}vEXH?cC2hgM1yRR5IgCxl4S>RYfTryZ;qje$pSi<Z3k%}Cdlff)e
zYgIlsa&RbGPh<x8e(y&kXXvAmGxX8O8Tw@87_S&PLm!QtIz+0`NJpJf-lIfOTnL+{
z;CT047!5ol#q88!mo*U6?KrIbl6{m&cV97b>Xvs_T#h+k1eXuqC@jr+1%I0Ia@A?s
z_UF~W*`-z|jZHEToQZSBtIhRVIyPT1as<9)<dE?Z7h&??YmuAK5FMGmJ694<(q#p+
z?K+X3`<eL!!WwkW4jvr3il44UM_t(uFd~)I=izN>y8>x@oR;%HGjfi6XXIQoC@eVg
zxskK|Gb5+plOx%zK|y7Rgvg`v?}fULejuRDhb>Xy^&ZcUDJ$y+9^3m=(v8hJUlFkR
z14d2>0nP#3R(mmKc~AnMrl>jGEaUkHjhtW*!FszjWi2j8WtT*(%ls8;Xw$Ea9Eq?a
z=TN@;`d{j9|CN!WvSQ?H{hE=(&+juJJ5w6xGXK;c+C&<hTw*&96U6{*hWcyvN5#C_
z3U@CRP<{FeQsnm%Cm@(MKTWcUv0X88MBu2H(T_$B|KaS1+)5YY6rOPi{9xp`e{bY)
z#SuH*y+^pvV#nueaMH)4fm01Cdx`A8?)JdJk4BCdd);MIf^hQ>Mvg$4vkUdUpEVE^
zy`Oe@${i%eZh?Qy9x&dZ{0k$;_A?{L<%>p+_0NnPhALy#p&l!cP%vM#b6C4zz)>*w
z4mw~;IhVmk;LRJw9kRoD)|qZ-5qahhe$!PYIUk0PYuI^K)VT0ISyi|rrsn4Mo(n3-
zFsWH&&Gp89sbIb^cN&+#XGYG@pEq*0|6t^df62&6p()UD!vt%`C?%@1tAy!3f|IOq
zipi^~u%T#vua=>>!Gbf2xEQ96jdKezyF0>tdAt*13ceSJUH{mGHD7a>aGJ$cd;<rG
zt=%h}H@_PupH9bb>2{&IEpi#+Xj|-uURb0w$WRWb8x`WZxsS=iTUkl0ne`DDUW{~G
zRlmJ$%BoEDFN(9}A;B|^Pf#scpSZo-AmLU|D~fm;)}%GVeqtz3X5;%On>FsNX$kHY
z$gp_2b(Q!C>{NN#wa%v*(qY`A9M>w=(-=EXzq>nQd97-&^I359yL)rTu9X(97&+Eo
zHFAiN*Oe)|Vn+{Tzdp94%Ws(wWtRQ`f1GU>UxNBkDrJ<ba;>f{b?kbE0aqOJ9Hmk*
zF`UjH&b`;7wIWjU2I$0ardhJF3oP(O+`GG^x}rM*p0Wvc1s*8xWmR3b-7lwXell`g
zzB6)ybx~(?33xAjn36My?eIg|(G8WqHgdx8arF|M_}vO&s?j1LgBlNbKfGw<f<5Nx
z(PzgdM2Snf5;VA=V%imvq;wIsm<>%R=gpONfwVZGmkv1fp21Z*;GXhr))y-24#Mel
z{u873pk`;nOQ&?N6foej40IR?ca)9A7S4H>dvBZ#5l*(ot=e_u3r3Dog}&><(nNmE
z889=A;1~axQ-w{LV7Mm4+MV?&Wml6z&GL>!9U5A6)-`@Xp`|<G*gGL?{8R||By^z9
zacITJDM3z^!XsWF@0?)q7DJ2Okdug4H&ujJQz?GU+=n0pr*4OlFvvbCWQuG3)PlN?
zy_Tk^)l7h1yItr$G~|T)T1KYUI)H68UOJ>n@kqBw-x}IIivEd{;72bYn(k|BlESX&
z$wi}8-zfy#!%7>I;e%f>avJJQI2MD3zB6*@-y1o-KR0r!snP<i+$D2x8M^F9l6JW$
zvMEVUOW$&!FG!l1st|laV^tvg8GpD8SRy$&O0^G`;G<RkB5deiFmf7-=mar;<9Y<6
zD8gn`Hrk&M7@~-Y`pL){S}}5LkQ9Pi)x>8;4gsm(s%+4-W(#+8^O`kAC&8&v(vMq@
zp&8Puu$XM;gYxb%c}d_B>d%avTVFJCDC}iM=%x^=mXUS_%%)6V;|v<2NI<NzM=EDJ
z#oHc*&=i%a3P+e^i0T}C^`OQUK>j}7YyEC^RWf8>z0s;1t?jQNie#f*0IPDnv}%2@
zbpX5Z5J7H9*TxnZoTLuf$2RgJ*(UmzM$WAtjU4)K8aV{^{@W5>b8P*;VdUts^YFlu
z!KrzrQs>F4_(o$HC(Q`YwH<UKUF}pdm`#Qr9wLEmBWtzzSnu}JI6*jdC}>yEzLR@S
zo&@hkgf(gNtrl0+(TLzXBi<wBN?&WS9ywLwifw?Hpkb<+exbww(#rfSnC@<|32WAQ
ze~birI$9|}FJwwB6=$<KQR2)iK5Ut_Kd&yTG6X*YiFwVJdDP}?#{7l_iA=<)Otz{_
z)JP`B+ssY{!m1o=kS(&OT(a<m1UON<q|_!?Q6mda@ZBOXUWqx$nnhy6VAWAoDjKB(
zf*Tpt2O*TsWl5k}n!2-^sCJ-4M3Xxqdu$iZhE)cffop&OBfOOT*plyz90ioEdanJ3
zT*v*n&Zly1Pa#^}Po6E_{b3DeoqG<~SWYk~Z;i)3tNlVY7jt*M&GVPcr732oVFD${
zf!y+Wdtbx7td%17AYA?7r3)++Jy=;0GR~jPDPFsdNexP+=f{{D_Wr`iF-Gkgl;>=^
zP^zGJYsjJhuNgU$pBXv+?DtIAOp28E?7oB}B21{roNm%O9gQ|LB;xkv2URi<K3G9N
ztl@FNg}oY66Bk={BUIH<`Tke(3Axop$P%_orPM3SlDSu7tkZ1{SC~pqfLZlTgXbk9
z;XYdDi)>L5f0L0jj}$gRm!X6G@-{KDS+_f}awV};C>Fqd<W8<Z3&%QljmQYU^NLz5
z-raDu8Xc+hP}x)ieT7Oq3pu5#<GPb{Er?6zM$tOwcKOhmBWpJbs+|TqR9(^0$Xy)I
zv-H1eAA_>dIiK7UTNlFCbZ(dC==Vkr0}VM!L9y7|tLkY~UR3n1R^~<SJAZ&pYhtbM
zJDx;joTwU_nuI<y5-ymccx{`a*=hrymxc{MGF70WNxs644W%u`YCD4Tq_S-og@Kgd
zx&E+i=vvzt*0^qDevw8#71=~(bz_b~x9Q}@Zp+o&?|iZ+fz(tCA%?mn?K!kIe!f|8
z9Rb<<?=W&IbhPeP!R6W@p_z@PWC&OTekxPLm<kO=K<M49+UmJe+j9H7@(yG2Qccja
zmrj##DC{D7lVK*N$D!AsT`P}UXZtP)Ej1=hp<tmLqAT91?&EBT*1p?NMQdsT8tr3(
z#Nw=*>RH_8vd@rFL1>uFa-;333fmZnF`Ct(s>xx0bZFMDL*{4)INR6=n(Qw%xMJk!
zuop1hOJsC&oa!NO*W(UrqLWaRumVi~ddNVUhYcFC$3GLgn@#p*xO=*gt!azh)|Mvg
zM%$IO*^#|X5Ms+8yl1vnOpwK`7pdM+VLQUws)Nee&fB1KD&rlCC)J_By`xncaYGPN
zSKsk+!HfmuckKnT+FJDl8NQ|atn6;~&>&n>Tt}NrN2j@b=W@pl6rr~U^F{)5>x)KC
zH*yindQCJ}xx1yp8u?}fsYqq5HqWi?mD!)witAxzn?)Z1&Kw5ya1nco`Z1=0T~qR1
z7hKHhbu4Wq5!+BCWos5&Q+rP`+;#)Yer0$*Ag;=chfcOv<Z^YaB<sQ%bV>|^-q44e
z?-M?{I_w>(Y%WixpxypdzrzU9QVUgG-w$&|n)qK;yT^M22*@kGZE)GqCI)FaE@t|)
z@ko2N*X8b}OfB{Iw|905+PL?<=fAy0EBA~w3r%;Oy-ha9e6xJkpabY^==*_s8y0Xc
ztDK~Ib9c6c^*Qnel+Xs0CL1Bz8U=2IG`kOh#s~RyL&6T?@b@rg>KLzU82ypRgvuVD
z<Qz53h_w6&(Sr)>ktFM^5APJHgAjPwa&Y{_gK)y7-mKt#L&Pf2${jsW8x@hBB&e>x
zIk8`emd8arCS+3u*S+T^jqC2j_6pqzU>c#7_T6Enpz7bUrT@an8T)ADFf#pz{^LfD
zHInDdB_r8_Okk4o0on1m09=fcuiqP#J;|rUqb-aPze`ZzL7mvUF9y3W$w@O0J0@y5
z{!Z6Yd%5t^UU*NN!oi6G_x1bFU(?K3b0Kff{y0WqCx5dlXh@LhQG}!21J6Uy)#dC+
zHVsiC_eMkVof!t0ErDZw{IHGC4a5`h`0p4wQU9os)4yWm(2x;!+V=Guv9?kNm8Et$
z8*ZbPZJc;g_e|Jz&dl34lBKwTT+cRNb!^AvVXX^Co^j0Ft++NOtE*jnj~`Q=9IFbI
zhdTiepiEtq;#|TMhfQ{@_0o0JnE>|A`_EFO+0UI;P+n*Af@8fFmqr=&xnkCW1g3gf
zp_(at)7)-uNC#GdKB^r|=v<0hg$o|~%*bIBX^O6oLuAdD*@gw}gV_^^cZM`7M4u9O
zsc8Z=+VW!pwE7)a{o@EPpu1rPCIzno>aLY~gYL4{&53ciZkowndLxC7TnEuhfik7g
z>|jWI{}T4rZ3$XE;lfC!4s6b3jwNI<5u2n8NJyzcv`7XrPLPUHI63~1&y`h&n$ku2
zG+B!qHs2;t$XjB#Rh5h2#KX=iY8&=dNaEul-iNuDR2UHXB_z!|A?<x8bG90m^_~Uv
z!EbkJbY<#JJZ$jSM$Q`cdtK;<o!Ijn*a*Q_f?#yqg8Q$G9BiyePj<7V#G(HD@EvfK
z-!^gv9+yNWTV|3k6rVDgHII?63$|(a%*gS$tn65}b86)F6Q?4N=40X;2WE%qy+0W_
zrav=s2ECm8d*4f`_<Jy-x#c$B9h&!QO%S)ra~WRn=}1%FHSH4bxux!`?(x;GBQO2>
zFVGwv*iQy+8!Gnc%452|D|WfFXK;G@-ksOGM%UWS)qiK?q!6uacC)|mDNEgQv{7*5
zpEYs>R&z{a(;_OxBIoIq>+fsaiuFiz--%xY>}M+UQ)9jGZ;nlP)Pp(oWgB1#+x*ud
zF^$%G98D068U$k>ughY0b>2{L2hJZaeBkB05h3hlapQIUZE`STlD&el$ZLgw0-=-1
z3O85pxw>E~?G+nfDtn;7_R3(Ueu<gFzGdtca`Q+@heTJ$f`#hD)wm;^!;`(8)&3g2
zw`AuF%&g?!)Ff%BA#eK~W!^(MTwSeu-aI>d5h^7W0~K&x=rQih?(a1ty1ukal{6V+
zv(Qm4%hmgZk&{e3=ICOvLD3P`we-ZK_!c#Oa8>PGnX%OkY|4=5@y^BJC>_2qf+L5?
z%aeLhwBS4R;G?&@s(MlFcXqK(nYk3T264OWyw)kYaqA}|C+D|~oC>%=0YW_wx&6yV
z&f-b=eBum$gP8KZ0ZWlbIb53!7`FB6!R5oI=|Qq@rtA(^jI(V0g^`ngAvcA&DT(`1
z(uVwxM$Q)6hOHM9l#$ymSGwJPl7HTD|BkI6jT|42d20t<Ma`XjjBa+R+RJL<bI%%I
z!egI%2)x&T)jV(voxibFEk}J?<YZ_-o7A=CfSbg?Qx?_oub209>+v28>@_nwwo^l6
z?ZKddjeFk*@jQt<7~HW>bt0~a@AVV@EeJ)wlM(s<f{~MKqU%QAnpNj{X?V>gp4N%_
z4_*LA(@sqt*Th-J3&3h?8WPn@f2)#<CC1aZatNh@&K2SYMfBoR227C;En$pDoO127
zO(v#Mzcg}6{U0#HC$Ecbw~S=V8RL*qj^%tDZ^F4S20q}duMO(aqd>6%<S2dJ9)DF?
z{dTF;mHEn}V1dt#oP-~ZoCZRxY&JT~E`6L|x`x7j-@15h9ERmeX13#`;~G+7TUb+m
z)588_1Z=)Ol7@1YBR3dp^q?ux&XZ*IVxrt6I&syW$<^&*CLqU!M7G|XHA$qb#YGIM
zHKbKG^2HHca!l+H!jR2B{s>NxjxqKCkEbYJbQu7j)NlCC$XTW!%29f3lTKk1{q@L;
z$!&5{Ousg(TTkPg(qLT0l^0!&$4`4>6NYPAI(K8G(jQIQs+|e86b?x`W7~${3^1}V
zG#Mk_CK^j$ThgWn5@DR}Q+99Dj!b#`pi1iD%0C%7Dqk~l^49B*<(NJmy{pdBdm`ID
zSDxM0><HJ9lf75XkfuIHTj+6;(jIt@F<ng2*w>95fj?#BWc_615F$e-mD^?OsrYrR
zQ~d6kaZJ0MQEuBEGkQpoYuk+V_@!shJ61lvT|1($y}I@ZIeqm&Z(?7ef3vWk9WqBW
zue|IEcQ0)x_l8t|4?JxLLh6_(6z@HCQZg{taQa#t-}0-oYXb8P5!rEg!SmSkvivR8
zZ8mpriFsX}l0B(D>^f)qsCrCXE&`r%?*t(XiK&cK;1NM?6>K_DO*BLh7m%;B2PN;w
z>^gj;*pdmy*Mp{?b-lb3Z>8!fj-^l6a-{Qqz^dkD0Cb6*WLx1Kx=qP52@*;*5iWD4
z7{j6@q7sTl!v@?u%C1k?oCPs3PA!KYDx%!YM5d6=aozf3Motk@1qOm3<Edx%qiIwS
zvCa0>!VMj3y2mU4Acw&5&rK(U1;Y8?#wl(QnVsGRp8#`4%_n<mpjf1bjgqMfXKx9L
zZA5HkaoyZ^GHnqFSg$uZ!ZDQQM~W2$2<Q+;sq`mtUo>(wQF`7D9LHyEG7sy|$iFt`
zv1<u9(rz7T1`RVxo=%WLc|;ioR&+J1K#$WgQ8H1DMzPNliX%F=6V*nzd}bEO+d)TU
zTpEqCmni%$W1?ElSt!A2Opf>&F;7lW?pfg$acOf_KY?sibg;_RTrFQ!`%EbFfjAB1
zw&U@M{Z+Rjtef+d?Y4%qV0%rMdSulBfK3np>JTl>d}u0rYxV&B8K&@HPNXuI8lx!$
z4B!C}kWAwc*Qp1aTGNG56G#MJ2fROr1&}@s#p7EfdB^}1;ohg2t#VuwL{)i_59MtQ
zhEi8XqzDq)zGUQt;&lihK-PbcI>K*Sxo+Pr8bA|v)qyuvP}yVwDo7t_H#Dm1-Io&u
zK~X^f0Yu#+4`7Wn#~ubP>0KPHZgYZ<C(30L0i9jK!|uRMVZ-E&g-1M4jgSKm6E3s3
z`U*#b0hRc*0I3iG09iwY)=Yi0Aeu&i5+6&y-glfp01Kyy^oAbMk)<cl*k0y8(i8zf
z!ewGpx7?XZCc`Gvc6o>b_2`nl4YJ+|G}y8yclpDfwrl>2Sm@#5b&uaa4|_0O{qW%P
z!z`fZVYfmbhF$mYUl~pWk}kcP#t&zo0d8qXL_8_>AcS=^#eLPt5r~ul0MTypX#qGN
ziAsoGE4+_B4$%OLiUiTRvs@r{MU6*ZO2Wjea(KA7DiyVyAiSh0tgA5FSL@LV16pa)
z0I*w87YGUWaHoP>X@|F6o06(LU9GlSFfyclop6uFbd$nH0MKe}U<yG2Nii+_EDcmt
zzi)p%e<{=~wZ1)HM?ELA=!uH(&DvFJ+QMlOJZLH=wAQ6v3G1tmCCFo!bO<!v@fQiM
zt&L`(bPr!BP!AYM(>A%QuM$*YLBQb%J;H7!VYTb$rNV@ZD=$^6SjJU5WYRzY6+5H6
z_XUOx0^TI}`$mpW5&jAxEUQ<q^IfrDxEN)d%Bl+h+Y$z?3J5=nU`HG3h*qwWZcqTI
zdtP9~0jkU_1`B`)2@R`mf*@o%2vO_`P$dwFk2Ex0pj3NftV5`}INo@`EaGmg(eCY)
zOqV+mDW!Dbo7xgLjaISJVWXH#DMQ)tFq*XSssvD=ApEX?>V^po>{83Fi-yuRkz%8?
z<S{nCKVswv!YN3oO})Z;V=9MpgnbcR8V|Q21E@@>Q#ZsxAd;X8TnKE&+qXxUYZnN#
zVO0TxA($$@O~@axQB`FJfJrZ77BbAV0)V3{E6pJ`z8W^I5s-SS*$jjwQ(cctKj5`a
zI2wS2nv0vXm*r5n%rp}PBVE(mt7_Uk5YRhP5GaY-!gb!mT00rqW|3_otrlkch|Pf%
zo-u1Utdv_6tHIpguL>9g9>{e70pMw^zX|~kh8h)knVE(F1+mopZQ+ReDiC1l6rynQ
zNkYn#Tf*|yGRv@12=FB%$83FtDnO=k+l3cuXdvyN&jPD=_JwT>rHBt(7H~DVgp`0u
z5Jd*y1*KMqS`}z?c_1Ro1*p<GIz2hm=_j4TIW;@pfOa%Qx-Lb~og?)t)|?)KI1gF0
zEtzn>$8+NW@zk~<u1euIFe`weAP*B<#5k#{3Y$c@NF}*c+z?X(T};BRAMNpohlw5R
zbXZE*G#V}e!&(*fh!Jg9$w!FTCyKsLa9HZq>866Cdhv@y=Ezm-k;cePsu5B^1ib=$
zfG^{8JXj;hrj^>GB%ZRVLPMga==KH)D>77IX<hhf7#9F=q}FN6WGj~?W{bp_#@o@!
z7Zu4pr@LWmyZdgA_8Ez%m@V~)@m(oq14Br(T)hf6GK9$PpbWDKy<oq;;p;}u8<^w_
z*s~SllMmHh3QHdaJC5AeS~T=j7DrV(8n-#_I6?G^NTNCCE@lsGeLBFN4T1Xu@KGIM
z8xV`N)2P14)jd>}5C>T`P?fX@XTPnmL|C8?HR~#uY9<xj&DazIW)IQWtpww%prVRs
z4%9G-kangADNMq@*CU?_Mbku-2Nm879Ak?xAPfd94zWr?AUf1ih%S^20EkA4pgn8@
z6^aMSk`tlMCaa>UAiOr8ClyjOD4`0RxDDtMX`mT3+<}r}2mr^yPB>7}RO?hPEjtnw
zl<B-Gt8!&oC5dyzf8EIOAm3&OZ%}%Vfp!mXJ<uft-f&=t6+qsgkpOz(qONDW-ZCDh
zr&EkY+_fi!D~v)@rLLQ60GAgN+yOe63>dj?6ldKyJOmS_((>J-<x_dmDt<6>$|4?b
z1X$u}t|8T0icpR+vXeCk5dtvT+y~1KZVU|_7UmmZ+JfND09>b3CX=e5N`qxmCCp)H
zXDTeSg2)Yea+$hmkDKtyzJOP(o-)9M0EkQ~zj8#4GVE2S3tJ|Y&3!F*Ce_Cd%%)Q;
z5kiG_Q>9>u3Yk;^F`9xiz;P8e;|gF>+axjpmZJ5@7toh`fGZZJ4O0n5`M{H-)V&kU
zknSpB6I0B~gzFt3AgmG;Ra{u=Vl`9(qXK8y!61L2O9*Fxxo6`S-FJp{Lj`0Y2sOxl
zn|Mhry9_qQs9M=r`N&lTeX4xg7T4Y<R6ND(6uJ*tF>(ap+yGT{KovR!bDF727oyUY
zBB1zN=bEU@OYf>Ys8leac3w;K=o9z40%{I7HHRIrngI%gsM@0m`$O-zwr+Ha2Z2<n
z3OhXsHj4Fq6=1}M)FdxBqBvFx$UtteGOmHuZ|E0*vpvIzJgYqCHAuMW`Ldv#5lbyq
zY5<V|Ts}_am6>TpbEYd5Fs7Ps)>*Y4xOK)u0(5T}eTwdTT2&^>RMl1ODb&#zDoKTI
zbq;e^b@i+G^F~f9%v6=Sn!}B>+D+Vp3hHLKM-@xo(%P86UR4!j7*PgBH=yR)ht7p5
zxfwwGCzz+FFmN=$w-g~a*G>dzoiGsEc$BRS(4J0kopJB;va};V@(7`VoNxO<G)uR2
zfK(|gLlN#FB|=ol=_zvE`|8?K@HNO?ww>V|1NV+CVx%YUcw~mDI)Yx=gH9R%PT^Dz
zLuyOe`s`Qk8-ZF6vaj;Ak7R<w{h^jvV4C`tCN?Cxaf)`@J7z5wEUXHC<MCu;_9r8!
z;fqF2><0HI{_iFCJhQ_fR^AFAw8C1hx-`d5aiF~~Ufm+xu%+Vmmc9}x`zLAw=t}7i
z?ZngcX3-Ib-i?~t8%NwGqVi^<3%5W=6XHI!*T52)Nc^K<pBj(uDKk~woC&pdB??aL
zE=q`6$8|L%nM!POtGhf|b98%_?0wwzP2x9)om?aK%rb;^!&#SBq6PTkPWRJgo_6uK
zApRZ%*1BovHsZWb8!2M9%r=wVB;k-S{2YC1iDrog$9fd>9R+*hIgIB(v1$?ZEk84I
zR_;OsV_7#oLJF%!29!I#d3DP?xH37C>VT)BqI}rN-ok2k4;&irO4(S|NoMJ;fI3G=
zx40n?fU0WMgIFpe>Uz!72W6t&Qt3~n(r0p@ibU@jkD;fl9zE5zyv}i-4kF!1L243?
z16LLkF4;jEm7(a00Q&YWCO`!a@!S}+)I<y|OwUek)c`@Mv#B_&)b!)CPevt{uW(0g
zzgTG00vWL{g7J;2;g|_}+*4>K=4}ef%$a_>3{m<aVj2;)Y6fg=3{o+rgP5ST;t`OC
z=Va#sw|_Enwtq5mw*Sh=@u{b&sE6n5?%SS~-Ez!k{gAibOqGo9b1tiSP&WY8p}NFJ
z6du?;maE+@Jm78}w#r;Xv~}J>Y2}L>Q5Rd&=i()LxOeUVZMD(D+JQ&$FT*!3n@K%W
z7CaGvX|e3L3kMt5O=>(AVc9b;uqTY?Zi@`)(e_eljuE(9u{+vGb&Cn|P6ShW#yw6b
zGJ@yzpm*2k&PRvuz%*yvFS<oA?4X&q!$`<T1=8a)>{QuJfpVB_BY3z2l`a{AUrtHI
z0b!;(r{V~a=C1=wgZ(LdL3DBuU3IS1ZP9h^@*NRY=OfX3iIE{`ymU0wc5SR(6n(|W
z+4@I}9O20FjZ{Qtg~W#|fHPHbqEexC9F|XIyi*UAqjKcCK}ILRBmhxQg^mL1Me9?m
zt=0+yh<K`we+1(I6<lA18ckRe2CM|C@?{NpyqmBe^d$S3M~DIo3B-n{o_Lrb$N55j
zFpN<RFxiXNTM_O;oNEdcBNU3(V@3gJJR=9CISDalBY_lacMuc8TA!&9@KlZ=+P!sD
zmk<E1N)y1->T@5v6h-WTj7T7ARwC!FO=>C0At}2=PM$yNSOIY@x)SAHz~9Xym<kfE
z$lU}+2ut|8uNXN36i*3s@EaQ0B!+)*#mFJb7_iZ_(E+nF^P)FAoC9gnehXf?{9c6~
zm&)?I5|b3R^cF-vT`_VPMJq<moHOtCpBXu-vl9LJw&!gxZ(WoeDA;f<;3=B}PXq)4
z7xYiq21Gaj>eg&J6bv20l7T|UZ*wM;1Z1U<2<7^>-FX>_-11Cw7!?9T1GEkBh9QV#
zMv4i+ae>Uvg0c@GXZG~51h6FYl^Z+*S0OX@d!pC(*mZic>z=T7ZyQ9y;kYROXh}4%
z)f*s-i2&mI$d=XdirbxrAOtLmtlWX{fa+#6_Ec}+47&$GcUPK%bRu1?tT+KOK{wMw
zkOS&()xaGA+IzMtZ-P1p+N3jO0tVy9xaq8t6@)N$PX;a=V;Yq#a80ZXj#8ezisaNB
ztw*SQXXLp5%*Yumh_Z<7{oKguk@K?tWaQ{u;HusCbn3G3y%9^cG2NGF$G%~oc*^>K
zve-2z^O<{Z%ch4ux-D&Dy%<YMo;~7>E-~khTQguH9<#>ll*k&#@(^3@Gi+6jHxD89
zmu#`ms8Dc7z2Gg5Todl*(*_2_G8;3hN!d3<8+6KIh&vDoCuELpRYwUD1dCEqE?lg-
z7>2ZXBU!MT7}k8eJy7guc*!W*0HZt!@;GkA{}Q6?<^GeAL$nZXn@lhkZ{Ki0rrbWS
zUh>+#{qJ@-)VgPLdzw-Y$W}R4^)_6Xb`zJSqvLNoS1pdjj)o0C-j*YpGHZrAVzNwy
z7S<obi7S6Ha)v%Pa^__deNVt({w~Y&H_D+RY>s@QzQ&^G=**gc<~OE-SqAN%9#7g8
z-e-3lZy2ai?9zIt$<-{4)KUs7)z?+(HF5H}+G~M)y3l2C6w`z^y>8krWYaX_C8xAa
zYfM?M_iF6Wrqk~Ox-Bo&s@&O8{a)oR8|7fR`5C;xC4sBmLb=9!!#yV@&MZmmn=9qc
zwcL+>E?~fRhVee6*@vR7b}iBF&>Q-h9QW+;HJ5FkS{#{$PAOascFU1HAl(p|U^7ed
zk@vZyA7W9b6srErE+c^=lKSqJWKA9Niu+uXz$OPl3Bg1SW8?m8Z(Q#WMvn4|kpolu
z(a2FbuS)x5<XFp4=KR|vq!$SKGL%|ogPyo*4TVd2aK*?`{$%8M^SPpp&FKkHVG>H<
zlaWJUw_YA)nb$KW7p~lI+JkXUb4`VXYZ|kCZy|4JWYNtd8@U|~BBV8m`p~tM@VGIS
zBS4IGb~wztgG}jPF>;a<=wzL7@wJpz&P4whTn7zPhc#yNM2C6hy0e?4dg_yHA#xp)
zT((OhxXhw(d0E{!v(z;6!tacn{_l*Ot=}0rN^~OP{sj_Tu@!RLonbh&SQIb59&Wh*
zb)$joQ{Olju|8o5&CcBVZ4usBm2_{h4HXUXMKPYjk@`2*B6jmO;EhF8$JLMFJfd8U
zY3P;umoQoDhBYP$-y1nLJQNc!Nrg8O2Nj1qKs`~m(cc?6J#s}q89AGYH+KY-p1vP<
zTF2YD(~ow`crP_VIaeRm;(!(SXyg<XBcnRpjW6ksqgpbpV)`?=%Iw?7!TS=|R>ZKF
z7(?Y3*ULaWa}EvtK_h4TijmX((a3ojyX30x!8>+NI@vxJ$JmA9a)2v;X5{z~v&Bf>
z`>I2l6`*_BJw>3|?dA>g_}3k=o*#{zNrm8(U^zw>SE;JhhQ5o;fwGda%R3KBxlBk7
zR`!+^2G>eSVs{VLE|gt4^j^xHd1|m8TV52YHM@yx3>KH8wD+8^G$kZHT4F~dW|Oil
zxs0UJLi9e49|KW>X$d&eBNlu#Xx)3ic8Lq}G4P-v-v@KCJuQS&oJSEVIo}&O&Ht*A
zb7O8qAVL5|dj^hbuOF^6987Qz)aScFVwKI;jf*9f);@~c8m*o)3RA3T;5bAM7Zn`i
zclU;4Gm3cR3dY#?R5YO@&mGZ|_GDomFNce|kt6JYFs{;yW-Poo)=PQ}TdmqGl_Gyk
zG!(w@CJu9crct&EUFRd1jof05RsLw?%r<79ub?*`Dvp$&bIQ<;44~X6!(B)QyakHn
zWGHxKj3cR$1EhGW%<!hF7(ztC-}e+R&p=$Lk}m1!i@NDq8~8oGE(3aITC_uhSO?*R
z$($}WF`gAapNWunZ<fj@LoA9&qQ^GFlz(mH^!^1Sr=P-ALG9sGI?1v{+9s_#C767!
zNW)reipc?fuUye2^DLum#C#(yNcqBV8960{yi18f=2se89o-J*m)%M0Q9~=D6sh{Q
zLqJ@pUClU8-GBl*-=ZM1`c&_48#x@j5(uB2op&6zZg6<WXOK^jBu2d_He(KNRO?MD
z49xY`6cxC_rk{=8rYEeIMC5(ZcO`p);^?}&tiH;z{QAqZ<@zbIm99A1bHvkB9)4m@
zt;=JSt3ry=s5z=)>%MYyd{O)S(DPOW{7H+8OK+d&aFtFJ(0eZkxKS*Oo;&b7SV|HU
z!BjI<TRS4+!3SlZKRGnZkWd|j@wxS^$=VV%YFnbaNyLZGB~^3QYt>Gz!F~9MYk7s-
zM(-}(y&qp`b@v(T@omF*Chy27w_Q7G8!^dM_vY3*f1`CH?*gy93#>_Ldx`uv8#!^Z
z-WE{DOxWAFceTSXigBebW?~1yCXjHGmf2<ecN#h5OkI3R7GDODKX0rqJ(IsYOQ5$C
zne8EXeXKdFf!s|Lo*rw*dGIe}3ESQk5xiH%=<tzfda_Iu;pxR?kBO}ItSF-p-P`-^
zJDnt&z^u`to5vTaME-#6)rI^DHTTPgEDoFj<sKA~%*&RH%)*g3C5PU!Lc977J956S
zw-khkiqVH=8;Qw%k{`w!JF@uLM9K7Fp{3Rm)h^lDMm|mRH!h(2D@M+8qtr|S$`7pk
zH6zFKdm~4A#mFHwZH;D%YFV0yo*L5{@G`##hHW-W3Sy{l;5wlkrxe&Q|45W#8nx!s
z80Bq;DYrExC0wcAzI>%J`!<-A-Y93S%RA#ll&9;GDTc>%vpe1OGsH~anv+o;_tMv!
z20(cQbIQc%Qv0zM*C!u^TO_oKF|7ZJk)x7M^OrGGrL^J;5^P<3j9Te~-N(y{e7cf-
zI%^vF^&3(h8o9}Ik`S2NI-5|SOY`{A$eB=Z$@1}tRZ?9sa>5mIP7z_b_HW}@ZnuT!
z=veT>Vyu}rWo@R*CPl-gAt=0$kv^!ka;hYAb5~RzBb~yI0E<x_#huY9tQ71hSYpme
zW^}btecpC@3VOLmz?_qO5zH$M;u(O7CiC0*_Lv|V5AW88xpIo$wJ`Gcad(_<cUf&T
zn(HRQkT6ecoCS-;Q+R8_3HZFkWgpt*Ey99%kVkzI8Bpc)URl&oaS^>#Ctdw97YX|R
z*t-vZs{j9g{AX|+oWsGf*Rkr@n<FZYT@pfML=qJxEtTpVn~;@M(jh96D9Wm=kWyw@
z=~$&rd;31maGYaQuh(aMf8+g6JTCXk{c*crZ%!KH0!66slp#L+uBUq;;|Eh75<I9z
z4lsS$fn(rU;vqJ*AU9c+`lt=2(QhEvHS4ruunB47F%R)hYUZi2wPFa)&2QF*%3|d{
zjM-XIjT|eAk)tUOmP0}B!)p~A{0=RdYM1ec?CD#)-WjQh;lWEldUf(se)uO13x{xt
zq$uUvhx$kFSB%TL5SucdQ84~UzV@Ap0>8V70{T4kHepvVo3ah>$qoO?$npBeMvmT}
zjhs$Rvx~bNUY0tnE8FmLmxYx^SB<y|Ur~cU-bUaGU;UM^y1OOl#9TJbh=MpX6U2`x
zV_+Jy3oU4kjq%ua)|z~7+q<=;-r-vJByPPqr&DvWx?^kLvJ;qrmro}MH#;KAEDEo!
zC@ejR+|0SipM9-@W1Zs7Izf^o{+^<x`zvL*-_IXmS&*~h@&zG{gd|1IMY~L-$TcT^
z*78meV$Fz)FkqgbQ(9)kSYje+PlNau5bv(qrpK8UE2fPc+_aJ7F`tp+HNTOgW3`Zx
z)1aONk)3=b)3t@`6|Y=%g9v$bFV=r}!;F#BrWPb9_sV~yquJ%nJ#jX6y=fyyb5z0n
zHAEJyR`g00U%cqaQ$;m`GZ!0FFzAGhKP1!EFHo&>C1`u*L$&6Lz#UKDJbzd8HcFhI
zZFBF7&J=9y+eP@HwrwByO?xX9S~^C2!q_zL)ohjluQqE}KHXf*C$6`Ek)!)Bj2!RZ
z8#y&<X-~CO^ZodXt~B%G%Ln4wil86ky0KW^_fu?Xo8BDJX;aJ;#abm@1eHAKvEP<m
zgnYY2$sUS8nevfOv*&GV7CZl%>o#H}Y_*N!+m48)FqNR)5S|`qv2a_F^Tk(>O%^Rv
zFW(&|EeY|rKKf1M?#}_0!4kaL7k;S+gsHfa)8_&lAzOIg7HLVaIhoYqYihpw+s1V9
zWp=B}eyxrD;hY_8mLp@PQPLntCg2Ipf?mG%Kiae~P*D<bu#0WPUvRS|54H=$-^TY#
zB}whGxUirZ=P8YAR!Sc|nT(tbR3qm{80N_;)sQhuGU)gaSFvnL#km^MAH^j&w4f1U
z?3}TFmDO6`o&0hQx(zjI?sJSBolq4`^a;(T8r^?r<Y*$S6(ou^w6#_v3bZHC0cGk9
z>;ias2v2|~@6<#7$>V0;YWpI!^q7nsjSqPH^2CzU+sr!K5Y=HY2QcqFXLLj@Z$^;`
z{AvT+n&o2;A^8zYEE??9uezz_Y4d8ysw<crlU(woxqeTB%smhfhNsw5E7t6RK$R8W
z#-L-~F;UICW6kp2Ocmp;*b>Z=Q7ZMkXRkgW<88Ddyj{Gqt2$S~BQOmFEfwgGbD$WN
zse1J82+SkU%Nt>lNOPC>1dF!?DQv0g{I6k;B@LTEKa2DRiJyM>@0LEUCy4WVCF+PK
zgSK&N^L}Zt?NWcbVm!RYc%{0T0)kU8;M$`1wr1P)#J%Z8j?ODCb3(CF{R*@lF)wSI
z#*LkP<Gh<WwRj~=xd<i-cHEq9yEzBrBDz$IB$N#w)Yv=BYvkP1GLqlO&n`&Fvvld;
z*Z*Q^wdih(lxAU>lU!Qd>0OqH&Zn#1?GQE#&<z&!W;JqtK=x}lSh%lLmAU)e)(Nf9
zzbe*st*Z!+QT*oDWd{xmMo&y})wZFoZ1X~Tm>_fY(j4oIvVbYD%o?^&z#-gP2^zN3
zZ2R5_%Yx?gi*Qvnn=y|;Q{)~5`qS56H4-A+(IHlG<GYWqsnC6FW4Uo3+X{w}6QMm?
zk;(DxE(m8Sa)u<me>mo&V-atTe&yNal~an9mMYr0Yb*2Ce=FdtPZwL6Vh+B~xyfVD
z*E0^8=Tn(~W=VmYK>gFL9#MlULC*qg3+m#6HO^OFda|VGF!KEywX5BPlvj0T-T5c4
z<e%EI<<heyR~A=Y@jDX8edQ9S!yIdU2lD7ykjf=>!)tz3*P7x2NAT!e2ic6~Pqyk7
zZmaUQ8&;mLsuYe4d^?3#?W#d^8UI9Ik?Pc2yLF3MDY^2k;jPc#Wp+ncey^(GHL4Y^
zu9Y^bTU=eIZd9*dUBBF@!LqtxwbAXh)wkChHTqRIZZ~S$TitZns5!d2`KZyI<JEW0
z7`2@L|EiIr1>6y_Y3o4WOdS$v#H)NcIsv^k`I$6vHA4MM-K75VNmo-{mvBpW(+`Iu
zbd3+c^D)(uhvMa-+K#4La8sS223@$R3fxp{qD~vP{Cj<tu37yTALtJ`wjYlU>*(0%
zWZar)s(W*tV&v$t8aX`^>q`A03J&qk$bMksRA8<xr0QDea!)E<XCJ@siet*I*LHp7
z-(+(_d-KE6eFA>Arw#Xg`tVi2-!9uUmM6{slD|XV$`g9KzoEA{=C8?jF553Swe?|y
zSn`&S-vk3(N__65>mCpaTvxWW_uB67LfhOcc0PYtc0hQ$=ZynjKYjcz9OP9S&MB-H
zDzan4?IWW4dwz%nZ@iPLxb|A8=*~^8rwsOf`XRc@zx}NBalM0LySH>-biKakr`Vo=
z-m9B|Uq<o0+a6c#`~2yrcu3GteXOwlA&Gs#V|P#J@BJmQf7kQQ{I%B)Ngmkqy1!!Y
z=U<YcA(JC_j_d!&$hjf-$bI+YV~;!!{uJ!-ij)N6r3p)gdN&^PNblWr`k+vsf8Ocz
zzAcw-2=xb)Jx=f6cH^heK+tW;;{(C1ONAfr>h?JPc+ca5!h<1Wr;iWre|<yvN$AJN
z$DbVf`BRuYMPQf8AcrBBi3~*udS(noNgfgzj#0?U7>-lDDKZkTJD4$&xb&CEXp*_q
ziP4l*%S6Z0oIFpArF$F_eVXB$b>ivCz?-7aGItN2c$W1aBZmwT?J?$9h6>|LBeN;G
zm~eZd!bQ8tFoPZw-b1Je8T1g`+66C=g^E;k9O82A!3*C+MQNrDAvU|1iVvcq|JRKi
zCuSo@(bamTCx7aRuF*vXz1FJ_@uy{@$FSC}E7oN3AIo<fQ*!NHvGyi^dP&-t%4XM<
zZiD>CE4s$i_Vun@|BFAP7X4Hs*44&GRtrOycE<iA?fgGa+Bs6N=g!6So{I_ZFCMsA
zlrvluS9AI7Xh}l-m2)4iM2?lFHkRdoymqAd`o*#98PBgDdtRRYvHa-W%A%*0nV+gs
z&sL{CxKZ-*#_4A_&yL^B{&X|r{H=`kTUTDx=5^JTeXh$YY9PI6xcIptr?;`9v?=dp
zQ}N5@%O9IBUb}PQaZB~9maCI@uT<W<G>hN4`QXY}d;Qz?8(-V6)pcBF2t1A56ojYw
z(al*7&%Hhh#nbk<37~k|2k+1*p6;PmipDe6&CqxTpY<|pJY%mYAkX-lQ9$E)Iq{64
z@l1Yv`~K4;0P_6LX*__mbLT(O4zskAUB)c!<SroXZ1}$~?QDvlPukILO&dL;E+RUz
z5+}QP1dw)Cb;c>QrA4$(OFM0JX{V7Q?F@mY{O?)yfN=K#X-DIT6=_D=(WOW`o3C2P
zoz*+Ci2pp74w6^z8dcgEWk@?+Tm+9onK52D(IYDOV5Q+#RnC2}_JxWlw<LwFqu_kw
z!K8PMSFV2xYgRct3PvuDap`Opi?b8sk$tl)z*?Ik?HD|Cv}sX^p-4NKj`t|iPJi>I
zQDZqk+R3F!J1|+Aw3E^aNIM}TNZE9e)Fz2KinKFCk#_1ZbZJMGBJHSBq#c7s%#}iY
z$mVePVp3s=a<%{a^YF!;8eK7%D!Q~oqDecWfV4x>q)9tTfV4B>LX~y`66TY33}&RA
z>xeG8v@?j{#9&7;fV49TNIQz7RB0y!kak8X(oV}PX$M1*c9J3Es#C3~L=AI!a4SXH
z!N`Us0n$#(w6vo`m3FSvq@AL>ZyV{-j(0di+KC(y0$piPS*KG;)WI6#tRBBe+|6Az
zNsypPJK?ThkR0p{r{9Du)>TR?7L9zzt^>Ia^EIB4b}$P|JMz)`#xv4R9h0<UnJA>G
z%)9a(AnjNtE>8%Eb7Dim%^zt58}adhbRP0QNxB;Lg(B^M^{CPgM&kF<P9%%8li%!w
ze2PKIa*YRYZyq)dI~FF^a|KpOV3v0DDAG=f9KRwqa}fBX+~g6ox8j?-&h9%a4IbL=
zxtuemy5qV2sotWnGQ;}bcreCcTH48{Njq{JCtR$o*IH!TW!Mm_ZuU-Dfm|8VPVgLQ
z$3V&=E@%O1M@B--H(hf)Jb@wYgm9nNHRS_s0i>NcR%xeHa9Y}l0;HWVK-wW8eI&6G
zRB2~Rg4UZviD_vki7xGQGNhgJGty4N5LMb4p-4NUG-*eH!>R&)D|u0>#LZdK&M4BB
zChg#6Njp(Y(oQ^0+Sz2H*0T9ykYA9(pjbn=W(140(`MWtoko#%gv8@0(vDUli?l-$
zoF(n3{6X4LrAj-g5}7@|A%<lp1_}ZJqZDbUBWC$+61PMpdHwS{`es(K9A*Q7TLoXX
zh!pSG-FmPn{<3y7cET8LjjPYcM=uY?)<v!mgTB?sL9XCy@RN>h5b4RdctkSyqGe-{
zNijp((Vs2tC`zzMJ2fy_K-$@a9a%`)*-DdkN+Du2X(x4B+9{rqcFxhHom^BDi?l;X
zph!Ep^GZAEzm;~pe1s^{j^Dh}P9q@gL@X%n5Eqhm!~tn1iAmatWRi9^3e7L=w9up-
zXS%er4Ul#sDbfxayJ>R7DxN0o#DkG%@<^h9w4=YtgeL8Xav(yyIG1g4ld}riXM)X7
zI>E~(mH<dQVsoXPAu}X8n=b8`QKg+yhP2~Mmv)Q+X~%3v+9{QlNN19E<fApFrJXCR
z(vD?f|7HGn?psi;9I~CUaVD4d?gqjR6lq6Gf<@XPz_1i)N7R%d?HE&}9W6bow6k<Z
z+8G6;oec<zv~w0QOWJAtJ837~OTP_}c8uxLPRs(*P8^f8GqQlR(@K?gMrqOxp67a-
zcG!nygA8fs5q#x2cq3KXsbokyXXi>gIy|H~($47LOFO1qB$R4Ny{}Q5;_hJ7@*2)o
znzYjfZ=*^(aWrYiiU((><JshWpeK41kamWs(#~0AB+mLeY5(>KSOV#<q@7A*p6@;I
zk_`qohU2=0Rr=<YcKCT_NjoH(v@^;g?ZnKMb~JfrOFO7(X-A8PF6|6crJY`?v}4Uf
z?0{E5k{;(6DyKpUN9Fq%(hi;n>3XObu2;5UAI{6bqKC^G!^V3(IYN~GqXqjVGF93M
z;vSlocG5ML+}nh5&lNiE=Xy0~>Bc%}sQ?c{+PO4W+QHMMorlxXPCB!+L!3|AdH&C(
zotuEP14jOpv@`rCY3Cb7+NlDhoe7GxQ$>|_9<*gY0HmE9_yd}><IN)NRMMoKcdXJ*
z0le#9NIT&((#}mUL_!-y+G$}(JA))R@x}RI@ADyI!7;|{B5)+Lv@=ALb{=v0T|ak+
z?|iY?MJF+iXPu%keti3v*c&Br<f5RT7XcSUT=*J8o6XjlZCpW|T%x(iOA}DZ=t4ZH
z@VW-i;}cBM4hE4=m3AI3B<&F4xNnG}pvy&=yhbksAnjDml6LrKq@7EEv}4Y*7IfNr
zqENuC<SGh!y@S0+Nf>tE@Q=^FmnQbWh{0h5vk%?+abZ`+&YctRU8^0kN8|$W-P9Hd
zdofq*;;RlX*fskuujzxkR>BMop?Jf*9TQ&1CnF)*2teAoNt1T!I0O8CC+##&OFP$D
zrJc^-NINT#bZMuDD(#Sv>Bff|tyJ0oX$OLwE$#IGLE33$NIR8?Wrmy%afl6My0lY3
zlXeO?69|Z+V#6W~;sNQ8(hiAxaE`P?GQQNLwSRZ^O##6aHv1~LOpFC?qZ4i;Pking
z0ql-mrHXENUB5+xTXlrEt78FY#^Ss>CTXXND(z%4q#Y2~Jkn0rjI=YT!Sj1*=fSkJ
z^MEStkS18A9Sp0qV?md8MgVCC#dGz~(oQ>zwDVwIX(tRpk#@Max<E)k+G(AZc3P*U
zofd|)a~9EPhfAkPJDNNTNjrUWq@7$1XbJ)GQI;<4)RDQr#v!yxOwtaR3y^kV=96~r
zE+Fj`u}C{Z^GG{48PZN1!uBVk5s-FX)1{qGhP0!EV3u|s%#n6T3rRZ=E<oC8r%5|v
zNJ%jyAnn8fxJVte{eN59fgo%4bI+D`vXP_-Xd5YL^!L&Zj@zS+y$X^)wN&8s4gR-F
z`9k*Y$@DT<Exa4F&1Z5qJC`DANOkaMt)<5VY#<Z0(Qi*cS}Xq35dPs>uf==T9^WmH
zNA~8>JAblZefA~(b~wK6fW5KD?E>ASqJ{NbmpbB{(#dpbCl`=*iVzfOhlrdl?L7Ri
zOFJu>q#gXUwDV|=wDS<Y!I(YozK-;V-BED__chDdtaxBCz~jG1@BPyt9_a*f@b^cD
zxrlJx?+Ilc*cgpKUC_#dzQh;4(GHHp8&_c^DID4_1&S{5*&J|Qy%Lp>wEofK=N@jU
zZpzQkE1NIHW@M<L)+wXh?~ZSH`Q}9#Y$vMbazB567XOyJ*Pt@+Awb%ZLHt?T(cu0I
zX$Lr4W=K1U$kSRp6lv!bi?nldj<hps%wESN?Tj)>J8gd_?Ig^Sb`V@Ge<AJU{x3*7
zBXgylXS1c9gm+1Eq#Zm(+A+5Sq@7~3Z7_r1OFQ3QTv>Dskap@@PjbEnq@5N(2K9U1
z#A|Mn*C(;$SoY<4q@BTaLuPDTuiYZH+}_VB?QH(<ly)$Sv9~9IygOCe*%@$?BJE_l
z|5It_03hw4djV-D3y^j^DAJB!iq{)ainN0>&p0w7`ghXKgy{ceX-5T+c5DG@N5O2C
zv{U$JX~#-5oaBnKb`&)u{YKj94-y0Cld#nbOFP{uVvQov5{2-S=eUFCmv)>^Xx7R2
zOHia8XFGW?JDMu(c(6!2(Lv{0O_LJ|=bV<Q2YYsNOVv%@K2DK#xY6tDDALZ}InvJS
zAVAt#8-SuoJ3QhGOFN+^|5Do7DiH|RzLODI$13eCB1-HVKYQHsgFMPQ?5Uc`B!o})
z+~;2hCXQbGwO_03*|N~leZ~=AZpzz$zoZmWq@7Tjv~yRunJVop`x|MeFOpT-u}akL
zB4O~&XW;b?lJ5eO)>h4ucFKM)?Wj_u9eB6|v$Qj5!Dm&H?2H{&Y{kTA0@99i=>`cV
zY3KTkwDW)>?c~y>9T6=ZnzR$=GOBI-J87pYBu0}i?Tq@<q#aBSL)!TUNINnd{D}hL
zB3RP}rJY`iw4>x>^RK0yN{l6LM%po$EA5bKvW-kz&UyS^+QBC%sSJryq@Ct$<l*}r
zBp!1!Bt|e?`CbZ!C(@s5Ej%A>6)m9)x@~drWa?Rr!+Cdy2wCmi=8|(|o46t7QSuj@
z%k^Gl2Ck}g8{x`D7`(iw&e<f_X2-q`C(or#pi4U-F{-rVl`!R;OBSL_J3B(^#aX2t
z?cYc{L!!jMW))^>Cpv*4?QBR8k!bpZv||TIJEGCLLODl*YyfG82uM3Qh-qo(470R@
zvNvLpcCtYbWxBL;Y@AOSkaoN$wgA#jCso>UqDeb@vcnnDjxi$L1&Z#YOFMlKD2PCa
ztjYx=;8Pg*(sgVwEQnw?k&jURWY5Fqg_vL3@ne>D<Rzx19X-0V^PMW~9HU7)UenS}
z9)cn5T$qt|Y<S#X4RxNX&_2IZF&rEUu{zQWk&OQl&noQ*)1@679jdgW%CiG*Ns)Gz
zu^l}LNIMx!(#{ezAnj-q0BL7qo#i<|+6iElc9uhhULCSnq~gxGS$aWfCn|<X+DX==
zOFJ$8G-+p?McR2VSK2XRm3Bg+RG6e4{2XcLgo|;@&YH7|8xMlmT`J)qJ1|GU57GIh
zod>g|ol=Ih6FrZ#Gt7{74pF5YKh%u0bAm4I+@wl7*IedGJ0%opr$*x>leBY*D(xKe
zqDwnuK-wW{?gFG8tf|nSq#eKFX=!KwjI`tTduivuw6t^JPts1vY-z_&1U4h>5F-3$
zNjsr4(vH{s(oR*xJkn0@LedVO4^`Un3!+IoU|*WF<3F#oW9a(NrJb$6k#<a?{zBT(
z^qG-%KrRevC!8VeXh;1{+6iTqc1q~d&h|Odjx!vO0}&*XA{Y6CRs}2-*NEH~N|AQf
z)M$AC(oPb)3n1-;z}5iL&IL9%K-xJlSK1+%YrtsI&Kica;}yw}cGmbCt`Ug>q#YZI
zv{O01v=d5~cKn#69X}RnC(cFV&(h9ay0o*CF73E6OFNFRg`^!1nzZ9am3G`_OFQ0k
zq#Zy1`J^2g4j;Ryuo{>-RoZc%EA7}v*#XjyH$~cU1Ed`yMcVP6mUcYI?S5^5w6n_f
z3!m>7K-x*Mqe(m7G--#=b+)u4%i-%Esf?K`?FjkOrJZ~`997!spC#>Ztz<|$7#Ks^
zv0;&Ra2uJW9hvCN>R3w@`|4u|yGSQ4F^%<)<-L#(CF2}b>|ubk<KGP3TKqpD?U?z}
zq@9g4X$R~|lXm>5(vBaqw4=ms@n4sAbY`R-=f9SA{C+3xRGM1#u5OE@N;~c@*a)pJ
zGt$l`W@$$QHY4qba4a$HZ?toBVUMCpJ76C`+A*X^J8pj^?L_=Z+VPF7_We6)hYiLe
z?QpYCOFMj4zms+b>=uxAJej2(cG&NvodeU-jt0z)Chcrwl6L&&k#-1nGt!QmPqUlb
z@1&hRJDRj};P=wb-QP+(@RfkH!yf5s$EFk$5#$oS3Fon0BwAMlx-#&opA@u?9MO5B
z^@s+W6N%Goh}$6pI`D1CvTRrf)oP9z9;mu4DFWgfzl#uwnkDUQqDnhne~@<UqUK0D
zd_GiZ$64dK-z;fIBWlxJX=l%jwBxscwBrT3;rBPv4i|?K85}1QU19r@7y^~Bf|ROp
zs*x{cpadP-x!2E<c0^$R4bqNZ+nCK?N;}7>(vCHYwBtNW+OeA@?SSp3r5%5fM2fVt
zIkIL^H1rvfO&Id?TEr=pSU-lelff+QfLs@nc9Q-q?fCsh+FAOKrJZ$v!Nn@=#M7l6
z=O~)A<G_%1R?(%MV5+neEb`H<St)q7w8I?$NIUo$X~&~ybe6Q^-8LibY+{ynKvDBZ
zJBUaYX~*q%(#|HDw4)tGm39s?NjuswinNm++2BT%cDAxgJ0VdnGtv%pB_Qn(=1M!e
zeHhXXaYov42Be+gh#)3u#~B3>g2W0H&^f&w=%ZsVJg(w+hOQxv+z<U*X{UGrX=evT
z+VNXJ+Ud2UNjpA&CGB`KNju)4sQIKFBw(Ozm`~bC`o1Gl0`Jd|c18ecXNXza@pFlx
zNIPc%X{RyyJww{Dwsl1)wKW6MPS85xU>0fT%RJJKFiqOg3;?maf|fXP8E>FVI~uQC
zXQZ7?6lrI2UTH_0ChgSFq@8_qX(ws}Y9B?~;boF`lIYS7PF~hHk1FlFzvn`gcDz2$
zC+)y|rllP}nzSRtEbR!cm{;1VrAa#*5rDMQ1~&kt9X46}B$~8iC+CMrvosqiw6Z-i
z$Smz7YxzV_r5&^_x-m)n{#<Ft*9Ln6kamt~o&lsCHEX-Pc*SEBX{XYr+Xnm4+II!k
z=L#V0)I?CEoxXQ~v=aqLJJ~&ev{Sq>?=B$i+@?!AjVd`D@~y@ScPY}2phm)$Z*!#`
zdqCRh*)^IFQOPXrnBshrpevAyjg?&@adtziq#lj}L7-XEPP0El+Uc8D+8LEQ&MfWt
z;;7QjD6_OvqM6E&c52u*P^6uZn7Pu9qEG8=X{TylX{UuM?Z|0Sq#c}T$Hw@1r5zGQ
z+Nq{WJ82s>Dw9~H9TKawLt;ofF|XJZ^Z;o`UXvm1=uoAd7P_<(Hb>gQP^6tNfV4A+
z{xzzQrlIbQD+Qz-eQm{erbtbX5+j34IFtJlMqNQk>iCJa70Q6L6QNF#cES~K1Nb$#
zk%9a6xMob;)CmBa2c(^o6lo`3A`^v2Mv##XG-*ehBJH?@{aM<Hp-DSi0BL6kkah|I
zX~&E%?X&^XPWHUgjv0EEw9`nFc7`a@PFGwIAnl~PgzKN2EA7-SAnh0c(vByyw9_uq
zDiXsY?fB89ok^Im6xb|P#a<YYb`+VV9qYuU!*Luwgk-Je8EI$FTxq8UkapORjZP^N
z6ltf~8^I#&fY5-nqdhI{*fFG?(Z7^-f&pn~fFkYW#?z%8H6ZCtm3GQ3aDcR9TX^Bj
zRH&22Zkn{ySkA7;rq4r{c62DxP6|cZk=LV2J79FxLekDfW%Rt#jv!6ixj>P2ienXb
z56_l%;^&ukNbz)O$Do=n?I>{Y>g?~8atJPMT&fnFdU0S(>w3lggKE3ZDnEYiaJ};3
z4YfU2FFt-9e7$P$ry8)8_1K~HAV+!#yzfi{yA;oLt4@lv(~lsEL1TJo($1z`4Pu?x
zSdBVx!hg54Q^<E|JWR6^wLAbrk#-z#6lq7KKIal3?WD0tJKoqxk^hRcQ%sX~GH$B^
z(vB@f+Q~A<F{B++l^;ejD_t(#7$mbDGQYGX=5=YJ=ML@61LgOxK0ndAXH$TTU*NTM
z$`>A7OibdnNP{Tl5(MhEnIql>tx)<BCQwI{b^>Rl9fx_OoqEk9H)J4k*WSdP+Gk|C
z`)dDVc--gm6T?uYY8hDN{L)SgAng>>r5zzXy0kO+duhj3WR|p}LXmdH=96}8S)`qt
z%+d~VTG~lxm3D%rr5(85!qN@~&)3K-?Xa0E&z5%B#TnAhSJD4rX~*`<%Bf#dho6<7
zIc4(DVz=abyOfI9)4HNwZ!qLFSPbYJLi0D$PRPHKc0{Hisu&poy`h%&^{5<Cv{<&l
z3L8ZYyx^v6p#m}JHgD@)*}`Ij+P{@{v{|Gb2|1dy<H{=Sw1?599oN~?j_x0&9UD_Q
zY*>#7RCXR|=cuMg{fxAOtycx4ogH}GENRCBzu0{x(%_hO3SHX40n(1kENO=w$}H{Z
z&nNBZ1JaIHxZqcaVriHbP1?~7Gtps@cC?wL9W1M~6Y)3F4m-A7KEh0HO%NP`<+k!y
zFqkFnj5A3)15|0pwN6kc3@bA&?Ibg#9XUO!w4?7&k#=-{C+&F6k#<S}X$LP)NT*9X
za8sp;<La}dokp6pW5z1&tezw7m?;C&j)<vz?!3~D87?zL6OeZ9(WM<lHYaUB+A(I8
zb`q%4jtN8BiO>i-CF@lmm0}t#2EDEe(W6N_-)2cW{uF5^gevWXP^29lc@sHfK-w`;
zrb;_}vO#odM+cC0Fn=lS5T~V`1{FZsNtu>*wCebc6;}OdkEpKQe#~s-!|{z4cQ&cr
z1|MXL28zss7dM2QU($E3E(njr)_qQbDmH+UxEAkdG}~_bAm}Oa)O|3=s$QD`$cVfN
z8h&4FG&Mak57pBu?%u#_hDZMZ8vxP{5nqeFP}osW@X-EZ`f6bvJCka#;=t)k!v#hA
z&916;>aa>X+RW09N&S@+y0oM7J8365T$d{C=>I|5Ij-PRr#Ltx?Wh9M4mO-g+KFYA
zcEF3N(vI$2X=gtm?Tn}pR@?bcOFIcvY3Ck9G2SFujW==~))KopI%$4sM?YjCX$R1y
z0BJ{9mLlz}o{@G^W~7}Y%^)XcX~$q%+R*`|9Z@Kgw3Dv^NIN=IX(#9}q#Y%yw1c0K
zc63;!9fR4@j-7InI%2c|H%Ho0v?7We<P!=4i#pcwC)G-JM8v=wc+;N3Oi<TvfO+JJ
zvB`6#owZ8$E_Ls_JQ(-l&O3tUpQIf-<xEk<S<+4<6k*IN?Qn<BNIS$i(hf09T82s5
zX`M&f(FLR(^S_jKP<nPO(vIT1(oUl3<{kL!Vd=TD?>?tcr5$WI=1GG3Ur0N+27+ch
zAnjlvILlVCQ0)=2&5OqK`k^X1RA~n{zqDg3*Tsi7(m{&uiV-=YxwurcU$gvYuJNS2
z4kDHz?dUP29qepr$AC%N(Z-n0NIL`nRN7&a{Tpe=iz@BFO>Oj9q#a!^s<h+9kaiyb
zSEQW?7HKD$D($$0=`SSh*Z|TFaUN+WYF=pvp*Nqjqcg9xlgujZV4?p|+HnD-9W!N`
zv=bF>z3v}MJNsv(9lgJlc1-@Qv?Egg52PJ#Q*>_1JkpN%RJi(oq@AbRmp$8i^V#8L
z<Iy+Ak1l(D{O0pB%U+zn`Qq}jm)CE;ytV9A)6G{8mc4#-^YxRPzhdjH<HO$^V8iW#
zPV9x^%wn~1P&|71o5fQdyG<wc59{_+I3VgUq4oM!x8ALvYSBEb>u#!xzNKRn`{8gn
z&MR!O*R8K>B;N0ZTB2`#lQYxbX!?C;gpPc;cEc^4BlKs}a)SV%<GWrL)Ic(M(){t8
z`8M~<8~TH91Y7V7UtgPXNWoA6xxpeq++fd#FMJ!VlI5)bB<-|ijbsY$wn)m<IeWj-
zTxZ?ZZlxW=IVoo=Uraf5IdvD>qOrvpcJoL(OK&?tAGL}$Zn^(zlQLJyxbBXo9NSC#
zbw$fPFV-z`(=Ax1S-g`~+9`F(;l1-yb(Pp#-QWWiDdBONyO^aN?~|Vr`cAyKQE+E$
z9s8-hGt$oZaG_A35<}X#VOXB`sFoq^Tt%M=RPXro{`sTphoui6`uY9q=g(8pH6V70
zq#6j)2vy4_=$=#ylMF@G!4)!->bO*^QS}Jjfuwq#r9V&&D07MA2L4q>e7Dg~?#Z`>
zJVN;zMSL@p8>hqqtNEHFb`K;sNge#b*NlmjNNJW$Fyg->f6P7Q&Z5(y{4LnL%#;?T
zOV#{$RmuiZ?yBAR!GBNVwnXYZtyUv}R-JD5)K<O6p#t}DW0|S<m%OePcwqE#Aoanr
zpFafJjM*jA+VIGw=yo$fkF<6R$%E()D}~c(9V=9CpgV1JAE$NNF8zt_vNM-F*5$Bj
zsbIIGlgF`cXODw|4_$muAA7hi@ITVdL>+Ru#AJiu`pn5j$-@%wnibAuzH3pvCGq~A
z?vu>-_m@sdd}uS5KK-F%)pE&?T~6yye|+e1Sn^Yk@0rt|`T}oBejeEU<n-skgHw`U
z$dS@nUxpKwOMM+Zwm$3Y)YH?4rM`{loyq$4;?gat@2|?9WPN{gV@m4B#BJ#_Ki;)2
zm;U*od;OW8pB^8U{`F<-%$Z-`Uf+_Q`tk9}nW<ktr=$sBfS%)YF@{Q^h@6i9uakDj
z|NYXAl)#BQj!(5t^xF6>6FAwP_Eaa|b=6i+fm6L*PxUH#S8YEekU4~YhP&fxyE9AR
z^mE5&OL}{4_udr9noN6U^xSpzfkA;YU%Q?y``Wwu@Gk)pSa95!bDdqd6gr#JX&f)w
zXBWK;ox^u*+)Qzu{Si;}S<&us3xhuUqleJBGJ?;otk*fDW})*Gou02)FNC6_Kkxqk
zjs7@>>2`+Oy!q$u&(;*X-qei~scUl5;%d@E`i^g&JihLHM&gANNBd6%OrG#4KN&rl
z=`(OT_)=DC=ow$~nVknon=X@%Jtplb$v#fb-d&NC_AX~@cy2&fZunqsXj$ILcX>fk
z=YmGg9V|be`Q$v2e4g<B!k)_ftfBmfg&3e?SHhVkpv-G=zr}!3=3+n>s2<S8+EWY?
zh~@!ZzD+7=JPW8m010%p`5avZYRPA)Kr|AlvbCuCe(~`Anm6|=zT7Xl)n3YgfoeOh
zF<_wER2XQM3e?))Kv97PW>lbV^8K&m`+y4cXt=F!w2J`)J$cqUIL=}N0Wi?h*F(?W
zjxlVY*Y93@d-r<s!<&C?0|DsI$bZluX7s0Ghz0#Qj|Rc8WC9x(*8DJh(FKgTFM6CD
z4oab+KPVy8CLAe3XwP`|ArXj+DW810)ds;uLPS$Oqku0%M>Ng}=R}DGi;N`T_Un)E
zE<QKz!{@}-yCK3rX!Gc9L$2)66#NgeJg-sL1S!GNdGlDX_KKm6{L8zFefeFy?4wX?
zJU2f*al6$@F2XVA`O{P7`${%NX_j(6I~`IflrRVVxmJtP>q*Ov*Ag*58*eCk`mD`a
z7%}|F;(;`?`_t$T;fV42+@vVub_)9Q1~etoYBdUiKLF65i6d486!a$$?$S^wYo7uU
z;ym36Q=p?iY&^Vr!&LOAG!e})T%dgUrceYo!LyWs{@|I>pT&V+0QBc&DSy+I>q;Zd
z>XBb+k&21&rq<#~b}tg;-Yk2?sTWhq7icu%IMAY=NI`#c0saR-e^%bPG#M0bCAy=H
zivA2l$pPq3lJrnx_)4Tv;nhUBEVGd&$yN&b^M-={wBqRKkA|{v$8(K}6`H|D?YJwi
zmOxIAz!eKhspt;}ry^Oyj8nFWivC#3kQPG(Wk|x4m?>E=9V+_c)BvDA6Y*5^$0(7G
z{-h^=9*olFA&u_gh}mm2jsAp7*CQg3#P+Bx$lyx^CrN1%2cSQbm}I>2Bo+NB+!;MS
zNkM<Q;p3Kl_ikC9d!8bP4&gGwQP7_<$hgK-E7?}tT)viy{*dHi8UXaCn}+_h!St!<
zPdyF&*>>-3J01N=J}YSLlJ#j*%~InE9}&>I26bliM;B2wiIJkCKkFIjPnl90N<7j5
zrVn`(wIyg8{eh_C=;%)Y2D2EI8z_WERf>fz4MSYs4~lPE;>gF*a$@@~;?A`{2AI$v
z;iE#DcX?MjSQHfsADuyeibIUrsp!uLfc{`dDCmy?75%A^q@X`sGANtgZ3u{~_uE8W
zU9(+@dtWPga@k$b234@2KcxWr^JWhE(@17Qe|ill=ue}Zz@O2dmG!+jV3PAR`m;IS
zeeyCP^au_8S;2(<But|}wILMrXJt5H3#uio*#Xn1j5m^c$h8+O%g!O|#}#UjR5Q6P
zBU<I0?$jDwrb4Zxn6I<WxM?B-{lOv5dqep_bpZPFf))Ki3s0jzl>quP44^+jJU)`m
zl818^3+XIL)Ow>PHI4o>(9xgp1esQ^jeP<r`Pv!u=WGcNXvf`M6PPp7QKdY$F0H^w
zCD73yZK;-7=uat+gNPDO@G#hD7Wz}kg#Ogf(4Rvz^k*{-{n09CL4O8<%w!5E=uf&t
zl0Sg{K#sDYKOo^*=#LSA{-o7zJ0oXRG^~M>x))b{C!jrFj~lA;io5z|U6%$G{n3`n
zok4#lDd-PAcKPj^Y4pc(9`t7?hav_2v7(?qw?d2o^hXIme}Z|a=+7N9Q6}`Kc^ds`
zUNRf~xg$wOe{|4sQ^pRMXgQ#WCBSih^v8<p?%4+60&=7#IZS+Wn>)etqreI@(a)*p
z{i^0^^amwWV-IWQ#ByHpXGMRE6DjD=r5W^ReGRcV@^yIqQY=pvGx}pEk+tge7HNe(
z_LJAjuD8C<N*WQSpg)J_MSsWu`cuw8f3$F4W$o7qn|F{rV^RXn`VTFH{wM<IPbo9{
zgN~oNh_BF2i3k%L6`mjc=`MDY*r3MeUYd>A_ycDW1)x6_^#J;lrgUg>#HQvfQpmLL
zMNTb%{(!`NvGq$1wR0W*PE1%w1kfKcEBX^5o(7;l*tzJBj5!hmj#W_dz!;jEEn3zC
zQzYZL;<nTyTs9fFhY;f>KO93l0_e}i8T5x-Cz(Y@f4-VrE{wO-ZbU&9(U-V5#5i~d
z1oy@}$-p%1(9+w5k20e_i4^pwV+j@g>5w#<fJ~jhY)*Q?>&&G~j#8qaKjt&&PmtUz
z&m=8_7II|b_oV_!V<C{^Y!5q~Cjs<_A34?ui(G^3ALH04kCJavS4>*6VhyZ)8vSu;
zbLtC+9wI=;1YF17E%9|+Y9zOMJlOQ^n$SZiXqK1$0D%6q(b1p81<;=)2Kr+Mo0yCK
z$g%4z-q=G$e<o?@4?k}`75#b1Kz}SbSHd{kspwB5ibFL_tuJ-iH6KKMs`^qh+lQUI
zRi-ku_8c>mX5%eLf~i6j)6!yaBkak(ORv2TpIjLIaU#I4Iqr`k8D?}uR$kzb>*Ok6
zMt_XCdT8j6G3P*Wqyt$kiH81&@G{V!NdW!HM&L09l{<L=^rxP*e+P;q%?n}HtZQDs
z*iSI__Tt5s#~~RpDleK7Q4K0M_P89EgPLA(=Tae!DBkZ@oDB5m8OhqAIB`di>2l*_
z_iIPQHuG;BX1_i>8~rH&&>sR^Iv1f!TASpM03~Yc60{O2=nslx(IdmnAk9G$A6GCh
zfc_k+v6RkT8t@rdy;<%^nnr&hyma&@2eBu02{e|w?|quRC@&Gu$&CIyW1v6$ye#NX
z4EGHB<IG-O%+uAa=&ONvGmZXa%|(Akc!U<Qr$I8#T~#ihi~e-b(VvlN^e2lM{TZ4M
z{mDm+UGd<rg<50Saiq<mGQn7&UX0yjhx~{g=VTC{BI;?ZPOxdnm_Y{Gep8C#=})5k
zEdcsc`*-M14x;^<Qqg-wNXoJ+SMBq(4YNfs{(j=a6@14zv$0%!{FO)m{b|Br))ylI
z^rs0xe~dZ$+p_xs^asM(PeXr(SkRwF8v1hu>98cvab2GC{ydkHc@A8hL;nc<5$5o<
z(}@~^dnUoII>7O3*jrG@Gy=Cv(z0#_`tuUR$v}S+?bt<{S<s(11h@<4fNwPS4EnQz
z3H>2+T%w{sE(C5G`jboG4$9{e-NjQrjsDbwcpqDHTNmr@+;I_2gj=^EN~!1%pm{}h
zUwTrh3RPq;9A&S4QJBBiaBQTYaR`p9L{<b{uE6BAqmTgl(=-eHNtr=^$^rC8kk@4z
z{ka98Kf^QVPdOF+iTMNi^NouBtl)I*qoY5&Xy}hU5<q`iXy^}~E8rQYzz9dVb|K7H
z{rF;()Df2leX3I5ePTYA?5HhmpGJS`S<xTzZ_pnx9tY#|Y3)aD#c<c3-EI`blSM^;
z1_1P@ZVvi$gnQ|TzW;Zj6z+IA0~8?@b*L{wB3=9XR_&FG%zZyt^f1t${m5lioDNHn
zK1tke6YO9|SQ&vm5Ou>ri7QP5Sy60Q(T3>9aIK#rvjrOG9od>^wBO};dos4Z1S%8i
zp1Sjpe$wP^?d4vGm$T5Hm+S?9M1RaVXV4!dE&%;$1<;>9n0gB|j8xYIpg(S~+-dYD
zhBP1g6M^Lah+1z!;%j$$3F7@d`qMv+{`6zu>nCywijn&;?5aQN98Q)y#6hh{tmw}}
zI{GsKpg&}uTQu~?r3U)V6@AzUm5RWJ7xHzvLLZ*+c0fV*29el^+-e^pyfP&nRy3~J
z(%3&2{juTj)Iw6wp8~F-8VdT;1E4={a36wG4}ku}!<!_a-3;_+4YJ)1mt_ar+;&C{
z%)1c!^K1_Kb4dewQUm!hhmQWVk`P~)Ahj`ERW^AyI#l;(H>0yD=uhH&=+7en{fUEb
zMPPN4I2=|u`q;r7PIBybf>p4fKP5ax<EZqwhOpXB^kk=0!lLl+*cJx*vjk~-1KAFs
zKbH{JL8S(dg~<%`r;i2w>7Pb_9K1Szigo)f%_~UaAet<9w9nz0yser2$O(KV^ykBx
zWDZCU1^szULx1{^l6@5PC#j8s{yhHQMt|y%HA@h)(VrbW1ryK#QqZLFg+pE!4vSs*
ze)7VRCAtWaoq5WBKUAN5xD=Go2dntP?Ma@E{^T;ypU4^X#}mczXY|K}6F`3)Ska#>
z5<=+oMN759O91-giKL)ECOoszpD5(9z5C+$_oc2iI>$dGXFL4e#CF+_qKn62?JZgd
zM+&`M_n*IRl(jhj+|K>+4MnYDw{hSei7D@5H1RQH5{jz2hU{lTe>$eoA4|@ckl|F@
zlIEZMF*o^TjvRKd;PkO$MSnzi0rbaZ8vRM5p+7@(^e1r^`qK$38D>F$(teNrbi?*C
zqd!FW8vy-jr=UMhHE#S4$_I6ox4T#b63X00Ufy~m<vFo(qkj}fNv+1jZ_yunm<#9$
z+f*$R`eVy;8p2CKf2w)Tp3>4?ZvURgb*X@1%N+D)(vH2A3H_O5pg&~x0cP|kmfZ;>
z)8AuQF85kyyMYm?dYR^sII$+MG$;)~e~9en)`g#fZ(YB-5nRaC{TJxZB|G*B>j{pK
zk171Ax*$bm1L#t$x$0VIc_&OG>5%Vb=|lCIa-v3@CAFKnF?bEXI6<6l8%*Y~i=M%{
zedS6b@z9Nj1;6MuKsCQ`6E`NG_(__2RmGnDlLP!~^Nx(zii~Yo_KCUZ&vl;14^Yoq
z`Oow4M@oE>fS}TTG|WMNf>SBzj}w6YOrW=082ujoQF`AIl@6dkkAI%Lqq-_it2@Uj
z_8EZwSkcj+D|*gl+s693U#>0ozMZJx_V872*vp`yUAZ*$r-%jpSsUaM)bUeUFUY$g
zR#1J@K+mL4bF#wfbMC$GeD9sm-Tu@)X@lRbGbTqDdGvkQ+?7vsc0wNCy|t&r_rbX-
zkMAY!{W~8$efqfn^LDcSnu(Zb3i?yf44^+H$eqD08Ggs=j6CV+j|899XhVYB+WP|r
zyPh}w+_L!YQn`0;jp~H`Jf*(w8*NYKc=qJU)Ko@de-zJCj6qa|{I#!P6+VN8Z;k|}
zcx@A>qCZv{XMM!~4*dxd{~twv@)M>WBb-VXnVh%D$@$2pyfO~BczD-t)tb}Qu~Nq4
z!<q~uYcRJ11^uy{h5j@$(4WpPFRe>D2uY8mZ%ve0t#0B6`cICwe(a4|rx;FJFJWCO
zW?8-<`twoFZ7&v_k5PR18}uhttc9>xst^uoIubHJ`crmNYd{7rMMZy{bnMLqspyXn
z6Z%s#%(3^}M`#KK{kaLCKOecJ2J9_PP|%;1g1!S3^ylat^e1pH1^o$@prJpB5(}e0
zX*>Qg`eP-RP%QeHJ8LIgTk&M%05ke?S6z>R{zy>JAE&Q%bJ3rmY4oR&g8rn@(4Uo}
z&ChFo`GB_l4f?YLHYNY7F}&e9ulil$dg~P;M|D`ypQc&p&+d5M7fIH<?}i`;T+Eh%
z+fDIo{J|PAW+v@HI5o4o8Wi+LM^1{4{^*ej9Fne<eCta1+>M77doWfy01oO-hDfP2
z;E}_2CAfG#j`|t&r@t9Mf7m$LCu^dJh#nm?8v2vuGOFiTlC3_9N|D|<y6CRFHQ4!G
z3Rg$&;#6$*$B%s2p%5#bs5LR@w74UaH30fUjz;6c_^rGl!|B=u?n=<(X0bH%#}Pn(
z(576YYr{vn$lL{KE$Yfsn_E`jf1Ols00YpU0{?(Np+BpJWV&UnRIYzn78WAI&U<%k
z&9~>#V;l1jjWN-N4D`p!h=TrvWOLcnp0^!!uGx1@Ai98t{`go8<*s-^9$3QBaV*C%
zPZQ~|GTJoyct`0<?iIe4e*8SjD&FE0^k;Yn4;B5{O+kO4D$MB5Vkup_8T2P?2K{lE
z7ya4Mq|oKX?u9es(k4^TpOxx01o7p~zT#dQJX7wuULrK~M?a*{N0Jr&(OVe(+2t(`
zpg-!&=#OP01O3rT1kfLW%(4r9RW0@d_vL*`$JCB5>Ghac@w{qCK|K<d{`gqLS#CaJ
z6HaIYVlM$ee}(|`#{oHw{#<84f1KS}(4UK-I#mk#v%{qR^mx0f&OLU&i52`7#cSkr
zR5%QG1L)7v2ARZcsI^tbHQ1qIJb40<9&al6jE??rL0QqC6e{}TH1V8<{-BWaqd$QZ
z^oI;ddb?soO1wdG8vWToM}Ml294ft*r>W>quJ1JZ<Ah|OKmPF&ATlb%Svm8i1n&mW
zFa!M|L99~RAX4$w2^Rh)yhmTzlMb7WYkqDPp`bqxf}-rasOXP|SbNM03i`8+?P&21
zxLN}f`m<lqZ~UWPx(tU}M4e>`s9r2$=<IU$A%w(JzFdXV@*B3B3cnh(z^V*zZq^@0
z#O~26&0Fek;7DSddZIuCdj`HZw!iXzd=C@)W3NL;f4XaE=#R+RhhcB{iVikJ=?WM$
z^wZIwOfav4aSddJU6@n=6ag18hV1{q0a7`|Cejn7&V>Fr&q05(spyZK5;OV}Do#g#
zjNqG}>fYLSp9msKc^Jd`XQ4mxu}}m748nj3r)SWgLUL8hTG()k`UW|W@ph?RFVLMq
z0R8zD9f+Mle{R#!A2m)8D7&XFX)gNnn1cQgw2PV0pTPJGzy7h)<#hCi#CK({iB3F#
z{y5ePQ_!D^ppX1)hkKX5`1v;c$<wN52j3p%0KW~tANnl(W*`d21_G;GEj`gUgZ>0+
zgx{-=Z{2Dv%5`h&%Vah?qI5ffV?3G1i;!HU+tUwI1A*k)G*0#Z9{thL=$VcF1O@@<
z4_Flh+M#U%s)-1kh5igM(4Q;5Aj0zI+9^pkkdpjTkyk`;am~K{HDcc*R%g`Qy<of~
zmsI>xPwLJMX@g}_22nyN0$=D2_q#g${$~6bP5v*&7^2DW`(%GA`V)A8hW-$@(9oY6
zCiKTJT&kqvVwIk4yy5zPjQ*tV0MH+e@azuL*6$^oBjoX0^`!GbTwnN5IFQtd8T3aR
zMA-SBPXR<weZ|KQ0%MYErSE{D8ew2~i9ZOW1W$QxXyncY@?fApoecEnNK|@NnADwR
zigzrfIm6h=d?aNHwX|@eij{OSc-H_c`Xd@GPbQ`f#qBPJY%4`9OS5Jd13i41j4dp7
zgX0YV^k-rk{fUX(Hvq#MM!3{y`2gt81iME$M71Z%1wens*}T6%o%-jZKOpNEn1M)(
zWDvoHf&P?7+Li;i@f8*B;V%AFE<qIZ$4-O|Kz}SW!VdT>mx={JLv0kS@0R7_1y&lR
z4A9Y^Kpb1YA(RbEXcRaf$UuLr!yTT-d3gN=`ePdcDm+5CaFLGwcr&9vg$trTJ~Z?v
zm5TnPQqiC9;clULg<ji20TVv}{lP)C8$dp6gmSsng@z9TYXI~Iq-t#3o=bT8vb8t2
zI`AtvFgDu%LR1)r!wNuuKx`Z4qCfdjP5}B-K|z1K0raOGKz{`MrqLfCa(kc#3_yR@
ze@WhA90{O5PBiqVf{y;I|I%UFMu5b0h<ucp>MP}sj*H$>!>-~V8CC;1Aewb517f(_
zzM0UjqmaI38vSwdr=mZGFaZ#VC*#&K)g0ZjlpI;E)l~FHN2C2z2n^TOd57F-sgQ2R
zg8r0mHipU|opjmlL-QT?$5POrm0t6qKlxEg6Oe5a;X5YS%&-xe;}GY*?xi0sHs~rK
zs+_G_oCA-^_(Y}>UGhHWJlyj7A+in%3j)E&#!~iR4!gBvGuhIe1db3VH3M*^iY#xJ
zgOow|E?+`+sel2A0BLL3LPLM5>FCe;B&brz-KjtvR4J$<kQx06j<lwsKTDucW5QLa
z37ZB81h2zOII^!Ju!(@m(o)!5tfgZKV3B2_8wk+iwMsb9v2Kuw3=uqTfIe`g1PX%1
zGti$KZhu05OhpLe?~|{E_XhqJ{jsoeb<~KmFfQSTyL-4qXdAO<DBrX(1YP>b7r>1E
z#L&?ntqh?PglY80gNFVP{Q>l6D+T@WUKst+RwEI#aYS|!L9y#k=+BMF>Kk*>A5EnY
z0$UqFnLS0DL=cxJYP*1V+-c~~3MCSVqu7<(Z3g|Z`7Qe6v;g|Eu?PBaH{ubpTjruc
zj>m7&pZ;m|CkEzCLw~B7(4WBh&>tr%`eQ;)-XGfU-|Xi7TlB|?hW_;b0sXNpzfJNW
zfUF2Mn~bGhLHAF4D}o>QqE3eSpTeoaR|DveQ{;L=gi<rxUVmr+?(uFyv>uj<{-{Cg
zFp(7W$17qT1^qeVTuw)SbWy9UnbDu1C|ew15sxQ!k*9(;0o-O5KtX?Q_+D@|z=16y
z%OI#)#Khg6`fwdjb7;`W)TuE(7z!kM0j4o=R|Z6EWe20I$XsQhWlxj+Dd^9AH;w0k
zv(TRySO9?jBtcJ&Y25l*b)yP$9Xh~OG=u&G)`a7n!Jiz#$IU@&BM3YegvK)0oKIw5
z(2c;qL4SgyDd<lu75#~!p+B(<^v8D=`V;gg^yh5YZMnV%)28YhP0^ksG3Ul(i~QKg
z$??DLR<ox}af>|P<69lrHfHyi=+8$g`m>LU{<J{~wt1Z@8+Mz8{#=+we`3N#zJ!f^
z0XxyqpJR}1B8fHt`coTOlQ@n3e4?N~fz1$!Bb;u}xurnS!PlI>e!6e7ry?y1w0<G<
zXM&FY7~m?O93jACZdSj3QYP1?ocUTgb3B(#TV~^UAOrn*8V1HTrE?o$j)E?KOupy?
ztqc6;=#PiXZ1iWfOIUXq{Ay9uQ&hP0M3^%J{mBE+A361j4<Quv=VOS-NAKo>kU8j2
zFo6C9&!9g(J);)mOVs?|3ap+4w}IG<L4F!hMF(~a<t=NIat`ncm$osKYo1)CLx8%>
zhyJ*;qCcs>L4Py@Xz0%o*p%wHSNvlp^yf&_G64Pg6xoo<M*10!t&h^izBr8}sIA|n
z&bPI%C(45WQ4SILk)DBuLstXn4|y*7^U<Gy{tQvkA7eHLeQx)purIRgduPy}Hn)Y)
zpTXJak9PAg`vpS7_a&j~1fC0?Q1U1Q3xd}W*vKHGV%LnS)%sE(coM-B71eNn0I8`&
zkdqgOgZOcvYd;KONuE;q6!a%>7Wy+4-cSXaLKgQr(a@i&NbO=*J~D_csUa6(Gzzui
z!h*GL1j>|zH^0%th!A*sh>w?p{ASRfEq*Ql`m;_6UJZ<#+t(YUr-h_%mpy(S>D3eN
zHy`@b@SUh2h2N%#+W(cPVI3zn0iZu6YUW(TWvJj+<CAhtfv#Cp^yj>oFZuSGhv$4!
zQnma#3Pmrki&q*LzMUV2$~+#zg8r1hR_waqaNgn4mXAsg3)fu_e$CY_LPLLs0Q6@)
zXvr=vV?2Ktlp_m)A_w%#TnWxj$6~ITIR#MApOUFn>;xz~3PjuwtL=d*Wo21ooZsou
z&>vDqCr2<xW^beU8%QO0R?!BOYX^Y-hy&;kq2&=b42F(D#VMgc0UJU70Qz&@lDlzH
z@m1AzRP?93tQGFfW|Gy?UiFPP{4o?ou2=y!j`F9WKegF`RP@J0go^$&ju0lmUdCnf
zp+9Jed-B~dgzhUe5<q{9t&MzhF%fbO4V|zUxJLv^VKZjb(rltoWc87krO9=?%MfL0
zR`RQQ>~($1sp!vWBD%c+`d}{lBiO2x4WK_xIu`)+N7LHQX_d-p3i{J%6WOZt&|2`W
zlFuN3{@g93pg&yUEr;Mm0Qz$guI-djxzQJ)6ydr1E(9b`s>^D(ddIP-$9Qa|+;(_!
zw^qWI$^;3FL~(k0enDkHIQOcrN`;FeQ*R#~-Bp?x(MZOa^XYy8dmmjb_95KRx8W=m
z{c#jcax6)d9{B=}T|5i@>5O5ZKU|%)`A<C+)WT3n-7b|M`;L&qdtYoFRXD?p{^S|P
z{J4l-ImwLv?9e&opU2J~?EYi2>8=DnH-P^1SSg$ho2m}J{dI*zw)x#n-Y@TJIceXY
zjs7%Qndo#_uk|hMSjGMN-2?Mue5Rr+ZpPh{vajzO(E-pO86(pUbi%yoPl1TIvP3fl
z{W(y+L0+wZhW?<M24mkUn{ySgqCW*x^ry`J^{PYw{V@R0pHXds%1~6Y!z-+>J{A4x
zrlLRRk|FXL-|s6`-{QXPHBm3VUQkjIM?rtEXLHdn0rY2ariOa9Va+SB`4Vjt3i{(+
z5^7YA<9i@UL4UOH69jHG3i_jkzYU;2i*X3kRKtmZ`^kp)Y5?>nLc$Y3e~KySkBU?-
z1^p>bbf%&|aJ^z+zZsGv=z?h|Dq38Z<Nt=c$uK+2CaO-***sFkNXCp!A0Lr6#F0or
zf6^j@0QBb#fc`WlLo_$i(I3JQ^Z=3n7QYqO22{9D9tmlkvB6BkAzb}lgy5PlvOwKH
zgr=HF{K||IHe>+(DU}I*LqUHcxc36+PnLiEl42r!Fdqxko`80HHCT*&EKX98;jq~M
zxz1eewST<3e5aJ6QEOh!*2s+xMgaP=v8FbuI4(yz%B%?o*A(j!fy?8Dmn5RSV?3>h
zsHwyDP<6-J#n!Ht!fF)sr(FbZjaSxN9EE06fH|>kKsbmVrJz5)1bf}#8T2P{4*GKd
z6Q!Hi0H8lwQuQAoCc}KlY4oRsv^uWKSP(#e^Z@h+S02Y<O<<rulK}ctU<ZvD?c~)q
zhVxuFVY~WGB1hbhMO>;J4nwiKa<`q8f0kic69S+=&x--{$1#D9{%8V8Z*;?Dgn(qU
zA%Olk(9xd+8v4^N0yALa;H9BIU>pVgX{4e*278W&skfO3HZ6qyY*oX|i~h(=vd8D@
z?7c!ke>CD0j}7y$*LBb+!|FB4Y&<G51jgsgi~fw*CD70xE2D=L^rw?oAmQJmKV4Mx
zhfG0#jv$E^(3nvw`okBnYoi1iYpp#{``?QGWWwHkjpr|)!0S|_mIveNxHsFS82-RS
z>Y3H&l-GpS6|_fbO{~pY78Q&iwu{<?9TS~{{#Y-Ohs!Dk`JWUPdKe$7V}eb1f9vTh
zd)Q;q2j*d<6R}RU^7k;utS3zPQ#80lCP{G3FSj)cG@uR?^ygQk;WYXKZcqczpVa{R
z^Af}UH|S3ofc~KC8_f|vf?AZY;pkQh`tvM$CmsFCE3R^u_nqQ}{M0S4SACOJ)@S2J
z+^zd~^2iN?dC;G5r3M*T;~ezI5VZ!O-E8JC5R?$Qrg~WDmXHA*{dqYL`h(%w@rCGL
zf`a->7KyT;KUi5KA_e{7KkR1Eky^AXZ=;c%_+>7$T+~+6Fc$Qug$4attg)eQ!wOAU
z7AyJ_;~i7-{>IxwZ{Y?DqdzzZe>*e!<H)Xtd&Vy6*}gd2FNW-J#bmu~q=ZL?(JLS6
zZA%~R6aNkRvmtU+;MUjs%Y!VJ_kG`W`TMTw^p+3Y*4tn1{qWfC&ad~ku5oZj-um%W
zee_N3cB|B9MUNFHer@0sUGr(={?Cb~nCb`HuQ~h){kf<88}z5J9-V~YI!7w=x7~lR
z`|X%*XW)H~VJYxBX|(leu21*&k70N}kw*j1z$3de%7js#M^WF%_cf*<8ne-#cx9W}
z=#Sn76Or_6(JUFUb3?Z>Nn+Qs#XDNLbG#*P4&BbL)nh?_2IOhzPXa6Y1BS|Z-R*L0
zU7Iiq{aJ^jp+9-xyo0hz=W>*yhR_=8(?ajBMtS)6I`jUlu_ZtijKg}&!sS@eAE__R
zS8%I!%uL0MY`%Jd2V48`j`bP<`jZ@H=w)(DP)^_Th;-JF{vMwL2l0wD^rw-A{)ihn
z5+B9SLVq-w(Vu%uLTV?U%i&kVEIv7e|8{SMpdCKFVF`f#B!vqqnktj=x{gHQ@wGDc
zVJ3EXi*%EmRxh(G`4!&~dUW*1Ojshf%$ODZDPIWv$(11q*jnUSUO3vV8L7mA{`eZ@
z5`$D%;_z0Yg~<-?zLp~4kJ^rw75hF&^KC_#id)rY?1Ko|g<%cwf_Ad9r6$DNGw6>2
z1^v0ZBojb?8gRcuf0C%^j}^GNV(bcO(}S3E4P-nLgI`2QU+jWPm%;PvKvgG>Yt5iP
z_7XO{8gKBzDqx|9Yzk>&Yy8`-F?EM`n6Z2CDh#Z$4D$7IetOq^ktI3LQ<hB)K!40k
z7qx{6SF_2AoJ;xPOT2VmTH+k^d8cAlgkh$G4uJmrprJo&l-UIJ0Q4t_75%9-6)y!h
z?=Tg01joR!#6xD<LE`dB^-+zc(H79__7DRa`lDp(q-LI)U?Ps--27&3s4P|iKz|Cu
z1CD`(3MuH1zC2hV2ta?pYE<+mSuTl={^$ef5AN^KA1~r!^m*uQ!mi*3bpZWooJN0a
zr_rB=-=aTBc%*UN=LS<{X7uM9@zfv{{XsxS<cVmwtvDV1StS9WKO4i)XuOdlI5nRc
z{W(fOe;Q1bXV4!391Hpb*XuHtP~j_T@W<N-T-i~7<r*FR(Ff2UD-*<zDFQH!*@YIg
z#>RMTJ8Mlox9#29(%bbo3i|VO2_5|rl^uBbbb@fRBcjZr@Y;&P(v!%|oQwR~k1r0X
zQ{;gPktFf=6fNCfY5X7d?))vr|NS5TG&9Y#&$OEMNkyAX`<`i`B2<bNOB*Vo5<+RF
zX-A4sr00~PNGc-PS_z@Wk~S@(5<<w@_i@cNGfkVP*ZckXe17;Iuj@a!j^lh>kK;Oz
z^Ss>w`r{1HA4M6ZvthR>$*Kt|VO069igfWR+%P4<mP-{vf7%RfsR`61`VMQEQ3Nim
z@=iy_qCyD$nGevP3>NxRiIRyvzVxT1dMXF{Q!_34^TxPfTJ*<SdemC40iZv}6e08n
zr+nR7vTONs6~CU_F!~cMuRG?T8zing<k#C&=lafG2EEXfh5i@-^k*R_`s1$y&>v4L
z@t}13<i9|FEE(ue$T<3AFaiDXFrAG4;58xi2W?8M+T>M;$2-fYptT-Qf*(e!+XM8+
zQ6iKo=~^k0HWB@)WuQN`Q_-JU^TyF1vhKg3KX}ayH}y&A&sCH_&_wjdfCK%>pMw76
zN68y;pg+H+qCf8p0s6CkBKjj-mGE<AR)}@Bf;FiaEzw1>r0__1u6O*2H;Sf7=21Hz
zqkH|t{biS_PmBIkS^1~1(4X53^v4-Of3zo{KV+$&Ma72B;-&(9r^yD_Y*(${CZdQo
zts(1HjL~Kp0`zC8G!y-KZ5*y)0HHq!QwaUpD5-%ftRP7)Ss{zkm`!@|Swcv82K2{3
zAYrad5lKgTxxk<i8~q_qLVrR`@loe$EF`Wiwj$N)+jF2l0yNA@E?oUlvG__{TA>Bc
z#TxXA1$|GE`O(IUY8>ZZ^w7-J!D-K)uWWHd*7!wT^^R!8zd?VJ8R(C$mHi4N?lErm
z(&nW+=-D+DhRF={Cz*}@2-0E%7rK6;EP8+T5c=?Zk++x*S(7`6UxoUe)Gt5%w#y&e
zA#S*FNHP@|2V3}caHBQL9?yTZxSv)*UNS#=u7I6*;N>}=mRWDrm#$@?KVenIO!OyF
z%$b^-xrKCNn{YqQpH~}4vEqxS&UN7D_1MnanHc?eUZIS-$)gI#^6AkZBMALjC{D?>
zacvSY7`3sTbN`;4!L;a4?L_p)`R~ymFAKpO{nRjk{-8Bs^rxI=m-Hv}N0z`J7iOE-
zzx~*Xt9l*wHom*ig>3Yv#^^86pI`?1W5@N7cf*>_^=lIabA8J5|1m!6AzJ-v)0)`M
zC5YF7%g$CMhLFybpMPOo7%BMao#w?Sltb443HoC|6Uz}%N~`;_Z2lsTrTJS;%FkRY
zpB1y&W{jr&U-aicL4Wp+mR6h8Sec|*9X&^TzbD!#9Q9!z&Dc6Y&lP2<wBVh=g0z9X
zrg<n`nMgao>XALxT9l|Sn{Lf>xRq&RA(lrorrbJda_ie8{K%49Un8SGUx+mIU7#U`
zn(r5>M&LE2+%hhzmU&$H?dz?@T-K)451p0LgbN+l!UpO2qAklZ4C9ccdZvU61eE~f
z6Kd0Fvb%NwA9l_jar<`ij)t`#78^OVX?V0|TRVQ$bWw}W4@^Lbt3D@hTd>b!N$y*3
zr`#p!`rE&Y1vuxg$X{8yTYPNO%JUvqcYOXX9_Ts|{b{?@QL$s2C|~%jui1uveVE;}
z*b!MhKbj4n{i{Yrr|tQ8TFD~eV7l@4mf{oFgS7v-yPZBy!20xt2X0&Kj_F58Z4Y>I
z&h5&MUs5|D^hYr~erMsD>)6j9#a)G3dlOq*T}C99uP$2Emq%?f;&*;jO>e37SzX_r
zfA`4zb0>b@%g8l0_F8%xvm|u$=Qq!<>>QKZ8~zPKe=daXG!5JSTJ5^@*OMXPivFbQ
zIsQDEm10tSsaH)c>rRywaOEBg3*=JH3lqs#to~ujf&Qf2{Q1r)zEFZ!?M?=*Q!<b^
zwu!E_@%BSvV9`nJ9`r(bpvr!%v8-Y@zLo?1=~Ya))e&OFGe0&oN6SL?!8d**sm2fe
zTB_sd&)ZFoS-(UEmtTnvY%jT}$^Bg<e+Rugw^+MFhK2rMbN4CzA{+_U3`UE_-wsn-
zh^-H6u)Ce=i&(h0k%j)a)a*RF@6K%(M>hI%CMsU4GN<^+v$YYw#9KW7$yw3jeZWlO
zx$luRN1tyv86nZ?mwWPPYry#%5^aH{9Y@=?-1sHY9#kuPtUcs`*{qJxCu@#%?C6M?
z)fv`z@>u8Yw>NgKqz!i*d$IS|kqd=mk=$}=T~RLAmRwn+ocl_dCcBr=6MyV1e|P)O
z$BX8NDs`syCdqf=GJi>ZPJ4N1Y0}Qx<mGGA`;M;JEBPvIeP;Tr<C||vzRuX*nf^L6
z;<sc!Jx1<$fA#@$sezm$YmX0{KDk$FFfTXr_~6;|H>KVbly)9}Q+VUI)KF2a+=-!*
z2j<dmFFjd%;_c;*z0&W>`Z7<vD}Q@a`u+9KohRPk{PkOUxPn_g<G<)nk4Sop^;~n|
zM90(~v3%Es>T8AfxjpWYxZ1LC{$AnzUShq3yRM6LGKCNLJNHUGZ&_q;Q#dI&wO3}q
z)yAY#_~5R`y>j1LY!>_$PNs^zB=Wl1TFHr|Bsjku`~Nli<JRhQ?55ahts?{W{_ZPI
zbc&rZdNQzVSL=#@ev9Q<hz~j>jJZ3Xk`vFja~X6>Z*@LnE`HYW$e?q+yUV$?;^*9+
z46eM|>T+SPc!8Jr8`rz;D=%h>pZ9lp<NmyL<&~S_g~3POtR8S*b*)qU!mcN8)_!YU
zb?diy5mkK1lh?zwT27)k!DYx>vd#65xkO3Iks)7I54ZbkB`&5v8QNgf=Jsf>#HB3p
zw|;gW?#-DJrTH#z1Kir&pWT$WTzuqhpudMlTc^a8t54o;+12Lp;<rRurTDv`1dr9d
za<i`9b$J((-nRO+`K<EBBkw}<J=VNgJL}r>C+~J#ZCmqx@2u<H;_t)mdaV7FIqSxN
z%lqBW+tz-)IqT+!Bk#ipJl6f_oOSElllObSwXNeD`#r0IOM=vlL^64#AOGc%ICvzF
zIJ0+g7DwVEpCqh&pJ2T%(ehX#wPoL`<NImv4=jF`wEB6H$A*K8Gn3<<fi0e7ua@L>
z0f&}vIy`|&3OcrGs+JUb+=C4!?aA~3W)c9CU@d8H)<#Y+3D%OLbGN`?63~+3&IEIU
zNeTI(u$grC+|ibE2R@zKbD&^Xa$)$*!t9>H#EJ{2UKSrXQWC{xlhRA$ZkOgyl9Mva
z4h)nX{akkNetF@m@{BLn4(HrRorEXBauQ&Z3aT<5SCxLP%DhlRhw&u9CY9XD`LmpK
z?Li@%O}g=@_*TP34mqi`=5aY2Px|n*y6)M{$#_yL15fIJ@T8{Bdm}Fzft>WD`{A?h
z2H+=g;z^yaTfX*p{v7D&8SMBv*xfhO4e+Et$w{LlKfiq$8yiDRd;pL1`M*38Cy(@i
z`^55FH-G&Y>3;L#(JiI3lX)b629Hz@^GFW=7kMN%-;}955_OzMx;&Lfx>wm?*qf^R
zK$oyt=YiSmN}Z*rFu9@vYOhjXvUw!@ezI3iS1h>=;*q{0#>yVpzC)xzJW|kp+Y*RJ
z3Ssa_!G|m*cq<jLbD2C+D&UbYy{LkcB<q7L9!X4q;#tS$k-Ry0B)nRP05YFE(jEeM
zq-8#Lwe|^kC#fGTs!otebJ%@Q`JMUxdxi(=gwLA~IfviZItuYfh0a3|k97a;`R{3;
zY^8RNFnA=5IAy>iH4wW8MePMm8>|j0=LPEU$UlR4q^}T<^vo6Jk?=a|^P5z40FP8+
z-sW1OVTP>qNl-7TWAI3E3F-r+n!AdPOdg4-26!YQ;k)VB>@IznN9qSW(zhZ8k5td%
zkxp~)NLS2RJW@5WUO-m}=8;AKkEHS474S&ki78d{zB72FhU&Qf?+}mlg2&L7lSgue
zc%%-biq6=BphtQOmAoEC>Wv7}l@Im<9_a<lBN5|_7(7xv%p(asc;Ck4k*@Yiuy~{n
znk2%qR*REIss%g}S)R!w`Ec?`K{7GNV~vn=<F=-;c_fnS%skR#teI~xn@4)b!6Tgk
zJkloolH-6!I>W&uks?eRMG(4AMcxA*$)1KwT|zZs@JL;95RW7Q@kkGuJW{C*2anV-
zfk(Olc%;!OJW>M*D};Dr^r?GUgepPO6ylKvt;GJFN7`2X{4y8agT*899$@fD%~N@#
zViu2N5drZ?+c<cnD08_T`}Sx|&m(oqNv(gX-`_jVBh?9<Ie-#HNZDA=4M<4*5`gi%
zC~f%m3#!Opm%!qYIsuQQjTJ~l;Cy8J<s!2;O6cALJkm0G7LU}=<dJle6qr0x^Ei)m
z#R3QMNZ*Jrh_Ti<29NZF$s?_hZ=S>>S>sj_1_6&`VLpjR>g3>&Ucx+563ioQfq5j|
z_6a=FtD>6OHz6MBscc#@;E@hZ<dKMkNj#DR;E{4*9_bw?k3@rcBrzQZkF-L*aGXc_
z4)I7;fJZ_I$dq@j8@Ow*WEvi+8s?FLARcK!geTyU76Tp$iDU3c!V9H1c%*g~kHlj(
znMWFsgLx!b0|t*26sMenhz$;(kw@yaCY(iJbkNl@TVNh(8Iwn9XYoi55=|)#9_dQi
zL>{S&!6RK6=aIZvJW{_<9w(2~AUlaiD(fXcJkr5wd8ChkM`~yDNV-fOsh!CqX~o^t
zv)sC`Yftvqq)`j0WhwDXGF}i4@@+K&JW@Lck5ntp!6Ol-=aF6%waI#GrhxCfAjBi3
z0UoKt2M>58jie7gjxVi*ARg(mm(V}Co-+QnD6^zs{zzQZ0r$IrN22hV2Y4vj2JNy?
z$xlwl)yQN39?5Vjj}*L6kVJ)fq&?9p<|<fKv=v|CA&5u1>PdllBwxTI#gFqy=w7)z
zCXXa&d7<F(9ld%ckK{d(M>;csM>-DiNFrto9_gc;DFQXlBaz}XARcM+IFFR3IOLgJ
zV$y_&P5QA$jLjo`2Ru@VV4os3=96HX9?v+BbQsgd;*s1KJQ8g>9*KrW<#`&s0z6U>
z{~UrwShdd48F-{LHjk8y`8ETO)XU(JzQa6HHm;t*BaN_mq&vJzVtLybJW@jti$_8U
zPT`SKaV1?W9tnkkd8F@u;E{$Q9_b*PN7}|;!pS3b@%6$yQU&iT29J~m^GJE)Jkoc-
zBWVdjJQ4~Ac%*vz?wvu{420m{@JJ1G+>g3(9%-1tBkknmk&u`xA-GZ-e03Pb%*H&E
z+p*Nzqy+Ft!#wi3f}A|kQHVzhf_S7YFprc1@klfd9%(0$Pp?A5uwsY9Ar_CMEeP>Q
zk^&Hql#ioUP2iD$V`bTu>X4s&HhUtEL=fQQkt)eJz$5ur2z+JnNO@Cvq-{7hk5oC8
zM+)Je7Zn|*iXUR}NO_z*k{2(n+FWvuvLV?dM)IU`qxzaCgQZ4-|1po$40t3jp{rqp
zR#f6wN%{fDe=<L~e^jOO9H;Y@(*;`TLf`2Rw2AUL4qV!T|H31=3jrRfkx2A%5CS|>
zBjAzf*uI9WKENYI@%F(y5|wWrGE=M)g=n2+xm%<G=8>F)Ch$m!yo3J{kF*o(4|pUW
zUe7Mf#S(}|YAzDYzzet~o4;W5NF$VS9_c9Hk^F?VKGVWg=U>#edf4Lfb(qHu@JO=+
z#(AW(96S<<=L&;Ia>EP2JW?TEAV`&85{;{5@ksT_xQ^#69_a&*U69}n29Gqv$s?gL
z<2;fVuc5n8RnUbhVs2Xz#3MCM;*n<aSufu4K`j=u-mDVvNVzyS7LRlX@JL8Zi`p#A
zp2(kH*H<!lq=Wy$BS~SjS}&})$LpqsH8DY1n&j?=d87{zkJJqFNIiUkaeSgWJTvh~
zZ7d$Cej<-F@CP30EQ?1X2tYg%0++|&kzN5F$y*5P>}+Uda`mi^?=`(y{JYLb3;dZ!
z>Sgmtd_v|Pd`_)`8;AmH@EERC%*|x(5Wpkd<I89etSU083KHzA;PV1JQpg{8B!u9|
zBp!($Q}VAoQY{CMbPwW@o&g?74GVarIC@nh;E_&X3RyhTK_b7oac<wH+-9HCk;13b
z?C?Y9PN?V#v3aDC<bUCj`dB<tUl5PiaCV7<P$VahMB;NPuXfp;5T3PluRY#n2Y+`f
zo)o114e&@oxH~Y9<TeA36b^VKVF6Aasc$NeRDfOE#Nd(C_y;|O0FTrQc%*AQ8z?Tl
zfJgcX@klS&JQBDv9Srl5F<StSlrkfaG(3ezx<W#oY7qRa&38pHSFhprGm_x9RzaN#
z4jxH?AMi*=r{j^j0FU&Y!6OYrJko|_jMI1Q?jxA02|SVoZYqz|%;u3=1(&T6Y6Coy
znIOy~4X}Bn-Ga+{lor3Oio2ifbH1T(3XfDWJROhp0gIf?4|t^4FpsobNOrdn;E~dT
zgaD89`u{bL<SkTjZwimZg)13Gy`l$wC+E>-;*r#_SHlE65twVp{4q1pw>L!In+b>Q
z+)>Epk&cY>NS;A|!6Q{p!z1O91YsWO3gD4`GkB!#DLj(C(DXdg>%Zrb_VAl1Du{b5
zBDM9`gz%>bxg|e$l)W>BN4m|sVG@s&2k}U5EFLKX=8?R3^?n>EZBjWpiAPez7Hjk9
zyb&!tFKoYO<?<!?j6d^8%GhvD9_a(mSHL3$3r^yZLRdVKC!0qK68KP_wE1PES$^C*
zq5k%=E8UtF=EWUS!q-yw8KP4#ZV->;C8RT)(kJAYz0YCvozTfc3?9iI$H^l#PvMci
zJ8(ba;E}$wc_akp6(^6BJ|mBm0eGYo4jxH^|HWVMNLOa!krc5r@<>GNf5szyo5~~E
z;3n}%8JK}7JkoInkK_h;By#T7So1&gNXt-)XO00L>Ama;|A$KxbzfX|X^b1ZgR_Tu
zq;6fKsXWq1RQDw%{<j{{0kusNc%)~cZvO{)q=v5$k5tkQcqB)mZ9AJG9%=PDCXe*<
zZ+Rqj8{8{W0^pJE@zSpPb((1I4>{ynD8t~9?9-Z0$^0FUR3!6%l}EBm`ZpfQ!A^mH
z6~rSgnZzTtuz92oh(~INc%<ryJkl0B8r?_3ZbW)X{fs=4tWw(^Lx@M}pP5GzKO)ss
zXCq(0vluH7F+Gp;`GoE}1r>P)kL0!}WuXLvNAly~k?MNl_MDbQA7=1Kq>#0G0&?%t
zHymg1NJstOK|Io_DLm5KJrIwyQv>Fa9?H(lBb_e(k9nk^YKTWtmk;C7@jnssZUT=)
zTFmB=G$0;nJ#V$h?9*R=?-@RL?)Pr((%0tUFLxEOc%&AHM>-AjNSmbUK0`dx(ZAu5
z5;0?QIC-QzoWVpMsc{mIB!1veJQBYS#3QY?l81RDF(Zga%CZsOQk>%H*`wM^tkciI
z(>&3N@*4G)g6|xPO#qKnKh7idjRGDin#m)%8o0tdQktu;k#BJpX+|DtFsx2L_9BBv
z`cAOn3nImfxkibyc%)^3M{0z5q;S9^X)t*tqQC?mDS^QwZBG3Ucq9swM>2}<^HmmX
zXt-m>=8@vfAs&e`fk!HVc_hDSc%)O~JW_U&x<-}^#3PMx;TSwpDa0euCh$l$@_NbR
zJW|y-k925S9_cDpr89`z7vhmfaS)G0s;H1zP?sy?S&=m6nM09;d88}h4K%q4Jklnk
znR%q}EE&KfX>syMug7_$D!?OQ#sADB<@NFl-^H3pAP?-x0X&kH4UfV{Hji|llSfK+
zr%d3HE+LR4h)3FGQGKRgn4~+z9XPyL6!1vOx*1rLlYmFs9<7+2g<8twk%p25j}}=;
z3^REo%}G2`6T~AS+=u-I)xS6jp^IkVkwPFIX_(0)y_93|NJ&f{$wLU@k<P$8QUHrb
z`aI4f@f?srR0uP8q=JJR2;)3b4bt{_SCstz)k%wkxbSQqiAM_Jk)9RBy6lH|q(*Hu
zN8aTSk5q_02=L(fFFAOm;}V<tw;P>J!OkzJvbjn?$sFxIW$Ec9$l{TX`4EOQ@2F{n
z^ZBpx7KC}Ee$z=j(jnsQJiQeG(O8kD#iNb-Odjb4;ZCh2o+3zQ@<?KF5RU|`bOZsx
zg(#?G^GK;aFpuQS!{Cur;<Pw;B)=&<(z$7Pr0X(F9%;cu9;t5<kCemak&4H8q(U~2
zq|D-xG;LBn*2agB$9beaCXZCe;F0b(Oy!Zd6akNf(7(;WBMBaWc%(B3%**txUWy31
zNXgDheLCQg!m9}ok96Y?JW_}&i$_w!3icx&nyALSDGqV?Baftxoe%R!>R3q?3NgVz
zZdX(f$^=nVB!jmY66F%qF&XgDl~cH+rGiy9qzL>>ksCFYv(O%Dz7bLZ@kl^df_NmJ
zn2<?4l15zE{RMK3Ca<bX0uU6-X?Ub1G0szYq=XrHq|FQ-DP)+*BW;CwBmx%0V?_+s
zl{30|#$%jE^7)T>B+(s!M{<~fM;aLCk@RNfkv5O>NE9zNk0c%2zRxB&@aov=w%DW9
zQ+T9$7LTNXZI?E5?==w_y}kA9A`LH?N8;OEHi<_fdGb`50v?GJJI4>PG|)`CE@qbo
z)^c0)>I!W?z$1}jy(*BJDsig;k7O9LUIp!<9!E4p<cHQ0obSijn-@sm1Ka#dTVhQa
zJkn}5kA#R_0rN=FwAFssR#!kgl8Y_GBQ2hmN79H}lX1WN`u&g~bejj0M+#x{NWp+d
z;`2`a3m$0&%p-k*d8CKyIeDa?GxA7&Fpt#C;E|dcJd%1en@0ku2-0-|j}$_P13Z%E
zBp#_TZu4ktR1nr4@JOWS4O4lfZy0yLBXMD5KBue)Jd$KA;E@7ZJd$5mV+aM}k$gr|
zw#EY<NyHuIk+@=KJ0DW~CG0cmWHW(BYKq&+6RS}c6IC~vN7~BdkyPFD7(CLx$vl!X
z#3QL003N9hW5VK*Tqg2JTRb^<q(;Ca@jB#9$0L1<RYRb*5zsrxF*dHz8KeKkBYpfg
z9?1>nkq(<Oc%-c`kA%iZmQe(XxP0muJW_}O}p@<>%NOJN?#{eQtD)w6jdGtYnF
zkwk1*JW|LXd8Ea*&s{08iy<DV-77v?FP_aKr37>GNG(hrNf+=)bu1p~Jd;P-40xn-
zfJZ7?{|6pvKAoZm^GGrnyeoy9UZx<<_2xWf-L|!I;9el;T<cpX9ERYbQ>3_KuXAI*
zJXp;~r|@|ih|?+SS0MSw<2;fcgGbT>JW|0#9_bXDM@n({6OXjoeFh%Mp9ek8Bc1;v
zkED(jM^F@>8lqcb*TXy#Iu=cMc&eH*cJ4=c$TU0>!kxh*Su=Q~&2??-|HLD?yTd$^
zI+pL9@a%V2Px(9}-t`_SxLmW3a#6REi-Zu%6Vv~4f5jhpBxk@Q9f|R&h*rbL>`A5t
z8?M=1hc&Wg@JP#0RY43MDH*+v!6SKe!90?;A%5vnP9CWucEto9sV11gBL(C=H|6A!
zK2740Mq{<6@JO2>9%-2;X&_`0kJJ(y40xnE7LQcT;E}$J^GG4X)AL9Hh#Mh)!y}b5
zc%()Kk5tCwk>+=uPs58lHSY7D#3NPwpWu-~8v0!Rl1I{u-8NJsca^~-b-_H6x921t
zX_&<$mC*=1G{7Udv3R6y1R+PjBk{&oJZ14ni(&we6w<)rk!&aMNIo<1NTgVe+iQ7v
zD5f*>NFi(<>B~eOX&<WU{C~_NwR+`E=8>FX9_e@ND;1hNg66^Ik={Z)5@|Rz0^*Uj
zM-aAes8frW!XxbjJW|OxkL1_#a&f=$d=4HdkizDXo(9Kr@JM;n@klund8Fn)@JPkM
zFpt!R8Pfzj(!97BiLcLmA9ZaRh-|}H03Jy{wx$_PpBJqn9jC|1BdK7$DN#%wiHLFr
zJQ69+{%h#P9YL0o+oMR^qYQ^HuKm23%_C{Wg{9Am3IjaSK2N|Sg~aR`=aC#dXX24G
z<1Twpc<5!Szb_zMDLTDZ^=9Ug7L4;q2piWKc%%;yj}$VAN17iE^GI&)Fpq?a)ti<_
zdOm?i3gqCC0`sQlk$icg1E=GW`hTP>l(*cbijRVMq;G&nvY5}oBZat^Ks=J-St<XI
z11IL3Ve&}%?>+Xby&CDrk0QwuA|~)iuJ5MsNa9j3k3`*!;PycnX8;~a6y}jA=Q9*p
zJkpb3h(~f9TgK#(%3&U<5b#JLMlg?5(G2lO1*)%M9;pfNNX>vpQs>~2iXa{-*cXwf
zG`k{y3E+`hR&4QL@JNW24;ehttHx{Pc!)<DW$;LwVIGNkDulr!c}X&Oq%RPU<U?M#
z1c@Yci%0RQl@V!z-Zf&;!i(cmWuGc3V*!tJ3F46|63qPpkEHC>uZU&vNOQLkb#1M`
z733}7H&VyJBQ+ZMw=;O8(1T)a{fDRFkxB*UodZ156aC`w0T*36htEqj&p<p<gT0>6
zyr*_Y_~-c`73Z#e(g5*Dnxgmj@-zV+>5>NEk*a;Umuf_><*tW$q&7b%Ta{k&dVA&V
zJSi@E2Ljxe$xY^w@=w(sd>3kcFuH-kBMBfGJW{opf4|}qLDk#k&QfX47LSNS0^sc@
z@kkv-Y#vE-S{_MBC7+W=>N7hC@krk}d87~exqh|W+`Awi>51VXh(~fwn9Io{1wcGf
zMD-LNsc{mIlq+l{wfLsmQX=4yd<+1O<YjKvbZL4Xse~YXPPPf+k*HnXzN8YEM+#!{
zNF@__q!I>?bQkbQM~Be4CV)rs)sNNCii3EhJ|hN?^n$@7m8T%*OyH4@$f>$QJd!=&
zkw(OR`>LHL&F?m=LnC8Mb-W-RX?^i^^Gd@koIK!>8gwm(@%ALZBh~0yc8pb`)C@^h
z&1T=)A2ymjcGx$TUL)%Xc%<79k7O@j2=PedgB}bXsm`zj^f&1}5^fGm9!XPR8XhU9
z8+#Puk#e}V10Lxs;E`HVqO{|gJQ9At*f3R;%_EV8m^>1xK1X5_kMt4nNOcO~Um+ez
zZ2um>BjqKd%x-^xc_adw%_9X*&m$c&2RxF03&bP!fO*L~COpB?y#$^)OdiP-;*kzI
zqDT;rlyzqo8RC(Ir7Z2L=IO5*=aKRmJd!`9(O_hpN6MbUBT@YTkK`+K+r>$~8jZ3T
zDQ5FXO$;7MqSSe@5#W(bAReiL%_Dth@krb7f8vqI5r9YfSO$2c5hjnMsGF*LK&)oI
zpy>KLW`IXp#pIE)U>>Q>Gu8xsjL9Qe7(+bLAjBi(m;fG$)NditI1`U_jzpT4N753;
zKs?elh(~HjRK0-|o5Ukso|Z>?Kg{Hj;?4UZ9%&n1^vVC6M;c-9NCOa$WFkb}f{K5~
z;E_^-L!)H}RPO4%^Ge#Ma`DE%{(uBy5PGRoRw=ZX6s;)JE#>Kp5y>o)m|xH>xUH-j
zAA2g!O2ZpFcJMMraV;rk1%f7ev8+}EQ@qbdqg&*fVXgX6(A*t@cqGwEM74eee!)&x
zq`(%3CNqozw^3kqc4b{u)lG#sT_%t8E;)9Sin8=n9?9&ld87uIM>53d03K--#3PyC
zHe>NfT4*i6BRK;eX(Z@xd87*QYN15}nBaSA_SNFgARftpCv2QY@=#J9!%yOo-Usi$
z;WjOg)UJSOn9L(Nn&U4D=-?MRy+S0xJkn7UCXX~S4Ug0%v=i`17a<<$ozw&#sbA6I
z1K^Rk#irqrPEX*GnmKtSE;S~PlsAz_I$p`-k>X8e=8;^HqHUZ!QtCpIAr>=%N2--w
z$KsK$%KU*x3i&r4NrLBJd8AeU#v|G5|A9wp_#g2|wqr=`$vl#PX5b_qX|2)qnR%oe
z7Df|!q&YB;R6LPKQlKfpJW}x_9_hF-%p+Z$nMcY&&Gn3G38X1c;E~*j5RddoKaeI3
zcqCs2j}(s50X)*xDl^}SJW_6zI?N*t!aS0PIpC3sCh<saoIH|%8D%Pugf;^_QW;Hr
zY4tpGwShAi0q{t{Q5Hd#i%zq7q<TXpk5mKkNS+gUr1qJ3Bqc=-9!X;YkCba(#^jNt
zU>=Fg!6T7qGJr?QvXlslQgH)3QjcPt1$BVUBb_pVcqD$a3cw?wP5#6ql}+K1&{l$`
zQ7RM(HNYd8S&FQ-nm_zZcbrFRlm$GJNHxqO&4qa+QznlzcQTJ;O#(bpAWdZiNw{94
z$mEe;6PY|xjaf#MKH!mLXcx&D#)HlC&`%5jkCZl%N9v==)N$3NTS+l_q#C^-={aT9
zv4d7|TToYmqfB5PX&Hk@N~g-Oc%-?2M{1x2=2}QJ03IpYNQrB18sL#ENHCA2Tn6(<
z2aEuZ<ob6!k}sDUi$~G|JklVGN7};Tk=p;rBb8YSdRBeyub#)rBMC*F_{iXqNHC9-
zB*Wy99>@Y7DLzU}Bg!1`NOw7TBpd<oNMH+LoJU$=Jb_25Gkjbj%jS{Nt4lgz9x2*r
zoJSg-!Xpi!OduX<jv13jdagJ<k2Fh-UZtvS#p01PbO4VO4tS(fvP>R{SDjKx1U%9_
zm`9?jLp+kS36n>vkp(;wg~1~=K|GQc;E^g=JW?M`7Vt<i)$?*Vc%=Smc_ekShG}`E
zXqnL(gAs^FQfBZ-bFW)V!93C+%p=thb;la?gT&`Dd8B$-bc{KZN1_-39%(Ztk2IhM
zcqEWA19+sezu=L)89dT)Hjfl-G=WDtVLq8hav(uGlC`-h%p*OPW%5XX76Uv|ibOb7
zYIUVZ-b5a$gTW&WOy!YQ%^&BHD)j%2M{*!#JfAm-N9sTcq)p_J)^YGicc<`3ccbLp
zICvykE9+4axkr?-#Nv~u1D%lpxc8bSfJaK0$Rnw8@<`SU9?6!$BPE;U(WI`kd8CK)
zrsa`dS@~aO@koOV9w{8~NDp);@JJNtX?P@S^O_3%mt!b`E8vk1$S`@Nxn|)7Mi7rg
zHfQiiQsX?*kRpRenmav@lw%~otH$J!)J)ktlIJ8Isl;3*>Rda_BP}!v<=~M>EFLNK
zZ+Rr;zu}R}7(CKyEBkG19;rsL24Pah;E~GMJd)P`hDSoHaq>t53?7M&G@FS>%CX{0
z=2Dx=BXv&8BkebthDXXYnwCczn8+iA|2>bip1~v00gq%&f_bD)nqA2scqD}UR352`
z%_E^r|B^>a|DW<mf&U4Qv<~8t=1k?0wvJWn{+CDkPk1ErwDV%-^{Drctjx&qW|yi>
z`>RcoX=Z6P#)MlobSp#M1xA;wQgs(t+AesvYU~j@(!@9NOK-JPft8jY&D_*#PBhJ~
zzG`%j^&C3&`?*NP0$R#TD=}-X_jhic^tknFBmb9AH^1y0`x-a)4Ha!pMR7m8CzeFN
zY469gJv$mBC>PGFy7H1O@IzHT4R#M~6ZW-DQM5a%yGvyK;v?#AmqWjaY_Lz)@qc=0
zm*~c2Crx&J8Tlsa=aBlP^@emyVTX0Z=&J`8=aS^FZhu=<+q`k>*hz!nm7mY6pI-Xn
zA`SV>Y(;EQmunP%ByZp|%u<htPkZy#^tTet*Q9Sqkv6>GI>%)%HsFV~TE^{NqZ=NS
z8^3vG?2?`-7;f-9{qjvqqn%%VN{0G1o?`PzF|!xCFaKv#j%Y&9=hnhaS{>`S1Jq+r
zbX~Cb<i>0<dB0*#-#^1W9z4Q=r7fZKQ+9J2Bts8KzxJ>Hy6n`Ex6fW|eqNX|YtsZC
z$>zZ0fhRkQUYF9=m>9GlQjN{nm7#iD<po9B*086lXNi1w;4Ygo?<&ijgF#^lw(^z@
ze%8`1MD4`#<#h_y#qY95mz}bITB(?5CzjYFFt#<+;?Yf+?d>Ud<RX3w*AZjdwenkj
zUVJS(Hj;40HtM=U5HTb%<sEr*!>$tT2WlrasrFHpXlCqAy_hHy4}wiJbv~<N4%m<Q
zqXk{jB8rJ4vDZZ(nSO3R{K)**Pn}CS!zph|l~2g@+f|KppC)V_kt9iOR60MD?k1D5
z<m#D`bo&##Qcv{D>b$nt=Bzu%>GaYFyhXJHwKY$)!FBz~BTwBo-w<E*BfcrLVfK&a
z$C=@;_^=v#4rR@eU!UmqTCJm?N$^ULcBzd~L`~=l`K{WGeHKn1EwI^dLfAagHswTz
z!j_YB?OKL;&!lY>3U!w0$dq&_58Qrg&ebvdp{%D5HgPu{ZQHJ`fG!Mr5&?K5<;=96
z#7OU1`M-G1-qE{`KE9E>{<>pg2I`i`%74Pc)o-W2#1tOwqFoWUbvL$6M+<J$VDm^@
z@9~|#+aS#1k+yLMO1K>QVXb<G$s?8P?peI|^oqj&9gh^QtIV5d<9JW+MaHLx)RJ(z
zujc2Bk*1{!%yM^T_LQBhjbD2ER>VKlc?HYO8zn!tZ-3DdJm;7ipL}>(@CM(_85Vca
z@3r22d2GyAJ2>@gf9^jwhr@N}ot2w&LvxOdYStOKpTo6hOyqNmE}W4I&wRXCX2YFG
z`QM{2<Su2d>ANLA_Veny3)_GF8k47R0WXl(m5h?ZQ+b`ckdiHAtT{ePIJFC{>T1Ei
z7EhCW+=Ve}vB2%cM=OYR^Vqpsie}<tRGqu|+*&MW-NeUgrFIMWyIM(i;^T}ScMI)m
zv6BCdkGBx(!6&#{E6NEc*g5}~M{=OaiDmJ+^jk`{I>ecaWeXqaw^ns`+_zTjl;o5C
zMMkZT2ltBQD2NZ(+POO&&J@d4bs1RvUmoe-c%(6yM;fN^uJ%O96DoOE4o6A0dtw(5
zs)UaYN2{*(;$KIomV7!KYt-(AizL)2NPLL5TkS3S5203d<%dMKcJEoY2)DJ4e%SB7
z+D94;OBy}>khH7aM}CY@XCd)1IbpT0qP*l?JCNv_-tIehf#f~MqaRcASFcxJCwbrP
z>Bpm2+t<&Jl&trX_>^{c^#+}PBp>*%{B-<z`v!wsk`IHAe##hFz0u@_<fC0rKV^Pv
z-?(5*vVkfwLg!uMXC*Jyn6PprTe8E?W`R^w%F&S=)iwT0)=4#|KOH%3)ZxE8QtEM*
z#OFM_H32LBk$RH9^7C1@j(}CSq@ETZ{aoO`W|PMYIjLt?pMEaf)v;;am{d!p#FwIk
zHGw|z($DX%+_4J9BBRFsUy)Jvi!9O>;hh#QJhoVT<uXvoOY>ah)~<BeyvnB5UD(&d
zh3a8hux4)YnmHTSy53nQdB;mS&}Vg>k6h4(b$2(+4&LZV@prxFKWBS@PkDe&*yauO
zn>BWC^{d}XdJwD=5fVV%vE|VYW7^K3hMmTb!c1d!hdkO%ZrE+!7-5yTcgNek+KrL6
zhbY^cDK-bFVQ;DW&QW^JH2YQ2hVP<H564D4j&*{)sMYZc02#F=feforFd5~&e<7?!
ztxvLp;V4cu%0FdU;9<w-hkb_+ugFeKtT-CRR-^LL54NQTen?*flTl$A>po=ow4V%N
zt5Fg34KN%PndQd`N6~TuVLNIjI4UuJ`y@CjsbF_XVZ=l@iZ%(3I&nGS^W}YYSI+fa
zNgKFwgbhd0ua4VMxii~QFdTKh8rV@;upL!$`xM}#IPIt__wqaLT_3u4@x%R+^7`{#
z^|war|6oU5X2VgnPp(aCM?Gw-{n%FD&^~TQJ?VM~_$UBJJ?m*`d-?cB-_y=lEni->
z{dm>#qW?MIqq+y$fglC=s8<|()Zp-|U&F88ejNP%@$HAt?>>F`@bk;ZFQcE?d=wy~
ze*Kq>;v}P<2y>EAFV$FN6wks)o;i8Mg#ipQ>K;r+B~Kuu46E@<M{Q?|&k^#f#v2EY
zcJCvdo|PRd6+-AeV7S}B2RHY0e=pt{{oFg+NW%Z+b`xaQ%R}Umt{frb`eFJ3o0a~3
zAv%`bFNMwOi~5A!{jxCl6>I%prPn^NRg8Ad9(Z-4ECG;F^DptfJ{ea2N)Yex<r|Vu
zi!4b@)uInu{u6Pp(!r=N)%SoNVVBPX^Vy9)fQ%}&s#hCKReF@WD^~5S<)RVtezFgJ
zIF{Vm?-_0V12NYB!1g1e<<UYjI(@%wDLn`xqYP^bX77rMlHhGrjDyIi)52%?9w!Ou
zi&R5oR5Xr7Mp+9`yz3O!;}j+LX;_8?u*fJCyhnpt2mz2$qy15UjB=+XXdfVCFVje?
z=uMD0?of`K^UnPGVxts5MlBe2F4(7?29Z(4&NBA_8TIDw`QLe>2~uGQEBwvxH#M+x
z02!66(EZ)2Uck7EhMRLP%qL#H6(Xa4Kx9;_Crm~)=%^bs4d`68)GArf=~<#-j%=ja
zX_Ufb)EPUCx1^VLO3e&1%0i(_4JoKVC;YY^n@u;cp?6tQoJUuv^Zlw|kWm5$Q<2&p
z4u#0GoMhAjn2gG9peZ~OaE8dJBxL8P0I%n~-=0xXeZL9RD9zsx8Ku+J8`u9EBBOeE
z{Km;BLq20qh>RLQ_Unw*79G^LlF51)sWT!-oRcyt8iwm(kWr_IamIj*DiC@^*k?H+
ze?s%Y`%Weqb=PW^jceu??+P>W+g?e8dyF=djMBI57)<&saBZLhCZkTH){j2GaMzrC
z7dBT<EwxA{rX<!FITst8$0VcTkXoKhGAfTqoP*EVEFp$3mx?lr61cD%F@iM@pt8xR
zFC1jlYd}Wb$1f=XWYlX;GAhzkSQH|oJ^(VxwHlXdMKy)UsBBMph>Vhg$f$QLGRl@g
zM#=Fx<mn*Zj+0TfWXp=WCjvh?$f%eo$(9gIlS7;!lZ;X!NSZ-p)OVVgib_Uji|w2Z
zYl3!O{k~dv``sl*PnYeukli;gc);Mq^TMdoJ=M>za}n3D$S75qjQRwVQI=T_Y1Y(h
zH=mE$A}ZNrR3uu2`_dj7Wdr_RRGkyCRXS>c-06K0x=3#9?74j5M#&W)wxq>roYos#
zVVEK7B`>x9s6oHt!POt$2BE7}p1m9uICI2G6rl#ls6;?UsljB_Q$R+gvdO4-fQ)jA
z<Buf+GRjXrGW(2#F5f}zcMn-))T~j(U7Gkj_v#f%3bmfTt)h6PwhyLa8V3^)iIw^{
zs0=dd7x5p3*l3uH`phJwn&qEPBBP=Yx)S(sAx#zwm}Ha|UB>VZH}T3lHW?*1HbN^k
zZprOSg~_O`5E+$&(i>7-rAg2Dd}!m-QsXNogB8|_H4quKQtmiJMm51?l(FThOg`eQ
zY|3OZYGosBRvt`74U-II>l3fv4Q$NUe}kMi#DD!})nlC<-=aLJ&GN<LWYlknjOs~P
zaD&VuqwH<%u-5IHH;KQwH>)Uk`-6zW{TF(%D*Xr^n=l3$73l}aC?`NhS;AzLLJTJv
z^^#3SnNKF8{N-UX>Li1Va!AI`p%Y_6;sF_DjO+*%aT~Pb%`<&YJb_)K>@LK^cmGoj
zA&(fVgSV313X@UG1*jXHTRts)$s(hYC0erp8P(5I-Y|iT3M3wMlIZ6yA19-Hil{{~
z4`|h9Jh*e5WE5U*5*bxzB?*yHN2VpCz5_C9h($&@=rPHtP9_=UI1?FV2FR#>n2d6u
zbl=QWme@ab%JQmCNOY8xwdC|<R8Nt#oVTX1cbx@;jLHOL)Z1!6Mmf(*{ovy?0+UhK
zvxNT1qRRw0pv+UV_#>qO88r~cA6mp9qZYBqC~MiwihLo{sbo|_t$=P8Oh)ZPs{%4g
z1&;z`locSOjJ)F^GD=)5pz)bpGMkK&#rw#ggUG0e=!=qoj2em4e>jX(5j((#jfxX$
z7vH(xv71}dK}>$@>j`93CWDMJXOK}L^2T@;870A|<6tu{6p&H7#>uEW#UbzH64S>-
zKt`QpkWo9)Pn%c%CZR6&FvuuHp|<r*GD;=cc=0JrCyR`72V|5FD%KO#C+gPs(RjVH
znW^IP{t&DCE5c)kk>@-O2I*#IbS4><#wMfUkOR#qV^4$YhiMnA<{xK~QH$u9U&BbN
z<lXd(VGi1nt5rl_*Q#AdaqG_Y?PHKpzhN?}2lt3UMvbz`sMowpPV;s$$fza?i;Pm7
zN=7}#l@7DWC`Be2^?PPA${EiK$fy)H8Fh-kltD%rH>hq8!JFav`xs=@qAuRSq8NuR
z&Eqf`)sNG6&|Q1SYfnquZ$L(Q36cRBWd)H@kLbI@DA-KmL^3K4nHH}xSeJya(J<sr
z%yx~K@0oa-hHUD>{pcSjqekd<4n;{}L7<15vikBqDSr{)*_bOOlgX&kVWbwGSKe1p
zhrTM==>UqVqeIb78^fdYDG(X86(*w^ar$^vEKEi{Lurw0!pM9&6&m`0jA~+$QQizP
z%8o%s4dAFfEHa9QEO@CjGK?g{WK_>M8Kv)Ow8&P#27$(1Nr{#e`Mij`h60gM0mA}6
zSY*_>Nn}(u>e5A=1co~mnRfc3dd*ZaDw|104YSCobDU%pl}SeFbCOa13^FPUWrN_>
zr~8L1gs6<UIdWSBEA=|?eh3m)#lK3>4Y3OAGfES4+;B+s<QGYir+|#g`a3ep``^f@
zM2L)PCK7!p5E<1xoTXBP?Qh8H2V_(>Z$C^%6*I`FEG8M%1d~xw6UnHvyzg0Ll$mFa
zXm`#IuG4e9b}ip6>v%SI%lFekYPnRM>~!H!6;i0U*6E#b*Z@FA(RjUwF&CS7EUmbo
zb_r&Z1>BR(d)Q>uD1DraN+WX<@+Oc`Kk&TnfQ+)?Afw91$tYt_p7LSjR}9*nEI_U>
zvG=ztCJO|)@k?6cY8p_oaRp?0!J`IT2d{ulk>0l8b7I20Hgv&?1{E{1$?z~T=E?aN
z<?~Ry+yzP;WE7RxFj1&B=t3<qx3dc(qnam?QI_LmR1F}b`f%=ulQzQzq8`QfhLKlh
zkCRa~3^FR^4`h^0(M2a?1{pQTAfu!qGHMS@MkxpZGU_QzMv3qTUf~n<nURd@WRX#i
z7-W<_dCeA;E89iqz2zjM_90!$FOW@gKlhxr54z<1UC4oaCbe<jEnA3;GA85BG03RF
zVdR1ADP+`=e<7p#*ksgVA@e<aPJBWe9R${pFkCs9N;-p#`p%b$5UMRQsih0{5A*qq
zRs4yJG9wC(a*$E;9Snb}V@m&(jOybcqrO9AR4YtIokb<ktD5mB<T*?+-DHs`I=mm5
z;xHW<<vdPCjW+xX8P(4sqxzG1e1@}2DMC~P_q?A~PRGlf0#J(_CX!L7Au>ucNc|U4
z!MF%_4<@7B>8S5+Vv(l!!vdDH0^!F-sHf>(4#UX3fQ+)3Kt}bm$*7-5C#fCVhHfZb
z$F4<!KiD!ScmDTuh>Yq3WK<i^Mv6-xAfse>@BBpeu*oPzp-u<Gb9BsBKt?srNJfoJ
zA*0Iis9c25XD5h^(rLKe>M8h*Pe^N+gN$;7$f&gG$f%cqjFRHrB%q>$=K*BYMmokx
zif4B&rWT>BKNf_3dA}@Iw0<Xb8ZzoBn~dTUT6RFF6Od7x1#N;Z8FkEh%O<1FP9UTD
zS!9%hXY((qCmYRjOYuBZiv`Y(*+L&`wX&YMaQzeh>uH5B57G%Dquw-Rt2mq@l?%z1
zLuAzPA|Yfp>djx1QJQ48=m*lbP(%s795E?{2n_LDQ`U}MEehq{S2s7J9rb579!6UP
z*(*GjrJfd5NRo9d$5?c%)eviVAkrk;7BXgo*WJ~|n=MrFeF_<6fh%o54bp>tlk;N#
zKt|;WcoQd+QN?UBDtDZW@}~R+8P&~8ZrI~MUQ>Hk@1SHsHQ)KBM3-}(Ofsq*kWrdK
z^@9aS1>F3Ko!hftO6p3O%LyyD6ZKclKt_H28#1a9g}-)L@EivjmCYifUQZ#TUh!@u
zbLT$Pl^@w2n@Cx`!W`X?!}y`yS!7fuOh!?eWK<eyvkqcO#Cq!B`Zy<N>J30fc~2mt
zGXIT?+RI5s3G@B{WK<SJMmbk_h&ZW7=&5gYUBo7%yjf(FCjF0OR2En}24qwgI7KWn
zN)vaoi9tr~pFl=EokB+aCUduPkWs%`WRwjNGssCs<#Rg|71~-%$`s!!Y&9}QTsPP1
zmZny0z7&)R$fzt1GHNw{4<{KVkFwf<9#h8)_8^lVkBU5eqDrkG=C_uUxrgnBv0<MN
zi5%8JsH#h%%v2W6GeDIoVl|WZuD>9^w>m>n(v-Kja>ElMnY1xc+)#&;j0!~gMv9N>
z*PygU`Ki7s>A&b>L)W;oeqp(O`v<2bTus};!~JV285K8~jLH=FHie8jOPk%8UF)v0
zyWX{Le(VBS9m};!ZcQ)kQdM0FeV;e=ElJZ_|1ig``PI@4BXM_8MQj=%qrR%1$bTou
zr`L1c@xzs~Hn^oQ8I`3s4H-2W-(BMjlTker$*3Lf|HsHE$Nu42ytTn%r7sn1ATny#
z)3l8-RqYHiD!c5Vsfg{%ngfcf9=02W4&3<_F!#Qh;>Y*KRkJp(mHW2qWn&8V^@|r{
zV`)iN8*#66(_^nHHb~O0`gfXa5eQB46q03-QA^X>P_o~WngJq!v(~KSPT3T+fM2-E
z!AhtaC2WKec22gyuDJAJk<4Z>yzB%r3dgN**jd|l_E+tY0@-7!+IQz{yYz9fhR?o`
z#hQBxoGv`0TbC@+-t|-D0;#sOq+az={l}$-y_f9caL->hJ-8NR()3XCL&1{eTHmf8
zHZkIVGEPRBW@mp!tMezKrPq9Hw0)5MxM_*PnvoT0D=jScxk6-={UkD~i%mwofXJv$
zh>W^3k&Fs;q!HJX?3`unAJ0fe=_$2Em;y3NW!NaYWAl@~)Q&3%mu>bN9_a3zA9;t{
z&~xvH+U-XqANSt@WK@8SKqSRs)GcD((ou~sNI};w`zt1C&kxMM?INT1MInztMm=?3
zoSzGmQU2p()SiayxQNqw)-V~R6|#1_fb5sz+YB=5oW!Otjev|gGnI^rfXJv_B$$j^
zCO4IglIFhtVrBS;I|Y^hDH*jrtQR7q&dKlQ(Ybpf=F0>!N^2R5j8Y^S0WxZnBuZ3a
z5*f9<0wSZVxke9lSpYJs04AgEOVxda$f)e<Eym<EhlW<>Bjz|z`30JyzU$|TC?r!w
zbBGsZT+5Uf7DW{wj|F7ZX<E$yZvK7hI=jXF2My}!L~`9fJk?IJA2%njYKF-u#lU5;
zd^z1h^Ys2mM%~v*rPJj6s@Y@|7$1<Wyn_!d7WVe*QSBqf8_<W5-uP4U8jq_4h8?s_
z_cvl5jgwLRJT)J8=kRh5RK!vR2!?B6GU~Xil5s$Bme!19)cde_gV<&svDCzUzg4h&
zfu1~Ko>ii@j>w*)I%ikA12XDEoN&^os9EtSp3Ax@zLy5H-g?i8WK=ptMyYMhn2wB+
z4Lf|&>0Z20h|SVPcHIh36l^uFjG9Nqb8+MD_pSKu56Gy6f=$DB%pJ(~VrP?y<k9#A
zfQ*uir}EiXo>}&CWyP+`qH(1#8Rbvz&RIOz)ozS!I+E?2t0m~PB<|uk8TC;}U5QIp
zsIe0N(*h==YHI|DpON$G4-ti8{P<S!sEXO%k=Mx^C!?Ci$*8mAWYoe+k6ykU0i!qP
z=0A^9>GF(OZ;0m8a$t~AT4iKeGeAbIM&QQ0>0K-`YHt@xegYY#Zagy?Md6aAZjRSZ
zLZN5*_8n6T&0X|r?m@!OFaOL9&0EBSJUB~c<G+wm*HHq(16Wgu*#{yn0W!)FkWsUR
zzGgpDYn!(<vT*_#<q<!DjJiBr$snU5EUM4;H<EOJ#%vx=6tymDR@N=Rn&bmADh91|
znu=P+B%|I{2p+9CB{9Mzql`Jps4lEo4}*;I7)}6WRHGoeOHlt80>z(9Ik^K*rF<ja
zb2|R<jyV|_`Vx>)qf9c&SDr;i9c7YH`xs=@Sq2%U6v(57U9+M2Sh}(h!okfhPN*f_
zU*&)_0wKa6qlR#PL?#)<OXF%l+GcbiiTn2_EeWz1C!=f`WYqHt%&Js~j7rhb4CZx!
z$f%p>gZH=+=8tfYQLPez{d&elS#k5rs%&l$tz<H~Pg!|V*<{qIUc%6#ICYHzKL2%5
zOft&P%$b57dm&5ZTDy7h$nNrosbn@8WjmT;z$Bx3RA4g7b^;mI?+24nMO=6#as|?s
z93@Mq!DLh@Afxu631k~>4l*hbBBSEbv+8!B!$E3~4DnteAfvWcoKp3TKybV6=0P}c
zVFP7k%?Vrx&7f^$CK(lhpvtX5VEW6*e3}Rfmo?)4BAfE2T{SQnMc|@b87HF(SY%WW
zgN$nQMBH5j$f&(Mp|;~>)Mq3@H`xH8@{kuXN^g1CHCBU@!Bgdb5(hQD?m9@sBjp4k
zGO9xV9+Qlc;zC8wV~|m22@Eo7Hlj<UWGmGm2ar+mijoi+bt`DQ2s-llg27+!X)j(~
zdmZsUat!gF_AvZ4%{(*+gC0d_T)dQS$tI(;LR}}4QMOe1Mhdn+MaYwqa!s$rDh`lQ
zvl~b!tgr-_jPhraQPO~n;%Adly4qx{5`&DAWs*^5p)D9h8H<b}aEAgis*D=B=}Mpa
z)f3l@=2)}IDD6N5#cG_4YNv7)RqWbbA?3rpaw-{>j*-Aqgu`#FzJE#BuSS?yEIdjk
zQZ0Hu32y~tR3I`G!HuXu*eG!Y!(@~S2N~tVCZn$TCR4e<5$M<3`AL}X6W2PKn_4v{
za>bNiK4v?6t(ON{I|NcChY%w1^9X5`<~4In!bQUX8Ra^ai~_PfLXIm=5Wk45cvW7*
zLZ3lKDIqBHhEjw_5yX^A`Kw$gViXsT)>Z^XmFLiaiRo%I#fL#gDG_X+ny|^JPaI^_
zH!63RFkO9-=3@pKMdb>$hRLXF!Y~;{jZ<u(rgrm%7fm9gioAF%%@7nB+gN1=870*p
zv&$N5NsC@vq3sXIDBD;cKt_?{)&erhfqSDN+QlkPegYY_7?4rRhB0P@don?kwQMqq
zfN_DzsQt9He%IEv05S@($`vA`mJp-%_$-i1K%m0ymF@1A=2(g@F+F4rlTk}TDd;vI
zn2eem$|j?BL1dIKeR?vAB3@T<35AFVw<+*h;sTRVs2HA#axTQOjhtkZ81^CxfhJMq
zj4TWI7s}Z!4t{Koz*B?_m-xeER4;>!>Sd5oCTudQax);KJUPjz<)JE5$fyCX%^$E^
z@o`bf*rkAsBBTA7WK^0M0il$3uSN8#oG{h{kWrF=j1t}m$S5N~MjhS^$S5tYvxi0e
zyBtH40U7nccN7GkLS&Q&Oh!q<WK@dpsFUpkGU_8Xn24Fz5EIqFAfu9zCfgnBD2=+x
z62UAo%A*V|HM$`BM63t`A(VE@d|tL*>7ne|i7pTsbrvF{x?)*ml*B5SjQS2LkeX{{
z805!6Mty+DD95tt$S7f~8XmQsgbs6!vGt42K%iE(J~8{e$XicY;Mz*tdn-2|QSga5
zOm)ruoc%Q5?NdP{8WV)TbdlxkxUdeZx~ykk+D5^KxoB!}m21q#J$91wg2^aRGl-0`
z4)#L|hM5G*U<iPWqEmevXsTgL#zH-5szFYnfQ;gy&enUT{q1Q|Ys@m3jPm|VGU}PC
zA>zmrgoPxPtKUd$Pf0Nfff)j16sQS@G@lz@|3*gHGRY{n(3!|6D%Ypg<x6bc+>>LM
zkhK6A<&%cir;n3SA;VN831PFwLz&m(`7lN{h??igs|U!aeij*3%OImDTw4Jdbq$bF
zq>Z**JYk42KF?>DBRs;xpUX);9b3$WaYbOr7w6Lv`XnkhouX<Qi-XB1K^7TBg~_N|
zJWNK(#$K0YlTla102yTk$f#n~FbcYXqRuU%56CDPE`2~o)c`Vzf=|1rN=IOe-1sk!
zlTnUS$*AjG2-;Py_~OEgt36;c>K7MR5aN-n*h1kBNB@N8le_^04l=5iNk$P!<ps@#
zlIBaV{7NZ%E4)Rv6Xi;&v5FIe$*5t>MwpC}87HHRL#HF7JQ!ruLWqp=*jneYk;27g
zNYUQnO?1?$Xf8wYxThWV!SEFCQ%7X-yL-T7l+{dR6h#ywqn5b*iHwSO0c6y9?)435
zHDXLeGA+b#O?W@n$bmsdtwdGDGsq}<v?oMH@vj+%$*3McMlEBIQ8EMyzW=^J3&v$4
z85IJNQD%X8Ze}E|MKPsFe5Jtf{T5WT?%IW@px&_)eZm+#f`G?r58o$_QXc%G;B342
zN)hI-gttOu)I%?lf9NDKYB)9|tVE_^A{m8=5qjE@^jTQrrAH_t+He`y7kjQ_3lXcL
zDME`Vw@cl!zjy{B%t9xTQG-;)7DbOI)Dymm21ul=3i6xR8;@43S_4<&2L>5cfs!^v
zUee?xG07<YO-wSX8P7xEaz)6u%t%H_;je1^zOQg1s#dYJ#_G=X8+YQ?_Qs#?Pbl1o
z?n>GJ`~G$ALu34efgS5jLmSqw`b#ouDT9o<8_kQLBAH}VkJltJiYGRB-X^<X71;{f
zECQ{spX!c4?(-^WjzMlG2sw3e?Nf-Y_!5VDMnz+hzt#dWiZ`@{Nk+-~agtFK-<ilL
zTbPVOn9WE=`GvB{sNYk_s2kC^vXH32M`H*IVz0!VXUj}^T0XuSdKsX@g{BOpiHWGc
z8vN%?m+H^?;_-oJ3vF(rT74=ogf1hou@o!uKKz*Q_oD(UZKIx)@?4aNdqtwj;ZbYI
zT>8dQT<^IIxMKksr8OKHX$X-~k%Z41>(nBrkWssesQOjoWR!o)%O(Bg9Ap$_bMiPD
z6=J*bti8$Xx(`crDX0n#GHMfbj?G7drvu5CCX!LTQ^+V~u7SXd8bYm@wZ$PY8TAP!
zqZV?IQJ-Qh0U5O{wx$<NH;YzL$Le#EQDm%d5RySg5yVtzE`W@3m`X-%-^wPV92sO(
zJRqa^fi*Rn7!xs0Mm2Z=GKz<KRReKaKUnNw-{6{yhC<z!1x;5knnXq!>Ca3?kvYgH
z+aOLdiXv=?xct)ule|`ri~E?MS12H(h+KRG%8}P8^KqZF7O==D515RS#^@J4$9Eyn
z$u&6wrY}*pd_*pt8=DmdATmmxKoP2=b}XQ524ob8Dut(3<PL7G0Ay6FDvzniC}Qh6
zqob)|N4L&CcILo(0(uLBjFN1SkdEh)Ez4bp<dIbg9DS2jD{r}71)n%T9p*`t{3WJ6
zM8$FQQBCn7L;W8VZ9+ZDATp}=tYpCVZx`pB=}kGTy|JlaV0k;g+ThRbtf-=sgh+Cr
z$h?3Nm8P7<$9C7mPbH&VU^2?Dcrzl#7h#;oM~Z^TsN(|oB0*UtKt>%>As)4U5(3C5
zLF$+$gNz!b+=Iv{)yxt=Mrj+vWEA2tL`D@^e1*xVR&RVdL`KaAWR&N<XZ#q9SbSIF
zSul|0i6|4BO*v~1$f$nWLqJB!iwF>6lK>gDAak(s+II#Sg(zRlMaFD}$tW(RPzD)Q
z36oKnmw=4&C9el$6n-)p^;q_~l5!ls&d|#PLdGp!2@3+~2=p9>QJ9QMp1YOkYis?h
zpnv(k(K@On&Qzc@)mCX~ONwE@5QB`mgcIu=ZJvgV>N_y65Rg$v3@(KaJkhmrP+m6w
z>`+__uF2jd36N1w_RaGV0%TN63q(d4TLChv6_8Pv4FMT-2N>b=qSxv{WK?ohW@k`H
zok}11NWJoQM2finfq=v$IeD3)qet`4mY=2ZFa4%gFz3d_+JhfMqYp+mwIFKoIs^t8
z^|;zRV06WO0YFBjN*#Bg9#j}6WZz|yQP~x0S2}k8*zD4E9gtDBls%f|D~+cmqjFRV
zATr8k#1mauktEh<o&u3kzd6aMVuLdf8MPZCqgu#K5E&K5tHMb}ZGp(B1k|I0l~1qh
zJTm)XDq5?-Z>CFYCR^w>*{xcCsc9+y+mDYH=6{F+WYppZ5E-Rt2$4|>teRd<Pezpz
zq~FLshR7(|khhXn>8OCUy>1o-BBS`Z`AR2}QKfXx?4G$08I=aeC{sX2DH+5o0W!(~
zkWt1AGOC9`M%|=FO(dh9$f<Y&GHQ|QDJ8K{vENGSd4P;Ezc0`eZKmVjR4t(8UwnN*
z4XOK}ym5U{vL3mgETE+^h=|s+>>kUiR?|1NYBv7`$SCutL4b_1mh%Q=)V*M|tV+Fn
zF``O<Lcy&Wp<_Q-*&1B}{mlZ)S?-=pGHT0oWK>=jHVq=9F2(EwWYiBpMs-n<I>`_j
zWs6H93y6(Y0y2t+Z|!iDPZn9oCe7QLq)pSRe<|TKnk|}<9IZ9SV!vHly8U-A)GR<o
z{RpE9d0Ov}pm*_{OGcUB6XxyA@8{McjgwI+Q^=^SicK-ThZX=bDxe)Aqp}rZt!+$s
z8m0RP@eDFbz$@OH49KV>S|}|CKt@$!3Dyu9<tSxo6s4)Z5hI4~<90#!@H-6vGHNk4
zfRbYPQ;T*itmHUPV}{V_DP$Cl0?4QwKt?smSBs%6es&AS*Ld2Vv-TEv49KW@Iv}I?
zjCbr3F)dq+wP|3JQNIBhl}AEFzih^9k>dsP(w8lNw+x&3a}M7;tW$SFXwH^XO0Uyw
z$dQ1I`ceeQD5a#)HP&9Ux=-n*`U;BGEEg1wxnsV?_na$}jLKEWR#frb)fpCRihc%@
zQPvhF5E=EIK}MPGh>Ox1%93cFiHzE$r8_MdrKiOpqizB+DipC#^{(XvGOCfw@;X&m
z?Eho$&i|qOyT^ggm|?~~cCv3-lASDrv2R&YSt3hRwAv~vnK9N<)}m6DR4SEF*>@t!
zT2W$bp(sV7#P^yR%UJVX?)&@s;r;`z$Mv{=Ij?iQ&N<H`dI!et3)cAURx5T#<}Agr
zR@bk57aEKBuF#(k)fjQw%DJ@}!Sp?ZPX1&YkA-J;m71hy%)RzL*{8WL{Up6_Y<fRv
z@igysq2%$bd+&!mpXPV`mh>s--0dM-pTgS+_DzIR@X$Rq7{-%Pwse@2kkD^LGRo5%
z$}=n)rZ}Fw3K_-WD6}#eb(}y(ZNmkuL`F>kWK<nf1p>RJ0-@pSs6}(syh)t~Os?!x
zo>I{eP*%YYQ<x>AMv^EFiv}$xqiXPEl&HJw6*kt_;iu&_MbD2Ge;C?E@t&hzHz4V9
z*v?YH3cic_xKf4-ARrlagiD!M$)zE%)_5|?vP#|CF;FlEbzD~yDm#Tt-U*OV6QO@3
zqY(6Zfn?%Ie5~agtEg!_jKr-4S>K|!(aZ0LpPVJ5k~36y3+-J-M*T<*FLYW?MwLOt
zab4t1%g87VL^F*HA3#Q-=Ex}IEEzSioQxU)(fbTwT!BtJS8h{IQTW~?FW&7uuxn>O
zhpwxTB}3S6e%+;HR1)H#_LD_q)azL?YOJJBTECP?Mtvo}2ar*_aZEXzD#}!FiWW&-
zb7T~9bu!9Pi>U)oMq$uoev)54ok=H`Q4(29M(Of6&XG|Z+-s0gd;Ua5DJ~_WL`SCg
zP;zV^?|J!q<XLDz{ZU1mKao*1Th<_>a9HL@KB`+uk6leq`n~$nXWD%DC9InVyo;CF
z@EX;4-N`;a`f*(E;Y4`QtN6!k2>S@cPuxrMnX+YMRGp;v5;BTMrDSz7suZlUh>Wrm
zA(Bz0i^-_X5Md%2Rl0<XdaFt#qYCHAsAOhfBL4JCGsJG!HcR^NC8pU}5!ZlLAIQc<
zWK<i0jEdL-#0P+kawU*aq2+ios<KSobuk(BC_sWpM*W;6qcqGhZ%USsQF|AWQR<;9
zkWuOY8C8vCvB63ruuA3_JQ?L1py{KfcXytQ+NwNDMnTyDGRk!^88x&T8I?*xM(J*z
zC8I*AMX3#3Z)y|}$*9m-GRlC2j6!0$P^Izr16X|mM4iZ3%=ZWZWYpvW8HFT}QR)qN
zG73pbMkS$4Hjtk+pQ(}D_Th1_U|=<tntiW63S6DrmzlJ$KJ-=vqMSyDObq=RPe$pM
zF}OmcN8%J_$tYID6ax=HMhQUJg}|(@182!79U>VOv5bs@$^c}P4@3-vWiQYXnkA!d
z^Usk{>Iu<X05VFHNJhm-LU$?yWK`N>GU_{ljJku}U=9w2i(<|MD!O0YSY00cQ#<4&
z<f(4}l1N7FB9Kwn=E<luJQ;<<9=d~J#o@^)6)ucO8ssGiEJGlp7&cbSl2IxE8RhsV
zGK#D8o5W29*HSzgRfzWX43q`PsGsE)WSYL2Lej^z7*WC|Q;mVRWn@%R$yra43ZL65
zZ*P@Vl+n1B{g}W?7JwqDL_Df=j+)lHZwR>hlR!oxAw67RW;l_I5=OMr^4RInN0Kqi
z2WXgsV_uPxQ4x4D3Wt#-A){0mkx>T9bs(O3GU`rw=EqqwN(CUJP^HvkGa%-PWn|PO
z1W6#H)Mv>k8zF#<8bB8{1wPhGe`1uLeTCMIa-%Ex8}alqF?H-588w6_qe1~Pss~R-
z6`>==YBq&p_*+XZD`?RVpu<p_66_dScTOY<6Nb5vbR5bvf~E^4kWt+L8FfPzAfp=Q
z$f)n-crr>9E15<@Mop|tMycagBclS9KoEhiY#Up|sfHp%3Ib=zsGmeKDv)1(CUT4W
z#W^yHh6fs?K_sIp&?*2K<x5IN-BCodQpG~>WK_j!WYkp#s9W2|=4jEdF9!%@)ZGO#
zN~NO2jRS0^)41tcbq2##4WI}OE@dwL^seiDgE~}36Co4%kh)h#LkA$EBoPQ^9)OIh
zM0>ofkTd|us76+F=>}^}#&jYXr9&V4fkG4Uv<s+lV!|f1wYf0Ud{J*7+%Gb?TjeRi
z{gq96o{aj4-ts3h3L%qlS#k*(HH@WBD@Wk2k>5O0z2WvSRVB?q5;E#l0Bx(~2COOj
z?ToC8UmvJT<-7{ubs{07#0X^6vqfYS5+I|Z%CvGyCS6TKTNn~vNeRf1l2L)It!OQD
zD3Odp7L;!&nJ1$zNY<el8W^S}A|-!tva#q;UX^}gApU(^+pThrjQU9+qe1~P>bwF#
zMzw<Cx~MV)qH|M92xJs93zDWU1+^vLz-q4-qo9sP0eZ{W43^z-5gDa^I$Z@Iql!@)
zcrxlX2^n=r2v0^`SdENQp{bcCqtxcfDAxemL-zDDz-U~Yj+3NsP^N}-z&#w1j3QS-
z&y!K+G)OFk1%|GUl{sFMKK_9wJgWk_U8C<c*_}WYy^3v8S+<fl<>+Mvq=Ypua;tP!
zmmi02tU%N9(Ph}nhUwHZ<yRwI+%GzX23H>o)45}-Ef#J7J+H%ns3wq6uG(8q1<<w7
z3z#&Uz;%QQK*(yyR0=4xnn*^~gFdMd$f!?fy)Sp8p)pd7!xZniRf|EtA1HQU#;075
z@y02#DD5BOU}kOw9ih&mo2W2tk@{dXfXzV}OI3)|P_i6)vT@W@=cpp*B!P@dCsUs#
zqo|n8F*mOtkuDrX4A8q#X3}LtsA5Z(l2Ok}wtZfij6&kcC~_9`O?~So#w`>21{-Ui
zUsqX?jG81RqXMZzS0tn2X_4V>!;eq-vxJPyP?a_yGLJaYx|PzTD#oS*WE50}NJf3e
z8kVg{MvYT5k57)HS0JOh7sx2Jb&^qc2xOEd_$B4O-5q=F&(hv>&byPSa@Urr{KLWB
z!5zk+{zImB%g%aA-_E<=sq(;|cJ#Ak)(dpB&tD;<4nmkyqgNoKPR(Ey>QFRwsNc+)
zJk5$$2M_3E<MO_!7XSFge=Jb{SAGdSvXrf$lowehQcxy^EZ<U4u7Rx3FQ_m>R$3KQ
zIv}g|7gQZZK08tH%pX}DQcxX%tcfeANkl%sUGV%Nvi4~~Z85U$SwUSr^2M8i7oEtL
z{RJ<-AnSh=)XyLrV1+<)dm~$6Bd=PMNMVzdTJx5|W(~C#{lXSAwO3Y!uN>4~?=O6P
zRPD`)!Z-eEts#Z25o&F5g>8vyZ*LdAeW>>CY2mwKwf1L)?e%K!-xR*@RO{$3?D(SA
z`J=FNMhyom!qKaDu@!aks&|VNbxW!DY$@u|Q18_*>NQjEvnuLym{I?*zv!=!QAL=q
z+G@R6{a&o<RFP^0L_@k#Egq{np{){*Rgc&CCgra$G@}$=u3VuVtD~W1t?_xke?_~t
zQUX>#0U{abKQT(CDp9F`(AqRnzR^WfJ|4=SQLNuv%2YQq^$wt&4K?a!)Y{9Z-sO%%
z0yQuYN>+Ivgp*bfHHV`21Y(a)7!yE7`7k)^o##|OJ{CG+pW{Vd-_^bI{st+#oS!xY
zdTAGnO>9zxg><qUuZtYv`5pF6h(;sg_jP1$oD_Xxgz;s?V?UV>?6|Z2j^*Q%EHei!
z@7v}c|DN~#dcMz3c<?ngPodK2D(E-c!IusiC*J4Xe8qO(HpfA*e|L|t#BgoA+`*rm
zZ=UaP^54Qj-4bS;lrL_^_bWf-Ak%|Wkjbyl6JBRNGP#fX^@;U)OHRs<cCFVT#_{=<
zSMSm$Y~hr8(B$CzWBfO#k9${n7~7UJT)yAVy265~pH3!t^}9<wtYDE${Qh*>=rya}
zz*RS`9w#b!@*>;~iCl`8*}YOcS0qLoD@JeAn>41pn93bZnF(`%%2JfP`Yd)g(f90?
zbkTiNmqpHzk?*)rMzy&B$X^xOBg^U3V#QNET9x;6_5W<_Pw@Il*_e6pE{8s^S0JT+
z;>-c}!C+Op0!T!nK0K`Inh{*)S>kA!pn=*rv`qLMa_W%~wbsi!Lg!4T-1;cx^GeA@
z{Re!?E*wzw6`=YhaJrXEi$({yKT`D2zis65T$aoJ?3I!7IWmf=0Y&~jgts5weVgZm
zQK}@@ahmeVYagp*p2dHfa-(Pp*f;6H=M1N;<mI=06czbnYw``*oNt#S4E)QgQ!bzU
zfZdd!kZ6#R<~vo>N2yhCT419Uge$gn&v`Z0HkXULE$g+)IYfn`Qk+{FJ^0S=7q-vt
z6Gm?B5^&vK>CO+8<)!q6zW<?^3^AMd@UE^_;*7`sqSLr6mNz1SKX1Nq*yQDGJ+qIT
zCmt6-tIpmPC@AhN$Fw>B_RRqt_rM0bDhBwwt%tb=uX}mluZoTTyiJJN?{q;`;>jvb
zw}SnbeSch^{28Ti4xHuF`+Vc1a=&Si-!#WSQV`D-*ADh^k!$XC9?z6Bg(TDV9QLva
zE9Uab)nhmAQLbm?=l^vf(yR*dD$zs3PvP9DJumlsm^@VFn*isa$r;ESF5>)B@O^sH
z^>czMtm8K2U7wqF;gq+9F(2hA^(*~OL)lLKmeDiN+Q<K?$g=8^+2PA?&e$gHYsyJs
zyw>`b^Lxuqhil(oQ&$!6wbEZ4*icTMB6zN9cjvVq9ey+16R7w6fpjXp)Y{*07aguo
z&V0D$f97s9&!g0fN0W<rehoeDy#DKR;S8RP;!T|T_CkaA_t-0k#NXrZ@nlqAV&e4A
zVLTc2y)$uUdX|hj8XXc@K}#f~Fih9n!*B4wJ<ffGdR}OjA(By2vJvh&;wp><+cck-
zYZAyPolw8ePIQ?D)Y7*~D_?atp4}lT!1WdJPNeA7S?MHxYjHdorKF)(C>>JQ5U%Rj
zLwDkI3gZ>GO2NBMVLuWCsV~8GS-E!TNS$E_A8OWD@_r>+tK%&6yQH!!R*By1ciHxf
zls#O7*3X8|KMKE)2aEiirI+X3BO6#9Bpry6Rpnuf3iIxmK?<Fq^Xe7U{hiyW?DL3I
z*Pb!vato&*d2|Hhd5FDYnXa?EjnVe&j2G|h=o7bTGqNgTy!0rxPr}W{*tUZ)F1Mvm
z(zngnVVW_%lo?nOY_rvwhv{<7jt{bz+qUjkXS&iD`$7JWjmbfKrmJl&9~5)jOpcym
zO6X$lSE{iw^}5b<ZE#1wN?V)hi6W-!Ut{}`gEnTTI+zkCTl&=}+syo@nUcUP11QQ}
z|0APvN?AU;huPZo@UZ39?ELI``JG+AI$K`j#n0Y%Y<GXMXUlJU_4#=2yWL;TuoZN%
zeDSHVwIBT-8MQVUHM2SyHJ*9-{h|FDoNpU1jc4E4efXdQ=exGo<4<zmA3o~O+1|za
zBd2Ef5wAqf_k)%{^4i`XIZ@2n@%7S=g2CNKPjzy3PQLz8H2MCh{|qM%%r;R%Y448Z
z<?5oenkeJwa1YVo>Sl<Ws1URFIOo9C!|`UKO1Z-$!k?>`pKY?*(B3m9k*iP4YVx^F
zhi6<d*9V!n$vQWCudAJ0{mO49U;1`<CC+dSXtMom2($OT!OJ~pX!Wz{a)<YA4epQI
z;(oT=u|Iatf%}uqo1d?9JB~f{=N@um`_)=we>^LZd)UqD*W0#^<4=pZKSMg`;2{1<
zC?yp1f6B#rxLf4EhGJP_l>iqDK(TCtXI-q%A(})K%RWqV9>sDxr_*}QY6*(9Khl`s
zVmY-&I=Drd5JjxRu}e{`+wm9XU94kQ>~gMz%)3}8ukX2kJqDNPwVI1XM6s|p4=-`C
zaJSK;X~$PYv4|p8)I-0Lhc{v}{CgjrznD4eV#Q|%^<~FgeH>Qx_|D2MR^Eb(mAbl%
zm0os@NMjLEtcR7!%U!G|BrX;a#malJ#Kp?)Yb^iLSUB1Eq_pWtWlP>XjkThSRrj`h
z-o<L}s2%HUBz3Xg_BI1977@kj=%01502HhHBi_ZD80z^j+%@>6Z}Q6ksf#r-Ht%AM
z{m;dES(yLh3$Fa!46j*H0jZ1C{0A4ymEdAk5nU|vMJ|>ocGktB+J;3aFLSX3@h;X4
zQWtAFsW)0<1m{AhTutI)r7|F^Gj1~2xL~U2m%3O%fQuzL>tem2Hy<A)qmstESkeIP
zw7QEm7|T5CV(E?mE*3Bf0=QVc=5sFASG<dbB)V9Rco$0)aIyRXwD2z0GrWtn5AR}`
z0xnk8G8fCKnqPQj7mFG1V)YVSEax!UaOP-JiAyD;1Q#npnBZbX5?!o>bF!C6T&!P!
zi<JtYoOiK8gaH@J9PeU<(<tMx5yJO;wl8wAtmj=Uxp^1Mn&4tNFLtrUD1}-UTr5g{
zNA_tH-o?^OYFNd^N?FOpD$!o%Vp-!|EM|-r(Z!M_aj~pPT`Xm5yo=R`cd<$V7fXvh
z>ZQNz7;Tbp<OGw_yo;recd-u5xmfB8E>@)=n;zg|IWBXt6lPtlzF8OR65wLpU+iM(
z5nQa)ITtHH+Irr_N)rA{F4nyjU93jNMJ|>msf)#qcd=g1x>yRUxLBol7wh6;7YlG{
zEhw4|^#7KN<%M^#lI-SOEammOSYBAP%dCsV1h`n2&iP5N=wflqx>!srx>yGQ7mJGM
zVpT13v5fSo1Ls_<{fk{JRlJL}dDg`$UF>27khoY5>vyr9&%0RCOI<80f{UfR;9?!Y
zyI8RhdBDZmyx?LDW<ZH9mf|88OLkQks}#bPH0NUFaLu_`?*b&|T&%$rU94|m8o7LP
zE|#%@*sP0XMCxMo;$V923oe!xiHk)}>SA^O*~Q`}x>%th!bu3CizU0Fi}fpzJq<x2
zhY;jGLU6HS%-}>9t9#DHGG~2@0bHzVc<y2s>i`09v8u^)7hJ48X@HAWxDFSqV*M_b
z{H%-BKI>u`uI6HC04`SV3NF^3^|)Bz1sChaG8Zd~;9|L=02eEY+Mf;YV(C+R5?w6a
zITuTaJF&!#PJIOzD`?)u!jiaH5Q2*pIOk$nEx1^(xaM4}!+}{WL>H?LH|t{Q6J4xQ
z^3BU#tSgILEM@qDizREIzu9xKi<K%k<P_<NY(UJrSo;Ys79WX=wUflf!Y;U2Hh_z@
z9TH@|f{PV|!@F36NovT*Sr_XPsf$$(QC{X^>7prq<H)rBhKu!M!NqExcd_JFbg^)A
zE*8@|Tr3dY#fqGFv0`RjEM<a=g`9J-bVn!$7rR&ri(M>@#V%H&^dDR-NrH>j47gYm
zE4Wz5c^8XuB^L_^Opf4PEZI31OBOAAX$AyQAh=jZ=3FcV5G07`Vm*UM6I?9W5($Mh
zT&!=4T`U}##xfU6f#724jX;*TSgvchSkZrSv7*;>v7BaIEQRGRRun`JM6U1`T&$>n
z)5U7x<J&`Uv0Bz}v7%;Otmai*tj}{U7IJ+qmMh?5Ia4~}D6-0CU93bDjm>H<)+NBj
zieKzvfhcWOcd?Ys;kh`nAL9@k6ph9b7pnyCVrk5|Sb9Vk3rwj;aIuhpi-jX`v6x9*
zET^R|R?DAUEE~`@J)(<+BYVoY)WwQi!^P4ATr6>di}jP>Vo|T@Vr^fqi>2@<7t0uM
zu|6(xv6SartU(;v`RISa#o7nBSbP-VK#J1HSr;pj#Kqb(ld+bIg_K_8Vo3rn7Uw!#
ztnaJ1SXb~aRtpG1b`I}i>6$}Nw~|Hvt1i}_B`(%3i0%>>>k{6@+Dve<l;>S6o5;m3
zmKeds!ma6I4Xxl}eU6-Sv1;M_h%Ocl<+Gt>E*6^N$X|4^azP6&mh7C1CB4kWy0n^$
zMTK{<WC<?TJ~Y9_3c|Zs3Nwy>*~QZPS6!@+L>KEW9rs;=i<Lx277h8hZWn9wzvE&>
zui|2rKn4jeR?wO*mJ?!i7wh7Ji{-Q)7wapf#_BFs?!1e|KrgvY7ps3gE><bQ#kxx3
zVnxrnSU;AzSmTuYmb+NiP@6dyE0O48InBCQm!uENE^)Ce7P(l7f62uH|G~v_nsc!>
zukB)CC~WX9RurA|yo<&2PhBiM1jQh!i*<RCi=|BBVkH7DR@CY)7Cl6JAHl_HTI6Eo
zlDJs1fQv;*aIr-2F4pE{E|vzt#gZj;vF!dO7b}r!xr=pc*2VIvw(g@3F6NS5)5W5m
zcd;(Nq@|K4xL9Xle{!+1S8=gy{yi6~cLYXovAPK^)~L^77mI5}7fX2+7b`hfS+Ict
zt9+nC)s)6Ne2I%y`(JahB>wDT$*<~S@e^Gv<5gX(_jnhp9q(dQE_SgzH31h(0&ua6
zn^twPHUln}I>E(~S>45A;b<VbSRyq3XI62s<d?fxr~?ZwmTz?c;9_kix>)Lfi?uVH
zi`2!c0bHy*E4x^4d?bi2mgHJ4)}z1bVtKijuj*nM&%0ROf)X-#7mJ}hns14V<(2UV
z7fbn%E>;TO#kxe|V$pA@PU6#8aIsnlE|&Vdi>3Pq7b`jvLh53*@BuDX2*Q)Z#ljI?
zthxZAi}h$F7prdt7mI&&7wa?L#VVh7u@0ESnXS8-3=BzJEPaLxJ!EX5J+LPdfQu!9
z?WsmBcCnIIcd=e_5nL<-f{UfQ;9>>Nx>z=Vi$zY`yx?MK5L_&Cj=&XMtc?fOcCorI
zi1Pt1Rt;v}#d;h_!`BxevDn3u{fjPEhdIH;k~YA*ShdpGeB4OD#oF}`T&&ZxF4icP
zb<V|NqhD~b=>P0u<@8V!Tr63li)FaFi-oXT>|#9~Ai7w-vo6*U!Nt<f*go%K`Bey}
zd92IDDw%b$(6%FPfQuDHaIq$dE|xdoVtrq5v2cKkHL_k8i)xvRr9{gK!Z9p$u_glu
zE><hS#WFfX;$pcHT&y=4^DdV7wlIQ=^#E|OzQPx|SU*`05?m}8(ZzxgTr4}M1sAJ)
z-o>)ovzm()qcrbg=`VM&wk~$D9EmPg`kaeJwzi9PWWmKcx!__QUglz{Eq1X^;aw~o
z`MO-JyK^qq9)gSYV!_4IS>$5L&AM1)1Q#n1aIwI=6KlFyY9uaJ7e6S8F>^m=%dG_$
ztMD(oSO#mmSTHFNnji0Cg|HD_EGMFiCB4kW3K7J+SPY9?tPIR%5XeJL6GU{eGS=f_
zwXEr4B?q&t;bOUvdBazCv200PtWXjc>(fdumJ89vy3a=HVj29=#VS?6yI4_zq%PJY
zFob=Hiv=RMSb2hgizP?uV&w<$)ToQq=<|ME>|*&Ycd=lC)dUwSZABLg#AQH1aIp$G
zh%VMCz{ScWxL6d<IRTp&xmd7OTr8uNU97;RE|wAdnl6?P^quW87s~^1vCcZjuiwR@
z{!1=a?VnvN>*X#MdNT^un2P@J=|x*=!Qrks7b|qRi-i`Pb+JMgxmYr!E><+&#fm3&
zv7(o`SWWuNT&!S;>Y#vXf{PWp+{L<Mn-<6cxL7w<bg{%&cCo(Axmb?NT&$8+Tr4=&
zTNH4y$PF9=6DG+1sf%T^*u`=rx>&(%fQuDB?_yambFrG{T&!LH9TzKF|Bo(~FW$v6
z0$i;4U?aSXW#=3js6gss4UoE6!CbC*7fXJ*i{(RbvF`oB#gdasLMsqmEcs<FmhYcj
zELBn$D_Q~XVqp}PyIA>ax>(usE>`=ji}ihpixsw#i-l(Ums~9LQWwi-4HxU}f6&E3
z5nL?2ITtIQ=wh9-n{~1F%(+;)|HQ>Yv*BGV<G<o!$u789`D9Na?NoGs%f;#j<6W#5
z1Q+WkhKp~`#j2inv9KGY0T(MwYGoG-&9kbDmCNxTbg@baE><hq-6M`yAFt+OrE!%&
z*bvx09A?)9nBZascmpn0>zs>KkAcpBXI-oYqKkEo>p$UQjW2Vt?*C;MYnO9LFxwIr
z3pM9ri9&ebSUbSQk_`a&6J4wu(twL4y@rc*&L<6{m^traH3BY{(SXV#7b~8`#R|pp
zZq4Uk?qWI5xmX2%!^H}o**xGFzR1O*SnOhjC@gZZLY!R##C_POF0nI96I?8VHC-%2
zf{TUzhb~sG!n#~6wEk)?7UfzlR@<D56|AtTi}i#DaIs3}T`chWTr3HWhD#gJ7%sev
z70M-gV4^3glDEuT6cOBoX@FDVU94V$i={f}V(lWjSmGS61Q+YZoQst}Ej~zav39fj
zYy82*I!1J{9GAFQ@pu>Oz2M3&))+dE=wdw}ak2OaE>^l`KheeNn02u>Epo9A04|n2
zC=GD2#Fw~OM*tT~eH9n0RB$C1>lol-(X8lV=~K%N^_tKrw~T~oxF(HYh38zX29YCt
zI~H6lGJ4f{7t8feF4l_$7mGzfZ`Q?%r*Gc6^CjNJs-1PQ+UH%Y4#35Fig&T9TohJv
zv9<~yn~Ge;#mc==8SxeGVl}sbf)KLI1Q)BKT-|kI`#HRe#f*2c%=kx`S8=iQ|LkJv
zjhN56SdlBbSdZsiEF{6jvNl}gVjWn;#cEmNVkLKx0WQ|A^}ATF2rkwD!Nr==UXP1)
zX$ZP^*2Ur@x>z?!U97wnTr6wA#nN5sVm0AitTHT(%wD{UB>}it%GH32rO}Ibu|AAo
z@h(<Wxwyi-i`9e%Tr43TC%lX06v%~lu_iDyXV4LLBWQw)l?mK$rVFsy%(+;mE4f%n
z7}zDei<L^g;9>>H5?m}eeK_95>LR#Ub~u8IrH6O11RyeXP_}Iodzh}E17!p>!wv8*
z);26F-o<j)B)V87L>CJTxLDQX(xMA4R@mw;Rw~iO+OyQff;)ve5nL>OtTe&Jdd5a@
zu{<_t$!JL`S^+LrCE#ME5M3;Bm@D4J;-7V~?C8=~cCliKE*1^Z#VWzOSOPQ+fQwa4
z;$n%z^p?0-e1MCUg^)%W5M3<E)m*GJ5*Mq7=wi_?b+K;q3lLo_y%k+77r@0L!@F25
zf7!+2pLel5m%CUsvo2N`jNN0Ii<LL$V%2TfngzI6`hUyCssUWAG4drY*4HI2R@BNa
zmJ^2~bY&OIlIUVJtmtA50WQ`MQw1Emr3_K*V=X{)1aPsaW?igmf{P_T=VGD%ri-O1
zSi*NvuNA`(4!Br-D7Ylv#RAQ{Sf1uk!EC&XRUxx}7psA8-o*;0rkZoH80h7#NL;LZ
zyH#8)o8>N6Cg5U~k~gp5Vr9`tle$=zYq(fLfQyC0xMty&yI7(^mf*kUVvUfvSd9c1
z%a-V3DdSzN##tB3U=0_`de+7ACvmaZ7Q0x&JPzw}u`K@oyI9(P$Hm&Zf{PWtf{RtK
zx{Fn~P8X|OXk{1c%B+i(JMUsSEpoBG0xniL!NtM~uk2!B@h+CjVi(KhpSxIrtGHMd
zfQzL~aIrM;E|y<_=4maxl;ti~1>0Y6v0PSiu?%KitQ?|?1)p`Xwk~(Ev{+9Eh}r-y
zmcU{c%X!@{R)zL57Yj>+nsc!<0~Whjujz>{7Ed`FAK+qD%(_@8qKj3(x{IaFUI3kQ
zvG%XxVr`#wu~JuZv2H>ZxmXo*E|#CxA{XoOyo)t3>tZEq5?m}D74}k*RLILI5Yfeo
z5}tLjOz<w2^`BfUcEH8j%iuzAv2saVtZ5X%#Ufjuixog{v9u*~NL(yd5*Leo-o@&p
z$Gcciyo)8h+{H2@xLBHNxmeXCF4oQR%nw8tONZcMVW>ye<zjK*U98^KTrBOCU93EU
zixsHJ-%@f}hK#<K;9@arE^@JkP;`N7yI9(iN&no%iWA1WSoI<W(8Vs64$;MWwStRP
zg8Ex7mhDm(>(;!BrK3_(;>JSaVr8Saf0rzFv5w+hEEM2keWoY6SfzlA6)33#xL8rF
zr!_b105hf%T`cIFi=|1+PH?f<S9h^Ktjoo+S>|GCQ>S8Acd@iqaItKbxme{ZxmejG
zF4o`yPQZ&2-k=3#GIr6V6@`YnfGt@o=_|3Ssim9)CMMDsETdj`^#;%|gSorv$@)Bt
zJ+^7aW>7kxOSL$v5o;;oy~)*3T)_XKMuQ}cL!c7;+k0!Q)fpXHca8_3O#+uUQRS4<
zbDq=QR$6W@N#&k(&YMM1L`G{2OYNhr5jcYpKJC>~joBhc_cHa!>F)Apx3r^JvZ%+f
zY+JHCQcAz!sAysy$-j~*(IOk&eYESe7B_#OcC)!=Na!PGIjyUYxUuidsF=-el}DzR
zfnjojqZLU_5VKOtUs`t3{DB)=N<MraIl7s_-!N9BT&HUV6iZU489_j?H1Q}_EEtbs
zK}k_8oo$-{6l?DsiuGO@k75N1m!L>ctk78$s{}x?#O6?}M*50!`oyeySIAa>tvM76
zDwG34RuE9EigM;-Gl6`yL=>yisvkvyV!c<%2mQXK*x@@q<#>!YVh+V>K_7;BEudK0
zpji~l1wgUrboLWaEc7?#heQ<1UA%k_#mdbhpje)G6f2&9Vr@T0*>N_oW%C2BPb%dk
zC|283Ly&j>fQ#Xf4pwpNA{0xCh+^5Rq$=zbj6HkVTb~BlGwJEUrgKQalVujgx)kcH
zbJ|&lIuz?GSD|NTyqUjt&~zuW@H>+*8!H=YJc`w)KtQno6KjTmV(rDyB+Q{$(vJ<N
zeVFhl78c`GapXjx{#}Dh_u!i)xAyJs&?bLEO*20EZ4Sl4eZOR!tMGoSzMU_$TRU#X
zpnQrRjfJYUD<{lM)=q5EXXi~~JK2r?zT-hevXsh=EqOEidHSMRH_TLSTK&9xa|w!d
zKGjy`PF&udB`8*~taPHv{Wp2{i6~YLDT?(my)*9-uWIIg>ciBT_xYN1MGb4n-t@bt
zr;Fr2c2IrtjOy?LiuFa;_C?zM{M<y<JT~&fr?3juGa#C30*Y1p#1fBUIp+1}7kvRx
zEFJw()e>02|6Hu1PsQp(&x(fX)ra4lc`=}^ZeXaMfJORLsD(pDBFdEqAls*=RVT_-
z!Xbct_f1MeUr1wQ^h_*BL(9B)*g?ajU0ba|d3ypxbR<CE0Ky$UGtsZPMS@&P3By03
z&7%aCi`V&8?603)%+ylM)LM$Cv04BcOZzuON5lUQF4hEti$Rp2;U#%r#=S-tS--qu
z68**{YEN;qu_lI!nODVoY<F*8MPxD3G+vBrS2nIe@xnCHgDkl7*%{M>_S(3RnR+9F
zi}jP`ko6<ynoA0&SP#EF_j62Fw>7#m-)ofWrRoV&p3<BXUs$-<hIiQq_~!@37{*+<
zftfsheDwCitD9{bDLS$$)7v&a`{J{gtgp4RK1m-IEZ0YQ$2^51<n4wD)3Z!(rX`MM
zzB<9DVgIC_p&;bY_In-Be2lEZg^y}yqIusjjz4&{(GA+K8^P+EvupTW?uj4M+^2oM
z_SD2Zjelrgc=}@VZHF%p{Z6)brM`;W7+>V))<v`7`h9w4^OIS^C7`IU{nxG?@7CoZ
z=NuK;po04PEb3KY^4YsdJB$w}y@uyiP*!$yk!eeId=*KQllD&GfEree#9<<BWO8Rt
zrG4Dbb9c{;yJ@}|Niuq)fn3qm0_Ty8H9{Bdngsls?xjne`55MD<o`1_<iW|*+z&jy
zPg3uz`+gqWS3Digw2y5&S)D$QtxxWLF7sWQ?jqYGFNbjGcE|_Oy%9*r(AqZ^cKDJ<
ziF@}ITAP^jNtOvoSS^tWrQ2FYQ!<rdassEG^Qt6dXkRf&@DX^(%dPw@a>LQO#xRo(
zj^`HJ>f!w&A^|RpZ|sh}zxc-9?>9?paKaAL=O?G47@s=PezPb(7|vZSDSJC#q~y9d
zHH;&HPJS!9|Dog?SC1Xn3g*xsh!<mWr|rfzVz`3F%ykbX3vGY(K?k9Gw~C{hO5}6u
z0qz<9vTd&@x$dMKWJ^*x*4?3fl$NzSRQP&)_u0)wt^6Xl3qpFH-9?T&2NVniZ+?0~
zc=XDYE46zDXg|NZt$E(>Cs#d=|Ah2wH0*rJcYOc3mZsM0xPSq<scq$9yQ!i@axsw|
zecX3nJLidWQtwl^>%ctj{Y3FlCHqiDCC}BN%oh~&ZP?hLdTYOrf}hp>Uq@AO`4_Z5
z&FOeO)}P?<vs)L1MJ4y3{0~{i)u(j0-P*Ff1a8D5HjvZ*>~hNS6wWhgDMMv<t!^Gj
zqQ)9kh9M`EL+*yu+XF7vZh!9aH_eK08^2u#ehoK`tKL?h{yZ*n)c;IW%w^Ch88RP3
zQQt#9qk8<UOVX8Zu9cBq<mzML+MCIP#8viS<(u?ndMCU@w5)s_MUGFYjL*7Qyho2?
z8@4~ZdAj}j5g9k%#Lp*6n_;-#?1v4|2YjdB8uD<JQXdT3Nbij+FPy@Jw_2An<hWIy
zW5!%Pl~GF>$Hy>9Wl7&KsqHOmfn^bui7k6UA1o8wMdM~&K3o75{2~KCay&Hhi9s)0
zTs&<P%2`{Ghat>xM>pfez=W+)aB3BoZst4Ix|{47&hdv)@aDKvXbVZ5b7Jmcud&vX
zyUuXlZAZ_BwpP6@MGO}_V(~7PzG??Ugl|g^&t$8<#xz4DhPjuI(#Aj=?_%xfoe|);
zj5yP<mw)5IULi3XL*pa58)}+O(7U!(a5rhXkq_#LOA=iy`kGWxO@{Lxb!5!+64h!b
zw@49J(TjK&i^G>*q~;rUlQm3Zj6WjHTX0*yYY-AtL2b_-AlrGxUg>QlOiZVT%iD*H
zJJ^{@!qG{q0PkYe=)HTTeQ7#J&o7Uk-OYTX=@(GLeo4)c6Q{9sX9x7Qgz8cHvIkH<
zVaGN`_Q1ClW+YJV9MF1J9r24Ym8bA)liE-I^L{lwa?_C<om`q6enNWeu^A#i0+<AX
zuQT5iQ%f19XrlKn(@$wiO4A*_)Og<Fxy*NiaF;{;^e1-<pzdxTG!L8EwPRviwlKsn
zLcNOr{B?sHoYvjCB~y)OEz_}VPjLEMehSg5n^&bdv3#<Au`zMKi5pLo<1^Hix95Gg
zepk33+3ardh{+5WneO}Qll|mdtKw;v3=GSVBc-i%IS=cju$@DDINn)5Q)kVLx;W$_
zW@}Sx&zg1l)zCiWcQ*BBShJH^hFuM9cQs#UeSBx<@By25yWSMBK6!L;_>h~e?Yj=v
zr@60&kNCc`?VM))pNn;UvVFhC3`YZobu5W;x2rbqhQ=_<u@sK?uKF4qnxZa^rHbu#
zGj`a}eEId*E#>!aX8s#mlK<yot>t3Pc*Ol`AGAM_-^u;O_sy@4$&M4nGu$H>wkaH?
zgHJgx&(|=kscw!=pJy68-=gBCdc_=kYaMt-FTa`kpxo(O@6R)q%=UZ0(BWirBG30b
zR=+>mbe?=u%rpKd?)Q+J!>M<jJU?>Z{Qm6Qd8%`UXQGsCdL+!@bPq4@WR2DIx67TU
z`!#rfHpWel-Er{y<iPu@?alOfZYQu<m3OL(ZDyjz;ml|v@9#mYnV)T)XMPm(PJfM?
znHqHP|JBJmGx=s_da~1hW`-98F$cjSLDUT(dIXrs9LyF8=4=4-BFF^I$wVT_HZ_n*
zAs}+*kS&oA)dq+L0;+8e)sKW417#R91o?Jza;r#k+Xiw61ckFX#r{Z&gAEi%5il=v
z*ojEksRo!o0**C@heX2nO7VgI+lpA6F8x+L&3Ju;g^_NY5sRg%;Vui4w4FTmmga}8
z^ecBUxY+K**lI0@#A@~lc<gsXyIDVX+j#7NbKU_tpTqm=4ojRo>RNYH`h|y_pXUM0
z@gw!eRj?=A8&0Uy`yhi(de)yrHJns$^wU0j=J@a#*+zeZXtY-|TK_!8XBeZnBR~Nl
z#H<3907Y!qnu-`ei0uj2TT>A;U80D2#96(KbNd>%>u(cc*wn*BMQjNn)_EJVL=iiG
z&!^_zrPh1rNAI1Adf-Qd#7Gpefbz^+W0^shvx5Oe3?Rf3o`kKeh~<(fVg)hvg^xZJ
zUh6NqF;J8|UKF2J9N$=+`LXooy|RQQidb7!ZsxPpPtP*4t8aa(e)zrm-jnBd-#;%H
zdY<*QHZ!m8J`ob@ep&MQW$whwM}_r|iW{;@8=uTWVihg9Yb#<eNEETAj^|4hv3Gs1
z7As<Je++bV54Ho4*eZ(H;LmTvU*{FE$?yMD#MY~b-DL(*h~m&tstFx`_{KCo-T$;A
zrrz}@MNEoB5u4PalEEutGN~hgB34yuuG|;va$bSm*ZGCIK%=wC4T{Iwb>d4EvDB3m
zvDBn+gU6|WBIZF<#G>(v7}H9MSUnT0`|hTPMXWkBXs3$hikKL}wn5y3sEBz!%Y3@a
zYgQ49D;YK9x?-MJKdXpUFx=M|*#RhGaVscdCqUYWqMt=v&lW3U^>{_hfcI@RR~G7*
zMEfJuTRWm6hLGPR*CZyNt1gqN(P2kW#Jm7Stm4t80@u;oh7!Zl^NN@nKTe#CL=j8H
z5frh5RKH6gxJ1wenuu63SzGf5WGg9Rw*W<~fo2CCrZM<BS;qtorQ_ylyJ);37B#Pk
zHHQpLPr**#=!TOhVm?&Lc0@%?RDPzCL=nT0Dq^=0vx-;)`&F$m-mA+Mu|0T246*^V
zD@b;id>%$#6h%<P$Z7M}R>as~9&?IVT!6IQ+KQM5?D^%R-WV^dsd0~-3UJ!tDsekp
zQ-1`j%*u+`SArt;B{D0(`UZWhF;Nk_<;Z&i>WEuO5woW<Pm==;V?(|%rihl`$Olyt
z6|tXu2mz{rL)32FsDO)06)`b(4mD(3<>sGQW--x(j#h(>`*ypZ$o*+2f2_t>`L*fs
zhbeuVJqEX2ZF>;#cuhr2J=r{dD<;3FZN>mpiVe9z<LcWors)rrCC^?#5fdPX3GAmj
ztsGhM^+<e(#4UxH?MewNC}MEh+ZVN&K;rs3A}0YwOng;EEM!$hEFZ6kNzN)_m2-+%
z0kcFz80hTZP{cmcc`hhoGJi!8lO$2ZauyV^P;4z%Qv?~y;Q-LAB6bVSer7xKo?@e2
zRRW*g$tLUbEK9L-ir8oA1x4)BtRluNe|&N^MXYd65qr9zh&`WI#F|4y{&hvnEcBW1
z_0<)z0m|BcsE7@$sE7^F-D|zI+4lFReX8$7s*X2sUpE;(z$^Tg{K}KZPhSjQ{|_r-
z7U-^`>%y$zGdHwy<<?fj-f{1dWY|+dRK$`z#`=ay6fr?MR_(VR3jjszW)jyTMJ(iR
zD`M;+B8VQ!vuCvz6tP!K2O9sRh>Zk@FrTM_1<Wd9UF4GMSH#9C|FR;+1Pc<RdpD<u
ziAAayty2*jS*nP|%`0MYWP__IVk65Gu~DeJh)Z9IA>H?5(~(99VfXLd^bHMi0b}YD
z84~1RjG&b#oKz8Whiwj!d>f<w<iD(lnc*a_xbu1Y$T1AiucnAKB%M6r4qK{-#gWB_
zN_?!ofT)mAB0rmA?I#5&VliaP6*04n3n$#Q|DcGCkjX4l#NuWU5CwPG#y6@9iWp)+
z5tEVDKY^lJuOb#hmfkBgHu6^#F%a!9L>#=)>x918J!zG?eF(c$*0}vPSt)8RL`7^I
z8cP;`D{E7Qv=V!n!DcID(4H-I0sH~VS7O&z#5~qi#73b1CloQUB-lVh@&I}}IE8Y+
zkuRm|DDxw#&1Bb^|D=e0S)U>%Chg54bL+$j7+w+cTDKw=w;o08F08+qBXmE*NtJDQ
zMQr2`idaJf{d-E96%?_NIYn#|nog>SdHe%KY~-IPVjEzpoOng-<cMS3*B~-}IvzvB
zYs7K4TMiYB)Q6r@F|9)pYe4fSLawZ=h+QSynfDN-dh>htExaQ3lg<ovJGSv$u>no_
zjiU>S*vP-8h}q34VjhS>i=R|W6)_Lg&2tBDB2QY!HAab+KZ5X|wu|vPvnBFtrQ8xl
zOzNK~VjEymS0JH)B8DJQ#0LIVMGOrmDq`pn=;o<1iz_)6t0-cU>ruqaM#%i!lc1V3
zl4F663EUP&Rof3#4Vaf%+^zDcOF1|-r--G)?8)d<>VTI~e_2rxoBB5tF~karn9MRo
zEN*Q@3<S3@+JRTZsNg66(~6jxWApC~ulB3md<=qPG&Oc?OQHK(DU<wWCphu+@7E<@
zIGF{tl(-6@h>4lskp8=hnB>2vh*8ldyhqfjArcQW+rMClH}a;}q<{QJMQj5sH;rb!
zikLgBJptje|M;QU7h2<8TCc5u0-aUdF{Yb1Cz#^xD|a1|?=un<F*DTe%DV~?9O>m$
z_nXe{yyr;EdhMRRWICxLCiQ<^5%ZW;#Nw7HVob0{e@PKzf%zdy9=>CIcb)M-?Gwl<
zikJubv2D+%;?F$uikRd&6)~CrgNhjMoFdk}rXt2Mr-(7ZBv(_!5HNm!YenT<zB%IT
ze^$gMpugQC={1G1ZH@VzJl|i(M~E?O388;qkLZ8Fc$<zfh-;jS46&jjc1oZzrE-@T
zUJ;Y}vm(X>i#JV@{vmet@=KHDir8Z%%g0Ch-oE-|mElx*LD=^7P+P!6Xjj31ToKz2
zC}LujUzs0w^P6pxp(7|_er4?rRmCB-w{l*tUlG%%{~*7rBGwGyp1klk6fr4s{+J!I
z1_D21J=3}4Vr6SKdS!nzl5jrfX(V|n-QwY!B%MrSS>GwfhtidAGwa0a>%N&N^<=NA
zh>2a8c~7%5d!y!Uq9XPw49dCtTcg2?l$IuA{@r8S<1Gz|irCG+tB6S&?nwBvB9<gF
z@_$$nlU!X9Qzb9xv^@RwS$gh&N)eMJDq=m$6|o$=BDNJg5sfp{v=2y6F5YvmO{8{1
z_4kr#XHZJ{k^j0PMlHWc5sOt?u83V9nODR<n?F(we?-xclw#RyDI)sdId%Y4@$F<P
zCHY@e#J&&|u~6pNv*)Ho^{Eb+hceqOSHwmGh>Do@zov-slhfDsZU4ETh*_YvGT)8l
zTU!xBcBLA9#I>uynl7g7xG6(xVH|QJB(5pjnA&Ks{{C;v6tO};5&KS}h}~f}c*gr@
zMa-nswudT}M)}h{skRVNf+E&SDKo2x<=_>uy<B#9MJyGx!Q$|MHnqUhGdKvZ#L#Wa
z+>fsc-|DDuEZn4$u<><Mbn^rEN*=fE)Tx5Eo;-fY(u6s}vMYXG5reSJD`F7~ide*-
z6|sVUT@i~BmQR4G-XW{REmp*aN@y>Y++ZC`lL^${*psaefq>BHp!`%Y4SZ&uiWthA
z%==$d#3Ed|x|^@&%H39@#1a*;GT!iTI^#q9h=`$WN&Y$mGC!6mVvTYVPLu>i><Lj3
z8!6L2_c`iO(2GO-%Cm}C6hRRy;Dc~o?-JA|Rm6Jc6*1d6MQi}MBMCawDU1QzAO3jp
zWZuhI)Or*#Xov!na>c-$BGyGOj4B~BGG9={T;L#yt59~7zAURW2nu&>My4o65EQXA
zC|mV$=t_!M9voy2h8^PKR^tPMB;7|f;BFrjihW-a6fqFRKn|Kp5`+fpfNJ&h^O}4s
z!XPwgFo+L~ekucE)JJypADhsgSHw~lDPl+9-UbVb*jF+Ti6T~yn^~-g@saV+3O1b%
zDN%eLg`pZt8$=3#A%RO2u@c72qe~RA?~G9YHjR(JzhFB*<o5$jATaP3?90>rSaok7
z3MdFHk(GT}3r0HtdZ{WF^hw5hi6Ul>;cZ022BPR3(NXydt=jX77>s?nBE|%!l~Wyb
zmgnJ@mqq;(MGT}}T{^=J1&Ir(vHw94qhOs?#N-)Wbr|_%7$;DC7|rfchNIPG#(*LQ
zA}C@KU=K$XUM@wLD2xKG&F3M{qg-^GR1rg{fkZL(UR!vRGk69nyEwHAdKjo%HC}sd
zF&(SWgI2P}m(q!1S_1$}O#4t~`4$Z9+}E@6?BZ%I1-vnO1_IgpMx&^b(7a#_1jpds
zigtv`NB=5iw1a?@w(u&Gfm+LW_`wJeBgYg2r!<<M9gP^J0L2IJT`nrm*99pB3vH{s
ztxAS*DRiz@^Pzcmsa9d;sB7+~fvBMv#?xaAyw)Hdu*#m^G9<zvV2puXN#DDq5OYJJ
zNDzE<YU6<lMjz<_E(4ASB_ZOidbPOn_#H`L$3mX4GAhnszB&k~1mj{JK+#a~`YPBy
zQs0{|TOUU*aWxn^fOb&|-qZ?25OPQfXr~W_wz-1$2nG^rWEEbTy`#FfTqRio_$27j
zYDjVg7={bNHiJN@q9AXylX(!eBPc4ySP2*Oq$lXG5{Sl~T-P0RH!F}oXUlj`6kHnh
zYzJfZ4r6ioM-`lg-VM6BsmA#_A^I7G3Me$0E7C&?)~8yN*q(a1f^m!J#Rn(~Bb?!p
zaFgv+`8ikhXU;>=P{flF2#CxPL$g&CRIPuaBJc5zAXrHrJXFOz6qL@1?mQhV;+4ze
zru=z`A?ux%hqNjPg=QLv60FEG?`24((I19@zyqMHgy3@!5X4%>bRaJ)OWL&6^yw!>
zZFW%luRNhf({!fN!#<g0cts4o2a3+&G)tE=^A-(x!U-s1B@KWg)?>1QBBm7R+F<g0
z#E||sI}1BnF!FgTQ!Wp~ydoC0UrC8anV^VeJQGp|-;J45#E!jinPBip3KAn<LlH}!
zY0G8|`3Cdg`;#J;K~%&jm_Q)9_+s_VDGHCHQv}ZLjNBd|O;p4vR2!OWaLxL{tX30^
zLL3ht0g9L?=BBoi`yxdQmQX;sZT*Vau-+a8VVZnPgXflqFY-GF#bB&&eouLQVE8rd
zPY8uOhysV=*#?H0zv<Kw$o4|Re0EAIV{#<~=vyp!@QN5HIXecKgeGgy@xUu$`R-g4
z>_kPZ8sNi>XT0YXF$6|H;f?I%>kEHS#L(HX(NJ?k-Y_(nU7ceO8j|rwObK-H6-bjG
z10GOjK9%_h0;1?8zqk{PK%2)q7dnZe!AaJ<$+_va#xcT7kvD0(Ji;Db3*!`Qdp7Xu
z;qWSom{&bF*{)N2%|Oz-R56%ub}GhrMU282^@tJP4oG-wDPr!cC}L=WB9;XxVj26*
z!EhhY43*=XCw}ivoo?gdcs*kQrmzN4pa_bX5{5hpErz5(Sfk04a`;)mpYEd_yzF@}
z1V!w<E`tvUo`l}O9bCXoG5*312uoCsTUe6NdzUL>Li36kh#~U1SP}@9VM9$+#B_~H
z`=Yj`fj*r_pLkaZX~^TzG-4QIC|ZvqhJe04M)QXD75_cul*(XSMIOL&vJ(|CMU$t$
zqjH8Bj&OHCtkD(PFcuJ6@U;?jBzXToUII5LfGZe^czFYual0pI4i^PAadwtB=g@tw
zr83wBHh2rl38E``3pR)HBtLulJ-EP+f*pZ|i1uuxU{ru0&u>B}1?4L3LnHEY$Z)wy
zg+Udzpmbd|?<5=#fA@7&mE*M066*B_j0@n>#!Orw2nu6l(^IsA98CL`9FB&TxKNBm
zk>lDqE-^M-qfHhIeG=9jU>($av3Zv{g-H^bMQezXXh?Hq$eB=xe8!G_$M?zeg<C7_
zepdiDf>T^UF&9+_sh8a6J+os|Ft(u=D)3SbT!{fAz(sZF!{$K{*KS<Up6;ED6zm`q
zi4gYM?)LKFD=)B2jytS3ff(x0Md5`S20c6F(TYVjGdxZpFdFQ^hb@AVAzJMaAPn?@
zId!Wu&(~l&#lk+W;Ap)N7(06BHN_G+)haHupf~8KXoyHT2AN?)H~OylUH&F_)sp*;
z<^zuJhpl-_wTg5@G|<j0)@Cg3Hc)q6_<$qS)$S_y0s1P62JMi5jSahRG1~Oe9xe!V
zpcCbh4p7T{#g$=r%jX7fHCP}r@o~{jzoY=JBzFJEgV{Wxs%c<BrBBflWF2QIxAC(S
zW&}T`d-G7dU!4U5Vn>q?U=CYvt=);V{)|Rle}3{q)T!WirxiEnYdyYx6&zK&r<f~K
z%o>?uQs7l*d&=9@8x0D*?izM$KNQChK3-cu9z8>i7(Big>0Q0oN=Y-dC-=F$7PC-0
z4L7=&N!}+G&0lU`e6zP8XeddtgSp5-xTej@gu-j6f(KB<CeUQ90e6UsSm;ZLyAvO!
z#)qi`{DXU+!-GA94;p%;aphnaDPn%}iWo)7cnD-x5hK4ULFv7qh`~IcSWbR6-FjR(
zHW=-~j;2BHr4@DIQMNmEW>5Vk+q@Uju!bC{L9j%XJsgfkD&=*aL&HOh3Whr$pDGKx
zKD;T`H5DqyZ|CaWI?OwGSlzUU4p7ASo?W6w@<o6ievi6`g_J#pB67ZAT<T|lKLI~F
z{Wqpac&q1!-rfVMV5rZbcxJ{;9Ul`v;l!pMvY?0V+|sXtymc<2U?(bKw0(#fhM$*c
zEb)q1XeMjO2cjZou$m%v%(YtFKjUCb&IpY^rCT!VL7C9Qk_1I8kEn<VR9$FvYj81M
zSrIF$=Xvdk>c6u{5koeI9~SJ7a)TGMx_Szo=t-ccu|=2{XLs9|Zxdtd`lO>~DvBO6
zR=*+XDa}?aBjs9pxScWdrDAP&(qSCSrV#hQ(TmyAGe=tk=&G!}&0RfCy!cLY<kIw(
zqkMsM*FU-#AWcELv_msJtsyBLZJ>c~x<8^bZqa(9f;XlGgp?i)GX%?7lc&~%dRKd!
zNgafV#BLLTZx;!LZ27eF2SsPz=4kY>c%L}$&^TXyxB=g>EWTio(1+HoFo;O#Ne^iT
zs^j$B6ktanBG!^wA7Ik=uzt{?fbBsXc~_FZ*V{FpJQQ^HYWEBknp{clx-C}19!+IX
z@UZp=*#P>Z0@_3pO@;>17=Y*|AXkHwe;w)pqd}BDf%^>#V4|S(S`d$~ESwJmv92w4
z1`YNxn7g+j^g=|u(2PlFu%j=}<Tq(vFKvT@8KCp}Y9V=<8oIJJ&&e8cl?6<P0vYN&
zFVQaYPen6IH@{<LR7VdT`2?J8ATHc*NNX_65zUl@VSu;a>7Y2Iv?b|UK*=UBVr2ZH
zZB5wG$&Dv{-&#{>;wXNdg;zy`58uJCS7U6+LVd(6dJVRf^F~Nav)(d(Bux_$q-Rk*
z@MeUc{xpR8v-QAN!Rkn!Mz^kw--Mn=-g8MB?62RI5TR$$l<qcqOT$AdEp_xn$n&z}
zPE)^2+{Q$kQjOwd4^w&a<)vBNwzz-byZGz$T~9rSKYqX0;>Juz!|t9``2@@y4IW4m
z2T_{B>9`zaQ6-Ar5p_)$ccp;Z7_Dk|^BtVAgsQNB=$KIr+8;MS_tK|@=4}MqJRgwf
zk~Z%u1(|Q-ZQ#zJxW<-8JtP@=@?5El={Dt<$3i=`Fk((p?Cj=z0h{ir0f{fTBsvsy
zS9-JPRW!ZIQD=IzfwUug9)B>yMCg@}qX)HVPST@BL^hFwI0|%4fCtdfhz1WO1V}w-
zKQl$|d8%I#kYH|9@Q$ZKd?g4+u^c`ut;z%rWooFzA7s=P^}@m<hfmwAqc>8UHgN*0
zN2Ou+El|TFG$&Gz+ONAxE6BXX?A&xgs2P{oNQU+{lPDL9Al@)+mAWjsZ>qsBWY>9(
z-=e9A=xs*I!WYFfzw=$PIgoqPs-u0To9dK}ueNc#<2L8Oo!uiTM*e3frA>DBwFhwT
zENHj*Anko1=*4EMwi=vV_SkLQW<S$owQ@Vp`_@@DH|%k>ESCVG$i&A6X+?s=EiUY+
zvDSJ<Z|gKFdV8Q3Tn0Yukt=@hzSe;G#YfN2HmUA{a@6Zjm@Apkn!)+C`5C9#_i7=B
zu)!LSt24UOO_Gx-Stgjt%=oXQH%UBcJ8*C>)q|72Hs^HNlfT?#Cw4qAXYlU1J~{5x
zvqvm@#o-v6i2J9cim3E*HWwS5Ei)?C^L2&N>kfz?GTi<dVpy^@x7RF#))?s#YxUuj
zOcmQHFDffr^GN+F{*dq&f(5RR9|c@O&sf~8-t15yRmrrkC7m^=YHN(r2vm9Kh1#zv
zxdsKBA=yS<Rf88ydYcNzb{fe2mT#1X`7v*hN-A|pe+8F)oURezEcb?Ge0!=%M<lo6
zTN!#<g?ESZe=D|o)V@e+ackZ|otgD^+xhp~qlH2x4H&mmH)zzkY^ORgR_Ie~mTF$x
z9_4WQR`11A#<_i$w^$ofiOOEL;Cl1H+tAFS%K1~jzNZ(Q(UWgdCt}B4FGbVfPNA3O
zcRtzQ<P>vFQ672loD=z#hRy-`&1x{JOgR7CjzER2>X`bjZJ7aQN0~ooh4Y!TZjafB
ztd`!+`r?;%9pm&^6qbg{W>lN50@1UFPQ!XeyM<dh-2x)7INWUZ8JQU&j}t(PhUv3Y
z$;NoH^TTLH^(D^mVR><aY)D+`6syGriC#49UbQYOYvaA4s1eZwChcz))qJscGJ>p}
zlBu^VF_c|&=Xb@G3I}S%in(=hD<m|i(*-m7q$bg%h8kXAErSRm1j+p-bTX)-1K0}q
zY{Wvb40jEpFu-C1g;HJSvev+je97Ske1ePz^kUAml#qL{cdFY*LO2+ldBvp5#JkZE
zo~W`D5+^ljsGJlya-)1TkiCY`?tFGx#!aRNg#>viYj7Tt<c_MTF;ie+p`GP)p|P)+
zskaHKc3?s~L_;*?yBJ!1b>O-*+Eg>4X*BqC2PhjV^&&nh{*=_PX1=owo{hP(sg9yj
zIVlK-BqRT^ZC1)CY<NW%Jx4`v%xgP%zbERvp=Z|Bj;RmrR9e~xEsebm7<J?y7~b?&
zdKo><w~w8!oBrrlAqw3+HyNGL!G88S6pu56w>Om5#<qhkm8AnVp3SX4$nVbgV>CpT
zO^cjELMJgOv{dVWxyi9JnJ1JdxRq=}b0Zm#rV0hw3aj-aAwPSfEi(04l*ENS>dXXb
znnQVSmkJ$Bbv)ymB#Io5611yK(Vd36rUxq1GIAvIzZj*E@7ByY!|cV+uy-HT+b$*7
zJuSQ&E)I(HH0Cph0=3;Fie1fjXI?+fe0=|i-zK{r@i)0mj~^T_++=?)nX=&9<A-N{
zZ*qiCTNhG2$p}`H*aN;tDMO=kGk-M5nJpS(y~B_-1+*zTutqmi`3S#Xd$m@9OeC{(
z7!2a8sWIbQEB?siEG($i^$XvH#v;@e#LZBR5s$hJ=2-}4KoL_s+s13@nO&tO=^1mc
zy-)UO?n^&O?;D%m4_Z9UdtE4bJnP>3Vb7=e9ls@g$~oVAsC-G`2NbazW8}PaKMaOJ
zwp>BB7ceKaL%%lIlo<Vp@;nXY8CD8Y9FL+qFOgOFG4^AadMb`wE~k|4jC7zNmlFq#
z5TJ-jvq`0Q(R$^SBQD(t(U#Z)n~5MQV%u@6C}N}FVWJ`?UF>5AC}NI)BK9><$)_i!
zqMEF{f&nH!a^kvru&nlHKoOG;;(Q>N5la<~9cPRwV*txt$+a|8lW-Lf^KrexxzREJ
z9jhsJ-mB!p)Hc|AAQna^T|R$IQ?LRxr-*R?ikOr+g?t(UYn>Cycfqns9j}PxppWY-
zLuIGzl6N}ZFPsP^Kcjp9K-kx@3yvOg3I5eDvj;D~p#JDZyZ`)?UGH)q-FwhLXB0~&
zp328szOjm$3S%U0Ey(&dl7U_cP{iatE;n3yBAwWfZzrJ(^uPU9$SL3aIq~rZliird
z3O|y=i+1nfdoq3Ys;`~)v8;FRsm}h$xdtd=?Oo)}q8rnrH*d|Tfm=BQr9FOsr%|0b
zi$;d8(xMl2;q>-`Zq|BBBy*0*{iJtSCaRO(Kc_t!a^_plIi_4Il`|fxLpZt<ctvc4
z%uU#oQw*{9$cs;}4%qMP-(W&e#HPh`nK8D?O)(F=Z@DD!aTY(<xsEuf^TauZpKY``
zE9INE<u#AjB`Q`=ipH+s6*03?af&^=oGrc*6tUeP=A11RWy-iG7Adoe*o*;^>$b@~
z+|Mt!nB;mhqMPn;Ue_|wKWfR^IT34zSH#S#>--}F{1m@@LZ_3<AlWE3>|+p3_J?;_
zHkCSvlPF@!;z7l?9&qUYy4TJVmFv*{nexlQww~U1lDf~IM$IW=8Ty~ve|bMtJyvk*
z`53+7(NCww-dog6kCtzQ(*zYyebDIrTpD2z^X0*Nu@UwE$KGAWMZvZ0!XIYnnxPwp
z?(QB!S{zbAM37KaQc%DkW@wO9K@o<Q5D95iN<rxoK|nxSMN%o9J%9oB75B5B{l537
z^=W-S*ZLjj|F9w9HG21|?ZZ4vaCLj6lo>z|{Sl3xDo?(#k6P2?=8|ztMaYmO-N+o&
z%9sZV0Fp?b-j8jH!U0BX-0R2D(W=lUd+CTWaECtjgLaJUC}Pl37kzKP-nVb`yFJ?Q
z#+b3plPR@t5`Jv)o`8bijf^|85QOx`)6qigBO&Wn?eOmvF~i-8*r>L93JpE8+*d`+
zx+W1tUz)-&&`OkQ&3J$G;U`7Rx`oo3eldmF(1M%sNNEePeXZK-O;$GMF3QwVHm+mk
zf*{Tly1f=8hicV8WFhSK$KLs}(z~T{<qybLTb7ROKfgy2dl84!heM8>=zj`cfF0OU
z#DM*t^_=nDd>@b1x1`V!vWxg9Kmpptut;f71cQ3Zwjy>z4f9~0CnI@Sr?jJp*@v+t
zjY^-jIbY~6VB1Whctw1@9*@;9?e<}1IM%b8`ja7Oc12Td_UogHPt)}5KsZjiu@@WU
zEGe!i5-aT}Vur!o*GE->B)Uv+)g)}ChMv*}5cO9@tdI4gs_Je<47gvG*m{3YT|!2>
z=7n07V_{t7W8A$QdYNs{7$58Dv?zI+@829Rg`^=j4;U?Tl#|)D=W*ymIaQ@p<tEaN
z{joO=-83q<4Ny-r@(d;t3DY`}p^Q<)Bz0wU@agZ88Chj$>Vcj;1D6&|w8u@f!qgZQ
zY9aX;MXZkJ$hIQZpyIa%I-*J;E=d>Vfl<Up?Hq`dIzaGDY=v}sHi8LbAPN4EPC&Zv
zezt(nLudkF1N+kPG-LyUh;c$w0jsIPt{64h9?bO+vaN`P_w!jnu6|X-GBs;5Phai_
zV|OtbgGJc36|rHAB6i)##Xtw6h<P>O*tK(yw`#iBS()0mSY&FBWLOGei|WzUdxCfY
zYP1a)MT{$U)6VZUMiJw}e$&mH*`S1qktRM=!~?nuOO%^462do;eI1*RQN(6CRoy4g
z0jDp<JoQ~sV{E``+ET>)g7JC$0+CWKH@NmFVz(mVri0B9CQ|!i6I2)}2^{7QUSPv0
zVs-~c5T|z(G4CBk4Dm@3Q$=@vQp7Cx%ki|STKM-%@WyVQh#I5uB&3bu<2Af+BFLLJ
zH0f4I%yfLtiD$GbOCmdp7&rDkUw3b$m@)YJI>=~C5wjIN3nW+1*pF=(Fj(t+v*G3P
zHCz41_EP(R0mz{Anozf_2G1<H0j~N6j3TDGx~e8ry{(9~sXLptyI>TtcYb*L&Gy3(
zFKKHjAo`5cu~!2oz$2|pn6Wmhj^dLdR#(e&E3YdjXV@S&=>V+)M0N19BId7NENUdL
zp6hP->aL-A$+1`N`dYG0HB1uG`3*d3aEhWGMXV(5avnwz;|o)$#VBGm6w6o!7jjyo
zgO50|>x^VNEgrnP22yBYd@#qQRFhlXb;?l*qllfF!YE<`$P$gbQk}fJsU!{rlkqrx
ze0g=esu)FVNVO$f(?UQ3f9gXpB8fVUi6h7JzHgN1WB#v-7$8(ZMPNq}Q}7E3xs1Bh
z!1PrStH+T|6ANyKcYts`I!cGJbypBfNP2yqZADB99AJJ+lV>JqwZ0C<?xDn&j`2+M
z9d5KW+`g}_F2Juef(Ra&Q6Nca62cz#4rUr^_ZUXnd#f`70%QOP*nA&n&q>1NcJ2mj
z`swz5o)cs1^<zQ}Bi`z)3g{?l_iaUNpy|-N7AE2VW#asD)$pkXj3Q>Y&kF$q<mbPB
zqgufAVlrDQ+>9^|MCC%azX6!2f80^bNDttg_*AH=!qIhdZe}t6ZQ!;dHfIzo67u$B
z-Dro?@)t!cR9&tCqloz(&?6JbXeuDPp<G_W^Z`ay`|A1VP=}7Xs5V42>JHKC&x#mj
z50iwt=tE!Erx-;Hi!NZ7A~t{>LWxnt?D4cAWkWlP7)YHK3(XTfkdJu^<vhZKV-{#c
zT5k7x-5Cy@eY~ZJafu6NA14<oZs}4jw}`+N!u~+`l!phrfyR!rcM4a4h$fl|!6A77
z(T))Vr<8n>w>f-o5Zj6v6K;l66Mfbj@`uEyKybM6+W};wzko~cwjvg$Pn%Uxd}SeD
zNw~Zh2t864Zvfta>V6y)80H1-+azah+)>0{8v{>*-wG-4sGCIltChpnUD|>N$r5|-
zzywr7H%(K#)l&tLA{FY?JutOkE$V6xLu><uYBl<5tQUjGm#3*P^MX(ljO<zTM~Nt*
z_cv%*)d_AClxp#<yi;>{s9JV8A)RgU{W|DPU4ce00y-5T>1n6c1GqLrSU`xZ$n<5{
z6e&`mq*5oI$b?DP2OqRMLoTeYT<t5pj8>zy0LmQL&v>Eu<+R@HBW|S&r{yRUL?6JE
zJqyJdxalP#^J_%t4j3_k1UN)qtT4B64|b|5+$Et~4u*z_a^IzUE?SN?0b8+^qkPQA
zSRf)^bby#oahdXTiEsl!x9SO1lGB!8v?;|xpE^cM3n)?+0Ok#<P}dWx%izfQ)*IAZ
zF1+ca{v1vWL*N=>AhD+uTacKOD!%wb{8;4)Q&1sN&alBixcIPG#ug+dZl`jENp7mC
z{!#;H1B`@+w7{|`M6aEqej5^Vzz=F#2~p2Jtd<>ajEvCRhQ!juJ5H!=L1KfEFu0LE
zB{oO(HYAqm8{B|aqq?{aiK!q0sP-M2^3{0D7mFV&Ozwy`#3cU!@F8Dn*zfFz6CNzr
zwjnX59*Q1-6VVw`z`g@L!jn2DkmWF4`362p0;<!cTpRl8&ZP`%YBSS!HS&N;%TM<C
z7Vxz{p@92kB;||TD~8O29SAUxnA#R3c8G}Jum`~;VL;FAd`5oxMu6d*+5so7i1dcC
zQE46Q<*C=>+RN$)rEN%z9*4@8Q_G@@T-sAhi>vvGrCeT#33puR&1Fpp1`=CzWye5b
zi=QDe>JV_l1u&8*804+2u4x-4$lE+)*h|UDpdXU31&OJLJG?15kGK-FiVm%PhJnOJ
zNHCCCdTCr<okAwIs7#4AuGcms2J%0z?(BoqENZ%1j4vpKfy9{AN!}4rVjwXX3p6aq
zw<&bm<C@W$<V1_6Ed~;+zlQg?9y`i63|n!$A`#EK1yHU@n~Y*v9}AW=DFvrWSEeaf
zqIu=C1jN%1R%RUChQ!!(V-&I42<(px+gZktWY|<@C(Gp=rKq1gbtKSI4={CFKc_C#
zO(d)G_6xcEAd;myq2kAYSWnQt-t6l|**8v}ygemX#9dY79Og(QmXD9r5WzrV2d7;G
zZVSto9<M5G4|P0MPjM@T3)S>aUs%Itf3~xHWmZ)sOMv5fG)5AG5jWL*pe$nUmO6Nf
zZ{OXK%D3_l-k)c?h}7Ju`mZ9kTM@he=7o~sAY$(A{W+sxg>ul9!Fm}0S`!~F!-$rh
zMi}8M&)=z+;X!N5C@-H!F0nsQ(0jZftp4uh$LXqi*$c|6$!bb^_~OfT3VI<D?zK?g
z28<=PQT2dIM9pZ~pCV70S;lWOx#7dq1I<D71_&7|_iB?$!V_Yx8i2bY>+1G4ss0iX
zujyS+G8>Hu2HCUAdlfN$vr_jpa(lf5aR>Wq?gPUWXXacM`5))?RbTC@BvxH*4x!XU
z6v(vD6kVf8^Gp;;)9OXfs^mB_uKA5&haZR|VVSHi&ayWzIn`h4u|e%*QE_JGX~}t-
zJId##lBlb%9XP6Z@zT^|idT^@Dx9WBS+HmIuNS)Du0@F3=iR71--e`<Ki84KdpMay
zOuV=GP-mL{!0LySlF8x+Zg{ViV5G6kmN{=b!Ylnpd$LW4Fwz)ru5uoJ_5j~BMjD&?
zIM+X5`-*wOvQOJcx-{G5oX?PI0{zrHv-07#m45QcEolsQ>fyPkj_#HpHrC$1N3+xb
za2TU%fFxZ(DF3IOGl|$_1Fsluyk~G^j&mi7h+jfh6kKy9EaHrTuw#*`ld(JCr1W&8
zl7<USGNgymRy}J-Mtd;2-J&{oztUA{G>%<Ao*{$pgzW8f@mu8FjGeh*3{@_T$rsun
zMRZ&Nn;B3Wq`EL0_j*EO$~0rq$)wDD2}r9%uSIOD)X)WrHW@N`&0C4Y&Dyu{&Q(q&
z60o{GqQf>=$~tg-HCpp}%cGF=7>~*jq{cbb*Y-E}>+2PUiL=p-hYQujPbI40Mh7Jb
z_1x-AQ9te4cvajynwyMUmB2|WZ#l$ihaqE$WnXOaH+MZo>ci-IEb`3dhz1s;L>Z8B
z!DfOQ)IrJ>Na(fc@FW^u5r?nGE#(@-XMabLJ@HmzjbYo_p^G%bo)b5(4WFZV%`bxg
zp)*M3T+tHu5p?_d>wtF4BAs*h5zLaV6kxJqfjCIQ>#?Ig<7@g6bRV=M`W18J+CxlF
zJFwdxO(1%jY#laa(yNv9fo$KsRQD!p{zMTj3;(*cr_C+_19n;`ZHBK5c}FPG&!k_m
zygri&9(cujmcAwA?s=%f@ggTK%D_|Bv!YqokQ;i>P@0O-$CK{gDqfZg844-9OS@2`
zW^?(&LVSV~V@zR~S(wBvS;W;9ZaE%Xg?bjr#Ag#wuMU2#g(HKmPmU!$aBt#H4^KTS
z7ZY}tez{{G%gyDk{pa}QFQueA6<nYf;K}MGnJv~qJ|ehLN$?>d$N<6CmY1M)@_di1
zk;Qn{zLa!Vjl*c#$GB(Z?%lj4W;(T=C}5g49)0Zc`Rh53ZrqiljjYEv2^Ld?gwLg-
zpb<I`2^7fBOfPl6dBB3+TzQc^bKkwrft&Co1ZjH^GQf#sx(Csa;pic{G@nn7i)Fwc
zPR2F`xnm|IW=b<TLU7>XBQNe)RhkB5kN_tqd6iCpa{g$P`0G%!6qhE(R3ibK)_DyG
z)-|;O>GYeN6B;WoUqC_*sc$J_Zk>2o-2SxLx6_!h6tq$(-69C~Wzx*~qErU0Lm>od
z=OT|KE=-<@RBt#zS|a~)=@KQEBvREeJD8N3?NF4ZdL!ZG)r0)k$C2urub7$7sB&IU
zR}=0<1Whq?p&#{F1!%z^(rU-;C}NgwLJ<{BRvIzfNY6#+(upyZxmxXr%~bMk14b8-
zew~B&$*&g1*;T`y@^V|LI2L0RF|U5zqaO{q?!~KR;<7SZF;gTwHl7qq=+`^0L~*?{
zZc-xKZ2u`siW~hslTsD^`<*XQB#v$=VrKehk|=J@7*EOd_v@d#Pm#0`H)Sqi7R70v
zp0w06rL@-Her2Bj8o{V02b)9G1sOICM@Z^X+khyiypCkDE7R({-Vk3?TNF--4UJxH
zxU6r=vGmi^Dk!VC&@DwQV2ZpwMGz!ZK=VQ-Sc0uK{DwQbVv<Xn<fO>u^X{x<Au?)?
zwrHLJEejiB&nSQKHc>pD7C(v18X&cOhGDKHRc^aQ(1U5)!c*aD^r9uVGT5v`iT51~
zXq{G-xkQM27;eYZ<w=c7><G|m0%?@eg2vij2A^_}$lX%J&dbI(_;&ert?r}V5WVHB
zevD~77<uMVC(a{3KQp)6`;`(=fu`_gCNb>D82l|o>}gEko0I(~xg#x+X@zyPU|Y^p
zip}ew;*U|UE-=1-1V^ee3*|OA(}bG8WTvTDKXX$d?-7lvs2X!CKB2PrLf9E!EuMPC
zMwv-KqU_xi2E;RjQX*^aQLB{l$0l#R`>XDH!)`HO%62+5rE=srs_VkXc<4Dlip%Km
z5^JSRnX43=QSI-TX=@3XZ~E=mro&ODts}cSkL0zmCOS%6Pxo{_P<GH7>_gkYO1%)Q
zZE=hunf4*C=|ZU4;4zv9w2wruE`&Q+*f6}HZIpewaM^3nh6PRAq(Z$I6=Gq_&O-NC
z+jKD|VbGRaneK_f)y24M3p@U!bj@Z@7q3<f+6nv6wOCUx#Xq*N7f+^ZbueAJ-alwB
z{eZ5`_3BdMjKy*J7j*4jPnZ6yh~0R>I3?S+*5);QCK=5*twOWj5n}0{#=<nCeQ>=i
zVc0!OnQ7MG+Imm6rAO{jrdMWt>rX5GtBCzv5kvnaMJ%iXKN3O^3n#c1MR22oAQ?iK
z1}DslBFya|yaORBh7*-V5mj{%J%A9`!-*TCh?_fz+aV;~aFV_#lII;HFCe5Z;iOYh
zq^~+i-$KAkaPa#m@J0t14S|3RAb8ObqD}~yjEus7j3%0lp_7b-jGWzooI9GFzmr^;
zj6&RiLOPm4zLP?kj8e^jQZt%Tx0CV!8I_R%)xl`0!<|$|$*64%sE<cepX#J`CZjoH
zKyxmd=6olO4;d}OfHo+aHms92l8i3afbLo}-HlGVWHNfvGz0pqX!_hv`a5JpK;VCg
zv_B%!ti$$Ul(e4^X-E5_te-_4b%_3=q#35hh1Oj4boow6bH9GL{CbdQ;?adfo57oI
z-bu%9C&i8=pSgsxzk|9mggWb!a-uNh+DM8=MQYq)>Z$LQw7@La@~p%iBCRqzX*3%d
zn&a`sN4uQo^*xbxwFvQRB5kJp>PmTJazzAcH<5NP?$3#|qDSc%B@IKQ?f7VSA7_<5
z$^Js5ReVRJ-ES}YhDiJ3qdn}cT6kLjxbMO1zQ=2QHH*(0oBQkL`kUAL>ldH5bPP7G
z4mE!!(puL>+Ezw;`o=n*kN4~)()xE3X%nwUS6{!Jc{{Q8c6xSx>cjlhn}ttA+UC2(
z<@by4R+l%{-l5TGOrj7U4fsI7s8xWfMc`BLSu_=-)CWP>brQ7-Qy+%Wik}>8DoksP
zgsO!yY8RzHj^#1Rv3OjR(R@wB=1HP<ac1icnKQG4kBhU~lVJ!#CY`&tI@7db`Hnof
zo86rSPt&=nQ<Br0d#L#2(36tfzB^X+p-j4^dHuyFx^s>+m)?F}=JN8%P2IBmp(@X%
z*`emLJ1-vif{2*)$_qy8gDLneTgnSxHb$}QCh1iaO*F@gpBiqdD4uFZsf97`ue>|c
zeak4<vbD10RbPQkbJG5*(l^h`&%7FLttxx_q6R_4qF-IU@UkhE|7crv#nMzqnr^cG
zy~>qW&x%jI_}fI91LgDx0`R1G1W9Qs1E+@A%b<|dXQxvx(E@o85RR)_Y*bu?1_+4k
z>DAFNkxZJ@KzcXYmk~1F((GXF%;_|UF?Rnkq%5_=xQF~l)Od{Y{D>{7Y|}g{Letb?
z!cBY^krw?3Y-H&$neebxiydj4Ix~5rJfP4%@aII@lU+nw#2zAzqdmhbkS|Ad-#jcF
zb}W595H>sxN2;#_(9^A2i-2eC`xL$qX>PlSH1^*TX-z*N(%fi)*|61d|Ib7kZH&GE
zhDZy+5NSD|h_uM2pAu<HTJ)Zqs#`>wz&4Q<#X7pK7EUZXg4iO`Y=U=)wDmtA(wcS=
zX^+{v71ZxE0>2Vz3TQTzw8l?~w9M%D!-3+YsPVIS!DY%f@lGtk?q${>eoLgi{6eIi
z&>CoYpqV)n!%n%ENJB+RsnSNb`G_r(jBrM-QpkYEHl50Ehh{<d5@|xMZ-)WNt4#;x
zk3MFn(KwX!Zi`5p`5QzU_g^8>{Js!r%ij=b%@Expjr_c+Nacvrp(fZ6{C#~QJ_<WT
z+QJr*R*xal{1l{~@!)5|z7lD3#6UCax0fYLG~F+sd&9Rwq|NLh(jGKjA>RCsNbAzl
zBmwlwE{*D6{7XdI`TG89ER@A*xT-W|x|B0-gvG)g-wR8435T?_5B`EkJCE?Sg*@?Z
zGK3CL_$xDCCAui`V<Jt3h2HL}^fY^<#ljmG?0TNQ@joHbW<hFAI-iI%Ef$~D<J1y_
zkz#XgEN(?ftem!gN~9&T1|q=^ZtFmqSMand@E=5Tb+bG@WZ^sP00(%4c>CR+u);z{
z9-<`#|A0uFwL#nmMx|<P9Ari>BT8hSWlY4W2t9FFadCFx9Hx&$NKCUI{1K66%6vWQ
z4~ew&TBl@ot^E0al}LNJL!^1uXR8J&`<$o?(9r?C6;TE2kTo1<VckdnEIv1kDLq&7
zk&DW>pO`;oKNN0?ujG5^2(OM8^q`Q|Rqb~Zh-ca?Hjkc#_vPJ`rVK^H4n+MCkrpTp
zVP|sgu<*59i9LYtcii~d(*E&ULDlnen)#G)>Vat7CW0pXijKhSrGbtERqMSv1d_fd
zp^=8vKPJ-f!Fz}_2=g~YT9X>x2x(dQ6~6|j8ykbu`el`Ut#fCqHiqUemldyDkB3gD
z4dZ4PRlgVPkdRqpGcc#wH;l3jjyaunLObZbq^fh+$obUwmseHj^`nDz6JO9q5;`kK
z%SDW<j!;xctNaBbje&WKNNZvxvE7tW*&@<r>LJ0I#)5GRHipY;yNNUhEs#=NG?5R3
ze}wtW-y_n_WAiFu68Kw0TFftrG&Ppoks)kdM`SUb>YcphAgQ)LA<~jm?ws==S1MOO
zGF5EIB8v|~CqNydX2Cxv(ux$iAc2=RZc;`~cmj`OKkYXC2n7|7kxZ~}6KQt%wj2<S
zM&T_YEf#m!SJmMm)g=(rtixo$2owkhO;DIkEXvs#D=M%bn08ZZHo6e_H;A+-+z<bl
zNbB<bOr)`s)W-@ds_Q@P_7FhFi=Dk9&(Z@fna33b^2Wsl%TVA(+bNbVAwEKl3K#hc
z{e|MX1+PC-!=y~m3(hIDm^C#a<9Ym2WA8|me0*0x<t_5iSfUb$U}3$TYzME08$<y@
zG*RFW<#5?IPcTyu@P|a2r!QVIltjHra$i07ajKAq+}xT!A=0`=z#FRsg~w#?jfM8o
z2rQ$tF+`f@H$+-0xI`0D@9C?ksg#6cP@*nhf+5o8@mXw1#83yL3?o2(;$psH+eDi0
z7Ln!*5FMtqG3x|NLO_8vnk?yxryD^SBF*zZNu)UdNY;Nrq@{tW|G!71bwi=Yd`Y`O
z(C+yZ-h$r{X<aU<yp@aqe^Nua3}f>QQ}2vJ*E0-r2>u$87KG=pL!`~)7T4jcs^L5x
zAxVZ2n?)&&p)q?5{<lJPG*(drezRF_)>)qPZr>AW>+|?#(DQbh#K+4rACqMj(C3;|
z?jq8x{)|XlBl<+7E#PaQNFH?XD8S_B|CmVY_Pw*omvJ`~o@n4xt|RbLl~7&h>;hjP
zuAO2-fg$k(*bHz}V?K}KaN(055owXW>dU>-q5ee^nVA%J2gN<l(%$l0M4x0dpf}Sf
zC^qE76&<)^v`%2g_lZb5|1%=Z2ESZ957$ok8aISF>`?oFAoGSz@JgX;?cHHWpv07<
zjy&Xl1(9}&(2$VyIGp$hhDeLUt%<^M`yr9$_6s5nO0o*$vc@=98zokDh5v|1<J%(A
zLQr+x7$WTkZXrs39~}F_G%ylQq$HOyaVn$RCew#3GhQ3=I`;;TF)8^9<fsOUtkYz*
z1FV=y1v~8w@{12m5X)OE1*veh%Gn*#fG7>tR{GUX1L}-JJvhSQ(@~#@G`~M2(oo<h
zXsaSYm2|Tx(7G9=j{+o?SQU{+*24>WnqZ9~(k}f8kyia<BJH@Z$%Iu)(<Xl7_e5G0
zu5(ASP$&3;2W5SD%M**1Rz1<y&6Y-DXje7a8ZX&0EHguZ>CxdwFRPv)Z#+8nx~}3M
z5^3xBr-*sPAX`Klrbxk%9^d;4?n3~lB-#plytzDsqUD?)IDZ;)HMGIMwwrRHn>m6D
zvBC3nK2tES+4y>o2_dO|1nF>14~`>=hRa>qA(}S;x6H!ceYZ^wa!B;YICS3B1vRJI
z-0ql0Daw85b!uh&N~A%4M5K}ZKSiVkTHW%YzqN7wR+yY5G3}WQ{^Og1FP3k+MDYC;
zBF*>TBhpyGe@dji$L)L~cJXDNm6>-|nL-kGcIFxH@P_<W`iC-D&lu6x1(be6z*-Qb
zs+8mgkvuyq)nN^h=hF=_MA4*XQT+x??+IQ3$71yhn?8^S-zR4c^D%r!a2$q{(I&yN
z>=791Yhk2>Jq^Y^gl*PwR%&U|g_I?E#BHO`hwx`a8arO$F?{h?6#2Kw^v;_e(1j#N
z9qk*MIdVAmF#k*z|2{>Y_;?|RIX}drdHUF^xmixUOS_4*1^o36eY_Ns03#*in#1IV
z{1+wpoeyca{Z%3@8rKZ)0vjDo`jto%0^jTcw+_!;4F{*)5R+6kSRyr3q>z8=`&K+<
zk(aD$Q>+Tj{8-Ou{v!-$01}~e7TUTR&O&+i<47x;({qX!%o-5fnF0lNvvB;Bg%U%A
zM*@y9l=b;D`EvF*tj@BsfNCYtQ3k&n$Ga}c&?W3>oPFAP@7x}g729H25RJ`qkRCZY
zow~Zl4+;FML>l|gi8Sbcf=DA?V?Wd}qJku#60&{PF{&0!2G0CzL>l|lH4Krqf+5o8
z_J>N0RU0gnh2nwtt7Hr?%3Vp3l>NU)q`l|aBGSe&M4AEV8Ly}D$9EBFn`Bz!4H4`I
z+XiLbXBt18<Zf1EUwkWDM|0egdChCQGa7H|#S1h#{<7L}43U-)D9heKhNy5Dme(hC
z54R#^S^*eO%j}PT{=bAs)BZPzv=^(dv<ruQqxx7L&X;H%Xe7V->{w*$N`J7MHUet*
z8zN1T<M2f#tnA+rX<gHeEP41Rxru!)!B@>L3hrMOcn2goG@@4~AKxD#{KzCxVwv?8
zOD%__*Hd$y><nuAeGP^+4#3iWokS0zwFx7yCV#w(nUd<Umwhu$ltkSuO~M(M3m;ua
zAC0BTr9QR%IK|;$mY?~_oM=g+Q@1NDdtcqkGWB-6c>gfNL9b6lnm%(w2MPbZ+p?VV
zb9KwOVQ;M&KKuhB&GThM0p0st7H@p<$2S6&4b09}jc0yXZRV7?p)0EA$LKYkcFoeA
z{jU>g@Bf%cyB>(<`gj%5Fas8D_B*PrGaV`2gn}wJCF9o{GA%kr9qe{_fkuuiv7got
zBupPA6_kts&qis37e|5T52-6*b*iaile>uotE+Un$Ox%_L!?p4{*p+Whl?tFL!{yV
zD@2;ruZT2>9}{T_xD<sIe9rM>H*CqH`>P+dx{~uJ&Wsz%-aOmJ=ox#{@QD_wo92Fv
zeWR?stXcwPt4jXJPehtS@PsWVN!NUk(jO3MnGQc7(u)7HL|SJM&j>ugPUagTE#u!N
z(zyQ~k;X=H@oxQ<Ds4@CRyNZ2seOFU1)Y653-!^sv^7|hbM4E|Ar`^MILZAd?~x|b
zd?c62ESs(sNslvR_EM?OneG&kc#Y#UA4;KCfFaWIc8D|&BzvYSNM9?y6!%hr>RiVk
z5osYL{O_Vkut!Lw)&L-)DBqjz5I^4)=o7>1i;dqBY3eNN;o`^HUQaq-eF+2yFT@=S
zBgGTw*Ua%1OKxN2IE_z;cf`K?S^_620B)uoMEWejfro?vP($Wv%Afe^b>s=?H$)l`
zx=p01d?nJf=#3t^1@+h99*je1#!c=e(nj%xm+N*DX{V<p<qA@^iL`rAH4KrKre@(s
z!Z=Bm&UusLSlTWk&7UOXtkm5M#S@C(5NWZ$B+|6fp8C&`<zJ-SL!=d8LB1u@-2XX|
zb_VvRL|VmfiL^`j?&@EOw3R<2(g4!Ci8R58_~Xwfa%geK6P!m`0XsxmdbA%-Fgso8
zROgd>E`OCsgCkn%!&^_m=m;O2dKHcRFA`}ZxPSsbK>)y2Tm?Xj<8I{(Eb#L=RW`w2
zaidC>OFhW5S(&+0ezIQdG{E<diL``&K&06qm<ua%tEBY9t8D)ckwz%_TO!T&UnbI2
z75@g2*0Y;P^V=rUBs8aS1Y&m)Y12DITHsHKw2o~eZTfp6tyyL|p!5}v(-x5y@CQU1
zo@Rlf)VD-h%r=o0sQsTJ(&D}+(n@y`X(~<_BF*ZLiL@xZ{pH*@V1G!YQ8;}f(#Rb~
z4BVq|IetZ?8ESU;0)x9~SN<xIcH@UcT8^|x=Z)#WpAu;&K&&Jtk~jtzvW>kLen+H<
zV0#`4(6mA(t^!R5dKG^`qye#iL!?>n5NQ;OKP1vRc8D}9%wgz$3j^hSN2DDCfndJH
zAQfy8Oj4#!mC+c-+!ven&xo|we@>*4Yts5oFGZIk%-ltKNr2`OAIPvf`cM9lNQ?SR
zq(xy%p>X2)?_*TI+bhv-(|$k^faa0IoCJsa=K~qHh_n!ic<O{{JUO-JkKl(7Jq(;Z
z48Z$iA`Kw*?+|I^QYc>r4lJod0MZ8B=_CIlkw$Qm_CHOe9s0jSq;=rQ?ht8Fh;1Tm
z@-vYZtPR*9(r}b_h_uV!5NQCXpAl)jyNNVK*gq!HuoQnvq~XE-5s}8Zi%7#)_zjVU
z<@CRiNCSK((rW(GL>fTxZxCr=|2mN-0%FETSbQPUJ_LZK(nRLneMEqGL>@l0KP1wK
zyl(kPeI?Qiz9Z5APEmpR=UqoLenF&>{RfCNo-ah&z!s5a^)n*PPwY>Lv|!CIL|Vt+
zBGPPrPNV^_zY=LKe~Cz2`i@Am`XP}Pvxi6<*+ryH{)|WqRGI#UNW=H~Ln3YF6OopV
zA=0jYL!<@$8IflEiAcjK`<6%pNV{MD8Ii`vuuY^r`Ho1d`7M#wu!~4TeM_X}1UbLj
zCei>ryNR^Rdx$iKs9z9iLl`2>Z5NRi`-w<%+ab~xAE^d@BGMxF5NWZ2J4D+0pAc#L
zw}`amZ6Xc&iAcNmOCqgnFOe3sL!=pgCeo&VM5OU<5otWzL>l4~kv1LsnMljnBGPDq
zk^cgbHoK(tJ&|U!MWms&iL?mzdw))($$Uek8Pf}=V~DgK;y)zPhE=wRG>P3rn&&Tw
zw3tss+LJ9J?JNSH{LFVm+QfH6+M92PG&c;9He1~C9g(*B9g#-KyhEhTY!PXxV96~a
zE&30LG}>PgX%4%Iw5S~-t!6ioc4-%p7WEq<&5bsBhe%V~Cep?+M4G}5kw*L{M4G|N
zZ6b{XL!^!U36a*dO{B?+e?z2c?IqGgz9Z7;e@di9?IF@eenzAP{zW1!V~0p{zz}K6
zyNER2FGSk-4~eviEh5btToV63L!>QyL!@>8yF}XJULtMz-zCyEalaC2%3c^E&DknO
ziFg59_A`;j8uXb+n~%Z}X&K)WX^;OAkrw!cNK^USL>lofBJKEIBF*kQB5mcTMB2zG
zPS>|Ynt?K9_coC>`I$(&`YR$00QUR|kv7e4x)A&yAku>W8IiV+`DnbtYa13P#lC+=
zq)Gh?MB4s;pGedDLn5t4h4yL+T@ovO=66I|EtXsdEA!-UiL`o-UlVEfure;P@nxp+
z1zJ;z{0WiP|Cvau|BguW|4$NWO+O;iGF4Jrt<;k^bbdpmh5sEQt$K$@)A~fDY3(M`
z5PONVG4`h2L|WP(6KPF9BGMFqygNjiqCeS*dg1wNk|SS;G;-$ei8O`Z5ow#Mv<(gH
zpNO=q&qNyX&xkYxV-to*Q`<wNHPr{Ms|9(3$}ajV1n(l!Zu)&oq-Cg3k08$f4-si2
zf1OC9_rI~en@GF-nMfmH{xy*{@@pau!2BB`ZS}WAT0i?=Bhp^(BGUX=dukFyf#C7)
zi8O5HUlD2bpNO<{mFT}oq#?J6v`znAM4I|uA`STskw(n?zkx_os5@mn2d1QC{+3Ad
zqc_GPzg5e$n@Ah|8Ijf}{7;Frng0<YZF-ggLx*t=sN%=!+NzL9AcJjdb=meo9@k^q
z5g6xN_sg`IMw^a}`x8_8G0hwRO}IVqB2$ekAUGA4Zs@EWXDZ<SDqfq9&F7AChY;~8
zqzt~>@FB#(Ky?zAgnU3QEdCT>buE~^S<OJD0q#WTA|CEZCB?m<x?E4>siurX*K%H1
z>S^+mmcQJV?sQ?SzA;lRnrew?89^gm?3$^vG)+hxyCBgkTB8J9I`Ve(LLHMJQtdfh
zB@(}gQe5>$ArpcDPHKDrb1Sb73s0PVqXE^WcA(aDLp4!E5Xse3Gr2PFEJ^0GKaRV(
zVN?W|H}Z{-CbY*#i{JLquy^}t>IVE6AI<Kwk2WOx3m>fp<D>C@_0gK@!O0jO4YbQg
zYhcItXicC^jE~lY;nC1ve6)uLr(nB$v>`c+kCrJl>~;2ol?O}Y7az^n5pTDT2KeNo
z*<yS&QuX88KAP_$<((ZL&E>0)R<X-Ri`(|mjK272ujDX3+U#c^tzTLP@Wn?9S5V-v
z{o<nufA-PRCAWOEgdHEvZLg1ZH5jbE?V};Qe&(Z1NN)RR7#<D%*+)zK?4ya4Xn*vi
zm_=yUA^graIBof8T3>xMoOeXT7$42|laDsCa#eTRN3+2AXlmO&8f42y8<b5%d$p{V
zY0|QwXx7JkF+N&kim+UobS0WqPK&2F?SNdy!S8*vi1fp9+1Dzwzwyxm#YB?jZueE*
z{(+A+oA;u!kVU@8nP{(%mY2s}RdQ6mw4HF5kM?$-P3x`WRTatdl`J@p=P^7Q`m>ML
zTxz=Iqgho>Ro#D!@zK;Zm*i{ks{j8=q=~2KzOJ9SbBXUANclDB_1k*caD==kHlR>x
zPJT?O03_dnP;NoU7pN(WtIg3oV7{-UyjuV2t=b~PgQW+fucWnKcdsoSe6Vs<dFU-@
zK^R+kuwHRhP3e}BQF*;w+=I0{h*kNAucdwB20?ES$c;$EX0qD4aKJ|2N4apd4+!;-
zZ+$+38p>U##@58Qi8LZALW$`pYxNL{-x6t>mo`Y}if7(tHd@{Ge0SPIpCesi(pc(D
z47arix9&A_>vz%DC{#Z#%6L5~K+pCfOcLY@i|1?~WW1jfd_zOw_zjWvD&}Zw^~cpW
zZ^~N}ip_2#afE0Mc{<}XqS=i3aL8E&beFus<s?rvwBYAf`Yq#yQixpA4E1mmKFX|g
z&aCY02l}(8`->g=N=Y^Z>JrkyZHK4wi)uYr=5AM&2@fj<R$rnYr<oh9I5oE#m|H4X
z{@_B(Y02ix@M)>TH^P}(rdqnWEb)d)a>ldiRc&sVN2u|fjup&^0P}g+%qMju$qC<E
z*{o=!w!hwQ%iuFO${7o%U!D@n$rIyYG*;+5S$sRO;34!}`YNPm;j}@UtmPtzux9PL
z{D~WIINfmp^rh2St}KU<4$iTw#MiT~>`x?%eE2+Ef&4MY6^oe1TsQT)G80`wyHFQB
z<#`evC$rsd2$i`8u?R;LW)xjGJrklA5PvElN@4NDLzLd2J4GAD9ukjS++<DXw<aDd
z=Kn~%2!>&ONJ-<@+BD0`H60{~$X?}Z(TmT|EQ0eRa)6yEokVyKlTiGaf8~Xa=^Q$|
zeRh1bi13+{c}0oS$CENNEM~L4xL)P-a$o#F^~@@O2@@~1PIGv|cUys{ETCwRJWGgR
zY%0<5Q9pO0>DZY}Dx0~{r<%z4mv&6{gYJzt^`sKAt}A4o<ci$CNYF?D$#n&WIr2U9
zPj<daZqI-gxvcYqfEPcdo{$?A+{h@m7@TD&M14eu?C@YAPK4>0K|=_fCyucDqDG<}
zqu-rciIn}|lMe~xHvJk1l-m3f$bI0hK#~P@`JUX9QU>Ly$52^3cu`AEZ^-_^?3~Hu
zPJC`YZg0t}vpKi#)4$3q8D2*vKw{j=KxJ!>SR7tvUp;-U&g}fKBdL7szL}@)1>81u
zvSHU0pbogh3WKg(k=J>{uZ`rFyJSAGS1_~54!L<NNYN5Xwr<msm)ePe+g#bt#L2RE
zLa!d7E<dK@QVP+>D>?i`$%kAD*P);;WMw*|bP&f@-H68XWd21o)9Oe7OOj`Fbv{8q
z@9ps8uhB*KUdOyXSyeq{hKQGM)N73xC8!razt~7EO+c3%bte3AJq2Q92x%pfiZC^~
zuy!KRfSc62H$+nApu1sisaYry7RES`OXuyl*Fqr4Kt_ojjO!!fM1vpFc!(INat{88
zg+d`B??g#lHIE%%@EGNk_dx}UBuD_S@hIV)v(>@KR<HLiK_#iZs0$oHEG-loN>5d2
zi3{slraCMvOS7^NcXP=J$#B;h$1_8;N1<8f?X9bLMS1h=5;zWlqJ)MpBG*|TeJ!d+
zm^-N@vYv(UhK@oyEa<$Ry&{c!oz!X}WrN8{L`iY7GN0rXW5xh;U0zlq0y8Z&X7cEe
z3)<+#(_LVi*+*P2=VO#7J2^`{LSnAwndYq4QrMh!R{S6nEBMq_9RW39eZ!_Mf{Y2e
zC_)&Do4~@PAex%J{Fe6u5HXVoqZBsXM`%%QVq?jPqk}I%^|AbsVF$F}dcZMWciQM?
z$TP7_T1QhYaV?e)qE-HdI?+2sTAPcMuGjSI0j2fm3}>jWcb8EcXPGN0<&l<Hp3uew
zd)Ejj&h#S*a4lu{D3>u3@9LqkL`nsmhqriucJD_B>6e#vGqtQSGO|9O1~P!d+*#e!
z7dzCvkZ&Jqnt2IB!KnwdUg}A6y?~vdj7i$^!&CV(C8qSf28@zFQr?=a*22txIS@({
zB#Y(>{wAcZXBdA)hK@jkQ|4hg0TxxRS?{cA#X#>-Yf_Tby1H}K=BC9-RJR>WUTJ%(
z;0d8pE}XjZ%3{X+VAU|y9k1S3mTLnCAAF=L*do#h4j-y#rY;OId3}uT`JqN7>Z0f?
zuWfk`n>AZf7bo<-wwKlIPvsidkx99%uKL`pJBhj^TT%Ob=-sFb93-r~IMA%{fkNbI
z_Jo|?H%?y94<idq+3wiAP_d7eu+GCGjLN;;2muD@u2ENZUdgxKC={4FL}31&7SFvj
zCGpI&W7Mrp&5E8X!PTAA7nsg8$|A`kFWR=S^wO%yJV~X;q(rYjs(wVf2*p7kPehQy
zQJ^rmAC7>?xk>`ldH-T>>a&XhT-G^y*W&w*__VOm_79kHhL46Qpx#I5njw;ry4|u@
z_YvN{^+awiAh1Tpk0>q}kG0$?OjIUHBWg84pKgmt^GpQWr$1{Gt;cnIX$vDfcqPZ6
zL!mm><<6{7lf5*Nk4zs+n@gRyWmTXl^a)c(dV7}d7Ln!^pqj7E)#@iSYgNQNpxPwB
z=X%w3+>d4hYGIs7Y;Z=V_Q|2AZWp-XJK;z+=FHrN6uc07O=bG72ZyPZ+v>pQ5*-<=
zWP@cZsYtCQvZ$hHH8~fp4)oF@4!~-8tP)4k>`R+THagsR{QUwnG|}{Z6;C}1PLI({
zCa`xCRNyKfFqP^>ruJm_W3v=Q$zASLX?{2yc&lcf@={F;fe+7{{E8t*XEf<eTg70*
z52H=a$qYj?rtd5Jhn&tmU>IJw`o4PRi1Yau3@_H6zQ4aV<m`iH7{Q`hts$^<L9j56
z5*%EuqZ@V!Qf3?@ySCcEYv~$xl<_59-|8dTVb@3>#&K4fwI*##x7cLH3EqQiPt1nh
zu03F!6uq|A;$V5^zeL)?HT34pQJ;+$Ea<g9^vAUqK4>%x00al%MFB8%UtkCp1ssbe
z3X7owiv<E?hXc8zfc*a@(tbvyp?48!48;ZvWzh^(oeU4i80!rf8>1PUI~m)_n7R#^
z`l6YhcQU;oV}5DCJQdCSs+0LG8OxFZ%ll}SjZPLc85Cp)#fyOwbwR=8tQ3Z<G%>6U
zU92qRZ0v??+%atYU2MYS?Ba&((lPAvUF^!_9BPIfnlT)@T^t9<IgJcC55{mF?&3U3
z&ShiBbv%aaR2P>sIrkYu?sGBR=exLl$axTkJV7x$VO>0t<h-$lyw_rQZ*=h{lk=q+
z@@2*F<#zGiA?GhP<S&ciuj=A|KrT>kD9{)q(A*`^PA=GODA*Sx_`FN-1-Z~mL!qe{
zp;ui(Z^?z1426x}#|Uq938TqHKt>{Xu_8p>B47$p3L{aPSW$*<Q5Fg@b|W$FSTX)?
zF<}aEaU*f*SaJDoab*e#H6sblSP9*3i31dpMn;kcV<iuFOCF_I{eQ@rbFn}A*q+Vx
zxRtNNp(hSp9w%)oPl|gw+P63gcsrkHaTaNH6~E|q((kNO`&l`}IhT%ea_yc90p4!y
z-mngDrOu0Lp_k6Sxg^%<qZQ+OrrTFD!q4-KpOmq`WH;gusX6tZQ*(Qqxzll<oH^GY
zICB<1bmn%Dxl1X>_abwrd(siZ=@&{et}kY|yv)29^gCqketzm$erU{{OEq`WVheo6
z3nQ)+`F}>{f+p_9J}SvhEDc>L4QndPohXZ+DZ7$f9<k%h{il(+du@edZ8dXk6{~H9
zzeVOA_tkuH=5~;|mVsY6a|7euKXT@VHfM(3&yG%h@60XEt}nh>Se{#Yw}7GM-mR@{
z{@0niSM~nwNPQTZ<-q;wwWaCq+@tOH?`^!V>L$5y;KBV58_T1wUbH_*&!Gh1@{IUm
z6XNgl!RNXK-M7b?i`wJN$<%K-bH}K-NUiH3a^E>~He1fzONhx=XAYP$9s^q*Nhg(S
z`Qpr}j*gQlwiHZ|nV*Qpg?#JGh3s<XNFeZcYpR5zFgj?QX!^Wr^2Hrz&Un8ht(Q?N
z#+ftPpN3l^9?mxt_t}}#SQZI~*=##=(^g3Jjjzs};+8XaH{AuP;)XBNkjLf~<4;Y{
z$sWX=CKZ-RmPOcenN*6j9+X#f840Gu8_VIpbDvs**camu*@4;V!UR;^?8jbLnGS>)
z<ncldNAbB)ZaH%!Th5%RQHWR=Welmnm713!j0y0{1Dtb8c{;L}cbvKKFtIDo<l*@R
z#>CCA4<BDWzWp)%CB~Us-ErnLIUjx0fn%IG@fKpa5ySz`98V*y9cON1+nF;a7p#lO
z;qMUV7w(!7uTT{&QXV!g5>Ntm8W9NG-Erow5eU2y84qFa+IHqtSW$dH5>^!LN0}{W
zPIJqdGg&n{MfjlxG?EOsOdJ^p6gv#h2ma8R>ri8DCpISa>kLc+4zCguKm|V<$M{ct
zq>Tm&ebjP1?<+pi{l%F(wA-1JGal<0#2E!ni=!VFL`tbKVw^egWfCjS%c~Tgd!4yF
z(stS#s>>`ln0GmIAR5h2&fJ@qbO6HuF>{GZKM5X~l-AJf<rU(pnHm<N)2R0@nIOB>
zR$QEhn{%GrC46xOi~%_sa=_ir98lCa)u@%|m^V5H3gv>NJ5p0ZD(U?d{fX~*1D5fW
zPJDId-hJcD<wA6GzIWyd$pI2i$+w(2<Fv2NoYl57N6iY+>;LS`N$z&$-t2Ma?l<)k
zukUu|{OO*#;dW{Tedo;CQ1bF54nNc4vOnT-u43In!sD^7>{I=-cTy(=U1y|k^ymAR
zY&&z%FU}m@9%oK91s<>GS9QN1tp%t>1f>z5@akDs@xd0uxr=e;>_0hk3>arFFzlkh
z51lzC>+hVoRpP8G>=Xb#O?7VbkkEI0xK_msGH;%O3LM;N85k25CV31(=XRXAKp5DD
z=>*1^%ldoH+|eI6bG_d>bKq@fu1iIEJ=7reaw%LC#VFH=11+2T?9BCTJ9Bd1ICJR;
ziPw9bxmyiv4V?$Dm`s@yb~$r$s%c4tP?}6D+Dk^1#~$dIKVqA60j{-I8h0XSzBqF-
zOf8|+k56}IOT7XLz9y=^U)LjkcFo_)ubZXdnVqM6iHa;I#p#c*0#BT=5aoL?V#dmm
zqce}obhNbb)CV0;QN4OXQ{d{+dNDuzPB$LUGyq@olQU<#*O{aHQ)kX$k28lUXXQje
z1KomOwu0n<L+<2ev)Tl=6#Ahz@Q!erlj0LLFE!BSKm)~zKRa_22Z;TSo9uSxqIR6Q
zY5elN&fMu8XRci9imyJwE6WXYUYi2Hf`C>;y&^t1=UJxU;SaCu<)3puI{Vk1xz~T)
znN!3#b0fQ)IUMS6bgpWJxEs=+UY+jT{-*Lkg+{C^{V3fyEejm?rSOeGp0R>0XD-_M
zlQWluapvBnVVpTij5GJr;0Ml}ACV8ujx*<uB2+qgm|ergONA#pDgn&FlvI;Vs^BVy
zkO^V)?2~^%^Kq$;0%w-m?;){RbO<Nk5vcr`1|B6IJRV{Y;f^y`VIAxj&a_NLd7`tA
zIULwodJ3Lh;cvo3Y{QbX<;-0~7E^t8=72nuw+Zq5gGdLd&V`$d;t0VhS)8XLpWh*0
zv^WWA#bfIZ+3n1^vB*I_J9E^8;#zou?r<vtFE!_SvFc677?@u=`|D#-7-tTOapo>=
zJ9Fo@ojH+R&Ya1QojG%iGiL(|u=;^B7cdXZv67xaDJuFBanTBR){9^1VC&}g8&Xxj
zat%1s4U)5xu8u|AQ4>yp$ZUwY4Ur3IY&&ymQQoLxPq>(m1rNp4L%wPdjs&;uM2$A-
zipR$&9SEn(${4u4L)?E^X|+HA2g{HBpd0=af$mj;VP64;CaTUa&K$*$oVmMSoH_R2
zJ98!@Th83&FU}l-=<c>NC%5g)DFQw@a~dOC&K!J1D8U8l?kP?-4VHpSST<Upe-`v{
zKFG{~1O}C@R09XdXt$%hG0t2P<d2-WPK+}*y~mk@Z##2}uxN|YFnR}aTQ=OXqHmqK
zyBKF~1fRv2MEtWeC+;hD1(UOr+Uv|oK|ldJ&RpNNGbchQULzn?a~9qO)_MjNUR5zL
zBsm)^2a+WoSc)^40sD;+Q~;xfQswz$fqCN`%kx0kNE|#nDrXE#Vs@zjU#jGomz0&P
zh77SL02^Eujie)AF~zC(1^4vwI?NMqe0Jt?MC4lRAr|S>*N&SNrz+Z}g6<ZBsc~`Q
zfbp5d{PiL-v~^m72NeR2Nw@g3`paIA^CuGYM|$!?=0y}A*}+{M<a40cFL^k7cwIYl
z?HbU408y_*$HgfHlMkS~$=S(&#9w;98OcP^5%Ls}CICkY<#2)3jR$RJfTQBd@e)q3
z;6la=nGBI|Q}djVji)rQkKw)fj*h$+?m`nyTH#4M01ACihl(&rPFgTu<VE3MM-f({
zhzC%l>!?;SC`&pV%aEkAlrMjY7Z{^dRBVtTE}udRJ#n02tb*(sK?)Bc8F?sarIdUZ
z6l$~W%ysQ{=3)q@t)Qu+&Xg&Hg1{uo6cAv5M%A0V^M}sd^{>vHqE$M@X!=>KOm1th
z1KvyqIT=ptnJ#=8e&VSKWbV8o?o^_g=XRVqBZ6ZXXRZie)d;6|gd|CX*nE#O7xmSd
zy8_3djVE>P69w027mKO2Ju}%D!8gY^bJ9O{=H%e`<@3PzxY*_*#IPE9JqPUq5n>l@
zB06<&eFumsC=Z6pYwrLL%@Ao8NS<-cr5wfAM3LO@;8EP|%n{(^ap2a@=4GFgpLm(`
z$bdj5l(fO+P6IS!c!Z>gFt_U)XHM*^GgrUu%$WmjYJPF%*l?fm(cqr<*?ezTKYte2
z&+YOroH<R5Gbgw0%+3DTnd^m|b;vy003<q{MMz=vduOiQmo*u5T?%%@iKoniLhwz2
z@}XwY3)4Z;hZ$vW08J|Iz~nPl#xnI>?i#O?!eLo)ona4Ti0jjw<zV0(*ri8W0yFc#
zh!|2lV`CXL`HCEI+bT&KBCjlYV#SxzCpM^Kh{D-rA-=JYO9M#8tKwy+#C5s$*)3~K
z0OEWZ%IihTjdVzrcAPmFv8BkCGxq?s?aa**CSg_{3*;M6B-0~=Hs~7cUpRA$knfy1
ze%!mT+l^x09x3-JsA8}Us_<EZHDqi}WNb;p(~T&2T>JSdCJ5@DYcw3LMlzTg&l1LS
zXAHm;2QkiE4k#E^*R}1;6`<rbthSuF%dmgXne)ZBnNPjzOX>^25!|dZyk2g25~Kkm
zG^wmN@ea9=;(SRDViHI+Isg%J;r{?-l`Ht{%$cM1I&-pH&K!ImcoE~wi4qGfBdrpd
z40RqEoqRM6uQSYf<l2&YY7=NkfA-AldmLY!IUS<6QKadoX(nLTldAAPIdiXn;LPRx
zb!V;|0!jyvuBZ~0v1f>PJQ{$LtPzrmju2MqW!&o$^iFA_R3RdK4Y>li>4Vit!P;5S
zL#D&nJ|WtkZJ|33(>I*ma^}PVpPf0vEoZI)z$t}x`IR%*`@J)FghcbtoH@8v_Xql3
z3{iL&@FQmq3m>RTB+Mr_+mXr(PZP-@Wy&E{AcQ8MNP(%KS*vGQV|{cgo`{Q-v_oXN
za%47TWa<Nf(G{I`ap|&T0|KH0tk%9boqR$tGh{2n0}zy&FrAW~^&&1bw=3nW*E812
zV-=2_*alK;ow3*|E_$pzOn#XZte2S#DsfeYECnb#TFJYZp1YwnArfBC31UcV)`=5`
zAT5fJWJgNNR<d{<cd!chZU<-v<?<1BE8v&T+%YI_6)+pENb%+#`CCOY&vR!BtYi<+
zcmSMi7BX-Mc_E{M!yjrjkNt@=H%b8OI1h&%d6**^Ntahoc)KgqBnM7HeKS{6D6bqa
zt|~;@GMfkdmz}xJZD%fQmow-8*_oUA&Y7DeI1c~LnLB}P{@IyJ+HvL#2qZTmO1gNi
zh&YM^bT8WZ&DsSS8vEVDICF-3oVldmIdd0xJ9DG>8=svylOH*A$L4iyPXyu>)(WAB
z7b-71j{7KP2hEXA50;mW3aKa+4$+fU#f8aWN8_6Rp)=R}y)y^@u`{O$-RsO{<CyGn
z=Hzxcb4eIyE@hW9r}v#RcNQDX4<Q)?M)j<cxApS+)j+cc%HcTk+VgmxD>3A;;s9QL
zI*=mIK0#?v`H!4An8@)^DjD(J&fIB`tq;|zR0BwKmB`OFI^hEf{kjS#<pUnpM+evV
zkcxOGe4Gz1QD7BLM1N=13+9!l@sYe_(m~*%cF0sKc@`;o0OLDGAS8+K2hJRVtuu9>
zIj?sMd_p)-nMqvLlEbWPTsw}}B;U5bYeF|()UGYv4AUE$C`)BZ!QQy#%)S5O%$Y1?
z<!DCg?KpGRKXm2-NAuK)-W*1rd^m<U+&6cm+G}NQ;(6blzO&{oT_5<RT&x>HsD$kY
zpDoxlMROj=wCG>7Ye|rFp0tQMcKkuIN+j2jfn|rDY(G;Il4~BPo)y})XQGd66k0q#
z(>FOe^!&Z^h_uo4{M42+clWb1*BgI4pl<N!qX$9FndNPRKXm5ge(cPNMF&=}chDhZ
zG0vP5vHRsu&Rn_Pjx*P7T>}KG3)SL8pK?(qBCCU|Vg47%WI<%cQ7U*wcNa7m9VsD9
z%;%REG@*#)!n*tFr-X4>V~xeM*xrj_+J>*ii9O~zb9Yfkz$VO1N9cT>;hjE|dXcV}
z*CzQLk%t3CExhe5i~D6>-qi~N_m6kAR=LP`wFxcc=^hYWtB#eICF=d^%qgU%u3+;M
zg<>-tS?ttmP3`H@Wj(TN6mP7pLUafwS(2e6H7@a3`rr{U-Gf&YJf2<|VZCf>vEN+W
z6z8im*SOc2bJ=p{__U1^b-Mh{KKDNx(c50xMcn+{nP5WKqM*rx%EGBkkmLD91*~i+
z&%A8vkYn#e+)x?7<cywutHe2BpGF)Rt4j+HO|H;=a^^INeSClB%)R^M%$b^Nr37p{
zbFf{`-1&~wpo^J;9NW&^eT*~bLCo|nJ9FEa3%h#qT_?tw%lOWjd$Z%r@h!kjRKyj2
z<;>+|r^`*UUAy4+guiUl?J=wS_5D?%?>EnMsL@<>@6y%0>?AKQebM9T;d386s9yzM
zJlo>2*O_~_+nH<r;><0x^U3;83OUfFk+WvL|9E~rGWVmmSjm*qg>jEt$kqECdRVJ5
zBibsK{y8ZRj^*}q=h8QQcIM<@M`B)^W&^n3eniAw{_9d1<g8JC6zR}n#zW<t`wILE
zV>B?%T;?8Ut_1~!eRbx#ww<~AUz|D4UpjNm;&CVh^ND&E4gq|0ffl9gGZ-FIZ6m~`
zFxuL7jCTSWERCA?w<b<w5$LHS-gf3XaobU;rsJmEJo!%$(*TS!7e|0IQxoV%Oe<qi
zt0mtFQB63+A%`hs5*>%cu$&p^YUa?!!t~k^cBOO2@}#V+knz0r43-Wo4yKF?4g1KW
zNq8C_Ole$4p=AIZyDFYzVG6pYz7RxqdC8w97=&NC<;+PVUba{f=fph`=0`g`Ineed
zsy_PX&YV8ewlf#J?aXO^b>@OUIdf*)&Rpkw<7a0Mwi>KF{Jw)OIE7HJHcNlpw8pEH
zBIs^Sih|k`E(h3Xy3Xv#pd4P;l~m&lQ4&Mlpxw?KDL)4m6KQ8HWK#v~)7FI|z1=_z
zT>%QV#6U>{P7of%&!*IBWD!R_)VO#(HVtZ+W$^^bCZ66@m|0>^l)5jF<CbZ;)NG>T
z{@TMY3Db#XU*!t-Yx0a(VVpT^LQ$=t3*(ZyqUBH~#ilK1E)s2>K0;^cIITv+R(5Fw
z#3JxI%d}#)_uhcI64yO`xkRp~T`}GHE)SU<jEK_NGfPYEP<8n^QJKg4VlnwS28&$=
zVbj=7T;p@k(3t$jnbV|7EWw0&pBN0baoF6Q5V|JUe`H=~rfQT^H~{zR(3NTsG1&~B
z0yTNW@0_`)!^l0(T<N^u|6%V=yrF*o|M5R(F*6tphK4L7WULLs*muUhFCkeYMM$On
zIWyKswxp62ijqjmR@sS^Em4%U6iK^Q-{+80uU@bB>+?CE@9%eh=lA&!u5+F9xUR=}
zT-UkX7o53$`VEDXDde?ZqJw9Hc#TSU7o53#c++sOk$4`BVYTGU)k4l3ga2)TVwCCX
zu`3z~1OS53)p;;1W_}p0{Q!v~0f74~)0yj9aOS=)I&(W9XYS)qXKow-*yrHMFU`k9
zR{H&oGgr9e%*p)4nIjxp3FLft=C}fdemZlv;nWku^`ek7XC5l{)0rcEcjjW87o52i
zWs-ipO+>}rrnAVyZC!C|W|uj05BL|Ix!5&V>P>4%hC*2*;)Y(!oVf<Vw27&#To&6V
zhre~^QYp;^Dh@$WXr6BBT#A|o0I&%Gz$mGuNdO0O82#$Z1;POW00T-!xE7r`x^PY|
z7DLd3@AmtXGq(i>s=g^eu4vtX+zaJ<2@%^ay6UxUtreH?+Xt|?R$%~J7<!A4unrLh
zD1^Sz{qD@|185@a0n}s#$ff{*Fe9Md#I&k=*Ohn#7K8yr7<lccGgmZR-R6QCO<l7}
z642W!(&Yu*GBHhe55Yv}{dDGD!GX2OY5?g5D=?SSf2V)GkxK|i6a7MbF85*AVImPO
z!YbaqH?~%Fxicrc;LH``n9iK{DgflUyp^VQ=BG1v^Pil#P!tk?$(3C>W`O3H1ny``
zM^7n6{0C<)b`1cm>Li~qL=#9LF<wn%6MYn+36zwq#OY7-!Z?&QpZTs85xb(KhnAp#
z*e@x<b6O($O4B{s5&bBj0;aI&%;6TCxr)DY=743++#n5BQoCz+t)P3fQ)X>@fu2TQ
zPRW$2$gS(5>N+AR|LDwZfk(_Cfm*;+4i@I6Au6PbCZSOnLt@xk5%nAAmOFFFG#Ipd
zlPWvkaI?LEZ4kPl*r+K|3V!v~-Z^Guv&G1E3r%1e<cX6fWY+04uGZYk8(BiQWXm|+
zZP@X-bW@as!Ddy_LV#_K8%F^|V6hxH6Fu=tQ8|580NnP5TLJ*(r@46m7%`<zv=W9O
z(qS0ItpFf{NqwfN<$(lzsXR`5H6#esKINFf1k<oBmGd5NVlo=&BDZv;Z<&gIq_GTh
z=g68U^fG92R8bl%!U#RMlHxX|$urly^}LB3EmpjfmOjF^w*($?1*?;8#v%yxO{I{E
z$le$OZ2%Oa#z+PNR$H_Mhog5Hp$#@8J!>xqQbA5C%C{D-pojJ(16V3c02%3I7%NHv
z3L}~bj_uKwIz=nncqpLNEJ~ZuCKL*IQYah%Fz!o5<6;~u02HpWG7;e!sOi}sgQx|a
zZIS344Ra!WkFTysJb>71DQVVTo@c;op_OVByFRPEs>UKB5c$v-fh2*=yiyUiI_bzZ
zt21VDyBPM*4*DiXWlx(7tj#Y;(461hO97~WH@hxC1o&HPuONVZdrgac+Z`i;q6Dzu
za}=hw3I<pQL@FJfO39eIBcfO>k4Kjw03?MbqHa*cZY*ME9@eV^;6P4Fdte0xAcK4l
zqlz^(*&iZjBC11_qulozNDf#R@zw=@cjf?JBv>JCQ>1AVL5jV)5>U|7>&gS4Omz(8
z)dW9-1;0XX#l_N-V=W<Pj)DyAw`!X+<N8YABLEVaZT-BJBHU<qpizk%CG?IvfI<;b
zjPa073$AF9P=}pQOAUmaxj2->z7D@R?y$^gX%-&$k}e4`dr|I~RgS6RUsL?%x=p@2
zb7J!kuJFXZMu!nl^0m?QPWT>y>=Vgw&FyxrVAonn{;&#7>6(&zZqn{KNWnSXsI=dl
zIX0(c2ReDdnH&D$%w;&wbx8<ZD*XgQkZAdal+a(Cx!A0lc-smVn<H4;XeTy7@`fP^
zFOELpgN}0Cu`)PD1PK{w%VO#pl?5P}&fGf_9~DV#wKKKNIrxZ}Z*&^XHUHh2zMvO<
z9G?)&oH>_aqg7Y7f#^sl1$9`J+$yeKdl9BH2cEvN<je)aIU+T~@F+qBh|Qt-bs}UU
zE#@P<5Hi0xb8Rfv#QWjz`dR<%%mL-;sYq8d(RdI>&=K$f5hX4%6yV4`Kwpdon^ec|
zxm=0>P~$(GIc;we2+MI5JzZJkYmp|&o1D)v5*A;2GJd7_K+EL4OD|GQ{^-o@xho8J
z+Y@X9kli$Cus0qW=G1|8aVT@WQXY(lZyZuJbD1+YyWE*W3IDS*my6^qCkNQVFp<DK
zo7erT``q{L9S{-do41FdTmh6`*_xasXKpPD=L)jqREY7xrY?dTwt0%sXlw-K>Iq}+
zNC1-q3i8F&@S)y!c(CPwY+h=7IiSBGoJ~(rCK5z;g0d`sapp43WpV&?$vXBjmbcr0
zOIGG}6Wn$Mz|<jd=U5Y>vkIyv?zbs7YG44P5*AllT;}24f0+dYPJM;JLV>%&cw_D%
zyG`*uC*wEamOFE(k;W?MVkMBPih3vlI#$=drc}J(4iSEYa0MF;(R=_X-bX>sq5>wX
zvV=i8J_bp+liL8!U-+yM0fKPi^;g<jho-!47J+$uU>*nHJ_!^F1IEKCyZ5?pZFLU-
zVK54)6yig)Q?Bi)fMeV;(|l2w(gax`o88TwTEkN7)@z7no8ewHQ<>{~pLomXZPC@n
z1h8yv9gGa%3-GG%+Z`*Ka@K<Y6|~%_C%O)}bJANHHZ*`cP7gdmk;gbu)~n~U__s#M
z5Tf@bGr}qB_fDeKsR)bUCjr)odN8`@dPhQX)P@{ZqY-wGNyOl%5!3Qf3a-P7I67F}
zBt!tXC)=_8F^&{)HK!+OwWp*v2<vPNk1LhCqrIhIoi+t#5?v0*)nRAb`#&?*dKx1_
z$L3E=aHDVl0T-(@+fD>%9V{>$b(pOj(0RhWb<(TH*V>!BDIyYtx!&7^&??(}8%8le
z&&GsDUKZ*^oR}cr{91jz0e%fJ$o4IYvu`Nr9k<-Ld&C@r;tYH52s>&FxI}@RCSY^<
zx-;*+wgB1@<Uo}t{xT^}kNTSvfG6N{ns~ps`#stTzk_OUxG)L+(R<4ML99$C?BJ`|
zO6w_FEn+1Feno+mJbW<|$7kP_5acx#`c-Dzi~~0YS`{GLk7~Z+(UdU3iSs*uB|xMu
zpyFOY&t+N1DRn_yrQEl6v0QqS_=85nmYVA=v7TdbXD8!}1CYZhiQn35SW@TN3D0);
zYejTUI8*fV#?;%_8sH@cvBKa@-Yb#mpjd<F&5PqThqjznc!a;PLGspsi&f0F=|+*t
zDAqX;J`6t};&r0j$2<8BBGjA6dh-c#v)C*Dwz=pq`ORiwBw@&zBQPc=VQv6C!Mms@
znjS$&vKxja2*lLBk44<4A<^)!&e132SR?x3LJ6$y&)9_nW5cgHe|&$(az|x)4CqGy
zv2p$!WIqx0!9Dv&?`F7Hb&%1W6-a7~T(c(z^Q$u_-YJ{)LN;qM52-BX7Z}n1LiE`S
z9qSvM-{>$>O9s0Z@i1`dUCIT>nafAwD#Gbo?#=@su%Ex>zO@#n|MipU@gPkY5}eM&
z^T<AVerjr1`pYH0xGm?4O`8#JzO^XAusVJ|#gK0TH_!bkBhiUUzgLba<BxqpW{BVr
zOlMAm4tohxdj~ml;);+nM_F{{-UYPE9H`iwRxyh`z`E%)|7Jx@hywer5}NAysJyVA
zEvL^kCv^q(`<YKxtqFX|Yx4@$2_W^r;J8I+PN!3(FPs{1-coZ_>np3ZAfh(rW<pJm
zhp+g7?%B<>)uyl2`kp0UiFW^DAv>cYbR?X+*}C^(6r6f<T=V%V^tM+kw=wt!o8@88
zwv@?nK0tYvhT}{r0cPxPQ1c3tUWvxB(fl9o``sN5d3N9p%3#v#ymd_DLu8Ih6iF7X
zN_u{h160@$v4(r|1HD+^P`GR);Y&s)o`P`FJDy05wfqoKwj<O)U^|_>olco8^W465
z_Ts};tgf-~JI!JvkFB7GBJI@@yg~XLJ$fHGlwPm`&3oGGgRM6XYHVnga==;DF#O?(
z=j+QToFi8`v^-2=ueyVnoC@i0mjG8#c}!ikb(Ez5Z2YXTcMZr{;E5O>hm!zIEr=Wj
zbxYP|R@<nF0GMRZBs8XR4+yWV!VafMF#sM4aP^BODjAA^Kpy4rj)+u3lVEHF@W|7Y
zHC%5L)uI}!fq9OSb?(GLglkO^FG{s!9rrMROm57>YK<ePY$TZS^<c3PM(d2KC;{Yb
zr48wV!I1!pLK7s=YV)55*T!r^xXEB@pq6v%2K9{e$c(M4j-ET@k3)u(T#EB566oY#
z83z-t$ln0R2up97n>yVjS|1^eJNS$?OFby?6|Xc+TVu>d)53*MPred2jc~7^$!&U_
zdtPAEr;is_pBqa_Qwr!VdS)}2AoJ|YNFlxCB;kPG79RPax1{bo^P{^P<7T9L3+&I?
zUkrLD(^uqnE&K(WieNMXff5QV4F;n90F690Js(~=0(~5dE8$o#emVSf28npp=wA4W
z##BDqyfq7mV8P9SZK%3_giQ8jGorJS1_v7J7)c)P=|P91OY}b&&%mqLvmf~2cJ(-P
z_(<y?u?5@iv!hV>xXy#;xqvV)AV*@A-gyi5=GDWDJMR4mA`cb{C&YLob+ey$RX@Nn
zh7h<fmF6%#)K(iCE`Utb7mpC)M26bb2}Hwoo~rsb2F}9#_53a1aNGzVomHlS$l&m4
z#7A+P$Mp&iNJz%AD^HIf;?(FLj@R9k2N+4(&WWSrFzcg|rM40ssYYLmCT$YtT2l<T
zw6NvrR0*s86w0P)M9*Pk`V}txqq&~D`e=cV66tp4yHXuE+;&N3tP7twB!97Be&-Rj
zvc1oatTnZj<XlrY9ox^<W$Bb8-)Gj8An(g2F6G?cZ_js<O+&eTKjy*Z0LQBoWv9$$
zKfVsRC{M}Ta6lrbKKs!YpE%Nl-Vv<ib|8gM^-$2kBoU%eNk&HD`Kt2_cB_vvMXRru
zH64B(5p_7Ks~>2>DdXYZhiwFV8+10!8Mb4ko2wiJk2%t8#AflS@iOghd*rV=o~@O+
zHnjV5u+wnG89pB>xJRMNS)-?}@QJ6S0v(rp&$a5^gM?wm!1K+1qzls)_*m1oUdZCw
zB>aR<(w7T(i*H}5$c@~(>n5)AxqFnVoegYaVcG5R<yA}n+In_p0deXrsa*PeO?cBs
zbD`75?IGS%?Mm^8yNB!gYLxG4f7aq{l4I9i%jnkAU)ycw;(w*viv7jwyT<vi3<S+@
zXdEKiH9Qcftlg~bt!vmleyD%LiLc?E))%g;J`Aq@syfJKu<xqn6~f9X;hs+6d@6n1
zXPkUx4r^q&HXm$x6#tUlnC(jA*T^P+10D5isSf);(y!!sof(z7W%t7B$TTuv>&gyK
z3AI=W#n=?vX;Qw1|3jlltI@T4HD(-cq!_Hu{Cr2I<|g|kui1u`8}5lnJEm$<O&oJ2
z@N@WY<1**SYesb1F{4r1%KqIASjA1HHM$Mt5gSpB+o859dXwbaWVz>nk&3~{{Aq@a
zs+M7o&ey>^T{^v?3G>H{M0{{m%eFA2FzL2v2~dv(K`xKCIp|l0RP`&+e6s+)!p*g@
zxLB(GOkfDMMe{V>GNzu-**IEGOUwwVW)PKk8hr#fXnW>L^v>I4gU_T)v*8rDa^k3@
zngNw7iJXXkTgQ8ohsx$TOZUy!<223mF(NB56mO67+s~ch%}S0^T&<sImU+zblQ&{T
ztJvPpku*-PwTb)khB4=p5jt%nm`8<^EQ%!LJ+DTSiFYN*k|}7D-5=_W6<!1;dPww$
zNNaWE*KUsXOV!Qt%iA<qmt1ntM=Zw3R14F!a)LlzO&Qfl!g|N~P-(dNBZ>$`$2uvq
zIyAumW|StUC}^M#S5OUz!6PSFoRFjJ_RkJ$kD8-5fhm+Pij1R?myct*vN-d^ZUu*z
zop_XZLeI~&V-xKTl@7+J<fn5sJ9UdT;1T*?MmXXcy{H$Ae6Za)HV1Em{N;{p8asCJ
zXjPb_O<R$Q@7Bp9eDd~xqpmhMPew$Im*Euk;y4P9S=-E5qYr*r%_fhwABm613(1vu
znrW(cz?H}ReM!B^X^Et{^+w(+Mts+%J08L}uHoQ~ZqW(xlXWdBI5of5iJU8TMx5lg
z>rrHk7V<uq&no1Zc1wLt!iU=lpTu(&-{ooTI7(NXrtx=EWZins&-ayIF25MEPu62h
z=6+>&dGU_xvWiM!_piS$zqJ3Wtk?YU`?Wk*OJcOAHz+Hj67$yXydEfL5HWjDx@i@D
zgNi-5oTS<;=69IT1v99jrQk`0Xu>X-?$=H2(uIl#QQP|i7o0ibajrvgy0hMvD=o`#
zyzgQ;*X|w=u@Aq}tgR59c42Tr>00HTeF_n|vO~}8uT}M3SJ+W@VdzEpwdzM-6(So}
zt`AeXdq%Viw(ArUCBk`)`eOFM%4l~^+HOSL>)L^vCihdqBak95Nb#!gQ<4%$W!Il2
z2E}XS4YMd$)N$@7M~MrK2zW`Lc(P0Q*A$I#Y^!L%#pK2s%K4z@5AQ&Udy=CahUvUz
z6-_*-(ga_*5uR#FlWc}!lK2<Y>yNj28*mJ@Mx5?0M+59u+io2;7>jyj!<mLodVM3)
znRCh3i3vAgI&-Axl|{<rbR_)22xnS7CrtTxxydbU3Ct?#(7@v>`1=y~uGJ?UdUNy1
zv>j?l;I1(}=UBW`op>Yhi0N=0chW2y;h7g^jcv2?c^tyEge0Ei+^iGf6(wGwx5HSy
zQSpnGn3L<p>vJH>e&dTlaWAeUd4?%x?Wwp^_Uu^4j*VNy0)nr)$rjwbkc8thNvF%?
z0sIXj&FpMpZ8DAs{s*8P*IF0MZaKSSof$jGr%N<FB#h^A@UJQr4e~SD<qs^~Y1>sk
zoKC#%1Q)+LbMVA2EyL|)4~H-ZKU5s6XUIU#To>`|g;Zh7OLeWzp8E>QA0F${!9mU(
z!PtJunY)>xg)6Ws%Bem+S3w+V<9Hdf`}J5nueyuI{;=Fx$eEj@1wx6hfx^}+r7`{?
z9S@y?+?<{Y7#D~;j>LTxlf)lzSMN?Mj>z}Z5?^_V%_s-A+3>1in%IgrJ(teBHgH}a
zcCWU|`Ra|g$KKXXkZou(WS<8<=C4@J&#K>DKg?Sp+gPtLtZJWA7gze``pf+<<Fp7z
zt<KMVdYQ*tHdaLME?ntpU}gH!iU09jn&T?oNAr}{+q7i(K82T4`}3N}6e*N|XP4CJ
zfVg4%%laEu8H;!=IdcNS(bvuv^O=4=KlmuQ(q?dm_3-9_hvN_BRobo{@`)bjz4`Hu
zZm6m5gU=C{K1bAKw7q3F+d8%L?U3!QZ*Oj{#;`}<{PJYY_)OhaYTDD{A?ev~KCA)`
z@5k<Zoo$J$xx4kM>zu{>xA_B4D^8uz?=#sh{Khu5GXA8BfY%Ih*nva@K4I1TtdPz*
zET0lTUmsvGpjPU0j|CI$B8azWId_K{_+%p6*_`q~>)reAy_~S_3BH3K6@j^l;>}L7
zy}!MCg2?rLcs%$NCi-4x`3jupVce(TJJi2AbLN%`p$2>#PxGG_M1**oMVwwCD5CMx
znH#y8l_Pld^vdoI_A}l>H%6MiJ98uLcyGbir$y|Aq=bgb8*ls9HB5aGTgBgvKQppw
zwNHgSL&B@Q*RjK;t^v*(FTQc~9VjLker9#?1I?O8<^5KBemZlf@#GEZd+*rb)&~wa
zbG@szzQU05qxVM|N~ZV7d>gI5eOiD`oJ>DPoNK*IIjjbq4_cNV17VLk9vZ|oC{Lzf
z>*{p^^^fq0t9d4fW{;@t@ZEFKK+eO0L;Z;ICquM=eeOkfT}Rse+J>O`d2wxPGx6gi
z+I_y3{s@+h7HQiXHQacQs9<&C>Rvq)H!zQrIzD3X>9#qatw9D-r`GXmD}&Dop@3yj
z9BG6}7qMM*{YV3oAI{t-OLeUGP}Vy0a3nz}uiTF=yPL=A#`v=+tCUuW#%ad6jwqXr
z?1~1|c{vsv`a|29+vX1%?N&*M=kQva<eL^8zNg3{Um+1?B<>Iz$4+9W2IlKR&YZjj
z#egbUlw$AUZ)(K2-+8#a#Q$!(e}@)BNUtulkj@`TCpj7L*`E3C%<1$fsR$%*hn%_7
z{@(05oeehGNUgl%Vl4TNpAymc+M@FGtOQvO+RoonuzONIE*=Fra|C}=Jy>hy#O0ig
zcjL}BVjHlOdJ>o+<BH2rujdYAteJID8D4E#dv*(*ANPe@#FC3Ff*?r1`1_)y(ghs?
zyUZx{2f~b4)*qG{v@#9#_i}#H?y=f*INx(sBiZs;ePjb^j!vkF5+|HZ{o+r%7$7Ee
z7V)e{I=fLPD^(5KUrJ(>>1Am==T$&DsZa72=P^=8xD6tn?1WG5OYH;SEje?Jus95f
zwm(WW)P402XKokd%#jYIPsTYLIw=^ZLCzeOb<>Q?-c<!sZzrsW8C&vcOlL0KNJEGw
zm4~<k)R7wl_G`@BN!G%5JdoPpY^6cuG;o9utSwCa5|})?B9e`eDpP2;H!ya$^ug?c
z_|(bF^ON_5>R!v`a|hC7@aGWM!HDoEB}=a3pBn7p`nxVmki!jl^dzmmbVWhV+!3R(
zw@3X<Zf#U(g6%`b=G7hymuieWr}5xyeQiC~ul~avLZJpoW|InQHri@^H<X`#;yny)
zHDIZQ7!!iwF-bz>X&KRyxPA^14<oKbI9`sf>j+EhGN>aJ6m_3J-)DCr<1k^Zt^P1f
zVesU|(euT-jmqR5G>tAq*iT)tcPsaqiZG$7-v&hFxQiPD4J>&t=Qms)t#2>IC*>Jw
zM4dmVSI7Q#9>Bk)+3r2x5g)fcB-d>CY{+YuD<2VBw}o!btk$W$P}99RSm&7d;M9{z
z@J4r3xk=Gg^P(%qIX1Db4rDnhQ&2Ch!{E;mHn=Tq>M^a13HTbv$c8UDbJFp$ar$EY
zwa4TQxF*4PJ(wJU#u2(wOOF;$OUl`S6qyA%<LX+5vP?z|S=4itKpWdm21{_~)xJja
zcaSr8+=_%yfSfr6u4p%sDQQ#eoMFA5_;wwcyl)A4#hXqvH(tCNWhf`BGmMBEF4Q`7
ztaTOgQ8-5U-reneQ5(afgyy0sbMRHKTqJvg*rpFl)ffp5+YFEbM?W=;u4)_(HxgSr
zpR5*oL~1&4th?291}lP$*2NZAXkec<>S>Hi8t+1^f+-YF%Nvxee*C0R6?A4xH{=UF
zW?2i*vJMDV=&=B{X7wqwRtASXnR)iQ_+`uqZsewc=RK*U_?H_EMmj^@o;4h(l5Fc9
z^Q9YUG}dksfY}&z$)0R2;Xa{Tp(hNh!`Dqc92x4=K`QEZl9Mm7j~nSyAZJbihr^4I
zkcv%U*c~GUDvhwOiyx#3y6Q8Xx$dYqj1gD*6O=yg+6eT<NsIqzXedPcMof87eDMbL
zd~>**@T;Rgow?_rTKW?u`N9C6;>)c(1{H&e$YR91gZD@zt~c|@^o=tKYdgtV0t(dR
z3qa}Je!Gy<#T+k#WL`kdTmx?SBujostKhj8Y)#nB3>!<wm)%h<bh*$jI!C{=Aj6t)
zuB7b9t74rs6<u^uCwQRQ;ZKD2uY+=rqz#Scctl#j`Gch=&u(#q2XVbr&=NvA9jZ5|
zsQnmd9oNg9b#Kk8XF&_joS*@c*CLR{K|;m_!kqb=xE7tcNh>RIl5<Mm$Z$QD023a$
z3x}M!Fgtz7ne$zA=J@3zWCMRVa~mLM?)8u(!)1RIN2owCAiL_=f-|==!O*F$f$7YZ
zB}72ZoZ@$9E^c05a_=^#GpEe?Cugqi^)Tejl`@?<4ak|>IudChEEZ+hW2+w<SNh$V
zduYRkw>jI8T(IEGy@8xL#DX*DK^8Mw-M`?>$#WktOP6Xe8j+)4fSkE%b3-zV254wk
zkyLt8!KlX;tHnS$(>QPQ<1_WSGK=+*WsOJ&-HASUVU&i+f-|SE;LNR&)ITz${<yVa
zhmm9>$U)>R@l=X8y31SLit`IS;vE-LyM4i#lTM@}4;gXen9f|;UC5c+L+9+}T4mK^
zg^5~n=76}?2K;u&nY#;2X)~fZnp~zJXYPC|GHngd3)IjLXYTzMrZcyLj}kB~fXDYk
z&RiMiT%&dGnkVLyj0(VFO_U7Qj1O|=-ayWr>dKD|laMoa0j@L6W(<bPG_c_vY5Cb9
z<jOa=Nv=(-mpQK(vSra^Y}r{MXYSF#s9yPEA;_7lwVOfMgq%&xYP>dZ%?yZmI_YON
zZNyMraOQZ7`M`Wr*KVFQbEeeQ?QNbKkTWL^Idc)FSm-}pc-RV~Eh^!B9~md|FMS%#
zi1Rht>l?)$$JnLZXyRcZFV_Cd+6gcD&?<hN%eqVst;9``Gk1V5c9yNKlj+QPacru?
zW~rtZ)N5rok{6x1nFVKVTVu%1DAV)Qj0+ff1<Q%`j|>-`x%Yaa1oqfS>OrP6SE({&
zX}ajl%~Kn`aDj|PXYOPBoZ5mjw|f+P=UDv1nX58g?#u~Vr0T=&ux?!c$lvqek~8Pd
z+wf%b`j|%+z|$?(=j(qsa|bxy%qWy~fT@uUM)wMjUoJcmwB*bMK+fFdi^OhYlG!cz
z{imTz&Rh%R%pvf3_Ny~n-&?;lc3*PlRzS|2p~`K@nY*p`6@OWT>C6QgeRt+Qi*5h^
zxij~9SUanMQo+#7x-q4>N_Q4vnrNs@WV{eZ$d<rWLXC9B8>Z%U1Rpg}A`B^whC0}J
zwJd~YBSO=bAy;CcJcm%}HIT<QPypTcTg9fT4Yg(swJI94CJ_d$H*^~jDnvuI+lDX1
z4V8Nh-`~{b?Q3}dv_T8hHR#oyI>pePZTNWM+Y3Y^<p6?}f9;|(C!iWJhx7SQ&fIjt
z%WU2KGou|5Pm8lHPHOIY|MnwqpzUeHcz%`L_)YfthVPnIy52o`W0#t*LXFFj`Qdx9
z4j(yc)Mm1DjuY-4Qr@$}<HjNX>VsdN-x<DN=B<3=-L;S`o#@DS{EeI6XE~&7MDuv=
zCWQGkB?zeP_(FJXex7CPRsVjDV?BFXDb-_%id}+Tx%X`!Ry;AgmU26LToE&EHr?-%
z>^=C-FZrgHO_0>!(23!Y0h{R}#K4;O_xiuCQrr1WXm`Z3o<f(ynmfF7raA6zPpIS+
zC_g^rxM7fmE&YT_eCH|6le@Q1-M2ZbC73RG)h*%Lwt45tn>j;+k&TB**_Z~Uq~txL
z*?V8lHdJ9Gvy$uC<ZEW@_lNl0ITblr$aZ!QrA9V8vbj(yd;8l$v~p0QdrJkao|Q{s
z{s5G=E9cjDtVQqxPSEer#>?z6f}34gTTbnvd;6~_nkh6+b1RX-sQCGH<q_zwH=X6R
z+9B2|>@4@JaV`B|R}>!&!?xPI-$NFos#c>^a#bEm<G$sV>}|q(Z*YKx*S2lUM(vTG
zTt4qGfSrkVLxl$%G`UW<H>b}HNSceLX{GU5eSL;Xw{JE}I^`yG?_7pgeQ%!SfhXR^
zX&b8wn;fvg*ZJ;yY#%z}k{EI(NG5ZC^we2X^{Ly<zA5T0Wv@ATc+FhokM;2c%{=pa
zpg)<};-q2n@I8@emk^vvn<UJnNQfWdxT_z-zLB^yc28Ok<>}hD9s}L$11Qdeinglr
zJ(zcEGDpH?@fEZk+aib-+0^?d75t{)#d|vmNdgB}iEw7p4hkq#?#VbIb#*((NwjX#
zp7qBjGS=@Gc+wnl-t?kZT4Q{r&pUzGV|%oC?M3g@+r7#@%}d{rv+L|o)A2oEX<kNT
z(7Igw0ljq%JUfbu9}tOX)^iyUKoy&$H7Z@fexUyBm`KoTy(ZD1?A9|U=w-uCPxRBD
zt;T*F&a-(an;o}G<Z_3}=i+{z!lsjMonDgJM%h5qDcY_cDf@NJ&mIa!akym?owIWq
zPMK!UjtTX&%TKVb-KgDpYTJt(leD^%^)FMljXTZ6@2BoJ;N7`H_S%lM^_4H;lYBk1
zKh8fnc|c@$`sgiF&7I-JrD8$Jg^GcG4}ws~w)T}ar=Hg@^*dVCe)z<Z_e1(ksjq8P
zUYIyHevP<dcCd>*z0Zp8v+8C7RqBiLn&j>JR8=1nspcaUQsd)x)se^<nb?(4hn}+*
z6-2L8nyduOf{16t*FWZ0i|^w*$ana)sg6(X>N>u$oz1MKttR{{L!Q;spPHZ6{dBfw
z@+&S*A3usarY5&DBHxv>OXP!&GHzq&S%K<FqkC(;S*;@A2~O;&@;k7bfv|XiSFH_#
zlU}S{SP6nJp5s~2hbV=bQuYzt(207JOSIb6*rycqH4({Dxj8Xa&b1C(`fBSU)^Q39
z#c|9FRqIt6OJk$*_ZU>J;$xwlsS_>eGS(kW$)W{z3x9lu<Jj||y0~_=+EX6_dLPxu
z<pxhiX}V;wR_}^K-dr+4$IL7@`U$;gln{M`+o*dbR$`y!X5n7YE%t1FsYq!n&;Gbr
zmA<jV`|-IezvQ3<-uW~~e6_Mh9n00d!%f|9MI)~G%rnKgsqXP?gPygwiDK64Rs%)L
z6r0w}aiQ%=>xpLJmGLe3{+Ls1qLoy>#2rdzYbK@~QA++sat*QV65OAzysNBt(nS4%
z-C>!0sCcqnb^Mb2H(3TgxZpIHY=?FBN(dhzI4GMd%I|M=<h>o~R{2)!xS6F7M`c&+
zwaIy6@m4`{7E7tSw8DGjzN|DNm}e-p>c~o?PYvt6$s@eCNAyjsPP0$#?rAwoj=xdY
zAy}$!__*!f%`W4E5vf8aw?sazj<fC+Rn9xS#qFcrcW2Jn;1g+j=(g}!9KZUh{=_DJ
zqdjAk4bn)4w8iA;-kH;=FE#kw(1I`?6{Qx!v)Y3y=~G+7<T1J^?;QP5&htv6!+4>X
zI}au5w|&5I3SJ&}qGoL2$mu++Ys+0I=SnA5$My1w*zq}2r&;3*+O&a>NDFFF@w<u(
zEMM&sRXn_Ts-L~^y5;WqCVRzo0kcknK26-dM5+Z}SFAiATt9Z!*PMSOSO2|x^8Bva
z`?7DhxAqWX1OxI{)G?ho0ZUKpnYzOb!Lw1)9^UL5`u(eO3|DlL<Bs?c8pZfu#hH2d
z@SY+xNjtwfxNgvA#Z5x9V#ce)O&-209}`;C`(7pOVmfn#R(<~0$?+b3;-Uh#c!OT*
zXUOr#$f@75%XpoxuT^wBFmL7Nie>}Xf_S>^&J?U>Tr0^XIi&Vb+a~8X$8TAr?VX!0
z;lK4dgRgsn-U^Sbb2Y?If1bD{Ai;+AeUrnwKJf5vl88{ZsahuYMdMg0x2Xaa*{l6d
zo5$-oj@w#jiF8qihjxX}P)y0Arw_L@9m0;_1{j^Q`QMJ*6ZC_6-{WDN8b<RpP8}Iz
z{>!!-4d(^>>-z3FzP3AKx_wNj6-QMLx@cJu0mt`IHn==X#%Q}7I$zX(=xAB$WtH0Y
zJECtm_g(oK<##n{ASBC33)L0vmJCbF-EH)uS#}H4nd24gQt+o^w{3Z1d`!K?zmR5p
zAn;7kQ`ZL0@+%4YM&|`atPiz@D;utx6Yu;M*vxyQu|E1#yYN@To`%=!A!klY>GrcW
z%ieA-|E(y6>DENc&2`ulqFT{Yu95nyM`DWe%6WI(=%@(WoFwI;HMUaCN{W$?9huq5
zGx<!mt<ZD(1=)!>!4sbHA5&U)QTjw57euQ>c*jR6j$NsXG}`oK1hv+c!I&S*Hjp2j
z$d)cTz0zE?)othrYTp(id~Iue?<LR32GK{7pEe!T+=9xUos<-90*?={cXI`=2#=*?
z!HF%}Q?k>x;Sv3jPjw_q$-Ob6XElY>xgYPoe>0l|j|r#0KEcO$%Xn9E|Le@I$9o>n
zi_F!n_%<8AVegoz=*L?w-(DYky!WZD=%=ou-`*B(*f+I7^z*>|Z|^G~?|XSb^vlSK
z`MFyg_P;qL`t_O1{HKA(`#;<i{r11kTo<n{H{Q?=Z<>O)=)&7@^Eue@xuo#9ckylD
z=J&PZ4@lwP+{M3@d&M@p6+2T_?CDx@fSd5Y&fK4!x%vNTXHM1EK{X&vb#ssER$jGj
z4r)8o)b{kK9pI%f94N7Al!PA2VP5q#2lb<A>L+^CPw{HxI%u3r)40&1afw&6%t7;7
znr3y6=1pF$1_!N{G_Cd?t-HM1Jr3IU)3hJ<Xg}uF8FSEinx-?=qw|ti_l<+@hcw;K
zJ-YL}dI(27bh;jUuO1g(pVv`;MY{gVUVTx#fw-fARJws|ufZC;p|Yc)TDqZTuc0p9
z$k5TqG~FoPqSwd<Z|vY`?2>Nm-fO%8Z{q7{5|D1Pxz}VX-gKLz>CSZ1J-wy}@KlB)
zH8!1^&`UjxH%oIgJDP5GqSx#c-aOaQ{9L;Eg<kVZc#ASei)-l?)x8!s@s<samM!U)
z?Y)+F@m4*KR`=7b9`;&2##@g$T0c#<p6a!JiMM&<X!9Z6=5uf3|A%zG|4THVGlK%@
zd^1s6ZZTSEG5dOB>}O*2J>qmd<MlJ*!F%z}FXN586aKBs7rf;1g)X^#=Q5KDjvan@
zY|E=->m!c;ndaM{6R@cBEvNYwUB0ONkRLQ(%rctqVBz+v!t9a4s9P5@`Y#-Mb74<X
z(XK_BFXhrch~|S_zKqL^C6_Pe-@AOdHEDORmrh+j`SeEa<c-tsZ)BdknOSf%v+L&N
z^K~bl*X8%tmw%|we%^TDL*toCO{Xt6=M6MhPPLR=X+1mDdg)#3g{y6aLv1zFZDp_8
zFIU~ZIDGr&-0kAgC718|T_(*p(be#>>-xv8t99L1n|iCJdmG;NUjNuz{i?6w*8Q7p
zf1&w07HGb^gRPx|EptQdJ&)VpKJL0VeCOlvop&R>_eVP)j`#km^F8=5`Dpan;6Lkp
zv;V8}S)8)IUiEIOzijj4JAbS5u`bv7B>tlF1>h%#89-ava1`E|V*88EM`AE_zEymy
z+3XlN^}pzR;!K?{7w7m>=lhm3o~k=L?8m9zx=iQG<JM{|$>(0@7uL-6yUs`Zsq^)9
zaQ&|HHP_jyPox`hs1UXrGIc&frp_mhU8eIH&k_^$yz@F^^oGW57j(Y<4(e;5|E{rC
z9>~=ByrT5OFeFIl3rjVCbUt1*Q|H^r)cLGARoTjZ)%hf_pjV@q<aeFVbD7SElL^Bz
zb-uxHNawRRWK}wdO-+(buWc|BI%-?R1?hZ=kj~f0eNlJTaWA`4I#cH>cARd5biVcl
zov&43=c3Lhgl6h|oy3t(;)z)GVFs6EK?J0U53~xE=`HAd1GbAgpRKa2Z1<)`oo~o?
zLFY4!m%Y+hDq9oyW@o(Y3v%O6osTF3XB8tZ=zLykCQO~r@lQHmcFKoGG0L1d<2%rC
z*K|*!1K;RfKU>>C?D$RRvt{ah_>_A21)Wc6na)R9uJfteGIhQocpy{fvr#o5Ksuk&
zTMi;q=c6p?d^l5$9quAqI6Hpmd_%ygxmFj=4Y$VlO_p@NTmis<Wl85#Vd{MMu+<aa
zb-oOQ-`vITI-kmd&UXgV`BtFA@(_CRJr6IX9)*)_zw3Mj#2m>#=zL-5wqsi(Xxm)A
z{I2tD##x;CtIn6Qp!2<ibUxd^=zMsl&R2|uuk(JHr1FnC-;rN+KDa=?J*4xQ{zc~#
z{}(#n=7xbPSdRM^TLU$Gp6b?rt@CYWfPUX~K3+)Y+mW!3^hcdffT{C2t4)d@_IULo
z6xl$!Ki&`Nd}BNdI-mJZov#_v`5b@O`J$F|zJULd&R0!?K7+PLd?h|6#zb-5yl74o
zd55M}Vs56a?h)<%i_Yglc+MH#_V+rU%Yx3Q4(WW!`U-8E-h~E-N<I=yXDI)s^W{V>
z>3m1y80|vchv9s|bU^95&Zqag&SzW4Sdmp1a!Q<9JVUM!`l0jD<rZ{4$0ePw_&1%e
z9@6=M?>e8FIaT^kI^Xy(+9a@{&>&X#fCr@WX&_#b4Y<s?8v{gHn*{nZFC+-(T`+A9
z)gPxR(eVRBTW5?8=(=9od>7G0ftq3VeuB~eL+4Y)ADq{-O-4)R0E;@G(jRrcF(X0&
z5Tk?<7Y^?906pLFT4QJdj>~mETmA=Os8-fi%(d2-!Z!~(ZK^-rGiOx+gBEqZYd>{9
z?*d5YyAJ7mlbi+1b-qsFY^xVRqLL3-j$bXm*6|{{6(KOpd95Oa));c)^WdcQwW|9a
zGdrq356vcBEBoX<e(<Nxr%d^{%Fb<t@q--CxYRAVfo8EcR1CHz4DUJfA!$xu&^jf~
zBI_~XFxysjNaq_|rt>xNCC=wUI-d`u^CACM=X)sZqrmOmID+;2LeW3Y)cJfDbiU+Q
zW43R_Ir$AAJg-XOJe8j#6hJ}fB!{sd;9AuA!odZd&-ka#msPuolk!)cFDx3X5cXZ?
zGa~5_&?F3`^BpwAx^7hW2A6a`7m=tXo$sCy##gj}sq+O#m2oh2K2z1USxDzQ1nGRH
z3p$_OA9cPA{YyKy^XOC<t$$h;E~*av)cKSkoi7~H`L_R}^Lar!-yHzb`Lq{wzJLXt
zkBBJi=9u6`M~iblR9U9;Z9@%#2Ai7r_9KYvAf3+v!LUV4@UEM9t>N#ettD<V8E)9_
zu$M6lFIdp|v_ik@eCf+|z6ON)lFoN@N#`>TMSY!x8~h8Muj4nJuZ7iO2kX$H&KHW7
zrz<>2)4BR*ov#xm50_3)kE0;|v(D%Eo6fiGyUwS+pz~=BvrUxHi4vj4wcmBVqf0uU
z%5t4gpF?*^=j+JXy)zV@_3w4Q*57r$ouP(WKXg9$-|Kuv97;<%pAx8)4(WU<q3G53
zHG=`gM+Dz>U0f<S1Y=R>YhmhqJ8^7EwQ?%Ubv}ayolkm6=d1r+=hOX*&Zh$Dd?c*N
zEaJP)XTnmypz{TE{?z#je$)9<f6@8s|Elwa|E}{DEZ6z;zw3M|%XL1p1)VPiVFIwI
z{7ap$_uuP$2LD#)^Zudp<)9}!Pfvmlu<#|FkG7!mrTnALxBI8gr}b}izMbd*+qE%<
ztX`d{vNIS1Lzdo7jw~W}-7h*{=ue$5UGEP%-#SR=lUk<poku_I5r_-m-mPJ$PR3k=
zbiVh9bwsT0g3eb={I2uW*D`fJ-JGJ11)a}iN#`?3X6k%ezv+C)WjdceQ|D_4z0^R=
zAL{&*&d2jp=c`}P`PKm^O%`;%)>-&9_)nd${y*w`CXmi2xS;d3v91$DYpz5XXy)&p
z^*Z`08ZO2uVutHo)cHo)w#2gWD*vs{H-w8>`&7kT6W6hz^QrtNozG&q&PQVEeCm2!
z1^=M)$^KV#J_|N`Hco#s)&qxvMWAjbvxMQU+qbc00h|pbnhnVuleKK#^CieIz5ImD
z`C7YOk9MVy8cGpjdp**&?N>{F)ugQTSDlajU+8>I%XGdrrp`A2>3o9dHOCRLi#p#P
zRB?``vF-n~&KHXDUeNgt{LuN_5XQt`b-o=xbw2eHuGV?4%kuhp>ym%f`J|WWd}9Ae
z=PN>c!XaP2!hX5VcLC!MI!$=pZvBhSH)KmG2t@^Vo>J)I+PfX!ka)Yz<93IoV#k-;
zEm&fA4fjWB?zehp^W}t_-J8d%+oDc1Z=SBdhC`fzbiP$golmK=c|dPL=d1l)=S%-b
zolj{NZEx=AABwX7gx<X!)c{DU%zOQl&e!{^&No!s%VNc0@|(_goWpul!u&;jZ2KAC
zi=C4>+8ST)g>(r0)cI!7G<{u1yEB}xniNmpcY>YT`?at375a}l-%&{COZ|UE=X>xc
zov-%0&d2yWolg*58He=(e%JYmf9QNie(HQ)q3FRZoL|6>E$JNw??(*!T)d=qxE$Ti
zn?LN0Ry}w8{D#vPdFoho|Dy91=zZ7uuKhQ3zWb=IHl=-IMPBQ6pSz}&Eme4S+wR21
z;ts(k3anpf-n#@(8-mv@=zM#Y>3rc!I$z6QbiQU*f4#rxe6GlKOFCcHqRyxPUFS<D
z2P-Yt`FPQ#O26oQS^uo_@uB~q^QCY^JLotr)A_={a`&;Rn=>L_KXg9uA9cPk)VhDE
z^Y#8!=hI^uz#Y=rLF|}I6vglOHr%l)<RR~45fk87o$nZn<1(F3eVNXe1?hY#|ETkA
z{DaPSP4B19r}RVTlR{MRq7{<&`(F~>-;gCPpv78RxA7iPcR}Y<!lA_uxT>nV?W&L=
zc>E9Pd|9Z!*ZCq_^&p+^rjXJ<>3sGG-bI~H?8LERtAom;Rd%mp526oSEb4q><rL@g
zkckKPrd&$Ao025m`=$rzb5SFCf1~rQ`=8VK#+T`Qik#ba_5KT;PyG)%pDEW9g_Ia|
z@lMtSolgN9k+`JuS!DJggg+*=|39Yl$^D(qC!I7ugmt>ITL0YIztQ<@&BWMUAe~S0
z?{&V1b5mxe55VO6q7A?5d?D%#q94i3QRp9ZK4D1bqrjLtpW@%@e0+QYcP3jzi!ecG
z?1BA%qw^{M)cK75p!4l&r9(QO@OWwxc-H9#IowkvQRw~Ym_?nBKj{6ff71C#|5@iN
zIQ?JM`L+e-9x4&|a6xo8M!E1r^shP}nMxDdHJN+VGeVrC$kh2*8L7nIbiQplzvz4g
zi#lI|VC%cuZ@$2ph7k4ttn)R`OMc5(uJft3<`8v%*ZFk*rOs!eoSKXf@mtdQ(kZ<}
zNau^ig_Lr8doXoADx~wly)lr^cbkr#u`ShvvMD>3>3nkyuXjhVvP>-Me6EW+-_b>#
zkNgihA5|?T_lM3GM2^GT(s`+7i#ne@Q|B{X)cMBHS0x~wPl_?tO8kS)cRnO}^n@Qz
z%0NwXM;MQ6*0XVY^^-g92rcM*)CHZ-_@~YXe%JZbA)RjmyG-ZPUC{Y#1wh)r)cJB_
zk9J?NU^n+S4S1a-Lxgm`TeKfKUw#y%^U>vg)%lc`>3miHQRi!s8nlh}`>FGhA)QaF
z)gRLNxFDS`=f9=%MKX0hj8f7Y#NX+B=>MeiHL(9noe$@}_ZOY7d{Tcw=i9E|aBk9$
zympW!cvgnju%t&~Z5CSd<aeDfjA8j*=bJA1MdwpmuJhHRwcD6FALuq~2I+h$9LP=%
z)sKrhUj(G{z5A*24MRHL<bTll&MoMCd7Ck8f7SUomg#%}gr7QJE1Y_)mJaEBNoHQK
z-*vuwIWbNPIv=<4YQ=bKrp}kWpz|qAFVp#|_=6@@G>TJV6^iOjs|gJ&Ge>d_y!1JQ
zo^a<$o|N#(&4qNn78$v{Y@2KhIO2DxUdh*<)N;&0&Oer<!90VXAK6`XCx!e&=QEwN
z`#YTv8LPsp-Z<&CsPh%neb@Qm!a2T+I-lcrov%fap9~-|UOif8R1XLJ)cJNph!CXn
zU4V4H;M!d2Uv)n11)Xo(lFqm1&pKcF51p_4r_OhNN#`4tVCsAw-*rAuOoY}?o$m!4
zP-g0U*{s0Zoc`Ob^HGq_2NRw9sq?Wgbw2P9I^Q`AQ|B8I1H2%ePk&M88zWqO+SOM5
zPdcC1pL9Mw#_fj0j?H=kY&SPgr66r-qEL9qWD2Jjm{P6MZx{<vgksBeKJP`HkNlg?
zr>GYz&eZw1f9ialD4+x;x2W?03p!uPA9cRVn*q?EwQgP*3CKuj6MC0)K8t9_|ANk!
z64F|4;RlbH{Cl0xfgw^_d7)a>I<eXprwx#3p4-$!PnU>HHjS(_tQq5G@7L|yre^)N
z(FEDVpIOIAqV>}uqt9^5<pwnxI^h-DT7ryrZ;fc033b(#jc-yQ21^u1Lkx3=_Jdx?
zwW*)$cpMP`MNL#44)oWHh{13GkH8o1m1Izi0OF=lKqj4d>_$ViF+hruuxmP}38(p8
z_i5FR#I|I#m(Pa;s>@BLOsDbeeakKC3Xy*rKI8RTI4b=uH-TarQG1=1t8zmew)M;E
zphliZGF^x&P+S`;({Iu~+>q&*1M|8r5?{~89z(p10BUKzwscfyW8Vqd`ef4x;uVvA
z7P*8N<Rs`zLdmtZu7_wo3d=?kMDw9VDPRFa^BGw%X+B;i&1X3oqlGgU3I*3M(tPez
zG$zJjf#$2&%UB;+y}px4^Epu=ny<=?utf81v6NJAzrv*XYEq2Q>l526ixy};haWWG
zjkGVftd5(>ZGvb%Hi$LL9yjS{(tOpsdMWe2(tP0F2-6~mc85ipZ)$<&o3+}wNb^1X
z6V0dJ7P?6Dk(Ow__63@+9r*&H`DCMDwN;laQl}d=xO-!yWC0bjA(mtU#A&{2ta@z}
z8y;8<tA!(xR&0Sch7zsX9`cKH@*kK)g^@73Dx&sWW;G0r8O+0;n(jPoM}tw|g^AiJ
zQ`}(%EP8TjUKMtt-Z6}^6ra{|r7qMS%T(SR4e9t8VdL09N_U@Dj3_sHU9vr~Fj~+m
zRqS1g7s)_Uv0GFfwI&$JK>|q8cA}|P^Ri*2130vIE8U$GCs%TGq%xjV(8C{{xWd@M
zhdZ`9t)AWe;*s;wW|_2kL&_#H3>XGKj`ggvcaW8qIinX%k;LQ%F?g=W2bVCkP9|z^
zcl24uB5IZTN>Emm4Dz^YL?L2TF!r`qJzPyI%=1?qsJ(S!4(UGWcx$fLB|ir?b<gUP
zlh=?KwTUMz2TrEO>Vs&<P^57y>l!b~_4j&0gq$7f$(y4kwsbfP$T(93;+)(rZOV5J
z86xU>0cbCPbDWzm6pVOhC1Ie6js#pLQhAfxSG}&4o8VT_b3x(EHE$u<NPra{y}A>;
z#@^xu(%4%;0ZNQkCjF`rdR`@yzS=mJjS6rRyTj#qx4s~GbVh|q-cLG7RDq6fiYCqo
zfG}I4oRPj$4ht28=~+md0Y~1ZU<lwyniz@#?mkIJP}gzb@H_-C+ptt>r6%B2yPmp^
z1w%tetM{?TzzJadJMQD{8s&29ls>vXz=<5iJv>%Xnz9e;`R;+jrYKmPj_9W9qsFoJ
zLpi6kdqnlYtczFQ51u}C@%}p`c&40}K)joO0-1g!IxrK7mxa~Jqo}rsbztRa`xQj1
zo2YcG2nj$0I+i=}lpHw}(h6G<$Cg21Y)XmWpHo&AoOos5z0CzTSV959WX!dPWoG@h
z?7k>I5JcyI^V|L1uU$7i`hwg0>l!{Uki`pFI|XO6W$?NJY?<{w0FA{JILK?yUGRu)
zuKdXaH=zJjyzp>6o`wbiwwx}n+J|1Q8*b+VYz4p$2N;{{Rq-4Ee}ayt0vsjwL^}jq
zg+7lhgJrmObL1ly9IP-4&K3$DFE4S^(?w6Z<zYQUV9{&^k1&zf)@uP5r?~U*`l16C
zD*<xmN{}#B)pjvj-W|Y9t`o%p=*dBSyYx=sBN^nOW0^5}uIpO@*V_tTKECq7X280L
z9f17W+;)va2_xNG9*WW)iVQf9XoD<Ntq5BfK=wIg2!?pY6gLdOh^<~!a9B$NTTwL+
ziw5CDZ6?h(=5?b8$m0X@I6${a@PaUCG|as_;$cXw`$i_s2Pkb^qWJ)~OvVz;hj`!y
z(R>vU%@@l$lOhJueD3#&bv|zvXuiu!G@r_ob_a~@BF$&Pr1`*(Bi_;<2N!6*l@QJ6
zNFJi(v-njYWiZkE;uzs%h~|r>P#EUxpKR1Y)Q7V4T<l1QTcr6C+##CpwYTZTQ8l2$
zk}x{RZp)<k`rEOcF%A@9HR_R+$Pb!NQSQ$5%{c>F6q@lO%{ScM{|3RN`Mi7~nQwlP
z=2INDAObKZ&8O!D(R|uZQbLBkdK~U}5f^Aa+Xb4>eSzkiglIk`p;pH6iIN)-&6i*x
zIpinu49R(CJ(K1ebdQ*2s5!&lInpwiG#|ie0yJM-cY0=cGeq+dCt>&eW#XM4bv7r=
zPJp8@@%~)54j7Z>`$Q8W!av$UG#^@~l}Yne=uFWn7=mPYnF8yY?=&BKknLuO<_mwa
zNb`Xrov5ZFkET5noWOWtUVupH(`!wOG+(6vPF-%MUF-zCY2|}PP1Bn4mKYN>CNeNS
zX>ykdAW}JbqtTsM3C<^PbZIt3dw53k8fj$bT8bOh)irg(<}~#grmTd^Q!gHxH9u_m
z=FT>Q!e8AWS+~wb8^zT5N*8p#T6p2c;o}!ay}&z&K&H+&@is_o1k(9f!h|86uRy4R
zu>!-G7>2pc!4kaX7Ii+`epmu`%uPt=yGujP!@ioZFm=ApMV&7}C@?mx*!km=I~F@C
z(_%nhNau_6=OFrtC=Tx4F?uKIVdbLEM?uNmfOI}ki&FJC0mQ`V)J!}s-(wJ;@j^B+
zkg4-I21azg5FL4;ZLPyOLx&L;bw02d()k#Sx|5L3_nPLhp!4nHZ0TFj`6iIheIT7L
zbW0{aRi^Lxsj&r}FLF!aS<~jv13ndtIv=+o%Xgj6Q4bF3e3v1ekBATf819hHr$mQ6
zrKv9Hd}K)HBY)TVHbOdI!7n;rFr@Pp&{WSv<!xf>d`&T3fvw|alT`{obv|H0=X*7r
zuXC5bFC1iuT2_lK>U<SUov%A8So~>9Am%22V7SCq-z?NEH%#Y^qEXLkJ83TODWmI_
zB=D`pjWY`2<P|p+r6z0r2YJ9dstrCl{=<B-v7u3KEK5q}Lu%oiH(VpAfni&%-XUj>
ze7hEcLvm(3_odcY&J7sET@HtE<h}u5^0n~?o|3a15#*TF1@zdut?_0wB|VnBTX7Ms
z5jIkr(NgJlQWyuRIK-MMr<bV5Rr0Ce_RPqm5phR%iD68M+skk$QrsGsel$WVZg&`&
zo9#U(2MXo|aL2X7ZG(7CU%8xpq_W2sxA9?ZnSVrJHA@_DFl}_64P>DxXFDL|JV7>U
z&87Aa@JZmg3SgxG!a)c+1~_LK$D=Dh`HjIqfHe@gky?W$0Y&YA$Sx%ek%q8szv&B3
zay-vq`JwXx8H+mKnnj(jV8D&Ap!2b#R0<Y#J|m{i_t}(<L{lnf>U=FTS4AM5uNKnz
zfCZfoCP;wQ9tjGrh}rgeK>EARS9v6BE@SH%NaypzL<KW-J~@HT48b^>5L4%i6Os;^
z8%tT#`RF6GPAVHy=Nn(p`81bwKDVn(oljgwAmG!-T>f*pKXg8JNaq_mO)n899MJuj
zI^StX=ko<Lve@)iF?GI7EH3A7b-uUY`9+=Y{4$*{XF=yH(7(T^^Y!`Q)R{V;6r}Tc
zeb@O)4hC@np<Y0y#Hw29MV+sBQRl<NgkZdpI@wRUs;d@szB#7O7ZdWU&PQ9+`Q9^i
zK3_d2Naw@;uJfe}_e=1_vMWvZT5+oP*2e1w<jo==osV}x=fg<_6W1>3e2pn^F3lf0
zU%(HYZ|ILY-#sh&3y{v|q;{F9^O@L6-cdL=9h=G2`K%$GuiQf37X|5j_j{Q-pOQGF
z^YuYGUpX1l`I`Lr4naB}-*=sF$j=@_n$X*RTO#61@;wzu=d=E+&X>ES^YsGJI3?_Y
z&ezzW6EJ6(z|{GA1&-R%?h<FQ;jDkr`AQ(2&vZfOQ~IOMH!fAk)cH(iZU0v13scJr
zjAmik#nk!kuf5FF`6y<;=zKx{Qs+DQs$Kxn`K*4?`Fj6W=ew||^U;QV@*th>iy@@*
zh5nPy*97T&>ECs}an%^2*k5(Nt10!8zvz5NM5JvYozK{IQRnlM$!F?(w~*bC&bPjv
zfmQT}biR5yNas^;4aKSGjuR8fa!+OvDh5OIDF_*rwM#l*r`Lkc=f%|dyrYC5ov(O~
zhTRVycAo_obiT{bd^2a1f1T}joloIUI$stIozB$x@|Np-N>NOm55tv6gmgaIPo0m*
zX~NX`Rx!x88~N?#e0Yz8QHrbd6RAv{&knJok*V|Pb9zZYI$tfOAnvEmNBEaIUq4gl
z8zsgVwP<2WA)T*PlBx4yyyLu>I$w$yf^5sw`C?b-eAoFD>*fCsd-oOA)D|_2I*lGu
z=$+6*5$U~zgx(At6p*T@C|$uuLI)dFP*Fou6hw+5T_7|Cqzg!qE(p?9tegP4w{G3#
z`=0+f=Un_(>uTN1IoEu~Tyu<fC>i{$^GVPg+|v03zUh39ztQ=KzJKa`5Q@&%^@q;)
zjH2_keAoFB)ypJk^vizI`EpSdoiBi*^BL~weA0iX^X2}m^XXD_z9r~4ozLzMolkH}
z=Ns|*2c1u5_8)Y<c^T>7>U_JA+d5wrMd$PHj1#Y(VE$3(djiB(Z0UTlf7SVxP#3#u
zzUzE#T&4jOozLKZrSm<Z=zLRDKk9tP|Dy95{jJXD`nNit?LX;!!xWwGJaat&r(8?X
z`S2j<QHst-4UAL?BxlyQP;@?IwEQ=nZ_zi(8}0e4&S&&*I-ky#&Zj>>M4s=Y=a|OO
z?#AfL=OVy%TRNY9la@aovaR#UMr`SP)>}HC@4xDNoiP1mkVJMZE19i{f!fbl0#9Zg
zBp~4m%0K9QmHUK6e%1Mi=c_G#)%l9S62rgO`I4Zrw0f3Pn2V>aswUX}QRiD2gPj;7
zdX;SHeA0i_`S4ph-!${T>U_Q5biU;+oe%h3=ga+5=ToKVeCb91LFdCyFpX^Ke4*cU
zzDOArn!oCN&i_g0v-~%mkL}-eKD&R@`P!8JN$11;Z*)H0O{^SBfLUq$Y1e*4CMOG5
z2D33#+UpmcuS|#Iat7xO0j^uW=zQfswN3%PnLl*CbkX1Hd?L7i(fJ+%bIu4#+{%=Q
za{Wo?TcPNDU@^zAfk5!jI-kR~&bLQ75VxiCdF<$XxGkNpyk5)WXPqynUh*$GAO2UJ
z&-G`WkMQ?8p9OgrZMX^^xTW*?h3WWW^>658w!7%w5H|i(=Zj#c=zNa<QRkZy{0E)y
z!H&+?!uhMtr-0ki`7*F<zF}w!(3Z~EphNrscKSb{^U;PwRj_CR+qTXZhV-E5eC*$K
zzUT1IUAz>Xk1L!VMbY^nKkIz(Uv$2REuAkAhu#4Fp!2;#{i*X=Zs~le9i6Xd*Y9;c
z98UwVC5Oz3-_iMWm3)Upc67eu;75Mnbw0~&oi9b_yUvIHrt@9b`KI%60Jn6$&x9SF
z4=GaigU*NlH=U1zqVstoJ%HbJKFBwn?<;0Y=Q|Agrt=N|qs~_r26d$9eB@m}>U^;8
zI-de~l7pi2nQ!ZS)9`_IUPlN#0>pw2)5iZr=YwzQe8Y9S{z2z!spb7q=NtW5=Ue{o
zI^Wc<Iv=|Psa{+O_g&}n{;u<7@e1D!t|7#W(@7HQP`$NR#6j>Wiq1!rWYPIS=WF0y
zz`zK9=zKyy>wMu`Iv<L>EB$}1^XY!q`PjF0KDby_1LsdVUjs^E6R+&c`d#O1<Nb@y
z7xbgfcW7JZ18?bkWq+sh?fX;bbN-#q$NIC*_oem+oiF|eoo^A2=;i&U^FgF_DLP*Q
zTQHEz8puT2(fJ_XbiNTCMviTrkK^xkz8TEF>U{As>4Up|qw|ITr1Ks8QRl<{M(4Bm
zLFW_r8=Wum?{z*8oh_Zu<GapBB69zs^9_eVS$?bYU6%Y+=fhKUKHWccz6W)1iq2>8
zi_RB_(<W>Jw{*USztQ<_{G#*u{=Lpe`c>y^5b6C{=R=3(4gXH(QwXQF)Y;Pc;(`B7
z=YxneV1Cf~Vt%Ldb-{OZJ`b>I0QT>7zE;4z;<nEB>K}AIrEfZ4FGc4I_*v(JNI>cS
zs`F+2p!4B(biR^pozH(u=Sv3u4|P7O|8qK@{qJ->PvVx&N22I_5&uc&TmAo3=X*j(
z4E&$yd<Q8yU$@AwI^PMfVhcs*Yx%!ApO4n76E&|wwPvGhW-n>YrPj=S8dF8!c4KfV
zTRNYc))d%aHcS{1_J$eDHC89(tE<_&t@GUomvE^^W5DXrP0==xECwv=0^-iD6Wt)A
z+ko6MAX$pecf?g|wqB|YB+~$XFG*J22-j)=V<W(#h%kxsxHrsU!skQZHET0raql~@
zDhRR^8jMBb-p_+%01=N*rO^WC^=LDsLmB>?&KLNB>451K`9sgEW~Cj=0zNcd?|HT4
z_$>Wt*@u8slm05lk^?#=A6O1s-?6%5`|u>|<`LU_`^t~M{b(~&mA>fPw3fPOw$qs*
zqh0OM`9oc?9-(sCNBl<0DpqdTR4PB?X$hF5W#>!vnQ}QRxmgjg@u;vP{=%2(dkkI0
z<f@2{D>g>K0$zn#MyX0?xPlJ%<vE-<&%XGo+IP|UW?t@*%Z^0TR}MUS=yVHR+Is>J
z)n+6AY4hX@rjxqLPd&|-RTdr&$EM8i2dN57!Qlb1<B#N_kE@=kC4WhLS(#e3|Hy~6
zx&B9?{GngFSDJS9_LuNAOH3SKi)5p}U3)IZqEX3<woW+xw6z75unmW+F1^@HnT$%p
zjdP3Hb9ax-s)=(5OvOzh)^aPCTDbRAMb*29Cv0lo@SQl<XzJDxdup}L9sVVPC$UBF
zf(Db($BCl$o14$O4&G=Lu84jVNw|_j4k)9${YdoYU~y_dRmjYZfU`qWSI*w>J1pR-
zWRdfD<Z?(8^RZ`#Br;zS9Ab<;FV|(GC1kHm^F={KSTbKF$5Ju7aXfu>#Y{%F6Kx|g
z7||XXQwMn#Mc`boKyp@GWYqHUhFKahF06HA4tM1ws<9tNR&kIyJ(E_Qle=Oa*!;zC
z`%iE`=#1Rx^2Cc$y-2Q$DqHbL_IoiIeMj^lu!+}3=1Cym(Z_+3PkbABQ-}TAHBV%b
z+9t$qH$FGY>pY$2_L|%CfJ1a`$Q@QTjtGQ=1m9*Toj?>f79HUQ6X&^S8W)v=7rC*U
z>$n?3^Y9?HJdXe5F;ycrthuT_<SAYiOy_WHPpG-Gd2ghlqK!s;5_8D)X=}e%`qSx|
zZ}nU*e=2ys%0|D(K2*XFJ9SR}xD>zq<$X=)^C|mU`P~ZVS2V>wUJ+AGY`iAcIGwAX
zx=`G%#r@{NBPL0iB5$0@?!k{qkM58coWyRHlI|SbpQZ1rYl7vN6LY~H5D2(V7BUVV
z58^uDaXDBxAuK+C!>@j_^?f1F+J)<e;JT@2vIk)r6DuJMp$EE_`Mj288u`7_%fh&C
z-lu4PQ-tvuhS&K4VXLb7z7w&*hRVEepC;lw*fvibkOjNxrY|?}-?-8vMz(L7tG-I&
z6}&27qp)re@Jy4hkxrhrp^Ja&HG!IWqTLv|oH7!A>4=z&pP0s_No66P5x@F@URw;9
z4?(1}CK>wI$CFrIE8aNdqCv`FsF!KfG)+j<r4>xAzh}r45ksY5EfA@&L57Mx)e|wD
zh1;|Nqb6O#St1mxW@g<vuZ`I+B(6a;D06nhkl#wT|2p$Wcjg))<nhvF=;oAfv|<2O
zb0L#Kzw`ddQM#)S(n)a+g&F5YCvCbKlxafOFNP!<?!O0XdN9>+D7c~J=E?f58~I0f
zsa8LUWJ?Gr97XyPi7ZnnI)@fNMPC8<y1^y{&cbuzfe3p-Tcbv<wL)B=uRx@GODsYl
zR`c|D#6GV9cEb=Xn-Y{u-ZAY)^6^Mb;e!GtvrhhP9NKY5fvMw&moc{ea-oi|7+$Fu
zq-H8r+NtS;wDem0cLVej94?`s)QL#nc_g{EemLoRYbW!qL)4)fV(g5u2B+9S<|lH!
z5{@_Q_h$>ZzJxNccY$OJ%sK2iHOhQ*RlEoLn#ggy@sPkuY)cBIOM29U9PPJ+sG|pT
zXm8^?l@`&aTC@{+rxea}i$J?oxn|%Hn@Jl^|7Q6ngI!+BIL;DWo8*}fa?uM+=)(Lf
zEF2RGk))+7dxhcJ$2=~3Quf*BJX}g&HtQ}-Va!g}s6|VM2~{sO;OGO&4B}Y)&1aW|
zRL$2ppFh82dh<*(OYeBIYNC9{=^L!~4%y7_-7k18sH#<IQ^8uL7mN&By|XvggPxAY
z)*35wpXp2xtq!d$P3)Bn{)YH^cI$+ws5u;`<v^I2==;dCQ$ni2w0pRuuVqU5=I5BB
zQ*hqO^tV-Y_~kuYBwrQALeJ1#l^`c@T}N<aJU1>D=1%C#M#YZS6>vR~#Vu)w>N0w^
zoS(|d@n5|C@Uw%_xgf}B@4#NCd1v;@!4yOM$zqQ3)z|_sRsS)mE4!`maU5c9kQ^>-
zytAPcqhDh@3u1gAQ^A(r&P6vmIMsoY{{VKkjM?v%G=w;dn9z?HyKxu}(HG~raBD;-
z;{Bo@pS;vU=_{Z!mqw9bXqq6-E*F9eOc0Qi$+W*4&m|ZabjjTo<lg?qK+|RJ(*45{
zjJEN*!ECpjc62^}eI*VgoZG|zrdpg4XR3E`Hme2hSFE>TAr+4(5wJhdq5*jke@Zt*
zusS!QP)or>{w8PpA={Fx<zCe1om`(BxxAJ>=Xg+^8_ymv5XLES;-K~>XD5+ueM{%V
z@pE;>+OB7Ej(8bpb9E<NUe6YHI%Kk+tLMt|^;@bVhxUYW^=7cW%{6j5Y?XD7--*vC
zQKbHG)GQ8jPwQ>|A*UmH9h>ueZvbN#($UB^xBAxR;V_YE4b5m@@bOaHcg0sUr;c0@
z+V3|?dtYpIKB@s5T5CvVzUAosT5*aFbL3sw6Q{+JsBqq~H|?4+vJ7r4=Xlvb6M{BG
zT2t?6?qC-%!}VflEHV?n=+fZvwjW_{+QIt@ps%qGtR9FJ;8_ADa<T|EjN0O$!SVI-
z6s}aPjcAlrR?k{<^jOkOp6Lnf3CzLCOP*71JQesDtpl!co(L@a=Xi*al1Stj!JqA7
zq`r2h+Bq?gMY_AR@Ipq`QiX*lFKj29PVuqb2x@r-?Lf`32_p+#&(&S)cGLZQGTp!A
zChwb%b5AtF>Mxy)2#?!DG$d-zSRhUy>SH?q7Zqo@87$wCQ@+Nt_3-B~U_E9zEux>D
zs<CRe-w+!9in@c9xfaE)R>zB-V(IQ44e1EgQdEm=o_*Amqc<wV7jU0Opnj@z04P=*
zu?%^z;TO3SpR)Wl9>UGWJZxrPscv<mKB9dbVvqT%E_`P8)qy3tC#nLrH)JGdw{$-D
zM&4pS(>+gnH9}F-Jk@Db>Z`6Y0fzN<MQJ!(PGPLbqAOdAUouM@o>7MWW|UaT1-kN#
z&ympnpaBfOq4CE8myZQ-ATu7gUl5(9%U>pGKCJV3L1g5HtBOpWlyJ0vHficJkzXm}
z1jJjQ!GPY`Xk%0189hw@<P0IZ;&!gg48zrMe(7eqceQ<N2$}#q%}s2dhOc0Lo4sII
zAEC3ACzJn}FHI7jE;XL+S|{C21br5s{&qZlUMKy11Vag);ZZz8WhcX91eA=2HpfF-
zJE0v2#vVLle>~$*C*w;5Y!VN96%U*5ge@W9Yk2tkc=)GI_$C4Ywm{G%AQ-w3a3qr1
z0?D3$<nBW9BbkIOn8Xs8B)gb)Bbntbn3WTl)&H-~mt-lPnkas)Tl^-IM3$w*?L>*Z
zZi)L$k|masj}j#-yCokpNs%q3niHj3yQMmqcJ)~9>QDT?I^XYfzRmxC=zM!NS@2*R
zJWUFop$`vdwP3cfU{A5&?z7-$wG^_k6icy`?6cg>Y9()DrJQ1=-e;xFYK^n8Hb}8H
z>9gL$YGY+%W0zvHug_*btF60@?ZFh=BYn0$tabr5b|+HoPW9P^vf78+*hi<>pX;-~
z#Ojb_<B*!-aIMe5^(O1yEStTzQ}*Wd?Y+;suf%5Gqm+G>efu7>I+AT1n^PQH`y4x1
zoqBAX`cs^S`kY>}I#1d-ze;hQ?{i*a-M?nD|9#5-PksA0SzW-kE;N^27@oVp*<6`z
zUD+?YrYNES0D%t>ItXABKuJmm0H`3HplHgImeRkSmIlf|&kF-1;4mfxoRyi0lZ};|
zgI$sf&d1Fuz{i8-rx6z57Znl^7ZKVeF1lM1ttrVbw@X4vR$4`Vx4NR7mZ~B~O&O=D
z>aH!SkI^u~X<fp>P4#us^bwZEda1^&w&q5AEzNRm_?&I=N9_z6_aZ&^*%0?(?>mVd
zbhh`}@6f!Tv)Pr~+ugCno$vo;buc9+lmZX#sDr6-#Qz06=$C5emumka_0US{-v4F~
z9@w!5Lo>X7<OjpEkM0PBzvTya?7_IZK|k_?2?b|%1VRcwm{b`0uL9xCvI}!%m*19M
zB9&iittgnONPkzEl>PVoAjKZct54tI2k$pz><ENE@PoJi8$Ve5xbwk3^MechPd@b5
zt`0OW4z_+AB)4tbgFEnG_vlj!JlH$d{ug*~bY|e)%+RNq0g5_EAqOX3kGy|9KD{u$
zu`oHeH2q;|_Vx0sFUzkMR^~pgzFGN09o$&|{Ndf^=H}Mo-voT2<1s8G)rHeCOE|U^
zW{{&1LdNNaMVXD~IOGoxw-jYHUqa#Hc#Mj(pCqBJ?m9jx&S_1Raeta_RC25Rno7Xy
z;U^`xJ8oja>3NMG<aT8lCP_FweQ>AeHa^Svy79xieR=jJhew`1%<I4JLXP7#Da{`&
z@#?wj)LMFP=#lT_)9WUW3Pvh}*ItjbKDz(%F#*iLXIfS`PL5%gbZ#pvnrx02GPz+|
zUOe5JCVynKt-Rz_2MKqM&#dCXTu-i5o^yM}!}<O~_tqO`m8EZn$^zy`+bbU}y{rvq
z;5V--TbXQ0lHC8Ss(kHLXV!mF2m4unR0pRdSOC=MF#?31RxgxRG#91k_5YqaNc>eD
zjQmp_e7CI*g6L&2oTy}3(lYkunP+wJsx!%f?TQ>{0=Cq_fGu^<s!d`(S-2x7Bue5g
zR&N=99^*z@j>5eBrVeg=R|iRj=M76q6m>9QTOA~ZZK;FuH0U4HLAJlBgVs=jYug{{
z;IZ%OAR4i+QzC$8OC4NDq^N_=;ZNi)@D!U%rPYF;@?4{+gQAOCRdK5EZQJT#RjXXu
zmO5Bu&C^Oz2N|B;`<f4?;|hV`5H%lbG-yP()Iovqk5)VCplIIdfENCtKh(h?mmPHw
zp&+T;Ev`_Gl`YnO>9Va3h8szhwr#6}kBp?=$Ux|Y`!sa#H-mHp#<tW!7mlx(O~El`
zebSCPC`tdN7Cd$na1nYb86>w4UjWMdjXIcFOBU#adccTXQ5Qj@8&EpZuCFd(Tk0UO
zUizClxE4M8^)t=stV!D7Kh;4MdR3P#b?^-ctw2!+J1FX4(T+MO8o#9uPJTXCb}ueV
zrg=vl?BqCyUFW}M-oEtmyE^F3{)ajU<^t?({7D_8V*FDb4EOv|9qi<ZtY}gLDM$O|
ze^Upe!(?3kQ62P7_*->w9$`}Pt2&5e1}HpdTBE3gj+5|Y98p7Q08N|e!hZtdGRC!~
z4nF&?4jKktJn=??j~<^Z4|o$Ey~>n{CTCRw8Zp?qmK5k$6he@G)|=tb1STwUTOI7R
z|3e)_b8u>E3^wlin8kudr;iR8iXL$CJyHJAQ6cDwiRyFn<M%VCclpgJUmGk4dw7aG
zSOX+EeOCvKE;z2-C!AiRxngf<WQWbbr|A+aYX&zB0d?WgSx~Q#-gTW&2ou$VQ$MSN
zrRUBlfT(B$#pq9~#@DVKON*AerMPLOlD@4DKL1G_q-DH)#hn=-XP_$<_p>@kX%5VD
zWn~6!5w{4&wd{>%_;+>C{h~mli^mIQgz(Uc28-0CSU_Bz(&InWL4jY@!T!IhgO}_%
zB;fx|9lX4w4*G1XgJ6Z9)xr5%U7@C~JwRStzH4c}sDqiLzp8__6m^iaqYkeAMjd2P
zIQ}8bh1kPi^cQsy6sKK{`mPR|{ze^Kqd{+}gTXuMpf^Pw#Qv!cic@j@57j~CZ|a~Z
z2|*ojezG0>dvy>T$&rhomS=J2_1RGe@xM_AiQDR6<-qUM!OB0?LAUSfAR3<cqdJJ^
z`>Q(WzO4?X{<}JeSNNt5j($@I9sW)o)S;+@3p?r{o-kf>Lxk;5b<pE))WONZeSB`x
z32tpb#w~S_w51MCQq;lZU6)rTE!W+*)xnw~*v*Vu9xn`7>v9o8DE~Kgu<&Pf(1Vvm
zQ3o-<s)MnSP^F?Bbue64TuX%p%|cNJuWqS><!%u>>Y#U*9bfXF>L80df8IBBkatTR
zY*uRfFY4gcpVdLyAJjqn=xufI%%AFDzR-dzMIG#<w0Hkh{j)l_$~Y}g6DbcH3i_rF
zqT|(!!>M2XtPV#1P92P12IaXZ&yzGY3csm?X@97L(V)2>)WK_isDp&RRR?EkjbLws
zzQ!9PM10>)z&rn<4${z@l+wN2RtJ0IzpH~dMsm__O<nWnJwZ~NX>!L?)cJeirOV&d
zLFWIU4g%;(txv|2)YG~nD{`6QN*GEJyNbx3-_$__!_1C42%w)YjKq&gU;C{(==Y~O
z*hxAW5>G?IFzU7_>XF3`vc@)wi5WzL(qg1uw_HRtNU2c8W!j(F?Gkq@9Mn4o|3ph)
z<fd9Z5!c5qwN5g^7hVkcQ5|IZjXGGmOt}N3;}85v9ZcI&2jjQYL7yMg!RQ~<!4Ui}
z>Y)F&I_U6S9R$&rgW^Xr)g{A0`BTE{%b?$@gZ4kEgN@tjpcjDg6C#ziE8v8Ic-}v%
zgOql~9QB5~>@*_Xl-t4t!c?y&7ynfq%==LtB>qkv4Edj{gZ&hBun1Nj%<%#o_nwn<
z!Q$qPmA$LtB-*Pa`U(>C1qt?%)GmkO&&C7&|4kjd3ae03??a*7;$b~tRNrz2x|U|H
zGh>dT4i?kRxu7z~eOQWqQU`l|GsP=-0EsY5wH)icIkqQr?62lnR?scFq~0v@`znU~
zXLS%Q6UZui>qIJz7eyTmr*mDVF6rJ<2m6;9N%$>waB`DU8WffrXRN<b_@_FUMo|aL
zU_Sk_aPplJIoz`Wn@<3`Ep^cD2X*l259**VZRL(Si2tSz7U7}3hZs0@;f>$b!A^=g
z$O-+X4g%@)3mNNvRR>vqPzQ;0Dpz4mzW19@IWL#D)WJT&{m&9P5909Y7NKRvQj?Z{
zs)LO`tAni+b&%;#b+B<;9gHXFuJ<X&g%wZVy2b2iCm(#ABbT_kd6>t7%VA3$l-O1W
z>FFKRzNv$!cho`IEp@PeM;&Bh@P0(k9Pqd5;LGpoVCO%mgXcgt756dfId3O!ZK;E=
zVR+2#<gRm%?Z2smdE4sX{4(f5F^tCAS_P+GeplY3Qjwh@<o3RQQ3q!L$pr2)vTT{v
zUYOP?dP^?Y0T-wfiW(R}T^~;sKv4%j(vuLdrb6|mLdLmedN+zX81N73Ack=RBkFok
zGw0Jo7tf;Ic$LrG)TNkv&2lG$GHRGv6CoCrv;r~uDjqf}9<cM-R?KL>L5XrI`uZXL
zhJ95L+z!?sx75KQiaMyar4GiC>iZC2&^hX&@9JQ@3xk$g&h(L-9`{?J$XjVfh=sgs
zXb%|ETf}~S60*x?qZ6)qixuPT116@$U6IRQEd}d{w5xgA>m#&=>ne!kIY7O2T#)d2
z{2YnaZ8@_v9v1eaI!LOTYAv%q8GAaz=d3Bhrt~Luu=StS!BAfk#NsD)a1LK@dAG^0
zE%V4{kR{jgfQ4$|HX3Ipm|A}GoD0KZAuQXQeFk&&#t`iRg3Sy?9fZ;~e+Es~wym$4
z&;SoTl83#-tK<==eg22)U?l>48v%Rk|4khn@@4$M1(RL=K^=5upkF|w{Z1X6#+X~u
z(;b1L<xsQ~b?^Xz+ERk{WF&Rdjyf2kk(0yRc7g~mm_=NUYY40BVOi<nyC53=3ElsP
zI>-exzYcpzQ3ucbq7GL4qz=ygMIF4*6Ncbe$FYjMM(pQd4sl{#F7NkY<OxHeN|!S;
z$*^5<AVvDDh0ctH+AKgZ-2w`wS__NhMV+~hj1U_zAa?N<Wi!hj=hn$S%5jC;N#E!y
zGpU^^lb4Cw9&v91l&m;VwW1Di%fJ|CAiEC&iY0gtr$+H+N=6N_nISxdm^6(LkY*O_
z2+~UpIWd6DIfCeU(}-OemO_pc?m7Y4)JZD6j+zJLcNPvZ77c^P2ldDMc!+m&-y_yt
z7&HoD^snF%CuyTT-X>PukFChHA`@ioD*Q`du4ulb@6Qd0Ki7(&b}f{QfBjOvZd7u7
zl$m(qAUnh5wLpvaFO}H#JCNc*z|rv${?jbfA+_yvI>!$*>kmqK@JV}|p*rq%BFI76
zf{yRFOTgVbA6Z{WAW6&MY8t9uoBX|NX?1G(of7x#AJX@`bd?{Ts;^+s=9`+V&3`6=
zSX~C4wi7eDq2t~)iL|I^baS7<hos&{Cn$$Bx=SFWCxmMFr>4kD6(@ZV_oRB1pV42=
zIdQUeG9>Y^+U;h;g%|l2=b1y>k<^<e$o^dj4M5S6p~A{Sc_zyuPe{pmbE!(eTs+kk
z-abE4p)|kr9LuTU-F~x@$l?t#Pm&9@HRiSHn$G@%xwI{c(>TIc7lK|q)zO3U$G*-i
z1L>t7g?_n>NW+)Bw3oaPM%N<>F6^~q%XL1E)?*z|4?svp%amw!z2K^QaPaK|2$24R
z=SceKL&frk31=%Td&9#*=0F(_L3Iz$NteDUa1L0e0e-I7mGMSAqtsg+5nl*@6NnhX
zt4!mlszd}HcH5P#MtLgG*jFl6FU~I_sUPb`9SBBnFMwJR_vZ)nzxF4c99Rr}cHtDm
zBGVM}i+ji-lkylG!YiI?$qX@1iGTQw77-#9v_VU&o#J0=7Z#2^*^sFa$E`7oEXDW9
z7X>iB*J7sJ?-aG}E}36SXj6bJ!L17!yJp>Ky3coP=(xUukMc}B+_mz?72;Y5Yn4xI
zj6rbjmsGS*b-++D6<??hSMP$YUQPnn&NDOBAZds78EEKb_aGeb$qk2hzdxmJ!d6=<
z1KTsv`8HBI_U2=d#fGemhyL<oP!~!XV04~;-0?aSEi~~?HG?(aCODK}yIWjV92{Sq
zDBBrs+3PPyP!AXb%^AG=IIi5Lnpl^F;P$p<Tm=W*vL_0G0|2Yho=I6L(RpEYiZbu)
zh(0(CMA&15A={M!_|uxreTczO#LJs((O1&W%|+om;WQr*)^cgQ_ddO`@VW3Ijma-y
zqxK8bbyUjrHOivJr9+?}j`#|J3EOv$=|s@6N_z}+j^o1SNtkTIE;f2TIol8C#&<`b
zzr?C{QP`n-$|zafrodycd)g#T*7I4m1Eq&?M1Or7T~yEQ)-$bc1*gJ6?PWgJpYKi7
zx%ceJRS4I&2|fz5$#?ik9XyVzaZ{2VlpA`E+FQ6W{48f*|Dsb>$lJx~)`w1P*Ze<)
zeNi7+c5R4d-F;wqV8y*9L1fP@$H7(4wkwM8<gzP12RkzKE{Qt5SU+^r%A(Sy`o-HL
z14W)4$2Os<$A=$03R;>O89HIcqWW0}Yrzw_E2PQ7G(F34RB_ra1O5I)k<WM$`mSX3
zR9BhrL{oy~!9|{vel-J)haY=Yow~S0PPwG)Jh~Au`S|V9tCyReD}fvMV@ZdT<pp_V
zlk;v>Pc#@d(@uBmbZAG!4e6?CbrbKG@ql;=F_SRU&N8aCtWFezZ11u<{DM#?2EyvG
ztjl%eL4rP@r_0ZP@6`H=0iW0~!-KbYz^b8eD2v=~LGn{sBlIQ5Reg!P2dfXovU>fS
z#a9lu8wovPv1*on^N}fEs`-3zo8(a7n%PtTS-jb<!Ti=z!MWk?XXVQfs}8k?;Q{#c
znU)LqP2Gba1!EymV|ZZ^NyWEInEOn!l#%$o-Y#ABphK)I#W9UmmUi{RII~OM@_oYh
zJy@Sux|`AQje9&y$yV5}w|t@IDrBCKCg_a?)H!-eLCPhPw{&3NwKHDq3Xr|jNx0@Z
z58i_%yy$+r59#x5_sibc;;U=l8avun_bCnG3PxyHE>VYp_=TRgvpJdd9c|sCK(@YY
z>c2Lj>=?S)*YCW~E&+Jq?B^n5(((G`S2PjV8dJN&TP>G5LV-03m0>CEWp4YLb=>)h
zAAwNIME8f&Ec?7I*mNa<`7`^k-g&_JDq){=O0-n)fY=M1(qPL$hjHe~8SBOt*PBNQ
z=HA+G7J8Q-xXE+*z(cOv8JAz!7w0$aowqJOt9CfMXY_XEgQF=l%rFb8_4<h^*|y>P
z&sz6d0q6OkKKIvQ$Gd7Q3M-E`F#9ZUnclKm^lK4HJ?;NgGJ06&R$umz|1<UXp94B^
z>}LWer)~uVbX(b-33|TI&hJ>i`y-8L<<X73el;I63}g~(jJ)`h{cbZH8$5TP2V4A*
zWs;@&!ildTvpUKkW+9K!ZZ=sNI>D2RmG5iH=JME?PrZ4ptVLrQ@sa_{a+;rxk7bN?
zmg|Gqt-WW83jEUH^Xl)kc`K%C0}V2VvcI0dKtz`f=w9qg*7v|r>Epwmx{Zw`uGiAl
z+~vA9yKfT)i`K3bZayQ#nV~(33MYOZJB#}KG_WC6$H^xA%oi}zr}Ocu9D?{L)og1;
zwHTa;VoWsM@Hpb_6b=ULGH5CyA%P;~vBFNNPD3m#xR5b4#uxRmBojY_59jfQ@M8z`
z^y7+RZ>8Z-FA4PwaTe##=E^Y0wU8TD5lvheT%0{|C_Oz*0(J|Bcrw%_ibw`?eO=i<
z9vmq+Cyb*xDwr@=s2A1Xi!(TWKH&-vvoKKQiLoGUQo4p<ME4_un`K!7FKNw%@G=s+
zK9YIRxpe|~0v(=1gf7a&Joi`#<39REem(Rv24|Uz{GG*6G~p&RP6#YZVv?v%7Zz9F
z<a~sszRhL);K1D)zqn&@bh;jsSCz=(`93$SOeQ_{ss_}W1!3m|Rm-j`u(C!*nHr$(
zx4C_SFj2E8EL=7ld?k<=z^Z^J^MAq+Wz1r*#Lpz5uU`9co(O6QbmI*b;t*i6+?@MG
zebn;j+^ctik%@wb!u^KQ4Xh4ZCfBSRNHW6s_e%8a5}8frz7VT^mk<#sBTR!`rqSHs
zGzpVqVV3jlWhh3N5M_EZ#7r}?@BrS>mRdH>={d7FH^cP9hnQok5Q5~B&##EIu(5}s
z_KsBK`WLWL9X*qGNxC7wpwxpui-2QIt3#k0TzHp>c2eZAu%P9!%K^SXjW{A`(+d-n
z!N^NH{E-Mho$GtkzE8q#&6s&3{z1W<3zxltq<KX}-^onPdza#ZU-Xr-8B*QtJLt3;
z8TdI!pcVZL?&zE1oEe|O5qnd^t#jz?<@gK^B&~)sKHbLaa%TF-UHzlnN#~x}R_=W<
zb-bD(XYs6E6%+kHkk!P+-5S~a%Z9Xy@48^NGY5G216x!EjyT`-I8pV<%s}nKr~R8>
z?J70NOIUx|xMWPrmA4YhPV16msS}wr4TNr^peZV7o|{2KZ6SMEMxHs8Xr5ZT%r~1&
z&wT1V@=|USqZ-h4kg2SWwhpIk4TA6MbZ>&eIL~){ghBxT5X)#HwG0Ztzp$Ch%s~PG
zd^2t<W~Uh_A!?O-r@&At3@ET$2lBNqTns1vl$Ub)?IwZ&Qnd_P1$pOBn8u$OTWh}>
zB6F?s&_xD~u||uNN7Z=ZJ^1d_KRGF}cBvSM=J9qgbFzJ|0zi2Rvwqy~d09Zw8$d7^
z;JkP2Mu~Q2LX7#rThFe}2t%py4E#ZE3`CT_nsia5j)K2I=wbqiTqSf^ckn5<GnvcL
z6~=3{*Px@UK?GYgt_lCdq$bxaR5ixHCvwuDfx5Jq*x==u@7h1t(!^IaM$h*l4C)t5
zeF@<gspw^Ia4~8<A>umBBUhcbfK(_!IuonNb9L}p)N#^#Jdi1n68}<rDc-SqI;UzS
z$eGd9mdp6nz<@u);N>g;fc6Cd&Xajq4`KjHm<tZzlLn<T2|V3WQ}Em2bO09s1W*`-
zi3b1~P(ZrCc$gf@1wc1|6a>UCAYD+rPwi^~2o%9|-tdK5Jr&@2z7Uh+*bC$=kTTc=
zu}U|f*dyY_TfT3BET}mF0EUVuekE|-1p+9;w1a`!X&qHF%1c1V@jxI)_9RHW3;>`;
z04146W)1r-#9%T2YJdym>vR)9_w#aiYU()S9ng}fHfJ>MY)mSEP!*&Q4&+hi-Q%n(
z*eyT@pK>yI09z*oO)&u40Hc8TU@<^vxT|&+vzG5B26B2V{B~aYEA=o8ZJ_RXgLz)i
zu#5q<L}6CWycYxtP*QY0d-QT%7{^6Bt;lEq!KC&E)k~5-HJc2~v(wo?{5`hMX!(=J
zd$0G^n_sTZpM78T{tLKbvwZc+(&xZnYRCpaGV4K_F%9D^pj}ctVyGz4Fub+oeA_+@
z$H$t(LkSQ=A|Hhu9M~cU<MR~zO=xyg$iZ5ft0puYXaawTGOugc_?jAkB*P8RnP&h(
zh16%Q6nK#ea)w*vAj1NZcUFT}R&JhL9XLiI2Z_5VBP^r?Kt%?+5I}{*v-=)RahG4s
zQx!3dK2fR7Tc<u<QtS-?=$6&-P?AB!Sv1)x<RGaw_;4+!JC$ur?b9@jYBK5mkP>fs
zHJ`W^@0}=C1Oee)y|3~C(!K$SC_>I+`2BRoClh?i>Ww|Z0%@rLwE%r#q90z352{2X
zLqolR<#$!!6|cFqFPt}{{BE9-*=co8fF=M%baGebODN<UXdGj}RrVkmTD1GzmCdFa
z^wxFRV(MThVt*KsV;FZNldMFfi5rhopq0>QsNxIPH(+|;Ik`m+@_itHI}<46;Qn>_
zg!ww8BN%{I=A)2<E%m&dMEEk2W8oV)2>-N24)Vv=)aU5|Fi}D}jknZ61Zz!?GR+g8
zn^Gzt`q-CmN)9B<hclg;+9C&eS5#el>ooy}#3>{Px;e10nvkSe%?&)ZAbRM*HaV!m
zd5=O4w&*|YB&X_<fcR?Oka{|yDE?szISBNmkb|`ieb<2d3C)3s2L{Vjl35gT5a5Z4
zk{k#NT&4oo0&Ie*bukYEmx<tDW82epCAuw>C2AyLB6v2!X8=rU0MaZ+hV=jdGBpu_
z05^Ojg9{)&yj5j6^5GiQF%<yRmrCCkaHldtAXoWqPXa9p)1=E(qH7{9TtsGg5?HHO
zmTXdC8f`$TR>TlM_8Pv%G*gmKZnR~mJxEmMNV#W7ZQN;e^t74f$BIYi49<fIn-D<h
z5*ProCo*WL1Ii4JKd5+M9Z6GIK^sg-^aSK_6Gl%*iMp5bI;g%GMi#f$`=QhU7y$D?
zg5ZOSJ-x`R&-x2s0B{yioE;Sh27nEV%m*rpvkJ{y%u9!qbU6Td^A$pM=6PV9V_wA|
zd$3#s!4*Q$@Al*gbp*;pKjbFtlBw;;CQSF34J222j|06|qJ21`iSf~9xnfrhBfM(O
zo{Sm6-lVZ`5QGR%`@!YBoHUNhWLW`f?&*YsXcb<asD0eb$4JdWvcNmxOouzW0!h?D
zo@So234Xbe=(k8mQkM|Yl20H?KsQnF4bpSA+n|#G3hri~&KSsM+KgI__CrTW4MY-K
zKqu*LT#W&#d0I64cFD6|_RCdA=NI-Gi#wJ@aL#In=S49A0I-<Hn!K3`If)reaW(`i
zBI>R(s_W`3wMK1EOJ|QhE1TVHmk{0k!c`y`Ma-5j^K}8EzE~@~#h<!j9kN1mEkD+x
zg~~h<x+lnnj$X#OU3mYOKAw}-lAJUWwBbQ2kYIZ%L$8Qy8z7sfeHtVBt|B4~dA0@>
zw%(BfZb3=74Z8Kj=gk9sM|qPl+v*@=ZvqQN9eiUZBu7yP3ATMq%rUJ36Bwz!ge`Rt
zV5~N{r4E|%Y^j5#pY+{!)IofdW*Vr}G@7Cgf<(<I>L3BZ(e2NhbZi9eybSTX{`_JJ
zX-geMtHZa|L4KYFjNZ07sA7UP0whmuse@zTKd6I%WF!aSx_pr+gE|0@*-udi0YI7{
z)jpwZb#NMarLy9Il!NRC`#}KTWyDZgZc)NfsQ=r&yFwy>!CHI{m8oVlmhGgQiamT3
zb?~~<yEckCXt$*f<}h<`bYxdTlJ8L+E`u-&0c-W5jO@er`j(GZZmENOvfJvQi}gc2
zrozYzJ`{B@m_7v)?nR6}8(&i5bpFAYUhlMRb#No9w6(;f6Hk9Cisesr@SZ{HNP^3o
z`z+h)p!^z$-X6TA4#r?THV71TFqWYkK~V>1AI|h`se>|kLypjGbui7st#+T=cXcqx
z1W0eVr4BOhsDrtd{0?CH+&ZLvI8|q@H$@$!1?KLkgE=yeGF$3k7SxefU|SvZdgQ19
z$R9#xL3H@KOt_bKr*ae6hbo>nMoRsl4q|kYI~h|_WJb~osj>D>O<p7VjKx>DUwChr
z<!!5jnU!ki&$&|6K|bOTZ`Zaus8SVZxTOxB#}RyjqwZ1EL4={3Az(~O4VtUAtqvkI
zS9WQfpB$_HrVauex70y^ekU>{aLA{2=-_vCkY7jsF}Vx`*qcgG2R91iBmvjKdmUA_
z)WIH;Xu8n^fzk5Jef|7(6RYW^<a2;x;X0rUfjNyuan!^H@Le6W#qe#bgXj;#1AwbU
z`)kU)F*Y(zDi0$)2OtvY$TMl+fNgb96$9Q<2lc^qF;qP{?QtZCYdjsU>zvaDcxZK8
z^WKEYMw>au#1NRG4iXTZt<W)QoA2tNuqy#rs~Zq3D^*kNO&Zjc0qO-k1Oe)x1FiiG
z5C!vXb+B(o9ps>q8!$m_0NTG0;FvKwiaPi_!Dq~++r-=rH5V9602=mrt*IAVwE@vs
znhojzFFBrp@T+}=HE$}bDnX^6_R+(rw$#CCq~!2WAZ>)QIdR=|OC7ZRK^^p7t_nnX
zQPe?kqRmKcQ{3`&C`BD?5u&JrSFPiew$;H6i}}6V>R{})I_T5Btq$_V?(V#o3ShOU
zJ9h*>@6#^nuhoN~B>?RSd}C1!`Hl_S>R@j6LEde3usc)IYN(tOpei-fin<oo!2N<O
zX;78Z9A*BeI>=k@MNtR&chtc~6B@_kkxU9|*RPohD%90gcLHbCF#!g2wBOZ1>cbOy
zuAlUn(vRABqMFTy6HL<p2sB|={9)>XK?%{QR~iJicL_^Y=J%<YoG(LN4R<G?jzm2r
zY6Jsi4PktRk^Cf%MmZ<6ee@VQl9!a`ws9m>W|;@G%-^zPLwb@x>3COIluAmeZXq7$
zIC%KN(wi!e%j$<{@ln7Qg57ff_BoP#@1WS?LfQ2ph5*2M6M$#!#C#+HFc6+OUrifB
zctzg#)vQu9*=w+%K1RuSHy9gfPBXHI937pUoOIdE0q}DyfBb2Mc6Kk{9W_;sVG~MJ
z1~+^Q1#HrGzVh*YLk<V*vU_HBLx~v!Xg+R)y5n|lQ5ANv{;MUi`SRfq>#Cc2QQidL
zb@dfKaceyF3f~o<78fdEyi*)%-p~G`+!#@2fQkh#B!uwgbLnxB@ztacH-Aqf<RXKA
zPh$}smA4vQAxg*4ynLC!b|`}_taGL)KAOv3$W(<(shUlEuQx0w%Csip-Wuqgk{=5{
zfDr?Lj8PvRP-BNX&#f)EDAK6T)|GIBcsg{!Dg^J@%4Q+60cn5UjHsm}KvC^grKUrd
z8mIu%trDY(+!t061?D~T5g?Vvlahx8H~p8H1HxdAO(Misj`C8}d#TN312&qJ_ZZQC
zirU;YHg?V|Is$g$x#^xU=ee_=sBvR1cWk4`^AR`oBE;mQ6*&%HX9P&w1xf>t3>rpz
zc!f!Lr4>abAIAXY?WwZLV}fee&Bf-a*;y>uV=UQe!Ml&xY*LTj-IWj=l<Jil6r382
zq&4ISDn?VIgYVl9M1$C4LR@7KpyMOL6m^h*AW+o7*G$@5>Y&25I{3I`I?#Sg9gIzy
z_)1X+(el^#ZL5PSRR!c<)Ir*at3j&Y)WP70gDP9<U|uVL_mCVd2N7)8T0>C>`x5Y8
z4hZvT(EtDwiSpru@UBoO#sFQFs!fJY!qvveI!!`DrJ9?4_*F(A3<EG!c=}kr=4>{A
z31u}z&7>W?aCDwX337PGzJSM~DAq4C35WzZ-kG65OOI||4|^;`gwMW9HZh7l_(8-!
zWYC2gJ4^lXByD3N(EARNqlLH^L>q#}Phl*`{FkJ@vK8QpWT2NK_3<sU{mTOI(_n^0
z``HztmUzCNLvy05!cXJ#JV<k|mR_V^(zoo+KeTr1vET08{I%5Rr}f8OKYyt`w2to1
zHcpj0O7HJdk!yL|^4{UM63_GZKJtI_`fZ-|VHOya!<Rty2*{EQoFz%r#+cK>cwFQ#
zfJcFs+PYJWGXV}vcI{56Bb!RP6)XT43#JqInhW9y&yJ}O1v)&PQ{a)okJl0K7W|#O
zg`(HlD;O4}W8%)$O_^J$CRGdDV2R?cyE!=Us4&SqO+X6~IA$3GxGT2{eXVv+g^xS@
zw4n^azCs`hxe-$l?Q=vIdJ>L7pe3mQoHcr8nt)mY<Wjev3Id=Nd60#A>H@ubJUEIM
z6J=c{jH*Srh?k+l8Pzt%Fy=-o0+Gh!8SRz<WhmU9ms9aLM$$$&HNCbAC{jBhrYv5c
zfw<a)jmG!xIrp_Hrh^B)T!^zUOYpFa<i8N!q$Nicl5O}2vvNWE3pyK-Xkn}>k|M72
z7IoR-aCwg1%dyP~`cn>PtW45eY}_MkCO0yTL*qVR%xq@H!gy_J#w<l;0}rP#O4|)S
z8Iymwej6oy#yqlB-sVDVn{98eo0n~a6aWJfU;khx78CDw(fX;QTQhv0=NkI<+`>v7
z@Tgz8MBY8@EIy^^X<VZEUWj;y!3N&Yj1f;OKo(&7%HfICSO|~OE^R5C$T!O<qGR3Q
z0d)vm%kP#d9XxzQgudY9r(I>^&aBTQ9mS7Fl+E2eH!aVb9e2!jN`jW?aOvKu-8J<3
zWxF05UaU8MtRLb9f$PmmcpF(Qf{kiT%cu4fGMZ@kCELxMl5JuS4WPH%hc7f}5{OQ3
z7pn1kSQM5Tv1xg?W!L_y-Hpr#dh^-JnoN6CmLaMO?V6uH%Xca|EXZ}~soOKM=u1|w
z+Zf7!QRtGPIm5!Wn^fnK{~RIrFkd^$UA~|7omIBk%XnU;7qW0h#i65>UzCRZTH8sz
zhk861ic2P3FN|1GDo=MCvbi&KYPWeX(}%2A2S3J>Tv~?{_Mg5rm2%3YeEN#A7Xv+7
z?nXCH|4f9@9?Pfh^REn!C($wmqUiK4Sr-Q=nMb`;ct*Z6?>x<o_RdsYE_lkVu>ytd
z*I2b%A%a9J&sjGpnqr9^;}*qXaceA#WT=4IfK`vEMvIIUTl*)gHm0wi6T+eNPHQ+=
zBg>>4Oxtl2XU(UYZwXdVdegIKQKR^h!jvEZonXL0FUK6fAwUCNGmtuq3g;hlXV)03
z`^@HcQEG}nlQ*Ep#?_U#kg$wSXU45swxE*l6h_*)W-wT(AnQ|n1-!<9q7m3+@k4dI
zis_wNuqdWr5(%0UV|0<N9xTKHrV0h<71D==u~(rS&}rewyM_tG77SGJi5^S+K!hkN
z<GdkCi0QC?(%IfxssN6cTF&ucPF8n*v`oFk3;`a1sXrlgQU?liRpcyB2+`J<GJ;H0
za>y}BnjaAs;-`Bu<_Dv4QO{2L3=|P|0K;RF`&i%>!s;``n3poqI!fcnfe>9<Jt&xd
zGo}p689}7SIM8d=$j}R9X2<rT;*iI?%H>Ed=-p+Ri2Wqv&~*ztRZRH#rg1oD!&K69
zN7`5Z_zOn<CD%qj&kWOJaYt-T0u2Rq6$*@Uf>fR*enlPNfK6QTF%_oPbIW0JCq$ib
z)}<~j6tU{AYfYX4+N#Rbi^i3A91-wEy<dx#W5-f)O6lH=j;X^Q#+wD5Ek2>T!K<<_
zraYd>CtEmjpNQrw4e-awM9X3WRuzdHzqUO>(4H9nJ9XJdNG@l+NNA0B2||vInR;I#
zUilG5j7*#v0_~ru6{d8`&awmuAU#FtUyQ4Gx%KjMrOb&<cd4_)5aFe{)O&mGZa#ll
z{P5nfGm?&z68+`f4-1Z0OFCaDqN`ecc>nAdNlM|QeKmb)VU(tn8?cg27OI<5`6<$!
zJrQhgZN!!ZkW7qtqF1bXOyJCL3${iU!6Fk&0}j#A-VAA#DDsP=i5&1+lcA`Cn5&4K
z80}@hHZJ@cf`y_ED#Z=*+xkCf(v<d3${U`RdsP1HjC5d@<j9=mql)L%(#K2kM&9^8
zsvP|y9ZcpP@l#vM6riYsS?g5%u=j><0Q-0%k6a|4#l@_4I@B7!M+TgR@V!xaqV%o^
zc0sD7`gQW_Sgq_aD*3WH*jbqfAs$yws4z9t4H@>``QwZMWn{$VtZ1B+8_njW9d*!R
zER4CNtdWVj=$yOMI8&ucqvU1Ti$b5N*MN*HjkILtdKv8y7eT0xOScvb7^!-CGPAJ-
zL~fF$QCL24Ln}%Sw@RsqmdW8RkS|Q8PYi#@lvIxd%3m$FHPVvu5<~}kUF8<F4I?D$
zh+hb(o%w7*Gs4+nkVv|6A&8<5Vs_L)00ZZiI%rR=kc$YnFN;B4bpECe5{?@f>B@a}
z%&>8xsDm-v>R{~3`b8H%`Sj41XAkDCv@^U8U_5xCbnj4kQC>kO%s2uhK|-;SrJERF
zL}Lj@A-17-BwXbL?MVf{E1j21WimP|ouncu_rG5h%gDPHZ$9KQb0R)ed|!0F#?=i~
z`Zexah$AkjWN3sw?tR&HiaIzoPSuMR%}?BATKI(4ZhvI%!;w2(+AJkdS#+c2EPh8F
z?6|DKQf79KG<0>Ng*5V%(I@)s>f|}*ayzxNe%T8sc*u@Acu3?JHyYu2tbM-ku(Qo8
zE;F>SEim@0xF-v7pK5nfLEtTqbQJgFr@AD>5#3VvBmwrdo|4Q}ob7eL{#rG=(wg<F
zTk4=eodmVpUU$nCs=O_A5WrHV+)%GNR%)3!zM~Fq#%S=|Hp?6PxO9tIeyT9B`wsUF
zteJt2E!)eDWEVH)mz#KsI!FjRqqH<nc%Ub%!A{L}0Ex~Br5(5JuG=r6$G88xI;biU
z`S?}=r@^PZVZMa&{lklNOGgGLr-r2Uo<2(Wt_~I&%nyGGyssWqb?fOm+{kDC)cT0!
zldo%JeOhSb<IgkNQ;T(%43m}$M$pSz?u_DA@8+L<S>}(a>bRuj05IMBy1DtP?B+E+
zHiMw+Yu1V7u_KC{V~Z#kYcvV~GE??8gV>U&Ko>q$4^kN$mKz}_kCH3`QBR1d&aoYJ
z5LN1Hev;U?^v1j==o!rfA8_wY7NhI*U)xSjqu}qxrjGK{#rCCfav%;|LVR@Tz;A-&
z|Dq0BLU#xMp$?841!k~wIjhzFp$@v%rjxizGq_*0Gi18*)QmUQ>1?Zmu5B!?T&o#;
zmg!<VPNi+o19iBC&jNyc-7J~of}(C^vS1M}lRigA`#KyL87p+a?HxgY%Rf`J;Hr9+
zbLp7bsp=oq!I#Mq=6HmY*Wh#b3TDp(Fxne5cp5C4)+6!Njog;ONiQT5#wh?WD#3Ip
zpC)tbwr#6}*Kp^-3d=~w#_#Ijfph#f#+8q|pDGHI@@Qq$Op*UcrV+5ry0?!4xDC{j
z565l_Y1$eIT^-kao@IInOm)m8=}d!~Gjob2R4Zaz9kh%QyE={qF`Dq=u{R)E4ZWo;
zU^XYRGz(b;ufs9hFF?d%30VEi@9H4vf-2P2Y@q&1PPW16IvuxG(Xt7#K4H^a&jxs&
zm>Rcf1@ATcJXMOwiuk<8YF)St>DiGlY>pDas$tcpv#rA*pX{$&m3c(!W?2QtFvy%U
z^vcn$BKj(ts2J07JwRHy<QU+=0|W5V!s(9W>2?g6q7EVouxx~Sv@1m&6cldTRtK@n
z@`{}CL0KA(<DQ2Yv^v4~TM&(GE<w6!YY-#th;bx|U?vzDXTM3e+u}g!R8~YwI0MhL
z0S4Go?pZ>b>4*_+WC@32u;S+jC0r1fb;6L|IGN>s#j#rkwYR)44#FXpeAaLoQSz2L
zI0`{0U$yeJFviq}hBQ!l!qHRh2ELvywg=iAZyAi`I7{ownsSm)<HR92js}P@hiKAg
zPvX5-0z9ISH$CFF8nj5=%24}aDewbKy4qroG;NCNLQ+9~c;Z|aHgM(yX!cCvbHZCP
zPaCl19+(SHjG;vnqZ%mcpy-Y|cozJKNKprKFC@>#IEULP=_OsM<6)sYv}ku)5RG2<
z+%p#Low2PBo@`L#0HX85pMA#2HXJ;Q-9(BuY^#IL?P};}SeLLt1@WZMUhxx@UuYbO
z65^Jpy`oQw$KA+{O`J`;>ovfkvnE4P2kRtQ#30p#z>^Jf*6^zz!B$)9poi>95R-0>
z8HBPM)cIU*m|RcwFn@ADNe>hm5lyO%^S|8?d|T~>D7hgF>W$slAWQG4gU@t*Y&(4U
z!mfQK(wI4zVZyi6LBunj*`&*n)9^7fK1x`d3}R8(RtE>`>(IIR-FNSfTIAi>!=Zt|
zPSr{8sDoj;C9+oPx_N<?^A9ZdK6IN8G>=hj!SE?06f~f5c;@1J<l@Ep)`!U#^BdG6
zB+g;#7`D{G&p?aQciR(UoQ??@kKH=9YWLs+Sfh>S@uH|!ZC+LPk)v9i!ox>iQPjZ~
z5fAnAOO5j%WHKJ2n@OYUm&mUd$5Pb65p3HX14k(Z+E-uBhu>fm;@eRNWuHh!)Co}3
zK}Cu>2#CYzNd2J>#$F_y)#an8gAqIGAel;aQZA+g-wCD;>MR|Fn7jq^MR1u*k)=sG
z2}<zDy}1VHx#$gYJw_-<OCp=%9~T_D_N?Jvjjpbgq}Et?%-Ea;V@8WKWb|YV??^|`
zXvBe&4LpEG6-YQ{nO(G3f_@#2Zh&yjb_}AuCO(oUq#MRgHV9~Jb}9$5q8Gd-U$of2
zGv$LuYC{Xku;*Vj)T&K+>YWM40165g-e3zwU(U=ao#&)aqo{+NW)0iwpq!N{z$g8=
zbW8bBznR6k)q<s{ZFO+bDoG}G=~(@E=dtwy++c;s)9y+4xCXU`+C!|wJ*G&hoR&i5
zHSMxm-Y*!|y7{5;kxpY>StGn`{C$Q6U2RPL5!XdHi#4Buu52U0?>S_*E|4=af$g-;
zmO7YS$NK^j%R*TZ2WX5CkEVCjL9i|da1)*IqJVM~y4&QR&%0tL({`^f<o;;f>nAg{
z%E_YgyY3uhk}hfM#+Er=fJj5W&_73`;h#1k$p?;|*TBoB4@%<^`2g9@F^gjv1&m8~
zCEkQH<Wtl^Uh14<EnK(XFf~Gbz<9j%(u;`ZFe%@`ZFTURImhk7l9ZJKt=(mVAe3u;
zng#q5%H->?)aWj--e)GhX2ND%(e+yk)}X`iC20+`u1!i9t_<_h_gTy^GQICUX7)9=
zt8|FS3oLDt2}K=Lh=}p1GZEB7JPB9N2J$Soo2fjrO|YF<ps0gH-nl*CY5&I|NNjQ;
z-H~(ImOk3awo-xfX+{!)q4%{rrJ+X}RA~K29mDOSDC*#q0ze)nO_IK<4ldM+v(Rb4
zOVj(xpATkL5?jHplNnCqv?DfwqNmq-+lb2Q7oTMxJ3T>eF2E(Qt}(2Kvn!YQW$LWW
z(nFJ06#8Uqv7j}lrEx+%@2&{k5MJjJZ83{H_F55dI5!?<y@&Ev{<b>!se#mu+f!%z
z37amnt3h-}9aKbynk9?1HjFD!N(6M+$n?4@dTJ45i`t7t*QIrb@c$2c_x(?G<3E1<
zEPEZ!$#xthL}kx|W3S@avqEH)O_Agr<Cxh=QH~j<LM1yKD<pelWUm%Q(egcXbzRj}
zU0v7v{r-H{`={4G@VdR`^KpODqCcyHDI|5!T@@nHM47BSYX&X}lQ&W~6uxCG?kK?^
z&MV=la&Am+zLj_evWuh+3ep!JDvjFz5Jucq2VE#5>eiyvg{;*IV@<-&?*F6?N^~6u
z?+;a_AB{(2jP>D=oz(zTEBJjjHnLT1N6=;%lB5o*gof{EGT%}McPCRO?_+YK7#own
z2l$XLJsxo4gRLKT{I)vC1&4o92LT!eef#Egox{ojdJ2uZ;oIuqJ9>4eGL8+kMeIxX
zO_0)Rn+Dc%_d{y<mO6MtwBi<YnZbpMqz;0q)9QCy&`=rsQO!|@_g%li`9!`2VDwzg
zz<t-*+{U}ZGP;1(`KL2FtLmXju_)9|2X>M=$ggeF!?e#|TYFb~+qitLl&L^U^o3O|
zC~2O~+lx>AxYWxX8=>iWH{VXBMlz_MW(cE+4GmCM*K&y2Bh<cV)DP$9(2u%cZfQZM
z9_unI6&QLhVm-QkXcJoMK0&vo4wj`9HK6j<#YFGueDsGs57lW1#RWFH2Zw2uYNy_!
z+#|hz_8>x?>@^MT>y4Ln+{l;+Y-{wyTB_cL)NF^AO#oy{?L5VOA_R(!fhdm3Wo!m?
ztl!mQ<tDJaox)0)mc?i7lh2W<+~kqh7QB^XAfIRc_Ud(FDz9FW3b2#v=)rNvLrG_I
zt>p{PR~8<I5$BE_#2?xZm_M$6wE-_Knkj#Mu=08Y-K*z&Z`}tZp9X967hWtaOm|%>
zdR$q;tx)Pg<3=NXgECB0ROdd(e8ID*NTBM@VTH1X)NUSNctOuDLhEb&7aB(%6gX8?
zWGYm0leq;GKdFOtAK;~k_A;|$yESgxR?b(|z6j(EQrCK=P)AW+$AGG5sjlZnH3(EU
z>_ZV{s)@>|My={b15}fFb<<%~vr~1m2dd>{bxSa+HKMvT9(DhG_5Dm#+m-6Jo2d4?
z)$R9C9WB)z4^a;Ws~<c@b<S6JzCb;EQ~hug)kRT58gB1qsp;lc>=CHx*{9emQ`4)g
z*r!#~XQ0?`UekYAalol&z(aBHWX)i(;!s4*P`u*s`I_NO#Yb0a9^F(Nxmz=GPjR%R
zX7r)r*kH}rW5x0Ln(-HkkKfch-c+2RsGVR?nq;Y+<W`yzsGZuUG%Zs*t*kVoRXby#
zG;3Zvdw5f6&Z&0pJL(`oHWDPT8X~i$4o;yuLbW_WEV8&~BWJj7hiEl^eDX$#U0;pM
zww|pkL<XYF0ssk&f&^~kp0R`|n}C>QRk%h&UYOrwZVpA1<2Xb>a_|riix3hwrkFrf
zl?-K<RpGH!d!_(nxm~+<Pnjt?<aJfOs7b?{ePR54IF3~u|GF9q5XLT$Eh{J1djGI$
z_}^0pg%L3RC1!cU+fy68ey@&ZS$}L?6bjRi=a9*EmiBx5Cv`A<@maoPdhh#1$nL9{
ztg!r1?de=!XLawHmwPg-PiD(|zh!Fnk$yIA6TdLWT+5LpdM^d{Sd7+&mFsYP?1#m3
zPrJm`YJ9ra)P;t)oo{}j4ob|-A9$qT(R=E0@`-n^_ZTYrA=2@$UJ`RF;kCxmaoGrg
z2dc_qlpVJB;{0gMWLi0M(H=sV<hqH_N<ZNtx!2y=W^x<&MYi2{&uCq`e}??USj;$k
z@R<+qHr~A1%-nsZvBHV{_}hj(cg@zLwNegMv*EL?M=`=#cDstS;fiHdO;l33g<A1S
zC|CX@?Of07IHo2l9fjxB;D=N~yh0F~&CumXt*F)1(8!wblw*8M=nSx$Skj!&)aBEv
zkc9iYE}dp-6U^g0!0q?)LNiCx`UUcO>r;#Ea9f9C`+28F(VdwZqw77HF3yW&4+7m?
zn%VTLUFMjF&s2wJT2H;4XVtgj5#W(qybZf#-RiB4r2HUuyYt!1%uH$^{NimR&GR|o
z$w%OAS{Dsu?Rqm$T9wQsYrv>|yTb8V@X8m=AveydUOGZ=VmKVu*J%{kt)BAi{r&Dt
zM3dMo?ByvF?TYeoIkCO__Z*1KJS3>`%FwK2jY7n@HS6ZXtknufR%1CszsqK_iOuO5
z`KMXN{bw(oAOEmg_~P=JC2PvZfn7r4h)tKqfO%<;GCysZ(&rWTd+a)SB@uZkOHE8N
z#V#85GS3ZnXXzG&Vz{1I$u(1<5w4P13D=Iza_zl3on4Z8c$W_kuISoMo~5fXGu^Oj
zM{Xs=!>Aw0Tkgp2AK>znj&wRlXFpuA)XJM$V^@^pIUIJ;w3SJ~KXn+H_Tm0K?UM|l
z{@Eq0WxxE}r#{)40kkgzS^`{eyFWX%HlF^X_QRG<^{!taGcaUYD|4bN5ibg<DWu>n
zwwh$VQmSruA*206lz-uoxkA?T03%D?OJ~O>m}x~2z95=2CWm$!c<tUu=1CEjpnQFj
z*DIUB_e4v;oAF=|ZKPD=WEYihXQ5jBrhm~~12_E>BqrYEkwehhK)skVt4E!`*8nR`
zA(2|(a-`G7T;{#8s8J8OoOAxnY|cZkq7Uk4!d!Uf1HrdyHw~_%6O}{e6$B<a;QF#^
zRT%*CV9Y#yuVCxOd&3-ULa6gvRNQDrUDQcI3MVqTP}z>@uxcQExRA*twIyXa@3U)%
z*Fz|k-F+B_B#(Lx`BT*A8kVPP=d)y^>7~_Gn1e=h51bQh6pPDB;o9wJ#Z+>s4LKkG
zqQ3KpQ?dO!_e70g($lydJOVvsq%^lcWXmibUhB9LVZE#Yr(R7~>9Rve?VN#4C|He@
zBhQ8r49}9=9o`YNgNkOrK<mMJ>L$#}D@I!M<(VZQK@~!3VC@ZYZ_;fFn~y?OH*!v2
zme4-kI9W!=?toA#;r5f>sDYJ1Q%h22MO*?do|&CKBo>>kW(($U(RT9cNoy7b-V)8<
zxieBtBwIPI74BlvKzAx3AJJu(AHCl&fl96$R^D}BkNd53o388@T5&p@e;fDNBsS)^
z2@kAKKSZXAM8X>GlX+2M%s9oZR0&{mUjpAbDoZDYOLa=&2}Nr0Gi?2-(`SprlZ7@%
ztW@z7`X2ecRE>t(sD)%GZefb_1wKP)vRS1Gt+l5ws-5q!rQZ2kc)r*<7t?jzzG})i
ztDdZ^tF}ar=8YWgyDKdy{AQM6sG=@B9}`&{atkW8r%g6>f282(gpl8=y~ZmJT`u!5
zdi!xTBq}gnX4#Ti1>wQ|0*$CAAG+eQoWoXhO;6#?B15iNZqWkNp*5F~P#PqJqq%eV
z)cRz`W!Y&~#l!;G)D%V_<G?k?de@6jSr~-&-_$%zT?i|6fGS(j>3GCgOJC1VHSv$&
zJ|#7|-*Uuiu$H+jxzHdHaW1#P()9}UqKoAjb`#~dM7tWwDGYOdUzo#<JnDd}=rLr!
zw3N(_z7oX!Tujsp%bO?24MW@Ox)`q6)x#ZqLX@<Rk{Ld|QMDl&DXGvGf4Yy7M*7;5
zg9n=`m)Uc5#f-ESo-9Xg!V1H)I;hxLTLa>>%LFuSmM;_)96Kmr!N5T-M||VStOdWM
zeYHx>&`;9BsOQnm6fq;~<2p9>uuR$fyMFtFmXk)puxji|8gU-5q#Nn04MsG?8_JzL
z(KAMUbTQFsJ`tuAG6nTa)H+R3#R(2ma`pH0S;5}xhLrR0?BK&9>2T%}-oESS_fL6V
zfK!V<239t=%`b8v-oYEErJHpuNa`Uk{b`0b8Nf?1m(tnQy>j?(b>1h+C+^@CyKa{2
z#@Jg)p|WSPl>SW)f;+!Utj{)FSCHb8;BV?+#Ej<qY;E+8B-x0kFO3dxEotuG!>FpC
zn~&sKQ$2b;AwYYxMeJ%SrKkwwdFCMYp?c=m#Zd>3pA~sYyO*e1aCYptlQPGn?l_ly
zOUTX~ZH|%Qf!AdfV{RV79HW!WZ%FE(yH6&^*rM5+%Hc8hllM5rS5n_pFCO#=e9ZB9
zW8h8g#+XO&Cdb6aTuYsf>Ij>>I=5tCWIcG?GeX&BjLo`HKvA4d;Qec!C5_fR$~Lk`
zD=}wiR+{5@4tXbMjt;}*oA<0@BCL)zPO+YhY-Ul7p{G})Gw@%_Q@xQOfT5gKVR_qS
zC_=5Z=%7%k$9SPSi$X*_d+$<LD112s>M^Q9hj^7EQHKmywa`6j6FJ=s6OX}FgSm*2
z5lRz-`C_!K3Y$T)#Pd@Y2am_vEyZ3V!j`bRjBSB5Ej!;%P#yNKWvjttFT({^J!5a9
zc3%YD4pS-z9Ksbv(%AaXH@)*3wnhQ{4V=ThTR#?56#`Wy1un=u<qPjtP~l=$Cb}(H
zM)|`VrjK+@-Q_h**w2AjuV+!hLNxcdB;;_*t~47Q7i@g67Rq@{{F<Py9GqT<uOVDk
zl11L5)Z^Tl<28bfQKyDf&|U*du0s5K-mmxsYZIvs8{K5LQn_?8_8=C;@$uuv<KRAc
za6zsLSDdyXUWmI6Bqz`J7O8$yHY=re=B+k46dS@_-C3l2lj#v!jQ1(bxf5k^GswS#
z>S)%7KG4U_){va_r@Kh;jmYG#GaZ}u7;>jBp`*g*nLr%*S%_*og;f=HtO_SQo_l}R
z4((Ptvqr((Ea>Qjmp=tZIlzfoh1#9RS(icn?F4fH(YSz~13?A3BI=x=M%@RH&agGy
zb)0>bKzG^`i3QTwCXjEbgT*`T7mUioq#?R8r?U3$=P&HK&yl*kM|wuR52=)p?a*Ps
zvpxx{jp$%f#pV(&p*@$1Y?J4%&`&%>mxouSg>p;MLRsVJwG!caCA%+14|5WwnDzVg
z&+@!gfgdnrc1mPE*3Im}$l_zjax#%6u$v{Aku}tiH6oEUrkgdMkuBMf?R+9zdN*4p
zBl~8KA^Vj?_G{hjHyJr@8FJiB<f!WAxW~vzG~{ea<ZSQee8|YvYsfX2$TiZ<^_USc
zZHSmpL_Fz6ykO*hWyt*|k^5aY_a-9}Y=oppLelgg8JKurMm#J@JRChd+)TWDM!W(^
zyuv-a`<VD7jQC`d_!N5hl$my_8ST_c+NsyG(}0QJ*ofaeiQl@1|1i_8BSyQNl6D>I
z+2z3`;A13kGD#q?M<AF<Fw{seB1tf&M=+jA=)dZq(vx1L7ck{l#>#J!mEZL$Z^F=E
z6EsB%nx+rU09S#TsIa7{aP+Bg!&UiAR0UF0h5J<Z{Z}3QvpTr>A5{lA2JE<*?fJ~?
z1yb#W2kiGTACWLSB9nSVVc>`|vxAzMgI218-hhJvv!k(@qj{>M^?>7H=A%c<jyk0t
zJvMOEgW1W)%;{vRQ{aG8Ftc;0nR7&{bIgEqJhMx(nalZ9m-GRbOlH>{GuJDruGa=!
zZ!#adWp?at>anVUWA~Vk6U~mdq#kb{IR22?t=G(LFx72j!0j=!`?Q(+e5(7C0rwXJ
zA|Np6|92L#H*~*wnC$Z~locM8j1TI=8$FLuv58dvhD98TF}IJ^yciq$;;gP?oX%jJ
z&2XHxQ-a>*gowceyP<@`E{O+*lO2|mjong=vQwh#QvFFR;`dBM>+*{c{uzf?GLDR1
z@;-Ih{`%$QiA<j}gnwcpMiu&gViCVI5kG;5i8q6OY9dChmBqB)y*7I{ZSn58@3M$F
zzs4edG7)b!WqrXS=Kq;RtmwEt(Q$9R<Hl5H-Sf_h_0E!-ha?v9R(*Hb?=oUjU**$2
z;%Z;bMqky+0I_wj_Agn){x4X>M>D<eW(R(eMSS)Ri@34&Uly^mrs~a$31ZA9w?S?7
z#;b+iYlk1!*1UUD^&=K>UHyNCMO2#1Wkj_W=P_D3{B0Jo?N?dEiJ!5E-rFo<&^C+6
z*COy|7V#mBV(O~!&06Ly7P0kr7SZ)97SWq^i$z=r*<ulo+!v2!C9#O9b+4j0FJda=
z`9HCUt=lYOQM-8R7cAnt`=3}u|4%HUNCZELMNIgeMU3aacKS%<mn@>iCl(PSDJ;?B
zB3Yrd#Uhe^u_}SOkC0fz)@>H?$`*^bO7$CysQ9n3h@m{)->`@lpIF3@&n)8f?<}J8
zS1h8%7K^wDa{ih{B=CR9A|iid5xf7)BC7qtBJ%x-McnaMETX_yETYBFSw!3qS;Y45
zvWVSGTP)(r7K=#ymPKU!8!Y1cUt$qMe}P5x*<ulqKVT7+e#|2Je9a=}#{`M~DvQWU
zViDCov52n!VHPp-7g<E=zsDlFf1gDxhJ0obFOniP&YpPC4!011xN6R2Y9z}~S;Xb<
zu!tr<Vi8|PeZeB?eTPMyju6;l5j{V#h|XWLh&+FnMdaFM5e*U|_%HvMMO>h2e;4+d
zMReb05t9vm$RbvLmqo1n4vR?nHH!%SH?WAKf5jpylUT%szs(|YY_o{1pIF4~Ef$gZ
z8;f|vXjSb`EMgW-FvpKr#7q*4sPtVHQ8Mc{77-$(Bp4w8pQegV`hrF5hi$Ql3EyQA
z**>#~Ap-ET)D$6F^rJgY#u`qN?Zv>kJ?7&_ZZf^JafLph;O&k25sUbmO8n<6;-x>a
zh<w{DqT|n4MEv(yMEvh8BH=d{G4%&5;>Dk{h_4`$0uJA>h~3|?h;OL$@;|eP*q^hA
z6aNB>nDYY`ahZz5A{tEWz4%uwVmINGKb9i%*IC4MsxMhYgW@><f5alDZn22iEf&%J
z3l<Uo1&ip9{wo&oCDlJ?5uty@BEE*CfYS1B34e!0%>F5hX!lbVaTy{-a5>H6Ex2iE
zNT%Yoa~ean;>jokor{w6R`Z{gOM@F8O%l5FnvLl{%OVzkW)ZXh4vTp8Z?cFH+brS{
zD!U2tTMfUlh?(EAh=e~_#MED55i7r75p5|e|B6NI{!12d15)%Qi)i;(ETZavf<=5w
zWx4w|7BTQgEaH*BW)Zvp4vT2;A7&A4KC_74+bm+{H!Py}znw)~qxueuxO<C5jQWqV
zhzY;3h`43Qp7#w#7t4*Tz#158(@LW0?<`{eFSCdS%b+vA!Xj30vxpt#My_A5i0yyD
zBD()g7O@fv&LgpiMt{K~rv98ognnib*}q^BNowSOf<-j2?ft;sPZBlDpp-ZjWfQ|}
z`jsZJtU*&?=IIXub&QlCdzyW_<)3zC3u1Ca+vvI4=uy<ji*@v%B=A$)A>h;?n~HyE
z5S(?4QBR)n$X!PDNBG2wZpV~dImSmKVvl(2uw>o4_o6Ms9&p?PBbljl;p{v?<j8A1
zStkO9cq;8H+`1u#(!AZt5Eak;Jbhfad>Bt0mtiHj%Ge<hc-I4_9<CAZO)aQozz9_-
zeH}Yp#u&6i5t``+KlFexP1lz}g`unt{Dk275nX_{EeK{Wcz3ZNMqY}R)hAEb>HVI^
ztJgix?xv_Hr?rEUSAhyQ6=Bb6m|iF{`ky>eVk>9B;s<a)vT}}$S_nG1XZ%CGmK~O2
zGz043bmDl*1J&1)ssrY>0w>JR`@!-i>?owKT)cWX>pIg4m2y|00s3ImRjGKkA|mzm
zo@mo+o^;HYu4(NpsszlaD$#c=6@hpd_SK#A%bsDAWL82j@{b~=kJ6tz84%4BkZg|1
zXPV^GpL(aFuk`-LwR!UHHu0e8B3sK-SMH)N3l!%2oQiF{@qoQa7C6MYX;%!#je+XH
z(5f=JYcvXcJUgs4MMoAIvuP6PEfa<fx!zDc0Zk?Am$ZIhimYYgi3v7(O?4Dame(oC
zz3PXL#@ZMwK^7RuEg+U%C!}A^dD3%dPI$i?45qfDl6rUcPLE)!sGB%IFUS$M<QQRO
zf~(=9D6yxMcmlg|opFDlnSmZOGvV;y*y2I!WNYEYE5aIzf@x`cp;p3BoAw3!C(oDo
zDb7IaZjLaGTxN1@F9QRq-gW6yl+cA6E1A?;GZ_g7NeO#cXnJGsSWiE>_Z(rjtmoj2
zrzol4TTHuB8Rs?=tXLTFoPJ@n{O;sl6{V6fcE+ld7+DC8+!F8@vROjHMH6S~4YOk~
z>w6h4^)Ngbf1Vo4kdrPhrEK_$-ck{!Fo=C2k@ZrDvFg2e)h6Qpe&gkjXtELLS)~)m
z2kWui@Dm>=9`L%4z#bzsq2y1BQGAxMlvyixj6(e`keMKPMurs1`JVB3$jJe!mBc1F
zaCL6CJu{K7Ac<reIz_L&@7=xS06b1Jy}XnD;NgYr^$lSto*S%o6tXD{rJDjJ^sO^>
z_6y<akcE#b(PYay%M|`=NleM&03l&Eu%e*G9szJUAI08;Gmba8&k!^C*icj@^+)@W
z%A!uuJ7mR?6g<He(sEV-<-1vJzz)GX)}<T4V(T<Ghr|mX2%Ar<$g)0A06)5TrA1Yw
zxvxV$cqTBY@P`g}S3O3o4Wz{jG0H?Rj6H<TKVZ5-&lJx2niB-gq}|~AibafMWVjK?
z+nudpE$H8BF}n|ck5gRr&<|L|47nYLX!r!u^a-MG_M}&I(osuJ*BY+ejiz8Yppy59
zQ~unfl$_aDEaJe^;gI#{$=ePz&#c2-o2Ej4XAwsRZw{WY^z8W{EbaMy7SUtQCc)n6
zUZ%<?7O}4oXJ$%w-fx>l%-=ltuEb`<XK;?hBEIpMkTINDrl4x_f|t$kXc-#P`veT8
zIR!P09&WxD(Vku2$;qTW(|DH8ymM5}cd_Mzt3bOV-^&+r4J=NF5E}tA-H8<Qj~{Pt
zrp4(wG0aI8;^p{y7(**u#})KrePeC+a;*VO7Gw{kjqq`8#I@Viff&^H){`Y3^Hio`
zY{00|6TysfU`CS!6$<0qE1H~ca8a&p77-b`TGCLfevE;PC)q??oA-@4Y4ZDgiunCq
zKDS@$iX4gY*4-OeWOQ?opkAsc9`K&&rfAcn(hi}A9WM{aPTv-ZU>Kh1c~Ir4(9^kh
zrAW^}Y@<3^L5`+hCvJ0$*7Wu+l`E3j*=rEtCs7cNgD<<aA7uCS=<ys}HBK{A;fb+8
zOWonulb(^hFJpdCT+jR*%5UJ@1W%lq%>gS3GqSPuCpsmg*n~mursX@@1}#jfL-z3x
z)`lZ}RYD1lB09dDdIPu<BOxcw_CKubp=}@WpqkaQDQ@-KVdH*RYUfCh60ndUuq>86
z=GH%(GIkeW>a+jo1Id&7f?LRBZO^PU`R!oqT4>=eqI4CY4L*Zew+z~IU|r-jh|XeS
z|6PT&;j{ai{Wv9G^AvE`@01EKv(_zXVm_+TXjJD4DjU|#@Y}mFYaGxT5)qUyrJfvz
z%{NsN^FCx6%lW!u?&9X*<Q?s)$6nvhaxuS#vvR$fC`EJZdc~psCk0o`PCW~%wdODn
z5Lv;Psz{*p5sh7R!Zp|B_?MqItdhsPu;ci^L00|P?DR^@jgnmXIo@p+@$P%?`#ioE
z4^)YLW)XYzwBp<q6lAto#FHQVn4jQ-PIUNq63-U1y}8DHic(@RJ^Zzy<;kj<{15Bx
z{F3Q<V){7FfQ6j%hkW@&#6srwx-k-ykoj*u1}?{6`*=$H&b-p;8K2^?_1c~4!1bgF
z6_rCFH?r>8UmF&9!ruC(?&A?aKG9tceK6^%Ss`E-21i5N6Y^F%kBKJ%2g^m?;<PB|
z*C-Atxr*Q1^)WTHagkwPJMOTK?gE2MD*>t8nn_7C;(F<pVBYWfcr$E9iSM{Ro;r7u
zevj!{hNT1@hL@9|KnryxV7HnogvnbpQeCCnQ+BVqo@7!27;&7)y;Fp8vsfE0*N3Fw
zs*iyBmL%FcPYKN-TV*aUhuFh&xJ5cbXqPc!sMr$nZbG)%jG2JojkeH5%Ep(ca;eB>
z>+m>Q3)w^U+6vuJ)r%Gm^2bYf#AcvL+&(kA+IQ*z&0Z!^_v8vB3udjYF$zBSZ<WCl
zDd8#6F&{-Ks9kL-;TBUcZ5_~5s>D^BL*Vo3D_V?kuR>U2rzy%rz|=DWq0^)W`D#kr
zKH*K5HiOP*3B*EjSV_fIkBq5w2d2c~>gEStOu`w9Ge&ZkPIPkmCtosZ)28><I-sdB
z$<xoHEpm5VDI^R?#?U@%{MIFM)`5(!Z@EPYgWeCnnt)VZk5nFigW0N$_t#(1pE0Wo
zD1$|m)n%d7+VWjdlexM}6C@?P=Ulc)o*12xUc{}4^F6oqXmlO5oTlP-BYC*!@8h8F
zRTzRhdkFM*!f26eAtD_~NcwPRYI8~<xONM-cyW_v(8c5&q|p_do-kgC+}4u(J4b0s
zHSjwN%*v&gGTb!kt*5DTY2}_=+cz8`IF2DZDmz0ZW)X3EMyg%3+?ET~n#XAah~Km)
zAlZ%F7Sw2X@1B_ebBjE^Vpg%#U-L*^X;;lL`HWoyJxRScJev?M#x%Kn`DJ%*?&!g}
z@32Zc&BKLrYZZ@s1!i%WJ-^#GPjgNnp7s6fOab2lO-fKa3#ZeLj60+m^ftrM&YeeY
z&+a`hKYVamcd=@ce_uFx>e#vRX&S~w3KX;I*`V9Rb5)jFlsw|}Z?Xq>kL>XX?k&;Z
zBxkJy&OLv)I+9=$Y0u9TGFL;N!SazwHotrUD3+UIga}X}UR_`mlYC0%z8noxD>mkr
zETT{-1T{?rHS%5c0_$t1m64w*R(;+@ms&?;UM&y{)7mwCTNMljV6ov<xj<UV%{mIj
zDG0eB0ARE1LMQw>kq)v<C%pjx(<ERo`9g8nHDsI7#g{Eg=n&rt0Dxv0l<-1#8o}Yf
z{Wey@iTCN8$Hi$7L*z<|eL6jb$gtK`taxT8XYO%IYKntLd(U5xq6c6sbt348F1TpZ
zaR4S5{mq0ko;+o6K~D9iS4dn@qzVQ0fwVJ*K*-pPINjqa(D<i@gkbdru{V+I#?9Ul
zgT>_LX`xyvbBvO^4XH4`<qw-~K;k=ADEF;5XvI8FED3*boJWqG<=BFsd}$WNzVZgG
zS|pg0FqxxfV@Jn1$C%51X{Y@aFxyl82w{;TY8P{Rx~LP<xAPR86-}^^&Bt6g;32oA
zbEhghleL=*q>Np|D42S**1Kio0RU=F0AO0QrHKuSrNiV5ggj@w5d@Erg2^>5+JXSA
z03e_U2;GUU18Ji{T)CmNl&ombDPKx}NFan&J3^e9<Z4mc_M)<-<2`{`=~s~umev!H
zQvd*f6WMmd0^R0Tmm}m51R%3GMG3$FDUPGK6j_0Qy`Da3N|!mQdjXw+036~VfPAqW
zO}!U@1*!wuHMJ^x0ve;hv{)d36^N}612Ac!Cg=Uu)viudwV9JoCGE542cSI=4{QPV
z^|ey0&qVsFH-H1@6R%SobVh7|01^o@0KrZwz$#&=Yhp8uffEYkUPms8ya|X$LO}>d
zzMj(&0GW<N9QA6!B8nXd4m)r*&1q!zDw2HWg2yBefWTDhR4-GIh$D+tV=J5QZmaS1
zV}b+^D=&R`5&C$pYCh;i@Fw6zXy@tq&{|*YmW(KJ>-L3h8L?AADE!HmjMzbpeQ*rT
zMt$$tlPwvMn<OJHY{`g;RZ>HrWW+Af^lcdt86|_T3z-5d0E$I9pej#kfOHZHi$^38
zJip0^wC@?Y)=>x*@u$6i$cSDNDgf5sWW?ZOcV~qw(yQcl?T_$pS4MOz%n?a4B37-n
zev=CV*u7Jcl_Vn;*9DxaV<*XoX?5)dX!%@1@e^sp{TgmLCB(Lj$auQOru{afb0Z_N
zgmE2>#HmcZO7v)L&?Cu+05Xz{s6~<yZRNQ+w`D|1HKdm$Laz3Tbts~w;#!roeyoBc
zbW27&<RinKRg73@n&eQco@S&OQXcS;(O+%UglI6QZOMp3Avm_DYR5~7GB}Eum1s%U
z-HLtH+{v2Sytj|O+L95uNiyQZmW*f%kxY75&qR_DWo5WYGU8AJf+QmXnAqO`CL=<(
zWklqKT4L3fjJVUV>52jf=b-4&s_0MKlG=V})5Ez!cp>p=GSlhREg2C3l((NzRfKAX
ztTM97w)oc7;BusDIe;GTceyrh%ZS=+H%Kz#kY@V?G0lVkw5>rzHBj^6k$s<K#ID8x
zl8l(p;)~pp5k>wiBVzGtm~9y`QrA4T{<cZ$3{gIdBqL6Qd31rZwq?Xnl8lJ14gV}7
zCMN5VWW=)HWW;a{Pr%h{VLatBucs3!MbRxLOt($+c1xBta@_ar(x}MQt0KvW#oIEX
zGs;VsVpidP=4kGPMkX1-b2qf{IuknXu?LK)tIE^0HqU~w5NO%*wv0%-Ujfjnb+WPY
z4oOC=tE7yS$3y~(IIxey@B%&+2p75MPZ@8GG<b<_%ZLk!e2tZu8OB^%t!LXZ;;meK
z3`s_`5Yu0%ymd=de@OrClQK0{K+(I(o!$CHFco+IEg4aw5o-^@mU9>sNo>i8Wh5C9
zUDuV1otr)|oLlWS33S_*5knFv4wMU|qaiL`2ilf(7(Q&vhzV^&unGi8Mg%m9^N@3{
zF*?i2B2@4;!Z7#ZmYrh2tI15R6I(LkPQL?=>svCS5E+wAaraIhBW@l%uSpW$2S&&B
zZ5c7LhjlG$bNDt>#3vcCD?FqX6v%ctJrbngXV{AEmgG<MDpwGyF7CGyvMC5-TUQSI
zBqOHXQ`(a)btfsCH`+A8I7D=}jA(cI0$!o3_x?n$7C*E3diPGYn<d*aVxHQTjL1W0
zDn({^y3pj*3PnaW6-h=kI7f>KH>GA5Jv_G4mTrJ6+C=1&j3~M-Bie>#tb@!R^(#Kp
zw3p(ituoVYGjlt~b0j<&XOXv-J>dFmfDQy9_XLnnpb<Ji3e4bRb>7=PSPFmBy<)fu
z5nhHqBZOtBuOlGqHcXL#1$8xg*@Ec&t2}p-vzB9N(}0d$p+cVRo4yvLLyvC(7D9>R
zl^PV^7>Iimu8$n_UK^sa0)x@mTVNH4C~1LcgDR&9nH3hoioKnZ1i|QVM`3}iN^JI6
zaPgp!EZ|%}K!uG&N6EnhOH052@>Q~PrT{1wlXgVWUJwf;Sa4@m6j|#f^TQJI=qA0Q
zN-jll@C~;t^xu4zq{WI|c$HWdI_xXjPY1G+{J;q58g})0$OW<rbTj~nS}EXgFKsGy
zwTG<;cwMv@6QzwqLYPzmS(<Py>6E>`#^|$v1Bn8(4qEe5Sr4z{IX!U&wp5a7%oi3Y
z<kd!+G1e9j@JrSJ3M|gUze@2Mg#M1Gvo?^@AFxSnJ6IMp5_ozT!8Wj|3naGykfSB`
z5wKFCI5GlONFC2$fh8l9^UwjGT*n^vIfTIBs97bd#+so107?RuogZJ#PyYIW4e7E(
zZF?6^z&a{`sL>@t{#ZyCR+ubFih$+d#7S8I=sU<44q~ARZ9)V9MX@Cfk!;lma8pCK
zem2pt0Py52_T)$txT_MOqRY6-SbG}?2(17{mfW~yV>47rh6QA<0fC-?hg@(C#xX;e
zsNPFd$5<f)ezb#h{XEy?vLE0l8Y@XRR#wr<qFz}x=>vB^B$hv8bmtleTVNaYBH#cl
z-+(M+o!oh$GJ^{cvJ(%1cIFVVo7ea-l!AaBj>p8_a{A}()Y?`+?MHyRaQeDOKnn;W
ztL5$oe04ZED-;VBoZdywBn3vD6~+?6D`byip;hIei3&nfc%wC-NTbG=FoEEix~w37
zf-Xr!>7lD$HKnK?j1vHs#pzm3*P4(4=^l|$Vj*=7<g1Bf6QgXYOkJ1gvV<bbqIyFt
z!h6pdTU(GHAb^a9DC9&VdYdB7B!DH0O^%*8Dv6A>kUcn39jOB)zles{c9AL9UFSYy
zB8(61nt||kDgv8uKuTb32f!T@4tAcJ2)CayWg=$<9FUA)ZJ!!#$6xFR!)#3~gaM2l
z*xFb{wDz>ABv!iCauZ<(0Ag`o$k19y2*c1Q!#Wmn14A=(1hIjqm#&%JiBHmxpkT$C
zUXrepP-y1F^7&#tL?Z-<K*eH9`d1_OMyiB873!|rVis)2o>_3$tJWT%Kx3!j77yW`
zmJm-3$^~19vrRgeD?=xFmtI83uC9amOqR2BZq<>8=>-v@A&RB_oW(l%{yE&OK;DGR
zJGFU1gb+>wYjDD`+XzZj0gzAjNzyuKJetaoXGcvr{to@%&E4}#bT|MjmTUp&Zn3}J
z6lL)oi@w};YA!JlKXO`nPnGJO%jv+xcKdsrr9u{{>;u(49oB)q3%*!D<Ynimd?&~R
zW9;kpYO<tF8tCE)$7<hJM{`+~-06xoNmcmHQCcqSJ(#3_3YLd>=w9ATb@)@l-f?*C
zVgCEW=BDI6Pa6^SVN?JdXegx6-8TJ>y?taS*wYS4r9AiEm1ohh4T|^TKc?eVz*!f{
z0u7y=09vmDW9*80gF^gR>5YbfF+${ZuOq+@aga^mheKrPB2m6wAkG*n>%|yOXA18!
zvyJEa`%lQF-~o=TSX!(jouC6k&L;4T{lir2$_JtpUF8rAUZnXDB_%*nw(@ZdmNK%o
z`q|?<felfYp9!Zp=RzcSY!-Zno^da_De2eJzYYN+TT*FI$auibwZv;N;D+mA4COCz
z4i7g;ZvsK|T7&v1$|3K$nHg6JAjJQ88k|XZd@1wEgwXqaJFrg+^R=46Rt~M?tP^tZ
z%|tc2S?DI?+f-UJbV&c5$WlbaoFEuM2|kDhN{fd8=YcYGc<_9V=(2CHD2Rf_FPL@B
zxpjAN@v-FcW!hjW5{r0DEYfW+O+W!ox-=};tM_;oZ*!cXYuAkKg8V+`7cherU>5*_
z2DlUOHv+vT^J*U=%zPq4x%XG`w5}YG#DZJ#_hL}Jv2J|xjINaTn4P_Mo}A7g*Rg?O
z?%kd`L^Kp)nS7$Is4s|J)l<sZOA-L@iS2W)ce7!N?38YwBDhWLkcjXMdv)%1@utU6
z2z~RAFUHyH<byR@_tcMfJp{w(FS|Nwqx1of)FQ=wEWp|0!+?dC8gG({^UwNf<98K=
zMAUmkscf-`x%VUeT73=n9itFPF%+OQ7KjAPJRz}&k1O{ikv6XRpZAMAAHYMYjr6-E
zh!=<?v4|94fyh%{qKwoh82GnY#DsQ`g)2<U%i_kkROmF+eWb2x*4KH9MT}0L+9a`v
zvJ#iALq!f@skN(bwv$*y?2;7rz+Nl}3!v2o&;uap;d1YePXn<4Du0Nx_7;m+)DA!d
zY_o_K?e~rV7H1hTp2H*-QQ#AcXd8gocqz*LN=<u<MFgZbku@k{o7zb%A~=1UMbuGm
zt5d5DCb5X3y(7#?O4z6Fe`XOWN4Ho+SsB8mkUA2JxcvH@_5CQ1ja{b#9@*km7RcX4
zQ#L07-L_do>wm@~Ui^kdjQFQ4BIQ405dnW<5goQz#OvR(h>avyeTzjDC9#NvZ&}2v
z5gt#}wpc{K_gF+S=WP~|<7X`57>Pyn{+&h4+-4CiUWO@qZ?lL&Q_ZUQ-&n->@3V-g
ze*=q%l>E#h(n$W9MWhpmh}~ilO^iOXhzmbs5e+DLLjTMnW|3G#R!}_8#h<W<{F2{g
z5u<;VMI?O5BA&zk5{vi%_FWc{_7_>i@og4SvUTqtETaDwi)iqD7BPv$B0BueB8E~j
z`5-sczh)8hI0T))W)Yv^Lij(ih)Q3uh#g20i<tZ+i@5$L77@P1BC7o*i>US$i`b>X
z%=&W{5y$^$7BTk^7V*rw`tK}a!e6k6-e0qbGk>s%w7<k6PSbC(h;$?taq1I`DER{x
z5&1id==%>?ME0;>V-Y8|Sj3R;u!#77FN>)8GZxYArz~RDcUi=1-?E6=zrrG}e8VF4
z{@=tRJ|(e;&tRWfL<?S8cM^+8y8`*0MdbONMO^*?i+Er0Z?lM+-(wL~{xOS4`vr^W
z^gD}~*`;t$#PPc<qUCp4#EI{)h=$uNBC^S7?w43Z0E7R}SwxL*S;Wi#j77}t{sk7%
zLiK-+MU?(OlSSPB9Tu@;ukW8&#Ofcjh&A7^h&Df95s5p0&LUR)gheC@IFne!Q2wu2
z#9`!bEMn*vETY=~42u~02a6b_s(Sh-EMm;BvWU_@W)aJO%p$6Xa-z0b#M2FemfI|1
z>%YPxqP}4fK|f{@nZ95V8wI{%5g!VCpG5?J%_3g;0gIUY0~Rrqv-KMmG5rq~G3Xl>
z5%-xzToCw{MXVS2f<;W^|B^+t_}5s(6Q5bciN9hIok=WW=vOQvdr11*Z5C0T#3I(i
zpmCpBM7k{&F`)q_`U4hm0{2rE5%3j@xby{!h}vQi>tO5u8jGm;JBxVyGmALQ^#_ZH
z+hP&Lwpm2fXBH8Ki`rrlAwOjiiCkMOV(7oXB8Git5zq5)v4{@^zGV@^KCy`X0>80{
zwEs>P(e+<s5#gU%#KyfpVG$?)Z7kx2e*=qX`3o#!;;*xa^&G#mhztJ$i&*|M77@o!
zVi8+^nMFMPw^+omZ&^f9P|?KqSVZ+tEaCv{S6Rd`{=dZ{2LGHz)c8dfu@CmQS;RKj
z|BEal_TR}OD*mTgL?Wyp>Ax)E-(?ZQ8g_ljA|6-WW)YSCU=fvwY_dS++aWRqIG8q&
z#AXX)R5^x}c-F!Ewm4W<{hsyOwPTYCeYLOxoD3uw0SHxYRD1GHO@dXK$2Ro!$@=xf
z%J1G0ct_6&ci~_&^{O*CxU33`tm-<)y`{$=cLBnbabPNDNq?x_ud;~p)qQy}T*qw}
z5?*Oh?%FSq^*(?ou4%&}pwD?n@)X>~C{ORg7cAn%(oL2QOnT+*C8}Llx+Fkca=_P4
zf(GF;t+RZs1AEl`W>%?U=Z`;9EMw^|S)(yOa`+7ITCH%w;J(UA7MgeIRqGSeAwI*|
zF#_H<?{%2VoqYYC&DXh`#3CwjwslMPO}$_9UVSUYB|889z!UF6(~dxz@QdsP?t;hg
z0U46Lw2p$sSsz4t*xsHlSc!Gb@P{pS=v)qI%d$>9RB|4s`Y|$C#-bMKwQ!;@=&8)=
zc+G77;^5t2?kyHEeY`4fFU$b)lDurFZ|E7PD4Y$Sgje+f#p0}RU0Ily#m|`q`uy`R
zqt?p{&JE^zhQtkq5hLZFs5a;;grty`7N{1p?%ul@-N3=180O6xSuV}F0hSXbf3lz`
z@ce#@+Q$@|q-_>aw{t0A?$QBOFX7Dn)VXSmxGpv#qnEp!7>_T$^gj1e^~?FR16C@%
z_l{-^H>MwT4`@k8cudZxT9doJI)IzX=;iQrzd+8jglAl3mRnqHxp%;Q_^hFh(4NT3
zqt3%KX}FgG&B+H&u`OIO+q(kkRvuF~CfMyXz0rhAIi`l0iG3&8XUOB0f(ag9<WI(!
zR3}zXL6}<L2DKxG$f@_MevM9imwb_DP9?%G;hqB}M{w0tO>pmt>0W~%ceeb#14e63
zm(8RDn$xW-&nAtZdRD{o`1BLL7B*XK)RhaHM+C3Wvj*d`$^^8m>gS}4<xK_SZ=4Rl
zFRIlbPG3H6CFB8HnDGgbQzckSPG^y9#3*GZKYPO#0?9_q!Y?%xr)B00BbNxry13^r
z3ol(}%<MItnYY^ew!(t!;vKUiL5QmbNtdu}74uMj<{CQ!$4!e@(Ln>5dXX2`j}l+X
zf#scA&(O2tF!;{a_;(ka1hdXwa?)IQG;n^4MdVnnlL8Id+O}RGPlK(gv~YM*$~Pz4
z`3rTW1kklbn;oiLho<lCgI-~KxN+YiQK3CBf=K`_r}f+=qppGDdI@V#LC<5x2&Q5&
zM@wYS3y~NG-!@mM|Kz2K3&<s<hh0>gzMWZo@&31;H)PT-mOEWU85KTT8#+8sk&%U8
zA&-4p=A%ljx=`FeB{&tJ^mg%}*@sT+PG^3E#tGL0)i>7I5}9WNxuq*p5dv5@Ro`W;
z75qGdvFs%6N_K+JQ_-_=6%V;3ydm<@%$c)Y52(`pDZJSGN+crrP)8X@sV#?8S!$Pc
zUZ7iOoz~+52}IF^=oSV4NVVW)A{#MHOM;pr)@kPq;-(>mD<!3z-+^f<g)pi-&k#W?
z?WYLQ6)j<cCtit;jEn7>mKwajDl4{|dsg`1Qge2*b+K2BTSAU(!7Gv1Y+Br%%VC}6
zgSDv9?7a*xd0%xgBBUrAVRJr=o1>MU>cKN!@oE>i*@I@;>0UBuH8BqMxp(6WcO)P?
zlb}&O+RCy_P6v)EB%_B;(n8C$IF}PSDCZ{`4y`_vJGT4rxb2YM;g3vd^)}RWQH2a_
zZ3$@$=uxrDK-%MxIgxeCRw}A+UafLR)|(ZL();R(d)2j(rmHPGYLYaTE`a3h7`2)?
zjhZ*;9Mmzb_bsO641#mr1$zmdM7X1b$g)aOzwl!Wd`L{7z(;jYTSCwKEKbpm;#AOz
z0Q%Ch{#`l^y2~Qe1JToGFU*Dsbi93pX16d%iw&2rMrxxb_!3fTLp49zx{NBxrql~M
zp*jOn1p<WjXMThisO(tMa^KV@28@C)G@3-p)23cM$=a=VzA%C>frWQKlE`?et>xHz
z9(twNE8LwkS{=>2&@+wGMpehyJaa{%A2tdTiUO`FPw5W2jIJU2fR8ZMiI_@Vqy4@9
z6tBitXpLUFu)lY1eliNe;Kk2goRcut7?y|LKD&hDcy>5o9hcEgaud%p777N6!|yz}
zbK@<C0V>zChV3kMe*a_(Cays0VhC;6^`*nRONsIKU;7r+?|AMRCES<Y(}i!jl%?9R
zbdyv1&5b(Dh{-kfUBR}d*KGPJxGR@0?sbkR0()tmG%qt-{Xi9zBKY_<W*6C-yj@^b
zZvuwoCJtW!x#@RNv=w35H!0WnxYh21z4`zXY<4P6@qVD|)ZUNZFXfbifP!2ovFsJk
zK3QHcSjk1gYSmB0d5`Ohz`GG=vof+y)187wY3A0EF|EoW8r{%$q%T`!$GbK4ufzq6
z9=SKR%(a1>Gkjt=(=G_%sB^x6o--7+-A~-3Q?&P3Mq<B~_qiLs>-oH{1L37_r`cu{
zBL%pb?QpsF>K5gV=&tvbQu7^DJ5DsPmNqe{A|s&SQQk+n1j@+-gE~1{>bLUwwk)v5
zPJaa9Ler#<P~`RNlZ#BJo@ZT_Ky?uPjEU!lGUjCN9#uE<gyeY}E9j1eX78(TQ(jV;
z{#c?zXGVZ{A?A))Ki*^?tSGyqgoiNcGVRQ!p(;bK0@*@xO|6@cifcqaNI1MNjJq|z
zwU|QHZI{HnXxmXrQBpwwUu6HxB6eh02wD^*R{X{ymOT$oeTb%PZ~BTw1hTBxQ62IO
z<>s8EGGA|C+hP$prx?$#Hwqo{iaE?V%{I8+EH~~IAIv$!BSWXGJ)U?-U}gp^w(GXW
zxcB*cr>AZO#j%_CG7icy@c_pgON1Vgjd2AALsm3T+a2=F;Z}Tn%apiB)s9SvbC_4g
zJhGEYH3mu|6fyo~gb*dDpeNm;9m~5RpRxG8%N^35d0_ZL*L9~EAkF5W?|wwC=OS=e
zg|1K`TcR$ZcC4Cc&+upieY6C|M$d<MTYlIL%gfDh$<Bnqd!KYO`i&Fe$TK&VNTFgZ
z*_{Ng)hw2viH^=&{=RnevK39N%?&-M{R>QQ7eLJWRk#LDzha&Z)Ks<#q!ENNP;<~s
zmb}WxYZ!7ljwi&!!*0?KUYcaXD+Z!W9-evt%{y`j@!@sF;}5&!RIMfkDOf*7CZD9u
zp^-MEP)04Cv%vGFo@win*uOt=)ED<=H*9c1v7bgYc7ZM7ru+=CIRnf5e)36O2bCs&
zT_0gb#xxhiLp8eL-R>^XzGBI`7Z#j2wc2YtltdAd5mI$P1KQ=co6<a~nvNeaa}28W
zWE(s|AEP&)7t)av8&SBW2DJ^77Vge^s-r+)3$Yj)o+tf)Y?{Z9l&s)r!0BC7nZ-i6
zR9uadtav+7RWdFs9{9Q);?Oi}oh@wDj&@;!RUMBl2E6RTt7Tvr<gci}Nrs||!%>Xf
z`UG=Ej`0#b2g-$F8sku^LGA2LNd{^vy+XHIU#tpbEyhx1bun@?GU+tf;_cXZsk!#n
zGh#5vd=+W9U2G$6{PHYY7datrfmu_X?h%+P61?YV0yiq_bgu34E_G^vE5%|b^?-Wt
zLR~Rsfxtq$?0S}n(XLtEZ5DBih&0k4iS`<MKgqVqkb{iwE{db$Nx05kAjbAz7EzP|
zCI&MWV@Vd{=oRCJiSrqY3nYsR_loa>Nk|w=$RtZB^hzkhB-M;1wUQ<EdL<2DQpUzo
z=E+jly;6r^(npM?osy-G^-6odWPFTePA1C)_R0jqWJ8T*Ba&rfdS&Bba>>SW=ac2q
zd*w1=@;S!xSCZwg^~&FbDcmwvxSOm{)vIt1h9VlHT9Q%iy{LyU#a?5@!DPjeUd6{S
zrD<cO`Q-nyh&xQwOii@TndtSK80;`LHZ?UrXKLMVdU%J~5mPg#b7sf-%{+FP`<R-a
zJZB!*ZyvnEBGlC4zbxX{EF!aq$}2OEH>n=)20S*IJ;COl6z4r@20a;AykO>DEa$yA
z2EDjhy!p(%1<rd54|?xo@sTk1kvZ?9FzBPq;;VLd3iSWIs%RD}OM(^uQdP8zQ76HQ
z|2tI0<9)fI<GH8r<XwE3=Q*7p6mi9?{7S~e73`~m6VZi!e^wO}Zv=gU6~9mwLx`pM
ztEJ%=ZsTWfCpX_IOfUOGRs1ulm{XPXx+?i$P05p*OY^lk3$<CVYtydWODnjS)_t#Z
zsXp&oLq=c2oi`1ae@ZG|9c!z8+IDNDy|nUAq+;!NNX4puBdPd!Vff9$`1{4Nsim<u
zOOvxtC)b}&FTR-Fc(JgwJpW;N{=ceXXLZG^`K}zjO#Pb5wI@Tjjy?XNs@Tt%Zg8*m
z!@JeVCyyWA%iRqJkPA*=A=H!_|1+wh>aVJba}O9WuQx!{VrVvGiWp&8H8ZHK9wRrK
z;&4`qHQ>ktCEo5M2Xe^osKxGHO4<1^F95&$s;b5^Iu>nDAgPMuGng>-cYw`>2ih+I
zLk~4j1VXI#9fEC`%8yk=rd!~m(zq}N_;0GB`VUpbgx#N1#hEQt(aI-^q$+09i=6*W
zReVTN6^nG`5<aPl88PDLw^YSq6WVt4hmTvTVgZ<n-5;O^t$kZ7((+kVREwpRn+Sc#
zf7PF)Dn4rEyoG)zGFpOuWb;W?gl?&dLXs7#Bvo<TW?NPCp%S_Co2p3lNmcAaso!h?
zsqheXgQ$3HSwEsTc?mL_gb7uw$-1#H^@lp}L?$4PHa-O;ZjHGC%1(SUj+dY(%$%Tz
zysLbP!ub`tCc7?_r;FBv9@mYJ1C6iKQrYhLX!A)`RQ*;}oTB_%RkYbs6=y+$TdHEb
zv?^;>XR!Dx-NYwVaq7K$`Ss`=WQ6<)Ys7K-u1~6>(t{V{fXww)bA`kA`TkH9!R!E|
zaB(ZiN}Qx1T1tCtDUR$5RT1pCex01G@zQgD0jb?7#hl@#czKWjg;xO>y{C8NW>Q3m
zsLfARMc1FIilv%2iss{$&mNC9g+M7a21SEWE5ECX7XMgPtZO|-`)5_L7o$Z7=$Csn
zsUIZB%BF}KZrbzq7gfb-Ai?H1MpXu$EA1h7)@J1<_Vg=?3l`cs=BmG}DyIHaRZNvx
z;ET6edFBZr3J%Ut(p@=6QWbY=sSBL?T2)M8<>0)qGAC#l{T!^;Y7{{ehGsaz<;)$N
z?Zhle9WVa8liR!WG7rB)70Wtbz+Py971213r^(jg5e&L>WCaBmiH`zA*Gt!snmMm_
z-w(*|sfq&@HrR0&48Sky6z=-0EijD1g7sHb#T1pjZ7yq`-&Ylv${~D>-3CA|GsO2)
zMJ($XW4Qf2U8`o^=boUAhm|Jvp)7=Y_e?(R8{bnE;h$B-;vq+Wg*z&8{IKI6(Z&8`
zU#g0CzpE-z2>#nuMNC2qKLLvOj+}k~76*;_GFdL^P!*ttk?9l%`K{<FsXwcVP&KZ<
zR23__@P)4)bs1E>?boG}!nz{kjhGk6D!!{KULDHcWBuXDQH2qK<`aKb71h`#=<k-F
z!!^36zZ+f9zgs!@;Q5KFcVo+OcW=G5n~8p!GfrMuTK#4ZMpAZz*U*YZ<Fl%07*Q*w
z>Jc*$nEfVhU4>mgF;Xw%F>5@v$Cj!%^M$HN#vHquqgo+h9~Q!{&UW%ZYdId(0z5ZN
z&`Z&_A@h9|`)*Wls(4FPWVHWHRU~{?6;1Y}to*JjR%g*?W)V1@(O{*N#6MI;0=1H>
zHJ^rOfQn#Y!UYC(t{<q1xNzF9R7DCwD46<_swih4hKuD|-2r#~T2+J|;l4UC2GMg1
zyS1$<Mo4!og9QJvs>n<&j?voVjj^Q)Q1c*)SHE{lLgNbfp4ugpqPn2?xOd;Eic@s6
zBvp}*e&lOaaU84a(zN3Y7-`vM`p6jkBUSOLt;`ZZ5tZ<ps(AjNsfu7SlBzgcr$fKy
z_c1{i%I~>0#nAOVRdF0E!qK{;_jgrMf{vKHPf=Zepw~}iGfn)&IR)-MhCBa?s+df3
z2fC+(=qT4E<mU}V0cd86Ly$W?HI}KCio-EKQWfp!l#z0kY7F7BI$fVsMNvBSRw)gl
zfYXksCIJDh2vAz2$Wm(@v{6KsEIQjFXrFC#ekiDSg5llQsv_nWRK+{XATa<Hw*#Fx
z!92m}EEp#tjuk)uPgF&Fx)aIrU>({=uTl&b8F0U-Dr(beE`u5FCWf&wt!a`qVj24S
zg`5F@sESub<vWf-ZE~5<J6Yb!R&+=L-@e7bOiuPmRcsWMWo^*jV~z^9m+1)M36Z;)
zlJu>rcoli^jGu>Jz<HnZ=RscIQx#q4W=jt;C4w~pWWTB^4q!Z4vgj-PSs#I;->?zR
z8fIQzv3e;)pu9++t|ZVtBGA7jJP=26=VE~NblqjUZ@dx$B`KBOGR%`u$YMo0J8?`^
zFrKH%5~OBiil(oWR_H?_?XmQ|U}WENmS8c(LRZ!T))<&gwP1_Pp7elcQSSj=h9`mn
zk62VsG4*<83srIgLg<a;^GvMr%ueN5T+B22XR4ylAFATO1YIVY)-pk9YLk>cg%m{V
zYOa5wDxN2)iUsr@gJKNC!dv2MokOPY092O9Ku0ZFr@Q(08Lt$xUo-t$Rjl}=DxztX
z>lF68=oF)AJuPY2)EOG<z+4eU%7mgWlB!5Wt641N<8=)Vq|zkN)pZG?&<e}Tpz!|d
zqzDU4MfR1d=tU(PP2c2svk93uK0#MXeXS3B^Zo9;+tHW|!{BmVk?Ai~#l~VI+F1rm
zz$MM)BA9ha+cM}b6Zz0?7V^O0_ir2<mrs!6yc4kMtNk+3A*HkV`7lRw3I7wU1-O@+
zuAGMKmYT)4jCPZYJ-TW9XH}7h9-#vrfSz#4KimkSIevv2_G49X9Ez8mm(o>$cKsby
z5%Wn^)TSloc*vm{uA<L0Yl|!`gU)8tQ<#{@swq@lm2jw%VxbARqDQMZE#v%-If*8g
zPY#MrhMsv8#+fQ{_n3s<E)B<3%~?PSmZO{~R&K0IuXK#sh?@Q=hW6mLs#u>uwxudA
zQD*|^n~D{h2y_b*)b^Xjke{iFqIB!%U3MfI@7*0+$C7;*+4mgechJ{c#83HU)xvfp
zK@6)Xc_KAs9ZY2%=wow@VS--6yDPp_6_=>f1o9rC6-Pg-ihWQpD2BY4prC<)oL&GW
zU}%)&^Jb6b^&ZI&X3S61fj+&KE@(o}v<5w_Nnq?YT_^41%-?}N?g7T7MPCpvdRYcm
z;eR0SXrT#J8m+Iy5f=arCeeO7V=)Wcs^T3iJq|$jhpI@ZCb5AgzpIL=U#W_1o3^EU
zRB|m7z;7+#|BJo*erjs#+kn5500}K5Gyy3=M5;*dCDhOjMLI}R5J8HdU?U+k5$R1t
zsUiX@y`!NcO+cy$(gjfj0mYg(;Ax(t=iKLho_F5&hvyI2Gi&zDo^`ER-~G9Ql@W<_
z8iZoxkPu|#niKY$s;EvUwi)V}!DXu7ZsyUxgl#r0Z1?TSIr$lE%5moOtH%9gRS^tV
zEbdss(ynH~^E~$~pwn;es)`GaJ)Lya9iPFo#GcK!22jw6YCiZBR=yBN^>0<hS_C8?
zfNwefqAEUhr2jwzmzbuhH@ww2c<@|yC$kAH%_~Iek5t8Zw6Q4-^+`HG$?sLgHh^D-
z<VX>ueCubb;>cS5!QyW7^r0g(aO11+DdG^N7rl;8g~H^X*MMJs>9F=)3zI^6<JtZC
zubav2n9JS%r7RW2FT<yLIkDeV#j8*72)0d47XFurqnu1Z_AG0)qu%tKcoeE~EhncO
zelQ9wLzBDGpS?oN1#+lYP$-2Gco-Mz;tgb|z!(NUz*U;ZBync1dY%{CwY~N_dg)AA
zy^J|rj8s;LyR+aVnX!g-CBQiwt)Gn?bOXwSxja(CxpG9pCs>UT$M_gk^biys%o>wO
zcSYpv81mLh#FN);8tczQk&`6{&r*=o6RU2ZUINAaCFAs^&mc47Iy1wZ_&Zwf5t~?A
z<t#YO3x-e+Sop`=_`3U->k7<Ta1xevepS!cRi4v~7Wl<o=|WIBm59W>d@j{AB{DO`
zgg@&BrA^uJH+lbDmi4H0RvZ{KH8aU`ftf0h*h{T`=6HwBxTq_)nCnH#GtOrNtmRCo
zxz9MBF1+)R<*6_-a}Cl6r5rj^Y_pNpq*&Z9eAnt0&4}Ybt;c+GI;|S_{4BA!PZ;rb
z4Sc~;K<}oy%fKAcq?z8?WdR$MdRs7FE~w2#7$G*x_kd@9zU58bxl@R{qEF=dXi{#S
zJ=Z-Kl;ELwyF>TY(_)iorr=&A70CcOdXSu0N>5Id)RsswnwB1;D33N4tp%3jD6er1
z`(~Di@rW%mpMQ49cS!_Uwk>ch(~-&?{nBtl{is_3tW#z|6Zh2-ryWP><tBCN>*Crv
zwODoVm)nR`Z25C5k*j{xPYyszhAdeN9L@-8vy3VEAw<H(%T))Sax_)AZB<aLQ-3%%
znK4x<Q(GB-sm^qW5E8Tu&aMPERbCORdVSBqZyE~vTz4@0wNQ4IrxGHrgyFS6;we^s
zL6fq9pSN<*vixoMvHei1dYQ)6l~p9wL#^=Rfr!1Yz+H&@D`PreM-$JDtp@j9Jx{yJ
zIM4L-F0$01Hc}Je9!L4c2=S7fe|Yp(5&U(qfH!aZg}xA9y*l-1Tf9z4bAyThP28|l
zsSEvkRVJZK#?tOX<tuOEd!#AeFqmi24=lMr2csWvt2@15nBttRJh=YaiNYxh-Yu2T
z7Kva#Dk5W*YK^93EW6rBP#S>0O-Y0hSC|+dAYspRXx~#y97b4UlUh9vy+5yHz)Gw{
z!4J>&Z-t3n&U^?q*_IG@)meK89zcl!deJ;Hb~hMdbP0EE(3%68kYJp}At4DNNL*Qh
zL_fiF$WIcd<Tnjo#=QGDBiEyl(3FVS>uEv%7IHe@3eN}e1Kvg)OUzA<C<<wk5r1ci
z_tsQKggiv(vR)fw=z2i1MT`d{o@cT~TuZyM9FFa0fPO%jOQvz%{q)+z`|5`@M&Hxh
z#4mJCQ=(2UQ6`;^k9kKK5ML?a`@d5aLtbW~^K?sDX}BfLKU|qP6cHWEq8;-SRWWp=
zxf2xr<aYPPF6YA21n^aPZ}ZQ0W}7sh94?S1=p1o3f*&ci{!UdqgHm;tJv1yiF@mxw
z*?!h{>o--gyV9QZy5FaeFG^!;KUNhPl4`DbyFJd<{-!EsnwiueX?(i1t16x%(WRbw
zR#6@BhO8={HDXrytgd0gseLf0-NY~{*Y2jwf@QYg`?ICqGo^xsA`$ZgH9oWL@gi=k
zoacNWjJ0_@bZ<Bx^QI*^R?cB+`}Ewytv4^8laBfNzrz|cc_fj?^dypU^BZSd(H*db
ze)Y#{p;1q?YE}C2_iH%8oF(WvxM6<{<wkBlidJH1O^M+uUq70H#dS@K<77p=4lpp_
zi`i8bxdoolR%~H`x4Qd-nI#YHYw42E6O6Tct0P=g@wQSRcgU|pXx*b%kFT29tV8Ve
zN5*2&j_9%;kqQ3|qb|QCtkJ>o;_j+_%g+Y;YS$>t9xGN7PGd9XJFj9%T5e!zeZB+w
z3?-#m@;(Fm_g+jA)f2iqG@zvvpvS^ohHEo3wXEB(X%y=zHN5}6E6XEO7b9x!8Q03>
zJn5s_{Z}8PQ*_fq174fZIYi7$i#mpJRgKwRzbLpzn!<E3L9?w^i_5K?OK{ZkL&i$a
z{hHSn*hb=(zMVzmu&k}-y~!6$u~Z>o9=?%YR(qpiukORrE#@hPejBrLcEP0KQ3u;2
z@t~`hK9}leooQZs0S&$0mO4o2HhuFr81z88J|wxf#@V(_-GvAL5kzO2;BvPu$;QKk
zRZ9evw|F%DP6hjmcw4dL2+_bX0UJ%}@lH4E8K${K^R`YWo|DDPTUMkJkJ96roGHhX
zIc{gCJhdt-Zns%6uf3$`k@sZkc726c@(V_|3FT(<?7T$Jv-^GBHfEp|ZaVM#oA5IO
z4@^qxy;_;Pd(sW^%~pLo`F2&sh-d2g!+8^aeM-NoigWY%r%w->S?;KcmcFM(U8<F#
za?iGHd>?$w#)v00=(+PG`QD~IHGbtjr$$*Na|?6F)w5rNmel2D8TnkN%2*}DsP~;)
zt$+WZX1Qn&)A`pA<y0dKLZ8!WFkj%I=4PH|>E!qzkZ*IbwAl9o!-~>79<I6tqCX~Q
zBJb;2G{u264E0mnBpp{Yr4BZv%XxY_VUtMxAc`Y>$(96%N2t~B@3_dvo~`x_MZkZa
zzJ&VR<=>jBZf`=k_yxlFDLPJpZ67vVA&*%`F;bIXCNhHh*$iT9UK0))z_gcUAwm2t
z(<S|){kj_Pz%2UUNFUV4@*M0umcZ#r!K2ZstrMAjIX_7gHHB-YjZ}}mR3J_(No;9d
zL$q_CHKVNX6B!w4!tfkE#G{G$1BfID$Jh0v(>`JQmiKEyPwb0dD$ovZ_0hzfiH^U<
z$+RCN|44ryEHOiQU+7>pCbK4&cM1mQ!-@+Z{FuurSb*on`dmKD#!nq?U|ewO1idXy
z8;`bNAFTr_hNr)bP7s$#7sUsW$YK<3%-AoaL}IVjpo-wouQ*=V;1qQ#idxHcE?u@o
zsM!0anZcZ^jlyZ7QGmwsK82ba(kv`t;f5I0{T}B}6pU2N(yvmC#&7c`oMw?WY~lHY
z#)}(8YT!R-@qKkas(B1SB`nx>QyxD7%+(t29cd0<`&^J-018XkcY@$Mk%2MuFim=}
zi4mdi<F*lga*%&1Y46p`N`*KIfARfLjWwvsHoHNH<R+t}&k$`H!T>Kmlr3PGor?vy
zf;+QV*%y|LqMUUzJoK0%8xZ?i&W&8-FJRphg0h*cEAYF=Lg{s}C|0bs_+FJOPfnmF
zOG*<$uoca<hPM=LnFa@}O{e(zfRrQgV3IpJAe){G_Ut2`;X;8=rq!^p<%T}fc3j21
zB}Wb`jEHev-SD{_mAkP~flr64Sam52hu!SoQu==m;O!FZW3cl{cF2iKX1koJ?A$+b
zDJ3qO4GB|rz;YgOPsz!cEY$JZn|S4sMZL|_`7@2Qw^lD%HZanR1(?mo98%8XS<~&5
zem4NOSk&R-@sE@rJLyp9dbZ({Hb(Kor=z5=mh~zvZ!~;(qms~_*S3V$>^DWGQ>SvE
zEx19wfO$%~+s>F4V#%JWY!PERym1PVOtmG^Fr9yojLmANmj^kGGuAZ0Y9Vsw;8>e}
zmv%UuJ^JxSIywLVGfyQ@iK76XSENWLwk!ZRm3><#FAXD$z{w5GL+C`&VE;jNim$^2
z0ZpMUF7oNO9}fXUiL|QsilWaN#$BA==uHn2zg}-0L#sU9W^(SJB4?Z{_pRnf=Y%(6
zOF)90p4LY87Af)o>ezmkk4KNC%t(_JJIomS-BUNq)pGEW#%}q2>5Kd6sL-@LzRt8b
zl%%3)DW$r!A0~J;KC7i6_k`AX*ItJf4jU6Vm!1vgaY-mYx^zZ`VS-UnxPz~upO%~d
z9Hy13stn({WLxYsx<m};Zs@1s-U^}f38adJ`-aK5TVZ0tH{(OE#<&#h<+_{YBb?=R
zS%x!xyf6Gr))p4T=ughSRPHi&%(|8p4ujdV+j|P=zhW>v*_f#%01)&6fXG}<7B@5?
zD}L1)at>3qXu>%tI?s?xpavWP3ZR4v9S4ADQ6Or699$CR2vCm=@B(qKkd6S?BP$|+
zK;aBmbe}5LQ34~ye2jL}PmxO?0Pw*HR6BzNs_`-TK3gDW)G{xCrsRzC_1|=)0BX>^
zAW&Y~<Az1KHz0~L{vfujIj~R-08k-7B21G@x}!(|xHv!sI8uC_YzMSHuMtvHXXx*M
z-yBe5kI=jnnF8P%0;CBb&b?fR9X{~(BdHnY?J*Vb&8&bSTA&A*0^;NafPR9L8i7gG
zhlHlMFip5!l<`6-1P$|-j>fETfhPnpRKg{>w^rOK=zw?94wt-AZacHZSgM9a0DuAU
zCgoI`4izgZ#<kx8BlKQlSa0o<>wEY2jifK>E0^9ky#E5JBh|jW_U3|r;0~!Ml3S6c
z0i|C8dPRgnCnU(EVt09Tk1d+*;{%V09a52-Oe&7;kcx3dGNYQ%LjaDKD4wnfWfR2l
z1j%tZh0JUy0$JjF0reGH5FMY=l9@CYQd$xn!6%QSeTC#&Qs$D7Txn79AEN?F@CV6n
zn2$^<Qu;gMz$N%gw$<}{YtxGq__ZR=)~j(fDJ_&s?vRQ#O`H?}Nr+ix51CZVA_jU8
z*~z40B(W<Et&o&;e?pe4wvk&%l{`Dng1{j>8*S?=kXEfoL@9C!&Eu;+Gl%r9Y1VfI
ze<Kxj_Je$}irjRvP(diwwg!)rG?&nWd|Lunc5PvitkH#fS73)!w0Du?jxXUJYn!Ik
ztbc-}?Nl3fku#ca)!x)%jocv>M?>&z&oocww8-M2Q8Q7}Fk$7^25y25hOy$<+zzS8
zO(qrlkz`Ww=%!TsN)wVyDhkSRlS#$SW-c<RxQ1kV^$V%Uut5c+h45T{&|IVq$cOW(
zx8*B=apsLKH7aL6w<p)jcw5zyM8@J*2#n|FcSuF9bp@v(4HZBaKaXS+#Q2vq;u2*V
z_kvEnI&h+5msFHzze^?+J9WDHTT->MK-fmEpl0g5;XFH}BHk4nLPcyHzK(amVf+yl
zm?cV)>){kjI9K^_kuk9U5+#I)GY<^cM9cWE;UR(g78jbzwL0g@6|;6oMG7*hm_;TP
zm%>8Gq@wtPP=B10ZWyg25JxbOUka;S3G<Q%=-hWm#XIGpyajSwPvT)Hbh{Q~xt4*@
z{?Zm&J%6HhO_D*KRs<$%msGS;_R)aOi#)p7lb2S(D94t37agwGujh5a$n;}f^%YDs
z1V^F(s^099inPi~Kn><hMO}qq7__7g7Pvzy7VX7NT?jwmQp;tn@cJ3DtXsnuwM#0F
z#qX=AJ3NHU{jBq9msBjv2#+F@in<cUV|8V@;>MlERTDd;V$n(+Uz2eWq{+*Dhg6ho
z#W_*ns%Z}w@g4RTjHo1&isHn_dANlqMq^10o--iNb*MKY0#7Ct3k1^9q3%SZN7H)n
z*Sn-5u4@!h%Y}@vU2BnGr`o#^?<OeEr4VkrH_<DrgHHl<hmdfh-^4$Sitkvj>k`s8
zD@<@J-ZpE14{6HH9?q+ku<v!e>(VZ%7&y3RA$u&3kre(G>Wc~&?F_?rg3nRkOpgRB
z9y96i8IWRO^({~mEG`++zhhex%D$vV$PH%%0C?m>6|NlVTM5~WG)Hh|c$BalY9M_&
zT#5Lkv;T<>ONzzP03Y@Jl3h|UPfDIlDx$uaOK)M%Uo#I{hh8tHHX%|PhtVAlI6_S$
z?$Epc=$B#6bLJvQs4xr?KqeKjl)8?g*SEn(x`ve}b)5M5X^Si{brzmsyv_kkn%mTy
z2_qe2!(LoWXh#6*2+$A3GyCBDUmNjBDnSEr7Q>88k=?wrXwl(#8MGx8pszRpp%DZO
znV|>zaaEt%op5;CP8_=~l}Z}8N-KgSlLkJZ9YLduL$D3{aV4Ib6trKW@Vzk-lbj_(
zMsWp|7_<N~Ld?V2iq_7e)Ww114FvUor1^Ll8*ZAwOC^sxcOwL%YfTR%A=z*@q)HFa
zDgjucgRV6t0D=Z64DSsGv*9i;Ag|TeRft+ke6Sh^xKj`lX$7V6UUYt2HV1=3L4m5=
z*7d2{P}AP5OqnO#>bQ&>vhRAbGw)h%QQ&fJF|n~d&MT)#x)pY!go23=L{y>Dvx3<8
z)XvmbKss%>g(A2G0f?h{r8Z+p7`=BVXip$bGMeCyzkDgKyxcyz;)}Uw+5<`-fNd?j
zs$0sSA4_vSoEe9MX5mNy$84+bVp1pL9beyPcEnLS0#X}b8Y>8s6+jc&?6Qrcv;r>E
z4k8MsXqGA$hmmXrIPszhJ32fR2hgMqI1wkDtd92F0%!_=00R(>ZWUh^z;rzXsteE;
znDSUdXbPH;Rs_m^v}fQHB@9%M0jBZ6rQa&C6<32U+2qpMaj}Qd6imU~tL>D5;t6Cf
zg*x|u!QQn)se5sIChEEx!$fTX*pf950)Q?(L#rqC(<dj3Po@=wt6SN(yHD!SmtEUy
z<GF2AL<^AJ;hcKK=qpZxo)g^o39bQ)85J^0rtGf^0>qu8H39Fy@VhPJAVjB=E-)>s
zNLQdp0)^qg2$l7N%F%Pvjm1D73y?>Tvt7a!apAQ4kwN~p-oyzv90(*2NFI0QQI~qy
zQUeBTQVA|p+a*yVzzxV#Tlogc8k;AY5!6%hyi>I~wxc{vvu`u1TCM<P`<p=GIHoja
znW=7b0Gnlx19Wi)7HDp3TyL_I;D={pKsw&)x*Qkmh`7D{UCLwq6vC*mi*W=$ar+BP
zPz5wZ-+uA94x|Z3`Q%n_R9dKG9JS`a6}vUa#M>E_yUz04hQ@5O6A&yX8xGOmO*a;9
zE)N`_niAl4*zbe`5nKHNB}5;ncxG9vh=a5PD#1V#-B|Z1ghJX_8{+74eHcliLI7+C
zsN|RdY8&YNf@45WQ&$2iBS`OQ$3cTWC)5f5KpaSS*nLB(%&Z3_r~zFI_j8xz>?foT
zmpph~-%t;(`eaK(MG5b-k6A#9JhSx&LgkF{n}+xlZNMTFfa?J5cdfHm9X;2S{Za0q
z;bTJhBa_7TsI`UQSrA_*pG_|)-8@S6Bc2ll-ZojWc?uQo1YKT_s8L<<ZX<ArgUh)u
zAL_rG3b2?o(VoPvc=w9<sXjr#a3Cuj_gHvqv0dx=1voHYkmtr#`l7ncZ7@f~Y@(JO
zP!L`0MqLkS-TSmf1k-S<BU}dx3v|C6vlOHQaMij$Xtm|3#gXEUTefLJ?M{U;N-N&D
zZn#gnsj0Caw4{VSjiH8>t-PMlYoF+#@|e|j`lQX6;Wg}v>M(kSG)w~!g1Ccm9#r?n
zg}K9DDC1b)#lJB#zE8#IkP_{vdng`tGQ10<90-!og>x5#@no^JN!klyBc@SdTv=?+
z+b4s?*ErE@Je}T0vL3~wp$AJ!Q?rsAJMm}O+&r$ndEMZeqI3eL8xHEkS&jf2BgmG!
zZUU>XYHm!>o(7@~aIVDJl`tGR#^tOu!Xj}mT5P`>)gMT5AHUZeDXV`7q7kM8om@pu
zP0h{CIUZsIeC=u<ep-hu*>K;flV`ItAg3}0-7PwR1nYm{?fJTe035XJGrB3uga$g!
z=%Ma7-(6LJ$25O6#doB51erHvs!)02KsS`uxrNNJRO{T=ygMB!_hap&P$zw@VkD>W
z;+>StSUx_454WS4qqvU>4Z-+5l+RHd`yOf%5nl8*qV51SZO2*)j+Lw`hV(C%#zk;g
z<r>Iy$TqSH*?7Wlgd0|c-rWGdll5ih0qD^H#aQ@>F~vO$4$B*_91ljwFEy3#1#>>u
zg2)4&OZ6RmMq^@rT-U<ioCF<Edn?<1BDR4NSm+j>lG%IpE#jW>leti^{KGjBk9{P+
zHKx-caJzPX{0loNQ7RiM<5IuvcDciPG#lZhgVWPjv?D^{XGaVVPdhAM+6dQ}cD!R8
z-ZB@OsS+w65+TFpaf2QZv-B4Oog7C)UEM>3-P20Llg^+)Qdr8|T37&a(^z1IY7eu?
zo=DR@Fvy{kN8VFS6&{Qa3`lj~6A+jhh=l2~1(czv1OpFQjYWX>L<TvDBfw`SId@e>
zTsIi|l2L8lGJi_?ybI#^#KZDq{#HAx;^oBIuVhtGQ0j&)WJgt$Z@AY&RuzGlGQb~H
z#nAKsg^#Y^RK-v?`5jfUs2kuqv8yWTc0X{zEe#{F?$!vMhy&kLMXMmLbuu-%p(($k
zD&o=`!<tlZt@U+IR)q9jRZ&;E>!H+xOJr3MWi~;Tpc?qf>o-+#ES$XSGG&2~fZd%b
zDo?@c%o`yO$*SVgyCeg>%Wfa|{es4=!qum#KAwZMC4fA4RYjZcRmDQhQgOQ2Fdb~?
z(&!p5!vzTKs@2juUuPWmz=@dyZ})e_6}o0Ezj*w+s;K6BsGwluN2(&KuE6xR>0OU4
z;gMpSYQNVnw~B^NFvIECd~j`5Am#+nQk*dHS5=WH>mS=Qn5>@zSTkC7+oMjBWGU*H
z0XQ?dU-Kmg#W9Aw$hrd{>#ikfPI2r^(=Vzb)r~!Mw6DY>&s}NSRTV4$pekyJ6sZ7Y
zRgp+m74Ph-iVTY0E({lR#U0t|c*Bv~k$+MZ8?=p703wbew%=DC0jP$#eWxl`??(|4
zjzTpk0=?q)G}>5Co;OT?GX57;acVwJlm45kXa^4aCspw>p<PvyGAK{?6ME*V+84n*
zM1qOF0)MiQ`W7n1+N1WC<<v9MAkBH}AWefbM-!LOBeR<c`oU2j#Ep(DJPYAE()i4D
zQQY4ntoNYh_@im5ip|^82QL~2bW0t%8q{O)q~F=yqD2%ygM~JicT`2w81qL~JF247
zhT!d`pR0=UM)cV4RmIBAlG$RT?B7(yf<e)$agUSyH22PZI#@H~Kp7)qCv+yXX1Van
zg4BPjDxP<tv9!hRs*2IQe2wmvr6DPQRTUHE*C-TT^{RaOEY&Y#{Yr8`TS=Fm`A4ea
z@UE&D;vzN5^3E*JXey3N_NfE|z08DH{TJD1zTLf9Lnoe?)0UM_nOvPTOOTEf(`7WH
z?N{q@Wun<t6|q^^?q~5wFXYcBpEsyoxF%;sOCu<Gb4OM5|5a7=+f@~*wPVfiot8BY
zf4;x3<<5%3k5t9x9aS+@#!zEdRrHJ6U|uc%URBiWVf?zQDq3%7!dnq@&Tus=k|tSI
zEHH)qt}0IN!wJS?*k~jZ{n&V+bQ@67ODF=*G~YK>(KJSM9tSP#{6|%>>2Fj;1cdS@
zs$!EibMsi}0aSLhE{c!QLnral5Rvj%RT1gJBPbpsJdca@LpPrlJ*Q6hAE}B*zEc&a
z1S8bHQxyy7cIscy)-<XQzNv~&P*F&~AF7J2GYssl^NAyNuor&lt9pLr*QY)&KBLjl
zJZWLzugjrDRu%aJ<ogo7qK>n{XBoT=_fu&*-(qyZg<o{gqN*(6H|uZePWqp!iu}Gk
zhxzE9MDpBj+J7?3@sfL%pz^zTKD(wI?XMK>#i0uHjO^LGy&F`2uPRn%QQ15xB#l&-
zRo*>yQN(Uec(it~^4^(75r->(t151Ux$H?GSegs5{z+AAkU%htUxq@0)YV8q-NL25
zQP8k4_jOdvzyowT;#Q>Enr{yW_J2)Pw2i@^(~NxEZ%x#HAMba8g8Q}nW!ZPx@T;Qb
zjW3g4URKSUrj)8_f?pC3<>Pc>r`u1(cvF1Oq2d|((={!Kl-vkSQD-PA)`E)9K|IW4
zI)tgbrj3!R^oon<3}d}~n@Ea84Bt0Zu@y#;YZg}vvin6<1W_sk&gHarf?Hbus47x<
ziHGgICsmR}lR$XKNOl`QQt7o8|3Xz<qhVh_!wzAo$f_d5swNT@W6`eaho#`F!JWaV
zQ%HWc<2~Ydw~>4%yQF>B<MR4ujH9nqMsR0e#qzaY+Lx#4-L6*IOw^VZ-Rp<zhk}K(
z0M?cR?X)|pq7{VoX&jP4{&!U|yT9J<N2+3W^aJ~!sfteo4-_XHG%R@pvpgDBP&s+$
zcU2J`bHS`(mi2LpGINd5-K>f9?ar*pE_&~XOK<0{Fx6TrUh>U*^#@hac&{Mh*s0!?
zVGoBRFF1?@_nU(*e--+Rs+jc`RdIx<Xj%1OGkuM?AdbNcQ#sqXn66V6t|>gW2bgQ*
zTALN7t4wqL6IIbpgK3I{?d%E0g<O<<vw|z8lu+J7#c>=dm>mq8u^4PRDy+?YG)?)H
z3(qN)Q3c_!hxzx|F`tT_amUvleYQ&d=H&R?{DhcxS9QE;*gVt24}EGSn3ZRr{O>CT
zG~{<}GU$1)oZp-@ee`vs<)2l>Dl5Q{^p!+<QImOHn-vpqW5Yb5_VT0*`}8Wx(OeJ(
zfa&EtjVLU#D8W}hHI7s2>(=Ta=e)8^{85kasQzh9<~S5hKB~&c_#A%t&1>T)0e#R}
zZjenTv)&DwuRZ4$Pz>*;=e>BSFAt}&vmuVhB0f4kHY7DmqIj8PXSxQCB68T7IkK5d
zqyM5Rax4Cwst8i-=jC2>>S1=`c$>{_`V&?0;Qv@v3~c$4su(L5_y<)n60)NzHZ`ld
zswcDX$sNDKb8|-SjLZ2_4N=!_dX;3Uk1bGM)7-nZYFN-1vBl#uiBH8sk1u^jWhB?|
z7=-eaLE^<$MF*y26*|?>ruAh$4bw=0^cf8>y#ZOxxk;hgI#ksOVYSv2LlES#>TFA+
zynj{|jTGpdjE0)8-O9sUXi|6ne?e6=gp7?bRFy0|PFm<i6FAXLh(ZlkvZ`qRKUWpe
ze^3<>1UhoGi@ql8h)7WnLApc4*HUGs^D)GH&zNxrid|K4U&|g8h;`~8RYeL3L-v+H
zh!CL3)=IIT?Lgw^WB9v&R238C=&Z^FAr<Hh#Z@yg*b#+SiT4T!3CjZ-{)=b9OBWMH
za9g{o;vEPF79R-{#D|B<`uwUYo`Y2XrYhPHj>u{!Ui+D<7^=wDBv3%;`wU35x?R#B
z4e%4eXPycib-1c1*r#FlAF7IYVP*k}Mx6h-P)T!!^p6m;ujrsMSBd{nRV0Sc?Wl^H
zKUNjdWK|Kw{AX1W%=}GN9BytBEGQl<ESxeax_OvQ8KE(){&Q7PSE2I{s^XoNvc+$z
zVyI%M@D=oqst7Ru_o`y5a6z+>#&4>k=#HuwNw~@So2qzOB=ireA{r#htWNK<R~h|7
zRWVmG@-em_LKV<oHAP{twW}%$YW~ku#V~n*fL<H@8&xq*&i{w1B2IDsn062W4cxo;
z>a|A6f#-{NWTV+>k{~QT>_$XzhOwKMq?sY$oiQTTS?lGyxVrrI-kWe+B*lsGRkK9#
z%WuA^iiMivb^Kj}b1qS#imk*GEcnBQNYPuJCCKY)HAJp2XqKjxiJ8fMeJu$+ghbqZ
z+E-d?=;o77s|?J)sfwZhm8!T$yyxz4(EX{XmyZ^4a!CiI4&HHN6f5r;)Tpt$N+Cw^
zg=R!hkl_=FBI)?4Xk~;%hV>6r#R39inv3ezsZNgDuNm9uPC~F)^EXdJJ3>T#hBfHN
zEI6(hv)wK!PhP*LdZ=a?jI#fOswf1}{>;eTfg?qg-pGGt4)$PpBc?2<b>zQO73Y7Z
zDzb|DucYY-?+d=K)-OhPGE^SsH)Tbz4A-LfxpogILZ^w){7h90)Km*4HT_vtEYyr=
z*`VDd?2#+?%~9W2qM=J%mmZcNYJfNF-^~0>RU|)E&<uh~@qKE|8q_@8WbsKOL;T?1
zsEU+|xE2#)Oz90VtqCk0`kSiA%KV?Iimm@bRdk0K{)4Kh{vWD}%*;Pf6+?xYsaagB
z4t#=ZxmE4`pt+2D%UlFj-R#oF`3OIzVg7-th!?h^r8WzoUZe>dx_ggvMX>`gUDZ5%
z>cG{!*6MLNePHv&t9iXmErM#avhsdc4oVgrzpmXN<Do!Z-2>fSHx=__jtC@0UE9PU
zo-7*q`SNLb%DiRyK)8PE{>RyrNCvG74574<gdjC7jO&$yLfy-z!_549jW1ubw6>zx
ziaxO*bDoeKu^rVkMnaUGnx;R7r^~2HDri>Dr;re@)cYF9v`WxxCg9Jvo(c}dl<B6F
z!w$+CF4%KxQNE+4d-vh(|B|YBrzK^dL4x|fR}}*x+QWC!%kEtFcv<|su9Qcq%$wGW
zR`MP!R7YIz5!iCcr?^<4zVfJ2)ngj3lMv<~s*2|cGMyweT_^Dia~XGcmBmS6?Fz@b
z7xfR`oZoj*3$vj_gf<Wvl$-W6H1Q}m3p6wzQf`rJXi-yc#Wb`YR&KLwXgjLh?$*%m
zt=w_8p(9wiGoqn0R{2qC!=p^)uG<Y=_m#V=8@eAV_jEM$JXY=<ZRmZj-1nlP?~U@~
z_YIFp%Kgwr@^JgWp2h(ll|g~V!9yxf<Qku-sSIHnhYqU@TQ&|KRT*(>9Pw5eJ=-`M
ztTGnSI2Nlip4vE`sq*x8<J0>p6V;6q4^^IZG(LN*GCA5f`CMh{MdQ>PmFMpppOaLk
zp%11RRA=@)nBh^K75I0mqN6-nRb11M%XqM&G^^Z0z<7dxQ5B0rFs)x#-m7vb?y8E#
z8o#QF&BEWQiugaMit0P6;^&ZERS~kID%ug=o&HT#{3`srstEd@sfy<Ft&iAGNVI&&
zg)q4Z22YkmQ+H72=cZ_0W|jGqs%Z8!r1lXhp6P~^Z?iI=_{x1X@c>~?IWeB5@)PX&
zdv70hY&br+dZRIL)pM$nWBo0Y^?UoKx}e8Rjj*vy+ZHIx9{=<2?3Clrd@;#C$A0>F
z@AYr0VpE`3#+WHz*tLiH_P!(ji(2uw(>7Sa2W7;$deZ4O<n>fmse6u!f3j|P^t4(>
z#<=dX=i>guO*8g)^Qt<#sd<AN@AAw$l$^CxT2_5W2ztZ4-oG+leU`+1>B0y7IpoXs
zg(5YV&eDE3bdvQo8%-OvIF-#UbcDvET!o?`pIt`Lodv@g-%PD2`iwqzA)R))b_vE|
zOoM?nfe%y(HXGN!LHPM*O+EFQk0nhL*NXTyGHL{Ps9$_ScA~;K6FT=DI`5X8Ih5ta
zomI!^%PF+IbUc}XMG>0sOJQ@01s^@`%5v~aZ3pY|^zppC$325??`8Lz>0q^``Y36L
z@04chJ?$A!mAw#JTHYgdo$oZ0?J9dDR+GUd=9;yv#PO^P8SAc04pbUtjEA=~m<%N-
z8T0#Rv^d>sWM9#V$><4H`uCs*HeYZ#NK!9ovQ``PW%}r^=P9vKzBDqnlAx0v(4?G=
zNY!|(p44{?`tm@MX}bc0vBFlVHrsx=@uAEhi}BWLr#yW}I{kW8_DuQ@A3MyZzun2l
zsSo3QoOv4d2=ZJFyn$g8_&P>;fTXBw?XGZR3NIwCQTI_wF2iExRN}qC(>d~CzRop8
zN8WwPJuL9mP;~BWhJVNvqE`DIS3=546eB){*29p_*Lm1EP4ymoz6qu9*3i7e8I6K)
zC!2*E(>}9LM&5jE(?cKirnivEa^g~0xX`y$c<oO8$2Noce!f%OX|BenxS6XR_Pnkb
zcDVk!N-k>8(F?)r`xz|0+`$+Xe2J$oy0<hvl4Y&?4wFLn<r?*sQy<$xGQ(M{6YI|k
z;(IeLe^R&e6<|Aip*L{rK<8n+e6WCsYTu*6g~7vTa~48U%=kEqGUPir72ihQJ}UOP
zG%DtN-XlnIi_GJUb#KpAD!QdSvY1HPArmhP%-;F(?wNYHmyvCs75~jtfBmO&7sWG<
zWz65Nt*k$4pw#a(Z1VngQd+Cg+5x4!%U0)tvHq=78=?#oWGNBjZNpkB6$()@o=%@&
z8$&}?5h0qhZNh@O>JAy2E?@gQ<kNZS9AI;M2sy1hed?EMW==9uUyeAHQcfF;SfcX{
zd8EK$!LW6Uip7{MZNX8nWqi1VH@p5O{g?QL4x?2OoeE0EFQrkk$`YL2)U2DPxv|Fs
zosTtNap3j@rE+(za*ml0(5|^s!G_RdeTYbwQdlCdL)4y_u}n2$NAw8=CzdLdQECR2
z=(~aJ$T1gZ?>Y*R;CVg+F#aY<0?@rldbJcRo=s1zIGw0*z#ESonm?d0u6KA}8!Jn(
zW3k0Lt%)i5D%?klAJ=h(Y1TlHx>hd`&LWZE3rd}Fw~9_kY~f<;NU7;r5F;!}4Ah#S
z*v^HBKg=;a{?WxxJigrzwZNcugO2tBI{#q89`Rrbv$Pp>Tx79x`wVV|^F`KGbjckf
z0XuJFaTCaiP}7c6M6EQtem$O1DC@|FmTNVi^=YZgnz_6lQP<0-F%3HR-#4MdU1B%p
z|D>00c!@EWeRxSn;bokUKO~P=CPG!iX7E&6S;!z;2Zi>B+K|uiqsLB|(R>+*_F0>A
zG@a&$2go0oZJ>(tNzj=~Bgr8ywzgOaOC9L+7miEq6pEG!@@Nb+Nj$9!DSB@egFT?b
zzu>fdqcpKy$@M)v>!W7DXUFix!5pL0icRK}>~4+E(yr%!obyPDI;v7mP`yNfk?a)@
zcim<$KCj4o((G!XnnTWwK;7)Kf@MP*^-T<E1->U3UPA%3;Ze>-Jdb0eJ4Vme=E=<w
zFCLi_a;p-t!#6jR&g7X=+Ut{7_FA*LS5uI6s4Qc3i08qkP#c2!##BKz&zY+N9juk+
z3ulaIl5`!`-Z4!s3lCF!05ohLOKVK+dZ|B-#j<F`v#hf2IXeCtqlyg;OKz08N3kvz
zxV3H<>~7}BHfYTCC0m>%uJwd-3Bs^ZgOWlXv8*$OP02JQG^8K}HQB&<YGnz$8SW|N
zpI?$0R#}^&OKh#Ytn25eOq`h>61YB2cTgF5bRAu~6EceRk{c?BGu4G*w)Bs2EAw7^
zK2>sArSh3^-L(kf*jX1CuaV5_y>@g?*^ChNw#3|G^TUqrbltO1-VjaLhRnK$DYo@g
zTx$8nFQGxm^DCj$WeZ~0A3vBuU1he&HG3tfL3|H;%wG8DaOoXhX5sX*#X>_2oplqk
z-6kxN*{S$^O*tcaz*8k|{1Av;lior+o2gL2`EW4DP<CIm>gGV~rQ)=qjhYD6DP(NI
zYWF^cs?I{~vc8Zpk_~Uo$h0#oVaQ>_232<nc86V~HGHjQlm&UF8ZH?-3!@sN`=HGq
zvcPL{bnnFY$UFVF170lG(|I<wm*iKSOs%}nC!SS?U`w+0`9It{wVv``tL_HFrM29t
z$&{@I_D)*G=?KL9?E4*6(f`HXyB}hzn*Lr@-1DJR&%rM-lXF4H@<W&Pj;hGHxbfiq
z0||}Ogt3fa+R~t&psCZDsn5#fO$f=Nl8GFA6!FrPiAuFt+su>&>!wd1hVD3QUADEL
zuY!fK<e{!zVYBDe6NsFa<)xERZW?PG(O18TLKQvaS|#}gS0AIS7!kWcfFI5xlxM_4
zMdkM$T<#<=Z;QsA8dIlFG;@(6_BUw88)t&{>&|Gb$DD?dt;MmanF|Tr)Hj+;DWX<o
z+QkFirtRPK2~)C`00FfRx!;w>q9*6|$!JJlq&sTu#EmegzUTv@y=7%=R0B|*Qfy-X
zf-63FGp<fR+3;<o<aLg(``>*jNeSvd++o-^9X;xUXWVM~Vwt}X85v;nZrPIb@v-)K
zD-eCWhgF+V=Szx%w+KA%UkwIptn(;Xx3RNDBUrD}CdInsYcEsm;|atg#9P^mV-*H9
zmA<;Le$IaVc}7N*|Lfvo>M1;$sO2$sm;w_=G1Kyebdzwt>`Ju;FE=9ZzyrKdMiv;k
zrY1@W$Q`HrkR7xn3=+zw{~Xe!tp2J5@@cJyGXu>kidAwT9JYY<2a0eXxXl>Y-J;)5
zb00yQtC1Xy2T{*p`vAI2x9P2VskZ?o;4lr5n4B?vp#<2xN2SrV#zBlN%|oGcyxqF`
zSx<pYVQ)BeA)j7hol>-E!egi@!E|j{9tS?=OCZ`paaukTMgd>`*>Hqxll5vYx>)mk
z7D4s_Z%;@Y`#qiOL!GSRTJ)WBoabCb8Of?5Z%`gCAEBkc522Vxq@h{nUz(Qba}%f%
zk=f2}{_6Nba935-+xHaLI~mi4N-t$6QRbq~7>^{-o6yV-C7A5}KUMMnR7G<gw<MjD
zLpt8fnA7H%vq_lqLzrM@U4pr8M3U~6A>CMJy+m`p)Fi#@LwcFa`nl%%x0CdXhV<_<
z8<d+HR3{nK4;egUHf%9B>_{@~9x{B)Z1lw3Xf(-aV#w$@v+<m{@rxwml_BFd%!fD3
z55G@3{AuVgi5Uwyf`ukyX@{{4EGA4xO!g$3>>W1YVKL=9Vk(eqDl%+(h{a6mh?!in
znbNSC+W)DFsVOI}kDSP4^~kmGxSirrG~#ie^<=rl$?BAo^&=-AvU;{ycy^?Cc8_>I
zX7zev;We7#H8JwPtSXv9{!dl>|GTQ_^*5^GH&QXGFyK*9%2?6WjiU20#X)~n6_d+;
zQ5DmEq$(~~C;t^zB&&*f4gWQ)czdPu{#IvERo9*0V8z<Mz>1AKuwq5iK-I!P%bS75
z4+B+gLv??I6(5a0cs2Uy!zl6XSjXyk_s8*;o~JEuCwlsyb!<;|4^DM$J|7sK?)@;`
zw>2{~I@|wre(2M}$kgK4yTyr5i(~(Zs<^hf`uW}4jrVWgec1Z+;T?%YB3HY^NWd3r
zPTi8MCIXB}*silAyCnj_r=Ou)n$vcLP0Hh0XK8LnEJ`zqQ?D%VQKFz(q1~ghTivPR
zE?pUV<@vqW<xjtS_Ne^!<4iPxhD*PqU?5jFQP{q#;?9%X*j)V^`jv&lMONh=lU<cX
zqxT(KqPPsIipR^{pA_16SKXbc_L=LtVNiW<vOaL*<z#pD{pSyH5L#}-nv$88NG1`7
zo|@9RjyOJpn})Sz3*Bi_C#QO9%U?Xs(!9cLR9CV5q`<7mp|`GbWwgYl`=(KS)$56x
z(<@WG_0?~l6A83D#tk*=bDfDINB@PYILh)zRdN3RzpCQ9AE}CQ3X4hpy)tYUPhTag
zil=u}MYA5^l|QJ8*k4q|=R2z6M}V~bo2pn6ty}f?sv_&3R7LZjs*3%;sESKFs-nZ`
zM`Ts8%=lMTv2aIKY=}~b{iZ4wcYjkAOU*fdRTYajU>t!Ie^M3Aeo+;RE|68li5*q(
z<BqC0@r$a6-BA@!d{Y&l|Dr1DiB|ohD(da1ijVk)e^C{ue^C{cN&BY%3srG|&h>Xy
zG3z%~G33vx;@po^#bvNNSyjw>OjZ?3e^C`<x0&P_=6+EXJHDxk1K(6d<K8#Ve^nJV
ze^V8g`8WWZw(nF$mOrS9gzr?ve$KGEcCxA%;amKls*0Y!tBRYxHLaimuXbU(>A@GV
ztP<S_gSx*{7480@Dx!JLQaDbt@gfYz`{=;dPH$plDlz^sXI~3*(_jmvfMr6&TgDv0
zmfU)v4Xx4iLsfCe>c3VMAAnHyzp9FQ|D~#!PkT`uObOj5KyyJMj<|j*EkZP3hGZt6
z!LH83actx}RgsPU_BFDqDEU`avEnyX@g-SRwE0C<)creE(d9>~;={jF6-WQ9D#rdq
zReb3}cmR&e(fwq}P1+<>DvaG)Ncmn>T;j77%gWeFa2u&qtX5hftBUPER~57VtSVak
zy{c&btEyP~|Bb4s$K%pI7Cl<bCC3~^LVr^gsZK}#ld8z<^3SSb-Pn&*#kwD=iba2~
zD!S~dim5+U6_<XhDq8=Ys<`wARgwP>s-o*pRK>YnRWbfoRWXOGDlWGmBJ-0Dru?od
zJ}4!tio{)2F(vzVRk7rIRnhfls^aC}RmJlZLaKsLLFQjo#oAw0MbGb5MP^N&qCcvN
z9sgccH04o%K}gq7C*oc*kX1#ih+S3j;_s?r@y}Jox4WvM)Sp$w=l_|iSmY?TLRJ;C
z{uflm#qU+cfgh=g&v#YDq2E+R%^#_XRsTv=T!U4apNq{>N*fHTD`1SurLFp-s)(Rn
z{8d$4`5RTy_jgrs;G3$5{*P3}q5nix%wed+AX)-(Dj3z9lqQv0N>yZ4aSg`f|36n1
z{dQGF>wl>#T79P~wtZ6-5%eDssjz|5XE8!We^nK8e^(XT{;DeG{8?2j`bSkU=-;b~
zqhwXF^gmM-{r*W+Oy5xzhsmm9+>WX^ysIiM_h&Efs*20sRK?QoRK=lhs$#<bvZ^?`
zMxTk@Q5ENYsw&oerz(D2gYBq_mOoV$>%OUq*k4q|QY@X%i5*q3?N?QCfUGLA|Eemk
z!*ojMoBmN%OozAo+;2zSdcL-!Dh~f#Rc!lSRqXy=RczZ;6=VNPRZ(I`RUG}MDl*b~
zR{x!<`21H@ap1pD6|H_z6^nLN#TBxuSoRlH(e@uy#YNy(RnZ2ndY;CV1Ag4`7ge$O
zo2vMcCKCZ~FHveQp<iD6M^zF1168r=U#W^8cT~lRKd6esyQ*U8uc~6K<BwED*MFfZ
zF8``3F7K*}RdL^|iddQ>buCAJQx)_7peklDbpNxeX!4z^xcoy^krA%gQ)B8uyIQiN
zDlY!2DlU>$#m_LZsyO$Xswf42j+HO^_o`wY0&)uh-!lD0Rh;ml|G)v4So?#j==4)n
zae=HVeuVv1Rc!yJDw5I3pQ(zYzp08GaN`^B=VVp!;$Kw7y6;rQ<v*#4Dz~Z-Fub~&
zxk(Ouy-gx}^av>P!j};u5(ajrJtVC7sy{~%n=9T0=jwth)1cCcaBu?TmE#y_c9dN`
zkZ_TiZ4zmqh;*q&YCR2)uN^p+l&64vDk|}m*9k{CAS{Nq4(;9h5Q1W*$z$f=y-0;B
z8q7WuG{#%!T<bMJVIsS4Ady1d$B=i33!l%#8^dK%N2NaLAj;g|%Q(n2;YY$Cq=P1?
z%iu%~`ix0Lj|w8wi`k(UnWpd0pw3W5gsf!wd_@<8I~D|U6nsiAxS}XS$9DRbh}-9b
z&o}S-Tos1a*3da2sOrIYNGeRP8yVlIAOp{yDRophye9xS<+7ekNh5@qIXLyD3FCx=
zKFdJ3x}EV%>eYBRqcLLXC~(FyHGt{Xv=dbJc6#B_?7NKX)N1|bv1t3YLYY|h;ue~_
zgHcC{eCSzk6k)`Q>wtL;Rd~<KVlXemA>!G9oOyO>R#k2!|1*^Aad`6CpeV+mL`&s-
z#u+~2*-z@ms-N!_y`UQClDs%q>}Y-NcD3?Nfjjx9&qcT1>*Z*Z2aR!(oJyGSli(%@
zqP~j0h*pV@m&H~`d}66Jhc+H=9XD>m^`3eKJez1-+WCbs@&P07m0;6%)W^}3xB8@c
zHUq+=aCT;@6iW<LRutC#XJj`Pec(Kq(|(^ugK2!JWj<Z49286y_mTt*E*`_bJQiVU
zj&J0HmO8_vR+#SHMH-&BIBbB(j5|6yxomHnXe+XOTSQw$FfC0CVIzXD>t1qRS$)Y5
zy@Vj%pJ1H0$>`Bt1zCrE>^Fv%(ubL;niFjqO+_xsh<ID+_~9yT=T;uBayzXVxVnc!
zOPj<>=+^6Eyyk;d?nJD@m!8#B&xon3mQHdY>yxg?Q{btrf#(#YQu0?6zW_JMxq{sm
zW4JNM&^xu763vi%T~bEPWCL!k!lX2cdn1+oRtQ=DS+btQ{m9U4?JJsc0&!LK461iK
znuqz!*XiDUrzV)5bL$|eR!WrltfOJs>y@U2fNPZIDBg)Nr5e81yxs~5K!d8p%w9av
ztHLJ}wLuY2sjXN1&hKG$xhu$%c5ZDy-2UiN&h`fpL^uyb^Ed@b1VKLwjvLx$>>C!s
z6H#}b)}bla^wyw(TM3Mbl7Ns1J48iL`=9`%h7T$hcj?%Do=YtmeC*29rA^0&QEK9D
zQ7rP3C@62Rm8^nIP>nE~9mF-5Wm~otBC$=2ca6XHC5!Z`o-+Fj6!i6kZ`$SBG;(9y
z7oRu=b$-J5K>c&>t&y}?A*5Uc!{lSci(bataK<pscbs5ECfx_V?^MM|B*Q(zzJVNV
zTfx9itA#`14>=_@9DbrIW+<>Y(DDhS8E1)a9lT!KM^7U?_rPSmItt2Qq<-rur(*Jq
zjDp2?s^ZA2@sRDPnFd$d*S4V^ZL@^mRK<zW`=e*9eFndX$ol+PRrFr8i*t5+n5q6v
zRUEp5w>Uzd8nCM>=9BC{mD)|59$h4>itoLr<xJ++-ox5_nXBe`F(xMP(?O$YZeh*O
zj<!D}qp>x8pOL!rtylRh`<^NIFL!+L5a?Fnd;3PAd5@a|_lKbQfq3YP=g&!`v={?7
zhDGT+;R<|%NJ6d0l#+3@f3%|**A`&DByW^9!N>I>rrU`KX3!!R|HYs5QKLmRV>RI|
z5TpVGX&$EzHLF<H;q+n_=h{^jQH0IX<_B6Q87O%Z%_VjBy_fVW=1NVHe01P+#an$*
zmn(kyV&{uZ?~i6_l^I9|eP+Bb-uAStN9b|STO;|o3egCL@%h2tdLO01K62Bf!C{FH
z4T(w$w8MHaq)ECX6$jLBOXuWlQHan+QS7yUJD}T}Gc;(xYrkohW}(h|#R@G`dCNd{
zUiy)orM;wqWwLU>Nb)pqjD?+%jg$rD<o1eQ=`&p1C{Np3rS9Pl#*{JV*xs%2NPl%g
z)-f?X{|ti>{F#Z6GgpTn*A3EjPk2)=7}%9`2C&$js+QSrdr=j12PL>Bku&KvypS|m
z4IDXbc)VBo?4jTeN_odi>umun?EOm}JjE~%0lMHz*lp{J2aUEx-+}3^rVXo=(#EeI
zY7gL)-sCOdY1%InWMQjc+QxcZyVaEF0j?U?&j=9vuwWL{83MhSFQb(hgUdgnD&gmF
zB${)xb}^lFG?Aq{<>cn0>=TwncpHzxcp2K0cWWJnR|;-hob$T)z;>@?kk~r*h`N-r
zF?VY}y-4F-1^%_w=1r<AZ=Cji*-P2*+~UG|$GzG-#l?NQs$%tLzel|O=|=Suzp9FZ
z2AG&rN=kA&s^Zx%0jw+G7ti#Z_G!6V!v4O9=NwFG`Fhx<iS^m~`TQ^2-Tczm4J3^5
zoIy*usSf^pViF;XVqVC(1XTX}ujkidi@u(dtbCz*Vg7VY==OvCTA=NOX?1mnkbBt=
zor}f=RyaD}6Ti9u`7Ngu(Dn(hEbagYuy|U!!H|!#w-|Zj@JxBAa!#une(jQw(!y}k
zfv+iq)@6o6-T0$=`b!LQomnWg&P-T~Dc4)CILl$5=cLeiRX$JSaGJas_`xGr8D7Te
zF}$4tpSRLd1r2CwP%!$5M{21L_{fWC8AvC@LAX6zc=n6JNF}<=3PUI;S5pMSzck+2
zeO71@)hU;?7UImD%OlzoLbryMP>wF88pz7An70rRyw^oohPA#umq$&xKn%yzS;;#z
z=_(B%G}5hH6+KINCFT(cJg4Umbnn*#S-ef48O#$%6wKb*LJF=1cFKjfz?hSwu6z}T
z(s($+nC)hnboIcqDN==Y4v<u>bqq3QBV<qX9JERlLNhNwnCnE-6()5Z5+R-FI^6d<
zuH_CDQ)z9XcgE~>SH}49hW1`xMv;u=c~gZOXZkn;6K|My>B9XmMmpLvyu-Y@qSf1~
zA)z2jhVBKkk0&A*Tq)^?)*@7~XhY`0IF#CUq}tSb?9R{1hE2DP=PigqRZJ08#B62F
zu6z&lOrHMB>1T@2!Q>qCTN3o91`*{Ese=^;wED*|ZnH7MC|)l3BRt}>Izw>ZU>3YF
zln%8OBHELHf`_@&Si*#ubvt+@OWJfUrYGj2OmEu_hVGNf>nzQ$JWgAt9lpQ7qDJ;*
zhL?7e?Ho-Wox)1dp@9g&DJ<o2c?uc{tB4EpGTq`ej$F!}w>a&9Sdw!Vio?`vNt1S8
z^`&VDkLau07PT*j8=q>a9%wwNm~miaFyYBPpEm9jX0&;H`BjzoSqAZ^SZvZR@N(h3
zIwfN^AbVUFQic6*=`0GwvVDG+Dd1nA0|UqI;dEoks4Q@+?=pGTx8J2=K`d2q+<r}e
zxqgQKP#9IpWOB_MEpi#E%&I|uv7#lp-Wmhrm4v^~85N#5=pFo|)R;uYMg%RcKHi*&
zvx{`*XAD_vglFve$|#>-vjmdJOETpSQg10-LP|)#qCB-0#iUu1$S++CRk{Oin+^!&
zEA)jJ>!wvvT`JL7?Wa#6wy<s%NQ7bz%vESW$V?P2tUeD!2O|-oDzg++f&gH*c7k5y
zT|7O-8olfX074swyWx+(<F-&;rs;1xRM8>+(*Qub29A59KgYdSi|1psl-s^ni{9yT
zV1~%`B<JgJsOUJR5GR@0$C>8|qk-BVf0BAl1`c4Y^&;S7*G}lt?*)j+KnszKl~)WW
zP_s|2*Gk=1p(cQaz`7Y@U{rJl+`v;E5&Oy{D_Cnu;(a8CS-W4vXbF{N8Ud5Eh?Ev}
zqQ?5yJZ`I^i0zqy9olZjTv?4T4eRyfRp8ijaw$NuEE{^LrWx}91>ww^$<?%TqUT&h
z=JDUy?|d7={>nH)M6{UZgsn6E<ukGsw^ZC!%yAT?=UjM@gV)RCb9H@*y6purW*(tX
z#zD;XfSe)#&~O64oOnkYI|4_K%^e9@Mc%u}93jJ`(7Nmh2G{@)Pz*xsM-#!iXfRhE
zfeyxo2A}hX0ix$A*mNT#S;;IH%<+kGj%=(C2q(J{NwKH%48=L}y(=fG>z)<5%Zr#R
z<a!aHv^oa^upp?XGM5S)2oUo*jfS0AlzAA`cOJlV+XGa~HE0?!vKgfXbn9U127_8J
zL+EfIfDMGJl>itq$}=wlwlxc<>$@zeW)lwO@B?UX?p{aWkufI8_EMz3Rx{-Mi}<@x
zdw1>+U_dHP4iN041~#+C`lm^u44eoM&o=6%==-2p6avhR<Qu#Y0m${l<7qYvmX$d`
zkWizmX>Jn>g(#}|Yu+=w0FklGtx2vR9#0vq$zJthpsUd*fRQ42T<ztTH-zVl^)D{I
z2_^w=2z~z#dv_iV_4@t+e8vo8H^bP%jD3%>Z-X(&R<e_Q50xd7w3x-NvM-g&78Mnx
zB0D3bvS(|tr=%1~QS%!*om1y@_O0*v`Ro4c`RBRr>;7Dy>$;!U`@myjZ3u1^R+PR{
ze$03kR=ler5j9grffa8z9lo;z!%bheV`ddrL{ebI=~Y-Uxk_okWDQpAM4d2Mg%$bZ
zR1j{2F^~qJ6vYG8dBy-_QqXwfp@<Mrls8<36&Y7xd`oDAj{LKpnvjw2V8tK>3al9Q
z5mt=YaeY#%@<f%I=;oNPc5OtL##GbgRamjLfy@U6ND6CmQDDW=`hDT`8z``1R(<<f
zjCw&%>5MX>tp=&4g*dkgE5Z)cIJTF=d`K|<GT0J^AFneupB&KIXyQru2rC*0<AYq)
zk-W+f6oiIWmp@1mp;lYuKtz;P7FQ{o9@g-JuEL7W!79jH3V_-?%A;F74r3V5z89=w
zx<J|l*5}Atg%t+~c<yJqJ1;k>;2{Yw;}y9iHG8X(shbQ1%f07UVMQbbRvbyDz>2P5
z#gyd+Rtl`Bs)D4ziUW-Z3akiV<zD#?R)j9E!ixOIYMZL`0hnlE^X4KAD!iwrXRBry
zV@pQ+RdRq&rPOrtvsBgt3#+gq0;ujjfz^Z>5*A=wsx2Y)HTZm`S{`7)il`rH4OTSd
zzDR);2R5~jG-X-k09|VkagFps(fq5hBG8KhD|V9ZodCKdwS@318q85k=Tl%sfER`W
zD-uHHD6k^H8W*i=c6Ak2j5W4B+)!@SI?<$_y9z5tQeeeg3amI6MWn!rnA)fifV)`~
z1y)Q>HBp_5x;9VkPk|K!S7F8T6j-rBWpO;27KLfCVlB5akyI=r@wA0>>Q@$+RBeVB
zl&-;wKIkB0$fQQw>H7u8NUSR2=@$*7jYf?84{x!guc|m<Kt2M(fuYyt)?h`(%^HAK
zgT161SFNHT^*3l^S7F5x9^9kIXtCf*gs<B3XRs^7jX|h2SaCX8h;+kj0#?9iFuMjT
zUMYx9pumcDa;DQau3SNx4wzn_S%no#mTw4mnU=8W_=l~+iV7s0I~Z5Nv$aH_BLo$5
zjRGrT>N^W?Q{!6(3#xaG0(ZTP3E+w$P+-Lhu@e}uZ|9a<b4D!h*I>n@TLWyB2yTcY
zfFv(K!}}WMqpFI~iFTA?^Dk`?mIIzoW%V2B3dx}n-m}GPDLLqDlms=aV`-PLfCW+@
zTF@#*=snD9$-<x$M-|)6^*Wb4Sk4;rDkexgTDmie&`PzR`_ze8Dvdqnt+*~lk&K`U
z4T<W~K6?pA3aq%K9a+2vD`wScZOl`;nvy3NZ=GaGKuM~gx=u_-YjpOsjr16ZaM&(&
z33Fd6TZ0wP=vGi*MFA#jC2I2n=d8kCLb9vr%v-6qrZbvFS<`PoxjYbdWxB@~Zzau5
zffb3Xu%ca*foo*;5|zzRpXTf)cO?<VDjUOFHoMXVJfc$Zc4uDa-SeBh$3z9D2?WrL
zU=T(?h*|$5J;Cx|93;$IMh;&oEy&Vqf!Ib2@dD(QvuWnws5(hOu2f86Re{1ZTopLR
zETC5>Q6jLN9AZZ)-63ajU|PJOQosD$dq;<&O!@nFzaF5o2Z1oSD<B;(in1xwh~>4S
zw#R|FaOG(!U^63R91h5(#qEv*mG(=h0@C{cI^1~Rv>JT><uVX}W`R208UV$aWqD}2
zi{pSfcF5ey5(kr15w@f=Ort?@Whdi!ga%ut`!3D08gSvJ=aa7y2SZSOOjP!Y?_uE1
zLBHS*J}UeDURwbudksAPm7}_e;h=pEjR{7MmDbTSDN^Yyb(T~urDZR?h6PXKsZam|
zCkGKahry+2-a!0WS31Qkj$_jhb=~2cW)60DqMtedAUJ$LSe51#F!NQEk0FpY3_zxL
z?Z0+#c>jSx1ou6%F_6X%K!Z_`&A}<5@YFdt3B70*I~;XRg#Z(9<^s+o*cpMx({m|Q
zJ!po80cdk@8$_b3MQ9f9I8w$Ez3X*&4$e!1iXKxY5rzYI;-siklyY!9ym%!$0P}5{
zX(t>s>6Sze08+Y*p^17S7;s77xM4Ec{48MR2yX9iGpO?hLdO`k0IMwr0*IBs*s_aP
z932NPQ{w=qUju=GfDS&mKJ0<HZ(Pqwx*c5LdwUrBnfe5Z)$;B{kC1LqKCE1*8znue
z+{#<7zfZ21h57S61li$8CNXdTPUxO0c!|bm`bIV%fFK+VhThF@!jX%G%xJ{{-8_$)
zdMcQox6>Qi0}Y1&^-;|ALqIz)BDdxG`{?Q@8ZIafBt9-m!>R;AACbc4L{+MK<DgX)
zR3nu+%~2!=K#6`$NX`gCVC<BJdMHzhv{r|oNi{9XgpC&fQpFo@8?UvZ1~Ls%)8fGO
zo-_-|)Fbz~Ggv!MGUZCdUW@A?*hTfETRPa$Y{{Xr=!B@DVtSfm4kdvUORc;^y%qTn
z+o?JYSH~JbX^vyywVl-3^%szbtfZoeofBZeyPCjeJdhSxdmG?y76tMd8;Nosvu35?
z0&G!?;c6ed-yVIu55(qbWhVuI-Nw}(*2EZ&TPxy}YqyaRZU7(-AH+|r1rt~X?z1f6
zz!%LJ20RdNqnVX!CWWI@Ok*HiIO~(j^$Hp{d2vD^xByg)SQAjQbQ|;haNTf~RG>!v
z1y{3a*9Wt9$Odff76=A64!7%o2W|rg>eEiUf_)rM@cFUarRg+@A&7Q56|!!dWZG37
z>%uIKKoK-A_wkk*6^7*_TY-W}r?1wE9Lyo`=5R$M?I=gkqR#?_RA*9_s2;}CnG3Mj
zR7788?!P4YSc?e{;KET)1O4qbw_Bs_p5rj5ZiP=J?~finpuDjPd-c=_U~;>A9q(lc
zJ9OTb>fqZB`$MKfaDdoTK5>QH!6UH4i|y6aDP#udlTfefkXA2SRh@$I%3F$9xbS^O
zK3pA}VptkZpvk%J%tUq6vmBX+@LCs<wn1BKn&4+7L_;JU08ceQIOp$r;;OrQ>|Icx
z8$X@))QX?L6R%s)=pd0DMnPwJ>xrCD;^YX>VF{SvR?-ti*u%waF#t@Eps8Ps0d?TP
zWZ-*e>J!p&A)Qpb33Lum5_o+eyRX^2eQvrrR4pwU;KhYw#Cb7^dm_{v_aAca$Z)uE
z2L<V@0GmZi-*l#>1!$_?c$9#njjgSoeROqyW8A4(sWhJgu!4Z&bjZLg^2shO(^}?5
z0+7EYg8|K-2)Oh*xi|sTcr}ux;uYSrgG~7oILK_!Z;GZJ*gZ8d;imuuhwaRQvr0XD
zdU|F=Vnvo6_v~Du!A+38XDbcYh#H)ntjjbBCBxojFxp@UeOF^IBVwk+K?quq69%X(
zPXIm!sxU=^9_ORxLLyL95QaSwT(5mvB_m3Aq*lx^M$l1I#T|07yJQ&loy9BPh%5-|
z*_kVN^QgIBr>DuZx~$I&wyiILod7Tf;GYwHaevV0nc5D7O>is`xw%T9_2m{t9H=$A
zE&<(hc$d&)m>+E&htF=|z2n(5MvhRky7DpSCUXhS(HT8WQ*qpaiB`T01rV&0ll5uX
z<;WU)SGj#GXV(b3LQG)fe0q5)IbeXmd~+bg%qM8?o!5;186U0(h(|J?^7Ar8n*xS(
zW95VGKzR=b0n@Ma-=vfl9tkmw7ClRdX$XkZ0V>#07qrFhX${#by8|MYW-dl+DHaP-
znXx9*P-4<jD1mKZnR{Y0_X)%r@b9@IP9q+B$*vOu5{nHFLc!=mSwz-U#iVvBJ3lsq
zAiIkXm5Ad||Ka+o$q=7aRWbg=7@49fsw$jvAg-#4hSitaDXJpwsS@rpRS|q5N^N=P
znyMHG_Ay*l6-(Lyh<$6SqFsBP2jIyh%q(yaY8oT<QB`!^hj{x6g`C$lTvZhTCz`1n
zHF3@D>h5-+6KkrXk>0I(-P#C>s)*_t=19@PJ@fxwRUG-GD$?FRHx<28RVC*np`M~D
z&Ml@pw8aIy6%F4v<QlCrO|u+Ndou;NYfV*j_)=B8__L~FkMEN;Rk3(gRebS-s#r%+
z6-&OVD!TquRkZT^s47xl2U3`V>6{-_MZootqu;BFch*!zy|1Z?PrgtUMZZ%O<G-RR
z5<XKE&#$S9TW@?+6>)Z7RTXQ$Qx%VPuc?aEK3}Mc6<<{qbH7s+AN?*>@dz>cqpJ80
z^YZJe;-eAr7)4b)Xh~5OttqPF_)^}gs)*TQJvBm66>CQ<MCC&K(wSr^sv^JQ)rBH{
znS-WL42srA;%?jY_EJ<u(nnSC?W(Hie$?vLnyTnUQ5B#3ysBvUg{nABjMl#PBUQ2F
zN2((G-S1UJ5yju4Dn6YztlwNYv9*-R1Ra!SJGEc#CTB$O_o`y{5uw_jQ5AcBsw&!j
zT~)ldrYc5%QWYP4RaNv{RTbUVRK->qLk^EGRYlh?RYjkls*0iCtBRM`R7J&KRuxH~
zR7C<sReaj?rK)K8NmX>BsEW<-RaMb(O;s$h&{b4^(zEqBIxkUi;*+Y#7QCh^8hlh0
zbw8?#?rW-Iap&(*6_d1>qglgpau^F@jgE3Of`s5dt17mAT~$1-<(vfKX4j>tij5Ri
zktG=YJ5<GOU#N<YP(M-?D}Jmh_EJ>EkguwWH$PJq&3>vXMp9J8Ge4+`i9b>muTfOR
z?!Q1)Jo8CaJl9b0NmX2+sEW;bA5}%8kE-JGre9VSubur_Rq@C#s*202sv^kF%IL?c
zV(r&eMbzJ<D(*OnKlDjegaxmuifzgZWq*UJ*i75>gQ}RK#Yj;V4~*wEQ&h#9pR0<|
zyHIETl&T0|SW^}4Hc?bX;+m@H9Q}i;s7Fy1bJtYG*x#xu@^duFd{h-3g*b+PtSV|a
zeMMD#UG@vAV(-tZie|r4RrLQ-Rh$;Gc^UhgRK@<!RmFx+s$%h%s$#)!R23h6t}2%6
z|C_3!^0r@76}S8ysv?!bk5$FnKT#E(e^FJ``Aw>#+@Dqz4}4Ws>`*!InW}hLcU4tv
zCj3NIB>V<d(f2p2icUlsc+=0Qibqye#ettw6%T8L*>72yxCYIST-j>5AY1|S>L?L5
z<rl#!W7Q`MtO(#`yOWj`o>6-FmSM3Bs02fwGujpSKqV7ZW7-YnFiY1n24<hBih66R
z;>GV(#WA5)9sFC66P8Uui92aeKH72A%a=i`6J%BhMi*=lq?@#&VxoOu9F>FHA{Z5K
zN2ZfC_r5lfAK6M|;GH!1Tvdb<8POC~ad1^t)Fi-m>Z0cQf2=BseyJ*=8zc6SsJ%MG
zChiyndb!$o-*zlC7&+rCqqnLm9so&zDXJn#=*OyJq*hM%s;VgcQB_Qpp-o>^6-&OR
zDqi?rRV4kODjxbwRdoJkRgtu+Dwa@GMa(Bvk@Qhjyz_fh#fDF+BI%E)ilmRKBJu00
zqTVm6ii1B@74bi>D#m`HDqd*1{Pd%$Ncvr>;-Jv|9gin)wL_6tH<es7E-BAr@}--~
zqVAV0X_VOXy{fo#RaHFvxvJRqrK+g&i>l)IS5!r5;-6C$n^nQTqAGU&jH+0_swy7*
zTvdFssw!r!sfwiEtSVmoUR5OhnyP5_ovMibk*Y}gL#m?fXR2cTud0e>a@ogztSUYs
zGL(F&Dh7O}Dh~ccRUG_MRowWOs*2M;rz+ZfsVb6IRYk|&rYauzs;YSLXH-S4UsM$-
zr%Ha8s;I9X`I)My_jjs_J3m(yNkY{CbSr2j4;S02%YKj?$=?o`(f>25BIzrt;-z0!
z6&t>yDn9+~s^Y`nq$(c%y{cjfMOD=MPE~yRkEn_l{-~;W;P<GC0Y9TEMl`Lfie#;+
z?X^<@T95bEK910uj;Wna)OwOx`(!z1RaIOdd_`3(|D-Bvt*MITgiop>R_Y5?vEegS
z5x=S`0*Gs>qVB4y==!;;cu4AVRS|<-;;DQ3=z}OAQX3DV<4_EPx?!UjxRpbepzeBc
zY!Wu*VK9$PM|jji7nWe2hRH%k8H)Q@y^PbPwyCeGipPBAn!i&OAC?}5wNQ%|d{tF^
zNT{SEr+iWsrAk*-MPY-Fs^WQ}>swvX+j}UgV(gcyV%O)YB8Su0RmJ-jLT5gziU&Ta
zib_gm->HgQp3`l1{Xtc%jtlu-RUG(2Rebt2Rq+)?RjgZ86*(a9KdFj-->ZsYYpUW|
zc0>N3s)~j`RuyqSuPPROuPP=}RK>YMimHf(i0%g4Uu4H09V}Q?6(47KXAhE2c>C{b
z;o%M#eVp;Vs<<V@{}@G8jQ&nlO#P%PUgWk{R->qjr(Sxdey%ER_^PUS@_SVg8MOJw
zs$x+lwrfpQd?gCEY+Y3q-&A^irz+YHPH+eKf2JzRrcY*PZDNupt<Z_7Q_XLufQlp3
zqHCTa`7=<_{u8K348m3v+k6KqmW+J_711{(Jc;+4<Gu$Kt=+SfkA4CbZ785(q?_L-
zQ1R6#Q1O)8`-%w)sCesGQ5DtA??6SzRZ#JgbLO+lceHqB%T);1r7XjjZFBbepYvoR
zcs8AvQm;^o<w$yeOhh-ryRq@afwB=XH~o7P&-sj9H6D*1qLIBH*Tm*x$!nY?Lje_K
zRzbziHp$6OgS~=YcTbw>Qb0w_<5f^m>^o4guuX`)L8@paFwk@HJ5X`WQzVOx#T{H6
zQj6Yo$KkHeDyS$qbp0TzAS!#T>?5d%3hXg@)AAjtSm-;jFTyMm%ole(x?+cz^1dP!
zi5&ynBs`y(>y}+~RwGp01N8zDV~nuF`~s(fqK%jG5qIXm!f>59;{tC)(aW1{@6waP
zroGjw=OFmIP_e8WA-C5k7e9;9$O!$TQ8EXd7<sxYpR{!%n=P})YXwOT&@SW!pC;Dk
zvTRp5S*7K`XtDc~Ra29r9D!}QGo5%oC0adY<@uHn!$n5CVRAg`?dX|sVBGRs;{H2X
z8Ep1J4Ba6{zV%onAHh&lc(Kr=^p%0uWnt(PUw*{I+Ya(k!G7(bITH;PI?tETX^e?8
zYwEFHVT)J%4YZe!Lbsdg@u1a|#17*XBa@hRydox@h<t3u1mfoOkvJOJEUu<hEfC~s
z)NcRqa?FPL><!d}T(PBBQaAMqwRs_I*K}?n4{hM)Si;<PfM1HNSvaE#6&5Ux4N`T*
zK-7KMRC3HLkJR_FZ0^Nu$R&00pk9h_hNQI2<Ei(2FcaNamx3i^2O2o+rjn(ZiYy0&
zM7*Cq?Gnw_wm+pX<wV-Fo`k)5g1RvKvCipD0kA}~o$!K_X|7V)I<!h*7KdAiZILT4
zH)u8bZiv-I$oTp+$-!FAe88RCd<K=YDk+MxiME83S1HAF2})|`wNq~O`l4SW+F`ev
z&U&Jy)dXz!r|>lFzR}}tC9|;)T*S87I>}#N>7)XCYp--)?OyMg11q#gJ+p%t+XfWu
zUWQ=%GKP9HeZ&wJt$gv))@A{7AW?6$J$CtxM8!Q6%Swfxo~-@0c4v+&e(mChO7YA=
zVT3EkpuXTIb7!5C<OvcYtxbXYhSLk1nBKQ;F>ia!;`9*ie(?@yr&sa4J?=Zrbx+P_
zCmF<zz4q6(KwV@DFS^kOq-K1N%9hw%nfTsL0KP5mqW``VEO565Cy$L%I)x4oM(GQV
ze`rh!9h+t$;&YEZKD$vTT!>nxVzXYGlmCm-(RA|InZp?FMkw-qaysK^WEtspW+=y7
zrCZ({jj)Wl$Vc;si=4wY+{tRu91CK&8)^aT$svNvni<$KMFeP48{K1VuheH>zeYPG
zLJB3^L01o4=hUV3&7t!ccBf_Fgd0lYq&@rgQR#ZvacI-Rc(Jjvah9nB!O$M}>H7)J
z7Cr-Zbeo}~8ru$_I3T_SrN>XX8^EsC7=+ygY}p^ag(=qzmMpb>!r8TzJ_$wH94(;r
zc#wbG^eotn)t-gA$y(d5lu9HVw1r-KLw9mUh<ElV6ITj|r)Tb_V&_ZdEde18Ty2n}
z(z_Fz4-{lm8(qcP%qAYp-e3-qyQ*XVKFL;r431?QH89&~G2_qYiD-r~mT*%YHU_ur
zrrIoCKK5W|dha+_*CLJD&A6k!2X;7~0K9&fy{k>_)M&Qk)5QwPB?gN{B43!jxzRU!
z#0LoqeQ{K|^6rIt=T4w@WX|52w+{j$EL9&obG}}c|KRZ6Y~6>}%WoRjRK;wCmFX6e
z#KXiet7YCpZmBA&%t46}yb}VPZ_S_Q`a36np(@H{zP;`19DL#t?_;(8w|7@nMKbR+
zWVEGI1M3%p^hCZ<5AQtoFr?@OZ`ns{kxfA~GHH*lRZeATWuM;}{)ax#d)k~suk7b7
z^Q+JoFX5+db0j?_)3>SXyt@|Xc6OAm@`HLj^(!#&Bqe>GbEN_%m2)YSjxQvPiZA>1
zVYDld)z{nrQPAm)4{Kuf3(V#|35=fLqYqhFK<WTE<M-xxaJ?L8c@2J?x?niXm?4<7
zyG)MembTE#guNLOr8w$Z7Q|8m=OGXSlCubwH{-E%i*6p5WBiQBV25hn?bk?+a_ph&
zn2vD`cp2HP>E@PikT%deS5*0;h382!cBxM;RRKM&<d~y(Fom4%tCQz;6!GE1+ehSJ
zcBD;MbW(2)yT5yJxgOt=z^NM(+SpO;36kWg+&Wr(M}_M$%G<tN#v+`eElzOXrD%)9
zhHM<iO2Z4X{Vh6aF91X58n;ODUD-;rJ&9%%1UL=aZzBc|MXhR!_4qA@rSdC}wWUR<
zWW6D}cw`FXf@0FKp?cYO?QB!b8r>|)E2F&Gt{j`!z(rH>yJ4L{l5P-W2~7u-sRt?v
zoe9SR847U96mT)Lh$-dnD!3>}0T**P!#xg^@-G(BV4p*ICOVLC9eOIg75^#bfKgHY
zGp|bViX|u*llQg)*QeEi7p71wPv?}dK(5ky#=a!DNf+E&@M%&Ev(|(bJxRTUGE_ml
z1=4ns)67?1gsy^%AU+DXm`wo}bHmCv^Hab@>>9X8wFWNU+%87Wp@@qO^&je|O<_D&
z%z4bmCLAyDlV<H0sdyXAQS@UQAdS;Ex=iWwkavT49>Eaf=7`71h?y?L3m9_V9Qh_0
zx!i>$!}viK{E!rWhHicqRsl8(0nQWwo^AmotDumDpje8aRJWiktB`_)kV=Y>Mz@eQ
ztFW$xutAEjNw@G;RuM}J5!)0Ihi(xUR#6WN(d{XsJGw;!SjB=Z#P+6$?e7+gU==4?
zh{vReCv=M^vPz^{NMxo+oamM~%_^C1Az73nS==poiB;-~h1B&Fsj6<NI#%f>3+a{=
z>Gp2v4%Ur5790ChHV$`he8eg<ZXxqHMP{a3<^`+lyoD_JO^WPtw=9_z1+qjzQc(;&
z>#E|qs#w+MP{;1rWbN3J?%3Yv*un19W9`(R?lj!z^oZSg+}inZy7Nq*^9y#Dd25$9
z=`PECE@XCBkc}%O!<FHlD+`Akn~fW1h8xd4HzbF<kd3=ohP%`~cUcY(1se~Q3=fTa
z9@-q9x;CB$8J;HhJhyUqS=xBnW_UT=^K#+v_OS8Zp5eXYo_7Gp_F$Xsdo#B0zqdVt
z!-r_&6O-YSaL*@^!#CB&_b*Wu-R5lq-ed$U-wPmf1cGb>A(?>;{edi;L2R}`oS8v9
z{Xt01-9omz#WHtG_3xJD3|6oWR>=(3=nvNB4AHd>F~|%t=?|g2^|iF!LwU;U(7(rp
zGt|R2bbDs#j{Z<1C4K-v;4PRA3?KufDeIX4YH%l245iXiHsom`j12UA%pfQWGb@yZ
zosE^7gPn(qQ)&YXf`?lG!HY#ggaweILIM&ZLK`JSWu?S5rI7L)C6(o5R25`3l;pM4
zlrZWlx|(Vp+M=5<Xd_*%L|vB6n{=`^K`o5+GmY78OpWX<ww$#_INO-*vNdS7hj}_!
z;~lV<oW!;}+xfU`YjNRjapT$P;n?bdX!8~f+U|<;wY%jjy2sDshMz*%F7MmBq{9Pz
zZU><51SuTc?S~Kb?+8^V?hWkRtKJcYjtbx15sv8$*XlZ`8-FNt_K<v6gkcIUxCdu&
z1RpkwSGFQ3*?imTBB5aCFQ|+0=k|Pr7k^n@%(zT!x?H$$IqDx*7tjA0b+Pq#tBXB<
zKwX?)d_{p5DeB_Ny1H0X_2$J$Qvw;ewYK{0{B%#TOGj<Z@|&vvin@5`x2TKD|BAYJ
z<2!XR>F3o&5Z!N47ngshx=1JdV|5Ypuc?crpR0>WzgJzH{pZxh#Xq4gy8cvMR5JWb
zU7Y<NP!|(^PF-~SL+ax5&(uYqe@R_@{;TTZv;VTX==+~g7oYuW>f-F*s4fzJtGej%
zr`5&X>+0ejX>yi)Xu1Znm*w}VivT)`x|sAWtBaSvrY-{LzBzSq`4`m1E9>gwH=-^s
z1L*!rbrDGS&#Q|`>+0feXpP0UrY<J^i|S(OKcFr$(tQ)^B0b%@y11?`{uk6mAl>r1
zy7*sF7vFq?>LP^h=ha1C)^&C9FIE?a{~~p9@z>PFm>;W)i$AD~i(gk4Xa6~MadBN;
z{2x~rTfS9waqt^g7mxh)>f%At->fcr{xNlN<gZc}U#_c*>+0gVy7+CYi{<~Gx)`&r
zF8+eL*!_*Gi`0hypVY;ab#-xFUHn{K9Qc2&E}mIe7uVIr|CYK)YxupoIPiC>i(%{P
z;_TDc#lNU7CVnI8V&XrbF5dj8E-rt|>f*D%LtT6hGWtbz@y`DTb@BP{QWs}e)y2zy
zhq~DLr`5$rAJs*V@6|=jy1E#P{7hY3Tvr#th*{M(<;A~UUF`lx)y13tw7U4_-%%IE
zg>8Uw>+0eMGWl`E=@a@K276A<TcuRSJy7BvdCu=@CC(3^T2~jddL%!%H{H(VrWZmH
z2KfO-S1?~y7aPA>b@BG!tS$-)|CQ<@=99Xp^V`%#%x_T_!NNaQ7fI{tVn^Tx!ijfy
z$d+wezCCr3TX<bvd^Gh>sf(CzL|vR+R~Pei=BMcyQ(r3f$<<^38|orh_#0IhpMO*8
z;`4QNabBYyQeDr2Zs4qLK%yJPsvBj|O)Aw*+GvtNHEAol*|xgb1$}dS_00fu%iiji
z2y|;qb!#HJEwj4qH2PLi^{q?j_UqN{b?DnI)wes)clxXEJVM`nTz&Tiy5miC2N~T7
zsp(|V?BcBHLTYx4)pW~h_NdhKXlwQw)bwuE?6a-ubJ4uFz2;tkX8+!r{s_&1n3{n^
z&B4r?!PA;UMKwd0G>5O(4A*JiZ>hQ8q4}V{=D{P)hmUI>zR-O1rsfe@a|BX5!lE_G
zSv!i<8WXD>lhqnmsU6qWnlPxH*s3*YTRZ9U4XTT(f4RC?nE!L?VjDU6=hVfb|7ms6
zfcK~BqQQ^V#lZiPy7+osUHpsGMU`Ju7ejtUU7VHHUG6ePhmXdhJMk>(hIi1W<400o
zO9{N}yt6xOl!fY~fGJAHpz*0&ZEry%9Xb9!o#m1`hjKx1&yHN}_#)MogJ)u{FXd|6
zchLyNd#E+IJNqq+GH$JC-+QOMY2yf1w?7x8;RlV~xpOM<NzyZJD&H|Sx4b43>$yW8
zMw}H2CnIg{6BL~+Hk5W6KoAxIu{BRvOIDH-rRgH~wM--TeYld}`Z`g0rTZ><%c30`
ztPV{{PMZ*xh)X-SN1y&-1sxyh=5e{CXy|3PEr+1HQ|EZkyYY`VN;W5#a*05q<%LZp
zZQG1($ILuVN#$cu3z7DR&Scgt#EiQ(DjU9S+A7pUg$&)7FosXcxC)05^gPpLm?4bQ
z7|5<Mnl!JBml^NyaT^SU(v-qMqE{yfrc+^Br8#$z4UUtxhK5ksa~~7ak>>jBq>TN~
zFCpL0w+C`OG3`cQPNB1&#&Qpt#bj@yhaC|Y=mgTlIj1R|;G*G+oMMkU5QO~@c7$(K
zk%=VmB3<_IXjZI(MMT;{fdyBr)|i`g>ST(CJbSCjL}c^vxn86e(^JJ*a(Ln-?WCKP
zJR&1IsaUh^h^tJLuYzPIhqrSNU7;kc5|Q3Cjo#BQ!|$}(6<w`EU<3KPs?nZ9+|nWH
zxqcY-rzWD}QTKCOEmjt2v|U+m<^#(kPD@HL&eyXP3ijs4SwC~<E>@0pwxS>KiPjfr
z-ykiX$9Z9Cg9OVfl;c~NdX2fR_U?SkS8s(fq@%ce=K1Zr4_Rk(IlxU#G{h#%^TKL|
z6XAg~kq^)L@4*0dwHdd^n>_W<wxQLxiEg*=p91OI1#;S4HBK5sT)#%;R#=BBIH~lm
z$<>vAO3l<H>7gN>L58i%fB&$?&ag9K5<+ItC{Ke3PZ3>J;4_)|GbhQ|Lri5y*ynI`
zjw5f%2^@4bf#SU|mXNvJ%iMl9Td+Y1Hjb)$=;X5C9J<xVsYR=b^pm6ouBC3D0+LE=
zxUh!7x1sqQx^`zt7z@}q_oH4mt_@9>mvmxBpx6U?*~j7VG9DJ)$Ic5W*rrlH7sA3)
z%NRqMs-aL+Un^WAUUgQpF*w@eTF(wY+NgLx$4Z`Jn66D=WSRY_us+ue;&upDgp!yV
zK6kz3ojH+Ryz7L=2Chy#$3l*RE}i9VYOX?nWqNB@yt5&kVSjn6CWj@=I3e-`bz3=B
zd6wm%)dusE)O)Urzw(WKRw}SkdQM+`W0K9@VpRh7Yb?$@&UGI-wzKly>x=s?q^!UQ
z(4(hJ6zt2YCC;eiB|ldZ84jZfIPWvqm9bcUj;~SGX?f@bKw02;(BWO6ssnwduCmiO
zWPCi&gC{m`a>ntycJAOAI4XYsx<a-8{zp8I-rn2m{d|-uf;{}_4yBvfUmxDWdw}iA
z!|&8ZN0G51Hj;#MP=X8ZI7?g0d4-3c)WudK=iRBNe^3`QvypNyXph3N!G!5?XS%Yt
z?W^kIrR+-|eZ^FiC@FD|Zd!I_sT!f6NV?<QY{xn0J;mDDmwxaSr|FF-ykeob5*paI
zwcl9h6n{=}9p7_u&?RLTYP~+0Tw;Dm;5~&`IBJ6eeZGB3giPu&CXKTVL2e<@`gB3!
zofmo{z(7awhxnszBwb`bTlUs&p<D&KcuaNkO)fB*v07W_1(h5%M=5kqWgTL%?6mNM
z@i9fL;z33im>U9WMRza|$WUl!x}^d@vt50Z`+e!m##3fD#H6KP#j>8*@Ii6$eVCA@
z1+G@zdw2Bq>S%_vvn<c+<Tn~9KI^z_OMW+4Co|L(zx|MvZrMqI^~Q5V<n*)d2<%Iw
z+O|pVhf)JJMsF#!V%jHKv4lb^Hr1`tin+6T6j@RK!}JS2TJYxV!uMKGu<o3}!xw6$
z+xL*MK<aUzjvp28fF6}pQ^bcR3&5Pa84A86u<r&vFy<W7%2*BB?O7>k*|iCIw}H+Z
zPjz)%X-O}VBu&j%#A=4B*Gr-=?xa6QxO7nrUW%dj8E33_-8%$$oQ-2C9e+^(U<}Vy
zxd~y=3h?8PWGoX{S<!(N@MH2`c(=}R_)}TXu<#gq(9U+cX6VyL`_nbhGtOfeU4-B`
z%5BZj3z@Tu1&I@w_f3!JKF`OLG==97mFwMF36tD~(Z?F6IliYAL)U1<j5S&ju|_K{
zPK!*BC{bv|NQ$fotoz{lSiFlX5yovx7)M{=&!NbQjojpu6k0Kl>$F_2dNKdI+zqM8
zJXKvhbuiv0bKaI@-u5ou4j5mLIbVM=-*6Y-y1J;KlB%H5qoB>EsB5Wckg90Xqqvn#
z$<k8EHdV=?N6Cdv*~3zKd#dt|9_0Wwm0(Miy{RhudsHIWREd_VF{!EvJ*tUpYN?iL
znW<_gdely{spng&7p1Bf_o!cD)3{=(aXnR|sz;-a4c%mkZb?PA_n<r2G<z&H`%^WC
zdo&-hX^mTIJx<k{>Ct+@raf<|{U%j=xksDKh5=b&AZZweUJMIdhs{cdGfju5R|g5l
z3Rz*r(y&s!SXsEPf|agHnyyB#t~Ojx*GkVIO^<BStG5-dZ)v4(o2Kv3tM3Be<gu<U
z{{K-IH~o2a(Mf@SomTuuXvL6Y4rh-g4j<e3@|aV_@tCk|mzUWd_fPH)KjnVmRO-m-
z;Db5dmvYh{<b+1#`jq8nj^ysC%u9Qfw}V))>+hfyv#-UyzLwB>y?F9^)|2b$rz?&;
zsmOR;k(g7N*nZ>U)Q#-Ls?>t&)Q+06nVOT2YxAdTa~Er~it4h?)@60oU4GhdrnoV?
zxAE$m##2v8#cxP?mzr}g-z*rsSvk{ETHabT(|YN3Yw@*P=YD}!tnIj5*IC}sb#1b%
z=|xw~+pcTPy;aY8n-+R&-u70#yw}wBkI;$~S8@K$I;}WxWyhnt|3zByZbOpVR9eU#
zC9Z?PM}7;f`0i`8Vlb^ZsYLJ~0n0(xrO+alubkiwE28f;Wme|60xG$DG?E1l89Og^
zsg}cv5$ASWK!inzJ3$(|+i&bymCaC`d5JjGp;I!Li|QO^X`0Y-`MPs(oBUy}%cjzq
z_494K$IZ@vq7`q$E@;nLm9)!e4rrKNEVJTm$Grcr+;-tZ$q%$5x<%yX2je7x(RY@I
z8P!IJ9U{dCJYtc<t-Mz-?|uWVc)Luh+GoDVNO~5v@Ga4bIX_1$qFU5L9S}R2ySNgt
z3&<0ucV0XKoL*|R)o^Lk<=kX<YSF!36Z7N`(26QCK_wu}#-8CzDKP|;W1i(52KR9C
zS^gXmXu&QHIP}H_f+m6SQaE4%qO}tbxpgcc1Rrd>vhXKpMa-|zickIrXhnvfqZM`j
z5Uu$1Gg{H`U!oPC{wl3F{j;=U7O|bTJCTZg7XcuT%|AuY&zYCQb;uI#UT187Q}B5p
z)!U96HVs71oCg2XLWURTP!+tl<Ez_tcAZn6AxJ-CsIG0aQVe}daK-l^%Lcr{G_LBX
ziLmYbfGG{5eif%(!_UZjW5nf2+jSE|35eePT|3xkZgG|d?YVRC;^9l<5b=o-$fm%i
zbJ!T|2%p9%V=U+e3d>>)BW*_tP;VH>Do)@lC^onms560=C%^~!&1`73aCS}-#{2kf
zWehWn7AJ`VM*j&~ar&R76>kHXJXch8@`4s7pL|9udN6b74n3_cV?Lc*&+CH$X=UUx
zMDP%f*guJ3*j-Am<>w%zAGl9P{9Mv87Eiv@^}ftnLGnb^IKi-fjYpgx<{R0lpK`=S
zF)HT9iAXx}Ypl|Wst|EFh(7+fE~A}yrF$g)Fy8_@d}o&}B8jT&+77dGm4rTCxbB~(
z6)pZ8t*8KrQeYnTqV*Jp3b)9LC#f3~X&&LQzRm21K>XV}t%oc@(Pp4Ywr!KI)V-`U
z(L!6Nck8xW9*CZ!Dt1+w$<ajTFo<$Vhczi=b_({0;U8f2(qpKeG=bDyRjN~omvm*1
zLsggMcRyg2*2mGjpQFMih38xeGn0>S6lZ(fELjbrRuuD`syAYOz2`%cF;pb*^%zT6
zrvhO?YpGP48i=Pb^t5m2ObY29;iP$5*?V!2jRcvYRIO{eOiih>ntG=9dj7+-V&4A<
zt@!R2XvO?>TJam972o|oq7~I48ayDZ#+m(du9+{RsN|RtM$mp}sBfVQiIrjJb$T`r
z+6sjd8ZX&QF(@Lzu48B;V%a11by-kD`6Fnw;$tOa4QLlm;56vC62{42{Q4fYjkBfN
zcI|Qprejnbc-0c9tZ!VxXq<UHR%jAfZuOMe3{#ZWl~8BL*pwfjhG8kj9J*;JJu^pj
z<T5kF%1TvNqw>6hXO$8s!@eR1M$K^*pJk2|hQmT?P+ThX&`>0AhQjq73MQiZUJIM1
z0BJa$iYB=VOM7Om{qz<an7v&Yo%m^hku;4-)WKh+6@xKn5_X(HhudX#C5tzefdmdX
zrUoBUNqX6=fW|N_VMN`wYo1xY>grV{Yo@xwLvsytp+!D?Pi`$6dkWaRidG<Yld7k+
zsweZ|0!udWph3yX*L01;n@A4Tkv!Y1-qB}?of*bx-dBgn9tXwcH1<J3R0%X?IU4$A
z-~-cC|0b=Nvra3LUBMIW6=&FP@5QrRoQ7t^lL!qx@RvP^BcjA*@&38OjV0|?$9t_e
zFq@uaepKH}eUNEWV7b}@&RM|j!m>X73pVCAm`ulnjb|HU+VeavbUw+^RDa*+e}~u1
zwdehYK1%CcgVN%4w5`nZm|r%_<@Q?xPak-HuO3EA<<1~0ss5}pPuwgYb&Hwr7BiZj
z|9Cw!RSM{t>i}@9pIax4co5F@0A`{N^SBPv8;VY@?D9%0P=gIg%MA&*;i$VLWiZ<!
z@9@-t_&Mkc;2Q)E((o5|=Z5YZ5V+x9xvL9ot}NJ<3f2kSEYQn`|2t?!bx36eqZ^c_
zis~F$lWn$!^@S!ZY;S0ps~RQb2H@}UGM$=U0y?_!;rj*yHyq@CHq>)_=+3k|*u_!o
zJzH0?P)Z68+nEtJh;q^K^Dem;SYOg<ckVaCI5nSFO5`qSqQB4`Z(SV7#Bs9NK&Ipd
zU;?YfeEVq$l>m!u{oXx!6Wod%S_qiPeST$c=JdV$;#v2l+M)|tM}<tsmUT?ERxTDl
zrs=vRe{j6Sbz6ARH$f{ZK+4={6=v8jUVv@hZ?n||dOFFa|G^U{hg1itCq+{Fn&Mem
zGEjRdsAK!I`^@vFN{~a)`b)#C!>3sN+OL6tbnm`KD+c4PI*iZMJx93BnRxm{L&_Rt
zN*Q0?IJ#>hLi1eAbLQ#$71u{)bhOGIY=BjzC8&b&G}{1=z~nM!xw+&?X7juRvn3gp
zlie(L9zM@F%#wdXUP;@0o_U)ln?^tGg+lHt30T#Nd=(kdw%Ky-1BQASdPFOf|IX53
zBs}!P$Q?odVYWwzO;DPdQnb*v!?d|CuUZiI9HX}47Z@JUs1TYJ2vAc4RBOqN^5E-t
zl?R^Yp9d#X>l>9U?ykFj#S^%bVSG-Q*~w)(Z|SWRG#Uxg^#+rrpiE;_Nxe&~cl#vp
z_5A0CZeXbAjOHL=uYXJ{DnMkC4tZTd9%{-K;zrYzHF)>&YooTuv#ZLZAOaC~%4+ue
zDkQlaL7oxpOUfjW+!6!cGx^y29P+a&>fHAb;0NEJthmZ7e_HDIfk`YnBE-S2sz->|
z_p%ZtU@9>z4?3Wa@30mzvqteQ@=`%hGrkqF>m1REq+^%y9OxX?jfJsXBno!r={tyr
zwc1U}M%VGmW1WS!bx#<jNmyU>9PFMn$&&NBTd=KXYD=~nyEB7=Se9uH>h;giidWTa
zuKG_7_08Cpx-}maak%$vkgya#TJ6a&>k#SJJVtcrf9_Ph@AdP^;r>hgq1ytx-%BY6
zx{>18WxekYy!2>I7TH?pIQYuz_A#Y^DaR!D?RBSh5=EVc7JPfp;ccv$GWYBlDD&zl
zBs(paISvQ+Pfa}-eiJaFVm>kV1Faau9K5eTYkO4VeV3bcl<`(^_diA}`W_`eV6-k5
z)hSZU%X<x$Vu%OxIKApJypz}4Z6e^bV3}p3BamQ+QM!7@M0rB7O~uwp-sCT)6&?N}
zT5;jmXhq16X~l&fXvKxE(~7(PIa+byzeg*ksrB+h_!?rMA!W(#K4TJ7{H-cEa|CyI
zK2rKNfpN}E4t=<crYk4UX2M2H{Nk<uaau9vTcs7dzD_Gn@;U+%$?iG)8!UEB>oN#l
zKQsbDN<S;IseIa3Go+^_TC+nvTl8LcO3%f>W`wULLxE7?wX2udyYc?)_E`r6`0%@0
z<&VyTI6WsbB}2|^ni5OoT3I|T7IJnIEma~X?{@a=t7o@Y-7>#_SJ<O`QYKS<&}q*2
zN!6%`Y!pq#gY=4V2G|n_ngh%9KS(R;{lBFZg=3W1)JRWUsQ_F6AfN;Y6~@$48DgmT
z3W$ufTo|hG5L$rrelV9|j64Sl0H$^ALFXwa1_E))^RZyg)=+RbCC`zU|JFr2%&lGZ
z`4XN70n~Qkv;Z?8WG9+WlM4ut2@J;2`c5g;?Yp}lfJZn1Xr5GH=w$#npdO%olfjMd
zeWW-LBW|5mT&ES+X+>HTrp1c2+{#2!v5dsi7SgF-SzuDNd7W0=vra2+BZhbZa?9B?
zb13WCq##!+rm(6&VH&Oq9Ag&HtCJ`Z*iH_yqm=HDvp6s<UQnrD{_VY^Ls6#u{kvZe
z(Ak4P7~B<*4j4sA;BCb6T2b5Mz+AZUv=p$J5i$-3<kI4H$AL=wB~$_FeE=P9JaAeK
zzW;I=2tczyoo)?);>@x<G~LB<z#KbdZe@vsNva52(ix`Fpt!P=aXdnUEz^CMX4h%O
zv+K0t=d@yHj2bGYr#a?O7D%zw$~)9sk^iurs?%_FtPzyvI0jzZNv&Of0eQ$uDw^0i
z0T#Tg32ep#X@Rx30sdxDAfK_3DEBdIRvIqA7R4B@_Obiz(Z~BhY_3*zQUKU(T<u{^
zjN!PoB2Kw>8yVpS0OIgL{KQ%?fo0%6%MuQJ(Trih1MxPRS-ECXI6B2N2Ev82KB-)<
zpmCEIClrDUK*fkP0X0jvG0zXz4OdA8YSdqFHJf&QFl&cwz}9YoU~uDbyAF8ZHgKRm
z?X)Y{$MFQ8AIn{uPLmjdXs1&l>$XXzUDdHJ%;E?XLGyASZ>dpXSU$29D42BmYOTmR
zt@t<7im9N+tC1`fukfB7WB?9#klCQ$6iqv@dun3BPXP!H+nEJtm3sK}^vsCFiYz<s
z*||c4n;?77RvNAmH8?q0muV78hP}&Rw80SiuEt(Q#7v2U5VRmC3{Y8~0DKHoVTuMl
z&PUCKM4+f340|HDUi-94MwISIt(aqsp!3b;*dZ6YONL?JS-kR%$bz7row<THkDB{+
zdYVkD%lf=v+ximtQ(7^Jh}>Ky(E4(VA`a9VU6+9FIlN2gG0cy)j>BiS@ZRxk8Y4%j
zSzY;<bCbCQ=je={rl~k?!9*)xW;cqnPEOXRVV5Io>|N#dv7B8a><Te~k@M;0rR0DC
z0`tv*5Hp{ky?0(S`e%H&9v~jce9F(u5N!$=(v6i5wgcro90W|i(tnduT6iSHFk191
zA*LZ9P6w!9M_tesyQei|tLzSlSem&Qt)*BjNM**FO!Mf*#uVJ1tgy^Iv6=e>KBE;o
z*J;HM92a%VP>hLDo6K6L`{x8$4uBY*+fBa|YE44)_&yPRC44KX*fZzJ;}=8OiJL6C
zOMK@G>w;v@mdwY*+-eMUTX|payCB|OV4Nwxi+;E3jk6X-78m?pOWrH7zrOolp%q*4
zz<P^Vz<Jb0@e?^)Zv=R-956)T>~07|!<J&t#{|siGKRBY0OC^A0Pb4-Et-IO9Qb$A
zioq59x?3MjB<V7pULw-aYdca!X$QwvByD0iICc{oZPvRr;X`$72e0^Csjm5!WKWAI
z<Pl=@M_TdSw@fQe{~fgA)Bj;wv75JlD#U23#VwDS#|EK9TGkMLI{iee%fZT~(T^1G
zHl3SsKEosKlczR!@fHvIB_p#7`jzc0zEPwq!HT4`8H?{2HNQ-VpNBvFU9{qpRa!Cc
z@1PZveuY-dBErraCgWQ%j7n|#@Wz2iQU2V+hWtXTew$Jc_104dbDjQ3E9$P%ic>h2
z;B{KD=L=eKVVzd|NGmS<?X+SFg;tDGJ20Nt+)CASQx2jyxA&A*w7l*dE_xU049`V{
z(lq)M;v#EmBMhi;ywavkQ`$#RJj~}fkEjg+m!>0eB)EQR#T@d0yTc$Q=h%@wIzl8&
z`lbOq>@a|VdlEw{Yqv@9ER<+h5zBwnIr^Wb6<_}`T5;O!=mE>>F^-N5G`wQVg`DBz
zORYH%ZZQSK9C|gLz*cFiekiEm8Gt2h1n+ZYj>=cWpGO?(<$q_U&(GQV@rEtyw4(Ah
zz-IC~t(Yen?FL6ZN{ci#gF5*P-eY-**;?Kt=0i1jph@Jn(u#y{mR3CcSJR43yqE^)
zMJ&gGMsX)9b~8cY+dBBSASW!Ff)aPqo_w_9sFyE;Rwu};5R5L^AV@c9Ma4w>z&I)g
zw?!~2-i}NsYwmq*B0sW~$iO>kfC08vdR@tx>WCF>h7%e8AzCr=x6z7Cytjd^7eE`#
z@UgVw_-K-H;0e*zrs#LNF^53c4-(L^XOE;!$2t?OmGx7PHSogee4pDM5S$iU@Y*^;
z+?lJxF+$uQPEzM;5Gx_xUBSqawjaWhyF^G-p+jOW&Ue(s?_wPZgNhQVD?UkMoMH4_
zDUuQv2Yh0}CE`z=jZ2x%I`1>Ur8AH6f_XMb!o|QfxR7v?ycNswcOc6Tn0=Q$<wB`g
z_0DVoTSSdC1e_#|FJyX}ws|Y-Q$<C_<kZLSE+T~$sSk-ZkqC@F*rg?+Of?{hUM%RY
zUVzO{X~ny|)2SIzlPn`l2p=#@5)~Xp&^8064mLK3pDpP=fBvC)@u{s`Xef3BFLVFo
zg|YJ&33^xLEH(6sLo8;>E$pwl&xDx9s<i?TipdvA;<{#RmoGG3e%jc6HSK5#Nj*|B
z0n@-RM+U%`faV9z-${;j@)t55DfEA3TmBY=zRg?rTvV&RxVn4CF0KDjT9L#HXjTOi
zF?0PQy^{0`9bzQ#hUtz$ai6hwO=B{ok?=?XG`UkHq)+Ub&-hTQ-6A7`F-n{9Vg>f_
zV^Y2PgqQw7A_j2r;<H(7sp$VdTJg#MA6oG?UPa^R-2(puV@)j=b(7iW85W3~Dp!Km
zX~l>8Lf^aYK_)7*t8RbB2Z#6Kc0q!f0s32eWv7gNA}atU8YD?L9lPf>(Pd`6?bmqT
z>OR4}f?uN2TDYZ;3zY1jhnwNgoVtjryaJtL@ul0%Tn?hoYLK*JptIaVH$@-Sd*LGQ
zjCu>e;^{X<D?VMP71wD+(FKA^cI}MD82UERU?&x)Dt>nO5N|obfb?PJjn)ROCT>+A
zM>#>|ES}9!ht~`%WrpP$&=ObziMZm~NDUj8YG3ad)#$BdJBwEVM<4)1ZIbTHvaSM`
zwty>fF}PvLMSFQUNAUh3DH5J-q5(UBhpPfP{~B5`0mQalJmO*LVOR_GAEFhn|IgEk
zajMeyner!(Gd!uBrrlsl|KFw+-~1+8u}GC_emj@ghY{*RRrEF=HS)=acnK8t#ybU-
zZ2M9F)QjE0d8))9Y(=rn;&T30u@9R|#`b215EAOqHzhoY_nYHb@kbf_HZumfTf1i|
zALTAIr<Q!(J7E)wJsaufH+ga-aIELvi&xD?7?%Jh8>Lfj?<*z_+?~F4tf-3WrpZL7
zkUt{J(bOLSzvP_x?D8Egp4oC0!gVRj@MYVaz5eGs*$AFZ=ZjS<lwvuO-X9aujqq-4
zJaM3GM9fY9-o$f0V^@vGqlai@@5eQ<xmfZVXUVi~#mhv9NojSqN&bjd%vOCBE9N4z
zQYLwHe_@*tdxKQbN?@SpA`RnoK`@pcJ675lM;054JGeNc7QO3^!(AVdQ<))>L)ZU8
zT9Ncu(Ta<IkXGdUBebFs@3&1WI$oB_n-Sg}csb6Eq~qgk-pVO9k=Q=~Gws3fzH)xs
z$aOSM75Uo0&_FT@|4ayRQ+}I_+LQ&pTF=z3gwFJRZqF%G(AhV3N6irAO(NrNZFH4G
zsrP9MEi#nzcl)|cDV=mZPcXYuG$MQsQ|Nte@tA_f#JEAA@c3a5!@`pd*dn&`H!V-s
zdJ-&J`QoLUw+76CMBUIEFw1Ywl{TVSRxpxSK6|?+1V@=4(Z{wh=y03`oFRT%U#fP~
zEh3uH_E4m0KyPQ_{eiRtA7Vv}1quhzf%mRBu#4T~(C_KEOSdmg-1)_#5cQyX?%wkb
zd}j5XEKSG8QkDl2*|Ev#507(PeT#u{+}F1*W}Ud+aPR^q>xnF*@Ae}fP+VNG`;K<9
z7N}T^5Zd*uhKCoKd7LGjZ_%a+Fb;Mhx3xh{mu|El@GVMm5!&hgcG!hX{_sY#(5D$k
zR~^@y)5HuvqN||A5$^!~%v1Efk^8-;*mVA*r^uM_ou`;Q#@_KYPm$p}Pw_0h3!!)E
z=2&~_nx|Mn@f2yl@D%MGD>=XJDGsQ7?<rDob?m!0e@X#FqjjIad8&e6KvIrrcR9fY
zwXbm(^Odal`%PVlQEwg53rWVy9?0ZtJzh!&pTu|`7tq*AtL^Cr+q!p#e_s5kt6~k*
z)k@F~F*aY~>$Jn6nCy9>Z63T4Q5`oq0pxK>ZA1iYY*Rkfa6(dY@$#_;J1H(5Z&1==
z`I+}uZL$ROn+}D7_QN16P=ezy$D4|_BaeM7_Yb)=HOdV!uz}Kf9=^<YQ~jidJ0y}&
z|MntSVCfE|t$>OF_?U2Z#wn19<Q=6$-r87j(jiKlcMO)fMB-sh+;7f1&fULsQ|+g;
zBBz?R-9s3!#Ka_cu%#Ks8l3)!_pzFansZPdjnp<zQMb*p$eCzyrC_&Uu+i3SrzQhW
zYV$ocH&Au%3rsMx)1gnPH0)%@h7cC+<oShBHNeiK6VN&s3)|(P!4EsD>1ofCov@Hi
z<0B>8Cx8q`4HMK~@l#7Nka$APh~tgZj40t3W;qT;WLl~UvuY4uQ*4XYMKRUW1qRsd
zrEvVtgd=hb@415`un(x+<8cZ#v*&EzKNWksSfP3ZYKUyI)ysl_t=*B1^#q9wOEwu?
z!!gsaP1+OT31Vr_=@>lFd8EQ<?R^Ke9~yR)?$1AZEPIsu(kPY4Q=#Qco7-VbRSGk0
zE{EnXwZASMJBIA*j6Z?0HhDS%QLkD!ZMI@yYO`-sIGwq-3>4{6cxGDg3@0s6_Z0A5
zmXPLLJDpDhvh!|!cD=<w$NTJ&HB@nGML7wiF=x=dhALw5V2Y_oUPToPfFDuCg%|FI
zYpCL7Kfo%gC|HATm?_nL_Z_M@3jByFmY0AjsG?zD9U4lXZ$^KP>PuA7b!rt=)cpZf
zRHUGaV8$}H<&UUh#tZNIq|t1E#R@Zz;W%V+4OKkwoVGHaVZNT>BdT~Rke;Uth71x9
zW8OFR1*+KcQ&iD^4ONU@LlxnlP{pw|R56T#D(cjJsGs6D=ZZ<@vd!xyo#juXpo&=T
zbc(4c$VJYCnM238mIXE>z<92h^ITu26<OHi*evBZQ{{Mi<dAIgLYDGksq#`i^0I6S
z3YP1%Vy|H$+$hz`C^OCIM6c0lxN*LfaZ#Faaj)?uxXBeOlj~_FRlO#4@XbwDn_JR0
zxA$)DfN$xs+R~r4Ww>|CBe?0fmFeR&)0tk=7x1m~R$JesZC&o&N`{+(tj!?lW(<91
zEbQiN*5;h)<~)7oNOlV$YYVY-3#mQ}S$0bWYfF`MON~BDZFVbNYb%3vE0aE}t?bs8
z*4DP^)((BvF6=fQ);8PIZFcn81hCr%TifnUx82`o8^LZzw6=>$w@c`=OJv`cYP~Hp
zecOq?ZRFGJ_W9QKMd|j%efF2w9j;hATu*oS|3fQc{tT^X{RvfM0+0dHlxGb9YH%l2
z45iXSXlQ96j12UA%pfQWGb@yZosE^7gPn(qQ)&YXf`?lG!HY#ggaweILIM&ZLK`JS
zWu?S5rI7L)C6(o5R25`3l;pM4lrZWlx|(Vp+M=5<Xd_*%L|vB6n{=`^K`o5+GmY78
zOpWX<ww$#_INO-*vNdS7hj}_!;~lV<oW!;}+xfU`YjNRjapT$P;n?bdX!8~f+U|<;
zwY%jjy2sDshMz*%F7MmBq{9PzZU><51SuTc?S~Kb?+8^V?hWkRtKJcYjtbx15sv8$
z*XlZ`8-FNt_K<v6gkcIUxCdu&1RpkwSGFQ3^$<7PMyfuKMB7KBQ=<>|Mq50O(Q%B`
zPLGXnj??Ljvw0Dxml=<DOVArguswd5_~MAM*HNSXqmF||9kwT#oJxx6PjVYba`8>x
zGMMT)muk5y%_1)?zCI%?DART*)AwbjeNooY??uIs;|^a%6%YNhsN#urRPp7LcdusW
z7M`!8il#L;UeEj?RB=f!f>!h_zrGKAdV~nLb!8+HZlh|(0rghRiR1{K&OO9MB~FA2
zXBY~yi_)7Dp=vvqMiWqloO#h3c5{s%Q4LoSVi7Bx&WBoo2i+t8kG=bjYWm9-hW{m%
zP(l)rUV`)@gx(=EK~So6l+dI}7eu8bgf1#gL<9^S1t}s@r3lgl2~7b-sRDuuf{G~c
zGULpBes}KN=b5?h%-lP7{PX;K&R%=%z1LZvt-|WH5Tdq6SxD1bpK(K~^sZB`7+8BP
z2FYp87NOO9tBcWgZlrD|%hO(OZ$23`6o@%lu=4g+Lu}2NIOzw7rQEQlFM~{GU%r9p
zWbho=3>nJ0&h3c)zX_@s^cz%B;Lo9oL(IQH6?^{^R59q!ql$^YMHPGh0#s4*uSFF#
zW$tUeal9|72^tPQCi$@U&!CDL{4?Sp1V4d&55IqSM(HSJMu&KE+fssVw;eol8@S4F
zEdwO$U{(n#Nd5XcP7X;~2!$uqYvsZ{H}Q`O+R6OG3~or$aNJeU>um-E<;b36boAmL
z3n^M^&(QZ0QFdlNetGW)JiKt8*3)ompv|CUB~5@unNG!Vj`|9^0`ipKfAXKAirBvw
zswnacRV0RQ!f)Cd9<$NRH_Or^HMdUg8v-5V_(BHH3u9Z_Q4kFDK`@!<hU$;*wZKj>
zM{Dtx{6ZDgRvRD!-NU9dJl4F~DgUjgV!X)T991+;=@H69!Ge?L2f?zS>2nyncgGNA
z>XX=8@KZwe$YsRS?=kFUD3~0JD~})5k$C!Zx+yKm<K)EViG_|MI+s)pDp|}}r%13~
zL@#aAMBJUtDXMAn&bSdmf#{9BX2H4)Z8E%0G(oJM{%$YkQbwwdeMIimpk*qbC^_P=
zyLv|LrAT)uiZ}1Xdv89WDQNb?y86NQdA+V2Gsyae8>BA3Ti;(To76YG82k|0{C#@;
zYJKgF^Fq=;7**{3^QfZk-vLz=jTd2=M<k{F22~tq{tHmWXc3kxbns{c<f}vHlg($L
zQf4fC{!7<hR$)FldZPy6hes2$wX4pDU^E-_PA%2`7FGO$khP6J5@bd|MCkf=%C`LQ
zO~aEa1lF8W?yFN#aaX_RvZO4Afjl73N3Hj;;Mz}&ivs`MsNyE%p957iosr58z@7_}
zLoYKan8}~+alSMWzqcN57s#lERcX>?id8-~Ot~0Fgx|(9>h&t<cZzr%N_-+BVh|6?
zN|1cldll6ssSHgju#J!=B$bdsV>3+Ow-GfiDv#!p#@QsdD922zuZ9Kas^e1~A71A4
z!nk2z_5Vvy#V?QyP*zE;#1ot{`(wi+HtMl1N(0gS(JI*)1@uRvW5UEx>o|>Wce6k*
zwQ_8BWQc#rg&V;)Zh!(2<W5ZvVIc*)S}aGd(6Gd*Xr&Vu7#HuK!lZ(au0s?kUg7*f
zqWgB{Q0+j$c{9XD09p+7Hc>uEH*8TQi^cp*npo}^4$KR)0Ja)rV;K7sIO!_~<%;?3
zybb$LViekJ3SAS0VTyv>p$y7m`HIYFf*6M%idSxmfzmYZ*P0j0spYd{Jw3SQ8qqfp
z`J!}aOg6GfQEeQHbxA>vg0bW4`J&bE6>9zp(UPVBu|mKW%=)v`&>aEgv7~~5DK?#p
zn6ZB$RPh_6f(6#`uHw#lwZ-|n-GK<@Y-D#pRX4Wy%{t?Ky7F;i)erIF2T5i*=1~ns
zlJh!rdPboe;&Cu{jVIL>42w*5K<?4?3TB6zr|Y143~WN24R$H&$5;0!>!C1GPzq6R
zYg{QQ`u<``3A4M6Tv#Z38R^r$H@7*b-O=h=3vrmtRF&lp!cP1jjVhY{qfo`5KZ_~`
z{bNu?@qZwyxDGk;<FQ3{gM~d<-;B<xsnhCWVtBrP<Z+Z$3H|I8N-98N7t62me@7Kf
z*Flj16o@&4)K&~3hsVOG+tRyx#q6=gL2M2b`1}A_aE1o2JrZnzpT;0n2O2EA=|5B>
zi_WsW#b@U|r9DHmdP^ASWkB@&0L`}#Y<)6@(|Fa(A>WuOmlI)r)Z0?SOyMCcoyi0J
zjst_oWd?r?^e|vYTF~Fb&|CPDVo9EEhwl02{+L_cK5LJgP~c(|^0Nh9y+E-nwfkiN
z<2TL&4vwz*c=4l=BNy{~S)A$V)=)Qq+$fr1X8z&oF|-l)(4x%H9Y^Cuyom)J!iPar
z7Da1ebn*-lX2D5&F&5Sh2r2yiP({;!2~<)1?}93t{%=MV1^!A@QRpv16@&hzQAL6O
z996{rRjA@N<iCt6Uizz0MS=e-s;KZk0#!8si7H0?uSFG){RyhLn)u&@DpEw&WeTQ!
z#}_lE>jA6a<7Wot&r3)3K$QuR8&5(GaZs0g_$p|<MHr$Y&9?0#j-1$*`~qUMojG2w
zmNj`rx;unh{uip)=2AW>vdY=}wSCVODCzW5!JkT7v%Uien~~@lMxu8Vi!uBuB<3P)
zEw^ohkbZS^&E2?t;k`_9*9w#LQ<Bp$qh%(gUJ6#L_cm>(1<xnn6r1sYH~TRQngVA{
z;^>NIkw>hqFuhAT#`I|xbjemvlV(^~2Z9O0CFp4n2PjMF8Ox`ofO*e$@(D`P?pGVK
z{25d+?_VBORG%#}dN*@mjE`I|I9V*iXki>*8-HWufib<2yMf2tRdFmo53-Mh`k~Df
z^=yQKd=$fg{TwYhkcLIZdeYg@im@2>@X1y`IU13jUWm0QbsUK~ELYT9Q&M+^{=R;k
zV3~D;;=3GQ{SJqDx*`UZ)pF@SqKXR$8Qb{q1%;=$1_F<IZ}Bfwk%4x<9j-A4fr$cu
z<GL54#Ftb?$U39qHvmkZLd-pfA`w4h`z^9R^=RUw&&>b;{W>V+qtQGs*S{{R$npzS
z#N7AjP%29$L6dbk9xe^{KMDxJK%yqK-tB%Qzj@od6!9@?ANWXq7QRGoJx7E=wgJi7
z2RDu2jLX0?HL=*$nsbKafzISXA3O(Lo6l-0#E`@{OoT6|A_>IQW`zl3xHLfIr{ZoI
z!`VfN*hD2>=jb`G8c>bnLTRtj(=f`Zt+>kb^8Z2=f1!%MP(@{4?KnpXX20qlK^dC6
z=@{>s;d2z2;4f5>_ZO;oa~ZCx`?A~2!FDk2odW<TlKjJ(HEJQqI-I8=4Q&{(Pe*w1
zFyiH<@JU{d=le!9Fk1kImy@Ot6>uadg(#*M$7D-{QX2RfX;$wMoq|vEl1Oyya?R6E
zP+<Tqg~%xs*CGV_GU!N0A<_}*StvwzH4q)XMl6g7p%NvaX$lk~7dJ`47C;WbmQN8;
zDg9y;0A6iJ-wE9c2CDRpIu=vSf1!%e{|;4z{{dA@`GqQ$(FiE7rfq{>Cn3!F4?Sv#
zt3$r15?|6}BmwM1=rWC;?eV8p>b4(<_`Lp$Z&NSDy$n}8(yUXLcZ(+VsY@I8eKA}0
zf)g#l0}hwYEuSL-33;B0B_5C&bn=&{Ezq=mdelm&d&{|AcN=BxqWQ*tc^wwPR}4JF
zHfH&-3?hH$>9*p9me@6l)N7VjC!xMc8!K4wS{H9e3<4m5CZg~75pLDFxFkFS2RLI9
zT5o@N^RKw~qv8UEe2xW{akrD%P~^oK8i#F~%gz;}5z!&+NQ()Y%VMzhFY(|Z5@erd
z_cZjDWa2q0i2E|aVdXNnCp_rk-x*cB{LhFgCj8T*ig6+dRkpuSMajP$Rm}b;K^43H
z{-|QmpQ4JNVzh$(1FCrK&!dX!8&|Y;MT<~r=0++)*Tu9yV>9i%8;fn;%<Rw6U9yX?
zG|nPexyD${Zx<LvC4Ix6uzEWa&12O%V<9Ya&igu}l+9!xR=#el6e|^B5=$>{btQ4Y
zdTh+a)4EF%IFNU?zA=i#C%ard*>7vn!{p$;DO$R+ywO498`vmbeotrF?0QXqQkt4Q
zL~O`l+syC;qbV&vnIE&q?yjT$Pk<^8G9Q(Av}I)|w<|x4gGaD%N>e)ADxNdQ)>UZ5
zxyrpb^u@C1#G4cz#VHvkMunHY&AW=P0-p|2#=J(|=<nCQcD^!gnI_*WWytDEPt_W5
zW2Ot+dKA`XN+CRbmFg5;vT*&9apU4mB~N-fQQ5q-KSdRTvETIma#T_CpAJ<_`G25_
zLH{0AT=<15nhG%dLKS_kk|K2zK2h!3jlQCT!~cP(;s)g3P(}WKT2%2iRqd3d`#uW1
ztI*JS<iqVc&J(9dbqfDQRPpWK302HP`RF}#P3LFZ9IY+*q-&iU_@Z6a=3(nr_Impw
z&Y(ja=3?(^u>mb#R~b45urw%jJyw}{Xi+qrP_y~yW8{8<I(O-b@|m5FCCqXQ)oCMl
zxbk#P82DSWzS+)j)M0+JZ`L~yMU0M6{J2Vdpf97&2ID+~7R`^MowXk6a1z(&b;?p-
zbLI2Xc%dR5+g4J^Veq~D6>n;z)2k1Nk3N(03ooVg`|DFJVi%a(zCF{bHduZ2{alq=
zNJ~lo7Sl2R)k|B`7JYl0or<&!v28!zYAt-|xMrCCv2t2;UDK6O%<{|Xv)y&RgqERe
zzfi^Eh{NI~zfeWnT+0TxSiM5aumpPCWkb(mtp-wng0Zp@E$0KYC85~B3_LNx^ssty
zC}VL@kIb$9?@`6x|39dr`u}89k<8uum!pcLe`-{*gBf-8-=m6;ng8afqWbSp#dhX@
z7^<kQEy<$I7{H~jPD)I?N{NK<uHlg}9X-=IN9Q`BD)X`lLuOPkEQI>-HN^OHCr=Eg
zi6mKyqMfS96l-5*Ai5I2-T4?V5TYqw1WPWe^t$z|>t3s#o}`543^`$DMV&FfR|@j_
zVgk?fP{`|;GZ$lip^8<nliu~cZCA<=mOFCC10z*CFrw4ocm*N_*`<3fD$4YIAChs#
zFInA8Cg-M<8L9%1q0X55<ySI(yes}Mgevy_4?z{5GiT5+W%=nq<et!`Yb{!XYhqL_
z^voq{9c10*m}C#jxocmaR$1!pjO-HX!ZV5@t54rgJU+zSnSgQ&xb8(8-~KsKPs~C0
zPV&i^E60bKdOMkJ%TdpQk4NbsUtPnSS(>mw1X}?0Uht0sVnVO(p@{t$>{DP>pB#JW
ziOmxJ=tuE%+H`4*FMN7hwGG%UQT+F);u!N^jVkst|3Ve#hzeE@ujNat7AiIE^Q#()
z))tzo7TfIHz1Nv}*f>pt<{9G5sn_nO)2<XbsNT8JbjOLg^R3URxYNghrL!h?AIHh!
zZmZsV(R44Kar1*zZ6A;x4%Q#PlYRfrE$?>~Z<=cO)b9J!`_ju+(#9Oc9qR+xEC*Cn
zh&0zZsXZK`^Y!m!E=v=p^nNk<sP8&>u;;V!wptS()HkYAp?4q8(A&Pta-a9<Lu(&#
z{Rf1mrRLU;mkvkh8T>*O{~W5Q$@Aw?MH-$zK^3Wg4XQ}}o1=<_|ASFQB;9cW?z>$}
z-&Flk1(TM<b8iJrJ7!PaD|$Hb6u}?$=pNs~>FV<~YVS0^kS~1X-Jq^c)}P<!jST;0
zG>`t&y;$Dn+FL_qh3~SyXQz9Dz`?wW@$ou+g(~G^VI_I$+YM!h47gJtBUFE(ifq&8
z#@(f_FXm(&Wt8mtfe=ysBdRE@`ac&{lu-R!po-k8e?S$J{yeI<T>TiaFZ%aI6{-K-
zsG`At1yw}w{8gwTB-TE%_(t1S{5;{YqT#nrQ-MwpU+9I)bEK5aIu>}ep4)XPB%EOx
z5BHseWw>W<WbTj>ISmCe6fS~=>lUI--iB#bQ=aj4I4;^48luo2JdI6ep0wwrWM2AE
z#kafpG=O!*WJLXb8p3K>hhxet{x_&1^%tu6H$@eT|H)8A(%&0Zbi2o5l_e&ty5^x&
z&33MxiN80**FTEuRoK;s4<ybfe|g-6pSAwlG&${e-v4NN>GiKIrascla}c`H$gi#6
zrv0P#9fb1RQ_O(VKT*Z=y=qPO0^<LGDvF&ByzKNFRPoi^57Y&NfTEN%W;edCM!kL7
zuY+#1<;;gYN#v|>OT8H*!yj3}RWLRXJBSw4aKB*f=Y0BHA>ZzsFssfZI?hlr!?%Z(
zY!aR!MwBk!rJ*Z;HCfYvpfvnEYtC%nYd6HPWuXWj_F{5vUMgHt`S6kbcfDkm3Q3gz
zgf`<<`a-$(lonl*U+$g&?Tk*xx^tH+-wWm((-DDuIol-s!zbPBZ}*ZP=sLd#$v|1F
zv0F7!yj%IV-6rSf<aM^g8Jy70yr`3j5dk#xCAKCf8UUDw>MX}@%IXn{nX0Jd@%04E
zEzUi?&%0p)8l4}msGbRm^Js~q&nRPh*Cu<!Kz{96!Hc~wjcrmRok<>%Cv_$K9-lmN
zhs?LUHWH<?!KY%k$gv`%ce9alDfxuYQtCS>KW>X*UQXl>iek&}6~(S=KmMR7mV7^K
z1`=5}X#J@uYJ(3H#or-{Zop4Oapt4TzWh%`QG7q{r=m!DR}KF52SqU-_=BQ&7JQ&6
z$_KQGQfaTD5PzyDVi$j>D1tu}0Sp)OmAc{dya$S67hMhi&QC=#`s103byh!+#qxoo
zSO^>by`tz@32!u_+a%KcR1}kN2zV-rK2X#Rd13kgr6}6}Mo|R*s3<P~R#7A_GN9Rl
z&Ds8sq6lIq9Vm)(tmFekv4HLSEc^Lkj@xL?{X%oj(p1j!Va}>ws3JTaM?Z@Dg(@EP
z$T;dVcGRE6Ao!%g`3!?gV+K(yhUAlm@fn7ff1!%=R;QP)pI#k5{qc~~rj^sz>rUUt
zo%RnAz}5tKCV~Drfr-_b+1i;c)0ykJGasvqfVGQAri;XL7im^kIcry?Ojot%u3D^a
zy4G$6nQq3<-Aq~CEv?;cGTj}XyF0O-akW0<k$J}F`5Av!k6>$$^O+u(o_j>GdXlX@
z<1;-kKli-G>XmNobtBX3)^o4htlovz-ldt|<<GsVSbb`(ed;rPnxFf$v7YU;KHHOd
z_UZGpL#)1|*1j(?eP2HJeZ%TEZ|%2~>9_ja?<1?f%wL5nYX4DD)cuc&A{<Uj%Ro<$
zWI~~TqbRbmaU4L3yj+|=6-A-Ld_M_ANpbO?exj;^td^>xnud<9rs@Hnn6AfUtdGw!
z_ye10Xl#BUCrVpfJHQjoEbV^ciSo9o750J$gyMmp=<aB(b}Hj1o~YxJ>E!DDlTg%m
z%Qifd^IJ&qxOdJ0q!@bE{Qy!l_rHArDV`0y5FY4tz$sb><=cgp{S*~Xoi7d!Bc8rc
zJaj?hC#vWYUg8o_{?k=FKo#Fd$^AqX|4md(j}8A2t9gJb2E^SX#a%ma75x(GPAB4n
z67Qc&tU7QN4@AYAm!m&kHuz~Nx?eL2PkHcLPBA>KF*z;g09E`cDz0Z(ABc)^H|h^i
z#g;7MPf;->+c7q~<NB?Vja$x_bDCb|23^c^xtEtdb36DZrTjG|G&0|#CO`92p)a|}
zH>0Taby4`kl3Vj75%HygnWf!tN{QKJ?MZh+n(pMy-ig_~d$F%PbE5ppwR;z{?+upR
zYizA7n5#@Gta`Fgb0zbBbm#q&tOs$657IwBNa(J+lk+g?-oyUI`mB|POiJUmr;YdC
zHsw?`k9=uPFKS62dQ`LaD5th{bg8v)xi!D6Evu?+s;PteuA{j8an9J|y04x2@4Cus
zx(hqHM<=@*S9_{gd#mdD%BK5U*7|F^pFaQew5D<3-t1ue_F(mgXN|2x_uGf-o(wMy
z48K|&?)*6X=-Wuc)3N!Hv6pLOom*p%y2o2Ko_DUj===7f{nJFxhsmcqlbr)oos%!$
ze0n)BHoZ1IJ-a>qbmVpa)|=t+nZa)}&pywNP0epkEsVZd__(zA_WR=V*Ka50-o9Uc
z`}WJ*m*3w`d|iIMxU%tMWqR)2^w)Q@i)*vnYx64~7r%X6-d$f>`=uzhG;S_Y3yp98
z1&ZQswrN}I?)R<P)i*<J3wM|SnCJ`<LZ__%Q&IH&y`uQ+r=mz@`>mp=+=)I=6bo2|
zd7V4as{cVzod2DoIFGjfKZ+tUe<4lx$4t?ILGf>jqRFfvv(`Yh5VKSGa5w5t6~!wD
zilXFCMX_WMW%i}-F#`8HMG=?NexN8$b)+cIWe8r8XZI4gqIq~+;6x#;Zu6<wYKHt!
z@r5|?yE+Cx)-U7Ta&YnZspWtey&Yh`Y|wBMm>AO6$}vketj%eU(GH~z>#8_>A?Pt1
zV%#-eq)_qlTXZSi*j1$B-eYjZ{i`uUEPqfGx9Ewk6a0%z0vwkmb%MO-)|#!S63r__
zP!3eFP;Ss2{PwHIJ@@O4$j4-ox$i%d$m*I;<jFR>%Ow0kGdxK-W#T|l+&CF-ER!{%
zW>#5s@<%^@cW<@t-d+Xx7+3hZ4ytvh^(<Vtd(Vi<KfAN}ltFcd%p_du8El9h@8zz=
z??}F?!H*L#M;>3fD?yc&kQ-T%Z8SMh6sHKkQxwO^eG;`3KNZD3iTAh#gdkO2uc`-h
zf`3K~#KS-Hdqt6=cs!?ChiJcTxr*5B`n{sa{YORd;h#|y^VU20pE3ykPEm~fy`nfH
zxkm^(P!yLVE^Ar5<eg#Ih8%9v+TVS>tOVjs`|{~ys#ntjEi^J3nWZd$Ub`M>8i>Lz
zTMnX+S8TpvhyW)b1ot3&ol31-e&ur_6E#<-GvVc(vfX*WZcmBUe6!*k`ZwF&OXU|{
zMI-v3@-jSxi$+L-@ui|iFCSG(fkAs=cO0f`GM$xpwslDiYrN0SnK86Y5{V6?JRh$v
zG95`V<Bm=1Rt0&)`&WSRM@C;(rJRqJArx2+(7RmRe}Kh`qKbSEv7nkbgEXRPuU*{V
zglnGZfcIbbKSv5?`>_?+&_z?`+b!-mLtVPYDzl0*PCHt8cj=nem9t4!5Gq{%1ujY*
z&Ac!79P=%uHrh}Cm7&(5E<aHQ&%^Vb|KT*l&W}1iDaCl>W$xGy?Yd|0D^GQ)bs$1u
z*obwr(>e_9VOy+NcEbd=#%ygYL`RP%*O&hUw_&vjj%@#IhGVswhN5bt`KtIMM4;S2
zq`5&qDtQhPJIck?*Ck1xH^bVv<0v28Xsq(wB(y5K_=x|C(yhs>(RH^vCm+yI96Zf*
zlvs)seZM6;zQ6W+MNzQtv9(FQ*$wqSD2h+W@ddwA6c-K@#ZQn2x5&gZK!0?X1$Oe%
zc&A@J)6tw6{DQi+G#t|~jo3`-dhj-iE?!P}S)g!W1Qzi&Ric&WDuHb=oBPJBe4r-?
zKbKIZC4BeV=?>s*D7bVw5_p)rr$ZKyc+D-8gh+CswOh6AK)-XY0I$rOZvD_XI&a?X
zv7>7;E>{$Dwg(i2^@oB^_=I)I2(l+jUIInCspXspEy|$rxQP<QbsDVS%}Ty`wXT%)
z*?KEPQQ_XUDBBwm3%4Cz&dc;vHAXs$)Cs2Q2P~4r^$j}R4Q&(EWw?{H>d9eNI#>pH
zsR0<Xj_{<~02X7OyF28_{R(S%(*sADUj4=jUO(i$E(h{CDlB5b8=6th`>Fr#^S7ZM
zJXwS;r5!PB=QCaA(14q|JLZ&vV<`M_&kRkSg~!Z49{VS$R@fLc+jjAoVE64_h()$X
zD^9!*hV&icgO!r)uCU=3HLjnrS&xl~cwv)eA17spk__0HKhy;AFO?S+af=@0gCnc(
z>Kh`g$s}FYEeVZpaR{*$VnUO<uZu$;NU`#2<FhLpAqTBH4+9AitZcRXVTtKPgV{0P
z37(_xw8f&g*8~bZ!Cb*1HROQtUN)&-b+e<W!(0n}bRBTi9f>EROkMrZ4%xnzaFp7L
z?f`pwO?I7JybjuPpKi0gi=`WT)xY5a{y629306%*Y&S!M)3KIPF8`F~g!Y9zESa@C
zCC;hB6`4&>EsvZ_6j(n_f3dYsy+L8wWU1^rXh%nF3Q(bunPnXpRXEM{ZpFIUUW@`u
zVSKCI52~4Ay@N>+a~fPdEfLG0NE=#xA)o=iG0XC@La01qaP7?Zq6y?2xwiDg`$Bv(
zex&l@!}{s;3oP?5XOQP*QhMJ9{fVL&YOR&zh>oDX#Gbrb-wK_I6Lu0bS}o}19-%i+
z^I|!&+FO70t#9h3k7KV<TC|;FppAr&-{;IH?}=EHraC~v4}THvMMw?2sBMW3wBN^`
zKbmD`MrP@(L~z_lSyINza-BO^KU7XUdvzm^YmqB-9y}oQiC*miDVbNKS2np)J%W3V
znvtz96Rw^VInm)_=#Z=Ue72T3p^(wH-9W}~_@i#Mxx}t532D;NbJizDpVm2F$4xUO
zBy6rkb-k;PVNNh<g6HE!n}#8{X-28T!XY_ojBsYwIno*frf{9YQ?h<pOtc?~Bivk!
zl!3_xQEe=<piWV^B;A*l+C^{stwPr6BXV5MV+0kLpM@s0RF3eC8-nRe%;b-7i}I=l
zu)Uhkhq6}S&BI%AwY;m0dV=q0%kdc=Kc5}fGBti|duHU^%{HTmWdeg+bkV+ciS&fn
z0D-5LN<$JVVtmASd40Ve0fOE~R$t@q-}LNcSAO=@Ts?DxrUx?KX}yO7*A_4?xWZ#M
z8K**M-2_nrJ<=j6sz#%*sQ?|%Cx;@zSf_TYNmp<@0lWaVTl}QzuBV|cV7eTn+Yde;
z-wrAzD6OVwXa&#<vP*__%4Jax55q~*I(q5nLCc$9Rf1A;Fu6)sIvb_@{czAUM$&)^
z+ieFK1YD$~hnZob>_wU1J`r!0gUYeF%~c;mE{5z8jZlXIKI<IQ5HS2eW_oIYLW%|n
zo)5^QxMfoqd(%jc8w}yp!^>$J%dToeSoLosx(g>Y9806cENvS1=e2in^ug4_DUWsH
z669O~yKz@Fjb$d8LlSKmiDey?>7Yan7Kz?Ze0y&bO&j9o3!o`x#)WXiMY5Pf*k$p2
z<$4_bFh<Rx1e|Lj0^a~vVUc3n+BD}OdDTceW$1?j1RN8uv`O3}fb~a1xZ>h3E;EH^
z9U8$w(h8M6V-qAEFqHMc!)Fjf*ceAk`EVEOtF-5XT+WG@CH4kgUD?JD1X<>8Cyw@j
z3O!Xt)*1GQ*YZ#jnWGZr$`KtFOgH7B%e`==Eik&#y&)`BSX<aNKw<}X2||+$?G2tE
zwL|F}KaiuB1i&dX+9Npd1*q7FGD=wvEJ{Y;2;lI2v!E6^II8vvF7wbX0gMZv4PVfn
ztPRxyz`<ScLL7L&1?&SC+9kv=jzsga2#pYw?toL;QZ$aQWbC0t^HL;sCyrdKl@+Nr
zGO=Ki#6gTFGvIf`_b4gzFOmqB5*Z%gOx>8ac8Kmw06Rw(zqY^qI{h~8RPG4uDTT=|
z5v6W(J|l>(u=XshL*Lu{!gU3SNnK%8yxNYLvn5_E!b`RJ6Fr&CpWGGHWholkDaron
z2IZJoJ@xQW+Z!M>(}<-bY%%j;Fx~A*n=isQ&e@?DI7oGJ%By5&3m5PMfvjhCm`5W*
zVTBnZW>Ql^Xw`OzB>{Z1n~mQljl~MZyl)_jypBRHrGRAe3<Z>;Me>Np&~9I{hE#6z
z^D{!uqgM%+<5M+q4R7yFvVU6PsQjF_Z%2V${5M5W5<I6(cL+NI_?FM9-ad?77Et4~
zQmvg&qzMXrxRJ}HeUs6?0JT9`O7W=$GlFzrOIQs6#K?US6cvEvyogjfgv|~>!VYup
z9z~Z@4^JOMt5R=AY!r%YFbH}VJf*=dtrwYb7F(zmpR_Nw-YLpnM+Sf6;OvRQY=CuD
z(Z=3vr!HbLdWv4m7TGkFoSiB$<y6LIbKuW|bZpQB`}5&cn7*rW77iASlSszO+hZB0
zW)N-b(B(}=n|QI<{flL8F-+MrrI*Cng6&JO@d$eYX>}%)XA^f*RYLATvSTq*$~v^#
zAheAT>Y2^$H+8pCyf})Wnd=<J8d$1U42}<=mn8V>u0z{!kmmG^6pBI{HM5qe{dt{U
zt3B|EDx{~0VV9EI(hhNuV|!qPPHBgXx6@zw1b)EGB#F13>c96Alww(J<T_LS^y0;O
zUCnZD?kuyyB^1LJCxhu-#;NtY_vjcuXIGhWmeW4r*t99{l9eh%6}c`|5<JbuH|fQn
znC-1Y2m2rcbTt?U2FU;kSF?LTGS#0;qfURJ_wzuBz!8S>P7#HoLdJd`O_m{t$Y(rA
z?Aw*yvqdTUPaw+Qi`-@kcIb-p2*shqTHJcA*$x~T%5h2*^`<%%!p}&EKl4prvZ^|?
z6ekl;RBQJ(`(kkcR8tfGq+<Ghjb^AVHy7Knaz-cR;M2hmz%>l)pHy<az@z%d{2i2r
zN02*~b=>Lkmkev4IM<3`i?^q0&FrOp=%9LB#UF9dKqHQ(-pg$VX{iMKIe>0XDY@%D
zQj#jVO2F&I$~|x`S7m<apj&g*ps9^27isy>f1}|MZ5o(H8BtSe+~BOD+pJjVW^wYU
zzaUa$vOZFcn@C?gTU}eUUNoHo>sW`n0eIi)me83N(|)=<Dr3j`@eVV_rFJ?u02+!a
zPS{r~R`IsIk)JA>UIV5HcO(ag!&BCu$Z4%JY~zIqHW~#_>zov7B+Zn!)nK)#dp($o
zA<nI8iwF18OuG@UC+cP?>PF{SWXUY*H!0q*h-iCxv_qnWL~m!_PnY?%XdI_8=?#~>
z3r-|FrUKyoDOlA^q(Mr&1c0cmE;Qq8wG`KI-C;Xze-lD#t-qi%hx0<ty3=r?9b=hx
z+g<HzIzKC-VlQNgb&8)=L!B(Bun2XBq;_&taLI)uxw(sN;E!oTkcoJhq$>Rq-c_vS
zv8i{1Y182z`qo6Q;*4IlZ=pR9ZFlNe4t))%euN2A0NycU5O|5v-hrwH+}7VG^?*Bi
z`4;YRp>ySMx$KHiNfa%_2-P;DbE4tN<VKMbL$Px>lK)4MdrP;Ncemtv5#dGm6#e6<
z8KG&j&fsul?K*Om+84@?%x`Q=PJ!77A=|hIQh));b;c*hrCZOTu7#?-p)ke<)A{1y
zJ1dyoY8!)&ryc48t!D>VTo0JV0pR`sm-B6mIg|6dz7d%g!jDHq+zoDLyT!xlad^6E
zGwGrLHB(ivrz7JCp=ufcSKyzTPf1J{u#u0WYYFX05+Zz!4WWUi-!<Yf?|SFRyC&KH
zfCag*Rg^;LCKec(s-E<s!b~}7FMMt>a{(X6_L$kLHiffoS0^F&W$rLJ4~NQ(vN(^j
zT@faJ7aeIY5mSF^&N*f=#dtIVIfWnFlVm)Oe}J22d%qr7A~UX$Yi(lBXfh|LbMJA?
ztpW!P>Qah^OvLz^L2gUx$WHc{)9y(9SGG;vLx<m??75i(PaS%%^1_3W`!O@Nw!NUB
z6DfWXBs*2GM#*1GDFg}-YgnvmJ2K*gpg4cn#RwMkG}=%V?NX1{Zi>5lY}nncNF{Jm
zGIf$)n+P2im%!Ow8susPW0|K4(VYC@Fl>22ey|w!!TbbdEFWgBcsM^DA`@^tf0W0(
zgn8o%4}TLZ|COC2OZOnAH)86D4N7Km3UMF#sEHv&qYJ)ofV%F>Vm*kyu6mBioT+vl
zyqXfQhboK5m4&}6-S#d^P*tF#4KCpF_;ls<yWD^zZ}>x723H)cd8F*K2J`$Q%%TQ5
z)FZTtpke|K`Ets2{WBCUhI(;jdbh*CwH-d5gL1VAJu5h<Z9S{qZR5liY8@Y<2Av_m
z6^p#@ItAXt%p!EFFInPFJ-(}uyi(piRWWqYsuar@ezsg=ue_cxue`_D*Hi(LVUnbr
z4*@N(%d^V!qWNE86@-!LHW!jUg{2y(mjumlRL*|aHc=U<yrTqv)-M}TTX9O|VsWW@
z&eyUM%ZtewmHqu)%7HJqWvW?bUx7BjjF%tMU7}ap7vRS@96h48+!aJ0zh`@;&zyS+
zvFb9L$Xmm-i-~N-@cKlVzeRXaptqjM^Dcyty@`&xnxJJSNEpPaJyg;1?HMFr9yRD&
zeH0xDA^Y@7-H2!w)>m%bC|sYkq7ZK(Pik?6*96hxR+)?Lp^y1kA2&wj5uFA#R_rCx
zZ7(kuN$9I>-?%D;vXMa9Nh~`Ve^_yclc;SKFEPV;7>`>I!8C{+stMejF;-X8zS;p}
zArY=1@igFis9BwZ?rPl!Ue_687sEJsV26Ym!-u4+zFkqO7vdNEmL?PGU+`*cqNh1$
zn^G?;Lxy2agx8Q7B(6R6CDQ!%WwQ^OOu73bOr4q^t|c>3ZplitS+4BaYA~yf%zTie
z`6M>m^aIrVxw7|o?Z+c08J|tK!V8iImbD2>OfQmWD{|N0cR*aLk^SJb#|bEulZ2e;
z4JQf|6MdzHtkxU3ky!|Sw91TVMMGX4rCUOXnxdSr86Dozo0rs#p10MmGnxibw_>HD
zoZ3J&UvXHs<JE1TVXOpjEc)8a$y^NNRVpQd-kzGbbDDTWP)te%oD!Xet0r4?1<4WB
zLaRYbrJr|ZmHH5A?dd2sM{7n|NKmFNNe&zuuo0(_Uf>>IuG68I^4TWPUsD|w)`l{8
zoAvB=U$X;hC<--xn>EHOE8*BN%Y7;n<QwWFC`*~~`<k|YQePIvId~hp%P>5BWOxNT
z+haY%KRCp;{sxnFyw4mXwD3`K9DxcA`zByZozad#9FlUIpw8+h(0@L3*|uh;NkwET
ze6-}rn>&13@^*rDBMZke5F#aRcg(VLGiBVL71@oxJ&~gl@?l|ebjg&W9g7sQA3NOY
zq$x8fJ0*Y6pwVvV7u%1&v#PMG^IM!6U$v>Gdl|8zqOdku<1t?8{_^>Ihlaq#XT=UL
zKAdW~@cF~y%NHM=+E2VVfyg-@;M|pXNczmHi4E687XIc_DwChw2W~3(zvX83_Ncn8
zeNFh()YeLa$hmFuxyPRq?KV%}#_pf>_@eGr>uhrKz5jDWqgOp>f0r{&i>Jz_K9c8B
z==+zAr+N-mUOyNo_nnfy{r-o-){6$GLSd)ZKfYB}4(;B&hnPAmywp1oXZ=dy=7Iiq
z`_@(70-qCSzRz>NKj~2Q=<Dgr{;e<GaSdt311u@{MP&G(#`Z$tkS49#*19gr-QpuR
z##nwskHu2HMymnI^#O9oHA6<9bvkHRmEB{^yqi;ZYr_B=#T{sH*ajk1*&iSo)Q7p`
zCec?B=ayzDLVobcNb=aIcD&f-il8II1p_rtdD_$^j#m^3ruPWco|6+-OS>3sQuzE;
zD&ldOfKR#DTy5}C_0J1;hqP!0(@pmENUDo5(x;DY4d>xFs;TU6iq0KXlD>|%Fgc&(
zQD>rCckIN8#ap_ST(#NYHVae1`7u@|tLx*|#^F{c9o?IX8KaXr^h}~!JKS;|FGnPt
zJTa(F-!I=&alK7ZEd6+&$FY;oZO^i)y4gmkYgbal)}0SK1TpD+8S&}R*}NM(eC6T2
zkbB-YM$SDw@->5FYPsk34O(vxhN!se7q2huSG*{H*H!U+>incp!(?nePuN^stCucc
z^bWs|Y0{P4*bKWfcN97#$H{N)(yHV+7RhSeU*e@Bsqrs#<yD?6o=q2+cQfjvYV&y&
zX<J!WoJl>(#}nGh!g-s-s%l-CeAM1+-{|I^if2x(qT%iN2i>8(#~<E0Hwc`%6)$zB
zHce_pXHxD`<%1ggThA4yHD}LOZ9ab~?S-55Rcr^dg$F#QS5go75tes<t&{8gkHB7m
z8{t9yPF&5#-4ZXtgP*B=4cED^#kL#3^EPXK<<a81Qr=pVk)wx`Eo~&$hJBPAweBVg
zk~7+TzwVx&5%2&p3+qV*vC85&4u`$Hb^dkT>}4m+g~i+Tr{Krkt{Jy6pH>pfV{Q>L
z<lF!Y+kd}T^zA#-yg=o{vpiDQYR+m+*Y8LE@U^<)$H7sd6$QY|EH|BBUi~4`UhMVQ
zSGApMXW}r|$D4xDds&?fbh0s<DkzDTRNj4%0+jJXovHpS*XTL*WldBb)r4wGL3o|x
zJ2WL7E3<~7ub<apc@!5VUy&b)FYc(6>_n(;Yb*Sq>4+}7mcUX&W;_=l7tTG)s+H9t
zEsw?oqV%{d2_4dr!%Pg3&aiM=cD_7MvO7>C<~)yK5-V;Gh8#XGG!hej4y&W|{4Q5T
z?|cS6f$zl326rtxio<B4$KyRZ)p%!K1(bMLr++Es^4cuoe(BNtmU;duGe!ZE8BxI<
zU2c);4t~iM#1-XPzx&P^LdDKTecT-il7tSWOb@Vp4iGLEFv!qLJXTO`k&@w7G_hR9
z={b{<6*~eG%d{(km|yYg4L@@yd*5!5M?c+Tbc`fhqf+>083<`#=u@d!N4-WZq#La9
zYIg@jN7%^<zEh7mOBjjs*w*C}$+Ct@(}F{S?z79WlUdbuo>5{>M7|jiMtErJ_{(M-
zqh>|xxk4DXcS(Wtb<27ZQ|2trC(m+0?|hI<G|Ox0q%&2H*F6^ii5hdw&CglVl#wB;
z*UZr83-)S$_tK6gnB_KZ^e~)pHp>7B34}<lT$K;(0j6v2SRNUd_drwj&8^Da?u%R3
zix&bN;&+sWdqidkP#0x4I-IRRP|KlynF<1rR&^1NHR_sE4uL~`Tttf=^DuG-%%}6Y
z2a(`?vgm4^NMGWz&4uo<{VG}6a(ji-t^!;meHL~1Z&(dqiY&9el`zZg<!dP8C>L|6
zJ?1*=!UAIXUE+oInFnh*Gn%K2Q^Km-6-u!c&Lr{#IoetTI)64WvB+><*v6pO$}d<*
z_*Hg`E(3bSK%MmyL&O7edXT*VnEw;ws?H11t`NTqLxCqYOV}Q*9PxYFMUQp}KP<d6
zyV&shCF`gAFAD0`Nz&)^%rUXr?IohA(hzQ#Peu~6;qr(OWG!CmCg^crM3(@C1U6Z|
zQTySMzwTB5<IOHt*3Zkh$lT)DJK}{PAdDDw`5cK3f~OUl(}M~EMEjH#MrK8GB#3fF
z43Q6_Pr%;@2S^^@_79deO$FA;qoRWs4v<7za8iB$ET()R$1e1E<h|p^1I^lLIQ+^I
zxpA({H$gpa7lV>YYD&0SE*Ke9jw=D}t{ipW>`Y;^az#H9q)iV!byTF4qt#yS4pX5f
zgm(beq{AjL&L}C(crv`B2b23v&--*xVqT3amTjBS-!@j+u*d@=HjlXh=#%<#-WjJD
za$ln*OI?&)3ND)(tF}hx`fS9R-FD@Sr0py;F1jo?rp+O&qsRUlPryua49VzxR*9o|
zA6)Uct)%+1(ChUxcB50zy}oopbcnB**oh;TGnXmo_ty+lzDy^Y%Qs)}ToTSP<l+Q~
z5F|kKPawb9XP^aOd8uCVHxfpL?{;R`<;(=@(Eto#0Pq@@fWi`J_-RQ@&jMi(20V?B
z4g@&8OQN&AL<7d-0pLV|@{KZ9piDMV2TwY!+YSeScAB7;B&f1FT=1^W5ZsJ-BNzaf
z1Az9SSuztq1ab4lB;hIpuU>iuXA(t2PX{3BiijY99e@zkldsqRSj<swKR6MYC@(m{
zgz85xr>ifhb<y2>dWrDP_xz#LAYeim%?P8u3tq6DOHhs%lwA+Oc&QHh2&YN`c(4x`
z`z8k<_5|N!Frn?BL7}2i-n<*BH<oF*v8mD@7{0)5b-52^;S*g>7ck-4$A+r+!>UC5
z=$xoLU-tAtfRyt$7SDMO-Mwy{yy@YDc;_X4(cN-WmYv}nt^E!kcV6^V(ok=4f4N^8
zQHiF|U^l-NE;SHgz>wK_<{j>UWwl49KO$XNqh1JE;OR`x(ZEH~j07O&rF_3yJPrT^
zQPo$};@L!rEO!(!iP2*Ms=#^`Hx~bT9-y&Qec4$TY*s6$951X)+*M1>B`dPeYYf%G
zfL;<r{vkvV2NNZ7v)6lG(ukdJs9?s6N}xXopsUCl*jq3FAH%qY2M!(uua4L{Fio`1
zCTU3-$DS<H>e^NlW1tk!D`Hk!nC&z$Bp5R-5tP$nl764bwsW6}P|ZY(XGz76$)SC#
zJ5-aSg8?W|1}HL+{D~?kbvR=H5J&)qjM1tBspGdAl|)mo927;Pop-rlonRu0R>4aS
zz4wX6ME#LB{o~-Q13gmRYgAX$QCI6YiEg2G=K_iDm5xz?j%p&DluxJZDJHqq{GI$n
z-J;f3E)|hNWF97hv8jITK;`9@7=hGSfm9`c=q{Hk3;^6+8ei4Wbn2<xI6#n{2pNR|
zWzj5+8l1Iy0DBz!v96mwpnw?lrA?B@5B<bddEb<V(NzteZ$uwKG`}r?5o<Ib(AEMB
z0_9WLM7x7$T7o;}tG@%M1%>Ux)58cLo(A^)()RcxPxafWkK<cz(-2!Q$J+Nk#iF;!
zY}|3;o`8C?Iwv*OlR+B@gPa2Hdzb-?>~YSh>R>7qTn1R0!Sry7{K~+Mvt0;5qjP69
z^1yv4Wx#|A(*pXq1AtSu_4EMn+}HrV4z;8JFy)4l3h=1})l=1R;4-2W9s+M~G{#5!
zUed&nfGuNV4vzi;HyyZ7Gf_SM_}Tu_<o@6=$lxU~M3mSNToN4cD0;0|GpSeUCfFd6
z&LshIWlX=@v8bS2)$4~6U<O!9Xab@D^F&(-m>6+VE>F(LQuG9EnTi<^$m0SAPsVZG
zYQUr_zm!B5cXs%jsRDT7J{r);3s%L*^f_&50JH!j?xDww5`ZHj=3^)hs{3;>QyEPJ
z-58pg#{A3ZsRb3#gE%e;q7wUKI;=iW*7SNoWkwwyn9xK+3;sNBj7WI&^z88#fg5~S
z)+lP6zi7e*YE0l9LWdC7|El*?i|HXF5{+l{jfxhsM5=!oRN4*Wlwihe9v32z>bxv3
zTodP=oQiH&;kgh;rxEW#JKS~L2yqI^I^G4pl8RJ7J1J{(9Bhf;fN@2{(2D|xtf<UE
z1Co=agm1CZ4YASNpuoi3ylRlJhFR;3AvPk@e?k?&DRSJ*FS#3QOrhCuRg#4e>8o4C
ztoZo{({2<b>|5e3qKS7@wukZ>U>d}cwv-Xsh)k<?D!X%K8U_TWCEakX_oI**AB|!M
zhe&po0UPkkYl)`SP}R@$Y6>T5?4^y~3m88-$)q}}^bK}|ogAVZ6Q&F`B*ffCflnlj
ziJmY!p)UydjH_R?ven0$=x6Bm7Ohx}Tjg5Oa6(`K0Bl_gbBqQKSPv%imq<L<5lTY`
z7##w&vxjs$xdSO{7_Af{sJ+uaA(}p`$!RN=?SSi}ket`a;)G$PvS?;Tedr9pv}h%K
zXS^m!`qZ>l*x+p?900LZrO^Yx01?gIInZ<)YDT2N9*l>87<n{pg6Sa_BG~r1xH54+
z;t^5d8<7U3Lfc$ZC^wk<$_6$;+^SIS-HZjX6WNZWCa<a#w!9EZeKAUn7x6{h98Y8_
zfAJ{m<PG;U19sw+TxuEpMDUCyP4onx1{z{JfibURkDhQpVj?4y&bB>xqZtx0IBHC+
zMxjQXvmh4b4P)u|!G@C<G@MTq0AojU-I)!CVLY~^)RaWUnL|0t@yT6wE!0Wl+_+Z<
z?qL{>Z<eY|bIi_`w7Ve*9snRv&+~TeUV$etePf$H*+b%eT*^U6lAtMoD;JFMfIaM0
zLM{TsxkU3(N6ZBh!dA9$Tn`yQgr@-T&#^_Hp|2Di4pI+-_;8;kg=pggLJ+IP0|00P
za6jZIqPLwXj0|0G^O|`Dogv<+03ia1<j+<1?6PoAyYvUPvA2NXSfbZx7kIr9BXbNS
zpISaZvvs$Drnj2H_456pX}I#EU{o|f?5rC{XB}azch9()^)d%1-!e}BsCewqsB%&+
z?Abyi01(;m&3WIIl+V6mMoeK+$9pu0P|xOIL(;-p<C`&<JFRLg4-mKog)R?VFDK@%
zK7)$_U6)Q_oSW&o`w_hpz|5>Ym6*;0bPH%lYE%_j#j(*6!Jf{0<J}WK>Olz;NosEr
zjd76@#FWbu_MXj9<w^d%*O)*;s)LI22{an{Y`@r7jkbLR$A0h>G+H;EE97I}Cr?0W
z0qF8vgkUPv@a5iTC%q8nEHT<jm62%W*hc*kJ5ksPYP2~Ou7-+ld=ej7O;#jW8fGpi
z;x5}{z3dfCG^B;)CZyLl#Nttv5XCX3N^t7}1pcAr{Q!w(hFD$!_~2r}4TRf+gx>3D
z7(1ZO63@Uq`|K8s{F#hSm@*axK#nyPW3k!^&ie91&ZD*%{sy+~IJtHse!vAx1sEx(
zzrLE~e;&7Kr9Qe98>|UmV;tiZP%Bn@N;9DXr@{goYPi?Q<l>G5p5`iJJO=8Dp^4p8
zcy(SOl~dgW!x0muMr7IUMD5w^Lp;0S%1)4pDYB5~Rxa$ZTD;qbXIfWN_fIf53MOiY
zmhurm@-8QND2CT&3izocLEv_#lu!f}!~?KLQM|6VT4`3(2pf8(qrewx6ZO3^9;U=)
zwpu+gT2xyk@}36xs$sR<4)ukujLLJU0e4IXf%1Mam^y;-l20upk(p;J9BahG)RKIg
zU5-zAXS@v#1H4<$_;kBNu&KV!`iu0@bf`HD+Btr0-pUZ4Nw3nNrwz@q|He(M(XI7J
zCLR(vRXR9V!~;aB!%3P|-*`@Qm`~_Hr=yG;xiX0iqC{Mo=bFX@)0fy1HR5;u)VY`Q
zDbMopidP7|R_U+P_ajDVGzm1aDOdQiV);?*P1!HSY~kbVP+nA)6UsZv%#Vlgfq(hE
zCB-mZ87>3V+}dVoppruI?$-C-Bi7~;EtlZzaWw0FGz~-{VRZSpdyf#BQSoS;d@3%0
z7-dOxMmdi}5P@~_buJBBB5}%iitV}&tZX&7+BscM_V8Pu;zK&^evdYNU7a%;?n?yF
zdfG8hHmYV#8B>Wg4K>kQ<bz_~X-~hwuNgkG?(=HRk&Bec1;n3BW%}TmrsgC$4r6Iw
zOUgUiK%Q{UI*9+q&zflIBd(t`Q&W-2C&Qwf?<J(~!KUzJK6bK$GD*?}G`~k8%t9AU
z3T1%c{U`$HJ7;i|=%zbPGOB$go$B|YGV#>Pbtjnw)7MECs%efK47vGfoo7uMgWicn
z#PPSrQ0T!E*8X2w0SF%O35%no`=4f=I(`UljqE7V1?@l61uGN1*qfW^2O1-_O(it<
zZykl54;U~xi2r^jWF779D!*`Qxu9D2d<@7INca*<j#LF`1Lp-c++c6+F_KEkWzkn{
z*K%=z+fN4HLiR^s`dY*gjrc=cpSxm~gKbrA3Zi`pF`M_6ojuh|h_-sYGJ#>_=ra?*
z`ns@x+DqOm!)c!)CVit+Nb<_iTi>pPOa$SyR+cr>WJPG@MQ9g~t|-2MjqXUMr3CNa
zn#c@U&h+P}HN*v1ZpVuCR@zYG7lac6YO1vPKBjz$1qcArvmZoQ-a74Hfox*>(D?cN
z<o%aDWex!CL7LU90&IyQ^o>fWS!fpVA(!eYX&~T(>!1`76h@>|eyy!Mk#y-9Cod76
zKr}Fmdl*av&8UpD*1)%kU|fHVD=@^f9ChkVaDxn-mIlENgo&V0Y=Ibqn1_W#dgTfG
ztSN9<bKYjGlCrJ+Q9xO~@4o9JzYHR3dAQ}F>Htzvbd1Q|`yE^jBk+(omjRi3o<3P|
z?&Jw^(Pk8tXd2%TqyEN6<f90j!37)RvtF4%Dd)hlauI2GM1`!4ko%f!+c8eTa-~&~
z%e%5Y@$Z#scnuK=rHJrhwn$Q9H0s;EZ5S&R<T6Vp@7y4o3+TW{Jl5-zLzWxUfu&Kv
zl9tFc6H}x?6lEs@hShl*Z(<oqqP#>ty;Pi!S_ji?Ugw;y;J`<C0?X2~N9F;9b{Y~J
zl09pN0F;rCNbc}pDTXIdbC@K%?d1+2CI=>^9_BUENDIA72|wD=P6VN>^D9=s_*^zX
zDv*|tG#Z^k2g@B5CKbS-;P71Cpa1~G58lP9Q_*N}mRaKSHE|j|)E6v+1aSC{!eDxE
z)^*D9$AFKhHZq(2Q#(gS9Sa0M@>zPOJsQp|b#{LnH`f(!nzO#NEwj*@CSqB6_M7b6
zfovtU=ek#d-P9z`RBV=>h(~he{isusfsC?5g<7k1znHjPs&bVnH*0w4;ry%ZwVdq^
zSK8&ir7lO~)^8465h*v7tNc#gZxx&R@%j7Q(D%>lb3N(O{&_WXTkl@f`hRToyl3SC
z_ernf<z#MubM9u^B`GMNqrQ1VxehmeU8-*2{MCc+W{M|{kc1lYWXrd2oIZkne)6(x
z)VR`d=b?&%SwgGiK{qL;SH>ukkaZYo)aj_xgNi*NcQ|=zJHLYl@LcCj(WX-obWXl`
zUNG&L=9jDN2G778nu{8)oh$|e0li^Q6>cmrIsMqDm~!n6$bx;14o}7j+s_0Ws>gc<
zCEX0{R}snGqZkP0U3k~%acR2Rg`Id}T}3qil6a>85RH86aghnTpqrm+q*|03Vt;YP
z^>$J8osd$QjZU=rnLfvy9sFaj3%hG^2a00TyNTTNepQKkTd6L#?3itHiK<7T3WEYo
zsFJ~ZNvA+YS6jtj`V?0k{zfhfN!lo?9eNU6lsWF*e58Iln`8C<Y!bboyk+twsiv6g
zx1^ev6j$$s_*PT9L(j?T(zfJyPcqhh6Q8_x?xq)WbsLoH>=NR=cnhwRQSAq=>tgGr
z>NB-5UUzs0%#JSw#Z06vNY`$wK|*fkw)b?41@EgpLDcH~2&&rdP~W7;j)vD>s?9;&
z>c2TjQ>yibV3B=uQ+~4c<_pxP7~W$hq*pm>s1}aC?1)0~5xYXw9z^!c4~5&w{~vpI
z85LKa?~T5o3U_xX+=IIn79dD)cP*SiNFZ1hg%$4Z!9(!iPJ%l@5<&t&0#OJOG<8W&
z&z$a=K0VztbIyI9b?@7Hwb$BvuU-G2d_UoG_lm+&L&WXE@?prOOa|tudj{(UO{vu$
zFHcg=iJM#GvR%Ip;Xe-<XjSNgY}^J*Pp%h;D(~)32n_5AMu>jLABZNbTxrm9K0iW;
zIiC01;q7Kli9``{>T(j2N$0<x;Z>d#1j)Bu?kjI4A`c@874m&2sN!{z5(gW5T9_}#
z+SF>lP7ztu9!`nO`5vS`xh|1@inj~Qx9>Ixc|E63IfDa@w~zK{yXt=`zzKSblUZHV
zkB(<wh_b~ZJN`Djg70YS97lnE8i7Wd3|r{bQt)U%mjUT8@y()nhn5g677P-e5@WG-
z8q-nsuM;1>okCy6>?Lt?W{f{DKhl@X_OEV;<nv&Dara($Xv(b6+F4>w_FN0Cxm##-
z@-*lSBJUZq2@;=u>QH!+&6@6w&k42>au&qohi*up5)W}cRm(Y%8}ij^e>Oeq6aJ}j
zJ#@|<jr1yIfNQUqp!+OJ!5JpcIIkxxy?`caTQws0wJ}Ljvtaand!9rNl9-mPEPrXB
ziRN56-k|~R&>|#9t*(YlJVU!iKF9n;oiUq>-}+CNJR9HN5SO+M=NPWikSs_P$~eTL
zMKL^#q><!Ei-y4+JOtHLa8uo-Atg)&F3q-up4m?$vhf3ryXU2%qMVzeDFSFJy;Y{g
zE1ME9iy9eR^TEEJ#ZIzEius&9=#qsX_JaP?_$5Jjn#aPh@D6iRX#AW|qv0mb%K>4D
zxARP$=@sC215e13H;9^Hm`Y?dvys9rC4?bdDy%$nNd1;l${wzph!UK5-<F4rS6u4K
zxcUjPEoB^X+_w~KaD)YK<~&`E)MR)FG?_$F6alJI`$zj=jgvw&j`4&nW7%XL@37+S
z&^R|w$9U$s;fFHi3IRjZ^1%*Od@xqNpiQFS^f^plSrGqK3Bu}adbBV-kNH9kYUxSS
zlgC~myq23h%N_Gi>hAUMS|8Rd_k4X)A9}@W3*=oHm=;T3>?(J>YilYJSYLa~O|6e!
z-S`evk8Un^<cYPa=x7X3_yCIKR8x}VzrvA_m{B2Xhsa%QYJE}{!tde0Yw=<lCM1~6
z?|Bxzy7slTtvBHlFpT%rM(@2U5%3Ln_n>eJa9hW8fu~Oq@7fF6Zyn=KpYJyFu1XP4
z+Z3KYqizw38l3`?Ib;vrJGv9Yy`o6hcKM7-=a@jIrKGvy%qy6onNYr^gm$@OnDDlH
z#dD0sM*G@NM4;OB^s#-S_c^a|tUK1-aE?HI9=C-#Ki1;fWXsVk`J_5VuM42o60axd
zS;zwVK^*Pj64H|Bc(IN6{Qc_`1C4_5aV1GqB6b)CKmz6%w70AUrPh_tMtFr~w%EPn
z@@fq5BiJpKRV(6$2#sf=HPp8g%mU@ioP`4e)^o|A8=!jdp@6AR42zp0ZG9D{cW805
z^7DrwuJMQY1CkhZYlG4e)a=<n{#`}7$+0sjt#pj)B>N+LviJ^Pd+;kO(i@#~Njgbo
zIC6}PP&g4^z%aG<LubL0IEmZmoP1v<)vYk?<DswtuG)vuKG4pk*4`(Nc2cA{wo(L<
zlx*_8mBPwuFEjk{#ph!ZvTZhBO37Xqz(b1@$b#V*?$TyrI{QP9S(Z>me%&r@{yDeQ
z^U+E3A5C-0FMafH?poWLdlDJMkiDm^IDXdyE8qbK0s2Ic;N%W-Z*%LH0J@zwpQk5@
ziupg0<%bL1WM{oH^@;Tf3&JoeljQV%gpfChrb&^M996#IJ3fhU3II)JsacDncWDWZ
zwX}^-0ll9Q?raP7;d6+V5PUHW!seW1TRoW?FuM$Qalm%`USoQ9gno^wQt~rVrzyk3
zweI)E^<vR*spND#-wCsc2e$3g%Jr-SAGy5u78ONqxo}|37B_~kF5LLm0et@P9dQr?
z?^^4P`xsxuo_8&sT9frH6xc_cYHg6!pTf@P-6P&HHzD8cl0nYt`A`(h5Z0u&F_Z6K
z)2xHXP47s|ru81>x!^}Q@Jzv|ZbwCnOR|{VmR%+Som2>9&wJHhtQmNGCE1Y+#OGJY
z1~Q2bO58iZi%NoWT&F0iWlU3A7&nm-y_R8>XQ@t-_^^C&_T8=a+mOKbN5I|(==}Sx
z6E@w4Nlex$#J(4s0;qfLjKLlwu2)kEVO}rZR$QPI0GPQSF>Iai!Dz2vN%aq)-2el{
zi-GdCZGuc79WVw<!im&6hOuq)z<?CA7%LRqUG)YS3&wtF-r0!TB55oO(Z*>7H{h&-
zc8c)aXoZ65D@XBq)(vG_bnZ?T6D1~JA9skq+ZGGq99e0ZO`+fkB+O*uC1mp8S9iu|
zByY;(Td>&~5nMrBTM(R3rG6-o129FFxY6ne2Iex;@K7^*jFopMh(m|yZIKTBR3m!k
z4#7jhwz}Y+aQR?(NI5gO2^U9v9gO+bwH%%I75F4Oie7s7%j{g7khua>vF|C+fQE&`
zJob8-gTvY0Ob^)G5*wsA%*vu4Vn-k!KX4Vu!karnEWXZrjwh0%!)rYJ^~t#GdXng?
zL4jZdW&D8iK{DrEB<H?8T`l#=VyW<r&4C!;xz#Wq8@0&IVYHrDj;B@(R-2-43Hrff
zJjQYIm(<P?tdELI0s?dbf*%&=IJ8M_I#)UH-W+81M6t?oEWOQE6U|j)h#hgQh2&@r
z%byR?Coh(hmj<-J(XG_v<%dO%@V0GlDeuH7`c4S143Lwra0kOV0VEtyMM9-;hU`oQ
z!!o++l%U8g=4oZr8B^uDvRuqVr>BV2ITEQQhXFuRT0WLI$B2jNFiy;E?N&DY2iL?G
ztD_dYL2j!Y?9_YLzU^`lA2P@VTI62W2~|WVGXx6U%@noWc7T){VlEQjC1#q{rX@vC
z%c5!8M{!c;1neg{LC~Rc!=DV3IKdkZM-SCsI<~EEIXG_JoMsLwh!u}V7l=o@{u`#@
zg{7XGY0rp$YcP?6zr<-*nZy<7iqsG))2Nj~6>zMDOCk{*s$<f%Sr}3`Z-3u*G3U@r
zF;-ZCGhnYux4<cDZ$c9*91WF=TnA-$D-`xC#E)_~CzXBPV&1{66x~`4Xg8r<f#01}
z){~EtgzUIJ2v^I*l-D()3r3R{-EpV|k_8M(TTT#PqC47iT-pxut~*^{gxdT>s2nB-
z{$!9BRzR$aGujTc{M`eNXz#B(VT_e`DBt;zLVfk|$*x-lj005pN@jzEc%$16<iIty
zDuwn<V&WZ<iVaTL0a^Q-SUFfs5fo0kGY+GU1s@#)iW434F`pbb^`4e5m~B^g58^`y
z-<%HdH$Vbn+0FFTOy;Ld83z%V;a_G^RL*?B3BdvKn0N+9(lDGYVpDvkm0_azLGtU=
zLa1WURCrZcMY?`<YK=}B<urA7q5|71evkYN`|8Y_QF+yRGEb{5=lAkonijm>vrLVa
zoCGkn+)jtQyFad%`*<k#wNlF&0_Tj-73Auvg@$+8PYw#-zJ#_u8CLyn=VV)Md@nQq
zOj*{HuF{KL9#T`L?`AYe#b)__dKXsV991w}Q#f9e?}e|I;HaCh$elk(dSi%6FyBFU
z*WuNB;TWgw;Gw9B62_`s`lkK>Pb}W}0p=B$sPG`sF2qA?fR`RlaAYQ{HE;)QDn<#D
zX&*)yuh`&fA@FwSlc>EAVEW`a3i$bGy6}3g?*zfvU*t?a#NPrBY?|^|y1s9mZl{Rq
zU`2*|IPrsV@xoOI{gI4wgecoe?pvUI?aip%n{b>*4vrsPwRE>%l{;T<IjksBga8Gy
zbzSU~G716j0?^M}6nBWV+-hnS8u)5sW|+GZ#gEcBeJUs3Vk$nsWAaEU0J+`0Nioyk
zFAa6%cSYbtdZhc*ItV(AxIx80i#Ra|%F|`1Zl#E6C!-pYbJ*hu<HrqB9%jyu3w$0g
z6TT#gaT#zUz3&md?4~rP>-nlqc|e}6$(cn<XIQ$wUylK<ke=Esj(JB{&!HCf9$)ba
z^8V?aSMAcnNAd8Fm*^XHC;%Q*Q2~N(I557QkI$Jvf}g#OG93V5BvZ$r(O2ETa=YnX
zHcdqC^kr11=m1V2IB@4|h`M%W$1>ITMs4e8Ro&P3Ab&~$-CE!CPs6x-jqhRNDx7Q$
zE>6jOZkZb7QkX4hSYDQst<#X6vYivg8{_o+jvqhL-`eD#o%W3J7!X9uU%{N0kD>&p
z$k+Bu)1!@SBo-@SE}kP6&2^59l_}=*mz|^P(I1&kg%j8=q64P@OkeUC_A`4Q7f+#M
z*(vExCA^Km*|Fpup-}d|n}Rt6*d^VM<ZzdZ;`-+0DI1_Bm!P!Cm^j@K^<Ld{J2yE~
zn7Ed2DOL)Tx_X>y1qI-I9F=7nEx$e_+YO}eABeWbocKtlS1`#x*-xUSyVH_L8I+4E
z+uJ9tZyx1ZJ5ko_Q7XdBh_Bgya}HdTuJ;TE;@HHCUOseOfrY8!WalQA6!y~x)Q|S2
zQjXe9U9W(Bh*H=-@aoo4Xn=_y4N=>ogDt$<RtA`wC!bt;8<u>iuR{dp2;m(eIItd>
zwW6)6AP;GM=&b~+l)_inJjVjU-%Dch$wYB`Q@BSUX&woqJ2Vs{A5w;FN~@1>7uQi=
zAn=%OAeWRSRE;)=X{n{6I9B>+?s%I%x$QDFPjp*tOmNV1AO8LI@R!&Tsk=a^>{QMR
zB;TqqKHtz6R}`GkaFM)tfQb6>Afw;GNz`b-K7NG8&=f?v{y@3&AzfAjZkGc$J3R~8
z$Rj08j(!+HF@E;jefQC+i}%AMuj)dOn6A2_9+Jb#YDZp2Q8lB&c=!Xd0AZF3O)=eO
z&RxiMb}~JN_In6A-qRsj$Y-3|VcF+I0J<af*Ob2aErk1DGrh2=k#>#|`@=7Y@pQeu
zi2Cc^o;H4>qd@nBvVD88V4i#hX3W$~XsG9Ec%$}dMM^C|RAQK0J(}|Li12=bhRiVf
z8E_7CU@Sy0udAVdRwrsdP7Z}9yu_iF6K?Bl7Ef*<Y#G8S8{j4;rQU4riy>-ui+Xl*
zEaxRLeiiDWeDJ2u_b8|Md1sR-E_ZDS{hO{097~f!eAdHS_ED4|N5|P&fg^trjbSaF
zlf}o%%A0;X{8_@vQPfwjL_R<rs22@;_ODKX5mF>>gXO*=QBESmxWNc}5eA}ST#5u_
z!R*3i6^%Gaw!&H_!Dxw|zo_Hpb5}!+sukf}$~VWs1NdD2`T2wF*24n*e!_*{F87p$
zhlkvhhfS1k3NGD*En`wjYfgWn=i3;*EI!(xR0Bthxt3vi`W(SNNU($qX?_3pc|#e_
zgtL^c<9hq1T(D$Rkz`x^i9;<zY@6gf@m)tQ9qKO0gyr@GD#m!VVcIv6N#EL&5HF<n
zU9ziC%j6!b>gH@W-5mQro+e3jq$x<TG`dxoJI<95nd)rE*VGWtNT%QK$O`KiZ}_y-
znsb_q$#1qBF20L+&y|Jf$m^5J@541t+fU0*_ViF|j9r}Bf1f$hQG}8zw!k$u86pR#
za6BD;J^lE`GF}>1=R*bQG6bfvJ3@34fIkV@&KJZoImW_klvk6kiten+(%n_Z^h%Ph
zsqCz&mwwdN`KV92cBHd*=BE_JH_~<QI_thj*MIA*M@ctebu|#lG*Wf_NKxeMY7&rX
zmgs6$kZDotYPl`*#N?+GMVGEtZ<)6HU2S19?a^KBNirQ-Kcy&Ec6HXvbhV+ny82|g
zN4mOaWO|mndfv$N{zy@j>HF5zhmz^X>h33!9iZwSV3Hl=>>d=59g^rCQjmSB*8TLh
z>@$<@XEw6KF5Sc4vLpAqN5W)Bqq|3wWXH0)$BJafE4#<*WhdIYC;DV3N4h6xWT%$9
zr{2g;zw4g<B0KY~dj=&ti`6qrBsWLZGsh%1&)G9CAh#gVvyfLP5i!WIjxH|Svv>iP
zn;mlSK&MuRF9%&QR1G>fUM*%_0T~gr>S$C|=;G~ga?1e*-EbaVCHjC6=2IZM51jlJ
z8h>`r8!WKw-5&CGH1V<!rlW9$QRT%8giw13vkGDzG4K{8x7}965{&BMc?Bmwf;$`y
zP^hC(ODetX>Ukb^#bGG_KJLx7CY)9U_#p_P0R6tKsmOH-6!%f22|%pJg}(n5dN>!p
z>>bWJ+pEz2{bO^l1AdqQcKGsguM-R?xdn8D^c^{1O2dZaC8K2Nl|^3xkD{@pAbqC>
z3V{&{3Qv*WhLjxx`cBi7PomY%FNTi$P>z#fj+P2XX$aY;W8W^6QNRcVI1q<YG=SJn
zDH4xH{O&2Sy$X_y+qflw#NlQFoz%UfQxZq@6jqH)(J@_XdhV82mO?v8spL5#<pGEH
zwPH(k^q<dKVBfq|1>bdi>A0dcuIXdwc#`^J<}E|6h>i1IRt!|0dVUD5bop4ho2sQg
z?wK;}()x>Vb=TL5-x`Z1gT56OwggdmTlWN=og80K`PdF1a0Jp#u<5A9&?B`o2A@?*
zaECxMoTzWz%7NDi%iu3^^73<gC9Zv7-7V!&ORQ7xXnx5x{K!n%>l4p*>_a6>$DL-$
z)>`w3K`fSpO?Bc0;Y-=!3}1madxHzrf15eI{|)<ghJ>J3@I3HV+9L%Y6Of&Oss*!D
z&N|52=vhD-&-wSybHevL$UNdpFc>}JA4W2nLuu5rFHb&v=>v?Fu+v7=y;lWeqfOTI
zX+t|)iU}2DcX=FaU#Mimze-i4Y5UM%%ifZ%PF6%=;k<vQTscoSS}iH;_`aONA~;0>
zC4Pj(Xeo{pDZV~=>lWBsX^)NXEl9~tk<DU4UxgUst(u1UC{ClI(J(!Bo~{y_S{;b$
zRdl9x|7yg|uw6Z;G=~O~g)aH4OR`xA21EL+5--m-4|nMuMBLTWygkAIkngSJM#~S5
zC66M))i^ZpN^q1*o%OeCwV|b&xK;86+=jV^uJ~f4<^8ivdQSQng@<JT<#|h&w~NIp
zE~P5qYG>bwz9nZC-^B`$n{fpLXU3q~ci7R0X-@JJBV5az+-fDx#jm$GCTfF)HM7eg
zOC~w6DK&!JL`D5&Ga5gSy2{-Y4KuF24FW@yG6rMzdN_eR^+p7qd3wc6S-&AT09xWm
z7Jl#L)0EctqS%>MS9_;~VWolibd~MvYKE%VvUr8r<Y-unp*MF*w?=d`HJk#vOW4-J
zZ;*32p^H#P<i{f!I-%S#$AO~WDrw>LKA(4$87uqu)mmgeBP){hRXAQahO*^R<Oy?h
zeTr53yq<s?SXS}!z4;xEWJ)o^6t$G%OA?9d5OV|ueKW5t)x?zLA(rdIs{yS9IhnNg
ziBK)iRi@YU%r1+;25Tm<+Utt3rUr}q!}{hF@(jn%jcf{zmzc+mD`aSSH5o1G_cjR?
zxdM@enGGc3ClOoR?`x=NOmsPXRgU!^qx2bfzEp1(8C%yyg=Stz!6%KSDxS3#WpjoZ
zA`!vfb>pdRStoWvbM@uL;Y}fw?{EUEMtqfv3(Ah8E$_cOb_pqfzWHkFC^PXXf$z33
zW?rW%UdF3vA6_BL(ca}A&NVEJ@1rBZpg}r2pU?ab3ziC!@5necFc8in1s_aTl&E@%
zqlCz{x}m-p9uPuX18&4E+{UzOJ`QGmJG>aJC%l66b9ALVgz5Rw)!7sWG3th;#~&km
z;4M+OdY1T<PpWR@2=b|ZZ%?jo2V>`8M^HNBF_J&rC73Q#6TR@eMKh{MSfql_<s`dF
zel?dpR|PT)7QqyMMWI@vB4`!6`4&Y&Wgr`lFA!v(j($Uu9peqeHzMC5(O{e<gRj~#
zQkZ<3OT+AzL7_fav<zp?cQ-r7qm=6YX{Ht|hS>KRE+@05uBg|&NcP?`<gBLAjjP59
zYeGk+ulxE9HR|LxxNP2dELb-@NVUVX7C5$IhQ+_!p>Ql2mvc!=BEQ^dfvVRUJQb}F
zV%($?8Ba0C4BQm^7Lx~mIuY<e$<`-zkf>sGlVcFT#e$)v&OJGiyK<!V8hRh&@xhL2
z##2lMM`3|_$FK31n#G6b{YiJCNHdrz_S7}Z=RaSk2G0@S<h2^ZP+eD|xT@J!)Wu*Y
zxQWN@wHqxGwwGi(?14xd+tc}k3amF3N;8)2S*GB!6R#JGs@8GZfx`5oLbLhEMPI2o
zv=hh1n~7D0P`k+o3`MF8G@DC2&@y&vA}T*0iod_B;y%uz9u{1KFO-5F!V-WX$i*wC
z>sdqIEiPP`onV@MN84Q~s(ob&^l<Ar)NFW3AUT)3IcM>sv(##eZWVe<$r?y%OObFz
zah$pn7lU7^t0f}%J?>ZDD%uNhbz4oOh)%8Mi&Cf6(i1&gHU5}egQvzttx<S&{20F1
zQ>c$7#Y7z5sxfElV-Fw&tW9(y^a5mPG&0DzOav)p=`@q~j7@yJkE3p7yUjFmDZwx8
z;%En{6+=6i$$LpgeVI1RQI_Ck5^Mcuf#e(ILD_n)5E|y13MU#n!B|pt90wO}OFKLp
z>LE;S1Q-gB(^;=0PLIKqG_<S!hO^D`E%~vkAz!Kt<<>J?q!7SFE7|E~`!IUWf$~X;
zL#})TlSJKU;-|aB4<O}W{wQ^U0Ar?FN9u9C%&+OHuCp!v=#;f<PmRur6GE-f5Qfu&
zz{O;>t5}*TSL4H6l%uXmA`f{pNF<LpK2C<Kg4m_>u<-1ai^7{{Q{JKRg5<npQ<pSz
zNaLeYnt~m=Sc>@+O82rIPBI?ij=7wrqY9}tSHq}MvC*$bRT@@q21U8H`?Df7W@~OH
zeY8uBna8!RR_+#WP}f!CrQ^E5HFq1-OV&%`durLu$@Wx^OmDPD8{umnE(&xnIZAf5
zUICcm;y;FAzp#C#6k#iPG&%f$6<fTU($lYqZf#E<TXhW*r|YwU3+TaarD*aDzl)#g
zRUDoy!uA=iJ0Sd?^0XhP*FDxes^FUtKgDOC3Wp;&UgAE1^tlhlIpq<dSIk&<qFz)B
z9Gfu_0CaBWPfm<fTI@+4k^jiiBpiUaQK_dapF^7<Y<NkH=iLr@y|x&RqTf|CIU2wa
zmUX0fyXs^*xqseIbL%4z->N58yI(g-l(B`0upEOT@g|18|MW1x4;b}vjoM=tV^Upl
zWc0ZYem)FNii*}aw_n-9HqbWR4P3r>EuwXo?Xf$;OE=PRR)gv8J|g*BiWV1JGkA{P
z!7-9rkh&?6Ry@NJeAchZZ0;A|<PdoyJp-NZ5^X<E>uW_gr|g&%t6Og$<4Ge^^_x4s
zZF5!J<X_k0wY&9-=N?u1r3TJz+C>J1mL(KsSE|rwi!|x11o64d;OuL7Kgc(P2AmqD
z$=WO7h*=q*Y*3+2jnwqIdM<F~^^|GaDWe^+?(>oMDbe`A({b<E?HurE`#ePZ7HM4~
z+@Gix9!FWmqRMxJ)==pjux~KDg<JFKTpxLL-hbu8LjC}b*PnDLo(z=H)vX|q_zV*#
zWfiF@^+Iv53ODg;CNf)3Lam`CVz1WuN71+^u@6s6$R=-ggTh5tfJYpgxa|PM*BwHZ
zStj)ceCu!~VUG6fDPR#X?n6P{Q~r@@4{*LN0(TIXKxwpLU(*AhIii-STNig?7Jr7A
zU_qB)IhkN}mf#IB;im5OuJ!f8B;glgqC;JxZ^=X#vqUIjVxS)Jj}*l@Vj>a}GCdNi
z6cV~Q5+)K-Ry|VA6jI(fQUMY&5j`@A6f&7PG6fQHWj%7W6mrcu^4la726_}GDHIlS
z6gDK34tkU>*Dt~xrT0%MiuY5fg662gNT?Bd)X^!_adXs3Bs6JyG+8M$dH+s|;=5Uf
z&wAj`dQ4Y}Ob01U7Y9t=gun-lOl!<c7)@ZTc`(I1Q*H?jr7$yDDl@w<3z{#O$d`$m
z6wE-%f~L<ZGS9+G%B)7pra{UiMaqgJ%qHi{t~t+Sq0g>857zt2Dl^aSDa>J$%C0TU
zPB70v-$e5um6?;2BZQPAvWdgxD|2)cSB@{I|5pwJQf`bUMt=fOoiE9yB4!;a$g!V^
z63(j#ptxk_%j##E1oP!FGYrn-U)tde3Nz?3^ELbO*3a_}r1Fk5@u9{@d7q^6ei7z7
zPUW2<<?qnve=*O$p?{+z^#<xIFECA@ex8qJLEzI@p+jL|MVR1%FMmf9|C?0aP2U^5
z&AbAKJQxPTtj$9FWCFKEL?jjjWe#~1420C0Z)i4)J^Lzl*2M2k2D-EpvJ&A#6A}N`
zBv>!Zkc%dyc*q0y6OCRFH6fE=UXYaXlX6cJ_D++G^b-tB6AcrQ^e2<{I~43XlvD&u
z)u-_mqzRAs$vv9qQ3PY2Kp0}cn4i<IpEHwvK9m<xWH=SU?1nI$03c2SG=OyZ9ss1k
zPT?#~{u7zPF&X44O#ulZe7=F{1;eIQWN3h4%ah|hS0tA|Qbwtk$ZH%a(ZN-aV5)pO
zRVhP4<L5Lt(^aIND=QkRm^@c8IZ_h2t1OeQqMUwH^GHQORMn(K)y9y)K3&DdP{TVN
zJHk*c?zxhXp|Yo_x?j4=eR9=BMO6(^4fnemPIuMA$ZwV3)vRt&^9E>Y7-}N#s?HrL
z4?S1!F}&%gsF8D|{N_k)(@-U(Mf+j;?T!|mzPmbBhFZtz*!hN9Gk0|tpWgzCDX66@
zaJMM2rz;SULom`IXA3lrXo`!9if3d7U()2!L>0a@OKpfO*Xc7@Qy4oK8M|Z{yDu7h
zQ<(S}ncUAX30gD>qcBAnnMP-r#x0sAQJAF}nPn}Sm}D5CydTpz!p$l(%pWb9*Hc(D
z8(FkvSadB~EDo3zJy|L}wwPG7obiWr=wnRw(}ym~XOV;Q?Tn|;Kp=ACZxE~PVyifR
zEU#jD2Y}U&6h(2<AtOtdDI=U8DT<~Ci})wDSde~&5DIL7G2vT(>knea0w;C}0MKN=
z>BXWZ0o?97MG<2OZ)x4uli%+4b&8_6@qrlCb45z|Oy>j$hJC*R^F18<ei~XdY(rZt
zm?8rYrS<j`gKz!xyNlK~$M(o2daq*8OEK3~3hK^cj7%7Gae&yX7^53Z_Z&`#{T$!E
z-=+tG(|&?^QjFmRF&`1fOb6g)0-Uc?6yg3(C^JgX=S*)ZN}Fw4A{YQ9nU1}3B)^Ep
z5AVmzSHx)OCl+0T3M|pU&_E3Uei68<1SP0-2@e9M;ac`(r&NAtfZ^3oPm2bMFTVcK
zQ*RkhdfA3m!k;P2%ZlpW1?7D|Dr00n-yx;lH{<(=Ws8Gj9;1G|ml<@z19*nTAmaOe
zHexjR8~h8#_X;-b(b}v<sEmtFjAW>&>!@scV7?mSG=rJg6~+v*nRMw8jLcS${jz;g
z8wL!*kZ$WXRdP4dB+PEfHe`8mso3?K39OpJ#>viRae&?tg0ThhDafLGjz;}@nb;8a
zU~`#9dKquBAD>n+sNf`Uk=cF<4S^DCCvnSkgriYUGDBC7`J2&PNF>7^Q7P|z3(gV`
z!=jGHX$`x|TEJ}r`%%Ya7&$vE(uk5#+h5;6G=3&ia)>QauB5^v2{H(T@Py1y>|T(<
zJ)+lNl`7j~{g>!pij#SPF(=^;1SOzdD*r~R(4>1&3yXLS0MMma%!gBp``OVHk7+0e
zB!-0f4i^%EG^Pjs?skj#w~9eAwtiXHBfV{&tKY2Hm+7~%{X0q!8^=5r{rHRlsrC9e
z*`_|;#T3LVc(<;%N5C}Cnd!DxJg&r2g-$Scv*<F5LFr)3dyr&58jAzTq$@s&dQu3Y
z!^uA<J8Uu4Q;d$V-FRvPjta}jae9(tcbwxOmV0NBxVu=DyFI(j%&Y*7=t1CII$8Ds
zm~wa^e}<-D#4fudr=UZMN{a?`t6ya`rx5YPS(PRqg)fRI&R=*@G!<Cz!L0a`B%OH)
z#o)bSGINt5eW$~~8AvnfceB#PK<{!2=PYr$RA!pY%!e{BA1ct6DVvw6<(5q`U-Kem
z2Il1^xn;L=%WY^YOkS2d<W{(!KNNdeVIXbn*ZI&zx=eG4CZ>&)&5xNudg`?>=6PW0
zl@#`{T~$wiskX5-g_%f^bPc>yo_(Rl>R!#0PV4$yyDnNO5jb|gbZxUahA~x5hxDWC
zTAGb<Z5}O6a{K)R^GOuMuln#o6+F<MqE&GMjiwbqlb_4$pK14_ycSfy-CU1D*@%(X
zaCYACg{*-&h&~*U4P0sDzAn41Hc*{3VqG+ebU7+t<iDc@(Y~xJ*UHb3u4kvE;X!Lo
z+X$aJx2UAfwhE%R4{CL{u)Sj;@1NHux7-G#Y)_Leh|X(We%X#^(e8A?Q?Oxxb<%ES
z(Gf>y^+=|pM8>-EqOIVf$YFyA;rryF2QTaS6B|03@j!pz^VVh~%EbFs2tW@iuxF&C
zCuh}SbCrIltM}@x_wb^pF{AG)s1#@^f81q(M-SQ!s^&!_+NT4(?zG&LVZeXY`$A>_
z>(ZR&)c_~$Ac{SIuy1it$g(v0CGUjHkh!A#!s@dr8XCb19;sk+BMOi`8jXrYj}tuz
zns4SwKjJT2?~u<M5^M&S9kI$Eb?LT9u^c_5CBn6^?pPdK2pS9O9!ohLPJ8w2A$@jb
zu*IX`Q6U*#qszfo{WhE6QKv3??7Md!8(H6x!DO+Vvdf=Zqo1r4n;z+y{v?b2QWkQU
zZ}!bney@8vkZ$%(w>eJ8^hI!+lMLp(VqikPDb3of4gK5!{q%9#%td}1Ysh^4;`}20
zv#D2uuQqrXdZydJ%@|jvn{*&^=3$h@;s|_^?A2ld#gfz2ko#J`x7=)w|FX;4@(j%i
zg_T)!&oatAq~S^M)3hGHz=9=)s};W<(~OXpav}8j1@mDPt8yXT+69CCU+3dOsvQ)E
zrxYnW<xCVac$?Rj=dO4b3)b!|uGN#icDH(+7O<9b{8|zG#wg^?-rAcd^y^b{9X;Kp
zX~%DXy)#(7Z*11q8D1|?6gty{z71ix{?5D-b0;8V+;|+^Kp_R8GiFHL;AsPIeG1wl
zd$py<2r>-aPV3s%3^m;&+i?orx!tuRc42Zye)~RSfrCuxCxd}7v8vm>vyqI$LEpC#
zg?mgryK6zFX^h)+JuA_<n=*{etzX9;$`^F3x}+2aboEyc$bWPS{um-wRX_icTYl@=
z>zCe7KA{xXKg}@~Y!`l9`~LCZdww8&atOteLn!@x{@!unr-|M#SD`KS!uvt~`$n(#
z85n48rF{^a_&|dyatgwmFTqQEZR~!+b7ppUD32|TI^?!Gq6_{yS9mDLbmZ=TtkHKg
zb#`nJX5!L!Jitg(+Ko4FM-=?p7{1!1i8^s8GWPE~v3vCmZgc9MaoYEKnOEVN08_Jm
z$Qi1mVUO(G0YaI}j2WwNF%x(Z{pMo8=5nN{bUW?B)nB1c;j%pJY@+XCL*Xh*VNB$r
zXSHy7BIFVcJ))mF=sAsSfS>`s*_6G9qWF!{r$};M^X`~C^ujT~o>8Tk*%yq&kCQP5
z(uAB)x8UE+JA-jVDkgJ8-CuSiMJlHYWP{ExaYU<TOH|@$<zhvv_4Cn<q(gE^%*w%F
z`|PyigLQSdV)273X+0jJN2VlR7;_Z0FDvaISx>p`d%S#dSE!X8&!pg0XRv?{L)EmI
zx&XRj@y9sRO`C3Kycz9R-@F(5uX|QemMPowQ~5GM-|?kecIV18^QK>r`&m^t4nK?8
za7q$!vE;4RnS3ec@uFq!W$&8Aw+}1L?m!~z>SLeR!%2s#QI+}~+t;#0@NRzH{@Sw;
z7aN9<^Uv>>nM0R@rF+hgKdyF#5h;A1dj6)5WmUg@LQ;0;L;bKoa_HsRH+mQtdxZ(^
zwuZ`j6N<xwov9J&DKza(d=m-|r>bM$@TcI3DGX*wRJTWR6vnVXk36$eO(~n&*9`>*
zp+)hczR=ACH*E@Kcj*V)Z<A~fc3ES<WigJaw{DC%roDg6<(RIoqv4ccY>nIwRFfWa
z%CZi{smRiG)^N^oE<`%#y46tFXM6SHxa9l#itps!dyRA{eDE2^EYI&d4zxHN-JG*1
ziZK>i8f(4xt~gO1*R_m|vJ+aKX&viY;o-&YT3Hy1``#tp?Uq}0MPaAQ!;-pjw?}p3
zqC7QC)3@9oOVpgZ)pdTBhSs)z$Mt9!tc&EWA7+fJP3t9`@MxaKwD4$}*U{t;o{&ey
zdA7bZr}cdDIux(YW!X#9t7E6)g=hQwx{12mn}vAZ-Cy5ldv%?>j`P<1GCkql_x-i8
zcP~1T<)>a0W4zCx4u+P`5a9>6hC$NX`GP}4Ht~&>BnFdrM)u9~?~JmL;f9ZJ6j=&Y
zver+2eMt8Z-*56s_$%Kjan7@*$($V$MUaQ3qsEMx>0Lz-xrcHJ28n5LbF=6heE;WP
zw_mlCn*jh25~@aK0N{qHC;$N55=vpWBhnRXzO6ZRZ?#gdptaP*rN@88#)MoPpry%%
zz62d1cs%Y!q;neN0}S1LWp42_YR&dyO-p5U>q_EnYn@fVPA-*y`*skIb=z`M9O~*&
z5~ln4Y&+b0`oV`h|3c})Vv*01ukC@viYk=0{P#Y#*nfVoKR9IG^rd;)T5q#-^|OTF
z)Ye+pK^3|}@bTc#jgZ_?gR;vt^6fQ$k_58#`zMw9-XZ6C4&J>vtGAzDZBj<`KtKSt
z2FTGT_t@U^??ltRS5A8&q{yOAvJkY!$j4Y`kMaQmi+v~!K{vGE;tXtR5@0A1fN>PK
z?KlU)v*!sX<FlLK;Tq(&^P#8BS6`78l&Y1orDxW%D_4gO(nsM(ij&XdT5zRMB@O|B
z#Qn2wD?=(9y3ty9sfp489(L&UV;Gj%@1;}0dCc$7E4_-MVhvZ}qIE-R^PwDi3%PDm
zP9@y$Ud{Wu67%F0P6~^i*2BV4=&)=PUc$YI*~RM(R0wW=0xmuqm|HLr2!Mbn?f}3S
zqnxtu@1(wY%gQEzl+@7oO`C6G<4|}Zs_pBW-u;!0>o!tYFV#1rPMDp?W=zPa$v3mu
zmz~c$N7($muWjqoa)Ar>2`k)YlV=y@LaS7hc07JMJ+c)dV;Pf9w-&Ugf-A&|D5hN9
znl%@@D<mQ_raWW)G}bOFq+D7%@6`AiZOc~5%w$dbk2f293a*qBp_mSQFCu^3U8z8o
zF%yEDE_ZcVsW?JC1LqOd!H}y`J|Lfsyk#g#5K^T&mobZUOV_06sZv9Yk<TT>8gesS
zRcSmTpHHbt_j@K=tr?v$pD|9(#U4_v?Ml9o^ZqWUSWoqB=JbUE+(iz#t7^R`qR-1>
ztE$vIdHRKGo>!$_*G(Vu*oX5hR*eHdL`^j&-y-mdN5PLAwP#2nx@Gk>Vz(Os1Ek})
zCiD5n!tReh<n9B)RiFCT7rSC$b2%>eS0H&FuRpSr+Dxp$zSrnH_}<RxfpNd^y(YuK
z544PNFUmw8@>rGEy4bNLJ3HQMxoI|JqY!6KtGC@$=J{Bc)IIz8xUpgeag2;*oJFyR
zIHpMMV{f4aW8xU`wx^%QSU^h4Z+Nl<0@yX~6iuXUma;#dcznZ9+7M;B>n6dO_jsJL
z%6)C$I6|>xtuFA+Tf)5u5>k!O`k)`#yW{tJj~>^De2IH=`Tl<2<)`{E6y7=j?|NkP
zMgyEEejS9@PMXoLjE_6?^6=IQ$7j<aGd#owzI(tB{pW^g1^l<faRE=+ZZslq$G;_i
z6!47Ct1-?7f0KG5U>H4RfYwW9gZ|A^hQ|&2q@nm*V7$Ol70f0`3~Y;yH*idgBODTo
zzs;rDF{<X(l#zA0#qAzAp;Y%Zqc7j-Mx4~R_4ltCL$W)fbTlAmagp3b{CDi>01!Js
zDKDoR2(JQ9`xN>WeCghjMcB^RTMyAv3RyDno_m6c@zog#T>Vj_EM@4(mU0r(xmz~p
z^JmYGD)<Yu;gaVINrj?@5(XPJ@wv|{LO($D84yNcor`gG{;93B?)r#`rT8VWG7$oF
z8->n=1WIuwEje1tiQL88@&vV646fE`J1;sjTOZe3vAA8ld|6JSt{DHAkhAFAe*m*h
z@oTk*kKd}u%es5b3kzPF^%kNBi6>o+3ErfO7O%g_Yv1qt<bH?qK@Awt-tf#SH^k<_
z>yP4|bvd7mPq;3@_?2x#CE5p}?}9cDa!wn?K6`s(b$2rhv^QdS(I$PN-73-RP~?&S
z6t^n#mNZMM%x?N1e`s|_<i3B<cWt-yM_9X^ln=%Or@eD!=ums*&S%p`Yj?|+>EH8a
zbxzm6E<|p2i>kD>%thb$dOPfD*YL~Pb0$XrqCU>o7D<6G*gxH^ohbMSooQcOTR2ur
zV))3>cl3HM@t_sq{3iT%`xGAP{m@9r=lI)~t0cE`yP3AW1WQP&a}k}k3`Kv6Q|J-_
ze>pWp^d6Mmj%`&_pdEAQ{hDkYvh%6#-nabTLo*3aJ9~j5!#BN0-C>=(uBgL?=)5f!
zeYpdP`qQq7?{BLlWcMrUE?;Y+L^{Jl_q9JiIJql#(TnOn9_tNaGYY8XrbQjid^y=o
ztLloRIXzdM4mmcoxpHrl`+PgX;oxByijuQ0b>&Ma`(WruCCdB6B-DL9?6ML@mL8_r
zWQGQ10dR$4XR{Hs!>D55(g(0x_HdeAI1_d_GgmmPdN?~YoHHhzyDFS_G@O4oTmTy(
z#Dx%1M~FcY5-|v=s_XD4gxoGd0XssGD?(X4LKPaJ789XS6`?sAp}iY%8#_{uE7Cwc
z(g+%95))}w6=^XVX|)?^gB@kZ73H8F<phm#iHUNpigF)~^4yK`#*V(j744@U?GKH<
z9}^u|6&*Ah9kLr8h8+Xvib1HyL_%YtV`7k1F>#|Y3A-^#*vJ$vWSTlM1B%RwLFQB;
z^G1;cyT~H!*b=VThw8EA(AdhD*y^g-N29TicTutR*l~?qan0&+PoQyaF>xJLab2Tv
zJ-cyz*zp5g@k8qI&!F)mG4W$n@e`x*Q@imq*a>r72@C28i_nDSn1mNq39F+CYr6?=
zuoE}95;xTox1oveViNbN5<gsbKXwzpU?&}LB^|0K9Yd48#U!0oC0&drUF{~Ju#?fa
zlYtt^7_P}!$Yh-AWW2Ftg1uxSoD>r76f%tz3fB}WWC~4n3f))=!(Iv#PAW5ZDyv2+
zyK5>ZGL^eJm3J(ae=k)4CryYuO++J2%r#8{nI=`8CNq{Mx0j}Xldi~}uB>t0Ye`o_
zrfXEEYmTLB@1@_y$<X7@Fwn>_a?LP7zRxhL&afEE__6ValWE7D>7bG6<eKS%%yg~J
zbRWy~+{^UF$-2Xx<)@M5@0xWVnH5-_6*QI=vX>QxlMUz2MrdS5x@Jcsvys)=abwvD
zd)Y}iIVs#ZX&N~ht~puAoSf>Mys?~uy__PP+!F5GhZ?!%uDO-S-0JGwM`O8<_j2oT
z@*27Gnl<vCxaPGX^E#^Yy2kQ)_VW60@&~x{hcxn^x#o``^T(?5C&u!p_VQ<N3g);A
z7BmVLT?>|x1uv=#R>um~_6pwM6mD=AZfX>6yB5Af7VcFSei$qKv{(2Ar|4iW5e*H%
zd<Mb+{eOr5Q2ZtTG5;UsKUR`$TvN1{Q|$id_>Z?0q5qrw#~-pkehdCspX|GaKi*FF
z|0(-pe|hx(=Ra24d^X1mG~4Rdx&jX0uT8Yozv+Vk@ffw*8#abw$at+M+Z#7Wl36ti
zwK|%%C$dG{Ur%;4zndvmj$_pBY}s3=GPpi+cRu;B+~6=#sNL22X|>(&!|SQ8wl8mf
z9I$n|+YdHJ(|B#B{{;VW{C_+DL9Ttxe~|s)KgfRY9}B<cKW6`1{sR)P-t_zY$I0LE
zAJ6|O|FQCe|G0_3`N4lA{x|%G2i{-!k2=GTzv4f3|BnAy_<jB(`3L_|{cHXM$=mcZ
z|AG7q|1tBQ;XlTI$$u38mH+VkL;Oc8pym(oABdm%51C)^A1nXGe{fy%AK+i{AL+l~
zKOq0Wf5iSt{=@Ni`H$G&<3Ch>oBtsEXZ(lyZ}K1g|BV0W|6TqA{5Sq%?_c9TJpKg#
zk@4U1A1D6{{0Hkl@E;q0nE#;vcleK^KgoaS|IB|3{ollYz@n`GIsY;6oBT)rzr=qK
z|KL9){?q&i$uIej_FwQH#J|gb%>T@P#Qcr_NX7U~{sT+M<InORPyd1cnEf07@!)6v
zBl*|-$Lv4wACN!7f5iSC|Izfn%zxPaFY+H7|HXey{|5g7{<rv#R`9R*kGem`f6V=j
z|0w&J|Cs(G{Kxvg#DB2<%zw=N`~1h;Py9#EpX5J!e#w8#{>*=j|3Us^{x|rK)<4gG
z%>8NpgXB-}A9H_%|2V||ng95T|Ihi4jsF?`gZKyk(ep3xA3gsa|6%(x|IzbT{-b9$
zv+0`unEfmNQS*cU==>%BQTzw^kA1wObG)DVk8}M0mj77zHUFXcYyM;D-{(KB13Z7?
zKkEJ<|55U<@E<*YfdA<Ev-}4P^O|}2JN~0@U#ssA@gLWU-#_plP5&PMG4m7uQTJE=
zqv=1(fAIWa{sZy{_>Z1H%zrfflK+7HNBIwrzvn;Z{(=8!`eXbD^pEo&bN|SH(ErEy
zkEZ`~_>Y?3;y;@H2>+q}8~jJzf0q9s{+a)1{U7B&+<(b`*#92?0sTLW{}}&G{sZzK
z;y>p8=lPGOKf-@_{vXSK-2F%XgXDMl55eE%Kdj}2#{ReY51ha8AKlQO_>bHF692LH
z;wSzi^#5-D!}4F`Kbo%jkC^|r_>YW8ax=%D_>Z7}!haM&OMmbmj>w<*k0Y9YhySRD
z{!j8B`v08&;QE>WDE$xdAIJEA$A8THF8{&xga3fff=!8!NrbrXHNXkIqLNrw-eQUD
zMsg^z5Qak?aQSvs1<v6E0+TQzv`qw=XE8oloZZ9nEps_}Kq6$TP9--viBM%_*xVmM
z5s*)ceee(|Q>aV{WKqUBJLQvO^wkKJ#RBVzs-IEor^v}Fp3HNl-<MUPtFe2EW4e*V
z`ZNE*^H=`Ekp1DW_z$ta@*h6e{D*LInq}F_PF1eUpW{ECrWOCpe;EDDe+XlVzTX5b
z)U0FJ6;Hc<^uu(R4ObhbNpBeYlJ|nGgin2UDpGil#vle7Ux?PHAgEJ9k-?=Z6<Zn?
ztNoB^(TbgDJng>e2F^R57{bK$qzAPk>4(obIh>O@DTA5QL35l6{OZK`H6jw<v*CQW
z5A=&2BNExxQaC<RgJpz`YRYpf_|T8~s+}{mjCyK}oyfta%*Pz(ry%-TFn+Wa8s-P}
z#5N_VD2m!mtc;c++_!UaWLyrF-*;UV2bYL~*IBE+OAhG9JuqxMVUr?0=9$TSzlc(`
z7kf19z~`vQ^P*aRsfp*o3=x?-nNU9PF#&UwdsG8@cEfylp6r07oDdOpc4h(Da~F3U
zQX<Os9dfl%13S2%DI)Zm|5&}|Khl4b|9E@Ne>nUu|B+(;Oa7y+v}GSn;I8P;{0GT@
z!+#Y1;6LvF7yqIBGyh>%&G8%j2jGwMA5Z>~|8V{l|55fE{71=8{D<Zb{$o`5XZ|Dl
z@A!|#zwsaWzve&K|BnAq{w4q6`h)*a{tN$+e$9U{|2_W^{=57~;$QfW_}}F}^8Y0N
zk?%l_M-4zn2S7=mb*QueAQ>9u=(tC;=<)ynfG~N}h_8P`3am#FEDuBP&j$jsVL(7A
zAyY5_K)!woHjKEF;P+}%J^+H`+7I{B1!Ir{`T=0T)(`%J?d?-E%zgkM7|^ps4M2Qa
z`y4g3%4`fRcnvi8()DPc6woh@gbKopi&#fU)t*YRrJyyWsV}%%iy(c`0JNrbfU_MC
zK(_FMqmL3cAq++wVS5;p)U86a4nPLndDo!OPy4p2A9RcDkTe8_R&fs%^(;v4j=_HE
z=f-aWqyQh}L?wi7n)<6mRAV5iqAb2F5q!@kgk>)6^^ws|=kkEgJ%WhWTa85_pZpR4
z1c00wM!69TQR36c&b--oFvOd^5c^ZIh10GZDd_q>rFcFt(m4Poq+R<_w;%TP;3PWQ
zb%!<pj;@~K#+t&V+fxbzpvK|oALR&%8_K)nEM>67WDtJPaNv3$*@hGp(fIm8)*S$&
z*M&G3K+qjv=%esEapEfml8FnQXc0}Md-9}bohv|LR{%g|9YO?xfk3dQc@QRQ*yRw%
z*=CcWI>v=Eet+H|K)BPEm1IVSWQjG!MG$_S4Ltrql=}jJ62AmsUI5TkQgF27$mXKx
zT86kJv2+12T<8$-X;e1efZr?tix>;@w41y{gw#$hHwZ!cLb7o6iCjykoun)P8?Kus
zPPQSyw5#&`kvOw#G|p-7Xj-e>M`iKLA@T-@{G%eO2FQ*4GM=)u0AlJI7%+2uuy3f(
z^eL-YoETXS07sI9KoUT@hl#%{J*Fv1Y9>h<2n3jllewY;Mh9L6^^sNglZ{<_GvR3J
zf}Q{vk2=Y#hmD#bm~9M+YFP&d_Q)t6<_zMdZF;-T0wz*f?#)69QU6U+l5h-gN-C==
z!x6%VUX3ge%|SMLT1G+(uZw6`)js!`1QLs57LJO$gB!deYz2zvj~Kn6fsOK#V0;v?
z1}iGS2JEWBF-Mih9>Oh?Z<2suYNHrnKTM2Sm>o7InoP8%APiS9(h&l3APWZuXsDI-
zmujgkf9OcYhXdC^p4W@RlW16@k^Wr(094NZF2Gt41J@RY@EeyN#i*XZaF>MPnqsK<
z!1B95Y%AistR&d#3Qy8WN=3&x?h3Y%jrz^1R7TvYmW@_h>6U=N(353cq@$Nb)RVSY
zk-=$FKIv7&QR*wBRvuca!qSiOhQojW3_-C?APij)?Yo~eU|mh@L&rl=jD-k59uNb2
zw*zfu(y_e}$xDLlnj$spq`!<Rzkd2a)Nt^}j!M>)G|=!HAPg`IaPY$n1p<KCf;z;~
z6^8;k4O7*4;wsdzLe@^|>Zw9rh<ke@dH|567N!pZJUW~z#GCdb#;T@+37YoxrUPCK
zX^l+E_@1HJA7FW&Mulf%X;X6+f+L(7v=X;eFAYn`sbL&2jR~1{(lbo+QzecK3>>i(
zM^gz>oG2X!Qul^oY8rU{0*On*te+1iiP5B;WXd&^M5#(*4x6Pu&?VczAWu&rmP@f4
zol|Rvp_|TO$d!ytl7`@BTA!j@aK#7^XRYkv@CN9Ew&N1%=UvV)>wo}<v=kb99`kk(
zEw#cuUS&W#>_f9Y1<yQ+?+$mYWF$L#Oja%s@CoTYi{QSB<5693F^j}cAlYHzW)_4I
z!=&zgz?5Fsm1EbxqNkR?pbBdrEj*1dZ#U>0T~MJYKJGM>A2-xK28)HHdC!ImnMNze
zL>s_BH&1bdM%iwa>tlR+u8b~d`i#}AzzB41s3HZ@%B?f@H?p88R<s3R*}_n)Ddavd
zyR}JbH)%&zLlzo%rC|x6Y|e$;7!!N!#sLtA3nqIR#nld|0p7F@K*Oy9&{AV6RH2v4
zMoUzolT%zHATXjUBaQ*1#@Kr6W1|OuK|pLfe?mY2q-@GRBOqMY2ng&40+Rd#0YL$M
zekdSe|Al}EmC0xqUS1<0faBWs(aj$Sh`(4${9(t#SIg{;*9Zs}w<k{CH3BlR+|yu~
z^8*0^tcs9S^RD=v8laV$GG8Mg0Y4!irKT=o)56yX2tX&h3lz5f69U4uVEY3BkzBk+
zK(3Si|AK%>E)@Me0)myWW!AlKrk#Pg_7?=C_!<ELT^!Xr{sjTyS}JCE`HFRgbmO-W
z5WK%2AZ^zO$ig)Oa`-a>Qoi;V1O$e)9a*uB@!H4&^%n)?*9ZuVS~W!?89;CelQ4y$
z(lBSO0EDnHo@+bA)D%@3$?ONqmeWWuYR3_@!p?5hmW37Zrlj#f$OgvgA@#9zFnqGk
zW(=E!5WsU8EM{z&WUvK8$&2}9i<>#uuO5!_rbW;Gs-~4t!jP%!?quOL5EKB<IP3_E
z8yb~MDdkTwFL(ts1+>XTlk4gf0d+jpF-!bb(5Tg{bpbPu9k}aKUxH!i>fJA#y22dZ
z)aJty31Hv~3<A>^XwYs_(8{6POUD2>KoUShxbB%g6~+sTeJsi33<GVpp<{Q%mSeP8
zz%o?rzw)QxP)eaPd6&qg>^6eU+Ym5*0tA{MfOMaXe)^Wd`gE)n?AjC(+EF7lgSAqu
zqgfkDz;nXaY1#Q>4BA)OGcfFDLHyJhAq~Jg?H0kiSTffGu#dMiy@1U=kzE;DsWA~Y
zvq;H6JPT~lhVQxx`-b$crcSo)%;q#bHGr^x9Jc|}KoUSmX--sONn-~?8&$qD+CX-#
zaq5~XP{V6_BG9?|DHg^psX=tsD!^I0D0Y(YAh@?AqLw_IMI1md3;P&y8+_B=)Ar3X
z8EtFZcYeFpN}n2=ETmiL0fl}5PvU602{Z-M71~<UCZG%k-<&W9iLR~9vjP*cM#U|*
z6vf>Q6gfbJjL{V2^AyY026Xx|QhWC#BWh3v%jHBzDUk$SC*G0`N96|s5-#$<kfBOF
zY2{}GB>Qg&NWW{=(oYBo^cM(7OjP#L;!|HIxorUR4+JEtS$4H;!hyinp5(}hbkDYw
zV#jayuLy{Y-Q#Nn1SS*jFXP~0?%sWkfWSO<c04~{BOoL`OXC&S2#DlcQmKt-@+~9X
z{!F}%cC7)7?w4oufF@-T=rsbOY*l^ywt@i`CL4{A7r2zOrnzIP!VqP@rA(Xl69O{2
z``OBrbO)nS2Jl^#WD~fRI?b#so`AAhH_CWT_Fo7{@-+gI-O>492#B?yTbPd*1MD+1
z_Gg2tUn3yUZIdZaT=Gri|HIy0cf}EJdxNKOcXtaO+_f7B5IkrIBv^2Fm!|RH76|Sh
zG-z;lcL=V5putH`Cr9qN&pqe4=b3qCt(i6R0;>M0RrRaA*WTZc&mRQj7KVVpu`uCP
zKA8<Yi^q}d{|^L2*m(9g0)mjj07F3FR&18{LPSY-_P$DnQAxgJR5IywU#4TUT`)Bi
zp_Yr_YeftTOclV(Du<M}A!3mRQt&BAp$4MRnj00^H2MVM4)jlqf5CHX26!qE(QU>t
ziCnK~*Z~3K<CfM@Vv$(LR-WKEpHl)fO#!)60+GW`g%IY&mB`nJ4mr_+w_u*?5Q0v6
zCiNdQsKn5>j`sYKWI-?lMA{`FoXm`cBVgk&@y!10uLuaL#%}}!%<&fl<WLPO!J6F-
znXw%)7XxA0-Ql+V4+7$doLhHlB=|;^DC{*cs8|LbumD3q;H+rHS_wv5{T=b0khdSC
ztfS7*_HFyNRVx`c)e|SX<V^6phHGuaRapX&axC8&S)vG?Z!0-jaIRNj0gB6O2|h3W
zfFU4o{S$u>5P7LU4;TU>=GIqm;9}JL2LVC69y>606jROl3j%@=61oUS>cr}huttqF
z)pFr?2SY#re?>sxE_n?Pk0cX#SX=^(T!I|!Q(|18b}Y{)=+VR)Bkc6T?C*$!0ue*@
zBj2S49XliWS=tAol01lBU2<BzgDHU<aK#*f;r6FDd)B!O#@Ued904)^q!y&WKwpf_
zOY}e_&)PU22*JBRG)J+#hoA5)7NF~6c$PqvlE7W6;E+n;gV{}hXCSI)@Owuw6qdj&
zrDm6=KMshnVy!9M)Qbaf$a*ab++Q3JZ&>Vy)H$I%Vk67}dHwoL(=tM!SoU^^(CbA5
zxj<p@mvuH04loA<Zo0i)bR4_kw*ztub3j6ke>)(7yknL&aiM1Ui)`G#9gtUH!XfY1
z?c^QUP%w@E;((<7c0izihd_Wro?$m(!G@OvsbGK7U%`K+Kq4alPJsyjodQAlO@X{*
zkfqUpQ6MoAfrL3?Xr7W-+#ztcaH^Ke2;o5h)IdaxH`jiPxYb(#IB7xvsuLkLCaGg!
zPctDLHX(3ho3d936`fiE?-igca-Wluo4czEP92wulJ<7bAT<Fa5A!u#JTXEfEMuS1
z6K(4^2(sb&R}f^A<LDnjkf1*xNNxcP1o6z2k^T*W;69OxZ{Xu0<QSC_+p+%!L2xzy
z0)j-Nz%M4p{RTmVO|j`;LeDW(-=M?OT7CZq{=<BPS@rh&@g3j6WS)E?r`<jO(QKL6
z_uK~Z`b;9e`Ma5-?FQxmJ5|gs{=V$Y)y#9J>wPQLeHmu+D~4}(!tEl={%52YZ>~gm
z7Cx8%nwML*U|JnW#Hn<M6byK3zcn@dCGmKBu|Kn(aVPof@&4wrO3^0SAi)ZO)_;Qg
zd{L-5mHxFf9O`D2>DFYowtn*@{)Wg`b>TGrdZ4+n|4>EuhF`tsYr^M4!h%NJNg{Q_
z5eetDaB%1a8@YlRv?h_l!dNb7R5I#JSWyyL+hNEka5<m=712A!q(nP8nq=)ahf886
z>LL>sx1-SgC@f7(o*ue$v&PJ1Dc^I5q}?sU2xj+NJu`|=mf#7xbIQCSR+sxb<{a?7
zsbNwGxi?GRgIkZH8M;6`OF=ySC*=e<akizr8wsOHnFR0q!$eJVQMS@7zXZk7ou&R>
z9C=TxB6t5IgqLNPKNAfqn~z#-EP{jX*{i$I6%@^k6*j`EhuBt9_+xi?(*%3X-O*U&
zIDIN>^Df@(;#8rtA%9$PC&5X!h=lPUhh<{LRf{bT_K6e90Is&5s!UaFchlu3EjwSj
zq$v)OS}^IJioDH*HpzX>q&9MkqI)ou#Lsh>4}5s~$!xyz3{cSwbM=)DZS9qKa}YS^
zEa5>lJ|wpd)}G;R<+{Vuu&iYKAY>lg;+YsGU*wyN`$fq=^*H3*?I4tIE}#9&7lLNz
zGM-;J?eb1$kih#jt9j0`Y{i?=Qa=})IkN?}Or{s*nU+O1t(7eK4kHpvG|WaO?pE@$
ziQfos2Yt=hO14xACA*F6Cah8)xgnm0lSgV?>bC^p*n-t0W4NMM(<3gTn0V1rGH1Cx
ztb#0%Pm)h@Pic~lv$ft<mr=PrXj>6I!Pv2_ynDE}ix)jO86HgIB%+Uwk<Sge@%J{y
zIz0HvT$DNt>u2<FD(e^YCxXYv!{+;OQtSET4*Vm}V{U?d#NLQAm+(YVbrRhm5VU1L
zal@I-rv2eDIKFzpa?Ce6c5Tg(-wUfeugK|S=B@@~A%3*FH--=`f}QS-z}QJM7=E)q
z2;DowglV1NRWQSlxP=irlVm`xg;gP?X#?idMQvn?$cFr1bFmz58}c)O#+=8a-phQ&
zW|k*m`CIFBojoAQdNqnIVKA1$BH3rRJ=7l*J!s4FQDjjdj5jPelD%gUKcoBo$5E*W
zY{C2j8G*hWa5;^yX<y)ZzeKT99~XM$f!vbS#O8{8!p_R=0pZuig>sOeyxSYtIkQp?
z7G9!<*2iT0oTRa(gkXv0WBurY6W6*Lz%iN(ef1f_#}^kuGU9^Gn-GfAHw7So@=x`@
zx_;@N4#<?+StNTtn!}eTj)*C0iXbWH96vn;#>DYz%VpKHAGI|f@J!|3@A}LqnUN?_
zp{^|D2XX1mC32EGz_HLW&0yXzpztQc@mtJI`0O~&s!7HoAZjY4%(A;ypBv@%wSva(
zIEwR$uG@X*IHv1rfV;7I&`V(-@%=4?Ba80u{0CpzRP^8Y54LGTOX)xShi2Jya#>OV
zhaao5DVt`pbr5EHn)#(ScxL>dlQ__%kD1W>nE>&mvB>u*RH1wX75hEJ!@Dl?*XoKA
zc^4nR3A9k7L!4dPP@Hv3HjInZk=<Ja8i)EWYMd#kQouoAs<Z$-PWr#(Kkyr>LnSy&
z2+9}xcpGZ`v<q%r$v@e=JM?vE(-0$c2Q@}QqL$C*#RvP!OZ?<0vm@li<TSDTDj>od
zUylXv4%1gA8yXtgp4+>WudMxWM@|O=9DMXUH}D&q`XxTw^MtSN@{%;FWP)65zON8e
z(6-FCaXKV_SUb76ZeGl^cWY+<wl=<LkAEr4)t?j1<7iKvO4>s?ogXWs+=ab7X~jjk
z&o8#vRsRJ96H97-OCT9L&2o6gV$93Wf7aSwo!}617^k0~;oNS1Lvs`{cH+5099)g%
z7y4R>4GnlLMMr!-@2Wn@GrNuQ=AaMPS2To6wufl$00|?M7J~vepSta~>yY;2HWj-J
z4Ou-BM*B6nG%7-$mS{+)(FYve@cAJfIbD817ur#y*F91h1!D@f#*Z0`Ax3g(sh662
z>^;R)S)|>p{5+x7Fvo+P`-IT;yf^%(39`X`5Pcf%jwCFD=bECA)fI?&fg6-;>(5`n
zAW_4y@Pqg5y8=mKKR#t!^HGCuQC<P5R)tRYh*=H%CC{F++<;ps%ag&(^{@81R@wTO
zg#p=#g2=kAa+8_y6;kde=+l{7guixUsJnBI%=lWDT0fzjq|y!!8F<Iv;(i-rX)_zq
zT7iZyeE!rRm1%78U`jnq+Q;%9@4LS&0s%NK<YS%_s^lO&dEDRz;Vm$V&bJHsM17pj
zwg%pC0)khNNLBT;X)}1ZO!VCdY_$N=oAV7a+i4f>=i{WY^zmGd+x$lOb#=hKN#1J8
zsCwYpj2%P5S6k*&PcxlyTf2HNnqW3O)BE!f8N?u*Ed?${+bImQMKF?Sbu&k*dKW?c
zCWbO;H|e**Ah?T8Y-enKjCRyxp0CG*lTTe_19edfmS2y}r5>#I;_HBt=3|yO1Osl>
zb%P3;I}YpkkbUg57E=QX-%dmtd_aWY85r+2u8%IS3srJM#%-$_f#%jLT)brq_YkUw
zvU6vJqJIX$$hU-0DSRN8uQIpxkdip!QQdkk-Fxyu++|6p<0jpn;95J;Z^bIx$<C;o
zILk4F`QnLJ_Y6b^X3?~mj}Mpp*?r+4ifETK@hCHBf^8}s!feaqB&7$wDuqhkzKD8o
zX`-I_B&h#sMZ=#VhTP$hYxv&cn~z$F52o*#EPs2>J2BRt^SBMS%R-c`7wb^aI2~>e
z-6F{Ri%uzSkWDZRqTEL4(7VT<Q;h;@rJ0{pYT~5dZfv|adSz==a+1Y#o7F-U#5@`M
z^rA<UvKuEnhLg|;u6+o1hpZfsv#TvbK?xuLN++YCv!li!V$<QVX_Xo;s@g#{M?`RN
z?9xVGOydix5lHtEm>3)#AP{dM*nB~d<bS7E2@#%^aS4=naSfFm?GX<QBQ6^#-{=wL
zHYznx!5gQex_(s}txxqPqTwWVZFke>c=P#P?(_yk5G{|6+GLOt>;2o569Jq7Iu#l@
z4F>FShEPiS<tVeac}(_sObv$j+***X6lQN67H5+|S?R>IJhspDc-|Y#s;TS=^z4et
z&k^T1zR`2Gza`wuvp%NhlG}ipC|uYKJjD4t)C{&n^t_x5eDm+{1@i+X82D4DC^LHa
z-!TYckF&hn7Bn~Q*Eaa<I%3ubar4X<>85WmHs#1-XhuU=Dje=Wj8gA|@dv&rV&C$m
z@3#1l7$iCMQ)Y(;JLf4G4Wx(*K-7%VL2@^R=rgWzVu)!>5py_CaCS{;Ov0F_0xHt>
zJH5*E{N9Z6Z^-C!&`J;fm?*R~JHBAG2yzQw2ybv4eKX8N>8c4~RLxTolHOL`D+q^~
zD4nLav!ROj2p3oJ*pyv)KOw{{%Hpq+)#RR4RWR^t6ly7w3J^wpwv>5AZN~ToEFAZn
zMY(=ksP_v^O3?HTr?NobxL!;aZ_%(gqB=k7nvi7|Y4|ss!VQx5hFr6h1hQND*i6Qv
zvBJT5R)f;PL`+sd+$zhUn>)Psyyo}(%E?K)4Mv+bmgbd#&;s9raUY|-d@u73$|CD<
zCSy5x##c->MWNWEz@fe{lWBRS{xG|Wz>IJ?JNJIdCZf`-_rCRAh{*%C-l2Rfqx(t2
zPUM)5Wf)T`AV{XPAsfs@0gFoq&G{iut;GYK3cb^I#b@)L7okheLK4#C#2;xNGA(R4
zl`m{x`pNFOA<A22bly8Mc@=G&eFj?k_Y)fFJ0}bWkVk2kDP@DYSvclc5o7;=C=kxn
zl(wfaFq7p$1}@E`iWWLdL+SF&lB*b#2P7ji6r@<d#ol<r5Bc`nwd?pOj{10qx_Sro
zTm@0p11c?hSPr^LdvO>&Exe8PZJrM3e2b-;pxrEZj8+Fd1Xc(L!|*(dLoBZStWgQi
zs}qHz5<b=&`L&_@4VNVImTG>{kvb!3sFb0w1lb#vri97~+$J%N_N3p-WLQJgyt>5~
zOPzKOGxuox9G{Ud0z5|%0=z?o2@g@o!rZ2jB|WugHX(7|{i57p<_d&nOweWNg6Iwo
z6D{kJmPIFKs)Z4JZ{X4HtFl6kLs$DFI@hDfvi^*ItBQ-mtRvQ}<+5xTg|ZrL^@l<U
zrDnwd21VQ>@H~!vzK2+0gJS5-wfwsYD)y{0aQ)7@-bBmYc*=RBNBXu890!NmWdLp4
zOS*bXUh%S2Ho-KMASPMTgjYuzSWrM{<Up`@=-2UdPsHx?)dMRQnQ@qg@->Po93Onw
zLwP{Di8t^!4F&AirElR|+C^`B{$$fBJx(f)&2kQYewEbCThS9F7mcPRmc&t$cRY0Q
zX1Lb2rvHzIvKadjx2)g?UQA`rfb+ZHuF3OJxwe!!!s<>OWe}|aOS=xj3|%z#>W-x_
zOYo<8oUh8_)o=xpmcd&+lf)-eoR<Eepy?mTuA(PaB^668$4j3$hJ}-*Sb8+RXxBW;
z;Pvf7;~%T>MqX*LI|v*X61LGg0yX~nH1)Ha{}$m7h|*~S15rv+VIKQ$5am`&Tp8dh
z5dFm;2BJU%v7@@aWOmYBbqj4EoRu*0aA4n!%AAo-jO5Ab!%UO{6Kh<^^Lo(b8rG+>
zQVZHcyW5_M>Ya!f_U6wYn(x`FBL}+gW%!%Qv0aVrxozzD7uVd8ua=Qfz%h|Up?=<>
zRK8O}2k@9_#2a`6hn~`p^?*a!(T|~3QgH98DkkW}V+1Lan0*0v<Y5k<F=*l@a%OFF
z?X{<2Aj(xCmlXo0an(oVQ$m1colcKNW}vVo7@Qo+j#(bTSpw`+Ln0`*z_cWKvJMqJ
z%aJ`plv&2pvObMT@Gb}gTLq1>oS{|8oHALgw?FfNt$=j`wO}AhQ^J%}sH-QQMFsE#
z6AFf6p0FYsSiHBd`ZASz6@*;{od4O=_Jrlogin*CLD3Z$N*_nW9S0u)ChhDZ(KWR`
zMm~9j3m~6Jy(Oesgd+gzR!_wqx`uwj<cdn6T+M=4k*=0H2x{$T!csb2$E+13Jle3T
zYE(Zae$KN^B!5kPh&LM8>1)Ms<2ZJ8YSDXI^}Oi$6*gmsbq6;n8#fH<9ZDP*_lH6O
zDIv#>`G>+waRy#gVo#<~OW2|%_OH%AS3604{nL5IlUtt$i)P!I>t%J>P!O7Nx5nL=
zP0P>$zr7NEk8=hdUr%S-NoDQ*$(hD?d>Kda>H(?fZd_>p)PdZIB`HBqT#pV^y^14m
z%q^6BO|c_c!@dH|>i_|E&WUvbC>6@Bc9cOPL}QEHn3MpNc<dh>{4~`tzBJ)%i>D>E
z9Q~$8vsrqSGr8H>1&hLlZiUy$7b1|T%)eu9xd;^TLhI{}8;4OS!eLHLXq;Ani^@~9
zul&xmvx>|E+gAt}mNHUN0H#4#My@ETUf1zBB@Tz={pl0YuOxDHKq-DVi&1Ba)##6y
zyu9CQrFsz<<KAJ6L^02*T12^7ym!+(3{5w3)n%_M%VZ`?-W3fTV0Gnr0YMhNIr}o-
zBVsp)t5!<x2BT2mW}ctFS&Fqf*ANd28|9XET3pf^<MGXq5&9aM+60BS$N=gU3t+PJ
zG+BYMedh>Ex^T`;srCiVIR{37mzYgMtQ=wH4>I!1#a86s1zhT^TBdQ%x>OqpmSWg2
z7lC8y6{0tC>p)&-N&v-!uI*^Q(}SFaQMaQ-tuuF+)7b>>DCE`YRks$z*e3`(5F7I(
zer6II76v3f3c+)6Z@!D=*mqxn|LC@O{XF0mZ*ds86{DrHiy8nAqrM=Zv4D5dLvM53
zro$~MgoZ-}jK$Gp9T1A`i)Y8}R5c2ILKL)f>1T!gm2`TD#j5M|2qB@pt{TF0%7B*)
z9(o_!Ws>rnLTSN{BuD$Q6VxF1y6!iHk^{;RP_dS8>aBpPZ4}9ocn|f%<6#=@ktKxs
zrsO83%j@ZUS$e%^IT@OoFeYCA%=>dF@$ue!zy4S-ve}bSJd9FCzq1^~cRT-SQ9U(%
z--C`SXaSrvr?kUykb5*DC002OXInL=y)&=q6so`dkQhnQHI#Ep0Ilw%3nqZj5jrlx
zU4V#O%kRvV`Uxq)<plx**7Ub93gxUZI|E+plN?uggOQ0S&k@9^AK_!2rPYC%9?0{f
z!cGHBue3z)xt$1i@W_G!X`3SKv|=2^g(~a3dHi~C`tRwsAeH)POPw*vALJxtTWc*^
zd)1pQs`0I@#hR2x?I8U&s;*7hVlBn3G%;e9uF(3H-~5M9T}@f}J*VHZR~F(HuByxu
z>8)RX^B<4;A<t(dzXi;b?2N(%v9YvVw|4&KKYVE-xDjnY{OZnjR~og~Y^WnqtxA9R
z52aCkeZG&KxK0IO-+nlC`#lc+=0AK(zq$!11JJCx9eN$n8^3fmeI5PHe@OVU-1hZ!
zVg{-Tid}-``6TKZCZ!~1<^8;F;|!GA<_sm~E!yTCBo;i{76K#|!`c>OC6+$6EoDnA
z7q=}}Nvt%st#nAN4z#UKNUSZit*uLZ+i&}JDzSdkwhoopKxyB=k=!I{-=vY;Vs78!
zlH3+*-<Fcxk#FBoliby9-!+6v?pd_&IY{n%wC@K<9)z_Y#7Z81Y(LDFJSuKKs*?QP
z*#5mk@_3;ActY}Iq5WiC^2dJrk5kFhoAy(v<QYoG8IIIBNyj;j)CF_L1((#NP{*Z|
z)Rlb4m73H~-HxAzQr8w8*A7xQ9vwFUQnz6px3N-pA3N@{rS6M6?yIC88ap0fQFa3z
zj}uZ)3ms4EQor^)ew|7|Z=f4+!Hw$a_QsbU{|5izg>R;q%&ynqdWUbW9Cvj<w~8pI
zIG*95MOVN|V5y!f6G1HCO=zW2sFWt?c28KQY-&~D_$p)!8lA-M!BUz>$ZSCukkq8m
z%*Ss1=8MfzgWChKy+O0f;rw$noMJ+u#ggl#U9~JwKwm9!Pzp(uQR@dXA@@g8=l4U2
zthzBJ3dLn&8uygPE-%nY<pb-mXPbwdt>?=18r`4B-EA9F3k$$HE9o6$qJ_a1VbMxt
z4qoyjg8r0V&buRNLRDhy`%Lm}PiuQ`A2zPu207pRqhcGh2XFMr%c9t?gS`54)(|G*
zDLwCYr26+grX|Efe(WYHP4Gwsj6cNY0*FL$#GQ9U4kZG}U9r1SpJl{#&+Y(hh=o40
zm{)vv9v&lQB|I!>_(a`3BnFU5D#2kDMhuJ0a33nohDN)$#>m9hYD5*_iYZyjeQO$g
zm9JlbTmFKcL{TG`*sB$RD&c<UFw4iX0(XSt%W8sB;SMVz1^2WtDk)BL$q>c3IUakS
zdI1Xpo%Xj3mLy5cpm8kIABQryF<MT&c#}V1Rufg>h7%(V(Wi5Cd308#$O~Rx{FfwD
zCcL@C+m5nvq$5pg1+0Zl%rug%;zV;=+HbWPJhjNiqdy%CDHYRnHA~~#evS;!$mkSd
zDbIQYm=kFG|J={gi{vpUu#HTE@hAM5A=!G9^mU7-iEkV9oXx>SxfQ>pb@a@!6x|c`
zet=Nlx{(c+rRoX-kaK;b4ufHvc7+85j(GI*uc5RvndkDs=26=@J|;Vp?|dCzHm#aJ
zf%j8Xr17FO0=S7v2<UlUl=Rtb0#26Q7bL>7BQ5B{-UjN){gF??hOMWTEmGbZto0iH
zmQM&wtM$_6@}ecl4;K`N6wxhLH?|fxU0Y<N0?Y|}73xI6CG`<5(^a_Neo2Q3X(y}(
z3$YiL@YrVdbGD93t|yxq)bjNxF>_z_h%vX3n7m<D#BO;NIrRgeQXKYVrQZ)BohaRa
zV5@o>uX$38{m9S)Gs|Umj-?LK_FRlkD;G93^i17it91C5Ob?|-SQVx#<CGV~XJz0v
zCQ&P_sgmDrgwT9@UhGw_8Ci)FWI+s7RF?^tJ<K}x%GH&=9Jm)ND@RW!Yu*^Jf03ht
zPpv46D1YK_zn%9`);aOg7p9ybx`p&gu=rXQ69i`*BCdA?Xy9f%U2S0<D9}lI96-d)
z5s?Fc``9;uax{uH64zd_G*)>Og2SC@FRTi2Jy<Y^b^zE&yl38brtiqL=x|1FkzF~L
zQ7qp9Vz7h0n-<7qX4Inqp?5thR;0@rf-WeQInlwtSUxZePBpAlKKIaAL==C+C|qCI
zMWIJQa^AG~g3JH>SumecS}%R9zHlCn2QK0>VObn3<6Y5Zn{aW-q~tK9sW&2YVQZ@W
z1saSvdi>qnfE$Hp5vyu1@<kP(D18>~JUq2ti?3c#vK&TN7?g8RE)TS&Hb}6l=i<~U
zOwj(cWE7$dmW{7lcI(6y3$U#v$lS?qA8(Qk=&dH@PYhx+2c%@}sGAmlNYr}-yp%`Q
zd|i1t2O5TtVv&0ZQ9G6=v`MHLLoJ8sBW?>eFR3`_?6`?G!wW_ph<!@}aD>oKx%KbF
zjR{-5wZy<8JvhW_1&?Y3tiHM5c{$<z?J}-jiBTFTgA@=`nuBtpt{NrJ6%dZ$V6YKG
zh|T)}`$sR$(^aw1&K1K!iL;y;EsBUTV{4hRYtEM$jMs7yCEKg9>~?_pAnrv^@U)Av
zyD};j(VaT$Dm=9a9*$Zel&tSzRDmPCnfP`6ol3DJQJEoTvFfdbD$WZF5|0A|)#WAJ
zsiEhx%jLxU-#n0fofWdd2Kuj`c;;*AVa$o}(mJA|U>!9gpC#SEbLT|efMWrnoxpyh
z(|DquU0Ge~W1<&Ws91Y`(Utbk<+OWysNxg>#^{F!hAw$|t@jW%502I6v4o>0XAE)}
zyvW?d{F=tUn3!uW*^QpSX}tEk)Mj3<)p7b_7e6~|9e&8$QG6JXJTt9Pi9T{pTUpgo
znRDr^E=wbH!q7hcT#orl|L_9POx&DH<1SGyHT|jmhx1<R=G<^c0j*HWyj|OuR`_S4
zue*518rxmxFjR+O^1x}xmfHgh0f{tE=C7<qoWn7By{69k5p!Y%ZGfZdHQhIe<34sK
zT=Z+l<|d&uHS`YW6Qa(*CYrU6?HVOHZqt*XuI3?*py6><SB=^6&l()$tC`N3E2cEi
zRFPcuzPO05Xh`ugQDUsfmC`&I^f;4r#;x#RVN{W)*NgSP;$|ePw9Lj0MB00-9b`JU
z)HxDK_zeP`S*I~~gWtdCaWEm1LdVOOUR58_Y7U}D-`$neQnA(ru9)qn;)<@^g}%N<
ze!bWFj)9ea#AmBa1{R$x6fCV_`x!mSA>Ld*Lz&3yRqxObo>z(+vY)IOIMV~q`4#I2
zbAiA4kIW2SRHzAY<AE$W1_;eEP=-kF;e8~(GY&k_!y*H#m2}EUocSrk655P?eYy&s
zrTqKPc$@MK0vdMNJi*ig%WCy>wHWt+@9JN4Zd#V!rhN>mCa7|}V5*%)u{{2P-fi7z
z?V5(1;Rw=r_|1QOPVq1l;LBaKZpV0+roReO4)N6MVSVTH0cCdswF;fvD1$)wE#(d!
z$=%==*>S{d%3ZV~a$GlQB!@)GJ)VzuqwxgjlZ0V=A`5rpUesis%3t?EB=?gM?_Bd~
zs19H1-cP4}b1jylI(kKeCRM_TuP(83gtjC<N15PO8bEbyJdohvR!b7Q+MkSd_~Q~^
z@D=wg7adfG{@Q_!#l3Z%>a_B_lENGhozuV=L<xG3na{%gZf8Pbp99}WAeR}e4p#B{
zoj&M5vR-RdD*@sq`f<klM=`<05tU3t4ojH9+WU~nGwc{5U4a2pOd#otF>T)-eMv4B
zQ83CGDA~_hvGOvx_=nHPOl{jQQO?D{?CZY!QZy_dbtfz_&aZi+B4YgF2%cR7kl`(!
z2^q0KUKAQd`P-TiYu(ZijWYE$$qZu!u==J|8yEUEqEa=!gz!isA}jh1-S-EZQv&Qv
zu<o&O0R(3Z1rs*1YFzv>=+xhJC&4uD%9y7a38xXC=RhQ47-u^-9`A$AttV(MHi@C=
z0RAZBU)X($&dTWTx@c%8Xry<HTSl;Gaj7lUR2@|TK9eW`xZf3RkUb(|I91GdK&s9?
z6nVQyRI-uNJI2D?_V1YpZ@Yd9mtVJUN!sTVpid|qsmW&GBAao`b{3+Rs#A}K;lB?Z
z2!!z;XK;QWLLPshTj%vLv0yiRZi|w=`kaGlpZlUS1S2Sx?W&*+TgH)a6Meq-3A3op
z+?elR7u^<tqtg+uC)Dh-5!dh;?T>1l3vO9yW0IyEtj$Rn{{e$Z*?$1JyLVKa-xJ@%
zt6UwwDavabJ_Q4Nu=0W_-vo<U$I^)ALJ&`AcMx@7$MJpcWIG$?5Iz^W{U8IqH5OeS
z`K~@iUR85J%C!WKZAKhK(d;Bem`C0k|CT&x<=&XG<`vaKJk`n+)jA&a_ABcBc<S#{
z)Tekfm#=7UVD`rp4HS<SL4y`0ffi$$76+e>K!c7XfsSIDjs~BeL4%$d*2tZv=Yn}F
z8Vo`SFxrDb3O0_X!6=`=s5H%}hW|`c<C$*4GyUmjhWJdT8cY@mOg7U@4*1M28q6LE
z%s$i10r)Hs4VJJ3mJib`vG}Zs8mu1^SktFjv+>#THQ0(1*kCM16+U~N276-yd+RiN
z2R=uS2FE}G$H+9t1pf0Gjpqvq&sV0Ouj6xWJBzG>IdOtGPp4^q)N(>EHMs8Zxt?k{
ze@;^!UvME2aHCvuKY__o0X$eU+ys|ARCQc{MDBB5-UnwMiaIW?8D3^hUJL?$F+Tq9
zynO6@+!8K)uQd5@Gz8RK_)+TkMKt+zT?F4I3TV3UtGIBl8S|upga`<D^<9MYFNMqq
z1jz`5L-<6TE(NV-_&;27?bgl%14T)?Xx;~kf`G`6#(1>^i0WN5UtQ21yD+~dl1+Ds
zjdjwbbc)RYh`!E<)+CBH)``^-i1+b{mtTt3B}%qkO4hlEkMN02@JTGxNv!jUZ6``K
z&q!S+iVpCBZd@eEW+kZz5#eXWr})I?5+&+pBsMjrza&bRUP?h}W?^-x^!G&B=Y%pS
zS~8`HGB|{?yPC4vS7LhnQgexNpiUZG*B5PdQf~>Rkdj1az+~w4GNpC$AVLLs!WTC6
zpfG-!cr7`GBss{HJb+(bCQ07!N-lj?4h@EV5F$n;Db~5XWFS<Y(h@BuKr}JJnFXVo
z1gb^=sd&Mvhx`PybZVxZ7_-JW_x!}4a@DqHG4AWh&iK`~T~)tdsXn->T_&OK0IBRZ
zki&EEW&s%CftocyDp|0mh&JI4zZUBkJn3Xq$6PXX0nJ@F?R0>ajDV)l7fmT5ZFwSX
z);SFxZB3auO;c^Hm&uwcMB3WP+H+mnGDJGD$vP1mx=;u0*UVouxZHI7=3v&Yu97yD
zs(@Cswod#{ZE&(~`cJ(Yfj4eHk;??MssvuY`eGn5ryu5~Z%9NEBcLae{MKvkt(2SY
z+??K}fc|c>{-&FD$Io{WMtU8|27qgW;yJ?;Laj@Fjb}e!UAn42T&W=lsHM{pqia)P
z3#hTDsBYJ*oe-)e*Q;1Xi_U?~^kMu5vAL;^xkZY(&Ahn-v4x9{g-42o&%8wdu_Z*u
zGAzaN!@OlIv6Tn0nWoNsDjjhGv30(Vb#aPy`Mh-%u}z(hO`{G~N{Us$s8zF$?Ldkx
zKtN2p6LS=7u}`Q6${{nFrvz@O>AT~M>tN67SVBEEkazfzhvyxj#EyRRHXRKEI)aWk
zBu<b9`!ORNcR0jrR|{~C!)~YDrjGsF6lbypRA47&sE$M994@}DtNe{an-LZ&$sp!O
zSKW_pZyW5LKvX7R7t;k)EtpeN@AQ!t`BN@lAP~vD6NZ{NuUy*+xZ{k{+3%;Au?l&P
zZ6YfI?V@$<{Bkkg7@-B}Qekc)zv;xN1yME8sgJ?#FprT$>*HXA^JW7%i`dr`h*oWc
z_D0u#ztQ5AkQ*q_|B}S%yAJj>94e4jGlKT*p%&FJ0qWNrGA%d^%uVO8kIv~`BtSTf
zVLpNc5*HAhPa7O!99<CetrI(us`dslbTk(a*ooQ#<2)K+G1ZWpd9X?<c-tdH|8;=P
zVyJ!!YX6Ks21$U!VpwB?eW@nWSD;-p9l=*1l44FEPpVmb7w+PWuVE7zOJl(9e2{*M
zm!1y94;=Y@9)n)kHNMLy0?vER*rgeSrUmDv)EUD3F+v{>bryt{vp^|(8+O{{hT;*H
zZ;h2i5(^c!{w_#-rb9IfLe>Ie|MG}v22uHfqp?6pd5h8MAV?eRG3MZX_Vh}7O+~pt
z$#$1O0dkjFAo1;@^wqUn;-j!`j5~Q9$u1BxMCx@y8fPQo_|r4CO@SL}CdKE@(s02n
zeN)<x4jI@<Ih+{(0)Ti8OoN_iMe+d<ci`06Z=GvWU2Xy;ScyIr-nox~{P;GJO*$!g
z7jPA6W0aaAS5iHVmu%bMFn~r5etKEW#2;PAJX4MF+-JqwW>oi=vV9utYZ}eQau5{*
zQMpOeFzy28bfcH9!DE}5nyD20&32`ANTY%Abe}|%Y15!L$ZvAv+Hw$qaHw%0s@l!W
z0S^bN7H0?Am}X-%MIf4q5z4QnqVk5UlO;>rB+-Z2V(ptE$R`VCZ}U2EoY_1jX_`gi
zy;*XLS=zE$W{Wu%%##sF2q7<zZ6G@X7DM(Ge8_Q(j4As+Rg8F328x!?h?YAU7l3jQ
z<+Llemo3b0@>}mMp`!e#y~`Ch-W5}CK102;>T-$Rbol^QsvYLV)D}ML7Rs=Lt7sl7
z&Tp*rNxbR+WN`p5KK(kO^g6MXIw^{JnH5S7in<pou#uK8GU@f2>0k6IzUZ!eG1YGn
zd8oBmsee1)AVAR|q3@bb7tX#3!gHx<4VEwkR?+!XL5wH^S1_1-T-UF2xRRPPTN`(;
zK*c_8xeqP7DJ=xLtsnRa!gE^NR$8>-Lej-rD=EJArMq?LH^=6tx_LG=7Rbb}w1ZoV
z>24f}zEH*(W5gIY*Il|3eC&9l=sbT=`6=dz@z{YN4$DzheQ50(phNXujwKQA#-i*(
zp>!gn>||Z-hQ3(n86s~70c-Xtl-lo`P99*BHTZ0lWGr4^n~6X9c=ru-^%)!VLmT?n
zuliklAs(v^KC4Y*<b$S^ZD9tT0grv9b!5WCjuF0nu?B-9I>XUlht`OPy?lr6$cam4
zgkF7>uAZsU%jk;*RlHhMvskq@1&4#hP=_<BrhF-9#fKW_$HoBTyS`P2tK&;wtuK8i
z=vF4yug1UVOoC{~<6H61a>hY{ZGH1&Gsctq;$v7;lcj=FBviE&Pg4w;HZV1qhN7ua
zbCkJ&=-ce5u3trLZg(l)Oz!o25FByLX3xaq9Ef&4(S6?LY5rtouFhp4zG1=6Zw^8=
z|D|CO8nD)W4(wbPwE4I;8vk}7xh>UdZBch^$%lNoMrRq^)?Ily%YZ26kTC~->Kma`
z$MdvaZ|FDeoSJBxoAFy~rLtb5s@V1W1_7=;&3;QHUSH?`wkt94khxYUxUu<m-RZH<
zl$I*Sa}grAiIO#k(f)1aN%ivWy36V&U6wWTuT>?#Rk~iP5|_<gKMan?^@#Z~P!5qn
z=7gF*rN*~OU4KjcU%Mi2_Xa-gJxN$OQSW(VRrvhch$TL7d$$L8Tn4Qj2ng?+`fo;j
z+Y7lq$o1bIFg|3+vMBf8?(*G9&lh8TcMwlO{BDiX1oYjm!L)AX$fNzZ^zwM7-FzWS
z6uR<mZ~a^9RJ-LNHRAEFopZ?_H@}u2{Ewr3SDvj{-hDg$Np<!!YZoQpT<F)Csn9uH
zz&`t9Z-=DFeBc>Iz%t-5=Sj<H4nS7of*~F-4qBgtwLU=`SFhFwwGFSpf~xw^pT^m}
zX3%c0hHDj?n~~){Dj!vxObfsCE2LjH`fqRa)^8HCH$wu(!1K3ChMOVOO?-xzu?S*m
zYj<O!BOZ;nkS2_j)`vFeTvq_>D$xO{3km2$ahCZU4dP<Q<H-F}Pr%bq$FCvLg$FMS
z0DTGxE^R{;M1V85I|P$L)K~bk25u0~r_$DNo_x8ev1{C8e7wBDcwA<D##)|Ts2ms(
zi=Gkfk`$Hfm-WBkKc)+n(?$Kz1<JH?c!89V2mu@E2>ofdb9|*;#UR?Cud|W!bh=eW
zeb!Mg=53doF&F%?z7sPT1UVnxe_0Vc?Q1iexL5JP#0lp-y!OP4;vraiu8UKQ6s60(
z*`6}R^ltT*=e=8kzRr&fb*8b>3jJ1pEU|{;rFxr{cB&-Wqw)8q$9U<iavbJ7ET@vI
z4~@ecJs+|qvjjyPH+!RHvf2Ga-1ZkF3=2s;P33VbW01OLBt&2AvZm<<WclyZoYI;E
zF9^3k-rXWPJwS1c0^zY0jKIiy$kM)9FQHo5A~o-eV&r{Ug%@}*`!{HV@l#&VnUI*L
zPKAP8n>J)gB}q*T81wp!{ElAtP5}{f8%>mH^1|c81<dD6FuBZUqoQahON;_gs3ZQ$
zf7Bf|<ohPm5<>iZ_-8N;lV#JAL$uyR6s8!M?CuI{dpnt>nAwRiy)?^8D@wI%iI9J`
z+ewDOTQtTxoo-Y{hM4Xvos^pCd8CKydq{TpKK~E@k+6lln}bDFhonclnOjnbZCrLJ
zoZ)?BUPKeI%vy>8_C6{pySCB*(Y4*<mVd}qWY4W3XJm<pQvJ<;U@LJ{C+}Gs=QOvl
zzN#AWUp}t$lVg7_i{A$|di@3c+4qVD^tb7iRkVb^`H!p*_O=7wBlfL7+JEyO30F2P
zzxj{$+s|S!{^J*hV<-HBc2zqv4UGR#yby!&A5xf3y;Z~&j(x<2Q9L%7N-+L|IslVb
zhtNXVd59^yVy2(2YSejz^G1w!n0G?CuAQwT%4J;iRNQ=20E+24nfPtgWlD}Fx?V>T
zW6X6%l|;dHT0>3c=eUwowA=if4q~^tcL7*}y}Ax6?n~wrb8d^)Rb%e0rrB5?tIi8a
z?kn!=(Ki_m6Js9hY73bj8$me!tKa--Vs1wR3C2CQV?Mn1+)7ZhKi`Tqj1k$4*BtlS
zzj>48b&yvDZEM~y%9i9f$gdjro-WMC_BoC&`{sSp(DB%E+;VD9d(sHS79VK7RP{Y?
zyrcH*^^(N}P~hlw`x0Zn#RVX(aK8s35;F!|o%ILc_}dJ+oH`Q2!KwGk*rLJ(Vqjyz
zHe0<o-lIJt#2MD#Y@SX)HMY08xG!_n{LWkqWj0U(PgrFU_giV;+=@DWy>tvh_1+jq
zOqC3)&J8@Zq2<G`#X=OF3~HhvK~f9vE`E#+e(I(LtSofhia1aP;?iL#rFK&uow2Zg
zHU4T)0>Y-|_J<1xN^>~2-`-W5;jQKp^epr|YrzP|T7s>JF9Hp@5x|N`CWD`Dd%5ws
zBHvv>iHXQeULf!yf{)p|k<lhQd4n*cOe#!|2U+B;GM(tGj&qPU8Us<`XaN`pCe$Go
z(qe2HVV>geKVO%`Nn%eS5Qft{daDoOiE7wJ7!)wGE)J@cp(mil?~nsFz~bTD#A$?P
zy$82Luc<kcKGzen4j2!IbWR}9iDx79PYu5j#Z0N?C|b2-9Ti#Q{fNG_D=f|p2T<Tj
z9U>&<iH;bnrK|g7fKQ8L0H^9WJ{gIJS}Z)UIcitJM>o5(*YP=R%+tg!{YOPSTw<y$
z(i^<&eZD+CvgvW}ag3}Bj*`g()=BI%2RKZ-61Xd?p-|o=_-$d>s_Y~#3O9f5FZvP?
zR7#OA*x9w9@{&bC&6+np!L=}#k5$pon<u%}wJ64gRoNkuJ8jyvIH-<QHK3&m@!YlK
z-4&~PtT$&SzFVm^ADc$DB1a*wTbZ^Cn^u)5f3AjG`A{93PR9{Tsk2*!_$Axxi5AA1
z1h-0I*>ZipBAtfepC2-P%ip?`%{3o=DROHoH-xk-bPA4F1U#>>+hSYneN$HzYG+%6
zTfR8h9aR%kSy6MrwlwM=U7d1bt3_MBH0k}JF6;SoO(6U7Ea!*%BD?1}Jmt%a(s8w)
zEA38=*jHA0;~N@I>;l!xS2mm@zO+BLA9iG4-BFBc>bK)uiz{C}5R7Ub7vOX(`~ZD>
zpx)Th-e&LKVUu>^ywITilE`yng>x>-qpeO49<@8<+pRYSG3{%3pVJ5O8~m5;k8>#|
z#Nc%}wL+rWqbhKrK)epBXP26jydO5^ra{EVt`xT_5Pj4ph}9g6@W+`(>MNQ{bI;xv
z@BlvXD3gMU+)hS&r!c1OO~R2>7HsN-4-OewinzU0d_QW`VTX(TrstqbZdHU|)cYI`
z6FFJ?3j;!#EJmdzW+l$3#3~M&L>A9sgKucz-|LWWO`3-qM4diPWDt00k&S8wg`}@z
z?hB82jk|uX%RG(R7ys@x;rpX58;W@V#PFUB=B&@fi9V2J_nu5HL8LYTrjSDOy{3ho
z2FO>HQj~4HXEJ`&7fWFs!9o&d3pl@&szo1Zm3z-s*ncTE#QOev#CyJ;DI9aY(^T=h
z=vZab6}~^#u@Q#PVlVRb%kaSC_v}7Pqf81l*;pr*BoB+DFx}%j`-!cM{^D#yLu16o
zvE2u;<+Wc8UwR~dxT3VK?zK0xtUo`-4}?_#mO^zNKwP5Ehqa5M#<q{q4!8&Ut2VED
z=tsYP4;~4n<tA5=yWXM+682@tNWSgmGtv2ANXejMcH564^IB=4cr$M4gP#?{MWpiT
z4!T2gLK$rExh_M4_V)G#+dG$Z3ra*r!)9&cZ<h&T6hf>xEsEyv((_`Gp@*Cf-ryt{
z$V@|wc$_BO<n^6A+F`W<xZX5ti14!zXHCkOWMsiY^Ey9v?a-E4eR-_iebu-5D6Uzw
z+eQYrC3f$q!K+n&9Q&GRz<|$*xn(2z^T+O+r?UWE-xV4)_x^pPvoC3_JtseCM)Wgj
zJ>*+=&<qWGVkxhfapKnJKwe1!zn;g0ef>@%<=qtK5BxNNu?N-k>013ISRCN_-E78Z
z7MgWaj&gU5bag%3;eS^n(sp5&_>go=edARnwhthD-0$hX>mhmC2nl!uB)@$a<&v^V
zSodqzHGDRMqJAYb?SIOU^|-<%d8_0=TQXz#vu3^H4!Uksz8_G34)s664fxUMKkebS
zWf6dIK)(IaANtA_8`U>V9t;-_ewiD9r{JemjE6!>i-Z~k(}erO0x%Z?C|SVla>UG@
zwDb!>WGs*@A!ibWKs4bXy3|0DcnBk@i{Nb_aY@kPKoF-VBe!KRUrDeA03s6}NWBOV
zJphY01<JDoZ{7rP90bcYk*k<ky=@9M_Vj;o%VH=;oEgTLLJ}gIYW4Eg_5CeN^E`_)
zOQ_pmunk;jv`MICDx>-95XGQi)r$~!g>W_5Ff-5hF|}bX;bAe(;UO^oBb<P?KP-^t
z|K~scd;SCZ{|)|wHT&{q_D`$qn~3bY((H$!?5D$QC|VAHEi(r}F$c*y2PHBGtt<y)
zI0x$}2M0YDk1dx#F_*|Xmn1TmtSpyeIG5@umj*qLjxCQtG4Gjm9&=<KYgr!qaNhHy
zJTCNn9=3cw#e4zle4)sEk+OWT;e3gsd@1w-5L<zaV!;dR0{O^-mt_S?!v!iw1#0Mp
zuh<GT6$`bk3w0w4^~wtMhYQ~x6&j)!8M76cDi)bp7g<CWZIa>szf~-0vF1~;$#l0h
z8@1yYb>JR#<g#`0@^!M(an2oc=F@X80lV8zxQo8^D1<HgzVj-a@RA7ecAoGC{-aoO
z62LbTC?5^>)Cv-qfhg++3nzy7{s@tL6DsZ)S_uw~oek5l5C8Hm0_Yr3>l#rtAE9IX
zK{o9}(CG*Hg&2dSm^WszioS96S#e<tamIfUOaAZRN@fcn>jl0IMd^RzO28Y%fuBk`
zBTL;{O0zaggD=axhsskH%cEl}y+2is6;(F3f6m+b9GPF$w_6jPQXAA$Ta;QKx?7+4
zvp&54OKC<!WM#wfZe!|UQ%X*A>_~IvUQ0$*>-2SNV!_wMiME>Kwv4*=nSV<x8L0mL
zzYi_>Ct}I!=<M3@+S=yr+Q{^`;j8tjxs9>Ajq#tGv&-9;%R4jcJE!}*dk?$w-}V-_
z_D&A=_OAC<9`+V*4!-Rko<AP0Z5^%M9Bu9%Z{8knAD-^sogO@$?H`{X-d~)YUHy2x
zzPP-(xW4=Ocy|qjLSgYbs8F~kG)jf)oGu6|0h_^Kb#6}>E`wr*LQP)Z2U0%k)xnzl
zfmm9ZNXnPB1w)A}nq>w<wS^-exlM;NUe*<jr3<?ptq#={Ph<lj=v0dJB~$qdiEM9&
z>q}>f)$<iI6~C0tmA|gDUK{>WzEEY<6G^4iP_a~J2{VO98Y=%EDVE&*bFqZwMF1*O
z3GEA8!h;P6+<4taFrkic90{(ua859>JFHVg3NPG)$C#pELd-;M+=C}-d%O98yNDz&
zl-!wgJ6hOVhyj<m=wKU94{^yPScKSW$4v}7cPBvxZnFSebo4AIT3*L$*O^aolaT;8
zTK$aRoo81+uI4+dy|lhD1%_a)yu-cpridEzP>y=E{Y=l6qA^_c>!EHmZXg+L5_d+Y
zbhh7oSDf%x5@R$>EMfR9mN5JlOSb=$SOT~C0ce^*8wOlHa155chl7@kDO|!WPP_nS
zsQ*<gaYOa&t)TaE4kAID(+p$I7yPh?SByRzgDrSpi%?M;6C6v3vQ@@j)lR&F5oj_?
z_Y9YT>;s3iv-Q?-tIl%7s|sdZ{Yh3gO88RX?P4uVEK!8K{JU84lIoLs84lAAN#97}
zxLLePsdFt`rGFxppi%f7{}D?JP?-9EDNfRD-f#bhSb|DBH%M6ryysZ00nQoWKktq%
zW1svjmK^dnEArGzEgRKxNW#xSU}DK^4f|Ki%i_O^C6j-|l9zNFtngHHIi$aUQ2HD}
z<&0|SK)qYd?`TiG2pidOF_f`M@Vxr!pW$ocZ@z`{Vdw0)ql7m~WujPK0^73Sdg(^~
z=VA#QeTx+I>Dz%2JaxkL#c8}%%ML1%e-L)6Fuw<=0j}krh$Yy)LhTgx<y*|NH8E=`
zDCIqW6-%W4xmdyh6H8eBlUS1S4`PY>KZqr<9C7NDAqg<CL^sT#0s;7ZW~D051D?ky
zPjeK*#2Z>mo5PG-U`IrV+d}Rv5ri7+4ZTE>d|!hyob2EVb|HDZa%$=Yl-TvN8Ej1M
z#}e~=$5l%BS7OOcTwRa?0&bF6mpK1o2}%}_#^cd&gOm<edFj6uODthx34j(+S{9IL
zN2db&CaH2m-i&YjpB76JdzR_}{~?y#{U@<RF<1SgIJmWa3910s2MNo=wDg+Y0R<pl
zAl4^B0?pxugL*Y+mwe`W{#V43kN;FG3508iy8oAA$(6L+_N#u2dl}U^zJg%e0r&t~
z2PAkE8_!-IM$#w_ANZj6Vi_LryF7S6?!_X(GXSl9+Gm<=vEI0|%|>msg8W~%EF|m9
z8t?CA{+U>E0#X${Kr!SJ)tVwkM@~Z6Z-SfE@w1%Nh0~a|d_oWQhgRsIwA35?MJ!Rp
zuI$x^xOO7@?N}ovl~Z2~m(B0FTTrDM^$Ojy()NtY5V$#}$=tun$$N<lRJKf#l-}tk
zxcx6;Nnj_u;Npo3;?Nv5axp|NngqBjk!-HJ5#r~!pqu*Ue<qfMgJp=X*d^{l(O3@y
z!&}VkO!SA~1wY3$k4K-o!O<a6VS>?|g|!cU?Bl33slT*cq>?)Vu?F29Gvpf~P`J3&
zKpf`=NjL|^)#Y&MDRzd?yHIdT+51><dWVs^c!$3F;))&0jFKkSeEPx=CXJ^6MZfF}
zChVn+acJ@aD(9rD(uzs2J|!`e8`R~L^N#>tg1oXwWr%wNkqs+kus>l;miuo-Fr0B<
zc()IUHwhf5?w2IPUr38B!ifNQ{#&uc3{w!*z1qXE3FTyyaHZl|x!>5a`9r}X_A;cd
zSmh)i*b1Ef3@h%}61@n2izOcahFCHj%4Eo>_&qP2avI}Rf)(NO?}LqUdv@_Yr?cO1
zrBHiV;m^ZQAGTgCRWfT7|Bqsc9+cKYE>&F}LijJmk`;u}XImdctHDv!%!B_Smb~~Q
zmdtjUDClPj&TrNcghQ}wJLUf`izP->1sfQwEM?f-MrpggbjZBUle!u(u>{N=DYNn!
zRIoR!?Y8mH#F7H_dJak!YEeg$)$MpB;tJp^->;cc)>VoFE~Owo8U<yK|3NGPV!jV5
zfP#v+UbBuGQT-FK<OALCr4fWwc>Ly-c*;3o0CBEI=NC6ZT^`nsCQ8U9*0LMwdq!M_
z0WRh^QN<qQWk+etJ|cev+IOAWOQr~6MhH6ydb<~*X0j6E3~C3?GQ$WSVV&^BMnd1?
zB!K@^EI~jNH4<udfmF$GeZm!fpm$!w=aBD2e(Hpmcl6Fl^i;<Wc*8=l*T>e%fW$}g
zeyjQ=_O9EnKt)_4$Dh(KB^VTbKyXGhaIsmO89f}ca^8Q+!5T~e8=PbMOwu1DNF11o
zP5e`_#CeiFu3I`ZoX-SKZ_ZRq;sA$-2sZY^ejqKf<{TkG$Ub;M^J_0cttoUn0Vz&h
zDIW#R8^WsZ`GGB0_&<py0L1?!mariG$U{TH4->i!{AGmjV#bXkG|c+|$2XN|`tM>%
zJ!VNGiq8hx#J?k!oc$NEgc0eW2}KAI5wF>-$uph_#AM>ge$VZL2#7)&blINK!+oJt
z|2MH@`oD-JK2UY%uM8--b<x}@L{CNt+>WTeJD{aHcOV>sOFc?HH^Qh1f(^>EC!=7j
z=^$#tXVZVglJ@^av84SU#1g%YKVnHY^2mQDmS_N3{j5Y=xBmBtCDVTsOEioS()vm0
zbQ1`*aS5REyx7UO*!ywtJXs11LP5+~fiLmiU#CupWYf|8FNh`6|BhIKfCbNsyiY3u
z2ag34OZ*+N$-S|Kh-g1KVk6U&Kgr=0Ptvcw#1oy&_B+pKKL78;5&)u%D4vov$y;yy
zq=ABk%>vz)BHQI6HF9CvPh>z3cxhccqc<Ktoyadtg;Qyfow?bgX!-SMe~TsU8%PJ2
zSh``XAyDs<_rW-yHi~`NNL=0&(}tnx8G*lVxKmwnr-`!j)khf=;>2wrRm;1#|AScK
zZzP#%>`ClYELI46&;N)e8%XVc6HD6vB9?4m06U%fL=gvCev2io|0tGJV?@Iv))U}x
z0ADW;SFXUvX;dqkY?P09dpF8RmRnP%s^{;+VP2tQ{#7hN$NHCI$@U+yWCLkz2yqm>
z24DZTSYo1H>C998vpC@0-oGc7m~Q0VqZeiw{U6-jXHZn#x-a@}8k!6ZO^%HOL9*oB
zP0o^o2ofX*$w7h*O=u91q>`f|3Me^ekRVaA<fKFqBqQ3V@qO1_d*5~HoVE9<TXpJw
zn;++_nl);SXFSjU_sS1hEp$+=w}VgSPjAT$S*}RNW&1CRC6)i4SaON0%=qd%49`oG
zzN!C7+rJ@}wEfq`l8zNTI{@6RqQ!5e<<3W<+%eLQ1MQAKVu{@Wt{>zT8YA;c%EjzO
zK{9u0B?uUD59JerpLFm+1b*-@VhJz!zbTg7#pinqins0>!-^#z!T(=~CGkRFzJFgV
z(fcEo?BGdz=BZ%9`#_!jtQ+Nw6geV7Idoijd;kJmO-S4SPAmyq;at?~_6Z^T_r(%7
z82;rp<*y1;wa&p#*`YSKAu79}ev%<T)exgi9;H6H&CbBMaEtX->r1AF2X4K${zWVq
z|8I*W9pF1e1VJY)dbS{KSfAcq>823c^NKh!jPM(Bn@|426I3=6v<Y0upWNgBDwgp5
zyJCsK*!X4U<o#dc^=Gt4O4K)YAa|LdUY69~q-GpRnYy5`|BJ+urvIr}0>Ir(^85`c
zi4iIZ*?E2LQi7HiBO>rAWOV$Iu(Xro8Fv@I&Wyws25ufNIgx{|w^DwQqwsh1|EE~;
z1rMJGGLx|Qt5eOk0)HwSVrS~_#xaaASw-}k-lz39iSd)cTd~F$f9dk}zE?TrDxp$E
zuz`?e*ITjp?b439ve8GzuVMcOV#!VXk&m}StII5<9=&=kn|)SNZ1^ZX?cK+ZJ(6BC
zOu`jZs|z?lT+%0XME?b`BndBTM3iO259NZqrzDTFMUESYYt`W|Zur%Kj5T-6`=b6a
zQ8?l4!Gzjz?sS;D$bn{vO8B-|jDcu)iy?lcH-XSD^kq4PhO3FT79<yWe^_q&E^n&Y
zldYG$Dl+FU5(OZpybyEVt@~R0+s63FvG%fg%1^nJj#+geAmQbhF1|i#l#;x8g$1Pn
zZ-^N0pyx9`y;=*U-P(N?+Z8Qa^=N#rPF}tLrC8Dlwz6Krtt1obNS-It&wHY`FHfF>
z87J?S-+vlUo}YD_x7~32x0xJNX8hk4OKdC1K7vxZ&=AOdUJ>pWR!Ml25eY3=vp($b
zc@d~}7fRShfxDnev`NT)2Vw<F>vR!33YO8FZvQvM67#X#ODiNl2akXhC@CUEr~+ls
z<1K=e@vFeue0_4cDltHq(vb?Gy=Ovt8`t}}S-1$u&+{-^EVa-+rc|+0Jn6*L>!G|X
zB(NQ#_BDMZZ=l%%GWr-Yl}8iloQ~GeFu;tF<6c0FaMC47f9@e3#to!X+W4Hqevy1y
z<o~n{TkSI$Wg8x)Jy@np(H_vJ<lOkqH$@2X^Z!?|g!)=6k(RnS8#3|y!!i#HE^5wU
zKE9!mMtHOM!5h81InRadM_!sweAUU8^4s6|Jh6Ev9}z{yd3W-L{Qdu>SQ2z7CARmu
z(sAmY{rvPdiw3VRBd;uG_AOh2PWHdd&wRh%p);dFm>uA0(-TWA=&&$*XctSx)@&*D
z`G@^bhS<ZeOi&lc_j!n?T$Xdk+YL8;&r!ZzCx442_Z+bisns@`8Q=aJV#!5DIpG{u
zEa@GJHd#1H_tAF9%SvP^bk%V<T4(xZWbwZB%nIA;Gqb}ust^O9N`ikO3mKL>-zXZD
zCy+TlP=eSSd}pH65<OI=G8C;;Xdq+U$ECJQ6IP*F^!_AG=Qyd~%b;|8s0Mq?<fV4Q
z6j$KgM^8TQ0m|S9yaQ#?4^q@`qH2C<@@Y&UVtAgEdGmiN9I6~-ZkOfNE_=z5+Q(k)
zEAm!4<&lqW(ey$xVOI&eD=*JlwU4Uo$;R7J1>kV1E=D<A`U|e$|3)lHReHx*odRk%
zxWlwQNkeY@Y|2C{#MtPbeN_}`MBKkGmcV!pY;IV1lPjK%yLKubz4iH&P*?6(?($;X
zcaZ-qjed5kFYg6`iyFz}=!%)8AWYdz=}u4C^jyGa&4$lW1<ZkK(QP(LtPz)Nu6N=R
z{wbEA{wbEw5C|g2VrG;?r9OOdOJ!VtpxHNuV0C_pxE4#2|A-}24F4x$iJ<d;T`bv1
zTHkK{vh$jyT6bLaM!caZ@7^a@iF*ofW0_EC?e1s40#?`^aiCnv0tU~8h3Ibte$5J4
zs$G3@pEBr6UcDv0_JgNd?NBQT=NxDYr+TJ75krL2xB8T?4;A8{Hq2G|HOTf>{R+W^
zT^-dMi#6Fl7z_J_r-#hUB%k*`ZU+kJKs_daOXGbs2SKA8l*chl4%YI=auD8@WGf7g
z7#`_<;~kX+yNET}b9qSanC_T$KB2QOEA^6Kl<*!Uas9d?RcrBM(XxUt_^Zx$R7ynB
z07bE@Pl@}~8}v%JI4V2VAZAI;dsTogl8}PfBs2;(mxMzcr%w`^JxVMxtJHCtk20LK
zriZ&}&NlQYY4RU1A^R<3McG)H(U8R29Wd{yBqwA|4f;qnh7T+nP5JxKJk)3-1t%yG
zQP`jKL*oH^aA3q<r9SufKy?paPc&4LD0b;*FQFSiQ#(+R{W1fel0Hhq8EJ4^&6AYa
zIzQpdXE@1C_!`N*R6!j|74eG74WbVYYEy7f%m=<SarMrj8=PntZ7nWQEzB2f*M0R&
z*`i{y=NZHFzf|!{h`H{J=tspIM8gVXZ7F|M4u;xz6TlB*<aIp>IJ%U{Mi21ib%pqe
zGarHvLwX5Agh9d&I@!OFXwH7c*L6?Pqv5#XQqI67<uMag9Yg1_(w*rgScw*~sZgkW
zIMq+tAxkCsG9dGICDKPy8DHZd#!Y#9B<UEMD&7wzX%W&yokR0!Ir=ZA8%b7%I;e^4
zdGv03_oeNtLxV{4Sc)D^8R#3*0C8X@t(sir-Y2EEi6CW}kD#F;Yox|>(Mm4?C_j!q
z3wY=z(KHZOd)fx?@ZbaCbA)LGK`pF&8()6M#^~|6*c&a&E%Tt1Y)o9@Ge<q<QugK@
z<8_s~D$Z6u6Om?f>ekJe#99rykx$dn$0xW-)<ErhL5S^@Dd;z3xNG8=F45%??(uP-
zwAo6gJ`>xWo7^P|ZWTs}$>KNhK<+-VJ?fjPrfOr)Jp4F|7cyJeNhm(4$<X{D2`yun
z@TQCbu@xo+TG#Uo)p`VvhU=X5(zYGCdkjtz|Am(veredBr#T%rEvh*{2>M3qQ-&it
zi@Eg$sYt-CX>m~Xt#MAOg&2VhobFGdJ?!~jAYB5wn$uqom40}VX4G_3f8{?k$KkVe
zz4Zq#34h`nPJ|05;9OJ2;{agsk^xdiaeXqJ`~)6COaTrt8vY^#5bk&Z>z8Kmt`&tu
z_-p_G!~jryyXG2ADQ=F9|Im|GHw`bn4j@}17B8u=gJ$6LKWOrfE5_m_qCuK>-c3mW
z;1B4hF3e5At0Fa5Xp#HWLl49WM8KU}z3Eb)9{-J(AQ2F8`IsoY)jrDB3uW(I@7P@7
z2OJW!q#kBblIk2zlstd%64Ym=U9BW_rl$ZUfw;0wpZ>Y21`~=r=hbMVJUfO^K=&)H
zG-8o41QsvBrCaE*ro5mZ6OK5MiVXkeQ`Xf{d~m|K;OS_2G&ke5-;JvXSR|)IPNddt
z6|#MMs-Azk6q_vC>b$kdm95T*VE`a;$pFZQXw(V`HkCM+!bS20dXlTK`?)jIst+6p
zAPEEj7GP)y%o@l>5KcZ~1I8tR1349O0Up1?iLz0D;U!2X$}fNLk{8!_2^HgCcnM?!
zi<hiP!6>NXv3SYKUw8@RZ@dK72s6U<PEK9e_<!Ri$c>DdtFQmWOWLq_Nz^aP@6q4p
z*^HfXRzMTq+w-t^2|(f+FS(n?-p}wCUQ&~)KIxVF7hV#`2mo&40<>A&?Eit6tQ^I^
z{|hg9bhugb2QR^3^^%uI*Lumju;{)gtzL%5h2I+`gs$<DQ7m3EYW70{E&PbmhKWR(
zJbd?I=#8oBr4vi8=Fgu-{7GLfeQ8_{{f@%oC9sS!_G`Q(DG)uE^=UH@wR-W5@5+vA
zld+CcA4w&d{I_0$Y|!6r@c~@xC3uXDf9WM2>=fKdt;JX-VlW)cCr_qV@#d$TwG6(L
z$RE7~)&XUccI&QOlaagDOOoJ@sc`Tgy~J-&d?8gb1=@_)Q$@+6Kq=L{pj36Om%tEE
zTqFT5vVZ<sF98g3{bH}i>LnN@lAif4fOpdac8UoZiaB-)j1!hG@q~}?it+yhNM8Yn
zegg26ld(y^SiOYxSm|%Qq~uyJ$=3RZULx5_wJJhcAeZZdqNJB9WUNCROWOus>m^1L
z;!rjrR&JHqU2#sVULx5(G*O4(Q<j$Pp*nyoR_D<kz;D;Q6!=Ro2}Gq6b$5e0?p?7<
z4gP1ngj;6#i6mu)B&8P?y!oS-5Ol3Hw?nu8p_ibsdI<olm#nN;-oXXfpeZyq8oAW_
zhM?eyZq)~q4F(h71eDx5Rxbgl{iT;Yw^L!;L;2pj)=L~^W5$Ce^t75W<lMcsbAR(C
z*Ln$^hz)MMaL=_~GQ>+k$X8)y-6`LJu+5JE6DSX3^^!4F>OXo3M=(||0oX#ocz^39
zc=m8yN334bprN(VQ5>%}&)bytmtL}kO8cXi1Yz}(61gB><X?J8OtmIfFDd^IdPzQ3
zFQJpz!|Ekyg~l|BV&9LqYJ{2%`+XoPr9GPESiOW!?piMyYsTs&^FHdSSL_KP&}+Sf
zE?S*#z@}_S)m!@gd@l;Cmw1Y8{?SWtYNP=$bt&Ga*P?hck$^m`Uc%i3q|>oKuT0>j
zz$E+}rp#!9T}8hE0kC=r2VYYud-4nAUMzir)k_?M!4cTsa#l!JPx`HhknX{7xz@E_
zQfSviw>@0w3U@uP#PI}il_5=V0q;dd3bn5Fl5$3XP<ne;8ekEmGe{!q4aE7UUIM$B
zONZ-lpq;{@3P>op)=N4xMuY$8C6Y>9+jyj66!z&7loZhhSiR)nS})0;NOn9J^9ck~
zKhw7Tqn9vX^^%S;I$?e2HXdDCGL;;KEy1`NRxe5aL?~A<I7AstM05WDtCtY`(Mw`)
zH5d?ld6IH(T%KJ9;3-a@QBYDCrIjCkQdEx-$3+sK%L^J8a1B#3OX6Vl5*|+Ud<qB`
ztC#en_<ubS2%WfV9tBCD*wOr>mvl%y+Kt9~ObB}eATyl|RxdgKqnDf;wi8UMQ|Dh?
zPAU)?>!0LHV)c@Kod2Mg#0sr&=zcLE<eySi6uP&_Zn-#xD{ZVS6{$1#?ryE|eP-BS
zdI^Z*S}(C@9;SOM?G$ybmy{Y6;BI_!H8KIK4+v~u>m~3jFjg;lr_}qmUIL4j&&PQq
zi!YInLuY)gmq6uAxPa5uAK%-GnS@QTN(cdP^PBLLu?r7?=0W#JR~~kQ2z1iKVEGa>
zmM<B*=1V{oCRn`$^_O0vCq?p8xFlGoP}U4Q3%J;87}~woOM=9blSG<cGtF`yUh5_N
z?u2<$u~6dK)&rv)%WJ)4S%jk8b=F6661Zl@iPcLQW+{_v>DJ6#{dC2#dI?+?OZ1>P
zC$%~%Al8O9>9{7llAkB4KqddsOFSov{;8J`imy;-Z{a6%+-(t>yORT6{Yx)dkrr#l
z#fS>o|D~5WO~169Td|v^WSctE1cJ=~;EvluNdO7DaJ(ddBlM46LeN0@1u&C?G#0U>
z3<@Vqzx{?;h0GI)!B0XGe~Wti4R7t4#kF42QHRw_EL?F2JA`g|0`MA;Oez#uy@cWl
zfYnPt+2Bd6Uecj)t(T;mfr_FyeURCq8p+QZ2t6$cX6y82kwv`8FWlfz;2;z7eIg?g
zV%Su#a(^ZiF#AU@k!`VHUi~~ihSf_5#gT;Bo}yh-#N7##^iZj!oak}BCIA3Qn=Vx(
z(;z#v0Ck?D+@2biL*i95`=|rAMWr_;!S;I6PneN@dw6(4I+>+_LXlBy_<#SrWs{8L
zCFvj`_h*2f?cFhC1~c-bD<U%V{afQ`S^^|!b`_UJZBe!XXKOZ5#ukhgir_`2?V4fk
zRy5<Kf97^rrd+jtR@CUALqTUUQd%oR05KGz1At&a1;VuoQM?~}vv>pmJTtopj%2(N
z3p}e84L@i)55c?S@d(MN_8bFqZm>>&g#K8JG$f||Lrho+NW8)D4%l8?h}iVpVwfXV
z9RSWjr`A{C!S&t|(@fG7qq;V5$;9P;421(%02O5bSD`2nx6La#n~`S}U^*n6Dh7hG
znaBdienU}g&1rEX!P&x<LwJbuRSi)jTd^6XO#|&YScE`}&C?b%1|TI^{;9pjJq^Ch
zX_?uJdL$q7!+!FHYx5h_AP^>vKL++XuVmUn#eVBdw3n$#?V$0qqXgn%E}t!giczpe
z>QYkRvg-nsLsp|y09qk{OBG~wj#=!xWoM@rp9Y5`w+%X*l^z1s6!e1#2nc44Bi3ZZ
zyrupWyQ!LW=9t?y?26$V1BxEdPIWljEP@!VBeKL}g~lYZ%+geyiJfPiZT!kC!VJmG
z*6<F1u7QK~tulyd<Smm<J1z>S!<@Z5{%!tbO+zV$KuJ29LHZ(`7La+fPw(3kRZsaC
ze8{FZm!q93fKtP;vg|HZ0f1Y8g08J!#R`wGtTAnHkS@F9{o*LlT1K+Fmmpnuc4|)K
z-5gM|-v_yMhO@HyjN(a@k*$-e;)XC`KN1H3N)}j-bzilrXu@DWh03c<*?*hq(Sr#9
z*fwWd?(j8p35W&``V7D^rNasDENy>=<E2M>2M{s;0}mF66Vc$o+`rF$a8uOVB~>y;
z2ws_WPSr35{C=anJj{^WY(1fS6CV~0l>7*6K=N@>RH`@(b5c-+^~Q-(2zeq=h5%cn
z%`6r$*#c$ST>~b|rE@zUq?z~}JLU0jglTZ6uJzQ-ak{z97cI+KsV4X|6UHF3#V87k
zQ1AZ$CagaF@>syc$>G7CYjZG?8eeUatd63h5!j$k?QHYRLF$s)&>bE=PUGw`B$G%T
zjRj272ERiQ6H+w$tI<hDo)Mkp1ew#|IXDOdgQJ$mZg8c0JQ@ezZ`c?6qnCU?#g{yb
zN#}`%LKt{v!&Bi8PyPl>&?bKX6aK#d6COR%xbK9a(cEpguRy4!-iN>b0!#wIuRxym
z{&x+i@hwddrAjzpT4j(V(%D+3-B7z@#FH`zyeR|sSU4aPbRS^9Q|Y#9G@;j<XiEtk
ztSkKkm~3rXl{k^a9ByVEx_T^ElLAY3Z`1A1{#X?9f~!t`#RW}(wH1)TaxwHz{08>6
zeDWJ}IIt;(xR=z<wiPnED`v_Bx4k@3vAweZCocgBN{l4G&@$}?7r_AnWmrLPDjDuq
z5w-XOACp;k#9p~A_5Nu0oil8US3&`(fH^v@`zK(sv_^D4DPkWBm?TBukkVq}jxE0Y
z_zN&8<pU(NeZLZLedTIX)V=)DPbOmW8Zbc`uAX55lZL7^9}pcDFsYC!);h)U+*FbO
z_7`BXO&uBgO>&QE4R{Th;M!MQ115z}8hy_H049N&b#{QMgsrF#%k}>NOdj7%rhR%y
zuZG)<1x(V-?w-$qI%JA=@g&mCY*dl5AsY3iaz0qV1a8p%yJ=jvjt>i%s9#|L6Z>nx
z1RzfB?3y0!yl!^O^BOQQ>646ox$M2^jY%hqx1o!4wH8KqTni@5NFcK$=Yc-y6f!We
z@jPIS|Mw35X8pE}W@4(s_osj9CCMvNXK@d$!}(y(<;+SR6Vi#N_yR(~DBjN?bzoa6
za(4n?NPr|?iF_*u;Kpvh(G@T8&>);q3KIR54kQGZR)9(kxQYZZjl2SQ<^yn8i5FpX
z5Mexo1QCP<5VVR6CnN(SZ*0L=01}%W1or^;9XJs+bb+!Ru`3#pFKAS`;r6Q{L|`x#
zvLbF(krlAjf<3M%0SvQg0*zo>+2VvaV%&6NyG)d5f=I|7^boGAO!Axzen5Roi4bth
ziCx_XfCLh;<jBxtU=_IblwdQ9e#5cBTnCzQ0|<a{X(&^|Xa8@p1S;#*#flY6OshS<
zU5f3^Ryj_*OOPfPn=jq182dDmC(7I<cVXwVM!+HXdk3N>_YlwJj-MXu-GZX!qb<K3
zdi*Lo^#1f_*FEC<KN%TA-)5vg{GMAY&og&*V)*V#?vGgV{b8mk_Jt&2;V+$)25*IW
z73)L*6uXrjmN#rQ?WlmT9+ALUr9pGOFN#khHjl?`94E#KKgR%XRcl7Q{N#N@sfHUx
zi|PtI9l9mtJw1p6;7;m_o%4)9^Q`eH4{`dCtbP`iVhGY@Wncmz!FYFrIG>yQJKTM2
z`3Q4i@A5tJ(-+ydtKG{Y;_AXZBr#hORzdf1R`DR06{}DAL`3n6U${A?;K|4I_@KF7
z9|Un1#@^Z)eSBB?5-XOF&64uw8Ba#O%y40NbK3w1$>W%oatc>waDQ~`t(kWtcWHU?
zsm85$O|KKkv`IR9G9IP`l*lLbf4r|S`AeFw@<ZXY)7ybt&3h3qL%`9vp+YkJwR$>7
z>H;~=>w8WwkUt*Ot{ODIt+c{P-Yv9AGv5z7^d-F6eE3mDur=fcuRz<yUBU#a%gdh+
z9j|a?E7~`vcUc(uDunY2he*6D$~^t61$wMci<aExtnXpP5|KwZoor8JZx3*0h1`A#
z4#sF_@dZ?6;*0R|N-x1`L$;srQ?qt1x!v4j6B#?w^oro)X4LtHQsd2W9@mo5$>+PN
zP9f^<N4GO7kzVGrC2MCeyeWo~OzwMOz*N93!#Ly5>pqA3Q*5FAqgMpioq7H@B>}r~
z&aZ-hE@of>6G{m;HFc3Zs`CR9hg+4DORwa+(e6*((gDJtU@MaSr-Fu{LKLa(`Oy$W
zn#xeySDJ2r6cW7U8Am!eRD4I_VQKLwW9=;2ysYh(Cr<FPP(k<CcNIa(a&-V;q~M#_
z^(ZoUw(S$Tn34<0({mNM-sMH|hVrvj*TM4hRS|^mX;~!@m+Kpvj3v*eB~^Z7s|hnb
zLg*NO+miY91qc@!;)Meb?9yqM0TNrUkeg=blWAK6iyW*o=^IGIYfEszIr*KW9(tCQ
zpJGVO^zesPizH$s!vzn3Erydo)@3B_q8^HzZU_JovhF4{6_U^ydmmGi5#zjL(#Gbk
zYOO3=Nb$6xz9a`}E3d2*dgYZTD2#Hub1zLE5=d}T;z_<M87|)Dg~NCN5p&QQrueZL
z1r7N`D*{oXsXAZ@iCl%A`Xun{!kR6<=o8tRh0|SjMo`xXiSco>lZ?IuF-3f06+iz>
z%|4J>vJGI+Y~kP%c{A|(mo80;Hfh1T(^rU|y;L-1-<XMBu}C(YL>!(ViW!##os{v2
z$u_Vt&cYHWuoXwIkWs1q^UU7`#U`0f_5!5TPsMWK3?)(=E>%LH$%O;Rgztv0w)4lv
zZ8$oM>i$IAcD-lZ(F5)5yO;i(Oe&v?h~{J`CG=>?J1>e@5KN09&%?Xcv_)7h(=9UY
z0hJ#g|9BA>HzyL`9cf9X%Q%=GbJG|d?RX<4L8*IH%spv1K-HVYN2ZhR3P$XdRP+Cc
zB~>-A1pbI66B*-FbeZ`)x;}3wa(>jjmc>pMqHawVP(FK|Nr!SC%V-^`RK=H4qT-eB
z)ED~V6+y?y;9~8>z?@&qPz<zFKw2}<?2RY4W#1?~X2WzYRcuBUe@2P7eT;Z0dxSet
zhELopiIO&}PG`*7q0Ts;>io}QNn$A919sle0|s?f&s+H%L`pvod)HOx`jy?>?wg#F
z6b?HA?Y)>rR8synW(t@DH+@|duyfZD`<3tNvZik_ZKTAymcE&*SE_@yRV3<?67Wtf
z#fl~MjU#^VaPI(6n~DJuldS^&)uoGHPaT?<e(ig=OM?z>U=#P)1RqW8F6_UpZylw6
z|7du3=|bL=EUPsACbmt`9bFKF?c}7}5Mm8wQY7*lQ{4<%#k(I`MCJ#<cd1EU#w&7Q
z4z^YjTk;|0C3<nEef^e;IS&Gc@ongV+ZD0`eA^r{&8%4D5EA&lBQ!5|KM2!|#XH{<
zXTE1das*JM2@#IW*61W2_f!!J>5O3O?*e})i4jD?WJdTK2L{Jt$jEGnX-ae?P;}9W
z&Avp@g!L@%&UMl!WCfkm!HR|El_KnoWUn3#_40uA5<?{&^FK?$gG_wF<_cojvK67W
zC8{(#6*vT1oixo0>5PLLQDe7lJ|;ge<inMWGfW?mLqWLmmH2n`1LB7}h)J^*-jGk?
zkwS|bkFs=p?z6tjba^KaEYs(AHCT6Kjt4}Di>?y7Kd>RUBA8BECvx_U>!dDuBkH0$
z?`GPvPxTt<8T<o6X64h2nO_o^mJRE})$-?>%Ii@(Dsga;K=m$|Dxb|vGrQ6}mSGt@
z=;3)F>=vpHqP#0VAwpJ(Z=sH&Fn`{~5+{tiRl6Q}*9r*DU44q!hUX85)xFC27U!2V
z#roE7^rqYCx8&584J#sv_<{0_BMr8ZJU9Hi;WXK4k9!wQBc&D`tOhc(dcQ1v6@;e4
z@OT2dsI9DfSjZ|9Ezv+|h7}l_Z;Z>+A3?}23uJ7u<`v#Bw$TPeFv+rkHLKx?<EI-u
zy~Mb&^)d9xLQ)Is0s-?wc1|*VgL#{Y+-bY{PFYf~M^Aopw*9meK?*jCo+4xA;1LvV
zB_NK2)i@>fb!<L*huXKE&Y2)>maf;5Jt5PTL8c@vWL9)|jHgJ4Ib`O(6;yW5?x8nh
za4IYavyr>58r*&JB&RWEeqY2V_@NdES~nKS7iSTZonuQrXdU7*?M2`?zXtKmxqA5W
z&M&1J64KWPk^GujCAVs<PQNNV&O|*<T-B<Yj@%V7n#Cxe?dE1R)`fmwwF<F7VoHY0
zRcYeG#jPWfKlMonMcg!AK4DfoWy@DETE0ziPiClF+Sk00MA0KZ5A0!`{w?=Pg|fwF
zwEPQ$!6&F%)XI81Oet-pj4hYzVEGUWm;l0AzlDpUyIDvOyXO(0TPrxE;Z)}l?>S*x
z8X!gjW)3ul)kumAU%UWXI9*;&m*Yh>Vowfj%ouhyq_!QUrc|bRzVKlSMYjWz-|Chw
z1Ib(GDy*O+(cQ911&@;0T(-JpTUHr*ZQc!`B=ZZ(B8Q>B*<hLD<)18IVFOLfdMnh0
zVNAB8JZm#6C>g0j4qe+ZWgRENneX=GA2oDtxEONTj&jv8ae@=B;tP3lZ`>*d|9bUQ
zEj-<`ypZc-IB)TdK4olG>xRJBHE1F17xyY*u?6`>p+K(|zxtFA3;S)NB^oX}cRqFz
zZ!GH8DWc0RW>O?(RphC1L)?R1;&O?~-!3YYUGn21V|KS>F1xfm8DHYMbg|t))Ivoz
zu?to#xoRkqdrl{qYbU?7-cQ;+KcLygH)Qmo``{(M0t*Lq?}DT>yP|(q`jzG&!3!oy
z3ni16Dpnk-Rp5((xT$<q8Ex~()oCcObGim~(+Q`SB%j-!L(6;UX5zY5-OEf;#q656
zRVS2qe|VO17OgCGc}}kcA4(Fg=!C^g0)ce{FAYYtWc=+61?-<-F%tmC&vTUc9*2we
z9ga6-JI6{idfKx66h?{mjeG2pnVja&>BMA7D(}5=aeBqGJwCsJdiv^><!>UT2s<n9
zc<I9t%MmaK<)Ex&lIU!NV2Bb8y3@n*6Uigs`9&ASZN$yroc1OTm*{T3u4ulbbo(|;
zG(P<kuCzRkC<n*!(GS`8KA;OcO1{4D;dneo7DiB1(#X|g?cm;DY_F=w^Nj1^I94)2
zDz^1GoW|VwieFv^_pDU)x<oNu8JEi1hhc>?cuX*fql+x)14-wDAB6sjB)%iWlk}!0
z(hf|viZlcq9Fqw80`TN&k^;QTc>jgvh>|cvQQ3-;oEglmr`xSIFYJ`7XI9a(4c}v@
zmk{j`D1`6EwDs-Eu`vHj*aQ6Vx2llhX#Xb7C>D~)ktd8;(!_I$M~FNMfde(_7J!?z
z^XtZhaqo5@JNQS;$du?L!$UvzRvgASw~V{OyLNt&JK8?IX{6`EwD|~!yN>{~Ws%}o
zGX-Qkj}wo_nb5%xVTlMS-h8C{CPY9_K%c|yoQCeOfRCy>FJ95)YYP8XH|ooH1~#_#
zOI$>8FHicL7cL-%QxpogE?t43f#7Gxp)!A%j5u}48Y$(Epu{)gZ_?c=y!BQgFhZ2X
zDfk{I!({j)b#50l=owAQ&FszTm2Q^&7}^!oGgVe-V3%~mAmkk9*|;;%CW4n>+jR>S
zBoH6<3e4p+R2FUZCU+<BQ3QS6PH8lL!6ho6tTdm+rRcUx;f>NF#hn(R&Xw7(6oH7N
z${5}Xz|&$?tiDlmiE<|kPj%oj3X6d56}vS!J>CmXZ0aSXy7^duC}Is0L$?QT9s5Wq
zS(@BSoZ|2beHq6)gyeF<!JdHMcuzqZwpc3E;_h;HRpG<b$x}b}-X=*H3o>9{7>g3V
znffZ12-wN34rD)9Ds)EiHEiehclJuNelTF(M2El62SZ4*4gL1|qW4^wJ_px<Mt*FK
z?37g>?v0*0g`vAi_QC-<v9I2BTk(9Bo{cd428;zJ9}jg%^X)Nc0*S|9u$rwWkDhta
znHuan#pZ5d0u5v<kR^%bt~TY<mrCecbR2=@lUwlF5!KNp_pvqik&oK!{2<e9<Wx3}
zia<Am<#1iG>M}!_NGPg7(VnHpwWbnDN7Wrtp?ES2aQw~i^a6vTYUrYvg^%>0sN!d)
zN?cuzyIJ;-WN2U$mNB8~mRRZj!52|ymAG}4K7kWH_EGizsS?Y=4R<OOe?|CPGTq#L
zXP1_@WMi)Hj~}=UX|(wdwOw}CnCxPb-iVTvk-cQ|LY5jw%&rzjpN(tMNEs%LgHeU5
z%>ADv_HZDG*|j%Gd+KUlEhD`x+dnV6*O;IDV(J=nLE(tGl<epiNjtXgg>MNFjT^jH
zprR8iN7)&qiUX1_ay8B~DTET=lNo_bv5d(BMD&N=T8Gm46thPHkh*tP(FTIGTzvQ<
zAMs-jN|?jn5UF`BXebP+5xC-v-V-8yk0QO#z5e?Z>Kz8_m~@!s470$J=(2kkdMJF$
z00$&MT$^v3+c+-i`_;9SS+h8l@8O?MKpa~gP?*Q=`4DX_B}qq#+r1>PjUHWOC!<j~
zG>zSzuJ1bl=&L+RF$5ne;e`$XTH}C#4`f4YuEz|6$2jk5>0jah>=q#5yGtm1E<ncV
z3i4CLDQi=`6zI#P>K6Of$x@={+YrAw0_bkx;dT_}@bd<>yQLLG^OFF1BzCwah@o_G
zMEssE4}j#`-9%;G6tdJuX184K32izYta(&0=|Bla!K=9)Q^z@^D<-1%hlxb0R&FpL
zV#`RLWb$!9xICY&U46}IAcIIw3C}<4i4q}+#|ZCArn+-gx#YXj1PhJS8WiRB5^0ly
zsPPXPvS~mR-#&JV72I(VLeQ@d5aK?eo$a8dz|U#GryuE-Y3XE4cXcBfRtZlYy;e=a
ziCW2^dq|>hfQQ<X7}#w&^1<V;l%YfTkOrJj-c!fDBGX1yQ3BOOAE48n2Hx+YNgvE+
zw7gLO=uhM#nI?Z+^qSM`ar~~*XBhyxkeo0W^bHcF%!@J`F8^qm>@*-xXg0g`Y^|H2
z9EAKLL~M-@Vik$6>Ribt<n*Z)aWs=v&UM`r8V$rb@TGP+5OV1_G4A#yo2ZrW$--Mo
z7Bb17ukzBG5ixN&)c-y~c+pKnr^!-)0duJ*4LW(TxF?7*4{~0j6b)lA+;g-AV7ARZ
zDPNRF*#J)&oaWHax*I7kl}fb-zo*ej4+z&(`ffL&#WD<6CMCyfEVul1q;r2umKG$l
zUgIv{HDqw&EnDSkjYA@va<eqriv-~%EN0A#I3@ws@i0u`)C3ek{aph<^TrhiCn>|A
zzyNKr*$%?M2r@}1<eRZ>9^emY0-|0%(^pDzkvt=*SiG%G8z>|p65vBKq{dSI(j~uI
zdIFzV_F0s|RKzYIFiixH-ak^prd&OoG|AkvG@7jc)3myH(PTK_P{bjxm#0LH2DgG{
z{b_{;txH+Q=%k7B`vTE*3@Y<wokCe%nL2`|p^LYc*DUm%4?A6aX!05LN4D32eY4~n
zRaOivK_=ZuxA9e1n3Dp!SSYs9)mm*KyV%t&;YHi9?6JMu@uu5@PVbcGE<IH)Xx5yE
zQkUgQi?)ppSzzD2PO&$2&U9)D_fA2%(PkOF)0f?p5)kLCUWS5RHOq;(91Un*2hrFY
z46L!Vhay#kNQgb@$y-Q#4xn|X!}oKCZroH5v9$H4xX)-`>vq0d@1D{Q0iuouc+juh
z&J}4kB+60j?X9XZ{f#d9lCFHkBvQ>8=m(9~T@|s3IGtw{X|cW_9AlpY&k{l6*^Ygd
zW}Z+`j))BB8mi_oW?+7gEUR8suBN$hMy97E$c4Z#d`_l)#$o+8m)2Qx2f1wL!xdRx
z#}3+-E<xGu`dMkfZVn`!%8ep;Iy|tcJVoBROG36Upr!9;(n3V}hky~^GH&!~Dc{4Z
zzW1_&^|GM>2l!f`TNYnL{Yq=<ghm%?2EWUWo?UgK8+=|6Lf+`f|8ie3cscU3Wn55h
zLNE?(ilRD5;?f=_pBJ(b(H@uhBbGGBpj}Zz6G<YCN0RRgyqbqRpZd>SizUCv7s*`D
z8|VLjCziBhK#>aJAVM0^!2haPk|E+eT@wU#)Xk9zIz7JlpNJ(cMsEz?nAAR^#<-f4
zTQvHgTvEH4RoV?a7Yn9w|IcDcZ7}UatJdI))03aHp4OcxLR#?<IxpJ~|4}Rv*yf)s
zwwUD$IK86xb*etzB3(G<)ZCf$HzMWW$BHGNtDQGxpL2brF`k`MuC$Fwxuxl80R5rn
ztVJbL?IIEIo9U5n?17$|Gm2D#)#~?#*QsNfM1j*(d*F*Ome5BhxzINz_BV-G!$ZoH
zFV@h(--q5xl%HW(I{+Y8!8p-Eo-xM9D~9}WdRLte#J5}CkSPH9TOi#eqnVtwI!w-E
zc_4Z|y?pW@LJl!}Y8?FR5CYpzD$!#=M^;Suh7?z3uvrV5i6%5szli06LPIT(X#A6!
zw@XWj`eTQCKk{!9XC|w7Z%{a^J+7Ke8Wd;^QD<3maPB6uOJo$T#eEukBUzV-Pls*N
z$oKYe^f|gq+p}0b;l<=-rBf%x@KA}wk^Egl`H0I0o=*_GO`JsQ`@WO;8pKVh2$`{q
zlDx_N#=cQO73OC~`vjd|pNQfTfrt4ukGR^*<L$W9xclkUsV$g^qR2-i-PY5C&j~he
z7&Cdjl$S}=NgCrOIU)EIaaq$vp_uaIhH4z_8P#YcALo{?BopC-JGZ0vN+!7X2OMV&
z7DLYz1C25&62`aQ=+-KCR^EWP`P-qhF_Rq>CH2!+gjfd!e2R5Y;-#<-O8m8h(sk{i
zq+5usMlps-+Il<0f(w@F>}GAyQm%nm2ZbJO|AKsH80(-AI^>5WZYx)ZZ(tpi6nsT9
z8x@Ovkx${5kxKc&r=o_AxeuMCzo7qOP!2sT9=ClcgQ~SNZ;d3ZzInKwexC-NSLVou
z?@+kP@`pj`n~2Ytccih}SX6epW>8Y?DuNi7dZ@pbr7abrixc>1a`nVy;*VdC!ePem
zQlpNWrN!6@v2eXFoss>x4jryooPwHZ`SFA~r~g-OUGYV^9iyLJ>WhZ!i?BZ9BISH|
zQOEb(OQWp0Jj~1mRsY3g3XRitah^#M;>z=m4t3zEQNqSMe#@GMizYmYxP;N3(SV=v
zL--O?iH!{R=S@|P3>CIDbS^x$8)^KXKvw|tASv+SEutJKfvf`}_BTn74$DWQ6_OuB
zKhL`({0a0uDn7mDKL7>9=Fh%dK@f_Eqx^nJj?qY`GeU}0BM%P1oRg-IR6>qOs-JqW
z{zJC4Zxu26uw2seby6~w0yX~?l<eg(-eb>xvNJRoE1@809wo6>R56S9Ls*?Jq9Ok3
zBUD%kh4c1dgwz9Ttc3FPR8l=8a84~0E1?LaxVe2by#G#=K$-Qj$i!JP``wCNj8jQs
z{BQL{4151!(^aj<V|^@zvac*Vg{4rkWaxoXp9ebV?nss0PL%anC6J$GgQN*T<@$TF
zD4Zc|KhzB$7SpIFyozROu*iC)nGBD<7<jHW^y)Q(x03W5Etn-$0ip4$A#jR1wP#YX
z#G~rUjdW*L8J`7kkr1BzP@!sP59iA{7(_yc+=u<L>*^|bSl7+)g*@+<8^0*j>{j@R
z-lpSu-Az?{|BBr7<6(?Q#>E{}>m6$x4PBudjXeDFRjkQ;Ix{PF6#^dPsq|A@mTRvW
zc&&?)01qJaXe9!P1a)J=aPnfSV(FhDz~ZG2=Fd%2gCnoTUI`^^Yd>*rw<CKgZ#eem
zZ3ISoQsh-HQt~Kfz_%WcN(BL{-dc0HN;b@S#BLh929f@$4E9a}=^hUb8$N!dunWOg
zIPK~E?z;nf{M;S(nD3Uhv5HniKV^niLKpu^G6U@@bzw4-L0&v4FM$HTh|ze@c79xc
z>Ok+M(+)&%@1S+^B^BF7(PE}(dZkm#7?G%0s?Ouj(j%AM)%nc*@*9<PD;JZ#1=Q-n
z=}L(f9O$~=748xJ6r{^bMH2m53GFR(LM05s3?w9r&W5h>3k?J+_Y!a>h*FFfi=%a`
zPVhZkf?6J_?&S5Z^yR+ujkmtHT@DD<bNTvWe(|zMuIOr5E=8oaP5KGzp3dtg13C@N
zPI&!`kd+uO=%5*hHIOe6@4nED`M1goiqyZl_Yh_QZ6WI4b=|kr+*EeS$BPfT4hIgR
zLq%%1$M$RMc@KY;!D9tXl8yPp4qeMp47ZQFQ3dE_d9&Imy^yV5wy)jjqvULUN!_MN
zV<QjW?95P4GZ=T3(#;(^reN_=6R!BKj&av0L2f~PVSg{Gx7>xIzR7{L2D(+6H4Ia@
zG|k(hi8Mb=t#Oy>N6iVNZk;b|>X^kc<=;yXKA?^>KMq0@(&td;_o!^s6MkGhQG4gX
za7(QZf1Fo-HkLw>>6PkS_sM6)LM^r(W#~%@qdMw^a|BwBVl6SXH-Vb6vrOv<v+A8z
z9kKJ0SSzCDaw;IcMgl#tMyYg*B86t!{#mBg?^-sh&$s+MC_{<$Wo+HwmgwG?_J8`?
z07ndBzxddZI=)|jO;>aHsOj?}^=;g1{-lS85D|OLpJeTR&A#PL&VBN8nT3!S0nSZ|
z_|CqfQ{>r2{2LM}(o;*as@B6h?%By4$?{m*po_MPn1OQ0{2R?he`%G8kpCKW%#!lM
zb4bE(^G<7yn}qTc$V~nRT3E59QD0lY{4BDoN@%%J-NPovh{D!G2`iQajr-(na?!cy
z4wt7}`IX*p-OyzEG2IxZ$*vJfMALUUJ79JCI<ion`u5Mc&rAMA9qii}j~71|wygrL
z#gd?zpGy}@0qswsS;N2gH&Q8Lo6gt035Bng>6g#-znF^64D^T3#wHOfR5;)HrASJM
zb1O`tBrcKm*A^yqS$yaQl|@C@GXce*sC&6Engv|JIU&3_2~uU;jIJ{E<=|z7o9)%!
z9<DfYcrruZ=t5>A*zZM>UA{!Tfw`jyHv>p+n}tIJQ8Daodb~q+6$sDGDA`kN295@S
zQMaa2fCUrj?XgX|4+?E?gYWCh%dD6L!nTAKE%b0I!uUZfxpx%h=_+wZnFQqqaX<WR
z;R+pgJjlU@D9njSPc23I``tNf8SAIU6+k2FeciED`1lIl^ae488^LmQ=dBUmLnegZ
zBtOPh4-B-!z+*1T*5wM}jbJeIxlQ?9kclGDBps#X$zf3QjTn|>cJTG*6&tHZIAmv?
zPIAl~Za-4ELVaa(c4ebe{IzQihQHeR(_7`6!x+ivfq;vr&RoCr9v9UHn<-@v<1H|8
zt#XRBy-S>@{{nUy|K8O0P%?T0E)6_|eE@y#A*=Qzo{4<$fN*Y4l|>s(xz{@~HbyC^
z&;R2|g25<}=K4@E0U6|b4=n1U3`yd#s;llmJWVbU@ujC16-e1h^xzB5v#&i4KzYwz
zB9cf+GA|l6e2=mfX*zwFd@{MBmyTjMZCyU4@F)5_3O)>MRAR3~M(=|O*q)|p-Ppn1
z&SSlY=^%Eeh*Ug^X&+am?V3Az;;#eqj=KL=NWKg%;h-gjK18?;X`inu>AD@}W5tq6
zJ`cea&qQ~U2pHiHb)rI6VoC={#M-3|8}R=&vBW@NGeux`T;MyUAXY2EoTUi<92dk;
z3V{rT@Kc3|CxpnM!caqDS`op;PGP(*VfG2u8%Nku*KK~o+rme}JQK_?5fLm)f)z`C
z70_oQL=jL?H4!oWquXK=BAh;Ag4LpTj&9pQ#Vu0B6bvOE`be<)h~M`S@v0V&N|oSE
zl|)rb$Q((yr;0zRmP($GjH#9guNGM>5X}mgRx=cPS}pxlL?**fO2<&9(MR@`h;$BA
zvRy=k9x4p)kfX-JCLMCuunB_V>mS(U01KNGkQ`Lgj{_A3v9Jk10SlWPK;^$o$n74<
zZyG9G_$Vxk$Zt*{4n-6<s}(Rl@*rP0@i83gD^EMAi1`Lpx;ZKL(?^-N2BAZxs859}
zP6fyFl_#8pZ$c5&X)4<jDvKgYhEysVH7cx=YBolyGHI%d6RJu^YV>Jpv7!nIzKVpC
z8d%swxkml)NHN(+QEF0dqJUohSatD8)6YmN*hoF^Sh?9(^+TG5>7+)zsFs+oX27Io
zrKsj8m8M*pZYvdT$E40?wYI6z9lU39^H|sf{s%Vc(7%RFI`x^wpp!NRcKO7U2yy{2
zn(S2r+FD|PDS8e+?1Mh57`EDFaPt|#8l2e^fPW2}tP-I+Ox|N*lTH(NV=6j7Q_ETk
ze=Ka$NgwHFvJN-PL6`>knYf;qV0?_tf{o2AsZH#knFLUqzIbMerAxw%&0?p_rhw)F
z#^&8q=CLq~qGuKsC&qTQ=9ScU1B~xJHfE0SGwpn4{z1&VcIxh^nB^Bg%Qw{cOMa&7
zeil(D_uZ-QH`iLFQqy+%-E*I^E~mEfsl7``V|mlxihkOPy3XuK%r-Xv-qF;3F>&j8
zYCAS#)0=+A=3>S-YYhdl<cgm`4jYZUF|(qd!To7{+7kmdV}pTXJ@Rh3sm^P$B-O<E
z#dGJZY3ICu6-%DGHe=}#8n<o}w^A%}QYVzjM$>EJKJ(mte%gJR#$(+C>xFpinlOKy
zcEjL<+`m14_;dQ9n4i3HKFLt03#0KpL<fBuRyKhdJ~bi7ksu>@;cD|t-)`lhAgzxG
zt?QxqLr{^E7_F~TfGcY~$uR&Qo^Mckiq9uO1~K)br**cd_e}uce$02}siz=9_y)WP
z5UwYl%=aN&_X&Ox_=MJ(m6mprjmE_^C;^UVn{S{KKxo@R&#;Pb1i%kNFq@otLSHzX
zbTHA>dnMHQ)y^<^=Hn8a1rwfOl_tFB@ZhNeh-W@t6O3^(oKd`%#1??>Z9=#~i+`Mt
z=LvH^k^rZz5Iye*q)iWhFCG|0i_2gZp>*c84kr%-;5s}b08i^rttvduC(cITVcz9K
ztX~9M%+QBnvrASKL=Yi%w76^a#BdnBQF@gAnK3nW@bDkiqyd2YyFRAbI{N2XWN1Sq
zbs+jlU_{nz?9=B2mq+1p5)pZ`al5Bpi-vejNKdS4(u7q_I#71APN@YDlH<ouXX)=^
z(_PP^p4NpV_(wkuPhhPlHZluHT@8zcg-(V0U#ljt5Umch`HOgq6@08}GCsppaTdq=
zIZ!Gf?n05Ymo`N($emS!hQsuaY62q@3XI39CSl=8#0b3c*`yqs=;nNqkNFf!=^+E>
z#)uB4yBE(GZG!yHXu~?0-o5Z76=lq>Ph~bwxG$D`AsNC<pNh#c_u&jmS&tBrn#d@X
za!aOl&S6u1%m#M5P|z@^g2TzX=nbYMp>P-($5fOJZKA6wImx8)s8mkD3=>!q>Inl6
zA^eF8a4E4@q76ySv>Cv9;&%Yt%b85*oJWCF=2Rg)Re|OqRDsR7fcMgcRU+(Z9f@W>
zE*ciy-k2&Jh{XHssXxm^B8_fDJSU%#v&bh=zj(Q5NZ3J-^2(={ZY0(O;D*8IC)pTD
zG9Uk}e`!gJPnp5^JRdg=`ItZR&GPdC#yP(HNjbr1Z)57;yq|M1ZgQ>;PtBNSQvdAI
zF74cT>GXlYdEnBSxPTZf_N;QQynC8{AMkeOhW6`AG7Q!<`EmFC*(0X1%W}+RxfkL!
z)--uUT|v(1`eLSd^ODa)l;9xqJ-f{NUksJJ76sR&$!ZvXR&^1LLimfyzBN@|M3q+a
zdv;0p1c{JpHu@B{ko$~vSg`~<yX`t(_i&!cY`)ejt3G(X{-H(vV~d8E`Fd1V!&Ama
z`{vrztor2VjW+WQ&cOjWY)^RER8&N2TD#zOfGQoCDlBPI)=X@W6#$(nvNLKK2yUVm
zQ<=yL9Byu<H*Hm+ZEMGpCf04+S*^wZbl=a`&+~1E&4Ig&Ey)F0uOyor*Hl}xI?IFK
z8q)e|)G{R@h?Ce_HldGHOuMjF3A3y|+dUtQ1h%Yq)hV{1e>0>9Ynl|#r6^tXNG)`W
z$oi@*bQx!V2zb$ZGS`6s)Ieo<cbb~%TWXREC{1MP&7|7Doo2t5?(YllPhc7l4j6#e
z4&-G=7hQS3&ThV#`}lOBy_%`Jw55M>g5FKsr&hMVnQ0J1Gu#+5L@_h;N_L2ok!ArZ
z6UxN9ky;aVuRj_1KAg@lmC3^{{7JbC!RbBhNGB8E*Wm8+vEj}!3b`ukoKJYa+*#$u
zb+X2xwV$?WCJ-xQt<9AC)}IjYj*I7G6KoUEU!zis<BO*gN{cmWt&?{aJq$yqwC0<3
zp`+!6)RfOgQF8B-Z9Xg>O-+eAVM!BAQbF&}mRZEgY@hfwg-oA4yD2jF!GA78Zub4+
z?6&`WX-?;NKsPkNqdRA`m3gkSHS1Z<JSu15_1wZ2n#J<a53AKPZxrRT?#-6B_7B<^
zDmA!60|xAnlRraev1sz9r90u$I|}(#6ktX8*=pbPD)eN9;`hK!tCi2EYosh|IW7HI
z(xgptzW#Jw#A;R|Y!zSLfR$w}FMC60$=$GRIY4gtbr<u3$OeTKv02Mn>+>-zX@a&K
z4-R7r%bh^Axnh}Rd*<z<yW2crZaGU^MON=$x2<<i?-a0X^S3Oz=j=M3Z$FjasLkDO
ztlJ%y|Juj4cW23EM*izJ*-cE*n!GW~ZYv{A9M&`e?iZXoY^HuI3j4lT{T=h$8MG{i
z&$>;#{QTE%S87&Vy7o<G%mI7*;!TC`jj~JnjBcEHKiHOju-)GhQ8>11J9>6@q@%E7
z+S0e%#xn^&l2BOWUnmmx^POU&Uoa$gQuySaH{tX643U2pnl~8EdRFVNk42ml?)N3P
ze<=6A2wJ{4%k0-^)|Xjyd1G-V+;$nmd>NH@*?xbcQemw2`Og5>jmo8_`>dxg6y-nU
zTwPoazX|wRole{p{Cm57_FKCPuq%TF0&9pb75#@;l3sBwmSq1emf#RFC=&?3RF9$L
zxx0YAZHMWLz*lPukxGUor-=&o?kMUFN}34<%kvQy+774jDqPCW32~t_l=PQ|8ll@t
z4`2_@o8!bvr_1j(Kl()^UN&3#U@%keiFo;3t=oK4D6z!5g+|{G9|7UoZ>^#!YhSL9
zbD9`t;UaKX8%-ZBw}<1GJ~2M`wEcj%!l99+yNwt~O%`a|Gpn}g$qBvDY$%kIE08#4
zf2)l1;dX8wqhq4>qq@O~H>UMrIfkchZ%uX?6cS|{e|#Crl6g!fcWD;U1f@+Zh;b;U
ztIYg>wzT|yvd2>&fDw>w89kh9490)|oBQXF{ZD=0WBCMC<{4$`6lr>x&&t&(g19rz
ztR8_BF=@+^KW(O$;TXI?R>Zg^+9sO8qu(ZmB}|f;fOyT+faGfrPJuMYU3^WyKP}KU
zj+bG&&{?Q3{Zl+*QhiOCYYm;8C_7GLNV1ddn=B$p!LgEbqjk$JUP|@rOD#Bk>_)Oy
z#MlOsCW62r-8NCfA;Upj&GH$ENtYpsux~+($cP&_CG$>|RAQFrM~&Ax?5(q3v%E%}
z&2qwYqh9BtPJ^7(UmF`F7FKdV?-ilJO*ab=bS^wfPgQSiy?mB<{w1S0H_qkl+jqAt
zGjjwY<7uMkePbfti&O2EtxrBGEvkA{Q(E47D~-3Jg-qs|fwWhgo8pHmU$^SqTl17p
zUsYk^-0S8%2KnpW-5}<y9`Cx9+^{ZfvEPXHc)NcG(UWA+ydKH>P>HhB;!Ew~{@}G(
z61-4<LZ<E6c`cT7Ug8X0izN#c9fWtZy{^TQLoH&ZKVk`AaS#2|KVk{C6axDrmdtSe
z5leiA#T8!u7?l1#<TGmVA;f1)kz7Z#Q|f2D@3^J{iSH*}1ya9BF_u=}DU<uHE)xb1
zhy7-(o+yh=+dkFtkGcCe!GF#L%IyEyqn%X3+wr|lz@oq1g8#y!@55*2KFg$mD-n5F
z0n5>>i46*m$*;u{8S`tgMECSsED8FWs-hdTnal3p__gpUM)#3Y_T$7yJG?Pgk9OZF
zgf;C{jgAQIzF$rZUaXuL3I0Aemm7T0^{}=1doSx_u7hsD(U7qZ?Bt=xEVq_JPNrX6
zwH(hqBxgREc@eLMOHp>1#JOg-I)+D~S3#;oqio%I)`RK@{dJ1kZoQ(n0|EdlvNd2J
zpaYML9smF%W1`Hukf5>qlT`uj1ez867e4tP&NmhQ2YdG!)l|Ff3p@}?Xdwv!LT}QG
zbm<UkDAK!#bP(xHP|$=>Lhnrh0jW}?gVKAKUIbJ?Q4mxFL`0Mub?^7=_w2s!Df^Cb
zKd*0Vtue>5=9=^W1286|sl?a;8)Xpa;X@2v03#7Et`{Cv9%0b8cE(&EMMdWmF@YME
zRzRuJf!{?4?BaE0V<ZdbcqAk98YMNV)Ay7hT6LA<+bz%lUlBL%q7VXV&({ZLg#e%^
z9P!EZZUMOuF~&k?_Zd1=HN+NnVyR*Zp-nQqS0wwe_NI;#!NG$Hn&%UOOzD{zHZ;NF
z{a8XFRZ23^UZokzq#GW^ACAjWSHJmkU~&tIDO-P$CgqOj3<gnJvBp8kr>|;xDw1{F
z@uZ1N0bV^FVZM{<RLEQ+tY|T6)k&T~X0*vputuP;CQ4T~$9*&$Jm&QLeAb``{QS`R
zSR`T!cwrY$ni!3{xKw41?z+6luDB?#C~=28=k-t0q~QGB^+v>n4l;vQOhcZ2FP=0(
z8-(&qCqReGl!ok|c!DH3c8lNiKWCVXNc7AnsfLpDfHWbGp+(<ziewp#r=nOX3(4QP
z&7UD2OcQ_f2AmVF0GxX}nwt6_rb)77G1<#<E$_Dy$#}8k(GRiYL_BXlpuGA3FP4yt
z7vjZ|J3qt{a<Ly`N#YN&gj}=&FP30_h$WBDSL4N!fFEMX9pN8h$rTAf>lb$fn(6~<
zjQs^|KDhHdnhAWU(I9Ah#>msLA6R<<?=(|ilZHZr>S`o}9N6MGdc=e3ha#$+WqGVd
z-H#j+JE~l>(w<JlHkS^cR$XnQU7mih;8vnoeXXNpX@0c1syeLN(<o#4>Dy+jypC$`
z`P7wX<e$wtzE%5<!B*D=77YdzYy5jsS2uO8qb9;?0&mlut!%q5y3BXfT&K-?_AZv*
z`PsLc!29yg51*8_zYY|+F;DTLqqe1EFw8sjgD(5Y+t0Gsp>(&-1kZ2mUhf{mlO`L)
zYebblNfQiPC^PW7b`PAD-W^V`PB~dZ%RZ$Ysk~Yh)2P~a?pB<9IN=8TvwJ7^Q58n9
zY6G!CCgtu{m#{b!UvO+Os89m|-SK_NeqV!%<$Ya>mShSeMaYPgtXNhe<>sDgIQx6M
z`iz0pmxye^QJeQ<*xR9-qF4>6-rM?|q;N(^yydvZd-5DD|JO1Sd_32@8uFS_UlzC#
z^!UBsZ$O8>QE?q$@m`R)YlrzEmQ2TcHQr~V+D4t}-k8BlIwj}veewS!mb?$(7VwQm
zz%@t0y`;=n3rT?VE(?t{P1W8BJ2pEv7Te!9J-qz~u|%Y~E-B%cSmM>(K*kA_GJQHf
z#~L8$&=KKr?dHnr`{tG=VH!@{&DB>TEsx0d-vw0OeD(s|f?pqhPttJn`Qhv4w)F&W
z&Vsh*r?#Iv4yZnaeZIN2^8G^h%Zqyv{%u6;d_B})FE3_@Ix)F{OdkvQqn|D_5&TUH
z<6Hqq#p33xQ4Un5^#NiCMzqN&wmWK-2yN?ReoZe{IdV0Be_4QZ0V(^%Q1YeSn>`!8
zY67{DB-YY42+P@~rZ+9frv{v*%<@K@6f>#jXkK#V+ncS-CsQq*DW%G9b}YR`XC}XM
z)YEtD&~xH2hBe-KS)p$wTPhdqMUFPhJ9d$u<x;Zr)7q21eXtwCtxYEeQ@+dFaTzkq
zf1#A!8h0w|RTi>Z*l=9ReCtibo3<$Nhba>j9S0cKn;QoAIHsbX9VR|(cRY8yaHxU#
zD4VzAwUzQo{)^6!_gccXd_P=&CQp1^e*XJf<UQE5me$e5!m!=TY$4%#-;dD-N+0ju
zztML^`FMUZ<i*XT(02#Vk6%3uJC-O4-4?ya^Tb;b#C|XJNQ?Jt1cUPDmi+Hu@8AA<
zLVxyoj2gZ4=H{o*XSbQ_Z!vM)eouOvF$H~a0sVc5qaf=xeNhn27P{9JLr{+Ks|#jm
z4V}t@QkA23dBa#ZF{iG#&~GsGmQX=d*pszzCO)i(5r(gvgR~sXnav>+43%5DO$6eU
za=UHU>mO-^zN+P<DTCE5zaBx4WjnrwSjWnP!euSPk*FI6OA(4?k*_aAsAorL4M#W*
zW3=6{ESxt@g0WL&QShw@*R7}qo+x|5YXkN?fvBjEU}g=OX!}&xNU^Y6mLZ<y!7j&<
zC{Q%3xMyiS?#33**)6(kKN`cwb2~WFsW;j+JUVGO#%K;#p6Zw`!;?0QbBDw@@5kho
z$5sZ@7UIqXDu!e0_~IH+aZPS<Ex5Qx<#BDpaUEN6U7+|LzW6>={D52h5H5bCJbr9A
zeqt+r5|l8_moSS;n0HH9#3ei}PgogFc(#@B0+hJUm-rHuxapSo2A8;9p13od_--rl
z11RYuU(x|8>62U1XI#>k@}#fBN#C}T&Opfo{K-J=Wa6vIq%p~470DDM$yD3P)MP18
z{uCPR6xypP^f4(66)8+3DJ<J5Y-Fh%{Ha{psoYmnd1F%fD^dkVQiZou&y%Hz@ux{>
zr%7E+yAYEmTahL|lBT$wrc9QO{QqLfyY2iBWcNP)Rk5W1-&ZWT`k?gMXsPGhQg8Ay
zUx6}zow7jpvg@&BArH!Kj+TYJExS!#ju9w_!vCLzP4wJz@wUk?*u=>D9^N+jM_`jb
zRZXUEqy9c@67@USWd2WKlY~o86EFP<Y-0D{2b(-EzKK^&HcD^(5jOb~)#Smyu9|GN
zX8j3la`!L6CPn34*$=yxANNeX?J243&7JFQ`rKFecA&Cu@P5zW?9;(VJOACV$;#OO
zhfRPKta`1r>wP#HLEG`xx|c)AT)O#skLowavL&wJ+Y1eECJWT!ST8<q+@38rskEJV
z+_bY;>o}Hwv90;tN~{0Q^NF^W4==j06m0tKtsh?wrwLwp(*Ee+&D4F}d-@%ZKkY0v
zTzm1PqwVttyl8sHX3*LG<zQ>J^2%gq$Jftoi~sAe$txHhHra&z@4zOt5y)S#N#HNo
zMC*63N$=l+O<aBtn;`xJHu2XMi$l~W3TE}sYO~}RKA7bG37aJS2AgCp$s5+xnC_0M
zeEYsKQvJQ^0Q4JdGQ^FCO_G0uO(wa^+#G)go7nsYo1Fg*HnI5$oB00*n`HffP3A_p
z{xfW%@B=o{{U>3Qh(Ci(Z2ZDEzi)ZQDI2e_u2CNU2W-OlJJ=-a_ppg>)xitOFktWq
z*LR|S2sUvb8y#b%Y$oLk`@e@xZ2nc)Wb7}(CLdvE5(}`u44csXSHmW_4Wh_dCZ>^o
zA&UHNx<@BAlKzi$Wf$~=9^NSt_TIj5_i18y(|;9glBAKlrt(Swd7c#3`i$%#xxexC
zZSv>_?k%qS<1-{-uTum&SrYB&H}5e2fK8kTRW@+t$~+H}Y<mD6LBO(Se+rx2Ad7VX
zS?yT%K;PO|0k>Zo9R7>2iNyaXY?5X92iSz`Phk_?|7zGo?jtYVA7PWAzY3e!{{c2h
z()&GZQuMFFCau50Cc1wSHp%->u*u9{gH440LD(eZe+M@4{A;jD=06FWAU3AbQ}M8g
zQ0%S01e<uP)fx$Yv&4Y)dxku&MQDKR3ss$zk^=)aO69itM<_SW#V)aYxM9&cNotT@
zcB!9MVpyFgGdlpYy9+Ja`>U`C`=7%mpI}d1aP2iSZ1~7divLE~<oZw8q~*_G6X(AL
zn?(I3*d*%DV3VvV&S_H2GgbAp>x5f>0-NOgU&AJO1x`8t9k59f9ya+5`n#}6UM<)P
z51XX^W3b88KLMNMK?E~r1uJF3@XJ0q|1fNlw1)g0Y~oKQY6tu?*u?I4uu0M1gH7_1
z1-~r`-)Io$t<}*trWO(<(tVmvS|RYgAo=BDteuHqx+^eKEuyoQNNvpr!H~^?^!{Il
zO=^k$?O>Cfe+D+m*#rB3VPG7(4f|(cldPYxN!%~kWa`gglbqjRlk0y0Hc9%Muu0VK
zVUwf+slN=H)Dm5ipl{THCe;$n|2^0w>+iuPMUZ00H#K%{hV#F{CXfC)Z1Nd|lEh~`
z@Nw&Uxjr@tq{X_pVi3nQgX_h~XH7&hUyFaiCVBq=Y!Zc*?{+slG7cfEtBW3}dRAYj
z6lBTFM6X>*bw$SC*1r+>Zw#B{{kOv=^JHBsnmvN;7z!(+QS!{s#q*+yPk+KDxc>y3
z?1AcQ?;A39ng}R5p3vJ`=MZ5!TS8PfM6ZI^oe3DBHj&idx*e_S`aVfRB15wI`vg4X
zA*MxD#zD?RDSZr8OcJ4BX66zL(q2#?824`io5Z0>EV#j4%;QObaiKk`0lo8`0g$91
z`4<ILk^bcWU9gESS?Df3nIe?pn+}Un|63c@U7^uNIQZ3JagyC2x=6=B&eZKsU=!Vc
z0XET9X%u}%|8CE>RBT=`&s^V{N`K>=YBfIIt>}{C)SF~Qv9NiU3FdzVHc2JhWoMV`
z28UfdC%_SWBMc6G21Ut19a^Bs$5Dye)6P!Cvc6A+Ql4@k(ZtgNf}&P8Czv{c>@>^w
zp^O}%B<z(%h5r2PjW3so<_bxSq&W-Ih{SyK3TIi2N@+eOuy8ykDO|M@f)7r>hQpSH
zEg)h~m&xkE9e*1(iTWRdO{V|dV3S3%9f$Q8);j8Muv?ul)@!$o7RcQGCTx=T3pVln
z18kD@=dg*x?_iU>e+oAF2>N%0P3nmLQP^bh@53g#wOxeM?1BL8@T4`<JQ&exN`WWE
z|I4t6_&)=ioF5Timc)Ocfj(-KSkJ#TtFmhH+FYLBv8W|q`LBmfZvIW!<RnFz<sp8S
zisfd|yOl?mhiGdu@J{x~<@5L6ok|@pwqCi<bLIKzmxnczUvl#B>lfU=!6v%DV3Qra
ze?!>B_wT|cA`G=th!@2HnitMzK#ldU$GSG@t2Jp~ytw(dVUtJd`nNkDIpx{Jh2cyu
zPAE`}N)A<JbV>84>5aH*n=V*-(2F}+hRGpo@UV&1{|Ibip(g$>!6x~-&36MP0GIDZ
zi?}qTifpSsmAF~cSZ95ALF$>(y2rzVg_ZMHMb<r~yMgqf_zkTK3O=X7`SrVfOxI6+
zhq<ys{YI}awdoEDE{6I)k^da3TCYt1&4=X=un8$!gFZ~FDC{r7CRa96xqreYB7X*(
zMC&?v8+Fk%%8t;}c^#GAb7%fkmd8Cc#VU05`%&L9u2T3?^q8a2%H;9E;_cg)%<f;(
zBw0_o4Lny+`ns=~g}4^2I~K7LfNuGO8KD*0%hyJmCx^@tnC{3Bo^^9B(LP6cWA22L
zd|oT#d@qdj<%+*TX644~CgT$+`FN7z;EgI%5P#H44o9r*K^OB|L*;@Kc8f!M3jRGi
zvgg1n#9!Ab__yrH#)b>P=x(?#3JF(R!w9FhL@a&*#!B!FO7!~@@dqPGlT@y-MEQ`h
zo7Unq$e6OiQ57WlK*%FOBc50Hu{6)?%%9msvX_~vo;q<RzeyfI4;HAZDa9qH*uXd^
z3sG<>W2NNcVu(R<hb;Lf3wS$P$h;dUU5n<w$b3)OvH&REy#}p@Vs9<4Q*2GFSyU7c
z%Vk~<XV~hdS23jW_K^iHF4<8Ro{ROco7G0dRwq5cXi^uRS@C%$Z`{$)fy`%XPIzVt
z++ANax)5@7k;O7CSK=fAY&fKspL?Gid^H+wUXbM6-ECAAAC1sQQ(qnLhUg+xm18*!
zFX0mqcb2e{`5@p3?j@ykceD~76=7L(WZ<<l<@H!2=HDaFN0MFowqW%HKFS&SR)IgQ
zfFm+<5X5+J0DP&(Xp+?nFXOvYvE=dC<XM<su|kLzZLUvZEP=hv+6pi6H;zOOkOza%
z5|CP<h>8W*Loc{zyBkYj6yA@eVqzxj_G>8j-YTH6f@~Xxr9zbn1GRDhPG|tXMSJGk
zyY--Cz`==y_`9Zu=nNyY-R8pGtv(v>@?KF!@$54OAuieH4x4iA0Ic)g8c`H(Q%<ff
z+@ZFf{Yu8T0>GCrY)g%a<rTe_0Xvu_KD-+DN!!m-$1;B)qc-Dk=Ssr$m1p~nEg|1L
zeasG7IcFAl>}8@I8N!qFTS-8pheIN%6-gQuE+lz-#FPb})yonWq_hxh$2R_C3+8=I
zwX_2s8Et9d3>Ka0cV30QtGs{m+@cG1)BECcC<$(hi*;j4YsYdi=@#lf%d(}Z@#{h=
z2WW91v8*Ub2~sGmAIw&HKspFny^_~|y^Bj}NJcx<f##lNr!Y`V-F-bKv&xZ7P=#mO
zI+PAtDO37WNjWseD=EW2l$3}cO3Il#o=HjNj`+!>j2;C>a1~&%7q^yLg*ttIFe#I6
zeYDW``__I{n?Apol%zj0Da*exDJFkpQvOs)nUq`h{}UzU4#C)_c%@T*PSALc@Ux#v
zij`(X46~>!UP+mBx)JbGNrB(ciT<Iabh|P%omeG_tV^7GhckFdJDdAMNkQ%o2Foo)
z{ZvwlF5;CGFQw=-VxwVL-ii7H+klw-I#(6?r@xex;%hMeK3L|ldWv?Q*AFEn5wE12
z2<`ZnudMEwL#y#hiVt2%Im0t44S!@(<nT<2iWBT9<D!`AXW0mXk9a0!sI<0)dv(t}
zWOn6w#SbRM@CBYpSswG+u1$GIjgtAi8Dk_p=I?gx2b1z2O3Is`N=k~SX%=n;ucQ<|
z&3*MZloUB4!1F&*QUD&Xfye5N0F{y-O3L9Ml$7K*cqL`~hmvxNS5mt3@Ztp;i2j3;
zvi6wWG$OFt|JlxeR#E_4O)cNvom=iFAn67GLc9C%N=lmN^ZlraRSvW4v)cCrCI>4G
zQ!qfc%nv3d=pNUkv2wpGX9~eo8fvA&Rw~Ai0KjO;43K?61ZdCqcJ@#OfzfD4gx%-z
zqz-lJH9*V_-<_$SObT8}IrsU8lJfdi)cjY)K$ES=<v3+FH9|mb#Eve3XK)nqD~ZFB
z5)30Jy4D5}?Yb@x{m7+!P$~K3KmiY<P=S;i;<~<6c7>_|r~s0-vlafW_{8?kG(TAf
z`REIKig*0!5bZp`)t293DJqXWD?5K-DI6=0e_<)Hcr3-Rs}~4h8^dt!DuW^Q18vHo
z@}y>XEX6JyxYk3nE|0@DoPGbQ^g~NARK=R8a{km(QsQKeP2_53+c_c{VcROOFYU*`
z#;X9d+M4QlBJ?>T^sBq7crAtb952JGM!c57q)xeZx1T_~9nA&(AP+s_g8sl#L{;DJ
zNNaxun4bc8z5+PZQ~33i@mPv{qXwT$v;hE3?lyqOQd%kc{HFk<5K@xkPI#dd%wG91
z9!q&D*SXSixlzGEMhTCl_@v3utc$U2X&zR}An{nrarahQ>*ZYy^V0!%t*UL`J^ETz
z{oP`nKVT`q;?e%@rT*YKHnX@3G&uk=87P$u0Jcp+xuvkJD+jZZ`+=oc%Fx&o0*3p}
zPH*<mRP@q}5CB!e2~gs{w3O5P4cC5ZDbB_6JfM*+8j=rK6gvH}*DOhen(`T5OX)`a
z(o*WVv=n!-$;{e#Ed{F({a#+ygQA0aOUv!f(1n<2ZZvoNRr1g!$*@yJ<_H}mBYH~^
z%Dr1>%igDiR{Mda3~OxTv6N(#7!g2gm{{eHSPI8)Sc(i07LTO_>$(>A_UdVW-f64F
zV<}5So?F=3pIAx;9!qgk&iEsia^GJMkEM+K0ZWNg^Fg;a5S?3+0iA<_P{{doXs_hB
zW`Ou2&8YvB=1_#**@yzE){@c>EhSmeQ!e_mgw8|Ba}{_kMU<@!L4sNu4ci@kJ<ieB
z&>nLt3or!uOQ-<&05ogJAs`^%w5d~G&qT%mRNH2NMt3p+-kV0r-+c^AkvkPi85ryH
zwp0M9prN4t&YKD_SzYw0G5`di5^Z%|lLd&P`B#W~92MABBEIIfqvazAw&Z)`pkH^}
zI2)tn1pyb>`^ovV0JZIByYd8zq`t}R1OP1U?nScXuHAqqt6cQ#c-!WfgmN_E`bG@W
zj%4T6D04zF90A}#>+Z-uhJ7KiK32y|DSUV-#Zne8rFh|`l-gmul+uouQVM49Qi`aV
z{@E`oMG8-)_{<>Ijqy~9WO~YZJeAUF@`Fl2&7N~Ed@~LU10;Iy5udM(4BsR4eKeY1
zPN=15+_^TSQZ4la2*9R6nNtO=Yl#>U$V@>EKr5P}YL1?9PG}m#Re&=w#E<2kmj%q^
zw?-)>&vg};np9_)way?$&KJN4fgplb$46e-K;a29<g;naRWqND(QzNi49bZweWI|@
zFelUzyC!wcV`2fSI)C9yln?|PC>jwg6RBkxaSwzwy0f4?pzl?3j{T+uGS(vGGP}11
zTn)kva9j+kUL=GOk@x^ej*&2J0#b<O`^LgS`6Wm0RA}%xJ-MoE*zg(J8C|=Zs+5c-
z93JpShf@?Npm!tb3(({R1P)t30mE^BAE1D!iLWUDyk&gbIrXMS75&S_TX|OBeSts~
zz#x+<kthJbu4c?E^34iBj6nC!L5Wd1G#E5P7zc?AI;tcbxc8L8GL0GmsKeIFt0^45
z(!J-5rm~!V5Z7tThbAzzq8X9vlGnq#D0dVS=89q-PsE(>d)iUH(0Un$mr}k;Ku5Ti
z{rBbx?^vtgr4*lKn9&8MJIhguQ$~0x1!UOT5Rw1POcz}bL73Sm6ZuujeM)Nt+Fhc7
zlCtpufPC|vcqygl0WE?o#}3<9A9HI;r(=MkvuWY#RM#1?51M|8WRylqx7CQvBnlo3
zAWa5@e_QFE=qeOW@f5Cu+o6f=04N}k%m)j#1dxf!*iWH}Ez!9v#$dz?GDOQe?iBiL
zw1(QM=PLkdFo4W$#@2GxcKFI%27oLZfYT))3%<aU4B)#@NNR|t2sVNH0?DR&seQ1-
z$30iKo)fPDT8jzEd;le%#H<mLr0A7~aqE)1=#P=;n3X}`aT`o_j8hUiK2AVW`Iul>
zyhrdEnDqszN|!$*9Do~Gm`{1coxsIN$mAxNX&EiIN0%$wygDEEOk+W6_Hkt%$%kEh
zg+S9=%6ENzWEt?BhG7*}Xt9OIQhYl6QJ6F0Pi=sC5@$$zDGNFUucaL8H&+5WzfR$$
zfmhfo3tu0>pNx~OEdwA<)>D8c7W8YuzI(!T1HZJCY)7`|!(UDx5f&^z`07Z463-Vz
z*WS0b_URxtTu}$F!wMbh9Oc6=LM2(J1_KpA!=``0Qbt~mOGbiAmVaO=2<Ln}mSXvg
zjl{uuAobQ13A>wMjrLr)46(EwP$MJKVK_nvLL62O^u@iVN&`yU#e!#Dym&wsIG624
z(0_O-!4G+#%!`*|pRW=L9Cd;xet0S4zr2(!hwg71TR*)N8+f#kn&XGNQN?&KCEMl<
z52kS1NKD|tl-8Hdl4wO+YZ%AlA7IL`9*3yY4=|<H4ng%weIW{Nt8};<nWaQZ#k!y*
z*fF3sL9izO159acVBP|jRI5GUR-7{F6_av?eTjf8+2%+=<@F5lUW&3lft`Y5p$5P;
z6b;uzKQXf|HDABV*XfVjq85IQAlv94){5IJX&xnHhX7eDNp3@cOv&N(y`=nhnDSJ@
zPcsDk075kgsThFJ^2<*5lSR2~g7#)H90-`x5TkK5y*ZhLf7D_**41PajkE=@)ke(<
zJzJc0rgC!<qjZCPbm$S@@?V;RU6ro8kGZerIAJ3pfbOUaRK(iYoW;#;`3D0Mzq=)o
zxDm0Zq%4dNXh6wTUcrzr%a~uA8TK|)v@PlNaaY+evH)h(q;T<QDZwkl-(C%{pzkS=
zmWb3b^4Kw4U3TP-3V)>`mxiX~1BkA<Q<*P|zb77&M>A_efs`(dM}>~kRCY^?&8&ne
zGf^~rm7zvH{98nl)}$<U1kw=TRV55}a0Ewk_zggeqINmu3m;#+!EQ;oFA(Do0*bc9
z7+@$^+(?6i76Fr!M)`6%w*U?ZbQd$40_OzlvBBK3g%P~Odg#y)07;K!iP=dcMP87C
z&`Ngl`&a;|wrjx5ZW!B_1b*+o_Od};QbW^gkVXA<P}dnee-o1~H+$a?guaA763La@
z=uV*tS|#r9VgbQuED7p)PzR}<f4stnP$q&FCUlu;ia5`;dfj!sc@j9gcTMT=(p_u&
zY&;$$&!U`SaCwtK8QKJnH}xT0O#rp<;9j8ab1Y#OAf#aT@Hp%6kl-i>R5`^M;eKiz
zwKB$9Ieg1llwZadZt?N%QikmpTC9v~bv7vzJIJ$@=p$LCeGb<Ic+M5&qzh3HUHicN
z;v<C$fT%Xg71GYm>(=|s+_%70EI{F$o8M(gG%%ZFra^K2)Ki!@#Z|PMtr#Wp*>B&x
z6FfgI4!*#5`Mo+1bX=(8^-2VxCA#u`WZ9GbGZ|$Sxg<B}`&EcfyN;UUgZVXn8d9{v
zhl_h+p2J5#pQrwo5+N2(DwRl^@9M&)qcl+VH9RDXD-jin5ehV<7u?>KQ2{P|IOJj2
zn|2d1O3I7n`*aIcE+G@C4~bmZ6Qb<mOVPQpmQ8w|{rurb;O*KI4xEUXJb@kc5pCHY
z`IKNH_C0dGndl&&AAAakBFmS*=&HfYFFs{R2=HLgmxb4}N6@kB+Ip9iVt#r%o=?f8
zc?qLH69+fe`U55Le2R}^ugNi?%C^1qho5{3fQXK$r1~-F*~=e%iVu;qk0QRPb?UbH
zw>FR-qk%GdGmhx950~8wJ=dT9!B0Wo<Aus(`O7I2E#mzYLu>2uRUlfi3-6~GTHn${
zTPo<zUQ<rO`zd>~8=VUK;8qmgPjUMWtR=zx@Kex6o9=i&CGxJdfM^F~3UEDIu0+p1
z?cPTNQqXNeQkan29(!*DIlZ{4jK@?{2o*&Qlb^$&oTr-0R<`}{LOhMM9iU>^rJ$PT
z`|A+djfc-t<4%lgJhsOMH4q}aoC@@>84dEwTxz%97+AA}>xPSaKG<W56WTd_H^Nz)
zhq$el>-X;MC&8s!TZ3E~*CV0jM)$>f&z&RT)mFbZGm2mJdNBk*aB;1)3ZWQ)QIGhz
z_Kd6t12iNdsttNF{k-2*4L-~iUM)i&^4U)&i?AC*2nx*&#HyUX(%=PubusK0xe_YA
z!~XFHxpL07HW*`NO=;*Y{#EW_NduJJuuiw98%+o?ul_`UenJ7rlpzvrx{9$S4u5jB
z@1_bioS@?g$J2Nf+*73#44VTW3=sa&lN(T8Fd^g(#2*O>6LSx&0YIICcp{*T%Ysk%
zYSbMD*Xbe^0BWv@Bbw#LF$c~mMv60rTRfdq%BGqtippaSJISv?nG$(^167Enzlo>^
zvo}+|ih~PYP94$pXk4OBR&^=5NGH9Dcx9nP;9R8gqP8%}*wkG%S;^S#?4^OS?J?Ku
zOy@fxJa?Qhtvq)<A8ThxH&*T6yR<w$!Xc?!_35HWslss%WU`zaEWA^aK_MKFKO0x*
zeNm0#5-zBGT!7jOMN#ZFT@-H}L=Ie(sC0U3ex3qQphBMP-Y~*Ziu0!v%N!RYvYEx5
zyp;`e^FiBrpPUHRay*FOsT*KC)JNEEW2rOko-}}!2-jy5mF7=og|Y}gInFhWlh1i5
zp9nej;b&r}v@MO@$s*`gw)|6t-Y`<oG37X6k~lshQb+g?PQIS+CaGW$>LF$d-LrmH
z3tM#6V?Pz`zb4Qi2mrU0>_t)UYFPKP+-xtz5yaUP@m9nuOzY{Q&g#@zrc1w?<eVt@
z`B|(os!BYOy(_afr1*8ULAtn~7*DO7h8|AO%A}56LVCN6@V0U)22OJ9Fw;RqXqckZ
zEx6_k6qc*7@5W4Sgh?-7trYgLGHv^IbY}`haN${C19!`_kT%ax%gDMOLZ&N4BjfC0
z_xYVKTxL?*Xr_tjd$*DDa=hVr#-&@buXC<-K8g<2tw|Q*rM*ikanE~umc1z(SA5>>
zAs2BvMND5WXXy&K7S21|EBit5%~Sb3qBB;7kF2A9s=F<0rdnO!L;XigFFi@C+UK^F
zz|n+c%TVvS)vE=m?Ub(?Dlen2D4v*(`l|8_w6O^dei(aUe|oTTHkrxBYm?fE)IuGU
z!1wCXg-d#!PATG)ST~4n3aPuObQ>x5qib#rt5Tle+iwBM@GF$|pn>4QCRPHX^AlKS
zwP7O2gK0>ZWDWaCu$nM?8N?TdBozY9NQ_2`gyA+oa>>044gnF)l<JJOQ$0|db#h67
zDyfw$JDk_AU2OGXEQ{YA+J<2|A@{miu@ntBaW4tG4WXblzX{?wRFlY^ieo^AfJww2
z6pF(Tf5#2Q%lQ(jDQrOBO%Yhh%p~b{`;y5`4QdQKV2g!{>CA$QX*l_{wf#IfUewxC
zbw~o)PbcVS&=|O!J?@6-eXx*QzO>y`5yPB)m?)%=?Ceg<pcTxC)#>ULdjF7?N893A
z!8;|ViPs4Ss>Spimthi(TDlS(ek57lGZIHzaWrmR+zK+0M*S^BbWa>Xf--9FOGC(+
za7c2;J#wYqwHRqub+#KqQ8JmeM5;O*6rvzz3QJKPOtCS1ak)=)pb#iqi@B54{!|>#
zShJ`Av%z6}>Rh9;D&b;<UsFqBNQ@pwcvY~C;YKL;#FB(+yD1a^X~Jk9LiR)KO+#xf
zttB*xbg_Ct9{we0^8*KQI<XReik3mw5~<*+7KuO&<zkLV+FX^$4KzmiQ5mq{i3&I{
zTR;ywYGhqwK-!vKP8&^X{v{@`Du>2p{{ior8V2I8dsN<Q-g21WyybXj%bLXMy}Od4
z4mQywPfMX6fDM`JqYIAQ=J$!^35Cqi+p5^=<X0p(kN44?@C_<r$jxrA-3JR!Y3fzQ
zny~;lYZ`NhPV_}dl!pl!Yr=#*90gaN&NMeScL;m=SK^zc%`Kh8nmnO`tLw0q)<MM@
zUrgLD*hI>UXHX@xQQ*8b@iZoByr0}4J1FqRxj1l<nX3E|ut1L`+$ci(B8Ehq8#h77
zh$~4*uC<F$;vOSEDxjbv+SlE%6M&q4r2M{Ymtyfr%e+lj_fu*~5BQd71eee{nMrFe
zU8iW2MAbT#e`_D>cTt?0&<6A@t+k&=Ni5dHV?B0%@^O>82_vlsXK1J+%j%sEtR&&o
zp5s8jPsy4Jo!p6amnrl#MHUkA6n(7}1=~(=ZsJFKxM##fjj+PKcxoAHE1L~XxnuF{
zKB3oQX^+NTl>Bql{0I>RU&h^Eqwc;GdLujgXk4gVBLBeVHA$b<<Q4M+@>8KL<oz#C
zB9sE|e$jJN;d(snmf81xZh`Cy4$0);_Dn&9gG4q|n=L9?m8Fs3+|ZL<roeKn%(3j%
z^W&5~H|?<GZGKeFE;%~4t3FuM#3l_zIq^1q|Fj&jO$r`(MKlADeqwl&@Zl{`^)PEr
zeU4}Qw$fc4gYf%^*F7TO6Vw^GZE}?0gLMizN+g{$pQd6c0TJhk<LYKJ!R5d`D4ksh
zCl;aEq*a_`;>NYeJRdD%L$Dc2lj}0W9+$smyz4l*AD9w%R4e;xS5z+47xH1Mp8`zh
ztKdLZHXMO?kP<1UqfXuo86vCQjAKCcQ_x-}Y_oXoXQgKXFPlP&Jr)P$ySKklI{Wez
zd@DR+$a#INefJG0BpfH0E0hA}n&B=BD4i@>G9Z0y(r6UT?Z!ouXJ^bZEJ<{U-FVXw
zh7}|t^v77zzpI(*;or!2uX)A6Y}qCM{NVk=5P%;URao3~R!q`DnEsafc{wXY=U~s>
zCwmt!G(R7xi`Q=3fFGQ-?sBt!q@+6uPa3n-WI@-Go=2!Ylgf?eD1Jo9UwlVPW|4Gx
zp7o%i&4ES8E$k9@gKU1g<8$X(hvjkSZdU_0kFlYG@CvfD7noXziw@n-Ixl-w^4_r*
zS?Key6yozjNJ`Pg0G_F-m>U7%RCzKQVzC^=h+zVdL+t=G5i}$epG>7E%>QkmmQt);
zLExQ|Jc23`3?Kmc5=*EM?r|3oim<EsOzu@{42l)xfbM~J^)D6B?rX0dN!}x_Cnh<`
z7tX#1Zw;rn2_IV@TMX&pUjsJqnei6b^4L6Q4d^v>Q{yXq&Iuqph=5IUt5fgyAG#Gl
zz=a<)RxENfh<MIS2c9NEZ?HG{&cW{J)2Ob|gs*WO_p-Y6A!?Cp$3S+QaARn`vKx?z
zc_kSY!4aU^m|V!<5-x-yV9)L4K347U)TTXUhrTXkC0v2$tHF3o=bk+oC>daTV$3dX
zZ(+m&Gv@%=s)`}P=@`Sm<8_T)9AdY}^qg7wmp+CQHO88C9&ijaP*tG{n=moPUOdcN
z!zs9LZ_#AHL7tBgn4Bw&4A@S(D#m&;w_&xqF^{q1Q7DowzzEItKyd`y)qN7dSNOiD
z@(mX7vJx=iunS=$$&FZ{;GUxqLRMokL4=`T)P0%3j2T*{K;QKJk4d83%txMPa;1}U
zcQoX`pRp><VU-Ro<=4~{OtCWkSoK3S`O`@ST)NSmnquvIa-?q37c9~?PR6wFLI78W
z&7=$-HhGddgM6WJ2e(d;s_9j18Q`>mdG%%uXp?eIr?hyTnL3W&5?++F$6-L?HLq)K
zpvQVoM^it3^PIuaIRjRQlY#|PX9mOGVrI$`gBq%HYnP0rOH5+#i>MmC-`o(|pEOl+
zelkaR-JaVbsD!BVz6A-fWt6jEejigZw{>ZWbq)8W(IxF>Zks{wi~09$7K&{|*6?o2
z<@elI_6>}lZ(cbn`S6al+bJP@J;jdab%TcU74cGsljoxB1zo2X=?Bde5HlGHr7l5>
zmiuSUu3kLPImWso65~gZ%NQQ_(o*-D*Q%?9U80j_wM@!keL@-ix&f*@l5x^Dgqn4w
z-ZcrA7q~Bfcj-h%bR8#2yJ4B#G8~;P;M-W8aoQoXbipkw{Wy!SOW7iki;Z7d5aA_(
z+FqyBX@q-*a&EZ4CKR@5qwIv)=*OCcmW6J_JHB@gd%|05q_$2JFP+VM!*5Q~kAmeg
z_bocUJE5;HbCxe3Uov3WQqOkk9`9Sw#tI+zUWm6j95?2z)#WwiV;Y{-lPkw1x*^EY
z;lzj-0d?*KJsy-3qRA~*)u`3OV407>U}>wJsLZl<$^zmxxxMu?drSQof3;V0;EXSo
zL_-V3W;sk48>?~SR;2V+H+g}ss(OVPLHzYwkttPZ3mJZ-0(OHEiOY=1E}F=EO}X_9
zr;-~^A3&J7)yM6Gq*qd9fsCl2S(#SHxei@R7`7DLHqB2cC>GX{$6V};?x{Btghlx+
zA^aw}=(v4#7E69rlmK$Ayl(XkZXBC+gIG)(gGk+O#|bR^yq&LF<-+xv4uC4Ys12F*
zi4@<F3|LJX?|z^^59vm8?DhcG--t$FXei&R9`-E~vjuajD=VlbYg0gutv{vTL+Wjl
zuWc6{UAzyAxZBIWf;U^n<E3%EA~>Y+Va2&yF?rUNkG@wZw-VClm#PBJn5B?$%EPK+
zOL5A1y!6&|4}9$#tNO~C;#Eu^G{3KGk4;F=yMw3!GCB2tKM6AJnMxg_DD|t9`|YH@
z^ijC%4xXTR5zv@JUdB0s%wPc|4ttJ#_hMa-DPC-`jG<psdkl^^p0Z1(LcTFumcz|(
zx9*TnTwSYDOC;;(&ZeHar9Dxj*5FmCv|Gh-ShYnIIbbd{@B}zyT|MMbJs9rsVw}eC
zqS<L)_`_yFisNY&c;CYt)iGd#R!;6)H^OO{w^iqWHHj$2TFeTax?*m(P>q^AWUN?@
zc-K<{DFlQ#Ei^go>^~ByY}%o8A|(HU_ei>70pT_KZ<iL{K74=X{!oON9nixcET|@=
z_P(4FG2f%uaYuO=`KYdkb*)b)CLBJePZz;>0bEs5@3pl{uno?GqoE~Dca(AY!gln#
zgqYn0eI%Nxio|L83-mzs!-1UlK`KsWyqi@oEjUadyl$qoTJ7U<FDp^DFh)evt)>x$
z4C^U0w|fsW1u}Caf$dyX``=c9&m#ta6vMk;p9m<Ge*k6By;LGRrJGBb@>Wwn|4GOD
zK%kcJJQ#n|#q}~s2A*9N>2s8#UIwcZ8Pu9HuW-k>v9`J?>xnSI`?7KgnIuzm4}qKj
zg0?L+y4-N;ro@CL00f<)#GKt2!3r5BP-33s>Nb%dJ{z8`xC_qhmt)4HfsqaS>NTI#
zSVcG0;cB3u=if!E`oR4#DmzdJGKlsg4R_75Q>9A8yCu#KMnsk$>)9XIzC(aFNhpYz
z4fq3C?>0&km4d6xLi<FPj2~R?-N^^w3%l{!JAONgo|=9#qW!7&bt-#M<sP(3fa*A`
zeo)+adAEng{=tZ*czSoYTziE|Hy{a_&v??uOc7Br<GW(sXDa1K*MCQ~RrTrjcOfL%
zd8yS;>+2CkAHNRP%Z!Upu@F$*%2D>=$PU%6a_$9G*NgR~*M$2#e^OQiRu{<YCLiyX
zt~Ssvu|YaxPHw!N%864_AfUt<@9gdwzE#u1o%H}85mM#?D8>PdYh%=P^JJ7rB!jAC
zHJX0B+lMuROJjyB5{YO>(#jxhQzuW#=O9bd0G%GnV-$;z1UQKd;)DT1ph~T53=b0+
zzN!)5Qw@}^SKcLL(q*fNsul1Sk-FAbrldM2LUitYy}%?|Ww(djqJ9gn>5QY-g#5&|
zB+V53n6&-c3d`|;%kIhHaxk-Ni1=q0f|RX3av|R!0?hf){ioj_C^znt$|r$wxyoCT
zVo6>k6zasw08gDg>*yv#W<aYIvGuIq<Om@}cQ?0Q24DbgM#&yT*3UEn0BuWAD)dU;
z_C(RE%a3<+A_m$F(@H|#G7R%m1fM;Cx0;Oh!1Qe?sBia?DfG7KnaSs(g+W`#xvrz%
z9)i`=7+na~$!ky@eN63`)xjNOMWj()HxohlrU*uu3dx&3CRYV#a$3+z@^zGWyU*|c
zh4NvyZ^Wy5Nhum>y)>!aTYXG1iISFYkxOWD4GR4g*l|7pLLJvAZbQdD$9ea<&M-y=
zcfnP|uksU+;_xoQrq|?}$HjXW1;2eDBg(PR-KfdymUFZIQmdltdp?Lpoq7JcZdTLf
zuRyV(KCVMM3F>54s;Q{B>F??k0oSlrFQgXosO6!2DS3pJ7p^16)t-e*8*`?fPq%Qn
z2fKEKf-^!rvCjW4XRvZ@g|O^d8Gu+@84#Y;NkO4L+tf&5nX7hzXyEJ#4JGb~tFaj|
z-u>|~0}kk6(k4*g9q?;Aep(!n>7U5~CB8O^7A)^aB{e0}NrO@z#1N)$jkGAw5$JIB
zbC(+@t_O&J@Xz{mop-o}dSrMtgie#_1QNh7eG+o+N`%oC^bu9@jh7+Ira*nm_jONU
zf+?Te8qms`hhzm~3QJJr@FNu=;9XDRJd<OqOUGHo>fYdfR!~sT`t_h^CqQTV%AIcW
zQz@hL)~c2waCtlx2%JMtq$C3k|I(`T0eP32Ch=alPHQ;Is4@P)q~gjWDxU@NRlTtq
zY0eQsy%2)5zUOJ2IW1Oa@2_5JlV0nCyb_fvA%ZY7Gltr9#eb=Pc#(-%M6K4Y5!Vw&
zZQc%ZyKn?#-Jeqw5G*d5i0AA#9Tsd6axzr#RdYh7cgi5knTF_z27wAtC95trb>(7K
zMYWr0X~aU?-d(x9<e`nyAEuk&bFAA~jVjiVo*A-SxDqpgm8kCfDSVry4KXgAnvlCW
zsKzyG;cyLzsRls$v5x}!Cx%apvf9HhR=}BipsnLAJevsOfa+`74i_ViwpDW6JFEwR
zm#<PF53w@p6qzcCMttp($qA_=VYy&+d5`?&-7xvXl@>}OY$lmwAmP?JRB2Zxk@6gq
zk3S1Sm8@?MhCYKTsVhP1I^x5CgKSDV?-6%=;wUvvk#pF3|IW8%2~P65@;-4&{Xhyb
zz9vLxX^qnR%7kRwMM@d>_h(9bq{`awZz0<s?XfBE^C~}=6`r#lD`QY?sM<CZuU0{H
z?O#zoa=o2NTYDO-#)1<lZ(^#ccNgh$54@&)Qr2}c2^0E?71G5TCKc*e3NJlaTgpE>
zdDHd%!`TMpCLKV%j^^NWLLT!WLi+Yt!11inn>l`q@25}qRiTcW2~4s<hsRJSR0@}N
zrep}rStmo#syW~b%ti0dV3Voj`TFC#>*sZ)_;XI3Q#U@K$^zvW>+N4YJiFH$OCR|c
zV3T?6IX+|08JF&Cj){9hbfO|s{VnQ4@s+d&<H?(JzlTj;p2Hcv&<xFx{RNv$-^Vu)
z!x#hI=PRvRg1-HNO%|KOn67(0YYX{&^o=RlXT2|m{=zNh5Wmf_oL{iX_RsvjUo)rI
zKYwQl4gUCYB<sTMAF#>JQ+!$<>#fi)2iuD+x7lvr`u6q9=bx|%F>`V^A(aB8hltiD
zxrc-$6w(Xg&Q0zm{|TE&ttR(@6;C1k5Dn&(e%M6?D84S*qzuqq4uuXPoO4qK&lo-1
zp+n4pt0_aQVW-ex_DJT`Va@~v*vPpIo754WyinLEUrBE2s6cf)Y)q(WH5Ct=oWjOM
z2bj~w#U~VKCM4%=(k7&zh0;8c+00FQBKNMHW>VqPYTBgIw^N!a6=Ih3DOD;(__R9h
z<@9MymN57XiaRfTMn|{<KC377EPYmA@f&>35D%No84n$jz%P3B49=MgmqfG1OMc;u
zwZ7J*MjLMzn6apyq|Fs8Y}!+rz*kl42s7is+&5P}&2ft3+s!UnbSI9CUf^5qCb3is
z{;0)j{!OgZQnhI0h{Ct}^7Tn|53_+pzT*NMwP4Y45!5H{;=K9ArEeDu&aU4_aoxdm
zeB`ygbRRIl=F!aFch}>9INL$awZbe-lkTX@E|Rnq<!DP-k+GiCO~89EUSD7KTtN5J
zXwHztnAiDfR-A8M<yzb#bG_yDfPpo^{YegUwiV$rTUNqr)YSwVr5xrEullEK4+J|O
z^M+*Sl~4)Bhb+9brdHyKRhMCqSx9mdmc3f1vB4GluqUU;+}8b_Ye|IS_vI3Y`I4C3
z5Q+Lr>%zz8+nId1kze-`5Q`wM$agByrMKKW-sHE{JrCs#`RT#%k@M^dJABf7Zk0<#
zhWB8)QM8L%gpt(d=e>S<FcI8lj92?@<!>pse&G9_&+n74+gt=aQ!Ppe-%N*HQSeG)
zodkKwFp@=hiHBy6?Ee5^u0NR=B4ah<^x`tVQQu_d<5LA9x@)h-S!V9TCm?NcI~@O1
zPY#9@UF_o>-3XZmvxyaIQ#!2n9O>rpe+!9GDnQO;<_4UmR_v#00=hkP6=wmDi!XJ2
zd~F0Xf2NpiVT_&KIkq9Z056)_sqN!{MSQseAk|WBBLi~<VSyU&ku47ge4<*|IYH1Z
z>flvXngYn;;i<2psqco*VjpPr9Ekd+HYAd#7^GYvL*bX}6Ybg$l2#!g_pt$o&n*uL
z1*a%od^N>(Xc)<ph@q0mr%q<)*QhIkBuIN8(a?sBGnVkz)NRC^zB3y{sH4q(YvKe5
z`ByqQcq#edRaN_(IKt=RS1T_Dr3SQ{*uxcuN3PqCnO^}h3SHwKOMuLnrxoCy7bQQu
zxin_3bEw6?qX~6bAjiR>oX`ZEXyoQtMw2nI!j?-VmGMX4h--8m528ExP!NwVMVlSr
znbdYq-y-xw*#x!drN^Hour?98eA@b`U_t`B$0%0Z>qZ}`ZA`@4kR8z_>en2v4NhVT
z8R$5zGnDrcvRtZNp*vn5RToP3-OE;g+RZU~3+_PyqcYdH7HAY4><C+%Ly_`3OcT2c
zL0(N|i`Way@@@H*Ebk8v6rm;L_mHeXU&EC}&Rn8zs$;23&~7N+QR=xm7?V?S)_%MO
zNM8LK`95IC06S`!MIuS{AUV1X5jD~JuFv)%AlmdoxrSG`L=biLw%)ht$CAfJK_BbY
zBvo?EZmU;9U-50qYcWjnxe>DZ%yRS1t|g#uh~E41s-zM1Mkr*p2pU?e#?JFm>PA3<
zCF@N$tydh)4*b(K&?;J48~(wejNW^|_Dk*|qswD45hb29Y#PNkrW0aoS_r>o3#=L1
zc*AwWr%#rZoKPs7ragIRHu1Py+j4&shSOEIluPj_GT;RJDA&j9+BKY2_eo#XV6Y?H
zRE)x9bF|v*lxMeiGimL+dFMAl*YA9=>N7h;rk??~hcYFTpuk||ZR1D}Ct!&FB`X4^
z8%<@s!`(uvxf6~>2dH*VS5?F3I}{v8QGzX&ic9)4_u0U8IPLgLL2v1}j_&lvYVbNT
zVyn%+h88NzfyRX6g~;JKk*408)U*$mnCfU&2b!;45KqQ3Uo~;9MN_^Ea*wn6qH|u_
z{gFe|Kvo>0urfhS=<%#eabw%2FWieD$+|>n0w`TIx%;{*SUcH@!e#FZvqxpNzKjRr
zWhBc3D?zI3>USTUTT$acP^DTI_Fs{&^U!+ac3bjf8u2t*p+9(x-XAst_oZ(d_Km|P
zEVGp;A!LiD-`<3eWi>r`VfvB&Ri5S<S3y>zWN8AlDm|fU#0XKOnV$RBx=DEMJAlsp
zW{mB?$Rgsj;O<-^l(GU7(n(cmCTCRbe!F$7e(14QWBQiM%a4vLtF-sDs4B-@`!cCd
z%bW5)k3UknB!NJST;}vDj16JE!&S8FqLfV5B7F#)OF0@UR@CtcVPIY#oUw<SZf~3G
zwC9;;N0?^l$R+r%&Mp_xGMtDR8Rq)46|WHTNox8<9}sMO!7b2%7<TQcMJ#zA&MU$6
zQ&OH{Xpa2MZ$xiDPS8Z&UTW^8NAt@hc`K0Xyt8C1elWJ6Ef~z+mQnpG)Z@L}PQ^j-
z^^Q6ca<g2PcXx1%vOG5h9ownlXALUy`iiOAf<nR%hAFKl3*RLz6<Yd-WGy}yd#@aO
zJ;F-<_1E5aO~jA0iarKRqUyrmKbF|XLISvmE`0+F37!iN4u7M@MSGRlkmP0~Lr?qb
zr=!=sMRi}o3~V@0YUI^EAXfH0fP6)yU+kv8(It3CAk0##)o~wLRq~0dNrZH+KNLYk
z=Mt?3=^foj<A5}@67x#x;<VL)%nxwq0-lzp-V~ZR-MSZ(F421{sr5G7TV99m%@4Oy
z`<2h-fytB)AHu%AN#WWe@Q%>@t`bgf?0!3b=;Up}*n?OaTjYDmLd#=z#@8d{CvUVD
z1gYGdDT-VP4k`$M?=GtpPKk)>oO$(tRihzuTR<*BA`MZ?@b$Oun}OC-Bzfn0?es~n
zLtY~)YCN3DzkeW!PS#QBvE_*ZrS0jgVTd!P$nHVN?;DbrC6iYgDjpM1IB(oka-fiK
zU}GHNdOSrwG^IQ>VctBzP5!z~E_@9Xi$m{Hm<n)-mz^?dRt!U^cYx29?dVkODXLW5
zEmf(Mi>M?V3MDc0%XZ`^NjPa9u2Q?eeM8tf@R@npqF>~@(r)nF7UI~Bf|0{{s?c`E
zZiusrN?IT<5kpyphUkG<8P_SShp3p`?X#2VU)i(u#yYa|_y_S)WnX+*grR)9i4gat
z;qRrk@PcL4$qR_N+)03(Z6s5wmo*-<2l3dmb=qylZrXLCDWinQ6ARfAo#{%^rKR0z
z;A`M}WmKId5N%Q>@i&C)BrN1SREZdmPCJ-_7Nf?S1V)1N2T2U1^>Vq>sVYX7*0{<2
zF5aHPu(b+V7?Q#bqpd|;T;OHLop#J2ZxURl+4k4zKs~mJ>nsVp{@o(vwmod@(`>_<
zF`ybMIE>XvEGRjd-CJCaGS#DB=h89=FTw<Y2bmCj+?B6u4Ygu~#4|!u*(|4*TzsuU
zOYLL|AvC<KV}pEVsoWzjSe<L1mr<<J?yzOIU7s1DG~lz|QR-@T^Kx*-+8PDFh_A{t
z`S2RunhUmhjs6V7eVy;UO#nZ%N+obk49Dk1x3L*ng|^Gy6d;yJdooPk94W}(EBpl@
zGC~3mwx<}~7m`nt8K1Jm6Q3$WfyXX%k2eDp48m_kZuF*<@0L*UMKiCtIJu;-$six-
zC2=~q-qJI+tx~a6zi7?VV6XZ9+A-3RPoGjTO*Rh;ou32_xp5Uq$VF;$WtzwtlyjXt
zWUFnE?V?fWGf@~yQy807n50phHBnqlQ(T!<d_kl1(nRS^n$pg!(gzx4Jh1jTP5JAr
z@)?Z^&{TyqU4>#!g&K~eF-6j+BbnxqY;aXBQ&rw{Rlzyc^Kdl@Q?(1}YVvbx%5Zfx
zQ+2I$^)uZ$bpyDDiK&J~y2hnBjVo|XM^jDLbj@pXn%;0Ne^afq0hSx-oHyX8Zv?0?
zQ&e;#3VVnO3qU<v*GdV{PD|G=oMXFF$WU~sea}><?ocN|Qv0qXs%Z{YF{hIN*Xv5x
zZJE=aozt72(;Ar5%{bH>k<?#IN4<gTKTX$u)~Gj>uK(pwf5%k+>EXqkIhOK91`;!!
zhB<w*d3|W0!9k-AO`s9Clp#Tr!HYSglmM-pghX;?&{HId94(PkHya#jiUiP}uA63b
zvyHBq-sND?Z=yU!lIcsa7_OTtOPR`Nm|iq9H3>8`n>Rt4ncn<liZL^_nm5z<X_=gP
z(pqSkS;RG&CYf2vXPA{_ScWuN-~MEcRI$1uWv+qOPs~icr7T(kP1~AGQfMzd477eU
zZ?W>}QeTGEP?O0Rt@Ui6#bThXQIl<Cp!ru?qEim*?N6o&pKP&#R`OCTcY3TQnoOvq
zFVkdRemQ@oI>UZI%HgxwrLSi8P-!b-^UD-Rb_5F!XH8aG&GyJOdwFwHe)CHv(k>S=
zOpxp(hbk;Mc9I*Jpg97X8_lj_NR|j`lE*46huv<DJq+>Yu5I0Jc^qz$=B^<Nu9yY4
z7<0E6cJSOfi5D7#K(f@JL8C|Ha~$x|W)C%c*ZJma3`oxy0DUfp*MKy5V}app#@urt
z(_@0p^JS*z%jRoc(jG(Ro|ER@i_M;6N1iW(egG)%%{>q3{Jv&_AoM=;S=Tz~JiZ+H
zoSAz97d__*yylO5KTG?4l=h`q^b@-fAa&ixyW4-BE`aue*X5S~L*0G2HPxp3;$M&u
zdPfM-dsmtes-X&qfYKF^UIpnOH6irgdv8(&1f}=h1A<beiGYYw1QAP4c;A_Kzq4o0
z?3w*LzjLnh7p!YNxz@8*?&rS0pGVpmZt8T8-EiEwnjbkeyFR9KCiL;XZs@Dx<8xcm
zXOGqknL)ry=k-AHiA9D-!dJUj2KFz!of-`6vtHXL890Q!rnl^Mn8$Gpd+qOUU>A30
zhw`>`PUn%<XZr9a=rdjLiDB^9jNtEYf-!UmkP!ku6G6OyAcrEUjgVN_gkb^60uABF
zL~I!bc@@)JDujp`p(Ha=G7G4i&`>3#P|U5&(0OEt0F>uiOQ>OH*aMh@iay?04<k{g
z9S0pamo0b_2b}mi=oARwG7qQo#dk5cv+4;;fJUWYb7i4n&LKf*(C88)WMB))7jt|#
z!k+LPKNd#j0*mlD4{C3Tz7$>%$cRi&Vuk28nQ=)iSm7ngV>4<wGk*U(C=hxnyo?zo
zTnaA;`&y$*;RT8nUd%6rmzN9SZoUCn;l(pEV!t`&$|9pnA=vgj$?p78cu9pPVTBi$
zzX~s@FG(yBk?pL6%HJSZ;l%|&=}JM8*NIYl;(f9*NMZ5YP_UnIX30Xt@50MKI)Qbw
z9cI2)|99dAE4=h%Cbcj8CcO0Mizp=bL&1uzm%>X^R!+l$lZOGGOAjLy2ONtahOeis
zwh|9zMb>@Gt2WNqTg;DGEWj)VMIrQq7o$-0h2+^-{6$y4kk~epLAZ!muMnIomAfxV
zPgG>^kiH<VC?@VnME7ElKx@$OH#+I1h<13+Jd9o|i$K(vX(W>&8IH%^3jUN8BhZEy
z1ZPTSO_{XFqr6&ikQqfN%{^zHjJjHRV<EzdEpon>(Hf4o31snQGt6z!Ikr*g!Al-5
z(GRr}j}?+YaZ34Gi|03@Cwr@VvnkJv;(|BmCN>i7S_~R{6Y?&eVkDQGyxPh*zCBG@
zs!Q{&h+5)I_f*F$)w4kpKEI*wIi<4%z!Sat)zX*93-@<B$*Y&hOUUb-URde45xL_F
zCo%s<oJB@kdTN(T<Ruo1ym&6<$t{&LNYy=TxkO$f&+C2KLqQMfZ(@-bq`CH~UT}JI
z!ZIQdmU__qJMxmtv0Rz-B;BqpykU{i^+A5CMU8WdE*5#Il5Ur|LCDFF^|<g#Zrgt#
zFRnRhQRi))=Mc|qhSWlEGAqOzXvHj}0>3v)Za$Qmw<iyX$1&+8&TRjN?G^V6o-C>&
zHtIX_={sod`~0=<XEQ~cxyuW`UW^iBNZtk+gprf=b<byjb_hB6U}bQatyjflNQIGZ
zfdQ<6aJDlUCihL4Sssw;GeMaTKFl34mL2k89DO3gaKGq^megngBSQO1d@v)&L>g5z
z<G6)vrpQ7(hZI9H8$G-6#BlD!_{zjI<K!!o$;plJ{(#9f#;Gln$z_wN{gtV$+^Nqd
z(_cF#dUL1Oegt6xCQg1#yjh^9$)>8mp>e0fz{-52F?R%uyij!#x8%mTLEC!MW`$PK
zKC}-c^WsH*zVgX@Rc18DL`xl6ICp3Dl|E~}fZUuM)4YCXyte6VQf~vkU(e)~S%0}1
zQrVayU&nDA`X+#$+f)z7I2setxsdSljhn<mTIOOL(;_l((La5mGLSK(rzhe5QbXrr
zf$3t2?@~hGa(iIhc;}!S6S&-@{_c+%f2Q#yBvp$XeVgC>ZCE3z?Au}F+XJSxB;Pf+
zmur~3T+pvb{I@d?SJpo>y{495B<^}EGfzJz8FfYeEd%q0DRhfIX!G&HCZ7Ce3?r@d
zsSciuUY*I?Z6<mH+57~FwVN>7tI{(l_;yUk_VC6wOMa-`TSmuU@1taQeB|HDE$krW
z$0L~So&<#^FoPd4&+=`Mc`}3T1H<g(nG%_IOoR4fx=?w{9~w<QRKERi8@m63d7L^=
zFRJZ|tM~R={$LVvS!RA8BL)q^`YwsRE5<>e6be6aoqswB`s{D|N#*o22kh|l*8y?C
zr(3Wi{O&iOSr^@mLRo^h>DN9ptu-8(9j%!ilja^PEgTaTEZ<BkRC=+tk$<?~$(SmU
zEd`DEDhDYyJKf4ZHNE*o40fj5apruJ;6BFQ<6(#oi=9LF8HVZnVK6Ex_{@K8ZC?&D
zi&ISg5Sg`hzQO#>jpYoP{?#9|RuX(6vv8sR@PKfMNqYVpwtnAcdd}ec9&5Y2liz(6
z%=kKZZ@B=ucJo(%{x9Q|UpVZlbao$zuF6IV7b&6|+7R|(f&^u5Gy?ZKB4>(eDOkZ&
zCIq6KN)Z%Xwz5%Fi<lNDW7Gf@A+>dX1SL;#M`cpUaHcHzl%NAOk5-zXLd(Y}z18V#
zMG^L`g^7Z>O1<j)o&N+jS=OhFl)1D2HuOqpNvqNIlrcdf_6pNn-_zsM?-^F>y?2OF
z3(ItFeMSg8G5I~{bL+6wD-XIpeu=j%%aJmK#EG74%*tz*$VX|4-<qv?;2$J+t?p_|
zhyV9qq_QoC8v`*6H-G6*TCSjyDmiBxh@Ip<B)iS^{U|?iL*r@H1<Co3?aXvPz(<+}
z3>~bNWt0cWcV5Jd@ZRBM7Z$a&JCvEtdraxS-HFfa2h7^B_<T#l46*o%{D@%SV*MCy
z5=LwGSJ=dK6bRA4CsI*2V+stV31)N?nX==!r&p}SdsfO$AlP<p8Ow8_zZG}gw$zG5
z?0C*9=BBN6@!iNtYgWNq_i5fGid>1>iczO(C{?;s^);1*If(Etu*m?DcQb`2twKfG
z#Ixw3S_3a_Xo{odKzWYqu{h5yueVWl6wY1rPc=Q42<=s#P>t;rML~G4((UbTm}zG6
zmaAk(U2C(`3=BEkDWMs(-6~D%^W5{wwtZ8U^{k7?spk2VBipUw;!-1$IiXN>k_K^V
zrSfLm)ct2frx#B3)nqbS4XkX$HT4ts-wD=rsbbn|Dwg-=92EJ}!5dAJAFLlKqWJ|r
z!Io7G?G@HkX|5p{XEYvnp1qCv-1)Lx#xYjJ-Zqih^Ek%b4D-w&u_uU%v9KH9krnR$
zdG$xVG!crwp_qH9a4L4nUdnLj^lmJ+&Bu<>dKf>j#;Aj1D(CTp=(MKCWY594YoOK;
zYa;U$Y|Acf??cDE>6`d@Zv8S0q~aBdF}KC1P0v@F)YT1X7`V38YHtZ1*^ED))8q&|
zt?;p*eDS90En(v%7B=x&ao-X=Ruzc%z+X`3uxgI;-8XHv6nt;`Qa6yCtYt*q@~h`m
z1je*QH-;h0e%bvJHpxy=|N53oBItCa&>!RC^=?1VMOuSv2x0%hsN|DhVa=N3xA!lx
zu*s(`FJ}MGT^O=}!#?tdcMsZF5(19L>;`3yrfy<klUePx)T8l-34v#slG=e^-v*Nh
zoxi$Y7x?Xc!NcocH|wT@zJKc079`l6)(-w@TSXrH>*Dit_vd%Z<UIh94(xot0EaxX
z2mJg_5a>}Mh-Eh&m)|vnrlt_@@$pRpM^_YMQ#ANGK_5l5YcT!CLPBj=4|%+6nBb$L
zFB*}3&@prXzh@EY<H-JzUe|Ehj~hphnf<IpZjlK~MdS&Q1LHVJk(!T+sokswI5pg&
zMIUTZ*F_ErnsG+!eJrN4u~89<c8gVdhuNf?jvNvWONxE;Xp3kva|kwer0C>X!t}WU
z4x4gI2q4j7IwBZ>_h}~t3YM}h9^X>ncTalD@s5p!P`!aOIq7Y`5}3U{JVkFa*=S@0
zj~$M5HW|RBtOvMwc1P5z+|!J*-tj$+zyp9n0v=-&0IY|^k^lgx2c^Q_Fpkq9imbFQ
z6EWT!vrxRA-dMAJ%_Azw6t^e!3MEo7tWpz1dy=^lU@h9HE^9k0%HiZ&eywhiB>It3
z_5zrPkbYs(ckC64)zuC&u%~H~pOTTqILxx(FzqwtQ3(2J3lEOacFz{e?f}EVyp}k|
z$H#@=mbn$KFR7sJiF*?cs!3r^N6}8dis@%_cU4#I?#5QpL|v7u+>`c8N>DsupY5=r
z98*U)wKWCunO17sEzIVnla|va?MVsMkK-u=0HF~=J?v^%{x8oeZW4YyG1a+fXj&0-
zA#mMi5%l!sNmX1ZkN$MFYISm&xpCQufddghzK+ampxD3P&7<G+;YQeLNA=ew>G<aR
z))~x3PX(ET$=WZ{{GO~<TkSu6Jt#_CA5u$TF}#7qAt+3VPJ8s_>h}foY<*pR9J3hT
zddOV)%L0}-grlKM{J4wNOPak$4te<ZXFi<yC3QL%XY$>Rx_462o3^cV-Jf##!oat6
zwbmn8ZE2hAdOE1$nHQcgW~J_aa~lnG7zbd*jfEAq&2pJ}6vUV<pT6w)*tzxO74btZ
z)#lDGT>Ji8F%O$-o4bBYZU&wZuk%kecZ213gF&(8{s+xHB($5@mK+OVvX)*N`E3+O
z?8f&yEq#o%@501LEN{59^mD%4icpHRBok^G5G-Gh(j~Eyj&B(hAKHwuinZFRX&I8G
zwT}-rX=M89JHmTIATgn)j-L9-s6>ZIasi_Pm)Mgr4o}h4x?EZ|-6!J(H$>CBC#3j1
zo=iOXBAPk<gG(so$z*q<X!hE~l^cyurYb$eaz6)Lk$UxH+OSb9A0v20?&Jv?d?HqO
zBxtWFkZl|;FP=-?xvPdToSKM#_T|%n;GSkq#%%g0&(s^FAD;X9&2=I@E3}33Ra35x
z*(<)Nj(Ah0Kkg@_0VwR7#W}s{#RY3*zNnkI=ajMSw_r#e#~u{-=y_8ge89zf@pv}c
z`Zj~$r`^cLx;znmZJD7L>EtiF<pgJR?3drY))13UhPhUMhwJb)w>K6uKCbhBYmkj@
z|LmOR7!mvS2P82RzD^cE9KgR5-@AJecR1JNzfO`d-bGF3);_|$L{it%uXN=owr*IN
zrp|Y8dX-XW<^C4MPL5^q=22>U{|4Jru%H>)N#=OKd-1x~$;a_0x%&Y-vY%V0gUP-W
z5(i?NLEB~$;=hy%1Y-77nx~lnu}`VDSD73uURXYhKdo^J+&B5$_NJTctUf02qxJRn
z#p(F7rs}|hM~~Z=*T}xMjOTHP>L~S;#rssXlw8p_3|YgFo%aw29R@!pq$Eo?9}oyS
zVr1*sVj+Lh#}IUsYA0LAk??H-Kj=8^v#jT}x^L*4`6u~x0b42w7n2NSU-EATet3xa
zN`)u{-!%WZ>C;1brRUe_^QWB$R}%awcICe~>Y&(l^1r@YBLUxYq<NarP0ur}DtbL%
z{<Hu?8!x`5D_MRK?>GC@jC%OHqN2umT0)R8vf_uj)J^xA&vbhz){BLRm@}?dPsIY)
ze#G4(`__Du{-+%yW(O0nnGuBF!UiS?!aWaS)ww2j^n_F`c&H%=u;=ZN2pa1R!n0>1
z;^iTMA+FjZ@iu}8>_g}`k?eOvMsVE838)Jq0tS02uR*CPjTrd|s0DZ#VZKO+5u5BT
zHLEWpe1t;LH{{lCFncCS)t6C-0Eso5#WHDxVWAo$fl#Bc?{8376+@*nL+?XFjUq#>
z&QS&}6lO+jTIV4;BO&)jsP)dn7+S(?2*L@F;hww^oFk!byj(tN;lWTw)0PN_-EdZ%
z2)g2McDKlYbEIWt#PUu=0yJDcGQ_rm21O8=waXw2jSAgGgpY(r8buN}L?(~WXJ#V3
z7NW{qqK!u|LA4c84GXk<1TlBdqX_RtLz5$0pwUeBQCK7esu)w@%Z4$GVe@4l=8YMT
zq$R3|9cqaAkQhTx6^ADh*HsZVO~5#%7TZ_B7_AV+ycxJY61xqJWUq)r8%4fRi!0%c
z>okg5%ZOi&j9-N&^b&AyLF3<#B)EvgpDn}}jKp6}jszLUo<=4x9w!jebL;JJ*={EO
z<W1@<N~p(m=P~5gvQK>L>-Bws?FylQ&kjGkR1%j|jN@S<ZB&x2d(t6q{Mv5P^{ixW
z^^_XrWPW-SeQUA}RT78sC2V5o<|3ueEqUn=r>a+`-X2Z8vzMw(n0A*hO;<fl-yzK~
z3X^7Bnf72b&2%sAA$Ho1FWpK#-Nqr^E-KxjGTmu3-FYwlF(GywEyF`S!^<JVCo1Df
zWrqJ~M&MpXFkvQ=FB7Gn8Rn1~5tSKLnHe*h8Ml|2K$w-pmzAQPmFAF@5tWrynUyn|
zmA98wK$u;`mtCTsUFMMeG%CBYGP`;-yLK<TjxeWzFQ-vG=Y>N~b5u@iWlsBOPUl`u
zH(_osUv9s8?w~{Na8&MSW$yTB?&MzXG-2KhU*0SAym^PbH&J<um3hmfd8>PQYlQh5
zeED1I`P&ZpJ5l+2mHGRl`Trekg86?QHbH4rggI73L{~&rRm6-{#C@npAgWB_uT0UX
zOmnQvh_1}4s>~Uy%==JTKvY%4Usa+}RpwarG`gy?s;YXdysGv?RUJ`v1Ald+M)eEF
z>gMR`)~f3EvFgqb)!jrjz5F%(8a0ECHN(+0qg6HIV>Oc>YNm;5XZUMhY1Ga;*1n0Z
zU975I9;;pbP`gI-Y=i&Vmd3Mf$7egy&-SXG?T<Y>`0(sAQQZ-L-HArssbk&O=(=xJ
zb>GM8etxLK5Y^)d)Pru<<2lvi$J7&6*AtJ|lkV4(6E{!_G*I7exZ>167t;{_f0u5l
z&}TL?&~Y}rC2o{7c%KsaK+(p;K*lt+&Xi~PA^orggQ8{nLo3HeRwg4>%qrH|YPPwf
zw(M?p<_HI)F$Zoe-Ezk%?{~fBe?Yg){wKO6<hEfbEF~=9Q<(hya9P*zT4Z>_+<!y2
z-2a1a`Q2@KlVl!{+!~vlyO?6_oO-V~HTp2sz%9ctJfnFj!=WP+QIVCfob|{n+axTz
zH!Y|9D90iuw{0cQ!!O^mHa}&(z$2@$`fZ_iP?23jQTlO-Gpf`%wX|!l6!o?=0IRpG
zmm~hHx2#nlqbt4ID)Tq~1;AyX@o8pL_;ypuX;WnG%jnvdW82M{f1+D*|4g^+bQXT>
z%x&y?wcGVC=q)34FGed?$2vZaH4crxJ|1sqov2-(=susU-<<0CG}YQQ{k&)9#o)}&
z#LUX}O#kPZ&Tq3V<8xcHbITv+`oGL|4$XHQz3%_`X7t;ep5uk#PmALhi~SQz{fo<M
z$NxL&mUnxfx4(Vf{du_a@o4Yj_~7u%rypm>Ctr`xzMcN~c80-V001Ds06z&C)#?j-
zQ3TZdCL{Gl{Sg!#8o6o>#e*?WF~^mWhLYg~R;6f0_2;FdDZIK>CZo^G#xsPi#&Xpg
z%O`VS9v@al8=p=Wz)?g@8ch{5C2A@BrejT&ub%3ZXyj?UsG6@fYIIy3dr|$S&b&XG
z>GsQ-#YX#ARi@)FYnPi{x5n~rH$Pi#_dWTrI^JBj){Xdomu^w(r{qjmv!vx_cI&5<
zd33%JBV3OCs<`S7-HL<xNpeu|l<#g)8iN-tL#1dP-g(K86}?MV0yf@}$)FDl<8B!^
zY`cqTY+&gY^gp9pgqjF<@_gIMCn<E!7W)WA;PkAiBDrYAg230kiLlL7&Ny+X14o=Z
z`#i^;63C0KalZXj@#(TB;rvyKw}6cpxK%D|1bpeEYpC)CfT@^NI{_A^Rp7Zgv1*OE
zf6y&~ztb(lf6y&cWD*zulx}hPTe^kul5SafKK#5{BSl>#it+iBK-R#CI#Z5Ll{WWp
zbW76jbW6Z(k*rI)rB3h1CEfD<l5U|U{DW?}#f_y~(3f-zF{#WtN}Kzsy~p3sE!Ka~
zEj)kFE!Mx$Eh(b{jdKkG9rh>9qgcA-i#q3jrdyPMr(1dy5yt1b`-DFSK<foSJYzyC
zuIK}uXSmOkzP=3?BP)F8jUU;3GY{YX1m2ks4E!zKvM%_``Zu~I@He`JmGn<^3-h1o
zmOiqqOS+{QXqyNY+0~t-#L_J+q=BGJb<V$|TiW|Yhw_1+!{s-(+9lSA*UlYxs-LV}
z(k*6xN4M-kDj%#iq+2vIohu<pJ~B^v>yUJ>A`mUFm_EmECkQ6$Foq=$N#hzuJgx!3
zg<dV!CHmlsSpQSH#kK)|EbXx;(u3~D7q^xHoC@b5ev@_dP6DmS{(nigh*1Ayx`pbJ
zZuvx#v79&eL*d2L!86kVnO;IK2y5V>j+r8fjqexQLa3TOU28E8D_Bt(C(oJf4t7t{
zf}`%wuG8<g;1o(5%CD4t26I&3;%RSD36A{}-Ln2q>6XF=_Bx7^G^G;G-(pP;5)c6=
z_*tBzeFhpuIvKLa_O3;Y8Zd~8C?>IgGWSj)7<>$FN<ks)fw7Q*d#sE8^ZhPG3CjNt
z-SX%^=$661r(3drr(4YbA>Hx@H<&d65BH9f?|?`tG*-|bH^f>d*9Ui7gc2^YP%d$Z
z!|IatjAcvaU!hx$h?EW#v}AViA6}Q%o1x{0q=I%@fH{Led$b{NZ_fTFQD_jR#v8w_
z$wXvCrL~4xi>!9w0m{1v68J6}FSVNac&zI6dv80YEVaMTEmr>`-GauISUB(ikIpkg
zno-7abntDtG+X2Ku)x4KhMD)nuRWj;biLTR(guF~RGgQ`I%JXspR5ipfAsVZx+R^E
z?*I|mX5(!6U=dg1S$ykM+>sZ+7RE&K2i<b#Z|Rnj|0&%v^54)c1($S-E97B~5?MAe
zx;p6iAJQ!wwDY_-%oslG8MNQ$D}<m)-z$vazF4QNq)Oy_IJs{oU_&BF;9dWJiEcT-
zCIcru00*$2agPvQn|RaM5#nZyVf9h{cj*>JEZvfgrCVhGE4syH=JRiKi+S&Vrdt9w
z%Vp00o^E+}MSNl4ce+K8s^mZD77_ET?Ep52s5{#5UMAi{r0^efi_bc7V6LSP6(^Q%
z@&27|fhql!Zjo`NTiHqqqpgSE4d}?b=~$;R>`|#8#-gU_;}_nsG_QWXKI@s)tr7SU
zPGTKWicu)PZp4Q+XKGx)L2{Lnc9O;%9ySx=;yov;k6{}-F-JjRQ(yl?x4=P-#iZ|a
z@xx9?m%RQl-Qod?a0R^s8E+p;+bGM)a%k_mD~*ACBG9-`%_a8}<>0QwoKQjEezB~-
zrCVgoCEGnvbxPNB{!F)^ac{Z$6{h&=PzB%TrG7ui-_C(2MrXZQuTHk@^$VdvamDpi
zQC*Hh?GuW8{2m1vuREuYYeAuP&c8&r2ot-b*%SK|!z0Bk0pocq8M$3@kt+h-R06w-
zQmgJ!ax?-X$1K=GL+zIEtz^6;EZss!_y^t6EKEE@CG+4VDDNH*J`T8!m5lFP0mlbi
z@H^e|{I7J2D@f&)7ejc2-!6GT=9O7taB_*{DQl!a6G=rgzW?EWN4LDeEwPv8IVAao
zNGSMs=@v0!Aqr3umTrNAp5XD#!YE)$Al?*05!e4jx442tT>nb9P=Gv|@JryJ33rea
zKG#q4P}12DW*V+pbID3jVppP^=3eSA3f_XhrCWslo^J8^pU^EbaG47oi+gasKnLme
zO=1*^Eq1_tK$q9MUl4knQK-(>jAmCg%D|;0pVc*iY^T5UASzfiJmb#rG^QY-N4^k)
z?V~L2xr3TGGN+8GI%m0jOHyZbt}Ss<%3$dhS5Vdv9h+e?jXni6=9VZ~8U@)-BCbfj
z8i!;EPd-AO()uiOTB?AJjTG!dxo;j5ktCO=R`6>Pdb~&f>@*)^TnO<iB*-o#YAYmJ
z5(I535M5!N1)Qrlr3=_ucR6IP>Pt6nMd7%6zdXugP{<;^UrcdSxRdDA2qMK5h3v4(
z0l1`$ez-xdWLN#jB(JdM{4L!ggDwa>D&aXI;dCq>$6?($EY-PMc2BxY?|zxVMQP6e
zh;GUHjc$qhoo+e&JGv$354t7ezo1)^{t4ak0{fg33z<JwTF2`W2DhiACjCaYG$IsE
z*NNdhZiCX`;Wm<=g?a6NrCXBzM7IdRjh4o0mvIyC)oWO;SC9MoH7m(iJ2GbdcXUh1
zKc-uRTm>w3YTZTZPoD;xy(f0Dqu`+<{FmsKg5T&Ck;6uv5BOx>^rpNNYxPNBHd6Bl
z+ixm@b@kp)g+(I%MY`n)=#`54;|G#6vt$>#FBnrI{M8x<EgE@P%g&b?b?#qxx&SLP
zlznE!bJL)28;R*+mHqY-bm~g9DH%KPoJ<JKyKfFx4ijs#s+OjH`9P^5{#IKTS}aKS
z<>RB4PJ(0*4vetj>FpK^DW!Ia66<?<s*gFz<QAKQWUygoWgGR4rH7@fu8^K}JSzbH
zsJ_E%y+eD6sNfH}1&vKw0eexDMPg*iq#TVhijsI!8bCM!CMb^p{KUgSG58_LIh@<v
zP_B6V#lss7LfE550Z1c7?J$*}mqnM%Hg;Xw363I^d98JMt%*!Zb*Xt>7WrFF|3tSe
z{fTaA14Uu!777q%3{tlqbSp7Jkb<!Be;?fvg{51hiFe>ud>wt-jxE}4?8C%eQ4D3N
zBXr-qhrtRq=($|tUfkwca;oQ`3mp=UWh#Xacrva9Dj4K2sCR_rT`dD;p15!xlp9Y7
zAOLGnbge7iX&GERDt$;&W)VQf_M_CMV~EdjNa(QC{LRo3abM6n*Q!pxM*vylA=y59
z)SHd0sI@i9^)GZw5-=h3|DA3LAQpiWt?FDab(PW90NI<6&YIV)Qh;jV<9C+?R*UIS
znv{*^J!DD$kZwu(E8SxE2i@Wh`oBrHH1-r1_mlDa;fgL5e=IEem{<Zlzoc7a{$;vF
z@c&o3r4az{C%XQksEGJC>6SWkDJ^`jGgGU>Z9IHFiZ^kqKYMRk*5l9TQdk*!KjNHJ
zFxXHSGJHtqZ4lulgST#uFH!1P_0X-B>gb=*EzRazuwSI3Z8f+e<U)l$Ubyd|;<Vz-
zlx!=kH@L}C44*_F`zGCzEq7n1f41>mK}%}lStSqt)R<^sV~welU)fXH+^-eox_+^#
z&&I|EU~X?1Me1obR&a5^q%kjv{E1~S9Bfn%RE1=A2i%Dxei_A$-evsycXZ1cq1`{F
zTMB-sTax}lw`8$8iyvwPs37-lMBEcccIe_axc?2^Qt)rlEtG`+BHbdWL-Hv)-gzKc
z`boq)mz~AP<~Pg=@|3GrH`=gq)Zku-nfY6A1DQxq(lXiIf*74o^5l7#S@M4QPYJQ)
zg*l=E-MV|fjO3_gX4gN7;T-dAwEe(sKYcc$+4xyVk92Cm3comZVpqX@hx|?KMor$~
z!9S;48bO`=)P!A>;1yM(um72DX*?v=c1M2+yB7Sg8@J)B2&?t)bc^7h>6XAh(Jktr
z#E@i>deprEcX5P_R}b#a)6<I$$x*`Oo)ii?69ZCFuzR`@QVHbcdK7*mrPwB-TCrC$
z@zl`mvAisWZ#TuQ_nA`#qwNnUrh_Tw3ur?fG9%U1?_tp7;BORqxS250?;jN&M~`Mw
zS$LeY{v?@M6`I*&-555QW}BR*J6xkm)*QV{#r5v9;5;FPm-jagBlNmLDB+cB)(hwj
zrAXq_D=|h5>(Wv@3jwdv2iN#m;S&E2-6A&me~xbPK99lDEm6iNW(BMm6T356heivH
ztb@m|30obSaWOxole_<Ax~22Kq+9O%AEsNDEh6}0YTSipiYFSznYv{KG;2yZQ-(Pj
zJ;kb|ll?rjN?x!0Q@X`W{mV?g=)X_5w1ts|M2}w5Eu;UGZjr{)E%N^z-9mG9VRyJ7
zgTV0?NpN`mo3~FeHE*gv4Ai_{@>$eqSqv*;^4$#YvQT0PxnOhBj*iO<OEtEwywNK-
zk9u#MTqjPyjglFnCAf}2N4!yz_z${eL4n1gR6*aM#x_Z{fXTay=4t_wR@&fMtm=IS
zj7HWkDf`?;3AKW)rXlZq&3}Pz5&bvmmczf$EwlJ6vD$q+`C(^w0&DAUHLtq<tl)Mh
zx%aE<r_VYnAs|XKouYNbcxc3$U?a!p*ONDql0l>IG9rGRF^Og|Ju^%<-vB#n_T7qS
z$~?AXc7E5v74xk5t44PBPni6s<M`W+W9ax<O3<(GU)K!g(RWlymew#NzVJJf5zaE~
zthgC337Zdq$Ded#U@i@1hiRoO%@nsV3N8)!$Oc=&sKP=+Uokm+N2042NYcXMr!6$I
zkHbWosKwa{l&-Eug#XCdAZxeoKUk+wsiQ0;53XR*NlO$sfrZh<_duNIKm;-)>#}AW
z$`asOGNr_j>k>v0YU_J67S>AmM{WdsAJ^$O3AX4v%sU=LDv%k&IT}*!Q|sMEBU3}L
zIqpU6RL+X>+sjr1Z8On|S`K07ivvG2#A9&cEC>}fIm^h5N4bQK8RL{GIk&~sHIp5}
zc+hW|!j8!zCQzi}nd}rUY%2U0AQmrk8#StpFlzB$|FuL#Vl7t`m+~gH>_V@oJZ|Xc
z19L+EmR>@|<Z<c&1fC!e(yWP*qFHPbPIb~i|HQ4lYOmv-6Fdvy8!|2h-;Hxvm$j=L
zTbyDlOR?KuLBclpO4dFCUT@xwN>!~V>XNWQPITT2JcV{WAVK2ouWvGx9mcVNJ@Cb`
z6>@pDIPZ_<1Vc3Vth2mvLCTvDB_n(aJ*6BbHDurq8jXcRpK0IcXkXD6Jep#BcsW?b
z<qWI1m}Tp7D}bKDRc5pX-|H5Cicb~X9+jzD5A_gNCc8}mnl&LDKRm$E{t5I^#Ixd=
zZK#vs#|?K~6y3GD*rK)sa241^z*J;Kc%w=Elt9D1@?V@BA(|iJCGK_sl+Wu>`WpeZ
zl!drd1`WmHf|hgwB^aQWzfN)npZBd!n1#4CxiNt2VTRNX=42<9SqQz}$qM1eMMAn@
z_6k#NcS9!nh(&sC-GquL1~Xbb6RhZ`B166zJ?50UVJbL%ezBm*ZO|~xam`(OPU)TK
zn^t~5Z7P&gif}GRBgxSqm8EM4tr{EE=>qaP@{oit;48TIONjS?aKdZbN5z7yv9Q^Z
z5ZXwb=C*AGV!!XpXQq-ocsVY}C{J||kI^jx1MH8<y`J5{K|<bpOT>jO&Su@2zKdW@
zTG6|g;k@{2v#$yygRMQ}Q48wVZiKi?Z?sorfBbCEaMTNAg4Y6NAILi$706iP^UG*N
zfz}=Q;H6dM0tS~xNJ{1U__#nyA#_xk%{2*mpP1!~;w?okN@&NUXsXk`ar1iBN@-;1
zHH*ISz};lNg<NwrIPO*0ZfM$5|95<noaArpqhJBO(RZwcr=2RF=WSHR5&`Qt_pi<3
z@lyb7sTI^$5&^(bfm^a;QCXS*AyLj5N+igNYkG_W&fiAe-sgQaKMN<ADgpt507<x+
zU_O3ra`0HGS2MR~f&;0Zn@$goS3H(^p>Uwi>YKH8^ujVP+)S~48fBNvOQ8e(jqk>_
zW*cJWq)`vaU%&47jd}SrL?gYD8QKdNAd9uI%uB3%L^d9Bgo^3A@|c!aRDP0!cElnn
z#>FTMrdH}q#RsC!WIdDen>qC0%~jq+fT5lZ4i2{%sUg}hZaw9L`z>tiJDI91J%^vD
z_WDRXb;6@4a3GS1Ealfj-mw%xWELYo7^~6G`L4wiO3M0gUg`FI{#_VJ!FmpY6n<@U
zmUi*{u0*vQ=Vv*0@I~%^4k6EMI0Rrtf`D~~%|mGrE&^%yj$x5&vpH&)!bv6L8>0@k
z!IK#PBnjBT1V(TI#dVZNCJqir2adfkB0RVdcZYQd7lJ?lh#cjaYj=eJVJE6E1TISi
zf*hMw4>Iw)LX2o9Q&Yx6lNSQXI{?7F4m1?><Ffz&-j8bpSN8Hg2jOEn$eDH6iF(!<
zY1DA=0AYZ@x9un)K{iU-4S^#J04xO0Z$J>XH8(pg^nKK>O!WQiGm-l)GXMrWwTiEj
zAQm#pW!R@gqDTk|lrOZ-o~xG<19QL*u;9l70Oygq;aU{9_y~ZF0(T;(y-y$se;uoc
zggG&E;nzdlDiDOclw$%(<mLd%AJXx?rA;i%tVN!1PLvY>G<&*f(BXCjFCMc(esNH?
zf<V*6NKhz@n!X2Dw#WEHZXG+u_zJ*LmL)8O6UV~9Xh3`GWs!6QF&c4%;;Z0j_V5KA
zHcCH?>C=%`h!?<u3P|c!0H2qV)Es!REcsmqAA5fo&co+jGWbwl1Wl_H6*2@*Rt`Xm
zG6^e@zXPs2$&pO7c<4xo!SK0Zh-<Qx(<xH7PT)Wj1VAHiD7W4Ki$Qn+Cf>HJ82HN*
znYSEDh60o<oJs2`aP1rj01uV_p#<nCvCHC1e?j7)6@9Z6&2ES3wI~iy+`O;MI>#VI
z^{t!Q0ZxSsze0cztLY9xy&$(AB8NAULzQTXl<>qUoqGnHLPI<byNO(fu++;awX%^X
z;AW0p9!f`!BuJC2ByUpJiERAI%@vODFCYX30W4dLQt$*PNV6x0VbCKJU`@T5y`}p2
zM>tK3lFKp+w58vSgzEv;c_ApO@I_%NW(RxL2P1y4*qp%r26{Q~{PsYG%0cE5da;+f
zgkI3fq@jJ(4gJ(Jzd0|wV!t^rNhGP_{+G^6l4p}F_qqBv>TryQdO~S?&?`vW?H=;E
zB=UOo-<_9!hLJlTQ3WJe*a9bcMb+P0nCKi4w^AM%km73;!qftN+7n^YuhxSedHJyb
zC$XE#xL<HTOz|U1jT6Fe4>;#`Uq$0(GAaWIu<2owoen_C3b8nR?t#VwRRFp=5M{U&
z8w?nFG%QUsSrX7QeKJk~LujGH<qvN&xdNv4ZNvb8udIQ;i>F%%K-AjjOF<aZLOIj=
za8Lz89}dP}kky2T<i{vbAptH~EqcPq8BdiPDEWHXhyatx*8!6r2=Fft5SSPEAjT5`
z8tWV=ZN?%muBjDJh<eX>>_p#}6}Gwl&P);+Eb@YqQ2=-mS9TQ_KtQeD%V~}~x=<a0
zo(?SpVwwT?p%<=E-A+{`LnM^+`qjW=dpQ6OP*Ds{$H-B!X(oUbE|C{_tKFeAHql#h
zA3W<JC$t|*SlgMT6pC{$`znT#@TaU;Q@92edEp%-VpRirI!S-Zl4FsV!cH6j#El((
z&Fs0*EIsw4X07LNJ`WGcjJUJFlMe;kCQf&hPV>hVVVxHYxBbNT+wD}}!tVpBSm;F(
z3%%G&W1*KIEc8-13S~o1VxgDBS6JxfrWfpY=S5j1>Av|Z=!`D)UYK%fl04RVsnAoy
zIxny}vA80E!M{2$Ex$Q0i#M>&ivicGPV~5TVEW@j?0rhnBcGL4;b~SN4NWBNp*TPb
zz?iGAvnubt_#5>C*AIc=1}B299Yi^efQ)_;8{c?sXB;LSM+v#j&nAqZNR)lLA1>9S
z>nvwb=V0J^gx~g&P^Ui3=``li9YZj?sQ(?#fXO#BM1Q4TV4=QH4yxlQVR+e-?HIpp
zL(GO~gb-(BoDl~9*icz2R5!am%*IHpY$1&DH|qsZ`ptSV{;^W@M#k8ai;Bwp&Q&TU
zHRsVp8=(7l>IFS?Nxjs|C49t#VyTyk->4VZ<R$gOI)}hgFAKT}HdHZrf?Uf+@p<<_
z?w8cd8xEyQ>V<c}Qtuk(l6nDVu+$6eHkNwfDZ8Xz(l4o(rQfNSKC4CzT{+xI%{nag
z0-J45>Hdv+xlg?)gXXwXYnogoM;hp>pI%{-w;)y%Hy<CjavvFr(*mb1l6x)}@mQs>
z^>mI}0caMYj7oXX7Dw4Pv3w1QBukUk+`aEI2$mp5Vl1veG+0~OAHa=dfT0_dZih%*
zVT9%B3N&kF79EatC7c|ig3LjgJyAg|<CB9i;gfG17JBep0Vo=>jLl}tyeITm@Ff|~
zbY{M%K`1Fu4&PY~2Vw+3TyF>`Vi6)FULuf64I#x&EG@LjZUf+a1QKLUg+vl!XT0Zc
zk+~x96A?EK@LnI_k!zU|CL#zETWJyz;a0eW=3@M=0A341RfSSA5h3>jkTe2>b0Iip
z0GYiee<Fad^FXLNOveKl$y>F~0l?vi>{r7ef==v1BqpA;G>2qumpPTepA|D>Q(ebb
z>$wD95><ERDR-ITd;u^<Br)WkW0c_tc%hfjW8bXv+|2)ucvt(f1A2NIyImlVL!i$3
z6xDBXl(RxfQDti&BVbo1f(CXMy|3e}1DSPN#vvFp(?R_7>>xVqU<yRwvc4qp?y7gP
zT+Ri$ND;cv@JMx5a9nRH{kZ?b#?%IZ1Ym$B?N)98x?TWi>y)`?ix53&!-dMW)#B|w
z00zBmIJlE!xn+kr7HJ&bk$ai$q5u;-6pk>0>X2Id<sIFTyKSZj?EYf?T7$|Mc+X@d
zs%mg|9wGq?IortA6^hg~2T8!^jd{cGjD*}pM@UoP`#%#B$+QbTv_sf}8h!Eny|t4Q
z!RF{F*pnE{0|1OuvgN67EsdVi8ri~(-(`XVWEGP{^$=Ycpg?A-`0OFQ1p)`H>Q>RH
z`m5VPZCRcbX;IsZE8MT#e#evotYt9lDIcLj`vJRHkA*?YG$HyD04W;5WP4B7+s4`6
z@{9v*R`|i=+`@geY0If|lM$Hq0GufzG+rU)bspR<eXvE{b%SKi=Is!-*~7{kNw)>>
zQc;H9)xvSLwr)^Ccn2W3Re?4A<sFYr2Uxd9{T`G4&W?@UT#H%^LCKkM$P_NF)mR9F
z8i=m~<V=C0g@zzZX|AH{lzhW5>;yBfuTxQ>W~Oj?IiiFMrE`o@RUL>Obhu+luf@DJ
zz>vYW@eXmEShcp|x*op<jG2{FxRVr^P1EG@P2<eF^buFp+Eu$Il}m8<+8^w4sJ|{7
zEs&4EC-|Uq%>m3xS=x2yHI{m@-==b~eyO~pZ`41`AiJZdEYW1j%LHsGNo2$#ly%oz
zx6NPJtm5pBdH6axk8IMUC%sfLw1lbyMzTA<YcIe@7J~;WpYRrB5Z6?bsKxDunAwN1
z+6#JNgp51n9J~Yz;i#{mUO-9Phe)4?3MHY$pm;ycQOK^H%08pOg(K$RFzQ5<Tp})l
z?^1h_ztmo0nCv5>Kdn$k;95UxufEh?fGO+&Nxco#=xR#-Ln^*^nB;-xOYVh029Gsd
z)nNUSdvWc+4Fw2V;I9KM7GspDEPx}kWe`4~>u>YL#q^%_XZ%N&kI2;9l;mY1fRP)N
z(<PwgK`<#4p}{dOPk_KTcS!i?vg?ny)jZl952HeK;F#aOa@Tr5qJw)#-x-d?#ebBQ
z+tqp{+yQ~?-8!Z|(zj=Jql!qxYA>JS2u5uiIAAz0$3hGftGyPmm<=eY3S|ik^Ib<$
zQ$%R`hKTh<2;;gxdUM7@fwHEHKxnvg*&Y9deKFsy&5XEYUq(W6*a$3UM2MCSi~}Kt
zL*Q8uh<xq%S~mcO15Un>S%#C;Ypa1*A~3Pc$_q*%l546U7{WnV{^NJ8!}lIkPr|9e
zN?AWnie>hn)r2v2-cccgNt!-3<W5?WmH)bbNxyV{3Tu7qp>eDCcC*9M=_&=H)7Z(n
z?dOIhHGV?Cz7|^4nc^Jey5ynO6z9{@Ikbs`(4?AyDA`-~a6@+YLt9lsZ)4?`$o*zg
zgc`m##}WAfyEh*y(ki2v)*NKvhnI36UjiN39348}i~s0r92X4q;<z^C*LPzh+$r1w
zIUVm*qhs#B;xEmP)z1#`_|OsFzF7PPSB5CV?Jj!|X6`rq1u-uObi8)IcHL!G*BTvT
ziB^%XE$zhOFSRn(m>;AFJo^{D9w=3;{(_KyRq_qj-qBP3@HhPhK}!pM(b-Omw|%L<
zAiy>Vd9402jm@s{N07sSS#fy?tN9M~GOv7uh6nbwjKERzr^@=G(e0^>kSA&ZUew|(
z%K>|!PBVZ&5=7?Og6QdO^#}w=5Iq}=$v9MsCcFq%wxQS%h#)$AW*8uqzDCmY9)Uy1
zzyz51y7nxI+w4FY3ulExA)xCb-qNl;R#?wAf=bBo3-4^HMusSt-)3lc#l5HZY8_Ac
zU)S7k#?mb}KGZ9`c^?>e)nSzI>Sp@Kq6X9u8>_Ka6O?`XQF+CMFFfzXyV!1Rdxwdw
zeav(n9jm2Q{W?yI;Jk;$GljQ)(U6>=U#0U|ZKa~S=wDqgMxIZt<qO_jjyjT57XP^L
z-0s!0gU=4HR@!_{KCOPw3I%~6<@MZ2P=K@?H()okhbI*WrzQ_2j^-JnzzdCF<&O_J
zM3U<QF!LFFRY`(y7PTaF9PY-!v?<KoJOqW4M<snI)iWt&e%=K4B<9p327NrZRS=wM
zPNRUMXa0o*4?>~?fU8NiL4aou_Fo($*j$5$nB*yfb;q811?MWSF#I}2SOkKC@YF32
z87XYO0T7fLrGf!HAQb@;E(JJAAU%oTF*RYpi;#;~E%;*=@~#jO7!mr|)DQEGEAzIT
z4MUbqb{77P!aS~U*sm3K2!kay@0a18FXfJGl66Re89Z0wHq$BiWhnG$eQU?UYl35#
z%GkF7#M+>)nw52F!Pwb4en`MtFuzkUAIi(J{i@1a!mydiwP)pbgsK7kREg&wAd^%|
zfh93~cawPr#1x}+Z^tU^-5amzr175<e?j5((PgZL%EsjdEa$F}D4u?`u$o-s*bCLu
z=Kw%dx?UrZ$7&f3gHobK8I@RXkhUD~m-ga}wzggG{z-O&y9$R`a9+kD^kuyG^kHR!
zM3<n)l603^W4y%AnpabLv-T3&Ill%{gv+mf?-!A8M!SMZ#d9&-d)BtNNtyDG7*+du
zK>b5Q+{Wu3YO)cJ+@mKIh~+%>sxJJ+XVrrj?+B<T4TsL&z1^8AdX5XcxU0Ey)&t+Y
z^Yg}n3XZ1uVk0tHW6`9x5uf#uU;~MBic6I?rvs`y>t@74r{r1_J(I*b@}!!SPaVmo
zz!D<Bd@7!}>rS)LYB3wt8S^0i%R*p31YCd<p^*Mwe@}N(h|21!&v;RFm-K!uU0~mK
z!}t`9_`Qjs?*}iox@6X~+TUJb5UM}gtDGP?Zr8h5cU~@CMa2K;xiBY@JN3p)%A74a
zb<2HS^)E>JJpb@U%mmI(Z|u3PhD4;0^^~sWjjC?;VXONp7)20zZ~rD1gqb*&1Jc5)
z0V-F05VkmzBN{`kW)W;usr0KWDJm_?ff?dq?)*%Ifae`jvui}rPIEB+)e|mCOZ!QK
zDmGD)=Q_IXuwHH|-hN>R=Wq#Y4bsOI{juj8;3p0ndhx7r+Uhtg1v7g5Xvo0AE{C92
zeT2blw@41af_!=bbzSu=N~s1#3WxUb93~O8%9h;O2L>n?C`7K0C=ekM6^EOOJGQw#
zlfEq6(*JUoL<GGKvFsTZD6J1QKDT1ZGQy=;IE+(cR3KSHj|+7OgRie_Qu`<NQ+#<j
zaL2_4X|=${n?=>ClPt<nB3MQ`qo}6kCqiB0Hd&78J0#N@Q)S6(*SKjm60Q``M|XRn
z*CJjA|9b8^g@4PSfJ;v%gP;X-3}rv%)h8j)dITPPVZh+g-7shAqMWy1-tROe6SATK
zg1A^>3T#}0^hY>Rhsm%&Ivgc<!9nfvZJRkhF`aDyk>B)VNALYnDzx}{A^l9Af>IPZ
zl-3o=<I60hbc6qnNC^rMN`ux&5j{9|qoMz)ib;2kNwTp_UPBKHy=8~k6mQ?XH=@X{
zj7ktjY^EC;j}rzo;ESj!6x>@-xWb}>Qag;&k{Kz6g}a8lAT1(;+ao1%v%6!=JdrX8
zh*D$Ke672ex6C1n{>hox9a7vtiyJ8to0gb60lBy~x9kfg&JOkOek%*eY3U`KN(@sf
z+@{D1t+b!A(5?B1D^x*QdT%fhPtcKrN~sV>?`Q9n;3xLHibVyc^h5gY*B@(uzzs5j
zrFjNs*CqnNT8D-mG~^{k0*6eRT-ExbsK_JwC2To5K!n^ff1UQCzE<Lk6#2tzMJ!wl
zePjb{ah6{mM@IlPmFY9x+J{`k$14MpO>A+#E5%pujg(p^d`Pfi+<-Le*fQnU8w*dJ
z6~y?BL4ODn+oPMi&N{CLom8*=JZ|p(_47IcB)E=44Ta{g3WreFtmBEb^pZ%_qkf}X
zGJA8N{klfuiVy9L_+_9DmG^O?&oE22%)L&%gz<<<?R76}V|xV>Eg;j&w+K%{Yu~Vz
z504f`*H%`XB5Dk;(Eiwh=ZXWiHcm7dEpCali*%Fv%BmL3X-QDRdUTWNB2~zvb=>UN
zpXe5`>{m7KZ#1?}x&(>k{!X_{d3Ska87?Z48R8XZCv&Acydrm#?f1MZH9+Plv1_-Y
z$ncaJTivBhNK)^&IEOjN9Ey<NeC)_HXcP_`!AdeTO3fD(!=jAd(xLh!EM2}{wD!Wp
zZuaF&xn!QiJ0dZfKRoffe%+`?34OGnZeJMUmLSciLRm4$EIL?7G?fS)IMB7@&2>q<
zjOw&$w*HQJGiBi3+%M!}^}v7Sz3th{;hzT{jo%mC&o@5!@j;v;*<wzx2FtrczCcDr
zA}{+)nt+Y4w!jiHuiZ=uKdHltnmE!U;>jC=(N3b1o0a!m4^+yW4rmh{H<=&iDg7*D
zXv&3OWzk;tS6a@Q&(F2zqpNi>dh5RYqbb-oyYzav@I4vztt<0~DyFt>D9gEiIyfTd
zCPE%ubX|!>1~wpcAFen;VhI&1m=u$^OA`Cgb1uzfW4>QY+(DMhP?N276w?|{)_iT7
zJ>f~XL#y|0YoMekUAujdKQUjfCADP*q{yD)3g3z%BM)oQbpo*}{VpN?D4rNP+l?6N
z*i9N446mv^M8v2gL*)r|f%J~jb>Zg)Js;H-zN?%Xb!y6PAJ_#Gbx2nFeQ5Xve)f=P
z)av@h^K~nlpRb3w<=q~LBx>v|!8-KLKaz`du=B@hOFLy@qM34wFWf>knfn^PA9!?s
zm&h45%s|YS6n5?Z3T58A6MXTsG%x)b?Zb<Q505|XZ!wJTy7<VwjL|(;)M@)v28&f>
zV(ev`Q{dKHVRoHjqj@D--%}>6iJOdfBE>Sx$8u7uM4UNO>xIYLl<+l>l^}fm5n_$d
zB<*ft7)=uk{Dso+-30M~G(vWjZ$GJt%cqIc*Uyt!zCT&(w81&TdIXXE%pVolNwlXw
z_VVOnLc{~GoC;!@u}|<2L6?Vsvd%K+BI8~lXd-*b=Hj5jW)AR&de}Hl6NrwSlD#mB
zGm@3zWf6nRpzIfI609N6X;GQDPWD6lZcRGTQqlLGLS`yFmY{W6#y+TW2u*AsRjwkf
zUcYF)LRHzi>_ETtqduyRY^eAuvja$e9mQq2DUgc`Wn;(l8hoD?hWD+A{~0?$7bDY9
zp50{Lua-@nIX3vH<psJ}XMz3e>N3wtAF~>Wf>E&)opZguZ%_qKK0whfQi-W2P9nGW
zsi2kE>)vNfy?g<RoF*()dcAzl*<s;ZqkHVv%bDLFXs>p%gPy$pILU6mYNnXFb+(FG
z=3Bw#Q0u2q?qgnArb=BpnM8g5h7z+h6W6kWOK%C~_ED*!VD|kGmoe7TD3}(fieIk4
z7zezQ1v3Bkz#@};GF?@g;+Adbtq;uPwu*AxA>tHosp@eUbnZ<fbT|e3`F1Da7buCQ
zcS7}PcV1(2_)&}_y=<C^lT9I1`keQ;%k1WvM;lg+=UIuRQWq!JbziRkQnOLi;UXYg
zk{;-nT<;g1>ld2nqp+Be<}AJ51R8XWR=Pk{f9rc%!__~bbkn|HFmYSbB^tuV_3&)_
z=KR|q-)yo<*9`H>&1WGNp9=4}=k2ef9x-uSt8$+TCgvwWuRW(A6xCtLpSQ8Z=-8GQ
zTHhlt4C8i4FL(GbD1|#y4CofVuzEI%<CJf^uNE>tTJHST_Fj0YqgJlV`>QU`<Aq`u
z9+UC7EwSm*?ie!ixEs8a>gaWs=kZj1>Z!$(F30U<#^dc?u4`+@=FH>sd;{ys_{8%(
zkxq1q-@)cn5qKA(UCE*b`<*JD1{}Zt7H9W(>giX~{;Nxxha}UF2K%p@5(SY}*zxW7
zUgbr)JnRLNelyQv6n_|^S`n(n8)gtDxkQ4^{hU<^laQqnV$+Zb=;O|fmngIj%isO%
z`QE3BH`*-EXd#xu0VP3Tb9|RdXb+^fPykcz<L?ZS_r;NXS&>+N$Ism^i43zhT&5^+
z$V2f?<^CNNxnHly7;)a8D$&Yn%T_>=T^tryczpc$GB&T?V4OzFR_ZD9={Mli@|8ek
ztuwp!%2|1R#`yMyZ3}w&3}Nrl6H2z~N_zoVhmf5ouy6cF@%5HT#m&m%Yy9virALk`
zgCdRwq120y6wPo`%QW~YPC>h);W^21@}5<UQ6DPnd7XXp?E@SavZ_A7sthZtiZw!v
z9r$a#2Ok)5JyPa(Mr1y+?<cE=+nM6ksfICzCQdR|KC15}tw-4JI_k;xpOEz0rV}+)
zkv%_~6rJnURvF~;?d36#mbX@<J-6eW!;w%|dHE^%rn2Jw$>p3WC08QM(@D?bytBo!
z=Q<Uy`M)UNi<%!ITyZj<Q>ec`*sZ0~1tHChXKgJ1pa;&?Qxm|<?Y!j_T;nw3jKvks
z!=)fFS<O|s@li2Ht>2h)O~<0fX#gR@M43UR1cf0x9P#8QLJGqn=rX8*;Fb_xM!F@M
zCv{ryoS!(iy6YubcYbAa{*-is!m52g@5d0RC#0P@q&>YFty<fD(J#=#8EQLNnTL?5
z0ToOrioBahODnp4@w&H_vp_AW+bh0Dac|N4;LWDeO=#{-ue-E!vGS!t43C)i&ilD1
z`qv=OBx2`yCX_ZHkj<;l#Mi6rOXun5aLOn8`&6-Ke$GsXqdc*geTPe9CYo*?G_Nrz
zE!fNBS>|*eG8c3}YoqwuU8N;{|IH_)o^?n`RCRFrr#-Fv^vnm+O`rDD2iJ){sZl=L
zxb|$5`xB4&r_cY3y}JyGqh0$&KfnNkyW1eao!~Zu1PFmZaEAcFg9S-~%na`C?wSC>
zB?On?1a|@<Xaa$tNjO6uUF&()`>yrwz3ZG)wY$2yKlG>Ws=mAX>g)dhxS^&^yF}id
z9Q&O%ZE`pYT_@-A0;QG5*ev`XnAK%=lMx7#;c{K>Zu~?i$0kGao)R7IfZ4mfr6ZMT
zfc?%xQk`m~5dkg4<(crz>~rIune1S7L?vue!Abpeme2k5ao@llblIXxSpX_wrX1Zl
zx303@jtUCnG!z$*H*8LPv5z8?2_TF_koJ&*=8G0FDnMv?7<?$0Y+003YTDYGcMl4&
z3S91KDvrHyko?AfitS1$dc8_W<9hlwSZo|XPR9Kqo)_=j3McbJ$gQ=3)I)3VFxm#%
zV-z?|mg8I9Zmen)G@i8Y+@1XmScHTRr0QVX`2quOt~lPVg}}p(FafG-?O1zsqB8;F
zD*;00``_}bWX*NILbnA8wSG8OY2$u5OJ5QV{hYi7{~pdul0sxO4Mi=#!${vrH~<%`
zhMUu(EGf&A?|0lHkEd*MmYnJ&q=m9<4r2Lq2~~Cr(RMQJDstg=@<&sw&ZAeVBg_5r
z^iz-Y6sT!RADgZ@RkzELFG0{I@NRwWma^qOxa8X-eIcvx`NXde%efDwM4N2}_x#dc
zn_m#fcYwcEI{4L5kM!D6dkSuk#AZO+8CIxRIe;bp0@-SmuW{pxrbp6dLQ)Lrcn<Qo
z3cYNBFJ&-;YsyE}$?$Tdj`C`BamV#-dSUXTW|VeSZ!ZJ7i`~z4(fG4qVz=Mx>hqnt
z?V+S_&6ql$2A_zi@_mgzamqaDc3mOLd|CCic6h2tRx0yWcJ13wClV*Od+rEk$J^@+
z%S9SwP>$;xazk;d!Du|4cvIYDD4m8&5Efe0rOIy3Dh$~$6asE23uOLX&?^!NQyf|-
zc@KoOI-9(qUe8ub)Jcmnu#-j`P7=tbcWAehWQr?hLhY+B`>umec>KpJk|pkLLSrG3
zif9p<FC6EkDp%L?*3Bw7tilfYwGNOk__oM<0~NzY5sF!NicN37Su2+^#+8eE1biY;
zeM)%uM4J|YM`NPB)J2$h=+LOnn{ue2_n6!~L8iJxf)*vziCa+>-8P_3_Nk|EY4BR!
zi7v|*tj+uME3goIuO9<-)>oMxS7@H@E8HFWtbhcf*FnPrWQ5>`(_(b$VlP~UF6QT-
zt%g2xEJ2v878dGZId4(M;es^dkSUZh+ER4GZ*<*J!ZV|<#6ZMGUv-P4X3d&D&`V7T
zazkZCUp;xswr{^6+15#u>Z}W#9n9=7_UXc6K_nKfVR?6wsz3!C`5#5;S$!6@_R3U6
zye$EAa&cb^@Y}iD#`M`#RNAB*iY|Fya9ijuLB1V^+2c$ZWW#6yUgiV$77lczypoev
zQInN|5?hO)N{X@&9of*%Y)Ef%qdJ|{)9ZT+?y5X8gb9pcP?H9LupY1GeRP^l^c)SZ
zrv*=>2&Z*GUx}K}i8!8V16$Iry-jo*WsSYm-AzmIXXIa^6|=L%m<92%ECeuA^E96e
zR%0NB(m(b=Oz6+CrlR!wZRj!~Qgvv&Y*`kl^yWQi3|N~&N^;S6;i1oa#h-NRZEli#
zu2c4RTzw-2CoT!u>M~U~fh|a^R8LDjN2Ly>8~q@DlxShthN?{|-qW({^A13rEXnWW
zO*VK9m9jb2v691G0vwck%I0(s9;PSzBU(k*DLn4cRm0vcJ#Vi~ZhLo?R}}Q9$=hVO
zyS-I%Pdh-+w+lZt6QU>(|K=G^Pq!2<O8E4!R2@KPNvuVwSCD(rp;WTS?5rg8LR%Bv
zXUHo(Kz}%3Zt!!5L!IcO%C@H@V+#4NNS9z^Hj+=!pf<zum8wBs=@HEL5(f7->3bl9
zbpd?0^EmrUB38R98Q`Z4fbrO%mjQ2CH?>PkP^x3@kmE`kI<3>gCa@fvA{$7Sge0mX
zzOY74)sy({%_V+Mf5^t0gLj5j>wX}=QsHXdyS39T|Dg7V3#V@8o!R$zCdufZJr&7u
zulKT8S5Yvvb+p^l<hLaD1tubdP4*#^?(Bmc)9<QUL;xr_bCi{51UPe_^m-va6c4m8
zgbBxkWRwGBiWDuOy($&HX|~->Zpj3BK^-{=%OZ54ylNxdr05d#@4M1E7xwq*pdZ;^
zI6jM`SR*Lsf2il9(Q72@HHuac7u2m9)GHPF!p>0JF<nOEp5gl_y#{$%{d)q&xZA_>
z<tRN;{+BbpBy-Nof@Y|DbeSPzW(r{>9J+PhHTex{jmTI&QkC>nW>uz<<69p>DMT7)
z=;E2IW020vE82@f0!#HQ$)~3$7bLbCdGcZ8!p}%|MxBpXPgO5T?X}Cuj|MaEPF$D0
zsU*5uZ_^*!)v2)@Ocs7l?qpc+Ft2`~M_^{`b4+;m9jiu;nA0BpWk!h;pE?3#kzB-w
z@)x?LkNt5-FWv1nu?8P1_eUccf6y%vK|V*iA142SZh7s#Tq2)lT0^z{C3e=@qfp`0
z>+R4;Xqoe$=oa3F1uPM^@CatVSJAR&x0#~CeXv9M_~Mc)+JF2`x4f~bA7JaTj=Lkz
z>STLp6L#;LI8Tw*seZonH`?FnmV$Ct9Dj`A{8SQP`bVITdaPaAfM@AOqL!)Mc-L=q
zi|g%cT;UV82>Zgho*cEp!~S9q&(KJ`)ytZ2aq8dcmN3U9jg0Guxln5VM|O<C_n5kE
z!UlbgKPHpdrrvt{E8XI#4i0Ne2jz?Yuh1=O(qz-xIwncex+cD4Gy2w9Ni&8{ugPYO
zJ(iPZO?|(U&6x+$CC@#Kk|v+GN-{~Ff0X4*zF=FFmAqj8;x+lAWBqdS;^Wuf$(LMu
z=~9;5Mx-g0pG=#iEPF2dQmlA?$VypxcJP{F)#vMS%BtV@?-Xm-Fm(FVH3Xgv<$55Q
zY3h0~ogd}<&|BH5@56c8DK{d8S5h~krGHRv#wyaMZN{s~P<=?$F-`lBY~n|?m1>=x
zwv~<yTKt&lv6A*N+xG|6c5V=T`gVSl4E0W7l4<%*ah4zTZfQ|=`fm9Pk?9N#u}<`i
zir3Mp^v_t{Z$_{Wi!9>nuwY;9HDJkLM6ow$pl68WS9e9<)h+|#*J2%&#Pj4=2aq@7
zeWu8MRbY#j(R8ua%kZ@2w4bsSE9}k@AFFJp`*SjJBQnYSHD)H6%Fy=_N=%JLd$r;_
zw4TpoV^E`PZO{4`CdQ(fNd2ql5xCBzdeW!wSBrWb)#=xl8Lk(-N~H5YJjLqSUvWpp
z%=BUHGQG+gN3qEX-4tg{e_kybPP;$-QKszVf@;Xen_bY%*R4yG)6c*C&1(L4j!XLI
zo3Z`+qaR~XsR`gDaZ0PU6Bt~SXf9(yG@qi0&=tKAo)3pq<||9yV0{TB(1d}-ip@n#
zQ=PcvCYF!Ep`@)&k2%R$mKD^ST6yYX*_%SUR^>vw!%t$F7?-l>#@ESfmpACy@2wH{
zDuEn*Q1FPbf`N@-5$DKga{omY_IwCNSZRKQG!{BTOK_VA?FPLMC{R=TC{!tP6#sEg
z7ES>`zHA_tiLI`S8N}Gc{=}JGVlxjUfZ7ulNQfT;Qn<z%JZvvL*$BPRU?xce5$J%b
z@E#U~ydM>jchP4goXcHQAFvQ{QRsPWf2_nWmKUydxj|pY-zOjj$Fm$qrJsYa@SH;<
zx>RbCsv<vdJE-6rDr_)$2GDX_s|>yDjVGyV3Q@@AP>Yxwp{!n0;Ae@CvGjiEKwM*W
zOA3B3ta>u(cH|b84SO6(7bDXdJ0tKlmb!6IZCd>arj$!(n8rQz*dP2>Gg5GQ`MWHE
zZvy*w{0v6y?gTP?FGLqF4O0)l3#7>dp^HV&4Rsv^khfK{unq4JJS#<z^mp_raB$Q=
znB&2ou<a%{<!Gy&hx+{xvj9I46T811=y7#B;~VI@Msgs}(yM%%k<Bxuhh40w)JD?&
zK}l1e!ySt>WptDGqo?Q>uG5aDFF^Okbi+a``LWAe`*%h?@B1rE2NJ<6<`<~qy!za;
zn-{Zo>+D5zItl`9<R3xc`tom*qGLlMyZD$(C93n){VqZm=c8-xt3T8UCsts>-mwsA
zAdaW^OSD(bVSTq8C4em(1(LGW44YK}2E3(tsKSMcGj-A3;Axw^RPEZub0}XC-eFC!
zu8D<%=q~$Sy-fa$OLQ$=t?BUa&Mit+BI`RWO-;t8;DH*c+Q*Hpn*0?W6d&<66&Za!
z*8-%}&(ZzCWB6yG7z}r7jJ7V58T5KMMF#j=uBBF@2t5gxNH<aNzrH$an78Jk)@F<u
z`x;%%wA8<2juQQY={Psknw!!C$Mo}MK!mNn9i^g8h%J9o#}C3K<^iJV5t;g0%{8Eu
zoULwgekYBz39DUN@Jy%Lk@J_1UgmT25QsJ^;>5*#IlE*rV!#sN*=iH&YbWAn`!x^3
zt!Qr%CdZj`_Eu?g&_kLsDCAVHsV|Bt-3UiorvqhlrFxMM9kbKdhorbQs*Cg-5^?A|
z|5n0LUV&d<FH7b#PSV%@Ea^BK?g;k*u2ZGJsLl!YQUtlLmQgTz%N!s6D1)P}dx;K}
zfz}-bm(EaEqOVu){d)8rQOL45uUakXxvrgF+0>$n+~r<aj>~fn>{vU_4<(wwa!tRd
zxJ;3HfcJtaG1lmZom<k#{v+Av!>K&A3hJWh4oWqPtI@gh_lDH`*%K;^a!pB@<RX6L
zk1$L(G>CSH$!}6!23mnJ#c$ghG{1Phm}X+Us;y+_7&yJ~dgF=QtuN~?LXzPRbaPY3
z=+KQjx*Zn+UZo|_Y@B5sI_F<muR8iV6n?mLT>4rMOz6jv1kO12wuf50FoZ6j3Q~{N
zqt-F9AMnafZ~f?K9=-L7;HlJ;%7r_-qs(8LyW-F&n%rAtbE75Q6wvn0sxu5nSnpmZ
z$1iV1VK{_PpXAZVKVB%HZ!ZAc51-1|y?%5Ie)pZIk)y<8QgXje;9Ro{g`Sxb&A6$=
z*QVjE`s>{v=f<%|o&=rCBpV)^A?pMquA^_ikNYnQGMuBF#%C<qvQs$n>#8d%uE~+*
zBsD8$rqB6|3kN!F_fJ0kM3BRF_O&45`~GLoQFeXd9fJekM=vzOe$04<_saTBQs{{Y
zo^&_nrS8ih{}pO*f4*q`*!}64v5BW6@!)Yu-cq4+gYUQu(^PE$oBEmP-8c0SeNkN;
zn9f0b)gHlvqJE^ids4SgW-FU)UDnv2jc+*`^YrcC{d}@lD?@M+%1WvYMP-X60fy50
z;5tRZ6Xf9JtS)W*`K6UG|MQ5Ko0#9PPe&O#Y!?zkflB?r5a%Sn&rFwnOX}mN>NYqs
z)ub+mXlz}N=c*#u!x=z%fuQxS2mFsKAw*lH=ojD;$G6z2;Rl(HOu^M4zJ1{9Jm>JL
zvnR?#8vIcYN0%_hY8Swy06WYNTWGE*m<;QA+E7>0^}J6O%ba<R#v^5<8W9MKVot`u
z;RBSsU|du<xl1QWcqAbwBXtLq?3w+TL@4_wxIdFCaZ&y%>w97WCX%x};*GGc5&|T?
z2of*U9Zv+q-8go+i9&7!{R8%F2~9R{c#B3^G%ArjK7NN33b{lq$$l_F{(5aCBx$L4
zay-|u0TAmLXXg_40m4RVu1<Nqj!v-;2nVg_C)U`d)=+(5r38*Uwt;B6j|{w>uHH`2
zHWHLT_8p5MWW5t~6}L#$L%dhw=xfmFU)IncYciZ6E6WoM*F@kj1OtX3CoKmXt{c-S
zV+lVhBibb6wbhr=VAt3#PtpS>)6ezq?UvhfTUeRGz!P4(dyGnx>a10Gwv40=9oQHH
z?3{vZ{BBH+5hUJuc*Ov+jj*Sz53%b)S)RM8vEGjuS9jud!QNlXkA@R8tP#~=(%r+v
z8;+V?=xE~Hqa5hK23e%9trNAwA_R#Wy+6`Fh0>qGJJZ>`<CUYv*FJ^wQ4e%HiH5UB
z2{JvHy!4sm<pHwyVt&2`!I=la;kl6n9i_yl>o}ETk6k|E40J5#uTfs2INMraw>w}b
z-tCi`j9CD<nY)EoGlm5U1dexlj;~R2ZsTx5>CY#Z^Fs^h;bnj$UbA=5FAqwS-CX6^
zum?URBJ~=4b*Go?q%TWdVncj9LHKVv1ZG1E+9nykpiqF;pF~52_SnOIY=xV5GI&lh
zaBgRtR^d64(6<mrZV`#}*UDJcBB&i*Z*wBY=SY`+8aEE?N+I#8?d-tX@~H%dmx7<#
z;+<FeJ*7}sJwk<e24L@xC9aDRu~=`1H3~L6n>e8bw6RibQxdE(oew6ld$z8(aPUdL
zoISDScmcz8VGO*EwZoYbd_2B=#@}B_+KK(DRB(Cc%oh5jX%O4K#2Mp6F(N#_66Q*L
zn@J>*K%x#I2d8L&$Z=?^6fiS=?!#yO7}io6WZUUl$&TfZ_1G^)V0G`wLT=~)V_<1N
z*F`7EB^Nd`Y9vHOLa85nt9S<kQ`xuw0vyVa{PB$1P32fy=J6}y1fqP-uKVAg__3qj
zzfMf&MJ2n+)A*XGNi(g<K=y!H=K)*N1Fq=@d}LZeI$B85L~>e7mP}h-M_VaLTXkCd
zKADb|j*ecEj?uJ^8JVu7j;>9TuEVshGnt;dj-FSN-t%cae=_|59sQ6b{fKG(7&3zd
z9fOo4gN$i|>l`w}0v*GWB*Thn!zwbPS{<XtB%{`8qc>#6-8#noNyatPbfdydqdF$v
zp(YbaCW~K9W`#{B>P?mzO+M6{ew;S_I(<XeoC=#ACz+v(n6G=7e)cfIA~*d`X1=at
zK{8{GLvF@K{*Z&*go@l^NBAL~rzO{niKMP2&y1<SsRhl9rJ9J9Y_cVfh~>dF-M4xw
z!(=l|aw`*ZE9(X;rBgGThDT35t#wYVgvf0^)Enoa0;4^NzFA;IlLH@hFp$ITZs;0D
z`y09jY>%XC@*8gGntTyD4MzI}PrH~IyS!w(k_P)Sa=WBtyD<^_>14YX<PK@N4$U(T
z*PXhKX~~YOr*=rXC1%F{V#aCY)cKu=3l#Ra*3%&kiMb@(b$dGEG};lIAwhB%v_@w<
z3MW2MSBlxkG-tL9dd_T(j$DoIMW^ob4G#AyfZr^frA6)6MV`zyJdP2eOGj~LJhQd%
za<iFr6Q%G#nf0VXqAe*d_ftHry&fB+xS5H1>QH!VojuMt^Mr!EVp8mUQ(Q{Co=42s
zLLoot8VJT{3TO&SGJ57C45gdX`$^XT{H!~v)>3?00e)E)zVj(QBNV>V6n@JozBhCY
zBc>Y+ME#Slp+Co-f|Amo!xi&<IL=`-a6}lGBGV#(N(^6Qj_R5<6+txzXVgcC&LKq4
zVI<ygnpC9q63BIqU=RxsZ3>Xpr;|%XDCvjXPX$@&2RY2ai1guVV!>Le2tCSxX=nh4
zScs~3h@y9}8D(gYcUV|ckUJoZLqE*UJD}zqUN9G&r61@H4S9MFe{&wxt&cEiiU>%J
zN^6SD@s5<%51&p2`RIpNc}LgJg>H!XvZeZBHNntReGe%7KBV}~&r(^T_)kOq=PBaG
zQhe4$eP<iJI?p(wb?IcN66FmNmC_Pb=M(Q!C21KX>7^wZ%_o^rC0iOK+oUBs%qKfj
zrMMfUc+Dq?rX|GXQ(3`NLef$r=2K&+(h>~PQqt0{Gv?E#J5&7U*%23M74zv;PyNz#
zZ|EA+c^@xIV5UVPlCIgLNc;-P*vQRr5Qh)xVN_FPZy01-il-N)u}eM8J~qg)qskhB
z5V!$=OS4J-YgrrM%>L#~`T5-M^B_nru48i+O&;NCT0WOVb}IyL|APH+K3{U7K%Oeg
z9ZF}_nWwY>(uQCxo#iA!Ff#Lq{2=IVYZO!P+)jf`8Uuo1c;?7O0^YOY5k|~=xf!l4
z8UAn_V+htGLpp3mOygXfS5UepxZe;2!wnLjU|!}9AutAG1{#!GgRx#huw>FJhp3Z<
zpA|qmDrXIICdBbi){w*wJPZ~wrbl;OeTv!AL8ZNhjm?<nu#lUzP61iNuGS^-G|YoS
z%31-yc#CQr$y_3DAIk+=>R;R%Km|`L4&`Dw%GImy&nm?iYv&j0?$acOb=Xf_W=~Vs
zn=PhIT-YMrnwB)0+eo*j1Nh0XMpm2(d)=Xix-P3TceN#xh$hkZGJ)!fBAh0x)x4Tb
zf+{y16lh3CoqpriJXrwBwB|lv{OQ&}N=F!rEoffLwqzSzu}#5B-qEy&QDs?MWFg&}
zM@Y8@{PJnWja$>wigat5-Yim4w%)ik)F{o*TN;Tdk@QRlQ5%u+v-}&k2Bo<5!l8D(
z@ZhQ~ga&@y+uGuB*|xFR^YQ8H`3$Drdei$$y&mF)^7B-rXB1Xzoiz<_6j6XDkp6dG
zO~NR^_vXF?l6eV>d0*EY2q*`Fq>4u16~c^|RvonDErj<VZ9I!juNRBur7~LAupu4g
zX2!!g;=Kl~ROFo=1tRwEyoMKPlP3(ypv}1VI)I^&8rP-vjr5Afs|>V7+IHjGW{b|w
z3tN+1+{>%67!fQtsh92@Wc#f+_W(dYFx3<zO?zAUi<U703Cx}hn#2xZd~W%2=2Tqs
z@PW8T47s0PR)OmBw3)%UnmEmFYvM@W8?*Tt#furJ_^kZXS<Pm`mfQgJZ_^PbDM+wJ
zyUpx6O&8-6n7j{Vp}=IJKW{o}c_B)gf`txvuLDuFyl9zLNS9U5C<@B<T^OTVsQA7(
z>pNWANoI^vK5w$3BW^FWkj*$tJZ`dDX7VEFqQFDqhO2p!zJ{~1MnJz#V!BR|y*|RY
zhS|Q(Z2F!pdz~TsJs<rB+sb>P><!5uYv?N*%rc4c?Q5bk>l_PIR*S?yFSE`w2kVZd
zv+qktu12>V=iBT2-uY3o*)3Q44?}t`&)W+;WVVOqKc1y+yXujIu5HKBZ|i_-o&C1q
zraNgX1qs<(ah-j7t+tGMTW|b6=$PalH~as>)!1jx_xoiJ{n&pev)`L?@L~SodcyRe
z*Dq&J=AfSur2YN%;t!t@`hyLbqGOrERr-Z1Q=jYXPXw!<@=W%i9V>%6UQqDX8`IUe
zPU1@$D(tqM9I64G?_c_%$KtEU8{#LuUMH$=YVI>+YcXt<WPO!1+ciT56Zs#<%uvy%
zeR4Kiuvz_DLv`wEcI0(^3|&1NlO~TAc{J!@cT9IIz(AEPUAu919%q15Gd~0XE+>31
z`|~axR?})%X&c^LjeWoBzP^k}`!?dg`p*Aob~Sa80oY`=#j}pz!2qmmPp_4w19TCG
zf|L8Gq-+TdDqW2s1KUihSv_Gt=@x;4O5QCXu>!~~vq%ybN*I<ZP;~t^iA1#cSf76r
z3K#k|-xelRGMXjz{PG*t?b7i)g$Qct@Y`jRMfWl!e6fYgr^*ye#1q4Wxs<J-5O2jn
zL2gww!L~lR;CozhFHNB^G8_tKgIe2ZdaEnpmn#wO&`dQ4FIv;a=Q#KGuSBamC7rCr
zgd8bdO<Dt1<$}4WT+I7S>C9F#(%fbhwN*1@q9p2frz?$G{qS11ao>bHu+@<kW@d-P
z$d>q2mI<jWHoAZQG`T2xXRRxYVs^yn>76b75E7+e8VR?Zp=tE0PsaR@sdjEdH&?#5
z;_lVg(8NTyGkyKKzMLTHEZ*L7v41cbiDwQ&#aA|mW6+1LX?*g&CZl&Xe9~azLjzyK
z))Nr+9uL4*3`Np2et{OjgslBpA>_gA?}J(H+AxJO7V9LdTyV_352CaOnT42Wcr%6b
zKl6z9+nw5`6*Lu2Fps~>J7|@lE;GNt1U?CQs9W;{9U=Z|SU;6p0AX&Kv|+rHlx+Oz
zgSC-`uF9iiqgUr2(%BpASTpUzo5^j!xCRe1y{Q#GX57BKC^3Kb#jZrpZDuBkT0;ig
zt}tHxt{u!CW>9MAK~%GD{j4-0QqRz;Mb|J>W|N~dKmJ)tS(e<XT`4&7ZMpf&eC&$y
z+8It$sDjiJR@KoSZ2F3fc6-X2)|v3Est!4k%JP#u_Sk|X)9VPQhK0u&2af4S)Wnao
zUa(ivo4PU*H-W<T2%EX^o<DBcrS5rY<JyUX+7c0OSk=n8Uh%mN)54B8UGh`Qc-!|~
z^y)TLl6!%j6|BZZal)<<u6@+b!>;x#*xV$K4GX(_pK=dQ>JpL$a6ceqPNC&iWPe^H
zI3(13@6{mJh}8I7a73p2Fi+8bZN~tApQ6OGCyX;*wSHXu<NP7L?js^J=~a{WLO#@y
zYg~c4dg)@+Jm(+fjI2!y3ZIr43l2<1;+j^_5ie53p*Jp>RX8;+J{?mNmGeFR>bV5N
zG^GeM?z&=3^6{DxS@-`u;`W|~_wnP6`ez=VAG7`OFAMB2ul-V*1gFH~nr|oYCOpT_
z<Bi)ztD%qIE5V_D{<hB9T4H~9fWGGwc)FEAag<i7=&<*7^wsAUuKRq+f~2w&M^56V
z>>u--$B=YOg~;WnIUbg7`DbDqxFc7uWPXT!@N)ILM0;`n+12O%Dwz`p1G)B#?T=M&
zT9-PBKQ!fVTX~3W&yV?kan}UI+_`bC-R99c&v-*SaqTtO*R|*cZzoo{F2NDlK*p9k
zlpQl^8i6b)YuK8pT?<5x+9xC{n2T;*<j-7!@iS6RML<1By5%{YHu$mqc?WZ!2G=KO
z{*Uw~g%^<}wwk0dXcbK_!2_`HwaazFH=sU#w~A1G?&|_7B;9hm+%?MZD4%i_)GsC&
z7U@`tq+3G!rFI3R9w!zsT!WNn$6aFrk#q||nDY8pf!IjLLgoy?0foD6@rjj%w+>zn
zDA~IuWNxak@L|2x2zN_#7`9@&ANKZ+AM&_k5to^rkXEr<avkXgr$yM1@vd7+c$_tl
zKh`krN_+~E@(?iE88YW|Ps^d%63D?Cu_YHw8?G!C7TvmMXYZb|)WalPg*ED;%bBsv
zT_QeqA?8}{p0&WlCb5b&<{iG1v0qstjkBr#bk{xSTMxGMXRL8p18dHA?o#Ob#eFzZ
zxY1(VhB9Dl+Oa0)k-o5fKubLlX|J6^QeUccEqh54`S?j83z@YNG<-7gQoit(Q<*B!
z(+5d!>+-pM%NUOc;h;(su9N`|aw|7DNW+{4Tmu1en`=cIx)k4Y;#9X!pOSuvf}GQa
zsyhP)0NNm|Xn+pDAuLw)i3dQl*ZN*oxUQ#MeWiD%y-wA_^o!ua3IJpmssPb>^=dlF
zMy<lEvw7zA%)|@bq(SQUZ>QTty1|RN6{hH_Z`*%(yc)vgwwhMfZ?YGzF<ssf`>{4R
zbjPzSk>`aR57&awqnYZ^tO`98LX-e~Sh=a%3l$ZIg{1|O`i9>3_VR9XBP}9TZ)`D4
z92OT<@9H)VFS9r&wDznbSeo3>u}o?WuLHY@!Byk+n{F96rgvl-TTv2u<w`U3ah`af
z5CI^l<S^qecfYi*zo??^=Q8_{b_U+|c!9~jHvRGx&>l1LnQ_Nq6&OPF2BUb{4{y?J
z548i$+oh5lv}B(8UbmC>&aD6;+9u2x<}T1qIVQEL4rU};H#mDMSQ6J#&9A9fk3=Ah
z;Ng2$Z*u_ZIY)$Dr4q2;dtfC)AQrl%i``~EsCw$?!rZaR8pGVbSo#X;=d&q^oi<>M
zkrh{4$=f)Y+~A4#DYcAxkv0H0Wd3L)xfR!@*0*`2K7AMPDbfZdQM|*uT?oC;6#xhY
zv*0%gWgVPviE*V{y35oRFsE-TUaLNf1bf#N#nA4kI9wV=wbzw=P1{k6ka&>wqpoa%
zYFD#jL8VBhzM?s8S7%5<<%M7Ui#)15gFWh;r1tu%v-CX^92!XdkNO&SBrMJKJomLs
zL#=B1zO^ciaIarOy|d(jqh-ay>?hA#1uqU<WP=u0cpHOzqaIHPFD~szvo*cLb1sN&
zT|Sxl60s5Gj5^Y~@=bT6^%(Ckd%txR$hYwZE&8zJW$PL)-&Q9{_90x<=l%F|u^u#D
z*KmhS5Arw2(`!G9HG8o^A0s-T812Te(z?kV^L9`R-(5GZ?ZbP&r^C+CC28-B7e)G;
z#{>$Gv+lQkl;vx2Lhzng`ww4l->WL<jmP&WW`~QYRXwA&L_xi!;Jc@sCUIJce+m!`
zzHQ8RrBNwYQC%S&Y~mU;zlxuTK4^aMgaACb-o9H_^7@kx0j*_a&{@Y`Ar=0F#VW!5
za%L>QBk|^`6(WMCro!PziH(DZc#4bR;~}n3r9L09_|Vww{Z8yVB|x#87jIRujtiZo
zUBxy|r=I(L)pdV;P>V>J8(KLI^a>?!@_s(Ks&Uks@>){&^Yb6Q4=;wD+mCYyzHh7g
zUrtrEf31r7zVG0Fwe-3D><z(>!wCOxn|yCB#t8gWBR5rHd_O)d=LMHFTK_nydh`8r
z%=NcD|Lbp`-&|i4z);v>Xv)a{f3`5pP#9Jz3}*m_w+%BDK(ilz`bi0%{1N-81V~j1
zrx}3LZNsTSEDB%*vohkAEyDB&&QXfsI)^jbBKW)!2K@*j<pA1k1b=8iCR2d$KmezA
zfH)|CeJ()WHh>i+P@Fwbp)`=%78PucD(e!+nu=zchpJi{sCFKxsgKYCq3R3-*ymzI
zz@CvQ2bZjq{dgrr@R2Oo)x|-d^7B@(bCX+<Yp}@|=fhcE7Xcx|S!!=vKJ5U6HG3$Q
zAdNpe`EzB*=S(3rL?O>mLcp+KP6448nxS!_M4=!WKie?*1dlXtj^I?{RI$(kWpH|F
z2s||uStgel2n}z#rueKI_KY#S+#)<AG`vO=NjpYV#YIrpL==J|0h19eb73fx&&vmh
zCB%XeK-2+B^2%-MZuYP@$`LtDVZ;IvO}0@z10h{aQSJJXo$S#osUhzuqx-hWMpKF2
zg24Th6#D}atEs^s=R&@KqL<mhlc7;l+hHGUiRQ(kQ4C^!coPBUqjypxd%R*t*vSv)
zVsiCkzYS1d4uqYHfhTQa7nEbKlw(kL;wqqVRL!xw%0&2K(YVdTtQWCy?C~UaF@nr-
zD3cL9&GG#6aSUMzrSLd`r|~Rh_?+_zoG6LHRB@szi6VA!7!M+Dm&KiSC5mGuX$T}p
zaezPB63J6tCsM+blnml91(WU=fYZ;BxC^c&Rg%phsj5m6+QTH0nj`}QBIm)RM?3K!
zlvAkZ$yLI@-l-|JJ1G)&QC?IuP8=yN97I7Xi3qHCcyqGFQx5Z;q?oc4f0eZRoheZU
z;7_5cF3o9NWvL$XDKV)24>wo}4AM$e$b7`pR41Q1)kIc?#b$-2q;e$0b8wKbr<ayx
zJg`WQpG>bBWO-2*doMp-V=|*PER!K9qy6c#xGx#`Wf+A9>4QkRC5$8xGgIwV=FI=4
zTmGkX%k}>c=oYGq8k(URy1g0(oL7uoub5R|-Ew%v7V(Os;uY7>E1tbqd^oiNT(v@~
zwZaayq7k*?6}6H>wbFaFvN&~6t~z<uIz@*%rHDF}iaOPyI<>vJ`#ANQT=iP2^*Rng
z^+>kcprYPrsNQ6+-VCR~f~&z&wZYn<!6u@?uA;$VsKIHk!5OE~6<Om{ZS-(x^onSF
zTG9A?sL^+?(I2M?&eas4+7#r_6cW)CR?!qO)D*SX6ob<o$JLym+MMLjoD$KTR?(a>
z)SR`~oP*Pn$JJ7x+EV1uQWDWpR?$*1)Z$5v49U3wVgUiy$ow1Rf({%<4MFZfn3$L#
z5H1c5J^>*S0X{Jy0T~G~6*(CN1r-e?1w9QF9X*(lo>q<l^A-~W$1P?a4pweXPC*_{
z5dmJo+hUT!g0d1KlG1YWG7^@utO*JPs)~?QCBg@H6;tk#DXVJgs;lrlh%tPirlDo<
zJ5Ez+$ns~O=HJ0-?%8J|eVSiz8cpY%|A9|);4kzJrW6JD)<y`w3%K|HWt?X9Cr<Ob
zOtV%3OE2yCRi-HmJT8AWSdlze5f$^|S^A5S;up>BFZ18O3@@na-K>d9eue0MRs6e5
z(^p^i-{LgC$uxPTZ&It?EVOiv?{*edbY)I;)t`0e?e>({^c8gWy_@fA-upi)(<}{7
zE$=Tcub(duO|HB>S)G_(8@X5;{klH2uyMSw`EGUd^T!WcS083pw&vb%9c*uHoo+2&
zZOxr+uYA}!`nI$Des}q7cm2cu`uYCG|CMRf+nSCx1`@c;M%$W?KaLlu=BU4J`MNh(
z>##cdy7lbyT6e@X!~OQQi{tHg6=q}YudmKpXD`z4ziIz|b+W#<I`)R8oD_h;z6Jwg
ziz)hpSWCf*PNdsw0f5okwLnr`v2hB*M`F2w<euAkew3*C^2A7)CZC*@6)sOK^%t3@
z;6|pgBsTm*rXfelG>V{g76PfM-(?#0bt@9NscLHyGoOh&M94n6t+d_|W#&Nb{GF|g
zrl^`n!Mwl9G-^Z|r#o`kf;TdaVBs24rdjw~nFfdR51B><gp_Hl3i**T&0*|6$TV_=
zH!@A(cp%ghl-g6t<Qv~bfi-RUQ>J-DT!KA?Patyn9<B0Kbl?~%=KFH4s&?{C92j!W
zXAvPYRRp)3+wU?B2cZ!mrziNQOw;wNOcMqEMWzY+O{R$q7mJ%CdLetH{kJlW3XRXc
z9AW!qyW>xphL8y<)2QM}-N-bhwgJlE=>ghW$R+nu4P^QcnMU+RrcoDoCA;v4Of&a4
zGL0G|m=pCD;~M3UpE8YF;kX>k@LbCQ`=4c+hQE<%iormpAzT)G_(X6v>dHAT){RUP
zkNEIo`xlwU9Pb>+)FONRePvq|mFW+eCL5LD51B@ATT6{tt@7CHH<^aFN3@;ham9O%
zxti$ZWXvI?OjG<9nI<18(`5f9)0DE`iMS&gi-8Wp{6(e_rT<l?@kYut>%Yk~1U$dV
zG&X<8G%1MRWtuuLn4PfDiHwx6h1yLT0g8EceT*sdsPkXSG&n@6@poR9e~gihatzl2
zj$<m$^7~8uBGX*N)*_Ud2@_R2rEbraVirRfyuO*OQQyck_;`PoX;lA7rU6sk$Ta29
zKg%=^Gy)7~kTOljuQClE`foB#EE9UrI~tn79&ViCe<{;sbkEnJ{41G89Vye?`x}`?
z5WOxV0A~LWGR>XBHOS^YC?6(q(=yg^Y){>mKXynh>o#-2@Fa%sRvcG5U9>sHhjiMM
z_1mtFf5<e0zsNL!fQHCRxd3La71~?B$~3l6;$4eMw4IInC*S1mY-sk`T*|9Y3l#=B
zeniSNRlmwKEL6YAG$}u28o@uwH1hwZOmhTPm-<bnx%(HHhVw?IN&Z8odHhqR@g7IY
zH0A#w)7btl(|Ee1$zN*b=Bp4w)NB)F<TjD*VqMPR5|w&Nt@=H5>fmbw3eLba#4j=p
z83RWD?=p?i;qNky$-j_k*eD|5^5iF6(icdX=IB?MX6JXA22}u^o-_~3T})^D)5n+_
znZ{|3?#?ch19863Txg3%<L*%t;4(cx!8;(OafgtJW^)j`6O*uvtCyXi=Pi1t;9#2%
zq2!MIFl9nbdc9DH9Fgrc_VGXuX&*S+x#=lHEjL3QEGf<LJ&}#txHh-q_7I91^l1(_
zfV>ZelxZw~lWABE@8LXaACzhm-d6uunuK~OC%FI+M-l!fnT8PmMy6^0lS~tYD~6P5
zd|jF_k5I@KD{oc!A{*YW3g__O2h^6R9TY%XA(Jl~8XA`qo|0}XuHkzL#10&|Wn3+7
zt2egHj(qZLy;?r>)Rhf4Ch{F$1Zzh(wxcfuvzoEo-OC@Koy5_Mw<G1*8)&?<<rMe)
z^VABVEU23U^(gf7)qBnPKgl%8*uTm&hBq=zx`svoY4=Mks+8D|Vqig<Ct<|!3YcT`
zQ8vv78qW>1;al%<B<tXj^lSrykuRlu!N1Bh_rm?=Iv*+<Wr@tJ*OG=7;5l_5=TuKP
zD^zQ8eYZs+(CF-UbO=-gS>(xC$;5gfWg4l!m1%_kkZB4JbLooLA~@LJ;tSr$Gy*?m
z8ZD$u69oBPrg@5#X>xC58V{1u;9q1KNB~Z;#%&&2c6zBBnI;dNqVBIUP53{^G>7KD
z$ux5uQ%IR+?JqJ-3{s}C?MBKpUJs;_k5FcT)7`p1G=9o7mOo{hpkHMgj#!Di?=Tiz
z<ZOG%{LsK=9Xj&?XrZvbk!eELP)mQxG;)8HX;M(PnSoM&k!e)MF}|;%s{E5oBlMri
zG(O`@+ws!dmXc#g0%B5rQ(M}&1i_)D*L=MJ{mzf${+mo=`QOSk`Ts(u>H8_uF#aaf
zr2Ld=#Lz$eF4MsNQKr%OlT6c(>GKzvhC?H4z%6>`95U>tm31EW?&FP2!|_*{<~I8F
z0H!Dlkf_<Z$vch}%4+Gtb;<u6h!TlD;J)$BfKXAjP6&q={8OgU_)VtKx{+xFVQ4<r
z8g6Yun1r=a{K;hBVQ7M|Uu7COFq(T0W}yb!Fyh~mX*jCysy`s$)c_*fL@>)Zf8@q)
z%!Zq5aV3WQlxfC+ifb;ERH=+mXTvp|bAFSoNsOUfg2!QmQhHvA2<(DdM~qHId(Edw
z!d&z6tWrN^8m)g{rV02vnFjGUGL6(YPz(0|qD&+An@p3A>i-v+rgWTXS%paI-;`+>
zf$|bWs`eBn&xjNI3uo60^;(J@7mDvwi-FUrAStMFdPL@iUOwX(ik4z&{21>1Tv6cL
zhG4t}q)c;&zI}|R7s3&A{jAg~kl@cUjiEVwZ_ShLm_JQ|OQ<f=xQHO`5WQN-v)$a&
zHl6nILitP1B7bw4EDLXP*AmHIv``luUUO%~L-clyf0k+FkTQ+oZ!*m|&`5})?k-W>
zIB>ceCyEJJM?%2+n@poseb@3ok!cG5Nv1hOADIUZW7iNH;qtn0S^fty%`{N#s?cgJ
z{}Q_hDbskuY6X!p&E?<AG^P9kq5q~#6ZZEq4ae^?4L16XOvC>tnWhizE9_U9hWCG2
zrYS<oG%$>gLv$+u#HqT?^Di=u6#(7yzmRF<{!ymkMandi|5KU99+UemS`<>I0i#_n
z+{iR4u^~MFTV<Lk$iE@eO#GB-x_*;sF43j_Nv07-$}}SAyoCRiOvC$|OymD|GEEfh
z51EGdpJbW<Y$txq%N^qH)p|;uL!DB??T*8wmcs+M!+=-AG!{9;ngkZRgOdVn=HFfy
z(l%K+_Hp{)2x{EOG(||6#_%_p2K+yfX>7+a?o)%Fer?l0ps9iTH4G(Md??PV!||^L
z$_OkbJO$p7TD+r(Vuf9?Pj(b@NDXOHPd!+`yW@+$0Gay1ji&~w<6ovYICL!*n3m4c
zRX4;_f6pTKqAM^X-$;7=W304*@ARV)TCMTP%k(L;?~{#Z6vy&pOuK}Jv?Q)3WC!B2
zHh8pMB;a3Vn)H8`X{7#bnTF^8tV{#`Ri+93S2B$~W`jPiB|k>%Wa(FFl8x8IAEb#q
zZ9M;wX}<m;(^z)=TQZGe^>ZzLldf{%$eoIgh03vKI;CJdAIA#m9~FO=X?XulnMU;A
zkZBnILz%`l7d>P2HvOhYfIZAuUIulW0GJ9i>+lrO+Iob~@K>2e_|GzpC1wrcKapvy
zG2!EHDi?_-vWaan8qoeE(->A85kKJa5#}0lN%GXFH<I70|3q)OrutAh7}K?r=f9R|
zCNRu?$~1!i+hm#vpk+1wTeSGDP(ng8E+O_5vs`pyL{wXV<bdB%a`!*WG-lw$PJ6!N
z=aP44-u#nHBM7!qtA2wz0p|HfnZ|HD`_dG~!@|L9a3j+Q{*-BiVUnKXf01b({FG_5
z&^-Sn(}?|dGL6>%Os4VtS29hDILCs|yW(C3PDZ(Zlxfnlk_D_s3k}|Fsbz|LeA=9U
z_wjx%GzkBe;S`gMnaqDB)A$~V3-8a@*i65)UYt2FYI6NBT4Xf)$)xS+*H0f7XFr>D
zsLiTjWqP?-^n{V|JzAPOvJ4|-Y&8*||6)CyChWXLOJZ+Rl>?1oHCZ^>Y2xrck4WtD
z2uI2^CE#nvUt}6}q)elW{hLf9OJAke=tuY5^I);rq@V0%60)2;Xu_9s@J;w+w#lr3
z)eISbQ}uG}d)kdm!}@VxI9PW{IL%${QBFoQeg2->qpJ<t18t+K*Jq{?&h4|iG-I+M
z0Mb~<2YjCq>GREkF&U8L$)P-<^@Go}#HzQC6iBsh*T^>E)9|8`Stbf7k}tbWNKo2L
zY4%aepByQH{b^m5nDl_WFW<UwyA2XQx8fSC47Q3_W(%nMa+h0W1O6{%8cxYyWttkS
zu2N=)3Xb=+?sufVZkCV9qKqV{Un{`nZUyoEH!@9z{7ahJbhI}Q?z3!6krU`3rw*(7
z=x7^Tw-o(*GL76XGEFYWp&gTv8-d*Eq(i6Nak=|MRKp987xpQWPlk9XlBgGck!fsj
z{lovIOk?+lOjGnXGL3F1U*LF%o`MLp_k&{s^M=*k!L>ihGz|3rW0^*M-LdL;W|7bC
zKb2`*=(kcgc3!XdQQm6PD&g9nuoN|xEe~TUNPJ^G>+7|`?97zFs=(_;E-1*6@3onr
zw^F|vU>5Jak&==Xa?jXbmDUbbMLi?_L?t}L=-ZAGgAcnQ8@)_<;}0&oA3x;JLo0YP
zLWV547st+zXZ`(+bP9~_V64aZqp{=`Z*@1&p;yCH7Xuf)$6LMz-6A&ZfXfDUNXOSP
z8+$+RyA~|e4D<s&B-x2T$}}5o=)cM|sYsco?-!Yd_7|Dv;!iToMb0lW4f0ddHsm&;
zK(P3EK7!&TMCQF_6x$t5+A7L!N}maQ-??>ipH#VleRE7#ml1q0krEA)0H%z>dz_pO
zB^uMCAR8aJ{@vSm=bEe(?g}5$!b?rUL>L+9I|yROcJFYJix-i-w;>5<nc&7y2xbKx
z#U<KrvZjy@y5A#KOisMdDy>pXRt)j=!F?-9ogbrjn1><Oq(~$qpy;%{K@Km4;%R6C
zc_JCnJ<k<z+Ffv{3c-YmsR)W7jY#XdJkTH<m7woBmx0koE{TIs4#$N*D5J)W{gvH1
z$7~|_lInr*_;{iCbz#(lrdnmJeCl^I9AghUNpd9f*~az<13W)z-FdT)vfDG5;I5y?
z*iI-%V+BU@xwoE7KGi1}XpZUpvH(OuCP#GAnIW(S!#slYvRSRgu#z$pt0{L;+K&^+
z9Oh!ll|rR%$0JzQa`DpiKS2G78!oXDbGUKoHPJYy?yIAe2_X8u{pe`Q<xNr<*C^N4
zoYJm=PM0@m72SXO1)oc5ofc<DiRS!JfoiHdS*sF*VWB#V;}Al7A*Vp&or`A?F3&=l
z(XWzGjXMK=AHXl{z+w-MCgo;EuOdW%p6}{hXIpK?8ZA$-5>w?WJkYHzdi9YTm8D}O
zm^|tD$PpXDwLpRn(v5u`CIdmi<iZW8G(7L&_6DQLl)8maQg&B8OIs9C4#1R)eTc_?
zH?}>Wv^s6ATLMhoFZNa#J#_kxrRb6V%odBd5*g1JYsA9+Y|q-R4PI{~U2_;e+jc|O
z)H;v|WXd<-*!57x4wi}>KA@3uf#O9Qpe=wHvBs1U4(#5>{=?nq)9eVGI;4VXTYv=^
zb!I7SjV9IB3uJ!!SslB<l#rw>fswT)`i}8KQq{_C;in;#wE0ndwie`;gi45v9iBE3
z3ld>{OoBT8Aj}O*dVr9!!a>B6$dl_MnhcPcY~LZ@Oy~yrx=~F?R?<W6e&rm4tuM*V
zxbKs7sF)f6=nAJrvDUU|M8dHs1m+Ku!#fOy6)z4`iVShUNX16`mL}ylpBu$y%;H9|
z$-7Z(#{9M?IVja0-Y7N_+ksiLG+W}L3Iwy}Dl7};Ap+w9@0`kNi_Xd-k@@ea&v+kT
z@Dc);kctgO>WyMkEGo62AbF$MC<NkgLr_gn<$&4ffku1mv(xW8K%+HC#RiO9OwLoR
z^ny630m$&YO~mM~nv;8YH!4BtiH6z<Oh03rw1HKtR_k_@@PYZ97N_Tnb`*fg(7^JT
z{V8@1ijy+TsP=m1Qv);=8j29zT0~v7LT314lX@`W2AF>pCzS>%C4-jP482~do<tg7
zNsK#tqjB{>^L-PPsZu)>*ilU$Cs`sC-oq4-ip}2B9Lo=EG0ow-CJ~~c-)P?*%2R?(
znM^YC@Za)lGIbqdKoYiBE}}Kxjxk1-<^+&Elj$81IKuEAYugglYh+;OM-YW{0LW~_
z9$;m=_$xnbcey{@wfMN_x#YUS!WuG>*aZOak*D=_h5&9K;zpIUD$t2)(&fL{mCIqq
z2G|0CfWu&DBr-^avJ(Vzi53Ez1F+dOnE-%eLgO{s9{mmgAt4NwpuBRc934=smQSSL
z@sS8{jS2v`Ag{wil$ceNu=2wz6jJah(!)WgCp>otFaiP9kdK&o`9Is?Fj0Ybt>BcI
z-KbpE000IdidpT-*J?IRHhg{<64?P7HS_@peZ3k*BR}ESATrMgC|kQ_sk?xH0SV$7
zIEqWNdsF?OYM^^+ARb7TcwWrIQj~ZC9Z(IgKm)wq0|L&avXGJu7=alIU;-l+6Qm}&
zh(L!($p+nrL>7dUY?_c~6gSTmM`#O6cpf}-EdEw9$h2CPYD(zVjbzh7b|cv|ASD}o
zmbd|&fE5~KLQ^vdRVT4jr`=xrXPh@*HULCY(o}^|nkjMM8o+F?@w!|h1a}R9LR#L)
z)#MHfxUOjBija4gkjq9=Hu`XqK^T&<!MBC=Y>44Vg&<9dTZclUk|8&eO^pO`7=rA!
z3}C#Lj$eV{1R!fELp$8;uHT51Y}mwLGE#9X5fXaGP(q|+GY40cYEcB%VX(vKz>;MV
zoxOW)2h0jKTts{<M287bGo)mr9H{<H0ic0gA$NfYl<{ug^zO%6=sHdEJs^lZOYR1V
z1o1@&i5(J7!5{^}<SQXD0S$z<{e+M@LP`bFJO#2F$)@*tB*Gnpj?_N9XyMMW(wb73
z_}&0lTL9s`xM$39<dv^Q*@;H?q_a2r_n0xRfj}4$VRM-fkrWzg%sprYO`m%%fIqRL
zY(vT4Q3+-YSKSx=7KYsRX}!855rzrR!xp3Da>B)ZoH+R1Kr~H=2s;%<vJOK7$2}eg
ze9nOMG86SN$B6;}#X>}E0D#F9R7{FURVt2-A8?BjCie~lP>LWOgc@`!0|<jD4F(q6
zQEL(*7UvzMxNirK#hg;xNWVepu;7&}L`?bsVu9E3ONz3Ds;_RxQHs5FKZMi`i5=mf
z<lJUUM|w84sPsQQ8^=Wzz;O2fun;A-gV>-)YA@))Nq{~}FjBSf&4kd52bIw({`73>
zZ8QM*H=a%Hjc3yYyVlYORuGe55(CWn4BWk~Uhe~4B^e>Q0c|j32}kI>0Vd|HxBvi!
z@et;AkXAJe1Jd@f63rx4=Ek#W0_Z9SVvbAS(?ES0Ax9hr5H`L~#WA|^<c{L=H=R-;
zQ9h&FnWIS02Hywi*}yI$O59<c-QR|l(uYOU(3HZ$En<PAn<`^Z#_1&5_X_TIpaIau
znwfzxR0v$gM+UGx<Z&#$DTPiN1zW@k0v*0a+19Ww6-HuCgF_R<7BVK^Ft*SDKz0<1
z6X|VcqAA?FU?2>z1}k_T+>Qo7^R82;Y~OlUtKOlxOVXl130UQ7r)<_-6;g00tw;3^
zc-RKGP5{F8&>pPPOu7?>?9jmY&E>B%VN_G&nA5UuL<s50U}yHwr*pu7_gHe~!8ix^
zq?ZfHC;@DtBRC3eKRp{Iq-Udo^lZ!}iHR^`ke*G`TS^X;Wu#|QJ%#jaG)**aJR9>M
zU8H9No1#3@MtU~diE$c8&t^bJc>sp0Kdl(W2pajtvk9`~4CNzCncl(T@}5!n5Rpwg
zV{;Mw2@O_|Ky<QDZrA~&0e3eDDFFrm+;zItoHN|(aF$$<cCMhmGOB-S00fEIj0f0#
zkFZyqwXq1g7Zpdc$jQVHBMN=pu!kYBrtNo2SB5Ut3!TEhV>later+_M_hxQ3hzHC!
zG^eznAFamd;hW$LD)xW?<HG~*oFo1ETM<PwxZmg0-V3Fgu%u<pqhlK=K!JI-HOU7!
zk@fSuRDl@Y$N^A+*Z__RUcg^w{HSUebSs`1rcO<)U>Ni^&j~QGPb`}XLmlsT4n^RW
zw&(5#AtSDFs!<*u25{<+x_bw3LZ;)i0R-pTxz@y));xlH1}QHVQJx_&8`u`J0uVXy
zu=l!=@_qk_*=!&&8;yG;VE~CD<SQSn<OKo^u!O6hKu8Iju&gswZ6`fY>u`eMn`;dv
zblhMz=0+qFZL9L??I!W9NX#a7Cb`KZYwq^z<%sK?tmRubnhlgBO{QBq1jdv5mTU&8
z*$nW+B`xN?^)+PS(Gv_qVT_W#cW&h03%o-EcSB+}?BYX4P+LjBEE2N;AW->X?&zi>
z@Wk)-D9&+V;xMet?U0duleY8a$gE&GV`T3$ic@L3Yd278TF6=-1>_CG;x}BsWlG1r
zM0_;oJ|0YFi)@hw*x&?Uc?S^d!?468EY@J?`pD;kHi4K0Hn^Dpnf;#&vobP`K7nDv
zU|8N$rY<X{+v{JmU|6}ZQX@DPOq?whaHj%+sR6?c)ggTvfHl`c=pBF#=&=K>qaVWN
zDiK)TfWGNkLr?=|tjW~UQf~q5nj{)fzA=CXXeWlM$={CKUxM@0wxN{Pt;?_S%UFPv
zJKe!Z%0}sYI&OguudoT-6<nMOqF(L|3)nDweYhH=RzEVdWOuHyihPX;MVYyh?nvkd
z$q;Su#HDAgq3OfUBtyu|Cs#=xIB5j0KVL!t51DEJ2%TQzY)kVa9XSmM^<&u%2g`#(
zz!)Cv;Y)OU^JNqlh!*Y=j;E=0=nZ3IL~ix6P_u&zFjOyP@faqz*NRFgJ@g{z%m^@J
zy(P#Sr%L~NMreW5z?vy&<tzf`gok8o03?SbrZb~jhYyB+GB)m?RFRC$8J(5fV|^|=
zOql^zMOM&D1Kn!`BuK<I;4m%d;T(_$9K>&5Akq<X-xeVTx4m6%Tk9PZo~`kVV-x2Y
zVY17wvZbf}6770FQ1u6dZyEmouy+?;aYk#J=&NuFtHRxbI|L6<Sb*T3kRSmPG!WbZ
zRk*vmdyp6sq;OAg3y{JgKyW9isdV?uojdn*-_xg0PmlE9@U8W&{qFrf&kuM6+iwFn
zN`_$qHdiTZLFq|2)POhS5gKNjB)Q>z=OLsG=9*jpCC!fq(_zqY+i)>}#jB^J+-=lX
z;iBW(tZFYXkpSZHHOYG~Ud)Dzzd(>5gf+|I3X0D^6P4e3^cA?%jysMv>^?FaVfKGi
z8R73dGV9gXdP#~OCT?umdOyj`P@j}0)Y2RdGqmkifklME#8m-DwoeDV*6oE5?wJlk
zDm&EN8@=O0(ahx$lo8yS7~xOC8<B9G${k+?Ocd1>hTIiKPWJ(~B!eM!$ohCV@^>h=
zU8qk(jaCDuIXAv=rp!NTHmeR8d1G~1swN~tTi5^$M+Kd;u+G3OfE{CB5l51)z)Fc+
z#H%o?uSNhmg*Ky=FNQV2S0hW8G8)_M8t7I_yrUltIF3cC08;L~0}pfZMwqQYl2N#3
z$cr!)j|USeIz~3i`){X!T%8^<8fdYJJm37a*9s6Y>TbDD@Wq-vJ!!zm^tsS*VCqNw
zc^C#B=GTko{VJR0J{_1l*5p!(!NvzH`gT(Q9IE$t^B3tELj0Y=ysFn&$f!`(O1Rn;
zvvW2ET5Mr&U{j6^O&E4_z6uq_3q_HS2Wt&Fr%2)oBR}L^kvAjZUWvOI_f9m#UJjQy
z;xUH<0bhWF00)kwgL@A697%er8UtcULOuY50pPjmCV4mva1=7j+l3biqw_H5jPEcd
zbi|O4uu#>qcHF`aGJhU$MCD}d&oMkC)A=X?uy8+Vr3Q1q4~v)@_C!Wg9uI)0_M`Cb
z@G=Bu@>PRku7%X69c{Q!Ky9Z4+QnClops@4m;2SJox^C!CK5QYcS?qD;{EBA%<2H4
z8^$?r5ozj{dV?`z7or2;K-bIqP+?@<U??LZ$id~}3ZXhz7!o&b{sZ1`E*r@!d39v)
z#l26n=hMuuDMEC2(ToiWbP~Z&QejC$Dfi>2)f=1_{h_M_Axzuu@?Qb}fY^kuvU!xq
znI}--<}mhc8(^q?fB46+;p)7l(*+)SpbZ-~tlsLoGhO*(?6b)OW!t0_L)@1yNQbmf
z-4WVcFzms7^GGM{3QzX7^D1%cBL?_(&L^W!PXz<TUgK#{9AZ6~!by+^G(U(i{Ctf)
zw(oBDV38f-EEy_(;q=_6Q@e6Wx%vKUpOAt0B|xO7s|zU`6VWx#rD#m#y(aG-hhUxY
zaKcAGxp9nFHy>2Tas0o=>12j1{dNn|0e&e6nN7S?K*sHupNcm{IX{kgbxj!@iN$gR
zvdF~X@C!>=EJ3-_P~GdkQaK1ij}Rn2UoaZ>9~_>ZGRhhLZkME7Io%uCHG|=ef7b6n
z0!(2q$l4`LH?a$0m%JSnf`E_WJLG~e3>b{Sat&(vbR<RJf)Rk12vE}vzx0P;96gwk
ziFgtM14{xnu<!@~w3?QlKc8};jiCG-0J19*A9F>h77t4yj~XEKnmTa@0U)5kp|31E
zR=@-Rh|m0#CY5loNQiHMLd?Mt?ix6n)Ja8v;All$BGbY+mP8=ESFEh%0W^eELJoZ#
z=-NdyHnjAWZthsPnA$XG#s*nA{=s4Ho%7xW|5CHtc869{H`7X+-{r}{-lZTC5sXVF
z5R3ArE^<62ynTN<q#Z*mAor#kUZP6y##(=Ruy_5KGw4b`_V@JG6uoj1_%%mfx0qvq
zyM8lLG(z~h`}4Y0%GhevKa9=7#J5t3la1dUE#vRLFfsA_e2Y6qgLfDEi+{4jUj>$r
z)&^1pEq*UxC9<2CuB#IQA`F0v9*UOY!!W??7bvTJ`YIkaOsxCKnrYz*Q0i?1sjh<1
z84d<!t@k(`2<CwRZQHoQfaJ153S77kEN7LsL#<{puJ~Pb`H9qg6gY96@kluc)pZpp
z2p?F(ftciAIMn`G>VzsImMfaEQL99t8Jm<9ApIZ4M!G5j01>-xdd^C8hLQweXuaDU
z$F|FpglT~kidTWac`>*M>4A4*Oi1k28V%u0u>wFN^OCa=4&uppwnF2_RqUrbmBZkE
zRh%I2%&b4k--PVJ<W9nyP_-^vy-#aixf(V|-4W@PAz!)6rp%snHQrC1WK%)s5{bqt
zOMMw4xaw~-i{j*e1+0E;XruM#dp8s;!S#Mj+ALrEV?!{d*`g*dqnK9Zd7MDSXbUss
zYw100ej`xXBmU`&=XGXN)9)x-*SUL!b600hUa5SvyO;X0yX~Bi_v+Kk2nK+wq5Jcq
zNAe)|nvgOfhX?ubtQb%xAfAby9`OA=ga2LQlQ0e$k)eQgHXOIg4=AgL4}RD7L@;<|
zMh{a*UL{A#S7t_M$mQM`5c2pezk4VDU>)1zi$OC&iAWt;!tgc{bQ}g&{i+{QagTSd
zpW_KKL`^o*iS)y)ZO)qu^O4{-@o&z!i(0&{{5zrFJiqa0h|ppxc$>LK-~!c&R~|^N
zIz`2buPwuiLEbvsX*FJ_OKT${S~f)J;^`l3j%!2s+a#=cF>=!N4pf2CKNuYiKu@hS
zkq>_~&OIPvZ*BhQ=aU)g*0|sP{*C1BBL3>t;B!980E>eoI381+LdUb|!AJ5B&SwZ-
zv>q-vqA0}-oKU|mmqX-#?;^}xOz8wZ0G-~Ag55gIPr-)_Z<py&BtZ+^%L($RE^8e*
z045g#NQ$0uY$C63a5EoYIobGGhGWE)(J9V%%iJI$B<CaA93p$ff?N6|d|YGjlEJSH
z)VlbHD;1k;9m51{j0r5blv+nwu?@JaEcX>Yx!9~pwPoWDyV_Mcg4gi<j^f2$!6Oye
zV;H`Y5i-d&M&bOvN7iQ-0e-LcZo%n!xH*05_YSW9meAL+FKP#w^kJg>C-?9t0kh;s
zjl9ZL!LOZ`;^n}nSpER?Mc;fcb-87PkEtFLjdG|sSU60uuv^SoAw+U^^`U+&oTSfm
zfLg5x+ajPV0zUCjUao@b4Wf&(_-;hHG%1vwyol(#sVXz7!!^d&Zk@t8Q;{yc=$%v~
zrr_QYHdDuV_>jsmLGEWZ5ds4xk=({C_pUtAlE)A`4TD%M1uK!$NgNiNVCh-mbn2BP
zE!i&#f~A&PRac2oI(SwzS#}|mi;2NfOV7#N5$G0`ajcOc1AR$LB9f=NA>4^XLZ2Ei
z6blN+!vv;%V8__3$%(<jABylJ!NK4cELbw=8xSqieohf9O(wn`CUCnZbEr_**dQ~h
zB-gH_^<swad|Av)o4rbJgu%-n9u<PMR-g+BZ7WEO$*5$pX535y_h=E0N^_WaIg)@;
zlZEVNDVDNyl|W3>3Zzx}a5GyMld(ZHUklMiMcar{-9Rc47IJNyZwX`1YOaz+RsxwM
zdm^}z2;zWWy|TT+VP@=BG;S(N1cOIW@3o;gx;|l)FOsH*w#vd~Vc|NWH49^IUjDKO
z4%<FsT_p%caH>kG{k{+mJszB-?(G;Ay;K<GhgFJ5OY`b-T`U&zqLL;xAkUK;<IP;m
zx`1O9vR4xr1F=Qo+-kwri{s%6^F?^~$8l)!J`--RDiXwZ?QoVOa18@iDJshLoqQ~(
zzQhZM@23^{e<x5VTsexb=#9~Z*pl$(Qt6#HV>2Zq31~tu2?W&Of<LUju?Ju@dkyvy
z^*G`}`b+Q@6&hUUhHK31R=c$_;|K$La9^W7SksKyDM3n$u$66^8t7HAiL+h1*$Wlh
zO1WHuQlt|WN@0XSnb=~%d>breErY6ZBFQPW8}~$8hO`4kQcDP9wUk?ijXOlr-`8&P
z>G=MmOq08*mDnY4Zd)SwC6@}qT0>Dd*yz0_9HWI~7BLvdW%6mzlKKV}xsMkr-k%uN
z*lJ0bqnmA$4@a_!xsVN#I&nlJvZRifNsZfMX<r>bo{h#N3IGSoRUjwHkJ9_s?$z6@
z@);B^md(@!-mkUh-+MgOI{T^Pex3W<y=SMbbN{_eBPaeY<;|Yqcj2*sp~Ir?Du<ub
zJ$2Q`t1>A<F%I89p&&661DqIL5w<&+#bdYq9PF1w_T=kPZHi$G;z?1qXG(N&rul+v
zjZxoT6lX{g^l}^(kr);Ny9*Fd=6tW1mrLG@L#d*nzRbr_25oDUos#{cb;q%D2mz7#
z=6;zkG>Iu~8yxb!{TbmWY47jW-ZDCla0;AI_O@+_e{UXksXLA9yxS7}E;TM8hfAb$
zNY+8ERH$`7K{M8h7%>^adQccA=B{u2Ju<8Fqm_sCO)`mdWw=`%+%Uq0Gu0=nwYMgO
z>V3jVD$!Rai~Iqv4!d>AH=jnG2kX4AfafG@EiXW&jh7P#lGs1^N#5WVG<P%Q%SM^B
z6_qQ@kRvphR8UvJg84rZR5bqZIAH|QLIm{W=-x&<PICppn~WbJwN0+@&jd=5RtkYK
zpNK*`-D~62mgt;5q8{v)T2VQVVIKu&>`G4u$o1bolTG;g;^cPV?pT)TD&Op(AU;UV
zV!Rp0ho)9iA0TBhZ7FP_cK*=7BJlZGHx)NCHjj^P>;|~Ic~&s??o2LW{(C2ioh%Rp
zW_n8f-DbDvj$4;wUgeac;2D@fgvJu<o+XH{@F^f4^M>j7o8a2JVUB=5nhe9$sKK-O
ztC>0K%nbR`0`)8;ZyN?lAqL?V<EtI0q-7z|3Ntb57uf(~GRt%`Fw$nV=L;7Y073#5
z`;Pliso-Q?h=?U})AGTG9_i5@^5}l)fF5bQ2p0Pu>DrKIeM)3k-5ko@ykcFvggWML
zg2e{`tUEojhDvd(efVo(An6?WT%>fff}jzL8%z;<lbIQ(n3;B%m^PoJuJ67Ul$66r
zhWrthde6&evk*BJHfdIf>Ke-@Z14(Fwh&`<iOzC?@?jLF9Ke)Zy@!LEjN}N)J`bcl
zf{Cj=A*)Pf*vKOIfY5k0z))=AURy}7G3#;!1IsG8p^Y3uRuPU85!&#lG{sL0zl$(F
zVmVO&HDbTve=f#2EM~m^<S83-T?m61luluedI<wsMflks$Ya+-XRpB?&`qtT#955$
zlDG<yY-W?y=y`tdje6dK$qE;2TcSX0BO<cm$ABfKZG5(x2=yw-%9~S6*Hw~RSHfA7
zHqGXAqhca_NJow-8~9~%0WN13!hn}A)|@OKx}mn%#jmVLR;b83%sgZYmnSXNT4CSN
z+K^(m0WvZxl~ZA}+Nk7HVu2>k@Ue9kk<vEZyraPs_uvl59^L@pxE+wPtP}^0*~HR4
zoL!f-*);yNLB1a>NRIh|g@A<*q+NH<Y|F;aQ%|2`hSVVmOW!i9N-uuQmU6~cWoZ+8
z1*tDyMlmx(Jw8fKu5>>DKGp^?Jpl@9U@``l)jHV<(=YRrhdj>K;+@ws^Fo!stj@;5
z$Un(5VOxRdLcVh(m)`?T*fT0S;1qB0DUtqysORJG7%H`NfmrQk@ZMtboFz*lV#}@+
zU4C=O?N4&_hAe<5UW!+^>!)Msuemd7KmyazK8?2_C+V6^&#{G7+wve1Gsub)ZPMV+
zfZta=QGTb#vIrJe+_0l9^W-V^RZaXb!x^|$5!j!nvoaBX3|OGJC-Q4M@FanK+#JqP
ziT?4K6IZU>uM85{xt{ONQLhX$=Ypnlgs+8%zuI}3k4f)S85z$Nm0lUev*MFq8C}Pf
z`<652M_5dUomh95)L>=Y$_@iQSNspIc#aaL{IR3TCt>GYNj!|9i>RF>N^WN29^rJY
zn_8WCcu~G@MY6HIrYBeY^QyEh<WMFNrq(z5LS%Y8cUF2;76y)1dK|G9u4dk|2mPsF
z*@rS}dUbY69I>-mTf5i2m9ZyP`M=Gdr^eBtRh&{)bJt0{xD>giKHg>PYP5<I0N4D@
zU6xFou((rZ%(GFY$ScV$VQ;&$fz8AIL-JUGbksuLuIpECh=*NuO}ut;hh1$4&w^gh
zZJ`$HZeL}-F<oTOHnN90_ugA#$9HyBakP8aux(8UuT>=H;;51&M-o~-qKt)e_L0l<
z&2AVPlC^Q7dv2QJQzQX9mUf2CIN?h7v=Lh0TJw2D&N0(iQ4tMZ@p8S6OAEZkSKN%;
zyjG(%=ev7nvAn-q_AJzb?IC>Kq&QQx9A25c-iZ!gc9<j|5SvHXy*EAd<Pi%tKfFFb
z^SC2=*7`)3bfWFY2K7k>G`@;lQM4q_aVq>Fab$syc%`41*VdL^DY3JYPD1u%b?w5^
zwc2S_<)<+_KojE}e5fUi9t<1rL{)D|97~0Rb^5nOqYfJ%U{hORhMOuw>6&xeB(urH
z*D4s?06SNsyf5NVG>0Ro9`cCMfhdz7MhT=l>7sA{Ar#p~hUILDRt>Hkt(<}hn-!+C
zBQkG7q#SA~eaFq!`1*MGe+#{>>o=~uQpD5d;NC}dQ<D#TNd}Geo0$i^`g#+>Ka*}r
ztq*ctokC+c9z@*8uwlX!xp}yx+T2vF(zI0kbab`Ha`2CLujG42!F8CjVX6l!ujmj)
z_hWTi@7K$hnk|=s_~XEqT8Er!J*%t_S&QIm<)yP*VUmf_46<XKy;JT;Os1t_Dx}ib
zR-d%#7iq4S5C!r{UlvxOdlbJ^M!)QjY^ZS9DWMeY?*hB;hU+%h>VL1{oXORn8VjC3
z7sPsbc!8rshKxmU0NGaG?zSqhKi&K~I)VModRd#Jg_xI1wyO(Al^t*1t1=b`rNXZJ
zRvqZ#a{_w3f2gmj=%g-ir(3rVf-iO`5;>u|Iq=|XKc+aR50)8mm%bz|i+p`uO5S$h
zV!_vgKa^>+04MwapR=mn@jbS~19EFZ*{(vo?R)r+Ud@g|sT0g7b>KD(%fcVi%O8WP
z(vE2kRknAXWX_IpF;AFsOqj_;@Eju~k!iON#$-e5N2Xz;%?RnG<BBr&s$Z%+eQ)i!
z;xvTy$k(0k>*f<3BT7%g9({5av`v-o4IyY2{MO1Z=Xydeq_;?Gz%`PxktSk^Cn8Aa
zCU`51s;!gf!-NGh6BZ*y0)VazWAyl<!e$Z3u<@oJP_3;#S#}@^maD7>D;t&~8To*;
zn4*bFw<uQkwU?<p{WHiJpOw^_1QK;%`8GtEB1By6i^c(=9AEn8S<iUr+=+;4&v^(V
zGnbXF2Au-=7wURS8zLTdpes2M$@lJDKcl{zhBH8;yj=q)BQ6aIE~z7}+{Sy)Od(PK
zxA=n9NU5La-~<M>0f~JKt#f^jqb|GDX=~+S0!8h^{txn_V&>yQJFZ`7!!>TpVOpXB
z=ST2Gs59Gk80%^nVXYF$Z3yA?DOq6m6uHt$_<@?^JrYAqSUF764mgk9&+Bt!gp=`w
za^P{0&>V4*YKWU@g6HE)rjWNGy(*xJ=^XjgbB_IJ<L$m@+nz%jqVL!Cwmtw};z5~R
zEkF&FeBw|7v94E1&;g1rIa?GX-YZ4HkEaXQ3Pg55JjL);{4U;56Nsxe`=A1;SQmjt
zwgE*KBUwL`n_MvpPK|(5$O7Yt`$tM)lmPGRRRyEQtbs4AbvwqcNpvg5A5?HjROv){
z6sk>cdjtYL+@ln4!4WsNYZ4E2VK;5G7<WDV9eWAI)hdZz?+8|UuX9M*<NJA5=WBvP
zDI+QGD+o-ZI<g5Hcg#-c9h)P(WEVYlxEF(78|-0w2Ym-Sc;8oxxJ){?WIq+T#k{|U
z$kCTvaQ*1v&lp<r`q}sIe9bUIpK!b83#IKWaKpk^R~+GZpGPxqk@)-WxG}273d{;2
z^0CbX^mz|j0IW;FBuA+9o7~lxmf=(QT7(Zlpk+l1dve!ZNl9^d?I@<)@=tQCrVuDl
zU$h^4tVad`q^~`)IK$*22a?#q2@<>9$^fjT{nvUcR7m}hp-h$4tj%f3bIT7N*aQuk
zUaXj0s!FGBP7>q~MM+}&CCD*1SHt8maEM{cQ>hYKS|_r*O}Gr-qgVU1D_~{Y&q`zZ
zD_ynan_=Q-A%#}bK`GiLy>1|`m%$<0@;s;d@zC}b1^He-bw{!<vT-3n&7lKI?DGW{
zhZ=e7Dvj$ZbZ4#Rx7Q)JN}&-~zgo<s@b{z@Ks+07^Y_AD9mJ~IL)*`l2BLZlk10vo
zl6u?U+X=pZd5Kb5%_cW@W+Y<6NF#A4Vt(z44=v)Gt)}Wni#Oh?irMRcY&u3_JIvan
z*&pJHq_OZ0nSh6DE$%M<Yj?&(YU%XCL=}Y?FWb7G5&8{HN|ww4gwb>1mXYIT9)n?%
zg-tLa5}}$dkwOIwwYqV(6m_|#vzbP?50Z_|WsLOPRl0_|ika>VCHQSWJ2%86ZtHI`
z6Je+F11Sd+IJraUP3=ZQ2=@C1$<~E}mOL}>-anLVxTDP93X6X4Q^o19$oWGA_AAQq
zZoZ@u=WW@;W20q*HhObc`P8-K7#ZS#V3C|^l0q30HR7qCDQo==&GkR=m;0#)74D-S
zOs8*~TTw7E4|2yP>`q55c?DC+6C=>mU!wH63}O$uD`4;{64tx&-o0PfqdNELRMq6Q
zYHRZdM{DSQtK2t`I~>Ss*peph;^m>xx`MNJUWB<(hEqOudb-=U`v7ImhpNcryy%j%
z;4`+7ok<R9d`53dN*;*UZb>!>yG}?<seloVVw6>N5-4YaKPWiEzPy|PG+;1tAKpgz
zcBp;)V27zpz>=h2TDclCkW0=V9lP39i4#v-aCU4zS==ujL?`8Sb_KCfOJY+`7xN{x
z)kx!g{K?~*lta^5wwzr(*u^?WP52*V8e2LR3x`4s9@4b*l#UNaiC%wX8iOk1kA4&=
z-f^!25$6-mFD4J2vqbD~Hx6fHgU(|qZ+nf_=d=oXujz7jzda5zW7|!;h??$id~<$&
z>d<658~01(P4X-b6G?#eK6CcF+7)sc_wu8Oh{`bzWvlar>l6Hn=QDp~n!Izfw)kJ>
zbDzc_1>!XyejS_F>exJ3Zi=Fk2&DHtNkAywP!6?8sqIWgIZlaxHIXlw8C)qo;GL|o
z9l7gc`-nf&6xShFlwC(37;t^MJJ*ELqbEs}bqHudF(Clh^ofZ4T=!Rv7!*$vyKoqk
z1v(R79Updq_}joeg!h*cdx#(GyXNVDhc?p0@2;Id%9&>U@!V&pxM@?FIY&JxTIV*%
z0KMl@(f}i>h9gW|-&HS{^3B93lZ8WMDETj4NOy*y*GYsb)7v)E5x$R0$s+<3wW^)u
zy%UPrv>sFCI6>Ki8@#`guP`WL#H%Mqr2k2#c|YQis$mfGTwm8QpZrK2+GKmS-bHMv
z>uakGy3S3V)ZlL?pVBlronlg`$?C4rDnH_k(wSX_c8Y86zm$}||6gSqX(?>O91+{f
z)vCu&6IsZ99oYxVlU0e?r9b&6nZ`@uqom*0g6YEl<z<=<+P&J3E7^N>?Z0XF8~PY?
z_TP=k(H(r4G0!>pv>ZtHvw1T==V$9d2i;-Y`AW`V$FJXXM+j`D+@o$HdHUmC3X9z1
zeug0WlfiohxhKQ?o%E-p_rK?!etCeRKO0wJ$~&9Xl4m%dHnPY&pM4g@a4~ONkaw}@
zJU2n7_eaF}_QpGh(NA&>i;z23;&;4}B<S}gYO6<%gNVD?6q`<>w0SLF!?=o_c%9(5
zf>fZiIfQb1Y>qa6t;`iOXXo}0iQ{)UK)pv0rTRu_OTGYAMIjYP;hm_+Bt99zs|F-Y
zh%7kw@Rrp+BMH{KEg+u+6M_7Cm@s7X$(2`0oLq|tS9A+7*i046C%S!deXwwUS#=TV
zyRz|agfYj?btS<t>92S2h&@e7Jz&;MbV&ok#ji=|yF=+E4OvP2la&KC`y!8yA|YvN
z@yy-q(Z8=&DWLCE67IkeXdTBeekVaB8yu&&&&a>zifs)$4D0Vf3YQk*>FDbEuyN-T
zedKzWas~ytVBu244iK!fsNJItSVhtKK5zd84U5Oxk7SV;#8z#^qSC)&WEQ-JX!~I$
z(zRhq7fzC_qj{VN&2^qlJv=8E3lSZ@Dt!yHtP5cx<#*mFu2Nl`_}bzOPKXMVUxcCr
zn#Xwq#?mxK^EmWJ#9w+X*~*RvOOz+s!rQvpKrC|HXASqVmTZ_+PKM$EBE$(`ES8ZY
z<-$yT(B)u+h)IivPpx9;D=_1OX>VEe;B`<i0_R*qk$4?$%{FV0FCW|$WyCzqbXgcC
z9N&fSL>)qTgus!u?;?4Us*_F}R;kSGpyxKuO3Tv7c*iO|5q+UuoLkuUK$3JSE4bIM
zABN2t+?5nS-$V9!eeeM<YBeg=t+a?FuT&F_#>Z2O5Yx5bvV6aqDqK^n7Wh~xkAxFw
zM?Mc+JByHV-;R2eox%pg;+7@G)6bdoV7oiw;UCnSDxFPZn+Jz+Azo`Fq`NSEK=wV5
zdTkgqZcULZi6g%A<m-G^x1WAwI9)S955jmztbZ24f}J#U>>JEZxKVvvY8pw@O~OF;
z6q{43vCB{cE?)kC(ZNV&#CFXP#HYm%nDUktQfqALzdd-!>fff}q@1L$i+n)rBU^i;
z^eJpf%_DAmI!?i;+HeesL(y!u{uYBVRMuRh??zq2uO7A`TS2Y>dWelf1=k;acoy$X
zSa%`X^e&c-heVwOwSGS%_v~oPiD9pG=#^`xKHxwV360T^O=R;nEaD=%g_tsrGf{OY
z5tKy`DY?O!J{u{kO5rDHOhf4F4<fKzkXE~4^FD0h5fVHT<_WbPY^+~)K-kcD3dW29
zx%BSWE^Tryg}Na1HYKJFD>b1j%rNifhhjIDAmXO0p1Wq-SB-k%z!#@}Va*{|mCPir
zd@V!Nv#&#@8bH2x^&y)?8*;>W1g<_(Wp-LF{_vJnX4E`Wn<l1p2sc7Tx#XkmMZ^^&
zlz8EU>eKHu3{E6)aQ%}w(aI6uBZ9Wpjd+*z?<u$fj1v(uc*UeHr4Q+9F1v{$lo{PV
zFdAe3(pyhLSvR@<D&;1ppHP~m9cq><Q+Hh&@Ojlc!Y22cFXh0Jx{j52;v)Q9fu}>_
zCuU{RW&?TUIPMcH$b8e6QaW+BhkLIs!Ymu=<r@z0owxleOJ97D-*AfU(6FNTu#<ms
zCTo20+b!U?-Nn0K?Yh^D9&Bp_;ic*=wrZD3lig%B0IDCh+TPNhXAf2=8mxAJE)9gs
zyuAz-)Q^(zgi^(v`7yf2-CXv?-)?N&w=-%xN&ig0)%&HsQOZq$XGu0)4p*8!&KsG3
zV_nw1i9uA>0D0m=<NLeedaNC&sa|}v6wZe!HJCJTtC6rPJ9l`~T7mGhR%(_wwCtQ2
zhA0rUZ=xD=Js&=Q<5c<xNOdHXPrUcrRb74}@jDr_+Gp?Au?5=bEy3e~^-M+cC1_i}
zsIS@=e>3S<^Cc6oV~Xd$`?GFoKV@7#+>-d3^kxvVu6NnjL8>zem6kx?j6m-Fg7_0A
zv(dJ6Mx3WRw!s4z3bo|j#Ar32Or)$(PfoEAy%z|p^y~fcQNo<b>@Z<x;z`TdY-wj)
z7l~s0F?AO;+c(q!bbTS?;?v~-N;$6GKa!-zubxBxOTtf|YSYQNWx4uWL;{lT_mKwY
zaX&9LbwWBhkjfZ{;2>c)f7E_b)Cw3Px`Cfde`S)>>0@?<u_t2G<5ra-KN;#Y$?A62
z6_TRbMu%SvVd?3f&sO*h7c$9dlJ7V&y@(=EwhFV<#k_@Ko<akfncrm}UUR7Xy%_ho
zD8i5k4*!WDBi`}<LDcHE+gl1K8axCc3R~FKv2}DowWDE^h>`f1jDFng=Xk#H1Bc}#
z%N;LA0E7TcR}W<?imgOqDQN8A>Qv$Y^^H2Y9h^8ylU;KU)Lc1I{U|y)@%9dwX{VhA
zdJQ8^!lD6TDHZ$26GH@#V9fxq77H1$k*&4@-@mHvstAl%1wPV*lx%~@t+MGGNyPTv
z)fIlsKAe#bCf9;|1y9hm4q!bHN+D-~q^O_7$KU-PAyNkBO6vImAXFm95TpYIYWg7r
z`GYaDjx>6E)%+34gPWSGh7_>7gFNyaRsh=psbssRK}Dp+Kzie@_sww$PuCcm)fjh=
zx!UU3j`Y~iUNi0MRnv|$okQ;3G_vd0vtM;FKT~8TAz<GDCT;26^C{{lt<LT}_8b=&
zMN>I<iDb1EB*j2Pon=w>*2-j|PctBw&&^Zl-7!FooK=Ut0Eg-)ARPp(H%#_4eRr>n
zle&N0Cjg%_WYShT9yex^%U9?<#(__zB}>>Ox4kMkab#$IGLH)m<EwW(@AY|`l6gN*
z@^+H)Jqu>)C*@kQXCHmXb^(2_jKSYC$=@FKJ3iu#Pj~PvKRYwHyEJ+ig+TO6v!<<0
zgw*cy<DNd=`ATF5MQ_1?`tdk^xUnC-V-tua^XVe0WM(Og4wDWBc|-}x7(Cw5$w=1m
zJxT=q1k}eDku)PA9(W9dTtxA8>r2Sq{XOboG<5(kM^iZnSjLG+kK_)|A1bG4><L$>
zzIxUq;8s(Jb{GMRhl^>svyq<SJeZO`#S#nSx&^@nN0`%}za@cHkzN1^Uyb_-;Smla
zcT4|BIsSHV5G)pC>^ONhnX?24WOh$)U`bOZO&sqEo<vgb;1Ti^rL~Ht-~50);ia#i
zf;O?sJaoK2#|bMfyaIz5u7C%r+v&=y>BG2Tk!mT$5JJ?Fd)Cdc#4i>m*CH_S4)xjl
zZ2c&rG63bBmFO>cd;<t$xlnPnNCIxp!(^yd&#t&TI5zvTUKz>=!w+eLme@_lavY>L
z@F+X;s$Z{)mwlCJ*^c5HBx4p$xq2U8{6W<vHC~@*HvV<}#%eE*RsD*q+B*5eo%%7-
zQ&1=_VHF?oG%1#-{r&nvLRVm-el$U<s9z#J*70^T`6|e*O0EEeWe<h<{Q&V)`uBd&
z)2gYfgT49U!FKY2<RUd*8BWy<(B33BdcZDFzfHWgo#q#nWY_h^Nu2@;@>58BP_z$Q
zf~5`u6YT~i&`eI7CZz;MCI*ix?hdGY;Jkmp0QF!8`+FplF&@@85u^H#4+W+e4MghX
zg3Veyqh-6FeEwLj$jWkS^|aCG*&LdsnR)h|!hGGxd^^p2Z^rzP!s67(;xf(RcE$ol
zVToyMiJNXoFl$LdX+>siMU{?LXRMegpR*Z1=S+XjJNsOa(puEmS|Z(AX4YDs(niVH
z=3%<cqgfjrN?QYCTa$EKvsqgU$`{tgFJ7j<aGZVNLiy6&_@#IHOaIxIL6mkO#&*uL
z4AEX}(UkVTfcA05_8Fh-Q!eb|yzG}(?TWk{O41z~Xa6uc?=BqbjUBr#9P`8-YQ*jP
zX6?}kO&+E5*L0_WS%>vm=gnEWnOUc@3un}VxXX6B{UxQ#Zo0$4C+E3z7yL_?TVt2q
zi&s^%49%ZtC`}xDW?g9JTv)u(ER7?Zx7&S**N`UH!&$c?FS{T`EDdkS9UMo)1j`QX
z<Ul=Dm?`d7J+lx@qexG*lVd(dcn8NfmtfFe_0*B@e3aq&%*4~$+sk&&L(jxB=F&6C
z#M6EbjnjC0W_Z7$@-Z^;$!YQ|F!6nq;q@`YH>$}$;nH74!4K`18hLyBn|KCE_zZY^
zjx>1`Q3Z5*`wz|e>|F*-W%$iCd3>YtU-$Oe_71XY3QF_#CNRaiWAVSf^vt^qO7Zr4
zB*Bo~<+t4A!5|sPmKk_D2W!s=M$Jfs;F<;ym<F>*`caq$(p|wJ^C2Y7ekRSqD#+kR
zrk+x!0oIZc4>LSeEO9Or7-B7PqUZlOInm9LXeTGt2d7Pe;Q|qbc5-q}Bij*Cc`Q+B
zrjb$ekxBDWS*B5O3jg5bAn@p+3=IgpMQVa+EAqwWxQAAeo6WHd(D*pClf#lQV@iB7
zPqStkKa&}^OdWrk8GqUw`&BY-&NTkJY2tQs{I{$4Q=f!eQ-<HB@t8Cz1Pge~G)bIU
zv18P6_}57!kK@S};%9&fn^(!WQYk>GWV(eEs8pJYZ<0GAb(1>no>YQ!OPobk@?)Ar
zcVNo>mN@^Gq#&Aj6pe3&{NpSm-%K;9%xmiOqy;=lnsi60?AKYT1=o@5rcr%9v0bK7
zRr66rrqOBhG&Wt)Gr*X%`P>-O$h@n_6rYec^PCzc3^xk}D4IgdCxy7#g#?R*B(z0j
zPl~9ri|7`Mm}raHo)mLt7xOL_3(}T|W*4C`8(*}O11(W{Qu;8v^wDCe4sDsilQNU+
zvKe@Z3@wLTYuU@}a!2WCqYUg(1U+qbr08R;T$aKyC|2Qo!6l$#)3SoI71zx&@+G3Y
zfVR5irpSV}{8?~88Ewt`C&h7#gcpUl%CIOJX}sJg#DUV45jO=Rtu;vsSfjAwjO;Wb
zXw7zZUC|-|YPPW2daZgdyZ-j3AWoWU8cMnNq#+50{Q?%%o{j$kK|{}iXIh9G2xaJB
ztbqIFT_Wg1vny{~YVUoccSB-%-MsU@p=w29XDYm#=>oeUvD=vGrr~s@^Mo&8RqdAe
zhBCMpNNhJiskJ{&I)ES(Q6G`h%phHV{sb%9tmXY;<)$S`umaZfJf25O<V=@W2!bFN
zj@^I&k7vIdS)>VsVl^PV?nB>CJ;BodMxe}0)0@-QwHO<ciS34<r-x!C77{2UKOKA{
zn9Zr`yzTgG)_nb~GvgbAWT_wy=9TcRI)$!_DYq=H)#EXOz$=>$eWh!P#Hy8Pzm=jP
zEb>OV&>`}QYV-UnzkVx_`CKq}OQo??*{;yGDNSSk4NuXGVLqEK9fmD(i}gFFR^|>n
zSb-s(`NNo12Mhhsuk30X*?Y5=?^Ec9RTe94S*p-f4tkM$1JEj!`-jT$TLPOZ^ad@_
z%zh&nMG(>h`=mbi%&gXob&XCeL2%6K{!lrqjoz)^@4Fh_-VHuniVZ`bGH(Y<md4Bc
zhO(B}%Do&&mM4U18&C^0<Cjz~&>yhN>vI6PvL%W5ugHf_$&?j{ljqwer2D@4k@z*m
zD!rM8e53a=BXhIF8HK(jTEz-o>d;ym;FTG7StMvsz{<Rth-fb(%j?Rqf>2+1qAV^W
zqm~yK7Ap<Dp~VL*Z3Nz=%+y=@R&W0Sf7-S&;QV<G-Rx4uqf6}3!jZ0aj|_#WA{pGL
zUBm52EM;cAWGKTs;JkfKRr_+SyTV`#9ADcK|3x8g{xVW)alYmT_Gm7OF0h`2agEMz
z316D7I-qc@XoQY-9Vos2%Xb~svQD%JZnI42lU>tcEXf0skiT&>^2RwrV>!^Rm-$-*
ztE+m9+j??TThFkxVe#&aJ4}8J-}Abbz44xRY^9iQxybG0<j?=Xa#la)<^O=(cpkS_
zFVB&t=I=SnwLll^MP>eAIU?WozcL<7nIFvMAADOm7_-_R`F*gR{}Z*ha<IPg^VIxs
zkMZzw<q#!zFvNJY{ks4cwSOCUu)RpbzC?<UaD3D3{SvVIS#CGNlAiWE0V2N+ezQ11
zb$Z|8ID$GrzMx(z=nU;%eq21`HzkW@J~y&Bd(7M^+Igl@aQ>{b-sJm9Qr9F^fX8yi
zNl520ja+S`UkqBy`2?U5_`VrqQJo-voe^{epT91ly-6#$j<Tq!54s+(!lV8@RL~ij
zWN}@=)YuesS7Nc%$rRc1{bq{k);9lA1+W)J8KPo&5>l{-#&SC3X#m|>RF8jvXk{aX
zin_xHAr7R#*Q&Lz$+=nIizzFMz_IB3?(im&J&|O*@t-qaucHu&d}h+2T#Cg*Db)Af
zJfc!I2Q%;S7KiSPJ|4(bru&(?`@Vd*NF|3+c5&*t76h6l-462P=raZ9T;GDkYv&tn
zMzSBoh`(L@==81i4S_`6Qj5plVtb54{Yrbl@+8<wy$0FEk)*Xx>b_}I{H`tYJ^OPt
zWLNkAOMa1$@R$AsHXX{R*KRMy_@$K6H6=Zs*OWrDFEo8}@5!dCP+KkESg(6j$bU7A
zqw#(fUav=%|LpeSXwuxLM@}GE_51F0jag^>gU=TSOP~FN_IO_GAE$~cl6O4aAdGBG
zWMOleXu~_(ow0u+Sp3WXYH(vpCy2@aXP0+!(77<VWgsRgDiT*yRMH)(i2q}t01n|0
zTMa(CPYnsBk`84GTR-RQX8oQQ`8=AZZt!`GK*#*7g&t&(Np*7{o)vKpm7FB}Fp)V8
zme`_ZNr3#qW7kq#+X;)`rJ*59Rwx#;Nl{t!wn^3}5>}GVj=f+{*K<(6m!d6zTbA&I
zXJIn~#h+fDx&h^2i1k{DdYSL{b7<S^r^1I9$!5wno33$DNR6NlZ0RqBQF&DhMNzZ^
zTq^OT_LWqTJWuRZGAOfiN^`w#7z2m-IeE%r13|mbs{~qKRDtu*9CkHnq^8N6pTmyz
z9lt?*(J_(CFDpX(p65%wYa2@Dy8^!0*Bn$V<$KQ}g(4uU&C}*p{8(y5kn}0dZO^&%
zYxD@02z_*6{KvU`I%ky)fm{Bz<0l_peSQlk;4h(h3vohVkZ8JgVbxC@wl@;lDL>af
zDAE=II~N_f9Nv#z=z-`weQiZ0vqauY8l&)ffbvc5>p{8{r+0>M8pu<FFOjn4Lxdqu
z$;bGb0wzX;sqUZlJ9vR;5I9V69+Mh^Z<Z}?Kg!M<lB|h|DnA><IoH&0`k^<&`ZVrU
zpP4~>#Ej|7XA|=RzC_}S978XawIkliT8}t1^<FHzO2BMd%ARC!sq+-k@>vaMif^9s
zCkUUQ-1Pu*ycQzTYx))^&v>o)PSad!F+=Iq!4_B#)zPe8@Ukv(C&@GaW2;5Q`v@xO
zt`B`vF$Ij$+hw=YmQ)QRjFZ|QdHE#Q`k4{}PCjF_-dYkX@~slS6BF$@8go3C4W2Y`
z`E|}=%k=AP=G)I-l1N^Uf~#eJdFG;SqX+hla|H>j7wZ{8@2+e3v4Vn59uhz{@m*nP
z+{7z0qLaU`^eHy?w;j^Tw1QC>{D-Th4f9n_wq~L^P9qX5WJ*n>KOVv?mgoDTkeCx6
zivwj{fG0JN7)ldz=G0t;8sjBV_VdDU_KQe@@RUC?gF~pY1__1UM-;{iI9>6sNyhJl
zu}fP=i4qn;k}7+*4U;%bVxLpG+*k5^TuiUKgbLwP{nSA!-56_O^PKEhs9z-i_45r;
z8j_GdGL0Tg$*`oPL!4N4`gIKF_4*8!`XC;yNMgtms|aP(pz?23IdXS42+M-nLw$Xh
zSD)7z<<T+?ZEb>8Z{)q2$Yg_b(%59eWS*CikkSt#A+@<>PR+fo>Aw1@ZTn?{r^*^;
zAot8aGEG9%==}ak#;8-dXbah>jfQ*nG+L&qZz;ExL(4S#<<E+v#$2P_b2s=n@jmX3
zd7xz)TVRFMADL#@J%0nrDRUU5^Qtu^|8BoR9u=kOzvW(tMX@Odj2;g~%QT<K?9ejJ
z1QX*QnWj=jP=h%_)uV)7Wkne!44O=g7AvAXs8rXf{*VywQO4(7CHW|NGILnWl*hA5
z%O%>ttlOhp_Mj@?A$zJ2<XL%22G>c5HZ%vORcbm{8vyO5OEo;Jg`WH{sE?khl@_cv
zJg7G5v^IJh?OCg}yle6`+PF0|t=7r8=FwR8Z1b>DB&%!9v%?>T&0jq01F%P)9E0W&
zzYXf&@H;(4@yz$~%;tuo*BaZS=lhaHNk|g`bU5x&!!MvhG>Hn>pM=Q>)c}~uAMLD}
zVirqPKYdso{gYu1?P`Dm05G^E4gdz+=wi=68~{uoO-z-0HOoHZcYVA2WPX^k>C+78
z6;NR@IuZG?^Ff_r*dx@^e*SdxY~BkuYhG$`q03Lx&NwQcj+cITQ5DY5)cLawFQ2oX
zeja(t@9XZr@EX9{eqt+V@}0o4s=ukTuhhk7U~g#&Lji-l3*qSg$TA4+Qj@>fhOzN!
zVmhj{U1$k;22I3nD^mBI<+_IHER7MQG^f$#<45Gkq-;-K;H}*Qc$&!Skd^ohj2Q~Y
z<1ai<Y0GS*MjT+UqvNVVmc8<U74g1=w&pj@L!yLkD&e`7U_<7n=3iaOGmmWD<fMje
zR@PH{VxhbSSR=wX0KAh#^Tz=+W1IBuS%-wZqEj?M4ve@tTES-E!pn~&)C0Mfcax|!
z--(rJ(c=2KZF!Ul`}jJb3xL(Ipd^2j?e*eAMcVd`R)#<e1^W3@E6;-X5puec5x1-f
z=ooGHWO{o4timO(S$AsDdFahiNXdwmMQ3_fYW`5Icb=x%y5EB4)ctowTZ=$7|3wUd
zct!>P0VsAI0APk2Gcq5%)G=5X6}X(p<^SpNEp2J*RTE<T?N6VCwB?_5P4!6r!vKr4
zm5ZMe1xIfWVPt9Fe+yjY0R)ah*He)=E<Q2fx}(VVsjI~GlF`fp$FU))Ym|qQVtduc
zi5cnZjDpvmLINkLDTWgqE>aD;btjpZDH{UyzUGz!r?~?uTjGZ;PoQ<Dg^p?4a)LKz
zt^#MJ)+wkRRTt@JX=s)G-O{e14rH<<{@hxm{l`<1k(u|zURJN#_nx8r=D+3-Hm0=y
zc=7P_w?~y1A7$DPT<T?huL*dUOfCNmaM_tYCHCpqZ$AuuNVkINa@s`|c+4OpyY{Tk
zr~eUSbwd4}Ijj8jDDLoa`laO7eG)&~*Bz&nCQo;C1jp8r0?*y76a#fhZmr$I@N4UT
znLVxVncoWxClX0I2&zv%N_D#I)v-~13cTAW*whi_>NstZ^xORQ?Yt+b<9uX}xkNqa
z*2-R0Q^fbzk&>3lk|4?iZ2ac9hRFdX(s_$gu00?5Zj%Us%PbuR9)3lpogShZ2NQy}
zB>0ZEQ9;<1_vnKIfRRC%YSK76Fam2v{7Tr>_8Z|w?3Odw>7|;`Dg{|3?57Zn(hk2-
z;g3wi85#UXrWp+8-w77P3lZiDLCZAv?Ls6XL!>Iv<xe3Gc0%OwLZ$8S-yicWZo|oT
zh#irBLS3O+JE1ywVR~F)25MnOc3~!wVUH`r%m%}r?Sxt2g<EljTdRfJ+Mz@I5U~cF
zOYczUD~g{;kj5aEyIO>&U4(aJgoh-rDk9>|PDBu1BseJ|L@hEbGr}J)GKxBq)iN?}
zC(=7IGMX!js3$VPE-H)~Eww}j`$Xm0MPyY*#q30t*hO$MV{n48itr*I03dt{sOS>A
z=*r6IpuuQXWORBnj$;EJ!%ld+DT6{6wI(h^1?thGMlSX;cHqi;3K;9w<E~Ck_OwJQ
zc#vUS^8T1&Tt{V`;0e{7Deb}z!%!qy-=M(oJi}Ns4gFl)B$rg|6~pXcJT8m$hdG8L
zAAV$W+;t`EMP%GhA678%fdDkh(kNaE>b{p5|2vc6&L;u1%Rsmge|D9Kw;l(nN}y_C
z1uuY4Gg&F96Iq~9ZC9_EhDb3V$C1+{;B_T&(!>#QCvg@h@kAw%EhJM$B}qiF3TJ_N
z7m@&vlL7M#jNFL|RSeQu(xQ)3xvJ>YuH!X)Q;G3Yv|Ca%qf(4o67{c9se%hBtP05l
zkYqG!OL&~7^*Du2J<a5C`r}<z;h~h<$TaMUbYt!e^{n(0pY-o6sYJr*miVOp>gg0x
zX}anuFnjRptRz$WOl}Nx@E1+dFgW>Ua3*JfRx<*sGL)|~p7vy(U!@<AX6Zdn$;nF5
z=FX0{&-QQ3Ea1+P%L1oWv8F6!XX0mvKF;QQob*vDdm=I?t0kvmH^;Lpp*<?2)*f8f
z!rJgS_gz*_Q&sk-U6yY3bfKa&A&j`m>zp}zh9kVZo}siMZVc9I)<OH+S2WpULs_l%
z`O#5A!S<XpQhD?E1-^QDyF(f43#=*j1sm7Q-*!3o)C+z{N%|+FLV>ge*gOS$*ZIEs
zaQZ<`#jJvep-}wRbi5zDPR+cO4uv$)RG2rs1fYD-VkpyMKKU>weRUD1v<dYh?+Rxz
zb9FA8MxkGEF_%V(*l=;XNXh-`5}DzW2R};WL8VZhQYDR26^GJ?(WUCurH_V7wSJW9
zfXeiE$_zBhj2y~LqRSpvmzfQhJ^N8+0V=oRDYw=rw{<9g8C`B)UG6ws?);<N1yu2x
zr@~#M!qcI`JG#QRy25|B;?0kWAW$Wor!qvNGR&d!KV_P~O{PKp$ICQt_gd=-J~#4y
ze*ft6N5{`iF`rv%K7Sth+`jj@lc24Ox2@+<Tc2awKup_EP20#w+t^;)SAzBl-u9_S
z?K6(;b204;HSOO<+L!m*zY}z<@^-90>ezJb*pBJgt?Aes={Wd@>XT#M&eKPo=Z>A1
zF`d^nowp;MzxFy&1QZA$9|BVof$fCAjYZ(sA_$g@fWZGVrJS+XqQ-7TkG(44Ua!7-
zNk8*0bN7Ln`<8w6eGum7_B^2c`J0-FH%ifgUVnv@qxUNEqj{8qThu#`sQQ^GW2+eD
zteD{W7?Z=8hjVde3-M;Q2^s;3AMz6;<`XUKle7YoTVj)Q7gB7TQ}v5eqmNRJUuT$v
zXEZHl*tccEDzg&4WjT3fKMl+7O3Nuf&asNgZC%Q9_sf6&Ha`Vf;GR`jvr_04SoE^7
zDE*|^F{IQvwX|d9ADEoA^1#z_w|~TP{s$@NADNuf8vnnylvDhdrJTN+{|%*_jsKK#
z{@0RntpBo<gZ2NFa-jdLl#}#tm2$AqQjYCkl5(Jbo0MZS&tm(Rr5t*UDut`1|0d<o
z|C^+oahCsH%5neuNIA?jf0L90?q&I_r5wh;R?1=gpDX2Hh}aYxj1oNeL;b6zoIUX0
zB;^SF-zwz<|9eO|GJh8-hxXq|$_f74rJTh75GiNyUzBpVLMR6l|1MHa+5Ztz4*kC@
z<s2&g{iGb|f0J@T{<4(g^^a1H+Fv8(WdFaV9N7P#l#}vD%E6@h=cOFae@V)T_)Ahw
z#DA4?pnp-yA^VS(a%}#MQV!%lNXjAqf216nf0LBs`cG00^gpE>78W8bZ^)iyOhnRy
zJhg(~3)CmOG<E0ssK<pkeua41g`n0#!bLvJH7JOJc@p4UvnE}@%DlrSLu(}cemx54
z=Jn|~j}Dqe^rRSkT)3U+_#Tr8L;vq5<v{*5QjWsEo0Jpr&r3Pbe?iJ2{U4<qo4=ow
zWAm?-a%}%<DJSB8BPk~l2f>VEi<WW#gcg>#Uv5j^9^o$o2)|+x&bSi4)y2`Z#MMJZ
zHydP^gnQD^Mv2hKfDr@tB?r6#_!hEcSYKfzHW*$rY^_gkjmY*e!csbIga{`5_=-%Z
zwm%y%s)OIffP>UR6~)68KOt14@59&9-v*l%9DQ~sZ|kOOPNXP%Yw4@=glH<|trwzL
zHW81LkVxdH-uVdhGXu+a9wSMJKn7H{CQ~*kS{}4omZlEg_0QpCCr;S{n^P7-x{R*I
zNo30@WS_cV>Sab`iPUy~!i3%%=CL(V1xwd<wL*Kg$Gi0WJXvCOw-fPf5ykIaiN(sh
z`R+=?Z%cXI+E#O#^)#Xal3aW=!G<_mV=Z8QSKeRDEV6|peM0Z}A*B`w%uCc`a$i|+
z+#PhK6*BP{b1KTp0Eq!tD8yPN5SR{qn#-UA>euDz-)8RCap-r-Eq=L=p#$=I)z;2(
zhig7bB(6EIEktnGK%DPHwFb`4`G#ljYP1Fz?WV`?+Q;~AIeNDC2=~~o>6B<uSF&;(
z$GxyXV1mTolf0d8wD)dgKvQ@iceIO;d9)33!3{YFmlyCc^w9Mq&4%G-{pk2*6EkMn
zIMKO2sOhxyeq#R&GttE&k;pjcBYj!>B)=bYkX)DmcORTJJ`h+mPS!PEKMhfB`?5Ll
zr9|`5s)Du-E&fYFuIjT=r8FGpqf&UH$yb7VlH*wJgk@##N4()AHK-kM$_<#xnMzCx
zA`v%XhtZtCO5{}C{eiwrk-u!&b$YvyNafep$#E=Yx~Vr4#7r+~4G*U5H%n)b?AjvJ
zyqeA2!!uZKh!@zVOyA6o3S$ert=Ax$6?)?zBrI>pQcT>~C(JTuG?DKSH;Z7A1&R>x
z@ks9%7IQO~@T1#AhKZ#>%sB{RjBd<*<eYLbX>ilrLzW2!cqti+7agS3aVL}FnW}0w
zS>_mNHUlY^DfsOqMoQmY+o}ver04-{5v2Pi;2jUGG#UnzNzhVYZ~)t~kxHwBF$c(H
zmLay%kni)5Vn^`E+djqDOMFR7mCJ6}kd(SS=DqQn5z9GcRDdg%)q?8l8G5}crAzR+
z5COD-7~R$d_rnVrt_X~-509=iD1ixaw!RkszT3WnUs3608PlhLW7EJJ=kQ$=y25L<
zLT2Ut;u4g;?xE}b{XUL`g=-=Pe0gD+DL@$~z;X;<*voc6b&B4GlF=sM+|%l%r)iS`
zkl4#osk;1zVvYw=fF{Nyu&3_TKIzHq0M(A&)S85WCdUUp{aEkxBap~n|DISo!UH}<
zV)&VGLgS&<dg~CDZX$i_H6h=$3a$hy-(G7Tyt-Ao4yKLLp8ae;cVsQ!l*GtlT8W9@
zaF1_-gLK(|+HQ5N7JBJ@41)Ox@|7P99dEF!Y4|U+-T6OM{~tg68N=9_F=OAxz8A8u
zGj`dRvaeBth(u(Y1!G^5rI5W4BD?JSntc~TlnN0QQm*O!`QEPUm+SiR`UlQ0=bYE=
zyq@Rvc-)&WYp*f!*Llvpi8hsN#_Xof=Wq=K6x3c}t=WarPG3FxB(Yidlhv~z4Q${2
z+4uv>S+N{EEWa&)`HRFD9#Y)BbM1EI$HOCPsqCoVFCkA6^=q~g$&aaLZh~I-+rV?2
z14VUV!>Yj$2?C&AgB18rZ@4|sKz>Ahy0iAArcpM&G2XPzvH>4;wo4Y!NS5A+|J%6p
z+&LIR^>?gIif>;mpvg-Wl3vKT{{S*?uC!f3@m7ehvDc>l4V{e_<&C%UjecJbP~c9%
zSdS10sSIX-ShKsNckwdgq3yxL=gA?7`_OIJOf|HIvo%f|;(JK($prEh0pc3jhx}-z
z`f+f4IVJW7xwp+Qatde@>-(-+c91%Mtxkacn+A-pfT?EeYOT+=#BsTcb**_~l6o*=
zbU2BJJoqnWf_;63W`oBB3I1BBh7e1lf*v)>;_shP*dzFshE-cK_So(zt4+PtC?axN
zbo-Y27o>eBKcdiLullLg)m-B7SCw|-P>{;RWtZ&qrvxPYDoAUA{6YdkKSP!#cS`L%
zFJ{rr&A!rHNU`7gjbcgb@z!H`fS9NlNL5r<(gxIWi&Dxz(&064WJVr>T8$dp<2jGe
zMcj#JR+4w6WV>g3P0T*HMVvVaWFN)+>t`P*{TFS3N6Oj7v-Y<Xz(163f4opRvGF-i
zF6AixAk!F8LYSwsb(1_NFLIK^pb7-W*-6Oyd#2|MOi|%KxVA3Bp_fuJBbi)67M6eC
zkwIpLmzH-XiKu95<|`gcQ=8gxP$7jmo4Z>B_^%&J(Z?paEK%h+^5y91ZNn#GH?CB*
z%m`_F1v~%0OF6q1NvGk!2|3!&v-#JH#QPQJzuc&@YxLV$ng422>oy>J_ZJ0vzRqjx
z#s8O-gQd`PQuI7r?<M>nDQ7rc%>D^ov*-V$oVDd+<BEcwSQe6$<26_DiIm{DYDu#s
zc6%c6GQYPrf91GzK1;c*smo4mw`N~lEo9H&Z%Du2AC>=AJ;thME7^Q#%(zN;->z`7
zG;`}~O7+S`=*j24UX5Qbe+r`;bMqvuI9CFeJm1MzMAWoBig#TtZPI+VnbP=kJ@IPO
z*_Xuq&hLO|5}H8oaiwR8n31aS`!Itf<!Hmxg@3-2`6uOA2k62tGbHM^EL{WiIBXt3
zudvl+)amhfwFl@R@Nn5-rZBlTx|<){jE4kr)sFO=v(_pNM3STL8%WmA&B*bDlz$(V
zSmpN}<?h;(8E+VzOSpb5!uY<C(#touDwMwJR8H{ZN{_45w>@*$Q1h9~Fnj%%&U)%n
zec#$z)Y|fND^pkCk5~p7W4?^3kx%qBD-NL_4KG9Ne?PF!TiSlosk}QH@JjhaRenI$
zGD61Urc=a^ep|!&%oh$T(&ahEyC<J=jTe@GEX5h`z$Y3?9qY#({)ElSj^-pS=-f`9
zZz|GGnEwRZVR%MXAlxLc$me-&;-;j0{dJr7UK`%5uO3P{{aOpOs3=N~yoetu3?4pw
zNfmxntvD6d)0Q&sQ<uD09aG?IyMmL5+|5-uktye`KW|`Lw!8k+Gs}T>?Xfz#SYFxa
z$qm!fTfX>HeyWIYbq|=e>w0jjtYuRJ9nVR+9>)!@d2bf4lg*+}#zjDTbn%@ZG+viw
zPn+gG7ZMgieWFhcQ+#|sjg-E<zRCq@3f;ROEb%2vV@|!{tG&akCSPCJ0el7=cCQnd
zAq?B_hK2k0(kfo~_fsxTeiENFy$Bc<$PT|hD$%Ug^rq{<#r=1xzb*o&B;-^d%)mam
zr6?C4IQS*sm<bDdJ9s4`xc{tvWmxt)bzbm#*sqB1!m?htZGk&t0vY^~Hj$wp-Do3E
zg_HF=LsvqF$$z$*+nI7^*xMXr;SD}~c(m8|SolyguHbZ~K6E&Iupa0X6?y)3C{zBe
z*8}s&-@ktq%$~PY>;L}kGOGYo<Y})7cWc!Z?);dF@c+htPDO72F#v@p`6gr1!<VNl
zR4g0F*O)vUILbpn^plKV^jC>Znj><0^2#Z_vw+PDd)vONJ+-Q`))sfa6Z*Km>s#|)
zjH<1qsZr}mhvy>txGFbO-P5piPrRZPPP;)a;e8Cjr{twyWN6tBQCxqB+JYKK6o*Ge
zHuI;ry12L}b)nR8St>+jvVgZRUz~=T`36_XeDclHy6Zx7lfvidVmo*_oe8lBAw^-J
zuMnU1NxC$F$&go1Z^l^27<jg>^yHzE2hUi`fRx9A=po9Vy|g{%xoi(eri};-Mgzrf
z_kdU%_^8Uu30FhXz^X(6rjZXQsO&VDRjvps1|j&i$;ISFyb*0sE)rfP&3}LGq{~mC
zOXWdj$(A9<2DERU%{Ga>v%<pi)%jmej*sB|YBKbCHnCqyKmTXqoKoo^ob5nSQ^J{Q
z=)O}Nk<54ZK8@8WS!=j-4F6#_LoN|Z9-0;{eAgW|Q;uah^^YScY(m7AsKgtP3C1Dc
zpQG4Ue{YYN!Wgc;I0~;2d}%(*jw*?W^3O90_#%j2J9#NSBewiV#d<C1ewjunf%&;V
zLu`97^?<ED4LM6Hyp)L&bvU464~Wrg;G@P43;8BYfo1R3KK+Apg*8YgI{3>`HBaf$
z=$%u)dO=KDS&F`%{UsxL7h0iSyekRrAL<eQY5h^|F3ssn+sk3UHyX(icRj4+5O#m$
zMb1gx3sur|v1yx-zq|T0I1J+&a+LQ9WXU^VD*9?^A+vmWkD{#rz3(ZK^V|UFkW1=z
zWGk(_*z!f#V^ZOA;xHHDD;N2<89P&QZ!}<4o<eqZ159RZ3ntU_)vufm-iT^whhH%r
z^k<m55>1yprC)+0ik8(ZG`u!Iedjr+=0Wpmg5weQB67*NxX80*TXbm|_&`ym-K_Z@
zHF{%TGw?Asy?VIqXsPiM8W-C>c-W!Ix(t|5s8t%C)}wfc%5^;}$s}|qEBVP#u!f^t
zxBO9BA)N8$h9%Smapane7MUDXpdR`whJ+}lO?r{bGp;Yz_cKVzb?UD1VWv6?QJu4R
zV>F1_Yj#Lj!wnj6c*;^WtwsMh%`+<8h|f92K1{wc)l+Snx1gJ{#ZQLO*T8>N4JG>|
z;2)ZU(?`i$u+c>%z<%^jxz!H-LvyaW^-e{e&WMTnx{=oZe`roYpTv&3CJD_krxw@1
zCTOPtc~`m#zl68Gm~)m*KG%CGdj$ZXqB=KVZ$Sd${EJN;UC99DF;Cb1z2N%@z)Cq2
z^hzy&I-Hsc8pi@jm?*jBk_Zw|8e#y{Vx*^3-V~<D8=X`zxrA%I-w;)Fye;Kt^3TuN
zl{2<D!MK#{!uu6wn{4Eg74{J;mp7jM{0HcG%nol%uLM&UZ2B5>tJZD%DQe{uQDvWK
zW0~)ay%oAL%tnV{7XPBd1}^#<Xz&PvRfBd~HGK0a*kvEO9bCL|2)-HDr$eilE-Q_V
zHy3PMS09Rw?+3<9@A5B$GzpVIrVm({+ga|FpDDlCBuFP+=(HiVxu0P9b)q-v;}oWQ
zU>X9?3$)ohG$|#>BWTKQZP5c1Rc114?rEC4k~1@4f#!dYo>}I7_*<y+h_Z_<6~sfJ
ze5jSs&;tY*69ItJSS7>;27o5AOHKZYcTFi)3Fll)*3gForT|m`B0ZiBNXA0KcmSJR
zXk<44?$56SaNXr=x$IVstHS^h2mn+uz1z&177)FvBT$Q+69A9{07SsR?Ex~KE)eVn
z>Kr5rI8p}yXw)#@KLNC;0It9#Mx1WdL-jpRMsljWVKNyd0>w>NAb<`*HvTu_kZ`Zq
zR0#t_lkO!@xIPw$ksF|GCn&4M)si*%clQ~zQ#kS&0{~6epqy-&LREtMHFX^&O2Z|<
z`88<vtYYLfs1pFdX|4)Dx0?b0%RVZeyX5>K7%BuAzj^1(+YT5Oz$l&WjBGi_1AHI^
z+CmIWrV~bu1y8l!G4Ci>?XcR7A(zxbS&;#{qnRCnz9F%9euLdZP%yp@X-p?{s;9^Z
zddb<3;-*tP&CopW(_|<|y_e_}Fz$V!4PbC>iiK4M4g(m<yR(_v6I3ac(vbal7OfLu
zsqi+K1%}xmoi5~`5d$W+XB+hdQh@;GWZGdJfpJ(e+w_KO>7s`{dmsR66>FTN#VFnI
z%|YvhDj`A}ALx$*Vfx`%jW-_}Me|TT01Wq`PW7>ljt_=x3Hw$;mH$L-DX`0Ey9pMr
z4SU+f@6qH10O(+J?Z`2v<QN7uT?89O&rwACuHp@I3SDbD8nvOn)18&qpzOv_gd7x&
z!~&*t;7Q8&Xn`0ypaCt=$U5C>4+Wo&^|T%qRU()JFtk*|(9_thR|A)UB*Y9t0O#~D
ziz&f?TH9fGSg87LSR27w(|rjEV8cGUrV0njA>s^qj8%QqC~0!~nB?9Pk_<3;!_4Lb
zu^9zy=DHzsr4Jf1LJ(}PFraepp`MVT;?jZ$2^Dw|hS~tipag(@2GhrB!uHf)XKJue
z5a3h=9zX^_4+?Yj!wm=E%RrDh4v3cX1z^N&p~B=%ndAVs9B8VJhDiAs6CBJgXjCcJ
zkuwXP{eTkNPKUS}!T4|#(&=k`hIdZzZS6+zcwn^}fo)AS>s1#d?z)f4s8T#Z7$Isa
zK@+Z|_!3T6E;#Xn9mAvsHKS{A?$*^r=((4ZQKAhlVGTehX(I=6fWZ{S?JzI}5#SC1
zYpYT^Nn>c0C_Itm)dDyWn`yevz}}t_UsC4^7Z$Wj?t6$|S;JCJ#dM949&fF#aE!AO
z1uYsg0h?5rqBx$V@KGYw$5ZHpU_SPd3x%l4%B557YG0N@_vYUDKam4Aj0gG~9toNq
zt5F(+^e7@RWYXRKDg?ec<7K$uY*L1@xl}nD_<G31OOJjC1^>QPSACuuz#Nc2s|64R
zz%e>UAi(fi^X}?9tEFiw^G@?P%q}N@?MAGdY6nb4U06N+o6q3AQw;zT!&E-F%c%)l
zHmS_hA}s|BQ*C!JY5-}B(O2@XAk9nE*JvU2u1f7_V4TKYE>tMF)3_nlO#-9XJxDuj
z2r%ywOV*H3rwowp0#cD$#-^yHds&#L!E)IMe*s@tMSKn+nTduJB4v&-Vey^guqTOF
zWLwrf6RPR=%40$wJa!hn0k??lx(0QNQx>TMH|C`?p*46yW3AN*cgk-t3dO?Dz&8Om
znJZ!}^3!c~)18UB97XeRKJe|BXgX1V%a1u`j%lgQYPTZ_IhD9rZ`}MEwFK3o$$a8c
z!-CBj_!I=FE`fg2`VY}*(e552Avzd&9UIo(1*uliL}ZNhcY@#{LAlVnparZhy4bB`
z6A{6D({-MGM7orp>=MKV+yb@x72<7tmwY1Ta6sFDBSI38#=MpyhJr43XX$UKY$mf{
zmhUojYf<S8EQP=aDMg1MV+_#Ig=~0p6}v72yPQToB$qvcU#=wCF10adnoI}+S}EM0
zD|ISBp)r(bjG<gQa|q^D%rpm$X3cwB0Ws{+gQDwd3v~@E;PQ#9M|f&cOzcIh=rG`<
zWYjqhNZSJ7M1VER$-b!(6w7f=jfND50K0s9k@V$Hm9pi@_Wk<>iqfPdy30rhKyn2f
z`}OyV3n<Jnz+qD!3(Py6bSfolR&NXlvMR2G8JWN+P-B6$>eo3H4nA1y=B<&AL~ELK
zFzv-$lCfdBbki3yI`_lZge@HBrzr26Q19%-TllPXLhL`tGa0Y}gmj?CV{3tFOP8qk
z-X>6Tw)e23Rt_zvy7x0-@)>O9mRo(~BN4X7g$>Xa8@C+tJR^19lO_<AGaO2Z5CwpS
z7e5EV45z_7XrO;lymA_K{x0QWv~ytQ3h-vSmwzus2!?G6e3GkZY-^3Oie<)ND047X
z)$3n<wZ_%cvz^}j&(ZPwza5>a|2aCCLHrHIB{!OuR(6Gdj*idqdiMVu9mu>h)rNDN
z`{h4J2k?gE=&-4f9G&a`b94|lnMsb0{{YF+xunSH_bMkrI)JTzkPc>&xxqf9iBfd^
z{R5}T5)5|=rao*0l+y`Yo-o#d{#*kJ8<Dswxv#4mD(h}k#Qz)}(P8Qu=(aq4(|5`%
zqe@NQ&iSrjEsSet+Inn<{Nk<mUTM?2{~R6cMn>m|gaOPneNP=)I^g`-0RU7ZFrQj}
zenoP0z+YkSfh{CQ2g6R$NsH-JCOJC0NI`J-2<`UIQp^%P<}S(6IeibL>TxVx6QXtb
zpQGd1wB4*WGa`YRGg0^P!|37L$;vzCswseum<@_gY8vS`n$(G7E6is*65KApBuw!C
z93220?Kf!^H+wnvAEXlzYYel)06IO4omUX?lo|-U&2F}-0@dr!H}U@{9ngQ2PISf$
zr7DD=K*cln43_cybEaORjjb1Kfa*E`{Jh(%r6q<ae${Hh#<>PhwI6*Wt4HY{r33i+
zKT4<2^K0V{`~`{9!NkG|roTPe^T3lNO2@#(SQKO2F8_-}>G*$4l>>NzonSpAN(U^5
zHsjy@kJ9nKr8RKde<2q67s<09)2BhH+_~g2*7fbfBoNd2kJ4dl;y%PrnheejXr3SI
zIPTwpQO6+v68m(ao_m%s_GoWsV8Y4Hm@Xha8iUlsoc(c}VcGT??!F8(_^P~vW*PAq
zL|>1aB1DgpCyRMSA@ElZV-UnbWl@}+sHkZc7UvDxrXjODm5Ml|kUf32CmbV2Tt+Sl
zsUBu#uz~ve;`KtGG*2PYwY;gp2Z4tGUuOWKHulfj1~3WDfVkr@?hUK(bXr({D73Xi
zqI8zpU4kbaUXhV`I05HI4{sQ?k|>?RuWy@ts`LP`WuISkF3fe9dm8C3JSNGvDa`0P
zS0tvKFZzGz&H=l-!Uc?|TN-&3T*4SOfH~uVkbNN^k1H>r)9-EFhp)$xH~o*&S;_h^
zxwGR8=>o-hFi&eGy|^cM25}9sk4KYlf82JZW_imWb19gETbzpZt_4W}^29<YTx#)k
zVzD--WNC*4?NhP<WK7*ALWAl#oLFdvyqBRwkU=!&Q8BlYK%J1<(uGCQsZX<3cmIJp
zIsZVN2MW+%^Iu>J=??3oQ#vG22QxwfbxwD9Vo9J5h}cI0bpS$iE;7QJ?(IJGngp+P
z6K~p25Y`PJ$pAh&kC@Kuv$I{cshBNY=<X~0kN-d&x7q(dom211Dt}-!#^a6=;$9mQ
zq!Y+y!m{bPKG=cuvmt>xJTHA4B$0FfKppJL+Y|Ux8|=b&DN4wV5FBMJm9&|kEE<1p
zMxxFeB&BpEfrd<#3a5?6U4BcE3P+a-PUT1>oWiFF4x%_g(zK~O!GJ`7YM$inX1W;G
z;ZMD4atMH9N|H2$=E!mnEz$oqcL#9CxVBTe{Jzo92_2FYHHy7ct6}!Zdq2W1z}4FU
zt|??5M3BRPa=;f>NZNrz2gUR|Q@w^dV~!g?cz$&&1(`Y5v|0)U_$xqvj(0)!qRDJA
ziw7~YO+j}ydeLS+>d!ZzkS_n<J9C*Ij9`?N<ljvpa=uGvAhxx@7Wv9wQ;QmuL{(GR
zbgUkg$BHl*xJN#x8|@AwD2n>d&|^Fo9}<9&lkdMwz^Bp$Ae^ii`%*OVC?<UdoVti}
z2T1V5MF-gmUxs&6N{Qks5i)BoFG5{KW!cj1h=NnhskQYV<nCq#nb-3rL?ZySBw8l|
zO|Y3Fi20WUh_Uilp6TuXhwDHl$z1oZcRjdl(s0h|)T(j*gEu}V;X3Gc$CL{auH*Zv
zL-BNn0zgGW3Eop$tUv-8xLDYfK2h>T)6&S&argsBIXAFYzUrbYfSfw*34ORZ;zLXd
z41lBxAe!j^=j+VNJi$KYo~#a+cJBq`s6HeEnu~w|##~?o2bvE*U~j-EHyl#9$eG9^
ziwK#TX2bxYYI#<&uDx+|6c9RJhXAZXF-U0-^Qe0T4;JzZ2c!Xe-+PU!@s#sl29sQ!
zhYv}v4#IDB__2sp&D}HEkK@l2T}(-?&hAvPe#RBwbGa{bl{WQ$^pF0rI`)dArIRkX
za4G(yn)Kqqm&T|_#izxuO$2#1F4C`KCpWVBCqZRtMXy8Uc?c`v96ZsJT#IFs$*sbX
z@|7IE=VuwW^&ey$fB%&D_oLRBN>q3Q#!r9H1$siQguqg8gcN!`4`@Q*=~YgN_(@~w
zG+hbXKo%K*zyEar-vb=xmIWOIBmW8Mo_<R;*}NMmU@V+M0p~$3&;Yn<Ss<z%SdzCI
zd=g6r;;!vgX6JGRP%zSUPb)JjvCJvEDK%l@XdhUQ>9YjQq^E=2F5hI3Q&`u{USnaC
zMgpNra61cqp&b<9<%2iKR2sVbDGD&2ZY&w-#F8b33Ub7paFc(g`zZ+FFXAcT1bF%c
z6kP@o)a8L7ZDFDy>v--6xws5<9?YO=qbLN!1gUHje^u@MksVhzs`3i`$XvkLxA{j#
zzwp<%l4K<{bcqSfw<<#deR?RpDiN&KY$z}(Hde*Gb&8;`^Vrtc6C{6pho^d@A;1BB
zH2tVX!wUVuOw$GV@Jjp9sOoD?nzlz*JI^%AO{A)jdQTPp%2JuY9!HdniRCXC^j}Ml
zw;C(({cJhb)uD5DS+3DoApk#GJM$UWh*q<f!Z$M4N@uHI_Kgl_{&+*$)>akPDdZ#W
zCn%{x@zmV9jtcZ+%BuZ6K#nhAax;cTV2KVBRqhqlTX~BHFpszolTt1X(_rz_1{n%=
z-!!b5KyKQr$v1z;x2iOA1yO@)vz5L>YQY$FU0N%_^!~v0EPWq{3wc1^O1HYYD`zem
zJIQy%^@duUV5FhEQ@H#}?&DLRcixKCt~X0yxrrKWw?`rL$lc7KP6Rp2j)BTvoz>uj
zokmWo1o2PR_2aUWpRJOwj%_!mT%D<^KTz3^6Q&P4cHB2pos{h3IsU7ZnyS#L)~An{
z>BkeB55LS-?;qEFn&jJg)zw**J@!}Q!hmG(+;%g*B<f$BC2Eim9$SS=oHUfC=<{pL
z(-Q9ARPgA|X&<_J!$R~z4?+9Tjb<$8#wnt_hyH#ozAT^ss4dz%hP*{1ptebE6xYk#
z$%y5-Yr^R`6&o~>$R2%Is8Je_xRq{nbK}b($VI6YK~opE2jZj6DDM}Nt&2Ae-!gSX
z>&%T8)0@tMu0@xp9_J^jMb{2gMGl}WZI9&65v+`UG6V7}el%h^6z~r%%D9oblwZXq
z+{eRD?Mhu~?ph~v^M6Xc=fSV}=^0_}uhJ_YQ4+?Z1kqSH$}=E$ci!7|^A5+->_ikN
zy+D!1zxq15kMBDN8uSRClwY^0_RFkUGnTk?5gRMI;G=jdTITf_BNb%~<o#HjDSn?Y
z2Ko$AFsmhaXSq>ImEMC50Fss3VrXQI`RK>cl)Oov!*?3^AR8b0q*lz6ud>O?J8Zk7
zPk@vTg|l+6%S|{RyAB*hppyUE4)MJ(k9AuvvM=fx5+0T&c%whSI#0>YVk^v#4(sUZ
z!*_23sHWo?bc^9Zp0M>6^J&uX_UR!bhA1EV@a~fwI<5&dzkoRHJz-eEA*Fb<e5x3H
zjG{BHpVb)!<{@F@Jb$8T{l9=TSg<dxAcEd^-D1i#iYiQlDnTZ*j9#KO<pnuf&|p+-
z-WG!Xspw7NVSm~!ilUHQB^}5!$Yng@?gWKy4h6#%+nLtqw|Sl$?&uz?z?r`=7l-e^
z;y%m4S!6XheJf_Z#$#v`QdCU;8so#%32F5lCPE63JHnQQF=FIyG`<FSZiVSsV|XK-
zngI%GDNPVg<A*huGHMJ05;9WsUZxLENN7xxhrYltx)8A}w~tnlNx=$+O61L*X*h?a
zBCuRg&;3s6!~x5Pa^c%RIl!y;`}dpQ3aITrc$KIzoSz7>gTJoQNRKu^3-F|qEODAq
zJK14O$BL3C#2jlTTZ&ax`=bTxOpAr<6jPHJC7(}$3@a%wxC4j#)fm#rTplz~+aqdO
zLZm4Jc0Vv1`UBqsN-3x=FMqOl5mCY`-FV*)vW_ivA;!Zm?`^gM21Bdrk~2hYHN_k9
z7jm=JtBCG)6D0{&EjzN7$XM+{GD@)}Qy4!XVW;=RH}JIIRKOzFU}>hCDmGj0BQdcF
zs#IdKMDD*5Fb~BGSJzYHSO)J>vKR7~R1^CW{-9!67(?rhl{{%i4+(b2lBrk?xnfxL
zuI{zA>6A#hQUR&YhE{De-Ag)U*Q!681h&mSKR7AVl=@<k(KeUAuEVa@_rdMleZI)B
zq}?8vput<tdz>?*@{vgP{2bXgeS%V3IHF)BF9I9p9H@j4aV&sDx+@5UY{ktTlWrr&
z*CDaQN~^}8HL^=ewelXmJ>oush+(WZ^o2ezqS!bjR)?(L4Dm9t>3Q^G{b#3Q=W+G7
zh~u{#fB!0WgRUH6VeLe)rcy7g<}l`3`zAw_Qoq38Zz1(7^M!nSReIvz$TmN~Tuyu8
z8ZwL#k{@WB#1@9M*Ha#a%WwZc4BQT^+;O;z`#6)cc>1`I;`a4ER<E31R*j-$?b2|T
z)7{h6()8mA*{6*1wu2J<7VnaOhq64)Av3G5`B5F%@zwcKWvS;N_e-?X-t!97@@&n|
z#`-^B-}<SpeOUkTsKn{OjyH^UujW?=;m>~fW!Tc^cMsb^ori8wwUqSN!M<s3<HuBA
zxfaS&!&msitS*(%&7ISepP1pth3SP#6c6YJEF+LVPBWFx2OZxv^@MhR;rv-C!x_PK
z^~Y&BLE|tz%(#~}Yy&-{c8>b(MiIr+cRk`we_hHo9y3lWf8auOTq-fU^PCI5$IJF)
z8osu6zVkbf#{Hs@JFF|1$l8S;c8Roed!Ot+s}JoYCi0g<cV|K<4%cWF-RJsPQE9KP
z?z%V@P4KPZXb+$Ji1tcX@nTzso=brSr52`qlWlK+@G=OnWr|#gUeDdZpFzA%)%by+
zsWVSre7TEZd?7T`6<_EIW*N5d?PWE<v#e>+V+P@CIHgh~<Czxyc<ckL9t=Qa)EbgJ
z)uKte)G}6|4TtnnbP~Py7`{()>`V1s^JjzKcH6n@O7j45JKQzsGYH0EAsiA*{iyJc
zpsiv2CP$_lO<vLMy9FHHMLq`F=R_iwxkp6Wiha63;m{S`z=7U-3L!(J?k`Im0>mY^
zj)w_6(ID;wLaHvm(9L4Zc%PR%D%cLpc9T^jX_+ISh?SH8!w?-K_&MYGIqnw-wGB!g
zQu6rWxKFj{ucSqr*m%Al6yf17pyxwV6+iFjRcYy-uhJ&3A-Urg5?2JSDU@Jc-A{eD
zJUr&$Ia}_H__w87UT&;nZ}@}UKJXg$DO|th`M_P!yHC~wCs&B$*zA+k=@r=~XcS)J
zJmdQ$u4@anYcWJ}Np1D{kK2Uh-K6y(lYWc}k?)B()kc}xJUT=|)Ibr^czz`T-J7Ml
zm4n8*B_1tA-CkO`?*J}~!4$h&`h%nTvD+R=r9zQf&{7mr)k1*(1YFHZVWL;Wx=-p5
zz;56W)}aM^P;j|liroaUFZJ9o+45F%^Fde|DwJ8temEPk)%W)Zswm{w^}JsBEYWU<
z*KJ47+f(AUmO8Z&{V5q^T%Yk-uL=>Pu&b?3)NV$(GT5gI<MbTg%}JRri1fqh4O5s!
zcdWoKT<r^No`Y`0Zn6anCG~7t<Afg7@rl*BI&cYd-_{be#<QH@>EeXm%3bzcvBn2Q
z4@z-up|tQ$k3UKfyZPU+?m&90>4fhN3cK~%idzT=74ctb<>PwsOzH=_U)Ezk28w&{
z+=SY!<<qdY7oKW_YtgUus?7n!YY7_dTZpU|PQAq_Z|!jQjbFy55>y#?V_$|aJmvJ;
zpeklnV#sg}DpYQ>eY7?6C|D;fwrq;;4t<q2G$f0q-8$b3d*NvkMB@gNBU|t&L76(s
zm!VvE-pQ{`g=mOI&t!5wx)nW|Ao`po=4Lt85iMr9T|NC=vno*m-lxJ=qPeU6)1Yr!
zJyj4ps0c{ZB!Ut(hSUuDWE+Hbi1;)w(bS*2@FVEJG=~iXOztPtu=sK@ZObzKW=X1P
z`k=hn6TONjIIzc+xq>6)=NlDTPM@F9K!qe-vtuiA5<cCt_xh3fIV;7Ba=Evvq9V7`
zOTSYjuPHX~o!4Cw*Rxdd{6MVWXGMYETFT#wLWVClpNkX;ixoKwa^-0kD^!+<Kgm+@
zF4d^KCj4PrGOc|;8)Gj1@)7Sdg)c9Iy(JhxLI$RE6XpdZo9eK;C9d+-j6JF7kR;^@
z=_PMlPY+H23#P?i|EzrdSKRwzXOrAAYM2>~?z=yA1F}tc_H?4|Hkl>xRYNDFSlGMK
zR02FWxVbx1JKn=B?x8-NsS!S?D5)(Mvna9K$12C))Z{~E;$7T(`RZ*}fp|mj=7TvY
z`h0Zl2X_+Jqh_UvMnMKZlJ8#iWSNySdH3?%{cM59o2GQeg1ZuINL<euWJgA}YH)O{
ziphKEKEyIhZ_uv_y(_viH(_=#rHIBhS=&4$f6vf}f?WuXEL2St+tk($N|N_XywJ0r
ze<uw1=uY7~>G$Li%1)V|9wJ)3?f43NcN&v)7pzhZ-jVb%sGbn-4P};EY#VI$EWz$c
z;+Cwi|2aKI`QT;TAXhtKd)Not0Ay&uVB&nyYT6Lyp7dVYbw9|OaGI<eH@Z-3>V2$+
z2acuCTQE8cEo#MC${5DCh~wB(tM$s|c{kk#p0&JO{1{vf0gB>WeSMTDacn}~X?`kv
zhz`lS*m2N%=VG*@GkSM_cDM#ycW{2{N~+q;D%P^&d!h-qmEY@~Cw{p4`N}sk1J9$L
ztK56iNj)&f8t)S+>>NmV0kD(>US79f6^FB@$1WFFe`0~|GWc!&E#^k($34c~?9ku7
z;(RE31>Js?zN2?xuabSgP@!R05{}<W>m~Y4NbPDj-kk^}&cbVxHFIkEX=*igUkm=w
z*2He9H}*t6M+2LI_)U-1aS-J_+)+jPuos?+P^%e^lk>QWrQ=4wkNuiJ`YXt~x>r=!
zFUlJ?#!BqlvRwTnk5Y>?gP!8HYx+dEF13W0zIk)`Z5>?Yjn)%x5ZWsKqH=nu@<3!W
zl5C&(2pVST6JAUC3QCo6NS%8~mFQ1HYXMuce5c1EF8x}wUCUgI5e@IVT2@CYh=x8$
zTz)J`f_fH;^<*0G`wYXC*RyE|dWez(K62ba^_A*vXOW`0VVT3zN9JeeHJ>_2R!^_+
zVHNOPI*X;}`yk=y-GS(DZN#?Cxo`$2^U#9{J5G-b&G8<G0a=YwBqXgD4k>4`em;!_
z3(ekVKI)Ne_zpMDzUps;4%atb@0I%W{Yu8*ABuab#({#?fr(D_^0%(Z3&bhS0eBI7
z$(;x4^WBndfaWqN?_rhG&SFH?<^3cLmpeBei&~k(thH&j!3%Y-yr`}ooohpkZPZ#Y
z3>(*uw(x3ZC?Pjlt<8Fkg0hgi^*VR1Df(Q~WwoHG8k2PuV<cx1KeQVu!yu*u&>jt%
zcjYi^Yl^O7BVVvnxWPzalv-1tbwsZeT<GmuFINK)tALXu@7-Fq7nD3Qp<UFB(27d_
z=y?M#)1=Kg&Y$Uxr?^$8q4OMQ#P4;2=fQ~iz_pdAkEE*mtgXB_$gyhqqNci97DZ%2
zHnNnNS2^DXTxlkV9CuH5So07>jWXoW+l|X9Ung|Gdlw#%9h0;koRgCYN$ZhvnG$Iy
zBot{e%J{qg?sIo|XUKg?c812&VPc2me^S4dqCDz}nj2Fh=xJbM>8Ko5MllLYH(WI-
zT|OWve#<j@=y$~7S*-Ei-AD3_S0=9<a1I5a>FzsjT+4ca@jGr}8GZ1^?ejwISetZn
z!^F{5Wks{H6GYv~VC9ulVeFeTq<jP!@5P`<X*wtO^6Z(OqzKj@`I3PpNMT(IGK^VB
zLqYOxLg9pF@p^?NEXnhcJnY`Np)aTt=p%Z=N@|`h3CLyJ1Ctc@@n>h>4y51JhAg43
z8Px`s-P24%<z+JS)&{M#{cynh>R)wl6K~es!-?Fvx?j@}G+A?<cI@jqiw{IWh_#RY
z3+1h-LF(*u!oVe~^h>E!JeXIm&MPtY_9g$Md-4N7t81Y7lL67sozliuxf%`KDuP(`
zOy(?s`^OCTlQtBh)`)(u^$cj447QMOYLtDup6P$sc=}uWna`$VOZRQ}imMU1%$s(R
zt5z}>V4aVl5i#E<?5g8GXtT39&|eVf!N9tC5c_F&$x8=XB9eYw60HC<TE>1KRy59E
z;Dh(@**;=Yvm-%JW{RQEesgF8S$0|0%Q60l?RB+w5Lb5(uTkdJG%Y50Vo)jOe#ab7
zmK%heEXzWF$^`W|qb2^K`I+8B%_<{Ed#~axuQTuFq~Cpav(KcW`U<nt<(`Ci5drr!
zDTP*<n=39Cq{5n*gLtnopAD2D-x3I#g<(lJy^Q)qT67=bPVZaFR?6ibF2n<xI3{HQ
zRt?cbmFOFdZ!y*B$4P`i^nTdWTQ4*VmG8Y>gjqJXI%c(E)X<I>f#z=&&}u{a{A4o=
zGFNzw<?l75>d}uLNSy-4byIjcp?~)Epr<v#-jtgO4dtxZSwsBvw;`!QKLH)wZ66TB
zRP&HLC6mU_C$mG!4?sS~&h&5;Z8(;0=?2H$bE#7O%2gDCi;Pi}l`-j5Dk;QaQth{7
z1ii6M!7EDRKZ6qCgH5wF^9+yZk)<2Ayh5WWJ6C~;xq8CG$X2P^)=zp+$M@Y)S|ON+
z5cp-!@e+!5O~kKoVIDiUrKoX!0S<G_au`T{@<EmI20kPI*TizB@;yatD^hJ-8`^@T
zX`fST=|%%cZ)gKuLvAo-;^^vGn`A^o0=Tg6S=Z|9_f?oD_2v6St9+lHZSZX~6QILr
zgxB2cfLVscufDE3A$4WlvhW@Wa_sU9!aqDSJTYp%V1a86#<0e<tP~+A*+)i^8AG3C
z0P4>(^Sxk}3xT+4#n3W-N$h_~&*&nRP&W0c*ECn`%JVX+6CvFMJ^9CXdqt8N#Z?Q~
z{z*Bvjh|lgT4)G`-7(EqW!(BYQjgFm`a7&6zGODoo^}4@%E|JZ4Xc;bPi6NO;g{%}
zIe$)M96y;Aw7~z+yc1Bpwr(udZ14W#lLVDkGsP^&lS<}$&K+`#@vFaC{at(TtSj-`
zV-$=$9=9XJmbPb$(#kC*CBBQtDR3R{wHSndU0@xR4+)=PlAVF~r8^Rdv%8Q2cxi+#
z4SVT8JG`9y9iOAQ%L}vM$8etjiI^@kKIY%K8CrU|@B;pkZmfXSbyX?v@IQaJ!$Xcf
zjPTA4-n#x+&}@}W>XN6kM*-D2hty@u%*y!({;>QXDTj>xv2dK=Gut6n9Nn`R0>XT=
zh*#>b!%ONYCb8mp!GkafttJHB7L4W(%DgA|VnndF#@V8Z+V@cAi1|{Zm-ZmT^J9)k
zTnNrqk4sj;jzG9$Ucm<me-=Vf5R`R9$*ZB!I@T@zPs+*atoT|k*|A2=>kC%>T2<0!
zU(O@b<(M&{@Se`UCe}H@>Rt4%TEg}3Cuii$Pri5+7nu1UV(G$9HbDe24zGURF?b$@
zq(%sO>z(3%QjWZn6&DYDs|Y-#z@0f~X`=q)ZF!`YsF}6Xe^QQA`D~0<F7u*e(EH3q
z=ZHVdORkIYk{LEsGoRAL7?cCqRbL#=@mhDDZjU?Q{~sx5zUdjfH0&nVod}ElY7TzB
z0V`|V;STMusy|ulkM=uQH^P6sZ+_veW`g3nr1gPV<#Jqj@x!9LO|;}RWKZrmM+!a9
z*-DV=WV<EtYI@RDO5F0gVz?zFklie_7Q}4rEGD{@<P^#NF~{?{@`vO<pIe@ZDIDF&
z5W6tkg7K^S;tM0^?mqokn(0g`t;~Nn_c5h0{RNoa`}7_QtA{IeR2UfqY2`pfJo`UV
z4lwZR_>KAh|D>EQ?q6#`8~MN1BQCj5i7~v-Pq+RxMs8=iJU_eqm><P+zFSuC{QOIG
z7tim##*OE{4>~S+E)EBH3ogD-X#VSebSe1r^L-TW-_xCfg1_hcUA&hUKQ;<3|Ngn;
zCGqt{0JSX=!~?-nTNBCHmynbi5FGRgkzC9cMe7W~v(FL1%1bE5NJumve3Q!1RtxqV
z5+i24Nn^L9#o7spm3gvB=VhzSxeg&H&uub<E@|`rg~XxYTab8L9RVI_yrK0L)5bQv
zg+CeVlIs@yw?5+|wrH4ZS}#j;2;l}>e}Xk!;3B06EavaVyyTCE*Z32zR~0h_EV=Vt
zSWsUv*kov6`@l0x$tZQbhki-=7H`NVW2nJ2@1X6iOTOYGeQCtw)O7d;e@jb(szDJW
z#pgceQb4Re+x=v-ZGI6!yX%J*mNedRdg2|MsYdrLXo?Rh6<S=u_b!eyUd-+MMAzw>
zs_|$2wH1=IvV*vO*Mc}a@igiNri62qKAjAwR_U%w#SMR8n{Ls+7NnJOJM!8y<dLu@
zpxz_|;gP!`NRSV5H;ppS$fv=IXq7J;-ya4^ubmJy9#$BI4yUvDwcupF7>r9beP^?@
zjTW&C9mqllJpHC7YJ85Mz~S&T4%-7PV;&hcOc{l0b^?Mw9#0wbc$Cy`YZ(OKXvL=L
ziX}}9jG>kmw(CIdN1umSz6CI*{0z+gE=sP@eOVZbBkwD8Y$;ZhHl$VQ)PY+{<54&H
z=5ykT87=q9I8y>rHK?>iUWN1vD1{R0nk-8#5nj&532DjBo6wk+5_oASEW3BEn6BtE
zN}PkBPsLwy8zJHxEFKfK{oxhzy^z|?03$`mbe^c~EyJDw3Y4or@>RYemL7{V`N(PB
z9%8?^%GcDesb01rBDq2miZ;Zx<aGm)QtBjRZaV8{Lxq!+G8&p3Q&pGtLbuwxEX3Y)
zYKsRfbLBqs8@*fII9QLgfkw(EwJ1k)UFKo*J$ioonc|ZcPW1|u0tW%NCQw3NRudEu
zu)bNdz)NzcM0BvjZ_jVNHa#IX`sJN=nXtgZlUKEWKf?hMIiAh3ZC>+``7Y#coEDr&
z{CxLE3#0uZt}c&Qqq$p0W6A~Mq`tWaF{#rN)9Isk6y29<4Iu=c-zvfRi}9#$J~khG
znD|MOT#`1P!M29~MINTitPGjO9auM{sV8omD-lCHZ+RTK&Cm8uY)8scnNRqmyAaKH
z3$gI;JbByhVSfTVl3Du49k}kHM#I)m+L*EmqQA4)08^9hPdEQ6^Sb`2e59R(*)>Y-
zid3(S1b*yGa#Yg`7y7zg!qM=Ot89p6AkXH}IP-`Am_NZS{)X6G3*xX)SIEE%68rc2
z3r<riNtMrxH#bl@clrnQTDuuVuU_^x%Eagk!D$%yf8EM-%=y9Y+o9{&*T<O&k<-FB
zq&d80$-yBgrCYi7y^OG9<KR-oM`9HB){7XwFNv~UOpmFq32;P6>sG~>_(V$2k1R=p
zgx`-2YOQUiSf^1cbxR%G)O48hwvAB}6*E$Ic)*(%O`-I0fA#OV-PDbk#>R^M)bdKc
z{+k`!+{Jtz5x+mAq#}mW1)R1Gjj*u8a?$LVD)7B=rIu$0McGGj)+(bQ*3{iTZgLB1
z+>AD9V=G+6%Abm_sq0{Uxz92J+##EtgBK`B>1VF*zc_{qPh^$5(aPR)JYFex<_(gu
zfl}6o-AZok5J3I1aDoll(_C8bf~2bKf?m9xqo;7&edcCtEG@ah>-(#JH9zHj9$}4_
zQZY8Vtd_=p_$ZNa=w4w(f__vS_g)6&evz_6nkx9iwsOqFk>3H|CDwmEF3f*8?%CO=
z6G-YlT~d1C<^@(}!4>t(iECf+n%$;p&2WWuDi-c-wCi;Yc7Zz&2`(2^s*k>cHwBq<
z?#+F+=_+*CZg}tq=qMJ*_ta99O6uc#-6+X|v-R>XhG8SWlAmF@w*5s*CfWY(YI3CA
zzbM_R3-J6nX8HZ^7()EuJbJP`?EsOK^0m#3#vjPjwEGmEc4C^6r;w0xrJ`v&?uY$V
zf^%wOY4T6H(d>{-hJ(9_m%;b=PLoEMXclfua3qjgJyQ$Q?tMu}qWIH8;WmZ%iQ=J=
z94nk0a<4^*8m0~dS?%Mg{`62e#B&w*P=9kv?!KESow%-GbkQQkp(8cqCrz2Wne<%j
z>6#hMI4$3T8FjNkar6}LIB72-dF1T<JqgPzOH+`-$95<N5WAPvgr0uvPyGk`*smt}
zU^8XqD{wx6_q6sK-Pc9alnJ8rmvannl|M-NFjfsRiQ^;B@P?AscyW3PX58>!N#41t
z;<Z9voH_Up793R#m-!60N>6SxqRH8#EV#?UyH6wTw!T1L5nRU_1xafdraQ+j=<rSd
z1Xi>l;g||GmpaBvcNyM;I9g+4x)Dg(J1X{OG_Q3X;_+t&HEhPN!O^I3WrzuliUi|p
z0A2rHX=FNUnd|#lL;8=&W5qP7qoX-(af!kZ`rj!j#OfLGX(k^7_)Q=m>@n;ho(o-*
zn1p(xgJofoU1f70szE&8Hko)g!uer}w^IBp^16Ubyg;B#gLeSmcHD23$IQy{wBj>x
z$2a_p?#cZYmGC598om;mqD_sNq#9S~l(!(ss<Yjri8iK-KS12SFTz<P(1A(`4q$Qe
zhN{iHGEMvaJ#A(U3I8H4JXy{k&?CfK)O~X^m8GcrfbT*am1vMU%yU$M;~Nk!DsFj=
zzz@@rV_7c!dtkve5OF?^Za3!Jk_Y@WA_siW8Lr73yZ>b<mSNwL`Q;`vX#^KJmhse*
zb?K#a!SO1<M6P7?!Ern)U)qIdg+frvYDU!uvT^5=>m&<E_%UpuoUyoQrUuZ^O*ooE
zCbksT*wzyqt;i(|;l>cf0ZP_`!g89T9?UEuI#6j+l<hDe@x`d}>*I$WS2>z9R7<7@
zBvTU00djR2YKi)AC9&*LEA@0ro@asT8!(LzRvMo&G``MiC};43B_vKV_)Y^UU8*#{
zSs_0OLt91DLfkU}_xP^Y&ApSj=yqLZ=zU2Sn6==GygKK_H2r@ZphH6urUoIl6U3!$
z@_!Ie_q9oh90nYz4pRG;oEOtkMf+hQ$77m<!k+&@K+mbU6%6TH%zmz67FqV$#z_zm
zU+X^z2vNx~H}77d{tp5|5u-=4!oR$lE2MuY!!hofkpk2YYCxzwVfVB)IgZhLJwi_l
z)SBonPpV<8to#Q7<pd<#Q`3!OF8)D4MagI^O=U6-hHgjjLCsoWngP6`w&$gPeeslA
z<{XiYiH1%bRlYS>F1QDc9>20^ZT+^)Bw$Y;IP$m@NvlfBeOh$c8CRi$tvD&qe)G9(
zoQaN{xk}LZ`u`jtrO#|!H>$(M5&s;ZP2E3yMJuo1m+uibHu<i<5?9xsx34d=hIx~|
z=6XpGP-SIi`(|TWP=R?$#mcLj*;Ni_ZibWQ*FVJN-5h}#%#|T-6phN;Wy=?ZkL|WF
z^=@Mq#euz4-|cC$Y?v&FDkn5G<vg=e3_mx4o_k~8H)+NJtm321E!{>F<*&T!(p&CA
zYq~3#GTXh=S*{qi)gUvshn;nUhv0iOWL_?`#csceZm{d{5G*a#f@@gtO`0dk2Y~dr
z>y=swEMTvS$Tv-+<t)I)HKh^y`w3j);!jJT@T$43r@TQ_j=o7?&Zq$-$3jwX2WQ2l
z7oGxhyr(rIvV8HLx~#{F^pbpA3Vzend<!@IE;D`j)arQ;n|v=>{6RMUl-d5Yi~fwP
z0Wg~Y*6aYz#Q<K``vNxiMY8WpEZ)D$8hFhnP%%4Dbumzr^?|m{1Ck(PwD`b`HOR^)
z$R<0;VKK;sHTafI@SW^npT*#NtPcZi9zM)|7`FH@iZujp6GF%iNn8veMRqf6LbJ0&
za~DGkSRavMx-YXIy;^+qnpOKfDvVYu?Cl~i$*SmL4Ifwx8+jPkv&h{-s+C_1pKXr#
zQ^fwPCt^7}Vxu|o^TY57n~08Ikwc1+pB{$)&W<`}japp9P@ZC%e?|TJ6;7>$;bz13
zvEn$Du(J=b6l@p)CA^p|j#mlGt`zZ}FY+=M7`?F=DWViD(h@DRgxgt+wm6MZZ^6sw
zU~O8$>l7t)kOcM~UNn-RiveF?p^>)amOZ?2In)=Mba5^0GuXJvZr&VB+$<k+Tn-_^
zmVgh5iy|>Or*RKk2vN3)@hyo_O7YpJgxu5kl8}T~r-awGNijJ|UABab)8sy-#GRbP
z&$i_6a^mw(2_%drDkq_uEfq_`uUnEx1-hF`sm-?OXG^KGY-vHZX{$?Vb!_Q;t#LwU
ziAA;<y4}2MN{{11lEju1r)>$dMeGY9X+a@R=$D_smeUnOQ>@NXo!B$J*=CrvKAAYp
zV6=N;*qU+YX~sNT&J8<qTf6MbD5b1#OF8-Mgg{&J+pdgrJyf@mxyeXwIaF?=9c*qh
z_f9v-_F){fW65*Nd%a9MxXj*umit;cx4AWUNI9=-nQ9x!eIG%p*@VskX_JtJbx3YK
zR3XJ9c<ou?k7X#s3f27{cCPb+o$jLio<hd+0?;E8rBei3Df;oW;17Et<Fmr697W9b
zh3qRueD=lj*kZ<&Vh8(@<ib)_j<Vy>g5Sy|hR;eES4vpzxjD`Y?Kn!D+KNr=OYgM3
zh&X?NQlSh!FAO^`<$hE_@vPiRrCdUV)&9JU!oE`XStYGXY0<M6UFR?B?8~cFiWA#j
zB_m!W+E+}pRRlh(YF#e8>^ggX)cU+jIe(}%Z}KcRAH}j@$Gviv`^!G}b!cAea;{tG
zGprV29`!~f_l?Bro2#7l*Bt5<bL&-C>oqwWv>h7sa~q6S8_YNxtsEL{avL318?{&K
zc*8`Vp;(+(o9=No2RbxA%xw-^ZI0q>!8>rfJ2VC2nqoLxGaOnc&Iooyx^YxP{c@RZ
zH@oC2mrh}xNEqWY2Zln<#xMkBZ74V^w|#82-7vQ$@wYJl@AlQz4zsYgldg=9kmS9}
z4Kc3mJD9d=&bML?T|1oAIz&24&UX9?WSx@)gSB_K($6`FEIITDIQEK#y$wWhd!V|n
za#7p5f_p<dpSprC^Ln7s7>Y+k);VC;%eQU7FvjuCwt9y*KYsU5@KKrq+U&U6qKasp
zG1R7x+;n`D&fT<cP~0t>d6T3|tkPx?hXP$0oe`AYtHXC(scSLR!dzqZ;SJmuJ-W!T
zuC<P42Zo<WDji}$GO?o3jyubis=b@t7C=i^)Me$^mA}cV1E9^ag*mTv>2?owAjuzZ
zzB_L3{I&ed4naBI1Jwagw~=_8@aYb~RA25pcBgl*)n-Jv#})HuMOLXE=Zr0`j;ZF)
z;lthr<xsQ(+FDVtb_|87>%<?&HyJ&U(wq^A_v|NO<8`@{A`XK>oKsP##pYGogNyDA
z>~M1T;N?7DcdHw<ZTEl~X6D#o!39Y*=SF>ZjSJE-_co$;R&~zPo!)hAb?i@5vja=J
z1NS%<Y>Q+VRa<C9aYv$7=&=-j`78OrsSYCDyKd+s^+8W3?%h?cpB)?Az&^$c*2o?%
z1Fp6*B~FF#_pRKEzs^=N-w(9DUsL?s-lM+8NER`j{XxI8Q6le6eo<<a8(62CE6a9W
zA4UEX@UfMBQ65FU-JScZy(_}0`xi3d$MVO3&b|rYs5~F#?QX8Ws}NJ-3TwpTOQ!*;
z=dB$85~b8`$n!O3^+RhrI~(7V_?);_<*!4L4b7`VBERWOiR4M$lTMNE$GAp|oZ7yw
zaa~saoo)pZUpf$6h;-W>2SFj!&Yk0d-OLN`X-$#j(FpcAKF&&wk-o5lU#gTf`J6dK
z@+?>IBg~#+RC9A@i?SVI$nJzM@7Tzt;Yg#t9`#;km22Cn!J+GoQ`8%`f;XN~_4GZo
zi1T%mf?p1+?1#h;4$3D-BnYVIG?n*k2zwG%a2BS?N;(^7iYUr0I5*_%qb?Yu45doY
zJbSxwn%zapWqthz0bz#+c>k#8#&Nc{P%bmI^Zw1;81o71byE8W0XaHe{wlcqy>SWb
z&FjXJ(~_hdf7d3D5hj&zDw(am7<wW5_Bac^z9cSHm9<@&;<ofJS}dizX{DE=nUW4|
z;nY@T_3HdOwv{9O`Ca*HVdodra^+J+I*A<W333%PWyZNG5j66Za~0OF>^l<X#bD5D
z?#cg2Ij^+`-=FYHydX(AE-F@c$UiMN_<mi9Ia8>i5)S-!{zp~zwIdV_<gAfsxvgTN
zx62dB^?$K<A6!udYMQ7wQ~_1Qsv_qiXC&vG1OzOCWF;d}q6i97MG=Y|B_kP;jDSSR
zSwNx$MM+9lKvXcml;@njw|nMH_r2YxXL{C}f3WvnYkzBp_j?~xv3Su)R?Y4%iALN|
zqWFU;@>W+XXUT7_%83dsdkZx-oewD#pC3H2(N1`g_|tWgF;~UzwUm>Nyt7S8PVHDr
z>*tZ)C~Da{#dH6UeKGW^-8Scey_2=f?6S_SS%)#5s>xG%O5gWhjm25?ygUC|U#4A?
zlc?Hr@%z`$pO;if)5-ZQ+B?M2Q3*WjJeQjW4o9`+Q2(2;kJch6tiP>YgMTtdTGGb#
z7GW9tn>j34XP+Q(^hpe+vDBQ|C6FmOEJwU>d+<gK$7?q(JvkGG%><=ya<j=!Lnfw@
z1fpZk=|(D0myD(v`#Fp`=MJrlByOox_*Qnn94wOoXOL;@=U$p+ABW`4alIqIh4qM*
z=e^^SRLYYpJT>N8(7uj&0x5vYr)BL<yKm>+Pa3_QM{G^V?}9~m@RuaVsbMp6?~J=Y
zdHis^P{{VCo?yiK0?l?%FB~^<&w?|c3i8ybwF=VMY%N$bI@w`c+uGq#URU{TN2soR
zgJa!BhK@`)r}1Quxv4w}dvIs`*(JYs!@4-3N9((XWOv#&OhPuA>jf>R*lcbouG%n9
z0hR6il&POO_S!pbx=ze3>*)_fW3E{I$bDJgaq+HtsuOhGW}Q4<<cC%7(YT^f-?ucr
z<NkKRod#amgUrTuSr@@OW4wh4{^K?6rqn|;J{<3QvO)wRgc^SAN?3{&3P?Ijy*Y53
zQW)ua`%0FK_4O2exNG3F2D3$O(e#f6sVRA(um+zST!!!EjIWP3(@V3z@JSOaOblA_
zsDDAt#pyO7eWx+sBT3k_p6A;9jbYZ;Z>1N)TCGF4Zr^?TFdmR|#V(r3EynPvG`&mY
zN;GKUtfX#ROZ!6cdNW9<TYmf0>N2VQcKqjpfZ*?qllS-Qdfsg@RmK}t`1yH<EV1oz
zo6gZSo4WnXY5)B0=Vu6Ua;HPb7tx5%!*emeg2$=f|N6q8<POe{p49p^_-gZh=P6pm
zuInq*v0mB!?Uzr=v$D064}P7zx*l$BCgb_SQhaJUz*#DGny6{(diax#_cvWl(gCBX
z;Gg^Kw=SOa5=56{NFs{>9!RDoBgVtA`c`|*RrO9J3{5|X3{Gk4>ztmz=4%pH?2!yG
zjQd7wv=>5sN{d9wO3B!5Vue#ABdHw4ViXUG^&j#xap<Sul=7Jn%VmQE5;HjN5J#8~
z4(WWCgY^Nd&{|)LUD#+QRxRPu@j{S9P4s@F_9&F=y{)bU)3{$!p!3a_4Q@#2?i5dN
zs<x!-nvPPmb}~~ghMgc*RXqut5-PRD4thGO{mC_1WOtK`I#$~@_O>nr%=8vKHma|H
zNKHLW@srt2GwR<<_p8=pwS&I2jNVTwKSjm40_~~4k_}tBCS!ch<<kzH3BLfF1f$(^
z9O&k<ZO6(LGTJAgbSTyX517B@(@{GG>fD)M;}?|z>6G1u5p@~m@~>j2cxU``peOpi
zT@5jev96dGUQZUE(_Ftj(Uhm=&!_TXneSo$XyFmKat>^bFNN4Fc#uN$1vzGP4JK9i
zlcqA}s0bCU(0nhu?56zX9276*oJ#K>@cN}tt0@I$6!IA&Tg*LX3sO<#bYII2Oi4}C
zhsW=oCJ5-;S)1B@YK~<1wWFIHH(#bxUM744b=}jt_=&YtmAW$QM)i+MjxI>`a7LB3
zyzB5b<Bg}zBGp!yezUr&yR~>J$L2k$MO@<7n!wt9<2k0qu06bzb69OBFKf|B8r0A@
zxNk=lkC$?S8r3O;9oWg18JIE~GiqyGuEbll$048PAA0@f&0C(13u-Pqtaeh4Uzx8U
zZ!Y()^|T{<WBu5?rMcF-)sp!Q-nnV*y1VS<P4*T~fVI95sq;&&e)FF6Ui-u$m0v2^
z>W+TavvKdbyY<&DP2L#X>wJ4y=U5%TdK5=5^y+I}$gB8wjuH2|4!rA4$MfEujo<4Y
zwyA&cIo__MH>>;CVSTus%lluX!MzttpTnsV>@SJ4d&%$AW2nj3A$j-uDC)$5*zuB-
z=UE%g^M;tL_;rf-;KBOCqnPWqZ(!-cL&DuPvBu<1ud3RH5+<==?q1@zwj0A%ZHC0$
zD2z9b2!!Yb5+D5BU=TWQlvMF|Yytp)g+SH|1_1WHc?5tx5CVD0)2syWeU=%!CK_-v
zPxxbxhSj*)Yl+N}5*L7hQJ5R&pFPK7Bas*K%2`|T@p;Ebf%nlAccz{d<Q+fq9z354
z52}59PQIIZ`J;U%gd#An-fKr>JD3G+DOJw;Vp%uddU)k`pu33jj>bU9OCY7!LJamn
zB(I}6nXRRk%x2Fjo^HX3L#o2Ud)rQmYwFqS7B|nZedkwxv%|N9>W4P=W#f6K%vA`B
zq4wLZF?7r0pPoAh)Ox>EQ52q$ks@yH0-ykrfSf<5P2{Dw&r6$!6A$m9Mkq4<>zTl`
zOV2XHr|;;z$!k1*+}dYj@fkx#^WJXedouwLp(JcgM_?g$S2OG=p;U66E}3^=Wc{eY
zjS(D|bOIVSK28d!-(>QU7nZL(x%E(K%bxLEPE8CTIF<V#uIklylkzmJuWLKiHh{<;
z9a!eGa=D1m?U)^L_~NbmTS$qo!`+JQv?lz`Ud+va8Yku3cHzq7b<f)^tETS0xUk*#
z`aVBB_fV6c%KlRzz1q@m!|&}D_ADd-03AL-w+|H5d-`;)m!E#?6M8%prP{T*0R1#{
zP32=^c-M!^^s_NfmHtOPUE5#N&nM$AdI~PPcAcny%v3+@E?0fAZ<YRI;pIhFZTO4B
z>(oD&_aAn)^t||7o%VB;jJ^HE<%{ED#IJRs!qy?x?k`zszdl@Je?EzqauN~0cRdT6
z7kawCW7B>g#<MrAUUr{{ATExp3)d`Fdw$xaU*M&j?Zfb%-^SFJ=lkLHA9{Mee(4D(
zI5Yo^mvW{^(1bX&hc=qXEfl|YNo8qDHj3`vM#J1NGu#+zw+FPr7*<Pt#!5`x2!>5J
z!V(<8;dY<PGD1jB4NvAgei9+fkL}rvxZ)NfE{Bz0(*JrJt6XW9`UI;Ud{;#`@~VTT
z1}-v`=&JT;q-G<n!=p%J%Nx4=U_-Yk)kfMS?kF2K<I#Q*3rO?@QgCV@$_000eVx<+
z5-ltVa@~ne9Kw3+U~SZ+ecWPRL<%2q#Td#VB~wiAL2$2~WF7=ZJu{8L;BbgCg~+yO
z>EftZNbDz5YK1<W#Zt^I+SnXjL0wKleUn)G9huFt*wSptg|z5GhUns8?XuChdjCto
zC%8BVIizhP5o#$eb;+cFA^yP*WwCBNf|jh0KVd*OVaP3E1eY*YnecKnVR9$o6(n(n
zKXFbsaltKd5tq1JnfPWjan&s`6A-vx8q>)i^QnQj1;esinY2HebhwlB8IpX=pZrBP
z`Kw#<cU<y$W%AF_<lj5Vmyi?!ffSHlO7=724Be!{9m+c2B!jgSDrhQPAeH(&McM&O
zADhbfG?n=&J<V<^J2Z{PJ(Wc-jVYFzBQ{NdF_p_IO(Y~u5Sq?DmL_7Ac7-ur)+#kZ
zBVDweUT!xX7DCABOQ_M1&b$ng?juy)#ml)F+D}uj3J~f+(>)uA6V_s(v6qjwc(}qb
zT4%=8=$SCPbNWfXOee+|D`RR(8tR*j%pXT-J;o5aW>NL)nZ)yS{yC3Amf6i5v+iQD
znv65=!85a*GAmmjnaw>2g=UEyXL$=KhP7wPaWLO)&yM2ExgVQzuAcKSBnK@(m|;eL
ze?7-OB=bpew%~k@(3k8-R@zT@vwZ~Q>h!Xz8S^Sqb6Vw@^I~P6L7AH%xt_)J7EosC
z<2)~p+=k*jubJ$+)cjQUyj;D!D~<W-j0K|N1#PhfwKMsz$MPE2^St5tXU7G_^0-l}
zf+_i|dT7qu^ZXx;1+~kM&yF8wG8Qho7gmcG9_2j#DgIa-{`h>R(Bt^Ba2}es11%sL
zfBdtZ{c}jcNyy{Vr$yfdil3$yQjiu6?iPLsDK3QOGwB!Y?`p2f=RufCzP1-_yBAaH
zmk1~ni+IqI3zjfj=W~k}{faFXGcFY*ErG4Di+Pm%D$WzGDjnx66ZI%FnaS4{d@S36
zkoPEM*+Up9l=(51?v07+E0kIOD3&rQzq(hBf|uQ_Vkcl?>R>=RD<Dkn7o|KcpI|KT
z&dqy<Wr33-@5n!~i+f_Fp5v>){QGIeFZGJ>jtVWo3Y+mKe%6(r1fB%uK1n34@XxKh
zUZog8T4|vF6nnq&PHs}dIQK_}tEi2qNrF{39G>Klb2s5w`j@%ihg?35>v&q!QCSd?
zVj@vp>QQ|iUR4lLRkg=mxmR4kRBfDA-Kt-+d80Z{0@?M0yR%AQK(J<rw00=BCf~ni
z#-nyIu6DVq_RV<h>R#=8(z<oQx=sDM4<2>fado>@b^GIWhkJFON$ZaV>%ZvNfAy&U
z9#?-}RsVCm{`X$}C20eJPy^^%1CeI~Nqhsex`FIv1I2y=6<H%(sFC_wBdup6eS9Nh
zbtCi3M%MjCcCu$2LeIFaJ>&6w#uxugp!%86%V#3{&#sU)i3|N-Dd*oK<^1{|q@0Of
zii2J%@;<n5AGJXrtydp?LLXyIA2U8ke9*^E-p?WYry+$0A2~|s7pUnMn&=lf=)Xcf
zATB&0X)qw|H6WWXAYU_}I5D7nFrZ34s4hIHX)vhmHFz~)P_Jh2+QgvY!QgfBA!Feo
zQ-h%!UPBfMLsm6IHWNcP4~Fc>haH56oeYLuyoPTl47=A1drk~{9}N4DkN63X1Q?9m
z^%}XCFcMNT@?c^l>|i9Ed=w)*iZvLG@*0gv7>%tNjh`4zJQz(TA4?S;OE(yM<TaL+
zFqTs@mNzk0a4=R#K3*(5UTQF29y<1)0RkyVOQ<TyC@O1cswg<A@}_H1UDH;}z6vwZ
z*Ur+X)xBnHZlrg`B-z@;5M^prd4uhiIm+AOs+48wkTo1*qv2v}u6Q$}{wCju9pi`t
zvxZ})os)-`lkKPzo3?YVu5137E2rOWd$hadxI3?bM}CKgWRRE3gtxG<PvL}*n3rEj
zsGs{k6a+H)yCBg2r~xge*#F}}pi=L@f<W_S*mq?Qo>%1kRRene1pO~SpsL6(RrmjD
z0{t%nfd>Ci1c5gHF9`Gx0D%N)0Al_%G?-LQI~>AWiPZL{*;&H^Q%!4;H0E;C^e|Vs
zqDZ=+o#KZKgqE5J?o8bhI$mCkCPK;UY&~AAg1#i0$)8~}QSQF%KLP|w{O>^^LQ)Ae
zMr4LW(V9kK*h*iD+(rg>q7;KWSE35%0+(Saamyx|;C_bGtMZU&!72^CKOm5Ekywn{
z%27(B)(_yaa#HsTu=Gk>y$F?{+f+0isU8H$9<1REi|D6^E;x<wmCD4sBA$@WQ&P$N
z*Z|c$ONx9&L$XmNRNqavMTU0zJ0K80%myYHge3eIAQ19D1OmZ0|2YVR{l|bnYYcw_
zfr_Rz(AH<BLZrV3L2HFT5=(Lhp@a>pj_`Tv_jl2flto)XB)C@90ur|`YA;G)V9vjR
zKuLt}&d8x_!WYgF5g#sg!s1m;-muwIoPjwzR4;$O+mR*Y{C`29BtohjIjMW<tw6^_
zxWtaBA;PfciycK6C|i&F0{l-P5dTtR(rPBj%K?eu65#hph3aOf%zLu;XCB+tA#Y2d
z<1ZhR<Lhd|gh6VR{5tVEvMIzw5R#`htBsisvTSFX81e(QsbCa&&pI02Hpluo=>wHW
z3W_BvZCHWuc8pIANKIt!O?^sCg!sQ31R{g~+aQo;pOVy4B}s`I`@LUwYfKz4gXMn-
z0%`U^?-C=!j!?HW$X$X@>5z=NZuIR{>PWDL7D0hGharn@0}6$;e!a%H-%C)WV4?E1
zoQjC6`YK;%n|62#AyL#EGxOM>Fj>hOUHcDPsetxt@~@48>T}CQe0F8?mXjh{@&=Zh
z35smoP#Ur{WisC93ATsH=+G}DIoxCY=0?S+EG<lD_wuDKFocaMA$JRz-%<|;BZ!*w
zuxJlpJYvuUx%^;Z;7)O}PSKj$mX`Vz5=7f7^h?TM^T%+~m?qvGuF{EF;;@gYLfx!M
z_VgceS+drp{JaR&HgJ`yyj97!#sIG%(391F00<OA_(2@5Cb3i@b3}l=lT*jOsrg?9
z1k#{6>-ULMsIj=(X*tMhguJw(7yJ)^Kned_K%n7&6$C<J>4yI?AW+nQ5fBJMDmt;)
z)D_`peTlrMlZ(I8Xa?$_j9Dq$a!3j0z*q#P8ts*I{FwOzbI>Mef@gzFu^E%V#y2XF
zP^T1z{5v3!Bn_^V!n^mX_?;Oatp;PE-);m{sJ;;|&q!^EL$QXlO3K~PjS8i+!7=g;
z?zkn^&-X3bUXfhScw)0fE4?(xo0%PmU;0Co9Tl-wti=oPk5fw6=X?ki|F=M(=zl*5
zWdCo0K*@hVpaF*eIS3T>HxP(FML~a#c*R%4ZHV?E2x-@QV;Kv={XGx}_pg9JF@!t+
z+d&|w|1uyDKPq<AKWX<&ZNlHQ;4F4-o3PYPf&Ym70-an46Uv+us+J4uGoi|nBH9@x
zk^N^Nkkfw%1VaBiK_LDHeIpYpQ55*vat6s$!Hc4l&BZu-Q=yC)P^M;N_cU00&6j~O
zn?v2ldX4N%>}J6%@yjBrJFze&i+dRnq@_(>#C_Tx#vzZSg_bpWmDCh}pd3uq1j5`E
zIycC$SdN52|3Op!paEfqldK{=f!1kG9m_02IMuAFE%ArU=UCFhWs7gTS%FqCaz;#x
zq})E%!6X9I%#}T5g?KT`6I_}xixOSofh$deP0^s7VR{aWG@2VQ>dUJVl#gJP+bM+N
zk9E0ZBlsSp_2ACmvR}y;{-=OI8vg_W#Sw=4QZn7Al%+-H`BD;dGX2(pS59-T>fsNu
zFzmRL@0gt1qvRz4a{H(Z#Z+#hP;O>jZvLYz?}#$soRMiH9PzJ%Krw_G7I1s(d!f_B
z+D>vgV*hC%5bhrY0y+KTKp?08zaWtF|7Q>g_a6g+_>txK7I&2O6;DzkE#~siVnlxW
zj2)x#-AJYLVbE7J>4t2=;4@0mY5skCHLWPgW~XWe>gP6^jY(HKx~C-{nm+eAZhHYq
z0};qU8=qWjbCB2Ulqq#KG1Kwkrc_>TeW=KSCM#cWXevJ{Tg8JwM?}te5U8OmXszq|
z3TfdqMemV8FN$J&n$#H}3WAm6E)~n=JuI_|Q~A>yK?I?;*nm)yl%pX@^&|2#HC}rQ
z<&u{zcG8WaD7iC5;wD(_2;%--hi=6WsbG#y$Z?Dozq2X7GpTKvDK-C{Wx=+u(4IFs
zc<mZPW@WrWn)$tKK}>nsgG6{7lxW{SjRak;5ZA9g)JusGfkB%ZN>NPRrh>{&Kj?2+
z=YTQYtsxp4V(ygdE(A<)+bF8vy-wDR17BreQ6bs*@33BqFtd^xlOPvx>HuR6vt%eG
z3ro2LNk8N+Wuh9fumah(nv*~m9`0$o-oZIS)*Z`So-s;)9y9`0cbT5gCz~N`ouxwb
zgMOgMx!xeue-J787HVH&MnHX|>|3?W@B(SE0tOi(Q5XcQ59?mjFl-xIJ}$E(FLwx~
z<oH$Q(lspLF)VsiX1_SRLe?L?#<PkV2neNYI-=a49t+~2EN*X4Od+=5q3mIqNChTD
zk0^!=u5<^&l7kfA7g0oENxj8Le(WNCH&|Tld)cQn(d{)s<1{f!J^?(NV0I`(7*jdy
zjm?U8+5dV`#?t2OH7poPCV?VdMO`WPRlIHua<iqFwXa`Af@;-X8m|bgme6Aj;7#_u
zl&R3r1A3@3ob0zgtMTBTE!%<ccry*<)@fO){V=*j|GI*i`!w-&CP>KFE>r}_5IKUf
zR_F+&KWm7iycB;*<uDT@K1bs)N1w=x{>eYvTOpwI(wJ%9WQ9T}jB-V7{z90-P_0>P
zmHzO^uR?r5xxn1Wn!;#<Tcfr=GOxr&d3rlVSv+jPb&|z&diF=|yxs5F*6;LRG-)~a
zVAd?uem7|k<ri;Lu=G<Sn|e!11}FvN2qjiZ4vLBoQc8hm&;uk=sh2X$kXw)=_<k4-
zd=;*%0C#MKt9L{v>CLz}m&yAr3#Tq~sH2Hy1VzNG9!xTKgOJoKrEn&WP-0|tNpXMx
zvUzg}JYP&~EW=rx4i@({D4t_AuAn|nWaa1}E`DnzOfx)*7!6wyv4Dv$uRxzszUUyo
zt2{_@c@_4^o5p++{zxH^%9yGN2HsEcy?|BX#41Dgo}779;uNGwAps@Kw@(t^?G^aO
zd5}D}BzF=c?wqass!YB40`Wl^9&|gX-d^5_<nFhdPDfvfNCaSuiL1Z+t~&LSEab!R
z@nA3RNp<se^<fKqTG%}1t|HNzJ&8=2N0pslE#ere-SEIv>}G$Jbi!_R?@G<9`!_0)
z6ro<#$`{qG_M37S6k{DVgyK}9MfdI!ZZSyFNwL8>-Xf)WDe<A=xRc=2t4bCAYm9a4
zKh=%oC+eQcl1z<Dgf-RNl)qp8L@ED!WrgYegp9iJ@j*GiMHcY}n)SDYa4<#ubJ7Q7
zikDm*2pb&{#hpQavX~3Y#4%%*@6dh6^;ot>s^5r*-3T_%aN}=K_adUaDJizCyI2pj
zt)>d$4iz{XY}XqkWBSpRlD%-+|GYJvG!-iGGO=ZrKL_b8eWV|%joFosF_FS_IgvC*
zK*aW`%WC0zp5_MEV1;PAN#$K@p>)gmoiZV9#j~s=QJ94g%t~m-?%Jna7ZS{LPt6;|
z%wxpuyyqY|^vARji7`c#riyig4Z=hyR9fhz@1r18i;d=f%O^IcwQG*L(IkF-A}I1t
zaY^2T;R+!!TX(jXajlDN>MHP6ruB~0cscM4v7P-pa3iHeZ|WOL<HC5<Cl#uK%UP-c
zl~2hDR7H6bLOrIt7naJ@inD8<BneIg);oR?c7ClJHE8-QVn#8w<U~@EFtMX<zfHB6
zuwGMebT|WcYM>kkrS;=rFgqbh{w%v9B1A-D7gllf;c?~w=*2!Yv>Oh7t3&!7%6}bZ
zhs@~nxbo$JqW<firXz~${?n&XqTzNugpJ=Nkj{n;J%lqz5kM~@dCjZ<0e+iW6h>w}
z{rJZ%v<SC=s1+zBB2A(JYcl9BjaCerCft7V^~bvG7&NUn9Y$|!PGJJ}&$Pstf`WXH
zqovbJTw<y<`s7l+TKM^>D8YhzU{^n8PZf@J+Q43g!xjqZBHgobdU~dp(^TMdm>FTV
z9L3KAb)UGgY=lF=8S*#z%&N%DE^>Xu{1wOKEBd4Nh%|#SV+7CEXW<1XEGX!l%X0dk
zgFs|oY2z&$*E;0+S3>71hS;l+>M~Z`R<n2z2+CLC{1la2kSXr+_dy^|6+0ElNr@FH
zK9eVqW9@S5e*prKz6m>)mp)i-yuDEOKLddb7Y(8L_k0}&WB&#M#nNze-jrWH`6~#-
zLhW(8zEC}x7Y_pMw($p_#Ygr_$60;3Rf@dyy8TVby~)8S=g^0awB5ax@bb4pnkrkp
zMe9S>2SJB#+Ha1~);&5q*c`igrSR~V^yy-oT`8~KyI<$^b+3NsynwD8@NSPzM4P{r
z&IvGdEzC<|E7>=6{kh3<Xl7IY;`^<5pYFvy=2xmQ08NV82g=Y%<+H8QS1J(2Q#=Ud
zV)B^<aZTzE2qe|0+D6GtNkr?EA+Alg>OZ5vaC_c(m`U^W_$o4-#qTPo1z5Ch+*jCt
z4DrBOXsjmMIZc-j+kB!gthb4Y5s0tx7nv!UXne`qqa<WdQ^uV>!qpTgDX5rsKftK;
z_1i{he<hb^wZKMGfR57Ft*Te51e57Tms%JNqNppk^iF3UOE5M}GrTVg)RDdN2yS9@
zFYb1Wk!FjYq2Y%-%{u0$Tu_h6b?(i1I;tCw7R;}O-Y~Ou=_sd&h#S)~3hy3sF0hRc
z!<iXQDv^y#jnq8qkrBZEkh-mB_S({mUc=ckOhvt}NZ`nw)5f1l<J+ufpT?J}fSJVS
zwRdYhvStHciqJn|TG<&X%z}8_CJ&EmSbP_9S+iKZH(2v}<=(P>+j3MfYw$*Nx4R~L
z#19V7>v4$%<r!A4Po?{W7qB0#((0ucKVTJyWpGy_reiF$WYmW~c%^e~I_r<Esk6J6
zsoyZKaZS}>XAA14VJgJXDVWzK=vcd7>gQa@yX7~@=oW4^4+lLqc%BzH3Ea$!5p``!
z6W!HVmV8jx+-RNmT6$Gy-K+k~>o-^2CDy%VdO`Gm0fCf!e+55&b}+zv@1H;*JLb-7
z!$OOp0eBE7RO6W{{cm5kkJ+2MFV=?{c)CoV2p!Bg$=a$`#d4Qs^tddB-FwI7!<o*j
zCF)NnAt6w5Z!6v6UCVo{U0U#FR#ribfo(F`qpfE3*ccnq{@d0nRjn67?iUxDXSiyS
zyqK3x!f#%kZf1o)w7F4gqeHy@Bs}~=x*++G^+SF5wKtJ(f~Px<8+jlr*wH=m2sL*|
z0&@LYkwx%k7l8*U(+>>AWl{E%Hu4G|EJri76gfnLX*DMDn0cMF)4Bh!2&P@%UPxwF
z$&R|=EA&cDo10TST3*Z-^X?58R*hGH5*)~BW=3d2;SdpUEkyt<Mzw04ETzVY^{)z0
z)Td(yyaGhn80ePK;5QbXA-E<_XxxeL)=*JWd(TveSAdrM^qB`=@$TuCSdrt%4O5EQ
z1fs5LipC~yA92MI3b1SNrWr76Va}!)@Cr~FLt;_lmAGl;aPk@U-@S99xkqs!ZEMtp
zzI{rk#vpnvN7DK>BF^9j^6)beh-h{{O?Mv&eS(AW4>b(kbE&AjoBsUIc8j<dGmzhg
zjHRdf%Oo!^%Mwj2n{=TiOmh`aCruov^A$IEUv-UPJ(5gyde#Z{GRE)<5C_NEbo7-t
z@kiP>{774i_$XB{ujtMk+4{EzXv)^(1;iW~<>ZpClpRA=XgCCNjyS2h*Qvaliy`~`
zI%FG|h`VkWnw*9$#c;&)Z%@<nS;*P0%{?{IHX^7Hj~M=O(c6|Wm7zDC^3=%K%(QWR
z{>k&|GQE%!N+G3n7LvXZJ{ZT#_!D*FLBW3Ed}}PPn-i<y8iti~Ch|JC81n3w29u=#
zpIw;)snQxqMWT2xv_-R29WuyZi%g<B+az0A($Y&DPfr;2t5jS8vx2nnAkcHOclp}r
z(?1}Pk-ti!cApd1gA$-`uU>YBgn!LG%7F!3TzRGgi+s-SjU*((sqs=pG$dR%C?;;z
zo#MkcEZ$u2rQc8^;E$h)ZXxck)l-Wki#SR^a$`u;yf88+9gE#}Uh|EGxI2gNF1-|-
z#jj}Hy4&=igwD0K^ZkvP2mbsw^Kk1d#nQUSGgR`!?APr3ZWtZ3XG{oKUD|t83xWS6
z$LYlh2?trK-nW67AvvL<(;B=VVaZpDdWl{d_T$SnZRvL&)pMzTHX_xz1*3+ha_}}L
z>DW5bT&o$74vAqv^pj{!IME-TUR93kRnt1+VC!ykK_0-U{G=S7GY`dBZP;i>Ok5K7
zfQxs`a@WT09u+fiNxzH>J6Wf>ea^Bm@1NEF)&<r&F%H8sK?wi&D_hwldVM37VZ~H-
zWq+w_l%Siy(j_>sF-z-)!W$F9+&9Vc&a@PB50ZI>ok~r3hj^=$T&WbvCbDXYVE2o;
z9;fk>=c#DN-f!F$vn(|$Kxt%&HM*+??$SKv73W40P_PC%&Ti34mNA#acyc?l6}oAO
zs~8X6(cYl@VHsm;2aojFaiYVy4T$`h!Fyku)Tu{9-KWQ->~*D6KQ*))Q=d_K>pIyz
zPdcr+QcaHU;3v!yMGy<a0M3j`YPxIy@KCRiZCKG#grH?Aw7_J-YJ`_J2{pivi6S5D
z^S@tMK|`h*L4Yul{9}?=?N}`$BoiFp6zr)8+33Zge{E>@NetBrB#|nqy%v(50d07f
zm@efRP+Xspdfkl0Tz|UO@`D&S72(QNtzKsiB_8B(I2p7K-6D1%<}ffx=+@a_+`Oe=
zqn~uDHEa*ms2TJ1i$Q`4H|MdVPO-KROS1X8v|f$2_9*|3mTk~r;U-mx&A>nnBKzlr
zS`~S9xhZuc)#-muoy&hx`QBaaw%rnpee+73LNyYz&oev3xK~6@&BICVvm+II|Kbb7
z!f%%TonP{ne!HgRY}7st=kGzP!P!4Cgq#fG5OP>h&4AhNjqjH++)FlT4=1pDU3M=Q
z0(yoYE3Rv;ECB$oF93vUvP}A@0TM^#O+8&&?y|<LoOO4M3%N)EH@ro06s?W}2*_X<
z2--JE5@`>R@*8skz4u_2Yb=A7y#Ne`F6Dyf3#D2E=vXc|yb>6S2ax!1s~q})Qxwrz
zH!Ct#Fu0e19}OG;KoOb**Bt;5!T>a>TaP*__0*>4+XGc38jX00W{`^^MPWz*Gyx6>
z-&DN>sUdbFK@4bO0D!GYcru_(6jfF|88!kSLb&HVzsNQ<`)T{Z0KYP#5koND8PL{x
zd@V8{8%%*yN60H?r^_Q|h=2yn3<$XVunz`;RR>I?jgS!}IDiuw0isd;Aq0o)0Ek_p
z!gO^=1F>HN{@hXtgyAqZbo+zoFQ!T-icz=3G}ODKcmTjaO_O#y`ZlD^2T3f$oq9xu
zC8ohBZgo=U3@CIB#CrZo)G)mT<hxYWxwSN<l)y_sICIBi1rqWlK)~$js!c}#8p~&p
zz)wC*-k~)p1SdjasQb_){HYXf=mSkfNu?Mu0N`1Y`lcAez>lVZD<fhfl$+Inwr17_
zovR0E!%a0U;jRE&yQCZmpB&m%DV6v@>0W@ATr)ASgz?Vr@;+$BS7)-Km0yt!9(wlB
zmg&R@!7aGq3^ZDo;d#V>Ze&pCRbW~NnAY$IM-ZTf{g{SRO^I&E=?v=Xq-_<F1u7vz
z2B>#65g1}R2-;Ivvjr;$+tGvZOT)5tXgIDaOToR>MoSYS0wDP73KY^{d|+xJN--3{
zfS(&6XOLRJm8v4#E6Wf6=BYO5G)~P;EDQ$VzMZcmQ}scFtrMCvd7}YEfF;eqD<}OY
z2YQuem;e@qvsg@km!6)4o<b}MG>%lxQt%Nuc_z)od8|BMm?6zZQ!k@I$kaQd06mN5
zAs74;SE?)kOi04{03gat%U%f{pp?og2JkQd#&g6#Wdx0$R*2>`02a-#JWd!$xJ;vY
z=@2|HoiK51s_4zoqZF#eN`RT?hI3j1h{m1{TV2%@!xgDihBmz4qq!oa$OtAF3FPe$
zO%GnHiuWT89c>!|Ck&InI%5RHg;Twon{QQKRfXvOv4&9N;&^I^VKU?|)KEB{8d}0r
zL(ztRs3G7FHKZFkhNp(kUeybakS<KB2KJuO{EZqq`$G*8y&V96qk+{w)KC<u8*uPt
zT46d0K98q{05bb1tzdv?5X__Y0>zyQnbu}~1Sf4lB`dYC=T8M#UZWy1hAWfk+7JAp
zh8X(26iC#%jK0s89*3sO`)1&&AwA3M!x_z@Eyb5)O6s$bDgX-I-l>JRhUnaesle!u
z3GyUe)23~65V>9y4j^FxWNt*?=juT)s%nYADa}TG*3|x3Ln*o>V0A?MtI<d;0D`8-
z?z-)!0*C?T`;pLt-fR1jnmp<w*CGjgdr1@Ens?Pao1^dJsi8_;vW9DbT;J8ZYI=BT
zh@p=F0=nfj3uPFT`f9?%orM(R@^0gg$c{1e<$H_-yNa29)0%U>$wA8i@B!13gWZVp
zXlt|{?=F#_G~A_E838A5aYA^?O)>}&5Y4CF7F!GmCJtFJag<B-v5$JFjUPaZ41N~W
zyHTMTslm!{M_o(ZUOc|F=uJ_4d1VseNSY}J;(39fPo0Ab?O1wE#(&GVeC(+XWGgX3
z>x-+13>pZmCzRcg1VArf#%+bDS`uEza2G+$rkDO$Lum8Icxwn^#XoPJN5NsPyT~Bl
zSj<TXf?<G(7k7$4L59|GH(z6Rt$dGTz8paD)KKZy_|&15i*t#l1+HepH{|`xvUqBU
z0ee?1GI*z0=L{-7TGsd>{+Y|0^D(KO7Oq~3w*>w+TI%3px5gKT@!dRc1sEfVgVDrj
z9fUE4B*j+dCI?m5+iIRP#2E^arV~LlIqHo*J3y#rqX|*tJ~%>h{=U(JD27UatbxGs
z2rD=}9T1Ea>|MNUH$zhfTa36M23Bh%Y;3!=SJrDY|5!siY94>AA@u#4vBR{#SVNU4
zR%750Pg^mVBk<PH&Re`Sv^|8DCcqG6_n1|;k`I~^hrJ_SL*JBE6+eg~WB^vB;a?y0
zlHGjABk*o+nj}RV3VIE-)qMBD&6YqEPYt0prBdNF?*e>RE;#IBmEqvCcZl{*TF&=V
zFXnT2(iw2`z#w@0rnP~tG(6kNp(wIVvPU_x4YXrN{a0$Ja+$=HT6cz6=?lIy8kF4|
z`w(@Vc$kc2c*Wgv@Gs6#G{QjMK<@Q5Q{ulkL%?|A8q{2CPb9TvRRZq}T@twgG5-%V
zl&$2jgeI~CK6oxtRyvWQJ7swPKtqvp_RkN{Bxp4B?DegkwOf|XtdH@~5E`#$Le~`e
zve9OLpdo-9Vo8IChAgk*p&=sluzT<((GCFA{&9v5Uo=}o+DIU4Kh54BmZBAsfN7_f
zAapOH{ko?VoMx3kRI-O4r3KoxZc*n1865~fMgXvJ_SbMi6$(Y<Mz*efzFP;+>v&$H
zl|UQS(*k1IyS)H_W?1VXiBu^DZ&E*9LonKktDuR_`T|fG!?0f61!9+Mwa=`;$^j8k
z@Z3ccnmF_ZgdY&0*<y?AzG-Ak>h>N$?_63hp?|XiSDLTxtUjYOk7j_NK@c}L*GcuL
zZbE*$FP=NZu$GTPz`4+S>$5(hrT6iVKOo@S=liPThVTcE=cz9GAZp8E3;;-sKvjN+
zMmfq{<UJ7tAj0i_<W42pS$E5Ht^J+4&V}<3h13ynfjzOVUnnZ61;QGz2_B%(9TG)c
zdU6xU@5rMmn5dr4G%W>eKMidOinoD8QtrFv6>KZG%^JbBWxW<y8PJq!#$*lArgG@J
znQK98PK@qo0+haAiu8kr1MbteRQWN8;Yh-U;XqU4n+%Z=AN4`HZl8Ek_u?@=a#$K3
z!Z;Z;#S&mf{5q!F&3nm3ba3wS*7RY3{fDQkvdmj*EUfs81bD+@?!O^WUAl!8e$SN9
z=Urow%bSW?`XEeqi&}ovfG1Vm-i;PFe*f_;@R>ej$psv|e)!_ft;fVdN+eSc7oH}i
zx*L%X+2TS{%5{(0B1SzT82<1=i-apx9w3z?62%k(knH}YV{PZxDDfSpP&Et^870v6
zMh!w})&ROC02Mz|&a=$WaVK+M!|<xv?rwOd9inl65r&vwI3Tt5D3*3YoV^eZw@IT9
z0#H_}ckGB72o9QV(;Bu4LNrc)_q{w=n-e|^K%?i(59e=rfsyb<^BGE=RMLhWMC0wF
z1P}8ioy+td<igd<J4z0YtZ1gt_UR0CV5bxO&MqYzu%i^S_wJd~b7#imchx+^FTM0b
z@&F2cw3wWa`MY-^pQ5Og&@MWu*FyKs9~W22P}uu6M&n`()WF;W9-O?qT53@OIB}ZF
z5(7D3#Uq^0QWP{i>W=)z6HXj-r2KjV$PtlyeaAOVjzoO4CGU);ZH?f<$nQhqsegj|
z$-eg=UMP5)pckFY3#YwvAjS*7H*D}(3eO7xJ9u8GVO#MJFND3Q9)RG`ng{kqlznKk
zLw;3~sP6070XO0A_HkP$s&79ORZJXr_W38H0hv_d8Z7m2Bn1Qdey5Qt1c0O*j5?pN
zN1`tuUY}Hy?LwUO5CGR{bGE<N_1x64^429#Q2jhhqjB=b7a};f`9|%xoX`7>`swFh
zR1_a-BdYhgVQZ6=T;5$Z0>B4rrAEYfL}cZGmGi{vPDejHOSGwsvH2e5auy*l{TN#K
zTm}i+=EUjte#L7*c}tIOozr4d_G`0ASdb7rGUQB}=^)QV`~LOqHaCOpUNQSXm)k*q
zLx!@|+{3-dZrS*q?T7qQ<2m|P{s$R~W>V4+2s^pUmwLNR%T0JPDEywn`+oBqGa*5W
zeyb<(yl|Qp^(%jnA>jBE(V_W0%*bHGwwLuo2l!cUY}59Mi;FpR%xKq_OQSX^@9dwT
zqtyUi+2KW#W0jZ-W)xy3T65{c7v5<01MrDq<O94i)O+WM0v&$uoHyrm#<D)AXD_lL
zB%&=!UN?eQji}6CjJ-2Td$-*28I~zKLT38Z(Ne^(?XIF*1UEmSmSv0$0HMLbq|YO$
zhFTr@SI#_ljyMK!7gMqAyvLk6u{ep^x$k4_R57U$&cf~|-1_0&6+52a_1|aQrFgRD
znRdcEm9KE`<Y1SYlayvV8X@9w%0FACpC#eFcPcPnsr7)!ZCZU0Lx`nRL(25_KP6zM
z11x=kUJS7&2L%Jn0b~qw;gXXl@s2b0CZO|zVeEUEX<Y<Z7#c1&ZJ!Vl$s|boP9-}+
z=xFR2q|ictgdz%WF(3l0J5H*~pR(LPjo)8G%N@D85djpu4NOeqXs?ngd@TsTAOHjI
zIs(1T4r(R+v|_e(+DhIZK`-9fenJ!UVT&IEZHK-_V`wO+7>!!d{0X7A76!N4_Y2)Z
zLZScm2mnCfv$>1{Pv4?A8%{5KAXMwFe=otFUdvxVpdzgLZz+x_+D}sC9E%f9vqGsj
zJctt%I-`YZU7FFMkZyyG3Mm!A1{n;S;b6{IaLJ?+Vb~WvX77BQ2HDFcOoW_J*g6&a
zl@sxp>oiu*#j2I_(>kgbx=tgSGV1N+s_)w_i=qrd-DXgVPG_dzEcdE*-aH;6B945&
zartf2R|cph7ePyEHgUiU&k-R5BY=p%azqVLYXn-cC^ZL8ZXP3|V79dadn*nAZ0z&v
z(KgD5AGJgvn2+rvAVwYa0{I1BfQX(b%o<^|sF<0^<D0L?P?dDiP-6rQipcntnSC!n
zq=kB8+(%(yOG1!8J4Wa&AT}z$@;0QGn3R0_<-K4|waB0>R$os}3Zx=HxFlGfOGG-Q
z0Nf*0^WP&N@Rh|#bn~n%1K8e`*95m=H{uBi_|^FaC=`DcMSANi`RUw8VNGJ#H#Bva
z3qw!FC7j+Oc-U9EB5+a{JD1q&%(Z7t<eUp<0oS<RSH3-YDV=m2rypvDrJBA-fR9}_
zsya7h{^6|W7bWHn+DN@Bp)9>{!|C+nfR*Qquf{9${c#cc?jRZLv=nAuwj=+f-d;;7
zAVaPN?U^Ck61n>Ft%0HGHIuutmE=N~qLyUuwHNyBZq-2M<|S)ry3MXQ3ltH)UkOYb
z71)4jlk*1B%*;zAd0s3L-|icd-g_#^(zsCTbDqQ?;PMv6&NIT5B<EgKLcwUAec+(^
zqgh;HLSoLV>1dG4#9(BlSzKFs<w#5$p|>VkJY!3ItPSh`DS3^8y*<hFk3mGmd5pvx
zM4O$L4|6T6RaAd}RlQs=6f%OEXZ`;D(<ehhp9HuNAPOgo=yj3%+CwCfa`)%~(nzhC
zbXmF>+PV`X^HGdQM9Y!2(5;_lMUB{f;*;yR<U5*NRKnH=1E$K#HHH;rljzWZ#`3jv
z6&!J2p4k{XZixei&89vVZ@}r4rOW8AXNVc}Qe6$@+^Zmf-W21BCF|GX*C81a@tDMD
z%<IAGu8NC$L3qw!BeH`_NjpQO>}S)&Nh^)dLQbdI58EEAd@OF3te8m(&L>fMU72W*
zVPGixi<6W3=_m;zH9jeH%lH%Fn4X4lT1J=i@2)o8^yWSy@8I0QY;_37R4H6}w*T7e
zt+G2Ae(7eO<wBQEyWKjD&oZBP@rVXIy>`{ZBomQCq{&}F;u_k>I%^p%GgzrF4(q40
zMUe1gb>r-FBT2Zv@W@ol5YbFHX1y~gSnd{>l8*|={}?$gj1r6Tavh{R+(%q}EtR~~
zNUgt!9Hc(&E!PEWI3A#wjDiDG@jWh?UzI9zKcXWH^P7tOC5kk;?)UuCYcA0`2a!r(
zrg7ZrOxH_eGiS@<pmzc_e)LXLA2=X5+}C6B_;oY~)thw<9LSp*xY$=3D09v>8NDG|
z6z9HVj1MtScxJAu?(M+Bdi&_~qaZ2=zLOSsGM#*EoxV<hf`z7!^6V^{_28&Ddd-R2
zDO>YYW&JY#%1%Ss9c4X*G5eWzm7%!67yGD#xW(wSoeH0?BMB156_T}j<e$%~^&W-5
z!`cAa*|uF_-3=;5sSQSc{DY1C3Nf33Pr-_BpD?EbHH{ml$u#)34qhc%P$_PyyDP$Y
zrT<wf5htWlE_E6Ypdf_@*sa|LoQ{o?SHIC|A>V3K-&!Z5r*WW@;}>--{h7id5?KG5
zCyuAyX6C?SF>hB3qyBy+x$<c&<ByC_nPqTX@%bjTbaup*!BlA2ni`p%TAxBDhLC+C
z;z<xcA*b^!m`#d9Z>6`MPB#^rcmig31fm>SC8(O{*6Bz%K<u!Y==()Q5WON}=?ElN
z_Yw$Xo70SxQR$nMp;2#_UYe%=6?f~jBAsM<M>Hv*W|NhDMq48D(+^Z9j|MDY*l@Ft
zFVk<%hK2*7R7t>jl**~XO`xabOF-&7P36~SPbzgtLTX}$MS7JGU7SV8$n>oh<a6~S
z>I4KUeB*73ir{6v>ddE##41aD^vA(bR1qi;i=jF(Cc9sFxM=En8vqw_ADv22a*8@Z
z7b_*X$zKtfGVshzdw+9Vr*JR%$bXE@Jf%4*0(rZ9hzrs*YWy<-Mq_uT$(*o;eHehl
zBE=NgMA!Q0W%^<avKc2mKANcBnR#))d7ZWrhSO+CDdnbdVq@<ZqA8m(ap7~gtgP2f
zlY?OhRg|ppsKVXA?P3&7$~qPPb)joh<a5Ye=YJ0ZVH%<6e*%G$d@(|Q1%cq*Pzf;6
zJVfNXX3cViIht^lCig0Dg#8Pjd4NcwvhVB1M#KFV{Y27heN>0jku)u8%%-H0RGjM(
zl21aYZO1t@k1+b*qeDoqb`WLK->;xMDuS%ww3u_({BLL3lF1=uE4}ypb|1>}{{evp
zM87qrzc_GJRb2TC2=wCcPB<O}68+vj_u^AfkK(&8b@!St&x#nb8V1Qb?-tH$@}8{`
z)P7wD(NA}<ZMYE%!agTkG-$auUGn!Uz2=|@n^$9ZvK;1n-Bs~$q6E5E-6vcI2Ya77
z;rX#p)l7I~#sa7tDfoNWu8%A9tfLlNc&y}_8Y|%Y{A^fN<s`lS*9XbMa~|1{F9qxw
zSyy|0yzWu?_ULl|AfV^x*ms4mFJ3KgOWyqTQC0OzYx2ccS@vH$e5yY;-~W=wso*?V
zu`*(cdj|Pm-G8VJ(kx+QY6h+06qd0!G|MarWCj(s=E)BSrSlg*A4bY?tHUdE8KUxM
z-PFlO0sLSjIzbyO5!{yUQ(8lB-x%OK%O7mkM9lXx;1X1v38^Y`rF1pnw#Y|kn#$Y+
zRQC9BYoBm;mi`D$WjhDvz2x8wTVxl5#1^TI^RNG`WF|FR!G`A2BvH{?7h~-m=<Yy|
zy-k@DFe)^dJ2$db8Can=2K=SzDQO0LkIglkivvWkD!nYT1Q|xKez8yvqf-!aA(gHx
zU8-3Vsi3tlKs{|1TWLs+)SzW0qCzTbnMi|?RyJ492bkM)*n=GRbv04>hGt3*G@P#$
zEb}?N9jGO6^xX>r9ch9xx<dCiBJ(q?Zv4eHniv$pfk=0XuXHWtoZq0Pu@LKD5<Vj&
zP0`run>T_H^36Kxjj}M_&%c`OfcTXnb*J<vnv)b)Vw%Eve-|s+VZsX@5=?SL&D-gv
zmI@bek(P0pDP3|X`j;9R^hw|s9Njdp5t&A@GKjgZw$pC1kUGZ~5o#noGTKp>TjJ8!
z9Z--eNnOyCkT26VPmB%QOcaljE1_4J&J_;fl8bgiWo+1mm0gJ~Q_xt~F41bklxc$1
znUVb}9~~KD-x!VooCn73+PSK*GJVJvUNnknW4n%ykZdV45#=$xqo=d7WRjx$oY6{A
z*HE_uVkV<~Rmb9nW4e_62OWQBJsB4roF=k&%V5jNa6=O=ti|j$Z_$A!=XQDx-^>E@
zl&xlD%&$ovfhBbbt?(caWrbd)Ep4=m@dT&CIJJ3Dx=CoRo@j-s%tsTo3e7s~6|IO7
ztq2+X^UoD<gxR{L>KUG@=o1#!L^>0yu0sSNH^wKexFJQn-4U!^5tFA{QWb+rdb~d0
zcunsVm&2nROBRJ(seO5ed~-Pk$7lUGwf$!|B+5{5GngQ`9q*Dly11V{v|q&eHN*5M
zgA}3Eq&l}3PA-&>Gjdx&i;yw2p8=AyV5xrR2XENxCkUBsd8ONd?OcjOCB{43Hpfr=
zOmdYdiO@kC5=R7r6Y8ETeGi^naO-N0oKDM@_3`b11Oro4D|14u`J;6rt|SmJ74<XV
zH;%+9IBXNb>iFZ|@s*3uV;*x`yHYESa}BxBbQEu?FSr@MbyL2xDdDW)`h$=&6vKLY
zY0iu6mk3PI%;u?esWgau9P-#DL#tmXpH?tbLww@NU^Ag!3x9UBKvmx+wdj+wyF40U
zS^RfC<XF2XKix$&Jk=)NP2ud1?dlg9)on|}NS$I;+(3_lbTeH0GiI%0Z1uPySuBaK
zlw+Tks(1wUab438%)*t$8wi%0<I0mhn0zd~;;bP)U6wuuiK_)cZ>@^Rt!%mP@WCv_
zySA!4Zo!EOij$~R@~taAR@DugD12q@pxxGSDO1p{C?gQkfbN^=^Q!DPXwGXY>vH4N
zJXPmGSxGYvhl0;ttDoycqKWreA_qU;-EVxj|NKrG_o+jBMRkWtRZ_=7tiE+;=H+~6
zozSl(jgc9l?vI{6B~QCIz&+oDvhlzXAlye+)5j*<@5)ifD?A`mGs0LspaLG$5q9YB
zlSc^;yB_Go3Jv?$49oDCSQ|2U-&86Z8+lwqGweBBB|I+rK@8ws2%P0BwoxLtoNX4K
zy8pJv^<e7bfp)*q0x-8W+1GwvGs7k_%j>N(%D2!)oug(^yZX_N2xHJZKuS1|?0YhM
zM}*T*c<8>!Vvu7r%J6F642xT-zB8@kE{HU6Oky;{?!_QIzw^@TL&^}Z!HwEg{bIqk
ziFvSjZLxO-a^2<_Xu;r`<+YR&#@@+@{%Q~&(x}_y<&aJ=*>}UPl@PA$T;g>jO{(<)
zhKc>HB+<N6;h|hnPIXT$oanB?VD0lMrO|w;z-?K#J_ZI_$FTlyzE7@b-K2(j?i1G^
zT|AOQSL<oLKFZYcN_@p@wr?lxbJFpsP~ijpE~x2o<X3BoB@>9rIe0&4;~TN@@t*6c
zV<b0?)p^AgeWjed3-F2g=*Mr7r_Jay+rf`h1es=u?=G~M*U&k~gFj^kC7Vs)z~@}@
z2H4>hFcf+$9T{}1a@@J!N7>NpnY|`t%-{#;cExQe`A<qq`!7r;Pv2>MOWOQeb%k?P
z<LAZT_X_;dqL2QP`fvR~GF2_8Y2wzyx0fei;pJPJG)MDi_=XoTFwvzGcZ!B?kp@h-
z$nC~}Xedq!m#N7hjwp;ZI#Jh^|0IU%qmFFQLyAQ;_~^X#xnP@@(jNRZB}N*aN~$^t
z0%csuhs?Nv1P=Nc?8k^V3yI%gh_=P~jc+vNM5>&X$kYscozM`^rV^0zO@14pg1eDy
z`$_>QvXG7>@ATuMk|3pd<`zwBP^Zc4)^}CunVgotmf66lSHDuxN%Ry}CSiiFO+xsk
z{{y`N(wA2_%P_3`lS&5-st4{o;r%|0Z0yKHb+ZP|8cpiZeua4y942rPGOdH6{ic7!
zCtalJta01=%N)O?<RU7=>xqhP053|?sNtDlsierriBRjJ!kfzzPHBuzq7NbzKV!6B
zYHKLUX^BT>C|&yNN?Fx1e%^}cr!M-e-8N$|;bzn}D7<9AtQo2CbAasCKy}pw^a+&w
zbEKNyAWuDh0tRLXi`y99`ePiWfM-Pl)a)7!wfuBxG1q=-dau$+J7@(y<SH@DByUzX
zIv-$>%DT?3^~X4pitxcN5#na9f?80UD>9gA!zec!A`Hrk+L&3|L=y~kZxBCDP`P*4
z68qKSK}!@)lOn~2;=8}ZqFP~lufp31>0<)DEu8lP`lDVWuMvi<(pq&)iqqatS~ybS
z7+AffMXibtSLLdnF{yArms<nb{rsv+zh>X6?!bQeTn~5GD!IiXK<2j3EN_p2?k}Xq
z<2Mp-7ZtxYX(oJ=00)kTg4D0qvH3ogo6t}U4v<{5W_^FmGTun+RLAzpo*LXI@hTy&
zq@Ur0;FFic4pgu3zp;1Me^GAz|L6y1$RTFvh5?jTx*Mb$MM@+LQVBuY8M+&!Te`cM
z0Ythxl$1tLK?IRAy7#{KzV}`GbAP_)oFC5l53cKRt+lSldaw0<J+Ha2NAt5bqLf4e
zicb6)vbogAx^<w%N{AZv=mmkJkUPZ$a-Zi<1cg+<u`08lq;8%vm%bf30*rYF$f|2A
zRGku!@)1`#3_Pn-ovOMP-7m5)ALWe;qgQ<DgPCMc!MVMv%+@3W(Nlo9D=_&H+4vI(
z_OMZb@CDte!BECzyjz7!L_l+eKBTz)R@geOx^LIX(HD6MMc+@dLII#yYZTB@QToFt
zl@G@o%~x<~i2z7<qxoKw=uwl@bqoO)3UfXX_SbF#2fw7Trua%=0<hX1=c$qc$mZN{
ziu(DMupgM)g-`{^JSEG@)U_X)oIxSS*JmnJ_g=Z^h{?_bqQg)bt3pa9$1<c4!YnVr
z-F=snJ&walm+?fi$iS`~9gFwVH8SK@OJ{kM*JpYEgh$e!c%g1g1B1B<xulgu)A)rb
zw9Y24OC1u5Mvc^3IbQm6MUJ)zf4e!A0}2vx<=bbDJ3`61yYsepf&C_wzla|kp#r&*
zf<|*5@EKJ#&T8U7H*D67KU7hirT+kpo|!11$EFM@vJj>*B7Wn%`v(74wPH7gqbs<}
z@*~?kqy*k^NoQAcp;z?e8h76{LfbXCW@sW7qW7!6{FLnd!;27<uxwt75yJ^LE28#c
z^3?14qA$<BzdA{f6pnqa7x1Vn!ww^sDAZjTgGf+bT&i0(KO&>|5lx+}#93D`2id5o
zsP@pf1QLUesZJ3TCmiCROa>&Po8x-cgsp%QyTPxCU}k1_BK5}g%JVESc^D1vo7@*O
z4h~SsQnjD-)OdO+$J!$=7$BH_uCM|hDtmtUUd1#INvGH<d&@%IsOGFlDuXXnCb|9k
zqb8yge{j`Xst10H+7gg?xy7gYgn_NZkr>iTv*JgL*v$Z@bAHt0W0Uvo&CyqQ9U^YI
zW{Qb+p<y<vTOx{^_eZC!#@a6oIwsffl;>LA6cZlsO<nO*-1H&I#*}0KvYWw^F)zn=
zCQG<&xfLY`KI;O!ouyjxAWe5*tphNJC_q<`6YH})xQWC*7>|w-;3Z7X6#!8Y6*t&d
zD_ub(y=U^P3h9(DX-L|1q(GScq(DeF83+|qr5!CQHUFmLVvKtC>qR_YPc4RG<X!e}
z%javvIi1WC-$K_BRa9X#qh$Qgwxfx|n7rRJ)%nYt%E#gg^dnJkvNE)p7qi*pZ1AQ1
zzDv7mbg`(!#&DQS8E#c>4sx(+=6()Vv6M+=HziA9BefWg)h{-v_awiv>#`Nq@m@nY
zW-3a2?>Lr)_TOsrxMlk6L}c`JUkEAmMm#D{<#mu`iOuod?koxiEZyvq0UWky6Woht
z!w9}(t5)~RRlBY{rL>M0K;n^e>SxyDd8#k9`tth8=rT1M-7aa|?B{DuZmtV75$39R
zfA&drwu@-+5bDU5M*tb41kc8Hqn;<c88A`xvs19xO6o<4miVmKCXbROtX1T7A^KWY
zwH>UjcurrBBwUw+9Lv(+y)M;|?Dghc;tv%w?dxH@y^pK<>Xghh28B(JwoOZppf>XJ
zN6lkde9RUaK^_$oZxryVcMIjA%9!INzVZ=O?Y^I@ciDXU^mlo#XcW9|2=XwL+TMEM
zjc1w90PTY2kQhmls7}nxbM#-&@a9*wIWsS!qP9imWZ#5eD5bLM#N^<S9j#VoS&ppB
z1u?l>D~OZn^eNKRh9$3ay-+KGg}%m=%LzmW?)r_=yjP7bh%)5Hjx{;6&chRb>Li!S
z8*NgU%-pd7!&BTZ!Wia&?C-F#qmS^>Akd`-Ekl6{b144e+|iU_ygf_EO<P`W`P<*l
zhbVb=6VM<~Abrvt?rS+vtWmxZPHZA1t{_qtV$(%*f8P)%OB-Udm1tz^`7qO+*(NX9
zGdr<iJSgUlL6+ry@<i6diN1WObdu3%mMb%gyx)@l_!`O8B7X{y+^5XvA%Wie{s$2z
z`^nueALge#&NO1SsF{lpdTY4;H01LerKnpBgp4zE`Fsy3%S+yD#Qp?<=mn{a?jIRF
zN(neh35?c$l5#8E<Y-5k=Kgy*tXL%-o5C6sOe4>&%onG@j}*N<z&o#V8;luk9u=2S
z1;uecB85A6ZIUML_bI*;run)CuDm0^NkRPBhJ`fZ;oGzi9hcwJ=E4iQ_L-1`GIUOz
zcb@QUj8YVqWcB8dJ*IZ@Hrk?anE4tIt%5yyokY>B8EesK=0qn=0}`wBvFF|k`qMd5
zN^eg82R}g|%4XMC&v!pTppN=sX#WQJ>1VkI_*aT%5h5MI_}|vzw;b612m-~H$mP7^
zaEGu--!GsVe2I3IHeo+qCBsVM-$9@(!D)9~l{%(K8gC+AO{TG1aXNI;f*7zbz~4b2
z)|p3uyuc85c5Z&^A%2D~phPw%d1Z+Cs^D)RP!3p(D%n=Ug7o`bk51fCsO!-R%)wk+
zMv?_Z{VNERGS^6h-wQXe?Bh0N^1r<Oo<AitTd`wC@un{{!h&p_ihe3@OE)CK=Jq<x
z{G5_V2Q<nlVV!QrP+8(FG}>coo#E@8vdnjA41#Qf3C~DHfq^78^!COTGxfZRvNTCt
zY{CXBhmoqf8A*J~)W&tOc~xy+l7t+xO?FiyHT_JI#NykVoJR9%cRNVXA&r~dHb&|u
zZ%JM@Pi@}tm{-65og^7W_MSJ?NW+SOG^PK?<IQV4mPV&pCcGCcHqx{+BTbv1dN15O
zuldxMG<}t9OSIoe%O#UEW9Rmk`24)q^A6I?<Ag2A9V2b8x1?ELr?#ZO&TGH;PMVED
zzAcMqtmDr>mV<X^Tb_DBCs>*+7n-=O$YHD-Zbp_zJ-w|YwxApBOO_8K-%(LD){D<1
zd&O~QN6lzK?_~#B0bk;dhK;d)+FP<hvFRNxj|Kg#?_@=C<hwedSH`zfJQT>%k?1p^
zg(<HIe+Il&5LLd;bje!_ay&$desjr)RgoONsUeo|5>p`8QVvOJks@7*G46}oeqg;O
zAWw_&tW%eNiJl`+7`cFBcBa6faT3foU>st-K~CUTzh~K8j9Xf<Mx?h5ls|XG;()J0
z;XHPF<pX%Vz6NPgiGDP>e8x}DSZWLs{n)=D2yY~yXg!9xt!+#+jc+HCMjMvPsFf~^
zGb=W>K@{&8d67H9Ss0nco;cU~5jpMyVIM`61P`5-W@FZy=I>S5R}B*5+@WM(DSqPC
zkFh)ppJf~ox_M_xf@F)~CEZ8I7}ra5J$1r>!TwbsZH0NnRpWU>Nug8_8QE&+xY7yd
zZJsBdz;7wiDyYttZ23DLy3_A`uGe>*JhdMvnZqJ<uVF5(vTd$fomr8`f8tXWT3E9d
zD`{B&T=tFMx$d;rQg_#v@^VRh1R-w`1`Gw@rOe$W?4Rf=H-ZL|4aCIU;iVSL-3IDE
z-3zi>$|Lr3ALe8@#vOc{Gg!D;MJ8Fs1c}b?y6dh8TjRufpNjpOGpOp0DR&&sn^mY^
zvLkidA~Wq4%b<7#kE8+AL_{%>!K2<b<R`OaRb~WJzJo%<)I6I0$t-am{5`X@KJtTE
z+NRmie11Ne!yxp7St?1mI;qUWt}jYCxB1~Lp*LAo#d-!moh6l@&eE&v0b^)qshl*|
zMl1YmmYm2*o|6tIV9BcM`@@D>r{jZr(F?ygORzc7i@Xt)lYr2@^cb8*8ipi?lPdp6
zh;LaM#RjCI9xL+~W~u79WT)i^vow~T-S8W;ghBaCTT|EIC$qHu%)Z<+_~<;Z%TKo2
zR0@$eT+mvw$`fFF6-G2&Vfi{;hbQV)c0!6t{d*D0nxt@^K-0x<)$aA2R9&T?OZa^_
z85(V`LE<bp9-J~H)!Q~-9=qVP^z7YP7M5?hJaEi2s86}&c?Zob;h9X&Tzzmm4p~&2
z7h5#KFaQ4ZQHJmQ(R*N-fs|4Uxx;5B;8`z4f%2Vt>BpXR)Z4VP9DR4V9&*&t!G1VP
zl4%g&mT)g=7C!flJ>rRXh(?RoN`Yu+DW9uriYrL@8ZH4*=9j!WQ$ruad-w0m{a}{H
zE>s*NV`kHg8~vDqpA=`JgDnxeJ+q}EPq?u5e=ti$yj0(u7Jp@yc3nq3eW~WR=h*!p
zjN8x1FTpB)FiTaHmlKTlKmA~q=mw3O72FxQ!4yb~OZ)P-`&u6|2~N_ZzkajmpJH0i
z=B_zpqIstE{Tr-;0YT?`<Jj}baXy@MWffJVwKavLy)w8l%le_9OsgVbsC)y1k|Brq
zP!__8>fA<j_6;=ZRB~>>kOL)43^CIsVRSJS?@WitZj4THYv7hv;yUaLghiwBv)|1S
zpIQ_5l{tR$wIg3cg4=V-jCm@)*)gULuj^^!7iAM$W3;5k;OY($Lb{N>M4R4V0_;)7
zficpNG29#;Y=JSx@1s;?TKEPCiaE|wBFNj1BmEl#jCBw&C3Nz8)C7dN!fzG$nBY>p
zicy-k<SkDPufwID4wfC~QQ0njl?5hDyM6#(j*mimgZs*uYs|Ulo*mX8WhvV+cJ>`c
z;;J^E5L3E3QF`&=6F$W!?W!q)Qz7iB(~di@O2R%S3^O`v?lhS<<pW^W7MB$Rj6tzf
z?W_Ir`wiPwT?25sJ`5D@&9WLkYGUomInG)Tlr}Sp%19mhfd@u&MC}UggX^$*$Kdm5
z{$Q9&IGaInq%vczoI~ZzrPFg^Wa>@@TH_@N(c~BejcA7HZAHnWYR>JbZES)Q10EXB
z5BT2Wop2{SuPD|_6ss;j46QJo^X$fqzt<yy(S=u_6(+54wo4S7b~svLV*ij+R#j2L
z6nS}FleYLKjo{7qX8hM9VP$c4O+&i)Z4Ruxy6mN4sAm(5NKV|!8xVbaXe5I1x<&_D
zVcOtgq^_<nu|4v0X1_#Ln;n&19l|OG4w(8Q7`JPPijPjEWA?}R@h;$u>CVg?`~}=3
zhkh`YV2vLP6AdwIvESC=4aS~B6q;dj*1L9zxc0PC;M$&m!em*ACVt4__2?%;#2?TM
z(`B!A-=kXLr+Sq|C1{4}L=kp$D%Xc*n4Xo2Xx9?!2{5jOfhD!Ln)Q0R@I^~)85K!k
zL3>1!sG21;NNZHTwKhH{&keM~RClB2NxbkY^KYK&gfr2*Ng5R$1WgqKB@`swdt>Ee
zmB%!beD~GR3X?1_fpjgL&hV%tLT((bFkuRwms!5AFmIpI-tQU|pPXRK<fd}bkiQl#
zZzV8kT+2BZM#GgLc*PSArkNtssFS;uTUHm}4~k;Mx9Gyp0o)`jtB{5E*ehJDY^WUK
zKhxs!&|$TFrUb5%Z%33rauL$ifO3-!O2^Tx#~q^?rnlU;x=ZAoP>PH>?+jp-WI68+
zVYFO`64BT#B7uHC*ajzh%2mreFZsbRp%tb_Rlh1s1~&*P%Y+Us+P@3xkUyZmm8(;}
zrt`%@r&Cja@<c~LLASQ+daWPh^?D(O#I+(n238y$Wq-<mXr{q^O@|VO<xx^|3pufz
zvU4UHnh*HAnrXPYghgTCxAwQ6mfRNlSgnX+xu2NkxJu+(2EjixaN@k{Dpcl&AzfP1
zA2w}t<)TU+uWwu^B&IonQ67fRdt%gh@=_61^C;Y;`%dx-!tnL9=_vWV$vgLE6Yni1
z>V3@_eZ*o`ZfW-T<Hq*%y-)R#n3E-^oWg2g;?i6Ji4Ti4P=X+BR>vW26T5Gpr!7+0
zd6(f7iU@FpY=;@pywcMAmfvSl1mzMOpZjFdO`Wxfsh@%3VKh5${19htiEQx-5&j|7
zIULLYYaYv~nS#^YK`TyAkD_u2DzYJdgbWNA1W6I*nosNd5-B$<7(YihnuFieXb=uK
z3+Lq!aPCo=2|t4RS%wNc>~45rAlx!k10iZ4fDhqZtn_nQFe2figS&OeY=S0T{HPqp
ztC28@qU^6lfGt^Gi^U<r@3vNf1hkI(cNhui)zk^2ERe`-5_bXzgvKg^+}6@<dx0-r
zeH8EQ4Jw(`@$+jY#t@9Ve5DZ@WDyY+PwZOshSX6^PwO>S<7OB?Vo>6vYNB!+`w8BB
z)W<hRF>1^(VwWw6PZG*fGQ^zrBk#DRJ@*oQjy%<_glLg%toCaS(rO(%-vfgp%a#nE
zZx_8}3^?VAcPnozt&_B{(%pB&i||6+b;lW+@s3f0YB5+>l0c$lGG4wwu<@QmTUIia
zEC_sCGiM~y+pM_3SdmTOxQeom1eZ{hRg?)4hwqZD;>Qp;HkS+8z-kf>@KwUguNFl7
zA8V~tm{)F4!f>023EYv22+Ah&7Z)#so(A6^-X#JJzDc(4w$7;x+gCC<C^i1{q;<4r
z$-K936&1u~^A$xp^FbN9)=wAt{MsIVk1gA#TA)d|$YnU=vr?hG`k*&dUW#ry4%6=n
zFeAqe+mz%ZCJpCGy7VqqBm3u~K2Sw}GK~I`9DOkteMJ=mG>XAVi2={Y5L3sJ8pTqk
z#L~{kGE&E(qkq{_;<)C2g#HQ`#fzlGOU%d1P$wuDB`BvPpd&}LsT1{$67QxYn#?EO
zr%tjmN_w1<WH+Dml=`KM(aYy4FTLhpzMxL_H%bmpNe-V+j;2nDH%fV#l5&+cpTamp
zpGytPO-a2(q`sO@MPomu9%-+>rY>8gHh)cPrB3gkXH3nZ9`HziGoL>1kx}2A*4>=C
zY?L-`lu@6Oxka7%&M5uDDC^QF^}r~z-6QL`Is1w_4K4j((4=FDXMLc~fq9|@pll4!
zY}7pcSTpsFh4e+E96sY5vGW{S@eGOcJk1t#x^6CxaenjHl*cR}OHb%G1h%C($QsE=
zfhtg7BL8Mln1W;+GA~Sn(Yq}Wd_&;5iPP&@6rx!mE1E*rg#xehLLcJ-n}vcr&%)w`
z0)%mqLuyeZO>tssvBN@ft$1PMLWvbk(J)PEj(B;YXSo8hG`OYc%Hg~yexcxHOYyt&
zf_3qN=G5}p^RiXr5};Sb9!=Q?@q$mOWf$kgSLan8;??EnMJy7aZ#iX9uflrI>eBO4
zD{=Z%xv~@S0-@GQ3EC>KNzF7(-9bwo<6=3>Vy#$fDbHf1fLAStNj;lH*;9!+1@k(q
z#RA>Ma<A5=`!od#=GdpQ^bzLRxr?|{a-_KuEkbhiWnS2Avh=62tq)Pub&JjIvaK08
zE#-^NIVLT|Cau+rEs?TBQ!pH7BrcsCeH9Y-BQ2V2BKs)Osl3{JDbYcX>WpNfOwU0c
zm=NJFQJ*h%9?*84q;-PnkYLG<t=5hYi=AH<QCAYkPhQ9?@HZr>DLutfCvAEU%Mz|=
zdY24c$7Wgw%)6UysguhTIgLPGdi5~2^-#BU3z)t(YU{oCt;<EW_cE<lstp+^+4-EV
z$0;4<g6Pqd?2MP}ewp6M_pR^l(tyLaewVg>X!@JtC0w2KH~wvdp>(~C-Ypl4Ez1|}
z^NTGglh)?N*78N_2XbxGh_-T*k-Wv`dast!i@HP;VM}9rl6&Kn8RN9e<BaqZEcYhZ
zGA6i|CvMVD3f!ASgFq6?lQQ&E3iqazGp5w(C&9~O7J1YUP*Wz$)A#9TtnSS`&X}=V
zo_R_?JB=}|zbs@RHT!~o&cD6Y!4qo;Nyks$qAm%#O3xV|hJl()#=pSlHdp3k+Hss$
znjg!~HD)Zf`b<90nAHT1w`VL3E>FH%COFN;kq5N$-NUWBN0ih)pXD>YF0~xX1R4TN
zRnos9L@iy>uQV@%XPB1mTP*<@R!M!wUrA9;$x(b<UX3-!dIV^l&cJ(wq^6U@HOR*C
zm7{-qZ$9O6<O`B6oqmB->aEmUI_DKol+Q-=C1uMBRx)yZ8U=A)!D?fookGyIEfPEe
zEVi5D*-PV`u3$OCr@ef!lK|jk+0`tDU7_|BLTOO$+ugx?3!CP|0ZgF%McfF<mT9@7
zKqNTb0;>uM*{0uEU#9kjfvRMSgisrMQlKl_w_tfD>LrH5`FkB{URcgZIyx9ACL1ho
zzK!(`e8{jk>w7f$b_aU@xYFz++x_uKKvALDQfcN#5ysh9QU!OB;HV5*K@`|v1=Q1V
zNGe5504om8JkEf<t^Yp1Wj3xaJ^tZ4rRDvFcI3gO6t&x1Tw^o(qYT<4b1b#*APUB}
z`d3&1vh+#Wo5QOg#InxG8J75D1ZP$@O0zER-CKB=voMXKvo^=tfbZ#M(N3*W#=V0W
zAWvStqdt5K9zqh(Ax?FrPo^!FhvmNSyn_Pd4R959eJ}ah9t4WHYRErOsFBZTCKsE+
zOUcpF!hO8!jH~;2BcM5yd^$xkl>gOlAdo=8P>P`4LL0S!BJPX-1Of?_8e|`~cwUAH
zl+9H?7)+&aWmCM7Fe1<URfr`(OaRtYOiOM_Y{o*tXZx&xBY;j*KrjWoiuFoKz>8);
zm(tzQ!sVv3^#EV@lBEKhv^Yt6!`kZzS_xl`JuLN*xW_+1AUC576T8KZNQuV7<u<R2
z?}T)=wYLPH(a1bWuiW1pN|U&sa(Y)yfK7`E?>M~TUI2`fOK|OZp4c=j$x$NxEMF<(
z=8!$x)9)2A(-o|qVo-S%e%JZiqkXzi_k5>~Sn(xZr!EqK&sRsL{zTHaFts`?Ws5)x
zvk;3QnkRj$`r%BJT?EWgqPbeo%n-{k{)|~YVQ}+<sC&Y%lj9=T#zW#FZ&I(_x-n8#
z6%Zy*q?)fjvNCQFr}hg7WMd)FI}BImUN;SWn6#d3_~50PFJ6IK^9p4bUS2@xqtqI_
z1b;4_4!p<d&LgUYL4<+40g1+k9@k#le#f)Uu6Vc}#x;){W}PcW-KdliC5>;BAEz}i
znUQo9x|0MeVo}d#c^I$3&l0I-TU?MCW?NEHVM|n$TZ3;`R#UONTh{QF)2_VfaG<m}
z=M<ky4H;L$Rbn9?Z-AS$-4h^@APsh?o6s^bQ4rX^O4-R&h^Q^2%qZv|cYWe|!IQem
zuU?V56%}sS{KoHrsdy^Y>S60_`Pi-2-LBI3w$I<24;%V=UW4kf86zCKaNeajbPw*{
zrb-SN)*<3IVd_3eNLAssd`<b7;JEj`);?b^aWH$$OIDMJV^Ia!^tXNVwcgG>{Q5&5
z6K@7n)eZ=}@ZLni1WO#pl^7%I;`D;x4&BMjR{ewhqU$`d2)U)tqB`oDuI=n*^p-Ow
z!Mv{13VuH2NmefpPC~82>Fc#dL?;^-^@ZErW)0qzyDia<-`iO9?#<N~P-TpAUkiJB
zXX%xeL}Wzb*Aa8KfEss;ks1Zjk;fbB8fIbvFCSk;v2A&I5_v9<L{>EK*s71z?haR*
zc{U`i9DCqi<+^)_m&*`JY}N=UU%YQv&-`%6cKY3`U~r<!{quyjwvSFlz?u80+y}a@
zqbg{DK6hUof!LR~o!HWo>yM)&zCsFaN`ED6e7f|t0@dkz>aNj0?teCz#c{sV<6HhU
z>+}?-`ny;k{FB!_a|sR#S53#_b${yVd&+v}eS|Z91fg<;(krl~jUCMflZ!Mi-%_ZK
z9raQ+r8q7vS&&K~Giwgm;*5qm$T83)4bdjQCD)gaPF50Jb$+JO4L&^z1`&WsZl1N_
zsX2w+ewHBdtfq_n3C1H)?!is@m9W$18{zA7SIna=DoHnk#@!zb#ZgCY(+GuCM?TqL
zw%_Pe61U{O(PGD}c_gaDvv4c~&$k-uMJaE-9tWGJTM>fqzE)9lj-xx*At6jDH{2hh
zt2xS3e}GbcXrZT`I)%q3HBX{L!xr<5`<1D<2gRM;fJBF9n;cfuYQ}L;YTP9<PW_ZY
zUCaKYD#38>TO32#Cvp1aVg)xcPWf|nol~dEu0NT94?TEf=QEo_XFL^4kYO*EX4`Ej
z;^h`E1=mmC7$OnzI30EjGEYAsNEKV<pl}_C&pZiOc!dP^q%zrMNZ4;lw5N=^j?`w#
z)%M5)vLzvcYO@_olLX5{$0KZ~I9_8gDO}ZWG*V}etMu<;HcI19WQ0y#@0$o!%}N=H
ziK@HCLx@t>O}&;<Q<u;7nj@*HFg?}VDTku0Pz!57KlwUokqGs!Xn5+a2LS+2+VYY+
zmG}u!=Vbc2i}K<v5S=7kMK+HGTeWt4gNsOVZJk>-cROij63gn#9=)D0ndFRbZaB$n
ztFsY5g=@Wp6I#2r+nL_Uoo$J7d~xs0&fJ9GFnZUi#1IVv354BxZE35v`vA}4!FU8U
z#Guw_jr+l4fbqDRL2bbax2=MN@x&>fWyZb!#}=)|wH3sVT<vyfZgMQnES%PtBp%@M
z^_nD|HTWRO-v``4gFt$GwY~HfOZ@s*8u6@P?dgLh*QXwF2Tw{{eY~jMmamz8OcGIC
znXYi^Ej4Q`xlK=>pX!uqw^W@$d2J`M(i^69zkyee?M(B%%d7Aeka~2>ZeVJn;zpp<
zP-L0fwQ_%`su*75E4S~ih1VF;SMgk$x(TtI0&b-%lh_dwC$ZxMd|?XrdEd}N>B|?!
zWp6>zD%#CQu@#ZgN{R*c=u@?-dcpIEE`DwG&GD@o^*7ZI$e)iy2nX`V(`r1tcE1_5
zM9UUslm3uPz1ij7;f?{Z#)e?2k+IU@(M-qEMiHtR<;?I&c+dXv79q^RLz+JGqOGv#
zxVggGtTu=Ephy_#IUez(E{~CLN9F2q=~zfb-K&gzYgIeX$@IgzLYa(PYWF>-@<((E
z<RW)(mwHZ@MO7B56Yd#)c|TQNQD6Qva?e!aV7lh8zOr84?jG1{uIGkZzQ^U>11?%l
zlyF0B7U6+47sdQwMMHh$guRWO*W%Kl+i8){fn#_Y+x%%m^JwJZV}GxueKWV_Nx~2A
zgA&twPa503E)PBSyxx7oe%Ahh&{1!z^&RMD6H4{s1DuO)94OP&%}8{td)<4LOxvZK
zCF(fB&bwBwqUnvg&v9h9_Xcs+*&A)5<(PQyP42A5eqEwZr6p~ff|X*8_ZdE=TM2`N
zKQxbiiFC;T`=kn7HIGNX-OVQUx!SqIEk1EK0|!q9-M`urFjb3WBT&i4TpXLgVs%6m
zzH3|8xY;`7apTnCF$TJI9kXB#-NKH9YXi}}pdVvisZaR;Y-SrKhKbyF#o9k)nRzX~
zGyBr~q4*GhE0Lsxbn75xSa?C)wn;8>*6*@#^kj>amPGqYpUAq}qIuhf(9`{a`@SbC
zgOa<~hCO-)r9QhAo{Iu3&SwiV_sc$9lHIGkP=53FQ}+F~Weg?+*FE@w8?kitoevk=
z`rxyX$DfbBeEvF5EAz3_8hbtMzRx{{`{x@kC{DWHZSC1{T!hV%tgrh9jFK{a+#WqS
z8;pLTlF|9y%HT!P9HS?t&T}x+6$T&%KmhRlcGvF9%NK;AY!`)a*7q+AG2y*mFv!iH
zyM6)Ux_d&KYzemEFx+d9ZN#w<;;tUz5C^~*gHyl;rZe;_!}eoV@mH7k<D0w3CQ8JS
ze9iR>#;Z4O#JohjA^x9xy@Wyn#-06dv73nZ`5UhJuODFmnE-~$0UBpE0?7d;?lAR`
zz_5qz<N%<RXi&pT9}?N1hoVHfO@t2a*Y2JLrWXX7sstlf1D%@g1ikSd+H#+747Pvi
zty^@>F(f!nIM_8Lq}3@nFhtKz1Q3lIia8ccjT;(mh_Q~&FyO`X`Ur^b3rTYe31ts!
zs1C`p4ilmb%PR^q)D0`#z6xV~8CJ?3u0I}DX&p{Y8D5L_@N~l)x5J5EhPSdusE&ts
zT1Q+`M06KLDC$PM*^c;_6fwviDKj21Y8|;n5jj~DIqe>~+~k0kfhPJQ->O9Ix&^F;
zL?MIRHv6KA+@p4IqwnxV9jHV%VMiSog`>Co7wrBYLZYww!uR^3fp|_|aAQh}qCv$m
z&fC#AJ2A?!F<_3^m`5?hp&?MQSn6hLa+}y^A+a=gaaO&t^v!|jdH~zbeHPU?73(<m
zow(^&aa^kYJYVC4#2g4Y;<;4gh5O@0$>YU#;OHWO!n~FYUcy(l1jXV6lHhpduQ964
z3A(CEN;?S~IEi{_5NJUm@eZ|*abn{AVjI0%cT7{_39Ij#hbCDmiDD@vJ*39ON=kB4
zwY>Nw>%b8|+pX<f{8I0f|B2;GE{|IRRWJREEls|@ES-gTs3wPVm|VE%2HV8y@dHhI
zlM{<IV?Zffp_*YfDH;7b;|VGJ9=D$Eq`b1ZExyW~(;OEk_PAgt)!#p*q&bdJKDE*&
zjVnObmm`f|HSL*eS|_!vL|$4eN4z?V@ngL7S33`2=Au0w35T+2uo^5z3h=Z|#%yTD
zd~wENf5!4o#yh;sRgTPc)yz$s%&pMOo#M>B{>+1&%nx{3$HkdMfjBvzlSl9p&|cGX
zOy<j-tSh{149=@;pjtMTZ8lC=HeN|Kcp#e)y(-}6Ksj?r)pE$ivjwZLi$k*<c8Dsf
zvNQm>FwR^SwcKkox#AWej*?uifm|NW8`tsk_&D>fhvnX|&Ep>67AVP+5YH9z%#%sY
zljO|j+s%{l%##z(SM|(ovC5a-rBK6v#T>?%F`mz}02Hsr)Wv_L&k4FSkb9Q~(}*)4
zO*Ms&rPGEL=)y!q`3z92Y{E{_PmM|E*$Z7367E(PXkta3Q!@($8V*g+dbj8a@EO>r
z6a){@zUC`>0V;B9;t+)vMthPzGp6zMEHua|^5wi6xl8L;QhZ&vsB^X0<8^U}ZAlYf
zNq})lN6r;#{Vme9wIYky$P`=BoEF+*wUQ@tu%=YC(gE5wPJ<55lI{|6<U(nS8ccn?
zgb#M(vACUw6KNGq(Og{-pG9e>T6xw0N0)fH&$;T7XX*TTd7oO@rZH{rdErKCS-Cjr
zFb&;+G3nt#@tSS<iYM)MD#@%d?5v~`g{nNYt-#<SKf^Bp4ALIqlYTs}*ykk0m#BPu
zPI9?WKAl<-<O%ELtp2W6$sSvcxmT@!T)FEB!(AjHYONYet*XYO1GSbjbCuAhRbpRM
zO)pf_fUB|gY8Xpvf#6zEyJ~9r8cvIvy|9{Vr8UCp)oi-8q~Qwct)-uL>$t%6{H?Wj
z(yqwbXzJNo%dYd)k(1PMjMwXV)vBr2w;<{tUex%c)?0Gv+1b@UwIeIuZ9pE^TkO>n
zfE$$UV2{&kFU0G8N@3o%bTWf5zwidf@Fw}yVwci-Hj74Gzedy2M#_uEfN)s2SCcTf
z2@$TDme!O-+nABo9C^{i65jagqRv*LWz~}|sg(6xEJ+iyHCw$^3)WOoD%iJL)(kE$
z+G{N5YRw35tpu~t7`MLhs<(r*>eL7h^|!U`u{K_?)`quDOW5{;+4O2!H7D8@FIomJ
zuFu)EukTean6zz#ckGmQ><xAt>~(wqcOG+fep2r|vFrR2-ubn(^J1{`a<B6WeD(iT
z5XgR@Fk+y%>}sHNXrO$5ppsy)ntQNTW3b+SurXq=xoog?Xs~^Mu#;d2#XZ!mG4$Gg
z=uN~>f7#IB(9rPy&?v$1IQQ_R#_+WL@NC5JeA)2g(D3s9@H>K$Rql~>jgd|Jk*$c4
zowAX=p^=0Akq-o;$K0czG)7PCN54djek~il7#h9YAH5<N!{8YMYK~z!jNwF%;gyep
zhsOvH#)t{Wp*-WHn&adS<CKx()aB!}!{hV^<BWt8FrEn(&53Ic6Ks(a9OV;S!xKCQ
z6E_Jb`FJJ;G$(}|CPgAA#mXloh9{*CCS?ex<ankOG^cJkOesfBsg_Tv4^L?xOlcEN
z>+($NYbH(KahSdvIc-!vZ8AK4?_l~q;fw{(jFslhLx-8ikux^sGj_u>4hJ(&31^*n
zW?eLAT^(khN6vbb&w35d`W(!@Ae=++%=v511v<<HN6v+o&xH@qMIOvW6VAu-%*Sia
zCpyf(jGRv?pHCZ}&p4RRB3#JfS;*5|c;&EA7`aefzEC>6P=2sbNw`?evskOSSg+ap
z-%?F9Fa|n#Mx1NRj2zckcsQ<eb8_<Ya0>I?_<z!ALL*I@b{W4oP5%YbH1R^^;Dx{h
zTsacqe%nuI(qH3lfM|T6_hF#4agd~AP&pzfdMZfw@13SQ7U7C1;eJ1yrYMv7DC39G
zYThw*nK8lt8>h)L)3Q7>eks#sCCeoxyYy|gn{UqJ>YSvHe{h=K<$M35)AX(g5mxNl
zQk=P3{GX|&p4!6Xx}eRv_>;Pj^oFqVhJnq-<ejFZ?B?jf=JNL~>6NV$r>*h%ZSkY+
z)%)$~wH=e&9l1rF$(5Z8EvT_w)T`32^r^1;FWou2e{`DORPFUu*7p}J547zM)b<X}
zd>pK99x7iM>O32+S{p$gjx=|S)*#30UypAMjW2DEcYhdf|2ok$IJG`8wYWdk{duar
zce?Fprh9+3|LZLB<J_CW`N8w~?xBV5`Nel17YC=7_m`Jf&z1)#-VS_zH$J^G{B>pI
zWOZs`{nNt6<hzXzTbu7MHfP?xpIdu>u>Jo1>HEct_j6yi-)`<4f7@AJ+g<*$ySll*
zdbYpu|5Hu>d#Y)pnDkewiTziq$^MU2Q_SB{O)A|`G}UBDah<`b8!GV+RMR>!Tfz1^
z)Ce?h86ZYsv*9X1l(P}1@NH#-NMh_LJ5t%eX46?fZFPf0W~^$H#LOMl3(+^Td7tun
zScN6vcJ9vmw5Cur)x=YWx0T`EQZNkBIi2sq<NHB1@uiQUsiv8KN;M5~{7y9~e_IKc
zwMu6SmR;C){5z^iCLK*R)udMi$hqRW|Dc+j{m@jC{!gmuJrqqfjSvZ+cm1TAqW?fO
zSx&(=iCL(_x#gXotnIfNEQIQou|Z76I9%y|P)&0aZ)zIV;#K(~=xU<4QhGkA(x>T^
zXkR~+_6`$`or0Fj9N)HA=S!KB(5a}ny+0s(`Te55{CgQG9<9&5Jf!2i!&Lct?{~E^
z7@BGV6H2W3YhN$4cEM$u?xU-fJ?CDkmYse;!qXL5!ZpUvB`~qW->k-0BeU?JhFcnQ
zIzE)EW~!R2&H7VgDAxh+XI0iQNyW-Hn5wW94orGj_ODcvdOA`bZgi%<hxccyspg+h
zO_@jCuwSVr-=9=dHkxX3{y{Z4{G^(g2+sh2qna3gr<#1bh<;K{4L_(RzHR+ssCwBa
z#^0!>@7*FDv`<Rc*rt9`O|59EDf7=%)0`!mYBKwcYAXDVYTCyBg=%V~|CMTTLsL!5
zzfn!m+`myxcYmjvo@4%vYN}z%W`pEAkdr}LXq=_|aHBo1KH*3|7{?h%eEJOGLiz2p
zQ&SH{kwY)1>B`tvGzH%t<X=-w7csSdDnLkr#4l7+<}Xwe)eowPi16iN#?&{t`jLZ*
zdp#0=qMEX)eo#%h7=NUiv}FB_C(u+=)2~$12heX+Q^XqRH>xQU`LC#^_#adg)4!ma
z)X-Fu<UgUBK7#7v{o&TXQ%&|c#7gOCs!8(CRMWNpNHx9wg=+EzG(?=s`?GMprMs4j
z7iNiTv}cZj?pl-qch<E(f0kET*X@0LuAnt7kRM<_i}`{n8Vgg?&b@~(pDKde3)Am`
zMEdieR1@DHs3wWOLN%@8E1bw_No?cXzbSruoPrZO0l3u!m@@FO9=i+Bo3g$<_xHUj
zbHiz=Gv({M)m+A)MO5Bn;_rsU_Sp!-N+@OcI8ZY4-t94cig}O7IR{hsh!v@;V~WDL
zZg#FJL{{B8L0W#Ji}cS_(=3PY7^d*tfeWbr4kLD>zfmNm?50%WBcqi-AD`K~$;Lr9
zOd#Bj=iTHjpr?g`>}(JGh8b~)DrKdQ3n@Z=r<&05L@f^;EKTMyg)5?(M<S110kA-N
z0t-B6(L39RThW?LI;!?_^h&#O9DZl}EP3WYS{K)9f5+)Q${T%>I!X{`+KqmE6b_`A
z>oq%Z&j1#RzrW2JBC(?|L=|71TF(+J4^_Fs|I`;i*7FP1q@JCo#UvrcahbqIV_KVC
zDmaLtD(8_!r9jaG$G%^tK$Hp|EA{;t%5uaF_U!1FY!cem+A2!K{3tIm2N1*HK~YSz
z3z^aG?ijQhb7W(W5x$ojz^q476qCeo+#lXE<9bLSg6mf0;n;+8vP!mCcCFNBc>mEw
z{v6S+e{G@WL7r@@>_kOFL*sJ12if}K3ej`En7#w&w2P%}t;Uww;X}99i{&FX1DP;W
zsL$9U)9t9n4y=Ko>-SmJ_Hsk$CcwIJHe@_|eT_=*9b&ycOudE3;C6Fh9*2CmSks+9
zKqrAiO+envr`P-Neo#$KeojU|sHUWUOEvBNpqj$PtA3}N=+IPC+$}zD$uQq3l%<ME
zhVaa4Eoq29p*@;vvLFAT@PleHM-gfL1Jxw)PpGCIa>3uJro1C_`ur6z2YU$--w&z@
z_LFMTi^018f;UWIu|h8Y{lJ~)D`1~=%jYDlCnO_ozfeuG3gCR5I&M041_?*XrS;fA
ziYi%M@3ssX+e)=JF2!;Jj4B$>!-Cotrd7{YCZ45qs`>28{zf$!a*UbN*UVucuH_T9
z6NVohHR54n)eu#Mqp2oye>BzfMOQNE7^4w1-EHt)7Fe50xS@{|_=#}A^;fEi4NWz5
z|4ucTp{XVpV6Y=_18B7QQT(Bzlq8GxwzI+j@OkhUW}&&rUW}BCIhd7-+r3*LWsG?o
z2eB-#82=n|`x8*YT%^^-zf$358btJh*?F0STN#OcIfkk1=$Rewu0!&|n4R?fYtB{{
zECI>~YgMX5o37vCY7lbA6M0oB7L`MP;z2zK5xX<%bH}Xg2Wi=aeQ^lWV*;Ns=IuDC
zZ7YdUw23mIuyI?;w9t=3|8Dcuy4)ob*m;aOrb|93M8NVtQcZDKu{!E`lz5*0947AJ
zoH?QmOyF@636ln3h8`QvF|dM(h~rES<2fj+ipYo^>#zn7ha_0!6a2d)@YbX&ZBVf1
zHnDdy`2;U0E>GlyDTJ$zplBAy=Lm0<DZo@;(A&}=3ir9Q<ukTFQBAWys3x|5q?%Z<
zw&!p}J_Di651ZU$ughJx{70&Z1<V5h#;(Xs$O1jEI3`3Pq6$FvcsxEwpwE?#a~lf|
zq&AW_iTu(L$mjSg)g%J}x=i8Z$pVL*fp$38F3kf7C;S-5u1%PW6a!;AVx%;7623#&
zvtqa|=XgA8`PqI_O+38+Ks7!8Ni|i06n>+cjDDe-y8b{lIschzlK4qA>HTY}so_sl
zlgmG&nw<X$)g(~`LN^uszehFk|3)==V*36A)l~SCYLfViRMRm~K^&@XOL@<eB;if|
z>}vkqmIC{Q0&N;mrc`R#=f6@-KFFU`6BD*GFINPUpb-<{!VzA_3fA@~!n?s7fmfbI
z4+4nORtmj1DP4>UnO@=<nIraA+~_~?rigP1)J2%SB92|bs#13AFn6;~rF*haQo;Gk
z*IYWo!kxmYP@*0fY!2ozf2y#8)xisDjZcWp7U~#Fs)5U$tbk>ZPOrs5Z(0a0vol(&
zKqdl|b!yPqD$sNlIPxQ~j+B^3)^K5<d=WE7uS(7Ge?m3oLGrD(D$K2QrqL4XYn|^a
zSi{YrA^d6*69OJbF3bM`)l?4>y~wxvjcRg**YX|J>g?hWxl!L^hrFvolSG8(!H>S)
z;;yK2E9B)1{)<$T2XOM1>QfVu@d=`H{d&6iU@w*0*A}&Gf1{etK|iP_raw?k4Zst}
zU#TXZ|25T=kEWX7*vJ(uD}bzhRhuiCY8v<h)r7>iIs&==8>&g>@2MspG}Xj~UGqPp
zng)KOnv8L{TYwR0stE$T8o;ht@l}oq=7!+a{GX$mB6zX6IsX&Yg!)M})%->^?P5v%
ziE0u=Q%%>gcmV&7YU25gYV!S!YO47I)f55$ooeFw6V>E`Z_o5Uq?+u(e6l~NrhGKj
zqz3$zYJvdE{y;U={57h{8i}oq|C4HR2CDxTRFk^wU!t1y{u9+y^9$AF`Ddz0;xAK8
z-2b;yO*KcrU#O<we?>JJ|Dc*Inf^>QRs4-=+WehrvK;$MRFguLm)_q~O@+TvO$~pb
znt1*q)x`D}sHS7!530%Tk5rT8zoVM0WB!3^atE3HYpO}`k5rRBPPOy@glf8j1OFFP
zlhGfjCfDDnCd=QbChmVvHKDN0eo{?*|Hr7NYLMmMQ%z<uf1sLb|4cQR{efz#`FpB~
zkLiK>PpXOgk5rQb*ywLmlj;wuiSH-XBnX#qMg9ZT#Q&3OQUJRCfoc-@PgIlMe@8XB
z{wu0UT#Rkbdot<uyJAL}zo(jv{{z+3|F5YgkH0`Qss44UiOuaS{8`rt9-3;(V!AT@
zg=$huInbWL`;BVqr2lJF)7PI=)3vSMA5_yxvWxoPsHRW<CDn8Y`fsSFMT>t)HI<0}
zN;NtCq?)+?k!lj(1l=_K_f%8-52`8d2h~LP_f%6&;9sMf#DAfhm^hA%{w3A)g^XtI
z7ph5_;6>2Cq?#=LMl~e{qT^TpOf{Y2-1Hp_o>dSQ`$09)qN%1gbH7nd4`P+F=>Kb~
zN&3H~nvUo<V*Ux$MCbn-)pVaZ{+i+qy(B(<>OWCUK0m0Yy#zGXWP|gAYFhY}YC8Q%
zHF^DKs>$sK)wGGTAc2SZ3dZXfa1&v+8u<ykh{JjtM;LCId9`*Uxr4xWOlyoc8^`7u
zBeeHs0LMNFUZa&fS^IlmZu=ZxSs_#fT$8}rd<C<;F_hk*oAEWopNh2`*MW{1JaMK(
zzsp4AH>E%!WB5k=d^}jiy9>O$*IiMvie<Sv#%{4rLdbCk=>o`gyS5PE?FN??kS?Vy
z3t3O#56RL*#wylOjZq~5y2bTuqY$PO^rNxLWXHPFFIZVq_}wv&L;2W0#Pscc<^$b4
zv&3Eg6ij?MPAqv~iC2-V43>@!rAR-(;R^{MGu0)&e`HP#`q~3AX2Rm|&Lif5bmx9{
z^5eEw#TSX+(0NdcQmWvP+qcTI&Bo|^@LiQQKjcv?$(5o|fmm(otJL?x&!1^#K6Jqu
z`&<y=TML{bk7wH|@{_lv2IkEBVS{2Z*`$mjDE8F}D#n<l^Bn_XzpX$Pssc~7oPY(8
z4FuMXLZ%@knzW1soY$wwI{h`is=hM)-IV!}xY|f0g&saE5-K>eh0|-3kgws_t8zDt
zIX;Z%)y;Z()|&(I&u^pfwsb;d0^M-Uu!b@TmI9Q&Rf7xwnAcBYfK1}lp$Y-V*?60j
zpi7wCi=J$H?xSGJx@x@ew+U?2HY}RY>q14aw<8}tv@5RR2nXy`mb<uac&~V3Hcy-=
zV)!K*KFuZ8Y0JUyX6h4{hT#ZXj~0HfdQIG+D|hAac^&;<RN!-ylM+rh$IZ%?W1MpY
z<{ThvJ0QW*M8-J6-j)mz=5mY=ba8Gz(=0VT;WWJ5jo*MLR7i4_nt@Yh8}PLoJEX?(
zeYi~5O17m$+R8P%9ErLbSisgXuc2`@hTh*~h16FvZyGvc(r~X*D~n=)-Hw1J?kFLT
zTokbzyzpuITB{6|-_3joaQ2%yUNDmi!P>ZAg|92?@Uki@&dZ#ckOT#uiS?uYW*!P{
zy8Z!IK~5Tl&HiY$MbCYKqwR?BMF@%_IHYI3rz+HydzDlo1Vpw43p658q|m(<5?tSS
zi=(aKQHpGK0K(E77w0S8GMRI1sObi<@oMM|q!^2x%GmP7lQWwLQANqmu~;U3h&SKS
zm9HnV{<KI|E8ZJ@5wB=M-2&z)=%NC6w5m6+;b8TtT<75N9s|?YCn%b))N-gzfu;RX
zG_Q6+BrO4W(w}nF3v@pF!7%WwSF%Z;X;s9nFU3fjc6Sv5L4@|>#4mc!$n0Z!Vb)CG
zyR4_xgCTE7;3uja8l_aB)5<bRh(|)T^TUoEb=vPWb{shKFahp>%<yLje2^^ewOvIl
zRsg^_rk^lUIF<-AJCXx02NN73`_dbLc>I-VK|Iy1UJ&Bvf_4(X0ASUQ?T%S#eg+ma
zn9_1=On<vOOAyj6{+%2sX79{!<vJ$^KIbL&c86tL_Q^k9UnTagTE!6=d(Fmt><Hy*
z8?KmBj9$-(zu(##yOs?HULV#a6*Hf|&W}~s|Ll-V(@Il(`!u2BUg=W+e1YHZYwbt|
z>TwY*3G-vFHkl`oM+BI#Qgz&}6F#c`75^Pb?D=>xiF58O6dP!W6(){>Ek|`h7eWD|
zSI_@QTJODd&9k?z`tq?zlLh%2lkTW$K7oe$+Q!!Q>$jtb=Om#(67#-W^>*K%Ym8kU
zChLq3+pGpPW?9jA0~BV}6Tkvva@5!5K~zgCk4ZMYxA<x<!~!tRUCJ;=3)m&EFEM>W
z5_cSNZ*_y@vsZ|zWcQ7TuZqXZ4~bPF!pv#NNn)zi<9DT4du@*`Mp7J^9jpNW5>Wu4
z14gtXzyzRj@14JE#$2BkLbP}NG<y^S3&6XA0dVwZl83{w(5*qzqQTS<UI11CE)+0#
zfy3!YWN8S;kc9)N#7T0RNpi3N)*>W$82HwbxJT$~uW(>U!yQAw$4Ly5987#VI3}+w
z5de<o2-uUrVLU_QO@ObYAaW;}vv`^FPY4`#C_WtFk_{)z1^}o4xX1<o9TJl@R!bC)
zVGaPG&)jN*Fn9&u@3jZ1N(UEV)`sBvK!P~}x*7~Su76|F005>~Vri)0@!`Us70_%`
z06~=;iJZh$l8YEgKNg?}V-g78LbFZTot<d534)0O2f!eh*pi*!xMFcuey~j$ttcEc
z+f)R{V~2vcV~NcHEne8Cc5R;p0?iENZ}kYE2c-tQn+(l1%{8FeCUI8iCm;}y03q{P
zf^@!H`dhbKyc|uP9Q_nPYD4DM14ZR;5}+}F{e{>|@nG;6oM(ysokWX^JCIw0fJdYE
z`&Y%+XtqfOLD~#JzdWHi;Dfq^h$If0ZDL)iJ(Ixs!8UP7ks$o!mSh1)0s12)^$mbD
zSWZQ<&Ba;_%{E;Zh1*I(@jy}!Y855XY||LRsjkiGvj8?bfIhi>OkMFPUgnBwL+Ke8
z)Pyyb=C-0enr)H|@N82CK$OiSaoj#5Fk+OR8uv!42i|s9>IqRw%4Z~skR)mDCgo5h
zK?ITG!k^lA*XuVDvkwsS))CJsky$9qq1h&QUtxfsOI0^M?*Qa12sovj@C@K&4v^G{
zO=F3bzbz}m9(xuq`?^+vf;EU21c$gwj0->|K4G*F^h_-Fxg-NjZ!3)Fsg-^UB6EL}
z<<Cgv{wCF)^<{p%dlhG)J1{e@ADP|X9g&q}B}tkBz!QZMilV;|HbF8<=$kYNo(zc-
z5HKf6YJmxeQBhUwC3Sj3I*tL9^~0bNbN~Q2Rbo{h2seTN79p`$RkvlYH)#ry1xW~M
z4k~umPhx)t_oz?B5<6;=K>e_oVlNj5LpS^vhcrnM7$fOwjn8=T&*1$U1wG#J28)Ov
zU{kV4ABdozdo+X^AjBQ()K+V@tt_pgVwvrS9Wx+QhA@>K_CbS9eOUHruxShpHepLk
z1e@~0@p-Wx%7O+-{eV<sHTG`^E{7G;k>><I!KM}e^C=9RzQE;H^lf9sm1l4>UMzfb
z_#vsTcpo|>91S+X@eQ#Q9pN}VAXdZn+pJJrh!SHWlwevXUQv*_XT&8$9ePcd6b&|I
zEBpYPWaVwwB$g7i<;6!uVu8w`VHPm~Um`TF9%JYWtjSVn4DSK~SlO-GAULKW!j@GI
z5HpgLh9nfik_rT1?}KoYkr?j!58WF+b3s3wOp)Npg?<ZyfB+ySjL38(32W?SorVSo
z4j2OrdSUMX0YK|IEhM_tzgA0UiY!7>kqVB7P7hX{!uzab=iY$n=pR)E=l}sI5~lFV
zrd%L6WOM*tre5|$_^k(%;w1VaIm~`z*btTwkGX(nYoT)HL4tv!LJtin)DRfvn3z7@
zhg`8wv$4`2#F??*CDjdDW`SB5N?fnTo{4~xxXaRe1U-`qeq407gC&UcYtS9E0hSZ!
z6dCI-6l;d7LY*^93d0Tx3;?qOu3ntX5IY-ie|=?s9LU3odlT}qcrla{civ$-{H$(H
z?<+Pn2rw8AUC-q(Mh4J`_LunwK>=_u{8mEy92@IPdQr?UQ7o;G!7N8OV##Q;DM*ri
zzEgBQgD3HhIU0!KO(nqu;$i?d+Mgu*Kld@tJfX?KqP)Rklnw|qHaG5cG_HJ=#bUB3
zZfnxm&J^Jj|FqA~x3oq-1f+Bp%A3tvw+XI~G=Xp`p<cnHxJ;W5=A%|CRZFTmv6i0P
zS~`P*upI%|NF@?g44kSZ5zQRv(o)4W5)vw1=tQqS&+x!Q`1wAGbPOCbX5cB@53D0M
zxQ~U#hwzIqELVV>M`KqmjzG@2*|ysNqL{n=596BK%ddNx_DQ|HbOHip0niO45PHGc
zev=8h@zn@`MFl6AhGLy*ks<(A<S=Ye_}D8yV9Z;vVLUMv;G2Hk<4;JbK%Je3aKfYM
z6a8*8b~wh-JyH)D{3V^OdvP1L2z{7L5>(7H`UKxEha-7b=n(-J?uw*xa{E#^B?nob
z%I8Ss0LMH~q`>{pk+GNd?`|M4)P!U;Lf#g=2HgT<q?2Q-#k8K#D!NJl0K!nGBLpTd
zAR}>wO3Zw6EQsD5<7q6O7^F6B8|RC+d0WUzMn;gTDF6qK;h=+x>jpi1E$~nUf#V3k
zLz?0@n5(wEy&^#@!qhRa4FTA)BD^sG5hesy3}BEHo6r!B<u2{M36RQ!H^p0#AP{&|
zjYLW6MCd6O18_RPf*fM099rPT!0`a>WHIn|D@;5cK~6^iRujPQ7E~k#?(q#EVhFHL
z#}+pO5Haa+#sF}R%p~&y9nc`5v_(=HKq?469zO^yLXymDKNW;hOk*&c$nZ(x5KLJZ
z&#dF%_P9X&06J>087Q-Kq`1mjvblM>ia5LQd|&w^GHT&7lXo^DlXwK^KPdu`kKENC
z;FpFH+=%UNH^(;xFiQsiU+mpwR9sJ=FZ#x%8))2}Ai*WLbkhV0P6!S`6Cgm)5J9?e
zm*5iIoj`DF+$E6UPH=bU@_(M0IcH{`b7p3(Id|Q)?s;Epzu8s0c73aU^&vUb#?8^T
z*T4jU7EyYKOf&#uq;0rS5PeTLs%SlotbP0D&jZ;vz$G3$Bo71ca1n(M=AF90h-PN>
z_(V~FZ{GTp(8M+;;M7<q_zfHy(}G$jbDE36Wb`N;S{t!OyL8K-bk31Xzf~qRWAcN?
zWB8)*!HEuu0~|D8!e5;l!vPwAlz25FeE<X524(%5@!oZxrR0cGeqmGJ{b+x4_9D&E
zKsMZWk6;tqSK?|itRJjF+7`Y7PjHj~nBRh8YAZ1EZFxB4^*!=@+4uZhT3~v=5GYFk
zvQof1KL5x08aMu}P&^?f1)z{5P-%8UA~j(D4;oS1bR{R?J&iE=5C&Aky0U58<>Tfr
zd;rBIrl7SZW3M&ZC;-p;k6EsD#P5KI*Q^~<d;Sa3fqKI;wzEj^+89a{1Zx!2>7y|1
z654^A;^{9aHI0JD&{pBC6|b-f@h3&KCxp<TO_H`3o;4=u>;qVrR_IY?2eh)LX#u>F
zfg|y+N^}TI<->YdaLQP*AJH}X#9Vj`hVUkucY!Yjg`;p=An_$aGs>s=4C9e%!g%Y5
zb%6!BM7)G>$6%u^HwHhqiLHqWxG*<ry?z(^2M}rkpsxs^{k6<wXNw2e^7ODH3V!=#
zcqxI_^70j&YO}@j!<bn%DznjRrZpAt8`TNvKrD^Dzz>f?Q}omaO|U#6?$jpH^xNa=
z?N<~%C{3+Qq>9ek%NDc%S|hQC@i4gA>gtJ`<pIVrO2M#8n}faHx@vs%;hur{lnUTd
zhA|cnVh8Xk9_XE$c<f^kNy6XCN2}*-UrR^d;DbyZ=X^&4t%CesVl(?q9lRFzdl}^e
zi^5~?M@KF9<<bjOnL@`%&s7Ht5-|s9Uj)8-c#>Jq7b6<TH(LD{(lmt-I@xh_IQ>w)
zb&9r+^@ubjj-u27zOqJ>1=tC)Mt|B@sgfY%bA)d{B280orM=*QB{Y;>7&aWPfWE9D
zjPzq6#56rV2zLPhY9r#0!Rv~gGM%r5w+H29=s@n+45q}<5OEDNl~Fj#N8$Z7U%*Fr
zf6X8>TRYaM`()?-Ln|{1Dh=RRo6sZT{oT!<_+OYLA5TtohL|N^n<ZjW)U{g3L?@lu
zn2Hc#D`BvGT=CfqWHI-p7&v8dczlh1FGU}_alogBBFzWC4-DKG`MDXkZb1@Xf#aBE
z=HVGnaSVITlK*Zq6+GHZfz(02RT%P2DarT+oZfh1Ms%Zt(9z^XK3KK_&>?_#A2C6$
zANqz(>qxPX3kpPXsP^eE&_v-jqfpjrttT?>M4tlGJLP|AUrhV%Z|7j>xoLWMH9D6%
zN3ar-%|iwMW-}e{W9$oGcw;?BJlK)MFM}D7A7<a4hX0W##v16{S8Efrhuoln7hEW6
z+BPH}j&;^iL?3M?OxWe0Q&vo-UB8p(e%8c~E1>-&Jb>5hPXR{+o1d>dm4dX2uRb1P
zycSIn5Aw6B@VA;msDlIFj$RS#1yn?%+86l3D*VkMbwNb|Fb!{SQFO?qm!ZZrx(wny
zJ7zcl+Zz>&h|79(v7T=dU%>9;p+=tDwe;02Ki^M+Kq?XE-OZ5%63;!Ot(fm>86+Oc
zlHcvNj-L!B3cMwgbXuYLC#va$Z8SqR@R4c~di!{fk*J@j24ob0)rqOi_YBg33IO5*
zMB4ytIgh1a*1cCyPIT6d45jHp?lx3BMli@RMs~*!4b3%mM>_+KS%NuybanHP;o}4J
z!IZ-Qv_aTXL70+30Hq`oEDRdmHV%|FUjnSTrJTp_tKTb82};p#Csn>+qV4lj6gWNz
zkSGL#<Rr9XbXPlnar4MXpzfyOVQ_@U5Wp*Gh8Zat7(4w@vAuXqGPv_2i^YBDE7svC
zIMlQNqmLS1$=_W-_!^Ydvc8C8F$r4H!@I|s5?7P~fi@#Y?1S?Zdz{bLNRR;bljeIE
zWXICEmoa~-qZ@~-cdUm^sI#q|$W6#e7NolC7(@Z*a}E-^Ol1fq*Sd8K5_NN(3XDMY
zWD1n=Og)6rL;7P!Wr5c&xOjG_tC2!(;OehmUtOQ50`*fT6v$A2JTM2y!1TmeldO^p
zqg65fqMGc9&ce_?^T+!<`%Q=j$IL@NgtB3uVs!yf^jy^R?r5W4Vq<KQ`lzpHFl?ZV
z&;KDom0nxJG<I283qbu$8`UmGPGj1Jjt>G)i{YOtP*dD-12$1b#{?)X3POs=S;d}f
z07%88U<ed65&*(haylTzfd<|51sgCZ7tXL@O}v3Z#m)!eo#+dOgGcy3KuUu6z`Fo!
zxtsB~q_>mXfH4k$QUMk^_#1lvpm2dD8g^EZ9#&#BF*hzc+%E-#+Jg^)l~&K!f&T{@
z4kOaqjO5aibH=6~=w%Avt~oUu5Y(SA8{lY>bN1t;n|;WN<c43asLP~hlzitl?_B{h
zd<XjxjNAti;;1Tqy~3luR++Bwd18ZBMSd?7E;OO3Jg<?AZRq*zx1<eh;OWC%j_M?e
zY?Yk);+i>bi#yH{NPT7W>z-Qu=!zS!Bi1uKZs|Vm41wY$AOrWO9XVwWhf=06jgb;2
zQH^HHTnO%`cjGurc|kG6{E377ej4LkUSeicj<0ln=cbrcw7)Di`6FRw&B8yJ!gZv?
z8l5;7C_O`C9x6nCAvhu_v%;*#BEEC)Jm?If@8d|CKt%3~6XXoxYtcBNOJn2O{~<8B
z%^;vA8HbE*b5~X>kzLXdjWDL9YDwQ7Me3hzoy|UY%V^G52uv8;E<eZs+_OMqC~e*{
zWAt#kHVS2o3Ix8&w_BzuB8{9CH)5h*j;1A`y*7+GdJ}f|y{!@0zDw+Rh;<a^j=h!y
z_8)XHkyMMu*dkn`KGGXK@6I8}P>On@e%!<OnZ1*-!Osg{l8I<O2Tu!x0U}z05oPN&
z*g%-bq54d4zA>CprOHrUUk1Y0$G*GIxIo|#3hJq)(7Cfrf}~47VQXzH;g1N?ijy&%
zmzxCkIb-Df0~SYi%l_g)NT3kcOZ<+4-sb`WKJuqbEX;kxHHzQAYUSiS5&R^>C+y5@
zXN^J~U&HqXWX^n2(Zv=&7U^YeL6Uxmarj_))NkcsLHAR1l`i)&`_YEc+$RR|N@ptD
zZ+=Z!(F^3X)(te~11Zh7S+Qke4q0nec|=aI2v-#j**jOIM6FpqBVY<We8xpE7?mOI
zaU>6+Sz#FhbuiePJ#h+h4$5ZOkpEyB>Uiv8tCbinf@a%LiBp|n&r|><HXzYYh2Y+~
zD$*{v=LW^v(3Qn7aH<~#znpL}o22j~J~qu&1elxc@);;gBh<rHPBMA8V`$VWaQuJ9
zs$!RLsGZcdrXCBid5J<<O+H64D_YoaWd2Ol(u6XeqtVOQB}!ARp?|Tnq;%_*1&e5c
z5a9Pp<`qdYGh<kfH|T#GF-2o=xP0Ij*6slAPXtNp*nmBoGRf3`1#wO}`W^0#0$GlF
z#PJ#ZH$1cP-41ghhn0_lY^HDdDJp^g)9H9VSCCXQmu5xK^w5f2)ng?k(HkLspU3Ph
z=~64PpCrINOxVWKE=bzI5!Yr@g^Y3xi|YC?jEu{I($J~{zi30lz8XRnt=EV19c;v*
zIKlX%0M+#y!~B-oWEch`r4Y)I@5{llw^TV$+I7b7qAS^SEtkm7>q>Nv-N*3z@HsGm
zA(UFB<j1*HucV#8_{cFiTjDOS`U7wYE^vy@O=~Zcd@jVv56ii*(mOL@1$)}AqUVEq
zaMm=`zv8cfXYV?39@BBR2TL=OBy3xiLqbfArVkAHL7j%rOO)e6L}5?1u^iPATHah{
z=3Umvn9f5JDoAe>fwVJ}q5;hsRM)5GB@i1^hc?DU8MMzl&M>TRmAuqp8LcNT>ET4=
zNdm(c(Hp}GuJ%>$%%*ZPMUV(o0>i%fSPDC*2k0#c+1sIZ@rfyfnz7=YqL|Yf4|lSv
zfprdOSJ0!Qe8~mOgmgif7@igLU;)iA^^eOqs7}0!=uB(ex?*_}Q}1Kng^X&GyZ$Pv
zu|&{5oo>WkYkT!wfmBhI_;pa`@PM@fi_djf^z;fkJtrofT7~bEkB^}+`csBearB)#
z227Hl@-nBp7}7Ul572xFjAaU*tv+E^$+onLGuOCom9Y%2G5U%3!jF(caT%-}gcN6T
z^10~$Jkj8FC~5xLhyM~vHYzIGPF!~AFZg$=iJ9lI<2J33wTkiyI~|3)G_BG-i1x~)
z9Yw`7t+C2n^@#9ert}&VWby<_k96W{+#0gBP_#2v6Y3gfK&jKMk@(i5sE|!bA_;bP
zR)<5hj7V90^9&TA-je@w8b-{cZUx|ZQ?M$RHLcyH+@T#Crm!Vnwa^rju#+)-siqBh
zBHE5`;OP6-qkR+Be-Zo6waSbB`+6yNg(@oVC6c)1FhE9fg}D5(OR(iA!dr5UnfI#i
zWy^8=L#yPvVENUMOUp^<L8J0(HLxM4%@40Y9BDg7EDjAh8cA_}>6y&W9KB^9esXqC
zsaN9Y*U5rfL_2weE58eJ!@}<`(V5q#B>Br%iT!g%CBb-%bFHAOnu3l2CPEy$gN&B^
z@?%NMXdDjo+P|o#>+$mYv#RvFK6%ZX`S&qZJ+1fWtupt&2u^QLS|7FuB=4?XJ2uk;
zu`^KUOmFt+QF%;nP#92&7|`TRZ~CCMcw?Nw2;s{GUMo}!?r>>r9a?KN#Y<F6<6tw!
z_>pJ^g3=DXSH3DnzP_HXl?P#x)xIaCFqyh`{2&DIr>O)DboLMR^V1G-04jE=uV}$T
zn%`wRt72l(VKg^ahbbw2SRCo$ps#2Jl+`lwbdQi)ZrSt`$UhYdj7pE~WuOw!LR>-N
ze!p=xwWzw)+c>C;FceF=%&rEP3kiE^SIpv~7G)|C6q_Aj>rwD-49Q1?P@U|vwgiuP
z2!A5^XB<D~;Yoqbj*ux?;BKNasGaX}S-v8SJP1L;=QCz$N`LCh9)cuVijYo4t>TxJ
zS~6kUH=*S+BjyQ{=4&VXh@$f(lfn`~p4u)V*RHFC;C|$TcH@SR%)@up=rwvnuVgb2
zS<lKMgr?A^Dg3G1mpw~i1N>j<zGu>YpA!jKWeU%RpDsUR#dhJ=c@_l5%XskPHl2#N
zLX8#+KRu;*vYyR&)s7R^&avC3gY0C`wvfO_m-g@#p7;tON%!NngryOlDt086`U+cj
zNG^3qZo(9Pqp|5|!^+V7Hao;gUMUR2<U`P2m@z7^bST+&<VNR=Ia<mtun5~)Xu2|g
zjn;o=<)a$KEHWd9p%$;MMXZqq*Vt##Tw(E1L`g>y>O_w->P$(Ur*L}AbT*|%Z7p$l
zJTY&Uqx189DekuujAZq*jI%*w=tVG)S?YJ^P7HR$a-+mxV5l?cC-}b<&YRU}S&rVb
zdUp0lnCQ7lzm;+np|*pM_Dnm)v*h8<HpU4S-8WAn?VsqB!GM=UO5G3W?7hV1WSx>E
zzQPQa>LIZAm6q0JtR17d-{*7H{o+YJu15dp@X;KfX<pZ$S@)b~mHD&&buUkKl=U5v
zA8+b1B(_t>3NfPeL>h#|$<fp(H3oLJEd<X<zv)vrod23SPap|X;qzr7*?^2veM)2d
zOxG!S`_l0kT_SHIscs#=7geK^%BlTrTrZpFy`SewK4c;cx@iQ{X5Mo1v-#}z{3_pv
zhyC5Q8Esm}7adAb=~&-uIX~$szw?*==biortAe)+0(PjJw?8=s*LduGXyn>Ou(kM4
zkvAS_%yP04j&YpT1#*9=BNR1AY1n<w3nKHD17r)t?q@Y^3kta(o~XHQdXjR;6t1eV
zbFjZ@$KQvWEW^m6=7~tqE(^vuv^zYkkZd4?P^T{!7YfZxJ3f4iP`l&vn_j}i{B00w
z=PmoU-yBiNGb+$6Uz|MUCx5icXf*Dq)1_n6x6w1m{yaN}v4$Z(1*74KuFJncV$MS(
z3YZ3V+e9XO$#-L3q;llh7I81FvU#)<%;j%av};Wl7L^s1J;|lcVlKSO(;%G^K3<RS
z+g2WXsy1aS`_z_I(U)Qg4bLw{X0wCnvR!blEdocYG7Bjk*O?@Y=TP4c@%qE+_vF@t
zq}YM8R$5OB^-Zk-j+q)|T|lu<*p6d=ZWiv#vC%dTNfc?hhxY8@4m^+cm>jyqrQcP<
z>)z{}RK2KYv3a5->=R3{vLw!SR<39KB%50X0Wad;3C9+`U@y^PuRktsXo(gg8Nx5=
z0N=tHwEVb0NH7<)XKja^Y=`KP7y+<fmZ-3(P`kW{+Tth~THqQUCN+{Rq0#HS;4jp`
zNF51amF|3X4pEf!KpUY@mFe^qR`ipefSLcWl(bZzP_wTrgK;AZw-wvj*14tvO6&2T
zc4je7W0p<{XmO7k&D506UbC0A*eiFI&J}HoH9_asOBeRJ7tifw=}H#=I%c`pfnNqC
zDO<kYpiYIY2$!wakd2BvtV#2H@>-t=i(c&VP1Jbc*|=Vw7T(|Z;9!m4@lk$=&Hra>
zR|k<sp+QL5&ce36G|zksk9keRMA-ONAHwP<&%t@w!F`#+uJwdmY{JLaFzG3RR6o4D
zT!=M{Rfzmh{yiIG*{W9gX-&4T9G<3C4h=ft6Nl}uPiI89eCe*xls=-=n3P}Rj;*me
z+?4Us<+TUNs@h=0?StjMNm0z$zml;;;pu`Uw3P#tH8!anPzWkOS}=~n;k$+@=~tB0
zK^+9kz7$|C)YpeegAS{<6--X0pUo>2C`z^mVYG=h1zs?+Af(|ud7-dj!FME4A_w*e
zAKpWXD5z9^N(b+~pIh7r>*1#F-64K${L}S^w-j5j9dUFb_3$&+a4dH}3_}ZI;xRnt
zO|XO?i}f_=dwykf<K1CDe9m4pX6&;Hz!hI71<;R%fo-CRSG59(x2dn<R|%0s;|b=N
znBpg_uSC};y)x6Nq70X|Y>(qnWr?MR>c!Pvb(~i!D&QSTmT=F?s}fdq5?xplx$qP6
z@A$}7Dx?CywQ{tnM^Lx`)W~^)hEH|Sm!=0@NC`o_!vC{PfUxlU?UDscn9uXnc7g&1
zW?tyCT_0Yh4ktWxo*m~z#W(Z}q^JZi3Q;7>dp|n1AaV&gs+$ff<=;{moA`;9tnNf?
zXy2<eS7=aFIrn@h6qT4Q7?_#ALrNa1*#D4H@ABB0O^v^a<RU@44nxJv9qXsjp|Vmp
z#UrB(7r4K!lAfx{Jo7aZ%bY~mRH6z|Yg;_q9cLYcJ-_LA{;oqBL90NY{^CQmkVmD;
zCO*{!Vyr>{8iW=qIdWvYrL+X22Zxh)7E7T0-Yx0C!$TgJnVvx9Oq@Cy$OVA-a;%#)
zjM@9*Yo~bJN(>LKtmtmamZ#5Ox+(geDtxJaq-Md~P>okkyz!ea>STevn-CH-txwNz
z^*h0dg80mQ?4k&=_vqZA{JKCt#5ZSFP9^pMzZd*|P;WtIe?i`x@0_D;zpeaOhw%+L
zPhNlpweS!YH@+X7CLi07<UOR2Y^u<90;t1Cg$E|z4)hX)$#PtGeC(5jrdQGgeGs}I
z|GWh%e@+&iQOF%tV<YGT<ziy4MSDN6`TpjE4(f&DNP&;2Ej?gutmar8PVQ0aYkvWi
zUz_|e)}};u!lMKQ-oi;@V=d|11$1Gq!V~y82T&SazMG!}n<|pkkS5eBzE$53F78UC
z!j{1zfl=w7TGgDeYP~Pqo!o!cUv&uRb&h%FTJiXj>m@=m&LE(Vh`?YT&kjRoM>?9#
zgWFLpZy&XTG4_lTN;)=b0G?#F2AN|myML8TSo>5dD8S0cR#501uM_stPg>FSHL>5P
za~Pe6y#k3ZcLAXs;DL-9QVm)AWkULn1zrw8uQBD+5)C{PxPjTgg3S*ABN}ps2hk(q
zbr3tTv)-vAW8q&-zh4>m@vJ5ATFKJ)V*5v>$gE98VALevprx$3h0>xD*uX%SimK^t
zDOE?{GnB+jUykBx2zESV$*_vMK^}FT%`!3}TaK&I?U`ODP7sW&j=?1Ehtr9(L`r!+
zft>M;Z!DT%-aGO9#Wh05kB(iRE-SvuI5zAGiE9107H<-#dnt-{a3-EAt1{y5UTX*B
ztGRkC>9Xu}R~KW@j-+7F5gkD3{fvA^5bWXEIRcWi-ywELuThXpaE0np_#vsa5yV^$
z3V<hp6-Y^khsMTN=QM?#;jXV^Vvb`7G)3tzIilq9ZaR3_&+Yd=Cn%iz9l(Wq`753M
zI3{oOM=YYM>$AeIqUllag0xJTQy|rZX~ceMFU{qvcfq|ukx`!rxRE!#z0L%3WRBmY
zE84_qkZ2bIS?SLN6B^ojvSkKW^IZIV1V26>oD`8<^HJ6=+>v1Z5IkJ|S+-x+?Zp;P
zsY48UAO0<5@CwGC3c!Q2jrYLElr9YxzZ{Xm#)`;krco8f6Sjjp!b>_>O~r<}VLzAA
z^p%k~v{#ka?E-pwRGF?`(>_i&XpF&>>4q$z4c&|$KWWD`i6$iV;179AS@wCjOa&la
z<O<*NVKuB0DhUcE;X+)9Up24Z_~a4}at#sG`D7dTg#epM3H;gydPR(+#FTuS$vg4t
zOwUC>c|qL+f}1)!7<Kq>dBgQ8Df{*gw6ab#WU2u*!ALUs+t-|0wCp1?^P_`R*wS2e
z{y`|5DAR+r_YiBw<3-7z*)_m!7)v5+=}Vj-&Aw}(-{o6^ttz5nHc$N`tBmM0IW8Q*
zKrcen&S>fEoaLLNHH~kuviMW63AUd&yzr*cinCQSda9jUV@ap}^cI-J<L@oXW-plI
z=kIR?s{`q+ACw~iA+Fo<@rwG^ToQyQ#3_leV6tZ~PK|1_<u-yj^HgU9<V7O6ES7g3
z6dKJ*jVmwLL-CS7uyuY6*5-QiO<j4q#_fj8!KmJ4>-Uc@<nK+I9qqqmFb>eSJdv=*
zmijaKOWn{U2tRsVeJ&!g>sI<?gW~&|G@I9Hbj-P*Xibv&+~%q}x27;#faO=8gZx(Y
z^vK;yemNmqGU~fh2ks}VHskyRS9@$Xa-obTrf7Ff<l?ioB5EEpM<3G`#qV48L<tKY
z#VDA8_Jv6KbIpDst{X!#i=L=~NM_xEmB@frt{HJJqnVx>TD#!FbTZ6StTuY|u&w4x
zRO%AGo5S(Q)=jP^Fs$K&o@@y9(?M`2_&H6qT<uJ-Ww4^%*qf%ujgKcWs)`1zF%RM&
zrclDk%r{rD_`hGSVR{q=ZxD0D!&O3Pt&PHah;v5e>8U!SFzCHKrV)6r*F^pOsRi`S
zgVoJ}MRMM0TfTV0+u-boiVp>=exLQC(4sCqzQRCkXGj4eduQd+K?nxzV*o2y;><3W
z*%7Ge-5KQ9MzL<AoUW9h<yz>)_sn)Yic6{}T^(<znBH@0MUmb~O>|#U=TFGnGA?|h
z7uqEuM9*0Dh-u>{O#%(rL|#8qO?vg!X4%P!>(Q&|vz=ysnD&QPa+z!LVu<kHzvl`f
zsU3pM+N`_|m4|*=7odrHhs-+7IN3O&gWnjovB&VIGmnw;;_Lema&(GjMLay&zLO6j
z)@%Eo%y@gv$Z2mLgb4WIx>`CF!rek)LHJ`D8p0d_iN#YCq@$D*_A0>65m2uu;CcPM
zE@CawDlKU}Is7^gzk2wFg~&MJlNOcm55iSyPb0JJ^pDk7a-gX7V7ayQO!IMi8|Qn{
zs2``%&p{r)#aM_FHXg;WV63x0QO4VP0pTj0@Zh~JHJhFU>3BjIC{4tsC;cV<a_@Q@
z27T(}d)FsXhn=(S8y$rDZoksCri=2Oy0}|uP6i{B0||wtkF4m@0*Tm$q`!k#^_*(n
zSfpu6_xa)F8@uGv{+#AB4m%Nlm`iuthFC!CM*%Dgw#QQCyRx1*H&G9^l5b&To_3#<
zKr;k{u;keUL{a}sCKRKS!!G*t+vDe9yX@^0g6VhX^K3Qr_U5P0=?emW<|ir|>37F}
z@+j1zd8q1QlQskDZLLx!MLm}|%$K=;uI7~j$C37^3`TjzXLqgFgORIQFYpR%KYa3B
zqwFI16W7WI6Uh82Q#6jQ$~K9)s2|p%E{u8s9LNG&)Fg|6(cgoE-1tdN7|0VC--PJx
zjCPBsEw{RrbbLt%4~bxJ0!KBY;9UhjMbwUh-=qJXYVtnAsi5U%35;rI45$OSD&@U5
zx$FdgQI!9SYJzfQX`UzkjcW2O#;i%LMsvy-AlI6Tc;K}L2Wu*>lgRWY^lnoq{tv3D
z&sLFDNIy!x`ZhEC7Mn}(Uet$NZ7h)4&C>JR|Dc+>zG`@Vha@RkVF};r2Usq+hP<p}
zVvQU8^UqY%_qklJB1V7JOAF#Qv39oKPT33CPrUlVtc3oVY9d+l{D?zJ1=;2QKB~#e
z!c5VQoh#$5`7cxxInggdchdiJR8uw`X`#}qZLOpk?R;s{BF(sM?LvcB#U`Z1`oFey
z>Stb+dy$ryk?!dA8R%4{k(S!L+A)}((Wz}AEpv+7G1@ZFZCoHN|MY9e<Z4E@^`5i>
zLAq;-W2o0bM^+j9YS)}{R<B2z?0a<Ft|f<|{(uQtRno8BH;*>Xh!<IPCh4BFlA*zP
z8rhG+S9`Ylvj&qbWHps>dv-R4hO-M~we`RD96rq&F5Z*XAxZZggAI*V>B#H*UhO+4
z%^Gb;lQ)dT?YkBl8t<5pH%|ZB|4=_`eBediw5(brB8v<*G=(*7edCha<R?+{V8lHN
zFQ?V!Cpj-7Zw-)=r^>3pcz9)+ji*`RL;Ex{<V71}i{GKblNvCF#2`~E;XSA161D&1
zUVZDAC4ZSUgo!r=bDLj~ynpMG8BRJyd2m$u(_OH?RHr3@PEb2J9da3vpxcrPIf~dT
zT4B#&q>?!gkTKv|WcO>QpPE9YY|>n&I-%%y`u5yI>?nx&hPhY%-btloFci{B-e-@3
zC3*~v<xjZc-UReWn=?gP$gR>@{05438*K<G1P<R)Xr?Y}#)?iR(b)Y4rr%}0fzo%4
zKG!@+>|=~1eAEP@A_QXpAeQv2k+|J@74fSQYZh{hglU&fUuIDk`N$i_9j9R=LU<7z
zoeAVed)Y=IC044i2evj=%(48}DzSRhpMbU91Ke2|ORs>l>^(gFMd5Z>uJ8i-qvjqd
zOQ|jP0blUcr7V>>5lHQQX7hsM5f{mAyoMYC1k=Q5SS1RP%5d+u7wwih2V*xEtPn;<
zRni_ySsE!oCn;ClG|lb(6~I|YO~{FHkiDHw)$?gN{bw|Egh9G7&=HD|4<!51k)I7E
z`VTdp$IOnJeAd=$X~qmBMMZ=^wD{8;VJN7e8ol;L_a!b$te4s62U^hh5>N4Ub1fml
zgGYSmtKg2ck0EB-gXHE~;&Y*Rq9weOxebWI`w=nz&@UkW9TS-s@bDvCHFOL1E71V9
zK?#y*-FD&!ZF<~cxBZ>6o`y+S@G}~7=Sbam277j`&ljucT)o>?$x^ZX1F82TgJLF$
z+aoSDbedg1_I}(ld-$w!8GWfAg|_R8b*E857@`4(%_s#PO20t@qg`b8?=u3QiaLSp
zJm}V@xu3(c!QsMoW*e&U<+Rtkk$PA@Q~2k8h7KN=m*+`f`2{}lu#yl9m-gO?h<2we
z-o-85#o2SZFC=AZccd@%T3&AoUauB=WgnWf#04ppW^1f|>D6oTy->I?qb0uY5jik7
zKe*mM2pa6Q9lTvpCS6+owHCTfr9SP&jWpd|X5qn&cNn(~yL(eIa*SwQ+o8ZG_|scH
zD{4RUU>Q!g0(_v0pd%W-aUN;#80nqk#*OD?T{0tk3hfDyohT}qHXmU(G3&mCV($S4
zu7T9%_P|TzEfHcf0*~$~%0wIV=9;m$h5_d$6lZk+XBkQT6a_7`ecL<>CwRCY6+u&?
zazD(6mkqh^9Bpqh>(7D@@0t><G5&68qt6?}-)E#c&mf5a1LLCTJHu})5Fn$lCG;@x
zZU!<BLf3}GKXSw#0Ar0qNY|iUQ6N-(dwR=V(l$oILWg7a#{=U-*wY$#cgu4>m(Hh3
zyLK6<DhP<~GLerkRl@;#EiXp)BTQxXYmMOMXB+j`gKbmChRqRVlPYp;nT*bi;9-{m
z{1iIAi82mQ83=RaSj!wowL3J>+<Ihx2H&5=mXg>;ZCK*bY&g>7;_-BYe~I$25{=>H
zM$K;WW7VpVF2U)W8QbE^kV5wKzauUp_;B+~3Em)verwVMm*SbrPN0rnR__93N9i$t
z661cQnct^;KSnP;Mxnurt8GRGE@^o&cEqDGPcuk=I7avK=eoGYx_K7TCzCvV2<%=-
z|GBc6s=UjNhcJ?mGJ6N@&j4-(Bbo7NZ!Z9e4V|bCo1Mz)O5EG2c;DRu;A}?TvL7rD
zJ6#oxKCKkstUabx;-d?c?aqU6)pK)CI*+d?V~!2em*C&kEDdBau)bj=eApPEZ`a~#
zHk<!!-_IiOyY~^MLQKe2wC*2sDUY^;OS&OM)HCW_(V!=s@7Z-KxhucUHbt}7Y0_;7
z;5wkttrQPJUb21B95Gi#8rW@tRoDZM>qE3!Mm0FZ!uvlW@u~P)vYa_sG;XDbuw!_r
zYDRJEw8onRXlvC)?+~KlF6@smmGHsc;MeO2K~`;0d+#z?fQrN&LLxAXCJP~Xz}U9S
z+hU|fXo1iBhmXqf@GAL4EIhNde|G>|5cjf-9hF#e75J-Soc?l$dgp*Sl>5meOl2}O
z_6Sqa><PRQ=v(1LZxxihgLWl5we4pjG0TNeBIsFMnZ(L)zi0v;@J?wi;Pg|1!d6xF
z*5fF?%fhYPgbq+rol%iU*_)?)^Z>_SGa2+{#A0_)v0_IB;}QjL?Y4Cu+|F|G0bV8L
zQQW7DglJ>4S*|aN$J>`eLDx_m*fQD$a<+znq{L1+)RiDYh@Q$0_>n;7Y<%*1Kza2Y
zJzR*jWe{Hy+D!stxgeO&;lq8i4=r5+9+poQX}`#309SG05oz8J4<XOP2iBEaw8mxF
zw2&Yt4Bgo037jO_$d@v4#8lxlu}&>vD1T(l$fVEkrkSowmPWyZfSWKif(iQHdz{61
zI>stG>8I=Qt{h+$p0}?Qt?Yn0KS+YyUIjC?9g@sLBIzHnmw#cKk-Up*Eny(M<<`B(
zxbz#rtss#35zU_V%s|0Orx^vAC8QM0O=umr@cAVVy*9=y0}0u_-p#vL?-6?RW+&R2
z?L=lL`^!9>C@rp9H!rH^e3mbsJ`OqOm*t@#R5LOMBym>s-(V^z>DL1Wbv)kv<x%l-
z3qcnCU~|jqEXxZ<%Nu-!mo=7uP^}hy#20<&&B=HTbj~Au=+1jBwtUFjqSgUrX65e$
zD94CR7+;Aoww*Ij>5Ssq4VTFY;4QralJQvQzq597>5@f=q>z<6An|L$!Sdy{g*&#D
zHLX5K%~j6%?s)rRT#gYEht+eH;7HOx?{MvE>>o}(6w5-p(^TF+{4QRC+My&k0w)~_
z$eoCFoyc|HTrsY4tvO9IIcHa0vLrb1ieyS_xA1_(eFm8l%oW@#4)%|M?NRIn;TADm
zVEzQRu`SrFDVeMpu%vD5wB2Qv$u(FOTMR)yV~T5Cb5It>o|iFaF!?ci3pNlgz4J~x
zzYSmhfa2T~NS8S{%GmuA!V~=+FNY635&<fKgIn<F=$3)Qs;<F@z32&l!Bl*N1BqcX
z+uV4VLNBrrAoE>{<cm)hvLCumKR$@We61bAjs?F+0M&(4UzpB6!c;8~6*Rlv7C7is
z;4hd8(~d096feK++T+NTxC~F2%l)AlkGi1LMi-CPhYK%adAucqsA33Sk9S6gazjA|
ze=iz|K6O<v*{;WhyX3O|2vf0EwRCcmbmFz=?GA;6ziwUf*~2><o}@osCc}nyN0|Ac
zM9lC!!!<$D2TjsT+aG?Y#`B<{8+4z)B@3KP40F947Z__-;U!r!n-3VI4k-&|9wP6u
zKa3T<T}z~ItCbnKXglTVm1J}eF7<<|MmAG~$%Jp$X_~02)8$kUsi?o4){F7ngz;;B
zD9valJ0n;&rGG(uwarUk0tY#m{VH$(t|zpv+bb!k+!G;jdxw0_9F*Q>c8w0>!a+!~
ztN3h!(~_lj1~FE-PXvlr;}5b3@*0L15&h(MiY^$BV^U>ybno{Y#*X$<g9L}x_-daE
zjqaJH>0Yy6ExR6%Fcndyp@sRpo?58!Anq-v1T82jMn(BqIDLto5}SK6ns^vo#Ii8{
zB&<CHZ)PL}HG_a^H{R#XO=c!Wau(-I7B5w{ph31sa<;@wwhUDc%pgZ0IY)UWN1ZD7
zr9rN4a<1V_?jvDjVUYJWIq%&}-g~P2$7?y<lk>mK<a<*U_!<-hCKrUx6hu-L#uyYP
zBp0U46sA)ZWg8UbCl?jZ6qQpIR~Z!7CKor(6t_~9bQqNMB$o`#l#Ec7jvJItCYKsc
z(k_UzE*O;ELCcnt%N};F%QnQzmmA9F8OzQZ$}eWhF=qdQsW2rf&{8T$B`S|Tmp^<i
zqogj!qpmzM_|80ANljfLLR}?BUB*HE{Yt!w`%AUNY?-oQwbX1m^f7Lotu~hUp`KDL
zB~g7hLknu8v`wiXr~YA2{ll&Chwe><dt+_zml~^^A28~=vxZV`bo4Ys!do-UG-~uW
zZS*9F1}K2^ma#FejlQ3u@e!u_-Uzyd;(V8&)nIJQ{?d>>+fbR(P}|s8Pu-B4(y%De
z_$Q^InYyXau&HmhY0R*>Fs1q6rr{)|C4IILXRc-brfpRM35B<Id}%6dY#K>v82|Fv
zyn+6<{>%{hK-|<uOVc7F+5Q*IbX(7B)F#r@EYZ~Y<EC?~vFSAp`mI@;s$}DlMAt@R
zYq|t&GD;i&ZM~C6hx=TI0!=sJTn~pwuVE_kb!v~BN2^V0$9u^hE1Euw+t%XS9w<X^
zdTK*>DzesNFlDwL3c);u&;~&;7gGO%sTOXB9$~6YBg_T}?I~cy0!ew8I@Aal`DQk}
zl{z#}GyI2UWG{6%nBi|Q6&#xiN?QiU=DEY2fRgas{d}G|Bz8AOjTjFGkf)kWa7f|H
z&r=G28|Rq+$!|QaFh8zvH^%Jwlk?lS;J05AcjLTL6AF)Tp)sx2w{czLsn_4IU5$S~
ze3>6(H2!HUHEHo}{4MRoFX)7r)Rdv;)GN=)_q5Y-o-;|!zg++`V#YI{JSUKMKda^^
zOO1ayL8pT6evaJz9ycDhZ=Q?!wouqSU+y`tYCQYr8+MrSY^&#D*ZlN})Ue36Vanz)
z(r?3eG$UuJBU^Kn<|w1TprczfD~qW^N0P%EO}%51;%SDoYIJ{In*7mC`(wE9=QZ8B
zg~|HcwDorj>+k6{Tue6H(>A^=Y<Sac`kHJ8F03o0tzBeMnj<z7(za3-wjQabY?JN$
zwC&=B?O({vNNL`$_uGvNJFQ+Lg@zdYZ8Q!GLxHsDsb+tMP|#0l{+vN}S2K3MNdJ78
zHNtG8J2){paFO2manGaTb%6Hz@Dtts0EEC9fWAAoj#%1XW!Rf+*?YNggtv$d$pCq@
z>{DlgG1E^ZWDXi3c(*3JfW;H##nYE``%X|=bL6q^BDOXJbNBWz4uYAQNeG8vI4_Y;
zAdbdN_Bc%l1`&Jn_iMD?7ekC#DjB<o)?IG|&<KL_;WaHTBbHGH@H>>Y4lyzS!E}bK
z#+Y8aKnRQ&uwqSatQc_0AUJC2ceC^x&%IBfZFd{550|C!PXX8v_|IVY+@cXJAPa=e
zV4PZ5r-dy??gp_e2t{k3<^}7b+Y01seCrNm@Uq!OWt#2`VGt@DV1z|JgwU*0A^6%c
z<cQpO8sUS;QARmtoVZc#k1pAxnR202QXxWxKXX-5#65AJZNFrCajV}P@~rrGsZrzS
zJ6z$vQ%zE#!lg4m>}DH0fg)vd^{zcW0LEwK3(X!k*T0H4c(6&02Mbs83PW*;x6waq
zCzM1HC5efN`%<tuE{9PwN@HFDtJZ`48Q#8B==3vVW~h6jX*QgSlZq$y*%d|3nCREK
z&ix&pWZmJi_rY(e2+8{6zo;f}e5r=hHCr;G)(EM_^DKk~<!@_;fDlp0A?{k<{^YLg
z(>K2ZHbIsN0#;OJ)n#K<-82k?eff)uTnw@21H9`1loat8s|O1|-0f5O6g9$cv4*yl
zS2f0eqnhNqRk6&2m?9L-gIUvpn2h#Idd)*=Td*y{<S+t4HHP6CoxB34?rGv#@Qj{F
zIc>~zR))^ZU=X=eJUzD6Cci$-HbrpG*Y&z6Usm=cG)+qX#HbYIBm_9qiliuen$)tt
z_f3ie)0tVwBh~cw+lPf<w%{Rl0bf(Ed$F|?AN*}y(@1;m0325Em}VrF5B!OpoZ@Df
zm~DUOkf$uvH34Xq@pj8tDTD3BC$Z{dQ*u^NY?%0T0S63URMqwke!Ww+AC6Mz3+wWh
zHxzHv+VPd`D!b`IvzWYn7+_Vy;$J4qf2sjr<tbP_oXl&kXJGxRfjKos*UBPNv>A<;
z%tuuw$_C1`hvyJ>O~=E^@0-sZeubF|%%Kd3-roZcMaOEC9g{sTn}i46Tnd>O8#
z!V5JOr!KPBgL9S)=wt8O=x!tqJD4Jy9E3}&ovHess_*1eQM7_w1_efTBfH~0!m8Rn
zcC|a$O|!(P*vS&8y8cBqx&C~Sa^f<oEQ9AZ@j`^#?U#;%>e(-Y_r^k_Ml#$Jld!j*
z)#bzJm_AS3IhOH<99r?*=bY78VLf7BXgWo0-H}z*!x=T_3!V?xBH5z2()P;;PNBMK
z_+nfHtDMljX!g_2PWP2aU+~r1#M71|(caw$y|}r&^oY;f&Nd$IJGP6tmgP$QkLHvC
zLw0QoE1~$8z1j`@n|<GN2Z{Z1LC&U(&If5VaK);KM^y{6i^p!0^6RG7VL@Q?@suF%
zbp%hbn%C8Oy7#LVhN*e+;R%U!6_3~sYnI*JPzRjb<3@d%s*6_ouXjHRz1@HmfYpS0
zl<ghwtHw~lRDPLjZm=m92}25YZ`+;}pAT>QQje)q!kdiuek@#OgV(NA=RXK2??Qq>
zL{pi1B=Yu9#pND7QGD|DD42i{7M}ekKh1WO@66URfeWkLJ|Vw^{2T>X>P@i38W=sz
zHySkV)Ja{V5v-G%Nqj)o#i4WbTzBw+X?Q{yjkw4u+)h%5GcmVa^cqMxi-vq;Epi&$
zP$}zPGSXtWC@ilzd3uDc(jO4@E`gjQAM<TmVw}|HWC9WHqmzrmEPe6|dr=?OG+6)W
zDNPw`!P4#K=}E`BwTqnNShvUT)~x$)<6s25G=CiLby_`<$FC1kthg(Em8X=P5-x#0
zyg<}J4xE_8F3CJ@e`1w4crFPCG0?RSAC;|M#3VN7JP{}-RyB4O^!}{^`s>z1n<8*{
ziCw<LViJw}oPSc|MEgnF7CEI)2C1tDlhj_Hl*jq=^xG0fDKyN{*O-ABcarRFMAxcI
zd=nY?r1PR5<hop>t+MV}Smhot`pF}7CbB4Kv*n;#qY=pheus92%CA3@SrxkEi1~J%
z4-x{yS)Y(ms8Xw<ycus?(#}_0E;QBtJeqONmha8KZ5;JNJs1B+p_Knq!Dzz%Z+G2=
z(sx^;IsFqJI=_lt28+al3??e+CO)nD78)+%>UtMs7F#}N+NU^cZ{9=^a37O3=J=?)
zzZF-`aJch&gJP-)HJ~Cu%8v19Myg=<8KtMxE)BO+m6F*B$J^Cn(T8h2Bv1Tz{~uiU
z0ynbN4mnk^ce~JEzkk>Df2b+mjd=u|D=-CsIf`Pl#&sDYbEqn{0!w?E9zfJ3gI~p+
z&&o8Tij9`<i|aKI4vx9S4^l{U+iV7oJx&5;<KZmshAI2B57}Aj2lphD42sP5i@?{!
zGc`>bARn@yNdF<K=MeX03eWs^uWz?&*>C5k-2GEpZ`R4bVw@j%pOGzL2<9TOy18{?
zQt+kZ&e`wKUVkFyGQ|XTBOjXi$OW3rvRyB0NUh4htO8dl@*UC$?h{+ii_9rIvnT})
z9mAoR5;WvblqB}~L*IE=;O`{%NZ&hsbun6FO`vceS<QG46o1KvrQfG1E#L{%|FeOK
zIS`K*A2t&9CTZ-lhr})el-EF5?H@5D;wqT>jA^53Of2XFK4+Rj(_3kYgCQ?@;taHJ
zvwLEl@kfLz@mnB>?1Ko;NRXP)?gVmk-)Cve@|jDr4BqyaQp&N39o?#ij6ke&_j(zg
zv*)i9x2ZiVe_~eq6`GZ9>yIZV)ObBBa#0;KJ~_sZXYVOI0|S4)5F0I%7Ov2rw>77x
z{@u4<oFIYcqwz>Jolre1wP&MPT3DWG#JqUl!|!0$NRZL@T%^8r$ib=gX4dVLv--kr
z|3kjvyhzD~Tjh?81JGm1_4q^miTlBO=G4VXkZ{M&?qT3$Eu4tlwcSQ_7&k#|7X6^E
zN7M2!<dJG(;jQmek8n1}yj|sb|H(x*?KpA3V_m4ce#pDQIbp|R!x?ck<c)ut0rcDi
zjfjmzMz~gArao+{yl)s!$9Ic!k=)WQZ_tmYJ1cqTxnopbKURu=UU7rAW6aw)JreOj
z+}n89PC<Nn9RH$jz;l1l=*#Tm>bG{>^T6Za%iLbXMVq_PffsMnGQo&z8_?@$mQ`|v
zp5UrC#po!k+#{Km_iFH+*U6W>rav+S7K1Kcr#ZZy#!>{=6C*mOdGDKdUN1^d6nmXJ
zSV`@^kNh$@kape_n7`*jaJ!`Jb<xaw|J0lJc8xRrpi`vfWHRWHxc9z(^Zx#%T&8{V
zrT5L8d&5~Jf!DE3>kX_2hR#%hnQFXpt9Lnt!306rqYt7IKAzm!y1zTzS#(`(l^LxB
z000{3qE!!=r~m-(AwL=bfCk3`xZvQ50`A$|uWG$XH-+!m5W-k+R7E&$5S%U>4lwn8
zU_wQqKu{)rAhAYpVhd6P`3Tk`&@TDkEg^8MeTJ5JXTd&fmp;El+_<p)HdlS55}o;{
z5Lni}z(lXrLoA8M6J8X4njfWMmwv2o{RH)V8S3BwFv`6-3Q8UP)s)*)c7H2&UTyXO
zW_N!&n6F}iKkFrM2<&5)7+|0f@Fpm*%O}8%-RT_#pZz5Qh1dsE4_!zRz}g$A?;iN6
zH|XQ{z~J8ZUf6taYhSVqI1v07L<NKdMs0e^Oa)~I@kee3H?jsl$Oap1qL5U;ai<>8
zQhR-K6<tHwLw<Z@%3%);`VeyeHN*!SKnKT?pa51Rh6ZDW)C7f{`h<2VzHJo6Z^q`s
z-9!<mfaCMwclL(KDunj+hX1S#o7S@!#twgA3SV7%EI$J51%@wOy39_6A6z;!v_(K`
z5hRDG7at>)rveD!kyoPlf9mj1ws?0$BTd}H4uhiHkHay7jj6E%OhtX{FQZVV{Qpq!
zq4z}zY((JnMY~i+Q3e}6)?_{kO{n1LQpK;#N`I567*Od}0n9jGg=(W|ZDJgbq6G_M
ze(J`EY{l3_$4GF*A}3>HY+@}5V_}7{6}qtsTd}XBW0g7LawlWeZQ=|FAL3p<V#d00
zx?6D;Y>|c>@itR&uWjP=#o}%BKU&$us|Cl~;v`(UN7*YS*dN6^1t)NbCb;z_ydaPN
zgp)Yl6Ypsg<4&0vSQzx>k!qqO3kXh(oObo?OT^wvjIv3BvL(e_MZ|qd`eqZAjFW7R
zOiEKq=154&3=YfIPcBw+&JRxhQIK51kwUPMTuvEMDV9=S|L%uPN?1@z15WC<{KRIl
zq*lt*o-5NPrPMdpsl8jNKXX$DIQ)mMQh$BY8{_x}Rs8n5@0+Md>U3Yi?DV(QPa0D=
zX`Jk7YlUeQmT4RMh?5^_M@lX{>uH%{lvHf#R~$|Z+Tv$oNij&9YmSEukgig}T6)Zt
zeE72r;I-rMI4+iW(lHAf=tbu9i*MlVxR}fg(*8_W9i>YDOwS}<0lxRNwpr9{vW)$S
zE<ZBawzKNGbe>XWx)Wyb+GaDKiQ6-0hlyp8yFUs|A`IxL91YoFg<L6^k5rRJ=4r<B
zq9lbE<}aS+J_ZD;+d0XF(ozBGFR!z&<a2b3lJ*^Q2D30~FoADF@@$Io-u36%Z|A+o
z&3Ag5@A4ww%{JdXB>z)U{+IrI&+U9~+ycbY0^k1pL^mucj4V^!<oygxsw%EX+`{Om
zg)uJ*<7^8PLJE_L3RC(Ezik($;}&H;Ey{jTlxtg*Z%`<hfhk_}P|&%BUpiXwf}yzT
zMez^Y;#%=ycPM&ee{u76ajUIp-P4ke7bSH?#cd%aEe*n5{Ut*N#gCE7SVPJ1i_#9<
z(y`={$6#ePxmeq;^k)e3+|#n^hNq^-rLFz+zWik?24xV(vX<nsry8ZU8JHo5xuqfH
z;bM%NZpn;jq)A)l>imf)oE7A_<oGP4x1_XT4TfsS*LQt1AVVYkM&T>l%HA<H;zmu<
zo$!y0q=21DP5z1-TvFUw8p<6b^zO=0#!8N2LW0H$m)y!1C{^U|s$9mtlY}xeIFrk+
zlLU-ce&SDLH~h}oNFz2&@{E&K(NJ6dhDPNJ$%`*lFK@^+W*@30fK1z~Rmx_f7gUjk
z10;}}YJr{a)Qmp}m1~ICtNCXuG#hIyW@~QFYP6MWZOnc=4gJBG^+R>+$9QF}%zzeG
zN{zBp&5%>AoMxS}L|u?Xt)oO0EV|B(v;M79-J99E(W6?Wv0DAvDi7*9yPG=al-i7U
zM$yG}PVefoshQm0HN@;RSZLOlQqv~ABS|T){Z>p;^Q9pZSf3DDQ@}~`UAY0d)94f0
z(0<d<w?kTD*i;qT_&l?*7RZu(Q_n!uIP|4DG^GLjj!7}Jsk^vxvAAiqm{fzaCGn<7
zmav&gwh>m@GLCF2YHXPK(y|1EPANB>DYxA05G;hY{v3N~IT&c!Y9vGjwVvLzwo<p?
z4A%G{o7vkd@CRFoRmixDTZbi@sm$8YQjr)&%}-WZkCmCo2HWyE+rg5$Y$`}jqZSUM
zcEDUcwIov#XUA{l8gjcjo|1Ns_5$8FY*K^mP!Jj6ZJS$`w9oPnj_<Y4BwM|-I@x49
zJKKvs3UtZZb#d=@d~)to;$l;{MLH98xubUKs&uF8bhUrwHIigAOl7lB>9PX#h@^CP
zICneQ^|*)id@AYrGT7s}+v5%DMR4`{s`UEX^#+FZ2AA}P4)%uc_C|vGqPhBFRQlrV
z`VzwWl1lng2K&D4_N9aRGr9V+Rr+)PFV*xns_EhXdsLJCY;E{#ed%oD&}{SGY%AUz
zl6$U0b*{^Pt|xr1uXJu;Xl`h4ZUk?BjC+1ub^e$A{ABq2bm{!;(ER+~{371MGWWu&
z>cSuUg^loqt<r^^p@qG@g#*0BBksi$)x|UW#f$L8tJ1}rp~bsBo5csbB@~_|G_@rR
zhb63tC7iM);P4XO{t^NHG9k}0vDz}J!!miqGG*B^_3$$7{xUuO3M0>B;pNH`hZVMn
z6^^nM&fyjA{S{vPReqjTLABLq4yz&&t72uV62q%f`>QheYfv@W|NrPyqo1VwKRcUy
z<e7UGk9opEygvM0pBn!U^eL@>txxIvuk@*@sMj{ps*};C9$)LjzNSvcSlY*GWyOXZ
z#_BjF=msRz&Lr40CBh4mB4?BA+>(v_laX;Lc}FQ`p{WgX-(3C<Q2kqdD$C9{$38Zv
zWg^FS;UDQ!|3ps}`SlgYPZftB7k`N?{hVAnlvi5cQkJz+7Lr}wwN@D(|J|qKd)~j$
zQ{6ub|3iIhqdDWB0jkV@3{Z6yS9WJ3yT_-y>;GHysiS|ZPqqKI=u>~Er*60B|F1rE
zu-N7cr2oJAR5s?1)&GJ%RrNpgsZW2`rvllsg+u>y`jqWI(5L3U|D{j){!O16=1go`
zRiaJSC?fc~J{9$sK6R+=q0FE7mp)alefyU_wey!gg@!}@<)8E^tbeUf5&S!S%Jd)T
zQ>K5@r+oW3tNyM}<@Y`6Q)@W?PM?B2Fl7k;Px@3F+EO|o0u&jGDqyHlhWek<r<S<x
zP5-7(dHzTGRHCSmJGA!S>Qg~DEcfXD8GUN*zf+$w&3ZWqH2?hYkM*fHmH$P3ijeq0
z@Hf%L|5~5g2mPPXr<VS=`c%e$LZ3qV24;b*KTWJbz0v=jKIQOV)TgXbAuB-zGOR_B
zCjUU63i(I+)bjr+ed-7ow)fwnPbL1dJ_Y+P>Qley{x|y6>c7>eB>yLUDgcM$KhUQL
z{=4+4w*Nq%O8ZNna>V=>eQM=@sZTBcLw#!LAL&zj%l}HBn)!c0pDKOSr=tI7eX8mI
zq3%B1ntaxM;U^Fvl!OkUCv>FuUP4ED2kA{v0cj#ANJ8ix1Vky)R8&9^P*lW(BA}E|
z1wlGe1nCF}<c+TNTf42c&%5{8Xa5J!%yrGobKP^#_w!HbQ<HyHpSt(A^r^tVsZT}B
zKUCf7=%JbCPZ{UhykXxwKw+Ny$Z3&T4j(6&Ul4{~r(yUT`c%O`(x;UEtWSY|>r-=o
zU7xz~_w=cT|I7MR(4Y0Gg1@0p-TVKoPnDE<-}^(Ky7~9?DXIUQK9xn(rzrkKpL!|v
zZ}h2Wf9O*sf6}MQ{|SBSCB@Cz|AanOLMNI(Ec#R_8fQg&m#9xQ|08`$_Ln}D_3!j4
z%rAZF=HJt&8vn6ARq{WiPrdw;J_V#5vUVn4%75{{TA#WX1SRKXKh>xIXY{FibhM#I
zZ0ubz4F8-yb@R7ARq(I%soDRaPu=^AK9%@a^r@`BuTKU28+|J4w?5VIxAm#4zvxq>
ze^Z|-u&7uD(Ckssm_H$6Sx;)HAp7^8nX^9yce3r;Kkbl__|NH66qJT?ZqXIO0>**9
zudS~!V=nrlVTZNv=PI)Z|4N@Kaewf4^r>h64f@pff2%$fME-B|sn1j;cnEgO1Zx3V
z#{VDbQw{%6pIV}PH>r;kZ9!8zT7LfP`qZ;O=~Dp8hW}c9O67k@pK73^{f6%eM?lM7
zy-ExEvp$st=>0Fyr=tG4K2`It^r;4-K82=?T4$wHr>8zW&t=)M=FGh=_Mwppy0}-F
z<^CR3e%@Tg#`pgbeX8L<>Qm*E>u~u0EBaK!|EWIp?62xmb^nAuHAne(^r@Hst@_l>
zf2~i2{Gm@RQ-1TDOXjYpJ!QDn%D{ak#_}tr@88v@O7J1X>v}3QrOe0lrXk@1c);J+
zr%F(6ed?<hL~lE!u2hQZsUF_Rkf5^{rE?TraWnqD`tS59AmuUMjKUHUucPt5R-am?
z6gH>(*ZNe$Kci0(J8b?J>r--${EkD5M!A$i54|5-`~!VTy6^v{K7}FbQ_25cpSt>o
zKE<B%&+Ah)l%LoCgFbb|^y2?AeaiKhJ|)FghlkBnhUqIx=FwZ3U61u`GSg`?GBsWL
zoBGu2U-}eI*DR(L=Uwca8l7Zg+NVbSL9VMh@124O@%Gc#$Y#vJpY@kMrG~8iuhplD
z<8vJ^{w;k<?yu-m7yqF?#clGUFsu*YQkW=lu^~rdReM7AW^H5rg~BoUFMrXeq~-z?
zu%xU}L2cBEYC$IvCC}H}Ij)}sck|te3i;s1@y7VQ=%=XAe$^jQ+RrsvPyew#Me<9Z
z3dxt2`VaaP#b5NP#NYaq`jeMuqL<G8Ielt4Zt}lapL+B+^(n7E=~ML-h7m-4YVxn@
zQ$v5zr)qxdQ#`-)sfK@~Pi;peX(Y^&xzUu}JliVMJVrlq5u0P)^+OA(4aPPQvm~>!
z+C<mpQhCHM@Di9dbtOFh>UtTOr$erWSysHb(cHxx&J=%z@oss6q-cK|h#VlfSMw5v
z2`^?9TSa)^c+slCW@zMVMs<&@|M%IuUvdYphNDzGcNRHqBf7=?wCF_qpWh}1aJF`A
zQHe8jP){Et_oHxFf$khQtynkrP6tUukvo?oj7*UCZvXwbn&`#7hvXRF!C<S#EGxWU
zT4}w8rc_`#mk)!S(s?VUXd8cCy~i7HO3RXt3Mw-t3gnh$XB=m&J@B>=sr+0vs(7AG
zYCDk=fa~!oh=&8k!AL&gR#+p3>})GmL2lckV27VCz<)JEZu>ppZT(X(ab^WydiZI!
zZB0hefTMZVSW}6xR^5j+)4lCvMH>%TLoNxVG$PCC1i+Jsf*@5^Q@LmkK#5uUp7)WY
z1jjQ#>Up1Y$T50M^r}wmS<;%#(;K6&kNK6^Tto+&**|Hw<yE)wiC;Ev)E;?0)^zU1
z07U1?Z7IKYmWz+O=+Dm6MNjQT=sCxEIKdqvR)naHo7p&=cS$3H7*aQ|6z?<KKi-<v
z@ls5}i35PP5sj!Pc3eFH*RAR%9^Ns;*j&ANt;6-ldwb8XH9aZ_O9}<Lr!U`)k_&GA
zOb;)Lh4^pjY3>ClIdN)JeKriDR(PDQUW8*ET1gay0x1>TNqEw>;y7J#2|nKTkM{(q
zZY<rL4-I1M6t&w<8J?73(D7za9mhyUz#C65gi{8yYfA?r$n4zPUhW^_=<5tfMS=)-
z&?OFSv>n)lNWXase{6|@gmN6h8`&-$n3C)=HF)8$lvPDWBpDlY(K@$^)t4M2f4-BF
zKWvr3_q)y=6U*fTjd^-J7AVxJ<^&6Ug)rD^n@B);&GcK*_)`0Ey_kw~!Y)v}TuGE1
zD@%{0nd2a%KR1mUhsJ=yz#pqHLbWQMNQ%ynF=G#9&H+#qX|D`ftF!=d7QALQS|orf
zvb$3#U&d89;B!F^-MKmxIIM?)E+U`yMoopAy)h|5DG>^&14z}~s6m@Goeu;g7oGtI
zW4^Q_*0NVU>yV7rJ#C_6*(<SoI>SZNm`6CSH6I!zr@TgI{u}XJ+beIf3BN?C6KA3*
zH9JNWrJnW3ZTuFc3=eYie~D6nahce|hKEE^%HbzH36JPYLIB-GHDJfJQlQ?N^xESh
zZJLkcIv+K~(mlnHoV%#&?{E0CxFsPuzTqhZzl*O$|16)W(oi-hG22mTa|b-tq8Gx#
z!H)O6`eRGIl9_ImCuqLW9XOP)A6+L`tk&k_UsFoX4Nf*jY4=fF|0!U|pJ9MPvf^qF
zm8V+|UO!!#ZwkUp3`nPIpwMdqL-A}Yr8JBP5}H6m*<_j4ZCKMOXIs^YvYqrr>-AHH
zz^ubByRFv~et3`|+&3v`vaVHK8Cf*_(Zz3wAkTJ}dE=-=XyXpNk-)<lOEFMoz?A`K
zh?*r$BVRRONvQK7GF+4f`1c}e(s{Cmq-j|Z@5Rh;VV{>5SL=N}-v3*kYX3J+mGFtx
zwY-kVQ+-NkD*VM$xf45D0g7~SbXq7fFq&=)9V$f%f&s{ciNRlh*FRBIN)&$xRmu!y
z%?yvp0No0|getl}gsPP$qEL1ATc~0o3RPQw7OH;yAyknuftaPWK*ZNhd;dYGg1?}d
z!b17!{~}Z|6NRcI*`3>O6DTzkt70FIvl8Oz63^w37dMC~q$RCsw?BcslQ}6h2B7+X
zSyg~ns)??oTDnS!hTQ-m{_JO7N{M{*E&vq!xEer7(+mJ0-&6IO1tEd}U^)^697jmS
zGDH%sk!)9dvrrV^3SA;q0g3^LV>kkkJG}9QYvHK1tXJZtO**A@NC3@o1}4COhy<^n
z<emk(4BMJg7C5>s-Pfx0ri;4fy$S-}+CsV7kZxTnlTKTIy>~hQ2>eB+>f_L60Hj+d
z<=)%ds)>q0U~v_U04#pAUZ)wW6SmId25MojL@_C4QwO0K1_9)Cnsrw?LII=ztyo!O
zY$ys%Vo2Y|M=wm*$p%6Zq=(VyYCWh@17}oct7>9`EGE=FmK5K`Xo>q!(R86j_X+^O
zrPbZ3(=F$PBEbVk8q{n$G|6<^P?awj9_uq)YO~>gaR~s>#T#aTP#6$OE6tDxhPt^f
zc<tn+jbZ$GhQ!Fqt{Y+bRsQ_!a%v3q9gGOQ-*Oco)?2r};RUVVN7|$YT7V%_a<>Ih
zuBz&JLzJrkL=X({k_LVC5Syt+0SO}FRVZVV>{LE_D<&inuL9X1u?xn${0W*wyh`fL
zN7-ztUElynuaERYXaVYqNyo<p<9GhXSQB8%i4w6<Ic5EW{=M@mXbNyjiei;W4GqoB
zT+^dVN`yDE*+fBxaS%lc&kn?*1Z+Bf@@1d!(JKM~-Lmw8090XGXQ*0svKl>?6o4NF
zP#h))l*Tfl^_<&H0CWj3M-zH)l5G=RkGhT(8Z!WsY5+jXqEV0Q2(`{nk8l7m+{F%c
z^k~qT@5s@^l=?%fbjQBE7CHgU=n8(0y1n@Mw_oM{=*yyMZ5m#Q9i=NqAIH?-O4p+i
zWc16g!W-*V16>NtvOp*UJelX8{i+06RSK6s`&DtBM87Ixuq(Hl*Vf$H8Ak^}lg@$y
zRxos<KngtBIMJ^X?%e;wuR0F3Qo)nKNB-<r5r}{lV+)8MpzcistiT5HdGx&U#Qt7c
z2~K?IxQS4_m56$xL4ocszzWcQNhQ%*&4RY3f-;(swj#x&AP%yG*B9Vt=ht5I*92Ig
zns)U7!YF3E0XGPB=HJY$W@RmG3x*>tP$*_jfT?YQ3pJJjsO2P{&Dqj(wHpc00x%r*
zFs~ySlm};9^Z;N0#G%F4LK7ebP+I`OMsU&#aTg%k?K*Kl2P9h>{RI~sx-r2;l(?sS
zppr5Lz}sA1knZXf!GJa(0291!O=;0-d~HOQpY<FsIAB~ZHc94Bc-48bwCR>lmyOUw
zyb5-$<Cut7Rgu+s=MY>Y92hOh$BB9s9Z|1J_(s&Ll#oQdDw(KP9XjX<{MM^19GM=+
zC!}Ym6ZI-7Bev~vqFz-P{Y$UP)f=b1F(S78FL+h;RPs58&#|Ma7_!fHN8|z^ROfB_
z@ym}dG{>=zzaRe-UKOGLm>E&lm-8F1iZ><VRl?_DmXfb@V;-HRR*6sAIg+KO(;r?I
zK}ezKwy@*h5|q0gS|FdJxL_~HSYw*;C5IrVDyMhNlkH#bvpk(rdF|Z$wzT0FUPU79
zkf?)7v_}2euj*N%{_w?_nb+XcgEE;^mwr>{6lG9ZQlgZ@msUR)!e<u-q&tAZ9d(O8
zn<)r2H#)-f8M!F$%!@z^F_*=pIj%6dl7j~&R!J#^0dG&pg_{8gntoTJl~ILahbL&1
zk_f0%D3-?NaG8?L0y0ir1Xri<&*RN!UB)&nj?-a^QUDMhhtehPKY(m8<I$Y^WELo(
zuoagjfJ~kqoMcb$i6RYhJ*R{Mw4&sXP(Tz`Wm29)&XybEPCkwb<HG8$$CJQN`|{bO
z-Z;LE8G(AY5j@2sQ%cUUWVL4U(=XIB59YWc<A6bWjKDThjl|Xs9_q6RMkMi}a`sDO
z1a<hdC$p0b8tt}^H3qo9eH*7j4XkG-H!^$!WYQyCQAM%-!B{<K_EbPK1&jk(wpi|F
zk(R$szJ<s0^ryllCNE`mk_7=^cyfeTvvJiYX=|d32cXD8%?o()W$2Mg(D#|vGr6P4
z+yR$~;$RRdg9CulLCph?B6C3P4m&^%mngN~SP0U?3Q)dRJo^^`6cGSQ_i<O$yzAkT
zLOy`90QJEbNLi{Xn1xcQAfd28Q3p9P1(Q-@yJ>?kWGh{lU`xdLg*_ml3__7}H(XFs
zpeUGQTyj4tMA;+&dKY?0{cyxZgqEWh8wE0RV1Zk*Fq?&7vn2{Z=P$)7%UF4go<l#~
zsxX=BJ>^AMoMys>GjTrxQ=~j-WcJeR2=i~oipCpvaNGF220gz-_Jq18i!(ri$XFTL
zv7Fcv87o-aED%26YJoBv#Zp<|0*Q<jSl4N+?cnCJSTTwgiYl)qgZRw>g*&pDW|=Ua
ze^RUp1^vFKjUI@isJXSuE&>#--;qRMscXq3oKY+n*Fq(-QxmixV$)2HtL}N85^<=f
ze<)TZ{Z`iFW7MuFqGHwX-JGacDdn%QDX$D0`pw41RS1BAUYPH9<2?^WBBRQI!xBWo
zDjMsrAeBn%MQR|D{Aa>yOJbMG`?207l@)8VW<TR8J1!UiiXEb=Bezxp5V9mZvs=B{
zJWxQqaqw0{-iwY)?z0+jpjc}h39Q?G*vf?tRD98dbn6m@ApH>reN_r0#vEIz0D#~D
zf#LS$7cU1yEF<McT`e|40lqlM3z1%=92bB&3=lw<=rWAf@SDBc;w}=V9mh1$C`fM+
zv8-R>##q+lMI@}iYfNC1JPCJDL@z~zFNkh|Tq7u=Btb)s;_G+24m<izGny~_l<yBH
zq_LF_=bj)6$P~tZ6IMyv0~%-^7@3IDm(p+SQP^NEO_yJO6;|>#81uI6w_oK~Er9)k
z_Y5dq0#y9=t7L5#B-XD$P?xh70~jbT-8P%A&RZhT+M(F1-sO!A*;kNAj<`#xnF+V{
zuMq*O=D>~q?_cx*4BLU?@t#a&s0R|+c?lNnu4HjjSc<ga+a`wM`JaGUZSkr7;D{#M
zTF?4~c_08ED!j!s>FbkE4_0vYl<IHokf-b>o*fu!ie+;BRo7V@>7g&vwq6_eHlxUP
z8zA9}IB|pzbd-pL0ZpKIO|rICwvw)n$Mf6~Fo!>(Zg|WXbfB^&P_`Xc%$pnvCgo{O
zHb<v&0h%UrLQ3OF8lc#NTL4cOiiZnDU3!^eb$+_mn}O}pVweRZkd(qtlMJ4a=ek4z
zMrq)+%;EsxAU)xPi#%aQ8}D~R4_66{J}(}g?FvIbAQd~Wzqm3F(mE#>0WR=hv_z`l
z=Z%SI)p!%>1`(|S%t8B=m)j_|4%hd>h-MX(69BfQ&pivGj9Pw5G^@t<sGs#qHoE^Z
zt0J_*HM484U2z_`HYuKN6GWnUP^s(>eoq9ew*CxOUEfJmufp6i+~&Fepg1KwM(Jh@
zHawu<+*o&b!16)ipTH_uKrIohnzc89{RXRee;7xTKWqiTKp022AK`z1Rj{HTGiIKB
z%!!}KjktAVV`hwhfmK=BGE6qAz7Y(O<ZkO-Yhe*dGhxUnJ8`{B4L2Q-zLyzrLn30j
z1T$e2S=N@T#a2Aek(*rPSAAb;D3H7NMP93W(0kcnu$lRCob)hxrzYx$dZIl?v|ip;
zC?3luKp!9#cfB>pb5`4|&Rus!J~)UJbY~U-IC^w7r-~;%6h{7JhBZnl-k3qSy31=3
zkYs<hm0Wn;^Ggk*X5i@d;wGY%kygDvG6Kw?n|vm$e`2?;+nLB~kR!Ib>0EF{(Ehnx
zBzRaQ8hSk`Zm&Y%mp*m8E1>80#{Rgn`lc}13`5EJJ2C-ldm<xM{N_bUzWe9KsxQ0@
z*;v~b9k283%6a=)6hI0^K$+;mW`XrUW)ld$4uFj%1wf_hj{UFzFnjGSEHwe$qwHt(
z{4#Z&mJS$1I#r2Pox=jSmX(-=OL4X6&}bFSs?yomQs7k}@t@?wISi1NSIsJ60tp;r
zu09Xgnr#Ov+KB+%;U0Om7UU^z8yoPrxE`lyKq)CHRscdu=kYKId9CJKlq1i|lD>Q*
zHJH<3gA^{67-~pv2o5d-#MVA$^?S2cQ45{na!)6v$#U1B061@9QNzNaP*MsDdIvB&
zOlsD)h%-nl#wYR+k%UNr@!DG5jo?i&gUEKv@2ZWMOW$Owu;voOTjVOJt_NXs{EMVO
z{Km7xS%&nc{E2!(czk9y2jW$t_Dwh?Gx6oq%7BPm-C(BX&<H`=%E~@vbwE+v+j4~4
zQEemxc19yDSQPw0S;)*LJwm7?a!q7Rmcjku1*$Q;0S$n?fB{QU1g}Fdk%HX&lw$%S
zu(k*$lq1+VSqFEYqQjoe349oo$B_fPoX0`s9<D{T>>PvwGAc=7uPiIom4&(cH)~Z;
zJJ=fgKMD36eOllWVhbX(2p*MXf=Ous>EMr;uZ?+hApsAAo&(&ez#$n5x428uB&2)1
zGxx#Z!IH}qhbdsv0VoRl(q-QcnfMyIRYH>4d_xPcX;f+wmer<!g1;mQN3q$DmTLhF
z*OjF^nNuBji`lMBS#ghKRrVodHTEF<S$?~Cm6CM=I$2@&aGsh!QH<Cq+q%AeUKM_Y
zw_oS;NR;fIjVgZ`<3rd+CJd%$>r*sSS4LaFQK2-_a~d%>Flu$>t^6mkiA&Ps9;r2X
z3Qg5R9`>J$P7!j({`=_?4`I%C=?44+%*2;3J}?&d`%(VGet4vfc?N#2AqB@hCZlB6
zq}Dxtt_`){doJzf=tmc-N~varBDiOYl0AKB52p@F-gK!f^&#37lYXkQ&geBIzv20w
zQQrujS`FbqX<2otv^1cNxL*44y=Mp+3H~6eS{DrFX#Le=+p0ElvOAb+-Nn{H-Ds8Z
z8>14GQUCf2qcYcPz|UH27}uBm!l(!&1BiP?44Q<~_M>a-B*Iu=$^(uXu(1!F4wg(t
zO7w#}7l3J;ne@gA@ClnOscaQ);^-O1_(=C$2<!82z)SSL1)U--aA;Ov?DZ^EmrO}8
zm584XM;aZtJ8(OTZ7hraQ9(RwBLZr;{!Cy7WsuTOArvj#hf$l$(S*)*h*)Kd07l>}
z4b4IUS-fKISz0`e!tXzsF3`U|q+(SMqqL|BObevppm;i-%aeQ6%Ohy8OJDdlUql<D
zJf?%27>ugkNJlreo2X%CnSG5e+awW>$Y-IXG;t>}npe`LfACOOIpq26lJ!~U8Q~9>
zm-VD8)s|qU$scT?QW^JqDLDuiunD()(%3Lk$=``Fgpy*UJm2UNg*vv<bxu&sucpfQ
ze<+$5o*Uvx+pB;zdfYa-EF<s*yCC{9q0c|$c1)SKfKt0ie{fDiQF)k;qNz-3mLCzK
z!aiUPucL_SC1uo6iiPDPAR;GPG}rJQ(tNAE`nPmwRF!mjZ$C~KTi2orDZMC9;gKp`
zW06teE@T!C=m`r6yJDq;6YCYR8gB}y6dbiSGJi5u-#ZVoTJbZ^SClE}zQo<^lss6P
zU>H$dk+JJXp|J;)FK#t_bd2&eI~}C0SZlwtA*{dsIy@bzgrN0`1;J(BL(6yKcvU9^
zP1;q2l#8?&Mb)pA2qzK7npn0_{?XrTPl8BHl1BLrvflS(FbFC=;EmgE@1p61$Lov)
zUpaQjW?av{?K6U)wi=1+PDm1vPV!(m^XuXsugfSuTwr^vGtV7}OSl|?ZctJ_$7E2R
zsW{Htq!dZUkzqkEcmtU8O(~9P4V8IyqztNtNfPXUCtmhzXME%D>2mvNZhi)^wx8LU
z{l2KnQ{C&YeO*Wl^HdoWP5_L=NiJ%m%RF1<i;$jkvo@cMwKi;j-q4(^xrR;hZFFb*
zSU}Ga#vgy@as^ofI7ibAizg;V^1rAei7hUjC6heNPzH9;npq~M5S22bUnO&r9k1f&
z#d28H6)#&oB0w<oU^R}2m%Jbq=QyR+@i{u!n8wQP+tA^;C)L|dSJS+*U+jV0qw7cO
zScEP*Fu&)xQng=DX&K!J;GS1PbNa2)R;R=jJlgtYS!Ic(#pYPx3}70Tt+$dYxJ3t_
z%PBCtWpodzJL}#QNqP;UXRRP}W*|+uG|MaLFxGub!pQhKAf1cxH9kS3k>z^U7fmPK
zm|*q}RW@~@D0fc^oh*H6wQY=hc{TKT6d118MlMoRK62;|9BVA2e66v>8DE^p3B9Xo
zW9~?!v9lnedyvA1N9Bj!0-th+c-~h74diGjI9_+R(|soYpjY8>!~OIR-0$RG)kb$`
zc6n!><NQewSvq~Max9&xl5+F$=$4-OrMg7*s0DH%hXjqNGDx)F0$haA>d3WT19?C?
ziga#DJ|4{QNy6P&Qs2~CbD?o7f+wlcfi)WGa|;YTXm{zl=ycapiEb-{kXCS0`j-vO
z_Iu~Nw%Wx?%Xab_T9zbYlzY7-cJB_id{ua-+#gyS>h7n#tU*x5V<h&<sEe0%HC2Xg
z*M^l{@uabN9PW~A%8)+vnE5^|(mF6WNnOj6`{h<#stqL5sk@Afs82B*%#!KVZn8M~
z;WF|8$;(Z%<kDK6Tz)~Mh$i^xJ$#(ad^A{D499v{KnCYt&Aj0^Pp4zi&323K0@oKU
zXd<B$I8|)W!clOk19GQLtkTu7TK099jk5Zh^|RyAhSvSs81;28$)6L$tp_jOseccB
z_LEpr{n1KL-@-_q%yqR6^yD2IJ{K3<&T$nv?XHoWt$~P$Rq#lnDfXi0u1SiOK~=YO
z<rg!O1^m1y{T<pEI)akIlXR<ss5JQl5eZIeUf=?J2gBF0bkmvZ+ZxIfYKEApFR`q9
zgUG&ErpmjTaC(isc4)K1F4v@5FNvTbI>Q-GezBB15Ka+ZN^t`Yu^{Go!@*Xa6WMU8
zhow}taEgoE)U9xu%d@M+?lfzL;1U2eF?HnoEX8X$?O7>BKb&^j9ZFJ0f1{MMj&P5Y
z&0dbVNOR<NP;r{ZEKA~1M{u^$)l<7*moix&J9({6c_v5DcMyLPkdH~{XdQ<z)L~K6
zsVVkoJ;l=6#0jYZ`6IMRSf;u6=mmw{Qo1{g`$#!jVjmWh2<kGbjo%Z(52=9YdFSRB
zq4Of%Xbr5+-Z~!IF?=TtA=GM>d4x-J|3oS5E_7htBT|@T;Uuy%AR@t$R5gDtBbn?L
z6GswSg9aTBK|_tutcLBPMTIH#4$>%C!m5?jivkVK5%ETVy?7^_Mn~)gNMpR0-g{i5
z9>*;Om%lhJraP?bjqID!R>k8HcoUu>$_G72&Gli?qBi=ewvTa>DwPBamI6n<5)+l$
z3Z@oq(WqqjhYOm1Iv#p_$m2{oi}=Z`c;Ou0v>MWp$RUx~`9$n|s<O9&-lC|63(}SH
zF`2!*H%=UnvYcwWO`j*Z!Zx-y@oXP-euu3+ok&=ry5)#pwy1wRBP&L_f;8ot!iw#Y
zCM_+Roo{EG(w1JCVJm8rnIbtrrzsyJQuf-#4S_l<^9Iwga;1|hhuZRR_<+))NZh22
zodDI*g1|KYg>XEwL`yrNQ(NYqM(?7i2Z^m=rM6W(L#u;xIHOAm$|WOS_^ZzaZ8FHE
zHeMAw!xhiBcfGr#2hOKVi^`clE^fOjug4wN?yfO6rB3@ZfDi{`>QwXpdW;yFisYL}
z#&J6jsa?iMPQ{wGQL2rgSxv0uS9BCL2B_-Mfo%h7CIvdx7=IFNoX=-1G0%(KLL0r9
za&cT~bf*)sf#Kosg%=N;tjKg)9m2wg!={&nd3|k|zIsfPaB&eMA_3YEkT+G~d-<;_
zjaYka0kfz!T`pfutw9w-QjT5{%TXaCxmiPJj!$xYypLH>=kgQ`F>-XJmm-BQA?YC{
zsM1KXaDmzSCY>?AN9B6L4r-6?I|>^Z=_Du+BMN;n8hR{DpFHN<7ghyb(0<e%S}XBI
z=fg`@9PRSgv9!%))>7^Kxm9u3xK<|w6~@rpc~#kggkH6%+=Po{dfbmk)K;KzHue^i
z*HkW<`c&nHkmX%i)e_V3O^J(s`_QOGFzRbu!MS+TJYlum$M=DH=n&#&Y$z)8SU;mk
zFMOmZQ1ABHL~)2s$>q)x?o~LlRC7J{N}COH(WN4Za}^3J_sP#WfACT9;4gkX(!C*I
zVtLL^>$1qPm3)*AByS*ELZ?~TTAHa{#fB7t@Uy6Ys1($LtAApZ+%D5{nHdt>CHJKE
z`#DU%$fGmI@B~}8vj@X{%wuGtCJ<3Orl;=uUh+~T9Nox^6ZXAzz;UBty{R^t6~VnJ
z5^c5IDiW)g?*;fc+Yp9#8Jl9=w$HtJ@y+z$fv^T)u{+YwW#2(N#P8+cQ-_JCwzF4|
z$FZ8W&Mbb~T<bU)=MI4lv|JKK$q>U@gznR7Q^B@>i2Ks6U#-v$<fzON0{an6^4=s=
zch`Elg)esx^@N?f*Ha=^R4JDH@PVY-5cham;00PitysAvq~LZ2G%~j1xcxMqi(}9K
zBoe2yffFg1V45R+SzkS@QFFh^COgOV{@5tywM`zk(`d@*sMU)5F^M3ySH|0JueyDA
z3(7Y;SnAm`Kwbl96PqNd?iFiqv8CTdicb^usS@zRbF9^a9k7FdkW=vx7K~t$_@{lA
zzz2f<9#+z60SU$0lY!M|xSGXV7{PU*NjbrT*_1@?yZA~%?aKLz>Z1T5-fy!vglbYq
zpL}rYy`jC5UO1*cq*&^7XD>%ntevYC^N}fDZf{6UhJ+vM#5~b9nl7;;D7musbVr+P
zSK%39YuUQx5=C)4hnD2Q#b*bBl0TmN4~I)0CTs==)*L<u9p!J<w&IjaC4at<6r!sA
znFBg`zghml_Y>Z77uQ~hmn2*iTszn#96ZZ|>SP9*iuEy!;o2FLGP|hiNHgbl53YhV
z>$0bzpQ^1vA8<b`q$sY}QN(N&@vn__kN6-<6{0ZrPqi$;>4Gb{3hvrybRA9T$kEVM
z$UxAA=iOsdwh+e>!}THkOLy|KjcT+B+V?5rspje!9u1%DTxFEpHhriq3JbbUnZuOa
zAp)uo-@wxM8WKe;1svv{mNeT<E5Pt3+nr!Jt9J20Xm^?}3l9g!_?lJ{u<(gA_tieo
z@Fw?1`u+S4uI1pEThA0maSZ%bl2JM=QGykhE&$sWj<}w~&1D2wE0q9&W-aytqVbr{
zOhMtb`_VgsgbAx;BRGd0X+zx4;66xUx20aE$TLq-^Fe`KT`}t&e%;T)n>)$t0Elx{
zvY$+fpR~;)m>N59-miWqtdFq}%rOP1QI40=?2vUIesIZD-riDHmEOy77Ro$p;i1g}
z-`WIl7nl_=-R(t0cnJ((wz&zLW4X_*s(0=W%1S<B1iJQ!zwDqy$yn1Rf1;^WH#TK2
z>{iolu=c;r)cslBxKG>O5_uhOq}?Wr?+`h`606Aa>m&n)q^MN}h=rUf4Lb5W&ee2B
zDh|zv4K?!)l_Z213-1c1jOs1*LpgWVLv1v?q?Nu6#d*Xjq_s&L4(FoN6!Sw(Ve;a*
zG5FUw4Yj)pd%2puv2!78GLRaL!~DRMbIfD(T5kK|YWtMB*GLcYtM3M|DCydzw%gs&
zm0!sc>}_}YspEV_XJBo{WpZC%$v*|v%QgZW;oLKH&e6=v6iN%VoF#ozk7f;<(oF79
z5km`^R2O#m%RT5d#uD<)RxnBf#3Oo0r;f%qbGJwLz?+XgA0>OyEB2yfr*qf-m4$u%
z?t`WSF}IsT40u~{9^B`<jhZdm)LLzKSlV5eUTBWUWPuq3t#^c!&=SiXI<&G<cXTzM
z+MRPt)-;H>zuRHI9Hy`#m+!vkf2IIA`C=+o;hh;~BouG3$!v7h#Y(Fn&ST{K3cpjV
zYg8vd!7h%o8m6G%L7Ns!Bq<Yu3lh~k?0@`FVOuxIF7N^RGa5~c`!S)YmC(22B+VRE
zy_<tV4-=?$6ETN(?j<QzakS@Ux>wLZY|N?QarzrLQ<!et7sH!6aZHU^T0^AW+m}Z6
zq=wBSP#ZyGKZ2aW&vse|79xbzC63ciCDoXU$nYK2<GGXhGl`7qm03h{e(GWVl|#|=
zYu|@DpklPUY8^5WI7%k^;8ak7WV_*`2}LnQfn{WPMVhyDxCQOL;BlKd>%Pi@m+vq`
zguxJ=p~K;ajb?$ocLVYQUyfY^vY6m&v_~YczMC;&{5r*4%H(C*^Zm0g1|;iVzxhK5
zt$6i*>{W`0J4K3Ja~K`|>ltbt_cTG(n}B<dC(LXVW1sdYuE!#`XaswQ-vo5r!LnHb
z_nwi8`+a+@C!DU(fz_2esIxW~+CUb9U?~Q&f$F+6a=a%US|7t63FQt{bCBtf?n7-z
zO^Z-U-UJ+Lt6k9buX^SacK|PgQgy?Awm<%H`1<9~H;)8(YA_isj(VU<%@)<Oo?}<C
z6RcZk(PjuK#i*g0a>lo2&C-`b_zuzBmx5EEOs~Bo`6HcmIgL7W4By6ra)dd5x}l*`
zyl7m!XeU|(78{R*wIG?5(8u3FF2`Vwq{@%qvZBmkLk<qo?^$JT-+1h{QgG*<McvJ^
z5=ALhwb^{t(JQ1ieJ-`EWA>~V!{heX@;%|37oH)MP9jcqswZ`%ZZe7V#iyUpC8<Z7
z4>GKq>w3R2q!Ht-$Evg}=(vZar0Tx<sncqGYH*A(eEr6(DDs}BZtgUIYFXkQt7WUA
z`YtEo);vM=LVsJT9r1srE+3_yVO6Xd1%fmqmb(D_El0s0UtJGfYFhdk$C0j6^;#}M
z&4RE)*YU=1eNPk>Sr@}K>83lN^;6&QW`gA#Yq?Rij&_a~T<8Kwuy+V@NJ_1y+8i0n
zI(5t|htzJIV9tC!6v`0s?ID`|NHkZ;ltyJ#w8hXO+8|2T&`@XSP6s5)<0z^L2?yo&
zMBf3#X~sB0DXSNZW?LA)1r}%VZRyL$9D=xG`Rm-M15P{K+pcSu3Mr5n<;z7f_?*uZ
zH66>wn17&*IQv=;k2IvwkffGQUVT)f_wJrxs<=oG`LJ$`PUX?h7Zn#+V&urr$5A8`
zc+V%F$+7J(uf`Emb;)>bKU`cKsIq?gJnT>Ul;xW0-MmG$yl?9zJLg%0+;JF6R)wfT
z?{}Ep<D+54tJC!6>D$+sg&MykJM9LZqJAuls0FCz_e3`BGHC=CRPKGd^MGtY-M_I$
z6<L2@Dc~AaZDEs6VXLE#MgphNq4UdE1#*{m=QHD<ab=l(VK47{sG*?hc|+yelLBO1
zQqLX581CpB`ym`d1@gf?P<B4^;?ixZ#hPXQyT^<#bxJ+gZ(e*%tl#@)GTs_rK*X#m
zAvyD;lIIfCIXRzIGbXs#G(Y23@l51NNWvpo{2aP?6y&^3ODRRGyIbF5FMA{rB31S(
zar@*?za}uMO_Yhm`&G3+<}yQ7l0|%FD<|W*bQxU*B)cG(z?C43*Q}~6KSv#Ka%m+u
z_W&H6=p=O+X9DUmxqV)A?sjH+Q}Z6ND7TS&B~hTV8QrgXdctU-bthXJy0te*&R}@!
z(1R=3Y}+$Y<@2C-n*g-TgTlnmu%civf16j^G(%~LP9)sH7tbi=!C#HxJ!Z&K$%wc_
zYhu=|t(mEHyr#4lce#-(c<<h$4E2=AjQFb#bnT4N@W`)mz99aU)?`C9VZ49Sm;6bs
zZL2k@sE++E$23p8@q;d#W0nWE#^qOCu30lYnZzE~iwZF9(=W%p_uEmdCET5FyCx7u
zwzEWWn?}&c9X(ycI={!BUNE1+_kB5+4}3o0F5kG)VjNfamUafBk}ffwuS03Bo6%(7
zo69_=bS}~Gt<n+>wg`}3)Dcr(q@#M|bP@b>&&CqTalO-0Jwks1^HRm^ZWyI;!(sO_
zqr)NYwtC7}AYJUOskwyhH7R<%)KS;MjTfuzrbOndJ0(4Js&!II;nr4cg48!Py(cfD
zdPodgAex-p9U{|wO(G3d`uBZ`hCw{b773Ny0nZQhIh3Ki^>Q9P52ivu=0=nEtzmbC
zLPT1omS_U<n;+bFT=ZKu4_?cfPZM$;+RV2e-|}Je^?giw+q1IHFpcoAQMrTl9@G7j
z<F(C`haNG27bQ1y&OIBR+1Rud+5O(9$rHUtyUqV}$l}g?-i;IONS5faiKrRt%5fdZ
zA7rs^w~UkU$6MtpZ<BPWOz)Bf<j+2ES_fXg#X!NYHkYikV!+69AyLl^kr0`Lp`V_h
z69mwgEbB=|i`dLjIgYpOa<1_2Ok`4Da?s%*r}BNdMW%6LpN&ZZD*0E<oVM1}%uB~Y
zgpWs7PlA(pNQACk!z1+K6sc3TzOwjl>8i3H3V^>t8J|VO3kBk;Rn|Z9^5POD`)8Bw
z#XML#g~?OQB6NP~Q;}+%H0I?z>Sy#>=&6s0ajd2Rn+Zol<Sao&4Uv9pgp_e(ORxH1
zmikSSPIjWzBDX~&PJ8VEjHY~nyQ7XGcm+cr=C7xYRZ5kf)`oVvvk0!iA#M>!#%m63
zB2N$$riX2;^q(R8$NYv~+>Cd-ycZE|N(|AtYjlSf-hT(=sz^qVxZN`Os_?3(EzzSx
z{O}&@`Bo9S;E*fatyu};P4w(@qaG}$eiVXPJ1IUZ?Zn{dX~mOzs0q_r(HEu_ElQQQ
zmy5LY9u5^VMIp#|k7CKQU}Pw>ZH&`r(?YV*6@BH)N}qDQZ_ci-7#dv|3a};BqWcgl
z=Qk@5VBte)q>QHzd_nQdd!$l%bk!{Kv-SP6#()s^Bvb<7S|MY^B{o3H$aPl)T@lG&
z^r=#+{a`CR$i8xxwx?RhTjV@-ami)dKlG_LiM9cCa^!Lr?$n+rO28bS#%}PF=;?O5
zKlG{5hB{PiYTf^wKE=El(c|R0Tf+Kw)pqm7#H8zwR@T<-yv?XpC%2!|tnZFSH*XzH
zx)BIxtXN{d1B%kwos<WLqqN(KWt(!R(1f+o=WoS{ID1gL!P?ozwi1-5JZNKJ9SD}~
zBqL`}#`~~e`MoKQQ=Y8vVDF{#x6>{;dvVObx|GMZGa{$FcnGj=B+E`#va>fI4_l9s
z-A>NkDQ_W7whxy1JGqaYeMH^ZK01!=<iDEok&I#M^<W_~QqC9GBKepKv1AIpQ(viv
zG2HwU9jxUR%PNydW`1--;ZgOhS1E$Z$%0JbGaZ@eIGW)}DTs5;1RP`GNo`q2Dt_#|
z3Ves@xAY@b0Q6C~9_n!WA0$dsnI`#pA5)jV*n4tR2v&XC2DO~UXdSx83r7)f^raGE
z_cmH6?Fbj%)n<^emrMI!J>(k;&(Ib=L8psn;W+O0%hx@2al0@Q$(Z5rLNldi-Gf?p
zvIVSLeD^Iw5Q>jSK>7OXFR{>|bshMQlD^#c;J~)5g{dRgA0AtMwEH7Jxdb0yZ|wnI
zC5E)|d{<C9&lJdT{eB_mjz#9%Q{?t#YbWlshk6{<?r8=$-}HBB=rb`4CVO;63WP~q
zZ__zr(a^;$%ob=DM_Mjt^$Sc)A2fSV)vWENMU4qOe)ariT_|prmn!4dt3mVUVYgeH
zC&IP5B9ASXZ%(y;WqtNS4UA5gEJea`fFqXqb%^6|+h8E29#gj#gKZs`1fgt}wD8%N
z1g|L!EgGJ7j&ly|G+DOU^)-?yDv-Ohu=1;25D3A`MHWs$zIs0K)%haVoIC9}dUSy@
z+lfob6N5SKqwY6jPfww?x^E!C4-Fn}aE1jrAn3+njZWQ`zCqwheB^<FltNj`<j)1}
zMydDG3TTKIex7T*Sxx*9Nqs)??T>e~XIrV}&<nbJ0`X^ZTk+;m3KTJnjm;EBSjk(t
zOrK$O<GNCYIhkHz+I{@e>H;e0=$x(TAKJ7reHgQxd+kX0caN`X{in0EtR!_mQwDgZ
zfvgG$CSCEJld>IrHDg-sj^X@L$tIWo#?gnXC!km!_AHie^vPBxh+ss*p^ad|;@0kE
z4jrIbB5->OxU&;9w~Ys529QHPYwvY66O}ksc^Txz?2q!k{&o25N!eEt;3|I&ql4!s
zmb!kD47%KnVLWoe#$#0hIZ-D;#a=<Ru};-svA*~Hq}=^y-PWj7Uw<oncD$~CYKtF*
z?-xeGLnNp|Hn{!!`k{E9wydup61s2I1kgNzBnXggIuT+D`DVgA?eTS;<|i+HHKBIU
zFJMPZlB#5LAp`=wDn7dd#ILWzShDu<QtMjZ*ZecM*V1T(GP&8!X>MA4jI)?nl%OiH
zfKQ`YgmIq?+ZLaTuU+2acb^+O!NE3AlOzz1%YoE~NC<%uc$EL0OBlU~#Zmt(8-G#C
zMhap7X2L#$;}AwOnri<9@v>)|PZANW#y;q$daepAw9j(5W$tr1U}hafyIA&>h-lUJ
z{X(=3OPTVsIf}D+dZCbdG>tc8n<kxZ9X|96(L(YZZNrAMSqF)T7H+g4oxvlJ#~;Fi
zEko3Al1OJW&X}>y4RW1&Y~bA~<|M|5h*onJ?<r!46V2Hc#Qd&~xx$@sdTwbwi+T{t
zaWCkn-!_qH8|vsETm-UmqG^eSmN0H%1-$_7o6MCKSVSyRZ2-K6j@HsRN47|dYnejm
z5B)R5Hn+uUzKi!~FKL;>*{#@X=+_Bb&spD@GS32}-j?A@B!|=jd8TQ>cciHvqG<hq
z)6+v@*|iW*+ai@E<=YMF^MgFl21W)(@ujQht`G5O55XLysBF+IF!2E^D-y-Q4gNl!
zLn}!q>mS;K2O!>|ScLE+GepdDo>-ZFUa7ILXNWsFB2WF9HhQV*$^?BZC%RFCVBBI0
zWZi~$tTgbXd26f{rTP{Lkq+7!+o5c*RDIQ;`Yu$$vR=ZdZR{ad4Ogo^v%9d?%Q7**
z)0hc)={{Ai1@|jMZ1(be7*=~bw-NjOvslB|UxpTN$wV4|5UOr%ISdp3WXQ-dk5{{!
zE-#zK?<%A5igCT;IX`wtg0Lw|6*R}SCicZ}L=iJIbGd)ebK?lsr<57`A!oRMd{7w)
zog^Y!y!HK0WCg?qX$;KR3MJWF2dS{b3mpyO@9>7FK%=}|ej=i!5d<A&q`qSVcTOMb
z2C`=K8J_}8GSfNBfu@^f_`SM*?*YV>OwA2x_K0Arim>zP2>ejM6rCIu0MAdAYw|5^
zsd<D45FoZ2BzL=3o``5&G@B<PTKs`JE)5fF)l6NDCa1X3@*Vtl#1K?Uk1~@-Y+nW`
z$$=T7W4<PSgyNZP)DMvR5M;xE@i6F;pbtVayILArwo%JU^MJRPh=$gST%%K*QNy;q
zkGMnPDE_-76`@zkc(~5ddXP%EjCi-X{$&3`gU#?t8qG0|O~-@j2XdW=Xf<v)-Oi)U
zm*?RPphjhxpW3XDm^y#+=Si}Kzwd*p;Kn%9<p^0D)zVafSFMPM)}hqO^U(_xrSLZp
z2>TH9liAQ2bn1I={{<Th$>Bk!9cDLXyZd5HHb`%Sa7Nw?&Z3?EH1xhUnngdH+qRsl
z#(fT!Lq`gAV;$w04peK%xaiY&@zJ#(CGrBWK8>qm4gmqwt}mFf4t$Ku@rQXEhFLsd
zkFVf4{!kV?(a-`t^F4x7rW2X7Ec3U|`5(TxY`$~xEqd@tlVdh<Qdl-)M>K>+nTduL
z_ti@T(hZ+r;3cj(Qd`6@!yM_Rho%U+KWdoTT7Dze11v&Za=TtH(`ZQ0EJ0<APjcvl
z5$sqb^SvNxdo!u;9&_5)!}=<a#`9seyw`q|g^_02J1JgUh`siO#P~}r&t-cl&rjr*
zvD|@XVau_s-Sj`ek|8hGwGq!5-OGFw%kYPAcGp3wF!OgNjF1(7YVKzd&(<R%_eQmW
zh81_-1>vBr8FXe+H|zaxzEZ@;B0axVZ}hX?YDiW7ly~dfb(d^9!3}?^FvVLxf4tGg
zjXms(p>SxK#zj%W(2Ndf)&exgIGSfX{HSb~&MVfoJoc#^r8q2BvAJG<v|pi5D#cWm
zU_EaiBMtbmOZ}mqzYZE!SOZsvC49PUGl}|*Xlc!Zb>i&H<BZ#2ioX%9AVt8-8vcjy
z4Nr&UzRNblQ1jh&Zz7^)wgo$Mr{+X_!IzEUu^M+9Al3Cue?qk0Z*p<YQIGY<Wd~2t
z6#PQ8lyW9ZA>VeO5NOi{BBFJ916Cf9Le`ehcP*JBvhtqNG+iE@RRIkaDt0uxAxuQH
zu+G#Q<3vR3MD`b=1x;spILq}&i#k3eo~R;e)FgI7IqD>CxIwv6Adn1?#a0wUvspGS
zgNzGJjkuF_-LaI$k*eNd*j=1zW$%D!Xi3No^hz-GW(*N(1EzDJLGRpe?`M#G8t2&o
zvVw7A8FRUmwBHmIsN8WpS>rtV-vKdAkhmkRk;4s8!JQf9yHSygDptcbQcR0;8yS5Z
zIg&-9X2N~n0mZLqHtzCtD_MMs7(A&NS1C)(mdG>ezu$Sc$N>5iI}~VZ!CjrrV1xIX
zo2c0Lvr!&OsDbx$hr@}8mQ^n0uGB9?D`;-1?ke?n82<ZrNAo@?BaRAhmV3JCcnL8!
zK0uX}KFEFJ(bFtYjr*|h1-QvQT8kTtzYML?3eC??u6AP}eNf%LZ{vZ>er3ZSB(B`w
z94L{$O&A>e?7r4LxAZ<B{iuwQUB;hme#3pBkl@ot1*$O?NPk?|=cJy&)41U%dH95S
zvLLBBtezEQu3gXUG;0!D$69z|MRNTo;yHw)LDs23v9LjPvO$xhQOBv#ps>++veBHQ
z$=a#OzOcz@vdN9(g_qL{-@+GHCSP3Tcp2*S@_OORo0BhNIGQm|&54E0sguo_9ItLW
zy}DEQil{Q(=XhP=^!icZ>!*{ipK-itaC-By@XedaH}5!F+MQau3R^x-whVB*9d>&A
zsqpRO<l7mJR<CicuTJo<ldY$?)>V#oyEor$zInH*`tD0v>!~W1;Dm)t{W7$mEm&$!
z99IkO=;u3%lU790JLV$X(PW#ba~od~R<o#`fGld2E@}g|w9B7#=s3T#p6bwZ#u`Pn
z%Q|=Zv~=2YcIvfskWFzhwXlV7;&_TWuN8GhtG#!N!o{d{XP>+eh<a~a)P1VjN>2)U
z===-OddT@3(E@(_g=m$1{Do+hek3AVuUmd0TCdf(EXqDUJ^Ap+`Qt0jkMGoaaYY|$
zI6p48eB9vt*jdzDKh-<v+&3}RSI^o1BkJQ%&VfhHz4R^vOHqU0S_Y8-{Ku2tdbPe!
zoF6Ao`uNm83Ppc7of_m&9~3C=H+VZF>4KMy{-F2;uc_XzqdxjJYIIwz&zB2yGKaT)
z`|+q{bW;ugNR8_r8m}DvA@X#X5aTjpUOdL;GA?~O?!`6a%QYT-IuOh?a{cY6fZ~ZO
z(fEewab)TEBd(8mTtn|prz)I3`~}haS_~dRFn*1mmPK-Hxsd-tv`{lXIJQHs={KmE
z;<@Q<uIZ)X>5bx<eXf~*hiECB{X(=9ZY}5`rjfViIe?4FaMq%^MQIJF*)*F5_oB4x
zg7Wl&x$C0&t$ES2d0Fm7Rqn4kw-yy!7tJ-6>|MDoa4)(|ulSaLqo%)NT<1lm=Y3k2
zuW&D3Em<7JEh1Z2yv|l!&WLQ)YVp}xnZ|M`Y7IHPhCW;DxwY`db){)~DHOLt$iB7k
z>DKb(^ujfbjY96tdX4Wd&o*qQzipI&bEm&`oo)8HuKjGC*5sZ+Xv}kQ&ybbOoN~=>
ze_``R&yM0|w~Kd{xu%caPH(DDOq@zRbmp?Vzwb1&@5XcB<#ynE|KQ5Z!Bw6gp>98}
z-~VxQ=0^<AA;#@6@%~}z%weY64|AS<>Iyb*;L&}a;|jOqNB57P&Ky7E`Ptz1a};@W
zCr0XC%+GeWlP<zcz4I?bE8J~5lN(etw@*a0PKx*Uu_p`gQ_Q>h1sC$}`-Gn}1fX^?
z77e0i0Rh|Yx5d+Ns6>IK%R7>pL@%@?Nmsm2=TyCM0+y-l&gM71r<T0KOVGxMIlYde
zlzrHHSMJK^mgI&9+;l#Bi-7D^K{~dzc~sCvJZF*wDE&aLP1YC3sXQWoj{gsR>Rwao
zy<G2)_x?qnx)Lrh{wnO-=l$2RcT^lLeb_7!d{yQGGDY$v<-A>z*K|_3Z66sV(5QdS
zmErOWtAE8Q*o(|Jar`1FA(1O)XD^(XDlst<oa(HvKPq8lv5a5fO%(f-ecRbGM3JaZ
zb-Zf(7k#S4E^vEw<mti`n*l8yUHS-p&!FM+*D`QaSn$L7^JNdxlG(2vP<Jrz+!a$K
z3w}+V<h{L2YI~>MJNfP~7_1)z)D9pECzQF_rnC8U+`x*DmtJFWP4ckU6$ZK_a^C{~
z)~DvRhkTMeQ`$D-vZ!1l-kS=#RJpfB98%_*AkOoTmw5HV^1fIdc!XD|9G{Xbnz?i&
z+RD_>58hR=2)-Rhm3Mcx^rqr#K%9zE*hMqXa~Vco3&43v7w=uJ?YUTZ=}EBT-H`rB
zF7WdR!7OFjD!Q(4g%CdW{P-%1NsPhjCp|VFIhjhWyOevkm6OhW2D>?&?xZRwMZWM-
zh<VI-F<*mZTp%|u*~s_Fld)?L3u{}cu2etor^;4+F`e@5$?NauEnGp$q_LM|Q0~x3
zR0>HfcQ?b}!p*xVIs-wp{F;Ng>U%<2f5V_zp_3r+-hvH6FwD_CtGw0VoVT$HP}{bp
zm3q^pX6QUopPEjUyg=l!NVU(-zDYK0L)E^TJ%aq^vC#MHO9Sr|=IQ#arYWxrc0-!<
z5sTVvs0(Qp3|)bDFrua59@>#TRktB;p4-ZAS1E_}q%#QeBRFs>n`&2EH3&3ec%&$a
z6gY<~eJ@#6ve@&zgb(JC@mIi&;Sn-R^{i2l2gDlTvKZ?cV3Jw$RQ5VJJ^b_KXD*(y
zXCHzL#1?u@uYXw(HVvP?;Z|V$;TMNB9h=!>-{a4d5iy@~zljfw><+lT7`mVyv6MfM
zmo8e{7#_Jia;iEuU!F-YyRk|y@0z^$WCqga+G3Y)D$`@5e{<u-OvcUcuQ&VODAx~6
z-`r}W9r(G~!IOEi^<HQoYWL;G?@?PIJ-44buZCA?QuE-IajFkvXm1_*Z3>evJ~iO(
zP@246U--mOnsfbl<I%CkkDX^1Vor?vGT&Z5dw83Yck5XUjWsZKJW-Q?0HH|43Q2|&
z(>#I=qnN5o$y`R8cP|Cq1XK1FRSIB2;5yXZ7BiEvyh3y-S#g5vaH@}$#Nt#IM*k+_
zu4i{!FsKX@99!mXmqf#ULn>Y~cWx@&uaSGYE=ifw0EDD_O?^H%#U?CcQp;Tf@<bv@
z)g(cduAtoanpCP;H9?p4of4KhdC<>$asC#*s$4#QATV%`7iP)drErfP(I2GGK6>~<
zY>Ym`gNC2$M+B2*hDc^kDw*~@%TB}dAvu>;?bjNs^t`(vNSS7@Yu?-C8)S1iIm3%e
zN~=a|s3FdBexF5?<PVw*zIipyTw=F{KhEKYf@{;91-=KJr<2>#E;TU_H-2U0%pjZF
zqBbLmQ8uAw-Ys}CIZY#++~<FJn6FlfUGSZ<qBnfdY&4ri+Y_C};AvHK_Thm`Z*phY
zt=q-mU|*NnWV34*Ly8V6sWq04`czvWA|pqSGzJXJLs-Hbw$-Z0$vz`v&ALi|g3!D#
zk_Xc+HzH1X`IHFq-JK!2U)6BP6xiIs|Hs~aMK#s7`@)}Tgib<7ilKJ|q)AO^(g{Vn
zbQF*(9YGU%mk26FdXZiP1!>ZxgQ2K^pcLt#fS}l5$LD$9wcfq<UTc42jXl1jeKt=r
z<{TOGzURz8*LD3&+F}Ds>1&g9mB`03A4rk&?78Z19h#QBlqnN^>Y>{NGs~VZCj$)l
zjqp`w*<UkDLxzR*?t5w%k5m-c`fnRad5oue232PS!qsDPOvU&2%ddj?$?do&?4z#K
z=<<nLjwQV@iF)nhb-ZP_l=J5Ko7y@97?u56m8D=>bkXEd_3f1^i|oVKwYJ}HIEN`(
z#V~#qO}nzq`#foG%rxEIl4ke2GhQ=bD5~lr0j7c3pM4(1%w5c1YhbWbKNA)7wEtYK
zrDHN;j`IGq+Ri<Xplb7kXA@8Bf7f2$8L)l#;C1WZl}f*>8}DYfgW^qQYJ%!>&lF?}
zpFQ6Z<L*<eWKyZ%Wh0*ihd694^2LR8tf^e!oThqTlkl(uC0T##3Z(=8d)KbLPG1F4
zLR%u+Q-L{`&t{)RUwz(wEAXqf{>~Zuk`et|6inbVext2(+c~6<gUsdy#}CJL?kAG+
z!(8gEg<Xhb)<nK%iHR7T^O9Uhe@f(VvP;cM+hl9MSg(KDmYflOuD^!%YsH<A-4(9K
zCxe%%S&b6B?0Kn}*ifz4;_Fk~ZbfDd-@91y2g3q2#ati{<9Hav5py9vyV*7PQRbCh
zH_7BVl(*cM><#7(*@tf&g1atCLq}o*H=TOKtz8(NKias&Qaa&Fdr;sc=B|F$)K5gc
z5xrmgXwBfpyrDy9)AoCT_v)i)=JE8NA{9e<Y`dmSsa#N*O0B0!%a56gYk8CEDqAKG
zbKcyR;HGo)SZNJ@_NH;-xW-}JE$p<7zlV9FA@^OAq5iFT?(M+Zopo)tqhOTS&4s5e
zt(Uz;Em4a`A6gvPK6z*4zS_|KM*DL7#m$y?55+7l>%Z8nzwV&)Zrj2#d!uuOcK)a3
z4@^SWb9Qe}(TL^I#;+aGLh{3b7`jNYrW6yJgP!1fE8U&~-E?dRsg?_?=Pf<>)m0A&
zkY^t!YBewM)xoWa58v)hD2!dX?Vs|YXHD{9SQsI7KSnZQQ!_rfPfb<*PSMF3E&8&e
zt&=isc~eBPu|xPYDF2Az^6zb{^N+&<PWNgwu5O!MD0};G>|+c|<et~%;Ys}otp=CH
zl$&=H7Ds8P+E*8|F<Gnc^(()<2zmZF^=tk7yR?)3TOaqLd^=YE=u`T)52aN)RxaEP
zOOnh#eDt|vLyhhSQNwmK`$Fdy?~|~}>f6UPBz@|@=lk^N>0#xa&OP6|KNoho4oeF<
zKVNkCxkz>Ar2m5IrpwvSk8~<01HN5f3g~|O@;ZE<DUkb8a`*S{jXOWp^KKu%C|KJG
zxby4dg*#t6=}wP)t$wZhzWDjU_tsJMozrYLwO^m_p8dLPe|q%!Ona~X4oC<G2|e@q
zwQ&btVF>8psD^MfoAzW0IHZs+<tC2F9nVssg%HBC3u!SX;LnpsF<0O@bfQ*P@!Sbf
z!WDOTt)j%O6a_1yq=ceB4n|41M<+p|FIGe=ZAQq3Mys{TT^fqk(1~f?h(;&GV0dG+
zHp4>^AY=nsl?#P&0_<J@2#E&0bChRBfS9{u7D8flh2l=0#5lBuTm402RW<!3W1%jQ
zI!8$|R*(zDO$FduMWmBLT%?YuTSa_Pe4OV{+)eU$0&hI96dTA3_Q;CIvqna2#%G*}
z;K&p6<r8iQUAp0z;J=wLE-C*mJ>hO>qRQ;8%!DKlm&7uiuxzWd1mDfX0M=L%ja4#~
zRGyXeydnwZmprkNlslW4pb$@@u>xE`9t!cD?h*GYlE<yQJ1SCMeoH3wB{m49q>*T>
z^n_v7)V{%#3Gy^zW76Vm=(M~1>(GSYj07Jm=p!8<O((7QTk5jTT^e}mLB*|gEBVdM
zL}pa{KWMD()D!oZ$5wYK<^)#V)7>854eYzyOQNwP<8RJFpt?yk-^0IDq;n24Q&$rB
zzoiE-5Vrr4u}XxfSlR9!#HVvnWblCRiC^;Ny+q4zEq`+pRGbw@lCi{eGinD3Qo5PK
zQW==<-g1c<fh8G#%UD;)Gj%G%HLNo&b<gN8>)x-BOCZr$4&U!LS*0R@2Tqr04WH9^
zT#`3?et+=WJu8Zb!$tSK!>&aqqztttybgWnVU=R&A@8O8Fz@<(f88v0sfYOQF766I
z@^BV7{UOtER`Ne-EW#>~oS0Q0pB1~6&Fr6*E1aV|n_b|MQxS5vq%z0WI_L3L4mC2T
zS~!<`HmCl3&L4eBILg-}w^NwDwKBKoIqvCJZUM!k-o!_uL%A=9AH`+o3{&K#>pU7~
zdpO9J_tyIMv~Hf2N8apK-mTV0?}YQ|C-Xjd<iC2Hx5}2W7M8!K8?jZH&o!L?Nw?rR
zyx^cR{fl+M&#mxpi3P_M1;0r8RPjc^8Cx1iv5-O}YuTf4JF$?GvgqevA&p2r-MJzb
zkx-akQJZ@a>voaZ<0AH)B+eg2{EEKZBE^|H#R4P6{c=UZHjhZI_Qer5A<B|Sp%R&@
z67Fjy@*;7U+Db6t_A1*YI^?D5Nu_wLQmr4+By8Jw<d(s?0$Z}OD?h>>3Y2X>=Z(Ey
zcC{@eO$KA#mZx;n&)&1#O%Th%U;b{+@M}=H?~f3rkCZps^6dE`eo2oTz7+><XDh9g
zhf!8+2w=|*Jnq_(lkN_}S5?Hp!Rh7|GnH5Gv{hu}xXc_^1bO;pR#kEjVBQB*&V*G2
zwN#e0DW=U-6o}+&Lcnf%XH~U7u;fyYD{`vb2FmI@tBqnb8%3&D!nDdQs#~fmoi{4l
z74tt8R%w^O1X-v?N&3`w%_|Z*B~m-BSNqzt_H9z_TvhG6k=n)W+7Fa<%OZ8FdUb1_
zbsLm*KrsBVRz<%E>EmRnW-?#&>W@9^za`awud4q!QvZ9q{*1DLL{CBV8(=pY;K>aX
z)eTg+^&}K4f4h!mo3;*7ujkmvlHABv-N=5c@tzj+Jk=9!(I>p4DjYYS2qr&a-)ZC>
zeZt2sCQQ{NmD?!#?ujgwnsjoLuzr)=yC?j)O=`)FN~28@RLxqsjlvftG?bpGfxse;
z&05LL=)z{6(PpFMv!*{NmShcb^y$a%ti~3FnY<TndD1(JGVFUiyRQF?yXW#H%rzfS
zy|$T)%Ycd(vPJya^`5Dxw{Fq@j%ty?TyvUd_Ml=o)os0if97zD!MB?Ewo;2YvennW
z<*pKf@Qyhnw<T({C6|gmi>fu~M&NK1!~PfM_#OKFt=43!Hjm}!*|#`qcjzBbwag#4
zq_?*{N^U<7YQMnU?(47BD#x(j^z;TE(XG!=dZVRT|2cHBy{5XOE}5gf-MvMr{pM)<
zOm6#JJ90|@`s@z#i(4HJ*V<p+VCc2&e9GSbKACwzsWZHqWA|Ohy`LR{J6-cPUU2ku
zfsrr#KwVN!U4xTnFQgA%Z0JA#S<U>ton>3}#hZ6sIV8J$w1YC@1%onjU$p0ge%A%5
zZs1XmWMdCBqVt%Fg;}h36x2?p+>3bB&2P{nZik#o?&T0`6F=yY_Ua%r=|dU3ASF+m
z?0uwGD7A$?D1X0%S3k9XFN;^77@<$!pl{`8mq^VEy$)vGvEFg1=UU4BHWB?-cc0rS
zcU@FQ7^ZN53=po${m6)ylS(ffJGxJM`>blN`YpT+@<Li0yc|Y$yW0(LiXkE%4Ty3K
z4&w)J{NnJxF?93MV6fd_LdQ_JK^Jae&{=HQ_SeuurNM_|16j;G`y<0C)FV%&2cs9b
zEk9o9vmGH&pS|Q<8A|l(EqNq>P~v&QG4ga5kzXTFo-)GaJW{>OonSC>^Vje*gRxny
zQSX4Nq21B*QKNh}$6iv8_ixL!kBv=wjlWG9pQ{;vH#WYwJN|)sVp(ir)nH=HYhoj1
zVyk9iXKZ3`cj7bks{^rDUkqLyd%gOW^6GodtDj@9e(%0Iqb7pHi4a2~%$o>LB~sK9
zsm6&kdqg^#Nu>BBgW)8T_asZ|BwOty`}id1-sE|jDQ@v8Uc)JV?<v95DdE~F(eWwq
zy{QW{(^BHo7Y(Ony{F|<r!Un`D~(U9>`klD%wWW4Gz@37yk{<_&gj<8=#S4B?#&p}
zy#9as6iJ`@{{M?UCGk<i=%bd;$IEFSb?ZLrPkc1|^wF4h%|v3&%xLY3&zfc0nswcp
z?Zn#EPiqde>rN8uE=KEaKI_-h);;RhZ%nLve_HpY-SCr$|R^4SPU+X$=MxHYj6
z`Dx=0?IvDgGumh~)@L(5Z8NcMGkIb&_0#5E+AV^_R)*2meV?s|X<ONKTe%Zkd7ril
zXt#@QWB$7u78@rQikpi={XCqX=e#gKueh*)n23n9xQLvTgrcmpnxdSNin@lXqKle9
zh9;f97CP%P!c<S|p&pZtzKMmA?gi7kHl~JHGwX^gT=o`NZ_CRvR)m)}NW87Oo1KNy
z)y(><f`blhgHG(~&JP@1JiT1(hFrL`Tyu1;JsQ5o<A2=|=V3MCAz<M7sLk_Yu$SAI
zx0s1<!MLxamw#A<zsI=$MT?t7*1;9{V4qjPidRF*0zz^2VP*fTiM4m<;{O4}ivLeR
ztc8>-Z&PjO(rn!B>P4hC=cmX2ZDRcmV!gfR{C~;B^8Pmy>%+g8SWAy_IThXi4G@c@
zVI4nB{6B(N|AmIN-CzB!zvzFfVSO8^85n)@e5`h9?8TR{Co2=(pC+Dny?W9;`Sj)F
z#@OV-+GOA7$<FW7&qrrgr)J*m&h#D4bPl}k*#D0jR^LA~tc9_e#ofil<&(wHsrMsC
zA0}TfjelR7I9{HaU;Q%war(o@&l_v&KiA&8U!PrB-`iYY|GNI}=lblo&G&0t2mepQ
z+I!a;u=9Srz2*OwhQ%ks2#^Ua;h>ZXT6f3=Do|QJjGIf*z(mth45Nhtkp*#0p)iIy
zc(dp>E7(edp6`K9F|&XGUV~oQ>ts1uvYe$j?%Yk*)l`LWc^8CW`KAlK4Rp>q<`T2V
z#~>x<qK~9^yk$N*<(d7$)XNqgYd0?%ExR&cW*XcW93qyrk!JQD>)9{Ib$DaUi?`Nu
zTM3QV;v||WHu6H-$_<g&uUlYBX*3%uQ@U_Ty&&>^PrAZNCSR%ys|RnYD$i?P!#^4p
zmB>z}%&W4nIFTxKUFdQ$+N}^BkDlL8kJ0=AoK=kLd;w-(X<-VnDLPGs#28Enc~*Z7
zPh?at3&rbz!9N<-HTuVtGqiMaKUN?$PtsyuF~V1>MC-elKT_db7r5OJylly0>NkD<
zsbL8rY!M<MeBes-$?Vi04J$)eDwXfaglKm6mtoFaY?U!d!%9g~AT0c)VR`9GW&ewY
z_4AL0#gNDz`L~7@aruvih2>fPv8qp_ycBILP~o1DfO<W|(S-gXw$O-v?fP#Tmi*L~
z^m8MrCu;Mqe`#15Bn@k!QMAMTOUoY(>qz$>8kQk9N(9W$jbc01{G(wR782EQHYaAH
zl)wLjhSf&+_CD?+ZQ;jYctVR>9^Cy4y0aLe$ummLM~k0~O9Q_@p{5{dSguh~Yp0vu
ze`#2bG$-UdZKUx6?>FVa0{6ZiekORdeI$paf$6gUXjsqwXjsylW`^{JHD4TPA|YA2
zBn^v;L~OJBRIdmvG^Q;+fRFY`4-^Bx2g}t~+vPq`eK_&ls1BPgrWhH`r+x+(iWGyO
zD}=O@wdK>vVC3*h+r`EQPV!tQ8hGkmu8B}A^^0X3u63I8bJ`l6csiCN_TGRZI3(V;
z27(r!epjC!50-ZQhlbURLJ1*Cy_pyhZRc*PM3LVOKl=h#y*BxuYFMI3{d?MVRU3EJ
zQoWL{K#6dzw~}|1rT)^ee*V$0G!U5@J<2k(74Ty8`H)`@OXs)|26GZL|EghW^iTwm
zp(6LO_UhDbp-0RpHXV1C=T&$VR9zF4=gn=%q0@lHM%%nuV%zBk6)IY)E|k&1c&jf9
zwzq2CNe9DXr`g$u`^Bh=yZ<u{tE6wP8HD;zG%TYc>_bg_d)M5V4)CuU7Co%FBpT-l
zj70UDqULVB?(-_Tt6jK+{-}w$0H<$Vr1+BF-@JZ@GQLS*lec7SiY#)SAlk*5=E$;^
z!|`xg#^3ATHLPL4D;V;4F$#E=@<TnESM)sxf6m_;mOF-i+o=Y!wQ79yOI`b4HLMNr
z9aKFGY<MHIUy6?{MeG(h%2nx6Ja|nCiI$!%m)i%Se6s7#uj==w?=QDpp(rgmJrQF0
zAZY6PL*raB6;X+XvQWa1uA!Mx47X3xu#PcC%A0V93yS8G%z9**kd0Pg#v;<4XbG6k
zxc@#EbNj630lcl*PHIT&c@0+@ZEe48bm$UU<i{#lW;NI0NY$J5;Om^(?)~yVgi(DH
zE({@l*&07g3X63SXhZi*RrQbRj3>RmNs2X=m)ouSIgL<f)+{1XOJMogy#VO&mGfkS
z(blOf=rxu5*KGG=BO~8hX4%9^Tt$fa{rF!rEY$-+mUO%Z^O2~^_XiZh2e^bbH*aU#
zEwEf&+Vcrg(*;xt#>H4f5vXuw^V7!NKN^<LET{H1MmXwZm$%dp!X6OR8146Zh(%&Z
z8LN%pVgEQx*#k#ZioO)0>mPyjNDp^JAe6Q=##l2NbDnC%t0UddD8CH#GY+BBd|SiN
zhK0FCC?yr)-<g8v?3xOzWkx}Un6Lt&Xy&1Gl7<ycn?psczI~X;w{Jid-ZiY;D!Xa4
zQE?yqLtSYBxCD~z`JXi`1noLz1pK`F-!-f<Y6bG(hDg6w_%Vp-T@8PA<oNEjpQW?3
z+y8wHYdcQBflqIzn4EKp%H*C0qxjBHi}t!V;nwGw_XsueK4I`d!snkWCUbiv4Ga0V
zhDA;(G4{5Jq+!{dp+dBCNGpx8ua1K4VfuywN}4?|kse=-^GZ9&XJ2Cv-uX+zQfkGg
za0w1cr_?D&@~sdv|7chSNw*hzoONvT<lZb_WK8Iz@#(%S<u&<Pv%y64w>yXq+cW5O
zBSwqdsYu;bH9aU|rCj;sf2U!|&i4PUVTsX~?k{ncFC_~LZPQ9SX0JtH$fR!)EzL+8
zRx~<E<6Rx5bbaJX*b-G_p>qg5Ul7B@gM^N{sq?ROqN&QUGU6QMT*`hd3(G|?mS(g`
zL`R;QXT9EFKqcnlc^!k0oc~F~+Q(75MwOmn$}h|c&p2{6ErIa-r8J#1$@}{)6kymB
z+J+47kuQD_Hid~0Q{@K-ptsQ1eHN!!NK-M*#{hWj7n=F|<gR=O-oXn(>56)*Wb=ON
z?k|~cLr@OgSLUK2i8#ndi1pf`qMN3QGOzLGO^p#qNa7N>!cl%FT?OO#4-G5(-!!av
z@FoLP*-^edAi7@TLhe5`EZrrt-%DU!zwpA0P%Ql&8zF}Emm=*KVHa6kR~mF_*Md%Q
zdI%=JV|85>UY$?TbfcySTA`bKA$|pguDSozup<9!4J(kylisTymvGS)uzu~Lq_RmT
z#U%QIUUXCa(&EiT6-Lpa!}F)>iN>vQtHm$^NyB3KcMa>=-x}5cB+pb3PAbLwTf=$?
zEg)%F3b0R4{;6T%AX?Kw>~Znon{*LbOjB6sy%PCjRDx(Tb;VnF<o<uuu!OLQLpRg5
zPS9gF&GJqXr#HYQ?utVD)Tg++1^=pH$-p*e;qr`7<a4*yP=WwPz|~LmhvY3NC<QhY
zusUsx(9&<dNF{-S5J(yp77_*%o>D+4m_dXxD5P<a$UhpE1{~3pD*1rvHx5E->x}q_
znQIEhpdbM=@KP*fEDCZ1&i~snhGr^?i;;iIQN9wA-j%Lmu$6g=5Gwemh9%UXXJkqz
zfraYNWx^{(P7Bjl-zGVliDt$_9%#gL5usX3eynU++!$Y*Kh=^~^H#`43+a3kNuYU1
zW)x*flNVW!mZwSBeOb{t4FP4e(hsbY8Cp2fL$Q5@Dmt1wrT=EXnNV<_80+D~LS5l!
z|3SlwrYxAV{3`G;&>BI_hJSidVJF(jGz!wpn>Arg-#Nt}T9P@1m6+#8Difh*I7s#Y
z3%BJx#w!Shv&+)7_Yt%k>0qgR9bWk;!F-%9()DZBt4jsk+%(V-<c?!<JV7N-r{Hvs
z^>B-=?l}L<x{xfqkUXc5vaOJMUJSB=p=3f$0p8UsiUmBVO<tvQR}`C86G1nFpB?0}
zW3p*%iV+8e8|gQiAT(f8vJI390H)zc0^|H>&xO;<Gof<-sbN(Rc@}j^msk*aP$GCh
z&F5J>3PNq{mtxPAnJSi<+mu=SD9!yh4GRg?P(<o`vRn<P&m1g$yIgA7R_--lZhTGw
zmBWUP2di5m9c@A)m&mkS6tdA|fs&%BC>a|RiI<}2+J|j^p|Ok?jy(&naE+nM{WlHk
zA%%@2erG9|^NVD*qUgou6uUAy!al6wa&VVpuzL=N&wN##NEyyiHP0!O+5fT9OGu(4
zm4u_O);_EY3vJKHB>anph3WQxX#*W>qyAl(*G`1mUSw(3LlTJ4*9}yu^w4Gqodnuy
zex&vtINhv4&vmJKG(5aTL$%tIBb%gQNm3sv{-+vNDWcS6qt4MC`<nE6{}Ow;4;!C@
zj!`z!+fqyTiMnEIZ%Q>BKfYtXPUUkQA;|JyXjreI3O`HTmWqE+mK8Xbh2WZ`_nWYk
z<g~$TSA`HC8VFEs8prr+-?hX@8dim*R3c8P+Y|fMGz{F>82_?n@kyg<uoVY8i*7ZI
zgF=9PKr^I~n)UEfULs^#OV`&{esYTThuKq(jQCqRO)s6AgivKC^G#Tr3pXfXn(So<
zk}!Wgwzi?<E|l{30mw0qaz#F+{|T)GQE0~ztr>f<*`->M;hC*QW7_4mF5<=8X3u;N
zT06<_K|l%=jgR$Poi1s#%aypAnrr*=(W=a~+*abiQI#z>G?nd_E~b<9Ns_q%XrFy5
z2S514&(hj`ibYB4S2EPE{b*~kWLQ7A$yrjXSx!k@5Zk##X*MN9_n@r8U<g3rpv(Y$
zg`;x?2fyZRv-^34VFw(W@xqm~)rE@{S+Z=jn{nwPo+Kmg=)|bY#i~E+)>4$kuRN%Y
zvMtze_h#(qWp7PqDywx2Gq$0b&ZrIPE><Rz3sTca@7Me6Q+|2~4VwiMB&n1r%T|=i
zrY@G>SuVS;i`crAE67Kiv5v53E=2ZRIU&+1moq8b`9e&x;<Ke|dY?fs{39Z6mf8r#
znw~aH-v+VABs_>ag;X^~?$%x0<VP!0-YfR2H121q=*^Dh+*T94#0Y|Kr~$&9%y9fU
zLflXEH;P-iknW}A6LDmzLpS8xnKfgWG9vXC=6xG-(i$?I=w!A8jzSkgm#HLXV(cDq
z8dDBnMFuudy~dscUXO~e?}CjfgMB(Wxv9zRr)cC11~(+B4jO3ly;xQdIl1r1J^Ze$
z0Asxz6g|7(4~}C;EBf#Q_ZHH_601<LL>5?BATddID~PdEY^?v+=%9hr;G?k~YSdT<
z@~bfN7*Spz#@WX{uw*-ew;j0N(fbSqDI?Mxn^LxXDV0qhc#Wd@I!_}_q<qRz);T2}
zju~Q<qJr-tvWbJYi--(8#QGVecE`lp<V1;q{xaIg_#DM`YN4v5QjPm$KKrFn>6Si{
z)YvG9q2wUeMzKAD<>ag(iB_tT&VMr4WSS8_&6+BJ`zbWlT`poUYN9w}I!~h$NjvX2
zb0$V(h;Ei%WZB#IFE@FumS<sPLu0hUr`g#XlUsb%khqbqaxw3<`#6W${?w1Q87I!^
zmTxRyG?;j{5w;u*0auy!tlxUjaP%^u{sCeofu-k*cMFSl(@TISe?TndZrVGBd?MVT
z5s{4ai%1<sq;m@r(-xOzJ?Z9JdWkS6);PzF!NDd)#3ijG$Jx6eD2DkG<T>sLGE{YO
zQGhV288Qc*DIznG<0;C3O8FV|Ommu)GaRIHa<`H7EZB%K4vo`~<jsp)BBZ|0Q#_&V
zY@-f2Gwg?7Mm+Rpv>Hd=R}7>xp=&}wchdb%5fzD&6%pHyPdqCU6lE#N1B%(NAJx9!
z&GSnNhd;BTc14r5PgQ(VVOZ;=-%vpYUl0Bp#5%d^vVRPN3nS)g7k~F$b|u2!JVLlw
z27AejV}h441C|af!4~mBO8iTXaJf>?DhK~s`U48BhFfNmS9_~uQ?{zR=WAYtU#URR
zM0!=LomM}?tty_<47b&QrRXFILxOldvdS>aaUppYP_hEF8J1y5hoOYa%H{W#*e8~M
zVvH2W>MAe8Cq|?rn`*9J3NL%C{ODUnxmkEhX5GkqzXIVchg1V2Xc3Hr(j-5lJi9@q
z#LG=@t1WK3+3!r1cxsh8Y{K!4Vkc@jnX3`;n;!Q!i1n4iqY#!iA;a}CDB2Ter=beo
zq=RNb9lC?%0@mGW&lmg+ViEoUVr8SeW%u<WwD4Q9@uo8PjsSS$J#xt%hVojZ?hOkA
zeMAAy;nmf@K&<M2fLQ5&gIM~T4mUn+1;L}1Uevs!pU$Tz6;(r!{|;i=G}zLciblwa
zj{4mX!9KNh*=hO2<+`NrtP=;v_lRSuKP9Dk_uo+ri(gOMm`iAx<HD#)EuLF$BP1(8
zm&qJ(@1c#f(%pnbT9blg?EaZ5UEUPkOZ!jhDRhOo(&8`7c22ES7?h@f&lkB5g_qlY
zf!n`z4H-;-7B{Dvn00{{r;Kf495?7@YnJOe_xC2Dt_`#!kbAue2zm$6i$V__3Ssn7
zsU6WuBl!mp`XHS<3{+i6*n&3YHwqDBgaazG$MeF`EhWA67k@ykDB@A91m5=rc=DSx
z%GI!&bbt~EbYtq5Eb{1K3xr~CDjQ<{FMFIgpRj~ABt7b$bVIah|4mt(QV0>eF?jrA
zS$>$}UUvq9)y{&(6ngW472XUIl70{;n^Ei*Uv1i>&~R+&@2jSa2!DaNyq-m@A8xlr
zOx{7fEntrE$VxcV)iop1LBAu+!C8vpKX);{NyAz6P5~$A-_!?-;s;x(gF&lT+^=4-
z9DbnBup2g^=U=BooI+{&tcXjP7z!o{*IDASMgo%GsMKn5<z>{=(865o<m%;g>SHD<
z4?j*$MxQQ^=@q&w>8M=2iBfB`C7oR6vc=)K=?&vTOe`(G&CI4rsqTFVxA_?XRR_$)
z@tZbGyyn%X`)+IVuXijPoL;8!+rHVgj^68nE+)y5CcgTwO_bTb{dBb>?D*5#ySJYm
zy74eN0lV3T$sjY@4a1Jv1D7EJzj664%XPQrhf==l3v*wt6N?y}nSS37^q8r<Qh$w;
z8Af-9fF095le)p>&6xCgDPNFA{*`d+?{Re#mb$kq{T`PO2czY@=9;}%-;BTe=G8XX
zE-*O0@ZD>(_3?C_QM>%!o2}RN*FOh-y@YO+$Mh|Jv}0Q!X1<aLsH6B4&~W2!(VScl
zO?p7rEgIGDn<e9_zuc$kIzdb#``yq2m-J`fx7#ng_$|WduSu_;ve_A6YVNPaY#ZpW
z1={eWzQkzXe4x$Zl5%5U&$ItvkUdDoUxz2zl}-zl5!0y9CbLSZ%U{AMees@q%Har*
zEpt;}qWxD2oU6h7re3qrt*OgWc)n?|i%n6|<EW=cHz!IyB_tUsCr2?12{4ZOh}V}l
z_!@Kk{Pjij3_~G4^GcchHw6=8SLjO<y?_xYM$7w1+Ki+9<I#YgMlA)`tfnkesk~a}
z-L$sQk4b5#=5CGD7H+ObudUp!5Z;*G>KtO0hl&VfDE<B}kP#GdMXtzP?dr6c;G(A4
zTd~}lCzn01L<C#=(C9&}BUL?o3WfJQifsdbdpwx-9`>BB3Yxn=T^mxJBtIQIy~ce1
z+`{HyK_1jIp88G_@!`8$6yug+dlO@FFJpT=t>)vaRZg6vyZklI<9}FFVN;Cr%19*E
z<ZFz?hv+z)%vAI2wFHe%vI!TWh=Q}4au}^^4tb(3YX+lBnDZW`9>;HLNF>&IuG{O3
z=ZX^L=HHyvXI`7%GAQC|bI)&o6Hl6xm?y}vFBv=CJ-7Z`)TXZPhRx*3)U)KhnuQ6b
ziB=P=l2_NyulhL#QGMQjG^}5K{S1N~YK4uOw*SzuL|cB{oF8NU;y<SJ?N<O%V{qSV
zQs43sTyZmN{&U;W@@#RZbxX3>^bO-*YBd>RC5%1Z-+qTI3H$P72pCx0d>}0?%oDnv
z8*=;Ea`IjJu(g7gym$lG0xG7B=EelLEm`lzyy}y;s$w2cc>hUKlU6Q#+*|V&@#{{@
z+38h>_MZdfTZ3nJfZLR6z7W$h@JX{_e=59D>4SCDQfHDR_8b|5&i8ZV50-R3;|ih%
z&hB`c32n;yMDOh^k$;2Iz>*{{|B`b0tv9PKRfJF$@j`lkh4-<ZJ~n6hH8MMdhLfve
zBXUoiWPh1ZOQ#p<r4qGyno+5~3(K@C2pyGc$e5s-lJk)X{eoSHE>)oVoP!QC9YOt>
z<g%n0g>pRV=Hp_+g?RX`8Sm4!$s|SR%IM#7P);)$D(L+p3YjsN@=sPnLVE`skzPpD
z=ZiX;<(1Jwk_Bw>^mpSnOUNDewUE6Vblg8kr<m7bu$Q7^iCAHfz}g~Q5sAVb#avzF
zz0%ObM4nbhO0yH~^LA)5oh=B=2AF0HzBXLEupUi_$%tNp557f5r;qVv%ITe94EZmS
z-@qmd$X#(W^abnYqE`jz%GoB^k@4_qjdJ4&r`WjJVlr@cub_rCHOsGL>iYd+bQh`)
z<@$;R;T0tglkUME^%#re;FNEQV5Y9c_x3U=DOci+{KFeUG%GhBk*ohLu{8PdNh
zac)W!11S~qp41t=X8K?|?H=Q?u5!(OOn@XGvPUFKg}XKJ!AW0c;!>j8ClonW-46xh
zBv%)8S7mE1ft{X2$;nBX<otm0`=<z}%Sl~^jFU91D@^j&ols{a4eMV2D{B*yhV^6!
z{d7dc@CcctVCBS0-Kd4wCnU_1^JR7|fmB_;P<k*jpWiX?#AJ!2p9KvqIs9lSR4Z0|
zU1k5Y4()Gr`7NbP-GD5?kH7jrS=5HP6Wd&_wU@lv)Hgn%NxeL~qrTs$EZ^D_f$_s2
zG`|;IFu;rWpfOZaD62BcQVI!jkt_Zvh%Gs|YTplZrB)<k_A8%L?V8U$+PSOyr<?7|
z{Pi!NP~8h#0Kp?eb!^FbXylh5T&G#_3Zagp;a)2ldqJPWQlBgylAUlYG5X<2a|%8U
zjJ=@Vg7XjHniFPL*(8>G7(JIBhw(X^QgKn?kQ`GsKoN_YsYg<;--=m91&bhUw5<7S
z3jPEN2Eo(lEF%+_eRVKBk%$pgU9f=#WTAc&2L#Jk?yBscrJ+8cwfO9d=px2=kQK9f
zO7=ym1`*C&U9<gh$5P2knqaQuA-{(gi&Dc2ds!;d2LykJx|W5W48Avyg8={@DM|rh
zCI^t_GZa(?0Ps|Yfy1w(m=lU-x8jL{F{40IAa3vs7+iG6b<@im4c(Xp0nCWFOZBot
zeqRTryV4VM+?}{A_F*NZ{@VuW{>-kk{ha4awo$FzNY_klK0x-aDk<{~8R}Qwl-$kp
z<Ry32iDF)G#F`F<*%V!?R1nz*&R-AIqTBzHWF)mI<1w!_jhm)LrSj|UY_kIjN2&dW
z;)WsnY<Y3er-O=~+}BTN_pP)UZkr@HpHy<45&SfiN+)CT+@HVR*^i|oYomxD4dd9L
zUo)cTP77jvN3$cO&5(qQv3%5qG*5iiytnw8l^Vw+zOBhhPS^+-%R+>jBU`MGy!ER$
z+2ZV*la>LvMFOwZXCs2NB%U<QS>c`5pk`7(C{c0~Jh`D7KN&l5#8TGI?6>*-Qu#r=
zWR0Cx8#<aZvyn$D21F}tG}-pfo42??gVjq7E~*_tS?L0%{TQq`Q}$_34U2|;fRR9#
z+c)p7<o4~LAXjMZ6C9u%Pkd(QdJH-5`x;=*ac)@I(yFG11)89~AYxjZCu0(m`-~#R
zo)06>PX#IAwdQ95K)??GA~ZOj`ktWy>HU<P5L+z;2Lh*Z<aL$;UP{0nfC2zqJplkw
zA@Jm+phgDe2vA}PJU~Mr!fJ`5->MrxAaLQ2hZaPtU;sLg2WgJlK>}a^@B`GFoI!&h
zFiBN@XQYDLqa6S!#KDI;0{}1rz)@DHs)rIbbGx?NRZ%#AsS?Mk5KoE4Qvx_p0#1up
z?Tf|>#;q6#D~=2R5GctTtT@(No&C8F-)JNR`$Zcf;Mba>!qS!R;Nm51;qp3Bo<ip%
z8)AiLF{R&?@!jzTI#3f&IL#NhcUDwvd$gNlCz~?mrDzOmFBB+jXKciSblL(?&1+^c
z0qIbhq3$!r#!J4C7RE^!&;WW40p@m~Kx<c(S)36n3Z4M)prXE+seUp;l5gS|w_w53
zXz~U!|As%`#jzO@;SLntirW}fTvv*<_rqv&Nbv)JLAnMLG48rwvoDHF$$;>YD*6Wl
z9&M+{yw#^ht%<GfrW)&}T>w;nscHvm>eMJgXK`A|E%z1S)U$v@ztBrt$%yW<3$4+7
zh-ltz7F%Mx<t(4PJ2-A9Lm0ur<yCc?JMngwg7jvzKu)G`O|K~5b1|_bak~K|<;!X_
zBn%5;?!m#a1R8hTQu`$Z<#<T|;8&2^R*Gj80$38;855(_kJJFxM$Y}q2D`X3241vo
zX<NXFoQwioPyrY2O8DW@uF|Ke(o6=-;_-~_c!NeVAspvP`!n1A<?1eqkAsG0NIL^0
zwQIjtE*XH0N$Su65IO)#BMuq`N+0y|9Dr5F7kj|<$YHe=WZqfvw-Im;D>8F;@Y~5a
zXJTA!H=INjMK+9tTd6n9kVU%3H_yQRQKPr5;E`GJ^0x*H6E2ri7oP33F%D}mU+QPX
zlQEOy?nLxG+L1w686Xm*5VM2KPCDv#NN?QmNXlPyRs%4=i1)>+r7FkMgaZEVfJz`C
zP@kaTrKW&IZdbpko*skqkx4-T<mROoTLJ<Ce$Ub0`fm6vpb)s~s?joSFkxr#${Zh`
zBL5>1AHOiFbMud#MM;`XKO`JAB&oOwaqJ!KB<gSW7x><2V=BT?I1*?SNH;|sbwjrt
zV;3WL7b6}5D6}*AgMoBiJ#%ele;wvI5Cj_q@{{rga3X#L-Cq~qK>?=*!i<-ipb%D$
zF;2PE_|UHF(RADzd%wXiBx30mBX<-`2l<(OBKub~ScS-x2s&1VD|0C4OrsIx#@Fr{
zUBJf+Ea6kFDI;)?qlQM@SS#9(jM@O>b59FEjv7pCI>?>av|rJgd~qUvz?hc?I}!GC
zK?lG=uUa)<$Kq&EWKIf=0Yn(20cVCKJJTW+0V)7u-s5qB(`1I4Kg~>$3OFNToEmnD
zGZeV0piDw?Gy{q7%~-Pv(wgj2dJ4H}g}&Ml2WbE-urcs-H3Mu^yX{NHM8Nsc47<m)
zyzB^@5{5w~exYMpd2u=b2UUuJKuJVaM|l8NlSySt`H9JeqG%f1B!|M7m=hMB*HpYu
zUnhNk0q-zgfB-N=8<x}`<%kbgMgzd4Z<CsW3d|!F_YD$D-tYpXVBv<4SvMoBv0E~6
zqqBdJfuR6Y2$a{X1~otm@f#aLalkClcq?um0zkSOjb>kfIU0=+mSnq%TCBj&9W{0e
z%b#B^-#|2janbqBz}X5E2RFC;dE;#WA|A$pla$mp%fo5&y|KOD<I}@~C&u{#oraE&
z3xuH8$SrzVE$)poGqD1KLsJS+Ri^K8Hv6NZTd@4ANH>KJMr7QhcKRDcV|HQC_n(C8
zz<fX`S$W<SXGemsV{ElI!G>tfj+tlLicRkzl(`|DS#5Q?ao~#i98PY#HF_s$W`~nv
z{0TT9jI*!-+;QK!yKwH={rkQo9um>cZc>|71v6*>IcO@oqd-76VExOMA>3AC8PA8J
zFrTgG+lMP!Sr@j(sVu$g*|#0O&t$=B!_HQp#RG;Q@JAXQJ{6D>@vAMe){(<@HxJ@D
zVM*9l*x4i#^;Fs7*(J&4ao!d2_cX<J7rv8;qoRX!prP(hY^f+o63>UdcODw{*F>cD
zYI#5Hy@#0EEBmV#C%`>B>~~=w0G=4KP#jtJAfpK$?)SmPn;Y`z!<^wg`ff9Zsmt|w
zufBQ%{7e~YSvYX_m~R4@+8uqk8_QY&P&I&@PohP#NcTvzNc#MeIgVDx=D3soV7$t<
zQ19q>^3rcdemn$1g4jM@hLZNN&7mGX@t@WJjD*ttM#9`DnG%7!vPEPHxL>tV5Jx9!
z90P(Cw^uENq3ZS!H)HkzXdA3HT>9*VaG-`ICPLTGXfwtK^zZiQ-wG#6O(d$c#+}j2
zE${wbNy5i~68f2}(QK;l*EEHwYqrc7fXf0|a-#?};Sd(NAd?6RHdHgPTAqFxbB+N&
z$P}jwC~k=M8z}+e_DFvq3M`2ma$8mKXY^jeGb32i3!{sx5^wKM%6v*@C|~rb=!b>k
zSc!3D9dZVUIiwjG6AlN@0#1Tl6w3QqEeNZel1%P6m^;ppDw+ZpO>c#xKqxuQk}xe`
zPHCPt>l)?Bb2lRbYayWD?y|UxgX3@%Lv!}TRePNc{d^onA@Ix$PeE!<$-<qhj)G$W
z>e+c_d^AOt4gwbq>mKxQUx#ht#A>4`LIDo0MjO9o_`b7{%F5Yt3C<%8*D^g0=~iRH
zo8GY_pcg^lfG*H}<L{D>arxKCS^EP}Q2@@s=#+r4PgO#!-4$BRag0;faeHC4Hubb=
zOLWCU$Kody03?78+tn7L4IHi^FIf;i!`2~II0j`nQ^VVzE|%WdxZm%VK?+2BEZ`=t
zMpdB}8;b*@H2fqm3#0CsGJu~J*HRZt)4c*hYuxo(22H!TCEx)Cpdonc?8st46yOe4
zedYtORCj`js@!$440eFnvz-JBLgD+a!)OPVO3#qBRfZIxmnIq{2{5oSHZjkbp{=<8
z!nB6SCK;^(!`mKNw5t-?TlkZ6ZA|3mL$zo7BuxttF(t+ekBCQX!iC!ymYLxz%n6o5
zwO3Qg^-f~*8yKD^)XlDV4Bz)ul6-AMzOAe|%gKtPB{!#Ph$DeoWw%|*Y1i33aG-7j
z|NX|Qi9V0kWi=rXW*`Q<e_4s${3;6i#KI7Q-r+DJyidmaqDe7+)N?r;%`6c8-m2x<
z4eufMi;v#eH|z&sH{WW>(D8NaaN>U4B6(VH%saeVx6?z$722_Ge8l{)5fVGJY5R4F
zDNHxq5UFl;gXzSeD$WV&Zb&}l4s~?p$oEgpCzDi$|FW=}dq&8zr{2vZf5%KNy;N$m
zvcQuClXt9FO2<pwy}(EgHqDAUv;6{-2G}E5zevB3#gK!|TOs-P$fYW3b8w8h{>lBG
z;KOl|-P3opxE&Y(zJW8>)9#sm4|KlQIWi)YrMY}nh4-yp<F^3VfvzepbEWDiMzIwJ
zb7Pe^uK+bTIjbM!!u}U+9HYrT=JhIbC9chaP?c{odo30(qqa9~PT<o~Kb-|_cKehV
zQ#3Srp1KUYSp~691|%GSL_Na02%Py>opoM~|7xNjlH|2$ZcBHL2ix`v-4LBEW(uvh
zw-3)1@6DXVekr?Y!dxz#8>QJwBQgTL;G0PDv}9Y#jD<wZZPgix-;@vnCEsH%-AxEU
zKxDX>X4R><+~arbUCsg=2tqio^-(`^R2&FB4eAD77!fp#K06o@%I#mVUL{C|0t;q<
zbH%o291b{%KK$87o`BPtafvkQ&Xn;pQ;Tnoo6>FHvH0MUpK`1@=1x?7wf3_+`z~<7
zp75gyqCOBq!wO)`Ce_FRazEcg>SKl&T-k>4wfZ)Cg%_Z#NfyF3|L3k00XuIUyzBX!
zzs!43%yAwGpuN#hW)r)yv{2^6!(MExAbKsK;xHJEH%7zEh2osE1n+D@E<E0neZil<
z9a8H^AN4k_GAT7mJ~XDD!V$^r%$>0DDJiTQpE(}mBF*f&T%=Y%cfH|;!R!l3@{p9b
zq10#q+7NekeO4{q;qxU`d;i%_smf@6$M0h@I0&hqDx&8K|M4SZ!gX@3i2hf3pTE0a
z(1_tQul#f=KQ^e{h=4vu%k0L0t$_2NVeErp6)Z0+2YnN-xgr(N*lJI13wI6%_@V1p
zBUUNztltoT+<SwJp2Ho4yBF2jg|w3d?$zPv5u6IZGSCQtD9S1nR=m07?<ewAgq0h3
z6eVK$#B1x2e=JM-`c%ypJ&f{>V#wj{))zryp?W;MxaU#Di+~sTR$K9b8+pb`VI7C@
z#tX`fJ6=VFs~5J7A};-oyjgP5gfGuI=mFEuT2{&?<FI^&0B@g3&FnW@86z&&OHrY4
zhOZlEH<G%7>yHer9|ur&3B(GT)p>oFzII2!`{t+J?-$*PonV<w)CwA;&YVco;OE&*
z`pwJC0r(a6pmiW*nzLv`|1P=F1SYrG)D{P0*F>=bmtT5Oo(p-jV_w)DH%m70`#Eh-
z6qq`O%nC|+W>?^8$k6G4ZuS5iHfGDJ00N*0xM_YhP}l>lp@t@b&X9p0AUp<39QtU$
zk%Uh<KIs9H+|5B`A79fid#`g6sW?6c;Xq(I>LWPN5#*Of4>3T2$zZ6ZsZc6%83dwX
zFMS#GMwy7FkPjtcy)4!jQ>8Zo&0)SgUXJLy&>+*v)FSIJ{s-0rF=p4UhM#?3yAUgR
zk<LD(85`{~zuyg^%|2NrqttSherai1Df>py{(A;FrR-4?v$g#(UL6s+scUsL#4S#b
z#z%pFoKso%EC00*t%b2Jk?uuiO0Fkn(6XW=MUl#!qC)<v%Bml87a80&^C{o7>QDph
zkLUsNJQUXCZ%M1|N+5vYVJsw&izk}(RKsh?IX%e%41#04M-jn6=^luq+;H^6ff$t~
z(cv4)SY))5c{946irRcM{9}+bvE`hTdO8$ljv-!T`Xgx}$y@J5BlKo5z~jIbB0z~C
zNm_MW4J1h`v$VgO9O2Is25+s_ft-;ftv-px>piL4v}ftX;PlX2Xh7Jga4f33N*>_e
z_!JDBgT5|C0~EE2GLu@>{ce@IqMc?cx{M-eZeLEO667qd#?iewO((o@O*H+H%Kk&A
zEzm9H%Hk`Q(^5mZci!#ZRg?asc~x>x8%*8w=NA^)WDFaQQY9YGQgb3-)$kdK^H-MY
zi(mO#tY9#W>!)AM7w$_MfAm`V`72$n!6Zp3l|ItI=3|~*un4ZyP%!Bc4=twO(eyG>
z%1}dbcflK*>l^U%wEeoy3zZJHU8@6Ko-4L-bPm~-m$c}0m&~%?+LIk<A%0}Z>eB?%
z`)0D|y5o&`_W7Prh<vDi(dCv4I#d01z%XMdDvddlfAs5nU;Wr8VCggcZv_bG&_MqV
zSxmwH?Bnj@7<Hy+h4V(GNDA|24Z(Rd7wlytwS%TJ!^(c_g=>Taw<8zNdQ^s!x`KLM
z1SC2QGa|o)&)$yIJ#T00X!7WZAje@tyr%yLP_$4#(VdjnQ}jVkCHwhlz0V==y2wk>
z6j%}yV_|Rw9C?z7GPvO3oHYo!zd<FhSxlFkZgUPwNKn=3W3eIja(-G$)?_TA3)zg8
zYn~*>JW5Rq?q8K&AjWGhEVK2O6frYY4rx81NwAFI<4bgTq+@D&=Vc|Iz{UeDZOWH4
z5`NK#+AmYoPk2+VXR8aWw5Dj1J97qP#)+Q|?I-!3sIy1<LBuWHlRthhIo~qoCiSMG
zhly)SViC<Pct38;Rl3PLZH!N*M0ni8v?=HFJJ*Z1q^X`~deV&v@k0;%;nJiOwq7WX
zeQJYB?$e>ykIiWF(#GD(JevH|^bOGk)P3h8C${ZseQuv+e*c)8_|m0yY^Y<hm$bQu
z8M;TTM%bkI*t?jS#!%}*l}XkZ7#8TcY5XZ&^-hG#g`%8z)<9>yJDQ~aa8gFt?;mgA
z-bZ6*HJ}&C_9{#r`}mtdzanoDjpBlN<XfSBhObLyI^<F2yNGvYBhHy_QO#BM#Slul
z#>v_!0i50MZT$|)H}zmJ%;$-S@jcX8Y8B?1se`GOkhx+kPoetxl}!zXa#VtEVKIfF
zUo?A!6IIc6|Kr1>4W}f><d9E+Y)$U!^g~NzcWxV>??YFqBs@t`a_2^#&T2{p@}xBv
zMp3(F#j4Hwj|O$@v-u!msDC<A$(yfIUEoMk{ZXWmzsXD6GP{R8%!W42?o&}64=U12
z#VReWviry6*vMhX6wOzox=wm&CabO%2R2i?{Pr;@CVzjB6w-0d8?4z<%^(luX2|<t
zUeS-B%iDC}+Szngan=)PPb%R$CdR9_RXo`GJuH0eZU5#p=581%<0{?MkY!|bTxbKB
zrqFw0&@cD3mHS|$R@&~14dudTL|t}?EG<61Xs~!nXsP=1SSIIRF>KRW0}gyis3=^L
zQdTTADRxKvqPXlm20nibNW1+cyuB*3%+%$FL0-c{MygsyREPB}#;e_;>~4-a?mc-}
zJ7>a(4Qh8cV=v1pGJi78OYf@F$GAOjz-7?GVrE@KwZxrP7jv&tNjD}<4G)fV*P<#N
z>bHhR(@DjscVoDlWrpbG82P|VX8Sb>Yc&}H*k`N~eo11HCJ^aJ&{GRlS!2Z!h<nWQ
z*LAmLYodpukBY;MH%l_J<}K*Fbu>7zZUU;(J<&V~G)$P2n8)e2;*GaUQ<NHoMT%4J
zGFKR~=jzDVPb|9^DMz2piv?*YVfPc=<KLXG*HNd*9Q4Rb@SQd~tq{8*?pt$+u5Ntq
zsr^}eGGa&Rp3ABG6?}Du^sQkoi}a9+H~!Dg#XLK&fX1u6lv44go<CnPn>lMwP`Tq?
za(?DC>S?12i^qaos}PaQZcLr28ZAC`y182}yhFvc#7i#}+G4blx^MOhQY|C|L0to-
z7BO^gYX7BS9hF_|+%meOI8!2VTuJA`VD>`sO;g=*Z2*aF`>Z(IC-Jq>H<H1vo1z;N
z&RQT8XkMGJGtn+{*LWXA9{65YK;~Cc+n4SpQmDS@hU!zA0pNz+@l;iviH3~YrC_)o
z?+{uDlci<ob#_mWe%l_pDYtCesri|uTr&CTjqw@(mcuOn;{OjC7Q>5^fybR&)q3Ii
zhz|WjmEYJOjkF#*5UwAspSw4>BezGf?Dt83%s(!Gn%nW0zlPO)4FNlj8Jtm-ZpN#2
znb0t<M8CZ<9WVEQAe(3K;@k(v_sTU_z6>K&k05kdwxeN^fYtk`CJ~~Ff@&8+jZiQP
zN7x&{Xb1<hM;Xm@lify<#}$&B7E+}YQsgf|tMcK+g%D>HWivoEP)Kd#NHI}J<5NgE
zQApLhMDx`VHiaJ&Ckmc`+1w#)vvbO>XT5=o1vj71IN4d+D7@uFKMZnWIa@T1K@P~)
zScAbY<z>J&C%uZ)%O8rO#3P(oCl*;2dc-ty<e(TDM$j?EJ$62Io=m%nF(hYXlxhOP
zCShD))=5C8An^Gkr`ctsp2m5}`|L~0MulLy2oRm79*e~aPbwQKkSx3i$8E!NaKu45
z!|whoSMWAZ=UndfbZ6o4VMe00T{>QsvFEPv12xi;At6}ieHmJ8w2XZOShmq_ai(~*
z>QSC}Yj^#)7Wc1Sk;52qnI1vqzR1X4&au90Dt#BVR~4Hz_zXa7u2C1pG<an&A{0^L
zj37=K5Ze*vdE$t&42ExpSvcWL1Hsq(-XmI-QBO)U=c+6|?>DFN$g0FXT1~dc|F@=^
zd*3rzUJd%YGD|TZX8Hw!SAuIb<~@)?hiHM|I1!7FT0gMbK77{$T{Ud9AL&}ky5q%X
zx?N^_^MB`55OOMObDdIh=2N&R)4_btN~9%91wA!5BGq5(Xebt`pI>soT8z7A+ZYl+
zBD2e498TvuzzX-0E--?!OEbi0Y(3_zd1jWKw_=!otzNmtFS4snZ;n+|vDbZ823Fyt
z)GReH;H%n#7>k$+EXC+d^$U;{U72%}UgM|ST{Ac;v$Y>!w93T>Kd=*Ge%Zs<aV1ub
z$hS2-^<Ilz1kGZ<i&4ltE4_N3IpB4lfJ_gk*v$2Npn%#wXd{Ai0hDl+m2)WLf>*Cv
z(ukM=<~D{my|b6>`@AyL3?cN&YP;WieO++3m&M@jDyKkz1W|d+hN0n{0g=CIS;JeJ
z-fm>gZUw64`7lV@ELe{(MDDs9-@1TUxws#)pzr}TU(~GCb=LtqN$qt-QcpsS#uuq{
zv=razC2Kw+o?2XkzO+aANDvO%T)4k3-3<{T;>A<)#rp-YlLD0q5E<~i;8>shr(QAP
zILFHSRs!no)<TE--3WmV%R;d2JyNUuTutq~e&Jijz{lZF`{wyFWI8GWjW$B_bN&Z;
zcNJAfw)P93g}b}11xavs*C4?IK>`F1t|18|IKf>51ef40K?4hScXxN!th18tbocJ=
z-Fv^^_l|Kc&Q;yiP1UHHv+9}8{Qp9E)WZB$!aB^utLY5QAz%dNM<V#*x;0*()^gFh
znzz8S3h!Q+W)NnMC4(>!IaMSiFIpM$hD9-B)jjDM0kKNzt)%161g%>r9(Xe^t!NC5
z@WwpRPRbFL^8uod$g@AAGJ#ch^Ckf=KH|&U(u+`QXo(}G&n)j362cEDhL_{n84)t0
zla7(UBMW`HBiBgxx%$Ir$DMKAX_Ko5Pt#&_cCba5B!O{rs}EO$7!)~1h?KVoRm|a#
zr(5t%(sM8JIg&G;C@|z}Kaeziz<|g&10pYb8C~XWS$@M{XY-LDeup7Ql12&^mO4qO
z$f8i9;ER!T1?Gp+iFLh4YO+suDtgEa2pJo3HuysrU7kZWUq{8rr9T6yz`dH#{F0G)
z?pDwg_N1a^H_we$7G>i_O0sr41(+uWObFj{^DuZo@6CNO>zL1*DsP6nf(~1zY}AcM
z?pY1@=FdX4rJimM1Tx7+?uo@0(yr*Ux8*Ub_iLnivnqrep)Vt#v~Z-side$+<Hqv|
zwGJ?Z^EI@vtmVK`5OlIIk8<P~I2w&ID83mW9h2VARj`SSGZN(TCXA0GQ&FVK9j4$S
zW=x2Ne<)6s#VpP(LB)qC;_6M9WkXfz!|VlGrN<Q^PZ~d9UX;+6dAPXET<}agU&dyq
z)SIc|>3#^$n!wysYFF_`u7L7o1`458CeJycDNWuLNDP^*k4PWkSmm^0e;li8i*J+{
z&B@T|IrDCH@orpCUB<J)`^Q8b2TLP>eGc0PTP8GD5_oC8qBR=qz)zSD)6J%zX34=(
ze6W2)Zbua`BxftJvx5B)y><5mRKv2%8?br?vMFLN+^bs`Flk}zgSGi~K*8|QnAz6S
zP2xH5P?-5}v6i*7dxF-JTwJ@5dLDMpq6G4d73LDY2a(Mboel85`znsrre{PyQk>+f
zMX$*45&Ge6`LM7!fZ_wq{mcl5IvmB27s;~->SRfB@=}ykHq@L_)aW3+DoH_u_B#}f
z*OA>CM~{RG;l{=m&$<fuWc4u_AAFnkW>#-4yn#e46tm&dvS*_f;}Rj@@j8rlfceGP
z2{hR~;tB{ZKkUCO>+oxFkHR1lrxNl+CHhzv>0LtNk8t_9tOV2NV^k=u*V8$$B;JwO
zR4F^<$1Fg_G36$EPKV@^$bO!OKnmH<R8$<)wB^){{gqLnvJR-QmXgUD+Sq*3g03x(
z#A10&yn~s`X*I|3DjeuMI9v$5Gw4E}uj5c$B^wfJ#^R95F}FV5X)|*5dKtyRLOV)W
zam=!LVwf+%*zEA$ft*oiPTZCV>w$Qy1%LzG`uU23ixro&;+RY3mE2P}`r6RT;}0Y~
zpUBQipGSCIKIi0bQl$EH%zrubl|!GOaR#RXG7X&)n66uRo%YY3kJIW7(oVGyU&k(2
zbBZBVJ`9pPz<lh7a;7#nbz}`&l|l-gN%Fy|bLT@hpvRA+`|0$hZ52ECI9XOsu*In!
z%Scu#skHD$ay`*U#2RZ3)#wn{?_gK<ORV&~ypvM+@^bd9+_VOO={#%DP^lyY$I-n!
zg3OJzeFkfz!MFp@AX_}OCHctQi~P&j{7&1;age-=K90nh(2*U4B~(hs3CC{oaSj*f
zw1m87hb$QaD%Y8==VO&hZo5$KJoQu4J|AVQ4vz6@CG0B6qT|b{D%il8gKxfN;vji$
zaqc~d-s~wQY##c%$2gU=FT~GS1HgE$kaHE{D$_!z=a+4YYSgk6G0J^Til4Y?(z$sB
zU$dP|-A1*rq`lOjZP8HUHZZR`S&JqkKFQoq;4xTa!uPp~fK`K=Fj52=C@MQLYZ8H9
zJJf@Xt}ooqCCSI31G^WYtgi_03mKCMH`5r2+of5*4-b>NUmUM?#1|L&Rx={M%WN=3
z0LF{c4}3#BuOfZb>usn!6&+`IAmXb6T`D+zsyJckFV@sl#j4aHZ>W|iM5L?8OW-_v
zBii|^yrNkpNPM0Bd7TU1zRSFHDS7*z6`TJ?QkE7>M4WBX;Eg8bjeIM~Uh^!_-wCI|
zP8`XJP6#YVgrMJg7O?w4w}49TEhJD!*-zbf%p$XzI*&&U31HMDfx(nwKu*K;gvV6g
z559KXq$JX0Z7R(4N|~uua-G0(-V1#wU35r11|>=h9zd@kPScPiPmrL*_a)IzO*FK2
zi=<;>Pb%Fyo4NA(Q>Tma619AlPkOy`2F<%?bnh~ooJ|8HG0wbLyUtyq`#-xP(X4$X
z&b<swe8bY^;tJaFYs9d(#&dLCxZ8YXj+>d`9tSb=jKKpe!9HkXNk*JJA~834yyJ$(
zlliT3j9&#*nd-_!Z_21{sFRbRUZ1{#QKj4lhbsUzL_OpXzC!ReM{0(5&ROhGJQ8wA
z3(waHuC^xgvl_h6V5}kk2ze@>>FqE(-mUod^<mp<voE67U-%westLUi-2-q^w)Y~&
zy#Nxuc^__%qxqo5F`2eD$_gj?7A~luMzrQySdqWKaX)9OMoG6`X^gM)7$!@OR0oaN
zEOKl(17^%bf-1mQRCV>!k>}^}?&iD((NduZLDD0~B=pk9juPbB0X$ge;^o?P%8VbC
zx|#)KZAY5$$J|@aobQas9(5JSao_p&SOH295rXTTqbt<2obH1!Yua-7Ug$Nx4DgxY
zHNy?LO>79%evl<<vTXjQL8t0opg~ymt>6<Z7v;UWyi9@E(d634*N>1p;xykBa#lZ?
z-%3V{itk)c!CS_-ua!W72qe)Ug!F5L1bPv-c@YSC;gdan(Go~jnzhav^YJu(;*OYY
z<gPX6B2+?<fyuA`uqEcp*}`b?*x^?mXPpP0{3`JLd#!x(H<B~3J&~z8b=<C<R30-M
zLdttW5qau3bWKMU%6M7fS_*^NP2{WFl4ymJxa1$BJ(}iE;inJXpWML77dO6Cy_G%o
zj8QzP)Vv*2_LUuXziom{z<m()f<qzXa>h24@I@oxQQ+(K4N(xfTefP+^ds|dbB13w
zls90<=T5oyp`*cVryjWr%-q6$sgS^FF;VG)M>|0O6>(<83u}?qLtOScny^hjQtCcm
z)pecvX?==5{D34#38J4R0;{@26HgZ<X2SvRe&dbR&f$@IFg50H_o9K%As*bfCQXLv
z!Q2sdpMizYt85EHE5ZFRvRP2#70;VHVn>tiXnLB;$IsHpLhmav+#VJqw)eto-rQc4
zYejoyD`(z6dYY-)f$X4Ouw{2FR`9(->r-7Q9rvyBK}WyyTRQ<*XkIRohJh&2%uQrB
zysOP#5C7p^iZ^UZlM6HABWj;Rw4m1sUG{H=?OefQ@be~h{fRQ%%-<}rzhJQ9mSC3m
zrz)!Jp!vd~aItaTHjMO94V<kGHtjPts8IR9k1?me=8#%%Mte*i*@jCp@-pSan?y@s
zbK9{QQC3iV1`34Z#q&qP>hR^+f%w7OtkDl<PI3xLT24BNvhK>Vk@paLx07s5dQ9+a
zaxFpK6v0D?(1=}!ObUDvafDbS{7?ODT;saYirnuD4C8`Wdb+68rQad=K4izs<@zW=
znwKR)zXRtBywSq^Qh?hdg-BlAV*}(>p`(tbPts)x3=49``9f$3MY`nZlO=%C6a;jU
zkvHN)zSJAFmHmGCU~vUXt@3=oY9&b!F40m#4l+?2{vg6N41qZbi8CEFeVlG$sVK9+
zu41PT-wARSvR>E4OnAhzIPG9IN4V!J0>K1&J<jGvsN@5RL<`RAjXty=cIs^^y}YlO
zDzmKlLoy%;SZ9Gb^RmaG{Il>Mlyr6qUp=kI&8u`wDEM5!5^aYXt4>4tA}>HqcAX+&
zEoyy!sJ6rNBq)UDHWJkS;VkeP7=yLbx#8`Y!VkJqc$u4ujsyFQ%0WfznNXG?D%K<B
z^2Y%$AH=Se0zV`4TyGYdKKEBEYWzk@>-_o3BpJWG%#@_`M!Un8)bh$Cj#(5(icC=N
zO6gOqYl4vqrE|n`u=3e8JOU9<LQZJp9PqrhC1)!q^-x#VgtA4)jeD>Po7-W9)wQ<A
zQS(0CI7^Ugq{EJ!xV}|Q1?*07F*PaW7W5zrdnlB~bWsn)>wT5sXUQsM+T`at+@i4%
ztDkZW*&rF&40}BqkVT~*H3V%zRokV(m2Z-jh!E)_zC+V_$v^q=7~v#4P`1vW_U6&&
z$<5fgNEV+kg|t$HRN&{XHMCEjx?@Za!i-E-^i$(ygr_pZyr4R!iE||L!4WFJlp0r+
zChe4ON*s%HjZ7nW2<fAL_*)w!izmSmLzqv)@uIN(*kjTYH_{Qxv+3k|&1D{(9V7Gz
zXQEuiw@}O+hs^eSBSl^zj*QT9Q4PQa*q0ej-$lks7g|z?H}~i*;WWIn&cI?K#|f`g
z`EdA*2FI4Im-fgZLHZ1gu_ES6I%)u}GO_n_8C!*_H8P?k@HFptR)HwmvWXGP7GL?~
zA&+msa8+5-0YDs?=rcn!UVM;}>{ERxU?k-Mi~=6$jB_MbX3<w>BGOB=Q?$`h%YQYZ
zeeUc_=qlbMXx=JtRQi~zP|6Q{CeD!BoCyllRxqZlkn-S?{TeZ?V776L3EQWFhZOZe
zv(Ok-96KZ7Q6QE>^Fv&Z;jE#;Kt-Ds=|or@)5qSxQ1>%0NA9B@1|1iWj!6b_L*)RG
zRyjIHpAqWI#CD1}_BLf#Z;!WgOPnM#D*glZ6sfXOk9IWMrGV1ry)|%)@ZLeqD4_{h
z1lzJr8^I*^zKNzN61dc$LC<PvbN!73o=6#kej(a}R4ohnMxzn>08Ts+a|z))NMz$9
zE^)G}h#b)u;3s(VoT-aIA8J*vaD^co)RLhN{7N7u?}H3$Emb<X?&lg6?}|w2BJda6
z%7z=O+KIRW;OXhSgMf4=vLNBz7uQcR+zTa1rGgVhDvuRa`X$Yuf;$B&%P;}k#uQ;i
zMutRW6wP(EW$^?u1_<8MzR$Y|KWX^^vu;APxeT-GhdLiY<9@l?a6ZbkuhIso!0YFh
zmeh{#+ft0;QwK_-jpT}(RSu^<n(9=RyMkr7VPg|NA*>sYWf4D1$4a`+q>Qlg=b0(X
z&!~c<dxqn0Qox7RrUccn6zys&fl>I{2+Yaah>xA^kvQBGly`p9us)XT6?NeAr~;op
z^s;tG8-F>FtqJo}!%E`5u#~Lf$OXtNap3TWTFKCKoB00Jus(MiaA*DRYFM19B>ff|
zr-{>ZFL|3t1{~r}leTru1Q(&D?upZs>p3$~2+5Ea;aM7rp1C9y>2RRNSq90xxr`|3
zNMzhu7QLQ@ygun@!o=BU{&@>!57M!8!t-1?JxjGz((ycv^L*`jOU)+IiL$u!LJK`B
zoka-gWbMRxvCF)bK7@1%On6ZmsAp|VMK;~7aZ#QyZ*3+@HZvS|QJJS_W2H|vJ3Vnx
zT{~}M=Rr2NOn6z-t!Mixm27@n<Famg-u7)1*}`$$Wy7|f-TOtd#p{X7uh;W--$QZ%
zL|4ryFYJA&$d>_^esp|ZXx0zNSL!|^2_v?ku*m{ei91^v5IK$mJQ~J3p_}n*N>QyF
z#8EYyB_C?2qVOBcVSmeoC(80fdhSWS`Psd*J^KjJI%E#3;mBWz@&L;?Z4P^QiJv$q
z<yDTyI~)>y1j?)>B(JMw)Tc15G=5=@er8E{%0%yTGFcF~rCRqEj*!MVSrAmO;K(4l
zY(Bis1LtLn6r+{Re6*CyZ#>c(_g@mpF1oNIhcxMdmSAK=kTaY+IN>Rlru@a$974?J
zB#-$({ww^4&YjjNRI}haK~!&-foS6sK9WXJ>eL&b%CEpkO(FiZvgE$o)eGmQdZ8Ce
z!MwU)Vh${!j&XN%dZre<mpL^OEMd+QcugSp2#F)GI6}xN>}pLc$}Ak!T}N8Ob~O9f
zaTM?S>Q~@f9<VRI5zGA<S=&8Ar2Fi#XIS?c-0EeG%*E^Qw=Tr6WX)n2@YKY9;b?RN
zWcgu)MqwZ+anwEopvE$QLIVG8Y5D8`BW#)S&H&rqh=6h#ryLVYOlAM8GAg7+nWLiw
zSbB&`3C1>8LZvKuG*NQ@nH97W4$M-<q%_1X97LC3<v3DCJpfVhl|qgVC^Wnd7CcwB
zyf!()?wXfT5dmZhVW2L+YO^>{C2aK$M9gPMP&q_(;6)g+3|-<S3-Kac0FXIF5MFr^
z+J?b^RnWVK(1#<)%|WEtu<IXe(R+{3slw3ty$BBsfrw?;Sg`9M075<xF(Nfp7#NS#
z78q5ED`bd;w1U=JdWVd2+hqqVRmOy0p)6#*qISS_@WKb+VB9ZL*n8ngrEi%JQQ6xs
z3xV$K?Z02bB4~FF8wW!bcm*J|@FK@_zzcT(mWty`0mx6VFd=rfRM6Pls0cicVX7@d
z0={M9QZR8i_L2f%Jqt*>;EC22alnCzB|At}YKJ{hvLR#$Y8W734?9Co-~WI~F=I<G
z7mhb$3&}EgcErAV7D<Ix3P+%ddS_3SZM(^Vi7tBxVrQYoFe2wH#)bF3&GOtm0PS)p
z5!`zLOO%1qxT|8SK&eQ4MTh;Fuw7EzRgGneLe|xb2*TCDI|C^5#fFqEhUpu=`{?Pe
zEGv~X%W4>yAk`j(Vt;kUdb<T!6&XR?1|Xv0lHV4Q&lbaGLl-GmD9qDwTcCF>{BR44
z3<H+1a)4?C7wcQtS}EYR#*>QF5ocoPejyz<42v8BTTV3;hPD*7wt>64b3)OOj_Y0y
zyioyeIbz(}Vt1t<a*VKp)KED%*xwJ3ohhO6U}4>fQI=vsX^+FBCCUsi7BmhL!ohM4
z0ubSn^`-4-u&tv5u*}0y*8t=Kr<~(a>`hNGG{h-04)$#wZ!SQ)1^{w{S6HtdXg!|7
z&N_0?j8c)SU^F<u=3!!GEK}KyQkfs%ba?@jp90gLqVg?MWU<mfR52O=l=nvr=QcD}
z#W2Q7l=jOwcQ9Cp>A2qEl<tRXuqDhm5|ja0>*|pLtJteu=^$VBZwg+Foou(5>YM~z
z5K;;DR6Aq@Se{)DRwR2#@Y5p=aZKqkGKh*2rUlE@g*a~KFmtvi>YXRyBV`FZr~3sl
zU=-HFS@xr582Wqh$HHEZi7IjTM+NV__(GRSvJD8#m)H5i_^pO%X-YTlmL&!8pVUXt
zRj2^XS%|wvzdctIy7dyG4<pPgMl&20Uc_4r;aDw(AuFw5m>ocWF@PP#dW6UZ%C-H5
zeoR$`iT-VjjMS0HW=MQJlJ)jX8SqSn*@>Rr30NM6iu)P{^z5lG)@u0)&V4!-RTLV!
zGAg_`p@G`!9Y7Utoa{lw-5HBa*&uqC7kL~jz1)BrMJ)aMgY}vN*)lI`yz~8(7$PJI
z0s3=gq*5^yBQZ{OwQLxo1?Z@Is0C?_5t78ZH458VJ6a!6SKJR(<UC+sb-KC;BRcYY
z#Ez+qLrse}ay5gCnJLazVxZzvq5@I}j*e4JROulZQLTv+GncDg4nrZ~9osN+d+~kP
z2`WU5{VotG;RU5iF%5e$sxcm#C^u*3GUI;ai~Vt8*|1}DyJy)3_-L@tun1RE4)yO1
z*U)2VLSydJ#)z-LH<pLQ-su;v+)tJ<S0hFYa3-iS!bF}OP?{?dB%H%vgUnt#Azw!c
zsg;{jjA30F8kKSDY}@EqaS%6*!w><8G{hNt&w;Q}w5Q7tvJWwC!1{~hR4cKp?bSP7
z6V_@<c-cVEbu4H(j=m%f7h-_NjfQP^9;g5QV5KjOYUL?@h$9th1e#R(A^b<1`(~R{
zuZ<c5a#0?W-taY4qScFKYlN1gqh`EvmW?p=2UKjV*<xrm7pTokG~MBLry8g#ct>L}
zJe(r{D<ya&<y8*M=kgjd#>L#(Pc3sa7NiUbf+n5$y)L>yBHRPSDJuBpU}t7d5Hzev
z_mEpT>WpX7^j;hmBNkHpWv6`7wo%0vXJwt^+51tR-5RlXiiU34AAu?duc(fQuffo<
z89OHWz03hBVLCi`5^IW`qGX9mlt&Du#r;^5ziN`~1*YBdn|ngT_q-9hoZ~MuPcWp!
z5$8XyWf2igT;hCiAb>dA;(R!!6sp2yVNrmKvLIn2?kmI1Vpa2<T<kNzHU|(10Yov<
zaWeqq8URYYv1{uUO5N~)P%RFFSYQkvDBhVWA|AhqFerieQA#}MA{KN72)6MKsyGI2
ziQfikJ#t=V`*H+tF}3LQnnxHwnD!A*WdJKfoS`HQO^{h`d}*ad3~^X%aqLPbTM54-
zHcS+Q=tv9(L!9K=dGYQlT#kj<l4upE5=omdxG?6xN)k=+mLi99H8(Aoo+JiA5x;!k
zKw>%uZJz@7Iz}@gR%bd^pCry$JFX(0%JYcbnjd6OqCd_4(QNvoVV^nYz$Pi&{yTh7
zn+B8Iuo@VK9fD#6@gqJ^IsKTU-4b$vVJ?nevxI7iMH{3Iibw#CMBzCvW8@kH%MBkQ
zd!rIZB+gzpg~S1P<5punq8^EngoCkamT-u%C`y$uIL;Lpfvk}y#C=Ps=wR%{Wt`?_
zK(q_<JWH&LIOWAMFU0oXA{=g9%=DOtv=3%C%qwMI8(7ZoFh8AjiJC%hXNuvK&~E^P
zG=}w{6!!vvj!U#YhKb$>RL@=_z7bzH_d<OTje1iiluUxSD7MvH3sYtY+0wch0_=}1
z5r<%*Gb}@%zk^9V#`)&pr#w?Y#gM)0kow+sCu_;53Y+3eT$7&#@E8QJQ#xb{zn3OP
zcddhiqz<RwgQ)Dm*yRVrF*op+gKx882=5G&@4;8<s@98Xg^TIw4@+a3o|mW67lvZ-
zy)PztEKd1AWxv4-1BL9ehZFFOy%>k1;(9qvZX#We<!opGui523{^m-ez7%Wr>cU=(
zvxa0H#LAdX;`6rLXEq|_g16!tl}_o6q8jFfm-b>L&FL~~9}H2J9agPari>EYy2dt#
zBTlgaAXor@J&rK<0H<VW?}buzBN<irF{<l9H3D_*y+LiLGQP7Hnx{_9>8EgS{`I4@
zE!ZPKV>qEFCg55V^Rbex%X6-Z1B|_J@~pul@<b{j01t{5@PR!lT>VaQ+8Rvt#sb*^
z1eW*eD*bRx<KsD5d*pUfq;t6cFz|UpyL<^yX|5d$2UJ}{WiHhIHmURdT&D+lmyd3j
ze^OWQTvs@GH*`Pr$E5C0bKR-rJy0boC#k1kuBU{&w?en~OHyzBTyGP3U#o5(G~%Im
zu5XaMe^j@BGO2%du78nyU{!ZuGihLVZs3r7@Kks3GHLL3ZV*B~1gAHIlstqsKZHdw
zjHfqDlsrr}KTJh2LZdfAo18cg9zkds;hd-9xF6w79u?Lb6~7<hpQm6G9+T4>lNTPp
zPbWzfA6KOq*A$*GydQl$KgR7gA=)^ue?R()V$v#kLRoLh!)=PyZPLzd%&Tz{5}Q0F
zm^>ZbI3<5S<(3T9#%9vzr$07MMK+Gjr;mT~n$^^sNNt==6`sq}o6*yo>vo&35}qxh
zm>v`!qrYdDXkH)zQ<*m}NO~gPdEs0L!#@R6!K9$vEu+JHB^d!M4K`E7!z_)02w*4|
z&*v9z?-wuimQdW64uuyl=T`tCtCx*SSni8>?#pD~mTBA<X%|-SDb{!w7SP<+1;4K7
zQLY+_z)Mpu6SyyuEG%DAtUOHFxSrqG7hW@_+|d5I!Md>J@B-QbzPUfYsrF)vK4mLG
zWGUHwm1JQ@vYAT#>o(xqYWj;+xrK$%bP}a+oBQ{>zAyHIUu>6rTkmz>gp8-`m@Vvd
zitIgh-}PVE1&i!1Qtm3I9QKRA4=o&AHtw6fI3h@0*cFC<>4`N4Mt<3R5-LW)1wLWc
z#~U*|HETv2^THC*CrnyCrCmf5StQ}|IHhemVHG_UZ93&$MBWgia0DWSG~<i`&_bFo
z%fu+8!Iy3x_;emuHj6lZi^z^(k{FN6O|k1_@hg9i%lD8=AN}iK{c9Vl%h#!w{!~{v
zsaK(kmy!C{35(a`fE$1Po6*IaP~crf>YWwj;#JcPnCjMF|2ABoBFf_mK>d-E20oPU
zDQ`|1j#(x?W!qEi;5t79nLIT<8ND!aECMBUbJcXIAb12L^-bAyNQEvY&btQ|M@DUd
zWX2K?_;9lnyh+puxwMZATD;M97Pz7+R+MN+c;7HxIryn7?qogT&QOXTCn-;|InM|i
z)G#ZrK2hB?wbH0~R%A3zO8uefyN1;m%v-Y1=z4o|kH%NJ1pa_VCKAF|w$dI#Cg_gN
z&#_dq!=Upuguh~=KS}WYH*|r@t>G;BPa>fLRXgK_I`!@tf;`(bQC72GLj}Ja%s0Hh
z{f2S(hEuydm`pTGsP<&N?~|YhrXI!q(pZ5`Q<!l5#r~WFRyd|e!&Rw+WFen%ab+Y4
zvLs)xH4D5}uWL_9e6;)PaB`yQa0r%x=V!%9JugJc00VDS7D!i`XbcLn;fMV3w}@22
zAH)bOBuaVx-ye0q)%GW##%Uob-1i>=;TCsMd%h?fHVEMukTnkF>A5lp7C3O$cB{>$
zkq;E3E^9$o*Y0XVAK;^ILluU}9Prz3q@6%_jmKMbjeU)r&Cj0{@gi0;A5MXYl?{+B
z;J<d{O*Ea`8meX1*PKcupPK+j#kwY@o5acFg@7l7`6SnZmomsa16oq0Gvp^kweURe
z2m51#$W7p7p60!hMwW11?nBighs}tg5P(xa)^f_1iv#&Zd?o@th~CL3wlrBs<&R&L
zMV58KX-RH;2V(U2eDfqft(B0>qGI6rOL)9cC3%~wi5HOi`OHDvSzR}WqNT_0=FC^x
zQEBZ_txUVgTc9y^j$1GMV|q68p+U`$7}-uHHXr9RJUac1V~{UN%`0E%xsKA&g0_w(
zky`;Dzp>S0(=LP?VADZr*XPjbS(KjLPEDqn%5<G)jEQln9mK+G!r<D4`j&Dxr0_+O
zgCET~G|EwcDAAa6APhc_nyop0)a2d%OUVa4_@jlxt+2*&$6Xp|0cD-f?fPF&V${LC
znKIH><gpfcv7vx$K7j4bpIj&O1lhGMl%PNH1Dn4_k+->Bplju);dvJ_i-DBHH8vl9
zYD&kJ*2aPQqZrlbO$0*Fk>;C?VblHBn<*Zc?`-<nAQF-;pHstPH}XGe=qJV{JG7uk
zH{bB|#2o}4y;Dmxb}60Pn|q<lnzYPu=)es4lFeV^T~0*noERc7t))ckQI{&f&#RDB
z+J-J%i22nq$zRF+dLz|?h$hFs^x5r<9~Q*C=~Y~R_oswaM~f@txF*wE{Rz=Q@)k7M
zNbNgJWHPfgfE&7X8eIKE$Vnd%tBlwm0lF~h(17Jd9-_~ZLgbC7mF4q5NHHSrvKc?$
z-Z#in6WLD%jNUWkO~#at(Hn=MS+k<Zy9Y8?K%yZ;bqJ7Ria=v#Z+&3N1}{d6A6Fh3
zVq#zsq+XaoP!iD2Wa$vR;hBM7i`>B$<PiLV9Fj>gNY}xU;Sg$FX@ozE+|k<{8D!bE
z5|p&eEZ^pfazK|s1wodbue3sBSI<EAXTubJ=f%hTZg6kxv#fM^SLFMUtS~whxog>z
zFd}+o0WQN2ijIzN7-1%;S*N>eTsdL{TOLqHf_W?u9OEhrvki64yL5NhS)`*PG+wG;
znpgu!0%HvPfM>l1m=*C2LZ3aO=oO3(qTB}1vAI6-hk=ebOa^0uI3n5mUr28yw)JiB
zXi5#BL3jC!S7r+?q72qbvBCTHnc{-;`c1|ZVwP&jSa<m`T?Z^vVNPgoVHi~0Qcgq>
zADSTIJyG#{f}I{W^!a_4QGcKjb_N=SvLuAwQq|0$GL1CWkZENk#5vz7+k=S$ci%$U
zL>*g;b8G9B2@Z=e=5jV?%r>97rP}7w7`ecD9=aQ<x;uwi?&D|FPp65-HrUR6rDM|{
zo*a#0LrWEWiZW{N1=MmGUh}KX=YdKR$BU$M3iK5-C@q>tYI@GSiVdg~4lTt^w7B4n
zg)w!v0z(`-oJ!od2lS0`rs{X9gnXF?4DrxL+dHz$%3TT#_7jj$zIO7*g)$kYj!xIV
zjQjY>M#&tbR!h3?byXpP-Zo6or0z-uxe<WCaba~3r9&f`AlpV!UWa_{1h=3b!`#ja
zO?Mjkqg&hjzIEjL*+TR$H60W!=prPL@hK+FF9X5{cA1}MH#!JYCm#}-YF6kS&zu$&
z*_6B&+z6{tdHY3Y>ZPNO&nR|{M9H&cJGb<A`V(t!n_ecfB0_HGr_ke@5JgJeOe>(d
zr}6RDqdP8&c+1}iiNMv*N(+$-4L8FwTP%GQ{epwhW4^v^XG)2?8Jjhb>}bi@h-mi}
zSBpFOFxAW%CLd~dmq6ZW+IhO~Fl)U>3i9{t8sk0*kJep&*m;$kX-Xa8LvH%$aH3nb
z!!9o8Zis;wr$@lHlxKE&g{#0t+A4x0o<_cJdfZ83M^;+5`e-AigCyUn`W5m~(x(4`
z%RnA~a4LYp{559cr)>7KWV}XIc?i%!c$xr%a<@-ccJuYHn|tNwP{HlQ7bKh?t2y72
z70PgxxQrL_sBE*`S`<82m&*nl>()hdX_=K~WEE9?u`gQZJxz22T!a)!!dUAW+fP+K
z>Mx5f+Cw|wex22QnA!=@QRJ+jN_KfuoM{8LFxJwT9N>AahCZoL@P2;Ug}cT~YnVAJ
z6D@W?Az}r#^)2gr<de^rzK8b`uXY6%PK$Y8!lc-_=|n7j!^CJoptLeEsYcsgg3IJL
zR<Yjsw2au)*GiBw8K`-;@~NAz&^W~QO@ZrrQzUDb86CJHCW)~>-m6339UO0*w80~K
z-TPYPmG;=(2A@9ltw}LS5ppAB^YP*t?&C%h9X#R=(anb=oSA3ox4Mgg^BY>(#hUp(
zF0M?h_0wdlC!aTCCj)mKO&iW7s;FZ3l|L)HVAEg9T2<_S`XIP)`t_o5@_zp<l$>?R
z!(5su6f)|p6}w)@Y$0=Bu22%1>7wxNXiC^KgKAhv(NNf{!u#nlER|Hyp+S@D8BOu_
z_NerDw@l($v5ecEY15mTPYV~g9gS_ws$nCi;)MPSbu-$mt_x5(%LV4^QJ{y}>Sn@e
zYRT90Q`~p0Xca;=13qU}5Pg&I*4vsxi>rEwTeBTxVpX~6<}zq=o!9Mth1TOb92H{c
z^XX>t5OQ82>T>nKV@DIB3P<-2!Pz6%*ApdIieOy@o$qZUlGp8p=S_#lH-E2WBu~69
zFN&@28WxDo+t101#N3<lix*9<H)EGK^OiTOtlmRsZ_X)8dSoBo03Uv+hK20RA?qU=
z|B~m2hV|I|gN(Vd2=WK{trrpjAC!@ORq1@Gb3Z7U`@UNLpqA^a)8(s|YyZsI*D&{~
z_Li@yxu02p-&+Jfqb|Q{DL)Hje+N2$of<zIbAQh>zgM~b@4Ni@wEW*92S~>FyU7Ol
zng`%r`FrIC&~pX&Zv})S2R{1}5PhW-N*wqxATWXNjiY#AGM{{0ZeTiHP-eVT;8tMH
z7Jr&-P(fEvyg4K&7dcobGpI;5xN6G3ggCgihP}c(xN$4kEFid!E@Yx5xXC=Elh_x`
z7t-5B*B%fuh#V@I8`38m>c0{)9PjfE2*7PdlygFvjYr`80KioN%tnY40Rcpwq0L=^
z<6B|6uR?c`eY9bq(FpKzZQp?}Ha5xcz*ia)u@lNSKA00NztO8Oly2a$c?7d;_(eeY
zx2|xGwQ!iUFd{D4bFB!BZeQfQ2r3sKdUqtlRm3Hqq%|<|J~y)8Kzvpul8iq}Z7UKe
z7d?#&%U<jIkR<XpHwrQpx{8g=8W_zn9mZ`D6HFZ?dF>_O5=Ac;2|<RzH4rCK35Vpy
zbZbFkWb$Hpqhd6>y%gvr>AItp^CFvv&<QMJUj%;Otc|tlCezD{Lr0Dyc@T$}AWo1M
zF5?*mpBCxh^1*sL&dY_&e*5D(??+<wj|?t=Z#6KuFfb_1Fc#YJlF0Gi76}pJ@zMM)
z{x0Hy*D+Ko0LWIjD0Tu{UV?yD!pFSC;K+oWgtti+;wdg4VU7Urj-tv{5{v0WwQCa_
z11XB~J}Dx7S_OV0UJIvMiaNi7S&jGv-u7?U{xnQN-n^Z}%A3^gBHqc5NyP@umI&+D
zPG*fy9Fa?L7f)W!v%}H`ur;UbT}K<y1NOI5R@0Ja4N?i=Q?|OjSG7~_1KoJ@QdzDb
z5zn+^iRk0tpNBuqOD2g)1qgWGZKvWqA==zdtCJ3g^GqjUfI(zPBne6<V8cX$fuR9P
zVtJ+$)Olkwq~knEr`yT+nw!BmlgfOP!95ei&XBn#m&wzUnGul5Pns+^lPUQwP!u(*
zkv>Z*Kg-`dOC~>2t}aWp#~=DD5r>lfG$`9aHv1WAyk=syzNMc|Pqxi=wt?kmC*)+~
z{LikcpUrkYtI&P6vW&60`TY9%2M2~6F1egHJvq4v-!-gPWjSt7a#yZ%yb^PKp63SV
zdpif^9_HqTFyv8f<%T~GjTFdBK=q2X%<ButOGM4D>C8(O2uUT)&q;in`6R#29Fm{A
zlh2ovUqBjMbdz6oV+*CQa%BsudkV_@3Tk%(>t_mDNzI#33uEXC+wu$9Ulw-O1wh02
zhM(&~Su8K)qLH8?w#P-|@B9zqiWc*|={t*bXIQY2iZ|bR&_0x3-O1X|aM?mFiT<da
z-(IZrTr+^M<odb$%o^(XPS!Cu+zmr%#=G2aGpYODC2$3$e9+TgmNJrxb1u1~$(IFw
zHo|(JWfNCQ&|8-J<|XlMiNkR*g?#yGmAo5#xeRF;qE<Pxpd>8;EPZUbQocySW;w6C
zUgmfSr%pEaCwo4$N+nZOD2Vk;K$*v^SX{pRjJD!&Z}x#o#a;zM95&iBD@c`QaFupJ
zl}>M!-fopXTD2i#wXuA)sa3UEaJ5B2wN-Dm&2F_F+82lV>Zmv*)s0dmo$P~BM3zbs
zx7{xuXf<ApH9qn+zE(B<!8L&eHNm|#p}RHVXtj}ywbAmmv4S;RrHFLFUp%3@SLqi8
zn7VYvx=i`HY_d9sbnLu>x`KL{&%1RcX!Y5_bp`VEd9!t8!S%I_bx;w#@qK+AT0?Pf
zeWT8I7rhg$u2sIFuz;s)w;|(JD72y>|2=5qxM6^-QG%^8Pp6R)yTPgyF=VLnll<4W
zI7D+BB$qtN3QnZz&m~3GOCyiJ9^J-KdK)U{e`(_(y{s;-i)`xOfY`rR{|eVfoDJ8U
z0dCq2COzo=3WwViZ_$*U{<Yq)d8?iT<&F$u1&;FqH>QIDg*@;~ErG{iWTxib_pdXK
zWt-WXQVg>Qn837qO*U_u#UHhjD72EzfxoJ@B$u_)ptt!9w{E|0ZDLoZzat6f`g$JR
zmR8n6nbdl#(^kvgCL+`>MBbis48^XRp1Zb-qj$KgwkMXgOOq2RHjq3aCznwmwd`x>
z-fIViwCY*6J6cm1>ynt>b+mu(G~DZa@6}0u*Zz`;SIM=^%C!UffA!wF^^H)c{hou*
zUDxG!XNaqP)LmzSE0LFO_lJ;<q4KT(-7Y!uo;X)<yh6LSHN-C0x<{;~r-8jKxv;xJ
zfykJtH>Hon)|J9~j-*b3BI&ND#;_NR-md4`8|T_rDb!o0(ANm=jbHAqPwKMJ?E$m*
zg}HX-@AXVIP>?3|y}#@4DeQhoKJfLpFBYeN%3&alykfqvf1RmM8-1`{m-2p=;#y~L
zrEt(~xxXKsd@yNXx@-WD+~2V`$f;m`+SfkkI%v}|bc;S*wKs%xKNzSm1S{O1SJ^f*
zJct!aaiuWaoc?9|GmwU2m^PW{%6brmLwUVycpltAbU%!@KRlg2!jVyn7Bx!OKl;jW
zgkuB>!~>c2`sW-*A2uRBm>-oF))brv;yf5b#2rIFfs6|Dk7@2#s!-4<g^ug(kLzPh
z7&1>7D^8f&OqhjESQJfI^-tLBPuO8hIxtVZQk;BkGx;`j(xqtfegCA}{-g)Slo#`q
zkK&ZC&6I!WRAA9maQ{^3{!}=|bR_e1wBmHE&Gg66>4c)`PyN%$`_riyGwIATnTj*n
zHZwV)GkHZb1^qKc`!gjNvt`UsMRm5yX7)?yY;DnOegACZ{%jM*9GH2oRdKG}X09`I
zuDfWiw|}mGe{K+CewcZFRB?XXW_~hs9-1~f+dn_QKfj2vu*|%$s<^Ojv#=SuuwAsU
z+rO~Czi^1Lc+9+bs<?P=vv?W0cwMx3+Yi;SApcKlSS&l4N;}!MJ2_$CoxI|mf`Of)
zgPju0-7=Ql3Z>mD+ubi=yS2r;^#i+&2fIy}dtjEmR;9gm+r7@Pz3$?@-hsXTgS|n_
z{b82<QKkKH+x^L~{psTU*@6A}gZ)L!gJqV3Ri%S<+k?%pgYDvj-GPJsgM&lN!(*1i
zQ>DXm+r!JS!|US1+kwOTgF^`B5rFjwPWcGI?g%OT2&Lo*ZSV-=@CXa*7>D&3Px+X@
z?wBb2n55*GZ19-k@R$ng1jKqmqkQtv?&O*h8wPX@j{*+^fnkDvV!<H555f9FkH|<!
zNXW?OXlR&N*f?02xY$?(c(^2l1Vlt6WW+?2WTgKqq}OkrSK;#qe<Z#B8_x@hc_~^Y
z|KfS|{lvVWl2^YY=eQH+f8}|(|E=dG{M=8--ml2ZFMRATp4Uv!Gs9r1gkbN(V3~jL
zy#7a+*Si#>qLk>llvjHxR!ga`64DA5(%!hIo0X-<on+ent>?9v<M}7j>onh`yC80=
zAT+$_U1CxH=c3xL#ThHbL764(+a>;MWubB9-aF+XZ5283m454$(dU%`|4#KfuaC}Z
zh#qV#`>A?m<Tk~ZG|kk3hjzf(1uaQqEmi-ZdO=CAlisplRIjW4(toRZjnw?2dhP#5
z)oZr*|Bvc*w>|$0?6tnPe6_c>eYk#oxOIQDxp%yMbFzPQc5ruba(a1kaeaPweF1?$
zzCZjBn0pkcppypnLB?ay?J7-g^~a`pk|bM}(H>09X*t(bmf0B&lnf%5E6?hVrc=w;
z?Jm#m{m5qAlO$L1x&IU2tDU*-ik!hzF&|WlCzZLwnX=IgdOekSqd6*>Pm-Th<&PI=
zRanmVR258?7_<ga$X6FmSD26H>-AO_&3>_8?MasZQaoSpe7ZB=`=w;D$rBEZQlX}F
zxitWf@kL)v*=lD5jeLqiZTWg{Jg3z{Uv0(aV47qwrD9#>_GqqJ!HfR7s@=&_<K7g-
z`s)9E)hizl<`>nA_*d1->W`|I%D<>ye62W8)r*?&5v5@(j=*13uT?Cl>a~ia^}FhY
z301u$@0PMK1^Rwdy`-1da7Ft{*Kzfn$~v(Bta=4PRWGJrRj+<*m5Xj@Q`mRai!G@c
zs(Ow5N7YN_ZYfyII0+l7dTrVNi|Qqs^j-BzD*YhtgzOAey}TSHpsJT75*<|a+Q5OT
zUSXI#H|0N6FJ=7SRWG9<&^p$iR4>}^s+SY_57n#XyXxg5#~wlsRlVZd;84G-URb}V
zUJ*l3)$3Rts(Qu$LG?oGfvR3`-K4I+s9p+4-&L<6(DKb{FS@{z4;EDQdWHN))yv>F
z)r<4H>LvYM^)mROdig+Auc6;nFL=~nRj<e2RWAxq8u2%=@2Z!4QmKTe)|J{W%6%K$
zQYuUsd3X#ghmJ}yZ1LZyUMWYdpkGxl_n)elf#dJ0*An^_%x|g}<?pJOyEkV1Z>ksD
zmRdiKeBtRLx*J>o3RLy_*7}R;MLYCE^(ug>UMYW3y^Nr$7v*16uP(%2RWFKPRWB!~
z>NWkF>c#X^^^*Br^?D1-Zt$z>RSE>s{*CGd{<o^vF81H4UN}Eguj}us7aVqs;4i9I
z$}g%H@pskh0R4}um*AgOFXHd2S0dn#s+SU*&+`GO>Q(xy>U9YJo9eX!|5No!`M0W9
z@IR?u(ooe)=vURN-N!!z-P~ntP22<i1imuZ$MfYMRWB^*B&g~o^k>!U;eS-Uz`v+o
z?tf6df__oGw7@t&Rj)k>=~dMZvl~gJan7s{)}2t*%kHP@Mf_9sdiz85V*7*YCHP;e
zUdPas`=6>8>R(i^8y~3ZrSZG!#qvY-aw>(YUY37Uz2XgiQ@xyiSH0was9r62e^tHQ
zo4vVzs9pqAh&jKhUYbL{sb1QDt9pqY(-H>!s(SgM&~N{$dUgM%dcoizP@o&4IQ*`9
zS^Yuv()u5&UU*Q|iw>%KHA~^Q{i1rw|5f#REbfv<3`f{z4^_Qreo?((gJ_P>|3&rM
zkr14Ks$R^0QoSNDzN=nk&A+Q&rszCS)$1)(^*a7n)obPdyXsZ<tLi07{vT8?X1d>0
zuP&5dRWGgYs#n}Us$Q$#RWCGw!rxUd^50djp`WT(1zvzLhSe{sm*jWVOUn!MPpX&a
z%4Y$X_HOi*2SHO5hwn6N29cCwa&*=RIDe{M=up)QNRhD=Oh*@l$@X3K0{u|ERH3Su
z$M34w>z}IEIqtxlUsNwXIJ68EE+%q1N&%?qwd#dHSol}f>)pSoURz?nsa|w_P}OVb
zFRE8CRQ1yGA^xd)efgn!vHeiJB!8%0uYXm&XrZcC#qX+@9#r)*hVwW08`aCd`B&9T
z^rz|-|C{Rd7Iy0tPT()9mrN<*eKV}gpHwfr|EzkY{Xz9|{b$w7;iu|l^dD6(Z-fY_
z>V@<d)$8*Q)$17USJmq+d>T~sBL0KwW$>@67uz3HuTCUa7}P=F2VFHTS0jxu<hPDS
zPPBhgy*j_EUbH_{ue3j^Uib)GT}ZrVaKEWuMt`SzF~Pt^KvgfcpQ;xp9Gwpen*p5b
zchw8;r|M+@$7cVl>Lm&T_o@vkiw&;N=$}-tw4bUM?GM$9iR~|{m)Q^1s}x@Hr|PA(
z^h5P3|0mT;;D_p^`X5y<9IO#FUBvac>c3UJjQ&RT5-5dNHTb`%dU5<zz23pP{~Ogy
z;Gb2mBg|LVB&3}lxW{n+q<X#mRrPW${jPe&0}&nA7(;+uT2R#s2KDREzf-;ZQMCS|
zdPNNVS@m-NP4&u#zUOF626mD|2w&O0t6mX*P`yN<s+Yh|)vNSZ)hnX(hw60#SBZzk
z^i%axEq!A22h}Scs(QhopP~NOs@D)gf9<cT7n41s(VtW=q<>Jos=ljU#y?cAG=pp>
z&k8oE>a~OP?^G}U|5Ej`_<Plh_BYjQ2Og?=9b*4M_4@p~>c#ZGqI%gQHZLI<!-!eI
zpzDeKP`zMK=V8zX;eV)JY=}x?|DbxE!u^Zt)%#ubGWsu6ue85Yy_}je1e(9AUTjAt
zR#4UJExbz&Y{dVf>eY;F{9mYEj6YN_fuE|EUfQ2jFaGbUmufSt=Rc@keLq#NJ*3}M
zufyL|uU=%cUsNx26mZ{PR4-^C`u|k*g85zb;{2(4vHeB$ivM@27wS*d>oua)QI=<f
z<{;Wbo>KT%=-Js7y>Gp+3Lsn9(KpycHbh*CIJ}|5=CC#4)EL(JEtTZi63p52_G6oA
z7?1A<M@pfO>!{l>CY2ef`u?cJde->T10{|zMui&so^g0L%xRiYEw_n290Zo4k|!7w
zY;Ny8*hSSr8JK15?4ZeK!zoUo6U`tY00$ZqgTP)|1}!j?xd)T92a_Ka_^BBaHUn;N
zX;LZ!*Za$)3}~3bD+>?wh72dmYAc>VPg*(=FTNi)kpdT93%jTsHoASXVObD{BVCv@
z9jC<%rksIP;3KSrV7Q_fg(bEr4X%J3He4sZ;5?400M6nRPKFhBZ&AC1!yHrOT<*Lh
z0#0;sGH`dOpx0nh3gT)HZ#XUOFix(TCwYl|&W0vhiixs`<@FBPrzgifsKhTQS1r?%
zjkeB#XK}l60VOBb$so8Lh-g&G7;3r5DZapHxPWK)_T?pN+^Unx+eL0feLedKSg-l%
zc`DZjh^_|xDC}=cJEcd-O$aGXT+d${n!VQgq6WZxV<4IT`G#PU0VfSQa1tSmJ}i9R
z8vhlwu>Yn|(-(DQsIz)!waF5VH)VA(qOg|%`?MMMohGe#n7Fa(Dh{Xx<Eilqn@emC
zT{w|Tn=u1&@iN(0s<o`vy~KA8ONC6MyuCBAnVRo<T3x~|1+qJ3xAO}XL-3sYap2@}
z2AQ!%hf2*0N~<BIoVe6wreozFl$feLx5CHc$=e;$N?C}Cw{XygS&ugvm&-1QOw;TU
zwVJmTR>fcN<|1}+uhDpZ6Z4cALa;XDeCfV%1VCl}=y98a9S^LS(_#$uMj7FOD{0fj
zkALxs?lE4Mpc6KuKTL&)>I`XQ<;(U;cmV3v`dmzL6-QuIpi<q_N*|BwEm(&t*vKlM
zZ&m9lFPvbIzxCEJgZAkisx1VuBhs+;ov_DM_||+7>K}rtS~M%l(KY3ep4D?hEAR&(
z#IFzhOq{Wa8(`a)inpeu?{cEwY8|{y33U$M$63Q0DZ(ixs|}FEwi-g%RK(tefg|tU
z$3Cw`K0i2x4AI|<?X6*UU%}MTx1I=QAB2x{meF7wir|4#af^FdORWxr`?&5FB*vFQ
zgx>&rx<V-7-+c4zCs~+5U8Ix;BJQRM0qH}KagM7vd>p3{w1A+gF2S1UJz_h4fuVYl
z^d&OYW}7Vgw1^Y<VFU@1!V8I}FPSFa1ko0c9v~~~Z^2$&Fk-u6!AVrZ-!Woil*2}F
zU7@@fr&n#JAepK5MA)xAM3|C@T8ZL>p{GNE6Qq00#0ys=iNt8{u2Vwg9-Rb45km0-
zn~nn|fo6dOe9$-+VmmEP`sZ(I7znK4o_i2nUbMnRUZOdegk9eyHq;{k?vV`dEyUyf
z0^?&K_z3r65m@36JrhRD1}V=z$A{44@c3hm4q`9N<ECKZdbpmGuiUxfK$zLPW62+?
zKK(WTi#^gdG`&9fuc{Z%n5OkgyU*@QlGdpr8KFn6``y%s;WfD!`e!VKH6srtEu3CJ
zRj<(v#U%dM2W$VLdWBrM0@}IIwnvknq%*Yfj_*7x)ULAqsd{l(Pa>F)ms#|FHl3Z=
z*QxnC)k{>5$n<ET#h-xn<=hX|i~e~G`WI8vz69<cs+U4uD%g)uZ{`fDdTpi*En|(K
zOwqpV4~Dq4uqDr&W{t;@WLGz7({2^-GYC0b%YJiev%MF%*qizC>d;U4BcJAKRWz&r
zd;`zf)QItJSkcU#%h`5oi^yiq#Ut~ok4a=|WHSy^#skcGZpC%)0u5%fcti)5!>TS8
zf?1)0SMdJV6POROVz3w{Ea0i7=x~wSqv#_^Y)SmcM;8O^$5QxeP}K_`63tk)qGaG8
zO{(dH!$MpZT_#Ow(cmBj^ug!o!hO$G{&;z#PN9?LlhCoum$<onS=!JKj<QS@V<TJ?
zPPr#tjI-1>JrqrQ?0uCTV?j?i-4q<<`EoLh^Z0h9^7|=2vh@j6)CC!d2w9CqE0=sj
zS0921@2jiRsVi-*#6G6EM~Q~TN@iD*xB9@TM*8r)GROJ(t&@7v)LP6}zO5dI0=_dr
z?soR4ZtSWWdT!@!T5{vDk8~#3a)}kT&Nj&uCZ^A)0u<Kq`zy0_EBbWq-;Z+i#D`2s
zy^I{MPL~WCN5Wsn41!I4Sk27~GUe>oVB)TLqB(D|Xh~G?mRav|?v-kSVW|6EV0YS^
zwj(oS*W)7Iq4(grus*A@(8(g-R2!`sZ$|g6Puyqhxl|Q5mBiE9PZCVybcp7ngv~R!
z`Q>AtDP0-ccx<g8xw#6P;Heudys2e>TJ3~RaTX~}`pjb7lF;I8IDJzg9q`;d!|WW@
z0+O9jJ+__ZKjC8a;Y=>f%4QRsRsUp`9J|_O589l%6DKkzT)F#Pr=Z%#2JZlG1o6Gy
zS3oo(-l8R*>#wR8(&XSK!=TdLZ>pD2b$OH1o#Vg{)r*l!&}js35){UlaiC)x`fTL=
z>-r8Bw>NFq6*FDzPf(KHEWE#TJ9)^a?Y%~0MgkWNa@TZs*)T+Nzj_oZ^VMbMbu;`$
zt%|l1S*%m(I?y$Lef8a5Yt$oq(STGa5c|5zwW9){=iz>{+ZoGUZ{eiketUbFI(k!6
zBy)SKKgt8(rD!O2wY>&hKFtub!0rRC>HxJ|;TmBbQAzJ2Lm_ENoi*sic0QmsJT7cx
z39@zn52s|ys7)p<2Wcvg%eqt1^t-53pB*t8;Xy;Qro@hHGW^GnWZ2t)h&^l)Wd6<G
zTwleJ1Oi%t=ke`W6J=rUM*!Tkt(MEHp#n=Mu$F)nbiLn1Ql8?7+_PprkVl+~A{Q%k
zct@HM+BS%>V}|F*HOz#{<@d1bC@d}?+QSsn`D#z~v3r&>5X0g#MvAAa33-nobw)VI
z2}~q;l_CnAq};bGh~%Byg|wi$OexSt)D!R^<0$Ce)e2HC8#0|=vp1d8GMTG^7cpse
zIG#beylNN8!(fR|m?GthXpX65+He@+44f)6biQ2SkV;?y|9--R5CM1XG>!F*!Y6@%
z4PFa;a*Eu6coBXi0&1gR65<D_$#*8~T0^Yt4c@_s+psn6_QLvn_9&HHvhY|f{=!8-
zN?I)>LRqgsxnfQ_<M*lj;BN4;VPz7bun9h&0F8O&AXZqxmP|4{MtGw7W6(n~xo1Iw
za!<x+57Q*@1^|(gSC$56PD_u(R<NE@N<8|O1_u<{ZuUVx10p5^uMLL62(B{GW~QX1
zOn0I~8;-MuXQarH@H>nA&edm<+C8smH7X^_MNEak+M|gXfbN}q{$UxqIWb>Du{J`{
z=1!1_afI@X1k#mrKVufVmTT5&E{bZt_yoWQ;=b+U{mt1@J?Hs&EvzX&nPS0U<;{d-
z-Lt~BRVH(_F^Qq5iAts*WlYZCXtpGp5-hOH$wVpQ$-O6nD9l5TI&6fT!ew|yJ~)F&
z%ZP`iOF2)g0O-~L<p0CnoyJ4?hX2FAX0eQA%$UJg$Joif@5UP0BUEUJkZg&_Hj6#`
z7KMnUvX)9^89QYeCHpd#N>tWFk-zWne*OOU)BExL@Or(jr`LI%=W!h8=l!Uc!f^KC
zRSWl-TuQCeTQixJ@YeSgKVzL+&~JZQ&m$9WmwDs1HknSMZXx6)<5te>pve0<b6a12
z3(SuN#U0FC`q4Jn#`)S*>dJ#w`Bg$SB%C!CbU1opw~R;E=y3`)c+sJ_numvxqGt0M
zCKmmTlV`r`j*Y$NhW-+g)=ZKVYPkSX!QhTod5kuL({D@J;r`HiqrHo{nc55Qy{iTQ
zA;m>ex8pJ}2+^6MYY&0}W!zV;LQ?JXD1dLp8KY_{SY-2|5MKC#UZHa4lV~~ic)EZV
zKm}8USDJeF`;uJ1K^zY_ZrXSW!3LAj?9Y0zUE=-0v6Y%qbb#j)+7#}qoN9Bj&OMAY
z{pjleZ*zU9xNzcZH7KWx3D&9xZSr1=g_d{8`0y?p^V{n&t1yzXm&r^1{|c{_%_#di
zENn4A2nngWAVx#s0|8O)ctP9lRkYrlLCITY`7de~)tg9MONyh9tSi$jT}4K}uJ*hf
zAqAjPmXQQnPrky@4@<kh({~8=RsN%iKKC#4MFGb3ww0_ZgND3PMo`RjmIo@}&BtSv
zXM0-lpv}+*&(23uzs0BV--0vW&SuPaL5*m092orM>n~DIE}eo~ZIX~jcbT5De@IeG
zZjq@^?!rwka@40RBSP$0MByP>k((au&XsCncF3fM_)Z=ojZtvY-`_u^xZ>UwqtvEy
z5MWLRfc-?xvSA`Xp!4<x?xy6WKhSEL>KD@QLjhDG6HvxZW(I+|5oE+JUEm6y3ZR2U
zOaQ_RwwkJy+(-lo3j+_;vme?zvH~qrCb%;ETO93VK$H$RT<HOKmqJk1hT9M+U{MPo
z!Ze9%UspSr06eIfm27(Lrq1l=c?wf;GFU;AiQz0B1h4_%3;&Lz=uAN(wgQBcM=I04
ze>y1M<(ps}=7Zp0ib7|ZjJSchE}?-j;^pPsdVICP7ZAjAtxRyCkbw>UhaxDDJ+AEn
zk-ApKfk|Fux<$_05q}wd+Z_xrYarPfvsR^5bWAjvEc$_I6{J_Fs<{f%4FLEQH3463
zTL5_dSKWIPiVFsq5n!BM%d@v{QIP;#G25NqG#v%_Ba&DOi72HO)B(U)_R`1hZMe=`
zht-6Ylirar7-)`Xv;qZ0B+CC~^i0O1a5{>_76ct1WQ=4R!^5LhCUf<syY$$b@vS-?
zXxEM)V}PCZ%+B(0Xfwc0HMqUq{8~F+KDhoERj8l4L*Wfpz_=u-5#wX2NxTTA=}m_E
z$1Kqixor<9x2l;gTqH-*lDNv!uO@@7h|u+C2DeDuDtQt@j;~PmM6`J}YcLTt3NX^&
zcwMB10uTUCW{r9q8bJcPWRq30C4r7X2od(4WLs<qZ*Caz?+DdNI;}zpC6FNvCuo%}
z(cu|y%}JSpC?ISaCECMwnF#JDrLbzEcD0*BTWuVlql%1BMXji@XMQKdQiG{0lxRQL
z8S2|3gdtiSN~pFxkpk`*+~}eJU<INUw@Z>}Fw5snhBb;71(1j*LiIJJ%oLN~<;eI^
zWzEyN!&fARZfl^*sc59(F^a^9Vg~FSsos~LbL{tXFgJ40O}PAeI82ZM$-Q~e<j_JY
z3owA#PwbrOxp4ysArM(yv#nH+NRt+I&Fohc-LQN3Poj*+5F#Q%on)NNybgM_OC>M&
zh87ZKbn&E6i^9W1G_l7n_dXA?Cn>t}W>aoNR@wbzh&GjJ(X&2omr0lkj;5xE5ulew
z8Nd0zCl+%%Dzc^*)x@{RKE2xiH>bOyrQ-Bu4RjFzGe@#(0;q3{Y{`1i@7kyXZImAb
znAAXffPunZ9@#E*WDj}(1i_O*n~Eotmb43!=Z13S38ht-U1FjuVLk*wGqQABb*sMh
z{>b=z2Y<}BlFb2FqmX0<#q5@+XRgjt#$2t@k)Xb77L{xYEc?Vx$EwD(+z1!&o_|TH
z3!~t^BtKnfS`%zWO_IRC%m}1#S|5%^T2Xu$4^)XtRfX-7q%h=2qI`Uw{MvN<X|z=}
z^~HMAeUK&<g)@b%GhCX5c#9=U`vL_fc)pXu-HIs?0d=E2^RWZ|Be$9x{v)@l|0B0d
z8Z>a40PB&3v)AaPSVzAx4WS9x(h~LXG=X5iZL*maAR_au{}Z>$0LIBTd?gS!MZN#T
zt!lst4`uRgvBZ-TRE$t0qC(nPzVoBpdVNTg{%75!hc%=8L!+S)@yE>9PRK1_`Kd&p
z!w^`l@_SmYX0<_?3sVR!X`(18lA7ePN(o0W1!#iOi<kmjlEz1sHgrsiEywmQIBxhW
z6z<r71P8U$#D*MNhl;fUJK*ZFAs_{y8caqZz*2Nmf9R-#<~e3NU0WitpC7O}mnfz4
z7Nw-)s+T=-uQzC47r+ydlfC`?dZ-Y)?ixdY8DMXC<wMj46an-O^gW~%wiAC*uQkH>
z#9h)IyobD)-eTL7D0PaczS+yta0akzy_Bx&p~n=W*a`wDiee5he1}zQg?0k!lrnR`
zK4b9=G;BM?aFZ;ROu;eJEPt?qhbDemoY;tDR&VNYtxk4OHABjc9QSG$w0&Z_3ev+x
zU9ypJq&OStt1A?ln5LKHBXvGdG!cEk=tMlv^*AA=Bs<GA+Z|!Xhnqs<7)xW~Sx>&d
zut~(UvmCNNXfr`xJ6X*YZ21Ew6TuYX!f5K|LiKg2Xe|gL>H!TJe1^4mo+Mb7fo=?{
zr9p|TzMZvt(_d701U138@d-BDNurxcn!x1!W=37=bQf*<Wh=K6eUcYee}@wcVFq<B
zHwR`>GTB{UG4Q|P;)(0Wlrbk<+??qET>It9j@M>&{<zYHge%i?gQ#F7mn7q4CP!jC
z1)8eZAU4F#HZ17&_p#zkiRkRm99YKf*!1=5Ge-4O58XOf<_?fh#$bT4-vng=VzP6$
zaVw`q&G)J0ARFvCr@Qa94z73u(4!o^EFzdN5EMaX#p`u{Pv9vdvXp^5Cn?g&qoKYO
zX_u+TjsP5SemRVDq2wu;-+gIr;h*0L&IQocO`s<@*JjUcwA`Qn!MV6UBN>uy&?I7{
zIPL`JS}P$#6zQzKxf~ea?WsnoWnD)>d&m_cyURqA4)s5rE9(;4PiG+19u%1K&ze0Z
z`NEx5kJ4r(V0e0IXfZJ|9z-xiE9o(wSVKqm+2yCvh5)NRGWa6_UW#O5UsQ-B5yV?8
zrRW{4@tmxn7hH+Q7FjQwAcpEX0G}B$WR(O~1YW8w@lGv%Jo$gSfP%|mO|vPn{m*fG
zx2FZ?{D>V4!9*S!<Csp9W%C5gArTz`Fl7N>Og+V8I~eqlqjU9W0+E3Ls6ikwUkcI%
zfHi1%(1;8!#45;nxbJ6J^2@X8**t|r<=dWBD*#gj0Lz+mFI#fQe9<fbV1)qD5(Jx6
zm&hV=-UBn)5n0R5bNNAFWj!3e6o&q8Kh4h!bRugB7#0k`N*gY$Dl<_R<-(g_zTV6j
z%_?2ufDV%B$OL^bDnPGq`r97bpsS(()hQO>&}G6g1368Xg*q;el~MFdVZ!4uXa1Gr
zb}28Kobs!`bid89{u7xig4CYd@>tZu$_6Q+pFQ_!1>yoM>Lj6EoCa8(0_+&yKc$0Q
zhTQFlwhS#S#Fn5KBG_Ejjj`=<u8(jDzzHW-)G@H1z%m%>C0+W_15fXW|75OW{ngRp
zPmfOla2uTmR{##m8*sG_ypCb<BETEI7N(w^_ELv>d7jJfo5u^!MGDZs@Sn`Z383#Y
zesEZIg8z@q)g)nqIuB@@t;WaBXnL&bP~xl9m>rvIH%?%#P3aSuOX`i>Z?cH?=(P~~
zHA+OnOs7LyGL%41(Mq}f^^JV$PuKiXi1M%av?^-g5D7#lVrzk8f6W94;+vSnH|r`S
zBL*lyGx7NQu@omV&r^_gGajdiwzAKJKQS26{YtIAhcd7IfD?K48C8I@IG3vs8o&<t
zM5tYTG|m_a$2<N=I6<ziyU(6_-#QZY0YubgqA`XfKNFaQz+%ndy?WE4rg?7b1$kf1
z$1kBty<TcaL(CdF%c8)E0No#8%JP9KUWUQjB1;+n=_Gyq=hV}7xz{QEo;Ivcomq)i
zdA@T7SD26|`egm%YlB13*<><hmqBU&?#Zw#1sadVGicMKbD1eq?^4Vn^ImDzhy(Ml
zZw2&!1}fc&LJf?PVatnu{n@jwx*rChc)y7Y{R~B1JiaL5!B9r3_5UU;_e@&2je}di
zuhMg*`)6nb@B@Bz!3;pbHiRE~o-meG`q>39ZMv^8oMmfy)Ahka)>NTt0z_>!>l$R1
zdgeS&ClnB5gow+!Owb9&xbQ1{kLi8liM>!_8$=)0PXq%LHc20t(>HfSD+J-owP@HS
zzs0K^G6pa%s-<u-RT<+Gq%@(^Sr4*AWwQ1Y-S&+yfD_8Kp;!Zw&m#yygwIa#dYWdE
zBDJxYnd>#eU_##0ZRA{&zRrFu;E4fHf<)Gat0>rI`mh&D`dgpsOEd_=RH)4$oLCV1
znTh#i?bT(E2bc+lGF4YTIGCY4h`RR)$F@v>Qq-D3{ZgR74bD8D7I&-XAN43nfPfjY
z{~ko44a$xoN`(&VF%y}j0=p|i7o&)oOxDojmq<hlsKJKY{u`oCCzA1E03KvB5<D#1
z#(rXQMUdWH{*6|;*ew4WZNJ)Kmmq=gN^{u?*96)9KPFeQ<b_lHTtW3>1L2gcaLRty
zg$tB(e^mk&_5w#z+z;{zhRh$oq((M?;(Fpe`3gL7qS8S#KEZ324Z4cezruokv;L3C
z<<rm-$@5c!+btw3z#Xk8w*R}}Kaz`a)}c+cH8fEp+lSs^wKAA=UlTAGzOXtjeD0gi
zQy0UVS5XI}v;25lDdI6h*`_;TGePn|NcZ6D7f%&9Xf*11!56}HGo=u`74&yJ>|<h=
z0q|EZNdyuTSg{!^1hA_i0~Dc=!@-^iecMTbNuhFxFNC3;4lqYn$8owVuunbt!}s=2
z;yB2>gGtXz>Y^se5yY%rc8Ki0NfxeFgK`+kM9?l7Q5I55?94YsdeiuhN?1b!MEkS&
zIXo^r3M$LEofVt>pXy~5*Y;r5|M!_od125B`bEzFt9q#}r=Y$TC<m<VN{>~aeRQ_=
z>Mxn`8mlM<0u|Ry0+Zpo!s=z6k3oFgfJ-ny1u<G;|HIWFA2|YWidsx^sSW`kZeM27
zF#&%M9Uv)y$yzRc1ZGgJQ40>tTw&ruyCPJHCv)PAx^mu%CxzbA@A!125N|rq!T_OY
zP1+S{27pbh;lkPgF|g{HV0;!4bCm-KbqAU&J%9(jX!+>69^JrINb7X;mtYWy@-PaR
z{2UA)0AM(IG+y}A4miLns(Q%qh^WTIW;V78&^saf))j+VYyyf2Za7~85Nj2AoeJ9a
zQ^O^2U5F@8un>HKOA>^u4GK>TilPNi4VLAqYp)Wz@czY$Pzn2eQJN_u4&7%YIY`S)
zM=bXD!3;J@m+b{(R>}>k2OG=`{+Syynd#%S9vUn(5EE>o35Iq$p8Llt(0q?nEr}vI
z@dVsmzbCK1oEtHxP5MZ?<O(SPzQJbzYy=sIw`D^R)xOdg7C}}CcKFLU6LC00un?it
z)8pg->JT8n{q<~s6m1eDT^!m0Vzi=Dfy$C)Aij?TS_H?+H#o{w#axl8PIv2cgfdul
zjH#giQ@9Yjdyd!NtM#2IToKRkZY<0v3RjR&*@?ondtIoQnHe|l!_<<>3~4`6xSpRK
za3aM&h2u-XnbEiKz=}m#S_r8?ohV#A9!BJ~`VZkUZ_rZgV7OH6Q3N|B%PBM#q3M|}
zxTMl(;Hm1Bm+cw*JW=0Xeimmlz5mgc=U?8T(mUy=#{wUU7~dW$58C=Uu%6;P^U!(-
zZS)-KxUhOXwKWyCHR!N3cD>f&&6sDXg1Lj5wVb`QTe))0q>hK2y~a6K5~)$d>fA`f
zgI|uV4G-}w_WsK-kw?j0Xr(*-N+#z%rXB5h^R*;6561k}Q|vs&s{dKXgYBO~s=Yu6
zRG<Hf)n^X3!?H}H=Yxv0MT6Q#827#a=LqgzS&r7XhoV#43y+_+{W&++<eBdo)2OfW
z!$!J719)cn`A<AYw3*+J4pwaQw;qaWrrgU_6FaFV81eLemN-;qQfAWQk)GbJu}Xs^
z-($UfrE+=QgU`<&TT45Ua2-Nl-Y)!B&0IC&`h#*mUV_bUtRE|HEi(NwUhWiwYs-4v
zfWjc%i4Qo=4tB=LH<m&~r8;0wu0{WSE6jL*`wrXn%^3dg!pzPS1}v#w?6NM#yVda=
z`j{-<2t<-PXEQvYn}*#v@uw<BGh(A5*y;V={w5szT6#^AK}$cIKeN7Qm?%liwGee*
zs)t2JJl?5Ag!_4Qk6d_gyu)C>tgJ{C7axM-F5P&Q?^T*HK!$687{uU>jCM^Gtd(?#
zU=xYMoYukZ`b<>FRDxaoLkH24txGu2Q2Zp-5$$;`1%9~SV<9igB3a15qw?)liQlta
z|D{Sv<COgK#dx#4S#un0J3YrLB~87ulk<3qm@2jJDP*r{qO=ddqH8>u%K!$6?hdf_
zz9)O(YLe;_QOkq#W8uy!7@OK*cI<W;VNHeP3xks58!Im3EtstyM7#^Jk%mi7#!G#C
zEHVH1c}Z<liO%u>+MpOftqk@f%f51ynhzM)Irf~`=rB9<Sw8K;Bz;VyrFKNU;4~r$
zZuJbd@ogFLKCN0`9h8hNf}&>F?(5^npi#|Uyf>)i-|F^k<m3umHG+cSn}qAvcnH3a
z>g59r_4Fq_**~pzZeMti85_(Y`X{(cE_FJ`xn_}>rNf;^>~)5*2?@Tx&nUPmoWU1h
z#1>MWsE%K}E$_8adL;}d-6woJ^1}UL?6sKnv$HG{H{=&{e8l_tVu>m8F^}_QcTZzd
z%OQ@k6_^j3JuBU#38u|C52dwWrgCd8amDc*?<Ya}-MGX|Z96Q8Ek)mj$l|9O%q?4l
z6fNx_d!xs({wIK+S0y|5Aed8M3&c(E@6Vbgv$O?(PrNW!=o=`)0M8(Z7D<#B4(I(x
zH4^e6W!_S~BYfmygbr_vcity67#Ak67e`HO1$qft7=CsA_%@H@iAL%7fFKErNN~vA
zd@l)qalw5WOm{N}+18Mt+P(PRSb)Tl{)@>(nl-h*uH!W<@tRIX1I&!ABkK1UNKS!s
zfYxg)Aen5;@**<Z_*j4kElKNxjguJ85;{vwI!<GZw$9T^@qCEINf=zoa-)@-Yks$n
zv-=_&x2gr(Y)MD*8ybFFnOC%O45Ugw^;z2C^}8=0NpAOM^+v5Nu+_<3Nb~`_uFw*%
z<avnLwZ&!U<cY*+%v9Xzy;RMJAfce2NeY$sveXNH<?U1B;fXXQ$3p<^zTKz28f-+y
zFAYVcgJne0Gr0<_`0oX8*$pdQ&i18z_($yKn+^fnncRB#FQNx|1<@*uiVuZO{j_5C
z^pg8HU963-&;JB_=X&${M9a^zXlpH-hn(?k4$qjl(w<y{*LHCqb5Rt2YH^h8US>S?
zBZ=LHPVe<wKJK=dKHKN6r1c-fmG_hUP{~>%#m)q$9g$$5ye>vA+x@ikD*?V20seXS
z`gl{|w(ejgS!v&co2IGRiK^R7P-$6&$7yzp%5SAOv@CJAYbvUTY^8^`EDIfL_8XLL
zW#zW4NEjUSX(%ODGXKqM95xqwKbC4IW+mVY?UqQ^8wfh2Ghy18C2an(2=32z?rdtY
zRi94cog~2a35E|f8dDNL-<XJY=BZAqS)zy-=8Fv5`DRWN@+KbK3Yp*9{p1!Z8(Mz^
z#_7y1%m04;vGr$o`$@<`-S5_&){WR>9Xdo|zXR2_nP{N9^rOw|dYgb~ui075JgCPy
z7lk!AX53y1sLqZ=pTpkaVX^n%%pBqI+QBR$&8w46`YdHbesM>-SCFDyqiuUH+x32i
z*8iQ`h-Ew}A8bV3&*O!js9py8+hHT*6_xgb*FHL1CALuu_fPb!cKyA`_QUU?2K%%T
z{a>{UM_U{E@U?%XE<I)JzB34vJJ)&Br%%$0(q7<PKFJt%UWg;tP^vyjy;CE6To>%o
z0PJB$R8eU*Y!>)i0JQR(t9=<6euD(Z4*>3To`E}9J9D>B7{;r%)Dmi~n|VV_*|&H)
z^96I*U3#GjDDhl8X0;2UIDy!=N8cc+wiv11n7BEGSF)Snn7wzCG@-mofeVo38jkUh
z&Te5g2&+33TIz0yH@ffFjd+}fm-R3Up3mE*2<hQ4+F7b%3?p8qOw*XiTI2Ux2$n$M
zgc|z!$2f);9tl(rj0mhU?3@~bBsWO4nItD26)Ff94ao979f0CwiWG_gY4ftjupVK%
z`So8EIT{H=?6gRBRwIJNFD&7Gjh$k;oa{XX@SWOO_9`zZorA_k-vNm_h-eK-K^3M7
zkTC)$URW27IBD9j#8+de6o1ZEkSsP|u5@M;Q;O%k(8H@<q_4XK^)NcyT+S=eb1?T&
zML%1$6j1XtWpZCu5;8@*@JabX&YU-455Fh8$KL{)YHeJmnexd*AD7tC4Nro%wAsd0
z2A5=e?%`KNWxk6lAO*Rlplz+4xa1C9SJ-H|TTvF<$uh=G?9`P7VF$_ZWQzXkC*?_S
zrfwH!#7h4SLlc`7`Bf?sao0Ri)bh-zE@6t(g!i24<=jQ%COvy)c~KP!2EL3t)*_<3
zP8Ccqy^_+FCGteEU>a_ci;eEtQsSl~B;r^HVZHWATes9Qo-9&C*BvZVxM8I$022O3
zWsmgkBaHOa*nw)HCbd`@LT6w~it2Zw4Gkns=XV_!wlV2A7477xHsCrgF8#fe1IU*3
z!`VwzZM9S~zw>e&JBQvC%l$Np=5@UMbHy%)$6G|S!0?#&%9$!pZU*jnuCq&B2*-FO
ztrU0zz*gwi&g(f@;s%k1jp{+{6^+GoJ#=fJ*2UdO0=eSH7mi&CF79r=8-|rbWKDp^
zXAZfOKVYdgEPl6OwT#?Phe)$^aLA5al1RarOG<t3yg8hlnNSs(m?`J>#bI(WvX1TY
z8X#d|+CaJzWn}Nu>*F}+6Z10X8<(k4Z?`T6?wo3DAp0o&1ts+m3+GzpFsIxJ8SEbX
z(0!65ulOjm*SpZX3mN~3?ONw`Zi;@5u`WH!=My2<<XoSxR8k;0Lfr<3`x4u`Dl^Sj
zC&v(_UL+8UWEuB$m|czdyo&ze8~dy{txAyV@c2=IMHfO=I@@uqKyx4m4$6+EgbQ`(
z(v1aFD>W5ugt9Mm?soA~@jS_-%qem>oTLzKjP{k}#t-tY;=k^8VUndQxg3@o?9kkg
zOLJ1Prlqpm+|_M31+^10Gn~uTs%yh4?iYM0{V*-8$;Nu2H0<%DHFx*d5S(Ge{G#1_
zn%|mPH$>mn&-{yDMS;xy535>encSll>43``b*_4?LQl`;JXL3?AzzNlk<ofV-igO4
z$dM9SOXXw@dCaAA?#et%9Z(Oa^ZlE-QkoN;kF&0tdw%w8lYCE;Ocf8g${K;pJ(sH#
zi(}+oZIpQW`s{%El`pR!SlM_My{Yr>Y&t$=`%+S$2p09~)-E%$%jVG+<8S$Qiuz1U
z+It=Vf74XDB0VZu%llm#cg^cA!C=si$WX{G=%l6!*O#RzICg0h!Psbug3Ch%G|sTw
z7?gNzK%SzS_w?Aro!TZl*!%srfQ%M{>zQcbA)#vp`sE6BAi=yP?Fh8+CP}m5fqXVO
zbe@y1wo7=6WJ5Q`2!gSSolQMRQGyiAl#F^OI}u(xAv0KW=3=GOlS%zWD-RG>79>XK
zI7R4)Q^Oq9QZ$<!&kU0>H8pa{AjA**xzrBjmQGGt7aqbx$Q*bmMs7)>Zi(CUg?wO=
zYTdHFyx6tQQzjpgR=MhcsLYLH&~JK|1dYV=ffVZfb3Qh3b=(Q$(TSr~pi3zHCi35V
z>%I@m|F~+aLwzWR?^Jf2#En6uObnGKJ2koQwK}D&=FISY57_d|mpiO`cLuVkoz*@r
z|I2CPjdIPeUg!zzWi|Wr)XGogO>eX!8Pi;=Swm7DBCE=7Y+W@*pTr3~tM}kV$+VDP
z*<|w<Lw^5MI3D*I-m5o1Q~+*6_3@dSvR&GPo!Zxo?k3dmJdu})HdfP|(A_87G%QJ=
z7ojs*4C@pHJXm7TX!lR1Qym-NMmVVg0`<WaiE^w#@vQ9)_Nz}UX~9r-<G`vkSUGLI
zr;BqH=<9Dl+?QN|A2%AH8<FdNi`7;b4}w6`WzN%$Xj>(&xRLBCD;dGYb-~eyfUihO
zr$j`qI@O!&j#7sDQ)Ey*?|q--N-O<QM2XwU7|e(B<u3WM#+GtZ);B=wb&Xhu9DpN4
z_&CJ#gx^|iaL>NjAORD+&vnNA;yrg0U0rFM^ESGt0eShE_$x6rwobZlmq>+?Xzm0b
z!q-r0MdFb%1FjMATzP*oxbg8b``xGXK?ul#@;nB@o!rqj&n0C7m(rZ!lkMP?s*%O2
zC`(=;x5oR4@7N(G7O#Qdm*%VL?6m)aq_Olc*QY(|HPNU@;|uM#<Lyyj@X(AKQEoTU
zy0~L%0#<1_R?*E&fe%s#g3VQK_Dk`Yrq%#oh}}|sB!;R%VQdfIB=He@j~=R9MT~~P
zJTH`0-DkV8RhY-h+5N>+#M{HjFqI8!J!e`t#uvdMMtt_CXGa(FbFqp|9nz!0e^tHj
zWQ%5`7uv7=wi{-pVnt(qe`C$^DPqcIKv!VbPSZXSX<}SqW$&LU!9OBw1eUIZmjAdP
zaIQ=KTE6OJfxrmS;ZZk2)qA>kM={<IRoP^TS4|q+vGVUWU{V#=$}v0HV07)G2UN{m
zn=}rLuB*kXvsGd61Ll%qr$3TT$MIR5=5VM5p(zDP_P)!5MoPhOX_sAvX|lfWCk6Fk
z$8*Q$fNxD+^&oGBJ?TATr*muCH612r3%u(=pU+XS0iC)HFAbVss_!FBht*96DFGC+
zYUK-i;x;eMun($cw(5CF11^PL`55~><YzWP)SjNYdS@R@xG8I)_{nmWVpd^y3@TA4
z{5BJv4n<|VIcP|@XxLF-`d4TKe%!mY5FWVk5-La16Q4v1e|2sLv*O7zoF+=UxzVB+
z=k;GhouN{y9XeemXM>pCHk#~z?b_3u?1(6to)@kLqh!eej_(VnZmdc)m~b-6J4d~+
zbqzBJdolJWJ_P3s4m8=9xjZ$*%vJ-kJ}?%DzLUn^&5_l)ukU;#AlzUg0&~7V+~e38
zazO5JjnA4i5?gG}SnxMnp+9;7$y@)OXQ|a<e~`bSk(AuUw%H+~o)LU<T@!&~RlO*-
z1+pxh2q|Gs;W0rsP=f<=QyvAVIhsg&S6W(yo%`Fxp=zhwKoyb$ox2UuZ;33v9C7sN
z_3dT?_N__2!L0)0TY0uLSn{B9r3r)C1s!=~o?;^C*KbqDHwLbM?o3W<uxaY<@L1It
zN96Kfx+v^k!RrADH;a2^;2M!*6)x{|%QsV<vuF?RxOebG-EP&@fZj3QX|nlF#6p;_
z;S$tAi_6>4$k7ez<J_Du5gJp`>HM`hHzK0#)A}7|&A2<w#EQani)QP%af@@u1M-Cv
zPM}AInmmTD#|cM;HeGKG07=7HRWn7Ce;t6)jgA&$=*2h=tiav&q{!ceoNP75JOnsf
zcNP=bXqouORO}amIYO<n8<q^=K3q8a`FAX8`jH_lcKv3r^V-Xgulp!1{ix4KqLF@8
zw*q6fLGq!5Ijr|@*Wg6-V`tct=b^Sd+Qp|k)MGTID!UUc1uX|(+pZo=xM^m+kGPF`
zZ6%;(D0Yy;WRZJp5(K&vlwgQy263qx{_BiaebdjkkDK^wpDO9xqv(v_?0#`shrunP
zYC<73fXie4j}`XU<2!#%ncLtu_$q2O&G+BV{SH;yFF&b_k@Vu@EABo~JJydgZd>{N
zHx1NcRa{WCm;8oe3+kEa#Hw;zmFU+{wUa-OPvqGBH6Gb;c*yrp=nn;(cxV~?<`D`S
zJxv5{w}Hfe&9Bo7R$>QVt;jY=l=aMTC|InZ+y)2QGA6%lv!b16T(p;CEX7{r*bd?&
z-m2>Ay?)eEpwQg5^VUG|pOI^tI<u|`qU9y8u6@L~ZVQFKxr5XWl_<+%2jbhgrV0By
zOiymNp+3Ot>?4@Z<ry=6BPvHAFPo+FYlZLbBfZSCMJ)<cBRRd#<O>Fby>7me-X1%B
zcoZQXn0SJ5DZxGVtsk{}TFU>~WkN5c1ohZ-?@A7Np635_xVYoIb-dJqTEAA3oI565
zUC4IiQ52!}#Hr4m-KO^HCPIvI<l?(7$%vXvJas^>+);a%67la#ZF7V<TbukvrIez9
z2bUJpjFsv-cE_b?S6vQ=q%75h#Gdj${xf5;ONWg;wB>I)<gT&`I0>Qs8O5&=7{hnk
z=SOp(hRoRO6dsLOfygbXHu-JUYP;fgH-kfO_?v4=GL+%lk$ZhfnH{LsqaL-@+kb{}
zw|chqCThj1tfyV;@a-|l>RtbYYyED5(T;Y~i4UrCbPyd-F4wG%x+{ebpNQWm#7Q{X
z6fWkY!mmG;O6-QEKIScbJZxODuer#izf`swzpB{@W#sSdT6=hmN~DUh>^bQgC1DeT
zvopA^xb)puyVgA_jPZ_N?~FZr*&{jfhSz50)oXwqQ)1IyQbxrMO%NydQjrfcHz1al
zFd#25df%Hs^I+yYI>=HVX()Sq>WBJL#c9E7MYj_S+SeWIG#1l>JJr@?Z%fDs#*ASF
z3z9n%&2X*gk5=hXLo#34p1~vqcN>SX<95py*pQcNS54z)`G$0h*4~^_VE=vHQU4G0
z!F&0ZoC{ALn_qg&Vh&N$<DT-$7fjLJcIsrh5Z9e$DS`R2Wq#jZ>$+1#Y;#ZY%r%|V
zYg5^OrqV@49P~OYI;REw8nPP@d7=R$mLspymef{ft{<KA6FlZQ7AzzzHJ$%Dm%*0)
z(IHN@*dqm1ykFjJ7)Jx4;ssqPaHWhikpWECsrmuQiegS@^BdNvJe12msUH;wh)D$8
zpmiixlLem9OJn{;67E%KE+vnSmvOIFT3lF8lD|Sj89HjR4)Dl6bL3mEc`^T{-WdPQ
zxguPf?+33ow0HGFebmRkC&52{?ESC`C>Q-1^q_Dt>!n)iz4f-Ee>0Uqd-<@<_N_+M
z*WoDrR~5Gq3If~x;<hhK)Zp2S9wF{U37Klid5OsPGm$-atjAA~sTg+>EG+IFH|ECs
ziN}Z6>G*O;{^%Ey*L1|6sqQ=fgf7trV$rrPRnDuWtfI%}+jj;2tUkP7`X^6+*4GIB
zbfNU`&vPG`vV<ziE|>TeV8A(2O}wd@)?<&1lQiM4Lkr~1C$7AjVE0@&^6otLh+d~L
zVgcMsky^v6ytm14?nXv^Ot9fdA;VAM4(8}&h*DOwlfku)B=KUyGoH8}-(n{9jS@tH
zv?H#n?p1bT?TPADTsqCRohF5bU|$v{9e%;Vm3%314%gE><FDd1%`4pg>@ab}n4|dk
zpj>H)8SMvD#KjszKKuO(Oex*MjwcscRWvE^?okHqL8III)NW3ENV3`>g~JWMd@9_*
zh<6^D89BJDJ)NBL>A)D9l*Rm}z%YrysFAe{KXJ_ZYtsDmpYJJWzMn>~O0kQ4AY~X=
z4gg`n$^PGha`MGIBiq8WrBc)NRnI443hYhe_Q@PRmI#?uMRbUO2hZu`VcBuv4D93s
zEXuWyL*{y7%huP(Ovf+EMN_Y?s(yyDqLXkjN^Q==0B0o)CKF4)EpK-_dkFnilP4Y~
zeZe%vGCp3lhOyg<(_Y}$B*OaLc(rED^OApxK00QURO1_stks1~qHrACx$|s+{Y<yY
zl47PfbCUTvW7`{eBvZg4AX2?)Dwu0wlNpPy%y^P$b0MC=Z;+5%dcM=U?q)pkR<O=A
z>o+UEyPR)3Ecibt&X`7rK(7fc@<x|k)`>l4P8B^VK;3IdRgGpzxwX6dNc4?g?BP}_
zHhDGQnApKlK+2?mAKYd&>M`Pf6CWhI$hA`j5t|NyUMxG!wnKfd`(=w=(h$r^dHT)$
zVA?rLmW9>ob%9gPgEJ+oz|CsRc;ex-OWzeQq5ikbZ*)D4-aW8>#-oIzTmiB8ZF&gV
z)8F+J;8Au|n66%TCn9#U#o9H^Iy3*rH3OE(t0o?(D$o=X-<WYv&`w?H;g8^yd#ATu
z3oiAX`*}SdHd#CjFscyxWnBP>)hZOr`G6KK4?Q{e^0X{+ZA1(_ef$ddTki9@jaySQ
z?!Vi3+P3mHqQ70d^mm@8{owzqUOZF~_a+hMN`PQ79WbX&GVd&b>3>x(R}a=pm@eM&
z%|xwP4~{rYH;#KN`F~X}r>)fUv;V(Ty)L%RBN!xuN$g$*_eOTh`b;&q7^GbPPKUYl
zm{zg}1hpSve2HXkClb3lzMLhjtXoEEE72d-iOr*d(QEkIK@0ptn+@vdNg{j5I*I3B
zR?_n$kF-#f2;bj-;Et`iO+`uY%+qQJdY6FEa|E$m3XZ3av|hUw+PR23R_-n*Ci>>h
z^8YK;d|58c5=Ss*_1f%h(~!S@&%cO!;!C{fg`b(Z&s$a)7qt|?Apv)ypaS%MCbOKj
z8(C!#fxn8$x*5pyD6tsv74tvi_hR{LcSN<ElTMq}wS`?bj}iC$%``UJhJ5J*T|2gr
zOw!GvgvCuBeTlr2^wzH<Q3fMAk8clumkCNRiGHy1aWDBrX4_szk_m?$psQIK9N_M%
z^IY`277es;CsbutGofD7On&6L+zoy4W+J#nH1k$^lfG!SPoyBtqd3;}uh4I5^n9cO
zhY?|!)mPD65n7+%7e!fWB5IhMfEbiry|{*XQlxh2-;19wVt&(%g`J+UoYn*{hwaC{
z)8k;E@toe}eI3muV3-_f-0@AyUT<A|0XcbDY&$5}L|Dd_u>tjUuZ%9V?eRAv^Ecgt
z>q-WDRl3j~`-~Zfz!PCaL-{P8EKtWTz_v8|atKQ%p`37#qeUU#4on6Kb$nu2`GSNR
zaL2wRtZ&DB;s(Sx7;3o*9UyT(Ac+pk(M__T*0d?JER^q}kh~FdO0ekg5QacPkrzd_
z7cu&zDS0qRdJ%PFQ$!a5wFqKX2--bCp698;Kg+iP4wi=qp59F+TN?I+cGEOOGY9@V
zT>O{!17)}IPhMo(6CtE1&zRZ3%udG6XL0v;Fu$N76u|r@hG;72w>xcqkHj4T0%?I*
zk4QpJBvb~7pJf!F455eFSsswsn}nf0@R>Ej_rt|)u;H)OA1M6?%hQ|Fy%`7>c{+{s
z*{S@OCh7AH4wm8-?nXJDo7wx#3b67rrZA<YUG|wa!uR9it?4p*Q4{2hREMxS2aEbo
zAw~Gi2O2hUbeqjcp#BFdy9irf1KYWb&*~Yx^#NS;^6ds|rmu*-GaGZVb^kUwSUeRs
z)ou7x0>5t?&NlqOOw&O5A^T8;--?++bwm8?nL_iK7=zIX^X$*nCohi*(@ES?pcQ%W
zR(Rl^yuBy^cY-sCuT#JFvh&N^vhI_3QHBf`IfSG-HmM-Y-^G<Cx_F<pM18u%Vh6ue
z2Udm5#O^6^F6%3pBoG1Tzqc)24)AB^EVSUhmf_de@Ej|P+ig_r^*Z=Z9N#V#ec^+o
zM-Dd2mba0_CS`L(OGm5`<}2|+RMM$dW%1)XA4Eq9Tq~d@*I^;?Agm&s`(&UhOp)W)
zD7GR~{2`~zQTYL_4D~Q*X-$|fdQ|?%V_twHkl2W$Y~jj@C^~MtVU%Z-%J1IDBzJwH
zDSJMdV}1q1BVfp}CXA2*ZLW4~46?7f<cO|#Y!1t@OQIO-(*+8Z5FR6F^|Mf=5zXhy
zS|JKzIUly5G~xLiiIB7VO*^8LK(2YbZtLQ#XYf1_gneL#zR1Z^iRbV&Tzi1hI+w}L
z2HqOZ<|6%Mg@3?)*g=guXgzLF*ZGKL{D=`ivN(~rX9H%qbK!rHe^!UEEx9__JO~pf
zgxzzV?4jzPDQEl~YZf~FC3xvrb5ri(N43ye;l^5)hDBxRoX`E#IcCrn(Pm%UbIGfo
zIYw!@je5G3#QUq^-(3~%n>nXrc2859w7Ism6~N1tfJMTFMTP2S9lK}=4I4q@eNnbr
zMius5lzTpe%|KhU;{KQ^eBIpH?k5WL8*U-4&%SB0;K^B-4OnJF^H(7)+=dN*Z;FV7
zo{4eXPezHxqja95S%N`AbphYlxJ*u?zRPpWOUN_Mv70*Vjys`eiaE^~Y`;d7!@q1z
z2j+=xB6(Re#V;xHk)N@|qc@XxwJ6AQM~3Il{}S0V6aqK$6*=-;{3I+qJl_xEISY3=
zGIVjs5O`pCeq(XAd29Mu3L&pRvusr6(|yM6^TH|JW454fbqvkYttdJ?=2Abj75xd@
zU90)35%0WVm`=jVWd6*+VOHyGal4=EehA<G<#GgCx}q}o(_{Wau>DXbc2muOAz1P>
zN^t6h)-NKq^4D3V7vrk=LX>ic+X~2F4=#}$M-4FMw-R<xX?wB^d+XD=BaqWgWiRPK
zFH7#ZX9$+85a&Bv-aOA(q!#5ya`pq&eQxG2)TFch0ZEva3;!nVH{sC{^1jYa92eBF
zU#wY8MlW{c@Ajtq)(2p%#)VVs;QF9t`VhWr^dOj%MY+NKDV?<?WH+4Kr<^Vu2WOw>
z<iD3W-)X!0jD6-<DBpDlH9x5=BI@MnV~utq1+(5keaR3YsLZ5wfJ{l;EU#pAmbjmm
z{h0kA&}ZX6^9lQ)-u&jsb!m90|4Yc_0?}D^OBEh(B^y?e3ACfeb)}`*mhl6&Y%Fv6
zHZx91!+G|JFtUFm^cR84zL6z*^dbo*di8fWN+q<lV=i#d`<wz&)%mX(m*qN_$P^yE
zR3FwScRj=~Ob~}~_E_M=AvVe_r8}naXbeyI0l6G4ee%Vr2FIndfl1uKi>Sa{gcOdC
z>cQpSsK>7${<HiCV>9vgvbB;3Nyn4)dy&{jyNrz>o$e$V8aW%1vGSVY5*U;QSxD?Q
z(UQz_oOTv66cigLXZv{@MOX~cTAbY#<`a3wqS^2sfo89<W?kBdzbTiXr?zBb=;*Wm
zKDZoC&O~sABt_OH#YD`KNrCl04su*lV+Kv{ji=T(`<=5_ZnS36j7V)S>^A`|UxlZ=
z-|we`Qifd8CkoSNCes%%8OxgD`=pGN<zwBY3?)yjQ={m%OUChJD+~9`pIQZ*3<E6@
zFXQWMZ+BTUI7M&R5-<If1r_CVJta&LxlIgNpAdgKb!O>_WGjKiwMaaZcox+NwkWu0
zCE-A3DnI`z;g0RaS8^c_%ix?_m|Z-pfX6r5;t~z8bjxE8-WJXzu{|LoQV~J|i>$|Y
zZL`lk`%Ek3S@FOge)#HT^ZO+S`-fjwDoAYdKQUJi3fPTuv-k2x4k|n&*T(V@d_`>W
zwwk|$|44aY+W@~2xzBAxHY%DWqa6Doox4(4<{^>CVkdhclN~Idm%_n+BPdanL(m4!
zo>9KpM&yhhDM=VX3U=^(<|#3_P&8J=9a*#>24|^JgN%}}+c##iY|&XG^VjRvoNS}p
z>GxlcAn#9Mw?RD2pydpY@*&&bf4Er)9axtsEQ<oWaRIv(pHQ*ZpMFf`qYIfPZ#Mts
zEMV->E4V*rhxwfvsy8xJvlZCA|6pF+#b!mi-hVwu{kfu#%R5(J&Td<i&iDA3)s`s%
z6~${W6r96}K?Xm*&~UDraCA2JDPel)rR)MB^Rm;gh}SIr0FQ_*(+k4A9=X4s>Wd9Z
z$S3#%Ha@n?1>6$Du&30O*?>B|zufGNEPvSR*^L^15gS=g)Gb3+a8yI++bAgS+!~Qi
z968X=<o@?#KU{;cOYX{FEm@@u_N$o!BK51KMOghsxugl<2e#mZyGu`qv$6T}?tecM
zxi|MoUp>b&!}wb_nDaSYk{Ikor{A^?$cqlow5Df?sy1U+by|PlYyUgbe#}pWxKf#l
zsjRb94uKAoYX?tp$4SC6R-jYVwNtXV^VDpof<TvwYnMiGm(FaLfk5}Mv1|9~;%>{?
zZd-vK2iG3w;+~7MJ(mP}FT3{o6!-eio+#OUp{{-ZpH#2I{<)5K?49qP&tjh)zB_@v
zT3z3F9KL%!E7+hrIN&<?UU%q!)UBaWfuRZA;l;!EJ+p%^qKDgCh87Or?+A>n7Y~oP
z(vG8P_0c06(SxAY5v~&2+u~7FEA9Ou?WlN!zx4xdZj`5$hHM?2D<8T?`Z(b_jBWjh
zJt4N-KFqm}S;Tx&)B7kVIBKgm_*hp1PaWs#z<N=~4e^YJhRATi|IjU>8|<*0jo5mE
zZcQG)r(*Mf$rE*pC^!)|Hy(8~ano%wC1x^6Z{p_MG)ZsfX6s~T%tUU?)V-srikOK<
zb2Bl5v#;jHZ^z8NZJnMIoLLlv_6knr$4nH>P2CinepoUeIX54mH@hr2Kh-*4KS$qk
zTX<ix5HPp!(T)DNgwCr!DHuCbG`D0(#g4Tul8$C@?lS{(<0tCY@X<oR(K3Vk3ak5~
z!oNAo*oAYYOJC=fPV2Aq#4Iz-FB|GFUlLj#D*0+H1ht$0a<ldGSGU#t(s6%5sHZT;
z7>U`Fx|V_$RPI=-)jvVE)-MxT$8a2N?%c(T>yJuV+va(jV%HzFt<~$Vx3{goDrG*V
z;{}5OrsOi@SO-fob))t_b!+1&7F`{?`J)ZVc>h0j3mvzyh~FwP++>Q|`1@}Ia%qe8
z($){5jbEi3OxR7y`<v_w8^}vrybD{OK-)~0wjCC>Q-pU_?(eSu`?=G$ZHV1ry0pV_
zNsu#c)BgVUIfHG}g`G<Vdtq^VT3DvQxXsYGU9RK(BcXlE_TQogJZIy69nBx;VgEqd
zcZ#rkui}0`Uikg6eT!o7H>K<sWnsU^;J_by*yz6bD)#3${hzPezPIat?~7e8G2{kB
z5~-NTu@GL2v71CZ1CrAo1A#Kfp-)|CNmi=pO&8F)b;zt-*`F<Dc~>_@`Qh=qeA$a{
zqG2jkgIS!Prdm=|9u1f1M*TU2saDg<O>Xn)rK&#u@bKhXYz&Lqld%V!J{MY3)t-*m
zy1u=2#G)=ce&t!!UA^1twbL)I&Af?W)u?;(#Pk1Ey{?F#(l}AQ*0#-|<qy)dDoi*#
zL5o(8v=FYrd<E6uVb3bf;A(#>%@ftj{M#SB|5d&AoO7GLPg%0x8K6K+Br5a;j0>!I
zzb?<1;q&~a&%0F^HQm$U84@2_|MowsSIMpKUuWN5WX!fKkzHO&uTE~{f0ct7<~y(>
zE#G-Fzb15gSX43d^+0}*enAi%E-sshHN1WF%#`&^|M4RmoMsc%RDCU&a*0<dqSus@
zeJSfSt7e|52b+aUdHhX@(g??JnYw<@+wyHLAHt=EHSc-^uPj2C)1woOMZu397@75h
z7t>gr(3}D>dq-e0m*JJp`@zDB{S3?lir*>&*XVde^cPhy8F`UdhAVV+{8p6XA#(mf
zk?#j)pJEMUIW#SNKE<c>*0y*>aqOEgUQbuqUTX>0YCCY2!*re%?o5`}{h(ppa8Ymj
zKd-6{9nN0G@K`C|NsBjOtF{T56)W$I6|ekuFIsND%!U(k7qW2w<t?A-(l<Zf`Pa84
z=AAT7;I|7ro?WZT&{Fm)sCY12z4QJ_LUmdB-C@V$0aIRY)$5O~kEinPX-!_8>5mvZ
z+P<x|A-CtN{zd%aN#1{__FC)<&f5xpum8OZYXA4|?_C`*hgEPJ<7sb~2n{VrCmC6U
zT6tbU%<AjrIDZeu94rg<4lbPElM-O@8*J1Py3+YjtBdO_xQ5{L?rKc?BH;hXiAbO7
z(0>0yfvSJZc7x`mR*}q>B$&QytfLT<=fO7bXa*BUD0z1ed|CB)Qa0r?Jmhu#W9=a4
z3%lOuZkBoR-C9fZGtXS}guRs4yh3*pN(1y%YG$SEjW~If+4nE#v06tgCSo(PMa(Hg
zyX6>0xRyQPcOLsQ-J+cu`@*kz2iEtN#|~^0f{(K;v-!+2v>k^hNfGOH?f-&Ql6nZI
zWtV3&qJA#xmfqUP{tDJ$7EfD>+OkORQ~&->VI=x?CK(a`<Be^c&PMO0xM20VW)a-p
zJX2WHjiF52*n>xUmteovHsIt4iJy0@l?T3`jyu|0$c+2<XJe#YYineo9bgG29{$CG
zIFhL#K1CASHTu!YS1Pb1M*ek?@bB(&+IvSMku$+b2l~vNh``VGN?G%Ns(9i<u4S=$
zN7{H*k2i3=q-iOvl(D^b=)#=6l88AR^!Shs6WMG?a&+h@bV)YGo`EJCeYb%-B&Q{h
zS;YURdf9Hbpst2cI1M=hxH&1;g+*EW?T#0}hpX@_re>#I`7XleUD2ylkbOHXO4M(u
zzc&P0e!G)gfgew1)4rvY9+$WLW3Rtif4(s*Qs6Y&P`K^Xnd>=umC4`n1S7d83RzKB
zy)P0mg=t|*xfwMkk_OUz_R1M~#Z8<t#ue{4*Xr_1O+;jU`p!6<>E;~<yrn{lbS|{z
zC^im?i$s32e2vb%)tF_jA_E)pCDVMreXNwo_IRt*LoEo&?kQ8p#9uwjac`L>p|QAR
z9ZGa4{wVrLEBAH5jk?g7pH^bJpG0g|8$)m9HyCRf(z>Y;DuO!#KI%WDX+di{@kfU~
z_|M8T@{=Hna#oe80*j8b;_zL8Rzc-s1dJSY*Bi%~!l3-lcPLZHtkMA|En)l4KL1So
z!?PieE$nYuXMIqWQBROQ{X_9>f6K#1ntJ6{#w<J!!qL@k=qDHRo|xv#fGZqpuhP=Y
z-es75%KJ>^$o{~|YyZLKY4fs|^Q&);&*NX*{wL-yO$i>af8br4=6~w^(AuXan}oW{
zVW%W71Kpud!o0$MopRn`aq8UrRaXVADGz^wZkzse7yaUix5E0Vo95lMfkR;IuQhZK
znaYKoll19ZoH8N5lzt!{plSQ`?bw4bnOZryYoU@CUz<IAS>IYK+J`)8JHC`^Q48=f
zu$+;3J>Gniq0U6;&Bf2tdv(LzHDUGs$C5qP<F6#s7(|9}w-^7JaCb0(LOs^qQi#qi
z`nU~`;i&0dGNIKrq~3)7{`|oQji%2%^_PmK_4i)BYM&h{iS4?03Cz=61B729FGS7g
znQ^{F*9C`tAj~s7YD#mQxe_pz&6eV2*!5#2Sj0fU6OmTf-J#l;lz%o0U0>KE6xJw`
z&UqR6vAHJS{L*FU#XL50bAwKzUs8~3p1{+HKA|65nz6F<gwGL;4RiE(xwOx+6}`Tu
z-pU5Z0ig;nJCTca<#)m!S@zcMNnU0&EIN8iS54CDzZ1Dr6e{^u?Qi8!c$>;k{1eqB
zC%=L7b0MWYu0AS%53-VAs`e(9s|?4Y5GdEDXAc!>dE^!D-l`fj(tZhem8P8*8J$rr
zrO^HCHg1g3PVJWH9DTFfi2w9Z{nrmd?bUMH^d}!PM!Q#88M?wnl25L!RE5a-mwcZd
z7di@SNNUaXygBtMw@$UHK0ToRTEW!VJvYN-LCASkQO4dc;lJMO|L{$Un*FT)>Q&S;
zL`ZJb^lYp~^XIw1i(Pq{0|L+eU#$n;=!%-#QNMZqeSc8t{@)7V(kA^G`&RN>uNlU#
zTSAu`F5QF5Bya^il2^*0-@A4)Z`vNw%NmNw$emqE(>dsOj$M;~B3e74ZPmp-e<o{Z
z^Rr^RTA@!y?p@23FMP4h-I*CTa_pjyKa-kD@Xc9F?m2wJvw_;duXw`}<(j^B)Wm;m
zl>b#5+B$G4>DFYF&fXR02LiSu6j?8;pqz^**y*ENpMEr)%!Imihe$S#=EC=>{$Aho
zu*)9rt|hgF&TV=LonHE=KRotkYAaQtWd(WZpp$Z=JG@?VS@Jld|5fNts{8H&L*}gx
zRP6s@?=GXFeBXZIPth<;P!ck9cQbT%iL@|)0Rjpl2ujQ_3>`x$2uLd>QX(M25E25?
zN*EwWi=e20AkXM8|M&lQ$6n7~Yws8P{rTp));h22jN|xzcJ6Mf4XLbMzx&8_*C1d0
z!^@Wru8AkVKI#jHo%P<BxEHZ!=obDlHT7^wEOLM7a=SCZ@^IC2Ztpo+^?HzcwCVG9
z0h!kREyLpILt^CNl2pgOKI75Hs*bJ&&5rMH8ISh{kN01@bsWjO{;|Iid3^XW^6Nxo
zB+%jX{>pJAg%_484$DkM?m5Sf>tSiAad2TAvfq(z8q2C|%xHw;Agf+%IC3&CkC8t6
zDo(&FN@z6#B^)K@rNJK;B}I*wX$}+Zk5cGYlNA1?dQAt&d*L-#Rh55Jz4|@Kq?fUS
zvW{1@`D(Ofxv^1s^r<~LGiri;9Kk}EVB1eP@*p@;$G8jQou>)s`o-LYW4y~_IE`Y?
zuf~K%#rO!v26|!r_F}H>@dg<ERK2z@#D-AEi5AC(dqrG>0pW#|>z*{RArzB=K)4og
zt`N-v1F~qvG5yrO;-_TdZYf9D0{{Rk$a=|7R!dS#{U@vCPu1diOjD^0xFd|qX^ww5
z&7LouI7^jKY?M$LmoQP10KmjI^MQ)U)K@mP(JOH<j=ec9>E)xu5+n7C^NAH+NyGl=
zIapHPUQ&=l<PderwRcIcSHs4p6YqH?S7pa7Zd1(}rMzKF+3^xu+)Ej}kTT(rOlnR5
zz<`fDfkn*;UsfZZ38zw=VA&NW_Fqe#&`l;wOuc(_!>}Y^4)MDokupBb1xI8Ky+K!j
zX4p?`MJC;KfJ_<zdi&E3uBDwANVl&`6QKz`nS(}oC$khL(7}KJB7jaSO?oZ%?R2_!
z1-sN*hKo=}vu?)0Dv+r*p|T&WHju0z8X+c<d3pe$Cvu!6b}jQ!MkX)0ugRZkPMFRr
zCrgAn(=PsIC@$-qV}P>?^h^%AauqnsMvml#o*lUP-Z0C1;1*xq&CmhAOEkBd`ED)F
z1HmXja@;MfNW_hqTd8aC$bsy;O^HnNpj)9i8`DHMHYY~~N@!sy3PmTX<Q!kSNsPbk
z#FJCDcHuEK5ulR9uz$N~I+aj?E*-f2VkNs`AeXuBcFWqiLS;a=aUKYkYi^v^Z46xW
z2LMo@iA6v+P2TjQ+$RIM9V+=VEiqHx`Q`EXvov=w{rRu=v)`V$v$7w(XnZHk`_Agx
z9li298}T<k?BDs4gWnM;IBi_;b)Y~vu3-N}=J%Q70`M&En5Ix%q!3bB*bs7?YQ2y<
zt&mQ%h{~&w(TNCGEjsZmlKEoMPFxW?ZShWD5f^O=H+!+r#Rxu=;z6%svg$Q=uUO0}
z@u%ulnadzrB4+Ya^^zm2Ub96%Rj=6_GPI>w;h(CP_k~i!>#;vouhuJM)$0=VPt^-(
zU#4}v%yGRe*PzUKmT=~v?A-b}chS4HMt9FYyBqPX#Jly5&+Og6b!RWyd&a`|u2$aL
zy>?HV7IcHQ{QCag@Y&qkEakBY;Zp|Xj0eK4vE`}PZw$-pC(@D|i>?wADu`6Jr}QfT
zmDX}MD~e2R+*qQ`r!BnA3@)y$Tva+Qze}5w3aYFUtzxFKwO_7$ErOOIhBiE_GP67L
z=ym}cOVtyT>I;JIr0bQs_SJ*y=UkSw`)?Ptu-_OmxxX=ChT1k8r7cVVgKjyIRWE(B
z)0MN=3tu_;%qP@X6O0y3YN)OoFD;j^ncOe9b^pV9;TGwBQU--9E8WrhgJarSpja)~
zw3foBmMXE9rmB{1u$Ez?mXWRwE>?#$tz-77V@<3(Ay%h;p6dO%s;}1zw}_M@4ax#O
z^+JjDB31QbgY^;{^-^>VGGYyKrVR={4N8d(Dpd_+$xHoly)1b!ZM`fR)RL|@!8RIK
zHJT1Kn&&o-=tHc<9-cCNczW<y+v1n%Wls0-^u|NGIcaCI>h-ws%=d>E=ycCkH97k<
zd3}Fq|F|ijs*%ilVZ<I?d)(+hAsgiUum#5!a^unU4RDz0!-y)7PcEf*A@vv4#$<Fz
zM*vfaAj=D|#(hy_CLPmGd`pf`i$tBN5l@R7PyNNOUYtwJCFl#S=UY<-TP5A)E6_|O
ziWP2kEgCxo59g4#=~@int<F2G*Iyv(Iatc++LU?PiWA*y=Ul7iT8FF1%_yx5r&tkb
zm-K+TR5Kc7V=XnNtvyf4i9b*3zCY=odon2Yq&v6mso2TIjkXWYhy^;PJ~5VCwokNy
zx=C})lQ)=N-e_Ipc+&9rn0XuRx@p?}EEoAHvHd;T2eR4Dz=;5fU!>n;-bFKgLw6kb
zJn5M2p!IDB3^BvnNGms3QNBoOaTflzcHT{rm>NRZr3-P$%tX(`;=(HH+rjQaTKDPV
z@Fn%qb*ohSYQADdwRMa8_MF6Z>AQ5Zy+X?SvMO#OE%Hd}VMr6To*x`tC)K(f4!cB?
zSV6u|4aIv;X!q#QvsmRJZ4P_PhL9K4p8Bx#+7ES#R6lh~dKz%pd&Z^DbEuCE*n6In
z#mg6YsjZi3qDR@6_1xyu_@Sp)^VoY5`-Jk^(_Zz3bGB!Ob;cwiqr+IEs`d6BKc!6?
z;127<y0DhqV7rlb%t}_hvWEJIub$=PUCK*h^)eg0=khGE?O6urVEU^;4DK0O?CLgy
zS62_-)9!raGH6yk)LebO#H_u7Q`#HjSH)95Wi~Xk*~b<<R32a)3w#!lHWc@YwO4#7
z_;4^@jZ3F$_(K@{r3)9CvhPol|2)Ln`HFpe^Z9pQ$4xb^de4zvv*+bSBl|-mRIi%>
zPo7f`k1~81Wn>tGON=4S$C&-bSd+(2-2a)^!S!K`n_-+sVw}%>T)=N!D0y7u{<zri
zxWtEXDTWCdi3vIL2?f6irQ`{f`xEHl3H1*XnhcZL5|g^-llp#>hRKu0_a{w<C(S=h
zS~5&oOH7?IKb|`6H)WqZ<#>O}dHDaSUMcf5HS=`O=NY!<8KDbs$pxgv0`sK>)|7=4
z<b2WR3tU?Z+|YMClJEE|-U(cKCzSF|q~@L2^LG+k@1&rMGLnmO7K;j(7L`&KRcaQ|
z&llCV7B!(u+LBAU7EAh<mJCytjBA!mpD&qjEm=a}TT8w_W%2&>rT6wJ?;UI2J3oJa
zX6wBhblF{U+0$bA+@<9UDa+n9%RbMS{kE1bLstSMR{||of-bFGOIZo6S-J6iC46fo
z61s|$T*X_g5-zRArmV)-tR_BRP2O5fg|4MZu4P!PWnEgkm9myovzGgOEq`mR0J>iE
zm+EEwzen}D!S#QuuJz1~rO%y1$K$4(=S5#nmwwNa`e$z&ozELM&l_+7gY|ZJ<}LVl
zU~BjfU~4!)j%;jA2TJ}sur(5@PPl%>BkZn6c-2_AZbC%xhsb{fwlw|%wqmR=#XWS5
z*SZp4e>MKWRJ`3^x>kzwOp5clRFg1b;~iq`OCn~P=;obf9+uvcl%DrL1h%$w-4pX#
z=kqST$`AaF+4>K_)=shCpTO3e(y*qxxv}>GZr<zt7hS6&`cvig|6JFK`B+OJ16!+g
zNn~T|Phe}eG5()`t=tEX$H}_Zm$uBm0b51?4s3nxDO!J8Ro7e6**h`Q+p^LB;Nd{|
z>t}77&l<?U*3RF6t*z%R?IZO|qg|x2hfl{=hQ?lf9DB0=hpx5xhpx5rqI>h@!2V0p
zr|G_}nZbjZuA$lPnYp*0=7#>CuJwOf*E+gw+0lOVeRpBw?MTPjKXonP-*qkDzw27W
zf6=v!zzDLg<-sDz8vsV2|5?}KLpc7WYaz(Gmfqp~5)?i9r><qPz>g#+KMNpTLpmwp
z|D<b4{H|*;z^%T{bkWFYk##MZyiu~Q_2Qp&t<R>S8=3MWWuY;ml{!X;+dp+J6j|5W
z#QwXk)tE<$)()bMBkNj(D^X-!>y+V7T}u!_*0r8P6@PU7(zR0m(6x5yupX0t>RMOc
zZ9cY}jkm5Q>snT#L8za)*8HEk7OEa9p522q;mZ3>*UC#!CQkm+wUU0<wQ6nY2epoV
zaQxD>XgI>QbztoW?JmD`Eg0{@!Dl)K^iN%@!V7QoU+7vUf77*S#2Y7n=~{g>;vb}$
zXn)tWjCnAkAf7*UEwi7xmg7I^TJ`^^Yk_(HMb|<}{P<1RN>0?YnLCMM*n|A3Yw`X~
z*XsIB*J=i|4n@kWo?<|lRe$DY_>a2Q<S$+8@jvNW^HF47%k>Xkt3ucy(LjkvNwNC7
zuJz~-T`QQZYrXzM*Gm0U*RuadU8^2d_z$|4*MF{S(ZT;4U5oD@buB2vf2C^`vKhs(
zwiIjsi>{@GcN(8RvC;f*x>n}jbS(gD%Ylo0V2i2B3ya_fx633huPNouq(nW;_@!&P
zcv<NvF_kL%?I*c>NX3SIrpn<T=(02U&vmT~Jl5+kUCY1dpLH!c!GG4Z{6Sjp;>tAz
zD^p#c{-taE(82SGz2Ox2L)QW#{?N5{|5ev|`8Qpw^grlYGJn&xbpI#17LZPttZSkF
z(6vPWS=S2wOV_garE3L~{!?8Gj|}=t*E0KE*E;OFoS<55Z}`}uhsy$W>}W3<F$z-r
zL)Uurm##Jcr>^DvQ`Z8sv_dZ5lNS~`8#T;L1%05Uvvcq7y4Hu^b*-5{buADNfeVJC
zx$;ZbVzg+sGWPvT*DAyOFX~!+WL?YXr>+(KhpuJz@4A+;c4!fsE=vzK#;scSH(d)s
z%fBuDFS^zz9rQF=*OCFUP6;cxa;&e}J$4c)q#XUFYdr+8Rv?HXZo?a{V&~|U$hubO
zPhE?Ld9GTZDtvhJ{P)sn=>HF0>)G$RR@{H5Yx(`uwOk-!yk7->)3r!Z0ggX)t?d6+
z*ZP#GTKku-g(B-(#riT~E(sBnf77+_48CMt%YW>$-Y;FN6Kd1h=j#)#Pwif$b5?^G
z6#ecln)=^$EeMPJJVfYb_Ep>_J)&$I!&SOXCn8)4l_Bd|<fdTRE2H){g=AgJDnWOy
zM!R(R+39QBbm65Q*AV;)$mcP?=~`O4bfs2}KXoniPhBgG@K3r{!oTQRn}6zB4kDu%
zuEyzq)U_}_b**nUYBzU)eZO=qtzWv<sb9Jl;cvQD_g}h}D_PeH1jqURgRT`f3aY>;
zZ4lKpv2^@w;vwB~|3TM6|DkK;!IZ!AUU`iWHzH9Uje?B+gRaH*-|JdMg=g~$8T!+4
zE<5!9rLLt#cjbSsYo-53U8`A(ZVZ8TZu(u<szpIX_OyYqkRr0KB}}o^MMH&%Rr-wm
z;s39?me#-OTCo34*LwMvu2uARU5o#Jplj*UNx**TT3UbTTDm`VEgApcbS=I=bS;0d
z4E7IQ3-(jjD$@cFUHJ!HtAnU+wwCz=CS3Hdx|W32zv)`ne(G8sB#7Q0x|ZYiFI}ta
zZ@N}GZApVKWvBi{>(DF(u^C-K^e<h@<~LpI6CEDUlhkvi=ag`8w>aCUTZP6V&7-^q
z4!1ym>RK7J1vB<v1#ew-gwdbCJ(N@4z`NUA`3GGKO@i3?|KFi&MgE~{<@rM?dD)K)
z;1#31uZ`j8|5De=`(M?yNWbe^SAOYQj$~a6M%yv}uew&={Jk5ZtbtDVP_Z<Q|E_Dz
z|J1cQFu`88IWNst)`*rx{;6v{1jk|NBruot<|#U~e%G}+MsGG^wZClB{nWKge%H0y
zNPp;BB*+wrF8P<PCGm%@W%KX47L0zE{Xf;U%3!6QD>WD|tEta)qED@U%u@^x{H|+B
z{9V`jN_Xi3Oz6MTwVwW^YZYP2g0KxTWL@jvA9StS+TaRlnK&$(bkXXoO(>|YF7|2l
z>-sv4U<XbPR^uuLH|0Rrz(#N#J=-Uh{LueS*E;y6YoUJEwK`C0`%U04MA~;sNj>#Y
ziGR|yI!5IpPBmTLX?{YT4hAaI)ZH^}c307TtXOi^#@666KU96@Q3RS3OINl~+i-Wg
z^fi{U^OvsWTiX^i-)6Z^TQthhxoy^I#jr9@>$wdHf|bP`qsvq-I@~Hs6V9ju1H)YK
zfnij{?Wb~@+w^-{f*5=C;=zY*3Uv}z%6npzjj;QDi0eV_?dbPu5T3`>JF$AgXHN;A
zrFAJig%rLtBihVN+c9U*Db|LgbF^Nkz4@(lN?Lu!iAuZ`oP_Bbg@KQsQP$2!7!hN|
z05pxYC06Y1r$p5~4_IBDav-?&N1;0Jq`jdF=YZ^R7XsrE$<wK>`->us5SlI0E$WMg
z*%nvZ1fPSXb)Tr_kPCxya+cXsbx{XFlcXudP3Ts%JVn~NEH5@&w(|DTwa0UmW%je~
z2lqj=&y7yz(ba(-jWZ(Z!3S3Kd~*oxbqch9f&MYB58T<$y>y=go-Z$*&n8GA0i%YP
zz&hr2%$uLi?3B9Em$`>Qc@9g@we^Zz?3LIq#k}mDrR$2E7kF*e9T)~}+=gz94g~W+
zi&|Qeu$1-!&<@TaB49{jo8hUMRQpv}YB2h3Ap;?U))z%}u!cCQwKwb>>{J_S_Z?#L
z9O|bZ0@M$2xECO-8Qs?h#%0<thfhj5o6q|8iYC#?U}#@kN!|5FTbh8qTo}eN4_?E-
zHClt#vtqA{S@CA@MhppxqY2w&rBR2|9hq=h_pG~|+!TM-$OK*5EhS=lvBf5qs<vJv
zN=tU?&@XLPSHNbdJ}W2H)-cw++63saOa-I+Sg_0llluf~vLN=m@HpwNh}xhv`=re*
zgF!fSR%`NyID?s1qx5Um58DBEWv0~g?JS%aEZ*_!-0zCcEp}EPT_LK=gioCx=Cm0d
zKe#>Vb~OIz8|!CXX5Mv}6DKm@4D$z-mlqf~yO5|xQgLxNRP;JXcD8u4uxOK50_dXI
zM4`|mXt+7QC{M`sa3=U`xREN{;}KlDH73P)?A+N>m4F%Xv>6_4EXA0pn6%@KVUBh%
z3OQQ>XXgo{L{$|R1&W{=7pEbUMU>WxyhRxh8Go~)2`=lq$em;^o>t1DSB~OLy~Bw9
z@L36an9R&9O+EBUD}9i957n_DEX$9{ZWx}WdX>?dv2h!`LG=FtE02>d4_m*tcd<N9
zRe_c|u$be*r{p*5`Thw`R80=_9w^Gk<K<t}k&90d@73YK7lLasDi%~hU(a}Mzo(!Q
zfxS$Aebi~_L86+<gL&Eq`|=NK+bwAK+Pkp^+r<W<DdsU$ilrAT-2(0-;Iw+RH*BQO
zbX6)OtyPg`t4FS%u0Sz_`Btg_sA|S6D*s>@XsrgxFiI3&3j!^%$+O6xg!8;YDF{L{
z>_Zbig`^p(-MunTKK=f#ZJ{z$Qz1n4{F!WcL-iSz>t*-U^1hYdJ#{@Pv*y{e9_4_S
zoHDgc3$H*sV1~pd+C)0^F&_`Y*+2rl+7m?=`@<o5z?zelcEe*K{$w5F5h9`;andK!
znuXSjNRj(o{^U{+{vy^zR|B-l2#JHZl7baaEuV*S7mZ%oe-ufJqmdm<emE|ijq;P<
zHVM<mttrIX$m7~hQPo9JOK%`c@57CK?95DIMOe3C^))B442Q(kQZaq>-mMf#n7tUx
zQEb)CbZhN26>hYndJZvm2XP^{2@Iq;7`33XW+3QlIMzBNY{bG8#0LGdf~+1o>ux;U
zI_WWQ>R}W^70@YWMZcAh;@1<Y8XCKFX=Ntv(aV$C8t~Wb3$1C1%8*V<SIiqo9aM&t
zHV3sXNVMA0V9Y-rXYAJ4N=;%c%#{`EIJNe}K^=)6pWl)LeiB(|Jp?`eQqynN@KM5+
z;rX;DRdLeLsy1eY@nzCNb^i8;PKZY>^cgt4D-H&86O$9Z<w~SLL?yT3(ftuSHyglD
zHjp&!aL6kIT2@+NOPDJvv-6_V=No8~7afh;43<|$cL|b_ZXKYyZ!)N}X0;ulF_aj<
zI4X7CHXi|bl~$NcN6xuBaK%dSi%1%SiBah?wRoGJEAm)$P%UWX-j{;~r2(3BQU;9G
z#g0J-a^<E2P8S^HzZ0X7QG718N~cqa_{BcpvW6NgqyuKSoc+9D;IT7oBoa1Nz!L49
z9cOH8b3Doj*@xMJvXvRWZ)#so7|2Gr2kxPc=*M15jIE&-`s_w{hDTVp-y+h@2CNYR
zOCQCjXkbAh`+N?gf7i9>zAz^`)Xl4^2u+7g+<fX*$*rmE$nQ8#*0pGa?w+l%a>~Cc
zbMBvYE#7uF4Vf|7S$QFwd(=DnWlsO1Ythby?x-ki&eUC)s`<}!E%TSgG<nzj-FxDH
z*R|rAcpjfonfdgauEmMGc;P{TcB&v**IH{93f{wC?fOFF^x3rlb?kECtD1L%yGhQ6
z)E6`@-j6`XN9^exTo3FYMR45+{xH{arjNNMYj1OL;EYtkheL(km(6Y^f^KgP_aD@Z
z9OVqt%=!wh^bW<?z50?JXm-9JH|1opkHz`#i<}>9ogX~;=9+l9{pC8xh-NH+iKz7+
z8aAxHw^TBsL5<!e>sse*K5`;V<$vm0@^zZcP>wAKvuCD^KFjMXW2$TyCartfb$53R
zQIVVhhP?I=$(m>W;#UR`H_nO;RL7i6Hxj}(elig^o^y{CNvysiF;+ZOH^|kYCT3P$
z%Ae84*Kk#?QZ@a0phd}xS7|g|<$OM3BJUak4b;9YRgP!^hchgW^>8NdAyOFQ-LX5;
zCu&F8-j-f9P?E}m+gMynxbV<I_o1=5`TGpr8jgl^aEFa0=i(#_<LRs^JJYb!wl3$o
z2n<mPoq86L?VV@yT@u6NY|V$&=$^^<RcCc5ie#7#TrjqM;o!@vbJihTN4o|kvhB|6
ze1%cx>$p#+&gaU&vE-)vLH94-8oxRyp~TESz1mlBi~6D=ePmqi%QvCN)i0~od#Yc|
zUYjv#o*@)*g}jStch}{PI^glKOh_(!%H-r#q0lKlg<p0|e;|M2Js#crl}ajNG}c~E
z+4$*u-wck$vnGAh+T7ly+NbTRz0wQ{xPsf6*b8ths&+L=22S3`COJP;yz&|pjS3bU
zdxKA!HRWC%2As(y$09VOORnk6$la)EtaHkJq3~K`!S})E7jshH(hGiyBrxkQT}#dX
zFyv1CW;e&RKXffOj>o3GVlTr2$+}jUPQ51U(Kgo-adGX*LNA*@+o^kEn`53zE}E6`
zoZXon=U#?id&74DgcQ`1Ous23%~O1BDZ~EF!?$?1^pM3{x5BB+TvEldmKwFasa$Bg
zE;wmaKKdc%{o{x3UR;&Ljo3j?@wt)R#aodP&ZkS94Ja4xMMnNm$WQ&i_5MMm>0<O;
z@M!B!-FvE8G!3YXM>;B63g^0z{F$;`#A}sG5$kd1_?={SJAK5c#i(>4mG@O{c&}8n
z$R>j3k*5yRljR6;-=YXDh0YqRIsFyPJm^VZJeOTJ_fvApDStP$ABvZ5e9wSu9R-b=
z#ItBR^r;?nQW-^e(Y;>muBlw0@K_iXc3(s=h@2(`LW+Y0-bIH6V>RS7syJ%m7Bgkz
zxGhL&dW~$OY}tTrRhx?`IG1s*ku*c59czt9e*PTU5YSG%jPS>hIE}b@f*Y*p#*ghH
z%>$f}t2B`1GdYGzXDq7W2t`RGg2dN%61m0ks3MdOT`7uidAo?h!y!|{f=G}sUO1o5
znc%B9-LD`J7w&7zAP<Ni()8|T8Wp#RDnIURJa5xrJ3hIbQavE&yEUKlI&<uDFjm#$
z(-P<D5Nb&;EtrUJea2I-&h{PvodlwX?#+SrmxxX+!Txj<qc}D9r^cv|JPa3kuP?}(
z^SmJXe)!VvT}u3gu>hM!qRpsRQej=Yru3y^u5$=^WfL2wa9dwq{fZAL8tXf4CA1dG
zvAVF%D(pZ8E^j+dQ!k!6d#?nFo9749Ax5KM@=@;+wb6F-j8a~BBqKq@Qg*!e=2jf?
zGW{q=!@-n|dj<<|oZDe|y?;OH3*?;oMmz{oRryAbyEsIbIc@>watPp#!!l^A?k951
zmnhT{4KO<a&x=n&Dj<%A^k2&uk7*7{DlC)NZ5P)wmd@^0t94&=rW>%UrL}ChqdrEf
zF6J~|xvH+zR&CzppYm7{!rkWy=IHr`XE`Kg9PC6fWp~9Os{srV3ZmNCqfvKszEH}L
z^ikRDsVrKjEBU-XSkT^d+C+F0XWrMOG|ipaHmPn^2sLCA^|%?`)6KoN+6RRsFz)I=
z+86zv1$Eze8|aVh_)ZQ!sGE~L&{<+Bj-&b7R*NsB%$E52<+7pQ0@!V}zmy-OOR%=)
zb+cuoe<3_2ls;N!YCFw%M(1f<%l9}#EihGqm;Xgz^?c0I0=w*5tl~Sm#Rlo-r?YAX
z6o73kHR~FPnVJMM*^Q?)ItBomP#GL%zPwxzEsj&{IutB0oa8<LH1Y|U5wx^)(HjL>
z83h7Z05MzzU!E%4(V%BG*|_etq`fP|f*o9}kt(EqL7k`R1N_TO=AP!Nq)(ZRE>)KS
z^8>P=-G-jL&I_6Q@GC#oZ@=}0ork>}PmY%>+n~k+8$tR7fNoS&SPG0WDn(%YbNs>P
zdxU!Tz^UF^j#s0!0mSk#e$`$9$$*u>J<#;ZszQ9v4z=_q=ovxqtH71v4b$?~(I$WJ
z{Sg@kO|15$z%1d!sy{ta07QSOSvnr^WR>m10cW@HHx(ziyRGnd#3fi`UD|zLjqmOt
zp6M+rdjE@-K9l3exnB+WJrarG@I0w}s4^Y$bu`jj7YrbhfPig=0JA(GkVKMmc(Q_c
zGOKr0`g5vE7*rU51u_D#9F%YnL>vX-+3r*s!eW8Kg?jM-K&_?~&_fCXpr$638tbhh
zW<UThL2GJZlppmTxxiBykl|d1P2a%k*%lrEXfaoz01OD)yr&Yj4Fp(Wmho0&gPt0n
zZ-1W$3KRqApKIfotjL9+SW+gL*DK~YLQ=7j^`>p$k&`EY`%*KBqxXDirbh-tMOX5P
z+=S={FU1c+D4Cd{tT9SI@V5Y3kBx2dz*ji~B9=WW{As|)8Rb)9U*+P1fmrrx4gl=<
z7y`IxvFRD+K~0V@hsBVtW^T0UG0p?x!-`fPYm(UCm6ISQ(YuInEU+cQV6g1|727?J
zov~DZ1i(Lj?w%IMNbM)3l)4*;d`@~BM%+%UAMXP4?Vi_7^y?2b*BGeV?<BUbRcUyT
zajWclL-a4)3Z|aG-h8zy))s?ba*7KK0TcEpEgZN?VdcSEkh^<rkEqqDH@QFGXhM+b
zD&?Pa6@pAx?J3(=J^4vj8AZ`%v;<;tAR~AXA6(d~{XQ5=J%Ky1sR1pot$nO<9v!Pe
zrmMW7z*e2ewAL#e^;_T7eE<M1Qm0>cCmort8U=>QDXr4A<lrA4vvD>c)-(|nk5_Za
zb`@67N=Fca<=`X*QtNQDVUe4HG<k&~#261up<A=oD`maNQ7XSZ3LTVm*l0|!Fr_z%
zDxkI}3Ko02lPa9L(`Gd0TsBpBIb{GbCP<kbu}h1j*E?8H_2GlRMZ=f*;9k-=K%w?5
z{-Nx5fZHLK@jHM`FAZg;fgFpG)iV%Qj(t;wb)&~!R&EvA)TM$^QSLoqQjtfvYm^1z
z5oszFH=5pfKK9g72T%i@&`QWqX>KpWrBh1EYOyqX9n<JX=fiq08v%L4<o9qu-m6ay
z*!5K7si=!-EcBwa%E3v-J?7Dn=xTh3Lrf8El*K&ju?z{Kfx!puQRvNsqe!t<{UFx^
zLU1`)o;rGaj8bYIEMwIF&PksDG&;N9;3bzvLnK3DSTHK>5((Rqp-$w3r}4p+004iv
zG(iAXZm69~EsaMF&LxfIX9GYdC;^30Or7m~XhQ&74BMDNnGdKc>52RHlj7=uOuT}h
zk;>9%4X%CcUH&v42LNJ0<+`4(X01uJJe+OX_`F)*$6_oa(fBN)Un!nSa2l7GLlZU+
zkrJkK!bDYI`oGW)xREGC$|<AiV^G^s_QiLWZ^wpW32H#&G&73yv-l7b3K4*~9tI?{
z%A38EV8=hSdjdNx2Iq{Hb|dO&Zg(Af7DiDz7|c}R&M2D*L$HR^1d$t*6x1a5^4h>@
zvT_BmRgTe{ZsJkKF76ueELl9b+Fmg@3{%Ehj#6s&n{)YN&j5ZZSIgf`sJ1C=$;#Ds
z^QTh$8Lh{^lq;;A5ritF)zk<Sg4aagun>By6En}ZUUkFx+8(P>1&NP*HX9);SFZzq
zB3C`RcQIt!l%Kyl45{MJblZVSu{q}g(JZpiEQu}tlL)2!9)(9gSR_PG5T)-oee0ZZ
zW@tZeWE#rP%Upy=sZvNN%N}MuVXgB{wMo|`5e%T{SNIIZf~0}W{AfVjphm9hM?DHj
z0^sg<2z7QVFmC+V(@Hi=EG^S#0zvaw?l7hn41loVl=52Z`O@B24}1h;0i#&I8!_=<
z09d-tlB8OfSZj%yXl!WGW5ZTVw6Zx)ROD*=Sk;64!7A0*>kvRw$wbBDi9i@tBL_g*
zL5nsEuogJ3Dr&7%#2Ymlb6GepbRKfGk~#o`w~m6a60B9IDQaoTkpd9&eo#Q+P}H8a
zGXb*WNCn@G<u%s}n8%;%=MyYru}>~xV#5k*S<HQIM(k5M$LS01Py{HXc><IXCny~}
z5k3yj*iPW?O{86rei;}-8OosOUp8vDYLBR+z?#FaDZt%obxy>;M5<6mhm$!hZ20RJ
zj8UhL#dpdu`veJ5YAM*Qsk%56GuQ|Q7V(N@Jpww7##|>sq_E`e0Vu$TLWVj@RVzBe
z$}Y-*GK0Vyh9%tSB3zDp;jM4y^FDfD&@ME9CEmQ~G7$}!Ry-kd|7JbGv>d3h+vrRt
zw3<6g^QZgxZgFXW5{w7~x}ZoR-bsSS4-@TXOlVlpbNN8!jfJ!@kdZDtiUbk9K7+@;
zu)-9QZCO2GLdc#_WOl4=$c(*H><tB{xS3hyi-fDmX&*0E@JM4}(yiEy7!{0t-+QMA
zaA*G=^1&=k81)GUEr=e9+8RTVzUt6BEK~Zy#cy3|=04x-{nvEG(@Oi4Y0)o^LyRbl
zFwwcwjx7unBXnSs>#y6(&0m!j(D=MjzV5opg?g=@Ir*L@ygW8aSnB;3y5;;gk|%y4
zTwdA;GQx#=D{Nj=XX^G`ARR7k3BTTn3&QW5!@k-?Xp#{whu+KBC_1ahw|6Pn$Ou<C
z&T|_qN<9+j4;CfahmsMl5c}<O>Fdc=z>PQWlV8)OuqjCcAh5@5dgKp1K%`NBG`)br
z3JaXK;IamE$iu0%PQyL0;1D-aWh|^6tFVs+_P4-K$v)T^U!!-YoCa8(YnlE`0I>lm
z72(+>svkG!1zP4OMyX!<(TKmGIWaL$Sj33BW*f2rHss)q=!N6J>{mbP7UI<5khlee
zNE3Ve0^7d%$t?t1?WvN-5LnDBQ?@!7Y1TbE+Sya(y;uV{!~+SZ;uZ#gM`xu|;9`;t
ze$zPSZI&D&9?}pW;V&okBJtz>*WRP;6#f9VQObu^4W^hWYV_|8*JrLp+2<Na$+WrQ
z-yANi4B6rG|K)H^H@W|GxBziJ_E4i`n%ajLK{$D9AmzCj^qa%AXXh5;>9%*?;HSfd
zy+U@l08M0v3tsZe;bNPnyb0hx1SmORS@L4sT>(%n3sE9~%4>nTfkG@0E7Ihtk&8VW
z1Gwtk2QF_#><^!iPdg@y14kY$lW3}H)3Z2>Wh$-qK(;6VTd&cJG-JhNRnk)Sv`1cl
zqve}KtD9%I6IHnG#E9g#l2<Zpd+5rBX7|$fNR>rInya%0mIBolXav+MQ$<fv=Ep1m
zNhWSq08!>vTB5268R2S{^ASwzob%qx!*WBhwM`TZUhjZjPehm&4zDkIVt*oB6)fK6
zdZ!Y_upH-GV(e6)xy>L_3r7=0morw-zy~h~zx`aLNbW6@_C>X1&n`UR-fsxkHnKX#
z(v~>M@eASVOff|`VhvAvr*F+FsjNlK-%b*Uqdkk?Dk6BySCA1dp-PFbS9n#5KAbrR
zK5oDgW_7I7<DxO6@yelz%at{^wq6zA1=AiuZhuubp8Bb9eX9oeXc54x-m*W|oNtm5
zF6=obDi+;~Z*wVGzT)8|CtES>iQT%rR|M_abwADzfz#^;Q1T0+l*5kj2>bj*xTaTZ
zD0~`U#KgEhk^DjcYsN<Qx(LrbuKhj&B&z;IxU6Kkw(%?{yE$H<A9r_Nm+(FByJ~kA
zgXGcG6iCyqZ3Y|Rywuha27t?9*cbz>)}@8cz*TSQCxJ$nO$7Xm75yg5E7G<6qF`XN
zgtB@8kP`-+T8(G(zw$-{$1O}D0(;{Im`N?YBF6egYY%5z4$k9^msVCj&UMH%@J{UV
zh}uZ5S_*c7!Zs+jfj-+KdXjBJF91z3U7LdN0>#BG4XX02Wo|nx`?hjviY0dmsC&Y_
zYi>Zv)ns2Ima6dM{oYFuRN7I>h>`)ER(XSbztG9_!H(2f)U5(}(#1KnXv+n7GS^U?
z1mJc)&#|@460ry@91Mg7`1N}Q-Gs9(zw#V41^`rRZer<$0n&v#k(U;Vzf#nru_*@d
z&tN}PDi4oRGDi9VZ{Jxr9moqk$PAV@iAgkdkJ6PCizJp=QH$!WvIkwbM*jO3(GX-F
z#RXF1Pdtvd#3gc}W?ozm>?43W?Nlftv7Y3~PrfF?`XClOk3ZC$LjW({ae0U&TU@ou
z6#nNR;aI>nxQI`K8VlH%`>a-GOIdrB^-U09y1sGws&b01)wTARo4$EwD(xJh)Y%@$
zG*#99Mbl9%(5n8)E*=nq{a8beH*TXE-M`Be;K2bb=D>E^rWG&m<okHto1$du4`R1`
z*4?n+o=wR{QXy!<D^G9w^aWG9QwVLJO_cr=tc<fVBG?MYc!UT=&f|p)y@Lt_@~(fA
zpbGN~5hb^XhQ0ijJDuga&x{9b-OrBY$Ubexb{BJkMFtTPA5PiW4ygu%y)E|$9RP?H
zz$b*VIx%F+U~!I_YB@%y-V{{2tPWPjdXJ)e2d$1xzI8dsb+DM3Wc4XA+%t71PVR|c
zbV9zgH1t7)jy&;sLMFH<LIT{R0~)~C0!_^#%a3U25)6fw*InoMaRG^pz0I^^8Aql}
zkHFaZ!0ozMj7_Y4t3U?}#8`~3mlwMxW!HBI2W6aI)ARViz<KP0K-v*)>iP3LJ#h#j
zn`*C}pSqUPmCTTL(H%ry!*p@)PyEj^MeXZ-*T&zfcvw{K-Vmv`5Kcp5_Pd2Hy@?NM
zw&>r9J;kp<{Gn4v6Hjf^U&@mscx1P!cPf`}gwS#~OMusGWB2_l9>jR+gNrW@z6<EP
zp&brNtLa22xRFiQzkT|!@$ErJDi;+}()W08+uaSw=1(0^NGb#~rZALaFJfaT04$sU
ze=M%c5KO5xTD#qSp4$Amb_T-Q8B4*ggJPQ(e7a0SMY*c{twIaPki(Go8GNWsLBUGN
zK%@s?ah9|v=tE!&V|A~gv}z9utw2~RZm61?ArJtjxz7|Ki;dt3q2l46zOxDjaIpa-
zz1fIfN))W}7ZM{1)MJSp!vX$45L9@H3Q!v0PYw()f^|_)pse75bY2Za#_ToJJn)4w
ziA1e<6+oh3%v2thS&{Y!FqaYvaX<md-2rWG-miQ_ZQ7hML+puA{`4N$m0>lvsX7ot
zkat5jRB5TFmqri6OI~~FAD7t*>+j?HY2<hLrfl?g0=gK(;#yejU4b`g8GI-C&AIsA
z6PDcGHWKyEgq?-kkU=h8NI|@4t8fV}Uz)!(&E(>=9Afi@3+)Ss5PAT6A%a9zfbxei
zfgzY-m13@|Bpn{6T4!pec-_u2DzmsbPwKr|BF97bN+JjCX0R6Rii<xMh*XxwUR_c4
zw+bf*ylYj^37@448dkWmdFhrolQz&+e3zbrlHLjc*)YE97V$j*1`sU}m%a_c=anRv
zk-OkX02+Y+5s<Fh^ef;C!7gkI7=^j4KYx0@q!FxFPU7o53Db&3aO!ebPB2LKH<WN;
zddW@KFfBwz<#C(r;7O4w;USsCOe%#)h4@Ujz17WBHmfyep@O%yMX7gWKP%i){IR=8
z&@|&XlAp9j&&p1nHmppRxWDI+rs#yEWI!Ur8|Xy278QHs5b>U-I`9u3gD=_}!^h;o
z=DWe}eU0Ngn5OA7SCSq)l%+QqY5a6ezuoJu7A@HOvoUXZT*Ii$ts!lQ!33v9XaM`w
z^S7sp5?vkAY;w0=qTTb}jAz=Qa1f0!VE7WF>tUhgsm9Uy_v_+yoyIJCC<G&KUg<dc
z)4+zn^y)DB_)zC{b2|J|m3HKl&wU|K>=$NZ&1vxPhXnQg=eKIq4#eWSOb&#@kt1#m
zd=;r9AF7URC$hh8bVM2t-8$9;z)KiTorTaNwsir>@_KJI4_4L_^BBn;n&%?5QE95&
z$F867)1Bh<N`t8MC8{oXdTq4frvi#o<vK5#&l4njTzy=Hb*tP*qlMgc>86SD1~Pb<
zqP$IB>rN-P=*2iawc=tc<!%Alx_FB)UZz}oUH+J87RRwcHGgfofO3AuA^!o{Qf>WA
ze*)~0a=LPGcDs#>wE&v*lx@+AUnCF9V%@g*j1<$S&TEhwcDShT6#$YPkl_zfzN6XB
z!}72i&uFBzWV~F|dUKbLxlx$kxJH{=XlcQSNDV2O)|SteE)y{5;TL_#8;kS@5o^?j
zz8$-Ym?rjIxmkbMO(Tsn;Wy&*zBV&qze_&H6|`aJPJ-|>j+F)v>2i)c7-}}+Qe8#w
zvyadl%ipW$4ce{eQk;xU&%>l<iI+efwW2kZt&@mxV9^Tl`LN^+RHN3ND`=-rZW>0t
zw*zGLEstT{sz8MAf+P9H`ZzARTV;`=7>vAVkJ<o+k=0<hO*vSj-8xp)Uq&<!hUcs-
zO13)eqWfYhU{VzlB{N-L#)d02^`xE1{*gu#q$j{ZMzD0aE=qJoFG=lfX9_YeQU(!q
zMGrb@3{dZ`eeTy0UKKGn>US@;Os<3;@i6G2-U;hXQc+nKr?Qmlu-_`xcS`Cyj=Ru^
zIWg!U#8J*qA?aO0(TLS^wIEWoAU^XyDhFZmQPZ8!7kDw69!4AM*t>C^bRB!0vWIB|
zRWCftUU{D<UzNO|5suXi`&7zF3*z)jt3gCx#LB^VVoH)fraHgO$Bjc@`_6pk6&I(8
zFx8=QX>DjN1|+$Ti$;m-mLCwwj}51-t1g6gV8FJGJXB|F8e2vP5REoc>^W2v<2{A}
zD7hdof8L{d2S#N*xo4b);;k!E#%V;Q6KpV1try82mLA-$?v7THS-cdl4G+cDUIpfo
zT`Hu!a}vv>9(`e%c1D~3z{g@+A{raxD_6b15V#kKZeH_FeEIU$@u58bh8K`uC!qgg
zk5-Y{lp$9e2cus#pNR>@In6E)501bn#&^v?d6|XRAK!tIXcTD7W(RM@mQWnj?{0*W
zIU8B4O<U0{t6?`P@8{pu?xxZgajKX>;yW1O>(xi26YxHWT<L05*a<~)BIXH84VP%*
z@gjNSr?(2TxPr^LkHh-3=&lnQ1^Ag+*%5P;fsdG;Xp6oPWpJq_39X3N#a}LLEEhHJ
zOMN5HU0DYXtJbAIW#D(_KpP+Qb&*miu3FjS9>d-NA2XhpUHsAtqu;LXpzD17E#&E}
zD*1Cl>I=ne0*Mw7pRcSX<eYIW(|)xLm8{PW?@f-i=)C+NAJ4t{q1fClu@#W<_|>w8
zQtQP1t)K=pTOLNKZBgQ5=)~hUyTOm1e7^rN{B!P`JhpB_SaJ_KV=37Xy)LyI;G%aJ
z#WFY@odxTRR>d4l9L--%nUQ`I<aO{aESm};-AT=xr<(P4uamJ$3}IHv%z`%BuU|>~
z#724mm2U<jx5uI+0;7=9&J&EFu}qQEB0@$XDsa_j(VBi=A+AJ_1og?0i}x~{xLZ_T
zG}QbIJJ@hNR-Nva{92dsWb?cxdUm4b>%)e>bgkI%E>HeFBeo;vr@Xwu?^Y#w@4zYL
zJm0bQ1uENUt)-qbV`2@$=vgv#&^xX2G5a2`uGhzhVIXs_x$ou0YBNW)O5cd!zo1HU
zxILE2m3?!a=?;}dlU~`(#2>oWjn@<Nd@|GOA2oHr^T?mNR>YPw_VB$N_cwd)h|d?^
zen(cL4qkNp*vd*h`T#!OpDu{_(jpb{+VWZ?KQmsjNBT`D22^T15vwn<aWh><zl4)v
zz-aBV$8|eh3BAV#LVkB#t92(Aq7GV4W*up9tT~EqVp%t}?w|@G=`g<|p!>9Kq&eo3
z%N)(_j63IT${Hxu^+I<nhMG5?DVo(T4yOUbdBTC5#yD0Zu(++RSMm!6Ch&P}JEK=9
zZwb7{CV+QdhmLyQ6b6z392@A%FbfH@6Hepb<l8CcqnKw?<-_!*{UMZs9HRH}qz@z1
zPAK<m3{U6+HNoAT=+69ukQHvLa26;ziaj$Ay3RE%rR6YTmYw&I;-ty6RGyZIJSsPw
zf`@q0Z3xekLR>Af)FgvM3DFv>^XwKL)UFFOXWb2a-A(j8XxzID<BC`!^lG2Nh0=*a
zcL2hdAe1S*0_y}Oe@9`jZk2Ns^v`c|S#VfNJ2Sp39z5eHdUeu%Nn5#*SCL?SFa+i>
z%QP7RpM#gk+0Chiu^}<j`d%I;3*8}EL;(*E!3YSe2SV}osA7x<r3Rl{8?R6gFXts#
zj*AUFc^+f<BwrjmHY~i04;WKb^Dv3)I$`agUJ5_#0aGo24-ZQeNh4}%6xxIyO&z4Z
zLWZR>PdYjONF2{bN+WY$4tfM-<#%=7-8kz~gQzJr`3#NQd?rnn^1&ztn`m?6PNlmx
zXys(Zh-pHQr^+*a^K_#8^jTA<Xob7{&SyJ~D)=;DK)YI;<d?H_JzA6IxhG}wC(j`A
z+g{04Q^@Io2+SvVAv&V-y29Jh8uL2B{$=)G@jyY(vvqDLvh#!D<4*z#)pjaLCukgk
zc>96=3t$Ndh}Q*Szjagb>S@E*=dMk4I#YmzCbi$vlzB#ts*R4Bn?$o~+#Rc4f=*lO
zb2^zh9SfFV?w+@ST)4jMMtoy@SC6+fn%_EGd3Q#3n_a@FQ>{l=wn<Q^O;BTg3QN#=
zFTlbZf>R#VBG=(F^=q%}#4Abz`7@a$jqnx(5JEn~=WBu5*S9qy7mPb~z?2|K>CV&X
zf+3es1^Y8Pw&zW978sLJp$5^R!3(VE#On#?NraVar?oHk!e#5V#Se7VLbQd&yU#4G
zL@WyiE$DJNoZvs4W%MHRRv^Ko>@?exw@@X)TUw%FnX+}bh^<lb_+#Vpl{#E-JB93d
zzVJKclRfuz8ih=<Jg$Fo6s=hev&l}Jg|XMKBo%v!!gYp?7F3&~*!u5kkU#@#HkyaW
zUPNAA!96o|GDUmTCFP}iwH_zWHd4%#lW&A4D_ZnABJ%gU(F1o^LcJ_8IyWzgh%@QO
zuM6jDn1|I1n-KUA`5vMm7s=DPc_-odI??&{9=SGYVzndQGz3Q(pa!q@xV3HIcvKOz
zg3YK~b{;ILY$tQrrDW!vr6Y{l?Un-Aa~%RCz3@!(D^k-F#q5<UjycNymG^!CBuc&G
zZm$+RUoXz%rEFihHoU|(X2(J)Kv)xH-l^2t6TP33CK!H8ku!@k#5ltMQ~#{9{`R!T
z4(_=>h+X)-Dg@+^0G4b#Suljp&;bb=bvvYVzAsDT^eVqK4_1HQqdJLWJv?5P64$lB
zma#L7wVxaiSw7n?`%E!{t>dd$!C{pW?IzoTF7xV)&KA35VdoP`@#k@R+BqrkODB77
z-%(WSE(PA}4Bkwm9uKhNxSld*0=2mi@v`5>dZ25`Q?eKm(}}jq-=5T#6s^|W(dLS-
z?%Udoe^LJI8P3tDaD;d4A%%oYjqXC4o~U$`R*Ne?KhM<t?(ilrv=RS^tAzKmNW{g$
z7wOe1Kk{WIXT6KZCE`FY?nunuz3&RBngvnLHGOcZ)|DwgA>LE0A>J*tptI?3uc@x<
z5Dnt<(p4Yrg7sRc+g=pb(it~ecY6UA&F|(Q-Cwehd~a9t-XvK*4v6$WzL`}PWh^5I
zOaKb%y_Q|d9F>Vuw$<g*(#ePeU&-H6m8Ll5C5jN(eE&vri^b>J@|NkQ<i|Tba@(CA
zS9DO~EJE|TqFOo%+rVJv%+cDd@hjHvnk26dcaLk_VrxV4CVilO(y4MNxfgSJ5L&!f
z(=&SWvXL5CaK7t6usl$Lf>#{RxyOkPxTpClYq!2eGY)_BCX2Zacjc&Sau%kkGfdgy
zs)nLHklc<BmH^+1220f*)PI!9p5bA}GmQ%Hs#T8D3vw=ev{{v!e)GVY_O#kiw}A&j
z#;a^>-pX#xQBArNN<R#Kx$W70pCJ_jmGjT~p|cP#HfW5i@Wv~L9gD)HU%}F)S+hU^
zEZx+L5A-id3i?Y?mpz|wfP)U~pqFJ>ugQ3S1#1)Py6)?uH;3w;&gM))90<`GnP<(*
z?`T%nt;|dSj)~#y!#r@44R75u#p8^V`siqoP*S?0S~)BCmC1J(q2DEWZ!D*?F-Upi
zubw*@SZos}FfQ9T5j{ZBr&up^Z+w5*UpVrLNqv-9W39ypr{yW9>1Sh56tL=CC)LyL
zLSnr{pEYE~U-IoIIU78q{xBv*Pqa~%jKJ8&0hvG7%L<J^F9*nNq)y$|la=~xjPjk7
z=0lp@E<2B7la~-A=zNF<NvgeEz9X(sAg7vf-lqxTRMz0ic6@V<QwsE~0d3F0#xWqT
zlrY%TqtQpt_x<V92z?FHdCf;7s<}4m5A^xNtaX&+hc*EWn@g^Z4Q{Z{PG$qN+bPD4
z^_+TzV@aP}YdaZ;IZjqr4<cajY`FrpZY?odBOyzbGK^7(<mFx&!L!<S+B#gLmyI$f
z-e=8ViVJiTd(<-T&u9#*XJo@!Y&01a;O3&3#;eDZb*3Rx#(AU&g`kqnPdw?3PV{LZ
z@p>kMW)All?fFKybaX_r3F&LxuBX9LC=S<nJ*Nj>irV<N0U5eTT{h)T>jsGFcM3gI
zd1L=ZLvA=n7R11(@zgQQHW6Z;IxZz{cQp$n6{mei_;`y_DB0q3<9WKETyL-81m^2w
z4x6JoG5|}Fp~je-tcKoRo3@ks0mRcUoqR4V(PRf}`ew%0fH|~Ib9N|l5M32WaG@dH
zfO`{aUSLi_*A=C2fl>r{n4&YiAiGuGO6Zrj?!lYUAd8n2k7<)xmzFIOdsL;hg{#4b
zFraI(+h&ZuZe6s-t4658_%j@TxX^IuJ*C6R+mY+tH#~L1=Jc*`U&9$b3Y7b1gW9`#
z0ft;1SLMU8mg=}ZI*|~1%7_Upt-kl;HU(Vo))@4murg4$LC^8qQ%|=bJE<>eRu7#r
z(~T#CJ?E?v9z8UEc!FWq#R<l9{f4sZ3PFA-$Ov}anfe{<A@Txr8-jJ^ojjpWUkg;<
z2VZf7Kdd(vF#;}`+npOz{Ai|<DW!7Z%(&EUl2Id#WSh0kAt_7ur12;w=OI2<7nJuo
zI<Id(uVdd0BE)^@zBvRoewiKk5Np*2=PsqN;<w9$?BAKkGc}SJjex@N&}%Z<3Ye#;
z4*==n9_PM?n$4n-O<I?1uDi&!mgru;e*`!>t$MQ*bGIQnze6?uZD@X<D)sxX?{X+0
zu8xwDc-A}suXnT2^nq+hGh4WB9AnT)t1l5%-)bBc&woRm1AjR`CvWl5Dq${I_FdDZ
z&rPAn!4{-!Wm1#5vb*LIaI%R^Nh4j?(=UUMuNlct>OKvK5-mv@385)#jy@IQTHa#!
zVXqwbz6cu<1D=TeI1BB$6)Dh?@V2Kg3@inpV5M=i(Yu*ookKX8ZLi&?N$qHa`C_C-
z@#87UHtAcH#8dZsjNI}$ecx4Xz-{QO@sTll^unhoZ<c8S9vkI_bXvxjQ^Y8r#Rc7k
zh`a2W-6L2yH|MRi#V_A*{dP!m7&eOJLzF6ISvj84%g}TX656DB{=Iwhf$mi5!@4<i
zqOO05rmFBxh;TNA_>!_vDWTMU@9s6*gd6+8W7gS^C~{(>b4psWJoilxvoJtAw&+d{
zTO2avvS|qK%~~AiS9MOVeUF_a&mGLI>ErLGCeGH}i*iwWLcR@7`B*wl<@Yl6N49=W
zS8jA42jU|Wp7Q|AZM$!KmXO<dV&lTzMqfnVN7nvF`c4ZVcp**F93zs`(q>o1_yTTZ
zt(&$Qj4)%WY&bN!`b2XztnMR;;{eYIQa9aheSl~6{!;giZ#@2T1OxQhSHp0zah+4_
zj+XuY`J^9%CteNT8aQ1aNv{Q}yQaL{(Gw4b)Nt)>6Fz+_$<*}LJcQ$xEa#w+wN6?W
zR~Y#urPx;TVJnPC?j)gY_nx>_o*p(f-O$c!9yuLWL1r%+Lnlf#!al!w6536F!OG0H
z@%8p2ojH>n*WG-gV21fAy^2y)mqXt%#_GOvOYoNiW?zRo&w-l?H(31alLcpLcV1e~
zX*<00GIH@r@1MAgIAZpUvj0dzzD>yYuafo|CF@*SJs0a2Rb7OZ+Rm<ht>_T9J5vA3
z8d}epl*mzFHuHec6yYK57;~HD>kHMavb?x&p#)<+kL^&EI%o!4v&6yh;F*cb=8D-S
zD_<Txa$<>;mzPVSs^GWi{h@r6725Uv>lWLsTbI7uIq$Abc|N*UVE1--llZVEvEbSF
z8%N*wzkMsPOK>x59W1!3@s7Z=^0mwB#9NyIuafri&#{bYhddR6nbHRYo=AV5u7_4o
z^hVyLo~~%5pQ014J1K5-S=ngXYbE;F%Eq`Xy9)6=weMv3A-w;GU<vMKZ}v2f@{x@S
zj?%$mTUsaS|0D0N!<zixKHzU-urU~HG>jN2-6G9KiAX7mh#)0Ory>Tp(cL1clt@Sj
zsFXC)C0$aI(iot^o}u5a-}iUl_j4T2aXf$R@2hs5*XMJd?^h~qP;sNJS5C&0-0UrX
zjy*)7R8)B*PasNtC%lF>xL!RJp`m6K#1XugTSjkd+{z&{c!ic*vRg5v-KW+8AAD<)
z(*3EubFN#^6ZuSh&MQ4!c7WF+XJ!D4ibDgR(6bNMl9)WvT&M5lo{Opyo=aZCrtSrM
zKupC|b&X(_g~tcaM5xEY&m9k==(j*l;mHM@0Y;-&?wfhm?Pzluh*t5OHQ?H=siu(b
z(6km-fKO{XJs*B}7k-BBydv!Qknx=m@uqKMz=YS!>TzSY*IzN3mn;g2$oOj0%$F0G
z7RR(7;r+%LpZFkN*v<Mr7Zf!w`4S?=ulNzU1jeciFg=~9@5mfZr+izY_Qi3BDJy{c
zGIQaL<txmKi2>dB&)Gh3+-Vo!z5OxBSjwtYOKBuNvsY3?ou>~=p;SIecVbRDo)*fM
z7$r*LCX~tM+?G$JupQ65R?>1+j!PgK!=)f|mL+AqWOT2Ag2iM(f_|mu3vZa_#M_k3
z+5=6xh2$@1Dhgsg&dM&Nuu{S15>fh-IWdHXsXHB=U-(>`MLwfAt{e<7ZHGM1Z{6+I
zRbl&R^KoC(rnFqZ^JI$ABNsOHIbH9q!5h<QpWk}lbm>fq4&V7a7op-K?6${$AWU#V
zU;N6q5VL;l;cY%5{`Ww_J}80>6vMi|)xz=UZh~JO`S{L|IpMmu50d18=T`qo7E{|<
z?#p*wvHmgUiy1b|(e=$vI75iuj2(N1amwM|XNu1a`aW|Q_0X%l5g0TV-<(#9WRB{y
z`v<<%<4wWJvX;nC-*qiZ-C^SFg9V7exgWxnulmep5DU9|Du7WH`|Lv@A{g6z;kY|L
zsZ3ucd*U7t1v<m5r^U(BDa63_4iIunT$QSBuSJ6<k>;+VM5y{C9%&bYksH+3;79sN
z`#d9&K>NZucl%HHG(d^vFzve5jJqNqTvH26$<d&}cGgmy^s;(z$hmg}E`ba1CSoAO
zT>Y$AHYU!z4?y!cT1(Jpi$W~>T~IjP0{_Q>D4XzE#@!SMPfZDxQ=h7ajgAIeIcI=D
z7dO3oB7}>W=jV3=$^ER^hD|4=V?POo)OZ6C@#4nnd;^j9A|TvWt=y(`?;#i4I)_Yr
zLvHtF3SOW+$={6WIT!yfI{Vy`{8-Xcd#z^fi_v88xlH(~I9~3OsxRZ&h9C!IaT<``
z_Ck5TP-KOxe@k?uJWTbpgsmEf#D|j#sxhRud^GV)XZY2wfslSy*`6AL!Iu{CA@Vcp
zQi-{X#77@u;?)qR@J&O7EDt{1MdB|gcnr0NdvcwME*DF0Z+w?<KcJEFDYsZirzB4)
ziE7TAX9nx)xgmj57wLtwm|`?>uG=JXbmv$*!(nRA8z7n%(!7@rG%jdZ4}tc%vr#6w
zGSHAWu|<O_74_;839T$*iVMtExBxnL^)Pwitk}m;Qqev;)qG`!QjCZoQm%n5larI~
z{U~0&hlCNT!BC$0ZH_v-KKS;PA&zaY^9-xRQNz$1Y&ZB57~RiNYfV~E4jHUd8CS>j
zComLE(VlX=g#pVoHx&uOV=spxp((YSsfieWnbPRcLhV_UBSsxOzdO)J)U~j}`7(>l
zBrJ*n3`BL9kH<HPn|I}!I&AaqncS!wB}JI8jX|=M=VJ+L%h?j51wpSpC8@FNFYCB#
zTs%D+E!={$c>IN;A;eA@J&WF)&Wgp{t1O`$!e^+c8Ay;mxM2MK%xe{WtlmUjYv)vC
zW3<P1xE-qumORvI&w~HT;u8t)a_f3IJF|!o(<|H@%<ZR)c4CtzuN+fh?l_aM6Q5^l
zBV^9pd2x6rp>onj>>hKMCBtrFyXjS_N6g)JM!U&llUGmFG55G7?53`mUQ?K6?!7g<
z`*45qnhJrr56|!+o!pFg6R`A$7=6fOp0Yiu!ty32;X}57ncZn~mVu<<4>@vEcKY{N
z1~V8w=AJUMH+;l0lxOrY|KgPWg*ukuX9*vl+L<|AnkKM}R1SYEx;5osPGA{rVE9xL
zV&-Vgff{Q!`c#@U<#<g6HQt}_sXWijiMWzIF*f|^Mdg%}%RSWOEW_uDb~9&>N2sY4
zqt8`iQ_eT*P;a*rKG&?6x!jpXP45qXuHBz<xko?|VWqu#^2@G%9IUhC7xo&N-?|2=
zu+AYL>@^Eqb_+9Soo61|doB0YE$ZIn{9C4gWA1o(^dr-W59vXt6t@HTYrZXb8V8&@
z7wMjI0>x|>+(=}-B4pGXV4g>;7cl4nBa!tQRi#@q2uo3!8r^ceMK_Lvr+v;~B(h%Z
zMAqvOBNvMy0W^|v`IEU2XtAI~jqVFBM%kDXMj*Og!}pZk6Yn&x-P$}po)sNv`(X-o
zXspncB~Em`tdCr;!KI>`t@Bk3VxRrFVVhBPw6&W|8F$6N+wM&+q(s;2q^_#Um!c!r
zt3FsUn&^7@vx~fg9;}@vp2yuLmExcv-ODO>+;iDQsy;(j@lmvM6X1^-MAqvY$(?($
zgzf&~5XJDzVKT-IOs87Eb&^Dd^Yeq~yv_HGOb_>GJ*I`cgH=B@NCZ6iJhvc3)j1>a
z$b0l#>e|<Bp9u%hy+)UY!!9nyOu)*Z7{H|w;G}v0?WO9oRQWQyurbR%r~gIJ^&<?3
zszt-aRheG6P#E=~MvEAti-a_Z$KO`ZV>An{v!eS_|BkB|9zDzc1%v3bqGxSD&h${Z
zif?U*!FKdjKK1g=^uky(5DB6%onm3K62OSQ5KRf+AT<>$7BLw`>AI<e7Kd$ca@h8P
zL=fyomfPbN3(J<P7LkPd1{fHKx?LpHHoH&{<o0o1{Dx&xw4{I6$FY&Y5DsKk1fs$-
z7-oQ|>=K5(42IN5l5GR({XS}7468jSi|^c0sWbK0Eo$9JYNZT@jRqc>XS8l}OW~Xh
zidZHcE{<p*omLM|V>AuMl16uqYPW<Si#*)x<sk;diO;c5ihVunM(=@Vlt3a5fb8xK
zw3_($iG3XD2JbMO076C|&!9eX7Pvu&q*Fq2?*W+|@T|&i40ZiHC6;uWKvpgUGR>L8
zK7+BbkJhT6W7(2k5y)K9fU0wy*PC6+M6--rP<(LRw&<bq?B$rzN03FYVDLh#Jxu1#
zpJDi|QYtp63q55YEz|{+g)u<WEb_#1DU^_DNWg^MxCZoAEjB1TH+jrOd0nhHEF)>e
zeGfA&Ha3787J5tvc<yOxZqJ<sS0wlK7)I|iTTqt`?VSZ9Ap0csB3}$MZ66`BXFXLM
zmW4q+ciAwK-0&3RxK6bg-N4lA$|L9cl}G$=d3M414fzU?T!Dr|qKJdMm^2H+DFI@)
z$J1=}@DLhZc9;<CE?f+AJsh9`Dq)wU65!zr9EbK<Bw0UT7Ee=4%_>>Sap+8e@K|El
zU0|VQuffw4z2Or?ax-}#1oRPY_#LY^(r2V#R+7?rJt!_Q*p*(YFBtZjO^R=vJ8LuS
znHki24dP-_68oIslQgI{+<G8l8P-6R;0${QWVPRwA&ryXl!O~$+53979=acV0&Z9V
zS))B@9=iz^pCzU6IBqz=p(74ob0Zz;p~{@)dNjb1(1UElb9bNR?w5oq0@(+}_{1dP
zH9$_0Z4n`7zN8|O7(L>pMt-TM0^?~)iOyN?l6bMWpDKIB=8}Jm67BXvTL#Z_2_Qiq
zFZx;hQ2CsUhBWAvs&ualg#<_rB_(;nRdZW%*9b`EIf(MnLp~7w`Uy+_xnDfX0`?`H
z;hesP+I7GLfV+{JpMqw$79f0p)xzSnPL|WN4Jset6(VL?vn=TC8<wv|DyH-c8b+^t
zo7Hrn(|sQ;G>_m;&|}&g0EQW=e8sC=h-4lqqKX;7P+y;`p;>$iK+TkikVjF57a<y{
zcV!HOhMj>*+g$S-6rw{YZFiQmK6Uz7Ng*Oyb>7hIy0GOS&x|un^#;kA^XH#$F3j!F
z9c0kxyHm)E!NfBeqNNtU0ne!oq0U7UxWu$)qbS?(tgpp{Z}u4J-WSg6Stbw{^q%2)
z)rPiu;#qW6l`eifd!j_`NwJ2_ahN-h{j&21nd=k+aVl=qhtbaKbp6Yq^9J0J29_Jr
zv^T!;6f>^j1k9<<`f&-Wz4;2GMP^~83M~xFiVe@4<0cvAAbVk<YsK*ni!v)cckGRY
z1ZX`qlGUAaOLCY)MrNyxlST6ryH63Hc@aF0mdfS0OxCO@TdXD9Fq5bA2YDCcEDJ^_
zkg>|Ag`Q2T1MHGwJm0H$K>r}qUc*5mHM2i{|LJjE>dl4vH`dr;j=o5&-v&GJ%(i}n
z>~q>b{$Sc$dhIdYicUH8o~6y~@yi^}ms8F%tqqaTb21uXMZVG>lZ+K4?9Lt=Du#b)
zu%aI3ph=MYn6SP#?1I;0$U^f7B=8^~2p8gLqG@Fn5bnGWtnzvm+R`~_Jm_lNIpkd_
zH1Rvq4_v?2yY5=9ys+SKk-7HOWl8??!lzjmiOk(K0No7LO6|F0`r?vV7^<{kSnUko
zev~`+2^em7=M6y4`VBZq4{}^=(Lz*zUy48Mh3wE-r;!)4nwIocBX^W6_uDwJ);&x;
zu5|Vdcgzfh&~IR&o3i)ZKVKcOJ;0JG-3LuSSf3klTQ_j?Yh1QE??b}4@dD$mZ;2av
z$>+1-slSEV&p=ETBbwuUZuG$DG9cS8siBhS!Wk|X88wGSJg2cDVPOOnPUVig381(1
zxfX41J!Cgf3fIJv!@ZUUPcV{=BFo+AbM%nq+w6|_X-q}+rAlv~GGO`^Lo+C5^!&tp
z8wO#|$%p}}Qs8MafviSA&WOQpU32WAQDLu)RidBsH5&`Hd2!SyGHx<Nv@;3!R0#3C
z5ZVJqcKb%mBabaxwp1Al-=39P+JYp>&S&3{!*Vk8jnMiOQD<UB3e%}vM05t~7hYh<
zft7RM{mTQ+bf50Wc!&`914$^btO8?m!uzo|^_Y@BFBllaUtk`f8oF-IoS=IXJwm&f
zlOB1I`GJxX-AvK8``80DIJ@fpgP^3uu(8A_=A^ibN!`92gyemt5?7)0O1@8c^mEnZ
z2h1rkT@IE-s}}Q{`O^F!jKpsB8`S}%9jrhv_qK3SDHD|~H80@ymUJ)bVTsftwYP+t
zEBQbJw6`<hITn$(p6%FM!L<6)s99=i62R9y7n^Uw)-bFw8PqT8k($(OZ$;r&9}OnZ
zk_|M>ZS^o%1MO@BvbG-FdP|%_Eb$JO{nM<xi2gQTG}!>gmh%Kl+st}&Lk1@c_oCc&
zBunnlsf-IQwiFGi?G_{_%Bjyq(|nqxQ2o3F+N5YhU&sP5f8kuVw}hSZfC-kW^fQxB
zpx=L}Bza~DV!n9LH@o=;z+AIQ!H;DRm%nggi<NDbi|{};ch@91u!>VCd38_}cG-xE
zsC;GLSX6bTQ|(*fD*gy{4XOhaIBc<=8RyvHWP|}XqVZ4fxq@Ou!PX5NuyKwWeWs5u
z-~bf6o(buli^Z2N1?-J~Es0z0aHD&NB_-)aK_y_AJEdv{Ow1@AyA%%9<ZEZDmR&bD
zG1y0tzNdAY`<@ErF+E@T+|;ZqSQj`Y1u|I6MxIxv+^zW}zcdCj(!1qNOO<=k4N{U>
zh@*7J9`LzQ*qSU|F>q@V<)d$aX>JvGoN;roT-WP|ed}3HR;c6LK^3O2=AgJcs;PS>
zzG`MLzQ9$#N@<L`mV)o0st_g7?>n@gUByKE66htC=tlBy&~A*^1KY6&^3;#_fppPv
zeiEvrBhh7JJuojS>m<DfYB7(pC=Pz2GEvzW^vxf{5`OF!$_3OOlls|FwJq)&t)Ero
z*V*=v$&O;y&N9<ZBCS<D*-1=-Xfo|;P3`KO?CNFh9x&}5N$sAP>?Q^c&ztrvrS`m^
z?Ac`P-8Jp~oZ9<!vX{WxM`G3oN$aDS>Z4}sr#0(mOzTHY^>eVj;Wm47EbWcZ)EhCj
z0V%VA6KMkqQv)h&gKB1jC({N`PYvp`4H=pZT}T_cG&Q6##b(9EZIw2BfFHJ*8YW6v
z4&Ea+2g6gA!?zAb?y!x9OmQS<Fo$}N5`v~ilf1`nyc+R)HJoNP5@R-YBW?T%+xR21
z(Q31aS7yV7X5-%86VF~v*0GKBrcE}mjkYLF6thjudQS~ZO*VK>;-}c6Uome?ji#7Q
zZJSN)A52XsjeR|shS$DbQF_~IHgoG>Xo>{P<%9fYNyfzvzFN=0&@hL^(0{X>e^AfS
zVKJY=$tF`v`OT7CMw#uL<@~YQId1m(<8S8_4(F9F&k4Mpv-X*{dpn1{{7&TIJ6-mL
z^A8t9-Y$43&)<Bz$j$yPf_=$SdF7hV3buafWbHeV!*_;n=PuMPJUX1qQl7i@aOJ__
za>nJwCZE*;_T^&bxw41L)rSjphih`m>jbC6ck}GvZyC$|KJzzx)*TL)xRu$GvCGeu
z=RVfH|H{7Bd3obL`&MD?*7Vzz`L~<<wM*-7-|zZtu3X+;QeGBQ*}__EaZk@7r&ko}
zK5(!T4~*;shAk9BW>p6r<fOGy`6Pv9b2KNb!mxe7e7@Gee0}<3HRf|##wVxgkCx`2
z?94yAO@9hQQw?%L+|!{fShk{cXej|Uh^H%6`Fd*h<13XfsD`g$7{=6$Z-pvU9n;KJ
z(_afYzCM5SwUgspr^=Tnbzh37zrLJ4s8jg{%+!jJU1cGs%k3O%;EEV*xwsrY*cf<$
z>hhUm+h~Cs6y%F-4F+Z!ct$DM<mj^*0&z)@O;wuN{Yp$M#ToVwiGFjc;m74n-rb5`
z(7g{yTe08YLL1=Wj0xYEc8}?#fXG=W^S3OTvO(N0;!hc7_2#cCubvY;6F9E3I+!n#
zDH?Z)xh%DNJyWmO^jg{C>X{K6XVW^TsmA*hApg3SaFl`%rCjN|_IRO7wc&DQi`}UT
zcMd7#iMm$y=@jJ%`QwYtt0vVxaD^9ZW91GLwGj$0H>PUtd_9CKR&32ShoMv=73DUY
z^HUV=Q7Kh@_@QeZ+$y`+QGJI%rChVO{jM`bCF(NU?%LW!^*w5p+Hd<GGF<edRO$|E
zLa@2~)_N`)Z8HdHPxDnOs8=N+=j1)XX5@@3hnxD055wi)443yqt(HOTK2WP*uE=F-
z2j+*tnXd4JjFVL8k`@#K{Mr)j3#--S4m*i6AakRYvC;}vrMhLwXdfMXC01Ls{Yu=a
zWUVXlXKRPkMOV8T=kK4)MUz|-5#{ugiU4G&Qq|{jTjL?CyngJ9JQWrW(hu$QsCdC`
zIVr1vrT~i5sd<r{aut0VMD8o=0<+{hKq3u(F+GSv&NV2PQrq-db9}P%YD(NgADDe^
zW@HC*eCoqcOFy?|AQ-B<kewiJg9E5D_T;(-aGuCHl_gb=b8UH=R3E|(#d!jKCF{t(
zT3vKXu+!s4vo?@IBee+=q^03I@`Xi7Rs|yYbCK^&kf)<VovT)hIydg-#8SB2g7f95
zG6LP>PB99`qYIuD3Rt(%3}?z^;iZf6(a(yy$5=}1Stl(R>&WuLGc+didLk$JGa6HP
z9WQMqi2^brX>KMPUab+-ue7Wdt)ukllC;jzOck15GxIA`&yAFmQXI9fn_Sy}#wjS<
zQ7F~sc}9~tf?xPaoekci=Z)?OUz_N9fHhST5SH4Vp!6j5`b8e|Z&y2Hi_<JSrRv}}
zC*9+g^`<<hyFK5wo!?KELVpt=87iaFg+XuAQC)bGghK?GHodJ7kGc)j>6?qVX&0HD
z^bYMOC&zLY)c%HxKv|l6b$6tN9xa}K^ZiPt(#^HfUcEaW-NKS;_o_Cj9=xypI*d*)
zx_?HMT!Tr$tG7^ld>dz<oK^LF5@TjzB^oaw{UJmE>s26E^Tvabw=X|jek`|^Kda~S
zZTS<Y<I|fn>w3l5*PegZwNzfTZJ@hI>u>hE;Hs0@ok|<Z#uBY<UtL5yGA*+}YRP<G
zNT@T?xJ!fV5pq2hO@~LiR!1T8K}-YN6^Tf?eAj?^#0;6a7RD@`8q7NirF7Xt3481N
zE3RcwtMQ5>puhlOVJnzfa1+m}2&&jCAR`{CF}b{<r9#xTirX^KMvcLyj-1e<?7R~;
zYRny8ggEBj;MdamZV`@-S*UJ_*OIkvk=LJQq2_H{6<41{dQE0=5E3;dLGF>o%<q`L
zR%mj{Szo@d)kQOjZ_y&^T5phvl)<AdTrf-4h&9m7;Opu02ZeEuSkLmao$BCEbB~7!
zKIW2p^XU4OOlZ;Fh3#_&BKr9>2_Z4OB9F^Ebosblmol>@qC#|f!4h#@j#sRz;<+l@
z(plU4R3&9EsxqZ%B@dSK$vn#IrgSSy9=X0qXbj14yY0cM>Xp;ooR{Ft*Oc0)9wT4e
zu6Gl*@=%bK51O0Ug@avB598#7inr^C_LQY{7?_A`msMQjy3R_Wo1i8}*H6$b&x8*>
z4j@S0KE>evA(KO7R#T{7k7S!Sjn8aWOR0(@`l0mW9%BK`OD5_Ud2*P+>v{UTN!22J
z(i!a-%jZ`B1G`;~mm}zW4I+#O-B^$3Endu*Oa3y*rFkQtnm6kFv+<U~!>Ig){d`23
zNwfAOHXpsm>ywa7RiZkSYrVee)wMdPlYhU^S(n;$p`%5!XXc5&$Wy5Kc3lQh@@m%-
zfUbREYi5;Z-s8!)=6uiA-r-vs>g0G&e1fgp-81*0E~V{#?(q)34^+I0(YMZ?9`Aez
zc@b)}E@gI!ef;X1vM}+dF85AXPwHNO)@5od_rXeNi<Li<kH=Z%%x%-`xfcqZ-isz_
zrwM14xo%c<<ZTd&-kZ)lU#N6@ChA!x1ZHlFecHb5?9o(Uwi5fGa)x(9btt8HfU5P?
zN8MZtJjD#4vx_Z6uGr)GjNS&rwLG+!hIPNa1vu(_L$hUx->&@(y|!^}`?D=SV#6s|
zsI`fSZ2LILh|$59z-Gkjjlj4G%PVFTEwgNp(66Da4Av)@73fQ%?u8c}eq?M;ir3KY
zmY|@Y&k;Mwa0`q`W#SRqm(kG+kAqX%<nxZno+oR#-<x71;KAH-nXlBy>1&ICVN#d5
zr*q=V8Vi|}i`lkh^NA^xbDki&w!0f;v4aMSa&e!MTh;PI2Q$K(ZLxg@ydR9I(`*q0
z;pBd<8|4{(yAQPVliwVae^9s+XQ$yY{`mgr9B#BAMT6^0b=K9VPdG(ZjjoLhYMqyI
zJeRio*|#F*&Zn~Cds7*cc}Bx_x^{`T%i5Y<@o~*pIkjEF)^3SZcl-K$BJew=T=BCQ
z@4lSzJgOVz<WW5#c-?W+tI6V2lyybnq09>hZs)6U3IU6kB}xaoH+FZtO6oUW*3EOT
z-9jNBn`l884cJh^yjO!kpI;zgKCbjarosEpG7a!Z*HN9+S-Ade3-`m6hzqHs?G_@8
zZ!&`P2l%qyJMOhg9kRsSOnt_8va;h^(~c$Wt!ctWWpA<JOcLsu|Gfq|vt&-c1PU`k
zfV%m9e_WAA#)+xrGECK*2OBK}dNUdKJo&+A8}?$uw`JOEx1t{(b``efyf=!v-6Z#3
zuR7t?vulsa4tyd%*F4}`wz#%drT|$Q?m8XpJ+eC8(v^PbSh|(%d~C){Zm&h^?Plc3
zni+bPTR|#@Yy;;_?yc5-2vvTlo!DE`8qvL9JB0$LGk%!*NcDBpC2%wR(J|Q28&ajg
z>$8IlRqIaS=cc}{Kg~Jzaow-(&K%?PW^1qa&gq(Ou|({vVx&n}di_%^q4rDf=Bv$3
z@q<-!^Zv1GAKu$U9ey|&_$jIQ>b(T-pq-cIjT7uAzdfKn|E0<NFz#ku>3Z+IgC*mz
zMS{1*(!Gy2@9jM~Pr~oA>*=!!!LPRZ<h(Q>9lghIgMS``hgDo60$XPOXE{IO10mkr
z%dT9buGCC;A?O`i+wZy-zn_$r-|@s#L}N>C*@M{3rnKy*0`<r8`!5Cf$=mwZzxGqh
z^*`Nqq-(`p@IT2Pa5uqU-}Xq?x|kb4P9I>n8~`*5xWpf5trciv>}R$YU}tM=X&dOY
z9OwcKVhaki*9uZ<33Lk%x|JJrC)e1+IOtxY&ds(UKds<^<v<^3aER<FU)$h_<>06a
z|KQx<I9rWyXvl-$kR)5*Sgnw>HnoJ@kPQCNtYFWFwxJ->(CpmMg0@i4Cj_P^(6HC>
zp@mvu&uzm@n?s)EhLuW%y<85fs|c;E2y23#cm)k_4Gxdy4{vS@7q<>?heq`026c{x
z4^@cv@<)v2MqJT~7+#LZ@{O3_kDOojpW2I9S{9hqiqr{)AQ3=^dX0pcNMj3iMg-Bf
zf(u^(A}xULWh07%BZ15(R+ppHf=P+vl$!M#4rl;i3#2Ix0Eh#;N>mdNF(d}jUbd0M
zuPkoWXl8PMNK!Nfa}4!GbtF09AXk+O7tKT->rxTJCJ@KI6C*a}$CVeYSx&}F9wRbF
zDNqjQUx}5m3zU$HJGml?#>6`Z$MLL0D+$DG$x`9a@ux4w140P#7X<{5+ufHOjhAna
zJ0=iAq`w5N0HFdgX6+HidH0=GcueyW#P;rMl*j1{B#4kxcH?60m>*oSjdvzb90We_
z-p6~itKP7S750yX+kq8M0YpwEn(RHmpGxYLNQ?=&7g(tpJQl}*i1~^Bs(+AZ7eHKm
z$O~b4V3(ZpBuTJ2$!Y~ihmJvxkz~se`=R`E^O9f5u{_O73ICidK$j9ql)rEgRXK_Z
z=G29@gj({nEnsRlxo49cRZFERas`MDi6+WlU8mAw_EP&#Jsgurn-#b|9FiuOo%Tci
z`T%{nEZ|>r@!@AX=A~1Q;KyR=wm^jaM`te*9v}hfKzXY5N;rA4>TcyD728L9<Qeau
z#KT$qxk3_b^I~t@%79)>SZ`OQ)XtFEOGj#FhG#tD9Cw7s0fag-LD3n{+cSl<f1<xM
z-T{O{GnHjCd9^c-Rb^pWB9vCM5U_03(Cm7xY>nHGP9|sTn}nV2$bPqyZD9X6pZ~ET
zEbaX5$7cB<7xN##YJYrLJ0}X7W0{<6ZIa`l9egb`Cq6I7QSiyF<s27SqMQ7aTepMf
z?VfmRGkfJf!OI8USbcJlJl8ig*H|kz;C6gaa&A;r%H59KxGJVdSl$DZN3q&@;r4ln
zt9eQlxhaCtX<zal3;JaU<}YjI=X4PAxr6ibzC;v^=a*I8Ert~g^B0uo7ldCccsU+k
zSyj+bb^X<9K{NDeW9U=R$)_z<VXeted$k=qJDxsUe%fbW7|&NYa65G9cHxxvm9hN7
zhi!##wTnhci)OV$=1q#;%b!~cEed6FT@x%;YV+9qk^_=*-_0+E<r=nJDYg_8FML@{
z;&A)v&?N#(PVjR(aA(Qhh+Z+S#8TTrvaf{xQb97yGlZZxg~Kzp>g!L39GKr{@$irU
zm!BQ$v{T|MHG$c(hLws5Ioy6xN|V9_q9{AzV9^6UB~|d4Cj~D{QBK4{(e;LksGNhQ
z+t`BgC7VkKhjQD{a@LpShA1O}1wy%gSPt3!>-*ZzPu#(2ggtjzrPBJUVq!pEihE&K
z@WP?<1rgP9p?K*g^wQ(>%Nq_aZ-%|RRq*mo=S%PRFYi%Q;DsvuPFMI`vcHMB%87bm
zyGmt`P(LK8j1j7gJ6(C-q4GgkWl}+9N@r!-`^rZYRT)B6S*NQWJ5)Uht4dHHu`ekL
zQ^?!cf<;z?%T8B6cc^|DR$ZRLMA1<F>V0)&d^Islv?;8*`h9h4XLbGQn$FIe=MFV(
z6t6laY6eg>y%ew7gkB96yee~eHS)FkUfHYJOV#tV@^2@qMdvu?P_^$Uz>A&L%LSmp
z0y6s&sKxuL&tI8Bww+&OxGwH%)VUFIw0Ja_QdmHW^}ZLmg~)Ou?l@IvxE>0!QBpc{
zE@|yKG-Ssp&^|>`uhrEf>j?#%;F@IeNz{P?8*@!vSwq7JXM?~Ri;yXsh)%;jkA~x{
zERr=1^lNqYPf(fuY-En8i=mCYPn(dGwk$d}8eNSi*BZqg*<?*odX7zoHOvNGb=r5?
z$Xc3Sa%z7HtG^VEQf6(^S*tf@Wiw)Jx%#d7iVo^*&1?ANYkQp*4@YKOVU%-fO9=3F
zS%1q|MoUe9t4nyZn@-bd%2qqmwhhbHLVT-lxKo5qYm6du*tbUa)Yd@S*Mjd`Z%;NQ
zueF^@Z3|RvlepHN`P3r%TRY1ILPu;@M-;X__ip<gQ_+Vt?TKA2<*6NlH67QwUX#D<
zth~!xr^9AM*;(k=6>izu!rEDmY}?#!ecs=-w%yT4$=0sZZB5zQk=ikSx9hb|7g5pb
zr9}0wb)|N-R;02Gvv!0|b~e=X?DjWKuC?t<b{B>>eQ;!(n`C)M$?-+8Q=OuBJ-m0Q
z>orM4_W`isV?#aEtQT&^yiM6N%GvXcmE%ySe=W5e>C`-Owa?{S4-9V0vEIiW(ZyNV
zPt)DbXx6{jb^5X}2SVh{*0a825o{5iE}T{aJcR=>&-%#WTx3HWqGlZTp1zTEdLzNc
zp_Il`D8!}nYC!)LlUy1PMuafP3L0G2;n0p4uy-9WSRV>p801k^JwL^HPKoR6)S!9c
zu%*JV7R|5&e8f#;#6x%FhSSK+h>=@`BX_z-yw^wW!AJ2Tqkg)h0ZyYq5u+i6qhZ~n
z5$mH-@G;_BC{B0mzSG!)h_R%?v6SwywDqw^@bL_h@hsi($4=u<BF6Iy#|yg03)jbs
z;S<k9Cdzato;yvvjF_k_oT%=ec(p!J2cK*ZnQYRXY;l@wjhJjNob2qL>|USjg-`X1
zObzHx4LMB_(?-V%rzX0mrq-vX;csU}-p=d3U2uB46!CVY@a_BVx9jU~H{sLUBGbFN
z(;uCtKSxaO7fyfeo<3M7OcUTUK+zczy%|#H8OZ<dbgj4lH@enH<oa0A`b5wA)W-TW
z)yAyo#=PFfg7d~w<i<+T#`~U)^^J{9s?BZD&0W3CkItK)BRBVpHox|49&Bt9sJ4J&
zTO|5hq%K>Ks4ep1EsEYP_~sTh^)^y$n^u3D-esFHYMZ%u8`Znbwz<tgy~8QC!>zx=
z>#}n!YDb`WN2qs4WOGN1dRIbhS4w~PxXbQ|s9m|<Eg%rUxeq1>0|)?NVu=MH1^0o1
zh`&$>1OkOpQczG)BaqZoGze;XS{h~sdg8PziiwdO#mvTz=45A8<$&;VaR~5oiwN)u
z3kph#2+Bx^${&|hk(W_WQdLuyw^recQ>Q+yfk`}xIIFGkK$~9c^cf?)Q(|YMOwQ^W
z7+$<=WZ-n+q_lC&Qxl#R6D0nUs*S0Uf?0g4IrD!czjW+ViRzc9qfM8S@EMm!MD=UT
zmEY0r)?GKdAMn?o)vvxksb6b8(gV1Y5qPh2zQ+grbT0VI#s%En2>6Zq6?FCw>ept7
z`VaVPB;wL$#Obj}lV9Mk->P35v4+3EUv3XB1U`5<{=lv#5to}3HId|aBiS?{xnV2W
z{C-LfQT_VieN8^}_yhU1lj-;i`8E9;@@x7D{<rGaQl8IjzW;9it-pi6h~yX1`)Vr9
zNh}XsD3AMC9{l=w-d~YlsYLSYV|5%+{rYF}>vL1aYV+TcUpv1czvg=Cf2d!-kY5Y^
zO-Jh2Kt<=^{F}jv->P3k@@svxgQ$M}hWzUM-;iH(t5cs>XTPmZEv(J%t-V{>T-e`S
zKG<4X+g|yyv%d9V<J+g5-OoFp_CJ2x|3n}V)BXTZ0^oq0RjVYu!4FC+Xxdhi(G-N>
z)=t%Wme~@<BxOI@_AIM43au8(da5+LJ&xZn-?Y8-apwbZ>yFe@WjWm`vL36G?PX7T
zA7T7pY})0y{aIRZf@U4%c>_-jvb58*pXU!17?;^kbv!Q^DYj?|Wjp=i=~$WVK)zY$
zi^7SQuJavfr(YILReSBOPIbO4p030Fe~bJQqyv!g&)~o?*`LTS=iicFeZMEa)Q-rn
zOa?yU=G|YAU)G3YIm^~GCclzj3`Fuv13ddX@=I^_3N5y;#D>=V?yTmY$ghZJSBcy=
z`BIu!RgUfv`2~XgAivU&$glD5<d<}}G?SfFgfiEVlx`N;^WTwQr@-4`7@KtQBl0Wy
zcjOl~-GVsHklyEy^@Ju8$uGQbBa!^Fh8&S!SAQnI-h3y&dVfQHS&wqsAh?;sgjL;t
zA;0*K$S=<y<kwtl=}Wz=5Q&H*@+-NXB=m^<isIW)CX!#VqeSv+>s)x4MDnPDLD5g-
z7sV0z#T|n3`9Xd;2JyW<)c%$Hiuyr*4Y#qDVZI1YKEn*#(ug!h<O?CBgigE>kgC)>
zBEM`)g_S`=Sw!+{^jGo=9Lm$Ls9xL((mf)-csXa74z&ne=`y<M^{P0NJwqYbK|RUL
zBS0i&R6I!Xl0gxu>MzKzOaz##i;{;5-yawWdb>wSP9(o<eSH@Wm;agkifp7xmX*GV
ztpIc!kzdxjG`c^?uiOxxLoj>uiCUC%!5shS5Ausd>UAdIpfyKrzFKCQVtUVhso>U3
z<}c)zI0+_C{CDJ6qUEpTm&I?$FKUr!1J;1#*Ycoizmi`;z7n>XhFug^w+ZEFG(RHS
ziJlHo#p15y3yr!>*o7$D&O$owyIjY6Fn;^sR?!U1b$TsmI@7ll#UMc>zmheJ@|U7i
zA{;}{gZm&FBjWcI&(IR2hG`C>%Y1c+<d<55qV#AkBoo7N^PBk$3nxNnO!Rl;ms$h)
z4KlR%mceCJN*k{a41Yy_861&c0G40KFKSZmf|JLpD>UxKgGd7gP^k81VT#PZCBIUB
zPkxa{{FeOEBa&b0`0Cm*f)=2`FDR4J_SWD#>^(3IX?e;Y$ge2P^cl=Mb*vbKrecbG
zH@dle@g6Lw>@Uc#q*-aVKa*d+fEVFElVAD7mRRV;_ZHY+$ggjznzLtKU;Cn_Hzbwq
z?|4LhMUjGZ9lV+)ekH$xKnoH`%zq%itXaY+`V`=>bWvUEl5#p>+!m4i+W$xLi^boE
z@brlMN|k8SsC>%q{Db_OA(CIAr11spJ01DMi=Nlml5Lw$d=Wr5_4v_x{z`u7ekZ?F
z>HbW9`SyWMd?&x|bCCT?eqG%9L4H{UivBhEg&~q(;dnKM4?;@&IphL=L4HXDu+e3Z
zd;Cg%Isb<Ia{VvKFDWAVWlJQ#`kLupqa$4^Zeeu)On&KNZ>975F}#i@l3&(8$S+VR
z&z8>b$geM|3X??g>o|~c_@BwI$KT1XJ4Etp|M%qAj$hdm-SsR?HResxix)4a;%+g`
zPs~ugl!$IycTf2`xvclHYNUI^v-<1QmZy<Qs43FBZvuTT@?|aQ>QCfX+kYazM1Cc|
zpfJ&{kuoCrWpYG*B@@Xnrlult<_FPBvS>-v^$;3-0nRaU`ypxp<+)4J#k)hHP;o?l
zL8Zcr6urNbUjg6AuhE~$FDbg<Cb)Bb&@bed#h=J89FhD2{3H3LLnOb_*>bkR1o%6C
zkY5tt$uC19`Q`T)<kyX#$**B8HHsVqX%SZFck*jCBY>d<bLMVMnu>j~cB@AoR*FMQ
z=VtQn$uA4aE56wTY>wFI-;iHXoE^KaO}~&|BflZPtba#-@e?!c=6@x>%>M=Xh5ecQ
zO77$8hv27F)#HLd%e3G>lV7K1$cW_EsXvfkQvaF!O8<rY0>XXzxRzs;maP@~h_=of
zwRh)~OrQ7)7+$C(%wrEQ6dpg5U)F$&L)HpP%hVF|LUlAk%c^oy?jcHaLTx)7hl?Tl
z6@l}aq_GC4vyPG9_7k||6(*P=`#bUr3I2)vdH_x*l3%iaOMVR){7il|Q|2x~d;qXM
zw7;pL^j#~XNa#&>tLyv*A#LuFD|?tOcf+*3kb&>y7e4@gh>J@9E%_x)y1WcIK?g=w
z+EjSO@L~C^U4_1g-vI-|N!vW;2QDHsPM3ctzhY;w1HUD|vX00vAA*5<jnrR|Usxjf
z_3kgouK|k_c_h)lkYDLPlVAKL+InZHMGXFi{OSX1{7inC{2;&P$hy+0okI|c7jDM?
z4f$pGAIUEu^&3M|vW0{f|APD)Fc2N*C3;$5!+%SDNx;E3k?$?Sf?|}?v>qLfG3~4{
z7kzw4xR_3MI~|&w4y#J192X{;!@}s%0|2LjIr&Fi=w)sNmh<vu^C3WY&llTiC~Okk
zBoncnz7*|HMhgd>C0jx(0chZ?p`iajegWY;_L-eP^wL(g0n6jF@{iA%JU050or<9L
z*k@*Gy+?xttH~oz+cTQoripLO9+}O)P?h62o}<qqi%w?71c6j9AT3O8`pg`WU&-QR
z9^yg~XlWC1_&5MoxAk}A*AsG+KapRtTmPB-(%2%cGdLo@V$+ZRLVjV1<d+G!wS)2?
zJ*}qiC-N({4?IjHzi7baB-Fo<Uxp>x)-wg2w{O2xQ!cP)O*Y6{`Yrjz0{@s?tj|&a
zZDHQMP|z$X`bY9>i?n;}JNe~6NhH6l4GP^QN<KchclihTb&Om~+T1&fpZB!$wJO6K
z^nO>b;hFY|Ue9Jn6NZk+FPoXnFR;hy7LPsuOnyngErPD@YY6{a@~h#W$S;2M<Gt}R
z0~0X^7^yny@wWK?o8(tCS;H2o4FKa@QseoZ{7U~pepwumUp4?z&wn7lumJcU$uEU}
zL4J|`k^CAal3(^m<X416V?UAnT0J7aPDKX^qyI0-uLy&GL4Gy-OnzB>C%?Y@CHW=u
z-;-Ym>R-sOi0Gfluh_pLznsPYcjT8NeBdw1uMG0PBfnyQCco@vekH$j|C#(6_%r#X
z2-p1s`DOpt<d@;UB)>xc=j500{}uVw@t5Qm0{kDyFMG%fTS{y3zbC&w{z`sX&-@GW
z3kcIFxnuYT@=N@GL4KY17vvWb{P*M+<WJ-m8O$#IPvlo3*!*YmEBy!gmGKk#mHY?t
z%lePxSNcDbUpBudzc{~>UzSJYm&woMSC{L3&!5RJ>z~OlVT*qxzh=qI|0Ve~@MrSt
z%3qOR{b1|glV9fPe?xvjj>s?be<Z(jzms3WzbC&;{)YVWtp5}Fb@nIn%k#e>zYPCp
z<d^4PkYCJ4<X4p(|K#0)93uIJ#{Q1{a!vkc^6U6NkYC>ag8b6`_v9D9=U$wD<8c^~
z{K`TT9It(<A(CHuMDmLP_JjN~`ESTCf$=rIrH-yhqsbdd9=iW)@{5Y}|Csy|RQQSf
zdiI_CD)<ZXi!|T|`6c}a^2_%Z@+;+t{7OC|zl8rlezm}T!~2iOum1l?eqpdh=>l7J
z|3rRG{vf}uQQiyvTk^~8FUYU3U&$|-U@_lc$uA)y`PDg!ePoyOo%~ArPJT)M1No)<
z_vDx65Av(nPWrzlzZMh!g8UNxh5T|+jr&f1NlFX+iTu+2J^7_VB)<y&Tk?w+dPIIb
z`7QaC_eb)p|DVY(CrS^CALN%w6US?&CMKQ%BKf6CF|ZfNw)TVk!XA-dvyfA`If|*>
zrlP0Y|CanRU{3yP@+<f|`L#_Xze2YH%;|n5zod`IFCagLNPdxWlEo%|C%@3*e&}?5
zRf-((0GGWCQfnglWsn{qqWcH(OZVTCUq;`_ujnK4>ot-5dVNHGy`y*wQzepL^*_k3
zV2+(;kXO0|n+bowUyxshMDi>1XY%XpAIY!gCYb(TkY7!IB)^PjqW%T>MNj%0@++gw
z?>qSg2L6uxO8lRbUu{2;Umkv_W=4Moa6{ae{YJXPIWoEu^mp<r`8VVj?4QW55D4=T
z`Bncf$gd0{`BnQH@(T$5PJYq+M1C1l4)NbV7T@<+=Ul}P@{598OPw3?@UO`)Q(~4m
z01ss(Ct-jBklOFaDRjP*U$m@0lV4oEqzq`hD3BA>3j%#7znm~X$S?Gt$gkY`@8p-#
zujH3oqRyYlFRX1mGtCe3EBX)Q*F(gg$S>>>`6bRe^Aq`HqRA)838S1&8c9OO$f7v|
z%`laHOUpNkf(kR$CO}l>$|sM1L6e<%V9RKm+a#$I50$8&ZRFAZkZE21-h<M5a>-W1
z|4hu9PCd47NnEDXYzhJkwx~vn*XJn}o;mF@&OwL^F07{=Sh-gw-mfPcBO?RAk+T8-
z(}>n46aq(y@f*4$+Fzi14kAS`?mGj(kf4cd7o{o~YK()b1N=SGfj|-iOb87SVChG!
zN%&ub$Z$A-PO`ecXp9H|ca<h29n=>IKmY(Z67foU3TP#j);ZE#>U4nWCIG;{g$sE^
z0!0Hbq^8PH`n=Qy(I7bl+8`5FKf_9IfF%Wp<Dfc~ODfdzA&PD|Ah8=1-RE+gY-`q^
zq{fo$W-z^T*B+6}-sb261BP`oSttRcOBRytv~E<|wwMhb`{R!ebTZ8V>0~QpfF>m%
zAW`ZL^Fwqa2^R*;g+5?ClS{Z2g6;#-?5p;B1YwRhTLNM6!OOfLEQvcD9<NsYE_bVC
zHiW~H7l5YCyMUKTw_I?c%lgPeQ_hqs3Yw(&s$Tw5X`_G5v!Ziq1C^-M6XJ6BofHa)
zO5DlPzfDCsifhlx#Z{Mk*pjp<$X;W{*mfvi6GD<2;AtCh5dIjrEiS_2`G5jM0s!F6
zElE&-F!AH)uqS9{m1rBPpaVck|5_sCRb*IeLxjB4{5)KJNxbT5-KyMBlFMPQ?1_-q
za=qjGdI|?3<b}T?6yrWG^}t$zg6MeRRcJyK=2A-0I$%bBEMNu$7*(VN`vNWModxSp
zTnad^g=vmfBuGwjJk64!!M~#2SE30Cq=n)rrIn0@q!7z$h&^#cE{0B`Vd}jS(J$ap
zZ|0YUoB;qRw$zY&ff*?c9-}x2B8V*byUMk%l;!6~V<-2-<AtVrwN;xUv3b_Sp)r#L
zbO8*SQad522!Tb{^$We!yxXiCu1+uBeA17DNxWIckw+?<)(e-OYwMSMwyEBt$uj<t
zGPewE298`d1}+PrSqY@{Qg|~jOS3IYgC}}#GPG_WfUznq5C~L6()ml082AEbh~@%L
zP%CCZq4XRWXBmvtla@c0*xHXG8>KyI$0KJvKo&djYIy*8LmJ6Nw6!YbF7ceuNNFY9
zCgNK4uRXk!ye~bkB*9-(&#}5o>t*Z9R>738M{1}V;<W|*kSykFL3Z8hb*1a;Xq`tu
zrdKp880ao3YK??bI8e|Pr@`}zWt7xC8w<esn<Yxx8sOmkfj^;HC4h6rf$D8CT(W>{
za0~5+4sXiZCj+ODvH<<QK;^zuY+g9CtrL_0z|4H>5t@~YBkQXud+KL~t~SdJBq<@H
zS^f~?DjfsRO%(Bx0uE6+%qtzm9~u!PH6e;Ye2Sgrrkx%*|6#u)G^;Ts#{*FtR?{xe
z(taX|<fI+BDaM}(6LLul^x+F>4jM{iL6Wm6Qlz`>8|2G{P7;Wg6=~b^H4+?177qa{
z0E|yQzAIm%PPz~d$fgZ|dQ}1Ux@`<fV}+2h6FoF5^4Grw77<x2G+y9tRS7pTJzjH#
z$YPD+9Q^`=j#w-S{dD=_Fme69p3<x%7VAk_6;pf9lcsumB8!D15h}-B0t3ovd!GpD
z-{!6c5|@O^y2$yJ-zs*ua5D;WL7nyjeG?&iiKp@s1I-b+x4d*Wv1hK<C%WvBT8mTI
z=0dLSk$M{k$priR_CYjD{PwGKi3A<LZ{Q8_z*~C(t)05XquuaAdU__nF)i)E0a?Cs
zQrRms<|SuoFOuEkj<LiY=gT9z9*?9kmS@8U5`>i?w)_J#LV>jVfkrq(x@V+<5i#OK
zAgd3{%sD_SK&Bi3CK@a!yw4H?bAR@+f{%QxQ&3`*$thdkJmY@$`(W)fkQX9I4v@dv
z5F`){KBeXBX%UFB_4VF{m@XIISN9i#f>rt+2-x}y;LhW%-jukWRU3+Taa91c{p4fm
z<O08bJ)r;wP#V--RvM)0PU1-qJ~zs9PYZM}kpy`jYN`dgj0mdUhUoAH>ok(Or32lf
z{Uw;*ki^1O`T`|zK^ABdI^#4W`kWN3KN?5sgyCiA^XD1mbm<>5GpoO*n_)EbhH1Yj
zfeS=}0A_rB>74FI5K|hZRy`-5XXLsKi9ZKDfdT8oM%?K0(^W56azQ_H@mk3x8yE-N
z7J=%b1t*#XSd1a(#<@DVj7w(Dhdq9DxH=~P<zo6Pbhvk%OP{ZVF+?2~bS~Oo(;`?R
z8tlCX|Hv{X2L*fA2QVNYCuAdUjRKvRF5dGhe2~VQx)U_P6P)bbeWUwgn$uZ7wsFm5
z@yZD9s=^7NpouzgEJ!OrpbxAN3`Fws8btG&>|Ii@z~9&l5C8;V_I!Pq#&&ji4J^>M
zw!Y^80k3Etp=^ck*<Q-OeaXII;(*zo%nL^rjiEV%hhV0rbux+_rb2mXXfUUdne__r
z)&VC#+FC3@Igto+HM<0ZD8&`*h%i?!fFc)fwd^OzM0}|H1dR<%&f%yKhHq?WUhy)P
zVEyf8{5`iIMKS&xNQf>5T$mQ*j0JDfn@_Te4@ZOXs|-&xVE8xSh8_5%_?iBI#I?s9
zvP8veOP=Dp;)Qyu_LJhZrA<`4BBW!Wxdupk97*C7QSk!4#vKRZf$2wzSK+0eeAXGV
z83077vj4l{wR}A0zMp)_w`tz7w*!4aS`p-IeB>rLQqyQ~8*eb143yb0m}_JD#mq$%
zAB`3h?%nB=U{Pe?ItQibIXWzkTr}qLX->+AW*@H@N#cP!bX7Wt8G?VeKav)Bl`T-a
z;(6TrSCR@iCK;p~z!xMAxaMRfgQs&E1u`&=CMNoU!=R?F{HOSf{D~V*hI2I*bAE+^
zi<fW^9MDO;TE5etGNQ!B00{NMksC}Mi?muynNy?FrR^u9x5bg#;v{JO$Z;ez#yIk}
z7nY+(v==c>ld8=IR`T4KNPDFN#Hy`mp9N5P0icOEfsdpjpGa+M=gAWRFs2jqi2zFv
zUvj2rf?fd9dVstJQZ^C500zn$1IV8SUc8K>(&`XQ#6i4fj&!d(I2JN(>J3>~+X7Vl
zrL{6HR|uKjjG+xV&DK{OhXOEU$;;;~nFa!;6d(jHC;<D;nyq1Wpo9eL9Ky~Q(&ink
z<8kE`?%lPI5()Db_3HYc!2qUZx!gEeEb9U-XEj(ks9I!!#28So0HHUw3sD0&8I$G5
z%>Z*x5{<9f4{{W)^1uKbXjIYqlR^lIZDlqNL4_-L5dim^1@6_LcxJx6nX~zBd}S9c
z(+ZST$5nvZX5z9|$!1D|gm6in7MB1uq+XWAua{_mI?20oL%J~!W%NbKYM=-s38Hz*
z4^(lpuT&=mbkC4NiT~dYi##!;eb!;M%eFUYBYFlkd4td87H$wff_`g!opCC<L2^WV
zndrtQ{zQBc7V|}8H_oROk#v6Wk7rQhWW`YhpQgwqJ12`v44g}nSzxlm0gct&ES^0K
zd}Z%Cql^Yh^!S77F&rtKW=!Cm4RsQnJ(Mpd%n$E^A*tl?EtJ8*M{%AxCkj5<I{}t^
zF6o)iY<dJQ1qYN?zptui1w6R}a6&+M2k^>XGu&Mk)p6BS>V~y^$TI+2z1Np%v8tbV
zVz7z!^wH`Ml`X&k4Jg1CY%ve%*}`4jpxt%`POULDEH@i##_l=#G93Y5jv^ovR}vLO
zJ`=)yOcRgh4>0){WFBndTMyy6u=51&kJchpki8U!_VX<Z(Xfku!T*$RW}@PYliE6f
z@boeOol91qJzwv)21husTz964u@fk=v!Y)_5P`40iiZzRa}<CYh&Mu$rikdkt}+Cw
z<?`wB=AtHm2ESQ3XhoNYD-w-)NY>uv96<H0GRd%uINLAzq7PV7twej0eCwIn;at`5
z91z#$QL**SYS}3PNnSK+RiSxOv6Q?I2SWJKMJ+*w?aTqyBsg2T_S(*zZKhSnfy4`O
zeQreEt4`xc_tIr@SJ(=6nIYwWz-s`_FE<mT+wxS{;>`e(3Ks`^0DjiJpwq)#9%>Q3
zHKLV-K%5m5;3+GBQrv+?Zhnc+h9<*K@RJrT(hm|XOUfVk@U0C23dJdJ$xVdepjyfz
zRM(!-s(v#1;1O(}K3Q5E`9Y+pQJY#Br?+O$BUe+l2hFu4)}Hd{d7aTC;45s+4}b%#
zCcIXKC_-KLZ}{K1$_-3M0iw?#(`sv6NNg>K0_ki&(w%5+XqvIiC1XmI^HD)wfjiom
zdqOV;9J9R=*0=460UiNg;$+rD;A@M-k?{)uiAxh}$(5fW*GB@MSVdgFaMQCc#BAlh
zxde3LZRo8EAY#bh5|&_z<i5S6YrD0olP)j8|H*svCM5;{&Ly)=ufj)dBr}+}A)Hyj
z3cOxkn$kFuT(WAlnr`*$k;jm>ZOY`*C!-+yMoWqWK-%fFoZ~`|uNU*hRMb@W?)rm>
z<>6;is_DI?5#^N68+Wf-BLNE1?^h@ziNF`c&i}>{@Rj?GB>k<&mc$5$E{zK0k#&cf
zA{eK)Z3R%&ub)x3kaWY5z@N+jaQnq4Xb8B%XOLi@Loym++mduP1MtoIogn>5MY{K{
z8Hw{^oY=ekWWMfFh?s0Vi(FOzUN;jg3UZ-T5wghAnJ7uY^`>0!Q6n3emo#Z*_gG(2
zUCy!t<n(m>4U#7_4m2MG26N9oIa_Eygoe>Ay>MS&{U|hAV$~We;_yj$yxi2A)V2@X
zj0gEqVfbb0LHR%w1Hjl7P>(0O#0h6Y5G+Y9AiTL{<rtkpFE{}i91(a604u$>04r1a
zeCiVrsm$7O*P<v}C<C1ZlQd2g03cI$auNslg0(v3RrnDTjl<*sG)@+9&4CmE=PMr<
z?7+DfHF5+e;+TaIfEyNowsK2MW)Ho1&5IT#*EN#bnVJn8u)(j;8^E;Ts@IMq=MtyG
zpoc$##$8GMFUv>Y#2lxV#`wb70XSlefl*nP9Gul4z>>?+0^n<U%e@{5%0JE(!kg@s
z8FJC=Iaip7o(3i7NEi2gHsQYXco~H?S3gzfbOV1rL(}YNEz~|qsKz1M7X&{Dzn-n(
zlaBD`ICXY`Mo08Z91QLZB}hlGk;*;hO**_g;LD)BpV5L@51-XX+H}YrOS{n%Pak?~
zwer}bYgj4lwc<PjU7r>}2~ZG-n;{3GH6<{Bp;R@dV2CTPDljbskswPCzK!!vZV3P&
zOdH&i(l0e+V6H)OU8%?*Oqd1|l0MHK67=O`WWf}QRrN+MM*ko7?lLT@eE}Oj!wfaR
zz)(XC!_d+tT|+3{DhN`df*@&t0y1<-i*yMHiiDujGPHDwh;$A;DAMtc?l_*~KIiNw
z-nicD`M$ocwXSvF|8@U%Qh6;}$IN*wwG370Em0<D0FaIv<!OEG?Uj3QkbeX(IbA^`
z`;r3?3t-_B^%vPCiXeb~slQ857A{G>PCyzYkmSY?*0D;keFpy`Bmt>Rf$(~f<1HXX
zypt_SHs-Mq7?iD^MQ`D=70y3aE!Hl+fO-@uaebIWiThCEoaRN_Q`seH7cA%Xb|H@Z
zN6N=OGkrZ`t9256Vl&}l_|e+q$5L-9IdaX$SoQ2A_58o}2p6&!GeP@(xTA%Z@4t=|
z(mc#PYyM%BhT$W(@DR9(b4>j1r8kC*<^s)$M0x_wF$?6@;6l+iQkh%<5i*wa31o1M
z#0z>8=&Uyw>oCe=nR$Araft={HsHAhg9RB48m;My+0JXkTN=~{Uh3qO>ety4S<)TQ
zR2(?=CN2IKpZ#i+l+QQFZ`NmhcqDM$aU^-Om1XmTcoa~j&a5$p6yuc7rmXlaVb0Ij
zFsC@+Sa+&%&JOFbk|4gTOqOTAzx-k|VPm-V)Guo+*)EBZcKZ~dd=hgB_+Hrly|NvT
zdQR05RMcU_0%00}tByva>`C)X_SpC^WX5Gz*9F*#CH5Y-JK#S$=CVoDMr(l=MR{Bt
z&@2vb%CA%B26;3YOS58|9=&%9k*dtTs9x9%|56sJbd*D)<)s$TugcBZr6v(Vsw7H1
z%W#b*6x?+Q%-L&CQf0`&uq;VL*H0K`6=XToz;{k5*gfjHI=PS`d!8Ui-rei3$TAku
zvQkzH%t2nNY@J-;D$Y@GkwES9{>Ex@G_UwQRRFxbg&m5ru5r;vS8!}+v`UTuM5%mv
z%JHI<sbbf3JubKIh|1FYHe$(kaAXo|*+lAlfwXOmVKS$x@eyKCXoeGqP{eo{B!3Uc
z>_XbId*n|pZ8k?<mmaQk;NB2`eM<S(Y*E){CWOn&-p9HsS9t^-c4icSm?{f|x5Pp9
zqii7~{lt8JTSQ;NUu6Kbt}^kQ>8m($&D<H+R@^M=;BkW{xR3_$jDwz~s7UbJgteni
zu=-ipt7x%-^W?^2loo@zyf8<Q<mE<+>ve;aa;X8al>>yAHJi@x^*5cL;7hPD%gHzJ
zI-_elrjiBXAT25jJl}>7g+XYhll}mBC5qf<IPjU$OLN+S#z>yVS(p$Xp^%H)aBze;
zN7yj$#cIN)Vr`EXmf!4{jYKu&#wc!x6@~Hy#Ga}aNpi*zi=AUH(Ejjz%?A9=j8vE%
zOyzFM74d+Jl*1Vero*and{1|Uwdj3fk#rDWK5&6M*OMFqXi+kufMO~*SZb!Q%>k{_
z)^Ez(jU|7R{(^6)D$v2__3IK}A?KO5fqufb@A6*>S8_v>I%x(|Ye|MFE#?>w>k}bT
zM^R9#qzHEZS-nq{KrjghnKE??rHLld-7O4Zx?>=1L`J79n*i-C=Z}bZH#K=f0`OYH
zAfil@kkWMY6S~TUT^HV|qON0U#O6T~9`%y5i_}I8?A6FdvC3R-X817bEYG`9Ayk18
zt^0u*ODYb?H-e0|#!68eOp6K~;mCbYk2t8A*hs@P1gYKKnyAvVaen0DRQcP1#HDNP
zl!ntL?mqe~K@&7-R>YBm7pf4Sk5%uzv*1n0ZsDYG50l|OG`V<iwc%v16@o*O(MjHU
zbnr+Fx#X@%mpDUJ8AhBsRJ?e$qPoY$Pa=Iza7lKky7z8_L}nm{OyO&FpWlf@HjvUm
zk-P?<gh=KBdcwu+xiQ);rKn=YM3S#Noi52PoQt+mVtYBzyVHD{>jc3Hnsy|fxIlOT
zR7Y9!4I*FZ&hwl&VtLIb$UPznR0A}KefTlEBb-$5Zle=_U*Jcvy-c`+TOiN$Q=;(&
z5U(6hK0Bz1Q+6y)HJ*Kq!?5a<%t4hO+#pJHS*0eaO4#14A{S47)lO{q{Yif9G)Oo6
zAirv-PEMp7fx<X6ZQV5Svt7puQb#7`;K9L+rr-%&<hi{Zc(+QBn4egPY4IFcok|c(
z3v#BG83^q!Wa`j}4znJ<59d_Ahr)@C^KhkONK)Fxzln`!hJRcHxzp%0gvR)-sg#Je
z&nq}Ux!_{;%lZ%HhMx+5D>BF+HV+4Uc#%oZZ2ueil|LC!h9|#_E=hmv>An5psXx)p
zhw|e^N;_3UimMJW@}DQHcIyp%A=<*$a_!lV#K!NirSkFiY?t?BLo_mw``2Yi0`%Ld
z?BUg?#g)zUrFd03fT7K;Tv;j0U0rvM+1t=Zv$EXdq2<y1F@aXF&}yiTzFNz9<qqYd
zurbrMX>xheq4mJN`mz(W`cYIdPJ;J3-QKP`slH!d(v%OaBH}<ORrQLAII%CC?K6$4
zS-J*MN;9+OBEx#LSj3nKo$}e|-TmzlYIGz+UH44F2V$kW;iT#g&6Ik3MEOucvARj_
zqRA_-**fX7kHi8H4uSBatZ(LOfkqdUr?b9Yv02nryC|b~nKdiXc2G`+nNZ7mD^Bwp
z)R@$mnk=b<%r5(aB}~>lkYSpTQjka(_gM9q&~c{Q(L4o`#8921at1dkK-mg$AXKV6
z1#-}#Xu8o-)2g(Ek6EUh0v&-!iYt08lK?veA73URp$+YJBdi<qvO1e76UqE4j5wEo
zBsG|%CPAqZM&zh^G0}$Pdh1lV5o;1PJl7wd+q$)2%dFH&cN>N`yZDP*cK6L7_s!Kz
zKN&q{5d^W^%_j_g+>KZUD&YH%o<KM51m!wiwjedW%ox?jQ7Zm+d@E{-m1=|g=mE-H
z!Cnrb&Qa&H0H?TCmKs{6L?qEmTb3Hzi#|5UZ@J`vIXH*4kg5jKqY2rYO(+yD)Jnin
zrz;|t>#LE=S)xWBHYBH;Z4eYdi_%ckRNX_NV8T!3N;sK&o1I^dnBj)#s865ry;kc@
z?3b*&D!ei)T9csIYp5hXrPOv+`4y+313*rZQ;80xT?JTQS0Qg9sP;Ce^0TP^MDv97
z^LsrF3EcowY_psLP(d&mMfkC|6{N6jsZ}x$>}h7e%w4Kv*XazG7q^Cm69o*+>Aum_
z+i27a(a_(pH{E8HISJBMYE_8E4D<v_(Ov74B;;ewM^&Lr!TA>oVz!TAmpby~^Rp?h
zaT`jFS$Z!}pt;T57B2M0(rf0Ee+%qw4YD|aO4?YWsuudrB#5_muU@!jb&}4%6X?dI
zZVhR%Daf}S3pdXMUVbygHrWrp-)hHTeAVyT!{eEY>WjAe)JT6_hVWCh^LeRf%{T%F
z2qnD=Sn`;aG>4GAq>=j=!*WYbu8S8q7WIhGT=Q8x-2h>q=%9Q6M|Uz;H$Wo2PhmWf
z1s5QdM<_IkVy{%YuC$cy&wbr4UX0%eae{nmPUC)IiTcWoOZLy$RhK~3s(iL_c%)32
zF;FH9cus*)BK^jFmt+PIiZ**mVcz(BBcXx1EiFiuu18C`3eC{i#5mf*I0_J?14yzH
zwH>Rz@0h;+A<CbokY`$T$zPRLz0k|WA#!_WD}37Wn3Exxo@9gLW_Te@9QI-|U+BeH
zc)1b3B;d53f-f(XOEW;J1sin`7zC%6h_dz6QsrbP<fAU)!JcxZn5og?7)(!8p=Kj@
zW&-bIjH<9>yZFu|1Q604(8ayF7U{Qau$?0wP!vfp=ltkQidAq5gMF$twUQZ{O}tqd
zt*Y#kz%rVt)N#i1TVT-ZCv8McT>61rZiK=P%W-35!cl0MPiUTgRa#9#!Mp$|Njf22
z6t!l`;{&x^;hVuB>G9py(?Xsb<Qes>!_4iB^qxcGg@=pyjh^>DE!3xGVo#(&&&xTO
zx5CLNM*+MWG$n7ErOieZyb>aN0%eMuvl;k>-I|`)gh`FkZ))K&F@RwAsC0yy;&k(!
z`Y3o_Q<TE0i2AB%xXF{Y=hZdS_SfT*mq8`@0?&H^wV9^^gnEQxHgWD}Q8c;$DZN0J
z;okbiRr(oq8Uj<+c>NH$t5qjWNS7$Yb|y<=(^+B^&9rJ47i!nYOpnP#S#k~LJSj4Y
zHpah2yo&0Q1aG?YvdCVO&nd1+6(pQc<tvN35}_W~G}=w0t|n%(m_C2CenHzSmp5WW
zt445OmN|k!$dpxR@D=I%*)iEFdSnsp%=$+W2MkOS!z!~h=pyv-?ybu^&FxGr3O*=7
zFe05{Fp5&>!dCLfH$oR)KmS|;8gE<I-VT(62gww!uP<O^`(I9-2;Hm}n1%#R*ElPy
z0EIOJ#M}aeUIY2MGmRP9p56qaPXZ8<K~gP?yQZg%)zv(L6MRw7Co(%xgsqGUE$^ob
zO2}V1ue>VhiZ-B*LSNQH$va@0^#KyYYRs`nL0vWe@kW?KQ+!GDwSlOKh#cHaHB!|D
zy4XB<XyEycZnBs7sbe+THUF-{k{zC`!2*}vn&PBtfDjidx>1$3J235tP!fdElrrUa
z`z)t>i}cOdA)CPc!6t}*08gxIRBNE|hAtHSiB(~ChoKCBz;)gv<YNThZ?#UY;vyi%
z?2q1J-cwW5WDRsgy}+mvS&It#2k7M!@&yUse7Vqj+bON%v6N3B9}(JEMwl0`vraG&
zesp8#5t^QLd(RBx%cD`4--LAoIo29Q!cLnZc>yZJ%@bB`GmdWffS*oWjoPPKtxyoz
z+R^I}FXhn8YWV5#6<Qwpq!dv#!Hf|j9{}0sGUh(R8A2D9%`(D6H);npXyJ#p1qUb{
zx`9}fRwB8TLsc19-hzo{BWFu~86co3qS9)G$|IDbAB1pW9yy|c7+_kl7|-X}Rl*IP
zwBl~SMARBR&xo$PgPJ^coRD%t#cOtHzF3V^{R9OnF;XKpie5SUh4ZaRM+TKr6q^2q
zxaeH(F5!mgi<qw`&Z5?>X~w+@3e%E?Gtv$iMpjxLG!EvlEV5@!E9oSDuR=O22MW~C
z@Rhg_ixKG~<CPRb=1a&v9qIXUns>10Y}irJi^WA0a$HFNy8cOGH>iUBb%m*JlPf?H
zHS`|R->6v9A@f#K*g_+^%zvd=U9As*TkmGE4rUow@z!fqr2<LH7((4VQ+#e8SZ;sI
zquHTU=ePXYg$?8x748|nTnSa@uLcNc1*|Z6p!$H_ZGwGuUk&;_8CP$iE>R0}ZAW0g
zW)w;o+647&3mOe+@$!B<XAn&Bi5?YH*=uuWU-#?=Hk&IkKwl8H@Hp`-PBrl{KF@w_
z)=YNx0L_c%Xk#(7d)o%Fl98;E#w;!Bm$s?(22cvO)nVT#;CDDHBqL@_SMbIcYoYhT
zZQaipU1cc_Y^7v10HAzIXMJXK$t!a;F+jT(L${(P6TY+LKr1a2YZAKS;JWj22PpG+
zMvk;lHTI26@(#+Znclrg0ee?KY=It4=!SUj7T6@YcIQIjWO04Bg6V4+)4S5}@O6G7
zr9D)a4?0Op3RSE|Yd^Y6hY2K`l%p%+85dHkzYR9eEY;(`KSXiw!CUQ$ZLg0(-pawQ
zUw3?AZ~c^K;#l8;&SJQOJ!yPU{Ee?4y!PjExP|qm@jq0PfuUAf1yG?)v=o&FZf7GI
zcT6NqOcN+FK!e)FQns)i#rSV>)i6pG3xjU!d#mcuy4NP8&w1-*I2gV3n0Wbb85w_y
zhqp9l+;3r3`H*q*RGm7piB7V~fartag`yRZHx!c_9rO8d4h71POxO$>$08fg(z2Iw
zN&dEXK;ZrpY4zlU>VVQPnSTGUoW>=|-MgF5P4t53_fZDwL3$HmQIRcll`7P_0K|Zd
zrG=Vy;Q%CW3zdBK@}U~_D2+m;f0EFd%T5AWhx<t&^c-1Dj7?TfS5Wf3nv@4MPYkHR
z{S*?|mQCA_oF{zXsyH#P!NQ8nNSzUBO&Qb@TJGJhoKK9D=$ot7DRw4rkhPM!R6!vX
zcde>-`dfGI4&CKTx~rwq8t_exZP>|>u~}4cl)GnV5gH_EWWuLS$SAQNHf2~&<%O2l
zi2I6-xWS~vcM1x+#8~_0{>AfNwpt8f6)|c>@hLb}^{}B}#~_0bg~|>|s<L<99X1D3
zg3^Z6I~~+0+(36%N8|SH?C+sHh3e8CwlKFg%2|F@X;CrZu)feKkFwdTT?#vk1%bl?
z8B9}k8wmrP);&@#B{%v6Jn>;leUSY^p{rJbm<JWI+|l?zo#;R<-@Pe0)`y44w>XXL
zCGd9W>VDo=Xk=i3exquHr>X%#jS0J4Fnw*p)ENo&Y9U9~eKXl4gYYC}BAt3u9W;Qc
z5>2mwV%ffx45?umW*@U2cr-Wser@=G@_p53!}6^A{H(2=hd_~HFIA^+#Z*Cq@+Xkk
zC%2a;Ln2S*=RamE@1YS2WMS_v`PepyIVdd&99_jsJ~pQlrb91TDDBu6s@WW!b3#=v
z1Ide<TOdLCHxy8O^~%Y0#hd;V2WpgWjtmNGSoY^B%S2awG0#Obn3$FJ%eA%+kBA0U
z)!Ck?S-L)PZYa~bj1_zT-u59yB6GTCk}}nafz96ICsC?-hmy{|cuA^<_CYVJPt##@
z6YyfQ@=+W?3(SWvc^`PK-C8x6oC(j1yIR#rd8eMOOg2nlxg~v6-p{~^EEG8~)Rn-7
zaOIksP;*xTSL}3CBpmVN7wrxG40-RJ?fnX#5)tr36&~?Qd&geZGB7%0fNkR7d8hd8
zM)7HQQ_;zD$kBC*V55gaHf?pbJqV?TBJ{m#<q%keEKrU4?6QGQ*XwKe(b_be^H@+A
z7x&snRf~6Gsn|@=fmuODwTWRPeqtk7RsAZ?*ZYMd#UR76s6<Om|05oZ#f!^BvoXY0
zl{l`V*I^@wXT`)uYi%#(ZEs>UVs3g;T1eS1bfH(A9BOZM-|013zwQTraCiMPT7N%Z
z^rmY3?9mo@Hs<w(>zO9p6t04Al$HHxa{V`A+?uSHau^&bv<0(zmw9;gWCpJDG3<Dj
zlHL;kdY(pl3<XFuH5O~je^vE4wi%*$<W^hdkj?#)=WaHp(9|#+z(AMHtSykxQVte8
zWzI$!v^_ggL6Ryjx{(om5gx=-Uf8RVd~^~0_7SIkx^|)L5!8bahVPV@bfP`YQ;y|k
z*H%9-r<^eFbdV9RlS{T6Ny2z8Am_PZY#x!<;+b3`u!s|;lHPSY6i<2a5uSf|T|rn%
zC_dtaV&qYn2Z<$x6Uum>{iS3-N=IRUQhiGs++#Q}o)eCzye<rzUbsRpKQjy#$;nT>
z&#(B<@3T-{!|cI8R-<#*CSMEP)ozXUeo1OfG(^W)th7=5CW+Z#uCdz1m-P&von31-
z8?tcwBUxf#dHxV@`@#0{$eLS)S$ANUVH3%kLpue2>9wRfzAY$Jch^Dv`&XxFm4(~6
zx4+Ga$b}H<cU-v--*JQ^5t+$$MiSg~7ayA15466#UMU%-Ibji}F7zZlSBH~?96wy!
zr?AtQvj-v~67QK13sZ?2ydDa7;d{|3Ai$Q2&E;M6j^K(f>v`n<$d8#<I$$p#<eaqb
z!s}GOfn2@9`V;20vH{CI*;I-*q>~j)sZZ?QFu7>nDqqM<bIE8x9!}M?wvl{TKj`^9
znY^-WvDrka%(~S=Z=Jr?27j2|9K#|9J=Y=hj`eHz*{Srey^5!n$oDLrjN5~Hya&jI
z7R&<d6_fUroIA<khudSf-obZEKLUuLdNyL(2z9fXCrt7MW&DptRH~nBpN?ld^lNtX
zb2NKqJ-#<v8<`iXpJvK+!kp#UU~Z9S?B+;vu>HY$%E75gb;ip*>hu~o$S(&KZ=9*k
z9cJCY_||)kcACIxkZRJmSr&V<UAn+l*w<W*g&N&1S6mJe>rrDFDr3Jy9jEwEK{S9^
z9YlCM5bdbmFS;s|b9rn40v_DByc!$yfkJ{(J_?`)8lHi8SHYbWxHT^)6H~_LJ{pxo
zoki$0!Hj1}EH9LV8V%=2m9&SCtV5t-Zq3{HL```V!+0ez2+oC!_D<x8tSTfSsR)e`
z_S=G)9tF^Uw53o^6hn?NK1B?ZM#%R9=tR4tl}2n?-OYf$chcdf%{4bdcZRPrQ+9K5
zc<^cHSkWYiZ6z`^+6lj<;5yUo)d^uu0Xx?7B^3FvNwhV_<D(rGM;i_fFIz>uX*)<I
zfd(!0mi%Sis}yL_5SjF^k02|&XRCCH1g<!qGXxO|9Wy=^lbj)Okb%;rmo;CJtAyy&
zX^7`jhjJ~_c6c|=MqbryWdi2VymknTf1bFcaIZ?sNf%99jWVZEDUZ&)_MT7Eor-SR
zyuUYJmBwr~g7X`<nsV_~xL<!hyql5Ktdf&6-X`R7REna9s%b8>PNAyb0BL1qbKFUP
z2pm6SpdLg8CEAKTYMUk&@_{m3wILQ-!$n$00qCl5YW&#K^NiBTpv=dTSmTtNHG0=$
ziN&(fS`GsNj1IGB_C%o(=cIBA{OCQ(9D-uyp2wbJw}YPq67g|~#dw1_=nov)MHbym
zrFiCx9ghPlTlmZ4bFZ=anOSWGffF2CJPYCph%6k-lU4Sv!h-<RN-bzo!$b};{6??t
zg$T1UKZeQ-`Oo!}^p}U^qM7`rLBclP-9i1ij(7P~`A1hqtZoM0NljKmHQ17<<AJL(
z_?$B!|MG~{H3+9(tIozAB__JHB5nvI<PaGt&Kl&3?g#lVBI(HW0I;|gV`BpgtFM``
z`sHtAN~vLC#IuAKCMyF4R4^3Rbqx?RA3}J>w8&2l4xkKQV?}()o2;I67N!zyEwU0~
zqK^0(VN;)DWeO~=$csL8v>FaMt&|Bib!et~B)YIyh$Xo`uUCKO;#P$DxT$Y8Bk!^Q
zmaY{m?cnp9Z2kS`h~Hr}nvMb_iww0`4*`@~-PAf?RrrKm#_fJ5zlQ7;5||AB5Bc>g
z`NcY~_pOajE{@zeh;`v}0f{2rV7RCzU{UlPP=M~$m&B>@PaTGVbXARD=Q<SlQdJ<g
znQgdCV;%KL83>l=7J7M_6~EZp-j$Cdc3w-Ts>g*Y=x@YaC8(z!%)ZZ9!*-_vXaN<w
z(F)IN3=P7~fKQD{n>pV=ZpXLR(cbu2TRJ36bXK!@a}r1L`KoZR(H@Y+QZ!JyP=B{x
zS?S|ze{WtkTd#)%4LCmo&4mX@(qx1c&ose#B?gZBgF_(r^yqojc{GLNxZ1WdG8F6R
zdcUJP6Y&{+EYC>zU@YP4H|0<D%EkzvNV+U!5lm5bzC2^}aBe^L$%*Q``}XC!8F0Jd
z{Y6`0FMCZCGz%x+b?u8sKkd82vom-tmkPq)SO*h*_ezg6%X?j!7<;X~cXy&8b`O?G
zzER5Sfda?79D~Y`kXYnMDQ<%RUiK7Wv%$83Iw|NQG%uwtLsAU0BZJU~RsIWgIqNr(
z%MNyQr+JMObOH2+{XFN;RQmc~CJC4}&{UuqUb7h}8**cVorH+$G*9KUB=D4x<D_I7
z3PvyIO>cVz5KzV*+o=LzcE_{RP|(bAH~VffCt?0H+m{?-5gg$Znx1i!(kz;-P<Zix
zinT<Ax(u`A5Ws2!VWlC&I`krfa%jzLA;&XpH)j}Qb7;$E7;nzN%WT0;XvEE#WjRr*
z-7>0EQR??O40$sg{`#wXcmZr{{-BKZ<_sHM0IlKxhyMnnT@Gy!3i$=Vq?9vHr%E9-
zL(6A`#2Hc@m(tFap3-rg%(5dlW{xWj=*`7o_r+*|1Bgi^OwN|BriAPm2|m9;dkPW-
z)7u?0Y{6$;plVyRv;m0ta)u57og<W$o{;67EnOpukalZ%Cx_uaib5X6aExX%%b|_M
z3u;gb*$p~>eQ@3kWt9yTlgQ$R|Lzg;1cW9?+n~MPv=I$m^eUwW8?5%{;LK(S<a2O*
zhTs-1j;k&l0)xO?Zglz6G-r(03xpS&{C5p$7ENCv_rw+jk;oMTFm{7&R(LUF03k<n
zLKDDiD-5HxgFV=Sk(A=Fy<E1@^pi8kcF{CxMu1bQ<;e}Qd_ypU`yn=(dm(!Fi|vvf
zgee+Isr3q2?Mk>1!)62F&5C7<@8|p~Hg{Bxv&3I4j-1S45JYaC(y1Qtl>+9<k#?w!
zBb4ao^cOD(%WMq!9)^n^O-+S^3j&TBQJjYWTot>RceI#ouh<lZMGzps)I>v@D@IoS
z1%zhhH{dalIGeA+qfxO^hx(Fdv$Nq(HIF=LYD92tLN-v$d((6fS_%3DgnBGjIfh~^
znl!M4dc%LYP=&1#BjxTXszWRC!JmE}xelS?|Ky686=rBe%ARp&E}{{*)Gumoa`t!z
z^kJIKJa&CUg;|tF?ijtyhGv!fA}B2`l%GvIX?tu>!}+0+h2{&*%;2oUt7Qez<#{BG
z4NbM7LM@0o!~zceguhaJ<(SVo^mk$WYy!27X4UmzIi<(Zt;AC;P^sVWROc?^IY)b3
zC5nt665~z)I!cP1jiI0QKVJ{PGQ=%cx*{&dA*f8ih5l4GZNFVKRVTwy(x@H<46;jz
zP&5r9Lbhom64kG4p*DvQHD4L~jlgC(4AIexokL7`xh$<0;Wm73Xc$s!451BJ4$4tR
z^vmp4APy21QsdUwL}jVyP-iv-u5N(KkV+G;aNW~bFzQG=26#1Koe@VXX1vivU{a6a
zD%v75xQ!GTG8Q{)BK=L{z4$qLj*UVUQ(4gqm+l<e=nESSAOxY@)s0{C*pWApve$YM
zsuxV_ZHW#IzT`=sbo;Y*ppRPOmt4M?cD-6TjgH=Eq+_{kY)VC?_reG{QgK1-F;Fq_
z!1DIRe0JC*U{Nzht-4J7P-1shWO>vD8l!JWa$y#HcG1wpsM__*{TWCq%_7G)jyz+o
zcYUI?M$A%Q!7>*P70zl%8`~VCZ744ycTj9^wz%~kb5Kbk2RD{GkT8(J)noKkq8QdZ
zwEZRk>rAsaZYVoPed(GBGwutLWydxKy`<UqHS7Y|D-IbzZ;yXah>jrcZm2nZ(IFSr
zi$NnMOZQ_@jH#QKKhSO22n#Ap*&id<nN6`9=;e?&OLQzE@2>U$y^!x+?Su{WeSd@*
zzCEX(#eO&wJY%J72=zeIj|}3g6VB5Y;s}3_<H>A<FoW$e%2vSB^>c~qsTB6Q5m^0|
zosPJB*B7uLQZ{f1$a&90;LVCvFU0{$?EH+tE(Ta_L&xvxN&bWiB8^CnCf|eJxHEF<
z)$3{Nf*_DaDr`cOkQ?z3-Fq}d+$P{foMS0Fh1;uB{!1SD>@s2ol<_7!24%~4-M-oj
zFK$=ji$sS<o<bj!ZoysX%rFn$y`@c#VWl%&j0RAi&tYiTJ$sddqqK1^mX^;u=5EXg
z;v&vOfZFe~z8_*20^8+?*1x!P$!#v0d}No7)XNt}h;@SzVd4<rnPaf6!s@-H5*4VA
z=)?VNcA_s}QJNcPZzI`c0#4gK{px419MbM&hEVJi;=>CUvn~ov+0Z57{JmX#J<<LM
zTNZQl3Y{&>=FCN*nT2gr&X;dN!7~UU{4ICq!P#C4P!5B~3@t|`{x)N7MAOrJ(d;Yb
z-N5YC>_wJxn#1g(uI5JVBBLHaU5BcoTnQgJ2G}_UAZDw0$IRG-0@!T2BRz9rDhUvD
zS@>C(%PC)J?U26m0PLO$^T-$Q8uiB(Q%b97@+8q%A(z;#3+w05)-2{9J!T+MWz=ou
z@gf`XVkt{O7;jr)qVp+_B`A#yU`bc^Z<EC<UX2E?RXz6HA3BHJU^RI1(0q6jm5Ba{
z{CZN&d%A~7N#P{F#*qrMLx9D33Q|%k_Ujs?7K=B;2>P@|>|A$W!CcQ$sCpv#Vk4m<
zGOs^nyjyXa%4Rr+CNIg}_ajWdW|t0A6_w9{P5OheRWKn}WMMXFiYbSD#Yrdjx}%Fv
z(KMtD%CzTC&W7IZ2W$+hT!en3<dP7K!%&oDQ!8!3*^m_avFT((xS(p-ye*>a>lcO?
zLMKDY5Gjv*48=5riA^q-HXu_&IwvsImm&3A*c<BJPZTn-YWp@sLbiw|mD^~2TvH>(
z?F-=897IqFL!r&tqDGEmiHrmsWu;4&A~g%Xi1<haCosU9o`+41H1jiscOC-=wxFk?
z@!`RjOWi{Y;e)v^T-Nglt}ju;_iQga>VwXsKw0`<EK3QzWhh>a5f6yvA0rVSIn=Wd
zrcP$kGos7tq6|lv?Bkik5O>!p_OdBJ{-ypWyJN2no|V26k$=(4dLG4g(GXXcL!HlF
zdBy@1T3)X9>dihX?}1eQBjH_wP1>Clf<ES>?3lM2^2-e|G_s~4Jw|L?Lp0q+53E1e
zN-sH;CuElTFC^_s&t<2=o)8EffV<gYBQZ49*#-Aph+&u3?2Vx%{vga{80;;>D1^Rr
zdNaDW`kOolW(!;#T|?Vcw@*<2&Xw*yn!M()R$$ztN*243y(&pfv{}kfCJZ_i@PgiP
zaWB0uJ-0#07Rx%)_tiKRp@fu`mqA{PrIfE-FUejKf3wWMx+Qt(a4+Wz11wD_y#sYV
zyE!?&x*Qp=@cuyzGQ{#dYKsF~g~+b!`2Pa=W$imWff}Jz9dVjK-1HrBg@3#=G2-nz
z;ywX)sQ-wb!24dK#~7w`%;;%&#%N6arxf3hzE?(X9e=u~`00u7#}^r6PvK*s6QAE6
zf4*@%_U!m$wc_U<__!y0qDyf+(0BYb{PU3F<fkhWeTw7n6-OtKpE3YbF%zFYDo%Z@
zpPHGNcswx$IGJ9rpIpcoCu#U->np3OG7G~XuB*(d*$^MuLWPw;rWk}wCfU&ph0G+=
zAbPH^5s~aaH-w^>$($9knw9XI6PcVtoqQL-M64EN8x}>B=FgwZ>fl8$zXgkvS!=7M
zvzbe-R<mj+SWl(J$C-;MN+3VH33f7TWVIlYxp0MTMa*i2yJ0CUb2(0F<%ZQ-(d0@X
z+bXx!YUJdqE!)~a!`$hIlSLz|4Yfu@l+wDa-_obaMYPrI5QZtlZ<X6`vwm{3d2(&Z
zZyCQ_LW$VOvf4Op*z`TwcxQ#Tzcyf58^LT}iIhR4)?Y-Fwz4L_>LF%1l|c43RKplj
zdzGC>DsU;(&b5cM!!tYA8p(%ksqQ{x$h6(Ho+7_{%H({yW39Y%<K50Z<z3e)(s>oQ
z8v#jFBXk%*9;I?vt^(IY;ax8}o72PmDQLqK>FpV&?$d*X#-l9E;k(m=iid}_Q%B8H
zNBLO?cmeEP*5MT52%wq~hdwu7=&9ZxR&s+3UX+l4V=4++DWh)5b>To6<H@cTbaR+m
zBv9-oYlm3QDJlpAGY--;<j{yer^}<eYy|I!Ba@h1GaJ026C!I4@hMon)|bG69_c21
zbw)3ZC8I<a8=tL~d_Lt1MJL@-V~k7#Wcv)~I?o-)A!ehuMK7bw`{wT(y*<BCVeYY8
z_>}|ZV*TdUR2wC<DQot>l3xenc6W*`{xkXIBRxCZ{WJNsG5)D|e*9<htJFny=i8s;
zSKsTW?_!jdty+*5)5Y4;pyCR2O%i1(v`trDuAgG2z#asAtW+|jlG)$MFI(4@fuG2)
zzMFXR%g&7=vz&wqS^PSU8rW$xjV7zXlV6%aZf$NfZ1z9MuN;`uzmQ)wZNHOWn#JtR
zmxaWU%@Wb1<%Cpt@{1EqyvW_mw#Z({{+;}SKzIm#kY7W=<htL<FPW<8@8nm)M<#Jy
zY%2|Vwk(uf#u-n3>DXYtlV4+hl3z7H$S-7|#~M<d6vAY5@$yPKG=SPlp@NVhWIUPY
zQ6B*<Aw#7LA#XI2U`2zplR#iCQtov%A!Jd8hLGk;(CIYaYb!2!+tLpksYP$bbG2Qn
zUov4pMR@YdrFNt9#`Eeg@$Kw(0$u=i=`^qM0I~|Uu2k_5QM6F11cT<>b25g{W9h}*
z<ho51_W{naos2hIGFH|)dT0dd997?vWGx3!uL!z7lO5>o`jW`f@FO|Z{d&!*<&#J6
zgqRF@&`PpIVBpJ>uAWRJ%d3E=lS&E2up8+!q|F|L#nF+AlE;;tX2fI^qKmO)?3ho^
z`(HbCR_#67TuX{QKQlF0dX9Va=}Cugj6b?J>9Xl-`M5-pwkb<I$OiIKBY~!gE$rRv
zZ60I?6jm-R)s46PSmtHsucUG=^T>4A=tqYnpW2AO21ge2j2(KTHArc{P|DwT`>6L|
z{moQwx<q7mqxELPJNgH>dNEQ5ryI#O0nm2l6VDg%euCMli<Qwr(#Eu5$>cZa6cz1s
zSSR@*rAKSQWUu+3>Px*8k+a=yc-~7%%Oi*cQZ-E>CfBMq`yQU2$iE?-3RV#YMZr!W
zg)FN*JS<8Hk7Og-(!P^lFXOVE_{><;yljzLYS|<)UnvxhT!Xj-krU|{1k*H%Va_3k
z+*$?#^m7X#9S+`CwIPh|cMEO6#P8{nwy=Z6OhM!rYBSPit~Z7u3eFr;ueKsCF?NQV
z*6D3VOSa(8Cq%OH&vGY{wlRiGYp32nHIYipiIOh*jr^J-ZI|gBV7;L`$GRETuFzQ?
zeShsK;%i5{GT0;bmO3YL6Pv15A{OgPHz=`khpa^u1Gg;B;}&6p2fQZ;x7D4cZi8xx
zIEQKy8(U4Q%61|j8^;$$4e}eLWShzvvma@-^F*<Cne)36eWb}3a13X(m^IceJ+c=k
zej=>P@0rrQrVEuP>(S&W&^Z$kNzoY>CBy|xJQFk!UL3A>%fmBuvYT3_qFT=pQkKpr
z_e`c;EXZ-TJKd4&hWN0S9$mF(8ZPl!?9Ou2)ewTn9>GEs)pJI=5dVaJ(46925k<km
z7p3Sl9<}x@!)sdGs`T(_jZ+C`BkRkBPt$^sn$mKEbbi}3TY~*oV?~3oOw+sr<g&KK
zLDUlu$pWoJBD-{Se>V6-eBGfP{wyU0gOv`k<k>z!9Q}JF<Arc7c)M}h<;-WPocKc2
z?n0^Dz?Q?~7q&+$1m)V9<;>+TwCX@?#moV=lS@U*>;e}a-ybQ9IRDakJ<no>|I&8<
zhZ38pd5VyT(Uw#kJy7BKRg2`Pq!5+TN!f1I1dKtRcG9bf@?t^J)zOYGp%vp>f(|kK
zms?_`WD9zn)wW_)fsdcPE}SU#c33qV)i-%FkGaLGQA^qizE|~jZbAb=-V>U{Df0Fp
z8qNP)b)Gmezv~*mYxURDamR)WHH`Vfo~3E&YY?~E!3!JrGRR@;9&c;aV$nha5v*J1
z-quaN7QUaOV>PcdTz`1^rQ3YkR0wlY6-ZdLXB?gUP5U1C7m$d1CUd|g^`w{J>o{|`
z0xPLbRVmmnCwM)QmC~T9na#z`L%rLU#?{l!{hO<+p|0(QUsW|ye<b9p<)nL=Oj$cx
z>|Vl_36R{oV+CyEuQje^UOCKK;kI>auL;3=&+L7e?W=@az-uj<<``2R%Y?{;1!`yS
z`YUh5lg$OMb3M55_G+DY(tyJC<)r;Cs*s9Qz0T|6nX;W+(Y&Z|3apBNBc)@5#Lc%w
z3I)$K@rP!+87TBFsGnxt8F&Q2JVo9z))HWr@hjTS7lRw>^(9DW+?6c6c0XJMOxjTG
z&GoeX!Of0{)WL%2JNGX1m`cBE`|v1JB%E{q28#T_D10`<>DI(ZQb@RTjJhsNCES_u
z)$O<4B_Av1oUx8n)XlFQ?~<0l*I_pwe5&1&s%l<WeNX5rP5owDCYoi{-7`&UF+{4y
zqHqJo+ckl+5{aeKS@S1nRcdQ^OJiOWeET-~Lm7s~F51D(oeDWaey_aw(decFr{xUA
z!=6?o+ZKaM-E7sqS6f^L#pqom`~l-PXSsvku$a2J5;5-%<O`3aT1zQWWvTd6MO-%d
zgdABzHH`@tmf6>O$|N3EJ#Zy#`-w>XvXb=u;m1nk1@gzscC0poS81OVn`ErMVz^pz
zZD@@W@o8n~NY1&b<lFP}td(DeoyIt8cjQ-Hu|AvfjuHBIJM>v@-@dL_AI0cZ3YqLC
zpY7wNjal)cu}TVks4!0?;@!qFx%K49p5zDjD+OD;n+AQ@`J$Hn-bl+&*{7cy)Ku=P
zZBA@fmeyY<pxS@%N>s>dR81cdee3C}RlDvt#p#jf_f0n&_THWM`$F{YXi{3awa;Lm
zyAyM$*xfYbL3M<yP(Gd}M^Jt2JK2Fx_-gh|?yR{g+q+HeJAYaF<fZxWNa$$YefV_W
zv{m_d{h{}lCFcW@Q-1)Tc?^%AJ+J@%+lNO>7f2jjci;GJoJVhvJbb=uNXF<dn2)Y*
zM?>~35TpUNEymnu10v4*^76U!FuK#4p+z(wzzPGtlV1*j(qVzJqgukGfr@;$#R~)R
z<d>RekcLChYHOfUVNeTk(0Oc-0co%iU+|MBK{^h>{v$yqg~1jb!B?=slox_8@r4j2
z1zS6W+z1PCOb)b_3At5hcC9ePoiEf=GZfh#;u02$A_~3J5$cN#eTX%?mmC^6s{4R6
zEHo@EoG&y$GwhL<R!Cu39A9|CUQiS^>`9?UtY&yxM|ehIKvGzE4yk%7Hay=U;#tSt
z+`<TAjfg_*X+$Y$<ozd%FEk@Nha<|vBC87{Z9oyPv5~JmBWwAhn)f2=_afW*q%oRN
zT^&)04pAMXkHnuw^=Ll&fDP?qeDrBlc*x<=1ojag92?_{e%kbC${~7*FL*{KdKG(S
zAuQUkkc5UE;7o8XnLWllTb+>|Kwm~FdK*CF2H5m^RM8PlBrCna7kfVWJN$K?;G8r2
zclb;D2mEy(r<!aS2aJvNDU2p2i{}i8g=+<oe~P6tkE2adrzax-EUR)h#<FU~d+x;{
z9TV8Z<0Y7ac$Q<eTZqqS#fdFb2vt%Fo=K1^3OVbYphG5t^iTBYNZ>mYhjNVD#=~DW
zr-=qBiJ<q1SI+Ru7Cn|?e5^#4DBu`Jzzz_)4WMw0vn7kRTz>4n%w@BjBq5WewVhz%
zm?TC<(c2h*%lwITVWNjt@(}6?S~lPwnVNS|yl6{2)ElI%MIaWQY$cN%9G=qap8WXz
z!-##=D5gZ1VH`O-fFPEDf*?7)DELWA%1dwNw4&7KODV#j)a&~IdYd@<ePE$?VmVWA
z@p3BW40G9XTC8-MkZD>p837`j<eV&doq75)>60d{j7=0C_`2IJ3wgh<O1}@#cppn8
z3h58ecr26gAv|-`J!8S~_SpLj;rWa?9015pu&0^1<`~qNl6h#(v>KiTy%A53J0%3l
zWnWBrLZgyRBnR25rlcHG-QCYpE6h65%Gq2>gkBEfd7tFG9PeG7Ly?lSMW#j_ks~LQ
zLm!bFIg`cBe2ZL`Km`1hus^4o?5W7*AMlqbq1HBmNN299SMHgJT!Dk98kZlT`19zr
z^UihVwS?tq)nw_6<(Z^L8i4b$XYx&-=a)F-U((JnugSMv3BR(Ek0C3tizrCYEVwq7
zdLy;KH6qNZvmkl7!0qNUU%qFa+R1nBKl7~#TPnhnUratL&w}rVc=H!t(JBn-EVK+O
z46jLy94kyXNb|>&U(Xrw<X2j1R#HS!?DL{@{^zK@!mOLIIdad7ZU*MxJbk_v_WU{c
z1#idmmvYgi%rD*^_*7`W7;|`0welkN*^64{NA(9US`Thx_=`I<i`zPji9?IuA4GPI
z6%R!?_kmx&=6gB({AKd>mmg~)KGnROiLjqod5PCeXCq3+HA)sD!k1D@Ht(CRc9uk&
zx#4b>qDXIlm3s#A^w?b~g<wtI=apX57A@Z`C3$hbjNTGxQ4sabk(9jr2xd^)SavPK
zMx45wDeXn(<#IZ0QK}c^$iv%Z^v-aBJU%WU5#K8T@|&pZudK8k*t=dyI63+4ykdxC
zB-W{re_=DIt|h&i&-WRvpi`+mZ-OK+Rk0`lfF5Y9R<7n-(7mX1?yO|rJ*~WCaZ!l-
zwMkb2_`~hvh}ZJ9{#sqHJy#&Q@+uZ?WUm_k7WozIR23Ro6_9q*%l|sJ#T(}ph?Ai@
zq56LzzlvVeyy&V)l?OWEDq<ddhri;xKzQ=2`bBMRS8Y`!BN?C$PkzM@*S0#<;mNOe
z0(D*FbuE$KrLXE2b=^Aky)5+~E$W7J>bsrlM_23LzNr5!Ux)r$zmQhDs3tedQYSo!
zShQ%s3V>F~>(*)sM{9|l%1G@6Y7bW#!^B))&z!og$ewE`FVMBuV2xxZ_Gt_;=M*_t
z5LbJvX2y+>1x~H&!p*C7^aAq~BM(bwp%rX=XVeHRMv@+-Qg*Wd1mW<bcdr0VBer;#
ziCIJ!E*6DBS72l*n5B*|OoELrPgn|W!@-s;S2~-{tTof?I<Q4u)1qkB5p0&Uge%}V
zuj1xQ#Z0CYjrz`TFj31JTkV6cMr$7yRm)~WL5w8@{IX^1O@&qm1(u6PZBW*Bm#Efz
zmQ2p9EFR;nVW_rO(6-T;)>>$XXLrk;sAdD*_FL&4>pAVknD&tFTX9kCj|G`x6q@gj
zw}+dw2@7=iv9@FizSkS?i16t+`|N$e+Nn*VLMPjk&LoPiX!QHyy7v!#gmaJHr&F|5
zjduzkbvjYBQ|@-v`*1faz%T1|l^1tM=Cr@J?5Z&8*bwWeg!Zh8b+sL__C)pE&~5J>
z@0_gb?u_dGtP3AHV*Vi5lTFc47X=@)?2KmZZawP#0&Siae80omTi)HgX9-{IX2u?|
zo%nQV>hx`O_kE&hC+X=qLSeQ67>bNOs2<Zd-QJJ3y#$m9!bbzR@gDk@EuRbeJr(*O
zdJddI1H3)m-0K4jl$|UY11l7|cB}}xTZ5Zh{Q|!5IC3{+?hxPlQ0!JeB_#*A6(O#N
z2wWSKdO3KO5`oI#Di`1|JRUN6dCG`az|?OIv#JiSDIoNFhMdZVOoc`wxIb_OsG3h8
z%@jE<!arPHAG!8mMALZ0_5YAx2*@l_c$QOtmfK~PH+uF=$*e%{tkA}+2xLx7cuqop
z?ySq4bo88T$((%eoZ`luGGrblJg=rdui-L(K6)PicZg2!yxzvV0c62Qc)>(};eyM;
zrRW9ok_C(2g)18i))0IFzIauC@tVuxjp#+kl0~Q9#akPTu8<{n;U!P~r8_Q5_oA1)
zOO_t=F8OXOJ%nJ<!q`B4Y_JP9G#VRTf{pCOKH9*>K$hc#mlO1tAG<6+iC#`ASx)O+
z&e&Maf~@2SuRPUX$#+?K7Cry}U-GN;t9;*AMXIg;S@?_j|8?~XPk!k+W&Eao;mNO$
zZfAZbzlJ;|{*L;!{!rpq^=tiS^((}9JVfW;!CxDXbUsE~{5$vyuYTbYOl~C_=O#w{
z3V&^;SpQ~!{RV%HXLv4TIRD0f{X6?>D(}IYg0zVObm%kpq-Sl@&-_yh8zYMD)D&gT
z6#YZ}!oEPqyu6?KvZvr>bwf$+Y)Qn^($>||u;1*jmWpS;*<ahQ!~Y%pwe!CWe{KB)
zfBmL@&G$F`34eW8zXpF-zt)GFw}<Q7KGbcEG_QSpkB7hT>et4nuAktq?*A3|>u7o6
zH~Z`Vz+anFje+C{{kp2HxsC(@>)yKRuS@+;b+Yv9Yrd_HRya-d*4OTCPB%xMA`BYp
z_P=6>URd`v)F1BFemqV!c-L@zxIMEv)%VW+IqmQ87vJyj*R6jKf5`y9!(Vm`JRG(_
z8ad~^nMlzBSZ)Zj2jko$8GN%wg@?a5Y0Uotf6?IKFZHA8JcwL3F8k5>i;fE(652Cd
zw94IO+<5qFfcO{qD-I8T3H}a$QR3mR_f2G?D)@iHMAIApgul2R;o&dN@9-DrFYuS<
z5e^T3rGJONu>Su9e<`OM;^D9K#_#Y~7#{u#_V@vRo&OGh@qCBBq9IZzuYSN^F+agy
z_M^xJs^8$RyR&Px7stYlig|y6znbvym-bVw-{G$o+6Z{YpYT`Qclc||G)m{6;4hZ%
z@E5HXi_b6cR~Locbl?y8D~$capYYd*-{G%*aXkFBEMBesSMb+IGQo9GI&H50AMlsf
zclZm5WM?{2{|<lYrkAPuo9~&dk{!4FfWKJ(fWO}S1^ktX19Eiz27mee34eL~1OA$(
z*dyhrQ9eDM#7Yx##P59BjB~7+CnfR=_yhi`>3%4RHKC-@E&e)1;R`I(!oy!D&A-84
zyuZO;FPg>MGQY!L%0I(j0eJX}jp7XnpRXVu{^I)`{^}quvY04OvXzGKsi7&>*m`dp
zQoQ@*?_V_p-;7>}5&RB+#s4$>b&pW|5BTd9dp7T1z+agE1b@Z<JNRoK4}WQ@Q76j(
z27hJ#Tlh=<U*IoxM$Ir-bt;-2q^b_cxP{ciV}$ymftP!ynO4gH*>abZ#`8Bpf5Kn0
zpg-WR%)bkN?MM9#e`(|4FNNRXuhyU7uP>nQ@Yi*M&VUwU_D>H!G`r=*oJ+^UUkd*M
ze@XlW{PhG6f88cjnGGvc=6N1tg&}ah3w$==_bdEm2KX8Nn)?a<YRAK0uD`=yT#QkI
z4+sP7<<sx|fWJgX3#4!Wc9)bA#GG17EN<rQ1+u)SCwqLbDPCjy1GT?`zqU~Na##{;
z5joQV1~73VaH)!5_@b{v|0M$BVTa>`Ks@|)5f6V^{tSQJ?#IJlH~$j;dipc`rTYW^
zYNGuW{_<-Kkop0C(IbeT1)4vCsVpcyzJBR<`0H|rusOA$+X0ZF2ITrol8@Iupa($$
zDOFM3;$?{a2mH0{A69eimYv0WLaCDI>fT3NcR)xYI5qlr_$x-g%24apPw<z+{{;M{
z`5pcWqU-n#{?h#w{?bBu=kTd9bo>N=(SW&dg8vGCjp5-hF#znt&+u0)<szz+u$%x^
zL=$_)x@Xl&AfG~t^lsTbJp8rw&+ymmFYp)Lclhhx-+;fy{x1A=>mTq}2ifoNm-%=2
zD;W=e(fwQaYwkDrtMWVi)gk^T{H5{F@K*(G*i*_|jpzS_zs%4OV@$iVQ;-I!ZH}tF
zQtX|e*#bGzzk<Icu<E=?$+yvKf<NG|JRJFV_)F9#Wx)^i1O76`!(R{o0e{`W4|e3)
z-J{_;`v?5>K@&)xXILr7%Eu<>1{<G?BVs82Z}1n^{}1@f>`b=}ys{sF=FX$6r;Nnm
z-jWd#y@He_;NdR^Ad^h*uCYSW7NGqH{3Qyk$fcbBXZVX34}T5)GyHWG7-j>U2bwQ@
zk-Mg@sK9A}^-${s-V19aEV7Yaja5|s75=(Mi2Vwbvyra#3@lX>$)J`w<nWlF5!CD_
zK5it`{1^C(^S{GiIob9Z*_0jeXv-}MpFiNQzW)q=+5cDgE1oD04}ZaafxilX8OFRM
zTfpDpuTW499{%DZ+887wp$V1#>VIMb)EK(M5)yhJOXZVHKdABt{8dR&*iPa@4etAA
z_>1>n;IDSVrw($wI0`)cmGd+F#YKeeAd%h%{t18C{}uctNC1qRMh%Jry@}2Y%23Nl
z0QsJhiP`{t{t5oF0pfR-edbZ0D()&106kks@<oB&c0eZ*?qi!E%E16OI_|-LhQD(D
zfWLTuz+ZwYzrbHNfJtgW?;1hsf52bnzrkOF#9jX${*qIXKQOd4{;%*C^gqI1cEC!`
z<X&@{`ay25r-_3<;4isGkg*Lgr45F>6i;`7n)dX(IOH)kWGR+VEK`$HI)FFRUkhr#
zliVkpg+%@jz+Z!Z2mS*70e=xvvfd~3cY`qBhe*@2XW)myIGB&mL5uo1CbXb({aL<S
zPkFZ}{u2Jmz(Ib8zqWw?3I4kGJN)I-{{#L~`5pc;XQv#a{ssQZn11$vALe=a8T&Ib
z^IzbvxL@Eee;cI?TQ3IpXY%>LFn@AE8&`Ea{H5|8{)+nv{!+%nU)rGdnji32<L~fS
zTqEcM9{&0QtfZw9R52UteEFF$*0@aD{y)H9;J*QXz5fA!Sx^YN3E2M&`~~|D@K@_U
z;IEt?@RumA!VpXfxyy8gk9w*s4ut$4gulvvz+aBQAq_283+aJD$brdg)`ZXpniZ|K
z6}*4KUk4yO{I$vc6Z};G{1ywIm5yq`6T$s_t2Qd?!4j2MU&ztEu}~|IK40^$U&7Di
zjq6rbJ!w1;AVXIEOsC3LR;^a*slBo3Iae--;-|NM@~r;k`7>n|1-QJ4Kj5!hf52Zk
zzrkOIl;7bm9Oys6U&=U&pW!b-Lzz9DzX5;I|113U;Wzl}`FHrMp8$9|_8tDxj13i_
z{(l_)D*pk0<pK{3e}}*1+_E%I(d|G?2V(vu3p7JQG=q_cNRXWrq)q*9T2-&A_0v|K
zHATLy4+MFXcdf4N%*{4IT%OIxwlVT1|7q?C!)8w(NF@&PEBqBl&@G6gY}FNMxJ?~%
zSAHs+GB^Qz>wg^n614$O7>X3Q$s5Q49V{sa@$eS`utcTHXiQ)t7Z#`st+Z)`{CoH-
z?oarupV)w()caeVp&d~7Kf_;xzrtUFl)C={e_j4-_{;cj!e94)g1-jI*4WwQ8X>-V
zT>MC{`@VG038<zV)b1@5RTC1eHE_*7PuBgDVB9Ap%AaU}U*LZi{8jUp@D~pF-{CJa
z3VW5m1%KH${tfsG3RW+BVEixe7yDnpUxL~9?hwv1N-{{YL6PI^XL%qAm%Jmsc*UJp
zDDaqODw#P%>C1MP6#X6eYYX`A;V;-P@D~HvG4>buE9@WeSI#f+mjq7RM+3clHq=-W
zUH1$8mGj@=uYmq{#h+;gGHGt4y#Ydhz+Xn+;V<();IFQq;4k|>;4cBg{|J8#{0@JK
zHpYF17-dBoZYWV@oDNboD{aI?QDvuz3%oN~J~30Il^^^S{xbb5_zMHF{}=cx_9yu3
zDX@N(maG8^8b1ey{TKL4l-*wU2mB@Q&+wP|pYWF~Fg74wv@FoL#Y4hh{%+YX@R#Zj
z_)7x#GyEkL`|XmutC9k>*E{O-i^;uN?`tin`yNt%$YKa`Ob*l1GXCEOf6@O2fANm_
z3?<>=FNCt3IhXn1yjCI^Z-IT0;s4F>m)75hzj$x&Mc!`uMuvyKvVOo{3V8TS8xMbt
zko^XK$;B)GU)<eSR8!xh==&5Pln@enPw2fD=_E7*QWX@HjzU11fCx%S=tvhtRHUOQ
zND)*-DWRi?G!bbg6a@qf2pFW@;P1c7*>|6F&pqQl-N*Gh$CzWyHP@Wqk5KKoSN}v9
zUOV@4)!d=3&i6Yj6|L=SY<+HWEt7Pe-QTUP`3Sr}!!+r441Xp5g}*HSfxmuOdw~}O
z*X%FWw)}QU4Q&0qBJj~L3BZ|!UW7${(5EhxeKcUy-J%%7FQ5J?$bL$F!-VsUdc9#2
zOkkbv{{;RT#U#n3RtGB#mk!jw7i!a!v#c%`&*>Fw2vz%c_$&J_{3Z9_z+a2;|2_P5
z>wg3Os$h-1^}h*!8DVNrG8Fg!IsA2pZ}K1bD+wBt{6B@ieEu8wEABtwubm{N=wtXx
z$Gm&dFXu1(HH1O>l>ddlvdxe}VXd71XYiN7Kk%2*|7-XwNa+6o{_-~B_!s;o@?YRD
zXUM<7U*-@e<__-*1~m9f&gYQ9gqmEXa53q<r~K5%t@*n#(H9-cE}AirAIHQTYCOzb
z6I!f|IrSrcDs-rMqka)`41ZPpXZTCzzrtTb|7-Xw{U7-2bBfT}PGmO<%=Z`m5@i|r
z5BSUQ82%zAVdH7=*L-Kq)Bh3vVk`}lSc#7e#T%#@R0-51&*!Qp7g@Jwn>6y;^5y^c
z@K^X>`0FPP{z|4bUg7@%e<{=8FE@;|5iz#m0Kkx)^%wp^%EzHfP#~6aR6-zyK!1q_
ze_3ZGD472j_>1*_1%IuO?#<*52ZrKxJT?~u9cb{E7aD#He|5VNTl@Y6fBnJG;4kz)
z@E0R;voSWjz)k4<e+z$|romsu^#*9=fKs8$?Ee-1dRxY9{U7kxLrSutNeW{=wG$Rg
z5(l%e55>aOW9Q;9x@V8!uQCp{1Q{FEk)FKuN{&G2kU+zqPp92;xPc=`#}6xgyJ_2W
z{|WvoZ8H7~f9(VQ1%I&!k;*jcvi=kN1%d8VupKe|DSKj*zG6SWlCyAWt6Hzq_aaOG
z**a#MhC=;eW_`H}BTtv~PrR+R>iHM^b;Veq>o=Htznunu#d7A4Byv>$1ApbW#}*oW
zVo+{RK;`qZaiblciutTrGv{4cW%tSYvRISxa>|)vQQfQ&(aU=be{~(hUr8{!TWniK
zbglFL@2+*;{2CHOyXXGtXLS9P>K~&8?$TrUt2nNhAzxu<JMg4G8T?=1uW{*5Qn!!c
zFY3R;U+8&;qJP0((`0_t<s{8HmiY$drtV2SGkO38&&ab3;$m!vTWqB;WB(ogDix$d
z3!LFMqUVMa6n6ojkDI{1@RtvY?t32)!2N%Rzl!mH;V<p~fWNFft+d-Wa~qwi0s*9c
zRnS&LR{_!c-{CK~7w6nadWu@b4{9v15oB5f2aCi;X23aOGbBcSrTkf4WY_;6;V&H;
z{B`wv2o*H(eMuvw3&^Ch3VN3y873M0;fH1A($Gsh_}NF5bi-uKn8YMK|4I;)L&69e
z)TErk-m=8I_D8T&`nUE4guA`8E=Lf&u|E5mpTUtkNMvFi0uA!DxiU6#^k64R+~X9b
zD^!OhZyCyAUCzo1K!YHF_7h!*s|<7i@JF}p!c$wm9G{2-hTkaK#kBOh9sm%8GGT<*
z;o<S^knd<Ph@lwIE&&3xAEN1#Tkt>>3Xmg-C^>bB1yFp?M5GwsC_)0$Xd{4SKsU&&
z5X^3eSpiD}hP7$Tm{#%JcM1^#Kojygj7$|`A_lzI;~=@oASEpb{b@9ic1RL*#(-fc
z!FtO^(2e%g4%xbr4vY*Zg93Rwgia?2=pHIDyY55OfcUVSWCn1PT8>R&a)_lUI8@56
zYIoI}eGLRqcRT?QJY)h46ioC|yWoNVf(R6|EZIwgzl7WW!e7^7@EToq1g6}+C5b-(
zaPUFeol^pfl@!yt6eL-k27f)ZA!ruT;4i_>ZE@Mxyv4$?(`-{FFWREkhoRSB(|$Jb
z7a#nEzc>Vd{D0xE43;7MyRu3G4gLxO_n-O){%Spjzp%8l3jiXGV0FW1glLQ%!(Vvu
zO67drBpw?4Wp{#|5Ig%`2asGR*p6PB$20HgEPB2SSyEHiN|MyVL-Y`pa<4?<48All
z0Qv~9>6fs#$_&zY!S)j&0<D>;+OHbgRpby<vFz7ktuhZ70N8k*v}5~gPZz?mMflJ5
z*HKrop4v3>S%W5f%3u47z;JAT>Cx=31~zIZ8?}z@*#5%Isv-PsJ51tZL+~xkfG#*S
zv9t`M5(>EL2KaI++gL37tFexjG$KE)**i}Eg>K>pFdkm~B1A14@(XxwTK`&AM@T+k
zSF9x@#00ya$cZJMj4R^75>NPvtC!~-t6xEJ_dPn>gF4-4>Q|~J$2|a(7UHk^#Q;ry
zGxAG|9jJY*egRH!_<#UzM&CHvIWR<yejph8kNO4ptA45eRll;WOqwN=PmTyAPJmD1
z^l0i=V$Kvz{mN!TpJeBYrAHwiR&`76$AuT1JmQD|Uhy-r-&bU&;=N2Bxku)NyMbux
z*W-4YZe!N&){{w-zEJ;2UkL*HaUyyQvN(X5ygp6(x?25@^!41^7Vt+Pky$s%SsBla
zPVmIW`wPT^Dg8Ej#3uv2q*R@JC;?2R^QVII2Y`?Xdi)yz0ALUm3UEc!GrIvY=HKZ|
z&^JucU(v!d;}T4Q@Q>cdi{oEyh#?qBhHrBbPs%Nnp(@0jz7R*#nk|buJqR{PUki-~
zDZlk$){O8oH)8(Fe5EjZWYOJm>Y*RA<R8&_A#n26zq4M-1PG@tz^%_9wfU(D{bW3#
zVvmk7x%mi){orY<nk$!`BR9ytt0TFeSW9!gc!9EM&Gll42l0PhuOYnu&BWwm*Q?&9
zPNy!l&IUEu&~WT}RdzP>@(osYqOTmgUU72O0GjLd!gH|l=3odM(jWj(p|o}9;^)*p
z=*(H3C=rbvN(_`vj##1#ol7xtOB{CUA5kCTv>*U+u|<~p8FJZyb@bXar;BRKq0NB*
z$LXqP2uaIE;B<r{5)t}I-r>V;KZd&f=!GN@7ng=P&)acqBnagqc=WS9rB7p<@St`(
z=mCnZo86T;&vl|SmI}Ih{$XJyNa2}nt6RU6|D8a*E@0wc+SZX}F+q7tou+oM*tRJr
zjP!`{2%$l@unAV15OGS9Hf|_(;%;v8+t{W=UCK!Rn<4Fk;<L)b$9xt)2+Rm9Woe@E
zS)9)HI@|pE^gJ=j<}tV=O)3zto#N34YFL6?Wh{#riZwvnw*k&rEfyW#|D^NO;bKd%
zG!4q?1F6!WtmGv7<aje>#>jU1(t5@yMzI*c1NU1H;bKL{8J6=O9Cq(1Ur879`!Eii
zbTGlt#RBe|k>YG8?z(E_Mpq_c>*8#Ol5Q~4Pw5C;WlXr-UK&Qr`cv}gyGyU-C;5_q
zR!ejSSqycA1S~ZHi!S!Lmg>8BR#JqHAqYTYv5wfyfsm|;G0T#=Hxrf;w-HMgh*C5v
zAujncAb<6?VHO_b))k14WkKuWwi0-X@yx{pPbyfp{apwiEL%Bz-W~vRvrD?n9%z*t
zO{Evd(Y4*X6{3*r;TC&8J2v8Sr6xYbHJ_k_i<ftV_)`R8_#E;vbav=iWF1&SR$hh*
z6vu(x&O0VLjFmj&)}j$v0NuYt7GB`(zY$saG$IS1rjB3)*djde;3Y>{EqrqeUSk&z
zY&s^gYO1U%sxLB30QT**NB$C74>b^XbDE!~O-aa1(ugcYjg$xy*aW~YZd?1v|EviK
z997966VC8)HR;GZ>w@F$#4v2a6UW4>B8*ojxFd&>bg3ZSc8HG~sQiFlHAwnV(9|oO
z<Cw%>O-l{YFf|o|A3L;jlF~=eNl&xOyzFwG=B+pHTf5B@WL^56uGxRglD8g?A9XK|
zzj)^LtXu<_*O>zWK}rL_S)*&|h))Wv{zC+=q0c#Ri0V?|<vyO6%9(38@W}`UN$EtT
zVn+XonMtm(rE5d-o8nTWxCeaX5H5(WbfR9z>}tXky+O7Qu9ZFr&oji(Sk+*O8e-H<
z<O~NuvH-W%W`ABbXi-2oeW>Mh!_&Lbz%4KnJ`O=6vL;@-4;_PBNoVX})H$ZQ7jlx>
zM?CoeB{kQx3jjzsfQe-5igk6Z^aSStnDX(#r+`d=my%g{L>UNTi)R6hJiLSF-Ul3W
zTLp>oE&v$STs8{;VVpkZwnFfu39beY@Jfk*P|t2~elvT$IaD3dFaSI_tv#p<sS<Fr
zJe-3}w1n`+0#IE7h1m?6tYKCu*XqDlyzb(tyvcNk0lHKk9V>o|F0wcw=*djEj!R4>
z#0v1)tqE)r#L1Hv>*|uo_lW#*Xx4PQ{%**$kK>0*762fe(3+!jOUy*VAe*9)?SFZW
zhH?>glQ`S0pM+TZ<GeeB@DW?|^lnzgRe(y*j}U3RuBRtEliqcM_eV_m(|}^!#UcEV
z5MZbi^X5bCmVP1+BOWY`b8<OJDsKWgI^7YtoI78aEC+aS(di=mEj{B*`nOB$+TS05
zb#7T@M<ot!bLlZEpE)MEP(Z`;OARLU+fLKRBv++RB8}w2lAOjDb)s@yV4tydr(>}R
zlPkg(vfL9#lB9gWx5Y0CQ1V>efC9F3jjf~FC<mDdc5ydmoUru8mBKQIDHMs$#O;>9
z3&eo(?T3DfRzxZd>$+NaCbA~3dp|xTLw|dK03-n#ssUHf31GbU&pY2G^AHTY05eVq
z_tf`^2Mp~8aR~ewdpQ7fOQms|-Uy4cZd?foTAGI8k9epI>RRtb+Hv3^0BiEXVZl=R
zc%t3T+sUnjMS~=Z8hh#YZ)zLf1MxbLA%?5A&jqP*?WP^w-MY;`(0tv?W`c_%+!r{^
zjedwDjEbAUSfKgX_qV2an@GH!8UBEEx?OD1r|)eD&VT2vFV`2^wLP=j6TUGh8rUUa
zC;_^F0~^3)d9x^*?MWO|f^8PaAQ|G+ccJGU#nugEz?;T}P0*%(8c)%qvX6OjLEel&
zFb{7%Y0r-i+PLkQYvz;M5j#2VyQ;j1zvTiz)+IIzl8BzZtkfm`RX_F=Zwl*L2>OhA
zp%Z;EFk{NQaZ5!OrPs@)cg4~*q;V}I9B?!ph8v_2Uc3H{mNZ%#kgk{=wbS>MMtDJW
z9_*bG-fG`v9Rjw$(FgZ3QtFk@PHV%aw}kLXdXQh^iRTzD@rg`Z>L>cr0g7(onEGgn
z7kIyBp}pJN75)aCf0?FuJ&~kEdnoOU48LSkp6y7OVCiMhe<82@pno7Q=-moiMp=`k
z`!0bH@j8N%7GWNLE=LQZoL~Qd%GoqT2y^ojFuNvQ>606>4$(>k;@$z9@Y#}xz3o*A
z$?S;M9tT~7N)X`I8Gz{Fdk7=m5YRjo2cS7#l9|>!m+)#lPG%6i!u*ovIaj%~UnGIW
z(!!pcQQezK_)!hSQDs%!?gu(nUVubHpCKb2!t0OY3?bgcC!Rd{OY$WG-VCH*xrp9?
zkFV`C&-kN(roDl|@_OAui9X@L2S0W=+(!$|w(URqjylpyVa-z~R>HIh$B>tFq6ZD~
zB7vRmx<QL13Yf!U^KZlq(YfdlqEhGzWSP9K@7$lb<Fd;YN42cUhX^>@TJb(|<KtEV
z1w*3}(+BCQIO6QShXu9)=+J;G;S5z`*N3=Wowy)<HJJKSu~E_bU@g2)yKZ;ffGV=X
z@x1|)I4$^g;%7AWqODD1m-mG|Tdl7+c9r*U!7Vn@c>4T6SKGknU_i>})?0yV)S0hv
zxUTxt_oMD-muQ?9PW|UG=heOkrhEyZ)c3Ky+znd<!Y$Z`8BBRE?;9`>_vpH<=p;EH
zTIj$|R(#U$T}j}L5&W}~-i>72AfX`6NI2w+Bg9FIaK<jE`dnB{-Jfk8_V8{>pfp1|
zI;9T67z2XP;4caZZE}BnnPt(Yw;gK;KV6O6DD8GVz4aol!seY0;WR~sh}#r@mn(bj
zx!>~0*A$NLUL(~$za$3>bgpl%9>ZV7>QVG=?IJYGD;}n&rCCg~y!ijIynqa9G|LNs
z0e@g~5K-5LSlzOsQC>Jk8s$~M=^!P@n>9a8qrB8DHG<YNXCYjiPAK&wybSGw&fvo(
zWfF!C+q<G8oz>J~$pjFNq*-2)^Z=-M<Ne)!JnsH|q4+ES&to>gH5Wi%InDBF=2R4X
zX{vi=j%IlYehUH;;_k%&!WV-S`vFWMik#@;Q3}XkJqr7QxQEw(K+VRM0Hh8uWi;cV
zXAu6@XE;9;|9E$~9k^!n``6E(M{O}GE$S!&Jq&9}W4sz}3&{<@Z)@r-xy2d#7og)M
zPg6aUj6vj(SaivN2wYTZVCZ9#NJd{TlOaW=^wf9!)pP>5Le*H{fGU<QM0dwtEDIdf
zX~ZqEk)42E%ObNOFgm;9xpt+T9C(Kd5fXWZ`eGR8q>3XqtI%FRG0pOdq%eV~7@FlZ
zUeL)E4H@Dz0$xkV%F*HsjlhQlOC;dg)QKB;chzW?moub1XpkPlt4sicmBTW?)D}sG
zXqM{N?UpaK!Y0bo$L}y%Avn?WRv&HM+5z-v+exeX4`&4+z~aq*kh2WBPkS;b0?)t<
zCA|-E7FCW9P7-SO5rx+206=e7%FomPan}KaFrzz`fIwv_qDsx{FB5=x`^is0+|Z>|
z5Kuf@;_b$}y(0YS$(u@M*KN<t$AZb8C<EZ0v6(pd9d<tFYhy`fCUu;et$DchE5VRc
zH&UgC&(mb_t<cT=4XeqCkz3I^KE|psL&`^l(GzcqRcoA#^+IyAUc#@8D!$BJeg8qv
z%JY=9_V4SKa`WrnEJGS!I$SP1gN}}>Jri%qQL>lG0u4<@-e#1Y8w$0Q422Jms-M1j
zaF^j6fnIgWzw=^k&sD=+7;o@n&Js>6YNM8@X0Y4IW4JV$XxKO~R5By|V%VIUiehII
zeOP{5Yw?a@fBn?GE3LaWGfi_jPM5D5=qzgr<!Ay*e=O`qvk7wJmh0ccUM;?OEdEaR
zrR$cJo`$esg#rDK=-U~GC{?}9{-XHTs~>cWDl{Ka#S`gb^kVd<M$yk%Y=(c{?U(ZQ
zG;Hl{l&c+Ki=1aMYx{m`_s!nMd&9Qrft;fl!^0B~?-(9U{QPPNIN@#Z$Dy269%tOO
z-koLyhg(2?nC<Z=*D_kv#qu_|0@Nyrtig40!f(F<6tM6M@Im+MZi$Qp@iL?74)ZxI
zYSY55BXtSDBlEVTr9239A+j#X|I9tMxMT?wbA2+pq?<`SzB6{hJ@}B?V^pf1*{qO_
z{wy8Ou}&(-GS0cIx;a`HsTil)*4^?F91^r1ViJ44VNrcWOi=gtYps!NNxT+8a!?vB
zjurC|+a1n1E5fYbY=UGAj@4Iu4%NLx4u2?}i0-nhv(F+x8!0DssY8j^;=7O^adD^{
zy%49y5`NdEa?`Eh%sGS!GN6fG?nnWYs)-^55%*$Q59(niSR#!2&z5e?wOD9KWum6h
zMye8HX4arQBl~;XUZ2CRn`3XkS<*rbnyT(e@qV3b>LucmrcBVE;a(!2lHgHwD6Wwv
zaRtfeC1!eY^zR)R#HUaqGB~V&e6gvxMR2VA>SzkrYf~=vmG}hJ+>+Hd$*AZoW?gs&
z)Ro%JmPgK%pTGz-wx85jerlJZf?<B^29l2^f<%Wp7{pA!t9?i0XaqDoQrj)ET23A<
z*ny`=Ntf|SomG*hjhk}%ZCE)al`xj|a0A}U^bKIFC}~n!qD3&UuFH_mHR6cyV>0ML
zF<-0sMK?l8;%&Hflx&YBhySsp=RF|CXLHBV>xdd#c-IvxIc-*cG%1A@6Gw^cFY6Mc
z3Sn=VM*H~Gu?grB*P?hft0g=m^i(&SQN6hHBpDA%p+ho^FvygbHc}li-HpR3wa*s>
zFI6OK+WyGIHkJrUF`D{_EVDVH+!>e(s?fYr@LXRLRCxNT+Gr*CzVOR*6Tbj>5zEZs
zu6>GDS_K-<FMiV=_}cpZN$ejLFm|VtL29T{>#%~g`i~eF)`M4`?mL_R7Wjp$t-_Ux
zt&%{_dAj&fp!_}|)4lLoS#Qn{Y)lC_(qxWK#$oPiOI2?~`3Bu(0G&c{37Iv7)?qkQ
zPBxaGLmcHabx9hi+&WV|=N4+ztr)G6<|#kV_ddT{y;UV6q}r43dMQ+;ew{V-VirHl
z<PQ3Dg&cznnLlbCVu)QqtBcq;E|K~ng}piML%O;H?F^Rf5SG(ZDb`wPriO4jvZ%U9
z5~}2#3GXAP6q6B-NDOl${JF$kOKee3`9JWN!V-q#ANY&o*^;SR^KeGAdbyawviX_j
zk-S#*M`}?^t%`Pibjv&jM%iO`VaX?(cssSXox~!$9BK-7PV#*xT0}MK1k|P<2g-FL
zw~Qg>XJ4p&$D~5dD<^skG@s`@TfMCI;EP%^6ZHPtYW@Iva=caZWkZV}H}1{R)a==?
zqN;;655qk=Io=b^qceU1Rc~fSV6U3rM+ICTeefluPiZsPoWVcK{R!=?tcutpHkUAa
zvG?-4$_X-Xe+mI=37^$bKhIic)LGdMW7q2C{bIjFV$oR|?lvyeD+0wD&Zt-Q$($r}
z$p1F{Wc7Ob>}>GSTfuJ{w~bC8oMMQAlS@tNN;q3ltd91^74k1IDn|G12>TtF<RBS?
zP<*^nHQs%0s7p|^B>fr*#FI?wR4vSAc2c)Peyod=Tt`D~GFnn}E<nZwfW{BbmGe*P
z`x-WGTxk9!<T;Yu|1LIo6T}fLgbphjI5k*wzi61Ubt*E3_v`PwSugWH9rb|}y-@5<
zXpNe-p)1{gn4MzwK@4u+t0ZsdCxltVLH*lx6cugawbfNP)lgv3NlI#1d<V>vdUx$=
z?M?r35mrYw%0f=<{-W;cPbtQ?HVm28QA>HzPYelj^hl1#bJ>4b-$w5cf`ix9kP@eD
z{iPd+``8a7TMCnuH%}h1h@(9CE@2ZAR?_IKaGJuCwseYEV}W=heLZ81_zs@r&J*e#
z5<Xy2dyH1G14t1iZ#$xcW#7D0#1Mdj)O6{Ib8|3q+hCD8<j&I?S-&u@TitZz<!mMk
zTV`M6yK8P11+G%%$Zr)kDNgKA6sR*Fwa<DkcDU%E!YHNML2Bs8NKBBeliuxs$;5E0
z(9n$(DbgX-n8j&vS_(fN$z;SZg5phd=Z!|aPjRyj&Eae;R(lcGUF_yTKh8Wz;(sXu
zH18C+Pqxk~=Jhb)7UzJ?ff3ZtKh~0AbpYrzUwleo!3Woa^X!UnnwtPnNJexX(B2%K
z9EsRW+Y<2ESn=Xdl4eG-@kabwB(_Mh@S{>$>sh@exZrI3!n3)YtP=5clWR{(<oOvD
zHnXg!JrtjIJ$o3hjwM1Vn0DK<y$W&a$^_OdV3OP1smt!-borW*Kqv)m94{&lori9*
z%N~kqC6>AN3x<3!kuS}eKM&Xb)}_roOGXUo%$exkIx6dAOhYeq&N`cLWpUja0~^SX
zFpZR<VGDfS^V$PtY7s?@m_jSm0-sE|j_f(=z4=T;IU`p`E8L_~gutoi^z6L2ksA*-
zqx_xBXMSyQkromw!PSb&D=c!?;t~ARNc^eWNb}}QxrGeOK%CYX81|)X9S4qb?^1#;
zS_xOoIDPGJnYXJav+vrImP=f<C199EORU7{o{wBsUzO;}*G!D0s0*g$9ZHdx&K6d*
zI28$&UVZ{}@pvY2@wo|etAt|DB86mpefXmeDMxE7PHT(BW`*6=gI&}FR3*``ii?wV
zh||Iv>tf^1>-6g|7E6v98%D-?-bmJz7JKG%)VYr6x}+m%5Of-8`pCKPn<;9zD&m}u
zB7#rS&bh<>%G}VEM<Tw>Y)?OY)I%AGS$bA##~ZX8Nw0bZ-iW_BQ^cA=qvIqMyE=JL
z9U-DaEu5X~2Ge?^4t7l=EN_V@u0wACd`JfI+Ig=NJJjU8*So*@*GPTElwTPHnk?PB
zIU*VP{QEApW3t~S$FxIrOF|Kg(XBRaTl0=tF_yVR<cW_BPXr-&-MJ&<SWzHaau`|t
z?K)XF6BqkO1HnN88AM_P=!#{TaI*XF_1vT<$smpaj7k<pdZ8?;XQ{jU64%U(-EifV
zceu^z*xTJ716~qD<sI}IG2-$$2Kz_2EM{Iuug`*6+~YoA1kO0wx8npuziL6zMriD<
znook^IN1RpvfQXmeYnlZr^^JU$oSAuy(4v{^1&@Zht_5Dt|tY|3)+qado%%VAB4mb
zs>vN}jl_i|nW8_-mo$vRm|}<Yja6`94%-Q}P@_Abex=nZ9pxOeP>?|s7;7FUsZ3N_
zV!U^|utJqXhV_g%-0fkFY}L!BRdcp3Js(fRgA_tR*rn4aUv_c~KYgZ3r$FISh#xzs
z0Lg2~mRme+VO$Cp#fX~-irN>eSA!KSt2jxqm6L=dSvgVVA5RAJp0>(1X$qf7l&iV@
zLur<%-IpnDY9zieqBlV#JUhDbM$%l|1ZL0y3hV&=B!d-K7pE~yiWFdgLY#q<v%3X2
zT#+2a9RHd1vB3}si8G45F&4WIBHowlxiu8&vD$OL3hP@e-I&!=Zezj8ww;0~z?5Jb
zCwp})_0-KVT_dt0@mirm3R@T7dsPpPuw{7oeXLn2?D3N=W{0qMN_nLL&829{NA`$~
zo-zR@KVXq;ENx;Wmb*0Q^^AVlrzcpUYOceJ>%4d*n76f)7YAi}-KCfBwK+g6FYKE1
zeKtL)Fw?y1Qe&)<^~?Zgtb*-qqd8#vppMuz9d+4ig-#`km42i#SrTr5?Nn`-u3Pi$
zQAc>N$7^OOh#VZDu@o06e6}Xe$n%rJ@~t61uhr$k%Z8CY0u+MK0D-Ux6wShDY=LR3
zGI5-=!VvQQi#YLY!Z&VX0Tk%|Gk<ByBP$oD*h^3()1sgt?=qQP<nkwuZEx|dJ11$i
zlz>|LYx1ve{IuIK7FVu<<;KFWV1!@U>1W1qHJ#(bu`pbRDqhw=%a=f`-H-Lv=n9kx
zQv6D@vQYk74kDPehic|R5tlK0UEte6wP22+kGHSTCDlrf6%`3*B$DDz>&L;mxD=Fu
z&ngJ4K9qylI)iecg6$V+*=HZ@z~KILFn5q*$r*vIili(;x<MW6bH?ZUSJ;Yd2G`5?
zx4=hHN9+azfc9mu8QCb_vcPZ&JYjG(nK|G8k1;13Oo0>&V+>G%`@bV!9{2*}z=9R`
zJ5F2z@`Z2kC4flMOG=GEj<gNfM-`!vVy!N3-*-8C@T=0i^)OB_duXf>3Mfx97J$0d
zyKHdgbaBY4D%OeIf%$(;$H2axlET)gIR^`!JZo5|aLWGq^w0&1<mWx*>z#BeW_Z<s
zd(StgRi+0sRV}Iva2=N%mL#l2a6S(;=^PD*Kwr#6z=J$Wd(Wj5yrq|9znX(C`Kzi;
zrNRaPLNKh}r#>hfHoh7#CupLv2VU!DrNXcR6L`P+E_JppwMI5X<@cO|kj==3HTfg<
zK_(Mfap}&1U~a6p_yq7CYnLeNPd{x^t3)RD#-=H}vG4;pb4R)-bW>WOu}3FVt=Hy0
zC`I-`7n57CMG)51DO3)lo@J>_80gfBQN>7qLYJ%c<g0JuL)Ri*#Pb7h9<&obaC6v$
zmEewO*7#GM>f+HtC>1ptH_Rd3Xj&IS&<j!L>C(Ke2J6qlIE84QY^1kpOdnDkwX-MU
zjAbaXYKOm8%`6RmHk^ZO1qf|Uar4>x&$JC0sVG~^^!*Y^eXK0B*|vIGX(Qci3hTtP
z%2avHknRk+##rDIFlg|az}vGL6Sh(V#vXf}9#`U6S*0$OebTcGlg1jKesdHLenb#b
zPQ!A<2kVGYW<szeFj9JeM>*estxHE4BVBF$6HZi$+}06Py5l>o<I|xZ=!|2EPn>KB
zeYtbxxAo285P!KY`6nixN;|>l!Y=8axO`F5>pdICLbjZZvn&N;-VS0h0jcg8s{l@4
zvk@_YW6sWBRZETKkpE>`8A`C#FbWFIj%YmP)_5uzVYKkVJ{2D6Id0k60Zsd2LISZg
zg+=@>4*Q9<W-+mm3OBLh3=rtLV^H+apAp)qNFD&5da<6gkCwp#OM`Pyk~QXVT1<q8
zusdTC4!&xyleur=QX{oWxx0owjC(TVU;iAQF;7jO3QtcqRym}RJV!6l)t%4@g2h#5
z)(xUbU#^LMvbuZ|Lqj_o7Q>?vZnbxgeHs1kv<dplmh$;h!!9t3vZK}4t=w}FJi8~<
z9OClko$h+ZXZ)sSOi>Fy?(T2BFq8+IL^}D1d{vDkGHKa`v&9$w(#|RPbfWmW+E+r<
zkK0!|cOw0-oy!qEoB5)B`Q=E*^_y$gF4Tf+ftpv?!rW8A&UdRZTXB;mCMsDYe&4g*
zICjtjrxo<CieqchOTVMf(FW*x>`iJ0lp34BpHuJ(&8ZVtbp7l@uIRwDKguH<8?lzG
zIg-5d5rk61w+>E=+l_n1FIeIubCM}IFf<<P>-vVX(592{CMDxYO^JyP>g1c$j@Rtt
zY&c?ho@#==|2uNI{jeim>k@(E939PO)3Y%#_<8nv%&VJwH>`}inCSM~e+#j{eHnjA
zm%Q-MQ0uDHKDPDTzK)Zgh0>oI-O&3NUvu#^Rj!@IU+*w+)3%D!?tEF2@@hT4O6$o>
zs`Mw@r1x4Ds4*i6PTn+vfIWeu3DfLhvT`0PfGbSp_!4(!tlepB#2;(_QwK<VRm5@S
zEGvf+R7)r$GV<G-iQaK<Qz|C@O*Bv3w_PyO@n&)^JaG4H&2`2pmaeG=T@0t>X#c3#
zBgP9QQESS?g-GlhHWTiwdj{3*Iw*`{zj`*CN$XzR&D4X%-J`f~OnPQ?e~MY+#V7IK
zf?GLW{~qTMx_#-e>z9xMujpka-m$slsdIeUgjXqg#$;X(@!a3%U#pH6#oxSgwOxy@
z?o{V{ft$pb6Ast+UUkOnY#c=1c|#YSY*w*nL7LZl8z)dOWR3%YzTge30k0qIJ%_Yj
zsQ*M*zVUOEEfV>>%Va<Xq-_$^Jb~0jr5r?WpJOub{KOH@YB}8oh<|8%$T+B55Br>=
zO|^zYKlK!;$DW5HI2|c&9olsM_P>%cQKeYAz51c?%rwbFm<W65F1y!X_$$)KyCj!m
zWB<cNGCP7V(iP?_I%*@38g1at?Ya3p{ZZy&GIsw_+0g~=7`6S&8@x*F*n7eU*KVvR
zjioeP`oNy1^Mci+{QRphi7Om|E-g2AcM_f`J#xJJ3s(a!SgCgHPUSlhw$B^9&~iHZ
zb=P)xMJor*>H35D^b{8RKKYSo_&qn3nnNl@B;2UZFq<wWY9}eR&!SO5py<c=xieD!
z`RB$AtW2hCVzMV2brG@-Pd&IH7BByG=Jc19R^0eWNgXe=<uwn6>cmRtv)fYEjcp!F
zMTBUj`yW$~k(z%R8tzG2xz!P0q&oS|(}}8Q8@;mCG%`v;CX)u*xV&gi7adn_EDFd3
zWon5Y(jm}`e)FkoTj#IpN&Fs~)mO~7O8Nfuh(pv}q%b1cjr_XM5qGO~*lmcwxJN2W
zt&(qiy+${BX->>YC`cqFLFRnw$h*sl^6W($?~I>UNjM1RShj|`88HiV$>)5~oQVv1
z^a|~fS&Vc;cry%7zj=pzIp{&V)5ba1CsyzE>v4I`Y2U09nsEYyMO^Hr<`o>R_t->*
z+;)?Vz~p_-F<Vmym6sEOoe+nZK3*m}UdA%>qH~v3H6BIdqEf~keJ=RgcmDzUNkX>~
z-{}xHRl}4DciwfpyLV~3x9M)71onJvz#7-Z)$tPLseqP)ail`ZTUNEZgQsdmev{s8
zLS$@=mGoG7R)f%=FR@(hVz=>Qe8wrn1#37$j*i^bIG`h71%yKDN_2GPyWrEw5{3D5
z_t^75OyXU>ai4DKyHuwmTl0zLTxW)5Yh9m*Z_MX8NArF2t73)L`nbRQ<aIavPPq3K
z&v)A2iW7wY)CYQ*<>5*<&gbZQW*^>pbR*yT{>sy5t^7Z#U(DYBQPWZrK9k=k_xs25
z4+a8jjh|c|ti7B`lwZwXihQu%yw)o4^X>NRoAql(7!wXh)CdG20|$oj>6Rxe-BB_E
zh6S`r6cuc~`wM^VKK({V$HQ}S!?iqr<1U}5jA^5NG<A{Xtk`G4oryNn3p+IU%X!Dw
zWJ;dJ$IJ1wKuvy@ud{e7HX+lnzvp4Z(ff@jC!c$(GbK#57hg9Qa6$zX?ya{33Jl19
z6B|G!<~f<E3#}#xoC$7=LH_gzdVN^$8~fBxa(9{M``tD7aR%;3_md=PQF}Kc8-c0O
znfg>D!8$j=7|YnL!<i@YI(hjT^H}lctzjk;99WzR?>&)6NDYfL;ct`f(R*2u?ur8|
z|De(<x-GH!qd+mz_GCRBDu%X+BiIz4=(v^L!qxg+K(X58Rgim<4|$%as(GB@iDP$j
zf{j3H91$vR#KPT<<|tiekGQb;km86)KX;LV4|?~Ozo`cdL+;iyB0@|CN_ZRd<4~)W
ztXFZMpf*51>&D5Gx`Sk%D}H51T6rSu%v{Fs<T|iC!vurrKnaJG{HRVNhK1+Q2uW=>
zmA(b6wjL~DjX!TDTkc+strSnM&t04;yoSDOc{T6#zN<hV{FdtgZLxvtR8kjd)5Lni
z8W|Hfjfkl<O`QJ{$yjAvMAWG8TYh&wSiX^X%C%6M3%La$8#wk}reK(x(1j-N;#pL)
z$SfgQ9e_1>it2tTvMnDRa{7yj)d1mPZC8aN(*@f&Va^g2b5n8DBUas^Qsi3xNijM^
z<~0iDUaVuU9u?hhKLIR@>k`38``V@b@hq9zGZo8g%rKv%ltd=S8<Z20FV`(!Dxm@u
zqEW1pI5tFNelL&X5kIqTqcL;u07#zxzU^ZJuBUbtqVoKhk}J145p&oC&fF&{5kczs
zwMrj>m5@(nm#$TjOJrZ2Z7#n-Azy7H#W_Jvk3Ptg;YxS()XhS(NV+Yljx5PotWnaD
zjHR5}SbDenvJSll+|RS06{xSGl5KJGPha`O39aJe?c+PD+@6_98;LOLV#^<NaxQx5
zUg3XtA<VpOV)Zs%QgUT7xCT)#W34Nat~~%|dhgbu_NRnN7dH?22=C<?smma{?})!A
zR9t#;(fNnV=PS0WblWTSX=@+ixF6<=cvY0JMadfr{;>6u&I8`Qk@lRI3aAbDp=P`K
z-Bnv@@w36Hv>fHgdz$~sN|fx+y)}Et%{0e&YYwUfagP?c^I}cfv!Wex<j&K{H%>_u
zGken-&Z~qP|5Eu<f)u#|7J1T6k8LfP^KE3mRadE$9z<X%zRKIHJ-(6QDKm%o#oLGB
z-popIx+I3=>o-5UdHde<rGLR+xlf!f%ensl8~z%f<xP+ZCa^{x34GovPCBKBNR$@b
zCxyEuoT7sTCDrot`6h#S90}<sOo+_kb#!v_h@?1y4rCt5h?8QQnp9LUMo|vuoW--I
z?3M5wW+k;9xTmEGi1N#^fj`*I{<2mAk*nK{Irq_ULq`#2_we`urPjdsn;qZnzN!zE
z6({2CX9Ny;bvnwFnPc4ISiC4b@9rvIYq;3V4f)+A*1Vos71FYDMCX1}iQ#Hc?Poec
zQeW?>&DQI0i@}0>sARn?MEcEz8I^^;y}3PMzV2Ufx=Be8OITZYFypMs?cWfRiW0|Q
zCmkh1DoL*?E<7gxaP>)1ik_ZJ>Ip|8uSn7!u^}T(S{}sdfDE^SM*sdWYM>OIY_v*L
zNr?MBM=}_EKTa0D+2>U7{Y!n+uxo5&O$c!}t>2Urt+>D1+qI{RF!;QI&sg1>C;e_Z
zx#{rrFu$)8KEW8r&nTMqCB&UHi@KqJ&bVu5LWDZSash0W%!q9J3Twx97m<yDsB&y~
z0hcK#P{aCeDe6z1=N~uFZZ!!3bzdlL|H<vS*BnSa!iny?7*T0>7Xy(x0NAVnACw;B
zUBDSOh%-po(S3E+jkM&x2+#P_PGn{P3dq8g`pBeq0!lG}ypQ44BXH#pA=gW|(|~+>
zK!LOpZW2)7Y#leXgxj*_usn<T8Jy)smY}Z)zt`NHM-6kWGRwgSX8jWGb)v)y1$KFE
zE=`1655wyuip&CXQmr7`FwV&#iP9kEs*kYj%s)<`-8npp#>jXC!dX;!WbI%thL9u?
z9zAzXTn*iU2>muI=W```XCrDKTsSKOx(#PzibWdH>@E>DJ_L{RKX#YMLD$g2vEAhk
z(Z?W;?JnZ6-4&n$Ia*ueR8(XxrQuz8=3W??;<mXD++}dz!@@ZIN|y~bNRl7nO^V-!
z2tOQ&dwPT)<4VjX;zEc3p{e0R!7R2i0PKs(l0A&v;kF6bB+;o#RwBsq1XR8fbKbge
z7L2Spj9l5EGRBIsDY7$pu*+?*zsUHJH;81*;35&J@EX=rD*M$x=hN2d9F&>+Y<Kc9
zP&omco0vH`jL$%Yaku`^%jV#ArZ5a9YLg{wG$dShb+$VD2UMB4CmThg;a$KLC(+;I
z8T+?YBt1ly_c3xC?Q4=SfvjV@3&~T$(!wSzPu^+A2=9?sno#mm8S-p{^5kQ?OVWLg
z^@yod{!P{z13_@YTI5JoxeP6`eS7h($XY3SgVN5n0NkbFT_Z5IbrJr35@##BV)t$2
zRwj~$cO_?lRR-Y{w}nT?c$bPuh}<5#>@nU2TzU(WND4$|9phc<Q$bwk*(D)Ea!hBG
z56DMjBtE8~B?^k4gwQx}U!dV#D;rYZRiw+>IY<~PC%Z5W@9IFnve{>OZ!fH}Ega)r
zL^g^WTwY{niM%ZjTYnq8jr%#LS+CVgA@vcF-YWanB{EgYyXzq;+iC}!9!fEp3{0Zx
zA5JSQ2V%-p*BwP*l4Amj8PJo8J39pUlMT5tH|G6fZaN$EuaLc?Sv)FONvs92-hq-j
zz!+l)#=p-%KK{}^DA7y@@|NLgi2Xcw%?Yaw3Hq#seKJOX6I)a#c{dAXX3hI_bYCw-
zXRkyDQp1_F&Sd;cmpD2Tz)r3P2;3f(emw})8-xe5(Hex3i2?f*xNwdlbaqT&Kby;D
z$gsCwVQR~YY;Vn)D}@-7$O>TI%sm7+*k1lg%2kCQkXeDZSymL88B4j1)X4iln_puB
z3|W6h6iu@~Li-4UVK!1ygLVgvQs)Qf^VZGkOHjYYendBNIeTa^ZCfqZ8n_w>Guzvh
zp?FAS($4x>pE`vqj?FB#g~SY~zT&ADxid|iWPqCGk+;p-4IrDvCTS>C(*88k|D#;D
zGXJ*`=5OjdE1c->b{7u_7h66_(C{v=4b)z)P}?08esF<?cRjauIUu++WC)fLTz``1
z1UE?;w(55%c3f)w#hZffx1G}6=XPq=H8q%}5t7PWu59bSNuQA7g9ZX4X0O?>=>%k2
z<`xa_!hUp!+xh`hl=`XRdH`H{r#8RtzMz?XP9+Ozf7X=1C9QDQ6f<aefJZWFp1<QT
zlmAIPfqedF;4$8nIC9~#k?=)Tr1EJh&F-4zayq~`O$Ga=)cDqN&vUCVZ`C{RsrcO-
zq1j#PYNLlEVg6Hh7NN&>m;6bx<Zt5PQIi|zL_olsakf@Xq*(?_CBj4E<sZqx0JZ>R
zT^?!$#)bwiqu0%(*a4qZne!=^o}r+q+kYm{`j?^9zFM;yoe??8T#&R~XNQqX8+9~B
zJoQ7Qlk#xG{xrNREbudjS*Bo@8aYjbk%o5#{8si66?#_u3(X-Wm3h^09LX?b{e>+e
z#X906H*;^8q@JSP-E&v6GguOTb2eQMcb%I<@c^!7BcVhp)cwSRb92>h2zlij2gL#}
zhM7qSkHudSgD0Y{heWgx=SMXCUIilZ?*gkd>}<|T)9fxY%1x<&@DRdHq&xR{_eE}Z
z?w>?E1tO``UfB87Q9PMn0Yg1vzZSOq0m?wbyMUY{qqJ#ujCXYm8%JfTte5=qr6$&c
z?Oi>Rd`gpkizLY*eB+vueuI)XVx2c=L}I?mEl0k~vBG)-iF>6yl;=z;b@9tq4(1%3
z9wOoT<hgwmf8q#pq4G$uJu5VW#Y{Ps?4Meqv1CTL@IHJb7|8bRBRs4=eSR&S96lFM
z3}sUU{Lar>UOjchoz1Zu_&Qq)5x`u~lqGilqZx4do%L;{*B?okOqF{%x?ge(`ErfV
z=bq%#r4n;%#Tc%L-f{InHfKwoy_f5`TO7bmz5r9LsWJ8T@O}K8T}T7ExhXN8nb@YN
zcKJ*G=#tkzcGpogeoGL1_ln0|S0g!n8s6o`oZrMgwJ!0f_$Y&~;KY*GUZy)w!1c!f
zwlD<WJ`L}3|2afn8bjH&ZLyB2O40DH>UKD7Zqx9t!_2#{pZ`$*i+8z=u5|?*@Y}L#
zYWkNEp&2l~LG6c3vG=w$3)J|-dLk%V<M8M&(50Ve58MEM@vcB6#UC`hOH|_+?^3Pd
ze&nY7xLxR(TD~!b)g$2k8k@j)ZCV1GP>nTf7IBA$cahl2m)UrcKw)#ova%b&T9bk^
z_ZH(7nc;a%!vv)LHS$&<=hnxCks3-<W^5<wkr130Jc-;C;ei5|vq~PT1RbEQkB&Tu
z$hTjRet{g1cUbHAg#kAJ3g@4)Tnwz7-0{d+jJ(RZ;0|aQ6nLx5Ou6xFJCLJa2g&yU
zx%Juu+&qu^xq^1T|LW)Cz@J-^y0w_Wok_}Bt_hw+jDiA@=kn*eD^vaf+?w~kFf#;%
zDyhLPMEJe>`0!afG#Epj%wplcFvlI_7h)~KLu971J(jrYcg1}PG|XH*IB%ibJc{6X
zR=jxj0qVvSTlCb9SqV=Q{-ytemeIsK6&M@N`VcU*>q}nTtc~hdp6l7Ekm6XLZQt+1
zP*)U-cY&Nn4be;<fYhv-ltE@`MHh4Hw{6w|o|(vr06+KFEhqK^8nu(Y<Z~Z+g1RsT
zn{Gy(#(Hetu_=4xF74@VSHT`nrylQuo-5Nmfr7muPQBL)dT&nm#t8PsIrSwK^rcSs
zWeWD^IQ8Ex=zlQXUnKah%<0|Zf_GKZ@BY7ozphMUhMA0p1!j=^QNu`~5s8^$nW$lr
z86n=55tW${wU*I?62AMyQSFDLhAm^}Q6mb@qe2H`Qu<>jqed=1{B%a>(}|gJ?}Krk
zgHPuUMtt<gql7+-2~FJ8|Ew1E`LfV>oc@=i6z7Q;{m&8lqcb974}g<~Gh<2mlSwU;
z*)tQSGn4fPQx99d+<Ex<Rm%usMhA_a;Ugk1p=U5?hJ6BJR_GY-T8cWxyOvsLc-Jfq
z@5;l^((taOhch$IGxJfiUuR}F4rV{M%zSkwFSn4t>VN%xFtc~?6&y`sIh<j0nOl4~
zhjf|wbucexKsGHTn+ww^7JfZAm;t(wzCI+e3NMnK7eBSkohn?w7%cL*d_O<Cs3!dF
zlk+#-*>4Ep?}XObghMjWWf{|s)H7IGj+#rEC9Am1jF#|eMt}Phwc<a!5;FV!ZuCOK
z;bM#MvW?4fZR?7{;c}qM%9GaRqu#=04dL|{!gNh8YhU$OZD!XGgl9&D=sak6R|%sB
zdL#81@7mxx#=AB=|KeSeG28|2n`~cMB){?r9&NB0Zt%2iNEvP-+x~@j-J;=LWaeAw
zo!Vo(Yv*ziC;Vu~;VUAbjWLwS7kRY3*#7$=aVPL-+cRe8%Gci^Uw=CkZ95}(0*iJs
zk-x9G?nHe3O>m`tB2WXrQs21lrWXHsfZRJ1vwhKU_es%i;Md*ju0l7Cc3vZQTiU44
zT>td8?av(Tmmnd4j_hVRQ)X_vlkeORr&l;#FqO7<)e?fov`;Tt-Zdfwa~i2j4~ZBF
zYTaTKcci!<8O1?mE~IH8%9}G79zK%~A1Ss-P+&bPes2`j#cOiniI~L}NwQqUOWSkB
zbVm5mpqI)_*&xfAYp1e3E<aUgV1ysOyRV<B`E2rq-&AuH%ZZxl*P%ZqTT)Nd&bCDE
z{W)OKsv{ADd!Op2Y1RKP;jg@2c7t@C7b~Cs4gMPY;FaB)uKQ|z=IzbBLsq?}plgr3
z1q?IvUT-ea;IDJeH=DMW$0{=DOXkvEzc=+5pd<U$Ys2jjKVR1v4ektz3*4xM8Ma0a
zbQew0;IFpBgZ;fdH9c26C^&4E?<NTlYnKN+B0m%)rJQu}fboaZF?xrO7m6i8``nW@
zBI*-kL^H4+DUyX+qIlt&J`a!Y%cX<z+&$s(%qqOsNbD+F^Nes=5+F?n8qG6nud?bs
z7``a<%`NL2$+jcRO!Ns%*}1XKBx^-5)|kcRQW@;TnTH54?7U391ng!bKF;5xr?`vj
zR3p~=VSY)ncj1loe($2NCphoo&4*IG!e~649hL#F8013%$O&q)PFJz<#yU$-Wt0<n
zNz%fCF*eTyU!3-+K(Z1BJ9&u95JL$L(=+0lSGp^`T>ki0gpBxB6}KMVazvb>n)}uF
z2&ejm;6d+K1HY$N#PUpCZAjsf%{>~zRVK-V^szr@{(=gJaa+tjPS%K+sBBNWS;%ug
zpc0yIYVyQ7VOqMx=(fZ(e?XQ3pd^Fc?*1>&28LITuFsj327)?a?_c!XhS;P{MKn}D
z&d^pZzm9u3ZU6eGh-`66m0H=2t37-f`R~hLK8bZ3?3d9Molk5BcxGfyMLe)d=i_k-
zehT>b;1ZD&sqfmsrt~3n)Ozo`_1I~f^w3YGE&2Iss7o?=+8NQ7%#1hVqip*h;8DG&
z3(dl75^jcH9RA|-6$g9ppwf3RJ}DPaSGBNts(ffX;wn9(*M)RykcHug@c9hG=nHCT
zeL>EPdC1)GZ}|@&OL%za+8QBBqK_VKl=yv{63YI@sVH|sKIX((7VpTne;h6FQPQy5
zORJ_#na7M*!d)M)m3-#G59|`sc8|Ud{(7mkFk)j9we6$gq0MON-?sW|_T0B-&o6G%
z`PxWVuU3!mVtLUXKa9hYdDzqUqYg^7bCS0I{QTH9`oW1OPOr~HkWRiB*gLGhCquc}
zOc7$VXwRazP*zhNaXwN^CPLTyFQVWb05(P=kYrG-c;f|4mknm+J3$GzpExC}Gj{U6
z8!`}lYr+_qjD~k5TbsX2RL#vUM=@VbrXBM^WF~is-|tL9+m~__F?Nfqs@$@#7Ug`5
z>z4P;PBxq_<=~h%74aBO77RY>X;4(jlW6ix^z$ndI6wc4HxizN;_T2GTB4r{m)0wt
z;uqeY5HWbPktxSsj_e2bscJ6hEKisq*q>mBpP<f0$S;WYj`W>;-j@|-ndq3f-D7(z
zI5(V(60%9@sh`H7on=m{zRXI~1=(VNzKe36_bk?igAHEBSI9fOKDE20nl}%Rm6hl@
zRocX!_u8ofpJ<Nu^kuu(VgF5mWyu`=HY;~}_0fs<n}+a#jocHKJrZe8pgEY+I^Jg%
zwR+vHL!YV{tc}g;&YM4t=y+ThtcNlfJ>MS%q7;4?OjUa-IzZs36#c1&88XR!h^xtY
z$V^`%-!qaH=o?z*UtYj^)Nej`395Wng|RZoOGH7PnOr8qxvYit9U&Eu3CdoUVRU95
zP1*5!q|q&6{rJh5SxRG^COuhVlX4o4JFO#ab<*ad&go)RjS7>BdApqEF|zvhlM^Oo
zP%Y;1x}Bd~li(-knew4Nv8c+X^Y0ulWkWp@?VtIzq+jgjJJ;}NTj!d@2WPVE=QHcq
z<fDW>xc>4T*8?c)wQKviMOl0%Y3)?sa**(hQ9DoM&p~*sReK{(zP?`QQ1@NF*Iu;Z
z0i{t5U)JsAV{`M%ROQ(_SbqgQ*NY<)x4m9YR{39<_nDl2lqc8tV$DAR9%t5L|FUcC
znLmMLid-}Psw~|*xXR(kagdVt!h3tgyN$&q>9wbPkN+BX#*?X!#hi4t*eiDLZ_fHW
z`mFZD|EI<Ko9$HQ>+0Lrl%iQHUB@=B+wVmE4Cxi&uJHP;deHJSrWZll4SPgnI8=!3
zz3nh;OMT7DTAO5ODZgs>n;4p#p#DK6mHuRp?B^%S(N=ogoK?K4^1`X9?^!(aD|pp4
z7>McV4?OvPX%P)1>kZ|qI{8NP`wRp8v#wXWND4%hU}wo$7x!H~130>z)>Tu+Z5L#c
z)bmQ^WC&v=Y4v`XffEwH)ISz@!K?3mV7b<C??l`kt&jHxaWB*~6mq;ZetmhNxjGoE
z;Ay6=dwnQE;a8Cy2TuEljsMwQ=}_}K1uxJczuR!r&+i(tuI$;a*XJ0xVO~g)d-Jc#
zJ2!bgu~PUT<m~kcg}avXIMVmL*q`$+qhA0+9{TnUHGghZEWV)PeQ(?1LSr1mPIbiE
zipR-cI(;>1&p!|N%}avmTv=bdYHKO5JEa@{ecDK;IcTY;4<|1y_`5d2Eg;nU`i#)P
zPSyLU^-#6M*|o3}zzv0;{gkQM3hP9VH(43_diPbfw<_9zH9xzd(_eA=;T=4!`H4Ay
z+NRbun+#!_pR?}HiO`|W@;Bt3R~KV|NxcSIt>@>~zFk!0`M=n^&#0!ly<PaB1_&ke
zAT5A&P?`{WiPC$Kj`X6SAfO;E5K8DEC?H7hy*CjP0!TLqND-B$QWdNS2q#$X?cMfs
z@8_I%jOV=Ld|6-DhqcC>YmRmOuU~<X!Ps``NboX4jO>vA*wx%*`MQUbYn5B_jv4z3
zN3VrwZjA2dV0C0(t$OI~r57>3tG@L0G*6gZNg@joSN3bUYacq5K_{*WaK5r+m)f7j
zoch#~_G}AuE@-|6d%5$0^{sVO&0ww5$2-fCTd~eTvmZkrT6|W#RCGdTp)cWMjZWx0
z|FzDiqp~W60S+`km(Mj?NrA)}>F=$ogqCcxzl>jh{-NxF*SgGu8^AV>+`#s;vQiIX
zELSa84QLeKI2{GzrVl?AP2ay080Oz-82V)-FaG7n!=a64Ihuj8pbwUc)a#E9OLuDg
zKUIZ&d1JtNkYT=Y2l*msCoF7V=1f>~3Hz5<!xs)8X#^{bU-|00bo6e|?SaAm+c4WG
z8)BKGpwG+*!Wn}@rm*)95ozXOK(cUJfpB`wa7OoVzh(qgc{tZ+1oLV*Uj5<{h~ROz
zVQCNNU-e?wj1V4(5M7Npt$Cdf6(Kp}B1DEfhQG>@@|yY*nn-1co%8_mJN(78ic~3&
zyvzF&{whZdwMCi@xabK)S$>1RTyI65CyRa-8D*;(?cyG7up8x29$g?6?Y0_yg)BxS
zGy0NdjO1jr4=N_GJO&7h@n4N$@rwx(Kp{0zC#Pe=P^f)+RMY?}aTTS04Ud4uPBfvC
z-D5LQu`&#?X#=r|Cb3y$aRoD|?3vh-0jWHJxQg;PAI-Q@Jp4t8jH?oeZ)%UK*^O%p
z5NXhizc&zn&ON@JEFq*Y{=Q~H-)_VMNWvhBAM2hVS`MTI6L@;VGXaSfU^Qki0Yg0%
z(3ybNo?z4>-n2YnIUo)SNU}ze;0N5*z2V1-*8(Az6aXLwxM8o7DV9v+on(nhSXoW}
zib>cPh*)b++JYtTkg2^V1H7<M;m%Lm6G$<fNj}m{-K9;T{Sr<*n8ejf3KUGHnWZFd
zrlKHEg#<>@Tc!$Dh`e&Ysb8K-N}kNAmHZe+9j<ayH1Ot9`Azu_e&*OThTWTN_#m)W
zG5}0K>`bt(nXJ4PFE^NG5Xh}Gm`)2xhfb!7YaON2kW-H4r|8JuQb64_6ue!_b?X8P
z!Yok5JT?VbobuM4m|Y7%<8fOaa@)xxqr&L6Z%2r`hswn-sZ3(YAn>u`1zNauBM|8y
zm=P}s35?AwdzeA8l5uv8fI%hs{R~mG<;~=^h`7PbyjkX?!7M-KEMloFPyB>cKJcV0
z=#K22hpXxNg4u&yck0&sOJu3bJXGGV67W<cQHxR6dSqXPWH))_G#X`N*RHl#WRvt}
zFE1P`UQYyahGZjh19N7{nFl@Y9;&A>ED$cT<VpqJqJ`!z%Thn;pxV$<nVP)|Mcthf
z%)5lS`&Q74xFTJ9FvUD8Z#^LWQJ~5jkE1+hNZxyod{?79qP>f2FaXthK4E=c##%m=
z_BX`~N(fy6P*vu0TI2&S=9AAA@W{n;QWU-uEIe6RSm<8Jf9I}XXQB9wSkd*ue)1xT
zxS|BjqBBC-GIxrUJ7eUBit^TqR4x{K3lzgUGtb>9*0YM%sw}=XSgfyIVntSBBy`)v
zs>C`jx-Yim!W@&;P>GXvq&Y>YykMzwWvQ%tsoR~K9-XB=b6IxlrT%-IB7$Xsdnm7q
zWrt*CHz>+Ew97&$O2bZ+$7qKKYnKnXm!sCpgJI?ICrT3c%5TX9#R*lQH7jlpRft0>
zvWAMX=PHV<d^0I3>jWx`D=Xi)9#xiIjH~FZY}mV4vtD_Ztg11t%1^zjMJ~4OPSpc#
z$9qFnv8z?+i`Bfl6<E2vz8lq}>rsQ1)pLTE$FyrWW_-ruN}j7BriN;ot{de?*1*?A
zlc#H5-nbFhXSpa>?A+q^YQ46}O}8$;7A|KezFqry?naMX-KAC0t+=|Q^{a6&J@zRI
zkLZb3fc50VuI%dd3KXt~mG!jp9#&84Kj7WO_=Ztwrc0&`3K#45Ga9&9)tE^LS*9A`
zaf(otTJGUSn5pHv8;#m`8oxeiJOi?HB4`q?Dqifp`t)KGT~G*bRnvuaYQZYSW5g@J
zS!cLeZ==}&)M6yuVxrSxcIl|aJif)Us>OP^#df3R0;ttNxYbFg)#XyFy|qW6iZhXX
zvo>DwLaWa5wE60^`Cn?g9^V#N)fP0|7P8S625Ju%Zb$00e}}(ftJ(vEi7ufVysXRc
zikJ62;#-$GGU7Y3syc4RJ5Vfk<n4EOG<Ou~be2?g+y!-3RDlaGb=GWjX5dRHsyeIp
zJ6q&C8-(vw=-g`^zIO{RfU$O3Pu#->b#!B8(EA-^5$wJ4UHu^9fsKx#D#BL0;)N#T
z19i++F_E5AHI!2mC9VnIxu4olw5-#;ILtgB&$7Y9dL{niliTWbi`|`k-aA$IKR;zo
zhd)SfxV%8Y`fC3OqD6sDGU}#j>=vzjfGNHF3B>xo3XK|numy76--pm9JYcS7rlx#g
z?ZoC3?t5!oW1s?_)lft}Vo%w1;>5@Ufq69j0h&n!^H#@6Bmr|qmszOGQR?8t;s?yl
zag7<_tByz(E|CYPx-f^sCtwO#wqQ1G5g)nD6Z+K<F;A>nFjl>*S5t&lL6=2Yfz^hx
zhtj%NA_uEG-{ZUqG4*6K4u)J5VfAF=G4$;7ooDi%@4rgPYEQ{x=gD@1jU|{3%g}Wt
zp!&o$wui1cY{r}YO$7syx(|~Rn7q3NLN+l$BK_$iy<x$F;cT91Y<(67y{Kw7?ajd}
zltVGqeJRyPLzl(}3ai;dt09O4w)!qe<H$f+4y5E@&^`EJt-_E+^>C>O7SlD<r#qB%
z(09vbI9p+OXav&Q)!&{lG~zST-Ni<&JJQp|Gix(aRoye+)i)Ll!R4?u2WzS143trh
zX;F?0%=g+~W3SL1-QFB~<~eezYiu!R@O3a}z3$k+&ge&l{-+|iaT{EZ=jf+uoZDje
z&OE2h!K2}VhqP3<-C*3kP2AU=R*o`G*84b4+lSjCkG^`!u6lBUM@L4-am<SS<RP5N
z!<=GNk0nQOm(b%hA?$p5k8c%CjE&=XY934LO~9$_B(^w@CMM)Xo5e*ZPv}h=P<3dE
za;sAvO__O3nI}$J)=XKCPT6ivU7&j6Ao|2f?}>}o6Su@C9yL!cjXv?(dUAzo+DCNS
z_y56P|Nnx&+Ws$uzurFmzt{58y_kdNyuMprMpyFioY$|G*PkJ;M}dk_H?BUqq2d@^
z>KIZr9s-XGz4m*{OUFDCmKGKK=2y!r#`q7AmqYy7toVqx@fy>Kc*V=wC0RQ-r8zex
zW+vr=N2=a*s(tXyj)a>zc*yI!;<cTA-Y3I6I-_ka!=oz`QJ$6jG|Tfh#cL<qAwH)Q
z4|)Bi;`O{J=v|Q)ve+xVxErr{EtZD<h2m8iIaqajrYiAWRnVUaukU^rwy|`xDe*hu
z^|2Y%-%{}p6|dLb1*_c!<qtCJ9?W%OaO;?os-B$5o|g6As!zQI4gE!!{)yTCj*Wr3
zmcjC8LtUFgP5r}9-u(i3EsdeSTVB6GUN6V7$ClT`56f%wr{%T%N6QO4GKZag`r_UE
z|FgUhL?8~`_WDIEieA`mq`hJJVG55<u5L%;%i&DPOV39-nqEK3hsSg1bvCa}l$%u9
zjdr$dOxHUN=jz>S-Fn*YyYYPVUfchM<@M!P%WI|LkCvC`ua;K|GuRcDAIWrWwICEi
z2*c8Tx4bwUu(W?;c`eiaVtG;HEid@rSzdMln0~N{oyV)JzEMq{NYlc#SJ~~czgS+Q
z;6GYkPcSL4rSv~oUdzLR8|hMyN&=(tdcDTMLcEGo4)oaa^8T~s)pTrm`I80UEw8|<
z5zORMCNcbY%j*^Gcgt(9=l7P^3JBpi`J3hC`itd-6ZEGftWepVX*{;Pe6_^mDI3Rx
zGkTY`*s}~PAMw6X3XX#%Pkyt!Jaxn~X5<ZP>r4-ZRK6Z=4B{=X_hhU=n`+?hy>6R_
zy#0sTIOyWu@;A%t5pS8hB-yW)mkph0PhzDo-ts#Ao8@KGD569-<vS?cG}$2B<^Dcn
zP<TshWsv8m<+UJ4$j+4yIaK)fmRI9nT3%S_?<}tckwcqrmX}w&vhh<6yyXS>&GMrD
zo#mAQle(_j3ixh$jne+GyaEP!ezCkJ8<L*g2L7exHS;^mtL#6uyv$>+R1>L)PCTtk
zxlSl<Q)n^*a=dZ$*Or%S!{1t7m%uuIVR`M)9Z5c+`+RJ95&hBfV&Vep&c30{czSp8
zK(%FTtJb#nFDx&2yyZpk&n&NmUo0;)Q^%f-ly8TQ>=XTKb$3ccudK;r&n88*q+w^9
z382>QhH5el#nN8?*z!vIo#o|OkbLexvAmrB((>9<L-GheXXCv=9_L7AiBHARt~*o{
ztt}gT_@Ji#-?6+{|B2<bLjm9Vk1Q{J>Y83_q#yc^mRE*Fugsnx6g$R4@9&)j-!sZD
z)B>ygw7hnEuEfbzn`_*&=w;W39$8KchN20-TV7Kfzgk`kQ6VAI=9xb&uVuzRSY8Tv
z%M10x^14PY_-D%tfVaFT!^yA0%vRsLPS(X+UY`H5yo&7qL(7XNMveB^@@kJ{=>2z=
zS1tt3)ay-pp&Cwo2ZXB%U5e%TgXQ&3O@8Ls^1?9vmF0zI`pxok`DS?q;w`VOMTV!<
zyj3Bio38uCGt_hceama;hvkK0dkiwV>A@hnG0>*|$}2VK?c{T?G8tBoa0m5vf5~XJ
zhTpi1)|xn&`xD=H%d0EG=O0*JPw|%5QoLOKzbr4xC0zO)yyc}37dnY?)U>`U{bUhu
zc_FDh@s^k8_*>O_BjK-j%S-?FmRA7Y^4jhlq+B`~H^ct+hI#uVph0?>^$Mfpz*)X;
zme(e2(Y8H%@dDoRs{Ceo1#^A3yfX2YmslM9X{~DUt06Q01yD%N56ep$)m8hLa|-rP
zEUz2UU2{`fy9<x~vL0xMtg8IZ@@o3C<rR;&yzG$>yya!|N6X6u81<fN?hKjpNifgD
z)5n$<_FtBl9olTxi3s^umKPFDSoYoWvIm`nhy-9IGjQDF!0=~kXVZRfd1d{yyfo0q
zmY2qVZh7VAJ7@j0yn_Cn<s}BXisMe{QHw@NI{pL8D;aNjeI~ns6toVA7b<|Yih;)I
z<gI^NUUg7v!Ch5?>%_U=Ew7t@V|j`FVtKUzgBHmDx#gAn2g|Gdcb1pqpDiy*5Z>}i
zUiiJ`<$G*-1sz*nJV0<$qS$T5uXxJ~Un%;V<<$%<`WwruJ4I1<E&UKIkoyPAOYE;L
zuWmFk{5Q*M0kkV-d$;Eo%j+sdQIjVr=G;Z2z*}d8XW@Lmv%Ho-NF-N6@6}!tfooV1
z$h(YuEx}eCx4K0J;cu3gFGb$0`6s>%KT9wrOL&VUYy;_F{6Eq1k|2EzRRnyqyh49k
zURggaud;t&d1d{FmRAt^*z(GNl3o=Pj)zJeTV4y~-3uhE@2SjV1fz~_lsiY#Wc_A&
zT_^vu<(0fZQm=8X+y0vS9k$DJm9;`8p}$yONc&^U3%)?oEp}{qCFh^%#@%j0sD4}k
z9a~;<KP<0%KP|6hyyaE@7nYafFP2w^VbN=R@gxPMK_%7Pc4f_<EUzMPvD52Xdw0XB
zWsp#x;o$<w=r5L+<8PMNE6`;(F#l&VO{ohZMFPA!m)$x|{27t1ZsCyK+Wy7jl%sE!
zm(xPw9z{v6eThG!>DcmG2maaes;j?NCMJ$V$fGYBeliXuY-ot-tA5tlpmfcGjg?ue
zis}N)*Uq<@=)Yxob>oRayyfNn?<}wG|HSet##>(Ar04|_CxD7)eV6}2m%$K4E{+Pl
zt&7H6UT6xZZDN0L3F=6`ME0UZMnS4TS_2V5unp2T7?`r%C;1namoRA)xaJ|<4S$Dj
z`ImU(>>k-p%vk|v69H!mn_?4sfy=W(?Jvn6JXOaCcZGv2jfN<0e=a_@ysUsCm3Z3m
zo8>h`TDK6Yfw#Q2$(rhm3{P~M2q`-4G22;X5r=oT1*$EHc~CF95S*a3iK6+6cCu=~
zev}4B1!f9jg*@fKriInU*IbBGu`JcBlEKt$Y$fKv9x{Jwlo+Xq9O$)*lVDem!Nqoi
zPVR@G?pW56^a18C*B%n9y5J^rK!32j)=B=x@&X)NUfutd<rVtV@@o3U@{0E+HRq*%
zz&4WnXUof%!V?PITci70Z?1tE#wd(*dyX(TjSNtZ02)VF9rEamXdKoDAB%U{AKWiy
zYj^hS7xDy&sT^Bg#lN?_s(-P(n(&sF4|(t=Gr1xy=qtYTxOd%#V^d_PnSpxcLviv?
z%gYT-YC!Qn!18KB7Zzfvg?_cXZvIcQyqbPmUP!U>;PtZIi{&V}GZbXLg{*Gx5}&W%
z^^UUwwpvg+LjP!a)!EDH1N}eQI&Hrs0Sbbr6Q6y>XgJpY1IufX9R4TEtL&%c)oQ;C
zJER)ytR@tv`KOi_KX7bFBBZI>R`y0onL^Iz@=}u<3F);%L%lGcX*ThChQ)cp@0Qmk
zko*x37oD}bsQhZLBPiz3B5}}&?KSy^<6<mF1I<^u&~7@8OJPQ@$lX%@WO)S;+o7*X
zo4j(R=FI(WdHIk_3@5fc7RZ2l{m$|-0X9gGiEYpq*U)NRI<Kn(&i(h6ml+W8tL3#r
zwujRP{>k$4H*B$nZ?wGOaQugs7lzc%{yA|2_5VrB%klS?m)+l4Ua!do48V5Kbj-!m
z?}OyEpFC*VrZTvS`w(?1?7{=WhR=U(d3k~U&hqlF|C8k<@x$`+_uh#<lUC>wQ>BLa
z|H|_6zxIX40=J+VNzQo6c?P!#M}a<mv%KVF`DczTuNM`Z$`Ze`ysYlt7Izsdww!pS
zmm}-{W@UEbwL!jW6g98aB)8H9rPHGlb5i&N8rjad6050ovuewh%P;4qHq7fOo(As7
zp4psjaGR=idHQ6_y4~mHSc&!Y8{4kHk8fT+oql@(tvCIjSzbYS%PZFMo8@KW_UVV^
zb>*k!wU_!&Ew3+GcfVO){l}Kq$4uX!mY1&U`{n;3mRF_R%^SY@MNj7c*7A~jNqpK)
z>%(~NDVBO1<VCTcy3FZYw8r|^|7Cfl!E0HYZW28(Heg$xWTG*<HFaJm*v!<%r7;R`
zd3BuC59{u5zH1X7f-=<`RR9f1J*>X<Kw2<OchF7C^ofNh^9g5*5QYE3^7@?4GV|T?
z(x42B{#(n-;Wx|cZdAIZYsDFi$keZv7x38fnpTyNJ+{19mz}jA{$_c({+E_lu1;&V
z-zdN~JLZ&Y)6G+BYO|6-wapDy*-y?q`_1w?wdf^{CSnfu?g7atcpn7hHf~~BuOIjf
z@MHvE9lF4JPp4maI@oti{&TQeqcZbXZ}ydxW&9jNKZLi-q)d2o+)2hpxiXdwnf}0K
zI^_Cu9=9bryybQEw)iQQKU!WfIyT80=_}2uT0m>O<u#}H-SYYb|0kB$@c%i>OONuZ
z{Q}|rjPI5g7zsJqMCL_#Y<a1(uS2OLCY_kRSzZk>8Ua0^XHW5#*CL7IB2K_znT|@(
z4DAcRTV6xISzguOEiYZX<<$hiLH<k2D|&(C0_9K3tISqxk@3BKIKRSo%PTphM|gcP
z{@C)$g?zWXHp59A|GnjfWWb3SN0cA+H@g})nLeI;l~g?_>G?;?3nluC<<+}QAxhT^
zdXBfef`3|G0~|jsFGwFRch*>5WKGD*hf-3c+qjQ$bIK3POZnegUZj{R#9&%@*0JR!
zi?_Urs1bj(yl76l^Zd*568M+p<@-05S6%>|F?tbfjkmmz2r5;%HPEr;RrkMPdG-9T
zyqt)Bv%GfjmRAqn@>-w_JtL(0)AFh(`L8T5jel%;<>4)_u76oxmllzBs{_R+3E@$C
zMum2!5K6q|#g~HP)iG_Sv6bjUb!?Dns1O0Oe^_2Czqh<hf3ds}VD0AbmRAcjjaAq4
zyX8gqx0V+mnmzAhAM8B2{Ol%#y{sd3=@-jOqVMM5$yW@2V|mTeUOimD^THGC3jUYn
zRZVy<8-Ro!TV9|)SYGw4^Ys)yDdpoQjiY%*2q-9DWKG|Oroz|=NNrU*aIaVWYh!8(
z;nO`-%}NiY_5h?t8Jf(l`A7*}KQgiQ#h#Pe9}1nCH+;#Q=3iT!i_}Z?)M;16^(kFz
z{4yUy9%+A%Qw&|9SYxDfWsdXcCaMNaKd~0pBsQ)GOO?i_F3H&dfEVD0SQapVQUN&?
zbZWdx?<`RAC=>e{K?s0s0|4!+U@jFjp&FQwGY3ma20;*N`;h_2_K6r_KyfC#$3krX
z_$0Sq>_q~ARGI)W145cO7@zHALkw0~s0{e3a0{Ic0gyoCfB-Q9pzZ;i(k=iXuzgjv
z-2LUT<rT7xpfg$^d7ZC9Apk%SsMrrF0XuP8&9Ow32m-(^BD6*vLBr3sKqc7@uk>E-
zKO$L-JIdz;)L*6>w+En=fN46RDEwWBe1BM8Yk12`Qw9L(CI|H9%nr>&;w>)%E;6pQ
zlWjjNua9cuem^a*@}HJhI{fKM=_(1{@^Ux{K-2xSyuf(N>x3*M7jJoi_P<+R2cOy>
zeSLExKjfR`CHafx1;ATg2)yMLfE<wjZh0yF!SYJ{W_gJL0C>wQ<Gbah`pxpf{$hE(
zmwRb_Y<Wrku)I>sSbwp+Mt)je^)gpkyOV-CT7Otxv_C8_*bmDKu%PfS%S$K9R8!@s
zHxqAp<y9B`W6KLb0w@QlP=;TD%AHUEQhEQvdCAMk2+(E($+`LVHuI2v=e(|d<Gd{9
z75#p4URRGfFSwR&I76`1ZXo`ORab+{#RAFV;$+GNr70<8PO5)dlXR3!B~L-nk0Xen
zsh81!c45UN9@=CcS{VS~iexGu0Kn(0M4&*+ppeQY1~>@;P*0Eo@*@~5yLn8`0l?9a
zwcesjgf~tqI-u_R<n-S}p79dscowh3{srNGl9tN?K!@qD_Ut)Q%GU^zN@X7C_eCg%
zSfA<K2e_Z*bNW^Ex}=T{=uiDk^xBAG-9&Po{3&|jqORgaFK=So%wy4u3QFowUhj(|
zAu0!$7)HYfq`6>#0?I!6UhPmyrShUdFbtuGi&n}XWb+2tZnxnfnuQGw;3|npK7bV0
zUSCXPD<E%MA5Bz_FoO{T?d5b-2(Pm$(}e>LH*{D!hN_9NU{F__Ld<!};RcamUvJ`R
zUm{`wL{E09FSt7)VNgzJP$rc~BR0+<g*d~npM+TN#879mq(<zos28O?AYecVDOV#!
za`Y?`QA|WahUg>+&~q`ANE1%IX+1`_gGaqcf1qBGa(LA1Zq5(X%QGlC<{RpzSKe6{
zU$1AV-&E8JhXBg&bwafCf1qC8$EcSLF`_w5zq|^Mdc`!d0>rkJ2k@wu(<sha;p%Uw
z*8m>%BFCd%lfi>i&OcDE0$s&KJnB`BN4;*^2^i5Ek%sZmIv~#QHAMU2Q7`*r)QbU+
zdX<llos6dc5^V-BW~hjwO-zNHNwu3%Whoe^=OX3vj|2$-I6vZO=tf0$O6+%{M1{ys
zgEOYqVui>is9u6Hn;)P55`EN0gz!wGow!(GRZo1P{y`WP4rm8_gqzUzJQf)b=gCKz
z%$y8^5r(B8$+u!J4Im|Mbx}`E&{&Z$C8oZ;D99y-07E*%Hlk$%j5O{W1KBfG@S>OD
zVD4_DwT0;e*n~db@3NYbyJ%*9AFA}t?-I9&QANd=1Vo<OjTOs3X?kWtJ#k9qj+kR2
zkCWmPf;(nsS%?b+>g=~bW@b+WX@8(w$L1FL$+Rw4{l<BHytxI|p)Ex7Fh0EG0=Tnz
zQ|UKz3wF<A^Sil4;J8X8v^s=m1cheCt?=eniqS<EI@iQ1g81_edNW^rh=^1WM|Djq
z#Q4Rh9V1UH`o$8zDg&w~X-O6|>B9j;j9jEJgilEXQT`0bB8>)uxWg*W`?T{}uy&ja
zf@<3!o#(!t0Deifpm*pfpU_6x-i%VD3W1uSR%1epP$m9k#N6a8zBBhTpA?DGX+RJw
zlBtaoGrpOVhg!2jcn1qQOSjg-pgrp|H73uS#+*M^&=eUPWvYXBu-Z)=P?6T~Zw?mN
z>W70hFj4J7uQ^W2Zb5J*7Ns!|;bTN5t0@+h8N=g#_Zl8S+m3WFMuoa-RrP_Yw<dpj
zSJ6#Xk~)SsGLs+PmDjVmT9@twQCf@9x}zW96%i4+_c!orK>9m)6^%5ac7Kisua<aI
zkG(4%YxD2k6?ohZ_S6n?q371IcjbfkuE4)|S5RXHA0l#h42?IEBn9mOdrq=|C@3Z*
z_XeaS)?3v}0L85C2G1sCBVI)Te0}?fQab6z@#Ix%3!c1E>maais07UuU4DK{UV)Fv
ztKO;9V#P$c02@?hj0@^ixyxK+=Iybq6Jg$`q6eDCr{W*`n{r<2xP3QzCbAO%KrnB2
zl&8VedY{pMnWNJ>|4b1<Le}N0N$@s7Zhex}rMxqh9T2ohLXt9?SA{4`dvpX80E|sM
ze~{Kr?mA4KG7Csqw!#7Ok6kNF+-O~s**Dh;;>2)GV>!K@(9kkH$cc2JK1LXD$7I%u
ztcwINr(m~0$F+24U)D>HR-|>TnM#4o-9+rWYo+DXDn+tuI(zI|Wv;~FT`Sl;!}&!6
z|1_pkWVLI?5ipX|nuMp@BTWRN&%p=`a54OJM0|iq4SOP42(buVj2teS2TbH%8>0$|
z;DVF}0*GbZfgc@TSptaTwj&(_BCiaXX#q&@qSD&jYuEQ26l)yi5F>ifr5WTSHvFbw
zF-%cUY63&>y_(~HZp-3;Ah18{V=pd}bl+olMhOyr)YcM7h*sgeq+<(?l>Bs-$YME#
zH#I&e{E8S+D+8gtG=K^R0C3=7V@_U~_K%*9+9B3_q4v5_5?${*@3SGwd;wlyAn$Ov
z62S7L>FmAid(^!~I()Q-nF}-LEbzwFo0GJv-pdS`y~6z##AJQIOnc%1>lCkx6uG1$
z^1#^JkF1hX8TBb$PsZBtk%^;=Ercdhb_oOrm?7JQiD=*yz8VQuZ=y12A|^0}2xm!&
zNY@=?L|1qohR+Q-JnSaUY9NrV-w?@+5)*)Bf7h)X3El3C1ge`*XD*X$6I{X#qZt*<
zo*<NJRm1sc`9E19m11OC?6S-NCvdPMk;^)qMG=@wv*_XeCcTG=N-@Ay_msm`1Rl8J
zT5DCX#sgOhr)Wi(1}*KPsEOt7@aW=!t9C^kLHj*L)??u6waZftrKbcbcxZC{V9);Z
zt<=<)rjF=-4F!o~-3oxL<+D$zS+XO$M+9-e>sA)}8<0+y3Ba*#)%K}G6-FWmA)cK<
ziU5QX2O<J22&@-2<m@BP*&|sjVz}%HgHbUoFam2FnKU4hK7e!<U2)kJDKzB3X8{bh
z50A7W6<nB-ra-dXi!}%bvAf3vaGWPm#%M`*WQ778A%F@t1c=O;uHb3-m@QqnqZhFj
zJpmCg1x5lT6$yQQgvYOxc00b|SKUn|FB(|YQqI5ewRgHZFQJ%pxw)lhow}Qx!{w4l
zN0*Z?nV1!Qpqw1aS_g+9Fl<cNL;?Z;k-7a#)LlU62mi<`uB_qttbkP0RH0KF+1U%y
zQ=|;;Z)=q_dUPxuGNYOEWd)T}WuL9^DyOzkCzyH@j@O{tE(4vEq8v^|W5*&D>#3x-
zBLflPALR(dEr<>5iI^;69`K=7pe4HYNXG!73q68i?U9NCWGZA^EbcKk-bJ|8SNnqB
zWq)U}1oVzsER><cDKdw}dEygZG$GLnt&x>PNW$cIf<IWS=*r=D5v0}@j4?NAF-P_A
z2#G6ak6o<xd%ab<E4O{=0;4z6(7wgK@>kxDAs@9?J6Z`Ft&cg;S?b_jEIqu7g<iKq
ztiufaww(N8T^G8j!t3FZBIhj$rNw<R)pwsql1-4}MX?A)Am{MzSns;;u58gsS}%)8
z@;4V9$-4A3XW{k|KHfxSr)B|SAFQs>k#bVaJpNeLf@)Kz*1!OLQmDiSBItJs5>>9b
zyxvf(7wx(L<by<nf@2sBKDoW#xUx->D1b5nKoZ6s!UTL=>O^+5K691DdRfL?{=yUy
zK>Tc-;z9~xh<l7V4k$=g<efE7{`flSRusS<KutDGSbk9;<K2_mPNAgEBhd4?uAqTN
zYXF%&OmM6YU;z*>l9fR(kz^v!_c}9ABhqtUem;dD3_wt%Tu=pArt>^H!+`*z02+qT
zX#8wELM~Sx$Qy*9fdOi|<ViK{O8aL(>R|wH1ULmjAQnWY>UYlV0~~-NA`-BHc;`O>
z0e}#I;mk0;(3=?ygI%wsK@fmpIdBOTH57;hY$4)dj29Q@wD%zSTpAdnCv0L6qaq>%
zh{jpp<XRGjK<EVAT@2c^Qc46of5&tEgWzPjahY+=#g9Vg%lY+pH`YH2&(u3UyeWF=
zlgM22#e38|eqPV5>io}-SiCmKre>E`_~O)brjANH_to8$#-r89W=^^2dJA*6jbugs
zSD5XS5A&Qk_&syhg)XC*1>XZ~*R7bNl~2z}xV*b@YNVyz-C)#y;!$3++=Z-xH(UD~
zGEA16Zw4Q?+=Ya}LnW`gIgtIZ>eS|1bNQ>>r_I?sEwH;-R7-L%z+H@S0n10MT|h}@
zzm>y-)Ygd>fQk{D`Y?2HE@Y}LYAU6#kP;FFyQQ*Hkol=lyteU15YXdwPXQ*`{7Jy&
z9HMArP<<QXT#K0f0ztOLhkTXW=?tm_rs*FjNk}OT0mM}bFNpwtC!NWG1euM4grq`H
zJeuWq{TR){>1aIXf<~ST82~PEQ4YWWglE-x2>^^@M}3O`7QqD+5=fkqN<5?~h7Mv%
z6c~s)dB@0Dl!6!$c`b0ggFnyQi<dn=oMO+6V^R~CVgBCTgi2{?bz(|p3EeU#^H{Tq
zPzfK}Opwmn<Iy+YMXe_@_)jk1g5~T<KB~y;oYPk>>Lh)de;ADIFS6S?zmdPES&*pw
zH6ZmwUEhfyk-Eu`9U@Jmu4Q_nRbq^{q#s)Wspt(tisA*m4*7c}^<zyyX?knM!_D{8
z<)@@tRQ%ug4^=;Q^>1mvWGt$5#;iunRIzF3zVXLK0Dz)+p;kJZ%`pzfOY1bq1~)uI
zg{Hbtj3HQ&y(j*VUHKz_BUk+9l)OU%<rApm<`Jfs$90jnk5(gKZvIjO`5uy4c@-P2
z+%$ro9(>S{iWj#i=^jC|{FtOB^nf+h4~=vbKjuEGH=YX9GrWIh+FTGR4zSX3@%N{J
zoV1_zsA6Xv(7#9ZjK2a_Q-1nx;YU4%$5SI!N}><8o_ZZpzLQyu0#baOixnPgkS;bQ
zi6#yaQTp;^0#-O|nrQAuF2H1R*fHtF`evR+l9QFRP#-w<;d#-$L%Gd{yeQae%Ts+u
zDdYL>{Wl%&4}+Ephr5|rMd}GQ8%Dqq3XNy3r^&rng>x!?jGCZU_%wUzf#T<9K^Jar
zPi33|J>q(eN!ab`Rv!?Jh(jK16s3pVrfw}h3VSeNoFg{;`Kw7{%@JX{2!Ns<VVQN#
zVcYGtoX8eyM!inWD+dV@()AOO-fA4gAIVhM;@LZ_;`v{>-Ci@QkL<dMC6{nOGk%Ko
z6ba@!Z$pM<xzkI-FOW!%y-Mr>(4p9!naVfjYGYH=;Pmo|P#kMakaKqM&Ju`rv${qh
zj&fi+bbrV(Q%_B%grq_YJmv7jL|+Ubh;SX(P(J^fF{Epe>7vN6@QgQc?#EHkr-@0Z
zc2x3}$pY$p3NyZ5Xv{@-EPeNO#0ylpW((AtQY!f5c`4wa)}6CA(}TI_KecJr)h_}w
zRFbX+Fh*bZY($mP$17QQQ+QbTFe$HUvmY_-P%?=)u^2kT?TVpM_v-DLk{3qF8&if$
zZoOnOgO$?Xtk88Sd?SL`#R#sWCB*|U%*qzg%8iCVuMtAdkM(@g$Ub7h%?R?kZ4ywl
z7>G5pDg6y4$iX;ZFi^Vh`iID3#kY99QvcOmTUw?D(!K=By$K7sl!((^#t%&U;cWaV
zL<iEVw^UUo==pIE$)BV~8QBoVbYnCiN<P}A-2I$fy{k}tt|-jnI|fc?HCQ|*;wfq|
zM-mawTy257%WVk6;rI=aLX!p0^?`ThJszW21l01cly&ty<YjtaZgPO89~?JjPnf=?
zu^FCb3?s4FX^5Dt?k~D8`%v>?;Zb74-ZHJH`$KXCg7X4<%ZwVC1n=zU7z_RTa=K?q
zlrOGN-Yql)3Y}c1BuC8<3SDcMS?0I*-R(DHALcNFcoJ_tPG(VQ;FN|DNcW`*df7~J
zmWhoO*%dV1``}bvIT&e~cO&8$+ESRn2p^0K%=?wZhESEA_Cq9V<SgVM7)4xP$kH(6
z+Ea#Rl1LQ_KU*_y>wI$m)U~FnXIod>?mho{DgX;g(2Z>CdZl>!#zfWg4@uYWzX>@V
zyqx`9H^D(T^~~Z0tg*6F!xH@<<D^Vze&&GP(k=g~a7WTMp*}S9ihpJ}RVIRlDdpA~
zuCx&v07kNFHR`m6$~O3LfOzo;^`5vO>s%;N)x=R}TAp>_cgt&{y<hs9<+aTIzWt%n
zp?C^XWQB{qV?bR=;$~X)3h(QHK3Uxzb4`JAqectE-Q9fU%mrt<F(>~$w8Vru#eIuJ
z-YdJSG1POGFYk^yF=eEv*)55@mYwJryVfn4yQ6@tK|>$ics@jVAo9)fy6zfYKwsl7
z{{V)IPkNtgP#>Xzx4Z(?n@c3OUaMQnJx+TfRlXw<Gt)Vi;)sie(8(q1kkMJ}4J=C^
z-59vNGoEZKxKe$uF-hb+Qg#};dIvbAMeF#9L2f&O+K(P@c_rtC*6Z`>3~fFT{Y)G^
zO6^>>)q3#)>yiBIlWX}4)ymQ+RnGjKKJX?#{zS6OIHgi1=Vh31#jZ(s+wQf*hXSPP
zOazI&9f&KM;PRR&d<eM}^Nh6CyGP4Oc(zBoxn%K?|NQlU`OsGX?)zGC=5Lp#$9H@3
z-cPBV=K-~5s+t$ugJMFrS71{Wc3&6cvr9?)_#sgZYZSK!<D$SGRI)haDZlA62gEdW
z+P$Dkn!6@%>8vrZ-Zr(1+@};n^py!F>*%&BXcSL97>eX?9`AiulHHu#^N=AXMR28G
zq3=vc6gB!roN}lOOY5#|LC^Td`|t0+<<E{W%G#c&IC(#RSJQnjF4V91%DJVt3I|^q
zIQ>2LZKW?9(cBx<ks;ITu?O#=ABtq=6Sdc~w?7Q&ld}L+`lsLnI_P`mO5@!_6WyO$
z-KZC86a&hgjVY2&yURy21{Uq5@1$RM+uq@)T6$|I6!jp)s?kt$WZ8+V)dlWx`w<~z
zM2)(Lrdqh!A)Yg3hTi3~8egwC858jw{f0oa=mIyDwI+}G<AAUO|1FTUw__mgNEtwC
zU$|<pBTF(szL39?OTBGis`BJ57c^f0N~9J=q?YfAvNR9q;el$4Qxcks!trzjlv0h|
zb3tTMmFY_=TQ41JPLINj8oLdl%_^4Slp1IWDMi@>-Be|_xlM8i1rxHjv7gssvsd-W
zA*4FuBAJ`E=i)jPSTun+fcK(FxhXmlBOnSra`hOfCY)~*BNsqO9}poL5CPL9U=_jg
zA{HyD)Z}-Ob;XM(;)p0tA^AT*H}wiQ-V`XSF3M^aD4Vg91lpJY90l>+txV^iSVnTa
zbFeZkxGb*99?-)b5FrIk_XscGM{p@M!xhVOlxGMbcb;%}71Yfn3!EaNKgmGZ9bN$A
z7U?gP7j)q1q+iLxO}W^HJTtud%#r+Mq1Gn%^x%@EN}*DKD)Xs0X-!pe&jKb@ZnnML
zk;EmzbVn)eoYR{a3FxHUKsZFR2TWT8OX4}Sv28Y+x97b;y)%JTydX!BN8V6$uKkEd
zwlInx%2VDI!KTo|Gt#4=X~J%p3JZv!ycShw&vS;`NuF&*Dh^KJih;~W98K|@JAZQ1
z=Gl(r$`yfJBbQ?Jei9Ao=Nh?D(uiBO3via&n@S9ih3@A{yTga|h9sQhU|kWQ=tA8w
zq}0F^$7Z<n?t&(1iD5J)q3mp!tONB+I|l`*D_04*V2KoUiPiSJ?+8{fAc8*!BaC1W
z)G9F#<t66krWMVgCeF6tEBPE=@-+YC`EEiR%?Pw0F5`ZZG{nYYH^R2E#O`tKX(3~~
zH>MYoUfR{Z1U`!hTQnf6WLexCVZUp{F80!1z4S#zk@FoAm-DY^a<QxoNrmo5NZV#)
zncq@nSF!B~5?E+tE-)lFA6<-sD+Uvp5o#+}Bc(Fg*y4~ykwg1A&LzP(&x=TR|H8s9
zE?1^99}fPjr8I`MFL_oM1o6G*7zY;W4Bt;kQ51${CZf_d0?33_a4vw@^z1-%ly`fm
zE7O!lddRLtD|z!nxBFzEgscZffp6?joWgQA6H>f#xcaG#T-GIwusm$;IcpB~1qw-R
z(}VZO{Nwr+ocSY!+{<iwV2Tm^t3+mZd!UpLDK{}-=WsSi$vzu~M+D9^(j&8q=7Bs_
z0NBN9vneSM(Zh0KDdn-<5sx;*PqT$PQkN&+!C8KCOF49ZImj`QexzSmkHKl$D4;O(
zUvLTn9(?Fko&~VdB*xq};^F~9Iww3^a4LU>k?l$PBOBg(Ye)zhogS@i8Yg&XsXVg4
z!--Dt?vjE1r`LC%2)>{~o+Q@WNpP!ghO@=0E06Smd+qb7*A-NzxFd%+Ow&$Jj)Kot
zFh_Xgf50ko&(n5Ah)x=a@Afb~yG6}LV6%Xfa;#)_7b@e6Q7XpdtP564JaXB4UEP0i
z`j##(<&ilGD<Xmw79%KcCZeYdx81I+BfNAYE?l(WWO40$aieO<iD3ygjL0U2(0E>W
z<{48>x+o<^=B(q)7i{x+;mfxCY>k+zxysI3;d|<?jN5McVn;Y12CNJ|bx%oHKS@NP
z7I&X;v^FrcJTisNxkrwY&@T>o`h$BuB$3&VL0V`Hy1)k_Gk)x>rbtQ1x{2X+CWHoH
zxXW{xN#l82g$L=95Ztc^LtQ*c^R076sPQ>IflQ?tHT~EZENB|G?$ov7)QJP@T6+d1
zcdP^ou6(WUyaYyY<}L%yc2Iij1*PCswVHEFaB%@wEjoU1DWPzVF8{4)X#op!#1!?b
zC)|k_-CR`HtFhpK)GoQ2r`>wF+-~z$E0qLPl?yK!jIn1)N2f#k1V?)04xVz4x-Bdq
zAtOko>Q_%s)lN)ayee0_SuJ95z}qMlC+dMbU7dS+<fuo|SzCUlM|c~@tI#7^J+J*~
zz32mWKmAmBd9CP3@zx^tYSM`ESoyV3IDR;Vr6Y}hfs$p9kW~zmAaQDk>1`vIyH)$+
z7u8rE6b2&TF|)S7akd&JqV~9}M-m#r08k@;TuR-&s9?eP`LaE=Rb9y^TgeVRKJ*4(
zP2Enni89$`U&G52BQLFH-VPRT`sVY!G0Q#dq<&XQ^7RCWvq4qGu{xmjsgr)HR4-Pp
z`~uUinv}n`RCt_+y0=tC0fQ$uE9G{NmYT`^Ix_hfyk(`J6!T79qw|o|t{U+yuCJ;V
zI-yzPTOUqUf9p!Ix48m*osz(r2}FaXreYnV!yH-8+`vTjEb=;I0+iI)o1@J|Xqj85
zrgN<tg0XRQE5e$pp+h$8B1n3E3gtLqC_qQrY8w)7-x4~-1NOwL0S+9m279mAEWDMU
z-64yo8CB2s%K_|{_MN;P#TiDz5i>G>o|k%`^n<;l`R?|BSmOrU)y0u{o&+^ZW3$??
z#%DGO%Qdm514-~Q;Z?uqLpD3SBRytgJ=%&m{F@~?&-1Pt%ex&#_Gyl#Zb&4p;k49g
z8eW^1RB#9^oGtGh7_LE{=WWqj-<Xwh5P1&tz?;M55l2v;Ak?RJH$ti<K{}!56e|3(
zf*K=HJUv{Tv5fLvFD+||m*pxF9_U&+a-=2>9u<hJxj7f1w3~X<RU5NTD{_BZa8gn}
z4<Y{<&dHTqTCd8q-KQ82SBg1zX2yVT1PkAXpN-Gc5{&yw8GX*0TSDgHbgnA9!jQtr
z#=St_Qv80Ix56<W$4og*AJiw8uqd}O3eJ385w!@lQDZAO7bMZ(cFoM(hEVs^PC$S2
z{>wxUOG*6=sfL2Svl<^voIaep(roJM_d!h61NxRW03(?GPPiV;WA7ynpgkX^ZAl$2
zoxxj&!V2c~2&5$Qr^i8x3#2tov@5toi6TVn(xoOvS(M@8y_<12>U%;W=p(l+Ro?mP
zzW2-2=b{<n{H#uvcn+%3#DV4E<2f?69R*y%pG6WEEz=~f1W16X!rk|=lIKiJV)~>{
z+-0yZVn?g=ze`{%H|bx(k{_T2AnMXyCNdwJ%qOM4xECEJq%nR`W4dw9*>C;X%TJeO
zge;n^ty_?OG5-E0*DqUMzvi^%i-O1O^+1!QbRVg(=TFFqedg$*b5Jp{O_9!SMALY_
z6?hA!H${3eMpKJzS-4B^?_+5!j1=n8-cvIC*+Rj?*Ikt(LiR~=);?R>$V6Vb9%&%+
zk*vA>wo79;<LoIUa}N4(LW{Y@u0&2tZ;5*Y@fJ}$wzL{6=zNKYXWlHLQaZRwzvrC%
zNRJ3?D4|aK!ZKC@!MHhR$5DS&XY}ZUt#^~mQ)}srCdSWF`4X)j1b*^$*epgVU7lvO
zWl7ev*XkqBDX*y7l#(1Yga_X4XX0x%?;U5uEb`2x+Nd<S(9k$t@i%`TeR(<B4aDpx
zq+xZP1SNCT$|=29Puhx7LWJd^%qF1&V(7$@wDdEF3%$>PW}gc8u_vxY6<m)3K0k3W
z(^Lm}TT4`Oa}#40B}4t%$Q+G#r+g}>U9<w#N)G~uSfs38L{Xc<EprhtXVto_KJys=
znQmjqk=zqCiMw@_wfo50_j@?@@cozPE^Jfwe1X@w_0$e@Hq{X|%Qwc-C#}3IIEao4
ze<%YCY2{CUDeQfXuj{7A#L;zY+FefZR&O`YORQ}pyw}Y|u76!<z5Kq_3SuI`ZUTwK
z99vrq?pCn77wQRy*6w{R#{bede`YFM+4NeD291+jK)e$}`DTP$o>*H|OLfeFmDkk8
z_;aP!!Q%OBuA2mx-R!^2FxnBcDOU%Ze>hp1JytrL6Yjq;oIN?nO#OKMc16%Rrsn8l
zXp0TQ{uN-ycXgDAwgPt}_C=>pK3kKpQOxO4!Z~zX+{TkfooeES@fkVF_91n^XCj^#
zOwT!zzfWip>Sv#NLa6|M<oSXprQPyEu%*h?GScd>N4}2R9W~R87EW7I=6fZ=_r~@U
zrTz94<!<1EPp?O@@?A$5R%ojws!VzYZ*8HM-SU~q<Zwml+Jc#V@9%GlwcaEJ)gPdR
z1Fl=D1rF>7dYCI-p1AGh-=}{&it2+^sfB_=&S&`7184c%D`pBf$_JtfrsfCTmpwXP
ze88)3?g1ylaP<1@1K}09D$h}ErSSwxe(fUh1U;h+yFpRapU-(XYY${A&h5h$6nY++
z?bljN*3N{P+h6$5rqn}lwngO7b$8f!^nzLxh(+3O7wmX8mR|7u<TRKQ8wj4ZRp={r
z)J)~kx-At*=c0X!s$|#LeK=k%gunO8(~sB}V2{J@HO=;s;aC%L2R@PWxEHyK<Oa^B
zuvH_q3$U-VCnDY+omDgNG|k<RerL?*C2p?ED|hy3Tx9Z0v;5-PWQ8O7Mu1fy^LNYZ
z<E4$>1k1y1@o{nFMg_XAk;$xlA`g~#7)KI%+qZ0`m_Kwg6`sM@t0U$qQgbh5G?pu)
z*nVp73o3~desQm=$+2H9tioJJ3)bn^qZ+>d<-K1-UrJzYV%Vp9jdv2;<gSf@Y+}li
z=#wpavt=Utti#@0h*c{rH$HF?^P|MDS;nYDkhYjH?s+GBvbWNGa>6JJeg)XnDfUpp
zb-N=P%ing8vY*ug@)g&IV}PPvU@WDU<1$@OWt>(4ryX9{%7bnUaz-8u5*O3ZH(q8(
z=QI&;9hK#;CzE*X(Js@yYJH5$tM7m3Msno0LR)o3XjwbPoUCd~3R;qLb4cinpAeUb
zSx<~kSTAZQFVud9j5}n&Pg5smPb-Z}dNi^;PqK!sA}^lfu^y+7zQAP#C3u`hu?Qeo
zQ@@GnrX-gNqoePb`d6zmX${`H>BiAyevcX=8M4D0K1&V1jroeA@DzJ)v7gvna=>yq
zdMQcga!2(YBIAL~p&+x4(NI97u$LbWLwe5>tJkKTsK_+yEcnhWjwi`Gj!Nv-T_#@X
z&~3-)0uBWiXk74MgxtkG_Kf+f$z}|rv0$&J0vXOYNy`9cFLzttt^3Ru?su!oj0AtR
zCCfXa$XlLxB(~*O&JliOo4FXx9tv6dW_iVxO;s0QRhl!GlN1jjD=FtVvQ}=I_p}%2
z>e*$z{APJ&y0`|i8<2LaFxGxxIUA?CX;Vrq$S2<iGT1Z?d{unQ?#^22-Ov*kQ!8b;
z&J^^K&oK+uzjuk&P~TZg=M3H<)GaRh&GJgD>F2-GnBp3}*DQ#Nr9LCy6L0d#ecZE+
zgfnNmhe|nTi<qj?lV_v8@(N3yUpdbye%rHb??=wO$az1;dj0?^C}BC?#-m{Qdiq)W
zdJG1w7{>l-#wG9Wr!<x6=*tk-84o5V`}W?l9_r;GCCo*9yREuj<wNG93*36wjXdJc
z<?gN5XlRWgU*FH&*M8bi^89AE13ZqJbMJ8E&g)L|Y?l*p{Iyp)^YRY&wjKquNEbKI
z=LO7-m$Ey=J(TGdrwM6x;&=hp@Of99n3TXz|B4<;AanD<S6X$}x$+n_x>D7iY9|hA
zsq@MT1(i|NPPDqXCtodQ)R?=)T(<(we#wbRwp59t%36();=s?|hb+4W0V1Wg7vmKv
zm;As|FQ|hwWmz5@h9e=p`u)qXa+`|`9|3n5ImPb-``~QD78++(Vv=2823$+qeT>-R
zL`PyA=N_7ya?L_R{<*m0oIMu2l0xn=;sn-ckL2g@IU_sc2!^u}9<k~Zpj4}!XdJhr
zq$MPh$@qFxQ1eKRFPX6}3s@$90Ito`heCSBkx35HE4U&C0ewW?^4xY{|BxCh2XLh6
z6zr$HUmp`X<4A)F=v7~7S5x4i&l)s+Ra|TYBpoe^0s1YgZZF1i#T7tyx3i@mti)^E
z-ISPYE>*r`$>l>Cp*(e<E6=opveb0o*a(OeXDv?F5L=|hPYToYa!Gq6VCX-tW=WAY
z!~}|kUo~DZ5YL!3j8S4J3?5f!FL&1>57l9tOTls!V@Q2gu~(L7OY+kNZizVi6&+>@
zF!CVvdjiy`_bh;>uHvL&11Y(W#vk&MHc$qvqnS0x()fFi7ODa^{b-hUZOQNU;!wwy
z*DWFV*cX(eJGPKwyg!4(CsIxUTLe8*E*d8uKQXdQ=UJ|fZeO3eZPlW*1mj-m^`;O$
zRa7c-_jS~@_1J?cIB>W<PKim?h<y^ycK_@%!QzI5J(z!G>a9)Zt@32s`U2`YfkK@|
zzc@*S2*zA+4F9X~WS1Onj#m7auAdXuJr<swN9DzKI(t^A5p(JzED8dtpz&C_T^-E6
zav=;sa~e7h>VuUtWYq&@-z+kgdFLsuqoXa|lN)EJ-dw9N=ZEPL-=h??2<xc=zdi54
z^0=u_e~O4qB}a|(!91Mr&TE=L?j^d9UtU5b3KWjs95SN`n6}fKWuC*RAsF)W+Yv1D
z_CRGw5AE&kNI@G1&;`gh%S(3NfhG*n%Y}bdS~iaKd5}KA^E+{t^N!39ApPREcM?2o
zoLFCcx4Z)9oj8yFr&?YHK|Bn1&?M3}wi{<Aj*uJ_<Gsv<xDC6fs*DtvmYUeDmrnUy
z6xN0$(sN)E;TZ?I%1mOm8@6O&x{e^DdLq%dXIsKp<g}4Hk#x!^&~6vb(flb!{EjWk
zJ#rtk{^?U!K@Qo4svc^i1-RO-eUw0O0qyGLYt<n&<Tp6y2R|hdo+xbazOu{nqB}`V
z;2=CvGzG)DNDb?e&2_f=U`3yp*{*!z)J_!t*_AG`vvq<TwB86FPEcUr2!8~%_a+b5
zJD9rEo1J&*Da$Wa^S;<3#*$xuVB?@%3&ahEzfXrg<CMPM2`?T4XFtecdl!)O=qu)9
zQrLa2clpwybM_=oHcwaXhwh3Orl9mi6sC`87yXBeYOlp@b5XbfA2Qq+jkja9I7ut>
zW!C($XW;v&t$jPx3*K&$o;+e^qk8G*oG-vblEiQ6+KA+KA1B+rSmp==?yoX)C#%^n
zgWNSW#U6J@*#yB~G}nJRt42#AA#j$lwN6uDS7jr)Z4vT$0S+}Tj8m8Dd2tPPhy`&*
zVc+uZQ10AgJYj_L)ChmY7kjYso;r2-H1S(+_p{JlebS<hzV}A$8cNXyH$LwZaa0Zj
zuwK<m_TIPJS*TZo);Da%rW8%1xw!6#&Kz(-q*NL4E8m-Nri4X^6yDYfKen}cl9_hH
zncBTRf(;2+a0FZ_Z0=kqI0|RSya<k1w+TEF3C@Hwy;0>lUr)kbIGaGgB*g_`;O0y!
zpm)~eTDn3f=RnN31fcicvB14$FyK0%rlwos*nP8k)f?y&PHqGyT%=)^;$oQe+CNy_
zx38h+c)QO)_*M$caiB-!fFq%g;H*ty8dxNW!BH_1vZ`@0pcmhZr9Ax<&J@6PD8)sF
z$F)pV>5~Xp=eEC^)-c==r6??*YE>bS9Gl*Rt{q_B5^}w3uAx8axUf(+eX|yP^36O>
zb;&gRos{a5+G&coW%>|N294B@C<D?WH1WBe=jhStZs?k4!?bq;7sL289~T$#X$rzO
z90#M*#W>FM4R7hxSc0g?>D9=OvT)>F`b&gKOhI~#3*m2ry@=bk-$Cl;c5C+0rzxbs
zTZH<|N1|)*2xfz~APa8~oqaw&rv7l4#BpO3axa;qHkpxTXA)wx6mXhCLY!+MoQV&!
zz_7HXrvLu1p38pm#Q_2L7GmWl73;xe5dI<1I}i%eaPSpup$QoG3l>`!xYP7_f)aV~
zxE3FVjir#7-jRpjaD_0O?JPCq(mTE)0K~y~zH4#05U{$5pjpAZ?M8DdjZx!mt=)VE
zp~ol1Z*tljFg1ize$d;?sR3_7pB~#<;R1;g+-{Gd<0_0RnCAjxtnV*#9#Ao%7lky$
zDEr3Qe3QBT>G;1Ed^*DA|1b9Lv#qIa?Hhdxfe;8J1f)X%>7euuh9(^;A_%A;pcIj&
z2uexly$CA3Nt522fK=%as#GZ|MY@83f_dUq*1Fc(*Lv>fzW08ykA3Vn^9#&lj5+2w
z&-4F7JiNHLg=W$n6+GjZW5Tgqt7J3YXM2f3Edh72qqL)K%oj#U&f+J64Cl;7W<LVy
znQ+uwXavvl)_V3<($Gh~FB~70w^Q_BM`GY7(Jc0&@QdZNr0zh%uw<Z^)TLO?+f_Rg
z7dgtFaw!`f27N_e(WhI&$hKt9NQlf0-)DbdfD{yi<zuPsfotw4DXwxj&B}I0JdNHC
z#rskAoN83QvDA|aaf)&FsWFBv5!hASxkBOT)u$8#$fKGe_NWAz-D<!)Q2>f_F2Gt;
zHdX*t&3;b&U7g4xY)?RNTui-`)prP1v3&8waHSVJ3tQgS)jvdYE{csn^!67Ct!-*8
zxO3eVKODtT8c)^q4%Ccmq(ALT({(K711_8FUiP5fehf#u;MukD=jyFK<)At2mj(QX
z*l*HaZs9nh-TlxuzT1ms>E+m25}k>txx8jLUnsmZk7D*jUgjTG>M`K>;;x~0_0X*P
zz)M{7C4hb@``vAQ$w`;<^yBNN!?R!Xz^~vcT(lEB6YuWPsE$*8^lGQ7t9++)z|n?0
zHxt7tD#Bzm2D^H&Wp*HCj5In^HsUwoAlh1E74!~QX$2)YwxZ{Hf%I%tCTGef>_l5j
z`Py#wOjzZ+@6>`oye3YJiLweMU27c8F?0L=r(6lx^Ei%-36m$KJGztXgt$`4&`L$_
zT_qx}b*#S`!@*Efrn_Ig@_3uo;?U%*{k_!JnH`R~Tm${|SoStah3yHpWJ!h6QmGRx
z`-8(Pz{zovXUu`w1{N2QuF7;@;tg3rbUmW%X~^B#EOzZlqcfnfhM4uCvo-V7Oppl7
z%I)gi{o8A!FrH<B%%_J+Qnnf<^Ip-E-+^4J*{nyn!#Xsr+66n_=hOmH>{ZSbw4-M6
z5BHx&+dXk+XOZH#HcTbgzF0D(m@xVcBL*X>uqa)kh%(&2e9rde62A@=yo`py>B`(w
z>Q8<{?+_0}v*XQQiLrk*xg{%1dllzAcMVk)!y@waUDWbV72LVmI$i?D3aZrVbIBNE
zg1&w6B)faLy84LAA>37d3LyTCqY$nMroVmWO!1|T_Pn$UJ#lxO`ZgcO4#VxjI4+RU
z&y=8%NxQBmRx})=Fx^ozLk|wQBaaVat}VD(rEj;nE+R=xkI&I*zNTZJL(^83yC(>{
zxGB3cbHGhF=4m+KyV;t&xOWIzx<1cu0oh1i;);`SHjJhO;m)~cqm-%<JVaYdneIZR
z+{VuN9qZ3i^}a_d+Vq@$9Jl?BmVJ})R=bb<R6G25Rj%>|u>U+d|BW8O8o)*w<*N}u
zL^1&BE>8@Fb!)3oR?GJ#vuBRcOkYM}FnsS43hw1hQMHRBXbA_v58taO8%i_uxwcao
zl_OSMgLF!R^kilNa86IQzuh(qy)vlcG!^RKaEIIQqOUUy>J=K>(5=$GC`A>X%J6mx
z7?N%lQIHf-JRMQa5LtbE{umc|xN^$55=noXod?O;VHP=(^mumi-CJjFrWgfwPHWUt
z^2h^<o9-McS9}F`_(zjsZx!5_!=6*IrYON|8g)c-amLVtI3;oPvsN&YByx@W9Qjt?
zzE3}uEVyy^idmrW{em{Cl|6=ID+(r#Rebg$9-t{)1IK(}jm1%xWFagOY)s1(j#py1
z-B+@b=s#Ms4?g`Ua^WC^8lH1#^Abn-eVak<Bmt!oN3j0(G?UR$Om;1|7V$ZW^6C}I
z6Z8>}HG3=IPU`k@E0!`&0v40ao)LX6AI)2UrDgmYQ(g`q7LLD8&8*@QxKG8(L<Nt*
zZMRy{=#HeAj8HMR)7H|bP(Qwtn~c)BKEEdn^DzMsajg!CX{(F0R<UzR_t(x}@qV+E
z7Cu7dGQ<7_NDpgYjIqv0zj#mr|7O+B&Nst8tq()h!C9Et?#Uh{F=RjbZbzH4J!~|;
zE<*c}<A`mTnNI{}DVJ+~1t$5OE;xnV%KN&D_iR+zvK&V|S9!)<+2+&ld8N_YmklIw
zFQ`5N&-3D_MxPhFdu%&9DFm5;xeGg`(onsXu_189CYE9;U4groT`58sX96zTEW#O3
z?J(Ps^aK$b2ad)2co;*>Y~A;YOQY~otN9K&j@1<E&nep~IQlwF>5O@e;^pY{A*u=Z
z;l0>B`|SCfE)OL4rp4;g62=y1v0r<EyVrJ}pJb!T+#jMikG@^WI~;-~ZeOj1R|`_v
zjl{64U9cJQs(G1ehd%LDH-j^GG?iLxFo2rMe?Zt(us^b2=cP6e%r%cNw~Sk~yi0AF
zn`>EQZv9}<x|Z6yIoG<&{N}60o1@e>Kjz*LnA^aXZDeU}6!XM#OFPQ4oj$FddA^;U
zrGv||gEy^1aK7UrOQ*PHr*vAU{CwvnmM(&-WtT=;m(G0G6_##e%Wl)OZj1k5d0Ef1
z`YCYuS@xbO_u`10*J*F4LLaWVcY&k#S##fu`M$h)_LOYKe1-m(Y5lbd1Mxn6nLfRZ
zEPbUc1M!xFo$~{)S^D3x49&3g_OT2mD+~?!4A0H?Zdwj6%=ayy4i3x@pDB#&rVTGB
z45!btmNYZM();UKM&PU?bS)!Cr~ULTM9T{gIUD)FGWM*w=PQUr=?3ytnN*3D#I}u{
z7B`^`pgZN5e9^|<kDg5BU^Qx?Jhdh_Qe-vYm{j$hATnKs=@X_clh;`%)YB*Y6(@t!
zCkQuKr?hTNIV?=M-FT;!{x0@xA|ZYH(!%7cg=ycj*+9iPW$cWN@03={luP=Ahwr=B
zEfa6f#-H7ot8STXVVz!7obOqf88{msxiR~$<=tG%dy}*G;Vn}HR+3Ze*=@zic*Vug
zmYGY6tSP|R(X(-+-va&ng*Dct%7x`V-<2QfbA<F|I=>n6j0I|?WeD2`@Xr~YpUcYV
zl}i~D!Wna>eyj2e<H~5#0}N{zn$#}?Isrua{aho~(!-QUn=q^gfDOBL#<+~N*MN<5
z>-F%AHD9*%V786ujP-Cd)x<LCeJqqgnY9cH9sUWMP^KOJxuu@HHuH0n5w{(VrYEFX
z@AN5At-fcR%GmCEzcqSud+q)9+Rx2Szpa6c?eUD=xu4r3N;_+<JG(bozhrD5-TXqx
zfYRRDV_w{Bzqxg$v=7eQCS%{3RNk3U`trl?%c0*sHTzdd{{z`KdoF;3nVScU{yWx$
zE#t*~y<58;%3t^iTP}n>k6YXDH{ZlFkG0+$UGYEKzIhm&2^G3^c+3C9Zt-ivrS*3i
z>y53OwHfQ_Y#YxqHp1UC5<!AV<<H@4r~Vmh@k;BVtt)P97nN?X?ywWS-Xa`j5`HWa
zfGX*2I1&mbg)ouqj$le=IUlHKPFFaspm}qc=*zd!Eb=fCU`J+e{CS-eg>bPvLjN-%
zizXj(@%+JL38&fSaPflSbcHA1PstDL#ILhOGATw#yc)~XO_lS7O>*>RT`e|miI6Ow
zDz$w5_{{O4{Y0hhz_|%9O;Ci`>Uo;*><d)TyQD+7brpoLCY{^t?RhuV1&it+3g)*m
zbS3|^yo%A(7Ol-lXGTSNjMY;pNttC6WP62`?@=`pVJ8N<*3*kvovFF_$WUDNPs_{4
z_S0-vB$ryMPP))ke{^Bke)89+48sgS!^#gYn(%IGMdK*05H^o|^8U&DJD0=jmb&ZD
zy7Rhewm(xY*pG6j%H3ZY=z`7%(;O~jX;4Tbx^GcxTM{aR+^Cf74P9yUHLZis-PBxm
zMcfZ#G<RDEl0c)No?x!!SH`4J%!B19m??w%JI|b<Lkg&AZkU#LAr5nk9(~^ULv+R~
zk3cVhc`GU|G($TC3KEzJj>Wn0zCemdLGuz>?)T*>s|n$(lWxao-ATUFpKJZX@p9e^
z^BXnYaGo252A~K9SYi~1jtsxeqv77e<r{La2N@WppCCT-8xwpMV&9RK8FIyLFN0to
zpNV{mnym!{$!V9|9gcU3fmz?an-SqyR8;moiK!qSR%~S7xAH=6wYSYQ%+vkl@Wmvi
zoB-_A;ZHX7c8Tr1Sqr1@l4ZNu272AA&b~y-zN;nF-jy1j5%^s3U;)pc`!Sr!sWB<J
z-?8a)*}(nRJdI$N<}WEaE{46xkCf1_-GBgD{x1SB=wlLHwak~+AQhG*Ou;?J$6Jh{
za!|p+3S1JcgT7-(BL3A=+?~(7@#zAOAyC|8r2F;trUCbX3vUK3#3Op+t_?}ir@0T)
zWvee@>=F$?NQIwHPGO|xa?|#!iCgET;RTZ_jLjF|PiX+5UaEq1o`ysVqcB0Qj{tdI
z^Jr<OUX5J4t0HjtzI3hFp!<m4qXi8AZE@)G_Rymg7lLB^IJup%pvvl=!00lBLn&^B
zM6@-I<HpCa94z+MPQ3V|=^^j64F57Caffb#tA@~rw3x@AKO9GUZ<ei%NkX~9h=*T#
z;TMwYO}oSL15W}FK^sNX{&Jgj?ByO(r8PP1UxqJT6~Eu|%kr}RsZYK?TTT_=PW|+S
zo>*U;hTq9*W~|@$&*dYnvdgiHey3kXMt=S{Sd1l{ep?&yC#*&8zBxvo$9|f-_1*ph
zWs3pmypC(=Ase(Es(t5*DB}IM5c(iDp$ZB$4yqeL`Q>oW3MqEmENG;02jab55R_Ke
zd<;j<Sy2(JVyv7X6Q)8RKoTM*p$`)eqx8dR1^lwS%D=p(5OBkxal`k{oeOkFt5Wph
zm)4a68Tqv1Bd*=!Ja_RW@%Ab{{P7P$j$KD@w;M@zcsa<%t1gUEOinbC*sr)TRah^T
zQ5oaFqJdCGw{XGS<AM^y*D+Sg+>RGxoODCPUCkJRBt_%>a@DxlWmT&*ja(9KKgNnU
zB<Wo<c$o3v{CRS&etmPA^TV!}c_d|<)SlBM#z%4Uo66Fgvhh6YiiBvU81`DhJd(Jw
zuYaR`rD>Z~rX?!Febsh9A40mE)MdOXle95dfEi~Q%U#_o2_G^QvrAo=XOsELH=GxT
z@_Nt0#=YaJhd786!s}|t7B}iX7!yy~YF?86AUjey@ik-CB8xIC93MneN%vSaU-e2T
zr9uEYUE?}~=51V*0H=74Lw2DdK`5d(N-pswdf(m<6JZ$5W1Pct2-Q~qjF*p!k<j;k
zrF~IzEL^2KpZb{t%3+o^Lm>WTgh8QUY`=Vp;g@XHT3gw+&YWDl`qNw+fzJ#l6L&zh
ze8$e43Z>?KXj{o5&5fe>t&S!oDi4d36Ov5ZnWh-pL{cpuZeDLMx>l+^S!U8*%>7BA
z;Q7t265oe~%JC7?U1LM6Xk4*LZQJF#J0vM+dv&$B4YS@=!zzaC61##8vq^_*<!t*~
zcB-jOqfcwO@*%>GXEIcNea00u4#IcZi_C}L4{Kz$IGfv0JjGT$uP@Nsyhs;0|FMd~
z#oo7+#s;V1(Hl@l86SL4d5JKGSD`;Ymbar)lKOm0&hzzI%Fg9B3Yz_nXUz+WyALNL
zO*1`5UN8EVdl>iJ{OU;3GTq|xIgaDjZliQ_;SC$~v&bcq7h3SMLl?1PzM4BX)u=yf
zl4{m0ExD-3#G=afg2i?F;X2ctv~?m-5z3X~2(wrk{{2v6N<(eiUEv48njl3>Geo3B
zhfqvd<Q2*f3?mK62i-3sJ+`JHL~>pC{+A$o&vEo?RP02&CP=vh0@uF&u%X0Vt&B22
zsPo;M8&l3IZ9=QU1!aTRrgTy!qvXO@gg6r+UyQ5=S1-Q4KH%DFW4=lmFK2T+?5a)*
zrTY9)O|VJYU`Kpk=vD9of@}6$vg=fu0c-1$WE^7&=SuQ$8tcNU=3|Lcy#=D_8{^SU
z<5aQ_3-c(KL<&@?6)*Sl{8(Q%dC`O})0b4U>kq#E?mN0Z=8F?NdR<-c$xMtxNqM-m
z9BfXGw95W6rR&+&ilpIeSAJb>W%{-~udVfDYh7ig@Q%X^=J{9W_?f%CKaEI9&&`iB
z*TYqITr%aycc#{qS6D~A<z?;<UTA2qT)Fr7*28C__PdzbMCD-rgk>svXcxEAzND1p
zn{!umx<p%DqfJlc*~nyHyegr}QW6senKtlB4|hbSvOK(@FWc%v^7Q%Lq$RT5#u4wQ
zu5mr150*Cq*v!2*L@zxdtXDd(j((jSNhZ9YQF|me_VU6ZgXzM$=_BVUf4y*b+8fkW
zBBHNFhYu<r-Pq81qdMJl^BcwPlQoW$#)aLCgsc&t2#3Betg9Cuw%T~J_!AyWN;2Q+
z0Q>ER9sO82x?o6Iz3?g8w0XIh(Oc;#dChCLdCfTIsLjIt3(wv28^KE72R=v~7A?NN
zb<5dny#D>6GJ{=_Ea7B+P3fR|mk7jBpDt1OA6s>|?8N#%dXMry8FXp=nn~?TU}8U+
zxYY3FW$f9OlmCzTH>U^1)P8oi-u(D@@y*Fd?9Y{Vil<w<C&%N|gyRAKpCbgnAG@(j
zN8|p4)7>`&y8Hgeyx8zOf<NIdaheB94mAbJ5alidNFnx@<>iH?T*uP$=^`|7%)K~P
zO+RAu69=Cr(>jjZK7g0O2hA5C$ftZhEZ`zEP?XP2pf^C$Oz{HWZ<ZJIwuF7)r3QJK
z-z~2~O(kfM*0ijOeURRIkXl%fHeawuXV4Y<VAHSwLz!TUX)%+q;9JlTn!;d9&5+HN
zVC%3DhhBdhvk>P(fxCqvZhWDuJt6n)L+^k>J$ik;5I|%F>8vriZy2P@1Bk=`=d$F^
zA%N$yLSbg1kD%e!PeY@Ve9ef73kD>!)ubQ*-~vVg3;=+!WUq|Lvt$5?Vc1xP@Zuy6
zG?ownwGU4!49{8*?*vBx+QJICKrg%^%8&hvdL!D8nG@C{hv_4eH5HsNk(s@bL#}dj
zu8}QfQBDnh9rn>BDpBJNK0Pv#>Ag|e$Dtqg$VLmJC%mH98U$v{Vmf-F`x>I^7$S(8
zR)G!h1w+K9rhi*l%#Ue?&tb7|-o<pjjCv1^Z9b+La*aGXj@>VaJzbBxwH!+!`vmw(
z4tzbb$Rje%j5w78Xy%LGdlyH||I{2A&+hF_n=E&(FX|j1;txzKD~?AibW-N2G&u{m
zR>Jkrr-d({?yUo95fNF_U@`t^`59l1@C2O`lw5cs&%1<zuL%r9Obbgk%15BMe3Hm+
zpP;+(?CEl%1;3l2ER}JxT-G`e?-fqew9NUR&lM!z;(sB9eD0F$Z0qp6F!1^BnpWWY
zbI)*JH`y1#jHrkFNw3aD5;d*pnWSZzIOI}NtSr@&M)(VFIb3qm;k#!c8_AZqq|}+a
zmG-gUk|M#^Q(nl#K6xdV!k;pzk(9}w%7;uTZ?t<Z1897e3UW<ReU;j%^#`Wa`2o=A
zkUC7CTHTk{u^iDyo{n!!8|q7|WlVn;9z3p<UgeNJy^*e0m_E0Wyl|5KsV{JuKO<Nx
zW3?|sG%RC-|HbA^##e`cUGmJE{Fw)@GMVi&j~WwC8Z&{P31R6QnUL=^0D&y>?~x>q
zS@0qnXi*k2C6@AY7M(c_LV(Cc`<*#t{|L)wg5_AwWOHe!jxgr%ng_9H=S&@E^L@@q
zYs?W9pb`F_BdP5pAn>wS^QBb(%QvAfWntm+voBSP9$$jxdh+F}73CV;&DEF<(Q3*y
zlnbQ&oV!7uXB3gwI+bhEA8eYEcMEpcqCd}gJ<rN9UxX*$rYOknalW&F@71FGNr#;K
z+6D73^4-1%-ZL+F;%M?HqCj%m-bbKtIP{+X=gcRdCxJzUMQb{$wuKvwymIx036H(S
zOs>YJWKag*PV9eGT7S6|`)Z@lOcehr@3XHfQ&DguZ>l4qs8qmBtk(8be_9R-9J^Lj
z&t%)fUA)p~RT5GBrsxi7U2#r|2hs8}daFhyQL>^{T=1x5q)D-r1k_ejvJozgM!&)r
zl}3Ct&N46E^DZr{EBzpM)$3#FA}llXfpfTaS&x9%ctjcGGu68yX>-iON^JQ_QTdPl
z^0Uw71Xu-7umY@80dcAzi>x3ouAmsGfNxe%Q&b`aD^WU?a6y|#t~V-~%J(*?9QWkC
z!BrfBRa`n%+)h=zkyZS~Re}Rm!kbkWDXK*UtHpJyC7r6JBdd7?!H!ua%of=@co^Gj
z5>=fVb*CDQ$Qm_fOSQH?EHBE$nqQVzB%wx!qV_s-?f2WiEU(LvwdR6#=!052r&??I
zI&;C=I|Fs<k#!EQYn=t_FV9J`fa?wB7#&6H-7V@duJu<^>jkXp9J5FxFr`Y74Z{w1
zVAc*+)(S?rBFugRd_N;Wr!oFDszePLJx9k{EFC%EMA=1`v1wPz(-a=rB&95#_XF{K
zweW^@BgJTDWijH}CM&AF@p@%bmXl+_TqEV%rl`%=7RpV{#VnnvO??!oZf5&liWHDI
z5=|1nph{$$U)O$WHfe7zO>Hr+Z0RVzXtm!$zTDLB)G8+0y7Z&zrkm!`6axLAVPvzF
zilgNvMe|!h#3!dWnNCg1uNgL&2~9r*TaSuc*PPl0blMgtTP#Ogsex~-M%xhkZEptN
zz_Z`bvNS)dYx|Mfe)78geQH~aU>likhaj+x#H~FF*-jzaj-aIZnu-vPYR^jT5VvfL
z1-40+Fvy;^b8mJ2bnWPo?})DKfO2$RplqRZ>ypxKRrH}#F6oRCZ8dD}<PhrG{Ly*c
zl14$HE5@)3QrV?R*-3(Yt1HxDc1mX%^)|Y)<?87h@~yY#CEdnbUAOkTL56Q{vvfA~
zzrD8Ae#5ex?zG2gi=msj$K|v!RH*0r{M&~mJ+^~Aac(_wv~PTcdQF8GqbYmimm3|F
zdxHn9GMal|M$v?9^+r^7c$W}5E>gaYkLq;w>F;{-CW5lRGVN{lX<x2TPx`%q$0hx0
zgZ*Ax{c+a)sg?sdlq{^N_gb<Co3;jb0|sc^H60B58b{mS2z6)A5BzW%Y#Ob8vp+N<
zG(4ohF>X23Bs$coz?hykP~JSaLOG&AH{8x4x7N(Onl|XTH{2{bvcEO*%6x=oY=oeT
zhdATOqVeRVc#0uBd>c;<A4Lj}qVz`ToJZ-SM;S{;nTJMMw@2CGV;sU`TzX^N&SSjM
zWBjFKf<t4%+hZ5u<D$aj;(Ftf&g0V2<FcjW@<Zc_+vAtu6UxF9s(KUZ&J!BZ6I!Jc
zIztnB+eFK2(olHPSnvP0ya@0m;Dsfy{u1Q=5?Ra=dD#-h@DhAyiJEE|d0`o)zf5<3
znLcKjv22-nc$sx)`Ttv%m%{(l^7^^)KLxcIS=rDWY%D75WZazW{M=l^{5(Pe0%F1f
zQlb~+B*iYtNy#g!s4B_XT;fSkqt;Q!BxxXwwAEi|(`o7$UenjQXcTL1q-S7!z0id1
z<~0LnQw<5T_-=C~&O*h`@|ygO#PS=wJ+~NpteI7AKfh(;c+bYN*M?2qHbwJJTHhT`
zx4TwY2eW<$p8pxE^`A{G-M=xlLJa@b)S8Yo{l#j<5Lqqre`B@&A2hZ80cuU;1}^6M
z5LvC?O|8WO>{5Y$N?}{XtA|amGM0;iz7{?HUDo>Fuv$b@>tjvAf6LVRTTtt$Gn;5?
z{oew$#{K}cw*LgR_Wu*8H8(J^u(hzTe7rC)_P+mMaddKN=wxa5aCu_(!`Io5<BK16
z*FLTO_%!u?b$VrWdwq5F+v?np)#;=4_n$WQPd64;J}(@7UjDSTe7yB>WB1d^?)ur@
z+SdNY_b=Of2Ro<VzI;9U^6ljC^yC|XKp_5cKnZ{|au&^stoA@CO2D$WBD*sb!KIz1
zS((!v$sq1H-&^^zCl;+5!J<`_+n2y+Tx8i-l{fH0#HK$@t2%!uRmS7<d|!3JNG2u_
z#;RRYIQmjELEuJz&8zVOgO}Rr+O<WK#b(ux3;ngl@5-$@BUp9nN@l9<$BS+Z)RoTF
zyME|T*QqaCc<uG|^TI%V`Qn@ZcY#{x1!w`Jd`nmon2fqVl&27_?)+C!3;!>mmYFII
z5!A{#$HRkDrBS$dyc{W#PoERQ<j(LRTIR8|4T3j+-G;`TWaf5|>^X;z59QAhK`nKX
z<@3}E6MI?F8rK{?xr^&B+oF^wD(q0Vh%JN2e+RYViJ;bn8uGPtucmxGq`|ih5KIii
zh)xvCT2jgMo&8%-i$dU^pq3WNawNtsON0n&?Zy2IsHL1`5T#k2g%48pgeDO|E#H6+
zBB*84^9$6vLqi0$sHmmBulxpTjnI;<6bY8Mo+E-<w$mJT2rkA*Ar<%ge}Y<k2n&RO
zC;AttHQ(_I)Jo72jYbnet>mt+;jF0!MOS!sl%gVJ;-`NDwS06$lm7y0{rClHp|qHN
zeh0PgY48w1Ed(bK)Y5?~ECpWSDYOsN{41zs`wvh{`WL9BFIshJ*7i40D}e}VP5%aJ
z)&Byu4z$ky4r=LfpanqO9B9U$YQI1&y)3*6*8JF55O&rDUdjZ-u*4>U#4HTTKy`lu
zYULnEIR5~(VnFYYDanbTmTf@5r=RP-zkym-@MDsHfLfgY1hry7)XBd<t@>Y}me{(n
z9*thf*IRI3aFW*fpCoKu(yh$*i&yxje*?7!I>p}R0M2^yFMW6|wMeme?6_9!J)c9~
zKafFLN5<zX1jZEp32H&fURf+uKDU-;J66R}Zm|t}8Bo4i#$p@BS$AVTQ47ZzumnGS
zD+jv!Pf#lqBxd^us8xeT^C5Db>1Yv6Ozw&S(AdX>uVhMh+W#Y{MS=V~P)ii`3)DLK
z1!{325>?w3B&G|=axm<VPH!zS{Q|Wv!2b$rskW0pBt`q~8QfH%wDUSRhi23yf?7q&
ze+9J+3<AxkmKZnNfLU^;O7nTt5Uyek-q#K4{&65k@HjJbUzZR?&eDGZwNih9T3P=A
z)Y8v3c%g=S-8w_i1at?6=1|&uPkdDNC!vAVqy}Og0sR48M(CL*lb!doV=redVLqxU
zUnHYxSRnrz*HyFX4-2j4S?78=I7aHb8ZX$&8e>KODTU?5vV_~ce}Y<lfP0?cf`tG;
zUDThTR?6?7mc25~pP<(1zk*t8Ab)f@1f=KW)g^kKF-qtOD8N=eEfn-g6p0a=&X?K)
zqVFe{v42qgKLoY*mGu?Y$!=YgyE=MKn=}!;)&Q8e=4+2P1sF}(pD_jb5lWtuHPu*(
z_Nq6Qu-*R+)bhd;L9HT4Vlms7{-UW>&%3P2_J4p{HYm@3f?9g^iApLTRcQYm)S?#%
zSPJ+Z)S_c2?FqadO^^Ac`0S3w-akOC8wep+VtB*9fm%xYy!3H@fLhPV`S-D5O?J+=
zEjB<>WigGz(fbcUq7XLPY;up^K`lKZsO9`mP%GE|zX@uI6G1I|BB<5dMcey3sHK;c
zs*jde<UdQ~WwNZ!DwY@k>M46?@&%sjjU$3uHot>fU&7Dt=~6sy?NexwT-RSKd<Oci
zB0oz6wIrAS71Tmdtt$6}8khbFYUNSNKs_sbiJ;a#knXRb*2@1J)SCSR)aw1OK&@?J
zUVHrSpcWK%Venlw5!5m#pdVdMA+9vq&N6bw7jbJcXffso;WW5n?7f)%4CYVFo*#aJ
zS`_j%{{*$re}G!L5q{Huf?DFVVK3p%L{RJgsEgV!P|F@jZSb$4md{GQ!tvjMT9VUU
zzk^yrG`V|Otocik{CxdXVphqYe3X9!wTy|NRv_jdpq4ig)XMq=YCS{^hx`s|X$Df{
z8%PMV@Ubbl($9a$hS1kw41Jo@FFBTL_jtTg7H8MgeU$Pqpw=GtPf%-`f5M8jdI^Z*
z&V{$YBlq^|$w81Rs)__6sAUgklo@_x^b6E_M>5%Y?WX~_ItTvI<~L9)_zzHvj|ggw
z{}a@@MFh11!C_eNNAUGeU*zo66cxCxth=lBgCB)0feL>EwUk}|0JW0;0cwSU)=?x1
zR?@FM0?Sn|rv3?PY2iuFmOxtn25N~z#OZBUDzvCRJ^YE)M$ow)s%R;4Y3>A44;Ue+
z_}tGwa?Q-LP0fP$KE+w?Q~LbxK`oCzK`q<=64c6p#1la+dh&mOTJ^t!T5rMWM!aN5
zl0QJL7bKZPP)i1~Q}rjPg$1jRKV%LGeY{TXlSDUW@E1_4hs<a1-$5-tgYaJWn2lr1
zpu2JUarpQe=%u|J-yY>pY;5LVK`jZ$dM}wYEeW#GuE8swN14a=??9~!XmC6c)G`2j
zL-@yJ5HiMKz65eHEZFB4s3ra<sD%ZKVgCTNl+j?1F0xz$@L&MgiH!TqDhNInz(&hG
zW+nX!9QO}UEAvlKi?2dk--!Bx!T$x+3I#t`4Qj=csQ(FSng0%Ijr|4G3ix+WO93PQ
z-N4!y!|&@L_xkTZt@?ihwF3VR)CvICa3u|2r)e4E_IjB(W^iGa8>xUNF~)+E-_moK
zKBYB5pa>dbRL>ApYjGga3{5WS0NxC&7Si@x(uiy(2M3(w5pvTiGBjQ>T{H9N48xZV
z#<If<!u2fD$63&nELc+(<*X2RMHxni9s@WRugGO`qSv|PnM~xWKZFC_J?r+<nU#~_
z<~fM{thG3&YA_sR^e3nl0rLM7)Jpvm)GGW9)Kb7_`tHBv-KRY7m@@!GukGa;Fy$G^
z<y|$;yY@Xd^&g-Xl0;PwspCk0<1tNQPwu<rT+^ofd$ajhm}Jl?jF?c6iYd~{{E-j-
z7pRqtA@vXuj7CeC6G5##^47h71+`ND0cyP<H@CuVE_t$k6-ky86t9W0%%hIq`*%>w
z{~w@MH#p3d;)0cn`W~d!;1{SB{})h8nFwl`{|Rd0Ni4+aYqXK^_}@S+8j>0m^#zRC
zY=7w-D9*S-+x9P@R`P!ZYUTbLsI><fnjsm4Rnk~cUT_t({WnmHp8P+9T9YI)KXUDU
z1GO@(@;tHCVnk5u``?3Fg(9M1|A(MfICxxL%f&)^bd2h|aV<+i=o8KAZtH43bl&l7
zwSoCXCm2MHId4}4;-<~m)EoH=)Org(#Qp(lUBL5gT4B_J#cOPe<xq7Ns+BPsP5&)W
zD~||j#gVq5N$mg_X8`3bE3)AqxutvL3joRy63R(es!{_|11mB^LPUdc%FB?4j7;HT
zjPi)K9!Z&=M*#9$3Mi5hEVV7jbCRpc@`nj(6BL~A#+JC%Jr>F~rC)n(%%+8?ibVKp
z2B}B|tJJlr%Sqx^o|gt#WbVCorfu$EZiu7HE4A{zVh$fqDD`a1QNTlaDdA#!<<5Js
zofjnD)1Y_}3VB%GihSOfc)tH~-ZL%4#*<Xu^Hd3|h@0oKknJYNcxr`wIt5D?uwhbY
zvRFw+9ax#WU%<}vGD5DTy-B%q4c~6~_#sD>!5SWF*OpW5N+prsA#|D>@*`K!y?Hsc
z!B9KgC*H+N7jczTZ>SL=>?(MM=1|C@?iQ&MM&{mX10NBt(|Ri)qED6IHz7x_gU7?I
zjh8?;Ocu#9#f6C=%QV(2u(t*RZ`aU7sO#;$w4A$Jper!X`^_yJr(`$B;8MChYa$f8
z6;v7b=vNRasdG>VSCbXMU<V6%`xa=?YVcr1hiu=zo~Tb6$Q0s9J+d+{j8Z>&NZTSb
z*mXM4qbu5zHrP&y9&AQ_<3}DM@-u~4JDJ}uS@h#9-rjBQs7HhI@bE(;SpC;r$+)+Z
zX!y5TxELN*%aYeJCj3~rmsXU5YzvW$@A1pVquTN16UfWW!=FZnU+U^CWAv{uk>91{
zD>}$keMaiMmy3%t9iiZs!IOAU=H*onJi<{I6V?$4-x2iA^b&eV>F7~=P(v&y{9aK<
z4NIPiaNdIJ#99_y{cL0mPol;=?mJ4wewXR$_PE2R+{vZ$`eGA;x()pOlO(=WGhE|l
zzEgvukPD^d+VCk6-zWZ}m#%W;P*rw|a=bGc&3F(!)yAO!6r&IlklV`2;X}U^?x$kv
zr;>%CQ`@LO9pJ5{cWOB_0rl@RI7V4<xhM`#W@N6@dJ^4@%a>D7NkcR#tTZHMh|)1o
zLifAoWqE*DwjxtDvg0nGN`Oi31xQ6cRu9AKh_K_Lk<&teduZhskalv&#c5=Y6JnsW
zTg7c&D1N?h!5xB3C`(6g;)@5Y-l-9MTuH2FF1t;#7`{?HLL7=vC|6LCuTkS7pn?4b
zei7v%5rxJtu_C-pZc>XIE$_(-3O%hNyD_A;6@t-@i{i@f1+CwstRLMuf<6E6z~IrM
zB<ZbNu5lpT!ps7@j~c0u)eyO;r(MtGaTeQiY_>j!53TP$G^;lTQh8db7Uh4ZdnbU*
zByOD2ka6x3^UkDJSjo`$64PMV7`~_O^M^N&DWo$#EXI`#2q3;LfgYRkD#s|>7=A!<
zbij>lRz$p?74XH<dw1CgK#3RLt?VCjJGW9Edn}a*jY|*AK6`2UxWCgo)=@66huGOu
zq8Eko8bX3~kR!qfWqgHwaYa3$LY#)P(r%(ENMEQPyB<54#M14SS#g2BY#m84dU1bE
zaJljuy<KJ;sd?Lm?g!<Y(uJhGk{`LSKQUOXJ;=Sg;&=R3_x8z!U-<thKqRB9=gkD8
zpOTMV1DAK1(k9*X;8RES%6lRN!vNJvhO<oZHFvseNcPE(Kg}nW)ry7JhU+&O)dc#V
ztb^QYLGiVLKWjf_-1J01e-1PWb8Pdw)j7x`;<Ko?A0Q?TWIn!xyyoVp?J%vbqBM0N
zGkGmpdw+9BnY8tMh^-fbVII`IRJJ~S`LrP6k=f3pjA*aOZRAJPSShlMxiL%?;k*Y~
z(?e{c!7P2-h{Hzc;m%hAp8pK9^^vOY7|_Ju`9(f&Cw5Z2k_*18gyP7gDI2(0;j|k$
zC~^8;WpXJ>(G%U@8^uQA`4c<D_<k0)$fk!O-ON%z^G89E`?X?$?k5m)G{<zWd_%$(
zgNv*J{<Tu}60>2ObFOP<+!vC4hzeuLH<dT_FKvIyQ!MVChw9y02OWPCMEG0;t4xuc
z3L@ZRpg4(R@|%<VhHb2jv-Me!?Z#cmw93<!r;-4EK7Oz~pSqAKxWR@@*wxRXoZT-W
z4Na~<j%&A@M609khSSMNT9Glhn2Gb7do~ErMS;!z>5jg2g5!@U+-ze`PE(p+Lx5*w
z)@KgNNg?4$i3ADA877WenH!rtUOB>cke?LAkCY0f9v?xxU!cjLqVe}RWLY`&K@x;T
z`<}6I8yfu_1|i0Jr)NHm{1wzfa!XB^-dpJo++5AF|EiaI&c85#WF~0zqgEon$%T@J
zF>X}{&zpY_YONba9s2->Bq%n<)3vh&x}^UF)UxgtyLSY!pR9Bk$p25E77lXhhP2(@
z`;Jh$i+ARy_icLP`OOn4>+S3YlO<hN=V!j^zRGM5Id^0Bz+vLmTF%n)MH<*N-<_dI
zLUcz(`s~--$>*|pb#Jcot(R>JD0ppY{`BhlEfIFM-eWgJ@r8`(huVaTp$pAY2h(FV
zn=z%cr``t}ogGR?1>bn=Yg5w%jhScNrtO9$U-_0bJr1{;%dNXKyc|>e?S16Mx|7e5
z+pS*!L7Es4-1b8I^io2s(vQ7_JynD%Z9LDnVbOgxTH~v3>a>Ie!O9f_E4Rx`rVo%8
z7%CGgFS9u`yQ!fAX~lYJo=8-wFRwP~_Hd;t>}%9NpD)tnjSh0x6sn#WlVI~I{L(8p
z$LZY9`esXXu;%SVgtoY^uDgy*L6yxbnN78#A+}VJLAmOtl-o)QP7?`N%70Q`#S;{_
zuU_T5YH+;rOr7hDKLJFYE~>BN6eMoU#C=#(;AQ^f!PT_skBP0a>-}!UvIp{#-C{<*
zqK4OQ_#SqdX-z)Mx0n?vOwwIHSWDHNnmL>f)BQv{RFi92J!o<EWL&I2DQZgXPW)sY
zhg!ts8tM~O3MiAOPEwk~PJHN^kYu&C>4L+eBYp8B;TuQu9)_>7qy0|9`?5TH_X?ms
z`=!$OC+$r!gHDyv?@EI+oy}$g1pU@ir4B?3*{i?TFw9)nPPTh)K|lXg(LP5~RwvO!
z|JcSk@R$?o>!WUqx@z^_vr){bu7;BBApSCwiNmDhIfsMg>^0qNpt*g{-9wlIAuqXZ
zVk0Yb%G)XEKr6<{d95$^we}nfqRxBE-Ba-MbEOHznoV<y;yPz%)P349(kCvhzyu!D
zq9f`zQ0vsSi|pOVn!t$upP-gty+U2pn+K=vL{RJ011~5c|6mNYW*sA&vtw~T+GOm>
z!`E*w_<DAoRL}N`X_KdUzJGG$`-Ml$A>bp|U4E_vPCrvW?^SCGzhj<gjaKhj?_QE`
zjRx2CnV)$zd_wyaefscttMe((-leci;!)DO*XM0D@P@zN_syPXlCK>e82J78ag;g!
zy`fa&$B$d%Qb1|8<}#oA<e(#?9E<~E5dFadZRP`R0lCANPUE8qS!q2Dlw~e~99<|0
z1XP9jQ)tjv=4IF$+m4+q1NF+jOp05*?1m<Lg15OkSy-kqd(JtblY1JXy%^Gd2^Hor
ze1Jr&HJN-^C;Bi+9WhlI<G05_lX={6bc`={^l3MfQ|q5@wpG<(-DANuEQCubv$GXa
zM~{BKEVycx2mgE*<t{NQ1iKo-)4Lb*yyycuHL=HI%TV1f_X-;BkPpwn`q;Ac%X8+$
za{9E>s~=}vB7UU&)*a~eyt)-E_rk9<pq-WDl+WkyMLZ_H_5qPz-iW0De%)neA6FnF
zQyw*~eYTEqFC%xPN-C97l^%tACi8VLTv<TeV3sdfB9>5tE|%R+o>HKbY@Fe`_gyzt
zA#7FJftH1>a5zaxHk6LjJ(7vR7M6Z$D{6_qDApVhNqPcm2yj)rB~w9OBcVw`-4Uu-
zi)Q093q7Y9AFfp<&S&!^Q?|XYec8Gu?VRFAS{XSm`<h+qnBsMfbP{-M%2jm^Ze}f$
z2zf2-3Etg`4%9FZsdnsWb?{(`2eU$L#HqsbvqBZEu+bJsd4MKON1xc@W6m9apqQOj
zQ?vV=5Z%0=r#P#|LPpzD8gh7bHmw_b%zLdyrAo<8z5V)lN)E8^bCK*Q8Q+psur=o6
zIpsDoPFtI}E8hdij=hEib4AU3a=#Xm8x|=~aRd_lHUa~FdO2P#FrRD$*~v2N6_3<>
zpHgiyDe3wkWN$p7f`2+yBNTCkN<1<_G>xmAx?SVTES~fWq#dFR;P!77ffUpLA;Owq
zt9Zvao`$6Yqi!7KeI&HtZ70Mi&r$2<TtZ;!wbz#gK6<tcyxj3KZKi#_qxW7kBr?m6
zV}FlK>3cgkU`4fsCf>z6^XbC=>JiKP2^as9xm(+<gRL}`5WYJ(Ef@E!3c;Qfe!$aF
zb3it|g37D#4%cPlv_g7%sz6EoNpfx<auofy&KLTIw|7-QG<du+FI%%YQ2dzVaRaH|
z_w4ACei>mZKT+vt)<6Kpszaj#3jtw*P!9<mAQS*2Ja|A#`_i5ah`;<S%nAq5T++dW
zVQR2Twrt8L=FEt8Sx*2K5|rKJ5M3E_eMMhdHKfPMFIPrj4?us5R-GCn7NI|CD<1Ey
zK5jowRb$D0VevCFAWSTpgjHC~WsmW02uXV9?5Ye`5Mxm9fz9f@4f(fLfD!{k-VTv4
zj!c`bz={vy$7wm20#DRNu<p+!PeY_DR9JW(*MukH$aRBMI=#P1^5~wY(hO3jH&Qx~
z^=sL@UClRI>lIi!A_~70gqz?UgD`#0qNL^Kq;%=62tT*5&UpBprGxKC)=YHSScn<r
zf<CBBXt{Uk2M)x!egR4u=V;(TJ5EUd7JB}U&R(~V+|mWh8kA9PG#p?BA_KHZcOmyl
zNzmXC*N2%`Xq{*$fkVpQ_GEJaSW*npG-3#XA}RpLFaUH70|t?1VNu*5Ko=<vGOQd0
zp#%Vlp@-p=zB%Rq%n%QaG9;H3h$hxs$y~(*&xw3tO)7*Lvtxh}?|}e=B_Q1;G6V*I
zg?0HLgd9%>Y?M6Em?bs3uy$F2tN<7>1s_=`h7Z<%fO@zB0NVoqn6_I^l;|!B`r}Rn
z6;kly@jlK_=7VY&IiO}vO^N|qF|zzIfp>)^0gqYGJ8--No>glCVBu46K<Fb7K>Sgi
zn4EGDnHm<VW=3f0bMxbbJ|K=&Th%OZSi#-QupnN!@8K9c_QoZfPh*!)_#bC`eYj#q
z4rn9UG|7r4=3_B;VOzqr*+L2<t&Y0%N4GuRJdy12-FZ0jgY@1Tj}Kh8PKGbHkruIR
zB+8LdP6Gz23vmNA9@xM>9T|ImjKi#wy*v_PfTL~4lF7uw?XfX|l9TeGA^-q)gGiEm
zC<7ms&QKZ^9<Vqr2S}=5#bY)$u@qqWRi`?SV{r)?GF}-hR5!j*u%0tPiP$j<n8s1h
z*HI5vkn&+!+oU}NTVo>|>pR=T<dG-h$R_btfmBj}W)MS~GGGq_*i)b-2>`mbxyZH2
z7()mqW|;0m1&OW9(rPJGatkfF5(-Cp4vK~ADqfctM?lpOP*Fq!hE7>|Q5ETI)uA30
z-~ojIDger~M07-sSs@he1#q(m%v!{&iN`PLG)c=KlOpBp1G{RuNQc1yWJRrqYCIGS
zy1u3O@O6hr7T~*hi$|cE7Nwf@RUBQE#7Q{u*{NZqDj!Zpo&u9;;Fo5hl##gn{Y2bG
z6$wki(#~MPBJuZo0gdvCvEs-$@pz)C<*JJ01ps&-D1mg5bh`1ZA^>g%05#FnDh!}=
zXgzQ9%hX~#>B{v0J&{nfPHJ&4d7F?R=`7RuK2?bgi1U;{a+(29qm2YhAC*fL8a`_A
z4AXBt;uQUyBwvGp4p(_>qY}LAL2SJYg>7UqPcFBIy?tt#2^48TonXi}gINv&InRd(
zxB@g36q)hC9?i-CEXj>RqN#=bWokA2W@=SniKdp?v=pZdAcv)!c0${qMd?+w7E%VQ
zk0-rU(Z}iqxB-x%1OS$Q^pLFw8y8|pml`Tdz&B)mGqoxJ*EEC3T;+5PKwg5EP~iZ=
z4;`ky{!-dbBy)45LZ~UrK$XIP2bN^|$uCo@vpC-a-5Q<NCok70lML2O{$*+<1-&Ju
z)nlG*s#Vp9Aevg!wcB7U$O;E#kq3nJUP_Q7lqo>oM`80Qf}wFuz%V^KE3riR_ynh6
z6i}Y`l(Yg2AmIZFCdyTbBQr`ae+FX#(^%&xAz?&Q3sb4z&{UCHp>L&MQ(dP<q)P^x
z7_aNU8pk+URe`($g=zpdNU*gp^<TaIWolJ3V?_X%zBKFykD<{A3Lcf5f%p&?nK18Z
zl80Y@nOc)keNzwcbVfL!Ye0^rVvPJRQ%ml_)0;Aew1%Wuain#eByVNN!?buBS2;HC
z5IUl%)i648K7{s!^cup5?o}{NdOV|g{LOV`rpi%T4pQD=5=uS*8ZwID91;fRTki*7
zkPEwrelc}IF32!Wbx4uiHAXN!326XhonIm+9=|egBVlfPgAF950RSkiE=h882rtmE
zX@Vj#!TMi9&+moG7UDA-NEKy_`+wk-;2hUnM;Xb>UvPrJ2wV<D!~Lv4hUf{QV0-|_
zRkwYz=cnWb6%Y+blmx_taB|VKh082@k{Bm1b3!VN4t$6S^1=jb+6QGZfOX7GB!aJ+
zv*yC&r)0IS*$Ja9OlZ~65nnl{-q=sxDSfJJk0rAQz$B1#URdYoAvzj)*R!i!{J^U7
z92B}n?h{j_6@3@?1IhUS8mA$AZP=RPw>QIZunGV(n)Fg(K)FJwbYTEni#lW-z|?Y$
z*L$i_K*Uk_TF7=LL7M0vLggvd0AK)?Wl(iAClg|T1>&{Y3<0rf@lcEbjU#dSy%UhZ
zMs{PRfH+`7BaKZ}+2&AT^EBxa0AM0Jz8MT+z~a=AFH+^o(x!RbrYG=Z;=bespU9aa
zr&}wo<tfr=GGITc##e7ndsIvitY-xEkR&oQsFPZ{+t)ol=_^VmFjNfZbdp4-U)ALk
zMdFREvw|#*8yDrP!F=YlNHR1Z0K7C_{1BxzO3G#rbj=QzH4{l&4}Fnq-cn(1kRGyT
zL7a*JI%~d`?<65j7qK${LcOr$>r*8Q=4&6OQOT2MMmSP4EGb{LND@|>4@cxuoKYcg
zGb{n(D#N%9Sj+=hR^LE{17QI1%HVD)F90+NK(ifOwGH`9H&31ffbmJwB>`@G1d#Jp
z3U~n^Z2&Hlc<Cf8Jqb?Q3;;_boxg#l;_DYk!jdt}kQYOQo?vr7X(gY@!1flP7-=&F
zK#@E$V**3#Fu=NW@fkCK{&mxv?puq&*!S{eoKS$Of+d^v>_kQ2+w}0l$#A`wmaP@@
znvkj&fiuJrwO2%VFASKKDi<N%HK7+@rii?AV*zZ2ZI>sb1B|??)^|1tDHfjrw)NaJ
z0L)U#QH05T55j`>nm@r6BDk#TbFnFKtWa4noM9G-P-N|zJ`=F83&R0q00iz~D=#(u
z2tn*~6IsFg0P4sFP(|bO(%^OrY&OK^r(!%^Yh%{t6y1sSmcm?nBvu+82owRJ0JMCb
z1IBS9&u?G>1^~qvP1JR4$K(>6XfW(A1@5I>l!RVwDBVpCzP-n9gb(Fw5<Uvxl(V*T
zbF~Zf3Z9eGONb+}S_+p9k6dfIfZ8!;D+Bj!1<_?Fp3LKb>)5&)fRjuxILo@U)_N*0
zo|FNgK}$yeV|gZ(H2yG<#@<4g4*(~rs-Fl}cD-#N0pRDkj_PY*I3|^F)!|&f4W7or
z!xll^w?(E%L8LA3w}SnZLccFu<sX-?*c<?cHId;--K?ru_W}v=CLPa*UN`-~ux{I+
z$RVI}3&HB~+z0w7#vp-fIPHVwXmzY%5CC);`<nH7%!MTfe6t7i?)Q%$8JCy3T`wm9
z>;lnXy%cUW;ehM*U?sEwqsV8eHZoc$$S4V9bqEnVX3F<;Ec_OVfr749fYZgoMP+2t
z>=QM-BRd@f?1xIMu8mXSS0Dh8)6&2j?q<#R0I}9~d#QM))mcZSP#MMdDJB5sr3Q9C
z9dvO(N8n8R+}o-f8V{AopjK;-Jn!0H2B4DH>V+)mUSTgP#k2Eh>D>vYrj<(-*JUSZ
zuh+u^dtWOFYLElOmP{<<FU$e6dOh&#X8}vQdB}vbtAyM5x0<?D<ajIy3VvR;82@Sc
zCc|rRmKEKMlJ46L#xJ%L0MY|F^2|GqYM5Z6j4>ORqbuVm4+wXehUDkxU11PV%W|X@
zaghh`<eUVRy$$nV2xJ-vH;AWTvnR8Xy0)&btaw=#7xK%tDq;apVr)?H77o{Lpc<|3
z(`wO@2a;tGZL1J=(wk5y;1aZHJ`xKxYpoJqtP<>a6td-!bUS0KN~HB(b$7=Qn-b`n
z?LCFYmaltIO>^4tCOIz)-Dxb)sw(;*5P-!xmA&m|Q-D_Nd)7GL6~tvT1D@I<+448i
zxR#_RLuiwnpX+OM+Wexe7%F5zSK{U9J`#TFBh%R^O}qm7TA&8^LvLenS1^#Pd?B~P
zc>R~adq1u6%kuJW=9Fhgo2%p$x<?;BclkaXe)Hs+l`_<FC&If8M?MsEo9X#&j+Zs0
zqjv!|x(!VtW;?)(u9O%6Nkz!rh9*eCo$_=OH}onqi#&J3o`wV#oD|Y*(LC_r9*uPT
z-DxG5t_DhDf99vciH{CjT`g+zo`_U@-Guz;W)R2>o3Ilc%eK$Dro>LY_OrzT$sjNJ
zWBGaMEm~BlW6idHl8E#10a#|*10ZHe7)($K%~I7yjfSYAt)BCQv~Q9;*CXLYg-Wm6
zC&B?Nm%j4G?~KI>OYOeM_!;EA6iDE-2Wk=xtE}jU4G>yQy3G6K=W)AsXt3~?&<M?^
zny!wt$00J89;lVOq^>`Ic>LT|H0&uE#jT{@xvEfphL>*q^sN04$cS8(J(h}L0EBh`
z^6oXZ%CTk0kqpnaMD|u&V4<!JEbo75RbthR(#Ok?ENuILoc%?B&(z0RqE>|kP%tbi
zGhBZreubY60F47^8icez!GhxCGUds50s#maK-u7HQv5>ndoz;NCq%^znS=%Md7(z#
z*pBwq7@A>i*!a@mdPSlv+H}(^Fy8JCiHKUpy!>)%4><xSkaw>x)!9kB6Fv<bxCC&T
zo}y_0Qsa%E*M$%q0Mf*=RSOCS&pLeiLlbo8=%>C%I|Hdo11TgT%&(1Xxd``g5Ay6I
zkmWeY4-KZ}1DOW=EZ+}(*vssL-SwU}p^fu<^YjF551EI8lzJI_@ML|FVJCOIQ}FbD
z`}Dns-sQ)npFm*`e;(WKua&bh`m0ll-CN(|=nA9ZH7c>+=X@K*B(0=|TVd&q<J5R6
z<nZNuf1-eC)x8a|kJaR4q?9sQ9kW>SF2Fq*I)EB42^p0dBcg3qR#P%Ggx1h1ADXZt
zFjz9PoCX7s!O#GjFK|$blya+~h=))Jn3PX}0Rj6Mm<@iPMj`${c@%<nl0?jr+s-B@
zsc7>V5FmFTU@%P0%7g}rl@kS6eMT%@Er3YSQOXtQt>WM?;^HsJ6##Lf&x9sZ3vnwz
zs9a_mpe;Zu&XWwlkOdfPtN}j0VjyJ=FpBdf>!yq3u@!~@6PrtZzdluT-`Y8o_lka8
z=-eeOh)=tGc6ySs;*xR6ryf!35ahz@t2TS;K=HsShIMnWL*qQ@#s?i{AI-0N3O;*C
zP3Hf_-hD<j(XM^Nr*}dEp_hc-dyx(yp-Klu5TvT8pcFyG(2?Fj1Vp3?NH5YmNDb1Z
zLjVh1kd9#9;MMoO_TKmXJokFuwchvnln*m&*5q6>vu4ioIR3v{$M`ND&&-ZcRpytH
z-O@|i`+Cf$Qscp)+;+J`;O_@}PgR7{jya;l`x$aHXQsV4W8@lg^@NK*h9t-+TM+Bf
zaQoy8@b}$R?~>#SH@SR=6U$Oz^Y^gnyJO>aqe+wem`)wHiHXWQt+#w|<G7B3eF{N`
z?C}9S9KOts<e7&Fz5L6;2nwEu;H*(8=k>=i5N4LP#F%h_hE-2K)G=S~VzXqo#%WVR
z7jJ=70M(Q2lbj*pl)G>AxE$s>h#86dhr4+lsyW~Da<$yn1nE`BYb!eMpgT%o<Ek3K
znuXE%5Y~Q%E_&GN7}l^F-_gz$tEmX5JBCtIalFW+7OtK5zHS#C6`>$f|0#J~Pf+mY
zr{ManhI=^@A$V;fI;&TSVR|>38%0|uT#tm?76P;TH8xQ3;VKhOGleipnT|#90D@%q
zQVUlFK)EH1FS_`vI$nv&?o>dSO0Cq=Wg6-nOhTW~0xfx=G9i)WviFZTMalPa8=D4o
z=ci{?Lo-R0#tc~4PHI%k06$!WpVW$#CyOFYYC;*)=pF@gS>IyVxx*Dxc#5iYc|ue&
z)-8CR(nP`7qAH{}P3ejnR)jE*131c5=N9BWg{rg%MBKxqm!2~FdethKHOsC{!z9&L
z;xFGHT}iy&ay${{HyJ|iyxAix8SEl86tpFc3+dlQOHy%orj+XOARWin12QDI2H$Zk
z?`ivQpz~{GOm?;|q0zLn(UWQP8BN~?6{zBupI=r{I+(cbr*t@Z^9NF+N^GNq4dpUU
z)o<Y>5vn=_&QhP@GXV91_Z)NHoxVH9a1OEn?wEAZ-(OUD2cFr9)~nNFalY2gG6N!Y
z&g}48oCdNxv2(g2^&jUR-%$4w6WVqier%%JE>y{@_6l?-m<Mb|YEYoIiNYhS*+8oc
zImA71;DAe}5$83H#il7CAT!r`E*ZuHgPepp)uYCxNp=a8dikgW&~yrj+;{_<I1W@0
zJ00mIVz86l(;E&+%`JT08^Nwox1{<YhW_P37F?vGQ$ygL5pl-CKpP2;dHP<}ked$;
zA)SWVN&=M>3XTB|FUnu3bQwX}6S8h@q2bKP+i|z6*@3$Zy}~nw(V|l>9H&#ZR7*DG
zY{nmHowe|)><*t&F5f2eZ0os%*|Z^c6(fMWfOfLH5m&HA!frX8<waRs3z4MWlQ$6L
zk<fEPIZ#)TLJ4@(XMn-FPy~A%Q>Oy-O00f|Aw)AcOxe<(>`t{49ZW2Ym1&oP9;<U5
zj?q%#^g`%S9MoLc+%hlVkh4)2-PPkSG<X7r0iGos0oc%y%{C#4eNhtRcpz)FI5~2>
zlO7<grIIH0)JkfJw#5Yox)p%0tX7rFmKLhn(2IIz3~&>&y7TFVKsQ}BI)cZiH^O3{
z@0Qr^Yq`jLd})UFUSarz?gg1NjDaM<zIcSEs_pXCsu8-y6$-};_<Sv-`e3b2h$&Kl
z!%&<sVU3K|cwe)h!WctAUmQxoR)ULc0m{A_y}~K{5m(CL&1Cbpw`J2S?UEZz@lLxY
z8o|I<Hn<_Nx;vR99BS%7i<>eE58p%M(fIHgF+x)pI*71iyo`*|m6&vR5oo0Q_BkkA
zrW&6xRgI8C^h(fB-UMV^LQ8Yy^M|f)H5}JJ2I!nypul8iQC-5N2acy|i3y`nnP>4z
z#lzPh48o!31p()$0r=n@BbM~h5R>zOh`_K_+Wut&73J?wv2(%3$Exj@A_DMk?W#UF
z&b(=MZlpDrFix-7rpaZ9HZs`qY#{RNRjdgMlsL1c8}<?l<`h~YHL2^MYY_{PEMB5?
zuj^#{AtolXy9B}{)^+hHi$@r+EQ71+-ii3`hF>xwiWREOb;U-U<V=tmvdCI2lBfZf
z`{H!d#~@{BSlk1dSm*#c!LtAtAoB@t_`V&@!ZJQtAP)PFRT|=99lV4{)yvflnNUXc
zcKX+1<n!;}_9(qB)cg~uwO9N_X|I0B_lIOAzVJ^_D@0i;o2Fz{U9w^1$^AXO2fCN;
z+l~#6bo7{y%-nkMJ}C6GSL%Irf0J*DjKl64F_qTcwJT%Jbg3zU%J#w==3@;XYFeaA
zU9IqAd!dsJhgy_K;Z0kb#;MxR&ngm2HZ6MOrUqgTN{xmCZ<{pE)N9ndt$Mj}>$(DF
zX6%DZovV-7woeDW!?4EeLL#Z<wk9OZB~NCia{%w1TQbq~P0>N3zPrdTOiDLBs&mcX
zUC9X~wnhiA;*{<rjP6r?aOE+hFRdrY!Ks@zD(#}wbd9Wv>t>7v7pqK#nC=eIt22B6
zw?L!KOjmN)-@(KMyp0b1O>+l^iK&3D<n;dXoWTs;J-1DxzgRRtX81gY6YtC3@ygW_
z3GniL(ip>}@L&Z{3+R5V;2~sjE^lt;9VPQ*;I88mowQgl_`cD2)hS-7Fqx(EEZd}X
zjz5@ClS`8%;9)ry)bb7G88brfKT|z#J8e^-kX(u{Qkm!6D%n_?F7N`2wQvJ5erJoV
ziP?HcJKufr-oEw$PrMDvl5_6!c)7?3ad!mOQm^8sz3BHZgZSloz4vs;{LoS75<5Y>
zO`6&7uP;=M97V?-Z?;#Rynk+WFU;#T1u#otK3RD?*E*Eku^y0pod8U&t9;xk`s4mY
z%W~Z%Y+w`gY^|nK{T;E;jeuC>VWUdqs6Xb!DEs^F0|a@My|Oa69Xa2Bz8OJL%oxya
zl`0;kB9-7pcpa!1^hhj-Yv&c=4JeUkk0R3WEWT^<CbTvQLKQr$%{O@(fM#unkfsHb
zW}_d4F?nsiR7b~=f5@b?Lw6I>Yawl7omr(mLCL+-Uz|Y2aBa1B(3E%>UH7M<w7oXe
z%Ix4<>7WdJY9_YjbK}Wq1nuF~kIzi$BD&}_*g=DVtVp~|KE(JwosmGi$6;B_Em>W-
zwha38yQ$+JuPj6rf{G?=wdb?6KC*vq&l+J5+)U9@P{coSMF>uTSY)y}52rrDSSAjx
zeIKFKlbioxZoz#z&K-#0QRaXjt8tnRU-C+tEbbJR8dmHIk|~}OE`|$=;0rhgjTA07
zYX=GW>MP`Ci*nh)xj=kGIbx#|9|sr3(!##tCX2IidU4tBi08n<mcMA>b3oOgnRv>M
zLDEEOP}5H6+W^*`08s}u_GuVb7+l&kCnC;%BRxmv8!mf>4FZh`dI-x=TFCiU4a}`z
z0-c(k)W<0vqPgg@B;G74>EytgEH<YCq#Qa}ggS)@IwVln#hU`92-GkXy@P{z91pLk
z*yM^*Xo(vdiEjqV+9C3ma&$_$q&#h{xEZJ%(l3wF>b~JpTgQhX)p(F<;!^?7XoC=^
zfr0yQrExeEp{8P(a}I`cdVMtF!LD487%Rh}vWDtfc*7OBSMT5C{Kl^5n{IZxqQjAU
zmla5O2OlyH<Zx_9#BgX3;#KFa7|Z0TARR2%SptgToQ?rk4ryXtxowC(Q{K<Exl3S6
z$0N3DJj=xmLE%E20%fDjn4{7~<8G=zJFG<V*l2?q=P`MrnQCm#JR0fvEYR0?GI;L3
zetmbrP`tp(>Taj-T%c5OjObjT2(~lWiyrQXFWgRzMByXI2p)732W2h`cj>EYAe2gZ
z++}#%4szUO2p($O9$o4bgm&C@4iuFqU`Y>R_NDd+`Eop%>y?o2bt`>jz9a1=ySf+T
zy`vst6~Ei@z0h1B&6^K`EJlh#U5^iWr=D_qU_mVbOO^d}bqYAviv8jRK(s}?Vbtex
z%vV1%gm=Mdc2vVC3PMEYY$I-m-gi9K>(4t;<8r{BZICGPnUpEKJE=fwA1=OwD^Q@1
zJnmp$3z8lGk~V$2dbLvm*#Sm$DE9X7Xa$88V>$(q6!#mLgqeCJxNsTM9mN&lubp_q
zZty4H;!l>b&2^v_Km|&L;d4l}3u)j94EH=QoudZ_2u||~%tiP`Mbk+I(1Go84UKsA
z6YzFnMW%3-wiUt5j<~ezzDxwP6K(VkIv@gEj@}7L2Q}L}g}Jvz9va`y(_dc%1y(5b
z=Lrq-W~otf6|(8|;%RF^ld@z{_+fFlwC&uC4r)v`UxM_3-?0*+P$#&TFLfEt<a9M;
zHR!2Jgsc`V8PJZCE8t{jjd!(^zMSo~a?xH2uZNCc^|zM-)oQt@Abua*onwD;-F9Bn
zAXcXh!Bs9!r#LC}X#ZRXZ<swN3zq7_gw<~mbCm1S1YhBDq}W6T;4lV9x%D@FQ>8?Z
zFs8>Obi-k$MICoz{N-<Vifr~61+6OTsGvHF5Ndd9oxC=Vf-~*!*ibydSFC*TAyRlo
z>O34^c*}jYrj9TvWV<97P9yc{Rx??57rx;A<gl}i^R{ACOA*mQXODmMGqvIoje$_(
z+oQ@u)H;X}Herx(e$+Ky#@qlphmLL}E=P4xsV<C$3m1|**BIZ<Gu|mI24>9c;LY9a
zui1=5cd|&~GV0=%iX{|=tvP5!waUQ!+e+p}otb-a>Xwb$WngY<!pl6R0pW06i(t8S
z!!a^@m{P=9Q~cy{AS*QC%mGt6iNY5l3sy!3eJWjEPr6@S+$picgLGJtpkR&B>6CN~
z0=F+;@=BBi!==mbDijBWK?9itL>|yOMkzYCA=5M%zM?GehWmec1bi^cU-nH*L__ug
zNd|T?F+oWO&(1YcrZOVnFj-2rw|AF$=P;%1gSD4pX}D8ds3SgAHBK*r;5!q6KbqpL
zw-z&6^{z+gslM?yaQjj}35U$kImdfwdm7CDbEPktoP;CSu>%~**(U_#NT03MN`qAg
z5U8yvPT}#LagUyMjM$DJ=@5MLG?Y126Ay!bl<y*aF3LQQcN#)`pie+H$E%T)MF|-p
z_Z#RO-T86X22Mf+$H9oT0V}?pxhz#%amA_Ws(olGyh>x*DT02k^wf@0%2k&Rw!hoX
z@+|bt{X~!UY+01ZgIg%@IR4X?Qt%pFp};j{KS&md53ojyVeJEd7j=qqz!F2Ye%IM4
z{QQ>D*o|R$o#<J|j%c3?oUa^gd!HE`CKJ~o5(n!rDkoGae`cO6V^JQjcWdpjvC%m&
zAB7cj$oaW;92W4(nGBg-bOf8J<=>Tgl}N;7<M1B^3CRslJK|PXe{;BdMVcbg6Hw*c
zH&l+qlXx;A;ny+H5+?IHfHkaFk)R^QLLwg-NQW>+?%;+Yas6TC(^3J9H;h5YYJ`~K
znOlMU=E2HRm>nwHt7`osir+is<M!lj$~en9<!h@n7~I8a+$E``oV+I_-3@7=QTsgY
z^p+&ySRE0erXUuKl0c~Oj?!IrTk-5cA|xPOEb_!^NvE9>vSGg0D85$1l=!F_&q}3|
zvRF~L`3SCCE$n=X?T1$hsGpN?Uhbm2grHK<VRa{<RSyOTy3rj}dlACGt!k8}({fuZ
zat~bT6T_q|#aFMqRbeqzqhvv#-=GUqRi@hCs3t%|O#_?EfN>pQMGA!W_y?8)^Cwgg
z|F;@%qv}tLfjjNOj&T-M2c5EA{e@Q*C~6SQp0*o<wt|O<7h$sF{<1$FN=tUhkNa=b
z;RxKt03qo#I_##D#hq6M$dq*h$O+oN^C7O7bt3D5RI>LFQ#7<=#=vS_#X1~+Jy+UT
z&pWSVz()ypYjN*2da6TZTqQkSX=EstB(!_DI$W==33t+G;;3AyhVdOqIJuhnbZWR0
z*h>eJBRg&r!?^e;1nJx5M1o|G11XLvO>VEC3NJnRuBNb~$|ZZ5GV&E0dPnKGq@Q6W
zw`PtSEeTKUb*1OJ=goJ5=iEfTO5Cgs5cTU9BCOI7vQ=4yUA=+0SA#3hsVmx3#-BBs
zkLVB(54Pm=Am*2bD^#l#ADkl&{I+7$9IGunq8__Xn|NF?y541wV**2Vie!R?-@Sjb
zivfK-hMT{fFv71_>C*RrfIJsoP%sF{x<5DLp4-dRNo?);(eeV;+a}L-_xU}1oh8|P
z!%H)AhS7}=q`SDtC<IUR2@sbb;=LNfXEsM%s!`c|81ZB`Z7=G@0Nd;0AZ13mDh8_#
zhAy7oh*aX!Oy&wtKg~_YPPuTC_`LZ`!Ddn&`Ift8uiYaow^(lLwG&0!k}3q>e{o2o
zebCJ`ZStT)&Q+W}fyBwI0>*d1lIdaPH*8f!%(yCT{oNxO*Hh!zMD=`(Aqtn}T070d
zFY0`3F178`TOQU_<Yt1V_%dMaXLaH3vBsA!2{d(>jEssPJkI63SJLY1bCPd9_CRc6
zj<5AR5Ko_1-D!WqxPH|8;R}mL)Au69#>T<kDD??%(0HR+#rLJSJ4mg=A8AAR)!2b(
zClWt!xD=fFMK103C91fWD(Nrjnoba^wGWxQNS52a1}ds-Ro7No!d#kqF!Mrn{uE+Y
zk(R4%0D^>1DJs2Ylv?P40aY%WOB(P~9!LDhI@Juj>Y4hsuM#!^=C5FN&qUE}!qq%a
zBv$l~q?OxbBQJLr4S1!mJT?%NOWcb}9Eg%Z)SKza#b1}x^cqua!e?oN>6;*Uya0e>
zIC*+=(xO*;(6ejvQ8f=5_xKJRT0Td#cG&mi8VeG14|##?&z`)SL^1|T4S$29F*vQR
z5tcb%0VdjZdJo^N$wmcw)A>LnMuN{hp)keARt-49E$d&Ho0huv9dp{a^_m9baFr29
z^2IMkDrmPAd~dN+<fk-tS0Q^5YK8F+vYFqY8430V$Z*|smYC;vH_QewRzp5CN4uq7
zKH^>u9mDkJ66q|EowgdMDzY3$yyXwWlIKDwxTbceVCBb&M(euoopq8eDvI*j_+9ki
zg0qvxgFKrGCc={){xCf2_P{U>+I`wwbP30?A^2=u;{w#u%-GPNzS*w(qMF^wRoour
zEKH_xcMR~3*R&vlwtA2MrePL5oKD&se8)KNa;l6+|2|y=Q`Onhy^b6Vk(Q~kwTB`@
zWtf!TvKLp<Dav}P;^s*vNyqIN1Msr(t%QKirJ*=yLvWwe)100<Z7%|TwaHg6>7+lL
ztZY1r=x+p^vnR|9E%JgzB2eV%a@!^&{6$N>eeg}iLeDdwl>m-}NUyz!y56-18RYTr
z-qTs~1Zl=s+x1-?TYiv5=S)PL{m~?)rzG&)QtRkQQS0Gi+tcgsX1ZnF{Q5PYU-DDt
zkL59O5fb$qm~7CEIoKWfwwCzN)w8$S{B;S3p9HL^QbqvJkh?nKP7b9q5Kh%W!i{(n
zeZq07lMTHA$`7d=cN=_lmux0CJPO!B`P3tujFK3{`9?@}y?QM)3Ztw1-La$Lnwz!;
zlQUw8c|mn~>De3Lm|zdrGs}cNo|nY}x%BFtp*nuOVMZa314lJ4C*>jvUx{i`k3mFC
z*7FB=U#)AtN@5z*WC4qHI_u{w%juAB80w5cQq-2KG8MQvOa|2`t-iFg%!0#*bLgbO
zqgvXh!m>g7LXJgD4NUh-HZrS3-W0NIY>4*lq^(w>WHvUthtn+!x&0oFMM(<Jl5qgz
zs+R(YS^RaJD!RE?lc(&WpFN!9PtaOc$B*^#?2`#R&L#>>LVS|NGDCRMj?L$Eb1v_q
z4Gj~R&L#OI1_@|}Z;wQ|<$CtKe7@ivd;Z$eZ@v1tb@q;{Xb(p2=%!?zH_kTwQZVg}
zKR_)8i%PAIb>j%>g+D;8$99q09dRF%uKW&akz0MCK}b9%<njTg;>D{!udt7(JcE6T
zG@w&A{{z%ow=aSPlw}^h=y=Y5Z7(lGON*cU85DWKq53CKOTF}UaeZ~%>yS^?<^|y=
zLi)?(rpJ6E#=n7DEW3Lhmt!soUs-XizuCXs9`iDSLUH#OP)q62<K5jisdhAeGT}nu
z1|OCt#N$p~hc<^UK&=_)*5={iXF1nHn7Y#55i&~f4>T4_Bt!_zJ+sa@!F+z{r@Roy
z#tO!QTCHr~H{UL1eBW-yu$}F^GeBBrldwU~_b03|-#tEBk;RK1do4na;A-57-dx-H
z$is6C#2+`wl<U5DGxlK*zT>E=LvqZAICya5R8`$ytul&(3ub^fjwX_ug5{%f)Ru>h
z6_6ECx>E(x$8bVrWLC5p!cOjdN1cm<of0MF7(jRuLbi+Bp&M2XDeDaurMp693SFi>
zCdroBdERNimUD~CJd{=B3rz3^DAH_PlPhpIm~08oWO0ng`MMl%CoX`)I>nBLX*A^V
zaW-Xvm%8+Quf)J~@o1cNyQd3|p;}EOAkV2T`di|${JQMa((;p-$EOuh*P$Ksm-a$s
zj%|oHR##|M;RN?3+Cy)G2_VP<J34K19h2-bR<qG=yvX=q^Ds`DJ;&Zl8Cg#~#I%@)
zQUYb~#}gn-SJY)4NFa`dgs!>NA>`wlJiw(o9xy)SRe6wX0+2Lq@PYQRDgjkX8@_~Y
zdtBIY7dSa<kRM3^I!=MJ^wIPiWl(4ACh_hI)E3yqWr-gTYtq~rp}LbK9&>uFM`YKP
zJTog>uVbHB<=nix3u?;o$}u>(x?(`t2ga-o91t!q<U%6s0JV;RGJ(T7BI+G5Se%BE
zOhDKJv}(F~Q3T%?bCVYf4?ShZ@>Rg=vDx8p3sqsX>O0I*iw9T2Gtd1sUVkQnhSi5g
z)DsC;!WhC;4fmLd)*KUd;=>KVoq&y<c0mq&b>ZV|g)kC=`G<iK1`Ra%uFp0s3C*JT
zky(_xtNa3K!@<tJIh62uZUKhi-mq#nvZ^>6YfS%G<7a6}ZI@Nq{9yv?aZXb6PkiU^
z$0o{VvRFf11xQq2qYvirUS|oT6<6`h8d~UTD)iEnTXrEbq~u8x!`+H4?89OEa2Chx
zPxr~yt}idcYnz;DoSh??ogH)ZFsBAD0<Y8Zx=GXI9-AwqJSAb#y~lRoh!04!Ax7-4
z(809SXmW#McLPmocAtGke(7tKfN4W^uk~c_Q~)qObR(_qqngiFuiM~5{=WrktsOju
zgVV8emZH_V*jNx7^%4O??(q86MO#{G*xSN8dY|kIFfcO9YlJd$(5HfPS=2=Z2o?)0
zon;zGZd`{ie0P46r!#26*act4W&S6fm5Zgbys>l^f|+8*^RO<un8d7X8DP8$hn>0*
z^7}7=rnWr_tOiNl7GLy!P7cJ<Sr4#u)_iGlAePRe6iI1k9*Mcs!uZ49qB@NxmZ47N
zRCvdS9<kg6L==&-fiLJR_7kt(&_FDml>_~S&T`F<TUil@oH*LNk0pJ}!p3puF{&@X
zEgwAx;W?7i4i=$K^uy9wDRBem?fW4rN_^j-GQx8%g!U}6%OyXK#B(!A3^o-eV74AT
zL8Ttq`!F&yVq#j0!N{xdVLl9Q?eT>A*gaQx*v1ARe3tM%VS^+gy|I|g3`Uu{Ba&bX
zuN7Y&Iv#r!OJ_X@J^g5OL1*Dp+~v~}t9<{|^a*^vTI|pe!A>Zt<v{ydG=lF`bv?8Z
zOJ}VHLDMTEG!;AMAJv_=ZiqZ>%;EjY;rgAH%_z*_a=^#Sq-W@{jD*fmf-P6CVCd9+
zq8F0ic2822KGlm-dlhpm-Pe*<%HF!$9JE3f*w$SdsupuKC<odc^HwFWJ^V@=_CcKa
zR6M4g)QKVJLe0wlsb-}(?`=|H_Oa>Ru@`EVVfJLHFy^ofqos$Dy+E@#BwX;dvnR1=
zmMl917Y76r(@ulX<7g?PR%FNH&i=9e;H%W|*1kT+oCttynQdx&T_4+{3L_RC#+>1@
zxdhN4V6(|XkPNDE#ig$q1{}ix+@<z;;4r>iIrO-l<W2yKyckiVAxAk3jKF1K8^TF-
zhByY$x5U!i7>2Cc(#kF|ln0PE4vpz%P3A(G=KRTbM3*eL0B-LgbNWC$gK0$=-{)wO
z>%w2iVCYgxR)YJqB(XFEBHwaxBw0o#phnbkv4^ULWPD=OLzFX?loW2I;OkppO%5un
z5^6HF?Of=>cKf^~CCNFAX0{aSRx#mJ4s|gkehfqth%9JSOkBlfn|eRNVMt09`!ynZ
z9+O6Onu~*5A+lh+JMSg}aT%P52_P8|1z!@~fPURt&6>Ddak9E}EHeVQ<V-~vbC8Pz
zBFAHM%%a}Jj+)3ac!*LHk8WWQ@?#gkCo);yzE$TB(J%tx#qFT8s2cz*A{CI+XmSdP
zN$Sc8I%>A2Eb2E#Ts-AaumldbKCl<Id?TJq&zS7SE@$2#Gn+n{%{Jgvm2D0{akjLy
zjb_WvqS6h33Vws0;O?t|m{F?p!9$Z|OMrxEGHgY{tx6tTW3CM&%BwIoR5UtGeCx1%
z-UgQ?N&+uSjHyWcfJlPdU=*TbK)GsoFuDcE&Z2%X3Q5=k^}=ZSKs19!WEfdow&87B
zK_kkhb|8N_tGF=Tv*^7jJvNsm&?y=~kVRb@!}ca-Qs_QZ&|t%xl4Rl=&h=;(4G=li
z5cs1wW+6t>_M0RmmQS^EGZ%+E+KnAzyk|4UCVHQC8Rt@S)+A7Dy7WH8P>hPyn5-ZZ
zt7d)DACtr%q9j}1K)M2j0TfLm5Z^JHKpH8tIPtYnNcAW~zaiPx0J<>Y4_$7gg`k6^
zL5QP?%z*ok>fLiPj_E*{DB}aZ-Ac&5#6*(V{O2J)(ke0GXlAP|vhsG}Nh37Me~N5r
zLr8zmm}8zg7GH38zRh2)*%q8rexgAG;x<;}uT~R%DBW2h&D}ANDQJUBmmv(m8x~uv
zmxm!d<=}domE26IV>_SqAVhu~-pqcmzrB<`wuQP-vo>4ACvQDOyfc~!6JDsJVKyCs
zlg23K8FCCusPmidNl9{jgh^YQlDXirSqOiu8<*xb7Il8V6(u|mjGH>!Q{fj@wJPDF
zl-hvC&~K|UUN3<eEi<abZxD^*<lu6a;lRuE;g@M>FyjzB4?}J{$VXgqb0Y+2ydinV
zTuL;H%hICA1VrLsv6r1m?SReOneMvtdCcg!<34vz78|3H5#t1doA5^&fL0!qSUp=)
z;q63!DHgSwlrf>JHQDJOV>k}jO4?=!gsr_ES0pc;z%<31C`~|6dg6XtYzdSko#RKx
zOXjbtbO&6`UX4v@R8bwXUzy+6;}+I`F3zx8y$8mnzlzIxl*A=s#I%=1Kk}aPG{BgA
z0s^?gv5VdDnY9lkQ68Fx`wE!yDoa@=b<`-Y+>kB%RpY$q2~;KoU<|Hvg~-N|BVfy7
zS8cxg+w8GV*FmZ79b7#UnUtxSILxvpw_Dk6qnR6=s-vOT`^uh&^CRVetSyu7K;I5>
zl?++AJl@7<U9q1ed?dC#VL7OL@QpsygKq?6HAXv%u%)d@z9+}N*1IHTJ;=~+0Co(x
zXD-3bvP%|H%J)S4i(T@ybM^xn({D3Z=NFP~F>6$|MuAh7;QN?~`8phDJ$9E787}XV
zTY6>WCt1L$Qed0$eb+5AaKO=K4HdyI74|RPJCJ|}y0X#>Eq!1P8?>dA*#WcPziD7#
zm1I6NLWy8MA-Oa;Oh=D*1S)r-&DH~z@37sfroJ|)Eb4k!Q<UMjoO<}ZdPVXWN)_mc
zORv~2PM$@bjmvVi9T=LpnX=3lqW`3x9t)XpwO!)wdIV`QBi@)mzMJIhf5gY(!FSy5
zld9&k7{|4m<yS+`@0G>5GIW&md@MtXUkR5El}zJZLY0lnT4wXZ1*I_IKT!ugIinxL
zsnZ|Q1Aj9O@SvdIhVGH!QgF+T@zn)l+=UsEYbNxmf=%i=Ns=6{Pd(L^0gjDM6xjG)
znF`U=1<yGz-A@VCqhM363k|v!7Mc<kITeP@<4z5RBp)l5it?q)avj2eCU_BvSWqkU
zx|Q<`B4;s|hI@w=;^Csv-o^>%_*PkqMt+N!y!N<mg3=KNu0xY0z2|R`<!h7W`Vmj#
z)lOLe_4ROBRtqH4h>a#s^{n&Qx0C+RmQ1#dLlK)rRfh(t0a$1BC@qsz=h5uVy9_8a
z8Cd}S(h{gGbH76tO1vHV7{+#(CBP3@;&^a4j&qGwh6$B99}^JIS`S@5wx^taK1&pD
zB65v9AZk!`udbTPxQzM`mja_)Gx>v(0@bFGhh{iknsf{xGfW`kaTOgrKAuC*?4<0K
zvws6KY+=!^aWq36fI^`CTZH*u{|-n%{ITD3Mix&By=y`q<$P}Dl_e_H<0Wl-%6$ax
ze#+L;Rs9_|dWz!I!~Wr<b9RVJ7I1Ehp=<hxV`xg1itfxd?mS?_A80+F`D!UE$>c%k
zSM$77o>%qn1@fFJ)M0GKUl*}m1$mh{>`eRqVp&S!uTPc|JtmSu2S1+<((K6Y^ww{r
z0rHh*rs_oS>i0c*4B6N!sk?XXnpqTCg<LO^h$(|k#3l2ts78Qfc6d(6P&o9%*gaK~
zU4;*UhqE_~K&7htn1&M~P%_<U2|=0vVwhgx)(og|hwL@w8*;Vc@BYR0`e3gB@=EU_
zPKBG5Q<K}OvtmR0t1)zMw)VK_aUW3H7BceA4^lG3vJBr}(M^RYw)08XLXAbwB`oGk
zRVRh6OamIxB8Th8uw`IP1UGYC;^)}rOMz7`ToH|R9{OCqvvmqU?&VrYib7rfi-w}v
zhBD^Hs_TulFB%(X8(W#1I<GhN{2vCjFg>g{nxHo<yU$_Ww&~sX&bn_a_SiOc&$D-X
zH1#~1>v{SU&I(cN4NC8Qrr76-?D0c(r?T`!v-G)I_UFv?y<q9BWf`bv=`LjHf2=rA
zf<!gWbq`pgn&*1j&-#nzQ1gm|L+PkyMU>ARYg7~CdV243mccES!Gos3$+O<0rXf<F
z_n*!NJ6VQ3n%)g@60rGz&H{+oln5N#Aantva3~he8cS`1yoZiq;Vg-Bin9Px2_;rz
z_AySMQONwL_{-5t&0}(`queh?t(C@Zz8qCz9p|?i*T$M!RulX$Cmx)Sy1)DYnIFT1
z&wsEwpR!k)hWk%q)h+(!af6qmCO#7{nnz!qk9b&3CpJ&LWc|>pG?PC+S#&;9W;IpY
zJki)ZCw)G5r+Iu)2@7XU4JwVfD$U<+o`hV$SyL6~BfCDcNAt5itPAn;i-kVu*_YFc
zFBcDdCf8ohepOoh#JaR{J}LNP5e`K|GDaygrZ4$^WS$>^+YlY9vPRhu-B=(Qhtb^l
z@ktuS>gY?<q{@1T^92iMxnz85#`*Hn_Vb;LPgZQ7Z?b)H&iEXy3K(Z6c55SHfw7ji
zk(9ELkK2Mvf2?a}eX9Sl#u~5@4W&=F-7LHT=w4u~$=E1dSg*LT(X+78^J5K@<GWsz
zu~C(=)%athOnI}XWpn5T>uAQt<c*!h1(N+6+us+~vTm%;D}P<d*!aS>IRV?OSKgWR
z-I?(H`ju^$*6$l*>$W@2xB463PJB0En03j;ufo<_?ywzF%(?+)+r)Zft7V_&)ggcD
zfvDfX;ElbTizF1*dn$fM>WjPXDxYgJKBu-|$*j*lY+pPwzTCNhvsNcyt9RH=tusEk
zDu2G+f;L)EWV2#@4>=#RKA(JbKD&6n2>G#M{o~849~+B5zWxVLi=!RLerEm~sO5b|
zB9Z&|pq8dgBDeT&pq5m@a2DbxsC5SxA$<XANxvB{{0V9utm)-pK`o_*P`fbN+bC@*
z3HZx&;CqTR@};LX*CGTzrW{OjhRRo4e?L7ZXJ8*I#)4YPQL+_SP%F!rf<n#>U4Hv;
zpCn5=JFfcPEFF^h5qhRyOD+8*)$AoFJmGqyZ^_s|S~qrEOSA$O)S`!U{-A8SJ!QG>
zkSY@6@Gc6KoQiV!tkoOA);jKdb>QlJ2BYL*3cj9;vxmE!e#-p9{AQVmXo{)XZN46I
z(dlv5S>IbBH$*R^zfA3^0c7Vdby8mw16c-=xnbU24+1EY*alN8ug(V2-QY7Laoc1^
zki=|03*wwBbk`tJ^IAfYU1Pv|?vY+`aGB&<QUR$~_S2mVdUh_Fm8g`$MEE1Yk2W!!
z?9dT)l5@tjr!n4EwRF@%9KE@T3^&3*nd|EI-h6(;m-JQ&&y|#$sbz!G$@I5ebHeEb
z(^WZQ@VM<sXmlFFUP|6`CV3u>7tR|O)4Iu+OfO!Utm~tZlCOVfPN<^e5wGHjorfq%
z)_dyDsgk*=8NTwvHg+*OcMD%<q)jnp1@ynMw(WDnT3W+~W}&VZmR2HDr5bi6DKCfq
zcKTA-tEuKksdDXrjWE~Z3rlM>_2zAvzCO&%TAA}F|F!HzkD0r5^brwv>py2iVhaN5
zJMTAcN05t}b%H+Xl57tG1Le4v<#kA&?B65EczGu~i)VmQVTR4KKMT<A#$ajhpGI)!
zy<<qae_=e*IE^<hg)Ty!#QWW438#;5BHj80%8=J3BZr|^Q4++KZiBF=2MemV(_I2V
zvfG09LUA?v&2E1VF6O#K5_!<USjVO}LVf0$5+qpZ?HU+<VQKZAu3dTPIXBbOMS2-E
z95i^B*i&NQek<jpIVoWdcapjJ=u4^hzMdzJlHR1jT3Tp<5i}u4Ic|x79cyXb_?Tel
zhcqZnlJx40e*8J@!M2g4-Jm~~(u%_9d#|mm>OEe6!<%&Z1ADqy|9U0yP0NY&#h54C
ze6x%l!0Z=*v(<tjedPLd-Lj6)JJDArsH!!9&;F=;Un6(BwVyZ1JF62bnLe&PtK;QZ
zgI__d&t6n5r`xSmey5u~27c!|Ll69ZoF-z<e{9oyRM}k`LXx_5TMEHIJazWo6i%7=
zjQ07AXMiVd%pJ18Rl;<k0%7GUdLropD1c`th>kjocnPlqZ(ChxZ8#WYT%h)<1ggy_
zv_!@~+ChJ#H<%7V)KatG1|@S1GhAXNj15zb5aN|3dI6J*s~~i++;LCE)&FV03sgk3
z)^mXKQV@-<AekE|%(84qX4e&uc!g^S4Tk5A>N38r4;`ytF!k|iO2%}CvU{<CFeJUI
zX<hE@DQHmH7Y!+%PDW`b%JwA3UL^~)_^4o88@4;OT0Cx=&mL0pa62~WiB!fXoaFNG
zYJ+aeb|ySOOJ`S~*4Av0NGfm`5U{rIN52c?7zE~u`jMg{+fd%2id+(i=edk=qoS3D
zG<cz^C^V}(OP}Q}>$E#Dw>4<I#)^3a8w2&6?aE$wp7EG<OgB2?4N-e#-XeL(kaFua
zJbe^#OKxQi_0Tx(<#sTy%}4E_4fZ&qcA)}T&?;FYt$S7uT!R&E^FD_milag`1RS|$
zSb-SlqY=(k$Iz!4ML1RSv0`fvqfdt8sq=CnR(x#AUsB7;_jAD%{D^Z2laLnEaPb2j
z{n(Tdb(V((h(T5qN1tJ)ekIE+%*c4=o7OP*vxnghZzP^rfC~gFUYb1n2rOPV&2^l(
zZ~5}>l@}3LvZJoNvC{iUVS#P<k#Q<=wi2*-C2v;gIZ^b$IZ@|H<%dc-_e^!+V%w$9
zfQU_xH`lf7E&N7Nz`BmCbxSAvt>bI25T2F8mc?r#PbRXRk}ETWSsgp&lSVvis-LhB
zw=A5Pg%{LRS}8f-dLnWCL(SpaAG#$mvX`%Ce*0G5B`ngg%5!brPL$3=DpbgB0BGJM
zL(qO8<j%j0v0N2FG}skxV+XhF%jo@vg?T}*Dusn@f!c??Q-z1sjaJ`EA3gj+D{5GG
zIsRMCMDy(B2fmjhHB^`$wGj}FF%>9S+v|+n?gz)nC&1!`xnz^bYjT3vS@1{=Qr^(s
z7c)5AL6ba4>0GhdVdciNqrfJ+-mhk}SSADEhoqD+|0oC-6<P*e9(~szEZS^bZ1#b}
zu#FIV1+fxHrmcIu^gzZSD74~5EM59u7v&{#;(Y>YnYV7d{pL)Q@JZOD{^1SZZ<bw(
zw?>tcZh^v`LV5zmLC+ZnZfCfqt?|*xz`F*iWA<*ugYW{`9uEh1>m__;Y0|#W&T8eq
z3yXq-7BTE;DEPI9IT*6Fg_G3&h+EY;lnHmV4ZI(|Y^jE;HLr2knhmT?b%xUfYAbOx
zjK2~gd80W${M<8ZqD(`p_!-JVmAqlNOGL&F9Jzt^0d%!w1PG;x<D2td_tJ4Vgi#!B
zI^ru#4}`p}$`anX^Qdup8gNvglGgn|Ew!qT_R-sBt8Hfkruieq-Uim0?Sq=Zsk7}z
zrg2KnhuLmKtE?nxLJTf<08MB-Ij;`d7>&T$+9f;KaVH_0YskI)W%}Ed)Dt5n8WG%!
zxQn@6CaXI!CZ{XxlOT01<wc+GPd-b9lC~*qYmB(|kUufJnOmQ}ncjFcRjKT`@)iBd
zFKOm6Uo<u4uLx&7%#ieXtDi5xCS(-z@+*u^Ao-~CY3V^BzS64Mko-tJn{8Q76NmJJ
z#@Xv`?zwOyA>;0#nNPmv!m*v(S2P_KHhdpF8&c|jLe+$Z2rO0bB6qyMJXy>O_fl9i
z|NNk=>5~HWqkLZD-N08|UtG6OdIX=XXVb3&Rn5J_{90BL5$C!5ekW5s%6o-n&07y*
zzt3&>9-ZE5-1MVD&g}UfcZs&_#>Sp;cd{L$Ue)g;Qk}0}_B$Q#Isf(|_S{aT^>prQ
z%TX(p@B9sw?;lmZ9d^e4*e~)sAA|UvEUKXQs{DTJm$jb9Z~Go^ES7(3ZN*@yu>C{6
zEwvaw!fQ6?y#AyG{^SMzC%65nNOVbh{b{rUXc>F~Bms;hTGWmKtg8VKEhIxh04D>2
zg(Q$SERa9Uk3cI>`1mqUL7+HakYoW;Xf^QCv8I?-kV0>eQi>@@SP-mNPJT5=-7#2$
zBv`E=*bN@6xf*Ox5U5=jY|<;CM}h^lo`U(Fn)W`$u1=YggxIe7VL!ibUK6qA3%OGe
zvZ@(!Yc(V{FyvmZ&toVqbsN#7JE=zsVS5lRwIS}TjXXURmmV5Q=@|4NEKGnV^r@_m
zIW}U!g<!Jt0?`r!{zSCmi1XY@Q)F?X`23wy!g6HUBS|8Lzl6o{g{L@%w*_Isaa6-{
zCGld9!}E{*vb7@WSD~*RBYU1l#4{*5wM9JFiX0S^pWTUgI~92t8riTKRo@;tpoMI$
zi+H9LmFg9`f<w~B7me}?8zPCZp^l!fdos=t)wvpxN`gZzCQrW;mZ}xAj|I%NVk5+3
zcEg^0CQ-ynTx(j9t-};$B(cYJzI)eViOm^~wBp|8$G+~2Epe1D(+bywMiHn+k{9|C
zg~u`9p(P8C&z_9S!=_Jr;ilB#VEeO4+i>tt;?eo>EToATIy~WUUv_PI&eRx)A#Q3|
zxJr3KzgFV>QG&R3lJrtMEc~I2oV+Y!JkAd8<G85GokXoQAGmpv*&U3#r1rD<{G^q(
zq`aVTh<{Y<G0uwEv+L$QSHqv(tEbisPbQswX00u6D+hpx;oy~r-abhl%};h(dv2fo
z><Pb5;Wb<_o0O2$=rcat(D0NM)#tM~sW~~%15=ScC(oZVQs383%}I{<dK^>H8=G+w
zwyE{}wPfmxJILhl)S^C6T6o%{&tdq`7ghW?nSF^>{4Z$50K_;roH&Y9&=+Ol$Txjy
z@1~gp_|y9e)4T4ZzgtV|Cw*z#n?6{dHiQMWNH0LG=RZL$^$Sqz`30z@eF19S`w43C
zV?nLQ&n`f%wE!%rh4=|-(O^L>(!>i;iwP64xcZ8a>?f$@?RS1BlQ=w+j4W%jCzDbq
zmWnBh-aCLmCyUuTonbvoUp9+nJ&Nu$i@X0hlR!3DC!41~yN5oTUnfFvCR?)qi6~i4
zIA4y`o1EI)IhRgD<Qj5d0^UmNIk!l1)gp2QujPt)=W4I#l4|B&?tiLxntMh5u8}~V
ziB{g#{yh7TJo7if*JtwV8*Ht~Uc>laJG^<_fAjTi@1Q#kuU#9iIj_GK_HuNK$nWEI
z^0=GnnQ-?pSwT(hW!0|yqdUA}^abG--lE*5PrYA}zO{=GD0~~LQHm}&O1&m2R`?>#
z`=NIsqa$y8e_@WdtEjreE1j1alK3H-SWwF%s5$t}&SRVG^*3+RZsF1urJTCe^cUGD
zBgm7Ab_(AVO%}b=fi;4$1$o6g+Lze<3%bcl-c_3<Hx&PvF3zSanT{~>K$J|ZzX}FB
z`@Ja{?)U0nFZr<s7`%JwI*vyLy7Vhq*{(p@o=(}p-Lj*Ie+O#e-y_|WvdZ@^U2Pz0
zGPy*1uYx|Zg0ZNAd7y%IqXI(ycc4~dg;Y6F8&d_xI-pdnLf5}auBb|3pi1dQ71)*l
zCRlv|YR$rwBdfKGs+GyBH8!ddFH|oJzBOsA()*67He-HkTJ%=?-dnTp)#i<FZNFE2
z{rL9UJyE;J8u=H}3??<|PZ;gvYaAPE)P`#i-)jWR-`*=HinJ+}+^A)a*OAA)V=k@;
zuzmG(7PuN-7ao}{0jiS|ue-VgAojeOpR9UCyxw!~W~OJo-$uO{uH>`tz&MQp)<PwD
z*Sh>!#b^bZSi$Qvj14coJH8aGPZDgzgEg4N*Jl?2>%Z5x&Qdo%X~bV@yaoe(AOf*E
zG`$f7tui*2-4iusZ+fE9*l@3L<VthOljhlH&21aayyDH2MorgXTD`MC*6~^s*Cx5F
zrkSGpapvajfksmCmTRCE5~J3)-&^*vEc-?)mn)|AjJfrxQ43W-i@8x-pMvG7LhJEt
zs}ZOTpxE{l)ZX>I?b{3Ulkcs}Le#XnKqlRmjR7FBE(0mDh1{w6`)ngUMf<E^d)_?;
zT8a*S#a2mF`=vP$n<a}7l9ne5$feuH(F9a=Y86pzq_ON0aJr|c+o^Q3Q}3)@H>%Sl
z3M3))?&?w}A*>6wDGHD32+ry>P^7&Y)fEnEv7>mWVA*Yo>Sh78IkI$EIRURbF_`ND
zAEwhfP;`Qwx?Iw`hL(CLnsm(Ox}A{S!7M$WBYQlAx*naq3*GGw6QT`m>W+-Bx2xz$
zM%tuU_P(T`?qKdE5$cLWVvo~r)6|@$i0Q5=>esgHOB3qLP<;2CWgvU*T|Raa>#R2d
zxBqQZzj$KbTk-nN5av#yfu2p!a~9NFn3i39OSDm29o9J892jlv8xTTKa#Z!A1{rNp
zfKk+tF7sg1Ks46f+8vxPejoaFkaAgW8HIY^#JrZyyw&vn$g<>X@!&CP=zMbsLotji
zJdCgRe?cwE*$Uy=D!tja&a<`Av-Ksjjf1nzTeGc{bM3-&oqBWcoacI?=lV+K1_tK_
zx8{Z@=SPI+$MohWoaZN_=ch~NX9wr!x8@fq7nXz<R`eD=IWK&PURWzx*ce>c+FJNZ
zxwtF5xTm*x;JkPgy?9cx_<eBkd<(Pq|8G!B{J#fk-D3sfu%8f+65wEPgs?ALID`bl
zc%j%|5@KRv5)uk>asU+&L<OJ*Qqj^-Gt$x0(=#$N(6cfBk11Ne6I#U<Tz^)y{tppa
zzLI19n$ZDXrh(F9L4QYRg&O|@q4hN!VH=4^jSSq5zWl#WXho(s?55k!y>$1^uq(+(
zM89%R%`95T^z_ZTU6GaiE&E<ju5(gu%P)S`@@wC{*KWTkTIhWLKM1YD;9vZ#y`m@o
zEkbL%CiYWp%357=W_|2HeaYvB7iEp3hmDE3O^HLz6`RfJRV`zyE!hRFDP^rQ4ei70
z?RiBV>Ej)5FBGkJ|1*l#=5LDD&c9T&Q2$ra!Y60btt(&Z45JaefvT%m>51dKoS|D^
z`Dq|U^4<cfzUs?RCOnc&uc3NvtiYt`#$dzSjmdKRfegLInyuM7_l<?Y#@eroZ9(J^
z{ieFzmEJ@_>-SCddtZigF2B-mZaCPOs=BxMzPa(}E4nih12Jf6I@wztE3zJHY5soH
zIC+w0(AskTeSc|Vaj5kVMT_rOMa${WidNiT6fG_M3q{M0j)%h)pIYIc6fMpRMT?W#
z{0~Ko8mnj_aF#v-6o!9Sv~-rZXjF&GxoK{AwG;i5q7{u*w1j_Ev?#HP)-)cO_=Tb+
zj)kCJ`F!|~ik21*R?%|Egklw~P5-|rTB^S&T5Z8F50WsfqV+g15UXgJgkC6GJQs@A
zdw|U8=ubr}7W{{zWk1f&{i~vN_b-Z;2g6TAtMWq83epyjV!$d|DP1ettZ9aCsD4qj
z;>Ledv{L@0Xl-05TKJ^QPkvFfEQv1^tvGh9qD4-rfDWR<Dq8j=e^#_?epj?4FBC1E
z3q{N3r=k^vRkX%`Dq8s$iq=QcUllFw3q^~a9nJ7V^+M6o&1_TiH~%|DtMcy@Eu3KX
ze^j(={-kI@DUWe}SG1V^q-b>jQhryo#8*uysdbC@AXr5!j1;SA0e(}o#(yeWjeo0X
z1!5Jg8~>zetrGpBXw|a*s%Uv)6|MQ-6s=gH-xMvgKPg&);x@l3T9wdD-oH__D*mOS
zH30lOMGN#((K@<NwDA8?(PFqzv;hBB(aL1FP_(jf|DtHA23d?^6|K7eHAO4&-zi!;
z|60*X4DxsUv!X@yw~ChJzfiOs|4_8v{i103|4Gq`_(jpO!Tnv)+W)JfHHlTUVt-Y%
zavA=rXo>$x(USZxDq34GeTCl?ErEYhw8$<LEzds`E&ZR0mS-DQ(Te!9qLpIvtD*&`
z@%Tg0(*2i;mj5u`FN)R#8&U1=ik3P0cSY;^-zr*)yZLlczbaZGr2JdIDq7ROD_S`0
zPg#Khq;5YIEvgGe%jr*wmd$@t(c;7^T3T2|t1TGZ{fnZd`_GD&HtcZ*6i(Oek5#nb
zzbIPEq+B~fe^Io)sVPih6)o|9P_%|AFBGk}e^RubQe46+T2HWw*4AGYt(pIIMXUc;
zMJwz-DOx3eqiC65C|W81R?(WhP_!cD%l}Zc82(VS#{Z;f1yMTvqG-V{6fK)}z&|Kj
zUdyi)cK%M$k{S;FMbV<bDq1$IxoC2JzBd5z3q?!(r=n$yRkQ;BP_!QXrf5miyubB}
zqNNHa&o!(T!YWz{7m8N=Q@ZkhR<t7iqG)Z}{HADK;~&N<T2ud|XvJa`Et^h;-xRH$
zpNf|1Pese*r=oT9Pl{IOABxrutfJ+PAL8;iidM+*uZouHZ;DpRpA{{90)^ict+d}1
zEv+`9^I<%#e^9hI|Ffc%k?D|@`KzM!<lie=Zo?dL9cm$AlJ@^m(MlkU!zx<D|D<Tu
z{8Y4Xe^azV2{N#X79Zhu_HT-o%U=~O)jug(wZu=*|4GrB{6o>o__LzLMYvi=e2L%>
zMa%y06fI#OejHZOQvFTQg5&cAk&3(EKe<q}IDb>LT=2zhepR$of%xv##JQ^YD7Sy7
zXl49W(GphuCq?VgPerSZ0D*R4U`%0$JupX;AB$PN?D%(zmcma(%lLm&(Q^A6MN6TL
z0NWJs|DK|y_J^Y7`<tSb_E$wq;omA+X}>F4xc?<Z>q*;%qLm^><R&H<1(h<#Dq3jL
z7W7{gt+d}2tx!_)e^RvK(Eq4t`TnkGy~W<=<ia)&5NN^{)eA){?oW!ADpt|b`AyMk
z`&H43Yx}8a;aw<N!oMk6#^pNpe^Rtk{=146nsBi1S49g;CE5RjqDA~~6s>m`ik8Dq
zMJvN5&%?h;9II%p|4T(H<iDtBJ^oLM)+v@H%KHlalcH7ghoU9?KcZ;)6SbiU9dJ~g
z%9}jUO$IY$8N-xqJGyO#lwXF)9CipifO%mUg*>^t*Pds^^Cec`<037C+>yj_JMSb_
zcPNfkd2Gy-vIpK;OIHXR${s5aRRK$SsJ%UGTNFOU6R<au?1m!v98CBe$SiYBX!!0=
z3)FogZJpI<7i<c^)_%{BB_HKZh$&555DPWnhuL%t1MxBaL}h4St+-Gj9MY=t97CoS
z69FarQ~DbgsRRKnwU5=7#qI!>ZsIb5ET2-Hx7k}%bRNh6pFU3E?-X!S0GehO8++a)
zi0@=9W|l+(SXlDRh&xC;0AZ>`Lh|HaRPFhju-a9fK?6q*c}qBRUQ#dpiDwT1?B?)z
zI(a)@?I;y>CH|=)1?Ma^Y@JZS<&`=npa;Lb7xJ-$8T3+0>?H#ap)d{!fex?*t)^G^
zZhAM@nj+5@31C0Vz1h^wf45tBC)Z}OdxpHj7tK9y*y)Z0RP6vZhWk9(0a^9+QT{|`
z+<;aVR2&XUc!%<xu4v0cV63OYVkYI&ATlQ?@#z}%dAXTp`#`%Qs>KNfwnz0+pl~Wt
z%(kznji_wb`$ol^Y|ff<S?U~|x&@Hr;)Z1NhN5{c3I;m(j+T_8Hf8fb{1VjxqZz^Z
zZ2BNwP?b#^Ab=FPNl&T-B0tw*HR@WoWZM+#uLc7??&rqYbo*!P7|5GCwh<YSkvu+V
zGIYb&h4vU)$TuMAkIN$f81X_X+YwLkF|h3zeKe2%cfQfK*ZhhDMoi<zGn5)WfEm^C
zA3~J6s?}oi^jkZwuf->nUS8F=pwwUHQY+~Qevy4$Y4}T=lDN;rtw9#!;nCByaqIKZ
z+9UcsI4#FI(1L}=)rxjYZt^xIO9u_Ksx3Ra6Ce<QCoz+~nVGd2mxGf{x(S6Uv;lnd
zxCGd}ynVo+d61So$gUOyYY2(a9=Yj|E9W{b6hF-l^Cuh;5E3(gGRWM552cyO0Wq;7
ziJ(Q<S?>JM>Xj*i@hl=E8IG((0&y4JtT9%j*EGA)tn3X$S##z>;O;@{UY{9ZGobkN
z3~42xxq-q%sf!q+34G=ZzB&kcCjXGih^h*QU?a}u2e2SStN^*5e|)zfOkSFd#66q&
z_P6MT^_MOY7Q{8zDD1JFLZbx-N;E6Y)Sr|<p0_>AY~=KbJr1qxcRmpk^8>N-+UM<>
z_T|JA=|FokPbaQH*wrOix0yA)=haXT1wyn9u}tpWH`cBt)Jvp@@+Zb(RvmAoqt=Sr
zW{QWruM|KjkxoTQKZ<H?R%Cxr_B9maiBkz@KJvi($RI^0#Rg)ZgG%!N63re*eDjLe
zRDA7*W-ML$4%3%Il@{_6zwejusVcUT^UljxOg}1kZQ>o3RNCL)CF?rLB3=$&n#02-
zpp2{`dqS>&;bf=2t|6?j`u`Ajmr+qg5C7;Vh@qz#8io+*E{S1=K|(@6R6>waLK;O-
zgc-UUL`51w1SC{KL`q8O?pCCc5D=LE@Oz$T-B|a3*L`>2oR?>vwf0*3oW1w=d_Qg8
zbP?xfab3oozi8I&7NWQ-na<#Wjd1P<LB>C6oDwNt^~!NCKMHXn+`(f&t4tJ;6xL0?
z3O9b<XXMH1_dc!(q9rGJzsG$X6v{xm$?aSVxJvvjA7LU#Y`8&PX$O&7M--I7bRXQ(
z*Mnve?)Iqtwh&D*i&-rYy{dBbJYE8NTNG+8x_Vb{>-SA+LjTv&DfmDZ-0{^XFp%b?
z-;mmvAq<Z(udsxhhz7`ue)mj!Wc1Mzzy5KH+kRfpPA8n&t69v5ek(fOtu08|KVsSa
z*F<E^7&i_Bn_*w5Pl{2ZXr{8ZnWd;?lx|9zVl>W<G1|f~y(SGZwPLmsVwrMY$%uZv
z@%!9N4WTkPza<O&BfL<53i^Cd-l<=`EpE!tJ8n;%7yDxsXY-4RoC+v?y|dX&VPC=6
z4Nh)}ghKC%$_hQVPNakf$2E|H6oI?x)!;Ad2%1J1#k3afFB+liP-}E*vy0^3Q<ZC@
zU#oW*u6y_Ihe-t8{R*o5D~)#0ulNcYK#Ku%gA?XWU&AS;lX9NXnfGU%SQEqrge7#r
ziNVRz6(J^V-f{$$M@^t#MF%Gfid{6xO({^8JGU4#D7@3nh<NZL&)snOl)QTp?=+ef
z6Ax~Cd0<qbeqW*5KQnr>yFOb&`+}e&*{D$Gj7VKw6H-4D#WB<rl%d4%Zv*EM-IW2i
z^*KVH(GSds5Bx?iblmFW?dfCLnS&?mcNxPkEpLmB&_Eyg9`l>^|DP2tx&!7Iv&wnp
zD?;M|L+RgmM9^3{a{==~vZ6(E`HjO{Ba7GR()a$K6)ir@U5s>(%%mK7fd<*VT4?cq
zQM72M{CBU&Z%kA=j+FoJ6fJ`>U7F0tp0;gK|E*|6A$dPrU77gvUy2qd!o~4@HZDPs
ztZ4nN74kg_32l)l{|jNAk0#x5JXCeAw!QXZ(*s3Y=Uf9Kov|l><$8a+CXnl?@8(pU
zRR?o<+R?^Rmz8Ap=BfPtSnb_>!Mn4k$M4Jgj$f3~Ou7pG>iiLYYg+z=kN*AaSMl6=
z4-D?_Epcv|TE74C*E+_dacqsFPdx&FOvJ7*2K1;ME$8=PAS(N0MeCl)HYZ$9?n2R$
zt5mOL<Y1&^wojG5ikk5rP-b-;Hg0Ff@9%1(gE+mk`EFB4ly`fId3V8|I*4|ahC3wd
zTn_p0=bD)Alx>7?OsTi{K;Dna?_6J1MfFPy1X4Qqs~^giC?`MhG0Y#GPNHck=6@h6
zyjbm{rFyVj(x(pWNiig85;Z6(C9QS$2ePEtD*9RH3La`HN~Xa~3?D~3el)~?)HN_z
zNx_$MR40SKnp_uH8b&eQOdGkS7jV<`&b|6DhT!OCO~atZW{1~zVxC2s8uX~rb<1^>
zrhQcqPSNjj)HNM7b7hfnFngwoD@P0O*z#F=Gie+SK4{k1EAbhK`&9O*%;ovu!|&oO
z%<SW<9of$zE{^m;kriXJ{-n~ecWZ5>qmz#(uGLP2<#PEghBw;cd4f-PA6$=)dtI1n
ze*dj}v)D+;PxIvWa%?LhD(xtUB%wdzHeL?*ZN)W(f63um*Eo*Hxd3<bR_XmDt!yse
zMkISS5v6>qJXXuXnRM;N`4y+kY6YF_r4Q}C-1?thJ?sHky^4^yU!5%RTVq1@Y59jr
zi&vxaGg=F-@ApQhB%P%e+!UI?EdNooR6S4qvZ^*(IUfIyqIH+!vtGOCSbz^%(F)M0
zQfE2a;aW~y`u%00o%K?~jUv&F0ei(e>LpPE`Ke#;jXirj%kKz62x>}rqhzFb^Bym!
z+@Ae77jie*Z|V8-XVm(466n&FKj54rENNRDC)G-7&PAQi5AjEl@5G-*e76^y>f2v>
z9u#PKGv88+YN047=v@AF!Y0?s`yjoc&?(>k`rS%O$fODlsE}7GI8>5oy%4uYRV?hZ
zO07V!%OWjGWHizT_8ay~<xo36<bkzIh6-=MX=>~>kY9cVin-<nV&$9532yY>HuIn_
zMNwS0T6w;)wz3MeLflyS=mw9pxYp2&!Nc|_tXYThNhP(8UklyLRBL(30;SzTzmV+`
zoI&_zlMf)z_tIc!fG+_fi+RUU7P*uv6Uk%Hl%!eB3T4Xxv?`mp#1rofa`h!?BX^B4
zK>`9VWFkSkQPM)&evz2SdCI%c+^6R|x#}mxA}gr{<~=9kWz~V;Y9KFFVq%Nv+5#O~
zECii})}Sjuhk0y}1pu>Dj8S5kxbDLJWX@<;h4D`LOOel9O&R0>Q9sn3^O5~xCc(v|
z_7C?>s!a!nf5w+~$+~XMznDoK@bD!l+x=PQyy@2|?u3O3yH=%qb82pE-=P(Ux6#dl
zG!6oqv4Wk+XeO~v?mun8emOQ==4eVmz8AgOp=HmO_uo*3I1YH3d`L9ucZ$ua#HdTT
z=W*SG%PCzmK|V8e<-7WJ6HQ~B)sRnXs1$*xZ+=JUN+G`7iB#8ghGZP&GZN+nz;y8b
zV5nU1Vhm2jY@SKd36Ee36TU7p*q*+ngYcm5=cqmzF|qYQ0S9@^de%CRW0@)MsjWwW
zDBhLKYVu_J;hDo15-kBho^S#KPWg8X*L=SG`$R39U9a9eZi=@Q=Gyd!g-j%xll-^W
z<JL@<)>4)o_DfY;T`cLkZdK4;ug+2%pj8vK7%W*;Q*0<TX!DH!tU$rjVGrhLqYgy@
zno~}8gOM36RLBYdL!i6}E~7s<OXGk_x|R~1!JdG^-YnsF-ZZ35x7dI?Cr+%C$A6l#
z+PPL*FYh10Dq@!&+SbZ*wA#T)5zVx(LD9J6*8QmU>70)z;_JVW?ZC<@nG=mRRCXlI
zVM9eo4poNu;em(tgWVA8)y@I|T71}b<2-9qCHhez=F7?bg?gs7OjgR@BJ2J|YGe7S
zGo3tLfTi={s|)NhzatbD>6WUcYQIgIhEoCnL<kEF7zJs9UTdSF(<cD{AJHis`mTIj
z6j+WM?7@^MG*RLV4eC1qraW3+c5%Z}{OSh+P|$F$?1OJgw`f!*Hdwie>XH_Vo4{sw
zj1g*0or22WlDh<cA`R>fl$-vfez^0_12Equ1KO`{%WQT`J%)Louf3deh29rf9E^*S
zEnJ6$04qROGa(`9;DC52U2y!R!M&)HjTN|BYuAnT3XbU}TCc?70RfZtOA<g@`neZl
z&(TRr+%PIDY+e7a)kozKWqJ6q7KRU)4!IL3mGN^O7RQ_r8U2TmQnd>$0@wEQ>_4pg
zK<uY~*<201p0uG?i|hY}@vS<ZrlyUw`HYrodaG7utmiSwLrRG(YeEeD4yu+KFi;{l
z0Rsp$oB+Taw4;>+N}yK_8F?x(@XkP!T9%a2`ilSpumgaAS{#%Q+XT`?2lHeu(L-1X
zplc5y00;*KN{Lz;MP^wjYz77R9!9wU0dgri6wCx)ia>JGfRoTwYKHB6gyj>_d<LLo
zeL@Yu5~=l1In~Mc6xs2{6+5kn2l@X90ubRh0aU+=3A7>r0#MVY8$(^+uiF*{rq2PA
z2QaWqn!t3KbDlxA7GL7I)J~#Yh$hWn0#vxeM{EF180r+gz(^lW4Y1E;<9Ej!j_}_g
zfV_?(fVGzf(3UyTJ>Lf9h7x({d4CJkko=?2{XqDE#=ye}f_$4TkT$h=^%4jN_CAYE
z#ZN64tx_&V@hk`c=HVr`i3(Y^D<06+0|9n_)+~wOX}W)!AHP1^8aO?y?K|7z$a&Tq
z<q@zf%K_xb_>+JA2_u=%>dr4FeE#6$7t*Ps<j96~>c%*VUJzOcGNC1OL1@MK$PZr-
zS_FY&spl%xWI_vxQ-l+PXIqs4ky2bu*wu9c?Vj?A<tLxjYFVWSK_vpUYEltL4Q~i$
zf=p=j6B&PeVr(E2S^%yJMQ@JA_@{NBs+*)mVMqM1I{rpsGNGju$`XqM%wqxbs)$n}
z(5A^<q)G7x<xL$dsVzfQb~?K>UjZIP7NXSP#Bc<JJnm{{qO#B<JoHEkT8u?X<7Q=H
zZbmJdp}{_Y3qlJ^CbZDX?Egb(P3R@z`IF{Ulof?w&z~wg`m}xEr|KaSS~(xRWs|7?
z0nMh>9=^LEw2t||c>8GToZ@v&iO2xCBO>|Qs-=Nfj-rM{M=KT!E6~#`3TPewmbH_;
zAhZx<LJNICXw{0U#q+}w_+ey1%R@Fv5C9N#zyMWYNL3h@6hVL$z(^*va)OcOjr=z*
z2rbs%ZTSyCPXyF#BfofMwkL<ky9w3J#9+99#76>2yk-D+bDgDY3kj2>{ZtOd+S%?y
zP<v)6Uk?U4X$sm0r1;qcbJemIHBl=*&}#B)Ptwl@qQAg@V<GEd92+6L0#sx|OH1qv
zdw-aBDGuOAVU_VegjVtYL1^JSKk+I7a_PSz+O7rCV~X?1gciWCKOB>zdqHUJD3S@S
z`St%HwEAl+3cyxE|3hdgg;Lwp>*;_VbEw0k0O#v^Y<1nG6s=IYhG^A@TlC*6#lHLa
zQH=Rq5Lzv--uOTpV`ICNMY<G|z}ivKwiy)9AGT9c7_fKOe~{IVA`@DjA2-N^mJ*Sg
zUIpOSi3w3IQ>7%$#1aa?VGu$+(9htWkxYtcQnF<)d{<fUl<Ga1&_V-6LX|7|VXrf_
ze*cHia(x;eK_;}Mqz#Mf-^WN98W~pSf5Ni@ia*!0>KYceVjmb)fjmP*KLGAf5I&?B
z7Qee7w5rI2){c5-CSlROr{6)<JC`q*OlS#3`u9^jT#VAR2_FvV8gb}Hk_j!R;9PyR
zIMEA2>xx6NwU9Bwm@0@LW=oJ4tPFn`3xnGzbNPoO$%Iz%K(9bJf=p-uOptHGU~x&T
z@=4a?IJVpY1TU4~vkO9t=b)bn-XpeKXtNt8E&`E+J|FoVB?1{@SfR`KFnH@YoKyoQ
zxTe5{T;5vLhO$?D4Qj;$ng9p*8?cr^u?e6+4#ad^AP5TzN(`adjC#-?B9qp@I5Na!
zM~R9{+ID%%D+PeD)(5SJU-2{6{$fJSm4T&X2{P)+I-;;NGySSGWVn)jZZV?la`W~V
zH0D`~M`y6K88tqV+LS<{bwnebBVZ~&q!l-UeJN!Z$8WDT3VeA}Q<@@I=)KJ*-OZb$
z!mv;(KLS-E7H&+WZW<la=dD=3Wq1h=hw8!dn)sPJ9=HKsZX{ze2q2p_4+4l@>9g|&
zC2KK&t{7;y3Km)I_VEOZj1O3t5*QPWUGBl}$Gro_+_E(oKl1{Eu>{ilYAglW@2hQA
zp%6bdC(p`&(qS0oybf7y12gARDG|I1gTXmw^kxVsE8!)F^rfl#nSg82ZUDxe>#6)-
ztc3_bfEmKJu6XELq*Zd58pAX6P`a7L>qO~@nHXoaNk0EjpbiEhtP-adp}U!#S~iHl
z0g}a&to3qJxo&SZ+>jvx*Es9-GR$<ogu)O+6=o{kTKUxVFET2CTzQz+5fLOsP%X4j
zAR^tyfv6qSi^LF$>Zm}cuHtVoZ#RdXof;|q0IdDt)$gkHjQSxrsF(=^>I{I}M~l*X
zjj`e|vmQxiCjzAtL7Fav#uE%TBhYjz*p3q@%>dyc10=?AE82>W6PI9Q5k&Hz#qA9O
zHGx0_9k7N@Sx3%(eNCXrA$Z*&(m+26W)NWH`g9`zJ=z566++{LgL;NgCN?=2&rq%s
zatnfK`~Zn@6&4j$)KV6&119402{Um3AD?gF#CrIEF1=jR$6?@^Mjg<mvSexMWX1|I
z{>6ti7=YGn8A&Qoi&Hk5&hWIzv<b&W-uaSoNBf{M{lSEDq(L#6&>{e{W0a%#HHXw-
zW#UN=S1$;yCNiP5(_5T>L1>k5OaLn`2(5|JD|CL!$7DilUUm6QC5q1GQvu)w13{Eb
zXaOdH05#6i@l&|vJ;DW{CGg3H^jOX?N)(WG^@@l)fbnT9DCbIASy+=LAm?E5R6Ge;
zUY9*Iiu`T6E-=*;Lr}ONv<UDW#O3?nZxF7h{fE#}4b*{~1De0s(4U(sPRs|-zm&KH
zF)c3JA`@Ek7lhX367fTCzAMJ}yln0T`-M%47$j#<*z`v!`N#Y$k${ih;Cch@Tn<IX
zs~rtr5LzGqi_l73cvrYEoOVHIX(6dm>kH$r!V@;ZaHA<bApre;<)>jvoQ>UeIe-wO
zIlNAZ^(b7{<~#5Be+VtlIp9Y-$<c7YVZ+QuSRjV__?xLvtIGSS??Au*5L!kuT&v*3
zs~V)VFQ4nyv79sZa9|kV{7$HRlEAVd92P2ki>SM78+(;t6iNVS0qQBu<52U?O$|Or
z_m78{S-a-jY_yVh9D-TF`q70Nmx9f0Le!uotZ0`DLJI&gNes3=2$NoAFTC$kbV!W_
zfJ}?QnS3<TLQ1d9Qnj38TI@iMUrO(44KX$?QXT;x^y@V;H)ziSq|2Kf1(Vo%C!H}7
zikGZk+$6B~*K)h-@#F_LKbUCxu2pHE{g6y(8U6CT@93xnfJgoMgtSDyB}hmlaietg
z?}sr`D8J;_=ibMDQtJoSepchqrrD{SRkKt^O#u@-eVSHJU2L|}l9E<T?V8$2+N%Fe
zXr-m!O&nRUhI}S()g!wwdY^u?E;<YWsP;r?vJNldv6RA66cYqKeW5kwok%jFRhWM1
zIz$AY=z>IVEAL#&-3=}K6zOvm%=S6zIx&XJiTW=0tzQ_Ns=^h*e+aF&WI{{I9`0}H
zgt3CZwRNM=MUV-t#0x@;d&>#}Az+T`rpSbr4yKZMu9Bn0*LTAw((d(im1Oxw<;RvE
zjEw*-hX-PH4NE%^DGP+Zva-#T-Z%khR292%L1?*TwYM><LUMK=6}a8!C+2Vfl1yP-
z>Azpm%`1=ztw^^tjCPA2nb4wQ&A9?pPr5?6e1?IMG8yS_dV)I3AX)Cz$Q=q(Y?z%;
z_~SnjYCG<Xx7N&C-tGxP)c#Wc9StwCi~AeyaoiYX^*imZG{kZ?+P{_v`4(zRn{Ers
zuRiQ|+*#Bsu9wo;0`U9~p;cT@@%(35*iA3!Pj>px0>wL8au<ZwXT64Q2UpnTB*#t+
zjjA?Wad&)6^~hC^>&-{_H&;o)q>pVX{Yw{wR`OO@JmW6s7>1j4|E$mw22qh)w@pjC
zi$Fv;7q}TlO1Z7>gVEzYJJOchKaw#K*|OK*15{cNn>4}jrlrtSH3~rlwc_|{G6R4^
za!-)BH9!!TpL_oL=RB7uG5|_VnlOv7#1d~T{60{I{}qhHd_7XTz2+fA6^D&F%JO(Q
zp8jYx-GdjR(_dD;Ln+)J;p<2FEHPM$_PJMcuAXDRHH1L5O2%FQNmQP|g!Pi4g<?^g
zcRimY#6D9-0>VEpoYE2~p|UT1Lb$B~w2+2(K8K(RNByi#kPrY;0oY-tNW6OGPv|0$
z0HE=sxCd#V76KG6)%h67KmbH=fA{AHgsC2<Sn>IKY63Mm`$Fa#FT*&;ytvgvo8AHF
z0TUKBQ()GH;&n<zfcZTwfW~lF1Gv#Ilgw<Hblv()jtt361GxN7!4*`lmw+5Q1eKf4
z4>G7c^vp#%Rbb-)k~vRZJiX1MxouhMSX<W62iTm*VlXNPXm@3rs}|@1l;GRp$nExt
zjbLufBL*J%Tvtj{Gh0(5h^DX}zieW8w(z|Di+}kM)iPhY+UnaN8dkkAk5_@=ktq{k
zBVy|-!0r^`1_S^FKnx*_oCFy(;iFFi6;#!8D>o8EO%>_qG>}(Ii(vCrDgreTL6AVR
zhaolqJTudbP=+7&(tj~nfVBm1FnBtX4(~~9ret~`kM$=EwPqkB%~OpC(cc`I>FI@_
z#F48p>g3e`aNZ;WP^2V|eT(hC;)Z~@8%gDi)d_IG=>5kd7J#`C>_%J!fZJ#c0$|pE
zNb3Iu0DzII$}F;kMVf9wdYz++;+#yaKC{w7G&Z>@Pdi1z?L=;Exa4+qU?eE)>v)yp
zP`TSbg{|rO$9r3wDxbJrzCP}I73bmS9?*RjM+|K^tdkte`g`84HRmcgT;ub+?0U39
z&{@L~|J<4C$^P1yPteSX+Ue1sUp1q*V$v1{CwIO^v}^7w)@RyHXya888A>0U($XY8
zE<ZMuq<g7gAf7J|$(AWK8?_K;wl<BCA#Ps&;oMiTXzTn%3_t*hm=-f!j>zPTzuI<3
zh8k96;KLX9YrnD?2yn&nBwc0qFK~WeStF35-?(=*MbD)=1gV4en)V+s=n#Nf14y|{
z9OpkYLM|K2bcG9=&)e&$hC2mEzwqk5QuJbr*Z*>s|C;b!#j>13W5iQh<>IVv01Y;$
z@L+<Sf<8%8s33{`t-$Lv3z4bIC3hxg6n9ID3SXQk)i^&nYr7A5`?jRs#nt!PiAZVX
z+HG1FTmAls(z>;mBXS9=b}tn^RQb{fsck(eEl;hg7l4`#9$)pUIj|RbJRtFkqj=2a
zGg;A6_$^Yk5UnR5XA=8VqW(?VD~Zp)MAkQbT|YEw`T5AmLfpdvxR8&XJ=ORx=cRjb
zt{FDLGgTJ8Ly`@pGSgCRu$pL%&&-wq((P;y8oaW$uWd|;+1@IlmaXd<YHj^`Kw6LD
zHPZmmw9o`eM~dr5BPwbNA{(X{YXVMvT1|4K=sK>huVoMD(nWt5H0V>Lqcs7XS#o)v
z>@f(gXIx=Qt&R$z;dq2pWP*;CgMGOy`hvqb7otQM(DtQEbm*rxR}y&lUCyd5yEY6m
z36R66`cu!XQz8*hq-bc+K2?Znk7s|={|u)UiBQwNRQht972|z=B|9(}Q|}y@Lx@^w
z;N>;&Gnvn~N-c2`nNrs5^!m;~k;3Jss#D?hopIzSm_j5RZQS=2>j%=5Up(^0s}zB7
zh3knM^I?}2OYxVWYB~!v%ie3UKhTEb)l)K$9Ec@?-`WJ@eTrkH+r`d5kgBOU)}1!{
zWL*J^zq#F;!(IGrgX#x5KDgv3D2@kPeD<g02>8Wh?BDDNk_|<!5fVIxa~T&C88C9v
zR98&#99cVIELv&x%vIDb4rng=6+|iPAk?g-gqPuklpN}3I0LpxQ>A^Li7(?f-F60p
zK)VrB&<6JLy%>X+(fCl8&IKF%9WB)-qfDlL*LYMStzA`tkmtI&O4y7+nQ<E_QTJ;+
zz4dVz3o=zT?192Y8gQ}h#-hkn)s}rLWAQI0w+}X`#C}HFDyWXInYiMoVvxXVbeFCn
z+~PBk0%~L&Ar;q5*9d5lIZX;vcCtqu6?a_53v&zV*s|#Rg-Mbuu%YJD*fiCKdmpXy
zuW<gUl3QQ9Bo#!X-;ZOUOl`gA+I}NTNE+`|%?3W&8PE*ckWg?Xyuc993|cR*(N;TA
zci$gMknGlql?a)Dek96V5o<-bhO(pu@V?6WCe6Kw#Vy#iDow1?F=t_k7^8}KvBVae
z>E;Ml%&wMF9+v%l)e_4<q!rGgO)QRNLztS!qB30QE0%BjuSNVw;-hv^A+$@~C>czv
z8g^D0=hgLCdZQ)b488O!j(53&QK15@I<ikaK586+(#iMO>!*T_?hZL5%PQ2cf-x0)
zG8<6b>phzymDUdN02@1M%_c^X)XSPghMNwF;~}o&O(Y%D91xF~P=bOSv3@htKDTzD
z-SP}bb75d**}VIAx=Sn2pJUAyW{0xdyLMM6?#lZ}VTY$7bzB=&h4KzB?`cO&{BSSL
zh`ag*e9z~{!FWFH#{nvs9e@ViS<S6dOXS?)WfW*5zW`oEAl>^x86!(kRcx0TSc$Lw
zrGOB{{&v$LbA?hDjdznTBSuef;J*h;R6>wKrTBaX!U>o;>RYd9qg-cT!w8+%>vx$u
z#9$93n9_E#+5X--Q$#fU=DAX-dO#&O01Kk5a4ps57qv;TWu$c2X%)-Kou`zoZDtJo
zzbRU_HclEBidH0^Twg$n$!HZID_S>7?O+dr>E9oVNw8VI%IbQ{oLv#e;Wfml7;R7e
z?^T4=BSZrF`X&c9W7bjHOS^f?=E>ouDMq{bx61wVRQgTYbn_)N2Bt1dLI4oDMXqox
zorcChu!VYiD!A<sA7Q=oCiVsYAaJNo;adPh*8i)b6(1;9z%Tw=_l8BkkJkN6M_G%5
z$c4yOX$nLG*8JD#go1HTZy}EY6ZKliaC+5)uO~Q%>kIaopTy+LAIK({+i1`dPvt8@
z{!7tnS5RQEMugb&|C5)qQTUKgZZcr`OgY@B@F^<pm!so9(pZ-kkgi^Q%Zq1fav7so
zU1PB25y3IDrQpka$+tz?$)5gCCbgi}ssep-a;4BiMrt)y4#c^N!g|wP`C1<aN4_HN
zNwjyl*HY{2s|}yWrf^&$<z9DCLrmKPws=Lx_wVuuReyF%JL|4`r*u%S2q&bx4{HyX
zUJZd{2?X~Q%u_lyX!unX+><t<=^k(MPXD-{$Ll@-y1gw3YxVO_Eva-?{=2kb^!22#
zVD}}dlxlgOc}LkstTOHCshUKD>v)lt?@=b#x}IGD<XuvjWj|WMr1qPd{ZG2YC%A&6
znWtVSTXe`o5VHzo!-op!RU_ND8?XIl)VS%<u-}*76B1UnUuySd)#Eey)v%2f@gjeu
zr?otqbh<PE<~H!t;8;hn_13(53{XF8EQzhwzFP_Yl*iZ8H-J|%kvv^M@Hml@Rj(P`
zI96W5XQjuSE(?=hzSsVA{5B-;7vB1Gue9;N$0MEBmlce+DLVdedt=l2Ydk8z=<U?8
zX3r-{((zExjSh8Z=Z8X+YfQCVKmE`37UrDA?vl>#uIS(ag4urz?w+}6qcRfzE`VXR
z&)Iv%7(Za?e}J}*XI`$b5Js3pR5_rkt-extJ~=e)n;hCKYWK8EkhSJi*?i_S&p=|h
z<8C&+0u4iYJHt<#$4!$=WPvM^$b`xzw}f`zB#q+RY+e^~(Op__lHwhYvRc9BI_WIH
zW=)vItWmzXEcLIMv%n}uv(?@H$$Q^egSmee_Oi9i$2{ZJWeE0c;^iWDmg8*MX)_KM
z23OOvVqP15+guPoSh#x1yEb9F_Mv41&Bw1`_co5Z)0nsXcut2IF$S|KH|CQuU&Pzw
z@!#r|pZ|V2o==!>Xw~_ya5?q<7o^CWMgLMha6MoDe28;bp7<<Z1GcBoITH~-ynB^_
zanVAOZ%A^BN8((+h$~-4!d@huSJ!HUu_06TB#%>biRG4+bO7GzQHQb<c<5V~fGU@4
zJpYx^Tr`G%_;tSIAaA2|GdBVD<S6)Z6KUzqcuQOwKjx=B%q0(VPNjaB|0xF~(6po)
ziB~nE!<2?7AtStz%gW^CvhcDO=ZLbAp631At^x%(cl#%qtsDRWo$vykcmds?;n?5-
zWxp0~tcKqQ{I2PMYUh$Q8|c)j#d-#Wfy7@%QqPYsZ(|*Hhnukqy5i{t#@zSH8Td^G
z;{_z{Wo9nF#SXFBw5SRUh-RiK<pis^fcR^<5y(F7$W~=+Ft1Y_#-aH(yN20M4iOs-
zE+~CUL-Q4-OID*R;s*Ryi-lHNG^SaXIEn@Mb?~Sk8tT&^gFFyNK&$aLJn9Z|CZJzb
zD%f1%4W>WNM)@aq(@JvF-4Z#{_x5jK*k+;AoBX|rLgo0M$=FL6KOEq=MF#Rla_2dx
z!-|oi5vsP&o;KZKQqUa~{MGBGokEwCKIm;H-51k4s#492cc@(y9NW(Ltu%^!N+JYj
zG`wtDxQ{fX#qcT>L|(t(-e+LbKlcNHAcs++@auaXE+L!&j(!SVD$s>Dp|PD^xJ`r0
zfj^4^QQ4BiK=x30V<nIy2P9HS<ovKQJ>3G2qSj-Ci)dayNhB%&4E>zIB0u5?zKPr7
zT`2c!BW+qL(=QdA1RXA=o%w0_FmMX?4+nlKZWAiJ(NY}qhI-j^*>^rfu0arObT5^@
zCEcuh%?bQ;@^;`&Xd9Z;??W*>A_hK<92Q*-VR2oJH59H{T`{o`PK(d99Bt;F|B+m*
zA!>R})hUiCH(mki{Mg*6aJofQe+Ca*_1OTxjc%jN=<M$cXSsiOmRQO9`L+g~kZBYm
z)Y~O$qv7=Ww`)%D%fTp>0e<($!nkuPj!3XZJn_|u@Ee7whY~AqwDb!m+Y9fDh`Vdw
z0R~@23O@VRI+wckb`;G2<4w^~t4zj(__PLBA_(e`2)r7FQ4J9^GF6#x6}Qolw$WD6
z{HZz$ey<B|*)O>x-m1KxbomFryBO2qbg*Ov5Fv$=x?fTgxK21Q^B9NKZiTakmMG~0
z1*btG$TuvU5eAE-kou|z>NX%afJj)wk53eEmX5MQiAc|(8`eXt=$46LqF@D1dOyUX
zu|<^Pf%NI6bo5VaTa8cGfPAqy%gt~>Pun^RL-l|qpPco=50jo5VsAT(pP-#T%H?z`
z#MT=2cKp=hn?`z%XFfV1BkMpzzGm5daBsYU;j@rYvAz$pSk>t!2|ptFa9%J#<Vh)5
zZh=D}r=NI@C^(Gg(g6w^tx-Jt1=rm)v;zrDYoHt$_;*%+xJ)zl6M$LNbtN5nz8$F*
z*cbEd)7`lCB-->mYL02FwXybed%LU|9qi$QRHS?BzFSQ}!uxMjA~sCEt6)KgW-kp;
zORv_6AF0UtweXjFYpUZ*YK+w0x<t5|DXO96Gb3CeV+$SyYq5c@v$cHv5z<nBqaaW0
zv8Jm~(x#Y0GxvvkuF)Zve=t461z#3}ZG&!3R1M*6HA)5Fc9y%<Ot(x`%|FQ@beQza
z%!VKKhHqJ4%YM_LN+I!RKL(llbHV!BiNcQ~@9(oXkg%q`8S^yn%~pwkL^;l6*S76b
z#(|?v;KtE!sYoIscFSEz0`sBOxDq7~Yu@T&2lJ<?egXBoh`wcwM)<)n6*yzIk{biz
zvsv0->fRtXnq^{%f<nv6=swke5LzDUKN7|?lC3mTCHT4<`-|bdnWK#3;s=It2ZANb
zaMFz6m52-0Di+sXS-=}0@zeVS#^3!5HgRqv95bDwP}=H6maPhCgt6s>*<g%cB7wU@
zd50r?828tAjMY(^*43-*k&*M3DJoT$EvA)iOiTVKR`3U&=U*$&gOI)r0bccCW9BNk
zJCctxh1rLjJzu<6Qmv%Qbw6Kqy<gS*Sxb6Tig>v+qzFosRNX~Y(+gsu9!BLW?$Q?D
zs097&SGa#E`^gC5%a`92@Mg+<JJ3Rtyd*En@bQovHDvgo(jju<Yx#&QIl%zBQTJwh
zY5E=Me<8JSAl#DwO<*u$e8c_2`(a-=VuOhvKr9NVW(los3Vn(6+#Q7j2e(Misq=+C
z2E2c)zYPQiE8|;~Rnu7fh83|I>NW4JrEzv^V9ZzZiBTLQe%oCq-mSt53hsg8B_0$e
z+6*+M&m;}{d&|8^w{Yn=XROdxlofOyl$Z)<(92Rh#&fj+IOY@7JDbJ6e0Tx`3hMy*
zBjLg?;M|Yi>qpSj(lLmRBuL6dxB_s11AT+JhlWE`eZOz2s2*UiJu+1vHMRVh?;D}i
zkM#}oI38qV7{-Zh`t)rybM>@751UsGeW-N}N4M;<6f1`?4S9OChf(LP+qB2|2^czj
zUG)PXsOQmn_qwGXZfV$qc0itET;6(}>ZZEFExdv$*nso9i<}*&<p^n3#t%qqW+3-n
z>z*WDTV+_$W-ocXT4t^J@Xg-k_3OJxk9L}3&I+Q#XtQW%^RKGQi2f<#j}r29`n&N!
zwg=KIf5BWsj2zRu6fdMXJQq|e;!SV`3KhMotMB9@n}w$16e7V1m4?h^t?|qur?E0?
z<6eI?5-E%mUurzm4Emw@FGNPR+IM_Ez<ED#0sq2m4{g5W*byFhT^GBuqx<xIb#dRw
z2FM}^>RWPK$X~;C+xkbv<6!Vj(V@M!vC#@`Sk^D=kJN@|HGXi%rroBNp!%joUkX0V
zs8z^$#K@x^H1+z#+DBfKpEeSY63BFKXpz0~!TMfi{MZ|Hh+KdqsT$B%t3G@b$HD^-
z@J1hp5TdpH=4%C;dSfJy4`UBUG7f#A9!F9wWe53c2!%T_x^#Yj8lWgarxvcR1FT-F
zbxarOY+tWv-{{wK;|?klFq2^*+YM4Xzb;(h8IiRC$E-w-^=Qd&Gz-QN#hqvEs&O+b
zSK`w41*Ib{GjQqEcs*78@zh>HMAbR&U#o=E2Vl8}b4Pp3E9Iu;5$l8Su<9ChB!1?&
zm3y4QRW-Gf{+8{5TuI-PvYKuVwwB_6<Qp*Jldu7T&-dGF8<F3&P@XR^6-~-JVp;!M
zZuhmvP}iL#`|b$bnz?l4#Pie020*-d<^E%Z*uEPh0rk_zq}H0Hqn#cQm2X<F$YqAm
zE^axtxNpj|{Q#Qo&n~w9KYX>NOSfF-U;EHr*%8v_Qf*~Sjgl)pmRFHYyuKf5f4O1_
z8UEl1@8uT~q~u*YpxV&N(EwEJ&_a1!e#}DuWtyPAkL-9F%tE15u05<d!BXm>Ttu2n
zxy^O=Ys)R|rKe1=n*4elpU+P!pFjPkWxUePATaIKq-?P*i{Vl!@4M|<%Jlw53YPo@
z^{stqeIxAh4Lbc*Q;RQnygpZ3dcR-y$A7Je_iwN(mLp!nQygcmrt@CKPd<PBtlkC|
zfWAm=?Nx8?owr1+accKHz|Y0N8<?_hi4RMwIXq_Ybe|^u5Or#mIMV2pXf4uyuG-i#
zy^)!B*s5Bwo**6)HXHmF@?e{-u;o=mY1m0I;#qn}d!1#E=JzMArzhld{R+tman^rj
zMQT=$@a~=tFCT#YD*%=MT6dPxFuQ4Yfup1AszraFo;4Uwh0}=a{}XL$?|<*{<J0r6
zQ;oGx*i60yxx-G}Y&7Vn0TwH#b_m@2T(y6%*q}LV+?4<ZK$~)qs}ZzW;9Iu3zO?&>
zt`meZF7RA6*9qsqjX~0=b?F|#9LS26Zn_*>)g%Kl%U5SlQPPepXwEl>Fw8fr$|ruS
z(G^x@*5*j_{M$ILjR*F8(bx3*VnX;=vB}dJ4PrEDIg1PHJAG~Zec0_Fi@Ip>C&N4#
zK^3P8FWQ?TBPl+=M?XGg@t93f$<V3e{ktqC=~UI3B*SFFWnk`pu)eCBB6nAF9GlEn
zHX|zh4SsFU<hTlh50|TaQN;4dW#pZC4XTUk#$<^#7UX{^zCFG`!ujM~x)CBJw8rVH
zW@T@Qc93G=(o@Lq2Xt;{?KXp*NpTMvGUS}|dq5leYwTYsdm5K+T6oc{`wgCR2L>GP
z{T_4NJmo(hJv#cw0iMYYv{Nb*cn0CrRZl+AH4>mYlddQTWc(o67`QL2i+<LIv(0<1
z{6RG9Gpnq##$5u$xg}KNM?wqAYS{ht!P*~9T9T>n&WaYFyK_g(?a2YJEZ?2oLTb~|
z->_`|0_eL8zJ!3Q9B4F-GV-2v1N^&apGLG&qEXapT3qU%h_{uW)?8{M@3R%>gupF|
zb0hd(7U#vtOh)ppR4n(Z1O=8L@+*x1pu~+26Sff?(|bjXC?}}Ucb!YGQwOiDsF>0U
zBsRU5(Np`F%7AXj0lq^S`$tRMt#bN3bj#{$4??q`3&bPrd{ESZ=RGLOXl1>6k54i{
zw|H!54ZD)gC55|}kZb+yaDo|@Df%suGt{Wr<!%~Ofcj(Dg`&m9^4_C>A#wVlRV#JH
ziSnsb6P<2Jk=3KkLZpoIc=17wzo+IUZW7wat32DT!E<ZeCSv7a{%#>~5#?1faWES#
z-pINX`(KJy;Cua~agnX1<X`-ks-6-3v}om)Z9s@;s=}^JcLSW2Z0~%DoUjR{RtROl
zA9{8z=fz>ze;1@#zjXG-quzdhQ-~4P3b^y<YW6)Nf324X;hOi-AN}OD;Lypg`_^5F
z5ShyMb@%`F+@mP#)mHsxBgb~bx@89fFXewpWuQPxbN1d^qK0CS(QXUEKYx_tPvU%B
z=AUlyubg{7ew9;E218kXdEPBZ>|$X@^IlaH@u1rA>ahyqIvoFxqP1J1rHE|n(qLyV
z9uySG=o)6Ak<4IrSD5-AMT`67;as#xOpalQE`Le-fLnyUv99Ft>NlS3(?31x*{8n?
zOSEVWP6sG>1ys$c2Z&Yc+U27IbJ?Wx3q_0T#+>OB7BG9Q14=v+DEKfR^~s?~#D#XA
zLf8yPXAKQGe395tpN3-!gog4W7a+Q38i*`tn6T*rt@*eHOCvN~I(32G*$mGy3yruk
zyuj!`j^{atM&gi*&?wfof%@(eC-XM27vq|jF_kwb6D_T?02Gj9&1f{6K|4w=`N<Fa
zC?n(&YZq&iw3w@UjBFPhP9{M(o{rf&BU32@8#0~>OYk4I-ydzJ;D4>f;rT9vH<C~8
zuiqj^lz9RPW7Hh3ww&N_ZWhjaHqfDdXfKzktD{0l=hlw~LkXUV&jkPE@?VpP-v-g3
zr)#utH^S3jwsx>OHHDH)?@@2642YBS0{V~$8Z4CE&B-*@JiuN_V5v~@h17S8*+CWu
zK%#m^MZ|4rGs{sV5aIN&1H}yXtd^qSKLOUS-O=HBUkpZ!SD^KCfXsjF?uq?2zy5TT
zfycy;5+ji+=7kP_DgBhnBoP34ruu`YtYWF0n_Bi6y`1>T@-H8FFh{^X81YY|S$v;J
z^P;vB;TA>YbSESP&w^;oq&2VoCI8A^(M%^~HLkjSp=j;fn_!p3jS3S2D+nSfyVUSf
z((tRmX*+rqvl~Z&?4|`r_#z7mBWc6s1ar9*y#EtpZSL@d^o^z~#jLHWPBw)~$&Z*~
zWZN{IqHokRGM6vfh5XALQbvcyiQ>7gd3?xa3NRCV!Be-c{6`sDZz3n&xUPM#e2K|q
zHA*A#Z9D7!05jik8ckmg(Fffe{%9P=T-@(qxnyB6l!ek$TGKmH@&=>*f+?SHWvSm1
zq2x<lL$T~eU%o>(6<Unq{ZI&m3ASL-Xj`thxTRb2(i7dIV2D?Ufts&T?BK_gS4WZ5
zGG{=DPAvT60`s=t4Mc*N?=Jrtl%r;Ui4z=^&%OOpI{^G)7X0Elma0TsV}Br?<S`$C
zU6oI}{DD^+U4SswcZyI)dw~TYWju2>Aei+ls22K~*7C?s_>~P+;P-Y5F4S(M?j5`T
zR1)9XjW(aQWBJP3E}gy`>wL$aV~(}s%II#q|Fk_1iM11l`jZ%S$AO=RtxNaTpX3+Q
z4wu#0x{cHSq`tj#PxLO^ck|Id>2=fhB!k#~*rN6_$j!mB*=#+|xAtC6Oy5`h%GT?Z
zzL)v?j-$#PTc7{vUe@unqdJMLpNQJep|Ntp^RN#@-P+G%n{m=sXCF*T-!Blha@M=c
zKJ;RA|IL*d=j%c2!?~z~VqGhj8`+aVvyg9so<s)IuTOgRb2_vYfZ;;Zq?1u!vv1lC
z3=i%;J!W-|Y(d>3#wlnv)B5JLiI96CEfFm|spA^R4Q$NayZ^d(Djp#x2@JM-M3(c!
zh<9hUvGxc)_9-fGUFD3skSJ*ET?HO_lnBL`@zUCOhSny0ak=BsG6Q@p(~zGS?u4A?
zIL}Zl&xg_m+1S(F+iCywSKKq^@(WbWY$!kbRziqu!#vG`k|fCMLBuNx&iPJi9h1gC
zbva<pe>#z>@vyk31p)HQI>)`1TkNm*@-d1L+B)uyKHi-H@*01se<WexZz3pu3SW*;
zT?_FEGCNx|SBz54G>B0!Yi1pwIxa&5#tI4LAt<vy>bgGrQ<(Bvf)o&`G2Sd4X1TXG
zs?+ejg-mgba=x1RBmMLXF8Fb{NAvdE=BvmY@xN^`ZM(clDy^FY#^e2^(Z99Yvma;u
zlRHD8;{ZH693ETgVLLjTqbQ!E_S{G_m!8L*a$_A%i>Xy!a#LzoJAy`zl(xX)n`*d%
zvv<B~^X}}j1?cR!Q))x)CXGF>xS-~a>YfYyK_{tja>5{=p95ESngftqNeQ!0xzBis
z9U_9W;pRj3Q?-JsN~KVUEApwta;>})+<U|7A3v*tE%Q+y&lV9CyTGad<cK9+xLTk7
z<7$<b?NcNI7@$Dr#0ytTXK}ox48SA>wCVvU5>ceB1^#P06xxg9WLQgqmleau6Q7GP
z+vFcjfGg*M)%gI_6+8OSZOAtN4kIIck$Xd8<9-E|S2N_Q5%7%cYS|(*h|?u~JXP06
zlzDfnw)vOiK?}e+AtOp-Dc&O-E!ovFsh}R(;jiFDY5+N9u7k?{<7$n1AbkJhYAKLi
zEg-`X(}@1UcpjR4(uNM=x#-!$7~adXBLPJvOe!x3oG{ROxUE8n3oQ&>tnSR59tc+V
zy*wK}IoO!e0K%Z}ubC7rwgRzaFy+ZWA1;CNa6?_qgL=im;lbN^Hgj9RInOwnvu5PB
z1aI{2Xs8r#WIrUyXo1yzj%2+%N`|#I7{`?RY5DthvU+CAum8&<fWEoUxk%52OYnp;
zjKu?Km)<k$d2Gl@Zm%wk2JfD%@}3wPL-jVHY`uqh1UQ21Y7yapE&f6GC86s~S3#&h
zJv^vEMpgIm3gGr90uPxiVej9aC&GIfIkhTz7~SavyvIfUj7pGQEh4-{S^y)(D^>-(
zA_46rF8RU)@5#{mdR?mP;gFG_eb~!*gyr5LyIQ<U8)R3D$fOVC!+Y}`;|?rf9NmQ3
z45kT4Gvgb#3s);pMu=_j5?JQK)tc{FsPfu61kRCNt%53WT?I$0*CBV6pyMEqwIl-|
z>F{R{BPov;Sv|<}rU%y9j9f@Uu1M1=0J)dlS@6;f4LCSXisxz>%Ukk%L3Xv8VMk4j
zAoAnJb2s*mW4CzK6E@=GXg0k;9&w!3N%Z`E$kR%|9;3X!x4dkEgxR0XPD$Q^KYWVG
z`+hgjcz5P`g3_0TaUsvi7Iz+}3Mj7(?HdA<6Yl5z8}cmg8Q^@Isk<;7BmM9IPkJ@t
zWs1B9R2DeI^J9>8QR>3g%5)o>{zKbrd|2GWLl{zA+9Un&BEjt@gPWzqw}ok{dFXvc
zOFd`LuZ!@?%HSBdyn1LWaFW|e3*Ai<5Z+B}{Qfn&SwSXBy!2cXK=aE2^XHutl64AP
zZ4i%>)70Kqn37gh2hF{~Ue%S<ax~p=cjK||=fOy!YI2tI(7aAK5uY9&6Vt0-Y!4xl
zOCJ#1-DFqGc5~EgJaGT&Owv@Q+gv|_!`1jI7bE7&4*zPE7A|#PA0e>ZtngUw!qswj
zTj@_dRUMQfGH&O%%?kBTARpq?%5Yxdf|nj{$i=g4G_iY#<8|#gZVzm5n}G6(0%Ziv
z)?Q8f6eP<C5Bq_!I@#4C(t8bDRe_lxK(nP}SBrN+YlP>T`~un4vN+(5-(>OFJbz<C
zB0RjD&x@8GFp(Z%4R>3)7O$J11Htp@-Z&VYl`uWSjT;WJ^rh^Q7Rj(y^Hwn#)*`Mo
znqqjiMu%ZHZ;tTH_sFDda=(eAnL-{P*;>}f8ZPac)gUIVQ<#o&Zyh|mex>aCdudj{
z!TyD-MdW6BB%n3GvB%4{QqFJ!H02-R5gg&CNuQ-h*(SwN=i4x=jWAyt<tih<3rvI!
zuG?Q3y;0XQ+MUBAD1+?x;?eh@(;zPCjM^Rp?DlLYKjlC}9+}a3j2j+~9`f2E@|HJp
z5IYQ${VA-r9{l+PQpE^u6PlH#&t6f1HucZaAXen@?m@BJk*36$rvaA1hb{X+_;-@^
z`pqE?TjpMro1*Pnr>%@n59^{N(h2D1RV5%dK>Jccgp}g7`UGWhW_xIuy7wo2_7G(c
zOtjN&nRuA$!GfCmL~u9A_4<txh!=OVm1H<3LO0@}<AWYyJ+#Q?BZ}utoL;apG&1Co
z91i3o|6Kfdlq1u?{*v!5GS|bu&*%}-@>eB;hV2RZ@%So=g?$Xx>B;=b0M@y~9heGt
zHNa}`KCqNzg(kt54Yj*Qhr7`iu9h-RmWBwwaJ6vo?4eDQCGMBK0RxJdJfy&QjllF{
zp5ZYF_*US|n8e~^3FSu;N4TIHt$}|%1y+Gky)2S`yqEql9hZ&`fBGPz0z@tQBI4ti
z@`&7J^Q2IHwV|fbPc|n=vtd>xqa|@9iFPD7ik@Y|W*<UiQ1ctcDuqUfvz8x@+9iZN
zIBG*9@B5fV*nWbo!^hst2f3L=T8bfe$`->}qipH9Zz)B+8js3mjm|fVF3O0$8_HA8
zifQQ+_`oV~*bLJPj(KMms|&I6Dx0!cnr}!EfTW}2cC?$ZmvDA_-G3KSy<@kJg8M%*
zIPoGsHPIHk%MXqVjI#=$yb*r63~zFR;wqM~cC;2u3H(<G{T~mWJQ^GKrQIMfBoLWC
zHNkE%a&3t-JVa_t+3=6-vUWGoLV%PD&9J8VgUMQ64)>@FSBqCn&2UlS{og@?xx4~<
z_xx-;Fh%|f?}^{NOXe?LL?n|O%gt$k@!tvi{i#g%6E0w_TZiLtM*427PCnVy;+=4^
zrFHVA#q3J0D4k5Ary&#j6}Ed~W?TIW^MmuOKN#tSfctqb_80qM8kJ9;o9EaUy^!2Z
zsWX_(L*G6oyIQt-j|~nqa0jL0OD^%d(Jb_2NNdq3{le8ELU%S<r`e7bm?llhuGT`*
zS@T9lqRkXKcY!zEaXXTF@{N2^PLH8j-6jJb$9-RNp`jU=k1o7oagb4wceAqS*fuTh
zX8J3JRmO4z#D91Gc%wYN_$K@0k8<$9!^d+*+zQF?Sx;Aw$x>cwtJbQ7GMmw2l<-1R
zjIi%6W`edGz(QIs2iG(`4|Dq~q%h-a3@arZ4EjTa(@{Ugsmhw>GkZ!XEfGWgwDocC
z5G`fLfbt#*q@OKa_erVBlzTVp#0Ftnlj-m@9@Qv*p!ysX5@*-^LTI;)K`eoDxqR8-
z1&=aL#6Xev{`>Q5FK0^$<C<xcg8vq@6gG~COF{~<YOm@f9g{|CLcSXb<f+t0NeHA{
z*561JIH}>O_+0n@kD_Hc{p~JiyZxPZM>3%`-R{BJ;nB(EtIF#;-Er33;m_F_63`jc
z(CM$*Ig{HFr`nZpr|b29T&=7IvY*vm*3cbw+WGvnqcXFzFta;q`upcQ->Wmb$ZXa?
zW=C`8_oRj&-%fjm?sP6q_l(@>nh5yOdZ+iGq4yVO??^*W+B8=|0~?5|`+a6F<?CJs
zwZ83uZYH$>-m|{5fWE2BfjHHU1%3(zva4lFrJzP}pX_P@hc8^M+~Ma<JU?=V$*$J5
z8TwOOnrmcND|cAsY)FypXK@W*R~s>YJw)cT9)B5r#x;EN^$2cegk)<q>O3=w;~I;2
zHXOq>u4pxqYc>Ap+2qqNlX$>{<=F^MZPbx#_`%s|wc2pav!S?|$#-g#A777+eVO`d
zHPQNPsAFcLPi<^SZPwt~EKzOrFWJ>vm{|ET9Q9>3NNqxq>}nAwx}FWuoKG`Z&yX#x
zw^j?yXA65=Q-8S@7|zFm+%wdT^JlLY|2><)lefTg78JRMFL6&@KVOlx8p30#{$RPH
zu~fc|kYQegZ{ROk92dcwsvgVrhp<X^wIaEHeI~5FUid})4?^`UYc-5}H3rQ%45aqV
zfw1Ga%5xy?=d{B(WP9MoRo-6%f$JQ=%^0$)wXoTYVI<AYvh{LrHd}9W&2G$DZ_Wj-
zlR2$c?#=Jq+e3ky9gUlFn5|#dTx;B$+q1iW8zJ;_+lagCb+hXSjXVFiH%VEWBh8xw
zjk|m2yPM}b)Y*T;Nqf@jJ6?pnf!RG6Y12GtL+|eH)wwO7=3U;P4acCJ2Xh;g>W88{
zM>zGr+N8sk+5Kl<Ap&#zw@F7<clTnx{_5jit;DRCag*Z&t8v`FiDXxc_<N-JH!<tq
zWA0y3jlY60i_Yh23RYY{|34{Od2LZhQH%dlv>5QAJJkO>MeD(2LzL`)DO#=*`lyco
zR<zy@7V5uJezdk*^xuk>{JYVzJD*J$PUK3*D;f6u=qp=duS8vSD2_q2yukVJ)<fmi
zy{=|{Wc8mn8cQ#oZw`&qI*9&{qQ#*SNKZbrY)KX6k$)h_lmLApK;=bu+Z|W$OWo2F
zAQ1W@HgH5<#No=PjR}g+#Zj>ridMtZf9G7@GMfu+EH8Ts4b#__wQqH<mikB0JH`c<
z&hP5Y{HpO9SxMsMPq;Ejv2b58qP1;udtvN+anVlK_feQ<?P{_CSIzc)htthGif2m8
z3m`^~&C4P1+hQc+J0XnsDei>A4Rvh8P=-R&A?$<qZ*lrlz%=*?3;htkwG5aB)Jmzk
zg*j}vkju&I4Bo;lbYCOOnfJ%oRY+IA6TjoyJam>;DPu?nqU{OOAn5uIEZv=Ie$*C2
zk6~L0w{U-91k?Lp?A=#bQ(M<J{E$HC5PA!}_bMeKy-F7g2uc+}dQ(u8gwRC@MWjh@
z0wP@yr1#!bK+zxwp$JhyY04L{Y}~r{z4!e*?{~ci@A*1gYhH7%F~@)WEQuVFY@>A@
zk|i#5Ur4c^2|3N+>>01iAe`j!8b@iFc2gU4cHfou@HaaX4NT@Yj%nI;I?W){ny7z6
zv#`MM(hGs|RzE%+LA%Rh_*v1^OUZV*DcP6&lalk(BQF&d$>wW0<uvvtm{(x)q7|eu
z1h~%m!Vi6UAtexWg6GCW2$O>hm%x<|t_~FCowC_bm!@6YXkX{Wy<`LL>QJE)OL>oN
zj9*skaWU7t(nz;QOQn5cx~mPO?hS7SubC5dljA6@_dPgDOJG&#IFUcTC4NTM1!^^D
zvf`Z;Cw~l67>r1`-vf~haT;_ANosbAgWFCmpwjrRY7zyG+?29esOj_S6KiU~QCj^T
zrw3#i(!2&4l8?MnaY(XOqdNM<LO7h@G_#rGe8LMJIr5A*xEO)h+gNG<G8`#fec47W
za-Y)b`SSTTZd+S=7)*S;yBRs?rd%!6?=@s_Wm-wp)|&|Zc0ex0eeYcC81V&l9Hq4)
zG%`cLsf2osFWG3!d2X)N77n*^OOU=YG2p+D9vFQ>`eM(X2hP$;i@v%vyLrohxs)<N
z?-^$jNAGftRj%dJ%(cO5Ya+``L6H1n!`;P_SJ4g6_bII#J<5B=0}r<huWvj>5(n^h
zxHnxT>NzHV9!F_OpWm9#h`F)7^kC@5&V0C0<Iejbqre^PvlyJ@^6Ek0-j^KZ#=V{x
z4xkMC-ncf)MRXoDn|aXDQo<IZ;}EH<aV^+dZAH!~B;p)|#B+{I=DO!FvJKA$q-_SJ
zi7XT2(dV!pjEmN%%?c5togzsZZ=r1*=9WyeL7psBwZ|^&(THSI#hB5dZ9F2#*1NqO
zDkYc_Kul*<I>Fk{m?kwmBTqGC(^N91ik=vWG#KAwVHD-=6pL0TGW0pc*wUtHpYSf?
zZ160jQJ2=^I;vZjPtM8*GX^bkdZL0wc=R<Gf=I<YuX)+qNu|ZMwQ}@FMDE)0LWy;m
z<1WNqEw<;ro}k<7F&b2~Gsn%Xn`CnJeH@Pak(R0J84(;!$V$i+(d+50ZK#kc5;-rT
zI7+5Y;+@n^Mm$jUuv?R>%||~DPpFNHR8G>Es9WTvRM$xVMJ3*p`6P!U5myFWTH^#?
ztn+<pz1QU_mY3GD!}m_elh7r!Im|x70oLzi;E-RLKI*~`o)I*<8r_k;`GO5}(YQZY
zs4Bd4*g}f^D$IUP5`Rgtw^fmv)ZR=onfjQX=H4x@5sgdhS*#n~+Bd03qufp=(;O2t
zIRP6Dduij7?Mb44CbA{&gp7z>2uA;|*;xL%PXz0^cD0zu@s}edaS+}m-oAHt>3B88
z;(5-Qnmp4fgh>}_W);!Q`k&GxQ7t~98F^*{{IuBNNRcIPularEr&_%np;IeG?TyUO
z3Mzbyu4p=&b-<p<*R6B88#qf*ri`}>CAzI*yR9A+g~-+%;T|DF2=gorc4?iCiSN+4
zAg(viRpeG_A=-OUQg~`Swx&c~!PU`pr^^%ToQ}L5?kvsn^vPxVE60GMZcl_PVu-4$
zA8Xz}i>RBJ6S{KFPg=x9lJTZuiaLGug>VrEmc5`?k+P52lHGh6yrwH1Kb60D%it?V
zeLg1Y(}On~Vpq%SU)FvZzxIkiJRl?W(Z}>N+=~NZH%!B#wr;FFer+JiLQwYtUpPts
z5_T={wv%R-g7?KGolxy6thI-hSqyEB2a!aY4Zz*6mA*$kL>y{M6{FsIEg?MO7};xD
zixbye?+I(r`q|dz`{jzPN<>~zoTWQj*@)j#9^xx<7R=?>qVHA_>=<gw(Ig!+78?#c
z)*3>7+}yXW#7m<T8YI&7sp;HHSG8u5dC`K>{?na$DNmvvMZ6Z_y8Rg|pCn`_8#p;|
zHdLBzNa|wvI8&S77hx$ixG}%*)sY57MaIo5x}tlzNK#p)a4$u!2JHvtL~;4+*5a%U
zYVHc7@ugL&DtDa>GNQ-RFB27MioOAaDX{uGdaB7Uc4=2mjT87+7jeT(#fGPz61Dgy
z*j&SCNMD`ocZjkJJl8OiTst9!(v-GGIXkipMT{wRx0c*`Yo~58^|16~b>)3mFH@Em
znA00N&*cY&kx%Ou=P%byin<vzUCSVheW<bc`Bm+aYiRt3y_MDE)~9=$AA@Y-!BlPr
zA<~u{6k&etleO5-Cw4_BANsXQDtWGXyqGn;oDB;i>8S)jXEOTzNQDjG8>B+t9DCp0
z%PxWqS`Ju%DaiM{afD%gI4Mip*ORiyeI{Y?dzh{F7yCV#*7F#q7md0u@n$Qn-)pK_
zGJCAf+snDG*bVI5s_`3bE8WQ9o?f=L+MW=%yqp#oyx{X-#~|Q~k5D>q-<9xdFXdR~
zJ=gCpN8u~J`poA2*v=dqZnUc*S#mjCSP6^dZ#csK>Z0<(i`BHXU0v+?4J|FDcXyzl
zhxFY23*3%vfa!pO=7FAL@w;&ko~_Rxi@Ej!$@Z~f?eSV5<u0038SOpv_+3oX&Wv#2
zR=<1WhYayI&)EaFVMa>p4`M#AI0x=D-BH?T8gg0o4&0p+Z`vB#vs^<4em106-hM^7
zx7la4vvjfPGtJ7Et>wVI-L<{3<-kC^LbI&}oTB9jCk%%#o(TYU!%4N^#6$=x0R$Bh
zoZJ!7z7D4;M6h%tFlP`9L_xs`2v(gSUdN!mPYBM!AWfMdeoT-!5pwS#Tv!L$HXbAy
zj#MZ_j>sX8V30^3<WYfOb)8^?+d<0V!I?C{n%%($6T#X^!6uG!dYIr-jv<mnAtwq$
zB-BIBU_z{F5$3fab`xUfh(a%hhY|>c+INRyY(t%h!aO%`I8TK7`U$xUgw2K#Qgh%r
zmmN!N4l^@WWaPl3D<d!R#-sMY^VdNfa}0~YNcnY#Ple$oT>!MojyZDx09as$G)~n5
z_@Q8l*a(nB1hGySsxXp)E26+}@A_@Oh~&+PyE=*)M1Y&&FmCIJd`u)bDYBR-ih4Bi
zF(#laJffo#T#1ROpCBu!B(Led**+22#2EEtf~8I1R^P>_itdO$qR1Qa6oG(Slk&Hs
z9d9k@@J;AMw?4epT^LnO6bazKEAYlkB#K<F4IB@T-oY>~g~v2Ki*ApPnkI^=-y|Kd
zzWHf0=6ylTE(R4b6GPf_4euTdq<gc-?q;eZevb~IULf|}GZdv@oCQ@Zd-7G<WEg#2
z6azMblmicd0+3~*`225hD#Xb-d2p)4uZ6`G=EPw)@#p}N85och)2*YrH)JE?^|oku
zBNB|B#TR^tXCwx&!wH84_DHq165bRf=r7(rRuFHYd&5M5!ZaC{v57b27(ppPaaJ(#
z1y0ctymMqG!JXLC-YKyVnK+BZ191R?Fo~CwuX`%o3GwH%5losSyh(=z-kMB8%cH2#
zNihl(*Xqdc_`?v%NyFMnp^M4FCU;WrT`F^o`51l^WS){JA9L*<EJZM7;8}8pU@9L~
z%7ev=x8(tK_fml#DeCu9>&)?HJ#g<0*!}@f=af3ckXqT3)`CdtA-+3Omp0IoR*h4%
zB0_PBR>gs$b!K1DO5RtrdV+C^R>*;(brh#)3EtUPw1|;7MeF>5qQ#3-wCWP}6|JH@
z#OK8fIpR!UWM-jbG(m5skY^?_N!AzbO!6hvzM=&Sq&c3o<Cuk0wAgAhS%k6&x3YN8
zhA_jjpG;)o6fGoEw&0_zeMM_2K!7Bt_(0KW!zo%M5&MeP(lwl-b@@Qix~HA1ITfm%
zl4~S{)W4czNRoGo#8Xcw&+b6cD%w}HLiQD{A_ttJWpbcs2|DCoj11mav?8r=ik1>l
z0Z!41(Jb&ij*Lz$2qd}Q(^)`X#9sz344b;vq@jUa%DC#~9ZqtuM9x&Jqwve5u_XPy
z<lbv8b0oKyGH&sLQiO`i9u}mN1YHffms3>4Cbws*=TP)q5GFP3SA4u!kx~D_)eQ2)
zqUzpakIUAz+xKLj6}J^R7_6%_U(F~Ny4K!XG8|&ry_Dfc1B{s}d6J^9{N&#7+04<D
zOHY^XLvL$O7TqU^)R}N7e0BDI{FUO_-po~w`&V-a&M=Vv6Ge-(uZ(=TjPhpLZGh3l
zo1&GonX8%L=6JckQ?!;V#7Qe9g)605Dx@>PU6;xQahw*aTn}BTOj@<CXzf(Cp2F8Y
zP_*=(t7t4&8Ie}2J6GxHRqGe;iJRQ4HfO0awWvPFqIQ<F#-y+MyhXJEOU*^nDm%TJ
z(>H5eS*p&pNjle8r6TCvp4WJ=;CmHU`P2h#iouu4h?Y|-k$S1ql2mu*>AGeipYPSO
zzROk`sf|vhyRShNUQfqZEa!0f5_v9N((;AU&bnaXN4WZC#t!68O(D<XG1`{e;-ge+
zx^-bJ>3PL<iS&=|Jh#p-h7|VErCZbkTk3O!8{}r{gD%%w&QMK*sW`{!V(TGmy7e`_
z4W~>R3XVR$n_6GZ((pL-@l)T&ZKRD7CXZhhi$@@IdY?l$d1~W@C1_e2CQ|D<EgG@K
z^~B|m&r3Ge>`PgXKkhu9A>C^hjcp?GY&!4RNSW0LPHUiwZLVc$A~$I^lWg8jeH1R)
z(!A5O{@k1j+RWNd&7cT@zMv!Qhme;vzg>p#tu$}c*X{H@rqpj{+HKtsZk2v<8rSNk
z5J1fl)n=*MdhUJ6e0?)7wEY}jE8|M5){7=l%a)t5O~)EqRS7y^`W;-7Ev5~0$}SKg
zk#+&HcFwZK<791*`P$4qJ1+D$QATwzN3|PRcDTDx8%1^UM>PUlIwG?=2t2!-^xM2e
zTJ+MOH$*ze$~#RgyFK(fo?PoTS8NBBclo{O#(&oxAkq=E+jYsM$2Nf8ZG|zZz9*cl
zS7@gG=1Lo`ZiQOuxNN!Cek-dxIiM$ar8lL&CuXLn659K4g)$x5$KB9e(7>p?(np{6
zI5(gtW0!@o*rfr{U)$gB`NCSapC#Of-UiA<2<?x^>Ki6wsutmtUuJpvqJM^rx=)02
zRDYnBbD%hi<;4q@Ig!D&G&3|AG~0Wy&StQy1l&{7kL@3#*BheZ8u~2q{}ipaQxE>1
zqGd7o=G^KVD~fp=v3Wbg`3r9I7o+E$O6Q#i=UrFl-6<A4#TL8`7ku3ou0${Rmo8iz
zT)4iv5J-VRh+&Y1m=HHiSTrW06mxSBb88h7L$Meuwis`?c-w99PV{1O>0;{O;@#E7
z42q>Jv85ctr98K#f@p<*r)YIWuk@6z^sO%9;r(}-7BeRsRE?dGmy2DHms?bjPee#a
zN>oTzQVe!PN*N}5^q88u63kASFJ6OEPg5mH8*<{f=AGkoI(jCj4Rys&#GE~0U~Fps
zKcTc9U6M9%zI)l_Lcgm>zq^Esr+<K_(}1V+X|Jp)UrF=Jg^0^;LziLauH<?9!O#2W
z4f`Jpx$0#bkZ*gvc;vcz<c-TKH>5`cb#R*2Yq-+ifm)$|2DQFwT5C78pWU*Uj6QoI
z=6C?ADjgLzfwFRnH3*2Si;7E|jJJ19IFX$YiM@Ts^Uj&jI}fMsI5i}}3zK7>C%gEj
zScasu+)m9u(6ns7Qd%$4y?@cPT)t{r<GIMMpw_E=_-{0=qTmljSHFT<f3Io1sfypI
z3h%7GmsS&bzoz$RN-GUVX>I(O(#raeloqzLXu11Abx+}RZ^KG&WoO^h_kCq`{rA!R
zO`8K{uLqk~2kRP#Dw;>CJ4P1zM_#-cX<Hk4yfs?eH$FQ${`?<kT7AE2TAS#>jhXSO
z*$-25W3T4c7T(P7ym|U^e&Y4~Tg?3Y$NA?w^An#iFW)S_+g+S~y)^x4Y39w!%;w76
z;@X?7HOy!1!pghF?e}l7>#MsT-+%b@{^Qoh?$*b>J=`EY0MQ=cGci=BEVBhkL?dL`
zU6$1r2H`%Qrc<8Xag$N{(u?l$oURxS^+>30MQ%^LfN7CsPeoqe9SOVMG~LSlfmC_#
zr58Pw1w$DsND|iLRfQutI`Km1daLe@6&U9nzk9s8=t;3z<)!J~>f&b)tlJ`4^=e8c
zD;>v*&h^#YfBw*8w)d{y!_w(`zYj~(eGebJYJ&e?rD@IGqXB>g&~SVb`QK?;!#`<S
z@@-T&O)Hz8kIkly3igYpl|zZsv}UQ!{-J46;504uO>`~=tpA6mWjHfOt<+!khT1Bi
zr4wR$-f2F$V?c*H_+<9td}{5!rX})C(;9#nf9z=`me|*{B+{DyQq$@aTuzV~%JUBu
zDpJ$lMB_BAw0%tr<METGrIcnIrBjhswy$aV?Q2?Itv@uac`BTy6^+xhDh@QQp`SIa
zJW6h+n<8pnKQt|Vh{dp=FBEuBWpiTmyQT%Li2g~_3c$4`f7P^H^dt{7t<sY#y(*u-
zeAl$DAJ(*n_cg6PGT6SRRp99Tcbb;rAx$enxZ<0p6>(V8GT=lD0$G1(T6$?^YVfn0
zrpv^i+d=3IKr}Qa0Vri*TnhZ1rj?Fv`>tu-0KVKLBhD20V(k_5<_pI4rt*pBY-qAW
znikt1n%0e=ubNg3;8A~|1jclLO0VR@E3$8z)@qwvBa2({YyPjARxwV~N(X%I%2%GP
zmwiS0YV*=UvHyfEPSaxhu4xqrXx-G3LxBmpziC=>-!&~CoTfGTUDKiz{f(w|<qu7(
z>bIJf{m5TxTFZZ<Y3+Q|w2rnY%1jgzrmL`D*|kFdM$<alLhK9XxQ;bGuSRykZ=Igw
zK+{V3Nz*cvK%O1MX<B99G_5s!?qY5J`dZDvsMq)*V=OE^?INV<&GdEKmNMRTdJ0bs
zFF#1h6LnvdOP!1ksy@)PI4m5E)#PY%WnH(TEZ@e!13nNY^YpZyHpFRKiirBg$vquF
z2Qn<1%+Y^*PBjq!J$_X@67KMarsa}Fsg;ISnNw61C#0^OCdR4YRr7%)VU@fX?wtNn
z@b&pv;YQYIYlb%|&^t3So`*E8mam#tz^|H?Sqs&YO$lgm)@XhAXHBaMr)jx=)3kVg
zXj)f*ZzQQyBo1j>NB@bYHAAAlp=t>Gu4$3{qG>H5ahlfYKWkb(`<m9J|Ey{09cWsu
zG@GsNk+708+Vy7btcDzW=FbEJn!jmUr`W*-KQyf~*dLmf`M##rM)wHcy+B5Q-#%!7
zosi;zisC!|!<yFOH%+VO4^2ywfR)VVFEp*3|3=et+}E_)ziV20ziL_r`<fQ=XH6@D
z8>|15rnUW5(-Li=e<E<?Jj>GJ>H4#RnPAj`rd8fde~%g^Xf?2WUO0qI7N==l!D(6>
zGqlf3c#E$OtT^oCPEaiU|D<VAS>Ok7edOyV7VCdjSsUbec3;y<{98?H`4>$Kiqo{>
zG$jKRBX9iBv?^)BziL`8BWnkmmKlP=u%*kzIarg(CQHp;3FV8^v|zu{wA$&U|IoB@
zaGF*=`sTi-CGm%*Wr`xOx-Jo^{=8H*cfR+OFHX}+v%Nyivq3$0`J1K%BF#6J5yfd*
zuzgJ{i-5l5KWSQ+ADY&LV81nM#qeKiTAxf56W`%IJkYcx4ryAx-!v_L6zupRP0I?W
zY1x6otbe0vg*5{UtmT$b$CRu|c^F0f+NA%`w5|X#vmn?nnwB<B(`p84|4Gx5{&$+z
z^}o}!I7t76rj`9?O{<23bcFh-MgD=NH3KT;pb*?t#k+E#X~`ebw5)&Dv?LB`TF(ft
z|DtK}8%K0|MK5lu^n01!-HaIP+Sj!Bv1DK1F+XWqG6a|jLb*8*Ro#VJzgRw1zTaqC
z+@vCa15HcfyQU?*uW3nGgRcLiX<36LJicjKN&t}eIAM+isNeP<X<Gbc#|=+Vib(vT
zX<a<fw94?+ziV1&f7P_SNOCG&z%81WO#E*j5uQ}%gB@sErhlzz)eLiKncV?WQI48g
zg5M<8c#~vIp83dk$HyE(#)PPrmS0BNoUr|krUfg*H?{u1LDRYl{8iH`80MPRrGouK
zO=||E4x`e$#BlB^bwXF}vzgp8kMdon@{O3~IZ~KZt^n1}P+6b7a{Xsb>+Dxe3;Wla
z*4bY*E$m-wT6ws2PAX#Uu8t*Wl=wr_s(`C*ph=Z*nilN4rd9S`(<(dAv|fX7nwH3S
zP0RFOYFasvT)Tx*Ye(ZJv!p^D#$T`m19jgtEs=kxX;uGO(~|fLO{=u*a)E?o*gw>?
zoPMuq@pI&DPE{J86?gusX-OQ?wDLh49we{jqS`AcME=K`RxUPo8V+v89@4aW4{2J>
z|4GwQ`dQNwIncB!{*|WHdq~qN0!868Ex^8}Rf@i$jS3S65Lf)~X<AV@O-txMX<Fq6
znpXCAO>3I~_9snC8mDQ=5{Ue*rX})=rd9D5nwH3)G%fFcuW7lEN~r8>TDdq)3-(>p
z0)R>mX<8NkR@1Tt>HQa)mfk<pv`qh#rd9D()4KX+O$+vqH7())qncI)8uV4u3j3Fu
zR_PB-YvYinHT;h>E%mZ%rax<11>ZHTnnRkF$p50IH3Qn$w44uXTDE_yX=VPRY5Cz>
z{k5hg{U=S!>wibnI{UYpmhgYlw5$#^Es6g%O{@IRnwC}OAx$gi&zhFiAx*2|XH83j
z!(Q(|(-J<cX}OY~{h?_o>}y&Q2bz{NPSYy;MbnZx(6pp~(zIm%lcr_*zpiQV<20@O
zj#q;0O8-vN>iKI;>-s;?v<&{arp52GiS%jRAjWB089y{F!{oO{Pl>;4TFU=M(^}#E
zp=s&;k2S4T{QpMN8dLqxnwIB*rd9l_rUiQwEN=N<YFZWlP}72a)wD7NvF3lNX?;py
z`a{zS{Rf)X?GRdX`#)=1Ps79mhQpqz%P9QNw1&THTK2J8?Ek%{rS#uwS{{F)X(7LB
zT2{b#UJbDmI8BS`Pny=beNAgQ0jFu{5*}z;N{2Nqi~p=?`Rr?29fbd9G%cvwADWgr
zz0$s>HG<Q$UXxBQ<20>zztgmQzG_+}e`s12I87_@_nMa94^1l+OJGIzho&XcLifQM
zr)jkWRc-;msHC8MO^bbB(_#dY=1YXQuOkjLEyK(ZQG?%WTFBpOT1#IwEuXKN)@i?R
zQ3n;&fu?1R)3neyO>2(y<$G0}rq#@QplRu_zpo1NOS5J@%lJD@%k=Lxtu_(^oTf!_
zNYnEFMbkp69zBhY`72G!^bbvI1OF#Y3yIUTAQqbd_OJs@i*#SpDm|=e5&rj@)&hur
zvpIfys}-kdh0>IK)wB|uahlc>uteFurbYP=HLb9})3kCAG_A(WADWia$PZ1+;15j;
zwXbO<QJ$0frfJQB|4P%+A^>3FL=1~SIwCku(~2O`!CeAY9cWtF(0xsdT8)4nf)LvP
z0Ed>oYFbVl_zT^?)wD9<2bz{bb2p#V4^2zqZ#6BlZ<^L-5MIgOYFcH#*R(<{4{2Is
zUp1}GeN9W?tELtFi>76!8EkM!)9Mc+4z{jmKcs2J{-J5<<1{T90N}f(#RLKTS<?y!
z0vNG4dPNn&iPN;yAVF;3HLYNrrnLj2`&rX++}E@O@M+<)_*Ze4tvF4q7^i7@t7L!G
zv|xk)3A}wx>)0j$An=E#bqx!rHbE0CWU7z|;2aT^Lz)(jZrOw%*0f4~*0e^xX<E_Y
z-a1@AG_5y4fXrb{D;NR=;BgXt)3n%{ziL{6I8Dn0LA<YNZ3Dh*TKNZ>md$~tW%RSA
z#r9`Si}?>ti}^s)iY6WY3r$N0K~o1H6rduv{-J3B4m7PWhOe4d#8*wL42sjVW)Evx
zgnWO}w7S1)S`uIZIP|YHEtNx>*2;HHOE2W)?=&s&cTKC3a<h$cvyAevrWJLdX%zxg
z$i8Y?gybFoPiw$mXj*W{S50gAyQY<NNYm0k(6s#jM$?KVM!{)D4m7RiKWSQ2hcvBN
zs084frd9Z}re*g#O=}D8%R|NaP192Qs%gbC{Lr*^0N*q%GvHrpT5~u}D^$o4r)eEy
z?*6K21zYZGS^#nmunkVr>Lvgc0!)p;8r`x#Yg#>!eN79jl-UFIfLmf8;-DP#vNj=x
zz%&y8-q*B{mIC#bWuc%#_$d|qeN9W{K+{6}drd3+FElNQLz<QhPSXm;X<7t-scA9(
ztZ5Cyf2V25YW%8cmHbZAO8C8|rTRnDI*$7|ziV2Vztyy2ss5~Kg`UD`T3NqpTEV1$
z*0jP8G%aG`-)UNcXKV4lX<D`4HLVc@cV@ULPScYAMbkR_RnrpWlz>BiuW1FJ{jH`o
zjMKEj)WgF}|3=eNIIL;mgFSFZ92II^yhEB+9Mum^>jF;GqE<q|_cg8XAkuwJD}*5v
zPJ#nL(8vQ#3wfYv0sf_?g}`ZAoM4=$bswi`O^}+!Qy$i|F2KqEw=^yPLz)&TPSXng
zNz=j{(zJ#VbidWKJm3s}Xj-APegHz$VNL4+tu>s$8mDQ2h&_;0W`KQ7Yxt|CWrEYR
zriu48tyqSn15IlVK<EefL({qqAWnjN>fsSXWcg5Vs$w9aF`RT?(*hAYwov}iw9xRZ
z5+Jb$PScV&TPF2Q(@KR;hy1K*^&i%>rU`MH7UUOAtGlZE$;}?$lkCoQiFZRMf*;{5
zEe32|VZ6MW%rwo&6t(W@@ndiTq6TjrytOFU(m41+;iFhqz_k?u0@Of8F}xst2uIQk
zs=sWCuLU^t5u+vnWwvLB0hz3T;kK5@0rB!vp$tTDki0GFW$nG$gj%4nc|xi!7+r>|
z%BGl_pCxJ_08EJuzM@v0N!d|wHK1avF{~h0Byt>+U<80T@RXfwYh(yEPfijL0SIbm
z!+2r|ATLNe(MG=U<YGjnizkBQL#CG4%mu*d%mml{vZrjt`QzeG(ubYmBRW%ff0QRe
z2LQes9{<p>bcxyK*nkZTu5YL^Gl3j};!s4hK9Vx9sXUyqaf-?C9Fq+k&sxLNT9PgL
zvD2oR5+h#q<6vO33cGWkB_x>lqXx+DHHtU(<~4-7Jg9~iC@Kpe9|nA49Tr-(btSSM
zdOmO-z2J?q(hrep`0(g46kgyBaD@=^_Tec3%y~{u?$xK(Q?#2L<D)VrLJw)0(deqJ
z@=&RwUehMEvv!){6Lk<0S>tC~pavZA(!u>l3EdNi^rK_R49OgLA`JP$C7W~2gvL2h
z1hN=VRuCe~0TdvQ$Icich&g4&h%D8`^=w`W1mLsFhrpTz;~>bO$_P!Tgc^YoUXQ1J
z?=Q%_feW99vz37#&sns1+mjQ`GW$4C$Ig`8p7-`MeSO=UAQSJ_>`cvixe#MRB6))g
z?Q<W+1zek>j{~l&)B&G^%Fj)&T$73f{hE5lCbnVj6h<X8N1=62mD2t>h!tM{ywWoY
zz`i_PdDpI-6%e5qc60Cnc>X*Sler-;*d?HSk2@YtCIFYvaoQr7gsz5^9fcEV#jX_3
zr9@{L$dX%2JcyfcvVsMhCIzXZ$OT&Qvr9oSo1y1)E}6d%&V&UQDk0vLf~=^SjfOAX
z#GU?<%2PLKYljh+F>h>KS7{pT;&&DZIYRMJy?C{7DZbc;*XPH0sc@M>luWFI2Oz=}
zV2hr4c^wWwBQxrc5y9beG#2kz>pATgI+X|op7w}-u<d2D5N=;VlcLpYI^+84$-@9S
zM`8<dKsAr?$r%B>eL6}+aKg-aCykZnYj7s3u1SX)Dxybt5M8>SnWV-#fSakS3f_d_
zqBl=N0$r$+A6^P6mL_>j`RN)>-Qr%eP6!|TMdZZdWqCX!`4CfqP+LF#Kn!wq9-W)c
zn<nKR)a@PU=<ez#^weYRQ}kNu#O?E2bjZRt_mc=&!j1JA^R1caC8eAxuZM~?1{aZn
z=5VZ3698WY;OrM#q>gobdDe_B%(}FtOdUw#t^tyVJJr^=7x#BicvAa^uEaNcL*G${
zy&Xgj)%4q(6&~qZwWT)KYXBWH6o3<OES^U@Lb^QPKKFEgYW0X5QKl}<cG`UFh@@vy
z=j41a(HPiJ84z@gkiB?gkY~|*Qz3_k%2gs5VCZB^q-dyPu3;_Z=>fVWHVG*7lyZ+-
zU?ZP6{^9zF6U9?J?G{2$)U7?=vJe{i+jq}D;C6BkLVMqQ_96F6sO>OO0^EHoKf={K
z%x#N42#!C!L}HZ$yzWSNW;jfcD93||0b1b$ej5U?22c?70f`p(C_HLQA3>uZ0c)lj
zu60*f0En#RSq2{f%m9)(3UcTff+Toz{UZl)_|-=HNijIk4^9HGQU#bNa1Zgb?FZVl
zjYFHg;XpVn{U{;tH8`a_;C{nVaP7IM&Iw@tHGl^kf`a2g{HW{RL0@@l5Gj(>0#JDb
zHOJsBHy@q%0HF+U%R%FA|55Z!ZCoTy@Rmz8()ALzI(au<momV)`6*Q)f}(aTp(fM`
zTa$1<sDTuZJbYs>cDWm1c;&OKcQa$CYAqN)G8|@xVB$z@dxEpK=+Vr;CMqGtCO@;8
zVkQis@~2?aMNr-<s8)(N_5pFg2*V90%hZKPcNH<)MP&N+9r(TV-O|O2;quAH;I#6J
z#1Lh2i4edhzz}z-L`b2*1ZkeC(*}Xr<QF6~5Fn76e2JL}lpumsAx#ett%8StOz4rS
zgtZMxm>aE*BI<oB9*71?26!{v(v0Ue7{XMWi3WyMF{UXt_i*Y*+!4|eFwT1|O#%kf
z!pnMXJJ<l227pI|I>0oIKJ6q2CQX(YbVPu0co|B4izrxrt`e(atU;Dfq2fVbtVs+I
za`c|q^Tz#Qk+9uGGI5mSU!Vqa_~@L33}#;x8a)945Tl0=X<A1WJzLpVe%7?eEhvw?
zdbH5f$q$ulocq$L0yEr6OL89c546iM`WUx3^|0%yoMvj%4XfQ-3vOTbHLZvB4sXBg
zYg*>cIn_lHPOhJ()h(#EEyVIq&c{NA0DKgp?l!kcMK|w`-3-bzP`~L&)>zOlbh})O
zG=zR6o6LHf*ltR?*hlBAI4J=4i%5H^jhHJx+>}c4PQPTZ(^!)HtU`bzE{4Y3FUNz^
zw9HeSmj&zQ;?}}ja^t2j5*<|9j2GE_MnxCf7?d!3ZK28){b=F@y^5>|`b{YH5NAr-
z3BEMXUUP?Q+Ee?QR_8Nv;R65m;B*8@N`aIz5Fp?bQ1P)@jhlR1AXk%5fj{qd=SN+k
zM6XW<ic1&F^OXjiBF`(Au}TRQ-76xoxEuQjr)h1)dYxsY#!?BF*4Z8z;I2!^A1En4
z2PBDk#GJaETP(ELcH28rHLarP2D51Ole5=E<L|TKG%a;CY0ZZ-k+=-*Yzm88#l)p9
zFsTcipI;hTSnQNIt#b51#i!Tx;!R&1uZcC|k>Y3v0u~qhN1xyGktQW9wM4agsmbYx
z>P3DieUu|pl1fpdv0Gkkn#R%B!n-h)(IZH>7g^CO+Q;8VYzptUV0AxGvJw=A;-%I7
z2RIBc<vcv_?wR{si5x9#oSsywf>%!s~I%l8VOn6FJ1JUw@3zKb|X<<@hmQMep|
z(xhtg@qD`n1w#_5&vS5im7^yPuWIHq^e%{!48`G9V>r7Cv$AhjjXJT{l$i`Lge~M7
zDd!F553y96m8J^2K=B+3t^8JoU}5?ugi5c*O~T~MXL5QNy-w!b;%^M#EP7t&OeoEC
zeus^{tci5bxvY(}slEHrSZ63@Qk8V5vU-AG=h5D#=@QrNGLJ|ZMBi(Wi?76cGSWVg
z961)4zF?)SNH<XTGQVTi7h2ibz0)`8w&co{_jZ+wSvUebB4KbRGAnEdW#SB_=(s9N
zMYHxXNMSQp#D=8aEJ!$@C5W@T6--mbMie&7T*UMsI9Kovv1xcK?Im&tevh+69qMcX
zl6H<=la@p=(!5sf`F2w`!{iM)2&3pkWy2tu{Dzq^G$rb!InBWnRY*$70N}OBqX?PZ
z@+w}o*R-bcr?w4aWdcQPf;y~K?{%VDm>>(Jh(1oJD@dAE1sQU=ft&3EMv9e3JX*^q
z{%X4knN`9i2!zH^*=0oJdXy*Y{SUJ)SOhUE*$k`zi{Q`Hegvx`l|^CHT_%j1Ow)ku
z!W=j_imGEVtu6B5NT=Z5fgCl9pU#o@a(5<@yB~e-LNIxXHB!~8+eM)i&Ld^ReS{Td
z9Mfi(EL{&CaAfWe=@@6FumQEL`$XURSQg}sHL0D@L88)w+Zj0(DDQ6Afv+xyksD^J
zcrt3U9AEDetU|{u*S6|?8P-xZ+zL5aN^Q6)-y#?336xkwCv7^Oqi66Fk}@1-fHf2H
z7@}HiizJh~)569LRlv&KKxV#Ug2xXut*Sh+>w@}rLSxCJRr#_6p?oeyV|U+I6)1ha
zXXHsTo<&_<sI_sAuN$4>JRhA@wP<#Ay*%1IJm=&GY>T4VyNK(C)kR;D!ekp`t9%tt
zvTXYm%7{GMqcm8zVS9$a=MmFN^X*5b+Y-#k1)!0F9bg*tSRTbk*hujb?zCFeM&?q6
zA5aFkoidD{x9tIB2LSa?j3UUpeS(`QW@7cM5lTCV2625=dc$*rEXPQ686M?VmtGfj
zu@iniIa*Uw^H|i)yZHI^`<jQ1pG9%p^otqlhqax@#Ju9KJs)3Mt*V%u_gUw>sSf4x
zvg#1ppw^uh54U4OncWrMMo=oGwfej^1M@TjM4h^4NK4B!l{q-W)W>HavmNb>QptLd
z*W7pYti{L{$`!PP`fhJiKX8SG#N5E3kww?BiuQ;I!NLcv^o<gs(j_zG-broJxUrM4
z6`N;!{VMHz`<hmR4Siv4huBjOXT9CmB!Qc_5ebsf-Y;zEmutJYqRXS51MJvolH0rl
z3LjmP1G`2c!ag*wK|VP>0#lD&9x!2DwpKqX+~&X<T-@oFUXE{|qfYp$R!kx^{}!*c
z8nY6rQ;-4^$vJ$AkZ?RmcHV@X1sY9fY6j$3Ath#qwr0N`R%MNrAdqt8y31+LHg@tF
z$x-g@mc+rkq@U4jb2jfrmw=1JNlfg{SEtTq(jN)XId@6k#LV7>5vdf4GmZRQNUTty
z!bMrC6jPauRQen)m#14UVAKi2$_PlI=U7xS2iYAOOW8s>^<)_@5{=4_`9`B}`pHb}
zvG++(AbA&vcdo`weZe9Us#-!#{eU#RHRq3HruN@(Y`b0DDA$-f!@O4*Iz|;T3rp&K
zVCp<|tcb#<Sy>DF2?~9sSH!+jltp0C50Eu2(}Z+kNM+*|ZZ)lUbv}2TqKUE{-FZyT
z!hxW4ngA%Cd4lxZwzd*H$3pY@Tx(6aP^w3l1N=<TvTtZ6c}cGg)7u*l+u}>t^X}-r
z;zxgS+9lV$o@Qy2<YCaV^Ol*%B4$atew(-=o!QX)?&ADbG@oMDt@<NTPd|>!Yscu0
zSa(g+!8qOsvPGooKLVDUmvm8NW|E$J^pHXV6)M_kO=_gi$#&*g8HK%P?FHyC1LL0N
z#r05%6FK$ISJL+sF%P9FmBg~5^I~B<?^@cD6<C){t_(DJ7hcV%KEHgI;<Nv7>Bk7^
zWk?UQg|jqgyOy*v+tZ4W^sM%oX+I{9>wqD@7&!ReN6sc#p&ZW_uvLJJg)BbV1Lg5{
zuuMrCJ$6Hz{V4)w6wt=7&~<EgRy@%4eQb2D>PuQ%_O8nbVH+EApBG!$c;3AlOE53Q
zLw_bl?>Z5t`?s#nv_V8@S;7sH%K>Cb^xFPVM}#H#wQ0mwvouyqb_*n}5u~isCgo!^
z+X8+=)D<MkLDtDZHi+z=V7Hb@BRkQH31RMu3O%xDMX{>?c_Y(t*BX)@hVa}Ad%Oi6
z+5`!&t6oSRqcY^AW1G2mBwiiO!NUt3x3r-WyRGdxGv;UG=x9SH6hp@thJ#&*(z93^
zXBJ{-6q2&o{ii2Hpr?mzC?;(f#NsC|a5A=X5|OKU5M^_+Wl#ENv2~8DyrGzgxO*aG
z0C^<)xnj1ahV3M0_E4GHbH{A{8?W;atOdkr+EkgVwUDN)^h?QH`EOIz3%LZ8$cNjx
zM4#G15z}ucv*W7R*xzJ}WfO`Ep~Y{IDZ$4i*tn&H$oeJj<V9qyu2}a2Y@`(IR#oi2
z@XmG_Q_8w=%Xx9L3sLGUHWyu=mF`8zU$$$~2&&5BK3c;qa3Xu7+d`^kk6ZrHY~y(A
z>B$_WRXe&0F6ED*%3pH$(%V>wa#h)Q)cA7MuBJ$e<*F;$Gsbag#6@cu+Cv&!6wGq9
z+;X3zax|~<Xm_IdPxco|^yPIR*MoD9zhpUf)?Tla$E^ejN@u!?L5j+oHIX5SFOk&O
z_8~jks4;NgW*(DL+dWr%75Y5a5)h9*;>F!CgVU@{@;!wTQ3X9Mrb2nA-FVLwJyl$9
zF<okt-fW#2P8Fv`4&r331e#;V)D<^drNi%tqj+7=NQ+ipmn7b^r}daG9Uo}cIx25w
z))7mI(Ld^^mgB_4H(_)})}hHbM^i1|?gpJ%MW*mNo@L!_k?}LEwR=FVCwMb{LGt=|
zJkTJhPFwtw7EF|bQ+mFE7oS~eFNdRUUcxO|$F_iu(6>>BM4}@DBA{0dvBDV86@z@w
zK~fzxdoS7fGriL=5mj~xwoU^Czm7UP4h0L36Gg?z_5*mv$@zvYSW!L7{``Jm%T$vy
z)ww`nto?`GF^!f^L97GOVl!1kJpBtjMa-Dz$Aanx9u1&?_vv}!K>%Nr1=u_y#rh(v
zOc%^4o##kc3W`72wv|%^blT=*fDq}CZoMMMw$Q<gQssy<A+H#_a{}`P@_628RA3sb
zvRpGAM~@UFZo!2ekusQ++ae&R(ZWRCp=AlRO;%tC@E#v@Pfe1nMNy}X;gp_aey`$q
z3pGc&cmNWYLzruh<@bo-pTMzHE!6t=BBKS9Up~(g?YEj?(<yK9cnzvl;P4Q`yKaET
zv58S;x`%qLzCjQzixbB;5D6qs)w@GQj;+*caaoB@&<)UN1Y08{$z7!=U&rBOi=%tD
zz?jKWLz<wwwNT^aobCBA`NC1b@Y|viLBb+Pabs448&6W#K_sj3;?}K_18v3G97^3l
zZbvm%d#)mlR?g|vJfS73rDif{o_|2h)nWcCIz1$)0#}J*=r~@HNP&MDg1mjyN5I)d
zvF)*0YM!64*YP(E<K!Vd3k-g(zBo|I5n*(L!M<ZpYr3rEo(eErEO}vOxQwJr?#1Y+
z4tG&MNNGODJN#MWOK=WJSZ?E}98{zm?_{-zNcmutC`YkBZnjBUa~7=2?{#QrZ)p38
zNO*deqT{j;rjNGd{5n7+A$O%A%B9)`$`chNf1dhIi_wu4phioK+g1JnElTVLVyZn`
zKcBU-v{xcrl?GDc7Vhj4juf@O=gwH%(HmNI!r4tCh~LG<W!x}FEus@w-&9*}57O`G
z)k?ePTt;Q=?bs%;(#mLD{Fn{c*y`-kFWR_7%~E#H4WkZm0-1;CN@n&5bT7P|3Q{T?
ze95f6m^OIZ$7P7M^i?_lEjF=KxB@Ff(4+QrUq`mR#%VWxQGA$WOwjEvzo5lSCQGL;
zKDk5~o~_Disom2XDnIO6=^s?T6qSCuiy^?FA#RY`uNCIg3)uut16ONDF6CY@s(*Cz
z&c<!?BjSFF1=!0ZN_oX6dEFPF+L-M&%;h!ArMAV=)urR=%jZc`x7w1~S{TxThL@;G
zRn(5QYe|y1Zl^Cos@^I*wGFiC<Cjq_dySOMwLVrd=DQ9uClJTuKfzAhb{hkV9$Y)=
z)YhRR>XP=>HNfRcz}vHi)`8cNGG-3|;z)B<4@ookJG$yb8A$mm<Yd5oZ;@NBDsGc0
zu6vU!Z!x1}iu9Wt7TCyH2)^rO9netgo)(0?bq72Q5EXaDV#aPKDl@XNK%$kq@dypx
zsctn3=p#^4D9|yns<V=9>j;`N#^_C;cY7$MjA57kJ9^S07j%k99aggE0ra^i>)1Oe
z;V9WULOft)<?<xiI0Agzs%sr@v%k&$ZYx>I1*+LL+A=uhu;4J)JL;2dY8_D&m}ysZ
z$zZw#x*bGnJ<hu<!lNg}J1fCsEydy}#lP0cx-7{y<SEkS)oxt+FoHWfHtvPVOX3Or
z&z)c~aS-I<h}_CrQmduQL@TEXkPj}w2Pb?x(Mpjv$QghX(QkolHdBWqm7uM%MhJP!
z#q)W^@;Yk->~92hR$s-PQnuW4bFp8YU!?(UHIqrSDoS`uU+Jyo1zw&KVm3Q}j~3)x
zz9<D~VSoZz%1T^lk+X~sCc34oE)OoOm|lIyNB+#C-MUP<?7@yh7=4B{r4_9bO83i`
zF$HiX)$$tkg;=t+P_TBn()Bhm0k36iHFjtM&>vVGI>M-0YOn(`tR(p;Q<;bhiutLn
z^~TfNh&G;NHwnC5lS1Lr+ziWgKDA(8;Cf%Vu&U$UimsmSk?>jKDCwj(p~5(E?KRD2
z0K;ytyGyNzi(l1nbahkGkyTa%wkSq<#nlhqW$qj_<yU?F0muruEGc{mcIu9>j`}gO
z!KcwI?{(fYj<-E2SK;}vH!yY`u@f+H-oGGWeudk!iqXiENnMh8c98kGS{J?v`}5{2
z`l{?{K{boW`l%op<3U)ViIABpO*5Qa20;$MqiqI|skG2W0iTih@>QyK+?PEmD2XT9
zg@<QB8-HKx6RGyvdqJ{`<~S*89c#jM`8cJhf7^+=3oezz9+D@a+i%vL9ZlL+PKbw4
z`q#+0tm6r6>6zRl0iMG`peIjAmsg9lq(T!s@!tbg6O~GuVbB)LCR|)V-o>w4xqGAc
zWfX-@n(|3py~o#WvtmFaoqRYqJkS?6oBoP-Z5VQMp(lvI@Wdv;8#1^qJ3jqM-won^
z6{1#oG8Hw+VsR;&y<+i_Xvf#4tldDfk8KbMlw+hWC|=iEm6OaE>dQsXrxJ8l+}j_2
z!}!BP7sd@`&T9IIL2;{1>WNk=A1W4()lvAHS&D*(*Ta;o`2;86j1r(&F*&~4o8+5q
zB#xkDVPCyIIR^g`jSD`PKagtg9KlUL5e`?6*aB%^^s~KE?a%T-lQTi>NR*8ACzlC8
z5)&c0u-6uGEWGa%ack%F#6wxhSWzM>m+-5b$&rQYAX30M<Ah~ElT70{0;=+!*e5b*
zOjIcVk7kD9aTZmG-6I!$>-+I?H^m`I9mw8EE$d<f>U#z?ZQv@FupH;MszCW&!Bo1Q
z=P<L;VX>>5b$f5;Un94BWc{Kh1zg00yYB%-M`-Q0_=Z#%c!LlW5*5$Mz_XvOX;)Ki
zeX^Pa5^|2iHsLjb9+Ckdd|liwVsX!B-gjb9&hiK!Du^D_pS}#{a}1J=>LS^d%OgD}
zGH^n4dQ@;OF1vE4p?#YS-*AdiI4P|)y1v!<B&^n}NbQ|pXvRJJ`{mH!p)1e9d;mFt
z3qHb>Ex~z@_<24%Y^huf86uJKvdVyuGnkG&Z@#hfk}Tmkwd=5=@%7QQzVyjB3j0_t
z%8Jkoc;eBQkTSUF^;337)}zBRABH5Y<9`lajt@g>mvlL}yx2T{i=s3p`t`!56yQtL
z@@}nNKj+e(3PCk=AS^>X4cO+fAs}PqC69-myTd>*C8*QGP^KrowIc{<;Oo9?UGSke
zV|!|B`*yfO>GD;X3;;J2$m>7JS*y1604V}(BDm0S>G%_d-5XzE(cRv@ZV9_RpzYO9
zZKdod)kG626~?&-cIQ8leiXUl&J*UD>*?1F$C(!mo}xk1p~B_Lt+p%GJS!(wO(Evd
zaAHD|wa#|DU}Xe|c#s>@N2nSIrt9PmH?q-)pb<P><ws?wb&Ey3l%~rwTM4zVY57xM
z=nda?QMJuoOjWUPN!%JET*N11dFA5tt^+eHWyEjhsE}pQb?;KCi-=uLTNs6flu<wG
zP0Zdv1ZPq{QG0G>Otbo_oh_DL+it}G{%t?z9L-m9`e7WWQm-rxa~hFdSiD~_bc$Wy
zO3}&t)KJEQ3tXbMqq%QyD$_ee<ZnD%2&PnV+2wp<(-z+h6Lu&u^=JO7X<fd{yqLhP
z&0!m|&U|I{g-bv{vgh$nf}%{<oklnfu6VuaQ@BBTAB&QmAG>!Z#_Z`Un3XFP>G;JI
zYvq;A_A~bK<+7^R7aml0l`8FC3sH3KVK&uo?76WrMrrTP+6*9oqMD-`JsmT5Nh~Gg
z0&?5Pk8W+-=x1MLvxl^i3BS)14l&%)X@h8{IWp-e;<>lS&jrn)Ot<x@IvFpd#dhv7
zyUOT7S$RfnLc85|C69Pk#cD#WBFmka&e%&9vRfIJ^RiJiDRkTkaZw1#@=vD<JC4AX
zchJ!ypftPzkGQ3C`~@`P2V|!MXa?m8dOf);0upG9f-JX!Ziz1?;S!HB$**;c=CJrQ
zu8<;7oM5}tLV_Ub!^LDlM&GK81_>MW7R6(qX~&H<S#OV@sQfSo(YKt@&rr{o4=%s(
zWqc&Vl*q2%&~$p-KEl)idjafp8Jl-k&?Q;B$p2|F;e_c^^VY<TXnCpfSLxN7sZ1xU
zXVlI;{(PWm-Lbq?q`+A$=mS|WqF64Zk2CR6>>#vitR2X(?7MFgk4eN5hVH2n1f6D~
zAN}x#D7Mq%g7qb;(-U+S4%oQ_7~eF*H%*J7M5~LYeMBvVDYx%w2Cu}sutDxd`Mj9G
z50A&}$dCBDkin1PjWe($rnMwiq^v;5LrpIyIi5L=D=A%UFJW3L%u7$XR9MX91`eze
zn8!!XE7*uGCXSed!3-5T9IqGiVI5q(WVga$OJ-a$I#rli)J1vPLJXn{;N~6}*{MyT
zm1Dv3uAR;*%~R^ZM}B9~qGUCiKzyaw8mvC{$jTdRC+puWHg174xX&$i(HkY2YdyMp
z;!4e3Awhy6hBHM`Co(VS({$bD-y>z+M2E1a``u=Xu}qD#A$rQbXKn_^qhWn#9;7|^
z{{B+Y>wBhUW49hXW81}cum}2me7YXDyZ*!~<MYSqK=v=2Z!$8zY`<+{-`m~zu4&=X
zq5;HaDj+rpg7_pF$TXoss00b3O8B8^F^!|a3KOb_H7)wJYczsG#QU0-numD-0-uHA
z9am7h2S)`qm>f~n%CN6#1=H{Zcs9m4s?*r1pftjDI63o-)n5;{i_r#A8j;zMG0?oG
zubb$gdV(ZRfe_lhE+=#HvkepR4&k>qfu$>UvVRr`wPQO;CMyzq#YM)Hu`3+*<W?6Q
zD*SZg`&tcP1c-XlG-gj6kfkZEL>(7vAFU)Y1JZkI%#6FZEq<Cs&aC#D^lf3=^jxQi
ztg$}xg>vp7Mcq5%;W=@4O2Wh$PqAo?<I&j3Kc(#iL`ddR$$bz2GhaXuJ7JKCVMpnh
z8$IY;C4e*>ah;q{L0#wbG^s*VT?~xnQ8Bc$L<O5*p81h5CC8i-%N*+THzh-SCtefz
z-Ww1iur>67T}qv%)mFwzGPL*G5jQ3g@@;cOb3)Z3uWwFYQuGhz#Z{w&8qTmUaqtWd
z7}F1B&Ts;3Qk+gpr*hIQ>ImD)cGB9B<(rIA+mBE>)y9(*Y(^hlHYpb;i%S=DUeq(N
z8%6j9QH76mQtR*8iMx{FDO4Ccx>ey3(JyLJh>U6<0kn`9Wvc3gndS6Sw1nbD<mTGY
zEt{E!P{z)UvzvO*yN@$f`PNplet>A7A&)byE=At|A|PxBk4(CXpAbjD+N$kh5*AXV
z#ga5UGbvkF;XB7GeiyG@kU2!_OaOj~-IEoE`{qztM*90l>z_aJnT&Z@nq!+|kFU|J
z5PA-yUUl8<jBORx9O-9EY=`5mB(g#z^;I*G1J6!)#!m>}y)Wt&euC8{i&)li7NU*{
z5v~Z2VRT5WoP6R2dB;g^Ap&OKSvQi5ERVLkfz+MajFzEAX0D3aJ!}<Oll(j~y%x#C
zHfq+dmS{t|=cE$c=oONE9OY-(;0Pi&M&K(6RU^f_ZFEtLtyB~6v^z`I)z5L7mXSPq
z+^-h44T<s7u${gv;lTD*!r6SCD#kaLklo=8_WyQGi}^{&M=b$aPg0j$=BL;436Fs*
zh$VFP@SfGyAceqE%Vv9116?{u+S*JKmnv0~Gi4y&ld8n>=oHA8Onio1>o9Ww%kzt&
zUH9{b!7gOiC>yY0is#=_+Hs^pM$od1y?0%&AkC@jPKU7OmJuRWW=Ku|kldZOTuv`s
zrCFn|y)!EsBBRlUeu*V~>@6B%ya{5l6hO+=4y+-p6#FWhH~6449)TPUGhhatE`KT_
zOXUVGG(cO4DBCO13ZE4{5vDTd8Rhsw{S7~7Sg-%8*X@-w_R<ywMcN?m^mw~@ex^st
zw&^|*GUqrY&nPI&&7`F5%q}rLgXzw_TQRSiA?ZY2?)JQowbN0hx+@`nU)akzLHhB^
z9^)jEww;1P2%W-E3x21;$mUgEfIs>6{J`W}15|@t8fl<-k7zFBZJn?ZSIn927c6ds
zJ|+3=wT)fJ)*F3?kQ!{k&0xk+4wN<OE@{<At;ZLs-rfvWBe}pBE@Yb#YrHb^gxS4K
za<x26B~61a+C!u9Ek{5I=sZc#8S)vrxKG0JL6Gsp);`@<zpk;nTygx}FJ{o;DlZ<B
zsqU4{f0)@B%CO?b8WVIpS8=}Tar9XTVHX_`L2hRi46Ox+sh|d&1M%%>PTK74&agSO
zFh<+Zl(jHA;IWk<b{r7w4l`5w;sC<3eLkzlhCbVd3uW+vXc$0+eL~_v<1oXv2M)qF
zFy=xHFrK%e39{jMKf?&idIDDaERaPb@4*4UwKP7!|4@nrbFHCOI96v?+YP}^So%l_
ze41f)^b8K*qU{~n-c{W>eV>NbXa{V&$_HV4?+P@<;u8e1XM50h;}Q5n$O(ZgYMivq
zsvo$pQy*>U{Zv28suF%iu${D_iN<3YgnR~<(xMDVva`r*tpS2!&sN}=UCuQi;$6{w
z8j;pl>5ymP(GX_C7sFXICuiQtX3fYOk@RxWc)QXZeYbwYogfblQZRX0Bl@fvj<KeC
zW-rM_B>7B0m1EnGWb-ZCd(mf!!|cbY*6@QEJw=HKY>94Si5N;}HV5eTJPqj3Gpk;=
zK*h%IDJZ8_$#-guNccQfHgC~y+`_!Kneckcm=5`3HnQIB_F+Am&4Zk=JcccIh!!+5
zO;$eRhI`nA18qYuz=;N{y_GM0|6YRYyy~l6RnE8Q*>G}}_tB)AEp&7UJa$Sp0lc@(
zs<b<JGqoIC5x2NJ2e@WhSOoB(bgdwQY%Zp<Ss(%mGi0!m;>%NEI92hyL3K9QdSS(y
za*lJYxtU#NkYbgS`C}$68#NDa9Q)}Qy7DZtrTbfPw;(I<sX`UD<`#a07pDa^$CwJ;
z9Op|m3YJAT_V;h;nmL6OJV@)PpiV=aPAB+2<9!@OQ#!}IT;X8eQ=t<6jF^HVpvT{_
zYD==^S<|3xR(+^w$C_EV-htjxP56~h8H!KM&Co+_C|5Wj0;($*yp?FtIj9%cT-FN8
zm3a9C(DN45(vyt$0qu4yV1wew6|W;lD7jBlujX2l<&1J2saW@u=Fl`e(6sO-`A}2s
zZtM;y2>S_=LTgF~n|)1-=>a*u+S|AhDs>97(eIj;D^_Z6l)ZP95p7KJ|FL(UUrnv+
z{_qnLAfYDoPADS1H|f0y2nZrlq$q+&6-7jlgdXWddI?oPs`TCwklwoiR6wa>K>>LJ
zuC=y%t+ju9pYxojyf}Zr9AnNg$90eIJ?C}ZA7dMujEL#EF``!YFGW8!t?`q7!xOOo
zoPU<E&@c~SB`Z<fR8jQOkq|E{rRa?<CXX$mayFr@isgRnEJS%rrSucG{}T5OSlRGQ
z(`u)#haH|=_n?sdUDKKsks@S&U7)0{gVVI`ZMx~P+KjNu!D#B+-sCDFZn5#+|EX!A
zz7XlJR*9WyTBxmwm{Uz_zG6Nj;#AXeG*o9LQ)qNUyu)c)RiAX@5L!l3-}H%GaP(Zn
z+Yw_WVzKp)f^+N6c$s?2wBnNt;?vfbRr*|3z1qo&;M1b_*sBbwhlkiWgc&qG5@{K4
z>WWKh8X6v>44LmEz9_Tw?9y1qQ?gz`tZdEoF4It5GCoEbQ%5poqps`#XMNz)oBF)_
z<XZPd82}$C_&#5bK+TvAy-6}A3N>JhrMluyx~(+H8oVX`Xitt&NZ}*`#kyVkK9Y^D
zXj|tk<%*jCv%bWYW40w;quFiLTtc~CToh~7ecAh!9K=TS>7OOOB3T_I^gn-^IGA7v
zSk^bxhr1|KzZ*3;r$W^z!W!+qJ%?dcpuT*pd|CFc^@kE`a>-dw+}o=#G8eI(-y`B?
z<Bj|HN!0U(Z1ucL3CVY5cGYF3ugjn65L7ZQHyJ(2StMBtB8VYy)1b-S(7~JT&a5yK
zgzgZT4BP8$Quz>(FXESpzU-Kl0Z5P)yD}y>@(?`Af~47(X>H2pLS5h76PR9^Fs&7v
zOS{Xm_Vl`r0F`mO)37IHK_nBW(R4WQhl&l&&=)QqcFMB04GabS2|Cg~bCT6zM@^R8
z^@E<P(3cY~PxcHw&95dl`w_(NYN+TQxIpn{k&<6VqFEu!+YlRpL(iE~C3vKe+gA*n
zdXGp6ZmJ%K5R~$mzU$h&JS!?`ORo<<sQF5CMYHS*%RGXrV8<Qp?Ba@YXSN}^f|{qY
zA=z2h<XN5q8&l0se)eC6@!%@%p400R5<D9kmn=%rI2bn@Lz^-+``(4urJURC8~tB>
zu5et0+WPWj`+jBf4TD*)*7{1|Jr?pe67pyLSj+kTD)~8o7OF0v3;whQm-U{OdHXr*
z6uzLm&gLQooc)4ec(+G%MBX<cM(PqlTp)x(IirAAmQ+v%Cw!)TF70GmQLw4<fQqdE
z<)j(^c1L%;FD6OBt|Tf}G$9@bcJwiV9uY)GwZQ>(FICuH^IyWntzN8hP)yP<n%0cb
zLHiRU)gxZ^FsLmnLkxRO(vwa)<dDR4lfXIHknDL|Yr+>0KPr;Tu?XoXA2var?wQD)
zHH&#`8Wj|ADdznpya+zq2&f916pD5ZNpw&Pk&i?aw0+*Di+#IhVHtJxp|f*g8`;z@
z-4`S=6YA{<@b#FICR-J$xF~Z}7D*`*b_vG91SGMJil84`j!&X}W5e3^ag{4_-$#fv
zLE=VE76}fo61)(H?;mwVGB)m-7gzGTlccAxr8<&}QQ}{bU$}7>DA~p6Ew^Dv0*#3x
zvsmMuX$q{l3fm}2#Uk^{NV}Y)^~o8f%ly~Km|=pXk;|KHND3A56diIhW*}AJ)nt&2
zd(te0eEs}8JtDXJCnG4<n)qoGAu5xdIq{))3{hU~h%`TPvKzCkAD3w$Y_B7;(&M7`
zTTF<qx3e<MvJSaG32R7U3@p~kU&2i>cTyZ7-#0s6%r6L2y+M7U8e(MF&8-*`zUm6)
zk)eK=!fIS^dSiChpKMviCYpXHeKfMb&@68_5~OYPV9|g@JeFd?z{xqK_`*Aj_SmR0
z<W&9_?qy8a`Gh^WZ$$lAns<?)lX^^INW@nzlf`?6@KVg@k!z6io;2&E1Z7xkMoAG+
zmU48Ls7dcRzJJNrwvu5SrG+ByX(*O@WYsG@yNOxQ5c=}Ng{DpKv&;j$AZOdwhur%m
zq=HdQ?}pyk;wUXPUY)B5ho~P~4NIk%8I|fecE%Molg)#yRW6$F3+DAX8ZqOE0e!;k
z8He>@m)K$%8w}mp4{BM9AJsR`H~#-a)ADg%P=1N8^77FFtGCZfKc?QGg_mfbm#771
zucqFZh2FTPzT+(Vl=i;lw7$%y{z9ML2#Y@7qy7-N{%1bDjcKncnO-F>47@xVcyRQp
z_Ncc{ZeWpVFo0=jUT!eXXRw=TU{!8-!(!;Q+~BNS-y&OoDsUuop?^(oWUXmrZ(%5J
zVFZ3WdfYVpIc<=(x!1i(LP=?yww?8+(zvn`!I2GIff;Pj&Z=bzJ!&V>YNj7UO$@fN
z#v>=jfz(<!J_|=u`A#S<P8c3fNHvcuT25;>Pb<n#UOgViSy?AHe5dXlkGopVsHe~P
zS&kbW&j!d(=cP{<GJ_-2CoPZ1aom<-`jj*Cyt3uIMDxt^^tmkg`3IJZ^^5ay%nK5h
z3#p3>?#zqJ%@c2rr)?}>E4Q(x$uDX9&TK4B$5@V!XVEA4E=c%d2N$v9i;G`<=O};7
zGqb!dvwTh7f{i$SJ#2}Ew!A){@%kzA8)_CX-St&P`IWN8H<m2pV$5J$1o;FCVym=<
zR$>-aUc0YAIkCKUqm6iijXYR^Ce3Eub%{85iQebOnybRvgO;@rg>}CS$chrP8-Oqr
z1D^mAhbnDWC^4%kZ+2g&a{IAa-2xxVfVj2OFZ}qh+O~C)-o81E<Fg)bzFOKEU)rk9
z_|VL<Ih?V%!?HDbeRFncYx(;2Bx-wjX`9h%2aUlAT6>i^aZ3SrH2u!-($4gC=D8o6
z^sGC~t=ptlyXRX!%Ab4$vJy(3Y|5VOE<XO;o$-lM@zVzuT85Lo?(1LhGrzo2*tN<0
z=y$U3ZuQAoaa*VLD;n`p$Le!L>u0gdgNI9-em~w<w7mCI*a&G^kNUBe&PJ1PojK*l
zTCLTZ>*Mu@OKWV8-(6E3pH%*__FvSrG$Ig62ZxY<uW7w-qPdeZ@=uzU^UUa<G%ft!
zG_8B!tW!-(&9)#6bgF3~nqcDdhNqgA``>F?j(=!cWH?Rhhua^TmJ|4&G_B@eG%eEK
zG_CGDL7b+gVcfM|d`%mtX+17z`(4vQ!~f8<a(-%B@5fZmG_9)LpPH8K(dXDxO=}d7
zOnHk|mBN(!Uus%MfIl=XU<dhi=^Q+o-!v^eJeo623o)>U{|`;;{yT9zf4C(QhKRlX
z>0sK^jed_k;F3zcO@bMhS|A1OW9XTt^-hQ01<iHME9-5y*}~10Afj_=bva6XRN3G-
zk-KXo7A#XwbCljeCsu_Xr@Y0FC_fj+3V&Z1#~`I$AbcHa*q>xctXL2i=>5(j@m9e#
z7L!|rXPQ<-p<zlvsi>U^zfa+fND^<9)_JM-N4B@wc){Fu7V_RU!SoT}{zaeEWHG0T
z2yVi8q1L1ui)IgRos2V;U<mkV$x>xxSPIG_br=haGQv(ZE!kMv?G|F8`j6KM@a}>x
zfc$+#kk({R8lK>(umC74>>ZMkFioyuwnt_x4|}qP+Mz-g)?8{S9%gLkoSwYNO#FD^
zO@62?u)}IULpP~@vvdHbY3)o6u#2Xtdklhe!uQp04N67RpNm)Oiu^G~WQ&R?ph>yF
zDb`2YX<uy}Tzc_Ad{--CWrV2YdVI94==+<hFZ}%27Sn6L^BAg7{CGR?#fZ0+<iWz-
z;l*)wi2%U$CGX5x&)3uv=?0RO>^CDzDX6bUFN4@FMXwN3uiy*v6RbaYt8u}Da52So
z=;7LV2@eyJ2W=;!mp1Y<706yElns4Xs&gY%fo4}-I#lns*?PF$u+wrk0|8c+dEb#(
z>b=!dnXboI^5%ihKKZB*<Ib4A{&8Z<RZ*WWg#pnE0jqX#x}vKQ`j3Ctv|Py!Rw~K;
zjy{&{{5bmZTFCGCU}w1X+wxa(MSnoF&v#W;=QLE}#d~Vd?Sc#tD@3{X4G%&4c*d^3
zFd4o#8+TWX&dA3+Wiqmt0mLLW?plzJhR|Ik@`8?xsB$3n3t<Od(=h`5nU2UN;b2k~
zHiDQ6At80QP&IzrD?aw^oV?{6!^sgHwgzN3oq+W8B$oC!_q(_+RXovcvUPgFt<Eb5
zcfDS9LPA$79f=UGxMBs4qKOgd;j$f#u;EW<*z3^{8-quz0@xwh_FYOuccX=X%n;tB
zuFZDCh(5O-QeqEbF7_8uPpxw~?6eZJR-9wQK8>E^$<ZdtE{%)u;j~fd>$~XLML*Pb
zlS?&3>+)lY*m9;k-qo@Ge#~93@^vjS2z0=jh>}yR^Ex{vnq*9XhajIshkq^?$K-l=
z^)bB^P5l;cpTdzcPIX<PY~y0SLtN_IAs0($eZ2dR($tRUUChN$JeJtE$s36C5>Fov
zJyh{Xr@41t?(GE{?>VtYMDgvy<WEM}YVcfNIyr1ayKBNQ``knyApFtF-8WP|@l#4%
zR6ij{j|RI`aWD(?YYL?p-qfhdRl9Ioi_tq|1l_|Us8@)u$vav;F_9%=x1yW+Vw}_E
z9vmuAWcWa;Qd`Ej;3@yh2PW}U^=g;z=}0WHr}qzJ(x?~d`q*FLp$8YMQ1e)Hr(S*T
zJ^9S>DYsqT`>V9{0kpOr&*2~5o2M2{6--SQTjAfaSne7NtNL90l7HQhJj}GdK8M4%
z<UP$)-Bh?7CAb91Ez5XlDyKoi5m!<y&KTA(aI2a-y_(-a|NLA9SzcA9yff>|iZU+(
z6ZYcf&8tR@*XBR>R@SKVImzOUOm0tAIefOWjS924KO0eAT8-e}c8D|`NMNf76@YjX
zpUka!ayE=xYTY09U+i&Av>IFNeIQG*)DoH4_^#T;`}LgB_WkL`ZRhQcDf8<QX<r+@
z$TN$s;4BLNuT_rVn|H~>u_A@2)?;-p>VO{I^g<4L=2?}1=5N+=7n3>=<-0-0sml;^
zPIAi9-4JCtGRT@CJLkLd5Pe<k&1$<+n6fo`(R(Gj$g7hp*gf26VBi}?R}WQ>hy%3)
z7R>jsk0K>m&v#)+_L3$$WK)Y)6k<2Ac()&3C<-Y(TKeH~p%%I)npEl2AYw!>WUo=V
z!R}ods$0{!YQP&lxnL)GV|LI}PA82`)Sh_0zN{C3QcezESKIID^I^Gut~NSS@MPow
z(Z2!NWk`RAP%;}sm3-PENPnxT={-iU_bE@rQpV6@jxC=+BL3v??Y%cP-Oy1^R>l&?
z%e1+Z1&<wc8xeQRIJ&0vJ)N`2OV)4lrHX`aecn~kT(NnHpcxEpFG<&v<I*@p5arZV
zhiy4IOnc8wwn)}=3pl%`GETBt-jII2dF@?>`TVMhRGrA;whs$<3HJ1X-|L!9B=G|8
zU{8(T6?)JYvYUEz;?ffEQa6<F!ZP{Q8y)+6dzIp8D}=RPUClY}k($Zq_XmX>!z-=<
z4?eE&rPcL{>D`U{TEM~MD%?gGxu3R{i)9bt*l1e~k}Dq@v+=AMwt1zSwHkJkDOCG*
zI8NbSzSLsTQ!nq4oTa%!^Uq{Yxd})1VZ^krQ&%)kWTwJg?v*~0->@m$opIiVr@!*u
zmRx=~p68Xo_j-Bj!SH6{%Zdjjd}BM_YlpA)T<qEyf9%4mh3A+f4_XPY?@l-!WqkAT
zXt?uupR3|<g7(`%=T*^9@~rZ2lT$vAQ;I{fjeWbdg+5-aVHr<eYua+&c{u&y@z>up
zEx(t?U%G@IZwEvjy*bmg6yon#9j&h(9SoJVd_L8*zOsBD+i7`GSa!S{cB*OldDQP5
ze-fiVdgt1D_?p~rGso)qlcMn9YShUQPSeuM^gBL@GX46}52SU1#A#Y<Qa*qJBox;=
zvyLQ(pvc$#h_z516G(U{ioO8#P6|c6j`F{UV&wMc(DLt_MzMzat5W%&>-85{_diZV
z@^A;VSNRJ$1W1Jj4ATaP^#-7f11>-UmAM0T?)%F-1ZM09s1^k3)CH=01?p=_Y4-*i
zX$1+b2O5M132_8n=?$_>LS0P?vgs8xUk|c#2nIodZ3}|eRD$i-gI#AH->wVxaNu=@
zge->;!ePKW(eeqHkZZznv@jr5IcdQSAlw@GfEy*N6%sKc>RAvvlXyyLsYjntT3Ec!
zpOluHOu`5n1Va;YheU=xp~XYznfk_=o}d$F(5c*V=@0<gL55uko!k2a?DeE@J&fYT
zlg3`3QU`QrB|$|mx_*WvuadN?AgrU#ulXQse1@?d649p_US5FiTSxogC@pOGG+jiv
zR>WIrt|{)ww#0~@&~Ti=1%LtbZUE!g(HlvAV-Atu*6G$AqMB<XJ3PYY*CXq3l$KK1
z=b5P8kf`sy(dhOlXyK!iP#GXkSb=I-vMKnb7N8yyvr`*Q3XL`2i)Mc4P4Q5MDmk2H
z1WgP(rL>5V(VW*Fv(m>(XuBa0aa;DW`2n%p>$u;N==5HY@VD>_Jdee1$7yd+a@>yB
ztBuPWkE4MCa1&=kbi``2C-JKx@fZ7^%7(;U<9V!qfz0rsO!_)-Pzy~aOlAsAn5%ti
z2~8Alk9Xd1v(-+>zmc$tJ*Bjey$Sao`nu952HfVdf+kI`J)y$lh1Dl5(M7}Ck|HjU
zJ*+2vdQHafVbaj~q`<ypUXjFPv}37O)F+29;DwZUx~PX}nIve+tJ>srXzIDW<dQ!7
zIB7sFIu*|#MH!u1t9?dkA@Dj@0kztxgI`lB3e(zcl3s444JW6)Dom^VmNt1ic$6o-
zTswWLFa1hr`fOkF{A~JaVc=_MMgUL7o5G9>4jF6E#Etrly$%1ZjSLHD=0|iUhgRn2
z<oK`2nI~w}Vc$un#6~8-5tFYK2`a+y7-9(DV~);ai2I{SzhkHw{NTJ<-?Xx5`m>ml
zF!V&(1G8BiGC_0<+2eItoJHBFZ&~M4vUnP@Mf!cX-e(s=azvlxv}@)_ybqO1$x-Zo
zB-@{JZ#_rJG56W|T-AnPb?;m~qJWELIlAw2jo!Oy6Xn@(=NT8}72L|Z`XuODL!Ql(
zTbA$h^db4SPx8-e<l8w0+Nb2ZI$GW7&zD=zcXNCeaqgK1Z$P-`GvD_<FY})fr<^Z+
z_bjO4Q8T9+sz3ALWsl(Z1x2(*YIy}m^#(#;3KEMRIZhD8^=F1rgOZ4fN)w-@y+=K?
zEzEjS#6)YPt#MK`3zZQm_bTLlE_0w$VwOqlSyWl{+{MJYX0A}Y_Idl0TRIa;EoPZz
zM2|X(iihkhdipaxL3j}j#pB+(^3{byGMEu>$BF(DhWnb+Pf9?JT2mSYi!voKSD!Bz
zVYUG!UX}P)2#NQ2%l=bM>rVMo?4_yhqW3Zw9HrIbAw~bZ;@@jphZUk2g6@kI=iif+
zxK&(itCat6rfJPrwyA^F?^K;?T8&C7ud4JuR4MCJY4cTIOcm0<b5ecvu+mVr+Wb)2
z^h34&^J)v(YMsMsyAPE%d^N^*YVI6XT2zYMPCccxoEmFf4nb~VRd=7`S)EZ@8{U;D
zzEeu;={xG~RoEfA&R{fKzM?KXmHN3FJh+jXCQRz4i6e0?b;2vV;{1Al;)V+%V(Evl
zrwIk@eezUUb%nC<EuQ+I!}Of6`uH#PPaCaspTqKBQK!i^;$<~v5jRP;HzG|MEk@z<
z1aQ^~>ZnH87Efc<m8L5qO?iyXsgD{f4;vdFHBVe=ZvW6MB+|T)DulMt>YazNg6m=!
zg(<U|rXJOI$+m2VH9}*Wuftoa7+b$IHh-FLe*K}9-~FT&V%U1!u!S7e0`_TwySLRG
zwvdXnnZnx+9yNr*+gs*aKQ>+?Kf-;AqM(+8F)UEy55S1S+dh1NaSpWYr`CUa-b~8h
zM!V3lPuwBWWFj`uF6BhQ;?!xu)?qPL{3f-H<ERtIhtmvns5Q0n$+d^Mx5}n<D8B8I
z=I>^Mw;MK5%R9kvjuzKuCnCB<YqO(~p!1qx_l@FKQm1Y@r!F12Zf6S$J*S>?PAzy@
z-A_>6_=Yd-`8(Z7+O^Y|d`No6V|w)EdR_Rt$IW}MGIfDsUV1k5f=7G3NxG2>FCBFI
ztbJ&lHt7;l`+_(7c-kA$1D#<^eUSs*_vE@FP$#{K7JdE${Yk}rQSE&dM}5_s<Y`C!
zY-w$IO?2`Duc&;QvvFGd5hG2QQ<Kd=P4R$hleOjmWAHs1D<*pUqgQCut05BlN`5xU
z4~z><1Fw(Zef(@A{DXDC!NPFHxdp}*lA$dh(<KrnjL}fN@=$j%!OQT0?c!l7zF|1t
z@FB?vP~d+xt^d`uu9d$1|3cG}{I6?TL;r0`i=LSU@vk&3QE_S6|F=LbUB@(>sr3`o
zGIY)Sld1JrP;2-vpw^b37*5mr&nc}0G;$JcvV&H`fm$iy0Xq>o(~<uHs1<MW-v_mF
zT>b=V{jH|;lhWFM?)`sL)B5ternT0L*=$a$Y#Co~`5RE{eb@7^U0D@9Iqf~;vpw~H
z(X=Z5y{0u@|0hjrZ>sa#blcWU|Hqk^-)B1q<~nERUw@qc8%pcj|592y8M^f^-o8o_
zyR$S<U%57nQ4M3!YpB{7FEDz3eXybW!*uzLR~dSZHCyv_9v_wl8*6u7w*?ThUTUh_
zTkVbGvl?ou-(MTa(aF5j-0=CsOy!-|L(Pp}cd(sdC#?D{P2cv{$Ddmbw=^GqZJa(%
z(Qj=zKK!)&;q`DUXA#w(C@mK%+;}cvs1h4UWg-ougWZzG1k!k}XFaCFGgYPdNojGR
zR4L^CLTTNA;V7*e6u(efG&o929lXp*E;sQDrFD~1d7|8o(i*v}0sk|l^%O^G3I0ZD
z>A?-YY^V^4o>E$(xmX;fwbULhy%H}zC{A}<EJA^OQcN$0pn9K}_aBs&Hh3>g=~k{1
zj?&tV{wGRHIoCQ|t15RSQ27BQ2}f!9#^TXICp})C&yftfMS-KV$jBvsto$>j^@$j1
zx4>ox`$=iJtZX)#%%Kg7d0^%+-Upm`I7(~bBaYI#6o(dx;KUt}pWL<I$DC?Vq|ddj
z5dK6uW&vKJxM%DWCXzfOYfxHlO!5jxX&v^J{3xbGGy3hSz*@ey_-JzV{J3bqzWjY(
zhg1$5pwCs{5EqJ=>Sd}_`p&;lp)_@qLZBm}hz};lCpE?+R)0om-F(5XfHxTj<*!<(
z;A?W&uZ8k&34hY&9F<cmdx@vVhTz3J$7W6cL+ykeBdM1=az<(0A^J0=)e!S_DOijQ
z^Tv}fv{o^l&|zPxIUlCRK0v}rh8hjdIHR->0zYoXo>E%AXOxyT=>dejLGk2xX<Z7B
z>mQU>1|E5`wD<$%T0sARpXmAxJqo?zeJfI5P?9$14=_vDPfCktp(1iIf$$YbtSA4J
z(o+3}(pt#IQCb;il$J0^sX+KQN((|*XuepHWFy6Lpo${dWEt|ZCTU&%XG$xjM+Waf
zh-)!ONnm`wEIQF&^k%lv0I{w2NfiRY4a;?=rh+vv+?Dr-M0ua=6Dm0D{Yy%V53ZA<
zQChSXr5NG#<O+C%P<>k1PfmpLL~M%U1V?G<s>0%Reo|WbKPfE+Hkj`0CDO$C^ob+o
z>Y=St%PyTiQ(E*|p|tfyC<ItV4VdoCribJGE*k`xO#v7_wEaeD3E}@vX+^W+|4wP;
zWB(PUmD4#}1;qS8X+b0YOlj%<4W%WDUzHPpbo>XU<&qVpk&C0WbpK3gas8FjO2$!I
zPIyWyp#_RuMN!xLeo|WgI7;h>N&pAn64SX9=o4GWwGR%;6u(niU{#G(!yfzZs+T6k
zas!>#aFkZr@01pOIR7I&|C_RDiD#6S=r5F(&R;358w_E@BeJAK7(qSq@+vBR<Svj{
z^;r3m-0zgu#lKKm41qXGD*;DorHS;a*B7%yl9hCs2Y6v|lvdHNlvc7sm(+J2MCZ^A
z$_H-As^1MU+1fBAy`Pj8)zP0QEm~fGES}WNmIt_Rl9k})AC#6kAlTP;`f8GGu%P8B
zr3Iq-6Q!lFcb+yLrAqUOPySm1lxOcZN^9c}N((H4&q9?2y(fKTeS0lRug*Z*WrkVf
zy)uvg!6rwp8;H^4eno)WWG}5?ubhDfjGggKA5l9YtdOspo4l(Zzg@Ji$p<F8p*lbp
zSCLY!8lnO}rL=mxsQM9+u5}NU^!}F8$`lTu>Bj_H6$g-|5RW{6{1MIhCrS%XRdxYz
z0VuIdGxaN_1tWW>+>cj}{RgGhO(Kn>w0v=t)-jO!S4!*qUnniQ)p;ygtw?n5*4@;@
zh4o9d4by|$o{fi#yPhVBPb}cRBl8I3$l4bC_rY9NoEJZ2Lzu^i4P$Rp34G|S)p+L|
z^Jr&c38o0?<iXnu-8oz_oZUKq`B}_QN=u9Al+tSZjnYcNQCf7JrBM3B=rw7CDC0de
z1?oA{DRM7^@hzk0A&%1e7$#eX3THVF5eqMs^X0@*TG>G&KDtjHFSOfgnWsxmEmu;7
zc9OcZg^0L}?x>X;@*O(>$qoLQ((+l!mpka{BU#~mGQ+&%eYI|wP(S{eIhaObri&{f
z=^kp6pCWe`%bdT9qqN?WiQ*`&$A$!=cSo)oVeqX2l>VT!9_|wRVooWo`;<coXOz~I
zLBQ{nmfTNDi?-^olvYu2)7+%?0e0+Oa_dFkT@1-h|J)Phe4!bh32Wvm>|ZFYM7I8Y
zH&uG+p$C^wDXr-<O3UDk(()h-+9#cR`WvOigQK)o3Fh2X9J;9=gAmp@N-F?_M*a<@
zg~s9)oKafJZog4l$s_Eegs4RowYWsQbxN?DwN#@=K$)sgDopy2{q7<Kzc!ZO7>lR<
zU#GM(F*j2&q`k2y3m~cA@08XELhjp`>KkKui)a2kMpx@kR+W#Hi0_TCM|Y?Mhl<$&
zu1(&Mm0u?pq2_C);9FO@uy_|OPsP{!k@d$rw0>RiYBqk1fldxB)H{I3+$)SXOS)F+
zjMC~kqqN}Q@}HDeA~>_0>>7^JdI2S*2$9-H{y>7%$L})+hj_1(`y^418~jdbb&(W&
zCG^{cjvxXpjKqCxO(G!=?%Lkt`4gqJc1mgS07!9^Rwj%uVVv)|v~T-m@?;#PbwDUZ
z1^$E5vUB76F8l}#49D;FSRKCxQ`f0dB^E@0VzA2N2ES8UMj-Aus3;QTcS>og62dAY
zgcGQbks#6N-zY6*1jyqPVXgsa!2h2pt#NCqLQr&Tw7l*{{0|s+W;EaNjDUBgD9;(C
zC1~&$N-N})(rO(6tN%f1?GhgdTc)oN3}DDz&@j2H590m*OliseN@;y04hUci@4DM%
z#O>M1Pxmnqqs>$MCrT^e?<g(*f1<R;4Fu=T!R1E4M#%q=(h?yBKY)L*4hxBqPuI%)
zF-!MxgTC~0#>q7dfj0({f+1?akj(LeR+NdT5#s>o=PNRq?1*&^S%xbzm8)prUC)}m
zbVlW5QnPH>9%e22P9-HNo-M%|LLNXt%9MhKbR%Q%CX=E@q`Hw2urnNMzzfbOExDhR
z7Lb(FG5Zw|v9_CQz>s%YCePR`&*Xb<>MohbH+qJbeiU%<|B2E{{EgD`!xE_9kWMxr
zxF^gPfe<$nCY{@bwgL#&_ermY@C2QB7u*aaPsKia#7pa8_6(5-{VSyv10X2Z^lY{E
zbVy-xnJX&g%|lu%q}zDWxIdHa2BF=E1+87x0R*iEr<7I<Mxu2jp$bQ7?Gh{FC@nMa
z%YKq$OnTGEZ<JQd2zaWEID!I<qqGEnp|tF<&tG|a*QzQ!cVtR7$XSDtd}1KcFT&k!
zQ3(U-=ae#ihUbuO`u(fVyF>+Z|Dd#R@g7HM0SE?X&nT@sB!X^yb_OMPMan-v^Sl0q
z*u@@po))SlZsnW9eNM;4zQO1|b-*oq6x~5-&vI_`$>b@ebqkyQohUEUI`09pQWQsN
z5kbg2=`Fcoughb=BBa(Kx4x<KmzR4M2#cWqEv3~?Lih1PI{NP^EuKFpEh2n1#=M>1
zDXmuAveX0mjQow#68t+#t93-|u~CidUR^UJ76g=rRy@<Gv$>$!D4BEfvayCMCz<?g
z?PFOcByrwyd1W4s(!vn50|;&blw8W29$=gF-xFnykhbsYwp){~VTo=5@E^ePLQiD#
zE;yPdX2o#FRe*p#76BeUgwea*V#)y010^o&tMb{es;wj{1aXv>IYHIGrL;anTjw>}
z`I=C~*9_mEQd(2O^0VHA{QaN^>yA+b=;S>?Irg!3bcg^9TJ=9iX+>BQ@L&9Ql-B4O
zrPTrYZcV~5PoYdiAonLqOX7^u5=2127h$bf6}`Id*}YsVk~|w9GPa{!yQUr<#~#7o
zDJ>-S+@e9JhYwlRFO*gUhT!TsvR0;n7{GwwpD3*WA{QmX?;8}y<ySS^U$x5(v^Wh=
z-5BU4834Q(V6@4kFeJBm-!~@GWPQ|}%T#yMsfX8xSk&N@(#pe8T4o>zC(?22vPA@_
z^cPC23P)+hKz%l8q4IFz<BQCOUGFVeHu?LjsL0-Y%8jw^L1tgnmoaw466o_n9)4~z
z@CWJrpDC^JwtODBSB4A|m*+?|e97jNCVt3~>ivn*awNU9!l_cy5ty27E<dssEid9b
zd25jA-%?stKPj!0Uns2?&`ktF?mwoq1pcQet$vdG@?C@{ny{zNR3?M)r!x1*4auuu
z;GdKh`d?96-h?#{Bz6V_jbjC$<tbO2Dc;J%J?%Zq|Dd$+2?%*$(-Diu?V5JG{{f}7
z2UY(IrBxtI>f`iW{>Ss$UnniX|B%wsBpm7&^{p(nyx^VpOfKzfLB5f9czkJpf0wlT
zG?Pd<)$#%!9DGV?J^Gc>y8An&^%eTTb{Wl5L4Hi}xP^k{j-TNdsN-KLtt7DZ@03>N
z$lY(Xenc@)(N_`GW8BFIXNg}aEf2zq*ngt5GLcq;@*8G+ai(GGxqRxf2Z@n_u&aEq
zYkccgI@=rf3H?V}i{~juGbrp+Yd~=5_mNA4Hl#tS3V%>q18z?r7*w09eyHANvBT=v
zY6TOzw+mR4Y(I%~?(&m)81lwtZ8o%annhUwzR0lL5ECX1UM8?UqqIc-Eu}S%-4+9W
z<XLVw!fX6o+N)c+BXE;+XyyiCcKE=$vh^DIbog>{`tH^!*sh$c9~9dW3WHhkiE$@d
z|4M0f{z7Seg>vh|tbd`js{WbM5=Gq9JEOD&ex<a0f1$Llol;t&XOxx%Que{fUns51
zXOxx^=z-f_utZ$8UC48lcIp3zD6I!x-#AQ1u*!i@YQdW`Bg?9x#GmQIOe?T5GCT{X
zloo3dLRs<}=e4mn+VRly`8NyQ=F$^H?1pl$jla`NyKsN|&FuIZZdx~p?3~#IdyAEV
z*yz8ev{3)ElopTIL0EjpeIm2{>(3A;KK5UlZdcmiD6J?HqMwwOOspbH+11*|%#S>`
z=IbqAQkOnG*j(+i6w2H>lK3=TXO+WcwRH5YtaKQd(#$ir$+b2x5NWbdo$R6alhXR2
zcMJ4}Y0KEWtoiHpFxQsp_l(1eApojqrMF~0gYpM&a)uQkvY&QUVRn~ym?(6__tdD2
z#48l*$QT9j|2ve{D(YWTTC%a;9+z^a7ApP~rKNHXU)cJT(h{XFAEA4ldrw13=qdd2
zr3X*!t1qcmYwPK~%~367tjq?rUe*_1ouDDV@^sQf$LET%g<V58segE%+9ki1zMJV5
zVZNcpdV_Mr{o*f+pSDW!#Oe0gYa36QI?-OlQCbShr8r9K_P?aGXrD4HtiQ}mgg8DU
z@q6+wDJ^$ZR{!s8cl4h`<mFMBIh;{iVehWRmWk894Up}Tgb4fNC@nQf<x@&aZ1v{F
zL9BA-?R@1cCdCfP8mugyE#eHBC>j})(r^v4+b0*3e_U`#tCZBrT&?Qy%+Re#y*CK3
zObrpdRT(R|p)xD>sI;oWEOkm^@zPI9tL(Puva@6xh}OrggIG$=?Z_+R#bzhtgCqA|
zjzpik{Z@>PIz4>TJ|07|Uwu?wDAFFgv8-cOH=37w=*~46J>%OPy&+|xScDeO`JK{o
zWsl=h6O5%16Xp36rIj9nqqK;h;wUY2$Qh-jh@-Tg-~K_Mb`bhpAobr+TJwSPUZ<4S
zImjuc^^8r}KTrsDeK}&EprFuUolp{Kn{l!tnAAe@c;wQkFoy8<Jyv*+P$17H1+?~t
z3RUyF$NWxNkCi0aOOYic_pGsa&9!J|vrg6?ZdH2Dafmag3i0?s5A!yH%zq+)M){P|
z+6&S0!6R8b>?|z?64)+}aNDd>kn&t<^MGV~o|_Bw@%l+=m7Y;rnR;z8YE^X6^eKN&
zX(jzZX*~f1TT%T^X`R0=4y4(4Yd^2B>|cqmOc0ZV$NzpW3?UqV$mI4vqqL6N@$F3G
z6)yh`rKKkhKo2P1&iPwP>*G&K%j<Vat5?ABC#BWn*51+&AQqqilPnRbe16>C#&t$%
z^|F4P@b}8aQCbLfF81W1%)k=gH=pte0_;cKFIPpMQd-#+3QEE*+01sA#icJ^rt&p*
zVplKRLO=~OnmUQ}ag-LtPf9CwH&jtA8AoZYlKEpfLBtdz{xEU>l{jTtGc38V!wpLE
zARc|uv7Ur&2TE6x5yr~zlb3Dc{y}L;;QvBtVL}6_Lzkn?!9Z5@DW&y|m<2~^l_zOf
z@3{|Uvw#c1*Fyellvb}>WTPaQ^`%DuV;3!$7Tg~99oR{gv=U5Jr9}Ezf>${Oi=(ut
z2}SFIPAM%~r7J}ox3?}4C75ke+>V}oTN+t2Z@GK1xIy9}Aw92cLSR=X>%lr9Irs_r
zClzqZs&oJS&PT63+$dWQCwCrK%!__k0n=hap<mkC{-Cs+fnclk-ds)w)gXOCb}M5q
zl1c6>=i^7t=^D?FTgu=lEn=vankr$sgPS9;7#qC1%pkfEBDq4mS}9!DJ!jE_>oG(@
zXn8=i5CHt*1e#bEM`_g{D4BGfvYAgQE%pw48U#uZ$c8tJhZlGM%^OE|Yw+3(j?xki
zX3qTFEo}moo!z8kepVl|Qr>n(Y02X#Et#K`mV1(}?4KzuWruirin~AFr@VHGzD4yL
zr9~G2EXPw%Kfq)2_aW1bPl-G?wvYb4`IbVtv(KnUm<ikVlhQIH;1Y%tk-ScxPC~>;
zBSeBNf1$MI@yMzaG$oFNag>$=?d|eTQQh27p|<4?&WoS2Z&ZEoAi1%yX00BmALFFk
zraZDHEcwE6i;yVXx{>V{N-O>!l-4C2r6mnO{!VEz!T_X70h5meN1yB6BosR_9Wewb
z;kpO`(lA>v#Iy~f0SNTS1p+|^N@yw|z$OHXx5nLrM}R~EbW_v<1!DvN$XgT<ZFnP*
z02s~#0SPBl6GOg{X&K`ekYfNUUr+rkBsvoWVFMuXEiOT*3)9{ThFpLl4A_aguuL?j
zD13l05~5qbrbsS>mT^Y{anKjrh^qv_?s6cg$%f!TD7DML0dDWS$Jzx3OzE*Rk^pAb
ztVR2%-O03_l(sn?B{Gk7vn>H_1RDf^PFWxzN$e4QI-&!_t^{UB95WdfoIFG$ut17$
zDx)4DN)lb}K%)52^>akZpu41`@v4n)p6zxoqgidv0RWVRRwzk~&0ANhoX?yTpXkyQ
z@D_*<)v9Xcw?{WU>s~ExGbPCnp<R96h%o}0eo|T_SY%&L0kW~mBNWstD{W7&<j}8R
z&j-ghMN#%4ag-LB1CG+F9+wRf0RYYwlqblB(EX&emgOni8zA#Ql0XIWg7Q+M7CYGx
z1)Ts7H-C^<8>M@LJEQ1&ShFJl$$WqZ=&d1ZD#uY;%vv=RJW>iC7iucoMEKwb95Hnq
zEj+|3>Tb$(U;r5yIVh%#paT$W=HvN@T`>p(tC5`a@pT@z%Q$ktXJlhubHq3(p#Z%~
z;{ny8#6U$76ge@9NDWT8(7eO}cQ)uy!%<ogd_WyikqPBW*FY~vNah7_cR<eQ#Hez_
zycUy@=8j45kg@krtKthD03qQRiSzt22rqTSi2S|h9Ud6KH^%0>9%@>jRJAQosy^Ze
zXq4)`P7N7V88ji}$rI^<LJ5*^NluM#8)CL%aH1q6<uVe4h;bP~)^f;4a=@cF;L-qq
zs~G$|0Kg?41B10uDl2n~0nXtJmT>~WACwkdFx`e)jt8DMQ?m`S**#4oHbBA|Q7^<D
zvpybkUmVVkqqOSl%{iq`)N?c+iO104C@n8}U-RmEV&HF-mIEG39o@4wLa93%ZC*Vw
zx|u+_W(qbH$UZ*fClDKdFs~axgHxVyCg^UiG5{H9nI!6903hQIwmI+*TEGX@A&pE4
z)O#h_r2$za-IQGyALB%ToIbcT5=Ut%V)~f9ke0i(B&U?tOTyhCqjKaarBxMRiD<Me
z2nN*wObh}EO=WZq&L}PP@08Y22MpBoM2_%0$*T(fS02c~sQ?g|8_<!O?*VHG5AT!V
z?UTv^X`+d2F~3t<9Wqs7nrILJzqfi5gv3)q5rSm_)|%NqG9_|2N-G?YOB@98Y5;l-
z+8Mlv<%7qX4^eD1+&c;`1p&a^Kwh7Qat?TUn#KkQ2c96E0)j(80FZFSC5%j2SotM`
zp%*!l>U79wl?`;-L(e+f91ULJAp`iDaFiCHDsJf6^Gn_wjlcuElYjvzx55<3U^fRX
zFFVBfAlN@CL{I5_26x~st-(Z#L43U|YC6Dqx{DLzbzD_J(l;rr5Qdc32>du=Y>*OM
zg~9jYV<=2zm{Gx$@`MgaqgcLR%5MZFyM|O1`0$7rS_!z-h%$Z5C?yZUxu8H2ZUD=c
z0i0rxe=pDaTaW-RL>QJhxdG)nxJ>$%I4O6`<QqXPpUMdoBoOfeU$-21cvve7Mv@pP
zij|BJ3?_48AjUXEOAF5r1A=a$?_dK&BIL-L$H{H+sUu=`9C_G<k#Jap--los2SfE^
z1Ycg90zR#uL0<*{-$L5Bm3v(GZRQV|NtugRt~6uxeB)e4{6$Se)Itf3LjyGqprRPg
z%jd?`oF|o1gsmeuY?!Bj-dEJL!CBm8*SCm`B&K-S0tvj3r-;@y6d`76S~sigm5J`T
zSc)@5i=F!AZRb-&OEKv;M2keY@%E=6x^g6OIm&kT4ADXc@b-?H83V|Xh7NWVHzS?{
z@0eH#%pBto4<$fZr4m>eZ~`b-mc2QCa1DS@2PmF^<72fb(MaG(GtdzUI+)^>280eG
zC7>uErXFr2S~5TAF@qoKj3nC~j$@R!;zk0oS1GSuC>XyOY#AFMPwERBPtY<;j}{49
z46_%QV@Cx7wG{3b&rm#^_#raOqYeiHW+^tRsYGX8CojpIi=)F_%IXXZu`|}CtAJz1
zZIS}bW$TytDnS4<N;n~c8vrUdDzu~28YN(H0J_FNWweA-*FzF~%$h>ybW4KYnd1x=
zptEqJOlKfCqTJ3D2=PKf%T0=^&E9pIslCyq91W&+IGvUdVGMvG11L<9(B2vw?3ttG
zVMyL<c|ufPJ##LG4g(NcHKVM+C-(wCl8~^^L1mxu*Wb=VlK@0?wbV%f8xMadT?MZf
zu8II`>Tu~K01XLH8pm=K2hUmp$m#ldlaPei8Av5Q-y=Zwq;|rVG*Ry&M7VZU9$CN#
zPw!Hqy!MKDq%4jRK$FwZl=pfe2oQVDA3)dDHW`y6A0aEfkYsI^)+_#UlDPMZG3$*B
zPbYOYKV1TZqA~(x(2QN9^6(dxGalSiV>m|((BxqXq)Lzmj|AIc8lrHH)+d~!rI*<V
zcowG*;l{1=*IRLo`L}e4yk-FyTXQTRlNmYO*d97qR%RJYhjX;JZHW|OL>pyK(0s@^
z`Fd^_0NJBDyrlZLYWy~HK<1+DkpR3o_d;gn6xFEB2NLtPFr?FJ8&DWPxf^%x)+;0A
zaGWI)chHXPJ3WeP$kq~T;vplcKCC}BMc^F7xS(V^3;za|=kiF%`67WYciAr}+qoOq
z`6Gkoc=cj2fz~5v>4#zOib`QE<BT<+-c2wiiz*uvfZX&IaY3+=G=R3$j81Zq?l$tL
zqs1KD>^Nhp$c?J({>{;{L<Dl;94&{HNSvb;hH}*c)o|kRO9IHS$S--dJWICD0PN7b
zp4G^jN2t}spcjoFaE=z>*`qT@YaXbGHRY7M))*&y!d^8h#}#7$upT=1o1>+IT%k_t
zV#>!kTIvvhH8|8fvUwd~@{V%(*0-)VboJOSYmHd!O@D5X?vp$v0X#Fe07V!tJ-|__
zErbe!cR9)5;y6fjogqiVG4BhZG6c`K4wS|Y73G#rHI3J}9oFH9XV+YOUDAlWU<DuG
z?>O?RiL^=M9a1P?`4(3UZHpPbWC;aOBBc@-F@A<<!Q`IeH#r^6(F?43Adwy>Yxl07
zB3chzUX`iCiAPo_Mr~rMZknvOWu{)}SWqU{H3u;RP7$qm0PDQvi>Iq)XNcC5At8dL
z>-67Dbp=ilEsj(qDL3*&NP6So?F{1={Bl{qDWa8gGdYq?Pcq^Z(Q3PGbrEcw<gbQ9
zwE6=vEjUDr;JUEmweNwLi{NLMP&+L+L@PzV4u@!k2>(R1uqaRLTPwY7%Bt1a5B3o5
zGeoNwDZ&M>alSQ%E3_dq9HJ%Sg+sKEwj;}nK}f(ZD6_H|5{i6tIJZkJ%VxaRr9gNd
zhiI+Z_7a%$<!)j@SP?qF9nK3)jk^$p8Kt|7td_Yh7C=*`xkUniM8CVu>C_egptFBD
zeXE87aE55rFTXmJ1PI=AHULg3Y<Muq#W4pvhN6-`>`<bN6l-=Uvo_icg3dcEoIGjU
z@YF)-E8!ap6WqWdS_c7}Q`R{+M2o`Jzre#!>kQE{*!k@8JEDa-MYNcZBflY93?ImX
za7Y2Th!M2%&h=ynhiD-kkpx8?yY>k-Ce(!1`O4)+c#tzh%duP*hiG+fyHTLd5UrzK
zn7#8UqSa($#xdHrghRAmH6AvdB3iK9RwE8%W$s&@?k+>G>zIK!M2lHr_TUWBn%>4C
zTERj9Ya|ZQ3i~`nwc)XQAxBM34S<akBxw5pj=KWpq9l}VTaP9M&=c-+UE3Z-mWaMi
zOr5f3aij8q5zd;1m}{Yo+BZ%<%fx=-g2+XA$x6L<6()#Kf`0LIO_@o!zn<XA7OFK;
zQhE@?GZNy7#P?0|7bZ${Z)elCGO&Um33id?{K%-KogXfDiW+SSIIN4hWtTV`@k0T@
zIm<^xxM!$L4gfJ<2M__|p6h(UOS0GT+`{7qK<bb?=fIKj7d|?z0FeMFGSCjtM97VN
zHec^yAPRw?KqD6$?;z)@9iE)S))FEK=}=HQ<m2;jhFW)~tKhauBnj5kTx%W#lPlQA
zm&VTA&_F6rXg7gcywY&fZ(}`|WT*0LMBd=yu+P<JQxtV5a?E(#r8}--v%GDMa4ga!
zv$j<hdAHV8gplOKmOJo{5+<}RfTjRw%VvRdbzOm_?7NIv*&gT+>XstZ<B@%R>8Fa)
z?-h}Jaq9;uZM442wA~R8OAiR%uqP<47y3byw8~tQgM&jK&4NsUovDDmRiqKlYF-a4
zlSgvX;Zl=u5q>BLZy3&Gh;2i{!L))@_CQ>)Wf>{~xM2Wz2;yY~9n2kHS(*sO0!UuQ
z;a21Xf$RrLSb+3e55xjy*M{d`!{8-1g2rkGCed8vHn3w8C&md{p>0o=RS<y9E&#Gm
z6={@C<7KS0o>l|JyTDC{{g6fx3JHaMqTExuq)wVZrnF1V+X)2-I&f&60a}Q3S^5*i
zZlE0{fw6gS+{mkp+ca~RVM@@YffOl^?agmu>o`h_Qa7f9_5DQA)k>GG?-D;Lt%wwI
ziTM|6g+0$0C0npR`qjP<ez!=v({tO;BL@d6z8!n^?5Ch*edPRX`&jm1cjZ|sm-88=
zrG2NeyGY31d1p}bPVBe&QlkhSJOmzTnRHDW{-j_{+k;3Ukf%w6Knk_jl4$X!W{Lo*
z=*?H6UVT#G_9NxCZ1yeu03;rtc!A#eCu!_MD&5wXHQ^ao_SwSL4%*v+0Jn0MDEaRP
zH|+BxaFmu>3#CSks$*v-l{V*c>VsY$&6_Z5a8?xKkCDrr=d~$LHhQ?suyI;)Xea+C
ziMNaD^Aq0!znxNA$=9VyeN18~J>J(pOM8WdC}pHgYBPZ0x4X_~qrY==rbfu5FmM;i
zU0jsf3q7Bg_?=3M$LkoA0C|@6M26SVh1VNLY4u#~x3|*8h7?uw6J3#r-W*GoERGD;
z=9U=x{=7ImR^}$m-~~N_YiHz>!WV-whx}FQDMb9$lOO2@siqtoo$Y7t9+uQ}Xz-;o
z3f7?(QwFI-w{tIh#_>0Hb}$MxfBr5eQ1|UUj?y~*ez+60GN;2Ra80sbQw&swwqUD+
z@sKsF#@d!U$t`3H_Y7Z(!4m*H;=kj|8dhxI%aK~lBEX}25+maL0JAYHm0Y~~R!-|h
z+8c==xpu;s7|07Q+2M^Z(C&)CM`B}9V=*0E=Vj&BF#0-r&(e*|7wHi^H)F+}v~>d(
zsSeZ<b9rO$%4aBatvf|I4J>5g7o^e!q)2yXUDlwlIv5{fbtx9BR2->e3(fOeSP7P}
z2C$?m9D6mSD7a%k);X2e#i%8u_`6pqe&7`CW<K!oc*(qy8$8TqH)0bZnR$fQlW+e@
z(6axQh3_Np`jr;h(uR*Mk0_ajhf)}oZ;oA}|3S5EN4G-~RZ~&Av5Ln#zOJVOD_9(b
zhzkmL4lKCrw!P_}t5ee99L>XY9~d=}FbbOVo`8=(PoG2;JNbiA{mj=AfIUL~Z6tmU
z%Q%e(U*SEx4S4Gr)Cj9iX}w2GONFA5w#M#@)-jHYZ#`gn6JD#p-2r>z=E$SdJ}O?o
zyv<oiFE@_KN%|BvVd~_)2h${4hlyn7alsD{)rdaD_}_OxQ6<l$+}l+qFi_L?=1B@x
z4CU%l!`KpGC|G#|-$ii=kI)J38q;%{f|iiVuEKITcP{q?IK-DnxcG1|>Gyz^vnoRD
zFJ5M&FwvA)=Ae}0?(i^x2kLW{c{~uNb!6WQnW$^`El|Q&Fl%FWcEUryx}ZsEl|!oi
zorA)~L6b;fuebgih(@~r*iaXmBAmtL-)cJRc4A%e@>=$-+j8sHOb@TVurPB@Y&x2T
z+FX$B&*KVGdl5qIpk0~#IfuaG10mUEVI}ti4MycpguFN&YpreN;wg{C2_?8_CaQO!
z)h-nt<IlgRlyD%-Oa+A$35f2}%C%{7UPdUJ1{)?nN_#nW*_uFUgq?vvo?C^oXe3Cq
zDvQjQTaANv6n(iWn})Q9i@#_z;%-$A%W;9G2+>$fY*jAT=XI_DYX+PC?We^RNhuaU
zB0ri9MqI3lyBvq!d>TtAoxUdL#tYI}%p#C>z*Ddg?$dM1HuTd{hJj=9&g}sREid}(
zhgmlWG$^GWLs;nYm539`UWSXSuR`^5PNu3~RF}B;@>#6%PS=lBmwGnyUEeR7ZvI$Z
z_V}338pJo#PEk`HocH{iy{5?|orl&<x20?7Kym>WkqVwP!ndE4XASJ`UO(>TbmYg`
zRl9(In7p@g4l!t+@UrSZD6NDV3E>D5$2;cZ6G}fREm?C~2#(TvT4MI-(ZbY{B))*D
z;JqAk^OcLW4Gnsw_fiinKHN>LxyQX$XK|IlIo>9Czc=uGc}~<Y{qEB;zM=JtAt_VM
zv=SfIQzh~}B4{%twY&LJ6b;)!!n;_qV|n48OAyFDcn1yfq){?*d-Vyt-~RE%Il)0A
z8)8ayHKT_r{U<{(;Dlz`)(FrkZfz3*HGvWK7+?T~owmfHs;qKaT>=*6*XF7G>6loe
zBp7sFJ$3+9DJpy{$hToQ49#!flUtQBH7kScTemY@=ZVkL72-8d7H8DB>$Q+5bH`zs
zMnY+j$_1q=@WVEIK_rLwc=VQNqy&C0Y?ma_2*MFiKm7QIM^k(n9+zKF-=hga9+3p-
z_`M6_qy#(ru)!DV&oHByhvJx4k90jB6-GBPQ*=q+t;hYb8KPVg{9e0S#&oJo=98qX
z9TkJ;D{ry*42hR|l-zkga3fOB`i4D8v!>6R3pf0^?q%tz-XWzpy!F!M#ft|5>3R<u
z2D&c>?%s?JU4x~bOq3L#FPvV+8;>Z3%1x4TGjWmS=4&v1Tg*o^aBe*uZ(M3jUS+sI
z*~G(t7{0Ym_9`FcYE39RcmGIg3@m8l|6v~cr8I)Z?5eX5l})<KOiG(2BB0_U<&fo5
zkC%rP=mjDJ#<d|b1*eFV`03Sq$4P{OL|IV}n;0@v$26OahMavTZoDHuxiE4f7ZvfA
zQOJtSJH=aIIntRc=~$z|D}D%+f2U`|!0M8HL{5}Br$5=yw|DiQ_rlbo1>a^IfvD!)
zL(CU|Bqnv;tR&$K?e##0xsjKw;AL&CF_Z)TqtBBdp#wi#I$q68yZCyIw<Kb3b{%wm
z#%QeW^OGwW15XyZ1h%1HCWJe^ns!mr3L-%jQm9@Y0Ej=uItcU;AmJsX0w;JDCA(nS
zwjz8LmVybse6{6kOJe#P=*ofWd4}5-k}_{^^W5&99~)bv`?1p;NG@|!JU#h_XNi=_
z_+$Uw!?`w;^mljSz>=KLrBPjjhwq{u9$0I?<_7VK?zOCsxBf5^l>78y#%b2DVU%~0
zL2v8z>?c;$Bi7tms~Btm4Ms&#IN)9KLjP0cL`d4R4Lvz8QgC)KUxCWEE1FyblnPz*
z-|<m>%K?nKoy=?)qEbwyfmy(9dI7eD%`{jXG*z(=vpIrLo<R`P^m&g0#mb}d`1@pZ
z6V8i(P(dddj6NXV`0E7UJ0F*T$f#^Q7Y1cQRpmpmU#MR}^R3Arv(ZTs<y|nP^M6?}
z2&Ye2zL%EOS(xRet4b-}zL*p#P1R1Ni=`4*<^;FP6@%zFl_>|Jr2$L|rpj_NS@iHx
zDu;F%C;ufZh>m0>$w8IREt2s%JJ%)6e$J_D%1gW4>HTudEA7^Ave;VfR-$3!jt-sF
zOC2)@piFs_J5@})Q`rJ4iy!65m6BiIe!Fsh3@Ef@o6m_ySBIjZVstX_kAiZDNv;k<
zF@o%L;*Yb%K8~*R5(o|$OW-IiJO(mP4ksTDX`-bIUG35t95VSiGNm_~IVojZIOH-S
z&Uc)w%JuwT?A>KtlzH1f{u#QN8M?c>q&uZWKqLf2=@bJLbcXJhknS!CK|mO~8$?1H
zK><NR()ka%?&a>f*Y35i>%M>Yga4!R>G|;cI*!lrd1p6uz{RJKlonId(URl|lkB$f
zOMmrBrAY=1W`&b6;pfW=the&Os4TAP^(nYo9g0LdEw9CMRP3X~o?EFp=cG5GQn;$a
zQ%GrcXw~v^)XSKqjNzpu!F?Gjl8Nz`yih68;r-QZY>qy|w!UYT%(@X8($AN5F<1gg
zTI0lUFziuj`eRd^1}U(?{rrk^iD2$^MP|xeLjqj6GOKIOtFS^JE=~1a$M8#HESIil
zVeHC5q+&^1G^A{aj0RV8gmWaOS<KQ%L`p&nQgZDxe2lZAsr<~*aIW8=&GYcek>Ip$
zEMRmb&%@Yg6Fx&(@az(W67i5^74)~!2qWOav#l3)R2*ESb(l@RhYgxX)t<@DnCI|n
zZ6HXIzZK(fcwCBE0V3S0F^$3F)#^M*Kq0sG%(2zQ9^}@#wzJ<B;Th-}5@Nm4>3&E3
zN`UI}&UB*|TSK?ClduhjvH~kP@<&k{hi651RHPRaB`a>q5@(8ewYis|a^+z>ddX%V
zm7kk}&$14_vu)Ec4ruXKbqY|m(C&(<hBnr#Sd7AEwR*2T4y0NDu<@uu2Wc9K<sC?|
zg<aWvN$HyE@EtNSIH7PhsX&=qKBT(0m}lj$y4^rP)tOUPJ)|QaDD;T3>oNC-iQV#{
z-=~ooZe{h*V=9<qWA>p!GK5|TpT48cO?<oPvUjYT>kl|@T(V!zVQ0I`i~M!AC)0gA
zXYU@^t~=()xz+Z=Y6B9B0^((GZalX0<Lzn;yJ2s%p53xhS5jD2eVsW<;RCjwcW$J}
z4vJK+j{QPm8fRqfIh?C^Ff0or2;NGwq=*Qcqw7~>CYEQ!+mJw$Pnv`0g!s}k`^4CD
z&S<@-i-Yqhq0m4%szIm}QoyIZDggnQghy<S%<DdB1ML+mu=tJm=NbuLa)WRN`1W<&
zY*9IO6e!52LRl5U^43G{L&CB`SL=Z4>VyQ9S;%>-fFCvow1BD(&eNYJ=2h(CL9i~@
zLleir>E%#&!vTDVx<QPXks!B92;!=L9w1`c&)To}>ZI+JeOrfDs}#VI7~io)+c!b4
z>v|EKMygAyx=@VYVO?n?co0wKOx_&|lqoFmx&&t{@y#WMPldmhz_VjD8gxX~hCE+l
z%v52WO%2vtk?`Q|_OY#qcVtZAh7PDSZ#xW8I>I3(EjT=_1e!#S;rCgA<QXVg@iDkc
z3X(Yi0*y-}C%*Sd<tqnSUvqQHpvk{{3lAlQ1EO1V9*#=kIqIG($PTyWs6;zEUj-HL
z%slq(w(p@S;H-wW60PSu4s&>%y?02lyJxWx6;|j53U|nHD4)b#xOsK9Rhwf1aP_uM
zgs0;N5_qOcmoOHB)84|FQMmNW&d}g<3?aub)Qtg}ZYWg&9gY6*`?RZ|s8(WO6d(l%
z#cl{z>kL1W-ynEq)I;HxqXHt2=x8b19No6hF=DIn{iNWuCs@uc?y|4q<PoHZe+K7E
z*=Xyv!Jmbrl`5{m%?|rf^)nUlOWM{V@MSb%xM*<Vv#@uJMIt4!y*qNZYXj0zie%AX
z=q~{>BJgxQqSKcjhjutN`^%}uKc07X?p@m1m)QBlsfl9|h<c(3lh!L_u*7NXAJ6MV
zJ5@yQ+Yq&N8g+GoD7EsPp$KUzg1u04-fm^JmTpwgxOlbByjKME@6gDhVh3bUE$~$D
z$h!@0b`c;JD_M)fz+BaW#Sc5UUkdYHsw|eN`(WEq>^1t~($m4F=>V%kR61@ZC-Sz%
zu(`?pVp8gYRg1w($|(9v+e@Pw%bYx8Dyo|&ZNj?S(u;}-7F(i8=9mwhCvm{U49<y^
zeKRe1d{N~aw_52^#sCb3vKG;#9NQ<kEsQTp79RKJ+4|yTbh6o&2rG}2MrahqhqyR?
z%x{UoJIZYAfqF<Jx}3DpWnZt{-HkC){BZp_X(N?mOY4|kIsLsD*s<VvUch{B<=NVE
zvCTVqEby)f9cCNs=;O8qr`D<d=Ryhds|q7nee2W5DvVePI6`g1w|ztsfVnD#c&DiN
zs^B_%gdsuI9u4RUvzG!SqiPehZC~PY`if7o0lKQPy+Zl^or>xgXM^SU+wTvzH&9$Q
z@m!85KW<K|oDD~w`2i`~VI)#OnbFQHmI|sA3Z*vv^}``ofNt0^DogWjo$xk#cB_H$
zbJ-n~)i3#2r@LHl_gPs+*Pj(K&=m-zB*~u1Go=SeW(RO&#!&S=*CndqC{|%~R0m{s
z@({ztJ@4p9h9a5OLzMzj;iodyEfUPYckMi!8cta!TUxP6vMCfoFYw77`Rz4n2&R~^
zx(@n|wls<pFV&0iol@}FrqIEclqcol&tN+6IPQEo<Tg9r)|A<?Y9fYzbk^tfn_Ed<
z2riy=RGvgQT}$hOw+eMxDzepE!g4Vwo@SB@G%hLkrDsvvVhBL);q%rvT<>0{nXmkG
zt8|Q1$lyUB<0&eW>^(xKJ8Y_8b|KXFVb7h`6?>Z$soR0`ohqy;xCBRvxUSFHd|~tr
zd&CAKQl-KgiW<w09qwDGf?9kIYH5k*h3)%4X{BG4C?&GjL@h7FAXrIoDG@&QaUn1}
zxY9*5%YE<3yaGX{%Hy^y*4SEH=v4}@{3}Fv8fSqtB`!Edz1M}fm<hlS!EeY?4<50-
z@8CEx{wxAqy(XpP6K$|J1sIvC5X*KBcS#hDuB<U%o{kWSjw)58XDRxWY3DKSD^P;q
zk8IVIZAayKuHuB60!kv#;vy7HPRD4*Tfh*p7dvP=>SU9<qTffZV{l;LZg2RyQ~a*4
zb7IvcM^#)+5lJ$*_JdJ2|50|H1CLlyE7_ZtHrSl}m$*|@9w|oO=e=*GczlacME@K}
zV;ia2pu*Y>AmEPiU~>hRkV2m*WLX)2Y@Z%hw;Ze7!O@i97CFg&f@Adv2XrN>RM{hI
zEL22kjBN)%9PRSCwVztq2e-XViWr9LH+sVH)V^RW!`IcBCo-isFPsQ;pZw^o5aZ@D
z@w<IrTvzQXu1i9Al9of9ONk!s%5;QcAOa=L;W_JBY?K3gU8xKd!J^KfQw-vK#OH@Z
z4@KL=BvC(uD2|HQ#NHn(CfKO@es1$M7dZ*@jLE2frr6-Cc;r<TE9vyq<F#j_QsiQ%
zitCZej&&d&dEQWcr^aJa*9w)+7oB}9;ZI+7_G`M~ND&~P1Ky)5Nz!@t6`lf>oxNN~
zWH&5V2NYvohu(VJ8b5@@U!7#V+JraH;%9d0uu5VSP>Y?+a2Eh22$-o4dwRM`<%_q~
z?h&xp(6?$Q_AD{Db#nOKqgTUCh{eeW<VG=`pcK7)%NH~%QSB>GO~41jhM)TCr9K4j
zbY4}S&<~F^aC(?8>Gg!?a;y|~c4q_?DIxiI%X7BNmqt4IDu(=VzI?=vV5dMRN+r6#
zyM@AIBvU+>fQpU6z2C-XYRcGxA|wnX7nXnSBRSA;<{*59u|PgI;tP!_C%G8GtW=C_
zN`uW|6qT1kQtp=y5jYCb<?eLt(kn8F1|jxhd6Y}OAIN%^L1W!ROZ!62=jT4T+KSR8
zP831D0(h*S*?c}Pw=E_jW)z#&UoNpiVf4ZZFC)8RqJ-YNePXR{eW7?YT5wDXpail0
za%Q&-ccdjZYPO%Xf4xE~{{y8Zet-W6d`m6*7fMV0DcAMdyT^jLVzi{5;{a458|_p{
z&%^y=qE#vVyS*8o*tQ4LwSv#ES?uqcF&m*Z*I)7FM2zK|+|D?!f4V`Yt*?cp4ZBy2
z!KweG`ncgBUo-15S~A|gXzgYzt9#!t$_bgP1>6^#?2;FGrFIgT%beyJ`JG!mu{uj8
z`8-#X?wwema|jI!S`Tb7I(>TWlA0m;q1~=wRmFtSD!H|_(Ljl=oU)>10$S@lE#bA*
zKDRV7X>R88!u{hH5r2!M!nnd;GN%%+z18Ee<EfsUK(sFBMABDDUbTLUzK7jp(lxX3
z`o$C3>{sTO`_ACkKzO42BayO*9r@cKl7dO^5(H=K6uG8uW#i}H4{_zkHrlUO442&=
zwoa9V95V%buA{UG<I-^7WLQ7jz-|6cY0Y*&Bc4@*N$2EwY!f^o5Almj(#2jP<7d3?
z{E8~Iv0E_YWMr+Gt#s3t*6Oi<HH}ZT8&g(Z^-2sqhD)V&qut|U<rL2X;x0iVx0@L8
zc6oMP>Gz!LJIK9u1gwYbm~XC;$$t>QAhixTx=ky8Udfuq#gZB~s?H<b^DIdZq#9~x
zZ>y0^8Pm5?kQ4*3;(5N(Fn)P(J;Rn(l=}A5$$NtJOfj6LXRDE#UjW&(#{M+%Q#YNe
zRdAmuO|&KwYo@TFd+FJRCM9{)DVA<f3SAQP-bs2lgE&cIOY>Z_FQRd6Yhz18>@#ee
zy1Xg9W9nWX?nW!q5O+7#d{ANgEwW0FHqjy@%3zX?rzEMhS}Q|iDfXU6Vh{dq-mT{r
zt^4&X5G?c_B|0m}W%ZQDFSD2+4yGeZL~*;7Ymu@qHv^MYj3aKz-T0!GQyW$lTCQj2
zP5W#;EBw{^!tI(}{Qyd|+zxaK!6fW-R(r@$DY5;|2ivrr%gk7!9!J^O4l%YX@f>x2
zj1Z@=5eyRQZD?+pSH7)AdfmISzGsZj)fLvu(CJckTJdG6`+}kI?5^!@t!$9A8c<iD
zR!n$)n1~w_`$vvf_n1mNT3V>!LoV|Em?bI?QVu4~p3odl-7d#U*HjZwv8Gkow|T}Y
zoG><#C-+(PZlk5Ah@r6>hfh30`g1DH$$D;j+R6LdCFl2(e4(qV5<YdeQ&}M+NL=0m
zTX1r?rtUWF;4r4UrPV8#iuQ+JC@ngc!NFN(!w>9=M3mrQ^I=U~Eq34dcr<bO4tt!W
z^)5b2@?g8W+PDuum<X|Nl-8sPwLB$e3^)Mf&!NAFb3tjn0tE=fE#lc3DN?-!1&WU^
z5_nE2(p^wm#7m%HBPAwUaPVdQB}meg5}OP-<VxHUaiNhi*9~y!_3;ZzOPTL6ILwlG
znY_nHMd<#DAM;3{NC}KBj9Z&--gTK`!$?)KH$whEC|Imz*pJ1GIT8}A%Gw&2>M6&h
z7b4V&V0#QMk-VU^?)D@ky779AThV@qioNYO7PnY!#d{vqC9x!s@X%{1lG#+1je|mc
zay=w=8zq62PAFVyN}2J*b6Ax5jfVM`QKr2kw6;Vb+YKc~B4?u*F)#GYd%`}%0?8Ny
zXd}hEse(`Y_lMd1E^E34DS}=wFYZ?O6FOOZAP7%fUWR6e=T2nP&9m!2rL4i0z`I4$
zpD}ue5w2nJg(w425@O?F7^#NF08T$rlv+>-Rq-mo;x1m3LaS`COT<b>v$Qp*ln;b;
zu96+qb<AQ3hI16;;=QoIs-3kUPPNSjlQj5Jg~7wXbBm<$yAf0}d*PbQJ~r!%iL$5&
zWBu&6m7Ebps)7e#LP;$c1?I`{$-X?U=z=e?agdV!dGwXH@&-j;)QXfQqk{@pO7XOU
zXZfCG^r(5=Wb0>dd$_HO@sar^W%7})h|D5}aY+Yx5}>UVtrDI|OHvukvMjoN8B~7a
zOQFS{PQRXkFBFuG^xC=}=YhcGD)*n4-{j`)lX!|+XlWV^YIlDYgFUw1o>z^WJwnw3
z3pK5raYiwP3?Bu4R$_z%Y~|k!HkswgV<nnC>a=RU5`Y}^VpY^TS|e6!Ww{G!58EBx
z)2Zg9yfy3R!<7>9fB_~(_q2wS0v(odNKsj{tajcI@~pQE^zY!@y)QUo89rl<K&ZG`
zS-6&|nY}0U!Xq*X2B|X3^@O1-XW`j{(D-&oLO3c`Td)<-ucB<4*4Sr)F=*E;b}cnf
zMfu9AJ<E-CRRT4qdhvtVQOOepMoWen^~&wgTE5I!(a}}Xu`qYne~JY&YA|<`Z>Umw
zqENf>XPZykb_K*fiqlf^A#DZ`pfkZ`Dzol9lO^3t>}iZ;GFj=rZMgUB&8)R(GsU1=
z{9ek2sg2}3#gOOZUfS`jjVyv<7)H9Efo*21NJlvmY`C9AF=wkPOF0@Hzn{ZlW~X6J
zIhHiJpC>+Nr}KnzJd^aG;If(h)pW{<Lc@ci>vQ(knkgqM;}1&g%p6SS5tOg%ClAUz
z=N!xtlv8lh!-`-tM=Lt2H$8@j&y(gHZ5rCCvKEwhD|Q_nW}eaRM`5wG)1$jQq9QDg
zQmZXD+tz2Y!q;19<*eAn;4lReJ~dKiSy^yWJj#ZcMxoH!TRJ}prKFvUZ>6e;-j>;K
zrTbJ+D;u%stf;2AaMS3hnd8-lvezRLk0=E?tkFO&HF>;9wYrAfb0=+m>eZxIb;OhO
z`0<b0=qM4j#7c{Vj;@P%Z$Wk4SKqp;ziypL@jx3mU;LC*l|rxhv4g(RY%dIoN`0J&
zHJ<wld>3j(hZc<~nBzuRknBgTOC~vS6>|UaLi>lEjG)&Y+7Ttm%v*>rbtf}Cf)7GW
zY2L3yVQRnHj(l}Wy(1Q_+T^esz(tKZulo5?e>8)?vWL&=^q|^{RNl`W?m2{da#CUi
z3tKllBnRlCk4M0fkOw-mEaC5tlw@SxdE?TU>!Vtmga}VV#?u&+(#2_q7h@iKoYH;<
zcrOGaAfDtXR5y)K<^3`}cx`8>sLDH<L>X~7Qsfzn>mI8rjRe}Gp5u4dsnTIs#u!K~
zf$6$XPb{4ua%8+>Da!ADSH6R#xNd@DKo`7eSMC|M@R(6hhk(`+B=He%FoNZ=4$d|M
zU3d8rZ4}FbCCS}w{OWL8wCx!~Lh3RLPz7x6k`HwwJ~dYBT>AhW!VgAdXo+^dNNc}H
z9t9(+SR}VcI$ZJq2N<1w=6oU_`n3vlbAF7TOwyc1###JDqhWN*ifQ90BKt*JW*_X-
zVaC}l@|!RsKY7MaKnf|#X=Vi!E;vz;E~Bn4`t@>bS(gLmrM(p>{dVRaNC&r`pKO{R
z+X~5WF_4ML6O%?D&VYdI0U`@R01M;ZeGsjTGiLS<HZ~H7sX#JZI6WW;3ksEzJaG%~
z=uXA_VJ7KAc@%MZJS4+q2qTIDQqh7@u0}Iz!sl}2DBnVH4RznW!Y3Rbq?2(0-Ex_i
zl4nxeCTP;y!n0fh5ztsWlh{WRS!*BVSn&Go&IFB+Ba+L{@^o<`D#!(R7hY-Mjq_49
zIZ<(Cku;Y=ux{?>$gONIF28ajIEPb6N77G^%#23SPgda1^RHQJuau3<7y@Y}KF$PH
z5W1BgY?dyc@d0uzFo|?lUV>M~dFe*CW}+4e1S%+#bas6R_t)Vwqa%oQAR_GwiNP+3
zP1$J<lnmJhZl4L!)@G#FS-;Om%*9A5H%Mm<Aq>%;t61EtgVL3`fo&@e7cwE#gw*ks
zbfyuwclG8Tj?O%W&^Bg5ATf+#QS@Fh7=g~9Zp-yfFjtKpPNy3u<{%YR8>f|k@I;PQ
zMhEW<xW2PMo0CbX31o}C!*<MYQUs<Nv{**0eVoGs67GlNtN^J81$pd7Ij`QqH<YL4
zEn7p;+dEubz6qq>kHNyMq$kolb$-tEVwA4L1z+3kRG5G;hk*ihjBbAm+zqD?h@lYC
z!x0103c66oy5Tp<lST3~(^XJ^E<N7XqP?>SJ^>J7WI{lZw0Pxn5!<YM3bdp{b8Evw
z_l9S>7b(fWpEcpk*FpPPvD}43M`AvlJT5?N1->VD*b~a73?LhZ@&wakRI^T)2l%^(
zmbfNhwp=LANe1cj2+91bhi{?u^g6UIyX)<8jOQ>JX}C=B7%q%R<Qy_(w3AhFMU
z+dd$84q~WsnLlHY9=fWiHO!zKMUU9mA~&u2yd5KQ3Kyv<B@`J%JAjC~#~#stnkfTN
zDeW=YY~#Hj0MUP3k0)dj*8ZHvPa&_37c)*(77aQll=K{7j}*TAH10CIim~G=qf7)&
z-reKsI1Qqq85IcbIUK7h8aGiJ2P=zoA2NF;ubw|nRqb*Bb(WL;h}R9HW_Dqmz}KoA
zXT&UftHi5N38%`hUK6YavG@oz313e5D9)B8-W98vOHZ}{pUL6XyEZN|w7s{jwS2$g
zt#zCVa7d+@hwFj<u1^`+P77U=mKxtp`uxgWXF<$d7)N==W$?$#HL(;n6Lj_mhAcPf
zRxH8rUG-4#HSDFOlW^)gz%@kt1l==|wQhOJq66C5E$XHL)X#!wV|Tf88CYN=*I)<a
z<67?%%d~T$_#6t_*%LF|eAmwz<}${p8SWkm?~@;8?i~_P_*s4g-BWZLoMDC-=T6Y^
z4vH>r(e67D@En{USz2J<1%{7`yxYA|Sw(o1X`*~j|52Gf;tIL$#4#xYnIVkHe1b84
zgno~KR_G)C3Gll61l|1!_UreTO-Zfio$zukD8nZx?@cn6XF&G#c$0N(gC~tJ%Vq{M
z=<e$g)8C<c7Ky85xt=&_eG0JIlb^54AQ`)7c3o#KZF1(2!5Z6VW2c2kX8SE;98I|k
zd#(i<@DQh+p61$+ZJ;3zVr6uFQjV`{<m6E6JceNQmDbhyr*a>+c*SF^BuQ75EJ<j|
z?ug5O?6wqzZ;|us659jsz#&Y2yEyB-e9Kq1dP&XC<xey29w|InRw1+1iL&9#dfORy
z*XD4!4(hIzd0+ei<1CL;IU(d24w4uGv5(yy+rlBuJlB6g=;%gTPERp*Pn-?K!#_dr
z@@uO1TDJEL4@oocb`2SH5nG6U!dH?<xL%tR6D70%3?_9WL30L^?$QodLtZ*5Cyd-I
z)FHR1gb2E5Qiw7SS%B;r$fV@O@G~JfKx#vIvfZjrYD={1gD{3Vmi@bo?Bq<`9(2rg
z_*V^md8U{IJ(xo7F(HoR{VuoqDvvO(GYrs@Ge2bDyu5RMCd!Om!zax^Dx5$xTS}M%
zV=8Y!`{1bXI%B3z4sq)UXeVYMpiOK%5%`gtY)9@G&k_<&juI^vJfTJYWpbt>GNgfg
z@D8y<n^9P0Eve+*Ou>R*lTrAVCb3M!yGinhJv`bxv4{^yN{c*l&nWV9V&q;R-Iqib
z5I+-|C*vWURKO?d)F>Kh=ro5f=(esB>@yn0v&?|BI^;On6pkpT)>iIB%N_^NAL84~
z6W1-^91b!wiZii$GFrzFJzT^u$ncwqT4(jaDIkn<zaBszf6{9(%btL<V*!cIB&=Hi
z=Md0HIpcQ<t0Lwt*jXSHg9|u#i`a{c;P#di&U#im=ZHu0w1*4=p}g<>BF`qFH~bAL
z2V0h-fQkM|^y;4W_pYZM1SZs!-M|ON4p|&Ot0Jr}haAe|<xS36XyXl9XypPZPJnOi
zVK{X$I1#%dA{2<XfJLMF;|lpBFR{I0`06Bpf>H;MbMfet=P~~-IHvN+yX(36`Dssf
zksIRW9C}k#5X})xw}a<IiQ(h~f4$E6aQYe^@yj#*E6L{!ba&t&83GFKlXE{pw_JMC
zv&H!H%-yx9+w=5!iwwy%AH%Or7u)3LQt1d_4nmaWX{!m>8Z$96r$62hI$5j8&#f#u
zwtO~ckc`;a+B6*`GP-`qKfOCGQI!93H>g6q>osK6lAQ|<A^TiRHRDEqNkHQmr#jqa
zQI7yG$>#RQ#PS8aI}Ce4QMmo$bM28f49?VKi#U0FSrbt<4)V(tJ2=K=Z_gxZ{K1fN
z=mJJEJ!b<UZ^N!qCRrV{k|wzhJ3o3JpOBRIxU78N9=?z<<naJB=RunJ=F{@qjL+Q+
zdx_e~$8e(kQBQ1zQ?ZId(QTYbt?Qq)UN|}1fg|YxB5a82>)uh_x4!NZnh54XY2JOb
z#jfybj|zt`%kOltd1I!9kQz>83MWf}Q_UikvQ{S3R<@K@F66F{x=qNmO*ExVa<)yD
zx*eft+OC??t})xLL)~%JwBuSzhskV*Id!L%X{Sv}r^9Tg3w4*fY1e}kB&BuXX!)9U
z2c~p~&UQyq_r#j^B&75t&-SEK_hy^+=BM-)&-Rv6_f?tpy-4Y6nC(M0L9}@V&cgb!
zefo!H=>{A7$4m#_P!G&C_D{^x^q&o^QV+g68$>=XQh-BSvx9qQL+6bHiz$O6Qo}P|
zL#K@cgmc4~X2Tz-N2#Po`=my2r3Y!eM+D49Uz?8cd5^wp9HlTD5%nIIP8}2S9_8^K
zoU<HCm7mz79+vc;kUXDIrWrq`p1dvn8tG_Vo*Q*IALvM7Q-V%W!0C`zJIYWD#2E}6
zV}_;&r%Or2J_F*X%u$TO-;A`-CAPd7V<1VHn~F}IN@#i$OEaA-Jso;J6`MMndOjQL
zJzXsQrd)dFMbk{P^qaQSxum(dvDB%2>G{{*v&VC@=VoY2bJLa5Z)#F!V&`VyW(!YK
z7lO~{5Oebf-V1%HOZc>l@5~m1Qx`wdEOnSIiF|n@E;Cn?x}w}dx8uE>+B7FkJGYuT
zH3p}6-?SLqw8}uc#zwoW@oL^iX3_1&3ToPl)tA*p=~bq*RkJTEkKV3qm~GhIKyyr6
zkM(|sO8dU@##EpgnzaStI2_9wx*0A<BMjT@xj{6}uw{dkxGV{$ACsnKZXw#<;!b~|
z7?#<((6qj6&OAnfT3BmxG<WDR!&)vVt}y5>lHyW<?NU4;ZkPFlJr8D_$GW>n!7sb}
z4zQOF{KO=?OV+$gN4LjDw}(By12*4fn%`A4|HP5L%R{#(lD;<q-(#ZNcS+w5UpUY)
zKg4X_A$+oLHownAcfe&%!z=sA$$Z}pv1gfn@CflaTK3357BfWlQ>5&nK=TR3{ISiG
zV_9=DXW7pb>8ID{PwAc<)XaY#lRfT8KZZZqOGliATYOGWKUqYa1kRrWTZ3L+QL!c;
z&l${+hdm=6Og!k%B)j*BS|)kbHBy3)U_wN{V1%KKf>G&6GFUJd(fgF!<fRw3P+otM
zu)}m?uu%SBs??*CGi>343rcI0yO6hVG*>fO!W&1VXuMFr*tjV~q<FH_wBg}7&ZUy6
z%3FOmdF+Hsr)wN%UV7t-md)1ReJzoE`%?MaCa=?zb6l~C1-RctW@)Hc<x)o&mE>c*
zq^-HuI4+YsBRw=+;kD<a`l71sRe5Vln))x<ghItrn-9A)xA#`xR696GQ;WaYo@;z`
z`UQWMPH(0?^pRG$wGJT|s}d&(Xe?|urlH8D%7}tL_4++EjUa)HloOw$PqJ*JOw-B1
zyTH&Vgiq}3&E8wzE|2u<!1L=(>i1X+0&(vH!X$>2MU9n(HW8NEcKIwM#;~;&R|Oj!
z!2$w)v&I%B*n8@jHryMxvXT8vnF6SeH@J5#2_7{@q26E}tUx2xY!9@GFs|&fij?_+
zbt_7&KHn<3CihYotwPX(nxnYb%_s@mAbLNtp$cdR!#EB3v`|YBv?K1Bm{BSg?L!71
zLGyr~6bW(eZUurhF-8=KSx^gO>WvI+s)T#?p4n+$l$UKY)hXb9Q6ap&w%HLfDmj@k
z81crJxjjZGM4x%UTe0<?CB+E_^273B!}lnRWAdU4_5ChqVrv!^dhV`1=#8>f@_%p9
zH2~oj_E1RA_c`$az30A?Dek7->*!S{jpI~3s;$AJ<tT-ia;$xrdr8CLeWGHUy~g8S
ztpGS}D@y2N8Q(lI+l)o5VvtYK;GMPV(=w(*Z%jP?HLNL$!Z$0Qx1N7^Y3Epm&s*%&
zRx54d)DF?nbaUM{4Rh-xaM7If(vW6S2xLwYx?P_gRMFLgQd%60<t{ADdau;_1!keU
z$BJP8T1!Ds@|w|uZtTv{!lDW+#;_zZqaXlPmo^!OTZf*G*1ZWk@ir{{B&UHIIh`k^
z2KKa^{+-xt<d)Vw^Ss#0<>~kA21h;aFuB}iX@aWMyCqcn^=Pc^^uD-}BA1KAx2o=j
zR5bCJ5p>>ZYsc2;A4Z*uKP9P|_)2MU3AEN=5riXXH&*k^l|}X6c$~(GuUfB4TrKA!
zIn}GuxEDnB(zIu3<5lE=CT$v_j@K@+Wb7L}&u&5Oy+K)7?Tu!gCog&ZLS0+g$6bb=
zdPAuQA0I6t)QYea`3b#G1~i7ePpNJ8dbyZi>c|?HB#1u#a`G|V<T$>7uw^|sLq^PA
z_flMD7zT$c49_tGNom2c)Q71tH5btMg5Y@S6+V=k8JI%daKaE*KYS&6Y`(fUB3^z!
zLbM?v&fCE;{BWAH;!J#(byB?nfHzQc9@Gg|<Xcdd%9c0j_7Q8}A-)oz<~0O~w0*|>
zlK)cD<v`Xj`VNk)aP$X|ETTdq2-i)pjLsRtQcx|1ow~>^+;RN!@k6XG^7vb_oyTh8
zF_r$e00N!^3=uTD1*+m9Ws$YVR<xhRR23#WqaIRsf!2ab6)0CCJc*fULfg96r1kDb
zo31beHyVXP08gB_b2)T8AuGYqKvy&iLGE3(+Z9})advO0uZu@q>%0?RU75S?TG%JN
zd*{-tS%!Td4h=qtkY|hE?aOIy(aM5*p54@Iw?p3aYbnIW*Q8jV+`0m>$+(lUQk^;Z
z<#n$itFPySXD~r*AzaN4SFCmYd5Nx(!3PAaX={l#(qj*XyzcDro$cEIP<wk|C%GAG
zr#2_t(U@K#7GZJ0HWGODI`>(tvpzZ65+WEluY{0xW|5;?;MwU8#ubfwl!MG9%%>Y~
zIqIR|OlT;oGlt$0)=L#CwY%Z`Qa$yReqPdU;dSV<vDDV+0u}-L>rtHJ32O|V*<d{V
zrw@nI2-b@DQ{Ph;Q<9hQ9z=&36<!}Q7AakX<Z1Zd7U#Ul@+zz|zSqiueGaMBuiY+l
z4=XTp55D%`{RFocNvio)QQr$3!!j|UO>>~6ABEAC^hZvPW?-tRy6xPGgbv4BY#;Q?
zT@NcZq&SRqLXGX~vza4nK9JIjPgS&EMJtagR5Up?*6t+bt}5k`Ho<M0<*nszs^M`>
zXEPm$$*pUacINGpj|mRA#MR%lWggprm?_tPT|X3Frj`)OI&b`-a8a|=bEueoI6A%o
z7}vo%AP~Btjn0%r!RI<>0y*lv#<|ZE>}?Wi4qm^;eNF;@LPxa#?7Q?5!<tW|NuuTa
zQvw{b*1>04!vaTAEDpqK5%A&BtZEFTiJ4d6;neT~KA%CPt@}H-@yxIoNBNGfTLNt6
z)K=jB#Lmp>%Fu?aXzGuNUG@8JY?Y8(6hz{A@ki$J?4eJ|TBj<NNbN%-y`D0E@aTcw
zdoIa>Op-kytrMWG3?2%zp0mX-Hhr8Xq?|BU&{)B22Dq6#*Vu!&b$gJpz}=tb%vxHt
zUhna%sy!4Mn}VJC;eg3o){OyA-yoblOO;gi)3BZ1sYrerF^=93<2awX6$Hq&<E<&A
zs<PISy^Cd{rb?D^MtmB#;#DLgTx^E#kl#J+mEkPJZF2s8c>CF84aQQbuh~<}&(HdL
z679)GD>1nxI}!p*4$9qlHv2&hlLOmA)wy%T_EpDqS*!<zL*d(X6}40EHPTelMx(Ba
zSz%0Af8LwLf9f&R@b>V=JoUWvR^aBN*^W-pMs#f#9|z-tDC+eT?}i(XsH7G?X?rwV
z6?Fy3t}Y6O*ZB%1Y)6Gkv440a7E33Niq4j+w<aVmmzs13FI#1XSC+NkAR_7d>y&4r
z3CF#5uiQ<BuFyQZea%|x?MI7FQ$z?i!g4s7%r@%@o)(MzNr1e}rxJ&AR+jQ(t|S`}
z-zM-`)fb_LW&*PZ5j3}Gy-&>GW%r-InA?K-H%zU*HGTO`kT9NIb?P%eE(6!uk}X2=
z?ZD&vuTIUjU<tbmvd%H38jnATY&;y^O-zz_x40|WC6(G$>Dh!T{K6YU`dyRu!-4d-
zAB0i`max+wj)l@@ln&j^uGBuBefRd0&g<0=l7xNpkED;PWZ8E^T}F}C)W=t<k3WT9
zcbNU~_{8{K)7}N8<?!Tm_Tyv1T%Gfs{F#%te9gy0kze+U5tR#M&8He#Uk>`7eAzE=
zK7a7`%jXZx?Yqs*2m~P%$PO)yLp(XPffi0YK`nsdc0=)}ywN?NU|U1%bts7~j4TK?
zLgoqShB2$aD6o7Okd)Su9%u^2W~)x8=EH@gv}|FlK|TTnDxB*+B1lS0><K@+uVlBZ
zaFDMolG0lDlIZqTW|xs+_q&Xww7Q*@Y>||fl-gHH%b@#)HkSYOI&nQ)f3tOeb1XTd
z0)Hzp5mT%Ho1g%F_JCX60T8PIJFGyrAYX^6fP3sbF6@Dx1%Zref%n$~!+ioDu?P8f
zL%ojz1Id|TYC)mhL5DU$L0G|3SwZ1yPae_(A;TDeyVwbd=<j2J5MAI5K$@H$NG=!b
zRR@bM2ytdd$!ACSTt~87u4sU93={x>KSKr;06@*a9CF8gDF!IR@`<bq>A<3nWe?lH
z41KN^`Z6eVBRdpe5i+QVQb``x;{j{84V$T>>JAEDdl6PuAmg+UR&N_VI4m^-3V(eR
zPEZg&ixn9)8nR^sTbv4eVH?qq7`zO^`k)rMofxvq9woaJj;QlK6pL8J3U9yyK!&Br
zL7@${QU2snsCLmGu0#<9dt)WZtOP~k+J(0);Ek|HQ;I`BdPH+zlTp~kbazD$FGmky
zNsrius>(&6S%mX&K-mjpr0Yq!3uCiB#|#n0t_2}49sm#k0J{aiLJ{|+D^`Z%sS+?w
zXXC!&20}`?K8ju!*iaBEI~=!Z`}Bb9=~cUU*(*=2>fMdrNEwUA0strvD<Y~u@%9@*
zB%bk}_2hPT39Ma6Q!9QbJCr^nqVfo^tefDS<m*wG5Pq4=t1$8KFafq9<tt7=&ksNu
z4i2VBdVeiG0{fXDFe&xAL!S|lANs7IK9ZILSXlUM*&=C%K6#)mDaZ41I>od4H;`<*
z<nY=sFh%s(dUOj#D1lwl@YUp|4ez?b<bhyFV_}LDMkuOW>I4U%b>r#8<x~=W0!#pa
zIZB35E_KB2asNij0Cp;p(t3!bw33o9D6OObB&C({mD0L_q_o~7UQk-%{uh*%=T}Ng
zfjtA&J|6vH2L3}|?4k_4o(ux@Om3`9@N_JZaV8a|4_QbiM`0#4XBJ;~BAtB}A2^Gt
zC<}KzlZ`X#g3`i)^1RR5`ATWsx}GJ{o82l9DUOq4sFp2l941PcqiUQcsh-1TpQH9Z
zXGSzfgECm_B*#F)Pn|QDTs_yYH}@e~?)8U3CeyiAAy15O@=!VRZWZO7ALiQF2im>N
zb1SlUdY|Wnm47EB-$^C^o_fH8XZcUmtseE}8?Wa>?F(jE3Vd<={T~*D_dd2RDtOsb
z5TRbkf>jtz`K-{eFxmL=YCs{KI%i*3VRq4jg*cV;qKurI_i}m>Mb4rIxBZK7ru7sj
zi)xA<MDF8M7G)HRpw_-GzMD|+lG8Uwp}5(;<nWS#HEYScU@4)Bhg~?OoQ600Br@0y
zOGZLUHCS(szbrOLD4jR9W06;!mB<+2^jZihdyk47>T9nQWn?g+6hAB5qm;Yxw0N5`
zbLXYges6hM_2thY<=`Uqeb%D$XQgRfWk83lZ9sWe6?!~9E|{y5NTZU(p^_}L@-HZ@
zN6)q5G4b+BaHul3TQF9MB*crWB>TQoT3pqN8r8p0TE*2GUnwme+?p$=Rl+S8%j$?K
zsrLlsu2q^XHD(`b%yDZiXKGk1(QZ4`+Jx5HIVj!it9ANNdsCy<p6i7zm!gZqiwCDQ
zZjvt^nY{4$@WQG1#UsfV-ls48C2NUT>b$4~1N!Q2XoxAq*4Z^sKO3nFJFQay)!Rze
zbML%xY{3W{F1yC{l6zOvgu&q+T;|ZdP%--DRfdex4=;;95arI;VcS=^-Y0o}zsT9G
z!6)8PQ1~Srm)Ll@!7#I-KvK>Gm{~zZQqDzF!_^=y-xy5l&>~6Jq|v1A)_4cj)J!GV
ziu+1>q^Z-PDKc2l*ivb&j|4>mscgM+5_t8tp<y=kW`{}Byaw4WF3AkltMg={6DkDB
znFd)AnyZ1OQf9I9yAKp7I4x%fuNqC7-y{>Gq%?!6TL?9q>l&KLH=Ajsi125LiKSXt
zuC(a6wcL|$F>-6AaBQXuYvxXAVl;(QQnym$wSAUsrY&g`1h!5)w7EyOUaf3p*K9Qu
zXcygV;qz)D-E0*PBgf}%6Pj(k(%5D&3z63BU@B?Rb!%5@?6@-0p%&JL^s;14$xf0x
zG&I`|EISQ1J2`+IP9+^Ijl`Cl9e4YQ?{jx*Mt8b^yVN(4J?UNc+{j#gr%PDp9j`9!
z%&yQg;_${UqLS{%{p~S$-I1`S0L^YPfu6vyZq1S&_mr-&6LNW}UTmuFr~Qb|1kKKj
z*&ds)n@Nl9g^eOrn>{b^y1>-E5qK(CroGChT{)V4{%5_e(LEh_ecdIUC1HI7VUQPG
zeJ#<gQH|tzngco|eZ87JHI4#~7S2tURr8zu%PD=+n;l7uef0tZt<)65j)OD({SB5i
z%>qL!jzetV!Szh_f=#N^{=s_SKy6shTdyJXaKi&?>h9RV#>ydF{9!cYg3@W2NUIdb
zi58+YLQy(GH84W6HA06!%D^+qq&3RoG|Cn}%27JXH89GvHOhxSCcrZ$q%|huG$tB8
zCSE!wIWQ)@H71KcF3&Trs5P$aG_D#xez|m9V_;lsYg`9^;tJ2iRV~DXfz!mb@QLfC
z6D9)_W?K{H_>-1AlU7=jx1A<!!YA!YCmjYRowg=j@L#*}ymr@meb4FjgYeg$rLP|i
zy!PID{RDps#xv!sHRbO#g`_NlOQ%8yroy+TBJtlu^Sp`Gdh^ujO+xsaq|!IZ18-8d
z-lXGCXYx#EYfa}mP3MPC7nV*J4@{T-|CHAMBTCEUKc}?HHv0xQ2evnd2)0Iex5l)$
zCY-lkM{K<*+nO2Nn%mx*C)i%(-L9qu0T_<au#qQr0B+<H3xJL`j1q|aVqs!pVqxLo
z;t~*oz=Q-45FrT>go2cWjEsVcoQ#(0|ERY$;KJ|d=IP~TH{d2@cqen(o%>gEYy7^b
z*@Ikn59kfg+`p-AZTZU>2S~XFl)?fc#{=}7gKBOB%iRfnemA%rNp2y%t)x(&kD;os
z!~fdb+K#*SZ@jJDWXsT$m$Rwv57Tazro}F#yC-E7zs<P+IMb#wGyYSy(>HJHZO)_G
zyyV5a$3OA53jOwq9)2UY{^)JJFArF$43B^A)Al?su{vP2I<~W>@Sr9*r8cCrws-YK
z;znJ3Mtx*oed*fE<no5mU&*b1<82+brN8ee{u|y_`O;v^_F(<1q310lH60`G`bTD0
zN7_D)G#!uD{m$Fk`QP@oHh1>7&kjHBeg1TKd~kMrh(I8#_5fH2z&SS3w#k6|Vi9qg
zc2{J!1%jB=Q`9Q6Izq{X>}R_xv%4bc6+@^mKhNojWxrZv+VecOFM;2xH|26w-axXL
z`}^6Rs{EmJIbR$a_3DC=Y_(WUv)<~$v3%WZ^;GqmqKRUoD*L(Kn&Q{x7HuIk8nq>F
zs%*!K%=&6eXI{82_oiyRD4T2W*n2<M_o95h8H$Qat65jE*cL>@b)&zoa=9yt>HnR#
zb?aAe%SibN7Ha{$@^8E?-QRj!Z5Q4aBN;0%tnJUdt!0QQ+MAnx;-q#f_arHi-j>Sm
zye-4Ul?!icmB`X>G2q{NTj77x+tT>K+tT>K+p74Px3zQOZPg*YEm(}gg|~&tj`X(H
ze(P=NkYFwqah1O!{jIlk=Lc^~m-7Mrg}1dZ`rX^2|LSd__R^$$^R`lc^|r!(>uuro
ze)G1xfAqFMKX_Y(w!Z()+cFe*E<62uZ>#IV+d@<S#oIDqu;4`D`PJLfx$w43kFNe*
zZwu{Dyshv*dRvTt^tS4L@wNsaI{%@!wXpP~w^jHzy)E7-U26Y7_qOWj={bJlZH@e?
zw}ty}ysgv!9d9e{2X6~NR)1nD>|U=SKB;}b{8=uK%Z6z3n+Ttpuih5DsjaSpC~?ju
zr{8*8hMBqvf6Lo){WEWi?dRT>>)-OW;J<oXc>m1XQv93V*1><*+w%R<+tT?HZ|mB>
zye)&@cw3;q@V4as(%ZU%PD{S{i?>Cn{abG<_n&xM1sC3y63H*#md+o&EdzPa41QFy
zAH6M<5SE=V+=s7vr0PW0wciyyMZx*zZAk;ke&%ff$O<7*9OeTbZgBm}+d5$Qjkopw
zf5F@0Vb{wCo1%F!9<u)GZJ8qIAE>1LTW{;bAG|I4U%V~TpLtuZBQD>)Exq4*TTrC8
z1?c#hx3z%A_KUZbi}bdNc0xIS>uniacw4%^@wRd<ysZPG!GK@Ats-4vUTSvQuih3M
z{Xg=yIRC=i`ux?~`uqoP%m3%zmgQG(E9ht5R?q@U;Wuv!`WN0-%6D%|<Eyu&@jGwp
zD!LHat)+^~1grPHK-EDct_KR2rIFcMU&1~;5CQug<_E4B8Mjitdt2WBHE*l+_uf|B
zPra=dXc<Uv%LskD^-sJliyyqL*O=Y_oWJjFW&G%E>7%bt{c~^2`}f`!^apQi95eT?
zyseDid0Q5L;%)7qsVumXQzSCTyO{pb+lu+Qw`Cy5;cX|;@H20#ZkSQUC;<gbIC|9-
zV>P}u_HTPzJ7@;~*SxKi@7`A7-|)6l{zGre`?ubfDbm{l;537N>usg{;BA>&z&<S8
zr`h9AlHd}m4l~Uqj0XKXZz~9T;ccmaFq$oX=55)3_qKMvds{m{@wN;q)c+%IEBANa
z76@bD_@8-O2mkW6GXBcjD&!Xk`fqt#oL{{yU352fikID?zj#|w|21zb@0+&;`i-}h
z@uRmz|3Bevq2v6Sw-xe(x25sl_O?R)fwx8ZQ*X-<{eQ~aiv7>MtuS0ciwkcn@4xD8
z>HGt4OXu%-TL#0UC(p*s&qrT;CfidaVSEoVrY3STBiRyvZG%tUN<{w?Z>#nHq_-9H
zkG(CDAH1#Mzu|2Gaa1ZE8StC67Kwyy6t_&53_Ua`{O)bl{f~NEp+9<CKHt49Oq}0)
zTNpU@E$GRE!n7;*eC?s8iZUqcglKhWmfyXtjKB1@e179?W&Bfb%e2A-qQ~VW!u8L*
zEzAG1x3&9wZ_Ba;9pV$-h>To3-i`m!+rq>_dRvzN*4xtgqqh}~YdV~Eas$f4%)$GY
z-qy{3;%ylqh6&M*LHa0(V)&<<@-87gi4aToBl>f^kvX1`4f@3{!y$%&A+nu$NQ`FB
z6$s19NA3x1&|i34ogL;#Z%gdI<!$-@4R6Z;JLQ3^WqU9QpY`n2u2nEGLxY+4n@_j<
zlSEwBsEO=t%G2c|S<R;RH|l=sZ5jSUZ)*VQZL$68ZRvdTwj8wo4|-d>-@Gl(r7Cw7
zse_fGAz9!+tTsXkrq1I3kG-wdzv*o$AiXU)q_@Sn<N2rFmgtY(R@mS1wmN?1Z3SI;
zTi2AtF8`nRw%WdXTTd8c*}i#O0zdP%xW0N@n5H<bHq$cyiMO@<U-!1Ue&cP?`~1P%
z8VOW`GUCmBKzdu?KX_Y9zw@@}w14ro(*DZZ3Ihe0lmE-xlDhD=fb4R=cv}U(dRrO%
zKDb4?{x18!cv~(0JO+!_G1MWBm!`T!Sc1GA^?&iU+Wv;OW#oayi}bcQ9iPYk>TNN9
z_qN!+dRuDWy)9GrpLtsb|K8g|#l3>`wm{#!t&|IIEBNQ$RwTcz@4vjQpuhIEvVu@a
zgBC%iNN+3Xf6Uv$RwVhs+e-Vz+iLl*d0Q)_Sx9fI^{3v}mG9oxQ?|qlZ|jKAOyO5=
zEA1C=YxB>&Ejh6I${)Qg&VS}@Dg5W&RyB%p8aXP`+ll}Y`TW7#8vgs<)|Vf=t+*h8
z-+5cM%6?aV@V3tX;BCeH%iGfZD{t%SpL$!6zvXS!fAhBP{v&To>L=b77U|EuEh4vw
zpLko+-@L6fcBHqZ>v!R8UHwaMtKgfr#rnVCZL$6xZwvYdZ)?59@k0x)0~BQnc8e?e
z&azN~l_V~86$B;=36@++eon86M&>6ESdaruNfDv>04-XaIa@?c{0-FP+M}cpg0plb
z*_R-&CZc0$NH7L578Fld+K8(PwB80fssI(p5evZQK1f4G0+^NBIm7~W0Z`nXHt<nE
zW-{D;0g4F<#0Y9478iybOK1D~LhQuz-D_2p8g6z=0my;I4y{?JDA&+X<`hLar7&@#
znn$=^sCc!@gte3Kx2yW5lk>M<a%2|DiS>YH6a@J`(`#$7XtRt<mtnd@lnKQa0~3e=
zAR8F?9+IQWVvt=i2n-dlbBPFs0x(h_!Uh7Rz{Gxns1`oJ1%4+0luIpoRr0w$8q_if
ztSv0Tp4c@)g)v2>YR4>YG=>o~*0eqbz9$_0726U=Vq40|U5JNBY^&v0Yzt<ily}oB
z*2CjFwq>Q#;@TPY4cpp~yTG>2F0d^wSE%v@wuSzCY^$IG2@)Z-EPbN@rS4iJwv~a_
zK~&xAjl{NMk=PbMXE;DM>IZCV8HsJ7>wm?z%KwFJK@HWuVp|s9v8@>mio)LF{R?a>
zSSpb9tha*t_t;jbSC0hccWf&PE#9#ceP5FjiEVNH0oyWC&GeEeQ9_>$10a6Ewrsy+
zTN+4gOX54W1>^XNZKcHh4%-sYxxlvgb>xuPR;|)EY)kxCYzvjE5o&_OwtNTklfPnH
z<fsVu3v6rRtp5jW3sd_Wwk0+YuQ`DB729IRLSkEDtkvij*cRwVYzyO8Yzu<Kwt~K4
zTLFd(7uXgkJeu?ywgtPuwwS+STQqaJV3c36t)Oq%7WcXy-YRZF+*fQ173vrZMvU2W
zn6#i#RWv`TQUr7Z4w%L`%!X60qlBpWYkdl2*};^64yV-xNMnt4kLgODXBf(jkRO-D
zbE2S<12a!wI2ZVmXpIwQ=}9bJb=}2`+r++7hpu=KD$t?-WrOc(DU-g|1n%g#=rIN_
zyYD?YKMys3HCw-QdQ^2v0|8}yL;M`<(+M#gLrWU^Ys$n*ppZ{X6R+4OZl*#MY@wL8
z0Bq)H5)Y`I(*W^_gkzIFBL}d8m;r}+)HQArBdUk@*cY1}s(co}(G94IRWT0&;?@DE
z*aKwid`hJ-#p-;ha+T3{0A${Vtm2b(l>F9P20n9iV*CKK9SK||05V&Tpej)uj!8$?
zg#s&(T00<II2wyw7mUQVb|$&Rpn*SPTYUq0UQ-zBfG<+@BYXZR<WO&s=%>CCC8kp>
z0#jqdnEX!I*%R0l8dFWKhM7DNHFD^RhH3~8SapjoCR~qL9vaCLeM5sG=D=_><*HyX
zaD!Mv({)O@!w*aa6Q{vYud9ju&?G1cO%nmT0en#Sp%UK4mte$B3oz0h(xePuw5s68
zMwjzCaPvFH?QLHnFC)l@F{+A%G{uIoOae%tP|QTAJu<?0`&E&&(tt47$q0sF1jQh)
z5=aDyvBS_4p^j7-1V&JF3o+6Iz)UW{#N7-52?pZqJTDOeo9sX_p-}82UGoKFbKAF#
zsZi_;sGA848+3_15ejbb!PJG~0rZGrzStIU5Y!hvs>L2UhrR>NX!ODMfQE<jn^Zi<
z#4=9Ne-n`nm<b2CGrdI(dI^DF#uJXNo&}yu)B`O9imGOgYRs^Po7~xb03fC232+t?
z+oGRMR6}B0)g2R|omv;zR$Pb1hn4Tx7Ln3065A@Ca;G;O`HpQ7{eo>tMAASXBC###
zS8U7oE4D?2#J1|b7--<wz5zrbu`Ouo1-2z0G{9H(4cj8WiTxGZLRwo0<Y@xicWf)>
z0^5S74lJGUfE$t6R`Db;-17atF%sJnrt$rTZ7~~a=(`TZe8sjTCXv_{;8m&xPUlt8
z`U`A}n<eNwwpI8qY)jy_o7`7yi&85l>R;FvVeJ@YEo#?38ie#Kwxx!|wlMU?0HpE8
zWVBzgEh8m23jt~*wlzE@%MN`04cjv5Lt<M@+e)ZLH-E*pYPeCjF0d`YLGBCo!JAI&
z^Mid_<}L5sUFR=<#kLy%g>AuPr>2;=k=RxPLCy$55{YfC&-c?95y>lTF@qIcmq?=8
zsnU$l0LobF=4h@n;ia|+<u#%a>!a!w^1_97BbAupZ`c-#oX7>XC4<DacI>`lTRwUP
zDBrNHtV{Me7uc51@3F0iKDU}m%vi4yCVs`XS~ME)8<p3fym|7sS))nwjLC0|%{yI3
zuK<R(E!ON;a)G4c(4`z#rpak8u&p~P@7%R7u&w(yG|G_JR?89uZW)!c@(tU9Be5-E
z6O;>VOXvdIYMZO@w<@Cn1W5%350;~K-k{i>(%=bjxcdvXCBSZn_&hg7d4X*~F_73+
z?5)HI2F-8SR)w9pf}ef?$~SB){TsGLZ+{)dKSKd6PaC#<fo)Oh79g=LOu=8Vt>N3|
z(%VEi%P})wu`OsXup7$H8eMI+Hp~)DR%;yjE4I~QIg7-$khSvPu&rg|k4S7w>0O%)
zCTnL8&)Chb?P<=q&4mx<3S}xWZ4Ee)&<qi9eidp}2O0r6fTf{Z77Ks{wYDQhVp~vB
z^RCHn*cRY2Ng)#3s{NvM6^U(4@Y*4<t(b4v*33sD&#N+dABmzjT8#YJb!S5=HW2sK
zfVyh_zhGPIz8^X*vXIyoii=O8`xCLR*p}SK{Ttu0t*Ecqmg{$H3+DsAe*pJaY-@4S
z<;$<w7SWD%z@h;Ora2PZvO>YMQ9>1iUSM0v{jG1mVOw(Un>&QpoCe*8YDz4PiAK5y
zZ$d63u`MYbB(?>xGjFlQPjK5Rc5|vVfAJODqUOE+8HsI0bxs~4u`LV@S?Ciaw)N;>
z0PO<X%93hVS)Y$VVq1G?F<M`-tqR*Hd??xHPpp?Ouq}c4glC<<Vq2J|NNlTe18Hp`
z_E@nbpLj^H{eo>BSpOc|;{1kf75sv2sp<TJZIyFFBL+X7-*6}@wk*J1DCm%!`-W}B
z{tMfp{)TNy9-;)<s9S%-wgB5Ke&N#MyQY7FZM7h=Ex?=H^<eyk+V9wwH(NA$`Yxr;
zS8Qv_$b|npwly_%Qw1R3j>NWPF0d_+(GG3NiM&e}*p`@=Vft5WD{(AF#=(W@4cAv}
z%K(XO5j}XU>Wsw@piqZ_Knn?yw1rX9$G5Bksdq>h1W}s7oZ^8VMvKLi>zGoQ{#Q4A
zv$j#|1cSrNvAssf9*fT=ybE!W<Gs1zn|6`__1r%Wu(J)Si<gFy@Hb+EWC`T_0a!qt
zg=y48A0QThAawf6`4kusgo23?CT6pfA@4?tK_IrUIEw?o#Gwb=0TK8B@vo8lWm_x&
zBPa;SGj=TG*nJ5J@ci7J@%qrOVsP`@7Q;GG)9@mwgElh!P_7XuR9RTa!LUj}v}h<T
z+IWCODKxoNJD3W(-=JM`ON_4%@YSGzWl%;CTo&0qruqM|cb8FdXxYB#aVy-tC?I%n
z_W}Y0mk1;zNJ7wH34|nA;ZC6e0>Rx~f)x<lAp{6g1q65Zdd1$|eY#KY?%SvD>v7+B
z<9=UX)`vC6SaXi~|4qQx(6F8+v8JHGeZ~C*anVq^<XA&A`h|{>IMQ6P#!nKzWFToJ
z{Vq0o;z)`8x$w%Lysau2CHGY{|LY6Uzw)-SPxWHAKYX$As5M^N+%D6~p35JOZs1@%
zk&w91QjprYdT-<Tu=;$Hrfb1<Z3dMlyK~)OJ+jyxE8xgnE&jCRz+$rYxkoi;eCxJS
zJT0pa>&RMYl~}?$e{DI6+Co~QsI3HS$$8<DS={8i_^c>u>urNX_^Xj>R?w^8sV(;W
z2+ojn)*&#8+6p2|epm$xUA_8^+Hzu!l-j6&@ha2vlntubqO1y4u<cN$(&Wqd?AA$#
z`;yfBPt+DB*FB7N98MEB(obDB*eND7!7}-MZUSPzp5ycDMq?DUWlv2;={WN~?{ohM
zo?>d^H+*_5B4dBfjDU?bw&W0=C&^qzd;}<J%Y8LF;R5TF>)kap5HC0N!v(jEExj~P
zK~Akz->Vl|dqD*yjeQSL)K*NAc)k~k+7fDMEGi22y?8;Ym3be>q18*HprV)OD_<2j
zw2!xXbdgq@YV66!*RLilzLwOqh;OE#s4ehZ(jeu*c9xEtAzx!_<xl>m{fk4sy5pIT
z0xc+SYd3Pf55REuAxEQ{2=dE)6Hpx*H*v#40&BUQEZjoyTmK^zwRL5?W$VH4(cY>X
z7-o;6wjSsU*}sD#f1|dte#xq2nxLpHl?q&FG@c8GO#d_vL1#&`jL2x%STqJF8}Ic>
znx+g<UW%?}>MgZpAZn+nrTmQQO!V<GPo~**mVD=weU#n6EDSp@g;qIP5|;BjwWWii
zwhk+Qqqed=;V5d$d~YsU{@VHjirSj3thXz#uTY6k2oyq5TPy~Drnce&NjQI_w$iW2
zyK-K9-7)EXr6u?Aea)DcOiAsc*ChpQYviA)E!vDbbh}qKsq*cGxlsUAMyJGGFw{+r
zZKS@9P{i>o3^Rt)ZVBUVwCE=c8u;T1VY@oBeJ{%WegTDwQhX%23eUR-#;UZfSg>$~
zdMDi1BN)KrJs?`qp+C>wB7XT<03ciuz{u|Op1LW*I;Qq3k%j70#;bH(g|q6I95ZX0
zYGSw03Br_Tdiv@Y_iWg4n%#rhu-{rI4r%z|T|ro}FVtbu^?IRNCWBIEEPh-mr%jYv
z9YDoP5UYVcwvML&mHc5h1-UgLjddX*Nin)ZyICD|jK0{NC9tSUewSEfMFiUtWVbKB
zLx`$?6gxI6X)hX|nbusY01tyJ^izXOaF}THnzGGodCP-r4B*|iNO4L1&ZQLPkfPBp
zwretciE1|NbhG83SLk7PCVWhc*|k5ZFSVJbY)O>2vGF1AzY%4&9*L+2B;Cyk>^Ip7
z^DpsWTGn`>#4?QusPLceztH!qJI2K2MoX7`n?(e?V52hG>vk~{y5nt~1&kt8X6H2K
z@W_TUbg6^m-S;#+f=fftmno?!&H&7CHgaxvGu~!*E!m+ZYi>bI7HhHy2zhn-A9!0h
zeiRhVT&g0s-qzbJs%<WHWuCEUhd7E?q=N#_x-}-$2ee8_f67CSB3Q7{@8|UTAFK5G
zCAYs}7K?{u@91GN%Ay1Leb_lAqx0pnS@3-G$D-YR{P^yg=c$r1Q9pAU^g7}ve3<@C
z!&{^)F(KMNQ;PS=c;Ua|ZFRX8mjQ}w0?)ISqs7$E>RG9Y?AqTe>HwkJad#HJlW4}M
z8l0`+lJHDT84dYSC*@<D85GTYudMye+cJNOIoiWgTS=u&WMA}i?x41=%oXD3$7}NA
zi&$NU_O`v@i0_hcT|)(S>6<LOpNrBG4gK-_ZswY}&R&|XmLsZkW|C1_iILJ5Q?qEs
z4UKRQ{<qop=RVx8ifl4olKNqWunwbaO5YZtlEuR$*?}&g8;1M)km~Lxs+(CJi(pst
zMG4Ssl^RbP$dV-pLiIihNyLGHs%vRv9FGD7ky@D4lRoKK&Sv45H&LQoUsyzrV3;cK
zcI;2_+Mr+vV%JEyqGBsZT=MG@$lI1aGdjwOd`m~Tlr3l9R*;0)-aJltx_8gFG7kL4
zob{cRXHFFkjgvm+*aLJLv8F|Vw%}BuFJnL(Vm2c~JpyE)fn)%w@TbG#Rk^zU9&W{h
zS8?HLo)gn%Nu=5dGO=bm{81xZGH(gU2b1m{zLyzCU~yH$#32Fh$<{-wyi4mAdL6#F
z;ab>_0;+<X9yES0^*YX5LGR|w783F8Vv{!u7FNKN9?3Lz0lbkDdCqzMqugyMM}%p`
z4AlNkSh3T^g~;|{AH~F`6J%`?@#06Y64Jc;M!ddbkjYr4ellVG8I{koF1MFfKb%yu
z%Bc9%+$dht?}|&ja=5!Q<pgr=>k1+pSr06l{)sJ&W+y*g{7{0kDY=0NLo{Wa@c!1<
zMe5di+ZAUa_i@X9+MwyLB5ri1g_le7APEu`2fCQgCXz`3#9z!QsuISVR!Rb00)`RJ
zM&fjKlBQDeFQyMOubYHr>fVo*lfKCoX<pCH*#k$)uPF@^_A`-u;A7f8G}d^sYV=Ne
zlt7=MJhpl3%D-{Kxn#2fEIrCu^F%9PyRnvSc{^PEveg8^)pXdr`$pm5$LamuAJL?}
z7xF9cXOG?e80UAR3{vcESI&A3Z%m=cgm=GcI_xAZP*rHUsX~r~!TF_<)6hCDzgdN(
z=YZe+O~FH(J#($m@s^WBo+R^L>7#|{pD*vwG{$=loxlBgBi`zy%=RTKf*_QQ>iD=@
zloa%2OtAKBvbANfrlra2z^rX%RgS4K%5!|p&!=3_kt0So`Cz=g^ClRVKf8|6S?dLT
zftjjoIO1l5HjAV@F-Ts;ln0K%KhPmf>nGF+<LI0^6HCYR{XA<tQVTP{a#+B$px~bc
zvyXt;kNo7bfi@^0z&af#6q9Qfo%IMNaO5Wj@?}u*mE6N%;-Zo`hEc?U*=RdNof26_
zz&vdjG;t6zMs(Kf8Ej?{`3}-(@eab44@40;C~*X4>(mAsQR7|sNgjd85}5gq&<jBr
ztSBK!Q124aA<Lzto8wEb;wx0#A&PoK)*T>AC0hF-QqlHZxeR7h$n6P;{08;?BISI5
zz%5J@LOEy<Um9XPF`^NWm~Mp=hO9FM>)MQHzM0rD>H@T^gkX;43}9d;*G>OUhy{1#
zVrw{DKuejHbdjo%h~MW2(_4hV8X4Tg+(zBP#u}3~oJ>UBltWdC?MjKm48r2W%EOT*
zeA9OtU?IZK))?%^f(J!IPd|U@D{dW$_7Dt&KBudPFu;{SUvN12(7A$#+~dIlHyDDs
zzAP$A?4&Ok^O5Mn)c4CpAIUP3i0&*2Jv8G&d0WB&sNBdTAIhbAC<|8(u}o)K>yRE%
z;wh%37AKq?!4RPgldMh?>+}<ccS&1!NW9IKoNZ^;f+qw6?zJ1p%A%8SsVTO+1W087
z``EQ^!o*3*SVz!T7}W%Gx}dYn-b@rs{!g^2bM%=l#|JwE+A#P8JH~8+#^gf#psF&#
z)anWPq)l2fJ{X*51KO1&27$jSQ!;@uIYyabmZ|qavLTt)5#rXEOj?T@TiMvxr2T@*
zv*EW&7cDKq_{K6%_63lD!;E-}r@lQ4Yxw(KrVXJP-F_RnAO%girmTsf`SX=5w3k3z
zj#uJHYO$2CJi%8sk{o;u5J^5_`8ddZHx4@oT<rsdU9F~WWtXi*?$-N0*;yEc7AF5y
zy95>j0VU&7!RI>4WsrqA)aJVIuO0;Zoi(T)3+CBQkmNhH8`eTyH8=(565S>^a<g;n
zeO9v)E#I*dzjfyfjJ6V$Uwv)OX{+AO)R5;<h(j`=`1Q5gTQ}TiO5M@biV4MCUSkj+
zPtNb}QO1@c2a}pt4321d7}>-Usy;uV=4#9*vW-^d@ki(4>&A6~)mx7-jj-6{M=&^P
zu<tFtd$uAw>&w+PvE<BY7i>k>yXKJz;GbP}OV6{*ZgcJGV!Fz+-QzlkSu>X~K?jh^
zzRcZUAHZhh)-naT8=W|+vW?l}luobpJ(5szmXb`8u8m$nJpFLhG~ALLlTHN^))?sT
zqUO1{W`nin(>T<TuIi0p6XDe#A)Xs}F@V>?A`y=v5C`!|<zmgYX7{(YA+-$+C6^@s
zWxJ+KWSQlFVzA!c=QiV#41KZYljUGdyeilmCH^W`$(BIfR>5azro@lI37oLjk=qEl
zW8Bf{)Gpgos4!9}u0_Z-pj;|VR<^;z`vF$~MPTva#v}(yQrfOcMhCSJ${&GU{K0ad
zLJv7~u42DzT67t&AJRS;tS^0+n^c1$`#t93#KU=Ai~VXWcmsEA>b&ggXOMv<V;fC3
zg=HrjrHgjuef<<B5pOO!$o;{n90|U9MfPfC8`_Q^X3?!~X=GU4(Pp_^DqxRBoVbm=
z&&h#MRorMVwJ2uXk$lzs`GSaAhJ?yUuJ4Kl#<~&4MIDhgZ?ybA#RQVI6)Vi@-eBFa
z73}!N2c4UR5Y~g|&oG(Pp(8Pdq;X1A>}hCZr1=;&qc~c?y{$CQ_|NESHdqk2I^h^k
z$wiWCh>d}a|28aUd#c4?I`eM3Tae_04*|h?Mc-p0mP|m?m(C-|@qn^njuKHlVqj63
zs$P-w0c>c(o<JTVmLA)?=VO{1nBY=?@~q}M{Qwgbi!R)70)E6Jq#<eX<HbhUqPT-y
z;@$Pa*XyAru((16LFH3yTDAas5q~g2ad>+|;6`QXzUZh#xmD#ruG`zK$Zc>`;bx6S
zs5n|-dSl`ZR#0YUT2PGUm&lcT)eUJ6>cWJ;!b%?T=8f(^7Tco^<~1XG+75X6()X7F
zPz~Z=W`^u0IyT{az2cfj7{zTdHe*V_{xJ&qm%SY>v1i};2bK6puJkAZw(RVS6^e=a
z_k8C=b=IRP&{ESC9*j~&*kfKQuLp!4vb5)*#40Ebm-?oNlzvL4CJ>K&mSb%N8c0~|
z7g*_}#zV`shJzMs97|9x_STdj7?Va8Xh*pPv&cVYEJS%TTQe6O-^O;^SWAfy%Skqq
zq)IW*w4CD6k`!ctoF3XlYN(jC^&S5Hn@SxgC0r4+7e(m1Ygjw*9j$&}rBj%1pNsD?
zEq{_c|D!?234*)dFSfqdMounb{1A`-(HD5xIeZC4u~g{PDqzMGOnXN9wMJOtwX-Io
z_~uF#S#5;z)8>k&|Eh6^<OaI7htWTuM}ypLN0Fj*F+;gH7#(Fo;YkWds7g+O2N>Xr
zA3MIX;)}((YgcaLR37$=lAjiGS4N+gx1R!vFSV{Zivu-SR|XV!kelhO%8S@c2$D+_
z>>Qvao_8c3@7Z<kY{jVdA=)Iu^S4U1$o(oqo*@k-6`a3}`ogxO72LHwAKeFTJ<vSw
zkovCJIa)=i;@crU+8Sxe!J?!g-!1E*eA@Vg9Mi?|W$(342P43V3|GiTWf$9OugTsC
z*Snk|#0l$D`D?{RnNBd{1ADud?e%aUg=!yMKPOsJL1E=+N*KkJTP0^5gXAMzS1feC
z>er`(jysivJfFI_V`HT<C~UMaIn!{6Cq6l}mCd(&A!2&d(@61iOW4LljDL#MM(bG4
zu`dTDD!nzNd+Ga#^GziRo<egVQ126=;gRpzk%rPhoyo*658HM2zOQw0d%uxwHD$-6
zqxRM&@zl16?P`lZ*2SbV$A!wSPDgM@N0lJ`fY&t<U#xA6FgZssRCAR$DAO6}J2*=)
zPvPyHCzv8mO6ZYXBIUI*Vx}A;zS&JrRO&u+U1D+rk7>$wq#fV79Ubtojj7=t=9~?y
zG8|g7yor75_xdFUr*(&GHQJj?WudZ44(Aw7NX+BIqe_2QqA4QzAByqWN(2*VeBpum
zGV5UEn@-rfQ=$0DG1&3ep6yFtLO2@hw&)r?%*IB{>+wTUlkdmXiVHeU1bFVe`*q%q
zeIM*JNbc!v%1Lm+C7O)<L>ina*0*O_T?tfvGpT4H0QVS$fe!toK#wTv*Gwdyx^AsD
z@1*j&<bP1Eq>HUAyDNw&hcAd|W+Ejb1Vjh-+b|G5(INnT_gV!zGvI)r$OwcbJ6-$=
zW6md1h^3tZ4}&0(oz_52!KvXB4MKDlLVbenzcck>Gf*EOrjPmVRIJv`3fCyCMgb}o
zi}%Jg+f||1_2~-&*Qf8avTB}Gxk{zpqGFG>tKGfB4rN6h&u}Im1rgdaY?gG5y{2|d
zSIsR_RancfbcfqE5f<<hTTZJwbf_kd=Gwfh6U^u;{8Y14;<vU~5X*)^^AclC#guUo
zgLUr}Z5)Q9Ev6^JmqihCgZr&3<5w2Jj*RE$RUP!uL;X~Vl@E2N`pBZF7sT&>YWt*7
z+bBx9NIWIdb0;v8gaAIcnj*XPAJ&t>13eYuks9B<=OMmP`&q#8X!hP1Nw-b+=cs*P
zBA=WDBMSQ~rHkVCoDx#5@D3*HHBLG|257H9zEruwRTa;}BlHmgF5kpc^zKturkD64
zTHAGlAGT`paz8dk1$<~~yIM;R%-{XWcrVoE%;6WJBgVUX5sRXrNLB8rY0$1NR-%2q
zx<ewkgXv}a>I0a)%zK3+SdLrMXNX7DW4Q<$GfE}TQE$1a-6?RI>gT{_d$<x+obmZR
zStn7`nXeGKE8mVFmhZ|yL7pp$D_{8u&+ZPT8SkZ|X=eJ*atOousaBgVYI$3Cl=Axc
z+NM@Xr(^yI2hBpjVGXG)vxc+uarswWhiv%W2Sp8xgUW+6_vJ>~OVU(jos>3sTQ<FC
zzxvw!vL~*NSYtA=7Te}_ZuP1hz~scs57cOcDJ~naF4_$!+aI<Z)XlC2?rc}Z_(0a<
z-T3>SUmo~{+9G|$@VxV0W^WYpKjOYaJ=T8e-ODtfEZ0WF2lxGKhsjs0%oZPFFa{!Q
zo)>`QKx@*#;}`;XVFnmj#irYn+EuEWpA`ZCbmDK%NG(+Up|^GCzMbq<4r#aLlL-GA
z+p~``y=jsOn(f&ehbo{_LGBQ0u@96sV^P;}z7vl*3=1CI7>w%U@gT>>^9{jr@5#Ai
zTHW->0>lntbrMZgmc%yvg8R!{gZl!h)Ho@)Os=c%xv=S&|EzoK1tS<&8%cH7rju~{
z-P_`R{KY;ZtTovrJSTD0@i~D9H@WbO-X)#F2j#xRHCOa*_S03|8y(KwQ;jL$>h-7X
z1L6*I<Fj!>uflnv9wfQ1X`*lTrpl)qoOC?=Mk^vwZ%qe#l4C}yGD5v6@`xkDb!*1P
z`HAo5<0PBvTW<^K?R9-7WOvg2EtyAhKPZ;x$`~Wg)!nR@Na6}nRCCRq0&OR_hWsKH
zV>K@%k??x2lm-x)9Z6FsHC~J4G(ZoC{9w|ic2@^S1wRd`RZQMZWF&0NN~J?jX2q<x
zQ}0)kGIE&L#W0tSO(}6<j4J`iNr~y>DQP;$zY!nj;GnZjjH0G_X-3@3>7EY*dpq6F
zz<E;cK`|sLHI~Qp+6;kU@NPk55NxbfQ|NjpdyJ%MeK}KQe6be|OB1Y)7P{jh>CD!{
z>2&{Bh)qic3d$x3^#{y#N*Neve9gQ=1-^oiOG!QRq?$CcjNh&bP_oBMGp=~4@%Y(~
z^^Q(X>ceg#X8B98sc*T)?RPyorNa3=Y+Wb~;x5hwJL+4UF^zOul5&fQ6)5sTWxN{1
zr9}!AA3l8a(UWH0{a5Oz=Z}w*Udab`LM*2~EOZ9RAfF`a=L02lRD|J>>(NyMBc&7^
zYDn>65S<lz*wNV53PQ8Sbj29=;gbVw+Kh+#*mnqDbync?+Sne`tRz}~Nm@x(P7b0-
zIr{ZuMZz#7n{bZ3F<!}s4WR;+ciB!_&rS8B-yk?PR%5V6SygrK6VJaTo2&}q(Aae%
zu*hC}k>vrMy+SxTIctP27hS!QUajX_J-urxC8d+|^6T{t!(JP<KtZY&eRc<tPNxu=
zkTbz9TkM0}kZb~#o#1Si#<v}uRDO`uRR#(&ZWpJ%Jp|RH*9L#;t+yp->wLkr6xr9$
zl@o4io$-P`!-Zm%;ocX;?-8Zu=KxVeh*d5xQV%PG^5l1Kt7O;JS<e8B^@+1DGm-d3
z^0F&4#br`%)Olh9X88e`R4d67(t<^+fwER0^6GdY4Vl~7%Wjc!rf0ko9TJ!03wTei
zIdo+naikyanQoqr>1?j}3chK1Jr2i_LU~(@yWV7&-vmCiW2?l$BxlkwpPLCq;LAhl
zOoFlUp7#)Lt6)&dUc!I(wgg|DjZEZDa1iS`VaRW;1&K+L;Tsj(%bPyclF>j9wOQ++
z*B4cl-P;e-!gF#}{FAr!9N*RI!4m!Sl&VAvS)_B^663A6HBT1xeqxFFd`eB>h71a!
zTxP*HR##>wj}CdTjAW&oR#&_Aw&IrAxsC5@J|~Y&npozLn!c~=MINWS+1;f=&aTI`
z1<F!kYC90m5e+0ysED&PSd30Lpf4pOE65oko$R|D@T0D`4whehgKIiOp49t*LoGL2
z#=}2fXQu7mhnD>?Qx9d}jFFm~O906$c&3Fq#yx)gM}u}3SxK$#uV{W%Lfwog1dkH~
zXCvv7+V%55ZK6Mf&!=_0m0t2|CKAs@T1lxSuHJ2Hk7glP26&8MxD-syN>cgisi5(u
zkDIH?u#N`R_;lU%Ra61LoC=a>&*oAZNL)U15k-ORG@RK((uM97jx38=$cc5GXyZ0c
zQH$iW;7)QgBm^)picU6A9xa}E7^XgJ&U^?cl<aLF&gO|X2*fB9zkr3yQ?AoIGz%13
zgNB;!Df+x?<J6yl1atal5Lj}3hViY|tJcE=@Efh!u`)h?UWv<tP}y@jiwf(^f?XFA
zRjI0BQqtCJgk2-JcV`u~)}1Uemrd+n6va?TESHoNkE-$Xp(Sg%AK@Qz!NY@vKlR6h
zsLXxt(aj**$hz(^M9_k&d}<R~iK**h&CAawGo?d$URKR;`7y-t5(i3gG0&jgqs#Y;
zTH<)uAO#}KP`YHva4+OD7rSd`SQ*&^V<k72<Foz}`n3Rr;WLjOKy~bIh?u8ojpR#X
zII?(#bSW(ad%`h3^ubL`^la}1e%6R6L<9I@xwmcoDii!EBx4?_k)1}hYa3zl+-QWA
zVjp&oF7q?}6Mrycfuf#~90zghj6|zYf)MCDCWQ15o4!_9mE8bF_@qtru`TA5hs|gt
zt~RF6wjfEA=M~HADfhe22K)s-F)kJ~tUu@D4GjX@hqu-v@P8Fj(9HKO96SUQz3bVR
z=-Z1I9HJd^?qVAiKj;e`nFhJ3_Hk`OqI9^OnZzd|<XbW-T|HhgkDGN#xa35|Khqle
z&v;u33^St%C)EYdUfY>6{G6UVsco2h?dZ)gi=aNO?|tTQ3!JUXXG^G#hM1Ts&+R9i
z-dh7l1-w-vd@xeivfmaOF!6C7{gZ_7q$0LJIR=Acx)SxC9{!^TO2il9{t7$@Y#w+9
zHO3G321K+YPZK%=_NlVK6^O+Ba*38e!e3ODKQPvjab^B_XNxfem*)%&^6J5$>f8&C
z;cc3`+))__8QM-VG$$HUY?Qb%KlC&-r@Uzkq#1$}MO`+n8MnIKJ(>$qQ=9{8cuS8_
z9UMO=R9evggeTb+O%hl>w~eF(<4T@nkiKV8rav{iRO^AcwRSvX_gux*KO&9_T$|fn
z&c9S6*o|rsxB*2u_RLP}5Wgq2+`Z{(nv^mHzE^3YcI;^v;*xjs6k(!!VARP8b#M$>
ze!3m0;Cb&#5qr$9gWzH(pyk+uEH5hc2&8}3uN(6rMdanF?y1tAObmcWtLbFmo%#`j
z!DZeOIuqx5P|L0}$^1L!tLo?=P&p`2j7x<!_tdw!+4=B^RtjrYdOIC;d+7Pomy}*U
z5<eDv!atswlgj&2F(b&_h)M9E>;6#$!Ncs~Wgs^J05gn~FOpy}k}ZYg!d`$iKMG{~
zo6P01ONdj(UK>S#M0G9E1g{<mio+pP#XCe>5zMj<3y~y@l_;7E9l_<xctpfVsf4&1
z1o~%C7$I=~By(l_S>}Ra-pX8{rI9kcC_(&B<@mQU7dk6t<T6wbKZ$fcru<gsqQ)Tl
zz6YY*p|!}M@HYpcWG;Ew9CbT3FM^`Y2^2hn7cD^aZugAZ;&fRNv;#U-A12-xq#>^$
z{QR5DC2dZrLyUP1!JOWvNQ}ay$vi0~Wp>*k_~}GM<qPDgpzeVXp+{5EU@)kfQ?@}a
z3k8>MWiA-D42%RNa~Wma%3P14vBUP+b-;*xl+4uzh#c8CAtFH%4g=jBNmF(g<;_`r
z9LSFc_XrW|>cmW6BB?UVD839`=KF9rIWM&7GmZ<OEkFsn1Q~5gmrk?^3Coy|x0#t(
z=}t??DHl)k+g5kXS5LOduE9*Mx*&3c1p<8#u@D(e#rl__)fN2(BXnjL$AvaQiUNUi
zcK%h-a?Aoaf#&e)LG&u20Fc080cuWeBgi~DeAF0qx&~e#Fu+`gVEh=R{V2?yu)lr~
zMNqB}LOm58^EGPU<EEX952GLp$m$h3&pyi*Au)s7FyPFbnFgI8i-eg6eB6d$yacZ|
z!Fh;uc#k7^5ikax40Z-3LMjX1jJ-`92xH3*aPxp4SpWwj4wjlAoB8Rxdu=4k=BJ%)
zz<Oem9WebBoU(9?uObFGBfwmNAavM4rx_yMYg;T<WNw295{dAvj&c3)p;|Uy$t-1i
z?Fe+^r*1<C!}chYE7`ZBc#g>huE95xX0*G*D|?FceWN1RutjDF<3u#a=qN`)It4uA
z<fel0M;k-2Gok00v;-@Q0RJ_I&MnS$^&8Hm9>uI8far?k0Vy%-=pvY%B}()bdd!)1
zqc3#KxuT(`^CE)3VlR1E`7L*`s1}7A$oYmH6{BLdjKIXy6AY9)1a~8kP7uVg6+8uP
z1Xt<Q8#)S0<LC2=AfsVWp7T~`+a2UJSV;k*v}#DwTqSvJE*1r$F7TnU1ub5^78i?V
z-`riiLMQ?#)dKYHc<O=pbZ8SqF1bXcF3qL3?^3+h!4s&GE;H1)>wD+)E}$GC@$O)K
zh-Hxwa@@6Z#oE4tlF9m`S3A+Po6VWQ`k31k4BcZ|qoUeBCKO(fE7Dl37Axuu3+SF!
z9~}{Kt&adZ%bA<ew(}K1wg}<#LEz#8oo3igWYnh8+tVQ*#va)5^D#K_v5w`z66?_F
zb4rFIeVwcwRb^+8OO@{E(bY^WXi`KGH=e)+o%v{R+f3~Kr#E|Uj*Ip?1Z?~oc@K=(
zGBr*I`D-SQ8c{x%BHQs@EhK1>Z9(WbzmgyabhpY!`~I-@J_S?WcVOZ16B-oIg`hki
z)#)I6N@cMk9LeYcS)cq4oQYpY`CJ>v%#;o+$J)3;Rk&nSf;lj*hS8_6V_L$Y?U6`>
z0yHuPR)eL73oiwpU1z{&4OyNYojaj?F3>4I37tRUKu1h1M`yu={Q0l%z*mtnbUVy^
zJ7jjQ=;!7y?;T-vyGQ{KEVjo{K9{MVtI@{<5Xy!MKsWyGNag~eayl>uE;8N|2GUoa
z%%=lK#GYQ8Kkcrxaon-Vazore3Fb#lemUD&3Ili$!a$Mhu3G!S<E4Xb!V7d>HOQS)
z&~=j;WlQPnvPlwTr8tmp2oNJ=PD6c8NbGR@8kqeEG(t=wZ@$X0bC1mBrY(lRi}Yoc
zA|b)S*-(Og0bJ;t0}=lr@Yn7lVfohC>jjr%^LuX>xhOc_Pg;4pQ5vDUy{Mz$i(;&d
zU5JF>sAW)F)CsV)GgP4+@Ku3`hMj~afm^%Ut-9`xk?tLCcwebmS#|WnKH0t-0(>~7
zEUtS;r-Yz<cViR{Bm|ujg2bch;FV@%<WBFe73tH20DVH{<FTl5rpJpa_h!&ymz!Ox
zBU$(<GUcHj_=ID@jFM0ABT?zQH?R*t1f?--i5fw<i_qf*EyNr#zNWtMhtTn6oM6?s
zDj2a2nUNw<MwdLg?C(aG5sdz>=!x_qGYd(e<rKScJjh;>)yW-bElC!i5afKu>Xyjb
z7teYI36{YK_S^@p!G<g(**?JTLY&aSiJ?G?2V#d57Uu6{z=$hFdM9Ck|H!z-TcU$O
z0AG3N_*rOd{EBLZaR=>$3p&ZbFzIulh+X%H=_$BB`rG4(n;lxHCXwc00u&(Sn58dq
zI!F*B31xWyUDbTGd?=c8`a2vJ$xRn4VjL@x6e}|wtB@3Z29DG8#k!LjM`r=d7Gl+*
zi+h>`HFH}~+~F)pR{>?(#0ry<JS3ct0X6Lg<m?DNGfq6kd$o{GtqKEF!Vlz?){(a7
zAcrJSdgU$CRSXZNAlssCCxAO9ew~gqqrM@ST(JE?um`7#hLJSE$!3X}-Z~IrQE4uq
z@jXK+T`T}XbD~?NOYz3Zm?vW>=2q!~iFTB3G?AeF@UiGdDP4-IP)N$4F$kLE&^(<9
z!AsdLwIDM8Gz`C*94FcOP3c;Dgh)gwU5ffP4M5sb>S7jw5;Ml6s!!Z|MC!!J<0K4C
z0^xQfOmPlGP|$H_I(b)F)^HRxFoRL<Ec0`tpYR8UALmQ9kpvhgxT6rD>i2~iN6Hz2
zrF!DsFT;>;={cBC>g#FX0f>gsd=(1HqZzq0_(Wg<1J+Ihkp{bDpHGPL>6tI4Z`h{`
zFu!`IOCReTF1>W7T!!5w4l!gpm5N14{oEyk%`lOD2JTFoU(+q(=&sA7C#O2*JtV1I
zpD8sYA^Z{RW2w*FR!ROc+7+9jwgmT;HbqiZ+q`t0&@YzwuaoDKQh*^A8e0;=X2lG^
z5VA4h*Nrn-CH&fYhV*MKwS6RU70Ws+e|6GN24f+B;!rgeM%}eyouMP;2N>YFOzp7D
z2ebExJ@|5;<Be|_wMyjm&?y0ashy3K(7PR?$|y!#lI^P`pgcl&;W2271Q&6!QVEAo
z94|IL-Iz)^IzwzWCd7~aY(HL2wxNyC9|ehfbdZ#RkUS|J)1<7C^+1)Y_Wy{tWirs6
zGSELeFw8iJ!nS^-4E~%QTwokpG8tM;8QPp3+GQL*G#Nfk8NQqyMlz0IJ{!SJ9RZ}~
z&7zM|VT{tu0jcFi8RkYosiSw~Mw#ZAC{eCf>X?A%_^r|f85estF5@|IPi~BxX`HTk
zg6(=-S#Ip{v+ufd6C$aTFPbMQn!g)1k6B)Se?K<~ocr<adQw2{hxy!h@9U`mrYYpd
z>q*z^u{p$eDr{ONb;9p@+Rt+)B6SL!I#bg8Gs$y0`q_^v&oQEAAr-W_Tc!(b4#jk#
zl&+a)SPx*p<+)p>YZ;|<f#*?5SBm2NIGAer+1xbK+=ATv&(!(t=J|2Yxt~mkU!I7c
z*Yk(XbEnM<NI5ue%N&4t5%Fx1fq8DXc?oy}2R}#Ldyd8PeBr!#?wSey^BEj}etC}R
z*Qn>B+Vf?(n`H{-)rVhx3C#Z*Wm=K=vO+Y!;^{RHX+c~wt)rAK$(z+*a*F|95O<m9
zP)e7u{K}}@hRv4^$1kg~^2=o{zZ&M(G?~|nyf#qAuO0J7j@Np}^L3=q{C352tZL@%
zpVyn3Uv|#tXNOTtmk-GVI{quP{b&@^g}zT_N->eKZ-quU0U=@arv3st000SDk#w}J
z`vBw~h4(%ia-RW+|GUx!MJZii02J+{Mv+M!{lq+tlCbqee}T*vh>udb+*^-VeNNLL
zCw8sJrV1xkX{U~9r~0PH#tX-GrYB(wC(ghV*R)el;MsTZnO)jh9q>Hb?BdhHg|5Q!
zW8_(m>A79n`5RLvx7L%Ig|i0lvjX5nhxgTV>s6`(?pW&yx)KvNJ61H*;4x_kH3Z*P
zPE%4XHOqha?VY#T4mwJK*g_m8>O5-1?6ftMSV?;<NR<#Gpxc1DGh8zkOP~6Iv0!FT
z3<K`aS;76e;WYIL8+z#%lOow>6Z_x`dujvujW!lB>4$40nQHff_i%srwvy$-#Q(<I
z+MH<)lla}+dcFBD73FOK805qM;%!M)F889mt(I`9s+GYMnU9fM$7O4y*_xl_Bcy9K
zz861@bravL+Cq6-KU*SXe)G190Nc{_dx*|328Br3_cl{4pJlvvCW`Q=tq1O_3bSPe
zTLlh=SW72Hy`_Fr{9-2>)7))s>*v=rLX(E8^P|n5tx*cCt!=xPm#uuv^d3hnN_x@w
z(Q}MHU6H3u<^%-!{&?0e1HY&QT?Ls3ZbM*!Ud&#27Qw8MXCQC-FTt$li|d&~eB`zH
zSO5_$v2+R%*`+_RU3j+LbA}>&=8^B<__=0LD7DMiRf)WSSkSZyt`hZ|+GTdDcIjpa
zDSt2%b+#n-Xo4!+KOY+Lr`E~Fvr37LR<}xZn-8)2;+(`~m9`TifeS>bUHZh4SJ}k$
zta#{MB7D})>V675XM}>R)*1O6s?uD(@n*s4sBSZLz7DZ+CDczUGB~}Hh85btLz|W>
z!Ce&HLbqA$wbQq0rY@ObRo+glX<yN^KW$gp7_v$QFf;0o;4mw9Qp!vvK;{mBbec9^
z`2OUkU3>SLI3e3C4Fj{(-OT7ihOi0iXtp$&%QzMQ)io@tlWSq|m(~`wAujAAPO<Rl
zVh(p|ClHvWW>6z1+_zsGwD=;uGNL%2KIuYnrzNOd@m0yN2LTSfwWKhA%#T9lbSd`F
zTft#87?|Nw(ogDMiwiyBEAPoU0XRlusA(O2#1RR9JEkE}k|v|0K;$}V@UE8Cd^lL|
z7a?n67FTz6a9j6}dm+UrwTm&w#&21pr@NLc-t#1UCA}b|U`5uw2miX1-l0YDhLMT(
zNicMNBJk2pbUajG$bBjER_z+o)_JcVWGbKJ{)jjbrFOB5+Wep<L5AiwPodik!OL7?
zE8U(q``~mJeEjbJ!*69T^qW~qc|MBm5^+ylPu1au&q_KgQHUJ*yg#hFv*Ug=rmHJw
z9InTYVKBqC>2V6J_+lhZ#rBH0J0{*V@!T&%H}N8j2_sOM<)f~*)$p>uC(7Gutri&@
zgyI^9zwp80gG<&wZpHebOVdOF!za#c!!zi*SHF~ojq<i+UTb2hkfx(6NGf7!IQbj)
zckw=l-61b57mD4~!!gC{pzX8rOF+vYBH{9-h83t!>jesjVs)|*I0vinWs*e&tGqed
z3%YNgNs$)Zc}K}P^nphvWl``qKH|}!C-$u7jkKM-)MU!TX2^s)O^aCXdYmHc?U!t7
z#V|?c_xx07yXj!03`EYjZ;igbU>2!X6TR41fov_kyHQv5SLb9(R>WYXz?Y`3Cy4TY
zko}l;U7eDuGO~AszI+z1PcPJkpCKiSdw4CL?s}C=giB4h5lSd?Gpu-Rp2KU--Tz?h
zK(5xql21RW`B`J$r+P+QGJ|u$=Qqm<y=b{S*UAG%^b|?7p&aNk+!!>GE}v(&IE=11
zF{F~m0taPtg;h^_R^sl)FEXl0fdht4ibXzdd#p-v_kMZbHR^K`ZY7U=tgFfRMn<2G
zLlH2g>!GBUhR(DmLclZZ=cPye+&NG}AXHymqcm`d(MlMJwN^;S6(>>UK1mnSrcdhi
zmJ!6X?x0~C8Jm0L$NSnw`VFRG(tLUD^qT?)mp)jM*9iH0vjRNf>6DmU<vbp28(qgx
zhV;z0kt$+52A)|Da%c9!MSJoexAwI@ep#0FlF3XMhX*5nESDFd6(}kf`lx0ou%yz7
z*LawRsi7~h)NPyVd2{BE;l1OMrGXA)ebr~!g;;5mKA$nsXN}H{u8KFEylibKc}!f#
zWt*>vyWco6Pqa{c)|eAb?xQv&@KJV5yta*@@q>v*!<x+3+g8s%H&10!SJ&Jr(KqA$
zIZbYk6Mj@+<@9l8ZY-guMXba@?y1hA25)&Hc;`)bFY@7_?YpmlH$jhm!)Ewd#%q(g
z3-F#hKg#fZ+$49$@zp@se1UJB&z5DW75wx3`PjRrG+3F(F@t6aQ+#9We%S}hrwgO=
zr-u7-dk)<oc#&IITcx(@y@oIZA@1gfAK!NwErs;n4EVN1M2Eg*lr<&&c(0TFRd`6V
zuf<-WyB*v7K-fLfCHPR{H*spgNI5OTo|W=%{3p(l`d^pmKmF)YT*-sFPAySvo+i#r
zl*gA5vWj2T_j*O#SyLfkapmgZeFm@8Xr3Jxj55Zu6c<q#C4AMdXF2%V?NAJnqSZT)
zG~lM1f5$eMX-Pge++yf;+F+=a*x~s|6?V0HhzYF{GD@o9LheO;Mfkebu$qg%<&hrl
z2e#h0QC`#XtUMyFk)F_G;~aV6Pll;-r~I!bSgnr>0C<~vYJrorEn?`SwhcXrp9YuK
zwldz_wfnX=Gtt7#QVzJ{wqTH{r`{>dEsJ=)<kUFLLTODiwvP>F=(_iOou$rM+ut$h
zbKCL?yjpkrwNuzv!EN!=23*=*SDD=T-IKS%gqHzt_dvrTNmfF`sk`qf0vArjdE2mc
zoH}Wn#+ggqY6T*lCq3#AELXsX>|ZFY2H<c;&h%~o^Fg#>$`U8;IiHHoLCliiN1(!h
z{_|3oBsTh>DAj@drJv>rd6g@H4N?P-y&S%>QXmTz6zoPm6E=rydTxA}t{)mq-k{r)
zlpQNr`hK2tTmlF*X1tP~iYjou6V<%=>QrRr8*{2l9n)OF12sD}j?}zQSE)8??9<Ki
z?__*ub{>V*;vEhB$~W}f4-X3aJ~*$1euG8m;cngVY;eCv*(f`{^@$$lu2t`w`GYiE
zxygIF@5hioj*zt~QXIoU#v^p=kAKK+J&ZaZScM&zf09eGaeVbn!t1P4qJL@iMq@or
znxsul{-d27@yh4tIm4!2hd;k~7^opHrqt|`-jp3~DVtu5=M|hL&DkSpysy70c)|Pe
zy|w_NH_$Zib6z{-<$_-N<%ELv;jVYur1xqr(re4gCv4RVJ^wdvYt4rQ5Ax=L53V|d
z_LC1;FoZ52!q5X@qBWr~f`IaEXx1QitbI9yeYvOHSh!H$mL+?>uMn4?h`OJcqz>Pj
zuT=drR8)uD+O4-m8tf;n?r-+Z4;=iPx8?4rY~-)&uCMmHw`Cph@|V9}en1v`z~ftQ
zEAW0|z*F_W*AoHe!GSjUfgF;7mTQ56Zv*YPg5IbHp-%-m1_x172D$bGd9DR1eF}o~
zXn#Bl3a}0i!gDnR1&85j_y-3^;e|w7E5GXrj<1)D<O)g34+&HcNmvWH?-%l!D>SP<
zF!d}XFHtZ<J+!DN^r1B}G#@XlGc&YAJ*?);uZ%XVA(6AnI;?puj5|22kt_UddswTx
z@9%b(_*?wmdTf@s-|Q|k#ap|}EW9*7xT7aR!!Ue$4e}I~s1L;w|DEnaQ~I6m!hVat
zC5Z-?41i5VoF)Pn)T0=<BA2ZrxAG%_osnoh5m+i1OOjES`Ti%tQAGEF7x_@ysi<Fg
zO0UtNo59c_LB*efP<*;*a1WH2JEofz1DNDbaUQiE9KBs1j-tDmY+_g%BG~T7x?@BO
zP5W>eN7Haaw^4MLpdzhc<aTguon)+7NF2LM?7adX>2okOO5+NFqUbKn`*B(}NIy^#
zs%b#484`c78i#`wk8Y!g84`KlEE>xPYHIBFq&MF2KK=9FgmIb#Y|#YT5cI7-+g*>P
zJ_)TQINeY51bu?gxx3z1d^a77qPw<xA{F*NF^42_NhSt_B)K~$#@o1sN-2gLC*0Cq
zBhgiYNh$c@YDq~&#*CjslBHLZme7*1J0n@zqL)x~ms4_CZ(w0>a_c&MY42x7n$K1D
z6>EN{yY|ArN~JKlC$({>+JRDr-#c8R=&tnCndulkZuFnMsY^a7KNY`VE~iWuKt`of
zH*GxbgnVI~ic*$}!^V$4kcw0cNx^yhWtR@J(fb8SNBte;ZRK%9Vw$Dn@}M2zC*j(r
z|H<y!1CyAgV<tmx@Y9jp>C}B0#labLjb9jMGT0hJfCQOi+?ni!nNaIY&Wq2t-qw>~
zl($ucpCufc<*J?~7MdiHoTX40DASkazn-ONn{CRKt$dMi??bk>M!@~T?5DliIvP0^
zYoGN)b8Lii9`@zP<K-A@#NK*a(tf4{xvbo`-d4i<9IK67v*=tqp1hIiT*nW&&eD1B
zLm{th^X7u{J`m&+_2hX<hkMiK2W@!!Y2-Ir=Lc`(=jP>y(T7D`<j32(Me`Kos~05n
z72F9bNV*95JX4U>_d1QBFoCNuyRh)fD`a6_UvNQVVa3L)l8r)NyrRm`B4*X1n&hCm
z<f2xdr(gSu9M_84Y>S!h6n8uc{OMLa7z&}zE7oYdd%aTp{fQUl@%_=hte?K_lN%)v
zE2B?2C9*t^Tu(|?r9Hck2$uS?=EX4A2+E*O^0pek{In?D4=uZcI;L7ix1k`?=6TLj
z?&fBG{Uqy&TN!3idAO=2&d<{4qa^^|3V48q?Q*%;McI)=1p`2d@(u>IYlZ9wxuEWf
zI}9e!no^KVHk+Lz$7ZFBm>zdgr80pIn_7tgZ^a^RrASfsj$q~V_$}S_$KDoijiF}E
zLpx;6<FFdzqME1uzj<4qYrGS1<-5vcWwKFr7lXf?-EZEOBcRTix9*K*oh!=Q3afjM
zVz&D0JU8pS0re2xdOwCbl-)&bSL=YHyP&l?@cJk~Lo{zg>}CD)Xwpw%4M}0Das3Uc
zn+>sc4N1I>pT0Jv*)`??8Zu-Wi=H;-Z#JeBH5SP<mRvU0Y}QxseoYP&tL^^^?U(rw
z`!!LMWqkB&)8$ts(xy)`O?-Qew{BN?RS0kMO9WMKE$uROij)eS5|0v}Xqne&^Zd_v
zfPtAzXl(@!-Eu-no^wlMt)sPQ^ZsX=n5CAejF#!AbhAaxd;86S_gi8h$mV=->tq=1
zX+Qn8W}BaRTOp)vH%#mR0CO8{I{~y#Yrc(wsg;nmgn_d#3EQX!TAn;=<;Q8q<!i@p
zYAX_gg+{lNZM8d9wEuY8UW~3oGeGM>*}P=e5fKd|^k`p~>BuGP;A8CMx#|cRZC4F%
zQ8(!n*y^+s>I{nR6y2hd38$6Zq8DSNGb-+68|WmlZ`ai7G?Qi2=c6^8{Z<*+r904N
zZQeyN+xdV{T-K!A*yJ0nNw<ww`%A{I=S@z|v)#)zT_3a@eP+9Yw5T0rdtB_lwZwG0
z$#zRz_4u2#1@d*O$vPxx_1?|wEg<U%3-8Hbq}C_w3s0dn(PDg3jHJzHWDK3{%>nn7
zZFOjx^!c0gXEOGs@%0yG^aa5B3Ou?W%l4L%^?R6fB@Xm<g)`!L^xMo1)Q9&_Tn!YB
z_WSPlf72g~ysGFA9~dX>SKAt_;$zw@VqBFO8VMh=g$;b2rEm5a?1~=T^%$rg7y>cc
zA&NWuOopE14zF(wXAKM=&knug8{T6aNQmp`t{A#DVO-%GDS^~Zx&g_qhpApuuV@XO
zpzDl9kMw1H!=4*K9~|j|i~@b@&z#4oOUBH=qrl2hrn^7}xq)8&F^WMP^5!uqqDR~%
zz#Gi*!~L=I(J`))@q2?+^4lQU*Z<esdcANOv2b3pa5=bey^UNz62Z~=;g~vbYzH`Q
zBpkmK4nPghci<$%2r_;Ig${zs0YMXqpesc%3?Z0y5J2KZ5dR{Z&f*=1Mb5}Y?$Slx
zp~bs9ivq+;Li|f2I!j^>OA?VwQl(2WLrZcyOA5rxVE$!go#lHD%W9F!_e+;GhnBT>
zmUW4L>GS_G)cN($;n(BHU;l@^t=#{Vx3#3R^UGmpHF9UYbZ2vDXM1O7mw0!dfA>&l
z_t;_gG;;U6boUaqKfkk!B;G?8*u&J_!*<-mjoQO6+XD>m5$*1gknEEQ>{ICOum1m=
z?)r<{^-s{QF>m#4Z;^2ywFrp&17ERmKds09lCc3EJO9}2N(k{m(OtVCDk!}xIouCL
zckM=KOh-PkjMDIcR)2v8O+ig<qP0C@8p2~zrej~ejx)%N3*C!*^uMonEo6J3^sc#F
z$p2LD`fqgCadj|C@A}`NyG}bY{x!O*{Qtvr*Y^LVyRtOXbebEFH>axX7KWO?p6<ds
z!jM4SmZtN=wecd;;g;sh)2~0SlXY8Lt}l-en+wCO|3!DH|B3E$q+Emhp$%2R{V5+w
z{x`Zy`Ihclq~_p&DE}k6>jnAK|DwC7QFPb6|3-HiAYR_mU6v@iYhU%B(p}nrM|Um4
zppuJmqJyHeHX;%7tlvenvv6t-|C;W)e@k~+W$Ohg&g?<|i0&Hk2fO1X{)O)H`;G2;
z^|y2v$zRi5aF8V_8(kQmlFQ%HUGD6^(OrwTbXQi0P$WBw?n>^&Bw$9-T~Qo6@+i71
z22NI@u>Sx>cO_5B=#`c~AnaGXzWI&rV(Vq_+EXHJxo8Ow;^?~3(EAJB6~$3t9oxe)
z*~3_+c)>SYp*U$xez!fMke5`1S7wY`q`}~p?y|1rlgId;h0j+Fui$O6KKz~T3jGt^
zrGHCz-MOW^)RC;|;@Y=#*V8|uyIP`8=L1EE)0f?FgX<Jhajg#(n{!E3{*Lalj`96<
zv-TIdi;%TZ0eL;YCV|26H*{CBr06^FpXn}ba_!&guKW=88!YBdi53QjqD5|aMdVxp
zZa=0-S1#Ihcdqi%SMdeF!kO)A(R+C2zd?6J-TgD&6%^!HjH!5c{AU^TldrIKrr`j<
z;sdglC7tUJ=q|)Rq`P?kknYl_K#EL~U*FPQFG%AwVX~rA`M9}?z;{=sa7GZR*0clB
zr=O`4SKykV?b2tRnlOA<92U<#z2{1VmhMN?EOhF@G!2C?7Az$d^wifNZ4@VHpy&5w
z5{-Vd4Lx1@vHWa~05)5Z8t2#gd*1&N-Br{vU5);a=q`hQOm`Le`PicM`F0wxOn>~|
z;gmt5mJL^2)&dLQlGo4SA3{5;SG);=syO}~x~mXB)B?|V(;EE0OLuAhi*(od|A_7?
zB`)cF>gT?P<GEaj9aqGB&{sIQ;%3E^?9?f7!OhY!<VWG|l%#y2pPqT2R8jk%&|SU~
zQ`>K_dgK3Xx+@o-d*3Ix(eky$({&8-(#VFPh<#TaFg7z~2EME0!?m5&-{>yKDJIno
zFt_j77F&)xCc_)o3O}dsJv971vU;kdtPIP&1Tb9E0^V<2B%OWOFyY=N4^o+R<pJ8*
zisTx@ASJS36x}s~^=G<E`|s&4eH7g#*+Jb`9%x#eMVt&6De}SyW#6;^?{wEZniRU&
z|B~+dMJS2qR_^Ikk9+>Nbl1VZPj_7ea+tDfY-Xx6jREvyY$)$;_SC7aypI03J26kH
zfY-r|u^+s9xu`$=M|9WITe>UxpVD22w{#akwh0o>%!wxwUMlO!{$F$#9A=^ZG*x^O
zQAHWNMC8~OB;+)@`)|`-TI4x<EX?_P03I#^5@EBXUtan+!Y(6^AN&Kl%avj%;di>r
z$PbXOSAF--bXUb6(p`;#O*7x`qd3X8Nv#^5d+CHPeY26^TmhqhLU*|<(@75fPIvwI
zE4s@MH{g(HCjPJJu0xy|Cnf7|R9=`YztdeIe?)hM{2kquJi<DP3z<_=iT#AJMu8=3
zCh_%+UzxJNU+Av;dpOr{jQjtM?o$4r(Oq8uobGZRVTHCU1qO>)q8WdGAtSd&B1Fa8
zO3u5cBsJ#}B1g&Fa{#<q3DK<&T&l#5(bLT0#Q)&O{nR~-Cqwd&>8?+|(Ov5QnC{a1
zE4phH*X!S=yHv2(*8U~BD+Uf8*TZ~|%{?YbDrtzxm4z?tgXwikcNyZ6Rz(OVP+j|A
z3Pb;j?ppqz(_MQ1fbJT>y7y<g>*?=w*8$EzI*CIFsqEu-asPnsdhnm1yGF1c{GX(|
zTyR!d<j}~87?Uv|PQ>&dh$X04{-bo4*B;Kj7m~?(IIe=cku0K5{}*&u9{$t6qq}1M
zj_!h($)}pTQ#<F$e8UX+jqbXKqPz5N>8_Y`vDT4<Y9H|N9su0t{O!q~>8_DK(Ooek
ze?WIV_*=RwSubmql<<h2P`8k1X0Nb>p6EEaOqae0?;G9W<DyPs{y(6*rvEYB#fh&j
zYU-KAbw|^|s?pGu%I}pGg!Zho3y}>)e!r!=tl*g!1UV?W%iX6+c&|#29*@|K?im;9
zLU}Zn5RqBXtMhw&<>hWDx+~=WExL>TH@ZvlKS_6$<G@I9tk4u4%bVQcO}ZNde@%B;
zkz%`(<^&^Ua-?jHK4nC6#a3XVdzkpW@xX=deG>tr5uGV=m_3%u?5{ButKip@JbQ{$
zO<K}T{=wC}MdnvD7U(P9evk^+OGB=g1SZ*r6kHC|JoSG_cZK5e^<hT-PIq14l*7I5
zqv$Rc{Oa;7J^B_y9=R76G|!(TVL@8z-YYE%+7Kfw(do%d0!XggUOcJjI2I=jc%R7K
z!DBB&`XIB|z|9gXx`VEmLBxZYkum2nZabbUaikLtp9Wx6@dbBNyRL1$ZX;_qpe2MM
zC$5L)+^ri6Y&kNK0vN@p8zUia$Gk8jWcx`D{$sjJ6`NlW4@-lz6|SUR|806d+mtZJ
z+=Cc&m2KJ7#ckWgzn5+HqiY7x4uRj9)9ZNSL0r8@ygAbA1|rUAXoxJwd3=Ysm2n^j
zZGeA|=$n>6%UjYYH<^WWqJUTeM?Kt&b@J=-$7-;CnCw7{{Q%{QfgZvEw8{Yn^E7gO
z67!ATF`*{2tLALR`j_@yJpUrym4WZEMT0L#2DnCrFL!R3FmLhoRZ|i#A7%eP+}&kV
zl<mIw@fn5~Y8bj<=<bvrx?4m*1w^_*1VtD+q(dp`Qd&YpKpLc^r5PF(X_21)pwF}S
zbI#uToPEwZul}#^b+7x?wbr$+`}%!9NtQi`d`&$mW2ZfAJt?r?k7oT~kk0>t?$Y`9
z=q}^`Z|JV5e?@mi<22Y4JkZB}KUVrfmUOj+WL=in$IhqP@`f(X!{a;m_x?(EA^$D9
zOQrgW@&6&+bqi;>U-)Tl`JEe&i%Mj&ewG#+J&sAK?C<ZA^!Q9CR86)#k3oz{_^bi%
z->18rs{euRO8W=8D-TzAAhv#tGXv%#hHm(&1bq>UFcb}H4#BBO`k&BUVK^ZpAIj%Q
zMzcxmG8;flxMw4}I97yVN^<6Zp}Tzb>&=zE)$cGoKx$d5hvRs(^H~z?M8~;w1xoov
zthsK^M85sZ0GA_PpjmE8d?tyxkNtm5ca8o7-Bta+r@M6i8Qo?6FX%4c5sb}}A7{%F
zA90h~lA)9qCWMB6&|SXn`{82A`41w>6x$^ee%$hKlaqn^et@cNqz&hMd~Xi@6bPNn
zp$K(Ii`39C{@>AEzP_g{rXxsrC@wj_&Gg8!QY8Kl>Sv}k$R;VSMgQ@Je?oWBWIq>r
zFkE<hd_yPe#>1Vpnek1%TzD9S&1{0X^`4yAsPL>PhhYhLU!}-w^6Sm=+x4#Nvy<O$
zRpZV5J9L-9|A_8NPU(1vXLfkE1cr*SJ8pKUwKDt*-DQ>}&ro&iZ2<ifpYL<;?(~vZ
zrk-rCe!L@)^Zi2X=yT(}0`_~07pGN~pRh8n=`Qxo;lVhQ`5)<CI)9_P@Ym?R8=F_P
z{Ji_jt@ZO)+E4Nk0I~#yb%_6v?8#ceCpob6(Vi0Yf#EJ4iI(WTGMSNRjeH}7mLH4!
zeu|I^#e(Ok6qVhCK@W}6(Y_iikj_Jm`4%RBWxqSG=SPw!Has88!)=n(IYR0VG<h{v
zgCe+|m3#7y<`32k(0`EO(Jn7!P3~o>^%milNqX$1TQD_W^Na4{`7h`$QR?aus-;42
zRSAJqVnf|W(RTH^O7$8#I_qUhm9(|5K_3kDWL76Ah;F7%nrQjoG`4uqu}&BqGpei`
z*g9(S(&E|ENMoHL8T@|H-tyEB;#|qvAMG@Zr%atGHGk7xFz!8v|BCKf-0IDF0d_1Q
z2#o%hbeEqJWAGW1lU{Ue(Z8m<KL0^?Nw3;yenP@?9E#yLP0H=lRT&w4T19Dcf+(a+
zDq~d598j9+S2yglYQ@!aR_l6v7<3vky@vpIG9&nHYm@lDD9(sHsjRCp%bXHh&|P+}
zI-HuTau8j15pM%g`nz}FOUSri_-4P^?xcNm;nBzP!r!z19_@Rr9-hzsUc=Hq{T1KH
zQ(n3=d@Wu5(z4t`#nx<8!m~YkU&2EEb(Bo!pLCa-Vlq3L?s_gF%JrY=E*u?;_`lFy
zX7a!3E{O6;WEo#(#K3*txlc!{F9HM1Zx)!VVlS5j240E1jQ>u*UKObIe@b^fv_xXG
z{DtmX1-r0Xqv<YehCLW0cp`)XZrUq#wv3~3O?Mss1KmZC@5A;l=&lj!jQ@`Aibm62
zWPhi-ME?Wbm6ZE;x{EUyzf>X2?c@)-t2&I&;D1kd-TFm$LH{}3#r})#iu{xAGUp6q
zXHFl^39Wd#c2tZVVmInxSeIb@i|%Sw5OmF_e_$voscA^|)YzF><<)l>u0eM5DxN-?
z?jrdM-Ib1}yFf%CNLCO&$w)9%G<YQ$E^UVVAJbiV37zDB&|OjgH+0vad)#|*Ovc_P
zowQw)n3S09$!EAA^0b3+vN}t`05NWO#-DUoH!O{Yh*II^YZiy^x_Hmcwn-ckX4Wg?
z8s_foX_hyM`9)B3TR#u&>SVkQ-eN`*9VueAuDbL;?0mB1<xcwHd~!FSW={A_ag8GH
zpVM8;N@2g~t~7#4&Qy++ks@tlD(Ek|i#AGKSqbM)x@+%W(_MhS&|OA!+Rpj(m<qH;
z%>R<^QV6Hd`Oz(Df-60<O+{bwE^(#04P<IzKq}kT$Npc_T{lQPufAq1IVadst&GJ+
zi4=XK3ISfzT>zzPx=TAH<3G|}?sO}E(p{?T!c2GsOX;7}VTqE=@bEhd??yJa9#%$F
z<SWfFL+a$z!~k$?gBSLcj*Xqd+J#`juH_C^&7=JLb>F-Q?$2-jqPw=WyWk_6g5q!P
z5Q6byEZ;K;w!M<AFwk<FWke<ao$k{8*L0URjtI(h#PAp0g^(n(#sr(TfmH#aUZp@F
zNM9j}?0-Uc+5A(w>n@o5Rn|Ix#0@A+pBcXkNk?HCgar^pfVJOk$`eUN{WH3&kNi)%
zYY-DKrNc~10GQsi6#hu=0nv0;*kN@P%emCfzXNE){(=qY{FCm2q3JFK%xk*K@ZY7o
z*Z?rnSNDR%bFJ3h$O?Y2l891g$zjanpDWkBmE9TL_Guhg*r7|49gcGIUlXAP(xn{~
z=sk`jKq5XClp@~Oc_o1Qq$TaB73}-v?0AT=OoK>2B5*i~A@+z^uljLm9AN-}?Z2hF
zj6%HJ|AFp813Y~VkmhP^P6WMr0|}ReoY#$p+BP8`;uDs{MwV7Cd_@&^I29%Uf{7Rs
zfy1Z(*xSVz{<Swv!!VTzP#<|ZFWaRYS%{~l6PH*L?G=ImeG20t^}_f-d4eD!{2)AK
zV$%7RMHXTg{SM`nU@s^Zpb;TY7vx6OL@k2@@dbF;Bc`<yl~@v&M4BWy6Q6rY*?B3~
z@q`b85X8A+9K2F6UlrJhtan+5S1#a`w#Cy+S^Y>!!y-t@U-Tp@NXffXRZ2-J3I`mG
zccb)`7(t9UtLo_&5o-}*yfg&qG6DokbR9vwWs!|zA&zHBlmr0WM2I;60Cv$tD71|f
z4(AjBuu%aZ<Jf@eV6xk-EJi8-s&J|=$^~8+kLg;h5G@{As!1VYF0dPdoQYfGi4R4I
zf9YNC(0Uh2r9kZoTJP%no8ASqS7yJD*1PQg)VrKi+kATxwR3<}EhJ2e*LoKwCKE3<
zk2^s1TJH+G*1IA@@1zOa>jNO1;Z}f<u=(G57q&{DI9l(@Bj_gW(hNZBT?N1OE^LL|
zzvx}x{;qdbH;3GTy}wf$4r)Z0=%e+nCT;yc^{#JP)bIMsFRt~jXc-(1f`J;|0k6o=
zsb?TePC!Ryu@|&8Cg!6Q_eY6WAhjqw>om+4-aS~DI@fxa$Uo>^mTLL_QWeTrsD&6n
zA!!)cw+ZO`r`~0b*1MYi)VqM(zx1w`S^q-s(nsrE;wr!OE{#9+uE-FcW`G4+?@Asn
zDf^{&0YIpbYrSiVVCX;VU4o&u>O(IqhOmC=T^v+sy{nPEF6>(Gg8fzR3jdqlMJkJ9
zpZ2HTwRf#|5yvJ{{?@w^uk|jr*iZsa0K<2EVv_%)cSZ4>7!t1IrxpIvyLc2)xFEjR
zH(}b<!1MFB(wGPWeR+|JG3=pq*4#+rY1Tk>jKES5?)NAsWQb6#45Ve8$PtS?HgVUH
zi&+ps3~dVhhAnMxpmGW0DN2^Zq72mkm<<jymo)ysIj+5)b0sw?rFrvaORmn-WVh*H
zVbciZ$Oz*EOtlkSkz7_owsB>bNrenS%UBjG`YGV!o5~uPd7M>uzvCN;O>uFBV*4Vn
z6BJ0$$(r1$&)Rua118#RNhDA$;`}yd@?HlQK*lzSLK*_Yvdb+Ym_YEo!%-MjH3Gjn
z$Qppjv(@hv3F7G+H8TbfAq?yvkl4hQ0i8_l@l9Vwfj|m?s#*n1K>!L+4VShVKe-LS
zq5_mp5Mv?LNuv<Jkrp6Y?>aHzkpx8kRqvV`Ld$fKE(plpr({~$dz=U$@)qgs8>Qo#
z;dhckWC@=_$Dga4y-W}aTX<&2H_IFq3RIVSSUyeSH*qC2!=*xu378@IQcos4<2I=)
z#g<H!tD83v8u4I4o2rHw-JmKBHJ5(3$Wsdfn2{3Wz&HV*YNJ;VNYzKN8SH^>iBVGO
zf|*+p&;8AsBWJZM!Z*wjIFUdX!S_-Fp_sAN4@`kzUj%No$?JNvjZQP=HEq(-aB_PD
zmOVm<B?LDzgv1nq+t*-)L|~Z$!o3WL`tG3cs_UoO64986z^WN(4Hl6v0Gx(^{s^o3
zfwi?hhnoh#qk2o82C(u9#-$SC@daS@0hm-0CDQ;D1VNIf0NnEMnL7X?Dovg=1P*c<
zT#Lo?1du<e@%+0aUf%*(@a?KBqLhdDWtRf!?E(6cs$^OKML|<@(b9YvAc-v)K-JYY
znOGo8C?h$aW{K9jM0+Rk`)*$AU8$2=+ed%uU9?@JXuYd;+KY2)>`%Rm><_)GDV`qi
z1g&=^{L;IUf9YK!XuV4kV5^1aI|Il?>s^4HYrU&Ia;U26x8B8RjrU9MLZSJtWZ8F|
zf9hSy*LoKqXTkb{kGKV`chydjjaq#pFh}cM&Z}*|^)5DBEn~!|<X?K1^afh*LVT#O
z#2+@2_;{^%@%>Z13;w`E|Cipyt&^1YcfAYRI!@aP>N~<DW%#9cnf{@7QC6B!iT~2O
zEU)!0dbHj(ZK}W-R67)k(Wb!YG;oJAl=WB{WWVx<-lY#}V8!6Q*1HhLMQ^zltz7`f
z;W?dqBb#24_cVX$T`hmtyMPKvQ&t(Y-X)D<t{atMCpG|B4zrn(YAEioCMqIU$kV#$
zicK-WDqw&mW~6ys%ND?7gLK*Uv}=v(9kR<(H3|7!?<!K@!!Yv&$)oiyz}G+YuH4|?
zdRKv}W6^QMwcgbR%3{V9;grlYO;L4t*5Qcppr!n-xDiq5FTHDIpqa2)bps(#47X)Z
zq--^#7Ox-yie=OSW5<^pj)c&9S1MMs^TjMR-?iT5WwPmg_ge3I<T_A=*1JYlNJgy^
z>;BNYI?#HTwmIlp@2b7lyXNk^NnNd?2cW^n=wSiu#k<s}rrLbi&i=pkE&xhU^2^Ek
zH0`zC1puS<t^%9%I3}IndRLpnJ<U+#+~8}yYb-Rk2NZvTeOK_8-ld6Iq8qf^^Gok)
zyw<yf{-$>!*YD}<kk+jxefy<%C0y%WLhQs1F1BOng*I%KAWAIk3y3m8SdT0(p!F^Q
z<{x_3`RpEA?=s%(lEdMc`pCCx-G^<?Q@D);Sqf7DoLFx(zuyDH%t$?&q}AuNkpPM+
zweJJ~aKeTID_ZXYP}%i<{;hXGHOSwg^)7J$zYSXNnv(m1*1M8_>s{Y=NrQ~!8+J+a
z(0UgZr~N!Cy6ww<(7X0Rwx=u$(0Uh%TX3mYp!zSpOaJ=1ZRT|9-Ba?A++TVZLSKif
z*piw;h~^t4ESzr`^EC@-Wy1~iH@%Bx&+fUE2|11>TJJK#0K5IEca;rx?)=uf+Pp6I
zpmr|9A)gwWt;|?PKQ3C6-2PMVf;!wAv4>Q7eDCyd9bRhurFYTG&77e1uC$)dzw|Ca
zfF%O0cRl+tOm?kz6)1P90FcSQ^seNaXuT^!vTZAY5I~J{$bS1;?-E{mkva7r^{)0W
zC^X-7#158;_m!6TL+?8F`J3Ja))=X%Ji+=y@5=o{@6x#Uhu&4qi-=#`y>fMW{obmS
z#qxEx^x|*5tKd()>lujtx89|7jFD!i<?~zbLhSNk#>w6|aQ>xtMTR~AG~;k0O6J~q
z=?jCwL7)+|-i4U0w~uB+zWr103g957dFw%U>zCezG&NWMt#^e<BB$@GBH$Bfy{q+F
z?}{Aj(UqPmZn)OF)ctRj{L;H}$CGuP+(d5w*1Js5dY3f9^R1f@4gtzqFw{vQH?l2+
zq7-P&WWmq|bOTm0@6qPvdqqW%x4sSv81d4VB$t;&XXSa4w@xzJD4#A<cE|cvo?x#r
zQ^;?<3dBuQuX0Nd5088@12P46W&-wC0mfhibT70@7QjV?03ZclV?}~6J`vLyAlnec
zn3Vivc0lyTmSMO8;GPS>fZ?ygsGuHL?UHy<20;2U0*FV19m#y6fJ8`c_JJ*6585z-
z8)$rGkWomD&~yq-PRj>OqWIX@WRWA$%Zf0-P8T5IqY}V4o5I&ve=Dm27vlye74lma
zNhCNDib=MwpsPao9HOvC&fSR%;J0T{_X425!TeI18U@=6eL#wBY~EKpGLY>^F>44_
zz+L=<?h?69G>~d1b};^h?s{W4UKyJ~BsTYE^Hom?t#~W)s$czV=qxMEsmCGkNrB$O
z<n^(Vk|{Nn%nt!p7cM0`m(nMDD<zriE>|*VM_)CZYA0U{*tzTusW~N`&hZ<^a$&$Q
z2&*I;valxk8`{u*7sv<gcV&?KqW!LIwG2K&VYJ`n`%xmsZlund$?mt`C5raDqS1br
zVz-U88gcf`L#Ah&fR1(`z`dFwUiR$dzFl#w1Z$#lD~oEPl4B=`T!VEv^HCp{+AqKB
z6YbTAA&66h1a*qdVUA2zmx)6AT`wG7zbk&R4m@Sg^5{=T`(6GfiKJd%-<4zyAi)aR
zS(6$xn8XfU9QjdaoUEC#QW<8PWipy*zblfX=*1bC1efn+?sITSUbGaqqbv7g?$@t+
z?E392wE>Z@Yx?nSiY0E3rHhxxJ&)oP8$K&5k4ciUf$G2E!glM7i+=THNa~!oP9+16
zw|??~ijaKD@x6=PwC8z6Lx(EQ0xf@Y&_c!#mGDlXp-(dJ`_2wpftDX<B7BW#x=Y~0
z<=Ode{K~8rE#GbNel-zLRa6$!TPPQ#Y4y2vwX+N|U$EzsA=>W(JmGbE%J{6@u8$?N
z9PM}MqY{N&d~?x$S4R2jx{UgptTnN4g?608B!V~W(x1Ly<8{{zJrNm;pF;ax9MZCz
zxq4bUB`=N47jDD2?2|;DHMB$M$xoDDtZ^rK%4W-TZ8^s~4<c)@O0%d!G9<hI@Vnv|
z-O5F3<wu%@B8vi$2WY<wz>q0->D!bc=Q)4S=v>{LsQf%5+ym`*u_|IQocM>}Fsu|_
z`&|=OvEtW$SFzmy|DAq2i>FT>zguaQu53DJeL_n2X?T_vZa=0=eMPohM72v0-%wNe
zWmS=Td`m|QTDrUp7UdW09GrLCYg_A|ZB%&1I$BiSePY~9FvoYRj|l7X$7fW0xpN3+
zA|Au-=fph%!EFSA&OoBsTr9b-#BD&^5?o`X3aRBjJ|$TYg`_3&P`HtHT=e@RhP9Zt
za-1E|Xm>|0t@csTQu-a%SJX1&xdmxQ&n8TrAMZoe@V-KYa*EiA&p|49M~T4?o%6^t
zrZc?vtitt`^&WGjh08~>cPSSJ<K>dv;||@3XBQly;@>l-W;F#ZhQi$hWeS`OdqV6}
zs$*UKS?Kh7K+AbG5q6qMOe7|1V#`XTGMpV=hQyfqtW{pVf|QP|%MlaJ?N48+W67Dd
z(Yv@~L=D_fBfVEZsBxx5;%2Xgr?B7m?i56!Q3`BojLZ<sV-NmdI^&MAtm(a-Z|fkl
zWl86E>y3q(%ZuiV&$w1Mr2C85!<66jlG|(4rvE6w_WFhcF%(qrI8mjAAE|LSAmcaN
zRy40hROMNzu{F(vbxzdVC1MhTdG{5bp9s>E;eucD3GY$Lv_-HQ!r-Ri2I)_-ddCdi
z!xcuDY5ob_WmuO_L5K!suIaA20*1>{H6gsQ#H6}H_8*)a!<IBw{X41UHE9_Z#CU-e
zUufZAjAX-tsO{7w9LblPGVa_Ut>rvyNqY=A3qcKC_k4o@bvP6|v50LSfOAJPSnru-
z6JL`;<|X(pRjC603rKH_sLCp?PQkxJcabzyhZmLIwo@~ir1Da?bzi(46-vbCDpbRj
zg|mJHpV5EddH1r9)sZ(WK41?Jl327ZW1ol19aHs-?z)feCyYIB5EG0gaC9;spHO()
zddcS=B5h6ye%siST4DC&$^6u!I2NBNzjuMT`HJS-rY4<A@62<HZ=Nq29&&CrTHL~R
zNwEq)90~neT@e3?dM~w#XLw69B4etBQtaDSrdY98EM>O1MmJA}yit3I;2wbJQdY1>
zmkNA{xf=!cp-?b#A2`B1Y(IFz#y@0ag-;q)Py0lP`p5tifTCEoHU@W!T3W^8nm}=S
z^m73Qo!0omN{lk<nEdEb!8xj6DmsREF&eFb0DDlKyxc))u@%jEWO4hx%&L^BSrz!u
zvYqBGS4xq#0JnL%D6Oie@B9lXCucO>r9epT9;C!~WgRmwRKR^XYAYNkhE)U=<chry
zW(j%sDd5VhIVB5&J+SBFlL@tK@?zX^?;E0o*t>_&p*Jcexudy$qPZWu=yef_wC*CN
zQ57F;1NxKDu7wz{?_Qs=^Q5FdSgrUz-?!WGjtpMT7_`#&w`5oDhx3w(=Ha_!aCBCG
zmH_!AN9Z_xac&xaz;D7F$`PV0Q}Vgc^?|HL3xqPw6-BT3T!)jcVcR45{XDX!KGdrs
z9cd6WZSSo1C_uJX3~#ReVW`Adv5?zCFWb)>l|vL}o6i1ZRxjPAGg|M!LTV03hwr3%
zb=J(x!4#CFhSIt|h*a*!zPDwdEs(g|I_Qxx^!|P(Zt;6Heg^NuwzUlSyZ+em+h6z6
z#SaCQ2E8f|O^t4JZbDCa3kK`6KhO=-kv$%Z%%;xWm2tRL>Nj4%|8T<Emq}aRJKwEm
zJ%RS+^CX5QKEBJtN<Dgq@IIZH@yg>slgqEo$3JE`7wl6VV~cy9znrI5e579W)Us00
zd<i6Q(kPI=ebx1ITer_9kcV{tjgbtTO5XR$y7R$v)Q5{UP8YYqCpgny^D>(+R{b7C
zWZykexBX&N^;oxvx5iH8Y;UCEO$y_k0VS0G`&*1vy<b~@wz{2t&cV@Vpp!hQsRHc>
zGFE7un4S&?2E5zNZg=}+c-9edRqHBbwC(lb{Hag#&wHS&z1|BtPni7Kc-7U9T1K-{
zH~EXzK#}RroT~$Yw{*iEsLR7Ziyk)=>c`TM!h&z8c`2EeO?T%37zQ$7oNv$hAqLAt
zVlbq%uUufuowO%UDoM)>3&0Y5p`ace&39S&I^9a7dk8Oe7{2YuNzD>|gJn{ArvMqe
ziz-5>Z9o8__y!Tos-NT93>wzaY|k>GPst!)N9B?5F9!{ELV|<s@2EL)LOBr~gW4cY
z_YMi0UIDrUb_D|7J(wdB#EFC_s3fwE1b^G=6rfV#HdW$w&hwC2C~PEftP62)2%+oH
zhYo5>+vJVdhp;yjky2RKPBWe}<umcC$r4~NAcDD<L&(lL(`1;*y{+gagN-Xdau@Ne
z%5cgtMbcb+K4&;_a}eVN6L~qD8Ix{Nw4K5k$O*M{qUuPIjQ(sNB0kYB^KoV)D-qgG
zATkk4-5x9#3NPc!7xvTyRNfQeFK|IB`VA?O4kobX4}7}_?p+RMKM4|7P8S!4Ge?H7
z+lR>M-<PQf;dq!QhfvI@P!balVsAzP8CZka0ai}s!8{4M`~F4()})(lP$JfL5f@-H
z8s~x+C`xH!zPYEw&+5Xe$UGP#XUxK;o6p>>Bwsl52t6QB*dZm;KCf>BlBMQjRg})f
z<|I(mbZr-KH(*9<U-JbX`khUY(c%~PxiM|%TY@BIbU9X7lp*WhUAbq}51OILqlGV-
zqd=T{2r*r2>VOc$GFt3vm+I<ddpu7VFqwR*NM9aOass1nG1NWi(8gPL%*rku1Tl!V
ziy}J&{5vU3kqkkKsfb{URyb)Jo52;EWq+I`YmT#}-Yi_n^c0TuC1l#UUDi>_bQx$Y
zu4WpxF7~?T*1LGOawY0!RQtOGwnu3Xm@gE$-Gj|4!>O}u6WuZR9HCCw8-m}{9+egs
z*gtojW-sBi_7#OZ9AOXs!v3DX*5!o#-Iq?$3ydz-XX1h&$)QdU8YL1zC3*i&0obO$
z*r?~#n*YsBnYs|u03%tl8L0`SN8Arww1XMiiywDfb6w3((U~wDJ;UClI)xX_J^oWc
zK|=SZqIzkO01iGi|9ouGHZ9_j>=$I5?`7`SH4-}I{o=Z0BIN8lDAICSk#M7;@VRDS
zsk)+W+~<k*U`AF9*}KTv!H{E@rNW~S=MHSwDTA0wjuvFclK>o#CRMyT+kyF#IMq)v
z!fPPNM;Xj5&q34xTX9d2oMuwofD)R>&`{)p=D;Rzotc6J+KkQ$Ra10d9cX7V#^_8`
zfJFM(qUG>~(tu>urOuq3zIB_im8t<dCEMBrP7@{ZW1R1&OC6QBLi<foWD(*i*ML`0
zkUevxeYmSVM;K?5=`by9*=Y*|d0OCx2E0NwxD-n5R)XbH;_O`6pTIw|96OX4I^vl+
z$|pePD>`ZWR>Xt8(%K}6S;RO@y_Qca7PlZE+HoWs3aJY25bgTny|zY!Z1*C2<rt}y
zAFfMwXKT;~_FyGByck=?EU$>HU4ZqgL~yXI*|4+mR#?C)bDrvr=rY{9P9}<_p<g?t
ze9PDos4`dN*NR#0>VvN>SB}+?Z*6@A@?g7bx+~Oy>m7o%kkyeYB<-xsogyfgq<Erb
zt2Pvatgyscl*@PTi_><gBc?;rUa1E()+yz6cF(gOYa{3cCGP~l=z(6GSi4bx12c46
z)S1hX449@GakWQ;sK*v@jsblkWatBM+iK7oL%FljdKU({BnFTg3O)mUJnI~#h+(|g
z&W%dVB35(63|cmg856D;uT+hGXegcXy*>Z?Ouymm8@`U<Yru=~0;89^?CB(cL3>0B
z8QgsWKOO`bqYbZerJ=Z3)+Pn0e)}in_Mmu>Sb1{)o`P^wPpa*;;kAf1ypX8mRogGi
z>^q-~xwd6?Xq9)?`om|7E9YKU&TwnLJ_CtB?*+*kz7kTRDr_6zbarfZ-R34DdkX5}
zW?`%=ZZhjf_mBgw6m!M7-?}D;W#r0d@ru86Eb?4=y@7^@9bfprmJEIEnr0`z2R|GQ
z7or<(aE&eN;C3{HY&a*gUgRIIIeb(c_=vsTrrJAp)+yS!Et{BkAmiK-{i-v7ln6{r
z7Pal{UVdypF0qG!%+Qs{9tWi6$y+8;ByOYiE{W%wN30#iXuYe{hDzO?Y?SLgI_^H{
zf(U>(_O(f=+v7WdkPOvsTdt0l+W>(mF(_K^>ZDk^<=htB&Rh<Ah)N2=-EUtMoS$(^
z+u3V55rm>{lb9}_7`s1*rpp6_IAUT6&pXMgl*k3R_V^3CD%r?kl`E=M_-(xV70v_w
zyzM4CCNG^Q^O>ixzfbkVeLmph4|N%zRlOLAzd)CN`r64A;8&wP`Kdd!Su+fs6T`=!
z+yVMA8Wk7ARkc~$+r_~`$JO$C!2_)&R2=sx;}6)`3_o4jJ8D-5Wu?oX1TkhMYtqDU
z<r!YEm-BQA<CKNt3{dGUD-!p4k`*1)iUKpT(7zV=fMTg~b!}3tz|F#PVVr75<lgQ9
zApNv6{c_KFntvx>bzm7m_xNzYa+|#@P29zc?3|j9GmFsxWsNt5-mnMhwWr9J8W9>>
zNDm-bp-V}49P9<u^ZPFD-Wpfv>2ebHc6K30duMF7y%z61oCtTa*lN+#YHz^}ndT6>
zzM$@&9vMdv<U|P{Q4OZu6Vx*x9~z&)_Ga(Rw6n$WK`UKdeES-^oJNO3cMoqAjZ5WW
zQ*>ZM)?T=2^C5R!Ah@-CJ*4yVZ{+F3_}8G01Y&Ff{pfTWKEjCFKG=}7wiXGeSGUG9
zjTYwMmYd&^%B4(vIx4zUn`W{%b<)FWS1Wa{B%>aj=&(Nx7@gh{bELDl*(;hjDh8~m
z&G~LhiaR5PIcEO8j-;gLBVOVc#GBm??Sn)wrAH_=o`P_GHBkXKO@NrUU`~&qnuf$y
zIJ-NBO_I00S{0$^wYtSwguzu`cb`bh_%mWLQs;@S26v$XVOxg-Qj`oRDtBvMo^;8`
z&xPJTp5uKudmjM8YpC_YmAL%5p@f79R*;E<9zKC9R!Q5#PD5|KpCy2wro{lPAtj&B
z&%~6+jTDKID-{n)5Uh;~GJ{IQjS8Hy^@gu{JPNQy)}{_vC9H5Pjsm=#MnrTyASPar
zkhwzyidg37anKTScpm{;281t(Tb_p>jn(PgI;J{*c;tg)tW__sFP3uT>0|Ry-udAz
zFHOfPAAHMt6E88TSESPK#!Y69U6izr5GZG7%m_Dk7oWbiw=Y+n6c+4&I8K7^oQ{;@
zlA@or_6+8JUA27fYKqr3wCOmg<wQy9<a<hGwkVb5nxJ=bpuX#d^V5O#C(mb*&9#O_
z)1Qv%W!^8G>LwK)S3P>7ry1)OVF(<3{6W}QgB*Bk^65(Zqa25XPh&}<ACoU0Zin98
zN7Go){1-N)E*BW*F#EzsIq9|7zyNc04L>J+zn1E=FV(84@n?s|c(z{|<h&&lWgtR#
z-Z_PCK9+*arj?WvN!M)BDO6!+Nj1m;M0y_gN)cd`P`<CzJO4ocK8vI*n}nJHaq3+y
zQ6DJXXg>Wuz-hxDQjaUiAj2tM?_`UEI<3Vilwwzu8R~4)><~Sg74T;948{;SX%Bs@
zdt;37!}*gpQ%}0Xq&qk+W)dpD6rb}@o4zn~=<m>dzjXY5?nMAetYo<oeF~6c0;qmh
zm;NM(y-s+0O-Ht{gElSkqn08yQc>mvPUVh~z|%amB=cU<gUGF2boz~W7Ih~HBWZl>
z5%y7crz?~f<8e`kRzRneWH5RDiVQ-JP&Y)%Cu%drY_g1nLoj6ZHOta+^K|@WDP5z~
zJ~lF&)aPjD#;xZ2_x$CN9WdE32>Yj}xAPd&4CEUp{KRfbvj$I94f<&)lF!u3CdsaF
z1fX9O(}x>*boBdskmHLtk;$?%qFTg^3*_oTB$0|_ksyxwu~DUYqmtuAz}2hNR(8=#
zqwtoM4|3ZPy<tC_2_^t!-w&k^8)PIz-QVB+=vj<61(GXNByMB&d}BhDvbA;C^5t#F
z$wd1iet;uLo_qpW(7#pN$iuhzn7X(1XZ&0<tf7trnxg;ihaoe^EW2ClnK&-tY0jxQ
zR>UJSP#+GxNLQ1ueF&p+r?Y7%4A3PJ2*RZh^@Um~{`Yj(1I<*NAIpx0;dl)GJOam=
z9Ih|r{6%n9#_dQ;<N`mC2z`?n*=R~X+33!csAAA~dg#6!wV{W~885int2gR@xX@H#
zx>=D~qG#9QBjeEU@SMWc;+@x*sro0BZg*RrEF3$P@Nq1KjI*9<6uQuGdR$EvDO#ND
zN$EV0ymZ`*PcMYO+Gy8Y>rKotc9vgRO)b@?vVD1}9^8|b%qZV@MD0Xhwdo)eSG=55
zh^zOyCOC>xB7n}%bA2FP;?dQ-q@zVyH`eDDU#pKM2NzknMC>yfC43c9+t(xTQdzA?
z_#mgxqKl2)0!AG>xJGIH`Hh6eHv|~;7u|{EP8V~#(WFoMw)_^IKePkPc1?HjHA8Qh
z_N%YG@VfwF5zT3iswqKaMcES_u+P{C<omU{iF6baG09LmG#B;^8hd+cv@%d<3~8CJ
zbanz6_jiLi4qr`qd+DDPs;E7!+gDN{sAwh`;H{re8sKk{!Od|X0U9!TeB}($tn6Y<
zPA9v?tCV!l{ZzHi*s#63Ct*rMIq7*n!V}-Z{fmB%n`o2+I~(O(t)9hIR${N{hpdz_
zO}-W~qt)<%iFU!f8f+qs{FP7~4WEpSas6+3q$v(l#2h^i0mOD9(jLoes_}ck2ZU;`
z5^4$VL!H#<Y+Je9Ua}5l+I_xjm5(*XRkoHg>sZl3VeYgaWIG#F7u4P9oIdv>R(P-U
zfby)7WW<8J%AAE@Hm#i{Mj{5d{=z@KooyzePQwL`a@hbrz?bYkEs7CdM0C%2IvDso
zllq#FY~`Ww@#cJt*kamhTvVo-YDiZ*n?-y)X@Ab+IuGUKq#9vxMX<Pv!+3x`!<KE@
zhf&o`<F8wv*K)%cGPd%`$LwA@T-;}$@rh~grpa4L9H&uYOT1a0SVH_d=OOgGXbH`9
zg^Ly}oMFXx^3$0vM-2tg?li79c++c4`4+@U@cXRQ9(RpulbYswghngxjo8rJVr#6u
z30e|te&9lqezE-SmZPIB-uwRfgJD?|-O);G`)aHwj$cT!SenNAym7zf<CktEc^H&a
z_3aT4+3l+6iEJTQ-SJWuke4SbvGNS3YeHwLNho8-(6DH#h_82gD?C#$YvEVt-9+qc
z?RWPNOV!sUa#Q6QFOMegE!itM)Fe}IV=oudPvmmx!Fm);<}>n|e&X2V_GP>E@4cF<
zAqqmDmSRwsvi)q=bF-pSrZ%>VZPvh`XeG^EX?TmJVb8*FPKzlTV1T3Hj$uJ)yo`5y
zT9I-Vi*Xj(JKSYO@N9X2>V`%PyE_xa>4Jly%qr$(U0ysRhP~Ly2^PoR%?3(2;%I}E
z6*B3L8{Bt^pWU8Vp?Ei~A`n0vWAz8!l}#M$@ZZy2Hagh9=q~TUl}MDEf>3iXXA*1#
zHWN}FseVm&!ScEVvP=`jQ-SxfW?0SZ+BMefL1dRa>awDvq3}kI<eHRqUatIjs;K*1
zvnSzM`NHu}sX^!{p&1d*0U<nUm2<qUGuA%}-*VQFv~gR_tsz{*b|jcON|TP?U5Qdi
zXcY!BqUHN|Ti1)Ekg+jWk%|IX$yLNhfEd*dAh?Os$=2cIzk(?enm>p=>Ehuw5-v4^
z`|MRWr$wFMVAn<vjtuV#VF8ndbeaL4Df%$8G40+5UK4(I5_WR+jxZKQKi%Z)i3H_n
zPQelbNwSCD`VZ2uAKM2#6Ep?M#X+r;p5K51yHm`6XkrO&qJna4mJ0}SEwhgss<H3e
zuLQEBV{2zrV{td{5@rZ8sVrHhNeC8%hAoFisG1q3WRq9;dt-9?3QszC6EZp>l?fiq
zX1wVWWyop^VGJ1klzpaD>3wt5Yz6~gja7@zN<UGkwF%4YDC9{s!N+FN#L1}>tIGLv
z6*OeWoZr=(hvITF(=a!ab<BV8@uEy#pCg@p&|CC-g2Sz}<p|(@9lXM&C|X}SzJf~p
z_MsqA)NnnPyXte+*25v&O9W2%4=~xoX{7TO7M^|^^X&q$?>_JFd%gKe>91JT{pe^y
zXM0SFwJ;MIlT->9zl1dV3hwGNltc}*DF%Oh&FiS>Xn{g$P_VY1hp~%4W7HT_%4;}9
z4`5poXiUH@8;>G<-kV$DXL`uzB4Y#!gcE!u-Dv7^IfZ|W=D8^h2r0td%Z~P!O`_6x
z8b_)lx`59NEo|wl6ZE9VqB0*U6eQDIsXhR2N9Khy;p$kHJ#9X`X<AewOKPIW?dfC1
zbI<SD&FAWDr1=lh>s2_c7BxQGNG1zMt#WZs6}i={q{8k~4|_a6%=%(sC%r`d$#3c~
z`*hw;9z{J8L~)dhd&gdhk!Cc?<S3td!Cp<CX6%1UcNrh`a7rcOJFn49w^I<vZow0D
zW32E#>iRI4!lBmqXu9hzuJE*A7(W``a!<pcIIzSuF|~$#lna&T9S!4J%cB@G`Pn3o
zL1d!`giMznGd^A>^1GO2>>W8~D%{@@LS`-iDNmHC@|;c9tndP<`WUMP!-Nz%7H2o=
z-$)C&Kf9O3gq4FqTUg`ab^==N&+g#72#V#;ZKvH0m+ZN{=ovV{Jo6IK)pt4Sk?7_R
z6WPULO42z9LxAW`Il&`gi%@UGeMV3sj&Pv|QSSXvI)xWfqY@+!17f<q><LDW7wN_o
z-e>)GC3*IlSlB0oj(%$`p;tY7C%)l5-42Q@Nv+Wdh{H=4GB2Tb+?yzbrRs0J+I<)N
z<|+Sii}V_iQJb{n>xAvQteFD@xTiz=mBcO}I@YJReBlfN2mHp1%<s}V8cB)HLQ)oC
zQIviRBfz8p)^moR2>*Ep0VY2>4BGpaoeH6OKl#b#XmP8$8)=23xpISG<&sxQs{0Z5
zI_V&NjlGQEAYu~*3=+ampksO0Q!dLZmJEr$)fzyQQrZ(dm8!@sjVj-;+*Vjr4u};z
z>MLroz*3ddA$tJ7oJFDFXm`sH0*Q`gSk##jC!(uHpxv!GnqaylLON{4xs2cLmKDZ-
zcDLYHD93AfYr$6lBvB2L7sR}Vx0smfDi$S2K=8fKQorCWa4^nOC{x|{U+`8C>>A$6
z`wUhD@GX<tC%^>tK{u*!7~KxREBhOku${d9Jzd;%LCPjU9Hl?ut-aXG3*eQ{cTxqS
zD=_oE36z1x6)R*92Pc?uteT<^2z~{H;{JxWfX9Y{3)k=#93Txx3#5O*TUStkNFu*3
ze6Co52APX5F1Vh;M^rb=$Pf=z-kp~VVq)DPNY?oVfv<ffq*sn3*Q_E{);%spa@rWo
z*pE^?sX7aH$8)WwARJyuaUrPVr%raECdwy8r4Er`TOSkyR(A51(GM=$De2u{O+qto
z++hvX_#dEa%8->fp&2y1MWZ)kUrlIGb=c*yJTGunY>9OUS;-h(uH$EXtuvFbOh8;s
z<)^o6O?0ruH1lTkatnAFU_i<;#wTa6mf?nH>H$N;TfBKIV2nK**B{LLFzfc^iy+p+
z+>LTVT81k8lVvLEAWSVH2Hy7FHY>{WywxU4wu&LPWI}c{yv57JNZ5gmv%;p~z5x!R
zvvs9O_T(zDq=_O~YzA%=!@eFMiPo0)dywnH-x&&*iFBFR9wxD!GMz*d(~iKFd)($A
zOhkhfcxynqYC|5a15U9dLQ^;c3NLPL#bEz9Z`m41H<5(BS<P^0aH>DXl|IH86HmzR
zaSG)pDrBNu9b+6MB<X9XBu=6v_r#L|GLX2@cqI}x!^z$BnT<%<UhmI8cAH;gqJ%9I
z9U!2*XyCkk=gs#GePO0GtKB*m0(v8?<XE~m4<dtIGX5kGlb&SR8%e8AOwnU|$8N9*
z5_SjApXFXG9&zLwZPG39Ig^q3Jy*u()ucwAc(0K}j!a)Nk|kA$AlMjtUHfEit^}B4
zjQxkC!{d@K1;vHN87~gdS19mI^C&thW(dX!_k~V}hZyTfr70&cE)6hnI_5*$Ma*}3
zZ`3l%)K1SrmwEO142;B3THdSx!<lLTE$bnZ3WTuZI~1_H;iJa{)%_75NJ;NX;4?uR
zmk3!9xN&=*-OF3eZ$ho07FLoBqp8G;_WqeRp>fDR!%2dB*^ZrDgYWB#hn-I`;W={=
zr2cGzHpT7GGER<>h_Ek+4$}=*p`(>L0bAyqhv_QRv{OGzStF~1;06ojd8<7llEm+j
zcr~tB0;5DS&4jw@-<S}o+S%_RTs9G$SD#SknPky7o=JJ5@`HclF%!|e(2Tt((}oAt
zIfTtfpXM<MegN5Su=fqWQR7SC&6}yPV>BWJrAe-%xb+Z*$G^~r7Mg}{T>?$z<LC;3
zw|C)ll|nOg?tCZ~cdb{3G@>LF_aB<Xx6g*gZ4P_mHIBggQcRPF_I%NX7oTK>kb;^U
zJU)n##_f9ooN7u}kGgIxNe32DZ;EEQ?k3Oew9ofI4L-y(Zr98G++~;bqMH=EfkH6m
zrW*2*TZ>>AEg4XWPyVE0qC^L<RmhoqMi~y7=tzkmXI8gvPcmBkV26t@D?hh+>w;He
zN#!+3b!Q4z(?&93$ou4zt%vxnWx|<}Tt-t*GJq%J<0^brs||$70~F%HVf%bjF6p~T
z^BbRL!^LNg^K5W}HxH1cG_LcQDYWtN>?M{MXse<JMk}Fb=jMagHMTLWz*jPQGOTm%
z={l1VYk=ymm+Sq`OMPI)LgCJ3O=cS8j{lZ)B96|~YbFi|M8jKn65Qm96g7zLF=4uT
zey7iqj468RcAq>+Azlv07*^s;9Tl1)KW%6$@tJ>;8B2KLE6z0?p8ygWA$j|dAVG<@
zv(*UVrd=;o8<`q0zGtGjUoFh>rw^`(R}0g;^V9>Ccw*5<XNvWjn-7_mEy*UT9#-&q
zdchwuSrOe{UZAof+J$TJ0cRw=DM_E7gaXO<nD$?bx^KQ^89_j=-7PC|qIQx(Ae||k
ze7ts#cZH!Z4ncUrGF=BFGi9RkWrQ~3OH%|>Q!z6%GP&0?od84lf`i$JnYOHK@l2Uf
zkKvqLd*@q}VPYM+a|fi>%O2A3xhn-4DiVC&giqiU!h{O^34yRDzRV_RMue_p3iaWa
zyp#tDKOt7or)g0v7?B~<v!Pb5$%LmF)6pz0D(NQA-ljQd)d;0l;7OfC_nwTY<}I7V
z#f+PdBdww)r(>6>;#N)LHq+w1nSMF}#>--$D6Hf0tr@iqn9io-a8Bc}O=ebfSftSU
zGKP)x8~l22g77ym8#jcOE-x;1@`AnPGTPqC!>_jdE~uDDnV*Os%qpEniOj_lZ^U<~
zguO<b2;Y7_Zf_YyWS+_AQ3fNzCZ@j1#fQPSMuL{7b2V>~LF^4-i9o_?Boq|@Wq?@`
z#C%HB@m!m3q+GLNJb1IAuX|h?PdGejTLdJef>3+<y};>6j`w-~IX&9(_Lq?#P-bdE
zpHC7fg;QQD#vY`7{rA-#0AZ6iUP2yYV+F<QT&^-Cg}hhNC=ujqMamN*TAQkHQX+b(
zIKqUy-JUiQSH0{<M8r%?l<O~Esx^hppOObrFG5`LN*`jN?XB&)nP4}vV1Wh8xG$=D
z{=JsDWkkd!zw9kY-g3fn-Uq$o6Q65)%W{VC%#{F60WqdwD7<|-l2%yN6r|m>dqlEG
zfTp+Lr*gxznu4zuc0@wl2wcplS~3{ZZdjC1&sSEi%H^e~2;`$Khs#qlUY*BbKP7!a
zXux1UhGtmYYG$h^?JN(+l529Okrcd}$apK0BLp@62#k^>9{W8qvrOmAvSFz>k+|CO
zgv<=zs(}Iu!L328c6_f?F{c0$<FCY4;dIoX0B_D+$sXt7<DFMOk@h3-n>zq3dG4NY
zS5a&bp7=b%dPQgpI$NiKK+NLlNa8n((e@UcFX9m_B_0?nwOoyyef(qI_WfD_#qNpK
zhNVfu)65p~$W-FAh|@jTigfGSVc3*;Ymgw5cq8N9`xX>!8_1#!C#wyAzKw{koz$Y8
zGOL|-zMYY-gT<nQBdddFzC(bnQ^cZEBCAt+zEhsA3#DYyrIyvDHQ%L2*ZqG>cRih>
zZ}o?@S`1#o2iwtl*TrD3%usvt-~!X&Wb@GH`JwfB#;kVg4VmH9tl=LrpGN(Mmiz}#
z>4v`3eHyhG0WEwwryHiEAEl-r#HAmZkr^d?I!3!N$a80meqo5|as+>2OjdSW;N=*-
z?AXFQ{q{Vy=F8!qbmKbo<2PHzB`$|=wM;soRj<o&7W%2l=7DuZ%zzf+iy-WPJDB!u
zj5I;hDhlMN3#OU$HpVg7%u6QvBw50XAlxKbdSfOu;58k%FrD~v`bEo3I{kFm%jplY
zGu<zzU((M;-I;y0Fk5qHF6!mnr_1T_m-B%OGhY_wTP_znWtUVC3k6SSqgrOGUQX9O
zojY%tMqPfMyt8!JvUo{9&nSn)SzN%s`b>0pk+OA;wsj@-a^+*oto&Wf3#&ywxtUSf
z)!vqcKw0`M;3DzWXM=#{TZ_va3~T!f>$m|M(%DP$+3Pn07BsS#_2kx77&euz7M@+L
ztH3q_v!`9MmtF*XeX{Ub#S;5Wfj-6(yLAyfVMW?{^-Tg!-xq-0sz84R_-?mMJ(B(H
z1K@j()i&y5_O}*>?QVweL)qK02*?Bzj%OQ~0Z#v>4GfXTp9ms@p!PKKzEPug8H4s?
z6)3Z<4sdfI?C9=&&OYwa9`U_>j-`DL)GjD+4?kz0H0O{OwNE5}!13Wg;2ynj&c4LG
zWBDbp@x3GSrCs2?Jz4o5N;&&#j0cnO18VtW>A+*Lz#n>yKOY93_<cC?0-R9aJGmWr
zkcZk!UiuMx@9-h~*a5Xyg*vLex3BZz%q!<2>ce?_;5pyD)9xj(^S#rYz{{egpX2h|
zlsVg{t-C<Qg<@(<yTQjM?md(bpOVOBrdG!{3E*O>8owBcR3T=*@VfvD7xpExYGueo
z2^XRIQ+dss{BcE!2h&BJW}Bl#N`_y`-10QW5iK3bQ+`Gx8!h^3tVlak>M5Ss>xoy!
zWo9kWVr5em7CD~Vxc`CfvVJ-A6;Gma{+;)qbl2C`H<$R5)xYU3nJK=d?igB;HO^oa
z8ZZ6WL47r~E|L5VWnO|=9ASK^l#1iNyx}*iXu3=5$1}->Kj^NxCB4thPi_&uEY>3;
z&dkMom*sajGMp1+3yD)!&L}IHlvP}le(y7NZ+7hpBG-Jfzt+CH7$?^<GSW0Ll(fTu
z`;59fOeB4OI}u7Di+Cj+mu^cyJP~nY5H~eFaAOVSj`4tSNIzGq&37Mz^y*cJIz+%f
zF;;3`G^K~2^l1%d_>H4|MTpx|$xf2nf_ZmigjH|ejTK*vydNjk>b)2v*FZr-{}jyB
z!SZT-4-EfW$P^5{C)24&5$Su(=$QdzQKZmz^|aK-#rP2h?zeo!=J9n6z=VGz?JyFo
z?#rYY<q|;5?g+3A?@AFIzP%YAa7CR$ti7#npBK&$U1}wZ(a(7|&!ek@GR33zBPDNE
zbs?CNI|NMXVM2`*Nyq(i`^B&WUU6|j_%YV=X|C}+V#3#?^b%UtmPlM5voA~dilw#6
zAseML_BCJIpWDCb=O1vc<*6Udsu}AcpXDujg}M(REFezjk|6mS4aR3%e04kRUSVPn
zOEI?ZvinBbvmKUQD;xsBjcv8`l9|2;zM3`H=bcq=Xw<jsu-}K5*Ww8bx_7>N2lD75
zVbtC?*~a}51Ev^;1>ewqtQ8G@8d^U3Av02;SHZ&YOOf|eU(E;w&N64+=*(P)VXw%n
zJ*UjV9h$G{AKqkyflF`3h~C4M9`qhZ(_PO+Vn@&|HWQ~5?<s>YA1i%_EcamIjDQ%v
zM6Q+BW}X{l^c)i3Y<ouW9em%5t7##$Z6H;a=iRtE+y%PgD$gR#W-+k0nMgT!g_MZQ
z<nMkS)7R7WTYvs+B65<Mwd*uLA#f*UPVE88tHNNz7k~1LQXWIfSH+raGUj_*7!RUy
zmntVk9$O4Q*=?2BCa@9NVj7U_VT`|!%w8Rq*=joB>%c7()w?v_{c`!_c-AexpoE#g
z!2e){_JjYAjaykmJXPMl0q0sbztjIb_@o!;ym(JI;Hv)_@@@>aZ2`dpDtk2Dl?x<_
zY{TSs5843a0;s|5U`_WRNLDVE0B1X%wR;Gis3kxe49`O(AZU~=eX{pUwcJB-cS>{c
z(R9}vUq|fa@tl)zK?r%kGT+=x%(Q5+5`$xJ1P=l8<4CabC-8pgs~~MDajQ@^VFPDg
z#5g2=S~*TeDEbSW8Is&y1MhZ^vEfDC*KW4!6n&k*a<o6BV5=Wz<IY5VgY2%y<HH`w
z;hH$-W)`;tPBp1Y53c}kLfB8qIHqbLvvAf(hGd~W@s-iUAkl1QiQc{`x}>-sPyu+w
zt_Mwbr7+-TgB{a)F5rfV{k}cqx4eYK^F8Ux$dY-A8q-W&U7y!Guk+9sXwk4&y?AS*
zBk1QBr6sq@ltIS89d$a;L+6$Dajj3-BVEfbPLG1l1Dopu?l7exVc;w62g1=f9ATE@
z{Iv-wco7Q2`!BudzQowxopp$N)MMm-SiULsEm-gA*Q%Vf3ywP&XDv^ocS#=SmVg@@
z(|n4Rau1a4;4EK<LuV86AYq*MP^_Ax7q1eqmw8`l1pbU3O7$vw*<1)Fz<Uwou1xU}
zS$N|P-gsr-QHt0d2VwWuFJ6vK6gymS*?9Jo=N)?&J%(m`?&TZjL&!?~qPVp(`+G_j
zyI-r^v|-W3o2r(Jb*!~<Fi5@~7cS$#pBc5jH~6^uX7NoXv+tVbGt>HwV<Z)h6+E|g
zn%*^c+^l^1pllGM>~jmm3R|zP<POpKRQo|{W%$D~%b_OC9uvG*H-XMJx1<bfqJ8Ry
zJaN=W@Ne<+j#b@qC;{KyHww!)sZX=1xM_iJ?wc>}S69S)%bj*^fw}6f)1^zACy#l{
zSmJ%6bzWmcnfY>DNMl0<o;P~_Y1%{ZbAkE0O3(KivwP7m^wZy$d%JKx)5^F{F?<tG
z85XjzQ2c`Bn~R&_;y~g_zE3OteK(Um9*j%&=O2Dt3V4D17p<&Q1CLvFgRls0VVqO)
z0K)eyDd*)uowpjJG1q<N30C&%fbF>ac6!~#2}`9))O5>=QR^CNWOfH!Bvv(Gi;ESj
z9;#&S2BA1Fy3h0_Y20G2LJ5gD8W*>FYS7YpH1QJ~Gd#Z@U9N-Jg87eHoVQ;Zdk8<1
ze{W9yShCB8zt*{w{U$F*RYqpnj)8t3vA~-CkW(vbKrV(Iao<b_uI=H=oTN?JacaK+
zpIQS9*-bd(ry|oQ(N0wsQ=BMDnosd0b@_a_>8jG}qx^B+*2zp5Nf~|<h3o_w0<x_(
zo=o(2Ej<kuJBj!5GDeh4AC}#~|F-LwG5p%LzAP%q>Gr2t-<DP}qu>@NF^+;)ch%Jx
zOD)LmFndmQU;WTeklof5o|_qAkFFc%wa|aoG_l4nVWyk;eIHkkS(UnvH%lnQq2%26
zn_Tq!Wxid%T{o}oxCZzh;g0j?_Y0`FM{NcR<0_S;!|%j)n{jq_AJJMYy(}!~AfnF*
zzkl0vW2dp#BiJ?C?slRGr=UG7L@CiId5s;Xzo50`Al0pMJwEE;V4}rPlHT+>=Z6~=
zGo_G<CK6#ti7(&7)~**N^Qg@mbzUPv6zp+ivb}Vu#>uLkq=a6&q;8fz%CqW0)59Bc
z7N08>+p>jXg=H&WY@N+?Rvy>yPJX`^@x*&wS4-9+pYHB%C$GQ1d%@d<?T32j3+t`h
zEk7@J`5^vLWpO|Hw6a;ve!in)VzHBzyxMpXe<&#$|0rP0<WtVl#gtl(-?-aC5kJHG
zQG<JDBZtX9qFP1QIO5Mg-pc-e?A`TW724JZYPwmZba%IOgLGp6qJVUl3MjP}-Kn&6
zcPJf;l1>FgI;6Wx?gDptw(jlTXP@)F_uluX`5%lq#{A6jeOB@xi!4R0oE5_A9m0}|
z?%b*wGn%hIdMn$&;pcWXp*X!-Yuj*89Cop8>2WquX|SJ-@!8>C<Jkgx<4J$m=Y9Ia
zvsv55xVOchkGnlS?-yV8e%Sha?m_VRaI5k162lWZR^d4N(gU7f=bYXX`I_#Uko81B
z0@C|<qRRnqm;v#T+(@y2#7K{D{DI_1AW8-h^MNOc87OrDNSy;>?f~7;0?{LRaYln!
zA#|6S*X|LBGskP6+l%j-?&^*45|Z;CAO4B%TH*D+wd`Hz=&i`$qbcWuJmRhD?-PaN
zbEm`S!LrYZqmMR&uTr^>o|&&HzmEaGuVoI0vA?e^k{@4=ua%r%*PO4tzn=>M$WhDB
z&5Xe*#}CNhkJ{nqZssol8Nze?gS0$+oc+VJ$O1b2_bL&wDWGk_#bWgXbT~u_DWGqZ
zpm%yfV|zkJRrwJi1>|;cM4APzW?#ZXxGmXmF&hfV2|LdX1;qjN+*3F<JP39mkbK!c
zPcFC;90+!Hhp1lVu|bs#qSZ)Hna;vAP(e-p!Fc?^Z8;%j_Q9ia?p+K)^YaM3{z31T
z(b~(=2h2jI#yme%g=}dNOm>8RL=5dQ3tG$xisc7@QbPB}LUWM9pacA=X2Q_5!sg^c
z`*VVzD4^TDpi6Rs;N|_H7{hN62EZ{!pg4!mafcq|guh2Z>w^lxii?0*4#f+IG@%Tm
zb#Wz*6DC~=?t~3_?F=_B2lc)q652VEu`|k`G*W=@8C!rbhju7Icn~TDG*mbgns}u6
z2M-APt)7b`wi0bgAN^M9G8zRL=0-|T^)akcb?6;=4>iUY#@aZy8DH`_y=aem!G#P(
zQG&S2kE$Q{GDI%IBp}8M`0@#(gQWn#IzYG@31$T;2!jLgxHE>|ImV?k)~YlnK)}`=
zIrc4e>^u|<ECp1ee{6W1yU~Z(<N)lj&bXGW;2Th|*)H*?V-eV%@wozk7uD#c=E4aA
z@t>CBQUVgFDdS(en0FyXU^0e~o+Olvg};asuINmdbV{i1Oe8B!=#)1t=7$=VPlCZr
zd?24RtPMSH2L&Y#Gq(pdjGVMsnb;eb&@b?6CC+cr{8dW8t5xJ=vyN9AA7Zx%laD_5
z?8zs)m?s~vBx~d(pP662yf{gQC-R17O3{!{LFh{1^-n<_k3t<!!KndZprkS~rsC$M
zQkbRUTSO4nq*AVef>u&#pJ7ulr7`Atl3Ju~`=>FXq+h;GW335cCralNd`Y8_F0`6R
z5RfjW<HOyRo@aJNcP-?mOO2;p(Or3Nl6e_n9anUhWNe1|YO1DA=KVk?wZKgGoJ?J&
ztRtsPz4#OZ!7TGU+lLlekNvYOP_oP0v#e`;ZHcm-6igizvLBgcJFjMoXJtPR^l>}Q
z_IdUY$dscZm*d-&vvw~lper$GJSR#46o!&p<zf+?m%Bi36SJE7D$O;4DbM+>@}q@Z
z<W)vZzPx;<ODE-nJK6Cmj0c7V3i;02a>Y>j$QC->YWej{PX6)v9LtR5tNCq$w#qk6
zz!tB-+^~731^o(7sAiPAm{O=^3I+lTwMGoy<>hO{6izdllMG5uFs1Ymxy}R@eS~|s
z5T6o94U-pNv;+Bm?32HalDf%cwVPM0*@kssQH*J!u!EO(7GIb|UwEmLwmDOj&;oBw
zkBWg>ip5-tqgZ;wvJ^k4lrX=PxVw~et&|+KjFP#GTCt4QvWz~c48nCWE0*bGAtJsk
zKtfI396*>#7vKvj7sxLc>Mj>qD;GnpkYKL(2Ho|soM!-Go~c}D^%795R<4xtGu>7D
zn#2IkQ1Oki<r~v8DgFF65V}jB`HdNBrAe)%HH7Z^_}Z4Z(nYB9X?LY1#PA}neEzZ0
zi}(!&eATmjPVf9G-8DX8$0}1Hl8Dl(z>igu+f^pS)hq**)&mG39EEpKYibxN)S)dy
zJH?6(a)s1Ix1wq&oN98O<BibV$V|ZF`Dl{xM$*in*5j#FHE~U&CC=@ZT4iX<ta!Zq
zd|af!I{DP(GR2y8#ya0ai-!BP)Vy_a>U9>SwL_@5A5iP2g>XIw)e`ODlMLFb>_}Ob
z*2$$N51#41Q^cE7tlPd{U-?{b|2f`nQ2jA#!$mjt>GR9Rg){uD#|?@*QpwM4sBmtq
z<kyaL*GtUSpR6_2GdFoaH#N04Vp}!JV1Ylcfm!Xr!}r0kRt?JbO;!?3s`kwX&+BCe
z!9)|y1j5aD!eA<^IxDQ^$pkQYPYYc{3uax5c|@~9X)}Xvvyyr%3rjuwL=&-9iw{<_
zQgF*n7F>;qmV3I`VpeT31x<1ht-88RGCOSwb&cEw^|xKECF<~?>e?)W+pUA!?9s5*
z3)&&(*DcO={X|?BrFK;og2z_vUX+b?>+Oe%9S*@AR=RJWDdD>IbU4=)c?7o$l5}XU
zxB6Li9s@f~CrlE8JM4u!f|QyckT68(5;(EohU#8+w5)X+V|BeiYokUW<Z~r>Bh;N7
z+|5v0UugAKHt`mc6+zB<xBpI81xp8@r`zW$cBHF1v7>CF2N=<u$3ozw)XOu`IjGxM
z8BEM0Wb=Bqw~wVyl%=~}m^cfLu!)3t*s7})t+(5?XZ-x_w8ZOqtA0wXz8PTODhu)Q
zL|>^v_b1(M>+Rkns{#Ex{nJ>&=dOJ#6TNU39EhxgcWMXrg$MCN1_=uXiF*f0HwMYk
zhbUQxsFjCkt%vACh8PQnn0tp<H-^~JhdEh?xs``+S`YJu3=0$v3-u0*Yz&K`zms5n
zC#C%Emi0T?kazNh|3`QIAKjJ8wwkW8nrX9|9jf!6p}TCxprN5CPvDRt8+K4Ekk$$c
z9&P}}4{{<QA|fIop`oGzFfg$&0N9uqH*l~C@owPb6A}~PlMxe=l2K5Skw}sw(o&H#
z(o(ZB(y=fxaj`P-a<Xyp@C)7K5)<SV5|NY=6*Ls1i;~7ryd@qhi>aY-D@NgloTB<&
z6?t}zFdYqLHBIe@ch#)#$?|AL6zI^j>0klxOB(Cm6?zc;R*&$l0kPzxmwJX4R))GA
zhGe&l;^j;dJ58wUP4zv^wYtpdlq?c!EV!Rq8TVMTsM{v@+HzRgySUn$_u6ycbx8d^
zw>97*;`7Ymk!#i?xBNjjsX+Iq|1Yw(-eq`w;kKr;Jiozh<$3SrJ?qSWIhG$1R`@Kw
zus5r)x}hj-t|&0Qxb26zt;FKmp~Kp!jJl})`qK6K#PWvW<%ZOp#@OP<@fz^JDmXL0
zIq_Zd>nm=nHNUhy9o#<rp}l&oqxf}a&SY2JdRKXS_sDK{X?0KGOi$x+@BeXIIfLnP
zQA`iIDsqRj)zTG`6kg}O&(|uqnCyC;KU%Ec5=g4}rr<-l*>K*2?l*-WEA8gHk`yb8
zCTpGdRwuhFi>DhsVNuDHs!C>C{Bf8c_EeS5zYV8We5F)fw%8rZZ8_CbUB1+xA{9iY
zTvM?!oTHiluouFMj+Pj9zf!J!v+=RYac!!%wsLE_$qSWSrLJmcz9WiRudl9pZ)xD)
z;<osI;<jvl%WYv2V4Co!c;h`?PIV`M(Yofg(*A_o()nX<OXX*7OW$+$_uN)QsfjOJ
z1@cmob4}Loxvi-m<F-sP#Q%ufa{7tef+0YD@Axfls~;C}E|0mm0dF7G(`e#5+?LZ9
zZfodYxUDYI-*8(K-{-ahh~2($Tdv>Yw*3Eq+fw<O+nV?Wx261r+oJd_x25wfZmZ_+
zaa&0L2Ddfw4|7`>zi?Ylzu~rEe&Mz%C@8+gZ4Le{ZtLud+miYwx25tU+!pX3<hIiP
zh}%;6KDU+rU*)#oq-5sR+f7fURNixEcv~&Ocu*9>!zf!iw{p@D2D3be0T~G;#=tCc
zVu^E&W$|u9Q`p26k<b4qw{`HBxUJAH+}6w=a9d74#%;lT;kNF4#ce_Py19+si+$wF
z_5hQ`?i3cU2F^B{hk@P*)Ju*CC>9srp~nvgO5yD@i=2Fu+k)e~=C&UH%5B;FhTF3H
zi`<qJgxfN^;<j3GJ19bJt6apt!EGr+xGfGZyp9wIx8?OKx25zIw*@05H1R{+R@*P!
z*1^}@*6QEqwpM@Qwvhe~x25yv+}7F^w-qE*^-XST;y2t@3%boez-`TtW^D&CGOPlw
zxh;unZcFn|xh*v>)GRfgU%0K*Z*p6CUvpcYKXY4SjPLYGD`ud9v>E92=t0}tmB=vg
zWq^_>%C0>-*l%)Mj=$r!=6~h3^qcN{@PaTrunVx-i@Sox(jvmts>=>iU9e7nhufO@
z7PrOy*SIaWKjyX`|IBR}{VBJV_E)$q{vYGEMiJfqHn+tCzdZI8w`F9<e9G}04mudV
z!*PCC8}pW8g%m0q1?)GuEw?LfOX@q^*1P`*x25xi+nW1xZcFn&!)<B)PjXw2e&x12
z|0~><+srk$C64g;n%mO(!finzEbpP;^JDb6e3oP6jgdH${hSHkQ74-s8(HV~+!ho<
ziR{xx{ikN}BsSxDMNFBVzvs4~{w;1xvqZsYCcpdHvq~w^d<&Al%xys-^!|q1GEysa
z;4C@F_IP-RYGaB?|EJuR$<N%D(-&?F<v-7Dp<HuY9REpfD+K`zg<t|DZc|d{^gC|L
z1Pb2iuW?(7f0x^O_8V?%^*_UH>Hl?Z3k5;gF8S6a@GUI3gM6Wo7%S-}M-l-qJR8Li
zaa*3><hD}&h}*Ie{~zPFEM^c?nf~+KmgfKWxvghc+?J8}_qi>21Vl#6(U8dtu&mL*
zk8)d@{~)&|`yb%8EK<I~ZRs~X<<<OT0w7Nra5$;-K=~fG<@gu5ttW_}?{Hf>zu~r=
ze&)7}evsRmMbOuuf-41ZHAQ>`s3!-hZHi(fT@GQih;D`jW27W-F*j<ieAW`d5gMM^
z<c8j5oUJ*BsXZv_P%7VIHA3$jGek@a?pc=5U&0s-o-Ih)-WY^4DgkuCMmGCnV(Kw-
zGsNhp{1LaMPZ15aVBdQ#q%hK0v5l_kFtG2#=AqXJQ+mWjVf0OIOXoY>mecpSEvLW2
zZE0Q(V8ESV-iC?gM?YJaunp{t#Wrv}rno>GoMatbp_qMpx1X}NAAfrqJ5s4r9h-Jx
zi{(8srqlPhEkQxX3D@DQZ*W`VNq?K$0`3UhT>nsN`o75c<H*MSD*MI0%=@F859(YF
zHWxpRZs|2Ck1GFNZp-xxx25v8xGm_PxUHTmZtL}Lxh>fLE!<X~&{y16KI2@uqm1yu
zLSDZZbZ?Z(r8H217M??2et+=Q_qna~D{d?8ireD(7jCQVFL7HbjDO5+O?=_D{QijB
zvi}oq3yA|X;P*4P#SP)MdjIFSt>u(&a9ce8%5CBOIkz<~`i0v<_-}JtA!v_(!);N(
z64G38TaplNtDSW7H{8}Bgxi8an_Po%ThIuPW(ODy=CRQk?=(3geV^M3{{e0b>W{ds
z*sr*)EDj&reK5R{R<x)_iVv&u-{-dOUUOUFj8<h)?RMaX4k%PsY&f(j6v+d3aMKrV
zOYUcGOXr*1mgY6LCHg&Xs|7{%8{F1B0Q9fi76ylz7Y>FGqbk=>`^!y#99y&j;_}n?
z8U|5#&_m=}y{jE3!8hTJMb-jf;PUgPq{&nLz5ZcttLrCj%hBr>ZVS2vH+BxfZHa%)
zZTb8ew<Y_RxUHrpuM~t>*24o^S!-xGz2%M!8ls=LE$3gktz(RDa9is?#%<yJ0Jp{Q
zPjFkfUvpc>FyG|1I7nu`&24dh&27P4b6cM|uDLDqk}Gb@pS|gu+*Z?1+|~u+-{ZE7
zuDLDsYi<jQAM;mkE8}l)TerW-ZK?bXZp;7Q<hIoRHn+7;@YlF4|3Buo{5XGv+fw`%
zw{;BjU*xue|Crkn{P(!6K>k1Hwy^$)+sgT4ZmXL8pW(L7VJTUBnZCzu9fSUi+wv9r
z9=BET*SRgP-*H>1|Kr@2=kK_!W0>!9TMYjlZVQP6Gv@sY@?Yn+Qm(nJvF~wPzJfo<
zZ4JQuhT96@`crO;@<+I>NU<;6mjBn>*0C28gxm7;V)`bx1^iKNYlMmae-*cd{P(#n
zVlQORf0x@TW%`NR!n)?Rpnt<{bus;0+*XLt|9`oyH$TX2jfwr1+oJfI+micB+!j#m
z``i}Rk8)cSuu6f~+?Jh}=oPnR@e{Wd3*ollxt58pxh=#iZmSByZ3S@sO>V1{=|9MA
zd0w*rDYq5-Gq=_7J8rAt7jDas<1cVq5uCr}wvJ){jN6*w{EFKW{D-(LANp@_Tg!i!
z+amrib6dXb|H^GiOMk^}A^ua`mJj2A-&0R`x7feVZFzl%+oJuaxGng<!fkzEYO2MW
z@%)<GVz}nEs{WYUdLhccD*6p>>!s+Qa9f@XKg4a#UUOR#zvH%`_?Oy|bTNO&ZK-|D
zZLR-?+Y<j*ZtEQ9hq$dM2)AYaqukcBuehy_D{f2on%i>xh1=r0;<ohv8{C%0&)n8I
z_#507&Na8yg8M7Cr4N@H_6xVQf<UkHpXIjnl(zl;h}$Ck7Pr-l`xUp9M9fxo#ckpK
z0Jl|h&28!aj@wfC2Dhbj#cer#&29MzmqNHLq_4THp?~GJ2!G+WCUO6j+nPxIh1-%u
zAgnkZRw1{!=C-OR{WINW=6rAJ|H5tAUvpbkSKJopn%m-PBRzI?d`o)GZ5a(*b6YS!
zaa$(8<F?|jxGlgHw`Kf0Zfo*qZp-F3+*V54vE~)Gb+_XZ?k8>w1Q*dosvQaah1)Wl
z1^kBF()|0}*7Dcfmf26-mipJ+)}ybvE!=Bv%k%r(mc}=@EvGAPYtZjq)%Un9o4?I%
z`F)4ms`w4Jh5Q$|Eq#Q)!)^8a2)8x)6}ROE;kMwu!EKQdWc_>Gmhq2qTLFy!2)Fh4
zirbP!unzxWZVQ%Udj@dLZ6W;;x8(@?3%8{S^+((m?%(6K%&xetUfl0+Tbln6xAh$9
zKf!G&f1le5`I+0Y`S-akhCku9?*19K<@3LS+sgiNZp;2V+?LbV+*X0lFV<EH%ol5m
zRlfl1YgS8~0`Z#FLVT*9T>nMT!h;A}NJSK=Z)Q$KesQo`_)^rb94t>5dZZ9uv*xp^
z6inWri&8x-K&sD;%bzi;f!|?Po)Y<#src8J6@j~fM<Iw=?aHIV{l%j)zxJpiQb`57
zV9WH#rVNbKuVtwM1EvZC(rSn-1rQB~KG>n8ekO~QH%;A+%1Nk9-O#=g&?P(}fujV=
zcHYcq22IG)M|kB$Nz&Iy;8;DPEuvzk3%T~9Fg|S%)JKD<@{sApCkYoHF?Xqm4NyIq
zc$5PXpfIVkNerBMR5(J3xyrhkM|?RB<2XGbbk@9;8A{y@Y@N7Nn@Bg!vO2qOy5+Vw
zdh180jz`XzR8LssQ6G0&=1`Lo5D=JLCOKC@1MG$zQm8G&Ve4?AH(Zd#%DM?;f<Bhu
zS!BQvcs4sOL#!?!yh1Z6&mD`Z5Ms|j8n`*<143>y7=SdjrM{uXISh+%D2*KGrb?Hv
z+4P}u7dzg(d|xPMAa(r=NWk4swo3+OIn8<kC{!b(k|(1i+C}F3R(NLKp{E<SDM?IJ
zL8Gi&P4aixleZDN9PQ2xaK!<5Oqf7asfGQ#*|En9!zf+*GsxCeik=Qtj0l!(rbTcd
zbAV%kw8G0anuh)nA`gVTs%T-KSa8CWA`}KIbjgT=5CujSESl1VyZTy75QGjhltNLJ
z^AIGNE;E7;RPD{A7`I^v3C3>GNy<oONI%7vNef!60-`kdiq3@d7I@iy(V<8(h^wI4
zmZetqvuvFK%i_qY4kosr>8!_1u7M~oVl#;tsBC^DdP}XAHoInF{cJI_Y={xX(9_~1
z6X6V6;t~J!7%q)yLPCcqlRw2|Svo?h4^4Dm!qF32^p=rDffSBsv!Ip&);WyD2pt2&
zLDTBH$-7WJ5u;)bD<w$tbUWKa2Zfh5L$p8&NXFpVi{NBo>i3e~CDhb8aM=Z*gk#mq
zO$SYo0n&OIi7F>4l;O)6yclrW!i^_k);tHCjiNA<#OVpvp+l8AT*h_v;-9#bpqc>6
z&%qMVNS?a3@OU=k(x9@1gK^D3k_s>c`@q}1umniWxclHwN^|kv%{ZRvRy@XnX{HwE
zMo;RDoR>2mL!c=VQ<Ji86EdS;p{awVd%nhxm0IqmA!yM_2CZUTS}|C1w6ybwPfY;P
zswAe5VM%X?XI?>5&A8Xl6pXp5s)+@7A36gNuhmItpCN-u5ZY#!mknCA$k3vH?N!)p
zRy3E#vSLx(ZszPSg}x7FKQ~g}G)12P!xh4^X(^E#^$UyNVS3jjNU%CK(}G(ij;RFh
zr^(aOX%Wmt!+4x(scU@qR0?xhS-1*H^d|IO4b3+;muvmEY1cjTiT#<YyV{F3*NS)7
z3YnBp^bvoCreLq2sUEWgl=XX(gM7<o9<!41^>gS5xxqJ~S^cFjwY=yOgE(=)d}BJ~
zN?w!=H~^@8PH9u70ZB1ANvw?KNa+F^B?<FGitKe@qQbI=`>@%|Po^~z_K7AkqB-!V
zQm=NiZ2L@_xUwBLO&_b6+SLFPvk>AATgZ6Gtp_rRk(Niqvma;qF6#I3nwt}kuO!JR
z4&^Zf$;f6ycq*t>ky)vjnPom&@)jzKP!ufO!4<2jT(LUzo^8pB_)xliumCzH0|5b^
zc|;Okkr;_hu5?&bUkn<A#hc0Ixpg^cRHjId8(BIxzm(#ORv;xAS;Q-CIejWKl@_P*
zDd*a!^1Ak^nuB2SDV{_EXW4?YeB)1HKf33y4;5{E*2X?wIzE=Ng|JFvZ1lm(Yjj(J
zEL$2f1wNGK^V>~rMT^<3rf(yGro3SGR#*&uKQ9wR3@A%nWSD623|lyG<ZXIZHR?p{
z&WlsnHx|s5RE4NW7K|s1^hRNoGJe%IcZTBgGPCkB$}HCFEXqe{Z};X|w_;p$s1ig=
zkZ6H%7Raqx#_MaqaS|L#oEDd8h)``>GmlKh1r>+zteDJZ*H2;Dq4ESCvQLH50&F#?
z1S~9}*v5%k;!dQ<DK0n7r6a(x*h~>j7D${HxH}7ZGK*b=SDsZO&ZpCopFArPW(zY3
z%@rxs0x4{}zE_~q;LuDlICel(oLHjvMjt{m6N^O!31A{c?A=Z`96K6>wCdd1IlU&W
zR%{U<qSgMdq7@}Xv=S}|QCK&pG#9Z#eyU#}h9pVe1F2+9Jo^$<W`<bX=|?&nr&%&g
z1K_jxj9r#a;VNkEvEq6-+j0cim^$kTCe_fI<*hWCSCT~wQ>cqJfxNmlxaLK3Pi;6Y
z=7m}%NK(wLTnl(-JjE)SxD43{wpp>S1T36!NQC&?`+L}gHO-(BY`r0-ON`b}b`YHF
zn!u8Y{z71-SXXda0t`5@TdWD9%7s32UlCaA<)42duy7y*miU=<-2^m?ZE$7|rv=vv
zW-7$LiXh_SBqrCDYP6@oQFCweq9GvM4@Jie=~Ybkl|Pdaw1g!=btw1=zrrTIBw%e)
zCf5xY8;hqomlUguOdIjMNl`!*AtB<-WfA_8nj@T7NrJYtf(0MQ3kNMe$<;R!#P&7;
zGfoA)g}aA_oE*o|iJudT9h*yWCkqafQ*Q_Be#PTNscS9^#A_vsI(BpD*-d&EY=!_0
zrf>~`gz_?)$LPx;W8sD`GbB;oL9rxWwhOT@a*OU7-y<=FkXiLiq-OnSKa*Jk)0S8T
zcW=e;{zPV}G4EwHS+;0c6dz{mzR8Bdf{<BOS7a6r!!{J|Ez7c^Cn$0t)YcYZTp+6V
zkUH}V3vmZNE-4#URkI}?XaiYE#8e9oE{K{X?HKAJ#N~8}MWxB>j5zV`O3e~)CHWv6
z4Wdz!V(JMN^#rZ$w+Lo{Xn6AZmtjxWk9c1+o9s})uE4U83<`@&31>D78x87Pw1`P6
zDpMB<AV3Qpz0@(>QhLsBK~W)j1}i1ii7Qnht@-$&WogX$6MftApraP)(Q?7kC?V@R
zhC)v(q*dQ{UCP)U%jBE*p}8iAA`!lG!?SbE2tV*L;8j$t@%5M=xU#m?7_6fSt$I)m
zAl8<hi<Ih=-~w~utR$Kc=ytlyXBcCI*GIc`<;I4G=H9$md|XT7Z>FjaEmCD{yPrVZ
zExYU{JN%=Jf#atPFYNH4ZG+$3p0vJGJx@CEh5@Epj8#5L7+LwP%JK~if_G3Z^zyue
z?d&D}zJ{meO4JyD-LQxgi{-gW<Dtk#-{{fq!eoG@QgvRkdS(tnoCBHYgi|C0;JV{t
z`3|=9sD@@&uv|>2qFl+exZO~u_O+hSo0zEzS-J$1+DZtw1xw^h!~iOaxq+-KL8oVm
z(ktY5SzFsER7W0LKet9oL%ZCeeNTm!cY|@g>Pg+DP!pmsQQKzyz$On%DQ}{7NY--T
zo16et;a1tYR%RvFd>mWpH35MFvGdYK)w;JH!X04>uJ^s}IxTgnZS77ye*4^@L=~~j
zPq^o;Yk6y>@2KY$Sf#v6srrTrXV18H3Z<`Q$;?!cEUbrIWJs*LZkvZ1r7B8L$g-jZ
zNH6jp5|?XOMAHPhT==84AOdW??<I()3B+(;ipi{*at=gSMa!8WGTuKrI=cA2Uu3fO
zY?L0AWdNF<g_SJ_NJZQ1X$gKt6#jw^G%%!3&Mz6fDm9C`A$$%ZqJd%1dp3EmVKM*m
zbkY=Y3R9WNwM81Eib6jJ?;Lah`8yN<8${*|JUv<|H*=H&@efFnr<^Q~Hf;DAellcM
zb%0?JU!5pft}1RZHCRKtXkL$rq%Lva!LigF0=Z6#?#qfXn~3hwf%q%DBC_JLBY^yB
zjZe_RcM<?BG?%=}(8n<aTJXI1lG6!_jc1LQ4xS)bbWENcXaY|lU8@&0Kc>H%*AZ+h
zuE}Tj1FR*CyHSke`^YqAYEhD0Hh|M|XDmaR5MqI+`^Q*D?ay{3U-EoVCugyy+>t+h
zify74$8A1R;eunTk|gAExPO9Urj{xdfOqp5uDM3$L4$eAQt@<+`M6wP0+H=yQp2-7
z4wC~v_J@tda|EY*D0s=YtwT=>Gz0hV<!0M*_c?koXNc<1tQ;Pk;oIqhy^!&FT?y<T
zwFTL?D@rf*;p(0enCkkWzFWwBv_?4WBv3Bunz-pYZ}D>EA!u0NO>q&Ap+PT^<}An$
zb=2ItL<3zHG3ai6P?_eeMI|8q&D4u4Zj0pE<CWpudzD2zOx%XXNk_HRj4yO`ovI)%
z-PUtw*OCgFl_(_gXY!#lUiQP@Xari(ZX=HS56WDoqB1Z%#_gq|G|YBnNmM$tI>|2^
zH0SYkv#O}EZtB;Dwg5!VF<UWjkwmm&qb7jRbOC{~T&^0eh_`NBoXCV<;>Hak#?bIU
z(<0di&cLAwo(>oly$Y6pB*blY;)AHhFE5$+#Ch2(?&<lUYyx9J>2e2+3o1;Ec?Cy%
zD_5^DPA|`U-KbvP=clw-TyV1rIFNy6o`QdIf$4>`_nvGdBaeJr3ROilEH{<g5F#$u
zd7K}bma`Ikv~<HD{R_z2Xj_^~(^#asETs=T9@lB<8b05h2QS{=ec*OuL<=}%N@nja
zKNpjeHGoB~W8L<eTxTLymPIRz!-UjiTmDg!XfWfg!B+(EhV@itU|N6k)>1k$*YQDw
zXga_y?rpUkpG+i;N#}PVw~gKKr<@m)Mtg0!hn8Z7mwoz5rBBTsDPDSzAV2DMzns({
z;n=K_N_@JBS;lIT#Of18<r1HTEI1KfK-z(AFAu4Xa9;T?@g>9L!8dI{cv>U3o=nFY
zzl!@5kF2;7S_20h_|&#<fKW-yiY<*f>kf!7b5E(h%WrSTjX>UC5oekdh<A}$X)bq~
zwW#-|d2!sFrI}CZqn*4D9xwx>u=Z;5irca#lTXx<KUE^OkEF}DiCG$KS8%PE?fckR
zNTO(44c*d)#Ran|$FgFlB#k36QKGfeb8|Xzk6Tlr75xnf*bmQROFt)tvQYk(8rr3b
zw?Pid5S*0jw*0MdY5f)5Ts^ZmItQ$3wouclYi<j_g+Ahv>U0JiK@)2Z6Rp>d>-WsQ
zLfOYpn&tLkj1Q!<cn(ZKmc&tsAGmiicFc{ncet3G{Q2~`MQ4QG_JRZshZXfaej@{n
z2S+Bn&g*V*eJy!t3^`P_ZHgO-c2Ya*_asmsVtNsJ6N_Ts#$=SA1DtZm;J6zEQ{6Ta
z5%AI$!gZ$A${A3}Wq@G|-U(_k$Mh3;Hw$nvqXT3$d+Eo6x+C>TIQD1pdyd;tKfK6$
zssxSu%rNbNT`D?jQ<^W|`s^2Oi<9GcT!raVg#Xih1I-kI4xUYMUr{A5!rWsNhP%ze
zf*EP#_KDO|cC!eAa*w3+aTh3%A>7tDjdM$B=j9pTgPg1=c4S2K0u7_K{1vwq_ilks
z;DfxXJ9cy`?jnP{wu0s>>=(JW7n!s_DBNqnetE@hnQJTFpK^#y8w}trYHN6|&7$29
ztwLq5tz<}s!#Qw#>)d1)mCqBXM51mIao6-_`wT1}p?W;=CIzpNJ5J)Pw1ODF0b|$l
zJpXts!oBUCklfZK{$VXYt%BxYms2U?0RK<-CRT7A;)hwbD&)jk!D!jBnWW=5bPqnI
zA}gC2k-4=7@iXeE2hAA~^)E=<jHCug8=1wG$azz2HU$q|$YP`CM^oGFM7zp3icr^k
zadM&fh7_e!Fuv~KIe(9+`_2o8s&-!T$t8%kpwxt7dIpZZj*(a%lI6b_{!X!n%0J*C
zZoc+=CfQ&K1lDC6(s2r@3~VfMKC68;tO)OJJ1`p8GPgbZYk%%Rg`gt$8+dE6hzw7k
z(t2=uiCbAoGVu)hy*)7^15!ceuxbDwk|egxv5d$nuC{WIA(j(E!Tk|~_l53w725DV
zG=OY$LC6I&=kG@iXHO!1<Bg45$}J(D9a-a9&15`-LdzYlapKR-Sj^gpq)*?r@5sTB
z3m<$^?eb4y%wTmj*np)kpd_@Glf)iofLUzvjOlxLvtsr}F{dW9Tu{e*D)RbZJiFNe
z7bK+D{O`vU2J#>3mW+}wPGZ{K1HHPu?Y|AEtMVdoAqq+1;o){0kipiNWdKYWqg0#{
zMDfqkOglfVBOKXg3E_O8>wU8lPyW{OW;okXb4*MXRO*;g0+OYEVC%}Rte>p{CSNQ*
zt`n3`M=R${H0`5me^Oj_?1;>51LK-Tvu5MS@JTuXdWAdiTfVuvi<%=|YPUjj-j9?T
zBC50yyaIok=~}7JUcd9^V7bgnf|8e|(Uf*NCvj{<f{0?xr;l88J7p$1b5;c`IwwaE
zn4+M~S_RfNsqSAcm@tzK(jadY4#<$eHjmcNCf!rxeo27a<h3tF+}M%u;u9E6-7%AV
znqxU#d(z@wBhg6d%Yy>*2bTAzFNsF0M-GZyCN1?Yuehzll7I(RhUCN_I`1Bq#Z6k7
zib1%omxmR(53DWqh(CT9Ieb$+X>IF4JTZ%RRMlB{$2K?(r@Bd|`orXA<)9ZC{)#t2
zhT7J%dEgCvU}f#eq^%aEA-cv440Fj20;4W8#!G!4+66URspA%G-EbH(i&@(sJz?eT
zluFzw&k)bERQ%83Z)+~>(Y%NyiHPxGJ2|HuVm$n@4o%?6GG-8ij%QIcFkxw=ZR{R@
zti@r+KOM-$abzrzAd)@u6*IH3Wejd6ADd|=tShyDg+scgZK}k&I*BYNJV`F^bUMho
zd+-n~ZA$G3iN7fVBe-O8<B~!Gk^j&D%Y{OU=t#d-xdZ&Pu|<U5ZAn&b9}pJ2Jh`=y
zQ>%=!6;{peP94_YG4VkK-~wm7^|_;NMBtLwg{KbBwyK$vLiF$%J1L=tek*+_nQhp>
z{f$sDH@R~P_#rPZl!MJ%^^De$Sz$^0{G9yVZjsLt42_OdmL#{$BT*TJ>kfNH<@UKX
zo@dWPlZvj$)^FKkOgWLAi$wWRmQecM)RHF1T9T}*SKreSCZS0WZzg1G4m^o5!gbf;
z8=dwHetv9#X$87L0gdedz(BHF@m59gFQyM>r+&JHLIK94Q9+rrp-aR#wJN60!JxKK
z1yC4ZI&7gKgwelIMY-IhB!}WSzZ-4>5xep>(dR<Qc>AV8F-VH^F-w3m;vkY$bP|^4
zncXj9*DT_{id|q>O9<GNIyX>^6vlxZQ-XX2b^)o;*cQUokmKwoBd@_OHW>8xcGPH_
z*I?Hy)fL!9Imy-x4*|QHwyFFFkRsU8owknI9vv+-QEgHl$@K$vIPkGc(Gq?JyW{|{
z7eLtl4V>68SoXBTB1|%eO_Yyz=&T@erc%5PAUbr!4fZc!7w{~vWbO*=0>cY|F@6EN
z?nb}|sVl31XEMZzraVzYOIFv>F)q>i$)DO{Cfd%4&QiPDV6XLVqk&f>0i=ncH`0o6
z68p|F#98VFr<&ABhS{N})lk|wNQ_nH*Ok%GipkbC$Zk>*ZuDZa%pGNTE^SgSt#4pm
zNRU41r@}6qLK&n2aAM&{tR#jmeJY)TfL#v#Q%xK=x$Gw-o1b_}U^8b>6vLKw)tAuN
z$zl4Y!VR#^Imib4_iMtAmQ$xtG+<YNFr$M6&xfR64zBE~qLd6$U4dPc%WR;7y3NyP
z>eP=Umd>G>b|}{20K`wjP>&7B2%%BZAz+upLDMYB8RbgV3=_Nx^I8b=71)(Z!!3!%
z`iMDodkq0d(y&Rsw##;zIYT}hIbR1{%ShSUZo*hFIBIPouL59fN)VmT;N}gnltz+|
zvy+w1qFHQ0WAtHei_hhVlQjW3(7BnGh8RXYZ!A!LN-3hYwk3C9!)u!50&n9;mC<a3
zF&$vDUr2l&(I?mn`?M`i)HTR`Au&e*BzYG>H#kU_nSwKudic4NWVDI6z#h$QNKk@?
zf}ZVyOohw=8v7gy0|AUJ7e*#sJkuV^Bp^wq(mz9H&sSJ7)nP!U8gZ&(zz`9BG{w!a
z7<DE|#b&$($2!MVjm^?;D;^fPt|bA$dq<46i9#E?e>e+>Dut}9qntxzconhv;ghK*
zDy@FXZ2R@rCfdsj2}v=a<dP;veL4Sy!OburUZ&>_i`3a&Yu=j?G;6kV=d<FdxUxQK
zw2%x58Wn<<+-D5j0%ryS^Q<`LDoE_*g2kE&#a^@<8z?2Sd`?3veJQhOz=QV9b3xFj
z0$cQM^`%xQ<$41$33b>F9OAb_N`pMgqwmBFvBlY`mU6^Z`q@>FD)v{=8CC|!TT95Q
zp*Av_s4Ql=wtC6uZmZOTKZk~`Nj^U6^Cam2A3W5U0UW3pN6r(4E<MC0-d9&i-IS5q
zp>il!9o#=3$DtnK7Dv2;;s8yy+Pk5DQ$EIV`{~xK*(M4xn?m+&t;}?Vjb66b@Ahko
z@VCXO*I1P<1?H%yIS+EmP%<f5i#?U)`;~WaNV6fz)`1TDBl3k=+>=3-7OeZMRG*ka
zNgNDTM&6T;KUwLJAX+^jL$je+Q%2-0N5s0pkqKs~9=s1eAb{)J7zowKgu>#c(wKie
zWyJpAf^ud;lj6btiQPWIG35~(2BG)tuF6f>^r9(U?1zi*$sdIZVQrGpY+_kHfj%)X
zy0s7Y)<J-L_tC~M#&N2i*AuPhZv+CLQ2Rh@zYoK50N$|M)#jTcxy40JRCYL(LOyWw
z{)NH)w`Jy*o95|<GoRH^rUrEv?JbRWQCMcV$hj}t-&pm&m|xyNJB4PJ1=1c-UR3Gh
zHWXPGk6>Ju@siVoqDFEW;NzXZ0c_T+$umZ%1^^hMluKlrx3C;OH))`_V;U8UqoM2`
z_r0{roZ)P<L1)_|U$mV=D_P&{opLxZxV1mafJ5&xVtW4`rws7MqkB(<z`GrkLR%XI
zW_Gw15>L;{sOxr6DEhgGhqlr14KKi-r}oc$D?bJDS^1S%3Z%`#y?4&#U8-twQk{L~
zhEI*AV!sr2;{=T9(2w~D#|3s1g@6(|ZWJS9hp;$>1cz6IQ_{7Qk2hqLn8?Pea^!?y
z*7>qu8~%oo?Jl|u80Pi88CO31B7AI>h#S12SSmYYfcMzTtn&SXCbOypv4hwas%j7L
zz0>E>E)i1k93Vw_7?VYUs0nzZU{KO9jBXQp_mQ*jb1F^FIbR_vzoS%N9Ch>O{C>(H
zKZ!J52@rW;EFEYJpASSvqwH&thChLggwNrfKPDh^hg*yi&$$u@tq&sun!Z>Z$%R!0
zLey6^!4ztR;J^k&-T5Sws@*m=>Hv+=(~tSkK4kBhV|*+GUWGusa%x#M46%BzgvS<x
zFk+9F=*jR@j(7kvVPuFsuEXXk)rZJJ9J1}>NWQozNNBbgVYHNXv~0E1F*w=<1SdlE
zg7Xo1Mk)2(xM;)bF8z@yK>&SZk+eXXc@!5G#vQaNZ0b4;-}FsR;}5YCs3y}8vkQoN
zSv0e21rsCkD25Y;34(S_d7^~#V}SwGIZ&TN2@^|EOlFJq_j;e^LSa0_B0Tp*r2uaX
zKrfAmtCjAfHx1E7%%T-FVU9q|E(x@Su$au<6|U+lvrCD4J*V#s$_}03sa57InjL_!
zPaugE6t}{g$gT6T{lg~H2&Vf9TA!`RMbl@9+12W4gKo3ZI)jFL=gREDEW*p7V9(Vj
ziQ|rC+(wtQi66!wu2T)R#2}5dK@X=qXl=r7$H?dp!=p?k5z|Uf*LlJJjCe9`-b4ij
z<`5BLcFEkF9=F9EFP^IcY`xk7wozokhU3AGlkZaEqfst}r)J|1oN3%cxrCrybsxwz
zwy+Wo(MyQPpvFHlY3HGSjLs1}P>Gs1f}maC&oBFk)3%Flh6#M!!s;9+B}^dS|6l+c
zKa0S=B5Dwyw3U4)tZYZ8SQ7(nwA|BJovdjH+bH4*dcqqKWE176xMGSa!Aj1>loz!l
zCle<qeH8c>7--cgsjz*QHN1<TBe05QF6_oJYv16Rg#wD9R)~r!Qa=)F@1O{(yk-Se
zUNlu|+TuO~qMFpc85N2$JDJ(`T<Eg>3@XMG4ZRpRLV+%_)Dz@%+(a)6BeB5PfQcs;
zo#mPxrCP^8T&ej~q(AfS$y~G0>e$Qu<Jq+uyq6#Dx5&yTSn`Lct5aW!p0{AIQ*)8D
zeh8-yuOe4+ZMi?urbp6lsM~Iu*lsz|ZcFmkQTMG=;@jsFZ#_slymUMK5<7w>I>Jag
zqjWoC5<3$nI+IDd(sjGC6T9*!x{67<%XPae6T53Cx*JJ)T6BBfLaeQco_><vVcp)*
z#NLk+z0)Lp^SXUYiG6DmeOn~`d%FEciT!62{g)&Iunz_hlOUAV00!wG&Vxbxq(S1z
z!INH6s!1xUq@fGo5bfj;yT~xJ+c53L(4@hTz{Ri-={xz!E4fR-?Var8J8if3H|vL`
z>W3aY7*>Dq{$|pMDd~vbgLls#jJiD-vVJfk;x=kuKjuL?9F{b82_${zBQk1B`XSZr
zL)7FL&}~d&l2mPyuxRq#{RbaPAAG33_>ds-zV_l{Z~b_#$hhBw34x2j1Sz<=Yr1Rh
z3*7~tg3w*(2GbC^Ye0V*B6l5<UddgD5V^}>dZ~VDo^<+Pa_a12`r^UV%H$Na`!wU!
z6!gQHjiecLve_H2W;Z5hxkab>rsn2JXOzk2DMc6Q-4|~)%_BC<Y+TIXOhIg}S-sCw
zhN4pfuNLopUNCq#=jHy%l5D|NbjtD7!t>9w9-o&_L{?Zo&!j`-uGEDH_vxGNE6ktg
z=OJ>J#KIHNsn-olwPedd4_EJyty?#&Cr>S=Ppw^6H_R7KEtR{k<v!fV7G2m9UB9Kj
zK0h@zIJJ1zusuyW1);l+ujwwT=_|U6N^BQGcd>XN)QOWGi|;|`E}rR~dhxyF)Lqu;
z9ZJ1jM!h}G>D>_hU*)cnCL{;)E4j-->_~og$4%^z9DH;occmU%djJA237<_LSwqCF
z<f9<+;~=p^)5b&F=_9A<6A!UtM~~y6%i}0L(wEam3CZW_(@0gxr;X%?#>t1N9%tFp
zNBMfk?}5i|9_Pu8=W&f^(9IpxPqcywTGK+KCA>1;vGQ=qJ_sd&MP*YuE}50`M!{cw
zcE~Z8?$`fVgoJ;I^0M6rmX9uxA$&$Ml#rAS_hfrs{s|+#=$cu{T+a(MYocI&_2pYW
z-0?OVqZPSWPZHAlVh?)q@SnIAh$a}n2oq$#o9pXC^u*#0MDnV3L;Z@|ay>i!mD>vD
zFP&=(J}SF|C{VW08O?mZAy}aNQ*WZs^Ur9470ZJeiV312g0ENK7l@TxqY3@YZ3$Iw
zPL?J0TA&M8ZO^s_5sQTiSMM&aKHPH$h}7(_yvx7eDEg6aZ)2j?(U=(oPvn>q(lf(2
zM`-Lw^+x6s?5j4C-K^&ecFt3^pD)g(gx&)5Jz)TH`alG-<$l8p*2@lk^X*iyEC!YE
zK^*2%Z^YEI4S8QmZ#jR@cJssBy$(wBSN?PE4@-dhL2M03hQVAlIr@RTQw)TzH96d<
z{=!t?W;E4X9j$2n!c=gmB2ej}KFhhI@6lXiTV6d6H|WR^5J(h%7_FHHtAx+a0nQNg
zTi6ESf5>T3zGv2BmyE9%8wX3yzOa2iftv*gkHh~N+02X^pm5D?E$iJx=wk5L?gjf{
zQdLN+Yp$k1G_QxkEiia~R?9TL{ZP~}c(FDbw0>04D-g{q++x)mTfS2g@JW~o2K#|O
z2Yu1Qif4K`)$Xg=#ZA0{R%H={VCl3zQB>=SA)U&cvJt9FMDqJA&JtvN3C`eV<d`Cq
zI4(a9uw@i}mLFxtMkW#A%kbAIO10ZA5_th#1?F%utF9f8c}LAfvSf|x1cbTD0?rh8
z{ScKi^io;Tz70<=c;}&&7NPxHFqjY3Z8cWP%QZ5z8$A}Dytz5CS#&rL-z;SZsqS86
zeyI1SR^dHrk$5DC=0zh<R`UT$V7G-`F~hF$w&=S3y9?z+`}cSCLT-XKt$Lq~YIxMg
zhenD}!^Cm>>jSbFqo`oWtyB+o>8N_tZ{!iTqf(JC%h2#mO2#`b(FyeEtN8gPrf?K(
z5}nfwPrCqpkdA=L0*<#$LtH+^+X51<G_QxtX{wiZTvk%S_e_k;t~js!Jdv^tCxF#d
z)F<gaW<K8Zw<D-#8LmS26$@C+0mZ@VZOCy~oL5APi{3_>U?2Jy&MV7SZ(=dg1H=7z
zuKT_JGL@E(`|F9~t+>q?W9l;FPZ?<A=TU>?aTk%Z$sZ^my1wH&M7F!x-_ddmfN)!n
zdI@LZB*=_7Lm}K2XkKj^ioHYh0fQ<Wy%`dM7(+Z6p(>DuB^4RnhYbr28iZ?Q0LO~d
zOaNjfE_QB<H}Y@k^$xv7zn+TWfs}&#u-QktAO*>JpPtEBim)ps5+@m{jX}Xa@ODAk
zjo#8$x`*~by6b5-%9q<X0!xGRNiNd~`w4E*rP&8XYR}_z^S9xMP~VTyN5z?dZWUg&
z4|^>!il(L2iU%+td9vSZtC2xA`l2x0Pg<R7qeG5Z#35qCJcEQ3=G9}XW~7&O8EaZ4
z%u)*2QC5RA^tL>m5_I!cy>sczddS^P864pi1=RPw-=*aBq>yxuNpc~55JzE^i>ceE
z<*;S!`HWc}(^#>164{w-Oyo!+RYm(Y`a|?1x|X;qqi`M%d1cF2%L&-JnMlqA-H-De
zlWYu9kf7uhscg#QyF9h&E2%5*H#?H-J$@l_6xF}CQJ#E&o9Pa7DvN@>pNwcdBhIeg
zyYEUH4@jDkL|-NK7UfCnk7W?QWFD8)E@>lNhj3d5NHvu0+^;%4XNpWb)fam}_n(k}
z6dsHX+1K%8b;jiiSUelX`}8>bNH|m#sMDJIDlEH0AP>cByjgKUBAbeT@u^8XAY<-b
zrXp*eeWJy%xWbFPyT*XKuN7Jahh{RYtn*>?>>FNm-2`>|=OEQFCBClXCY&+KeXv7B
zQr`tCb|_?ahC(F)V?WLGHAa1OKYgsBof`xFwyFbF_gEtnV!1=+IxA}sNgu*cNr+v(
zxoWMzz=mT{MWU%dO<C@24t+Af$XbB%R3{dM$6sE*c-y*Lb)xxcW#P)kiM!?fQNX=7
zw|7|Wyo9_7%_4IPIBl$>m@joFxnkaQ7;gw?o)x~0Z?BmQ$%ectPwhYIA+>TTvaZxu
zo=Y>yqH@0VAa(WOG25Mn?9^hnmencb)qAxCJ6mqBEHlS%+MA$cw%Pmd-r4c>1s}t2
zdK%uJxqDIB+)0Y)-CaY30(twUzEd2ax?ZsR0v`;Fz9rquiHdBCz%nyy=lP%qkDyzN
zo5v(5WHQLGqK*Hi2p%{rnb?RFhp<`3q*P7hc`NB&Y^UrS>qtLgJtiUTR5h8oNXy_E
zi!_`zBeuPuv4I6v?!%ZOuUxNpsc3JkBzpOc_cW$SOtE_6`cPh%C&*L36yA#KU)<lj
zDS=}qfHR&JLy+c@^D$1~viYPcC@Vj8r(jtDadeR5#jX(z>CzfiRj46vd9Erc#en?X
zVfB!l2yt%NH;;kg1z8l*VyJ6Yy)|7H4F@O332|CM`lGL3r4;L35E|grj$v0YuZT+N
ziG&%xej&<R!kKQR!z~2rdu5lOp}esa>0Fq@R#}~!zG_{InRZ`J7N0^nj;z$!XO;I5
zbNs>vx%<A)Y|+iyN%XDG^@OQ|(3!@)-Z<b<!u!q?EBqm_pOhY5%5cFE7?zFD2S2e0
z;8)ekDz$T`+<9V&t-2F3Foo2X03Si0+<`D&f%&>1mgM7ZLpFyOqZ5nep4C03Hm!TF
z>$vW$2=oDM%&DJ_Uviax-U@u;-kqwMwJh52Qjct@T+CZvq&i)8qyjiBp{84u%U&x)
z_A~A<QuHy#U;XgnoNODdY$LdcZk)CHuzGlM{i$E=_+o?8^JxvzS|38^8qq!XDG^yu
zj5_cG<>OMf`*8mE_D0)6PkPRL)*nyP!6nSWi#~olRd=^~Nd!%EFlr+=)O3GIQ|#GD
z<<xpHhTA%^@R_e(8cE7h3k#g}L0NLcQ6+o*%3jIY)aAoIaQ5EfO^l1>VV^zV7Ok^M
zlHaF$dW|h)vWKQ&nwy4tXU{7e3hGrq?|yvJ*DhOgQhVvPjr!zbeClv7Gt6T}b9!gb
z%HxD`)guYfbC>T@2UgDW7Mwcr6Hgnz=cs13C|b5hF&;SnE@w-g`2Ik`93XKAkd#0U
zTMkHR=76^hq%{N4`-2#BK>hF_s%21)42YS*i~E|}dOiwb&+#(C`-$6<VDR3F_7XDl
zUU}~&mE*10;jKIdyyfhzzI<1H+53)}&pm%1ctjtK4j<ZEKH5mW1`NK24EOGj`Ir(Y
z>dE<9cKBMG`Iz|o+E>Y1Ec-q&^K;_&vSaXjzAW|F-_HZdAGqxKti#VoPSTyhKLEmQ
zAwBV3_Fwh(4`v96k_&h^iWlY|P=p)sq9Y(_IY3(4KaL?Vt~?;wEHIltAeBEb-|S|l
z|7Bn?Qjl{_V1Zl^-h5!Ge^51pZ@E@bJppTFP7s(OSg9kZ!7SJxCb%UhxZBLD%{jQA
zpP{oOm?!7T^RgC~j@1v*o{{|GdEt6rd0xX+K`}@nE6z8E%tD!CuQ@MqX=@4yH37@U
zbH#Z*<B*6A4}%>D)n5)?l?z8~4uuW?Z4rd+#fBY?NuD4<Eiy>ZK!rgCgx}*2htG|G
zaR|rP2B9#9vAsh;4+y)lf`(Orj%gl2w&G1#9l<WoO4Ss37bz0WJd8FsY>XcOOo`<F
z5V?#LCE>zAx)MdC6-6Z<iIE!y;k>ZCp|^9wZpjCWGe+MLpq6I5e1Y#A&B_zWmm7Tp
z8RB_GsK>pKT8_LM@Ujy4!q~<0zP!YPm2h0Rhy!OhYI&#|oi8PwUz&Hul$E}8L3Xzh
zkg(H^BnS`t+4Fkox#IQwLrg?9fyYX0D19upbgaS^=M{Ex3>#b>`9j+(oG~uboFJMp
z{;^XWR&<;Lg!4*4WD-D4iHq-*dyy58Fbs@;9q>3`08l6(ae@THh#Ustydd0`i}Mw?
zRR`g=avd6w6R~L$zi?g?{)q#*po|ZR({cFyok<5-;SkPi$>o*chZoqMuT}&A@2k;w
z2qiuWyrN%Dnh8iArjI&^1EC<lP-BdEaB`WvJr@05UShv9nanx)q%*~q@)fd<<rY5_
zjzTI7W=fKLDvr)io)_yr6b?!%T~!KtR|<w;8e@DAtwq{#z!kTZ(~-t{nsmi&jR$Zm
zr1zMo^RK2y=A;V+CWxG--(vEYV9Lmp&yeZLaPrTPCyG-X&(Q4hRYl2kWz4*tmuX;@
zc`xv#c1@<isc-j6rtvd;eWon)8t(@dSrP$P+?IGpmi1}m6}KfAZ={g@d=>9$V7AA2
z(zCAY$E(?%7CE&1*<N{}KF@MO@_+$(IRhOzp$fUENVyTuf}?bD69k{f1m-s6<R&uZ
zJzmO9)(J`#%*z#Y%(S@7EAY?DL&;xl&npxREGEjY?6N3V$d5D2uUgG_&C0Jm^{+q8
zZ|iylW-9QND`@X3X!0rO?DFd#FBq=T=tn7Zh_!i_S4b=8F#0TWxy<e(Q_(KHM&UxC
zd?4EkzM{2N=jb~+OYs?YH_g@+if8UA7ef`xcRl1*E4~=d1;rO12e9p}7Q+iUM&Gf3
zwoF6gfn6~z!B8}#%_@-$G=W1c#m_f?#9MmWg|`}5O1}2+jkhc@a|Rl*Cq+;h8;u5)
zxCTu^#-fx9BXfEGqW1A>nHowt9ACLm!fh<$az50|O<c#>u5$7-cUIJjd#eDB=c4!R
zkjtQ6t24jWRD6BM^78e)px4^@KXY5CZw#2<{KRbqy)nP$woE>nxilFeCse4d0<6L%
zKY3NU<X1lLu5??g^gyiwGFN#iR{2;~`2|%4<W~iCSB0!qg`rlvE5cfFlsVRBZ*HSJ
z?S@O}u1;F3PDZUs?8d{8sL8afd5T+;n_rWUT9a;BQ><8%(_K@pSevv~Qxa5LcE7eZ
zp{6pZwj{r{j=3&jt+w%bjWKs!=f~<UFaGxXHQ3l>T?utP%y4~*H3Qu+b=?S714wd~
z)zi%QR`%9$l(u~?(rG&x92rtj-2|((4Hj{fIKCNA&MaS1+J4d@-Vd@uHkF-OYxIM@
z6g>M#cx2g-9?`J0M!qf-w}VQwXh{q$-0)JOsV21%i-Zs-nD|Cdqw!uNsS*K^aMOil
zgT^RfU<L7J0-*#77@ej0B*+A&$B<PC%x(oHNF=5RCgfcQ3$5exD>ZNx5N}F1$EV6o
zp*Bj@5z-}sd8``6m54<XTU1<Ilw1h~h1(A9w`ugW+)u<;(<Qu1(rN{4eW~7BN7<UJ
z-hL0QMY{*g9o(iq(LOla77pERfoAojr_IF*-_aGUL(*;?)rxJ|{z$hOWc8Ml<gHCz
zJK@sXKo&h`*AAG`j%P}p4&b-p=Wh+`SbT*$Je67#NjkBGJ5`n1c6hr|d#JNrFNsBi
zJ727K+0M2VCU(X|v=7<0$EtVt+jr&(6PNaMD+affk#shncNO(?{Xgv8S6GwlwmABb
zgd~(e5|9ptBGP+_5IO=%7nEiRy+}t86g2dXG!+4n-a!x)q)C$|9qGMy2t`E{IC0L^
z*Ia9_{XhHci*wFxuD&OE-tlFOcZ~7-5XD@DWqj}WDM+g=y_>lqwZr{pR{^$XM8B!k
zv3=quv0l(TmCD>j$=Ho$U8w66i0m1r?5)@OxJlVP=l@|$=>uV^=Svj*cvN?7M)#5y
z>q>XuXO`~oTg@L<dX0R0_M>c|PJI;cPh^7q$66g{Q+>T!SJiH^9u@ZwiS|*~Gka<}
zlP(NU3J%^A?c38r?||9pqFHSP2AH<{8MRq2Y;!!li<XcZl-{Oe-{#;c83Y6j_WQDm
z!3P})0~n{z&elV)W<@zxG}aF-b8ARlaQI5?*=ND{&j!)MCMCmWJ;S%Qhws2g%mqg*
zwMVR-Mr@-;>`O-O_KY}fkGQ}`-2_KHv`0OiM(;<D`jm`5>>2gj9(@cS^A{Wo)E*0V
z8Vijc3ojXq>=}#R9(w{Gj}shE&>ny4H2yq#{6)!lO3(Pq?eSOei44JsEbWOLr-{7i
ziGq@eqMnJ8?TOd$$#TKT3hl|aPLoy9lkZC=YkMZ^w<kZqr<w$(TC}G=I!(1lPj!||
zed?L&*`DfyPY(!A4{1*iJ53X}jgFU0PxeetZ%@y{XXXWG7PV)Von}^}XVyz*HhX5a
zw`X?YvwMQG2imh={(o-kZ@8_R|7W-@p`AsYon_~p)tH@i;!r{F&i2mEF4gXy(C&fG
z?ic6XZ!x>yOLu?t?w;)Io>37<gb5&B0;vlD`h-CCnn2M<fbSBhsrQh=do;Rx=Un#a
zpAav8_L%$jSa<i%QxiK#cmKb}dG-AdabD(;s=JZu$x(r$(PrZ@X4b@(-Pp>s*wC@q
zJN9wfzVYv);#0>Hteg_BWhO=t5^uOYHwt-PHSyfOE(xFi;>qL-N6+M&!O2ZeQ*!rG
z%p+54re1nHNV6zOOPG7*@gluwCf(~%hHZJqv;8cmz-*_)?1tYVuld|Ze*k$E{Le#P
z8}%=LgS;}oHYEM;SYCT0EnB0V-$xtw$J%$sKM_Ud?unN1$=Us>?$6U()6?@u)1L-s
zx(;UthUa>|&-H$p|2(mHFtIc=yR^Hyyz*mtWM*Y-VP$)5W##M2<d2oHZ)-El>w7=f
zrx!M+zirGfZ_OWVEv@e^f8Sj@A*^ogtsn1i6ApKNe%(L#w*U3}m!IFio}HZ$6AaiH
z;Dn4tqb$8C5Jtmyv!g7dB^1GVHC3ZL^J64~xWiOOc~<)qv`Pfal{eX)2|NacH#^_t
ze0nZo*_C>wBDW_6<FPT-S&`TGN->a}^=jq+3plUu$+{mJPJSHDZ_f68SSp|e5a)jI
zVDdk6UQYjeoY%mAm-CwVjq~D)mSC{wjF#sZ=G4xDyj}dnyO}7_m*W${SEzgiJRhlO
zoh|Z5oR?mdMn!gikdoJLoR?4hFV4#{^kSA&qzx*M{4*7`)bRqS_)SdEUpTKNBIh;s
z7tYIJVXOAWM7Vx2FT$*!*NX*Mpm;RZOys<-23`@3VtGT%ZCe+^S(Eh&skwLLeIqcj
zW501;zM7&*W3qasrG{HwiYKR=oh7HmpexM2Tgr%r;|514ciZXJe)jp}MNK$%E|8i#
zkJw<39`0bNP&^ixDpwrFp#+<w3;FxS_{9f_m&w0zUbr^`^1$K1aQ=$1-#D+laQ<zP
zB{Hsltm^A_pf>v)FYp38k@HeK<4Bj%&hA&n{~_n~?hiSyR`ySnTvYx8A!)#wBTBM4
zfm2+3!1C#uU!=mdNj4n(2>ch$i!J`^{%)Lo%@T|>4M?4Yk+`o^1*qwMEVgE#jnXbY
zxC8eCg^_Wcg4tT78<?Go7I?>g=e%0P+HwIW?YRnzwNkSbvquiAMLtuRWL=-qDBnSO
z`~*OXc|2;7YSOU~QW&(rY`XlJxis66ia+HRTd%hs<%fAZzIuptH)i>F&MUr6259?t
zoEI+Bpqs+t!Py^kUN%ktlJnX`XvV9R7Op-~h<1#)4(^9u9u;|vMbey!kD$I2IWG;)
zf8@Lv*b!ReLjM)#Wk>(MQ0bpIuQ|reMv`<HBl)QuVN%W_^^3LDmmf!QkOmJiGk3NM
zP~^_hy+6Jw;qhMc(uj`N>*O3kmv!ls@tA<ODZe<cbTd0WWog=MDW~sIH@BbQeGi~7
zxH_9}{2R_I<?lEz=L~AK>^a3HEhS+ns(PC2Ahxw~<uQ3^1@{_fR`(#pZzYbufi(t4
zznskSd|txM4yd>gmao8F_~dpcz|jkoHyr?Y7j>*0$jLv$av_2&!UATpX{UtRFfRtJ
zFX|rtA97x@t+9mps_SIgS*J%l^s^VQSskk|MN;(3!pYNxw5iJ~X$A0vd2*G#|BUmx
zDcW)QeKDK!@0?fvKXP74xK`<7UUW;Z3XRu4b6!WyE)g=tM(VZ3t*koeGm}x?fVlvv
zv271<=ea-PyiEVZd9|GT2hI!oH=I`p8SfrGtj5~O!fYKVRT}fYH+s(#_&ew2@jK_G
zU9ES;>93qumfe4o^Ai6P=hgUMa9(LVM9wP~a;Mnxcg|}eoQv>JoY%xJ&TF1-m`Cz9
z^Tzs(T2tP12!d)wsSEgij;;U|%X_D1^EQ9ZUpTM5dD_Y13q^iCTQ)zk$EX(miSwde
zoSdV&FB;pi?Vj>uYE7rAX0&I=tM<n<!Rv-X#7(4M|0LQlrmBH-;!m7c2g@LZe!M-c
z;ATga+KN-$!`;s_2nARRFK{nx_s4?%c*(_Ud2wc7UyiTb8stLVqZQQwZhzstXj@9j
z7@x<kV$fpD_rg*BMR>=Uy)@=!X0Jse=e0l~TltIg>JW=6#rm-<^d}}?7WKtOJR18O
z&MOP<)Tl1%Jg}=$rq6$3M?$UB)b4mU=rYVaL)l6`*3)|-7fWdEq+H;N7-QXiU{u`)
z)lJMZYdt5~AH@AE>7M@<B`S-M&YC+%<h;6m<Gg(T#Cau=-U$?mP?;=M%3kTZ?lVW>
zmuhhz#pOxU>lId4I(U9q<3HiNlK&m&Rq@B1m)&oimp=B{9?2+pxaG#F9;hM{zGV3u
z=j92r;zDq?3-iXxTpjvH&MWkfIIqw-U>;6-GgeN?m4b^wz`I2}sh?v2>OZZln(!RB
zMgzv;q-#9_U#kcwBQQTW+^10jSNi`CIj^*ItK@WeN4)>dJxbp{b6$OD?Ds*HB}2KJ
zc>%lzM(@uSl}<z`JpMbJSFE097L@EkAg`HsBwq%mN`ztnC2Q6OdU@?46bUXxQ}G@t
zkvs>dl~I`xIj>AIC@NI?0Dp=HT^{me4hem*M(vw)Zcq;#pC$bT9mZctncoieog?c*
z2i-J~@U^%R1H12TagSFoyu&?a{YbIf-QeX>_|Pga%T9)uKzWLPl7`@aHpE|q@oTz9
z{esAOb^KSHm-sKvD|Sw4P!Hro$~%ZbU<^P!fn;KMknb<fOZ;y*FISlFlG1pEml7J}
z(F)Dd19b<0?m{n|;DX?T0c^Av2655_pxB03Ij!}?Qv^?1EdR-v;DZV=-m<GY*QkZ`
zz?$QU&;q{G^w`DG2%G_bVkqdDN>D>T`0|`917i}ql8fma#gWLZmxGW`>D12Q2&~cl
zM0fJ63P(uOWe0tqr;_~RD%@B_*<(HPKXG0Q6oG;4QLXN+20UIZ0u1}l)35MW^>e5h
zKL;YI2MumQmY==zAb&M(^p*ShJre{aqyJlR%x0kZwE$2hXHu^Ts($c-cUIz{p3uYv
zB(@*?A9G&paPWQPCN45GPVS|~tJ86Y{dLCDFKK5c>5vEMu;g^|nsmwu0nmaH`8o6;
zz^Q0K<`oBejZ>ECx=h7lIElO0yS<mpN-yB1nTWmg)!4fgAUN>aZ=4qp&XNp#{AbQ9
z*_8^y!E~aA%<JcvzCwJ&SAKh07xyT+95O$VpjQdmdQ3UjWO58mb8Z}GCljbVzB4kl
zKSm+JDl$k-2l`tNP>Jo?qx0EDHMx!xxw=dkbTXsjbD**j5@&kfxBnOCm81yq5aEwP
zOPHeJ6LVw@|G;@A|Aq4k{R7S`_BYO};cqyv$A80lg}PD*;an~QAPsup+JwZ|bjgPP
zXBBv*FLM-1jcy-J!R<AaC+RP1`@v@7^p#hUvHjrTGKy#vxRQoiNYQwrt7H-w`wyH~
zl3vy-fbx)>QnwI3K`1OChkr?at;<vd`^b1;RMaXal!eH)TrI`f=?yPZ@O{)f{R`)1
zMk(aV|5wgy<u}d?N~R%k$1jWLf~K==je+O6KpR_shNIH9`Rv%UVKC-Lw)JnER~jzI
z>vzuU7)s^Ec#8)yTNVdqhvPzRzF!t7E%V9~5e>!5Hah5iz2*ZfFAx1#JpHCz-piPU
znf^)<{0_$BwnrtXoRVSx(#vqr(B&&GX3_(LRL2HySrS4YYE*nQui!=J98FZ{nF`<i
zd(NwY7?#>VUtGx-q@!BjPzm+(Y~mDEgT*T?i)3itnW>b=sMj>~i$5}W=dxE_4~qwp
zV93hzG^@=osnkkkSzR+!bK#<r8?SmK%YvuKnJ=rzCS*^?LK*=OYk;CtS)CV=^Xei`
z>xVZIv>Nr`tBvH=08+1i$9WMbj}*CaMsk^--rkWc7t+HVX+kOxCGDsOp5_g*%f#=c
z7Pc3v%421~V?};5+kl40d7Q6$ne4-)S`&YrKZS{Y7x}Yq*~21o;|{+#uW(#*KN@s4
z0V$n(bR{-a5I|N@mZitkV8AD5c}#!X^aa?zp~^>jLByVF-kO97c{7;$q|wr}yyc4&
zBG@O1w}sD97GaoKe9g-m9M{5F%q;Fp#ln(f1Z{?SQibb51Y{^y6)kz|nsptjb!#}<
zDH_6=a}qn~zk9WVm8|<er&0_6s|Kl2&7fmFO3q1?(!b=q5WhIDhB;;J>W|}l*>@;&
z%zdfYe`Z_PwedQ%2@$e!qiquu&5!@gc~uaoHv2oh*r_t!zmJOj6Xz8R=oTWtKWYg#
z+(SI^lATS52YZk^iTpP?FJB5VMe=Dq;cQn~T~m<VP52=0^)wn(toTWPf`2-bK2Qr;
zfor7lC-dE+CzC@`oLptqZ{4`bwk6P2NlUeKm>r92!)IRAl`*vMhv+i>XPnnyV=gcD
zlRneuYZGuaKdK4E&!+-#ZN*BFY5Hw~TdwG^+{+s}rf{7FF6ENupp;BAx&GByIZ?l1
zn;w?`lJlx)%*<?|;!6gKO=NDRXKcl00W!(9&}eKUm7g{jAG`MhKU(B8QbPu5QH4~h
z35mHfU~QFs$!%O9Zk$~SPddOSC}Q%khq(cSrkTh>GO_zY&_$UU9=zzv#WC>b42ZrI
zM@9lz)Kx2Eh*dwAW-pqRy#|soWg<Y^)`RNsn-DZYh>lN?y`ieFq4bn%g`TM+o;uOq
z=s`Y}xks%}U4Z~^#=4#&@<T=PeK+!s9P-0tB*|eOnasBP(K8z_T_YTz?~MO|^D4z%
z(t&z@y=6)GTh6QTKj6IP$u5^Y{0Gh}4-NNqERs7ds=_T|PT`$3#XwPNq4fKnz$FF=
zItex;`xIJ|n<~M`Ct}|_P92-;KF3%(|3gXVQg>;A^nc8GJ*1F5<77vfsR_!iwYpP;
zo*GAY>a(npZCcESvz1eypdK}#*zP{oUm>&qx13kn@0^!Enb@c3w}U)MXeUX+Ro~10
z>yn|@B>d|vq2=x{kxiQH66BS;H?%YnY4|%ma_gr23C59Y+5DGfkDkW}A&mGDCj4u6
zG<Vjmq5gl%d6AGE_v=9Q;lV2Mf8o47xjyy!XU<EHawj6jsr9jpPw0~K>UdbyD4UWz
za++zrCN2^K9{7(rufc!jybS;EabBxrJi3U#<-98X6VA(z;$LxIUjLf&^7>!kyu7@=
za~k*0DFu<86S5lXpH~T^_;N1NxO}eW67R$>&TF;+tt4T>Wiq&QC6Vl6u2q3v^1tD{
z<nPFf_J~bL5EC@m-sK$A;f?FXCU2dWCx$nT%E%}G=Q*#y#AeS3lY`rN=rc##uUPvE
zb0X*Ea)bQ6eHHNRgehKu?X^+WBi4sr+mr8awVx|}dbG9Jc}w`!_D{*f(ds){+;?Vv
zet%usck-fyY+{RhwW~Yi#+2t@IWKLSAB!y8hGwtpzuk^>X&BvL?o$W_(8ek*Q~CDD
z9W7<`$-`t12`UKdYr8BcO^H2KS_6r4g=#8hA<}b}iK3V3rrif*7;Hc5w=t<4?x~|6
zv$&~q7=eXKyIcj_J5dj<_&bY3tl~8;23GE06}YnKAIck9>@GNv*<JpL^#hh)t2mo0
zp`Ekho;crs$$7~TIj@_)I4=>#vVMly?0ag`!cURcbnZvkzSU8AdqrD&Ipr7UmHdnI
z68L-0t0o5?5YeQn^SGhO>gCNyzc54X9xO$dM0@em4^q4dTAj963`dL|>1C{p{jf@<
z|CaOmmdG^mA8=mwf8o4d1}B=>6i7A+3<s{5#J`qcTn?0Nllq<WQjxgyaoI6}pU8QA
zno~M&pRIKLMzKwt+Icpw23n?9{&X@oN~6?F?a!{hIK5<-S|O$JYO%7-i%siY%Do=I
zt&~t9n~Hd$b>(sKhozO}rYR$m(>n8xuMb8hh3!S=ounE;^uDgm6w+ANpWbP2wpy6)
z|8(o%eD3Ssb%(iDvyFe$*P~bVo3HX41^N?Lww0tm;JgF^6F*pw`rV)5bO9!Cs|vY4
z6BFUhyuXxSH1l>g@J_t<;`8S(p;|YeY$h&MDusudkvH3#{^Gp&?N3itj>3urQ$jyk
z3QYDLE<S(!$n1KSnHpq1@A2bP$(K*IS(jfw)*K3&^zN_OE587nkR=1=u!{r)3H#rk
zk3N9p^V+RJrSKMMXA43}4U~`ib^1lpq4xLABin?7c(+hwRhG)M^(&7A95Ws%N;Z|^
zqbWUpab9`htT$TDfBeOHwZNQMlqm*}LRhzcabA{mO2+Ln$4yWTZzAWl*iu^f_na4)
z$axJ0`Fi8!#pR2bi^CQZ#lp^OH^!+}FzEd!oEPK{ZN|e>LWaVzf8H&LrgI0b{ui<H
z0TrZ5kl3UE{*C!av_K#_jVFNO7w1Lz*PItz0ubJ<U>``^FK{g&|E#Uj=30f};OCW?
z;!bhL{ka#@i32X)co~cRC6*iB9fA&uzj0n4e{o)O<bUS8eE-aO!T!Q|F_3a|yy$%u
zRN}XEm<tKC9dNr=8T*U#N-u9v5OL0AwMI!`u3n?{Gj!y*T(FHM(@(4Wo%5n<D#CXr
z_$L#>6jXg+Nk=VI{(r!Esr;4m()cUq<?$~#uUGiMb0PDwW?+)@p?J8G%sK_zT$W^M
ztQv05tv8bmTmUu+rTm&heMWYiRiGQaVYs-Fuw->ujBRl+qv*U*My^|tCO1GX$8S1V
zxF#oESFGLoC(i4x%HMHbgG9~?{db&K_2vJH^9p6)vv?NN+H(GA4N47;pgvRvH!M1J
zdA2;9^>C&6@MC!QQTe3Uv2rWjt1z;!f5Um*B?-FyC(cV-Kl8SsH{}S=xr>SYIhuxJ
z)VIVwhQ0q0rmm<0O|^4%ASs>;S^Im=%dm~uT<8y@=LONj0LZJY;S^fLOTf42A!aSd
zOjfWWvjImlDIMBhh=d*32LvW~E-g8@;lQh7Bmla9%Xx`?jPK-Hq1Cq3mTlZmth`y|
z0+{O*10GhirZ(9oekTrvZY0k-B5V+U<-Cf4ms5|L(E+|Onu*CV7X}Z)kGGalaxI+(
zZ3O0-GIF=r`~j|OZ5M<{$SG%Ej6O%lVc0|=w-n#^udaEPhL&Wij4r?{<=Z8G{^Gne
z=<V_Y#k7LLgzNswdBH5FR*f$QX~%78)+zOWl=ph`ee0h%ueh+1Mw+4Z#}y(2I+!>q
z3;<8Y0szb++FO_r05~>q_@U51k+va`^Ga%24Fdw003?7qa|EYiBT!8Qh)xB;VGMZS
z)gTxECJUy=Kt<_90AMg~kc;D9xC045BEb$!hxY>GiI=S`_|76@#g6-mnS82#08)k;
zC_vF4s`Zma5k>+KAnYsU+bs(|_UZNq_@hkFkkztAasdFIL>1R153T9H(i#q;OeX=r
z{2!Hw;;ApP%)!O0Rf=5~+s;VmBhKb70Lq+E<2XR0JTyTwCd@;_0_1T~zv%mxEovPI
zkkXI_F!YiET2sfn=D<ic1PKR%eVwc7%qJW@M}qpIJa8`*FWKrwLY|nvc7a?8<bD#B
zs4}^fyGFVYe%|~7U=CGy$6qSVeAxxj@`a1(J42d$z!b#~)wdt~b_RZat?oP7VM+Jv
z4R`Tf5@#l1N!riSeGo%A2k6Sm$JbU8Wt|RLj4h+0U6;HqKa$kgpQaNJ<v~)};iEky
zKg<5kd5Jui4Q1fL(<(`$!UJYnWB_4htc{9m2YB)WnPszg9&6$f80bX|9*T|2W3FNk
zlpn8v0LJ`<0eHvFMvA+5;26n6&Z_y%>gRW5DOf5{{tBo#*@cuh_5gsYcM}5`Km`W$
ziYuWR0FbR*pl^ktM(`O}HL6p#<)l-_firGQHg1*^X{YE9=x7`Yd@DvlqDbjaP2o?j
zilkYRqZtUfVA#rof$9P96tGt05hOFK$zu)=MTA0P>uE1ZpuX2<Jq$#-z0dP_r>-Sy
z(T@c%keKpI)A)#>!#+-{Nb_T%<gp5a{8j2vs*0(t=QNts179&{C}AA4C9)H|@#*>a
zz+{J(M(-Aj#8>j1QZyNOG7ORm13;}q;P~3XMGR^WgYp3Z2vRg|K!Ba{3QZ%8QWMQM
z2}m!1WKP5hfalYQTb6xu9SkrJL+WB>F6OHb(u9n0syhf=G9C(v{}F%+muDp-@!~>q
z7z0pEm(Fh9Q&z}te<%^h(BI~Pm-91|tfBC?Q_Z#XP4Kn@vQ;zWHA1C5)Ee<^@mjA)
z(Df)@W!Ppg^I;%67g6-Ws|m<4_mg@QD*?R0x02r2>H(<G5c4Bo$Y)YeHNZd*qS_(F
zfdORFex&)_^@vhFzoL@}lIiqA6v{eTy#cofRg?h0+(A2ZjntqF59zNiF9zM>k-b$G
z0;<MeR}6yUYBcqL_n8$?;egX0nv9)YC6p})in>TF)QIKN8|)_!Z}8|tqUeQhPRaE^
zG(@L%%E)v|zaWZU5$0jwB;PhtT5YDTno3#qa1emB<Lwp*4<w#CN?AZyhkT&SS*Zl+
zOcXvF6b!@Hkc4Sl>xm`s$Hm|6MeWsa|Af2-0l+-|d_gkhoXE6nwRI34Fo$=17!nEs
zfJ8)f@@rm4is;~UDzc<h836gUH4G*?`7Mff_1*xzK>~I7n_zrpmQH?cuLmOZ4KrSt
zpwO9$U-0M|u)?}$a0K*+xbTGe^n>p$kSXIrhNC)1?)B4}`jfZ@WNOJp^T)a52Vb&^
zzm3tS(T6<dM4ICzxyvD*QE@1o469GbIk`~V>VZD45Ss5H*Adrf3xZM6ag362x5tzi
z%Li!KAs79ED0u*A(gA9Y9)Z0a++MIC-=9%0h9RnDiWjYeXE(lwREaB-fdr!qgEh-Y
ze*CDyg7K7k3X<p81$$6z8o&rlu=ai^7a{aget%juL=I!n`J-R%B>lSU0K@mvXB<Ef
zgMY@4D(Cb-2EWe&!TtV7L)Sg%v#oI5GE%iKkrH1FPuGQSlyDmP4O46kNq>h3q60lK
zLEacr4P4MG1nBD3>k^)ZCh%-B{t=AK4J%f(>E%QfM8rO7q``RD`enS59Uf{2AmfTV
z=Z$xa?x6+Bx@;SA@RGctWhd7fbZZ@flywU21(NaL)qaNXbl@wp+HQxDP*ek$(GZ3F
zfY;bi>HGk;x0gu?0H%@~-1Z~YOd|HIH-e{MNs9o^z(+C^ssIoG&)lkliGD?@hbQSL
zmXQEYB;tsHeVREPf&sXf1c36#D2)>k4ESVb(F>C`Gg#=Y{4vNH0C4%z;ASv!>oZ;w
z`7BbVG-~XE`PfiDRNRRyZ<vhn;aGk8jU2&vbq4&Bc-))GF^}}mrzYe4a!4@GIBNYZ
zt*MFovJUn_0z+AEMlCoZ`m-iOIkM5fJSoUb<^2qQ1&GI#1_?#;06_giMb<PL0}wVl
z5|_B}OBy06YoX7xP3y``bzg?8nBk#eBu<!GnOZO;TEyCz1m=w=8yhK}HeDGSLxm6j
zH1&rV;~@+cqDgpZ9)Hp#ydw>S${2q}io-B|0nFwA%qni7!b!*pV&#69sl5TPBminV
z_{}!y#<?l7Bmg->)wv{qxkmsQ!=F$u&dYJqNq9O+e`#X?St?}e7J!=PH`EI@4l5$%
ze~8as?o8UokQ1h1B2`9MKmk88tyPi6{u67za3V8+uBhh2$2+sZ_{0kV0G`&CVPvix
zT-I(XDa<srL!xV#;*+1@`Md9*zYG}<ssRA-421Xj3DwG4(=_W7DE*OPIXo$>&cm35
z5GAwu8DgC;6VHl&xJ62u-t(#!pO>Wz;{o)V&3s6}0KGKH)5igg3#N1U3|2sYi&A9I
z>o?a!7+`pihQ%4>BlV@kY9P)ev1kD@R~E_-NVXg|h1HQVObD;cqV(sJf4q0nMxJl$
zt$^3TI;5yrh$o*!!N;OXg7mx9I4O)6R2IXy;z)U>C`WL5o(WV!u+s0>0x-c78)+sy
zkTfPzKkv*53*n3L3D@aDZ*aqm@=J!e!ZiSpmthH2cBLD9^K#SkGO=1Zdh=rmeXI-s
zYP(MqWe@`lo^fP?$>tWLJ)Xo))eR?lKBnFtU_wN_-qi;I8x_w#)V#$I#C@s?3bTm2
z5EmKg@1h8*;sOdu0jTEiM}qzQrxs3VT;FETZNjQY{;XE8SlvNQ0}DRyA;1X%y)a3l
z02@E!vKp^Vspa^rFVBtCL*oXtjcN3ice&z}(ihI9x3cvbgAtcuXdJkDGIn|mm<H*V
zg}UbUX~)FDb)syz!gaY}VvX6xVxKvZf~Dp_8S(y^&LCe6e>6idFX8$fbYQ8;M(!hr
z$FLwYhE%qZHy#lfP!WFFKJgt-F}L@~C!mew7rel20J;p)@YAd*(29y-ktxUqm0@0*
zv*ICAf+BgFTtO0jFkf|8&c{&q9FBDoF!R(}^}ypjy;i***?`eVpGTkGTt-q57EpWU
z@!d<;*A&yUF10KvQTtAUS@E@#;_iun^Pt;rOBUa-0wS=XQN6;j)7y;f<2n~Y&K!eU
zIaBa(9=x#e`Z0W*btkw?7C^2Rw^h585|g1L1;>fJj$gCCBNJqh6rd6d=V=CKy(79_
zA-9YjO!kA)Wr7NH{P*Aea=mot93qK-0RQ589a&rW?a*{vCQ#VH&><x0T_hcNac<=M
zXq({+Nah)}IEmj~FMtKXd@dLdAOyaut%rr-m-r|5S!>zvt+vZUc~?3GL6)DSCiy>a
z&2bW4FZ^AB_jQ{Dn1(5hPmPTCq~;ueu}Xc15&$c+aWLF!3<NOSwoll+L&0iD&{xil
z&%bE61XQzf(jytaZGVre?&-M@`!JGZW&%ydkmAbj8BOPUqek$>q^XFtbuSGPT}-e6
zPl$#0#m94jyI<#W(k`Sby9A7RJoa{R^5z@C?;fS?ri?wk{ry~E^>RrPlqE?|iy;@s
zNGGa%7vUEo+z?dA3|gjh1@-~Jih#S`A%zA6`>zwm=R(a(o5~D;6!%p@7`%OTZEJ0J
z8=D)-CuA!@@t(jQ&GYTvgubdNb5q%Y?o$hty=EOqPKO6iDzbi?V27M_+dgn}-I=Xr
z^)FKqKW{UBEGg=i-Zrrk1RDwwM$ZMvLC@EI>62LZIJ%V0g>=G!fw%1~U|1bv6IGm;
zn>Q#%iWmai#9iXo*x+NP2Y&PR)GH+FP0%y9*l5q{U|P)6wA-&aeOv+v9#N|YIj12O
z{jkJXm*d=UCzDX;?{oop@bm`xog|>29n`2lloyue%1F=Bd=I)E46p-GGkgLvtOL%w
zzAvp|jgbNOPSizqyfMSWa2S@}*8pRHXx4ja!aQj@zOlB(Rv7=V*J?rt55(gs7-p4V
zCW+#GJZu11EM8qNr12r~bD1<*=!HN$0s|<mtA+I6iY6YzcMk#Hcw`cu1nrF)aAW)C
zrV7JSbl_u4f~(~4O_4RXy#r%!*?@Ue)4FBn657ca{P|uwzD;m);8&p<Bk528-0c`a
zRr^yn4n2JrVo!MYv?QR8ndFQr=}X)X4Nqb3wUAhI^l!9R*>AL${!O+<5*LzE4gzz=
z;6YUAxrRdjM}T{}m~-+thhMZ8`g?LCz27{2$48&iBghg5-S4!Q=In0DqmZzyagecp
zOA26b5nuqrBLFZR7!^yH7#jc9;|T<Tb={c{141ED-gX0-7z!H32bd~gqdyRaH}(z0
z0b0&c&+;UBD_VzuAUs$Gz{Wf%05p@ztm5k5L`r>EQqc!L)RIIaY?7##9`VtZj*^lG
zVLp60QW5YuoMbLO6p)J%R4l;tUvi>>x$B9fk6yaKj70dXh0c>?gfZ!{;sH)0ku-pt
z{a?@eSBYbGv{)H>ar^>V7dNHGQQ2C0s@i~YaSj?E-<YYMAmnr`vGKXksNzu)NAQQS
zH?~8iPCuk}rfTjV>}<=vV{`a$zb_@)#oO7p>m<%UsP5|}(b2STrz2{!Til<kJf4@h
zL`Xe8X*}YbJ;5FyZj5?7o<5fQd9=S;HFD$b)A_*(!iUfi)kEo;B#Uu%RV+;s=56EC
zr$TR+?&}CsBui-vW=X<ci4_@-m<pb|Z5S!$zkRXWzOQ(}+`gWe9s>Cd^Whi6k~m^6
zx877%N9JjJa73>j{RVp}o{ziC<dbdxy1a@jL92mNEkV<v<rnPbHsv#*-EM`zfzL8@
znNPc~1zyw_8xP?&o%7JZhT6GDym0Hfl=otX-REMO&j#-u>EiUSaWoIfW%ARy0Az~k
zIbX(^z?5;SJlSzf1zazmn(|FvEVwx_ExlKqm-FHnQ)U0)q}2;nP*7Oo;OKSrn6J2e
zL!I2=j@Ddg@%xSBVTmVe7RgeTZ@kEO<aQnumnOccu|gOR@~XLgDkU$h95#I@_)fbf
zLZE6IMb<+*6Cqn_KNtV7w7Sct_7<~HC2}UU8}Vi**VKzfu>R9RitvY%;|jqV5(=zH
z6DhMVA#US%a#FzjMj=$3qK}c4{hbIeRo!OH0>K$O#Ua`;suR~N081$@dVI0yOu(*-
zzZN?yz^jFHckyam?~_g{wp_vL4YDjt24ORx39(?Yi?U<zRkHS)?H}TwpZCTEa0{E&
zuVxzE?a6y(_RwkKJTDIA>3l_lW`_32j^3ItIld=No>(62bN)1zL0XthOOt}>eMyA9
zDvpMz&N~%XR4DXSBE#~0rv}v|ap=+%`IDrpDe|sk?%$nDE8|p?G6VL?6*gJKf{Cz~
zWhm=HN5~Uyt8V>hsk9?tTfWO?!>w*>-;-M3CZGbgtQn=?OT)E$+l*NW_Z#eGp3AT+
zKwVW)wZ7QQI|!54M3j#=b%+ZIRCLcc5fqoZC#pp#xF&MaKOP%Qou#G--dH;WpPhW8
z-gX8egAB&lwX6Vv!U1KJkL{YMCXz_yH{u#eBl5@$#xB#`oTs3tHK)U*&wWwWNF6oY
z_U0Cdey@|?Ok3!BS5&iUNEMT|uNuy%N|TY3zeF+a?f7sHp-#RME1K20f&d+=k{`we
zc-ooMCNWHU5!gd?t#lvq#)c>)<+iG%T9D^oo8?VhdBUw%#vmkej#0umZ~?F6it$}^
zvS<U@RhGqg)p4@jX#*`cm4~@Rpx8M^)Gy70Xs|p$FC8RUSM~KhFIOW+bQ5&EvguJC
zhE(2EkIl&r81ea%`Z>2Oxb`s!<wTUdux_38-&@XI$tS5h>tINc_{bgDki_Ug?1H@2
zX5)b6F=q=OeS>@8l+=nHqi}mK+uO+<qV*>9oOfr%%P(1whnrBUYh{XVEb7cx4%>Mv
z=cu=;7c@`%)f6PiAUY4kbdEHdq$A=2MD`S)AGxy9F@_b2UhAjFHbS|sr7PXc)lUvg
zZU1~tFGQgm$VBDGqsqxQ5Pq#PldhgeO}ua*+PyN1jWmQC%QqMoUzyD<S8zosV({sk
z${Zod0`4vXll8{Vv$uOmskisY0;SfOm0-Z9R)OJ!xA9QL=~XPA52QQ(C)um)ind+m
zHD99a1w`iZ?g60IR|E7T=W0Z26jM($h_aW+8AXa%do(t9k>U>L==;I9rC#;?w+{+O
z>-XQjessc*1M!bFq285+$O%}`6peipdsiN_Tx52?ePkTtab@`7-2?)Ao2Z&p$iZBy
zyi`h|-cHf^jHu{5!T>cJ9#K)3+Abg>8vJG8-Me@7g3caAlhZrzAg|*{Tps>NW&&4L
zx5){)du|3SiB-LS|CHbDrKZ_zZaV2;y^xnr?bMdLbaj7^kY~x{^xlpa)%MNj+a2j}
zu`O4&q}W^Dhi)>^nSHNblUth>2C_feY*>SfAook%R7TYbe6+>ac)bA-wlV)kD#$p+
z86j=y)?U+yvK{#&-d9$p#&;UPD-SVK=G<pJURF-%K=}xKBZsdeIW9JYzp%WCY9XBg
zWr%aM*=n+03xtMN2UDp2U{<EIY~3nQv-TOMc1j)T(7F9o;`YI-VLi+%mzz-SAHn8q
z8kkn`diQ7F-!2PPskQ3fcyeN41Q(pjgp|K%7R2+Y-6<}|Iw$5RtaZ1&&Bf7@*(`g&
z2A0HWYWhQZjS>w+tUnw2#2y1GTSfMm#EL?iiHo4J?77!z^<*TU$xA$F%p%jZ1G!LH
zmP@Z{>D}5FZ!hv9r55suD3@2Ko(D*ldX#Kl@3DNMot|aSB&XrK6>AfITO#X@r8Nuc
zhi!ZAn>Y9CS@jc=dwOJo_N`oDTZo5e!*91%3rFXHqa~c3wcmq2W|!=ER>;cL_llIM
zC)Du@Fvo0*JSqQ%X}2<}e)26OS>lj&cMw)P-7uiMT^Rj@qq_obNl{H<Rdyp_=6$hG
zE(R0M9AxVl$`~ht=}-~cpX|1@`au=-LcLeq?|GC&XK_{6=z%j^rLTnWlkXlHlP{IN
z<=SG-F7><BTO(d^F4wjaUqsFa!Uw2zeS;diD7M3V6aQ6%4>BWnewasUOb^7Kjwk8&
z-n(rhv)-_EZ=gNRGasppx%*glin``YDRu3b%cMk(HJ?<Pl-Ygn4`DOHtlxs`o1Fp`
zunW6F)^C{)XKNqMCsGJ$w{KGIQ=i58E}WdJ?Dl9lpqRY(LGE#y<*w*qW**ggmfwR%
z^PI^=kL9+moU7<)7+(MMu&Nt3b0~7L{_rryuR)07=RA$Vn)L@ZWuLjZ#o0$xUBZvv
zap+sE8GJb2+Ia};sn^`%oIM_W^HHZ>_;imZd4H)r`g`A#1CK_flby#3KNp1`JHCH(
z`t`$EpQFp;lf_rlt{C+*(sV#6#X-*<5~}pl46{NB3Y(8DhiEj|`PKCJ`EQrerSO(^
zr>nJf6uKW(Xb6p-#_6ySz2nY1WHIOrx$rI4B#9o9q6{=;TRLUionfblo>n#4%4br(
zAQsZ5-pas>b^(KSAnvI?N;dPigtJ#adD&534D62KIY~tAtA%CDAT7F=nHSkBpfXz>
z$G-+*=r^T_VJ~38{d~dBh%)A@3xLS<T{2<E#8FZ0DWYyB(9LOL!wi^qGI9*le|~2_
zZ$T&79a(4xVo3{N`Kr$x*0MYYVzj%1R$K5%MgP>dXb?#l(%^8eOe^dTWR>ujm<kZ~
z4Wx^0TB?h?crW~7m<6*036BGZK%2$qu$F^u$We!d697?U7cg9p6kb@EJPeF|3FRuh
zY6ou@jVGrmRA0WQE-EuFHb^0O+$O$b&ILn>*eq%f0~#{g1q;<VyxJ2h6<^G$VS1GU
zpU#h#s58$2c=g+*+uFqE&NPv0X)n4t>(kBOjrBNwY~#iIU&MvV;{xbh(OhFn*E>U|
zD@h6!1K10Vn0i4+!LzwAPBAJ=*o7>ql~02AI3E~tx@0Q~pN6m|E;@xRIod7d05TtR
zx5!>=Z_x6e9$w7p;Hod<de_g$6&0}0i+cP~S8@v||M3ZNAC>OaC-3%}CZgs=!kTFG
zmYnA-9}oc2D{Yr@vvwS{oT9R>I9t8Dx8(TKQgOwY<Wi_qRI^a5QsAW}cEu$nZYy3n
zt~zfW<~p?V8VF(EBE!-yK&z4*6`=4=iFqnOzA^^K7P_8J^(@iKn4H^uW%>43(B{~*
zOr<|v;uZ6V7V{A`N#C<5?rs&^;}%<omUi!EY^)94OB?&Ef$9;9?AiXTxKPdB5KN`@
zhLyh34y8Q7-xE)w$e!&;bho^lWxTH<kCe?eaxSs}xxJ}eD6Nz>mbpGcxa~mq+|ylA
zd3ksm#f=sj0b7qZbIw64w()rmx!exPHV@vcG)pv%X<4H1O}sqT{O<u=m4S}5E!S%D
z6tpanN!Eff^B1usQad5q0hV`rAy*$j)r2}VoS{Qg5X%S4HTWC_2+8C3%5c5wM}Tox
zzB@>+94`%!ew$ht8_<s&K@xt^NuZ^}ICgH#pR!VE{-}k8h;B6)AflRSMS!472ypn5
zD>HU21pi3Bvt-j{6ORrx1SY0^jpxZRk5i*D?_1E*nboJJ1w!WQ&ld6?5bZ32zi|4J
z<5wg2SQDhAMbMk_d{7@2H_S`4vtrjK{%mIrq~>3{(Sq%yqz;>R0_5ls?JSrM(auto
zRMK-FdbzSbaKyE9WX}vJOy5y^X5;YO!QtsuE%KmtF`n~*w@^ibzv!%<wLC}PLWQ8h
zL)?Hgc#UDBiP)}5+|6xTc){eIzem{x)!P^AjO}n#+_xV&Sn1ffnsVDP*)U`C9dVi7
zYfXn=)I_mV?lIcdw{snd=2{dD7cL|AnqBaMnQw2N*H*rQhDzuujeKI~<FuiJg0sSK
zU_Q!RKPV)-VhY~7)tpj8#Z73E6^y+o!N3qc5cIW3;pg2Vt3LLq2&oQ5NACa^2Ln3u
z3-tsg&bW2iG#$r|Mj3!ryF*LL#HL%vW=ani{zl+_4jyAif?p5eAIp2rca2xlxO*ng
zktJUt@$Rcq$4?E#85c<0N}njea=nAvKRGl{Bo+6Uf(8byiucU}2SZ*i6r>#ohCT?`
zx917vxIpYV%ZPbehT@H8<Bj68-;r2Po&hF)U2|EYK3jXj5JvI~wfcF-MZ+}boqtM!
zpiY4ui6|5}pQNCbUwu2WEM|k(m;KXmi_kqgX=SH6p`4|dYh2}aP6BrG$!Aug)h`qX
zB#q5#beE#|o32$KtE{#`)`YekB^+ar!-BL;vX=!`ZfMdpcFMA<zYx>A{yS<FOBJ%?
z?3h%nuvWZO`a+@l#i#v{f=ma;eikYMt|)DzXRUalEeRtk+)p<lpqk45J#a$LI*H(~
zKTo@ns|a_U`ql;D!t>B+FV1glCG)8hCt+)@QsYN1_O^uta}+n9QV>s0tIa?wdGSXM
zPI+QLX(VBx&3DE%*Zzi7wWtX&eBNAh)~DZ2m}hf-3o9BBdXZ5BOyYZ0*1*@RRqCj*
zBl~d(`!Ph~p0(2)0M8ma-%yYY8Q6+(u4#kJ5LY41DkDCgg}@_s3!<(nR0Cw<NVpFP
z^(&FA-Tp6g@p)U$W(zF^r7aHy#~G2r8$#9tF+FZvyI;i+_>Uki36sH6II2XOxjm$X
zeGhgwaNk|Hl+5JZg>f0Kc!oeiXIDrWU)(0Plw95Ei?Z-YviioOoqG<Y3f0bOO{H5A
z&a^J=m+rN=;sS{A!lzOZ_}v9*?9BV}8ehraI`B;;!VM1VJsMF=N)0%!0Xk-jXm`EF
zmb@m{UA!*2&Jw1(I0NDC08nWSLX8}d9dxv3V#cKY#^JgY9rgpcieig{BJ>9Z`L7Gm
zNN7)s*f&i{tAr7Yft0j$@;m@nwIa4#1zD}g_x-E|t1;}jB-Z|x&sDom@Su@ZT+bU(
zj_eKj4m`ImAi55gI2LM=i`<1a@5^)E9NEK@&MUSZ#@S!u?=;W8Y&ynrUY#83PewD!
z&VPqR*xixR4f&%5X&KHX>_($deqq!((e=$mBN5GSfixe=umcHl(ZkRpv3FKaE^mgo
zv$V%Ygi<D@$aB3IesRP7v)Z*qH3j_ATdPW^Ev@p~y|(anudk4l<+g?(G3(*B8=P({
zB`rD41H2MSaIHDlIThxz=H*sU!bix@R7qX-L-x2z#}0RR|Gp6aE2RV~ehMnFPjsHB
zgL@Wca7PdFdk4}k5n2hMhHf56T6N*O=jy!9u3wr^l6aM=doY-2*!i@>Z722i0bU9I
z(<3p+z~u;dGPY=|5W3t7kxwKs>+^D)`|9Z0iwzqPVgc55135)3LZc;zQR)VkI`Nl1
zKZtzW{2XG~{*~FY%NcZDUh7`sO)7DHPp8iyFHLDrUt1D$eJ6vJi2WpCTEyg65J$sv
zVQh<1^CzrGkDxC|z8mN<(R5JV?4H*AL|f1sT8+OG`Ew9*oqG*`UmcsR#H3BaANJbm
z`C<6`0J>CVQHfB;?*W|q0M3q8nQET(Y)RF-{@=KoXmLcd5y;4;ggjED5ecxpSRK_@
zT}X>@$`*<C2we?oH&gL0m!qN^r{rQeYwk^4l9@UbBj6OW{aH9JeksJz^)$_T1Gy9f
zF5&`ityVvC@p19J=pmEm>k~IfSUd>N8JxpBr*4nky}*d|_URjB4+ABoDx>Ed(Kw$V
z1^xv33$8<wT-7l>WAC`D1Nd=1$>(J<S0Op3g{&Q18%rkeEh}9Mo}DA%fQt{DtD9Ml
zfLwEm48vaqlOo<S4f6FWi5AmO<~D(a-t*s#kr-<dvwOz>(`WuPTA1=dhV7-?U76^j
ztq+yO5=o^})r^mu^Lz*MZXd|F7;+N}eTsac$FWV)-W*hw3%uQd$l&$c&N5DwS*&X|
zXj&z?bH}{||J9>rz8Rn!pKPtmnUBgR1Gl<$S^vWPiS7l{2eseS0(%3cBSDO@F<19P
zY?fu44j!l&wa^+q<?hxRLOHQ6K5Q~jr?*!^u>?F<!?xLCZPP@XNo$Ez7u{QzqlPyv
zl<(TkLheJpbiVej-Hl|cz;?ISb@yR=M(cWJvAwHxy}Q`HZ*_fV*nVhzKegNdef_{I
zHu?M?Vv3ty8iB%qqXG5$&jvX9lJW;fz)79@5f?vzd|ZWZpfKY8dis;iN)=gry=O$R
z1Z|632ZPM|D7IMcneS17xZLQh+)QNJXnUI&i!ujT*;}K9oh86$K9C>W%r0VOO?8T6
zdUS;inj|7`&a}WD^`vX{Om4+izIR*BBUTCHXES~^{vny*dwL~i^u_btDzcQ1<f0PR
zv*eYVYPh?V?%i$Jo|UiNK55=-a*t=yexSTz8Nhn@P>v-pDf<zz0=}6yM%4p6Z>NIX
zisq+O*fIL>#pRUdi2;pbvlzBzoXcOTG7wi|^tHBOa|*csFknALVPxN5;<F{TTZ#Ge
zqXp8RUuGY-et6F99l@QLy$xu^iuqF6vx`&HaQmMAT<7QLofVWn`02xuMfOT13^n?;
z+{5lFQv~IeXA(Xr>#I-sP2OplxV)5qE^eQD=;`oM^G4Fd@IP=~nlGe0k7*qY3k(Ww
zynQfywjrh!>pmh&N_I`u?<1A{z9hx$8*8zXF9)i7DZ(!X-}QP>jMB@$NjlPMjd;tz
z9rjqe*Fqx6y4LdqChhf;!QHAef!FArFQbP|PyD!;mG8YYexr(s>W#Ybr5Xd@>Z_kN
zU(b|y7Mi?nx!)D@+DmNICxEMD)<m}fEBK?X@|A=(ZYykPm13|Y_`rrW;1E75sNpWh
zA6lt7^(G~$Aw%jho8N;ko8wjY&)DRbC&^~t?9zwzm6&X&y)~hWLpl+LUcWTSg>hs%
ztdw&iv{v%lVtA7^EXXw;SUAv$QI!W$JL%Y~BwV_=u1+JX=ApwRi)Q3)QGxA$jNt~_
zTYfw{a;!tPvv^L$wX^wkBVPqiEfSM#_rW|VS+%B64Nm6f5{6pe7aR!PWHcQ06Wzp>
zmouU7mS%w3%YlpO42ZC4B%_~*qVE25zbxuvzZg4%THkNSewj+>lRx=M)312`?kcTF
z?or=!33U0Qf-?N_A;O7)?=aRtWFR-%jM$}lt|{s29^GS|ORY~OCNP&1%r?STwTMbj
zhjfJExi7J1Kr&A{4FpZ%=xx7~b7Q#Cp;ZZUx6j17?1a4vyWiH_e5_CG^=IRiTY%nI
z)*Z1rsXk)EsuH@-QSC7X*(5C=p4gb#rg@FBhh-X{u#eun=Tb2I>gIjPXS0t^PUz>(
z@QkJxWfFAAz`Fk9DbQ@*TyM$Q&=d19^Kg2{OtN)soL;2G1X@Qz`>Wj5^IANg7h+wo
zX+TQdN|WAxB>&ZbDBG*@?{D~ixt_F|=6A}tcG%if#pSy}W?KKC6`A+4PoyA$J?F(~
zahglnT{~7ci+CwczaT5}^G*%+?WK=Kkdvi84FhT{?0W;rV-;^NEyX%pH@6FAf0;?y
zZ8*{Cq1VQi8#4Pn8%LBleowM|W?MYOg|OdnyYL}+WAE~iO5xr`S$Q4C_1*RruEh^*
zA1-A_i>bh0ei^y-_+-@MVyicSoXpggPDJGW$LH1)uz)90K%_czz`~yG%S-sY3h6U3
ztbGg3*x9jK@<(5ZA1`cE6ViU{)Ssov*&h*tsI?jFEvdAR-Ifu1?B<%Om(We2eqlQ1
z*?C8+wy(6rC+8NG=V;~tWX6ghwtk*_1D^$n<*unPKE$Uo5VwX{r3s+p(NW4MyO1}9
zTI`Bp%Oxh@6=P+ZG(>Q*0j^MF9;r*q$u)roGeiwN84B(SWb8iQfUS;FRHfklcy%5T
zZmi15CaT+IGIv9wDUdtcpL*Dvp4uB1`f#2gl1Z*i<0~p55TU|kPvoK;f>g!RkkR&r
zoYoVcpFKLXWMlkJ$+F0vu*ec>oW|a1dpJ<KSd5JI{}boMhKdU}Tsq@m{Es-VLD3_P
z8`^}B-#D-6;t<R!hE^7BXT|km*$wL!25?q8KM|XFrB$^0W*h27r=g8++qbvUD{<_t
zZ!A@0hN$gq?o!ppbE_n;zrZ|ez3XV+EqOi=L7r^oj5D4V8z0xXpQ*-Tk7*UN<Bc(x
z%Y|QJ|HMMo#0RnIx_kaON$XjhcKlX_&R(kRBvxODJ)9G1g;Uka43x3Qesuf{;#6JH
zk0Q>DCRHS%SF_8b;))k<>>93LHJM=W;|hRY2B=g%iwokmvml=!T&AHa7j^3Phx+1z
z=vvQ2DFmyV=_hbnO3;d-G#w=-k*5X1k@SKg-dy)@Iw&JdJ3<#FbJ+S0U`fOuUr~{R
z?d4+N&RTn@s$BpF&n;WcbyK5Sz6*#v#Gn|}Q&tzHOb4qYd-O^<m55#7YcHO*+wcu)
zCej<%d`>1#7G#2Zdaf{QV}j)|3yD5p3vyqyWqYn3rPzCA=9)=O8&G+wQRkP^@~7L5
zcLxpHsB+I6Bz^R#Bp3`8XH}hIZXt@hKEGRgRu%t7@Cwf+wG()h-YQm&M(9&$5U(|x
z8EXArpG5iP=}fY1V5G1&KKyorR8Hmf-3OyZ;Wd&y)s!zloDmtMY)3cFH=fIN>IEau
zX0NDlAC&C+oy^Y^3^*k9s_+`+Gb1-2(9z^o8%c^mAikA>&Q(dx*k>dmWyI3|U_aab
z;HTR(uc~tv0HEMTm}E$!2n=(sUodt!#3fZ(Ir&zY1l1B*J&Q)$f$1JCS}d~UszaVm
zB1E2QllqQb880lZY^9O_hbv{m2m9M-r6fp&kV|RtS8qE9g;|KdVtn=`|H73n$N1M7
z+1(B|I#cp8sRbjm81_V>g~g_*kFR&p_qhrgV@Z&{OA+Us)DAKkr|k}Yy7k=kI?U$1
zWv_XMY3RksVeX}Ad)>!OpEKyb<X^evVDO4*xZuW@!hhhrYR?9lGseI|Wp2MXuf)T2
z=oKj>gqP*V*nK_HD?xA~=QSDEt`|sKolfpptwe5A4Z2{c6pmr3MVzLC>9bv-ri#qd
z>vUY$C_z$boaKbyT(H8@z}?3TpvmAcwb~Y(i{}~h++{=Xo9k{+-a~(Ozv=+m<~i5{
zOS93A8P!JK+j}Ugo8%5*YHjuN)PbC4<QW90R5cFbQaL$KXY{@6gL<T;OEZ%FTYH;Q
znp;R~Dt!RvU562n%5^D=OCI__v!5i!PehfiJ*-X6SBKX9h-E`rp=;>-9&K(*3zt@?
z%%vEe#G)TrYq!*|jA>uH_bNe!P1n9gVWii+it`%V*=%kwb19C}ZS?0Dt3n7Z?Lc@G
z^}`EoE0@L&cH-qVns(;Wo6CLN9Ip&5ElO6^>X&W1<ZiLfU$Dn^ychAwm{TU7m#<sZ
z6?>4t!nSl@5o&Pkw)JqTWzXe#J^Qjg%rQs_PDuutc`xGV!jeii?|g+P8wZKc&pZ+*
zyL|q^w!1XTBAXuqtZz6EQy2J2HL{CY&cS`p!Od_*e+b|tS90d1l;cUKms_}QaU9Pg
zPZfh`UFgyC%&ELh{;ebQ(02ArsafTmPA@zpnr#9;E=Gj76cJ@j6Q%(yG4TJ3y}Jyn
zVr~D%zk-g%qL(xh(h>sFi%_}|2_*&T6huK;3y^M*P*9MNk`R?{q&t*U7L9};ih$ty
z52#!B-u~`;-}e*$H_w}yIgaby%v^IE*E#3){V*UPlS#eI0hW{otPlX=vTH&_TT+%b
zA?(0RrQol2XlAS(X6o8|h=?0hY7^Rtrg_B5QR@8WOe|EU^tG59r5%PzMFIZ?oTIcC
zVPQ!bfM)-IK}cG@R)K)HGbyjcvh%^AqOSP#r?*ueZOx)sH!Qc-V1#$!v@bUC<N%2a
zOe@ApwWfJ^&~)hWgi^ZyP-S*g56(m*fa_n1e<FanFP5gG2|s6mOcg?}z)IEF^hs-T
zY6nf@0|tqMi2#Yqz>+c=Ous*X6&OURfhV(B=%!G_!khE4>#)*3W;$&+vSdmU&B0Pk
z5<|L51fE|cWkhOGpLeB1!gjJzLKfuXSK?@{yY2_*5IMNf5JpeO@{^QqAY%AWXj@Un
zMNwc8CqHC2Vm2%>z`!Az_CyTpi><NZSk|X*#5DtR$UaQ?)|dg9iH2<aiW{k>>vkhQ
zX6*f8HVf|iK1@;^rc{7AmvlTjlZ4a_;YIe|tbc16GgcgTxZHGblbn+IgRdm{e3CYi
zK^*H0nug1AR;Bs9g}^7KEp`hu=0KkPy~Sc4DLow^ab+T?<#CkBn7GjI8(C?;Sk6_l
zaO6jE#Po6i5*HVSNizWN#3PP#f{Qq41}g!&7-8-l7P>n_)3r?t*)uB}8D#UBTg{Ek
zmo{J<taSSsR9Y0LF2pn6c14smk-!8Fo<4zZpr(!>t|p!`5B3NOwoxSYyyXm5X@im6
zm6--c)5ywiBM4jCVv6f$Pu1f-MDLDdP$cxvY_QO|kP955rx?%-K7%Y?<g7Uslrxyk
zM_V+bjr2NYc&rqn=2z*uoj*5gGPyO8@6W(+&=hOYOv@V+4t?zU3QQkhlg*_<x|?Gi
znTYLyk7}7GMF+M5JbA)~KV7ooB0LQ|1OCf;oSr3;B14M?tgz}~`ci(}&fbk3RzmSD
zc0l6VN6|z_ON3B<oI<f4z!=oa7MnpVhiGZ3Ch3R-Ld$L8!_3oBP4FBfwH;<M>51U@
z08>oK)B&qhiM~8{EHi5?YX?6<((_Y~hsc*qkq~E6(rC!=hco&KN?2?ga~vRXu?o{u
z%=gSp5;eVd5cq7+Jfl;B?;3|`Mk?23A{Jr~WA&*WDU`jgDf?1M;_FGOT4C}~DxR*Y
z_djk#Yo3f6V7A*tR3VqLQLJ{X{0Y6x!HFt$;635~g~jr%9zfy(Z$jcHo}N)99Gb50
z#XzX&Q{q(43CJ(SveRs<dY$=vyPW-|r(~f4ksFvPnsgb*OHr!)9o^|E5&_%>XC?JS
zy-$luairYFRPW8AX*W=eG0x}pPcj9%zt{MHlVy3Tq)~YtrgB%GR(+INOZ0*&0CBOB
zrIV{()xB`SYNjuW!7X#{<|y;+=W`vbbkU!fN}tfhM1e;?fU(aFc(TB3m&pxnMiF_W
z%h&oea*)KDRvICn#t2+59$HSI66nBZK2nV!b}hGtHV^@<>mRPkD{qW}^o+trneqBW
zpRY4@@RN`||FWBDwjzRccq-B&bUCh^Y!_pE>bV~CtE&Rf83X0@Z)lUd$x~Aa8|a>-
zT@hlg-`bqYV7}&c;V|=p;|FUpfh)>llaF+W0?03hmDvz}AmU=>Z}Ir-uw&~!Ivv?d
zvM<k}*u?zV@^d8%mDR>o{TF10V$2;;#A5EIH5az?H0@%XnN^ZluWi62Eiujf$meCd
zSM-QZ>X?<VkQ57Td%UvEVd1maA{`Q@3oDr_eZLq_I!+^c3A-XP)uYGCNMnT+vrv$y
z#!Ge+2d{TniYD|TNCc_u&~6X)I4rh^T4DSR<g2BImk+^v0cUo2KF<hTx8>cm(Vv~n
zqw>`B##Dkl)LFe)E7(h;93%S4_A=o#C2%}_&&TUTRF+?)E67xYs7hvND!jzi1H7HD
z3ktoauYY1|O7oG5)iaCCAm6}@a)?v`d}x$B!9q)`_nQ2J4)ug4`G-xWr->Ai&WfJo
zmUm7gq~j=HF>2t8x8vGKaL_bvz&E%Y&c#aCC{L|JE`zVlwIRQTSBXlt(o{c*zF>v^
zj6qezS~L5g?VHi2vxcSt%mPMSoCpft0H#-ws9OQFSd<>5#`U)L?$vjR{8C^VhU=82
zPskq0vzDMBn$F14#<5D!p-xH&`1~F5yE6(HeS5^H8wTc90*91^B#)WjMug_`Bj$I;
zB4fe|$HK7+=aLO0Dtzpf<Ama(h|cbYx2HrBvQg0pEOZ$~y+-iP$cK$1qUVgFmr|lv
z$D)A{Z)i00juH2oE5|`4`wp7w0wi{OEH+)!B5r*;(rRu)ghSSwtwK<}g@sEUvV-F@
z-~1s~-1rsFD^fdFs>&Inp=d6;8yqZE>`ES#K24-~$iNDnMYRB;pqK>5s!<%n-D0nC
zcrwuj3p^&1tg?|D1!JVrBF!^6H;v>3e?VY+W{8L~@i9&0&8XdzsqBh<Q8(n7cEG2v
z_RU*p?~gQIaulQML1LoO$+uEj6~^tH$J0egljAln5u@XKSw7z^CyR}t*kL7!q?wcy
zAn8G==gc7X<tOdXL`m^P4uc~6;|Eg~Z**>aE(Pz{?QRZO&W+3<b_7VcGI!odd?pzr
zcM-b%c08Mr|ADD{%Jh?&Yzq@MIOA@nR`U911<dEZ-i1VgkImvFBscd-2JaoRGP?n9
z)&_#T`iq6DYYvF!z%uF3@_qBB^>juKCi7n0=_qZJ!a=^A&jP2Xqu`42OtB?%wU#)k
z_tvGiKQ{|LMhg|~VN#n$@6|ndCss^})j9Ez>)!jJ>imZ{-(M*eFG+?k$a8X|;fLOZ
zl%{n!G^Z8!h=SLh8-!svdp7c}DJ6|0ZkWw0vBa%6CNkdJeCDU4#t;RRWR`8(*f-5Y
zZW5i@nEY7%%yN*dWM=y7J=T*oWSqY570|SmpfYOu%J)2R<?FDu^__6n4|c3?{Isv@
z>r9v>WmI@zrYt^nU^cJy-P_Bg9MbbS0okJx%qQC*Du}w+-TOkh@9KIqv(<(Tu|(xt
z`j=*VsOv^#+5z<|QmY!xb*q#3`U-(xEE_PUjreJe#8ZuA3{8}mnrPFS=%<>P8JgKH
zHJ?gr=ACLj&CnupsYN`kMQW-=j-eH+c&Sx6tyO)hRh!|Z{-u`}(_a3c<GjEx8DFKb
zzMASiZ0a2cL@&R-x3zua(tXpJz3bBb?=STqPBGuhJn^-*{|mzaY2CoeLEq<tUh?!l
z-1LE!sX_Y7gOut0r_+ao(tBCc2e)d6I1YzJF83);4~t&zm$)^=c6sDN-H0;d2*7!L
znqtJMJ7L8*K$bpYlRn}sGpc=Sz*Xio`f&8}tx>7;*Xz=~H<WO&Nw>%k(0ED5Di;lS
z;v9(jAaepxx%x6D?z1u$9FhPkSAh(pPUgh@!|~+H6Zwo2B{Gv`>Er2)6R+zgrWq%m
zr%z^1Pc~hi>YSd+WSm~QHL=S0Ci(It*zC>dt(nQXnRB4GfCiQ+Gu6&G(S0~YDLX-X
zdwhL*hFErn`oXk#J%-urE!*w!Q*Yj$mYo)nod<SMVq~T+n&BK^-kz(USgD(TEAuv4
zhVdTyE%)tl`>(UEW^-~676{FjSidgmGhr?=EjfREW63mkwSMvPgJsj(Z?kSMoy%BC
zW}3Legem#Dns9j>K)H5~QLa~S2u4^bU)^38k!PH_jfVwPt{v2dP1A{Gru911MmlC4
z!?Zs7V14?*#sbqu6!N>uMJLY)s9c<Y$|X<5>Hpyz>$;Ht7Cm@7iiI`}v(0J_lYM(a
zfEl>>!2R}vocXpKFpAw`W8UUv{v_hReX3zwPVS?!Iini$w)Wf47vB;%z5V2AzIEd5
z)`f;0Q|4{+hufn~+d>VW^|7Bdu{&2E?nYtv;^cNbQF}sf_uR4DRsJ6e%|GY7{pi{B
z8SVd}-G8V1?FSpVg9zrYnR17Zu?Oeg?oYoZ05zv_vEf9W(F@68q49zehwEJ&2xah+
z@L<p|ip`8W!61@9*D)Act-*4&!^3bW0$VM^k>1HurJSA|&t`cWhdVx-fc)#t{R6@?
zc>|eB5p*))XYz+~H112@A`&ea$u}r8sS6h^eDy@_dchYWv7)iEE8X{GBE+6dJa?L`
z{tM^ja^2(4oL6J-m91MOzi?i*Ubks~a$Yo3KIH)Cb#a5LX*RN|f_}7<9OG0ZLC({(
zaidqEZ>?I!1DQ4`32<KSQV;*&ygo18t=d_?=KpYfSTRVsLLv5TAHVnY_azk#Y~=23
zF794YB<>9{=2gj}ufKf3k^!98e)8qpcua^_u2p$hHex@LBa({=-QG&lcjk!XI(VdY
z;|1mgg|cr-mYGq7yPX#7R8QLw30uLo`Vq;MDH;5o<RVqS+GCMMt3H;}!gP9m#wg~P
z<RXwI<hTUYQnk5jXcm^Ek9)pz!K0zG3?R7}t^}Q9$oC8;Q1HQ!5E~(yO+ywjI}rp%
z*{P~w7U{cpX-~52FQw1w&YvWfNEr?#P`Sq192<5M^Vpr~O)yTHmMoop@;w)#Byx=_
zgbsO+qSYMiO+CWj*)*)T2GEwfCxp@RrJ-^OL^-VqD5JXeGDRxTo%bKCjZZv&((rZh
zT>1`2c@{Zu!8Vh)dMR?2Fuo7li6K_VD{l>7MBH<zB#^x5P__6V!lhd6N!f$S4TYWi
zd@cFbFw&+lV_tDV6GsAKMXm7r56#lt&$Bh(HnR3vB+zhUBc1r%eR}cA+55%gNR`u-
zprxdi7k%*r8#O0Il#8o5A4Ym~y{>BU=oW|}DK{euUWg<()5j7ZVgHUdoWS=Z-%wj>
zC=0&ojkc;&e!k0+g9GQ(?fT+U=LG{L)=zjezX*f)I+sv6NAS^{M9_MU-@jYrG2u|s
zyJOzVr_kc)(a#@0?%ndqG|D2~y_xX*ShYx<6_cv7^HM6Cch(ex-=x;*w9M19Qv6Nj
zDH6{VN@!2zrAA7QhmvNy2M1!ugkm((N?S=}rg|l9>?%lo*Piw>jhyt1(9zp?{G!j-
zG~)i<-ddZ~toNp^5f`M5+C%P2n*{sBsoz)J(Yj^UHzV)6GvWHsL!_h^rOY=MseOBI
zZq4l0e%;d3DuPqe*|!heMSUbb@4Ss^xLX}A7__^Hm6QG0>53BSKF@1X#s=Zh;rE!+
z{>ntqL?C<B|1Ky4xBnCbPbN%hT;;s53QjXT+%4#c^U@Ag@VvGe$nBI#Y#!Q7-Ru^8
z#xIk^F|>stdLU5J$<pX1qM1HvQ?}3O0*7}q&UF>HFb$`Zme)j~*vp&#iimddx|x)N
z`9)W;8Y`Nu@^kDr2a%R**psgHDoUZXoQ$c05W3-AaT-CQh${wjT4T#?(7R>f9gX9U
z(+E0{L=-$<?muFUsiY)y4`CPK!WVvlBH_L5Dm`JD&Bn^zsiYS#k>q!Uojj~YQ{Ztz
z3PU@bVq8GWV?MqElykB|u}kG1#of<g9DDm*5PX<Na_yRpcI_z$H{DRc6KNaaH2L;<
z68^Ym24x{^P>*<lZEB_CqDV|?&nq2~@WmS2Gk4219Svs_E8RP}8cu1r+9rr%))voR
zpC$1OpiBovzSO#h>Gpe<5awPuBN!4!vL)nzx7r%Xcgd@jb(azaW^6|i-%Jg>$CgQa
zXs*c2quH&J_=vWaYXi$tpd0j|<Po+IhlznFK)PTtV`YX*5qEzu($F@GE&Y+IZoyD*
z=|~QZ^hwek!jTM*66(q?k9FHaNIb%kxp9N4f^n?sD4x6dvF;9h84e@a^}z)(Wju!1
z{Lyr`yQj^f-U)7P%6z<(TV#>$U_0hu@QhRMNfLUM>UlLm<~y$vrwCJ#7>5q4q(Ba*
zcny~%LfOVQ9%+FbT$lGe#*`iyl=WQ!wAY&Cj#-zd;nZt3q*4@}dM}<Trhw_?3ut>e
zUz8_#@!64g8#mGnKP#hiylg-}X}O<RQoHV4Jyn)4$m30%*IINL#uH%3emA?BV?#O0
zly;uyVrH}GL(j`KSlShVit2?L7t8Y1$1B3gPvcsR)trfG*Y%QX<~9Yctvq_O<?YR|
z*qd)QtNzA!-@D-e_wKq!_Z#B2fV9O}+?%5x;$L@ER72mWqRG;daNb{OYIb((BZ;IX
zj6gMKJ>Luzae70FUwPl7mnDde!3xIvss&LW5qx24oWc>_O0>Aa?KS?EVRcu|5xy1L
zMAz9s{!HqfN}JY;P3vI1y(}fMrv$NS^DY86Iy}R|5;7SUOtmELx|V&2E5B54Xz0e4
zcUhf0qSjcD&8u7U>(hI@QnmpPjQFmKeQ>DqRbqJW)9)9oHPy4f7#}~Z;L1I#Rc-MS
zdH;QSrEiHb2|q*$+v3w2$@$Ebh2Q>Ma>-D%0C6tm6Z;R`&s|*PHxk;nE{b|q4-|G?
z%WD^Z_i=w^B%g_2SZQ-ucJ=1#tiA0*@Yz28>?~p%8udW$p$2o;n*`0AVmD)Y8%%g5
z$65rujWW`mY+_<2`pk%5<S^P@$#_n@G6qfVRp`~@xj*>|ue;)T)QEfXmnj=n@r-fb
z)l1tq-yX<nxM4^e-@nX$!)f0}GD7P1fskPuS8lfsT<;dp4HQqc&*Hg@yFHD)G7GEN
zy(h$VRU2zt4GQ)-DI%K`rGJ3wYUAOtaj=VT*z-CpuIerM;2OjBDgA=u)<wgYa_Odt
zOUygHjs;vF1u3VoOU3fuLw9d?J;)+oR`K6|f&T<neR5lrqhePi=Rro6X}aItKFMBN
z{($0Bsf*&SHIw(_x3eqs{1~>HnP$V*R9k#EK5{HiI~op`ole@g-R?VsYi`^;IlZ}h
zu2y7AC(L8y7TMEE;cl<K&z&M>?|nmR=MT;H*vxOQOW&wj(QZhrG(C(fkw3$9zTxK5
z`I`(S*K5z&yuUdnm;Navw{GKli2=Lko7KwCb?f|eemV{J*7IC%Z(oqxv4WXz%%#;2
z<oF*%8_Ip5WjG~X^}eqy(0}~xMX~MlnA;VK{s(KW4PV}pVRyUbP&wKShq?`4_g4L}
z2k#rOSUHWQ>;BM6tm7U&uyqtgn1>=xaf7I!$SSSzI#84<Xlgq&?XDb*08L+MP7#V`
zCJ12V3RruLX0QwJT|l$t1@LwR@aNfc_yh=5YI83Kh}s2;hX&H(1PXTq)+z-`5Cj37
z7fWTJj9n1w<9E*M@M4fM!5xakAWfA!0O$4MbC7P{on4VT7nkpt69hLT-7!@Oo*2Gk
z85(S#7d$E&Y_l9(<{9kB72>H9vM?O%8XDq28RFFua%=a_^^_2_kFf7@$Q`>-MS{?P
zywD|u(2(WOn6ZGc%Fu+fJW&K;$)RDiTw#eFVMbPAsRZGfKB)U+VL4|x9&&}_ryOxy
zP8L}Cq{eV#5b~SHwHSEhapfBYX4{1~>@w$dM0`yKA~QhB7V=Ikz!?fU_PB27$R=$@
zLIoq^jQkt(qLxoazOM8Kq_581$lhJKegaU9iY&WD<g4W<p5=&1f|$X<sC6#?nb1g3
zE8g64<mwp7Tsi4tNAyR;k>Z7G&vTL`md!3^wj=TjK~(Ws7zz|iC=oku7fWl;v8@uf
zUJ<*S7qdVR1$bO@f#5cRDEd7#PFNgoK7uYRe&%%?HX(+TFn)EHxYr{3)LuMIUOeAQ
z!W~S!)D1r&dsz|H=tb-3ZXcXI70@bIBK25;9QR!md7^fhkCHJ~_Iy<gVl(o)$CZ&_
zScTG+xO+8~`hsebVaVP2th+3L#|4V&--TM8h;<A@*@h+gs!}_IB`ds6n%hoN0X(i)
zd=NLW_g*q#Ub5dxiZ&)W!rmP%0Sh#i?I(a>?IOtpVd31Vps|z~?t7Qfu@4DRiT0`U
zfvMj-uBXeXxhp|55`f}`h~vKBg%=HYTy^93;SvcHGxr-LV1-qr?GmzOsrUD3@4Z+_
zlSkk0KH)H97ta|MEn=MBb~e7yUbc%ned~2vKlg(%-Ft5({9m30t>iy|xTSmMKUgvT
z&T(P4K`ZtTwrL;Ct)va6KE&P#{nCkj_<ZFd$RWdzD+9`N5BFvUX>~ARK}K|E223r}
zf*_N;I+@ZWliuVGZFuI@{7eR(M{3KN%sh8lk2tSDfb)_)=DY*|&Z|29i1U&R05~t&
zW6lc!a9$>{N1T@=8sNM(RgO5X8>;tJiE;*vA84xOScYcn?nkJb<d_yb)DF)vD#*FS
zle=*}$9y8pQZm=R>z0i}Zer*W=M~zX>s%dr#ChGj=Bf5L!0xfnyT_!<IlgLHxAq_3
z;R#0b<Z-Iy1$X74b03H82S-fgCD7T#5aru&<tG;8ui4}$SKmpk&d*dcPJfrLOHlAA
zya20IkaH6oRG(B(Lg&BNRv=ZtJA+qP5$?0|QMugVQS~G5N}?je5W^cU3pv#cjA)8F
zd3+v^5WRGG)F=w=;(20SQP9T|SRGI_T<~Nw*zl(96X-h`kxk!8wc_j$?YH}xGD%Ms
zx{58lt(W(Uq_zsz)k?DNsHowTFw+&kx>#~(BD=#5S-Mxk>>y>oRDxe<<S|+VoqU9Q
z-<g28jO3gaad#;{kp}+NLh|n7TG~=--s}yX(#mq&yKrI-$ET+vo^lsH<?VjTzxwnv
zak&t0xrlnXsAIW!M7cy^xm0(#%xbwD@iY0F^1Bv#tcy>WCLe8-;(hUy(p-I}P5f^;
zFRABeO7V8XpBcS_Jt=*r0jhB4t?*Q@@S?AfA}2rMydspmk2x=|hzeiz${UjvXn^zL
ztq3%&jPk7v2RJXl^)juDp|46Nu1HX?@^chPS*`M@kuWZ=x=GJex>fanzFI-B`i5yW
zAH2%36fc6M)KR@g5v;vEmkDV_hN|5?F~U$=LtR}{6YO5If}5!}Y3J<jRHKIIaI}9D
ztn{3>&WK#RzniAJ2GJZrLt9XHH7?`j7n*ik#OS2`6?9z~rgq^A^^z}Qg}6>kq;AWU
zdc(JF@P3^vl=jj{d_6HOp;|r05!=u^Y5j`c5*%3%y;Q#zf%xc4L&VoWc0dJG^k9*Q
z#vl)ergP=$wY%!{ggi~SBn|5kjqkf_!?&8+Y=Kf!t*v|$e63mCz1e!OnYxye){o{y
zErMo^=4@>vTcic|C4^99Gb;(5f^^Ht+Gb&r*3&($s;sT6HLc;9E%r?<5|>(>bYIG(
zwem5%gw(!N(`e0fZ&ogPiPOV!d8*Z3gX(-_TbR&G+qjp8JxzAx?KW$6SJqzIlDxF!
zqoasy_x5vkE@}%Tp|a-daPfO-qucJ`)M8cEfpV%3kwygfv}egT_!l)N1$PGZbbg&_
zkB{u|WT1)Z>2NDDzqQtazJ%?3u+>@U)Jag=nYu=iG1VF5*ZGX0i&mrS!B$(AUsp-(
z%QA*mS-u|5DeDs5=3I1b$EEIGKdKee9=)^<@9d`R!R`@1x{9@~b0poBwTSMto^ih(
z%v#UF8fEudZ%%D@=2qKkPuFy9ua#fV%0aJVhU;+Vv(HX_Uk)f|rkEQ)(vAAjNv`!h
zME7k)c75#WI?Q}=ur{#d)Q<%ZKn@u|huwpi{*kzTvfe?z(E;pK*=wP}S7n3j(}Sm?
zp1n~V9M~G<S|2)1IxNILETTCq>O3qSH7xODSgLneW_?(WbVQziL{W3(ob!ls)QIYn
z5%t~?&Giv&(otRhQGHG9=mqD|i~o=Ff@;m+y3F85&kz>R5ckcHZp@IuFysOlN-Yev
z3x+lt1LTX+_hA?}FwC%7R)JYItyvD2*;CQ8+{LrJeY5-<v!`KmLIQIlT63Z<bK=o+
z62)^;eRDD!b8@hGd4YLFt@(2<^UBfls>So_ee;?d^V+ZlU4aFCt%VCN3m2mojEfgc
z`xY*5ESSR<Ed>^>wH9q$7OzGx+7~Z6_ANSZEV{y$+y$0AwU)eGmaa!H-6&r2?OVFF
zvE&b1Mhh$lYAxS!Sq_O_4l7=c=v$83SdM|M#0jh<Xsz6JSxJswNiANv-?x&!vGNf1
z?ibF>_x~r(tA6eOgvTW*Dl8`{CMBbwC@X0#$C;o+rhX2Yq72tlJD03Rt)i}LsHJ*Z
zFUCYqQ%B#}%uvVqqVgG|xFQqwmnP(BQw5t#hEkUk+s#k3Thc37C7D}0I9Xrnux2`U
z<(`UdTBq$v_p25td!sIUP7Q~&Y6lT-Cz~E;K3&&`y{>{z?l=70?R(ut3_UW9z4OrC
zF8$t;m#^n|`k>5i<oq4u8uC|J_ZJyPDMz7w3<5-l12rxNolUsow{b_-Bv{%l_z5~V
zW+Yh8CG@#j7}6u`>9w$u(J(^*<4TPP06eZ^jLYQz0>(9x9r(@T`i616eT<rUjJlWC
z7@qG{o&Nw+@ZWn}i<QYMl}Q;@G2K;97OT@rYKC@d60&O(`s>Qp>e7x$uFU^C9@pmo
z<Z(@Q|38llO3b8DS&C^1rQ|j1sVtjok7ZMTpi%X7p*uyy@l8)v`BHy|Vg!?B^|O`X
zJpDqm-s<P8uS>1FA86LRSf8x)Tz%79Q}O<7V<0iJR&C|hTt@=0d0%bS_R>I>`a`X{
z>QAd<<&JOr>S{i}pJ|D}GHch@?rkp*7n=9i*M0e1^ZHL77dy{iJuatTJ+1*-xb4}D
zAR6!G%-aZv3Y3C9N#zj@=Sg=cg_P4SCPFZm_E9jM2VySj>`iet_^I4wHVPA*ajPH+
z8vA)KDT>VbcqI^K9ws%gnGvOIXusegqJ?3nL=Kd4P@4NS;gRc`*)OKP>{Ve4GI+GI
zc)v2L%r=<+8R1g8PjxOSxz5fwgh&WjOC}0s3@ALj_3F1C7ctLIk4psvcwAR9SOAY}
z4Hcxc55ng4s%(SC`p+RVjy$f6#vpkwg3#8YlQ#mIX$eR5k3BBVBaf>OCbmEHH;>DD
zgp~u%b|QjL!Q&5)iwkZF=kfaHaXtO%arGT}T&h1ju1LV+8u^pQRbp`P)8itf_x<K^
zUHa*95tB+Cd0csRo&^8U<LcxsANl5Sb^h7oV&Q?Xvd$pBd0ZM9jmI7rFVSHubmk!_
znjt0;B5bNt40-w+kLwZW505MQ505M0r^m%Yx(oW9#}(ZS`{{8BE$fp~XcTQT|M0kA
z-#sp_kz<dm2JpBZ{mtVF06Z?UA0AiU507gZ@0-U}!T8<d@&-Jv>A!ni7k_$OApt`F
z#^WmcuRN~LM;;dxo~YO)eP%2V{}Gb;`hoe(vBw4blgFjlMCgUba%)q^Oo7D4=Oax9
zLIv=+9)W-LxO9+#CPRS7Rr%fHBKzraL2!R~T#x=ok1OHdd0a~9n)-393g~5E$RiTF
z8zb}b{x}r4&k_PrcA&0+Ry~$+-_e#Mk1GT4xRn0laf$qUkL%?(j|=s8kIMr5hsSlG
zaDGm=?draw)~HB!kkf03KT8ZQMAOlyRVW(~$>$3RxFVGn0$C6uM+%MQifw{fTvCgf
z=l+q$wMC@3F0UoEjBkEg(qNE=2QLx2R0$d}yk$3V5u`U_cSsa;8(ZX!U;XU6$E9`b
zad|fa9#=SSVj<Iqu7X#K-d7oa@wmKxdR!WIiLwgw3RHjfxM+D$1CVbX*C-QSMWAsM
zEpkETuC4Lrom;nFUrYf!E>k$4+y30&J+8+zk!VGlkGwK_fXB7|-Qybn!{Y)8-C=~I
z2|a##Tu#4uTo(VK$Hn&3<7#7xcCEaD)X2E6#UdrceVBNP?oxS1;hAo*ru>ZuEP*s_
zD8S=V{O)lP{?+5!SCAS5JT9TXcw7UdM;_PnUp%fmB;o|#rM_;J`0HTmUp=mg|K8*3
z`tEUs{s$fx!Li3x``zP8(E%Ec|3{B&^2p<gkSzVJ$2Ic9;}W3?4J38?#pAMQg6aIt
z<C6M~$2CuV=2wr);+w}+028uEUGNja6ZROms1JBt=${_fb-?4wIP$ne|M0kwip04(
zXZRVon55ijr{*&6(3B!|{c6+Y97@#MJ@e&7m{l~chyTgrTC*Uz5|E9R&pkcHJz&9D
zJ_bf}WRupBMr>|Y5JGUD!b)RUyS6P_5NG>7AA4Nw#~v5**yGawlgGsccw8+%JudUc
z3*(;95I5*N)Og{8q>Yk{G@JIahhi7>ddL7I@7Uu){@vpWfh<FDr2gh{sWjpp4nS1g
zZe}F-=ur5Za8WM4<f#$C6`{Q{TdE3M@cN2UgHyYGQc#s)Q`rb4>(+zAxIEaeyZ!2M
z`TlE<%j1W~WeqYOwU&}uCKICOZJ^*?R*;zX2$P}W?fAg_bumo4GI;J0?(aRW7snnK
z7^mc$#})E7kIN1ECyxvHi^o-g@B258i|a2Q*XtvXi|e-@S0%nU4i0&hO{Gs9r#z>%
z8}GiLFAg{ox5IO8*cg6J{h0_cKm6F^LjLf$6puVEAvdV+k;ldM!{c&;3jOf7kZ`Ey
zGyE(hw8!Hgd0bq_9v46IZywk6V~?v5M``BI9#``(9#_C$Jua#L)Z+^LoyX<z8;?t>
z5l7z*n%YLodNH2r0-O@74D2F-!<J$pLJw5f!~;$}K&g^n*-7b_c*y#H!sAl-;c<mS
zZvV~W$~*SBr2e7D1^$;FSIBpd%eV2^;}XR4_|@au#9iJdy%@rM2YWN`N)Xw<@whf|
zOO?HU^|)^T;c-0&<~cFHg{#sgZawm^9v2euxYT}lT#Y|GuEt}J3v%Rf@gskFT-Gy%
z-8XMmD9RQ(03nC}p~tm}+uMoLLsUj#O2Y5PYpwIdL#XuAV}G-M?{U36^0==2@VLBC
z<wBd~I`4ktag~&M=lye!>&EXrF0Oy!alL?kLVfqR`2UwZt{lMQLg6)T;$8tEol0xH
z0FP_p7msUz=n4qe>tA?W$Ul2r{D8+L^&fg%6F)pI6MVjEXe8iq!J*hLypoyQDzPDa
z|64t-NaR28xSEbVuBSgdu6<l7w}<Dj=yqsR2lM<Bdh+x$g6Rk`Tz=5M^0@eacwD!C
z>v5redR+W}@wftsoLK&2k4s4B$m7ZZJTA2#9v2+?<UjYg>>Ba3iH<!k52yx9yN-!u
zwIA(nX*dikluu?k=q)r%WjRb6#fkdD^;?fi<A1Nm75-O`OX?qcTzvm$Juc9{^SDfo
zJT7ZNyqclBPcoEqbrcIS<la}kOaAb<KH=hX!(T^DA2umlm;NJ<OX+VOSKjYDF8+V$
zah<~N>k__IUUXUFX3k^jw9k3D`ZpsJi@Um7&$_>65Gtj@OhLdnq!BNO{<+6x_jivg
z6vw>LTTFk^7RLN{kL%2@9+&=q=y6@ZNBskj%j<{7Wj&*Ar4o$q-o*E>J+3A^bBi}P
zWiX+}xJj7q!w8)XS+aEO5Lt`tMoc7G#(iPl2K|+<MlzIA|J37Z!m%!ebwT5sL*a09
zUJ<Tj^9)>yfT-F)sgB!QN#)SGRZ7Boa-6C2M8_VNIZI-b!|82bDYaJ(fAP44SgvT4
zHb4eh_&}-wF*63~6gX3H8NYg5s?gYgc%jljy;hGiC@HT-$kO9a`xx;~!uZAnIPE1v
zQUx53BqOvU)aw_IOFZ_|MR!+OX}C`VTzN62?_p<+DZJkwKKhU*$UY@hRaGB5K!&pi
zH-My^CH=A{?;75jLSgB-%W_CEIL$w}!h&fx>}T!mr`>!@5wFpyOTjV!o^O;8?)5);
zT#^!8V@DnrGY<>$&mNb_fA4YK+L91m8!x*$T5L1<YTdNbeW5SM^!3K&+8duX7A9Z6
zH*eH@tx1@6-OaK!jQX_g)Yz7F7!_;HWr^_*Ha)4Lu8Rzm4p&Pa%ExeCp7^*@$>qHp
z7}P9!<Z)%OU@!gjxM=?HxEdJ$na8zv<Z(H1E_EDvT%xI-8nzGbM>9Qg)U@6HFFh{U
zf8}vaTK<n7SAk^wO;4??S5t9>&3SB&h1|2{p68`M%@_2`fqN6Quu5nJ+&ibu{<X)I
zaO82tA9-BtfAP5P{HGq5<w;WyGKHNX$0mjC0?)yy7f-yNI3y2U>*lAWrW^a_aa|?x
z4=sKD<_5Otb>X|#qE{2w$JHvw?_@Ii%m&w6{`9zVe&cb`gq}tXguGTfBmWZcxYz)X
zt8?rZkLw}hf9-Ld|8G66O~(1y-*{Z?SwB3ks}RZ~kBdfFko7Mf*R3Oui})_!aoHbx
zToW?iJg%K%kIVPpdtBZ}9vANay2s^A;_-{eg=j(i;c=a3eD}@cLLPZsWq`*uOFTUZ
zcwAe!R+s@U%Q*^C?hB2cpl=?R_cxF0$*&$4{6q?<MN-cp8hvSqu|H0kYD-tvpPfBb
zI25uKCdBpLCsa0c6W1L6)8i7vP;c9zPe~63l!I9TkE<E*xQLHEE*6Djk83Rx*V-si
zRwv^Qzb3{uo*~>xY^+0+BlMP&!FP`<>$e`)#y5}4`=`fc_ub>NYpQSC1U#;J;x`b5
zPkv2E&W?B%GQJL`53K<{85WEt|H9*v{m(qEEEwt+k1Il6%4jC$wB5h;xTtY$WLCo<
zIE4jol$am-eDk<KKRm7oM!@4LiT%anQvUBeE^8=#D}E3Ss3~E8ubC>P8IP(IbnJ1Z
z3<Nw-_=G1^i3@mKF*L{v1#I@~T0}`EYZUge;|s;nFD5T<sufj>-uT7iYKQ$>kE^~k
zFas}zf9I2{vg20ZvByQEct`ul<2rlnam62bT$N;(CBJ)IY=3xM^MCQUf`R5jz~dr>
z(hxMl)mjO^dt3>C$93}9<Dv^V_P7pNApQH`V~@)jiL*2ScwF#c#)qF?o;4(t8ec;&
zKCX(J&1-}jUDBnLY3$&X{KMmt{FfdV$#;*7AP`&%cw7X5M;;fPIN;A7S1J8e<8M7K
z@;`fA&Bq?sKK$6@x|(t9aS2xb+2gV}7o-h%T$SHFt|@$?P>UKC!Nz=<C%Wpc6U^9O
zJT6VZ;}ZMT<3f@A@VJ!z<Z)HX!%qSpml8_=bJ`rqA08Jy4$W^oE)^VVz~j0NbaMh8
zR}tWGdHwLXZvODN<N)J~XVc?{$K?-rTo*uiOL-_Fp1*rspnv6YjavNlxD<Z%xI};T
zxLV;%a5O8)507i$r^jXa&Etan;c-1a_P8+YM;_P3Up%fGhzA0H^|<JNdR+9!9v6&c
z?1#tY^JkAs2Tj=ocwBL$KRhl$5Q;qy@VM~*>~RSmd0eZ1cwFToXG1vu;&Bb2VLdNk
zwWWAmAjVR05BmCO->MhojY7QSyKLlDZ1vpt@j%ER+DLiO3=%XWO?iL@TQs`xG>Yrv
zUQj_|TT`S(rXCh$iBW{rQSQl5po1w1fafk_#47^dRfO*f!t;<+Lh^4!$eneXl_CQ?
zLAan&5RwY*$|6Z89YX2@a<>DGtH&v_#l4l16z3vO_LaQq+4_tPuNMj;&v@=35{Lf<
zY&0cvt+3fM1GL9h=i#ZOa-gVcfTr?0vx^3fE$0;!CByIu!o$V$xW!0F#M#g9t%z8O
zkQ1e#D92GymN=IVP$jQSG#hyg8@V_L<SG)!2?B9mkp)YWQ%RFE3ZmE%AlNV-C@+A@
zxSmb_90(qaSZU32gxqA8u?($qPiu=06m{mRnvRfV1f#v!<5-U{t}0WfW~^+6vhNvk
zM8^+|3kujToJSa!MF8VBjLY$SqfcAhH;iiqd4zGTeZ#mw=lSaB2JU$L#JEtT0LGP9
z>N$W5Ekzw;TrXJ9f-*^7QnsocVO&|N#~4?zY=-JF#wAVyU|g#J#&t(O?+D{6&HjOL
zm4XbvVO%OdFs@bg6IESBI7b*4V5%6BbeHiRV_cp;F|NqSPD!3l@wo38SMs$sT%2Q!
zOXL@f>+CVc<#U8_J(0%6PXB>%`TW4ROaY8b@;k=G0{(_^rKcTZTw{O3xO9HOxKw{&
zTyBB9&p<~QSAtev;dhKna8s@Wz__e?2mXq2g~?k4kN9<tUKya$Lxb%CGQVS7xJMWl
z*RL2?@U=+tZx|O9fN|vw_8nndc!r=OjEg)f4)G1+$~?ljIB($q7#H)W0Wyj|Fs{(k
z@Z`}ILSBMl(gos_XG4I+g{^?1oD#@~9r8^ogXl^d{96=3ji678`sB?+eB)sD3<85O
zc7G(qKQ@qXJ<PEqQ21^wY;>5+3YR7-?!7}kt00IRQSHAPEa9W8T&IW6n1aNm_1Ecq
zu#01AWYBPSSZm?oSCdgmhYJ_$SY&S{xDEse8HFf@;v1lF&hHWmWw0BF4xf)2Mcxy%
ziej^tc?G_AK}iB9ldHsHo%q6qSKQ=5cs?k+SR{om8o%+?YYo=YRYNTf3JSP7`J+ZQ
z>UKwG(7m;I*%TDSqSZANLUOjoehn9q2O`b`TP+9jEO&Xj1@epyni!y9vAPa66t+=?
z;0QxY&9OswC=`jpmXsrL1VNz6CMg{LJ!3#g1Qm^t<Ibp1hJm2eK&(B=9l*FUj7W?q
z|G>DW{nWypL9k8jM7BCJE)*DKL}^)-H>?(VIsT3e=`EJwBqNjbSfP;V2z!}{lQ)9E
zDzcQ^Qc*G?s_PFEpA1pTgW~z)%+xaz885Ea>I<X6?-;7pQ;byVg2*Y+Qq;k!m7<BO
zb;44hOi^<8T{J`xC7oj;hNf~J1Ji8Mq{ar~l!x86>&$x@k-t7-Z&140Z0mlu|+
z>kJU+<58nf_$eUg=O#rq^^yGKM!l!0?NGROC?VoNLN_Rd5sI)w%yJBcYXk}o9K^!L
zE)$hLALk%PWPnb8F}b*g!bhP9;e%%INwd&54e2Pt43xV*nh^eiGX+In7=W(>B4N>^
zat|c5lZU$n;>I@G=S|}-qcV#E2z@}YQKcrOPw@p!(*4GxvryAfAWzSi(Aa8<K~<77
zanDD<hYD3-i?V{b$^Gfe1Y>ochyW0aQuAnBwoH_y&QyvUfN?$R7>(%kI>NY;(u2o>
z0E`QCjB%Y+I5SN-I6<LmIPwkS(gDAZlzexDaaG4Lf{rk**xrZbsK*J%7?&b|aaDqB
z)rn%qL8Y@MW1x&9jH@ZU_jK6>yd#Y3tQE1hGIkEYxO9vY@BhHK^p7zv(1bwWTMBsq
z<B|X{E~Xb+PXUa}Zdecjf^vc7?5$o%<L(+9V_cPUApph&pCWFX(e_Fp1u(7^y#VBI
zFfId{kPDol0LC@+E5=1<Dbs5yiPF$QV#Wfs84)O$kvef{Fo1C(>L*TU9b;S;M;I3q
zfN|}P$+Cc-f5W&O)i1+?IChkvKC`g^#ubQmJqvxo0O1!yk&b~rGY;@<SUD3|^iTGh
z%`ADwnt#K%>i)pEhS9PhV|IgaEP!#rT6JXrjEi8V|C|w}s=@|4xqPe@bxJE^n-LDd
zIRXL;oD9?0UOVtH#^svSuMr(bqD2B=Tw0u=LIB3aV{kGBS8NQL8II1hh58}EM;O=g
z1#?7TvFf`V7YBb34h!;*<exAuK2En+-5+eutfP3%P|T%xb@Qf8p7W#xb9C2iDdI3i
zcNaZ<^k?rH<K}^*<}fdgF|H)iS|_T>Ytly;*EL(9FZBrH@^MiwI~PYZGfRQ7jH|t3
zc#Ls10~ptpN$3&ARqhU8T&vUN>DFb8pfKr>h`tiMMY9tpjI}uMocvm`Z1+I`#wDm?
zzlS@{aD;K82mp+$aQ<F&rsg+{YYf1+a14H6T#t&6F)o$w7+2nT^j7gP#x?K@#x;ia
zUS6<t-k_|tPWW>52;++F0ym<BIpZpBEe>;#)4e($dnQiM2Nb3cvYNrX0WhxR9~c*<
z=@x)-U0G_A#pim}$-iyY#bnCcx;8^RqxhmNzPpAr29zZl_c#j*sBEMN5Jz{1EMUQA
zEZQpp7#He<dHcAn*b&ABSEcU6q|{e|T=bn)z++k~p6s=W0LFy^-y`0nOdXbc^`5e7
z1>2}|=M-uxd~C%V3D!p98hpdJ#sW7MXR-l|OV~A_!_(jH7~^t#|2g^x#+3(PTp{$K
zKQJy~N3vVN0szKE44ubw1Gj^|V_b@xc5h4ojLQPRxYQv;u0JrY!k(9~Zx~mjC&Ly+
z$a-I3|BD_=6W+n@4J!)c9~c+QirI`Eyxo0$(%toyc{TMB#>Hf4ya!-hDQ)9N7#E(F
z9Oww+D*V*PeuQyl0T`EH5J>A7<5D@sxZI#o0^^`OcVXA~B>>}6+rBku4|{WjaRC+=
z)~ga1z_`)@jLY6NV8%1z^>+3*j0@$u_Zy5W<R`}U^cvm~#)X0rbVCSMurRmE;%bKI
zYRHR;THo&&7yWmPOG13+JH};u8g;Y&%J>n+1tJES%Y%#)+4@iY2IB$&7}pa3<Ep$I
z*)|5r1u!nq5yl1gp{Uwocne@$wM31e*eAFzWR5W|H)yOTFddZA0gNl6oe+-Zj&gb)
z=<LAOLOK9$2QaQiLyA%`S><rzF~*e$U|f`F($G)XxYZ7j*7ZX%&qhSBd?g-Ec&MZW
zn2sf>Wg1PtNi%a2(m>85-QZ({;iX%~m-`%~KMu`#1FaM$j4L7Z8>GE$f9d{GxGPe?
zYCQ14eljZm<3aJt)zGu4G9c=+wS@2n(zAC!Ag~tjQwblYbOPQuQKbyUV>-K}qlAV+
zmChC!>0ZJOBbG|j2hSkEIC4DI@`4tbL?JFzD$=nOEnp}W6A5Txv#Am6(s$=XWyTC7
z<T+iMbYmy0Mp!bB8kbJaY&j7g9#v>#m(@#V&~hWlEng9(pGK2rz_Oh7f)Fasg&0`9
zL=i<0e0HsT6RD#_nhQg^(G<QU1o7E<j$u846&4Xwdf*9`EgTz4JeF%J2JpT|S9xCP
z!C44r27d9lq?FLj%xi!4xJaeQMBi2~b+(;i5U-#A+J=<W`jVF7*muL<I!jwDVP&GC
z{gwE+`wh3v52BV_z8-m86*ac&UynR4W5>dm1%md@pQjbADfaIRJT_Pyg!h9uwfJ2v
zbJY2F(}yDhay0cL>`3Y#lknaxGbFx4Gx~_cVxQ1@LZs-LipgnWPzH*K%Atku<l|6%
za-rlN`5^n@l(TaZx18KSAo?D0cEIB@zUR2gT{R#7KC~%2eqv1!mqG<`mFe0LKVd5^
zav9qaELT1-Lzt-kG&785mw}?6^<IV^XPSGLv8}K2#F59<_F9wo@r{w72WX;ukA>wR
zATE2qr+7^YY^3{K+2=SVPUYNf+X>@I^7yPN{m#ZXSGLza+)S>NQJAM7zktXzJ+2z?
zxc2UPm>?)WlJgc<S&8<tRVU{578PEG5XDr}-CxZv<RNUm>lrSe_O#$O9slzqk1OE`
zQw@KGqJqe|3QV}^M8(`adY7kT4(;cOolvJvi3H{q+9ypTrAnTDo~=3E@YT*&pz*uM
z<#eU`@Pim}O5$QuWV45YcqqSm_;zu1)|sM7ScTF-*>n92!R{uGrHO}~-1yk=r(OKr
z;>1Mys2)>B*Zpl$&ecST{sa-l8@(*r^JVPpsE*D)ujU(1-Cg$g51!?CWMqVOUs%o0
z8#R7E{`l49<VAd<6l4@V#SlsyS9V-JUoF?V<Z-{C{AAXou$P^C0q4s`PA$*8NTD{q
zug}Wy=~tK6`bC^TLn}-brMkVeAxpX1ayfmu{q!%4iYIxUSirV<=00ovk|7$p__A+D
zbVJUTVX`_A9tK%ar|SJ!3nr@^@kLIUePLoQZ6L-vmbMW0w{}zyx8cE4o{0p@DJ62Z
zNp&?$7dh`gLxrC~_d{@;yaYdJ5O?!siPKAIaF>hm_dry=x$H8(Qi;uBZ6m1n<jUl*
z2Xck<EGSgCB+8z|d=nR*gdyV}k*6<jRF;9~HEs%864h8V^ZE@!PWH^=Q9ffL2$`cR
zI8hRm&7DlBAKFaiKx)h7W<u~%k%>#l+K#noB+-xjezg5*rdcGKLD2Bo7=r@p0TL~%
zQwrmcgiu-y!(>}G3D<1MaECVAhvIz*3^XtXD~jia4w`}pX|iy0=oInnk!h!KHiBKA
zk@k3lNNI-30FNuH+dH;aoMKQ@hYqK87jeqZ!U|uh62^m?AzY3thOGyXvhTp@#YV`e
z^BVDqI{<`B+Ff!fW7hduoT@)EfOH*+KE;<W?q3TbJmd2kfwc_e9J3gp6*leT#mQG6
zQ*p*;Z=KsT!s{s}^i09?#PEAnRE;&dsqU0E3tZ1Fzde9-J*)&1QE|cM?4V&^k#}eg
z+|w`mbTUsYD|0rKc4{>fGIQ;o7t#UcGR{*lKdG68Xmhj??pxvSqHu_WebmpK*N@$f
zr6cN?2{A@yW&YmdY8+5fR{ZX9@vkUr7aV(B9HTfVE+zC#jmL{IM(Fd(>gsUbf)XH8
z^qd62vW6QokN4BswXFy8B?o5kG#ZtO&*T$o>Nt>bfgmi6>^Y26C=C@Z9&(dYZ8SmU
z%pG5vscdzz!wb*cAG==5be!e+XC9ZYbK%A-p8K{uVK-fDC}f+t&UZAsG2I^yvDL*@
zyY&g0Sh_+byAK3mn|UX1r{HqtX4H=l{qVR<r-vFvg~s?@FDpW4D2_ZX7Z+31)PgW=
zg*&5*=haD5s#2EfS9KdMcO$0PA)l+p(p|i&c+IA}(CP0ArV-DC@EH4`lx5HuS&i37
z(}`k<0&7MmyNl*yMS*UkV|}7dV<uceG4{CUUc!L7sU%5d6SHR~^HiWTuVkeO{yFsN
zxxgNxrNZQfYyH6zwd~{A@JLeY0eo_p3QmkBhIq*5oamX3CVDEi0K%ZCNU2H^An_Vr
zVJB~QOC;1X)JJACV@=>oCh0IuRcAqbu;W42J;J%+sMQqi27%f@f<U8O!?q9g&w6ZL
z1&wvC<TI}oWZp3y0Ey{Wz9ef|CKio<998zQJ?(X#Ayp)#sqk7KON!H?Jm7Kd1_%>n
z`_b_b>oNOBBRDUKERJZ5)xPrl*mE)}Ks76OC|I`t`WXzN^VAbd-i_Qe{CnNEW{pNm
z#?TzPtcFYTtPBt9k36n|8_RKoo_wTPxM5_BeI$e7X3rc8{8}u(^o;3iy(oT8`A)Ya
z)i^}Oj0EPMZdrH_n{;6CNz!DX+Ka_l{9&HavthvF$_jan`1;%~Rvg!+p^R~X`vucN
zs1wol;2Z6P^Ys|bdluz2;wBl4&$r}pZakHD0=deQj7aK8B~bTMVi(=en<VRkY!tXy
zz~gece<M`mEsDFm<9d>7d=y^lN3E)xQ+3d!h_(g6>wR`rY<6!p*A`{5drzJpU_3J}
zC0}H^Kj65raG8nGL6uB%5DgRMUAy$ou%X&f=2Bdq`2L_Q<#uOsy}AZlU2+;{^;p^0
zXF!hUx{H5}{PR99OUg;-dk?N@w7k%_UE0{7>8#1Y6qg!41CpfWYNxZ(b^`WIuL~p!
zH)W0QPRYDsjl(MYHK2m`dOgi7?=4<m>a})~36T9bd_v}#X2WSer2eO3|HC{BJmU(n
z%QrTn$GcNuw%G}{-;}l|+xVY8z(CX2UP&#(=$!l}yIJ>I+YQ-64-QuJ{ipr#Evvk4
z9L`;QYw}{i{&UOeukzZr4=T7D_FQjAi)S}{^SJz<yy|ZFy7Sq1ef1&sOUW0~r5QO8
zUPd+F!vpdR(Bec@CQ<n%Lur+Mux!T8=;cFaW}G(@f<9@vr4co22GW8}Fe7E$U>1T*
z^Mkky0@%HT)(7Zw2@FLOg!L>WZGe51o;yO~^bG1~-y&X14qw)g@(JK%j}o&8IPAzE
z*X#cJ5^GMu#2P{xkYu1XZWk!lftJOjE?4SOO!o+HYSPyQ$oe%E31uRp!@<qwC!#T^
zd<EVs7TYQM)VGJ1rv_jwXi@v7IzTed%w#eo!fi8W-oV)C2G(YWi`BC7w6Zdnq0bt@
zWFzHwz$e-7g%H-iWuNU97S&{bgSVQ~B|QSBRB7SgZ59WDa#f<~Z$OfL6u6#(DgCTC
z>re72M4dhR(8W(12rR-Dg>xFD)349+S8K}Qq~4IWDnKQ<A?EV<EN|+-uEVVpxaVqn
ztX$7#F`ZXnIXo#gK}9+>d1K7#Cd<j|Dul$bozAE%20_G$o9Q=8n@A&vuKBPzNw?I&
zvGN;t!=(GVPgto>chERxG}HPtdo4pb?V9iu6c}|bIE|3frxCGJS>4RUNc%DG+N%jN
zWeEnrg>BjDry$}F@I^Q9h&CU&j({a5&Z~5tKX1~-oZBv4Id^Tjn`(qn#zak{uUpNm
zJ59csi{1R>I_-f$i@+4+LF;*~jVm9oOfuy~Az*<B=_aLjZ8DGAVNPr=DQuF9(QO04
zXOpteTM;XF1<OI$qsetV?OM3jnh}CVicHOlbnFW8@rw28OQmSyH^H(8v0_Dm?mY@Z
z8J%1o+2~7~_?MxpIJxeLeJhs;RRe5}@TPY*az$FxPoVU6;8b|-Sp=uEL14QbwprRO
zSI#F_%qQ|xPm7&ZoPB)mnQK?hGC}A@n!KK6JB30`AHitIv-@URm<-x!4~FI2+9U<h
zr-~FG!_lWpZOm>qvsx%Dtpy_~u9&G&I9UXUNiX5yExCDji63Uk76p0;FA=@Nv%9(I
z17KVaZ0#Q{Iq;BBhDMz^*+iS6p!Zad7^xuDdR~aj#&<vP428V$&?Cg{X39%hE+g~e
zPjj8pu3W#A9Uq$Q%@^g&XM3@r`{E88eC;*wK%)V=KZfw?2Xe5UZO9oC4ky$yYtK~>
zsg6%yn{cQGF0K}1D~KK*E!P3Y@6D3}H*slz+4yvzGCI47Kx%&v(=)qAIaulkLds4c
z`MGNv(HnL#eQgnOdQuwsw@mEsE)LywSh<xOa(1ARX}4Lmi_?D)$!IqqIi=9P2Hx#y
zxsVAVEouoZAeGgSCk8c9A)>-KZA3ftd)APMi8gJ#966BuOsgXC0VO49L2R7+0iCAy
z8?A>=n;zm7xL9!Kdf4ac*|%nZeE1YU@TYJ*nGp5^6OC!yZVP_A56wH@PkjrD3b$lB
z%jHe+SR&oVB$|W%OuLC}wpYFS9Z0Ulo1DiAxmO@pZOm*fpP~cX+BkxhnN*lvsRHL1
z9*^nd+O(Zt@{2wz-%O3S5~R0W*Yw!WHY6Ij#cp|W7-;J5V+jfKf+Xy+Kj$E|JeP`C
z#Pn2;K&AbvMKe=n0^|lH@Rlw@m8)Stu;D4u4nshmogztN@TrfsVwQs!`ns6}hf=Du
zRvOQf6t&2C6p2;Z*U>50R;Oxwy(-GiOcWYOb8yk6R^gVn{mD3rz^0;GZNcb$Xw`@O
zuBS!aG;|askN0;KErRiVDvLPtG&}LuB}vvbn%^-AFFTE_q%Y>nUCTSgZXWEitoy*u
zo20-9cQv*zFRtD$eioKcu);6R9kY-3bxr$gC>l|Vrj|xyx6Wtl^3Xpso_J#rPBGxY
zFc7sD7!+Li9H%hvQ2=dmk=z<2#A9x_xlr$XF_-*M_)u^Fg^MZ;R`LE`3)8`>qlIqE
zvmst|p`4q5lV5Rj7hcQkn9ekWyppojOyId-)BVZ>_t+JP?p@i^MoE^Y<x6=R&F4G!
z75mN?-`i8X|9s6Q@m+p%ThDYO>}f&%ghn5yK;)g_4`2B*dm*jV@p9R{1_7N+RHK^d
z0z?CiZ8uy=kj)`xacAgU`U>nlVmtpo_U<w&%CG$!{>(7I(8Ewe4~R&&w4{`@A_5jI
zEiEcBLwAFOAf?hN(nyK4Ln+-7g0u<<&NE>A{N;81ujjhgeLw5D-=6DS=bLlwW39dS
zaeO~DPi%J&&v;Go*y$}dvlqVLv1^s#p;ohN(q9vtYn85VrLPB~7V+4tyGizNh{So?
zynzj&#netQGE~L07u8Fti(;wXb9-8E;}#T5g)g)#FVs><cT(7?;#?VMCpmoJL|L5r
zgcI6Xyqv{tHxaS2xXBA3w;RGZ?xlq0?kW;J9E2N#$i}%FhfoYdoP@5S>*c3qlHN;J
zKZs54-%KyQ2rC+a<8Rw+fR3(6%YoupipCgX#!3b4L?+0?N=30w*OXDTE_rMb4r{;`
zeyW`v*cMh9IsZgp=;FrC4g0$p#Y-1%EgmSY&W*0NJ1i@dxj$4CgW$7U`HF_)6Crdk
zF!^_}v7DK)T*>RqD&5dQxtU;o5+ngv&IWfq9^q^A!}hp?C#51rRB>JMdjiGw#tOs}
zNVdBIk74q5=gRnfsG$Cr_e$j+!gvW0JG=zKf~gk{61&Ll(b62kFZ6IkEk01y<R#||
z5XvbKwY5q^<%u$4WqUA+dYyQDw;2k)Chm@Gla6eGP_LjgnRf9T+7XekC{npc8$u&4
zd-rCzS9h9CCQ0?sB*q$CVO!+c0?_zPM_T9Y<}%jSKqy6-EPN~Bd^t?GjN*#W2Zc`d
zJ3_b*TxCVdh+Yj!562nY-8_Gl=#xl+16z<2hqXtWT+Iqj?B(m$Eco`2kM_H*Dn{x`
zV}X6pf_EN?j#g)G7t%T`6LDx$+v|KJH=B|)u;F5U#^UB`*Cs^LQ_gqhrhHT%7k;1M
zt2eHs6|OhvNvwnk9V^6ayDmhj=-CUCL-F}<4c9qSNxT7yq|Rxs#>VS}B(w>xCo%1K
z0!j9S<B=4%_gW5zFlMHAn6GGmaD;z+he*D-(`{8pYR~i0avJ)yqrD=KNk&y9-k?wD
z?6Ik3_f*tj>A6Ge^~1h)J=SFh{3=H>G4#hzb{PUrXR4g}tAg(?Ig8%%bkiMJ%iamF
z7(j@*+^TZFT}7{H^Z1RtMmlMFKT>OZAz(@i0}{JaB6h#(v)JcCYE{J*8^zQQOZVHC
zJYy^GYX=RjSNUK*I|;Z-lLw{N4n7UE>E&>^=Taq-;cKvc$GTRlLX`!1r8;07?-+{G
zNnr0F9wg;u<ll2=K9jcfnZ=c}V9NKM9EffAbHEGnJHpRIJMIvpo2bh8_iCM6pSd}|
zc)s7p4xI>#+Q7hls9S}usdZfN<DXGXIPiT3SzvnR=Tz!(mQrzb;hj)VYfP*7158!p
zg5aGB?p7^SAA;)HvY)d;3-;nx61%fv$dM6Y4HIq-za#!^uLZ6l&lS)G_bg`UX@xVi
zOcq|Ty;GCPeBk&6L|G3iT+c{uZ5JAG(C!qV<G5?EMMux$$C|Q8%0QZaTO2MABKH6_
zHNR&Ozy|4tgq@Nss5-#+aj^M-%*L<D({ReX&<YPeO|hpSz1Bp<Yv|#6&yHg$AwJd#
zfQr|9#q9xNFRU$)m3sCni-AW0oUoq#1qZPv58kicW5b8>C`zMiD+uq)j<IuAdhA*$
zMt3(031I3fRHW)(eStT&d>BIE?<=0$8xY!U<+Vb|kBO(-wy=0MOJ9?+%cW+Yi4(B`
za)q}@m+rX*Z`W4chj!JyyeZB0oCdLLvFcCAmb)iu1wz!1i7n%BF|@RY#ZkP*V;As^
z3yX6u4vBdX%HHNjG41<sU8)`HalOdm?`h#R1~s>~*WFQh&3ta)RyMyl`KeO<0oijy
zXWXq-&JAB_7`}P#%`L3Qb?)t*hPOWFMuHkfqRx$e!4uAZHTs}otfb*}*{Whew!4)g
z<Iw5xw+)jOSI;tlCKPr1ryHg*4SrN}kF0SJ3@vqbTg5htQWGt_3<`{te#Fzh49FOf
zA$i4iOevSvS2zDd1sl;BADQK#=$TiWaDW2m^&Ys$Lxvtu9(l9GlZ(V)NxF#^X%An9
zH3ixBM%#5?(Ihy#hW9f5i_Ngcsn&Mxy{EQ~zOo0<Q>9;%XZ%D&_9%mKrWY=<M3U0z
z%Cd1dEEKkWB9q+<!VHGXq!69q+O%Lx9%L&0$}+^rg$()pqEl=SZX8R>CLY5dhJ(=g
zv_n<7hvP4c!Xcm*@qn5r1Q5}Ry6!<u&xcTO>Ob=!H&c$FmvG<RbIN+I_!4|@z*;n2
z@0QbUg#!jBsK$bH%eJaWVO&1bq?1|J6i?6S@sc%z?^2pcIjOSP_~jJMmP_g+V?8b^
zjIDmr)f)GY2UK<jWoDg;4f&et#1ea(cgM;U)yr%&tUO1v)fSsl#9Y=HD9oZ78^q0Q
zG6f$;YE@|H^0u7OA7ip6*(zGCf@3|dREayE4ryJj`m<lYzt2-TZ5^IBDpN2Yw=4J5
z4l$d0dCj>__rUUPI=))ub2pF@lhON?H<`EY=XxJLvF_>geht4Hx<oe3D~I%4*>Qth
zZa}>TW*)GAcvBElcH(h)d+zV7yv2+qc2Keh?N+{h1*W)Z*}s&?xwwT-p}Yvxk@G^Z
zfQtFw8wL?*B51RjSf2q{Wwj4>tZ3`tCT6rZ+nW}ka*)HhgsVCSc-4;&37p6<GY%*)
zMD&xfnfMpaL-Gzp07GmCYlJI=*{SV*R0yZ#U5!VaEsAr=-YK2~%w8g+*=et&<rOHj
z9iaG-n`k7MLPKT&!mKfpdn@^zgLzBbxpwF)8dgC6qL7bgo>`vgbht~Rq6g2DNSnxO
z@%_q-UX%l>`0p<bAm;nQ1nhzLEeN&S#Wx2uf_A{sgQUp{6ncd?S&R~)Tjw>S-bjGs
zXy55*U(mJ;!DqfX0?<L^C8kuqu~<mLrBFQ#u`9oj=0!bb^*BvG+q;k3D*bA4wrFG5
zZZdwz)r0-0z$+K8E{!{Wsljdi>R_V4FtrIZO_xkWx%EbPkI&OfJlT9Xh;h?P37WYV
zXmr8A=hKI`YMM3{iQ~bi)05^x{p?nwecx>5sD!CpT_R$SPRdfz4z^l)60O4Ikj@zm
zP@wlBWnq;ST5Y%z=PA}j5yHO^t^80j+R;}+>!aU7xka$C!kKihMkNZ(#Dt#t{Gvv>
z)k6OFXPBJw4OPU~o*A-RuH|qlS4+M$w5;|>j9F~G+h$nz>TXWI^4X$|uv<*SBbz!1
z&pmzKPWu<{sOor*R)Pj153Fx7KIbdo+2%>GS!#`6>_79^t?h0=MA8@aBBusTS;mh;
z*k42;;aZ3j=OHa&9(6AMyhYUeoGo+0F<NUCy0M^cEz&WTyr+zmG<TIgVoDLors4J<
zZ1G{d?dX=c#mZ@{$K_{ti>&R_plKqfLk(_(MX2CS2K%;Ve~9)CTE&z#qZU%{{Z|H-
zScS)Afe3&5hJHRvWc?^U^HTE!fObR<Uk1%H)Y`_qrUV|_SERS&z~g#`KI3VnK>DVf
z22U}F5gRc}9W4jq5&%MI<)MLs@w3F%28zCHWK?3Yfw*KSGChq<IBqQYsu1-vi)bhp
zd`AWC&@6RRdY%^aY?d<5K#BWCjFI?IX8bcGfykjcgPm#*Z@ysN=}0JVQd26e->0@0
z4W?HN;^!Gw3{<3Q@tMsBl?C6R2p=+JDR~l3F-d2VSnnyAR2ds$%4=OZ&MU7=h06s{
zZWySk-+;v>4_#QHyhW~M1B=h3e8-_?c;QkyEFn+t9hc$giN{qI|BlDnQ2pu@>_N@Y
zJHET4wCx{ZNzIgt0u&c(!iUsJL*;`7%d!j5j(v!|WqQFpLrq&PJEkD3zBiu0;B#zj
zsl6*IXB&ZZF^E{iM`Ro6`W?+XjTGtO1MM^pf|^d0X0$1rYFHmLRF|?<YEJGYTbT=y
zMh3{jcc0znU|*YfpyIZS$ZI*##gNV+GwM0?@EM7g>YIF8%=;;QENFt>SOL@2tz(bt
zeY*P)D(zf9{?kygK(`1WEGV~Cy71{GRY)L7iO0)}l$cOD_jh`v{1Gd>W6s>D9!1i#
zglVEk9el;iol~pTFIf?SQr11$?0WNO0F`LQn+uU#jdIrNqhtD2&h1iZut=FkJz{G)
zQzmh$W%yV#Sk4oN>Sog`zre9aSzH<=s0dq@pi`s@gbTEr&TE$(HVI>f2-ybEz8xu)
zPx!-4$=vn=)jlCZB=_d1Zz9{60D=saPj-urJ+89Yx2G(v`8ioG^(?-P<mAa_ZcJ){
zu`~z5nB1#`8F5T+hovc+Ycs#=jy<D*4}Na2%+aj)(nYY@D9_rAti-rYOUao?832L0
zCH2@^kKg#*_~6uzv7fd=s8lE`%I*?cLFyTR3Nt%p&h*k)v7NMz^w37}1z~E*+~(G`
z4xvoOo!l5v>=ITsr=idkvC^yf96^`xhB=sPh(@QMHNK3dkyC#wlt$q#XZ)wqkx?9q
z5d^;G$G6&-;C77f<>ppECfa*RP7%ohlQeHHbZAsNHWa>v5nhG2(rFDQK10>rlFK3m
zDf{y4YzfyeE=yILY$bKp&)v<S=DL0=SlppmG(NtFNoO=0TQQ>D(1y}>?mL(Id7}G8
z!+NV!O)K8?3r1PBQe49`U>Pm-qk3;fOHb!0=&e|h*P}{wF8FdX*5ev=-sQ;PQ&&B6
zS@Pojzx24KF?4U+c9l6qQABnNbR*5wpA?tnqfmAr;)^=Z%RiKcqA2f=^d~+qii*MG
zbTpwFvGSuVHpahD=nHey5oI})C*V_UCViIlsdlu;#)IuDp?y<e<$e>9PsjY*uLAAQ
z3CKx2{8*+xQ13NedKhd`(n5N1#!qg~5tkF$O#XRFwB$hpf$vR*`SP>Xlmk$b$os9#
z1UH{kD$J7EIc5@1A@8&aPdPt$6-V7Q<&T~2CX0%CI1kE{;0I-{#d3ogW;*cYePvt&
zGjJHbK!c?t$s_KAk60HV2SZ`S<as+doZ3Mu^64^e&KyUqMxXHqn!TarG~gBaGeOeP
zAUB`tqjwmmM@7<Ynqi{Xn&I!-Ys%%li8<M_C>X?^E5sh{l<hRIct$HsHOu2#>?n+8
zSq67FrGE~$lbT`P`qDxG+K+K*-ll2}pzJ8xL({kI;_4oDd_YD<?JACbu2xxicjL=Q
zmmhQlphyRXg*Uh~k4))^^LF$`>!@ZD;~3&@Gr|aE4kZ`u#oN#AL4(5zTgW3Fs~OA5
zw!76?c9=#z<q<x(D$u!!ivp5L$~O;Qo?-h4)|F;pAcwqq09=g>^ODKGeIHXr#iTF)
zZmel!890>~vC}k52m;cVN3e9rk2c98p7)L(vcN@6sMyfV>nQ5*S-2>WJ{(0o1EgP!
zqQ>l@sE3L^3+UiTpmF4*8LU|7pr+$%_QyPzPXvw_ihA7y;a-YQW;z}Yq!wj?<FPVF
zW>Va<M}VSXk|ucgb0Fc;9S`WX_-zD&j1)Y_#K6B1>qy{)B65O)kAO^$CKL)R(_^oh
z=Wf51WZ9j&jiA)Voo$}ggF?J?5PLupYZQaGBO%5SQOZK80Aw&F!yUF~#%AGy94WHU
z%*!TJqO<VQW-<&Jg;OWxb4|jmOp<CjoXZZQYsRaGz-^GpF1m<<+H|f*XY_d_RJm^o
zZL*->yen$5V5v>WcZ&LfJ+*EB=R$4B<0d@ot(htN(I(^7Xx-8HeuTKwD278G!J$pa
zy3WMlFxrM@zPGgn_N7lCA;MK4szDPeIxMjE!4vGMW}3GW?eRthK1$!7fUh4dV2LfA
z4c16nW{1`7=CQ;N@SaUTNZIF4TAx^>nBqz3r=yq#UegGZvs!dgsPygU7*pYbn5<AR
z9tQ;I_M!n9j08l@)W@tmKx(%>Rtns%Mly#Bk}IQkXHc-OqztZQ%+irWdfQ`07e{Zv
znCelm%`$|I4&s_K*qRU8fm+NV=S;XrnB&AT-%D?*MVQk^x+lkkAR|6xSzMc8%0iK8
z08hI(pWc_>3nr)UlAG;_8izEK_C*jb02zvfxYY(YgoQ}-<(V+V#S1e|Tc4U|je!h9
z&Uo*lnYNtvwaPgk3@}IXlkmjs!}>_GfHd<1%zeG&9ho#_&NLJk2}OZSl-hJof+Y1U
zRQ3X_m*Ns~$tOLdCKiA+3@EZS1eAkiV|jM{8Of3sjAa3}@m!ObQ5ZKNf+1X&?9yvW
z9%r0W+TwZT;$|f*!P}cTa%98Xr*Fl6F1&Qg#er(3NvgqQTyJw?+krVgnnL#?VJ?!)
zN`56JPF$sg1kAeG(og9`N(>rc?y8{Z8x&6!5EUF`J{*9P>JsXssM~r+i7QApbobG{
z%+DyKXr6(-2!e3uCVZQPuW#^3R4_{qj*JM*Vsr3yFP+7x@5X<18Z8FUvkkJS6ce{a
zKtW_n9{emYhmW368fH>r_aXXlC(>zti7Wl=F0Lwfhg7oT5KmnY43UJP@t>21)IMsB
zvTs9<GVx+!i0)|-f_<rnVn+{As$oO)iBUVIkuoeL#2qLGJZ(gYrh39N#JuJNtCn0@
zCT-ZW1<H6*d|$y#>}Scu30lPRTtJTjG&Ay}fetznL&9aG+a0{KdO8!TL+80K$LqL`
z#+EC6)>`yvCLPlqwW4HM(1jnZv*`-Zd2ADUi){G1O5Ew!I|5$5?1uOx&$PQq8y8P~
z<uZa;YqA4KBiDE32xuT5$&dv!+%Oq0)E%XB<i)T!sy`K?6WXRSbJLHQ9Sba8>eC~9
zUW(|5H%R!f=`qY)$SYnTD5rK?J_5ze5cMIF1wNvsO*^y@&x;7EG&pLWxlu8`K0DC{
z)oqSqUaOSJ8)QFsiDCGx#6FTaBjF-1m8l@XrAa}!=*Q16AdS8Wi_%AgYZ=oHkb$a%
z<iO;L;V|>HVRm`_+4G6!HJXHv<=`%r@axYJB}mxNMINu$mQJEq=6OfEGMM#+D8D)}
zdqxo{pcaw(7W+txo!N<MBt^~eRjG}!K>g8AndZ1zOKTYv43QIHSNfRS?2qL@OCPa~
zLi7^aw{GhbwrwvC$niej+C$raag7{JjL^lrtd!~ez(ccba*EpV0|%u(%8}>}#hXY5
zgSgS~S%4ynnvjNzf|a@?V{HJ&P{n8ac9=O)Th;otGZm?e^&5~0HA`F31>w);jFCjF
zZz=V}oC!?FYpM6YMl(a2w;(71vA1Kz2=e+3m;DS%r7c3on5%c=5H_FP34~o5<R|Rj
zSg7!mi##|`sJyUrnPnV7`KH9JgxA?g-i=Y7><VxSCQr5@ug=LbDy~OE@qEvBmV#4$
zD__KMNi4n#0ks0sNScTepkP@*27MN)!NE<gIi{{iYzyS6k$429I1Ai^8Ja{SMeR$w
z$HJ7v;+Vj)2lV6i^*yzPSVqMWinC%oSU8Bz9xl@aY;<Uims1$eI*FN#?;+@@w+Xo%
zCm|vvu@OXX_yg`&N9reCBIBc!s|*|`p;<Hj43UR=C50?Og8lZ!d`%n@c=uCALQD2+
z^y96olERV`Dd}BCb2I$PlES;;whGO&27TdglOl@nm=dcae)YI^45G$EnGdQ@ZELdt
zk`bRWDJc}9Kf_}vMiF@KqYJ#Jq)BDTLFN*%M3t1p{;>$l+el3<9;(r}Ef3>yB((yH
zs2KTy4-`vf8cSfxCWfLJLlTN65!pr}ax?a1Xdf(j7>AKvP2+XSYa#`2!S|3v3?|Fy
z%-MmA3s;_zU@V0YQJKWWNT?^2i2+C)85OG@yD*hRvtYu!J+OGu;Zr_8N#C$#b|x|1
zI^0_#3D-A1O7y|}UGF=0SI`Miz8YeW*JAs|`y3|BO*2@}W1%U7xK@uaGLyMBf;tz;
znb$-uD;zgiLb7I`;6+AnSrSM^#wg8464|`bgoHVgJ-WLAWdzc^yOMsX_Wa5yRfNP8
zREse8GN>QLyf!rI&rj*EJ!x9JqN?rLjL0n7fL4q$Zv$x{&9jl2S<SaU?dcO5H#6If
zG9PLY%ReVErei9-yFX;`xQ>q1aBO2&Xo^sfa=~O@u8&@IGjDobI6#~Dt|YuOg*iv!
zT7|>}rnGNf(j-A;BMTE*lxdWI<bdZzai2(+$ubs3xOKZBrEK28cqcZ#q-kV^nr9Xn
zZQ{NgzE9W%prO2tSCjFu$o|0i&2)|+c`<SiAxUJCNDW(ulw{1e6_w~pQDZg<7c@(8
zearWo%8&RcJy1l{b!9>H^YG;HHN><l**;Gc^)m0C`xV>*5=*iaZpLDgYf%i8B}?VW
z%#!lFL01row}Ht<v&De%dsLIo;|t!R8+)il<4@5cR~s?fiR4K^pV5f*FO4<Dh&lQf
zK2R3XYUacHjsJ&wT!Yto-#+XepXi-t=)2O%xOfe*IMH|1+_%E;ddKtiM*Zs*>DQB)
zeMi!0%r!L0<gv{~+JGiv>}PD~-#>hff7Hj4_L?fKe}7_t`})ACG_-8mpnO`NVA=q%
zVestHkmB{%mnMgluA|kwuuj*oMZ@qF#$ly~A>2tu$_83z#(w6sVYjqluXAs1di7(E
z6Jw6vVC=o#sHcq_N%x&T4SsT+{LlpN$vLoP6Eh`nToHk_xyBzfG52JQV{NY5N#a8j
zg4%P87c<8Tj>eu|AFp8?e{pW2Ic=<naeS#^`~&0o%e0BI$%+2!lcST9WsFmwy~e*V
zPCvaqL4ITUo!9JY!>l4;21|04otu2iI6i(fc}iydjQ7~l<Sf0+?CJC=mBu;#8#BV*
zV`5V?vNBVOGVdC^-ff+myd{IRxn?dmj_)_T+c-D#^w{Q_k?<b7`*q&u#)5YGBJGW3
z!LQ3^OmnxGmc71CJ7H<u#wGjo6<hC_3h!mbjOC|H;|WZ2FTSp2UmsJH!`qc(43)!M
zY=mI2IM<^0Iu_^Jyn%<cxpt8oSet8)X}tltkv6-&#kBq|ef>lF#z&@&Fa+rk5Z^Ha
za%^*DKtxY$E>WKyC6;x0pKW^JZrHKSwJRt~sx?h3!@Mhab4Ox&NBickw$C;<W?Ptf
zSBm+QqR+0_i(PHmk5_Io8ZqzQoZh?j0^&LS$?pX6vUu^?mU;K~qut@=UHKP#W|+O}
zn9p|}?WbW5GG#wIArIuI4^WuhPM@8+n|qa5(W`kc#%JfP&*$;!9XHvdRAvlNA-<Ls
z9M-1$HrF`jS|6q8MH-b%VO`Q;6V6~I#+SYzDyBBn{On6#y08xMWVK05XPnZIg%PJ>
zqHxlUp%v7M2DQey_w`M#HJ9FXCGso!ZwCFf$91jl-q8<_tH?$#?XNs8&o2i*J+406
z-NLz-;q+48-#sp22lmy{#omWfKRvDjbvubltjBe=&YMKa-K^({?Rca8pj9xHWzWi4
z0zrS_szrsNYXvHwL&Y0`J57Q*c<U=e1v^T-Qgxp`Ow`@SkWSq+T3zVIXgVm9ML{`t
z@M4%$#GU5t=AX*KS~O;sAVkR+GKAZWT=E+zJf>h{UqU*J_zfhfOozU6P3|dmZ%U>z
zUt-R@Du1lZ1#2UeKFsR7-%N5Rj`&{Er3ojSmnvBj;z=`CL$RWjIt?F>e3oRu%#1J1
zXl`q-rey~pjpo8$upblOOtfK)5C`fd40<Ev-3=m#PKyUOya_DzNi5YY-8x@psz6z!
z_0FrF$um=i$a~E85E@V_JPO&8*inZVv?Z&BeGEWn)3C4&E<IYy^YaVko-x)s#lq09
z1W~{6J|GjlBEgxiZ<=qNoE2HCPp<ACVw0a=+{I;Q7E4%Q)k$0FOVfBPb8#mD&Scu0
zzSIFrOoTjg+{(0mm|@$To0$26A@w1R*TI9HXeBfzm(+WLqYM<rZfC?3!UxWbgo&i=
zSQWlk2)<sh-bi%2ep~->VA$$ZouPBN$kRv(VV<X!B@;7y_AJ~yoq586_e=t5BRIZf
zmAo&!)z?BIb}`fE#i6NIa3et~N#N0wRDtY;8{MY0d&PFw>vkH6U3!Fqmb7|Br+b|H
z0@OMZg;_Q^6d{Xk5~Un0%O<Ys1h-%c4E(qkrpxzNSk~k<q>3^nv@Hj6B|cG^f@)$}
ziPl5dmlkoUS>&F&j6bQ7cA0Q~tyyK-%OT|FaBpKWcHDa-;aZe!vWYK&67+)W3mchH
zUdQ_>+0P$O$T2+B<x3J2SWxEFeU>6#Jy1f!-hnx$xpE`eTqC=KaB3!aOnhNNo11q&
zJZipvXT5f#PwG<W8Y4)f<%P}tEe}nmE24)j7JW_k&Q2%p*vh|7+;yRv!&Stmf9++`
zH_?B8Z!U`8MYy)p5i4^QzV`ky51sZpY+n+(2VsY>`F!=fyeF~$6+<S+PrwaU(0TNQ
zv|46w<u*#PJCOUDARFF=QoehqbO8Lp&BT_skO^`b_|r5X!s{VQ$26CLe+y;4V*t;w
z#|2SziQn`WEX*Xi4QZvFa}1KM&m_GMX+spF{S^vXu7)PHFhAdv?Mu3RI=mcw$I3BO
zuW-)H|1=Jc_a;&S{)(a@IvGH+<S6?EV+sd~D08Ir%UkngJN0$6p_Z{U7YB%8-lLjI
zk1*UWK3jL$>J@%vSy%^TEUz%Q<2;u$H_k-XsYh0nB*{ysg}%{T{OKj<7BX{A3+8pI
zIuA&u*PFAm(AMkfKaI~|z(RD^{1?*~;yUCWvvs$2Y1G0JF`cKs5YmE(_?(m4c-SxY
z(13U)2mC5MErclDUyTXy#&$8N2$SJzzSj`;7_MIw-WN}^x9s<t>ai4m{kHc){Y7yJ
z!_$)ESF{}Glpn5Kdn!DZ*L#OafLhr)P!L0)!?jrC*L{s$Xy^(jZAY9)dFe1kfSeAP
z$(4cN`mz<BO=OVrE|Q|iN(7_mryJp2n%!KHYo&0ZDT1jKb|=FM0y0bue4>~GQ?gQ%
zC8Ud2a1G;e<J8bRbt&cEW{5B(S2yZ{%oT7+hQ@Vfp*OUkht5wpI?o64kq}<aa|p~Y
zE9JWMD4)K_Ca~ZJFNZ+{>zmf-kNMs8t^0w(DU~T_3vyz(FHO>^Rfo10Uj-MiMiY)S
z4e;I`w#z@2Y8aV{&J%7;W<MbQqVC47pLuUs!|c@P#SWuO<)KAuCVceuJqpxiX%>a*
z0tKVJgz|W<B6%iqUq<?!6U(2t6<U#uYrI+HDng<@*gsIyYbLx?z3m*Ndy#0Aw`ril
z*V+nlZA&kK^-9fY3kTzeM3~7m)+(=|$3-Tk^phW)@6-eVOWa?kc4johSKSvZaXmXe
z`O^EX&ZyUh)vL^@N7U^NDN4$+Aw)BP?DuzGP;F3~m1((j_%^uphd8X&T?f-EH4{Gx
z^NRqPEL<?KB4X+ZP>h}(a!6`n(&rB*>CvqZEN!6{bqZ#Ynj;l^`;vqGX{eIH9Ddm6
zgci!uC?8M6*@xBbmc0wJl=qn2*jhQRBFfK4TpM8HmjG+J3rS>#o4?pJ@4Ebao4<@f
zy}>TI^G4vU(~?%Ow^NTpE|A(Mrx99m#_ji}Dpe>LPEd>TOFW<RGL1qJFU#4Uxo!7&
z=fc|+mIjf2j_aFQnUhcZ>M>mR^dr0lV@@$jul8B=v*hk(j|Z)sUkVsZ|0?n&W2~xP
z{6W_|$6Bglk#$Y<SpSn7%=zQC9Qt*Vm0x-DGki$w-a>2NK=hWV2l{c();(5G=0udq
z^ZJ{eNp0w1pDAXxw=?Ii;~jSYRPpw~2kY_2<8MVpgeJxUT(QksPNSCGj~LhOD*`5_
z-MMOqdmXB)>(F@XZlxF!$1aAdDTp+)_AX<bWyj1U_|~K5@wCl=ozxjJm1-W!zRf^C
z0S|niZgoCBr-)Ws|2u)*Sru1}LsiP>9rnfB&wRBjX@NaG<73lh8(xQ8^;|Ngt?o#p
zv!;!POVqB+z3!yl%`C9M=!2yt2X1n@((*SfYl#UDC8VcXUSS-I(NnRYdXkzdc9^0Y
zbZRi7(T$&VZ1r5X8>CHZ;o*+wy6daZ*J(G@Kc=-2-K)M;!K=AhKYu0D>$Bm7K?lnQ
zim8nt6=^ip>pSg_-fk@wpO^SljBn^jyC_Q|y?B~zuW7n@JL#=-oWzEC&0DXJg?G9p
ztGv}FMGi=FgU-20og*ESx{+1&$m>G^(|zToub-QOY~mF8w`b;We6Cx{-Lk%JJ6z>`
zP~_t^mKx$YQy~1sW7>P?%lo4ZADy&$N?DcG+g}wQU`7X?Hhx)hINI&@`MO*3;%FlZ
z!}}a_bcpY9xI=~nav*V3F-Y7bqc3lL2so@Tw~!>uNHPeD+`tWzi=<jMBj!NS=A!63
zP>j_YSelzf{2F{2b=u1JOt9}BzAtNsud0$SC&W*X!%uk6o_oYsY)_kC6&wEKcW&8F
z!@^IT!#^y?Pu9v`CD>mO?yuP4e_7984HBTs5kOk)uW1zk-}S$g8*sHFVC71{6-eOM
zxPa@bffiPQTr`2!sv2e<f%eN-gUdxFGtebi)eaJLCphTtviwceATJIv_uL>9N3cUj
zkhfK^08X%9Zg7}*K!8VZ6ofydBREbq<lJ&_bZ|%kYe+&zNScT5gQSp52z%;s$YZNe
za!6=aZs=8o(5HJCqz3{BE5&0nCn!t8h4=$uI>7N685#tTW+pU|Bd9<%TyQY7*$Qch
z9YZw+Gd;rt0Ra3+IUFp`g~b10Mld7}=&1I~GYFrCFum%Cz{w5oSq>lKh`>J|0RV)r
z34^dM&pe0U6eRLvHRBvd6u=;|H(1UV894}v>MfNSFOA&7GF7TkpK_y%VIX{3zb_t<
z{gCKk@v!+#eB702h(tJ1XUt9CC|W}w=x7usH*y#PfR)P7l!gyOVjoq<FcQQOZO8C(
z`mo-W`^ph>njq>0ns~J%R%8W5KpUq>ODjweKX)r`-7jusS!NXyp*#}>21Kchq7>BP
zuXJMI%4!L958^*m!~^aEhpGWE0DzzgAX}3_Yn5QonP`!jV4duKy;J6<VJx!_a9A}$
z#xW6(-~qHc(Vig5cq`Fs#nrh+#&t9vunF|gi7qdF;2#poPn#4sO6NzA%z7(n9+~t(
zF@jkxx_b{WznSzvEg)7c`KdK+qFM_0L2_!ROqv8Kvj70(7?xd=g1h%1H!t;4W=hq*
z-8%yyKjLAFVT?E@uvP8hJRo(v>EWtbY9lAIrY3c8<sJz^8rUF`yC(KSaNJl;I0r%M
z`p(0*$vy*WX-mnJ4QlC8Pr`9#(l<B(6Cn>aR??{iNbv!HQ;u?EGwG|e$i<NKr94df
zSGA0INCr?c4aX>hNHQ2dG@~{zgP1GRV>yHDUJAKnChb@tl}%<`NG2U&*7c4|M#3a!
zx~wx?0jDlx*;!|Cyw6g}&Eme7z<ZE&w#!eDD_c=5TeK_tf>nwHVUBKD_PGl=?7`Xc
zT``JAIqJ12mCzi*yc`X#$KLzd+BT0>$sb?Je_U<&_{u?!VeMlRLZsIF$1fpIOhcc1
zRC!`i8+t3{$!!~N+pZ^B%TF9_o<^Q|>XH)TcJHazd)K@9Poq1YdSA#T!OunA3-&Y0
z4ZC0$6q@Uun;XuR7r2-kbs;E5GB4T2BEcrlCO9vJFdwfyFO4qn5ncY%e8cPu`B$tk
z`MK}&aUbUwjQO{I%C96ueq}EZ;^KK{S<o=%dFZNIb0Mn*bf?j#(0WPV=X4=kzTS2B
z!q>I;OBM*bFJ!f!#zBV`d5k?Cl1yuvD;y;(Cc(beUIes}5t8$q%`d+3>E^q!OodNH
zt6U|n?PlvnMasH`JNYFYxM~;8OBnAJPgIrQgvlLJg0KaO?Lg|bN-0UIk;mC0g1RiC
zReMs~vQw2><lJT4p&CT53TO&Sx`ImSxwF?xOPfz%u7B-uaX(X3f2L&nOojg0Eq8o&
z<zlwFtn~~$9I*5y^~%e(n93_*m4*eCSGy~(uU6h9dTzq~+)Vwsh3)fOVb84#p4+BY
z3TNPbeg91VJ!vttQr)=fPFU5k$92C-ITPwbRE;81@>H)5u&utoT7@d8_K~U%TCI)>
zs|u;BjvKFzwyp8!u8FIwPPku_W?Pk9P~-bWI9<KgLrT(wq83@lRHs{;bH7$Ty4I(z
zmfNw$CIc^2pxmjTPQ!$<Oq8Z4F@?pIaXcSRcwWA3HL*piUWt?W!`UpIRBMlByXFHp
zn%ia`PpPh;!6ZiP?R}a-`g*U-taf!8hOxRY^BI$?b&kNsc$0?JI_eMHv>Ra!vK0-V
zSE+WtG>p>M^W32^*Tc{*NYOClH{N4;5t;eoqk2PJOp}vS(+;=!RCnWH*bAycDiR(V
zGHKe5g%_^!$~E2fjMr!Y#LfM6SVp@Aw$?;xM+?WIG;59IYjt#X&1W^J`0DKhuF*0a
zzW8u~Ryv%9nW2^4&P4KBgV41$j(R$A4Ho5|Ce=e~5xdq)3{)D0)E5t1m04OGSlaS{
zZKu{+wKdwf3)>V6TXq)P5@uTrc-pyo+VzNEX*9Rpu5UJyrnz27caw+4qp)2^y4hml
zm05T@vWJdD;}z#M!ytxNVQXZz58H3py>e`Rb(f*jNw5>;*{-S4k<@c7bfVqyU1v<@
zi%hJ?W!Dj<(W$b7p?>hN>*|^c;vrpReJAhQtCaet(yhiEo-U!n?#CK0v%|XzGGCSO
z(6<&+7cz8LPIQL@dnyj;&;|5W;oS<<y^VIg7h}4cd+2V4_l#fbe8tdS+}|^Bt)srM
z_nl{7KCpMev-d+dCHi4si`}cq3Azb}zSnkrec^q>#7sJ?wo|jO*Ll!dWqr858nwXg
zm(s64OZVPu?VHo+B}-#;{K80i4o!2^XS4Zw)(K6J#)#jGF4IK=iu&R91HKmh3|^&p
z5$L0914o_%f|})v^ZjEn1494T<C@o;dS^ei6fw0@G_~40_2I+R2Fdgm@AQu5^hf*Y
z&k@u6Mblq;r;k2hrZFTlK)#v(zj|Du|C>Cn$c_EtjW2y0N9!9H(oLZDhyN8kmyn3K
z)c<#cuKy{|l^BBjCUjwWu9R@U|CZ2oFWs~#J#Hf1W#*Afaz?>ahP!v>t+LF-?QDC$
z9Q*j3#(yDn<@xR8-|H+$94Uy1D!P|a)cd5Urm;9{t~fNi<mEzHL}IybYx$F;XMyjY
z#kE)FeXI<5_&l`edDpwDr2mlTdRb7`p55F&INDyb+EG&3nLF84zt&aJ-u-5~yR4?C
zXr|}IUT^7KU(<SDP2=nGrvA#8{YyRl6Yu(4H~Jg)2dcY=<_Ctx*M?emhZ@?4>;Es$
zHJE?B`+3oLmE(L@ntE07WSz&(`^oOAlIa)7|Fd|m{6F$s_P_F6Q24Jrmx1DUo{Jr&
z2$TL3&t-PZbD6<@;kl@>JeLx9mW@n$=og;LoI-x6)Plko*{}R3o+}2+bMbxWxiqmn
z*NOt6&@s;?lrw|nxyJq_&!q;&@>~`<0$84FGx~Qtmwe7K&y|Drmv@IGVR<gESP-0G
z*zDDrY|${wW1fqYO!Q#xPdu0T2#dvcp37lwtxkU|M7NOhnCEgwfb!(_CgzTLt~fQp
z2t;`wcXHcK2xF>FzBc>143_7L8Tr9;C67qy6o2QrzH}CSEu>JR_x{Fn*{QI%f4u-@
zojsUWCy}1<)5h{#eyYFnT;?#|mWX_Av=F!0z=}|fmSDN;n0Yym3}`qG%X5vK@LW~L
zJlC!o8(R8&$t#d13zp|P&4Qr)dLF}?A*z{!KH<4+|HN}W{|lb$2^7rQP0U7$>JLo+
z!E>3%{>F0|lk9<i@?5O3pSCw*tZNq_xalCWWO0!@@>PJ^9v`9QOPVmv!kwE~o-0X>
z?JJn+JI}>Aa>8?UV|lJ8f8x2ausm1#pLi|^{x_aWjOjbi<$>k7X8+7{-TIB^dH@nK
z&$`q@WO@(t41wT)=GaqFLTl-q&-p^4?qPQDWh`g^mggcOSC3UL&R>d>jj#*73`XNC
zy%q407No!kzkwYc^IWH(@#^1rt|#AkE;<&d#wg$KcrNun@LUMmW1cHt{#TysqK==@
z8!XS&^quG8|H*Sjv;O3{p8PG(mHMxEE{(t7xrA_^rTQUle&xBMlyk5=m&PA>u8P0m
zx$Ho4bHTZ??D<hQI=}H;zQ6EXDFmUW5W`g~`JX%&Sn+o}*AkZJD*4WHvC;nExgMPG
zTtdI_T#9Yco3mAy339T(?s3pepSfs$phy=+gq9*9%;3``D}6@EgWSaOT>J7`(m!~v
z3xDFd=#F`=#NT)>hZCO51C8am@_*&IlC9dr4mc65eP$Hyzwum}Cp=fnU+`SMGrr$=
zt^{VhS3h~KtAM~CJlFNV<hf+F&d@}E=eZIIIJds@Tq{3$E|4HD6J;iW%L&gFrCF_`
zX8#+{m1Ffk<hg{u^IRQmlpWuAF3rE>xgK%&QFlaRc`mbWJlA%}A9*g2qSP3c=Q{fb
zo(oEP%yZTJ!gD<)7RT~jURa)M|MxuC_J7WEjeY02I{p>U_2JCLr!iN-o~)nPRe#5G
zrTin$wR6mK5lKD!jpstlq2p7O1U)rEy+?lVToshT*(CNSJlE~>rMlclRzR{p@LZmA
zPo($SI*I4lLPr=k?p>*VjjtX5^y&iD*^xH(#3WbL8V@XIGvgc2)kP|F%yY^A<hlIh
zLKVl0<#QIhF5msZbGcFU1qRm_4=@j_`u*U!q)&J*T$*Qp=DAXS$8&8Wf8)7^usqky
zpLnh~EYD?yLo42Q=c07t7Vzx}&!uz1bD5p+TmcYsHt4BW{G3>xYw$Oo%NWaZ`QZd3
z|AOZVp83vm$^YQFlF_XF_^3&R^KlPA%M@VgA3RqoRQwC8^CXN%4UKm+15*2+^IVTI
z%u_Q+I$}}Rwurs|ndfr(!E>4a8$4Hxj(Ro?!973Ds~%xonc`IfMEx+StL-N|7x@pK
z>jC&tDXF12?s_=^J}gLV2l*BGd!9?@7oKYg-+PnbHNyYeB@s_k{Yc0iXH!?sKk!^j
z$2=G33D5Ni%AGjKT_En&e32|!1b2BEUySlMp3D5NcrHE!PRxw_fX)w|>k<w}9DxuL
z$NQM)68^z+A#sF|5YGkq(F%8Y1dhuBevS@KkMBS6T#ur;k4AX!RS0pO@LYU4f8x1<
zPIxXfSm_Tu*T6sVT+;s)p3C<ycrIx)_!9DeBhPj52hWuP^7+AYr8<)0vC<tWlYis6
zr2moUO5G%N*{7v@<pU%CN1p4!cb>}|eav$u%i*~Qa7Q3Sj1VMan*@yjyx;L$sWVUS
zbJ4gMJw-eqFfvB1&bTw~2qa5#3qK3L_LwXNfcFQU%jYN0^%5u8k%-Uuwh{oZQRkTF
zipe<Jh)%3P%72_8lE?B~Mn8Bi^mm>s27SVF!H#(@zF&AQ^Iv$b<bTC;<v?@HmWqw7
zbcW}NxL)df1>p6Le&@OP9J$T^z;n?MsEXY5%H}w&?r^L2k{gwu<t-F^ueg0SCmJ(+
z%yU_s@LZ3KAG;$fgs?o<!Qb*+!APkl8=X%V?}Ez8f?gI*mY2!68!*t*s1=ah6nDAd
z@(ibp7``o$7V_6T7w13lT<yQ{Tzvl(o+}!!34mt-kh3qXcR%5|9-&E^HZ_`bNS4rq
z764rLf8e>~f6sIAVR<g~e}m`xNbq7@xtY5jMP#V^ljpL*=jp<U!17!O9L(4;&!rX}
z#0w>;D9zTPYrMpD&g_8ZhEXyY)mU{`VNSrBbk+h$M}94U?5N4isI2v)C^X=15@#!y
zofK3rtMH<`1vsXawvb-flazts@fG|Qh#P5y&cDHP^`G!uEkAfJLOkg|@LXq4crHHZ
zKk;0AKX@*mzv8(fqQCQ8F@PSvKk;1l0{>&4OXw%hW%PsRLi~y6iXre^qaip)PIPpE
zQMc{=HKsM5u4j~_3%fZn#_h<g3)+%;)@VF!x)Ywu7f16y;JGyayF6FQFFaQ{!5RV~
z{crPJy#H%?F6eijD_9`c^ZnC3o7`Z@vxE?rEc#p95mWEe97ApJu{@W#+~4zDxOhK#
zF7ugxgXh{JQ2O_HF1~-0=MwujcrNmP;JH2%teVb-FqM%V!Mqz`OtwC{p9rk~%yT7y
zjeqc5kI>HhRX&6<1VY^rl>;2f2>Y|Y@?2*4Wxf!BRf?P<ay46h4Rz=v<jvl5D@NRL
z24TxN+)7e=4<h-XSGb{u+{-uB*H<j?QNQwB<OBz3Eqq;)07V(2(yOqG+@5E-yB!nU
zfAC!9KX@+Qf9ARR@r+M+E}{P#&(#k$|2@xT{43AZ`U}tXnSetZYW(*+mk`2S^MvQ(
z{X3q^@R;WkI^ns_BBk8Xf8x0=p730kaNK|4xy1h$@m%hI$8*(6aE_huT=@ujQA0Mv
zfd#dAf-_Id^K?@FndcJj6&e%4ZqOiGN{@|(-(M~?taNxcHoSVJlyDsN-{rYDJ@&%l
zTilL$uBQl$-ETaX{&${BGFF!9-{ZNCk{bxd*4UT2j(IM(WEahEJlCqG<(L1E=i>X1
zc&>TW-|}2sQr~&5vcKiIPU8xk@LWQ)rD*tcj;pd5e**bMtvjK&Dzy|V)igEVr5^KK
zDaSk)&mVZM$5@`L^SqW%W2brAwJ@(>J<VQeqArnFg$XZ2IpZ`sZ>j0MF|eaiFgNg$
zkuT2R+_e6Co-2WF>>JM&MC=p#w>+2iKl5Co5CLCw(3SI|Cp;H7mgnl8`Gx0VX8K2-
zD_!Gxs%tOcdTJ1#WkoFCio&Sy{o-e3MyYSkPHO$&xrAozMVoMFJRMtz#H1Y$J<`k9
zTIuf`I(3|S;OX3TlfF*9o%^k)OP|zdPla+>nj=T1#iYOBxp;o^T(?={j(M&`AtBB`
z@LXv@KX|T?6Q0XR_8ZUj^@Qh2{TDpfxc|7vG0%1S|2@wYLF{tOb5(^f>bEk#MBvb}
z4MOa(7S_OCAmiFMo=g6i=b8;t^#l=5?qGQ?Al|P$7Z}TPjrn_e{K|7Z(rk)3Ujf&l
zP5En{E9ocC6$-$+N%<SkC4%L-9GlO`%=%W~%HzeH@LXZXJl7)*-xHo|uNl`I%X3})
zpYmMW-*_&M-*_&Y?>v`db7RLb&jlu)B0T1~n!fQ|!OYu3z8*PPo(rMG&YIl!$iK*I
zVfP81->rV9i_fAjp{>F*${PQf=YlpDAUoqwshh#F=R+V#d#$9XUwE!Kc`2hAG65?y
z3bFuBZJ~ko#C0o*+r()4ii6>cCN9*#0cL~V_Z|D;XMg3nGLheSE-;We7)c^8xkAMB
zN1iL_KjXP<73te(z%*bi&joCyOd1HJe1<sTxl(4ZJQo$dP_+`4=OUx|_joRRvVY{c
zGJ^>|H8uUla{>KNcrLo{JeLQS=em3*9(`Kl2hT-Bpem<`pJwG~11y{gT>b;k)&7m=
z;>4kW0LU*4g?#6^2C+O>)(OwW+H%5k0a-w=L7)?!%gGqLG=k;11pdTxmHrjaCG{6P
z7cI>B>-&^xJE$e}JI@6_;knZGTChA9sYZOt?|H6G`l%m07dGDsNJu=L{5A;@BaRUK
zJ<m1wjpq_L;km4Gu{>9NFn|4D@LYBp^}q34;l_0=zwlhK!9`6JgDXB20{vQ8o=f~!
zo(n+ogXhxw9nV#70zHN0xs(M!h=({NCp=d?mPn8S)BFX`Wd)|j@?1!4cjtGW>&_3J
ztM&)aB?kclcs93x@LVVW3TBAFTPkfL<oSi?8VbQ7&Hw@+f6a3t*a4*uu+i^4S9-9E
zhUu?7m*_FiHAMhudpO#)3?^rS0$HIyc&?e>crK@JJQv{~crKIE002e)&0lz~eR#Ue
zA9*f@-*_&D6P_!Qc;*Msh5S9wWq_jSMB;Ohlm6hj1Ob54$2?ci?|H7$W1eg0C(k7;
zB94FN4?NchiXVWqTWun;MS@0v_fJ*Lu2w&=l_FxOfT3hzF;a7><<<b?d5>l|7(faJ
z^a;x&-~ha}Cm>JZ%Q^uV@cHmgsn(-TNt;tKBT_Nbr^v13P=Jo6LBC2NBA^^Gii`+F
zc%GbM;T%PO;Ay=!4sk3{gCv5qk?-MUWjDLbAn~C=c+m}%5+bnuhV1)(FsGWQF3(jo
zq)gG$065TyTa4na03!J1q@ozNG(KUp>;QL_O89xXhiz1<%_@G6;HvWCb~z$BaURHw
zT%=!$O>2`!t7-frnNy+^nMeY0a#C>sYz2=5SvN2*4%-rk-NgZHic&a%09Fc%6ipQJ
z%@m_R935ZajDS4=$)y_ePOAJe7+?}it}QKjCRb&EB5>rCiVcs1!C+wQ7hhP23?l*1
zosFE;04sD!V6M5g$mG7dFA@Vs{}8%}P*&%k91C4mAf|6Zmy2=}vOV^j(8a0ni_nEs
z<~c`?#&y98T}bftr1D!j08*^bwFe3u!o{h^3SEKcJ49K<0a=tUDTca^g|3QDa&e><
zI#8yx^F-*XBE||`J10U{>9NpNR`^5css`w*`r{i*YUunBy1uB>c6JpJ9}8V!()d>x
zy33`zU6A0n_kR<*A|7^1N_L7Rp9o#i;3Us>T*?!nOX?S)OYTJI3O*LPFvZfiQ$K~S
z;2%PlEmr8N{VsHIpuP!R={YAt*UV3$t4u4mwj``n%NQ$kJwFcz<kr=~4Sxt-9ymPp
z$YY@^TPwHjyU@kIDcgw^x?Fnue-*k$z^-!y3dVuM;hk?>(Ue9gprdcrccClbSm+Y}
zRp`QV3y=9GbWvf2uIm2R--IscvCsvJh@t%^bd?<oU1tLPu|gLDx1Wslr_cov_$GA0
z2T9)%CASS=utZmtumS-NZ$v(>Mk(;imnvy6l2}LfEENlHFN{eQ6e<^>xgEr|86=U5
zPOrv0Cw{5(3;Ns<Lf^3;zF(Zk3c`V-GQU(gWcb0ohIj(dC~`f=E&Rl_5S>z7<&R+^
zAN9Vj@aq?yy5coV^nOrmACDK|=O*XxAs3)(<^KqZbK$~e5jQ<Uk{kl=H{z1|=8Om<
zCCc;A&~4b8MuTCCv{-p7B)%1ZfGvi~18Eo0O9_&?{XvhF6If2kLZ~s|)b<9iw3Bbe
zkAMTId>F{lfvm`GzYz>1ss_*_0%dZ2OQeIua($U9m2fu!bVd5?)^Dom1gshL112Ad
z2>>wQJxQYT02~049vd<p@d#H32}EO$kpNL5G1$UBNuPly4sgZ_UAZH~25~=yt|@8!
z>$xL%%K(6q#K39*2#!RaB~J{KEDj$zZ89>5#uv6Hcsfi#dw--ML;o=^R>VLq2*;F<
zkGNzEeKj2AK1UAb7=^7=QW_aLztfUF9S1M%%WMUQM(An4%gCE9nPm81RjirfuE60i
zq9DgdZ~$=7g9R28s{MFOR>0daArh(rsmnnRa*XOrjkMDO7q24mgMs$qb&{=Mya)jc
z10ci$Nig!JaMEaTa0C`Id}xHiGeF|OD+H5}VjL*kB%~b$9;pEmgKI2K`w=kx7;v@X
zIxGZ8xG7ZTr9|cdfFuE69|Foh;J&AtAV>lb!mFr~046TJ1n@F04*+fl;FMB~SQ3(&
z7$s%^Ab5y3aUDR$(Z!X7#D|PR3UImaBXiz$CVdbm+?<36R9%q<<Z+Xyx5-ghcQc~-
z<LLp^1+_0;-kc6V#-H{DaJ01!lRr5}B4ss^6pR(RM7oBFy1kBtt_Nv>qsKxQ@<iyW
zR?wKFSQ&%qz8U@|bQu6Q!zEXbg)YfhM&z;3mC^gC4*4|uMCiJT6}rSh?&^dYqkyJ4
zqZwr8vCt(S)>~43Iq+EMQZ>a8d#fy9g)U>m_<|oom)VKX1s~&IoQCOQg{~T`(8b)|
zSAi9}Iz&ks05}3b*}JAy(zyHPCqh@pd@xq%;+P<QW31yAM~W4?_J0w&SaH2Pvc^pL
z&&0-ErVi3S5xNH12-E<0X~A(-R>kkRX3tH|N=El+>CBGAy=H_1$gH}*30<^r#^@|h
zgf6RNp^F(SbOA<XI8e`D`h%L}nD47!hx@aCJ&zM?8iN(O!ce#6aH`lqe4+r-8RQ->
zn)|D%J;M0)YVVEBC70akZ$ek&PoZlZB?B47u$hlyg)Y`1T^X#<g)r{dG@#H`*kFs1
z&zPgiXk+R#07I1^2xD;dc=Y5l=tSspeDYc|GKNGe94mBbvqOZiLYL4GYf^ydCQfE7
zD$4=KQx%0k1aNL%zKQTFHhllY+r|gtkC4Na`kl~K$nNo`8)SL*Ba-I^08xt9czCth
z&zuxKPv>t5%QPu|yyzlO1Ory4Q~)D(W~)wwt_LL2_B>bJG>(NXH}@rX?_;6su6K92
z5;@W49Bj)Zw&%Oh)ru9mJjcPuLYJ^JR_MaHQCT!!&IrKLj^Ta$kgqprSw^)^2V(5}
z+fJn-u|gNW!O8*2DC4ov1t7!<U3Ckok(pZGgsx@ln+jN=3v@o3grf_b{rp7eGO#f`
z@Xt{2&(lI}KgSAPDcUo?2wgKM_dN?!uXTzZvp6EFW1%af3)q1aW+$(SupB;3PCum_
zBN8L{P3YP*nfX=d;vV0|3SF*CuVnB!7dv@z%(_L#xrf$fPR$6yk+wWF^{bl@RU?YK
zwUQoJHD&;`RVwSm07$8&jUHC$0?^-jHD>wzSm;8iQH{<fH%fq%&Fyu7qc^Nw+3FLp
zLRT;_g?^JFb5L$^14Gfdax8QuO@uD5xT~Um6S_A2Ha^Wf#tK~uw|z%kd^}EsF672u
z`VXP28Y^_+GbEuk;7^QcsRb2mp<aRf?f&`nIPa((L9c%ZU6(ekKaF99E)%TKbqPdt
z=ZDZ$*VE4QP3V$y<=LWm@S!j6b=8E4kyL-rS5ufZR_JQb;y~gGtlZeNBA<5pu;b*o
zK3&InEOaqjjviozu8j7vb*#`8$d8yg7P{&_z7{zax^l2WmpB-7!`c*5uVpZL-dM=V
z11C}xTLPSfZ^tfUg)XBVuUTud#bcohgC)A$sspe>S2|Ycx_jGq(<OXq=kYh8EBf}q
zPoXOqJo%pRW)jHD>KCD_#TEZp=mL<zyFu_30JCFFaV=w{B)D&^KJ2^D#qeF|suA1#
zE_B`EN8ax<A3GMhkVNold5B@W@N14^p$nj@6WDYg`&=?z3jeep5-W5SV}&mC^$6@T
ze2x{mkjFw7!UNXt#PoUVJVctP0~uWuQ1wmd^6-nkZVBc%pN<u};$9KJQCw+um2vhq
z+=`?lzz(d?)$s;ajUsCrOgIs`60kxSJrF~h^fBg(svEz@a$vLx!rxXdBe>L$8f#nX
zUSnzk-Ub%4ZqjEC?1TqVHRhwd0lV7bRI<i4vPkYY#C}Q>jn^zq$IH9Ldw2`1)UwNY
zJ_JeX(;KPYfx+3MI0mTJRKV6e@)86I1q5qBNEw2K5XefGXgsL2<N9nc2p=!p!>T_^
zoQQ(<o_H0g2?c^64Ltpf0j*SI(;P`2au$I&cpTDj!24MoU!19j^oowCW?VAcvvPMc
z23wOT1P$YLGD2V8q9!KhfTD(#!sGx$AwWP}5a6jKuUwunTEd<J;;bW(@mAtAJvsF5
zNYE@WGlWiu5ecw=6Gj2JhW>;>FJTAmDCHz+gpqRuUF^iFd!@@650(233Lhhou}#15
zTov9){||e285PHtJ%AodfX3asvEXh&gF8VZ5S&1QYl4LUjk`;5cemiu4Z+<ZxVtC8
z`*kw+&fJ-MXa4fuda~C0RJH0;)rUIg?0wGOKU)9xf9AOkMLq*9+g(Od!tGpbJ^JsW
zgZ)~*3vth+|G1x)TRvcztanN*vkMXMy6d>4TfY0rbImw;EnffRxwh-4Uxdc5j?bU8
z2TsdeJZ?%gnUj|hCHN#**AXAjQMciu%88LI@RU7=A1#BYRD1drJCVV&P#*9h<DkVz
z<(jcYD?B_zVtrQllrcD!HbS<`NJ<{B;HeXB`1S<^f{0)*0fO^fZn+i}RrU0-Ds6Of
zvC5X6orH??4hwE$PkT&pjZk1&Y83Z_nw^XqJagR)uU32&M1!n-LXsT%g$k06Xnyis
zd(4K9%QC-56MO&&7pC_kpi5-teVZdk!Hkw+%8e#3qECx|#iGkptT(^-__VYjFX>va
z-opK^D*&yisJO|}+F1$Cb5-rV1XvoXj0ToA?j=w0MeUd*3)EHzpfiabxtEs5RX3U9
zYL7F^ISiBoife!JT%Vsdg|O8x;-e1{E`^AcTdc%<C~xS0)2vUyQH!^fI*40+l>f?^
zfW38KErqlF?z)D(={KIs<0N|T`s-IV;}^xKyci>7R5YKtn6X>-W7bY=MHgtfduLRm
zp=@X=r6pdBB``Mge%5BuWj1CNJV!g{j@^;RNu{s1MAgSBH~IZUvruEBQFs_dX0d*t
z_cR^e@J=QUM?)Dnbz8TyUs??nWaxgdnFleO;=i|5R3KO)yfi1tW66qY&3)2|W;0?t
zFq`$DIE9cPMQ}Jv>LFRp<wOL?rnII;e54jHsK9e!T#ny}x;*8{-6y4#C-$?BSGE<k
z(K4U1eNL;y_o;dOsV+TU2U4x|28=M64r+u8WLzS37uxN&=?|KD+%<bZki<nRq4?q+
z1oX!Sx)hS8<Je^PgvR-#$800%PllKBBQXjU=q}kLyWYstjWkpa@_eX=Ajk7stwY(O
z%@ciy57b}|PPU)5t6&6oH^<_&&ICc!nNVzFT4YiWJU_EbX$<GlZnhH*oCiGWqEA0T
zIg(ERh7Fl$H64-<Dj22KTJkM>M2sy4{h>tg&I!7qI)HQm=xH3I(jfIb8oTTx!`|-K
z3!#C6np}ZlWKRWxs8<*@Gb0I0r7?1QyJkQ8;&A&(efX*j=DUT|KB7e;(vq0ER?p(|
z;>+^+Vh=9rt%Q&hqGI|C&`{bD@B$?|{heFrfajMyKqk%zIS;KkG(2wcesoaMiX>j8
zZwR#qt$SXLZ?g#jx_ECs)(`0iEGJ_=XYkCSM((gsX%K~t^*AWnTv|l)1YPB52vngU
zg#}xA-aVVkEI@woW$@EEK<bP~Kx-Y0{!O7J0e!-%i){;H^l4zxK~;dqG)Am+R5|^y
z6vRKPD{dc!^e|*ya9%xITs`Z7m(ezn;aQ--b(JF5yR%pas63!eBaF~57`3@8aKCz1
z;#qW+PumLO6WVAWtS!y(3HlAu`~)AKTVvu;S0))cma$;X+HB%hCOO{Xv2e%Q9N--j
zm%!;*bWCk7gBY`t8u@r!b!{HU$6dw88UZtGS}qNx;XNCZfO@Jp#bq=p+(P;km7tM$
zQ8X6uZM<h>uKn2j9g+kmt4ON0CIs<k(f}XaAg-susDeyd_z|yAW}?R)tRKjqb#TG_
zbr#};><%m_jW3fM$Lq?STUiaxi)UKT>MA_%SdEZbXCe5XD+9#XObAM5zwmsniuh=4
zxZKqId3Y;HxfrOI;upysqfyP1iV7ce=AH#R8s6cWS&RBddY(}GB^_>xzKITIuB`a{
zxs~14spRY8SwcO(YdEI+{@0mF2{_Ni;TYSjOTtv&I6QTz7kaZWe=qQW{S$|C%~#zm
z%lc+$c)4@Q2mRxi#Cj+D?Ivsahc;2*!1G?e187d<gcvUT@$lX&k`(yZBe2h;$KT+D
zMcF2xG-Nd|sR2ReI_bcE;K|i%bQ$=A9w!v{^9w001eGhMbLjQ88Q1cJF%FD3_%odq
zGTDWO9}4m6Yb^v{J_8LbY<FDLFP~PBUQ4gza7cqhCA!%4xaOB}O-SkAsPVIX9q=?q
zu9NpXE6zPlhLz?+ul?4AE$1sR&yAq8`OFD*gPa^68u{r0s@;!Bnk~&&iTQ(u2yOAY
zxUYS}H{I6R?liUqs`($}s@t<>NTV_4G{W;C@7i)xkyvuN`~4>6Gan@c&&28Q6UiNa
zqkdYWSdckh)X0}ThMfM?LyE%HNjtP%aogvpIz#x)H&$0~#b;69gxt~O3!TdL^(!oa
z9@bJ+PuI<*)_eo`wD@u;?vh!zD`&-}o#PXS_7B6FCT(nqY2z4?WsC}7v!$Q&#C2M+
zNg8aal$M?{u?ZZ$uW4S~J*^Ay6-(ZD3Z8SY4s?qck{4$A3ia%IJegZ%=a%?p_UL;!
zvE^GE4?=Ld4QWb;J~i@ZV#1L(Q%+wxbrz^aUyBSzbwQ*#&Z3v!0O{6UjD}Sl(+`_X
zb2ai?U$y~V&pS4Az>R|$TJuM^O^?L}ghqYStvCWNDOtA768hvWQhXZ|6(i@zWu4w-
z$qxa<3WTR?uyt{DP4^-rE=GD&&+>n0PAI|h3c^*L%cR3`p~fN$>k;bZAJS&KJt+!U
z#k8uvP0lq9+{k{9uxR8gB}%3hT_b?~V6M2!L|CT6EV4eacw*oZ4fE>VAUdwdv}ij|
zHzX~%ySqB4PKnG0iM?0iw3$4|0F9f99lTa6{-j7;u4V{qF(Y;=2-Vrmuc$vb_n%uK
zXup(teDe*z-xrk*^utNJ?X>0*I-Pv`^|W36vaGAE!5i_bnf3&B*Xz5}SkO>Br?~BK
z<b7%eGWNcg`0Y9;?CSOYw~Kc1doSl3_y7z$4CoZP%z(#lO?;p`GHS%5S50|JHKs2_
zRn(B=sDCUj-o4L2*_!9_UdXQ<XufzR%7=)f*YhAE6Rl|ZHi;UYcs_Oz=<{@fvi23A
zI}>v_^Hygue^$l1*7v8-)un-Zpd#V{Wnc;yFh#l_rN(~&Q-%#K<1=Ih;z1L%Lw*Wf
zgNWk0b2}Yl_^X3F7ehaVE^o;)AsVt608;-lS%NVbE_7LEo@Y)F1rY3R;Ns9D3Robv
zb#)3B(STlsJQ!XEeK&ri(b-ZMBG5&{GMELb0}JY5KZ$~TN6)5DM+I~nKH5^|6&j*n
z3)nB}7oC;-UFbq2Q^BVED3#~|W%?{h;J3!moy{f}E-0~V>o>wSEr(Fm&!9&|`OSo*
z?Ws8CoSRH`anQ6qHC+*3miseR7t-}uZo1aVY&!`$kP?*oL5{%MGpr2?_mymSCKDGG
zMT|If+n{wy!B1p9i|)0E*m3ypy<c04!jRhtAxBB*V&lr>Z$cMGUsz`%k$NCG??^M4
zOQOp8P-(|o&pxHdRHCO`b1zyI^~<=_@8@Em;|_`9v3=dP;PW^;kpD~$aJgnT3l>`H
zRv7M<Gf<)~?h);vdw(!MxR54h(62JCtZbs3CX2+(woLmi@u$$W5qsO)t@=Ip!a4<1
zibeKQ=#rG(lY5eniu3NZZDx+}-f;KiL!oqf`8T2R!w)3@xe;VhPUgtW2S{Xsv(mIu
zGPJo;$@ntR(Cu18%(Z|gDA59?oj--HTy*B!*A%sIp-XxnbIaiq_MTC&V#uZualXNs
znRw;!Vwp6BxnvS)z997*n`f}j9&5NekuUC@FW@oAI4EsliD#Ld&*!lrNGnA?i|E|4
zVIAbFn;$_;wlTco3(`g<MR_LG-!04sVJ!76AOv$ZY#MkX(VF^fpFET#-!RbBv^Mn-
zka>%W{no)<N$^4LlTu_S;kOt^0p>n$+{*JU^S3OD-&%2~5QJgzGa!;?LN%LWFl3}e
zdgZveHa}b=^AkgK=4r_SpaiDtwhN|$O<UHvxh|#~F;N@NTthZ|TQAF%weMf!Ud*sg
zN<0r%i^AJJBLZt$2J#V_SqCxEPHrO*jk=C^^MnmPK#!p6m7pMu5FZ4iPBDo-Kx9^t
zq~jY!mL0uJrH>E@1GT_*vdiMr`2(#{!0WDq5#M(r$K}G3G)0~<dz$RVA895yT6h)*
z3Ql^1E~S*l^S!3LsqEoGmru_n_;OJCMV1s+sdR8TT<8L0pg;&Iu|hb^_(x+0PdZ4K
z<kYeA#8JR2UA`D7&j`@W9<LUq1BcYshBH1(W@7Kzniu7}@8-WM>dKXHW$QfSCuOLc
z=kb;VEDU<~KP<fVEmTq?{^;u+lLeG0bS7sM&f9#IU`8P*uPaCI3?1+XFc@z=DpX=H
z18keU*)sl&=+`gD5E2MfH?$+{T&Lfj)n<6pAF%C>EhH;NjBVln%Dk<Q@uMYbBwXln
zWs+ExPC{T3mV_-Ar<;3oXb>wFDhLlOt_*T?6z!Y(fI0|}Kl=FkkCAE=wqGN6d=B|e
z4TTq8VRm&h-fjt4XuKE?1qo^<LDzS?0x(OZCEQB|I(A!uJuOhOrw`5f*$jUQT_~Sy
zTc963cWIMieEZnoU*&V{+jz}9(8M+fe1%WQcyrkaZ>QthallYI)Q5d2Olb48-x4Iu
zWV2wAepDpxvBSu=9N=uOnP2Ek$fAQ~6+O)q)4db36%kv#%PvzCc^`0pG4fOB>VOMf
zhzQ@ib9F2!TIS}rCPT<^o#@pgu8{pB_UkZNi?WeOKf{GCpFsE5ll`n(svOLUnxWGV
zeaT@*io~5MSH2(=Hf!_f&K6C!;1Y3HTWdd#&f$R0J#CFeDZGx@t~a)Ie2A$X6Aqs&
zkagmp)OHBdBkr0q9d~#4U3U(va=?wRlvXyoRLkOSxuI1FoF<myrNLp2^008N^M_?w
zLq1(pG2(?!p9chkD4(n5*#agddcYN!GEzZr@c3zuhO3Jl;}o09OD<3fKW<rD>zPA2
z4%+z+I^{}<H4Zuqta*M4UC5LjVDO$CLkk8rd}S_C+T{aojo~11!xN|CSbH&031p9@
z+GF+GJ;P!xUBle$@7{pMijHYnEBL;geu#}S>p;noT3&=Z#<5#$Wxay6cXYyz2Gg)!
zIJr#kFTC)@$R!{%^}$)UYMX^nE?59u0mn^`o@DL`caX$pX`JSBXptYzQU;zm+95yC
z7M1adWj>szADeG*uol(BkF6A7v-`0%4{yvDQ|3z>?tqq4YK^&%--x|YUOD;7?&3|E
zTOr4e=JwWg=l-6~!SK<J(&<m33sauK+D9Nt9)oEVMhw|Z#%C$QXU(#uR#wKF@m`6t
z!}3FCDLrQG2ms7%+zu1mlymW$#K#UpE(MQlOnu-RjE}&TdBhNFS#GYt=eS{0m$e<K
z<Td~%Cl0(C?u`EHWF`FfqoQ0+?azD#Y;1@j%*oaE02!a3LKh(zqYwrsx;mc?1#q~e
zmOPxfSmD80aX|K$#{;cer`oAUV-v(iNE96Nteju^7_pr@K`p3o^l-6F2U%hr@JsA*
zQ|%pS&d&O{>3SaGQB;Xjb0?_q5QuOS8de|5DKdIhKgf6|F3OELq9wLSpaZs-H4ObO
zx^K(W<G@wq+S}2%>l>rLXz@ti2AALVLR!IKKz6Bnm~?;Bd)nUqtzE5-?LjEh%NI7<
z@A0jcgpKxC82M;F)>;obVomaJaxP28s<L9J@{GKAPt5!NjV_kG6Tp>M&`wD?w&&S<
zCp^MHPP^wV?(stNV7?p^)${SVXMOR54o8^==iZW72=C&8wCpZnQg;jMCSDmYU$Q$;
z^KUVcY5h>PXjir2d;fM@y<kwTHUjuW{au`%Dz8|b&7`k&#b?`N0lR_4+i|()EarAN
zj~z(rNACn|3M(BrA3HsM91MQz^km!PWAyk1-9>obI8(io-D4M*$CS_a^5!8b*%9ee
z2x`}+0c*oBK)p+S{fBlJK^R=<>fE*LO!@ZKWBBdIWPXnyaGtBaR`5cU2sIU|RTxn`
z#C7D3Ea>~V!M7*)C&{Hf#V{B)L0kqWxqR&e16>3i1#1OH>oF%Kh#M;|q1Bx&b%7Ov
zq4lmWN=$7|YC}f^!)F@8mjxrX8zPPcBY!kR!UUsG8>4VwLeV5{y{+HvW<N)B3dP1|
z+Qdj=F<!CD_>AvJix~9@w@BGO7D{xvx?J_;L-9evK}`cNGS`mNXl5o>2&HtUKT$wt
z*$H=zl6tY{E6~-*$@PuZ)Q6KYQ1H@+&l<{J>&xjO#rmz2=MrMkEkFyu&xEcn_~h!A
zgw;3Z845S=cCzO}=&vL<N8PM1d^zpicS4XSWT2FpQsOOA1eai{ONcO`FX$vza8?pu
z1q>SW5y(X>|0+qpAVm-*N#G3zSqtTZM5^mk1TQ7&YLQv=<i)++cd3zR1wT++`hZ%b
zL_MICD8_Kqi`z7&8R`6T3F>AcEn+Smp6pKH0fQ2DBz9K6t{xF-4V>rE`yeRUT&vtk
z=@GW=s!A-TdN>H-GC^mFYWCtm+BNrGH??X0D#?vNmN6sp<z-9O=?$BLuVi^bt(EUk
z<x6s-8`g#rszKk{41Q>ZG<^qpEDaKl7&e4Mn(h+HP}uloS#-E_iu^HRNS&nUg)a+m
z_rs|uDQN@=SaM|t`6HZ6q>*x6k&gU)!_&~x=>?6JLmC?RFbwCpw$)3OeFgbUL^(Tq
z=dXA!rRW9`H8MW(9~@;4BhS4?Ux=lBa$+VL+9~>uz|g>L=11%DkIBcm=Bq*L%Oq{9
zYP!}pKAe1WtB>2(kCQh=+cwmmY`$#UG=x3bdfT>T_hfsyp(ewgml*l2%ah$iPnX#(
z!UZ#zoz90zZTs!_Zj;iVKLiS}N!MQZ3bOg~5%vh@-tb(W_Qr?_DR%OB6s2{FwXC!q
zc`+Y6_BtQ%EU~yQeT!snEJ8agiDHICYdyu-aKO-T-AhZq>neU3dR@And0x=IFWv4{
z*F>@?l^`pX{Z>k>VU5*8s%Xl4fYDT30ofnP?=yLj$6Vi}Dn_<h5bl-JU+`RbrV7z?
ziV1vf_-0D+tU90HUE#k`N#eDbu5}}LBPL!!sZ<iZJE3YQd$KAWSCpQnaK9EjK}-*9
zQ&A50biCw)Su)6s_zZTE6w#<wy_WwzAx~`cs?KWe^ZOfOTfIi7-RaiC*aC5zCkBeT
z3^p(EJ;rNgpf@M*$vK6bS<dvi9qyMDTq3$+EEVl$#&5wXi7#F;*pPj^!mB5HZ#h+>
zQ}297?rc4)xP365NI1s!Y^04pc%uM4yYuBEPTMd}bqd31MmqeNTs-@sYX0(pcdUoi
z5>q^Dx-*gPuBYpLiI2U2AFpGs4aB;)k9Bi$<}b3&&iiKAKi12MgeCT6cqZuBw)cEO
zQkO71sp7=<HR;?Y7Qa2oOVd%E*d}{Gm#Quy&ZD!<i-za+0OasQax+#}z|HQFjR1{r
znB|2I13v88lag)XfCNZSqMU+E7|*k==q=)B<Zg1U^znKzeGF+H_)6i!?r5U1U6Ogd
z0tvxGiOdG4W=XCcXY#2FO}CCocD-oXXgmT%YN44tr~ZM=KISG7?9W*O!X$7ld=+?j
zPU-MJzM)x<*UjCPr;xeT?xA^dS4-DJdvMZ;t&p=2H=!zaM>wheoPaS#)3E5Q&cx?L
zn&QL*QJUPa_mlkd7Z9rp0uSL7WK7Ki>UCnyuf3+K@mm&M5pGHY4gkZi+HVtRaV@5@
z&}hU2=EmQkn?}5MHhw;7|Ai`X!Eq=r=!^Y!63=I{Z3WsG&uMh}a0P^SBnEDDeab0(
z^Ae{CFkOU4=CPZa_>8zE0QWCAT<WP`O7!Q=k*de3Wwnh(-UN5C9A1l%Y(&WdlQxD<
zk{<AMZCy5O3~ilS5_73GKR{)d`*3BN^tI}7$9u{zZ-EXdwzZ#po?8ae*vyYY6IIgF
zP`eVh=Qeb_*uJCgS|p}FVDch1Y22**0!%rm7Kd)f?%wW(>DMgt)CM<DAgZMb+-iSF
zXvpGaou@x2lqcs3IkDO44|~Bp&(KjRO>VPgZW3alk>qoxqQ`C$qI0Y0ajM&NKYutX
z3rc&(c<Lr6Yj{G(YeR8YHH`DD_R3Gw=OQ}4d*ot_!N><`GT`-7<-{UT;ml!CxCtc-
zunWd~V^ItYYzdXm@LUopxsJck>EZS0z<5P@+)D74iujwG4(MYtk3+=CNHuV3bu%O5
z{(3W+F^axJ!6!_hmZnqsz9a=?%N;s;l8F^W4W9y5YbP?x(9r2Sqk7d@L}u+6mbK>@
z)=1Ldb0J}x+LJz1)RrPhS7%T-?_}t(4`paE2ab=9v*nLQTny0>ydu@4h@$TtQ;-eh
zd8Usyo-a*UZOXN8{?&C0E^0BI25H2t5f&*#JDVaY1JIFZ6VAj9Go>(|OX*Vgng+5n
z9|mSn=Lqr<2Qy@%5kX7Ve(_vOr;0DTH0g5@IYojxaTH0_@of>)U31IA-d<$DOmO?;
z3|mY9>3H%NC%^GraRXlXU*z+#%CT%39$-rrH3d|jhAC!}&Z}B<zejir$RFGI8_yL(
zFFO|aV|tVDg1MVniA~8nVkXi#PL2DRc}d47KiusdZsJ(n7T-^v%YYzdZgNYYaqg*|
zCqe2e;kIC(j;d2SLE7%KZQ(hcK2Hf=`u)O(A6d>+gKDKIm94j*T+OL@KJiU|G>5X;
z@et3udcessZh%*P4B~c+E^;5YBg5>@A!AJo9AH%vZL1Mj*TFIGeKsg8!-6H^ao|CX
zG$PBp7nxay{Jh&K=w)X9NJ@(dwsLB8ru8e0jC;buy<L*LT$o0-nl%*Xo^>>@{32N4
zwgh;N*6+9Udi<Vk3TK(LI2&F?FXFMr>uw=Kfg}lv5St<qdlal?>VjdYZATn<F3+!y
z*I!epN{-W5_{w+wW&8be{yPbOmhGruSB2LA2TN&wTf_izNI#CQDNXd+GfW5Xp5iG-
zHkJ<cFv!|2^;#58?lpHH`cM|$+NczMela|Fl)|w11f|S3BJ_<iRz~_@NwLQpsKz!;
z^WnjPeX#CA6W<y^9H!o@L~fis6fAX5i7xKG(FTFRRifnnQt@=%`WD*6n0r@QI_f%X
zF6%y$S0S-aJn(`hN;e3!Bp%@G<c8Dw?Y`COMY-9E_Jeuty5!mM9C@Sb8CA)c5Ew6(
zi}yyA=$cECS9QvZ6o17b;HS~LpSAU+K{58C7A#$R#F^Ba*>b@ljltl|sr+ON4Z7ls
zT2CD!?vsZFOx+?_gd)<aS5+XKPjyHVpGAp7xeTAZ=3<=MR~_&0HB%4-PQ71y>?uM{
zCN&6(aF>m(H#MaXoxuj2p=PDGEEDS5d^uV4!!*8)dqJa2DQaXyFwYf9?IA_^3ai{Z
zc;T%$jEt@VMVg}RH2f)=n#C*XFa0M@Z3^a{Bu?IAk!{AP?3qZQV1o;Dl&9uigs&|Y
zqE`uvOCl|Xz7dr3_i4;65XoS=1HO#PQ#=&gxkiAEVi)xD1U$zww{VvxOzn6e;Gu6_
z>l#UW5{72D8f+bcp!0}+sCFvME%aq?vP#W~zksJUrcL_~iZ<MuDjP){cTqnA<0xp;
z%*VjzqFoCc2|v)|pXRwKpOacfA(6ZQV?9<_1-KM;v9RC;z9)f#;#YhKk0e4rh*PfN
zd0~l8vOjoiB)#mh;xE1-Y3)V2zU&_)_oZ{iAvl9_llg5Z?QCm^hyoY~d$p4&7dJrO
z{&pGi<}u^5C8rFS9s^sV4|z8CJG;yE&4UCVrdu!;$0rB{QM=G+k-__tKtJOBtuDHR
zqsVO5k2~0_!kj2ow)wihR4<wFHs>(7>IJ*8{~PO-`;mS_;b!TpEq?2H=OdRud6}a&
z7suX@^gcgO7x2XKy5&)hEa0q{o{x){_WfScOpDBhvHh!tRY13b;OxxDi`NR0c<H3q
zjqKS+HJoi1WUIb}GC0^Qr70x)<t}nD*v?~#8_NuaeY>x*qZe4yFxqj@IdZ*E=2#7B
zM<RO<;yqE{mF9x>+j_*_wYwdEFa-K{$dOL2L>Wb;V{CtaIA{U34-1k4ym9SiS*yU)
zI04V<xO8$KK~N>bOo@Q2c;-jgC?`AKY5+gAM?svlj>iCC7A~<WU;&%{)5w*11#K=4
z?Hf*Ppd_yC2qpsOqiQw45e*1-dwiqGb-rRuls$|!91diOSPa3TESJEo%v$F1p`6B|
zq+DBG8Up!%30`EO-mL=7A*2ytf=URfIU=wUjBEi0nL}0w?a)F`&|>Y;`@qE6VA^||
z^)OuY_^8>4C<60UAP|Z<W>0%RL}~;k@L8ofTZQNPW`RBrSRn*0Cp3OhXyM10P8F9x
z+8=8jG)Jr7Wg@W;aY?WpFcU{XD~Ke5l7yneNOzLR;30xIHDr*<_hMY2c{yN)3yaDJ
z#1Ku~D~WZdP6R@tkdY+pki5wsUHuLwb_G8W0^{6)fiJ)W5r`C;8V>^TMpagqbE(M}
zyfH$!_GS;UAC7=vj%v7{B3DIMX&pK6XKYRYlDh)fRB^UM>5&9+5jVLAq7BiDEqIh8
z$FO;I0Q7`HH)3s;9rK|baHb6SXpMBP44*RlNAAkj5qN914DSw+%3*{C+i~&X7!BYQ
zmjG`!?r3YxVethb&^B_h<pe+P_!3)ni_0E4FB2etymeHy^^g;E5xy8fgKu_1H57UA
zS?$M;@!~^#<XuUmiD*(6&E6P|-6J(X=@`uln3x5;4V3!!x%}E$gVrc(>lVU%+_C>1
zi^4Gy1Mcq-LC`aBfGmjLI<hElvUVCWS$<%#&OBvZg;1~<)6*egQqi)eMeU=2DI3Z`
z+tnO-nIPEW_*x6iey+svkvGl;%@1e?sQL)|h=%;KgD^jatt<vKeN0sa!89sIL@dWW
zGFmN^0Cq@np`SCa$1qJ95p94sKiSe**n!Nki951*S}O^}9qD(~SWd?|?hx-MsY&;b
zH;<^vyQ6vUj8}nR%25r5p=gFYZ-N!$@7E5LQymnA+?Z}L!r}WMvZGsERiOPU-sK85
zN*2CMBv4{xxkHtOSqi9hyiCshxX6C7mj<Y;ajinb6t4bb{+x4F>xO5I-M9jUDx0Tn
zoOOUxB9!Og1r0X-B*lFhfJF7;dlq)2152Ja;L@9T16zDK_G+Pn=2;|74&DLO`_Ubu
z6iiG~YMlV5(Mj-*hCf`AIM0a49I~>+F2Jopza6=Hn<ardDF?=V<Tgq}%t0D+eocQa
zctayJa)@t;jmGLETtc7(Q+hOa2&l|@?4-Fn*s%hT{MJ!^%d)mv$cfccwFT`^X{7;*
z;UVu%kaxzY3|**9#EBb@i-UZ&3K3KXj#ba!T}%%#ZjORF?17D$2e}<I=2<*nhd@h&
zs;%Jr5YGK4d_M-gDSN@+UO6rU>Qs%#*D#N^UJ+89;Hf5+%ZZ=T*gB~V)!t4M(2k#r
zBR>b&BLb&w4)wk%#1fo1;;b5!1F()1a|pG)ES2WMIjZ6=Y9mOF5a?zOm6@~YU|&x!
zavcFVt85h#Ph}&Y9!^l^Oo8(2UV%(N8(D<kqE*|+UQzjMQbthPukMUbfu_Ih^wN-T
zeFNUJQ_o<bvOA$-O>yRcnd+i-Tc=3B+Z^_*YUXv|(yeJMzh5*u*1MBjo+Y5xslBqE
zB)wey&U8%b13pvwCYNHns6DQ~It9{J6+u1%5|`t><wv}tF_o-E>Escjs5aS+#kn*#
z^y1fcd66B!Pv;BK9#g}E3z62<I*i$rk~|<{$L|Z7puumi?r3y79W9K@Ei#B#uGIna
z(R!=gR>p8%DvO8W{1)nL-8Z#1IfQu)VUd-5^ken5L4vTs)}|x@r(6I8BaXm`I5i@e
zzWhF9Gh+kFoTlkN!WIQ@;g-u{@!Yp)0^CPmS5RX<tiJ4jVV#%B-L8toQUh9zTt!nq
zm=9mHtuvM+T&162c%Sh0Wqq2AF_8g@vykyw@2c?EAyQLyLUTmtAJw!CrvUOu9umhB
zv>B5-@cn%4jStCIzz-{5dn;z>3PQYVUcy#`x69KkcQ+E+dn|`_HKMC5T-yp<g9+Df
zhXBG=g!n|9%qp@9BTAg_qBKYzUw-fh&ro1;Sl1+65oWpGMCu?;y|x<1k^v)Cxh%Vq
zkQD#GQ*t0;QN>d_1p?~uCl3_{qTeiXlEzixzrj)0neqMDkBI^%hS|dh;Tl{P8uAWf
zqQYn?Lr(gmtWyKQfahzPG}!^HYXLuu190#xTrLA1O9gV9=yCgi0tD$jKanu{05j18
zM0`kQ$59DRd<$H&rHFXN5Q*O<65NO5WJ4G#5YU28Wv3(-8@!Q<NW<s)LL%!nWsG$o
zpBNohv3o0UUvY;YYo|?r3je`QD(bShffI?W6IIivbUYn}b7h->_joQG5ak*LB8#b0
zBs90(qn(T4BuiO=L~tj?ip<4|lf_Bv#K|YcDbK|%27ok$9?6W-YLn4^M<i#3#;YYI
zSS4}jB`k83(}&o~Fq>FJp5bEfW6tB#HjMbElylqYBqh4B!StrF%q0mMRsc+P^saNX
zo@BJCF$As<tip~UoT`0lAHYIn(!gA*G1P3)&S*K@xo8FZ)i2}=XnZ(oyfulSUN(u<
z67wh$f?1x4JB|wk(qOLOe9Cg%<xBc$d?`%qXGYxIs$tO!Sm(gmjU&?et28Rw<jwD?
z;^eu(4JJaiCK$$_hB9x*V{vvW@W0bwZhT*k;J_S2(8yaMy{1_)2Lp~`08kB~P#vU2
zqxH(G+e+|FhwJyztewdfQdLe&7Mfetrd!ifyzVMrY4VaP;j}<}>cnX*JypPc9V(pp
zlKQqdtwuOKvRYk!lw1MsL@0o%5#!ANWWHbk@Kyx4kRa+t_2p0Jt9uTlT7lO}Ub+g&
z+^vYINv;}kD?z1@n{e_r)&TAt@3gF<!>-TbobJe@%jWQiWx*hXWMiDB6@-c%QN)y_
zkwOi-8bsYnwGoU*BDI?kR#rsf=k--CDGB-sd^uNuVH+nBUTh;btE9;EiVjSB<L@m|
z7!0qLFYT=4%Rxk|fcfJBbO$So)y<6)K+y2YtDB}q4Wf#bHPf#&0Vy~kHy1Ksk_L%-
zH{CXQvP4AquWEa{cKpMfW_@zRql9bu^K?E=?AF4{b+7UF{-ew*2m#B)M=GCt>!=Fj
zBfuq=J{-JCQMHkc1U1-Ny>)AYNv9^Yy9JEQ5<Y@<Jxx8KMe0)1!(xU8-DG`{P3^W?
z=(eNmankE?N$vTt(Bnnf>#NrrnA#h<&>KnF7pvEonA(@J(3e5kpQG1bklJ6e&|g70
zP@^|cpE}UIFwjmp*r_+zlR7xCFgQXv^hcg+U2k|hb$EYa_!w?;>5cqI9l2Q;fl-bk
z>yM(Qjbbd0;!uqd=#P=4jZrL)fvCpm^v4;~##tA~IjP|E*2Lqq36aGKaVj{;H7T#J
zxB!`?f=+5Jf;8_YU#3mz>rWZqP3kOCsf$fp=ucaT&D>>?B}>jYP|diA&4TZy%oeAg
zf1EXJoq>7XO~q2pg{IBg>CeMED5`y&i~Km9)jC&~Hm{rZwWf96>TW(QZLYa>0kZhD
zzIDE;b$T&tCI!6cqCeZ-y4WtZ)Th7jQGaRo<MNc);t<u>W3g$)MLn606%q)@ykkYy
z`{AuI9<c$6CIm#Cj()p}N!>;^j<`0`0s4fnHbFx~4O}H!TA{dKB{5iI_FThxvP!bF
zLGxsj1Wt8%uJU@Wi`=hEd#=haZBhZZUM{V$dT#5sZF~f7f(=mK0N43FSA~|=Nq`%&
z={sagJ6KP)e1SV|Z98g9d(j5FR_VJ~OS?`6dy46MjZfBEJvW7x4rDt(@7nfh?l&O@
zn=p%|m5D4e+xuOt`@=kgqY{Jtk^Aj^&)sk72Z2im+fR<nJP!+&4p*NX!hnZ1>8FPV
zC?`uNByGom250;kD;V&XFv6LHpuOq12$!JZgIqi{B$zb*_O=6K(iq3UkT`YqoBT3{
z!7|x1uW$0dU@pV<Z!ee8HYBJVsZql^@Fo#4!aA<1B&g&dS7}~^3SQUY%Xs<AXpRuF
zTCb~3iJLUZ>jJN<6xdac;Z2F*O*rT(KI5tYblsD2UABBxWq8xLd^3f3TVQy5zI=-a
zMI(Nn6GqC%qqHbV=Qz39Yuptr%!Z0eEc(gbSXv&#Nl2GTV_51f36@f>`RE!98iq>o
zM6@w#MaiGY40utfLDl0s><E6wc$WDzmQM@cgVe!fC<ZN*XL9az9TG*C1m)|G%acqL
zDkqN<qAO*1Z`?_)QBZV%sWUw3u2C;v#;arbqwqYN*hatFY$TtE2AZ(~@x!2a5++#n
zPdt}yTbNMIZ#>sEx6%7t<&-Dk!hh$vJ|E20!g;Q6k@};>mJc`gSRMi^qg|mC;t`^a
zXPbj5B3`yFNu?{3CA#eqV!!cR<+g$sryBz);*n2UufO%=`Fi1qKhf);)lTJ>|JsY0
zNt>D_zzEgNJCp=rIIa}v;s`OpYBM~rpP(7rtX0Vy`x6@k83&Nt?u?k@d7_!vqNG>J
z<Isljr{Lc7jV*g2CU?^YD+Jkh+XD7X6@rA1E;C82?9oi4q_7oDqb1#YU&kmV%NcR(
z^-8VBDpYcHYCq!P_T`O0gGk}D7v|7<-GAZl1a2WPQCqNiTBu?(uE^&n?cI)l!BFui
zil7l{S&<dkvnQA#<7M0Vg73Cf*@GdZg1UpLYy|0wiBWx(5}jZWVv(P0D@+y>=Lw(z
zJ08&Zq2ZH_J=fk#rSZWv5bQ)E4rn1|2pztqMItV>^kE32UD@?V>su+_55|t~lfvE-
zq(#El4>Dq^F+gcHDjOPxkr&lY`t;k>=aE5B3f3Z&Z5y|Ww~Olc9ObEv*j&M&$H}e`
zD0<1g(kq?-E=2ZEtlxXq3K74*norJsaHHIT;tsZo=)1J&O4%Fi9l~czb(5-td0zS8
z?y;Tb3-y&NpT!WQhdTDNR1BWIw#wCU9Gt>q!tmMqB<%~%TN)TjC8L1)WK9bbl#;wn
zT}6Xfu9ZXtZxMd1rBmO!9N^rt4+gc*skoi@N{ehbbiIvWbDG0TUvQkatQZmqJZiym
zS$H#YryH9uL<ddd4Kl(m5sRdS0=+Z%YZ+*JqlqgxiB;Btw*sbuYtNH&3K@h3ja0(|
zQdhWZkgV7kX3yPVV1G1>@o-^R^ZFt8{qlBIJ>Jk!3B$wB8S(B%b$CH<E#9Wu`{1=-
ze{?DeF(}RWv=xWV{#fZ8br$38MT@AB@~yrlcKO1=7xXfQ994lloF=2Q&mqHD1dMFl
z(l|}+8H;<BBWhlE-zh!^9nuzl@oGAOaZ+rTF;EC-g$udMr68w21m|gFT9D3?OS?ko
zB#|>8c&%fKF4*}}9#DTxmdqeqp&?#p%0gEY#D?kH`y&kc|B$iw@vF2C_zaHuE*jKH
zxyPk-ix0t72!c{4sQdG=(Jof60$yJB1*v#EJ@l;YWKwbnA>7M)<QMdXFl0qBMp#QA
zCOV8a*dff64VFVT64cFCJVt4VxlX=})+1P474BG?L$$8ZBeLfZX@)`vS~gD>kKm4c
zI~mP8Z-(B%1)+Lool6HwqVya>2-3k^!|je%;8Y2ezsECJ;%V%odaoIssWQ$aPL`=o
zu1RyD7|0No+5a36`Cw!`mstm$^d(eNv7m*X=Q}Zn0>BC0Y*z(`HF!`4DPM_3X#ley
z9L7$K97`iJ7MP0u)I!rKX*vv7AV=t_*-=Fb?sdLE54WEgbTGxZkAbJFPX#y0DS78v
zLBy5?)G!1g<jX;UIE<MTH^e)pw`)ygA_+75%b8e!E`wx`gSs*Eg(TMEvNT<?x~_0x
zcB~AI9E`DP4A)>1fA?TSub+9G!1Gzo+3Jph@?Kc1CSRUp*aM?v#L?8f$>`c<6G@B^
zO#CNS581v&u&u=R(p)|ZlBDWU51miTNv11O#xl{$Xc|3Kh%eS@*}Ko|Pb<5wEQW_O
zz*H6={kHAG-4zxs|LdtzOZifzvRs|9;uj~CQ)SvJ^jOYtp38ld=;o%#SUD&xCPboq
z`f5NTT2d{OC827{!J3WQYPM@UuzIqJ?TuHlPKUjKV0yT<<SDKc>|H@^W?HF>ww3lI
zhgRJJ*ya&`Ga6*ixxON2Q5q+7&^LjOqoOIoi=0JjWh*wf^AU?pk<)@%`twFyGY*Fg
z3RvpSkzG?i(b4<xP~u(9`X=d5U{(l#@{pmvdHOwvYxIEr3UIRJoV?6-l49BCI==q)
zkaJ)G@zW`b3&vg-hg}2<(o6b;QY40xmsl+nD69?TNKdkS7cnT&IUAtF9QO8nD#qAq
zPIeY`b~X}&MtcSg4P@BUep(BQ4pD*??ULN@qaCzhd#*ie{f3@GdVSh)la$q5r&c>s
zAkvrGz1}p{(fYoo9ZWhMDqFhI9|+9wRNPvgJM$zcmYPxPKL4!i!4n5*G23*$>PMBU
z`6Q<FhQm{+k5ZLU+%0Td6vG0`*pt`1fLSy<M1iUgVUYNC@R@|y`%!;lNEY6qhAa$&
z{IRpeMGj4xnqoz)K)e87{&UM<);-kLDk1u;`WuTb%jB_i)%WjZpFZQw=$`a9;0z>i
zdn>l@K0}n9W}&Y?9rGqwAP_}`gbUr8Fy`IoF58)^iGyvkV;pE1^Jld5v;zXA53@B@
z0-tMaq`s`#3ZOY(2zsXM*=VKkFUbisC^H=qpbjkT068OI{revK6k=_j^|*>n{_oy_
zCkw&&MxHx%HaIjZ$d9WaAGME7k@Z$k#D_ZZ(ogVJTUIL@UAw^Hn3K*lR3Bz9ELq%#
z{p?!S@=sm6@mL*WQuO$lVEj?Xt;ebR3qpvVjkwb0B*_(dWV{NEBTvyTVsTnwI|4u4
z#{D@kvMKI%UM(1oYQ-iL@}}(-Pn(oJ*E&Fl&F&7g2wPTje9LE~tl5jRnk5kV{&>J{
z`(1^|TleAjT^tln)(lUZJwCaV94!tYXOBEW#@Ty!rXTMmF1q%u+!cDWcoO;Yl4t5v
zFMEvfNIr6BElK98-%4-xQ~TEz*$y}Hk;S7@yH?Yah)b6kE;fT%X%!r7n~VX2Zkal<
zrEV5?^^vw8_3#dv-=5sglZbcq;50t!m%I_{g^pW}+#Kb!-!AL}aYiEVFR=7K%2X_U
z+u#&8F*3X|AK#vJMf19*@;G#;g<Y!ni{C85T)$E1-d~Qio8Xjv)GP2heGK!uc>5f-
z4L{W3xz*#n73i7mqK^2<i~bR~N*?^sRhJ|PtRtgIRR{Lz@c<Rt13%eg%z88Sy5lhU
zu=e_}@Az=Sc`j{5h9DpQLMIj`U!lU^c&>F>UjZh+mVn=QF2zE>ND@Ek9Y5C>e#%V#
zS_=Np&HW!t`KcB9-x2x0-0?R=3os`2)oJiIW75`V3a}^)u<8vUlMi@<7AWK&V51QD
z-aOF7T-%N`@PoFBQ&6B6S`fG}z`Zxn|5Cw|DJU4ubGiEYnFmEO$p-!6x#F38BG7`9
zf}~^2gVT0`GZdVYnL_Tnf-}uS3W7o$Nl0^gL!i%KAw_7RRZOAUe!*qtp=IYGHHD$g
zt|4`<q3wkNjlH3r3SnV8p&dbCEOcRCdc%gy1A9J&jcIcX?1W93hZ~`Vj~9lgNQKYr
zgfAER&A}xubLK^~2!&6m_|%Bj-m;0A5jxZ|@PoWWl~_!0`^y_~`!cLVA>yt<0InyA
ze}ebpK#=#AwWfw&k)`+$5V#QB?4=S%qmXf<-Z4eo2SrmLMG^J+!V?3ib5R&%GFa#c
zSLRam5>bSG(N?a}WV<oM)zPd;zCep8sji1KeNoJFn2&0)=!;@_m;>0aVx)sPXc6Kp
z6=JE2qJ(y%4g|5iS7PPK;%*h<o)<B5GsEIJKE(+H$I|UaAy6Ye@<T+~jnWAYe`XPH
zVL`8Lk-*vzFZnK3c{iT<3S&qj#%wO(B~zSbU*Z5H!L1Q&7cAw#9K$3NgYJg%SP_94
z{nLwv#E<An-KUA+ie5f$QhrIXq@z(7)QAXC2$<f9am@aaWJ!5fWU<W2*>95={E`gN
zk%(5Ju&$6ZuVRam{BkXl8;i&aEmDH&lOIhc2cRQRN1;Ap#;Bc3Sq(~P>Py{*r1bT@
zZx_ObxJhB5BZ(<S;c#L1qNjy7qz<8{kDjJ3?mEGFE(X)Ibp#}2YJ`*Cw2fWg2D0??
zIns6X4D{`2A_U}{#tc=mMEs77J0TeMZX?!%S5n7r86r#>7k!!AZ{yJCeSwMzrWP>{
zLRlze3A@2kXn-u9hD<C#wy$vpRkAg*5CUUJHj;W)Rd6=rE5vns1Oy2r$qNKVrEKBL
zEE+&IoqLYhe3(#i4rYJO6Q$f1v|LHyjGsIgc_^IcTKUCu<?rOG^`~kG=jm7mKex<l
z49<H6$Pew!(|?t0NS^-|5cFCpKguHCd@uifVZK#=qRn;wd*PsE<^s1S(sz~xAFur#
ziVL3i{p7ixp%sFK<9_m7?kTPzg^?_zA^nB1<QWlwq9B%{xZ)xq*TTfT$fTyCtUaH!
zy`l}Y;_Q%OkV0`@6D+(SxwyjJqoluhe5bh5vLuMHq$WA6&b_47{as^mNk?x<n^Nih
z!%~QQXy>ca0f2Q+NNHJN=^#s4)K=+;aLAZ&*&M)h%CamusB9ikKKZ3=5fHpgUcP;;
zwXReiFl)E7S1uIfwBM9}d**O#S@F<Z3qoI^-_Kd(QUSLi3*&Wf=JWjCTOfp1UL>lP
zOH}FujCi9e@hD0X<|{G#IZ;`w$UeL)jJF~x$)V;$zALDr3$+m1s(R7?mQ=Z#b>Gt2
zxf&aT^uE8Em({4hOM%lWk6IVZH&7#GszvLqCHOV(%GX`Ys&@U6E+%WOsZuSeORd`1
z=a2Ggm6h|6p2OaK1Jv<~cuOkRS?yuVG>hvRp;t-#f#(|dY_tE_4x`?Iwcbg&{=L=j
zJl8<|$NhRZ&*e^G>5A}%>T8|p9=6q}^mS)LIGpFgXpDxdT*{5{@Cx?OM!3qAGSHZ|
z-<W~Xl*QVVqudmujBI6J6L?d2v;qhjK&ilJu3~MjQEslpAjJSTH<mPqJZpxdTJ6fs
z^(D=nq0KEAEj^(vaLS--prt#dW#nt~z(7mae#@v;YXxiTM02y7Q|lr{^HQhKd`dHe
zCTQtv>k2E%T4?je0McmlL#s+Oy^^MLD^l+&+cIPOwMN;`-1#yaGK3f~^81^1&pBGg
z?z~_Tn`&eG>tsr_K^v+9g$q_lilhh*B?U%ld;M7Z4J!?TNAd#|imMVzB9HcBFl2bO
z<B=XY;~*t7Cd7>w!W~A&;Q_%bZGS^Tk$ypmv_Sq`2})z#i8TnX&oq+^gTlovwgpPQ
zL2@OwPBk_%m9TcX14<<S&hk~oGv$t#x8%YLP=(TtXJM3@3tc8HT}CbBsvh0wsoifd
zzt}C1nx>Ll>V5Hsd?}9pGHU##Cc4K;rOO7hQ+}}9jIwu=rYBdj$5X{77_%q5lr*pf
zYOB`+p7_F0(&L=knNZp*tJmvu+r!S-mu_to*3w5z(jO7lAAkt!%N6Z&xn)oG=!*;c
zQmNO^;L#5UzaF>@)ZNlIw@_*h_7|}Y`qK137WzxZdbX;1N}~tYtNPnKD8FD184h-L
z>-A5I4ni>pCk818JjjPi2S0`N)M8SNFZ2bZ4zzj<??pprOM8z}hl*4>PZlVbRLEC6
zfZuQXB?g9fRYu0bx?%855lF`YxC4c11bv9~aByg3b?7n-c#S!>qc?=b-ZjB6YSl9Q
zaOf>X*(m7gAeGG+c6c8F)!15?@~c!J=Hb}3!zkSyWpJn+8SMnM%|wvH=!0+?Bv}y4
z5b%TbI0ySUdpJ;tioU3XM&aXxGCL_h6}{-;1R-={qXh<(dpcpoHK9^A<&!r_i6o_=
zPov&Sqnb9UYcs8XGbJ%T^>zrpoic5QHRHfO<Medqz0HhE_>5cG%!i?wkB2i}ShHaE
zS>LC#{x-9L;j_VIv!O$?;fJ%4SaZ?rbFok7;%(*<!{?I9=2C{{(hlb`u;#Pa=X0LU
z=h@5`gwGe1&6f<#mmSVmV12D(|623(Yn{#4`tYxfWnY_zzP28IZO2-GurG8zUHD?N
z&=bDUSGF)Pv@mqIFoLx>#=bc5baBdNaVC6mu59t^(Bk6Z;xg9KD*Mv^&vWfWV(&(C
z?8d6@#@p^DM(ie)@1_jzrXB5OVDDvd?B&1}NZY-Fh}r*l@LZfH$Z97K>`qW4PtYq)
zFh)+Wj!$rKPVqQT3Di!B>`qA{Psu7yDMn7Ij!!{2XEdB=bZTdh?9Lb?&zLLDSVzv-
zkIy)9&bc|ydDYJOBTxR{fPED{2O7Lkw|Obgryc#}6&_eu%1rNth<;p!K4Xs|S&uP=
zlu3f&YfJ0bdcCiKvZl!jZ&Lf-&^o*|^0v_Kw_s4QOl`8{b+$Hx<A)k{8H09Q)(&nS
z4i-ZWye}NHbes#p&bA}Y!ul?GPOjbtZh0eaV*c)qCLZ}FA4|qQN{4tlk9#TnPsy*p
zd0$DPK5+8u|2FSyIrqco{FK#v&%gqQgo5ss0`KI)j*z1FO-1Re#eV;N?CV=?5ZwFv
zE9@(!qIvv#b8K!)>_}_XL2GJF+r&;=c47OciuU;?$mkv<uLPPp39b9lnYGvTe=+uT
zI^B6N(|0w~aW>m?G&gWP*Eu-fIrnw>Y+-P6@nCUr^>T4we5wCpd2DKB=xSy7+v?=}
z`uY6E#PY`R_U6{j=Je9m?Aq4h&eqoVt@)d+*&jPgo4cpCyNhdki$C^OHxE`X4>op>
zH?NL&?oPH3PIs@*4o@zQZoi+M|2X@8_3ifRI}8Sc2N-BDggbOfh008bFB$=hUT<Yq
zXCN+}QmR5#_LopnUdx5vs+^ukYUvP4#p>L?SSGDvy}s(afkdv?{i%vI`9mp!PJ0V|
zH3cIX621T`rP{)=9EDgG{r=jbi30T;r8K3w;;9nt8q3B0x{{d+qs|a2<<F&aHRk`{
z!@jg-z0ep6sby{dh<&O56ZU29`xE=3C1GHR_Qe<b6ZVz!6Z^`+*F%{z@e?Ap*my5O
z4#&Ra&{j=x#Ag4FeZ5%CC6Jn}%p)-NTMhUV_7xAuzBqrwzQW<y*Oe52R|1ZG@#dbu
zv9G2768lm@gJWNBawP&K<}Wh;3Hy@z8}_y0C+UJ#_zU}zf@5D!zp$_TpV*fw9Q!)^
zg?*_Jp{^CPR<sdsV0fD?(B%Ck_T}<7?Cb1bu&=&9VqXjY9{UQW@cJ9}<?#>fD-=uY
zH|#6uKVV-k{u%pPfUl6v&;J?wdj1ppVx}?r4f|4sOKIMEms)?uzMB3D`=b8O*jFaj
zCE8zNUs8X-zIb=E!tqs0&oh3<zBqozz7~FAUtj+c`+~x;ucbd>UrfJYU-iFZU+!@1
zYxD2e7e|yjrGHGfFp|q3urHs#V_yx_)XaZ@eVzWVurJt8>`VGDu`kvCh<#=L!oI4(
z|Ac)R`M#QmV_&`hJM1gxKVe@lveXm*4fd7e>uvpCV_&?CJ9IgN;}1V>MYFb1MHrE6
zCQ~M^@;Uqg`x^Qi_T~3y?8_efckB!EpRunWaO`X3H|#6-U$8IU{{{ASC#fp-JN9My
zC+v&mC-(LEAJ|vKFYL>G1&)37{~PSf<saCW>c7Rl{7#S_&mKCV^i6>t&iozw(#QQf
z_GS2Qu&)A=xPM?@-+sfsuKtdFp=kI6Ng?R({(*hj{sH^4{~uys(s1mn5C%B!l_Bc?
z8}_C8XYA{_q+13TGD&|X9Q*S94f{fWbP|T)-qt7Dz`vuqT^Nr9kQP~hV_!o5f_<s~
z!oFJnfPH<z6oO-4UU2N|?w_%*>;FCWwf7tLg+?`wp%G(2$iClOFSlhA{o#0W30EAg
zlNsqW==f$$WA3l8FFhEwi(Kk|#J+BRVqc*m4S$J!E&Kud>cq1B1NLPv`4`xi*k58_
z0)NE5R;Y?sLRpyhuz7!CUmCx#ujij082bMM`}*)Z_Eq<H>`T29qgb7fgOUj-_7nSp
z_`?sxXn3@wiCb1E^*9wt@`4mpT#Ek*`?|=)H1)}aN#=9TvdqG<ubn?(Ux{$+%U=5L
z*w^+i?91pE_T}^^>}&lW*q1RJ`-(*liux<;>*P1=OX@GNFFF*lKVe@=D-Z8Zkd*!f
z`_g*AOJcfKsffM#{@z;&m&pE`l%g1&!jUh|fF>?BlOw&0{U5O}um6mFz55;eGW##F
zFX)56#=fS1VP7=AV_yZourKXDU|&)HjC~pX0sH!a>h)h@UqAj0_Vw(+&L!$&`hQ?w
zW`Bi!adQ2_zKnjyzFz;tzIdaMy?$a}(!XP0QOLZ%V_#BS$W9lixkku?G5-VXi__>&
z*jM5&>}v%@?sx1<Zw2F$OFwPxKVe^Dzp$_863ibhgqznee0^!cx*WT-n4CM=NY4^8
z6`AWtY2~yNk??TFwe%itCVch<WX!$%&XD*{2N#nJT*oW8?`y0X^B35c*b2(?sQ(AC
zFO!Gc)M5xoSd_^~-v0*s68mprUo`(M?8|HA7xtz8@ZB%$OYd*k7w*5uzV!Z#ec}Eq
z_T~L|>}%>L_Qh#rCx`p6&FEjTFDW?oW%)bywemamwek!5qWy_|asG~dJ+D+U`#*zy
z;XWMN{SEu#v}ZN@A7EdbKe4Yjzhhr6-Zi{%><fT~?M$Z6gu7fBjY5NE6!_*!maU@F
zxsZ$dzl(h({a4r*%L5sTykqqT4oYPI2XS}(7v;LQ4}XRnnxT>IZloKeI}`*dNhJjp
z5M*ZP?nWe~6zPx}I;2aG5D<|L2?4?R4!FX#_gZVOec$)<dVab7g6lkA*Lj`C=Xk&A
zjcB2lI-U9*`{MgQ!M?IF;Di`<06CZPrpNz=ec92YKmHr+OW}{$7atP)GX0-oUp|=J
z?@_~%*cU%4V&f9~QjZPc{XfON!Y%&+_O*0{eU1H!eO<$l{uk^^1c`m!MCYUbJM4?^
zSL_S&r`T8a@7NdLzhPf4a{o2<CG;Eib?;Z~i~oOuecfBc(BZtozT#1}{|DHY_CLeE
zj7G-J(kCn~#_GP3A1IPCZV=w4CU(C=x-I_B9*?@6n7#_0o7;iU`ES^l^gqVFc>lk}
zzUcoG_T_Vlec9^%HTFgNJN9L}_m8kI<?<&+{CC<*u1Bty!r#9f_Ax4=$Mbb6mHu8@
zXZca=J6_+LmnZ@ReE$&pQuzni7sG#vecgkjXAB9`t~?C52QgEWL0Ka}D?+pSYwSzp
zXY9-4zr?;CV#59c`!f3p`+EE<_GSAk_Qm`6*w+$<)fM(7^nZqZEuq=|5&N=&qZ7fR
znvi*qr~Ap{|B8KC{WbO_L~o;gg?;h<5&JS5$vQKK@Gx`mI$mO5LRZ+A2t@Mn;=f^E
z)>qiqUDU@vVPE3^3Hvfaj1Zum5*nhUis60Rl6MX7OC_@MIHAA59i8VHU8i5_xjD=*
zI846xfhb<HPmhRYWtV#ri}3MZVP6sw9CN<o-CcB?3<`h5zTW@Ov9F+ifPEQZWj=PZ
z>I@_0vzwdVzZ*uv(0E6D=8Nq>+I81eYT|qLub<1uu-<upxL(iU^E3A4`vd#BnYQiv
zJNDK353w&`IuiSGV*5OBiG9_id1(KJeW9*UZyTDvZvJW>;o9<UgKAhd1V9oi_X*#3
zQ2JygZ&(H-dAO%YXsf?VO{5{buS8-XTp?SJPxU{;zBY6I68kFo75f_ffqii<S9vH)
z9j%lM%K`@zv=K^B1(u-ygni{*VqdwJ*q89XU|(JT9rne!=l<8&7b(@;5A3TD*FW+v
zu`l<($G&cc@(2EoeF-74ufesSu&?L;KVV;bv}@Uaf_(}9hJ8I|BxXZmUt~gp0{?=2
zHUEZv6<=Xr?|;F*FqBS0OL-dqGxp_kiGAJp-(z2|a6Ny*zStFiU|%pK_SH?Z^8@=*
zxWvBpk=Pd_?)*0-_67a}_67QZefj(e_7zK+`Jb?_NJ0z?ir=v>F(mfog~Y!0VO3aG
z7;#1ITpLR`442p!e>?I=NRaFK61wdr_5}~(F<P>Vrw(@#neM&L66)t<h$jpP8<2I(
zBN^e=hZP~ZtL^lw496x`qhIz3IUWDNzI=XQU&da&JWg`4oKBSqU0!W1{g>DmGwuS>
zCH5u9)*DYxz}-vtW#tO{GW%2P%jgRGl9A(g$)&L+5*Aa}C-F0MV!TnjO^>CQ)r5+p
zCl;dkuh`c|eArLe7cy~Twixr@Vqe*zsAR!Qv8JG3v9E}K!@hd{JM631ExJ(zjjqQd
zfU1)%kQ{`>zOWQYQ<sBD>gBGmugpCp_H`Xos6GgZeZ~A8_Jv8wX`LL{*+F-*rt<gL
zS2hy+Y9IL>`vU(N_LY2zeN7YGk?0C-xWvBh{)T;R{WbO__Y?L-Os$FR%s`W)GT{7y
zeW4?<FYMp3uf>0keM$W-_C@jw_Qn1K`=UT)fcZuf62tz8eeqK-{)Byj{}TH`!LOF-
z5kCKceL0q2VP699KgGV_zhGZmnAm@fed+u)_GR+}`$|OtTmt|BaOf}C7mPlW>7QX=
zFyv+HFW8s2TrQWA9{`==H|$IP3j2DXP~`B5$KQJ(;1c_i`)Al!x!cEX1o~1qg8mBo
znzsbNWiS&o{tf#Q{TcgGLSkP~Mv{MyeJ%a3v9Hkoh<!n>urEwXb_j{QC{Y@0p+f=?
z%1`?T?5j#xEaYFYuSF>SKrMb#IR-m`wp{c9RZH}fhT1B)02la#3EaTc!jXXiPz@xH
zlm{%z0T!i*abZA9xC<v-)BxQ`RSwaaDkU`c{AHd9QCKtasWcHZm<$BLm6A5*sv<n;
zAUr82ERrJ;kY5l2JL|S9Wx_l_=zw~F95vLHUgDY*CcYQI-2pJ85vRx$_d!xZj2)cv
zM8e*qvziHG5ETN>u6ZC7hlzt?JSXj0+U}7JIAv;n;Gv{?uBc`PCGizLi9<d+lob>u
z!Z1PM;bKJ`BDlDs%*v<hLe@fH>{JNx5(Je#&SeBp&m|qr1dd?>iva+xLUC*W0IQ7*
zPzp>U1*YYPuuuT-$1wo)FcOm%CW9LQ!eEN^&b%imKFrcqq0R1@-SGj}o!J}aBaqS;
z^dWQHmGsqM>ZE{>%~p9L45sY;P5J^lD6w8jUv98pq_6wRaIfyTAJW&l+@<t&7{I_B
z%;g49=5D4M33~7^(pOQr$H;HeS1nTd%E9d-?o_{&zVd!ZUl_94YP4Q}J9}5s*XHli
zS9$fnNngglN?)5Alnwna(JrMgB-nBj_iY9DmGl+xyYv+q*(br-Cz|t%^p)b-jgEFD
zeF^;}eK}l7UtX8e*DEP>#5_{^!U+OF-T=LRmA*`o(wD?9(icDQhxGL<^Dm??-Jhf{
zwO^$#NB~z8;8OZZ&@L+dMfwuhlkG)HUv~#b{#E)4LrPy0zI~H6SJIakEaw;L3;k01
zV*gqC3igZy6I)8qcn6aprLUsVp&!y0;8OYmN5xV6kiK#*r7zYi>5J}Ygn;Nb=_~Yy
z^u-Mt$NPknT0Mq@z7Tb&5T^w2_`TxW@Ib2aR{wxtBETi~B}~e|Js3}``vd#JWZA=%
zNJU~_!P4voeVbR<m*o}q#rZ4tRTMz(H^KGr7wju(3+o5=CG>CD7ccuy*cbgJ_9gUp
z*cXw)&)ApWuh^FWumXvFN$Fo=U)g=U`$+5yfW*Eykl0s7w|OiQ`+`u>W60LS%A_#G
z>R~jmF0n7lKVV;UVt>HCniNOkudpxpCH57K#J>1-!S|5M?;V#IBzzEZ9SaI9Y5*Hl
zzM35@e0eE-A(Z|geZBfs`Vw@;dhx6DmH#i&m);ELZ_<~($%9Fx^hHdW{TI>~1ycG7
z`5}FkTuNWTv~Ec03rpfk`bti`-IV>S^cDMy^o9PD^i?|e@6s1QjQ@A(3kiK8D2@ON
zNa-u@4pH2t^i}@w7wHSU9aOQ6zK;Hr^!4OY`r^8hz8G(S#V(~UpxBl4HH(zKDEhg6
zlD_gL)h?y4MWpm4`a}A9hLpZcG-!X7zFKN57J?x2k|B&BfC9G}jo$n5`hc#eu)?k|
z%>=XN>^YUAie!%&$55>z8~`8|_&h=)jHz>6I_?z@*j8&E)ffVo3?bbcD$3J#)(tLU
zngN#gnCk*&&Kq#NBu)b%D2q)i7m{JbmbLkiG&~4b89F}bJrE#GT|Iq%&D1s)3J?P@
zw^$+`3u}jQL6UBWbGiWVpVXsdHzd6Zf}29JkE}0v;z-IGp3hE^tXpkz&%z@hA~XR&
zehBd%F`M061ITdF9SA@dAoWz0$OIWeUc|*P5?xw^EvECbfDDUX?W6@+FLLOQgs_$H
z96w+b*RyrEw1s&Ez30@5k43W_2@~^<SS{ftS}>rgMeW@RB#B0zjG@3iNKF&qzE}`y
ztkuf`tI4D|3<`iU2`1U*(sTw!>=7!lv8g6I0Qaz>b^=|&(ppCtz)ogD)F4KA5-e=_
zmT}q|brFE?^#NF8%{PSsJZ_rb3VJFNayn?p-XZyV_ASus4dw`jyRIPZUO?=Pc0^Kh
zW5cE#_558TEOa2oeBkvs<`r!shCmK;sM^X><PC^!AONTgd4p#XMZ4$-Z}K>?JDpge
z7+vhNRF2=Xfw7}%hO;PMhnctq$P$)N(%%z>hma7W=og__90dukT`RD=S9pvmPl#ez
zkDAGdCCDz8VVtP!7}5R!X5akMLfL=-zKjk+xj*u@g|ta!6(CU7X3rXjWX>FALPU8M
z(u^QfBlWZ{8gz}YHjf$j+wKZ26;ByVknZP4cJ}tl0HUzZwbZ606%bzDI9f6_O}ij`
zG>LR3P1-|vt@H@6zEPS=1#3^>!wpjj+F4+1uLpeX{K4W*5;%U_&>G&2P?4&{nuefI
zpeAK~h@D(A2Q{L`T9Wk1Xw<G#EZd9&Fb+7evW{7lkOgjXXfu#pP4*4Ry-?R_^n&C9
z9T2Bd>;?(_uH+s|&S~JQ+E5Sr0LsQN9cTot1EvM*&CfFOQX=AzV1P9RpqLth%YT;$
zYU-eThp5=f8BL9tG5|AH44poh_V^A61du&xn2msdR9h-&K2%V(KYFy~5o-Nxu9C0J
zsj{Yh0AB{EY;!4necS_yA*C+~Ne86#1p(?-Mji$LAdq`m-JSSSpzQsJ`ObDi&}=F|
zoFSMdc|C)8QDhQ>G}JjsMy1`r#3~hoGFu!d8z+vwav=joWa8r*g~EDYfwEjeNKViU
z<$|o)gCBnhk=@(Dzqw)3UVOj`lKzVMbt<^fI_hh%>uF2ao%JLO0g&lJxOXoUG#F@w
zooofpt2!RB-?P>%dLy8^1EAZ(l>?xa2iq6DK})eKi!yR2T)l?d$WpYYEDS+S4Q|wE
z>bG$Mv&Gr>%3w*U5Q*+j??|0EY0$i=A?kACV~wlnlpNU%L@|cM?*v8T?^C~%p+&4-
zyqX1rB!xGZlAc)*6NfnFZ)=D0JFgw0vQK;L37GB<#LI*{7g8r04OS+!Okxd&Z=xk>
zp|KKUicLEt-~p)k4p^Z(qY$3!A5xy}EYiA>_!43wW{g8jRiOq;>qinqUs*$CT2G{J
zZMd>yM9GDnWVxnKCqG<Ec4Y`v9eGu@7sNRd^2iI_uL#DEo#Nh>qhUW{4uW9pLCU!S
zaTspEn9Y*$r6Qrl(!s_M?nd-bKyc&IIW`2HP$)ehfYuy<4QeX&I7TVA*UZ{RVF!Tf
zA$u%=u{XrO1TF(104xZaEvN~T9Z>YK!9!ON1cIWD^f%rI%nhzZUSE8J3Bja*Vo^Y#
zY+&kl?zB3A@G1x{Xy&%VEGk7)(I&bW$i!9|pfJ(bgxcbjiDbd_`))QOBSV5K09vne
z)be1b>p<!gfRvHr{ZtHBgBh;gM(`p4VM5msO=9`*!>$l!q!s%W_EnEcUJkUDpQG(X
zVqd&WNbIZM;}ZL-gg!kv&=E_LHQu<yz9@ddzIvK}U|-2s*cXMyJJ(C>E91|wuhjpD
zeZh<a1Fo>IrJt}b!Yk}+@lUa@#h<Y+dBAks@7NdQckHVHiG7iHul+OZi#;b(dHfRl
zg8u{T>-Z1YSJD;sC3uN_ttx+TV!Oh=USDEg?SG4Xt^SIA-S}T&U-}`xU|%PHhJ7hs
zVqfEmr0VQHu&;bVD-a?l28n%HUt(YD-K=JRgME$uE%rtAPq44Mnv4H}eX0G1edQyu
zFSS3zzO+dHfPFoq;;X;JzDWK7_Vwlp`?~WJ_9cCVeck*s?8^{|eLemo_7$X5fyBN*
zf5g7V{uTSWMt_BUsjCv3lU`w8>G6YEzhGZ;ZNFh(`pTEs*ASh{74}un5L)Ozx2$~K
z>No7m{R;c4&p~2e!B^Oqeist^^62@2ec6s&VP8bQU|)7WV_!{|*jEOXg3XvV<#!4z
zR?1y&g1V}@^#c^nF_26IVa5DtuMi)1)xd(wq1>l|_f7m7%<l`}U1vsfh|CNg<25>T
z#Kl*FZ5K2KG{ZRtO<Pa^Utl?|zuOZ2`&4w9jW{@Zcn_A*bP%!mQUp1L6`6SU;*o-C
z<~ze}FIMiT2JNDDk`lN30vc`ON@7`Gl)@;Lh;s^xR&Zv#oSy6xs$j3h3gq=+fKktt
zun*&458a?7X%w@M_T({iZFHV+#0JZzzED!i&c!a$r{hdqC1BGnr{Lo^q7-%rSPqnT
z6Z8G(Y(0hQP+cB<iG5j2p?+$s2z3qDXJDLC5no~=mgYx!q{|Sfqx9PIvD+;t#(m70
z`nIP<a_BN<y0p$tDB%<0Dx~gtcv@#nL@o|0*fQ>Y&8Htp)ysiRh+c{e;V#yImQ+d)
zbAjGF-FEk+*{x{9-c?%qIHz_>P2;#XNDlR}25VMgl6m!2Jv-{ac(SR2uU{_bPOU<v
zc8JMYzeupvw5;)cL|Imt5<}ZZQ2Ru+O*A|X#(yN2a^glqMj2Wnpg%$`4Od~-&z3iP
zp_d+z*)ySUi6J+Dat+__Pq8obZdNJIu^-r1v6_7NSkfi-b$y+6VDFmk#!hn0ero1z
zAa;PrI+X$;N|H@N*j`N~rri8zDToBB&U_n&xEqR$d3m3fQ?9<hDwGfn{DR|%9@ADI
zrWdvNMxaG5^Fq~}qJ$rTlOfm>B^C4$$AanIKf}I0m6|^8nVJ#vP@8;mKVgrdTR>SP
z_+T+pMkJ#|cc+vtCo-yVZ#0G$LRi(5*~2ZU7j!gQ`y2MPGllUw4e0vh+che*x-0DK
z;WyZdU|mB)5|{fk4bu-V;OJw`ypOya=e8b*){hMGK72JhzrT}=zipPX-JcyLxaCHh
z7JJ9*&|Ly^;me~TlRKN%29n>p?P!8ZF&>w>E51`M_SO<&=ky^Ark#Vr@iAs_fcsf1
zclO(+6dbUhay+-WZEVqkw)#YD&WaT=_{heEJwPTBBFE(W65A@ao2#Uv4SzM8g2>R)
z$!@F7b}bJxw7v^R>05>Z?%mF<Vr5(J83O0bsa|dKBw_P|=aaf(&t1(hwY~){(W;7d
z3N=4SKCSu0Tc_Nqb2H|``W7DVTsuZZaXSx$UD@Jgg_KKTf$Z8qcg+h336|X_5A4wu
zA>ub9!9%wa4ft&*483E|0M(s>`_}|ZgWEqhFXTD0u9N6WTu+t}_JLQ0={TUe;@_<h
z{j8~b=ZjEJ>C+noykX%LGWG;Zfa_&Q?8|8IZj5$zp5rxXRo|^xyD)R%Jd3-w)I{Ix
zdtOvlK5nMbOGqCaR0#ZH2LWvnK0!>@Y<(_yw~zAf6;od$FsLj4)y~5zN$KVx{&JOs
zCQfdu=xzR(imzflHn-|yz6PfYAJXiOfg0yqmK3&2q6nA<#_{groZ#4%--InRy!3t{
zCKkpOXzvt48P6})i^RTW2kzQ@!;ef;84~hKi4^X8S=ayWV28HaSC}v6)I)Xlnf%um
z_F@R}5%*?W!skq%8aoANf?W>y4v5zE4Bj|IBKw!Dpq~v|C8jLCSw*PMkH&tVN!1(j
zG`EvjZ`tx3?a6vrM5-Wm-(PZ$;LTAPLF2URtZ;!Xr%0BF>0__f&;>r4uR%5K&H>2o
zg<W3T8mhw&jZc;mad@?QHu1j@AmV(NFG#BgJX#KLW<6V_{j=`w3LNGZ;;-lV`8-`>
zN-y=7-clp2>TQ`^fBU3vz;fY`pRM`uFxsz$7w3G5Sa!{}l~&=&;^M~-S@`{YPivX=
zY}O1~&$f1+fCig2wwOMgy{qifZsz;GPn`Z`r6=liIOf2kQ~qM-3j6YRYIyqnxD_$%
z<m!L%@%g;Fm<j?t8&HOGFlYh9&o0X`EfL1C>*_e9r$=*nK0ibE^#*+zUPq6!I&%J3
zrz?Q?5dP3O8x*X2)@OkgO`jtjwndXFJPIt$p~ppHU)>gy&f$Zd%97Q|BEG29SZzbq
z9c)gpF$YD~xnW#dtC~H;^K%XcqDRIIPGJS9Q6dhgG+PE)QA1Q5;300s5A~y5Yl;*j
zw~3<}im5Hn(-<g;QaP((7!t$cCJbV6`1nT<A~Rz0MGdJ?gKIlE1%}z@rwnw~WY-5G
zN*qwBb79oSaa5rlpB5D<9W3aTm%TIT&-JWZ_!Gue8C|NgN(MS;#Gt}+Fg{;Y^2D~4
zrcpM}KDN+YDls7YJx1<s>xs~ggKdnHUTbFnVW|^rvKh>`ygYjt5c>?1xkTLouSXyr
zo47>flc$P+#Ejq=4$oP)&`u6Bh=||rqt*<dC8vj{M1}EDPh!1X+M=@9n0!Fe(z{n7
zR4V`uy&lo-ZlOg)1b8hgZGfpc+p2bY(5VZ9Gq8=#GDOA(h1|`Oc~0J_FL=HlSfT`D
zD7kfQ2=yfB!wV3TApTttOP<K;TOLm)A44YBd^x`F-86|GokLfg999Ydxjq9OlKMR@
zhS2%Rj|IKV&E?FsBPPtTurC}${#`oPw@_rdVw~2Pb<|^OFWTNmF7e08ljyFvEZ+4w
z1c<J7i@(U*anf{-%u{o*sr6iOI=?HoY77()5s7W*O_UE1XJ(XJk!Q8xkY;Z3il%C!
zcUeOvbnK9z?%^g;Opk@hzJXHB!DOnVEonp6v+<J?ZHzBvs88m{sGHOC67@jxL^Z4M
z4y!5U>%NEq)&WKPvkv=v9X-D7Qn7Yq&+Hu4160D97>n9yEJHMgg2k$BH*ECecW`CS
zp$`Lrat!%SF9V2u+a<ih!6yo)8=u(d6<EFSU2$#XH$E|UDYH7DdOpZ@BPuL}5X)_J
zNO0SGR4%#%uG+^J-h07%FWt_ka<yHoZCW#rC=kfWZp+my$6OuYMAD)ErchQh51eYt
z6V1S`1Qgi`)`H!=KZK#~gQ?8hr|N<^K8JDF=hGWVfh;!AzZr(7YjgsbapQarW-fT7
zimKPG9Lk8|hfN3!V{_*2=rxXAoNL3amtQ(TrST+;YDplBRUj2cK@}%N3yV=(aOgOP
zMsOn1Z+|lJ=nW<mi|$!tk2zy^h8uI#pe8MRPP$#pYqg%dT<8-TfOih%%U*FhPC-r{
zW4!9%@fx5D9G0>q<(!5~#IC(xR3vSJ5E{0PW)|t+?2ziyBnVw{1{CO?1rUO?rJ4Y8
z;_|u=#-FXOkDf5^oD@?5O0sv9lkM)M+`E^gu8AGkBgjq{aEGXrN0A~QKDbus<Xa*e
zSaN7NDvGv7vC|e{XYZaxe7l6j<PFrLoJGl;t;yKI5}(!l={*~5JGa}ccGq4|NfkL+
z=6Y?l9UdtQNZ~(-*0ME!;pBzC7HPn2nG>t;5VUOSJ5=~+t4LN=G2}b3Ok$sZ*7!j&
zq9hEZh{#GWFgU+z4sU3yJ>!iw>v@|b&j_0^1x46s;Bl$!`TbHGWanGB$bg)aFU<9x
z0htv`^SL}z+`43zw$lJy0$|gFq<Y?Oy7z8o3^GG*27D=ih`9kF>)l+_g(;l+9M_Ep
z77CrHi)0h;KQD87+wwAp1L$5BBMW-r71;CErTu;C%aJnF(J`BsU#tSgf}brHXPpIv
zJcWI6WDj9v3BQM#6P;8}#1Tcy5y|PeBfOrzfRcE;=DI?FSR<f}m8Z6pCpoupRlQyC
z2AWaKqh0I(6u?ATN|n_tsyB})kLKj`Wq5nm!RzTDs^HwjTd)$X&s^c)%<Zt0j<6A^
zPm?_d!rPU}#3Q-d^y|+QKX+rS@oqT@J4J&hc_`W>Z*Z^Pj39>hNz$mK3F;cH2jIL6
zAd1Bg-f?kCeJQ*4a-}Rywm$9cm*C>udrl)}_<NS6SsR0EFPFPh#RT|9$lh}+Wip%w
zyw|l&J%{Qok!-wx;JM9x9g<^)u#;(hT-w-5=Tu3{E`6g;0GVPN>JAQKeA)gT2f1=O
z?M6GXUv@Dv$sjkBPI+pQA{U$X#ubQcJ-kENiDF`N%|(xVJ7I~|r3O?w%A1zcf|APl
zyu5{TNVCjIbw{#mT&gQr*wfZ|1puK5S!yXx#~9s;c6rl{v5;AY|3QJU3lWSLv0EIe
zF53i<NRnqg+-qKaOEUs}_5xD4<zl+rQC!yXglC2l%(ua7I~qOc&b)gpNC@dtWEM6V
zE5jptrA5^f+`+I9x*zc60bd!G2`S5r1amw^z+PW}a5-n(rc@cWit~{I-&DHF#?u|o
zdu6iqE?I45Tj4Gwu07(O9d0)5$o;~*UJm8-HQ3mN<C#9^tFd*I%4)(2JkZd|d%4tX
z*jWpTQ$D{||7)pNud#JL8eQk03Dx<ypv*cThp#z?d8-86OGbhaG{%A&hsEIZI*z`O
z6Z|;FPkvBb^tzZHj5*jL_*LV&O~RD*XhzmLcA*?|lbqB*0Juqx^Ayn`r8?=fBG^;I
z>83Tz^A%1br0Ydk0UioIMIl}17Fb6UKI83>j@ZR)|02U=HgyC+|0LI4^o4@S9UBLV
zMf{F|%YvHkffKGf_*)0~ZWuG4JF#p9%R84uw@S8K<!WC8h+E60MiZo?CNT{TYiwew
zc7h*J_r!<y;HGBCFsDtX-Fz_7t@}|~7P3-fyyCp2Sz$h8kJt0)7$f6TcT1q4?WD31
zll$tcj)D?F1-f{Zx53=A0G{2-FO<UT<&}%{RZe<r0y=E9GjNeYIixi7qFmTpl~j~U
z-u<u=3B}w>`beX6z_EPDtEHA?7DoMfX#Khl#WY-2MNRA|m~R9TBh6X+_2KnNq8`1w
z+VMOOTVszmCol{=MDQQ>JIR%<Ep;fV^nKz_Fql=A?ySA{8Hs&8n(O0p*0qIwsdYnQ
zUzpEa$Ca_k>mDGnubAn_f`uOaDdZe@vNF$&Ikg^$);&UEU#;MR+Z!~!%o{6dcw06)
z*6cecu5OP-pCGZXfU4mKP~p@vk$Ou1_Cnt=dy`gCe<b#$p`rNJz`bc*5?WI9eqg!e
zt3MwS`|`>Z_PlN=Z{*xQAj~s5RRNQ%4@P2NOe%`^JA8*Bc$RwKf_J$jBTXOIha<7C
zyARc;y0z=-BmWlrYKWr~k7sL$M`B;14GFU1i7E|=I^s#U8j>u;lkFRlU6I&VLyEt6
zYDhzBjCh)Xh0p_)dnpa+uf=E1+X$xN6B1FvU&)Wo0vJKG8J`=n_%x;9;*Y)7xlMAI
zcg1ta-_#sNQO&JNop}4FjnR<wd>Dal_NItfI!T?Ntf^mT<X#>U=4QegiW!9pbLZxy
zyeU=*8_!+GUHqKOr6mOd(u|~u&7mkGpkVGJTwLAkp*OkV!vy6zvh*;##5OjxBiw;0
z0z)9)bBQX^Zywbwk6ubh3HdM^0w1B3bfksL40qse4YEyihz&xj&P&HKhunMDabLb;
zlZvaVLo_yi3$BcKU0vtnB(^U$0}-={4O>un?wTwU+UVreKFaKV2rHIJY{UI{+Q@g_
zhyc<IC{haZHh)uON^O%eED>uWclr!R5%O_5Z>(xkpfJv7#^lUQk-z>@vg5VX+xr~^
z0}uut!n)6L0jG(zOW&l#pm<I2Y0dK<;)9~{D#8`Wx}0A2D!i>w%B)gqysl9O_cq-J
zVt9u~WSwH9sPt6TIZdZM0r!(Bf9dJQjEBL}Gbzn8&!yiNHop&O_ypI=d@Vf}aVlyE
zB_1(<ER15))4Y)4E$i^&oomn1R`cTPhNTTu4hl!7!ww$dEtFG~Nbw=LbZzFqo6JfI
z(kh6j9h`%_^a@Oxi;MnG6RFDRi`uv#D$HDsR3}BR@;=gWOOWUHv9Y&YW6s~~c-pSs
z2G?d=+x?!P!!9!oq4(5d9q7OWl9U8KmXhk=ZsM3#k3Ydy7%7xHK;24kQ9y}!uKuOv
zxNbJE40STQoplRVdKN%WjhF`Am2&lvP=9cCYpcV$NB+??ftrQ@A)9NH0yFdR@osCG
zmO~7%lgoFzI_wE}I3-H<`;PCIuWkzwA<uWDlt{30mHbIQHXGM*t8|6@jD1m`auUg;
z2suVK6{woM_1Zj}JUk_K(9KZ{BfIWH;;3JsktXu+jO3nSu|e_88lUTkPtRzLR!<uX
z0yUCuU9^Liz7*mrhETGFD^=H6bk<(Xfr^)vnQs=n7o6`4+?}e-+SgtBxJho&tm;`^
z^W=m_KR>g`<wkt4>g?FlNs*uiChh01RqJeqG9KztEvmNIoXs{BkMg*`_08!|G;wvA
zZ}k3pd_m>qw$u?uE^6+%@a7@Gw^!q}Wu7&UPTmaNzi?}i-5}WH==mNiA>%$gZz;7?
zX^}MfTEWBpyjV}_sAbw-pOINJZN*6N#si_@F#bs0+;E*ky^Ul+!iJ9o&bsbQ#1gve
zpNS>R(>_u8<u@?Jmo@3{5hy)6?ZA@nKiF#`F*1wmBD>=Y?xwKK)Z;@qmt^Nfa#H8*
z=Wv#!7I68M$Q5L9hO6!Nl<m!|RF&!KF(&Bvj3|ei&N(p0x5lT3ba>yE?<A*I(?gB(
z5_D%waP`UMm+`OP+SA|yn_!YEJy-@0OC8N649i@cClq_@u4reV0t<>8Z1clZh93^S
zv=%q4Kgq{crg?~>@4w;16VEA9;Y`ES+0c=qQ>|2zF6pxWnN-Q#y#vosq@f_o+nggH
z!svQb;Hcp(=OZ#DyM6m)<sB)K8Jna#$uoA(@H`VV)!%Go*r(Beo<Gd2FQD@+=>?Md
zl}{#{a(!N3Pv+Fu&<cCF!`?ly8F}r9*s<R&FO~3}qdkp$0?w!!!u%rVow+FN&Jo$&
zS9emEf@z*oST`3{4N3SPstqanooKlv;OC5MQ)kf<J<eK(-~T)pYGKBvLbrRaWaw{v
zToInRQmPO(LFnF&#oOulHO5+XMrk4Ua3)ZW7j4vzQnV!1Fk`5lqOy?ft?}wwKDzic
zSD)ecYg?Dtmz62_lqo^hJdMp5Kd13iOmKdmQdEm>T2G3s#6+23Bj3{-yY{`>?zHZm
z@^R4yII_O^-q;%)rrk+fDsu(6-!MKsJ!4qQ@c4ZCB73UxjtX5=&FBlTB-e|w!nQm9
zG{@7n2rX&}6ho9L6YTTOsC&N9+t-{4!3uGj10$@o3m)nACy3?2*i}*;uzTLxOu$>_
z)~(}nJ0H>hk;${YF1qLEUmS@F<JjxUP{8u%-mB5JUao#wsyicl1dit>t3smNJ+j8y
zMFxn0&l!t&>N<mQ!NRJy<S=CjVPLcjF~R-tTTbod>V%!FhwfZn>zItAUsSGtscZc{
zs2Ir1eY4C(4;M|HFjydQ3D?nBky392hNPrf=lCP2dG1o0^#%&drL+_AD&o}<CW0fZ
z3akwkuN{>ykrW%>;4%kCs0e5Yq_g9_P0YcKn+_B{bdM;$u%fJ^NEVaP<8k(KC4-pU
zrTV;&#T)3ZVlwfO_H<fBcC7p%vjB-M`&Si3TB5ix!xaQ0<&3I|3{iYs;tDf|iJFEv
zQ9_z<I;;4Mn$A<f;4=qHy-r~1t$d}#0H>apL&PcM5<66rsGqK|FZ>(SaYf0az6_v)
zOy-ov>S>Rms%X{hTxQ!q1yWyk4SN~l^igUxS>zb6#Xz3td-h;H!BI^=_$KjNc!r3K
zyQqIPDruZ?MuyD(Ti2(InG@A79!}{ENgf68WfTPuxPY&_2n5+IRTxVy3-tP!VWgD_
zC+?+lXoXmJQROb8@s{uFM%>n+vL%GUj1REbMwSTt;h3E56pU0HMGOaPZ@FD6G9}XO
z^I5tgmBnwX7)j?Rh8o9;M9GD$liua9Q_Oh3irCMV98jRU*vqA=CoF4%7PH|tuNfvO
z5cos}5?g1t->eG{F^cRgF(kd;xhD|8-?Z#@R0<PLhK5Hzg+)Cc!AM{3mtq@Gu;KIT
zHT`&ds!C9s3Py2Lc3>@2cCB1}QVxwHxe|Xi2>94@uPat2C)nENkf5j@l{3FBD59Q0
zNS|iY!T&+zb=@|cQg}C2Q7pQYp*3kzY{yN!r5JTDD7IHNx}*2zOVOQitqi%qu2sFr
z^rZksN}h?*^PDKvM5w@)aEyBwbT0h-5%VTt@*}U$t+JZO)_V7x&Sds6h4hu|$h~h+
zJR%CyX;J`PFc^8XO_+WwL!-T2&`wqE{vIK-*G~7Ps7N-l?Y5$lVyiX9o*(60q26^N
z-fikI;S#xwm=>_`Ya*5fBDVPu-RX8uifP{`x${=uLCuF>ZcxlIn-_@n!zfnTS-+1^
zKl`Gs=*eCPa9xVX46SXGKki|ye}gThn?pdbu1HoyAFP6wT0``SlP%E9mbUni_xT9d
zqn$;x>s|yMXQ@F{??;<=Pjx_{C&7(PTg_zlCU%~XG5Fe^utezHE*^6YeM?_?i~5}O
zL+=zy`+ZC%w<)~WBN(U|Po|}AH`FP;Xh+Idj!5~c*R0@5zT(SlqdM~w%vZa}^%}AB
zjv?!@eFwZYQm;mRLD(ad41OC@jbQQ;G&%A>o=oT(m8r*i)jaC!seKJg>Gr*>^p*v1
zEKaP+%ncofajT<c4VUn%IPX%l?}hl?HkGdAKDyypVWcf(J^sC@`UTqsq33}$q3Ne;
zbvQ8EH#UFas~wgEydox~_ant<y-IV4LbMN^)CXk&G1*K(H?KsSMNGDk){td4|GkW5
zwl*)dlRK^tdOJAKzJ~PnT)@ZTm}8kJZTfb(VrIsc@l5!GooAXSHRuAcBlbG;UzZTQ
z8v3>@;;Keh#P8u|Y*pGceXrjy-tp0J6Z^|Md-`r!Hu3Ct#?2u<x^D78?}_|2S%FW~
zLdzVbvK56)n|q{_haS|m(!da3_|Zf<%Y#GE@>b33OGINeBi>gkkr;|~sNQ7oN(s#+
zAm#Z=7404)gKN!R>eb1V8X3}OA+ceY`bNLRoT$Kl2^<XPAw9%PEc0((<DisO3*`+_
z!9`iOxAf9K%Q^OyqTOkD*L<>A5w6?1RB|}Nck2~?G&e2^Rf#Q@crA8xNcnN;cMt~K
z%_U#|xd5_mF$}hHE8N>~RH|2n=&}wKvyBEH&ZghVeC?BuaL5j<0kk|luCvhF@_><j
zrRcjj@F$wOhDs*JK%vY?7u`n8dXL%XHIdZPg|hWo$?nFU&iYFi=0t6L+GW~UmsRXN
zfIAR%J?7gvkk$=KtYig8Xb;of<ja+^+Pvw?96EHq2<;n)K^*QfoIueWq14B_z{hUP
z<?<v-K<bI;^GEmT9H8VrF~rwK=+>-A#g-__<uM<}V3)d?XhLg>=&vonabEIG)MFFS
z4$&pL5WeB9ld@vT)kLe?Si+Sb2jJ2OJCnkriG`!Ki?Z3~VoMiw@%Qn+oX23V@Zm>r
zx7MrU(v}g{Z4hcP;xv>H(YCJ_E%xm|`|A5qFXRalb{GWROWF4rxCv3O6OIdS_hGn~
zA{njN=+XrO^d9_82aP`cn4=>2xx-E$QAHmuFP(NoX|z0A2p{2Y+3J+b`kGZKr@+yg
z)#337cE%{>kqr*wI^KQ}0FMrZ)**+e$cg#U&fGvWmKF+G`T$)!m|z00rd)o#2||bA
z4sIdXTFfDOfKR<sj;s;H83ET!xtG2N(>CQ0-K$_;-es8H|2E=G*bAJe9i<1yW77)I
ze|<~UABByJPjDtjo2ZR@o-?<%NSm8OpxH*fD?oD!-9-UY4FUS3Uf19P3EbXduK=kz
zzc6;i(Z6=byD3i_8aaNuV(l2(X9=X%{c>T(Pj<gzuiu@4c#ICk6)%5eFB+F1HwWKh
zjLvNn+$&EI1}2D#!xjV5hVFnj-SC>)a6j!*4ioX1G81{=?B3J3l(fzO1Q<C)cG0xf
zE;ZAys1bS!v`*1AQn4IwT}ykd2%X)wG@;jCyRM@cFk%^O-&UXxh{kpzWSJG9-7XWX
zsF=Sgk1sJ!W&HNs?f&X<8=z{0x)_dq1|d6-62Pq5Tv%jyG(_AJJKqT>zkmu$w+Z72
z0hh)&FQ9BuR-j^}q-9mx63%WAONPZ)cg`ThXCR)ZL!PnA;KoH!PqeMB&-D$;^%@&J
zhWku+jC(v@>aB;ES6pc&fGYa|<@Ie`ySIdoqUX1GS)yNV9lplT(8N6+r^47rHy{ug
zjio*CkUbrjWe}oZ@nB9Jz{Z}~p_q_&bSces2V5|G#~#I5j>4vek?B^Jo<rquCaAE7
zHxT{KB1t>Ay-;eO9dbPlMN&hGulH-SxWy{u!8nQI@x&M^3LFfcvfDd+YPo!D2d6~<
z@<prC9cR_L1TISL^?RGW1Fp5*<5Hy)>K>@l4IA{cRjUJ0<a=_Yb>T94%cKax&;4=d
zx$<;Xi?a5-a-_rr!xMC4o?0qMOsfrpQb7J=tQH-t_fZ5A(;E9eL5FfQhQzdpj%bbV
z6V-8^>c^jo2s7p_U7OL>UZ0@Q-CS7SRw`aZ(SRx8JS>Hk>0B&T0}P0u<C}@&6eqxS
zxg81^aK+P8T++GJH%=GtVed^NTC+`Bx3{Qqh6g80Hyu3$*W<Wk-HpIi1Sbsoh~h)_
zJfqt=j2gEDDC&iG$$;cHfs{Rm%saYd2RX!HJ9uYMo!JSxg+$se(!SnFGt;-g;zfcZ
zL&7B^imGfPT_Wave2XI^ov#|DL)mm=dL&-%bbCWMO2B!v<U8NscMgDcP4qaDM+UF)
zYp@@c9xs{EF)r-EiBn(J!ib5{`Dlybrw-R~I<tvhMOz#sVaq+3p8~MZ3G6*6{WABe
zv_4!-B}wFdDRUh7cA=3&$P_!$(~2f@6kqz-YsJ&pPZ6wx^t2pl1X<?zaRhgmCHI#^
zl8r8M_Ry-gE6Mt5r_2j<%=N5mITP=XC-pT!?rG&X7bi0tZ{9_B#XM~zM8pme29Dj=
z;ld#U9(2|cbnf9)W#dae<Woa&J-W%>FhymDW3g1TNtSb;Mn{t?@n+0Eo>I=?B3Vrl
z8TtETu#+3<;eD{v9<6XSQT08^U0o9dFGYPhQD~V$*wiD}TO31{gbqM*DS2MJ9HLwx
z_02Y1J>oUkGOZxKcT!!6HtdGcvbTGJx4@ohp{S3&HQkGM%wG~&PM}W$mVGitywi5h
zs&BD)Ezw1I9=N6W&DOCxd9ol$t^8zS<5GfLAY~Q(+1z8+U=O_NejN1}f6P>f4$9NU
z>Ru%V&7(SqDGK>s_6}|vCRHj7=L7<#sDb6!)!p0UoDPts2-L8aM$jY&YD`;oxN$V}
zW4DV2nobAZF(yfMnlMidzAqNIWCe3J4tbm!@?<*1pCUBCI5Z?RG@?HF1Q?cJeQanQ
zre;mo$<LBL9a@+g{wmbCA-pv_cg%&DrPGK?Kv%H~K(7Ydj;<S*s|+7Ej-m@S{s19U
zYQw1ntOQ#}7_~>JF;a^|$rs?*E##=<QOqwFcc)Tgal9Xe9_<Pqm8MQ%@4+!+atN9h
z!8>>~$xe8jp3)!aY5n#ohUjr{<q?ZZ;7<Cz7B6a1yby1B+T$hGNxX^ao&70*(f;*o
zLzaEf&^Ve?hD9+eyqOgL1{1>55BigYohP_kWqjYV_c*QS5S{c^CYxiOi?|Yr*wHz3
zW)WmB<rrRB;y1=es_fzcwxaj(siw94!|-W1o$;c9pOG)>%24XI3y3ZU|2}!@F6Hwh
zrPOzB@n7He7G>){BS7Nx%B|tMO3>X$rE@4lo9ef4%P7ADk0f3&(7Ck{rfyMmn;c9J
z*%t%I&gEk-fS;vw%|0wXU&=|uaSc95D=<B~aZLHy?LjL{mt-Ypk9Uv?KAfjg#&tS`
zO8%a}F`Z7v#8AtmmZEG-YAL$0EYl;pP*x(}edprrfk%KY?Q#VXjNjo-dTHZrvCt#d
zB{7^bbvtQ&{48VhMwj@iMO-)N+QKl7&1v;D9dqy&7(vc}b3T;8rEBiE)QiE7!|q(0
zF7bNa4YLZ;nt#U7|At`b+GnJ%)nr-PoL<Rg%2!rjvu6ok)85ODCOf~sdp>opsbOAf
z!j!g!Hxf-9%DbSMMkfVi!TZX9y?Y{Zt*?^4=3Karq;VYO(dr3se#I!9C!;>1QS?03
z8~p@BOQ9i&YFXX7KII8QclpUThBr}Eja8<Nbs3F~vyH7(O&z99JsC}JXPbtpn#WC>
z-(@t<&NhFbYWZl|@;RerbGBuds`bFM^=n4!x7k(%6&%$Jj+qI^nS&Ehw-KAQkt4r=
z=i2C~+nLPT*)rR?=GytFJA}+SL^C@i=Q?DmI}wUzohq4~8grdG)LjN<UAHp3Oy{~R
zsJri)b=&_l?8|nJChMFb%dG!GzCQ=)eVz9gO1;f#>Yr!muW5Q)H}|${jxIfivRi7P
zBXeL<YOuohZL4qp4E5VV>cI-Lp^tNev(y7$sfSOg``4+58l;A|eMi2{_2b+bxtMzk
zyg-6rBQ(;Z1kXk;q(++OXa<@nIiC%@qaNj<8NJ>-N`5gQ+B~l2H^y=?ib^w4)6_?&
zie~-{e4c}0eh2LyoQ?uIb%UPtoZ(#toNk2vT?PZq0~);Z9IOY@H2Mth5O@8iEas=&
zpG`e(e&<ayW&3REx%9h&XH$MO(~fth!{(>s?#wton|XaPRrTz>#r(Uz`S;H*=JKTH
zZ$M@P{H7h7r(>Q?CHT$EHcx%Hn5?-oKi)hyPxBrjz3_Q{cJpF#_s-nc=9zEJiw`dr
zi<_tE%+b!R=I~_RRY)%tHqTl})1(9E_Ae#{o_-Kr_<%{fJUahz-EV~|Yo0C(33<(O
zWPRY1`N%^1iRt_7{qG-d(63lzO=)G#KYqGqIzNe&#7^XBq9GVr-$4`d#980huglXE
zWnsYOXifl|wr!N<S?g_p&1Y5{#aZjmXg3OIH(zCK#8~1_$YXjgf~e(b5Y>yI9djhi
zMY8jKM<r+d^!qjqbT@{cJkx4#{V6`i2g>8D-Svf?ee+$+54)I%?T=4)HnVmQvi84y
z-`$nj!))Cnu%ID&zDsU#NQVFkTYQoHu)SoyLnC{@^n90%Zf{b4?^NcH%Kwnm|A3F~
z$jJZLr1i@~!11a1vAF*p6tUy+;lSBq-$VXT4Y3o0_>y3;%hP&d@chiN_0-k>6wl&o
z0Rp6H@zvk|ThNE2D%p*%SsODg+ml%v&9s{}S)0WRls3SvN%^f}+V9V^)`75KxoavD
zj=2m9fvrKfR1&@*f!xk860X}#p#pi`QPh$?=ODrS-Z*BBbg3{w7DRX8#_c!0SVAub
z(uD87ZweDC9C{}8<m?<vxM(CtDdL)RxG=|XAZLbzANKW<iDJXj+s)xejzT8tjXoFH
zA}^;aY~H3zN8F?tf9W*)#t%odY_7pG$3-hb^tJgzU!rhJXt&uglkmhKc!~RkIM~ws
zSgY4MdND`Fvxuol6p4MwzMHzhm8f1DMPgsaJ@Hi=lM3H*mp&>6zQ|I<rqjmtaKD=p
zV!;N620Pe3jK;5!i8d3W5Gh1rU-;5*JU<sFn6~a1EAc+8gm~z*!@8ZOwH(Aegad<O
zEH>^@DG%JDr}KDYL2Ku#jfvgnyMpum2pw0eyl{v?0uE3{(prddx@*G57#PIp8*ofq
z3AZkKJWYpDv`4g0*Ty{=qgAcLShITd9@3Z9n^+)2)`6gCvljtOD8&K6AVtU$F3xT0
zcH<|t495|m+bczCeobL=^c0ND1}kxu#d)ZBzUA2g;?be8o#c$F^(++Hw^tXe)BrP9
zsdp=T?J{_2M$y6_45`^ado)y#o8gmuG;LuC>W*TyEQg>(Yt|+XFlhO5tUMW_K4!eD
zUh8S0q5U1j(ZZ6%(M%AVw&J-&t9u6;&S8$+YV1}Uf1rfsmOXy*lcDfu_Kz3B@0Y#V
z2?tX(j$&`!^6L{!lUSV~G>Hs;kT=9vMB5Gvv}Ignrf|qcEcNE^f+;e@C(SoiA9r7T
zi4b4Ms&x=qq~zMH4qG4LEIRDF=G2@y(|^C^Z0GH+<IXvb8~hkQ($HeIVI>lT%4nk<
zJrK=^LPtoxQpU<S;I11l&wKhl*Mq{-y?fQTNG)mg@DT|6l?$a~Nwoe<$&1^emXvKG
zg+Z>Z61xK)!&=unRPmnTX?e<v(rp`9puGviz-Fgz%kSv!cE~ACowpkruy~NSZH3ha
z!KgA}>+I|h*jNm&u*}ZBE4X1JbP$ky2am1^M+AyOEPMj-{9yfQ%VQBnpnakkNyyVK
z7mkxy_#t|?^SagyiDZKKz_E?EW=dn?sYb@ECy1iq5W&9m@de!{P1>N>Lq415A|J`|
zygLQ8w`)JhXn!o+{qDu<6ai^xZz3QteC*H|?fa!arM?KHG!p&fux3-+_Xy4YV>lP~
z?O|zcMWH(1ljRtM$w9Je%+no4x6cfIGt3FNeqXMzuMaW)-_J4*o}Pb05WoQ&ul-TD
zvw^6pa8yn==urS2D&lKA<`5tBt7Nng?cK0I;WnC;&1_6r_M{u50H5^;T5xxqJii-@
zco;OjUB6yorCK+Dzj_GQqBoV|_MYHVq^K30-9e)eg>J5&gXf(}NQbg7Au7cnNJzv+
zh{V1O4^<D;L%VQUm84#ZgYb}|7B4+&P(=n}@Lm&0Ss>m$!p;!yT8Ef24{KRergz@8
z9{E6?@BL9IYD|JFy<I}b;OLsScbAWid*m0~sdY$zCncahRrLo9<-|a&iqIC>RRPK&
zerr4K+Aa;jF`|qu8^V2*{?0J{1RcQwJAHA5xr+FNtT`O+TWbA*VjYx)O14|P;u^P}
zeo3huV6paUNHbOEBg1m+W`2&PMS#8So7%}N=<u24+Qb*`$`b>OFgdODJ08?Cb1zKZ
zI7Yh$3;BHHw&&}CX+M1N`dNr?q4Dy1(?jK9B5(RaP;zLB%L~P<<xV?k)Qv&k<k;um
z(Hw50sp}rvmSc>*EV^;$b9kqbM_!F$FazR-rOs<=W`+v6Zi>=%z1F~LE~c7%HPQ63
zz?X&`JUr`auTDqPSPNe8%{$Oqhh$Xl9ll_R<WL<JG>rc486nT2p<j`zuWaU7Vz`|)
zqSU8X6kkbwu>>|ILRFu!oqUwOQi6<yl9antJiklB0v_0yd|h<i-HGPDNn`j_{(#X-
z=SgNfUx%S;SY(;sJg0f9gmKIJq(pzxMD3u;cW-Wb<QlztY5Vw7bYOMOt2-li&BMmD
z!1e8UXLDO(5>I-E@mZ?#&<h>iL*7?$2G!*IZEsss-O3-Cs;RYI5hMIE+;ePGSMcej
zz5QnX6xqA7R;^IQhZ%G4-`Aw2yefP6$rB;gcU&7-!JjW~!!Vc8i&D>MymP-XBX&3V
z9qY%V2yd+jb8yi+_HC`+C!$mzPRR;dKFybLr@U!7s!VD6N^}2dn}!9-x37<S0sP;H
zw#;W&_v7BZDi3<z5&WHZI{j{7x`=6Bv<-7U4wapK2mzKgI0DkiVz(D2OHCpZ=+(*d
zXkSb!vNx;OxQn}NpM6**6~40q6T0aXVG;h3WPG|uwxvP@{hWv~V!HRmAbk*D<R|U`
zWd|kOFEV(JSy^WM3>I=ZDem?I{0BAzjO-pz@=UwQslY)OnS<?R?$w@&nW5TmMWbFs
z?@41&OJ%wb(vO_%WXQ+({1?=+)il=z5sZpxB$Jf|d^F^|T(^Dlw-h8==xx$G*%*dr
z51)lCI_k<kniz^WOq0A=*X;?MED(9PZTV^=bL9P`xr<xIcv}edICE0OoN$>fUc#N(
zH+ixbDCI%Y#MX}+>JrL?U%ZamE^&A?GZyhIGEWQDL^uGWYxVfB_QW}jT4`=2OQfz@
zddn@Qac(tOw0=g*)wI<xW|!LIevPTCXAjkf9g(9J0#0K8CnSqF7-qF}`1|orvvasZ
zEO>{r@iNb1mzS%>x=)u=qCA>Xy_>{fcXIdRs>VOE4SV$(egDK$l2`of5T}D<NIhYb
z{}aD#&4A-he&C#M2YyWbXiQ67SjRacrkWT;aZ;|K-<me7iFhTFlf@r&+?1-->N8Q(
z^04xD?xqex!nH$tO3FBwTKjVVx0l&o+^yzqyXO*<lS9X)t$v;EY;P1|@lW9PO6#Ts
zc^3VdAuZ&zHO{mu%cEIp-Av~D(xOsnG&-mK{)wHBKG%PuLU{E?cpQY?^c+Qx@tGi&
z*-GE?{iL>jR?uO7cw1U>n?*g)c%kKE?FZ>}kKy}t&t;A}WzRPJV$N5%{7(m5TMlL=
z&X+Z0XM6lxj$X%HY~A<&hKKle*y`#FcJn`9;cGn|9zI_S@V_80lR5i9fH-;U|2@M<
z_S>$-ov-8mi1Xc6M4hYu2^++)0O60YhhT<6u*4n!#UOYTTIfX(Fgui375btJf*%Tv
zLxYm`LTT2Z#9mNJc9?!Ol+FRh77E)VhcWfSRt#VqNbHL}V6YCx;}Fn)028{xzBq3M
zh=KxNCIm>U2HtQ8ynY-YUla%v3RGDO)By!eCI)J#21$+w>V*cGfPxH+gYFdZ-6{&Q
zVh@(+4KjBKZa@jXi^RUxptfGYuEuPRy}=%;A)vKjx6lwa#*l}-A%5)s$TK;Vo$<+9
z$XekgtmO=mNr8l#(o6q<wdw;dVXYuzD1<#U<AgdeH0)E|C9I_ik#VL600>dXgf3w%
zA2)<#N_jZyUKstFU#3IEo8_>oUcVf%@PhjAVhZU}5Fo`tl9@idvM2((D6FnGGAAyg
zFV(L}HGFIwqqQi!XBxMr3a>pha>NVrb~<t?lx_KQ6o@^lB{ck9FLIn89}189bP`p=
z9(`cUI1GvzdK^9B5Y^Tjj)b*p0)V-_;a^Yu7gb|0!$^-+W8bF4j2c9(_r~;`;0)47
zqBg{y+sA^6;|y|Q$-{i{!Xyc>BI}tV3q#Q+RRKL~ao<wnsMh1PN8`A>pU`_tGI~c*
zl!yNUYgxt#Qu<$FU*1FlSc$PJ3AJ|<&Os=o@bFR)n#@d;O4w5cwZvN-2qI;*B-50{
znyN%*q^y;VImeEp-;lIxpJZH|Op}vjU;N;XIKG9qWGM(`mOUIPYuT+Qucjp5Ur*tZ
zkA8v`o+}oG-w<Poh4KT}iY`ili9hu_O-T?3J7cBIbw`jAqGmLtZJopt!PB0J<9mwZ
z&swI}9Hgcc`^BrJy;>(sE>3^Z9f86T+j$aO%@K}JO|MT#ukiMJxt`vJmC@2?pCbn7
z3Cl#W%+LwT>@oSp)*3wk^r&UdU}m<>q<45fn>PuWDSnpF_iRBe>mDd;X+7nmN!Dgs
z(C4tMd&OB>9M84avUa_b_Qju{&IBAeK35ETeukAT*o%06u^x}0%*OPAp{i$JbIb;9
zWK$Pq<M_nlon@0=gMvA84pei<`g1Tsb11JxQ@zh&>W}{d%4JgrGpgrumB3iTbNS8)
zIs0>kZa<~N&dXrW6E4XsUC$Nu$rFE*Cx7NEvXSQv%2x=_?^nscfgPffp0DHcM5907
zel1`3UV#-`fx$+Qkx#*$H~){ly9|qJZP>;?Fm%o^bj{F>fHVWl5Yml^grsx|DhlWj
z(v2b#(jg)xAR!10CEcJRQqm$SDk1P+SUc~%_kBP2^S=KN@3-}BeOlLX9mhJ)^M{cy
zDPZU+IHy_In^It-dBe^OFuoieqY5>P3*GpO+6W6hpJ#c?7F~HBcxf-!ucYYuo|#8a
zk>pAd#-;cyS8+&BaN4Ef*tEd$!eT@NZ!54&ebv8@S~amDJ6g;)W$j+>XCuRcd!%Uw
z@}KS%UG=}RNRroZlzm4PTugGm`gU<?R8X{SNoCZ1=FdiFPTgN2mJ?67QqN!NyQbZw
znayzNKDMOPQPQUKd5O}a(&4r9X6@(!&Fm+P{v#z1R<YXb`lS<^+2I_xnGFwKN2zMn
zl+5zy%$vC`t(EDYS6?kDqcYQ2Jaz9a|AVa04?ghcY$D1cNAd0GNWoea_^uU%(G|q^
zD@c1Q$k!_<Nh_fOl`ySJ8rMp?=t_qBl}x>rEbEo<=*pB9y~U3EU!Iq{4Iv})sswtg
zgx0H0kUkU@cz9Clp@i#0spy9?_aDmjK9pa7s7P9k7N{062fOJ%;P%f0U@hJkcslFV
zdZaZ50yVnp7HZZ<HD{u0&fc$K6tA&dudx!SIeovzuCay$T<aKJt1nP%-&-qu6TrS|
zU0(ptHD0cd^Z@nCy!LYMBmG`U{=7$KOib5@9|i0`Qijx>m8%m3J#uRyh^Z)77pRBi
zXeo-ioJGse7!`@sD`ZyI^Ci}&Y0=zThuwCi*-Wr;DRgBtrYTOBzQFBLDp&u|oJuLL
zK~~h|jtfnWD{S*=qXf>~d^w92=f(;-Sba22nSY~1(Bq=?hR$`Weyzq)CaNCNrW0&U
zXA&W+wJ_nE37PA#*|U$a_eG3tn&P+{pYA`Nztudj->_lcJSOl2;oU5q*mTA~V>%ip
zOkK~+AgVBT)byaSx$Z@?p}~`_`;BY+&EnoqHX9#5HEH=E(8}oDLdM*>)7T{2`s8fl
z6C_ZK322)3ZZ$Ay?UHLlxV61|LCeM5#Di=-p$!#`X%e=eVF`f2`&t<?VA3&d8>(16
zHmp!-n`dhqc?ON@7pzEWJ0-OJR3ELRHVm18J@Utnb<m=xsdU|%!AMsP!4}etj&n#F
zn$iv}w@ye<yD~GKJ~PblOS>#{hsonM3$j+1fOcQz&P!x;AI&>2KW+&O=nU$E*b8==
zw03&3cX@etpP1{s_N4{$xWiho?J6_f1nE-}H`d#N-9dd_H)2|iW4dR|=%Qm(4&=I$
zN}t*xk6P}Pwp>eW@ttcZd;IjF1vF*jsVPoJY-zXGG*v@Dk4tAy$(IH|`YN}et90wD
zF6|4+u&J_OWZCF#B<mUe()-xAH*uq{AgEzNlJUjkzE{l9?rG**i*$wBbVC{4UDJJ&
zUpj6wGpgP1pA{U`?jx9XV_b9_$kP_z6{MTjW}HC|;^>^-LJs5xFz&c9f>;J|`-i@e
z$bAXuBNrNm=?v4j57WgCGdvh(>K|r#GYlsmVG|nR&>7)!AK{4|;d?M5&_5#dX5<9<
zsHo8BNu5y%_fe_XQJDv$a{Z(7Z$=f#$IwD!$~t4J?qh1PV;T>}wED+%-i+yyj~fV$
z8|fU4pLQQV6FYwP!MJ(<xaFI1EAj~&p$R*kiSzCgj<FNY4<=myANEBTH^)#m$22g<
zvN;E*m}e87=g^(!@|fp|o98Q=7Z{iq+MGW@u^=kEa8h?c!ec=yZb7DOL2h6{ese*Q
zVi7I8sI0rF>anO6x2RFJs5P*tv$?28@!CN6wUO@Y(;lzS#JxUS_S$^lwdLk(D~cr>
z;UzoWrSl$3j)37@w&Xgn<i5G&NwMrLyzHa9e9>e1a@_KjvSt5)<-pD5>l7<N!Yd)V
zD>pn=!sAvV%T}TXR$@2*A@*hPU&X$3*Z=>ZZ2cs*O3gTbt!(`V#8&^mPi+0YuN7|S
z5m9q45_KW6$~Uq+B@zP=TW=#(Y@$`tVnP67>us#&vpBQ!@tOe%)prxZrxL836LkWT
z>SK~Jo+aD6-!#m<8MSrO#QXM{u-lKG-*$eSiYdMm|Kg6@#Waf>X|1=?3*V*NL}xTi
zXZl>dYy04C@@$q5P%oItzH}|eu`(y+eV%(rzWdGm=2!UvfU-6Jr^?p7|2<_Z=YL7r
z>KJS69a|U~d$BQw-5zTKl&z<e&49A?W~v8(w*F_z){FnAY^_gL*!AAkX{>$oqRwZ1
zroZvg+gB|iq;TEGb?+9slLf2>9@l?Z9?H|o(rs$^xIXpJ_0>RA<L9@t*ytm;Ui0JK
z4=bbhtp=N$_CGgH?xyKIX+GHBo?Cx4_=K~B8brW5i@_t2{xf9@@*8E#RQXuh%BAJz
z4pOE<{z2KYJ65*rsLXy*wrBxmOBHX9lM*@hQ`yp;vxlL_D$c{KF>|N>pll@q%9ikV
zWlIN8wpNu$#Ez9MF#wACC(4!v-cMy~E8#cF7W$jAHFT_OrG8bmaDOUW4#&zC1)yxr
ze^s^ysee(n?5Ekz|CO>e@*gW(fqzi8w8)V^m92?x=7*>~!RboWgguo|TWpEIkeGnf
z$f{Vq?q4Ze!$_6#E?k{sWs8dq@m<-{$sba}nEhjA3-Z^>mi50<ws3!?Y>BPd=}_sE
zez5wXY_a}U+3NkFY$-1^O1>g}wd1mU|H^bOplsd!gR({RUD=ZQp=|j9%GTUZWlQMK
zlr7w!%2qW3!TTr5*6@F%Z0-N2$`<0QvQ_e1WlKNAYy!l%-tu2jwuoab-o#@9J`mpF
zeA;HB`<Kd=%ik+o54rzV*?Rg-*$V!nvgL&Sschl>R@qtxl&$jb$`<GElr6FUK-v0;
z)<ynMwlx2sY%v}yTPeR+w)~Ejt&+c2wsiibvK2gw`%T$84JYXOsce~pekxm*|3cZ~
zp-cEh*?RX~*;@TY*%HNPrOx?pDqBv+%2qpd_cvur=a0&k&atu;LfidoWh;_%OZzv<
z7VbA?OJa_8f>+`k)7q*@qZwZ|0pzQ)RsS1hOBztN0s&>~<8PI%wf{@Xmf5kgmG+m)
z*7|>@Y&qfliL!<KQ)Nryx5`%GY&0LBY>6E!Tj;OKmJy(Ah5VvyUHPGGUHqYJP3VV^
z7V3)&0m>HgSlP<Kr>p)uWorxbQ`zDh1C*`VKPX$t$I2G?r?NHqRoT-2du7WSP_{zA
z5tu(ywr0O8Tj)PkwqSV3KPX!ofU-4<tMNN!>*T+qY~hdx{!q4t0M2GadC^$jq9~Zp
z=uG|50{TFN^ry0A|F_Ck?!QpBI=?Dg&>zay?XSv~^skgH%x{$~{a-0tlZ1g=#6yTs
z3nTFWTa!4V%NJ~Y`Sc^ZFT}0xp!zNtW$r|dE`L?FK;(y*_$-J(%BaA7>A+S)$~)rt
zD^rA0)W0ZO_J5{q0l!oeXVD}2Ka?$_V`WPW0}lL+vV{SQ{ZO{h2(Zr>VZJ`NFZkb3
zwuJTnplpSIRknukRDUR2X8%ChLVi`YjQ)qpR`8!FTgV|iBh3FTWeY}*`%T%R`YUA%
z`AylvA?I|-?ZrVXZ{_PV78uGF7@HNC?B%C#QTXgKFm_$1g8n0AEAX4Lh5D{+nSE2X
zK>u3VGW(;l1^U;@R>!fjC2Z}f3L<FM|Glz>29zzcAIjFy4`pizZ=!-Umg-p968@oV
z8C7W7|An%}Nd7UcT#xZSQ3u0^GxyuYg!3W!cFSefPWs~ur2HNFhaiIfXWx}AVJ`vu
ze?!?C|Gly$_Fqx9BL7a=BKfLpiTq00>ik9768>)~TcAHvwyepQhe#Yif2nMtLF79q
zZtFAhxxF=35|zS$vZeK(C|eUE^3MQetLIqR8b*9qwlosLh5pYgTf<+Kt+pS^76}3J
zcgmIoplnIv3;(6ECH#+-E#d!$vL*IY*)jt=xsi`pm%l{(&y=lTu+D#=Z0Y<?*>WM*
zo##|~&=#7WYc4;uoFFe6IPTETZ1kThTgZQ`Yzh7EDqE0$q-@!v{<X4&|BJF^KlG23
zE!7Htqko`m3I7+BE$F|iY-RsJ*-FK;{@2Qu#D87cvLU~rtYG$M%9i~PWlQMqlr8J8
z%9hxFqHNid4@}t+=En4`psklFCu8PHGq>Ih<JtdK*|N_5m9mBXy|QKfuazw^guTvJ
zWlQL{%9hzrW$Wy*vL*Ia*^&U1t)V|CTZUhiEu-HkThf20Y#IHpC|iXc@Dc?2zou*j
z{R3r7=igAa{QgAQ(*2FHrTEX4ExzX)+<>wb_f^@_`M;!WEd>3&vQ_y_+2Z>XWeflR
zn6kyU<@~Rety_%Wm922H>rwxfvK75_HmO{k;dO{yrzDX`@b8qZ*<UGJa6s7-XUqzs
zl{G1gIc4U2q<QC1#wp{Wq<Ypub?2qK+O_Gv{UFQqaAAjsNy4j2&rbT6Racs&Pe{Df
zopUSyF!ADqv)G)wWDA%sz^jc^3hDL5?{3uwmg({r?{1FU0T+6#m>RV@1ttT02IM{m
zC{-!a9eDknvgOI1%>7N-;`^PlmHAWIiu|T*DU>`q6mUNLrfjAEy|U$ZtZZ@pQQ5lZ
zv_dF}vAugVFPz#;c5O&^SR|X!*%uD&JQ2#bK}Gz?PKml{>6)Nh&NY-oYZ)f?r?O>+
zg?Avp-;^z-Un^VaV`Xa?P_}T%Uan)yN^$;7+4B2SWh?FPl&vTbffe;H%9c2wY<U67
z)?DyId^AB~>ansFjW|}ec!Nm`MQ(U*x8mC$D_hw&gmiwVZ0Y=!vi1I(vgP+p*)jo?
zEf-V*-?6gg)!N*BtZd<t&5#@`TP@sQl`VDn`?0Uemf4>wTSkDgm0S5;*)sftvV|ql
z`&(rz87*fvOZo3BTOl;Z$`;-aWsCF=%2xQlr)>57O4*{rqr(G~EgUTMv9eYDP1#DD
z1(YosLb0#P7Uf?lTWY^3TZDhFY_+ufqHN*(UfCMwJ<W6TSlQb7scfkz{}W{k^gCrM
zm*rU5V*jRW;Q-1O?k~#L)IU_Vyi>L1ey?nyoo+HvT{v7zd*udk_@Qjke^a)0Z~<kD
zLi=XgPh|^@eQMPC?<iYp5{JK0wod#@WoubPvdZ${uaqs_KPp?Oka2(E;rlwr%9iPn
z0SE;KGMds5TRbAu7NS$2P@jAp9I!qrk_rc86As9qh)!Gr3<ji~rV=V_AOylVP{p?3
z4#j~WAP@#Da)*YLXqQ6W7{8b@8>I9Z1mfMoL}r1B*gzP33tb|bdl|2V!(|`{eRk6J
zS!P<(AbgMrhDf`9S&>pUQq~)TBMt(w4S7lsY|Vv&AKMUIj-c`A+j)XOzJs^pfhKg=
znaDs>%hqB~Vcu~XZm3O87m2I`ZFWmg3&AP@2rGvJN<C@Lkcnsmv!n3X5eLi$#Ya~n
z5wkc{AC-oE!ch|K-Z&&TBUZRb(BKQ?<TsTY7mHRp<|5%XTp$qao>h=!w#{o#NZv<I
zs%`oV1>9-UeU<7*@|(jOm+E?7ZZfCJ4@7zfES_Y-VNQLYr*}1uY!>r0uNc!<?Gpj+
zmXmg5Ksog&I0``VO@m-hF@(HO3MWjgPtB-YxF`t3Ra}uG7f%08*_xAwwKfpFz#$7&
zpe(K^Gip9B7p|Zc;^P$z_G^K8H+VCNtwcAu0ONr>xS;ND$`*!2y_SkkO2J3whq9Ge
z2Pj*lZ7N=9dOQ#X9;W{!8bJ>t*eJveIC)zC2A&Gp(Nh8JL946_2Xsm<@fAm+6DkPQ
zjT#N95hKM>BnzS>4I)v2!ls*MIKC=dG2fIej3S_H(Kj%BSGF)y-;}MBfU=dC;sYpK
zD%BieeaFg{1dpIB!cP@3^h4QV`l@VgA1hnRfU*@Cr0k15CHqs^x+g&vBl#!F7UmJh
zuazz6v9cwe2!XV~&}iP1pzq37@voIFl{_EZtIYB?7(m%Nb*yY5>QC?{u8byL6o(!w
zTlMwkoKi=sd4RH&NDnAme)56lHT9%Flr1OR-z!`6O;l`3MC<rWU%-H}#SbW3obt!Y
zRz4bp!Lv*ibJ7P<AP8)Bf^UrdRJJ64rEE19eOI=^6tkbQ{3~S(A!k_}2Cf5{sD~1o
z%4+NXR@wT}1_1-g79r1fWh->zSlI%#r5E}@n*UtcYLl)0wX%f@BE*veS*zs+d{?$W
z$I6!9H)X3TNdTGzC|j!yzF)%1z#u$c9R7fY3J&Nm%2r5NI2Z&LsnpGuEsw6y)gP$J
zt5u=L6g_O9*BB_mwz%k5;eJ=PK-I|uMfY{Dax~)X;2wqa5%Vfcko9+P(DAbqx$lGp
zr-tjGc<%DzIjHyFw&=&#$)TYK@z86Ijn;9O-jD`}EyS;gt$Sg<HxsE$Wm$s4VDf}c
zsl&4zVX$2SlPv@4d-wpcMF$XDLuiJ?V`7WzE3w7;Mj!eMu|@Qa*b>+=JSMjC0b+~b
zk$}<>F<2<J1Yf%XXMg{Z9Nw|7b@IUoLH`}jY$D?+&g<&9*R#RIZz5f%LPTSc6iuU)
zw)ix$iEmx_*hMf<NW=B@Fj*%9)dPe;L9zlq-F5w^cR~2((#B7CN3~yP9m<Z&YMwsb
zl&uq(>^X!hW=g0ML1-KidTJ+9ESuAiYgEO39F-<w9m`?EGJ$jTv<ez8hqwIP8&V^Q
z2|l(^0zV8v0*dNv5MlPjq;^huuZcES5*0)Xn%lxo)8*_AO4~?MOvT_@w|hnelZiAs
zZ``1-z>oq&$W93VN{<gFgui>(%os$8F>pFhWgmMV$JNA2XzCyc3`T*<AENL8WeZe+
zma`w-ISZ(VpwclY{;WDI5`#0;gai0mI}`lUponk2RyN>ki2=SAAjn0yV<@%;lbM>%
z@nUdh&%n;g6pw0#Stf<ZlLtaZQ`F5e6GU&kjCK@y&K?wsqponVbc*WA*rDh%K2<0l
z=o!^&4Yk-a&v9K@u4MXb-5hLa_<3V(`bucFkxh1}xm^8>z(X(y@U;k!eXR<kd&j;O
z0jtxme60YWGx}WnLD-Tx(2&4!7ipBmhT{G7wJJ<XYRs0fW-5!?u;DNoCk(z5MwBUp
z7!yKeiXrZnw3)@=n}Wi83@E!Tk4P$NrnnO6vq2{o%wYHMDg8i1sTjzc8|82CS6;s$
zP6d(BKcYzm+4vk2Tl`;%Ew*D~3-q1XDh+$~mDu73h^^TvqWky){-E4(jTC^`>IR6d
zM+@?pVgcw^VhfmWEl*|w(dIQgE_gM41C+!S45Dvu8BffUkCl_2PPI16=oar9C+$9M
z47ZcHHLkU>tqY0>x*H-J$<#h953PDQ<-<EMB9FlbJ@zrhp-z#;8zMNL-4M?L^54M6
zPteI~1QjLg5%B`&{JAH|(jW&d62E7l?0K_UP!<bju(36wzr6f(7(EdN%xg=ckSNwD
zcLWey$@2BQ--xZ$`s4@rE#{!Cm$qMopiTKQSq~?uhi%r$%mHG{ZJ`B61O(ek=K4x(
zC4VKh<d$>*V(ZBRYtjKDsi()pme8LPTj=xNz%J?UiLEk7^C;6Xv4sa?Rc2!bQJVIW
z7Ka&0gXqf4=p|p$J7aLHRlKc5S;CrJrlu5mgC2H-;<ljRu3DCeP|i;(V5j*wuEgl*
zAWwC0Ehny^B#2@b^Qqtw-wd!zK0END|J=~BPlT1`jjG1=h9+iEkw3^CLdf+ZNO9Jb
z6M42VS?-9vdKk%_s1LFp;4+12C~a~=l`!)(sqM^#rg%iEL?COt2=ln66_CjiY|de~
zeUZNYtFJX{AB+Hetpb$Lv9F~7;b#DS^|gp_4O4?HKH>wuR^BO>0>IZI`sQmz{^D!7
z;GS<PJtt{ISv-#q3U(RleN6uN)Dq@IA=-gEk*?W{LGl3=jzro+oY>L1+U-hy2=W&G
zW4ABQ8HAR7Fc=?`Wnf|-4*|XG(Oa$xB^{cl8n#KSwl`U6$x4@Ln?_S=n}b<EjV~U0
z-vq&5SXSLyC}#mhBEzEwP7utTW7sv-<|1$lXy-`Bkn>`WPDroryq;p(#IKM85uHlh
z$g{r_$EG7mZY@%t)Z%QVglC+JtCB#@+Y_4I436IkvlMYTyBC_Rgjb{+^tKsnMU|#k
z=MpU)E|OZAzC&F%8+2**wUy2$ta>47-H`|phLg~P(~S}3hSs_}i~t|nfLVfgqNpDz
z(g<WbH23lb2DAgtde}r1fmz&tzC|O)X1v_4K*%%kRA|Aro4{Nke`6LrD@qS?<&=5c
zxJ868gL%u!sRO<ih_+nq4H<|iVab`(ttA9R@7OizP)h}Bz=3Gc)X(+qOM-;$-Su%M
z6jpthk;yb+E)hX@*5AT{j1+6%!g5wy^l$JuO&>+ItX@(N(nH}J^M={_@myaC*_g1-
zyUUe9<r!S;b6wrj-H(4l|LsSQx9L;2&h65KWWRopO2~{E(xxx8W}p>iT&K7ZCe(>n
z!UUdQ@;n*<;h``t7=jXxEyola6B<J6LUe@@E|I4SSQ_I}A=iGt54-6FSf(4vEk0ki
zAdc<>A%nG#ZOk}^pU&7)o$YPhf2_+3z*MW}hMXwMz29KHJqBLYvEWoFpJY*Zwj&|x
zo!U9M8A>!7b^>ILktc*le;lA*_1TiiQ)xd1noZ^=0C273Z@5;=N&-2Ef$#(OSpe61
zAol8Z`h@j2T<g27)w+80Q8sCtn+O^2Cnxm{*CPIO>G!x6-#1(<^&76mreXCH*TTfl
zygl@AEornV=CCg5kelKBifiS4!?hmX2?4VJxE2U`U+WWYs-xDW@3_`mF1$E-nfGo#
za4iskYhj9B{KU018(lHaYn-CEW*_~)wXX3%86N@tUc6&mYj(;^{RJ3;JjS(Vr|eE)
z&|@0kajl4vPF=Z)!dlTq;5r;|rf7nyE{HOFG+Ecx^W-!B7C_d*m}EVAB8R!~$WxRs
z=IDp46+&B#W6Ng2+5*U0W$b{gmFp7;$XX>q*M^Q|Ed}W{1whtX*-2}m3!J0ti2W{W
zDXiSPPMoS<?s+FHEW#g<wQ#WMpmz%xBO(lBCA3@~!%L3=&5D%ZM}Tn$q09!eEf^>s
zoiMc{4#3B<4m<#PWrJ`Lq;m**h&Mi3ngqfMx-*BtA)zD)W#2)~f~1!_i7X)JTX2JG
z82yk#k+T}1skEBB`sdliNeKw3BU+;7ln|heb`a*NGR7#A*3THVl2J>HE5l1aw4Ol~
zK@<V`0(*xVP$5sDKyA_RV~Ih+P8{k!AmAN{OgV-l#1`Ip7=f{Qck)p0U1!<}LkNm^
zrY}v(XLDos<jPR48caK}4Zb#3a^|7On>~q*sVc|Ove>JX5-+Nj?{yY2NjA?OcB}05
z?^&d}b~<18$<w=-{CcFQXhKRg{mC`!FYZN~2XZ@G^F`_0?uW>|?KKV8`yC}G9Npjc
ztGOoark5GT^5G(I$;+i{GVpH+*R)*LJpsOCq9c?><9AoAbVJQdh+ND#TFmb$PmJSG
zg)N(7lOPC#D<EF1!xNdoKA_ZYZKwvld-?-g^zxUlwpImey!_sdonv9F6lbDJGwf8N
zvI`bVt-(2$ez}`Z%^qTn_m$Q%#PVoR9RaqM*$-RmwsT2+;qBKryWAPxJ$KGYJqR#K
zg!!!17iIL!5~1#9jB7CBL7m%qawGS6In!fh(-?V6keV;0-bL^f+}@*>;`2Mm4kIec
ziIU}a@!-G8UvjVWOpl|L_EvaFWe>?|iG-DrJCdbwVH&&=1AF&NW0GX;A^KGe1fJNq
zsC!lYvipM7s%a#GHRJE;`>7{f8r>bIF6=+3Z9659$s}AC^fIlFT5L1l@KUm1Besp{
zMAOH;lR|a7YmFzK9PI7Cjh}z6^+NEhBw%ZS%Ofq=Y9V|S4GT%O6>iAsT#?Q}UBK1?
z`3t%R!lO$ayE)QJX9W4Qj}k@QFK4d~O5G`4c#TxA%2<@RfvhA<OeCt}mK$9CMBGu?
z?|*V6{@B*yk&|D}*3;4{$}}>6$pF||N#brA>LD+wcT{fY^Cw-92W+hsw|KYS=^Xsx
zbn1{a>5d#Ff@51t7qGQXK2#h6Y^{R8>G?1TYY=O?!hv5ynu7P#`#QJsx<r+fv|#T_
z#dU<(4_hlgY>?Z2$R<`YYX`Tp(6Lw8vd6(9(En=ve6w6x!~14`81vvj8WY-ngo5Fa
zdhR^^TeA4t%Cgl3z}8xk*Mbzk93~PM25hZqkFA!)p67Ldtu<Vb-LYfzm@Hk$r27c(
z;N#>`e5qS7UQiFq*(98>6Ttwj<@BA_g0|o|6cHOusRFbXDIK*9t+e&*2eCRPVBPOB
z>tf6!1>QDDl$Q&iR_m~MG0P@rBm;6ZJ1=!Hdd$@A>Q`C|BAQh|0NvmJMr%0%wANIb
z@0J09zKY(}V_GYM8=$ppNwTTn{Gm(n+#(h9!duh~oTlIz4BAr!ndfTQ8RB%aBGw~-
zgITW=JeN}$?x<<VMrEQVF~<Qz^0xWtLqqjA%Y813(7CV=hmX~@1|HK|W-TlLtrgiT
zqXx6eBiHyrYrX5P2WTygVw{G$h%}KL?%-zAXI@9=D!b0+IyfU&teLNzsj@J0zy0{j
zB(aT*Tu%Y_4V9{J8Yhj1cRuD3_^cCB7>c00cTO>(0a~kiHh%f>yyh{j#Ys${X(p!g
zoz@b3hf3KIVWB1_DiIPJqC+0jS_rghn86+YjINQdv=%!ffjqAgtYqkhSar^?l`VkQ
z5-b^xy-=OUdQhw;O7czF`nbZ~XU%BSvw5quGBpjLwXV~yG6C1BWW(ghjax~C(wWOh
zFMhDr%Nzn}CtL*!kz-oRAW$6*!AmUQdIuu3)C|^(wr&t=K&2lLvC<ccklv=~iV;^`
zAlAt{ny9I&dEgN!V6njeSISnw{j-j0Cgb!z>gT;?&PIk(3VDcD@?{Xd-bO#uKY!ue
zK{uz1;EnieTcD7{g4alg#7MrF@|v<hAvZgL7tcmgY9&Ns$y{8`N5@c)nh%7$LgdWp
zhyZ2l)&nzt|LKVtNqiwwVc$G+^Lfoj4GlVFzUliG>lbd<`tmN<S*Q`XC)k92=nh@0
z$crCj*t%6NFtDN-o;J}$C$YYgE>Y+cOLtdNqeCD~(V!J9vNcO_ATQFXOGNYm?`<T}
zC0dk`SMN67ht~I1T*CcEHl(n~8YUkw!?pn)=!kaC)(8|Le$FPA*aSk@p`Q&hz}k`u
zE5nhfb|H(3voEM^>6uyMB^b4OuQ`FM6&2nW=i4yuM-;ZcLoUdgnw1lMux@2M$9J<p
z`vkxF9dV{p7yPDg%ep$v(Mq8DsXc;}h4yS?rbYAk4~8AY;w13%AtHRSMnoJT^@G<A
zeIDP;z~#Q)`P6?*?Ji9U@u;tiI61-F50L&U)uQa->?`8gPkb_U0+g7%PMStOc<OMi
zC+V&j_eTN0Ep=nJacO@dwL&|g^|SFVtUhkIOmcQB^7D3Kf-vzMQuj0-Y{jG$_)>DX
zj_ayh!{~WoTJ}&LunMwhGT-C8yhalRU8=_si&6?XFLUjNcXH$OY-LTT&x1R&IzdxT
zZfcjW$#+SRylA}`Dm9WX>Uq(}VRES~mey?9Er8l4(_<>F*%A>_`5rc4dCLb|`RoM(
zr7YW*(Ej9P*}K?A2Uey$sdLSJ-f8`fcIm{0jcUTIz8_i^)6n%jv7=|#w(dxN;8pJP
zDf?h*B!gXs><Z@f)!co;+*?h3btK|0L-t#wvq|xl(LCXcW43;5+KRrpo}I4~m@-q6
zSQ~_d4nCCWu{hu8)_FEs_UXFG!P?_bAD{8Qbh_mdTiBVBInAJSS-m{a`hke~EAWY(
zx)XOc4%<I(=yuy*7l6I1GD4#175)5QyS-02dh(@(*WI(vpK!`&8o7LX;mY~&yXSV)
z9afFXuj&>ERywNgZ4EuBx(T=JRXz%6JOeN9T5JB??726YMX1lpEWJ}%1b%lNE~K$z
zx;t?FTK(I*t)7F1du`!|58XtKHhiA!2VQ#o*$RBP)%Ath8=<&2T7LNPA>6FkQ}N5f
z^^;TBti$&wE;A2!9|4Q87M-3)M;~96-Y_qw*0S%wz9-7YHGxmJW_=X0E+q$d>S)$y
zkm__O!?rL!C<LLy&`#wm!b{d!P2d3?&DIQBmYZorWeC#R***D}`E_J2)gjK#SgC9S
zNT0S`KpQtvtfYP0eqA<1GWwv>3QCc4gXXC1rgYS#Q;6hHEAr{HrHn*KYoFLyEJIVU
z0tS7bEr;%cCaBDc{+iA8drAWO+3y03sBK}(Ef7l1)|1XSkK02e6LVN(d%#sztTQ(D
z2H1v(D9KVb{%RYR`XFf}g+c<($9HTTSJjA0UU77iiZbYMG<U8>_8_OxFm<fZPMeey
z4ujwTL!i>F041IVG|bJGtBhTMJ64)A%gtI(pz0KZU~ZZl?pP*Ncwqk7Ha6}`xKLP>
z!)m9<g&t^_+Je5C$l;V|Rj<HAr&v-B=L+<M$%586>TzJWU>G5rVOLT$>h|MPQX@e@
zK{gYS;Y_n29-%JDTmtbHE$GnQ+mDYp8e?p#>&RVm2>3CrJV?OT3Z^wZ_O*-(!d}$j
z6sss9;^-I#LO!{_%HLrZJ+vjD$&={p6|!Hrtdi%Jj}m^~$r769>X+|gx|p|N<JX6k
z74CYhjWgY`kXOgqn9W&T4ftBP?}!Zp3*rG^3t6D&GR3LOKUn>-b;@r}<Yp@jmG3sh
z;kN~nZ0nRx$=lE-a}CH-KWATUpYO6^r`Th9ME%v*N(c(#<75|EMA6#w2yr%;#xWJo
zx~_mJ0AFjT6Y#ZC6M_}K`C2#QtoFi|F%&mL?a%CSSx>yS`~+TY0er0>T3-$8D6Dl=
zn1sbKujR0JgmrMib^yK>#(_H4!AUdZ)YY%P7BXD3BuqO0{ECVJYJf~(8|{O^QGnXJ
zlqw(lTBe$SuVwc9tFL7`aIAnmf6bnA>}&a$WqaZl6<EU*0bh&R@dECYo9~iCaFKHg
zw{w)kmE5Hk@zx2X9Wa5xPk)}T9`Lo4U8u1JB}IxzJ7@%#;8iwWB#uN+nDzxbml6UE
z6GByrr)rvn!*v9<F0bpn3KR&?flW%}BBwtsPI*#UL8;ICs)O}&PldDN2CPvY`SG|4
zVmqZ1W~PGxU+Wd%YZ*gg?ixW7+Ni~GaTp-D&hhF4POaNPQ50#WPZ_-Pk4{18<2t5z
z<JMMO@=bYaz&8h$Z))BXG+4bg;^-HlOuij-B4N?>`5D01!UKFQQ*F5YAQDBxKh`3P
zS(%!}QrDp%+O2~z#Rg_r*?VM^zB#U2`FeZGkQE(d9Y{d}t!FrzF|j(h!nv_>k7?^(
zR?n$hCN3#vE;sqLNvylXAXY*0hWCWPfUng%<>=y8qUc-l9yKhrT|~Fp8f@a|bq#hl
zjmxwF?VZh~tjp7&?qqeyW$EE!r{LhJ$$g%rkV(+VMcek$2KvMBDN$w$Zx0=S-f}Ue
zSaLJs)Xs@latiG<_iuLeoj&%p!e(F!zE7`RGkSlgB;tJ$1bt)>GSC^chken~CtP}O
z)m{mnF$xL{4zfw4l`n4I13yX8+(xt&I)#vBck-+himO6TS82hisZz@pmb1giO2LXQ
zrIMxh9`A)U=04MUUnBvsB8dp0T|DFVI5@!N9^ztBQ2j<gVJBu!xo(NCr$n&#@GKQ*
zd1oiY%7O4w#RhjwfA`^rES`{d?HUXBic2?N=JR`sPAfc+EP(qqNOJN8t(oldC$z03
zR23(7>L%S?6%uiddw%N6Q2durG(&q34HA7g+?lId!j$psS=-IXPlH|{{g`L2CRbe_
z?yME%2GbUnDsCu+IoOTXt{W(9a&u8d)t+inC|0D#-q}4;hHtMst0cCjQt@AOUGnf)
zW-oQ&Esc3MCPdvTBjfg3RtuK>RA%>7DwV#`sxoP*GL;v_jTvE=m{P^*jfJE;iogKd
zKv;1Sze_bU#k6%v+*<GS##~9NB%9~p-ZMeo4ES!y6zY7+c934H@lqj*+<5v^4~o-^
zms*}<Zf4^Sf!gha`}O>k*E=2ibHhSuH(F=3+JxP(r=abJ>+MuOd@VdDH~Y5wS&U*e
z5ET%lZx>k6HK6H-Em3*Qb-oy)x|7|Edz&h&yo|pO<>7+dlqndM%?T4H+jN;lUE3vC
zD!X@QX=pvzqdu2lI-!jGl@dix7@7auBDW(=#X695BAR<~>v89?ua!}VDVX*!o5vQH
zfv-ZJ(cyS5u@($@#ClS{{Ya&M4e+(-?+nM0Lt=Fp^Ez9h?+9H(-r0JVzA=RnKa<5v
zqVo}XS{PPNlDH~TMl9#PE#^6XDSRonb9K*i%|jEkTE2eG1EvM|S|NZJ#_fc?RNcaH
z#vQ8d!4qi68%wqNzOoABO}^6qc><M^9lYDz=6q8`yP;e*vz%CQ!HA2G#VLNi;S_f_
zh(d6LK+OeON(*}{W`ZAN;;ctncW<Z=C5jz6LHMC4wY&%f#qY<8PDV?pjE*Y}r^T%j
z1HM)r;A<&E>rlMASS0T)m$9P@9R)5PLW6=IT9{#wOCWDZN!ZRj^)j>Q^7hGHVJy<$
zlc4IoJmK`%I}CUZ)t>sE4(3fv7)11W0s*sPf{VF)@q+AQA<B_!4un*nL#R%AZ(Jqj
zcD;ZH_og}_DtiwmS3hdvE~28Swat6q4KLi2+4)j;%cIqh1oTTs970#nN7rqznryU6
zLuVh}`hs<ehXs%OO$N6<Egm|UtGWbKZ$?(Tgb%h2clLFuyFlLZUI><j@}b~gCl@WJ
z^~L?*bIP3D!iU8EgQT9Orf0aJjSqC|l&}^}qseLM8T83$Tb;p?B=M)ob>17H=iXt^
z<QqOo_AvJy-2Lta8@r<{6SX%U5Q#-12E$1$rz{Fr&WjGN`US-V4==DPAbpdN6rw^G
zUB^OPvufR6NqUrL?w1i5(>i$^NqP}}9(eP~<z|H!T<QXkRJc3O1^(r$XA_5J?cQH0
z7@~i4!Ak0q<7WnRN&ZZbR&ZR#c#F;w=Z&_w!@b%|MUSqQOG&*grB%nSxM1(h@%T6J
z1Vl;rFF(5W_E8mQwd}jjw7amPt0ldN%_|?If_dtKi!_wXvDD(@+@&!i1n$i6onR~J
zFvlHF&T7e)M`U9l>H^QtWmT=EHDOuOQAK{IZ*#iNR!2RNj_LaEDqFYf?_|lO6&)*E
z>5uBupU7l%)n^RKWKPy+zLL2MC|hr3vOd>mJ+gAOn)5BiD)Z!ho_U?cb2YQe0fsE{
z2DB&p;Gw>d?EMf4M4JqMLt&PTg0F<<3YJHDFDDvX<S*;OyoF4V)qio`#bQs;uczQu
z+bbs%xpu6K=cmHuhLmWm_ed+xj%{%fK{-co`Jl4sHVzA~y&{BXSS48cF>Y%TE(0Q%
z$4q&dB=|O~T%@GZ;abBZt6iiDF2i&%`%sVrzMPz6+mZ?{iy(0R>F={3aM!j_9QI0_
z(-8KX3sUr4^!onub$aknduRfh$_Wj({`80knXCn7u^{75l`B@{!S+&B54N#{*0E9b
zBdfvEHn7t!${b#C65X=`L#^E60q|@kZu^F|M~{=}z%0~QBqG>H1?f^3d!kR7qb{g}
zQvd07a6`Pr>1$y2)Zv1`*bYx6IJGk8PVjUca!jgT^6@^8co5SVxH$fdd_)L>NNKzg
zCt}_duD-|fMf*%#vS+F&yE;}11uk^eP$$71m6PvPYkEm2qtJ)T;Me4&Bul@IBfi*l
zwxN|}3@fJ2%^rZQdi!A=fqO|%F5=>I0k0Ci+%}w`BM0|aO-m<a3bd3(L$@VY!`wU-
zR_$bllj9!VZeGLgB2z!DJyF=`YToeAQcw>$;aB5}>T?-Xc>AGlfCq<tOxdrmji=7<
zEnG1Mp19??E!EOHk=*c^bxW#RS+QEVC>rYn*_$`LeulJP4z2h;{3u#L@#U85nr9JW
zM^<6FjoZ(VV|voN0WCTUK1vAoTv3L%Ul%pL{_OhXdvK^?5SW-&+z(=-bc2*Z(su`9
zs}c$0GpY82+MSAJlDV|K1GQIA{6*PPb?7nHn`IFzt_~=f?CKX%30ykQAM6BU_tq$U
zyoNPmW>@*}WtGF_CJ(#VL-ygwE~+EfiP*hu=Z||dZl;xXPg5lPY2D3gT%ir2ktd#J
z>Ro1c)|&5y^WVKQU7cR!elE%Uz~f{6-aV*MQ3&Y^7UcTC=~~48gXD~Hx_cMNt<Jkh
zG59(S=V{!Q3}n2xHsWzG=NjC7yZrn}niF<%S$FU@Zl=qJGdo`Mg&F~L=TcM{6;wQg
z@25z6jtZ1NWCZ>)dsr$izo@_b`H&^R@7;osL&HPTEJc-I+Y{+UT%$$Y_RlL>&rMf6
z(ew52<~nSo^lphzQ4mYh(t%rDYB+z_ymVbH-IB^;2=2NU(OzCi9e|(Zr*P*y%t}n7
zJnvfRGrSnNb`6mv^O1B%T9vi7<&-1!fYly2Ov>3H<9q;`E7`M~DXE)17D@G#^A__8
zt<?0E``y>mvtG1fn@(KG1eVmrSqhTL1h=*Wa<H)%x8IGxMVL6Tv2qs{bkq3s>kCrv
z?rjyZsOU%f4A@S1b3|}<M}$`JDL^@?oc)H_Be<t|JM;LV^?Ao2m>pn&t@4bXaX4$h
z*pT{OZA8JkF^?EM9brGlWf@2_VR}CEmJl=gVa>hRt+Ni2_3FO5X^72)!u#i|6C4;s
zo)cf1DyxQa_EG?~Yf7Og=iDB3vkhKW0|SG0Iw=SCV+G8aUH#48Zs_Uj4d*|;;D(-E
zPQK#YME5G-<ICGtAzSZWryK>hKW&#a&1)yu+1x%$a9U+AGATwI;v6+MxfjVpWr(-u
zQ>b_Doock_-q!hKj7-&19L4~>NW){mSAW+}pG}!G*}$3Z{4Hp`YQkCd*!<aRH(1kF
za$|+vSuc^Mb<w5TXLhY_E=3mIH7|rz(X$pNbY|VV-`r4i>O%We?A4`R?z7%|riF`f
z?e%tglD9=KW;QI>`?DC`X}ELm(ZYc9a#n~!+EyF6BC~h+_HbdUd47Gzql+Hsj@#SM
zue^p?HSgNLk!Q;|*>nw1m}p$_sFrC6V4wM0`7GY%-B*0MQuJ~1<7(G!_Cj8BCb6_s
zTuG5JhZl<vB-u1cRhs!aV~_Y+c2t<CTN8}rjPWc_Wi1p9DM2!E3thIxzbacc9j2sW
zEnZ-#dt91v`o&A{P1CfKr1??q>;{!JdW9`dST<c%IK*t4Z>{99%$pKMR?mf5ZgB^Z
zE{@1nv)#GE3xQL*>L_jn3B=ASGrii<QsmDgZ$WM_J%<oRZsnlL^!1rEp<T$4koYT3
zT^O0MIf^SzX%~x0pc10g4As!G^V7Iwm^)pv?4mbpL!(XSs78=!J1SB;N(vv@u?|-w
zk}gi$pjeIjrSet6<}X5HosAb5E8A4!Te*qFG)MCk&;-m%YLLUBPL^!ZE<O+Tc>jD|
z*tuF_;VMziMzgu2%lu$+r&6NCugVr*;zj#5qdRpb9FW8!KITf|K;PRV(~rm$FU8&r
ztn1*Z&Q@|)d5~0j^H|yH4X_lun1+WHWG)~O+nEnH%U0%$O4KwOS&Gt#4rQGzBp3V0
z1`Dr#Eq?E;j_bK(@jZwdz-1{ri@c$o0L3VBevUfdZU^K(Y{;{C<9domB_R!}(j5^x
z{xh(w{r6$K(m|wdi?D1QniUjr3DwmhJ46N~gqprbA6aUPAQW0r;WIOcHr%FnO~9oy
z35u0cpCj=rZs+G`BMf6~gWsABrrttDM>pRLc=Up3p)?2^((Q|w9}3e^!y2U?ii>ZV
z7E{k0VaQ|mg6Iwtx)cv=V&WNX8I@_kMnPt$^LA~E7@c!z^Up#`pZn5E8bpgL43G2b
zuxXi`b~U3N9y&dXCb<TQfR`cgMUhJP;IAE(WhzacY~F`osJAi7=BBt@%bl5?V}q;V
z+p4-3awWW7%~pfg^bOut!YybH>bdAybz5!}{=JwOitRI_4h0VkO_fg?uajSIsmU>f
z+)%7&y>ZgduGmlhjfYK54Bxa3?U1Pjr`Ryz-mKmEx*!VMX-J{gCp4sENY@@ecsg_1
zhNT%_SUiDLib_Zsav9Pt<zZB=wkystk2$sE5JbY*tfZGW(#bQHO|VX#r^;!2#`(&N
zS4T-h!8sXzp>BZoJyl|Y055eQ=w;1sV8G0~2%=D~K8P>I4vw4HC7R|<Nn{nu451ah
zAwgw(EutN}#TyZ>svSpW#o2LKw-rq(wh(MV-?o?#uCA~V&$@qxV|~ODt`HP&OKqcR
zo*&s&h@g<7W>YXS?Gjk5CKEQ4Iw6tsJ|NsJIbV=V4QzXkbK>32ylNK?1Q;8TW*uAN
zX3KqKh|QnI$jZ94kw0ANxfV3NoYalYulB>z#3YV@Pma}eCA6_4bId~d?Q<wnM01(u
z3HhiQnT@S^PtZr5i)i`Oa$}%d?cN?#wf7bxBTk4;#S&_vj#H50QG>R(glKgg(NeDL
zs4LQ6jraF`KFGMLoQh`{!{=mYv*X7~R5QD%u3h_-JoLq_Ue1K`u6fT6=|7c2Mjvq#
zt<t)9k=eW-P2}G7q%}*$r}r?RG@i~0Lb;MLbZ-$$5zU_rp!n3R$WEzjtxV<$Q5T`;
z#}B>AQC5xOQ&wTSagxlQhT?Jr@0Tq-(33g(&s$i8a8;BVGPlfcr_NPP=!T*H;u!wi
zHVvyy#4XL7HtH)EOHX7bn8DgdF8H-0!~?@%w~Hrtr=*{VD%n%nJcCaudB8HJvo4CC
zO@9x?GpZ={H5Rdap~|ZM=zuNG?kFtc2q#X>Ws%e`8AsK^JdB|TbK86x-FTE0L7}~^
z<J)M5$9liz4HHB&K1Y&ze73F)Q88=~mJpIN3+Yy41D5%{Y-yrCcgZ{1#MpV^GIeI-
zBP$Yp%(g;kg;}H*x%95|+TCTYb|O$xNE>^4=J5SdK9a}DJ3gqd`4i!8v8Z)xq%|2Q
zylYEEkud4Arl0Lc@Rfi?BOQO;ysL<eln~Tr&Z-jO^_{wGg$>cSlzy|puw3i4z60+M
zfmd_KrQi_-s+92!QLLY9>4+3t^hhsEU)%i*Cz4cQBk|g1+_rEz=C9tz!IB1l@K>#e
zn;z?@2>cT^c^$$C({$l?J$&=osP=HH`c_WzCy)v2D{^`b9_{1_m~dGr<gm1tO-s+y
zifcfwF4J~nl%=~Et7mDdambP)0&7>9J_%Cokm5#rv1!lc<!3X@U`RPBA2E_p8u!7a
z-67{<3y?N!+dcdAnjK_pwMir_wyrexu`t{9$$XUD<BFUXeKO*>1z$Z9ixXroHH#TF
z$&5=W7}hAr*@>A-sPJ&d@<HXBIc1ER`(M!HQaT8##GGtBM1K5U>DwAx((<K*96-|&
ze~@Dm|HVaTT-T+{g<?4$wM|A|{(h*;SP(8=k`vdue<(~rxH%N?V00xYhoo|8W$yLF
z5YdNI<QMFk%~ToNU(>Ewvq<7FvKB(;=iX#2p4wLDKH9UR@9(C6dXMs2B41kvS#vwN
zp}p!5p7yo#93D2Xmiw1ef_e(GiT4&P3NbqEHuU}?4;B}aV}@AiY>Dln=kr0N_+N#t
zJr@L{PKy^g4mmFEMh~2diju@FuOeu)4g+8Ef=cR5074fnIrBgT+%%dLaUqX8DTklx
zSm@HMM40IzcrSb)aD#N)v>Xm`*%*=>if~2tFoCp5l*lN*pjf4K$N&f(5W3P@0ilac
zQH*^TXKo(CG=L~GrpO0`E|aKZq3h~<9-1Vsqpw2ObC+7#cO##2$^fA&`vPN+9`$5A
zHCtT47aMN75jdj<IkW!!ED7aNS`JzH2;5{1P`b#Sq2%rcB!JQ-_=d9gSm`3M93<*6
zsHRsE;~BN0&b^Cj3)`Lx>%$98X_Yin&X~wyQFmg=&k4rMW%Vr)dpj(_1DzzIC|Jay
zV{N6}vWD>I46WD<A=g?Msn`~Ah7~mTH^jE-qnMZU4_*4Hcf8-r_Df$BlktDRW_)2J
zA9a{r#eULowi<?jy3s76kWF)WDxL)-?(onP#4Ls+#VwRhY}j0wjMW=*yxd`CZxTvv
zGK*pO$S7>WNG7^m5@!_NJwkt|M`990t4)$Sc7j?<be?fUu0C0aNsk7mhcMx%Co`H%
zOA^^{6@f;5nJsyDluadO1yePm_BO4|DFZQWU!b#FC)4hMFurNQ6K0!Tn{X>9d!tEq
zZH#GYNQm@-Ol1Ox|F&9?vHJa!wB<gCwJ4G#<JoLuP4d{B_wPP`$@#dJKuWJof)`Ai
zJ(BYUM<aQRiJf8`M5ZY7=GgLLeM2MFqm^k)8`+b;)q|=8>^R?A=9@xViNg1`)$rq_
ziIt=)ect5*mRC>?=Z3!Gn227?s6I)V%3!{(vFgdwMmNG#nbx@Mwuf+I0Lu%;K%xen
zhrQAtW~ACqLvxl}s~_a3XTiwNjKj@7o+bn=FZAI~g$5R4f}i`qB8u6owI*yF9yMOm
zox_m!k@ZNy1;S9Wl}q)mS)3<*4qiWG;yq3;so6&Frc+?OM}n)9d@F}r$n*f67i9z?
zrJk4?q2ED|UfQ4!w(0tE^8imtub_n{@$}h)oCgjk^EYh@s^blG;^6c>G^fc82PG5@
zN@NZ&@Dds$sd3vACML2MVIeriq#jT&8yc^7#+379s-kel;gOkaI7Y(6@fL@kWSQZm
z^JvZ8{8{qA(-h7owB^}U*;IVQagKo#XChs40LzQrklNH6P83H9Fo7|&4hJZQ4>kpL
z2x9C-3nTZuq?DXbLFe&<TLH^!jii8#8p<NfQGj~4MU&s24KW~h@;4z#xWK4Q!+%sU
zcVx=HNY$6aSYq>J+vXsL&%4rAbi#{rQXRm&Xm5MVpu4)+AUQ+yhq}~GLEi3SY>&4{
zoHqEF3_6-=&mFMM$52nnN|h;`aby{EfVSmVQTv{+DXRnd=&)T9y^T<Cabwv$+-Ze~
z_d~`EeI?dNXoD8DCn@u{h|9Cdur$)d!IuNi2%#sLw4)rIKaJC}`AQ5JKfLMg30Pii
zOHP;bMCj;jKSLKif%qD9@h$7)YAV__<-slJtMPZK6;y&kTF^7sKcCU~Zh6f~0+v_W
zvE@bb!f1qlp4BNPh-Hdn_9lW;nvK^Fj!4~8rw!rTVG~YeyLyXl2PgDMAUFiJg;>F9
zVw7h0o8yFiT->1xv)hsT^pV7cnpW^OOreLe5QnZj`<;C%C&ZVWHj31iA|jqXQpe6p
zdHjJ&j&Y!Lq$+@UA!Y&gDwjU`p{Y<xYNQlD{ri+0R^8~X)R^8><T+y(K-nsgBw4S@
zDb5b<H;r3PjcZb-UekQEW*YxFHC_kIT2>biKAS*zCxP@?0wqHt>}(?4okS*v^c|ce
zx%p*k+azLJc)kc5|FcA?JIVWkHcTbOV!<^#Fg9Hi#JxeS4iFdd{3LB^Z9-MD-Px2N
zew$;_D~Pnrx=YyhCQaK-Vs^G;(F;RzDs_)222pH1=WyrFQTm;1s!MYXG`Wb|BwMJX
zxK_%#StutN%Zdwm)wb#@1cxO+dS!>XQ?jz6$rv|p(izqsrqV6iz?-XDJk}>AJ;<kS
zITp>4t*p@(KTE^M1u}MbNS|kO5vNI%T9Tu04Wed4M=9CMs6L^|(mv%`Xps#dw0CRZ
zN>Q}MDDHdKWR%IbtTxG$)@~D1FkR~p7b0gdbtR8O4+EUnmj^lcn@6lUWFJ0f`#&%8
z;mvvEl^(hFARl2)18`nwJvNd#6`VN>l9sp}4|2A^j_f>{&7<ef;O}wh$a2c!*a~zu
zC-q6@tXttXpTVhh_H{pzM=`Qa$;`jsDOye|gYpy~(U1#9mK>>|S=k3_9tVBMZz+Aq
zI9Gk5<fT{nZcbQ#O{Ugb``QHT+U~f?)!_i`ib2K#YWI(!AN=?ASjDQS_R781)2g-n
zt*AZ;c<+)xT*wDncwf&Zxqlk3-6a_S(FwW>)g!Vb_!rzHOAfuDWvDrI**&)u+S#?w
zW!B_{t@*s>bxm7`W!c5z<_NR>no*-#zaY|6FRB4$%j$J9nuIcyWR_WX%xSKeLf23A
zM4nrU)s3pM8PsHV>j-^m=58x2+wclL`#gbO>B1U`w5I7<&Ebip+Nj#09h(+6ljJ8a
zTHzTcF$}@6eureiZF~V8B)P2uUp_%>L-%d4M{NINWh;I9X%=%&o<$E36T1)05i|Eb
zwCH`5(c3uP`-Hg<Yth%0(bqfOH^|&SYSBNL(f?w){}uDVg2ljc1|Vn+yk#EzU@`bP
zV{m_Z@Q8T`Y&k@jIYjz$h>~R(W;slkIn4BO7|t@nVL8H+IU?|K<OIv;Ny||w`QewX
zqxfy3$}izc2cv44V>*^&1_z@WFIiCX<7X|$&E+Q!fVF4z1kfySl%MoI7&{H9RDqLv
zO%t96V<9Y4{+W|jmd}pj1D`1dPF)WiPi&eh$b6=i`8==bnfbx9*vzT>O)n~6J}+u|
zmeVx;GG`()Xxh<ovb<@!T>fRf<qLPqm(K!cI^?IDSf0O<AD6L=RcU#}&<b~Ic?IBC
zUxJ_n=kN?$;gGw;UvS7FGYlg*bHgq0RM6Zg8x4eY7Judy>ESHlxjBYwb4T*Cgfk0J
zg+;>VIrz0%j%)J*hw~?|%}UKIlC!>6n|Z}_ZAq(n!JT!{`y8GL>pa)BS-zQhLe>R|
zyUWBg%LnqWeOQ;Bo0k=5R)fy1nBQGFc)4PCZdK;)>OF<I2iF$)X4X|(;P%aH(8I;b
zbBkwZUX8XgoI6}OIM_J4b?#02xwR*UOE0diyuQ1Bd1if5;mzr58@FdRh7~s6vTj)3
z-FkTrZ+7M_Ve{tYbMLsaUhP}rIbbNqT8SK5KE$F}#9KeeTfxR`wjEnY$ATzzt!VGg
zZA-l()jeWRxxOv+<b$H(w%(I%wO2$-D3%Kd!k8B57!GMn%T6VV<y7lV>~(7C>$`!k
zpee72F3d6HU*B0q?PZ~NZ(rYuKH5pP+Do_E3xx07$lAFL-+h#|oB3)d$7=81tG#iY
z{o7Xi3$ONL5eL|;1OKDXAy4*k+9FVbYo~~*r8QroIef-s%u?5%DXFb32?jW9Ayfqk
zi5*mmx2&<uGLpiAbs}>|O7Re`C|^I($@VB7MaG=ED#X+DHE9Z!EBdc{!wESCs{J4f
z+F7Se3CQ`p?4RD1i0!K@(Rew2|J0cCb6MqylNIO2-r?+P)0!%*J;r=&Fj=1{vr>)N
z3YRLMX$siiJ0O*=m~9OuWm1TduAJ|PVUoK>CR4Te^rnEhu-lo;rTz>#|HB{3mO`v-
z&DwaWdE+&5x!R3q)vhme-9J}tzI^Pze@Kq3+nQ^S{&0zVz4ra<zHiFb_UhRE`@QbS
z#!qji8~u+c6aqXKCwkKrJtxYDXr21*)tVW!pB!9Lx%skBO+H#?)8=z`&JfuOxw>^w
zsSVG$U=rb@ZtD;V1)?0qI}GYJH_Bg!6Tsyo5>C4)5lM#!Y(MKd`~R_bpFvHvi~8^b
zp@bfK?}+r?q&F#21hG(5Kzav31OW*NC3Fx(K#(p~iu6wCozRpbO79>DDj>?cKz+7P
z+h?DB_L(#D&i_j?lMk89tgPfN*M0qvv}~-HbY)*x(5zHV5cYuErKCV4@h#FKN_tAl
zJVO3kx6#AeJa(-xRW?*Bp^;s8JK>NN8y11wapqvi?!f(5guaOe@BEU3G;%InNSVEz
zU{bKBMJ*_#lp`IoxC5u2%xfDkvh4?@Q)|^EftdvtV{WF3@&#a%D>8+x+RF&^+Ga(`
z<J;Yl<Gf@Sa5#VpfwIkB9l5ri&I*U#mTkkN3W>3`LJl3XVN#{rk64AWRjdU;dP>)M
zLe>}4&k<ZmTtGrJJXl+wp&sb-!t(Kb3NpGlP3$U0oUO6QV{e~?J5^0N6THnHeaL(3
zp=a4_kk1?2d2E97zS4!(Jq)d?W!K<brpUx8>J4i%`|BHmpO#m!3k5hub4e`=5NwiK
zr7cT%y(3yn1j>2kSV_wV_|Bb*Y~4;>O#Xy-yMxN+aymH$pQQ19&9@*X`eN5BAZZK0
zZv;L9U$kG`P7erXKYTb@EKQ%BB{~#Eu{JN*oJgMIvulmu=%ZO^*l5Rb58drCrtdE6
zzU@!sIYC;d;yG#U66xureD_lX#Bq=Xej&YAHVooBHbXg>j1=m+QTiy)CCs;d8vWLf
z*KRN^dB;8~G$cjHt@N|JuhsaPcR&yX^n9T9-mP$=2dkOUC&f=iBhcx$*9-2Cdv6pj
zy<WDqO>u>jmJbfReC{tom{zcCd7DpCq08nqfo=D3{Vgr@3p?WC(#;OM49+ZFiKGQQ
zv-fPvLc)^TDW&a%ay7c&+|%Ns9v-ci3{kTegoCahzfHKTVBZ>&FwmQx#9nTHeE(JR
zz;U!F2Ezbr1C;dXxJy8#w;Iy~E(&r<$Z=3_i0}h6+|AY%!NAaUOao~>T2g+%CZ(jT
zj8uL_(c?|-m_cB=n&%a22BF<dClWtEQLGC&O}Ym0E?2a%ByipngJ+ONBipfh&}5R1
znYb4fvsK)<>3cMAo)jZH`0U-nZ*FE%H`@~P7?Va=@||SSHgk1~7Pv)PYqQh8gQ)Xg
z7ml)ABxEdGRTF4hrJa8ncq?%>iUa>{OyIFjgSDQ@`6*Y(!cG?TBl4`ni9x5RK#mBG
z!>&t5khu7Y=yRX*pdYhU$kh%wxSYB$@5tSa%c$t%(mG_<6(OT_Ex*p{654lDKrJ|I
zGlzLAlY_v|3TH{NlPYFdgTNE1+{U*o9EaC$MVFV<sk$sUcYXj<e=li)22)5&VxUlp
zoc1-Lbx>7kzw^Vri>q%~_%G_I-s*LKw%@LWeKDr{wnS{oTWz&LZKG$67@}zlv$-$6
zX|e>gMyKO^T;T!A>{LBVGax~E*tGU|F1_dZry96$Pq>ft_Ejme==^Zh$=CJiJ6i<?
z^K!LJr8UNc_0x`2)o?<^5iwWPsg^!0K&>CBJdFb9N~aQE9+)#opVG@y#kTbT7RJwu
zP(Hl)nE0wq-c@>IV9ARTgRie`)I(J~Pco;#Aj5q;jpuIRt*-_5TBToc9>wAay(qkO
zeii><*rS9_HCXMU>-FU^?6htT8=Vuni6ue_s-T%d)A2aNCBCXMF~6c)Y(7tW=&q-E
zm(Kb=&zkIIOOVc(aj*$EG+K+l9vf}de#?|#dN?C0-FNGpLZ4fLzPOD%W}}(YOp^Ya
zWwFZMIewwqqiHyfWOaLEq}yD`n|E&$YU@Aty2TZqykYG(i@#Pm;O@sevqW57*BI&S
zbXa@K!<<Uuop_1-3f=TUucYO6DS@YdeUOX94GCGw0N&%|@h{6y3cf_@_@5NM`f}H`
zWubB)0HbIYd*ibNiLPs4ES_XZ@qKYhV%NL0MJBkf@li|(+fpK%uckbtYP-$Wd`$@#
z9BPLeNv~V-iP;kyIo62T>t7C~^tGs8^y<o9E4%g3_Z>@@PFK0`OGr$_t#c%`J+u$+
zMm~99%tcn)eJ%KdOHRM#H_yXf@`1Y)`I`$6AJJ#R&gD;C+HrW}YF~C&+|m`yj<TGv
zB5)_RPt6arkqd_n`8``rd%sCn1xZE+d9Gxj^64&~yssT*uEZjLF)}l{BRqu8@i1j(
zT-Ee3u6;7NmLOAZCx?)1eQ3G&)Rf2pJHxp=>s5hTYBrtxR1QI8(LG$zu&JBj;jeE$
z6D^&)F+03!jMe^095*_0V~nqUa`5e}snL_<Z^RE6Dn5!;#PKKFeXg6LYmf+WsN8b4
zsP6EHtgL^xm1-3CC75<bS-LL9Ziu2sKrH2Rd5D>duZ!0^(W})Z8-DM7?+4F*{Zx%Z
zD&RUQ^k%kFP0gl0hFD%vS`2^bc{6LV>!9|VIlo4)PD$eAsL{I4&EV=jQ(cBHkB)<>
zEVX*u<|Amme3$8qE_AsS?>!!Rvm*KA;^6(kz4NU@C(CJvVZ(@L`<E4l$I^$z;dZhf
zW+F49x(apZuQL-a&&Jmuc1R};;qFxw-VzasegMR^5ZnvuauFV1RObZl4<H?aJ)7$#
z7nrOYM;qTi{^s*`w9TdUgg$Yd#d&bd!t)tD#ZKBApBc(`-6oRHoK~rn7FQxZRfa#@
zN80(k>q$ZtdIgYhF5NG)i8>-*iT~)-#<R?udNf)6_EWXL&-RUGAA-+s=M%U>)(=_2
zFZ$1Hl_@;jF(vsTOL210^KS3M7lsETfU@;axN$x*pXv6>+|fH`q4F-_Z*OtOkLS-T
z%%Pec_Uli+`Y(y@XAz(5<(hugdT~<Ilj`^8JnYTNiC<#Z<<FlV(gwkDb799_#zd<y
z-FSU6$^b3w07_d2id7dt-(uu?fQ<}b<$|+oz|R57R-OjKY5?!ST^1x<@J!hf)j&+-
z!1<7fvSqk<H$rX|p#TXCypOn`5$IHfP(lW3<^^hX2Ofz9UW5dFxEH9S5p>Nq=!O^k
zGEI<)*9`+?kSQb>P_~G3gKpXe3oHelDqG#bPBk|GXv-~6%WgIJo^8l|NU$qch>wPb
z2QtJTf()2IJm?My@=|@sg$&I@h9d(4ZIRIv%E)eHoJQ#5#CtKw&^?aOgznJP)li%J
z)Ja@n)fJ&>wqd!*Fr7tYR(Dv2!AV#?B)n`Qv~VJ<@<6<VE4(%@9Ig>wwHnTh2(Rag
zXzLDcJP7Z~<40*k^mRvEw~gqAM8;%B3}{4-Ljs3rA}4FOMr|YI^UkO*wCWR3l##2-
zcj}8V@Ra(RF^tH_i`;`qyn#fECt?HCmpWS238;|(fhB=H2Y~u&QF<a219pwJM@H_i
z#z5~x6L2FAYofnO#bDT}fbl@@Ym_+Bqw%?8%_m|=G#?R=#j+m4DSDzM$8e~*W0=<n
z=_-im@E&o62C*AGx-iMlW)^3b_lOEFMo=?m9+18i<K(>KKIFw|9dexyjpsOs<6C<~
zs~H1GUvz;d7)Kg0m)9aL^~9Ujvg`IdW~F&7G4@DF^D*-w!C-o<$%O<RWSklI6BKKL
z3vGbaq>@c&EMs=;i5C{XCWzVYi8jp>ce}&}{U?b0hh9BO4-OyE2*v!MzGf4`LIZ=m
z6Q3H<hK433b|um;CSJwEq*ROnAA%E%;?fQg$vsIWc(l)YlKrTY>BN$K&!jIgZi0df
zPhYP-F6B;{VSU<6d#~~WadnRp7!Ol4KN^s}n(R^#G%0O%sh#>MqZiz}^Hb>CQx-s&
zKs(1WSL&1|qS!li?E=lD-Lr3Mv6LY2E^V5scLEtp+TI1?ceO-c@|Bh*p9v$Mt#hBG
z&veC|TtHCdKQ``(wMj}p@_PJkQt6vrIu}hk*gnG>^^APo;ZO?1xSoMonx4Cs!D#%$
z`I6WNF&1P98D>!1XV6Y%ib_Wa;%8y<oGM!{ZL=hkpPedO55nZuvtHqyDqATU*%x_I
zPL-`*B%o}Steq-b0bDr-bxEhnmVJm(K~8Ybsj}q&d2Y`0<W$*84jB)9?m|an-}~I%
zILHP+SBpE>qagQ^ZSMW#IPbdLfT?8X_1vH^Y8X#m=!0j0_IVG(^1|@*1t)SNFGWYw
z<v+OukGqsVWt*S4o==&V|CBB=^(a4Q$|r-Tpj)HhdGASqUr0gzQF!50L3yux34UP}
zS7Aj#;huG2^;B4GT_MWYp>e%13sTe?RurUG)R7$8m0UDrY|+<S6th}{wtvxc?!~A*
za{R%InM($f1uuNLT;5(P7M!>{NB4YJ*=?z}__+E?Rba6JonYGQ;*Vk8sY}MY(mCE8
zwx8BZ)>m|j(@PADO+|M~aD56Qq)RdB1iyxrlJvQ!F4+?hWKoKN_i)Q-r)>q)%CzZh
zhzrYDW$YbZm0>wh@AJIm_Azay&^XtZO;r!$;VqY}xWb0MA|R8qz2Gg{S3Ysi7&E-w
zxS*Wqb@@f!YjoHZN`*O}v)woBE4ZKfOBPm`uM<lXoG6%>;gzLVn)ID1TLe|+yj2!j
zRaOqC%9dSWl|x^Z(*~eyRl5PWmR9vWhiX>`J8wNJa+ylwbz(;rmG|s52(6kRhnkS^
zn$W_U@V=VJjhbkJ+F0J&IIY^p4z*9hYm*9Vky>C!^h-aJJb?Ow^<m{W)a8cP<rmgH
zcc3Pit1BU>_phic*Q&29tb0LFU%OHF(xJX_qdqshzK*w{;Y)poOg)OXp-v0PXg1`8
zH}ufgJC8Pu`qYhpFQC8F(Z6IGlWBa#i#4%PH`RyP*@xrU0=Ys^x7J7PiQ$}8<}!hI
z5jV56E>=ZFtT~mo`GeLIwpQ~iN7dcICv;zMN}6|@hdJH+vzzc3X!9&ua#>q;rs<4~
zo3qQZHw%^JdRw*#=t#5~u!~SnQK;5A6z--3zGG{Ya4T^{%TE2hTw%=)VN_OGHf<3d
z>n1(7b}LwxL5hJ+g0I!>RSSJX>v`?=FjQOSTw9ylWqxhCxWJ|_eeF5BtqO!KJU3gf
zGPKLdws*R<6I6FF61HzWZNI49893Z=^r@qxtX-hLti7x=Z?4_!X2->ZPArB_58sYy
zw@%e7T{6C1X~LaWfS^^@l}y_0>`1M@N$Zxv=)%|GwAtle)Zxw7WyE*a?<T`7-|pCy
zj;FHSY5mkbn?09Oy0cK-Q*+&!ZYRA-$6d<WJw<#yPmX)vpxUw`I@+!J(u?}OrS~Mh
z>CPdfD~#xEVW4Xz>`UnHD);UG^0+VM*l2)(ftzrk{<x=dv#-rjGR?eyqNw}De*5Hb
zUvGcMi<Ew8LMA5JfnkQuHSGZe-@xkz#{A8JdDfxivVmFc!Oed9_k4rzcAMAD2Ui$u
zKr@5b{4}eCLvQA~KNq3f9fx8z8IKvz6%B)UI>S^i7*Aw}aR!FHc86#fhjRMSGi7M#
z))3{)5VZ~(`k{JjnT3C5Sa^$??iTy!Y^HbGLu^hXn5okAjKkoqQM?beBqC!XPGd|1
zI0B5U5|N{LcSdCxnZ&-1X!@OuU1K!4*f=I(GAcPRa&=(jI?*cw6D6G&EQY|k+5c0v
z$aUu^o#+1lt8AhFqsrFc*39<SJL2s*f$as|?Iq{!m8k8t;_Z#W?XB(Y_r&ja1>W!J
zo^}a*j(UGs{Qk?}`>)&YPl$Ig1b4ufcd%V{aHD~pp&f#u9isO;BqY0}g1h9GcPU+V
zsiSvkOLpmpb{XIAGLw8@75u<{`NKJv59gylaF=}G9s0ok{(~UN9+(*lVm-vd1J3n<
z_<#`>2pbEH83H^*aB*=V5JCb1ViG7R2{9Rzgp!<$mWq;^nwFl1nu(s4k%@(si9wke
z_Z%BD_c?ZcZcaWP9ua;X31I<gaS;V+2^l$M6?th31<p8C60M7hiR#cRmo7fJM5&>r
ze_dBo@Jh7t6&*bTqyM1r)&EoYx_&of;I62VXI_A(^N^?Xt@}CdUa;HVIYZuZK@aZU
z@qK>BuW;B;CG4T+h`+{vjeG^`|B8G8!WY1MC56M^hpPj^*RQ<S>lm~DJ>hFC8}S|a
z3dwa#$nAWW3!BaLPtI!z%fDBb|7`BRK)#|9Uc%d6K2NL&UaE-etjzyd8JbcR_M)nH
zsXB43CLz5xy07-da$QPE{m7^Kxa@|wp~kY!#+34=(bcB^E#&K0;j44J0YJVsU-tmW
z7a)9XPxb-G*T7WU<n+4_(|uzzn=><W2Qz&mZ+rLO4Uf+b9L^4YoEw{3*qd4$eYg02
zWoh}#(yO=26Z6YktINxumj55}Rr$Y&eDVAd`EsIIokf5K%Vz^Au1le*q1ICAfmEKW
z84qbNHNZcRFE%$Ynap1!U+ljkUt|FCrHVDTNGyZ?1^MD2S3;MbBRBOO#`zQS6$v0;
z{6CN{A^`cC#KadqMZSd7(E#!_g^H1ykLQRKqp@R;lxG`f*U7@E1QdXcc(I`z?_iz+
zWsOth%Q9UkL~&{p_Iu<jT`xkTJiR4Q$rFM+MZVyz)Oh0-UFWkT!Z}ZouR&soqme%$
zUltR8M!vY9CQu$v7R-FbgEy^zK)ym5pXwD{=G>N#2$PDPAbp{*d(~G<IB7yguejvu
zaj)XnZ(n*|d@CZ?r1$-fd^xIfc7D4AWt%%%ARv<YfqZGOjQ@swjsJ7xYod&|!FI2@
zhj&Y8Uy}p<59EuLb(ZFv>IqxAgm!w%8S=%8|Fs=Fn+A$vh>ph;G0`i=tcv~oHdvH6
zebEyaS*?(YYrCh|nE4OnD+=@N0U_Qj-#1G*eCgY&U%0}RX(kq;11z>Wg_EyuS0ypo
z9)0@oKGv>o5rQ4nN}MDmc3-I)RM+n>ylOy1rd_nh{72-AYoaV_CIPn|K)y0TU%Q?w
z{EB?R0p#oUpOCLroP3j+vIO&L#sifA!cC?@PXPIv`7`om6XH??R^%U@E{O?&3tMIy
z^b_29aPl|E7wX?az79{3FLr3W3QAUNA`drHk@^0y=`0;9RC`i@=*e{I*s)UO;8yXi
zb`=!fJscLl9lhJigjQbrROvJtw$!zmN-S8)su-zGtU3%DrFx18<B?g~jhY|G7YR0d
zq5Apynv4E1nAkz1^z=RLd<2=ZRJBJp#oTMPF1*t9EJ@DccUhBsIvEA8eA+fyfst-v
ztEVhUkuBkL81YBsOEsXrY4St^)PV@eB((J&TU7GLBEznDih$Yv9{Eb2Ra{h662v8|
znZetOX|GuJ#}5(xuaU2gzeT>xFn&Y6j+NCG^gC^iRCLEhvjZJp1ISnO59BMGCW6lg
z6K*M!5`wuTOsXjSZy;a0O1d&XkuRRVM!r1%fqXd=zi2l>c%lL1E9`HOFHhGbl_UN1
zOiiew_8Ib}OmWca5++@AL%rUxol%$N#E6;)j)qH2Y`J6gP%`6G|Au@S?F9Mxy}prX
z94uh+H^^5mRm4A#udN@**W_==7p8C!BQyZdUFzEE_DZx)jh?2{1f$xz5;y!{lReuO
zOz(cL4B<N7O)bzZtEUEKqhIX7N8v*Ac{{jB+Iz84B0UYhP?<HAeww(l<Vw*HWzrwW
zSLb)+OZ%^pFBSw<XAF*Mkp*!w0lM(v2fRNbUq{L^Q=khN!gEyPzan2~qGhFC%*tPo
zuOLE60QvF(kgwg}BVY6XKJqmc%xTJTX(O|nVT3^cksSs9Mt8N^vQw<j`?0rB1xOn=
z<}UL6mwElkt@BrMV@<Gp**<YX@CEu`mp8!O&XBLfe~Nr9oFZQYG8F+4Oy|2rB8p}G
zfTVnU@<m}^?XZUvs5=@asS>Z|L@AJ2L{2U0!p_4ks-^n8U(Ha&dZ;c(2Vhm#JVV)1
zKIWe9{BxPVM83p+MZVG*&ycTPV&PNdOZcylulqldFY%wq*SLntPvlGH4EYM8D*ZF^
zl^onKHLiIuJK~Yle93Rq>>tP%8bH1#{)Bu*1IU+c8;#W9{VTEwyBJ+($d}?7@@0V=
zv_~`*1hM3RvUdq`#YkTo#hG$dw(X#N2xc(_kS})t|M@HA3;p-VR|w`RIhM?ykS`51
z&Q~<1#{UHQ+9mY;iF^(HCGzEtW{YW64n~Sv{M*P^)$ft7kUt?`uD?gV6n{a!x^R7W
z@P>Ymd~y8&`Feedd~xj%{sr>Y{X68#;;)b|e&`wUrT7#1QaMGwgk8bDr^uHmF0?#S
zD1q{;D_Hn9<O>RRZ^zA61oz+lmyj>6(o4EmNca{1gnZpUL%v$DRA*gjXcJkLTz(*5
zBRGBOB+j8w*&Fxc;rLnQjyR}`_WItB#d#-HIA#7L$k*M!K)z&Junb)PuaGY=5vDTE
z3X2>FlZYV<)8Cbt?g6nRCCgJ+VjMQQuWF=uXto(mQkn0_*Dm4z2>A-ZRK7uKW_;fl
zjdRgLDoF^(U5Gc5MeGOiwS&F7M|2~EJLu#=o@F4()7e}f9%^^vT$U$ze}R1MV3(?U
zHko<aCNnrs6%_O2_?yY6ntM^X<;ql^B47MwE~-1&O^Sbod|mp9e6{>UzFM%xe<EM}
zzaU>0{{;EM|F4j*9qfUgAIKNKE3d_W1NrJWMZPR&Gmr3d(#&!^VdcUA@^yqu>`8lz
z3;M1!7K@e0EX4ZoB40_VXP%HS5+(!G7=OCrjagO}(or<?vP|C7kb$0BvyjMC%Kf%`
z1-Oim=EH?l@4rUAxL9%yrpon<1s(p3d{zAe`QrbNAYU;!Ej!qjAVsIr2G7}s%TxGi
zXrh)K?H0XL<jWF-?Fr36p2*}}us3{?5z7@<2FCEciE#JDjoIlCRoWr^75U-^kT02k
z2l*NYkS}{&zB+KESt}X}KAFNPnSH1c6T<f&MZO{xarmSORunC`8(J^h*Ice+>mq0h
zrO%1)ratuS!cwwAkEIZx&XBK{KasB^Y?(hGUt(v-7e5q&bqU%utE^MgF}a&<N|<Br
zOU!zlZPn1pZQsfN6Z!I=JvXD*=I%>ezC*l$?(t+L&Zw=8jKR5aju?n`#)A6!|Ac%w
z3E>{Ck$o+_p^oZ9$@Vun_ET8&cN6x5UiQ<Qr;+KCn6LMY2sfA=H)b=`SUPs{_!0>J
zhJ0ND+ul4wzM%gO@@0p{xl9M~{@9>*7p(nnAYa;lK)#IsXUJC=rpQ$0W_reEOcv-R
z-X;r+%)g9$@%<koU-r0FhJ+SEe~)~9#Kz@@zK)#vic+^|`InF{)qf57;{O+sFG<|N
zUJ<|YqFWap<mAexe9n7r@E{_-xVN`m%I!6Sa4E&y8_fSM@@4mD<O_*q`uE6}*ssW!
z1#TG}BD6uC{eo1};kvdKG!14tAh%}B8)q24n$3Gr=HN+`0Q3eg)QET0RBL<93O4}V
zTr^EK{EW=zX%(0h?+C4ntN%yj%Tuq?L}jCLo5|uQ^2PVhk*{GK(=+5t_}@XkuKpGB
zg~GD<J@RGxEAmzTN94=&?~yNI7EA3j<csg`kT1<s<V*Mr`4WT4c((ir`BFYZzEr@T
zuDikFahX;jg~}+&|0U$h)ANws5Iw6Dh({@4If0&2K@xnV3^y#Bt-HWA<vaRU$X9Y|
zg0R(Kw$bRaPRfOQ+l!N<E0@!if{4!<kFm*{%8L$&Oo;&#G|2A79OLozYehzt&P!9{
z8#hYvr~Ur3$QPIAL3m)Rc$m@N?JSlPN1IQwcID=$$QKoUtz9+d$yez|&5R{Csvk1?
zcy3MC-s++(etfXG&~r;LZR=Qk|8<RN7N_ak<HM5Tp|44ecvFs?E8YFU*WZXIxoiK1
ze0^D9*t%*`()jsyxJ%RPb^0NN5D-O-;u5j%fZV}i){s0zW`9QoYIWs31DTfCt}2Cr
zSeZf%F+DLhrA55(MXH&*!_qW1WBQ$RD*L<YEdC5`>TEZ#1d4lI`R?|R`B?Jy6a`y8
z(m0Q(_;86&bK3lGkuM&ZM-SX}vtGT4{afS<J4o=h=Kk<A5!zBT&AV(5HA%t8q*rwB
zhuKu>s#I#~=qx=|DW)$^1~*^1%&{;=MRM)&_;oGcYgcbt)#VVu!+KP8{hN9$Q*Va*
zA+PET$P)C5brn5smf()l?y=Fl`pVFeTG`UjPhP1woqNap?~yM`x~bK!v?maI8$y5N
z-y&ajD$MXBR)@=Bk*PWHM%MY_D86yTFUS{C@E7EZeZlfl&%`gtR~n;d6UD!We5w7r
z$kz_za^k{T<6I}rxdww=-pyeP$(srVp&VK9%~r4d?!RTXVIx07zC=V=|A2h?{f2zm
zogrVwKaj6)DhJ3yexHy&3%=>0{e>s~4^6IRnW*8+<@)=76HkraVq7Zm*P0HT_WT><
zi~Enr7y6$gUrvPXX0w=$)uD{n0pyFOjfP_s;>2=_d<8RZvJk_^EU3<qFBE`$%@fQl
zv=tZZV&9oVbD1xY5piE@amUK^JU12S>-iVR7nC;fuaPe#=5DAk*LyFdJaPxy6#5V3
zO9()|YysqJ7(l*Qe}{YlAL$hN+R4DS0FW=ezd*i-{u%PM{T=!8{0H)7`vdv1MKyJv
zB43LH-;poH@5mQ~`9nM0E8UFo?~$+cvL*!~=S)T`vVRfzY9kJq<p2|qq2W+5_<XpM
zjNxpwpsfWtNf7sCk&(`XZCi2|LNtB((Kyg(MTIfKY&fvqeHcNBZ6&u6iiuTN@K%*M
z1NH~xE1YpQOS~jT&1~0gFp~)@AInJnzlVIa|3JPRROs8O1F24tuftY~#1R~dQWm0z
z;yg-;XaM>8h$CEcktLBXno99n0lVFnE`EaXCYfE#<Wg}|)%2~MOGS0!-XSzRcM<~I
z+n5hlyNI#ENcNSnfFnG;_u72kxx11#e;I%Ouxwi7NV%OV1Bv&ksq`Pn*Dm7rYIimV
zzDm$#{mk1}r3haE$k(G&<ZI$L<V%tLH{@$|j!tAPL}H#`p<Jk@W9n)!kTDE^P~(BA
zAT7{KV|WDGCm>KI%P76JBikABMF+>GVhIrV%7Qs`gb{adanasM5o-kvAYag6#<Y(e
zQrGchCO2sqb8BPg^IE`$H}%QoTDm!<J0A6LEK}%M=t%z&`9j(Jf_y>eM<PQ-b2cE~
zkuOLa3*0vfN&^24`I0+DzIN!}w&1(P<PCFN!Qm9bz$bi{^g59xR*Hob=aynEdS&%q
zamb5ImDlq`74ltT$50&oCmPf?c?c2hc%)FnTr0<={Y;CB4R?sen-#N*ftO<)wHuVs
z9rB(p4>xh~k!JNQLM{1nFZ8usrkGD2Az!qRkFNQb3k~Z4$d?2NhQ|N`y@PhO(L-T`
zvOkcos{rzq*tUYi1kr&oKn><lHpLc9RTemN$^s#T28MYl9s+{UV^K-r3R4Mzu&~TV
zIM_Tw?J+=NaT-{ZFi)(9K+=E#)>CAt*nLkilSkDLKxH1_f&g(y`<Ouicu$_44@!Bq
zOZ@)c{r;c;vTGoml{^?e4^T$0YSt@{TZh&h3k4IVV*nTM;R|6H$$5rZBGDR^BG-k^
z6YROL6BbTTsWaKQ8K^}bH%{vr(p_5_?0#Oq@Nm<HYz-46t|1Acd5Z^X2RaE?+o4R*
z09HcQHIC|2<O_X<e0hYx#M{jQ<STFW943H#eT|4$nO@9Y#hwpkp5p+JuYwx^63<SN
zueOgIblx=21mLI0S7o!`_VDqinxU`T^yz*-kuUl)<cpYa0@V8*`GO&ShkWS;kfQ+P
zE0*XK`4S(K2@wLpIP!#^$l(4!zCz(|+oVBAA;uQP)eRW_p7fGQmHTSBs8k526bx53
zHkZDd6(K)ajsrpm5chvazCetnl6UEwqI_z9B44Dn0P^(|2c!{59iar8RRqn-k{<_P
zn6)_bv`89YU(--LX-||DeUny{B|#S2NPZ{>@Dt<^;JV8h@`^$aRG<e!&^$#7VWqdC
zKanpGHmDS&ND<(|B26b7LgWQ<vjt6lN4{k0B)LeR_yEXPdj&hr02oA?UU^qE7WWH=
z;hUex7yB9Vb*!R!HGl#@z5;;9HZ|q%$QQm;9=8M`q2#Z~*CY(g66@Rzs^R^Pe8ozF
zKrW)OoB;A=DUTsbN+C<iC<No60TGYlfPRO3wP!hCKH!iuM*_%K=PB~VRXY<d&xjFl
zk0X{9K)z75CXUJ{3h4myMS6;S!2sk-ybk;m`7(nu*3jg(;7U5EwRm;LYNuhaG?J|;
zLN<cv_YpskFTO@P0QoBVj(oke(Ss2I$X8w|03m@(VFr4^s@+wrQlJdN4)XR(4+-V-
zvNTDhV7h1=g>=m`<V%te1e)FG!d(qA$b;daYf6j2x42|(l?H=L&yX)OX>E<)BVSl;
zPyzt?3c3CR`NDeb10Y|p-yvT~VD->2^BAlr9-Y`&I&{5tzeB#H0&odsKwjPQh#$xo
zEE^mIfqh55MB;d3Pm!-(Y0hJu5&-#P!Qcs$F8dAnnt(a_{6xO;>dufa-SSi93zSz6
zAYZz9ZHf*6^5uo#tpMG`f>p%n<`oXQLqlHD!-RGex>I2D76WKY*}EBRaCEQ>7t(tI
z%VQo-*(`X>w`bfEO>rdv!xo;QEf>if>yn3k0dT&!esR9af;}Qg$;_k~y@M&_LTvJe
z2RY81FVGc={2;*jq5+(*2_@Q$Q|F5_2#b&l#QYIW@(<?=DF}TszJ|vO89jBrDgfsz
z_@o*PbBrS$wa+(h38X7+_HR=GwSYdV7?8G(@J(WHe5bw?G5r$}r_>i3A@aC^c>I+5
zqB^C%@>zvIq%;8ag(K~yuikhCmoZWCJM{&@HZi=~EH$bNP+!L5()QPGG_uH_QeSZ4
ze^6g|!s#4W#Yfd5PpPjvk?a<7uP~B-P+w+S1lO*;;->vced!0_wgA)@Yw5;y-E(B$
zsV{cQE{9X<i|i-$g-Iv{P+!<Ic_0G7EZI4uzPu1T69DxEBaYFxw<5C!sITzr<~kE!
zy#eYAcJkf&0@a{ou=o#uM}2|7lt67h%<TmnoNh>HNDifeCDRL^o35Mjy%gpIBHp<i
z&wl27fegvbYXRpAdFxRS;C!)+CK#SNUm-K$c5*+QFLG{~NVyQrt+e<TBjie;NBpt3
zwKC!vZ)`Ofhy-A)Ge~PE8ftU|l9C6=P~u#w5s%+!6p;aCh?BY<1YiomWOIxq0w|m&
zFsOE@k`fVE<)II4d-6KM^S8$AY@4vXKs4y!@<LH<Jv77shY|+EO$0er8W&kLMevgv
z4ha5mz6cO_Uf>_j*Tk9gg%~~|p11`#Uz6uZPo1wX#y2)$xG)$Vboe%O`Zn@yb1Dok
z9p+{bfCsJOOoWjZ!g2LLge+Gmyb*Y|N>DEZc1(+1-VF9CETagH=LL$1EHy5Di7RBB
z>N^>g1)GTkxx06OW9rC;H3`LHE5|UtD%WC|l@%;ZAI;o?Of<UFz(Fjkt>dxTazrwE
zZxUSr=c}T7JiO=LRc43Ugw)`Pz&hZclV+zjFHTBXY=(SzicItR7~p(C8r=0T-bYBU
zkKtJ5)y4jBz6R3DVQ0=4Xi(*Cb6m}-^A$4*DxEi;0Hrg6&~2!&0l~6sIH%5+)Exp(
z^^=A88caQ-_^0zYv!x-tpk#wdV@LxwXi8x49huTx@|O!vI;2chx-W?uAhx4IG$1e+
zhJxLlDp~A<tCQFe5O&Q%2uCb7^bJAhEWo=E2|$Y1uD}(8rq-Vsap62;!}jyaoVp`;
z{!!djs*r1($QyYtMmX>^K{%<%xN6(tbvkpofjMbdzpmok1mZFy4UE`Oi=Y&6zF;&>
zQ?$CbXn#6iOi_(?2ZjnP7?r;{Uo?T|0O!kVJ_c~U5CJYy;3@`8ehC=S1n4s(nrHit
z6U1x?aK2_&++$3&gG3tk0Ot$#!}%J;PyiWmT%A0re_Bu6t}n+)st1`Jy7=AsidBla
z12|udorb5*7sL!J-6Uqf7ULOCzYMNR!jN`UETJx;HAko}CsMd2+mPofTVjyJEI1=9
zAj28#s~Et-62!fF&6EaFtht`!Z0`>VWKqPHY2khZMZn8LFWSXdaq)4wzUup6CAJ0Q
zy$xe7#c5nLLAfsyK^EvdtjS{MiXJb!dl}3>Hp0%sh+H_MzGxZ}h#DLzrafd&sV@)f
zm3zQ3T^3R=XRWe}vG}v|WOL@R4FL6}2sAykE-H~&PJ<a?Kd7&bnetSNvNP%{e6R#(
z`8F-Bk?tAwb;AA>1Xy1}8g_@+lMLHIr82Nn>Z@=uIV$4^^)>M;^@WvLbw+(@e5bww
z^V9-%tInt|G(dgf3V)}*CIUQHm&~2E$r~)<zWk)VT3{lavDJRdqvuHJUa0}pm(X|W
zYj*A}Kz;2X((2EsFLIMz#(GxEl}>qFE`a*lyVJ{L!rQ(%OE9Za)%mEeo+uiWB_5kw
z2(Ib~B%%SG>(fvG#-8cRcB-2#2pFwt*QB)s8RU%m>X}Pyss%Y4IB8%^=&reQG{jQ|
z1K+1)f*tatQH59U$!ph6POUH4o3M#BPsLxTuUW+Q@@zIheTlfhyWRb5&!{ig(`@b!
z>MIYRzC!4cKdCPf2NJ(vfzH4J0`MY^D@GSUeSsXjf(ul3Y~LCiQihlnqe`_f@z1C)
zyPA4{`syHdBlA9^z8H4NLbgt+uYPl5-r>G&fcnyE05_geUo304XKkTfZd=oCF0V}M
zC<6fMi|M-2;TiQcc}jiZ=qiBV0QFV)agbxp{oq0t2dR@(AV}Bl4x~X>V^Y;j#LWvF
zDKH7ja}#lSw8BI*acR$Q*pB!uhB^w@Ehh5hUJW*d)Z^6KCG2)C@LBip*L&IDg72Uq
z@i3Re=b=tUA<l<Xa3t2uI=*Qlrk`!d4Ri=MB+HeSn&G7f&Q=h}7Df!|!-TAz5WChC
z*D*xZVOC8w_;kNCfkDiq=m$$ch9KdrTFKct>~vU5eVw%+>_L;|qyP*P1|k5xQvw;q
zvk#qT0<1QWhF)-s5AeG5Ga1}-2oO{X^rE32r{-2f=LF_+ACMP_G!cdY^&+d?Wq7x%
z3TeP^0mZz)u9AbH!s~8(fn#)l+d(z8UuHJE3lAE=9qCw!aI$A_BSK?zDS#YWu9KBw
zkkpLER|VVcRK>r5H;@MqAwQnPZghim?|+qWZ=u0auED_ygUFa+(6J=6%>>ZzP|dPo
zHk0zmHhUS)@zSm0Dx3rw%z<;3!8Iayu_buE!_*J$Za!TJb5RtyGlzI~^aPf_e_Xs~
zgOo~=15rvf;6a;-q=JAci!KO)g-fhT3vHRYpaI5Vl3LMI1*lC`sUk!Do7kZQGARZa
zvx*p43Or3pLS`BGAubdevN2?B7+?w}LeSC<3b4lpgJ^5gXE8%6=~86TJ*?WHi9CSz
zl`~(Cf2Mu)-sxZlt+#++`DfZ!%2lCL?F%e<s(sxgi-ZJA?U(N;qE(5W6Dzt>6?Wi(
z_-x%LPJVD-2wIliQ|*hzL&F0)m}$cUXkRRNvjFlHC*X7>c8Yw-s0Oq$e@DKYzDR7p
zsk^_oO=LnM{;qDNr}I36WYglePE~2$FDZ!*gWmoQS(hc^)~2evzH48m$B`?}XUJD|
zz4g{Nx#NQmMyJ}Bke$=#85Ik%qo)G7SC@yOLm*CFei!o`E&hYl(QtT<jzPFBVN)(4
z@8h!T1VL2enS^FXcotKlMIIW)f&`#+7(Rvls3u!3(tuPr5v>$xH<~E5aN(h&D+om2
z4<KI`>5P&cHn?jSAH7GSvL8)t3SpCJ(AY3}jPTR8Q!A~Wj0P)|qj&J)wW`WOsSa4k
zNZ6jHU*QChFC%Lo^(pW3&%8Td>+t4!j|Dypz)#K<QNRRo+4;W2K`FBn9dTt}<h*b`
z=W!=h7*E38&pNW}Rz}a|2kgRbE0nT|0LWJXzDa6q-4RdG;p4l;G~@@Qyv4P5#ECfS
z;-3!`6`Et>N7vCk-N-KFp>2Qc9;TG?vfv>df91Hb4}aVXrh5Kr6=l(j)pKDcQ`HN}
z^v*9Q>|d)9IKj@J7Y)oSv`d&#lqq@nc^*K%zS;T+v|td(3Zby+9WCp=evlwYj9*7Z
zwBA)#NAhch?G@K$ixo{1SF0YERT`uV^`XwKOr`a3<DP`Q?B(y1B)~U-^*?2FIoi|V
z+=#z06ep_UO~iV6wak(upu1=AUaQ|rH|L|H<BA;j^wQA2Ya97_<3{f%b6?$h@(C9|
zNimY1Yy>8WEkCK0e~HV2H-AV-X*z3K#M9PoowK8bQ`bE&Lb#LfTSc2X{l@C%kf;;Z
z2sd+eh5i6_$jbA}3OR$%Nf@dOi>G;=STL;fOuaUTq><X@xbp8N%tNHg=E{3$+^=R0
zoNw}FEtsx#z!jyv{e_9Sw3*<<p|p))sJ**x^pzSksX{bZK{cMcQ>M2h_i}mF+9<$%
zVaaPjODBiBMfv&4Bi=e~3gz@qRRG-AWJY?&k-@}C1mJzGo?xAP{d`j74D5?toxsqx
zIDmimzEH$diP-Y%u`SraA%ORV4R~MSR8Vs&$@KJ(%2Euk^#;5+Idp1u^I9ni^c;j#
z0!CH2m_8_m(yEY~=R98wpYU+>*@fcbFT=_*J8($B$5{CL0q}dL-WT+#=MHPIp5<j9
zF2MUrcz))6<z8Xtd9+NzsaHzF&oxdXrU9P!Wp$PE&2loU0^3%UMtL@{Gu^5}ETYPg
z&TukTmRDU;fcGWC(t7XI`%;Yd@U*3NWJ85aRG=Q7dS8Z$On~<lHhMvw(j|*X2k^d}
zY;p1B-835k?@J>cRe#bAp%+7OBAQ|*@7@;fzSXK`FT-Wd6w>w5%+o2cU2KBDEx&%C
zgELqQ@V>liMN>Z_a2{-Q5$TmGy3wf9Ykv2>HX2&BPQ5R&Lu}m#WV#26D9JEj+`gsw
z<iM7Ziq@+@_zId@2JpW0(v@yL*H1>IgpBDa1}pSq(*25jHFBwm{y@F}?@N~FJMtx$
zuc;I^^7v&%j)3?YXZI|f)$(>i#hPJ?@vsC!;MDtSjlUBYx>I=<S8--V7Dk8AoeaQ{
zG{clPE(N?V_!VD8B`78aC->GYj-@hOKNMXjT&0-uRq-wLbD<N0rvhD(vOx<3x7hy~
z@+HT2hrDp2L!_!KYN^oVUf1<WDFe+hAKthf)=ptHiQv776nTm80=@M@=8Qm{+@0ZQ
zMi{ibA*G8?L^$Z<a8*@RBfqnI;q=UQ0#0!#hKtVz9UT^ce8~yiy*CYC6sfMQea!2Y
zs%7#n6NWv~DB$T`|7P>9WDR;i;NFYrncZzq;;pMUwmQ=zg*RQ9l8}sE`{vTPZ$~@_
z^cgqIRAj!iS~CU~c6t`Osk~MW_0|^U;_=)GVw?zQA^tW&a5BrZcxx9muFQr1kT%WI
zSjw~s>$#8Ao4Io*1J^B`Xb|#9m?E2(Bfe=&CvQO+iui3h4cS!|N9#?L)v5(9vgRUz
z>IS_sp+);fzM7TyB#BeXt8U%vkHu~-Fpuj=rMcY1)j15BW7Lpp7j3+o@VRnHpj@r}
zvTpQOvl~SGZ{RqkNv-@aE;ZAlSXt-z9EH{X&dN*}1)g<|J7joKl)Mfd+<7BjUubFc
zs&~v0$fI2ZSh&p%Ze6K-n`OgkN1;b2o*=*P-BccW*>=I1$f8VgMO*LI2hpy=haJQM
zp<!jx>Lha@@nZKE4%Y@OqP5d4?C9h)d^cUKLvM>^-LkM^Ae*-7dj9g|{TGb-amfSy
z%Bmmkz>phIpOf**&6R@J!|+!x*n8^mE_P(U*uGazFV{FIRC*E7z|BV=wZ#=(_F1aS
z@<vVc=ZDE+`;0ClkouX%Va%<9ND{XGa-ur~UIceaufyNg7I{CHk_x2{w6P7LeIz8+
zts-!Dx?jce3r<9mdXuPMoTFGzQFZV5-Zo>!O)<gfT6c}URHeOO8>y2EXtzcyXd3%c
zefx)rVCOx-J+d`Dg9o+|Odfeg0V@X0(yvUv%!O&p499$$Ow=C)oL}j+rcICGu4f-}
zN!g?v{AJ#d)O{=_sh@D37R#}slXxZ}bKk2P`Bsqeeo!Tw0YX7`{;PmhCH?-pI-j|C
z0s)<_72*%XC$YZsU$86s-JACCr#+hGT%K9H7v9fIBVNn$JMx=jPcHPA+f>Ic?`|4j
z>-D+cZ}xUy=zQb;ew1930KxGbxx%VdHIwrF+1Z764~csP<*PXKEmsYik2be`AOnqB
zo9yq7UcKzlZ4~^ro0jxpu{rW^D0<JmMd|CdKY)A*o;cJ#{PwB2dC1Yl|La29jH{IT
z33fWDfM9RH6oWXuID@`Gh`_o7vCqPS<(xJ%$^7{uOEFPfmmPk64Z-COF!?6zo?$v9
zSnsIE6fcS;<3i{rW1`pqMqvgEVP`sFr|G!erGXYTnTiAnUoZo9z+gq&c}L|DTNTbX
zLxfDMl{+VC$K0%Bo;0ksnmO^261Hs&n+DH92kE(o2l&A6YKD1N+o;jT<WX~Z3}(kk
zth8i_JQZ*piJ=QdtWuH0#9JV;n{iZcv}BP6bU?x7)%4>-R^~fY;@w&WwqS-#IKwA>
zdL&|LwvEQtltnGmJB8&~pRGyAU{qt?sp57)KY~#xK<o`%&=&zDzZV;Z&%5@VN8X_q
z!r-!J<LhJ_L$>X$;T&|cIf2jxj_~nDQo;Gm>3u{@5-!K{OSX7j!cq9-&vBPr)rF-e
zMFt7@KXr<3XK+Bsgsc~IhCxlKUHs40+3tqKmx7Yss7VbfAs)}Y&R3^@1LD@{l5Fi1
zeRD!Ux_UdQf1x3rwQ6j@5rxC!i#mVvjQVml<Csvo)}c02fy!5fvliT-8w3MgV>u9Z
z5n>C-xh#qKK7Nk{@2d;W>576!!Hn@)PRMLW+w2_Bod^AGGP)s6+5t1;SvlQ{4W)~f
zXn^{Hf8Zwb@3;(5U-BK79alLnt3_As224fF2_aGBdX~<!><>0UlJlJxo?C3&5;{d>
zX*zRMd1Rj=TFZtQ;%C%Xgc9Nc2b<!e5~n4%++w|lE`7tS(<&GWP+v4%d=%j17`Q@}
z68#&vd})*!o%&kJ;Ny5pLwrv2<)z!7+SVs#q$>ibVl>Ue+RR7P#Jx^VtuLFSHXD0H
z7eIZ*SW~51+g(Dahq1F|2Qc0Y(drGBsyMf9sjsw7D8Hk0&lf|H)zYyDd`f+J-~-f`
z$@&@f<uT|?XsNWm#DP)+s4tJZ>8@lpxiE4?fcoOIaetZa9Jp-rDA)cur+u>ZgO|@+
zg#sqD*~xq{c(|;1D^IB}M~b#9b-4=K?4*fS{88or^(C<$tOK`j=*79@iL1ubqha4Q
zGJ#|9Ag2zNqkx0q--t=1ckKW)>B_@Q%3<ZH0oHF-L$YD|;X^S(R~-2e-G+Lz6H0^?
z7;^`03?9(PrXSQ7_yQCwG+Og5SKCfNIL}G4@e-|jyBbtXw`-Lv`e@a$#gMxa{P^w4
zW8-`Q^R<L|n+HfR(N2J1`l90}YN81g4nTc*5Hbf2$(m8}pj)J4@}>als{)|D0)|ua
zu3T@E?dT^)W;lUz^Z@D$OINl6q$sSUcXu>(Ie++IaqGa29#oLNu9jeJ|HR(@u^J&h
ztV@K88F7oOkiU&O9X7CP<LFzU5NN+|HY|y?O0$kaSlhTgBR4KMXH=!+UV2XT_Da2>
ztr;=r?T7Y&=jCe5X-#KMFKg>)cE@WKwZE$-EJb`bOvmcBwWG)2N`wK2Sw_qi+n{+9
z-$5JC%~R?t<QutsOppJw(Y^eWf>6vnGIRaFV9WA}fq~7|r&YR~J17}`^m#EFn$Y3E
zPlXD{yoHt|Y=GX^4s!H`yVx60nJ+c$D6z+`$s`jywzo)wEW7O6o=z3Ib#FW!;DB96
ze8_-F*<!$!I(a8@pYUAa7B}pFYvag}rx5RuR_xf<RFuJr;Z_{20I~Lhb@e&JrxJ_M
z#o*x)%c2kFh{530`TS=`h>(Zy4|ZH3Z0EwPaWkSGmy&TuGI2-naBqvPCBMat|CHyl
zNOH0oO@qW>Fhr3bGrMRQ=Trqe&F9z6x5ePc#hgo2(9Wwd4lj-3;qhhdJ8Bc~u$5GH
zY7od-jJm>6#^uCkJC}T7DO{7Ju!GUkq(&tk!Hc?5bELA;inA(E<S6DCMLNz8Maf*`
zTfRa--q0gMtDYpHcWn(!Py{B6AP(LZa7-*xSS?yCPEx2z>e~*^&*X7LzaiQ&D|}Wk
zuv#?VnJ6VJh^Ct2Q%zw#RGHE{m$(z4KS!~i2_kZR^SM)z1I9(AvoN>5naqislwMe;
zMgn_vey}w-h^?sghyb{A+O3D%@rydx&Zw^z3<e5YXG?hf8<;|AOPksz_1MO$vp)4!
z+#HiYC8TgzASt5>Gm$5)v}t`n+u2cLTc%@F78NY!an9)t2u2$+*OZ@(GrSq)T-Vw;
zlTu9lP8o_i2__0J$wyuS@G$8}CC>ew#`$o@{(#g>#oSG2lliv%;x-@tNm^3Dbpfm4
zut+zK_n$<dFo60JGa4x%BFopIZwqc?-Gw+HKHL>7#xtTkH!02Whz7CK(-~aKqrV|r
zjIZwWQCaX+g8KTyZ4dimg&OB)sN&5qX9|Z?>dW<v`tmAO#5@!vHFV}qy~6WiWDWCf
z1yq;_Yw%zMl$Z`bYHD@J7Sic0k$q8ue|h1W_!<N9^1_rFXL}2g_6Y6`9@1_qiW3n-
z>;S`15`u2K;Y>x5g%Kg@^87rPd=^sNfi{snEpf}ZS9gY=K3l`j0)B1)>I+O-p~!Q1
z(k83%*l|&$tCGi6bBO<a3!^C13tC3n8+?d4zRI_|iY0a=&?XoD9=G*_Jp0X8TQKYy
zP-or;8g@5)+yFfC*Q~sz41yw#gl?o?+DJ`9IRxFv70S-N7KnF!dHzPJ=4S+XbE)ib
zoLuBMu0chmWpw$v+FhEiN5SfZiBIJ@lE#y$?xH*O-l-|TvMUX<omREWj0bJ-x;#JN
zJe><}3KX##R=dXTw)~<kr$9uR`H^~8FyAPM|NYAkwEL^2cV}739re!(Up`+o+#->s
zDCuARyma47gHn<l!)^cNb(F)6$61W3d))K;0-AV_4MQ0g2G@j#sL?G7Dw<Ne!Gh?M
zXgQv$&-cW~iM#YobszDIH^)?Mpm7Y`C5YX^92E;!=h{?NLYIW%3|_0rwO84%R5`!*
zeADyZQO^qgp~{s+(hWD&Wk?O5y85o5q<i$leUV)E-Y3-Oh!o`03^{e~N>+QiNZxNI
z%`q-u>|R`3q$S$4ynJVM>%hhJzNAlewGX0v$UZ<Uu~?#p*1t8^cf`i1S<?S=wZFQS
zN*}pf!<tM$LEfwW`GU{>f>H=csT45}ac!k*PVjy){^3_;aG9E57pV|tbrpv;-!2f5
znf{mH_q>u3CiiQ?N~FRq?p*@R`|AG_<m==@I&NJ$iF5{aT?Vss=J~ozLFp{Xx-13h
zZ1uYA%hEYF>T*n_pW7VGif28)Ul*?hW~)G9v9a^?E3<dDK?jxZ_(&I?9LQ3%(V$CR
z`*j^{!8{G&f?}A?)zT%erR4d*JTX&Jy8)W>2r(=fz@seHYP+X_5Tj^2uYpL${~|S`
zywH!3XIVKn(`t9r%1_ZIuwz&fEfZ2**p`Dj4`DBB3zknm!7Qmlo%cm>u)-NBRPwy^
zi^AIkvI7P*5GxT%EV76#U!}ZeOeOn(@QbYlaWZXt)nfgq^Mtw_c|I4e%yGu+ax}mb
zk8W_bgF6KfIQ&Act>vAnUt}kMtpPCeap8Qr5{r~&TUUdBGaP*JL;FTsoy7}AGyOJe
zWtIb80N(0-N~PJhB*LOB_XQrC@Q9;U)BSpGzj~w3JLSeNnB=O;wo46y>2|{Vd7XkP
za#+g1Xl3w=zT;ID77CMMggS@D$oYm=9_7Zdp|75WgKPV?a<j+d{s?~^6vIuqcfKg<
z3Y5sK3JY3@jRn=w=58{G0;XfdPez)XzVdjA%$T0Yy9*`>_7k&zT3J3H5^)G`^Ukd{
zvGIRk=ZHiI3QfNCs+Z~qOU4o#R=3Hbzumqgzg_=%c=QWH#r5rzhtWfABC<_u;O1Qt
zv!$ES4kiS-%*}i6Ocf5`<i03rdvzHW_$~S7Pt?`&V>(jK>I(7GpQ4-ZmZ-3Fo69(2
z_P6cvR^Y`^wu$hqh!m-Oc8$HShFLkPkQWlGFsAYatjcNk4f5YXzKp8GY6Z~z@Quxh
z$uYH?GV&H814@;}L~$1+!nbG;c>^!J)0X?$4EJqEypdj0hl>F6bv@>w!t)Qv7sR}G
zznTw{rEPKh@J^-<L*`}0!y?}0z8f)C^K`cczJ!_0qJo|X(=u?68pj>94~!<?PgilW
z6Vdu~{2TIh<Zc45hWp;#A{eLf7yA6cZR&Db3HR4!tEt5jMz;2E9(#inYvbEqNVcrO
z1OAcXKF=_@vFhS9cOY~61Nox5_9d>fox17Xyt9tc=lpx#^9IKs0sgCI`zT3dk}`w`
zxm@#f<#C2DsSTCeF)BCl4n#~yvhdYhnBw%#ur>K>y~Du5==Mp=2=1^ob-LwOMrdmJ
z&6<m8R{Jj_(n$^{ROwIbtdoLBsynA+yO{irNxNAPH*F$VHd}DhE+;15AvA4Df+Gbt
zZB^yJZi0&=nSj97rFZRzY)I~@gBLPaD{4BZon9$%kogxVEmDaN7wLyHBGK?R?WTkF
zf*YP@nYaM$8o}<Aozh2bSApbsBw?JAS-dXKus{zdtmMwud7zOMD@Z{>Hl}xx@$uM|
z*LB3KPSP9>&+eIxsWUju593NXEi2tsGR7OhRlB+2KF)j_Px+CEQ^Iafy$KScN)NZT
z%c8p)bv40Ai!|w+jMEeiB3@!sF^9-bvM0MP>e2ChE2SjsJh^H`-mr$<OVN@@>mi-{
zRC3e9)=@UvU#VwLVAxEFX2^XRTYOX10iAG(?7-N1s%c0mv)h3!nDi?Ami2shg?T%_
zUFXgkxv9onR-%UQWcJOd=gRHOPNt!Op+u%AT{@W<MULqQ8!A}VPBwP0ncX%GpU-AL
zzMZ`Gd~_t_hM#YT%`@-ioGJSmuPs+5x8*I|v=;=K4{q<6`E_1@@AXuj`Ra(?4kcaZ
zPThLdyW4vOVPLz!*Z1`1ENCAaeS)Mt<x`taSmgA$_sna@uH=f-mUs#YM{w|@ZFcJ0
zl)XXC4{8*;t|%bF;&;gLMiDdg0-22OU?GuwMcKyV3G<5uBZ>6+sU*f}c$OU_s7sF^
zY%web(-NVQ->Ofl5D++tZ$f??Qd<u=*!$RI*_M_KPLmaRX9|x4!nxiU6uJ-YsXBO9
zM=~FtjU2praJ1F@j^)8BH<DZ^`{2a?zTris{SXCaD>#m?Ee4yd5D6Otk=s`wK4blv
z$h3WyplL$sK{jh*yO|!MDY1)~&Mllqu^+~tF;(CzoL4r}%W{x7Uc6pb@Th{vu|BLT
z@EApZW6fU4d|`mtZx`EX*80Z($KHK@HTib?q7R{k1XAc70!T+GBE5v(lqP}-NL4_T
zCel<Adhfj%dgxt>^xiv4mnKCNQ9uEK?D%`u+UHsOjCIC-abE0k#(8sJ_g`?0G3Pbs
z_akt3gBtRZQc?>8DeDYjDR2#zyK6(29M*#eugB`RqQG8QQkt$AnrFvY4zWWTRFNyh
z4T}zz!-XpKuhIHT^NP6_Yzn`c3ed*_DVDf5b<}Q=MpN<A=w$@p(PRr+ngL+;tHc17
z>L0y|hus`MIkT0bP<<+DstH!}Tik}5EUIVRWbtvg6#~}!>Fe`3$@3woLurnH$<Ops
z-hCp}YC6fI+|O2X^(5!Fb#2*c<RbuUf(M+zitqxMX&jJ|JziTd1d7g5e(b1sMtYY_
zgC#5s(;wCu>T*{jrN_EkNH}rao1}|jKdwLg-F^MP$kzkIBHCFv)f?X)jxiD}t=c-w
z*)^APHO@}*XfNHgwcEz4S2G@6RKtfPQW&WwMgen0{YmWenLp#YC#6WaZ_ySCnC$5Y
zs6^u3HV`Byp-SY#`T@O33<0N)P)tCm>sAk^B5A4WB!ND94Oe3y2<umPm4R?Sr7czY
zJZOA|qAu#*<kSlml!?iRFFVi2S=`n#gBjg@o1n@Lu34|<pT6twZJQ*Vyl=i2VdUc+
zPyf6rK&;hl22XU%Xk-w?ciOBJavED~b-Ay4&Pm!H5D3O^_Th)`Auu13s#tPu%u&?y
zPnhj$i9f46z7YTscu`YRpswWvo1Vw460sro2Ji=Nu;C9T&ypLUaJQw0pWdjk2X~S&
z&ML=QohC#69EC_YPN|26setYI2L<yW2*YE{i|d{}Vh2;?C_6j4Snr^l-#IPOPWQlB
zmtjv};tN9Zd2p+wZUYgU2eYy-k>!$Fwws3_JWA~yrOD->bD?YOEAQWp5B5S!&HID0
zMeMrDy2-f)U(maO+)-7hYIW4h>jho5bYRb(t6iiv;0-;iDV*e1!7kkW0>(;`y8*aF
zP~Iu$>c46t7m0GCykphFSdS*Zb*c+_Giejm-{uzMwY<rZ7)U>50HPBsv1R|0_Cju(
zMC8B_F5)4BynB;OSQ-%(u(ipU1Ghjan^Wj(HFMtT7jtNoUznh`t99cXRNxvhy;;V@
z;Me{$_L2x@?y5qYSzo1e43X83yVpVL=$x>Q9OLnC9wAvD$aO?PZ;UL=kamUes}VsL
z*?pq^U`cN%k5Wkg31lx@>lLe>a)iCdms14|56a%^3Jo6R{zz8x;DLb{`Ra!!G<t(U
z&s|o&8l(qA7=?wfG{xBl0}r8QCj)k*){COPdB~5#$N1_8VHg`~Hew5PCmAt=B^{*P
zHW_Ej-0S7<A@{*1cYcd=Qz(mCHGIPVky6Q{>ePX6)f(Zp6$&UimH()&CS23%#d|#o
z*z%cp4c%2PYyOU}0J6uEVv`ug7AM^i8K)~%v<b@}oycBgn2in45P3(bWJ-VPKY990
zKsOdI$=Y!o_q{bc8bN*An*JMZAmE7`r0jT-LD`Q~(Eu5(#krw&)TGTrJA3O9O^~jU
zlJE4sShCg&4HiKoGnaZqm>#PiH@@OQzijE0@M|sZ+obmg#II`zJ);fGxdQd_rdhn`
z`R=et+*V23c^mFMnMb`S46?R9Uo_<=p`SU{-2N_V%x_~`YrZznPKVr@?arqTART!B
zXI=j~nmr;P|7dT0JzA&!g7YrHL<?p$M#XU#k^fdWEOb3w)}Lm%p4@HxeUjWqkDl_%
zb&u@;5v`ckeN+WgAUqx3cTVa`|5jmxJOF424idAD`L}QT;JqcwRoI7x9fsK6!yLPT
ztZS+61;(rHUtYdB4Vd7->QXsXv}Ei-^Kw_lCpbEH32f7<H+1#Yoxf}o^Zwf6Z35f0
zRQmOhSB15HjVz6mN)g3@SIi}E=cKO3K1-rP3|g_rSv_$Aa@;Lpe7>&M`rOo@i*!eW
zL_1E^X(w*m8hmU6PC>CaC_}b4;^e#cTJ8B3`=RhIsGvGCkO;A%$q|8p5z<a}9S_0Z
zi3h6XsIN!GltunEpK@Ub%5XtU)h?>42v;PlkK9_X!tqan;6qoTtiMEN%tmM#^#}MP
zVaeZNj{C?L`ZeGv&d#c1qpBuO#7}1@x(xtL8zv%wGV0WcV_JAoULTCZ!v4x1Q?T13
zRG@%r;pa<EU`pq44#g=N6$E_2nTl<aV|Rj4@AhBw>74`mG<M32Q2GyY@EcM`#`oJn
z`$51cd;kV$`?MJxb;9rJPhXMlKzSh_M~U2E5$AWl6G!oZm~Nvhj(rERh+1IRgd8Gi
z9uTJle0Bi=*$h!^mq^x`z<Wg-f?<IaxPC~3HF=6PJ0mHNA`u1GI+?*b*#{)(G1BK4
zrBhx>b%@e?ocmZh;;?;+yDe}VunVpxA_{$u9kz-DW2&7>o9Oe>&C5m>pJjBSdE2Z%
z@lbV;A(qYbc^zwcUEC2Kl?aFmAq0#svW!2rw(5%S$LJ^ruKZJza&ZBg(}Cy$ILP5U
z&DVx$Q5-2WcdH#nvkrDuKZiyXx$}EIPk4vR@UHpuIDr=u!N^y^Ng^uXSle_w$%#Ll
zM7%WuyArWqk>gH{fPXN+GN;-WTzZ0YWa|%ZCL8vCWsd?^({?22L+-N=Zr}`crNdmh
zb^ryf2KmVkafv!b9uMbZE;CCMB;YemzcNdJ73x+lf?6CtPRwzOAJh~e*@qz$3>H|#
zkco%DuEZ!gXk-kzd5Cs@>rGc#Mlc*GZ(S8%qubaz5UG~^KA4C4RSDob)8T_4R%>TC
z-qp!L2v8Mr26TsiW=xJkCA~k4)s+alF~hM<gB?UN|2ksFIjmoW_H}>n!-=2et^XK|
zmLHp8#DZ`yz`}*f6VN=N???W$`wExq;lB*lU;e0%m|{Fd)=qz63_w=kx2GAYzW6(j
zEB=__ND`o`*k$kJp9D&@og&pAO)>jbsywQRB&&g)S}U_j$RKRkw*g|<BK9X-`2ot1
z#dVAAe49#Q#5S6}<2hSOy=3IE7K56kZ3w6r$-ZdSV^`<ubi}P_O;c)3d2CHCyQ}tm
zgT=v$ZG-5Q#x6~PHIw+JbZC;ks;!LXb;c~3W?CYKdqlgX63ErtpMU0VFpp53cPVtt
zaC9f0FwUj3(ixTUj~A@1&KrNaX|hv^rS63NiP62Qovgq&<Ufq%P|+te$T(smA!^7X
zvpJ(b0OKQ~s3y)u_M0jwNQC8y|1YEwg-Y>3Crv>~q&H$CPv`_+z}c^N4DQ6PD~{aN
zGyzw~7R>@KpwO1?u-4~-XaG)B;BZ5>o*8pT>(2{veD8chk}kdg5!R`lS;$xf;5fC?
zE>f1gBT5$I+P#$w+MTjs=!HI4z6GRz^D9`-Q35&h;<lGn9&nvzT#X|Fju_SCz#Y<Q
zb>-uL91A9Pb1Jm=y6p5*XeJ|AM@7+5UA<};`a2&^>AROJmCM_!HmXa_6lOVaPx)LR
zPqMY2pc?w6O_1*f1-xDw6^26|f1pi!`IxYRmLS<8AI$+q)`C%Z-(TUC%7}3xhd;_o
zmEXXN-%#HsIV*2HJ#l%`M#%FsF}|&f@P79mHzRQScn80%OuM`9nCtM^4dcjxoVkZe
zpheCcSPKeu`Gb#E#^;&?FpGk@HCgU<RCyeW>nu&caPWrge25T_GpgmW$va*-SyQJ@
zsE3@IbAY{qteWTg9qz-M>~L;sdP>COAR!|jnwKbE-+TlY%H!3#mm$tQQc7f48SX&D
zAfHPG$)(QwYjQ1Vh}B%*VDBCFtzqC97WZcl@OxtD_gmPo=eHlX4M#Tv^1}@B6!rQ>
z-YaVn<Su5R(u+WH{jw8oi%PZfj$E)Z^~e7fUi}HaOHFT+LW9G>@`!dT(ft7Lo39M1
zE<z!@BN(CifPq7iw;t(g*0M~e0jk6d2k0g|7&)srAEYncC2kg&%g@+;;$Hv>wlxcR
zk`}@jz~e?2>cMDQ_Y6Q323~Cp2{a1}O$(z?p)Cl{jW7#OO$)!x$ga~Ao^KXWoEAX{
z3a|Q$d_^{<MZTYp?3m9vMMWv8bTZ~eQQ2_RKSPc)MlH=pe=-wtrbY8Ra$jiE(*+n_
zbD1cjrgWX)bT0Fy0{>Y{`-^<ZbZe~qi|FF45bus*;)<o>I+DgPETh4TUK4i1oVd<r
zC{vQ^{iKggsxo^F-;HIzbI!)({uR2=V75GMs;mT_70wgq1IA%1^m{_!ED<GEH&!YZ
zoAZy*wdzttJ^Zd!mkNLL?%n)c%Dg?sdnw?%3t`Px_cZTkHp)akn{7U<&H(4ej$oS(
zt6{h@>R&{ZkCP(+V9Mc6!NN7h^R5U73^*tj{GkGfH)~%8B=Vj$Rd>B(Y^s^;dON$u
z2!v1yBAfb~oAkaR7Ngyp)ANK{!rB&o(8d_9pwkQ1lx->5n!YEc>e8k>jWX9MxfAKy
zh0f_1nGN_y=>nrNVu-LaBkx)qnh8pm`~nA1X!2G|{yI@wiBPx*b4j9Xh}e0tKLU1=
zGP{Lo0f1RT^uXTdg{eZ528*j&w`otU(E>Nq8gQi-Lo~b#^&}6fFS=&E7mJB?hjSLo
zJ|j;AF|+s&CM8D?sv<vXe2R^)vhr`5JKx}pmYJ)!JOd8{7?^d3o3QC`!`@5NB|+~X
zDzVMKm?or?=`)5#E3t3iX;p|UEz5rc^HWq(s8s(!R}<^f5{Rxt-zwXO?>LNO%66f*
z9Gmil>KwWfeibK_@(*Q&8GpWiUNA&u6UoY~TO5$iAy0HMoWhCI?Q>mBujGtalZd*r
zguRzsb&4#KPL6)^uyx?QzT|yB0kau6ux(1N49e9yvou1R_xjIz+t5<`cb1N$haJB&
zJN_(n;8{9}%{$4nIw8xQFxD;_^Dc(0E|%pk4%TjN^KQPZZlUGw8>~GN<~>qbJ#x!E
zO02zj)&B#Kuh=2BUs;^LmM1Q|Ce8@X*Xv1q>*SgI<Vx-YmBJLvVv22rBO{lIy={tx
zZCa#ln&NVj;c`MOd-7WLG{wq{oW+bp_LP41tYP*9DtiXeHmiO)XKXQPyE12DF?Ij-
ztg6Ka&$bUw*glxF&C#u}@w71ouub2{{t%q~0UxdK(dG4YtinR><wrt1*~9DwDuszX
zL6Uc`5f|2E?-WQLcXH4ZEvs_UUF0sOc5;kjmot%U!z+{*))d1EY(}}u?=P1cEtZGa
zmM0Werm~mX*p`2{Enl)N&t<Q45wbijR`*s`yVyRFzgdQ`uQgh%AT8HUUT^$q+fW6p
zFI}#5DXi|WE$?5hN+>Q%y;-7K-4IgTkj(jH+P<k|xvu(VNpp2wU-6T%;`Z3<Z6d{0
zFGZ4z^>zF9Ws3G~yux~;0$T=VUHi>a_|;ad<>yB^I|7z_sH;5>_DwJLz38ho4EyKM
z_TASxU;N&z_q^Ft#qKq-FBh_JPF#Jfvsl8bDwF+EW{V(v+d;D^nqP0eOQP5SkH}h;
z*?yr9?Yo#j9N*i}huQ1ji8#KW<b1!(IV9ycj8uls5|O)NL98gYYAi^D12St(tKomF
ziTrNpf5b*~63NMswSIzn1hxFcbcciRbFBU8_|c=2NB&20_#;)06J3tq#{MUo9Vd^J
zem!}_=EQO0^6AX00~Gb?cjBWXnNLTa9jAUAC;o3w=DJP{JI*}tXV37bp>NMC@PBHQ
zPTkOd3_tye$Db_tACEjb>-+S}qw6f!|CmT+1;<4aDQ#q04Wh?LyE5JlEnMrykZK}@
z`8BiigPOCh$@BB&N<@&rG<c-Na`AmZOe`6C{MBJm=^3+QS@+eli!#OSWH$HISJ-pL
z?S3rhk3;mcHJ`1HHcP01{O^`MXp4|6`%q#2-uDuGt9-u3ZX`n?@>a!SgY#0$Ylu|k
za<$RiLR;kjGxF7KwDX`nN~Ui6Kaj7R+mCB`Gye<n)iRv-bg4aBuJJGO^@LYMj(~ir
z6o!~t_h(tBf7uFhE&6C4hV}Z*_z0;fW6LfLALfKAwtDy0zs^*ORct#y`MUI{Oir==
zqVL1l*L6hRV{6V&*{TylY@RP=o_s<e)20}`n3?e6j{>0~JAKRtw+YA>y=53O_)uZc
zI@J4qYNTu}EB^*UXwYEhweH|r6t{ADXU~l<haZ<cRL1H<Wr#LDXGLwVSp~SO4#nlm
zcDz{crWP-?1wpTS$4AR9Q`(16uK47VBual>2SN*P3j|V|39nnHKW0y{&Ty(6dYt(@
zrC~kYJ>p3=s~-T-jZ$A*8`S%fh5*7XrR#w7A$n4_{u7tfKzg)O?WTpo;%9ZxkmwhO
zH(v;Gj9}@sO)Ze-3xrBauCJk^*G*Zk-dww!j4xTW<G!W{-PZ7@l`RLuLN0F8;PR&*
zv>O5#hTZbR8HCafpMZ3EZ3n3fc^~9Uj4$A2EDDHabxZ0#KG-46r{txvN1#e=Ii+;U
zvH29Gf`a)FWn8{m+_pEfb31#=$EO`vR}j}u>k1^co$T%7Y~jTc+i}YI^#x%mjh3f_
z;QN*5=7pAN)*;-BADVdHY&(qBaC3{Fj@;O8#bwnmqz#I;GpdI6v~GV1``#rRJ5bfB
zh^KrpdC;u-VoKwC)C)V#jn8@@ond%@3|dEC2jq7*duB8vh;!gh9GBo8#!oAA>VrkT
z!=2O&S0^YYBu&%>H{bs7ThUQKq&jHj+E}Br0)&bnWW%1{mxvs-GT(^Unf2NXz2CTH
z@i@&&1u=eSOf<)$b|lMxd&@#libD?1mkfEVb<uoR#~_*yS}FQ9m;&<`@A7%LV6k)S
zgYai+UVbDoEC$xG_$i1Z_SMf}+lH_W<RQsrRj<B&+U{%nI?+elTF&#oeBAs~e|ux_
zsYuHgc48-AG`A_)M>=5s7bq#)EK2WQ@jF-N-<4vH_wo8|=7ZNsc&kAGSXdgO`OX_k
zXDsmoPX!!A<bP3Sb#)QiNy#h1Qt7ImbQ9Fw$#X{qCY(#5?~ns}&>bNB^$|$zE-#xs
zH`CB$Je5mW59=4#Q2DR9uraY7<}24QHQ_v1phGW@U`?2oc^=K%G*xC5w=nPY4XVth
z9x@qQvy`}D>Sau~XoOo-W;{NHl7GG%47O&qI973FCt(|rsfc!YVZhp^r3qbei<v3O
zr$^Xiy>Q3_y}8K$d{0?W>I)*y2*HDts~?c$B6e!z%D;9ae5g)MG&<{R-d%&6Z?gxn
ztb_AF@p&_)%U;c-f}7U_l}d(xRM#dIA8#Gm2;|&vac5OIwd=BzNxa9^lY&i(y{<o`
z`{>qg+IglONGol~LB}KGZtf${<e)Y^v@UhXHH53Hu0h|%gLSDsNeaT0<*MkC_4(_z
zRCxZl#Luei9ZG%q1;=np#bW;Ea*kVjXXES39yw=85fZ14`u-0@>5Ux8Bssu_VqDLI
z7e;x-4>bjuNRB0IMei}-gOv>-mM>VDR&Y;conm4`>H`P~=duq2jgsG07fwhB=qU(x
zCEuH*_U3d1u`^}G6sZ<*^*P*rG@OyPeKT7AM8LqF`)*!sb)-ZX&ZJ6E$yB~7&wPwS
z{Fn(?kjE?dQH@Mo1bnY1C#1YaRLHc$iM1gkq~du6zj-0o$DzrS@`Ya2%d5?dwnfQ`
zYJ{-q<+*m}yZ&m&pna}t@WLPz>bCh+kgxH6OfIFM<RnG$rSQ_|tH<~9BeM0LC@mOI
zCK%Ueh*a3!`O`WZKwnq!x%`en+2R}+MHWym@aH+p!@22{`gbSg&LZz`uks32MPa@@
zd9PzKq~p~><Pmz;9fDsJIh}5Z-g5w%|1in6F?}!j`MPZ@#4^q%)qm?+rQIaU>d8S>
zTjpz*!f7GP^%!C&CHn*GwKB`In85aJ3rh5n+|s4a=aP7tYF8GW6_75Y>6lz4dWI45
zIzyHIiYm%5Dsb)Ov6&#tfvA<Da5CK1tJiSz(AIzzNVk*HckPXszwN7aAFf})yox`f
z?I|BHzn>QqCHv{@MXAaXXx82qv>o)8@-w)CXh7!OzJN%v;W>_*$!I|(S>5+@hEw_o
z^6+Qs4%4=<5Sf78t)ukJ^zBE?A!8PAj;=zQRnkxIi9TF*cm1X}E*;xEj<$T3Be}TQ
zdYnEok?g{d&H7mjuX`>Zw)r&It5lz!>2ajd9+2h6SVw?jRp;yV7a;j(Tda`}W`e~e
zOHpkdCW#q0Dz9#qpOD|{r|W-j&#q}tB(i@Swm;W6{-_fFu*4EC+c*e9neb74bJ#DM
z?t5pY*ccac{j1Ck?u22IGPb8ktA|Th-`<g=Qhj;)#Ba%4>~~{VwvuP!L(v0`--Yq(
zAFmhK!rTucWxXh#`_%opeiG7Xderv)&C%yiDfF&&Z$-X^=`Krrlx!m14^0aGUBDy`
zXzDu&b@O*=-K1*t9+bQeiSfJGy#C6v|95R-QexI;ONGK4@xyz^4^B7vLeB<GpSw1$
zW_|cD<&zsN^`k&&1usHZ+-wRF3}iMPkbe3?7Ujouf?TpUqpm-nd&_rHVZ5^M72-P|
zx%sR%^iSd!gL0|pI**K0iTyWQzH@Wq{d$erjzdt?@<h~eA>_@Wony<#(D06QZ)+I&
z$;;Bf=i$9ilYZQOD7dOBbk--e`ZM*>vu%Ozr{hvIFaq4Q@tZU9R_gMXuutE&q&Tdm
zHs2o?>%UGlg`Jkb-~4W6h+Lnu)Y<fAhBXcN9m**{HzIQiw-h{oM#3((VI1e3<YlQG
zH@x<g{Lh3N+AAX2PFEuzU35sjQLNGb^(+s6xU+MmxAgt0<lw_<ZK(f+n25eN;ke*<
zb@m;GCgMjEYZ2c69MF#S{+EPdz2E-iyJ#2)gW$)|q&=i)LNkD#QE6dV1~F{A7!IwM
z^kEookUcXffG;dS02d&XcAHBp;D(k3?_dA{`I2-9B-;%T#RbM)3zYf?`9k6RTN(q^
zPwf=={{#6lPY%=o1y2Y42lAzK8f1tIPPrLuy89RTVoeKvs1?FL8*CjG;)o0REfr$F
z8v=b1@{~W+Lo1Y5GsuNdeba_|4u-zo4VC#2;=>;{R2S;+5EdF1CQKU^I2aaS92O1=
zkDm{XoDWL|-HhcAPsfE@YlWxmh64h_Gx;O(n}V`W!;1%na<wAL1|uXL@DVsrq)T2z
zg;r$4DTYwKH{*Eg93t7${-RyZohqq-sQXqZMouESYN`tlB5GHnHnRvXT;$BIL@Owo
z_8+uMqf^D1696~_(*J{Y`BW>VipCJTMr(&f&hEw>SV!+OViuaBSEOUs%}|>lzywZ-
z8yo$FKUR4@=DSwh9wL@#4}ClsP2WrQn?D9WPkB~Hbq<OH`2-TsZ>9wna>sa5T-+~E
z3`{$wTN;X1j%V|UpT-dwAzs$-1mI~r<zC#GRty2{I`be})QY*W7a=&5pyY$RK9u;I
zA(3u24ym1pKZT58W94L$gu~*M1(InQfci3l>O*)X&G6WZ{Mb(pBvje}yhE}OW3sVh
zN;)#hR>0S+S?R%99D``gf1+JUPCfzlJ}G_z436Qc-UBJ;n<+QXi0G7KHg}0%-jDa+
z!}t!R#xBsm8A`KcNIR2AGp7J>#F5hqKq6$)8+Q}q1Tq?t>2I|?l4YQ&%}Sf6L^LJQ
z1hgy1F~f#2Bi}I-YnV~z=!PrFIPb~WJR~CK1oZP~w#Z;&d@_e9=$jq0)-+=24uMll
z**rc;)STHfGSH4@s-<+LzJ)A!Sk|yW&cm*(Pd-nNafz}+v6|^Qi{6PHLrSZTIpmBv
zn~rbq8Ri`MI4(#7F8AI7t8+s4@NX~g|ATgk0_lzcmnCmuW^aG{ygggM(g;Stz`2_O
zxwNIZ@ea8RrCCfZxk#rlg7(!&k;fI0=c$!<O*VrsBkx9Oh|q9e++LojQ~o3Ve2L*y
zN#A@0onV>L{3k>CiaG^f%`#CD1r}lj>ca(!paN}hlI~)Gv236|xKLQ2@NQ`#zeAyE
zY5e_`LhD70#g{@-iXxkcB5JK7`}3G58AUESZ#9RDOurPlIu!$(iacbaJ$;K`e|h6m
zTHHKX{6+_tN{+*TBLg4cBAq-#BXGqyT$EtR%Tt^$p-B=^vc^}OJe-%BQS#RJMdok`
z`<D`|Q|Y5^T>fHMp)bC)Lhw;ZX=&hKX{AmXmb9!UBed>8+55$Syoj<*?Pslm<<L{t
zj*Nn775|>n^1K0qWV>=%K@tDP@|i`SHz#HjrTGs&Kb{?~$or^UiLQ`!vJjuF_`K-T
z$Xsd1FS6uR`R&~84XNXvZ|*TS@$63JZ>J}4-YN-M`>zpI_y-QR-&Ji0(oKV_$@d+M
zh%|`h@{e2IfFL!H!YWF+{IN|hL}X2Ku-TeU4a%wJdkO*hGCuFEVPh%yFzYrXSPSrb
zg<Lb>%`7;us+p)Gjc0&JMb^ob)ya+2DeTuNLF!RL^{Tq{>QC!6BkQ%x>UBrzZ|~RZ
zLmCW)8jMHkQ#$d+QuI}#ECmPEWQZ;KNB<khm)FC064hjovIgfb(8|dMUC#eRzT}!9
zDR2Vv6}7J(_7CzETGkZ(w3*^ZQ({?jrfyTRUvp|^bCys`+<x=hr_H%?EhR!t1nnzk
z|7I!VeUOlx>r6{jB*y^aeYM<sWrO#Te(!}uTb@>vMIP3^e%iX_$c;ZKVB}G0XJ#0M
zFp7iQruJK%tqmxW^3CO(f~KC0w=gY^I2~`R59qeLV5HaO7*~XtXZ9JChudEx+lHPp
zu6$tHk$dWw+m0n_|NWHVY@g|m5WfA6aXaxSJs_)n^L_h04@P%d=I<j6;!Yh$k)5C9
z?05ZaXv#b2UUgjkVIup=z^d1Ybf#y&VBox9`f%(XfYj{MO%{-6q`c^09&KaP>ss2k
zzM0i^Ym|YPwMRCpLt3~SB}~uL+N1oc+i1P}O-*+mraQQ%mrb}wO1M+Txl2jDuMyQt
z@}yV6yzlaTp9*EaMSS14Uwt`Kz33mkdQrVM<ZBGR_Nc$=yQ}9UFU)*jZ@|5r!Hc!u
zua(YLn9KeZVLrC^S$TiJ1%o3i^P8`IZdrqdSp(>={kvrY-sOE!qXVhJ{W0c4t7R-t
zS{cHeS#m}hu*-uktwYV$195uzp+xiH^8Vp8%8|RM?kZO1JaeI-S1j+M7z)e>GFk_-
zoLTD1hbzo!dsv71oQG=4N6oA|>k0MC=ty&Gzb|5}?Q75YDASnpXrVJ}=P1kK(%6Xb
zxOq*-{KaVF*V-NHkvVgg#jMdL!|^5OvF{gS#u^iw^5bj56FZ~hP3uFK%j3+>;|i?f
z-?|#$#q8wK6OanJwXb8l*0=k+y1%sc1K37?wN8*+PVRO!ew~`4q?)d6B?GOnBNV3K
z71Dg)SfJmgxCz}Xk^3Cq*pKt4`J+d6awo~CX5=awZYm(f$7WC>v#Pge)t}93M$c+j
z%<7KK-u^bLPc>&KGG}}nKWFl6&NO=Ne#P9wu{n!xbC0M#Sc`nHz5T)d+5eAxU0?tI
zI`WnJe<Jd=!v5b|UH?7Q#r$8CE<yf(C%RM>WEGUu2t=2*s-m6-DoF$JFQw~$5?utJ
z>!I=On`ZG|_tpCzAneWW$yp@TThR|#F;`i0JhF9qW@|BM%dT#hq4hXx=rI@e2`k#s
zY}k?a_S5W_&i13vgd?AGSG$Ohxri3I3i-J?jk!q>aIPMYzc|;wWG;6vAp*`7=<Q0t
zxmsT-5M(af*P?l^<q1Alq`wyd=ki6%%%C;jW7O{kNX`W6-4B*a41Sdqtlk-{cMz=T
z8d8A?iFFE9o((nnm(ukjy!zjXuF5Fmk1_w3(iIYCm=hQJ?@HHXg4IHz-LoX4yrhW3
zq<d~D_d-$|7gHTu)6lr|*rjym7a0$OGrD3ktdlc~eq>rlX0=RZx%lSTROBQs=Xk8W
z^>~AQOxROc#lB3*eOi;7@-zQgK!NjA!D|B7m0Z;Ot|+sk*!Lf<3muMoL3pg6C_(>=
z>uN2>&XmW*R`_OAjBQj#<X81o)P!u+M5opT_0|=Cs*4|~k0EefC-q_fvbs7O6aK|@
z<u=FscU)I@d*=Tlc9nN$&vrNb?#cbqTUOg&(A7V)(BHg2Sk*9uTN!TsI$YO3@}YUO
zVr{hJc(nRpyt!ktZfml;Z)#_BYWe$A+u3x}{{nR#{wLJ+<3FLU(f=0e8b4T@`rom-
zzU(ai-d+8?_v2!3W#h}r?=S18U$=G+HqXBAULNjz{jqoc^V{L^!NsqiN56mmIy<>I
z`-R67V)_6eJm8Xo;NoDr0zou_=7ZI_J)v-Joh&WFZgnK1gwyh1P5wYEr)mVNc5T5>
zBENB|`A}`)NUEsqaF%vm(O9Om$Cu@yy5fnq%7I`u9l}ItzE+~3#c+MeOtC?}PPR@%
z>0Fsvozu#2L)phFtDXop-FM{+bq+J779;N}mKt3*hqHAXD_7ooAAMOFX{`FxfhLBq
z>orxc_k__1S&lZ<Y!1Y6>*nY+*M1&JlXyz#nAh!0U{xd8Z@1L%&ESm7EXP{@-?h4k
zGW7|A+<%VO_diW^*p(sxWc+Jr67Z>-KZqB{sqXymRu}xgSY5l_aGn$`E_z-lq6dES
z|7LaNL-~q!H{oU^3pPPA^p0Dea_88s1jXGo9;%y7|I_MHT<4*dZK}RTZSL9?0yDOB
z+)nQs)8Y=go42=}*%VB$y7>NOb)`hZ41W1^gM|KCT|!Z=1gq=AKUNp*?VF7DG=Hrw
z8iLi;Osw~BR+s87AWGRLiZfJsVN&!Tt1E3x>j*GEp)MOmu(}$e&_O6qkTk*S!iWP2
zR+lk3Kf&tSh8Kgkpj5Yj9{;ksXvjB8g{s==Nhs0Qv&cdyH&djriu?18ukY_Ih8vc1
z!yg(5dh-0Wy0(52tS*f}ZLt`h+B?E&gTy+2tu7eB>dK0cPM9TFT|e(;>58TOwYqBV
zvW^g}F32#!>f)wg@jq69x1YD0lmE543<y>iaTMg{S|E(K#4d4=bM}8)U9(oyBHhuY
zLUH0ka?>T^&5B~RN()xC!ivDTKyBfM*?(DG+QJ8-BoRCl|5#lLNGm}g71E0FN(;|r
zbxVtpnUnr%R#rvnC*YJ1%{{_hh#sX+DnmPOwRx>a5;Hch5N&*e?GP=>8&q-c#)XL!
zhpSrEV`I@$imE`fNTswWgJvb)osHPp2J&5?Vqnn0gnzr#muPf&LB)liT?)I53MN*W
zm=`)`VQ?KSc=QQ;ZXiKIy??Qz@(EzW6|RKYU%UN1cq!u)<XLX(^|@;r8&$(Ck9XS}
zKhBB%y+*_F?UiJ#IVaL*{vqZUpb%yc;HT?zh~Fif#sc~Po~3dr;$Jn0{drt5%RNj~
z5$lbNl!q^ymsV;nFu{n3e1j=7&9yIU(VhUDz3-p79~y8ny%$bC%6c$*JV`G}Kz(!o
zLAFpW*Nj`cJ>h@VsVQ<LD)Te^y6b`OTSdxHX+Xo6SrBCT>|%=R@iiOmsX@Aviyy`D
z+VK&9pH{of+b}+xZvTFx4G#BvaSoI=?%ZjbWGtUM5xYGxSCA}jl7N!M>@N3~#0(`|
zzsyR*Q*Un3+;KobEZeY97?v`26<80XIN>tA&KRT|!jG*J2?{5s_y96j)@6{kWfKF?
z?hJa#9Y<T)oviUNH0;J2MWJ1NA9AOsnRFqxxJ+{bd9QmiX)g91nADaRid;UfTf80j
z(p~!DEkIHvrOsdoX7sU0cD&FfRh-Ker!kM|;4mNUa00h$suU9ip3~>6Xc9mqHbZt7
zrW|AS(j6WLQM?Z~1C#hw`I=onUJpaCI%ILLeO3k*zqev`Pn)}dt-FShytYcZzkr>P
zckh$xL5${^N9K!X@y6T+XtBaiLe);D%IMHz&p*{?LOVkYt?XRwdJ}Ec#Ka6Kkx$w9
z7*!OaJUL%qIOdpl;^YT+_526JeS?z>zTH`i-HeySI*`Un6Po7n)_>C{G><gmTCV{e
zNEb)R6al>z(<iF0!WpR*FWw1aTxU7hSMvU-`0Dwqsk#xlKS2@AUfa9$Ou>-C6>Y3>
zN`v8Km-A)n!OV*)6;|$_SQ*gsrLmOfVC4wvXOBE5VRQIt&eUWfvS!{;lb#_=viDOs
z)jT%VJlo2BR^sV{)ctHvt8T>VS}__d7khiQ%O1L?iHV>`0g$<d=O9CfCV;X-V7S_X
zuEGZPL>hDP#G+)fi(=kNY68Jy>VHZ@^_b2Q5dHgZx&jfyuQ`iH);dhh@~G<ey;!rY
z>G#>g*sK_eTmH1C?}0>pZ|}g#peEH-M_Vks1!{rF?UxN<_Ma&};9Ba$fA@W4>ZNg5
zBjy=gzl*JVt8{Bh<ysBOi?M{f5VTPjn-oCxbabu{T5G~(+QfOJ%!CSZj^h;~;ZRC?
zPWx6KF38Y3%(M9u^|b&dYD?Mg@F9j3td8XyCC1a}g94>nyS9mtnCG%S<;MkE#yNJP
zW9Z5RVe;dkEsP4K8K{Q|T?3V|yRKYyPQf42DIvUe#(T7O4=a_;eGeQ4Ik4*4Bnb*K
zH?W=cvga>09dj!5W>ywU8{mh$2rw_uQ7&|DsPw9!73*F5*wKzzXFm?T>yVgIy4_Hl
z`Yq8~ZWlHh^R7O2<0}y5w>UrkQh(bp>bc*ar9SDrcLTQ%+%x|y@7`%_`8am)^8M2N
zOGbC~W28%<*4fG_l%FN#RXl%1B$vDNcUA2a!}{{gRp#(U^)D61zH%3w;Nq|zj-2li
zn(B>M<!lZ2AK$|#Gda0&hn5r6k$u*vWhOidh@vuzYT>mrS5DbP_nI4A)7h#3<~8?u
zJ*Rb<{|39B3KIR&86xJM#W~FB`|~(HOvSjAzHiM<;M|Zr5_#Km!7Ow_gA;nInuw!s
zu&<q_Mx)|*)1YL2vq7?(E2!K6DatV@t88t|jNY&#bE8(@w*38`J8K8cr!yl$4PkJ$
zq0y0VQGUrAZuFuWst@R=p*0Dmt1fr%1obdV?UwP)+EmH%tLHxb$Z6=&S9%i=qG*)+
z9u&b$@kE!z(qs?jl(kNx&(BN`<$*Cbm3{l!*-b(FHCAD9oTFC%^G5S5HVsBnB&$Gd
zx&MXdm8(F@kZGZ!1Ds4;VVZLi_7zWKULEsbQn{0QIAk@1?)2Bv78-az^kdKAmQOX3
zl6k^UfHm{fpBv-*^fT<bsL+C_qNlR-D%v7kR0D``zYquF@^3oFQSolsJXn_kbdx>|
zRuGE=iHR!4nq03`)tKp#_z`sdR+9X)R1jYr_+=e*KA*T59?%saB_Bv3vhj*)UPP6|
zhuc+AR+;!^zTC}S+2dLYOx+F6k0M>-B+jlcRh50;+Ikyoyt&6uv(+cqazrBb+jax1
zP1Wal<*EZaaXAs!R-n=P76=<Lf<r*=T&AvAv|VN#)u0XL!8)ZsLFo!m*fEwHhs&RJ
zt8S_(Jn#w-P&I9uL0uX^-0=jZt5zi-Ov3umY}Qzga0!ai33X5l?TX8+h=<G53Jw0`
zxF`zO^A6bzAWcx##qv@31`3!;M+(MEHyc2vfO7XW{!zMeiEB8ayt^p;EfQ=s)Z~=p
zpq7GsIz*}meFZ00uk&Qm2z@!IVUD0ugv<CE!`|Rjh7ElE56Q7>luCn=>OFk+g<;S5
z_|&9;@nOOnS~1XG;akb!nV{DLlJ}c8D6d3gv2dZ}8KGj(>n<Z$+A+!IDfz7eVo17u
zJ!3pCir1PzbOHQGx*~x%kBy%DFiG7yV+db0FkuokwFdMi6&RO>OK$@C11W^y#Qvi0
z@43n09?{--Z@No3u}~byZx%JLO8lb%=zdIIxCR`hCRU-ib}1S}l}A`&yf$Seh4V1)
zL@Q{7Ctbn$v2jAD^CG@=;@sH3L>J#0vARzZQHkJ{a@<;Kgq5*SJOgnuO;9JAM6uJA
zx;YhzbTI=^p297%yUB(LBi7+?Sw63%1aMxWGg*zg6VfM1QfOY4_ok@axhUb%7x20-
z`yNQ?AApQ3aPKkZf7v6<n2?&GEzms4rFxnIM8c+2%}Ik(8WO?jL#D_5DbMf2$@b9o
zM|@vwt&OOO>v~cL?^Cx;U-MQ?nliXPe+_XHO`;DcPVHyl_#IDU0!L_yQzgSGL*sz>
zscbE7DgS|NUu}d<O4`su4iZ5H^g`@&MuuV((sy%C7Z|_pF;yhzoSnS|Fk^wTSds@=
zvPEIyX%qz==hT{W*|h9iF3ueqIVN@4+Wc@LqnGdEvsu>D$j@`(@z@>Lr?p3vKrXT!
zxB}oOCA};V?Fyy!h2Hv4qU(<aqGXcmqc-BE>)Y4y`F!h??BKi+BF>$-0-cruy~Tn%
z=LH5C1(^WYvoj{fRDbGRVg*@*x)Xz`FLnHrf{&O2!v{r=eT%f2rI|CB6s3U5ricfE
zUjChA>c-M(a58sMp%~7aW^k$n0JyW0bZ3*wBvink8D~ony3oa*ctM6|=SA$H6lS8B
z{py!&N1}<cLgFu?9u~q9I!P<|UUn+Kw8>y~@GZp+7oZIkv&FpW5yi6V#NlxeK4llh
zPSVab;+A}3o)Ssy9&v*!>I6V3i*@T@E+3wR%`QN+swF+vOKFi5TFO*yll-!xaz9;x
zfsz$-Eg}OaB&D=uO%KWop2%$)m-b^QZumlbCo6m73Krt1N_<Nv)+&Ey6qNZIWD)sS
z=?HHcf#sNA?hFT$sw;HH89_c1mQ}K}tja0gSNFLB8>z|01sN^`{eKVGcUHe7GjvaI
zRr@g~6|qsXL0=@RZhBqoC5;(o*NIi@+)N8zr!7dvFI%O92ZIeBkc+(sN|zO&JFQaV
zgMsT*blUK#HP6Q{AN5j0RMNpTiJ->(GE(~+34Czcr)K?&BD5p6Atp6$$ohrqV6h!Z
zWjXjT8kysfE(W(q40`8DBXSU@bZ11&(>qk;A?pn}pdNG8t+Ij>qawY@I$bbKzq%;N
zI<g5w+2!GK(*Ra-__{+&*kF!--#}S4SfY-&Og6va;Y@YpKy&A$#GB0q7fe$#E}oc3
zn!>PHE6rM_r{z|louQh>a~`OaW22WGt4~?Mx^i7nT*0y{S#Kw)&7qRBXsf4HtM(T#
zwv(!NO|Ms(YG(~>(@El4U4U6Cka%F0ii+pwt|7)x`I*~#_%z1$^hn6A{q?ylH5D=*
zHdyvm^C?RovXC`k%Lg`mJlES~gX2kZTR=6TD3IL~ay#HfzA+8I!-8NVDY!8*x><<z
zeOW=JsE@V|)iig7r&Zp~H4xhcr4YKx84lT(BJuPFCKx~@OA8j33Z`ZX{V|2H+VC}&
zOkN&n{5IVD-CIPB$>}6awunw#-i7!_DkfdL+~^%K>RK<@-b4c~%G%YE+r4vWruV>;
z;g!M88py^fufY{6PS(wpRp6glAoTP7yik)aIQ*5H%X2-r(J#G$X876?j9TR{&c(V!
zEjLVh6aH5HM?W!gko`pkOHJ1G$t-&OFA_dc(3Lj4b5cczzi%PF;9hHi*()exR)M*2
zKlfrEUtEEuX8*Kb7kcg5a%Z>GD`*1%wlDe@=gRZ}ZmfZxSeZ1u8mSkiX!%Ojs&}J}
z5R39yZZ(c7C=u+;Nq$Vgxv-|1$dM-Jk*V?#+L@6KO3toU#GwG<q`ELkn2n~qAiZ_y
z;c_1`3nF9%UN*Q<WF@El1^7shYU+?M_y(-R4(l!ot>iKI=ph=`I-mrr^((`rJOck!
zhpnsUlR5i(RzcSWa9#9{wjhNCC4Wg$fr=-Yb6i0n+H?SNO$<%qSYA*-JmQ6c74O2M
z&*9)_4E(ndLT!@{35~IMYO2TJ?vmDmTVn;w)iXPBR5BtHQ)m)}htsdup=?i>wM1qd
zf(vHXc<#8*AeS4t!E?V~LFa9!_1fk}e~@q~R4Lw`<GJnUk5szbl?z4miCKRzam#TS
zo9jf#6B$8xnPtB!=W%!D@eM<1hoKT+&dg3IP=)v_=SQ_XYX9FKGz}-&kOeeEFIj5x
zpM<4>ZfhuK&_s<<$FNZonZYaEfeEA^Tc_jz(^#n%EF$j-pjMD}F$E|t7pS1j-~_kl
zroO2SCmNu=v4VIci&&gTWIQDVWcI1lED297Wwp7J)+FR*bMCvA4P!sZn!A$Z&TG`n
zvi`uKe#1`;AhP&sDESV|F9Y=2so0yj3N45;_CQ}RZgzROx^lTfu8H&HjO>GxSyu~%
zmaa-*R)lg_XvDni7$C_#FYYw1N^D!2!{dNm%VR4Xezau%)uR-Mm$r=>gBP~oD_g%g
z&qtb`_lk{AzIj@0mSE56CIu1LHR7h<BvXB530TRH@Uj-)at1q-5;&CyWtl`yS#$M<
z$N^Q)gL0r43|nD+WVNZfOeesOU|i;u;DyHV`9ySk$4JQ+b$^0ht^E<ZBWhk*#7Evq
zz`2aeO(}fyQsvWAafRHzkvx^XEn8AuA6UDpXvLO+xx{2F?}#%Ya@<IWt_E-BPHzI_
z^?_L^zS)qO9K2t<=3iM&d`bPHoti<;U!M&81Wg)0ev_@&^R+D6TtX4Q10#|qF^_wB
ztM0QolmlDs{wvfUjG+)3(P)_FCnRHEU(@lU!|a@d7?NP#8<W>0fCTnw(kl=u5AUh#
z!m(D5y0dqUM-mM8cd}U2rPES_uEPz4;6{-<W@X=YOvnQbItrGk2Xd&bgx(P&Db73Z
zkfW%ABoxiC52=lW{3L~j;mMwB^$+vElpU~JPwHBNLdbt~@)=O>$i_G)`QMZYT^!$@
zV{9CQq7<!{nXOwQ{G>^`$jqx(NNS)$R`F9;2C04qTZ*vkX;^d4x8NvPTBbO%%J>uh
zz)XQyZc6z;!up4Rb<0IS%RY2akLJ6u8r5)<ExAq9;5^E52R636mV5dA8-~QX8ak98
z-yQ}hdn6<}m|~75rB;c4?;+Q|dYG(A+^|n`)rPnj(EyQy+4bS(or&+AZtOpm)4JEu
zutud{JMlC4y62~MAmX<Wz)nlF131OWcc|t4>63Og^@U%2ayG=wHRtd;T9`+Ge-9YP
zl^}!;G%Rqx?keZ$3fv+;IbWCRDT(h$gp=W8xz~tYL(DLnK+nm;;JJj{YoTS`onnW_
zriLz(^6=*!aP^S1Ui@I)LwKJ*eB>?t8;Z058EySZ*wrcgZeFU$v-7V=mms`j8a2w}
z6n#O7ToDo5<1`##6~B08eI<e!j9|THn0Gn;Gwb6uhMjRl&nQ{ntI<0f*Zqj#=Mn#A
zbum^zRl^Y1?i83!ZKy{vNj~42pW4)nL#oH{+@IdkP7*Mwv|C8vR<sfpn{&TE^B9#z
z*q)#HH>+#cus}Q6=EXqpwTVJQx?9Qr)#|eDi@Emj!`J)uj&qgve(o!Y?;Jn%7e4%W
zVA1MxazH8&_uaI^pA^PxK7VN4E9t>o*^>6db};^$zNK71h>|w<%~+hI%Mqx_Q*k2l
z*V%gF#FbMtKvz;=e=hUdSw6nz%zb+-TPc*?;=z&WM=fjr9E*oX-zHk5j#l-2CG2;n
z3iW@Np0Q#lGIL&QxZfGwc~T=8DHFPN)ck2y$Z7SMX;Nl0rRvG2_U1po$JXDLy&YUt
zc(t^>q$hXKN~|w`MSa&5MP^cazzX6{a#aBfC5b9jZTmhWfyf<Kt57yi8%RTyZcg>U
zS?;>2(?7hs+eKsB8YkIFwrHTi%B^Qu)~PirHo#^<>#oI>pN|RQu%{Fk8i)xH)22yn
zE!ED?38GeKj+}MJ$=WRb)WufHBM37_9)cx&Ei^}};$wFO$0QeoY4l{D>DZH8w<+<M
zND=k9F%In@Iqnf5KZ(=FtC=S3)T*&a4(X`2B@&k-ViN*ewfJalrzv;pX=n7fmuC%)
z)Q5u!`%qoIy8f+QcG*U@g&-r<!q!qvK3z&Wm4{{B4LTNH-%Re=FzIZWyjISw!15iU
z^2{7)@;oQ43-fAmjwNFWWlzJ0=_j4?>7?iw=644;LP73)l>V>azb*XREhLr;14cYe
z*&0`dEv<fhHhJVttTD)P>llgSC?2Oxn}48JQkY_}KQrC(<YjW2R)k2Am$i-OnhN=A
zgWGnAccnw#-4YWdyGzM@9L~$EqaazD;&7ac{ET{Qy<ndvXA<!^(~a!zPRgTOXAXhK
z=~R0*J6&5%N>$GKb$FlN^ArA0&tquhN_$!sapkDCgndNm<8$Zwg$Od5Sw)XO&zd$<
z{GPXb;?@7mQC#Wg(*EbyAD2#IhF5jC#92SrUK-O^ZvFVg7D7^25eh2fduQospp^I@
z_nMrT3y+pD8d(i7Jx7)ov&N>EE<B<rpbgVg1ThWAy~fLz%aTtoJz4FG6}%=LJA;m@
zj7mf@qa6lG`B*N`Y`r%MBZ{6WTmAm{sl<`LwWnmR^~&$Cr|M9yLce#y@5hX((%qkZ
zzYZ@>s9ry&sdSu|_pNxLY?=Qj-z^opvwlMmw{CI4bwYXM8gjd(CzGfvRGGYTkLlzo
zXIMW?*C7fXXppgncN5gg9cyw4WW5Q?CuyQB4n{%$%y8Vfm8;@(n$Ktr3XEork5;on
zGOyxP*?LiNzOyRi`(~O-SDX|EuGT*O(sYtdfHIo%Ek`Zpb?mNJ3@YlnO6DPys@zol
zm0J&;l^!*4s4o153Xc9ef|y!Ss~;7Ph>;QBl$q4ZmGm8m_GqOBY69B$Kaj9fPldvo
z0F)fU6C5JPno5JS5T0Hec0K?p{~ZHKwsK`^{V;U}bS|+yoP<_Ux{D@fEm|pylhSK?
z095T-z?UQ(C-ox=c*b9J?%)!c;?vLK!c^>>wvj4b8aw%-f5iH+VA@cWp_s`_J?7Jd
zbdCp9RKj>E-Q=u5F!fL{1oV?cUA&f&Pui5xCSEPT6?I>hkzMpxXpjMQuRrOTYWf|{
zSVTE7q_C5Ovu2?f;p~zzrnj~a797J&|Dd2anY_RjNnyl~H7Cq)YC>BEBLH9?ee#so
z#hHF$XCPQdT2qZ0Q~EO4!#}eVh~i2Q3q8$;2AXYMfq@eNqcrHrhZwm#Yq0Bfwlo~1
zjyhYS!0YZeH8Kxv{918$aT;Ic8XREfdA=s*cN$8~E)D#oO=c5zxoKUnKryZa2-_Mr
zA`1!P#-NB_+40g(p@kI7@6QCTC2{VXbu}L&l>Lv7i&1QXX7`O)g4|8)wLc58RYaKJ
z=dZo1p`Bi{<Ca^1J{t%Mxi-WwZv7#9HipU>oddmt4b;d8h3I1`STtM%B<kmit}CE)
zXP5%%wrt??$pcowEfnLj{AOv_4l=gP%(wb?n}+P4w+HA_d%w!%GSCi_zre)4ndHnl
z#U7|N{aJoHSk}CmJSjfpX9-GYXzN>H^u87lY4EDo+Z>D1TPdUaQTZ{iaj@%#o|+-Z
z2i1uSo4i5tHP}h5ltx91`WngCP@Y_1_fR3pwH)ifJG-e(-`Z}d9$Qhx9dom+d^<Gx
zS+?%TZVLpsqW$gFFcc){F8G&T5>5d6q4E$FP0A!CFfN*df{>Bzt(@R)ux0QW&pE)m
zDAq0t2=EvM0KkX9i00vSYHl@-rBU%mcbq>zickeo4IYLI`o)lqN~_>H#gcN&k&fn$
zWLo1>@v5Jx0EhFcE~|5ih+RqnW8kP^pL;5#mQt0`_r@dkV^$MR^gRO{jU|6j<iz@#
zN|cz2V-7qsl@<BqE8`&P%RrU~NGRwBlga?jHGSd-#Pn_89Gp5d&}Yh4wvKtOjQ&ON
z*H;j!sB_lo!$1ZuHl$@5209Qo$<?|>22=%2_#VWSPKZT0yv?V(Qtzt}SPzk&S^SXw
zOO-^~bs0+AIUW7jA(u{pVp5R#M$}_3x*u6V6!x1y02)mMSfg_L>PLhpszyuPs(1|Y
zd7$zlO+1q3RSXZniU<lovw(>Li1`Ux&tR9#s4IYohf^gIfG(30CAu%93?K(7SLN&N
zJOp5e;Xn+D@QW>i@C6_nbQ7YTJY-Vl2g@-4h<w|K0BTqwyrL#l7671dZiUmgc=t=K
z{$Q2nRG~KLlHpMXQUH_zFu+f-yW>ACy}AKFGXOx=YSjq@SU<@rdQWwmlzJrd`f-sQ
znE(;mS#@{He%!5>!7WC|4!aNEs1KrrA}s;f{T=|IU5*GHGjh%ddEQAJ#2J*XYQBYV
z?<C_qj+FOXA)12^kZ{3sWpr`G5ak95!8ab^`5O%Grua60LYBUcS`NvAYkypuThy@X
z?z-im3`mjVDTUkW5!R*U1G3kXz!ni_-e~@E|GV#f4gj(8FAwzz6b5pvko$7tr_3t$
zck7|WCE3MgC3g~lS}zPp6*fsq?|OLWX&rzVFnI)wmLsR*M1yN?fwTjrXk-EZgS5MR
zYx@7g#=kMfMvv|oIYOknOF-!wJwiZ4B}74qjWHNKQlvWsDMd$!G?S8UkW^B^L?kZ0
zpI`g~*X`YU?bz|!-p`%S^KsO`aiX=f1OV!(&X>IkM#;&cl|hZ~DL=IOVr7<wJN&M?
z1&_!8%8D#PjbMH>2eAeETyb!TSeppDJKXkiUzIWdz@I?@K*msYXakfXERu2*BS2uz
z`!*2!i6`C`i4*Oh{_Cmxi$m2N3meHJOkxQ>+86*pdyuIM5!_CvtVgjAxF~~NQZT>!
z9^HMFwH*ebDV2Na0Kf-m!h8md#upHXM34MXP?dO>6O4sU5c8K>hV$AyL$3n47|XJ5
z=z0Tpb>H}~&c0e4bgjET@6B*+uUwxVV`vvO05fETfxPZ<^3ak_i@T&uP(sv*)g_AC
z^dGs)J;M^9R~$|^0EC9!Z$#hn?@$obQvv|IGYI$$orPWiRbUt8a}3#4zqV1MKLCxW
zCTJuPhCx68dn{ekt6+Sq5OJWttb<#5z%`L*J{*guezzo-Mi(#uWgr8iVd<OtcZOfx
z9WkV|#JH))-FKFv+yOY93EM3*hG~;=BG`+&AX0h#@3`u*LV}k-WCzr;`{EQw_Y=gd
z9*aN$!adbl)^J|S+H0F&{@_@0BHELk0;mRYMW89Quhy7jJekNq(#CrJT?OQWQ&TEQ
z<Ur6)jQ<fRDIY_zh6^bJ0Hogq_@mvl!IVe<R?tLs4Og{^^OHtX`r-_H0eNNQ@U=Hv
zSOSDytMMnSV9QvLT=P0oEkYf_DP&TnKXkKJT}c^07OLj{M8Ut#NYjLLEe)hWN#&74
z9$#*dz&ygh*;Zq17zIL;Yqxv?0m!t0|D040B@7GpjcwLOAUUmOp@0G=G)X;{D}xA)
zSDsCRm3taK&{hQ~0}xn3{#2`a3@mlTfa=5OCE)6K!Lbn_G+9og*-2~pj|MZOX*JUu
z0~nxyx{c1#wBX-+KcWm-0O%kOZAOl+$uli@HG0KwRWSjsBedFL&@;ielm%{GyJ~nM
zQT)em#oV=`)I-Mh=NtXW7i5H?g_Mm+azu^}oa9KFo3sU`N^A(0;C}L&yN1I1Cm~mj
z!N+JkI3SivLxZeh*zUvv+6rcPNq}Y%+yFZCCF7JT6f70wRQzbVb90(#bAdY*c0dYY
zai~;4_J{+e_{qdYUD80gCFFZ-om2Pa6Uq2Cu!#lctLNM6<NzwPreHEZmoOtIdo;!f
zZ16n}egsje{+QKBp}{^$tnR;*Sjn<Ojng?uRWL@A0f3*#<?iQTAuiUEAwB40EAL}S
zoO8TI7g+utwZhEQiRE>DoS=b=4P?mb+A)PB6dPhh9%ckK4v5J<iPpJ7dqSqKI_fQi
z1uc1OLD4qS#^iZ;Df8QjdI~c_Vlh{10br6A6po=No*^ysR}9anCo{D76`xC3D&@?8
zyGTOEASgkv?G_mozRmR?n1ulNrcR-SCo5KmC|zADGkxUq07{%K|N2yaOoQFIO`s{C
z(*HIN+Ah@4SGPLdPhAmOKClr0IB(2kj7Db?All|MjsVcf3_=?Hr~)mq3jjh@pzTei
zAoR~o+#?sjB`v@_!KuTI9{?oTQFapx_CGxAXRxWDiGW$9A{;VL8iQ>U?P(pjOUQwt
z8Veb7P|VZ`!#qa?0kks*ecpoRnWsB8iZNwGXrNuo$RFLaHbF~2C`Y?jlUtV&Co*I~
zYe-6lIBtG4S)<jnLqb|sl7BJKgo;w7@p}4B9NzgV4CA1m6}w=Krm(>H<J)A)$bbKA
z@Z<+Vd;!o#+nlTgXjogAMx3FrGb0iJMgkB&$e;lrm<0f;{KmZt0JcD<b-baiUWOuC
z23R_vNZI@>g3~;jA^-qoA9tHya6`J(;Q&xP+E)+=4QLTU1E7h~6h;6lgylUP`jYah
z9ohnYmJvH>i>6infIy=uNcNX)IQU%vfyHq!5j_+E@MCfTt+hgrNtYS0s(j#&Qe_~i
zv8dMZ%S&en^j$D48i4GrPi72SNmsSV?v!>&)0S^BrG7Ir#WJjn&5Hdn-3lP6zgkj>
za_W6w0P9XBSkW#QSfg9iAdFWQ<?pv3QY_hLdmw4R%?L1L(@IHF*?R~eL%bTVkck>z
ztx7`UXwj^lIO=gEP+1)xY~Qo8U`PW19ijdt4@~`3B4bA;Sg(VP8Y2V&1g?1}q#Ae}
z$(ij61+EdSRh(WDC_6`Oo!TMFih|5&G8j++zFwsd-sMJuq3BC;-;JLcF!221AKWLy
z=bxf2a(RUDHta9AYj7T@8mn;#ALq4$J^1xw&p?1zG#)phI+BQ1%G^n>AAh;F_(=hW
zQY{`f1E5AS#yDVT+JGU-Y6_bxt~12}T<JjX003V5NRxN<Dn<A&Y~?$7vXl2LSQA$S
zIYTTA60jMpyzWW|U^$|Y3pIgv0bce4Xp~pKd%1It#U5N!Km3RDF_Z&VPswg=735ug
zLR%?F6oJGhjw5V%NH>PIz1~_UPYr@#B^~rH1!NJ}evaxIxiik2GUDez()tjR>k@N&
zX}<TJE7<JFa4+1mA=zz*(4R=~jD}+M$b@BnVJ;m}SS>;gOR=wFR~*AQ#wwJ|6dWs!
z<V^nToBBIWXB=Zw4a#i8U&kw@6EoBosM>VNY!xJpJ11!a+`%M_-_FpB+iJ3%0Pa<7
z%UA+=;X=2DT({FaxdjlLhpKjNLinm-UE1B27pO+JgXeEE&Dxi00-zk;)yoc4X=siV
z0;M8J@jjTvS%siB3=`5un3@Bj?Hp<Y5M)yt^ZfMaTmcLEsf~|#GQl6=w)6`YIXdNe
zWT3ib2qgi?j-n%6SHp2@Zb(&-ksH-tjVJQH)PEP-_$hXKpt1KW^o?+$M&ut);J2!G
zRDH!B?0}Q$ge~wj`mkMw;zLzm;maH#F6#|G_=F555pQrz#TgK1BxUvS{-{W{@|{O$
zPZ&Cv89+7fUM7XMq;Q5hpitAVDUYKmj^2`!mR>zX1CBsh`yG%_^c>e7bYc&@w$1e0
zNGOrm^m$=lZGURm^*RjTnnY}J`UU|wP<~KRMO&G40WRroh0p;Y+S{(Zdo95LVAWtq
zwn9>{JN7jU%DR&_>?$=z!2mdjcr?0D>v+ckNXYm~iJ264{YnWuBqG7WMoS4O-^c7g
z3nQEjBG%(b<V)ba(|1yw$M>R%_oByrEj_UQCt@Qf_tsdyrYmRJIIv(Xw#swj*mKNp
z5i0D$vJh=|I728nD`PH;5^wHg-<Petvg^=(0kK8HU#)nT4O!w$R=X;gqAA~WkVymX
zH10zg<P#)(eNNt;B`W{@?HAZN=tMB9j#;ymvv^hM4h=MEQtL3|2Y}~C-9o=qg3us{
zCOCB)6WLc$+f2zjzg^JixH;NgDRVg#OO!|7*N9`$Bf8Cx23xeQ-Mp?(T8+?*ZP_Qs
zxWsTXL6m%bqG$nRae-Hfs*f*@gB^C@RX~j^TI(n&goI<rVU88~F02)_>>8B(JJy38
zh)Dgu&KmFO5a;E<8ciUdcBDdul0^i>A;;rH(WTyD*-VT-F3)fPB$}4rge>Qae9`@(
zf@bEgt~osImkOG3Rf4kNcTqjG0C1=*As9<(hlV2Ci-#YQ5dlNj03jj(vH&#Y_=+yc
zK0(fmi4{OqMefdqrr-w@=(PqDWgt5M(9VZOCp4*|DfDo)0D`8t`j&yAy$4M#ZUlhc
zVp=i)RHQj4v=zv=z2F~Mi8N=XiB|YYYLe6Nivhs!mW`FFU95`29cYf~C!lHyM=+3`
z1Q1{O;zywHW|~K^tHHX^no-J+DnooA@R)2G4{7qdM81S-EK>jwN$JFi2i^|6#)sm1
z&KV^92V$|7*%E|_oIe|TT$p@;Z5YC@xjrWFvjyw0z54aI;wW}8I!mkZWyqap()RZ+
zKR$|$bV7poF+?n2s~uniMbquX6eysDU}%7mbk68%BpAcb3Xm*>$vCMsJX<T!+t6OV
z`RT2#()ijZEv>63qzW##fnnE5rJjQp=Pq7Lo3T0B+OI9atq^`d)UpL70$sY~;Rb>N
z9@+qkU&8?}%&5qrMix8Hicks~lo9{hoC=(Rofj7LHJ=a2#FFpyx)?AR$7kOh13>A%
zNp)2u^EKM#27`cpy2=zf+AUes<jj7JmgUd0-ZGLOk-m#fS6fwCz4ZGfK3nHlmBPOM
zO=7;$V=(>N-QSXnul?ql&tLdBF1`NIvyu3emCrTGU1)*l>DR=T&b#lLCfF`n<JbBU
zy7!)@kGg3|T?k#T_x~&Vc_g9z{^7x2xt;M+_^KaEhM(e8VG%rjFPZH{@fRZiY=h<n
z(TTn2dt1oqa>I&k#Y+0(zaLF@&1#>-$G*?XRM*5ggv<`9%(zhjg!nDhovI9~`(COW
z-btaaovhD*#CHSG)Ma0$8Xmm&vmZVE^DXWV?tSFK_)#BBZ`yXj4RcrpVpHAejn!%)
zUj2mo*VIJGdLkrXE|6Dl1;@h^kZ_+r&qD<g#9{}MCG01%V-jSBayDexx*&qKl8-*4
zjZ{WX1PQ;ll?2iZqFIK-4W&LOt3MY;mS~2Hg*j-s3Cjv+JNW&zjn{c{`Byln`gu?m
z8|;KZB=?S{Fs*QhP1b0RljWrGQ@_RMp9xNTRlOL&NSSAaj+z{Z5*+6fM3l>FE28X&
z#t;3nG!w^}vJ6MgJB4_WfdNW?b&(C(Sl<_3(aQkU7ll=&ZQ`{Th$muoO+%^@FIyJH
z%k5td*iy&n?=>aW3tZfWO8txfQBzs*GnbXNmHb~_iFuO6@XMLX54kN11NfJ3Rub%n
zq2}7{c07Eio3tYPHp(BPHpzUG;U+sxMM79SDaAby(=6%uqU~QpT2NAB{9ABsby+uM
z!+dEEtv#3o%>jhZ!Y0&zlWXFEM3Z!;yOs1Z$BP-+vLUFzZIS-)OJO><nivMdYZt^H
z5U%~|{Zu)Bn#nD`)<zv#Hl?x(b1mD1ijQ1G_5wRee;S~BrnB<?N7Z<BONi#`v}K$!
zYW<Zldyqv2Eut#`UNLw_l%k%UuAPT7|H1INcYg42a^Gve)c#ny93oS!mZr@KSp7-V
zvX8@QKEXs@X0Ei?K16wAgmMT`Cd(yHgSf9KIxRryA&4sZ%k;SrN6k_r(WJUxclmsl
zU$xu{65}2KOrje)!5Z)^Oh=n*5clag7|nl1>q~a!ujyTrp?RSEGbqHMab?EZw&vG@
zXVJT!wUo67KhsPp)?|Mex^1Dm&@*)#-|=$M+@x7*JAr2GrEIjOU>(*#EXOFHU9%HL
z)hB$PeBx-Z^ZPTrjrzLD^P2{pXPB6EmQ8Y7D!uQ{(ri+F2jRSu)I{GSny+b%F(T?E
zZ+!`G=_fzx0c6P=k?aEDsAvjJ>09CtuL2jAFX;+S6ND}RtcsaZEHzz&lp-0)rf25T
zU-*k1R3Z9`L{IW!>C&MyhD11V&6??qDz-CP9fiMny@>$ld@mr)X+e(*-puCWq8L<O
z9C~`&W@)mEtn+*xOLfQjS=;G4S=KK>3c>LL<-K&;v%i8Y$fG!Sk9GbiuQER4tscfa
zs6cp97gs+!Fvd5)F#O>my1hM}JPty`xu(Y`XynRqDRXjzV@wYv2m|r^9VfYbZ+_N!
zCM=B=8*yiRl{26&BAZb&a+}eUX*gU&zD#WNj#Y5(Xq|}StD4b!X2DDzJ3~BEh67FV
z68iPfe#yU^v^+Z~ZB#e;)@vi|qtYPWLuZ|gy|w78W#4#{<vtPo&p3u16b!})qxH}(
zfsaf<Tr$=uc^BwA0@o>9*sEMsbH?bOG)VBCBaHO^KdVd3#QMemV|7J{-SQNldOrEO
zQt_RbS?~+%Oh21@?6kwYzx0U7-ywVqnJDvarPPYu&1z(H>5Effe}g<F-+6KO4}9)G
z*fbfF`8YSSSA4c9y`|1uW8cAL{4$HBSmC8hppMg~_?6W)Qzu$2;rheTF15$D0cE=n
z{kk{T&G@@6`kJK2#L!$1+3&{q2!Ds|Vq?>+YcvZ`?CEDre4~aTpWQwW$LIjt%fLek
zFQ!BLSsgh)!~o~#DRK14K!ZbNG{x0?lLuA1<P$~@E9}k#K6a{hOhG4?G?fKdw+tvg
zp=kZE^3lGcKUR9D7xMN8=2c-A&bKd`bI8+`CV`=2Ibyqg)H+tvmw<Q9@2a^cLoQQT
z%i%|^kbF)Wu-UG4yJk=(@p6JHz;w4eBqqbQuLAQRk9rKq7HSJI3-HNrcN@v1^Ple0
zm2y7H65ZN}U?7jB5S{A2et8P&<LcOfnpiGL{_cnUEs##~l=QUu^_cwfoeBDOH9aeY
zn#lzdV24(7=sgT|*5m~engq5uoCaj_00xR?vl0hV-+P<XJ;jHgZX?IL@HL^nZa-mk
zA{nhC-m{bHHux9@JK;guzPQr?+fA-bq6C>HU;c`M4`Au<NPM7drp!o{{?<KkyfjUI
zgQTIYYZ#B{&Z6pGUbY4E@W<><`O51VpEsHv#6zF<6lm?x4UrtKB#+<#2j#segWl<a
z%7i?*QC3O9wegc9AYy^P$*u?mW=r123p#qBlo;z(0}MT~Whfow+84&8hSkeM{Hl#k
z7WQQoS}HvTEu7RY<?<?Z-c&Rn-v0xBkr;ODIB#%eb>)pfyuYfvNH!!hKUmpt4dC3R
zm414|VD*rKon`#|8-^*ocGxBUeaMLCV~w1}6En}W{dWUGga6jSS5+-*LC49#`PmTj
zlf2D?CPC2OJcgS-g;Rz>**W1Pp1CXu)!*NrPlaz?w46xVzf}Bot~47p9kv*H!B8~U
zVS6O5I+;;lD_G^YoAvw^Ro>T!-P-RyTD!4mo`wE;8607<wzq5e>*ZV1xWuKu_XFOQ
z(e2fj`BnR0SzSv!fxR>76m13n=C@IQh=P8M$J=Uapw!(=J@ZLlA@vpT1B7$2^>Ip+
zdJ={%?3GdE_pM9KK`zOLzoS=HSD{wstk(6@iT0ZZrAivRGUu_u<(<Fk=a^Tu`2Nl1
zJ)cBwFj;QHl^1_p90{;#Y&<ph_K<Wk&i`(sx{V>{WHvk*i*w!9;5+})JFn$hbjY`j
zzP%Ux{@?1i@UASI`Uaw4?ZVLjB&1mCG1`Oa?+}H^tv}~~nW%mhzSTO<xC;fd)OakA
zV!4a0;*FCb+aFsIpy7uWk~<(aw8MqQTIPuB7h`_%o>_5X^zkoRVM>&s>FD3_uB*$0
zH9tXJ-3nZYN+U1&Qo~QhI3tfY$@T(4Dx)FIuq!NUVoi^o-Ie+`>h>+ZFF^Q<Ez9>O
z#SUIB*&~;FJp4NHTV&FqAl4Yncqj}Z4Mix!x%h!hoN%^B@GgAsYDNEM=sL1vEZaZ2
zD-6b&UNZO-`_z_#-rLx^zn|NT^1_{BLeh|XZ;mI0ioLm?w{T6U55~nRpwbGcaTs9t
zFr<}=Mdt%>IR=75I`<9MdTvv2^=UJ{G*yql$>k@|=eXd)H>xf8OEX98BMig?fC%<j
zO%xd`f059%jyA^NLt}TAQ8bOC9e511sZf|sg!6R5e@>UcOHHJNN^g^wIwomzzA@m@
z_i#}5M6#EqHS&9p^ooeYzEH=IaHVOXo7Jez5_FDGX7tK7%nw7S@KaX|Lx;=}RHe8~
zDLKassPoH&V;BLRj)aZd;{bueejz)LMZ_>ty;Po8uvEwsS?3{<&31TXpqQz9Jx1sL
zu7|+UhU9Fi7E0*49|Koo_wVO8%?@+LIz5+ZT^W>-Sha`I=V;9UQ=?gf8Rt=qzNcQN
zmvKs$vE$4vep$5<$ZBD9E1~yR3RppT_==yfI_<Uc#=b)LsA~(8nclWB#LB9A2;}SV
zu*WLK;*`CFX8A27Ur=kF0o?<1BqjuqS6C3bM^!$a9-wDfD1;Cq6Om7L?C_8*EQdva
zMZ7?60!2<ew=?7!C9bfn<=d_vZjSQXR=Sn8cEYwMw{Lq?)bnHd&emZ8mpbC}Wvm5g
zAtDIL+^gYNsdZLDZ{)?Ui9#TN@JgJrtcP7JSV5LTW^YhVWS}z>Y$je_DP1nU2k`5U
zrUo!?HO@IL7SK-%dgz1HBMpK@$b1LJ4wNgA2<&TS^O5Q9t4iL{6D+qheP~cRU1krH
za?jVFW8d^s<Woc&&M=P_a}2WPUC~$L=UcCGM4!B<LI&91Xak{BKBK92I2d*?=_1~E
zEcF>s+G5kbGMjoD^Sw?_N`9D6drTc>BTnp6)vg*?>t)JE)2U<L-Kx^C0wHkJw8|)l
z#xk{2EL~rcdcL*<Tt`i05}#fDu6lE!8o||AomgprVZ9U0d3gs-L2Z7Dm7V9g&%ux_
z24YJ>x8{f-CGTWVi~+;+?rIkE9(cPC2n$=58|Vsg9pP>~VwDsq(t=jqYzE%S6*BqV
zYyPIfg0bRObNBsdFoSL^@7anYGxp<nMIZULMYO?`I<1f~8L&+>fI_q;<g<^!K-j6C
zypX8GItW)MB79hoWg>d_^GDz>Z@J&`AM$Tr_xGJc_3#Cxe?{xw*RUWzuY7R|stuyt
z5Q@(9>ZJ+?BdWLIaF|ZY5Z@6j=6=~sct2GgNJ9LsqW@0yY=71Ld8K9%h4~dI9>m(n
z>ev_UEAC4d;&nf4-#5D7{}fwZiFo5D@pfn))>ZNO<WkQ_cfd1XU&MFhb?3fnpM-Ld
z7}e)WBpwl;>zh~D734P&c%N*m7~#>iqt_}H9{nXes4Ak=G}6^q>d5EG8}MG8+1?e2
z(g9>abnm^yrGmw{eCPYKGeRa)T$ky>{`Nl5d{IK&&8X}l^RCtUsT(BX@&3u4#zh@-
zh|r^y{(D1p@~qg{zrB2~{ptyOtRZP-r`X9zgQ*Qa<c?ohzqQoKRdcc51S1t=I8=1T
zAm*!?w%C{|P4_hH%R*%T>(k!Wiv!$WZ0x;SM<cPUNHDP<a4NH#nLFIN>i<|{a^=n4
zq#50Y8G@D<jkYd{Z^T-~@(@Y{G>d(uG9nA+y&UJ8JZN=AxLO!hxcaR%di!SY+e3X`
zuD+<<+N=L9P6phsrIX;<=vD9P<?7J!F9nN)n$Vo|QXai%2*OkgShy#3ktvK%Px@aS
zvSamG(f}EDu^`WHw-s;=c_t|u#)yb8kQdrQ_5tqB^pD)H#`S!h<7}vi?Ei4<<=@X_
zXW_UL#riCxcwt*Bc9iaEy7-G}3^#rUD*s`@TS)WPuB!iRgv0of)uF~vZQnF_h4bsz
z#%y&X-N=R7f#uWz)RFxT=egzs#p%QK^yg0*EFxZl=oF-XSV<s>cP<{%espYjPxf{7
zjo59QYf~576Q|hOZ1%Y)hf}eKj`<*^zDux(zpkRu0Ogw5-f7pk2^ot61M9VKRQr@?
zZQ3Ks_0-x%;x_jsLk)gKdwz*b-*)`QM`sf`q_ef-?||x|>O;du>pD`<^r15sFJ$y~
z(Rv1Bl%YG^bAcSKGTcta+jbw$B|oY!%hXz6;TSSn?(tZ&onI+vp?tLZ2$nt{&GNUG
zEJLPQM$Cyag?$PQ{Wj*=)o_M0*m^THjhvjW`@SWvhfw<Z{a)Y|3)4NJecT6VwrK)Q
zJ@~bU{@Ig7v%~{gI<oJ0aCX{z#%o0X>4DbPw+kwnDDFT;&~^En!J-jXh~!DV4^7v(
zs5TDnIIbDEEQ@;8q04vmA}I51RxbOIjjtSjg5)?8q_c5t2jvrzw$9w29Z~ZR)l^KN
z8RUuFIqQll%^jBEW?Hx$@?jHocoWAGkEHo1%it{nnJlXF*o`rlnmq{hS6e{qC8tEZ
zf`kki?x%BclTL`Au0bjN-$3P$>1Y@p^H6&67SE>u40X9IT6xkD(7S`*xFu1j1F3WF
z`Y|!hrt!+e`spZgI@q#^J|o7UNR>zPr!1P?ly^nWVH#^^-hxb3aCq$eB>}8G>+R5>
z;Pf`6y`TkY)8O<`!Da4O@HG+Fy$T-%i_YSWRTZyJQi}_{qC49g2(X4Qi&1hljc@Hz
zsT2$>G~IjA;%@)uw%c!khD!-neeAS1Hnv2>=ZT1~s=W8JH+PC26)%4m9qo?|n)LJ%
zTQ^hm`>1$tP7%K>tDvr<eKlj;x!V!l=)d%z)wR@r%?ISufTre#eU`0f{WE01_V%H<
zQV8UsLJC;L{y(eh@!Q8yN}+LYLsON)p1ln#QhHML_DREkR@Zx_@WHp?AC)5J-bQ><
ziv036^4ot_*QF8~LPXPF^%D~@e9F<H#OVK7T|}&wa?B0lRkt$Eo``c(j`jJ^>UvC!
zi&DnN5%H<Y@z03yMal_P|5;sciHYx(lLr4Ut**yQ5iB6fT7x4S&(5D%W$s_uMPUwa
z8Ck0XoV|LHS9VU$q`D+5cdiw=si*rXNmgFEFtK-(*lTPT?~%?(H-=T>r;bCBO^k$z
z3CWv|flM}v3(TLu$9i2ZbnIn!HOBPBEqr*`Px+_2`KoE$ovYNgdic*OG`Dow8+EQD
zdeu=+1oS;EbdN<cSu4J@G3@Dy^PA7j_7_IsG^fcJiMmoWI*Qs&vPQbGq#&N@9u88k
zs{e%jvM<P3nCqmA#r77>G=^Rs!!2K0pZX6phK2ZG=lq_?&UI(uFF{PPm{-K7iU{oK
zF6fEnBrG&pXxgLh?LQa-%arKlny%KZxAv)zOtW0K4WcIcN=IT=7tuo_4Dar!4N%;A
z+Hx~GbL4Lv@n7LEmRq@3B+0A$nfjkQc%vW;y*%Z+8z2*t9*(}~p~T)!0Eqbys26LX
zxT7sU0&XbMkyqB6d3Z(+$EZ(ZNEsa;uD?4n=;gqB2@ook0(5w`bhY&Lj7)l9BUt5W
zAX_8wOA!BzMFeX+mV0O9b?r$0aB*dVo|G5M)L_In7X={}tQ-P_$On4P8$23*_vtOy
z3WSO_{*;gZ>nFa*cHyTe4~nbzYnhKqGe>2^Jo4>J&^-Q94FJThTWfw%`!o{DpTFHR
zx}$gX_cqm2tTMCSwa{L51QsW*r!|dbTD`UZzO(UJr|#p<uX?Lr?9~uwm;ur62P03e
zji`hU0TEk|1V)~G^wgb+!hM(1((EH^PvuKu8O`45y+4MH{u=oz1d9lWmU6~M{JH28
z?P>U|tC(pfPeX<vg1DB=B$YL3(b2MJK!o!-U(U^pMXd{v{u|NaQsJI0dUstMHHYHE
z6PSm7JQLh7(U8H@Fs4N)J}<{)QZ-r7I9oo9@wQ2pgu|PMe;K`RJ(s&vUw-2{yh_R}
z^!w{x@%7PMy?9oIC(JckkE4R%<c1(7#En)zjR~demkfx<A=-cQzL;?^hX0V}>C2^Z
zpKr<$+GbQUpX@F-XlU#GLSLjAbN+SqU7~rqAkO{^JYVUz_^nPWjlJQ#ahcA@i=V9$
z`Gjwt5ow|yfBpYfm+2%sr>G;+<?bf=)zW{RWcPX)sYv*m*}=T(Ialb>#Lc|Z#Ls2f
zN`4D3#z4Qln2uxI-(~;Gg}&6<^AZN?34CjHUKjmUaoTIkSG_T$n5Ff}mV--iNNPjw
z6M{=qv3S1EW3#CuEQo_VUbQc9P~Ad*h=NJwg5+I@+{156HBfk!G5dJ{h0|0sIq3Uf
z2Ha_VjHWh-!h(F?P0pFqqkg_8^*W@S%Q-rXVZW5O`jyoMe=#oqcpfU4Rm+%GCV89u
zg&v(0cc2ep<F#I?>Z^-2fvm_k62p0-Tc}OS<M41_9!~8*!{?EH3^(7~45?dlL@;uA
z;8huqMcFv5jL8$j%usp|q0_rHe773cq|^MlDM6Xiiru1V(m`V0JQ00=d((QTH00Ct
zgH(DU#`8vf1u~`@EHgH?EXQeu$fn+SP1qiYO0+FhXkbo%y<F7H?mSCAB8XwCC}h6)
zvwQ^FxPt9npRvKakfU92rmN(nC}$chy{aa%`9rMiZ7bja-~IDr)*feVAWj0s)B~Xw
zFv$H9Z_~^{#uvI>af{IyHu;7AQpl>CJYKe+QjqnQ$sJ>E#qosOFQoBadRJMIFo87R
zpWh+O##DDt)@y$6i)N=RYjA95+PW^3*cE7la-X#yLuL!}Vf{sSU$d8Su>{`c*vUEg
z=LwH!USRJVbKZ;NG*<NnIcHvr)Rjz+*m<~=*gpx$P&<ABN_6gHy#YBdUGQ?xF0B!K
z7OD8Rj8$>3x`OrgcPqmbc=Oi0=jQyQyc+!{$8mxHtS0wyAB*THYoYQTmM=N?A~{Oz
zB2;2T^WmqT^TL@omV@KR|9bPq?8s2$K2^RE&pqY>iKv+U``q|fD67><NRY{mnnzKF
zpLmv>6~!o+QKY~98FgEhRB4xTuvX!8Y4maCohpS<5jGSze2(uy>7-)m%sGQrUr4d(
zwq9m8;|&hJu7Vp7&Muet=l(`?diiHTVFFwa5ZCf(eTK(OW-TGNY=qGT-(!{gWKzMp
zVhp%-!ueImPNWge7A=_nfpt!YJ`xrqSrT{8e}V$RE~u2T`C%k!J?6#{6|FLcWG4Tm
zoyDx2-b{O4$#0w7?MVNQP|d=YMRoez0Yc<jW|nTGuiQ1}38A(Cvim_u{kju0wcgcU
z^3YMV7)pR<!2?T+w!q5f0wCdQx{7@hh=7Gb2=ivNQZqv=u@R1^-G!K6;ZOYOMzZ3=
z6l_p2_8}Sp8YqX?C7hv|PO4AhdP-;y(?w&-)%cBJ6_3lbW26>BVI=mC40#CBuy3Za
zH2w1=CgM?vO}H#gJb*$(lbi;OgFS1V-j-s~P1SQQqxRLtOWRa~^B)S@z3EEU*I$p3
z5sG0ME5{>FrOO6dy4nBi=<!?hB-~IhwR?2(c_e9vT&PDsp87AGnKux>q6~j1oF>2$
z;+rGrLc^}7+(V5@qg7<?Rl6NP#tjW5X9l=ax}R9^e1cL5g;Qf|#&rg-@~`-V3CcgD
zLB%i?&WMKtJQKd#sPEA7;B8BhbJFGw8SHD^+Es;sss1NbN9(**X5V9!!N)~3)066I
z(VJWD{PmX;obd##=qGK`UGxUMdq6ac$*(~Te|H+sfDO)pMg#TwG(F|{XudZ`qtYef
zwl5r6YPTA}^4#A!*-cws*cUL^s<<aU6^f~UbdPj52~KSW6@>pKii<u>gB3VNGx?j6
ztjmV_+Aad(DgVN`VL_>mB^HhO{QkE$6KtdU^w_dt{VAV!Q^f_g*iZnFAa6NVaJq|q
zV~tGuMY^8TybrB~v@VlP7>xj|hxO3NfaeUDB35k&87BiPu-~M^IqNZ(o>1`h?&U?y
z_pqs&`dc8oDLtKgS;zWoZUR^-JW9m5>^F1)gG;V|I{)Zbg(fo<Pf%PlYVpx%!XBO-
z_g?DBrzmws<LfntnU>t^MWuD)Mv;~VuD|+H&2ng>!%9&UOu^4-0wr`=4_+|;DyM$)
zPug6!ZvBG;8C>t-y3JEkM$aj>M^oP@$+Kb%WB0pR{uM{P>IjovUs?apUpMZU?^9o$
zDCq_%_U_;3P(Hw>vQ<E|<Y#x@o9ye*F8m;)D}Y?oxr8x_bc3yphMbw;!TX*VJ-TW#
z^5GW){^y!;qNP#lV-faF35Gc1D23GFEsk*v>uaCAyK;W2I$cFAU=Nm_+QEepx`cap
zN&jtnlcjDxnW-Ly$ZBxp!xILlmmcbp>pc(jiF~=AfBI>TW>^fCab>gD#($#Pd->*4
z9Jb}lk`Vavu4r*6yy4DO5N}yk?I(s;>mXW-(<kn!b{TyY>8GFF;T^BjBTmn187B8&
zsM-Mq)z6cGrVN)mPJ_Lyz9_H;ztWaiu3g-}@oVe?O);EZWR$n1f%ID$)ZzYQU<7|p
z^F<ex;94<zs`M+(WI(JIeq*g@T%Xng4dw=v(2uX#63?6RZV*7-0ojfD3_PjarR=dQ
zgwiC)O3<_S+@EFQ@Cjkqb@ts2hKNQzeo0ForZ(@OoJY_P?Z=#-<e6wawkcIq!|g-M
zj+pU<;;^*(hoaI2sZ0xvv~mfsdvR^kJ!hw-VuMu5`R{hj*!S;S5L0W%9xq-t?qaW*
z*#Gjl*+dInxAkI})Q7Q69Ok2+PSGX?r?%%64&>A`nYlj_%<tiekS5Ee$3Bw<=rH}w
zy&*qbOn+}vhbg9UMm?xHKJ}3x*N}8HQ+XSgJAs?$g7}8?PbVl}o=)isVtVsQJlMH(
z`cF4o=ZLMR9Kso7_sOnA?p`n+vUDql9%D<_ez7Ly{GNJcCqUPXE5xm2@pOJp(;U(K
z>rk-V&Z4VRdg}cJ^Y`*`^shK4tvZ}Gp=e?8cf3|l)cJk=;CRlsZ>Pi0Nf>UgomY=~
zE=b?b@)JZCyA%U(q=!44Ml}BdKEGz}dBf;2cUE#<Z=RDxXV85AVp@v#GPEbyDCM`&
z{YPgv2M2}}pFB8GFOzlN6Pk60dF{geq~R}aWyOFh*-QC$e8arQp{e6?2_L<K4#%=T
z28MUjMN6J?_k1IM;B$md^-ys-(ozu{3OgR`3DHoW>rl5!!+&FV^HXM(X%v+$4$m;$
z58b^T`;|5Vyh%XL??=3@AbWwjYCoEqeC^+}R4X+8G{cR!*ImJ19{@xX;Q$yNM<XqR
zt^!r<bD^V^7kEBDuxQd%F!(-PQQ9Yz47UTL+aBk01S{>p6~DSGQSFnD#`77a0pzG=
zjOxFwUfVlG^O0Fnq>UqHflM?I;UgX0vwnEYM8J^_hop(JUkTmi$q3R{o6#S}-oU`+
zq)T~^f-|Os@|ig`uMQisq`$HeE>Kr^2ImVcr4Op6J$3JH3$W|7*t59D<Jr%%9>~Ze
z-5Z^}y%E@i>ScUwx`?NwqDVi!<!|uFgXXkkO26dfHzwz`HnU>|{96-`eL3HEccs^;
zPR`>2|0DrHMt+8kivu*1A6Q8QhLiT8F-iWVZ3%KOqkiHWPs0eWFbx{lUb3ir9x9kG
zJ}An6z<T@<-0-qLQijW?lrKT&$=-TdADpvqTdz@=)dQ}T+r)Y{sykgK{kg=GUy!pt
zoiq2l*e@MkMauBPe%B!|dxyI-I#qqZLsH6<ceaFg6)btVy>|UT08Z1x`OHch!X&7V
zVWDG^QCSCkz??>pv7=3x{ed!=L%1}A>XE3=&jxz`Dj^-2+|F;Q&B;6}!F>1X;r@CT
zs#hB$C3dgTvJSxt2y3{jpfELohF(XwCHW;%M`1obUtiAdMB;rh>YM+q9p-4hfZ&9O
zujJah73rF3E1>pfH}gWtXt%C|-UW;;YBO(8D!RzQAC@Tab?+j(ee%EZe*HH0DEha6
zB-=A%_Jd)@AfpSYwMd^1-3F8?0mx^9p&s*u9l_b=yBIFC89U%K^C;LJKg%A*#R|^)
zSy=MeLz{Y<;mBGmv71M_gpTOLbHNX}L`M+T=r2{b1RSG7=TS_I>-0x(&I^=HHbnAr
zjdC7PDO5tIxGoEr(tJ97<Aw(fnNFRu&KJ6F#^QA@B(Mur7JF-hS9;30<fkyK@tH`p
z$+<gU`RnE}%bN|%g3UGp(-s0JI=4)FZhDr(cYqazHiF?gv)M!Wk<21pLHzmdJZl@2
z=<aMz3Z`avragWx0>7s+vqT|3Tc6JLE=G>O)8_kVvyWapr|SlH*PVla)K;kyXdQ@$
z4#x!wZKqqh*9E>nQ_KP>+d$Ndp0LJZR>p3_I4@HVciB)Iv%52PMR&*Y%~^%4k37Jf
zjx<!cdv=3&kH@uvn|F}bJw=3m2}O6<<q?^rI2GS~MT-1@me7nXQ@0?q!nN`&mos+<
zCJ!D)j8#<@ZHF%7#hS`&sf1&XdXFyeLv3qnLDr)<3L9hHp)LB8GR||1T?Pw^@)cRZ
zxUD`AiBmwSnXn!3=g{eNF#Z-YjCVf8I5G5a6r#k702Y^eeDyOtv+(<Er5@K6J>zeB
ze5^o{TC7@8yiygR#A4OOEMY5mrqXW15Pr5;Z6UvsEE8L^3q8o90NZ4rn+#kU&Uy#;
z07dyoA!c1PY~y*lonIWi)RpPyQR0zkK-Z{ECp1t5yV^r6xqGojgJ6*&pxEc!@3t$Z
zz4+~ySV6bf&&T<hW?q}F8OVN#%9iwEwYmG-d(NG|+Fk3j4$4CZ(xa^<1m~(=*JpBv
zrFi=Z&ix@Y@JP%BEd{<mTfd`X7Nj<}-B-fe*v!}0&GAu~%cF$d>Z8Fo4<30D&T3tb
z?~_g<w|P6jA=dP8Z8iz9&5-LozNB;yEw6|1mcrFNTtYy;v0~mr5apP*kn4wz7Zb=v
z0ChqipOt&M$z1T;KTz67{Y18KpsAF#xbm$b&cBl3Q*+SGb@!RMh)-;hoA!}ko<;7@
zMSf$8`e7gS=ULRhxu{Dv^k57h#k{b$r~pmq)xG<kmka}%$MCU73(mv6n?#ZN!X6X}
zoE|((_g+lDqV_&~bl)3(S+BDwbY*q1<Gws*UFu@h*P&MaBP7i(pooMclCQw+n4#Cr
z`bc<jF`qR%{>th~d&K&z28WL3E*+=q8@?LaaBDz#e798@N^2L3r!7eA16^_7#Cds3
zsB`17Vy4XVb8I{AeACyaLI+acP|`|T@|U>N`1Z4>D=YR5<HUmSKai<^lur`oAKD$j
zG(%}(jK@y-b0yvR+Ry@Sp5ARJ8h@Roq!K=lURF9;7OX;?@;nP4%+NO{r@lK?dVz8r
z?mgc1!oQy}+?as7)8<N|+{;MybjbEus5~Qf@w)RYt=Z-m!?LJ&PD;oyWY6`1&%?_C
zEqoG2UQvs1C|y=2VrMMbGN;(p7xK@bN(5t8b(oT4bz@N2vrS-9*{+Z8^Zen3e5S$d
zROA>@u5AaN>s`r3^cxz0Ob}`sQ#g7{Z!#+~C=n8{cRe3@#4`CJ6STwnD<$$GPN;DH
z1;3v2nwY-U*Ae@8Wpyo<f=_NEyKyQhq9wF+%=46FI;uZ_R0G;<LHL)ii<4~y^K?0H
zgwj%F8t(~7l-~o|0jQ}^1Bx`Nl`?~^#b^UZqbAihdd)VRkR!Fo>Hi9-^G@Xv?1~4d
z8|V+u6A&vN+c{5y>#PLJ_iNJag?_UKCwOzhPcTfcla(0+a*Nk4Xmah4dWb{q>Y5z5
zC7$on`7?}jzUEJE!@oB9he(sOmO2jIM)1E!thx<MrI?V=n=GY#j7trIPR*iu%@Rw^
z*STKFIlWTKd!@GYN{j2Yp400ad9QCSy*B4+v36>)&uej7YH{Owb7gh;<h{AO^yUHA
z+hC`+kMrI>U3weEMZ`K0<MN1!OT<*J)(ofrl{e=twH9%;l{vLl<+ar=wKZ_HzjA7S
zo7djH)c&5UqxZ_{%Ig?j>iEd@Zp!K1T;98-rFWmWIyap<zvOl9|KC|%=Kpvub-CfX
z`F-b@K7-{xbM^k4;r#|@eV^R>9M1ZkxCibm^W|VT{K5x(mIuPZ2W>n0Jv;g$ocjZv
z2W|67aonUR=Yc%u4+YMB$<8E~@DFJnLq**E4f#VQ+yfQrA5yu8yTgZHEf1B154oT5
z1mts!Ee||(9-eR>UN{?WS07wD8$Ik8`Jg^h<viwa*1J6iB6DFlD*=<OfE>H{n7hX{
zv{}yFClb5(NT`YDa30nInzIrps|Jsa`vm0OIEZJ0Wo4Y}e1gYioN{GcFJi)YWgPA@
zNn0>^jb}=sV2XBS%35Q>eq|cOGkK3^Mn_}rM#P*(*No`9N!s&Cxs~xtrFT<N=i^w7
zafgDr$LF&cm+7*I`9z-CRE_bBg4w+DsiN~m4vi(#^U2;7&{@fBQ^bUA#L~_48IT4~
zj?QeB#`w&;g(aTFT9@Szp4H@ctM6CldRJB!-p!1zEKEhLd~o?Rs4+{gxvGI$1+9)B
zugr0EZd`JYYoNhbMph&mta|~OhBN7EZprEJ+$sdWxiYe}x9^m2*sN~8)!xo4*)m<-
z)N$Q1cHOpI-HPI;o7SQ5T7&TG@Vr=qq<2zX8CmI?yEoQ13p97&-MdjJw%n4vWKFsk
zogBHVyUDz}S%tf`ynD5pJ6B>?>gw*Z)%_yPy^P4c+Katct~{4-R(IPAzxG~0<_ix#
z@$TRXce*1F2UmB8UH4`%dj*kS-*<j(?L3@v{r0!>==|c~w)Rm$;n7Oxp0L&~8{b!k
zqW#C1uZNnua$1K<MY|Ih-~X)sq`myX^!`Uv;j!^0<f!mi@cl0_z9ajnt-RH(h>I^_
zt6T1_+YYPSrkxzVI-h4SpG{p)^j0@*Be!l|tSV?mf?Rl--Tu8T`q%#H-+R8ZUbnNs
zqO;*oXCL{_r`*oxiq4lloqyuH*mS%2QgpG;cV7GH^wTpA-|mZlpDuyA1zi|&YEE^$
zbV(16hD$XZDpT4Q&n)5CftM*8NQP>J9zkTwNohhibJgQzD=vq!B%RvADdj3hp3C1|
z?1-1E8Y@tLdg}iniFL3<Kao?TZLlnk(QCx`tXtQGn|_og_eUcRWtA$tq1=zqi&d?@
z@t@UoPbXFD|FybWAMP){OZ@ZlMoaj=)0a7!BfK2Evc}5{A$~K__OIyj#ZTfOvK+lH
zu;n`qS60{G`^FhcuXiTOZ~o8f3R!+v;M8uG_wbpjV}{QqqPyp4O+YeNXVFsEP&x!(
zVP*R^4xFg*nUg7BbvZu?W|ndNF{eLuqCoGASbDbywPMIpdWJjv(M^VLvgyMx$H=Ey
zzZ&+J8X8pJU!0%)`*%rSY*e>$1BGD{W*OvF3%vw<K+0;D=Bs*zHukcPW?J9`kPOe*
zZM#D)`eU9e|H*-@+*{X?<%>n;sIDC{<f{-uk3b3gqeO6m2aD1SJ?APuD}{p2c*|0Y
znE{n<BK5&5!%SQSm1bquI%DOe++r%?lnIND5uwUV5-<pD<W03P&EmHcq9QNQMo?hA
zt(?Mh9Ar1owO5e5{?_`Gqqs)TxZb8ltg3;9k6D1V)KIm)zXs)<@^mwkI~CU}){$ko
zi_e&^xz%`@QM+8**;d>m2UQCQXD+zQA@1u?a1iS5I6sbg{==`1FrMuo-JJu<xAyc1
z=BiG}b;zQ@Z7k%M=4n#D)J}CYxz{r5dYSmr<(vQTy|)vQ?GFCr3VPnslA)-vn97um
zZr+27u9Cn}uMHjU=UavnUQd%a;#7YwCSHH?9PLBrl@MdGlXQndyde=c<bZ>CU~V>L
zPI)H=4sbpgY0?@&Oh#J?q|!X-7s<=Ac??Qp(1oUh%cQEQOTUOZBs^!5dA_t&%S`Q+
zlkn<>L0x+>O#`~k0Lm;<MyJS7CYn7uD0XwTq{B2kX!e)Oa^Re66z!Wx&XhXm1@9X*
zA&WN-^I?ib0$wRKjQuWzWzd8vVTD?(xnGKHvg*-VltS>0`B=V`(2e^tQ$KiKC4s`W
z(o?Z-*0SAPC!|cC!g>%nQTJKz8A@E5J=v`+a-GcK{dsh<Rj=o&veW$WK1{KpLzefj
z%|}SqxB8MU{D`YI^27ds_1A9yM8!B$*$?uNh@X?@<`KVU-BRDFjA|7{{8^1kJ^#Iy
zYJTx&<5_Ct>6BVS<R9`DzVp8`T=OG#&!FciN2lLDzR&P%9&g)ht%qz9Ke5K>mcKBH
zy+xtFMqoy~reLLvrs+!n?N*7VmJ2dz5&0>Et)uP32-?g)yC~EU!c>efjxV}am#$aU
zfQ5!3WOeK3>gjo8D~aH3Z9`UqWmh3bthU<0Iz1NO3tz3mYm#r!Y7q1U#0T-(+&Ab0
za%zOln&QoqN?F6^^+_%a2@bC>>6ucYDy&bs9?SZdaebO+9SGw`E6DT8N(J_N5&dFv
zOW5dkl~dF{2c|Y03o--6NX!hA3bEvCTZ}b>Al7Cdd|%m(+zA@Z-)ZUT*ewC4DUwMF
zLq_h|O@x~gb*eNdrOv-X!jrLiW2PyE6v~~@V?Fe0e8c3=K1R~bemHR1Dm{0hLgmTd
zn{(jcoK_m1>-Nt^ZY-uJjY=lUq=|LiT-M2ve^IIMmO$rE7Mx359#JTHK6<Ydiu+7n
zrJVfuJ!?l$;m<lzBUfO*!=7BS=TEd!T+sE@5i$<j^4nUMAJWicX~n1d13KrW|C^h|
z(%Dk!DluBd?){+CaH4U$lvSPBw4D}Yn}Hhr`C!TY#O9i4#SROL`^TIin^-t#OH(Xi
zFi2=n*SjWx&!KTNuTrK;&E<||ctUS6l`TP)Hq|md+6E#1tMb-0KlAe}n-aPfh~zxK
z%rK*Ev0uvzvv+&uRc+=vk8E!W7Z@QY{PgHa!IckR?tfcdXL#wSK#dIdGkmm*u~(MQ
zeZm8A`><o51h8xDlswp?bFwRyeAJkd#qAX)?!YXQ-RQ|P*xGg{^Mm4>=Geo#miogB
z6;Eab4@Ue^V(m7ziy?1bYvjkSnOtp}cqDx;HgICnP5k(Tza?em<&7u*oMOoB#rm$*
z1x{=)B}>i;j?U}{r%7D8tlK@V6Ek%U%Bo#iHu>5%F++M7C$Vbw$Ubc0_Wj!pq=Chu
z$DQmqK~JV`-sCqCQD<Ags-~}}Nv_#HKNa?jy5w2|YBhJAwcw+G2SDIeeuie{0f+GS
zHFERN>VE8y{YtKT(|uwO#Utrx!47x2tD><_wl~gUk{d&-*E@f{Y)TeoX(m*L24%;1
zc(7P$rTUkk)jl7yKNU>l_r#G5Qk+xMxEX}$!`gQvzNaz?+!j%CNHP&~&<7-X<lUbi
zGF~0Ze9PS$`Gi9N#oCzjD}knUHFWIZBde5&GgWnOIFHJy=soowRrQ-@AHy#ibuT*F
zl-Qn+M?8X-g0A_JE@c+SyKJe-1(Rt~qJ!z#%<%9D#E$X5g~^1~z{;j{Iy0@UDb;%a
z{4b7Qki)rJVaczLpL}+USx#gfK>@4pT~l#>nhWmu9a4Mmn!gKE``mj9#e;yHee6N*
z!r*|MUQ_i4emT~+q}bn$i7Wn2Zh5)Ti8p$!1y1#&PgV|CO<xwQ7~gCLw1a9Gf$Oxl
z!ls<~e-AwFY*7C8{rl47g<WMQIE6c!ZJDI}@R(?^#qbcMmIi!}de5f0Bd8Y6UvHJr
z*I)bfQDXR3?J-~=?o@f(-<>{(Ts})QGCngdZhK4j%ZJTtKeFB~e^$ED>f_V-W8$}Z
z@?)aDicKfPQCs<Pnfkrw*qyK6ORR}IH;P&(LC*KiV)M70zqOgIMg;ST-zGgKoqp(-
z+6v5c*&9+nNS_<~ZPr$B;H~vk3w#z7Rd#+DGI(NSng8cuRNsEg^)u71)nFZp)o-EB
z;Zt0EkJEHDzaMS+)l}4n4%x4!rLDHDYtf%(@Vovfzy5C5JoR+CwllVn{@uQd*6GY}
z<nPxF?+zch&CkA%{DVu?_!>ojwniOwB08t>E!8~e6I0aRkq4bWinMNS3Pzpo+iCu6
zNIgHe8})0ls`JmT|M_8J)Y;bcsJHJ^FVf;ZogF-Q|L@cLk6){zE?&E6oqbEaJj-yq
z`1$Sf)?q^w@M?3G{WARQOBBS&9AJc|CZTDKo>1V?3?vh(9W;wChHb|mhQM$k^qBD&
zK4>&N$CZ<W5hiKzBL1_wLe+(Qqpw5N5&v0T@GGbbkF5~IDv+=mM6^;4Rwq<hZ3k=M
z8}khkqgx&0suy!(C&s)w!k8FiT`gk@#o6O=eWExU5^l}|=YR+gI|9%bQw(HKdisJJ
ztbz3Wz(r}5yGS5vC(>yi7lIUXL&UxJ0blhj=%Cd7y5hu+RLKAUG6Ez$gE9sI2qQ&4
z^o>h}iiMK!Z{Eg5oW#W-@b!9l04y%;2QZw7&mcx&A@LO_3h9W1SN8FdC#rtv%Xlm_
zVFaME*ce}uld$v!Us;_9h)#H0{iHTD9zclCuui<KOc!mD*ojXpCnk>OTzglYR0T<T
zd6JNe!~>211Z!Y85<ig>(Ylkgp2Io5lU%NpT)&yn15GSurx|ICUqPmfLsB-3Qp<Hx
zj@iS$D68x$C#C;LiP%X10TND5!mkDZka)H~Mg*&>)b!reMk8QM^;IPV09p(<A`*su
z2+$8{!6gKauwYsa75Y2L-26bC5nd%A?F}@&=WQAfWybyEv}>&a0+cF3#z}xKV3<YX
z>&A3>mGJ8v8G0X><R~*wyfZe@85h+VuSs#V(sWv3nO&lp|A)Q%>}qOj<At9>Ae2BT
z(n~1PL3$SwI*9aMG;{<+L=;fegwShff=Vxn^d`~`y$DLPBLX5uL<HMLEIccqZg;!y
zeV_5XI^(=rA7HL|jWw@z&HqpTNOqj>c8Cpaq)A&=x?Vi593w9}{)l+CbHo|Di0mU0
ztcFJ}q}wO35Fy98at3o#nNT?=)EN(}Gd?2a5N$3TH96yV?E>K;OCW8opMApYa0**+
z=Js&P!-|~DcR6t*XUB|lb0RomO)eU=#6jjS7LFvSCS(-8yvQQQNDTrB%xfU#FJ4wZ
z6P0kW!Gz_~%S+dfMAu7PZhOhpeB^SM6QT9m<%W^V-6naG@VuUgi+xUcw?5&A67mSw
z^2Q|c8OeEfE?$^a&wr?nyL%+xJ|X`RZNcVH{uA}Ar(6ZVY~VAK0=Xjv<d+4{t`@u+
zNq_yR;6uXM4T(Y;lfsW9h2wFBpG?v|Kin>au4G)GEuy)^0x>P3KYf8Zv4~0IveQTr
zYa)J|wz$2b2(Y>;e2Y1p6Dd|#WdvY#rNJpym$gyJUgtQ9)s=W0u)18y6sv1pv{X?e
zhGKO|`T<s#=`h9WGN3NQa7XJommR3Y8YPygRg{@YmPh?ohU6}{Ni0A8yv)u&%HdM^
z;Ytga(Q@8!U#$O?#^3xsPZxQHMEI^;vCc7-ExYnoT~y$=D`BTYcwsgtBnvl1+{5WA
z0>cdINLSw`I7lNa5;Q_RoGajJqUS3s(&>)z8hEB`<t6t)&Wc^T{HTn--t<Cy!AID&
zJkv@|>cd6;70eEmRT|qq{OLLs?FG3j;nk*96(TP6l7*h0SFev&)n!^oCsut@SIN0o
zHQ;aLNmbo*sW4<I;HZCfd3#u4Wi@Dv(GzOmggntyRP%VW=E+LUQ@Yv($=YY8wa@))
zUnJJPtgL-CTKjsX_6=R#hGgA4)4C7-b#G47J`!=w)~NaPiSbC0hOjW;o7ckv>S>bd
zX{+k#Z`C7S)icpIFiSPC9%$GT(7=(@z*W`2bD&;^NL}}+j(>}>4peV|Z4^stl&ETy
zI@4JF0lJUANnWZ+QA$ZVpb4<Lq+T^D-fB`hAgT^nU6&hyMvXxSS~sa#{Xnzf<0j?H
z%@#?G0NSNZf8Fl#cB3gl&PKB-x`EB!<+@`B)LE*@wL{YQGWC%n_!M_zKoU!iKJ)nt
z91YKqvl2HD3wb94ZZJM#57J}~u9Eo(^G+32I=NA&J?KNY)sk?FRgkrnX~Q?fpCh~j
z8G2cZ?f8wM$s44RR);ID@t<$RK1QaU;fQ(M8n@h*nAEO{Y0q;(mhjwot-ws5Ma<S@
zzTMWwvd|vV&>nX{w78*zKE0#RrJaVk^IAZs(nbe^Rp%)|qse6?eOXKB0`u+9$i@S$
zxLfU14V}U1ouo7E;gem|4PBwk-8G-PhLXDFt-2S_bcaoL-aS*brrE^|?kY{{ihA7f
zk-i;ZRZ1JWn<lrrdoMdayW9;MW7(EMQjK-KyM_F~!~N!S=Y|w%l!w%Q=4ST2n`Ktr
zbdg=3HIcl5B*93QZTjAm;2zoqQpxdNy7b=pGd=m2dt_I89=Y^HOm^)x>)yvel9%q?
z-^s$`+85E#3!Chf93zQK_o!6&DUJ0hXmzS-^=LA*UD@aW94?1dCRN^krpSIOtNv2?
z{zG~F-5vebk=)L+{kF+n_Om@*J%f&`eL(NYkfFn4^;#wKAQxNLx2nElV_h7pLwwb2
zHhJ7Jn!~}#!!(_PCm05ez6@NE?@t>WD&iSFzv`JSJse%l9a}w;usR~_KAddE{YGkp
zxH{}vJ(wfCJ-T&f81%NT{+>YHmyxDqmb^TXkTSM2$wTjey~sRzBy#X0Y-|hMxNSAo
zoIEBZc*`{ER(qa6Yw{=%=aDZxUY|F1U(02P7nS^MY-@6?Hjnz=n82gt@#nnNvw0#*
zfwy0c-G04#`whdL4e2}Y%<g;$yz^V~oln(wK9Ak`x_W1uVFD~O0X;YYJ32v=GC^B2
zK|el$cs;>{m}HijWIZ^!=jbFy$|P6KB+vLH-|I;M#FU`Sl<>i+y+^0SQl=zorliKF
zWL{70LrlxdOe-FoRz5ndnli0kGp#v3z5n&J4r1p2SzU9lU(dZkJl&9a`tIP<4@aN=
zmh$vd&C}20Prtt2e!7jA2g}Yw&F5i3^E9dRw6*i}x91US^Gu8j%>VaWU7UYsb!p!P
zgF%9ysA#D`+aPJ+dkX}knt;RsPdE+D{~4C0xnEaLTLZwd()5@P7@%{En5|6>{v>4`
zbua?3EI`V_yXfv>S+!WcCM*ZwWd(Y=?n+r$uK)ncD)r$7ysXe8o&c7W<BtNotolGv
zz{`pV@&&N0tHDw+$3=Istg|8hwIK?Cmlb|W3V$kSSIq**EWpc(j|_D`D-V!aH_xI0
zFRSuAdg{C}KxXCOv;i_J1s@KOS>aJy0|Zk5&H~gdz{_%u)!ZesW@7)~Wt~Yha!=B~
zm=yIU$>@HHi+8F?YO2M<ROfu6J>X^CCt?9I%P;+4WcrQvbeH6eyoyZMT{R0Jvr4m*
zj^{Z1RI>mw>*NlZHFC*6;W9<d>b~s13un#dpV)=705uCBvz`>4I#=uqcv*z9z^1a3
z&1Dyd%TDjAS&LWB#a%rPs2zZpRb0`$P#OKM@^o@l*htld2URHmoOQoCHnS#j7tSiF
z8=$CJjRZi=y55}hs5yOC&AQx@P~9>DkXfUx*)Ll!6n$5-E`RLEEbGi_=$yLK)o`yX
zf3+)*++9+4^HF=x#7a*&;AP$Y;blD=sBHQNGOObUnYDQP#=lXsHh!pCZyyZ3et2u^
zVc*!_s97WLpHAMLAOA^aJzkoA@qGF7^Lum44;GhSlb4r2E<gUf{NQh}tk=I{S*siW
z56e1GXx`QS;njntfTy>+I(~aI-<Py4VA0+A=^c5x>hPWJuFt=9Jf!^<%My|Lfn})~
z>|$BRe#NpZ|A1v}LYM(8%Y$8%g&E4M{P$RvFtgL|SQd5hQU-=R?}bqA{E20mFL<$N
zbk=*bxP=0!(Vwxb1OUqt-^H>94<ao;CPcv{(Eyeu8IJ?7thpYf`cjrYLYecp9tF$N
zqhMLW3{tCEN_Wa5VkIke^~tDYw0FE^9C~&J9j(6w+8+LaWyRx?ja%Z0(U>r}F@R;I
z2<ZY?)`=ksmL<vzU|Hq}6}s<O7Tb3$ON0UEG5ZtCI{gF75<<ElrNZPWSQZ&F+<3#f
zk5+*w*Lzz!Z&-1ZuK>WZ#MZRO=+rZ3cd)E#dWAd+mepjdMZvN(0W7OtafAo=We3ZO
zq!9zKETr(lmhc$8GJs`?RR{MO3*P^UW!(?n#j-3FrSztbD7KjcSk`Rt4wlt7BHc2(
zgJr!K0kABkQIV+~EbE{kN(#a(Sj73wY+DGWYQo8l1+Xm1zhGI%{szkuB9n|2q3IMX
z3kXdDuq?kMoxFGomi1}}%i4r!$LwNR+^M+a-?6MDOQ;xtWf5g@D(?#Ewp{h}SysRN
z24Gns3KT30X->hiTH#^!6fEoBL~?@=1<RUzfBOfP#pEUeU|BX4EGx|i6u)QqS1ik3
zan=4imgR&X{(@zt$1rD<TFzjN=GTynr@muZ`Y3Ai9W2WNz_OP9ie<&gfaL!P%aZpn
znfWW06+*$Xgis;&NPjku5TP9`3%!eF@rqEetnxo#SwerpvdSQ|Uxgg@iT{FSU4S1#
z-{R0G{KT>neqvcR@jtLE3^Vzku&k46JgT6wpIBDuAFwP50Lv2k8!Rgkd+H=|;&&`7
zSN1)amV#vo{Rzvuu!CjI{)%OJD&`pi*iZa-EKBMaEX(~nmZeU?vXc13Q9rRPw?AT8
zmOrp8CiU2|s2^CCJ_XA%hCN#PiDf1K70a^x3zp^ME{-0)_7lsx_V-xUJpjwn+r_f(
zQm`yb#2kQS75~7p_)Y~wSQd7$EGCQD-?6N{yI7V1>d#nK^#qu1ZWqhKZQA_AvJ5c0
zSXL!hoBj@#<@6^ki)*0J67>Vi5-YR)j%Dqo`+;Ri^t1URqeW(Ru`DeB%j)_a%gS5)
zAF(WRJ^;&-7$a=6+909oy#SWA_pex%Qp{3H34;?-k2|_2RbvOs8WE2tHT?n0s-RyB
z2e7OxDmT}^Vp-7;x1U&6mckD#iwbW4E0zUE{u#@{?_gQO{~gOB|G=_Ne#f%v{|U<~
z1+c8pT`Wt8f@LWr4R}+qEE53Biu!vjD=YW`0x6plFSoY7gJq3Vu&f>c%Nk`Lp5Ktz
zI=+Kt&0^#3=%Z6rJHZ0O69e5`yI5BBuUHmb)6jjIJNd6zmO>H-Fr&YNWvL|CgswB%
zAP3plPSQ}YtX|{}mL>53z_QeSVp+<_SZzlNmZd@K>q)_~(gMoBFdK1a0Lx0-!Lo)S
zbbo_o9sC29<&XM_Ww9M1F}lnESk~h2SeAR-{Q&^W>cjw8*5@58OKb<r+9xM9E2kZX
zR$IWiCGTQcLKH0P80iO=HMN6fk^T<L8iI?H=uY)fu&nl7EUWK#EK3N$vMhgKS&Kig
zEM2N&!Kd{9gk>qh04!_iKVn&>IIjZI4wl7?!2Q6oCjW|MVd+o)#Iij8E0&c3%LK42
z)!(tKcI*z8W&a(^YC`W|S%y@lBt|<m*xKUXVObai<_DHFZh0CAZY)J2{(xnP{T-IY
zf&j3r(qFMGCD=1K{8uc?<F8njC%t$PBy$2Yv;G6idIu5jqm@KLaR8QO^9z<GN!r1(
zY@i$EkPs^P)%8DPSu;CWR__litMmt!CA5QOi6g207R%}-Qel2zSx%@OEbA@x_)jdW
z_s>|C@(z||vx{X3{SB7Y{wFM}@4sVNGdoz8GLZ_XbN>#@!cefR)qjU&&HOhkiws~{
z!U%{pH5tINgb?hK5CV>oEs=s{72p`Dg}4DMt9l2^Qr^X~m=U{J7Wt1@R>8l-vc$e)
zS-5oymX(L1J}D<fL@7C;5wmi1y%Vq(tc*Xgtb*UMtRY$_IsED$v8>Dq3YOLT3zkLr
ziDlVAlZ)uZ(Z?_ouwEq9cPxvGss+HZP~WkvaRAHuL~pW-Wy#Z;1S4+lVp+H!Se7!Z
zQsfsbtA}=9BIDph?I2)2ktkT!)Ss}dkl(Sa-W@E<EjZ6)2g@49L2d~Bj%D@kU|E^}
zjAfYsSeElHmZd>wd74JPih^YkcCjpGMgYs2*~PLH=ygZvSo{7F%bNXxWsUy_EKBNl
zEX#Zc%d*+UvcxG^ma-*N^$#p-^)Faf?|;U!^nb^)o}rtr5zC$usRt)u-s?KY<T}Fu
zEK8EUbR97`Z#Ec=AfxEL=c&T}6PATU{EB6X16Y<6b<2OnvXp<vvKj#_>of(+3d5Et
z16Y<cLK0VZOpgAQ5!K0fNGA60uq^%m0m~x)z_Q5maBpl$3+`WFS=P`k+zyuY2&Vi;
zENdSH%Tj@fTT-yB-e0k-<lnI@@gG<gVSevZ0Lw~dYymN?0$3J?@p1xW2}FBj7t7M3
zZRchDiDfO25Yc^f$1MLBEUTJcl1TT|a^E!o%i4k*jzr9?*FG(RH2#8RwE$RF&);EL
zZz0bBEKB1DmX%F?j93=4i)9i2GnS?MJC^mdews|8U|BQ7KVw<<f5ozre_&biu>XQ(
zc~G#d*XR-<0LyyB$o7bWWfe>?Lad>$|0R|c_5Tl+wHjPC{#Psu3t(BK9V~0~AF-@3
zRMIet+T%}Hmg?_VmfKG(ON1KtFR-jqBvq>_48XE7f5Eb<(ciJGb^y!bXZ(9C%kUqt
zEQf!MWmWxxWtIHIvVcoQf5Ng<=#CKof@K*~x&6ShN_VlWp6^&z9_Z-4U$LwcG!4Cf
zz_LpJGnRFdCgxWxOMVB-I!?i|oPJ<g<H+o=A6S;h4=hU@_aCvW4Qe+4%j#j2{I6Kn
z%wMsr(7(g7(y2U1f55Wbh`(T2Host5suV2C?H4So1<Cj;mL&=DGTFhh#DB%IYUrJQ
zVp*RkSeE1tmbEWfGYt1<EK3MUMZvP(LBjqQEX(Hq9LxGb{X3RL{3Pr+F^`F+-6QK|
z{QBQvS?<#65C0REb^qUBSs72V{xy~*RT6vCL`W&AUinxPyfsYwPAPz8W!?D}nD8CT
z68lv3@31VcCq;J(%Fdcc)sFcdX;99=<SZ$+Q?RU$?<0^J{|3uq<og4bb@2ZP%c?5=
zXDmzeJC-HCi)Bgt8O!o8h?e!CU|DMajAd0(u&hc7mL>g1ENkjHB8s>GU|GEj(f<j{
z@&K?b!{VAEiFK2I#Ika-Ip%h;EF<6x|DUle@jTTZSeB!Ub;H08mZfpz7c7fR!Lq#j
zS?$$gTUrz(shg9z-xtSHu&hyb|M%AbEUWw<v8;vvfMo@I$FfRd|5q%lwm4PeuUOWg
zg7tSS>kZ&W09e*h2|_07PgqvKJb-06UQ4;0;y*#bvcO&dmQ`})HD(9P3i!`hR`wuk
zZNN_~>)Nka)?UOPuq+eq|AJ*D6z^bJTE)Eqn@}zfBq0UWgD~{Mb1$^^@eKo5)&pG{
z;A)NzNIt<T)I9>Hc2~Lm7c46-RTsdr3f9ecu&lFs>^oT2GXTpPW`850_dAv)tnmw$
zW$**bGD5bal2JdftoKPGV;=nCoCD&P0G3sOWwFUM*dJX?@IiX9VbDEnSCEY8A~b+y
z#lahc%Ow7UWu;TFEU}=nzrnJ`cCoC3yI59HDILq?06km*W}v{rC9amk=>uR{p%g5u
zK<;DCE|vw>zi5eKVy+jazdBFBvc&#?WgVyc1<RWHj%6|Yf@PJ`nW2sJId`$Ff?)v5
z8Ue7ZXN)nwU|BYJO`riP8{D^pWv!rgu&jdLv8<NA!LkT!$19@bg-QS{i?D-b#aIDY
zmJj>P?^xEV<^P0bnQ%@}u&g!2F#yZ5q+nTB>1~Qec=T~mN)#;1fP!T~_mE3=v8<JU
z!m^@&$FgSrBbJpxZw+8sZWTYVtk!vq90kk5V@Or;mU2`K)PeeRYzD?GqEyoHA~gV(
zH9#d=HVL)-j%9rz0$3K|Czd7o9m}!>uq+VZ=L`T?7RVKC!pM37$p9gx2!MC7tUv(E
z+W3KGt%E}!09Y0X`e!UF<2#m>1YlW?x>Y+^R<Xb9%V9&qkg{Gdi2n?EyyLV2q!bJV
zVZUQpi^)H*EE^Qa(Gt#vwTw=hT)-Oq#IlP0C|K470xuTB2!G9`I|^V~lgtbbr2v*C
z6h}BKSgc;h&02BqddzY%y?Qb?-(4gXCxB%g&ciT{5{W`26b(d=d^-ZbvL>yP{Ys(i
z-`oaj<OSn)uq<|cD(zs`pIFwxpIFwLvH7<iAP`ax1nR{wp52E6ZL`M@Ub)LFXmP-p
z(Z=U^)Z_*gNSXu&5eY)t!5~=VJX8fe#KnlhQRy2qgMyW5L{R}S_&f-VREiEsVRWTn
zSz9=&$gd!NV3vS-SYDcq6wHZ^-@&q+Yj?1$Z-z8XY5<ny=gQ39s5Yp4`#3)Z%Q6OQ
z{KT>v6|B48ULfpZS!&orfpE~%59Spe2)CbDmOKT^f>T4pPoxTJpFH47!Lr_8ddwhr
z7=$7ZfItKcuo%_OTty&VC_jh_HTGpeFpUUR0u^KDAHHHFQLBq0@$fEQK3+#qWhv(P
zVWY@BJ;d$LD_>or(MAPSv+;w(zG48&8eRahWN6Uev8=j~dpG7j)O%vzi5x!r>hQi-
zP%LQpY^}J4Bo5zwpAUOF4z96C`WC^Y`t>H2cHIt^RRLgGNNRTMy7?KcP!M61wLV!d
zj%^pqihxW}u&jNYn>Qa%16Wr3gDS;PY?C57PDl>)`7%->NrkhcYfO(Okf;UGQh`vg
zED$FJ%W6@cR!h;ugx0IPA|PvB_M@t(L6$pM7AJb`7Dl{J8NjlRG<HY_#Mt9*cFb#v
zx)v6*s=#|XY329B)2UhEAW&$h1yqSqT#pee$2hM;=T6$5l-kF+L=6dtgtm6l%Jnh9
zX>z7Xyn&z)M-XorF-Ng0H<JJ#Y0Y~ENLd=*fRwd~+mW*N@#pGKPGf2S`HIv%a9Ks8
zxi1)nr&(2eV}hrt?sW;#-DR@W#3dwvldY1$hI`Y6q@PR{@mM|XfPNE!K#V33V?0%8
z!P;C|Ksmoj3rJabJVYFjvgCq5Ajt~k!^?e!R5%YZ(KV?}r~+WJwD=ucFA!QSo>9lM
z?w?gm_s&A1ECGN-{a}`gR@GoY7Lo0N!BH*MgYPsLi35jq2V~OYL@Mx6V7kcpMu%C=
zPprmrEVzLrBxJR28%suGKp-AVYDp|e-K&#RX%NAnjY^88n&|dG%7w1SKyq<*medAn
zDkwS7VM}V=K=h?m!<p%}gfD=D1`9$)Cp6=!*JDmrfk0~ej|Jkej)0Mci+X3Gz8-V+
z9V}1|M~j0|jI6$Bp<N>jsZ;Zwc(K|<R|HMt(s5d!hWouq5gWzGQvYFO1w<Qb3k}O$
zqZnD9MbWX*193~Y5P*@TIe3m@WGT->K@d5Lkp;pIrq8rpc7@%F#9f5O&`hX<9nHL3
z8{(6Y@tWgsOuH8YO&Nf9825@#t6w1yldBB^0lbHV^Gu=!h^%c$uAC*s$l7Nq2N+o@
z-;FE@z{t`G1dJ>qfj<v-kU{rG<oE-9nvie}FbMkg!~r;Ve}A;_&6x~AA$SlxE-IJC
zqE$3ojmlTtEKci=x)8XH)nr(zm8%~H09n{|3tB4*kmUgYSv|2{6d)_z4{jM6A4_ep
z|6Aw*$5u;t4-8R5q{=2@;TR_O30f;^=7DGc$f6stU@+YQvX}uND}D#aN|0=|`dppd
z=Vb+@i>rp>JOe6*GQ?d;RA_>>)H_{J1!(UFE1D21p=)3vPPo0L$axgxd<FD3*Mz`z
z0$)m!W3+W79tL?$d~PkdjS|N(k;XBfsWsIs6;e<VPco#u+0PpfXQN_V;nOXg)9T8o
z4|KL_+_t(YQy&O9!NU-FER7+N#y*$I*e^kjQ$*+aq#mC*=$5U*BU^LjA`KX;VSNI*
z-L?fZV-dq*;E1Dk#C;(kS^RMJZes{*4X5mBPW%CeM>iR>q4sXL1Tz*44yP7+ORNG{
z5zvM;2Giz(I4!9$MUZ@b8ucOwtw9{z7=*B#u!Uvl%b0B{*qOb)_dcBfQNxwJx(R3<
zATmi-dTQMYM}-7kQc9<qH=>Qet@jtf<Up?F5GeXST`LPC5-92QJW}nqTunmVa18L?
z1eZ=MQ2)WX_OxxS`5h)91L>B4ku_nJw&|F)DR<nC-uB4@-X1D2ZohZneYnZ==F9tg
z03(Y87+K2aKHO&<8O9&XV8e}H=!-s~Y-5J2XY!l!Xr;2btTqKzg4R3I3exbSaFB58
ztn0+oY=)o;z{pC_pcq*+vC<El)SPr{s2>4FmN7U8FtYlh-@f1Hy=!EJ+huzLMwUjH
z0gc`Vm+wXv6mY}{Ou#-@Yw_4Ivf8Am5#bagt1pJg7LVJT=|l^>M1CL|98O4X;u3;-
zI@=kJ!@=WKSa2W*DF_@VC+UZys=zUp+rx9wj6^7G_~y31u`6r>lwJmb`+-h>*yqaG
zNIl_L;MN2WpQR~kxvdN;NFpYG(V@kda>~^u2y2CIwp~3qH*^v-sYio?gOocTiGR8$
z(+2f^Nl)BEt1tYxS?)2~O+K0afxn;G6Dk~=Tu1&ZRpqhAv<r{n8#7%`)M1XAp(rp2
zj>{(;3<Axc*@FvUh@}c1%esuqJ7G?P!YMp+g<Exi%tzsJ4?t*lR}v_Z?;sqkec^fR
zCAWT%9FD>KFf-fuIbqOw07*z`rJ7cSY^t3fh`DY9N^~1rjv;=9wPl^TOLrXmFzfpD
zGdMwjS`h~!Ei;+SNA0lY=j{Lo1|%|Q2Did(SK0yNlWf1qz{@XMMPXwmo%vnR)E6{h
zXV;4-du#dMW@w4V?H7%A;;bQc!o&3vWM9%fp_BcbKMfP@4+h129ne~C27@O+WqF`L
zM;MfIK3fKx^MMFMg49Lg7*1fvs$wJdM3?e8nxSypF7oB?VFqL@{5Vd@kcRo*bC5AU
zSdCC74PloBF^~Wt^ET@tv!J3weH~+1td9~aNcE(8gPuk;8%QDm6oiW7X#!)495~+J
zuYaWhX;u$)TvRVR)b`w-HUgt+7ky3<#6s$$_PGy5>C+U=Jz(o7j9&JKYlW&gzp#DA
zIO5z9Jdot)8HEI-ta2Fy#3dZMjV4O$A(B-|G=P+4lN)8Shg#l|JNcep>c=?U39x-D
zMaq)<DP@^PSt(Z=irOHI-C^_Kz}C^L-W~e}aa?mG^H?M#=wbJM#WCdvR5*Op32eEm
zyrf?T&aK0(`XTjo?@-cnWUWInAZ3Al%Buk>3&as?cjNOM1P6oIwx!YE;+2gm+yh8i
zn#wM%G>-C-ukK?}i<kC*BD7wJrXYhrPak|Bp2@cHo-hEZsh7m!7*HU&Vc%!v_hF2&
z<%*!U<;ZzO&nRlakL3)WMA>9Zvb_hDeJ;dsJy~EeI-#3zfiCVaiEPOolj}i6WXC`3
zCfG+^+_o}4l7x<v12tqgvei|9!>~*IuUDz{7vs<P&{$G~gH6B{ARf^b$huco3=+CL
za6Stu=Z8CY0M~{%Km!M1jMeX)!O`Hlic*o)hj6a!3(5Kl^Yj6ipZ7GLQ(hVHaE)$l
zuz5o>;Rr}s>YGkxBoMf@A(AZ`@NBJu)T<6@(tv_}^nIN=TG<$l>7B4RcJ&oL>mW|>
z&D$@A%et=C#IkL+lFu1}a30SKkc8AEdu&ug4Ls%)4KpXq9t-nAQy&W{xOeX9tCI9N
zQTSs~crtsr>U?ZrFT>MsujgeGY)rE4<l}YC6C>imAD5_{{IeYrN-lkz^m8;b+f?6{
zBL$K#tkJ3Aprly8P4!jk=iSP-ArHpNr64pEDGTQh?`UIfPT(Q?fx5pyyEm6tj$JTv
z#hRD9&Re~+XuM+gj&=MR6b7*boo1vy6{L}<7)*7{`%(bFWGT>mba)0ZSxw_WYRC3s
ztfDF|z<{Qc+UoSTLq{%Pf^bwT<G$XGnwDe-gW(1ZhZm6u5cvF#kyWyB!o*Loj$&km
ztTUXNfB{BU41dU8)whrBLy{S3ypVXYxDbkw<-TKN<x-3+_gspR<unl|v1??}onS}A
zf*e7JbrT5g#f#Ln!f$P`IrUY$hYfvW0Fgzlhuyx30F120v`i??u94Lg3K92F()NX*
zKs33yM{ee0_u4kuakN9xhjxK1&sCliAVxXdWrhxz<1Dj}!>U0XPXLYy2Lh{|f(r&)
z2#jCP#L*QwxNbU8bS!#m^&$r|ZIJTVaD(RlBhfe}W2?FrqCSTTKN7@Hk1tmR1^V4h
zIrD&S*f+3(+UJ#nBxeT`3AaD2H8l35*KdI^`B=T-*w4lBnrJ)+F1w}%&uPhipAOQJ
zE+J?Ua-I`r?o`D=rWwwOd@<sO-mFXpt%cCghRAb-f?XmV5`!yb9KlqNopVls-z|xf
z{pM8(*)J$ERv*p|4zO*Ym`lnyu^k#KyZjL4Aj6K6NOh)l)T}%<pU>mLTYc-{c{}wA
zY=p`VjrH!3Qt4c=0D8p^_jEhJmDBsQjN;0n4(CV^WO#@+8wU~Bkg7$NGBsa56r<qa
z4}V4tlqCjGJQXCWSjq#9!$Hv##jGME92iDslM%<Q<Ah?lRZ9rK=}|Qn%LqXdL9Fd`
z)R3&`B8DhXAU6lxa%O(MPm%lhUbtnn@I;Yr9E*(qd-16<)AU5-!ka%}SvNw?t_(Tf
zuYOmuNPlLJfb)3|(Tn+svSuwUE`42-9Lfo^ou`XeF87WfzA5{S>Wxg`_NLro|LM!J
zM^`uHmxePYkN3f(M67~x_zoOkQOc{cQ<zK#fke11Lt5b>?_=l{+p*P2_I-P2K6rZ9
z8>$X^pAnYzMk{kDawF~?E9qea8KZkuR4o(j)2AyKGV@V}Rf2VMNCM#8ie~OR_APSq
zO5*({U#5L#pFhm{n+fWc1uon;{_qvKMDHojw+C-~#Wxy$ixqR4?~B(;4)0CGGn=Xv
z<CBZS1Y^1UIUlMv^4dMJ;7L^Th#kezpyTyUKFEbKZJ>pc<qNLz$0$F7?~$mPZFNw4
zD{`d}zg2(znfq6*0eHHJWZRMr`{<@fmX*(iQ7bGO6`$qgKVqevySZ)6rfMr2Ln}Ua
zG~&tyC55&E#!V~ELB{}D+OoWpk0QhhUaKdF7M{%z8)rL5r{QOXV>w+><iC9JK96|k
z#{KBqyp814t+T9R<pCa-B(COfHHnoJCu&GuE5CGlCD}ZJ`+^Mk9yw02%6#*lU|YQr
zV_8zcqQAW|SxBlr%v>-^rh>c5+jmG(%A@g?hSWtFAv5Mx`!F=wLM^Y}b6#uRis!IO
zoZJG<nM^hXcg<5V%5-&(N4I1;RqqK#iQReBv5@%N%B|wK&s#1tD4}4MH+K4#@9wj0
z&hI%arNL62t34PWU|~N#n-0q;K)qvA4{Q*M<!k}^PN-w`O*J}`o!eINX*lxRL1nk1
z<ZSJ)oD$jE$CpA**f(`z^l`eUHmY=1<rD_^Hlt4r@hzca(!@Mwjw4h{;nM>|rht5h
zX74YbPkOmW?N`b5$k>01r9Wu@T^^0##Z=C3RPI>L^=d@JWxJOIh}2AcU=pLn6R?Sr
zxYG34;ISF>)8^SC>@AV-1meJ=jq4dZSv$YmR4?+w7=7(y$fQv|aN=Z)oQBdf3-+*J
zPkQYSW!)NB6SIv2EKP8NF0!Q`{rO2x(p}pwUmlCB;vuQR&bOZprFuJhX;d5|Zxf|D
zQ{K};v+K^>(o2P(T=JK-O-|NMgm1-@%-OF7D+C|fjK-MGole?Dr|7I!-hoTmpsuM&
z%{)&NnPB7+m&@P`{Vl2?6yx>a4A!p14thkXE{eSqMO|nIy^g7mWJ<gv=y4ZAyFg%7
zhDW(M789)cYy853XKX~l@QTi!kZLSU+ft4*C>(Mw1Y`8Ida;$WyN6GRa{!^boaTgF
zfDwh}ZCKuC&C+^0`(GS@H*ID`+${>{5^-tjCfCU&ZrI*wTD%udolR~S;<uX+y3uks
zjU%vHKpxq%GHk^jRCY(8dN@jFRUv76lfd(J!kr_W+y`IKqgp`6!XdU$>BYVyo1T0b
z)W(|bGa!LXBz~<r7p;~W%>RxB!$s{*f26)KyEbyK^tPwOEvKo*3oV^{WlvnY<@R=p
zvta%wmev2hT%LkuDP-mri0j!*R9u%dA8=sFfJqoXEC?o}Y2M@M#2`2Nxx*DR->qMv
ziwuq9=tt42&lZbmSqY=#(KIpeiAaAW0m6*W!vsG9S%HSnmDSMO)WekTE~1a>u16e<
z5Z4!$oJ_E8E@AHyH&m>gObKZ&{TnRHC$!k*fS>Jy)`E8V=KY(<d5{}-SH!xRfZ9Q8
zr0U%?l=gtpCfNvqbFh)Q-N&An+q+mIdH0(2^-B9LN&AMas4EqyD(9o4^qsp{mV*J_
zX}WUTzDirEIv{1m-T-&+#?<v%$NVa{cbD$AJW{R=zbl2UagH;P9rgE^2eyqWlezKh
zeOqdmUR8!Gw@B9<vAFigtFSjU!%c7B!`3<LXVWdG(lhoblXVem$VYb}uObM+W{=i}
zoHZ|6Q@JINarstB$ex~*Z@VjVrbwe&H69~?LAxQ(DaXiKda~bt;P%D?$MEpln#9Bh
zH^ui>P(v~Vrt^AKFd6JR;Hr1Uc@+?oHRe9ZCU76zNVfJkGeXm-cPYQ}DB{qo$9_}y
zyYqVM&hfl+`6x6PV%1^D9=Z{A)eOTi&srqMuEt5DJ1M~IgVHq!rkj>*kcqS0hu4!{
zWZw22?GnPhv0Bp9Jsaw1pXX<a%Vcrsol6;*Io$yFNY3KQd?0sjqhGugFYmB7Ck@HI
zmtFaYo5-CKYE>^7`tf4i@%OEx_T6tYmK%CREbGN3`31FGjAU3#)dmh;-1o8fi;Tk1
zZ)1+PZ>16P=2hf%k4j>r-FlOkB!XB*R?+zB2kvv##9sSj+Dav?XE|jax7^Y-dCWG!
zfC)qTjPc|ZUG#p8G3`s@&N-!I)m`mZ>s9O@GH8Sp`V@<g;D$+}E5s$FE$N3IrMch5
zD7{@|Fimd1-~H{R-Lky28PuCZTE17Fq@1N_y7eHzJrt28!{(#eA%l5BAAe)2#{Wde
z_G7!jW5*`lSEcXeVCM@|&R=(23(waSfA;ZIXC?7y_;kmd+4CC1xvoX_^Yo+v^Be3(
z1A}B&9A`l{R67~L?9qyy3+4Scx_hLT;}+BgC)jdT?p9w<Jhrr`bZWEGYe9~f*}24a
z{!Nd`$jh4jOx-21&qlA`3yJNVT`Hi<89!0`&TheRT5})6MOE^<!drXEL82O0*EbBy
z6uVyPCtf(f)xLIJ-r0HF{>J%nnfJz;`)!n7Ydq*%JBoigo~7(4^YGfCxTd827Foz+
zkDtl@rXQdcPPpyy<d*htn$LwUpV`)&*W-Oha`9e|u2a!i4Bi}2?51E@1s51Ujo5s1
zvDq&C@?5HrtX8D=u3-C1$rNM6B;ng=jJfq?f627A?CuZYg_}$7*0v;h2=_JpXG)tT
z(nMy8WSh3nt}|?hFF<wr-$ZB}S#XRK;kfzf_WAB-&%1;J_7CuxJ~vcDRS=H0d9oE)
za;T~uS0`uQG{1QM%com)kM&lE45^<{tF91D=$T&QSNiM~HI_+E<WhPodmRu9?MwAJ
z5H;5CdX)5R!DF_mFQ1qvu@(p<hR+*(Wf+R$LQy}8U)?`P?Snn&)K?}>tEz;O(!$bo
zfz@XjwBvi8L=@4pQ*S6AV(>}iZo5VA95W>`qBV<Qu_VaC_0+uZoMU6q6y5X5y-eNP
z7?$_*2$f>iL3;IiH+#@+R&y9xE<tSUG1S|AkG7dkq=S2NQO2gNBT+EDOu%Di>`?r|
z>0-fheL;tML2BzL_{m~E`)PXHOYW9}9=Y>}#%So+;_Wuw`6@1e-nw`IGqhyn{rG7c
zedracp1WLd5o=TMa>4-mu1&ozM{<-K87k(5Sv%OvH_U45IL3n-5lNnR=bG1gpa1mr
zFvkT!PU<wSIrl5%D1Po(UjG=lpS!~>9%VnU&u~Cy&X`7MP)p9^P~a$=S)Rz;u%fl8
z!lFs^!Cr~Hd^&IYCD*=vj@C=)0cD@k*;y`>Gy{lRk5djK?PIW)-w?61V29i;5%eFg
zHG`oTg=Lo$WDQ|rr%O&|Gr9!#NqmXothgtspevP8BC(~X+p@^g)x#rKXh()_217No
zVq{QyQF*<hre(5Zy=h}FCr-rFe4N~tu(5L)9J^#CKi=Qa$K!>;$BU>Fmuy}8>cV@q
z$Yna~BC20T#mDq4mzk{S_A0L~3MlAu&*I$xqK`<>6+QSZez9d9ikdLs2)CBdg=vcP
zh}RR+sPJ;)B8I6D;ozt{elYPwA;a4fHo*|pX79DL-i}-G0w+tf>!Hq--fz8QEZ%xy
z`OB@?pIdVKSl61eFfj14U^wb~)n%FK%%U{WFomLL9$Qde>K?S|wjd}2!aCz_Z{`UE
zgV?eOAD&q}4e~rxf55J6Nn6%bC#Zzc>z;HcS_@_#hJXGLhF4#NDMvrE*%TGlzd|P7
zK5S~B$dL3pevGez#FLe*GlO}f?<@S0Bw+>?sZV`HN}XpAKG{Ntl75lEmlab3vnAth
zZH}Jwd2!0r;DmaaX1|#C)Qd<DtFw!~-a^#sogfrkPhPj&r;Eh5%BV?>ssriHkLm4i
z=%ugM3zlWjHUra<No;xa#|xe*>t{62khbj%RL_;_ka5GqP`Yqymhe)3tBRO{TPhyo
zvE7)sbAI*@uBNQKNEy9a-CU-l)c3Ib9%8SPVkjQ&ddpjP8<w_JF*|Re7A^|f0tY-Q
zcVxH5@Oz=V!7f^5o-rP4pZWsNE%8Jz8TfeVkjflxdmT(&;;9$4ok3wY!LvtU3Y}(7
zjLBwGBDR|h6I4?oGf%??uLRm(^3)YQguSX`NeDW{qRj^PWoLQJ_cHj@m96=-fUT0t
zt_&?-AOsDB7)V#R=C*hRJBSt;7*wef>YurU5N4oNtsvPX_u4O7eVY+32kFwo#1;9+
zZ7M*Tp^LR4P=d9;6Izmh@$@~^_b>tI+hcs)2c*rG&s7rjD(^K}i`o*e=rB~qioR-8
zc@@u$ag<HfF&4poF=#s7+l!QHZ6vfBdS?0*`I~MJMB9^NPD{|OFS9IM5u-AXT{MV?
z%;d!ShGzJlDDb^kAr`fwd&b|_!He;QpE+kVhSwI%8a!v;nVa0*6D3%!%;)>E0=8nC
zqeBucnj6W1NJy<0Hg5IpBVXZfe^pu{JjR%=C;Gy+XnB}XSV1~h2NZR+(zIM5o%QQA
zoz+#F&A>{-flB8bwU@d`rKze%f%zifXeDbWxcIB#>A89+GxFe3kJmQHDjlrUm{6{c
zG-s3l0FnKrjlK(m*Womlm)EgUqZ%Bj;+h+YxiYPnXg?8p`#o_Wh`N)_WFm=v>Cs#z
zN#wogH<J5^hg4LF0iIK`Wb~k~>6Po+1A&*eB`eP*RyI~vEn8GaN!DBt)E<Ls^<#MB
zMeT!oOZ#y;Md+$-e-1PMZ!<CQ^|Wo|(UC_ZIT=!?Q^?ZqUpzefGQ;D*m@aHgWlGp!
z%EpqQZEnC2YVSmpCh+@hqF=w}U$Mb5OdhI}jlN@JR`-;DgvgsAm;e^@J67&9$~V&!
zorp`r*61!m(;K0l#rMJZqmw1iS{copvR*%FH1{3p6REi0Cd;rTZ3fX9sLbBC9zuAy
zcr^R0!`EC6%`)Ql$Djt?ft<>;>E_jq?tt0GnjDtc$&b>mi`6>PH8IMsry(^nK`@O-
zJ;&fEv0wtW2)*JLgq&CvVVh*$%lsx}d;L=M8~XUMr`>2=ebmD3C>zdWN*b~vd}|xM
zg8Q%e^1*M9+QY;u&<tb9k<=<URgX=>8}{Ea8NX!C7m)}V4O}jh9B~`zoVDpiOmD`Z
z++m~2vy<X8pl@>Gc%eGD8H8@QPm2mn$D6LRer(SR=d@FIXU&cy%;a8uG1yE!Yzwbd
zWgZt~Mu@QnDH=CEeap}45_0XK3*vz}!%`yi_OVagb&L$h98=aGDzDS(z%~=>bcp-T
zwaRUMBy2UlVYorV_$qjn`kkC6i--x!UhoX(&A0hWh|4}O=PcN1NGu)0CGFh%ort?m
zW(KM*20HH-^T#~w0_hLTF<8XF4h3x+M7a%Ic^_<ca6mJsZoC1S!o4A0Xep}~!+I0M
zc6j4qjKU<UVR+b&cW5tXpLae`mTuW0$?_9H8>zhS7+<96rx~z6%`9EXM0HQ_98i=P
zH#$2T2lYivUO&jui4z?f5;z(oXL(yB<Ne%|rp`nIwP(o@*(a`UzMnRWQGcxT@x8Ha
z>&rU}1gW8+@d{=Q8-xAQ%2pQ2b`ID3)N5_~OOH4!JA_?#IKyLqAZFv7vQy4=Cn(3^
zE6<&^FKkyF5N&*-Q+dm=5WupoyXjaa-zM{E2~RmbpvRV~+!MX$w`TwJy1Rgi$2<8O
zK44`A8C7XVAC+ZK!(|;Y0LxPGxwTCzsW;^)=O_F%CgYxryRXU-0LwChOCIiH8_pCn
zyVaf;K$Z6K2nEY(aVk<!RcfK@1bq_;dMevcg=#*^q<Wm=h8E8=Tid4N`&3V;-Z-J7
z8fvtIWjWk9d06$7@Bal@)-m;*u(q7@>ba~BwDOV<kqNeX2K&Xsa_iKW+`W<Y1+Kw*
zy;`u-n9-<CrOPiOo+Ip>H~W-HpKM%D6kYu^y&i!|`7~|TOOzfKFN#T@ow2&sR$!qq
z^^zbfr^^S5a{HowILrG=;hIPh81-eqhgR=pD?t|2+oolp*xAF!%V1x-qQ5pTK7*H;
z0W({-*WPf`DN7XtnL7oae$bvGO9rVY_rB&msACDG(^_V0g{m7@J(cuBmI-NB^9ggh
zS0&;ZK?i4EYqV-Uxh_nrSyoW*S?=G^#}sEa`DMHQYC56(F-%>pM68FYJuR6LCF#)+
zwHecKGwg|0Xpi)Js6wvht8oHnxR)XsJ@#eP!J1I7H_$1zRr2o6u<@e)O|Ww0#7zrj
zwX9yT^(d8aHEp(DKIyBBo5RXv9RD+@NGC?os|NvyBt_Wm_j>&&%n+@8VvW5#!-OKI
zPEG6=EkCWHu*i`q=zjEoSR|ND>+AG0yc9ZS%5&2@s+>~|q3Y;|SL$O?=+)mBfE4NZ
zh&o}Lb%wCtK+O!pGRz?M#gz1FJt|m_R%m~bD1jT@!`>RDLISfng86Nuq-=Y6we|~b
z>g^2#v(5L&xVDbl0!!5)Q&f8CKH-VO_DL<Z{cI$>%F<aBh@dmkH~d*oVROHb8DaT+
z4|!T8DI!Xi;kq4>AiH!rAM4FthG8eoJ$LyijP8<}2eVQ2+E7L9LHBUj>XJY2AJ+RS
z_CO`6ZR_H#nAPd-{CVhyH`*S*X|q-IC<W@MZ9>=e_OoS0>G<`rSAf<0wBIt_kVEU%
z))V9`q36c*l;C~Jd9~WYdWvIE_4!0O5S8ZnrD&_Z7spWQLA_L4myK$GkyBO)`{r-}
z%Sz!<KlOf-*=sm$OaHG}*1hJox9n`<g_0PF=f^IY7hBGtR%yqGw+p!k5^fnaytGMu
z+5cM4c;EKJ<}(LvE(L5UOCG5E;un<SaQv0S345DMAB?hJ8?^4ZrlM?=ChBnBH3qX7
zE5|Elm>jwwEXIix4w~cyw?iu)R;Uu!!aat<t<}zd6|woal$w847f0vT5%K7GXGF!m
z#U_K=XId8ZPWM~R@`MFF>4^C4qub><Uhy0AjwZ_%)0V~aU-lB-l3A@fxo@Jal;!iy
zmwBNWby;(9x%{t|i&nMoHcizmn<qp0D@rztU8V|`V6gO?Yae9R>K>dG*P2SWCXm0@
z=G)o*?X7Q?v>KQS86+|tvu8MZqy*_=c;pIEB2XQs5a}opeQ8|d3sS*;u6}?WP5ks)
zHPUC&Ky~}n8d6lnWeE>pS!cg652IpuGel1#Czq2-z6dUN%B(|Z645~;X{FXhoSs4s
zweKsk(2s7>rh2W>_7k&Qua&V#6_KFhuWg;{x-QNoG0{m$V!Y_{%M@OAfBDi!zLU^?
zxiq7!R^(MVq_|Z~K;f&^guq$Qh)0%*8fKZ%d<zqs?i1Zs%5`@3;#H(EFus}2k$$|a
z|D5UmY&o>3`gI~lg8nsuAV;pf+>w`##Pj)wJW=L8-z(vj5y8l9&v|xzvYgAUwZWj|
z!ZIc{Q#RPkh{N6f*4+zErXoWZ4p(-aVs~Gn{mAXY-nnNk{CR%P-04>-Lwka|anOCI
zD|zU;x4Ww4^Z`$2W|%j>ALF;*0V%Z1>cIZ-MS)9($ujHFjJCb}N2$AF3SELO!aWk0
zD>oOD$J@MtKZMX_uO#`Px<!kiHs6v<$GZKxyj(v;=O(=E*<?K=+Ut;M;Vi1Yn7|Af
z^x1$E7<a0h8{R1_){)Ry&U%~_$8pd!p~>QFryiWwPW##&t#4!e4-3O*qFsFRm>1(X
zE{~72Ep>@aU175$xhO5Ahq()9h1*)`(z(|bFLR2_&Kod^c;ILHt-iF0+MTyQdL22g
ze(X3)gcft3{TWT67YGYSiLp!*-jMv0_fKA=$q>1Mjox#<B0^8je%NF&W$#>gY5#?#
ziy{r%(wy9ZEDuMn5i+epM^0v_`nhN~Xhb)Z(@(8Eu=?<JTu0#R`@8pzvp*E&Qm4v@
z-g6Mwy8YHjOE1LvU1rL?&l3C^>hwafkfv4mz@E<usg_78*juEW)-kR`sa#vp0u0!P
zMIWp64HmO6FNUD|smNefEXx$tuO(WRdnwvO={(v}j4Qg>{K`iqamN%7#{<RY=Hcl4
zRw10;5vPY=SQB|UF=DpXy-ZPt>1)8{6iYRC_(_G{$O?Dyp<)jPfl~$06ft%MVh>Z%
zI+Uy4ovkEZm(djk<pAu2+!NVkjksi0ePe;*$GpPP@^tbbT?RMfCtKpZ2tGL>?sw#&
z?U>#kgnV!xF+ML&JNo#LPjD%J8;=!71<=wp6O>o-FwqH>hj}SIL$uc$ASIPyr(B;A
zCm*D16E}v(v)*P&al@F~_r@+Uv*h-$Ez2c1v2G#^_B?qhpu2cHsmw}5LyLA|O17kY
z-=^Mya1b3^OA%rt5HCOzNj3D5HLXBPmlv^WWZC{{Jb1+`Zv$ksx5zO)M^HbH_f>-6
z*kmT_T2rC5h#=cMDD`Uuj0s;97hZdjRcqFh8{f*P*)?+T9GaH!h*K|%>;==G7qqY}
zic@20w`B5{E4X1vkRoru3pWYza}S4@T#<Cg1Dn0Q0DB6ioF`o~A^`euRmXN4!*+Cu
z>cDbOpAvg~j+R|7FY-$XG&`NZ+uFl>W)sh%wm>Z$UW^Rf>|xTyr214-3l7VTYn^+}
zbZRV$^}JP;-lbxq6`b03fNhd*ZbCCmD|Sy9dFaq*pts|9TVO3*kHe9<!^aHIb8-_V
z7C6Zg8N7&qMnGK&6OP72PySM1s@MmQ40-Uj@uGKr?A!#?sTp_TK-TNPBQB30u33tO
zW3A7Tdy-74AWX3n{m02xyhpR-Zg3UHow}!}AaxDnr6E5Ae!W~+^3fvyPKqqsm4Kqu
zSsTKs$7HoL)>#{KC7loQ`cC&ux<)U(RQpWI{oG>G=i+G4LDR*=i)6{)=3cZ=KWv;9
zse?JZA{o7>)i|1~8cU^EU&3UF*4G&(611rZR}!##Y{~1iZc6S~Ljh2vIylL<L5LZ>
z|Jdn{XZ5Y#2i@PqK;$pb$AH~KE5BCA9}3A3c-I<U%B4lCz2#VJ(yCXtIv*?M+Gflb
ziZ|S}RLFd2#biEQEAS4h&o#`PI@HEuTTmf=V0|G$b&Rmbq{xz`V!_)R7Qo_!96qvb
zy{vfkA-izMD?X0^7oBYY%i?EYkMn>X6<01BwIT!~8%V|Cw8G0^<Zbp%*n#t4UYgaH
z$7?U^(b#WIUA&iIM5+Q}7}uu^FxShIrdacNn-ccXFR(Mj5M2VdmD-A0l+>Ep>hr!h
zXnD#Fxux3kIj1>Kx04|(kNhC}me8~X=w2qIJRPqi=N=t7Jbf@WO2Ds|T?t$ArhPru
zB>wT9WbtUR)7WU%S`CwL!Ef~a18*!-Z%BNw_e~iQ;urWlBhbs-XyW&h)*^Y)t#_41
zx&61;)2-L(-AF^dJcpRhW;G)7DvT8S*Eucpp=0C769?EYMr)S!L@cyE6VYO3w3P=A
zRu_9yOwWZdy?khRmi_(hh`AGm)6o-p3%(_HgtII_&>Q-b@sUMX%nLt7uj%lsdsGh2
z<cGHlSo~%*b5%S2>_lG>bR2uCA{CjFI>y_Hz5VcO`l;nyPwwsGH-}D}KOjXNS8}&p
zkHcJ@Gz0tRzq<Xf*Cqq9%Hv#i|ESTa{4YI;(n<?d2@`l8Gc0u&N|5G^F(f`hFijv2
z#kz{t6{yEE9jB?`D)1V*zV}YNK^}HCFswtzb<{;lOUc5JzC>jcul#ALbx>u@!V21x
z*2(lm<aWtxt>|L<BZAR<F(-}R6}}-J1`?jXs%6WR4cMQ>X7C!fNXM98Gj?m}by*#5
zYDK=4cF8sTTFPm_vEnQgX$h^-xxfAG)6?x#D!2G}JUKClo*&QQijT>X73L-fVx>*n
zp^RJj)ymrG83_SDIAkwzqkTB4pRrIS*kq-QMP)@Jx8Ho*IJgL2sWDh2&~35@epDdW
zi{7+Y%yAteKrGr46nN`JKRdJ@953XGq!uIYLE#x(aSR@$l#e6<xip4Q9K-Epcxe%f
z7m6kqN;CMnfvSY2dX%c#lzJGaWfn|TQ`$X)Ej1rDy{CV$S)w8&3IFlv3`kl>P7<7c
zXIrU+-w>?(mPvS6_)tO2bHh^Sw-ZPvX67^IdtC9%JR7WQy}TK+H!_L|rVH%c8_`Np
zxN4NFQey0F4+wLwPBT@<V4r}NyeXQQN(wF<U7DcFENF{4*n(yi)n#wH#!j=sI-`&H
z7%PB+GY8XMt{<l3ch|I(N3O-4t0vtf_ah`0Ikq$5SK}vGJ-{@{B&sYDtOU*JfqEAO
z>W?oLIJLlC45Hb>i8LZV^kbFV*WZPZ=#{`cfydcTFkkU$U|Aj9^X)nF>M}or0c)l3
z5V!Frzv#Jh0fQ`7!e06uetKtPWA@A%2#RG0Nlo1uM4t~@V8zihE4g#`_w4y-BvxB0
zv$!a-)+6HXp&{w9SGi;_z%5z7^^%3`m08@YBP1$c(r|8wHwwhnh-O&9(y3we8|M*0
z`kehZzBMq?5iin@q8IIPcrYn&DTKdqNd6Lj@4iLRuXuh?x{yDM2oA$KPi-zeB}A7_
zq?QsUvB*4Sk$t9M+>8;^lJt;mAeDG=Z?jC$xthsFK$X_<JX^(FYj@Zy@I2T)2cKxZ
z<pu6x0uT2hH(iOq%7Xk?L4~VzE?<zU)JBNpqZZ%Zsx09}9D7;SFj;a@N)jbN8n=LH
zrcjv~|E#rAz_f~Yl5A2?RHCW))?1aBXcfCSj&+m?vgg=2R^=_hT4!Aag;z{DCxp&{
zjd0OCC_&}N$Jh#1bBLLm9ZiuTHmWB*=;PfHCm{zqS@%z8DlfUy(Gf(J1?5ln*uzUu
zkuRJ>7ZzIXxF9{)^QN1li?tt4@8`HCC|1IM>CHa&giq0eYBsu`-}g8T_c_s730%U<
zsXzrP2Xt@P?AM&pb6=W(VDyc$^tbV^q(^Pav~3L>LWk8bG%HxPU=a!WVq`l=@eTTk
z^Q%<OVn(e6tJBTTH>Y*lz(({72-#N#p0)yG)y*oNEWx&CmIY~1c;+ee3v=DC)P1bh
zu<<pr0Xrj0ku`_7gnWjto)g=_=@}za%s~aKgHPGanRNwx1mW;feV<}#$6~IPB7qf9
zgpVNYdqH@A5!ck1fa{E#NQn+}iN&^(<;xj!8X=n^3mPJxXKb9$62wvqHgfAt&j8t8
z#j-f!8^W`A{ArQ;w?4IFS-7Dpx0TF2?d*>U@u!}!KXzB|Lr;XL2m6&Gfe@I0KUykA
z(DLqBSk%1Xaa+YN?p9v~9k=6@X@$HUxU!kmz=F{j8ss8dJBiO0tGqd3!{yF~Dn1=-
zd#be<>FCa~0@CK{VHXvoT{o3--{bJ=?x8n(4!^oC&|lOzT<Vl>=lFa95swzgnBUh5
zc6xz#X~!`~H-Ckk!m1Jut9mL{?h#}-lEJyaIJ*EtLR?*<cq~t_Io|T<!`O3zSyW=0
z7o~;HV^Cz}!=Cm&z88GXzYATuBM{i5^LYW$Ut}6kgk@rP;t60I1+i>qW)I_i&#EB&
zL4rZ{C${j+SI{Tk7e8C9=2|ND<f1}q*?B2bu{ahpRut=&^o&IpGlrY^rej9z33_y;
zKF{ofUR((Jl*YGK*}M%eAu=A&4LPN}T-?0n$L3fp*o!|UmwAl&RgikIi9v0c+`G|0
zurBi}TQ?!ziG6N9?rg&gjG-u6M?nEKS@;TwB^oSX2)2DQzpnzr5QP)hgjgvFos#en
zSQ8WWxe;{2AuKE>%n71$U@>gJP`H#wxD{0QOr7k)Jhu6cNL24p$wf%cOD~4!^eYn5
zhZBXG@giq(&UD;AbMyaW@2<b1YS_2o4>QEjLw9#cBh8S~B3&XOAteeTNH{PI4N^)<
zcSv`qG$<n7AgN-bqC6Y0F0Z(+`}@Z8u4ldfz+P+bA9fu3JdaP}<}E@3*DTVy4xA<-
z)-)rQ>_lc&B1)hg|G`ZzcCcK>DVFuY_tqWtv~DZrYg&iwRA4Jy?iH@bOfX=hIAv>m
zIg=xrg{rS3$E`1|twTMRBGotBFd%^by;UAU0lx!H{-|FGKeA7K?=tlh#(;P<#H)_0
z`c}AhI=AhUf}N&=Z31tXD`dj5ZcS!#-s6GQD3QEh!L7^m%S1@DS>m~lNPSv)e|<G0
zlQH1I8G8jB0?S~(WF;C{E`Ku%U7!N~nLZ?Ur|PW+&W;@7Y-E9JQq<gZ)Y5_L&RN&o
zE$~VQ*>Lwua(23dfHQQM>gs6fD(oCpV7d3NaMKzzJ0QsFU<#PLRvc5r3`BlMC;Us6
z|NU-<orCBsM*1_x8uO&liY5u?l6~A8ByznPmorHXlj&=MBs#KexJ_cSdK@qt0}UHV
z4?1&536VTj1pUmMvH^ZCZ6Y#k__;sEEj{GH#z{Qd&f@6FC*6-pC`e8znX&M>nm72t
z_X`?6iz9(!{q~D)M42U?SC*8i9j-cML{IK^{tB-47Lj@+LO}esYo~OeN<e|Uc(_S=
z;}AnB-21-Gl_m*T+l)lEH*W4s3IO-e%qqs#Ywt5^$E>SAR?N#@R|_R_jYErwTNQVe
z*IKrO4`)fmfsr3qNW{Xah!iw1RpN4baOygG&2b3PshK!$;YA}E%tv5uQ(3pE3z3pC
zYZOenLLx8wn4>=xKFVhHr7m*EWC?9zNHZ-gnJq4-E~z#xsZS|so-JvoE(I3JAEuNJ
z&6bW)mra<KO{J90&6X`uKUgz;u$l5;clN>2OX~7Brsc<2)@=C^bp^z%0xPuwcdmkv
zrjo?0k|MQ|X0DQfrt1GASk}eQbh9)}vovjA(ApLNFRQt2?Q`3LPutQ;>nor3H>vGt
z^9<=LRN%w*BeM>o!;a@t?VqLE$mZLy=R2O$bTOoLQp~pt&v%K=x3bN5zWdyD#3kKx
zHm&U(ZI47+yG%<LM;gFn^=O#)NE~*5{7eTuq_Q*bAeryEGT(E}w^y&F!`=5GO1jUg
zrB`nL;VYlknFdHo%Q0`2(sImOQOgfXEt4It4BqKrc)C28Ay4<f7yobt`oNsdVr4Kx
zdN4I@u*`h0+IOgSejv+yaPDw$#eA@FekhN2xHoNhgmxs)d}Oy}@TK`^YT6LS{n440
z@ukCYDfn2s^l+Z<@R0f7nDhvR-yluvz$@BEgnr{x3nNlr9<kgX<7ge=p&J+W8#(Lu
zq_XA7hVQUhE98)AT<y!?^TQ`=zGJE8bm^UAe60g6G869iClnVZ@$XL^vB^vuU3_GA
zaq61PnC-<0r!P;f7N#$?juo^{Ni9#MUK|X&_^4WDJ~3@T$`a$NC0&pu#_UDt(=3wN
z)&(gmx^+K{21~lH9g9wA)O!~f8ao!Vm=-rKF3c<}tSl^UUtB~X2%cJD+QFgBR&)>G
zQ0}idPdiDu+g7!#7DU@tSmf7GnG~5!>ul)+3iQ-M7He$jKmo#<V)~k5+X{p1Du=}y
zzs1Jcwl$uwYl?s-<xi(=v8G4AWo7|&qkncYeT9yG)#U55OBQQ3i)&M8>!M#bjbyhj
z$Zk3<ZpF&(-1UEE-?1%9zjH%&y|rz%Jbkl>e!~ZC3)Qwd)b?zQe(mUr|K1&o7kU2A
zOJtv`(eJKUKtt(wn`K{irf<Lex*%+^NanvnWU=^hVe!?)r42f2$IhiGwB?P3S92E^
zo_|?b^P3*|5}fKwr@r*|Ji|M^OYe*_-kB}EyTtI`=F)rnjQ37U@2@g^aKH57X2u7f
zr4P3m4v-n|6)(MYI-qitKZw8dF)`y~>e9yyhEF+{J{4qqnhH3GxE*|_{nIg)CAXB<
zg8p=w)-huN*#^mEdN-B@*<W~j1UlTdJiK|dGUbQSvh?*O!_n2FPnB}F)#Q%QtbfO{
z3ir>4h~BpI*h0Us98I>n<$<u<H^(}IE~85-B*=2qMJ4=H*)dn>JC>!#o+$eD)~7>k
zk;3s4EGt~3=y9HAs-z!|Xz`OG{SwpGaM6;dW$IEM{n%oq)0LO;)%R*27!H~$sF!va
zzv{<vi1kcJ5_DeZi)NVmVp6#}CK1bub!*tiRVCEj9}U;yY~)Zli}#dhN@d_s-HpYs
z4@@4#4G|3qe;qCC{rEDLCugY1A79GT_(6@+Tw9b>{fmVbpU+?Y=1TTfdLot*R5!<>
z31XjOClg`sH;DrMd;x~5>N&BuByI%(UF2jt_o0b<I>{PXb}J7rnTLEFTX2t+gkF$q
zlBIaZ_u&?4)kS}nSN7%snDm_YVCO(b4=s@dvQVoaVr^9>*Dj_|tKeR>bpvd3foEDA
z<_WMak1gyTO_p;W0x7o{yc6bCpHX?PO77r8a+J)2ut<bcu`83@>Ac*Pu#u?ojGG(}
zD!L`l@p_J4q}Eomy$kj>u)1gJI$)b<;g6kv-ig%CHrcL^^#Wfcwud$@+jwPK*djdm
zG7DQxA*;yF^BNUaVH}SnIQjkRO=`blj0u76G#d&V9@mMdk{8$qC{%?-u-7eh(+92;
zT(+XJE6k2ocPz@c`>0)9{9xxw$pc~!a{2KJ@nIagG{uFqe2@KyJnwH9Z9nkvc>OfP
z_d*Rb-7Zwa**o(_;EV*jD6vBPyWS(!?VJ0eMQdbqHE$goRwdDQik_uMxHj!Pn41ue
zs#!K@dELj;)9~Jq>w+z$3;?e<@#9N!hXU+!VczL$d=ZP3yRk+*rGgw?7IcD}JVPV<
z;ko8PI&{Lj&TD)Qd{pM!b!jqO6b&C9_+D+?Yr}IN78*03^Lzsib|0mv8Wz5b%TY6u
zf_-1OKwXJK|1JC+Ny1x&D7Qzro@MVeYYWEL<=vl}ULCnHHP+LtKwp!f=s9DTSnWRP
zSRQ4?PkR%l(C0iRlV?hKGwSBzt(VU?!s!kK-p>Ta-xpg5X3%~LpjTB?tI-r3{O5ho
zYkP0pn|Stt9eFkSy-{JK<h0nZz>%;qfMrGB+9@s{y|ud;s@=3(HKy&eTQL>w^P*<y
zfzQjf9NAAVt4LT|wp&X4*+pnwg<eS|$`Jxs7H;h-PJsKF2Eq-2vEI$Jz#!s?d7q4y
znAJN<ZOO~$rQ0T--OSYHP{=KBi=oec>3^_4bpCeo?$O0)+i6Gn37$+e!hX?qtE&OS
z?vyHnN~L7zI=DmA^wabXc~I?&K>WQ9v*FxMTb=Ph0(2%zF;y`J@kmW7=`3jCBOr_$
zN3rmR;K=lMaic1N(Q59l!=OEkIF<UBc01mYH%L$x$57qcxfCFYR>y+rMxx=onvl6A
zz{Pz{#_$P@T&7T&`+B91QRLC;Ox*#IgZQg3JKj0+WK|XZx<^sgnrqZiZ<KfOqscA2
z`(Q`Vez-2wB1MszI8jjS-Q{P|<wd<ANt;Lo0)p5Loy)Yi>;3L<-MGM<TsErh6iwGS
z_w*hn&LQT(_G`Lssr`y<&)wDauglZrq+Mp#^3K#(A@(Wr-8h7;tC|+aCDJ(rFy09p
zzP#FJL@bgk4DsqF=pp9qd5yz&?}EJI8J3iZVKvdHP%V2`VT*;HfwSewBZ}8a?$m+p
zC1aDYDgtuFH}MK22L`mAW+!4^c}z=(>5biFzkrI;$(JV#*D37K2p==gBp!N|xZ8rs
zYK&*5xLw#9`Zb=H^hOfT5x-<_q@7)k&2}M{+^t6;jvm>&g`Da%#XV#_FXL<li<I@$
zl|!Qw^3GsfQMKjHzTVf9&#%n<CNg<Em-|MMtapf!@2v}br7^kU*DhmORE`)Z7!-@=
z?r4>UPhM1*bT(foGVVy3tc<%+Y$IP{JZakL`L(KS2fM^j-qbKGz4pNs11HcBlTnsr
zPua~I4h+fR(>=`YQp)dmHXW{YyFXE=fEFoBN$E^iDm>+h%iELZr70g)xKUl7;;aqd
zC42NKq2|8Kb6W%4$F^@L+%4t#?C6}to~G0lm-m*<T&5|nc~VzzW3WO<7BRn09V1!s
z&IQC18aMo8op9GO*r;atXkJ@^B4ncM#f@s8zUS(R>`!W4u_}O@bokj2ZmyR%Cp5$;
z9Y-xi48mTw_)NSF7H--b3H2Gn1zzH<+ahuY{K`_7DurG)47yYxxv=;HFb|w>q(%5i
z^q`(=C3T&xaZ^dyyo-01qMq#ijsjeo82@U6Gh3Tms6opr>0=&tLkt1MmAO?y8_GVx
zXuDQ@U7Nkd>4G87XUIE|>n+OSeW^Lw<WDLyjEj4D5H>;~8MGUneI<j2c9nz`=1W1E
zAFnDdR>Wt~J{xpx945hh!Fx1*DabcA#8B4#9*vOQnVS-bSHA9PghKY%-IM)lXKJ!+
z-anDKO5ptD?i(D(SCM2#<0g-6Z9Ei0F|MfLnm)Sc>5<Q&wLR)x@d)AXkt^T2>Gohe
zjFG^}hHGJ4_x7y`LqpLsgpYSz+NkT#NY#|zzF4dj@~Ph1T;2(*iwQ*F6W1$S2ahXj
zwY^z2)9m;DUY?8#8Flllf1_BP#9qY>XZ`c9W^WYMH@Li(|2((+KC{6#kG?!<uD%ts
zuJz>zo7HWaU>gV?#aB?234Z*7{k&4UFvKmO{q8bY_Mjc2y+Op2vV>3;@4*^%JNr!D
z{p(jnzTpT*XT6p+ic4O7wnNu~ZXY()c)GT}!he$_r@DkrVbvm(7IJSYt%PgTyDz@q
zJ#9B_LF{(r*lpPX2Wz9F)uA)D#zM3`^4@s$@+US<mOr3L5jGFg<d7t5ZhKkIvXEuX
zAjR*Od9GS`Zr$-L4cWxvMzM|G3y-nzr*qLCT6X<j`o3&llIQ-=gzLY5zVY)C;hlpX
z9{*R71vjyvgdh7U+8|NoEgSrIJ`TT;*^hhKviZfzYb3(|?J<_+H~4X^#D70au66ek
z;pb^#*>@%7GEdF;KhN*_e`rY*d+tK$o3z&Up@+Zi)g8jgC9K;Y+v#OrXApkbqPg^O
zxZFSPKL0V6^*N`Y?Opql<(~TqmbKJM`1LJ^;o-AmEbETT+mhQ~)of3(tO6qd%W4<;
zhGjV%sUBlll&Ys#7Q_Jo1!^a90W~XtY}%iYGJwh$PT~+iw-xXxB!HSTaI8Ck!6A^N
z!G}pakVjmCEi{lHip(nr<W)s_tpy4ediw(4)i`D<FlG>nfjj}P7Tm;0_d%oxWdB*D
z=vI)4J5s~T+ZZTI5I|3zz%=LwBUwNoMv$+iSpGN)%!r!!;B_8Yj3!0dPJ8J)pp2(c
zW}M;|p&)f*F?t=;<^JH-sh}%cAv;yUK80ScUMS=Q=Cyv5_W|DJ34D*jkibG8fXRyY
z;tqg@g`5j@gMzMmiA7H%H{j4{udrCJ-~@+oADgh8>6^(8p`qeOAr?>&AzX}92W3$h
zUd0hsP#AG34#2W*mU4=RG=zmEg>>)Zc{oJ09o%XJu&hEh0Lya0inM2mOmh(HcR+=R
zgS;uD9z2X3g+>#DqZY(HCmh5klR`<yQ8@b`5CVh~6S=N>Yl$-Y-8ADG=N&5hXj^1-
zc>@~pGU^)i&Yh$?Dd+CI4~=OJxPvj^`dL-%%XAp10?l_hv{oPnkLwmzatzHCri75#
zl+Bn8Q0x?EY?LtyUx$F=V{B4EEbVrjd1VZbgfo*wob3dPMu&iA93@{ECuHKy_c2c1
zn@n&!KKxlQaR*o}IU$2Hk}xwt!-U|h3BdyV?&XPi<;Ei~I9Gxh7nxGnUBhR=wZ;*i
zoRQWhs4C98_U?Btg?X6{+`T$OYB6w+M+F781cICpLaLaXR}zVJj=?K>Msa-0ME4>u
zSM0>FFw*N+lA^o=LyMAPB}gN;lkQ##h~Y|3-X=-7l6=1rkyMnNJdm8OmhuTJC5tLK
z$0ViXqklnIN?1`!DOc+HW=i?TdzBKYjmdtsS5nQwQk$^TG>yYs)zS=KrFMp;`HH9Y
z4y0YUmNtNWzo8**MD4!jtF%X9_X{4TPKL!yCEs64j-42|zh*+Zh@HN9#d}UIec9m{
z%L?I2-{s0k-Hv^EC8LZg;|*8FbMK5VMK^bfG79>SGQO&1+F@m)sfR&KGjRvqu);HM
z7iQvdXSF3}5Srd6lFXtSyh7%fH4>Hu<iLW@GU+}AF;Hi7;9O!+&lYva=G@7SuFw8#
zlEJT@lU$H3*c8ZTnj>}V!rAZ~=7!7C+_~XKmsQ{8Og1t*ivd`cr>_$Hocetpp{tte
zd2$rzF);F;Z1Zdx<XtTG<bI1|qJCd{Qq#gQUv4wU8Yh6KD-Xc39+RKP%g=B9D9Qu6
zaW%YvYZlF4q+mpi&LyQFpvk&#vcQJ>YG8OF$y4~KUg3yIfn{Q0>?h-p$-*aBg!Q<K
zlEY=bkmlbty)TwypTb={Ev#*{QM6{F6qlcyLw!`F{ji{5@cv6nVftJQ%yYQ);U$g5
zCC!5+tve;{IHjH3rQPbKy^f_1!%GK>ONRzaM|MibaLOKWmrV?oLhfNDvK3UA-hWvE
zZ29s38!YQXc=^gK*r}s%wm9SEKF-1|^dDFj`YxG5$2Tl%CBEVq%L1Ypno6qA6(ly5
zbi0+95tY<DRkWWg*)%Gdc&ey1s@R9BaGV&pq^fuyR|%U{(CYCC;8v19Lc6I@&F54t
zg{UShsh0j+8T=SpzEiGdmhLBSQ)?m)TS+<p8J5Xat2cC%<@vA%?wK;bBhQ|1$J<3?
zzH4QQS*Pw)XM)CW^BJc1J{RXBnGjL!RT>ig)LJS*+veCh3m!X?H#F8I_2`{-Z7cPc
z=j!a88uSDkoQCQ<R>*QOiB{gw7|g*klj}{*>KbDkf`%BAo9h$jXwp8{qI?>1aLF>~
z8ncIJl-C>ZiDXrqX`*OIVrc4~WYysjHB`^lrpz(s<2FR#(zZy!>NT3WX~;U}n$vM<
zi$BB4Qd=rMHzb5N*ZMU1X*AzXC2wnPo}_6a1h;f)v@GqC_W88-4>1l7!G_J+Mu(cl
zKR3=c!xrb-8UZZJx@o_;@r6%IA#U5}2-1a!RzmBeHtc{leBurq!Hy?9?Q^NE*ygbJ
zyNqeO9Uq1|h=$wA%t_yUZinf1U|j1!FKvT9>V)#Pg5^6OX&A8acG3rTF-xE4aqi?l
zB!Q)M5><5qKc?u1dBDSMxV)`rN@;{N+lW`|WqBJWHF^Z_y2E^W+A2HG?lFow%Rczr
zaUj+9DYc7Fx|^h{_LX%ntg6=}vd4;+R1vR_n7Bh5uY-ZMmn^%-*0)#Vu=xp54{25J
zMc%%f^CXv~AChIaIFxqo>^_t(RdH?UFsEgocg(#Q*zYymPr>`pQ<F)VlwWuFVFgXU
z9xs1P<bY2p+m}yl>GS<rwB1fI{g%uF32AI`El1sjulqAJ2ea{p)G!CFUW*o%vK8R5
zN2Co^4iBlD4P^-pwek*kYYz814?m0?9w;3i8Xg|m8y>?OdBi(1p*b??JTetIGE+J-
zH$1YiH?o8`y23lUra8LdJh~Y<x?TGJV_7aUiBU7jWizQGGxwj*WZ=(c@y+IF&E~nx
z7DUY!mCcrn%$7Z$Eytg$<eRJ3nyYo0tB;y%ESqZ{nQMJM*N#8m$v5AvHQ(zp|1fHP
zplp6<WParN{22biBff<Rt%XUKg{i28nX-ksk%fil3rqNmD}0M<T8kSli<?o4+hvQp
zBmaP9&HSH<W%1C#{&#9ur_@!G1sUL66<E{%MqT}It^nlfo)crM)0tD}D)K5DKwbG=
zlL-2Sx&oXl0J+NX6gqXTu6ptQpsp-WsH*}$X@I&)ye$nlSIr2eAI=pZTp@zszadxQ
z!Aeg;PMs@xkFbi#Fhc;j@{UkFb*>Vl&Yx0OfO9o==b~>+4M1H1&eavbxr%E9kgMi6
zi-~yaQ|Br>AsnEtuH7^I;an9a-vOvAj}z)@GQ}nMgu41m=W6l9xvJ0cIHj%t=V~I?
zZ!y>BZhp^FKH^vBs;MabSL$l21O;eUv1LAhbJg}Bd-Xv$KwZsLM*h&Qesiuy8xjEL
zDx)!axUuY6Q(A5F-4p66{*<~pajvoo+mlYItIf__K)WjGN_+BMyV~q6srno3s_}<*
zHB$R8wX2U)9nYr+0qqK)u0~F&tNGz43wuCRey}j~cyaKAx*GjKUCpjfEUmx%XYFcj
zXW_%n%E8|H)*rO1=RdWpgLj7?-ya<v0bd-@BhVLYTGfioP9&6s+q}Obt2+e7qMoK&
zncW*fDeO4kUzzjp4x?f?ty)#?Ks={jvH3t%-cX`|&0v~Zb^b`IxckohKy|@b1{{e)
zr(RR|C`UD(`{H0t(L{kxj{1G|+TzI)<7&r+!P=6ka?9>;I*q#0nQDiL;)_FdWpnjz
zYlHVS>K`mLd%f9N7^*K{YDYkD=`|ZFR=Pt;cr1n+D%T#yuxO-fHdbv6B?&t%4mVbB
zj%6xF&}%i-Y)=&Gl~{~4)$UGJ*bJp>HP=0#YjEFP9BHn9xzvHgWzcSEc(v9a&vR+C
zrSZ+?c+P*XUFC9r*RBqfPPHqSU$v`oa+sZXW)QjOR+c{{c)AM)XjiLb>;$j6V8VaW
zu51W6^0(GtMnAQyubJy{a_h_Mc)~S5v@6*aR$_^o3N~Uh=SO{nziU@0K)Yf;)voGB
z2zB0H350STYgb&MmVkCO+c_@2cA{Om{Gwe&a{tt>6xRXm$|h7G1U@$`aH3r`eABKZ
zPPHpUkh~{Uyr+~I#oR@XJ!y09Si5=#1GKAAJTV*_NNH7c&=|>2?aFGJ$(DeHDuP$x
z`mfqm47VreiFUR65YVowv4x^JyR>;z`$@u&wW~4q7qX>;;&IbNWpc0e0qrXFSi7p!
zr#;rLXpXfj7Bw3GQ|-$6Av>U5#V`Zfl_sw6GIET)*g2=4@fYpN`G<BTb*x><0@~G_
z^NDs<t;Sn7eX3ol0ooO5_&4oJhAER9jL&3A`Bn9Zd09-Al6sl!ue2+dztXPOGXd=?
z>JQpg>Mz>WG*}jSs$JnkBf@{tt^~T-ziU^Q0PRW`9nh|(0PV_^8PKjaLEp41&lBxx
z^rv>!_EWoJ1hgxSZ`zgW5ACWIbfZ`b(5}S3X;(9NfObWJx9{0Fw@`U_4Mh}vs$K1Y
zeri{+V67AFYK-g%z2~pAt3!dm)2_JwQoC|J)~>P{j<qYi-?XbVmSgSe{y%D02`AbW
zALSpkD^vIoIiOwfgGe{~Z%V!Wsa@&*8|}(nd`|3dwJVOl*RI@QI)BivR-k{ST?L<L
zS98B<S7Ly6<?v0rDgk=XT$gIh2s(l<eAlkdo@!U@ls~j9vp;HAn%}jnG4bGpKWbN;
z7_;*~w5#xcqg`2Bamw{y`Jr9q{YkrWA19nV8vUtVjT~!N<9M@xc9r~7yK?R#TK=Y8
zP5;!cnEp<?D((-!o;}sB{0}DZ?8q!YQ6Kb^MLWsgPhPxa1!z|yC)$<qZ`u`hZ-yr9
zn|3wFo-6WAyUN4<u3b^}kl5`*SciXVSG7O2tAy<TQo9<Z#Zk`W7`8bgIS=g??*Ozb
zrax;}Z-drR)_6wHZYn^#k~q<>)Hs7Xs(F?_vcFk2%shLa#Sq5<_k{zXT?PHFUGXP9
z<ix%Ft9B*WvOLvZ7qCLVj%DzxcGXY#Kh~}szH3+R|4F;b`c1ncj_AF3tX;|fy>><F
zHa$XktX=Jm|J1IszG+w2xIS5(XjgN`+Lb`GSk0++MRuxP75`DYQm~q!3i`8lMI1r?
zUAtlr)Abl9I1lS1A+-%5J=U(EC)yPUpj}CD{?M+30qsivSi7Rew%0q=uF^Wu&vVX_
z0ooN+L&@{k4T0Eyp<T)RLA$bp{m`yROabj`7|^a}|DauU1KL#$6QEuBoM=}pC)yRC
z0MDF&tS4N28F4ZE7wyWW;=6WLb*x?SXF~Y}WbYW9d7!8=(JlNc=!{r`v`Yb$J@Z7n
zivO-%RsTV|k`VZlb|r-F;^wLNn|AdE9nh}U{!zQi0<^1&Z`zgrKWbO*KeQ{W|EOJE
z$A|;8D~>;DS7ImHRV<`Z;6%F;L(c-Vs{{0(+SNW-x%vi`N{DB_in%<#+%MXd|1wtA
zzt*m@e$}qtqOWaXi6uaAlWl7#W7*}|t^P{8VvhmG0ov90ckOBd%vp`iwGZ|Ov@78s
z+SNXoEAvFV5{A6G3%<UNl{XF^ehpT@X8R%#gr6NqN6Pk_c9r!<?TURL^1F8R0eqJv
zs0)EE_g%X(I@PWo|Ds)G|E^sLpJ-R-|GjpV^H<u{YjAaUV!sJ->ti-A#e`GsN*IBD
zejoh5PrDNOsa*y9NxLdO(XNF5rFInyk&z@)cBC-6MI39NI~9<7!8G6QR=ygwICTn@
z?04<TfBaaxN`+y%3-ClUiWtH1=U_Np6&Rb4ztpbkv5o$uUBy-Wu3ZKE(5^%w;hDJX
z@T+na7+w32rg#Wzk!a>e$f<TEk$DXmv^&+VR8O@lCT!Ic?MgyG>b2!}?dlzRG3hVb
zRpn3ZYOdn1v@6};wJS5XG}Tk>$`V{p{JVA)_xIYBDxh6So@!UrI6974f~m*aRluos
zh4zbfMU1OZghP_^x7yX*AGIrf*v0sux*H^XFJk1hhXikUh47it^8cb;X`X0T=YP?z
zgmnmu|Hs;u$WQHR6<%Esle_4K*;j#KvoGf&(BcVbS2(y?%ipyt5Ux!Jy5~P=R}z2J
zuGj(XisoNvS7bl6tBUX1m8WI4@QHTCg(!D{;qIPAzu^Fm`%CRg<bSAL+5AiGO6a?G
z)r2AZN9~I5Si5?U&Mxpz+7<hE?J8iIZShy_N{}G+3V3Z9YJaL-@nSdO{nW0OEAWGI
za9jlbJMD_g4QEk@zW~s#X1{4yi!tDe-?XdBztXNAgI59Viu=2Ebpz8SCKq|4UGXFS
zwRW`#Xjc^{+7;s8X;-h%|A*R@(7)EMtpA_Yt|Y!`SH*v;U3mi96%5nrH|>hzr*>ub
zL%Sly^#2#yRn|VF;R8CLUB&&PT^0YTT@n0^b|v;V+SS>Ap<Ts7Flp)_f300n{7Jha
z$FX<&lXfMJZuVWf$~x7qD!*x0sUR1=U$rY6tjg>^XjfVPtX<h+A%E4bn0{(kM!#rR
zp5L`AtMA$s`#)<}k1)+nv@5Rv+qA0ybgMsVS7vU%Xjj6&Xjc@++LhU_+7;*z+7%b*
zvg(O;#r{X_%IJr7HFK<8aUqZwa<B8bNqJiSNxRyI9BWq-V9#H)EB^hrMi;J%O2b^+
zVamZtJxBf3X0YDdu%Qfcf9#|{3AOY8bM0#W@3gCtf2&=c{YUMp{@-a=@&8`CvJRH}
zsa<)VYFF{UXjg0>Q~#xQb@4>IQVDcD(XQ^uhy2j4B>rF2u2QZ3R=eW-u3ZtGYF8Y;
zYgf9;L44N7+LhSfYgehq+EvQ2c18P}c9jQcS2KWi)iLvr+LbP#T`2(C7015(-)dJz
zcgbf@wJQ$1+x~yAT|v{teri|Rf1zEuPcsABl|c`Q!LfEF$c^a{N%f0%mHdy|)y%)q
zuI&C>?JC_WTH-IXD?#mV+SOH7G5KTdipnOQ;WzEdej3oO^ov|lqwG$!t5-Is+7<jn
zyR!e!+LisWc6A+Yk@NZgl6Hl%`c=EKf+C}6EAf@h1E`lPkaT^=+7<JOc6G=YrsHho
z?GI>Ib$`&V<WID#QM^(kWnXW|AG9kf$bZtV9un3uMl$@+u5ej<tm)aI%AA@ywY0f#
z;`5<^b`=X~SFEIR0-Yr3AOg80#uM%8fm<%eUujnbE@^+IT~QsxB{P_g;PD=v)wr9f
z2xwQzxX{<=$J!OUxDlmwtWuz}yotoIb`^4}UA<CF);!j()^PHs|EyiT!u|{G3jG)D
zN)bmL(5^_oX;%$^c2xvuSKS22U$iTY04X2<<#RsOuAcoX?Mji<E#_FeilALqJk_oQ
z0qu(Y589RLf2CawP@HI25Aa<O76h6xfOch%dp=W*M#(Zz_*lCV1+=S=fuvj3|3SO*
z{i$6I{|D{r0-#-)CH>T{rcbpiZ~2a*W9@1W!wJx?lvLx`(eXlA^8oECN{Ka>>4$c8
zfB>{Bo4?eqGO>PWSKIg`_hN9t6;TZDEWtQl@HhuRyL$eMb~O%YSNq`KwX5hqXjet2
z+7-IusdfdhP(QS*6);HYyLN^5UAwx#h%f@QD+~CEcBS;2cIDqqV<C8|U5y8^4@O2?
zwoucR29Jv~uV7qKbr>yqieBvPk|nXWil3trA_`hTsh;bnuq#9gu?9i;TLL;@P44MZ
zxsD#BHnUq^sM~t6PFgKYqgxfC52Wxzp}xxvw48`Mnvrn@o?FD31|k-eUtVx8CU<TC
zI25BLFp6kHd-TNu4&sGHX_ZJQq~Ft_%O749KZ^#!bpwGG5ut>%a5RPk5dOGTFa*ko
zMx=lavKR@#9yUb-i^D<a_*oZoAQYfNp&(gCG)p;4EZ~r6*AH<pq~|eU;R<6Ia73aL
z2t?!n?|4)RAppU_wC93Q0uQc5`}krJgvOxjAPBG{;b0J~1A-`xyjy>`ktu)xk%K@4
zNmJC|>9cJl)K?WX0(#!%54Apzme&GV&cUt+fCkfS!i-vpDGnrq#9N<<DfUx<C~paZ
zIxKZSmRKc*n4Gu95m;|Cu|&_EBT=De!g2s9ban_&(^*Dc(_{n_g-b|^SAg`-b+2}$
zA9-;H%HN#&oCpPt_pG0*h;qQAq8)6I4qDwq-M<ZgTXipHQ=b15_f=pVmq7|s^6K@e
zZj1NTvLH;v{APG|4w&-b^8#Am&CpB;!G8S*x4EOCmCuq2*p!_?+~WvnCjvvYK|4a)
zV?S_+q#{ZY>)5>N6oU%NU~@?xT@OHeB7+YT$jfP!RKyY!hIlZ7A>-}Xu~k=)f(vsk
z);ZGXnqufD;1xxGEwrdkbWJ>3Pu`<L>^Txv?k>YvjR}II<2`|c#NqpM@|+W*XbtUG
zx|(@yFbp%>oA;$S%rmlC#GsE_u+;$YDi{E-z(FVAmG}vG1%e;p1av%>YJD5m>B5L$
zhldQOf<z7hiK3BUz7vx&1Y=wtC#>;FYUA0^n5a34OG7Qidco%)2trCxnn>8!Su_n+
z8TxfeXc*{)Q;TCW(CZgMgy@!iLr;q6=4oN$L?`h+$jC$><FdP&D!TMZ8N?=nu){#m
zBp99m2>J>WcU(zCPaJ9`4)unB+{Cb{WT^r3$`ZH)9rQdPW*7o}4igj_h*KmZ6{G~>
z3?`VVO=bZ*J4+AEp<V9jeJtGJ5+nY2PKLx=1$!F}0}&IqtK`@%?EFLpTORGwp3030
zk%~2h>0zG1Jh3-CkcyKsvjgi)d~aKIdmuUsnnTMGRKDXY4kip89h8Y?8w$oORD75!
zZ~L|b{s!aNyxRY1Ug_&#Dyi1dADdUfijnX%^oNsc5)sGd70LyK9+3-}R~R<|^Gc`H
z4KS}%0rLtJL^3G3k1BkF;RKjhUKmOaptK2e=KZ>7$QUdEx$?I$slx+`N^mSEDPJWl
z8dCLa5p|EypdlY5gb~p|!frg&7q*^*oR5<jkIxhcRzvigB=mR8XJ(f)*`kXBVvRnH
zEQk?7GTxpK0Xc}MrOyrMPY+`iO6Yij(n&!5`oT1*4bWKer;)HcClxmxNsu^#EmA1m
zT@t#YdShJ%1ZWR<s&x)qXF;3@YzQjTO!5efnoN+iRzyczZp_++O|Cbh)dbV9AkH3i
zV(<4bC1}jnXkCwxMB4|yjn{yBwe|(&bRL^mp)R2B=9K`tz0Po``IrPXS`&}jfMNr6
z4+bA#Ucqz#!|LX#c~u!~2b?@$UU43qSI~<xpu0mx)5qo&VOb0&U|uoG69yccS0qu#
z<`v$?c|6CT<`tjYy<rn<uIUS3O7Z%FE<nH`We~*WQ}b#Z9iAi015pIbD-JSUthfuz
z$pK81Py@icq6FVgf_yZ`c3ws@MB$p|>iT+P9HAehSH<*zdF9o3^9`n?v5rU-BhNw{
zA7EZt_TPn}%sD6O#3!Tx^NL$vTvA`D?C}RAg<C_QfF+i443<F*`Z<R%eo9t(jK|7=
zd9|xA^hsYwG*cRbL>VxzX7%eBpIkr@E1j5EUy(6H4hUn^Fut{<S?vU6mImIZc9<W;
z_#!AmlNgQwNhS=j7b1%E9$LbW%_|BWOn4|bLn-8JC>ZzDymA{i#E4Td&^*vJ(8iy7
z>wRoq<>7W5n^&Mte$8*@RT^Mk9UPliuTRV?izqO}@|$@T3z%0@lB2$Ao`88p*>x1|
zbc|l1H5g(KG^Ed|dGyBW0_N5Jg*%icfO+L^fNS_=nl=m_ElI{cateB7;sAS^0x++Z
zr=VG)2(oE{m42iaF=^pQ;zZC513fLkyb3)ruSyyw0P_k!Zm2@&0P`wI_g-yG%-u+r
zq+|0+;@G?j3DKOXHa1bJ4W0wcD|moQQj_3B&|AQ~qC^93+0Z0|MAQs4OwwB!OPOq*
z$QXoS4B~tPhI*ZtSE}F4t0us_N;)>LdQq@r^Q!uXc?DwD8BfE<oUA=DuafGB5C|g{
zz`Uy9JTb3ey@t>V_z{5@1Y=9i$pJ905OI;m=9TZMd9`nx37A(&^H>#i<D#I92v{^N
z9NS8rLZCccSlR>HROGTaa0B#MF@zop5}Tjpq?+QZJT|Z50P{+5u1050;i6y^&ve=F
z$Pzk;6yBT;5f|H=!$zBj5>2*0m%wn4@}LX=VKzXfF~N&QXybjBs)zyeM(pXvZ4VHb
zQ+ON&tK(VDj|8Fc5oCQBcpb)1f?`&XGcNrm=kP#~<>mK$ofGKdVAync_hOhvg+B`-
zhQ!$1K?<Y8xIfZj)2SKVxY48xhTS$|;?#^KuFDTYfI(=YL@W84s4Y@s3@Cz=9dR@o
z1jFbz{ouEx61x<rlS0D=HJ~ipsKmHzS)@CT#X!xsx5LE0vUY9XCNLEBNN6}B>1@JQ
z+=KD5<;P1>e#??E8af9{bfMbRFc7}wAa+Htz5oK^KZAbHgwO<pR@i;5UjX~5v{Qo-
z+;|o_i4LahAahs01V@Jj!>}xEJUCY@2tcGDEMW(AX0H`+2MABV;<}zy|2*cNvh*lk
zu)T^fT8!RB7OA{7b+ni&%<1534T97lbYGNw09|vrB0NnIi=$3)uhz`%ZVcs~mJhl(
zgfc)T($Y%?q38kHtJSKa8NBj-9ouAf+j)&(+q5~fHv(Z32t5X`_`jeXnK?k@Vv0yJ
zx5NPOsy{&2D^P<hSiqP%>Y2lx_aXBAXa*I>;1z%7*|>&y=^30Rg+M(~UR4!6d`l~g
zX*8$l!J->df_)&G_i&wH7<%+fhm7#3!8E!XT2Q=Yfq5mTS973?)TQAW=!mVyv@P+d
zQ8oZxQP~v?1K<^cGT)$qW(oK`hkm&+hDU>*Jupl3JQ}5xsA3<Mait&bw59lJ8X4l2
z{w8Nsj0@w^?7JAhT0Pq>Wss@_G;0n3ulSekH+rYA2!iv4L2vV7Ry1som`n$!;FaZ;
zp)R_C7g%{el3_L|ybgH}9CB%VO9uy)q>CO)9xz*nJOack9phv0ivJY6N<zEowa)lu
z4{E*|7JmX>#Q@+Hg4TZz47F`X!7#om2PDAw9Y6>TL^Izpcm+3>7ze<sq}HrxSeXUL
z;*3?aQq>BL)BSgy)xn~B3#%6s8meqwV(lAa&ooL>nra<`SAzcN0C)w`Gdx%7Duo4e
zb1>gD84@RFSH<;S?(`AclX>jYfY$NMeyF9js1}nH+PIw#gQr?QONRwT;~MG&R+mA8
z0q_cnVW9I3yqZcs2CtUbq4Vs}DDph9>0|I}nc&6BH}DFo1b|mwXb1D(z^hd9#|{Y1
zBQ2;T|G4vZ{t0+h5$ph!d``d7VesTy(q%$tN#+>KVIB~qBDk_dO1`8aFgkc;w|yn`
zYB~Altsc~t#~>EHD4M8~xk39xsiY1g2%}-s(rdE-&?Px!F+yxpkv;h(LfGWS8}}=&
z={&rFiE%U=EOHj%qKwtb{>X=Z$uYmvMHPK-!`{|GN(XAJ)L(hc3+ee{3dFcidGpNI
z16~@rL=^jLs&NuuN~|$Utc$P!HLERV`|GS@F6>hdZg5PZ(Cb_ruCe0eo~rk3nV@R$
zvOHKY$2iu_Pz*mWFsI`^dx<Q;kVlqK1c3Twv4Q{%XPaOr(`Pw-%_5Pn`Dip!lG#Q8
zlYAbegW$kzJR4()5sIjzY0^ArGr$MB!43kuA+Y-|Zar~MPrZs(xUUNJL~{Uvmn9yy
z31TgSAkzbtW{8KPR$dzx9u1Y42Oua6WETR1oO8pFJ7{_U^6f<d4~qKTMoTY<@4`C7
zQZbrWYO+KHdVnCuaKg3nux`GLmx)$*^v3vkLs%Ke|HT!1+-Xiu0K5XpF`TW-d1r^^
zf+2{h*a3i7P$_``a>U*8`vDXHc=ZVl0I!%YUB3-I2CvAsum%czH)kB=0PqUtdgBzl
zVw&?e!Z`-7UO|q*E21|WVp|ReXHjLFjY!b5Zp4v36a;`*X`%@B6Ywgr*TVk`f`J^w
z^S~6_p}F+Va=NfJ-IJl&jLEYd%eM@V!K-|dOCsGCxpMG51H>|+v$=q+FQ4$PYx5!i
zUM)Yw1;8uuCf)}zc^qwN+9+XrN9bJeZ3q-XNeqPsM~9-JfeGHiLkMC(5KPic#hOe+
z7bKMS`d%mj7=b-UdrJ)phX<-|aZ^Iwhy#V7;L>a6jGzn1Afgesp1X`7qB}pet3)9K
zZiS%sLfr!0GRJq^PfJbfuRq@r<<4-tR6m*;e%0B~*YOJ~HmHufiGO<06JttcNuSl@
z!|S`nF9*bKf2liQnLqjfXjkDBZ~SK89&1+|dMfq!Qzfw~^|ryh_yam_ZMu(?&Vu20
z926d|2yH#0I5V;p*eL6WPjO*7_HHZp7fOm3(G3aM8|HXdYK%IgF!ex;ozVF?IFq_)
zbdHdghd*O&{^2J@JWP;fq4QViPjAm<2)Vvolxg9AId?Vn)#d(}>X5b38yPkl1fObF
z?(p#i31#@WcwNVk4e!qh<tSzpXF`!NZzbKLa%^A<iT8$R=oVm1GKI0Z7Djr3B8{Jf
z+>wAiB48gBx4E@v;>8lJ8`h;B?H9l@W_`$1c*jhJ{porAaLPv3cr6taQ`7}@i4D5~
z)(s4Fgia${BE88GNf`e*7aLo>6a?5J@yhipIq}aoGBZ$@5+?296&?fHmG{m^`UJ;M
z9}B!6OQUgSq3GEPv%-i6pQZcMS}D*37;Hr{MZNFOIO}dYo1dS0>r;`OANQ$t#a&$V
z6iQZTGb6Md<tsknh`L4<7vZy}I_tny;VOzeQ-hPbNy0px&0S^ge~-7C^~@Y^O~MRw
z7fH9LZAj2pL^ZY)bd)8d_KlTID6ww?#{eT)9dgPz>!8@6U}Z3Mjh5Mqn6HhlE{VUL
zK5&}9;~WNa7yBDKQFPG&nSeVMZz{WTIwQAj@EYGcPe#%iac*M^U5Hw{$88m46(RTH
z;1Q<O!lxq=EgB?fJLHUuc{OU#bbEp@PJbJ6?u^7$G7TC<Jk@pb&QIOZ%;%>A2*o|8
z1*7#3yomc~r<_T`1<XjP1gCtoq*OYr&Wq(w+eWD6&)Bk9IZqkX#&)y62wE8<g!-eM
zpCj(}zAMXKsDM9Ew+_2Y7p-KYAUxtR--q|!pg9V=PBl9bY9#Vism^4B8Dmr3>+8qO
z>#m}z1jW;WmXv1Dctzo_=2j2I>X!A!cFJ&rdq~<Di6R8p4=smq>o#SiP0lZ*ioI50
zN|AmuB)s&phPg-M&=NJW8QIvg=8z$vi#As;y%s9)@WGaPp6Yg1XyzU0p817Ac8r&(
zF^cTHqmg>(lY_N0pTi4Z2gOkq;COz7VAm-IW5<wUF4ku9nlUE7XZE^#Wdu$=*35`0
zT-fO_f^Z?0z7+J#Ce*|)M&V$(2hSftVX)3f>MoT+$4Ew|b|BB~(vilkA3#V#YDbeE
z!*Fr@np`Q|HQ2>11ga3*9sQAoT+tyQ7mxBThO+I=u0nD%>kD0cDtQ*d;)|Fg?@I;1
z&XJcj4c=Bvi)N_V-g;3PLfWuZ=K3xNgKqaBuF`nZwKQ9r-8UiJ50(jAdYIu~r&Z*<
z8Za2Z*Axz5XyP$UfoLP}hyz5*SM!2g@T@kaa7PHMQil}p8J%dhv~#UW0>SWU1?s=l
zuBsB-M1nbdxrVKXtCRYq^92LK0PU(ec~m5yqi>&7^!oE~12l4!B@>Qb8y2lZe}G?Z
zRamF!HO%Gtb?J^|Fyl-X20y%uz-J5l{CqzlbAKlzrhW!h%Q9S1V3RP@5KaQEVsM)4
zB5}3?dI@7vi6a;FnE#D-RaKKm<Ki$yE=hK_Zqt>(k5CqB3{TR&N-sMRqMazxqy5e%
z^a2{O>?c9U%0fcKn~Glc^znx8+EsP2L0R207uPhmQO09%MO<yEos5&A7UJk>Z53Gw
z5uKA+!K?vMq38q8))K?r@TpeUcV%ApODsNe8<&n|#YT0RQq~a#zZkJ0(Z`LHjl*o_
zu^Zvj@-fwaU^r7)v37ZC8CR@o>dD8J=NI$!d-3W7AX1TawO!#BjEvQFhmGXt3rRaE
zIO6+euMb981`WG<@6s2Mm*88CKP1%ufV7mc!hI6jD|+igGX*2kvos>yBVY>8Zx~M0
zBp|QTZVk18CJIhva#4J)#Lu}`->Q|}rw8v&n6VQI+{=7c;3|cj2H#A1-&<brc4+A#
z`c!Lp=lqig*Dx;DFmj(CM;$;pBQeP_19jg%45BO4AxZ$(YWhYnO*<_U9mO~Fqz0Bl
z*HcM9-P2)U$e(0S7h296ep=z}URi6+8%V{I*T=4cXDLk-?&5%FIP@+jNUca&+uCTL
zGD)7mfN8vbU!GR3P3T_re6F_#44YgUCqg6i&I=RVUT%w5dOIbpf+0i0Z?vlKeIQ<E
z;y=&|w=}~c4M-H^X$-%wFC?W267|fy$&=k-kVaCrrOXjL)bK^<!qfNYq8j6L!CdZG
zJfU{8{^O5dXRG8h0Y$gMvphx()c0S#LaNneS!RmK<B+PW<C2heS7WXlyThVd#chc5
zzKT{L{qA~`YD_3_RaCUz-L@fPi%QUbZ%r!$u_Ni78TTL3`OLifz<2j(cJb@`yYD`m
zc`*7!d=O0nCMYkRN%yhXrdMz5l;P)cHd}n(R<Gwb6zf%g(7QssUpY0ROq(+oA<bUj
z@rsXMF;sbl;PwI6yOFDc@e<aO>6IebeOhAf&sXUN8lspMxsBnP>+Euky=$p%dbgUK
z9>wz)ZA@Q(&^pf~cuu0Q5B28$n-&AfXC7mOHqQvaGFu*0l4(&dxO{sqY-`_cip|H+
z3#n^%iOzpoJ%exQLE`sVXDLCe{mlDHWa_fF;s&0nlV`~o)AP$q6RiE8-#1S9J)&i>
z$g21HP(3AczH!=a3BrFsH0HZ+%+<0|9z`I|dZJyevy>O)YqY(-cSLA3$&>MMh@YBZ
zYgu|rajCFYBmHgm*z2ssxB01qIj#k_TNimOKDKs$9qik`afhCa%XJWfE!?2-94RN=
zb1wa$i{YAYwyUYcsMWy3+p=$S2)%E8fSO&nhNV}JMu7b+)9eKl#W7tQrFB{R)3f%8
zXDk_C-@JJW`_f6&RaY4$;Y{4E9KraxW-{`Qya4&9>8^yz3=nnLw!8%z!Lmaon0K9i
zo>un@THGUtF+99Zx{Cq%{YXZpOw3j2b7c!G*JUjO#XNxlG3iWhrDd$zPVsd-*&zAF
z07g9e;8!w>c&<1!of>%77!!g6($i=s;1xvNT%PiYCOWF?cF++3C!!G_S`x@Ik&X_D
zH!K)JwMhYPQ9O*}i5a@f3Ym(gT+ozN3u8QJ(l{wAwlu?fUh`6nl}}Mto@SO&Ll&ks
z7~7AD-a-%8oZ8wr%R1BY(vuKuTBsptm9~N$?bDofO(*Vt%v6k?z7jJ35dM@Yl+|<)
z?FDw9s)2rC7kLoaVym0oyz_-xAl-PpzNID&XBcaOr8U#C^da5yJ5|c`EJ^}G>SrtY
zTVMueOuFkRsN0IsG#ZnIvVgYonP>f2+<nsGs}>%EB>J>$&s0TB2ZeS9g47haa_Mkg
zo*si&mXFs}mBn0H7S@v)L?S`d-4vXiyso`$?0tB9M^=WE%*@xd%Jor<<T+<vVDoFE
zI0BhH??;<CD{>twP*xc7aCh;fFmr$ER%o*(sg<V@XE5AC9ymj!(g5(PJ1{|kLl*$A
zx+iqjO&FsdZ(#|7b5*T#p$?aICA4}g6=}>n17g<2lP(*WD^>vD)qbwr!MYf_2Ip|M
z&Wk%2h}lHnS~GHYQB9*+h^*;HLKM%8e2uZL2Qs?pUUI}^E_DnkMtRN(NX#KZKp<Bo
zIFQ*HJnn|#jLTMes-y4RCDyX>0<~cb#%A;bz$>I_)y8WV44qHwmh5c0^tKn6pXt`&
z5R*pI5_FOmDoBdOVygy9sbUBf+Sq(T(tbUH%j;%=!UKutR}A&n7=$+TX>%^kTl+xQ
zEE<LkN-xWa4a#|16F3|4)^teYkKPQko&5rm+`$lyw9y9@Fl(}JCuv*iDhre1zKDsW
z%Z1aVMam6#zSP`g*?@CN2e32{?DZ3@kmlTI3uh3q4`(9{u0`pugN8vGp04&cb$i|A
zbESq0Y-jEL93T1ZY}#`7iPs<)pxuJ%Z1%MXy0-v$1+F;gTpsS0DN?|#=ynssla&s@
zUhg2ujkuP-CaOtXI}8U|^qvjQky{51^dqqm#KZ^|1{2QUe2ue?S|N3vA;DXQ%N)_K
z?V}%al(hihmEvrfApxI>uyX+P@{xv}I_eIXYhjB}9FY%t9pJReW<vj1o_!r&7htBu
zdO2$K#YaV#;L9|TmsMOZ%k{GwKV8?lcbTRkUw=N+az9}H28K}2un9Sy)@-gmC~6!p
zj&=T$*C@M-1@&e1d<zEvyn<ZyCzhoRwWp7pW4m(ApZ)U|p);5z?Q&$@VIWdrg#DnC
zrB<7>;vR@7#@Vx2&UYt%FN&FTKr9!oAEaQk^XTh*PToN$E`FgfyOw?~NXpl`+!cv5
z-7!%uMyjpZTPV(kb%>jH+Fw!T)wjD{1yiartTD~kPs*1g<qkRHR4wZihTmx{7A>cf
zYl+@heM_O6vZSF3(x|-_?|Q`Oq^pdwa0m`8!alGg+0N&{8x7v+4aLz<ir(}{*>um}
zd|FWuxYOlxebdM}ded!`!WWHJHGtU5!l;Kbs!krs#Vf|Pxm|(UF;A51&(D0OmV{Hp
zeZWu+fLHtM3|&sS#W};|L`rAu4GQfB$XSF$lH?B13abY5B#B5disjxq>w}&bYb%#n
zQ%G!g5lZWpuI}Au3<#2bYyvCX9oJi`=!Q{_xH!7#Q<lg%lniqx$%!OYUssN$zoM@>
zhwHp_hx$sLL&=~*B4ZI>LtGMH2Q|(|NcZp>;vhi6YT{8i9CyzYSRrLS%>UZIGT>Me
zSlk=HSe*TM#9o)ZPUT41CA+vd7^kF(yY$6aX?Ss2`U!Z|fkqpXZ|JO$+k%iw>L}^k
zA=lseI*)=L5Q3<l53H&srIg&d>%e<xKa08&?>IE9jvAKLW!2Kv*MZ0x_Tu_JHAyN(
zvTq%zy1Za_)OUz{WLJJB^1Qx2|1!H;EGscHs*~OAWu9v|-LO0=92Dcgr?`rYtwP!q
z8G*x|KPt9qBp)_Ob6IQ}wI4vTRv0yjMSc<)2A@+dxnI8T3Ypz`eit?MC6hv`6b3qa
zQK_z+R7Lot#rbvL?tBwp5;f-IuchWYrE(&C!7?sSaQG%YF(kdZjhzEIoFP_89XoC>
z2&YR~X)h4-9mT%9<(3+G6*oq6xvm3I2wv?2>odL-QFy@0=K6XtOQv#@7N$L9(aWCO
zf%_z8;9d#z5U$^NmEuT`0G)It2_BRpNNsb0^3Jt5#xrq+cU}%7sc#R8u3z9BMtl`7
z4B#$@ss>^M;ME}ln>AMM;3e71**pFQ3;M6{^ecAJ`ws3c>BG*5Q)w|%MRCx$3hM|h
ze@Z8@d0n(JhqpY6yN5%Jwf~X%Dgo(B<GXINGHy8MPzQ14a!KX>9TlJ6Lq0cM#cvNG
zc(cDp;4Y{b$9f@-4O^e;;q~;rs8m;!X&UMljtUNGifpD)E17|*e(zZuWw}G^^e3wZ
z9uXSPBF{%1p)5Rm18tQH4)-+;l%+HHM=Oz0%-6UI#?NSAkk%te?XS&7RXySq92noC
z9m}H}+PGf}r=OT4+^-z>ymp7xo$w{0a$+y}CQ0sV5~e;KTD@wn$%lUHSm;-y9<`2;
z*MK<2&N1FV2^ed$rFblD2)D-ditpmxy8osCbmNIWhU8k!`@??yjw|CU5Z<wKqZP4|
zX38=mwHJ(P4K9iH$e%G7W^uHxHM%Woj7&Au!+0HBYmy;qiko=pfvuSeIjC}oz3C#n
zO2ed}_TrML#kujwr-gJ%Igc%kaUEFBF6KXVb2Zu&wdSa^{#;pafhJ1&TufxzPS)<S
zwjG>b%+CI(&Tb-%TSM1Ge2WDGGk&qm>T2DU3^B*^p#XSAG9J&NuhAU0i=OD|I92De
zBxYLpT1?s#rv~wr_r;Q!U@51FD@FY^hO;s(HU{Rx*Z&XKu0k4<?nopjHYR6Cq!cu!
zluM-6H>S2rq&;j*)A)Ec640I$#D*Kwu^42=k@~)13h{tU+)s2hf%<P719ufY7DSBt
zk$YK8Dm!n}=WYmP29R8q=edle5$`0OM`No2v-JdIG6c%$D3FVH(#?Yd$B?Wd6qj_6
z>B<<gBHh)@BTuv>O&=;|N(IndM&=!%2^>IV)*IzmyYm^kMD`>pU_OXTaVpjn43biG
zl}Ht4wM*LX#J7;r{Tcc?Y@F{Qj|;(42u1DK4e{Y_oYf|yvt60>M_qK{oeWC744MHX
zZfI=K&-rs7Gj9hX%4_L*Zar1){lL}Lew52_=(DTSO&eKE$6CnXOf1_2p4<Y9dOU5n
ziMS{pc<+<ET#1xubu&q3r%2G@*@Nz8!X}c)K)K6`<e5OX$){F`SB~uTQJQiG<i*i+
z*O4=lWg1OLpo?l5d8P$%G#wy)z(ziTWMS+i6Ib9J&oyqV;~43LwM6fEOKUF$X5I#~
z<+jL0N)Lwk>U+otzydQ%d<}yX#n-#_3uWf6DoX}+%PL{Wuy%{gBWFJ-OBBj1HTzlb
z$;dH67au|lmSvU_yXQajE`L^>=V&t!ku~UPolQh$jGbHjeAK=1Qcas))qS?b3K;Ne
zm?dFUr12mW1qGjB43J)ih%#ae6%v8%akrX#w|BcpL=@k+fElf2L?@7iOMx_+@<Im?
z_Mq0xL|-9sc@|%Vej`~!bV+ViWl35&qr(6ayxZb<k^;~sU7y~8kT3fzefh%8KCHJ}
z&iB60@g)yBve*wKiD`OQecPZ%&cIl1a7kXW;hY@wlgvEi10+Z;0D?^};svu(K&_2#
zb!~2A%iiv)gVIi^khSTYkEwmMQ9g6mg%p?BN60NbR|h=9Rkd;Ff3bJhUs3*Hzvy9z
z0S1PFp>u|i7(`MUXFxzg7(yCpL`0>#hLCQgyGvTSyQD)(=~h5d5s5S3ug~-BXP<q}
z59hbN&f5RNz3%l{_x=7{@9VWpZDKU|`}yucfn1i9=g;%sP+N4Kd^nA$7u9pEBGt6}
zu9sAHI%V3?Gg3*>w;%>gf2PZi^pNbX*XlQ`lKsv}P(eJSvM&;c8u$I1GMkm%PRQW}
z@3=M7H@DS4zgAuoj|Yj;F9mjIs^z(Gt1kK|cuGk88B(qbP8EgrGlf#-Rasn!ep&qS
zw6k3&WK`Sg*;b<GjSD<)m!ESGq0tzUUZ5J!>dQgQ#z^_Haq#|!(r9O5?K_V%#0~VC
z{FuGnzO1yk|GHuJxyU~=^xfLL!zaW4wC#q1?iER%{W~y%Z&5U}yZ2qApWWNfIo_|7
z@1$weDeoqG)croD@q5)`4YRnyLn8rXe0#~yA-tq?7+yX!KkkE;ooviQj<ej}g!mn(
z1>tB(w}uCOnDnih?6g2HF)_gA;o$1Zbhx<mv5GL=gZSw_T+}%i%TodRotjbpF}2*+
z=--9H{^AHCVWPCFu`#GBRT%42MLwlmzy0_cY7yY54V6wW>H~`CR|^5%w^xO=)O__V
z10TvR4~Ap)InutQ3tT}Ib7GFs+u>e~wer(1ua;~Q0~?7gA$Iub4P?rL;RCad9C<cS
zPaRw(I*kEu>IHr4thWn>FFUC9a?m{E;m=ox0m$#|t?VoqI`%@LZrSOw8qL(>@{jT#
zj|7;18g3jze||kEXZ0`q5n=eEWd@<ZC3#+ASZx^otfQ)#JK3cAlW3S;H8;gR_~+M-
zy?fO*=Wd3#n9d)ELl`=!5R&bBWbvuXyXer4r`PdXs=V~y4=W?;sY=H%0*;%XJl5{s
zXBGLV`i5CZod~e{j?HZ|`(+lozQV7pu!N8aa06zwN=GSDN)gU*afds}FdP)VeVTqy
zoCTiL`-$$cH^6MR3@8THT?bSC{Mvm6Gss-;Wvx9qea665H~glS??SmL9$zA|<VdkM
zz9pw&@ztL%Rhuz;j4JJgi^iCB^_mxQqX(Ct`e}h_4q}~oW8qG{EnDPXbnF>bQeV?{
z$#tf5GhV*`JyMJ?tD}$?gq4VI#|&rY?tL2<bN?9L^%_+`?Zx2OYY-u^vUks**W9G<
zu8gzA>22eLTc)Ew+7S@_V19Hc0-BI|XJzR+JSxGdGdj)4tM!tDW&G<k2N8Ft@=xQF
z-KBo=2UNA^2UkBn=iJ_0-#+jsWu(!YkRyMJ-XwR2;olLFCl^zLGyXUnU4mH1a`_Yp
z2&;e?Smxe36~0h2O8-=M+Smiu1qVxS#BHG2AqxZVUKo0A+_l(`)$PX(rL)RLvK6HH
zQibUiyqLWEbAueJRmJqyF$h`rM8HxZ3Y7JGgDWsqu7Vlj1Fer5+}#e=U1bA5ouf-}
z<A&`0wtOSnPwJn#9qS_wCk$WTpd!g5N-pYSE$+qz$2i8q@Xcw%iF&CdH)2HB*CE%B
z0JmTgID~)Qj5-fZFpZ>)KsO&sUZg&LcWK`6CCV~Ua#~6F5ErSPP5HJ=hx47<APdnh
z!tGwcQ#$f#nV+_t@ZY_p<5$x%{8tH}&yN<75BKpYoyJnSsciJT>f~0*3QfD`R7CvC
z-d4GC+VOt_hHkzkm=;IDn#|Vly$|@U8+Vjk9P=O0vA=OjV&~H}iWN(fP)nKTjQU0S
z)CMhf-%L`~v!AcvLB7(5O8Z&jTgtHC7G}iPb7sWJ`b#o$jv);FNQ(2Y9^&KfH*{3y
zgfI2`h`V!#=_*k$NA4a<j@povQVURq#~g2n5ZHX!QtJCDk;bk$@M@Z>6h(cA4!>Pa
z)U8u;tV=A?lf@;)bt6b2YDt9-zfG-|ux0Sg2t<ks_Xd9$FTd$7*9F#*dqssi?3FL*
z5`2>);&c>v^#f?UCrQ@!sX*Y*;iwOlGpmF8D+awFUHzf-R6aFDkt69;)Re@c*L@q<
zos8-8^A?4P(*lIKGNE8EB|7G9ZBBYT!o**%o5v#t#AU5Tp;ANmBohbNUW0;1K!T)g
z&+(@p5r89Lf#^y$LZy9chu@kppQ`dWgQk?gIvX*M$1%m1X4uOCOsv;<fzfpwP_|Ij
zBpf@N`XRSacCa>jX*`H|%K^xpHbd_Ike!q@o?nVPJl3&hv2!K2@WHAS`1bP9lI6SE
zYfWNfGd$J{TP5pBk+8hEBAYylcH58-`CgDT&5`IYJyDF8wYpU*lc}a(h8RccHo)==
z*4ruw(9$7!mG~Rid~ZQc3$^CfN+r^3TSi{P7V;`9b1IWD!SGwNO`nH%K<!%gain!y
zEZ+LC{FXkhVl=*tt)ohMd@@~C8tbI4J&E!DVyunvR)c1&>n{ccQU`}n-bgcOxi|nE
zhz{)fs9PYquOuCT#)qy4(Tbm9^exaqUFUApH$)*Cx5wnlNcXqB4#8|3xG}cD0Hzxp
zC2mEb0~M)fpoA#`sY^Ji0(U+YHi%>0J!N>3B*fFF+0PW03-bMVYXO<`eB_|xShg4?
z53Bnb#GF1Ih4R?c%zk)Um$qjAOoM>>UEI%x2e^|?(ysa=wzQ|O1iyImJT%ni&PVDl
zW?P^<qh3nvj$diMs>@^?;4kKt>n(lkqIz=Apt~Q5jz95*#*EI%Lmzay5^XO{S!vt$
zn=Q*sJfKqLJ4%y-(&EttLD~_7C-a6w8^mrt>`~g?4=1)Y(-fm9?xE**Q{0#6#G)*O
z00&LWH!`(8+7@c6rKmyEDP!w^youCi6gFYhWIDGr^0O()C8#50wZc$(K`@atAHdLN
zOGb%+2HtB3p%E;U**VpU`{DeL>d7F6hQ=U{M%);IZX3{TYfT?bV?eNgIN+o55+NlA
zioyiV4$L4LfZ$8xX$TClUSKQvRcAb%+8i|HsXZ_|X!J8vmhWkc?VA0_Fr!o+OlWt%
zNbhunm8*h_V#`o-WZh+He?6>5FYNfbmV5z<|E{^~S}xS$Pmr-C_=0iv{>MD1-*z^4
z!=4Q4SOEY2dIOb4O_0*&Sui3qkIeiOXpgo4VEDW&l;SYVm(v6k!`9Q+AA6zL@^0R{
z8Jd^eRO+;MqvU?D-+a#*zQ)gwL|nkBqyhJ(QIsm?P$4p&a}>3@TnXE2LY*FHZ+Cl5
z>@2<oOJnXCRUGaL>>Hb0NwE2MIW)eK0REo?*IQW>O>1<-umyv?4avta{E|Rs?7<L>
zqO~_?QRJbL-e71Yu)U9ANH+)DqY?n)G}7jbt=25*8#6j^36~ydzIj(6fXS!W=roVs
zC69h}L+j>M>lLaaLLRoD$`_IAyRb!gr;oWC#afC2tsp6ENm$W4#CHzZ8oSB)tifV=
zU?pV=;~m;wGiV%&Zm<Vzkw>M|Ljx9AxSvOMiDAfwee*-o2BYX6ePGsslUnt$@(bWG
zQ&4gW(k$mfS8(txA=KKM)R^*|<Z^_exmWupf!-Mpx5f4Scn0Y_viopSIb2qqJTeYq
zdbLerLtdJXD7s!4J3l9BRc?_zF6%8v54rRPsQ~eFj}36$CImo0y3$QSh!N8*d&XBw
zCXHf~HYdD~%Q~n@H#*&UWd<dgmbjdt>Fy!7M^RHvLm{W!D(@DKVL%si#_aVI{&;4;
z4F)^BkGpx`p&r&9exQXpmFgMQ^J%twl<aSdsZ9hyVeq@{7I%e&cwFFgoM*(myfnM!
z5IJ+E#%|(8K}wld49-*F<THkB<Q@4u`s{9U8VCB{CC^+oPPPST4u>dCLpd_wXAv{x
zF*B^MK7e<TbTG$-8#HxboJ24@DJH)}j*RFJinbRAJXS$A>cmMoNj_o5xoZBE${ggE
zN3XjHXVBm{n&Cg0k*dRWzKw{w_eTg5vBNG5x)&}-dpS|^sfvuxnt{ERtvZiPT7gp9
z{61mN9oE@t=^mPFB!y1iNwI_fd7e=)ugF>+Jr$g)QAi}zhD2MNSNb~-F+haEg0ZxR
ztQvMg2o-bI7VEL3y4hTDo8@vbhXBpBso<ogD7v_AijU?XDhvoNcyVP8<(OsV)@BQs
z)G8KcP#5ZWL?&L_H}|l}{~W_na*xI@P_#>1W-(C)%Er=MD?<SwiGHcQNlv_+E3pQr
zukPjyflHP+3&nSXKjKOi%|e9)N&9COHl2B^RHa3DWWw|5Sq2zD06CzAjvtBcDTX;I
zx@#~`!Z;E2k9MVcZYvTlKN2Y)Z_YSZ!8)u;m!2noFvhxVo=BwARTyb&FLKt1OJ8b^
zczm8@8wZLHWCqkMLINLY$|*kMWVoq;9m1*N%)qa-A5~MS*6XM?>2ROJX^vqGryB}G
z8w_!9n)5gYdlc<lWUD<cJx3t33yL}&SDh2C488YwaZa@-sZCJ<F>A%BV?Ng%$Iu9;
z*%#uG98tuJvc(@~meXck?V-8q))uE~!|$c(PgE6qt1UIJt(3&ji$qF1X7QLN4|HVF
z+0e8TqW_ZX$3G2K)26ivVm_V&Jei-DbJeNFWxDg>NokMYdOWkm21%ei#l;!7SD#;C
z5JUII^sRk<VgNe|qeFd#q|Ar2UgXh;{NPsUy8v6T!ua9sKeWf@jVGy1%tM%&;G`;f
z^xGKbR&_dy4YGU66b_rj_wz)4If8rFDcg#46C3CQ;~A*Tp$qR#njFLlaq)kcPdB1y
zuW(3S+_msW@u;zpzA=MZZisfjfDEFbcZt>H%|X&V1rgoE_++$kY%lK*!akMSNpEK~
zn>mnJ7-fdQ>fk?S-ahkQc;?^89lT*_&@1w1qctF&dAo<gp||7|`|hC5)PEqa;bsJY
z=WiFFcPwlPHW{dJ@%Jz@-KS6EAG2nPa>W7YjeEgtx|GZ7ocZQ2-6=ryG!OLd61J|>
z+%CWf1ChT2^R1}?HpFuF>E!}(uOB(M!5WEdX;T~-Qyk+lS_Zwk@9qn_!cEy1m@{=L
z*<5Gc%I&Uk>EQQGuW_9O%U&=pK(SXypaCc$E~&y7i!Dvc^gNz58jgN2JJl4`UiV9P
zI8oI&%>s<*Vrv<v?{UHgdG0HrnGNz{9I^)GduzEbMA+&3*IiYDUp2$-S~S`R?8*FN
zQeoVu2+2CljlKcML`ns@%^9Y0JrnahPP!kX;h=zV#}iur@9r{L>^l68PUdWXj*-GW
z2<IFcru#h<>eTpK@4-7527tcsK%@V4kKi>m$EXvZ(J$A@pWJaMx95v!y5yPL%mS{(
zSO(p@ivEkN_82k;v(I3R%`_4*zDK?cfd0gQ>df@`hgqAEr2Ra?mm3ZH`Ht;jb`BbD
ztGV)k6hxi5(Nl=<4E*I(0CMmRWhL92_ZI5haH9rg|1P?yJ`d_2aI__cEc`XB#z7tA
z+KPlSjf3dzv3D^jw&f|BeVypEKCNMW>T&V2O?~o=yx7E=cCUtub9LIP4K-IM#;bMW
z2^@NUaZ()s(=Hs)mrGbxNk0)#I6g#X2sgz?Jeb*V>9^%mH0Of_^C!Sxg7c{Tl*4{l
zs5dW0du%{%*yvL~3N-HU4a(76nMYDuDt_8el=t*r*%TYlPfJNlyUn>PSG1YdVJS)`
z$NGuelCr@4(1NNljb+(Fpbmw~Tu*uC$!BBrcE~zI3B&qysJ1zUax+(CW)})*63P^J
zzcN?%lSt(pOq@+)Y28&;g!`qZ<${)T$-TG)BHb0?pkf%`6p|Fl1@3)Y&KpGe&77n^
zfL1_Wz7FR5c$dG_j-h$|DT6u5I9osIoAOt1Q{#Tm5_r_{@4_O2$Hm=b;D;7hxcQuy
zp#ea;I<s5~!_v_7(muL+yIn9C4>6Z7>=w$`i%k+HR1<ov9?A>9+PJrh6FZ74{4mHH
zD`@FI+Z-<yeAt(rAqM)m@BS4g=wMYgfE2#iNGHM=NB)O)wdmk}Z<i>)iXgul*9abW
zQVq<nB3qQlB8MbW)&E;*SBn`PD=QtJ89TSI)Ky03(MsnDW7l`1u3s5le^$C~8N2a}
zyMdYApw(`2rXHwq4{c@-<7y8pQ!l$Q7P9I^toGhx>Jv8Z6U*$ATJ3wl)PE~)+^>|`
zue#c=A^rRlYJfm)z-X1#&}YDuY0!Fg;JMF$`4zK%`=I0MpmY1s^#*-*&yZ*4kbnDd
zxX<8A;~|r);b+prp+18dnInlzBkrrCC0C<*S0gD`gJsgA9ZX}EOyh0RW6nNU&uX+!
z`ooCvc$f58i}cWE_;3#Hg#YUBko3e*`^5C>c*yF++12D)`-l0=v0v?jnwh0i$Z6Uh
zR(<5OQ~<%1IR#4xo^cN=_Zrbv9x3-V{TyayteZ6|U}nCDnmcQn*<_mCcZPLsM(}!u
zwqu&rWS*yEo>gX6?0Q=2dRE?dPW5_P!(@RoYr)iHTKIa=Qf59RYyLL81MgMVtjzT^
z%4Ci;Ywj`g65M2ox?>?S>mx>HNzY^@ZEeY!8Jnpsd#^2PGOzS>%nV%5qfFMMx><c>
zR(X6EM%LyXO{V8J=-qsmseM1aTl-YMwzBB^@%#1CHS=1m$=XTBr<d1j)h3?~I@W;M
zYp%?jKRWO(Og30$)??Q;Wmu-69e6sq<O{e&I>;T28M8QQ=SennVPoeB610#<Zj()u
zYrd=T6lBA~V0^QqA-kj3x${hR*OY~5+l<)^+r(O@Siq13AP>vTm>;1Ii?XTEH-~R;
zD5_Y9yl@%XZw_|4kMepBt8Wep{0=KV9o2t2dYgTa#d27keRw;`a`gV`VaunZo~Or)
znB(eC$A6xF!Q_5jVL3_kJIIjza*+L{`qLL|GS_;8odo=H-Ff`w=~rOaDf8{=1`8q0
z?IGjs*ABn$McLoJ%YGZ{q`ka3DSCRolYL$x`xTXQYI=L7Y5MK)gJVS34-D)SVfy`L
z*LP^nPlHc~rZ@ZXo%^P;d(S#|U*GKHVQAd^n7wXxQcQO={B{jK?cn-thZ;^VqOOK=
zuEsuJO|o9knqDvFT(5k-{>*x_WqPxhb93~scJ<x#_E*mBpU?lPU6CA5_2l%1kTOd8
z5DDh@hf^U8+rtD42BVpzysn6Z3Wwu4RMVxyzir+M8xk6|`Vb5Mr*<V=GLa?i{a@Nu
zm3*qu|D;`|REhknT?zkz9V7F{B{GpZm5H;s={?TO4UqGQxZuoMS@Ujvz2u5d9X@}4
zJ~R}qS?>u3G0H}X3u*`ZF-rMe&AdpH6_9l3E$ibmd{3~{${gk<6bH8UTQ>P+OR+s)
zX#|>2P^>*(`m0_2k{hh@{=;(keo@k}Fcc4-w<%=J&YLSUg8~fJxTZ}On=C4YM9A(*
zLmx_AGetox>tC}<sYQ~o&o15#%#(|3bX}`U(R9>{r1&LJ*Joz%*-Pj6ml1~WvdAcq
zg#UIJt6lLAuV5(Ei4ygk&hzAfvFikV?91=86@ikrxMajSd^0qz=|!SyK%L;>aQ9r-
zscaf%f!WQ-<ac<ctkYTF9|4gcn@!^kKYHl7+Tvm?;$Om*&6Bh)@q;PIpN3oiqg@p#
zQm7LbV;nF=1Nv(Y`2@u9fJX($aXyQOz&|``G={W|oCU~rVyi6yH?Jav$Z|npR>=0o
zJW5P4Zpws6xk@~XM6%Kn-*fLFtxa)yC%%44wjYUIX+A^p;IoWuk~F=BsrM5Se8X?y
z8EcioQ3a840(%itA4?VJt)&x6T)#YV16Oy-%4OR1kvfB2EC<RyIKHz`DKQjKyS1}*
zPt6~FnVJ<t@~U|=Mzu=*BonJ$tyQh)IpCw%_XK!d9Mr?=6J}7XRYYa^u2bs>AlC>1
zqamx~Xf3!KFcikhb(#fTW`nCSY-hz@j%^hNXifK+9Q*mKH|@lzIgQ*|{5j6X=QH3m
zh72IB*L?b33{4LY7FZVe*_aOZi`sp^B*8ScMAl<kh90bxW4G$Btg<2sLcFu12n-vq
zEFc@YSR*)hU7XS5ab_7(`)S9P6Xmvy)vhQb?!ExJubL)5{)JZPDkQ7m&k{zc`_Rt)
zLi$6gJk%m>r&Yu87d~7(om%g4+fL9>Z+SS$6g|YZZ9n0;w>`e*v7f(qJEuC&91Q!h
zUk+6;o_pH`_C97GTEZny_m26qn_E5MeX`uVIqK6ve!HkwI}+pbZPZlR`%cS)TTfu$
z<E1RDmo;nhbNTh8@2^k(<bD@>`mr4syE(Cb7uzM1et-6>PyDXFIs0E<?Lw`(ex7>!
z!$cgcdmG&OUI*awnOSTW2CksU-KAkbocG-c#AVhZPF`mCoFb@VgE%>?x^Be(@xep*
zL*`5z0Fk^n1Lf&qFu|c2@R4mVw`&b%EH&jVX;>fAVH{6`Q7$=dSll+<BQsusA)%TY
zQXtD0Ap*91iulrgn9!M+y0ir)20Jx$UsFm$jZMM>@=#kdK2o>;HlJol{~_WPILd&k
z;B`6Cz=!!7yrGpm=94g`XyYn8lJkx4$??PjLY8`bE~H#B3rbEnT5-WHAK*c$!wR2D
z<KKB&(Xi7GE6YvAhn;6~%mSk280r!;6SrYv2FhB=LW#Ll)|Px}-K!q}@X6tVyRXB?
zLMq2S{m!?9M4lB~G&><0xS=?n-D9iQ2~0f?tt}%wV=V7L-N)>A1>OT5KbNacf7x!M
zTW8Sre3KvQVOAX1{`>LWQu&Ngd>b)VJasGnxXj%sxb*zU#2#)OLCbN;1IOlj)aOpQ
zPF9w{DG4eJ+=^!GH2)r11Uip9DVB_RUkG-X5-v2CC)>WScgw~=6|L)%>mknY?1D`z
z<`uNSSD6Q;%Fv(qb)bluV2kZ0d^U6Nm326WtrFhznB%xd2s_V0lF<Wg3BZ$5p}Q)Y
zL1A-+{6eK?&v`Yo(+5f~UCPxs4<)0@p9J!25pcNN(XH{CE97-5d-8)<f4)_hC64+r
zY@XP#@3Ieks$Jsq<;C(R45axEHORc-P$OaqSI<}{Gmz7sk?aWC&#Rjq_$AYFWmJ;!
zadNFg$1z$s<KuvCW72l&qC_;C!E{VAQ+9~GhL-Bm^quL3pZH&F=37Y(FI}73nQ0?V
zTbK7f1V-=WDwvqdfo9zT>I<0p<s!USQ#gJh#@|&sA6Vb6=Bm-c=c$if^D0bs+-R%D
z0?N+w5hiDZP0pV`@S_{sR)4rvwVS3r^(d1v6j-Qjy83dGJOeTPeJK=P5U!zdSp&9#
z;e!ChcQ7j+>-hJYd$N6MFrI;C1nvPnRQyFDYhj6`8qIwwu1^idBcQj+;_o=BY%wSw
zD8=j4e$G2X;nN5RH6nGOfMDJ48ng{V*jn=z)$ZvpWm5GifWRW(;+ImlGcL&CYAn?O
z@yE+4YAtsky9w>pR9f-6FO9vp8Xa>8{7C;RsoyO5Tf&f<O;GmlJI`%S(?=@w;76X5
zO>m*KA0v2trCX1PIKguEzxKF5=~E(tE?>SLZzFH{83tyqN%EoBJ4o{M8Ggs}BEfgV
z3FY<V0&d})TVc<YU$;&rziEg+kUG?A+MZKLewqC{>d2V!PED@gr)h}29re^EJulL=
zTI$zP3X%QCfhyPPL}q&%#y=lhL2Nb8?%G>uv@KGT6>yhG8?4K&ERRmO)t7zQ*e9Ol
zT<<Jx4)VTlGUom1@rG!t9<d^IfIH06ZoQ){P1(0i4|aVc*8RQXb)eDmdN!#?Z*9H9
z8+Y)?QQSdQ=eMtxs#@zXzUF>m=KhGTF-4-03$LxmCrK5V96xQuVWK6>ch7MdPD%EL
z7{T8!#@lymJANBF^E;=rE|1Rnc|LdLcggtEew*Ym94uk+3212RvBE!zKjkiaUL?GB
zfKIs#%vv)`s`fdy`lSVI@awM@peHx$@?0JmcYCKjTWcKCwz{YK>wVMO7eZ@+X|kK2
zttZ!8ELo?YHL~OCu-X;f^Oi|kPmf-p&^OA^tF<PH-(&Lk;%eu7`n<pXR&!^WwRqNk
z@c86ns>1I_<v;a$a_@<^H|Gsp-iMa4f3>R<-+RwY|E$mc`Puo8b`^WIUBGzJ`&zat
zy!vWi)&Fv?+V5-X$<;BC{&L}@^H&%7&Ag@QpY4;ozxrZtu*B816^sAx&y$Pa>-}%e
ztGljg_x&!8KIeSv>bkup5BQwo|3~RIpmEM0H!Og-G@xB9fM7pB$|V5Aje$PGxGx5f
zhhYe)Fx0~staeqH;z7?H*wXN?b`=&_;EG`%4y@4*<RJ<Y<POTN54>v|l<+-JxHL#=
zA0z4!^dR-V#Bh-OqhO-_AY@oD2Yax>aPZ?{Kc&=QO>TbG{op6IAq&6|t<sP@xe&em
z5K~(pgXR#+VNMgGH-k+;@>3kUQ|Y+eH&5cEs84YyyUDWUamkUm&&2&L9=-AP;It_X
z?a(8@wtnSKrR|Vmh&U+#4i2COm?cjV#f^h$_Vd{fO(B9mQwl#63k&fGiz*Fk?hC_-
z3(efZ4Hgg22=hx03x5}O%NS4^(YzS`CRNG~Cn7Q|VzNeJRUo2_E)qZ&Sj8Px0Eq0m
z@T$KE$ALs-&qmrm0tZe-4iZK6J&MlPikcbr8rF|&;*N;Ml36tpRLHRCu;{g+i21OX
zV8`ekI<Mt0sm9W%=CBAXnN{#8=J=8CUTVyrN7P4Qu_=2o*?6&IA0>Y3hc$}hlwQQn
zmc(A|$7yWDg34TRmn87QBdNN>{)5bNh^0*PA^RQ2UPeVhoFJwYpJ^Gth9$G6!g8@6
z(H;rrbWt476W^OB2#+}Mv`8REqOfF^_f%v9BvI1Shs`rlnTJy1dD5@J#O?J&0^+3h
zM`2`0u)@-9QfFwA%E(*ho+JZLdky-xnSEi5NHAk}m_yiGvlefoC9HPkkv^Q<wir%X
z1910DnIMWK4@mJ;23sqGS7E6c^~uiR-v4M<5)`J-Q~ejhu`3#ih+^ZE!`6vXv$a#B
ze|us5tE>Y^R9Tw({V)JBy+}Di=66DoayljQUotB|iVTVMue>u4(wYv)bComN41ycO
zGqTDu+Icc1_cOZEQhOvaN74cZo@c%e&m1MrlF?7ZYFF@owJYdw=6qVxKibvv;D5BM
z=WgrIvy+;$wj~lid1ilU3EeEqK5I#JI>`R96nwyw^Jh5w=Sa?{(461lF@KhBbMQvv
zPKk4Y<q&{ME-1q1HaxfYU+t=6FPD5d;venGE0xeL@7urH)jPdB=EKl`w5vl;tafGf
zuXbfvl8<N&xqF!}%Ihe|TcGu*;QnaA*ifE?VV2Z#fjmhd(koX^rBM0MO5Cmx8CIx5
zQbaXa_}D8*gP}-|<n;rUqUPsC`iDghqD4ldfhLzl){<y*-eR`>XEvk7)hR|;1Y?z+
zt7@UxwbiBGMc&ac%hAHg?XZMYPfM(*WWMDd)6bI7Ru{8vk|4vZ08VrmNf~Qsanxae
zqeW?aMA?w8)&s?|W={!T0gp7^a`Q#p_j6@)#AYdy<rONo7MHH&(S}ZyycJZ04*}=p
zbHB@y#46e%r0R9bn?|!<&6c#QRA%F8M`GnGFIyMG%6>zS;q=PY7Nvo~$`7sOm}lkF
zlG!Kg_YHyxbj3g$yj5E&RXcW7dl6L!<yA+cRbLLPPDrZHc&opwRR6H6#%fo;%d7v4
zR$tpyry<ox2g;VQ)>a&0!>kZ-MGa`|KeQ_fMD0J?)r(r%$Xfb}TE?+|v@2Fn9TvF)
zjRBsURp5hiPu59*FYxak)!hTt3nJ?IBOyq$da=lQiHdqEk$Rb<`Ug_=qHXo^8TD#-
z4N8#>0*Ho(V-1QK4H`%Fs$&fgj~dV~Zr_U_IJ8$9oSfd9{Hc2)ENEC!{}z|#>B@Vv
z3OtL9daFo;Mh4;Y8lt6$I_EJ6QM~nVNKTtP^q{OsxF^&1sL9Zf(yape<~}uHhJw2h
z<V|vkI;L53!B$PaDUp#9f!8A1)BFV6_w8w#DS-NWGfS8^YnZo0ynv*6H{-aqcp$jS
zGMeL8T9XiM%xBHTQjpS>*xw0Is-!llp3I_1n}k19?_WThk6J5MC<hs-`x&95Qf-so
z6ypf!1S7S#%S#ay$_YeG<k%tF(>7Mo+K7P6wNcHiwD&U7?RvNFt5P4fH6MdI&R$S_
zZR@N>&@CKwv?@?vynrrww>PTZcB-MePF{2c3U=d?QUgi5zKwN51-rM}x}WrP32t;@
z1bc)udv38*mUR2ZSZlNt-Pg$O^*^onq`hQOy%c%f1Zs4&tCZM8b5#l|P}%c#uvgT$
zi;Jn3#ixzQn0i;Lmxr(a2G%Rf)Yp1MDdN+=_5z|3g&p{(Q}F529PdLJ_vuRa^N{u{
z`g94c_FulB<5z>IuXakSLG+KCZKRou?YlQ32emZYUS|%Fjki1TQS++}nnd*z#1B~;
z_d=uxUK;nhkq+Vfq?Yud3-ca!9v`Np7_wjOeaa`d>`muEIv8#|5O>uTeB6qOqKk+c
zj^-Q1!fo-DZNB!Si*Ig64~_<lR!6GZ`yA{T2@zxY_G6^Dqr`Perl^q!OjiZpaHKI~
zOD2pfl5x;yY@`y>&<<-`9jmJyOOa;mmmYhL9vhANARaQ_>L@WO%{Y<CIL<V&q&6|V
z{9(ZO|7cf_vGZyFJ8M_B|NqpkqQCCPf)C>P4-(Z6-o83Wi8)BCI>?wf$ohJa13t{-
zKP*r`EP8cV5(7Oft2(ThIDGf@uo`?+%YPKf^8fB+0f~r6K_D<Wgn}GQ2_dJ3Qqt2<
z)6&v2($TUoGQe4w<XC~6Y^*$-?00$Y@bU5r-Q~S6$S)}>^g!~yl#HCbtfb|GJBbg;
zRTYq_N)Rm-g%lO)N2;2->dN=DVhyz(qqPm5>Y`ujDT(OER~m8*7*hOYvxZFRhs+t}
zERr!6k4-J@>@AIlEm;(-(jVDm{+FDkW|!G&C;XSq(tMqRWwY!ZJwG@K>pJE6I@$d-
zv;KlvSS{<RXVIjmOo*40g-@}SkAQ`51s2ST@N>h0S^r(j(hC;<Pc2K@;mteDo7lNG
zf2k~_Q+S<Ac=cZ`>o1jsb+WKXmUXPk|B7V&PdrwN-v5oqa!of5N$+`^QT!Li^2)Y&
zmz}tp?Yy4joR(Yh7sjg1Oa2$edYM$%Iae6;xzMMvI0LI<C6^3hZI1NP?uati{4!6h
zjkQ`9_?O2TsYu4cSh4TCurOBfyOzH;RzdXu7RE}h3+$^aPHlMe*Tx!rUzXVz@vd=n
zrzsU{W97EQj{Rd}WmLD#{I#(rJ8Jhja<Mj6edp|c=l|fb{wEu2prUrLpl5J)X|UyJ
zxcdD_>DEZi+GzXnX#L>W!nd*7e|fCViw`xM6Wv%It8=ohd;0yr^xpXN>dtiE$#lo>
zndY&%t(m!%<GH@`xsJj4_Ope)<HZpyl7$trzAlYnk*x8*NY={O|AJ(F`2U1tZT^d7
z?HvE(WF4IB{65*gKHWP$JGlJz<@EgP)z5F=e|`J;`~NsupC>xnex0oMMc%S%bhiKg
zzCT-GI@#Ir=U3a}?{tl>&g(zt8%Lify9&#oIE38m0r(_z3V)p}yZ`QFp=tlSlO-NR
zfpxOjXznm*22qIruTB;@*2yZM(ElG!7D?WAg53E!2UvXkznm<^jcrPq@tPe<6PLU<
zkpCwq3-Q;<DvpMrf41}z3;g3`31rq_ovewTIPuLSj%X3O=j_q4Z1e1o3kctDMe-aa
ziA)xGzTqvGQ#@afL|SCxgd&&M&Hi<=O8>*jlF39zJ*vyB2}U^+*<zh6S0_1I;(1{u
zF07MPOi@BI2L|82tozr=(xCbeCu<uNU_K7FCTIWG$+FozZqr>3*R14%7{&28Q~l#)
zeXPSeSt`!Tg5gwkF^H7@*%78Rtdqt0Rn|U2Ja!!GWS!~Qs|u$4<78Fo9FJn1td)^>
zH<jPR7`*r8Af1<;(nFkBCkqYVxZD~e6~{VRoW-`<VXX7RO!df1zSUafyzyTrYf1>g
zHFF@;qKI{}mW}^)vYf*ab>sg!St;R&F9LHT>{HSYtA_vz@LV1M{Xb5Y^etQNebvld
zxd8nO?IYsre!TS@oEWCqB!G|+x(ZMp|LfBmVQ}uY8!)WtK^D;VJF+8tN*+E&$^phq
zzwrZnx*#Ra<-0L<3f#Hbe;N5eYlUT<^x^{E`r!8Z)4mvhCgJC|llbSY+e8F@0C0-9
zh&!qgr*+(4U|&0$LbdYyXHs80j}i78{7-#ios6$4Ho3-YW7d*^k$pmg**Moj#SgaH
z?tjJ_^mcm{o*ylUN5@!58-d)ue0a!WZpBDNu{c74Qo=H$wc2EJF{TT74Cyh;gaewi
zYd#>Ld6xMkW`~?F4$TyjFenKS3w>RQhrBzxQXS_WC}5ngJr1()x~+l1xFCfusi`2X
z3{EnEM6q7C-+{7LwZPH0uU#<Cv{&bj&HcEgF9&&z*QfSkX#^`EstJl!<$JLYqU|G|
z;7<V+76tsJ&nRz&7bt(l)dxQ6BTtg*krw$_3d}~bx?h>DQ^Fx?OB19iD_L__sP_|J
zs!aN&dWc;KVZNv6r*fp$9_KVLx<`*_ThcMC_;L?%vtGg<W9>e5fgr<)b^4=H++0aL
z+0~*GeD(?@uC`_c|FBK`kXc5?k$yf<b~jDSrLl-}i>kzex?6R6(cRYvVi`*@f$xL*
zmKtzjMz&}<F{;A*FMmfFe~At7`3_9u80pnj%tNP0W7;~GZXe+c1cm04+Ir4yqx|u|
z;Wq>Y1=!$>2KH;gmb~Zt?DJwDX09W*rBU~Ql+A0z-{bllcKu00>pAz?3&v*%eRty#
zoy;+2v^(icDH|e=RsiH?Sm}d1<*`qDaO~aiO4ht^8lx`dg4hwCm^i(NBP@svj?fs2
zL-R_!gDs8oV>!hw&B14v^6K-#g~9es0DqVU0pRfqkA6W8x+p$xK%kXWraNFqkOC?2
zvH1QeF6>oW73&tFKkjs+=?QUR!OaCX?Po46t4n!?NYIoN8A&exWAd5?D!zcz4HEe;
zD0T6Dpy@qHooN~p!X&)CW}G=)U)w1?9IZLq>*XN7+e#W>YlE@iutG~E3mE*a-zdl-
zm(X`xg&?Vd<=bfa!mish=9EYMVwXIyz6o}yvqPHvrDkrvG6bn=n<Oi@-3!GgcM+16
zdP;5j{mkmHTZ0rHuNr{p$1l$KBl9eTp+N@Gw8$Nqw>D3vLVSG}^->Mr@asYN94`B)
zTk&6)h;VaR1%6-!f~%2|XC>6Z7<rm=gv@U@VxEnFuvY7r7Dg?A`&BV56VYd`R}caw
zB6DH~@hAIV_hQwW(aLronH3LFJb@R-?D=RsMrYUBAcy&3TK-{av?7F!aeIWM2M8%c
z3~-b8j}r6<jkNnfqz>fA=@M(x-{XbKQE=aqd~be8)eDPx-Ry}~fHKr!QZhW(Nn8xZ
z^|=)yW4H<^&nyTYO|KcDX(b*w9fVCaXNcKPNkLwnBht;H`|5k8ZvlsLQgb*GxOaPK
z=D9_mG9Di2wi)u|5~9g=QKNu&-85yCaXh9Uj-DbENJWX<YTO-~fnR#4Rw_9wd_Nr9
z{3-khUJj}+dHkgS*@m2{YHVy;OZ24LT3H9X3&st9amx6!y06~Uy7=L%Tic(tQ#aiQ
z5ylk0Q!6l?n5IsG@;7%(IaH4FiI`?UnhDRT?j8*{Dek_E_dc2X1bINz#{)PEJNdJz
zx%84ttAxS`--qqzond1B@x}V)Ku7&sn7d*!8XZK{S4B*p61OJ~6Jm4;r^HkQ*vFh@
zGwv|Dt>BGwZbnL!Vxm~MhJ~W4q<yJ2r;-vB1bz4-{Kk7M9vNlbU)ZRJhRKuJbt?(l
zPoK!uXd<rBxL~!OA^R7>3Pk34a#pf&t}dI!;`{w0q?;TOADK_Q^qMDu8c8Ka{nWz4
z5AP(Wx?qlvDe_O(nex{oxw-AY0%mDDJ`{vPPE&fCaRjE`un75;DpcX_=o80vkZ-Dm
zJ0-^t$_d@D_Np1yd4WEXe6$E36E};v1MTV-CWN{asp-?6^}w!LWyrY<CCvIr&E4)z
z`|`Z<#rlj(T9=CNI*imRu<#aDeD5RoxEXU@H!g;=kgS6&^7OQc7(h@5t_g*Yen-pG
ziBGs|N++M;HsR0r>D~z7)#sCK3j;&GlPy0Xvf_ZS58dO6lT;}nTy~JN9iaBZgPC+c
zS<=P}LE~-X8SH$Mw0<Zf&91TUBtMGh9#R7+HWNFFlaVn4anSL3^a-a-u}uRpYjO`0
z-2wZvc;aSaZO%c}^7qmp;(yqj)+qTDa|y3&0E!M?xrrWVN`FIc=<Wb-8<aqp)@rjx
z8NB0q6QBa2cK9KuEW`fjYY_RE76i=g#NqCcm1~ujOE#Q<F+L;p#%fs!GW(WNlQ8Mu
zGxFOyGR7r=Jlc9Kw_B)d7|3CYEv{GYO_;Dbj={X8l*~T4AT^?k60t8QvE~#mLxmXr
z#(J|GuF?EvE07=-ty=Jl$Sa7)$Rm<BPrMNZnx>R8dh@TAHH}vV1M^&<aG&94)qoA?
z2)-r|11Uqrz6ac(@f2oV8Q+9@?UVbYQqREf6AHwBz`_s>q@_(j?<wL*Sg^6Sh>wMC
z43WE&g$oxteAp@G-~u`Bq@8sUKHCH+u$AOGCA|rV&4M73XAu?RzCBvxX;cLJ%|Nj^
zJc<_UW{>{_vjn{Haia)^owsHUAPTAt>>%u}x7c;mi~yb|0ndy$L|hn;+nHDZjpu!f
zc5251Lh7RhlBuuJcmil5pKa7qy_*aUo^t~*UjT1h3-1Mx^V%$!Y$lL}igU(HtPC%%
zGfqbBAn69eofU_;{&?4`UWltkMO}*=0mD~aN&=Sg-sHw@Ek>AWBa-y+lI4RtYw+dP
z9q8y&;i%X8>!1q(ldOEgv0U<3;Sgy(_aqCFf_i(x9tAs1&$pt8CHXtzNU2M-xh9gw
z_qk--CMYNf9@X#Eug&e&$4B=qC0CiJaf(e*KLtQRKBH|+xRcyyNs_aq_w!DQivfg`
z9`jyU{3ys=OAD`oJ$2$Qm{pK8gXUl6q!6#c*F@u`4bsB(5~!X)ptnjw;I|O)UK~I$
z`w_cXAXj#PGKJO8)JcgPIGhaMo#MzWGBjQ$>ru|l65Y20`l=t<w+6X{Ub#f+xg@Q*
zq|1DGn<x@$*bL6gicQHJHrPJ96vGqA`mJzWC%4A4EJjosnPEQUEO#&NMLixFfQ@hu
zCW8YYWAXy{IDi?vz+%*}GzTyt8^g6CMe!8dnlgp>RF3ai0oNHRhh6>{E^P0#5Y14e
zC0V3nSfqPdn05+w{!Py?<WD(`Cof5%YDa70MVT~IxVTZM*II19T&%$$4ojy;x&!3&
zD9jAqy>kf_EX7kGgbo6TaF~cbjBI&|xO0kN|2vspC{M_(SE*GndD?o3H!rQTVF}Eg
zSl<kDwC=|IT_8;oA>0sUTtpr_MNp&U)@kNuo6huVxx9+E$j3}J%iM#;u|z5aFT@Ol
zFncXGMbHVuZ%a&y%@ysOO0Ek){a6RdbUP04;t#cwUgu`D*5Dfn(>AD3#Ma=?=YpbV
z@EV}x2<-CA(RV9=IL#Ur^Yw}`FRvzf*$O+R6m-EJ4(T}wsYW^3@@e@y60#rZ)fx;H
zL<98S^(y*>`12u!mU~rZw&?jS5bpr`W{TiL3;sAsEu|4D!U189e&-}u^P|N7=`QHi
zGYHo&qDLa8z6IQzs;{24YP(Vg**wG0T~rNj6vo}Y#~1%oXtADuNm7($R^%K|FK}9q
z9tDEk=uNmGpKIdr;bdl^Hoq14s%qSd1q4F^q`K|UKeapowY8xGm1}jivTpiJjI_!X
zWTxWIPn{d^YDww7Nn{z|%_=CrHWHhj0bgprXG#q9epEkTUe5(9x>&A98{T_yi2snW
z=mbLGs6yX59NCFImfqm~FeBL%i|VffBc`~I%#aU5gc~d?B%zH)^0hHat({ZCe%g(%
z&zd`k67X=viEB$#o6RNU+wK=wY3V4w<^anqHTg*~1%Qe+YU&G43)jpDyQc^&aFBL2
z?au4%8lxmxQ)JzzYTanEy>1eVb$n+?QP{0ik%XOoN?ts7Vl5u7k8zN*4>0a@Kv?FK
z^a6RuOiw0%?7gXIEdnim!AMvKc{fDq<!at3wS#>wZA53G54o+hxvfZy3$>x#ua<b5
z=ZU*k6nhZu7?6SHC`t0K!g&FiB}pJ(1YWpV?-UN+Z8>4px}RcPDDNpzT}=U+p;Mbz
z#`2Q(sbLyErnAXYZd2enc*7c(fx<Y1{JPuHu(t2VeMpFBDo-D;y%a<zzf#N18b7{|
zzLHVc2h7A&qzCLJas`LO2>EzHdq_*3_FfIUW{p<1Ay8*HV^PvD?Qgdse3bRnTqY<F
z&@@9%8Hjg@CS_ltL@g7DJLD+bVutW~hFQ1YF;Zj+3uMvJ5Fplp_$rXjb-BmQ150Ox
zrldvYK4AD&p>_KpkKG{Rw9ssEa2eF=v(CAO?sN75*PViorbgW0;JlWWa5F+ZPH-2~
zcr4C1;*@Ma?Ovw~B-Typb1qqkC5asl@bZB2x<*f_XRJqhywiT1%5r>|bR4H{oY6do
zQj^^LaAZcX-R!EPkg3_qevsE5Bp^VthQ3$eAf+LRXKPG0V^+O}gI9?h(_BWZ<<kbK
zQPi1rgB^)|j%kTyC_vXL%$og&#w^EtqYYHx?eoG|v%!FT6%9!pn_NPTL!jr6cC;3r
zDr^XCDB0>mdr=bsz7;GZH=lMBoTW0KrH#H5@P~V*yO>9MOp{?wYne>Z7rcy|yWt~K
zMK%bm(SA8~EEb%X$<kFfBvaqykbBn~oRM!NGqo2dBj`JC^MOfoYUVP1&h&bw=@;#H
zd1|&ph#?cy(S-Vo#NsnDrd}wlt~)=!56tTY5L(VZ&docHE5J!0K8C@>yTQJXIe6h7
zUcOWmYZQ+pDJ+^OP_1ubl&7t&3MCwu_~Mt~r~ra#US0tM?+=WfcrfU40R;oxhY(hg
zpXba2YuNgTKbJ?Sd7mvW5ns?jEpL`tvlx07%?xiP%v&|!qZ<4`IqbW9R}Uh%v`kzF
z?r0@-mFWlGDnYPCYuyhNZzWyGHOcFy@Q&gfZXl&00;N8OB^P$3VUnUGM9%q)&%Q-}
zI?Qs2kOVgBlbS;a+h$6C$UwI`D0gHi+@85rnMtSvU4NQbp3V~hc_53?Yu7zW<~6|i
zOo*kPn?1(|l<o#<P|uXsO*hn4ieTLgc)!rD+|=<M<utKejkl(NNpHDm)Imk}a^<Ag
zlVTW|k9~#AO+};GmiP_XNNXiPkQ|Zg?h4qZ6QL1dp@6T#MDKtT^*kfKdBiJ87dx%f
zS8e=3sY{Gkl>vbhqe8y*l_nBiMJ3Xize<a>y`qw;Mo0U_9T%AdYp6C>0n>P7k&PrT
zKvK8ta7rV^yHfl87NF1@{pb-*rbXf-i;ZxWTJmd3zfMY)7yg<H#5Ms0851Hb+pa-&
z0mkyOfPHd&TYQslxBJ?=HelAQDW~5}{v?jXLSxbIXSh>fFNIH4d=xMTqM=$Mn08@c
ztrn5M5w!3fh4KqsHC0GffawRB14Bfje&l{3LP6>xC59iOhkzI$_Dxm49*6?{rn)Lu
zD5tY2pJg=Soe^D5sRK31LgZ!jYm6wh5I&-aF^9L#==VnQNAJI~n6Im1M+bn8J-ler
zuMsgX`~4+7L$_b;Erm5LvY=!s))+Qg<0HlK^9W7MKH=Ab1-j!`z?wOc=&!QmS+_If
zeX?I;qsVhJgb-cY2RHgMP^p>qufn+Bcs5$E0Bt|2hSlm%?&^?De6$4SM~&~J%=X9^
zqc$qDPQTRRo7aFx@e+E&AP`f8Fn5Yc00CuSbbFB0u-{p75MIX-l(>@ue^rrWk(gTp
zVggI*vAg%(TS{f2tL~Ic!)fX~gx}w^3sCz@0A{6H(*>A@@!}{4#;)sRQR1)0=e`8#
zPi0>|4Y<p}!!Lms7nmSW6QtGeBpe{+oD0}1`Ej`+HbR`xod}^d)+J-ZcS_dB2;(_B
zoV^iE%(o7$kn0hR`=RIfT2>n3(FIZ3O`XUYX)}UM`a|Y(Xo8=ohAAs+-cFI@|Ay!Q
zQpL&s9HU-GjHFVUJ72)ANvGHDP9MNFhIA+4A0}x}KT{^CjbN8rZJ+SX6GNO`ezWUO
zt)qg8srjuwPHo7Cfqqa&>esGIigV5R%)S}ODPxflGT<<n*;Y;><|?)-Loa703tCSU
z8qDrK&XjQdy1g{Jr;&>a0dpG8vB{ds-Ww5G7Qz0Y5uGU%8O|R*sWf>1YG--=NUw%u
z#q~@=^mwWE*?g7t%EA|;X2+e0BBRBxCheX-zV56no|tw&UQ{5?baycC52wCov-<JO
zGMozDW+Jil&3Zgd^z|+i)b3ez4l4GJ$@2L@Gnd1Kw@dF2VuSBbb6~g9&wffjuQyjr
z`=YTx-158$aC?0j|A49bzjhXw3{h9Ty*S<)F}auX<x2E?vDviXj_IeX-_=!<XK7i)
z%g3C1{o`+RSKp^PtJ>sb#IWQaso898F@4c7s_yvpH1c)l;vwVYgHRl*IOGo4=Y!0}
zcEO}9k<|IAJj7b-go#pB<m@4pwn*)RW-#Mdd}_-iK?RyMr)f#LXLFi^4D#n^N-%#W
zM<q5reEzCY2R^3}N^dK~NaY)=ghyOK4c}Dwl>2Z)c_J&F?oQ{A*N!oFNh8!M3po;p
z*y~+{%Ow)LoYe~!Rvn3ZOW9vkaBtQ-D@y;^E}wjW`yo;N_8~@SCz#(@`FuK?pT1^_
z?sK7wqS(E+6k6);5zpSM%fDBC{CFowzKXFv5U)#1gKBGzhWyFfd0kbXCpyN~bqZvG
z5iJkZ{X1K%vWz2r!*m{hkOqy43{}4Ey3doSHu6kaXF=bdme)$(R}xi~%YACVX5>UJ
z_jBe&kKFfi=jrIicdqa3Qf6Gn?k*<L&+QN8q!8I*0j=Pg#ZR8Mm5UXJ{gn&L?n^4o
zOCfp89-D7EHRV|YFX1mVBBI|~QyEy5iT3c#2kjapREyB>1W64xhVpw&g)Yho2@dSo
zCqlQZR0gmm&F6)vC%TnZ@rtZWZk<#NIT#vA-Kr=>!{@guX*UwKnf3P{<!m(!x@D_2
zX1IL7G06z!x2aFyKag7z_O5EEHOyELU6b9gul~NUa_>3+#>@NNc(gtay&y4Zhbxcl
zy5l}Z_bbO?_7oqdQB%e?)j`CfkMo4oFCV$O2ej7?OzQz#2OS%Obe!$lC5Yo`OEKdI
z<>6G8NnO^9zV4scO*a!bAM$I_2=Y_pyKg7zeR}^n$TY!YD<y?FRMj|kENQy|MGQ0|
z>3y~=Q{Hrgcz&}he-T!3moaqAl5b`5d@IG@&*({kks{$niNF7iXjbeO=ACMP)v@3e
zhpE=H+9Kex6fvL(E)W=e5A$>*`a5AMk1dv24zS3+-Q-X0B=wt8pAyIgK6hcI7`zwE
zb4*FxWGP40vFpcYpXY}Z?Wqd5OX^^@4(Lb;XV&dw9UzjY<47cWNd*ASTnsYp!oY!Z
z@-#B~Lz0)Zp-L|KptY60s`6<9i;XF6^DRm;o+sVT7kO@+qrpB70kXof6^xZ(TS-D;
zIcnYU59{dS=#p{zB(>~fFvc^?lkrMaXPUD992{vv9)PoOLGBZeFxlWK0#l+q@0-)S
z2bUNw6TTkm@A@b%$=bmBA2@`uVS$LljYt;0AXpZpmn0t&^7`1Ez+68`Ry`o(uEK^*
z0#k(j{g1<<oMFE9I%Fa^;o}dUTT)H&X$6+v4mQ|m)$7d6?Z#A&2-|P2r>!MTzjg?a
zwD`8oq~j5G*9IBKZC{r-px@KkyH0YKvJmv?5cR{Sr<-#)0Y=U@%<`=;&?D1~SsyaM
z$(A;e6a3D1`@EPi=-ITRRzsZTlx<XQt*orTt9)i_N)d4tEh=9fdp3o#FEC=w?Dim%
z$Ks*#Bs~=YBZ-)_)365*4Tw@NEWv*39C#qgsX&NG;ARj?N@qQm-<BOp9>Sv`G&7j|
zl^gn+bc(V5a$d_^n+A7=RsX}`@b9P}_|`H<;Q;)K@=p(0vu*LH-)umP&T&{n0?1I3
z2Oy^P0@12CMYA)<iF_9PGJFFd>CYnaTjI-tGL7g%ovp*fZL9N2={`Fn(1>mgiAH_4
z%ruD%!f>X1Uq-CG@^QCAOxt~Y)*<a6hW^DM>htcz%L6&8)ciNl(r!{eQC?JXO<=a%
zdqRPl5Y|+NSZd^xa`xw6)Jc*Jk13zWE$vjrG_IJOs#La$dIITqEs}%#`&cjbfnfXy
z@^d--&aIcDu6^F0ogJWEfBrAN?mL>z{}25B6(Nb8h&^M}s=dWZP@^?VTUs=+ipDB!
zDXrLhm8x2`DXLamyNRv#Rz+ivsw(QEs@%T!Irm@p@BIGEAIUja&Pm?ac)g#Gsh`hk
zzbc&Q7PIHY&>l4t!}B4T(nr6&4c&i*J8bq9i=602Ub8H8us)`r7M~JL8ohMQ+J@O)
zvOA{fYm5PA1(NON;{mFoM9nX8D{MupEYq*l%Qbe-SsTy*dqfz=78M%|1Hal3OJ{Tr
z01YT4j|oADn;OGoMW;){4iA-C1E@w$Kxq$GS3TTO)Ej*ufPF8L@AdC)wVSjWUv@b8
z%9>J_^NC;^J4>WGsZUh0`+2{}I;*LZsXA#ty}_>18=&+nP#xBH<&f`P_*;o72e)QU
zUBl&s;hA10IhXBwIT$c(;&WXb0AkfIf)nm9m6~Thc~AD`CYM>BLev)$<VH-mexhiq
zf)qa19Ctk2_JKOKYb-`~wL?EbCiUGzQvw@b7CWK*w|Z$ov}{7Nev^1OZ#rH`FF2Hu
zL)5a6gHPDuwI1iHcC@6B9i7XaFvc(ymAV&0_q0q<)L;J*K^Fhq6CJW9&d-SY1ZW<o
zIXEXW*0m$Hp#TIJQ2^jLN)0tk1aK6tw~KzUI8Pz<%s;)n+Pz4CM1%rFMj{ME#SRaH
zuTpqjFeHH0LP!t5%?gy0)MILiAQTEn7e&+?>(c}Iuk;1;F%5!yU;v;1CO5mO^v%F5
zrr7O^;QW|6K%`Y8E^i!@p#TPy3D&(L^;mt-<t!YU9z!Lo2BopUfB*)7%IYj|G}^4t
zloxmLiUd8pp9l)JSps>_lKFHac{I*sY44swr9r@>v=|5&cBGz3c%YXf%)*tg5o<Se
zPbW>B10Xfa0i%1S00r81vqv<H0>G#RVOM3({|sF_1ej9FIpV7Sf~y3R=uGnU4aCNv
zocZ7Hm21w4$zG9VxqAu|009{`T67J+7%qo|bG{Qp^nU_=!#AJJiq&cDK1_CP9LU`b
zn8Eyb=y19scFy}5Lxhx`Zl<B5=|_p5i^M}a8~ohB{d#KmBrtB{?e{JtXfUD3CIBjq
zV8j7QLGLFuE}#mcaCyy3jc5*WBCD|~OCZ&^0W=UJ$305gTp`l^ZC<;q#IjYdpavCH
zBf>OO6@)(u#<zdbfZoToF;9MAZk2<G1Kf=t9|&tFhpT7ubod#4JQhxEy4)_24FTjL
zICHST9tPOdWE~6z`H;NOBvn0{b88z+SH7mwyujN^6_(UCBuJYj6oP~i8TH$2(i)gy
zUChTd%#9dUEO}88;fd?G5*+4tOnspcVHrZb#nC+T%1}5IlCR6EuEYY;E_MoM2~;l+
zQZcgDaD*uXu+ZCzs>r|^ftV|c^&O4EskE7&#uZhK(z`Il`m8o&!|>M}He@w|h;ngS
z05QMZEj;T%CyChUnEqP(vI_DQK&yseR0CMHAPnW*erj6D-!Uox(OVHA3IJkKsmv%6
z(vplU0D;xQKomJofGA;vSO>S>pa$?U2y=b3XnF6rUz-4@p@&kF%>*QEMQdv!^`TNK
z$_8NRSGNn+J=ZGl4N^+w813<kX?yDQzWFcFO~2GBI4!`2ino!oj09EnGawOrQcYfi
z#M@Z@U|`=Pc_+a@AILE?4C13dalhk%X0-PG2)oR>dlmpA3W6`M@#~`jmlLmBK=ejG
zpwx(V77$AlY}Jn8Qan0~Arw4I?Kuk08U#W6B12jL0Hz({PjnEcp~Ddqk=NAwXzB-O
z?yC{$ENJw6h^6%r!U3xL!U))&&ZqR$%E7CarzAMCHBJ+Hi}hNa(tw{^#EcV|S{&%i
zF7@MVPe|xTOZKaVf(>Ki@I>mD!95UGQ|@u}d&S;ZFhDb^`~ys+k_&~gY5+LH!i47Y
zC@Gr72%zLIH7uqX6l3aQQI~cZk#>KW<qulyH0m7~pymu+0}o#nLF5+qY=McuDBu|c
zi2(y(xmwd2bWMDXDQ>vFQbmuGSl-#pX**m#fw^x{M}-TQsv_D^1MiE5%Ug#1;Lv&=
zqAY;vPX|`~hQ<h*4+@0BMx(sNV*>lA{g-1gxTvY%{%QYFR^3n#F08=1E%9=ycRmf;
z`MHCdCDJk~L>PgOQ5LO@@=r)bxS{z1qu8{f?=_B%h(sa(KyJXVvlc|MB&KpHr#ft6
zxoXFdf)Fv!2zqe<MKi`MG$i$_1otaaS~5lk{&H%IR+4jqX^lR!YyAA?p9`u8@JvHY
zcu3r?p*FswqduVrGy)noCZr-qbL6Sw<RVS?p~8Dmwer!t#wZQ7iT=M9+W$~De8xEc
zRA<mpfnlIRaHCgDIOo$z?cdy38jcW){=B`2+c@h_Mpou)ug`8zp*?QgYC}oqrg@XX
z<ZPmKW1v<65&Flpa`__GSF8*Zr!ZM^j)}rfTGODcDSZj*0`YgaAM`hFOiO^MAwB>k
zAH#wLK}plICIvO$r_C-sM{r(4)R9CkAygV~Lh}1%#=x}VfZ=JBSR>F-)Z-8UqALfu
zQ4p<6s&|@DmCP`Ht!P>cfGOY7!-d7QtqK%>6K_BJ4-Y;EV}P1Y47D5p^pQ2GrT^Fh
zG@L-yB!Y%wgbW3!*#seKMBm&naLp{eO&T*Nkj*21X{C8F_-echkr5b8zue{^P6WYh
zknZYlzFv*Be;##(@u}QIhTHAj6#1Bicz4q|A@>N7g*H-NBS{N-^~dWMZR1ERkmjlK
zvo-$(->uz2D}_MNcM<fp@>!$z5eWKFO*V)z>3#Zvmazs<sEqJE4yBSKYQ3N1w7oqs
z3gNW?d8g8<8OddDMrY*QZY{rUo(tKy13&{no|qPNJvAgz&IJ<+^#N!{Z&pp+emFnN
z5;}FN3xe1H5YBqp6hMVDlqLo6L_!#Ci03qJYFul;w_M_#dV7|@P};q^nx|Koe2CB#
zfaM2G-4B{=MmyRRA}valHHC<GqN3%jmGHUnZ~);e2$dA#MFc{{2B6D<%-aJ@oS!99
z04V$mtcd2aA5c8ipZU9ycF!KB_VJb`@y%sK?j#0@zs5cKE}aKpuSb9CzWePdu&5D@
zf&qF;c6`|RiOlexMB4IhTGJxCwwigv-|{bmzPM)&mD2-2K<MkV=2*q9Ni9URbgHxc
z0@wy1Yd~26^EdToo)(bG%U?i^y$%+@9Cb4t5q%O&q}ps<qiKy5rhLc&vKWa{r8JE2
zIS@>XuXXlR=#EQ3D4+(MUmC^<=nuzU1~N?5FS`Ov;f++~>KP?8<U2qCjnkQQD%%J3
z{E2DSKlmMj3OSsp`Y#M52e9m2-0vN@o?@P1PXsIgts_$wTcBf#!gyq*`il}q$&$SU
zvnqePn;Pjzk+2+%7ORjxdLX2Zck%Uc3G<1ZLz_M)QsYKr)dJ(!D`b%CR{R;@{`m;D
z46Q#(7lPveT}{+=HGq5gHjk@47oG_6(f7sG3S_jo!)&!UK_A{nP>o^){08g*YOynY
zaLRJ(B}78d#d;L}K{HH7<pTC39!pzDL7Y5Ml#%a44tpEkyhIcG53PUE?Yu+<Kfn_X
zy)*#Qg4>>7a<*+PYGIxn(-uuNN8!e9*dT2?>b0Pla!1x#GuBZXYIrvkg`=*yle(};
zl@~Rr0re?0H`BH=*G_a5p|uc=ks}q`C|C=o&?wJ>3&KJRZ-Rr>Liyp5;+r?_!osU<
zw@aUSgzSa$%SEb_B%TA{@cP&*?&%-It1kIW574<PuL05yM1h*9w!^RFcxOhGQ(=TF
z%bTUQCF_1M6DuXQH2I;4fAJp=Yb8*vFWEFbMZWr*Y+MXGK76$C=$R`u3K96|THO@{
z-SINZAAIVh^NnLteq~dK-HNc!S86_>^=rLv0w4fhY<TZf#|Ok}Mkfr*!p<DHB)*tk
ziaIAGbP1;s8N`XQHd`lbw*0#^wHg4O0pdsJYIagVjtnDC?%nfE_q&qRRxx3^DU9OH
z)I}HjTaF?2HXgRy5&4o4Z?r@A^T2mmvdkzR@oG@H%-ZZ@)<#n3BVZl>beDB<C5?U)
zii!fId<HcFN}{QaiLO(g+HGgI>HLVXR)FI%p7Qi!SpnyFYQc!Wn(){COB&OD8@<}m
z64U+C^iBgZccdl>OTxG-?FMNREsW7Xu`;4O4gB#vH6tf*X~5{>ZO|H54{HKBh{$!X
zcW&_$0^SUQ8?!Afz3Ne?dS>P62KwT#<tNqpf-TBDAT*0-?=dxiUH^$(qMUbNB1JRj
z<2JV*sfC)!(O8K`IR=P@%!dCwqm<-b%F*=>>+=f<@b(OloF@J}&ik1?`@-Q5TR3U$
zZDurg=IAxfQXCh%yzYJYQ;6IL>dL=VYwSK$p8#qMa6bT2X|?CRd)tN$>L_}(R)dNz
zL?5h1bSG(aw+!|$`LYB;eiV`Xcz?0H^c+bu|G2tzTVrex;>3a<Xr*s66(`cn4m<3*
z!FzxG`0DGkd$)xVRI67n;QHl6S>89lXKpb9HUTlyA%<x|1uB1!%n$nk=pqq>CyJWN
z!QBzwYHDMvhg0yyfs?eq0Oh_4-p@B7jI&n{o-S=M_kaw^P~Viq^M^H&NVOMv4)25m
zy~8Me@iPY{XHkx$u=Et~lhRmE+i0&p>|p`a3)^&eW2m0GL2r#li^Gb1xHx$0{GmT0
z0UW>tAE4sg0t9@TKA`zC(9}J*+b&p)I{?hBk$3nVU<1fks;e9?(PRST&SqCxV$ihn
zoD7jFfJn!A7X$y2u4pd7PlU!04J;sJKO$93bDjqDQV{W?+y1so12Sr#IBi2+8gyZ|
z!c&MKcmPY&FWzsydT>p;Mj*9>=A#zSk=E>h1E<=%Qp@S*PPS0e3~6DZlDRwY(|&mT
z4F!!7d3{d7H4p+{DElT+)874lW|a4xFA}3I@KNHqjaXBX2*rQHTah^d4~w{u$&bkd
zvt@!DE$w*ALEa!4!9AXWj)VAUw)U*hXL|=`YA>{K+gilSY4AT;B#x&`7l3VG^)X~s
zC_`)WO$cq~)o(wupFv`azJM{Ht~BDW3F37akr{|Fg)#94D4>Y%{SqN?O`lzS3>6d-
z5#Tmfs78n6dY~3fMGB>YJ+pBR#{qh*%wNPa12AimV2G$1=iXKUI1D_S^H<j=^g<GK
zm&XL+COR{b(zXc}xVY|ntPBj|0Cwt1ybjP82qLjW10^cbm^Z+vx+e?F!$K~9rb(Cw
zK^<5gy#y+V;<Vr+0-n?HEP(as(fQ~G0DxJQ&>V`yi}5-U2BYH|@%$Wv0h{6y6e*Qd
zXqYDBd7`vES#hiWS-^6{r`fuD6V;x7Rd(l_A0O=g&^Y4r`1E)rJJCD9EBN!j$iRr!
zBXzl%y#LNh4ZiJMn*8YZ@~v##1<KWYEd1@?g_E^C;}^1UqIG(_zwvR};M$9&@wvTE
z(I4~=Rh!ZszZhaQk(p`@q!%}28de{h$<k-3FiICG!(J;?*i3UvvpML;D}??K8+0Ej
zU&gz)NdZJEaqIFS(WrExq$^!EEYa{XQ$L}^jm-iw2ynv)q+a0;EOvia`%xs#q#bOK
zcFiMPkJW(FcRp~;wAY#0{_s3Mnft6yK~Kz5;f;Z)4aLexGt${H?v?Ln^|DvHg8#3R
zC2?1^D*p(945CAq=Y0lfG5ICGzs!LdQuW1)Q@P)W<i5BqnJrdsH@BertE#Nz)rs0i
z_b30lZo=NYsc7~fJi2-!Syj8OO6PIcC_lQYX*+95DRI>?OQoUCwO>qY_eoWCdR?<K
zv&}fIf$u;yT}8vx?I7t7rp<9u9~W3?O<5P?G^*Vx&x5KPKfAW%a$hb-EanVS*X@?x
zeuR{68(7Yk{q*moUb-1XuPH~S;R)VL-9Gu6Erq}N1gc0s!ex(oFDJp&`aN!W&r5Aq
zNWO2zz&A_^mR(gDB35}W<@Wh<i{@)7F@3}XZ$Hx3i0aEKr*%z>ao#oMP$gezTJo{H
zn8qyQ3~g`okH3nOFFSm7MP=`_Z4}<RKUDVmPLL<JfS4W2LoWj(qyy`*8^<Ndtmi{{
z+MO`Z5wC&4P@0NYtjKJ&;a4mMoOQ<&!~7mq_4PU<<xA0JL9>Mh%J!)0Z0&!USF^P}
zCm;OrsxHUtXBIyCRjc!zm8F~aI9RclceyXhTog~TOjOA|9`7#q{@!js=otL3C74X5
zqgm6zqI1e3^3x%kTgz_TjPneJ7v=mZ#r(1U<5qo`#5hdm8guPXYM<g|srtc14+>^&
zaIOk9AUu~#>^`xaKhL=%ZN2%8`uyL2%s;$NN5NKuf+qOQFxe+H3?Vo?(_9LT_I4_X
zChi`s<!CpH-BLUo49l*ZPx-BDlrv-fBS2ItvB|8wgSEovzPtu`LSHR!Uq6;hA6ZaR
zzDoZkfDrTx-b+hKkuT~mg@bpxXb*kE9^$a9FFC(H+5<t%oy~*9QlfM+OS^P4h3Lw!
zzm`Z}PrhVP!+BZm2B(r*__9CNM=f~8(=iI{)=-o5s8yK%ZWMTpTpQyZcO4}(ZK%Gq
z!lDMJdSo&dZl?dv-_Pe3fxi~|<)VvLDo3MjZNcy9Ocgh&Zph|a#Atf5g79$brA7Pp
zxBcm4GspzBp7(KPD|L&8w`X$sT}(mR_qckfiR1ZWXX<cIJTtpAXX$;LG=}>{qfF|c
zYytiCxxbwtLEjA-&1x{dyoNl+htU!>6y}}A<!fi720BV#Xw04{m>sK;RpWfa<d!fm
zkA3*qxne5hua9!5k$Q#A^09WMmRaFBy_04rh;|<pH`7ybec}JVlSN}7swp|1`n;i7
zRO^i~Hg5dIg_9+t>@M21$L+GcoALfvW{%AgZMe!7kJcvWg|lDm-g_1(W?@5<NC!3_
z!b6m8sI+g^^qV*rUJp{kGM~arC6@9bE(&3mk(6fnYD~^QBL|K`)H!{&LT{pG<O=;=
z;hCoK_ZLpqWru@`nYR7+@1Fg;j00buC9`~}iPDmCL{`prD}1O;TC2SCxOe)CnxFAh
z(EYSM!5(=7m8b(sj<!m6g~e{AKtV!c+1?m4FA-kfniDN0gNXb+_Tj^aHfb-v%C8H%
zk09?tLEb@sv$&`~Huh-AJb2g=wyN;4sp-XK-`s0=zU5(P#@l2b1-8uZJWy>M9g=zY
z_Upp0U3R7)b}xT)<R{AQ`0&3>u@5-(MMD?&9}U~ue|NOf_}k;k7g-5;T<xnjWAG->
zRIyybXOxC_FqFgu`9l9^FK^ZU7kOHDllGa!Yv<cGciXAggVg5nqUS@8oIPOS+7U#I
zV6YUOeM;2jidr($bUr7GHICrALw4B&LnCXt>Gc0*V;G#ecHS7c1b$)m%$e>pb9kZT
zaPWG{LhZG;9n|!1B%aqutxK`(LB^l=Ycd}Vy3B7T|8u;>C^hQ{sf`VjCW;%}t*X`Z
zN-xpb9PD|Yhhe34UGt+FTUA6hk46pON;j8tnY0c}IRP5FWPWigR7Q1dv@I67i*6w;
z(8?LwN>4~>v1V>yZziW&)eRF1`+ddU%11OzGVXD;+8azufO56p+wV7qoRY8Q7rAq5
z83pg8xW+mt72S1m;br-IueY?W?r|HRWm?wIkYvO@&H}ar4?3TEzq3&>Q%g1TR=B_A
zS44O5+ueut8d`0`ay5o&t>RKVNk8P0YyVU0b-vY@{9ja-(jni^aahYjJ6ZQfMIy7{
zpcSJN{V^S`=4RMpQ&nK8np*7F@Oy-4t`s@7K0TTJuY*p`f0+_q84fExeVL%tU-j|x
z%z+ngL$H!;@*h8=uesR&O7E$itB?A&xxilwueEe3e2MZpkUe18vb1V;OW;2&w+!8|
z`h=do`xhT?v@n)(_9fGD*x$hwz16<sKh~S~u$)F$?S6>HJahB!YUY+%@2^TFE|MyF
zDt8_Se2Q6=<@+zPw!`y6wOalu<MN*8@LNmJQaZhiY43NYedhDj;N^d84TFB|2lQY4
zKWT;JIsKGBEG%Q%Dth|l*^+QpWr)^}F<X6K`_$Gz(8odC;-Q>a+u>o-({>s9(<P+N
zrpqUOU0(`i<r_cKXW3^TP?pY{R-aCGc7tF;ZP#{$zn#ofbepxwp8Y~*?XUJG{uxO=
z@N2;S+YQk<U6BnTG(9^z`gA@*@DBO6@_NBj&G4KiAE>537`h8$%C9cCQ=vrf+TD4G
zLQ#9YUic#L-xX9fV`s1D)s|Lz^X^U-3hALuJ}k=Or2j5$5~@Hec84!hi43YNKr!^>
zGxXe@@{AkmGSFzqPzeU}{w57K=v|CkkGpkVnjc}{$G_h@e|;(;$nwYrMTjlQOjL0L
z^X^#XB@XjQAcm#%zBQ&^-qhn5y^Tx~e8Y=7eI>}n!YNr320@Rg+X||sGBGU?5q3y+
z$~DaxEAHKb66^faKY{{|?8<}j6&D|s6~=p%${o|WM$zMRyNfbd4$MKFS~|ANrA-(K
zc{Su!40iHLg(}U4$p(YjBgm_*mSX<KVljo>QXp{;A*mk6$(YWAACTidM^6A==^QrI
zhLBxe{(2amk_#27xa!8(EB~AhSz);5ZzzxcqA*S`ebS@2D<}eEk#k)!9Rk`5dZjB2
zg&y^$mt$U04AeTX;V+hE-bQmz0uq+Jsy#i5l=FD_X5Ono;kJDIhuI-Qca(%bRty)d
zZAZoKLlGXt-sq27C<j$&h6z^O;vNPcM}8}X2`ex;!7df4tjA0H3qP?I_Rhh`p7rpi
zuXx6+65LixfWjw(of_AB+x0^irdCS&MA~XZK8$`5jtSeBU<v6qSKg%3?oK9bikM$b
z{_ul5m#`#9#3C(Ly(mskD1hpEk9uj*F2Tezp~%?F`Gfx|;nWGUZUa(}R*4CdiNJ=d
zI}2h~v7*irS|Y6hN!+a{uT3!Ay%WtFEyb#r6%(dY5z0LqrrnT)<B#6TXUa%-wxJWn
zudg{Afxpi#pvyt*>BjiDPW-fia`3r{=%C)clg@h{oxT1YnklaAxvuV4!wut{1T)FJ
zxae!cQECk?+s>BQT?Xx)(1-pYj9@XLs*}aP104_tKi0jo?IOn7aVdbwo52~oy(ZG#
zbIA?t{~+IorL2sI#B6t>rSAFFQM@A7?>#T`C>8a{a(z;_-XTSvH7P>)hf0XMTz*Ru
zZU`r^c3y8T(=jQ6XSzry6^JQ;RCc3G!<_C9L#{r78p!k;c|j-UAx=-$nu#SkM?gqZ
z2ZP0pW8jOA<ZHM{$s;4MWsgA&JJnM<I4D-kQ>wGiCWSHxx~S4F9fNuO;fd{5%rUyG
zB2-{?ICX5Y@uFMjPH4R3dDiVUTfaU7X0@c=P4VOtaZi$s#C!0I#f=xY-^k#%GM3Ap
z#B?(3gv#cx5{_mV2FZ}O;nD$v{1GFXxEB(GBy`H=97T_{3d5{V9?L1eezQ}vpMfc6
z$rC8CIMHK<nQ2x57-_7<gNfYrt+8W~-QzdhKt=wpL58cxOAn71R|jb$dKJV4!tGfq
zrS&*+NJE=tgy0IDh>Anpm@4%q=OX!HT+=rXdAs70ZAGYG%_V&Yu~r*59FwTSGmi`I
z#^<)ED|ackW;p>@7%)#h{B0nw$@Cz})WxBc5WuvVFd>X9NV)D7xqK&hxa`qRxsH)u
z^chk+y+0&x;^57BMJ!c03*Is!s<?ih@xtQBZXUk0L)MVC5L4phj2(+Os?<5XU+HWv
zm=LEz!Vvt!ygjVg@t4|mu)-JZoIEoEiG&86dp$a{=f3;)ea{{eA>It%&n2qiK*X)6
z%d=%KC9g{;+YBz25qQgW((k{nCJeM!6>x!ktCMwLr2!GW1Fju&nN_3J;IVP%s(pO;
zcvS91+TtWU`cc@vyLhzFr8p00LDGvF7KucDi3CaaU8Sw8IjZ!dP489a^G#+>B9_Mj
zi#)ySZFIY&A~gGrwAmXskUW%XDO1O!ywM@PCaFRqSa9GZT*lu`RoAmsrerngx=5{?
zr<B`L*15BM<13vV5UIm}T|MD4`Fi7t-bN2(Q)Y*tL`XuskcN>pu1Kxl9AF{!Yw#Jq
zQn0wO6;4+bj!0pO+Vvu2R_Sb3tyaI%X?!)XAN8itgD`5xxQDCE+aB7iTJFhIlb0Q3
z&yv#55&RQAXW^2$6Kc7{x}8U2@R|RwgCtB8XE$A0+TO{MG`!dn+kBOoI4w5Z6BQ{`
z)p16D@yqFQ9qXd2>J}2#zW76F!1Az`d)algOcHg<Nu34+j>+$vUX~m`(w6wW-oq-#
zWL_0CQ)NoNu4$JXHmN2U?P_#SXm&>_`MY>d0z|&(rS>;jkg=U4ujU@eVoo*FS6z7b
zc@$&(&o>EIb*cb#B>B?eUfcQrFDW!Pk65<jb!WNrO?79G^cOCK?6!={SkjQM$j>7M
zII+7^Sjl$0nvvzLDNk=yr{FKx{qX$<vemS<Y?r>EMV@np@AZF<s*z0nu31fI==ob$
zb~?*&``NC)N3~9)S01@~C(eu2yI0-6)5lI%)D0Y1j-mSV4sPQmk$YY8?f4c|T?70V
z18n$s7?YV9cG65mD3&w*{7&=jJ38}~8_E*AG3G0aJ(oxrMw4;qtqOP_JL|cE&2OSj
zY%*P+`&b@EVP#y7<KRvCyEiBVbf{C|ziZ0QY158l*?C)ZuSvpH7|p?OcojzS&v~b&
z(G+1-q4&L{kLif?3W-nAA^={C7>@cw#kM6SzeTNdBGaiA{}bA=uPtmhy+ov$!t|8y
za|-*?{YRul&In$<%PaeUz~GDc+lg?B6_NEt>eODE@k;lp6T4Mo{9icoQ;p_WnpWZz
z)avlPb8`J|)C1n$=W$Sm%xrCuS5vQUKA7yWSTWEcuD-Wf_1rP3br`<K*!$=RlD*c`
z9--heWpG2-cl~W=Nri&0z;nZaD5()Z`e)rfm(o^E9R*cSuoROw7yB?oQhAM04LK;S
zQ3^C-Q>DlH9@gC?-@o-@g;)PTV);<U)cA#6Ebqqfma;j=AW6s2SnYR|?C5#2mgI;3
z9x6|<^jbQZJ(qs?Ddp(<B*e;3h3VmE0;Y0vsZ-yue@!mU>Z^fP*9VV{4_-eX&G*ZC
zTDXMmfAC>e^@ZkoPZ-c~e0(6Q>X$tGSfR}C^Ggm1Mjh?fHj<_na@Hen)yJO@CAYVE
z`$V=^zcB1Ln>&i{9((&dRt@_2F(|x##4%JUvs$H*E2N_=c>JF2C)JSuK89SorZ-^a
z+q$I@T2VeXxLomHh^$(;YCw*Xzp_5|hD*nwlJwYgZJ0)5l($;6u%X`l&frcG1J3eq
z)X&Qr33nbh#=TREcY1hry2tEeW5S49;!I=WH?^dV#-yKW$^SJbpR1)nn^Kt1)l)f|
zQU%nXi#0u$RZmlGO4CtKH*88bSATJ<>BU|3jC)NP-s&$OH@yr|&-}kQStIJXGflbQ
z)blo)@_wqn{;%ovxq3ddIiDF_z|mYFfG!kkE|f(VsWunspo<Ngi_Os`x0*}tqD${J
zmwKbi9ygbTpv$A1%ahS>UN*mZjjkwbu6T#8{McOi30>9OTs4AzJJbC38@hU<x%wyi
z-G9yR&e1i{mKtV_T8@@l0gXDbmO5FDdexSTI81|KOM|(_`&%vV@BV!o1QvJekj8;O
zgtWlM!CHM$q5&Y*oWD&ISjoPq#_;o&mVs~bIUrUytR$|J8-ryVC5seyh%}O$=)-hO
z!q_n&zQK+b0nI<;@FqPnH!i$&gDi6#t{Kpx!`azJud5{0%3-0|@mTYakE*$hiVuV3
z?=s-G2C)W^g^W(yyfvEdhxPVq{tDG(&A}>7wq7V&eMK6q#4sIPID0~<s?<g2t#$0v
zqEt?csFd!=-_D_f;Gtf~#Lo_aoR*P|i>GgT+Jgqu-v7Mv!D>5tguc#;?6H>f)5j@#
z)9;?nlts@Sgulws(j4vi@=i-V=IP_UHXWkY;#bJG3CQd{t&3LItNb<{&a<&^O`6Al
zrK+%OoO&d^e@z>w@))w9&$;eUa*$W%#mLRS)dK^53}`hx{Nn48$!WR&w`W*SYqhAi
z%}+DU`dR--&(=XJd&AkIc`8;Qcyr~M=b^S|g!ae;2rXx<lk@jNw%Qic&Kn3v;lep`
zumtMx)%)beAaMT(73n8L97E>pGms1j@h0l>2Lz43Bg@b0@t<NJ7k3CrQGK2u|J`W)
zt_RwYjoq2(*}6p*f_0F<)ak)zu>Uz(1)uI%Q2!YKciZTOF$;4CZ@P{NNLcjjr5z)j
z$<HkE=LcSHm>a#geCf#PPpv@vOGWqThCt*!v;TvWCAd_wzwW}Q6>`{`(vTH>j%t()
zsVV6wea>s_Lp_5rz9N@dYVGuIA=_mqQ<Tu-O748*%l^r>p03pX+NiW$)2i#0G@C~p
zl#jljnx~Y$J79ZLkQvHHSFLKo{v`R1`&Z&7jB^<NyD^YKsqSsb$0_&CF;Wr{>Oqi&
zN40h#dtUBTzi$ZYMZ;;IfV<x;@2w&W_7?0*nwEQ0Y4^Wt#pgJG`a<srrlI5Q4|?)v
zH~W3%o6>PBD|d7h<6kpRpA5~8FC$a@PpN;u%{H{iG0U)xBT+GG!pYQZb}3{CUogBQ
z$4G)c&TV=$>}^?9AvkX`|JX@Te3K$lT!;CRSj<FIOBdHQikD}LQ^Nn^KYwm_drXo8
z&#>Ovd0S-jO6B#?GRfzyn<++>N%}Fmm7;<%Oza%)^yo^j&eY<rQ}T0>8M-i2mF2<)
zkIyJ$?gzq^40p-}<4*BI6;bILn}Qpsuc+fB(v<2tgNJdyG8f_oS)|#!D-m(eHU-~Y
zUEUn)u#ooKzL#sb-sjHmOUELHybBvIg_{fWzL>mjs>L>CeZ&66jT|XwM0&K52rSQ5
zbgT<ymOtu@VBfM~F1VGy*CBx4+7sgzZy-e}OCQtjr!<R)K}YmR*oN26FFlWJpBF~<
zW*hHl!sJnHZ!2eX`nG=e`_Du!8$T$p>CCn@5`yxg_fw*k9e<Rp<ej_iqiAehUfswL
z@UH7}O_*kKd`pMjBwEu2?k{}28<PL_eum=p)D5_}nX^^X)BGTsoG3=WiNa0T)hqfT
z^DZ+27Wrym?WEJ#{TZ&yN6_&redJ&K1dau^yy(1~Uku*5>HeZmGXjg@cTTr@)35yr
zT7O>g_q#LmE$49q_PccQE_}B9wI|yyN1Mfb!I&Q+Y1i5jy{xxPYP(rq-Tue3N1_qP
z+3R4u<uS+@NHEH~!`>gBq$3&|lc!ukDm8wd^umb$d8-7yQufH~_eInjzcf~Hqpq9&
z;{~YR!xx{YY&65Tlh{WTPn#B|v;P@)CsK4CbB)IwZ6$Ps6{H9ypW7b2`Qtj%Z|lYw
z=Kp(KkG%~x`Fcg&So_g!K4x^IiXh!cmF>LT{o#xs5r1qJ{RDQa7Eb#OrNU5*>u&z1
zmW?6?!m-vy>?J443?5Qry^=M1Fr7iHfX&2h9p^EU?%)#7OA9?wm6-SZBs`O!P4w4>
zQbxr?9IdNdq)JCkgw`OQxo#878Uc?~H(K#gpIl-JoYfOJOTmOVj;#eiB=mfppN5UT
zDDeL;Ra~oB<ScWnrq$w#H}xA-xt0ALf>O8SZA5(CU&N1m3;3qdQhc+96Zg;J(mJ;u
zff(cG>}MF3u)#unR$AdjlA1BIsmEb92x-`dWqLDOA?e@Xbk6yYTom}$`>IG0Oy$_7
z8(AwAFO$aAdRp5fxy|Gc*|K9@fkoaSg^Pf>T*e6gO35{)f|d`4PgokCdk-$L9Q#Ca
z3uP(;Kb8>3DUsa4^3Xe!PF4>aL$N|sqDP;uz=@G4_GIaU*`S`6hj^FfBZ)W}kpo1s
zI0W8rYvz}S%-uT8hT9g)2=k|2$(p6%8`pm>dX?HtYrj|CvGk>ze<j_k1f%Vn_k^GE
z54;AX`?OcFe4>fJu7EBX^&Kl{c^`)tp4F5a6pf7qrMp~>*^cY%xZd;RO3_UTbh!?T
z2ZIY^aZ(ud1oo_a?20b7@a))XbKhEfZO=(~fA*eS#Ce?Yx?1#e3z)TmDz`$<4G=Dc
ziczwF$oMQp#KOnXr7&r|AgWk~`BdCp`bHgta)RQkw#h6d3gwOcE=zQ~MYxIy2zmy0
zewlrh`YXmo`A&HO($B`A99?48$<JOJdt=AZy~B+CiZJKTh_X5+-*{`K?L1m6tMBei
zNpw|#0D`St2llyJf9aj_Yes3azl9^w9>xuk6&)hn26FsEA3iYW-n!8<n(P{?8}pZv
z%8nVUTr5;!t{8$AH(&%`=?bbaTe15X*Co%M6eS6Vndylb=ddM$%q=+MEu*byWUc#^
zKbA<d!ZNC|m3NF)kO+U3nac=Um&&-h6%-E@>D(YyS!60RTq2{ETArd8_Bu;XEDsSW
z$LhrVbfAkj<<0xB)fcE2+g($bwKtz2H@Rc?uHd=uI3izjc1y7HieDdd<hUQkyN@zl
z4t7bvhB~s#B+VG!w2s_BMBweWM;|Uw*N2II7QlK9rP$snPZx21>eDLYUQiUtmsa>$
zL&eBe4U{YI94!zw8-ubwYSFo|1m`e)z<)4WaDJnNPVvd^Is?nPeC1B_qRlsgZA*&Y
z;1<7yCYZOM{z^`DD53-2`>dv_itk(D=lFax$vA)5_WTO7u~COm#q+!Rfo#$oSzUS*
zwX{IZLa4n(IQQHbv*jd;p`BzX`h*xMCw@M`W>8)r!$N@H8pJTFrI#WKEn>(|IBQf{
z<zsKm6YlBo%#DeTa-PY>-|?Y(5SFR0L`sc=OaIhIH}xj_DeM+r9Q!6Dwz<X7D_rex
zVOJE^a<`5-@cz-IQ{sPD_r_u`4ZcSm=3Uj@TzVe9*MXSJ?3d}fl2I{7EwF53sCBl&
z9DFR6^&K9q!e0>eY}0Aw?S}v@rt#N-JG}y^83WD3(Byxc;OyTq#siizp4s1cH`HgE
zu+O>W&02+ev&66Q7mk%nPI_;|O<fUUHG>B?I9)UsnnJXblFRDnw}0D2o5-{?rQdt{
z{qz-ds@`!#pNU%hfVOk)%EJmbp>l!q<?;ZdVuStSZ+t%kM*^>l1&LZr9&A2Q-5Jjw
z9?}xg<(9AQrV$WK@)%`|8kg(7qyU26n(X8VYV1P86#jgUXB3Ek4W6KXK#vYsVhE!!
zS)7a|c^C=vLv(J)_XOq#!u>8CWa>@Od<*(^epVCwvxPlO@b2>j(DAxR@J5SItU9YB
zUlmMGRG~Kd-ew2cdLWpYKQ)Hu1DG(?ILF`k^Qn8E5W_`)_s5tzv!`|V0sf=f#sYIl
z$Yc>b^5PtHUY6-)j4*#g0e=JbD4_6nhT!ydFTU2{tuE}Yl-G(!^=}cGtaU-Fb(ud3
z7GTvH>l*Cc=k(Ni@CWFw<6;cu;xgbH-KfAad6(V!&k3Hn5QU^8Gb{W=6qmxQlQUOc
z`Hu48+gR>|A%S2)L>Dt8L=N_l4E-et`!bTV7wSQWWj!oF>MwZ^1d;i2=lTT#1pE&I
z*=oJuzAlYG2L*94y&d2!c1R{{u4FosnJaph70Ap&g94Z<5yzbb2RE*`0=TFY;uJyy
zO@-6T>taCY(k{5IF3+Q%s53Yi;r!<i&)k7wCs}Z_n`BXNTp8Y{Dpj=6H87nqfv{1w
zbrkXtpP5sWGY5k5<GEOeIWlnk+ky-PG8^8K=THz?h@#^!K<*VmO$y+JIDQ<7IRc=U
z8WC$K&<-x3KPO<hpJ4ta;P~6|Pz5}f5A2{Ye=Fw~BHz;6hs5kmruA_{Ojz>G{1T_&
ze_QOWXfv%<3{xDb$kZm>N6hQgwF0ZPs6u0!XkA*DC7rq+b_Z`hIzd7QiY|_f#KT$X
z@i_`V_r>LfE_UnR3>CCZ&Dp~<O;T9$$je#g+!>^8Z3Pi4nVgHE{|wxI4UW$T!z=ZR
zr7A_NSc2}@oY4-;>O*2x5M*e;^LxETX36k3W0ribi~Sa*!!i9gi@3;=N|q^zGzjXT
zLp^{|)*}pK678!=fXTmrlR{zHw%{SXdwb->XF_J(-s3sN^N9|!3R#NJ($U)$tf4QC
zznOwCFk(F3XDP<+t0kk*WRE?AC2j;gp+JCPLI6Hdm0?*k{zhPV>7Cn{0HFZ7PSTb<
zP%y8)f85DjLp%z`^F09s!laRe2V#5J@DnU|A;vobU@%R)Zc;#>;7gM_zU-i=Vozq<
z**=;}l8m2FOHPA(;%S>vQ*M4t%|teg0zcgn`%^4;oFH97KC%XPU{j9l5!Lvph@8ex
znF!L&Mqz}EM1pk%+OgaXc*r-F+-Wjf9F{!;W3`T_eS)#toY4MNPj75B9gLTMie)!b
zR4x%jniPngU^y~K?CbeZ0+wgkird7GFL>$Io*zvS;K|FXd&!#J%u?(;7O8H|dc{g<
zi-2ctt>Ns-hu7dR{DMeHR;~AV`G2ANXGQS#117)peOLL8W|ARu*|(cNB*u(+kBG*q
zgUh;`FSF87%S(|*q%|~_(Z`+tlt`!Ok9nf|AD}2OW}dCWWSrZ;zfNLMA@Jo*FgIhQ
zR0-2v%(cg4v(OG<T_JO3M}her;UnuS;2Rbk1MD(n=J)t13Xa3qn45iq!fm-!o^1G(
z_4>ci6X$|iqN2cKm_Q*@?c@Pdn*}5GJ&O952i0|Pk6i)AFl)v_fd;IcX92y^6%h+I
zk=r+Xsy|Ck18V+4wvC2Dd(c}VMM+UEc8jLYOjJBDSBvZ^+w-U87R)yo`N=FA1yH&I
zKJ5ow%XoeT`Rj_IhN?fA_)<^cY+fS6H(&o2J`_ZB^jNR<Sl`eUIP+kpVAvUSxg&72
zIZA?*hgS0stq%)0O%9ppmk^VC71KC&43@qEQyzTd4Mx|7QP*bGov|4A4G^|v)TLY1
zx7T5J29<G|gx+t*Gso0GJ1_@x1*Snn?jeJv*?k=uGAxC~+VPRhYe9wt9PLd(2fZWV
z)pynnc;-oqQ2kw0*Ak1&l5kAMe<z@9qY{1@vNn_BE3ew&h)w~!Z7Ek1x{Km<k|1*f
z4gsO!+s~(iF!pWY823ahlJE>dq6(DI34*H)t**^EhRpXE%YQ_6N^xOmEikZHW(e^3
zP>5$3J>qO-C(wrBV=ut<TMsz&Z{*6@-zt0{rs}i)n|;N=!&&gY9eLTA3^lFSW>n$l
zuV3kU$iH1`ZLDgo#=-Gx>4JD-$*Ru6xnUX#kf=dch5tmC&A7!UIargl?F+VwA=iF@
z1sKxhz7|}mziEcPca@q<zi0FqEyj#<WjP|#$5cwme5UUKlG7^$@;%s#^X-dK29MSj
z65JSBoE!tGc|2A(`KkDxuQ4QrzHY^_tdgJ9&IoikAzX_ml{i9?Hlg&jBp=E*7|YZo
zCDKfqPKFFUct}f!zm0sr1W|c-=cW6fpNMnGOk<wo(2W8lh3M(1h$w#;a1X^mM`jqc
z60@tPAEZnl;rKJH1-n77C`5EPEup-W?-caJ{kUS4`o-r*4%Y>*UiXk14HXdIl46Ch
zvPQ}7tZ_cS0v8{mA6C88vEoH5B;bXG=dW<Cf2{B*{*+H)J1ubfuRk4qpD~A%jzadr
z8z49`lmE^p{~oT&!0VU|F;H1>7a=15L#f=t^VhjvOC+&LGDXnpa>Ka@r-CV#X1sJu
z4kfWKRsOJ~Tk&))Avn{;)&*ni>jc~6k@4etm1Nv|GVF;GccR)8dZAd_u-DqI4((vp
zRgkO9XP%voL}<V*R)|tVrr{as<@p~$M}kL!7@1L1$W{&S$Wi#LfHKmtlDLxjnxV*V
zn)GrFWG=d-0qi7C*k0V?>XLkMu2A6dm&{Q}yd!PHJ&79&rj2}xh!zcmZP_yXhqDXx
zPW$<AT4rtXwh}`ECnq_5U&uPc6klLpf7x_@vI7BC0A1Evi>aS>;`~5Yyv)#p!OiEJ
z>o^O3{y^75Vdw9VYsmLGU*+^zWiBL#$XC$0;;-~%DpyEfRTB0r!auE3FS{k8Q9-=*
z=@rVLxj5O-`4N_W^i^(IRz>ApH20VlZulXsBUdvC<4cL!vlXxj?Pwi#MlR**HCBE)
zxn6@_<4;SY4a3afwPkz@&c9;+@y@a09?`A`^5?7azC`i6{zB|ev8$L_p}AkarK%u;
zc>*eh(51@79X!K>>PbuH+u|0kAoMgTq;E-Z+b!WwD3V)r*a1?uEuKAglYU#wc@y&{
zjiJu=bNd-!@s|6e-<^*%y~=z6*=WHC&n8F>j;Vu^$MJ);8_O8*fgVEr0&l~e|F|)}
zMfK@l`Kf$}Oo{1zoZ<$VK2hzR`5%^}X1HX!X1#xP7l{65qU?qsVlqDxTFiG=XQU_O
zw8r>jn?Z0tI|1wX&5P&dH&dabw*o-$$NxE5n!1u{pued%YPVJvPpWa%d?KT3T}<S4
zd45j0H5tvd<${j$pWD_vhh9`Qfp=d>zg$|$z`v^`2ViHEth~4`m@VQhvNvz9pIvYA
z@`HD-y&=4P;dXt|Ieqc-eaXE2X?FcDbNaLA`(N{ZF0%Vvmh-uC{_{KDfqJ`vk2wPu
zHQ|dAM5o<gZ_ePr{NM=h(1hL4OwQ2P`Jr#T!z*^f8#%+@=ZAmtjvUyH{FgKGcYfrY
zcNA<t3e6p*Ul?WP8$;TUapaEiEQ|^8jSJh4i{*}AUKp3<n^3f$P|cmtSeVe^o7A(P
zG|Zj6wlHbVH)Ul%bt`x3&cf7PzG)}>>3g};_ZOzU`DXm=XCCLy1TD;j@XdzX&qn9Y
z#xKk!^L<IP|8o8^_e=J|m)CrAMfP)L3)p$`9Bs#3{enQ<zqyaOU)$`zlK;&$E%4Q7
z&G*~S4`?m?E8xn)E{yRl%xEnx{rlRzF#rDP;-|KSZ~wj?@O}H9yEtM`Ie$ud_w?J(
zr}LopZ)|y#mfR&|J7wS><zMcFaJDSCxWv&;LA1{=6f9(iuFTjk3bd~XXs=2*EHBuv
z8b4c8)?Sh3UozL8e`DW^C9NaK0?wp$ECzB4LOkN9HX{oV9cWKO8Hnv%<Dkucl0Z7J
zIkCh_<llI>xE^%2@z`NA_SvSl_QvDI?NIISkJ~qspKbily!xM$wNbYC{VD&>$Hn#d
zXFponx6c>&zc2Aq_waAMc((CsaqBVvg|oFAxVY=7y|co<`=x#N-QwOaho1v^KRp+J
zPB`qn$=l=7+2jlP{%Ua_OA?rD{}p=nUGVPr{>Al)0<Ph+pPpw2G<Of_@BWfK|8Xtk
z=Z)9<8;kpfI)~lQ4xrx-usR2K1rCPt{xcPzw)l4Rxc&Er!|{vP>-YJo9RcP^Jj{`F
z5{==LBcHq#Ku+TSIuYq7LCozs>^Vz+%U;vBf8%Nh`CIns<ekpnPoMsN41q0T_y{CO
z6b3O#ri&t-gF51xE%fM^XiJ7EDXQD75?yO11ws$KS<%97K80-IRPyZl<tYV>JbFqG
zc+24z{jVq{M%{FyvBKWx+bZlknF>o+9}2tA@rF(0e-4upFc{>Vpj^q+34b<eoL<J5
z2C<}zq?`00ztp(H?jLnAno*%BCb=`4<}v+Bk3&UC@}}rS8lg5W=eCvLXU<^xH!A~=
zW6&l<r>+M#Gvm>kk-6QH35I+xJHiFeX{0jcVDK|^&=~`|VRNkbTDEo~`u+BWlhyK!
zQRBn^=VX1{U8qp4{L84>xVO|5&!dy1*|fhln5_}Qq}6=5HCcJ*Q<7H8(T`!(gEJ=W
z*5hBR1KB#s+HEI$Lyo>7%sTC-e-6KY{gkZp>Dj}@nZM`EI3g935iS%GH?#Qce@+&~
zF+21E(p=Y6)n{N0r40J46Z1KJ0yHx_c#t>C!Wn68XK`_o)iC=IXgka)L1Ea)DN*HQ
zg(n`pYqSvUOep}vo~dtyM|$JR1*6G)f1D7g6uf;bBV&iti<=dFG~B9Q{Vp#Zp3#cF
zRCh3TeMNp66OXRdeB+9c=%R3>T<xMH2x%ARcgk+F2I8X<x{1;1JdcjQrasAX(xXM5
zah0P#5y)XIPbw5+7^Qqt6VdZ>1_lhG4??L+R4C*y#$8WtFw0GGylZ8(E{AJX-SE}>
zZ$C7vtXDQyA20C)90OstR=-M^xKPKWNJR-7`IzUy{9A*vC>y+#Xt>NdZAY;kF(sj4
zlCB?_FENWt5<;=o(!dI`2D(3pY6p4MSJi#rtv*_$pNC(a|Lpzg?2O(gv}yU;-ctdu
z3@Q%fgK%07iF6CXhfkLjV_3F#-9@4dPd+cbCvly8{qX5x!R8ph{>r3OPrM>2Z61{x
zmVc==yEaeiIG>3nE=$pitew5(NYZ6C^&c~+jDi&C$TEJ5u1zRUQdfw85xVBp&<7}q
z2)cKQUmsv0TyX(*<z3s<?!z<q%XOkJKAk!a=OS<CBxYOwH?M52_D;%e#N>R)anz96
zEMO_>+osuaoGeqo%3J|gjv~s48w^|L40<Szq7*dY?477Ocp_}iD_48Xm+|s?`SDC;
z>LrejdJOAw>PEC`*#q)JPq%-dIBpVgg)1FD#g3PH1d@aIzbS{uFfeN~x8XX?nHQqd
zs0<BgFEOM_uUmrecnq=~xex!`exP?0nO%$NnOgIX(qAXdjb5F!OZOotY&##cl!+!W
zOE3EB(O$ynGWcWKsK?6!KHtv=3&6;uD5@tY@dO%Z>BZFo^l48&WHQbvsZvWUq5~o5
zW5mge6uJkuBlb-z!SsHp6)_>I3K+fJE@JxPkcY%>wP&y{R1!E`UaAn{8>$0O2LufW
zj{ej7I=okX<E)EcbYlQ&0XpA!9g#xhr_Dw}Lm}HMs`DbQ7YCZsH+&Nbgq8SeBU+iy
zzA-2Zt4it@iOwQ=7Qs730_U(k4Bdm22qi=Q|7`m7B_E_lXo?66(Dq+JD?CrHS{3;1
z)~^o{OM9B*jH+Bs2)A@pyy_FpV;=k2`gyOT{OB_8M_7b!!gKoFrt49Ss!g`j<5xe5
zl*sf?4%j_#dzo+27d{>uD+sU8oWF)`cB3_M@`AkjEM+C<6r1q*$F&#pJEf|4zwTRc
ze(Bkv$YdBY`~gaszAt5sDY{tLzalMnS4vFNR%GPihqN5F){VG*;}Kt=Am?hQ*xmJ5
zhG$uRhJa@ohW2(z6qS57%3?)THf}88kwG-dr$p_1Eps$fwDbOeHGK2))|hWZ`W=xQ
zW5$;=$6q9|W=TA8zZ@w(kumKbEnm`wkzdUW*;k5DFL4hi%uT#T3zy6AZL{NRU%9&Z
zS6E*uIaod(OBU*k-iiygJV4S%CbGb6)|PMfj!nH=7OPt4yl?w4V7eh=Qk(GbJMYSE
z?EA&CYMbEi>=KsHhOqoBI=cJl9gmyU>kq4cFI~31OKU@Bd889{rHa>3BD})mQN0@B
z3QaxToPf|u845=TR+_MMR<o`wR+bL7pr@Y-d(^=E;71Vd^4F^IM~WZTn7nTN9YgQP
z=^g)h>vbnvU?uEk<C@6s)AYYr=Y+!QC*OMQ=e#^0AB|HiUc;Hxt)>;E?OU`Uf4e_!
z+n)a~;$u$erFU0{zAqd;xYx!;kPU3&xx2>{)wcUo7VbziY4eJ1UulyK9;>|jYwlKy
zAdOGwlRJD=vd2Z4@2ewa2}+L%rJq)ZsIY56xiw+=Y(>8>M{DKWg5NRh5_u*S9UkLI
z?H%2H>6v_j&LAIm%WTh&s(G9s10P@ZY@7VqZo<c@Wx;QcdA0MZ9!2apIP0@@T30K4
z5>><Vd}3kOQ8tt!R^{|+8uiPr@4L1#tgprdDmt&%ypsOUWv7aZ+H?13_L$T?feG6I
z9~Upai7HpEnOCikll)?6hVJE@d`SxAuTO+}SYAHA_GH{%w=)m<_UoeuBb8d$4HZ<<
zXiTziOa%ToEW^S*ELYMebMnlb&2l|%n5R$CJRPpYO5ZQME|kQ^BIl>OwRN(7yP-iv
zxjOovgF_J8Xb0%1jGnM!X^=HOS*?<g1GRHL|6S()#7tbZp2pVWPK>r^^+#s*U93~{
zJe#%rgZ7K(F3B4I4|{hW4fX&34}Uge7|YoAF_!FvknCfZC7}{66dD<Oi;B!*mt939
zTL_8BP6pX`DoKUPk|m*clDJ-@^zPkz`Mf{h@9#R-b<TDDGjq=T`8u!HoY(XDyg%-@
zu(^eD-!a+u7oc%v1HRE=`!%EIm}*`wXff44y8B*mNxkhkq_W|Q^xH1GOB3vZsB*R*
zgIg{_0``j^y`GdM%bZAksWa@?N@Vbn(efYVovLgNPVk9~Sr3)f{_Jz2-p5@;uhQO_
z7Jb@1^*a2_8|A<YUS3+h{Y#^pQ#w1N`%3S=4Ljuj&Sqb4NJ7se0mGJ=5LZKnkm$3R
z)0)#qH`RuKmb;?X##skubph$hvlA$nd6)C*B{P+C6aF=i4jW$D^I9vls`Tre$aPsP
zPtB+P-!%If3aeiW2Bs7|KU((o+RcnWUwIh|bkWt;(oi&eXZP&I^lRcSlX^QZb|k!9
zPNEHXXL8KqZ1z((W;_4kLw0Mssy03<O_k4yJoQ2iqX(lxYd^%i;%$%A%Fud)<XS8q
ziY?%q?K*Y;P{z)x`lVw}yB}U&dGIix<NW65SFgNR&s&81s0uQd5R}KokAMAmooZ_7
ztv!8p+4AA>p+`pbo15Ca9iJ}Fu54n)57K_w4Fr)qUwaY8PaUMk5fDiiVF(Wfs+MJ!
zVHkMMh=?2}Fd+`{gn7|D4FusxAPGV(mldBXQR@+@bBcuFJ_=A-zHh8|A0Vfmy1d8O
zM^)8lhaU-x^OtNR8{mSB!h%flf=pNU>PQ6bGd`=|7G!N43^-Yb!h*lP4YF(tej*lp
z7!l$q5pvQv<W5EK(Xf#C--4anLfofAJQ1OSXG2_#L%GUByu(6)8J<g(LBKg$VB6vI
zZJ}i2uwY!+uBlK$UYPZcu+ZtS7({p+!Y;fr?CPp{ltg%PUU-UeSRyX`R?^<2w(u<D
zh}+yDX^4nBZHAe+h`ZC95%=22d3h0~5(b5c$cnJYs_FA(ZIRs0k=2MR6p1TWT6yYl
zS4LMNoAR!7wq5ZNjci3kwI*EYHjaACeWjN>>Y1_XATH{~bW~1Q)QCj1epA#dT=Wzo
zd|Wkpc6I05u;}+drFI@5WW|(EM1Kg2`D`4rY#Z~HTl!O8%n2MV3kvLtF}kV~d#J&H
z3k7B`X4G{8vp9gk$<dFdW4I2hf=uEL`%yhGeT<PS2I!E098m&+<U!|9`d7W;p~Z30
zZ86-E2`ZU!J6(eXKF0}Nh~H6VAWjEjqth22i<5Ir2<A@M6`rVIm0++ZSd}jRNFrR_
zHD2!-gLWCCmdR$KS$n8aa^g`*c})7%py@<4lX&a!c=#Ts0K!$rs;itcS3M6)o3>vw
zR=s8^c~vt!9)tpGJAu*R@xGEV0FOoH5%Zx-GO)dF&wkZ8{JP#}WcOG?;DsdbwyQy|
z$&-#r35UtylKPSD3A%3*L`-1&O+b2glDz<=`_7H=xa8a!LMo4b+McVNUhzm27!(Ua
zVv>v6L+(`FczB2JZhJ~CZHkU)ir);Foe(eH4y{hU+O#L6o-TFpFkd6x&CElo+GkSJ
z=|E@)T3a4u&xM;`B$9?)(;z1RFzfuYJxtGe^u=euhi2lK<e7j}VXkf3)SX+iacQ5z
z&(6)H>A*H`y&eNYF(7)^TN~lQ168*eBY3~wNf!xCU>}2U*k$0Vl2{xvxYU@S)r^8`
zdUU)Q2inq^PG^D<*F-J`tIk}%OqUq>EE8RI9V(?SoS$iCn<<{3l?Kk(t>z)H2ZWW%
zhAd`wN@ipCf?s=qKp2Sq8xZzgmQ7NYdVZEB;ACBlw%&VN>@?NMdXjhBek7ghWK~}Q
zoUApI9KgwH2+MIjo#r-@<4YguNuN6?nR_Nb_cku~{94L|>Re)ec)+{de7ZbRL|%+>
zUhwH;fDw-w3IE)lmvEXln*Pr98=;YV?|8c2NqTq3BkxYi$km%`cW(3EjF-y4Gs2U7
zdNcoSb$VWYer890(cS`U?);L7xKca7$qK57DA>p=sFf<*GhOh|E{393*v@<T(doju
zu)+@dyP2(p-D=Ujymz1So*UeIcLaBL_}yLZ+`G?tqh74teVgwNfLX1^MUx#x`5{F!
zBayQsMa%il0GL%Kac?F6-h%VJPx%p_tM7qR4t#xgFWt`@5?O35ahAqDk2ArS4q1Xh
z9C+SbeEzgT6ITgO=cPvFqa2rV(>UCCrSCJTTHYNiIiK&SAb(%Frm*<peX-LDLY?<_
z@ttc_cHe1wTa6vcWn8K$?PeWP>UG*xakkVT5+BQ1CQ-w~?N(;q>G;NJuL&|&?F-2Q
zaI%iT4qz|`tS;rUiTWQxmVbS8M6C0{<#!JhxyoHH9nv-^cb?7V|9F<Upxpd9(SEi(
z_#M+Rd+cEyy5g~lKx8FRx{_>K8SGXW8d(`$P#M`-88urOgRF{^u1YYiy6RSSJ+dmf
zpenJ(?QHrfAn|tj9TU#WfZeG&H?sOpL3KfA_1)R(d&rs+>6%j0ng?z*6_GVn1wbmR
zrf#;TP#TIuJ;+GOU+AOHE`YTc)OL2(cF)#!)bP*?)eV}~Wv|pejjVe%Tib71_d>ev
zNkQGXbbV)M-AlLnG4=YHOLcGE>R(3Ize7H3@2sD<uS;Ni_^GCL^`!cWdL0%bw0ddt
z;o2;8UAk@~1@bNu4*d6@Gp%Lh=S|t~)du!iKWx<BpL;CGP_BlLJC%|YE{b)@&3f+9
z4fbI-MGNCScN^_x>S`<>*O2Vu-(f}>@TPE#3iI-(3a<0B9YOEpr#upBnjto7Gw@^m
z(RziA34@KM8hpn5P10r*LMwk|Hk$tmzvsIqb%saccvtyC7kioJqh`&9SI`#z{7zlX
zuA{szG8BhYH2;oA?L<?CIf{27zm0$M3A08I4K&`r#s5glMLa)_zfDA=jZoMUeuek4
z8Gq1vONwLbBZbykaBGi3d+^+&(86X%d|O~`JE*bk;doopoJUq+Tka9wj3b-PVe4%v
zzO6c@?Xen<ip@HXueYbBwi~r}R5F~%InpU#(U~XHm66d=KiUzOy0eVGvq+}3W4%*{
zzbindO^~a*w@~ac9*xI$HFb5TQQDsSceQx8gRR<I6?!)IcMZ#+UlsOTz_*R9cP@^0
zj}~^%`=j5=@K2fb+?Q$ZsYTEEccyD}KjrVEQEXl^>p*DsHqABDN1<2O`PO7GsGD7O
zZhg@CzFC<zp7|c;6OFXOjp({QkpNy=_uhBJURF&E``rP^*B<fiNAoTH!AJTq?ykz_
z1AFGXcQX!3$ac!s4Xn$UpE1LTMGZn&2Q=@Zv!uP18i&*vA7`-)2x@MM@PEYU2Vkx;
z3>kM18fjvzyLU9%i<}U6?EHdfU-yoKQIB_?c)WqfILr^>`i5N0pQai-*`2B9#wc>y
zT?D83<SgUx`IM*jK2M46!=X{b;dh54yN9FZhhrF@#mPQP`2U?OZKgL^xi@+iZwx%%
z7)8G^DSBht^TvGP%|52L`{mwRTf9Bs@%B*k+rvd~?R(xHU3hz(Y0^<{@}$M2v&ZDA
z=t<Y2Nw=O!_k~GMrYUc^DPN1JvmR6Dqo*zuO<n4l3Rsv5WSS<*O_MFAgFU80qo>1*
zrXzc%|Fx5~`KyyvYBBr3W40oCwyJ2hrf0TpVfG=@97S%f$ztx2$6RalTzk=6XU|;s
z!dx%Ye81fMpvC-SkNKz3^UsRrpZCnaSeSpsv@kBW@Y-VGt;fPt^ukQh!femN{KCR}
zruQG@-Y;9c|LF1lQ}p}KMeo1#y#KoJev@etymJw{Z;{4xkv3+L?%pD@caib^A~W*`
zmYpBi_I=>+{J<6Sf#==_zTOW4?>`7KFA42j64|%3!*fYIW=Znil63Eq?E9si%*zTp
zmv`-3R`y)p9kaaW-m-e{vgZ3`ZRQp1&K13VD+Zn`MlmZU_f|}MSIpn9?Ay5n27`n?
z!{}h3O^^)miUp#9^+7^`Zv-vvKbl}X0%*+Nv0#cys_Op>8H{MJ`wI^CXBo`<lmo%l
zw!>BI8xD33?+o~0KX5RAZ`W@=*gxQ4KV-0hK;!?6gN6RT4hMUcOZee~0XW$BouK9X
zi~nmGEcIs@?7wBf{$zqZ{I5)~#lJPdy8eF?42ndXRThsog|SH=>#8hy-5M)mnr2pY
z|7~Z|F1MFmRi#tC>3Wf9^Xjsh!944NW8KvcW}g<H>`XJSDW88{={x(fyQbp(s|GSs
z(4w~T!|S#L>Ek`MRm)R-S*Euv>Z(7^4wt(9TN6w)pZ&WDX8hd*bN|@{LvjCXg4yb^
z0w&l5r<fQ~k5%K(CKw7Z!A`Q;|89bD0w$ONY+RICW9WwoW;O1_h8-$)W^*9)8?yXr
zg2k1%gvfn2!OU4Kf1A;zSEQO?irHg;2{!VVCKyuccN5G6HXf<toGlNSV2iPTFu}0d
zfC*Nb-4}#Che!fUuz+|7H{IittyB}tg_UZ8F{`XiY?)xp9KV}jPQyaZsBb2i$F>P3
ziLysYox@N~u+a&s36@}@5QVwlBc0s594?SznZHkLLF-C{YTWRa3FdFAkW4kf?%AwU
zO|UOi6O7G-@ABN135GWk157ZKFkph2GHQ&G_lW_;dB&KZOfaV(CfIJO31&q#!JM{C
zu!MH$(%~%=tfCz-!B$K}znNhBg)mZ(9YPqM4SlK!W}e-rOR!(HcBB8*1S|gw6D$V>
z6aH?3rEQsDV=@~~@l+EmV9Nw^U|fX>Z<}Dkznfrb5awj6306Th!4#*h%~{P0mya_B
zK$A>FH(==IZzh=J@RkYI37B9xznWm9nScqFwrzstZJS^S+V3V9`nw6{XUXtzeA@(z
zk=-`IPW^6zU56+-eK*0%G3gS2Ho;uR|JDRUviy|^rocuu!M;*WFcDOu={FNB=bH(}
zOEtmd7=JdwOn)`Oc#LseRry%VPbQd^CE4x?V1hM#H^Fw&Y@1-Q!Zh0^SkBnrnP4eY
z6D<92OfW0J1T*^!6HJk&EQL%s{ksX~kr88<4VYkNznWlTe{F){e>cI}znNg9pG>eD
z-%KzZmUY_%gX#Uj1e*d(uzTAk7|*r|c74kPQ~b#U)B86j*av#O&sYnMZ4+$opG+{`
zAixB>_PYt@v1Nk!^#LYW{?8^@GVZ$xc9QMf?<Sb}HxrEgR}+j&iZn)2*)qYd3c_1|
zm|*sxkZlv}DAfde{i_M4^+B8~_PYsojZX5zcN1*phY1G3(xBNh=zPDKVCH}c=Ki}0
zmW}%_O|V^n2^I#JU~Mptwr?hw`JYX&{n!h)B$_zeVgVEE<Tn#+DO_|B{|6HcqNhFr
zm|)7|e>A~ROjHxBYV3Ct>^6fcV1fkzCfH{%$Im9%(*N898~JX6wf!d(Y#ykbkNakV
z8Piiuuv(J0J=Fxe@sB3hGSvh_s+aw4f?)s?>;_<hnMGV4{$YZ#hh;Ik116Y9zo$Oc
z1jB)uE&phO`A_6%tTzA21bf4wJly=v1e0OSUQ8Fr8$(J-bTBDWO)%`131*W-bDXU6
z!vwnkm|*Et6YMNoPsleD%$SVKvn-PZOfU_q306YGRrY5S?8YBVutmbQ31%xb<RDNw
z_9qi80WiUEP#(Ypv!a?{Pq$1k%PkY^<dz8*{M`hT1Wd5O-%T(Fzyu>h!w7$2f`yGi
z^0rJctk-uFEcu5Cb{#U!2GiI!!BVzOFq1y`*D;96FD97Ye>TBxr8}i;n_!p!$pn)}
z`fi(GPXEyayH67bm|$FVKTNO+`7INyWy=I(f!+INf?bE*0!%PtnuYt@CK%z5CYa?<
zCfF41<;7o3Fv(v`uqmnuCb?yT-TK)C)2Er9rrpgB`(c7Pc}cJRVuI~L%3+{!fC*-~
zZGu@tB@*Zq3DC<_6KvPE2}Xb_626;YSPazn4Q;k1w2SmlCfKcQ6HIc;1e3G;lL;2O
zWrFp=47N=$`)?-Lz)vO^=~oj>W6K1y`Fj(r;ujN){8uIz=`Tz$jXszS;r~Gs%xc>N
zy8#K@Ho;Q1O|ZNz6HMbDO|X<7CKwCspG>gp-%YT~eN+=HSqJVbFCB$ZvIk7CMY?(r
z{0}Br$`2FlI-UKWOt3f*{1+1}@P`TZ2pZ;vlymSj0Kw}msU}$5mI+q6WrAS=6U^?r
z30Bkh-2{v4gFP-rMzO*G6HIQ~1hXmL>-3Wemi(Vgu<Tz<Fc7@^*>@96&P&?q7ZZ$&
z?(a>o$5a!{dCLU5<#78Pp;Qqt!Pfr51iM#!E>B(|>|dH-;eTy{N&Yawcxk96n9ffo
zSPS$c;kyYY_rEs5ZUZJ*EW7~(cLwRW7uTKxOt2C9TR%*&K6+;q&AERt!LWZc!Q=oF
z%oJYwA5E~2Kbc@7+a}m)TA2=L6kvj3pqnG`dt;YPVnbz7bfy32Ot2_RxQyC=GQs+{
zOt8jn6O10N@rwzj447bsG;%1!KbT;0+a_4xwh31HlL;0T``rYK19i#$VuF$B-R1vF
z6U-l}Xh}7}ZUZKm-L?saf!_Ve1S<thu(-c9!Q!?}FxNi#K3)XX1S3Js{|6?R`M)#4
zZ2pr8R{G5ZyYZ6=cAsj3Y5Z#wO!og)6RZ>k`(}cL{hbMRnrebM>HKPf-TPsJ(ZGM0
zU`}KI!UX$3XHa~}=8q;=-nI!=@skNA_b*Mb-T%S_V}VgkuuDIiU_RR>*rz|4V87A1
z7XQfvOM*FUn_#!TnP73>O|WE)yYkN_*h$(F(jQE)TmNi=Inxq<Ho;ivewbkPKbc_X
zwoNdnZ4*rPpG~lSxWkqSrucu%1nY-6{m}$-DE`R=Yx>Cq`$RRt9DXvvN*DiNf+=F0
z%(qN1*`H0Y0Hpm76YMb61XJ8H!ITN==lcF+f>~{uVAjxcKbc^v|H%Zi`Jb6!=g$3&
z30A#Fa>ReI{E=Wj2CMQ16YR##e>A~%b^pByM*J5h*#3WSf=T+VMkY3%jQ~urT+Al^
zn+ax>Jnwms{+kJ=7O#!|cP7}^<T}6v6PxOwnqX&>ea*j{VCF7g{)Z-*9L@j41ba>V
zTN6x5{ksWPvSorvOZ~|N)7?QMe~fB^DgLbqmO?ebZct4ynLnCf)wcl?tet9twg00D
zrVE&0TG%3t)S~O(nqXX4c}KpPV4)0w5r1ofx&AQ0Zr)Bj?DDG#rh<?s^@SeNSHV(E
zFloR9>m1uQ!CU|n4E@h0nAzW(U>4gZnBsqHf}tmq{=x*4$=Wu-JcSd)^yPf6DJn|-
zVuIZaH9Hc6yb73L;h|I$%uf583AV9if~EWi6YP1=b3dvHwgd6MHo>A8e5oc_#WxcS
z1LYANM7U#4047+7z#P>CJIRTqnqcFh#{Lk77t4SN28RD^g26J+?HCF2_xomo-Th{Q
znFA(RDYqrh4bWejU`anrum}+RIQzB<mU~oboMYLGBCa(~Dy6}~<I)?cCKv`V!EQ;A
zka;@6o~slZC%^==Dh`(2|JNp1)?b=nOW#Z|zi%ekA-^`+(>f?AstM*rsc%~ZOfVS3
zOL|?Z2`08>f`th#4Uzn^9R%z#24a6U!EClnuzKykF~MHbTLLB+>YE9cLN&p{0TZl=
ziTINVmVi~a8)KHoo&4Pd!~Jf8`TlN#DbxI9f~6Ch023_M9tIW+`(}cn0Tb-r&n8&t
ze`kWVd^f?|^!S>&U|cXt!WtMTPag<jFT*fWO|TndfC<Jyt5|7(N#bSZ`UexN^(PaI
z`5#QMX3liL1Z!v@Z<}Cl;GiuNj8!jqAJqi2Wq2ZSKs>Q;hnY<!^HDXx1Vhpp>*&$m
z{BD9x|6+o*0O3L+f=d$0g#fYa9STR90Vdc3%phQbWeQMDFyTfTP7F~FEClI=K(<UU
zZwJ`aFkpgVLVh*DiW{~}FipS&Q~P0pssGsoOXOko*?4#36&~e+niz-*-*tPIn+z_7
z7~DiPVMzYbC}vXhj)CRywYj&fnoaH2EsK0F8|b}b^ZG@t;9~MD^bD_(pC)1AR53#E
zqdHZ6Q`2XQLhokkJ)K}I(`r>(!@&1nH|E0SkrmAn5el{AjiP&3GEbJx`XWw_PB|C^
z?Tf>k)nfY|X`Q?Od6bs^ibIW%e8U~hyZcQ&M+7(H!|pb)4bB9X%J*BS#;K?RN*6x}
z^a|D5#D@YgYLFjalIt%px1rs&nbZWx=^$PZ7*y+s647aZ7|KI1sZd4)HvzIY5dlJ|
z!?;vw6*%QVFqp%DsPLKa(_oNN0uIJWI0qvDNdtaDd!emP+j$*fY5f3zo~Z^PFe0tl
zI=>DA43b$~!sg-L$_8HOB7%slhcWP};s$!4^c}44(4j?J-Dffs4rNFO1I*Ory9xwm
zasDyJU6p!8Uawm=X~rWqF=C)%57uW6paw141k<!IU$YZXU-A6~pXW}o&Oksa#=Ak>
zFX=$dsn0s5VJv7ASQsTVBU-U}AsjOXX8ow!e<qZm-0TgePt2R%L63#{e7%yW_xw%n
zG|fb~pyLh@h%Ns(Q6<gsttYDKqbP3`cbXPy6!}FT2qG`^um4ur`*ndoJ)kGt)Bnvb
zJ}`gMQr5nU(F|jtj;uUFO_?u&+@`L2ibn_6p+yD3Y>8~`1ONnM!V#i;m50=66+oaJ
zdGY`V#tndA*xjsgq?b(q2v#i6pfkNppkG#dYhUg=y-P`zR$P@ps}YyWS0O~!dR7Vt
z4HKEV%9(15;SvOa;@v)c_0gBA%1av*q*+!)SgJ&}KrrJVt}9s3m=0)6gAGOkJ2ZGm
zHSD&gIbf`_*_@=YYxGuOmI`Zl9ouJ300d)45EwKxZKX?5t4*lYVpN_Ey8@O9f>}1|
zCz5;-G=P|-!%y_YsPSshGWmhLaiC|Wae5+guhgq|OR!wOq;|@;xl9D!4JELoKk(TV
zM+=46j%uDMX!K17eHN+n@zpn8*E2anWcOEE4F^7(40ZL?!f6o^^s0H1Dhv#}MGZgC
z>;eXq>5~X-;{+%s&Z7@hDXkeT!V)7Aw;KckOfYc}NX$tKtii&r5hoxI+QAKC8ia$2
zN$iK~MXU`#s1WX%<}6>xMNv)1usZM5mUyzVyF}HCNG$<6;#pA^VZa2VRN3PjH?`7@
z027S6t;Lt18DOtmjRfQL#i%A24ubw>g1H$s_-&bBm^#)OstLw7M-~!=OM8I~Wi<Kv
zf_)0HAOh^@mI=o6%>?VCfmRZ%EkpF%RD@MQ84Qoun)hC2(8|kdXHg|s^o3}pw+r}z
zjxJU(03qkuR@&)c>tX`Dud=uhdQ?LFXmJR%5_Hfwh}J>P%o1{*Pn$Iyv@vVSQ`J!j
zYeFFb5G?c{LuZLhr!N8a^b!Dq5gGvy47Ck{C2xUXv9RlBT4-SAydBkLyNswHSlfd+
z00aXbIR<r*Uz-+L?XCvR=8G$YY-BKkP!0A2KrqDw>9~0N9@Y<PV(V}!2qpoR3Q{W(
zVY!)VNCm;h2>44Op<5uBMPBv2$YKjii_)xeeQr=*O*OZPMPAbu2<AtYt_2-|5y}!Q
z@(KVDEc8AfNMTXCEtN2Fvb)deClG8H0Kw>V9YTiu+aEjivD*P!9Vx?1lL~_6(d+?0
zFbMzzgHu5;!gmmi)qx6vu>&AjUVqOP2zC%;#eOH4B`S^^0KtZ_JQ-9FOe{DEfHDL>
z_A#^m0KpLQR1hp&8ZpQSfM8_<2S0~wRzL}ODhPJRt^vkZ{4lUd57Y+wsAtX6I3P1l
z6ir9i42uRDLjse?bo1eEePqR}wM>r(nNQGgM#a59Eh#KdVBxL~oQ13T?Ki5kq7_Ke
z`DTKFXzXom9;yyn{A7Y@1tfS5LlkXk^}}dw!h#G}!xaD%OnK1o4<^_FeJt#E6O1Pa
z?ni*f>aZRr0w&l~Goj+ygMbOfiZW%%Y!KmSb#n*Zn2Xm+B0wCPJ!44>sx_{2!Q90J
zWHI=}G*o)J!`Bb!wePpH0WrsJfnZSuR1nO3`0E8IREMy6uXGCptE8y^0)mBupd1-+
z00etLf~F5M*e0O32{!-`?0NMI|Gg3J1g6D(i6UDd7|52*u_|wHZ`jfJU`@sV%-}U!
zDhL(|fMA*<!o(o3u@;-8dX#3U$^5OvyHpS?UN-KSX-1;Jq4`>C#c=RDel@csTjNJT
zEPO<D4*1?m<;2-KMRiaH0D^%?00^dW+fIeZ?mkB3T;xnnBEw3<FXP(t9!1`nA9BUj
z)A$j%`$9?!c9~iBA*@3<2n5<BkoyC>Lg)G`vMjdU_c(9_8XQ4^jZEi9X0;{IwW&Cc
z5ol~dA>{p=%)>|Niyu7O5yzbl+WE!q&<cT;K%hhQA45Gq7WVStO#)py!P}llhf)zw
zBCwQ_Xe|j07%TP*WI7xL<wvH8ZE($dL9<B6C?nDNfnuYI?TYWy%G=%ae-@oZco7Bi
z^?d}5t!C{vVNi;DFbe*vTLpF~$$$NP?Zr{VaGfuP1j6VyK90-QWK_2tP4co!Z7XYg
z9NB)>M$oP5+Rc#RplT3^z`a<Nm!PVv^n$H_gw^EWkS2i!QR{09et$*n-4NV4uR2Zu
zbZL%;Cbs)l4IwvSA3_4uqxbS*LM6z>ls@(usCdF|43sVa>T9Azbnh%V5W<ZhKvhp5
z&lzpLPOOAj9!^Y|fR7c2N`r1#KeI#B(tt+fdS0<&$8UVu<8ID^F1NVPSc||}D{zCL
z@?dS(6XhB-t2WPQ5CD$$I#e`{1~rOo8QXU@fl&@oG-E~52_AWuc31+QCQK9HmpO7`
zr+9pV4QJ>9v9LpVcLzl2OhE9PVF?wuqIbNGn%(1Sgf0u6@nLeW05^!)wi8(#Vy#Nx
zt{>sCILhNn06PF6m;ySw&UJNIO9K4hQ4pj-N6^jmD0k3~-}Iq=6R|tuA|r{OI?!@a
zh^z{TX$<s9pigSygge5a_j&iRu_@o!<7UB%wae9Y{Dj;~TOinTq88||sLiv@nv@!*
z=KY#tah8a&UISY;6Ws;TIBe_$M^dvui!BUcfIv9F((Plrao{vK0D^g5>otpxW3XUw
z5e>HxLns0unADJPQn1P*G$Wpv;Q{qGCSou&QUC~sAs3mvyX|p05D|pYp-~4wFm5tw
z8w3*rK(HlerH=&ZV<1d1yzY%X#n*`m@tXIH3v1kX;nhiBKkJFBhiQtzQLo3#R}`eV
zYp*fZ;@O{{(U|fj5YD&&*;pzF=I3ErV!(nNn_wMxjH`7zIIWYOwWsk7mf7h!RDe(e
zfMAIr!Pyt3H&2#qfnbq6_u!Mqcz6z5?11C_n>R&L2#gXS1!LFGG|%`Kf{WD&2*bF!
zf;Ts!Gt5=CK(Jxg<GL`Lbcj9xf_1<$%K;E9<f!rK!)rn5x<Pps#1G|E5Nux`0D^@o
zd;`J8i07u?I=U~g)t*fFatiSc1ZyKGip5m~Ob+f~;eBEltHh$<2cnu_W8*J_37~26
zt(rPS7~u_@{Re>>A*ZPpEm{e{1Y17Qfwq@!o*P4s>6N#{ch)e*fU=b1atom4k6=tx
z6Rb@Oc=t@7bk(10AQO0ww?1<zXGLt8VC~~c^;IAbYj;cVu*Hn8Xl){3f`x%^AQ#z^
z2eqHPXRDgoY_Oz}AdE%~&zv(R?$e>M`DTJGk{2e&vH=rJamxh5ZJA(R)F|(F6D$uf
z!D#uz`pmwWV2W<c0U>fNLHTUZH*ha-?>7@HBwue4_YyF{LLG`I#nupd&n*+IvZlG9
z>k-ui3z<vUGQmRUd&s@zU5<9r{hbRZSPz@lLhCF56AUwRYz#2Lya5x;^U3jQ0b;S<
zF7&~}p8*prspZ+iHxmr>%>?Tao$+1WLp8xvgFqIpClIw3#?SNt6U+}9CHLI~n?i4y
zVEwL4lRr$b%3yZYt2Y4?%=Nnomi^5HBY1xPVS<HinPBOV09@#yK3b`56ATWRU^oyn
zq7#Cc*<|vnEUM;@u7;G4)Lv@4Z%;rtsPcU?!Lq7$kB!r$6B=r$CfLP#r)Pi(Mj#+T
zudtxQi6Xt?Xb>V6WNaDIa0&QbjcS6C2`E+2-P#&><<ToG!w|p(^CPe%{V>5k=p!_c
zZJ^k@H07EEN@VphKWMBu@Hpt->{1_#Y^CESN=D%ykljy<=rIk0TeU%M4Nq7riOiLQ
ziRB@#i{*(ANVR-mrm&BjakFh8i}PPqd>gpox|MKP1VSB0<i%WTdJE=X<Q$WNJY<p5
zc<5(4Ucfs|tGyXy{Q-LWH)y3IUEDo7|9-B^u18X)B0P2EPJAGztz9SFSy?ZdITfaw
ztV!Tdt))Y0GpPmxOBM@&Af{z9=0P=#>@kMI(W+Bk`a~$yP_@u@e=1ElQZv;aJf;JN
z=}6UM<sHW9Lp|AzHDVQ;z)*HH1LEx>r2*{O6V6kaJ_ZSWz?-Vk*Dhoho+Pzb!r}JB
zE+ibz9@fxt!T<w$*9;=G>k+JPa;DnIPp6jCLH9^-_syoVMj^sf=SmlK`t%udm~^~2
z3m(yd<Z!;jo4&vbiym{6%!By=b7q5M&KRFT^<?6to>-xD=*IefGQrf%;u;0#{%C?R
z+A}M^s-9|Z5$E4s|7N32U(MpnXp&pcg+RBgediKpMk-pL7#XBIyzH<ZHRZ8EHNh%s
zT;?~ZCfH%Of=BuCuI`^+=((}3rO4&lOtP@_g2XIjJsoeG%C6oVj3nJQw~oXy)aNot
zUoAO^4CZ{C$>6X?cXDJ`;TdDQoq#yqK+k@9&_p;l%$h|Zsc(Of>tK@V>pcNp!2B71
z*KSe31Ur1gZC0}CP5k>Sl<fGCMI8fH6Yf*!GXt_bFmCMh=3t0+>ChrwqG@?aJLf8f
zm036?-AXLgyW_CSC8H6l3D)w|Tsrr{o1ioz{f%5jZ3sxh)&D-6qAS9<CXsC*wnzN-
z)fRY!)HR<^<{Iyu59ergyG9(-E*4S*#?JET?Qh0a118w#t3Efl*;ZJji>gj2Gm2Ix
z=5!YpII_~mRP(0HW*12DG+*_N#-`rSzsxK9fNFvz+(p;OR_N*K8B~l%*pF1azQN~l
zfB5v%5TrXnTzpqhUV-bi7dq<q?thx7+4*n-cS)|{y9tJOs{Xp9f=o($N4e7IqiYl<
zYZ|d!RGqC<$j4lvzh3gdCR@IfvSVuGR=XtaX2kst+0Naj^frX96amk*WplCF#67(U
zyYwzF3RzB<IEfP5+I!A62Hf}dSX)~!yX~7@9Nu|g_D<g8!|$KvJ~?{*HzWFFohW<O
z0fG^Y)-&v#y*VfE<@U;BpJzQ+JcsvwC-$g8%)&P>7TY4TQTE!1Z+3dFcb7X1=$Wf1
z+t0`yI+e3e`*u$bGk>{l(Q|2cQLsy%gWp`QT9~CHt=6ky$57Rh@lrY-Uz@CM@p^(#
z{_`p~T3?=HU(kZZ50RU0#ZAap&280#PYhAXWqKjn28nxG)H@!&D0E+|Bt$3yV?!|f
zIi;m5$WEE8^L!d+lBFtgU92YOB=H$q94fCjT{<~F>y>D4u4@<AV@L#gbwW6U!=eG|
z+IWoYFqW^h!AKL8*RZHWq_4p>O8bwKgu5WLY-MOf=xg45o_j&rlGo|1!y4I7GrCB6
z*&!b3p(PYf;)Du^68%|HqFr~QCyXil@(0U?F}j3X#zbICGFmoPnC-+MlU56ee$II(
z&A?*oKzta&#&X<dM$ceiy+4SKvx(-mupZn^hhHAH5aLnB*yRUe<QymgOt7p@zu4N{
zto`Pe!m#F5ZgGDn60JcclN4!@ZaS`qX`W;*x{gXw8Di$hYcN8#Wks25c&kmNPq>%G
znFQ)*GR_-Q#AWX64y+ZXQ}%nxz3E668+Pd9Qnc@phTSn8HjbhdZGOFI3-2nT^G$;L
zj?12{s2XnYGWo5tQSN+B>E$6E&#w(wdUgq>*EneShR!3-b?=*p{MrRarj5iX#qAc2
zbb^wrh6+|7G4vZ&!MimRkbOH^=+;QIt6}=|ihia_hSssmv3B$wi=l^gvNHbK1Zx=9
zH`4oVg2~Pp?aSXX!FIgR=Q)zlHTo=GMIh2zT4%qdSbzuun`DJo1Zy2!8p~ZvZQbYG
zC#gOJqBU;_MJiQ=n_G4;OCoeJ0H2H=Bbb>;oMy2TH{=Q`6>Nh-Ib8N{4!$k(&h<Q#
z;Wi=l?@X{u?ga}^q*7d@!Y_I_vuZU;7`8Qfp;HD!UG~%L4fqI6ES_Q4TBDGekDa@|
zoMa%DmtOyDVA}+<fAOS2S#em_^Qbj+jFoDFd3YQpjJ{Rms_+)@@ICeXIk1~r{iJTe
z<7(uKdB~@#;hP?3tE7*;=po*GmoLCmhJ_3Ch_IDFW3<ek>e!DI?a4nWfX5v=K3qul
zdOX~tj32g>P>6A*F`!{?Xn?9SR8j<e#|1~p8q#W&cC_Ziov+DV^iu`bAD-zA*;6a}
zY%`*e(W%dfg~=8cvmeYb;Afz$)Q06}7a`FFMO{&^WC&OUu~c|raRGW^j$wY9kJIPm
zzGN^Ca#pqH$A`GBXWgKCJs35cB>7OTi;N)K<{WHUsxRwueiAg?K66KKF25w$eh8#u
zQ~8LwX&R{<pBq)O(wh1-?+JS>gi>&ZNhk?Fi3LosRgw>Vwm+{F(n>He+E(nyuE`;@
z;o2v@D_z1jNhVo210h<y=T$z?xsTp;lwQb5rM=M^Fk$=n-WYMmexZX?(?a~W>ZvAJ
z{)OohI$s&aEShj;fgXnbh+}1L`Tk9gU%G~^Ey{}?u)W)VFZpnoaT){4`=(>Tjm>N8
zHXqfF^i`k59NwLtXInN1m|$6<Pq{Z9;9`wvoFA45yp=3RzYW9FFZaLPmta^wZhpg|
zv}U(`y1;`E`(YQ#v3SsVBEyiHrFsHKFWcs%7kQCkUS5xtW)m>MJW?)%nY|)NmbRV0
z<{2LaPhPR8x;WYmy%yQ>R{nesu1W;=a&c}_YxDEn2kYa$=|`>~LZ|e(ExbL77C3Ff
zY~D{~dLTV_<lVuC)oz+c;_`N{^=q*$w_mR}H4~}3o+?&7T(Y603p1Mc2&}<A=sD}i
z_T2qO+8MK^a%-2Vg$2&`n%m<=#RtpG7elmbUu32JMq0B!FPErD$$GXrs`*kVZqvyB
zAtB^*x9>5>8<Xd!x=-RYNm?s|Jep<Z4|n?OSbr=E{F>(gKU|@5^uj{)v(98Dm+XYg
zFN<5RI|uGuABWzYd!jDE%!~Jb-YfLEx%HZ8*!ud6b>ItsTF0uh7rwqe^vbTh&-GK&
z&JFCo%j*@A4?lZeW>U?5_{{_hy!)i{;l^*D4$sft+Wc~lk7;U58vxL&Wp1srq=P0$
zsxs(Hj~vu6?geY5|MvLkS9d|!%Mp3M)STkTnmHQ{B`~wC5lsjNk#T%IE*-&iBcVBs
zXfViMI6_yCVQ2yTt(!SR4EQprn`_hV+Wn|$Gj;z)G0`X$C(_rpbQY`5jYpfuS<ynF
zETn5Td!OORDqTda@#N{s{j4v#6c^3;>PT7yN})mqcXR}}@i<TPIN^@2w3EYfk~PQW
z!Rb*HvnWy7ol@7Vr<#$0K1ff~a$Im>+<8B_HakM4R!FK@Nbmts)s{&s7W*4mSoB6H
zUHvQ3iB3gjbJ3UZ+1ni&!&o-sCfU`--FPsMaWr25<hsAEL^+nt|Abh*u#9e$s_HEd
z|9vt8Et`cMVm3GV<|kyU&9!047c@@f6Rvr2zs{3!ylBaE9(6K7@^x+32~X85^j=-e
zS7DVA8^+P+7luz<#0Z}^HbKU=yAxjX%X9Nwym_$<%yebojGqWzqp6O46T5IVT%)Ix
z=Y;8tHcosxgxkOI?6jU3o&q-{30NM$51I3&?iFP}aWP|D!(VXKb+0@+OP+*MbP=f^
zh3rnFRbDWpU(ECz2Jaa$H104owCfPeY1OEFeP$ZTF(jaAx7VzvbMLXvR0D{l=yBnB
zu63Ixxly+DW<!ewrxm9Z!MrGLrY3G3ivGJ6%}iQmyog7Vh}vXyOJ9iUwQR!^NTZGr
zZHQ<zi={6PDme$?k+;<oZq(xy)s2tWt2do0BO+ghXsySp6q3EWbQRL+Bv(%Il~H7;
zp|h|Y@5G*&BXlMtXDT4|&RM(A;>BG(K0G)Xm7~fn1~e?U;x`*LymGYta#Z}f#Jies
zC*oY=bCk|FsS4}z4pYvSW#hx3_L)qaEZIF{WI-ER?)5=zON*KkMZ8cimz}t?*!kFH
zh_I9H)Le)TtJAT)tavAqipCTiKIL_;WB1oAtwOSo;uQTmIPT)49{_@-xwvLdot83V
z3yV?`19PYATHTLF>g%dE8!AXRUs@w8abgb-WO9=r>_@UZhTiPHpMy_zI)5ZPJ}mp3
zOq9Ef%c1<vL%*Fw%{`SKYOo>p#?YNw;s9H@geo!Yz!M~dyH0@^E&Y006vNDDXrcw$
zbofxw+FfAU?mTrGu%sncM8*=TX}Ox19i@0hund=Zdy^wg!3Yn-zCL3Xy?~49X^D)p
zQa8I3VCQ;ua^ULenSh*7)ggl5YNJVqSm0xV0IpAMRJU~%yxP@tAVZh2uqiB`QOlBu
zgn>D@qr%0UmD{Yl7InBsTK2(jYs0W(&1B@dH5=%y$}`C{Uh{n~EpC-lZo%_C93*pm
zTyv~ko3lZFGI~q0NjvV2C=#&r!)BLTLUPxjd4|0l0Z>9j23l3(9Bb~Lo6dI8&U{L(
zc3RnI>rI0pISwyx=j!G-K~6azb8##ul3QAKgoL7v1wGlxulaL_Epwb(45$2~RSg<B
z;4?v1({+?wf0xi`;1YY~X^%sbS9AC5Ii7!Qb2?D0p93pltP=TRv`enib=HX_SeXC`
zfRF?BbDKy!Tq8fcPyZW+1Wa8qG_;7XxTrYxALxk`lpjc{&YEcmVJK|U_9;}Ubgknx
zs;y2o+c>2xdYnG2iF5ssN3CwaIalF0Rx+h9pe2O32CZ7U({aDBlhclsA$M(6&mn}?
zuX0W-&%7Nzuf{NM*7y#sIE^2gxjA`9`^>bs=<yJb>HTTAa}4>mG_$cid2#i)_z9+j
z{25sd$(S|x#@xP*D-`Yq3WpAH^Mhgb{?mMAheux8M6mYx@b^W1CI^KSJb)GCWs<mx
z3bp4Tp+2t%8w;!qizKiE5d$G4Ru2=-O}&)QWWn`WH;4UAWdqX00&Oojynj(+2fS%w
z*z$!gOC?+LF}Vjyl$6Q@@7Nj0{;OJL4Qis4=_7dyjfU-OdOe0kH$Lm7Jec!He0Qg@
zrE9!_={``mVb&uicO`gmX+tKX8`8`Xubtg(LkbsUe{6o!gMO%?<-$D%{l?H^aZ0=%
zJ^8LavF%kkZY%5J0WW3nHq#Wb!iO^WCM_9G6MVzLIfaQPjan#w1DH5zC{~GNTGd0U
z$~2R}brD6J-f>zSMdMbc#hiEJIo?V8yDrfb6ui9hrp540HJe5|8{QatXaLT%e%+hB
zC?!V{)m}86DUBbEnweab1+n0VHoaDFMC7fIk*RDvP7vnj()Gg>{vlWTGZ72-cW5QO
zQ>(llpWMHgR%FF`cbJ=Y>GXTZ*FzfmkOZN-Bm8kA#R_<(QI^PJ6~GF6X&1YnCH^i{
zIQRo?3LX!0V|@_)I!AuU>izOD_Y3JoQ+rQMuIbHAJezItnAR;hm#ViLVI+npsa!Ea
zVk|c~v2Ww!B{Slsk{1MxI#Ew`#=<-q33O7~@1<+u^u12&EeUG?cxA_t(1Tr-FLHMx
zF^myJFUa5K#Nsteb_O0m1szx|(@AA@r^hVI((O`6*}HbFgT=j1Lt@uM8>ou&JV(`?
z<a{rBeG;;{NrRn;Opn*@+SIdYhs$~L7i?Tx8CGN-{s1AiqPQ~fiSPGCMYF~*>D+p+
zIPAN6aZGx4nc^tGY=dHQFq4Y>z>?*KN?i2f@mZpj2seeG*h;jyKU~$n&$_FG?U3TU
zZoAldMVjkpw3SMbt%Dkm6KpRm>f0lKQ!4Nf4fU3A^=s3qnt{e2IO-}y>yG&7zS3l5
zXKFAK(t|2^>vzoyC+=Cu<1vkt*vIK^`H|)1OEufmQi5edXV2i9eHgp$%ZVSy#`H+h
z_9(PIIm1+X=9oPr&X?Y+bhlf_-WVercV8A1?aot=YkWBNjDVF=Cd_B!6D`B9HY+S7
zp_d6*#?@Vk1UApr#`U4ilPAs#9@;nW#r^RuCfRDa6Ia9JF7wgl6)Lx_r8ESsWvrBF
z+oPy_)_n+y&sFgNOt7Y->pd+t!qXnK6@UrW_whG;y1chIV1iYIU6}GwIpu$L|G-?<
za<KCNX1DJtzyzz{Ge3QM1Z$SYl=hflvGgYRrNt&>_xXE3L&~S!pXNA?^=3}%rOZ!V
zYMJtne{ktNV1k`5lRu-u5}Hyym>Y7sTf*bwmkJVKf;G|U9fERLJ{D_Z7-W(a5ceaW
z0!*+~Z}~EnwhD%!29A=QtJOYDWy+zsfC;vGAWPJJS}C&i|Fb68^XlDU5b-gH%8{Ci
zP>g1u9^OkA=pnC4`65uLix2uzQL%YxU4YDMhUF@Rs8mwe9Vh}ejZ!wc{7ILDR`qtA
zp|FpFWh-kaF@hS2U)U?bD$VMGizMwfy^1enh2cv=`sBt?O0%FwtM)D7)Gtz_6!t|h
zei6)RhUM1KZGK);eoI~aj7AsptJZx)UVUiyC9-zddeuIn#41$f43Wo=+*sh>#Z@=k
zPpa~56j`j*9$xPm)WFMV?nIEPK52LWr!;TKc!#<tzyTwnNvk15gI`Z+6#B%Mc8^2d
zh_B|wY)$RN@Mld;_@ug#1ifKjqtP!-PhSPN&wa)FYd%RJYb3Tm`=U3_S9h~h@8KYc
z&w;1_S|3bN?-6WbmmrDvZPr%4HmtI*duh7iu}ERp&{DM_RxOjNfZKL@eNcPj!tj@t
zopf&#YVk=MJ?Fu*ZnSb{l!xSv`9b*mUikF;b%FGz_!V;1t0v7<tqH&#V~3~&5qTR7
z<@GOfh1Kl7q9MCp;{oiCBw_J|x}TOqBo?t1B6WQHO`3~Dj906aMx#jTx<I9NPsIj%
zZGC+620lrPQ$tq>vCa<C*9wHv0VY_VV3B0-`iJBb4C6YXD5TnzWn;^$k}j(TE30u1
z4<)S^-o6$=IPJYEeYpJ0XI2-p<i9e(mVzoe?74TZtoI{#u}a+{juj&s%jq}m_xgxX
z7|-l-e%#=YdhqPW^D);-PNo*~WYI9E7}%}j`h``?=XA<WKa0=ekexVm?BZZicf>We
zyO&@r(uS*#xn(RUh)MOya5g!Tk@N+K|MkLW#9G$n8^RCLXH+jL>y}+Py!@;Y|CQ48
z$i(JJ5Ry-ef7(1zJfbetH1$M<%C*-)Y&+3y?^R@du6(c%4>M1c@Dh37|DYy@^Ile}
z*6yQ^X1G;m44ze--$Y;b|GYf&v?5S2@N!yCy+!zB4ze_!^p45TFhv&?oKxAv7F*AH
zyF89T29_@g*UN1@AU2WRc**cxs~~+wwS1EUilM8KC?9m1!!M0jk^y=&NUCL%yhhHC
zCobeI#+4?LrBqmqcx9UD_w6!Pe&YX}B_Dl=|BgXaI>byUL~N;5DUVyY2NN2*oEtBB
zF_py-y1YND@#N`C-o_<YMBAGr*D_9J3kGE6B1OW7VtTc{uCw*&&<G^<=`w0gKcqMC
z&Z7{=GH$b4&@VaBTcGbOMlUguoFnAd$5)sFGm|rsc(Ym3Ee?(gZo+<zHn3FHFFX&1
ztgQuH5BSyId1Fe3S+hK?kmCqSHTC5$AC~l4IZMC0Hp5xer=g0>e8Fs)eMEgBJcQX=
zf5&4RtIr=?jPYHniVq}<CEi496vUnyIeqV=(c=o-{*xRR*pnfRQsK{y_H5cV?BObw
zmbUXqKft*{d-&v67H4|pq33P41a`e$JQ}#<AH>h{KJIGI-f?dUBc{iTh7?Waqsect
z9lgvmndF>SwL^?f2`HlTx)2nj4!Z*rzBt+dN#Qf1R~EitxHKu<jX9WAggbO*VXt)#
z&hklaRvIbw&VjY7#}?pf=O4>IUJS(>i~M%#s_Li<@3@B0$khFf`kR^bTDWIZ<6#wI
zMnb#cne57>``P==1E+s$_P8hT;==0}h5k78Vq7>>Mvi&IYTR;ArKY0z^s=~M5xiqp
zQf&W+&?Bna49Sv#=h?p=x$0Uk@M-kytDB!*27IFJrVlSy?cLqoP>b3drSUv#Q$Rqt
zU64tgk$lnfplIH^g5EXDi|+~^Zp^YbrI9di^A|Vp%l)*z9rq-bjf#0{P)^xI+@4R<
z(~c`I`GWV8%e`n7p?lgW>_(c-mp?*pX`2nnbbV|)&PHk3$fFe^J2E>mSYOi~GO8<8
zzKhvQMz7}(kbYP6F~aM^vxWmKgYr&BZIsmc%ZK#%UZO&&CfEViT6&fOKhJ!WxSuzz
zWK_@vmOcD?*S)U<_wV4XXoSFpPAC@!w1sDoGTG?>en_>|aH6S?o%a6D8c+}4hJ2QG
zUt0^V_5=F(%>L9OpX|G_?+^F;B?jG}j*;ah+dwjogG!WwA9FVc;%(A5s}Urz+;9`0
z=J8O&H~q~HHcO-yY!56qJx96R`}m$FQu$JLGMfdMZ=E~*#{DwgJ;8H23?;mRtKLSu
zOQ`ErLvQ6SJTqNeE!OQv7@~rWr3}VSaGcvKtUK|BZy+j&naNvEy9FrEu=T#=BlW^H
z+r-?kIy~G_)Jpk9Q1IT=PJ1y$akZx5!rY_`!CY2@#ort=<-#Vc7Dru_QXa?nzqy0_
zD&!O&tDk=%+DY)u3hh_!Z2l1azTNDKdPzBbSIvHdBOO;+P7ht^k@R!3VNpL6jVZ^x
z#mrkFNfFXhHV<_bv(KKZ-Vx?90N_i&LhA91#f2N{`wJm?*tf7fZ#J<^DUKc7cvc!&
zQngHsB?9Ts7gm+-iU~eu;&>=AK|AjvZ^7jRqPQ+%@?~zHn^Z2+LYc<yrd{kkKixgh
zm6JkBRtQoFqq(i6K5tcowib8T*?km9D7;#pyhtuW3MJ{*5%>5iS_wsr4QQt2hI~4@
za^am1SpudQ`yjsKPNmMQNNQ;Wmt^CfPwBVrr!@|!KC+Sl<p=4#G(vf=66xb&O|(76
zX#*Ja1!t35b)I|(cV1zyYCo{xll&aL3qj(nT-5KS-ye=6oaCSfTApz}%y)X4YqS;8
zu`OTXmZTPHXuw$)2i0Sj?>h<3JByjFmK;m2t&l`y(3(G+W!*fs*dd*#WUSrH60Xwa
zgdV{dd!JW`^~5xCbzfZ!l04#w<O@oeU4qFZb%ftr6yiPCNSc;AGI8C;f)UXbs+C<5
zZams3_|@+bk@$SVa8y_DgAR@GG4Daot`j^_ItJ<<A0~(^uX!%7>T4{17~AJB%=XHb
zR?34&e>{C6N9@VcwW`s#*S+s2S+YK2F`9GUB?#j>k0A5XW0?X*Aq;Uk`haV6l6RSt
zAu6d<RjWV5tjv+^YmxzKax8RD;Yl81ag$DSe+Wh?gE4Ov&U0goR(*Ax(*UH$n&&|4
zn#wbj!TB*S6f!A)UWj{#Ksb-F=DX*HndnlC-px~HqdJ()6X*&IdFPxw(!a~E!`#+T
z`C=inP4;+O=VFss(3dC`m@xXjAq|HXHpEz8xbg0j-^#0AxCc3q?fTh2RbFzz95@7i
z__DlMX$0kXc<@HcV;uC#*?>qD|7vchJh;>dDD&0YNzOKxGor`F$8;Koxm?F8lrXj7
z_yWEOmg}k&1{tYnbAGLPTcc~9tTBFNMtr_H!Af}`xc~4o%DGj2W$FlH0z@z%&FC(Y
zb&<wsf=%HGJm~9qr17hoapu<5zVKr!^i54_hT;*bd6s0eH!zkkT(5>A3rxO@$S^xi
zE9KR<kmPoQ;c%b<+YOyy`}A5&MFWLDZJasaN&s>*%n#lhQ17MB-ZZYdUNP|b<@tx3
zN3}ZT!n7<bP>o#mf?qM~o}LjgGOx+)FjtLM_lTIfSE7`Oq}JB2L}qXN5y6SR5Ty;X
zRZn9*{wsiga-%jn@b$@+qFb$=zE@(N^}bx%O<aE)x#UKZ3lof6g^z_F_kS&TON=Dg
zronI};?<MaZ0B%#l;aAKX0eWJt4U3Y+4s)scY#|xUS0mA9z#EqkSS5&4t>%jDB+r}
z%l|&Pwe~<}%waF|=g&_!Hxlemtx3ERY?K@1EoAIk7+9w;1C$kt!Zb;txiQAk0Ag7q
zzTkDlERKUkydYoG>0BtxIK0G~qd>MJ&k<&=%}ENEmSda6y$@*_0+yCE&nX-04P298
zeIG`SG9n~$oHILv_H%*QB85wZGPf>-_88|p_`cP0yz+@7r@#49(Hy6e1wb{uxfUsS
z-%?x+B3jvp`3+pG(TMyU!_bMcY<6V39D_;2f1J?!yoiOPz#N6{0!|LAfDDF;Wk3{i
z%P&@DdSZ&^AxFoU`7GgDQLlV(Z0iJeOGg+qV?IKNwak%)&s!iuh%r8$5rySj6k<bR
zd&)9c8XS=2AO=P7CN2}rOJNeG%uPCiMTAi683OBbY%UbR=JB<VUcrMU9M9)D%Nv*`
z@dELtSJN9A&yd9ocX$hDo)HaJ*gPoBaM7S{m8Plo5ku*IzHvRk@~NbsSSBoLCVHZs
z9N5ylc&-s?-_3!*C}<!OFvw763zm<7&{H~mr^nt*%7j9Q^u|~|L@%?VBbt|p`O1R%
zm?5AdG?1Nvz6NGUyh87i(U-jwB`mao&*Z+5&Rv$l;6mZ@A7fJyqHD(T`(seoG6Y5~
z`0~<u;U`4Y?=u_&bCA+$kM?k<1as<VAdA!EuazWdP4FN|)?sao`3?0ejl9TA`f?|}
zTdYz?PY9$D**zRNL(BxPQ660zuMkyW9q4Da9B&VD<E&q*n9SggaFkJh&#6e^QY{i+
z$FLrJPp9ID*7rnvIq+;A%a}!Zv5EGgzf#sAEF<q&(DNWczXmRk47g5TNZEL=Mz`Rc
z?3yrx;&UCv03sXh2~JV3)@#@|X$%~SLL#oZf+|FYbw_mD7>AY+qM4PY9xP~#UGuR}
zri|^_w@dj@g4idojUbO)8&^}1q|B9k`h^CyXd*LUk-;DWs{qgDmcP)z*r;zFO<{QA
ztS~mt(g-?{?u}73V2_RFdgCa#XkgRTz^Cy>bZ9KDOOm$>q!vR_jq}C$Ev02zX_qRz
zDo>|tBhXvPGj4Rroid{d$lz{Br$Z4Lw7~r%V{HC~Af6SrNk_Ihf)LSHTv!MZpU#~e
zJ!eS~L=kB>%hP+;g;@33D@h=I7wo%rigH53k}dm~m^`ar`XJ|g$eJTMhxH4-mnj0o
zQdVSiYuxDS{NTFKEB^g_BN<O^`quXPimhafT)vBN5gJUx@@Es<N3eWa8FUlC1s<Hw
zU*U)t<2Z&z2ksKD(09F<jmqg~=rMF%)p3+^1kk*+df}+X28M;)gf+)RTn2sgZF;3_
ztDyqFQ3v^u0sUf%o?(|zpQFvt7<Z}!gA^7$v2wY`MIBAlJME@z#PQjGfvthS-hp9l
z192qnWGe&fPEnT1#@U|=u_|KWERJmND1ta;HoP($tI|L@hHcDBVr;<nRO50`XRjAx
zZF9YWxg7AjoaQVu1k;r5a+T5R7{<ADxX2(=r6*_l8Mf>*V%ZsVlj$H&M}bKP?%;iV
zas$i_4waMO0WX%LkCo|Nu;vF!|1b9LIxNb4?Hm3KIW$8_cQ=YicPT9fp>%htAc!*z
z-6<g=-5@1hLnEEiEe(QzlJX9yYp=D}+AH>6_x;|_^W6Vm|6RxV`(4+0oags5Ju$4&
zlI}8PK>XMwtQzrR4ZWJY9>_u;Y$EA|8s5Q#mo-VMYZ!?%I@5jvUcr<S3WaNEbjlc5
zVH&_`5=sJYt;T~!4H`5JxkK+5mmhinC-H&&?>`O|s*pDVuAoa(Y$lT$5Z%|<Cv-h9
zhmpK9GsJ2d<cfM^8W)PKJYeaTMN@{TDMPY*c*LiY@Z8T<rK9lhBGN@DdJrA_={~AT
zKl4m5#>1lfLuF_UK;m4Un+Jw`5?i42l^2+|c7|AaiO&qluEN1$O}m)V6n69WTgKEA
z>Yost*L`V0^rnDM8QLW>L`zbJgB=uesU~N1#+`E4=tpHy;7&(|4~cFXbI{=m8{H8#
zWF<zroh4aP-fW^V8UT>76yOk9qElw46S2E#2CG>0fOCPR$hixqJyHf+;13tySk-A*
z+$UHGCV86Dt?2lOYFNO`+dB3IywM?8-NWz->60D16tDmt{xamggx7q>90gd~LulK9
zFjjn>jxec^_SldtI~il*4HknLu`2;qoHR~1M0Wvz4VI-#AjIkhT%knbt!@+>SRxgb
z#ZRTv906fjK&AOd`ID^`SQ&)R(}2!KPhe~&!bP-X_D^Ur4<T#5`mQNhko&IIS_{7Y
zS4ihwD+Dl_aKYteIPbOzJ>Yl~xbM>M6H-<9`#h#{vBlDIwkq9qh@}fWkfEVZ0h^TW
zDLau_;X9D+Y>!Iqd(2ZvnoyBwqPr76MNg$p2TGaa1(^<6XV7)+8wT3nqG(AW_eddq
z)c5)8*w#b}m0%(D<Lxz9e(J9URJ=G&DMryQ$P_aH^xGf!5lYJ^OrcPq%Bq5jg_O{g
z!J`g1-Kv7|5uC8sw1`0d;VR4Hlu|5NbNy|IPt~o+Gu8|gLu^~ESf=eTbNlc`;DI;C
z?t~P1rOTJ6jt9&06t~~doD-16PunTIg?gmirg7y__ka?S%@a>ZQ8vb5cYh{KKA7po
z3s$+^n{Y3r!I4^gesnpRw8#ys?1<n)N!YXb(WfCt%gJD)5$2r~&Mg2QLp1$X<I&TR
z#%x-`a8CSF0}@Z`h_n05ktKD)d9+UPF4$hFD|x95M%YoedC<C3pJ=BmB&2V_rpe3D
zEJt)1q{z*>-%a!oOTcG}NU)JoNXxiip*LkbD?~50^IriT3uw}uCWBcA@WyPh?C26l
z@ZqP)Aj%%xa!HB=13Nh6VP`S|2xsuwy(6)eqC}qGtdk#v`|cjzy*|}Sk{#|9h?$=Y
z^(HMw8s5;3Ysg4~+c`siK1P!Vu?^L#8hIn0bm^e0t=AE`)M#!BGF<XH0~{|9E|bGe
z5C}!5htfIj=CzZTUehg=+ajb-39H$Cwnj#r05N-VP+$+FnUETvkc3OR)5^XqGaN2G
zsLsBtxio`qQF<H{70sO8`%aJ#Ll1s~!4TIBiYaZ6TeNlE9)5*rv*ZRvb((H9Q}7A?
zJfW<8$eCf=Caq#nzJ;1Dc~bYF4#l+-hngA+2fy8FmMH8~gTrH+-Z+(tSi>Ugri$yO
zOu7UZlQ<8%u7VV!?keznP29hqHQ9(T!Q3!tCI+Qeq?j=1srBfz%;^&H#;+)sTo2jE
zTs9;TNWo+9XgXiChhKwBof%T;I5+A8S6WhNxD!d>0wAf|<cjm<MunU7QZ&mzaDwCq
zy%ZV(BJ6Ut>tHD6X>uUpr3q#%Px&ylQ*)tHrb&#*eh0THA@=`Z6YSMQ-t@#9s>#xa
zlVa0U)z4_Fsiw|=Q*{rg+Uus8&!+00O-;{F4m_J4dNn;iO_Pv9ws1B*`*3FWY^FzS
zdQxoaV0vn8dZveJ?)=s4m+5K3nK|N_Nz|Fyk+V4r@r5f%Q!LaAWJ%Lh^>gS+3qoHP
zIP@0CzRr(NQ?1sK$?MJRO)uP>S<vuYyjDM>>G{DF0bnDzu$d17&n7c;QJ#8&PoZc}
z^-wGtX-K42<!Fgd=U3w!X?o{YU(!*9e#Jh8VuXrQ-JV~4F23rXv>KwfilD$^W>%nj
zt2JL&;d-kG^vmZ0{aP=e-tf`e=&D~m@6+3KPg?tsv{_ZZ-SBl=PIBwD__~khdY<0u
z8}W@Vo~tMID+AOYKYDH-&1_Jde?)%0h2F4&MYB!#eB;XVPZ9N>T0PfA^ifXfw%N{C
zd%k{Z_S|w8r%Hft;WVtMNbG99-es8G+e$h>mH2!^|D%ZhfriAEoc^xT`M%WbXNiU_
zzlH<3xdV6oRZIPkQ4+^bl2+sl&^}921skAM&w_>#!!Zpf*QKaho}<-EQhjbbHHDLP
z>z_0<p1z_xZPh=inmvKfo_6Y=hDhQL)1d?C{lE(AC8R=ea?{x`bcGya3)xU%1$<{A
zn4&tatT`4L0l&XGova@|(=z^HgyDHpC=SilXvK&Wx!`sFt4oT6=@Bsu52^VBN|J9y
zVBf4y)Y?sLPoU7oB_bcp8F;;}nrWg~#w43`HRg7RTfa7Uf&iY`v+BF^oms+FR$`c=
z9o-qGA#)EVK5q{D-*tX)y~e@UKxG{TOCVJ>YM!hlk?U)!U7wM83CTx|FQ$%0T|PJr
z_c*1!8-C9Ot93v5iX$qx*}oq6FHNwi8uxQtanXbRrtc=$!RBPmbG&npYuXFnOt7zK
zrzZ##ELnJ|RRLjwQTrQsU6^3BPxnwkhTa77BncqSL_^g_^4;oDpk7AvP*6Bog@O-f
zN5uSNv85e+Kf((WY!qkAAVgrs-#AowyCY4ar4wWlJ`v;EMlI$qN%~0Ifz{8C7C~1<
z$<fm_kxdl{M$k#ybutC(=MNai8HFNDFtflT<5;Ugw+8`L*$hfC4)pLQY;Us87VKU@
zdK4_N)70KbDo@sNZ1*_A1^?FT7}-KXiQ$GRez|)=S9o}V*}}d{J55){vztRq%)1*G
zt|(a~G*j~|N$O``<BUKhwCTN-_sD!E(7LdC`yGd^<tV02Fw?tYKYV(86K{R59A{sU
zw8uO)mNqF;MzV_V`Cbr6n?LVnszzY=+7)`nsI79vd#0>dLUD`!AVpWYrkpKLI_{v+
zYNdkwy-^CAhOgx2D1>#m$_{Wen%cQH=iF2J0V%~ha=ud*pHQ(_c(LppJ4u^lYoS-y
z45L~CR|_12Nm#ad=wlD%%5|9ca=_uaGE6s=iXf{PpS`eGv81z0QPP*QyBr2=2K^ld
zZ}IfF3>6imWDne)yr0U+mTQcQ!$Ka!cO!b;284wG{emm?6CHgSn0OM3g%uKv1tvmU
zaz5}h#0{DIQkl!JjLJqm9O=8taBF|qx68k5D3GVuby2Ju*=;G3Mpekwj(Q~+6xU1Z
zCDij&ED+@GeI80Wp5RaGXEZHs=@jGc!a1;(GilkIo3O+S6S__A)YP{XTDzAF)jX6V
zp)b;M`vhd(cHQfhz<cJ_!znG}GpZjJ_h~}+zENh|E5{}bdB};-Xj@_6o-ZuH*rRqT
zf7;N3CvpDzNeUORx>%^v>);BD;7jaBCe5ztMiIw_*G27k=TVg6r0~korOtSHo)YCJ
zqw=^W$URU)30g~Tq6amt)rJX;S57!}&%a$y#usAa@5Kxol3pQQz#;+bg6u)m=5s)p
z=w=EY#rt5)9spi3sUJAZzs1o5-%lCakozl(7olK!z@1vv#Lr)vIjtOns@LN{zUnQE
zfdl?Z`RA!*9I-g}D;G4)Z5Ukg(U}n@Sg1>W#1$^SHc@sB6o&-j)RKr`6I!cqZ_ac&
zynss+Y#ESFONP;@c*`jwG%=lthpqFLkyBJ6zX`1fM&}|VGCV<c=|$o^uadVf#&&iZ
zhdzeVfr|~A;cyzMA204*PpJ6A<NibbEG0ds&e%Nc%mjZ7WiZBGG+vInFu$R<=~ZVB
zPRM)iu<`DG(Q66T(#+fua3N@`Q{ob5mTj#?mrL$d{>KE7MrP``CJsQdDk7su$bPSD
zZ)wtIZC3CnHnpdPQLwMUV975+p>##ptj>vo#UuFoAET`$?<=oLSI7=9cxj?I@@FZW
zOJEKTplG1HRW_%l%k4LbR!P7YrV>#S#*GfO&fs-oLpNmCjM3YZ6UZ<naK5FPgbB`i
zp`Pu>YTTbf56%{OrLGoWb;q3cZRRavV@~Oz;Bc!)d2jNmsa33Qn-GEZu34-<Hv#kA
z#huSHCfX3}u)24iJVI$@nnyZ~dH=;H^TJ0X40=MO@4xOG1U)8BW7^rd2X-Kowop;f
zpA^2=xc*22_ArkN@8wu4T6S?*Pa3;r<4AwtXTQQZS}iqeSrgK`C{cBI7K(wvfxeI4
z7QF4VHU>`)<(5moE$Fj##u}aW&8%2BDzH%rM5puYkZ8l<wml!38e)!p)wQMOVq0}S
zDHr^>X39tJz#wqKCAEw)5=!DJzBEYZdp}K%$zD58muA0&uy`ZH(!C4eTz165_8)$9
z-F2U7>8_~%Ox1*)L^igwdB5&!-A8xi#F?+YS2EBuNgXRn4KQBrmridL`Mq2Y?Z<bm
zd!S|ESp&NVu9SZ3L**C%bT`^gcWr$^#YdojI=9mu*D6q79MD?2Nd6@*DN%FNr+{#Y
z<o%WQ<&ok_i+q#w(6o*ORJF*BAnbfk*RBWDacI}4jCI?ZvX{eKBT_WuG3CbFjB!=s
z`%V-2{mgn8?3`D+H>rezAiXH%doTAMEQ$FY6%Ku1NL-|}5P$Q&&sE+r75!{T`uq#H
z-)g&9T4dsbvh`DCYkdB6m{Q+v%p=8hMR|+Lowagb@}hKsw;=Ub>#qx+4v$v_=NVF2
zhx8_-j1(W_IM>}#nnM78FL2qFdh`vl9=|X6`nF_CWV3{tT&P{(I?O%)ma_fR$*FRU
zgU}P3X7amgBT}Xowc%Y3EXCQwToujz1*>YMFJXL-L#yNf_Kz4GXO=R1>-GvhG8789
z58p(5a0B&B_iAQ(j-FH_+qFO$v>%|W2|`P;C+w^}7BP+mTH3YlaHlt8wW_KnN+Y+0
zeRK!Wvm8aJeU%H!6Io*55pps}a*CmdSmqAH?KP#gGhuv>wKj(QCf-=nJ2&xsML?pr
z?@`i3%9XR#uA9P@&B2bL*3ULRg87EqSzEg9yyEMLgAO)$wiGeE+B9o8em^4qSUdV`
z(_)qZy|s|CwWDt9k^X1uj5<o^A<}MpbC#K?v@caP4?k2rTs1*`qthhw)a${U+7IrF
z2lZJmrmL)794SA`^~}cXJ!jVNabP<(;3(VcLJ?cnY&aT;{koUsclK^P2lwzrfpnxo
zjk5M^=ES7u%3`nBGAp;&%=3g#vG(<Q=21t(GG+c=M@`h}fuCHTKReds-Z;3XFgB0=
z@_44*^RTtS?UU~8skD4UKbJ=6`bQ~}3ccFpDxT+`t)HK`LK;rjo?Cs6wd($I?t$10
z%>h3vXHg^evU8<{U>+JB3gF`Ud)g91aSkCx6_6DHC|Nc%&&TTI{SyjSD3KQQ391(!
zx+97!gv%9zA?U%%<VCJ^=Njv?>#km7J}{wd1-TEJqJmGi(7idnz}VZpxc$9*&|xwi
z-YTo!Y9JpCR-bYg@0%7rx)t7<**>}*J`Y!Y^c4;6y80N8*&=W-bAMmUY+q}TyOE-=
zeVnCPhp)4u-y;jZCl<HuKz{D4hED!|&q4lBR{z`CejXP7X&?Mx+5SNt{vp}UKCb=|
z*>?k0{bMWwV*LZMPy-@60+wY1;z5Batbqu(=aofZ(SAT$c3@sdpoP|XU=}FIIXbXF
zG3c#Dkj!CVadwb4e^AA0Py;B~ry{8NP@|4CxZOXvQ_w9{D!4~bwJke%fHh<&PN8Zw
z`2DJAzhcN_M@WZ7$QURzC@o}KG4#V&;4EqAS|$IYMd;RQXsmzeI%^nObLdBlurH+k
zyMkdS9UKS#VdtQ5>+G;o#qf%SFkrl|8!eEa5zWm711ksBI2uTx4x9{^C8Y(DLc(`C
zf>GBZf}O)DFno0oIT8*iZY^j?2pEi49vJ{Y4o6pX!Qd7G&}#=EA4LdtGSFE@JyeWj
z4v6ILj5Jz`1SCf&$RaUmM~QX%3+6<rxiN@#M(Z3#u?WfA(4I$g<wW-w$WE$9D+$HG
zR-@H#zQABWGOY5yOBT(M6T>qez6b#62fQ#Ek1(~2t)Y)`KJvD5i_yLr&4U3TFpwox
zkL1aTJ<^JOk`reh8SB^S?ZGCm)%oIiPIN;*wwz^LXn>z_Rotsi>X4jxQBeF%#(0@{
zS-G4@1xO4^a&(HDU*cMPF~Z|sOCT0ZP`s0%69D9{0uTTI7>$5<?U&A=mnD{ojZ!b0
zg*+<UWUG#1Y1M%|YmpN8i3T}|R$7VeIj?FW65q!^?Y5NdbxQyMklc1+O4MJ?u!RRy
zz1j+(oz6*mhMu%Yo20lDNjn$AbOcxoPug7zM3`Ve@^hM<wb%MLULUy0ei6c@<pm(&
zN1SOV>&Lx9x|LEWl?={xlF$b7Hl|P>zldZ5Qmv;fCMQoCq{^eDkiPRF)JfqAgqY`~
z>K#V;XvZnA#q;Y#dgUbFj85ef_TgMlmAXZKWj$?OJ`x#{ev=&_!2arHU^+1`E;<0f
zNGp#ANtdhkkz_}RVd)4HZ2Q6lOT93`CPEM<7}2c@6KoJ+f{`a*m|#zX5hmEyr3qGn
zFu`(PU6^3+0ud%y+ocJXf-u3zUtXACRslipvR|!bhg;>OgOa0ibMiHEV%KvZtT`{O
zVlPZE9lsRzT$7u*neWbX$KrExF!R!ia|>?e5gg|hC*)q3V7Wes0-?#dFu~L=OtA0^
z6AaTEVS=4rnqaFJCRo^o36}5_VS=q+nqU?eCRpf&33lv=Fu}$yO|W@{3AP@5VS<rc
zBTTTCOB2k{?9G?zpbHaBS07=56@!WpCYXU-5vqG2b!-t{o{x5WQSbzxBzo}`cdz?Q
zs)QR^RB0ZhSS8J|4<=fRJ#};{NlMssp_m^qnKrWM1d!P|N(Z0jaZjdF!Ah>>m0BPk
zGb`04m%TOz6;Udy$~2X5&wBNuRIaP6@3E!gNlD6Xv5L}LhVpaO0+hE;$jbz@-aZtO
zzt4oE9rM;RSE_U6t+|rH&`61~Zno)5XA7(fPt!ZrUFAN)x6RCp9hKfPvX(#U%HCEl
zr))uefsgfvCfLias#hCTud%9AYO0!i(V@$wp1RrFMQD0uQomz@HDJ}kIcl4gYFkBW
z_>0iAf~t$waSMy8l>v1F92X|o2t{2A5Imk&H(7IQbfaz-t9~S?Zc?d!e6nsnsD6#3
zZc(>>%l*Oxo4GK->OWF6e8H;QQ)-yX6FS^z7(6+bs4H!laAzd>)bN#}QJS}LT(^-E
zzrnf)EvUbuO9`F@CdXc(WVw;-;X>uDBX57F6ut|mJ&jlOGI^F;y)Qt;Qc=7f(R8-#
zoOcI)t(#&5xp@%YL=j9y-3`A+(9~hsG?D_}Fl;8Rr4%})=CNsMgSKp?wD9E%@pHCT
z?Y0PVHdA=G4(=-L@HO=sX3253+}~_^^|;xQx$UNMo6=Ovwnl4DahoP~d+9(MnMd14
zzT4WTlnwlFrr`Ge;#SqfHjW4FYkci?q8&Dr9o@Ta{`pOT9vzO@orM}5?}|GfQ<6Wc
zrF=?B^F)~{p}WI$vqK}eEySiH)rL0e0cFhTdFMgqyNJzqdC+&tryVaig*`pWUV3!u
zcy#62v}KCEOWt%TJ?&x{eOK$@+;sY`(}TSDL3dejC!n;e@<EpyWlx(&ONVktfQ{3b
zO^-uU&n91cPk#5JGI<ndZ*Mnck_T<#6y>@yZTD%<s$uUgc1MUuZ<|Nol4$R|a^Dub
zw`0C{Be5&~LC-E<U%kh>iOn8R9qp~ezP!`^<NWTslmpwleXZbrkkddvWjRhkKQUKd
z0QTU)13IoLTDAv+1O<Zy^ZjSoH0Ox}7$pOIulhf44jL=lGxT&|KO212HpGE5{9$wG
z#@S$%^3YYW{_(PQ%)vp45L#B1;hmIfvaE9kO{(GhugF<#2ZgTQCN3GqY3fus8<yD`
z#z-A8O05-%9M$R>O*0%Z8XVDo$nfxCKep58-8!^8)1&TUI@Z$+QjG5f2;Pf+8nx<q
z@3&O}p<?z7`Ck((bWx~qQKWZKY<uy4O|bu|CK%p<1`p<errN<>`vW!_{QuW^us^oJ
ze1Bnsy$FDe1l%(WlKmK@kPr-eAEG-Rs$&{<%OkujDco-?T;DQ6#UrvRI5KfO%EUJM
zc4~CsPV_y;*!#Y*6%(<RwQ-Q__^`=%n@0%`d=lU>FEe*v8U`g+PrY(}nq*Xv6gBtS
zIX*dWCi$^vig|I$i%)5`uyot#^!nj+*lfB-dFD&MEXNmFZU5Ca*h*dUAMju;dBtsM
z@V24xwyKSeH*Y($|I2u=uK(r1{zvg(OF2JyFu^~|gQflf52o|`Jeca=&VzNa{X0CE
z+czG}?>Bg`KBC{`!K{A9gY~n0=fRpTcre&azTgWUEUslSfGR;f7Z1UMc?1fE|HOmE
z{fr0OxZuH%Z&G-C=fTi_$%ElBXZ;foX7CdacI|=(Q@!B93@&*v*iSrI)&&o?gz=pR
zQ=yw<`^JMw{=|dn{3kq^!Jp&7;(n6{^T+tNc(ANL$AjVh3m(kiI}cVyOZ!_q82m5t
zVBkw0?C3XnFw(!92Mhj>c`(&K&x7IpB_7P;cX_bD|85>^_iy3B;tam?U^0J(2Yb)v
z^@9f^{!2WV=+AgC-{0iH_<qKN;r$a2miF)PU=|1-tg(gYU-MupQf^7CuwU?C3kV)e
z`9I~scISzH&Vw!dH}GHuzrlm){4o!<_%C@d(Ldn9RDa2XxgvP5o!{ia`n|vLVAup{
z2p%kRE{N@yJecMM561fo9xU-!JXoeW|4%$v%3tEa#@POV2m7M&H}YUvzvRK<{sj+~
z@cTU2wLj*;l9Ejle(+!(e;W^$iW-jK!O;Jh2TMZmV1lUIsegh8Ye)B(`wKi+($9G?
ze$>^DKgENE{}T@eyWqh*evb!hK~MW59xUmv^I$r^=E0nPn+MbU^E{aIU*N$s|EKX_
z2|swStUtknCHzGm%;S;=i@W5(f@%465Ior2uXwP8pLj4o44q%`VBvp-2Mhlr9xVK~
zcreXh@?dd)#Dk^%B_0g@&+%YMf5d}j{f#^r<|Plt`%50o;cw%?(tnEwOZqtv2KcYw
z!9M&;9xV8ucrd`<$%6&|Z9JI3f5d|Y|KP#Gf6aqA|64qm<OL6w{`))_^k4E|;s4D%
znC8F1gQfmo%!4)l2_9_zf(O(5B@dSM|0fT&@+%%}8N)L9_js_RZ#)?EI}aB3M?6^4
zU*f@l|KP!N{-^U`$^U`}TlqJ6FrEKm9!&GUga^xPoz0<@;{Pi=7~g-$gQ@%_9t`#?
z9!&LTJQ(?3;K2%hiwCp*pUZ>gvHgk%6aK-2@&21U82o|<ga089CMs2!%=SAx*q7+P
z%7gj*4iCmJ^zZOs)PIHt<Ncd>FxXE#7}9qhjQ3YO7&?Ln+lc-L4<`Osc(9?rod?VM
z2M^Ya;K8JS#e>1o6<rZL*y3;UV1xg}gVFp)JQ$Qk^cxQr9`_RumW1HJGI@RMcfRvr
z$v#{vzs-Ze{sa$p?~(@#XZsx<4D^Es(;-Fu4IWJM_j#~pOf|uuc(8=u=fPzD!GkIO
zF%R|{0{feJu$JH8!J3KwEgsD8PxD}}f13v*m+?`#;K5uGJQy*82g^{pGluu@DuM?)
z@mE0bV2OW<2W$B&JQ(lq@nBbfmj^on{{|11k0h6P*mS{zDMcsziU%wD&V#ivaRV=T
zuvi2SM$PwIJlHAk&v-C@o`2%OwB)>1A~uzN@L-$2;=v;R3J>Q0pYmXNmpoW1`@h43
zwfq(jmj8nXn`8PX9!&AqJXr5H9&GL}@L-ugc(6HwU+`c@e=iT__s=|7z+d3OcmNQa
zjYceM2+|nPouOiWqcYZ71dFni04hNcA+mrNF9kqkUE!oC09+J6?=>k}QUKa!CXz?#
z9YvpW6xrZTk>;~bVJn7+F_DN_2C#)B6wuK)1bcfG3n+;V#lwPP%7O`(#0Up`neMc(
z3Zkn6AXuOl@F7}i8r*pff{yQp7G6gr#7}Tkm*x&5aIDI5E>}<%G3plukOFl$ZV<Zh
z()zbf%iQ1)MaK-6804r>2$q#hY#~;JE5KfpDoP33r1Pgoxk8e&A+Q9i=0?|Mqv+S-
z3<88Hi0NxEt{{M54GjlUGq@;7uq#O5h78ydAaq0mSV%7uHWEs~3CDrR>R!M(URwZ!
zT`}T=NXcCkfT2HFO;ngATVasUcZ@;7ic?5y$T#xDiy#0YgaIFa7s7<jAGk<MWVc@k
zVf{Y|VNeU%%wGs$&hm|rwn*jIK!gy+CVe4<?IVORUv>w`r4WYdj1a<He<p+-BKZy@
zgfPHQLRczME8+0F3n8o&A%p=``_UwdekO$NA%rm0Z$en{KZG#I-3uYCTInYt>_myI
z^IZY<g%B1bihiH6t3<TR+4UDfSV&^0uyE&%Z$g+qN}NX<D$%77Ch{vG%>P0NJ1^u%
zok0j;$d^Kx{|_O|8X<&L{}95U--NKF^nVh<_%4MoUR8si31Qkl31P^bwU7%TEKN1L
z=9>@(;n|VsL<nKdJp(@%!ur1pVI#qvqb}ctu+;BDn9qd}Cirt94DC^H#5W;~7$JmJ
z4)k3JVZL|qFN83HkO;DGLRj&I5XSQCLI|Tp9l)diCm{@jgLDY@16F*?;5mW_tGFhO
zfy@<>>!VZzJUOWlMS)<eOI#<W<LV)xRzwOE^ilcb$GGDsl--|Hi6$nf*?H10c9wkC
zVSx0g@C7{*GAT6Wq{1#4M*3`+)2AN_zT>cq{$evgtq4{AAc+6q&et`bdj$;lpN(Lx
z58XII<D!K<lJs^JL{&8KevOZO>(*WVM|ZSw(lIzj1%>aKP|@nh5y|2Qej*sH*BUW>
z6)9x_LAL;4Fh&r&LTo~Mh>%3=x9-rh0ZWMJFqH=#TSn1}I=OdY7_1QaQ(x8&NNHM|
zo<9()5<o$VCXwy+M%3>{wioqVIn*5hdBHtq%h5`5UQ4QbKGUyn@B+?J4u!E~0muLd
z1tR1+<Ta`~1lWIzN&^taAAxWmrzw)r1OZM3UdY+M5W;3e(H~}yp{)V{azcX}K1iex
z$aV0GAmPH`F($*Yp?>shwisC>7-a5ab;<WKxFQuuAxqaHN+!pglZU@*k8_BDQCP<b
z*4`57XghsS6=jMdE$U6FK?w{QRw6A1H)<NjdF#ql&2W?=v+59n(P>!$$o)fkri6+E
zXw()!`-lJ`Mc$XIezEB~wM9B=uY8wvA?W@<TfrLP8Wgk;UQ;a~2(h^_Hkv=Jvph6L
z5HND814Yw<pplmH#X)YcLQ&%&HiT%nT99*813|I_z-$IUxAY-F01$KMYVk8UJXZiH
z4nVNwQ?iA+PCSJX2f!q)AdUkVI(uP|7PGq|s67CKT*Qqy2njayh86%L5pC)r0FU(@
zdmIEEG!Du`<#30jf9Q<c62#n@2Ju$h7X{>SfRkDz2`#&*`gx)$03><U4XygKK9Fc8
zF92&x^9VQ-A%s~>#rY$IF#dNVSY6L9gs|9GzT^K8!YZYerwP|42sB1Veh6VZ!NMCC
zLYQzQ734w)OTHAs(k_KCU4#%Oi1b(qGkF})h!DacDHlSRR8Y^Gl5awoqR~0Fr@|6K
z2s6-*&if&R8D9!vq!T>LvjiFlA*>1^gweG1mLi0(4gp-sOCik7sDdB$$mCK8>sa(h
z2w|*K*rNvOkD_o9LfFx5FTo!|82LYhu)8FF_b!F7A;tj3pM)^>d9mqv;c#VD_4%==
zOCihxA%vkJgfOzv339VbA<W`J2%|v=VE}CjR%m(Mr4Z(RA%ro1l|}Y9iufUfRWKrP
zUkG84L#}>~uST}C27MbndOIu5*|Xn-u=;-pVL%Dc_&KA=I6?@cAJ!0O2CLH=45(-k
zYDj-X2w}+!#K|qxy;>;vav)j*l*-BQ=~bjlA<QAOPbD-0M>QBBgsFWK!meHlVRIKk
zSn4++jMRs1=TZpMUeENr6v6~Ag)sb|31P0IT}Wov4<MYELRkH&E*xfpOS(wzZAOq{
zSeUWw%v(SJe49`T4B4Bn*e_-$t&PPIwdK@(q<kTSJ$k(I*z-aNbMx#fK?q?x3k17{
zk=;voFNLsXgb?O2iE<%?U2{SRVaR%K3l>YL00>$#xR(d?Rga8rT$Rc9+{U}*QV4_a
zXssRNj8k0*VE{~o5LUDFGBic?n-GRrU6=OOjJp)Vno!cd31M1R+Mh0jupCwBrwbvB
zTx|{^grWaK2s<=2dbUm2Z5)MVaUp~yzXNtat}%nFLd-^(z!Wp`5&RL~g|HpNIfM|l
z^Fs*ZnEZqg!dzC`#nIW8JGqdJy96dVhBxOJ=J-e<)|^$f8#^FH9YVKiVb@8eIRIjb
zdm9@7Dl)UWgAl?16z1&{--IyQo5bVu@%2JT@+Jr&Y+TRMg|Rl~n-E5^Lzprox%}~*
zuyd_Z(T62&DsUAcgaOqAeKfxbVRNvLpXV|VLYTC@*O>Ej*GnM`^6@a~hY(hIDTKwT
ze;2}}t?{4v^3;3hQXqdIaX|V>2-DoL{5*jW!VE8kFsvs(gs__KHtKIen4}BmE@A9e
zZ&Y8!l%bBuK=)T80!xGtCUzl&@viCZSb%38xAq(zwr6WDg)kbk@neJ#mfSY6j1a<n
zd1&V@gs_@}KK=_KEd4?VLqXC*2w|eCTHl4RPyxgd;CRhGaup$j>Fhn5x5T>?!p<GT
zLmpiUVMz!f%+20w$2oXqFXNjK7H)t1lMn{E6vE=Z31NP0--NIx7xZsJ7-<(0=^B8>
zp{lT&DpVMyccM1vyAVeClMuG^T?jMhfw=dYOnei<NN1%$+R@kgSTBSyh{CUgutJ0o
z*8eaBQHJF|gfLoHf&oYBFW-bPNO*xy#djeL7XHu-g;h4GTVyWkLI`7jW%D-5){5go
z2<t!yVI7x3SmRL4r4SZVa3O@9<Hj9CoG3oxab5KdH>CBpmQ409f{|ncjWixmBTOz}
zA^i?T%HUqGA8~yy)Dz&MCP*x9U?mRWh@w48XuR@l{z^xyTj3$v5<Q9dYR+?vIHlQ-
zFFk$z)5ejtpv^A<yNdu#5Ck6pQU&2s`d_7mymbyk!xwefp7%#WM+<hf7)TYwA|!h%
zSb@|CMFK&zJYWWZW@5Zq);L#5Q(t5>R#8&G`aH51@=PLyi~|&oif4UY(hV}y97o8b
z9j%@m*lJFKjm?U0I3gD$2^bCl&PDnGG6lILa}4^0YzaY5>b%MCg_tP7_-?Cy^T3n<
za&;;Qz;-l<5b&V?^LhUYV#AI|RQSp@$O6VYW^Bd7qSfR?`2nr`3|dHJ<Ii}oQqMSg
zpN3!ZU|S;P)K(2o`d)_EyV`lYJBxsN*M1h_d!O{>>!|$fCi8HGb8LZqpuqF9#zThL
zvkM;Vz4P<w;|m^arDF7+b<F(W#7=|XsO<iY>Nulu1zAzTIKj7#F)`e4m!7EdU?m8s
zaHU-by}p{KHLAl!tam5qDs+pb+p;fz!O*e}p+_Te+{wma35cT)m1}t*tpLtaai$Mh
zIfTQ300&7L1P|txZuzFTf-y?Do<TlJ$*Q@T=q97%l-qzxy9vGl%6W<!#n<lJFcyug
z<G#!~b1+3we+#F;c*l1_S@GL+7d+THoBoZ0<j)a=?wG>aN$&s{lF1nd<K!sV5wfi5
z5#%|HuVQrACs}eHOibU{&Ckk+KNhU8e0tX63(CpKt+ujxd<(&Y6|XB`TInm#`Q=xw
zCyelitr{f=l$AWjU=`bbnqL@QQf-2-HOMCK*j0#`TXw;Nm8(<-a#l<eVDu2p1d0?|
z&PBQxR=zW<c}T%s2A)am#xL2<)Ok$ERoAuflBeP9xRk5<I}hfu6S00gImu~wFBkn9
zRv#G^T{$lsZtX_s!j7Hj6g^+Zd)0_0PSDHzyyq-==bRSrIBG;^IoXuKPWF!**ZOY6
z<r^=Hst;0rxb7{Qf*uu)a+O773}*$Sy?X29+Hh=dgcmc9Zrw`iee0gA*ShYu6EtiF
z1dr@)DiY2R9a>y5WlxCgNfJl22m9>0#!^so6Nm_33iiH|Mk6ad9Kxls%`YvL=qm&J
zXL(Ew%3n92Eqp0{7I*8VxWky!k=>iJ2-&z)uiava4ce<dREHkMepCw`zG2KJ-5MbR
zNry;n+4dXt54%l0&T2g1ND`t&O#~7igp42cbSb0^264&05*cQae&ocfD6LpqY+@S(
zi7Vk3kHb5zadVb-&)Dure(0X4<i%o~$VhHI)|@&|e93ih^&I8=><iwO9TM1EbBs>e
z1OVglD#Ctl0mq$)Lls|-XhaRn!q6O(Bh;J6x<X_~BA7gPAg!4A{?3*wGiOMZYIYM*
zu7fq75`0KjFzJ(Q0GTXdN=Eh)*0`&U`!2o$=5jb+S|=J9d0!TDKf>#gg&|QK>Ez=b
zI$t#tHFvgfUx~O(S=mG*%<S8<Y|+bM%<4s?+`PnO{93RDh?Ik%$D*xK8?r@N5rPL}
zpw@3g{s1rbw+|$sqaRfennxxSWkq_d3Pw?redF@j;l2$m9DTeD?wKWsDz2kWZEJxP
zI4q<<?3jk5a*Rx1YoUNC>eyL#v`Bn28(4eZLHd%vl^IqaN9L@@*YU8;%u1BikUHRf
ziNRCbxE9edEXOL5-cDv;<q|()*Ur*c2We>T8|b*VizFQ>6)0}*x3iVa;ceC~D1Ggh
zm*B@hQ+;|>^-vLhBQU~?cULm@(1D7C%s-d!cK;R8Ms&v8$x;t8H4<Qn?Zda#eI>e)
z$bXv$qek^*7X8kHiRIjs3cTdOxUc6hzuO@<UEhB3b~i3jXBPt|utp&TLW(hg1?;?y
zM3<ai5rwcLtBoUEV+$nl2SqnkEK+ZKC`#cYfiu~50qCZ;yflL5s`;uV6VDW>Ni%uR
zv0h$n4-xfQ#L{Q@b39n+hdkXU?W5y@&NoNgt)q76+W6!JeD~%O#RXpGs&D7fqy&d#
z?F`^iL-0#$6Wcj?`Fsure(+$E)7#}}Zz6#9?k5T4C>J~!x6`8yucfOMRaG$@j<1w-
zXET#g2kW>WyVXo>I^C%3@8Nz_Fgd-u{TO%aLF`sXGS1aa2kN-+hpzjM!ss)f9`|ZL
z+%VD<IcYPa^2tMcQs^l2UOvZ7<=QHnD*%mp4BCi`HjZ_^leF}37d|R&f$7Qi+C)c7
zzaC}TU2w{f`Ml?`i7hQmJP^`I?_q;!5Z=a-TMWltNG2t?V_;*p2{&DZq5D_*V9B0P
zNMjqfZ05+Dx{c%6CXRNf>c#Nu?Y$mR7kq910A1z8$B<f4u;p5v(~G0GAGj;zTh#7_
zof+N7;hIWCD~@mCg0RZ#=NF6GMQ2E?cDKFFG$6t-```>3Sh|Mb!F+q~M{Dw$4&QML
zKL(Vw@a~dd&GT(qshdf&WL_gu7ry>Nod0QK8itw$vOTVG@r@N_^@pFXwdZ-F;&HnL
z7K<z3%>yoYu#LMt#$hVSX_n+-iXNNcW&wKqY5K;dlmsW{?U^MdPwJ>Nq7r&~q`g0x
zKtP-L?&l+KH&=4s&m+ArVCbwl@@`E>@L;7PVs*W|MG8^1Y@8IKTfAY#Uj*At?pKC=
z@lD|0r}{Vus+q1IklxA-38U{W#WBXJ#4;(m=QUH6@0KYj7(n4|ZsSK5!HeL*xIayH
z8=IWq2FEM(UV9cB%-@+`@$UVe9d(%pKTp_^v*P3{sV|x4g6Bg0j&-K^uNgknv>+}b
zyFH#gf;A1zYKvg%{cLUMie`iGsQ!szkmB?}_}B3`jb0Z$GvT%RO_zc8q(|9cX+i7f
zB2#$P2ZeYwWA>B$8K&$4Ndmf0TpRpnc&NVkylt|DNr*0d<Tiavu|HemJ|B(6t<t`M
z`w8zn!eil#xUAc`eh+KXr9td@lJQ5r{nRYnwX|nXJ?9w`@}7%r-Xt#Vs2^GDa<Aw%
znAzuLsoUQVeOAwnbvjQdv1-~tE$ucpw>ayG`;N!6oL<9ZRkPuEbK4!%Q>V1aFnj#I
zq*b+!=j$$E!l$M7kfXk^J?BQLZ#)>!bDJv9ub&&v`)ur=pDn(gb`VrJM@<G4V(s<l
z196iJQ*?9rvCLYV_i1TS>|Rfg(|nPmEyQVVx4l(Ui>1~oL%7rUNGlnUc5~dRj}c0n
zA{MYo702HL%u7M=V9D5R`Xjc1JuUJgWiJFgkSS5&y=5>K3$H;7Wag<pY-+=|JLj)Y
z+2{x!lhWA)WW<FCSTs{^Y9@vBQm}!0Ib~)m2RK%dN&9sOL+NrT4Nl|f$OyF9%e>Hp
z`-HUV1S4>9cO?lPM3KxXiTZ1jZ>MD3Nj^QIqcI}6-W`-{flQg?Mfq8S!oT^$95R`O
zKCS$MTOxuiGpgr}8d9XUD@)4lhEefD`KP>iJYXc@@TJ-a7MB1Pe<KQhAgdKUXPeQm
zfAiiJ+F^&0EdW2y!fT`s%(JjCxep6}h0d6J%L1pJFA|e5SK)(;0-x~s)j=$-<F;$t
zhKwKrUb97&5kP%PJ6Em({p0rNGRgQkdBI*OSj_zU0tJdW0GmepjkdOHbLUFn)ui}t
zhPq_K^06M9);2Z>l*PbL+`x;(ftGPh>Taj+bQv&L(u*$lK6x+lq0ek4h~X-(F^DNm
zV7ZISh2iNP2K#hLp0B=C(TleJOEwlu8GzKM-OVDm+v}B~(<6%+9gKBFjOG1gjKN-?
z*a)7ts$Jhi5^oK&S!Gna6;{3rp9r4k^@kIxFWJo*KivV`SZ))_Oxw0mwhd0ZX=hUI
zvSf2=EV--&6!H@YZsHD?f(bFwOD;(<o3M#7*1D=v)Y96mBI8>&3sbgp63HY4dr6c_
zQA~M>mxUTo`>iG8zKAx_!elmF{-F06d1Gu^xC}}XebX?o*>F_;y2p7ibGMB7akIHq
zbGvJkXt){4D>KVmFoi${`gACjfuB;ZuV9(!x`~F=Hn#W<^brIoNtbSuFGJ|sB<y+%
zd?>BEp20$k#O#V|k8L8g{(-R-joAX(#VOf=AS(+(D7oG&%xUgiGH2(#Y#y0qg%H9L
z%$}AkH}S*Al#K}>a5h#`jw%3S8O(;L`F3@dgt9R>&Xg;3o<$TWu<fhjWo+GxcIzp+
zJa?y}9s1A|n(@;Q)sPGcG~n|(X&m*thk$Vhc6~5o#$!cfjW&6IdZcHV_`m=bTh8VV
zt?;=qD0Z3D{9!Yt3w}twCVp@e5ib(55I#yk*v%P><{fAd`+0)S2W{sLd3?dp_Epxf
zV^-TnEw;DFh)lg0og8k%wHFInPyJ<ZcAz}TOE#bH<BY-43YxiGv1z>fL=8sRh8u;$
zS10D0i7F-WmEi-4*|+aCi*{n;`On(|GSrV{@Ik7gl>o`>QtD1aua?&a4jH!(EhzxG
z$=mWT%&cOqtYU5{V|uq=Wu<{VB*^1JCQWbbS<SNX$d&NU-8UGxfwD@v4u_eUJ0=n8
z<T7cOL!FD5Wc65TwJa{gH%}`QRWk=2W;1d#3ejvEgH+d5`2K-BpD3<VsEVmxrj0A^
zYA_+AK}z^-3!epDkKU}uo7obIGJanP#iKi)Ck^f8oaY80WfK@`c>AW8PT}-!HodII
zMPy-%aD}t*ladAucz@25IJM3*!J`ij6zGt&arLsd(j+lts@subh*%RzQnl%56b6{I
zTQ$F&*l_IFc-g}Uxd;1{0THwSLe|<i#<F7BZ?j$3>YmB6q0E+uwtih`(^a3J!US|I
z43hw5x_Y;FSv5_><@XmN4-A^*e=>v(`o3DoNjir4J@xuz$?8YX6ljH>5*kxPz!pNy
z7R+wB&A*l~gB1OF)qV-@d^L>JA4sVMCp^`+SJcTUhrZ0=Qq8dd@}VQm$4Mw>SLy{7
zg|4%C&~+U*bGumFkhZPm&R7b)%~)(<%V{y6aBjj^885K|Y;2Mz5envj->y8CS!qLC
z<=(X6w+RK0a1p^p<T#h_DG@eyicl%UUsb=mCWDnPLlBPZyKQF^moKrJzf>46Q5oO$
z$u}p}%BG(ZcgG+vX}xDPf1xc-kdLRIWP(#Rk?sgKp>7(t1J#%(TF;ckahUq@4!{Uu
zB~e+NU*Ak%S3qpSR^P&djI#8$`TEf3H+{uIR8EW8KnrGmD?Nia;y`HxQW9m`88p?*
zK_to=o8>u4hc{O3G_Gt#%~RXG1?3HJ$EVaI#j(FGs%P(2F0@hH7HJ(4ZT01MF}0lo
zK&brY>vIy&1~x<Os@u?J5({x>rSV(OeQ|<5<^<o8s00W{0Gao9>Xw73x}mQ!Az7Pt
zx(m%Yh0X3<<78l-b#Bvv&>lww19lZ3(u&N;uRU0ZLr|bX(eB$!w+pg{eRAR{#Ly;Y
z8W(1aB!%sCzVj_&kJu0`#8j|7kmeapP+0fecCjjysI*Ih7j6dH5!ts3ximW%cp=UU
zw=zkjBYUux9owth>;;2sNF`<XjyRy+!%@k&M6cs|B%5?zm3MDM3*KO=E#AGpM(MA%
zID^LA0l-xrM89tZ?jRvLzp8}_)e2C<>aZNhl)Sn)$a`fkC;LqfEf~G0`RW&?>n2g7
zMguRC)-baGjFpn2-7?@xN%o`jW>Livo29GmZ`mDG`ndKQsjjKJ;unK^eUFfc*Esps
zQ239zo5g}YqBngKXLvBW3qhTiY|H*c%HW8J4#gmRPsgE8$>U^$?Fc?;1{()3@;DMo
z6f?cIi*_hsxnFei3yiR#NOT}dEMx>-bN{VLSn0N}6J>j3pdWVJOL4~dk@$N~!)@w|
z@)D4xw^~cKo65y{z2-RWk3XZm{LohKebsbC{w{;#azS%O?p0};NQEw6&i4SWk0qbT
z_}7X`=4eZ8G+6l5SjtBl1+pY>Jl{hIYHo_eH?BxI?w8zyTi=gKqmtcYTiEATxf$~y
zfO4gG?K&RmaHE96O~C_Sp8oSNG4}E=kFJjpv}+ivMshuB2>*=er)xS3;68e1Bbm24
z-z=-p`GGe|b5dTcrQ8a^gMEBF)yZS4ZtC@^9KnM*qQ9~qlE=J);K6P<hmAeCn&td1
z_6i%0g!pSMb`_@^2xsZWlLl~xPA*jk<NA^|&Zdc)5$pD$y~7g(4_4t0EA6v_^2Zel
zRFXY!%JLXA*KR=YU=`1mlw`Uz9c$M_pt;!--3z&2o+Eg$8?K4`F4vW%?pii=^K%W1
z7JG>xcrZaf1_c@GW{)mO90QFL-;W$3!MaZnJeXjR@uOR#ZK@Uj&+=gUCk5^@tTss8
z2FT^lYe0j@VjXSF-cX`MM5-#3y~DQ>c3xA{HOrR`C31kW8^9<O;lxuwrfejp7I@Va
zF9~&|D~fQc{-zol(IYslN(o9~0IU51<T-?iy4FaLHrHK|=I8VvRTph~BD&9pRGrsE
zr6@(yB2V)GO5_b?P&}=(7pb=QYHt_ah1L>fOYsla-Z*UTNUI_8_L49_z7hw$!Fl?w
zt9GD)nk(^ySx~y~q`7C$qo*BhXwQo_v8HbYO%Ng@-Yq|Be`c4AEVwCS)6vW)+bm}C
z>`A!H=$mKnv-~FZVDX7!qWx{-Z^VTBpFQcQlYofLOrp&Wp^ce~33b5Ylj|f%zYZYi
zu0s*7N;om8Ory+M)ygTKB9z|cT)HRB-7fBA<m1`Wo;-~ra0!M?oG8MRSYv(C)+-~n
zl-6G7EE;vkv$L;lZBO({+1JN&UPJ(o)kRO+eQ{fF@xEE0Fz-!?#1pY8<aHMDq%Ijc
z0~yk6DH{~nk~6&09l3J|sqv#ct0I)F!<XIlxxKeEjjQ`$4V-UEh6W`4B-@KY5b514
z{A8teLkYOa6R<hdwx$ndAZltv_Kx=W3PSK;_$d+(Zet#8Ftln(d*LyVdyuwA(6Zm|
z-ibN{o4`G9r%!dgS5Q~{eIATt3qviYg4b^KDD8@`$*?#I{2|y|<(ya`W=YYDVO2hm
z-3u;|^J)DfHJ5R_fZ;WHEb8*0vcrMYyW#oTUY766nG`q@WQ%G)=bGkS-(uGJg2}9x
zh@a1=_0o&D`$_%~^8?g~+v`N6_T!}}Zfwg;rn&GT$Io`bu0nfeWxkV$``lWSwE&Y$
z*juq*H(QnX8R2Wz4~1JC9atP@%HcG2I!oj$8G87-+3ItOGkNY$Xt?wgZ$KaCS`G2p
z426{ck_S5zQ-a12^x$y!-e%7gnWIy|lp={-2vwCv;vkw-6fO$SPN&7D!n&JcL5TH{
zE{EnhdoZR94(z6S5f;WfUiQ0l(7<$FTn|3>b29KJ9`;+H>Sk$$ejRT1ae2l7UND#J
zR`Q6>Nl1IPhe-tEl^cQVMLy)I9j}K{t+Fd&)VF$RZl&);w2|U<E8t*-730X$w+ok~
z<7KS+QAa{fL#Vk!Ih`7Q!GjUe0l2U~(4k{^`H|cb;L9dt6L4&466ux!k+3!GWDSX&
z2FPP_7YT)6d1~E3;SQVwYl0n?HvR5sYTS)syf?q=OTddzs9PV*H{HQ^;vI?5GS2AV
zz0Wqa<4Y3R0bB_cUlQ6HviMlZk|2KTLKRc`&`v>L%!hn)B)u{<Tx368n%b(Mb@cV!
z`BXWayGt6ffuI6TyVvI*41nm<jYVbtLSA<a`(K-c9k39w4QqulJa-)~lW{#87y>)V
z*P4$CbNQ^$QHk7Xeu;V{8~qax7H<}tz`4`ny995I5Z}i4j`Ux3T*S0-V7z%JV2Q4i
zqDUY}3#TUCbXSN|DWVCko$^8l(<xgIW9(@S1L)zs);rCwOBiCtXznh!)~tCS1Y6K_
zpCaGKWIs+erSWH4PDu2bqRk#0#vCkZyMC5a6IIjT8EqcwRzpC)-IU4{T2w7d+U+BE
z_rzwlrKIPzM>V}-pMk7=`)j8~6pf|KuOA#;T<#Z={oujQr(g4PaUL6q&GR$tNwbR)
zY@LU>dSo*`7vAR&UavDOrp+ss$7)&2tDtr-x=W-R==CCP!M&_cO+uL+p4<HzZm}ed
z9|=lDeVCpRw(D+BqROS?D-%xEAr+b_ipjoTs(*OuNN;Z1t8ktQ5;(kH2cqJ1$FLqN
zIW4YVPwBBl)7IHvU_pJ*2xCMhqw6qGAP7s$q!YcRx@?Co`hy2^t0b7$&em#!MfnK8
zgG7`A7<-~X3%3`-jCu392O39+uaZXOnc~Q*5#1%q(h7gpu_$zdT;Dfa5#Mu~$zf)v
zo$M^4O+X$w^a~&;Y{{FL(J{lLKM*aQIbH5KVrC<QT=5Jgj)|>knfBaz@f_*>-Ee*}
zTjeMYTnPbsJQlR(NK#Q%CstOU>%{{hr-S3f<r!H$$?BM6bLclm)0s$mZ<>ItI!2Bg
z@kB?9{J!&G`lBm;B!Tk0-hwT+*^sW}Rz?vJ(r3*^hcZ5M^`|(NYGXfM44irywWfZp
z$4cOniVBf&ME+4GhdR>3S>XYpAvSq)saEVW$-AuH6=8&qbVPB1EH^UN@;#Si)E?}p
z(Zxik-yVo!JYmg}Sbv}VfnV0EAt#)yg%S0Q#o&$mAms4drK&Es=5^B}NvmCm_|Ujm
zEaQyS@95oRIUy^dE36^pey*+ga)u~NsK=7^&Vc4?J1@#lwCz1t&rO2`e7s1+O-B{j
zU3}`nOAiJ_`=yJ^csYAJX*A?|?!d<-iI^CjcXU|=Vw-(3UZmzLT?c6i7gHjAEykx{
zlZ8*b$mC#^4$<z>r@<W-&VG<0gJL=+bqK!iOJtKW(=jDPQH3w(vPRvniG0e7S@)=l
zjtH3!q@(oq&V%R?aGwThFwt(J`>?&Xx@AtHiO>sx#sb~W(3*{<uI}W_=o2%16fTDW
zjMv0o1Oos+c9Q4{(8v<CTE<N$s8b_M@Csx9!$c<>g0}VBv9yD>o#I84-7j{UtFH|d
zY7$6?;Zu26anH-WsgJxhRez;^H|C?q#?Z~jkB~@iPNQfY<A<D!JT!FKC+1b=%<@IC
zdfbR{Z^w(Qdrp=7+N~5xdI-e>L+`l-Ttjskx<X?^yyv7Xbffbyx^5qXxM)T*{M|t9
zDWfY5q;1cd<lm-i8&jNYO0s4)xf)Ly)0~rbNRgB%Nf%Sn;0R?cg!}Sa4C3jNrqdj=
zb_g#(O*r()y10B5{7N^K6fIKF_ygLBb~M7xIn!vN{j#y+Q)V|B$a;?k6hub{aJ}*w
zx>4huUtwIubIf0?-Rf@_9-YVY$d{pb>We~u3{I6aFrwaIbr!)DTit6T8;T#@&lIx7
zf7Xoz_MnAD@8+-QdRJo~#G%tq82GXDG2m1ne%Y7jv1HTFQ)s&^kjXqWu%GY1al;Xf
zv12JTweWc&6GfM-_-Pw+35vFQkQd8~d9SOn3ABB2pRZXJ;i@Sck|ltek~JGQm|N1Q
z>K&w{Xa~F*cYxrAWgw#+9n3Ag5m(AWnp_pQCB2J0C$g)kh~^poZ2y1(^~;wgvYBOp
z9XQQ#QMp9X*@l2DCHewDrr`jNY@6SVy0FvEl^z_1Xu{5*%s0254A_$8BV)g5^kyN)
z&Auz&ic^z=kwe4+9#YBW%f^Ad$(?)yGg#EUe*bt7l{ieZR(eTrO@S}YCfd^ix;#>d
z-nzGmcU7{9W-uHoSk`avfg(jt%;MjP<Avc*DBE-XbycCQIp0R5|AAlZ<6ZV?$sl!y
zdCV76RV-4UoMA4x{&vaIu3wB?VCqmM<=E4uj|{l7%JalR1MM71Q`GW13D`VYmDpv5
z=E@NG6;szEwno|zP5u-bs~av@Wqf#EQ%0B*;b`Iu;!hlhA5uJ-#Snjo{d%x;iR7;5
zE_)S`Vlj3M=99`^zT-wz1#A?mXO&GRDNoUF_*<&9^CH)fBI7A|(-}#!C}v3)o9cBK
z(;Sh<kk#(eMP~yeSAu=X%ARAdD!r!tiu;;141lH1vIE7t8b-S>Me#!F=va#Kg%o*i
zKEl!>9fbl{49Rlo77!{JCf9<MJu((OQU<*D+)0|E(EuS>;mF!iXEu(VN>OweV2Y-o
zEgMoV8(?P6jWo{D?f}v3Q~Dl<U@yZ7z56#75FQj1+%iuR&dcHf#GHm<6R9&TC$E1l
zym4x1>5-1_+l$?AW_fI2$cg}v0IwURF94*S_NZfMv;`D1+y_&j<#ukD>lB0+`=e~p
zybNHIt{-{<ASJP4vr19d<3I2B6`@R#G3f#@@O7oyh~ujRPozfifdtF&&bc03Js=G)
z5UkZhI4Xt3kC1aDDRzJan*a<IF!5c-b<yJ4$I>5h7s$$_D9q?EFjEg7EL^cPqRurW
zt4Ek&@Xy#i{~vqz85Cu<^$VONIfo`g6GT8ja!w5hNJddqKyr|r1XNN3l0lM4PLd^q
zNS3C_IcKoRQAC0w0(~3MIXdGwGv}Q5t$VBP_h)~3YS*sXYp?bHQ3RAy;BgM`fjZ#`
z*(wu6omsGl(7ZAks2orRxUbAN8<LG}QA={oH-M<|PzDg<6}k;wdn6?8y=H5(^RzUX
zo8Qwqgn<P1Y0l7<N!Q(Cyc-VI!ZxgELc+h{BR2f>%s?^}K`>Z1)?|&8P7NerUyurB
z!s-Cskey+;3bAZiTWHBH_B?<B8L`cYu`*~A8u8T(v26`$vyq5n!302rw~~f+&yZ9c
zL~VjZ<PO0PRHfQPdhf~08sJD*fkYH*NE#+HzUhtYt}1y5CX$a_7DpzrB_J*!zN~<c
zTLB|8gY*ONi2Nd0UcvUt`dO?w34MUOW(<Uc$nWKNwwjTN+Z!q1SWTQm(kSnwNj44e
zeH<ELJWTs7cPf}j7Yz-E+o|U>7>^kkx=i^{cI41NJfFdOfNKnF4EW+cTB49`Kodb0
zth5Ts$g>lKVtk)lS!@xc!U__zP-3<sX&yx;E-2|kY?CSDi>4*$X5j>C=@dTR2mD0z
zo8CkSX|6F615K4=9*=%C3Rp2Gvd<uz#eliYKzgHy6~9n&I~_eC3iTBp>MIzaIa>S}
znI%X1z!r>g8<{v*n*O?hBqR-QyO(7?9TNzm;<lq*en(~rq-!o`iN~d{NXP6C75TC&
zr9TI-^d^X9z*ORe++x!|*}_gh_(^Fx^Dr2(2}99)Y&Zf?qGRN)LV^!2Qb-~Ir8&Z}
zRcwoN8PXkomk<SZ<1ZNuPD)Plm;FSGfGfA6fueh|8`=79U>u7f!9?fE<vB{VIZ|85
zr7!7J8GI7Q=~RGsfJ|g!;2bH?kjw)-+lfn`0wHhWAJ|K$02%_KN-ud1iK;_TvmoTb
zK+ydiAyaNlMlR9h53FBE#ZbXAB&4`?d;zz(SeL?a2|=JP6-_a_0c;<FC>Uu&A)T%P
zT_X%&hJVR6UHzD0*%opkQwt}~8owQhgkqRJ!5aj629zHWt`FxR-&`JD!goQXhUGDC
zUl2%WqTXajWaX=_o2yzFicEVyXrE(PS73mDPABQVP(o^^x1PiQ>M4$V0K!&MEDzR(
zD`ugA=8|G`?<-R~J7TDR08o+5HbclK8&&NLDL2zF4-D`Lk!j|7dPf-u6B_Rk8PeV+
zBnjQQ6y=1k$R&bm2vD1&Y);1lrt5z;P=5u|kN}CIrsKJQ)tP#Y#?rAU()Ee<{SVVe
z4}h4P1;TSTx0F62)Gclt6e8URl!GJ(e(zZfb|^x;ckN+-U<f&q4V`T|US%{;_ZiUs
z7LD^qK!rE3J?)lu=!X&<2)2=~@(M5;z|i#4GW|sjGh^MMp;gySYXm=KOFZj`H@iGX
zMhH><Y(ST$NweuqFluP?CY@dl*#OR_X1gZH`dJ!Ber`@J;*uZ%5r2Aj^Bg-*I+Z$@
zKpaAD2BNn$oXB*z{Kb$m1(zhxiH`k~;|H*V4$-Ew1+ChggRk`Bp&>SJ_`ISkKxK>`
zaU!}Plcpl?+Rl+S4{i9UOIc-5`M>}uV2pc)bO|t0v&vqxIY(au)o5vlSHrHT$QZzw
z`}c2NM36<ypO_9AC_WfcW^hSWycXIpq=h+Kca6E<m!al11n|$1HT2-O?~t)LbLHR?
z9rlb8;|*im(5`=aKx7EGzJJ{g?Eb`vdWq{&v!T)*FfO9$Y~GMGFB-TBn~&QCf3Ow(
zENyhm;Q6`H9u+Jxl}<rX)d43&#^pvPi7TL(G{8TA^?BQ{zQ@JY8li-w%`gi&3xGK<
z%FrC7`AIPvTo_xE8<)&XXCpA812SMv8eHjn9+c>Iaqzj4`P?{_HdTA$)?M|jZQk9j
zG5Ve7^N!_SA;?6V-kr>xX4^Z;>ghrXAL}yb0F4HYOIrZn(g92g2JGAPT&iQS3{SHR
z0d8e7OSZI`=~QSo?l04+@CuPh9@6m}UdCelh&j>wQTXWx!w#4;RTkvqHi%{(L{&G&
zl7UP0LX$qQZ^#|2fmo|bOdLBNq)!=(!+4M}ZX}V8Y0!@^S$#bb$O?%Ic}TQx?-W9N
zlWNicd-(ciqh%Y9Yozc8B$^*T8DAv-6r6^cfJCwfVM9%KcmuKioJO$?8l^BK#V(Ab
zr%WUQB`WinQGy&fuRJ?Wr$w)H5U?Mg+-GSvv|#{|;!KcC0ttm9RIgFs#v&*A+DzD{
zKQq3QZg}Uha{R$MGJOLw<@0JfXU%?~==?f^9DYwI&s}={8v1z<b%UWdWpAjyS-|l#
zHSI!7eg>6=SORx2(SbA-!oyU<Gq~DA-c*`|g_3QW@Z_^})~f;X10*aD5Dwj^>^VLm
zsShl%h8WQX*n#B42dcKo+Zq@yl(+2+DAPL$C!dkuEoe(9FwCafG?)mFBiKu)4FTcY
z8X&QF1m2$`-9(~?-`?i1Db6{D6wXo2_dasuRLA@PAz4OBsg4=7F9%o|QKHO|NfHrJ
z7~&rmvhoc?MGs2w2oE&Y6o^fgONnVzFg*X#9f^aI*Y;s9_zunLBz|UOAjF&F(_uv)
z*}R+>&IPe~wRAjuJR)vGJ%Y!s=0=p<V3nD{yuO;$kpqCPCcC;Jz#Z~Yn7Se-vF7C$
ziI1N+1ga}umgC8nVwIF!xHI+0#<eVq=SoOAZLOFY9(8T)9tBTaNB(%E)92R<B2}hF
zRUx&W<eUdI4@f=0xVj@Gjt^;v9TpSHybE<8<Vg@KAJsWdiRWN;JR1Pgkjq*u$*~*V
zb}SbTUJ|wTAe>#7#9C-R7`Z7c(t+=N(NgSU1!U756lmPE9}Avz|DwD94v?*e6V-@6
z?lO{)hJ^xJbVtSwhLIB2L85g#o{KZEYBC}Yu?U(@!lsTynockZJy)U7Zd^z0bk`f2
zZm4c|TT*w|bax+3&ya4<SW?f_bkAFw-UZ#>m89N{>E8D=eY?7SpOX5%O!vWQ`cd`z
zF_QanX8H+e2T1e=$dd=CX9nnL2buH+FC`CNo*BGCJH)3qB$PZPHZvqeJ1na=tdKmc
zJTt6LJ90yBL_2vzXJ$m7cGOsJ)I53AYG%}qcFaj{%r$xJ@ywVP?YOVrctG-a$jtat
z+KFhr3HbBmiNyMVY2-;Pl*ybK`fQ0)A*?ic@|DD7;S6o2$5egt)EkfK<8;ad@N|pb
zbeG4>h{RMi?Q~xKO!@Kjki^uA-t60%8EEp`-TJpL>Sq_~r}mF$v1Z>E&%iKF-oBB5
zeVCagIGH1(o5MMId*NhiW^OtWGT)UvLvk`t;<-SZGB=RCAknbM<~h%B4<_q5m7E-O
z6=|6q!CE3MU-d>mG9<FRhlbERol~%m=5U=GC=upcUn6~-^vV!2ne)Bn`*h28k}Fmz
zD;^Ci#-7Vobn6d1*R4)gd>fVn8djf5u03y9PNds#xVQ0=ZrQ70v-o6f;NJSkJ+zv8
ztMH(P<uJN6t9xtlv+r!^whTQt#_qlAIeGVjZhI+Z>&@(zA>I47l=sQA@A14=h~BJ+
z(d}Gqq;EgjejvF)mbzX~w>*?i*(CYiP;&Qk$}T)*n@Q@O)SInqZ$C`Y?TC5pRyXW?
zq1zSk+PR^>1DX8@(nph{|7dlxH<j`!=<SmJJv1`|f?)`z8PZ{xG%YXkVY(E_aQdNn
zBhIiPL76@viQ!A)Tb#1Dl(}yX6XBm<cpa9*4`05;T$HAD1Y(4y5e*~bgd)L9rD^4m
z;UDx#kz|r1!Sai_R&xD{T;^ERdC}4R@wxu%C4|ixwu~T66fCOlNNAvJ2r7>yO*>CI
z9OQ>ae%((|gYjyVyb6oTnkKDcB-s_Sx(NqZrym!VsGo>N_CU%-FI(KZ8s_1VSjicF
zmgN_rNgUD3kM8U<_xZ87UbkTf<n;T>y~Y=((%hUtNQ${(*p5Y!seFfK*T-JJpH%^y
zw>#b%52=xOlH9>wr;z--X&n<IT-R+Imx%G`;R&v2#p*A4Fm0z>7~)mibIl=t&V!{o
zZQ)7Q9eh~)#)Hi#cC6z|H5`53`^JN<H<ZH(47^eB6;F9E;grWmobYx7-w+2D6ddz7
z)MO$)ab_RB=6EI_Bgi{s1{_BX3q1l6Oy_i8_M&zp=Mx45560W8XpG>&R{QKYx7v*#
z08>g82pEs{lL*N>Bj@~Su>+VR6a(#BAF$AwC_cS)uR4R=3f6A={GKP4S)AT_plQ4r
zHii+`dOONef?^3bR3F64<I5L@36UXqlWWZEPsJ+;rCYXNWw2M=y03<RNdq%CZT)Dl
z1xIBwFPuT74t7;=-5xql$(OX+Li}vGqzy-;u5Arh*#OcUU(`UA99Pz>WK~!>dq@>u
zven5L=(x$?hlx+gb5nmkiNS~Po-h;z;LkB}DXRB~5e30^!(~{b88z0QV0LI&y^9dN
z&?$qz%+H8ItQQDmues;^*r;Mnaw@-edneeg0YV8uD>^yBv2R47&VAW{zJS4K&fx}P
z5Q=w$G-0*b;^^}Fb3?dN70dz`i)qcMr_&oBd{J%#J_6Z1>#(qF&R7@k=pp97eI!#y
z{r<BL;W|fYuE-J{?q2*Ad==*bdHS$DODj?;=b;Z^R-B;qI9cC7h+22g3jyjTpWGeM
zp+a)=qyfx!|LX<e5zBrOE=<<9K6hPNhFxQ5ov0Jp@6+GNbn5aw*>r|+;wL-L`O}9B
zhi`EpcrYKS2EBwP5vHch#CTup(Tu>7w&lkj$w8QogmC|NQ4F%x7_I0}Bp)R$$0c0D
z=ZhQ4WVo~%TGS@^rQ?(DJp+cOpa_CK`ne$br|vtQzGK~t{L+{ndyk3KJ)D8psir9}
zB^fkV#;em7<nigO=7=<wcZE$*IDTxRypz~BL7ae*=zICbV+WbCj@)Rx?bH-S$@}}^
z)GERdVzYkVb+!`8R-F`7dQ1pruo=++3CNJ^cF6_HevvgXHNi|X8YdGxQAV0xOy3(a
zb4lDH{@YD5HI)zw+crwKh%`LAK-p#iR2jZTS&mlZW+1i$4P{I^kx*R7Q4kD`MkIqI
z3z~hnWFM?mU{uJ>;=^!cAE=9FM3jmt-);&eE9!@9QS?>OtlD%0TU)=NHuP&za&`!p
zBZVaB3glWdGg11kzo3U>wo79>p7LNKd+iFc?2eJ49L$W=2p)`gCo-xa^CEI}n=<=#
z;e<V=ix=)+G-oa#PBQcnn+@#L$}bbANQ3~^+FKYxePiyq5ybKj*LMyK#%ed2vbo-2
z(O)l<t;5Zd2F8S|P^8DTZqnh5-t01<i{|Ul&5rkDQ#P^A)_=K~ji`lDb2K?7WiF~D
zJu-=R1RCSC$6X`{s(9gCRGz$40TkC^R(GixO8R7?DLI9>=fp+dKiCWrow(EIw6mHj
zO`3ZFYhB&9moIRV6hZ|F8VI!<<`W}@T!y!aD41x;q;()s^O2K^I(a(NFkZ~NrX6z~
zr>G)p_EBE2(RwGtU`6IY9UFnU==EM<D9_1J9-*t{4U9R`TzuN~Ynql?T&+HQJ>$7I
zixWCmI*2lXS6d0j1bkDr6actPON5n^SBt|@3yekx?(`Vms&LdSwD!pNn5EJd9o$cM
zDI~a8&Z^CI3x&Xn3@kt{H|o47P^iCj*{BQq_HF#il7J<3BXTi?>w`!ylipe5>luQI
zf&qc;_PLmcRP;^uEP!?-3vJbqy9c?WFAB+Q?lX{1ZFR@KDxzJn5sB8>+N`Y1Xh9_q
zh)JFMc&oT%<f)^Am97&bxm4eNp)~m%d}7m5`(dBXnuUkhpd+{0o!tQqrN;+)!Tzpw
zLr<PQ?723+SLR%AXk+I(YXv#Tew{U6X!r0ks{ZF*S4=)dGo2Y6*iq;6H=D=rAMSsd
zi3J=OLJILc2gL67*t$Y#<P*e%nP7XihG`#L@b6rO1rMSNHZyrz1Qk2YlcowZ%UYLu
zRg)N#4c!hDWVsSvdvSs6iW^NLkM)!E=mpC6ZZr~}r4OPw7LSSJ`JT<-$B?Ux;9EWH
zI>`X~J;&|3Ej&z9CS2x7hnmhhbh|r=p*%j?*Q_^Jq}dt(PAn%eC+fb__@JRYD5Sug
zdxO8m#hot+xqfBuV|BNid_~$*rByMwplFX6VD)Ns=$gvo`*>haXYHwp`jSIM+74JZ
zKwLswL&|wL3joQ}^w7E)k{}v+fB&VS>fJlCdm^s{1&T&4E8x%`h-5Io^6}D}(s(~9
zQtz@~d`&0FAYi0FdPBh9Ri#te3c-Vg5A4Q%*<?T;@llfxXB8QGa>rk18o!XlxtG(&
z`O@LQf{Rco3CsHjIHj{olK6E99t@b^@~BUww7mX{mFFAkx9j+BvJ7(eD-=h=nB?5N
zawQX|JQ&(xCA3y}kTdfI4pb07QTRp6IS=;miF!&)aPcV*_R!&!2SY{hVCLsM7{zM@
z4+bp@A-UnPe#(PgLhxW}XFOOlf(LVT{}AfrzM-o?5STuDl}^4@*e~)bpIMr736ADw
z8{3zOp(2+n2~L}eLfuov_zx<hXSOWbzO-41Y1F3ZwCdlgo!zkg*w7|1_8_U!0bPHx
zNvZ~{hv2~+cK2Ikb<)a>_X2>-$~_zWxye_|n#x!Y2b^a68bv%1O`{KS%1%J62p+5_
zFZ`nqo=ntJF;(TKEd5iGf&0D3i#09rvyabtFg*kh7P1%M@u7*%KX~V%ug9Sr{>DBV
z`NZ7I=jS|_l>R9XrX(+={6QngQOk><tmM^O^1kEG<@#Ty0^S_e>w9IpctwxFDf`U5
zG1{pH%pY%{F|7GxpkhA84YXa@_TCcG<^<T0VuA+)!1z_*LG!ygtzHLXU@8l+6PXX*
zihXy0H|Mwywy-;=fDe)I^>ZHV5rPMcyMu=AymiS}eB4(g%ZX#vM`6{So7GSGHy#XA
zSw7J3=J*38)+cwq@n9(OPj0dLQw2QHxA@9~m5}=zulmQ|^0#6QIOoBDBmQ=|0knVs
z*VQu~jN-||s(>ePdLFESL1#SJ)!W|wm_c#=fnkb4r#u+zT|bJT#5m39z@StF50)F4
z&>oaEuA0IcoQKel-25{w;K9WQ^11E7<p>^()vpLMr26*NGK-M<Qy$EvDmMh`CR>Mj
z#)Gk1G%1Gm93Yy1&Ui3kg>D277We}X=6}wEwV&}|7GHU=*fSms`J4yCJmbOKzVcv}
zXFOOLf(Hxw%7ZzXVBy4H&^zbBxWDmW2Z0D4Y@QW``hL)zGak(8oCoW_dd`E%n4Ixo
z*UosbhfEmX@nE`VJQ(Pl2dh5g!Pvg>U=vrr@nA?_c`%<d9t@2n$}s-tJlLz>@nA?l
z@L-1LJXpuoA9%2bXFS-$uRNG6f(H}%jt9Gc#)Gk)@?Zer1erhZV2)=zSS^AFWAl7X
z`FkGh{uvKeiQvJo9(QB?j0a;o<-ropcrcmod9aBy9;^mVhv3015j+^>4?NhtGafAO
zlm~PADGw%%;K6FncrXM2mY;$D=?5N67QutDpYdRal-%ntHh#*3HC{dC!Seqd9<1^=
z9<1hHJXqRqJlNfT@nA2`c(Cj<9?a`E9!%*EJeY`MEP@B?3`Fo?(Jv7^SVC5D@XN&f
zGak(C8xQs<q`|TvG`OG>yKqappr_`H2kZ3jRw{J0EF51ibPy_>%0J`5@*NR8*xVTp
zwt?Wmg2PUEFzizvtoMuuGeGcQN};Db7>@tsdNCLFDGwH}SaLxp{gekwJmtZngL$Md
zOUXApZ?vc)crc1H9&FxRcO1ckVc&g?;K4RLQO<ZU`ZFGEb*z}nDwyJo2eULk<H2fV
z`L<7au-w>F9xUmc2Qxe6!8*n&ZY0_#Ilz@P9_N6pe6_k>>G9uW)VO(jBZrh3g?<Xb
zgDDJ*lo{#dnw;@q-7S=-JlLeB1%d~gsvyR!eDE@FOS%$JapBoN<iQ5~F}%O=V7ImY
z0S~7AGagJUmJq>%P3ru>gJBK)iw9f!jR#ZyjtA2@<G~W)Qm+v_*kxv-Kk{INl?Wc}
z1%sAGMXr8~JkCpMssb99bqIYo<dp+tz`=1ny=IZcA<K`B&Du_~t%-~STKPfz$}|lE
z3|k{=Y6s<txzhlXm{~%z1*Yv-$f0X<O;>4XghQK>%%JU%W<HLV^2p}Px*~80rSl3+
zHGi55Gp&nKv!YA$qGpSbc&p-Ovl2~<YC)5|%P9|5sM%`%v2}Go^KKpDW5~TWkpV~x
zXHx5}B<K=?2Xk*hy56p)-L?|h4lQj(@L-NK?f&BJ8xCzf>1~@19Xjq6-qWql?(G&w
z9c>@l;REfBnw=XC@J_3;b_5TWUD}yD-MLoU(Gl4J*X-(a=(0X)782@OAnGch=|mZ9
z&+DdZIqE7d=uR)~Yz^(YW8IZ})a_BwHQ3#Cyxbis-VrR`je5O(qM&n%qx)H1_mT=#
z`*aU#R2Q_g3%RVfd7!tAqqhmUcT&8wEU9-^yknoH*QUE~8Mps!Qg;Gw&$e~XmTrFw
zQD3%r--0d>CAkkRsu@1r_dsR<$)?xTeIPcezp=C*Wv6$jqOF;ums+*`i+F!v_kBW{
zUV{2Twy*)@<W`oRfnkn8p0ZwgS|AnPP>S_{L{Go;Odk>L&{aGtw(db8#|}|d;H&Oo
zF^M4=o4#uvaHjm15BQBn<O@ei>ION(h6eZsxyyzzY=DZKBPlAwJQ;O@WurRpMiuJO
zwF`#{iAVMEBp!GG72l1R(vI1^8>1N=6)ux?vl;W~8uic{@hTke5*ybg9uL8rh~%7z
zR-JfeGx0oZBEE1Uv1cOr-9#$hWIE^M3)RUio5`H8$-KhJmpzk(?<R}!rb;=d%2lUc
z*-X6-o2o9Hs_mJoe>e38ZyLfm4ON|Pv6*fQo9-x_?&_KDc{kmMH#5LFGo(5*Vly)q
zHZxH;Gu1OQ^KRxX-s~Lb?1Jj-lFjT&*z8*2>_*S*yLX84)!Pr8Z+BJS?%TZm6!!LW
z;oC1gZ;#)>-@@@=$XqZ~HP{7P7)Ce@s|beE3&Y!j5#Y}eam|sa&5_y8k%!Mw7R^!j
z&e3ko(c{lEaLqHR&0n;gzZ5>tRy2RPcb;=={tEsA57z>p+Jb=Xg3$lx!4}lEmTb3H
z!nf9n{%_{N2*2`R+E4fI6z_kg{r^aq7vGS#LKxUh%ST|yS4G=TIQohE))UFQ{^Iuj
zg<$`u!vQ}*!rlkTA)GJ-681h!X)OG|<Aj|fVbdv2f98apBVqH|o<DKI^8I%6A9cKp
z9e)}2wD3_vVNZ5pbwg3cd{OX=;+DnIu-GymXjyh#h5u4T^nOKP>#Mw^%HYDv&ZXCJ
zYgMsn)la*s3zusWi)#lz)<$R6MfcU0{x2h8A4Z{@V;!Hz8h6IqwkEm`C!pPv(21$H
zJ5&E33G@EH3JGJ*|2-0BOS%g4Md~ew`H|idCZr%V6HfC3xU8moQlQ+HC1#FQ{O=)Q
zbMizt?%iLGZ|PBF^3%##TTZNcR%+(YRe`mV>{gSlN~G~|O$M7+ni3epn+cOi^_Yc3
z2+zkbhw)R~X9|;K9AQ#@f&OX%hy8a*m|3QDfb`^cgrD3Y5<Is@aTjU4?<y!$BUG_G
zv)>QoiW%2j!02&?ggLeS1rlaD&0tE%L>a;%<7oRG5=O}G3Pj11KA7G)MZ%)5@r0cs
zVe!qo9khuW`RWKHEHqd+a+;`6>VuZMGEe+>NZ6NCB#b18+Upz%b65Bg2~%guweSrD
zj<nO1OCNGfmr9SA{Dy=H{f2~@oFQS+2qbK}^m3iW?(0(|Z137{NEnbEfrJ@Qp2+<g
z39E_xH0#fYpSI|N5%^jv8N*^%x;~o_jj;=t86Q00pMo-bfQtp=I5GJV3BzQpk%Ax3
zt_q<rMt$6QA9=rK5%WR{3PJo&k+8UH-y>nurQtKN7+p}_)@-EXwrr_|TEVwCZx1Y2
zUOt@8!0PNu!L7t#_2592&i$uIm}`Jt0jf0T&{T26b01!lUn5~3{vi^^bB2V$PmwTL
z!Wd<UIRAJqMz%D)>ybW;>J$l6!+SoJJbVOt)%&hUuUQ#_^#C2{v8{1W2G`VW4*;Z8
zv>>m}2LsV$<dBnX7*uH#ORj79-W`QeZZsmNiE2wuXI;6#^ittcZPit;h`)n`y?{<s
zAgAeAXvheWW(wMT4%L14)Z2X*Bc8dV>DDihuou4GmPnmG&DVhwk4K=k=}-R=5@!8N
zBrM^78wor9M@U#WeqpnYuNw^AV=@0i%uBkR&iv737jxQpi?2wSF^Q{vyzHT7TE;a(
zX;q6DNtwka(t{?uV9^3?h1%QAv}!>39ddRb7>dyNJ14Y`k$;4QNg|N27_cm0@3O?_
z*q<R`Xy-_nv+&K;t(B*zNSN(7t^7KO&F5f~DbpU6+UY^5ul-0nIaj;5hCCr7^<oD$
z1cNZ|atkX#bLRyJZ%3Uwq1c*iH$`-5!YkPT8KP4pti74E6Buq+^-x+hEl~|9Cc$<b
zbBRi~Jnbca7cv3~OXc<jbf%%}7x>~Q;Pk)r-1!+2HjN~LEHDQcVHLPXy}ov<_AXl*
zIwAfts1v0c2FN3hVAJo}xOce)R~XZ!#KXP{;~1IjdnD}e-$%mM{aN&xl{PXkX$NsM
zqwbS(ZnVFaU$%*S{C;?rPzn>uhVmis{g-*oiFf}V687a32@4Uc0*BIFYUd3t688Yk
z_s1k$<#AUD_MC<oDe5E(j?R^n214;{8x?qL2khiZG%p`pAQNc(h=jQ#kg$WFB4Ojr
z=SUa_appGc90^;;=QW65a@R!Xb?nzZL&BtgK*G{~M8Y(DasC<!%lEIF9JzJ?8+49;
zqvWxjhHK)J2?u3g`7<Q!IYZ~Jy)310uj}>SBVkS$Pj>MppJ19W6Ed}3VT%w|T0oz)
zm$7Ie^F#$2G~S%>MGf>uT|~XJv?FRNCn3(HzUnC3iRu~%L&^OS35)*|BrNeaBn*ar
z3`4nQ|0pfmO@r9$E-T4$3w!O~K*CbfOcK8#VP3yR!kqgVBbsFV1Nlsm?u;0VNvsm^
zkX?R5e0fzyWX3T_g7k9x4*kh;kb0H>LdJzi1QJI6*GO3EITBX(H;}MT7+%}|00~R|
z9TIl%0}^IxfBBI6F&c8{g?6Wfp*w_El`HsgxPYjUzeB>JPmwUMQzT3lgRne|JC^L&
z8<p1^(|r*%QSJf)qB`wiWd0QrmiliaVe{x+X#}=GgyPz+F+Tq>66X8=3KC|7z5<j$
zLcya+K=HQ6r+S1hL<UU!hJ@w*4J0h_A0lC1F!Za&!tomD&fJ&7&XKU~KOkX=zae4I
ze}aTX{s9T|Hjqp<bOSi#h_#>w+T(B;*j+_JZ_q%ijgE=@D<mxPPmnNE*vqa*k6z14
zzO<x?|0^Uc^Os1NsYanAPsx6c*S%#NTXVuo<bQ>PnZYs+v9nSQvRu8(dAG|ourcvn
zDD_wg-<Cw8G2j^ln0>y=QC#AZ`#+6@dH>gtuq*@;mWJMlgl>i;ZCg_33ae9}#7_MV
z2{S{w;7XVk2p7u|vAq2}J(4xL6cyQB*VoA%BVxOS544SYAkAW+Es@dnN?)LqOGEfT
z2fduIu#Nc91H%TfCB%QJ#rzN;$7*te)dX8N^9Bj4?F4(({?CxGM;IKPsKMt**gASK
z%=21A04L#p6A248K<5y}S&=qot7}rXtWvLGY{O{?qRxtGC;#lyh6Xb2A5Ov<KzTh#
zK-`3SsDaBgMGV457q?Hn3J15LLfYvU3#o~c1-O$b5J(sh6HSS*0Vbnb)iUuRQy(|W
z&>f%QDATmAmCdr1Ydh0mtaTEn$s2ZYMg!{Pj$giwztP{}!hoM%T^*K&u6+?7(Ha{0
zM<mP_+g2LmaE<u5L|XyU1rhIVu<j-`?rz8JMk?#3HcTbfBrsg>804ulII7R2sWP!{
zWp~Hn)i_1MvVM((MgA!g7WoYcvxK3mvtvHouhZ~BRRy+b+!d{HCqF0&#)tFd5f~1*
z@C=a}4v~kkcz<CXY|Lg8@6x0izCMX3?}0xlJ$%A}rz%~+JwyI(+aa50L?Zc?+Fd-g
zd1jfyCcnfC9f|&x2nimK5wjkee+LOG`+o}wdxTMW8`o3=y>>8nUxH+zo_I-u$i>{H
z*g!-L<H1Kg<LwLR7;J=yvi&hc!F2m?AYmVVf`sM%CrFqAMsFvtM|pvs$fK+r@uW|=
z**6}A#uRmSHVZq9(eRXz&P}5bq2Yy8Vn4<agEKJ@>&SD8tu{O21f1Ls>(He6^amvD
zBbMbak+9TrBrNhP5*GhEB+Ln;)CZG$gCw(%=$h3n6=lNIUn5};Fns#o6ig8hq!61Y
zR-zL990_yPc%>t|@oJ0C6sByX=#Sw5;ncw03J$kv_7Z&<uxPt75%_wH4kSr5Lp4_u
z86u1}hi+gni&l!y+ZZ{8ubCR6u_Z~63?C$bN^U(3B}hx;z5M3J+R1GR60t$p79a8s
z+g!~NO6`78yGr?cPA$CNabt{((C$@`!3x1x=v+ba_PYTz(-Qnn)TpLFLPGt^e5}t6
z{tOBG^j}88T>DX0a`q4BggUUI8lwrxb#LKaM{|t54ZeZuYX8AsAUeY|;H3;iIAUMh
z!A??~(CrPO!g5@1YDcXOVV@V_NGibZeq7+SYyTz^=IZj9>2^O1<cCGZWisABCmV>f
zPZn~!6ecRlHtjx?-9n!a1PT6tgiR*L@|gB!-Wgg}O%i#qwKy@fqMinNf`9SuFr%ct
zB;Wrk5*G3=B+T9Xqxk)D!|#zW(Z7v^At%(IAz|I!{<o%I#XG5*r6z{cWo)RLp)S(A
z)6yxf|8y_Ju3>DQx=$(qi8Mlb3E#a(;$ZPbpCqQ(-nJ~E>Gk(C#LE01<VbJumr7OP
zQ*&J)Gmhc83Yc*m5T!65)@-Gc-TR;b^rCT4VAMwAD(bZ7aO@y{Y;w7yz~3ZF@se-F
zjuOYU1#kdcNP#2gKt^|I7wsGI%PIw#%+YO3<<5NhVo{Hr)Lx8Emtr;LGFklu36uGT
zgz^3<681v2h`Kxj_04s4{)J%x!OdqQx0Ky)YU!HRwBY#!cbp<&9e;_0N&W>AM*fUy
zdbKU}Ii_U}u2*o$*z7}i!Pv|7=7P~l*9oPni6`l_Zu9;P4zlz<hYVKg!C}c+zd*tS
zL8nL<--3x!4-7<qKNEEGR)JZhJUyLD11VK17$AD9C{+ILeYjHmiHJo~xu9a|LPe`f
z%HKi4c>ggHwwkuERzKHDak1`3&gIPkV<BCs{2=}pzae3aXGj=;kM|EqSO5YE!+G`_
z5;iGyj)bAh9R$AQObqBU=9uc+TX^o}sdMv%jy(EYj+fVoK=RXfv`fWa%2WS6B&-nE
z*#L%8|N0yWW0j?39{P%ewbE_@@qLDk0ifG$qK6*>6x|U>*q1*bVVD^%7bky*gr%M%
zVG)!GNKn!1mf>LCLE64Z1=0_il3vWr@w{;;AA)#T-@64$1|y;ClcqmD*-n=_1n1}>
z#^rYHA(tf2k+8^rAz`Usk+37k1=HIxlGpzn348I+k+9BfY))b{+*xdyeRoJBOM4WM
zfTR64Bn)`<PmwT5X>QvLT2o?vVWsP&9$MCnSM%Nhu{2Zaen7$!zae1@_&zXZR2<@d
zA3}bg`Dl>XT^Iqkh4H_TFpIxN!qNi&+eldZS0v2Im%5o8jT{XUeTa-e!sh)+E2Qx}
z1=v9eFrO3|G7R3TC%`x=0&?k_`AqlUsbR<7-6XyrF|kw>UOA<=tyEAW@DPKN-6+<t
z8A^Y!ia~%DOt2?|*05mH`2hO(t&=^;8$@D}XXzC0p-eL%?N5;~^>0YnO#~8lQAG=Z
zgoz@MFdQsJ1QM3~6$#s%qvBl)5S+(ZDCe$fnbc~%fP@6bBxge<$3!Ah8vcfak<h4E
zXV9WaQ{P~0x&Q!zxsVx9`cP1!A1p3fIvAj>j3Xlfeu;#M{t^kJB>skkk<Jf>1@UEV
zQ1~L3pj=HpKw<E4$5;7162?sfYy66Yp|fxkogray2qX;nJ0uJRze2K&|0@!9zr>eU
zB_{An<6IN7(q4vf#fB56@$`zpRX_DeYn4V&e~Y9`+2=nZVNrhz2{XaqgU3Nvz9M0b
zU_vJ8MihB&6krk)9>S7AQHsGt!W2UzM;H+RZX`4`gF$9S=O9aDB>rd%G=R4Ynl};>
z5{-99!7q?7N10rUB~Gu0-C!gz@f{%gN=YL&A_X2<&Y)8gqo)7b@Gp@tAj|KNFqJ<d
zVYBB**y=w(!g9VLVMrwZ5fT>Y+b$+-PAP5CDQSM0=)!F<NryKED-phhcbJpFu-M;3
z!pixDF)j&vV~9uQP`_sIm7FL?M;ZtJyGR({O^tsC2@CiY66X7#Az^`k0|^8F--(2I
z{}BoE{u3n3`)5elldniv1*#sam|lrL!Wg@CiiC-({2B@KMjP`*MPv1DO3Zd5Z1{?V
zrK2hY1sg{E9VATr3<<;eH;}N>GbF6!=SZ0M-$ug55lC2&jDi1ufP|sn`Y96j<ewp7
z7gT<Vgh`(xVHl#PNSOaOBn)`#cSu<7?~pJojXy)eSkI6!=_iU7eyKpzze2)@W&Tqn
z3`6+mNEp5F{}vKPtoV13Fem~E(^5G{!qR??gkg#P84?ElOC$_Q_`igN5ec6nVaUS&
zH6$$T|0yI){Fg|W^fx4o@ux@_*0mpyFhjA3?jMmb|6d_tE#HtZ;Eza{BI<vFghhUb
zgb~U7T_h}!w=whfDH3);=-><qb3t`i1OtI*NEoYc(K!-E=m(U3BG$+j1^k~z!c1=c
z&mduFTIWbuC)$e!)TamjdI%)!@Ea1=fIz|$&XBMG?zqy#1JWuO*yVp52@@4_(^2^^
zAYmH6Az@&3=?hxtNZ7&OM8f)iK*C!8i%3}gUn5~#e}aTroFid%Uy(3x)c+U>3;Yj}
zFcIOOBVqb7|3bo$6#o+>%=<q_!dTCcu&Q4mVSDPr&!i02rGA2h#Y+7g3G+Tf!UF$=
zghl)k3G?$kL&E01L&6BpkTBTyNLbn_62|jA5(Yj)!p4J;k)i{TazqhGnD^gD!lb`P
z!dTOj<cIz)687;2B<xub0tu_;K1ITo{|*us@;wrk^eZH+;CDz^$#+PY>ZPEhQzXpb
z`Y(|%lAj`BPfw9BC;|yvYyFCZS^NBRB#fFh|1Xd*?eCGWh;t;&|Jn~o80FtU!jh@E
zs!owG(!YU()tn(=dS8*SsJ}+STu+g(_}`GQC*q|T(UF*ENZ6-uNZ4Rx(~n3P6_Cy3
zJ0vXYdn9ZcfrKTVAz|s)<xi2YUV7UzB&>=dFvn|p{(B_M;S33@`VI+eK_FpHZKp_B
zAB$-}0trj~4GA;*0}_@<4Kf*2J4M3GenY}g*w2x$nSrlJnC(|2O!?<X7#b0p)-;2P
z={F>7?!SbDt$szqj=mycVAA+gBn*VE@f{MDc8Y}2v;T&K-TW&g?D{zp#&m{+X%P9H
zB4MrwB#iL`#zYmwGgtZ?3A6qV31cF*MId34|3xGWgZ=L#VG2JWVFu{Zzd*uTe~N^y
zv2=fjgdt=9hJ;1`fP~F_L&7>#tuwBBA&@Y%{|O|_q-0hn-j9GMoTrQ@31ejsGNJXv
zQU4gz)LQ(>Q_pQAzxbskakI!Ewu0iy%6d*)r<YSRJF%|?+`@1lZA^^~OP?WO(X~3{
ztgowkM+$XAzD!S^2wvcf<8mpV(pk2AUE35^<nr>d-utNMubnMcYOJ-<ZDI@qcH8|n
zn_fH}64{P@?bN$|mpl;x6bf#z>Izgjg;6&MD)m?;fHWbf+}kkx3!dEV_b>xLF~1Kc
ztOUs1*jE0`yxVlRbCLV)kRbt_FQ}5qNtSX?6AcY8XM6+6m;at-7@i9uMoUB*im|LQ
z0hcVjxO6k8F8AbHQX>jxGj##>t}agt)K?0gJNcO(65s{dO`qKtL@g$Zad!=x7*p6{
zUv*#MdR#5Q<X`q^lf2f_Vh$h>*h6ZIEXQ+b6t?8>g5y}zT(C&sLZ$}y<<uLPmtIu&
z`%5}EWG11ozi93B9ac!Y7#lPeb4P$o{{22swftI6+F)Kaf5rf6imJN|wVTuJkos%p
zKI>7bqGtP--R!Svh3<<y##G2fAYppNmUNG;QD{{cRzdT|0sJ@kUr-+>TwW*{my&gP
z_Pl4~U1-g)jV*vN<`Sx$K@NPppvY9}PCY((l`XB(EFLR|;JXLqwKHoUUite<BrK|e
zC+w{Q9){PqiLg&Kc{B?RXO`MMd~P<r^)U=!X>Q|AYM5e6k=UpQ^nFE4+GjfA)B?FP
z4HP#P>yBuKAds-gw`O!q3$6yeDvl}dYE3e)W!Gyr(7Ek4F1-L(cc<Q%+#;+I+6Bt?
z`f}~*I*Bx|Xnf`>SE<Z+OVeGa^=LSbiz<^q!t&PY!;$i$2jf2Dj9OmKnO^eCF=ENj
z6YkYqk?`0nv!k_qLZ~*i!1c-3<#?l6@Z*%Q-u?LCu$<n}<k>4tt}1;VhK2Szb0ozF
zb?Wi&&@UWp-BUF6RVLY~fkz+7vc7Tix?r=L0zYaJerMO8iZSt+Mq(|`_|g5G6#auh
zvkl`bkFU3Il-WHw+<|eH$4TjRD@%FQo2M3cVZS+OEk2wm4$z<z7yewGgSz`PmGc_K
zox{;Lp0#kgCa3q;zjU^pys|F6u^s*9=t*VWX9wSty_F*x2Lq|2g)8vSL-aZ&#Zo7`
zaK7n<RQREtD@_s<jt4|83fUcbiwuAjWg(m}<x?k&H4V*$es(VPld3@x9%}pdPM84@
z%fJ6{;4N0HL3%xEzl{>K4nSLxfZYqk8-*R|&18?OSXcO3-G>S_Y7%a$h`Behu!aem
zG#!t_(}-_{zz6h6xY7g2nqqGUPgwX0_CqAsCRXbriRZd`_rj>_eI&g>g`jlGC?%9$
zeX0~gaGuO%`?TGp8vq}YH5efQGeqD%aznGPaA`XI-OdYx`oI%IGfik+Zm?iC1N*Qc
zeKlBE7hf_4`4bW2#S{hX&bJqrari`3FV44a<aLTqgGdyioCi%p79dKMUTP1S=k79W
zH6W5uqf5PvobqA9a&K+D)j3DeDOEC(tWiemiMY2AR2VcOIp9imFoFu>jp{t7!g%Q>
z_y)TWR2Y9*I)V!0aY0aF(hcbWT=^JG->5K=L9lPS;do)d85IU^6F#-Vl!>-e;-{JF
z3lLNoo=ponyEo*N3N!HmxEU}{pHX2|$oX<Ij78+sy}k!wZ?h?w_~?u=1zrdts4zdK
zM<xrlnbO=Rt+bg7HgSvAZi`vCr&O5uDHVo1yR?us&RpNfTseG)IRa&u?fSo{umffd
zrM}8z$Yk6ccLapQV9|E_lnN7GZWXOOqr#G2D0!Mx`Yl?YB3x%wSVR+74A}P?Go!|$
zjGzgdDuN0Nr*8j|3XAZOt^uD@VTR{aSf<GxDi))UOZo^Z3^pTLbxMU91;e36r&d@u
zf(o-Zgjyh|F!v_$G&4Y<nWd7iVgeImE(Ae^sUWDZ=2I$620?`#ol#*tXH=N`S1L^R
zaOo0I=9CJfF_Ae$P+{^2`scx;GzZ30Dh!06!o<y;87b^ymMt=JtSVWo^35JMol#-B
z2r3MjT^K=yNuN_;H#&2qbd8B}FLEU?u!<uKZTYK38C&<FD?h?e;Oe+`MunLKFV#e3
zNuz_lQekKl4!rtA{HIjd^;Y>HMifs36&7#)l?s~%<5nT4FjQJ+!f*r?7STk?|CI_;
z+Jaj^kHDc^33u1NQDFzH5!h@t&8JjY?AA)GWgeHq+Vh<=D(nb+rDW0OP#ZC~d`5+J
zpHX3C><B6>?K>*0Aos>O6&5pRLzt!c9TleOIF#~nZ2<G)7G^#*VSf6S{Bsw}xJQ<;
z=TsQCzOUZ(uT<DUj&*3hRLmI_Mw&~x1@Ut+cT6GCskwN!2JF;$@v7~mItvR!Iu`wK
zOVfL14wfwD?Ag>Rxz^ShZkwR}Gb+p}T-D6>oC>?aY@HryWZ}Q8<1w4#a&$_C1)fr2
z@DA^k8++CH!NjLj*pr=B-$UpOtedMlZ^NXCzHSJ`!^amKNuih9c!&zARQd>PLX2PG
zHn(2F%n>vt(jM%h=O<3+U07@O$1Okw1s4c*=QYp;)HhA25?csx>thG{0?^`Y>wG+e
z^BA8+`A%$lcDDK)%GRK>cXx91(A^~lt{fit8U`!4^>4Bi^mNj_6J_R98(pWDXSG>n
zOFhh!3S7O!of_c7dZR4Y1-O2j@^aMtYSdtE^s-t^!y2c?{fHC!lkKM`e#n%~U@~zK
z(#O_J(|qc>iK+RR5CEYQP$T@a)$IhUR}>q089o%P1yY+bf&RuLqZ>EwZLwa36NgU9
zzqywyMG8&)45cUKur`T=RuOYNvsw+eU6a|gRxJ2Rh261Ux%-t0OZbio3pla0E+~*X
z+FUA&m#UlS-to^bv$P(j!9Ox6C|d71+Fa<269(B0P)%|uo>5^2rg29IDokq?L4`R_
zA9PAHN3a6)m=;bp6A@Hc$;(<L0`RhVU#q{r;3o7$xmnG+#f+$xZnKs5j0$T8(J<%Q
znlznJVMr}^IVct{ub)z3B&)o(3(Hf3yzv<gDDk|hrM>LE21VAo->5JSE*qG%H!a3$
zZ(bt$z`G3FS_BnV0xu#swZi=I6TeYm&p<3_9~zdsX#2q_2rBHzR(BqnUxez;GeOB<
zw<?)6h@isw-+$uO@NSW17LFe}qrzy~TA@52u&jJ{ee8<x?vSyaQel+Q++Cgir3fla
zqX<XG=Hqp{v4nut*47Ow`^|7A6s(eWDYj(iRG3NA85P!e(ba~?`kV?Q-XJck0G?7|
zpAl48n$H&m6;{EmHd!oQUyP%_aPuk~ZQ#?zS^0A+4Ab0_s2e~=!1t938_yfemgZX+
z<hit)SM`+&<2$9ohQ^Erl8V-Fa-`3wF!;F@c1DHmIkvS}BB(H~-9|bD6$W%5?)5)J
zP+{UcYoz>NxS*1Wc9?@ZQkSN`Qejm)lza|27+`GjF-AUpS}8|s8VBMpP-5et&0q}D
zPrjr#9JUg$SVJ7qr5s4rdBi(NBqoM#hjGj6D}Pknuw`v?5YKaKZ>(PPjWV3Me^J2(
zC}6vXdhKqA{A_D4^Tv|*sJ*+nUBw;SO=UKr8#WdKBzCi+*7=wD_85XHtj8VkU^`d%
zQe~p?IdJg#`T#DByARBC@Z6oS{dR@zlvJVvw7^b8qzc?tWc4mLMQ1?*FOAgS55{P9
zJR5h|%DlJh4Z_2PJIDClusc9GUR^NuO}%Z->A)?p%u1>CN!jv^nvL88ix7>RZuD1C
zbdtKxF}nDCs;_K@eQn-U+Q9|w`;w0b(QgS_*wYI+Ui#FJCuCDm;wUBLtRNH=cF9?3
z#r<LAAd<;meAb}wYiBPZw}4O7hWXjEVAYK9l#xbt^os%W;Yif4-P&He_X&v*6ao~X
z>j-QRnbl+Rl4rhv2S$}QK~;rZg*aJTQUgg|LVl0*)?*T3KZPp4wrg_QP*SZCmhRAD
z78^RL13xd}zyM)Kxe7tpYusTZK#Sey-ZE(StH3wHp>1y3uT5-_UWL9D4qvGXe=q#>
zQ`J+ra0Etm1OZ$mlDs;SUL@*Lb<`D+Xrbz8DUle3>KJvAXWG@z^hILLt7Gj%p1W2*
z_Y#Q<sE&Io692q9K2;<kr#hinB=L21;v12qw(6ulk>s)J<hLRzE7d9QMN&Uir@}?j
zFly2WMAOM@(&<GrF4bgQ5q%+4^Fm5AQ=ukPT{KI(CQDy5+q@>*PBh20CdW%OH=ri>
zsc7Ewn!Hre{G6KnV$qkcYhJz)EoiGL=o2j*t0{adTC`GA^j@_1Q%x~kv;?EJgg~s6
zytb5Htn5;4*%h&Jp;|<8afL!{g}T@)?b=uRVwL8#m3CsUcWZ<KQ7*wy1f9jIqk$6r
zzSj0W6pF~T<!~{&0w3$7$JKpe$Fxu?MP%{<6u~+$sV*{|Ruj9H4^2re!-4EYdoU>s
znX_LEnn*8RP)k~eEI9p`e%nW?9a{CpmuI_{K@PP!1k@^2*RK4QvEmCm3{1KQvfhJ`
zDS|1)n_70os$Pp-3a#s**6&b;P|5lBKK7MLbFWnfvmT%d+CwPaP@ADgJy$$72T*FA
znwT)_rMBJsH{7k|B(C71)Dn2udZP+2Lap5-#^0lhdP60f{l#fy`KNuyTrou4B&I_=
z9@R-m#bHfBQEf^jrlX+~u5B}4WG6n=+n`C>#MF;P`-;b1oB9Hs=aWe7f;J8{QR{+v
zDBMTN;kAAAzN8#JmsZ7VR$6PEBw)spc6(q_ElFVw<l0@7+P+FVB##ko$w%9d+xdc)
zUmjVPc=kJiH|;RE6hV+g&-Y{g+e7|q7!q`8sL^|<wQr#k6%7lYs>LZ#1Op*d&GOv3
zlH_T%LYd;6q(`=aKBP%t>w>0(PyVcXkSeibY8t4-9t7yz#xCB(R3T2+|E906fpqvJ
zYFg3;3GE7-HXY?W<5eX|FC0oi=YxKFE;j$8{YWF+d6^Ij>bo(!7KCJM<_D(y52FmF
z{66jMQ~D8`sl@Z$AFX&uVy>1f_VDB0XA%pIblD()z$4Q8*RzxZnsk;_yQv?YtOkMH
zUcvih?6uJib)Mj{i1@((4UuJ*hTLi|+Yf6My2g3b#zO~u0(zJ@Ju57Dw7Oj8rmCDe
z27+S;IEowXmwY_Bf<`6$pEAkvTj2t73~+a8cbl=uWpkd1(|)Y2d?#}+;)0nCtA?6E
zB!!q4{=3)@x?bD%4#XD(=bMAc$sds{1ubkZQf2MUcw~JxYL6n{*-#CcUVJk_X+&}n
zd%CmU<I}+WQcU#y{FlPCQ2*rn?w@zp#$J2TdwCvz`TXgV)G%pzX5ca&*QC!nyEsf!
zH5kMkg+idN!K)lILwL78;$@}=E-jw+L?8*?dr&UD7jIp#EP?NR!csi)_3iwduu^OW
zI1eD{13NW6@pirvph*_0FzvIIKcyz8$U`C!(<I<;5FI8AEG8zF_cI|~%ZD;&STK2^
z)dVvx(Ui4|c(F&yDAHKza;FOLi<=2iMXFd`W80$C4E9_F1uD+3iYP*v;nXqxGI$cC
z19D_~F^C{oMh#g_jwpKuH;X*KXn*lYpJ)aCX4(1xgGd=%FZmW|szoLYg&JH1!)U#_
zIf<FVM~;lq=c#2na`QG(6d9czJKIot^Sz@HE_Doswj1=%OmAV+hdi6dv$FsN(%5gW
z%F=<A>H$w5XRJYEw6tv=-1Mvi5hwD+IV+}J#)T{Z*%t?5b?lCVM!4>d-oBawznYnA
zue|gTj1RD%mMG{7&(N_T!#sXidB;mG(kSec{0@eqhHS-HsxKYGO0(Ft>F67796LPC
z0(B2HG!#rz;+GR_8Yowi9%NtZMAObxq|>EaLwyQjhXkew6*c-R_-XVg()rc#T&@Ti
zgW>2<<ZTR+vN3m$SQcaf6*l5RXI!(MOh4Q27C5@|<$CDxovYzBIi3f=(2pNfq@A+T
zG6?Q|ETu3m?TB0rdm?BP1;T6b9!jm3SgYMsdIAs;=DLFYp5yMKu(C=(S185Jswq1B
z!kMEE^MWV%*yyItM|Z}0bv0A+4S+XXg_e^&;Is#@C-f-?^T!T1pjl$*&K+<*Ng<P=
zi!*{)iXoeOm*lRujL%Y2P|i<Uy;kh@e7sdJG<CHi%K%f9z0<Y!_)|~!U_sB(HCzQQ
zbdUwZ-RTEZj|JFMg&3C;tay5rnHVrcvahqfTz%@bvfCD%yD!2(X3aEC2>ZxBT=HJR
z+Gt=$;iz&&FkgV#a;!F$)E=3@kCpieOBYF}5+h+SQin+DM)C)@aasBk!axwIkxE2P
zx+zbwn)V#pm2K~fekxa(^o=5=!Wl~I<)GTy2SE9nj{?LuiEe6lGs=EsAXwjI^`IS`
zmq8nS4t)rvx7ll>UZKDfn}u@7G(~IAUX0zpbD1i(hLGZzLEgAPiQ$VZ3?5B$y-`Ho
z9*FC3W28SuWNBNLc_+<?n|}?oEUe&r-8-6Qjg>o1k3km$D-0*g8_yGnrlud2o^tS9
zI@r08;AndRKVV#0|AaUWLTct2oSSZeh8lEjv5C>XG*}Wu#OTJ@yG}TW5mJY6gQhd2
zYFHb@OT({?b(=A-?GblnMkbNaC|;btSwyA>PQK1MR*`G^jBgKmGede-@>cT&O}F(F
zSOv?g!^o$;_8{qy7#VBWD|Qb?6Z%Qr_7g@l+F*kSVM<YGe5N!&9e)Me2pDBGOWEg`
zhi$yIGtdG=OU`+SEu$TOv6DiMXmUU3IdphU?cwB&)I%-OmxSvYB5)A?!-yB=sl5J4
za-fiOr7mX5nkE=vu*i~2F~cZ0j(m5K;3Y5C%Qf9d5&9jGFQ(5D`{z)!RMT(e3N~}3
zc=uA4K?!67n+b6e6BCO{FohrOdwJaM-z;!^LddpvAFuTCJ@VL_cJBBokumLz&CUcH
zg%D5rSF_TyK<p<RnT0QX*tv!eG1m)x<U`VWB|egKzU(Ge7f@9Ovl|k9IVOEwJ@U@>
zp>iD`t`DGU8*KnrGswc*n2g|1=ZT9WLH>Gkwfy}w+3d$r>+)OGcp@)c%4;JwdQIqO
z!j@GIN@tSXpR*IDD+JLH>m_U(-8Q{%YPY7N|7Di^&1bBvI&owic#dNehex1%YEeYZ
z5#2aTk`5GAD#QRoilT`q+@3X>f=N@jw2^ppTh<<o!BYSsoSxVYyryeJf*RRGcJC(l
z?cfN$B#Ks^*bkxibr(Q}#yX?JAHstw(*QS+>jeQj5ka~pO!V<A8Q$R$5z{7@q$oQz
zXSv1YI80BGusfqWvDMS2SG*{@4FL#OK-Y{fm9pplEk5;wf#tLqw2SsG?ULwL#3IF%
zeGf->Q|vx=zN|wQ7SkkK<ZY@^QO$m31dMgTSSGaYj_!+$t+3rM4Y%u-y|hcHAUnQ6
z;L$BhA3Zv8`K>gLCPKbSAgy3kH(K=%wG6UL^LdCmwCb+`XHdx)-7f;?;fbQn5s0j{
zT_z;5^n%G!Z6IQM3FmO`O>I6i6lJ~}p>#nUkx=UaYhohx376DGF2C6VrS3(`F-`*A
zivqVXHQSfUUNO<iNaMY-So+i}YaMr%B2sx&`kI^k0`6N$`B%mD5jVc<PGD(Qy^xe3
zaCbW-ftV>m={>CjuE^0J9PlHcqo)rH9!&&RU2S*OeEMkb#lnHc!xnP2T#GBrmNLA4
z8GW$I+<gY4XX61BNB053!E?ALB&Jdt*KpW{L$K-RV_cB;(Oaq>T^*;;1atb}-z=P?
zxJfE|agoOfUd<`~6m!5v=blUXhB<BSfiJb>0D%X>u7<yJdjcE}x2`dlnP><^W1o(|
za!8xU&%KQ)d2h~NQQVkz@&J{Q@I!!+I4V(?v>Xc~@=p2g$`W8+@YOA3W>C}x+M|Bp
z-O-D|5B8VtwrM<L(724A@rGIa{XIoVdqd1s8r1bdnn=|wBpfeTLNG_>GPUTH3vN|n
zMk)<QJMqOakK|-<nq7P)XSp2QO%N|Y7Jk&341r?ZO?ZKgZI|3i+~g``sb}>ose`#M
zh<3|R8(7G&oJa?#qk(WhaZU7@1MbHr4Z%qMcN=6$7a5FT?bKTtpN<$lj$Y)yZdZUA
zLBF^ZX;MtQn8vKtLZYk6n5l-%dRg3^;NbtTcb{QVCh6Y5X+Sa!O_M_hK*<?Nk{Xb#
z0-^#U&=N#)5=2Q2NX|(_6dK7O5*10(<Sa=*1fj_w84M)*ZFJ`B%<jzW?Cxwhd)`m=
zwXWx?daACfyZ*nzCDE+h3S5IKq%WJUfh+Iu^@;dmXbYCjsDx((@itY3b!nR65Y3SL
zY(GV4^AO4Segl|-Ae&TXS430IAn}@u8bK_)0S!{`gZixD@vyHG(~MsU7{t-cW}Av;
z%jW0TC~~h;_gR?E1@y71aaONU^bs%#&WKiLPEE`)t6R}#AwSIEK_<AW)dg4prKS|o
zL>AUvzLZ9S`%DQzzorYkPn7zzjRhWLGNGjs8E9)kQn*Z0_!ELS;ffI$>J$K!6GMva
zgQlQ>KG^+<X@;dtT;l~cy?A)03p_iH;z93Q8!V91iG>rxB!#8Cr!v2!%2tUP)0^2!
z*y=oVfZ>lBaiy5YGEL^GR{V9SXX&%d6ITAy!Hk)+)K;PFg4g}6VxjVwYgCliNv`|L
zZ@#OB-6AHTVIL^UEsL|Tqg|&0e~$0CQwHAz44-m>5GL#sY-8~;k|b{M73?fCA)JA3
zmL!42OJ(bmF!@BltRjYb906^>(tIi*uigOXptk%<;d%&anL+3{oQ@O0o>uxcxRePu
z%@pLyjK@ZtFl39fU~xF)`gKMlP>=1?TGlA|uInxKCSGV$U0k_br2tn?5i~skT4Zp0
z1v$iiorShs@z51M0su`AFsKMYq_9BK0jM69ffGQbh=2}fGWWT0>?3HG0w|`$g(sEY
z;ubK1t=l}C00tFtI#wiPAIT`3z(7<%H4y+@z%W%#b5>zQB`|O&IJw0DbRWxDX+gn>
zU{yrpcAXf-(X4t{7Be(XkCVg~%h-T`Rs!b6v22$sP9I^}Xpvw^VTo1@Qyd8T_*kuD
zPeF3t$|B!@(apd~?jwa`&#^@ySS8Q1`Cv(28L*}f&8CUUJxw@MJCx^yreartPE50`
zHVYgfD7zY&0vq3UDO38OfPrg3muWDL0PloR*Z`<#G0<$xCJBww$3&$`3ySCc)PY$;
z5JG4rg1r*4&DgYNmo@97!mj8Bc0xiF5t|DLApuD`VGl^@Gb%;o9Ig<{h0<rMoCY>d
z1J{+=d{kID0iaw0&<KW!n+Ake<-&yMHk}}i&W!xR>dguCDQFNeT+kPes87^-NPol7
ziDMHE5q%0>Kyr+u>Sqw_<8Yqt##zy)gK=V<ujp0YAvq#;c<QzlK>&s>7~MGhM3NBQ
zoP>Pnj-vT4c-;c72vXkK1+EW6CEfTcvB0iOs;|>$w=7vArZ@XM7`tFw)z12C45FAu
zY8xcW0-Ubgc`X7?W;0ApjAXi#1(|VYQ8%D&5kJ_(P<L4{W>rA(dEYdHhDuwExsBA*
z5@5mCT6f=EVVh^vbp<m%gZiMiCZ^BkU}@HsL6t~GTrTXw2_&LfTtG|wLhA(yoHDHq
znzzmkVi2Gvc8kTXacDwW@yynk0luRs;3s<ep<CCMmDx-i*ZRa2Vd6?g3Bc<H>{K+H
zy9jg3gp(&;Lq{;wjRXu<!%Vr#tn1T^;wTC)71pk4O1_QDFE@c^aGs568cj6Er(H0_
z>AHXvUE|PODdd&p>stQF)>l1G?ZfH1o{`XENLx_)k!W%sysHJHYd|wMAQ|l%k%@S^
z3GY+FP6v6~Mk3e)EjD}tuApXsb{_CF3vfS;l)VLu9-0KWE59LO_IZ~kiQ0iE8Ho4h
ze6S2Po?-HROkXppl-C#{lqq9-)v=y1+}&M)(Gu2d1ZxC<O5Tk{xRM8t?@>R0+X$me
zLE@dkc^g*>Gx#tq-0Gs(l?(*6+B$Im8IOPYsTM5Qi;i;_Av+5^eZ)m_YZyL*W%R*X
zUSsrZE`}~`*e;?;6w%}{YYI64(u6J1(<M~uKq#{(-0uq1^t7!$798fq%Lyk>o8~#~
zO0hizrG=Aq5m0a;NlBlPMZ5rwRFS1+&emKZdnHY`>1=#2ADRsZE5ZfE*4T0hs3;PB
zCr7E-feho@3=3GsVHj8n%Rul#g;e_bEl$V`7?ef;YJt-c0~qvBvd&lrGXRojlwlDY
zKwe2EdEec4@Ray4wG@UMmryFVh`n({1eL;GV^d)xOS)>w6jJNpi2!riH_|&+ka;3l
z@rg*MCFI*L-hRL&-+hbG219D{nXwSeXB$W2l?7q0<WTnrOV|V}B6(UdUl{`<o_-Oy
z>&7U)j#NU)Iin#FXpU^SfOnITG$2r+&zELHgLDV%q_?4n;&KL1J$`}b4jChmj36xK
zM+B=A`t%}#wE=w#+9#%uH?Ft+d7R>|Rv1lY+5)6_%}4Po6oV6TXdKBBAa&ZiNgL^|
z^9U>j_uz=Yaw$ATymW(noxW#jlv3spas-CrfjPHNz}qm*&lgxLksKk+VX;C7N#|0l
z^w`s;86SfaaW~Y#G?%ISheO8%coq%AuUt-xyl#Ep!@5caoEAVD7?2>btG5iJ+e9(3
z(Ma|NSmFp&xz@opSW8vI;8>wYI18|e4EZ{K?A<;eI>2=TLCcC!zqw08o6JMtzQ($d
zzOzf?Sp_}+5m*VM+r>KaU5Q6}r$~=?QB|ClzzQv*l<#`XRideK1FriI3^9%lU8bkM
zWCAr}jqRQW4p!T+8l;NTOWq1W<pq$Mew?)#X0ib=n8<)bc5Oc!sgGi58UqqlqaTlM
z<XcNZ#1WK=Xy!h{WDTdWE(<vcPbYJ%qopj*0vxq5eK9YSHOZT)YnovMKt+tfKj1p~
zc>|2AoTfB?P%NAF>{+qQ!?9E4dp#68Uegl#r>j76B^;YZ>?-sisu!%ADEhCBSs!RN
z*k3+oc~^EYbe4tC<KF$Rm&-w{ScW<ej!);4uF}a@p~-9zlrci!^-Sgj804{YtaqmG
zX_IFMX)o@+(@K6rR<s+>)Wp<iA$QY|;k8FO;M2yTc;OMcI`*Lw>WqYh@tl10#^WzE
zis(%W#wssPHGPcHD>%8-&d`G7eWpq(RxC>(LEw=L{Pg&X#fJ@IAVF#x)pz&dCaJlX
zDw&t2b>BE~7|IB0I6>&qse5;`KJGT?NF^@AZsYYv<{{H6bnS(Q7PqqSU#iZ%lDq{i
zgxl+jeaZ+*m_A1xd)nLsvaU><UfN*J-uAi#T8Tx)>$4e-4m}@XDjAA{o@dXhU_MpN
zOluI=$~NqAC?}EF7P&tbSclt1vPce-k7CHohjLw;ve>*BXV6*B80s<MSxJMtIv&O#
zG;2)swb!z3cq9y5@-TX)cbQA&;tZU)w)Z~(37dSI!7={i+IZfhV<GHD8%Mb>y!_F-
zBh<U9$#<_5CTe{rs*c`GBHwi$O>}cizMX`op;^Z9KcLCUW#9L$^%Fz&@7AtOV6VMz
zeKhr%V`}5tB&FFjwb{F)Yg4_x(*XRA2QmSDj0Hg^85E~+95Z5mGhFYnAV2KDB*%0;
zi{ksq57%Z8W;0q}X9N`A>wKNN)-WrpILl-<-+45CO^?{^G3XFQ;$}u{+X!XGES`li
z93qz<G(!6=mL9@6LLk(KDDn_R4g=(pSHq$^Wa-}f#mKKq(PoR@?-wilmR`PJj5k~M
zeZ2e#vXb+7#rOS6v*J?w`w#ArW!xlWwM=pSh2Q$w#?|``%f4TipS)kpYgpO%y11jb
z*!g&U@$1@_*$1%y#sOpvr?^Ozu||nop}}p1D{j|+U6wE>K18p<{g+z(wrjtxx+`*|
zA=XYPEuMX~sRP|&GvAqqd^~FSC^EG!F}17pYE@xsQ`LW0*8G#S(we{0$Fmk6-KQ3j
zQ|pnh_M9P$XDvv+D04(vkd#l64I{wiN(ZMA9CiLAb;=xHln<>jEG<*}^~#5j&<FKX
z`(@?_FU=1zQwPx&z+pJ4TO%1ef`foCG9G0#9L*}@k|Y<bzL4+UB6?pUBxbl5xwHyv
ziohdbR{3%0W_H;q7d0b2OI*`EG7c3r-uSGuQT*o$KiG1g)J!4LNReMIv*}2o;W|Gd
z14gPpkh#UlK7NryE0ah`asI*3N@J>;InX0TXW?wHiKDo#)}YN$xgHziJ#P<-)-rQ@
zgIhHQ*~9FH(LU(_qeQvJfFnCjdDRq&7PH|k#Hudib;XrB*k!L&QR^1Gh(U`L`721+
z-Gi@d`xQ06iG<bO#R(rtZ2k!eTYXn6GNsG-<xfc1;laTbp7(cuK*GW-0x8mPOjG_q
zMKZKyMtCD3>w@l$7AnT@=^odGuzqG&AKi{7b|#xqRUqX}W@MyrgXXmW%I`>6m}QLI
zJ{NnG;@7arFx$<6AhJL$p5PF7Jnt3ODkRHI$C-(~7D2;7Xq948vvh*(%rO#nJx1$P
zs)AFvO<HSoYNTAb?(!)*!5$cMyl&5Q6qibAf3wI6_e*4GY;R+zEHp%BBEc^$v6-9+
zXp%4Y%43TV>{sZn2^6^<A1yZ_AJRs}f2WK%S9Wtt1-R`i*Gy+5inb{(H@IShN5UfP
zOKQ427m6DiWM<fX$lxkx)i+P1%Grj&f|>eC16twd32U+?UWMTTTFcYe_p{0F-+`-$
zkJ{L08wQuh1<A&Q1*kD`Ce@TMO&4kk)ebhXZq&V6?-p@Y7cH}IB&5-G!H|C%cWyd}
z{=!0OX4(;b%B<8Su>3vneh*x??jSFLU6@ZWY=SOt$z}R0;dYprX{5FIBUWs_oPk>f
zF=fbO<!9}F4X|K29T_`d4F%29+$a)gw8x;f$QmnK7#;O#U#>2<EV+e#J<c*lcP_rZ
z&{93S`o4e<Cs=J|#ND!(iY{i$T0LCrcxd!>J5u(pS+%Q_n~6~6n88P?3bcyGIhiPR
ziRjxi5h4vw&crAIy|D>*+ihI?!Ym4IEC_ag<mKGNzBIpXkK=4&4|V*&-Fb1ltV}ig
z;rTq-0=tA}ss&~54swNOY;Jw1uR>@hqp-}Gxi*}a%xss)YoDFj)6Hbm;PV&i&D+f{
zOorX33vDCkVa6}#m%$GUds#^A`ZhP*5<i7x)CZ7^F8e=MTWndFj(B61-sm8{VkIH3
zU$Er!h7cm1>JoUeCzEu{9_E*@SVyMq5=bvd&6UqX*kVhI1g=_mjOC>}7z)WQOpkkL
z+p>e{Nbj}k!`*?{6X5~9L6W;M65Dzh_7#`VNc*;6o48P;D9bQ4!5JADqh{_qqD+Ti
z3^{#P3-9H{b6;lB49~*OnmXzdtI}qHUdgC&Yr94zcH=?>Ob7VH3kPI}b_^J&$l7K4
zY$H<$o^ZtS5=ysr>Alrd7pFS$BN7Iu3D<Pr-HHu&$mW8EcbrvmOGxs`<`xL=)CCU4
zra4%-%CU6lFpBH+S)`s+Y$o>Va7`|DIC)1(ib&-BR-`I(J6}C4L+BQnPin2Ta8;#_
z;Xd6t%<9Q7Kdr8Ny1X1|qJ-j!<cf^dl=oW<7jC33_ee5Sq;zajHJXz5xkMyNT}{uC
zy|Bk32jG*KS8ijBLv}+Uof@kiJn{n%Fy2l1k2j)j$bH=7^lNfwSJhk``b3`U*#OR1
zIgD2hHR`8=NM@2(@qlXi2&H4(pRljl+Twh8360Z+VmeCI5Q$>XZ^(stEYmN`Xx|x3
zstL<s@!->KJ~_lVAeo|G$ERITFa#YR&dzXEw<6>p=G>Re1C1~1aoHIrmq-?vN44Ha
z!wwYNB_|IS&1z~yP{C{LNt8dv3PL=);I|o~kR0ts-QyV*X<Se3kFH;x;(v44kzC?c
zSERNRkx}nfR$^YM2ASXwbdXyrUY-`X+PXj5nsuwRLQ?QL!vVBSZX_lz8*^ES(gae&
z8DuWBMjH>(2N9$whVJPK#);{b=6Y7`+;r4LUNsp$ANG8@Y|Y-%{`{n0$P2s<;H2{~
z6zUnK)ONzj{KmVCg*2&`%ckpo*=)FpKyl8>i8ZI4>_vkilF{t>+ffy(L+}(r{W_+T
z&%B?W$=J=^DP8p~xZ6o#zS$uiv}-M*+Z}1Xd)=ntW7P(&O`~pgn^)uE(+&SA0gI2H
zuGER1Eo}*ld~{SYTKVW>NvKktq?b=_<LYD}VyE^|MMNV*{z<{`bAtNx_8P5%mj%M3
z$z}=sL)(NJTtV(W?>T~s+JrqfW#ki$s4j%IOMTjs2@srJ6@A(9Rbd-XeLdnk^Q92B
zUVfj*6GMK+JEbfvU)Bmex1edGV%XsNK*@bUQsPE$#!ZRvDZxM)_s~AhQg_r=@ghCf
z%h#6ce7AOZ7iDS2U$35!O#587q=FOp*ncNj@}aM(UbLV0P&yFIMkaK#v<d8EMV%m*
zu=PMFc)a9EN`8U95aFd~CIwH0Ki=XcvNwLcUs?4y-^1n6%C#3SVpt4HJ+!@7NGRD}
zWPiHl5x`-O%ow3-Ic1+EM7m0S@Fgj2z4FDYb6m@^SH{)3?MR-~r5pI=Qa<PQddU@$
zx14{Kc-5vdyO(3bQlj|%x-e(Mz|(Z^o!Tii-KQV3pUl{XUKzusd~SGm&L!;p()55<
zbs>|Pg;iK%#q@f0I}P`GSkOTBRZR`1s7LA2zPXW{pFh)T`?*mSrAIP*Nq3%$ahvN&
zpBIA8^jdyRe>9pt(V^+YG>9R+!4-<jJzCv+?e52p{(M-eu2C}>+q~;~U^L5)s~&yT
z@ECM~BT6Y-*A2)OY15OrY$<a6ZE}!jRYm<8QaA7I{m0BN?R{6AmF~VDZSabp9m({*
z<Q3gI@u^`}VJ#r<%(E@qwK--;RoHz=Voc0l&xZPHOok`I@v|-HTz<-<4L*HDtZs;F
z*={b*Co}ZPoxzItJ1jo+!Iu^9-p{+pvB~i+nE%4(hgp8-p1f87ZS~&mMtzWIr1?01
zn&xP!J!Gd?q<|JMdqR=<*8C?(?Z;T%%WLK_<!#OzADdtKZr`73SbXib|FG`s{RIr&
ze4`@ND*i*`nXd<*{QW=IEBSw9^80chXSaXDI}`3po*(cG;rnv&Jh;ip+ajRibHE2F
zARV*6=LySQPZZe5myH<(G4d_QvBSOahmE0FY_D*Wxq?3XP?80Sjs>)lUOc6VI%OU7
zCNzkD?8=#rp!8c7s!aZ;zXU0FTvYfRD3%{QARTmeDfj}}J$>GL7d7uyBn9h)-Ln`C
zzSME=+R{C9vJj+^#g){1)?=<$c|&gIhuC+7ILh3$vJG+VxM{l-a?3W<D=gGo#=wO)
z)R*kKM}8=ZH!Mgq%&;TWFDz{0MA*HKu;`_**sx%-)Ud?rn~`MU_rt;;<cH_n3QJlF
zXSWW2$Q$uQGa`B{JR=N`97p7IL_A%>McCbrD8Sd~R7O0rjeHRnd6qe{q9fACF!Ci?
z6oxm-@<n95ZIs+@WOII0cSqE{%TeuQ(R4{sy_(T)Y@<DQqXzP$yCtGWm!hYtquy3W
z&!);ulEo~B#XRGUnd^wrvW!_Ki`_~M|1cKwQB!n-H+C;SHb^t}(^70rVC(^J9MRj5
zqc5?f#sUDXIQx83IvBvwLgW5)oH2nq3k<+eO06CYz!ykT%El&y#lekZIH%(uq~cRN
z2sAA4^+NcT$U>5UK$PH)p4xrdL?XR}`?hhMor!W;akAtgJP#5CSQ16{&We!}aA>J<
z2PDXlC&g4JD)1$r-cG#m_MS=sF2Q1$<SaQJbD>hLq}E(cx@;V#FPnVBTa;TXB`Pdg
zZ8_l@Um~q65Cu!IH%@_tr+9}8T)KJRU@XO?Gg*T#kpKoz4F>S?CHi*8-Y&Qwt#!($
zAoaqR`{tF&&U~ro_9%M;lEPUY+_6oGAx~QYJb1Jhlz3Au`DT)OaFUQW@l`E?b6RQM
zUml>f9?pxUl|4Y^8mr~MO=hM|q=W$o;s~f3A5<HMRv16*TxNT5Gkreqp<2tsKypF`
zSfbb-QHyL!Z)ZqHLHgtaww{7V6`#{p=^qu66TmV_uk%rku{=J}nfjhQ;{@U3wYT20
zvcP#`H8FBRWOxFNC~#FPqx1{z@s?KRx>yEa-1Ad-hFW&UECC@AjDVgzlZ-WF!Z?$u
zi<MLxt-zDSKtKfDN4pt6pd-kF%K@otsQKj7z%^(yTQoDplRPw9h}BgkJT<H!DcSo8
zuW>51otmKblS^N+#I&=s#GW8loOomjbh@$$<DR_f%+@gh%(@T|C=;6R66i!^Uz5o`
ztBo%U%0aTmUR%i##a|pm<W6hmTHit6NXvCLiMH>`C0@yOvCHe?&2y*7xOFGbH!ae;
zFmJLm&rdtQge)JGmL6o1A1N0R8j)XFkRQcgkh+u~OOX~YSMb0tg2=AmQ5tJ%VF8*y
zEP18Co4hb9qR>mTFy{^~B`>Y;S<R#LuEL5gE<5s~7voVy+C}oqh1DxXru;><D+TrY
zMXmhzYWR!Ew2IrhiffpQJNNUu$BTzp{W~b0e&u~ST=>-aOYvx7-rJg|SZ%M7m8WZD
zB{LBvLK-FW+A)i1B^xVFAG%83EtPEAJ*znNY=<@a<DF+mayEN~&)Pelebp|t9D532
zdqQ-zl(IXVG_sVL)s0G^%(UYcjeP+dS1`D!Z0p9QDXTJ6jacuCGOnwBomJPMZ23=e
z?76$kx31`w1eBxruS@iopRV;IV5=yo789_qP<ZFr`NmQ9Lyn>(5$95cMy;LcsmeS1
zH{~NMF9<k3cwQ;q?W1RptD^eMQYcw<N4rw?c9l7$`sI^^Mpad)I|xo#xkb@)FSTo;
zSD%O7c`pCrx%+`>2KKpgWIn9QlSSu+-c^)k<cmiuz#9({S1riP0;<D{sw2Crqd!!~
zQof8Ac$uj4GTHv+{m7ROie5hKe);Ib%M8jIv_Q=hotnowj^3iS2)6356`(`uS!Uwe
zGJ)C(o!Tn<+82?vFN<nxyKCz|)V`vu!wA$h>(sT{*R@C1J=Y;}$gC<lQ?x!!QPNF3
zq*MRKzJ4^ae)z666{ddjU44F1JyxJ$HnRTRhx)~C+G(AJ58VxK>>HLM8&=*m?65U#
zP`+9ec(q&fYRLZ8=Y#sx3fwDzY5n1oGhg4;pH+bqvNsY75|i}Qll2hpc9S?Xl39JI
zV{%|Ud-`k)zq-R*Y5f4EH$D$8*aVGYW7Xy0AB8-<>%<VM{Q=Xo$LJvvg*lzhHptc7
zk9LD}L%8eMLsy!+#F}&yn(QN*3GTZ|_CUm<T3X7Q1rBe@*0Eo3XujmYrn}md$_2}C
z^%}tFkfdq6iO<uhv(ol~7!^0$)V1hOv=~yg3d!HFb7*y^VzVu_ajS#C-n8~%bQsw^
zGgLXushS<qTjir5p6u-=@~|-WTepiLQ4Z`*y6uUk?ZN3CA*+x(R2;sCkhIlS?K2%N
zKJ5{8ZCS<a34*XVc^rHGDx`4rRE%zCSvqS;T~}!j<Z%ysx*)82g1zRj&7j!*xdWu~
zuq)dX7T43Yf$C`z?C#ZNElKaG?P+~U)ip@fQE%G&ippi+up?!nqs;*p*3<iRwYN2@
zvoESIudHX<0aoY0-k=Lx_hH{G?wL1bpPlH<HSJzy?@Nh#JxA4!OYb8R>g$>49Fl+i
zmi;wZH2ZFP*C&TQGK2m@ADFISKS4APlS2P;R2%D~PAUa<;5FE`!#O{np83^*(AC!@
z^&J^f@I}D^;od>EbNvqKgHYezljpeB1qX=-2P8PUSg40-6ov`T4M;{0KfyGKJmpH8
z7$ObqzOXhVbqzPX*E1|PSaZ#b%lOgoHHB_r>Y+2|6iz8{oqyU-UOs$@qf6r)SMNhE
zr?oe(Plp{c-<(r`TM3N}1&vaa4<n;TJcLG3M@W}?F2%}GZ|Z7i>M<jsvFNqBkfW2q
zYh(W(37b^{&LM>7RL{?yb(+(NnbRtn)9IT#w?20PIIk}}fAReMC8zl-G4sYH^H=-k
zudUCU0~e6O3zp{>teqBa#4Ow_S+MV0a9m$-1}?e^FS?&!yydj$6|?AFvUs;|(RY2(
zAGm}PUJ5$DbkAuiG-fHhWGS+5DSCY=7PuTQyqtJ`IoWCXe$4WNlI4ee%a7KVGk_~-
z;gu)nS8|+I@?vl+1tlv*eJfAbSDpbslnH;RIRBx_>BEbd4=+nT)b@R-U;pq5xQY>8
zZ9c!+>a^M(v)Wm*+TFL>yT1AwxHcfXHgtaNjnmp_%-Y+MwRe4Mlk00!z;&$f`u`Fn
zjNxZU*wxn`uf3iE00`iF#N@;TI08ZZ4vXLfaX(=wz9l0iB_$)HqND`U(1K`ybhI=K
zU^*5?1|}vJHfAOW8w&>n28ZD9ZAnjZLitW|3Gtm0<mVR`;+GN=7MGMcb6Q+UPU?(;
zimIZVrP8THH5#3>%BdQ(2HI!uYcpu-=wCjsC1Mb3VsK9HqOsX!J;y5=l1A~xCfuzi
zAk<YAYtzeTt|hgbv$P}GRIaC(TiQ8Tns!)1&RV5u+N5{daJt^G2)Jp~b@P<2U3!h3
zgr|dbkE5Wzb4IVTsDrDwkL%4|SBcARXk*WOl&8~cPq}MeIqtUu%)E16dn??#<96LA
z_quP<fUjzVpXb`&C57Rcu#HF!yc9MX{l_q26OY`!OJTppgbim0eV4+fas&QpQds&g
zNnu&}uTr1A8n40huV8YDn$m}xsy;WPS6Yh7+MZzAhTgWl{Lt~NsxyDGt8TTcqOE&m
zySwaV&(rCiS6_NdXZjk~`(8G@E^i#DY8_bY8JL(KXx<p8-y5v%9-bW>ez!W@ygOXq
z_NMOFrLdmi$<@h8?3c;z!S`LeQv+|Nd-taMK4OQ*XLrWuhNk8=7UvfZ=11NyjLj^p
zEiEj3T6lM`F!p)r{rvLQ;qv6n%H-!2?EEVB%j(?n#{AyK($VJP>ell9_S)v|`r)VT
zozL5!_C6l&eZt{z$Ace7a72z*c``9UWMF>Nj#6}UC@q(Ex@K8cYb3LT-9$&(llEAc
zY6QDhd3I+a@5MsX&hnh@`=XXz=~@-Jy$@yFS0*|u@?K{s2T^cnSLP2q(M;sO)>T<B
zl&AMZ`;m54;hQ3(3cJa!s-n?n7R?bHI?s#WR@e>|Uh97T^xX@W*{(-AFG?nBZ||&3
zcE5Nw_3A%e3UmC|NnrzjDTT%VrW7{*`=l`IY|-D6!aRQ>g<1YJDa>l@SEMk{?^0OP
zpGjfiKb6A9eq9RFV)OYfg*p6^6sGz6rLeJIm%?CwRSJ9l_eo*I|9})W_D_?-Zu~?F
zBm8Sp80PPi!uF1(Fs@&e!i0a16o&W%rLc#8rxf<^zex()`kSOMr|(i&|8GcPp1)5D
z3zYgMg)#iiQdrz?NnwQFr7-tDNnwsZk-}{MMk!3<Pf}RNZ%SdjL5v-7cqz>CH>9xf
z-zA0R{Erm2^>Zm~=I@un#($8)I@td?QrPUV6h?Wb@)xDBv7bm`PpBRL04Xf<yA;;-
zT?#||PAN?D_ef!BKbOJ+{+bk)h?l}_iGEQEv-}GwZ0MgRh4uddQkc(gOJVLmN?}(2
z7AdTq)aM_O!a9B?g<1VAQkc)N6ejU2QdrABQwkgWzbS<o{7DM)|CdN%KK<XMFl7?=
zKTrzu|0hUcR)3rnX7#s9Vb(uNVV>Wmuzk}11}Q9#1TTeI6DT{D)_MMg6lP6u!t-yF
z!gT&#Da`Iz3XA?Og^mAHq_AkcKTryz{asR+|1U~mala*nIg0+<q_CU)Bo|o!zZB*>
zE_8)f?Cm&tIk3Kl>Xt$aDNchn*^&NoFDO~ggGQgGf|mG0oXc0*{4mjcpOw5XcKKm)
zrzyzXv)FEIN55Zr<Pu?bEQMJq|1K%as`1|;g-QPtq_CU+h!ke|H%ejFq^RE^g?auc
zg<1VhDQw`MAca}|o1`$$Uzfr>{{>Q*=dVd&HL`r;zbu8N{fA0n4*!T0cJ$!86xMYt
zh28q86m~HCA0mbE{}EEy!(%Bd?N|yE{4*&m=MR;_#=lEpp}!@C-TYgmFaf+2*8T67
z!WL40K?)Q6b15uE{I5!3CW_ysu&=8BVks<|%Kax&7>wvoQdkJb>QAIF%y%hl_AjI`
z;$N4-^!|7$Y!h?B>JOK~I(|V4Bl|s4ScB5vB!x8tQUACU7Vt+)VJ$yMVfLy&lfnk^
zQW)&#QrOwQCWVDE|BIxsrQauo4YB=;q%hh)lfs%{za)iivc3OZQrHajPoyy0{O?j&
z-7iXEb^o9gX81EHtPc4nDU9e3lft$U|HV>Rz#k%oN&Lr4VR!#ADJ<Z3NMYXp-BMWb
z-!6sS{R=7V!M|M!yZtvwVdVe$Qdp?$u@pw~t5R6z@0P+~Kas*{|Ed(0fcQtHuu$n=
zmclZm|JO=k;j(|f6c!-;2T5V^(#KL5O8O6z!l?hxN?};JzfTHd{<##U{D(<l@rd6m
zg^~Rzh24{y{w9Sv{X`0b{V0Wz;ia$>$5I&We}NSC{4b=i=l>&xk&6B6q_7&ff1(sN
z{l8fXlli$6cKhEig}s#iWhrb5@kdEvxBqb|4E9Y5EB$RLj6u=DPVpC{Fh<2cL<;i>
z`X+@<{e=|v{`W{>!#|P2EdEX@Y$-Ecec<;>Vb6aig~cCBVX|V!QrO79K?+m(O(~4)
z7p1TZKT2V5|Lsy3-|vvZuCWPM9!p`gze5Tu{3eBQ{C+9S^XF1nusj+sg%ST;3hVoG
zDQq12>r&X*pQJDql4B_h2zC4>g;j#W@_Z%+e=3E!e3QZ|e<Fq5!%Jb7q2Hx2tDc`p
zVb*^kg<U<C!hpw8Sngj)VQ+tw!W@5F3M0fzVPkMzs~@E>%pW9$E&Q?+2LDYdjNz|I
zVRXMBg?S!JVHnc4mA@v1IsV5;VR|7-e}@#-^?RhSw?C7@eDG2j;XgwPdvn)5aTDGq
zrY;q-Go7v|^{`NHy$Fhqiq6{{pn(L?R@9}p3yO=~`#A9Yf26SW=OoYK0nT?1(pZUK
ze3Qa%eF&TrfAR8VvViL&ovTy1nI{J8g+0A%Csy60tNVL}Z#{iCxwY;ITr<7D){#jq
zzUl&b5O?kNuB#mB`)$uY<7*$TUp#ZrX2Wr>h{UVJRdrOo!26s8FaK=<637^;5lHfu
z61Vwy?%Eb+M8%fEk1xZ@#K^pXc;T+h1o9NF*VD=o7Ni&v(8%fIKw%NrCQw+00nTJH
z(-~Sg*sNl#mx4&cs_#*%9k8iTS+=Yes9Sr#rEyFj={RqeENQlr@kUQ3!`YPd+`&C0
zL{p|kqTVfKuWDZSg?h_{%dtn-uTTq3WRa9TXc7wGRW~m#lXptWQCjM0tI7?aC%2h*
zCmWcP0N3<~^j%51C~7@y=pDCDP}w5B#VTGD(zICr{>jZ#%k+A3r&AOq?=)6~U$7-|
z23nR$FY4-D+m>iA@;gBz93D}os6m4zI9-C5!Y=h%#-7W3a+6g-(`Pl#CfrQ&iMgdU
zJKe#J_T2JvuX+ys#I)XCmEdiw0J2ruySO)1tBZxBSi;e#T%EOmd#%||*KbvvQK;_|
zE!9Y@;}c|ySrd&d`z+ILb)`D?b4Z%xF2}|oS?y%QfXZ57bS!621+^t*HKkSQ<-qqZ
zi@kGYWWw2kZ#aaqB#6p%;H9v4J(gAnz^DfreG<O+qa-_vUv!P`I6*3XBt>HP+%?}l
zLVV7>A%m0ccdfUk&ET4^Z4rMP;<O{OL$|DdvBowEvYT&=TD<s5Zp8cm8L2rr5cl<M
zs(zn`nT_0X!>Y$X`{P^rAQc&V|1%RbH6Kf8YR8=4N#<DdOFfpl>UH~7*n1I<&-bdD
z9D|hPXEubbtJrp@YVTr`D230pe*kXN;NpE|ju<L?+#7Z%-+8=J@PBN%A-0>92V8#Q
zd&dvUl~&}hu&TvS(b4c`x%=*m9*g(8qCEAxyD`2E!jy+tu+ozCD~O8s^z`hMAFxZr
z?>V==)zZaR`>X4B$$IN`R=KA3N6TB!*Nc4J0;g@ywMXy0j@@x@L>#UAA4_5W4ln(_
zetLy_?cnTxG@CK$BBOyjkx5WOxzlS70A`k;@k|)yF%t%Z5j$l}zJ-213oD^+ZvQD0
zW|T=5qPO2^P96h8D}=9dq)PSziqJ5swoIxv^EZwWy)EizDpRC<h}chH`YM}w90CVz
zRZmU4rh*`=HgOq;d~iBXX1GImPHME2Z8Q7o#mCWoY<!?TLDi}10f8kV=6(}!47`Bd
z;_v~Sg)Wu9GLS^>wX88*CLRdfQl>LaWSrKK54*^^j?OX6JlumruQQ(Ri7d1wV$TX>
z|D?|r);vE=#A0g>Q=jophaKu)ZxBr!(&Tiid|cQQ#36~2oCp;031W=H%+(F>cy#iF
zU1yU7@Y-<-wp||%Yu;HS`O<OSk$|?yA@EH-NMr_YgayStBIPdB#v5T`2^8OrFfqBe
z;)9fUBTQob*a#D~!5d)&4d`~ELJiIzjWC%$L{Ktz^r^--BdlHem<Yq^fR-LV=;5l*
z#2aC~4nH-*Tr9Z9z8PVacq1$jUU-GIkLb(2sa!HHaiAsH$tO~HBg}*Ajv<$GwzA0A
z5RRl-$FMmE+qoQqV<YU$u@Q!vd^4NV!Cha<{k$J<gavN%(f!E?TjIW;9s7I>GaiK%
z4a0!-=A5RFjWFqjHrd>7Mp)DnEhnqz9&-+dmdXo18ewsWAX#os<vGMDD?SCh5q6%f
z?$3=drRRw6MwrESBP_|vh~gA-VcraHgpEzgRUR8*$cSd-F%gD4Ho|V~H{bYfgvHq~
zKC-!~9i$P##hH!58(}(lBdqe+2t(kFu+48q82o2O*wvLEjj&_M><1&v!!6T=?$`)Z
z#v5URH{8pooq`u`B;?uUp0Z1`xl{hl2-E#$gz^5#2s5b3Q_{5rrCJNc92;R$>mla?
zE$#bAwC|9r3wLUMGr}zI%-00uD3JhuFv1Aly6~HWxQ~r6{WkS5PC{S25f;w#gAq1{
zqN>CjVa@Cww9!8|!nEGoHgBRL`Eh9`^FJD4OT4lBypD~>Mp*Lu#blELVdQek%r_%!
z6D5*4=kVzY_1JeKjOtHDSlmyHu=IR`??zY{){!7b?<Yo>p4-r)h2?=S-0NR%vJn(!
zuB)fm*xk3YOa5+z@j`>H(fweAE#*1*6e<OOGs1|Mm{%}CHaA=!gG~xg8b3$5m!4EJ
z<Eb;UwE&(n^Ru%$Z{uQe%7)d3O+MejBJ1`NX7`&B<`#3#+U!Ro%mN)}V0&-os!v~@
z=jyQ$7J6)ib^1RZ+9|*lh7%qeVZkBU6%*8bt4$AU&Y#-EoDu5hkz{5L9|-<bq;zOs
zWJSXn6(QB3?BEmVY<H0nd9r>J!4<!J=J9!ljz&2Gt9HEbGycJ~<HN&V?tsfd+c^O;
zwt#@;Hi5Cc`}_ucr;U2v=Q*(FD<#=ylsI%Z6r)c9TuWk=$Z~H7w|6@=ji(m(mk<pM
zS`}|2g9bw$%@jP|4+`}Q+`h>h%6SrBbB2ydE~Vp(hVVu4-&~hmPJ2(7^l8a?js~|B
z%Nzz^H^P7q&7Cz(a-O3e76_d$umy;b5@J)8bn~mtB1>cV`F-Hs`^~~0w$dt&b;3Dw
zF$UaawvK|f*fgA#SoH&?O+aIlI-_iq0LGwtUv;sKWJ!3{LDJy|BkZi;!sQ=~um?Xe
z!a~-a98!ywmWt;}9w=2m=-v(~$g*?jX9sRt6g^()T`HbwOO+85>1P}l#7DC41&!-j
zr*7hnF!~j|5#}=S8E=FI@G_p8#jdQT;f=7&q8e?QfDxX)wvc<A#Z6x+@iV8zW}t<l
zxRvvp5!MJ`r~e-#tg%^Lka_sS(y<Yih=n*+krfRHKR`DSrt)W$Ht_f9mN;nsXoPuK
zJ5Cb>aD-wT3erdhR%4uM@J3jA3GkQ*!-Y^s{%C~7BTnsZ)-ObI^q?N$jj&axt2507
zCCzt*-m-v1R)nnw@J1N-#wT&wV<Sw`c<`GM#?~Iv4BsNN588GUDIqszIC*S@F$ZmS
zc7>GUjWGEV3Ju4PDk39k8Y_P59(E;4)lQEwC94rm^glDglnM8oK}O$=u)$@*@=Drc
zBkapJBWxdUgk_7K>v|^t^cls4*-NLF*~2c({%C}eUa<ppFw*11e=x#2ZVu!si_Z><
zGVK)P|6qiP9~)tbBi9EWK3=By!3g_KgyFs!VRPc`Rs47(OlYT(18;=UmVx?0_V7lS
zpx838<i2pTLgWT%)3zd)=?_L&{x&n0D+MWv96SmaFlQHWbD(ks9W;Y1!?{IV!AfN(
zN1c*f%6YDoYJCm@zbcg<NK}Y^Lwa$y$||;EJ;aT@Js~2LD)pfv_k%YNF1ro4>CLJu
z1<X|$%{i{>mYMb4pl<j4MDlRHtsz+4`i=S}F4u*p%{hhQD$oRt?hwII0-=raZ5GMp
z((-9og@Zni*ae>FZyKfYl%@T5a!Vz>H5sIt5U#uBmofHNlAmy>?eNX)3ZK(THVtQA
z>{~uf!#v!mq@gAAF+`*v7puVk{PV5TZ|K_fEzc(i-Fg-G>BBI|MRzIStu6=Uq9tsz
znnvfmXyV0p>IyB-?G~RqZFo*}ia6?72W~%ip^<haedIi(PQmoTO+?x~cFapW&%NtD
z6CbsbVulg_IXCGSp3c%<uRu8_g&ZB+D|5!wt5z4T^R9n!cJY$F`{Kpjpo-UaD9O|k
zscIJgraYg)8^*7s{Xf6(*U?e!zUW%Fd<IpRKi)G__}O1XCP?~rx}?WxUBo5FrXES5
zfswMnGu0u^GND`=s`kx3-OAJ!`UfE!0%xMGdR0d}lZmvvr9IMi{zY}vYnkZL>gfM_
zQrN-MyFt7zgu)g?&;4u328k3pNO*!#^yvpLr!f2-A=N=Rd?wA5SU!s01;cL<#HNX1
zm_VE?Ryo;%dC3&0WJt)QiQ(vPs)fq$VS--jpx7*e>OKQRz68nNu2o`gu4ht_6!c-%
zlW+2p-xVUPdDg_CiGa4KLrqci!5A*h!+Pg4HSU4!?ebfwI{JKs<Zzwzm*$Qqwe(?u
zN)|*+sVHf|!>;bSfmaZr^fNs2Dz6Wkdv|<#+ewCY0%7U3uNO&V0#p@y)JL3;oHB`I
zR#hE3n#I(b6|8){;#5bT`Htp=j_(9LNLP^WZ+rVpK{m|StD{~iK;iv6lBpq*u^S4q
z9YGH=>y?<l4otn2|8hpC8pFV>+NgT;a`8}16T^8Mr_vjH*D3Yj&BoE(jyhBmFc(C`
zkbXuaz1IGqtxr{9?n!&SyL_UdU+3$#<sEsZ%CDZ&f%F7EOS68CyNZs%iuhm&IZ-X8
z^aF(nq7@#+$K9%M3svTPgadKVoI9raE>Y(YVdF*!uO^D6qmBQzzjK%h^!DAsT8!9)
zDwIsctGJ0vp0H~QbFf(VK?krZ623arwrq~!qHk&>3QqF*O2#O8n-;BPYCy5~fveR>
zC6I=T)rWa89>#Cbvzhn>WQFlF$e!pP)zH&S7BGJ9vG=P|*c!QW@(WR?rM)LiAy&hR
z#F%TKU`HH-RPvl=AlH(57k?l|=IQpz21LlRT?Q$kP6>G)S@~rk>rz~?ap29-=O;A;
z($q@pJ{4LQofhIT`Al)jES<Jk%qTsOp~tHS%wu{Y{_-|Gv-8^uVsE~Mlh%cpA=gh%
zQMYAxY$`+E;n(xXMBb+qEONn`{SSFBF!+Kqc;`#j1Ue`MY;@zGP9}4#i#cYr4|(;c
zHQyKA^@0kSY09EJYa)ik9EPHwd*L8{Kas)|&Y_a&dZ~r`4EPJrOvBGnAQ%&7fEQE<
zb?Dz|%9Y0DXTzvCD6gQyz?2*C0;oTK6oo2vkd|I4C3%-99tlH5WQziQ#Q1S6ply*t
zZL*r?CXId*Vg9%3+~J}iA+@#4Hzo(s?fE`d@!U+(5&Wh1ShG4ZhO+GPtAilgeHq%>
zoAGVTG(8&Bl(A*h>YVLz<=HejOQDd2fWv5raEzeaE5)NjaKG{ij_*<!oIr?v9!^Rg
z7@DFjBh~@tlksk8I@6;{#>m&SnKyLiFkGENxKuWp($C10SU6%D<PLI~TMae5sDCM$
z`!aSbmrj(1)uGiC+hj=VCi*7c$TFvY>k8k*W(Z?K2VgNqaZYw^$abTeCrwe8rE2)1
z&U`x?XPFq0)|>3=thh6~*(wmbr>!Fym#|r9qc6=Ft3{AK6?DqL&07FSCmTyE!(;<5
zBl|O~Vn1ro^9>uta{1pLu2j8!G_V75Q?I)*A}4fj5zcYOu=(MMJ+-9ylxu!03#oW1
z%;tWY;ATt69A-XVah*0hA#BNYmcqe>Tgxzf4&KRDDivu&U7KyaB`bI?z6oQDPBEcy
z%Qqt*yHm?WcI|SjVRJ?~SMpfKrJ38c%fTO`Y@t1eL{}*I_cN`bVJ8>T((g^c@&|`0
z2Fu${9~HbytbOH|bR)*QmX341DeGiRX^k3l&%Lvk4jiUh%6l_>YB)7tTd1kGXSmH0
z>(AwWop<%{xKhIMdE(a8qtEYsag!O6LW29(6|j<AJ1YDNbZfZS+dlc+{&KsLQ7iSx
zGFVZWI%Ugp(F@4k(o6JLBLY*N%-pSfeL+c=A5++qfw7%ap-mvmI&m#KCwA+uGvj$7
zlMvN7mJUQrt~>?*ZiV@mLs!ll)_oedEHbGtSL(?)1n-jDkCh*mHLRd}Z;}|B?9T9<
zFl`LtCSrkiSZL72rsu-twa+g&k;=2Zrwx@I#sa;o>9EH6Mr}cf_hc}UXLQ54dlSiK
z3}#|2MT><88s9L8GshQMQ>$H|zeJyB6zAJ9D=W=v9+Iy~>o<AQ<^5(m%TaurlsZw&
zXM)JsxnKrv*Bqbz2$Jkm*=PM-2AFeLHIIl>Px6&6z;O1nIKt6Oagqv-x`_fnB`HoC
z9+Kt+X8H4Oyu9~LmkmT84!&i0o|D&`sYfw3O{z7LeUh<H%Zkjd<IR2}jr>Sy=*!`G
zVehv(<|B)tj1lUh!7?odLWE33)roXq&b+Cl7;fL&VQl+|HvawDh>3@Z%X$*Mc2e8t
z&e2=O7w_c?7!qEalEbI;@~PiIv{D@@C-Vlshy}YM=u;zjq;r;w{pM6Jm~LKxCnsea
z3?y<N@a8G4jAqVDss+9(h+}EtKJm<UQ2GiPQJg`=c@J&u)$9c38V`Cg5+R<Osn_)k
z&9rz9SjyogwP0a?<BJd9)91<d7VuskxR~J<$i5A0?-j>cM@fYTGAde+Xz+X7YXHre
z4#@YblvRof_H{z_&-NN(-YV0d<aXb@$}4rh`Cd+1R<X`$G9&picEYb^v}}B8nDLZc
z0YQ~$<6d(pa9A$i6s<~ZJ%;!Kx)MU~fPUXGA<OnM?ySc$r2it(p(sWDt(ORTA~>0e
zPL-i)(nrv1;}cPgTj_U)osIQw7NlFrrVw13fo~2iJKVf__1*gsFB@87Ar~xp216Fz
z06{xHW6}$<H*=5+Ia+Qgx5gkDChq=g>2B0?Z7T-%VS|pHily&*QZ}1wBnC<@(y7GK
zas<B=#-4rFkf1%$z|^pnyy5d<NXyfkkWp)%*l3?N8h7Rz(qorFR97%BgxJork^J&z
zAWP5mc~%MSEM?9BHdAEq^b8QGrwT8zMAG;(x4=iRLGYe?7O6?xHndw2#uL|>UNN`%
zHmO%-8(Xp+tSa;7Hr=+Iu!Q26I}nWJI%;L?P->P=t;^d94;+xUJ*qqPQ?`=|On*fR
zd$>u|duB^hbHpdkclRTgqts6NvgwU8?GDNMuFXz%D*UZlEgp$>RCdkNMJt~^z{b9e
zJYt!&)leE&DDof@Qp4O6Fe-ojm{=>5da!`A21S9Lq|BmLIU$T-eN%AxW8t-OZQ&CJ
zf~q-993}2iiY_=ThzOwpEfF=&e~+QQZZag+(<t25I156CrDl>3^6ASzVA>wjXi&E%
zarPlQX%{dj`vgg122~xYJf)el)oJIR!8VEXJdH?Mc%ni-PGx)51j=|h+&37IVWDry
z+!LU5;ZsmjWhP;Hekok%(&%j`7**bd;Ak4a7x)q^nKfpsMbuCQve5<|uigm*c1lgc
znf5x8>zv5v$Bm1oLD2d@pr4+e;5^;gm+N#-E#nGlpHLGuUTos90dqsEd0X6KFq?*c
zytxJe_mp(k)W9l3)cp4e<x}cQxf0nw7>~+Dp8KliE30!RE3Un1cqzJ?cM_^7GHT=C
z$B77j1jVhI%)J%>k;cY#fz!>xnsYXd)&=XAFHrRiiWYHrhZWF`qnAfmrfz2}HE-2i
zwQk_|y_cJhp_+_neh99NGd0IhRo~XMsLouI<d{_r3~Os0y?w&OaA`5`txzog&<9(q
zn2nNWw6{u1Z(zX0J893ZzPgRM*Qx>8GmdRP^(BBJO^^#5_gO<}0YwwoGs`%x`4zog
zS8`^Rgl)5!tU+&x-g)e_Y`f;gqY<^p`D)ayx!amYetk3-GAT<bu3kC%(q}Im6=S|W
z{kdHG@T+DHF{1DJ1wa`P8iAr24>;9=VWPMW(L)j*A=qiLjEs6VYSgu~#W1>34<I2i
zh_eo-Mk`mS!`V~>)r%uC7k#sjWy4b>Dad^r03mr6v;{>HiH2?>nG`Wh#m*cN2sS|%
zND6=<0u3uf;XRLi@lCK3mSF@5@j<fqAXq&S`xgC_uV|_4i=ZiJYI->BsxovRKuS5o
zvOoZ$#Q;aJ4C64m)y6#^G&v!PW~QHMHx7n}t<sb!X_1UAXzI!UnlG842qeY01;t<^
zuu_DIC!S6~|I|K$%?Zh}0_T~*vW#PR#{r-(%IszUszDd(BP4_q3ABl$O2LwkV!`7U
z5HmEH6Pj5O0L2Sf9RaXSEaNx<C<V(#RYn~XM`eR17YBgYu!P>W5S*YsYo2TCE|w90
zwUQ0ziP57AS795sAacgizY!&^LITY&P#*wQ-~h>e{9ziFp+gzE3uisTvQl2>-~@1p
zmF^v)nLA*R3>1wM9Q@doXBWZN0#F>cV7#0K4YVLC(C6gYwjSJsEr}^c06>-TuoVPb
z17`ma0Bu0Cwjh}n(HxZswoN2t1j$hehZyR!Uf$j}r90)X&#o=b?Ks0`j%6DspxQ*S
zlh3fN2GF-4ft8H_eFSu-jKiP|wjK||D`Sc%-qZb1z&0}o%`An1afoyG2|x<z6uUCv
zSF#{{2126-dijI=)H93=nQZS=xn#v5dT?4=3=?i?i$NU(G86~1Vt`*Vnaxl%;uxUf
zvF$_4iJ+qfi=ka0HW(4v!BdxADOLlhIx;!-u?&GQy2nU}6p~^AA7!h|u7{u;55U7)
zyx0U%_KVz?Bxn^8tfkw~MLo9aK>=ezs2LJCKFz?d$MzA)VuqCt+F@wx2hw8MMiAU6
zcd!W^ND)O#1Q)Wu4zY<RWp(4|)1$kOkl?~VE0Ln;oqd~l8bbrJZVT`jo#N~ePoEB{
zDmV0Lf}$4)zU02|mnBR-!+@7~8YLk50ERD(OcBV_N@y4tnoJQ3Ud?3YkE3xYg|gGD
ztTi%~Y=NnE1h_UCeGqKffNk73Tx}Epcg8YuA|Pcn<VQ#`8p4B9Nw66dg|t3fmMbJ1
zkKzHKZiejTVD1z&nHiD=Pt=J62uD#gQI(pp9vmHbP{@MzBY+`cT6s^I)y{(Ab|%^Q
zw5p{Flz59VjX*Yt0Az+D-337H2pAqCiJsv-O*h@DOkHy<qg^Js9*WdKPZ3A2r`n`W
zG$i-gfa@Ir#RIT@2AmG)4)j4ooZw<lK=?7pK<iG38UTs|6uf4X4$z=n3os`_WJ(X}
zB!M_>2yKBw_og*I4niLzne(3Mn<tB3yCvOR$uj~6bD}}xje9nMO5WQ#_W|3LND4Yb
zO20}YxU(QGsET93f&%D45rHO;0O(7=IqjR6Twv7Q(+obC6R^q)A5o+Um$=gcxN1LM
z-AW?GQ+Fd<r#8_X3rHgbA#?_7c9aeMbXpI02~&xpipV67u%IBsGT?cy6+Jc|1SK90
z^g+P9EktAW*;i=g-l1rCKLK6=7;<4MdyVEdXD)IfIbxH<xKK<(Fod)LDbsWLM`D+6
zd{pVY$i@m_c)uxaoWhIO!ECS$w!4ZgaN593>LoF{Tml=hQrlQhhAB6WaTqm~p>Zo(
zMH+eaCMUQt0G2z=@MTz89|6A-PnxE@Kb#DE{@i}ckkU|`#hH^X(1HT*!zq?i@?C`E
zcAkiURM;pyp#Vk~B1Vup!wrlwXh@7U1+D+Oh=UMLyNhNfL>zeH=f#LCT$<JiMU(pm
zxBzp$mBqXO12@1qz!GY$NXBFj3YP)vn{RBaKe4RB=vvS=mY*0k(bR@lu0Wqru5m&1
zl0a1#SY0y7D>uC0UKEvRh!g-c<^f4cI{6Auk~P}h2iQ9|F$EGpIngJ~5bSo!@Ta9G
zFM&u8=^cmk@4me6$c40jU2gui5;jJ^{r(E?Ef=QOI;>v;oMxGz*&=kgiLj-3@ZOdE
zL0Z4)ET|%ihAxXE;Is?$c4H+Rj2E>{(Bx^uP#YwW{)$yzg5YU4HvuMfoKh<7UI118
zWliUq>ub}DV}|aQTQ(0j7_t%UPUwriNWyc52Q7e$2Y^td<bji?=;_MP;xe)b7&$9i
z{c}Gwia9)a3>pa|>mYz;d1{j<Qi*S}<hqzWY&_9HK*hQZc7c&4OtVzN$p)FJ`ijWy
z8kx2*k)6tvHdsdSAz+F=UY1iP!ZIHrSdHT8oso=E03)w0hE)Rgry~BJM`HndvZO;y
z%5)5;KGGx)%YH<wCJ&Q3UT1Ma2}oe}!aRYT2Gr7Cs4XOz+mQ4C6nIs(f%^+1RV72?
zG&RR%%0eu|WiKX?5q`uNl=sTP#2_@(6}-?$F^c3tWtrcdF~q4R87jR9dtHQg*r*RB
z143^FJd@=OrstwmQ37*9mO#+JX_j3$I53l}5k}jBV9ixVn(HI%!Bi;#5buc93tB2g
z3>n-xo}BZs5`fAF3GRQ8(u!bbMLr^*0W8vjT2NHVL%>ynG|McgIEpm8k~%>dnwz;-
zQUxW{S2(}`2VwWCo<WV?CSM$X-hiYq$1?ElFm{bmOK+un6R=BT_V6}g<!hz{7`Yj8
z&+Sg$1Nuiq=!>9M)+v|EzI@telWjEN_`Z>?X2J@~Avs76Ha$xanu99-vA_#dB$~B!
zfT_g9pCPTNejHj{1G7Pc=*u}eEC_v(z^`Ip9RDRZ`xzCCB-sdxv=Bq;Sq5B0kwyTL
z*DN4*1RzZ$g*b9w&m@QIpg!d-%rEZLg1*g?tChDV^#8GUmtk>*S)RbFD5P+zkl+;V
z3GVI?AXtJEAV6?W@K99Y?!nzHxH|-QN$}tfA%P@7NNVZnnc3;xo|)a9p4pz6{&GLu
zkN3IneV_N7bN@dXsMi~TbbcWG*L4*(1HR`h&5_~#W`>`3VHpJ@Q1uIZvikD*ES-Wl
z_qq{1jW62h%!Az(y2}g}4qxJ;ph$;JvP3vc>NSNo{Mp$i)etG^)lD7pY5hB@j(1!y
zeXjH#uio2vME?2sI2~e!^-cJ`eDg9?#j;O(#5;#Gv0JDV&)gX06<+rQ>Gc3x8ND8|
zixE3E;9qQ+`T&?byl8qqKCth7iZmy?qNgSKT2w9G!J5^d!eyUy?@PLu;-Xc`65~bE
z6QkliXdCsYGxM+k2Ifc@@oT*bja2MM5(D#YIFWE{@lNbetrV1Zfki<9(4_Z~r&=k%
zY`6m(lQ=+wn&z7YLAY=T=h|rQ-TPa82BDu1lwUtDHepD-fzeOjitxs1Kv{nZGab;Y
z6vr_)P>ju+Ox{ajt80^=sHb*JrVg^EPS&RWgQPGTt+l?7*!>@o>vV`;AH%YjVoaA3
zetkqmtkb|Hm(xv`GbLAk<x^zHuH@6KluEAF{aQ*{Uk(Xajq6%@_iJf@X00Q8HP>`~
zI$%98V67)$dA4h9FMB;Idt;|-J@eQ4WcJ!g*QYP*8wXwMTV2cR`74=0o290!pSw0c
zOK#nmeyTRzqIk27A+`C7W`j;@*@xytp?8O(kIuGtM-h&B7X(o<L)Yn})5^iV+rrc8
zrkDfnP508J0ruwUNwsKq6*qS71u<o_J;OJ9(o(z18wc7_hsxc1&)@96c(d>Dd*9>D
zuGhw)2JKPU#*Xou<EZX~YTCm(GxSv2ed{;7b{qT3v<I(pPE<EeB&CiTXiv(!PXag2
zP<>{nnK`GD8>fY4XFfS+M^bxdZw~D?J}dUp6?LC$|33U;c9_1gGoMe9^ZQit_r;>w
zmsPWK)bC@ez*FYj&n+9DA4q>md2{h`;{qam@rdpsJLih#IXdjqrE>Sz7PD{GxjW)!
z=r-nr3w>al-XAeCGy;7;0-h5uSX{sC#a*x<jD1d)wRP?F2{-l=MR4G?SI>_?>Fc<j
z>#$GYT^Sm87*=#IWC4g9-FsIjL!;DpHyKFc9r&y36Xe4uuzMfHZs6UX%<pX3UmpYS
z#!+`bxpg*1^q6QJ{h9mBa8Y-1w<3bavRr7ywCb%h+WjU|P`Tu!ndM#t5i_(%Bykh<
z9)U|G6)jR{*_VRO?|iDFLo<S4knERW*JYMV#q&s3Ctujq%43gl9W2vioHmj2f~w>2
z(yP5yPB${C;5nYGpwE0Qi1^C65c)DkFAJ!jB-ZM>ZeJjN?}BxjEu8h8sFQ6-9(Qg&
z^?LizqVx6NxnT9Xqsg4c-O-{A`;%GXe!ua={#PmN?53`LxzS;@J4U?ae7*Bt3d5IZ
zz4%ip?BN~n>Cr-^aZjvd$M>_f4!?IB>SR}cB8BO*{_429xjI?xiIeVmbF%g6CyFrd
zd0a$qKgB-YJqjikf!dsKx>vy-IQij?AgHle?o}`_JGprn?Hd&n|DQ1`mJuvD;g*pc
zw~SQb54*$Hf?uBAt6=WfticF(o<mr0)0qe(lp!nMBvhLM?M0%R@8Nq&PAP2bWF1Xa
z=49@N5!R_q8h=p1@Q#@Opn^S!`6nvaZmT&maI!W`lu$`zHP-nLDj3$3Vd)=LFz1RF
z|Db~1y&A%!yjQ^rL{INkux-gds$kY-1yFtK@{*iL`-+Ol*L!6(Z$$E`{q9w;XG(p=
zQxpu~tq^`LbBpje*Ym@PM-1lql`LMr+4}R%!sDasMpj0MvblCq=CO<nu-OoBiv7v^
z21<esr`kLO=XvFE&ErgndKHdK=hvynE^n&qqdxl*OAR3&V7V7YJmAWTcW7u}egP)l
z=q_hOijU!J)i)lAt~T^YNaQ~lVn|mnRJtyYjbG#HLu9i?uhwQh0_RUb-(+|=b@Mr}
zTXqS3iuRZi^J~V;;YX=&1lOCC#fl2(sW|klfqm=gx%AX(_@{l{hA3iHvP%1o7i^~%
zo{E2EPVBj}oXWuB$cjl*9HthO=L&RuIUzHRZ#gOcDaLEV_uZl9r#C1Kugxhp!%Th#
z^5Zno_J@*@U_XKLXA2qOuwm1&TahpEer%mHyD3R_nk5;#C?2G!45d5T_=;S#dzLfq
zAqE+PEt~h*=jAT1^Y+hEKRqXT<ObmVgr8H-hKPl?@*A_=`mvP+I=p8aZH(LzZW)Xn
zEo<gon=c+^)d_r$<G$}9h_>o9K43k~h!$HOc~~C$f%vDGuzFVQ;C;&dw6t&Q4}x9*
zjw?LHV(>x%{uX_sG7t}M>bqwWe!<=l^<ydm3@2UL6_Z*airpCc&fbJlLD%3ZH%wY^
zct1&nmdhmh4BiD%l-r1Fr~vganrip}=DuYBgGisOJ9u#0|Hz+{s{j%g&Jhw}4(6@O
zC${z;fT?M_F1v<sQVPE3x>fSllq-1910I5~&qAMYp$hR8H;c8F*{McVLbEsSrLZx#
zSkJ0Ln$NZbLhX<^|I<Rc&t=2XIPURp@R<G}g^4!vCiqw3Gj7?ch_Q@P{Hz~*k+vDj
zWAC1nH5l7(Go!#S<_6xWEqXB6P=qP@*|kKWI8o1M^qD1gYE^JNCu>AJuvng0sg?O*
z?l8hR+dZ|-f8wEEI<rwClp@wgpEVbI(l${kqM)jTnNFUCoVkR0WC@K=?Wmus%{FuW
zZeI|>rb(1ApSd|`BPQKA<r4b>ymXZ=w$-oUlEa_*D6$mqC_=`spE!3fi=JO`M$wML
zGaoNT9aoWP%sv%Dk(&3CuW0`<N}V7RLW8A<;*QiNbRr3&`Nh^Kx00WLs1If7I^@wk
z?oWJn#XAMYlX#&vkXj%h!;!)+<B*{pv%L^e=dI398M#p8%;#;DT&9o!8E~H5EIv;N
z>ERL$E|G#%?8I|CU48M?!~AKb=5B>PG9#xpb}`xppUr5t@B?$=Vnk}MyuKn_9c3U$
z<FIb8w_fqFa_njHt1bt#PYoZtQ)d$ev?^ZEb;#+%X71$`dOiRLq9yU*VO#_T-|mgx
zg#BxYtdPT(?0(C@7&5WqZ(O#O=_|uk-$kn>xvjr!_G8wSHovp3v|Sxo9or_$Y&U)4
zYVr7qlFaM2i9OQ`F(bpJXN}Z>M=3s(ji}iNN+0v)tDW73k*1C-uR3VY&h>h5vo9E2
zJ6C_Py_)tj9SnclxkuBF_xk4P#h6#u?yGlRJDH~6m3|cdz+ZAqxZgLQrPfV4)goW*
z#}3bUbr_ei`o4Yf6w<m~?~&~q0`j%kv+^D=%yz|>#`|;-oi@NyLLXUOx&1Psb>J6G
z*ozC_&8@1|L2laNDEX``n)%i)p*Is2*^IltDZllpJM(qov2D^u@sR-p!?@hnsQU11
zM_5X}zNm_}-mtylHOZ-cs|c{!k2XZNF8Q23AH7A@U^vD_^N@0Y%SN=tr^BVYKI5DE
zLDq_BOyGul)KR(?E2r<Qw$VTq=+}Y^O3I~zS4WwTwgE%s?bA76^;NNAyq(5D@_e!s
zfrS)}y|!`c0vhR5Id8T7c_Odu4JiRL_v9yo+}Cr}1XGo=G!ElNmLGKAdu*9iZ;~1F
z%|<&nH>i?yZeVtV@+-pPz2rxSJ@b?2ON3-*1+pBY%vb#gJe&HQP684-Rs|$}G`(WH
zpEvajP2<jS<->D499mi5dM4a*@M{{lEG}|A)!2O$g$EJ%zKrK`9Z-OO!TQV-_vlcr
z+T*f#n1^@!j27)Z_nXb=M_)GAbG+X_ils_$$=cx)5FH6DbWeOjMbUaDC-!~DVJ$j2
zo6Add%!Sw^)wp?Ic>2ca^}{nVR)5qMflK>*3!_E8^lV7*=%lIDY&6A%$+19DyK_y>
zw`vcX$fc_GsY~ehBHZ<pXUZKP7HPlCe;}@2W^qeyoBH1H;@8=W=iexzvNPMCe?JfU
z{b`;s?s`$7>vMm}%cDE4d|*Q27q0B19hbIu%sSm)W5X^T`J`_qg=vFw9>fnResXiH
z*y+%rBH9{uo*Q>j{aTj0)u#Wv^`+$gw|F7{?Lfl28Ll^%Br)_RowZ>Z_MK}wkGf+@
zGyDheo4>CKN?oN$2OPiscsnvI71#7xTf(4#diWEPOAG%;w|LLp#>+RC@1MLm%%z(@
zdL&_mh(p~4+FX}?-iJ5GV0~lt{auQ3+985(>OZ3sa>itX50=6KOYp%k!}R?($3NhB
z;c#ogAQYx+cWEHqb<mx@AKlX+kbyR{ia%>wkYh1|v(?}`v&W_~;^8%d^SwJQ7$FMw
zXHY>(9wMc|!Ln?@@@#4%Wk}^~PYIRa$0NZSe<y`qSqH1Agy5A1YlnvzmW3FPgcJye
zJOzhFy$&%|3AMJp$5TV0-$E=#LJ5UJ?Z9DfY+)WE!46BIUaclBDq(&jVF8C>!rp=2
zY~hh5VS%>cVd3EsDu%B`!ed&sLdwDu*dmff!lDnu-(IW7t3+guL}aIhq=rZ2lPhH$
zMikpdmZ~80*di;v6^g=9k?+7!b!@LHMk1Ti<Z9TW+RCCjR9-gPM)i=(w2nj#s6@Xv
zQ0fLpkCut|+eS|wMz@DYkFmvg4@6Jf-UDF~vm!C8;rxr?F`vM(;bk#vDzTT_F<arW
zM{Hp`2C-*l90z5wU)bVIMq<xx<BHMZF3UoEU_fXurnM*buQZG&$v~(Ua8*m590nxM
zi`ym-{{c=|U_--?2sgaX=XXW79>heur@$^0K=&$GJeGhbHcS*iVi*36Jb|;E;U+xs
ziERRTc>?SxK@&X@&>PRMfcC&A@zHV^$7rIgA;Y~DqE4PfaiicUlSDU~GzpVmbxo2q
zO!fpP%h{!T=R+mvwuLE+Cee&0)8EAH0KnSiDS9{Y`VpyRa>>>d!6xa+kL{A^u>nw+
zJh^KE{b=fmcdFg!TfO>JpChF6k%HP$irZ*X&kUY$#9MfJ=+ou5apg3DqiGM>(gYRK
z1P$edM-!CulF@sUk|IK5vC|6;X%ewBzy|38p6TilKv)|93IJgD0-}5}tk^P&A~I_%
zGMZEa%0=ZXDc-`gfb`gj(ma_uqnXCunQfz4<#m~(?7rRX^1bQl005c~QA)jQ){JVL
z-*VO`L%QkF>}b~P9hqza^h6jS<-rYLr#5@%CSn6S=kkbV8#~uTKj%PH{z#Mn#sfg(
ziT~__%GGMky0Xj5vd9IEx$_zVc{cM1C{u&kfrL2uJH5H9@O(a|Je-wa4BtFDUkdE8
ze87VwFQ2!fs%b2~37(_5f{po%YQeNP1^gTo3^;}BHVL4-LU9fNn_8B5MIk8<0Tuwj
zw5dRtS13Fd%%@h!Z(pc}Q@lA+q;Z@7gtA!wHd<G$7}LJk;JA3Otk_sA*Yvj7IwQ)0
zqvVrniOpC^S$K)vSeC;|iN{KW3r=Y(d#PtdX`*eZmso~Rdufnwc))RK9CjHZvMhxy
zH)O0V-K{JFr`%1YEG9BFj<Wo%eQ1(e`7^unwBz!zwz5o)3a-SIT>Fa7vhu?A#B5(w
zMRj{oenmyhSVfImrEFS7oo`%&QDsL)WNl>Sn~KU#j;c+s%AS?jKC!CN<B)FqD!a(4
zF`Vib`c;!-G1HXQAIIG0)vD)htCx<e*GsBbE27tLtM@qUw>WBgRciLfYIH(tj_jjO
zR%$LeLMCwD!8qPsRlJL`efPsRkErDxup{{K!Ml(O9$vOuY}_}Bd+Hdtr8onAIGlA0
zVa8*7wXPh7<wA8-xNoj@aUS57LWDrnkLy={)WD)5a0=^~$LmePj3+|tHCE*KiGsKt
z8Zw%#cr#04o9l&78u~(Q#i;5#el#d{xWpx>%4L@DM<J9>8lULtF}Uif;g(`Dq0k^d
z8x0+l2ENtl`ISEFa5v&??*2w@deY=|U-k*BeetsaovrERc-gsm6Sxs0l?c}>s>P?W
z#c#YN;G`uGw>5~f75TU|#Gy4T>VK2MR$B)`vD`5mT>VPVYcbV4W&TkLD|TovjcPBi
zY_A+|uRdvihx<>YFynTCT1?f-wt{1Vnwd6r*gr^N;+;yVMC0R~6Mm{AxLvcHUBi`~
zlMY?jUpnV2yH+1}F8XzS%<Nj@?4G$VL^yP9iFY4ycJ4WJPx*-)<Ms@8NR`ibPZ%?z
zLwhd7d*rlw#{GJ@cu?IAwV2U7O<fMXsj|9q3#HnPioaGU@z$tparz*qy=4i#g9&cy
zeQh6<T;Dd*P(?fQ9Q0wS_m@K?=<%p2KGv@B_H|g4a#vA7Cm6}AidpZR$%XsZfc?Vi
zR2)@(v7!APTLaAMgC%tXH2xxAzmVHJpsv)*wbi4xwI2{m9r)-r$Zqmp3~x|EVo-Xb
z&ocGBBG*u!+j~Q@q17*1>Zeqddc9f)B7<9lbe->2I{TNjhs?7EFWrV^yoOflhMQ;K
zzu+3Nk{I?j8Qw@3>g^l)lrW-^)!=^j-X?3<h<dagGV=AyaD&_EM#8As+%OVvEPZw~
z<8E|qcBHdz<f|KMtSe#6jCzn=f9wPASdPT#w=ct)cQh^3<M|Wg$+M%aRb!8%$Kt3b
zTqec_PscuEPP{Q0@i!U&?lwF=F*>O}9(F%_<xkOmH}So0ta*0qYId^a%VeASWE1`5
zgvn@8=j4pZ$brP<^V6v%uIbs%@o27z?dXY3|LIoVsWg+R#b~;#&Z!@D17Gf@Y%OQL
zMo;Qz&4hPOH_T3dgG{|&7;09Z#CIA#Gnw{1wFOyD0@r7$s%I`c-;<xs45`mD%}qiy
z=<vAb;-hCColW!ongU7A2}@E?oz8M3j&KFgm7dOXo6ZTuOo>-BWQ}{WA{Im@7Yf#9
z>8j@jbY~goQ1drgbYdC{@s9IM{T=LciyHVJM7uCmC+9(Yi`w@<TQ!{+{-VC*2Mhd<
z1m71q=j7~TKDeALx&$n^O@8b${`iFNV*vLOQe!E^X({Yp;jCVYn!K07mg4Z26S$ZE
zCWZZ#OJTSFO{K6C8lwMF9N5JFJqI=$sPca+f-OcoyXU~tqY(EZ*k6tV^Y}mH!2W1~
zeJX`-mIh{&^+uMzYA?^(Di6M_@Exs8U8;<UtM<*Po-C<u>#ix-u8Ays_kOo7Cbb?h
zP+yYP7`oe-^sO;`sHr@wIkLKWY_BEls5LdOEpEK6dcQsM&v9V+f1U$-{~yMIjsJ}U
z1L59R?rXOO!ihP}CR*!uhT|C@=cu>U?~SMNJ8Vp}H5^Rm$w$#@v^O5jm+4lTO}00k
ze5`#jo}<yxe74%^ak4Sl(en9IFA|qdv$OTf&PWpH^Qq3Z%Y&K1$GMta?cYw88XP`N
zb#?ssyg3ksqI=Tad2@L<U-^8xyX)tVj*mAPPkOq4{k+;b`83_bR6zp3WZQ(J<ESVG
zf?3L7ivKDHwoS&u5+o0maJ=4%;wgDh5K8Gzz7r$jEBu0pwdC*x)EIr)GFX(%ZugZq
zS^jRKBKj5+p~S*PUX1cHyFGV)oh>V3*@aqbVsrRkD+fkMinU$A`L3I67Z?85$ARha
z)=RHg)pJRqEhdd}HvBmbOq(9YfyPY#CmfjZwXOrsuR+jeE+CdVE*Xu_SgQu@zW@go
z#~rUl9g;XChW6(<ux3~u8&Q!HDG5<KrMn~o9OsL=#FDc4FV2DK<ZHcE59;V%MyUYa
zBf|>tY<(7XWdqUqFdF~Hf&KMzV6qsrB>C8XK@Kb&g>yNAPWsPtVA`@ixoiXf8wciy
z>)Sml(JFYTc~F*uh9)ompOgbLM!~$4GPJaiBm*_r6mR1XL|}YWo)OTXO1NX}mmI1+
zs@MPF99Y>VE(hD6aA10A7|)S1k@BlGvPJu2PklCV1M)1rpiHlbr$WO!Yv$+{?>VqC
ztwwHYHd+bS2WvZZ7!Mj{wEa7?rS0FT4SST!^3$oPd;N19m;uLvIZeYRFo?MbzY9O=
z;-Uo`4Wpi*_OF=(lgHqHV6|PVO0f6pH(ZT~)b*R3swAVzIg)T(hlqg9oyp5JH_s|F
z4}T;v$m9#&UycK-$4Jn6T=)Rn7s+ny9mSC^(!zr~3l%pW0%hy4VnNW~!3fx|Wr1(e
zb886<RWQ!$v9X|G!k6&haFF8sE2_{i-$O$GG}1XO^u$8pZ?JIAM!d3r3kRlvarmE$
z12f*lz2-5^{y*Tr^kmor?8G{@agj*+=t1{EUAET)T;yNh=Bcu`%rGb!yhVc$&gq(9
z?xi*(adMaSzq7pcG$g{K2x{UNIYC<JAV7_bX;X&Kt~qA!!sI!vhbznwi5YY~I4FJS
z0lj`A$x|X?lrkSd3K79UJQ{C~3ZpQBH3zN=vHG4iEt*SDkB{yJIWdn4OOVV~$^E@d
z{`H8W=35TRFb~r=51f&Q)1HU7!Ufuv#UX{w0h}tg#c~;7hm7KsPsJK`B7p9%o4;gJ
z$)@8Q6%c*NJGdX90O6zk|K`AqVfZT-*xdlk!%KYqF!m6XZ<$pvVdiG3AIAd^qf*#g
zY-97Flg-yOmptiWocxW^CdGsa0L)tD*WKo?Z8NByS1M{aivQvqm|m^ge=`n@5<`Ki
z__GX#n;J#?NK`jW;${f+4UV%d96eZ1@NkCh#9T%pgun4cr5JIuv3y;ua(nj-{~O(A
zmoKed;6xBm1iP;EajS)>e1}k>m5!d03lo9la?2ZWYB+B3R&7J^MbY}d%z+X8jRSMd
zRYV01gZf73cB`o%*@8UT<VqM1|Hgr_ON?t%F6gY_D+Lg&$SnNk!q<>#<XL}kcHvgS
zyC|9cOw$NobDK%7x<5Fxz*utTAYPI;V9{ohT5o3VHe=!Wuep{V4=&|N8IFmJsEOT7
zNzX(-zQm{QCx$ij78DE+aActItrVQ*<)6kE0_w3(VK9kaf&dLB4tj6j020VLL`4i@
z*#ePm4~<owwYDk}bzA02Sf-bSW6W}J^BDR~Qgwr1#4CjmN_u}xSY<)J2Rp2BX9;~F
zA5&Y1AwLP7*Ht}#o<_Tb_)828eLH6Unjsg-&?I!^ua*PT<1y{85R5*m>|Lpv_I+9g
z!}oWrl>A-UV!k8t8-KLD3XPZWVV>73v|VxmG67l${TfV=g&;}aC-SRzg0e)3`zA%r
z)=ybY(TSS!e-{p{79(>?fOhv4(jIOiFNJnUh@OUS-uqfeci)D9E_cTLrX>(30h@0;
zrfH5X9p)r>q2{j`bR-z2BM{X2m*c>UYmK2goc@BG<E|-xl^j?t1{4v~i4-4s^Cfiv
z)OA9P-3>usQ^NUy&Gv-I9G2W?|LD?BT<t?o!v+2m_nE7Zhk?&~(CU8h!K^fDd(dWK
z+yGTX+@@YO6n!lrF96qgCg;`+&dtRB&=3@lNaU+U>I}LI!o~km9GD(zh7kRRNDnPd
z1pnu$tV`r*8q~t$8uklscAb0n2(~r+Y?^*@`oYB~XrlV4Hk5hyGuI+E(Z9lhHNU5;
zfXNCOG8xY8swQKzmROZ*{X27D+SplMt`>t4q>pUYmcG1*AffLt6<z*nJ&`WxvQJHH
z|MFd~Y#fW}%GFUTyZ3cea{sGH!%MSL80zmiFrD->muEO_b}eYAUt)>UwD0s=-q85H
zK3i=w9VV?wxjx+)HGPzOb|-lCvGsW&%kz!9n|C$S|M@sDPLAyc4<(6jyA{*Yz{w;{
zltPdkGX{^D>eXxxA4Tm9`KKaJCE-UY5FJgg$d^r;@=dB58hd{!4h+U|VaH(XPAK<%
z&Y@54vch9Frn&l6wf);U&vEVtDU^TXzzV!}lk_*5J|Ukcdhfh_n;oWZ5{H|z+bA0m
zW{lJS@~?~ov&5ad{wv_X^7=WCx1wNNNLVf#0=G;i#N{72u-XuA?Jb)`>PSbSr4d2q
z@Bl|Wd;vhjgtT2D$qbhcq6{_EXrt4hH@C1KTQ$n>_;oXVJ$cr}8!l$~b(dP-dxYCw
zhKR$lKIy${U-!Srff>UTSs2o%a)YY_cCSh>kuPW6bQ<IJW^AML>i$^{YzIe6But*D
zuM$3*6qI=pF0Bv&PP_iga9{(Zp<D6B=s>z~IKHgd5iad!q2RlCCG#(CQw6l><>-cC
zc;AZ&QP{VI<xgUc^>&VvcCD_eBnIq_aYvuk;yh`{k(|Ym<TRSAIFuCbtkM|zGaML*
zH0}R|0~`Lga$r#TkSE#&W_kvAAK0F<CeJXd>n#zQioFkS!^KvSk;lrmb+rdpZHE2@
zIWSl#P42h%BG0hJmru!QO4|~)YkNTkCfdZ3y(27Q?-NIv_DM8eXo&ZIO>Q))bOCIR
z@}XTd3}*GcOs0Uk|31$6<Va-mzi?ng1NR(QED<3hmU-?n;`Ve8DmgH!JM_<TVDy-#
zGHo*lhp%eFste>l{yhf<!_<DO^5Bmg7?}6pl>>`M15g5hfPX6o#=xl%0Kgz`#{$R%
zVX5Cy%YcCZu8aRC4y?v?X9$I{6^Vke0BW6~%jSSyDXgT&IpH4amLLyS?aG_em(U|L
zfRKtXfP4cRFqpMGc8Ct4B?2-K(H}9jpnM`=n?UF{xmnLJxZt205GT3pkQql7<o+u<
zS$=i5^blh^g3f{&03fb-9wd}wvFAcG@QsPGjXXyRv4;Cop{Xa}eD>~p>-4X4>b!ud
z2p9idekve!+SkG-zOi_lfU&|dct@khzrulG@d5zMWjt@i!^qj-B(lQL1jNRG7$Cfs
zrdQ_h5{`2zwrAYzaroysFoKC@g3j9eX=a*QVRx$TSiiRBhF)Gy$TcIRjj@|O6BD2k
z{2*EuuqgxBlpsb&0L^=yIeLY4F`lZ(pa#<<_}6l)3WcB%UBow%&>&0_FdR=p(txvp
z=z4(Yx|XO+hJ;skgCF9g)vu6@@Bm`~S^+ZDK`t;cN(n3iZ-AREVEJ)^JY&Kq@pfT0
z$Xh?LmmY(SjF^)kI3%yhoj(B!gl4cN=~>zDkq5Y8>~i-|P`Q&=y-!T@7r2hNzYZwL
z$%{o`fg^E5%GibQ@PwI^ZjSgZ`5`!IaN;dE2$tYH18C)xjAewxF(wED051FxRsev-
zN(v|eA(2R+;Q=s{0|@3Z0ksGc!)``hMF3GK`O#pZ2bwRFq(yj_Th>q_QqYO5Z9Phg
z20Q2#6NJG40PSltc9cU&=PCOMB#@5`dB7zDj0M|qfwl@PFZ`3dZP933$xC~&gdLQ6
zy@wLibAhlf=#dQgB!ub;Nza7I=?YNdlBAjmaj%jEz|l?9>R)OB2w<2NWwjnN7@$_T
zu2!hRh!BGaARq5N@u1opJgKt6QHTg!a|Tm7Z<NLxV0zJl2LNoI3}YRJ=+?q9XIg9j
z1q<xtF-6;075V@XZfB%K*fYHGI<9dKIQqwbVu3|RkBV`O3jc!z_SSO<16_l1ti6$6
zIRXU07->2M!O`xQ9G*D9dqfH;RxN>nT91Yo;f8?W?Lco0Yc0Mc&V)qcDd-n5mOIRM
zAOJcWkRw>EjuDcbrE~;>12*A~exYF?0Enkfv#kAHRIR3#W<z1K0y&_pqn%t;vur@d
zL8~6k8_C%TFhPemCTW&cPI(Z8)l&g@FQiAZ;M*@IXRIXL^BE8`p)PFUK1=AH+kddY
z7W_vSt!7A!f`G1we09kf&IFe-3{k5@Gd68vZOlMMhy`4br7qMnIss}fM&lDoA{q9w
zY<7w%l=ueo89;}mJOmPxKrWbIwj@iDKTAxH$r2Kb#|EJLHbV%V<oZ%<{w0K)1I$D8
zcJU~J6FiT<hnv<o_v|JV)dGS$CPC)y%Z+-`scL%y2jl@GfN%1;kp4NYtstg6u-+0=
zpbA=G8WQ^~!eIu<m(oeFI8SJaK^Bwn*`A$&2M!@`4?MvX^VU}G(!ruhlfifps5P1c
zz%Vw@>k*mP+{^uKv?yl(RKE)*6_Dg||7(*0mO?m|UU;z5bp&r7lb+zbQp}=E29IS7
z;|s|Tz>KE~vgrA2@669|pFaJ-P7#dh4aba^ff@#3^?vxMPG5WSOp`egO7s{~(91|V
z?BE2*IE6~5!O_eIUE&dVA{}<8A>_4i+*+XJ1&H%-%)=YRxio8}2Ox~swzr1b#8d*K
zo>^!t{qg~UWZ<ZG4KnCF06=S>I6C)@;r&+`P_+QT*i<2o0DwsEQ}y9)O$bol5}rX4
z5ji}AikEq{ecfLz(g{v*@g$kC%Zv>U1Q-xow3W@Pg_|aZNa6>;=2H!fvg3Kf)}!ns
zR~UkVfhtnO?BX$!VX9}j$<=ejvVcVH1hdEa$u#<Bow|Gxz+-AL^)v&O_rVaVAaPPm
zwN}C8lP*4SK)xWv4S+!7flCw{2?dcjZ3dBDkfo;~(HkP(*p8OHk19V~u(R#P@P?Dm
zgf>+2t82}Gbwf$vaI7?dQ<G7Zb$2v3#9;CrsVyAC7S2nI#P&u)4dB=#LKd5F3<E$Y
zQX56MWQtSUw9K49o(FjJ(@6gcjs=Hf6U~|tt(t{z^kl=a^WbjALD)n>tZ8sa0|HA6
zjtA2r@j+tS_7Qm_G2(me%GNP1;Q5URY;Qn(Os!FEJr<8qw*PW$A$&as;NkHe6yFY=
zRmBrXXj%jQl4}E+*H!GS-maU1m%2P)2mnl>e=(s*5?@?vEzQ*^You{xF>3Uc9-Tv5
zYIf*Sa6141C%<SbOA?V2SSOxcfvP@Rkc4A^J3S15pQFW&7ci~M+7oC1ey121@sqh7
z@Y19wU^c*%{6<ewE5PP4PW&>UcH3wZkVgZU8R(0gd{p-|lpG8PiCE&kRz~e4x1wno
zCTDJAZq|lz0y1=$jli84fR%?+pP;f^89zmxG$6Fin)UddU|U^Y^81w!l(w^MmcY2y
zTgCtbFj{xQm=Z9E)^LY5pS()Ke+aHQ(m}|CtQ_YUvSH>hU<7y<tXMu`O-#}w3wz2E
zu3uI?$Aqm4z|0O$YO$?3rnHcp+!BLNXv%CYA*X4`0fYwQxV53WB5?BV6$(vL3OhK^
zT*1wpmo~P`?%F__4cPQP7_C=^&f&2sc`);L1(5f4Jaa-+RFI1dsF?|kTL?g~3HU)X
z!*Oou1U8>uoiy7#@Q8n|9>Ujo+1^DBFZBaB5n(Z}0;K_lOnS?xj?4~%L2XHv1TFC9
zw4wpAs@yqKf^7UYY1$yokO4Ya5ezm*&ohpnv<2p1PKaZ<q)w~HCg5q}*)T<DvizL|
z#<9SV_V*T8{@+_*7#xRBpWj<xs>j97_JRLsfsy|c3(WPy_*ZLzZ*WdC0IU|XYuC8X
z!-@dBL+NP)P1veR+4u0)-A*yYs0GICY&Bo;a*}tZ;&(cdta?fuc);PFHV3bqZO~y5
zZ|BE#iV)n*ZRnOoLZ{WULz%on(f(aoLaS8}4ZLHu!7Uj;ce37){i2Qr5Frs3HT4d2
z-;9F7P?H(c(SH!dm<h*c1MsTY-C!(JpNG_n!@)`kr<J=IvH2Q8_~tzC5|`|r%c1M#
zp((`UvyGt_{Lunau{XR8&XWr+(+v9ZM+<DmK1w9)e_CLNdlpXT#GNmae!c|5LV@vP
zz!5kfOF~P){yZ~;@`F;m0EE{Y5TOgO+}zp-fdej(xgA~LaQH5<@fVs7daHvWDJ-@R
zquiI4W3<McgQuIgoAS*=iQ^skaezX>gwje-^LumxasczViZmDi&fB+BIPFEkDV`56
z+cZPL?LZ<`($TH7?lyq4u9FsUN%P2qsWX{0)Gi#DfqOxmJ}>>@GjZDys#gnx4Zaq+
zbo5#!=!p!59$ToTH*4S~@_c`@D2F+V&jm5!5oqh;<jwKH_4AL|&zVapW;dkBvc2jw
zEb8zXb@CE(3Nl_k2f~2RheN>?#GqYFSKu@NT?XLb9a<rOVY^{uKpJLV(^spDhU20D
z5`o*bb_`ZdyeDvj`h=b)^?Fc$frgz;A*Y)sEQ~m3$ImUHhL1ZzU7Bog4A_y`rY+I1
z+u5p{%ZKOfG(olU{It&uZv=VW(uS7LgTeEdn$iG-Bo<xew<)G0k89CFCWw<rFhJAJ
z65Oe&vaDdv=jIKHdAJNHbK`SKJfOv2Qo9V8wIkRED)(Wz#mAstwT6(0q-2}DW3+QY
zY<fg}ye#@1YB>W=hP&L9L^v6SIp2^W!qL}{ah~U)1=xn^&tP$Y3tcH5P}h56o`nEx
z0fgXjH1H9Mz_qoeojSH1t$C%>Z=~KB4mKB|ntBH?0Pq&J32$y;<iUG8+HD@eeY>re
zAHvb#a9qGAS%6_O<1{NR02~ic(F*PLyT31%BaX$4gcFGXsyjO{TTP>fme5N40N!v&
z8XQRE4Q=~E{ppJWSORwh5MPbaED7(6YB%!+#cSLz2Zihj@y)1VZ1N!X7{?~0lRcw6
z!4hy-8sO0T0oocw*gBuw9BOyboZN)yqyiFze?ujli~uyfehGQ>l4HuXVxmWa#chKq
zVW|UqK<W#!O%Ajk2!}+Ex4~8=<sp_dDp+?5RJ;#r<-<;RhwVT6;EkP0=0T*3%tOm9
zWX|ndc=^>`&C$znk#tEosYoX_ku-rw2ml<U2>_#G5vWiQ^{$AjfG}xA4qO$2Kp-WN
zDg*5-j0jxGEMwrN3=mz0qg$58d<!Scg+xUno^JpMBB8|t?_Kou0$rveC|dJ2(ZZT2
zvm|Cl>D43BIMmq8i?{i4F)>NPd&evlVSwX70DM#)uA5DkrN?ua)r<`iWh0+C$%4j!
z!$qzdE@WmD@Jk3}T*)fmV*?)AdMu$l0B|4<EE`Dy`+{ywj0y8p@g$lmu;uumLnMQ}
zIa8pV^w8;6;CP`zUtB$*pYC+2{^fj)(@&xEwRW$|b9`e$!B6c6qeHCJ!ri;SM-;>~
zf3BrDO!)*l6h3*KbhOek{6SeUv*(TZUCe>=Z;9Kh<CYGav)__;*Ix}CD&JS|*g5@J
zmv?~PW<D&{+lN4=0W6x_E*8a)xv#V5qY%X!x>2@x-KBV(DRs|qL&z2j@XT+qU###~
zd8!ya!Ug2@;*i+St1^^^>q2<bX0(It=F>!WMBli&0szz#!b}N@l!h4&C+uyziJznU
ziV{~YWE7#Q<S%JG=eQ}*$z=~w^P$oW3m4eQkDKd8$*y5gLWayd9hNM&F+&?a<rN>+
z9G{_&8l0s*yTLg@I2omU(r5rSJO6sjJ~>AGTec!a7E#vXlp)MWj#T#_8WP9Wh9y#y
zc9CY%we)-(73CE;#@Pw&w;WYBDef8M#Mcncnl?*8e5Ur~lF6z{3n)%pJ7wlcQ6&e(
zV2VeqY*u~68%pk`MI%4%q-xp@?iP7DdBv8kNaK~3oeV1H`X&31p}0<PR#yJtvP!$u
zbs6z@^*^>d9`*dT^?TS0#FgOb!=Q4sYX9|B2sbVHxG%cjT~0Zi`*GxDO?#0*6%}EN
z!d+dHUJ=iDAM?RV?kGDJDzbizdtCT2jvjm>lg8!tQiJ6rS#&yyU)~3wUhA;ViYaJh
zbm~=qK)svu?d@G-u}4vD#Q4*b^0Gz4&&#DBOy7Q2#z~inF^0~;l`*82Wy{q{Uc4)v
z=8;`3T;+T1=yuHVzL!PQqby!_i0gObfHKv|;psHL6Z#xGT}z`jK6%(d$rI_~sS-l!
zW`mklPA4XyO_{m(>9kn5mIap7rzMLpk-Du0Yzhy(!b#R{IDN%xn*){yh1pM9y4oIG
zltb+R?x(?#_W2J=MCpz4q0)-UqC?_iJ?m9Yx2^C<fuLz9y5nnsuhF>UT!mg#66)*?
zLJudPs;}7{^QB0Ic2G9sq&M<)(x^M>N@ExTjw23_z%##4Bud?i<6e@bYUov#Br5B@
z5D3EQu<hsc-$F1<pkWa=(t^WwC@U!51sAcu#n!z~YOu$*VRtnGzn7<F<9%UEU$v0z
z56O(Rdqlgf(nrnntZ@k@2hUXrlG3S-<&I|{wwx!B8Uo;)T0g>=yBMBJ3<v9JZRs7!
zE6&}`24j;AU=%aRV>-xC^Pr!HIyd4^cmwds=IUZ!cNUI&$9D=tXEn4K&<C%{S^cdL
zSc<I#9Ec0-!-Oe<GlT}yHBqL}0wHNxuQKjPVT^`^o7h3#wo_w*YM?>^{+UW2D_6O2
zU?&5%p!Y{|lm(Jy$$aJkpYaqYdimoel^86h!JP{O%!wLok2Fk=E$&w>ZA-nbs^44t
zA9|HEyjhTO`PD0nL&8R|V+)G-E%To2&MjNtdz5bFP?@E#c2u(;n~wcjiB|`}Lc0s4
ztM1rFd%`?~eT%@l4p+e8^L{L#q#J)3Z-g^;5oRb;m`@PErohNC8==!!K-R^k#9uKR
z<K9@<yQH8j&oP&f*jU8EeWd)PVlJh=v6y*Xfx;wdVr@B5h$c#xQ$|~hC4dnuo2KK)
z2b6mDb+hy~Yxs%v47>OO0867c3|F8nLPIN(kR2=s>t$l5-Gr;Fve`q7Sd|_GH_(lM
zK%_R>sQJA{w^A3+e1~n0k8N{JHLtrk%`PiGc71Jn_vRO;`Tg0c587NCD#>L@T)Fg~
zuer|8sq*{-N2U!&gs-zTRH~m%X{6tkHgi7AMjJyd;2S8p_J~C4whu{Y_WJE*nj%YC
zUib3cKX72i>mPar`Ifj{Om#t<&_8fs&d#RrwLQKEEp9Z<9xqo{Ng848AG*$+Q=-<-
z(0;TnWjnuW<1|~J3d%mNprL4##iW^HB(4L+NvVI7F<z+=t$0D>XsiExsS4@3xHKi`
zxMak}8)t{1h(Xxf3lhg`?W6P9qFX~saEi4WVQB<C+Cfg>98|vT@th77?POX;MONWk
z%_u_%4AA4W@542{6$J%GWT{CQ5!k^o(c-Om0T%#Bi>s_{fPA<`xVPkD-s!`i`S|l>
zZKD;5p$>P28Q44XF(+y4Jr5_4V5C9Gv!SoujT6=%f|o{*%IQuk>Ozbc0781L?+FJE
zaRn1gW9qJkvp$x6Ac;rotMnwGPjlRtz30HL5$-re{*)ZJI&^`t1}rB0`wQwzogX}|
zCK$32s)Z$Up;FUcLSL|*)~YQy&r7nfGR6b84Hn;R1~F^XKRY<2r_SyE0|!>&b6AJ%
z!G&Ll5kW{Zg*O{%*62{-KVb25Vo6uCxu%KuSo>YNVYo^T9+6wNMP&vm^-k}bn8{50
zE102hUYSAT{5=O&81|9;cav?rGKO_e9nBtlGwoiuBhKaQ#*-wa?k$ZB^M(##<2;(C
zFWTrn&9aUFuOPeyF)i^V(rIGUzAN$q?~F$tih;W4z??IE!qq>)*&9Z@Qe6^bFw?Iz
z+kDq1L8(zgdpurKwrz~I8yBbhQmC8irn@bVJd?Njw3#yw=X<8KH1?{58nZzJO`NAD
z$Ip7&9VAT>%7kxcrHC&_-*!J%XY6{L#nQf1_gg>?UHQy8utT<K>XilYs#8Xer}{v%
zuFb*uIoW7O@m5Xkvqp`JQ0dO~!mRIzTVt<>$$Wi<%hzj?8}tb%W&a*{=*^^unMKCF
z*TLiqM@fX#)jWk{qejmoe;M6xHG#j%%rOmHgiL+TW0%L%32cgz-fYwkzqJm0bhib{
zKK&rhcAwMkzdB8SGdP^e6n=Miq#L;Ik7d#J%IDXP{wJg68M_|?kABNOd2`po-gD#f
zhCrmK=Z_p%VD*Rbp5Nbp7@nQvqJF-kA~@KT24Lp3bLHMa@&NlQZTUD2CeI{Prh!s<
z-xp1PInkkStnheemDEOcoa#vk00|A0F+ySB{O5NGd0>K!q`{mZ#d+$g73}VN4(y)Z
z$}U;Jb8G}T*bNAGY7-r*i~IMpFvSR2A%2bIL3GA{zehcX($a@P5UF}<%eF|Ni6E)1
z^utzd==ucTg$7j@LJHnj#hXta8wu=xP7%8WFPG!AGQUjIC4Do0xJE?C6eQ@>*EJ|F
zlAlle3<qQAIo<h|wKlS|C{n1Cp5s2Dvnfc#fIuo<_B)V)DI*NK`xDdlIG>;f(+1{A
z@tDMtEV0S}_jSLpBalKRmMQ@4t-l;wvn;W{B}+HMea5zkNUpR06Rx=-RMi-ZUN+U)
zHg~&*G<v#^gk=Rh)s=jwjLX7Ti@=NMMH2f?=Y*w;NFlA79PAf^(25@Z+N#fzr7w)Z
zOGOnoe$)xRL(M}@;hXK-2qcJ}^YmtPlo;qDLCKz{L`Y1HQ&>J;A0czhLnHU^e|0F&
z;@F3&grL!S>bRgmm8Hf+V(FW|CE-tZZKuXVTgZbT;<I7wUPBYk!4f=I!nr7LSptf#
zD5;DoDH)B?l?+R??sy*Jk}l9l8mXyIjjNfBXDOnwGd*WGdvK>W@NkXzZcs_{-0I4T
zimoh%oM3=lrcdE`NU{Kn(2>zOjZthrc4#J4B(+G%5?6UFR2q#b7NX^03t~S-qu?=+
zXXuxwWRgovl<$6g&=`cf5h`^TFI0ten~>wp!)CvFLDksDeF!>1FL6trIx@jlMOgpA
zjykrMuF_numZx$ArW2Kjkh3`HA%`7N{SvMv(%vOP-V>}71Gbh4c8Mhdo>n3Za+FJb
zuNsRS!$HOc1Z0q+sZ9`_9v1oCyzJ1Bm_Q$Em3%2l(4$&wvo~lAR&ocYp)yb_Gc~BA
z6+%ej02A}T_4SzWuR^IRq&wdM&M~H~@4olF1(suDS8!m@p-vngBfxT>e<7z+pNOj<
zCqAge%VzC&ixeP}HJmFTN1&0I6gn^L3fGr7W?6Ze+$#e`ueoBJxNP(*#`V9yAUgfX
zxzMW@G#!Wi@+&D&$0kewkJ%B<#xU^`fUo5}HN+RLj)4(NGa^Gp6e~Re#F{J<#{jZx
z$ue?jfh4uAlZ#^b@aP(C3yM*sIlRh_=(0PW>VL@Vm>P;o&=FTJ4=}Pz*`G_XKME)b
z6IlSzUH7Ywu>>x{X>4c2*5rmSfY%cPPxIyQs|La=@TIhZaM6LJ<S`K})`BCt6Bjb%
zD??8(i>1+JHwTfpce=!YJ)vdx97>HR8=ASzeYuzw&gSeT?sg?Qc7sI#Z!Y<-+-c0!
zD|~QSoF(-)L!qU&pfaUt(f|-VGM`q2?KQMiG~3!J)|yIS*hs4ARrli%v=Z};;!?R1
zE3}u^W;PbhLCB#Y=Fl)&6*?CZ<PLS|l2(cJkkWyFtcYSiDdthI&S6(yslQEF?ENEl
zEtB2?rC*ndiaxJMMI8pR%#zBosR%`_uT4B`wL7swqian<3qV5#Xp^h5_1q$R>T$lq
z5M{PVyxt+!D;pt;*{4&ubUbru?S)6Zp?FmT((YA4t#)0M%AM`$>c3wKGCju$A0WHa
zckYx6cx}g!07dpy1q_7--GbV_mXFm}jguKc@k(#6<;_E}yjxFM$}~nX&&2S~)ccQV
z`3@Zyj<Wa5r9BT>nVyF_A8O~=zQ(ICz&MGYDog0Ly*EFSDvr1%*yC<7f1f`29o<LX
z+ea!Bg!-aXq-{^tXt=VW7YUtlr=E$qK?a9bHlbIR6(AneR7szrg}Lv{_gCsD)v(FV
zMb3pHpw6mfDEZ7A5Z&F0gSqxV;~ZyDrL^lqNB^4sG0cJOC9QQiNGtK6*~2D*zRcDn
zxA-G8?G&lTUNNS=LzA-eex=b{`6;EEj2rpPrc>wS<MRHYiLG9O`ik-u^(mHz(IN9+
ze{<zeq79NJN*7J)A+YI47B#Y+aTa=qeBR+H^oN-x2v9mtRoJ=5kG7RKT-~t-Y;Za1
z9rm$Q^>8^3NO6&=I`%$0<=q~T=mb&s0)zIISXyxjuH|t>xCRlxuE-iPw*)EDnk}8j
zwPe+aq{p28c3&|nD>tHdhm>~Pi6usf9aTX3bC?8oZ{0|0GE3NrMr#fWI33qwj`lCO
z0T9Opl<RdyWZ4xGH;b6U3XO1;vwNwJdch9IGxEHiSt{*Vto3bT`s_tcjSjSWi5%;z
z{b#ga`VtCgN%Yk#)CnuKyp95Ekf>UrdnRndC|(<qSPfzb`GS?{=!otBZHnC~;aSl6
zd}-$7lUH+~_HzGL{$zXkWXSnYuI_b~yf9dq#StMCt&9uPLXpYtB_^`xCvv2p(<zS=
zeU#Y@cfp5aa}<5%?8L;Gwz?Ziy1loqj7XEFWUqN@oU9Odn{Xx{o?<dtN6ETJflrBo
zpI$f0WI>&9V3*w3{JfcJx2a<grx^)0{vJJ$ko6g9TX}kgD~<vJcW^+0BnUSzQF;O;
zuQ!VM(1p74ck0y=AK}s$w4h<42l<Z4pP$6ULgNTzazFDed0hK$a-LlFS<n#b5fPZH
zb3}cC6uJ^6U$|1Zf9<Pd7ziaIu9GJJlA=%#<*y^w=R1=dW%1&}c<U)GP=`A_FR_?p
z;B%p1jQd@n(wXT#-pI~-M5gTsl=#%tjvmVi{LSfVK-uWA;!5ZgQRSX@s;e!lOBIFl
zAuih!GAFHXkQW<b2KF3ujr6ZP9S7a<C+Z)vK9`M~;=r2X9sb}+(BNrijBo3K<JutX
zFs2r#tmotbA;Nm}a<RjmRCEO>kh!gKl9;R&kuu18o<@5Km&L#4Plgk_T=(BCpk7#d
z(dj=qb0z<_2TRwv9JlQtaN_!A^NFZ*WT+vOR!T)6*<gxK@Rid7$gxz&`JMwCFuj`^
z(qlMu#%j6ez-GREcg*8)W4-6VTEcw}+=X8HztWyNExZh|o`VT{yu9bYTBtPai&tdT
za|m)4;hJA}LpC%~Xu@9a?m4g@!aq*QROFBB<ulI?{Duzv6Px@#-*aGIjXa(bkg&}5
z`O;APNj7KSpDl=c4r~BhULQoNwa7ApH&4J#!|IKEdC!4eyYVy%jkMq`^pe&+x^8zL
zXcP=9z30HLpB6GX9STGZ|F`A9R@;Tc(O5UpgiJbG!eEj!@{X=@<my3fnLlZ&<Q#*4
zwzQ!9?r4yd>aq{2(1cq1NX+|a^!hpU<fzm9=&$9OJ^M)3fZVMeeQ|UW$v;V2fkK0R
zbQcKe5&4#%NZutsdIe;ESl=L>#ISTOL)K4@wLX$7pyL&gOkI{-LT+%iqd8Zc)l*`E
z@YC><AW8+$q#sf`{I2au5Zg6K$TNt-8`)p!Kk=aJWERop(a(6%DZO+zH80`FCHV-9
zX!{}IeBY(nMLL>yeYkHh!Uv>!LnWx?1=c_xJg`K~yH-3TeTyWelOvV~1{~A6R+8kG
zJe1dd4t)F+;B@-S(O>dI5>g_0bor<J7FAdFxO~q%g33II7jQS9DLzFvK*EM#ok4ZB
z?kKexcWpfW?R?coA|WNB7u0r%XuE%H5AWusfBP)`9D0Pkm(=N)_It_;c;bNdP`$4Q
z`TJ}h^Yb+3;paP=yn)0kWZS0!$t<budvc5fO(-~svR8>m;mw2a4&i7C?z;}>`}#<l
ztYekjkIPWDE7=ytE-LB)$*Ulk>oA8zKV#M%O{?@&%Wsm-?!>|0j%iY45_0t5I}(6`
zR3HfZo&%eqt6>kh`<8Brw<Qxsgew+(siKv_ZgZ`8b)8_|!>)V2cfts^Qu~)Vu&==_
zW5(pdS9i0x{80Pcpv_uve=`osSk0ZW58spDda>6$>)ESsUU8{)FS2SW3NZ*X6^-s}
zXBkAAPh}eImlF#~xwrMreCKN>BU6d1{m>ztO4p0zT$+90eewMW;)e)jP9HS?w^hqQ
zozTk+hNiqD5nn;M#%ROK<$lLseFN`R^*#jOXYW!UY9zBpc7;98vTPAb-3casL_6|X
zh}%8-izaKhMlzc#<LB9?jySS+g;`R<rtgo)g^m=LTmF;-%PHyBjMy*1ZAe5M6L>3S
z$`OT>v<?u*cSDPt6Y#juE7&pROZ%U)Y!~(WDIE{f;pDgT444z)P4oxx1lyB(=TNfa
zflPxrhET{`WJO}odD%rmLo$*>2%=2MHHh<sUq$eP|0<+{R-d|DF(wa9oj#Q1>##r>
zIl~kzEdH`Ik=-{7q6E6sF6@6{@8_mc7tJ&}z<!(mvWPCAuoRauVj*t&PdKo{9vnrt
zvc90r{9>pk&Q~iOP1^E{*slZ#>qwrvtt*1Sg7gAhNA(j#E-9&x1A}+J9(tC@&p)_c
zx-@oAy*tZyA0yFqAs<^Fk_Klz_MmQFVt2oKg(KXVZ_VW1+g3>Eqkc)UB7PoGLa3|2
zyr`#h^TkHRaYBTziM^I>H&&uD{^g4OyKl;iEw<V(NPS4s(fT<eR+U9j2EC#WYB@QL
zob#TNU11r%_yw`X5nNau$)(}nyD$y>>K{xE`J9k4rMBh9rcAJSq0}cyXqx_y99SDO
z3${Q4y^pI;QJnbwR2_rwS}$5Al`@VXgOAeJea=bPv%(r%ea~|>-4a`^52b}Uh^+Fb
zw<%`lm||XwJc}1$jw+1bU#5tx*-&mt{15i-JRHjY?;rmx7|dYCzMHXc$(Af(24$^m
zMUf?BN!Ez6%-HumYs#K25k*MGk|k=0ETzU0LS0%fY4JOU>e6yupX<JV_kH}n$M5+5
zb^d!E=Xt)5^S!)Y&j)65;o6tB{GvDwmx+bxm_|`u%x;<@)?H!ON=){LF23*bxXL#b
zI6GAx<f2yV5(|}<Vftb^ZTvu~rLorSjhH|UO}|2R%FwH5Yh_JDjzs7g*3Z`GUEBD+
zabSPK2I*sODBs^b*xrgXNZj+Nc!Q5muup(djUoK3=V9UUrK<bu#%GtRZhu*3?YtO<
zepb2q#r@3?%(wrl_#53?t`?+Y3Bg6>&&5Uiw@-K?O~P+@!Q`PTy+l@Bb*GSb&`X*|
zBhmx!dTm*VcfORvFyZ!0_6V~~%@N&O^}DX14Z`_9mEqw52|8%OPvgt`hEWe>9d&z&
z7hZ%|Xn*6t4l%dVqpAWtE0JOW-Y|*8h(MGIufZqpgvcQg?#2!X4d(c+>fqkk!muJ%
zx@$~<%02sLI!UasYdc#&_jta@7Hg7v@3^$S;<tTna-qhj<VwmPM}`72BCaha@8AwM
zhZNd^>J%eKIlDsL%?mb~X~RS>$LjlZO-JvW8|tz%e;sxQcaQ3FLD{Yw-nJ^8VK-iv
z<ggq7^L*lr&Ary3r4qS<MbsS?So7B9evQof%7Lw~)oKmV?n6fEN$w>dXY)4@)S8*&
z8BQ!=V)WM5yaR-1SbCrHk(_cZ(cizXIX2c_*mT!aM5MumyH=v|Vyd0v)t9pi1uir1
zU43s~Boi}Zy88HpV%}(S&|C%lGsZD3MW-?_$x&eLE$lOA32&4RX*a99c6J%*ywQ6a
zxcwT+Z6xrXM8HXNl$u2n`Ud(L`h_VxEKX{{{I-^SiJyOS=}y<9n;e)jTeoDuq}hQK
zZT`7huCjy;qNoX}=<?myw2`&#jf8A?E{*Bpc~<|uDj%Sgms6K^a|H-S*u4y<zg6bb
zTwrdNa;Sp(L!4NK0#=h<ODGb}`G^!jy|)BawYD5iu>6x%+RLQ?u0X3vZbpVljPPVD
zhzYS3(aKEC2D$}2-FxY>%<dR1G*m^ZA|nodO`}7lDj-$xf-lp$#Il5RqM39zq`*LV
zE?DLKi%kyf{XIlj0kzDYp?WQIL2j~TWY{VVCiih?g#zy7L4-@ne8}9*I71IyyWZ4u
zM&V}Zi5|b4KIRZ}3(<*F^jeEx!EotDkyi3~3*$hmKQ}qBox#dCWe&DODlV)U2o%|i
zZAiy>w1GqPpN-(#2k1G86b_7IpzpYrKCAAho#7HeNbAQKgqwJTpXB3B4ov0rYIqAW
zAuXv3fjRt@1Is=*UT|2^)q3_K*J9Tp<j#b^uN;_1ta!!)A&kHl2PTDJVpQPj|0fQN
zCFH^pF+Ol?F2gmZwzCm~PMMn=Sat=oqz8#%|Gx80F&PI;6I4!dp4|(8gj76FuDvOu
zaA1wP=RFD{#hdYw2Cr|X3xH4Kl=tfFHV3z!RXL5TtS!~OMB%{v49#zfV59byA8HEs
zOB#xn*|VXAUR;E-3x6C@Yr+`0sYY=<yv`Z0M-YL8zr`wx(2Kp%;{Vv5RX#vwV9M8F
zNLF-K9H?D(=sNolTKHDo;+O}(fel>Yj~PB|POFtS?QXCf-XU3+Ec^J4lq({f>*ZKq
zNJ1L>A?3qtislka?DrYMCmLdFrwcb!srZUbJLN8LMj7;WPW`F&$e*8BI9|jvhXK+&
zNBJ<;yHB#IO*&YRh{<$Ok=8}%tYZa!2_|e>4fboh4Q|x05ays9k;eDr*pm#Hh^Ogm
zS9L4$EIXW=G0)8K(bw2c%%$4$Eg!M<?#s`<dcsMU^|i4j_bqT%$;aY_xnZNh{lc`h
zZyb(o#Jvp^nIWZ`1Rj4t@4Cjy+rn3>Fcph8nRKcbN|rq&sHQNwKEw5N?NKGOZN?pl
z*@zvDM>lbh)|9rU&W^@fnM(FpuTpN(GzO>BIpfv^*&#mX`(V*uH)GmQQMU2VQ8O1+
zOOh`cX8PgogGAfb#jqJZ+n`wi&8&dKV|=H>6VI5=*<7}d+r1Qb!J!~F#H}dO=W(s7
zk8(ta#zM5%y?0{~74aeGp89d<G+tF(<*&N`r-K1C%6aaoz{ZFBPUTn6*@cZ?I*sVq
zV1%@SR#nQS1ly|w5XKwaB(MMyB4i8^OMys{AUkC>--4mLQ=n?b(LrF;yd9sTmH;=7
zXM+|XeTc1@)9kB6s4bGlA;q|BnmrE7?N}rbRLDnL#A$5LPZP!}I1O`3p^YceJ}Tx1
zWTGIFz$$^>!wbDy2s5##x^7R`O%zx!<ZPQ}*RbbvNum3U6VM<sR!+mhSJ{mVIo|?^
zl0AEaJ$vmc?LrD8&whbb9Mro=V3pV!1rgvRGAa@1GYjc1$<hm9kQMD54Fo2@0$H)+
zTP<YhMKiOS@YoROEA7!9U_@>^BeIZBk3bIyU+q|)$pVIQJfa=MW{u2RDr9spVRt?O
zRQJMq$y5NYvw}y)&an5A*(VF>f(ns^wVdsC?34Cz4||q1EO(ndd?U!7KNrsgfH{>I
z>bwGuZUU;;jvWA>bY8J_;ZPN5W`GG>L$gHHigjT)CbR`6$?WC;OO5ArMhUzz5m~qA
z^RGou;<&9-)q{vs-ZP9Jjm5daD05>}yf<2&z_ibc>xCWP=RyWOdp>R-e#Ke=npE@&
zFlrx3Ko2AM8I15C&;v}E4VX=GSWF2Zx_rcEyx9+j@x4Qd`KD2*FJmG)6T_n8gNDn)
z&&V;)8FM2G8RUt4p3`hAc&17WgFcS`-84JIMEJ5PKTd~-yO2R}n#V(snc}4pVDm$C
zg(-;J_UvI~cC-(mIB_iyk=h+Xu;U!hR#`S8NCNm*bUYY_V?H981g2gP>eDpKOA}tf
zLIK(bvY+kw)(RLJaEw{@j1Vx~;u=FH0WnuAIuEF8Xj(T@UVb@__(Iv;L;+4YVLFK7
zBQ&ysNFQ9tpn((fd;|Vi$UljZ5vrrRZA_hK%-e?HXZK~9#PM2t@ryrb1qig12W-nY
z-btM3sW7zfD~=v!Km>xXflygQj$AzV2Qs@mN^$|q4UkqVWSWn}Js&{o!C(ZyEzOhp
zPlhS<;hDn7Y%h)3H0}9I2#B{2U>?(~Vs#8@^)j#`AtIU0+KX?}j&TLc^ZqsLvne--
zg-vN%6sINNMP>mwvy&w1jaw`NSaY4v_L_ls`WpoT4Fs4mhWR2^z|jsK&<-naS3222
zmzqj{!k#~_0A-A!1$3F?8PtG4=YgRssMU2Q(A(HkRIeCTdcPup$_LulGY(#3-F=%i
z>mfn-LjkJSm(Li0gRb$-PqVGznT)5oTA5KM82%s}UuepH6d3i<mrnzr*QO1;XH@Hv
zsB)0t3k4(+ERe>$=b1PE#c7^lMJ#~40q7iep}NQ}30w+OCJX9iy6E^SLl#b$XvY24
zp8v7zo?x5+d6fYtjAqc{W*=%TnP&IE@V6lkLs<p7?D<b$7fB=Q9+RUpF60leql)xn
zw?>H$N-=N5ky$iwH1mZt0OqA(&mvD$4Wxi~3^vp3j_9M|Al^U_BCb$nd6=VV)T&gG
zb{;H%ucNz;L%Txug`=7GKm-=gqaP9({YNz3+Or3l9wveiST-Y;_h$~I(zoO3hw)4r
zMBHwImMxLTsh)ccP4_-cYt~*}x0X*a)1hjb<ut40@~A4DSzry%W-`s5Ic@uycz~EL
zK4rG+`n1^&HZ!_+Cs1HE$dKs=kbQ8`9u$iC6;wb2L;GY@;6x#<Jca=)?3(o+mN(Q2
z=!%&nOK+?|FP2*aXXQ!(m=ImE1|~#U13UatA<EJm`i_X~x#2#|ZoQzyF#n2YV;;-m
z2~m8rOYpV7XR$2P3#fq7v@8RJf*IQ2?0L@EqrmP8V76v6D`$V{!74svA<74dI<U$P
z0Xy!>^7SMz-2m;kQV_!$?^wXwjM?)c!6;>4PS|;83kByxX~<I#{qLqTv5xUaYw-rz
zvwKYQG`&?X@ns4m^M|9UV^D#waDjR32%uppr-AS2JMEVDCp$Am-Msh(aWqd-V70O`
zp`!wm1egcXqmXot*yz!{>hTVz;fZ0MND(<%Pj_jUF%8AG(y*%=j6$%$m+g0&7>7FJ
zLJs=yl{{c{JM8@k&v_fe5@*k-WbXx#R44pcG7Cci^^U91w7YiC29YegjNA9;4gNK}
zH(yqyUk~>KFS-iye)t)MWnbE{La`m!eLqk8;*_Efz4q;E=K$D8J2}4!5KNw^g0goN
zQ`i$|r{ziH5X5jyJy5!iVV3mcN?Buh3-+;4h>tI%3&0~*>|8=;!d__e<`&R~*}<*l
zSkkaiicW8-pNFPR85KYhU;zbm^F-K8ofg<%bRI+JXvgMRD4;}ug%!}16mo|ZB=&)H
zmQb)stUgm9Tl5)^M|SKbg>-IcI?FnKK|;d$*XQy;q7vq5+OkM3e}#B^7~Qz18JFmg
zLWb^yrHQ>aOp7PC03~k^Z#SbENJSjB6kWwIr{NJBX$1`JcKp3)q&ye_k!Nm4v*@7&
zv}6@wmXTJR7d#gtuPZSiO^)As$kB^tVMoOWn~JE9nFJ2!qo%ox?HK`evRzKRd6#g)
zn8;}s8)qWdnb=D(ErA=LoNn2~g+eBHv)Fo}w#jHKy4mK|h`<c^&@6@)avpsEMQ@mc
zD0zToLkWZ&<|#54uqkA4tE25m$qddZ3H9Igh-_e+<!#pNK8s=ICUT@<c~0l1*lXoH
z0<q;5aK_nj<)STiS@5o)qEXX40U)3KV*;kig`HegRwwv8><`Bm!q|2rO$aug_RQcz
zaTagb_8D`pv@-%HD)-iz$1wa_>E&t}#v5*RbmavGC;J(50YJ9NDT5smhi4M(D2C0H
z!n6`*3%w*75M4MsIWFM-=+X*IS<cn*oGUwdRwPeWvFfaPusu9Ok;U8>c$_TEW>g>2
z>AO~0BARGl$}%Hy+}I3OrRi(8RjST>^mn`_0BRADo^%RfYx2|QSy^{_&*lWz;$5-h
ze}}2FFhe;{r(K_}6S5L`_z+dqj4!nc*f|lNZ-v0r*MGK;pYrzJo7b>kEk}XCY78I+
zSe`VrjD#t77@h{;7P|odbK2t8hsr>!b{OyFG<H}Ro~h^@KZHn~3qsu>vtrJ%PulSf
z7o=8@xhhqekJ=$QT8RRW>o=HMYlTLr`~CUX+Nlcy_(#t1o92lcTQLa9)0tXY_Mv6+
z0^xcl0&!=t`4)-`?J;!Lz0s{%#)oXx6?;*~Zzk>$EN>JekLrB{!=Z1vbbwJuv<UUG
zt$WNiMv#x?9q6<k=(#X(_wm4e-ogJ>4r~fM3WJPVObHxTAGMkqwa*`QQXf4w#b+M;
z@KpXo&)_i%_C*-;J2rMMcsx@5p)23mkz3;%4xh)u)gNXZn@FA-_syRyzBOrfYa;#D
z!_v<aH>W0Tryezap7d0IR5&$p`}5;&00sLzdHwUlsp+vi;?%kP@y^dvoxx843yhHe
z<i)M06TwqM#~!^2ez-q)P6ss20cc;KX^Qq`kK*3czJxcmFJVCY!p%^$FYFAUeF@u4
zbMa3LXw2|joY~Pf!xA#h!~aYq<QdPG8HKj#-EFfJ|Eq1<kbfRyGjGK|y|Zn>_RAc>
z=2@f-m7C41O53zL{~V9aoc@zVKK|#Zkojnv#o#ZCX8g<NFFyBt@*Ks#bmrpH{wGVf
zLS~3<&(!%}0N7W+mt_%+`Hk+2&rb1A1KO95#u7^7WyQspS1&F<&{+JV?fHi%EAjj<
zmP1~;w!Nt0fB7ur1=RM1_mfwzY^dJyzvB7wNBqUtDo@Ew-?cB$JBs!NerEz`Uxn|S
z$rSDDIG}xD-WzVfk3Z$Iy#3B_<E>ffJBN*TR@=2N3_Jm}UJqzr;Pt{#R-@bNsZUXr
zo7z{??GMlJAM*+8RkuG}(p<lM>EqQ)A5(2V<UIXQWxIa&>3W^O`t?g6ZwY)F#eJ%}
z^a<P%gB3~|apKC}J5^5Dx39uMT=!TKFBOBJc`pg0<Cnxa?{lZNfH&$MJEL@fvE7DN
zI%F4Pf-*`(I{|vEvP5Ea_D&Ks{~3LS#~k(o8&}N*OS#h2^IQULbBn0Cz5?MRqPJW|
z%TU=Wj*Q2Yg{npU>^r$lE?2A|j@%mwF=^DjqHx6R&+?B&?5B=hbGl!~hUvIOCQ`ON
z0dj1nJAp?n1flW^2evL}=T~Bwr;(_7eQC7XswIR$?Z(Pa99WPNnbZ}}qnWhl=Idtz
zd1|2^tvS`??Ht%fjfe6!4y>m%Jd{aO!@6D2@`9Z1quzu9fbCKe>#!<)ffIoHkS|*?
zsqEQkxD>>wL2G|%rcT#BlHDf8K8o98@xBWxg!Z@x)x|npCc%VVdB~4_Lr+7&xpxF(
z^<up4c+mSe>cyzOTqARw^rCf4(PGqhOvRn;1vs$WeReWSy;`&BdbP5hmLl?U;R;E#
zL@lP<<;8-bU%Gd7^3Q|B(XP@Vt_K*!$hu`YOP^-C;YL9fNf?#Z)xAnfUMyo=3es!c
z%z^W@J#ZBx*doHvk=T`%cHn4UYNkz`Ygw*`Dpy)Y2t9`2vx14BrREwsWVv(!6Na=^
z?$lzBYULD-zxPQ{i@n+{Of*4|{2`LIk6gJN%Y431i*a6A5W;K|V<%p3OVwg`W$@kx
zcSXZUSpTWUQZ6FZ<(VWykDK$A3l)t^KDuZ-=^%o@?%W_^2VK<{gQN0Mvfv%rQtx|a
z%E9lCPUe<Se>7~T3L%_K>RWT|%3B)f9b}fi5U6#1BjiIEa!LACnMz-c;p;S(i}61F
zl2->_JDe;z;xjOc5{HK^Wow5MN}t>vyuiiN5mxw6m1Tv)`NA|U(QT$GDR!PUxIxHx
ze(mngd9PT3+Y?5CZ+f*2=e)a|lcaqoP!}Kj0DHNEO3^P{8O}UDasRVbdYOt)N4`Rg
z9b=VxvS0^49#ASo1$$H3ukK_wn&tnr&rx~iP;PO#sLFudfrO|FWVw3CNompXH^CdJ
zk+ksPMAZP7#=*18HMb8~E5wtqwl8j6I)C=%bySSAtMdh~Fx2h!VBd;3o9av1^BIgg
zb{o8bjl-Saw(hYr{B+EXvF7ooZn`U?#Rrs1nVRih--x@%z#=9sr_I!S`_j}>?frwH
zpWpM`h<PDc-W}S!y0MdI;fg4al3Ak4*?oD?i!_8%lLA-Hac=FPX(1f6fI4&*vFEX8
zIPVJjQ7-Nh7a7AoD_%%<P?>S#m{%ldAo5QgFGzH)SJVwc+WS2*oxDr3W}ldeNWGX2
zbf$5nqO{=DwP|{bwZ0gmp#3jG8al-dyyIAx3PmDfx>@7M`e~|WN@=MH3bEb^jsOS7
zbwB2gV&xF8En=4YDZqhM)+PD?9N4U0kJ^%VvJ;h%z*Co8%_O;G=aE!}Nhi8?S>TM!
zy+lYLhc{#p6mtYIgS?a4yVEFI_Y2DAiTuqzK0njc0;6GZO|AlC?$?;N`q82Z1^tKU
zld10ymq;9;<Fx27)xX>-EdQQeMvvY%yQ|uWNh)?g2U2E$F}RE9Cm>|d&~%K>Q1k`5
z{jR3IIS&(%O2sPsonBteL#~%8^~gmybqwU$_le4P^%)^^d~+AgFDK2rcG$*&;<{HZ
zYi>wzBIEFBy<IbE4{{Ji-LKW7tVD4=-p2M4Z*dG$Pql?|jjdG6i_`!>XyhmbZS
z%+FWuTlY&0vxJxzzn)&yGh9kYH&rafB~aVtf=L&aMp7GEj^p5Q2xg6wG}7;qq{-)d
zF>B^AIKCd^_{sd@T%ig>hT~?Jnn^G8&Q~63UHVecpMPb&wi4Gs#eYFE>{#1E`E#<Q
zS>*a?wVQ6W!IhFDLzRbDYe%nG8VNJ_(~q~GC9!?{SYdA%laLmNt$Fz2E;bc+us|}i
zZq(ad8hvuSYdHGaNS*YF(8?q2UP{Ur6WwvIkXjq3FE<qASD&#wX*nWecKtEol*q0Y
zTH=y_<JICRZKn8v@Ju0@tIbKF+>%=4`Sg-b5y?{(zK@+Q9=eHilJUO8vvFbZrDt<L
z+e^R1c=qR}jm_HG1Sujt?+ek!mWO^a0jYP7k@-hj-*8{?7~y#uwtl|x(~F&VAA_@B
zNoK*9x@0_)Bq0{Unbi={RSSkz9xAD(8i+<=_!OL%Zf8>myNs8YqLDr0L0?bT>z=2u
z19nR`O-)>k4<pPTPkE;(U%ic!^Go$M+gJ+dnd!F;QL*l`%oyRlCj08-qLu)sg=H@u
zb1n5)xMREck#?hbtJHHWPAH?m)<gdCnfldEXsbgvtb*h-h^<b~{6F-=_SI*r8=Q~{
zQR(A7Af_3Zu&@X2%3vR&;Br}FPf?s6Umpm;@oB&u8|p`jWG5D)UYP9NfOGHmcYRxo
z$v>!nHC^evl498*w^*qq*sVGh;ljp`u3c`qLl+PD`R(0ru5jtjNTkiqXqG@{_2si;
zY(@F5$BsQrI}xiCO_jhQOXtp-cKSw_$5`Eil?A6im^!XV+@QUfzrtd0ZoIxu=|=r2
zt?n5QC0hTt${~46r_AzpJ=v$!WGMcU1$OuGBLB{$jsE4JWghjmkVd3_f8^-^!bmxR
z*)C+!^Ar<?4BcHv47U8k5o%4Q(j4qWU0h{8&^ldvGoXu*h!{DG;X60})=l#4y$H|N
znX*>_cTiG3X?fPW#5Z=O{Bi4#3(JpHz#%u0+AbWqS4+7R^lskYPy05V>DI=g(w~9D
zkuvZip3jR%AKQ}5(lg5yfLh~+$Ey#St<Y_ZKfl|m>UK@$U6~kf{ZhusaTc}ryYG4~
zoW82&eD<DSmkf`uyXgLwpzJeMFQ@K8i|&g+nU+q!K6XA-bI;7Xnt+avQ>)1qYx1M7
ztc!-kUg{<<&gAHP=s#&ao_+gK>)!T2&HGa?t37Wyt|qOWNt2bf9oIHuVmx)}uFV~t
z>*`PLNS-ym-}YxCEM)ba#-~XR&8{A%n<D+VkLtZ0!*2IKzAV1|>G3i@)BWTxZyAmS
z>s)>EZf>XMaXZ@&F2f7s0kom(d_ga~8#dOAA~iowZ3MjIvHG%h|MqdFE5X*6LtpLQ
z2z~2(Xk)?S52cX#9{hZCNYNQ%aCWG$2%%1wKoela5koklW6F1(5Y`hUQ0~Q_?FApl
zi}jvm5)YH=4coC8wv#qo&Qf1ACTv%^ucUamN;wezMB%_@_l7HpN3=$TYq~_}#zg3s
zM<jDZXfH+t9F8y)k2KSZJmeBdJsNSaJn}PJq{U*SEp3!NXZVq(NGEa2W8zV+<xwYl
zqquaVPS8fHL`I#`i}rJgKI3BP$r*jl(#SU^I+QksP#$%*H#%}nFGM^hwmc?2AR@vg
zCRu!MOm9rOUhH}Cuq4{poEYsim)QKp*h_l;x#DqOx?&3e4lE|lhl8`YH?G5cBd&tN
zfyG-!#9ncUzw#!o9^k+N;;sk8-!50WxygYgEXKFTBuEM+boV9<x<vP6Ck$E2++9o<
zbxE|NO&l&y%+mr~u*9e35fe>`vn~=-v`Ko|FlIE^9ltlLAn7PthYJm6t7Q<605jvk
z3u_5gdP$#~l;+EmHOr|1@=F)L*BuR9p<0T7`vnU0(#j&GK#?h@#go3or1C&g*!seu
zM^a!DDR3?w20G9O7cF6I3Tt2L$$(U@=V|QMQl)aj`CU`Ax@a(cDH0P1kp>3giZpqN
zs2v~Dv}0uiK^bm(>FA0SmFFod%8Yn&x-M77C%ueA6%uk18|P)RGn8V}g`TH?&|r}W
zFxB&vBe99*uIF7{g)Ln(rJBy;PNy3_KQHkCK8Q_on#i;e&v5I@x=YLqyh-qk)$*1|
z6W2+j3#8hu50aqEKHQWQOqX-#RaT;YXjq_DL{2&<DFu!OgHk{Ud{%};WHMJy=?AWK
ziQFRR9MOmz8#)LZIfdZ^wBSQ}MNUMCYwpbou5#DBn8sX@k=!Uc5IO~>Apvig$eWJI
zZ0@_TK+Nmw^SiCWNDS0spo6IEr!dJf_R{4iHeDE`yGVL<Vd}Z>uztR%WBx1%0!4#X
zd-La>hc|Iud^5p0OLvKGA(agT{dn`z0j@0O_Di2tHW;7ZWS~B(^+(_(HStSt`wAAE
zGw3G6`Smj$UDLc(3aPj<pT}y^(ih4%6)?~jh1*}^%XNpUfW+d8AjXAtu|;A>!LvZK
z6&8Yf3lcLZQe7*=&=(1vEmogQP^m0N^cQOwl(f>8;8ZVZA1yKDj@OMVAy<?bNtTu^
zmK^NAV4_-j#4YxaTj|Z%(xdcc@x7(Tj^^5OmpRkNI2e?rxR$vrmHCyIo$Sv#wO;0@
z8uL`*a$qy(X}8P4>yh4-mk;$_4lyV<r!6O_W`rLtk3X9i5Lcco$r;yQp3Z$KiM}F6
zvLd6hLM5O)YbiOWxuS3>EPttDj<&KWu2Mj+vb1>vpam<ho(-z%uN+>itaYo35v!`t
zO}Kux>ekuQH!G{!d#l<Es=v@w6VJwX9<9Dh@7@zveWkp5K=Mk;eD!_RxFOXm6ZDRw
zZdY<+u1wO`jC5a_qK|#bU9+%mHfvB5HSW2%RHG8(yWCv%>9zMCZdYks%!tBQkM-}Y
zICFJF@@)BetB;eV5q_?q_}aHw2Wqgj$LQ@8Qfg5=Rhg5ui2j{0sXDH6r_0ZuWUDGh
zD?&eCt`mxPRhh3l-0#e3cui{A&ENkTBb@U~|1||EyZ$b{ohM7tRs_Yn^;(W*f_O9K
zN2MRa&#Iqnm=&=?NHsVbG;p42IQZz0NNIziVHxDm#_4zT*A>+8IK%5Fml$<gG_CFE
z>aaJQPTp{izu{VS<K*2Nr<QMc!W+G%8hs5L{Z2Oi#DSgVaSH&Q;Cpo4af$IHNqfDs
zDRH?e8GbWW>Sns(&GRR3X2svksk)hW_h$a`&F>sonj!S0SAF!y@|R@#xVu!}Ij~wd
zCxXy&v#KS|yyez%%WcD!#;TUi_?A|9YfpS@om6Yr-PSvKt@j_b04`Y9ax3ZNt*cVE
z9<;Os`rex2X?fDAGMU#RYAW#L(JitR)l7WL++7H%h2~@}t#wuNo0FXQI*%*%UNblM
z-jFNPnbTo~Z*YJ4cspc5Q0z`=tlFt-_Fn6`ytD(S_%7?cl_KWh)R=gA;MKPqhi-qA
z!hnKusf~C(RPnL}-L51M?@hOhSaXXF@Jb+vfeJ*q1TL8%BC7iK2@al%Z+Rh)xepn1
zVB9+y2AtUuPPl{)?dlHc$GnOI+y>H}2c@};5^nEX;e|wY)=cZaHf*=}#I5?cL$A8s
zJb~Brao6$IF1uFl13`D_F5EeR==OZf>3D(L&AJ;;?5<4hCfRq_r}msQ>N<t!)E&6v
z#M}D}(^G=$2{Aeqi|9$L=8SIb@UZS7Jm?m!>hZtOnOWVt*Sa_CQ_l{uzKia539WtX
z9Q{cN{ZZhJzLGtCXFl!74eHBC=&rTy7Y*unNVr3N=I-@R!Y!@5rUU&I(gWd`9^&Kv
zs-d3wx}NIPf!VtLwjkba#GviKojcb35BCgoAO;=`@ZJsL9;_b7PUvYs@C`rii@I?4
zR?xkr)Q<7$-j^2!D~vi<AM-vj;wA_2zyH*ay?gJu(fy%>I~zuWZ;9<Igmx;v`*eex
zF9rthPY<po@UJ6=7Oe*vc62=uC7o=&M>FUQKwtv<2l!46F(&r0@D0r*7#_XAk9aY(
z;7t<x%o`i;$tCyzed<AsH;FnC1KBGeImmy`eOPA4@Qy@&6+YpLDvVz61H&DhyZD6n
zym-Lc@nEiXgMZ)t2Pb787+o0+D;?p5Xqg<t7~jGi$RDvf_3+roQS9)j^Wei%FCKa_
zjCt=E^W8t@cWUfR;#lC7v2%lC!7s)_8O90!mjm1Ja%LyvteniO!hzXc9<#fXW>sot
z)$Yxzzx+R(0~`PUBL|ke3I_krV_&Mf<TX{5)YP@KHB=omMbmYd4EJKQb&;k9d$SDK
z^bAc7AJE@vntarBzp>d7o5RMZEOZquQ>%{(cOOL&thAi0533!^=&|MMvFFh`o@wjg
z=I&tK>%hO)F<0-zg}xJl-p+P-SId4^Q6skt&29?*?oI=zq)j|8{Wqkq|8eGPEY&V3
z?PfySg^6^>QyHd38F8x_hrP2bqOuw%vs_!V@#Q(mk8<4oa;+nCiRbgmUgg=xUufQ9
zz8+unC13K*DX4l<;2%=xTvwR+y7*Lh$*GKzwx=aQH_Gy+%R;uKFY;yle}nmY_OF?*
zg<AznxAN=T9xS#My>H9@J@(c0Ka72?KI~i>>-#X){(8LU<;30fiOzw^&WT4)UqAZ4
z*cbl)DD105;v4oQ{uTRjXI&(RgYMOnBUleBr*I%oC>KPq`!5!Ta6<H;%)*&^$Js>%
zy`ju%zhGZN6zofg`N&_`7c+o;0Y^e}jB2Fs*q6byFbkGcE5c$EK%_yL*|^T<bPwtY
zMVJ>opU-QGtveC5qk(QAKcKmc0cHGt0zxl`<w9r36_B(p1wSOFD9>aFCn|Ef3MFa?
zjtcEBrnx>FFR`4Vc)v6-O0rT*4>TQ*btphbV<%Ve5jyLjjq*XgH=yzRd$9$^33~Mf
z?GZRX+L*3tLBFst4!Th@U9n=Ncv0rd^dt8emDY!$)z^|Dl3D-4zK)MzM36#U@zPp8
zCuUY!4o}9KREs06QY8F1Ar;uQ$HP6>8V!8)<>EQ7B}rv<J<#XNF|NEX@>0V+PC0o5
zbw%@)d61!8*0`E+O^x|VKlbyNM}1emRKKC+30~1cwyn2W_lVs2VvvHFUY~_CsFB0(
zi<G%I(4t3sdF!$3(vRz~qt?tjIua|TNb*uUho8&eG@xK#)|=RuZ>&`P2rxr-d6N|@
z^+I-}Pl&Wf=V}i`A5$O!!C(qFzwFr%EKo8kXxG9YSu>OR1^c>|`sb4<1;&Coe^^YT
zW<Jd24fa+MC<1dAA<Re^ib{e!Swql~rN3B*g+2SS7#y!@`iLLRum%!r*4+5~WN|ly
zJMI1JKT=(r=V+;uIvBH*70=)rLCpi9a*JjR%tqC31Q>#$0ewPWs2IC;xAAyX&4`cG
zB~4|*S~}(L6oEeXlxfbkC_RNgU2|Kg3Va+!*MHXraRVkEEDgn$iSLWww>yP~dXc8W
zYN{^NzL9TDn}As1zvpj^xIKl(H$C9{Bk5VP^f&CwBHFVWirw+x(bbe_h@5qi*#P|b
z*^O)H0<qs<Uqi6|^PZ;(z8s(4dN*}}%TL{rv?h}llG)|%A`R2_)l@DdYbLtK9ik$^
z_KwMh?s>($q41FTV@iFP9u%3OP28h6UJfh53Y__5OJ>I)jV4|qvL5A+d;&VMU(_7y
z(k9aR(V&A@jcv3LP62P(3pn*$IBph!(NtPG;QUjV{k(d$#@O(q!(^`ICUAkOg~sDj
zCTgK7U9py?y`eD>>c|H?Jbhi#@FFt%&2?)<-<yUi4-fcX%`M&G`FwZYL{ixG^v;O}
zaDkPJvDR+Z5~Wig60Bb&<AdJ7a)kRj4jTa2m(FjnFJ|h7^l-cjs6VXB6g_cnw9}(7
zd2az3JEw!&31e=WqI;9l)i57QAFUv|C{#Q!OcOkxD%Hl9WXJI=mp5x#(c2M%orx*e
z6s=6Q=?1y`LoZL^K{pcCwZes@p74sCrHeaGdt})T%)De@4Sha)@a<czeX}NaoY%Dv
zj4G5wxQ{_X(aF@1{U-yu<VrXbq|ZUZ9MvvFL!QZ@uyW&NN~>VBM^25vtU_1H>U85F
zx{~5AYvLSF#Y`R7wYlTrBsB*50-60xwGFJ&_|<88?RU5XYKt)2ovP+T?2<GY(1j+@
z$l+iYk_E_g#N{)6M94<9KdiaITCR8R&1(Jwj90p>!u{K6g6HC>GphJs_g6lg_jl&Y
zvh3QuE`ja@Vix?oa<tb?3X1fRSR<DV4XrsX*0m1LIMr$k-4@F(z60ouBUuu75=3eI
zg)dd#Apx4k@FR&F*k|hJPaGjf1_zH>WFL)^u|i6Ft#`6DQ+Zxi6c=+08x(*sUd5`u
zy38I!&}M%trT)R6PT~bVrrGJ#ajOZ4Qccp$dx@|7K$u8AB!SLH`OxCag=C{9V}18=
zzI{tLiLkX5p&~mdkFQ@HkonNdA=A6Zcpp-bXReQ)2t!s#b&E4~^-~k&`&xsLYR|O?
zIMeHLuM0(Mq4WUkt0{uD3!UWI6o@q{$UA^mQ<wOhA;xW8Ur?oZ7p#v9%;(f*@A9It
zt=4ADg_Ej6hUtV?rGLP_UTdk1gH*tB)9j<-yKH!to*!;GDp5c~VwlJEL#~tAE0|Lx
zYzLQZq?{1DY5i-@c{Rb_5m_Hqi&O;<uAKN-GS0XZUVnN2i(+gGcDUxojmD|;K-Squ
zWX3acDZMXz@;*LZJkZ!YHu%!N1=u?FKdc#NjS40`LYpTwwo&&-iP{PqEEmP_4#Q2-
zTv>N4_crdEKb3m!kC7)xP1;Tg$g7w?KF*j-oDws=oN7fCB=}yGmR@FHtiCDC`v?X5
z%Kk^}YZ*EqG83;_OGw}s>y=Na*%Qn;L(0hAD;Fdk7cxRTu4k36^l(~%H71<Fy<Jz%
zW5`px)<o*F9g)$9*yDaOVlS<Ip_ZdYir?v(GPT97KE#Z0+&JGKXDyoU!wzO#w(4S2
z?9~y?%sx$6SwR)8+VPc;;S%DNjB<84&w?;C@;)RBQvmxSpub~ZX8`Ogn}U7qV!3x>
z3;R;mhL;#ONCViH8U_1GjbyL=75h3H)jBz<zeXNDopakD80cAW3@h2dmF={YAOYCd
z_%GO3Jf{DRT{x%my)!0zGGBpvs75;vf5AfQix}q2V3BVaCY@*<g^@x%JH=B}4LWHi
zy|i4q*+QUboAyH!zR)Ny=p6LOv)8IlI_i6b4lep=_e0M_k$^Vs-ODNJSTDFRr*uH4
zLKaDI2u7IF(n*hoEJCT&>~^>KhF{g*nS)gRDCjfAEUnj0^O*$E^Ez9Q9$?HIdQ_Zc
zzFV?I=s#m$`2~(S->|P>lHg*R`l5r{eL&S2)}Aw0x4s-EVP<i2V;1*W7Vbk5OzF^y
zicvTYIx^~@roPA|$0l`~S!z*BWy&X3omHy$wZND8*n>?`vuV`H0QU7K?a$cPjZN$e
zOjWameMM8{1K5{1^~<zx*q7Ij*cWyi_B93zCehtTM_8LF1|2_~M0>{P_-S$D*j}Hc
z=WEyjAG7?m*au^fVi#5MRm2y3az0Wj^MO>Aaxl@9DMy%kaU8ariVAhpsVN{;6eoJz
zOKM&A92Gc$y4QF1!4c$M!v+QT4kR?0j2p&61F0p3m66KYP;p;6IWK7NhOtkp5DZzL
zD4WUl*$XOXM;kPUo2d84BB8z`zz+;M-~&Ag6Zvcx!7v=g&nhx(x4QzG(w3rb^gQDW
zQanFJ>ht)Hv-R@gwFU=FnRZ~Q3@0*R6_Q^HQf9~E?98Mx&OkG@Bih=jbjV(uT-g|$
z=aDV!tApll0h328a*xHCjN|mh_3kvpy>2Ff=XXg>Xp5?0)z*#eP5(Xi<?uV~%jY-P
zms&fOsn`F9*q1!b0$LpeVc?B}gm^J>pJm+5hR*R~q!Hx)ybo1I5}eXUsgW)PzbY1c
zg%EZtx(h}xtd<yamzt`UnjbAayk3&C%IN!ni@PV38BC?EiZXQLIChpfqo-tSy2PTn
z%zd)#Ah$9)mkS#W(Xv3<9X%7=PP5lRISWnWBP$h;Ry+b=UnIIVGW8GGSI&3r>kQqI
zU$C!aGWAc`SBRZPzI_0@_hq%~z&MBRu=CU*Q@3HMTGBI;3wE`UGVAfUcVsxW-Mia>
zs;3$8xgfu#oytmqqrm``+)g!G3r~blHLw8Ri{)hhl}C^i(^`Y$<f^-8&o*jnRJrkH
z85b{r5O3)b2P*-atnvyy!@Jz82f3?gySd(2RCUSA6d_9-7HaHVj7MkTlHJB%$kc;<
zR0H&N%vOjUUQ)-6ulUH-zPlW1GY|K0MvDDOtEXriTr4hP=;7RK=EoL(!kNIiR&!^%
zBxR$UO8H}n1G#9OzBJ#i)DK@Tw_0z!1Y`8)Iwp>MTANCRVX%un@nNrYO|5^KtXvdc
zt=-M|y=fq%t}eQ}dg@x8hQB2*4~KpggRQc!jc)_A4#D|aB|i}QV6VQX)$XBT#&xsn
zyy?;B^y<6q>&4NfYm@cHM|YlFr=nnA=xx~74d^?&uh`d)|JT@8F@Sw}(X^AP9Y9$3
z+Ezbu>%o5dd=f+Zs!_W!!$Lc~!zz^@vNUExtyIO$GOI9EJiQJI4zdpS4T7btb}L|4
z5o=gcI}7!qyVq@Z)$K4=UX!A!M_%b+KI>=SruGbYE-kdLqIJX_&BPt)txL>U#62b?
zn?~twKiWr>Y9+vrnDo<U{#i0At3GiQCfy8;vFjiqp&R`)HRKSzlxXQy+WOjJW9~LH
zNp**H4x6JnRD`z1K&=^BSH@{4FgMCNlIe51!_m6VcS^{}z-)<5Nq04*c~P~gzY|qz
zCs#F(LJ%V_Z>a^WgVv8RMwUie6~2IVkZA2V=+<<wS+ED*7Rytb(aZ6{zlRFvL>jpO
zCqf#BnV7FZ*NqWEkC<^w)M`IrUy1<sB}%;m$YnG@wvn~=H+4_EDzQbB+6OUWK9xAN
z-jQ&-vtzZyZtTt^yd#7xGG*N98^l<@%D7DG^T#k2-n<#_MPnhtc$;@188onCm7&{c
zXWMCHvcKBX0)|KjdUrHz{W<gJS_@s`UE-dBHunKmhk;(i0O;BPkNqWP6DIqmzG1mm
zyHB@Dc$*yE???v0<z(rnjCU4$sU0+cx>z#|+g+VPLaVWNO(vzLia5fJQ1y20jNWuX
zD;#v{DEMasK9jB`YyK7K{svaYxwj?Bc6aba1_xEmo!e;+($faMYc=+P8liiPkE%8Y
zajezGF>c6JFxe0J%ROMVf54F_ivK7+++Ox8_GR?%urJepiG9Uw!@kle*q7SB#=fNg
zcd;)J)pCm07i4*qY<bYq<u$kR7}Z_$w7x|=&aV@nEaiK}9fjSnL>x!cv<#QOQ)ijI
z#r#Yi<?rlYW2bTe=J)=X!|F3?m;`bxaq2Ts_c#eQdI9NR;qNXyh&w!uyJKO?;eR;V
zPmP*v2U99>tF-mL!aPK$Q+v+zN9?QYci7jCe~EpG!S40T2iI30Q#o6DdC!GE%gfBp
zCS=s~_jf6KkMYXYvQ9sSfT<YbZ_uBEt8EBjn638h04AnB@aQj=iG3!#V|2^Mr(^l+
zm_9Ryv@!Fa3^jR3=bZ8j_7y{A^9}pT-@?AUzhYlm=u?W@u`e@N-EmskWtNgFDE*U%
zjSP|bc-uks=SQW|E#ntUr1q+<WhKcVEu@e~q!w)rUp_ws!;@}TKVlxb$n2bV1Nw?~
zopb<Z!Vsygabz3z<!5}|N_+YGOa9|z!{d5UFmIx?G2&%h(y6Xc)xhXEkA;bt#xZ`J
z25O3Xx;ZsonTkkbWA}urj!~{X^%0}VrFi3)8cg{c!%UqTFOw6P3i9NoZks*-VyVue
zHcWo00Ddho-TVpC@~)=WsQ!-~<_!179biQX1B*Dj1*Wlt>FWH|7euP#wT%7Hw2l}g
z(pE}AJj*6!8}?Pd4f`6SU|%+WkA2CZ9gQ}zFX<n#uOr{FFMSI3CAW!vDdN@q+93;<
z->pyY?xRa<Pe*cCA7;>^^2xL$XhZ$HUPbLnFLH{m(jx9od1vA6sj&wca2u&RpMCFA
zUyBv;ekgME5_^Pec8tEh>3<LV^7H>7WJx09BIwv;9LGu1+A;8VZ1I+LWK|XM@t_Bp
z-IpZLSot5YucP^ya!&V3jy#y(e?i6X<=n)Bg@XmSNJf#PBZ3;X8aoH&Cl!GO8ttpS
zrAJ4X4pkqy?(uALblIYo{!!p7m0c?nb<U$TPLCeGuxj#tcCXZG?B%i6z;`d7JsSJN
zwtfGY{=dh*#QoRKMRe?<U|+@P4QuE3dtB@74FK$m{VVpho_d?_-(g=La`NdW-9;Df
z3`8A%{4U$q=)|SGB>tjhqZ4mtd0&`YUA^_EO}uB@*b>iu&1ev73icUe(4hL-T=9Jk
zTD7;U+DIqUKX{o96<_JFnkm+4HZk%rQnNW^$n9mH@)=U)bRIFe!>#@Hl`cAz*IQT6
zf=Z^Q-%Hx3kNKRVR9|(JW15~=c*AQ0Y5hm`(Gv01K0Ahr2I}te-QFW*R9zyR-Xm0h
zTA@-k?X2&C;)jn@={m}VPD)Aqf_=$TQ}48<U|%wSi+!bQ*YMP*L2sKL<eeR1XF7C#
z^sr&jA#-b|=17LHxSKi$LfdXS=3B=H$C&RQ+yn1d?5RF~TS+3_sLvTlxUh8Rkax5U
zR>jqzC06bK7W*1w<sM(`xs*lgri%!TsU3R~xKTY;wbWJpaPrKALDNKJAz#2uRGYoF
zK-fCw<iWVae5Z^fCn|OkrANc(kEC5y<a!pac88sIC!Q2-p)D`h{mea`XV%f6XB;Qs
zT7o-txcWruzDs=mZLHjv2<)ndYZCSyb=@$?`J&=-p<YSv(rm*W|BHq<@=gzej^#zm
zoTyKed9F2~aIU7I?r7e_T~qs}-LJlR_-LoA%=9Uxb|^=XR|kCe9<NUU7q6{!@|^kP
z-7Az8<kN4<(_(l>YAne2p4y*5TGuo=KCkl4rOZCRHGPLuq}A-Q)XI><ZfniTSYC&W
z+fHM_XPyW-&oGPX$oOQ+$zXoMzJj9-t&{I&0N9u7CiXR{QQ7!K%Js{8?X{Sy9p|F&
zI!Hgd|8_PjG{ovqvDH4B>C2&^Uv}juzu<dzHPrBK#3O%F^Q$^)+DSD!NGV1(EMh0Y
zW;*c=O}T{2B1{Q?{Nl!pOm-V0gmi!;TL5!CEr7bSGeTm8nXb`6i}lugh_riQ2zD2-
z2EQNSV@HPE%8KPX+$qqF4CfTCr#;0f2w-3P_?FO&VIvOgSj!&O^`U6p(;e`s<<6SQ
zY3k$CBysy$W(J8v?Y^KQf06!(Ab-4uf<_fjb<Avre9R@I_EepEP7-G}s8iL{Es0<~
z%y&Okm-Us2MyRlGj(iN{Rji!&9|18MF=T36WZ}6ltA(2Dgv-ZdiEM9NaAK-MVfA1P
zO>#;YfPKL!*jGMU3tobb^n6=LecUob!#E{!hyL%eFNfb^UoW??FaIs<>kxo_xnPkJ
z6zt1|*w#g+-@)7ke*)2Z7evI0_NJkkr1b<|cZCHM*zp}fc8mOqeVJ}zUmBXS9z}dk
z%!<kermVr{?t*(OUZCkrF18la9{{i~#1{6IL&3gW0qm<7C`c2A!kI~7NX4+3c$}Ig
znQ5ns5DQbJ#6kJtJDD%VSv(OWp8EAsQ+r=_@UVd8;8O301U70X_2pOyRaNB^9f6Ah
z+MC!H2rLk_iG9WM0oYef$~Npv_rHdHb$rFX9H2a1un2Y#F@6127;AP14QnkK5wc4X
zmrV-0sP&FUu8A6*&7I7SJya>=`r-h6=Ft^q*OZB8HAy!f9a}Z1Zr&BB`xo}r!$=j!
z^j3?iZT3{ZU+1}}zFsW1KaTzpQuj!HU8{@zVhr8;*4pp_n(Q6#-+Ahud=+l9*jpkD
z(T+5vU|*a7_BAS+MiMbJ&t^I%31DB#w7OU!Sl(CcYi^ob{&}?041Bg;wyAs4JPIf-
zB+zouLD^~Bkp>NPaH9<n=sG%`$H-lfj|$6U#vMk@jwZ-_MnmqegVX)y=G;zUsTN3J
z5Ig7>?5q4Q>`U@H_NDq8>}vw`4f{gO3@64alrGbTgUca%^FZO7*cbdK?5mdNaRI$|
zO8JnmX_SccD>}r}oUu%FsxmM5N9?PEp+TcZaSgPIeVr%>mp3|1E88^PA#Cur$e{sf
z)pU5gV7xcNFxB0#2}kPI@W1w907f5U*MgR9uTZ~YV(2+3u#pmTrJd!$^U!+Pq5aCK
zN=hI+9WMy<6xq|sg9Om0@X>QJLsk2AU<w=AoeTIa?5hcf6vVbebkJb}7djENoOp=A
zX#iZ{p<-8t$+63VsHp6Qg#}N?x`9E8>3URbcz>!8pqi5x-&bjg?e)V7N^W9bXTM=z
znjkPpa@7Y{?(%F$Xy8C7h`@XZM6*zir<Vkx=ymM+HDJvo{f1a5q5urMz>q6)cqTDk
zGJ`^scI7wht3ZT;eT~{}VP7FJzB*dlv9Dbe?5k}H`x@^;@*@ct#5e4V^cVJJzlD84
zzGGjdo7mU1FsPlm(qbF-rNVhp=4b4S=P&GwXA}EkM2vsKz5>E~)s&sNurB=?&Qd69
zV*(2i4--#iaKR_~?ix{p$%6306zmK375gG=VPCQo>}&Zi>`Os8T2vVi+mm{krx6pb
zF;PzgA`!k}U!cFmzLd9NU!MqHu`g|E^WR}#Q7m7vF9qb9HgZk&2ka{%%y*3nR13ng
zZed^13_oCBsy||1ps(21NAPd3FY`_8i?AL0irf7w_BDa0U|+r8u`kpn_LVC77xsnX
zlf?^fVP6G5VqYhJhkbzo>?;-X9sAOtU|*=eurKI0?8`2U@9(g$ISTeANx{Buac^N?
zUR&4~p5Z(8Rf{(@j?(VEf%yUZ(g(1w{UjQV0{u<wYxj5T%d{L%!M;kM$Hdi+)kZ;U
zL5GwhV0Nm8dXO_bn#{4FFTcgUyr{-}p;Y4dj=VBoWZPHlD;2668)uKF`aSlgybb%3
z-om~<M*J=Ih5ixy8vhIX+P{f??cc<{w12|Byuzg#e#X9Je~W$f0@zn9?mPBnN&vh3
zGxml075h5$TkOk^>R0S*=O*?g`FrfEHiCN#`)dD&eNBJ??8^+mzOazcluhib_Z#+Q
zx`lmJU}Qm?*jJRwPuSNg)$g&dUWl9}Ogjc<77(#_Emroo*q7Wk><je``!d;%eKG%p
zeQ9LlDcBbtvWb0BbC!eP<>2FFs3d@Wc|j#9*cYDhC+y4nUt(XS0QO~xuw?lW`vU!2
z?92N<VP6Ca_GJiQU)Lj0EEMcZe>?WIM)(W+8V6IbuasZ0FVGhDWk|ukXnw)Ic7Daa
zpy700(689n_!jmxw88il`$B!izE*yReVGB+*9}ns`zi*oFAxR$@&>Rk9MUWNEB3XB
zFD&^N*w@G}*caz_>?=|AZ?P}X@3AlA-(g?%e}jFEZ^yo9{+rmBEP#E9Z(?84|A>9b
ze#5?)f5N_Kx3Dk0AFwZb0Q=fc!M+aiapD;*4FT-S^lz{)4K(=r^>5f0avSy)PVkh4
z-rxnWFFeEezrem8fHi)?z7GC{eW7qE$NwevCD&eJDQPa4O|7&DEsP@+o`42n!DuA4
z1b}@ZzhPe>Dzt2*YP&=l?RV@;T67EhdI4Zxc!96j*Bk@wFW6W4SL{pjpRlh~`fu3R
zq5nGe1p=@y*?-2q<f+V3Ald--)l5}X15I9wItE~0OA!U~5#{>`uWF#S%((|Pu`k)|
zy1X^krg4J*uh>`n&)ApjcI=D%U&OwOp*OBaFl=I98b4!SN<U*?dfTus{7={ymRf8J
z`@#|q$WohaVPA{?2K$QUi6I$o$G&bvR6;kguO85EurI^^8uqpSSL}=JN9^m#-(X*s
zU$L+KdK20J_T}|E?CZ&2*cbJG#=ZhJv9A;W`+@=3m&6a)7oPDyV_z!2!@fXpknMKt
zOZNxt3-k;21=@~%Y16jSw{OF~yne*Kkl(SdP6pBz_H~%K7W^0XRT|dHLSXn2`-;L*
zu&)?ZJ1_<Nnj-K3*q7jU>`RJ*ef<$(_8eOJ@^{$R^PjLU&?feEn?XDhShDQj#J;eb
z*q81m_GL`LzH}(qmo<QWsa-JJ#J)5on*r>rkUrXjf_*V>VP9)=6zt369^o(StCoU&
zWdhh2wsfYRo`QW9^dIjQ04=tI>?*YJrg;GNh2F%zc2lq~YXJL-Ql6t=U)q0RU((;P
zFW&9gmpOoaouFV}=%27J9m22Jm)Z~5SJxf@`?B7|z8s1VDs5q3VifGl=C{~a=~wK_
zfr5RNn$Hg*{|5U?ko*bzs{D$5;Q{Qcz7JDM!M-vFa9^>nAa|hujOQopD}sW3t)Quy
z^|r7tx(E*J;zlQceUV52_H`{)pM8y!IT@3a{WJE(0AODu|A>9f)BS>das7yWCHio4
zvaD`lUx`9n*w>NQbl<QqIsp5M`W^Nq^dt7wvk&f0!M?)(1@<++iGA(<ihUI+RzG6g
z#J)@me!;%r^rrX$D+=~CDDn;a8blwMtD6(TZ(?75->@&Af|MVzuXz}K7B-Owz`n#N
z*jMa!?90#5+fB5af_;_6U?|wv1K1Y!<qjHl6=<wAN#yv3eck5)u&+ERcQk-~*-)^r
zC_NJZ`x-H!U|;F6oId8o`^DM<wy>`^oZGRl`xNZ!4h=G^K`2U7Cxh!7_SIlV!M-3=
z?tap*jVRdHZXPuX_O)Z+wVuDYV__RB1^Y5&`=GXkeet02c5$kBeT2;_H3j>U9{CIV
zlEu-t*o8?24M7A4W@vtoeTn}b`@#}7u`f<7d_I<-VO*Oe9W%pB!M-}kbSq9wTiBNi
zt(hKxeJKFg7ZJd|im6MPwP{?jygR>QU;ck#U;baQFYYbu%lbG>rzr`jIRvn;8UXtm
z6k12}D2?1_Eo+BSurH%+*w>ygh8I}eCic|?p;P<;`%2ovzE1re_Eo-xeUSj{s|oxa
z`;y%YU|)RSu&-NN*q1nfeHnww__kwT$6;#$RDWS#-1K+I|Ac+@{ucWh?Be{6eLaxc
zL&3hFv{(T9k^!)<ms{AE1F1rlM5ZwUs58Z!SR>;~CUFo1z`jcP9^;Ml#3cdj>kc~w
z`+5_``oD*L)qTajx<yKU#J+~xcgaz(FYWKxm(_Oc%Zj!3x7b%d1^de9Y`_56*DUjY
z#=drS1O9us>L&J8_#OM&`y1>lfdM$CMltG9CF>L6!(J5Zi^#JL`&wy7Ho5@Vm%@L-
zzFL2aeWgZPkw8kOKVx5qSz{>J*FE%i>`VSH>}y<PJNA|M9s80W`WgGG87GMB2e7ZX
zZP-`pf5yI|^lT7_ZP?e*E$r*!PuQ2(KVV-+DA*T{D)1VBeR<-xV_yUc_67YX?CaKl
z3Hy@#57<`&?muB)7XQ20*CHbY`?^cPzS#c__La2zZ?LbA4F5IkOP0v^8|*9nZ?G>E
z1^YU!MZvzTf5N^PzF}XzKVn}u!!!bZ#J&nUwqai+Ml@lU)8AoVg%SYvRkw+K#rzHS
zH3I&MeK`_10qn~Ul66{3{2KUo*q6b-#lEz*urJna*caU<_Er29`>G`}e8;|!KVe_l
zVH~Fc?5k76kw~MVwTXQ(@LcE@`X}s*hJt;K{EB_Wvu?+})WgJogMC?TVqe;v%3Ii1
z592>!U*X~_VVnT=#k~#ts{IN3iWPq=#8dkZ*cX(?aU1sK_!stN^aJ+A-N7~T6ZWMo
zU>?n}g?-85DA*Tr6Z`TH!&q;_zO4TZ_JyEeUxEaVYykT*h40yheKBuhUuVNu{t5dM
zLat;<k-lMHsPEWUIpzoK>i}ODh=P6fZem|xg18=0@GtDkXdCtg`bX@Gg#C(r4Pn1x
zUvD?DuN=r%>`M;^2N77mV_z%ZurCmReQCo#vHXC2UHcLHD%gg71%Q9SzU;SQUm|~t
zeO=qazI1<seX0Lfu`g>a3ijpqBlg7!U|-sZ_I=;5FT-!x*S_CjUjp<o+7#@o>F=;F
z?rqqY``=(+F8>PqiokKU;@Fh8urJB~hrRoZYO>oJMx9VX=n0|MP^EW~CK9>|2!e{B
zGywsrq6mVTfb=3w=|~U|QF>L1AiWpqhz1lyKn1}^s+>C%#rEuH?{~lBJLin=|NUpJ
zd#pLu9Ba;b{T};D_!roh>YuSMf*tHjd=K`OUn7tFGxjz1H`v$VE$mB_tQ)|-oGBFl
zE$pj~r4qot8hOjxD3=NG*w@uxv9IhuU|)@t{|ft3B~OZGJhO#;^<h~11pWo~rTE{%
zzM6Oe959pwkA2bnh<!Z=urD!6bdW%L-p|-q>lXHPMup<V7WPH6jeXJKv9Ejp`x5zE
z>`R<XQ3a2E!BD?qU!SP{1@<*YW!O!*gMEqrkFc-${}}s{{2lhiLTM|t2m6xxj(rXM
zf_-^_|4(3F16$Zv&#%~*!@r4r`O@m0_#O6jg`)faVqXU;iVi6hYgQB=Qz$uAQ37CJ
zXdk}4*q7}y1~mZts$fh1j(rg_tJTt{6UY>!XpJyz+A4zD1gvoioXd4Q4k+3o@Gkb{
zMOzGDUu*2&u`dNY_H|<$`!eH7@)8_E(awP#<}h?>wG7fKTi90x-!}H83I2|KX@c?C
z7XZBO#l9}6{D6HC{cm7jDlA6durF0w9)cgSuQ?PR`vNSqKVe_aTiBP{UhJ##XY30`
zAma_*!oI%Jf5X1eDzp(Ohjak@g7D7)*w-~Y_BDq>x@ZbYt8gb(Zed^7cd@T(I%xt<
zsP_-p7yr%m_d&bZ*Ujhr-7)-DJJ=V$K2QaU_y^cmZ0l&O41j&DNz%-uU~rF!p558S
zz8ny|0QQw|d<XkV_!rpM$vxPY4j%hzJdDS__PKt;zJdYl%kD?)D}!_w`=X@X!oET+
z%Svzmgnd!c?!mqiln&@*{2u#Cuhs|}u)$+rtpN5F!Ugk7%l8GaF9JOF#Y2?MkH@|Y
z`FekceF@^RuXp6%urK>4%v@Ifzk_|9kK*6PzEFFyFa90u>-_JrFVr^nWlf_)Ho-%t
z!~CEdkA3k517>s|fPDp70@&9mfPEphurKW&v9I`V*casv_Qij3X+J<JZ(&~r=eDpf
zV*vZIp+5c{`)UTTFaAf!`f$bj-?1+gH=QR<(688+;WqXK<|UKfgMB&tfPMA+5&N>U
zqE;Y?2e7Y^{2#F|jUDXkc-j{B75)SE)w7L#?W5a^eT7*DAKb;hurhnFuc;rgFU)_A
zeYMmi{fK>S`231}g#*}E=8xD{8T41|i|gORzS90N_7%bBVet$0Rrp`QzG(jy_H}Ou
z`zqSTzBGQqzDC&pgnebJ;kdqIUslvqc7Mdato#n|!M-8@?2BLv`w~I#!M^PNgne<T
z#--u0uSPPnZS0HxA7Nj_>Uiu+XAkzJw}X8>`d8RjX{zDzE$oYI3;Uu`;l7E-zO4Mz
z@YvVr7WO6d8|*7;3;VL&!oG54(BH8ynP+kjJoJCUz7FrjzQQRm0QM!@Bc-AZU|(AQ
zCG1NVz`hceTiNm0m(ULO)%_FpMfwf<8X70JMgD+&mEp0kn}5K*4EADQr2jqa%W*IE
z^`7BZ?8`Bgn7`C~5B60rqrHuNW&VPF8RP@lS3!V?G#>jJ@}=WhGgK(XV_%Rh>`Qur
zd<**`{)T-u<FPNIE$plL_t=*jR3#d~zD9kY@fF+>!((6T1iRRmf$RY77WS3*1NNl?
zU|-9Ahj*|q=AW=Hp}p8w>JIh=S1C68j(y$S#lED!VPB=3lls5GzDRz-zG!!`uN58~
zfPJ~*u`iFGu`it;v9D4BgKlMrQ|&hPm7~0ceVJ@wUsz>4_Er2l?Cazn>}zNb_7(dF
z>}zBf`y%;{eSM}^D-+wrz6k#V><dOHrMHEBbrT+f5vl4CX+{to?Izkh1|v4mBR&;D
z%;L;mjAEX*;48LZCwo@84meHY5R(WJFLB~47)tjV20%fluz-@Nu-?J4L!QyGqgcIR
zWcTI?-&(K@pg7jS9Q8OTNg8|hJlO)4%o;|rfFWBzahU2+Y>d-`P%O&nqz^6F>|q=;
z7VOR9l&*Fp8G6)T!~y)3#a4V@y#?ElDzhk-ddQq9UyqzL4MttSI8#eEqfDi3!M-$3
zBR>wWtYOIJL<}i2N6f?Pm1%=5*w0|8DX>%&C|2<TDp4$z%{Y}80f(h4fAKiWCvh%s
zEagfB!wDDCVO5qw5L6qyZ)qGZkL9mNQLNT5q}R~VE<iU2F_bek43#ysP8dpg3%c|g
zhWT3Zh*ZQ70ED4f(sA^V3Ho{v=};<lbuC>SnzGcDz8*=Q0wS%%!66I#rU2cn;2=9E
z;yRp1yOtq0pMkoNu%HJyk0C9M;9tU02Sy^Nuxu1G<gc+b1$rD8^&oGt9O4&|S@{sv
zPu!ZHxMt`1v{6*WwH%!|rlNW1Sq!C76s0y84zqyGrXmJV6!ItzTsOxmilWmM>0S$~
z#*hxDGOuHScU4;UaT+lc$LTbV`dS8W6zlvr%k=`bdaPjHC(@Eyn0zgTZ?E7ej3XTk
zX+SXxNAV4yn1^sQGg!e4EE|M?qu7FJvl#ew`HUZ;khosa+I+UYUJ*Er#78kUY88@E
zLN4B3j`~6>?Qyb(arjIsK-+L=j|+HRWUq%y4Pv1WBzRCoR1jCTGp>@(6EuddY)J(i
z<`<FjSZbmkX3ARF0G8uY)IPT3{6W1O-WbaGZqf}4ni6q@O)Xt|FK;oHI<=Q!gcFhC
z%AVUJhjn8YMUfTuFs!1OK^Aa!EMs~t`HV8fOe&kBB@=rsEDi^ss%3!H!antIXxGB%
z$7!ap@(n%6!RN4{8oG4wfz9U}lt2UV1oeFyPAUV~A|Zosp)kTg#Uzu_3Bz=&hhu^h
z@kW`hK%ABm#o~lQ6iG;K9@FP2!5|O!0b2-LMf18%NGwQ_51G?5_p%I|Gt8L7moSu9
zk&12z;!1ON4lKtV45g$6a)47SfR<y(oPP}%VnD$1-i?G`iu}rP{36vX;Msi)d{S&7
zC>d21igX&aVk{NGCH9jTrCZM#qTJ-@40*l5q@pNhwdb@$scd&pROuMq_tI1fwd8MV
z=<ZmsQ=rJS!BWl`D9Az~41m>86ciRr#uAMCqDh^`HP-YwRx$f@u-yAfj*E@c<9Zmb
zO46@cusT0uiC3mlR5<~D&JhY{`uLiK9xS`?iN+mCPIgJ<#tFUEak#BAg)N#AZO$I2
zOkrP)tU^+5-r-a}kAbA8BGAgr%W%?led7oH#&5x-uv%I)4rR@y0eEl5IL0D<7AGWo
zsH>)goBGEXh?4{YWO0%be7NJX=^ECwVH{E^iAd|?n*zhrYhcb;F-lJIi*D@fD6)~~
zbn_@Z%2FDR+EW{~7K?5tr7-MyQ8XLlG~TtA=dp~z7WCQ|c?W7?vc-&C2BPX%>Lrx*
z>47sG<4mXe4&VI*?{#HbHK$i8<-3C-Gomp&+7J6=XmFyC`lJQVJ_Cr~9a|}s+96kX
zb1!lVh3GiSVIx7cAjv*rK`Io<)e%DW8mzX8p)<XWoFBhXCv$-$O-QGZV+19wdYoef
zY`y8LBJ6e>d8Za8N^e9Mdu(-_W~hb%oyulwPLDRfu;2A;Lp}$68C&5z>jH|bn9fz;
z3%zYBBKtFwxinW~1SEF>;K^Lp#-%8+XF5JZe4=DN?l&96US7k<#9EMa!VbDwo;kHd
z9by4LfB6b`nwTd6#nTwdnS4Z`GHZbgTWBnq#3gkJ1LjNymWDz`$y&~H6NV+2eH>UO
zDGR3Hah9ok7z>SBl8kHv+N;6*{4kF6mOk=)iJ_PUQ^ZB4>^p1#J7-%&#g2uZ1;gGT
z;k=9dzLJjnqHb`YIHt<3&w}Z0>7AHVrjo=s>KN#nrLj4U!^0zwFVxa?rc$r#vusNC
zux?<_qb?!W>0O9p{oeb!C~%4{U?3;y$ys{con0h8k5hE&bBHpqHJG0~+e>>DEu}L~
z8ltax7sgQtgvsM9^;nXZmq;vSE=6B*H#@~a0fwdMxt}eg9sxt0u!u|#ekT;oLBydY
z6tiS4EeK0xug4sRqY!ir8(j|LE#2pA!EVFJqA*UMJqXJ^;AP>n&lN%XX@T}^EiKN4
zo_Uxx&qcr1<v8VdM8U!}1<vcQQB>|V<f}DwGK&zt=j5UKWHy|L^i=jhG^u<oOk>z0
z#DZy}7Ttd*M&~q{bbR!|#~i^Z^-&CTeTb<6LtI}&*NCHm^^qGgk*3$!Y!;=Op1;Uc
zuPi!=qu0F*H@*ZrQSMj9bjVcJUo)1JYCmLY86pW*o97I8jt;nHM2Rut=rsq}N|MUL
z3$7|gw@V<t66D3=A!qyfRxUF@x!4OqY>|=fw?A`}8dF~T1dqTeQeya(qUdK;S>(rQ
z5E7F6T#<sSX_4Xx_rEC4gOMR9)+G-n+^0ahXDY)UOiL(MV>ftiztX~G9%oD@Fegc@
zmRugias~^zhRtB;B{!Dg*Flll^e{|ep#J$xvl!AqSEe}R#dvf09TcSJq~q;`2N@vp
zfCOY=`N?Y-sLa5%%@Z7w;I#8D!gWQ6;|p*u1WX(2@^<`WY&7YnaWtjz$;8L;d2j0y
zhd~_f=4^pAMu+<tu9}lPlMRSH#SvjnVtTn?zuT!3E9y5UsHhErfFx3aiSr6_*gpib
z+Rsl-P;`xe;YvP7V@dj^5xFk|GYP>%LN}7eL5o=nTb(%4d_Cq>G&E46wBvH=Lal|F
z7qaFm(i@fCwMtQML1J_JHax~qp_c9$-0T!B4ARHpz9x{NOq(l_xLKN4m#C!thOA4x
z<mnS9O_M6$LIaD@s)b%|6AhNin#1QxGY7D4v642`<M(dKT<0d>ST%=NV=1W_#V7~p
z42MfkOJ=X37?O*qf=9>;doPM{*19RwkR<UId4x#CkZQS~-i#l8{M?wYnDfbfFX745
z^jX~1NgUG*8tR1Ndx)~R(CsW?T<Mn7(p!<KH&{Z=%Y914R$;jI7E|df*V7Hinz}-&
z&>r&i6~u`Xr!%k|5#H<uMr87y=gOq`U+I&rDo6Pq4~6&L(y^dV`NT4WgrIRWeMV$X
zsnO0@c6KlntxTb$Z+qS&?Q&ArT9WnG3gnRr<X@HLaDr}CpKeb}4+{lqhOsUVwqEYD
zz59}Tg~oct*q%$BeSRSMxx(1<Lu`GjXZtjh`;LzF9b@Y^INN_J883aAu??I%J8(XE
z;KJB|Guxos*}*HxgI;5UH`s=J&khA74~2{k-C`S#K0Ca5rI{_^8Zv=xWCJ{se0Jo1
z)yTb#k>qP5W8=dG*G7wyM{CD860l6qHb$SGebKY=BIn>}#leyOv5}Us7ddP%UnP$X
zj*Tvkz5F~jJUKR2vhniWLEM+*5fXOXO7iGN)yucZIHs>Sa#P&O#;eC;Y|T|ne5Nm+
zkKqJf;v}w*BdT9WU4N~vG{IRtzB%@~;M#DWD3P%#eBA<KtVCo}!$FIhQpM4(k59$c
zaJ1s45;@tNswvhjNS&0}bjPR6l%`BlrW{SD+^)a9{BqL5bSm-d6xMXg^W|G>_G!PA
z=`i+p)~4?sR!`-b&X}aUZAh7kub#X6bxu`z_J-25_4Vn^5Ywq!O78}*PmNYj7O=nX
zx;{7j^4;3k_peiC-&Rk~vd=AEfA{73yleG*#`S5ILqzMGfPgWT^L75-^;r`owuIW*
z_tldkhdxT({Ydy~p(AB+QfZ07>^+OwqQs$DUbBxvo1ZveEpa@ZJ^yr36}M<&Hg(wS
zz1yMXQz?_G%8(^xfUSchJcR<400~c5Bv5SWW{@Y!Y)dt(*0oHJ%vLIDR+BkbGq!Xu
z?5ouWW~(7csy;A@ODdER#g>~2o!KPo<D{K=`c>6p<@3`Gu#bKuM*X53x6#eWC$i9F
zKb5R`vRa`Tb{dKdDht-jvMxM^Kmbw?A(XH;+!v9$i3%iViCSkYY}UHTN9r^Ob+c4Y
zU~)`TE00Q5@h4&{43%57?7|#yRZ}ZB5O|hO=qtH#TAJZ#8sR-EL)j9p&ih<d^bb7u
zTlf2_n9yH4d@}QNv3f$INTGqhsrJm$OhZUZ9^ilxUD3a<nJ;zP=X2I9m(f}Cr{Tne
zci>z%pLQfEczvaiFP`rC6ZUmrrhVq>+E+@&^7-)}urI2EPnO<oV_yo3?N2JaHmQ^<
zmlxi&B_6u<)l2I1$Y=$CeO0foEX|HSy=BJsWodnFZIjv@O+clE^q8FtF!v$j+Prfb
zDimX(>!#kEuLtcUI<E^2Sjp7%6{?4iUsA+H!2QTm0xg3(-=8uM5v_)v3zh8Dx_7AZ
zLEyRY-pfY*?20#Q7~D{Li~)X(_RA)b2if5&OnqU2$2sM75Az0}&C)-2$JnXGI@Z+Q
z^W1IA@D-DQ$64G*qixv>d?>tE%5PG1iqq7SDXyn=M$nnY#Zg?1iyrr{q6@k&CmRQ|
zxO*dek(@zP7;|6V4~J7>7|yEGv9xYhwq!V>73|9{imNfrl;n49ps~tr&2}@ZCcE&c
zu=9w}1&h+)3&CuSSWOrwdNRgzCI+qoJ1blCjLr}F;Cy7~I?Xe>dP^GHC{DG_5p`&b
zvXDpw>&jySswr`rXYeyO=LH_0wK{59G%5Np`^ntY5$CFEx&pPF)emjXPrp)mJgg!Z
z9JH_zx&-Gu5O=A-hqTUg)I`!x7~_<pW^BZh$9!^@1zTmkcC?Yr9h?)>a>ke_ZAQE$
zj7A7#uTsJA`ke}Fh98q9H%`?q6)*gi{8G0HwT`sCJ#@sa_rqoWqk%JVQgs2<O6`>Q
zBp3>x-TxpT?Z{vqQwweKRe98TYwFU*er~%XD*y%7$Hdt%oWHWvY2s$(){6e{=+Y~}
zuV*gde5iFj!alHudrVvx3r~)JDu*CQkBe7z=*QknZJP9O3_A>UCDIUyVmq+;fTV%t
z^4G_SQ=!46RFZM`tT_3Gv~wFJKL#D}J$nXD5EQzZ!h!RnKIXm9cx5n@OG>)gd(i_-
zUF8N$UNm9ii_@zwxqayUY?j!u^80d?_u9gS=xnA`m`;S;ji<S@7OX0C?23g-K}%LN
z<;SEbXm!zJw<010KMJB4m;#>Uu6!-vf}wE0ou}=ogh6e5zzV6vu?9*LR&{oD5}N%9
zuTePf?gO0b9ndg?Kv71X3k(jN?n$mBB&{y~(mZFRn0b5^>MdCn=djdG`X~mn1)s-R
zW>9T(B&XnloL#UP<y~k4e`~NMC+r#3jX-sFh-=Upt1~jjJ;6sWyM{JfY_i`;$75dw
z>W1lR^sk`xuvEJf=vEEMC~%e{fPHz--Q(DVHY+F8g?rGZb5aL2E7M3uhC1+YF}!Qm
zIudp3N>V!KjdO<&s`TD6xTsOf9~sYEel9FsI76U8Rf6dZJlu%(nXK|K@n43(Foh6S
zVe7-Z#{Qq~SoUU!?7!KjYm<(8SEB~^5on*w!JR3Xn-rHaXg?R;5}T_AvH5hl)xq8^
zF&E1v^pv!<z5K9dv;c`@F*@|rgt(Th;9I%pOuD3n2I?Qw?#nmGb<y@qCBKIG$VO@$
ztBOM;FR-2u|Eopy#t~TRD($p_mu&|uDKe2ZCrkZ+TOI7tr$lEp2=C^4JVh=i0+oz-
ztI;&B9}!He&U+ho*dROSc1l)8_ByAw>PUP1#C!%vN2nD2y{_cd`Ao^PFdfhA?z`bJ
z=_(DD!jjKJLyla|&N!38BG;;KH8+1ovRUA|6-Hc-Y&`pP-;8YeO#d3XpVg9Ah`u9u
zAfxkqj-wy<83w^qE8Qi*P7PeVA6y1tS_qW6j^^36CnqXtWFC22Pnr=b46W1tmG4Y6
zNs$#i+&+*`M^m4D-ZPNG&mWohfmGYZ5<_v_=0tJ2<1M@W3C3OirKp_#&I|evN1Qul
zq)IwE9nZ}UE8yl;{#tQ#dfz&-#`pz@0Q+2Li_VO#8o(2BaxaIKZB|BKKUu~hqG=gU
ze3$&Tbik;e?Uko%Fa8QVm4p@%JJL1Uzhr;DipIg&(_m(7+5eQ}+~tp6en?--%oA1X
zIeA_SAul(=2dhVQ?9dDYChxjqEAN)fT^0+qNPEmJ^;IN~{;R;N8T5Xl9H^t2!uq(M
zf1EtG=z@{LdL8ZT0R<5miO_5O=jMB5O+=LzFijYyT8(nK{nr=5nj&A*9lPJGR4o=E
zg*ZJYzEY#tk$*eykr-5Rx%pA3pGpU32q#B?1f{)XXjKxEc*wA<RcC0tLg*AMYgpcq
zsy1<h<*i(ZY_t1Rp-!Su)Bd9Pt}CL>DRtWCRn|PS&?)EA+Pu%**wm$Mi^*NO)7Sl0
z{rvvq;n|t+zR1vaThw#s$t9ITY%{RXgg({%CHL>Wjx)?l=uf@8Uo{?aLI3$krBhNj
zI{x)xJr<9_g7-@~vC$V!d}J<;nZA6Ac%%G`!E$42QgKFJm?MM8$MUwX7RPwA-b{E%
zN}chrF00DXliPp(1t<R%EW?K5Wx@*c4@za!ui2a?@+)5c^#N;pw<!rOWKvPl_~pqv
z#}C){6{A3A;We5%E}LB3M6n&E4Pxx6jzWqd9Q`Wt<@2-S=>k$GUo2Po;anp$J>HxM
zU4E?abs>U0V3PNM9JNL6r#Ia%CdV}VT^>hJ9b`3;6)Cyj;VQa_n|rZ2mAc{C9l)NH
z=C;;|$dhf%3;+DdCGOqndh9uW1mkIGRfxvhC)8ECN%^;`=4=MjWS{CT)jqm5qphhh
zG^y+U#96U)GiJ8@Y^8P4=)n(`U0$OX*qY8$zx{}%Tu(#9eQrKlEn{*>v1nsOUd=5F
zm0Mh?<CU;tPX8!4Wm9qL^NYluE7eP}vB((!${o0SCTT`XY>@fQa%r9PlJ!L8oEPKA
zkwc;;@hw%EoQGE42;JC!TdYd+N>;4s^!R<A8wUpOQoqU7<+vEOQRRuvyEb#>)!Ikm
zr%MgaR-f)IQN{3UE`3IlpPt>AAG&d9HRr~)zbeeu78pLSbL26#?L!mBZ8CT4^LpEd
zoOCDIY`O~7a(bPQp80Z8V8991jPBILka=J__Zi>wzp)gHq36dq_hU%!yEJQ}1>$@l
z%U%MXF_g>tV$<FdvOezWzWa?%gBsmt-ulSK`R=!N<InO@&GHtW_T9$5jyB)aX+EN&
zbyGj?vc~jH0Q))>=yy8H?<=w2@o7JLO+OQU|8rXY*0%nS2K~&k{BP6ypP%-3h6cFu
z2e97uzhE1{G~n-+72wqzaBb-3Wsd-i(OJ*w06*KnfWSZ$Big4qFh(OV2pSa09~3=(
z8a)&kYovcmD=4u!DA_jfPGAr=PA6eHC<DO0Wc^e5gCCY_qz7&W=K<K)v~PBEa0#P&
zE`P{l0Q+jbTx=WiR93Zo3;SxAK3@$DZ7ElNW*gcu9on_5(VP|fTuZSX8a5ahR?i>S
z*Bs_^E^HVYJ{}l6Iutg^Fa3%?{9RUflveoEboho(_$>de#pZzb%i&+Ngch`Jtu^1W
zvAwknjmS&8wV~zjfdtd!L!1psNrH$^10a|lcywNs0SRVMj+iSC1V4y;$w<H;5M%^Q
zkT555E`|_*Kw=T<gn$l)CQ&jZ6_f+9lLl>;NA5q&O(+n38XCoQI7%=m$|yYwWFC1C
zC?#Numh%jhwu?Tx!X+CNbFw^|J6`<)E?U4YrlV$4brcq(xe{|dD@L324(NI0+0%jg
z!_oWfZVSanyq+g9Ief=7KGH%Uws0cG`SDE~x!Wg5V}wXSG&QOWuqYwB*w2iyZgz2|
z$76kiZh8c%8wTC+vWt1zO@R`K3ziEo^Nfo>%pPPHFWVe<=uO<A6;+g7l!o$cBJ-GJ
zfq=LN@i{AONe>cemgALZ6Ha=91s{WGKp@f@&~2tfr{;uQfuwS9;?sB6iiTB79>;R%
zfrTDKDRn2Fu}iXMOsca>F49kW-g33MMYUBf0W=Tx$iH0(OCEW5%g;0U-3rIBUCN!N
z<kz@lrSvF{)Z3gZpx1gS@8g4~AEayqvCloYYx89@Wnox#QI3j397NC^vBH#UY?S<!
z6q^Z7rL=cbI1Ls<V;P^^2^Rn}Wn*8Pr;Z}i6zfxIuli9lV+EL*5%y_hWziU>IMsJ?
z;>=Ok?NSdJriskl<j+n!*vcfFeeW$KicmRST@WNWlcatmolcyJ1O(znt5YkdqwM_@
zXYL&&OE=8Un6b?`m5_G&Nrpv2*x8v37+I!eaAv1gruE3(^9h;G@}U=6GvB?-bg{o*
z$ba9>KKb(1``4}pduHE%wuOBq0od0_0v`Kf4hjg)ihqz5D)``T^W9ta5AMMqL}x$n
zn$C(9jKyPLWB~y7WloC6zWPo-$Y|ZnmXW;kfb3zTR(6hY^nK=sWyTo~k35XEe^@^A
z@Tly=3g(Ea)rSr8Ax{J!1s-|S*!pOO;Ze)gTWuqco(KCkljXPx=JaLfIDUCFXdgcO
zBxl_I;@C{i7&LbxIQOka?&OiMw+Xo)TkU6Cb6cl#=k4>(@Z~L%g?_%8x6$f1kew&k
zn)mfc{%vSJm<7vxDxciM??gcUts@c&&H0Fj*N^$>P(Qp+d(NA-t>ERpGktyqS6fdP
z4HWP`y#BS1jPv1r7Cu70*}^xmd4fX0w5o+-7m955of+UOI(1c5G9Pn*yg2=&wSvO^
zxRXVwkm5EzJGF|!hS=g`CNA+3N3<309~9d3)e9*(y=2G<J7M_nK8%)tC9&ijxn{@h
zLQ|G3bKqLtR@!`<34p&a3Hnz13LF!QshUe%FFg1FDy2y$j)9S5gvx!7mit{O4+tp_
zdRQLP_Gj$N>v4xWiFanvRhFy|sSrb2)Psjl9=1KnnSJsN`zpCmQ5J&7zAD<burKn;
z+O;QAsStysPae%s<+waKT2t9ETiHck)iYYD=MU?@P&L4Er1xRfXj@g!(W*i6YG`ED
z*ij&HuYAQ)J+4qa)mA+cQvHs+dUmvWv90nW`O_g5xuu6sJ53H1xjh|N+vKJye7ZXN
z6gB^}pQT2qyV^b#65L(VL|&UZZlHZB%fwKF#EXUAoAqLLElX%^p+s$`#KpH3PjFK%
zSVMMRVQ2Y(XYjdaMFomNk65{{6ioHhHh{AZXtS~cS7hx>i6m#P!Dmz0XQ(+AY3*lm
ze02?&da=3seEs@;ta9s-OfF@tB};cNF0o!Dt5=h$ABQ(ctv9GWs@Hf?f7s!fgG}SG
z_Qq^@<GIqt$w>W^p}@yA#sPAjm<E9}jmOW_O)NCpD>iJvn~yLwz0q&3acy*LZ+3do
z1h`()5>2fZP46UHPAL|9CpEe#Hd|G;)E6|bM>bc%Tc;&jZ7(*5J=$!&=h~W{)H>zb
z(x~6E4sUCcXtS-Xm-^C*>uJq;(XtuYoRP#{TiN!|p*_X5^_h0t3E{T*%63nOw$9MD
zmCW|Q^=AL|HV{p7zeDTbTwA1f`#39eeNqSLcw3EY+gI1l+Q`njxsIo`9Ruqvxo0{@
z)|(ezbl8P<O|*B7o@u|+-aaSXF~i#Ztfw<=z4MhY^6Qx{@bUV!q^^quJ?p}q7K%Ml
zXS%CgyEh9uyDl}=%ylqOHh)>~x*2LmNzh4tt(RA)XX8vGS6EN?T#x9*PL}r^^c}qk
z!aZ_f-HORwlw-Z9F(%&7UTMh|88&1=Xy1X2UL}z(bsg@^3zsFhHv3f^`yYAt3g|rV
zSnLtG*hhE}srJ4vfuc{;vQp~ez^R-8)f|X{V;^O2ze$Ips}52vr{7|1;6lzI<DG&1
z7gaBb40?tPc(V0-ISw_g4W8~D4CojNdp~rGayU|CI9g};w&QSY*l>K#aAL=B^84Yt
zlp|P?k$XBL8IB|O!$uzDj6CcZ$$3ALM>$#`GFqfFTH-ib7B>1gXSAYYwCernQ_2^$
zA}{K6UNktqXbOALlJlai<3-2&7r@GTM8=-$jP*N?0n<i@bH+wH#>U={y`p?MF7ooV
z&dW*1mv6&fzRP(z+wt=K`<EXnUoD8dTGV;<+40qvuvaTNuhu$VZM@%nwMmHsi{c1%
zal}qIl5iYpE{?ntNBIFqO*IY|9Y^Sn(>aYZgpV`jj<a-*vwaxnpqk(mo#57;;B}hV
z7d|17J0a9L@&8%uYxDn)*q8I-fm@4md5a2Niw8e09s(ZJ#FkW#EvY*%Y2I2ooVRqe
zYf0zh(lP4K`eJ0C4UT<2;r#hC8|=T&gGoxuD*PW3!aAJA9b7%VUF|wtrA}VNo_5c|
zxI1;Z%b&fH;pTxh^~~t<Jm`1zqNR7H<+X=B*HnYAyZ>t;%>TGkV2Npv^2MOSOF?;e
zg3$dzCoMwMK89!}g!&GKnGA;;Ti-h39Z{ST5ik^CW*4dR9|&PDlHInEus;c5ed)g2
zNZ7Uz_Ub<Re*p<g%B$%8t0FqRGP<j(V6G}@O9;dMukv8;`|6hZsv7$%|1S^rJo{{0
zY0hYw%j?$Uqh+~c6&{N-V{K)5ub%$DiwEP$-sQn$cX%+zy*wC<aW4;Mq>AUk(&+j4
zFsd|)zwlt^@I2T#8sqOg7(Kv)sS}O!P%HL*<H2;ttq`cbd~1X`x<}&|9xM{z!9;g>
zFdcvgd#6GsiRZy2({TU~Hu75@j9l<L4|bRc;K8iZ#Q`2{KH>)+43&=O!P2{LqTHcz
z01tL8ihz-{|6CKE2eZNRU{usHs}oy1Sl1pN%xZ|!dWQ#d+U3CnU?wm@cjOii_6*O1
zMIV+3Ll$-l#n&$eu_fwdALIL=6dEiWIkd}z#p8LfJVO9T-T1nO=fMz%S-iJ-Fb7RO
zfCqzd0X*1IN=2OSF}^HYU#-17nAJBP>;Rqz)5Y^(R$Dw+bc;~Y&=wC?)&lTgONV*3
zc`zMLq#yw=Cz9!_8lDH!N$*xc8!sDN_=N{6{S6P62_xd#;lWaNc`&P}?>v|}<ucJX
z9*pZd50*ke9si97lbkltq0xD?Xa?|Laff-n60z^_U;;y1JXjmRgJu50gQWpHSjsLB
zmbJ@+K}oiGumkKnJeUW-gN^U<VALYJJlOf~JXkD&q}2`&R*XdQ|Aq&v{UZ-X4*wkw
zCV{~7U@LeYj2jknbejju+~&cU@jRF)<z61_=ubQtk_pd)Wux};V8``*jRyc8tY(J?
z6Z^)4MR0xN!7~5IgC+hQ52g$7VA{Xo!6b=`6MfP4Kk#50=>QL={SyyX^amcy;X4o3
zvdx3}?BT%@ws|mH)HfcCNc9IE>@C29<?ZlbJWRVhSnL)LCb@?PQ~f7A*aDgA0!mkL
zmj^rY3lGMO=fUoL=fRw|crcG{fCtOo%Y((+?(kse5boc3Fr6(P?Ab3o7=xe>&S#qk
zqvL=yedEDQK>oWt*jYRe_WEZYOle^sL&Odbc8648VTT8M_l*Z5kRWEK#ge*h^I$pv
z59aut2TQm8H+e8AfCsY$c(CSr+U9K@Oy^e~Ob6w8m*1DZIRfCp&TaExpMrSiwSVBj
z2vikD03K}rPdpfm3eST*-ot}sP{;y2*foF$TL9DT<-sQYa~^DDhX-r^S3KDJ?>v~+
z77teG<7$lO!4m$K2YZd@!N?Vgzw=<o9Ue?O`1;T;4^~7Qc#qO?n+H?F^I*1MYP}zM
zFz<;>#pPdlus3x3hw8U^FkzbX`Bb({T!;XFE0rXk2SaV~U<LpW=BxaT2lE7Yuv9z`
zb{Wy>zs-Yb`I2YqNs9nHm?EAB!xA$T|H^|U{J?|Fqj!0*A%Q-C2gCisgGB>8m@Od_
zz=Ivf^I(HpJeb}V4|Z;g2lLzE!2|#v?D=;d%pBmsd<g^5zv00GaRgagJQ!-12aEs4
zgT)d|BZw4td9cJ?9_(;8WCKTV_$MAr>R<C<cT=qrcX=@Hzvsc+c6l(Xf60TT5k~?%
z7z63gJXqrv4+ba7+vdSyiS7bCm@M&!!d)H={UZ;iw}%I7BJrO8nFka2i3fX&=fMQF
zc(A*Bc`#|>>1L7xwBLC!tKacpqDaC>fCtmt<-rUH`J+iC(S+W39!zSN2SXD|qIY;O
z6q3-bo+Mq5u-)hHc(A*>Jea^14<@Sj3lA2s#e;PdsqgY&#@jqt?;ak^=Vu;Faf=5t
z_~$&B@9%gppWpCcirqv8=>LN}*zsK+EP>$0E)SNt%Y$WY@nDL7%Y!9;<H6v6%Y()4
z@L=BEcpfZX8R8}`6o!;G26(V}(rOUo2Occ(8xIysYWxci772p<#Dm@V#)CBw2D*@o
znmen5Ak}(!9xQSX4~7DGFymbwtb2zCi|pRw!D#S2nCLDKW{`ixY7Y+<|F3wk^q+Vz
z5Ts*xhX)gN5wiM;2V)@pGY{5}=fSMEc(A+X8SdyJNq`4i{S6P6m+zh>E)n<-d9a}0
z^I!tscrY?zJP#(mhX-pU{EXh=!9@SZJXi+6gGE4UKoDz?vSWUwJHUgDklp>pgLRWx
zgNWV#h6h9a$b*RjJlN5Hz=M6>!-I|N@?iEP!mWg101t*F+#G@A;jSN!2oQmh{ug<$
zFui}kgY|6jV9$1WFfxeZPdwOufCrNy7KQyC4<@?HgWdQY4;B`&!-GYF+C_ij!F<Ua
z#s6&{Oi~ZegJl3bnDH(Th9u1Si3f}PBM%n2%Y)f<Lyj?T@nAlLI{yI=rt{BuFoS={
zgC*?Y!3yy_nBqU?!9@Odc`(=x4;J_*9?TxkgIOv6%!B29<H3j_-*_;qnt#B9Es(0`
zdl~%5gJu1W2NV5=JlKJMz=Og6h6nrd3lH`esa@(XJXjo&`7RH3cbf-`+~L9Ek&gTK
z@?hsk3VeRx!S4P&4`xk**~^2$Nx$)6#(Q`$_gx;$YL^ES`FkF$2V%a(gGv6^c(5KK
zs~>qV^VB^&Slu2T><gX;GygLWCW*At+2X-Oe&oT7zwuzF@jRI177w-`t>E7M3lDaD
ziw83xbl<~+$^I)I%-}!c!QB7EgFTTG81a6d*}##FM9KWXgC+bu4<_|DJQ(I5@L)Rs
zoCg!|SPqGKb{Wru-A8UZZ1Z5c01tL@hX<37I>i3Zc(9H5D$<cTzPGJ-9_(_wo6Zgo
zrem}AAM#+L{}B)N8uLdUOi*Em2P@d(!5;p~gQ@Tmi<{zkFv&miV2OAhECJ7h3ID`{
zWdJ-_3!VpS`CA@L1>nJyP`RlB^LBsa!5D5ck8JZ`0Tefa|Hy;cedob4e#3*wK*fCk
z9!yOJh3CP903NIjw}%JgVE=m_O#9C~nC>nQCi!pjU@q)aalhfggzxS0V9s38TRfPg
zq`*%+SaN{&nOo$y0Uj)9iw85_;laLc@nDJnf(IMDIqHGu!Fd1YJXjco8=eO%+vdTL
zgiJiop^kvX)w}G^Hn+`#q3}FdZGe_H0mayBfCmFZ_VQpv01q~D)7xX42g}*!!F0BG
zFg>P(-}7K`-*~WK5X6l3I}av3PPgb%yH9D{r-&E@iHv&&@L(Z$9_%i^4|%4zpYwbz
zu@%6B9Z&TW(fK_OcJH@5*r#nC%wwAeI|=Y$_R0}kJeW&ub@M#HgAq}@B*XJyHQPKG
zl;cyMk4L&Wn=w+I?^hnoV2cN<{u2*YM|KS0!C>1wSR$SW3j%nsIx5T_9xNKAV2q;{
zw>|fr2ebVx54L|V50;Ad-QvNBz#M^FJQz7Uz=P%O<-r2}JszxnhX=c$%2Llj#6Se_
zVBk91xL$wSVk9M=2TQ;KJQy8`WVt%PgHbd54G$LZod+YK{#za_72v^YYQFPe;G0`K
z7_+M1F+30E0q|fa_QiDbY8wtwpOpuAFmh5YWmS^o9Ug4@CmyVEn+FphWPpO;NBV+x
zc(CUH50<vYgK<6E;=#b21YHCKTRfPnInmo8fCm%*g$K+3&V$K+<G~bu!-Fx=?DAl+
z9UhF)7o1O^p1k}F;K8W0V-mu7dl!RN=O$?m*0mTk&a=F%+2O$;eBy92JP#HJ@L))Z
zA9=8eEgo!Le2WLO%>sC^m_V`0A9*ly^_#~c9keTVc(6GVvQYC1&OJO>)OQ|C7vRBU
z_wryM%3U7JaGM7U+~&b5EnwUL52hhbfJ`E!+~UDv0HQ&Gh~YOpm@N@Kz=NTI;!c1E
zdj#-cSCrGXd9WwDJeV>R3=*FIw9A8G03Pf#67n{`hD>-557xKMgF%1b!5;1MU`ReZ
z4>r8RgQWzzX<P2)!DR3}*voAmY?=tp4g+(+c6l(|cOJ}jn+GHN#)IA8;=wF<K_Eo7
z*&ZHjg)v3xXC938I}gUX#e;=Y;C6X1^p8B45eCr$@L+JN9Ud$|0tDj4^I!oxJXp{+
z50;PT!4|*sVA8TA`+nlVhA?6vw8Lx-`2{q=5ZH^mY<#vn_JRUAYY`3R5KW}QL}H;G
z2(9K(%SZ&GA_8?vp^%Iq$Xq6Yx6}zezfB^w&=!TdjTU)(?#Lm9$XDDz4><<ZT=U$w
zM3Nk=Oo5>$$B?PP5pND6di;3}>-l8^^gw8GXgz!xl6J4w4TmOy1wbOIXyv47R;uoK
z`O>&PzVBA5sjXnytq5WS8w(vkc#0zf8^%-*2q}_~MI7oCD$@*AQ%<U<)2h|<z00VD
zl66RzPLK9Lr)Hsj6YT41JnAfC?kaK1Ah2jsSvZv}h~^!H5?#^zT9#%(md2A1G%tg2
zB>>r~Od)Czs9MA@m{89Lj1zYRp#`-fClv}$5P>WL;l~u^_ho7JBK(KAHSLAvjGp^P
zt@+RdDY21)-Fe_#cp*$~^UNicLs?B;(vghajc(|J*G%?5A;;LNWuEhn_OK;j-xk8$
zG-}X|QQCLG$SN8E73i!V%Mu`j`3t(BHG~hcbQ8NhLV?iRLKuh&5W<!T{QHOr%h3jU
z{%XxKT(Y1v+6F{l>vamHtfCgUELyi4awxxLO9(5&3t@{*B-4Hd`FJ6$;L)xSRt`F;
zg%`rK^>&4@wWCZetvM8RF!IU}MUqpjZH0<$ZfK%GukS)wSW=6;e9M9OEg>v|D9*c)
zm{y0m^+~aUW)LBWxVdDG5KW-GC4>bwEBVTA<|-1u3`M7t`{9MKKpks6$!MX-s0*Dm
z3s3mgA$f!#B7ThEP5A<DcuKm)J3=%F_gx6n-4eod&2@|Jm8xwEVW)Mo>Xa|&6%u$5
z3Rj}f5TT3j>1I`Qy1@bpS<qthhgy=*6K)+nR*Dy~Tt40Y&isL%Lx2!Qs$%ZnAKEf-
zshidq19tIA(>@p`6zQDhCubF9Dyxsshuq+XTcG#z6+kYBMs5pXbO!^@m-lq>_#;*z
zCt=5FANbLPMKbM=G#x@Q74#rDA^ZGp0zw#)xQCjnLwF&>e8Epd5Gsxr!bpV}pHoee
z$Jh66o?P)SlTsli6bZ{F*3Jj7t(7Sfp(*qZ?Wf}u>7ZfPA_!LY)A<y@Gan$A)tyof
zIVfw;vetcY19{S=hjAtM4i^C-BL=%x=9KEoc&$&^uNwn5bXg#|Ge@eIPpt7dMEbMg
z*LPwkbGT1k>nERieqaS6g7m$teA7eOPs{e^T^Qk!BPXOU8=j_2Clwlyl|O04hBQ{E
zRf7e8q8X?*>bFjgLfN88Y(b<vk#rtthp-M>0tM&yhFk*RLRwBT?OxaV0Z4v}=z=dP
zKU!nmpT8Mhbg$7g5KLYUVnIR<W%=YO1{}!pVJ}f9o(D1KoaD0`C}$S8V>{_LcK3id
zXp?AJo?Hz?2tu>etICGmCDucOy8&e$bW1uC2<&4lsSsJv#T*~PtRV`cXc!|pfklFM
z^vO#_lCxPukZBM|U9NZ5kAM-4-VeVMBA**N#A`A1yqiSIk@S8)DU;VwRqDwM5kTZX
zzmbY89365??fZIqSm+>}h<}*oT?wu6>5G%PioDT``JLE0qTnz?ZN>t4je$k#O%v6}
zFNKN-`Hc~95+px}u>1K#YlK!0gxwbG92q31C7w7P5SwmXnQwe7*?-CeO%e!pl&z4j
zBZ7p9TN{C)9%#~`fk$J;Q_qKJg8J8uF%Tm(gt15>4t;<hLmY>8KtQOB(3`~OvP_>r
zuQEU;MQ3S(z-0511=rN6JwVVn5Y2nP!uP~8bT3HbKxB+%ba5aHHy={Q0znVpAc45m
zBM-!(=_xP=j6kGGkQZk`)cmc2acC0gF!Uj@kQX|AvL)`lEZO`RRJ`nzBItn-Jf&V4
zVb{jiEf&K9qJQ}0X@l7-KXeSQ4~W0Mt{<LxkW#_+MO>h9QnPexKY80VLyilNW0U=d
zZ$1Hm&|5-Sxr+7};@t?1{y_ghG%>W&%?LanDnHu?vCfi@Vnch)5fi6&+^s<0zjqAE
z59%~|`7~OV!2Kv$>M*Eg!Wf6fvVpqmP$3<8g(v*+LYS82CdGBlH!<Y|=BHyGPC#(^
z0YadJbHm2aN@B(lv8h)y`r`>}j~#X39F3htl$FqC87fu~p*Z-Er)8NU@ru<jF%;N~
z*MU5d#QZNP2F&#?M^lMHb61Z0DDMhkT;GMT6Z8Qm`2qnU>^TqV;cr5i;P}C@aruaL
zUA^(4=q@%!5VdU^AcPsnqL~Ipm~GB7*`Wcl(bZgnBfQEEbovlKrnF&82=h96mhmRv
zS2e;w%ShhHkPwWsGGQ4Hfv60K3Wr`6=@$BG>4-G%n(Z*1f9sa@O50Dea`8zuEBd|{
z$Pq@uI|@Do9p2=z8m>sJ;Of&?;)~Qnn)m1!A@o%~@<gIiC+Je^**lGhVCqn$IZ^p&
z#Mm@J3Zz|u#3i#!Cp?l;H`InF=olYV5)i^9`?%u#WN?JoC`_6Yp|=(WiS!egKVgRS
z%{@JndENd7^d?f7SOE~iVBdtWM|>UwZ3H&^Kcj_BLCAba^}0!|uN4*JYv!9aG+2w=
zj43zq92#&*LJ>G@alCA)01(1rDHR=sO)hJ{bwi^syT5h6ZbO8GdtPrVRELw#PtYt_
zM73L;+!Dg--k_+xM~T?b6{AuYV?Z2)rX@MA3)w)yiUFaWV$iRqOq|2Iy#AXGH|x0*
z(UkmXF{5{@l*4Qv{PGn*WEzok6>k#5vAQyp=Hhu#({^SmM22w$YJd>dN_4MuO9(Tv
zKfQW0RpsUbUCgIaybyK_XCDGw0JnuO9L9aw+Va{5MEkjDa$6|UADr3>ZbnP-!5@d&
z^z*`5UTQ>2M@no9Ve=L^KQw55R|pdt{lr$mdFgGF5{bZ6iwNPlHknbOzBwE>PJ$7A
zLHKdy>^xM<7~%Ou-or#22VyGI{6GPM=G)jC&eiyWSk5<%*p%XhFyvvn;qmxtIRXtU
zM?LVcsof=>%G-4Qc7fmomU#sBx$@M<O+?GP8a=;#aW8_W-??jHjwurxZVO>J-;aOc
zGE#VxRGfW=+-`U{J9-EXpg%6Bd`uj=ZMs6|TRxc+N5UG{t-URTsa$|v^A~Hpnax5t
zN$*0?wJU@f%-j7nVni2Ukz1Q@KtO&)jZhYCS6)$H(cZ}JO5^E27p;6rcmWanzB9V3
z?1hD~LQnfwOB%bQm4sEgfDk7B&UD@u{>t_JqN~e?R~2k{A&kRjcy+&oYii@j2S5n(
z7enHF4w7(GeD0Ed=e8`D&I5OpB_c4jvxHXa8V#!fLYN0(xC{^iT&0|&rr9Znj2Ews
z+fh&9g|JQ6h_K7$et-~`Vw%V8>FhJ_7W#HE<Ey`AH#8=~c{MZ0@pORG3cXL@mJk*P
z2w?%Ix&wBEuxFP@-ur=ULDY<G1dQ)M94?P@pRk3?6LpSMhBOzNprPintetrvBap<s
z#|P%eiBr)v6;IBKp}jh-MnusBXf!$FD-`r}j8qptI|v#9()vLNLjyusZe<0e`)n9+
z3`@O09%#G}hV-E6ab^FqpaxYWZ$?Mt_>~<**M>YX_3({2YeU4ZmeQ_(i*6!i#0Vxk
zlteq)3#n2KftwG3E;J9&lw+uCp5HF@x0^4$o#Ru<0^X#G`y9EZby>_~+CRbqdGmsD
zYGA%EJz#6<pJA^7JA-q%=2@`4i=hE@)!CTqprvE7bV}y-N@$^I<Vr#f!?kgS<_6E)
zWyl*YdZp<HH%Q}-zWSJW-9PZ&Frg8qE)lfw8f^eY!$5($P%73yNhG?&Edl~lbonqI
zNI(J!^|0+plO;zmU6m~(sKF3G(MI0B=Ab${>R0@69?I7Kgb;p3M%c_ap%3B9Bo<W{
zOf50>h5gE&sn6@;5E7?j^iqQx&eKy+@WU|u>LJRYz929tIskNEUPSqUdAFP+0(wzT
zJatfxmjw<3dI`tD*dS&-HZ;g_AOrzA)BV?G_gkRPj#gQoK?*%V+R8_vwVXelnxxTV
z^e6*~j;cx1j23lVm7eL#K2>x*j?3@qP~rLKxsGcxA6`7UviRY>LMglb(<@zxVa^^-
z-mM#vK{qS^l9L!r`SNu@<JBBrUzuBMj&rcgjg6XR?pGU%t4lM3Za2nO53VnNdRsPd
zGUWDn@5ubqfC06o15c7Hhc(p{5pl95HMehzmb|&5D@L9mqa$)}KlHBTBclOh5js=D
z5J}AYeeHH#`4bj)RX}=3AY_=Ovo9!#D_p(aTtyRpU&oCr?Co-GEg0mY%n_;1?3r$t
zS5U?itzFHn5q;FYu8#IFkLwH19-SsDm^slV_8808_TzQ?^d*NI`HXSCT8e=VKEd&>
zt#bF{KX7{POYxi$FguWw`d1{vi%dQ%r4>Y~oSN}@n3;$oQjI@7lKBBo@@->57XIur
zBVz{^9^KD~UzIJhySh>D4}I_;`-#1S`;k?_M+Gyd$n4FuaRHAW&m{CqM@(BL$P^d)
zALc*!;p(H@n8GJkFr!`p4cE3@vh3o1V=s|XohQM<Wn(m?9kefl6>{xxQC_*_tu_^B
zSwxHBFO%9~g&#7F-4P;HZ4-%NPd8SJM4o`j6~$|bS-j^XXI4i?g)L5IlSq+wF|l!$
ziVILx&PGklJ1M^4l4u^(jeI5yO?>q5#=eJ}!nUnK6^gHf1+?K8o!x8RbsdO*bZ$yf
zua|Xl|4l_KNpvKU<UWNV$}gl%Pu{Od^~H8ZKI0QJsd}4s>O#l;yCz<aBOC%&G?$$Y
zYaw3JF55C>2qr{zq$t%v9lM;`hOorhiL{7B*-oqqgsEuxITeTFqoSfiUB&Rg``#~l
zHTIh$a}$*|;*KOLxeQ%gamp)>REtaVStvL(i<I<ZTlPK|z&6qB-^FLut{*0IcbT9u
z%Xzl?Y`eAhMum4R!6C)`XEcYr5j-DFO;}J?y;MwJX)Q7tKMGTq6_vevO(56{RXPeQ
z818A75*03Lf9W`{JlQ@{E`F3}BqOz9)!@ZuQliMo=}n@|jW5*ioe1DWhC`g%Rv=$7
zpL~iNwzX6val}e9ku}7@_el+g)DfoR<P5YH^s=eA&nj9;gNE-t_=LkA>t;Qp&33sU
zakTcinrzA^wIC)n1U4h<4f(K#gVzE~lWZzN;$8~`PPnc{wiM}e*%m_^&p7Hn&k519
zI_4!1;eRMDQ%x<^k}T^uhhWUqEk3<`Mp1D(CTSzz2{g(@*88=iWh0?&aelaaB{#cS
zBjIFiL7;Om4JX%trrbC;LXn@qT@QZqm|ET?cb8KRT(u;_#kJS7l!=v$_1GO92!i|M
zH0fOLQR=L6(>U5{k}0{iRIR+GJDdfs+-zn{ly2bjt&U@IGnHsQ+h}92$Zx?OG+1bU
z)iJJKafsaYu|j7HpTBlt0G&rmQS#?|5U*Jhs^j^}uB@6YhnGkMi*eL*l@mw5c557x
zCWYu;mDF9<syz@K=_9_N9J}noM$Z(OEpfb?L9s@Y=XfgWOs0N<Z&Fhqpl2UyCt#+!
z#;?XL*b{WTIE}uFUqdRpC+uSJJ$B+oK1IRa$f)9UzJm`Aqk?;H7ZzuT?tjPEI?rr9
z^Wjd(LR^wDn9Nt^9SaIdaN8<6Xuc$hM0xD3B3h8}*f16%YfGSXCcj0;A?>)g779iH
z&lFeykysz`(GS5rk$9q<w4ue$m?^$Vo+#NArs(&Y+>Cqhac@bkdzFysV)kIwr;@zu
z8$#xULPNDQrTP8`g)I>ehZ-bH3&JNKnp|lb7?yQA-0yWEdY-dULPN%X5tpPSlbEgd
z;UNb$H0=I-4>da)R#chPBrGZ6_qnIEw6sdZ$?f6j*oRU`UL@GrYb}A9sI0v4py<WR
zvp#Pm%N{?zE##Vf)Z|rWDsgX>sJmyyi@A#j%DX#6FXxPoEqrjNdVePNeRC?M<eUq8
ze8gFgC0BWpm!I4_PoJH&G*DP;v|;mm2)UB$sye9gz*9$xAIMT5>_eCuD#$ST=6uSV
zvkSEYDz;?T1@2lI8<|xTO?k<_u;AP5aJO<q`YHvZYq-1}$jl=eg|Z83sU}hxX$;LB
zZ02gMr+rBR%l*jJ)>u?1&ehL7(6II#rglskXx25oEp57Zw_i{8uJaiZoi#rTb}iX@
zsj7>2R!SyC%QWhboxHVSd5TixMH-|a{+S4xU&HKCfud7P#-Zu<#*$1lEve0<8?@(*
z6yiy@f9I(f199s<L(hm+P;tHF0<+{p|7UNjUf#3gdq=A$zyFSs^wpZ8pkua#&Q#|L
z4!qUYJNrqh>EU%^YSEzJ0wqoAanSx;x18A%9p`T8q~5b*KB(nA7hw}*Dt*uFoHZ-W
z+WDr;!on+6Z2Hj&9UUq+KUtxnb1<*X{*t-3*@NQ*gE`zS6=1)H^qdcuixdu4b&BU}
zMpp_5vxL7Fzg6%>w#n*L`K>Sh3DQe!AA6w{W7Rz>@3X^hakUpwo+B?Ox5_{1^YZZ{
z&rDg_AeNiw9Rir5#ATaRML&(UpR-z{3XRw7l)4rhD&6v^taWhFiM`lcTI|+}o7QMD
z>PzN%*-g1_*D7n+UGB+>ddXpbr$w<vns@pJPi#Zkm$FV{-WoiWA23_92+<nriTFAk
zr{8(W)JFbY_1vYNrj*NBa244LHxyn_Klz+XT`}Z5DxG01D3c;%a>e6m;7c*KFMcJ@
z9DNTdPJ9%#E@4@ERpB)rLoTY*G)wh~dNa~{VuP-@-K~0&eDu=OgEvyneUw;AyHEA*
z-nFaO$GH<8-Z(gSn69X~y8m69S6RFH%O&xBRZC0Z*Q!Oy*T)furmdf{t9asYuU}oK
zY8AU)%A;>JZSZt;?t>S!qw44!_p8;x!Uo+cv9Ak=gimjp!dAL&ExOg9Ha^@qwEkM`
zhQs6QU;lc#+2!DTW8?MRF&A0QP2yBgF8N}I8JH?H7i*F&O>Warw}eCzIo%x_=J=wH
z%%!Yray(K|Nq($B6)|6P*(eq2ueaJ_MjDR99t@gei<9mEKg1#_8dE76&H5dKJL)wQ
zitosH6S5N5b{5y|bMWc4RpoopMZs=SGQW9uU4WCuosrWaC?hUR#<q@i&LAbMlSKgD
zDXjXcyhmu7kg?ks5zhI5)qFjklZhryu-FG8-z9gNQ#O){YC)OiOf)_2sA8Z2^9O8(
zVe0w{Cx<2d{`Qb;TSC?}AJ)J0Spw@OafD2^W=M?*&m`o!zGby|^m8pPr{a|Cc3(DW
zjPwg1F>hb`h}t)mJ^L=T><hGHkp}bIa|t(E_6620zK1L~TRMVZ4;_5^tKec26QfJM
z5y>Px*+*<Cn<S#h5ZRiOmoz2hhb4Q-MOGW7K45vEG~za|b^1Zo*d~!|O)mGQm}2F4
zoQ7;C%J=s8V2&mW4kV!8bfB?O3b%O_KAjTZ&RvyiQ99J&&;Suc*X}b9P_pu&cQNM~
zLY-*wA1elDtNCzdpJMJLT=sjF3FVfgItS&wCo|P1a*6w@A-8k7ve;LDwwTwBfo~ja
z-(-N&uC~`H9B-=D#*Fp9&S>VT%I7KVKFt&1^GSf_M#HiFa|B8aw;ZN<jvcuL%nKX|
z9TyL*Md-b8!kxQ14>~Z_D3^KfgM+qX=)J>ER;8ETIIN#jo-zW<1;|7^6OBOm%JFb1
zzd`X?2^{39^w4FgL^@3q!tCngS(}7uRTCn74wa%<Uic^#hnuqpyi29J6JupW#%D1#
zY5Eu8?9iBeF@`?outjj4#el|s@6C3;cGdH%b?5Etn!KMWM%d6N+t?lP)ePq5O2@F7
z2ORD6mo2uQvC>C<pir8}Tt<VHInx~;sUp0e$$K1uFRPf$OzuOf@Oe-<Q&^#9CV3h(
z_-qL;T}*YMxqlyxP@bui7e4P+h;zC*bw298eI}oMg3Z;!ssD$)`woht&+`X9<RQ<H
z^URR5B*|&WNhGNRMNmO<R#6dV$T@?6q#@@l0s=B*BuB|I<RpR^0MYr4KF_o1w|BdD
zw|l#HxBqlkb#--BS9gED)!+W~`_(Cho;A2lgTNEyw-ahs<!%Uaq3befDONGK4NkKY
ziG}ei;z=KbUJAVJJVLDZh(t?tK*x<_a*_D<qm33sp$aixK${w+(UlXxoQL2|Fn8g7
z9RlNCt#D5KCuAVJ2tHTgu730Qm02W30~~YG#pVNwX*UJMchX7W6Uc!GBjR+I9l8#Y
zQG(bE%MA<fel3t}Y~MD2+!?=Xhq=IWf|TX06w6Xk+nv<a;z!}?l!wR*x$7>UuTjpT
zi7UHAd?_Hoqlz~4f>Ryx@!Rt&U35*VAOrMxW{JtwF2w-~>TrxJpwQ?{9RxH~YyzlW
zgd2HHW^L|_pKu?XII;rDau2jp?VX-FIi=_skOlWi@I!)b(3Fc1FcowRZx_4xm8k@m
zeY6>uA>77gL<ia5^~|QVEaS0gM0(foXjt>LnmgD~@ml*k-7&QHu;jI8v1e5*ak0ts
z-9~@>q$RFM<rRC$&br9OmufrOl-mXsZ{iTLYUMXle1E@0MMpjCJFRl^KtT57aVfSe
z0>6aD);Kt{pnj2ZWWV!Siy`kJT0vxtPl|~tVm$bBxyre7`5kJ`=t${)RTsZNcPCQ@
zTb{N<I9I}sLbjnxe}_EaPM=fPv-v&G{=H|z+=#0|9|{q&4tR*2UZL6Ir-CK|7tM#3
zi(S}CRFa)@s$2%!D^NUmo>g%wz#`w^zCpLn`Lv3$DuVHeI~5;ngC;_=R!g(bg2Ma*
zKREJ-aq>huk)UEzYG?#vI0T{v9S@{-GM4d^KX1FQQ)9Q|n8NYc%+a*xH{EqC3mcKo
zN<|Dy9q`0S@G)sB1|?0_Q8lrGf_|{Uvo28|2N^ZjR?))sSQGAA2UlSSOa}IjcvHH{
zAznwP7K2>05Za{aOns}Dcw2PeMam@>JS{?pR?rmQysA&zF`&S%oi1T?Wk;R7LY*d_
zD)hk3C9OhbyJEd6U8N~~@Iz>6o|DTM8`YsrdG_w`cExIMnymPRF@||zjZD~S(7cgd
z+9A>yL$_O`O6jrq<+Um|f}i2i8fJGtLr^<Cx4cD<8ZpB+(i<AWS<(5O9QWjO+mCmX
zRrGLjDdP%C2Ob+;iQApdmn#UBhK?>RVWz3QZ8u}acS#ryx97m}anW>CJARsAPEEVu
zh(VQ$&VfSDq+(B~l#iY33IM?#hG{R&ARgb3b!+J*Ue2tddaDNN!G=;sy)TW{Q)vRo
zC%}0>9=2^pu@51$iV(&7ZdR*ZrBz*zMdp~n7j{MM#$$&)x!-@503mwRxuq;7swinH
zFR}K8cEOH-&Osl%E>w|P(DTg6b0;zd9S*z>tr1MvQ>-G>cKxJwVJ1U+*Z;uBsY<2E
zEgN06AL&Nt-Y4hN<#DGIS1%qmsN$cxgU#IpvP=XkCwB1b8bF?uz>$*~)wJBevvz!!
z0<lZ4s}(D&$u6&5xwyj?etB(Ki?<&@WiUZ<%?aGkK!=quCqkM>Tqf^#94}IpSep=I
zJT5J%E`@?ghPx!b=wG~(G;?eGS@sTDu_||ys^XA3xJgy;6x*e!Gwrf2(f3@?<I<?e
zaR<AkkuRtgJQ8|}ProB9zC$Q=CfcPG^`4~jgEH6knIi-dMzy!(0~41g83~e<_6<zv
zCffxs7Ya}C*Dmnw2<{7>v?{ecZ`_hS>iDkJ=za;JeO044o}?5rO=9}-`JK4>gHSKF
zzQo8dinM3S-09QlSG}fsjn=eO5bMv)*IoAwYOP1^Quf{dO#E!4w>?<GZd&UKm*-|>
zS7Dii8YEGBFjV*rK;(Vh2WF|Anz|Key^ArQ_+`Gv=?>{)RhfX}q8h1(I`lG(aL<o*
zSJBSbQu5g~js;dfieA!9xgNo`HL`P&nrW&-MO#<)Q|N^;Y@Cu{<Cl9Er)m0(ZyP3x
z+<O)O88@G9>Mc!$%cfH;-^O%lXb)_NC7CX0DRnnGZ8f^RzrQ$e!PUqv@I#{qwTvf8
zmiwd@8RHAD3o_nuvkxSSy<b0N6rfa5&M_Cf<R$aszPrqWSKva+GWLG%-E|Af{X3U$
z@gJPHdpwYN{Nlyqp!!iKq*Pj!bQ5zxXR+VJU5i&T0bgDO=<BNwntHbGC?Ly9=7(0x
zz64y54U+NAl=8V~0KekeIV2@AK2sa0&=l$}8^)!r?%d@!s7h&L{5ABwkV3T8gQm!8
z*{Iw1^k#YuUo=IJ%Er8Dig_y=yVVr?UN-JaQyf+{o}@XR8Y`E;*qi{7OXO=#ydak(
z)10Itm#p2Kd|58#T64-xxzxMOsqS)5A2dG=kV^||PK%REf7+a$BbQO!oKY?J>_zjl
zS8|zs&6%TeS#O%N-pXZfHD|w<%lXorgO$rAY00IQM=`dbAo6*9EqNE@^JQA{Rpbk_
zTM91A7hY>AyeVIFx24EkzW6~)ae#bDSW8KqeCgAc(j57+;+C>%`SKSn<*(!``dTVR
z<tyK`RKAt3+G?qKFJJwor5Y<=L-MkQTA`NlWi3RZj_+mN1%>)Q;lXZxt$ZBB?}0CB
zL(mxT5;#Gi)KAP8jHJu_+WZzR*dN*ygvABXycI7&(s`f-ZGu>J(DaLNo(eUdZgewa
zpo$qjqYj#Vtn(#A@f01@tdC^132Oa<ci|*R(f6eaQ&$_Knv}2~laXTQ1I3R5_$}3)
z>^g8rw-)3&k}ep{rE}iquF&Eg*w?3cglwfNflE!b%A9od=f9*24^*)sU`#{G2%o<m
zY#o2aA(E-Ur>HjiwQKm;Z@7<m@;DHh`EqoNSQeqKJft<_{>?3yKz3i<rN2vDqf6<|
zlLztYGu2Pt6o<_p2c>5!DUS8dRV&GbKY7sKrh-sfULbxuNj!U3Nv=OAJ-1DT>HGNG
zX2lZ)ktQ@flX{2xx8|*LaUCS5FIH_h?y+0i*Xj4)){nIyI(X|r1oW8-7cyTuf9)Mn
zS6a{SYx7o2GV>o8?cF(6WNi3;e<hF(;J3Zz@A^^MHCTD{EuOrXu1e-trA2~WKIQB|
zb(oDhQwiLKFlgNy-Sn7XU=qLMeJH;UlDWTE&^N$6Tn*y;c;Y2md{G?&RC`d-$)$+@
z`YrnFR_mTV-u{J%{mI^)n`kb&&JKd$WWVn~1}R?<O69r<+36lvkGWbPH5ZE?(^djh
z&}8T^=>&WS?Qc@BIQT}}NGC<eqS5D+#@--Z(s8EYA?;nmEQN=kKc3P$7@^c77~YY(
zr@Rnz+dj=_481d@Oo+Y#4tB-TOQ)>s1afU_y%r2a%T|8aea|6syHD0uQj46UF{<HY
zJnu?;g+-v_n?@dOp$v_h*3V^j<rhWxEWeQPT4#bP#LY7U>4zQ+(ehm<O1S!gj>&zl
zp75c-CXZbideZZ=TePp-v3*160&YByO5(31W0nur8GFWmnf?iF4*y2gJE4AZA$x;(
zh@0g)%T}Q^=o!E9iq3NR;|CBCYaKb{{g%i{ahJ)M#s^pqf4|e?oi{H6AOZg0lrAAt
zXoe|8M@$6E6jorD$lwf#t5lcO@b&2ybmVK|OA4SA?Bv%_;k4xMVWp4&!Dupd${<~%
z8gkOtVr5rWkdXyqRDR-uSZ45t3uSu1mab0iF-uXwIW6u8F|dfnyWDBZuQ7ckes>bM
z8D$~`YeHD^`g11poJyL4IP^wx^a>6WdYPz)v?<BsYALli`{e5is0+8lI1&-(F&v_?
z!d|bGzn#;LsS>d#kEu~A(ZK*BbQ>@d(!j7(Jz4R7S^?RI-JJ?U>Ocm8&cotKh4Tn4
zGSM2j7;=AeGeXhG6|gDTV|_o&%+&Zw3inmaQ4x(8HH%Bnbxfxj$V+TG!TfgN*wHnC
z#lujB#D2W3SmkxOcask9oA@%64Va%#nd)!!v2xam6X;GCH08xBd@NAoaH{N?$+?2b
z(~P;YZmbartQ2<3!EV^#kt}u8G=$3qUbP*|xfAzEn@(WLJdP{Ccd9|%_uKd}*h{PR
z?u@)h$QF!U!K~{U(WyrAM(PcJ=FK#_>~#C58N!F%q3h_41my!zL1Or}=Ng%d2e+<S
z#5!z%wMIJ1obqLX-I1K|rG!qj1uE5&%&WwjboS9pF5r!;J!V}wbzCX4IagMFU+x5d
zigthuofBLm6FkecgM{;JW@LseLQ5v5$R_G~FMcasNP79oKlyI#!<RIi2c3C5u{A9k
zOhX}>SH8Nu?XDZn@oVAK8MV>S>dWz3BQ#zw`o7`m<8!Tw`OD(Hw^?77pJ11Aq(p?z
zZYg1;xQ^8Xm1y2!<9z)}xC7)rN=5Is+15hKYqiL`cgkOIJg&JyXB8Qkn!ozEVf3<!
zfgrkUC<pDZt_Dg3<`LZ}D2zLL?9N~)Vi~F)&)g4>Em9;C{8)eU<lK|<uHA?>HV-I$
za;*)>F8r9(dA9DnwtW{h>_}{3`Eiwx=z2#GHvu!O-$t7zF0%-xsAst8Mxw~N3<{H*
z!caYIqQO{{nD+)Hg~+0#6bvG`hm(M-CaZC`#VSO{JErL+m=enEC^atAU7;&BkAKp?
zCMUykGqgkp<iEt@v3%Ia{4JqZT8kj|3m__PJ(!-`v(RrWlDL4kKr;Z>vr)*R^Nlc#
zN1$dCigjMY;=j2PFQw#akR(K<BF#z7N8FXjq-f~H&mVHJc0A^MVvfGCuy{Dvh-`L+
zM0ciuhhaqb4$!H8`mBRmai%7$d1^!S;hg@>nXNE}NG-8o*=`d7e8%#oBpO=I;<w4M
z+)sSNS<m3Tf@f=yi_emFj3kGhq(5A`M0Y!(;<QM}4FASk`Ej{P0j<069*S?ODg41N
z;%GhLbZL=%GKD)8{_E<OuOD89r6d=aj3;q_<u6v*eUrN(r4jh5G@iMeo2c4hLgpHf
zAl{_j&_@qrRglQk;zK7+EW+oQcFV}jT9@xDa~-VeC9P<Hh3T_px?;KEQvR#sra4}L
zY#*R~!xC7#Xz7SR24%Y$Z9$)qcJTW3am6vU+6FP<kpYOY=CB!hPL+;_+xyUpU;1fR
zNMS}^h5kjLxneCF{`XoCtAGZ2KD9`QUoFOB_$GvEO1|VeN}bSd7JdT07E0%WTJB$z
zV{Ha$`s{FwnG&3fk+t1xhSL$ifR_5t&8{bZ0*_h{MbjN+KAv*7Fmf!-yd#$ixUvd6
zoZNA7w6a=Qo_SyoA{6n!kmk_m(ToH71R0WF0H@bEE*I*0A-y_+WEr`~Ze)5<()8|{
zJcUlU4k*_w45c1+wMdRvnbN4mf!KqaMKPMy?TLDe?Tqb5DewLECUx&W#AndmAT&P%
z#b6a~*!p~=7c&qp4kdKD-$8oyFpzm@#gIi(FHe;d!Ft^`cx9E!)<_*zb=#IYfT<fc
zg9(BSh1jGebK8TCA}tngF}`BzebTA*yuji%>(_l%{-RFb+l#j$Sf+kBL!G`xEgOWA
zc|iB-hs1OjTVJ210prvU$)(rrgl;kqTFiV%ZC<py5WqZS%W#}FaNYjdA;GZ1k&e!c
zU;LAgpSWD5k280!-&N>yNip{9a&uA>?9uJ^Nphla>RKt^{k#XAJ(<a3UUJY@nO7?J
zArR3(hX|S1jb;<-=2A|Sa<(AJFiYfllxjpcjb^&^>Zh_Bb$X&iCc^54o$OWK(aIiJ
z4443}4XF~dC|O2R-m;t&AL<b8?N|fbhNtC{P6!w)rZaw+)o$0aBX;)#@;D*Z<??Nb
zts&|&4ZJ#qM*~jYIjl>z_b<XzH}lo#<|!PkEFlb6Bc24~<=7bCW*S1MT>c!C+>nc3
zS5gDhzw*Y{4N6gbIXH$I?*z6DO<{>W>J~Fo<9Oc-nQuA{ry7u6f-#=<r?k3}Zp>Sh
zuYe(KfmHrRM#393n#~6^mAB)|K>3se9j2Y^_O#rPCjM@(SoEQpKYx)4B1FaDod&Ji
zB&Fa}e8tqZ8m=U^J&QN;QJ21JJdx8^$cyjmoZ60Q;$MO&UwC8h;?D^W&Vpd~E!Rhd
zz$9_;uW2)_!@CL(%@2gzb}my4O^B7VKMXIWnMdu+Fu(QfTf3ifTK17XBac|pM~KSZ
za7@kX36bQ=Dh!DUY@GCorY7ZNVZ6CU?_i9|$+3T-SY}Y2pCH#>->x>*+?h>u88mpi
z-R;{d5hDZEcMSqLZ5cXlIjCWE>8R&CQM+W?YWrrLjqB1UD_W7%HR73sHQ1-Gaw>{Q
z(GEeE8=uw`s++~+{g+T*EJD6Rt_T9<_#oKRH?KrBV{Q;Ku7B6tf_|rlbqWDc`7PX>
zt!Eg(mr*<j2%pOcpD!L?Xbk_tU*y58#)xi$h;JJa-;F1B9wT-Kk$4-C++J<HKSmM&
z!q34lxFLBD@#r6cAcrVu1Dp*pMw$cKGeS}NB6wGAsgmQNk!VI>9t0mln+u}o8f!d5
zk$9>>UVHE#;+QQsD^QKCqy{<_Pq}o+{KKR|K^pKNWpI`=6nhyCbOC`uaL9-lNE*&o
zV9Rk1XT{-Mn{bu`F-jgBzm>q_XAABzqCKLf{Demykq1ddkrvsId*0#zA?c#?IHYYs
z=oPBBVpJ-&paC0>ZY1?d2bDD%2LMqh!$3t)4nGvQKNsqTN6}%!fJ3fMaw$P*Di9t7
z+W@6$fYRc=tAyO*@WZggs6pm!7_O>8_ElM=6WAc`91<9E%1*|48`dy2oTo+AF3vXt
zqm8)5khsE7fFe!?F_3mLM%pkGAW6DmH2t|OMkwGRj(9;(N8(Xz+Hypqh{;xIi)_fo
zJeh+4^nNJf88i_H1?;e)GD4EPfwRzoAv1X7usVo=3HTd|1%#m=0a3q!v(BI)bS7*#
zHmw_v(yo)b5Ki8147qPYL;r!-TLLUFPW=k!fx#iGwj3<uO8yeu4s~qxb?6aKTB=Uk
zrP~}QsvI~u=#D3w_Xm0qjFxkpF%`}D1jVilX9Zzs^XkA77?w3JQS6=s-(5T~Ck*78
z#|lOYe;J3IiL;$T`ABFee87;vT$XMW*Ed_{0}l?~L~<?^xCz9_c+Bcy!`{EbFec91
zfC7K7W17LxHi~gbPe>Vib4cS+czLoFVx*3|nCB79Bw#+*PDT)t8c+wZhk-yy?oTjU
z#4-6R6nH+D^cz@q!G<{-NiB`0I$5Em&Ev06;+?@TO&TlY)Im34G(KRJY$P}JD&4zW
zy5|#05uB`&D6kP8*bffL#skmW(5|8(1!$`N71{zAE$#@LD-4GihW!;<1~9}AkDknj
z{1cjSA4>aZlCCEa+UZ55jHGCX2|xB!-?F7jw4uW8LutzJNO1SYT{Lh3s$^`YIe^dv
z!^tZoY2DNykBlMqDB@j=7^a4m3l4EZ5qIOM;=rsx1S!TtQJj`q1}^>$4rv{ee5eYc
z@S^RQ<grJQDr1;uaD-k1M<kNE0IA>R!#;xo7pba5!Ek-&8g>$-xHIpEg7E7Vk^o|1
zA1Jx-=zRg4o>1CUTO2~glDH!L27dV|oZK3zecHj8n9HPkiyeewcg%yhB#H6lnY^fl
zbfefm5YTS|C|T(!+&(IqUgYnFQ3mFc2HKGAuP|h+T$rn6D#G2`AeD!?l=vu$G%=dY
zBw;Y}8Uc*5!Iq&2p!cpr(2i3WyJ5`g3jp7trKft%G9^X3iK3jxk!5H`!U@J17>!$l
z$t3Odo{KaMFw#^My991a9*!EKD2ONVFp+pZ4pD}a7u0aw#bf5eqwqIVvRh%u_GZ*M
zV%SCM9U)2D(R!8Q`udYpbPbf=$8b_(R^F?k)Jfp*c<^M0CIR~Lf(_%z3cZA_iSsIb
zq^jOPhq3bt91W#efKp0hgg@Dmjd<Bv%@`*E1T~Mj)W8&OFpfhQ^%FQ#1kTce(fZ-R
z%VGMAwHJ3J%#Pp;<Z6)AMn@bNc7(bilL~Es(Ez*|jo~g<C<`k!wgwD+1BRgy1hL1^
z9wxiKxTxWWq{B8Ifv%*uKT%_w@}kAZ?SZ>2NQqM$W(gGKh_lisTV`CT;A<dd{o?74
z2hIS{rya?;uUe4aV)k93<(Oi$wk7MA0M(^X>(oI$VvN4xL8LJ^E{|VN>bPg&dG#xb
z<2wzXOM((B%uG`X6mG<dkEYT=lHi2I3{$qSPtZeKDtwsT<pgSc6o;Fw$yYqEVJ*bS
zmVI7=myU+MAD}Q=OM2&uKo_Gz4+=bF%If3I9EoGL9x!vF8Kq%%ck>|1Fq>B}Qfmx@
z?}}^Jb6h!Kn1_-wfbaH+|CmK`M>2haQ7THq+L08#s^r}hPFqr-`3_*AIOs%`tw@y|
zn<-Ay*+3Zz;;X!Gsvt`f{xnd;TzF7|gOpPWD?wR?VfIY{8=Bia&!ueWpeh197D%S(
zJz|*8g)%-cQ$ezm-g5uS5b3SPCSl9K;d9mW4P?gCQTL*{?lCjIEgR2M;Wl%RQyXiU
zIu6%7Z)#eI=?B*Dp6uVHXl9yJlAwIH56tg=iDktwN2;>fBT1Go@=e@ljK3;f%fQ<t
z$!Gq6!GDs9p_VB!mvR%Cz|PEBdCZUv<4}fQ#kq3Uc%C@c2PX$ct}vV+NbGIdGgjz>
z#V#EmK^BZ4EgxC=CzFlm0w8H&JZfqQ#ym$b+9Fj}DigLx;;~uvq=IH-dnhpW?1jvg
zS;`m-vd0!Fr{l6mV~j<)3|KGbzz)XmjY5ujoY*Nw4^_56#EoJ`NaDjtxhCKy!e{a*
zB0nwL@m6H{39XxLFxZy41A6!FJq9w*$XAC^U9(h9r);DwkJ6hQu1N4Tq+AnVrcbmX
z3%$?Y00nleFzlQdy_dcJ4slI#I`*av%_@?@hCU)9P?@Bb<#U%O7zSd2*_GRJ7y2;U
zSQe40u^?#aKiabAHYg99vH4+GBW=C!;^PKdvo{h^FD`=aPf%^*Mw92{pOS=!eR1cn
z^%ZRoS7V!B5w5%{e&ZTT#)?3CQ(8F+!p5X4gQSR*<*RN~8J>4qSP{dbA1PMP0V9s?
zZK=|I#jqLQ;~nxM`-n&42Lm36Sv<FuNN-}l({b5uBBHA~TZomn8<ukukDlfuLm(9B
zQ_p1ml*Gx#f$M(pf>>gZ4gAuA$s4?spbjeGWbd5>sGlY4Dp~>}PU@W~AnEzSJFyY(
z88i_juy9R3h*OYYqxBHx35GWYB+?v#n!%hcwKOmsS=oAzEY=bS2C5d)Wpv#qi$pOc
zLMfv^vd&~sSk`fzCy8}gvG%@fodoE<T9Bwtmneo_qBo=KGq15*rIkjp%q(P*Oh7U{
z*(1%^G7v%V2d>qg*&<e*M=~u(MhQ3aKvqQ%x95}{Hi_<$a#${m@a<m4O#tI$J&%OB
zX4ls;b%}5R**5kQIy8bJRGLo`NwT>D4)T`Pzt*E752TRc*hl0o*sz}|)Hri?JhyFo
z2!Na*C<1+%&oGq%zMgV)vP#mRTm<!mZ|AG)?U9L;ZHrGo+Hy>!+F8;JtK@MsVD!Bu
zV%Fd+-L@Pv@L?pY?i&wwZco7;4An;F$m9Cqw|<OC6Oi@mENaumlF36iZ}Cx1L&81S
z%Vw3C$1jrK^C6dZ2|MgWFHWjtp=bPt;r|sL>}l5Av!%Hl_W69A4VE>(*Tr6y1+BWV
z@D09Do3-%r+rkT_#oD%oCD=kw+hX6+;`C1~Y({BmGHYo=X&L=warDW;4*TK~`!f2*
zTbvWN$G(KK!ALn4PTAiMD6M>Zf+1gCV710jE-!+=zx}#|5m8=+WMe3mF~dvji*3yE
z*-KmOt4bWJn(eE6-<P!8*Dd_lE`DF7<=E(Ho7XlZbn^$FBZ=Lt2^~5h49G1_DE&EX
zJG}!k0^P=GVS(Q%&XJ^n%IqevZ5$HjzPyFZ-U@5qj^Nn3m%UZ3y!||T3x|X~wBAWy
z-a%RKKFr2ZT3cP&d+y8IbIW_!%J1*$l@Bx#`$_&g58HQgvbXa6clX-2-hbchu|8O9
zfA@}Kk6PvZm*xGh-#4+=??_(llD|3%`F_;gzH{Lw;koTQc9m_k@`o4g`|da`4DTHt
zb`u_OsQvbk5ps-K{&?#DNhs&wLe59cfPJ}~Llu>e7a^Y|vHOp)A2p$$+;g^W<Q#+r
zoH{RWYT6KgR%MU2A+CB0oPyI<Vb3nY*_#50TUFUV1I}?;SVzuT8{j<4_G@#_StaD_
zbI5sH&es@Kswo(WR|k*{&R)|21ayXjg?F_`>16em;9Oo)a+Ya>b86bV>%u<vhfqyn
z5>k7Ol0%y=Ho0h*eRB_6Y-b21gd<wEcC{ytciNL~+t^MA$)%s&o&I4(FM$fCH^qMp
z?M;&*Ato9yVIRoB&tYLEOXfAm6D5)#q@P@cm(wvm;<l)FG(;&dGdy`{2Gy*!b~L#`
zp0aKBjNEkOq+ECD?JKP*M;1l(RLO4Zsdw;w1BO+l-BzfyqQ&7#XP9RAA<4hTgS|Ld
zYJL3G?VUx|zs-Za{QPe5<>R=6(-*(;V9IT0pY|7$+<Et2{>p=?y!!s_{A)S+d+Q%O
zm<^JcBitr%1C8Cf8APSLopzVA#v@d2f>~T$lT-F~rW~h~^dbjM9W*Rt_EUV28nase
ztte4LlH5QX4|Y37dKt%qeJA{KD^A&(Z<YD+N2r?3IB5ckjrINs%u|mnA{co0PFS9L
z=y|wZs>q|-&{%7KQu{O<55^N`nH|CF$+?*qD{RsjK}ar1D9uePDZ3U968?A?C9mVu
zkGU<mZyOs1B`dy@v$^gO7!pWRHge%cYllY8E>mI`x%HiVDw((}arH=RVNXY@$F1?|
ze%T{6gbW4+q|OzS3A)aejmweFRki5?&efuk{Cym1;YL@fV$Talm^p!%5J_PhTb-l;
z!JVNCoHkfg1#hUlKwzPDczpEpSq6dWT;X+_ST0WJcnGkdY_I2qfZ<EGhU!kC>guxt
zg-o!)Hkn5UKDB{ZVC#pd8h_45y@8AjUilG>!kO_dFFJW{18EP=($_=vh`(YQyLbc_
zU%c`Y&SRXhPNyi=k}5MyUKB>Fq4<UtJaaApQ6n@l8QyN4YQ@aA(OQrgp9#GejlC#!
z6{Vc;y0ns5IjMMAm!3t9NA)n_c)e=Lw~st~nPbDFOL}%ejw7>n3agtbug-79W-~Zt
zUdp^e!ro}6`0BdDm=X2&TjTl=91j+`w{5r<t77Q8zEr83DamOj9|YXwfBA`@b0722
z*47!z8ORpqxUk-Da)9zwFL<V0ELY-`*hR6a=-5xHSWYf6f;eMGF`9?R=dJgCy?e6y
z`ogH+@#@8TASI3A<tMg%H&wF2Q>h;GlJYT)i)>w?j&d4i!gm@uJn#x?49#xy=$+Yl
z+^DhDwYj1<ZJk-;BC&f%vel??+iwb=Lnh55kY^~DWY&4*N#a&3P|qWfj(eE1gb%;l
z;n0R^AL=vvG}Fb1Qf_lL!$;4Yjh2ceq}v$dMS%$k_Ztq9+K-hyG(xlOdW1zfhX&gt
z!px&@hieG0%F3E|aX%7cJf}sI(&TmXoAg~eSwqoRhxb@H8W5_3^1!cTHMsRWqZ0?Q
zp+eWu0up7la+7-|I3BD|_O(M)Dj=Udjz3TuU1l_=qa{H`)UQhB6(218g9p>`{&*A@
z;Znc_iRjl<^GZziE8rH27%-rkh|6%{_LOJt*Jq&7A2CnkQS2go(C?X2;j-~iN}Axp
z@==sJQ=dQ^2qNMM^n3c!PPD#3-|Xyz0eXKU%wJb8M2DX}LkwRciBy@Pf&6K=S<&6J
z9Rn%)`qcjZ#aGu!M?50ErL8gx<u31}%YEAxljJ9nXhcw0eIL_Nx>c-z5g7HEIM)2^
zcUN&d9sQ)GB<F;!4>YkO<^O#nyB|;@|3qWVmxT^x9?1`WDS$5%>z&W`j^6?6$B%E3
zF&Rs#<RH=gd5AbcG>em6TNfQN!B8m`B=TfOw{##cy>}v9I>ym3z}!@y%||_fncpaC
z)-+R1rx?y&CK)L>neQ*oknI?%T^)Jls$O+07rTH&@N5+`e~L<-$E-kD#}zUEdu+Ds
zd;YJTV(W`OMLD}V>m3tZYhJFcV)iNb|M0q}*?*kI*QOj;H<w#iq+abr<b3meB%~wn
zUTW|~;alJG&3osMlBN2~?y3x`U%OLNUck;N5h{q^KT#|R(+t&Ui?o~`3431aA>w#h
z2sZaRtg-Q(pqo<u!u!L|&$)WKsO1`RFlW+@=f<LrG0zOwcl(;_yWerDMq!usr7u4c
z5vi2Zw~XzRDpzK+6ack7Hb#YBtC&c+{BY93{9}t*+p6pP2g}dUCwYvmpLnWmSA^c4
zQrQv@eJp=)_;~r-#M8F#7pwi-tW5B=g_~yKhe6t}E#5i#cIkPC-Nlby7J*K+&kK|T
zuX|de1I@di@Oa)gh+Z8CYzh~)uX$jTxyn50+x-?@8-0&$bcj8*bMmM*a>HuvX!*oS
zT=|24A8dW_eqa9wO|2_((Hp`9`+<xzN5Z$o&Aj^q`-c;vgEJLxi#^sFx?>-kt`uYs
zD!1^yy*%<v6SM^wO&`9`Ad%f>aBX|DcG&H+clP+pE%~RjV~EYt+)uMxlGweIT$bs&
z!V8o|7tfo=+hh1ny2-fjad$~ttu$CFExj>{vm`8(zIfS~(rM4ge!BAhCr#Tdqn)9Q
zsYb0bp51U5fl6_5-iUkkr6}hs$7i$0M2+U8H`s2)$)n|!?Fz+X-noqGJnFXlY!mi~
zZzp*|@<vVJix~c??a0Tr8_H6}lUZ=a3wIYe9lkV20pELQhb@0@mjN3)w{54TO|NYq
z)E<ktZyYWxe&^uqh&mSuWL50AdQj1LA=Z<?^CiZHZkJ(VoXD27?^5;-XWx-ha9mhs
zKlj#Z_vky%_^4J{5t-A0Fs9=ah2qT%U!*0X7eajYVQ&V~9pRU=kJD+xuv;=RB4Z(j
zKI=?v3)WS>I3DcYXTPQ$n{$|5L3Wz`(8~68zPvY49G`1Vv-a+iycF&>{9Lyt9&}S>
z#CEyrelr(q+^E(_)9ppO#^U;e-e!fxH~wA=oOE>oDy}Q6l;{e5{|_y5Ez6glxh)7-
z%95|GZtP?{R1VWodw$+pO<nfz&i(d}MSY69nxhXVUT|#em}x)m;YIa5{Z?3dEouL5
zoVUk9yBC-dc_7FB@U>9DX-#eG4y$1ID_>jc%OcG$n{f@~Q7LDs<idwf*uTBI_V(-B
zKEIP<mG6+J*sWClu#aD$<d$6DKg<OLoK?p?QEb3|JL3Cveksdu2*-mtU|B|F9>3>?
zZG@6wA0ULUy5o4TjpD0RB?yYyA6gj50m&F{Sr{7dC=5x>grw2A#@_Ei$%r5<2_$qt
zbX+rm_#)Maf=2m*xXo`|bO?IDZKjYClw0ht6z-+y>m|?>s9EAC0u0tI3I4%@Z3kbL
z)z@$cHVwb01N@Z-v+57Q;|(zbhR)lE-1y0Z-3<?|{1Rf@ADSv1>iClf^VSLDdLHT;
z9>)4P^d61}+YSpj34V|k76i0>4E(`^MU;fg@P!9&hhMV`kHYa_IuR*4mN6&c>9U3i
z4iQ<~5jo-EX(bW)vwE4p$l~zGQuEL}oybZcR=cPqvX(!p9vED)9r?mRvqlHUgGIIR
z`!)fi*$SiDb)tJ5qT|0Xqf4S!q@w$9JQy(M{+*~notVMN=<)EFIrHdA^O&V@**7II
z82;F@{+MNlSRI1cwUXF9orn!zT)T<bPJisNPMrUC>|uCZGiThV{<v@9p<mMC@N|W~
zZpYcDk<dW#Tx_(TBH}FoTFg*9`Wi|toD+t?BbtjH;E!ibmnDoyxRHhn?*M4qXuCjh
zYXTc706+}z&`9HHO(MZzLLxAp%`r)CH9@j81SXfr)0`-9s)=K~7<Dzcp@|ZuNfG8r
zG6Ts{iAlN-LlkurZMun7N)xr`uoUVIlxh*lMx^2TbIG=jVw@`};ruDe5sB9Z63OJK
z5FIIYrztD~sooJnmr0)*_@<gUroaah0Z=^kU_8!&#0QRXUb;`ibb0UVrs<|Vy=j)>
zIPg^alzbSP9Mqh4511NWn!bZddzu~;<ERlwnykg0%=eJ+iY`EVC*3D4{n<{&`gnS|
z05aD?Bky4fQ%xc{6b}#&ps-1=BMqxO&FGqAttHLu(0-<I=b0ZVK7B``&?!OtTuR@=
z&`#aVHxaD8x>-d}Gu0b13rGRbc#`V^<P*(VSckOP(rlu<tgX@qOLA0iEi{Bk@vQ_B
zsl})^ce2aVviEj!4#u;;4q)#c3gl>L<g5Yk37`O~(j0u8T6LNOZehXO&E@M$q6ZK#
zXP{h8(`a&0tnySOEtFjH8kCkO3m}T7ERRShm9Hg45ohJ;CdV=7bDrX612lMd^NiB+
zgm&{$aFoI$H<%ni)2RSoEPvFoK+_U$%>w{X#lQIxpea~jKAW$yn-8}vv}%dH7Fj5W
zBQ^z#=C=!PvY>3`iyY6Q?VO6fM-(}c6?gX+xt3+SvlKtji}Kbhe&bl|yIWjZQv6sx
z^T}Cp$ZiBuu%t@2B=mJjQg}&3S$fobNfJxsH`3Cl87zr<rO)QW;v!4EOG`5a%e=Nr
zb68SQ@@1u#S*cFgvPv?RlCrYev)qc^vLdqby2$ct=4H=cC%nigfAu=}<?C|%o$?N+
z3MKxEu8g>zM-{`C{sUzdhy4{JdX+^amE(_MCoL-%EbqUGtXwXsTokNg+p2tP8H16p
z+Szs8aH<*%ui7Q6uIjCN#}fUXrTWXR-LYPElSB2%ZuN)4>aV+z-_ELu7Ovn4)f6;&
z5)al~bGS$Ptb}FKn^M1)Tj$DK!rI4W;(ga@*~$HS@7-X2S)6ypnZvn`#@DC{TK9O@
zR??&H!q<w1mO8;QaUSw|8LRuf_gp2T3YDb@Si|e#&d%3*>wU@`rG*-F2VIh{HVE%A
zvz0d(li%7d(7U9MEml?tGAVy<qj81P=E~KV#f*3Stn?f4h;ImzHwFqeN?&VqeR)ki
zq|s5R1bXp4?OvlXYv4_x7ZJNux1PbRY)EUNe>D%b*PQm%*>~lx!pj$dyHw6KnoI?M
z1rH|FTBA?kZ1lWvq3mFVtYnbzR~}5LZDfy`+_vpaR9lJE4<2kusBJo`4ddK4zt^_m
z+&)U)zFOYC{<!_!%QhSkzB<@`p#N$Z_wN3z?WyUjuU}iw^A%1WW7{+&VCOGieHS7G
zxU}I9;UBytcCG<FifRQLuw*BA48pwt8QN3el3U$c5__y{i|EW|Zq1_NVpjJtxEIr7
z4&DlPg)luDimqmulE^umKs0)~7R^k-#c@58OPHN8nnUtBy5F{IAKj_0$fjArp}pVv
zl(y@#3#-BPt_#uV;4f^gQykD%HgCah6@wn33P-7Z`<pJ^w$a^stsEv5Yz`DXt`w|J
zF6cW$98kNSA+$b7xbxm3n|W)ueRQXn3x`K*FCw$oKa<VndOx3EfAD^9Oe;&EA6vL$
zUpA_*-?Q%k-Z$<!5Fy+fwcl-5(I0d^K!88c2^+{1b}!z?_LoPq6lQiuD-Pt;_i028
zB>VL=M8CeR_&RrSK%Zo=)!<fH=AhJ<!3vk50?g}9w!xIe3r*Jt>s<Oq6o)jf4<TLp
zxvmXQF7nQ0a(Gk>^-+wV@CM$t4h_@}5GD@1_8h@W99q22v9>?*q@sUaap)u4$jbik
zQ3c1&b+*0ekw%w+iG7a4*1-b5;f3pCK(Fr4(XT0<jP?olP_=QK3$uN{4y9WfvMwJZ
z5gC8)($6k3N|V<~cB_-~+ZbOZ3wh<}JM<`nE0pQo1hLYn5M}QX@kB)C7<Z+kT+D=$
z$cVzFNnzJP@oy6V*Gs;BP{H9zA`=`K#!>9-DT6<)d<i>UWIVy;$_3?t=~P0~4W<kz
zr}SN+*S_)eMRD2Rn0BOOG5yA4IXo?qH;tbKy(2R144QU|d6OG5BfqNduEgb*#pUv3
z=HaE;#|v+)>)wP^&PM%<2a}0ildD=&7+F&~SW}@|hl{SO8?I}*t!u}w>sGDnkE~xh
zSielQVJx~~YPfO5ZR1+(hDFte)yT$;gN>V1o3^5xw+%P#+&1sVZaP+NI*)9+9&EZ(
zZF!1rc^husbK80lyY;YY>+#6elY^}Qs%@m`c97wAh}(8p>~=)ecGSpr%)xdX)lP!w
zPLknHirdc9*q!vMoo6FESqD2gRJ$nA-F(B{Lbu)G*#GN181W}l_YZh@|Ep-Qq5n7y
zHW8rnmvykPKhnW|p~2Fl0&zOn--!lW%DwN8x?77%{gCe(RN$Ii(Eb-_u(IIevPT2u
zsk7xVag~oUDu;_Io7=1MR;wcOt9#aKV^Zq^yXuP48bUW3l0G$r_dYMpY>cdIe7*4^
zZKo+Uw>fUGxpK4RA3%fc|3-ry&2;U*8905@@nN>_U~ceiu4`z%Yi{A~hlRnZrTwKP
z%*oQ=#PaKpZ^x%shEG>UK4GTj*N*4cC*Q8W-`d#xx-ql7IlH>~ZhLd{^XB~5&Dk&8
z%NsjK=Q~TQyGvhoF&q1sll}Fb_Zz40x4#{3?H}!&eRy~H@!<UPhvP3FKA(O%KmClw
zVsUR6KrG-JDVt7BE;<NED|o%X2Gtb?;?m31sm<$&Vv=-P?61x5i-W31vgy_p3?%WJ
zmR%pHD;#_(cKdavZhg`4Gg<H5#ew?b(HzwvGIqU&lJR_<B*7c68%igOjq>%f^q!YZ
zmz&o+ExmqT{-)ZdE0SHmv0|>?;eQ?trt{a*V5@(D2DAG2X)u$2ej1FLo@BL5sJfkD
zogDGcM}wLCWg5)*&(L62|4V7GxW7PyH9~X$57J;J|DwUB9KQXJqru>RYZ@&42MtC@
z|8LV^#y@DVuK$k)bNOFFgIWC((qJVk<br=pgPHv`G+2pI!|!OY+W!y@W-j<Yj|Nl!
zN6}z){}CEY=kHI0Y5Y&4!L0sj8qDnPLxY+9U#7vV{vr)#^^c&z%>K{OU@SjrFx7t?
z4F>ub4fbbfFs*;lU>!vQii5^1QzrA2T2H9vRj0lSQ~s4SnAyK*u*3fp4QBSwPJ`9_
zQ_x^m|Lina&EJ>?v-&&JU}k?88m#fZp9VAjFVbKp|3_#rA;HypZ!N`7>t&-Vc*9AC
zSPkTVBMk->{1*)-v_F1Z=DJE*#Qy>s?AAXA4VL>yG+2r1?`g1_5E0}5JPmg3Ck+M?
zbg4_~`AamI)t{xo%>I2EY>mw5??!`l{f%j`-akWw5zzmqXt2KjDh)>SD-CA;-$#Q%
z{|+=5s0&Af#e%2<|4JGR_Gf7@=pWEvK=HpT4Ho~mp}{zXG@by6nEn<tSk*s>25bJ?
z(qJTiN`oc*2WT*=p+>6K8e)C~dyR}2YkTbD=EnLCaUt*t7r2?LUEmopKqr_n8V*=d
z1*|C25(eVgbhrt2$e0pc(NV>ArzuJ<=2YZM(?qn<o+{BGiRpj{3PmMzp?c6s7wDu0
zRH8~J4qui8yBc+BBnNr}i2%5;Pd21GRGvkVgvuA-=>VA1Pf+Jdc&pGN!w-J?SpKee
zcLNvkFaZLb``k-1frJ3xd{N1#ywf`uaLU!@<*lJ}uC9wqPxF&HiNGzpwA9q)BS?Ue
zWU?g!(i9Xj+*+qQlD8zmWN8Rm41xff;5G(m5>krg0>^PB$N&KDl3+dnfcK6vo+6k|
zF@aqSz{3Qfnj{9)1kzcwbD3%aK%q=K-TB`5kGPd=!`nPFdlQ2$y7D(KMd4g9<h@^A
zux2Y4HLOam_74}V|937Jj-lcGBNxnBtHZZ9;TIQdNA))sj9AD6@Y4kg@%j@Ntfa<!
zjOY(tFcd`(ZMWVJ7cBob7cBP=T(G_0yI?i{jtjP@&)odFg7Ak6hT~nXQViA#|EUWW
z9X%i~_<I-ZsZTEv;ZGM#^8a(ee1EuLm5M~zrQf+=zQ4I(RyY?-{x=s4?-v&=EA!uQ
z!HoXE1=IbV3l=2Q3i#oIB^j2K|KfrH#1B>aaW2^H;jusGf=&4iOyBv{1w;Mnf)V|2
z!TA5s1q=20%>|>wxnL#ZBfq#{fFCXxI3|JV7Z(im!v*90>4HH%jZxG5i3=7X1e~PY
zAWv(Uz_DQ17X%2GB=DqDsbvQtYt5^GE_FaZ;FG#3xN|}ngXGQyn$2<t=->yW1(Cjs
za2^YiNNJ^-o}|7-#1ND4-bsK{3;||p3D_f+_chjTGa+G5Qzc>yFdE1P5Lua<y^@_Y
z+{pQEIW6yW<ysq5`AL%dEWU&}iAFeyS$MG4NrZSVx7o!>t(a-m46$1=T(^~G@G`Dw
zzzI?O)i&?QuUwfCU=AksMG(iU(pVr#I%eJ&z-soc8uBF4fb_w69bEK%&aQxreHxWC
z1inqTdwd{;>`TY}5T+Ugc@5sJLjs}g*WSLkc>8fnGXQnGv6CH*eM~uC)K%L{v)>*P
z5U3)s)%B``VgNuBT7gjH)B;zP0TokVq7@z52mk>+E@2<x`8<#y_m5n#B|p7LR|M7J
z<z%ilYkmYCz?{~$xnxo={6=Dk66F)<WU9GkR=jxFQk0|8JSQ?3Pe++nKp{pcO!r+*
za^(aq9FQoIV6BfzX215X)l?z^Z<kHpAkAE-Cm76%RG=r;Yr2@c*CwF=KwSiT0s`^H
z5Q>GC(nvbj6(qwULwZ^eVSR+Z!$3(-RO!1ZM~8MIUj)-wXnnb)fzcSyG?X5JAV~wb
zKDVr}YmXKIn-5phJ0OT05aP5!q`pBk<_OY$Y1<V9kvSkV$QVmKdxNaz`5aFIQ!e1b
zSIcW35hMr%DQMgpv|t^+{3;7Unv3wXLXv`{`O*;J`alvR1O?QD?qLwA0~+KTL=@lQ
zSh7TPh(I+2lKKMTV`?mG>PW;av;5{_^ASri0B`Reg7_Aiaa{_jgy)NR-_)A%Y--Ea
z7S5J#0B760p@9IXM(1=w0nP<8T1@l6xnK?b(@_KWez;(%S)sGPcfn-Uq?TyM=V^4W
zPW|SBy^ogP{o#VOB(MX1xM1-=U9hB|E|@yb1#1G>>yyRL0cvnA7$EnD3x<vyzEJy%
z3nqJu{Ju7J4d;RxStLLE%>^_4>4E{~MMvJ!z;P~^9L@#fXf&+DxnK^a;!HnXFvnYs
zibN-7KV7h<wJ@9u23jQVUAcTOi4y06?fiKc%#0!I%1;+;;tyRg7F(rZj67n<P!%&9
z^wR}1|J4O!YM*B|{ON+({BXfIa4y)1xe7nt^Iu#r=N~Q@&u0w+-_`ivT(CxNe32h6
z7~l*0nBc)JSD?-4!m#zqmUsNkUtF-ZKXkzW7TjiYSey$+)orYVbHRWsqnhTlx@reF
z7c732KCPR**PIZj2?W{@=32!MJK+6v!Q4|v4Pp~03@LCfnBgxjnBebSFx0Ou7?I%i
zPZvxV*MRy5E*R4vxL_VLgCFdqJ|TpDx?pYVR%q`#RKPVBAA6bvOhwA3x3B4HiUm;(
zUd$S%@uRp9Q)?<^s|($NkKzv(%*P(rBKyMy^L5j&#kpWBt27wfgw|hOuuhx{c4vX$
zhYMEkiF3jBmg=)^*Rlg56vLuMs);wPnVBsNd5B&7y0Jf9Fo3v@<0;V`+Yc8E0mQjr
z<?9)-s7t@NV6#76u-so=u)JSfFr8mruo6S$(JwC87|sO?`@IXcy<zKmK-+pd>FeDe
zE?E2z7fgaT;l-29NggoEj8?o9_*WNf1+)BzE*P!V5zYm>v(>9i!ap-0a(wGGhm}zG
z{tEeudSh?m;7iIlK>o#q;&Ot<9zrT60MDR~3XY}C-E`EzxnKz9n|*V?xL_b%`T<N@
zdo#ez6z77?8t!;=w<iDMf{`E6rcbKOyr*s6!FCuC@go)^XaCd%JJ?()z`0-&?t%T@
z0S-T1Fpu|NVt;eNN`AUv;lH_H63*05LPc>d7%jm%u?ODoTrl-Rhh<Bg3ug1v1tW9+
z%>^qT>Y@6@1?%u;JE94DHxe}3IAm)nG(LE6i^k$N7Yw>%z2X4s^L)49={|F_<);hA
zan<4!=Ypm6&i!z~hz(T$KU}c#Pb1tvT(JBfE?6+Y@TUu=^Q#LMBRU5t@sw~++`_qF
zddE-39jSi0U^o^G`-=;fg>%6i-2+#=quv}B{NjQk+)w|+1<U=#1tSpz=6f(Rveo$z
z|KfrH2l0VBSSpXEsus4`7W~Hf*2llPV64A$!B&2C!R#*}9<|?@`^5zVyoCcSlDS6t
z{tXwb66b<7-H7g;#V`8J1q1ogG#|0O{lx_X#8(nE{_27e#9zWa4jNfF7cA<B3nmcb
z@;u1ZiR*_8)`xS!I)1ufO_Rw#U9jZmKU^@X@K4x;y?%h<gKyH_9ZbY(O~izeKm`XR
z3pBNB1CQ;HVMP%C6<AR5m9IIboMoFt1siONAt>A=Xp$gJs3!FrXY_Zx{%kAKT~+iJ
zCMf&tDWde_dDYI{aM^Sv1ifr4DM*D%HUt1f8UlcXBvd-gppJPt9Rgww*)0zZBmsez
zY=yaTCQ$^rQl=H&iYgwVs$e@@%mzai=1!-h7%$O<M?l9x0o*u5<CL<I2<E2T75uR0
zESZX912BV#G(kOno5EE|a$;h-@Q&BFG@*dqZUACH9buZqkZC5io!LlAAji)%wwFm0
z0}Pk_SbwNGra@UmrRu>@-a`ryb?~0WdgJhAGH6y1GxUhij+PkeqvHb_$#W2#F#)NP
zu8jQw4W?j_&<WZ9V;YRoiu&T)maTzaJ~o;5_3!-}@`hg*)0{^h1~}(mzMr%+|Dtb3
zTl3i~f1C4|Ew}GKXs{PA?caU>L4#R1m-m#3Il6vXQg@~~dnQ_Jwh0E00(cEY+-(c>
zMNYCNqXG*rnMOHKv=>tdrPN*}4`G<jqp&$6y*)2k;iF@DfgF(AK}P2^smoa$ZVDDp
z8#4}eoJ^Bllk@k${eZ?cB*TrP!7MVI_XL{P6W>Rp3lirKRW)gJneKA<Oo%WOGQqd8
zlc6g0Q-`F<`i->%3@1<;YR+f5CcK%RuPy8!YtR3n!Fu0Z5-NVU9-NIN%P5vm!3Xd=
z`qdGm)wn3n_zN_7<@gFydWj<iQ@y@iQrxw(C{iAFjI>s%fk_CKm6nlNWhJ!WXt2{1
zuM8&I6R=QK^R0`N+%3sP!xiPWG-PotEYJ1|$_1IbQ@ms0nRR9UEF#Z;&|pcG94|#)
zsH>@KzQ9CU&A(X7V0EjTb$Sy@?uy{!lMF5?cT8PURj97}vikDEtM3kvMLT|_!CdaN
zeET3xo|e3e#{D~_rX4P#A9-BWQXo~qO8r9Py!N?Sf!H9LXKOxZK!5}rS@&9GP)483
z3^DYK-TmzN67OEJ+-Q=d`a?>X(RS?}Ze;(!$i2=db)If#XXg!t-UT%ggID%SOQtQ}
z&lS(yc=}nJEL}Cmie>_#O{6>rFV!o$U0pmX24Bcukht&Sxy#$r!E5MU5)bbc{@&1~
z&APX}KPu@;I3WOe(O^u;6t-1#S*38Kh?=d@ylO$nl^f5##Kw1jR6g9umPGmOtZkTV
zEvBB7+1o6Cn6DiHD_dxGCh=yr{>lNVc}0$OuIVCw+uh$XIim$iZ%_|a(M*=>Re1es
zslxTF2@xrU9Hk+2xi9r0ntV_={{gF_fk3^q=n#$WeE}DgGQIQ~)_#!wRJ~ROd#+M$
z1r0=yDIg*!Yz{R+shBvCSvYHbhqe-^q~lNuN%qpAQ^*e!$T@^hLfgOr3|nI<W3CP^
z5O_*z8s16gL}@SJVF~O}=inE=?EtHoO7;Uki*>xfv8sb+6T8|l3spnp=pdC%YGOs=
zIcaZAQYrTW$oB0n5KSERO(cc`&5ST+JL;Mf=i|Yo3|&Npoa)5Rs%&C}2cd2altaD%
zN`{GA91WH~=o{ZELo<HKh?B7Ugo)4ZP9TY96O~}#A?bF)2-Um5OWY@*XVO#D^d%kI
z<o)?EmlQqaw{llq8xnK_H1a6l>7e<9OJxFDIY}@2zG1@J2Jz0?j4?`BjR+Bz>d)%L
zkZ^ae9hwslRgrq95qo1q?!9Q9?eNh3+|()hps3z|O4a>a2b_$KpK8s4AmY1f55u`<
z)-~S&$o#f8FS=&Hu#*%baH1t{0^sFXr-4+yT*bf4(@T05NOBUcK_=m=FQsJ~e;jW~
z_WCf)LNy=t=V`ExSq*LVUuiIr9qr3yKWQ+YB@O25NkfZsiPG#*rb4R5M!ZkBfbcXE
z7YRJ&s~=X1&ocWi+l>h*OaVwPb%c>iHAh@Bili0*szE!rc{o-O2D<!CU`swN#^8EL
zKLG)~y)kxjqrtP--3R5oD)`sYV2@qP4`u|P*$YNIa<ijR?&R0%@ATk!HW_AbOr-bZ
z6G3v#4xREDI*8i({?p?$P2Q5+_PL4QXfUg#nU0GRvm)*{ObJ$Ke$ZfUZZ{B%8xo8!
zJlWm6?=CFRH9%Wt+78@OqL$v_e`%i0a=X_oWW6+k%-Stu$7N~~vyX7m))K@i8@y4q
zny->8yUp(6aP8)7MUcnz?8rrzSxbKLI7cE)BI=F~0tJdDG{hSNSqxGXl5eskxrDs1
z7Bob*RsQsq&uFMzEB72WvV!u?m^PTooG{K9k7B}C^P*HgoQ;kvkTf_ZTA_*J$sqvz
z!UOK`L_OR#+*fHjcVF}?igJ>nd7vyY)cHI=gLG{&W-m?PmFQ3qFvz^<YVU{kh9SF|
z;MswlQpkQ;ZHUzrK-#RShq`N<{9<BpOzp?M%r_-7bn*D;avv&Kn#(2}M}wUNdXW|Q
zu?UizKmuaTd9O=uP8rO$&Uk+u;>-%v%`ch=RUUmHeMIWISZOPCP?SlMG5BQFe7brC
z$zu$=y0r~s%W3~XgOxqpt|j#rrpzabp#FdC-Dg--U79caDsm`7QRG+!NRS*P=PXGO
zRK!3Kk(^Obz$#*qqev7AkSIu$j1(Y(1j&-2K*>2MlIkt>c{<GWboZR;J~Qu`{<=Ty
zYhCx+`&#Q>>;Gfx2MtEtt#&N-YqvV-9XBz2Q&t06Gk%?V6RGn8MD3nwRg#8HJ~cg*
zyFJk04ZSIyU1(N4jHAJF!#**d*Vx5r6W)JY!S;p!4f_|Q6WRXY?3F~V7K}lfWmTi}
zt!%cMU1I{@H>ys6M+ne}oRNGY-A4#^$t`FHv?;1iLx{!EU@qytNc}lDe^u9`WY>gf
zqSOP!`p46K_{ou-Uqm1E+tqW~&F*Y0DPg~t)|_HIvu{7Y!Ja<gxb@`@JDbC0DuY1;
zWsShb?X~M~8yppH#}`T;4=O?SyPvn{>2ozd&){houQ-=fBhcP-dD^I2)9-BsnQ~5h
z;icdH#>94cYm2_S@g=6L{Cc&)PN;IzOm4>4z~ftwgp<V4xf4gzinFkIthV1<c<A>&
z&%0J>OOKZO?l~z2Djf_nDOMZ274cIsIV^j6R%l6dvsUVk?^eu2Pb#HtUShy(`TOVh
zpNgDf@H02Y<oR%!?S4}qVc$F6CvziDPghNz&iD~q)qDG%E#8<je=}hJtzG0?^-92L
zE&to^t^t%Xd2fHwU{6cOdfuLY{dRM6JqvsCnuT(CUKv1?-5{8C3eE;BP1d8xs%~Fb
z(D?{d%Kkcf=ggUdV0Kc}CnLW+vT?&yK@v!1rcD?MB|%x7#%GgIrX_Z~KxhuLzM3R$
z!O>tihAT6F1mskW?`YpH-DFI?qA%~)#={*gWfOSTl?}eybN&u%LBkFU0|zFX>Q2}N
zN%bO>FsUnb#xyg%;yVT`&4EgA^eZtGV@w3F&4MWg120k&u(8}vF`)|>UYVw*;znF@
zMmOV7brg#IIvHW71;-ZVzHv}fUW8N=>|zIuqXr>kMyV91`W48@ofbygGRM8pBYw$%
zdzNVZ<p+gvRftZz&{3PT6Oc(KhQ%N6xt|)}8&!y(HBSqtpjxzyOqPq^6~UoS?5htv
zrkO083qlPB$^@yt3f9H&WH-jeLP4v?MwE}J?<MjtHuYM&%H*=^szJ{<r6x@&rl)+z
ztsg@<AL(2skLz}ZFS3d<GCj_GTn(g*8uIeta#Cn-rp2mmJquUp?_sjmo9Uu=%En{#
zYx7=F=W#+4X$7(wU2_^SV9C(srnP>I!YKH09NFuNvge8hQj6PiwM^qlzaYM}rA4-r
z<2nwMoz&9#prvL0fdd!xQMc%|LQXfrrf9CK-`}Hqw<kjrkDuFubCcoJv|V@_a@wI~
zxMg!-!@^M*%}CkKsDjp5>r~7krgGwPN#T-Pis>8(l}XOivL@I55UPyF9RoJ<w8Q7$
zz+)0MQ|D|`XXaK*NKkLlTdqcs&xR_U#!0;ja_?0W%O>SNxW`hB7FxkyC&+hC>R-K0
zdO7g^4@YY4zVa)>nNoEYCtxadz6>LevuV(KCv2O7TfVYSzLZZdZ*RMub-aB-zND9p
z45u3NING~9&k2ctD~FOEoYy~(&tXc;csi`w*(oQ9=6$7JK#LG5zkfFXkJCnNc_UPX
z#^$arjgw8Fl)^F*(X!ja57KA3O0R-E#Fxp|i0mFO`QTiz7q<2}%MKUyA;@S+9w1}3
z+SSSgat$^44lOah`%jL8B<WRe4&^Wg;?dsDbs70AU77EcVe{xVP8`U4C>ZT5XnUi$
z=f>B2)El1!Mp{h~A7e=$?9l<Q+J;GjE;zyYIC~!eD2#miJH?UugoH6{T`DZpG0MF_
z;=V$8LLk49Dwm)UzM|1lQeLz;h@;vr=Ovczg_yPzf$E}{e$19#Y=38D{8f4VB7bxH
zXG=rR99I4F!(>Kq*@tbHKkz&qg|pcW$W5!g-vJ)=wqHZ3QM_tL7E>r0A;<}Ubd1sA
zJohhkne^_cFiv(}A$qAypgP|XM1E=l0eq2~;D5nvaAnpo>kT@KsMy7lKi|VX|EhgQ
z9>7OXeNQOmLg}P9T$OBGKcF+T;26J9>m!{%K0E@&F2nbbra(6HzIn`j7RmSKN_pNb
zdLelEma{Jl)befc9^AicYxM>Z)Y*9<G>lz`!<9B@k+oplDF1$^*0NuWjAk1h(Q5G3
zm1cB-pKVwSZiw9ql`;6KM+LI77RAZfm8U#|bgFzhQjs&$y~1_&>o#~Cb%}WXctQTg
zjF<V|9tXXxB>M^tEVK&(wRZ9z*h*OqUh6045FJWs$X#s>1-)ul_IM>#XWz`M-PDk(
zfBxVSw*?upo&NNOOOu-aLwnA6njrKm|ISdvF@F7C(TB=cJ@n=@pn~Hgb<0p<pSlg6
zLW6FiO*zn}e%l(m_=?lWYUWarveybPw?(MSit!7(hoE9J!u7cR!uS?Dod1znyeg!?
zAA3x6zH#L|3eDJxrc*&+ceV129aySwPR^P}&<uF64n%(s3Jxu)At))#31ldHrM!U`
z=CL^3R&rIVj8AnaVkk6_#^o|SRz3YYKF8_0qor|s^^gFfMA=Q)$*-*K15x|JxY3Ln
zxDL{BSGYzJonDvd9=D2T{7k93RgN3Ia=UP=O{@D@y<e*=?Ynw<&4x?TT2WhPFQ%2U
zvbbnczn@1qDr9)?ToBcV*Fl${oY!X>NXkJwYLMwdHqzSZ`x>Ot7IrsYlG&xd*xn<q
zyFTCX;FQ;YR?x|G1<mv7t)Nr8k|6zMr`GEmVhimGP57*>K*W+3PaQeskvh4IU`HUZ
zIiif-Jzj~f40BbloW3-HZcV_?evh!EWH#z^r`G2Nh(b5SNeBPN5E13+b9dUZ^n8Bm
z?y{8}0jKHc)ukOF0N7~+>vohDQFstUo&jO9!K0cIXc<Sdj@XlVMQl}GP)b>ot9zc1
zI=J(q>?%#^I3w|%!#3X84FwInL|Ex0Yy4!nn3Lo*II>&{M~2Os#~FhYO7S^Ec8SxS
zoCq9gYGM}iMMth~@85Oy%`RKkeXw+_zP>QA-s!TUR`D=HU7AFj$0<-MN}C*Ngr!&g
zl90fUO1PN1#i89p{YhmW=}G}7y_mNx&_qP`(dM)>@fhb`nbRfqs~(A#Iokw+=HcAF
zqA%%HofIoXo?fF4zIIftl0oB42Hh7Tl@LqUJx=}rb{<gRlXz>2FLi&DuD&R>*o{mh
zki4T^ffhlYouJ%{RX6P>5_V-RIZr+q7pEHE#Y4QOW<WV5ZC{Cwp^2qb$=Vhl_dI$$
zFR;Fkwqm0)rKYshzZkg-&UK?s+Hqs@*h5!vwue$fDwG*_pJ`OmNK`;>h;OQO^E?tK
zeD0+zSwa4OSYb5L%y&oQ7Wr4n5*O|;cRqWcE|vOK{Df<F>|w;tB!|ui?b_ygnv<dZ
z)FoehlHKfhU0*S|tdR3vp?5Yq1mByLGjq7eQ4RC<a_aD)=&cmywNQ=izewCK_I}KZ
zvdZi3EebnNGPf#e#}B%(+NRE)U}|EK2cwN1bh48`$@B$-^@Jp&@Mj%jTPf`Oa8-&U
zi6l70^{DN11bff=5yy=yn{JGUU!bX1_j~LbDV+rmZRe;9x;m>u*_Cu8lg#?XFL^tU
z;5!vax!`E9_B*Hjou-^CF2uDs8f@V3t5de9J1>p~t3~=Qdq_R-^EMvZ$lVXQKLnNb
ze1N0DYFP{%UQVj&zo2|E3OC&Q95QQ&#gl&Y8b^bDlm50rucN-|pq{?D{G@Z)FQMki
zHjV~+R4wYI01iuU7%m8P=;L#Fd{P^Tqruuq)o<X_8IAIEfrcrC*m!+{9^h!OBX`ki
zsjgbkNGn~1$Wenwd-bKT0vru?bS;<Lc||hv{r_4TY^p&TiN`ySCw05AHVmpbpzh?R
z#;A{|Pd{OMrREfTQd^6Ca>^FOtgp)O3QwvIO>2o}Gi|$Qs>Yh~1a_o;!3#}04HT+t
zM8|R{B%RRK0i`;gaO?yscd6H&1c{A5foTM_g`qn*6y7Umab}!coJP|g0G$qi^!lod
z3Thowjc>B#dA$^Rspj5aK`?9J_dN+xMxNGRLGT^nOL-xfe1h6a{CXLh*9QaZJ=?f;
znv};+`-c^r1QkU{0_(pixWMscJ_k8jHjm*NjPQ1))=&jjb;)V`F;8My%jQW>#m9My
z%1Pl9?d?t}&6A1h<DS~nC+(l+{GB(>oct8W5`z?yx+hN5F)YoQJ?d|V16eE)Vt~`(
zboqXcc3Qqb-T`b=-J(|gt>#(1bC&}&t%8z_DWZNqupU>oE2qQC=f2}7og$=P5}TY-
z&ifw$*Byz4_0eyG&NqjNwm%ZBY@f1aw<jC~)z7snW+*M-_%T{MsbB<itCpxn00Xj7
zI!Zz4w9y5(Ka!&A^h)j9ekk98YAshY3v0XL0Rrmw{-Qz~SH>w@opOKeIc-x*LdUsN
ziW0qo8jR$W7NDW@6rU7FgAH($@rRrqrdoqADq+;*a#8y_M$h<dk2DXC;w|6un{0hq
z=OVGu{p&Q?UU2P)Ta3~Nr-S4YG!9va`EruBH)Pmbx*l9;3NMNKqpg-1*S!xP#U@wW
z%P42cC8SE%G(WW)<dk`{p;GNIk&sI#v~c6@<KeQth-66V69TY+*3l@Vpdp%MNq#9D
zA{?kK;EU(?{M7`aiDo~IvnG30=J6%9>ZqIh6Kzgs==OJ)O~-=CS(I2;43c;wn#1%m
ztZSu`7lR=p>|NVZLLO1OhP+6FBtAE;?ZKMHSo+tw8A{T3-mNl9t!hrx{y7cyBEQ8j
zd?}y2DghU=<fE0YMjeu0*A9tmp?Ucx9wbOm%ul3V&~}YyA+PO;*4ldxGE{?TyCpTK
zw+$g0>_F%9f|(zLe<%22CpPFfs5k+!Rk#yhl@xSQ3arg6*g<whLg&($-xRo*{RV51
zW^^{5J}i`H@4aLpBWFJ}EN;Ibf&Xy^SPOsOIJfPd!xML%iYV^xcK&13gFFuZ+yZj0
z@R8V$e@26?yd~3gFGM5eQ7>r>$@Xl>4B3lzV)iHl??;H9Vh$*u=A`D3JL#_nX3^34
zI&%87nG$5kocu7pOxWzN`7{-M)(avq0e`9$rVGx{^JIN9&hK&HO(xxhy3g&=TAxeh
ztG`b>DZdq-Pi3NUVbt{M_gz~Zr(PNH8vb&=&oK%maStXPULR_Y*4i20qw}Rr#cR75
zKBX;-HEWe+C>Ibgcgem+e?WZm-Wm8l*`<-Gt}Hf*FFSXh?)e3?g16(J_3L8X`LroV
zceK!oRCiMUK!ep^;31Wahxxks=Ecer6cKPfo^HiUXVE6R#ObTGw<OR9y`EcUcf)H-
z*CgN0XsjUjMPNqJwc}@Zw}|8(jf#%$ggNPOeSPpuX4;k+qX3&+t~_ta%!yF4n^?vm
zYk9O`(nLA5mjWyEj18WyeC=>~%{Jq^IP=QSPQKhO9A8kF>ijCkXjrPTw%lQ#m!pj6
zgG5T);BMG$8D&r^|I<gbXSbi(x3K+AgMB0JBMW~c^HI95wTW6cT45>|%f`mp%|R(o
z5%k#gI(Ok($;V@($7>~T&(~?&Uj#zG6z`ln?GF-ret6BduU*d6NNtmcu#^3^vSM{G
z%MxN7^u~=?9ACBzO{=YVKj08QOId$Ju=lXb0)p;5FC>NqSy5SmOp=vHw419gl|prc
z*iZA}<UUavP|nlwb*&-ru&9l87dm4z;D-9|G}twoCNgk|k83eCua7%1e{`@fSe8}y
z)IBO>@B(vf8y*qN`qC@^u5eUf4lQXVm9NZut%ddhTH;EPMnFHyxoEEPKv$<-(=NNk
zs&Ph{M_y^%_RT?`q~OYxSRv*hQ#_Ofph7Zal(FNflW8`#fh3TpApEjN2PRDG^I(Ui
z>0V%`YCl0icK)R|?iRA`fp7NmQXz&wmQ%*?w90BV*^mttP=z_ik-IkY9`*CzXt3j>
za<xGcE$R@Ri<<M+bPsho)fPUp3`OTrQM#)ucjCe`%-o-NT%57byKJD<5FT#Def82z
zaENY3&n+HtUb*)1R|P33jshCZov&6o!pMcIJJYt3>7%iJpNq)PU^WSH8pXabHXNT1
zh|d`FSVJ`iq-n*~Q}PF%>3=06w>knljQIBR`#73{<!{75-$1`WH?NWhMhGmMzEu;?
z^M2UyQpDc;Ck-Y;_wJ(4q={jiI{W8xru--@n#Xt`r=Vw#B&58x7Lh`pMs#)M8SO(&
z+3)zp1@UXrOg@~!mRtU0&G{Y;*`_9O*NO<gNAM;|s3_B`afLt`rv`!vHS@qFN9#cd
zvv0J5Zg$z^5+us=4b*}BBP=Nryj*lSB*HU`z79Tfnpp+H(nvKZzN|n|QUrOWQk!gv
zPdsOaC)F|kI=^7FiQqfDY+aep{<6<Df6`!I`$2)(gu)7gRcfZ3%=2a;fjdO7wCVOD
z3DvDDAiKDwfY0?2dM>K1Iy0-3+zo;g@4ZvIX#z}d@Ju+9sjUDxg9K|YG|fM|VdQ)3
z+fN!y#9yXf_)05YQO1!jM~)RQRuJjZ0t~qPWdz>ZOU8))L4z^$c3Z1mrqw<b3F7yo
zzC8^CIq(I0U!49)gUNdB1T|7eCB$@qVAp@6!BVb_XJ41JzrFZ^X{F;DwMdljZ#0-o
zIA78*7mVW<4JH7hqLg6z@YiTCNI=F-UN&HO8bu{l%j4j_`^i6Pu#_U2i!K8c23pVR
zkV%GDqhy^KA8X=pLIRfA%Ke-lG+3?nGnecTz6N-R?p}Q&2hdAZMpHxD6xj4w)=Rax
z{H1o*4;su{&$Rx6N~mVxwYnhhn87e%1*{r$Wd)y}`(#AE4yNxQ7s@nN!|0>H38E%H
zP?5Pn#=Eb^e$x89uy>w<DpP|ZR`P*lZ~6MYj>lv8r~}0tcU*8ZSZ^sia_F%siCQ|w
zNq0S{?P5i&==8pTJt&B2>r;0?R091qnd@|tru=L4A1Q(+s>91MD6AX-Tkh3%u?)sg
z-LCeTZ}L+Q+0m%+9G1^82H%8HHrQ=xM>_e*dp8Eqv816Pw{xJ+?__&N8Plm%TOCR3
zzNy+ke8y)8G3pnikI|(<dy$pzXcwiMwLNHneKCQDRnpmhj<;Z2ziHv#otg65_P#dl
zo{<@IGw^xdN$&FJA^koBZj$o-dv~xA2fh~;2I7r<t%u3%k7!vN*<MP_gu{&|?^kif
zieBTCml!=>V46FcDyFeW>cle{u_SVNhwdY}N>Wx~NpxF=K=e+RR9XxMrmE4t;Lw35
z#P`{Ac;%sX62@CnwD#MmiJhF;fag5%)$cvS(H2cBfeUOFev2H+&wZ|cV)F`$esuNo
z-2$r!>9vTAd)eUu4mlwn)8%p=GQj~#%VE6zho6FrA_Jbxc{6C#zLwu%FZuZGo-QHy
z!RI*~4fgSV;p-=sf#X?Tpf)TeUK3zPworhxwS)s?gk>K1N6=u8;)tL8putFjj7Y-b
zNFoPFVyQ{pFLSJ+*zMF<71THmV59|cWK~gAxOr-8&F)~yPO`vKjez38Aa>*&#RH(4
z{w8D&N1iBePPyVSkdoM%-DV!T;0E0o;85wHJh5UU<D@x)f+Vb{_T#9-IoTV^6^&Gx
zO>x8+5cH9n#@K)(&x#48#%cs(N8)g?Y$9e9$d!|3Bbzi_jhPw;8L5yhmqV-3v{Tun
z$_UUT0JMvy#9>iyEZH9-sFvW+F*K#kF3Ty5n$Zd;fYF_zDQ!^{$q3L3BfbM59o7g#
zF@>|htm!8awnL&cwH5hGR*=qe=$I8fbvz#@45Bp1a{y!uSzvJkfFodp4Mudt)@(jF
z`Ae0kLyW`)2o7xJSb`BISkn7gvW=k`uC_L9KuLT6pjH(|$83tbFv1-eVJn<C(2`t9
zm8Tj55l1r|pcyg-p=Ss##UYL{oR?+AP94wX3dG?;bjd(E84tGmcpQEhNLn`YvK9SZ
zAj_F5>s<`Q4@aG0=!_7ot~7Kw2xroYNhX2shBf<wD$4^krtkA$u=T}ZHzp-C(|SAf
zX#&n2qNlc^*NSHuuDo!d%F1WVl8hl;L@~OkGJkMm_p_qUQ)R_U0l~!>`VJIF2Zlab
zmF&9_OR*J$#t=g?ipRc<RT&2rp(u<n5LYzi(mb8Y5Q7c^BxS|UiK5-a=_oK-SCptK
z1gzl+^|N9yMo`!<Fc5RHW8*1_@xX5^p$?X8ttwn+D57d0lp$UmhiFkJK*eFyZE<8o
zYDAMT!iNw#aUiQj4x9KMo&G*#qm^R^H{vKcWsKY|5S)-ritEVh(14D_X_jClIP<70
z8x(=!IY5Dzpb!EYjw1jVM>rh=Il7>boLz2Z1Q~n0(y}F_)sn#vL55Sm-pmWATGPkv
z@r<d83y5*@B(YAZvM@_1C8NO<I7iBg5{rkT8l};^hI<1T{S`4t2MSCLqsCKZ#rbbX
zP?eW3nnD2hC>uP6q6MR<c7b$5+1j5H>A*m69+;PXSPE@PUpP;%Q$<>tNVNu|@qvRL
z8nXtr5_2Lz)F}2BR+Q8z&>>n6J)$oSBb7o>O~P3pERgD8I39Sip8-Lg<?OdDe~?B*
zoFsl2L*g8n;T<h}G3ieTO0)_~ix|(^AZ0R&yaq*DjGHO6S1*imI1N(bV7>zwO#*<f
z(}dM$p3a9B923uz2P28FlD1G~cC&=w(76^Mhfgcz?MqZAUSR2(YZiw%J4&PodQlaR
zgA)jbS8=Q%XhQZ#u~Qg&B_Q1xPVWQqk|uJ?Cx~4ZrxvZ|%k?&oy>xTgN+ZmJ)>RyG
z7Y2EbHdlrT+_PryKr`fFm?99jUt;KRRZ1~Li{4=&+J{)cXbdGa$)z}PGT(=JdN2+=
za%Zx&qRg|RZ?$Bav|_U~)wMuT6e9$u=1G@PVDX1co_i2Hpkev}Yq$i-5`f-b(uiwc
z7pII(s@|QDkgz~dHS9nXjPJW9Q;nfWY*jgI(Uc3OJhNVGZ{}sOgM>Rkjn--$QYWhn
z1g%*yIb?GXJ(J;0faaKTG#G&(-o`B6a(C1?To6>PP@2<W8w(f(65>2MrrhTa-9b?l
z0_d<xFq#%zX`v|mtgbr-s)R#8cQH7qjZO!qVSyv(ES<v>$sT*V9irS^5oGgmIGpUl
zu@!w<Ht8gkrUS#W0RZ74Kx*QbxKI=kI3TZ;@+h0W1g&6<V*Fslg6k@Fz`U_<Je8%r
zf<~AutSC*tLB@b!A1@zLdLEpJ*9E2TR$(5X2QOLD@4zl!sW1nlz(@03XR4OZK3TR)
zKjKm~XTi{?0l@u<8j)6zV-w2w8jd^!6}>yt#{50Zjes5+R|zXi<1yhN%ge@Sh6otx
z@s3u7<o#=JsKT#5@TE6kkhu{wPpWK1870M24I^=wheQBCwFB&kN)iVs1baK1Z3#i<
zlTDQ8&hFC+Jw_4vSVBIFl19LZ7l7c$RiQV{=#^2@7I++j59t%2j4u(yd0z4eGvp!K
zV1LJ~HXC|aNwS8b$b-4rFVLmUI~jQ6)HEh|HCw<D%U#t#SnUm*QU7`vb^@c2l)f+t
zquzjWAF8snnX=d>1TK41`oSQraN#MqFdBN}Ce5QWOw3CwN*8oA#*Fpu9$kXB{H7%&
zDuGJJE8+oys@RIh52jx<uWF1|dW$xwL4iH!9_YnOPpRlM*FJss{24<0PRO3$urxcn
zDNpS@cnWR&<$1v7HxAEKDi^ERELE0jppawR<ue4C6p#Z)IARxIBsd7K`alA5gg8SW
zNGA|MfWS{MquLaZpc&8IeJFiBJFe?KUd~=Deql*9(_M{aa-IR54cdG|>csG3O63I(
zPE50;)YxU|f>IcLXUXx2DDlAwTBL@?y!PN{Y{sk`+1k0;<cBEIE){0*F)iU9eHWDK
zlg|Y?amZzwm|6*CE);tQEcW|1>dn>*Hxs3Kz2o}!^Y&BXBw%@GXa;5==p8y%`Y`V1
z^(-*z#y!r0!8eSd-@MK+Oof9vCx}at!0f{@`D;vmw`4WnVV)^lF$kuS=|2ZWsImlz
z(HLQv{89saO_`hAL0=v*B?F(~ALK`;61&Yaonlz9X_hc9RRu=?9BrAVT#+_-{eiJh
ze9Z(0fjq>am3S#TFr<z0q8!P2(v=-m<_MthmvXE1H<cpkGFfPbwaGGKGnNBjB13(!
zV_OlOF>|@G=mXqy438^9nABRBVON;2j?@pv{@A<b1|A(VP_%yZ)-zKUP812;7lH%w
z%pPC-gn=X**EvhvjK1ahRKCvLyny37q{|~gOrkK1nde}fAvo<m@4gdeJjXZz)a8{B
zRu6jnsrcQe$L~~GtI^O;2-;8&Cao%NtVasg*klpLtbOu!S@r5JN+4`V-90e#Jq_=O
zSf+^w`cd0sQcVtVG-ZU8Z6}LtcXrCHg-mRBHofboTmC>0vnj6xtp524y;+s}cii`h
z(RF*TgQJmIy@}raG5MQp8tLN>Wf*(Y2~)6KqO?_$vzYl*wy!cqLX#DQ>$CX*bKW<Q
zTUhCd;W$_Y&dKkOI#8sAt)4-H`TbJd_q9ZgG4!*ePPu+eYpOU4l#RcUaqS6vnmE-v
zs|z*gO6^3MIT}$M4R+!umR_E5iH@V#O01FkV=birL7@5+iW%g`wgfY`Kv9XrKfG{_
zBLc=;dySPxQmy9ph<A}zea7>So3=a|Z}j~~Zq1BZu#MfjGxi{J%yDMSmF<(~ollQ4
zKRucG^ptHp=+1ap=6K}Hcr4pQ;++ZXzoEfOW+qj8*(&{^m6=m#h^d;Hske&LjsDX$
zXHzp)Q{89NJ!~@*KXtH4|CvuSGpqiyI5KRwd1~{{H0I9iyUe+7Y;)UpX2|c(Q{0_8
zyEE74KM!odP_a+rI505#44u+EmTf^SV1a8E0}j9p&alllGbzo^tlwEsy}NMvd_h17
zw-x#MPRpXK(jvp%FWqN9bTE&fI+({V9Sr?b2ebOAgIWI2!9suPV4*l2%xdLP%d#i?
zO33VT<oQbU-DTg|<*I;{`q}09yQ}^$Rx{bxUcOlKpIvKLT6sUa?#aH2onhaoP}-^u
z*wSp>c;2$=f4-VKyIjz+wtc?5ue99#Vr%()bNB8#<mvVa`zBUt89!^29J@w^-3?dT
zYd&9<!0BM9P1w_wcL95i=Nq0l9ZYqTP<dJN?T#MDE{nzf7xu%mmP3)bEs42<%WpRn
z=XTVe9>`jJl~&$-s(h$vdFVN}Y&EwPi8~m<zWfIrtn#N0R;he~)4`ga61CuTFqI!V
zSjXJ)Tb0vH)JgN)afQW6y~Qbd?$2~E0B2-8;^s&+vy5AkT(H*XLeCD-=MteYBi&Xj
z8_>20JW^(x!Z_3q8q7_@%;+AD1|wlp)8LEG(TuuiP`qx(eL*J~UprZ0wZgV5nTpGB
zS_WdJl`7-S$vSDmb~zhgS?Npa@LFq%h6SZpvfh$ru(`9i{^cRt;YuSG`Ve0)%XbwP
zj#s@KuI7!fnnwF&0L>ERTH$97oIhzWi$Bm{Ezs+aQbg}}gg!u0V??S~2J`gNm7?Wp
z)<$35Y7C%|f3q=B?KssEE&q!KJKsF6YQS_vvM9$W)bD-iO_zU4sn~F^I#P1$ZH(eC
z8VoCZCb6^oxhGvY_7@G-C^Dx{fAsxeed=xOFB<IR2Jh^XKhj`iX;_B2r<6)0sC!xA
zt!+$8`VTrl^x^Zp?n}r4M)xQBU4g6&wx84~$?X}fB86LY?!d|aK!eF0bFoG#og-(E
z4>ksaNCGeO28VjMt-z4)gk-sCI5SXpBB+?~Y?93zj@~iL|DwSz^Q0)cgxjXQi%yA@
ztJGiRp%LtbGREuo&PQ>nl@GLwtZ~;{g~j%jhskn;%1kE&q$ReKGEkZq%Dwg3#e)PC
z-_xNK@r#d^n^t((3Az|iL69%Iv8zV8=P%bzb5j&$`>OKl4clKdSi^^hORrj5WO7)a
zkigV5wRQ+o<Q^cQ9Sr^DaUn26yoNl9w@7T<yUH}y<2;h*0WdZ3PqvPErookQL9#JO
zcrXKJQo|O*e6fyD<4_y(cGKIf9uapf(F(^OG?*Kj^y{Q++e!2h6S>9hu4o>Ma<{<B
zS<2^8F#V>Jf&^A!enI3kO~H!W{5jqp(&BdHeeq0YOrhLWk17K4&=)GN-v_ingXQ#O
z94H&es7mvrh<?&wBAb)UNE(Vu{#+kCa^#i<j5sUkJ-PV%L(7dEn)~4=@0cFQh<oHP
zl$hkn+N5uGrJJ4aMan+8Tjwt2VJ=iXe)SMkg;LWtkcrZgh{n-iA}zV{G0K#_n1m<q
zZQc8kmPHSi1bcqcVD%Q(zi2S$b?$DHt%?d94Q5y%TlA9#Q^C<-imzEb`Vr?s7>1k3
z?1j&r*heypKWVVVA2b-m@Jh4Ady6YG$mcXaX)uh?@^wghaUT;Ajt1NINc<X_)$B&}
zY4s_N2J2Xwj~KPcX#GipDHs>6_>KN44F(PPody&9jRvE(qTI0b8ZXFjG8K|tnxFL2
zwPS_Q5Qn@ohIxW^3B%zy8tmW?G+3l#=YK$h(c);Z>&w5<V4Am`|BMDp{7Hii;%Klz
z+2Q?PG+6)dG#H-ryAMBUFwoykgW3F|!Nm3YEmJNi{Z4~jcr5it8tg4JOURqVF9k<~
z)%>8rXbjLB7mxv$KZNN2kp`>#L4z&fXt3U&G}sQP^(PIM_=^Vn&Ljuqm-wPW#1LoI
z!@=IIz2U|C!vpheD}1pX^+4|MJ7++fC#$;7^6*#El!q;lthLj4l`yjb5W8eHX$|im
zX)wD#&|qEV8mft6Zyv}Yy;f;gWpp18B{d*lGI{aqw_g~hACyeiYU0-|DjMdP9LdXa
z*RsLGUHUneEC5fg8gV(8J}Z+fvWR;3APqD4%Hi3wp^`-%?FbO8!I4PiFjkQL;Rl!x
zU6d8ud$XR&tg1AwQpYpvTXPpjPrII#J!&e^*pJ9+_NXYcs3u^az8L5vxAJOrUf|Zd
z<4^B$yvwU31+D2$I6CFVVhZxm*Okf5*&8^6EQB_x<H5#YK(bQUcYVP)F{ASQhc)~5
z&N^1N%ts87Z{{mD9q&0B&IE+k&g}}h=tYKcJVYvY61rGCn95p8ld506y%mthf}IW&
z=B%FHblJ~azB)|wDesF<RMo~XEE&(ZiQ&R)-%|OkgZ%yS4gaDi-DDO!UD81Z_eJ!3
zA}tQAZCeg&wyAAf_3JtxwVsx4Kb;e>Jp6j2NmR4E0~wilR`#hn^RO&Txk>VoUw-Sx
zmq6A1#>}dSR=UCqg5d^&#<Y&w?*y+4gh!Js0-lC-3bnX{J^g0cf=W7tAMVH~B$|P)
zguR#gx+?=0T-*???>bl9dmy@=$uECY4Be`Hj{gu%D({<Ifh?4@L497*u~jo|aZgqD
zT#}S{(3fQ|5k4mvDB~H{&spw?*nPE3%T@pJ-WI?2KHst|)#S$wLdmpmO)F|xfy05v
z!IJ6zw~e9$e1|hAhnY!)?91CAel`>datXUk!oibexygk^#zJ`4UYi${3Lkp&;XB^^
zcwAlcqR`7NbL~!TZ4A@ZaxY!qH6n7B+PtscUT`)?tE@4a4j#uGA>s{+lcS`xt?Jsh
z23)JMHzu{X9f)$9GOh-6lE2}8RL>Pruv&PFV8gaLua9l}p2Vx!En&`<!O{%h{l+;B
z{nEp{+y%R^8{^pIZ!J>>Zb-wG`N7L|#SC{XZIG>1^ILWAskpb0L4$d>b;1~;GBc$8
z^CLOGeWTV5@Bo!$L^3{-?ly?=_}rWEMTlde@7{Sv=BJG5E}b%lp$g&$Tw&P!vyJZ`
zJp))#-%hKwv>S$E+Yj7N%obU(b)Vk0yZ~Qei&D<h_n_p8wC&Aay(eNl@hs?JO;z)z
zm43m*^B0Wuj{a+|%1>rLwLFSn9Lx5-_9*(@^w*X}#Z7pD{Oeu2&CiVNHOS|Z1n8LW
zz1vzFF<B2)oxj<E4GNPpxA~1#WA#JbD-QCpe%WEUkB6#e_nG{fgRd(+d0t?`w!=0R
zeDTV+^qc^L+>eUj-M%M1h;@lps>3grsLod2hwi@;DWV4MhbS_7fBDMZco?gHebXYQ
zveR|@u>Gz7-t)PZ<&Oc!=}qU)7tl0cTF=>S;@4Z{&riNSefq6g`RO4;z|nK8!|?;(
zY?wc3A^f$ffBmu{q|L?05?=KUzAi;c!}#<e;k|>02#A?K3nPNv%)jWR1Ge@lbR5BC
zcY~Y69sJFYoFqte9NtN6!lQ%WxgRtd7Ibm^hJ060hPS0U!_!MgK`LD)ir)go3WEow
zgEVn87)gjRUx<lLNL5m>9x}x8Q}DH}kUJ|O79^ooW|lWnLhg^d-{K3kFAR0;3U!uw
zVq+KT-eqsM66$Ri_6Ql~D|6M2FU+6B+N&@O!G{deL7H}j1t5{rgvgLCWb_I$78y*E
zf=sNlk0c3yjtoyN41ej3Oj-$Ny&s;=7m=$I5j~D$!XoBrBVKkzl&)YS9DE{*_#!>3
zBVOA@)*>S{86&H@BF#)A>q(-}d{OsmBb)7_<PIX+3!{3vqC&1my(fvLNs8*zi5|6!
zes~ZySQy<S5&dZ;daf>NqAq$dMP`O1W*HgtnlI*aSIp&mF{>o8yD8!8<1vRiqT772
z-wR`dbYj1*#5M%Rp76!tPlTQw#S-5X0A7xB{DToTA7}pOMi{wlYyvV4b~A=^K0dYZ
zKQO|m6Y-4_p4-K7b|=c^#L1F|@}?#TFeQq7*AycKu;Gj_c!CURQcPW<BLA~Xdx=*j
zLez?|Kaem@(nN!aA4ZtYYSQ(aNMqS&4}3+rFDFMKpJ}Wn+~H58#u;JIWXGGy(C}p6
zaDi*~&##Urn|D9c=1=@(gz@nw`gh0r6g`i=%;Q&-a^>i`MfEdR{uBe85e82RXG(o+
zmmEWywgybi{2r8Oukp-2Nh>%>$d};OWq`ruG~c6C)aCRqVrdnri2R!xg%i&hsS|%Q
z!dg@7ZiZFeOz&Q0skP7eQjo6EksgRM!k~#_-|;(Sll!_uyNWVqQdxS7GONC2sMBT^
z|1`p^`N_wbUJ!Pt%#vmi;=S0M@LiOp{Bl!6j1<o*{D%>?aXG8}2>W99a`u*37I5<6
z*YGTjyx)v4TGDJ1=FsVz*$f|;iFHwmyh%7CjN=&PaWj<$kOPyWq-dbvm(zeWpzhkC
z7|C)AP$(g0ceU^oWKq&H-(0?%DHIMGg1Wiaj&j6w^K!&;Ro7g2WdV90^6=tvN4xX%
z{=^8=i^#hplc%Yhr`_<<iaGYq+DlQgeCvq(d7b?Gk5LcO@?FiN9Y5p~tmV5o6nx+-
z@FdIfeq7+67U^4DFw<QSpj%i*Qiw>)2r@5>l#2+9D6B3jjJjBqvQijJmKHBpl<E+H
z?@*MP#+*`Igt~})wpQdzTAUM6{79$x<zsAeL0a+ahRlo)#Z@1;97s!QC!<PqOB7a%
z>()wcUo2@{D{4M2d3Q0S;o>Wj%da{=ylP;4)qPypGx=(m`Dqtf={aBNNO7s_(W_6z
z1rrUW7~Mx>Yo(hcWeX8yLfU0tbYqs&%C^^B)<2X@t(5IJysqMTz0Vwd`1tjiobC7G
z*YCStpX-+28!rX2<l^5dC+`U-jx1+n_5cY~-0t$Gax7xu3Wk(a>^`_QXH$V_5bLY0
z;JOviU2}(nr7-uUBX>{b?hT_dcqQVZwZuT>rN#gNOI1;wn1ExI;?%?LQD@opA4VAG
zN|kn_!)>1G$H(>xk=0iOoKxRai}&~$Ibv%--<XOeYaZ)X%lgz<kZWDPfM-@ygLtgU
z39Ym&dGko)j_9p7$j5IKYTtOC+|I(hag8j5);wg=t2MfXxEEQQxkmXQUG+B32!q#!
zm()e})J3n?#gf;@3)Cm-)jxBre;!$%T2i0hQ=hqBpGDq)5@^WPYj~mO>?3NY%2J2?
zWrPtlRtPj!={43kHr7Tq)|WIk_B1xHH@+orLJKst>ovV|Y<eHr^af{yW!IF*m*9-B
zvL1qAz2;HJA2is=llvfa^UPFpVNx?jpk*<#d1}3RxrcgQuVuZbWz?}{C9-90s%4+0
zWt;r%vcTJelDET-Z@-;1r&M9z0&h3tkg)TqW=%C19&0OsAOTTtGf6Mr!A~R1X1$5Q
ziCOcKX3Rw`r_bfhgXq5a0+?VMM-&UQKHJ4l?4?g!=)!c@(QV)9y>Qgmr3{uKuJ!?x
z2YU}YcN1&aTKfmFHvNP)$B1^oa}UX0cCo0Aj*51HQ+wGa)+<i!*KkJIMq3IOG|T<b
zAX<+oO?x!HK)cCC*N@%oRl99dhw*fWDd?S$!UG4Vcb*^?yH~azP3+Locl~HRde(<o
z>TDLEcBhPY3Q_D2S>Ky0K#{E8KCjrLoLF7--zVOFADqz@y21V!#O8m>p0@E$SH8>5
z?|np5XU;3u1VLz=0+zLKgS~izCq}=!B7?cC=|g!h`-@)I3_)n!G;70Y=hau9Z=Bex
zPe0_{hQ{@N*hciW3HJ2qGnZxbHuk=&2Yna<bv57adkb<KJnc%J?&@@cB76HvH~QX1
zb@xa07gY4lJ3*VASX=a=TYjuNuX?}SW?h`_%fH>T!P=i3_3<<4JvO5sU#P!#x_emR
z;{+>Co@719`0&-KpXBPmsUK8dZ~zd^%b+;08r8|1*$q-;rMv^(b213<>;1AZ7`E||
zsJSak3brgbDBL&1Vld#8F~s5Dcfo*bOK^x_Xi$Rf0~5svmEs7%U{Er8Bp2N#Qp%M!
zJxm<fb7gZ_>JE0~d+&(cP{W-^TsJdE?kM&MQw+-+DDo(B8I}%^R*qa_`=D*W)tAoY
zvN`HrI^vi;YM=<S5gHo~`b1VaVii5+CG-h#X64q*rBwaNm!i&<V%$t<JbJS!^z1_L
z<~Z)Z^2~YSdGthT=|p<pMCRs17R4k=XfoGe@}=`+LG)x%>10XYWa;MQYl^7~p{Xi^
zsT$|0+UTkJ(y7M2spie8w-nQ8q3L#m>37c4@1v)?OQ(DKru#OhKT^yL3e5}~%#1qE
ze2Si#D4m(=o0-|1nWLD+2+b}U%zkm6U5=hzEuCHOo88=;-KM}T1LpP(<_?|bzD3V{
zFP%H-n>*XY&S5F$fx`3nhVz6j^TaXpq-FEu{qq!C^Hh`=urLN<h@o@AFvMV($}lYb
z7`8182jv1xc!A4s;eyKoZ_EOJ*@8g-g3#822<4)f@S=p_;w6{Gf6-uDi-ucYT(*{D
zwpPow*88_Mx3;z^w|9lN_YJoXU48@!d@tKR>EAxv+Qw4u07Z82uj~-I?hwcBkiOm_
z|F}c3y+cK{3l`ahT-l{_-DQZ~WqQ5K@^P1KdzXW14<@q5b!G2@>mG0H9{=k-fscDa
z+j}BZ`(h&d5?A&wx$aBH?#sU3m;bo0xV^7Tb)YJ8pnl~*)Ac|*_TcjC1HF$22HOW$
zs1A)q=nhS;9A0xhyb*hN^Y!7akB4_Y&iy|oh4uaCrLe!vgoPTrAZzZ1t9XQ0dWFAE
z4u}7e!f;GjT2#<KN(y`Y!n*WD;`9s8`7F=W?2_64SPGlVhldroCl_?i7r@gBTO*3R
z8;V|FivC_H?DIcL3VT;l(V2_x9G>W`U+;Qd(_J|8p=skoRcFuGUQb1RZ|QvR+oQhn
zh5pv9{`!`Wm92v{?*^B92dBRbwr>wMe;=yr8Ce_}ncDcLNMTd|lET(MmEY@mVbJ(y
zbE?jBeYUT$c6+Whh@8W)scv_%D^b9rzo~wIc_3FW%dolOaDBYWajw6)@!R%%dnA_Q
zN=wuC{gvSoi;peMC*K-BeNVgcw&m>P0JA>#@hx{TEr5t`9!@|e^Y=<&Ie$Y6Gym&S
znBo6?DeNQd-!FwNysxa)O}s1?4Xx}KNbT4UXG=FKzQVJm6cr&8KMpQc-Zk~p6H6VJ
zH!6E=dip`-?EIv=^!yd%GE2aQ8g<KYi<34_=eaI5C+2ujk3wNS=n4<+&YBK%w2QS$
z<ydgKLS@v3MyM^iSYSY0Kze9Zyx#C{OJN3oK?*bfe^d&i`WsSMH5B@nq%aKehi9%{
z2v3I71NXWPV4-v8#oO}(%dzxg<Y2u7t+L|fSmkJ^h-(A`#G0Q(pDKt!uo7c5XK_`5
zI$YFAdT0g7@j~K!6^=)z7W2$7YW)deisw_ABd56Q+?!>0I`q(_-b7IU9izKyp!+@t
z^iU=pJBIpVRVaa)1~AhZW`NTRuNnoJkIgf!w*s@}ZYWK^6d~j)(dKQe(|j7oNf<KB
z!qVL#NS;4WUw?dC(z9MqcFgeM>$I0buB+1N6ET4`>FpEM!0cOgMrzWuc~Z{bqi%1;
z!u|G%Q@Oj_t{eU@k;1;K8Y-+1TZqV+4$|uqCE+jE0Y<L-+YQ_RT>ZZxg+1dSdLMK%
znnC4@;xpS@fKY$`Pd8G`Lxt~93%VUI(lrpc7D)2(+64A-5L3QZQQGBYh(oB;9|$OZ
zPbTHxg(Dm8J6qpc#gi(Fsqc^8^~MwXM@wOLKcuh@+W%MzGx#Be1^qiIO#i<sg?$Io
zO})BM;@`Jndy+R!xffJbV6d61(x@_2_U29POrkIC;?z9lBeA%yO^@`G=@rA;hEIK4
z4;xQrb{<|=j<^l>ADDug#?-bDPKNSWaO<w;bg>SR8z<P)3axk5YArd(KiM9crB)_s
z=f~ScZl5d|Pi*pDEr`EG;K%uuM~6(f_fu6<pu73smcsV&doL`I%U2_!*m=9eqskQg
zp$h{^X_{hw`Vj%+XltEYnNnkzDq3VNg>$R6n9HE6M!B)TnH`YI2>ss4F<6tt3Z-VF
z6zA=?kgssm(G6PQju>a#ete_uBk`4_f?J>IE{%8aB&T>GHUw$%cCy*>=Og+5TnaP!
zd!(>@BgsEVVW|I<6gJNP|34{A;y)*a1q^VmBq*-jlm7@+_&%im*;Mg%K_I`$je6{&
z>X|6H=KyD1n_4JR!Uk}2^q#!p3Y8e0z*`!D6*buzk8nj=fv!D{^QG`Bb)kzn{~0Mv
z=I@ijmWcy)NIyb@Z<|Q^SznJKdE{a3#cvee<q@-bq|)nQl6e$9yo{G?C&#}7I)}$*
zQ41sw3zW$Cqpwn>N)oQD5KGe%fa~wq`NZ?6^4Pcu9E(0707emZc`gp$q}J4{mLL~~
z;>XXc4jJM567mnpP|KL$^Cgms!|?;KMjlNP#MD*MqRDh;aC~t%iQi|{iK>UHP<+qN
z#Cb;ey@B|S#23yigDHjr*=a8fSxOh-$F;;M>aQl9Q}boT37m}!J+2bxFV{7^N+oPW
zpf{03Ty*g~J8tn)gr$i<QW$=+dT`4Cf#$p$BU1`Y)z$p(mcmT_IZ~L(|0*dgV1P*T
zo=mC=k*BCYG*r_3Z%Se2{~c18$^SYjjO?crCi>qeg#rF0h5ZF7OzK}!*ndF^Gx?Vk
z_GePqJn?7-^}QPpow)l{uVYj@Z&)xqydLH)PdIN$ES2X_Y~fx?vrDR3{>0>ex)hfE
zKSByK|DP^}W&eYvF!O)16lU^Ik;3x-?@M6@|3xXx@PCOER>J?^DTQV8|4Rz{uSsFb
z#kJ=G_UGs7N5~SP^st_Lf>R$47N0*2xOFY}mKG7F;OW!zOPR5oY+qhK)td^Q@)>B@
zt++rkDNl;`5+)iLEP}X;iQXqF<hNTPmV#Tqz%B@<w15Hz3<pHBiS4~Oz?~w&{2Mf+
zwfEF$o0kFvolpTPm(XSKXppDnJYI8cINSAhj(1ReChlPpXQ<l0lfp1zI(~Sdnf>;%
zVjz(<W`NIXk%of*TB|2P&ch3n!G1n)B?+YxmQv(mk~lKUpfz5jiqVKE4bU!k)gcCP
zdx-60yf*EwvC>m+?o{y<yxnjyzHJ|*QUrj=f)@4Ud<Ug`j3~GxiJ{wfL-Q(O0;>pB
ziQ-fKObW{v4RJj}6WW+1DP7GD5i<Bcm%^_9l)~cp|B4ib<k%Yt^vSbiGyjWHn8{z4
z!rIBM{L`ecpntFw*6|mluy)%2BPlHGzbb_>|0ad`{80+4qq-ya4p~o5s-vP#oN4Fg
z0DLtcx`JUAUk#I5AYZH!t$R0V+KD@3h#+C$$7dh`fOSX0$@Q@SKn--5Mc*lhjX;IP
zgtLv19*PhK!tg%g;U#*1{_NmxNw7Q)1kj8A6Qr=CHk=ejsh^bgcS>Pme@O~E7X1?`
z3@P&0rLbvYvM9?&m}qN}VyUs7>m&y@0a@A#8D4!_B|2y*6E7tLfRnNU0CUvu+gYdq
z6beD3PlN|c3`~h7uqo}!$bXC!mUHnRCWXEFZ<4~k|6`@FuzxFsh5sj{FcARUX}y))
z5so(we8N?WS+9HUC{NB>MT1bLiI-nUue1liHGI&F1OQ3`K)-}4lo3F*k&ovmam^?M
zOP~?eE#H3DE$6@$KQ13X#|5@iK>)g1hl6Uw$$=^$1Qj`gOal!0tOywly<pnGClh7_
zfRmGSfRBiBa?zgiaAN8(qPS*SSxK7j&ACs4Xx!@yJl|;R%Ucg902qPh0@4s)Q7H1=
zjJmXd0x?;f@{mBSc9e!nMhBe^T01C<QAbtADNiyl(FdMg2oFkgXm9mtw@%7Z;*x@(
z;G{BON*MsnDiH;|acEJ7W><#B7ay=A1#!m%*r_c+S|O@v$OI7IC=fU=>I{Hi)QSHh
zUwMrHV1)!<QIO*;)E<I_j&o@{2+EobhbEi^(uCu%FyO=AurOKdZLc<^!uLP0uz^2d
zVF){o{6E9OJhfWkoe96NFn+ZkSlC7oj63wA8~i60M(Fu(u&^V%(2+mG!g6TeK}J6O
zz{0A2VPT<4<$r>O?f(%AtN1He*ohuf_lHu@4=gNFf%pb%Po=`Y#loU9y5;2lh=ry2
zbrRD4#KPqN9TtY{!eL?9G6llfKVV_V-?1=992VB_I~Iocg@wJy`wy@%%Rj-wZvFua
z!xwCV|G>g>4GSB8VPSBQ9p!Eu7UtPE_?NJ-(Wve*uivn+oZqmpkRMo>%%5UmMBcw+
zVRSewtZwk*FD#7u2Np&X9nbU&3#<5nh4KEx!k~nMRGj|?3nLX^9H#t2p4u^l#c5%+
z5^ALQLea&9`sKirlUfA=ILJu(5*<vakA__bFG3~6U@we&Crq|*;6)vgqKrxR$$;V+
z^t#(1<M*;;PCR@@1nQ*LB|C`Ge?%~300B02+a*rkAT=r{)H;lmJTyID6}eu@b;Ey@
zd~I0zJCP7H$Xg}YM<qnZE;x%CUsv~<q_^o!iab(*F&Vk*Hf&IHO<E1=h&`II7PHa&
znF*?PaAG?EDR(@b58Nrbj}}kfb<>oSA6Q8XBhw#p?-(O0?-pJSBISc?ordyt!K-pR
z?;?TZbpRG<s8V6zYlSfB!a(*KO~M@jbLn*+`>{G^QG2%QAv0Ohq5v$xksP@O03QHn
z!R1{?XAv5~fdjg1#(-GKcoIhV3`;hV48Wr_5Wn!xu&`ML;yZ=oL@NM*rtHvq2p%IG
zehHi$DOVOXe!*&dcz{^KnY3V(l<CQMbN2O@LNq#z@Xr$Ql~d!M*(2vSCj=D11bh=T
zt2MOdH$A=>DqKipEbm9P6GTLt>N8e=TTQI8gKw$V&k9uG^O-}y#85r}{=jg_eTdE=
z5xX7GH9lNcM>KsU?0KGfQ@Qz-%+RG<aAG9TS*B60oq#A>^u8I8#0O3~KK5$Hd}(-`
zCVceN96@9TCt|D;OMy%CAqZ38P7oqWGdPyeQikaeF!vI0tLhF-IFM{dyux3T$_GG_
z0-)IpsoW%7qnjp80gy4)(xm{bJOfD?D=zu~2)h7Wn(@*paC#6z+6+LNK{R~_K*jgr
zVhWs?WP+rGP~ZtX?@M>erVQE642fv%4Fy1v0Qg0R3dFvLZ9pW61wdcY@b;a>TnIer
zLLh*zqkR;dkHf<3rc;nOEKKslD0z?n4=n6?X6VEpv9LNd{TayWB#rUd=<itAPL$mG
z4=hYBferox3(NkAh2{Rl!fxTPFd4judSuxXfL0t921otC!c-&sURVCY!gQ>$paAX9
zI4sQaW>U%TSlGRvSQz7^$kH5*F%Ao>$6;X{o&8lfEUZh4lJzGR=4)N6K=|F}Cl=PV
zh{R!GeAA#YOC#?@N*osU{V!u-*XYBp|HQ(E{}c<mh*6xu$i?*<8ezs0e_~;FzhPla
zW0TCbKd~^oA6OU%4hsWJDDffQ{KCSX{J_F^&Nc9n*73h%VYS?N!auMu_>s_nz`3<E
z)bitc-`$;M&%(K1SXj#+u`q-Z$pn_$W&($WagG=(;jl2M<)DEX#8_<`hlOP?&}Db9
z_nQ$=Ymz`M3F@ZeW>)ZiVqtFi9}QySDGZ}<SlE?cSeW=vENllKm4L|k4GRn5-}#A!
z-CWBL_!BIQ`cJShpRpc1+e?RV!Jk-I%jqq2kPRi{B6F}U4a%zQ<&vjpDGjhDtqK^u
zkEuPVxX9S_oI=4_@Rqm!4=l|4;qt?PA6S@gKu;wO3)@+s*|kdO{S6Ci$6;Z9Qv^S-
zFbNMF7KVSfrgX8A4S-W7qxwZi&hIk8CJZlxVx59Jeqv#85wq1}iV3zKSQvl|hlMqM
zPLDwu{=&jmeqv!MzhPmyzpyZ~->|SEL&V-MENmW!g%SS|3p=`R?Y{--y_ZOC_X7*d
z{(*%_@PO;1ZAUMFS!T83CF6g?!gj3Yaah<&P*!6z2@?KUU}_JCg?TN%S0d(L>K4Mk
z*CRD0FtRbvH7~{pcNDB|THhhjF^Bjz$obsTp9e72YHxu6B;~darZ_AN!1Cbz<S#4?
zdYNtlliDJSr)7h~!Y1z8dvP~C`-O$E>_AY%Dofi~NcU>1Q3!9!bi~S^V_`c%+h6Bj
z;;=9^*T8Ylr#?TiF!=V-i{G)Zx}R8B%I{d1nj^J;s0a=VW5NGI?}qmWEX-ub{_7+T
z3$yx(g^@q{9Sdvh?PULjg{gQ6?n0h#_9uR<owhQUAM8E1rm_DW3lm+vyJH8QbKl%|
zciWn4{E3Be*iIbdu(0gT$sbtQ|Hs~a#>3Ti4Z|NquVeHwW)Qs-y$zxhB?UoDbkT`O
z)X__HqBA2p5j{$j(R&RNEk^GlNF<1NlJmT-`?{a!xy$?E{_y_Z=hNPw_ulI`_BwuR
zt$&0tWaT#&)_OKB@f!;({Eda(z_t8?g_-<~g~dx^mjDlOx8!Xs7G`!5fN`Y!gN0pV
zwXnaiuskdl_S`Mx$m`|SNzq?eSfbm{{{;)n_zMe*<oyc^>+&Z23kzcy#%0(6u(>x^
zwXnv^-WZ#IANw~J#_~@r?C5VS%w9OyZ_H-?FD#7VGmOYIReYT1KfuDOuvplHMI1H^
z8~=fYL42tvJ;2}p!oq?R--N&W8w(3fw6MFuqn3xo!cu-?VSKsH4Jj^8{J*iV0W20a
z@COU)oKE|Lg{8gujfGuPWSk{kXg(G8-Hu3vL&BaYBcrNA=}K`P8=8Z$JQq$C`w=s0
z>f~i4ZF@N)5O8`&npVlmNhz2=1@a@SlRf}LKhXQU>YQMmola@HEQmNm=ku5Bz=){V
zpYTi&-PwTSwP0hSU@AbAJ`n{=lo%wq!7Gt~O5Xht6NO7i@Y2^|vOt;?#P~w`9d0KA
zmnhi8Khz4)O-uQiC&O3SHUf`;N1lOd7lRjqx17VQ>W)C;Q$D$+{2V#modFUxO*KHq
z^xD&rk?~L=W^TtS13pCK08%0WC9;CbWmXe1E+8UL0}<q$%uQw>)$@;$7#vhIlL2cm
zz-2ZT1TdfYc0I8L0N~Lm%hHPnuM!V&k!hY+ZzFTmCrv7gAi>F<|00Fe1!k~^cl>)P
z>_Dy&?9}mWJUh<K*VTXMDk(bb{WlrWxxDYcX4OCMbA5Q{mHx&pMl$HC^PJ=J)o&?m
z&MRo?=Wi)&>)q`A*fh-4{82~btlFtmOU~m@8fx;O4C#i>v^1fH^=JCRq*;=Bg0F88
z<%?CC%$f<(THcKnLmY6AIF47Z!X4WL0KvHYcT4rSqjT8fZ}(WKXaGy}yx8NmPSI!_
zfV(mqRtkGw==iqg9cPMeJBNCTj#GCxjTWcJ;`2$pej6&Q8`r2i%)dsAy15O-KJ{^#
zt%PdIM>&VYWO@wAlw=-4e@kJzypN>bAipJn{77U=^M(M#%E+R#PfRz+lGJz#lbFgl
zbJNWDn0d<0=a;08D@%$pe@ee|d~wwiK~z>&-s0r!qm7lqYIYxxI6cyxh^%bh&6<%&
z+<u%TSzjBW#iMZeqOvNrw#A0ZWQteaW4MZ>y#BWo)~MGKBk*pCns}6EIYzF^aV6QW
zs%gls)q+{59=Mz{LREWMY~}+JY#Uz97VfzEStr=?w-n}ol(hSEVL<?XznoB<bexeD
z+9<+H@qRCP^~hCzkzI6PPCuzjfGE4NB8a=<TEJn5zg7OT0Ix34)6J)IXIv_?(t1<g
zV2WkqR+v1BFeT}R7`NO<^6$j`Ee99kAJWH?y10ZNwrv$Wcrsd&|Ip86o{iUr`l+jy
zCTN-F+=0G`FDrR8PqCZGW!!c6BMQGfn+B9EJ%&;tV5~czj%RbJtgBNRuLnkz1TIdg
z-?D;KWh-7~XlE<BfAsv}`nEnvEu$dhxJGFYA{Nei?r$B*x;hXs&Sf)V7$=#3j@wu2
zw%2YkV(Wj^>W{`%lCSQfR`LgNezAPW46~V{VEjb`FJ|~6K>4oj-Od^=-xQIe4pq&k
z$pLX8fx3}pmm}qkk@+SO9nSe8WbaSo#p|4G!Ta0SH?FU~Qy#eD0&m>?2-UR#gbIgL
zlLa}TDdscq6?c<5@ncGejX&N7Sz<`(Y2b9y$dxk{&78Tr2fkbaan1UrT{PwHPegUl
z(`wRrU)7=+)j+7C(sj~LzRrHfR2n3kiK4Fu34nN)Y9yygAx|9;G?@$wK1Waj1DiX3
zyonJ?8O3U9$j2n5Mr?ekn+aS7)eJ%+w2Trap{v0#cWM7Mm&bj04)xVoDU1XBs1I)g
zT@&RNLk(r0)sVq(faG~_eGGtMchuf``?x=FX2%eIsz(QwD&s4f8Gv1!abrHnXwZ7R
zCfEDPLG9w8L89m}*!E+MR;v`}{q+DtwnQ&iXnO{um!;@{MW3CMJP#ZkJy&b>!X=|e
z{v)YJv)tGqSA=eDB(3jYUGCXy0>3>%3ZrUe4;Bq(ty4n2`W4Fk_p3U;Ce)QAhzayx
zi0PkeqNQSzLPU<0)6d;m=@_HRMU5ut<vTSvjgT<&V#BP^oc<3+1`$dlxJ>_NDGZF?
z$0h%_6sAz71&jG3g$do-;Tk$(vfVv=)o`4VV}?T#D!Ic9Bf?FyNr^scNG4QX+L90E
z!@KhdOB_4kDw<ah>Nyt}1!}^maDm0V#{fcG?GVG*l@`$!<(w-`FhjA(HEFh3f1G^y
z8tEgB|DF^Uzftk<S^w-OX)moAzb7e2&^}Rh$%vDc97W0Oa)ZMPHq^_wlA}pVa4=Qf
z`<#9OG12g|$$v;;3rmNM1aFgY-25)Gm~Q-*!h}4Z?uD$2y=!hx<M+tbdHA^)i9gjQ
z<nz3Bao<y_X<}69>6?Y6<3k^c1M~EQ0VKKDzB@QG(ZcuCLzZy)tIwFJ#ol9Mxr;tK
z*6<2~XH_1mbLwT!^~8CwSqcI8BchXn;1lWfQQo@6F?v?Tfh3SO-^R@3QTvTeKj}p{
z*Y&86jSD1HF($Z^-QStSDzT5hyaqdt56M7%*UH&$A8orGN*L7?PO5gntU_kpvtOoe
z`}`B7OU~?ozGa$(<w^dGfpor`IicP~I2^1g-6P)S`RYf*hR{3po;&vwt{y)i7hEhL
zsLAXS4CYaPR9PeMnp&i^J<``u985!Ox8X%Jxh{^C!Xm~Vq#BFZez^NQ@h70ZN9>qM
ztRkXot8MwUBi9a%f$XhUiV`n6>!R;C;JHy)*GO&Y8d!W4@2?2Nrxc2gsZrFR!~lLv
zVSD#RtrPT+uN|2bH2wDz?V>FuUO%$7Wud;X?=P;ceb&Zmn36R*suK3qCYWfS%I|un
zVSlT94ud=QhGVc5C%m^1D}~j`DYT7=RBNQX=M`X%KM+Z%`7YgW^Pnl=dqkGRDeIRh
zqSmGMNtJ{0xCHi*I&y2$CQ_T~`ytECmCuW%rK6d{?42VSlSQynn9$dS5o?<ZikF!h
zW8wknFC_*m-wn;3xPt5bC4>`xcxf)=!oC;VOJB=Oc(mD4<#TMb_K1Coa6J(|q24hx
zZgF@CJ}osxY#DdR&OW+;$7(K3CjR=AVL0Y(X(zkWzVAKRpZByBs3QF&NN$m`<*bUb
z^`qN@M3F6@WS->1XTBX#%fhVR!yCF>LY3rKzX;hjFrR*I^~0o+3hDLlQGBJmPV!&9
zqOBkCYCj=e@a|9u%Cr6=dRkCIvGY3MMIeSFt0G8YUyHVGpnYa%*zetl)$*wbciZV{
zd_cPp=_LlFv~Ak~R(Za%vi3QUVn{f!k<-v-+qmQB{-GbyXq(PH$LF7OwY~an!oQ9|
zSzp)t<9>`MoOpG@{*uCkgPfZKe|_t?9(Q&Nx?0O$a+lV)#zz9GNKZx|;ZPu}P!G!`
zNbP#NPa%*SuK7!!*uLL}RFQZ0yJ)w*C%x0F3Oee1YJwz+F!(w6h&UdCQi$GX&5#(y
zsX$?+FeF*uqZyZ&(H?cV`d5<vcr5tnvHEUq=a4A}Rj$QxGBCX1=sN$B7fS8J0CkQo
z%7~M6=w{hB&Wjsk<^_%ksD5sm<ln|)m@osyL(5pKE;FHw)ERvBAq2AHGNw@JBnpaS
zWoq*jx)mMyC}XBWRMB1J<qs&^W4c=-vE>eUECnGf-wc_fx;Iwv7#$u#)K{P9VD+-c
z?IJ1Dn(VIidF3OatP%)`#SmftP`X6)`uj<4??LXU$IKEqJWlKaeUCpxb)Os%oDV#9
z0Z>&qhs?AAg;!S>PD2xO2|3HP9mxAdlSx438XMjkqOzaFrbq>U_K6>&IEko5?AG*V
z0PU!L!Ez0DpZ?T(<;)dz=`mPn8fNZ|2J;Gl*RWrzuTOmCS_inDmpQ`GhJ-hM9Chv`
z;0s1`TSY3`gwVNLaejo|8;n@0$0=6}ftEjD8pAse|6EMOAx2?Mbn~_3=CGhQ$BVlh
zZiULizam&u*Ic63ogLPT00l2by5)@e+jS93GiyZyoNd*djT5Gvi6LKkse^j&+}g)g
z>`idq=Deew(D(yA{}Lk-g$5a{yRKNjI08s*_Q@2#K6KV~dHGt))uz#V-TBg5dD8?(
zCQ>r7ODGW*D#OXHypAn&<yGK(@2k)J9^$%<N9EWp%hE4Eqnec%qSOduUJOyJkGBFx
z?jR{%rP`Q~aKSe>EWhFHeO!{QN6@8e!DG7Nv+B3}uSd8>RPBFu+dFml`*+DF+R^3O
zIckS$#Bi_|B3P{=b;cs3>uq;!3}J_4isy)@!8pp$Lgz|Vkbjq~uQu>p<>BrIH$;WY
zm%@$A2DZDw*{jawfamRrbf+#U2?i<ecFPLbd)2PEhHcs>mpEauuq?Y5wVPcM=#RSA
z)WJA>JhuGJ%AEC~&NSUdEhS32*1!x~!FVW-JdWgHgkFgClQ9DA7li6UgPN{{(~AVw
zFE(0&i<Ag(g4$Hb4ep%-KDqNf0&*7lXyO_6sYkKn29QwUM02|cbPt#$u6#t0)x$97
z-7MZzaqY%biCr`jxOg&DH=+}?mL0m!5wU#NS!NriUIXe>(((P<JPAK}Tslp78}QPW
zx6;hYgy1``R!d$)sgj=~gpupc-yV>EL=(K}7W93|7B((#Ma%c0Q#NsXex;kHNtsF)
zJ(*K#biZ4Ekc=`4;{qr$_^C=oq%YqDP`(8-@SM)w+?hP*JUn+~29zTY)nC~;r8_yL
zY3q`N^^5Vag<4Qo2;wmmc8+eBIQy3?g_WOLO-kL^X4plC+Sz;Lfy~Npnl>W5s&A@U
za=$lm_>I2>I@##kxtnp>G1)Q8mpWS&_-><5&(uZbDLmu#Y%PnOeJQqI8gp8q5{(?f
zS0DP1mH6zJDru@l{sJkc4hH2-pOjsfN8^@K!wthC3hNfh$M(CjTlBfk(Q<+l+!727
z(UW1{DwHmtRM=3mzl@O_P<HkYadR@JgWqgBhjAqB$mQuf4|K``Z2FzLv*-6b2KKT?
zIfL(qek}@?cEAbV>Er)clFnzud&^{Gxx|^JR4MgIewFiZdnM{7jz?935>c^lSpTqV
z*L+6hL>1oTluhMVc<59_?rK@y&(O%gkgtwBk?c2PoCs0zY1P!cabVt;e2#|_J6X%P
zso%EU)+w*I6Bwd!SWM8M%SUdSW<`yN>@q?9G6x({LR?ISl5S~}Wo&gkAD=&T_-D6}
zw}X_5%X^`s^>`!B8V45v2Tazrjc8M*(m76NmpYxyOMbLb(@)i{K7wtbeP;>hc;Jj6
z4O;HDz~+4&Q0Jf=t45}n!Mz<-(n?k8M2d(*SLcjMrR~b~s!XM(%;B#QWd%;o6D$-*
zRuy@>quZ6MeHqfC!V`4!0%|$XAEEOGwi)LLLk!Jsu`;>);`bqC&R`xoy*144eiokw
zwiC8Rn=*Kod#o=aoV~K^7b!M!dh8~9NGf~TITW!AN+%8rO{uF*SL;f!QhjH)x&Xt6
zy=_-R`hye<*tLPEVp1p*)sCCNmtWn^H>O+Vta&KcJ1yTEA>nQ7vH}QZjl{H<Wf4s7
z$Gf)l5iI9aQG8aR>b;I2kNr~iQd_ABAe#i^Iz4LJjAb1`<Q4~)?7Kc(?Jle8_7nWX
z2o&BGvYm_{^}vc?VpPGss+<z0Q&r^DZ}gb^Bf6o-L{CD$dJ0z&o6_F=B+Hr15PCE?
z6j9BWv?pIhqTzC;B0QU=u^V{k?Np`I<eG=B+K+LiaqE}y?sm87!mbz3>y>eTxB*RE
zd2@~U-c0S_*49&bkQ0ra&njmiLw>g7Iv0xQ4ZW3r^Ooe!+PzylEKzsXmesii02I1Y
zgb$p619UXkVkY<qlju971CEo$%3^C%BJ?L^rEkk1K*G^(vF|#!Y*J<)PiE)skd!EM
zHYv-Gr~;dm`F>n?%WKX!uZ#6J@VV=a3!ZeciW~S+)d0sLe&EvX2#D_7koYOotq}W#
zu<NTLhxzPrFg`}Puk<SehX)BEf*3Rh<$uH??CDJA0ler2T1RsVdw`T`ZqB);y4P|)
zsMh)(3hJnqpG;ARn;|qlZLmqGJB;vT=}(S{B+JNF<jkDOyzlv;&tOemDR{lXWZh+7
zx5jeJp1j}Z8$tF)UwfFC?Tq?84v)<@-9_bMDs0Ib!w~{=0KqS{Ul}EKs%uvub<T#|
zqIb9(XF4TIl%;}Bu$bC&O<E~>n8#`Dee{zDX|Gw;PIy;Oh4i%2%%fSh#&&K|GJNP%
z($JDVix8f;PEg=${QmUT40XSuwSKbT(~iV%*z<H_FG-50L(a+-+n8=Ojlm6(6ypVT
zg`P$ytQ7XeXK_&2#lSY?Ya><)^B~N1n^q^G$4X&RUI`zciIsQ_rPK40D=Fri@acI<
zVaX+_XC1&IvvSq}&fRrW@_m~-k9iKy-Q1sHrLcE?p>^X<2#Jg;$tK32t`h$#d(#fA
z6!tDiM@Mzo*yH_<9HP8*eq^=$dk|I%lk&}x@V=!ByXVq1A|W_ATN5IOmBOSWIW$zC
zbo&o0lUo^HM10|wd-?DgRtl4jwSKBS+o%8T|F=@uql-6wp*-%mLRNT<L9IkncnSjq
z++hfsoQvkqXug4nrqFBbOq$Q4r3e~#G@n%{vnHB$5q7gu<z^4MnLb46E-t+$nsuV9
zl}-K!I<#2_!E6=!{sc$(JXGGdRf(ayjb24Uz@NcDzU!I%sUU94+b&j39JU?;Hgg0`
z7@9-#vdvAd#Ve%0U;Y^Jo~9Hg@!`GHdH2BUR+^{~B`ZAo41|=x<<Ri^$quk!jvTkV
z%J@b1=!ySmKf&}#2qdR<e2YLjSXFUEeb(*D6^SRkuj)L|EvnY7U=#2xQFZohz+6e>
z{7GnLj)MF|->0_<GEo7~2HKQ@6_ytWK2H;Tv{#TB2+c&cDKY$-#429ra)M20S_ail
z)vM;MOHoZUyYIEiXo8<>#>LE+tMwBCHcg!MP(0ckIpLhvCl`HVstW6```f(aQ|<;1
zj`!`H$kW&V@>vO?0r+pP1-hInx`ZiW2TRC`Xes4fC@kXbax3Nyt3s_*8A@T!H$vCF
z&`o}LgVVU3Um|!k5sU+Ue7-?$QMhcrep9Vz(M3EqB9&*AT^#bbL!Z$XTkrRDaQ20x
z_ow@I9-%pCx;pW~QvH7sVWluCl#;m-$&WRTUK5oNN)9G}hOHzBpV7!s$~n*m9cWaz
zINYycp!uImVRQ$?ZfWmCT(^I`rjM|>t9S!#0St4wrj<-v*9_s<Rv+REK})~+y88tz
zXx%Rj7gr|*H^$bVPZr!utTYXAoNK(P!Jnm8{r+3IZN)7?ZnN(sT$VXhm7*p&A+#gU
zMnK%=_(}J_(lEGvs=M)=ck`xgIeOaTo9jzonG?JEhz0C^9-G4RhJ;ZzOmiZe=MHTE
zD4%De>VSWMl;2J_k<Ha?ooTDck}8|Wa7A;u!tWWIprxh^!lxx>TGV+uuJPYXVOI)z
zh&1X^a-lIJzH+%0s2&N74vUE1QNh)rS<sZNPAn~ikg<|JKt+K_zd*~_g7{vNsFH_j
z8B~)J4~dlDTS3GWict8A@?A3mzY3RY6SZ`AX-t?2@qJR~j1~b3svRI_%r4^kOZ{z<
zIO(Ng_^QL13I_703!F-uLc!W&`Pzj?Nqr2IBO2tS2{q*E?ESK}g_K3xk>KRu%Q&!5
zyntuNzmvjfpa4Od4JaXTNaQPRY0&`?uk`btF1Zm^B0Ao#qmpU4%V>2Hp=y~p(m)gQ
z8$vNFKrf*C`hMhHW5auCocA%u#nd8Lkh<3#({-21Q)DK|#JXtW_yO<YQ3PG`0L~VL
z;=0Viw8NJsZYD+D-@us8Mn5xqjVPYhOkq<&qTFer3fSpQ?`-}(Ou_BAd+VlZF+^_!
zT=TCttZ)dII;-oWWJ2!4C-Q9)&NOIvKbRzN1o?ibSM|M`JOO&Dzqg;26%5~kvdZ1<
z&c^?tmikXAEYmJMOW>#{VjaB!R6L}@lD^v>Yb4I@oLYCI*P(;V)snF$<gJCa$1(zX
zNnL1D)GIR*&r(a`k1tv|h%D~+-tEq><w*OOe{a>dbtmlXr32f@CEf!PzH_84Thz_X
zteo&gNa@rElBwFhTUTWZDXkrWsrK>DTdCO(y9#c`SGTA!jD+95cj5fGr*<^ozlB|M
z+)7QoKi_lhhT(eguMH1x?*~<k|B%A2m+~b91%5tOz({bMsPHLJA6zH+`j>JB$(~BQ
z+--x`Kq_j~NqcrG-hut9@6kMr33>H;)vtd1j*>1Px_l%b?Xa#wl}uECZ&6s3aO~$s
zr!Qz0p_<4z0E;h{C*eD-dvt#3!ESFmrg2?BBzgXzjfhpikNC;Q+RK{uUDT)}fvMT)
zDmT7)XDBBgBXqz@gE}Fn7%H!=zv)US{|_nbc@s6pwA7?8G$mXb9V@3B%{iJvv}&}P
zU@cN9G}$>rE5?viVN0%dhvptliAiF>z?zH{)1!z|O{&19o9@d;{ft*heUj>U@!tWl
z3F~3BoE}B~6EOsZT!puTur(V+Oqy3WGH&u#Z$hr0tX<>I-Aj~EaM4ZSr%;k)r{pH+
zPG*qT_vGOTzg06CcRBTmwy~&W6lp;6afMK8w(ut1n3fHZ)4<GmC#C#sb>!bt*rVC4
zNV*txkud2VBSBpHil!855PQkz)Ob#R-zesvus*(@YcY%2DLV$@qfU}v_4H`0lPZ4{
z^WVj__$-T^(#xxE59=knQcmLudzS$6fYD^ca7z{KR0giA-Z4MA15HaUG@4A|yx=KO
z+MPpgNT`K$lqE9uaN@spn38%xgqLVkr|+$ed03dt(Be%aN+8JXnDN-)uB8_D1!FC=
zsud&@Wco)6lNl}Jxj$)~?-|1K71BQ{c5VAoGCG7#(RNmY&pW&wxNbfvKcP}nFCs8D
z$YywZ^e+07GR;j+ucL=NlIh*yMOg)vI=6^S<ZD=Pf7MVi^QxieUlsFXQFGH#Ha3b6
zvZdxI)f=`SVduaH5j4)I<$*;R=H|rP-aFt4W4ucdlD4PKFd954k(o}zUGvm4;J7LN
zOS<D6zYlJv299MpHZrdO_g0}t(>s5pu;tljc2qY6-7&=Zv<1|YfPOx@)OSQP>)<;@
zTAm2c&QNK3&IyYgPjc$MU88i!l*^!E^}@)jqwW^*$tq)Nl>{o*ux265?YHg8+KYdr
zurL05(^@{yap|-+ZkU`?#a+u;z`ajtMRWy9B5pYObpDpY7)Mt0nZ&gVl-Yxs&Ea7y
zs}yhpRcMv<A1MqviwT8}gj;2#a@tY-Erl`k1$3!56q;HyU+gRM6nFVr|1E{l)#|9#
zu&|N;C52@=!+pJ*2LCfD%r5%~Z&dDBQ*+ioG2rx!!$tCs6eid2oM!0J?dqh$*Q?dz
zo#I61)V)%%`)v>M@q9M-w-lx{uTbHQC#Z%F=QpVx&%2?8B%dl{Z$Xe?mPiZ8Rq%yi
zzooFVa*JARA$%hN)uJxeDlalc_iGFg4@SsVC1P5-j3$3<HZ3~RDb&}w282gtAc?1V
z4dpZGzkbwcSGOf_^C!CL6ud6;8ctxzraD{CrCD@5=!BKRmf$|OV6Qe`tI*7oIXq-y
zqq`p+5QdX)WoXSX60CIRTWD%M61TRr8me<|&es(}R&pmSjuPh_x(!KVia+iVxvK*H
z(#JO6bP`1|D7gfs|1psE-j#S`-n3!`$krA@5oll_ut9yh`H=dJbz(WyYjV6!<1SV^
z5GPv`PmgCj`si*TPq9&OxRUOH8c1cDoG%?${#9EwM+(cH>6~n=-Y>NP86CNT#Qv@i
z+i^`iOKgh5b9T;w?69z0w(EVf^>Kb6VM5{%D919YyXeT|P@rw+4%x_*NCoTjs50t#
z)Xps9XW#xcpR^z4r?goG1mfQO6mI$xDxLxO;w!6A1SX_$+WRFXF*_6eqcvIwLsWjg
z-8=bm-M6okuxdoR%7^BzJp4OU!`AJtSF8B+bl1LXY-~STMowA|tC^iU>)6j#^o-xb
z=hj&`^v)iF1YfNY%qFct&n{$?<Pk!he9jhUYjSU!MPvh)P~T0%f3e-;Ba-39N?~&y
zLbu~AZqTp)(%ypnqJ(zw15mG9IN9I-!~njJ|Bp#wDF(#piNx6x#Q9VtuMJ4BQkWkR
zTOo>J7QxjHV<uB!!$RskIBZUP@3B%Cn;x50G1+HTW-2H#JDlq$hE@^teig;ggMj4W
z0AHaLPjT306M5<}%m71ne;6~-F&U_4cosuPwF){)<iWB!R4^t_6$<7_o=q4_4;*|6
z!%{~Sqy=Ef8qgV>wH*bz!eQHlgAEMX=CKfr2qh3hH)TK>0LQXjlnW@<RWyB^3bQMU
zb&-Qw5(U1GOY09M$0=f?0&=#y8(ilY0!t=uy241Q3V<z%JexSQ^#EG$0*3Qyo_aWl
z3d>}n*c3%+u3*fHXci?n*dI-a6{rY~u?QDv-U`%?L%Y91OT-RV#L`f3`W_79ekUa^
zn$jNzzUri;f`W`hxsFgw{wRhcIBO4-{0v6MJH>wOPIqa=*k?dn<Id2FMVeqNcd5B&
zVNCN7&@PJYz9+*ytm*}0K83N>qZpi$A?8L*^Eey}*az|T<`IlpbBe1RN)%$n3dH42
zGh*3a0Ud?1G}J&gq10GY$R>%YL=-#=XN;;PeI~}DRm)z40=vRV=FwF5JQ)2EoW~gE
zMI+|7?u?vMT-T>)%Jw7(mM*izp}v4I*<t98448Z1j0RBd04SJDoYf6Z*Nzcp1&I+C
zh`8bKI~K5xOw!XBal?`zn>fIs74Q|3;Sxga52s+qVPl69i9xBwpx_=1lvsrs>$wrs
zGUUNXJCSU7P>@d@ac3~K{VFXLilJAGy2XG=62_eDB~yf^C<Xu(Vf2P@YH>I#I~*%C
zQOpCtE{_@6ae!G6>eU)xsxfJUF_1l(c>zgBTp&MsOj`)29<8CaP+{J*5`Xd-tcc;I
zEKrgHvAvp9JUU^dVpj$t#5z2g9zo?<#ju(f?IjY}iKMnifU{5NVyvhKk*rt^?7CB#
zIUh>SB}%@Eea}!TcC0-VB78NaasUDCTd@k%lfOR!Db|o*B5y4~iSOQJR6>#enq&)0
z)x3h!`Fv1!D`42{q`!oNE+G=C9*mnvpb|>>3dwYdV(W!sJv%Vg;1b6Hk`$1ad|<=E
zVRmS?CJE|Gh>Rf=^i7-#3r$&~n2u1an*dtN6uGn1J4s?x^$==H^i6apr6Qcf6>H%I
zlXW6*wHa}3!XfEs^#&N}J^)KH(H-HCts677yR!~J46bmDzfY*Up@`=@=?7LosYW+X
z;n*9xS&VWz7MFv`-#ezIGGa(MhTfqD4nU~uMU>}&Y#}q0*G|Xxy&Ayn2yjCU+bb;i
zl*%fOxFv-HvsMvMg45YyfX8q;TpT%%Y0W_^*f5B86#;QYfuY_^;wU096oDmHfrAn;
z)Diojz&~envF?}?QYJ;2u@^<uQ)5LrOW%V-D2AbR?=*6JtgazW^wX2X3<|~~XYDvZ
z8W`Iqk~juVX8>n4hk)vFRIkvIQW)-guWW&Ea27yz>y*nCP0>dUeVYpLM^pI2!7R0G
zMX1|X%DRL!dNZkXJ6@FN)7uZkK|XNM5e?V+r24`%g>*fz=9L_lSfauTdf2!|(1d(r
z5r>2JX{hZVGZrIBk0<W|(GOH<X*YxQuZ<^-`;T1Kd_b-+)hiUxuHj}Oir5`OY|sE^
zM-UR!lGoP~i^0J^Xw?<~z<C_aHBW~0rxNdsJhwXCfe$<aX!SqU5HmqR^$;OjfZ-t0
z+x9VIrxi(-GAVdQQyi|bh4YZDmOKx~$n6vqZ)nMuYB^4&SAq4sU<8UNVj^4;9~iSa
z0H!2CZjlbj3WmobUy#=k7~s$jbUFz(3KOfa*g!yw9(1n|gcK4sX9(~;549&&U^59S
zc_3SmQDDM-W?yA4k6A7|Nl<bpC4~g_yfX7H+)fHbd<jruhS}TSlcZz^O+k3CP;$(0
z##9vyALEPZjKlRYlt+7M1+fMph~NN{l|HJZZCptm|cu(_Urd_7s$Pe7J%Ix&=s
zE&F|IplJY{L=w&zgJC{GfeYc%0Z_GXbk2jFksLTi$0F1r=}HS$N)5?m>W1PC%0d^0
z%*89TM;KSFIwAuotxP&=v&qYYVAeNH5Kf@}8HRQMqQwlqm95M?507yyU???`cS+?t
zhSM8>fQjG4jg3hq(G>eg(#UtdAVZf1M11-K(w`VcU&sSnE2RrG6LHszD;&SIGo~v9
zHi8)3JL#*dAKR}!PDv%aVa#ll98?6?eE2EEqmwOuHW2>pl~<<DcPVf^9N|`AI*5h;
z?sM70As629*H=h#TpTuk6nQ5S*n>!UBxRYDCUybKng-C8V`zD%=?!3F6&Sja=aCi#
z;DLJ(J!$=mdu+2mK=YX#2P?AHK;Q(etP4Y=6f_sUdYAi{d=3NkYhap%o7-ayr`?lO
zZy}ecViuHR%9?K0qsXlo;?Q&?t2k^lrp!~y9NBkiAEJnpgDEFJ(o43y{`9c`{xJlI
zqkoJ6Z7Sb$`#@ji0Uk?F5XaClVZ`xZil00vUY;^<0F7+VA|fY~*glbsKS;iUrNk;H
zUCgj?o`D$ZQnZ@An?1Gb=AZ82ka2zkdUOSpKtR7lsHZyR!@u3z3N~_i&gyQOeg>r)
zX-U6MXapBS9+q@cMij8Vf-$Yv@Ok}s_<)@ifh!^f1sS}895xCBz-kz?vu*207d&Em
zQIHB4RT1L8?J9N;b4f>VOx6Pn5zO2kAfscj@x%Blq?-LXt?VSd+QQA^THqP<bp;~U
z9zjTEQgDXSlKEP+M<4fef!?>3+<cb8^`c1U9YZnTCRXcoZ7C*v$Q6Tl$bn**m}%I<
z(5iVF8~QR*A(C!+kfmppmANzKLBYRjfTt+!{xr(g6Da<q@FN)W(lPUoB*@VM))ZBc
zf~PIL%9(b@+GKP`)eMR_FMcH6B<?aNUS<Af%rsz1tMjbu^^b^$UOe;eNgb~kuRT&!
zyFWqzHH@(#RC7l?AQcu@bnl>Yw4+L~2gG_0rd&5gX%oz^cls{dn{^686r)T^=j~x(
zMUn@1c*+9oRHjuz^j)+>*g~2kXYqZlC{}?bPv>2vu=*S`&=O7Gi6qK`7(7B14kDkG
zJte6GQCi$0wnSA=FOU(7jy)<Ed#2LsrNUBGr)FWsvx%z1D`Jqu(5~FFYlnkIK(z6b
zT=$PTaIYZl%$&GOlQ+Afo_A4-UnyUpb$cg3S{{M-&X}c-g*9lVHdtnYwmRF=^*l(}
z^p|WmF=NKLv%*KpPyXLZVQ*O%(kECOb0LjO3s>lcX4b{-fW?ls#b$-YCDg*G!qT|K
z($XI+Y#BS9n|1l1Z5b<w&0Q@V=PqvKE)On!zOeXwlDkBiw*t&tz{&eO*|viJ3j?xT
z#Oh$QmP?F*D|nWxx7t^^!K<|Gn3*Nk^)^No@bZ`3)!TWidWvhpfy;LkH{ie46av?n
z^EO5m78vi`@W}&SA_#o`U||e6+qWUKm#9Bj81gq37V`%Si@{=HsBOPrThA=Fqruw=
ziaSYpTLIwhckSD4;O(@$9mMhu%5t}Cc^3iR>kr%>2Jc@#v)sX0?l%M;wzePM1{`Gn
z+CeDpmVmb_e(jzpZhsHl8eKlzQ#?G&+oSLJa&38l7qmtA`G8Vs52W-pF7PW_aaRh9
zg<%eEc5Dx}f9+5_c!tHo5C_CTTUysgcOD(H<)7?Wp5a`diL-r?Vms5j-iNUrYjm6{
z<bRV3ItUFqyNx`1#<p$C_9fx^hnMBQVPTDbu&~CU-&j~@5W#ya78d*)3mag&XbZl~
z#ay7-E*kPL+VU@Z*)HRhDLz06Jv)g2T}iS6>Lia1rOK_)hPyOONw3F}y3NN}NK)4(
zOjW|MQkdFyB1$z%#*<;E^l0U}FPxlKCABoM;Pz7nTBn?y$*7@3LDFQ2=&x(q9PAeA
zIVMRQqc2rMcW;zcm)?1LGnWZ5G=&+<&?@N?*cO-@$-=M6+yCKxcd$<8o!zaUGf}!l
zHgSu0=VvQFMBeo>!I$Bv=6Z_2do**`H$uQZx~+5}<zr@LkKc#qT9p(Yn4xIOaVlt6
z{(mWjkzd|&c=}&RVHAO~+bjPng$22_XI38ls}y$qcFgyPT+<3c0FJT>ArZRv&GQE+
z62Zd~5L~#V_8F?VK=BFA5b=Rbju7kK0~nOl)2h^hQbwX46(-b9Wc?IZOw&3}ayiO6
zUiNT%++Fk+k&O>$UX2DNJDFrI74y&}CKAfj&zYnd<=*GRr*5N}Xy*E(fd0u5kzK~)
zcrCk3_|E~`EGH(7$3nXUDjV6F)gs+ix5Y$5#p8+4DwG|iuQ?;ZDw5sc&0rpO58Ypm
z`V`z&nx&}S%c)*c-OI9gsLcD7+mgHPc%K->E4O>8GdHXINo7U|cgb|D&^=kTV`jOT
zjmt4ls#*?ZnX~GDk#IzN?nA?fa2YWVtafvtAyk&q-MDlS@{BwwW0%+LxO5{<Av~$<
zR=eRugH{y>Nq1?7R46v3*>R~YqOAB@EyG$LHyr3QSG+&P9d_&JWklb2`$q~R;NPz3
zAUV-scM$MJK&7&L(OtyDfjZ`55h6IkNFASn^=hck!^MK0@C%&*&KC%mSA)JzJ+F6l
z2S=#|SYD{KVKdkes$GHOQkfkg-P0^_@JsJ0ZQ;?=Cr>!dyg!^J@sP&sW~hcn_gapO
z7RoSpg_M1h1y#}8=U|8iV;)z=CvBz%G;+Ax{TLSBJc@?)e;RpyHeqeN;WZLTA@~#{
z3SRQYN?~Kt35W6&&(|aF{IbaIli}zp%Fpa}o_ift-M{r9?)ptMktd|@AmyfUGhshf
zTHuS^&C+r$3h@k35tRFUq-sExl;k|j(hAxYlgdU3S&b7O_dgj+nIq$nFwhJ*djL%c
zc*^<MY>|;W$ExRD?jwuJa;Yagr7}I;!*TO0A>X<fEh;GIsq^TwL-`;0d8pJ4mZp%e
z#yQ>IuDgHKgbo7<zzGxv^6*Yxzu(ew522|<Ix-k406FbKiT#j-MbqsYHr-A`q8f9h
z)?I5k)zZ8YV<g$uM8XD~&TN&KXE_K$(p~pRc^h+a9tk}8p2sX|0tLYSNf<NVacJ{)
zK9PQB;!W*IS@)qwly9SY1vX=>*%`X15{T5<xjbTQ3a`y2%`qf*(mdkEQOoJ|ME%l3
zN$TeHY7AeZ)PV1`?ne%(izR!MDwB97h6xlxDWeC}vbqz3?-p{f5f7?~i6y62a&mGz
z4(d83Ck8DRa>T7^!5&W~nt7^s3*azuHCe}3Iv4Rzch@lb0~4%Rx}*(u!hg6As$zy&
zgq}9vv@HIb?nqrMta@X_NHR=iXCe%kTsCr4vtrRKuqg(c9<eVU%xF~Wv&a25<R0Ud
z(|}<Y9FNwX_`s`~#Y-sG82s`fE>KI!X-jS`Q=fcFT>V>EiTq6S9fmXUyfuapSybP6
zXA>yzhdFm5fwo$x6BP>g-nK&QwjS_(QVz>OsmAr~6II~I*PLf+5jV-Q$ZBCHup;9v
z&3?F1YWeAH!I>2uYrd+?meS%{d3Jqcv(a4K<6>_7IB`yn2^7<DiEJ9xooK$v*Hx)S
z+W6K2%F{0soSs&^$;o5Y(l)XoJGKxf+6}V75xq-+sese$Ne?*PzedimIN9<uERoEW
z?b=s8?d7oKE}y$RYKZm0e|_`l=swWl1m>Wp@n}Kzey5n^o3Nq{IH=VGaO+#mGqs!K
zO(gRZ-zI38Zd5o%N0CLxK&r7v3J#AEWFZmv8Y+ttp4?`7I9>corGb3h1<t?Vbx0@C
zhClA+^~6jbFsXVa<LZ8;{qS1)d;QQoZm%EW*A^J2RA9kD)w5iww)DLFP27TnHhE9k
zC>tcA)_NVDkNa8tEPaq0<sz*6`Qhw&gnc_xrJJ9%)AD7pl=x}Gmw-r-P`kc+?KckJ
zVzt%JIB(}V*5VvPxbH9SAEmdIob5kTB70oij3+_h`h||7{Lvxu-i<0v7r2i9YIL!$
z9KY+anT~%C11W?2Eg#YNxKiuWuhQm{fybf!$Beyp8L|rP#|izwb;c(pgX+J8lVK^J
zz8L&Kn~>L}cL<1(8J!Q-zYJF!g~r~LvlpW&7mFVyW0I(7mT@MC%hn;Y2M#pLJ*7kE
zlILtGR7ej7a@F0bsOXoO&YTExbwgsmF7<2X7iCe))`bg~)}gL6BRPll8M6l4T9LQ%
zF#HvXACkx>oM9iH-8@sflj{Vm%$m`8+E7+woM|$iHCx(n>vl=XlY1xgZ9X3+LQ1T)
z@5=dpY!*CwTLf}8rDSe+#p7d28_;a!b>3gPSYOgXe#oTvrFmNMvEeNq+szDW35zD%
z=25{(c|-dpc86!LxdU9EbF{+01-=8G<Q{HJw0{02RN(YhDwkI0;rnia^Y=dv4ns6j
zRfy8#yB>_X<8i3o$R~f-uN05;(2;-1y`&=B;_kfBNi1Q>@}nct$}`p8cf(@jyj3Ug
zYbtl-rr<Lfpofsx_R-?zhI)i&Yht{Dyxg_St+SGGM3vV%+0s_2!i%Z&_?+UDi+<)W
z(gPh7KHm~EcHuW3+opyxm`Yd^=ySIMN85Ai-?kmN(!Z7+AM@@V3D~<EDK~#M=F^@a
z|Bi5Guf;{)?%jpL7bi;pCBNMMC;VGSWqOx|91Pz^p5#ec2gx^(zmU^Rh*D`heSasG
z>8FikWo)sM!ZyBM&P;myS^gYkpS#C%zQa6sH%j;ukIj#kHHkB4_O`>=j4#WNgv^n|
z?WLj}KelxqN#?q>X+<(H2=8M`1v;cYy-irJb!GEPQ)u_A5e_^||9tuVcE`7wFE-!0
zX((UuXngw)A+;d=b-dD{blG+taB3g4ntmNr-WZfl&oo_v?P+J8De?QF20e%%B-Hey
z8gN|`L41AoK=i&FgC=6OA3=SNm@P4@APBys4*{1Vp4|%pa(hhl2a7U<Quz9dJ`JJu
zHIi}&kZB4D><v};XiB8+{nb8HnITMJ!%KuGREH-(!r|YfuzQ+1+5=&x3_kh}|B%9X
zA_yYF%^V`Y{o&SsNnzU&^$#NKc_MRPMY#PXg_TBf(nfl1M?&vM`u&l@!cD>h&Lg8g
zS|A+$NMS_LS{cDHn$bCZQAvNKuxtmjD3j>?kA~?3(O4<0Xgey8D5i`-zrf*-6!x|$
zqO>%oPFkaq=(iNs>=0I~8QYd|yRkGDD}{Ay`n=zc?Qc@;)ch@ljXF5=MZKJqh7E1M
z#7bdvz8VueaSH?TAEM$u6UC2|#w}{b$E?L+qOd?%?3zjZL8-)6Y5XxyLe@b1p+f>b
zUcyOf!i8qknQy{%6aSBa1U#)o*X;yAbYdfWBK}~+a|jM~C&4psV#-W>cq$IH0nUQE
z8UqA}p)>JRI+~a_d6Ng1tt{FU006k(c-BLJ3jl~vspDZ=m=X!qy@|zS09?`0gfhtr
z%^aj<De$OdzQJTM;uI^+6u?T-Z8cop%oNy<DEXZfV@D2U;xtR?>r{S5b!V$o(Vf&$
zWwnLG)H~19B6!m7M!zC5PPY9NWonu#yptx*n6w5UvL1Y8$C&I`mfrk0?U_utYjc`K
zbgDQpfLd9NAu(BeC;ciT-ESwub}BuVI6RnG-JCc*bSJfAf=sI{Be^-!{znF?8Jx6}
zsjQi)VUwxxTuo~yS)()U#!6~YStOD-tHBXm$eYdNo28zbWf_el)(oHq0EjyQxtZBM
zn%RwIIUR`Xe#gL8Q?)jk42S`aIB$xQL5|H%j!Q<)@J?>aWX^(?--MRhRC5*pfcsqJ
zRc&JKs$*i@kKAKN2xccQPa|*5Do>p=1p;}+`vb5xk$1*;9ec!^kN*>V%8PV;mjA<4
z?LvkEA_BlQNW#fNKK__X5QBPyK+^7dshZ-5016<o>92TkpnL^uE64?8ftnhM<!3m3
z7D_aRiFvnxS}HX<GegHQQ#va-Vh5@5q2QKNxCr0t+p<g&e1%^klJPnV_4oj?PPuwR
zg|s3Rga801K%KI)P-{0_&8hHqOrben@z?F5M@+Bbvc--}@wQII3^Bz{Bqg&0#V%$@
zH>Q$jEib*aOO72&e0NJ)N=y89a|3>sg#U~|@Rbf}l|~Ge7Dkmun`Ot&m!@PzCy<n(
zc*|1D%Stqn>APj+NoCo5<)IE``Q_;-+48cONUZx;?hsvGPExV>sqBq*g+lGCnwW~Q
zf%1m=l($(G9rHzXLlybE6`f9%#!VI7S&6+bDo0ylyUHsQhbqUk-+WE4ocx(EZT4n?
zByu9=jbHhjMZT)1&)$6AjmOAV?d*DPI8|*#Rqc|z{nA%;FckNN>FsyzCnwr(rySm%
z@4mGuetQw~^6KYXe4U78zG^Y;YJ%bF+^A~eY!v%kHE1E+g0LoiNK{p`hM7O;0lq#x
ze<{nFKZ{Q7W{LSCer<@hS?m2;LH;0u4H91dQVvNxp(l0w^wnY&F)ZD+QhRl-CFaY;
zb&r0kii?CO#nxBO+N!peAZP2eNE@b$9d+gEM(M8`9xS*cYqamSmfWrgH6d+;d*5SE
zyl2i|%D{=s!QA*HR%3>?&Mv#uVZqB;=iLN8lN;%~XeJ})lA5Q?4Ro4~&-cm>gBzLZ
z@n2Dq{`aM@qKoF42*NO~`jG6>!)gNaRM>w<3LErmm8d3oINVadOHp;yqO1J36!z(1
zo5?2C(q7wgw)Q+$3e#!-G~D(%ww(glzA@Z>@T6@kyL|_n-|KX&l6D-&wx2xgxX@|)
z9^0{!eJyjz-#NRW)Oymf{DhNMtP|I~Q^mb=DZ5j^pyNq3!Apb2@mO>T{O;Y;QtJ=u
zlzYtJeU=w|T^wXx%{Azm8qY&a%eI|ISr1sS(oKc1o6)(uMN~nYg_Zw%&4FRp2%=Q!
zJqza|C*Mf142wJ8gYE-px0X4J{74tFxO)VrSIW8f-DHn&jtm|ylP@=Gn>X@>4eN`T
z9^J;C?WA5g|2|!TUVZak!~HJr#=Zx-{WVE_PbB;Ifku{>EN$NC$Aq#oIDMjveP)Z@
zJ0AU>?|W|~4;ZEQ?@bQ$ANM`g9rQ6Di18ozQqw<)=|8F&eDuCPjHTcA{eZLl(6Hzr
z9`*HLPtwqrnjyEZ18D-o<;O#nEW-!KgQJs!c*(<KHN)=my>icnw+x4?&4&o62j7sf
z4a$$y?T-{44-JhBTT~9C<VO+v!?R=~INYO&{)6%UBZSEVOZ!8gokub+M|NH^jj)Un
zP7U`T595Cw8vu?EJCF6j#+Lnu8W+b_{Re-Tk9m+y?CMUeEso^rj-FPIe$AN}G#oGY
zAK%J>5G;)oP4(chPCO5pyzyqt@%?1h;zZB!1cBK2+-d)S^B7y)z_tIxOEM>#kTKBJ
zl;G$j{!$+w`P4_}sas#iI4mGwz3GC=Nf`O08tVkD#k7_llOWl&T<xG@9Hg0SMk(NW
zTK&zqUK>Z%-c#v<8SR6a`pYTN(diklDT%KiNZ&woU1kbiez>*zUiRzkBf&YHHiCx-
zA83qbt@RY1w?T9TXB{o(yaYc&=;q|Vs`|f~Ly*oPa%VyhK92i+v@-gb@PDN+C5m;J
z(7LMr`fb;Bjret~s&$>Qb-ly&I}{s+LL0{V8~0o{9>i~$R&6{S+psv?cto)Y7uvMe
z-?Vkzw2$9(tlE4sw&`-X=|-{TA++VCzxC90>skEP^QtYsv8{l^tsshRgwS@V{&u+Q
zc4Yi^bk%n3*mm6Eb^^stlF&|y{!W_fPI~-KX4Ovi*iP=@PCmshN@(}B{%(=$Zb|(0
zZduiC#n|qf!`-(Odo@CPb^3b^u6ys|_nNErTF3U<4);1J_R&K7-TM2zuKWG*`-4^c
z!(;oShx_9c2a`ev)A|Q9t_O4R2cN1A7RC;i4i7$49Abq2zaoXv{clp(m$NHYDggAy
z4dNSsYk&auPYZy5V*)o4dnF<yBqSmtBPFGvqykb>P*YLTf~XnkXzA%0nHlK8%#5sH
z2o%hs!bW(LosIV<hafMP03V;2AfKeDknAlnC0R*11r=3AS!*S(6g5hn+sYXlR7Tpj
z)3s?ebqw$8YY7`Am>KCA7@Jz&H*k5NAz_kKX~x-W21Gnmu{FOhXOY_fh_N5etn&EP
zBWovTYx4nX@NJtcO}m^yJ9ZCyt6)cyAxAD<r<@iiaUW;f5f=eNxBO8zQD=|m{vM8_
z9^&^sQKmkn2p`vRA6biMMP9zamd}gEpDTpF@O<oF{5YUuGC(yZ(C5E)!Xl0S)d~9x
z3CoNP!8&383lcV$X!SAikz<mce{%E7<eX0_HZG|~1*tJdsrNn7A4H_Tn@@LqpAlS|
znXr)Q{4~ovJPVzcU3{DkkIiXW%=P+<3j3dS!Z!XhCoKDI>(sZ_l*0EZ<83utZOHw$
zoVxbu?e>Dwj*Pb*^DXF!U35`JSI&p7hVR{|-JbtTg<&f$3I|hojLXdjYm0`{MXZN%
zwCajSv!%Uu7YFM~#`Bd!Nm#Y(ODA7zrtnz|)t60|7`)cb)ov)CsW7Q?S{iDon0ss0
z9mA^ASox{WVY=L6xbe-xJNLDrT%C7SORc^qyGz6G-hS=~#v=vmHdSM~qd@$YBTY4H
z{fQhpdAiND8^ammPnJiT>$b*`s<B|bminFPQsWBC(Uyk)IVx<O_a9Uk&)-y-GtKr&
zC}6B^C5-02bRs>Kois9x&Sx7H$bhSfN6q<4^D!M4y9XY%obx#*R-~A|AcD!0VJ%Mj
zg%k%Bckwm{wduc6VbrMgWHkV0okDKn2pOkw-*LlJTpPm)Ql6;339|G>69A1Z9XB(3
zM>RRZ?iTE9W;aFG*hL7|6L01EwiJ^C4ZeNCB@tC-grtfhCsgtSX3>e#tErrE5)6(U
zaf<9S9D1(_8rFt+_fjRsi=IdDm8)n1FtN(kNJyme{C;ql+E2iB>8R!j;N$phWu(DN
z%{pXf80;xgR8J-Q^N<jF;u+&e?$?sBT+}5bAI2yoe@@|5*2ae={0kNK_yhDN6$fLi
zfQqNn>VE6}`DnvR9;$~EyiZwh%aqR-YkyN=p<1FZS+G=CM$eiSYnDMdC6)^FkC9IN
z@DD01<6o$-z28(A9x=1uUsRYm;cqHz0*a-=NXg|^LMgdQ9K4ABl?t=^Clx0Cn+ntZ
zO@&$23Mk^vgbwo8eW>Ao?{HEw$bTTRPRuzWulBYdR|~qriwlJ!8Gb2Wvm+&Sk)0~R
zrsu}|Bv(CnEBSzUmV{JXv4;j#xV1^&mm|a}kn28#QSX#;2^~(9+X?_Z&|xx83dCeY
zJnr&28S#q1FRPG{jbGaVu}Ve@U<mm+fW1ZO`f7Pw3KyLG?dz8$$Ch;>{P-@43~7mH
zuy=r#ks#4+V{&TU$`dy70K6z-&R;hudZgN!T`N|3KGei7y&`Pw7V9ejT=f?#t+h&i
zCjETwv{mtZF@$(%*pjS~kS9O@Pq~CgJyu;RkpO?2pzPsN%`5mj)^k+^**<v8$AGM3
zDLA-kn)OTkMuI@10ZVvtpDgZ!NViHnWx?r%w~3LsqE-dQBczXCT-QR7+*E}wv@}#L
zOr8oML<ujhPY4z5YW_niY>(>yM1=wWP+{MHQ(<^isj7cbVFiCtVGO^iFp7Uig{l58
zR2Y)sHx*WZ^RHBxfpVzX6qX8W`kM-){3jLm68E1}Siyftg{AywRG2oF3R6S0wtu?T
z1oVbR7LYkS|F8}Vx<QR!pAs7E02m7CF@k*Zo9T8%QK}<Xl-Jc@!i3aKOT;IMJ@uPG
zB$47=+Z?Y)rU(Kylla?N<E`j7vRKkF5*`k?%BxYON?hd$mc0OHAH0&KU_j%`pDLjo
z{L3siV~ArO6PfN=;ZX0wEAe*L?wp>gsIM9J+5c44pAjz%bDqNuf+XPM>OJx85iMkR
zDd2}2Vk4ImiMt^RR2KbMEO~?jam}n^Ta)WaJi@%YM_l;&*EtXUXKo{#pQ=o;q!V)F
zBuF7W%IbO=f#9QK64e8kzT7{kFuwnd3L^;%ysq>iY^gUF9k|_G3D&20)AKOYr;{LH
zJqACu0{nHTe0I~vo;Aa&N9rdpq<c&i^wd35^`{}SK#NLQ*CAC=WnG2lyvr>{w(@~S
zt4R;5KIGbTjyHG$SMuY5*Nwp$Fu}WjQembm;s2n*9{wMxF!|#Wx~RXYun1z_gTJY;
zPyeLC0MKw&Dg?2o^u6uFElRy611;x|tm?Zk-jMTsj@MRr%wA7xLfvNu=!FL44b-XF
znb!wN(1cWF{JlJsJwy0tvHyp+`;2O8Yxh8(MnV!2(&#M|AvEc|C4e-Mt`wCfASlv7
zP>=+WrXWp41*C(3NN*w#K$?gFL@A;)1pyVof{1dX?tR|<o^!@IXWTo+{jxr+k8{mA
z#(L&_=KnX?9*NO<YcR~6S$nflG(jJ0!lc5w;t0LORR5L;vU&b33!;{e<c}-~-edLo
zmCBERrj&?0ZUfF<D%7RQ0DTk5sJyTM7u%5eH!5sXUuzPe0aTdhoFJ(<^R2!;a^FcZ
zAId<zp$vf<=Q!`+(j;9TuQ^M5vZ=9#)tnD#fxVk2{F4fs{(nz}4gE!hCH`+z*xi3o
zVXS{sVUEA3uxu-<SVB)VoacJlvN}<bFC+;^tEBp-e$3;0%@;QFiwe7>S@SO{jQ=kx
zOgs6))4!=OB|>5>%J(-F_QBv673NAuTl_l}7QRrbwejCkVaklSKU5eSu4uzmpm+``
zNvc3AxZZdjDGXH%V%Xa-sW6&+vcXI>rTERz;j?qds2umRI58FcNLXTf^_b8E*#KE=
z)gZ%964VOdda;;(k+X(u9oe3%cj}&5fAAfOl8}k{+2r{4=?T;Axv`KNon}$%WHyhO
z;yp^KoP#98RiJ(nNZVJ8dVspLvC#|%vDBe!E(s59xyEv<k9@V(zV;E=51HsW@{<g%
zFGMZb!Y*#1rbAgh#4w`$a-=j(vmWSlfWG%bjtgL-bJyXiU~obJcnR$IdQ;QWP)A$T
zawW)M2z)ky0V;D<TT9a+2O!0`Wx{)uvKb<yFxsrXVP*no1q{)0Rl6S?d(S}bCPw|c
zNYE@!#-t1Sg8?!LIG3LpZiS0>BH`aWl)5kazf)m(`5rg(Q3DyYV;|Yh|Ibud(BD*;
z`~OOXWw4}K9V~*u&&5g}4ZkE+px!Kx9K~rJZ35@oNWg%QdqlM4HU*df$*Vy-l33ms
z!eO`swJqw;0PunFP`>ztb1UqT*&JhJNJf#`XJVps16z4B?EKt+rou@7i3)rEiwYzC
zro!_6Nrj2AthB(?ApfGm-2Xc&Ocn!9V^U${zo{?-Few(U5CA^^iwYC{n+gj6D+K&S
zg^@Af;09O`89W^HKT%<Me^X(k-&B|^`M*$MXMa;+T@b^+sW8VsR9H9kQ9iq05=Ptp
zY*rAWsNNS!KXA%A;;M@Dl!3SwS!>72&F243g#{ySPuYJFzaHX<VdJ4SDygr<y4eJQ
z8$`259B~iE_JtQ^jaluV-iOudg4hIrZ}f2q+h-6CWAJ;%is-8t^l}<VA<slqEk+`b
zYKryvlKn*Ewy-b?au&PhdMP1YC)ecm&nfQBw>;IK^Y$F`q34(lVEKr)e70#B@B#(F
zK^y~|sa(*!Ekaxo)#5#@S-+SB3<_)dn9E1GfpRLue9T`?J6#V(ffS+3L>&MK#h(ni
z5P;@AhgRbt-V8uPMR<Q0VapgIv!+-r#_gz&MG_y`#7-4H0uq-uimiA{Y&1*koJx-D
z6yMxH2Y=(??T^L*AqJY*gQvKTpTlMK7eAjbwr?x-oi4THRVUu$At!+J?Xj*-XU}*2
zqQbI?&>(r~%S2^ICKWaZ@0ep**+SVTNM77KSMCwVesiwuycAckQyDP<?)YD*u(Uar
z8so4I*D&v!{C?9F)lwxFTy=BZ!Z`!Wv>KV~94YJSZ#c)&L5AGV%u35w>0n%|r&2!8
zA<12V56vL`ZEQdCbMJRSjw*3Am|@epAQLsn6cD5V&n`=Lm>#-214^^0F>{}*e01(y
zvw?2qDgJD$qGbTvCj^^i1!{Vu;w}R9`Q|-K-b&VoJX`jay^8ybFvTa9t6jaVCKi!W
z53PRAu{<7x3?piBN7-Zpq}{FV1}W5hE{k@4gY-Lzk$}NXlwG2VNc#@@oourW<zQw{
z(73m&`{s+&_8vmizZajFE8Ibp<hhoFQtK5q>aA8`=rEq+B+RRtbcis@HNorK0hxO>
zVP*0P2~@4FQ&wMWB0#mZ2@k7g>uPnw9QgUTOe;|?>cP&z4d7Zf?oEx{2=Mp;Q~#rC
zqhshD+eZG(g!3l#58diX#FFjldMhWn(>oADzLF2be^6mf;Libw1+~k)b!b@zY0Z^v
zcu}e0M5QLa>8L?%s&QKfL+OHTlmEw-2do)jpgO#^>|l$VhQWQ+A`croBY!cp&Q$XS
zEq*GpWWJ`pc%yih3hkO>IRPO1*0hJtwOdXj@))SD4f8H5)G`BcVgnM2DM{SZD$zLQ
zaJ?X%lvxV~Mjnd|j)bLcJX9iYux*pYUF~%WA2qtD)XG|^Z%ae#F?aiM=R(~&v|cmE
z<v#1j1VfUCEy)9Mtk@P$@|%)sc@6KJF``Si(~yqV(}-(diznoDrkr3hZQ#qU-3$zP
zZwPvC?t)2Lf(!s&UsGho+hHrEb7F_f+35y^*3lfHzaZ~}p7#XuVvk*9|Iu~AskY~{
zD&}HDwq%c#uNKCxu*xRP6O!J;Q^ltgiRR}ov4?fDhN3UaLuE9P%j6T1?cJ8AS}fZ{
z`jH(;d?i@}T;Ia_Arw!>(;Orn)I7$Hs{`*?v5C&$D61@5|A`7yme1uDXORW4Ld-B7
zbNYu`9!`BMc3~@Vi$n|W7JIh$NuKJH-6(c_-ZzcxzA(3M)~Y8s5?#N6USkY~38M>I
zTQ5_g_WRJC{KIL0Vc8ATLvy)~5X_Y@tylS|i@^wAB5da^?njNiG5rx;d$_}Qm~div
zfNdC1H_YdD8)wb#wmLYb(C)hXpqRhK!?#Z=5~)B&%v#A62WVNEfxVBR#$4~sV!(IF
zkF2MqXA8Mv&9U{aU1%CSa-9pVgGK&eW<2+<9ur)b8EPP)mp&Dzx%N>D%`7$Tyt|;5
z2-b+t?N&ixb7H@hlV)2a*LF=ZdQagFyW41(!Z^WgoGV3~`kgfP-%(-a<Oca!u6G-O
zr3w=|xkoIVP!<bf`ggnIZWSKYVJxTVC`3(oJ?6LhKT=`IAjRpz_56bMv?4$ue4R+t
z>Ow~y5|a`RKNm&7&SFh8vF^=SN?UxY>8Phiu}0vOO!|~Cg~~E2B_r>6{xM$%n24V)
z!tx47LWz}y1;LWUhQ&$9(*mfqsz^a5L?OVuU|hhu6#p?rK)4NB@WN4s(DxWO5H&4p
zk5QPKhS#AVw6TTi^uqRxF;~wJjy%R*)eK>`X0Hc8*3trgV#*Wb%Oh9IwojEOYN{Yu
zgA4giZl=6k%?(I)f;Bm?xf7xH$I3tJ;1?g@Uh81PPKMoc)v$ntemQ<(<24IR67xJ|
z_6ObAz2^Twh0VhaYtGyJI~7(&L`C{m>in#1c3o8ei5hIH0x7V|=AR7(EpaPzDhpzT
zUl3Kq(V6xU$(!Nn#@eMpb3E1a-zgRv!_{{rU?W3{QT0{FHO`fkY3F<`FSR{)IjeeT
zs8>DkIln>;Vg3aO2ti$HLYzlx?THHGjvC2ot@H*V6Mj0R3|jLq!`IyBlLTwof8Z{3
z-~>-cTfc#Or~MZyED_?|6{c$Y#tSW!#|Zk?9F3sC6(6NEj*+s7XOuV0A`j5sswCJb
z)7ouewLz@%Yxv^3Sku!-%nxGns4kCn-a1KVI$T;QmOh}heLZzQ#$FoZD81rx@crAv
zFe;<7Y6dr&hdX(z2@HhqFf3r!sEY==j{l&-LaiE)8mu+G7j&OH=x!1Z3#7|fvAs`D
zJ<}Vl8IiE$w>*{D{9KTti=E}2Z%e<V4xvMxU0*_K(F$GZGidAEm#p6FvghuNvG?e{
zzjB#9|CXY3r|sLH4mx<PvAOq3z)i{dwq4Nu&(#Cw^&e#IP$QEkV1<{5S17K_?9VUH
zSLJTJqeI+l&_m#i?nDg6MOuk;-8t<aR9HRu!5SXkfrY#<LM+2cmKbMZ7X6gm)_E<n
zXPxyMD9a$mr;GceT{=OvUloWR<~5z5QKAgMH0H{jT`mstB0WC}>G&U1m?=0dCPSen
z)}}W|nW`1q1zIlqyfd#h2+!!s#Bd!ug3^ZsU2~urfI|a5#;ar&dL~rr)78>G+XwpV
zYGcAXF~)DQM{W<^KZ<!0jhVR38RwIoXliQn|Bea^4f`hQz?h@N!8!JOOfu#T5|N)d
zE;-cBX=;!rBgd~jd?iUFD?5rgjxCvH!6iyP?pQhHUQ_TKDRvxxb0|k6^!?J*__Ad_
z<sy2Y(^C;$7hQ$Niqp!>0*&?KffA>Q)x%Yejef7EC)Vt15Hk@UHB{E8YEMp7d(J$2
zceEw&^+?Il=kJfVM|^(&dgl2Dm##z4P5<vy7%6N!Hm+MG*>TIch`4v`<QHw9dN(sB
z6~>8Z^=Ss}{ou{$6u4*Kd_mxR*t?n5<NX}fSGU&}2an6$ez&Xg>3NGwk+{pt-Ea4*
zpM1M<7e4JPzT7t)f8@pI>|k@R+qY5$3r`>N+FIm)XLt18gRjn){5zhn@;%W@01(p1
zuhEf@b+(s^p6Ie_ecCX<c-nm6#~oDuXh^VCuGMQn^PyQdPGl(@;G7K_)#N_;)Vhz?
z;L}HAVl;oCv4}lnfAvs+Owb_iyodB)RlG-ri9~F}rkRZCj9Y@_rK%v=(Zb={M*^MN
z(&kmgVwwG-^&v_Xni=PUEsCDKNQZZqi=LMLuT+>O3yYky>8H^=d7c^u_p9O%BQ?3J
zSR0G8$tN2v3>r-j9eSN<P|a7L0q(T1<X?Qs$$t3i#F2xMhwYAewp~QUB-0HoqC4mw
zxyLR=CE6W&tc@H}?ytJqsVbRiK6uj9?wNxxm!^k9ls2WBD7oP#ax{ot|I65Ey8c#0
z@MucY-O#(Iu8)O0lKo2Hom}a^eVz4`F<W$E&GVNLdsWXXS9`0TO`n}IYni%OAP~L~
z-{EE;6tg3I+A=vM_hOc#*BuqQ%tY)P$BcW*Jg;N5`Z!tTsEmZ?2Fe-_U;AeAEqa*s
zPf~<@iYbSWRC%Qv-4+PzAn@L%acUl^zHH>=vuAeWr-pY<y{gIW#fH8xLGz|tA&&va
zZzb&as?XT}R)0$Ae04*u)2(MJvqtm2_qLwR$oa_6pHb}sb43PpBh|D6cEj`P)_eHQ
z?gkEsUXKhKa^bswuuuAVWblaA*GT<3J+2=c0!wL&Zy(I}aqnxlEt6g!J)w3?uOf**
zHmlR~dDPjLq9;Lkal`#V*A(Q13(qcP+P`dk73-1_zIgq56wLhCm9?y;28vI@QAGF2
zX`Me**q7f_*!lm33LB4`3HwEbvHX9h!Va+o{i4Fk{!n3<SZ*<97BIgElL|8uSS6xk
zo}S<&JM?Sr)WS@{yOFaqOe$=i<)2g-fJudo#YKkwlL{01LxnN8v;TW4Eb%|6u*5kQ
z7tFt?FnJ~w=1r5(9*wC73PaP<eo<jaqD(9?kExdx6EFI&7qGZ9sW7Xwi?XKwJrx#9
zV940Sl<)O5c-hq3jXiynS~aNT`+n}mY}TlM7**4KbBX^jlM3@DV}4U%-t>;%4TLPN
z7x@yT|2dLQ79YqUvdatzZuZ86=er6xa<hnw+!(nXcQ<P3Qz<m|<Y=HxLz>NRDoj^T
z-mg%=6Q`_hW<!Xw^A$O8=N%Dlo!4H3uwYVQXnG}eFq3w3BT>&Vf;D@)2u+<610!*a
z7>shv!X=89!yLPuw*j90qNJtbSl_kxCU}1~24DTogpFG;CvZ&2;qmIgx62$Xo;qtu
zAV_7!OGBaC;Re5{FaS^}fr_GNzP%(cSEO<;&B*m*;7Fk$<POBqnC(jm`yPC!=#FK|
zs@>vh=90&!D(#+AN0Ea^Y7mz7c{-yA9cibriWMET_NqhOe^Fs4z<j;1I8FdPbLV3W
zA-fw&r~#lZs7O(=88LbKpP>pZEW~WyE1cxR6{0@xED+b6)^R>*Q?IL2n`Vx0m{ql@
zL>T{z3hPHhlG#7$Lpm1E42AZbe-#{n?_}l{U8tQ=+|lplyqyUD(q0pr56zbS^4Z_`
z^v77|m4RY0kio@6)`iY?+)OHrLn4Dwa?p-Rg()(ru<wb+WKmeoUsTxAf1<+T|4?CY
zFehsl#;h0q7ZsMtq{2jgQ(?R@zp1bvM9`BR;BPAI3>mV_U{Ya#|3Zb8cYz&_S>tuO
z2E-K~W(<nGAsjk!NV97*tKnFsKVWW95%j6PH-~;Q>l-%c=jzQ@z8EjIg|U<*rIIz)
zSYQ?CKn@_5Nrk0ikTL&Gh1KxAs6hm#m5++q^zGXZM6kWO@%%b5U0o3P?^IYfszJA3
zc?a;D3iHa3RWy%dm2a8v7Bl-)c%oq~nDxYqWrqWChtk&%won)kb;IhuF{!Xb*ZahO
zP+{r+qQVX_sW8=lQejlKzo{_8KU5g?4;9uzVP3@U0vQrxgmQY=n4%2GERGex$_L?O
zN)ep$00_i&OiUys=@by4oM{5#poT#%Fgp$Sse_dc<bhDK$R8@~91K9F!OVC0^#DMC
z)J71c-21g`bi{BpfQCB^fG(F)5mEpu(9m^A7uLow?M(u+<pY`4+l9LdRCWpeIh0b1
zLB-!x*xWuqjUR5p70{&%%RHEx7;K^s4wkU4{I-4)_Z9?DF;N3>kH7)FIa5P(y%<3Z
zO_)vityuG3L=uq!#C_Hu4N0J?^tu5NS>-GHKooG$kIPvGGfSl_EDK3O^J0KGT!lSN
zHP7v}Kc?ri7_SC*-u{>u$nS=Yol);ccfYhe`SG4FKWZe&KXOTl56G9jS!8(*%{B=b
zDk`VmZwL;L9nexg$wT%Y(mg4SWwD~+=~Ngg9pz0;308Tk1(OF*#meQcYr(ilR02f}
zNBcvC$qRImSJtSAEzQ?Qn}S!Al++W%)u}M;^fJC?;aJ_NdMJQFLk~Bh+iRdCfIy8}
z5MM{?`PQcTE(K}qwkWn$v_tY16hMySx=aDgkpXks_+1*%waZVcOYPuAI}`F=Z??A5
zi`!L2s<@;F_-{HmT0EYW`Q3FKq?It+2AFMmOgWjLKzXTzJ!92v7#9-^U;)$s$OM`{
zQIl6Y0Tm7i^ae~FOg9isf2F0VM#5e{uX!@Kw?P#87!1JXHwG!C!@dI@Ug(5Wb_eGJ
zzKK2v3N|#^H88cK5h9hhY0PJjk-mXu5{xxDS*=`Bm5ohJ%;?)&C3ht(BAbezqJoL(
zegl9OX`NJ2>=jY08UWz0lr9bch<oS)wXp<ktbjaKj2nO+hXV3r2#y`1wg&*1c<#5o
zMW;dM#B|&e9|Y#~WyGqSA+^q4(iH&GLdDXB9RN6b>rvnCJ>7ic^U7H6fxn$FFwomj
z{Ff8v8Y9rcUDgFtJ8jez-k1Kz342Ta+X;h81ptg>9`G_Q1~HwmaLDoOx|3E^6cOrH
zUK7k<0oMR*t)PYjO~UGc0=9?vUbA0LSdl4K9bmzT*UdK-2nQVBP-6oC=GK@_7>jK=
z70PI-DFz=WX&tYL2iH&!ljC5nZ3j(2XZiGSNr0bg2YFhDsvy6dFedkMgzZtS%%k9N
z$n#(@ghcJWRT_-xxO{m~Q)*Bx9c-MG?3M_*9@57G`R#-${lf`UXWrV?0)+o^!tN@w
z?9DQrFz`iIY8x>8Zzt?1(+Si3%LyX_|2Sc}IlrB-NviMp_yjOh3sSHsZ@YI%-olFM
zgsB>G1Iq8Wahv|_gayP(HvoP)VVM@?m4BQtfc%Eu0MiLO@tE;XCyW6JSxBO|#y^c5
zobX@}Y-m95n1a8YFqU6V80nu*SbWH3EY4L^AR?Z?bi&F<M}9eB@rMDwoG@%kI`<zZ
ztl*auCLRT0BLRdyGuUzea>C>=*C*a4NwJQjUL&&`#+XdlUNe~Ln~5Dib;qeCj<=>W
zy2k*}1^8@Wi|rnhnF5OCC)!SmMUz3%X|eEkNv8*56|c6VC&t;GSU6MCKb*QFEDykP
zw?(hTYlK@HKd^xbWRqFAqOAt=wjoCy>^jxQEneUL=`^8v>ahI-qHa{C{{TqAA;BOq
z!Ila!+D?+s7qe3tH%gfx-;{Sx5j~;v40!Xfp$4RYbkFr2^6=qjlGr$CI2D>k##z%~
zUC*AI3)ie2vDk;hVGd#oyF@wqPoDwYT+h(Wrh;61{iz@}_4_{SEZpS)BvU(C0ZXk6
z1qXnoCP$s@sOU87Q=T}lluF>GBW{N#e*}WTWa{3%dNM>F0BE6WL1e!<0$8{KRZp=j
zb0+vC0GNZBxK9l%i2>(3usPr{+|-+V3j1c-W+Tm#&j8RHmRX_?oJmw5zya^pT0U-;
zcs%2x4l0T`e$BxtH%%d7_L7gzv`9o8&_ow6sg<IWVEXQM*4;5Y1&|?|?tHKyOThkJ
zyR9M(xXRylFx$c8K^zuO)8dFXZBfZud!VQVC{V!$ZZq$!Q?*N+RB41WlR(Z5&Kqg5
zkou$x-h<^2FWq_f)W^GnB^<!bh_A1#KWN2ZwS{s}sjzIonMS87&yLHoSck`Q9NttG
zZ>j<~79Ie`IZ)vPs&12176(9l?C2hP@;IWVacUoyJ0BqT-N}BP3Zqitm{DiUjC114
z&Ri-ypBiXOgJYV+v#Hpk7?>4+jc7v%jD>qsFafbFX<a_$vn(srg5nr>I3O*h#;K+b
zChwFRIh9&OolOA*2R{U-wc$oh*_6{8p8|jAw*p;jD;8&VW{<N@J_zQH0T2zlC(?^`
zQZ%hzWCt*vu!ez&OM{`moUm)T@sq!tFaY;PYk8)+zVa-7bQ))R<mn$L%nJD7vgYb9
zC#)@90PxEROM85~o?4dq+X*vZI$<pUuY-uRDL~DF(<C7OmlH-$ek@me7|P8`1*^Lw
z!;JS9nNFCMW7e&|oiN+qP8eW%|HvyGh3SN8Fr6^LCW|_z6XtCz&kX>RfO<aeP0B3W
zcE6plmc<076NY(#?3=R;%|tPsu(vib>KCV1^BhUgJYJTl@WN?#If;x+JI;i|zn!o#
zu_O}!G&eD`*}Hm`*G=cKn<mxVf;>MNYbn4@MLQfs)<A95soWjYJQly5FxOvBm>|;$
z+n&@V0vjL1fx5^-rw<;-#O?cH2o7IJV>)56G=F(;6F*2+m5Q1Kd=+3wy>~yu>iT5n
zvGd$=aGJ{>C+xw0IAP;7U4WyQ-P9h_2}Ac<>xg5mSm&M`aKM}DzZb(&(%d<+dj<L&
zAgl*iSzRIdN7EjA1AjYV{@0$Er>3)6urZx53vpJ3u3`r%JCSS_)k$zcGOfT197zTe
zxmhGv4!dAtt4)~=si&d=5Tg1;%`V9d*8gzAWW)oWJ=*kCen*vdrV7<SA1ocE2QQ&m
z7kNXxaOv|^SKkDO+b&#nWGM%xEY3H5QeZk^*HG=ggqaZSUrtzv7qeydmlGE5cd+(A
zI$~}CH}96-zI1qnoL{8T&2+*%X28Fku=+rz6Sg*6pL?QK0Fb1eaB1Wo^o=tQkE6vt
zsBdKNp6D$AiUg21@%hFw#sA9*qp~ucu*#*IsRf7rIAN1ME}C(+X)y+AC{j11uo`@2
zJN~%IDaXyYe9gFWBihGmunUgYlEHMs66CXMZ*3D=CTU?SuiehP$G4xz{C@J66P7jv
z?4l})r#DBv8Q+KHeP)!VjFk@uB-sMo=jLDj(+R^L{m68}JeK=(VWek+vRm#$f=8u$
z*XNLP22Fh#kM5(c0E$%7%Zk8F58_bVfPIe!beaF2`EPs-nNAp$$EAPDOBKi32E>?h
z49;hFv;zEW&zJxwE#3x;wP!J%Fe>mSasz*3T<_TjeCyl2E)y0B>Wk#bw_#+UrTRr%
zQoMV(MD%3r`!{pNOeajyKV~2}+WWT?7VzO~>fcUSInxPC;7hbJ=Pq^S;Z#sO%^nrM
zzay>!3|@i;0Q&(DGT?N0e1*Y=_e&?H6Xwcv!VZEE{(n1RmBSCwf1I$cVE&J|gm)vc
zPnw3^oTNt|y?4hsGMz9T3lf!u_||#O8`B^7ZYI$GnM)f7t;Rq}@QC9#rW2OkH}!_;
zgh4Iz0Kc5D%FiQWznrilrV}O~2e4o|VcHfZj)ty^fdSx@{ZoMQKt=zIWu_BmwiPw%
zgMJA#ro)&_*j{K03qk#AF4GC~@sF7czVv*n_>U7t_5b!CP8bz3yNYm0`{RVc{&K?V
zLZH8#Fe;k$5s3Be9y*|<x{W`z4b(K<e*P~fjPEZeOhaw%FDJ}Pj(V=cW9pX^20#K_
zC;-PS(I*nWoG_}fReaZZ=6lUNE!e(T07e~fm+6GH9KYN*2`W7g2nS%ZsX$CPuJt4T
zt3X56c0?B-?Ji5xA15pToOX!091L@rPS~Y>IEE&f;@cQ|=9Fj;iUI6rI$>Q$a5X^o
zmhr6LPFPk+Ogo;2O8mT+zBT}`IQv62xQjcU(gKAfCu+I^d5PD0W@&sIoO2?ePOOx6
zXSl<>H17&b?`xdx6u9IixJ413eh(fw%5}l#*sbMcfAW6!so1=o>(o1+cB|i>OjN(2
z1K?0^hhsWX@)rRBpat_#35F)~V7jJTjlobs^<^tV8W?P-UgcnYj3o)Fm17H>BLg9N
zQf(A@*8)U>AHhUB4c7w%69m}+uQ%vjK)(?hPfPwBD4~%zN4slK*gWaFlo^R!vQUqJ
zLJ5gAL+%fS04rU9fI9{N+Z@guJK{=C6CA8Y;%2NJ!=<pstFPB@kgW_+rD$>hXXQgU
zK*l?Gaxa)!VIc%_V|j=lA)a_BF~r0UGg9a!^~?rCgwHYlL4|1<(z=D#|D6g$X|b!k
zYFi%cli*kDSo+yZ*0lJ3Ec^6GMD&RwOV!M`)6M<QBo5r_yx_c>vh4Ts7Zuig-|OAa
zUsRam>B`0md7m?1XAMr^c5dx2wR<y)c>)l(ko9*fIViiGJANsq<dE$pZ?=xIVX3RN
zN01jeCkokIci<<cl`2C_oaB&zd@6!)ss}DonrMqvxIRpY^BK=pU(|^54FCZ6hSkKF
zRG8z<(`%BgOBo;H=*1b+>qHi&TY6G3WK0$w$3<S*>xtK^XUxH~4%QWza&GhEo(SK}
zu@TP+9CGwJZ#?~r3hR4*NV+WIX<Qx+akETO4+J3jMAkv+`l6^EQt<(C4T+MgeP2wa
zt_6KPq`m6tSgQNjC)ruAMnF-j;!XwPXl{BNlM4Hm9>mLy|AdvUZgp3AEZUY;`nam{
zI0$j2jrZ1CaitWz_iAuFC8w_90<Uc2FDfkauHb#yW&?fE1I_cvN2i+?Z}R!oO`hsE
zLi$oAB$Q&yD}AoblC|#DeO<UO*ZI@?{Qj=Ls4!oTwjZ0S$n2~)^vm5r`f7=?2a~s|
z+lrK{X3))syS0rr`SOqG`<AC~4@$!JlIw<KAE_Y`Hq_yx0{%N&DDkx{jVGB(1`&^m
z7E85aV$^}bk<jjlx<J33o!y3#p#1!#M~Bz$lutN*m@0dA{Q4UhBAcATha00xu;@-v
zZkUyxxL5W>o-$K3qZsNDSRwwfOWY#3EK#^m=4V4ajBjma{fUw<VC=16bB%QhSHg0s
zrC!NM=@Y&thw2$=Un0<}+&O&xiDrU{HB9%_Q|kov+WDd+?jXCO6p4;-;fk5o)37aW
z=kJ0-HJ!-4(=|QFC%pr0<9$#}c7tfVo?#YGpVm<4Y}J{ahJa*c+7l4OH&lMp9QjD5
zNR3a+T(VwOb{J$DM)D}=AgC_xc^%~Vrd6xAx2splN2CTMYf??woHtl7*XFOtJf-l}
zcNyzo%DXn?DTw>7-O`bxAd%q(D850EHDQsrg6CdbvE+5QZDKd!6v~Sf;KcgSK#-(x
z!dtlNX;vimR;rJj-~yS(FMp(Al3$;iN2cjo)uhT?2I1Yu(YoCm@O4jima&cgv5fFU
zTa$Uaw^|3rcIk0&&LWl)oB`B_%r6IdAMe+I8V&=XILB(4R9MlYu(WnH+~^@IUP$jY
zw?w3?JIt_UM3OoOUrDb<zl%YMeZlalKK(#o)~?6_rVpkasJWcKaHb*MG@2ZPdPk;7
z$lOtjZU@1Y!=H2Sxy6c4x-z&FkB&$~?i`#nIRg{xUEFYh4p+m2v!TKBvZ2kblU)I(
zU&_1ppDnGwz##koXaOP!B=n*;IO(VQ0nXjPT>J1rq3IQ4@dq`77Ts_m(zcO;6`)jL
z2`6;-{sPEyUmtwO9kxw{AQZz7DjV6RZKd%d`sNZG$wdYKJr&l)Ff=y!iwcu{YiwEZ
zn+n@E(aU`-bNIznhN{3NTWMWuEAc2WD>>W7S01Q)<o#UPPENn&3C0~w#vIhV%NVJA
z2Y$%v6gvq3B6f+D2)v-0n~<ciP7-~barHt2TQLML>%H;U4S{9;AqA%wr2cPI*!eS+
z@1IHC@{&qA=jVyj?IsxwbO#9D8c*=DW-*KU49==~OVHh^jb(QZyS|mpB3_)|F*Wu#
z6?SxXtV=~<Qr7>t0eBAgiwg7eJ4$`=T9K<cP{1$v<jhe*4YBRngZF+{FU`IKeQll0
z^$Ts4cAg!g<*rubayJM=1xCR5TJRNJ^XKHF)72UkCj@-G?Oi6Tn2n#4BPza=P9%jZ
zJ}f#9nOj1!nrtm}q2L0c7qQyXnk`PS12nnC*kQzS<@L^xC-EBXVpDs`mr?Ev7#3{;
zxnfF3j)fmkQ68Z45kzC)aVeLzTG*o2=P=FQ6z?ddM7P9nor(PQ{oe~v<D9L76&dlT
zcZ+Vq7spf9vL!qBx5u)^I+Pyi+w5o<_IwsMIr#RD(0WDs#iI;>s!hv7_MR1_N=8{q
z?Wg{n=jBHTmqGN(kP%|G?;8q}3fqoRL=;EzN+E58qEorWk14%*YChTiEcnx~NJ@-p
zQR!H`?vu01^YAk-?z&08FU^77d=$0dFmZ2^w$D=d$nugf|Lu-nR9HpCN;*7P235q8
z#4a$xHk$0*aJnM0$L;&@q^(6$bt8V&`rZx41QTaAbYQMq<;}foyLO*7ofvJQL`SvT
z<qi$wOe(A>;W_uuM(;EU7SGOFf!C5vg0B;O5nH1#Ei;We<`3O;t-r74m@m-ykphXR
zqxb^+DQr(Qt+X;Zp5XW11kg6v-pPyNSoWAynBT34MDtfv$@+n_*Zeb5pf^5Qw4QtM
z0DSFI-)s4^Bi^l|-Y+-S-{|gryW6-sADn;ey1n2n#_9L3j|&Q%GG#wBN<%kFtsh%G
z(%E)e=U95V+Rmsherxc0$3b(^2iJ4N+a_y&Hc%kO@BE_gQyND?-S9JKZsvuU_cYmh
zEx&)yIe5QhzPjc}!=a6Mz4qCnoG&puN6+rhQluA6ZNJcYDV)A%9N9^Y|Moc8+3n_=
zv&)Z9`0B*yej4Y|X*kp=7fH7LTpj(R+!gBBta?1+ed^Ss8)&cM%nL7T`mcLN%k9pC
zbJw3~t)O{*BWE57f9vf(B9^$j`_?vkHWKF68XECq(f*ZF6T|0gkK9j+<%Qj5$<A;7
z7gE)VJO5B&(RZIc>iqfTtK+-1+k4;deMc?N=>eemZ8EoavH5^E)2#)F`eR45O`ZUC
z^S?|S|8YhL@^V@}Jg2ng(*1QiZFxG{!I&kU$XejCo1V{#zM0vZM>~+oUo{QyU{YaB
zmMgdPDVuKt__R-tT00iAVy+b)BQBPr>KgN7ARlY<=;y;d7o4DQ0xIU3o!OLktm*(w
zcmBpoi#2X`SaIVJ--8(4aC((O0e5OLu-k<vb)H(HFYV#Fm2Jy$VSMEU15Ko<c+wv*
zk@W&*2rYu8&qe6{yr*?+dvUUA`@CeYuuv^c-2tteNcjR35xbcH?|3D)@JLbRkl0J;
zTFH?1Qy|`?M|Qhg&4b2mlFAnWx*o1issrL9-NidZnEBi4>bLzOEoH{~_NtP_?Q;3v
zEy%VV(u3TH&~~q&UJKw}ESGURXN5kCIgu&3*gov;uU;f*q)+@IqB>1Ly_kuZbU#NF
zIcow(rVXB<7V*n-^PI~)S3^f#9t#N<_0{fqfZ3zGznY{y@`%U%;OqdWZ%zzXcz5Uu
zSlojS)z=rWI_&!t#g~H+Be<U{nAeUJ+V(M%7c7#G!6<r(cDw+o<-t_mLlGN={!f7#
z(?%vkMn+CULZ$uMEsG&5mk3V<bezo0M;@6uKgywWlf+y^-f`{P_3VFv-|aQBc<=Ga
zV@9w%g&S?atxh*w?b9jjNBfHUWs7RQN$q3At6wWNaz`2u#p{8@Qn6OS-aVxC7;bq7
z1Ho<sUNQZQ41<n?%QZCQ%Xr=0G}Wruz+rub{6W$uQN9|w><V}dQW}^w^7a_qG{*Cn
zE4AvWS7kAK7tH4Yyn!iI=N3O>7u)Z>*R35;suy0W8h%+~xX0T)-6x||ImAO<5XAeG
z9@<dsn+QHyh~~r=kIeN5+9h!9j#K*jH05a$RR(1knp};i^SN$eSN-Mncrwnz*$n6F
z8l$Sc423QSgbk_vDAKKp4N_c2tU|rdy$NSJVR>FYh0CX;*zk!d$|5wb9DSQQ8zfm@
ztJg?@<avH4RvAZe94q9$5Q9Hf<o9$*t*+EJ$K&iVra({}CX;eT#>>9qk^L7@%=&X_
zMwcD!$rbp?O)SvHD?yoUpD%Sqc=#j$WfeZsr<iEY!eSxN3*f_~>J0#4kIS`ybdm{B
zRK^OdW3`=CoT4}^*x+4Qvd599VC)N^EQXl>%JLZLyOeIDWqv2h$>-{uv8$)vMwKS0
zGr9z~yG@70qesaC-VDtb`u*#`?ctuoxgb<kPhtg1*Mx!u&<NZqN#dR=1GdBKWbWxc
zOK6E6fHK!>fZWC70k2i3B=dL=S-!NmT}QtSt?+Y|EDiE0wejiA2ZYNQY|3WuyF0BI
z4n$0vU+9Z3+X0swJ>iG~Q<L2U)k$HvGL2kMr__CX%Kc8d#i1PsFM>*4UzU{VmwJFs
zdOCZ#)zM=6`u4>e3z`V|6Ji(n%O<T#J^PH7BU9BW-5k)jaW*Rt=w*>!38~B>4k*`~
z2jAE()6j6KxVE<vEk4RYA(^ONntd_6zr|<GwOg<y6BGf8jk4x8C3Wt^cGe-j@W+&U
z8?bf7OMLQDbsIfA@<>pAEW54fZI=;SRgYd!m1>L61773ywj1U@PpXIsArcKZckTV!
z^`pXkMAC7w^s1=7c-juQb@R?pUDYE_UL0H5&bEPTJS@DWO1%8gAoQIk+dK2_RYAoS
z-=}YL-`vp)DVGp)iT7Kv&hrjqt8idhOB*Rq@9<`NAej|!Wwj-*>_C66TmForaJN%9
z)M<Mkjf$<M_!=CiU)m+(7(x7uly9+d@s*8`%JRGzuIehibx=ak;&^wZjZrm;GL}3R
zAA|EV<=iv4^{q#6ckQ&Rbx*^XG_6uEV83r<b@vdoXJOK67KClV_d4%yl&9Zn$qY<;
z3$nhdThpaUq^}$+f8T91xMMJ4RDJWC!L7!1zpT|e-F?HeUFf=sJJaSP;`=XO9N+vY
zQ}7tn%aNg1{MasLP>?WjD0e@C(bX5>&qnS}a86g|^&6@12}&DmEj|5dS0d`AjIZ4a
zUA(GO#<xdThSSuy>&UvoLXUQP4_`Zw_6926@(8sJMykv7o&!EeuI3C(*X5|5w>enD
zc{hV&RXWmVlcloq<>jS5qop>y_8{KZ1Z+RnhuXa!NT|M5Dv24aUMZCJeUb9^&4w%h
z>-%&sVEblr`6mNpPA0c2h<!%7<0*~*sU#vK`F-6!-RxD(mg^ZeMmO@RZE$xdxnY~9
zK7fAMYm-5l!gr_n)2C|`e3f5dFV(0r39*+>Y1Y_`yI_%vA7QtAeIciDjj4;J@=t9(
zY&oBa$gf^DJNahEU~OS)t<P^ozcwt#K#dh9?j56g8HOZU?cpe|GcqI#GNf+27czc?
z87I#r%Au%(lEojS+o6aj9=m;+J4^@5i6e7}vMpbI##Nu~1yw9Uz63|{)v1+>=D@@q
z-mW3%;A9cREm^pd!Y#9%YeU#G3~iE9ryW?;^BqU)of{SM2(mu1w?`X8LFQ-Z4euG)
z4MO+(^H=`7_GxkxJ^2wt>&I{v_-1{uOi9IEL6dKPP@D|jJ~t=5wncZFMcXk@uI5sg
zK4OdHF<Bb{JVBfET9KZ348B&6`{Px^I-F81-d^#Y{-F3-MV9L!ddjuP{&DSzOoxaK
z!=uPA%9Va%34tV^@LqE3TX4qV<37T$GpwJ_eCjcFI(T3@egsqbI{aFIw}gKckKYQC
zWXXBP>NEDlOHGGUQbG;Fp&`D#im2hb{Sq#eD<e{{5rzI|A?W%LXFim-5+a~p?evh@
z6=S<IN>~g`?&QS%AP$XZK;>Htht@K(tdg$wD!k7Y+zJPxww1D|c>nG0-KTpe+|LTx
zTfPh6{`{JF!)EJ|_kHvkna^IYFl7UM_3?tbCdye3BZ?}aXP$z6%T)cCR9MgP-H|>!
zkrh8!Gm{EqeE#B_FCQquq{5mLBbI|yPez7XkF6JNUGy9yss*29Qen+}hfb9|qnPKR
z^G2x_n@bm8TI_+;&fa5EVPDn0`f{2Wygg-b>)rDCzU9b_#`7PTRM^=D`4DYv!mYOP
zviMVvNq*<PH^(rkupYR9eJsK1s`vogI9gUfB0TmalM34oly6WSILpT9;;5C|ZVT#Z
zP)R6bQeoSNi^R^XC^LheE<aIEdES!pN<DSCCG~^)m9H&V_SDm0t!eCg8tGiE=|UPA
z60I3>8kuUXnR*&o#;sYF8dvRGuexYlJK1{8U*r1O*6Yz4*$J)LS2S*1Z@qC_<7Qdw
z&3hWRnp<ymYUK2{<~-5Jecqb;N+WN%HSdGQ?XRu3_cZchZTak)1zc?fLYjpVZH020
zMQUwDdYZ+?ZN-+FCH8G4E}Eq$+e-a4nF&B;(VFE6ZRJ-q?_6)Yb6c~btgYgnW@U3*
zWv6CUe_PcP&AZRr?!MBjUT&-Ypn30W+r2%_8rc0BcCA{j`?W$^brSdM<h1J5?$_&S
zH5lJ-u+(a_zu!31rWV&NJ_k}gcE34+sKYSu_3h>|q_y6<FHo-U8~44rdGGwLfB~-|
zowFRI+CU*V&;+bvq^v;v*;>Ne;C;Rn!X!|(<v#t2kapI2LIY5>S4(IkMsL8N`FpIw
zq?WK@Y<D!hS4g{G@3u(JeW^(bVFT#9LE|u_bE)h1&fIUh{arjndzk%IzcGc^5d8Rj
ztX|@7t1*SN4OaC9@`T5BS4IwVJy;u!Y4wj0-DuaF+#MO$_Lb3*gT%Cc)%Iha(k#XL
zx;}We2GykY=yt_x^BX9?06z<cX}CU^4%RtWtfQBeG}Y7NoBd!q(_k{#_{I00=dYs9
ztpD(h)OnT}tDQAC_1$2e??LV(gU)e%J_nitV0ZkM)`*Y+fut|N*lTZDG-^Hi;N`)e
zej5~mwywH4t#vD=l{sx!cE|O8MofP1lY_s`Z1>InIpPmoI}O`!NbijO`EDHg;R$r*
zL%TqJPsXR%)>l0`Il2o>jtm1*jim5)8Oa;|<V?J;c3E3?_r718J|T_bTdx0g%ZRi=
zX%>y*<L}Ygpb!HRq|{?XbJ_)3^hTO55ZXI3dVl(6cW|hKgjpjA07KnqFq}z+F@&l~
zal0Rr+}Y;I2^gei+#-pQMe^7_@M$~UwUcE1{`DfB)x+$6rouMk%7$jHtA5%Y{jP|U
zx=ov_f^?T6_KunbiPBNN_yZGNuD9$$KcBsFt@gyN8lEB+_FD&>cD+YM)SK4H4X36u
zia2B!?48ezS3gb;!{0p*!Acu#PjFWqqO-oydgg=QA7d;T3W~g5HAQR3Z6%8|=KH9h
zQ_*j@?6@`6?fZk?(<o{8EDp)1%fBLPCz1Rh;oxQW=BBHQad<hwfe)&(L6<*TNF>VI
zkpe_Nj5glC!g;Ugmaf|2#<$$6Zx2j0|2q|ySJGjW^vnxcpAj>J4mY|ag1J~&Q-n|J
zK$JA4vxz|}NKk_^{lntZ#ogzPR{Mnz1#QekS`6E8H%&gyj3Ydc_bn29JWi@_FLoz3
zIfJ%d&PcD%ij`8u8uQBZA}p0mRGvl7U@HXe`R^P^$p@JW$BS?FE0=SNj1Uvjwh}T(
z=W?({;4Ral?h~iZ2b$Dg78~p#?G&6W7K$o5i4;wGdgaN#QDG~c2!p_KI&H4tV#XoF
zs#x+N{yU7+O?1q@WM&!p6dhfd<c{<;pNYB6!4Yv<B)r=WlB53pm-%HY;Bz><y<q8J
zEW{T3ym>z=F6Uq{f72u>=#vVw$|~>_3+iI-wnUh35uCK%C&gc}G2Ay{XY=i&mx=Fy
zx?&@#irAZ~U6yuo`qaJ8#uLrnrUo1lgd|Y6RML#G#-2l$23L)=w38q4Fy|+j<B1>e
zeaXsCX9jKyD81e|9=#b7$B+Gxes#obK9FRL9^Wvc>#!fc@gG!J>ppR~a=LItKwuoZ
z7N`Isa&Ec?bc@dzp&}AtwE0Gwxrtg-?QI|Oe#oZK+v-_aQEE)iox?j<o!>(>&rZmX
zZzTAdh<-8VP=DdYJFhJ~y<GRRBgGw|>pitRpV%yJT%ZaqB&fvH6<Z&QUU}c^cTZq8
zVsW-A(p#&>n+BHI&;HY9-fCR+esj&KEeWA&=#Wx&+UUoGW9oWrHzcFa5`G-J>eC_c
zHx>33_85`Wr2a&0uqy{+mZCjVv?m}SGAM-B`Vn)^|A<)mYUPt1t8=TBoj=zIJ*hFo
z*QFajeYZwo!9({*TgEj!&8!~9G;fWsD=TiFUh-YEj%^BniGVc*=mcXO&kLWyxAn}Q
z$_#%VaKY32ewM?8W8K)@*le%qJvDw%uX2}Y7Av@0NJWNUHYAGdPOce^VaMe?j0fmB
z?=ILI{7r=&#<e4`mErys4DoO`m}E*^1XhFJY&Y=o#nFAd&2=ECu)9iC)Id@}Od$bY
z#~z{HZ?w?EAi(P6?gK{ne##f=F$Vg)+dm4rytU4$4l2Hz_Q7#9JS(nl<%%qCtR1Mp
z1yD=4IKkZ;?Q566*TxznUY2AU)H|PGv^3i5YPT7~jIx3h<(H~71-fX|$24sg-@qFI
z`F6RJZq_yEYg}YroUP>*+72}4-Nan~iwfJ>uF)T5HNsppkvcG^&k<%OqQ9`jH<l8|
zj`lIo>oYkJ?GSiANNU!n*z}N5TT+snn2pM;2a8$Gqod-A5}G}eRb^=fLS={p8(-WC
zW#blXHePrs-<r4*x#WZVA?%TnW>^uC>LIlB3HF1#m_Oc-p+*of$S!1DHUH9waM{M5
zdKxi83O{X!)v`||HW6PF-`OBzlBJjJI`tKcL&Mri<b0fdQ(@|;i&Ej!<A>4=1ea=f
zN-yuxORX4%Wsf#lFIIIm)3T8_p*Aa531J5`zJV*s(pS}Z!bRd--$x-Hlm<2BKeb6a
ze23+mnM9TnSr4Z#8b{=wVR*0{D8^Q9FUHawz7nJZyz`Mtta@{8m>9{YeA!A8q8x>+
z`)3y;e8OKHxLsDw3<M^EHKgxkB_r!JyEQ7p(?xQE*>@z@BxO=;WgdcvX6j2(8du-_
zroz6YveEKc_G^wR>062L&RJcI*?<b)e9?19iSpi(%{%SQg{9WygMO4Qli9auu{N2h
z{?HqPxC?gn;!|f3`YS+@SefR1?Q>V{ts;(o{Y{0*MX9$|TXcc$+}cJ66}n06NhkVs
z056!n9;0>*Be?0ms4%YKL3e#gg7L0gtYjqS*yKFYhZq+s_2M@brV+9c+l;xKks8M)
zeB>`GEZcH2|A?~BvBf-|m0nwn+~tVBs4zcMQr5Vru+SeWOqz`yt;93*KT%=$3ptJw
z0>Gr3s5<tJb8(M7ul=UNvhU!e&M;7ijIOpMW?9%=)_BKt?!fU2JP^K@bz6nMsIX?^
zt7q~LkeXaCnr*gb3IRhX>IZsN&4KObG(sq)H6_Nke^Ftf2klz-k>d}P+t$Q}rqUB+
z)%Wy?%sdwkvF~<T4Z`N9G@(4t8o9&O7myg_C$c&RLSjo_@O#(w@_{)Nd#)Jjit<V2
zfts}wz2}~R3qI-CANONYVZ(O?6UWXOvg&8f`<gArc9Uwa$i3K-_SpsTynjA;;c^D2
zt@<;9vYq5A=RH*HR6|nDe8HY3M4-s5M<HjM#cZHw_N&%R7(cyWvXE~{m@6V<LO}SK
z+CdJj=@a%0`W1Nm#bX7;>&Np$FI!{v8(g;4%$n-gX-i<PII9r_&QvpYx-z0>!}!iE
zhwhV2!mq8V33VJ^OX)5GYmP2~gSpxFygVfcn^q3I4}jN;zZWepjhR0_L}0DiI&pk2
z`IE-JIYzp5sQWm=C!D~4U!X*3Hi>FI?O88+Mc!IOOKD<ff#=osOa;y*s|jQ~Muz&)
z>5o}$SgY@np~uuA@<#_$Z>G){kPUklPBnmJNlU@wD`Cc2^P$S}&0i;My)}<8g6Cj1
z-yV&pxU^5kEC{$nE(+;g4?l8UAS5>Btj&^hnOm~jYI4qr{G<z~3NHpt*JuW*$6e4}
zHkKIq{5<Z?r3>d@edaW5mebl0tbFqIgc%rna_JQ_X#I(2`MvY5F_X7L*t+-7pmxB9
zM!B>|SEUe})gCY7|3@mUl7YB~LDpL#In0GV(Zn}^LfYN!-j9&Y3^sa|&`_G^jvL#|
zB4;)gYC#d-aATJ*U|XgzK^tNu4ckzl`=&r(8Z6|+1hd=)<qI&OWvC}<*yCP;Oaq3k
zn@iqJAYMceU4RzBN?6c177T>GkkQLlsO$5XVmJ2hHM(AO{PYQd)h;f(LP0NK!N@|P
z1qzBuS}|j1ofSk*S)-QSIIqp?GVv_GQK5}_P9q90XD#+tpa5~6V~@>Upn=XE1>z}j
z<p^}=iAyKFVPfV~l=DZt!KjcRmOqNZBuLm9uACbMLVoic+7vb~3ZHxdx&<rbKtVfG
z_&4ZWXdwOz0M|?B(xzdJfV@3c;=S`6%JZDN1>Cze{4VLj0-M|lwE|4*>DfHNiz0fG
z!fQd{*QSUviK}EFzI~2^X)HxjM88w`yyiK~0|l637om>-(mazjV`5Xh?sdHG?gHAv
z*h6FZNdQjUopfnTXkVSKUjf=IgShHOD5hcq>UeGk2v*E<I&Cr?CUHv&K2n&ik&c(A
zb5&5d{OL@JNhq0)AK2usbmN)a<l7Y%Sj0*1`4pn-0@;n}k_MX`yG$euxc_#6koG2r
zGtkg^o*<^EAe62E)8}<^6F=iF_=SkHps>jcqbPyI6%1c`5YHq4qb!VcrU<RhLBHfH
zMcJ^`eMFrFz>B-MB581D$6OtmIW(+kuCVMm%zH)godP9GH^S~b$0Wc|8;JWfubw%M
z&j!E&^O#*>LCq~pH6Ff7h4&JXf*Im(fVeMn7~f!lCR?r_6#gXuUVC1+5r~^4Vh4lS
zxrO;p(vidUXs?g^t^rX4HbOgYyd^-fk2ZX5W3nX_ekVn?Wja@w4f`5h1FkQG`^346
zA+v-CI@RIS#>A0<g4YTtd#%>uZ|D+b)_h}De35PkV1)w3^O#Ap=tG*}V<cYQO|Cuz
z-dKPxCL-IrkP8_oG+jHX7R^0R@N?t&LWMJ@BGg8J-Hmf*Ub}#RTL4Nu%H%&?C<k94
zU8%!Z0#WiblssLCNMZYuZ}Jhy3K>HRZW1Pme6s`#p-oOrTXc23c$hH%4<J!bi4Zk!
zDLk(Oq_gwTuug&OZz#OiMuh-$Inz-BlfLSk6Xp>n3RCdtd6`_C_&FlKbgck2pZi8W
z_YTD_ssI;d$99cQumrLiQSe~^A@@0sVpn#HO!1f2h~xt0`#9DdTSO_A6+O=bvKG2V
zNA5E0_h?s9c38L{)9#z&an|SmLS<@RJR3BnulZ;+MJQ7E7>f-*BOeVYKs(cqe(l0r
z6yPM4B|l~yO9>%1UOhS^OpH*_dAx=3wL_pO$E8)oBY~L7eDtKUpqHEdS{LE<7N(bK
z<Qby1Pto{nmhn}FvBIeKR{}=8j_@d0pv#JXm5gqfCjjR8KFt%*1-PRhJ#3q}mA6QI
zpT#=}a%c0=UNpEi{m}e`$&Uhb+8oa$PRI&?1-h{hSrZNLJ`X8A-)XGM^E^{s;@WQP
zz4LgTV1C#F;fw15AcbphLP&ld(*RUP>f69$Y%E9FQ5=NDkDT&AJC_B{W46ckfQQ-q
zD2VP2zlTJB6(EKcggF;RD9nJqp|C|#@Qe`g4Z8UcH-X7H4tW}@1)cbiroZNT9H!6T
z+r=*Y{FH<}$BkftB{Ke~yPz@!!LSJyror26@Vzt?H-&fInlCSeXPwDCZE-d{6Iz-G
zKK(VUC?oWEv(QroURf1nu^Z3o93j#TrtRi+|I<EaiaHH|r;>SV0#7W{J$UTV;`VG7
zG_{@$ccm}z*TJ01z~GYnU>7&`YjjPxh)(8~(2oGlV@HD6fzix4xRf8MFwaq(Ay*$L
znAYS8Q-XHOd-r_iUYz$<8N;u-647qX5|cvO6m&0;<&%8S_XhOdWDqQG3tvCVwM68h
zxpEnAheWBKf!pI*L1+96kl!}WfHw(C*Ze&7g%)VUvsCfuV2)_@#1mIFZe_w7XxyJ^
z(ENJdkxiru4YfK?aKFxxJ;&t8c*Q0qgbN&|@F7>ylkaB3z2;Bvd(Ppe&o@aV#Wt&b
z2MQ%xBVN?SG}4jDfg0C2jtL7pOFv~=b*Uc<Vty2)ylROqN>97{OgE~)pM6x$ZGi(_
zz}-&f&jy@FDp-~P;m(1at8;u!6L<@J)c?cYeT6l-wf&+Ggc5oJp|=1^2dUC~?^QvH
zf&x-Rnj$D*AoSh@q-c=dK|txf_bx>+bP$msMUb|GQ|FxTJKt}8-#S=(AMACWljpkf
z+|L;IxX1tZ*w{CtoN308@<SEhj1}=`x5ya^I=+JkXV%Z}cqU!!GH=N<Ol2~=T&K^V
zxm}$pU=Coe!UFNq+>e3aUf=~FFpae|Z^SB+Q6CT**W&2J%5;bs#+N6CSu@GT;k`xC
zK264JKt3jO!@mnBxp@dK{tmtiAUV}%hGBs`TUb~YopGOpBv<j-zM*`PL?By5>Ink_
zXEn?ZG-hB-vsff6Fzc;FJmfTmofoG5VJ^EdI45}G8d5YVsP<EkIPMczK(a*XNU{M@
z$?qtQ-e1)`q&!jZ!e64zMj14sY)0js?)yv3DKLn8P+oS+%t)s_q7<&kWbHCG0#vZD
z_$rYMpFG&<zIo5FcskEAukF)@BGX%U<5{ffb6SbUzb8JMV3ARv)Z3HlY_T4_N!T<)
z?OvPYokWtfNPCeb_&ma&<Vw;Nmz(14`V<W<>dq+yBUWXd^7d!n>@#Zfv2KXJd|7d_
zSTZ9|NH@oxf<d`5nf5a&5w&y**u?&KZ`H?JMLdG3o=|aDV~PrUBUmXpllk^2--ksd
zW-(fSQKmMbrv}idYkM><i}Frm6sjySovqOEQ8~*1>Hd8xyHuI)b)*e|N1H~>UQe0Q
zDde&$Fsp$3zO;2Y^$aZjwUg6CcCE}!Sk^l4R5Iz}^UNq-Ws(-tInP)7Y%LNW!XOJj
zz?ouCyHj-&>WkyhAzRi=gg%U_i3(~r-6LA5n=+Y5Pia2161_L1U-Oq2b&swe5!j}y
zw0=WpcJltheDTSd0-b7RYfyy%QCq`IrQtn8X_JpN$)Znnq&Sam64q660&{FTk?)=f
z>hCX7!K@R%1Mc0yW|wKDuu4neGp0is(OJBuX^W*f+l6}0F}HoAYOC!vlFA(v>fL=y
z^M?A`Yph=DXN(<gy|x%U^9Q?zq3o6bSOY>{N6uVIj~Eq<W$}l&OShaf$jp|vTi<2;
z42~qYS;f+z4;8U{l*aU!b>zm<sILWa*b>#t-O4kD@%wnRd<oQUeT)vO(ZZG!EMR7S
z-w8d&Nh8ZilZ;98`N=zsQ}-;V?q^In%}=@f8x_XL@zH-8KVUj$o;kX4`Xa${<|X4y
zM&tC0dB(`InH<L1ytCP}Oxjeexsv(W%Cot~#+l5F**KYxX})vyjWfgZAG<9-7BMc&
z$t*<3%=gR8&il^qS}r78e%kR}$ZK4fv7G<zi#p5rwCB69?K?YfJ(s4iSjqVD#CP%J
zY!R0URm-?^RdyM2jv`oC;5nZOvfNUHuTZx#+rd|qtnf~)A%?Oz`mM|segvnP#1>7o
zW38+GEzC(RtK(Rd77Hr|uU1T&R*jg}Y-QK9&R2|HZCIXf82PO^$*#J{u0Ls7e=fU<
zc(r+JVKd>?%6-|bWWSBtg^fm8oHq+=ZnCS7U#%N0toz^oa^uw(jq}Zm=7p_lzb_H5
zz78^N=iT1cc(q-|^fl=A*MsxbW7*Beuh2>@%;kPNmQ9;yOq)5cR>m`F3!AnznsyhN
zzO6Iu5H)Xc$ZZSWLASp`vt8_F%I+?|+GV^zOMOBY+&<uv!{L3sZ{)Yv&UEN@XGKjG
z$3~uPA`@f-KZ=lN6!Jd`lcShmIkrU-O(>A1-l0m*JVrDVrGBD~l{-c}KZ>|GN_&2s
z&<t9VXLJSNha({qi-h6uvod)`W&g98JJ3M6^WJ92QZvZCl@={`whXwyYI~W_iW4DX
z_#_8K`4~tPZfH`j&hS{=l}0%~*197E!f`!3rT<n3!i|-XAuJAc(H4v&L6vU0dsp!V
z9iyU8!Pk4Ov7A~|(znp40ahNdg)1P6kdaVPbEd1aRUo}|Ndn3K$po(c2#86Sg{DW5
zR<?vfIC0@n-eieYX1H%^l`|wt=(C-n$@{M#wY_b7+^610NXqzT^nNZ<vrKOKe6*(X
z@kv=EnC0|VQ=~-Y+F-iWvvXp}s{crZsTti2k$V4izTw%)If--)dhtI{VKGLfQ8M+1
z+aK$nU69H)9PQ4g^%h3UHvTyHGFShcOs?tl_;YDObBtW``Pu2o$whO9_x>dnhA^ON
zBeYGqKv+P8vMB?E8(vZbSk-R&qX^vuHW<jn<@b^PtkLRs-4C%s?}l@i_S}u&Z`v4k
zzB;6S&x0l@6Q7Lb<6{djSr=q6kn%I$m1wm<{VortHDmQCU0I2{)Q&Ccwl8kp4zo?V
z(Fd|kzWq7a8e@Y6tfZ(F!`dw+_*oFbQ8*RY7#nPvEs&g?9l^AwZ_n~je#n88lwBY+
z@73qiwjd&{fdX9?@tToK8%)WRR>)^Mh&*Zu8A2qUu2w*-X;IOUock&@J*lv?&#|bq
z=_y@u{*WeXu-gVi8H7)nX>9p95uymT6t8Tf3?jb85j%8B-bUGC*TxaYA~350>J_-y
z`VtLYt;Hr?6CrPdSOg-uYAlUUtlus&nHSb>j1jst)KXU96dx{NVhn!#;3#T1Zwq0u
z<$2T!6MOlnB7mS-H^N*fh*yC>LrxX6QbMVkHut*b#)(!Zjc4nFgkE*C4&-Ns-Y9aO
zFAj=z6vLZ};Ln_b`4aQz5qrrTU;90VWiN>L?H%`DdW>#ba}tGoP7y`~*YXbxX7W+L
z4aog0Y2-|8n>Y&U@)IhKj$X5Ae9UHZ{n7?&>4kO7q}T2bniyU2=zX^E;L*a>uMCeq
z`CX8RM}8&N^;&$&ENhukCqdEnCgCOU!Ni+DWcP}PWrhaG4UM}UOUqV(-$7w}(d3=F
z=9Nl7DwJYm!-6?iEA8Z;)A;UhX#r^q3Ek0U{^Wl_>Vs~(_hEol7#8aD&0}}S$DKwf
z)tr_+MZcpe?pj7s9*>lLo<vPTf7A!C;hG|?!85&=<nim_2p+8`){5nqHrUr>zn;do
z)gG0B1e!f9h&6(8nI`&ISY)9sIF5FZULu7%Ow(mpnj_+iCpy;?*XTWzNhIh#4&r%?
zE6n={hzD&bsux~wh3a<GKG8=K-2o}JhyoRaYLs}p{M#8myD~tGGs!qoB94MuaLA4`
zAup724?A7Mv>)6pf>B|!d~^*l?yx3{303K^ZKo`aHKuA7XIRnc4YT3B$f7mC>C`lK
zi;^a8P0_B-dvJw~_E}*T<4$O|^k=sipD$SwE9z=;msHpnHW(3x3M2m(8~z}hZCAWo
zjnGgmzKV_QVB^YtoMQ6CTLDr-pg#TZw^HDQR_Khn3QHs+!BU(o@rrR{SH;*1y#QN|
z`!iR~``#*64O~$MCq`>SGn1Q&7YMs1`z+4mg<2VMlOGjm+GywA&MM9oEqh7F`Nlmh
zJzG1~aV5narbN_ZdX>amB+E6rGJXCLOj0Xb*FAMSZRd)CbiV{Ci&ug@x;R3-cV@_C
zY~z*qL>}<iLGO8~aL5>OD@_H#XsG6dkT7v8*ZW#k8)L=Sy)ATt7x;-1F1H^s(5>dH
zsX-0#qpPx~Bnv_f9s3yHR%P}2aFLkQ8T5&_3mi5Sklz1n2yBJs;mvQVDSS5K?g|hZ
zOvyKTP1m<v0Lh|J=_2XAibx$&qrzFv2Irco6h#Az%wCY03@+X%H#8`=ktuvOlzQ{}
z+XLi7XEKYd{F~f2mq_oC_zUBAOg`!mEjG#Fv8oR@G5%Uz_B=<=3cp@ecL-3JSn`0_
za#6m}kt(D|z#jBDm8nUeovNqh{tX!-v;EMiH#w6J?n4r1KNlxe<<74;aZ#9m9(Y%s
z+6W}M3Vl64b+a`8MU1Q1mbnWywQP5Fi7d7C%!a0kS2z8popb%gs5{usbSq9@-O0-`
z*zQSvze>!L#@-L;_(u)5_*@<jZMEzNzt5g^c6maNxP4G+0uln*-5QMebX1t!w9>fq
zWcAs6{NZ=2T4z$9*7{q$x=-4mc&SpHS)b63)~~+?k(wx>!iUyG+v#QPLtgJKf}e}F
zOYv6t79`w-RGNnHukl9~<t#zSyciO8oe*&p%ap@j45G3X9s$M6$KO(fqB2P1@dqXd
zwY>Wd@4^B?BKu5fCK%oxRk)HOkXI^A`x6)6CL@4$eW4QVHl+S9vl7<8#kZQB{VGGA
z@!sd{7pZ+HEu6Y5y^fx$?RUkidiA_-U5rX{KzM3hsepJ>{lZ*>#9Q{!js9DW#k1;+
zy~s!^-o~5S%#X%1NL%w1&WsG4QYFH;4hjqgZ{1+q7cV&!Def#%#XtKlp1M*6cbT8n
z9-bAizJ5?5VIF32e{wjYNHp;NK(CtC)7c5#(cR!@Ul`XW{8jOy*}2+-ZrGX6;W<;d
zH!%jd;{O<#yDnA+%>C-NRX#s|PExnbx5Mz%)4Th)yrSfp)6>`V3rj;!6d)Zg%SR{U
zfDhM%6a{7+F~-_y?Yq{Z8Uwy;1X2AV$xBYQ&WK@i5Z$^LLXN33I7Vuje#gs2pUFLL
zId+wugLL4=D`%UdB%;lc_VQ;5hTeVYYy9hjgSJC68Q)JY)*A>U-`zh&hZ^~OHpV9l
zj=QZw$KEC86Q?3<1AA1wrN7m@`Qt-7zbDUAk1hG{{WGtlAHDUM-?j=l=`^p`d+%r7
zX+l;1aqjCuU7pO8v&B1?!-bh9<~sNdmxg6)kAqe=^Vdae`$6Dr&E9^IycavREpPIV
z2aOhnYL0!@l;phe<Im+`YG*x-1<~K`k|>1hNoh%uu@BVChHOWlEfuP~oHb9~jk(se
zt3z=-;<O+9cr$>>lknT)d%nlgL!b9(lc(n+l8>iC{0^&|Z-15gbfSnSr?I0S<}PxF
z?5%6{Jigx9LBgFM<7&-6N<R7NH9y~dA<=Ykp-0!d{&YF;0=DRhe-iQ(2lQ~+6~6ZV
z=GCN!#G&v$e1AM~|GxEGuT`I;P5j9>;7%|6aqqi!;KQ$)24L4byISo}P-DQ8@56WG
z?~aQQq`7q(<gu0)AYzITyy|hqK0waihch3cq#meZAE*`@s1d3u3kuXReXN)tXuug{
zq#ks`KIlhhpl*H;Iew7IM$jElur+6JesYkxeQ?~=UsM>)jY}$w@=q!(CD2Vg#FxhM
zaej#ZPby4i`ng|dXe?f6P|r^)EdQ2IN@xO&K?Eo)8AF9}hQ_OhWti$D<%eZ*hG!iG
zrEi4gd8s1R!;5;tOY$!exuM||)5?V#;nnsSD(rDNXGHyxVpV8FGbpk(|9)LhM5mX0
z6K7;^eq?`*YKMK~Fi5(mCvsdps%0Z`Bs9v8Eo!nSYF<73LrT=*hVa}*)T(`SG$?v0
zKl)fPdVM2$Cp2WUCVKCPdm9w<Jv8PnXUu+2OyS*_V^FXcrbAnf=VU_w48y$<_!9;z
zSE7btQ3GN(yh6|H<7R2FDK<k*F*jhXaGa_xVX$lZDwi-A9ADCgfL#JW*Bg4`6(@Mi
zda)6IqbH7uAf8<#-q<D{0E?3l!DgI^7nKMV;7U*{U=`6wH1tYfzNO-XOt{LGI0#po
z8%a>Ay-0j&pQzsZ;xs<)7Hz1`%LF#A7aX@@m(lnp1W9JM;w(3lO5P+oc?aG-PBiFE
z;K0COa3$)II1aAl-RUG3u9REk$<H+cA8DxQYa~74x`e@GHj{%f7_~&oi(|$hu9qUA
zDN@-fQngAlT=A-a7dWuQmz%+f4lfG|7*iZlNo!t8PP{bq#$x{sgT>9HI)<heZl+bX
zrq&numc3M}@J?pd$Kr5^myJy`<x01nPHX1MD21dChdu2GQ|dZ?2|#0cxxRQil0H=s
z<1dl1TEINX^(sCjV;PwtX%o+E^@0%tgMl%7qVN@mSH}`e8xF7UzJIm-QfWuxf|MBp
zgT=-k%)GuylkuY$nc4c9fZIdt7S=WSOz6|3a4sxL$IN9Iat@U#9*6`>1`*97ulCWB
zalgTPlHfa&ELV`iI~(_u3n>MC!&MlF$t;z4O3Ue(wcHg41Y|341NaNm6$pR9U~KX#
zWPofL?jZ5PEQ!7>eaD<N&Kx7NH#eT<SeixMD$F77%ek$Y+Xu?EPJMmPEZ6Br#QpHx
z)q>my+<B!Nxh~upZjyQ4lHrdX^P0l)o)YG#^yK-braq_3519=`Xy(6g$PfLTpBDN$
zg1g|=Xnu@i!IS*_gwIJYo)%>E1-~pTu;?v#rCB&aTaX!EDERF~PTxgg8>p~=E+K2S
zu#zq(kFY3#yQr$LNbRWb{cKEaT~X_g@OPh!0tt)T!i(2F6m?3*bf*>%YX*1p6}x;c
z9&s#jcwaou9X<K9WS-l7rm$qDr({91bQ!O7kuYl6taK~faXq}WE5Gy$cbVy0=}uq7
zu4LJ9c+i+*8GCry55n@ep0cx9Bo%czKISxCtvrHIP%N~Z%*jtnMTf{K56tERj;NSj
zHy=@{@C?6ImQ=yw<o9ERkkKiRnjOem^cH1O#=aE>2EOItsl2;xKDPGONK#42)nB;3
z5=mt%c9NS&RVkxY)xBmf|Lkq6NtG78YvQhk`bn<DR)Drv^^K|vW0nzPeWyHPC^ofu
z^__mz-WzYt=JG7)J**<$b*RwZ(|YG?W?;2m?qFU;7+USjQ}DH=nlu~t1(?Wp>-}@0
z8h@S|gjP+EQ%y)j&3{RSN!9jx;(OUudd}s2MdImC$mclK<wevL6x9{=*OhG5l@Znd
z2P&+-P8f-&M^u-Ofx!gowBQZBMGgJ^4TEV7+EkEHp2o2`jUlJT4-t)nM2+M9jSz#z
z8KS1eqK3J-#`%-RrHG~}EesWQ>4fb>G;H-ZP0Wd-otpdT<;sMc$BNhp+?x;6E}9j}
zn@8uGd19L!k$4fY)$RQ)X_-dqBKamzRUi*N1~q=@*h;P4TC&^HyX&^ZQui^}H3Nr<
z<;%nCYHcLNZKZC~92N}BVik*Vtu3v2!l(2!3|E+lbNMV>n3CHTt=nYM=>>?}64%;V
z6gqf{JBlD3Y#+tHE6_f;&rnhI`e8Q1!@hR;!}gCDFsz|d{y~RgdWQ;coBd&@R%BPs
zXy+ZzE|h_Rp)}^lEjQI9dKEgaGIZ%Ow9i*`*`0PAjdrVk==ucdsTb^Wi0pAp@Ahlx
zUf%8MWa(bn?J+v7^s?xBaN2F<)7$LU^WC7QX0&&CxA&e<PuPRLSAu;=i;KQR!QNI#
z@AuKZw%tA(pN?zq`{v^MveSEi81!UnGd243=kX4_6zppv?l<_-_rho3F>imLcK?Ch
zKwv{pKtun@X!j^@-*|C<l=Q&-0BwuK;0dI^Ua<dIaHzpxs2L;c`45gY^cFG<O*Qmv
zrw`g{4=+Rxe_$Ah$7Csf8Cd%`+!#0Xs$ppEBl8c2;ZsP*cZ*@?wvnSRgO;Zw(F`Ls
zf+IiNhWbUi8;S=h2D|qfhT+-{pteDLnK2fU(PM@#CY{lN;!!T4A?gff@~E+-FC(Hl
zBjT3B1Q}y8QM4@DW7od*2n{lqXio??j!AA0DV(vs;d#uvG$G43nJ;}Yc9mqjw{nzI
zXyW1vvwX=!(!e+uYXiT~l#%n4TnU~Y-vlUr(j-dS`HWfKdD1dt>b~;_=*=ksAtl%C
zsmEGVkLM?z@J+YZe=v^!fQXt7E18ZMoQ~R_jv<+e<C{tNzf{=&rNX{$4Sn7I`gMnN
zXP19xPj~0w;boA(ap}&<(9YS{oeNSl)-^Ox4~^@B#*aZ0l%a`+(Ih))GO}IBwOtCm
zT}qc->X=>HvR(S&UB;bVX0mTA*S@joeY@)NjU(n8SJ^k7;ct99->#AE30~V1*4q<x
z*%OP|lPKGh8s3xH*^?vNSGcyXq_?l)vac4iuTi$IHN3C0v#&>XU~moRVE6w73??KZ
zE+zW^l?^8Ff7%913WH;Ku$?ev>j>rP2$R%E#7>mvhiHqLXfxXwO`q7RSFs`g=Y+6N
z**@=b)8=#GA$e{|d0nVHcxrx2c){bkf>(<LfqR8ddyA5$i=tvmo~D)z=9bhpmA+Xj
z4bLj;T&ajkdK=LGHaDdz_<zoW{kFj}|KG8}&{OTlA6mAj`@T(g|CnhXm~Ee#`}A$D
ze`5a2{QTn4eE--&-~Ol3Nz~vmYUp5bVs?3Nc4hq2%Fg=g+R5tF!rJuG+V;lU+Tq&V
z$=dYyjfK_C-P6tarO)%<KQFF+Sv>l(vbnQ*yt8qJUjMSY`QzI*djIR`;kUi--wuxt
zPLB^SE-o<p4bTPPjDSJC9NCHhQE*%IlxMbwfY~(D)hpg~M$ia5e(b5p>W+aah5!Et
z20KgDYi>F_*<alHG~8@c_!|Zj{{@4&{2c}Z)BGI<GgZ2T!QN1@v->NNOaB7~yLSnL
z-6J>q3kIXYz+fski&w~`C;o)NbQf(X6eh}TDXieTs{eq&USeP{{$DVd4h9C>R3sF-
zgu#TeQ5YC(=_d>(GKhh}gfC$*;Y%27PmB967)%3aH$wh?wmt?1L&yFL45pB66{%j8
zJrbzk1xmrdVE*ygGz60fd`=7uW_JmLk&<0MU-}7y4gZG0_KDzjC>GmaFqr#q7>o;S
zuFvgt<q`%%En#3V-K;Rd=qqnYc~d)pgiPuBg)tZyEInL29`zFji;NIVy@bKajfwl^
z&(4YZFfbTfFTEdH5#02nDKg{|2GeI<{IRD+B8@`Cuou`T^uVTi7%Js|@P4e2pR)f0
z1_KN8NR4p`*XjylU@-fiFjy7=Zx!k%4AxD+yDfkder5D045q_k#f^QH1xb6ZehGu=
zWREDq&5n$m{sDtE{RbE<7p%-W@COX`>L&~a<2$#Hzl6b}e!^f@BuB)5!eH!w!C<ej
z$x<(2uo^($z;mIEdphJg#d~)!Fj#&V1_opL1%q*+e!^h=K;f?3OBhV)Z!j3@4F(2#
z^%DjY0Lm8#{DQ$i_?IwPinSQiFBr_rinw|4Hw;F`cL{@~Vqmb4zhJOrY+?IfFjy4~
z#`#Ye%zp8|gu!?qTB)j~h3heLQ4hjz;Edp_d=PjpZSWHYJHx<W+V{YTT7SS`xqrZ5
z43{w2!+(LnwEhhSgVCyoQr8x?{v8H0)JK?20qC|`e!*bZ{)E92S^tE=askw}KP*H%
zYPBS$bUn*bbNE~~#nNV?1FDNIVKA75y}qItG#fMP5oNI*1NYg(e|e?1?WQgU2Gjlz
zFqjZ-RS^R2_!kW3nn|XXje)_m{|yGK{0}hLOAHL=`WFn=`v(jbfPulzf5Bjdf52e&
z3V*_2I7<HlgRNs=u(Dq;*cIB}Fj(?W7)<DIFqqaqVX%AufWfecl#Ug2rGLX<n*V^o
z=q_QfBn%9e{s#<J`V$88LStaC!oR~{sjk0ZFa(9yUoe=?PZ+EXdirlLm<e|PDnRTf
z4EBN<ulr9J%p4H>69&5*%x`%Kg8`}Pa9r|4I5}(r2AT0m%jD&EIjB>9!C<)rT)V$u
zu+2YVFg!tACTJ$X<3C_9T?`E7@)r!2<MqD@gBf99FnbIPHqrqd_yY#h`6mpfqu`Ac
zM^Fuv2j3~q`U3{T4!?rd{udYwTS;mG1A~cTQBVCH1_P5`!eF%k>OWzyRbp`r4Caf0
z!H!ud{|<wF`v(k0vpk0)eJ>c>v+bUC@^M4=ecgw_ub%ZM^JveTa^V&b-;p_(arFBp
z+#kPSFm=W;B7=AbDBo7kd(}1PxMw>P3t%}=I~VqD=+4QK!3-a#VIIT+$A|ThUHvBv
z))L@mb_s)}Vqh?u{}Kk<!@ywQh@=}XVK9(zWT~|86$}jaCP>i7BHR!48wRU{hAxx1
zw1fz{j_xR5!eI7TWQP9=gTa?_r2(D2#7kGgrx|yin$!&A>m}xy<4}pBa5$1u9{GRK
zCeJ~`m~zn(T%3etLKqm#&-y0}W`xAOgV6sI2J=P}`DS0jV2>$=l77NqQ>F-_TzwHf
z3=AfH34>+gQdj*G2CMrQ7!2L=8wQ)^ny_N5Lj3~<OT)lmUI<zY3}$!<gMIi3gX#Z-
z!4N-Tuou5zFfI%Xw)YndW`%*l5Wq0_e}KWlP}l`OVK4>wFBmNKPZ%s2dxHW;`Zo-g
z{u>6<K;xaEur>Y-1{418VK5}pCjAc>42#6?Hw-oclRh3(S}~Tf$P3^yGO4{-RydO<
zdi)y(v-@vhus68z7#NJ>FBq&w{wEC9^%Dkz;FSLXgC*l2F))}o?$@^8Fc|z_V6buh
z-!NDQasE2KAAoQK7HDB4;&b<AH0X)@-A7#i27|3%!eCqgl5=<r^6xO12=2xPz8Lf`
z7|iaUFqje%KMWX;QW)3&4TBj0IkO0a;6T4i7|iH53<d`Z#r}f96ktG)75p51;6T8?
zz+mH6Vg<n1=2#i+&BSvsC-OH8#`O~h<JbQO3>I<;gEf!fsQiY(%+N$f0+t!y@CN>b
z!Q%fN29y2?gBkq+gMA}HAXp+h+&hdoJ==L{z9l0yxN1gNRZWwzA!K7l7I>>k?-KqK
z3>NS&FxdD{7)*Ku#|ZvEguw*=H(;>w{|O96L4xi669ywEVMxXH{|$qs|AxT|e!^hV
zf52c^B>xcxOaBuFgZwXHu;gDbm>>EQ21~WVdn~{c4HGdFAejXaHUsef1qMt169&s8
zF#87#77xI~z+laPgTeg&guyy7?>P~_m5T}huUY>R28&0EHjgA#VPG&ckpcz=GsEfb
zyM)0SMt;Fy@gq1>Ekse|moOOrZy3y|T+{AvFjy)E1_KlC)BT3Q=>8oB%lQ)q+xrQF
z0q_QAe!^f*#Qd&2c7MWPhd*I3j{gM=HhBqy-Tw)LA+2(};FUrc7>o||7Yru&3kEAM
z_bd<)4Et|ku-2b2SlEAt!MOf}!3c3LVK9MTFjzCDEOh}7Vt>J4{Qn6CYyRJX!E!M$
zSUFy+0N#CoybGAv3XVT?l3fZQoCgyRLy4zcNlRVv^x^mh7vVKVsae5~Y3ag*Xr;g{
z-J;^%n7RHt(iAu&a55Wg&q=mAi<27^Ti8Jf&32el_mnr&gnGT+h)DzdHUj)yJy7v_
zkm9=*6-iP5rKFMob0oUn8QRcBUlU82Q)=a{=SVW1P~z3{Mj8d;U?34fm$?9lz9!>%
zPh-c+6G;)~EJ@{z3Fkgv%z2>!-h7tEafK9fw11ll32D7?G(skwODS#P0yIboc_~!f
z_713UwU67@L=`Mq+*+s5zCO}w@bocDr2aYzbid_Il`E-8ZX54ucJN6yk9)&nT8)8b
zm`|LGmp0fKPiL?ej4|WRU@X!|vMzzQe2{Fb7U1`bTTpLlaMY>7LLFrE7H~Yw+6aY>
zkVoR|67f$2TBI}T5q9Zwcdf%P;8@p#^f&jvVCxZjK5S@YVF2A8Be|~Ky)I9*Q%?Ho
z0re6%HEj#z<a%QXFwn+J(E0`Ylhwffk{151{d<g}sV`oD#(Ru>%|A-^>@l>FccA06
zzgt_dJAI&)7&g!VIpl&IfOB8-GPcuqq0IaI&AaY5wAH|Xxg#V8cM0F`WsAmkO$m@3
z&XNeB2&)-#8prsaD)c}Vi15FFQ%Ab}GDj#{N6IE3strS{qeEHRT8r|!dfWu}i8%}R
zvz4mxT+rEwSd(F*tKuU#9>h60mHkir$%-yEzzILV)Xvl*IuNm_QG4u~7$K4eg>6*~
zIf{Ha^R5%?ND`H^;qeiSV>j+QO3Hkn&Uky=VKsXSbwyWbf=9cCt8Ws=mvn}0+|+k!
zKoFO|q)d}!O2GHob3r*{mN%pooq{YMZj8Qq6gAbtB8{a;#LF%D1^I>xmc`dcO4mm!
zK?qB4A;oS3enEXuenTGc{(~CJD5HNi1&b#=B-?2th0;=0HI*V|kUW)<9LE$~GKQVd
z`JrJ^3LumzLzf9@yAOEFO(%&dcTzDr@{EpPTQ+h@4KT19Dm4$Wm4tknhP-hC_m^}k
zx_#u0`<OrPjtfaB&46u<6b)E?P`>bS#j&1Ib(>@`C{X$iK9DC;C?_RYC-YAQA^P(C
z!pnlg^Nq6L0vvU2*FSAGE)eA9ds#(vS>f50^F%p*5>{B?v0k9Ceqx7Dl(hUv|H&s&
zygOE|vDp6eGxN+oHh6wkg9L(}w%w}Z3^r6uHa-WBt?xfJeQ$(C>S?7^nEQkB12+VT
zDV$=s<5!E#+EbbciwA!co4g<#AL)MgdAT{9NbJ?}r`Y0tZtxxo`>6?sLbSp?gJlRy
z8;Rk)B?0djd7LrS-W~V2L8XiIP0TCV?O#%#K1LPuj*IorzQ{6p+Sl$K<0zTat-e`U
ztP@G$H3$J}L5BIj3M1wAMddXY<-+8w6}A&^19f?8;2SZMDGZ%%$Z~$_(hUgF=(XK-
zp2dnoYFlJEo>|ML_Oillv3$H9(G@oMxjbA0fcN0Ou$|u;8jFxG`T0p6I2Bg;(Ud3Z
z4Z+w=U|EL=H08DjrwT=nloyyM3{WX+FiRI#W!G7SgGG3>`Z2MzS}3eKOt;Rk3i14S
z1KX_{JFXgWUcLJ2wwD0tyuXf*Wt+?Gor4rO9!a+S2t1`PzLJGof0d=W&7`u8*dz@9
zM!jhD!>zB@cuiM=ZM?uVAF;bor5n?#r+EoaOus&P73CGN4OyWWD}j{K*M=&AT`<~&
z4tNU&Wa!-nAJl>lzV2O&aGlA2St0E`0@QJ}f0N4j8Z#+eAxyF(OTqG*ytMyXxzkR>
zfXL~B;uI=U#uL`p6Ul_*c@7_>U6>{O#H3?|w}q63aYce4yVXJncLF>!7|V2zR87Jc
z8W#!ak$Txo6um)<bG9oo_8Sfso+54Wp<?s<ESqyJqEF~6Ae}oK*hhyvV4rJ1#VMRq
z9x%xmcC5$|!R<*dgBC{G*%~D7cI^)Cv|{{HyeNQ+lM5)tslsaltU=)Ox%!!xG5aN?
z!w94a{9A1&VJfiuVU*&caC{mUQ(-PM&l+yZNTAts%I}Bmz_{;3ZZ^@!r>PC~xL9ZS
z)@Ke1DZybWi5DWcXY#RR3RmGT$18@J_H$Drxggg=$i|1k3-jc!NXei3955`M`amxD
z1bbgFTs1H}AHoKY51<xThyM<PL9Sk(xc^|O6S4I<+iOoJjp}(p0M26IC<X@Oy1`#u
zGj_Gz!Rz*ahQT%rB9HvACY6ac$1^lDxjV%E1qQS36ncP<XFplt(4YHX!C?Nla+YGY
z=!Lcr%4>EXr+4r5#BrG=62G^#9e63~vi5OiPrKlCYcQ4N?7qW9!Fn!gQO}TYn#+DL
z;v%C>;MMG2?qrfg&O13Xu8q=dZfUOv8s}ae56>hIzs$b(*a?<N7B^Y0PPi5_-*A0@
zdhFg-bjj?g_x@&kn=Ezy^*sCPv~(#Wsadz_`$M7yzNK|f!>pFG-^mXxMpt7dYOlRJ
z{v5I0^bHWGE{{!O!{0iMN{Ep?K__5fFePXl`{9t_B@AZlrUJc4;Hg+Lv~p9WGkFBz
zr>RJ&P-Svxa8rgMph7+5&qUs;EUwjQceABQ@2b5|`dFyW5f$jJ&RaP#Cc@;E|E-5-
zj@7x3vH6SOKvma7xTdhLw!4;iUfaC_@h#=TL8df;0m;g`)Vs3MP7?`wW#`1kBNsB;
z#>V-^h5%ra3fq}R0ybHOpstovps*3$)q|=$FSC<J#_7{5iA|CleQrgP`%<Ev!iK(r
z1~)Bz4?0XWCSR~yEC}?_=xpq-)9Xyl988C5uR;f_vMnkH%+H>U3-zT$PAS{PO}@)i
z4xhw_u9Bu=zh-|YD#l_fJb05=v{KV#-r<uYb<q<(%kLjOj0zT`{7%Dqk)8wSJdn?B
ziP*@q*1G5cr;4Z#B|)#9O=kmm{5I0W_675qD}Pkc+%nV73`#Pm{utkA|3*|oEAfWz
z(LHAbfDPp9qZ625Y_;H7D{S~~pO|U?r5)W3hsp3HhyBIOb?q!HGy6C94+tGDa$dfh
z*hGd*c{>H}YeYLaua9QeYtAu%-+6y=_vHDUBs(EfwPj{r^v>Ct;wy9v@0m*zR+=is
zCr65(FxV+(R_w#@I`^>dZy1c{z4W`c&5usqF)-Mv#|V#z)T1$q^~`9=H($*kM%@^D
z_PD-_-`BI_xN^2fSeqc-bK%){-*4<94go7{4iZWUtbQhb-fPxGen;$4YE9m=-Xl1N
zwT8EJ>0fxYtipT>50;;PX-{QG%ZI+k7_;6zK3$bqme2iuY<0g7t#^2&?{{+Y{q^{d
zni92>lRM+$SYk{Kr9KY{u)iC=X>kA#z?RKnrar(%Y<F(D)3~S$WO{cEaj6S}rNc-B
z3{s?D4GG+%UnFd{Y5R)QSE=ZIO?0P++2976=dQ34Bg3>j+U-rq6got3zzVNVT#-I(
zq)nvBA747O9d>|J0Z&y#`yDBeBLVH-Pe*v1;H{>T%6-!fHcDEIXa+>he3-ZbGgCfU
z)ad76o;A}PlFuO&?jjIA!bidEJ?QA9!ev-mVz<W^0~Nn)Js62YE=exj$A+O#iuFwl
zD}0e!<>-|h<|E~|5k{>8@07Lx5bD>!oE2jIujB$Eo}RLT1_VHy;iv#E?L~S&SASZ%
zoEWHmrj}6;?bQgyG*a2OIz;ZT>2FbxC~ynw&k6*I#9UOtiX^sQPDxXW*3Pg!_@SL9
z9l9pw0A*mxA4-vx2%%&Rh@hjfA<Q_<7PJ_-CfpJbfrkaG32<$^BVJBWC8CZ)wiF^$
z4P)Xm4WZJ^4AUqT=DhdpwM1)g>!Nj4I+e@{R9rI4zUmq{x@bc!14<H;YOKO?m0sgU
zxRi$G1jkN!8^sV-obr*Q)&3(Ghx`(mA-f{`c}qJ?db0&Vybr_6fF0Y6L{l9BiDyyD
z%C?^qq8fH{WR{c}@S)u$!3V~(*`4qsj+<4AZ)I(DT5pY~zQOAKTqrTB#<^mJdsiNZ
zTA@Xa)#hHT-gyB2krxSXuAr$;_Fg`LL7~DF3*y3W6A^Ik<!GE|Hd%{pD?zVQG+gy#
zN~!KfamO;Rz0ri?Nc>b4Z@3<*a72PoI$If8tJ=2(G~PGdR$K+Z)#oh&xOojMxO}ES
zt2oD4_8L^4VW&T_s~{+^s~y)c$5G?<TmquxX1yx+if3bg)>l81259|Podtv72&65`
zE*f9<M=LO3NvV-M&c*w6{QU0PcZP)tm*>ZGcea}bn#gNaIPKoZ2%xR<fu2NuSf>W&
z0L=Ak#e%RNS8L<+9%^cKB~jf~f~!7U6x4Vf$@&I&cT`!)M@RfQm>SHmgpXK!YVdS^
zWJVqLiSv>A35q4VVFBc=+SK}5aIxhBDZDS1uqgm=z5yscG|L_zYee-$sH;D&I!a4E
zRK5z1vSCs<He;Y^mGA_>abq*P9il3tZ!PJHDFt^s`DKgqq5;%*pekhYLgD(OHo|e<
zDooeMNvkZb@_+hF4+s^C!eQhSaskubkH*PppIsAY%cc$P*}u2;U{k8g3Q(dS$I+x8
z%JQ0xBJbUD*irf$ImEH@2;BXJC_{*Nl_CTC)2gtfxG?Qd#dhz*$L!iyqSa%qsSRcK
zCHxw<?pAV+z6(W^3>%Qh$NEoj%m&eYEhmO@EfKl(l!sBxZ_pn6U})$3E@38UZOki0
z;Rf56h%I?w3Jkzz+js~fj&;=cfR0~e9Clx^(?WOpNTT>HswfPzNk{=!*!X}Ju@1;C
z9*#V4#P#uOJ*X3O9&1p6{Sg!}0ssMEq(L-T*i-@m5WpgXqkIbh>dLADfKRj3v`B<k
zz_DO3z>Di~nR+%vfczO{wsLqC8vqAmAOUnAc4DhG0V!@Md<Jp?Mr8m1LTTjEIzSNw
zu)<2A4p8BJA~9e~iUUf=06O9!xHqk^0K_ot8|U65ArD#g7_0y!0C~`nc@$Ql*CO_F
znl_fZK@3u|0)%&bK*CsX&$J#qAox%s{einmI)a=YSs!+L`@VddJvE@bwGIpAst1r?
z8@e6L5sHR`!2TdjxeGPuLqArKSBr9!)uVY9eG)edI5vmSk1)j%xTTWP>X@tqw@;kc
zvYsgcpr_-r36jL#>X^RMt1%3ugO?v8|Gh&uZriQwnP|J^*GJt__>N^B%WQX!hg1Rh
zg$$dCk|D$>cwc3{e}9!nEU;Hg+@4F`VOG{&3W96u5AB8Hi$h55;n9d{j149P09>sp
zPnHV7*kF_fVidbF(9t@AIV_SyS+bh)vU^Q-QXz6i2oKi)U}y`}zs{XUXfv(R5dddA
z!UjygBOAcjU~op$cN7w0atMj{?JYu5kYnMvTHz*cdPNnu0xb@J3<o}>qyVD<;GgCK
zBP(y123_D96Zc8ApN~p92}3Zx7fLwJUfv%tEkBV^Elh+ZPwWpS@+UHeK)*D8!q{L|
zZ7Pug9$;KR4P2hV--WY|P8y%|(guUin8zs#$Dx$!#Kq&15t8-@<!YYbK_DDbF3Kq_
z2@6$$p=2J{U)o?lcp5zr${IMznil@bks`-o{>p*vYMM$?VfX~8gc3Cc*BK(kL{xtq
z3*S?^w85Z@aG*fk!x4CmuuP0FBvv?18~|`tf^Yx;9LjNESPRrZflC;0l?FhDvBB~K
zC>@%v+*1M21k)ZXXM12j<88E#ZFDbIO-K-R7O1@@9=Ew1=cx=~H3d-g)?QeMh^bbp
z`6$QHOm}&N%J?}|*AZbk7_-|%CV1InGxgBqx8RFEQ*90Hinn-;#o0(9s7SDf%YcK!
z${UQa!PG=#=%<4`suTdBftL9~_WA%)&S2}KfZ&g~z#4$DDW1yobyjh}8-`BkgywUG
zru@oYj18tYf+t_z%jgBS1k_+`u*H*Zd^E0cIUEmFQ_+C16sWh%4+hr2Z|Vo)+t+F9
zV|($)VW6gq6D_*lz7pbg2t`ALG(IOo|6A#PkI=vm5f~c`&|Z}50c(m%@0F756)ym)
zza+eyf|C;1g$LE4ACs(BQVRzHaHp%cfpBbje-Km(;Hs7tDS1(<jJpsC$e{=Vh1Ow(
z4%%A1O^|{lI1N!8*F8QBE&~E^II(yl>nemHuZmSa1K|J^+!+xZim}1u1@+1$%hLq(
ztcEHpudC3&^V{oaZw=*-w>Vn8#STUAHUKPf0M%JT`SrTbgzK>||I)+(0&&?741-<5
z)I35U=c8am3cjvB$7_K=JJZ3G2ZMN)nUpjD4o=O<<r<EvAc;rhcLWTexA5S?an`Y-
z90kFTv*XC^C7Jv&Fc`jl{^%l4F!VV1Ccu!g0+&1^jz$G?2c<xlISS>%V~+~Fgu%}A
z$yo>auyU=BgZL#u0<h$%V*(zK5$OTZ%c?PxW4wzRDMdmGzUa3>+T~cML^aYlaAGSt
zk;XCn`IlG9Lyb4CJXgnlo)08E3v)stgfgVb2FJmUxKtT&=%-w)0&obd4!(sa<z=8s
z!opjfAV*34+^Y9AD9BvhxJ7(i=iv2)=A@L_jhll=-KYeY5o}@85arMi<5(OuP`FU}
z6(iAc72ipPLILXxw!3^&*x@%+G;rRCm)$udGFF-5=K86EA>}D<`Qw*QO<QD^&)w7!
zjVFg`k-u$WyV~vO3`jdAm&d4Jt{pC+0mSn4j{8A0<#3{M|GR)d?xQ}BPy|K=GdBj1
z#Tqy~Cb!Kf!hUwsN@n^z45NYp%G>2Ha4;%Zi-Po{@jq0sk`)LpS{)h&$3it?JHmmW
z58UE_utE5B0)MRXTJn2BrCWm@)3{;Ia8kfXB9F`+3=D=gfjUSOENg~1#|P?M!eGg!
zX0MQf!P^n`GP7)9fmo)po(<C!VG|b$Gu$^IIN%wI<7!I98P`=^DbWO)a@{xmfuWBl
zv^gsv<>S`*ffib|pQI{*U^6HLAI1p)wip#YrqCG0W3tC`%?y(?6-eI*NscsYOqtaw
z30^mc<A-87%hyZw2jXUw+nQp5yx;^aH;X#W*2m3M_O+p-!GFMDLTm_vP{bt+HvP^T
zbqRxoAPg?ZFfdq4^^9m71_l$@GlN#(l6e6@m_(C<pz;IU&4W3D6aXRTd&(5RU5@|)
z&I)cX0B#R}^+ud{3V@mz6Z;JyEDoNv1dws|ai_rX(bEK#xV+B*S*se!XX1p@^C0>6
zD>Co`Dafk{d8k7_BdRQs9zb1L*I4~&J_wL-H2}cb(YhL!twSQM{_&-&S;n+T&ni)`
ztuf3)B574?8%GZi>i;@HGMuMlOb1fgKJ6hsHI9M7zzrUzSd_WqI3vNf<#n-)0H1wa
zT%-=N9+01ffx$3!{&q{2IF_dtVJHR$yK9cZz+mu^{?@ShvU1DdUoe<%+=XzzR5%Yj
zQKy#cA%HBR20Ontu^PA49Dv-udnN;Es**sqPf;#fe_=3hjetAvwO|PVC;*A<o?6DS
z!-<w~fIdL_P>13cyrt2Kc)>_~28BSU@{5KV*OcsJ;@(3S7><N+*71E0V3jnmb+fWX
zz=P%_brMnntx#bSVG)>^Psq?XLldxf9|y{>#L565!{iC&;~9$sXqwDuRp)6jkdv#j
zo2wvGQlsOBsXV8D)nFj@h&=3Bza?kjRXi083>G6A7a8I2q7Qt31p|WtNKx?b)$cE1
zFfeL(OXm&-21~i4_2O;ANnH~IApaS_8H~?9hb50Ty{didq9IF)tz%T?I>Z2MH7sfh
zy`{J#5~mouM48{g_|6oEMg;`6!bvfY8Qj3KTZ8V}{g_yx?L~FEswSXq5CTA*)Eosq
zY%?#Q9E_V5{8_9e1PTf;ObM_&!xcWF%f9KDdl;es3NUT~W(b7|iHoP(C#rczv^!$k
z4Hn-~H6p87!UY64qWT*d8`Rd|0`C;=Uyq|1GNV&1p@4{{RboXiFTTfl%MFuGqHJ&`
zo}-ibn+hfX@$&00zX2gaEm165$9JsUJZeD}Nwj}a09%;jFajF3D%}$Sur15VoaJ&x
z0EUx{Sh$A&^)?;BEge2Q=g5vLY48gYPWUzT&Etb<hC|#6DFDIExa~@t)K@IJs!>+*
zWeFn=R+@pvDFMnz60Whp%r0Q;5#DWiM>Fi8Oii48U4L{J(2A8#zsE5Wqk`pEq=P7H
zQU0FjRV&M{(2nIx6^t_&3)zR&0~fjudGBjCE*eL>U>2tg5%L0r8^M36U;rFsdm|_m
zzDhK=dsT|nX1x=mg01!P@7?XCGUu)OvPfYiL<4vrBGK571__v97C%y^bJ{2Xb+g)6
zVgN=3a};^diU80)>7Mp{M-HyTf@x6oE)EchVaeJ!>tlV;-F(C=oyZvM80w#TvIC7X
zlJDAqR&2In);}CxA0tLKJ=L-F)q{)$@a~0jJVzt8*Q~NjuV%2iAZk3Go4PoMa(}Se
zIrQ5}-*|C{fGV(jwKN5vAy!|9GuN7nN{D-lEGU?N2&ae*xP0gW7zW_T!yVyxMZ#$N
zTx%0beCu}#6-L+u&o5Ol#}=v1`hkvfR|@~&?W~qZ#Ji9u&cg}A?+2{Sg-83o-lcHp
zZy=J<yHvp(?x5_+n%%yRySXfUs%6BgFcN0cojFz!bj$CWJ`5xn555Mr@|VGfr5y}o
zR4{;KwsD6F7?sG6*Sd$3cms!n0u$=K5k~@`qu%3i_&OF_BD|BFzGlS)hx&l=XHD@f
z)cr4vM>h{O;}5QbWL|qot9^D6z>C%=_#W(%wvqJsC<(KX(?FG!9R+cXgm}VneNzGi
z>5|<?Su|br?||TVXm|xLJQg$C?B`U}Z(Sg4RWvE}Nu(Y(6cAFmct(hMhRW0kAk%FC
zAy~TD{17|;zIO07HYWg714r}W#OO%u`7B|<0R*9ew%`VQPI&%St%sEm2;>h$X*M{)
z=Q`~pL{T;Pn2x4D0S)}Q7=*stjnM?BwGvK@HZ?b$1Hz;W_JYLG(>AJb#TAW4iYD)L
zI3#7P`?l1FckhH&Fw0>d)Av*4HU4Df<B7MOT$N_HN9rLcxJlXj7Ad$#x66ePHSt}6
zKqq}<SPOzGAM2i=1yc)_E2NYa!0_g+M|d)2bD_T<%0pkBQcm4bE|w?p=qPQ3+HaS-
zE5p0&2ya!0O75rtPMf09?2;NB92PMHG{x#j1AJQs7=z$obYQs*oRbC)0E9ZOvyzBg
zp&8mBxTM51{^&&|H!2#ceb<M$a3C%i;7x<y3J>4`cNw&xTY8A`iS@k%<e_c&c=#O>
zYF(%RP9PPmY7(}Br3bnpG_bF)=+8}-c}qY5DIa(f%#4lY%7F*hX2M2(tAb?*D6UuO
z2=pkl0`9CQ>MP6Rupk5Qy|^7wj{w*eMl8AjR|WdEG$4RjAAGTy-UkTe;7t>dhqb*9
zvcbNwH<A<p&^&bi`sG-7;|~~&&N>`=ezWr7_7Bm&V6aJ_{MAyKGSQ}m%3a9!`>OHi
z59@6fT7D;U^u8r&;$;srs++iGPY;00!zTymrS61lE;0w3`=38lx;!^aE4c}mb4qwE
zYeq5j$ulz`G7cp2EbLx{nbG#$exLOtLzw;K^w^C5XTEVlo4lECFy(i=l_tLJfp|JR
zG=6LS7@e!U4KeHW2E@H2ZLH1i35A%6vebEz!Wb9;0Q|4VM{KbQ0ZFOeDs&DjQq~N&
zvad^P$0?Jy2EDiNP{qSi1^;MRB;yl>U%btZb8&rxD;w640OBZs*RrQM2ZX(fb?cMh
z$oTSjIozH`!hqwo?^tbQG~mneOh%r9zP_3tcO7S}a@{d!c5%>K&Fl}p6nfsq0R?34
zFQPvTJBE2lau?*3;&EgZ6xMP3=7t`2;=s!#c}k3KQ1tR69hM6nUWU5gD`_43oL``V
z$C8s~eR}gjL8{ORZ`G*gvnz#dX3t7uMz#I<-p>c*mb_nd*ZNX5*|^w7KUX~y$+CJ=
z(^jm%&b+u`Z}wT4++;Wg20Qz4a;*gmUxUBt{pj1(EFTdg*R+0G_lUTqeDjA~pbuR@
zeqtwvZ7A0Wt3XfH617mTPqc+l-}dN5d>fShQ*cP?xldNFq}5PXcE8r`dp#6BG+ezf
z=eKN@E=W^t^F|3CMh8YN*Lb0c$5eEplb%brM5mCr@d4~w!$}<?b2|QHkF`n_3qGuE
zDiIGKPIM77nT7U+2^NJREV%7b6e8rdk9NBxMNfc(^a!iZ`1~%Wz+hC><~Uh?=_Xq@
zU)%@0etL}uy<9Z3CzZOaMkxPbF)tJgsne0`T~)>@dtl!+t4FEVw<k+{RHtey-xqyt
z-0CaZX%t&@+b(N_1hQ|ZEb2k5f_HUy9ogv9Wcjm&NIq5JRM0U+%P(UK4@{ilk?FoG
zjv}g3SF|KFOO#U?sGPrxd!{#i@%-YfZ|b@_xByj=L)(ImfC;oSo3$XW+xy2nB`$}5
zbZCQmjpCS|w&AKEaY-3y8cBYzi|P?Ef#iUt;CR=-E5);YhOr`~p6gOtj={s?ATExx
z08yHv+tM9z0g~Fp_Qe{?7xHn~zS&lcW}HFnbvGG(5?P?*S+@yu7s;|9f{=ogfc&0h
z!Z*iR1f(LtMDn(Hgi|OnD^wcsI8EA%T^JpQ4;#ZWXLsT*+{^LQIyK2AG-y6f=V%0n
zEF6|$jDrR3KVe`RsixC7@)vc1-{Cg&kD>BWqfgg=<1w_WjPY*b&tp62XXCK-mES%*
zhpUh~BKfbC+G!WPL|wZuvtuybuShC#pd*tNSNoLlAlY;)=Nd3c@z&Ikd-1KzxG&bY
z=Cj3iXZZ^AKl~9;s6IpMXczb_j*#z2NwT~rUao4COf#T0KE;AU)(}l{FWX8>8hKS#
zpF;&0UKl}oic5xO34`kEC*8BLV_qMvf~K>8t3vS<DGEn|gsT1>21B$GM7mdHF`aR$
zD-jw-g;!;>%W!Eb^o0p$2d7j;tU3vFv6}>9Bh`MWf&)-jrtI%N%Uki+-I5^7=mQve
z<ztbi!pW$O<0;a;5}6IbfeH@_G^ATvlj8vstjN*`ew3YDFn%!C2zG9lLYB^C%0=5m
zd3DJ{UmlC){|*M*4xgHRSuNVbYe<VszR9+Th_JNyLbz@%;cMz?oK|cicfFQQdohby
zdIV+TEJ0>wf0uCe8Q+6@Jaa!`uxe)#LpH?R(sfZ$6dy*;{<t_bh1(&+@9xk)^@;s^
zb*+v9Q7X^;=E79XL?gdTvex{%Ds}xrwKL<;E&l13n8?WdMQM@Ny6p|NN1#aCFR?~-
z<0Wg4cP$4c&+SOIEZBkzEXQ`E@kWf%0AlHu_U9DE6;M1@nf8b`0hw1vpeyk*?U4eF
zt_A)37Buau?#|r{R(QS_PzAV3&os0}fW*`^D}cJgUyw$<WwM3_F))HpM($5U{ph+_
zFf2G^@Lp8+>|5qpuybsJMWI7ByIhVpT6(;OG<m_PP1;@{#GKofd#=CFR8}YCg*MYs
z$q=1ciwen2VO)!i*obD%<tHOOn$H_%B5idPxIhp3R%oz$@16@Ifil<F^ICe}_`5S7
zRNN1CU=_W?K8Wa~mr<$5T=(<Zw`b+E-?a~+K#l}|1bg0nP&f0ss){2@hlGepS%}h7
zhm^UkV)NE`-BeDh8e<wtbp%!ybCjRi4|3j6%46>nI(<A8c(!tPu1+%JeE((43(!(8
z3^I0HU2w-+&#0{Z0yp0rKhBAQFjTbu<C^SuFISyK%O`eTMgs5X=CEE_eW-})2u3rm
zmQ*=Rq|LwH6s>d13i_Zx&#Yp<PG8sMLfwNbK2O{;**tZ1KEDnc$=4NThoGZ88kQ?w
zs&#*9Ocr?d(eB_p<$f^1PJFW3ytKUcedD2TD?W#keoceYeFA$Kdp=V)7tj*wxBI!C
zZLbS{c*_^oB$DN!x*>BXmGa^Feu0r?HJxARI7Q<|y0`a=`unRn5z$)O_-9);Oj23A
zJPxZXWsoMrb!Gk;*R|wQb1W*k-a4o~37xhabH0|sGjjO7mBR0<&UGpI1Iv1-BrR&d
zSbCc#2HZ`}bVur<NP129j)2y(`Q9SLlTm8Ndma92=Ko>uK7*p#wnkxh6Pg^l$+=r{
zlq?w<kStkHlq9Gml^{V$-Q*}y$vL$G0s@kuo1Bv*QII4_L_knMl&`_C-Fth^+2__<
zw{F$<{$Evd{g`Xi8gq;}p1c}5g$H*I#w%xy_%At`-M5f)uXK8?x#Bvaa<n-y#Q&u6
zNPa7e^}{MrA^{QW*Nrz;hjV(45T$DhyLtYbjkknfR_7~h7qFFH8Z-Vpd-OF6M&b87
z%>PhKF_gK#?CV}776watu>R`w(f*3ghn*V5FGGT%Zc8mkUr*ERG+6?^T9!t?Kr#2(
zcBs6kgyLFcz3gH8ATd`04(vSNTbCbsu0w@tOX;>oHo;B({W?oRzqzcYz`^sqn0ynK
zbVj15*(A+YpU;{Xp!*%Fa2>EJ7|MWhOh*=bvP&5)X{UUMhJqDHzSg}0(;mS>7?kfT
z5l>-Nurav&$i<a>Ft~?Q>?Ii^CO`p!DdvUI-|YoFeMKKK?_V0ge*wA^^o-geVWpdr
zf&(sYk8EtmJ(B`sRo23*f5o~yZ)>2^5E~&`WzE+(&(egHQYBYNM(*wBu!nRJKC$E&
zj1++lu=lF1$Mwq1!Krj`g$`TK*dZCjbs3SZ_Ytk!&2XyQ3!G1L`GumT1T1gZ4e>Xt
zF^Hc^a}F3Qh!dK)GQF!36HFj<kNEnYn#f%(NPO4g<t|~+MbUa~fdw_O)On7rxYHIk
zI^*cZa00>jP?&{!LKQlxyYtKhFd%$>;(iy?9D-X~{mf&Kc(*oq>WDSDJ+C2gz6u@f
zSgOW{0P<*rD%b_kT4i(0VT>w3FB_34jaKM`B!)rUkM5QQfIJb<B8Y`ua*#yGDbGvC
z=0-kRXc@#BW#fdfb+oe0--X@jSCN%bZ_+`&9I(kp=Qp78s~S@{5(BouqrRmv5?cXs
zr4){H`MRQd)%)=02$)DBhDyWs#?+$M7D94RO*)hPt#Q9&5WD8Jr79;|$K6H6(WxV7
zsAM9}>11Gli0vsUTR7_yw?uxu)gV)Ow$o}LxqX`q9)TczTXG_fVl#$mE<hoj+zLdn
z8g?%+YRU9ik-BQ}A#kmGMy3%->(gTup<>+}B4JC)-G9_}?Lg(agGwi&6<heDzQ1gz
zi>n@BbE*W$szIRrG(@W8^{UQ@(gdl(C*W-aQh|ZPu|$Om(JEu51wL#wTj1p32;j21
zcLQ%pY2hk+X$Y5HpxYIwGck9eU4r6zn+(T_D{=A-pKI46xE(SJ?c<m4Ji3Mvhfk{7
zKoD>~=xg3O1P2zbqgOF}QlzMA1CA{a2(adnLrP45&fQ&fcp9R4CG;$<riMxANPEZ?
z*Q<42oQfcfFGiV6YW%~-1!qP}Ff*sSPN4qd&QPuZpPiT^#EPS^N|zGlt2rcTBj(j7
z6_(4fQH4g7iLKO90YF$Rjthn6#46?!Fp`$>;>gi+mvS{qD0$}`>fR2@v1E$7IxunK
z`h7!Q!Hf0}rn&EgsgQlboKCiNS}-M>gX5Rt3Ry+5ISt8aoaY-u%Y@lIpKGJ8Rie~^
zW2p{9GZoniQVJhyr%xRE2P%|X=j3V;3KAGSGoy@I`{Awpjjc7NPrTU^o%b!)A6!{a
z6xAViA`qj0g*-d@Pz0AgU#WkN+wt}zMIXNR8Y5>8x#@S{ffg&yAqf|A3obMRT~P%p
zCPnr7tCpZbbB}c!wdGreg;ycVOyWF_#-}{DFz;tVL^$rbcnsK@a5-AtTfUvZVGN7a
zS`8X};oZsYzJyZLX$x7VQt;9A4|%qe!xw&V#0}OQ37l37I8b@nO?tYDcik?4E#C-;
z#0jtm)15tm!7_VyIh2d+0!d3iJX>56=i<)SN3t=;CqK1WEeRnl2|R|us(70~1dWd_
z>KqhF&|4CR1=4QN-9Y2`y7Iz&ApsaC-zRFwgSOhu6BrC+1|ht@{|VR1wacScfIIOU
z3|6Ys?7%97avXk`vG7pQnTLm-EyMw3kjmpu=wJ#gj_tLJtLKRy9E>mI6_Q%Jx7>L+
zMe!vF&d`mdk;8nQQOi5G&Xj*~x|cfQYm5uwaMb)8lYlps07q0I&M^$O)f#eh@maH@
zq1sJu!T5;Q&L%aKBK?s{>V6>GVX=b_xHUVT&-cx;$L0#3lcTUe^ggu^HCzV1@mg7%
z3Z*H7-<8ZbY_z6AQlbL!x);2>>5y2Wxa72ynxdG0v2PmmFm>Ibk(qpH?$HB>{w1e{
zC-i4{-woj~3JNnr_i>+VyngTrsNXZTT&P5L`SQnJ1cw)j`fT3(vQsLgD=C@3UNpvk
zaAn{zD45l$b-Axqa-&T*t{vpm!N{)A-zM9QWG3agVW(U_hfu6Sv?&YF_ZP34jL?iH
zEHiG-4_+E!WXNd^NMd9wfBL9jL&#C}rc9}kY-y)B^<&35v>$%x@>AZ_P5q6C&AP`S
zFO!AH7hB0oL1ckPw@|mW6l)PuDM+pj=cYjt)-hm4A)s(+(`-TI;p4!&3>WE%-Ys)+
zj(D7NX1?`-aoDdTkORsv`XHL}{s3c{S}TJKp(8F93@h22q5?mcA%)O;m-jpYl|#Vm
zQbNQkZ+B(hjRz2{JXTxB*;@DL1#F+*2-&1E?UKH&a?1{f+b+<vN{Per2H1F$J9w1m
ze*D^jNF|{Q+19yF6X*x|I0vl(4(a7Ot*2!RP7|x!7z^67I8!WkV*4ck<l=?|dJf>K
z2UH)QnBW6VUGzxMyd#BZkv>CV3O7{tX%t}`{(y?;t4IkQqX{j8v<LRYMF@^sCAoeT
za4ni=zfDf~=)B|0osQD=n-Y40@0D1XhCK+kDW8J&*ArJbDpn3F_eE9Y1K)w_T@@%U
zk8cC;=F#ohuJlaXL<B&hBNG_YD<<w82fS^{&njSTqBpLgkdL@jvfCR0;aqMzc--5N
zGZiuw39=X?Q}=RJ^}bzU#~YOD&K$g+-Ac7<xN(~1c4S?Sgw;;Ff$GX6XFJsfNFA5#
zOm5k(+(>`!G}gz>_RLYg8f-c%W6a0LbQ|g-?ud3J>vk1lVuO3%<9i=1QuE+8vD<Ck
zOJufg#7=H!OnbGw35@LBz=xeeM)w;m#-$c8VhIc9CJhthG!xO=8&R{{2sqj9`*^2k
zHx2_n4`X34M=T6hdW*h#i896TRi9napd%Ira~m$G3aPxys-U_XuX;~JLc-}M3|7N(
zSRZ1{`V9v29NK&8nEo9G3w1AY6}|3l4IWut+(B}Ve22k288!I|7Jxbt<Qd~ix|{jI
zz2rY&u$nU;OK5eDVX)M-BJb9sA28UNN&#`%FKTIp2}J>X{Xb!_vL5A2ZPao!+*Mc@
z>@D+m7_8P=01JcFkd7g!OW%EbD%$!J2FqG<{Qo-)7NyL+bOM8UV_`5{$J+t)8dw<2
zo3$LrG3XcuYxoSqWzqoBmE%aFk<^#rtQT<jFSIfze};Vu<a9<-FTsytus|#f)<BKM
z!eF1-cE7=3Z6Z^jVH$z0ktZ;i7#n-KEdLUc`VixAh@sIy(kp#~!MwS#Fc|KuE^Q!_
z#t#@w8*>bUIRhEL!(d<5#{=p-aX7xiV22I@zNaa%Fxa8fF$|{Sh=su>PhhZ;5IJbz
zF$`w;4F>z-g@wToSQsqO@f!?g`3(k>ciL!j{04&|eu2RzahNY-zQbVbfz-mSCotI1
zHyEt>#v$?;2Gd8@eZ<0Gk~fcGux2kT490|o!F(LCFqj+gjj6hj#t9780(#egg~5DS
zvjgLPg~6C{B*TDAB_YD93UtRXn2+G0_l>9k>TIB6x$?(XojiwF7)+iS+9rPpgk2`!
zSHj^)_hCJT!J4TX{o>l2u?x{CwZaG+e}Ta)g?K{`zr?wIhr!Zu!zpQa?Y_ZaioAxK
zuRp8&0~oBUH;rBj3xiRKLDsP_*kj7p&L1#X5PR^rl6A%fEDTmQA!3_R&Qgqp!8*(i
z9mapcV8xt*3zOequ%|}fVX(amCAzJI%PJop8ew5DLEmpMSQF%9JQfC9ll~P3>l?TK
z0fXHbJAuIxuhe|_0fTvbhrw=)eTTuyOv>^y6wX{7Ct~;=3|7>v6$c7EhQatKywnl`
zD1-C67qKuH<1q{-hsVcz41<|)t^WdpsaSu9!6J@fFip~*Fj#LqatB2j|6jmhT@c=H
zFqn0ovh5ETOojJ53>Nx(7)<>H27A~MuS<NO8lek)C>*mx9&wgf<Zxb`!aqMQ01JaH
zVqq|b6Bx|)&oEfUPZ*5z8w_@V*LC+iu~g&3V;HPw@dO5&mfMV5jxqWJ1{;<VmEe6W
z#StU-@FxuBU>!(vhd%Bb3|99G3}*5T24gr&Ecpuz7W5|=?D@Zf!Ca9`F>-_zSQu=s
z_RlcbweK*PQT_=G_TW!2*z<2NSm=G}UtqBN0TGH0-(fJA)GsjD*FV8v4k^Eb!HoV9
z3^sy3{4)$j6Zm%+>;V=AL;V>BtAk=;Fo!?GV9Ng;43;1JPhl{9?z?e+z+gx$40e{W
zrv4wnU~2Y%hQUU^!(go6VK9z=0fVVpe}};ezQbS*-(WDUzrbMAzk$I<DNkT9wWWYR
zV6Y_$a^$~+!EWPg{{n+$V_`7HV;Jm|P}DClSopt!!IV{!^N(S$W#TI*FqkgyKZ3zn
z@cFSYnC^EN>>d^dGZ^~@gFXIFFj#H&n9&Ig)_Veju`08N9>ZX_@zsuDu+PUZSmN(s
zu+|e8%;^LM6OxMh4uhqVJW+0yF7X1h{}~3;{uKrzCksNI6;c?fRJowcIA`^L1cNpG
z4F=O|$9b6XsTT|W6#az3rv3th*?)(@VlOYjNu8wr1cTK<u`n1O+3#U6<6mL0p8q)*
z%=uRstd#!mFqku{gQwQ{7Z^-cO8*-ShWZ-}X51a<9=lB-q;w2}eQLwPU}JJ<EDWX$
zVmyYyl$1$NU@!?{?vLMKu;F7EEC>sO6^Rd*JKFvR2D?qDoQH+MJ_oi6R8WW<!(i07
zj3+SI6Ix>_TAC9WjDq}E80-qJXgUu_`#TH<{R<2h`6~>TcMO9CM;WjvS6%r5gR#?v
z>XVC}z+lG272jd7R@iI9-@stk{|1Ap{(!;iIG3?7nC~$RR{K{N?Bbtcux1>iDFo=|
zz&9AI3=wh+gI&hLV6pQsWeqG0)~Ngk3|9RE1~dHw25Xx81qL%^{SyqvY<moYJqmW6
z`vHS>{Q-kX(5cpx$$f{xi2k32!D?bj8iq+)C`k*38|Spys;n6&thpxOOvG16_pDjA
zFbY^9EL@pw%bHyN3hOkC^rL>yGLUhu9O?&W+8pNIvStNrb7A3;IThwZDAAS@*8z}@
z1I`A@Wle@NgOr&d^K|QZY=zd0(}A?iFe;-{G#o%Oe;hW-3a&yJjh!{C+!Y#<1tvcj
z?Hd)gb{GxG6&61v!_7E~CTGT3D>?!kYQG#v;3?L10Krx^z5OYgqr+_KP#m^tYZlrH
zHZ358D3`HpgzW&!am~~2%~N(%ur0&sh^|ms163u#bPG8wyGZ60Yu0rj{ncD18yD92
zIOZ=fwlCJKv~Wl#C0n}-l)QrF(KhzI*$iP|(F*c}5w`VVa_%QAn{lx19LQ@I8lnnL
zzj?X~E?j;<ihd|HI}Qifh0zX9@y3RQ14cut%;tw7MQ2k5#u079SgWjA+UJ>;oLNe&
z8E?9<D7mmE&yy9xnX2HdE%S5)tz@3Alr09#ArNle3i@~Y<YZU)33B<r7;v=gFv*K@
zwF9X^Ipj)k^6EI~1dL`lo@yP)c$iJjVNK=_11rsw9dW>!t$-9t7>E&uRLX$43PS;c
zfe+{CmPJK4;Se)Xtnx;Eh^8=vi@MA+`2(pr5=4!1*!<?nX3_M@F05QekdhqMSp?NA
zlxEh7@#+;;XKTtr07ZKaOD>ptSf5Eehx`yA@dZK)5RoL9CsV>OS^=q<ffUJbu3d~s
zhc)|T4o`|TcpJ`?Y|TjQ%93u#tYpiQjG?c8#zy*{<IA>8<umF1Cy)*deex)O^*mh(
zklcM+=G`{uU<LPx0bBJv6JUhQKS%V70dqT$^2|1uiy=`o3_Obv4d13?hJhylbi3A!
z5Ez&lL+=M9rF>6Tf)RWLVE8i6BybykM6eB~f<rcpxXK}X);Z)-aEj}r6cO)vT;Qka
zFaq4$WXW(gL+mUM80}{u_3cE4r7gNJBdUcQu4OnC8bQl3PqqtVssXb}!AY!uTKr=a
z&OizXT=WhUEDi%Nz?mUA<RE3{Ehtfym3B3Tv~W(~q8MR+Hen%}BH4(m9Z8@Bl>LmP
zEkskk0?_Uz>Q#z?<Fknlt)TWWLS_i*1ROLAB}|<ovqN$nV6@;cFbKoQfgx4GkctD@
zAQ)0-3_TV-ViW-fh#Q@up_|Pn<iM^76g3ZEKm)MP&<z_v4iU!wBe0QC##vGD7UFaV
zT!$0J(e;c%*Om1spqe~;-o%ZDZW^d00i&TAqu83GThB4gq1L#1iZ!=F+h3ej2}r@`
zMzg&`hDM9JU`(+Ytuz>(6iW+{AY{%VbOw?_tm)w}R*)O-b1@<%YEmU@)(H%$RSu*m
z$4Ww+rX8be1S2A+W;AetrcxU(LZ}OsbR5NKBCJ%ltr*b=0@|E2zOF_i`fNJ1R|`aF
z3Y8$tIph<uT!lI0Rv0!bm{yT7mH!x<#eMCR_vZ&jNta=)g+Nuqd7Y6lu&|rlk*Hnd
zd$KtR8ga}O%PXvCgoKy~YZa8HFo%dV&XIkBjT24<!eQIWCen2wZiW%Qq^1>zaa~tt
zj(Em)qz0y&K$Dt11K)HbK9pe46QO-aE4(Ku_$86r=8BoSJ8Ko3<k5tsJyPQ12Re=%
zA}J(oKbk%&$5OAFCCwembB0Es#>KN*oNAtlYt*zT$FvmteIjVZF%(X;T<tmJg=o^$
zZ1Q!4rAv;4zcpjO62vY?GzI3IGsd_q;rOPS&>l%OFvo=BNi4d3x*A5*>&94Ub>}^V
zd>di?#oD{UQzHQiHZ!tt3^;q~gOPWotr48fc^-yu#I%59n1GpX&uf@^QeTwxkEyaf
zL#1@Xlq+_Wei^7$kSN$O>51LkeAVP(AIPe#kwgLZM9R#}@arj_4kPy&nCI!Fa_$^m
z%4M4dQda@=y~T+@a7gn=kbxJCL{9J*Fa;Vw=M1Nev|^3Nh7A+0LLh}RT;mJE^$mjd
zxMUU2FlH?H1?k*zCM@)VpU8Vn%V(V8aH^XIOiJSCS1=T`Ko+<$1Y*tdV4H3NPE|if
z&le|0un^f+OI1Nn?}7oFc(QPeu_a^U6BYF?98NUFDN0W*j@9Tf6o=L<`o_XkCJ-f<
zZN&u<>8U$$v9waw;gcBM0V|~<1XXhmQGgpX1WeX6$%d}64j*CL*`Z5C==slc-v~In
z4J7rWru6}nMq$FOX>GVixxUP6OqToKsiTUarmM=P`T~iyUSRT}p+4fNW(_h<*v`=z
zsv(-lHj>^}-pdIfI7NfbR{R2EZ8v6m6mMbaE}8<rcvgzc{LcMJXO;*kp=br2V+B!i
zyk9kt%??PKxI@<t54|%LYIB8!dQUF_qTFJwv;xd|fl;;@fu*=+M|u)-Bt`5Saw%CS
zz3_rYjSCjdxt?)j{ZI?_&mreZzNi<UXY-Uw<SyNsm-`}I|2l*sD#ziy6gWPGGnR%n
zHo<a4g6_2O>1|{o97wCMPuFS`&;6W`e?Pt`JFQEK$Z!lB=cw)AOm=q@&r~MTBq$q5
zpPs~AZ~@X58v4GOie`hbyqGsK-M?|sINA3O<)@E@uNV;nN<l|yR>aQJoI4juwh&ZL
zr0ndU(eI=<Y9ByeQB!O}gmFi7lRk<$8d6okXs|WF+ceZ1FBqNSWv0qZpCpaPJ=7#d
zDxXcTwdZiXvZCRHlN`9S=wG60M$)QHabkT7X=~XpfHL?zlaw{_?T=hXyAM2{VgsSD
z3Vo8qdj>@ag*cFQO#gP>K3RkWAs0CR;}lKKnTjs4`l1~5JSK|57fDGCbw#u`(wMUI
zmDM5%49oQbDQQJ-(DVni=0!P0&pn<z6IBs2V2X0DykAdH3X`+XVRe0`&LYjBO+`_A
z{)r8k&g=Gd0$AisJm!uu)7^2)o>9(-RDz&d7Apxt$h_oHWHw>Mc_u5MT8^RkdoLH4
z93n5PXrsfx&!R*Db7Wgq?l*ASR^Yrj7-b^mQ>Fp1P-QKGD=Z5Qa@;%Q7Yzj5uk?hz
z<o9ocR=Ke-!_K<ovRc7(I$*4WwSp4&>4dz+-%!#KQ{~;KA@8CIA{p&F{etbWT;Ex7
z>6v|jw}xybjB);OO`9vMv<VD&U=6rLp{46-BkO3*dZ8Hxt<O^}DY29}hn&pj+<Xu|
zmjLEP46;Xxr&nD3e3Jf_wHn>$s}C4V6I{8W8Jxl|*>z_4!*kjE8b|1`Fc_%N+nadH
zm}hlcpD^*7v;2fN%l;1KxUczCXvS3J%v21^b1VvWl$7y2ZRU9v%XFUkbWz51@yv7?
z%Zs>SmZ!eZr!z0UU|!U*ylnG*+0yi~PX6Ug&Wi#0nIZF;nHjcp48v^G%nO#;w@tG>
zUtUgrd9j`G@^!{+&&;dO=C9so%ur;`fitl^6t6~_=J3DHQ(3%ZpPi?%m|^gn!?jqD
zXkOrEU7%^6AD>}anqg38oqd<Fa5i({oWkO1zgazn*VbPb<^2|!GG7nKzo65@^JoSi
zB0(M&cy?$uM&RmMC7Q#W)f6<_X!dFbj3q*W><~#5p}=CCv+DhI#nWOnoOLxuVJ$9m
z#g}!prg^oAb@hJc8gh0m$722A>^hS5O_$$lAM3`Er^VX5#YVN?W<&GlS-{)0uWLw!
z^&-~Q;;-xP6;?m`tqja=zERlR%X~xE^6tpuEw29x!K=3vif^bCccT4vFbeBuEb$KK
z-*UFB_B8LbD7^JlU`a>5CGua<JlfK;+-A#qzh<!qJlYdudv}Iy@7&P_oNZgZWmi7y
zgRKACK>xk7*?XRBt5@0H#T@OsS*)D30v#x^L|K8Jz9Jm6rh4lC`3#%|?GI{HVmUw@
zUY}>^X8YWPILw;=jA8p+o%OjX>#&3EFd9KV1|x7q69N|EWCYZRuNbI5vVt3~Q#0n|
zZN{mX4>1$xFK%5_4#pv3R9%hDQ3;cFrC&pB%^h_HlhG(AqGEH;y3^A*q_2&H^~MU4
z#EXaTENZczGFMB#5XU|cr4qP~_pltL=gyhIi0mDmA57LPY8CjTGufYtUy-@7pJ?1u
zDP40-;$S>Xr@%J)rSbGc$ylhd+XZ}S_AM@VB(CL*u~%ow_3$Rtn}ko#OWJ+M?r4^f
zyUh27Qw&kUTC;u&gE_uvj{XUQ9ZJ}_{{{vtzSMH>Ck*B%vpTobm!=r=0|vV_`@Cdp
z_sxqxV6d`5udQPk48$5{6+kR><dx|IP$0Apia~PWkk}`yWPrtnIa<ZKQ`iG+I`-f&
zlG|1&a|&tks+=I9W<ncx98nFMXvx_yn|m^wt3%ErUkPnJI0{G9DNd0}W>7MXj?9O`
z7`r&)G{Ry#J^0juG-Aze?&s3o*dn}^eC3|zwG``v?yIQ|jOw{U>;1~F(=^J3+pNxt
zinNKv5Mq=m(5O6)P*!D06}Dvr&nXw3ulBm++*TT>oOQsn4icTihvcWE8|RLlFx-ob
zVkN5`kd)=&E)wZ}f^|}DD@=RplR>kLl&7;1j*sg%WtdW{z7n&C-`<4<5#lh+n_8{s
z!vZKR<l1m(!{iuv5{3Xr>^QXjHv@PQPg$)86ZTpazl}4d=~X6QmOF(5F%PriYp@7v
zxKjOAm#MgM7pL!5O9ul6uMCGm#~B0SUoCDSey@JYPQVKZJCo*xX(j6O(@qx+69%5n
z*7oRLDu;PodYRiEOrq1xaTj^xL9drXd)~TE&j5DZ{$1rJENvY?xh}Acl3o+i*-aH=
zjk-Omb$Vde@dk(4?XkT$DUyiwWR<}14vYSQd};R9fQKIxs2<bV=Wi4CL|iGk7q^_~
z`+?p08WE}R@>V#k>v{j3y<r=p*KYlx<bv+=BCIpF7a~p%O2ur-k>6Pg(fewi)+x{4
zT9B2}<}{ffHr%yh8hwPl$ax#u`8I*m=s7_b<$b@q8Ox}8O>(hhD$Y~fpZXtn%a9O%
z3bL?*wMHbeQ9u`>PY?OLA52)$VHele@ZB?o#rV2&Trs=M$enK0UXx*IUh?RSBM(Zt
zy{#{LnmOQuGNXAh#WW<7F0GB<)Z0b5vKQ-wEkrw<U9B|Ps>K9R30Q;VyEAd$=QXZq
zItNgfWZN?u$b&hq1rm8@6BImaer?<4&?}-oiLz;3OfQ$>6(1x{3nV<P&*8*YGVht0
zLqM|b94cp<F2*B{E8l&ESydnx+%*Dc;@b|aU(F)aMaOb#jmS9nT2hpSbqFj+*qowo
zrHmm|JH_P^VVi$+S<+&gSns||^ia-hQWasBRBxQx<wjNdcVVjFMop8@-Vo757nIU5
z3?`5dqrk#osckU`<9v2Dq8?RI(fGs?4i0Yn9vz4HSpS##?9q#w@GGOSW_Q)vgn*1(
zwKn%koC^4#wN)_qfMcwfTcz~Zg7=+!ROb7bh1}~nEedy%>>-7xRq*-^C4-dLrh>rn
z5Bs+&=FIB^mPO&u`maCgNq(x+c^&6NuXBW3diDG%!J%-i;W1u~R9<z_r?F9&aKM_1
z4lA;YDY|5%Vrn0PisZ)Y^yv4*G8gFsWO6!((6v;V`<J<6L0YPT4wN}K=U3$;SI>bP
z<I<VmqSTMhzE=VF@1%R`baIkDB7FjX4=*rU(de=^OnkI^R&aby+lKFPN<FIZiQFk&
zBeQ`Fob5tx`~fiz_Te1H?IM}`lzQQOBYBS#3$*a_1e6w|VjSFyOVcx1G_^);Nw>|#
z2-p3u0Y!|-=ZmeW-$->km>gw~Gdo=6r=KC7e7Ju7v3m!*1^1)L!>#H_5Bx>W-7OQa
z-Fvv*Id#hyGA3wI$<m;L*Va@G7XT6;Dm+y=$!dwGhd*r5Fya;4hbNPUM?lN>;G}l8
zaijqu=c`K!VjRyhUV2veK)IT1=!P}_3%5;L@h1GCTW*eK@_-SQFVZ)izi3@LlKNQH
zd!E~EU+l<yp0Ns?`}VPC#+jz1Op{t}K?2)McQ%S@@vy}XyE{YP<_9R#jIbN0bzWVX
z_!M%znX%-Sw~fQ>Vc{9E-RgI~p~8XJI?p%bZI<~0NnZiWCR-Mx?E|<?UT$n9H5Kh`
zcq)=!DXha42i<%}Oa91mGy6PVnZ^xktZx-w=q1a4bK6YYr=6aJUQWV8<X$w&W_L&G
zvZUX3VAnQ7$F*b``R47IF7OhAV^NRV*VFOvgy-+{_c0g9Dw0|Rgh>rQ^;9JWs}6`n
za>`y8rG6xOZ-A6hytq!<2^5{CO?n;NT_@{Ki^(8MUy(1C>ha^M)GIFTl75yl?0@rC
zHg<QZ9WmW~7&dE@|KiXl@FsPC`es$~wEn7Qs6^&Ge{t+s4(YHHe9V(`PgO6&0bG(g
zuI*m^u)-+i!cgi2s#@Y~QG(<7_tQ-tW5WSOHd@BAUQ=~~du0VwP8TVds*`v;F4Fkc
zS-E}cLcOdiY9ZTXJom2dnZgwV37)IV$q;e#+N*T~f+KPU*Jn=IdFFBZ-n_%!VEw_b
z2K+u_^Yw7UtFJ=24rOODXtXaiwt+r1?!Vm(P)}4QOuE-<I^c}Ut%8?DR@0?;FWW_1
zE{c0bS*G6E={1^2+=6+(CDh6_@w(S*^Zri_+I~BU+@Z^Yp3-0!A-C17m&>npLtGnT
z?<vU19!X2=6%8RDyDgE<tf1uYjwanpFHHE{#q>_9yM^52Lu~T8HQtr0iGj%%rEEaD
z+zsG?=Jcwvrnfig@??evZ+G<jzA+A!o!%StXpWJqAsByCe?#tC&1d;{4ir8!-Wgqv
z{3}}z&mHEo(|_o9%sgY`FIP==S5_k?O!?_<qh2KAfvsdoWTB$`D*n0j@ucRxtV!qw
zcf0F!%jJyqu+z_ZZ1?LI#rK>}HEl*Fznirbx|~haj1p<tU)8ph%(&I08A?xodUqZr
z&~oN^S<KRtn{00P<(s`LPWx>py*m7Ow&lb4JKGO!#uQ0B>K{G}lbDly-JWYvJZw7h
z-M#L=kaXn#=&64a9pkei1PLM2c#-!zRoL4?0s;+h%I=$s!pI#@QxTI}*q(ujE+pg=
za-ztr7=$>a3t&YdJ<kV#xm||45F+$}<X%1^?g2DjhG*=2rE3GQJwozR7YWsF?_3X5
zq7RaP?Iz3<sLkUmZWp9S82lXu)6mxH4!TJ1p=%dx{sRUBg#??~g|K%00fSYU9>ZW6
zKVdLbC<jfb+iEDxB-Hx^1`ECr?E5J+e99bYcLIYEhHEAxA~eF&JHz6zFc>O4&CV?B
zLU`7cK~i^ko<>B$YFH*=#6x=BT)T+U)uV{A+7J{fqEbq|gb)jZMb_B`J<*74N<RA(
z6^Y@AYSZv&T#f9iRY7Y+^>s%L*x7Z4MU6<odsm~z?V=~W)Q5SZUv$fjg+;$2yw{J4
zeyMRUVljF??A{t-<l=>UZ&BhasC(NyF{$16Htk~Yabw=2Vm@nx?Rmu<)$;Fm$KYzl
z-dv3VgvUNT6^q{!;*F)k=0Ki7L=-9b)`=%nn6oN96iAPb-IWR_;*DSC!C`wCei1vm
z-x<$y352D>geldIsjzYawICu<X#iJvIDvG$d>uQ<!vyQFc)p%^QKAGZjs(D5+*wr|
z-joFRewf@^f{{JD648ANsiQ=G2DO`3i6U!>gG#C|ViWc5+z;WoZyf%B&?x@u^RSB-
z6Hl+*7h{N9gc92HJh;XXZ~ri<?#g{n>EN4n_szo-#jsSEk}7>{yx3aOm*gbxwdAX#
zNs&as2qLx1L`i{biRd{}&4<bHb)nbylXL1=<JMA?G*Z-UQ`GOMYOckrqwnL*B^Epk
z&E`$5wr9=fO=I**RZC2@2nUM(pu#dz(mXWMo<2-(L8f)t`!!rtZIVug>I21i6BPB+
zZP(IoB&YYSWz>(PztHp^)>Iv>O9cRMyoDcB#%3(o$42jGY}-TU*D^EJGZ(Eg)i@HM
z&<DI&Dr`7&kKrhCi#H4ZfOVHQ`=)2s{zcW#(&SJq6{a5tOwGPBl>v&#DMe<}th=dP
z#NPbPg~}v7;040?au?^aUu5U1s^%~s1k<JFh(s_lt>;3{B!;IXYul$trN)P>Wvh?n
zN;m`y^W~kDVHD@fe-{#ui_SmC2as{dIM@4~3gZB%QK0iR*Mn6Z^3O)(U*;>^SuL<+
z%(Ip$v}e3`)uE6+qR@f3XrjCDhFSJ4#v;%9C^xO5ZTljx^`d%Ik@tFr??F-UK?ITy
z)vJjL=|$y-p~B75BBxOaso^oi4|8}QCO&#tq>-Jp{_s)U!!*7}fp!nG9wp_-JbD-r
zTHtW>$S(ZRBjVzh&mWd*70W+)P!Ul)*!`$_I-xAJxMjMavbQ*Ey%_CKVpLn)mKxh}
z7b_h_wmvF}?JXJ9D&0vc899h~W>)%wICMCo)caBCOTNeMo~5tW@6F3RUR!s4?eO?@
z*yDBLvUi=2-}XkoV=Viq<@jE!Y}Bso(|Vb0VcF-1s4oX)_}U?}eC48A<)FUujIeT|
zw476u<y0?%%?T=!dPP(;Dwz2FP4RW<_)*M@KFr!rmWwXG#D5Z?W!7NwM3CPfv`5U#
zk7Ad^6>_ZHpeq+Gj$m$ka^_9t&7#Y*g_V{EDq_L`ijh?%6IWFlin1pvHA$+U724~_
zRu0e|RhzzW&aTihZYVli9C(4`srBvir((}v=10+U;IK12b&OOWr>VS_hO&F%=A>OS
zjL&$Bq$Zrv(5a}xovE5u<LR9@4>u7{8LRM<uxe~^ZDe0<^qblklDatlx&-aI`;K)<
zk##A>b!mNd8E@*cNa}O=>+`hh3qIG47ZL<<RRyG>Hito%6XCys!QM2qkThcW8{4!S
zI~*IkA{%?W8^nh}m-_0f*2&AZ>UETw#!q0d=a-r;EK|<BX_`&bn&xj_)NX#>*Yql~
znH-FT!J6MX9@}7R*!*6*Wr3t+JF@xxrIydyO&=p$=F*O&5Bbp(FBBWzx6C?n(1@aO
zE~Ay5(KBgi0sWR6!=PyWr$dpLB5PygU6jq38pRtX)(z&ne68%Ht#uWc@e0??`TEss
zE)UyT1xs!z6SOfnwbhHri!rnCf2??G(AtkgDK;{5yyW2PFO+6><}+=33v1K7%q-X6
znqAn|59~PO)KP;a!P2F1aTvY0S(<KV-?e4A8_}-ww0$+ML)NELN1#LZa)-f2>+PqV
zraD~}ah;BmT^nFSi$mt7+n6f^GULEbk(ZrjFWc5!x?CGO@Z!4-le*rFba!ocy6g0K
zT<(tW>3&zyH8S6|RncSFSQW(F<<;2jB-h&~(t`^*>S>SbeOJ+YYp46ZK;NV7-V)}%
zx7$4fBR#nBeS;N!&T<{Ho_#9@edU*XL6DwOQnnts{>qL1g6-bk{yy`Pz8tv$<VN2F
zX+MyAAl9eno=-nPeD};o?<=SNl*9hDD8_!~L4wh~uI)bjoxyJKP@mIaCwy?$r}yd0
z!3Ce5{mX+cq{Hhv!;3HbGj#@bO9pn*hkFc$9{CKdq(eb7LxiL4xGckW0!Hvk2kje2
zQeO_YZx4e+hbDKsx}65uqPvfLhNDOwr~?M6zKjYEjNs37@{x^BIgLu}46>U;S<gMo
zEg6B6ji|B=)0jWgJjW<V`b_pok3uxGj&xkn_vo2g>Cm|*_Q!ABrE<r$-i}utj*1LC
z8+RKO-x(t*h3ecG&y5<BSZI{lnXnX`)SdxddOJpKIAL>6{!SBAM{vU4e9}#D3Q9XE
zx1-`yI*BBiL}rW!zMUHKp0YBWiuqp{?0;df|CeDf+C3w^z4N#BOk?&gmhD{{+B1K*
z_vL@7u($qV&k*X-NH606iD!X2ra@8(!9JV83T7d4&LO49keIO$gPUR17U4>+;ZJUd
zmwltcuuj;!NOi0eHW_{Ce*_7;n|Y-)GvQ^X+gz4gN_O#VwufKN^@^MaJ9#$(^KT^P
zH;?59zRLH;I$^JV>x4b}A92Fc%Nj;MG$iCVCJZ%I{9ks$wkO&)CVQ|{7}g2feBSrJ
zRM<>|*ZcLEzM8UEEeKo^R-M}N`L-}BevAIvip8#2cI`}^x+kyulEoZn`|B!KhO$*6
zS<lsDZ`z}biY*4}tKUqP+w^6gYk2zhMXlSL*@1?dcdyWaBy75kwcCr`3H+9Wjdkx=
zhV!(ubern;-b__Gz8Y+5`1o$FE%Jy>ueovm{pzz~%c16`&mS8m_kX3rIQ~Y3-T1#p
zg^m233XA)<RM_+h6~+;brNY>csWA3qDr}MDPgK}^q|()V;onhV`cWE{$5fcd2^Hph
zLWS9MasNVv9sGp~TOvW&PW`09ZvH}rQSx~}kEyVi$5fbBf~H6`^vNK9O8fh8mNflG
zdRQtfDncr5>VyjO(H2QLrozgM4|}mx*ykQB6-K4W<hOA`g*mBnVW}`mEETqRLWSvZ
zq3i-RpyNNOuyNaORM@a6|C!M>(Qj0k?Fki@(8FIjbwY*J^zgqG-qqw7{!WEKkEt*y
z!&lXRPlY}GEft1$s_$1SY);^-?Fkj;`-2L@`$>hJ`V$qFa!iHQ0P2saFr%MTShD7?
zRM^xvDy&WP8x^Mb3l;YA4=PLmR|&=QCo1g0FI1TR->9&7EERVBS1L@@_TN%r*ZwsX
zMgrE3|2q{X@{<bFVE-!>#&}GH3H>K3%nnP1!T&~u%`yCj3XA=P3Y(+-7gSi<F%_15
z=?4|IAN3EZu(Ur>VK;MP)cz?ImV~9koPJA%9ek(4Qvau@FqOYkVJd&4!nTS3DHV44
z8x?l*8x=PES1K&U?mHD`L*?;zD(ur=s4%)?DopZUQ(<P`sjx+wzffTcSSl>`I~Dfe
zcT^b8H!95SgbIr}ho!=9{6U4~+x?eRnAmqJth=4M``=MvSv-NX-LW9c5}R*S*iQIw
zsIci{Dr}y1{5MqC9PLjktl$qS4EP_YFzRC}%<~^mVbkBKux{r6K!v^KHY|#}^a~Z%
z_zM+A{cowT1rph+V=Am$^q2~RVyUpyvm!n^5q?v@P+@swH_+-LH%D&$pu+V3OojPi
zsjyG&f1|>dXe6fExlX7s0Z9H<HcR0gmI~`7Kc>Qb;NPgQWGoe?^am9-N8+3PoeB#%
zp~A*B{s|S9`e!N(@h2**^6ykw0+tH1!^Kizo`0jlY)+`K;9sb)XMd%_!hT1Eh0Woh
zzENS$->I;ae?f(%{iMQ%{|~9KtZdt~Z&cVe=}#(b=r>fDFp1j_D$MpDP+@UcDva(A
zDy&BMPgGdh4=OC{8x{8C_f**EPb#eHgbLdt8u}+x*cK_43d{PpRG97GsW7o)DlBde
zKKd&amhh7b6Z?e<L;Q&f%l{h{HhMyZHUFT(vi=zr*8D3KHg`gWje`1qQegrAmI_<=
z4HZ`N7b-09KT~0&|1}i``!A@l(SJgP;gaDPo={;p$5fdA4=OC}2Nj0;l?vM?{Vf%i
z_TN%r!^c!uiW108m_Hgzg+a-tw}_hmLWQOMq{5Pj{!WF(0gkD#=3l5V|6i!EFz4@7
zSn~-L7MCs2Jp7;%ONGt-pu*~psj!A0R9M_F-gx<Ms4&}KsIU|)6$T*PCH_H$5&xA6
z%l}D*VSn#C^uPY3!Y&<CVYWZ1u;mjfjP5^CVOLM6uq>+rk8f1i0l^<s80<S0R#xtT
z5*7(V$f6zeKN#M@si+9;D4BUuq2O_WnTbxbn9Nej&BCn;x8nbV3TysGg(3bO71sRU
zP+<jFDl8U+27s;tlx~zaddxNIO%rDglcBeC(E4O6!^Bqs_#Tu6VMnqB(he7ra^iRr
zDsX{5mjm5=2x7N7#Nb<`pOm<)OyzU?sx2idg!H98X@e>$OS>R<-L0EtU&rCW8VI*T
zRe5ZUcx;I;=NnP++<eYgyGPXWLJfPmk0iNhFirg6WB$0X{Bs8afnMBbtJYyC?$I=;
zY|c+JHdK(3sIojypRw79Pu}K$&cZAO57}IEM|nZmo_zi)kP&=2nBoiC#;l@kPm(hD
zPBL#BpOY-5ac+sB$5p(zHii-=F&}bf<^ofKRzi33Xnl}?49SX;4R0fs^s3dXKh;Ij
z9L`jb*iE<Z(S--UIy{z6GJ;bxN&#ubJ<um*e*u9LgXEmE&K@DVa53F%OQlTU3<=>3
zdP#gCN<us>%H}!cbG04MxAQGY3#@&}VTbuw8#{R&I)%3KttLCCNm~8qIA`?R+<eF@
zx5(cN_jtg_bL#4%V?m~z<Soqoae#iIEwT=s)6KUjV?1PEWs?O565kLeI9P*xDK}Ne
z^kL-so1OZpZTh=O`vFh-nXI!Q1{BuoJ)<IxR)<ab%(b>ooqRqdqWZ)$`lkz=W%bN(
z?JkpzT9wT}aZ8o@45s;Ka_Itfz?D{L@;D-&4LTxuFv%A!7K8Tn%d8s$y;aoYOS}1T
zR-K4kEj<}y`(cnCBjKIBM*RTXbI>k*GnslHx=-a1<VPY8DXd34M4nMwKckE0LVV^K
zMHlkQ^%*dZ8BUX_`I1j7jeQj$JEv47JVW<(%cW3cTt34@*NjYefkU~pH7G6jlKk*W
zth|Wt__YCMqv6qm)G^C1qctDt-mB1@TBkH)rgAZ-c`H46os7Aa3R;QI&21y+OT`hL
z&fUn)*@(>pJR#bELgmopzUMgjU|x59slhW~4H@v28Zf**<euipRoi@Nm*)a;&tY%`
z{s^C-@I~(dre<6y)pQ=15#|Ge7U$-;@j|N>r|`ydKn9YhauV=FoON=Zu^1FmZAY`f
z>Ona#FA7k14nVqnrv*(ZMV?O+Jt1$ZCv}%^Cpc24ynln*WB`0$<~D@^MI|NPn^@<s
zl&COal+Sw6CkIrRj07>ETQ1Y}o#@&14Ce?3f~OZqZIwU`qo_T3s>LSAYk9E8b&oPD
zX<Y*M59T&o_#gsa%E{=NFBo;(IfC(YN*hxTCyoKQ$vnK%)RNA_B-C9Nf6j_PGT-5m
zrAsMfo9Jx0w~?@U>m!M%wPN&i$<W>NC@7haQ?dNl;u@<(sjp-`^(8nW6hhga?l?>I
z;<VzdVAxBj1Q&UN>79rjuQ+wNLf1Kl$Mc`zy3+lRAD$r?>=pH`EHRh9TTmpI{t;DZ
zbT=yTac^(Cl*=TuNICWVOB^sBS>#h<ZxY!fb{OQ6nxO1zyDLfP*9*}-2FxFc-dvdv
zXRV<40`Y5xusZr1d?2#V#!nj*XI*j+bU<8IQNUTHz)QxnLVHLWEng#N%Nlmwukk02
zBNFY4t{&w{f!>hV((*ZrT$2bj6h}7N5L5&Z3csPsF9mBln&@a#W+5yG<k!sj6D~xq
z=JTJG{giZ1h|-jw@*@ALrS|69RRZL2OUVn!NG9ZZ+EZLG(ZR4TfdN^tih^1BC5R!v
zj|6|8^L-Ef>PsqbsyA6}=d`bAgb=u31ocTbBktX3_m{a7x^#2pd05RPD_j9Q!#H0b
z7b%4|0<yB2#j79}MaR7$H^_?A-&CN;I2xsBQ`n4&qR37Y<!>=s`+7m1N_KQ^Qw+Gn
zJ70f@)3EorTc`4!pfTCtlnp^{RR1d6YK3AlYQ7|6>+J}hZ8>=_ZhUJPC8Z_57*CQ_
zHa;XEx-n3;+i&|p8*bAZDxzjE-b*#&k3>9rlvdD0jKk^o-m+Q~EtOkjdalE}!9xC)
zEjSe)MWMFm%3E+opn?F+fS5Vs3<%!KxNKh%v*FAG3xpsCuh2!@*noJ^@<79OR|$ly
z$1u)H(cZ!QnI58ebOI&aWfL+(Jl6*okVd#3&f6gp3AtB8i<L1_v3sU2w-n?ky;>;M
zmy-vxdKxZK4*64#XVC`PCx>Zj8XXN&;O$cy<0MOwecpiIis(s(Si60Kejy#15gb{A
z&Ucv%!3Kutwq8Nvb$SdSoJ;Qn#)&9BJoecy4F5`nk?he#UZ|L>m*$=Jc~;oL_6Q1>
zyvT8J6ibB>aTnS?)KATLAaeEhRM;s6O9in3(P?pPf=0M~w!rL9R2cCK<hHcL#`B8n
z<B$Ip6?Sg&98tQbvvqs;cPcEL8rEPg{e0&e6~;{EaJ?)G9>ayD!q#eey*@=Iwz@}L
zd~Z<%J#xDKLC(I?S~unGEfeB8`x>01FEa6ptYxM(ek|S|Z(r1zchNk)|7l~f$NY5G
z+e3-n$y&=iF3Z`&{j$eHUs9TgrZ>1&diz66Ub?5aox7Hmc8@jp&ADrz7n$E0Un*<*
zXc2j<d2*d;NHG*Z9jo-3+-E@k(^B4$0-@|KmI}LS_>LK(Eq+XeiB~Ark~0b6)7T`6
zoTZ&{9g(5GK4#F#sIt4Q4)tetQ9oshC-k`2S-`ai;%&>{QxakuufZKywWB4Vxrhwq
zjVy5$9Lepk=woS-<JT$4=Sb*cue>eBCmVm)O*e1iWd%_yirul8ccIcvO>S@L(U2l=
zAVK#?6{*aLFKnT?JCZ5NP(DomD*v|HnbY^dhPs{+*Q<3^sx{A@d!458n5i-qx5ZFT
zU~!C=;{5$_6K$XK#+R?w7mx)+^r-6kH}}|PT#ob&Gd?#UN75_aRdT;Yk~cx8=enlx
z#04ihW!nqB3h>9-yj%9CF1b=De;9SdD8GN?HWK}`)V<UpY4moVAl-e&>D8{RBtnN!
zQvZnZ$=N$cC6mSL?Ijb_p3k*vp9kl#crAo9+pDkz9Kam)BBC=25-(nRD1i|e4_v+&
zUnb7*I#9M#l2ABcIMh^C65jFJDS>~{R;zCg&SswvKW|cUEl!P%)uWl3F$+m6WAZpk
z&CLEtE9I-SU3#UYM%H3gr$?sF)3n<I0Q0m^p=*`#LTk#;#k?O^RhXqsNX+QYJC(hk
zcyZcZbpD1U8kg>b3X^j_^vZm)(Z=NYg9@``YS8ZFpY(CVQei&IPZa6CII}J%FRnGs
zchYk<8Wr(xjM$vHtoSHgATP1y>ZGsdEc>lf30$f|t`9^-d2>CN5=>{SUj<smdo3m<
zWrXTnjv=|fR0R(Yy+qu4-AwUO%~yW=uU}O@g%t~?h4$G9ycpVDO!D`;bUyEr8fd=A
z-~X#bM$B85*Jb|NFM?ip4cBj1a1u_-65$lUgad+3BQ55m--A%RcB=%Eh%1>#3qr}w
z*z{O;SU8)&{x%!9^K=mJ285`_Mwz;4*-yYJ$4^ND^B56L>Si^E(^M1AV$#Oe0mWtD
zct&^ws!THaDTHMMN**v~LkqvqC37$zs^Nn}I`h8m@gpGU%KR{o^&*6f_dMDSFV}-}
zI>^Thp&+JE%v2h-m?#>Sbq*b;T1l_ZkP2v%F?6_xygbS>6sJzTZJ^-K!I2`GjI$js
z!t>56Od$dQvZT)O{<@W;cz`T27oVqj?~LJAm=CDLhlAphTlv@LBcTF;&@7$+l0xC&
zTc0rawigl=46}m;&&^+pXO3`^oa&a~4D)p|CKCsQ_bb}xQ4b3k2B3~QtF9SV8jp@G
z-z(`6bK03pnMoYE<%N*Bva`f&;?*tapcKpN^dzCf8PnXoMJx!xBb_By-t)nrxw_+_
z6aryvJ7WP}$76t@XSq(L3}ywD`Y!Djf&#CPxENN&8V%b;WmhyS3g66Sxe5`N(lVs>
zHFi36_TgJ7kwIo-8?l~Ls0t;f7}1k}Oxp@mR1GIg{?tZ}oa4YHfeZ&wiU%wtz-7(m
zD1_~7s3?MY^+ZQIA8guD-69=ksyrAsw05Hfj<Q`CSnuAClEA+z|0Wy<ulUidDqA)p
zkS1h4_7WbDEet^hmsulWoy(Ibi&eAQb{WiN#e0Z%F_iQ}0mTu~LEb~X=yl`8^@Jtc
z-4eMrhf5?qCgsF>m6`G*#Pa-RqmNeQ&oq{tYj?iaAc@D;<*35cPKQT_he<d9woxaK
zhEP{Q$^0bv;Hh%~naVT-qP1tC$&3_qO6MQ3+rQN%eqgo%v5$TJ`tiM|FU+^JO6n!<
zgwpd}c@Wgz#`bBIfC4XqVpkcjdGSWCdz<$wH)pDr&*Sg>Dqe^lD7VvQhY@{1qXV-+
z$$}sDZmBy0gDh6N^Ent*g7pk?EsVWLCwR_tCk}J!7}rvm%XEa*kq~JpsSsq?IXeJL
z=0aBI8AaDZB^O8*D}`%2rj0xC0RSW+9WO2&Apop37EYpb1OQY+pE2n;<+9)@F&Uj|
z#ixZLg@7=eAsn0p_oXEV7c0D#DIkDWID{o@uS3d&NcQ;#Jxftt+(J1T_rhfZDtUA_
zmrO@|563d~Ih%8`=$*u>%f+_<b3LLsyOr(fnCpoQ5ZABksjr+UuTd_HMu&?PyrB;S
zmgAhw_|ysw@FCYpOuffB`ab+%<26LSt;eWyi)j{3>=KI_;V=Yo34@7AU!_bYL*t~N
zA|P|6y5W^o_s5~7xhj(jWK{}X;s?SYgCq?)J5->kPGZ>U#`#tbt=(LksyA+gHZNDK
z&IaklIq5XQhdUHJp6tIQAda$XfC-}?%9k2w-<oDSiVrJAQ$1VruM{59m5P&;0w9R6
z!`5F>cC|540?6b7$GwF{iq9Dnh#e)jt%TtK7y&>)qctVF5*kNM7zdh;OGZeKz|l%1
z1Q5#N(Mb`A&<X?a@T^8TPTdZ700P7l?C@w29(dSc`2c1_Pss(PZcn9LK2=`;K7Bm_
zKnY2pbI7bj2m}ah?Z8oXuLb?@^dkXC$VDh<r5sHx06+j$t$Gy*>W4MQ!f{EnfdE3J
zU#SR!f}44cOsrO=#Cfsv2!B4}2+9R0zX^G61wbnhBxq-bx#?WNb>lWD-ru+mS;GNH
zYMcSk&k_OJ)1UXQ;(=Kyfu|^8YaBI4cfz4_K**l*$n8*sM7s-+I1#nVNestz{SuX^
z@?xoI6@MX|&6*Pcpn7D9l+3h#eT%YfkArcaK2ss!CCO*i>K5P4k;4zQLti$Tvwa7{
zZ}}{VF#(yAck=Y^-Xom@^yZ-u4OMQ4z;0Qo>kLYEy$aX)kDV|otP{p_?1V+TNsP&c
zieQ~El<+qvj2eCh5*{$yCIbj7XF)5izDE$hmwA2ZsoScUxD)}m6oNo5u864y7O3#N
z5(Jn+o(3SC-k?bw5jayoZ}yt`H?>KQvLwuv5Tqg`PIe*fi9G<J>V=`l1CZkZ2E~r4
zFwjOJj*r-R{oo@!)u<lXwl6(04(xGLvT?82!N*isH~Lv%wde^IMnQrkRs~Zn$y1Gl
za2mJsNQLSHux-`t;7_33JdE2Mf`Bp<6x&2CEe_dl%JU9{xYQN7Jyq9{y)rBZpa+`q
zpP{-V3=Qj;Q8~jeM?f5_ILcq69;K?3-cF-|Q4h?b*MLho<%{Phcp<V;h`>~bHndmU
zmBcIsc1fxn1QFI!lLA22KxBx9(M2i9wiM(JE?`TN$^{2tr@Tysrh;Rro&$091AueF
zHvkAejkwpcPtM~3ti!;1ax&Z~^--#jDRy-S0qG0RLgGIMK*AMRh=3j($5a>uBYkxF
zcB=xa%Ue8-ez?;OA@6%hqMih4r&?&^b3%pH(ifo#&bX<e5uNcmSwLtLgjbpHO)%3&
zAdDk~&l#a6AkQ?6?^Xf_An?qSpIpaMVNj6uC!CNmEER?@(hpJXKB2;>JE+Eb{YVu~
zs4#@?aEQV&6$UWhs=-oWbMLzdR)dYORM>EBMG3AskF0q)mI?!yXao^h$zZ84PbNi3
zIN<ANZH5ynjFRM-3N!sig(2`Jy|GjnqBX71jq;cZlac8;lY*-r9$_7em+aGtPkoND
zx4ueNJseAgbyshkP+<h5vVgE|g+MG7CWocM5cwp*ga|AZcJ8XaXaav+yyGBbyPoS1
zbV7w8`GRCB*uk0kYHKG{n3H!%D3%HnuFyr*mqnKATIp8iJyoR#pc?AwFY2P&lpOV+
z;CSH*G$JnJA*%9pQ4ND`l%Y?U5T~~kd(sgLZUZB>a;`b20)|6w@r2!(!n?gdq-+&3
z9@R5(dzjh`33Lv~)sc_pkGq8mmbQ(zkTRe$0Qs|ntq~Gj6(IMhIEa-D%bgG!`OxdN
zBSRb^RQn(kN<-?0!I0=U28lR}DL6yL2o(&(9ek{XLGec@P7Mfb7g%iv3-S>PQznhC
z5%JSMBY#bj(mr}*vL8|-rc8t@82tzztA&03TqB3o!t@m-XkdZ^5LOMG2&Le2JE0s~
zq0*?~%vzAVlu^&;Vfimm6Xy~7{l^bZ;o#CEb3WJH%nqdY9TNy1MuLr<w+S9>5b2lW
ztL;UK?-_qxJ8e?RZt6Quvi|JMK1dK6=&lsxr4+1T7nDW${}FcAVNJgA-|#nbG^2YP
z-7Vc+Qlf;4jFN5@1Yx7Q8w7@QNlAkYkWd=w99<%%0-`+gd;gy2x&ONFzjhq^XUBOR
zJ3rTTo#*F#zi{>R9!kD2vm`4a5}1>bdt}cFwbG=~po~4In(MKcb$FYq>VzP40uXVg
z(E20X62@q7<UPNcvGV~NX<)<#)7}Gf1ob1r2Vq3K2(8;l-eE-3yFu${AW0j585*fn
z5&B*sO1dJH?Sm%%DS)Z=5x4VP8<VIr>!XO(LTORJ9p053i3R`{fM6a_mq{qZH%0&_
zvCBw+B*_$PVP9n~B9H<2)P~|#ERb5HQ8FNMnZ>x4JJu8kpH?go>;nLrveQQqI1C8H
zJ#c26TwVME7kpu6l2F2(s2rPe7r4+}^r%#bN{0clEs@f=yx?2(^{?fkfFc-=caiGg
z1C5oX&yJx27ZwZ~NA=^yCYTv8G=O^_z>C5ktGBNSG~x1EQU5P6Y;vaBfm-K3Fw8S0
zMpj2O4-1BsSasD~8NH3%{a;|1Os8Bw9zlZW|A1i&b2Y10yE6+^F|)T;NCFE40Yj5m
zHbR;giJy&dqb4A?K-}Tm$T0o@td{~FH$A0_0TQ2zH@wmOPYVN3eT!)PhJQ%A@=pt6
z_@{-zv050z|7c+xnkmxR2s%=vv;}}DpJ3(x)51WDplW=9Kt##TNcJ}w;?q@-Xsfvb
zpi%%_Frb2!fLJF*uv!>hb;rj~&(<Rl>HleA{j=aQMKXD(mF#G%{9(z@vm{^Mm_e|O
z)^8&h!#e-~1jA{2MOvGh!7BB^5|zo^ELIBx{nNru<K>RN5;#=IrLrOdkMZ$~#tJ(T
z<^QxW!1&{}k7+VESS_q*5zxD7wShpf0w()a<Hp`MKKxG$)3LoH4c6XHZ^N;%Ot0P~
z*r<;Z0OZ;&T7kOo8J0wL*Qrb}xxd@p?}H(O<4t5;pkXO;7VOLiDhJrMD&Sw+FXDr+
zMP)0RGX<Y_g>=rw_(dAIFsSa@G*l&G>9D|(m!N<h|BZj~lC20&YT84(s7Kt<<`uOw
zoJ3e>{%v$xt5e+}KSpsCBbPjCXpC7%n_$I?k610NKJtMKf^lw%$?@qwEzC*7+eQqM
z*zF8hRN_Upd<w_uRe=QRKV=B#{;Po-ZJWZC5{K2oRQ_pU!vASuS3;8le{J2NHWNo<
z)~9>E73&5O;$0V5EeuiqpBBcoj8p<G-f`M5cII`me>G9!PBDhsOx?GjHc|V|nW9>>
zNn13)Hg17OsR@GG;I%C$ukPa%5RA$bdX-JwPfQ^*jCbUWG2#Y^_m)_Qe`U{(kUGUh
zr6P+xaD#M^P-q0->BDExusX}bvS61GP&iZtU%r<wl`<@}DMr&dy@j`i+kfs0j^n)_
z2tjKAw4R{n_Axrlo}6KeDcq3?1+OdJ^%bq90)EJC0w!EwS}z;;8M?B_6x;<LzcBa*
zhP`;X_cGWK4+;(l{?e!kCOO@tI)kT<+CSP?DS9W{zpY9Uw2a4!=v<b-f?*I`>kqYC
zjsJmR@#7+(zt)VfMMJL0JGbxwjy%LaFwElMhHR1bB%)p(K&+K=+_{~Xh%%HSvk`rt
zy6^l<4bLnaM<bbx_cPwR7Tlz($fp)AmN(%=YT=cJ$nzH5XH>aH8!mC!2f*xxyepbE
zEEsm>VEg8TdeknB#0dobA219HDYPdz&T@g7*R)b3Q^foMF%JN?r|^vk1Ykd`u=5`n
zwk@!H&e{p{+Z$3M<l7w)!nOM%wJh-Uc!Og@i~->)*xq$?3evHn4(O2ce~bmg7+e1X
z!|EMf%#M4*0L;&amK<BCK>xrn+C@xGk1USXKQL_3+S!k@D}y%DIU1PDd`gX)QQ7@|
zM?G@TYaGFoy%M{R1;da=D)?r+k+%N-z_9N>H%be*^3^;;7koqfJ>C8J=Mdko3clwp
zWLRI*hPCa~V!^QNNdty58%8=YHCM_vks^cPRm`|MbY3|Bz%YQTe`M8zQ|F&c7PL|D
zI&}R59FkZ6z%b{w&VkO+K{juyfXL%C6+gi<>a1_$STJk_ZY4i8`q!4qS-%Un+Yk$e
zi5^&=I)T@{zg>8Hove4VBJ0&9AdZVS_r$!52A594L0B*hx)G{K2<iMWA$j0?C0oJ?
zc9+4!v39lvbs1VLYS@T-`{O1`VM~CwglFnL8`*-@#T$$>#V$}AO?c;>obaM8f<`8z
z!1_H$fM@8bZ~Wdx>EB4(Nl<#S=S^9RyJeKeHC<>l-s&OovuvC<PEqEQQGB3xUX1iC
zeSU=BA^=VR3WhH@3<m&+S9@ItYoZ+9_)=HgaN}bH$VP@`{5`+|Aoi|Z`V@m-gy`+;
zcrJnn9JgN*M&KY2Bn<1SAj@=#30^h;C>fw*9N8O){a&s>o{%dHK`8^M>*^$!e42or
zhAn{re*`!i0fhQfO?k8ZI@16tkPIV|Ya?0}5$L!MYyYt1r;d2M8U>^B8)-vC3`qXB
zZXeRzT?Ew07l6ac0N3IF%&^{>jFw2})0T|d&@N`+9eMVTl;1ipMEv(7li|>CSCyjZ
z`hRAat;s(#%oAA0e#(rRzKD;a?ZKL1fJ-A8T4fs-WrRQ)^g6ef{tbqH_)|dL6~Q(;
zo$`KV2vN5F`uDux$mn-iGYr|E2RPe8JiwY^fM`PyIZL!S6!F0~nSfHk>jV>xLr4(s
z?=)2`Lqg5?TBa4J7l{KxSOkUH0QzYu)_Jr2RU9I533wG4C=W5Xp}1@L%<5i9G(Lsv
zJ(Yl>nf`2QG0Sx0qS#N*=}1X=DUq|9aVmhXF+f0C6rfyANTt$dQr4Xs<YO#aG%w4=
z45q|J*<gUE7$##@1i*bRjvDY}^5@;;9`>9ajfxz-1Y(ouGdHQuRsDWZzSfjQO(_(S
z+FPuhChUGAdHA);yeT-FJ>ug+<MWw1_uo<{D;=*cPQJ;vu(^DEHIbL#>F*Kr`A<qr
zc-K!^vH5~uf9JH;kGa3L`exO7#!7|!>Am7u|D$k&rNVqeR&Nw<ug>>c=N`pnV5XN&
zKSs@ITuOK3+b(KrC{Sn1eCW-{5dN_J%20$PSL(jdyL+HQ@fwRcD<N8Ivp8|&H=a@F
ziTX{rb2s+&5J$kQ;yzDIK6|3(fQ_0qxct5^d&1r&8Vv+^sX$URnF30j-#4^!rWy2b
zXr<}9^!L-~a(b@>Ox+){$0Cq-C?n>-qo(~lCgO{O+*TW5IttNlp|LqwDy%%`1Qx(k
z5OB!%OuDw{X9{&7v0O#LX8@5(QR$CGCOpy<4c?Lzrb^DY8CLwvyj4$@R;ABs%1d)@
zWLlkH{~3q`Rbr_y7q^#sH~cjXhvvjC&kQD`YT6HTXC;&OZF8lX8zXgj6;EE*)TK9e
z*i%|e^J#g1sUxmxp0x@TYPsJLE7-b9MKngU7As%pypbAM*Y?@5^C`1%Gk7h3l(O-p
z%<3hzQ1_S3ynj?!lTZhcL_rjd&m44`a(J`6EC_#8MJPcs!N>}05#=NAI!fI<^-x%0
z7aN{8Oz9H@<<(S&@KoOkI(-)CR9F|}GXVQ|zU)1ikj|;G+f^{0X4$zHu7Dy;OTiQ8
zkzXMDMKsj$?YG3&tnrjSZjr~`d&TCiW95a91KpP(eD+i?Jal!a*J!Ss=u7!?Q^yLF
z`a$j!9$ywv_*Ho{)Oj-FC^Z7crmLAmh<i;_lk!9}IJ!J|Wm@Z=4YV##=})#^o|4ys
z&$Y+<<`j+W;?T1O<s+zg1nX6hT@>r)aO4EH{isQTRN)oQV1?&V&(l$dpg)~KXdGpQ
z`aUY<AZpI<){mK0?Wf5Z|I)zA7`_Wqv^KRKY~k=vgOv0s8y2UAC4>c=M%Ua=Rdz;~
z+C=p^mr9F1-8@*i%g+;fw10<p_vaVIHxKN-nArl%z#b4L5?W6h;)Et&%EnhZOzFjs
zEhl=gph<0wA)%*%)5#QV{7}=$pEvvF&n=kHZdlPrQ|09<rjMS{kSRFVh+)*AMwM1<
zlPvnX1)foA6YnOAy&E9_<KAizU#5h<a6;1LFf6}3g%KFr8wK(uM=EERX=oJL5?7c)
z_|tcjxQ*)>ghgo?B`v}>5vpD?L0j&&gSbx3^@%ULIM|*I;_jduqCI1&VC-|+vKS6(
z1zwz&#^7)xjrV>pz0BR%F@%fF=->(!d?hPmHg`9i*srqMwBGN??%!}wxjShSD|wG}
zUvJUsRsg&1h8glCKXHfkWHb6&iw!>=baYYRg|o%XH`=^*&mK@%An|UOA0Oe4G-!;X
z^&e?^`{Nx!;1MCYX}yX!i#D_FB_V(F2E}pLrvBeaEoE%lnBi-2!z&%MbZknf=$T5^
zl@}`=V|106=_I{EuQsP?k?NB&liaZUp|7UKk;<buOyqBPH8}XEVoaNh>AHEfB&wzo
z{!wB0gWL-I(<!O{sIW?1)!6Bb#^zGtdk5T~PnjGJPclE8W#?M~iNmB0m{mbI8TM&0
zryo)YRaW;D5d64CizosaCmf|G^&|J)icN!cR4H-5WqfA<LI=H2lemozu@05|KRRp-
zWukW^dE!F}3K3f*&p77Wr$5xa>=v-TsG9FS|L{KekAMxXzyg}8r9M(o(3ZM-;gfhv
zL*h>L<5xp-i!#2tvw^N@r?5dWEvd+hjeI4kyei|9Y6vPmq5O1;f(=30)RjLZC@vQ9
zW2&X4rCZ3uw|aT?q=n#p3eYp~cP<lNYug}}3VU%Bx-H(?-ku@g{Z{|+dRY<vbhq%!
zfX<a;AL+KqG2s`r%d2N6FUh|>$@(^2L?(Xh#g>!&)c?|3j&SY#<+$b3Bije^zXu&z
zBdQ5r)p@JWYgGo^m*B;k#sq8&$X;@SMUuPIg6*eg=s7hf;$Xf)dn=1)J$So;GAnTI
zyRnz{?$9u$SVS*-kQ=d0@}NLf1DbrZh=Iz?#?A2<?XVw47~K{@qVbzqjnr=7xKhg@
zV3EQ-e{R^&Iz!U>qHxw&rqJ^V;r-tca5f#80f}y(%<B(3!mU~ZMvs#I*qW0GtrQb9
z<n#$4c(tC@G$?qamn!d%4t^*@&=5K9_=2XkC8#?lBgf6tABZ}9H48|-0W=SYpD~G7
zNA~S?uf22TKA<s{yO*gX`MS3$#>ffRliaRBde6Z4>AA#Ebud1Ka7=82k~RefaIem{
z_UPf5UDExccg{?TIzh+DjxpAf@1EH?uu%PeK2+A&_^O-LBrSJrOfCG}9sxS047{8D
zaJ*MFkHML*<rwJ%Mtmx%J$cb2uh=~<TCbhf#V5#|_)Rpa;g`&iy?I;GugF}<OV;nx
zpw88vDYb7^2}$guO=NZ?Z6x;fk3!elYXZt-WMY`ZpSwjdri#i8s|%kmkJ{P)CXdh2
z9+!BN6)!nb)B1V-!h@|jNKz!}+E-`!t?I9`=Q4M)liuA9l!Y8Sode>FkscQ!7gPr(
z4?3LU*)A(Ak$Vq5%FR9d4Uf}Vol5?@m~ArdXYD9=&~xlJHB|7T0<0$E8X~_!(ea~>
zqI1D>S+dlDU#dXr@hkt2(Q6{Czal>LxrZq$Y<?GZ_`rO*-WiBVClS6sbVPnmahDRb
z`G>Z7)VJq?WZCbdVn~7Acd^Uja`J<BZ(avuIC85)6pwXjn}&O4555Gpj@qnUit=<{
zUM9Zj5hl6CP%G~{d}LD#*x1-w4<`RC65PURV!!|3<IV9&AZV;x|CnR_X1?*0VYkTN
zGwR&)?V*J0iKGkPUe!M*A<DN~A|Y<=!GC{#yqj?I4EeKFxauXNeTQEJs3W-;dj=#g
zszW`lk|c5b)PD(u;&~LVE<%23LhH!-hurl#yGV@wfnmKbEQ&yp#y2C+h!UYF#h7E(
zY{@ZTH3~{PSVTJbY}P$?Y(PuCIa4YKmjxd^-rUdQ7CP;u&b=~0$_D>%dRKVM2cvq)
z0CS5e&Biif{Vc~13KGVd`M~3X>g#P&0{gfOlUCG;uu2x2+Z-4pRW^TfD1qFBtR+k)
zg`E6Mh3ZKf-G;tG^aG|7RH<3f?KKQyOLuQHuF46Qr8t!3rwMa(|IP+3qti2})@DFH
z^wz|-M>K6lhux#OplURXRT3$=5-JiDMwg7<?waE98{vtzWtIf;y08ll+J24hzxYOQ
zHEin+psaQao$UsTY;G=Jh9$ox<gC)eGAm-K#MD*VJAT??a*N{ABtkcX5+^855S6Io
z*8N#P4{AuLN}K)VP<pdU&W4uExN2AiX1-RNc>};_G9*1XD6w&;58f}x8Rh6Mg10P;
zxqTwwN1%CZqLl1I>AY+>7gQgPM6Nait29DkRpw0NxK|PDWgrf5ayt;$JE`3-LVg^t
z%{V+uR7CzpvZimjM{m11ZI=RyUt@6})1e*%<m&8J=`d$^J!i|LC1-NzIUiNXC!>4E
zI7*+A-1a$*^paYx(M$0d(P%Wa@wUf?-Ro0;^zNW+*}D@r1NZoMx*ql|e%o%hb}G9T
zK-nm%<UZkK)i7C3c9m^aZhJmO&MtpL<}RqmJ}xCz3u74)q*2dJ4pnYZWnKwYYEHCa
zi#jMG&rG+sAm)be?pXiCJz7|mYev$g>%wFE;d5H|g6>ASN7bL-^gnm$9}4PINOq)q
z>*%Z(rX9<{UV>z`iP9gBlxcQ2v^P;b!D?a17YLvVti%ngg$4D=`RjqN)E*!1@IckL
z{mDH^?NtwVI6rA|JK_5I6nRmVV-qb^uv(blbKk}dkMP~+spT$Z+%CC}uN!y!B+&~7
zSS<|5&+8!2uEN<I=0?+R+EK1-U<b~25K4scDgdQUBJYRVxsDU)y(ZKW9?|h2oLM2T
zd%e?vC{-o^hIFfu89%%NEPC-j19O(X)WJ0w)QV=uc|%MIjNx$?>>svB-dI4AHmhQ;
z`dR!a6M7y{Cil@u;^4|s;>9HCt~vEzA>;V(a;<hOeTTIuWfF(>d6RB<-Fq$gKHz4o
z?PXY13d0XFH_KoD)54G<McZya&B+$f1hxG_{_&9T2?ZP4e_B}b{?h+wVd$y+3e!jZ
z3L~Tx(HM6?=|3$DWT?;vP`RgS>@)Lr_h9OZ^W@5z8BkSpqLu0BlI7x(p=UrGJ|xZy
z342OaEriv=ddK$5-GZu=!>cZBrlj%q84l55j?cXdsI98FEL)Ji^;{a(JY5z}Hssva
z!7lcOj$T&Wj!cfs3KecP#s2%~ODv(MK<<-x-@&@f&7XWf{sE^AD%sR2V)Jp(c=^lY
z3S}MjsK3-o=_4TpGZ&S2RWUdfRB)5<$daZNvhm}-ybeR|E3~}OB#$HmL(Ek8&uZmc
z*J^tT_V`$-VHLNaP*0Z!ba1ZjD^-q^1Nj0&x8Ytnfc=n5f8NrO_wZ5P7$@RU*m)^J
z#tDcx7!+72&*C@byJs=FR_?}9p`7koSm*Yorv}9Z^sY-%29^1T4}J0ITgtAPtizp}
zwy!ydhfPOfsjz~Zu&ChBb7$Ttb}nqs87eWOo{BGljW3?x`9$&{cMT`~=f3AQ#oc}q
zLo|@Z0!@AU%u~mzv;~=0DP&mb1Qa90!DK5NRJ2*g)hF`v2f@DF^b7krNvpYc372js
znsPQcxeGdBa_{WL+H#byfW3WMbh7aRXw$YE^}RuYec@v_Nw-AstPl-aUQ=-Qkv?_r
zh&-!yj=1r||D}Z`lSiI-xMkNU@7HYC<tVr1d^wM-EOv35WFbGbsV+Di+ppOi%$5-o
znWS41)X0Zjhb<X9WM3goFf@l)EzE1>*Jl+@1TWqFEzIF@F26SRBy5Ks1!9h8d@wSC
zy{7Lk33lcTI8F@^*L-6CPYde>vd~m`*!Ok*)53cDwFDWy9_@RW(0@zAuz7p{RZj`$
zpn7n!`3viN_{R<E+;mRlKg}q7ij?$oaNhtRSfemKmAM2{$B7;tg9K~&b>!=6l%MV*
z$>P3O#$&ZGfLsbTz529!H;#1_`L+yEe(dphv%j*gKTv3q5iD{j>@bx$=FR#2r#L0z
zlRBrQ<#ZhxRqcJ|p~!yN8OSy4+()F2$dZ<8QI0c}A?$SIb7Vb#%8^1Hv9|jUHIcbo
z?Ze;`KbJb?Hje^y-Epi3jVD$M>-Vzn!`6#{W)+-kPq2jt-&<4u+UWzF#%4-yGSK+d
zoJw|4=uHofTZ!oX&+ip#-xC{cJ-m0o5^c1#ru9z?GnghccL5L6(cFn!;3F+!j7Wx^
zr^-~sx28quFDfhES3<#rWBua4^zYfH&Dl=n6&w(kt8o607N){~eb=v`GwZf3KJ<a#
z>;8n$MK7y_u|H)4cs%kNhxR~F>;O;lMz~)w?mJ=Mxe~{dxibVlMrE+#oPooem=H-s
zJr5Ij#v<b5M(Pdz-4C{l;S}+vR&L;$_el3@<T0<;{S`+2v0h;+O)+7X@WJH=`=q9m
zNFSD=)YvG}>^vpToY|a5K3@lox3rWI+aD~p-H#0#tjC{|4ZZwHkhe3~6E5yBtM!n>
zd$+c~v`SnJlB)eBQg9w1^u6(%QSzX^aRb`qX2K(8#M3g{D^;!{9dc1tFBzaiD^0KJ
zecAX3?P{L!j#cA=Z}U?4zHY{o7?!>9gL@PVUwf6cb!C1;icH=mDe|}cdU0=-YRJUS
zFjeTq$K;>b_4Eh6Qsgf_yQx&~WBN6;M|MQh9xQ7q4z#%JwRn7gxiTW+ZtM_x-r_|e
z?M?XBb4H7pzST!W+Ba$8m3X=D=PY_YGG(Pg3;z2)(ycE&rC)snms(Y^4s#xETaq2y
z8`<)nTzPuEk`8Qb4Ge3Va6w9D*GaW8hG40%>F1Uor9*zThUn|7e|g~Dbs&$ds#qG`
ztojuqA`>R<pD*cm&p`E|d*7&}(9~Q*sC-+br%V)wwz_M7&=(al8<XFW-v#93AHQmg
zeJ>Md_d;)O(6F^FenKW;zAa&0CULJV@w-gYuePK+nPkHDWQsf46#DiQh-@lPd#Z?R
znsj@bvTV9`d%BTqhIu<SwK?;7d#0ys)~oic5ZUag_Ut6toUHboLfPE%_T2Zfd9Cev
zA7%50+Vdx5-_EzcU6(D`YcKdNTllNJ@J_afu%n1V4n^OAg2)x~bQFuoy_4>Erz}^Z
z-BDsBS8Co-`b@6uc}JP295w-{JVdS{s-q%Ft}?5mvQVz7yrb&9Ty<+l^+&myp^lmf
zx!U=T+I6|Qy^gx?a_@h2yuXvHC+w`JkZ+*xY=Fo&@^m(e$TvxMHYv+DYj-vq$$v2K
z{P65|ZD1I$7mlzEZc9ifXd0WPNWc@0q{;u?zK-S}j%*9N>+JlpE>?l0@j~<4gfZ)&
zX;)OaYSg#}(Czf0%4Rt9I%w9(zD|h3H9D+aAIWSJ)^!0Cxe8P8?^I^!@1|Fi6bxc8
zR_J@Ba4Ce-@xG5$2M8G;fILCcgrhlhZo56@JA6Zjh7`__T{IP{l3%-|ulk4Ib<#wK
zD%;@FXCtKrZ$E$On)=8llrPVtpf>Tlf9xV?Y=~gyA{3h6Ik86|gHTr*)tdAC<57ew
zbFA(*+%KlluW0|~RkHfr`#1CDQA-zLIr)kTlY@)z6=kE}yc+ISMkuZ=6Rgh=EIe0~
z9S+MW>Q-j>JGI`fa3wF)hNfju?^XZPzIQ98gJ$=?QyWVP^vK4x-2B<TAb{uqx5IF0
z^W{bIJ6(Sdj;kwfzZ>fIRY)@n9+?<CxKN;P{`+zxlm-yAzZL9$spKB6G_ekp6V+AD
z|E;)!d&r|y@I@VFqs~yF>V_A#?Tc;;#2uNz>HQwbtAk`59_05A@r=fS_y<mRqQzEl
zAt1F^HGLckIG@+izxTS1^nu4BF~>852hY$PG=06e;psttL3EP-lqlsVro`7<9G@)I
zLMb?yf*AHvp!}wzr)gJUdvvgA$;y`@ZDXAb0m~M@Ybr;B90}*S<^byFhHvEqeqLTv
zI~k+YW9YsSd1kbVdhB1nqmQ&VQ^G?(1&6!e(Mn}(>x6RbYklSqMa$HlAAV;OvKx|t
zOK6d>wZt`FO%*>(uCWYto^RpO7Rc48@A_HgP<>B`$Lbd`w{<>cjhID#DDCL0QEHwi
z_$iOhX&5{goA3hocDWp?&@<jYJ>vakFC3dAm$CQrxHR5cVn(@eoyk02Bic9Ag}gg;
z-vow91RM>LAs$xSOnar)lzF@+8#-&%fv+G!);hAtmmRS)Vs0}DEwAp_f`hIv4(3}!
zAR)nj6z?N5sK&^I$4&XG<TqgViB;)RH_46EaP(=Gb>!-kD@vfGtR&{BXlj!0uu4b>
ze>|}|S(vVIJqgig(W-|V$k-B5@*pw(J4W!iNR=L_qrXpk(n^?rQHwK16fC6it!UQj
zcfwFbkbMd#y>u*peFRhSaN$g`OGR54o8EY#Udd_7AOppyHW^7$1DO{4kX&O4Md^MN
zTPor<flWA3(C4GlpIhol6@1q8Ni{M>8W=!`W(P({6dIMOCnGjY%_kEu&?i5t4x;1h
zJ1w7)zm3r%7Os~~APKg3f+rli0rmxZZ68OOJurEg!TAVtRz@XC!Q}So38v4C(noYQ
z#lo(1^30rX<usBmbr`ruuCy)tZN}+)8xNC`0po|S5A=72nAsb|aCK)(+KQ9qFH6+e
zTxvhf6+XliYbHG0w$z9P)e3qP-tE``30HgTo1<kzAHgRJ?UR0J)9`(@Na6_b|JtnX
z|7Yp~?4#B7d`?a%Vh_eDZ`PlOf31<elle55aW~tcAjdH)SMYQoavQw^Ryv_9NsZq3
z-XeDM;?y;Z*@lfU*Gt7&kad<goXHB_Pw7KjqB5<BeJZSp7G8I9fSx}3WY%BU$dR#7
z_;Ay|^C0|3yc1;f7T27Z|EkCV63w-nn;)?Pt(g8wJl!~W?@#4&TIa{$^yi5IomA{6
zeZ^df^&J`vqY;`9f4i*@G>#Ppb+GG9*l1`C75Z%9nQWK+-SPJGGp}R(wen*9?XR^r
zcdLbxLV`E8iWo_b3pIX4s&98m{y`O-A##_J@rT{;255DI7RkUtbt_w7{X?3^v7wpo
zHUpa{jFb)d(N&{`Xs2y8%2ZG>{?n4uq_aRzIzu6=NcCjKVb#Pk1!Dfore{~T-t5mE
z#<lN?K~h)d-5^%MKqA+L#@mLTL)4fvfu+^uCJ+9T-Y`yFM%b{8HdRu78B9UXaMy!S
zfq9KGO7<&;JfMvVV_9J_7?u_xgN~Coh~XSd18tgaCfSMB2v7CS(uy;rR6CGq7|}eW
zDYr;|GrT1$&Gam?LWeSVmCI}Gbcpd!%Ak}MZsIRMT+((pEvI*B&}1w@33rKR2)1XV
zlu73gUN#qB{Vw#*b?Xji{$aADqPszw0J*XhI|UCxe=385p${)_#Jz^8gxl#w+LqGt
zu_9yQg$+X8xe_kAab0_m%kb<~FNMNfeN_9`9pQjQ{bzG~QFO6dqTw<Frb0OM)op21
z)a>Q!>4}^{{?W`gs)PJDTd^y7X$Qs<V=hwX_wUo#rPN%P37FwLU6-4Zo#E4ZuKJ1e
zk4gq_cxw{1w<=9`ERS^QK~3<sy3vzUBUnayiRn}t=WpI}<-_@+9Z8MQkCn-c1DyEp
zou;MDLAc4LO@@AYn8zil3>|(nVgy1w&e^ucX4bkqzZn~0b)D40A(jvF)@aIQ$0~Ur
zO+6^|31vBl4vmT5ImAoFgwiQF%xUxcMf8BTpG+xCsx>r=3XYFJOf<*L(2FWGT%5kA
zk9noC`Xfqni)-}nfh-gnSaAL}P%`srpqDbs1O(L*EXN=a@~?6gPf+T34hyPRVDm^C
zH`LnjiY#+`vZmhw+vEe>TT$Zf7wxJvxG<2F{s*%s=|8{|miX~>XZe9&JuQu$EA#DT
zGXW1bVW%?(ZqAP%FR#tLa-_r)^1=`m(iT%q0fzYL(py2Z+iXUqx;{vs-Y^+@&dI0w
zK4esbho)K3Y4;JO`sLBg)BX;Lsk#SLYDtu=;qAg0&G$X2dMiEjJ!cu;gN|l&Uk2dN
z>F(fJTu~<6$v=hrUDApg2$o0UxxDNpdUP7fIJ#lTB%xQV!j52m0uSHVB!?TT!|Lqd
z6d?=)usKW^Y&60qJDt;!@+{VJ#g_gf!{D1ftq&!ZcFezzRd~z#{OwlkAa@MIs&tL|
z8VxKEGR6_zN9U<IZg79Uwh@!e^YqFm4g${@zgW(lXST06h=eeX!s#xuN1iz5o#Kwk
zpXun#1tq_^{K4Tab&-GY<hlHiTZV~uzlVz&|0mr6zcd$8m;R0F!=Fdcg{!%@jH^!C
z%1esXez-y!=m-Ie#)$$v-6FE-O7;#UF=mydm`n{{Se0qE^3ji~r;U2T_@;vDrG2b*
zzNAWCcNj3PDj}p!)Usj?O=fE~BR1MAJlMMhhDT=?5l!=%DCE$eFKG8@IS_aTfw)`{
z+p_QA1lADsxn^#i(z6j4-$Le9_{)2$nY-`QXqHHw9y3Ac9>u%~2Nv3x*fESEl#PCd
zr8gJhG*;BZ^dHXqdq7FcjlvTsfLE}6Xa-Z_*?_2-8r%0l$Wq%yH2H|sDvbVmIHSvh
zXlKc?dIJpU4kZsZHWu8W(riDWs<lh5qI^e&+xwu8)sdPL(#AXBlZZYw3+62|MMNkY
zeAA#-n<3-R!coZVuIET&IkKFWi@X0<<BhDod~xzn-`D+wHr`c;lE}QHTQIw7_*=-`
zvDNm30GKc-`7?FCb##B}sl|z4_kj`V=(K1xYd~}*)e`Dpj&a?8XzOLhb=4(pZZUy`
zp8&b1;iQ_+8+?h4O&Agr+A`x8PeH`aME`7y*2x4_Sm@ZQP-XD`U5ac^Q;*u$_Pzpq
zBg!v!Jsy8H@#*RA{I?*G>yFWjj+1(3x85f9E4BL%y5RHMEFAZLJf;@P+#;Au*@FG}
zEvu}66z=7Bd-`Kb{(ZZsT<|LDmu19X$U}aREDttleg31cX2MfE`t84Zd(giWus#6*
z>RksXd)EyH@M{7Hp~T@Z#^FiE5tzggp~RIi#+6RSm7l~_ro>Y>#?wy5)1Sn<Gor+Q
zV2p2`jQ@BN{~0BLoiV}lWCGVo0#8apUt_{o$%KKEgdvomFk?_uGAM2mltf9CW=xco
zOq4fCR7gqu&X~A7nYenA_&p^_lQGHvM}_qplMW@5e(`D<*YCLjl3@ucKRq%_TeeG}
z|J)?$5vB4boRM;qZVAP^X3TSmBv0t0NG$?66|;sGkrCOl4xpgyK-v>rNHY?=j0;u*
zLLP;ZDyfo(;Xrm_ln!dllrX9i42K+;>=TBz8KZQm%4Bv1?ZHqR!$Nj$M6R3F6?
zG2R<AeX0#{5R7LD2xbE-ouZgrin#rzAWASQ;ywy-An)BJ5OS(YE<FWVGiIusf(!t`
z)@W#nH+7{6%L{f&L2oVvZ{89h?bRvw9EN%c!9cCXx;O>dL@_u{Dec0jm4GlcFzHJq
zU78o$rYiF;hS{+JE2l6uW2mqel@%D`=FL`u1ao*ZGEqV1;Osmm*df6@iy_Tuat~FW
zO%z+a8jCoZf(fQE2V^8sW08V$iJZ~y0>GPS$SI7fZHoL9O;3pe6Bo1I_L9#bv8Q6e
z-vA687#>Y39%oxNB{aE~534bf=FK@>u@Ao|jC~mZE`if6tMV(uS=Gd-`5VAgDcpxZ
z+Fh)01LNR;V}F;t6bK#$fDhrUcT8~d5=_^E5BX9reKU~O15Hk;DrBbyu||^@03kQ3
zkO5WZOc<@NDU&0HZU71WfT0tfhRk8;jL{PFXfO#5L|8(CzDW#wy&Tc>RAQXZFm#S4
zELPrh>0s^~lwcuBim`z;2u*+5z`>XXIm0k!!oZ(klmKyPk{8`=uRu&A#1RNSX=J)Z
z)8DGl$Vw2I`H=6bvalmbdyvoqG`ZO{`5_8o45Q=+^UT30byA^A7(v}B$S#mJ*_0`$
zk-=VEMp>2Vvk7Dl2o^`vu8OJLn}RG*@fBjY2VkIE8#<Q_s;7<6ITVO9olr%B=p2he
zp;+y0h?S6pcT1|w))=loXo^rM2)nyxmQJ{2L+uZM*ds_o|M^~YE}L|@8?>1yC<mHC
zZJNRZr5$2MwT$JvipT`LsmlPg<TLdCDkPa-$zxI20h2Xv&<@*BZ>o|UZ_tLSFkhmG
z*x`(A=aS_cwA;q|?O*jhVW8LzYPqjWa5bjsBBJ9B>Sm<U2tZC5DMazW;0=uIxR>G<
zDkF`eYC4zD_f>sI13vEM|B-H_*a+@Pg_fww7kaZ=tCCQv%8#Uxtv8Sz+mN%PSi>bL
z+2L%b7}-BiYQ|<T-V5feCfOuWs?Z{^3qs=~3<PK<vQ9H}rIvIBfHPr4K`^ScUZp!v
zpk>A^J(etENg*s~<lcCoG!G}gk|e`gZ^ym*dp4}gP@;}|)R{oSVHJhvNTFpL?LVqd
z7c)p3rzv`EsE=)^JvN2Q8}RuhH96qKWnjWN6qz^*vWp}ffU}w+EHURwPm7?3s%GUT
znuIM{^Jx4MII%d4>MDi108X5KPL+iu4T94x^~z{xT0&--TN}uRp?b@`bZ?NR5<muL
zHKte<T7fD0P!+H-TKfl*v<N`^mCE`k_4yx^$=ipTV<y}n8d4=VBUbwxn58H7Wz795
zERCU)d&!6cr|y9{hBa})Ubq6ARZ25mmQ^7yVU+b|kdjmhZ6E4ffW#f`3+_l$lG_af
zH1_{*!x#j#t_D5}@u4n35fP`8)|<)ZNSMcnQsbz4pP|k3Hkd+8m|c3AJW(J(gZ29c
zqJkg3zmcS(O$5dm>fT<Zrh7_6wv0h4U~yH)I22JcTx6t??AC^jpp_xihEd1&8Bsbz
zh_pWk%v(E45;et*-2^?kc&03&IRao3GH1y}aQ=pYPR_XcO>CLL;QR*0-zb77(|)CJ
zYL%DVYE<CVUW!XN8{VAa;`|#z8q*IbvW*vXu^76gA|^^Sy%g;Eb6dJ$1cieiU1~4b
zM3osU7KUdU5V1S|K_Ms>TxSpz0u3;SK6)HD711R%6`k_kvJLAd3fwhE&LB>`;X{9G
zL#~9R&`o17L5AP=e<tsbEn^`Kery`v%wRb6`9nw#jA~ng`_T((YcxeBT;rK!Fqa?k
zA^f3)s-XnZ1bODo(F*!y!ZfUcok1^uqnJWB=z6eYXn?q#G0i{&wX>jK+aS|6bT5&F
zauPDjXD|LB6YapXjX&w4QU$rvp_eEIB{K+0j4d(+N_?#(fx_0~WRgqn-Cl}AB&k&q
znNT{kh#Iogiw|lhQ==jj7uO`hf%IfSjgh3cK+3{1CK5Wv5f$d?EN;IhXlFV&4yiYf
z&fEiL{W#;^LMp|XivRu<g6ofPC}z^i(zts?6)4fj+Uv`NDx%%4C$q*-Wmz)iUek$Y
zJEJng{%puW?y)&%OUVDE!$D!KOS>Ovjr9~x2bqlJjeL}t{E%f77^uIvNMSfbVU09l
zZH)dUMNLe7e=(g@+>}Q31zQl1)Qiru8p-ZS>+?Yd)V>hsTEviAM0*ScEq&GWgj-><
z6Evl%by7;6!`Sla9nPj+>^xwOoPGNVrTq!1A+7qDBs7JhosD)8@^Z=U4T`7-i0uOp
zaJAJ7gHrjc&@RL9X%-+QNKG(`U`drF6$*-H($JUXDa>Vn`4Oi=*#>@Q2$^L%2XJ3v
zT+3BRR35P$tAH&6YL{=A-oT0Pa*GN-!O4Tb&%yA_LRCrkK5`coY+D^oP$SW9b3D2T
z6skgUIz?U~$#w%L2X)pG(ep3^X{BVi)0@cHF>J6|NCC|8n+-7&?CpF&#7DH<QwD~4
zG)41<lWrcVfjqAwbMuQfw~!7p9BQzwcu@aLG(1$vf%?7!qX-yI&M9ZMXQKg^r!+<)
z;g9&fe=QE2q(2c0|IG+qLeSj!Goxn6t-$um@O%!W(H~Xj&%fp3;QY+!QfFJ%VW`#-
z1{qgG1TbeQ>m}?}k@tO_LKYBl)IjEMLw*CSkbw6D*bwh-RJaDP&H;l-Y}u@TNNk~`
z98}2nfUl&*#E6Rf?rKx|pPMj$pBWG_fz&+a27m|19xz%y;gn$>3=D0$f6e@mWk4Pb
z@uL}<v0{COVU`n*IzurSqZkl=tW`it#YWUKjJC-Wrh@$81Qs33>!Fb*wjh*vi~=3=
z6?2^g)z)t=!v|DhSpp%ce5_ZrlFRhBrpyX-wERAF>~Ol*w;f31Pp&N7#|qqj`B3bM
zy4ee*c_dRcn2gmwxqqq;{5GRptgjmRB&v_1toO<6E928FQfoTLV=I!>A~Gcf9wjiZ
z#;T&upNa1*vm~0ec?eRbClk(3SgJB7e&Ip};B#bLuxE<1uM}7P(%4_Toe%pzQ(<35
zS?k_H>z*$EQC)6$yWII_xm9tcp?i51w*0AkWoUI}b`_F~Vw_W4oq4;uqqv5Cvoi5!
z`G9q0m30k`6~b26j#yU-**1vSmakdYM-(^yyupyHEo1MoWNRznzw5tOF+xh4kOB;u
z5@u|bb)}n8u3&YKbyJaTQxl7a{aw}W*|rScy7zaJnr-J(_fo4No=3qyB+TPKB#Z&M
zrwOIKh5bXq#-aOpFxJq&q*x>@REgCTw(lFf=ef3rEZB?c!BSy+FADbFEA4+M*h^qL
z2(UiL`OgUpC^-E1cdx(T$a8IfaqZ}?_V2eQr4voWaa!;}K+i#8!QQ*z!=s+P?|*kc
zS)Xk6eEY_BM4|ls*V^&#zq?o}jPT<jHf}uP?^%1#fe01}gMVXH-bX8)xAq)+DzWAQ
zzX9)dRYOj-*H7so7nrrn>);;(g(o6~mzp8RvW2J0%9r;bKPB#t1Me<1p+7te_nsD>
zM1@?tuI*~t5d8cP39G{*VXD-1cQ^M`S=;_Y!hQm79ng%ug*V-R+qdxF?S(hBSSJi}
z+g<oOLFIptFcwwTdMp*z7Y!CX)FPsh(OXsJ@cAlhmHlN=P5W?L(9iJ{swqfF<fu_`
zYSYgm8}D{(;RV0ziy(ur#mh8oeoEq=^`_Z3anM0x14jpP&NuW@$YFY4c`u-Y+0ujr
z_#>vQBZWAHOpL_o+y=$M_;O!pXEs%<Y3N^bS~fWwqU0Ir-UOIIH5;s*O`nov?3?A0
zJQ%;K)?HoysP)yENkKhRV!-<AH`QYUx=qEyE~u1(<>^LWlxFlPp<MI-jSBPlX8HCM
z^M9tol1{E$ug?BADlE;D`>6Bw`hTOss!6_EBXG$7Un*<|eYf{4j9h6y`#F2PSETGT
zqnNrTyNq4FEW4!C3L8};G%8}@M{<}NquQ`-oUkEbQK<O%|4W7a#rtKOq-4#r$ryME
zRkN8QN<pzOzr2EZ>k-F<gPz+*6{|<yMmuB*y>5t1v<@cvM}=K;C0P~3aC@`w7AFdt
zw#49(NZ?6vQcK8eMN<l1p2o@PxC~?LB#z;UQBdM?`@-FAuh584s;Y63r(L}og@+8O
z{Up}*@5rT--ioQmS_^tRlLvMss|OW~*W=L{ln}Yr%%teL*8WF@HRSNQz88+=9b!|9
zHhx5&cw0Ko$PU6pNC?`%b<#rk4@O1UZSGJt+>vs8p{3T*$?+c+==f%f1h;JxIoP37
z5ulQ)qff1ThMgYG@B0MazrQ(=&j%aq6MOYysW8#duJgG1VD{I8q4ab<?_%f$^ON0L
z`?%~t)F(GN+mU(%zcDTST>LAoAA<yo>F2C-NXxY(s|?du1kq|Jp3!CRLJ<&ZoGKyL
z*P~CZoY4-g1xdhCVXZBLD0OAU!sy2AibPq-WEr<lD;lqxV1mhd?<Lk>dk-=uM#oot
zI;3<SUvQA$+|BrSYnxa==aPRv{~;l3i<!d5Cr*>b6n|}}^dX7<o3TgxhFgishW^{D
zwYvEd>}GOdpk3b1AH3|xm;gB3^^QH1CCYhud)V{@<*i<lr&KOm;gZ@<x~t$kOr%gv
zB0i3|VMWnfL?;(-5B`3BwfXrU6}EY=A4EoFX!Hg?^i26}bSC+$K_VW8DWScG6mc$N
z3^*?1rzbvPEs+J?UW0Q7fh`(){kt1_v)1|bZsLdb5?#in`$1oE*rc<)Lb*nZ2p3#8
z-lXnzf%LFc7$+G=1rN@E)2R*lG1PA%E8oqSOm=r6*H6!ag_@i&V!#CBLyC!r4jK!S
zJWiB2HAb^wsjyhr$Z$tQltsK<w1(iOjEqG;=W9{=TWT~BRq+6?>CpYFEfg)53VZBq
zfTvDb4E`vi!KvpRpZeu4Qs4=iPrRx@cIL>GZv7t><`kC+c*mN=8!CmaGG5ft5+}wV
z{{N{k9pB5dq!>3W6&5qBspgZK9#q095Hn&xKAn{7#_27`IIK@cr9W<w&85(f_iETX
zqsDC~KvD`<WbG_YoneTtn-U`A4GPNYbP#T8);GI3H$WfnL<Q^WMd<Ld=8EEorx7X9
zHIrlwn3X-xJ}{7^ZOR-TUitWhXdFw0Nj=Ull{GrZk^QqTD#1%A-hv=~{C84E(Y9P3
z!#CkKeWCd?=()mF4*E?;Md2085aslNWbogef?+^~+#8Kae<m7~MJzA4lMhEa(f1w8
zH(sZ^AYL5H+?hl&MJMrrpQ8jR!f)AGwRO=E({#0xVM1>XbSp=Sa|WlQr4pPCLo6QX
zv-qi}F!CD5Ej-9q(<xVFt&)i4pLrK7Mpxh*sr^3o;Um5Gi5#qa;^7N*jJz4jjb00U
zQN0gEgI}<~S&xE0yCgQ1{fKjQch$SVHE&;QsAKf24nF_<sXcg#%HO6M)VNsGSf>8o
z1>g1A_gF}8@r%sxdxExq-dPMToux|-S3Ot$qHb<qUtPk=E*{B`Gdx``0n?1s=#I6T
z9gq6Z;3ed2Bmi6d9M#hDjo(A@-SYR-pC33r^;5_;7h-OtT5e5*ofGm5w-1Nfn+Ak9
zRO0SdkEM)W3klWA>RTlaNmeVdSn*MI2b!QF&1<GJi~?pXEiOCEx;Ndwzgo*fUlr4L
z{or~J-w;^8CWjM@URJ+44P5&(oz?yK-uvM0$EG;if^7?`r(xQkEx)<=_v`saJ;#Y(
z6M}y2S>me(J@K|ehguB0;qrcI5WhJR+7>P7SpUi<f0J>>e_$Qm5dVT@Vw5$rZ|1Ba
zcIWZd+1k}(F{Sh1A=vhpmqWwnnpzKK<97sck3;F_&IIkm%zTGKhsRRl!}AsFL<6-(
z?Hv<y6vG@Tt1W%)*2eQRDfa*qIb$#B#0$C&%=dR2#yo!d7EE>S$z?4}B6cf_ek|-s
z+#OvNG0irXijbAvyKSH9N#MB}Am)6**)Q>UquEMvb>2A13a?b^o{<Te%aO6;Z0*Y*
zn((*A2cx-PTePaU4x?eX%H`?B<DT#D$6?j5n}rMf77L=MEVfB<XgMV;e4X&kZ9?bu
zfWuFlsMkCP>C+NV>q}b`c)#w)2EuogB+F;ss?v)*UtxFp)gA}>?xh{I_OnMCY~tFz
zpPfCswSUrZA>_Gpy1eq2jlDPSRw$HNq4&{AO^ZmPH?DUl#)jsQZh8tI&OCI#;DCMT
zOfftuDu0-BZ*yScn|E?tmyD3~^+*)MMTUI&uE;Mb@%ZHkzhl_^NRG3rQNcwHb=2LS
zw6xG<grVOyL-(?Eo&Vtb#1}t<+74`PVGbn)*^Z+d`%id^=i}IZHavKH^qjC$aKP|q
z<Ca+1Gv#skTHVWb4(6l@t?@Ry6^EAcrjx;T`IY%#pJjHM#t>!q4Q4WQ4HhcvSnOE4
zpXag6XC*_jwYhVU8=w@WqxRvp>pewPfc?v!%d#PbL(PeR=~lL#12gTwPu!@XtUsld
z=4r>zlYG6Fdwjt3$P-!CfX@OU*Yyou2h98fAN}DJMndhK?brtLxQv@j62a3qtbe|l
zum4^j3c4y+{tL;v+sovQy8HztvEul9z8Dg6^FHZ~Li639GoBx}_umGM@*r@X?wH1<
z1HW^^b|MMyULgb@d2ZDscFG@-S0G3iUW0TzD4me>(N?9AA+Mv56bwiz9dp)UFEV-r
zUPUOL6QbAL6ylFm!w;L_3FEYQde15B6{neeMp#jKuwt~2g1--6Tc~D5kPs+bw<27B
zIQ;&8xRH#$hEw>1=odPm2=nL&%ZiA{!x2F42s2RRl4HbEok$0#$mh|KwZ9_Z!;zU%
zk<OqfZ{8?hohXhEk?zq^%s(Sv3`f1$j|#a8f0Z2-2C@nSMMp(P$5cd1^F)X5N1HoD
z$MMFb>BMB{SS4IV=g1hQIK{l(k133f&aQ}gx1g5~iY<?ht+a?N)`_hJ-D#Iq#5VB8
zHG#rw_G4R}H0yQZI)~%BdHvf!@hqirJv#B9oZ^#zF`_HtHzebS_Twi&2`}yAzUU-;
znTel@PFS>vpRq_-jh30ONWkzWRt+btIVI}gCT>+E9_hsF_+#5mL=T1&FLaWE_Y+T}
zliJyneher5iH`i0odnbs_`RRxm`z9p1-jX2XCaa;0a}buAZ<OFRyYvb9f`k~IKrFE
zoFju5lkzkh8{PrXw$XNjVn1<hB(X{uAi!87t3DO?G$j?3%;KCTyO|<U83B_`<!Vpm
zyVevS0?_Mfa6(hXE7M{u(xgYyB~#OM10oc3Q*8zalq*xU7w<^bvC9ZC>BdCS`itps
zXHoWzjA-5rrI=LnkyK(?azt;2!*vD|U#4%2fDuuafq$l%bB5|jDgX*p4+pZ3q`q=a
z^3lzT(&c`so2{Fj^~@~8c_d5wnq&-`9@d`y0+bnDnR9^3&dLc(aMnm7O4s5{=Lx`j
zs0+|O$nne0$vep1p314_Ll#+T6bEE5)Tfd_fq-NHsZCBJQB>`9ZvP^415tjjcAkcP
zUJwxuZEvc;HEz#h#!x_HpKktq4D+Dw+p?^D_2&E%A^<d*@ChHubo<*or|gBw0{r5)
zdzG(NWy#kqH3W!o9`mJAh?4If6jWyy932#%OcnedxqE@7!Zb7rw*WY}Pyl&lA<pNB
zx$8o32NUqHh-WB`7J$o`i*mcprYb@)%aIdyka5UqkXfNDK`5%KVtk!Uo{k6wzU)xl
z^d!c2?AKX@E*jj2#m3pi0*CKVswnx_9xz#erb`Kq=(`E$5=|@MmKOk^g7fSWpvhli
zvG7j$@SUnv>En(>^Vm}Us!}W!w)Bq*L;a(|ZsM_2*x#6cRM-HP3acvkM}_IdVX3hB
z|ERD^EEOh~|BnhgjKNZ2b^lReX;><(D(4>+#uWR9s4^>;DOImBZz(D%w$it<GM~T7
zXTP$LDf1r{X7x4`ONG@EGgVYoHQW@{99ESPS2xC1n_E<U_?*&;rNTakcYdzM!KU)L
z)F|@S^yeo1qr$9$N2+R0hyPJwWrVd;uM_`KVOB5aV{6wc{!w8pd$sFU3I9=H?pP}9
z%YRf@9hM4XivLH29XepCu(toGu=CRQzYk;oQDMsufdcg<ZQcZ5>dl>A5am@c&G?e(
zH*o4aT*qq&tP&eCZ(t<}8hr7Tv9rARp(~qfBbC2#9kem<5H8`>DDu0exucQ4N{ox7
zN&4~2!58ilaivO<xXjT_s;;i)gH3)_&Qb!+x?kMVA2kaeF|t%Qn~>P<m+0NszbjXg
z4>PU)V59Mn-R9w=&T@MDpvU?xK!T_IBrT!*EmGz!?w#i95iQOF70`PxsgGJrm_wfl
zw8k8g+vcf0wjpYOwuR}pMYy&_#kKuksj%$duKpX(<vUwL56NBYH5p1es=sv99(BAY
z>HI%XVfFgBuErlqm#a=Th%3I}jU9DOkaSN8bdMh~lEAy?<GL#(yO+OouL^X}#&u&{
zyO)l-cU*fWNP0G_d$t36zIApVRQGIt`A3C~Vc*^Jy0ad9{QbM@_MQAy;9a+dIPA9b
z<6i+hfLk}tD9%YIfom`5bzB$NfT<wG>x-%nAXob<xWaZoOZ<qLWd)tz&Z${eUe4?}
zsp`WJ$i`jcDIcXrMcUsEQxv*o;fu%mVQ5BD4z?%x9D=O$@oW-L(8KWlV|1Uo0*hu1
zoAz;E7InXo8?(Waevx=|_%D{OuWZmR7GM4WWrI%wHO`X9j?df%;PC@`U2LW`EKa1K
z+)0^T+|c%;Y*2?!qiB6f!M+zOEEZh@j`4jyZfss%gNXdW;CvRhC&N5J!{Nt+30+K~
zK`hY<Lj|azVeg?6)uAcxkr=_jxZ?qbn&Gh95nP;+KG;aUplA8<-Eeh0Q)&J{yuwIf
z(~w5oNP5tx=J?Nc3ZIKsM)V24bQ#!I<$sa<^`*vbv;_0HkL63oib&g&FO6<P;|il1
zPeze$!yM*gGb`MS`D|V_qeG<QDB#F?*XT&Y2wv*QXYX-f>gdW7wyopwH#NiC3Zs`S
z;~U3gXEkgGPyQeF?mQl<_x~TiExR#ej4{TT86s<ivX%@gNo8qI7-gv}Ns^*wEZHk-
zLNc<Yji``hEM+ZQ*_lZpAxfnpzhh7o!mD2I_vib2|8=gv&h2)dw{x!R+^+LHkGtR-
z|0j2?i>tbY`m#&oT*@1bDp-#ceDp8jbbb0*x)Ah0Xh>S{n-PY$xy<-l1&d7OTk9f}
z%u}A&Ja)4@;o*uUHv~9tJnbPr<+H)?_f#>jek#TFsGqsYC#qucjRVR7RjXy5sBWs3
zwkeez2J)FV9e2S<mRBz_sKPZ1B_6U@WO$~wY2;agewB!g2u2jEeFJk*w?>z%W}^*e
z$FS&QKM{+)&kk@27!Hf>E`KH$`;6fdX1~m{L*Qoz18QSDpR2skv|BA=dr8FF^||w=
zx|5By#<y!dZ`Apf*9G*{o#Uzxl&KH?9~JgLD(t_R3S<6YX!nkuo(}t&iH(VFgiacG
zx1w9bRKef{99dadSXfy(IXFPvU<fye2h0tF@*wzNa5w_V4;MlrP(m22ke~*dMN}9q
zAu1vxAto&;DJLVTAiGp<g_7z@xiu;Zs;f0L)l~Ma5ewGh-ndphd_CAeXYB<YnD$2f
z?VC3&GdQ=~V3VHVF5~TbHapg@*co_z_u|6c5aJ#UbEEC5dqW<ZARgn98fIZ8`wm*~
zGb-9Aw03`lwnbF2g|NM)DdE7*k^^G82cxnM${({fFSC)>x4T?sx7^y^*~R`qxxM`M
zBcxr&l8DD_pB_`$>lE*BoM7x6U*Wvk^TZJ|mjpA{Yn85=zNd~=oz|X%4rcH>9c+*J
zIUSet>CxxC>du=S2;Afnl<6N7RUf?HCd42%#J4YGyZwb7XD-}pxNsmloRD<!T;oM+
z#|R_O2y$p-LVqOQFDh#;I#^4b3!sB}CEAB2KB6QNB9d}_uR3O3jiz4x9}V`rrM>P&
zdrxP3`^WaiukCf8I$K`7?jL&H{GzM*Qy2ABH+8W4<?FYvKELf8?(698fBofMPv1cA
z(8qW0KfU|-`NPoXk0T>MDj*%}2;DH7pms_O*_{<CX;hR#%J%|`=tOC!#uobV%O7ki
zO1<*<97fYuaKr7m;$U&ZWTWES@ue4*?<<Mgkd{y$spQbrRGgOh^s>4;J4z=#sq%_;
zu;kv7^sCj0dRKHV>D)<vc5P?c!RC@X*J^K>=KG>H-o0L*W>uZMxAg9f#(Rg`N-k}@
zck}-M4W_;JG^<z=X07dH8cdHLY@rn6!FQ~abc&y0rzX$hFzpw7Vq!#1o>kU^RKMj3
z@Ypi~NBG+Ulujt_120MF+{d$rsou;(neV_$M^!%3%b>MP)WzJZYWiXV)^9)X>WI7n
zbw3nWlVT3Vdr*I+!9r)H!CK}<gIUC>&qjkejniNn{A|x0rlY~QVJt6_rEcZ$0W_F-
z(+o72(_$J8_HKd(TRcXC6;GzYnr5cKe2}NdXfT)cqcoV_6dEkpdlnkZK=$^Uh95Lo
z(=;@gK9)v<nNFs`_6!;xVjnJGq+F&uD|jx1L2i%UO@^##X)vwd(O|6KX)v*Q(_l@1
zm<Bs1b6!u-bCd>innZ)SeW$_hVq(O>aW*hsaF)Q4)o!fkPK>-~QM2f0DG9YZN_2n^
z4cKQC&?nhEk~E@Jbe!Xpm70YH8#$lmrmZ<G4YqkMG#K#@(qLC+qrnVFdKYww_jBq;
zwCM`ny<$17oNHd<PBY0ZO26{2(qNpL>)P}mS$@&n{7gR1!@7gvH0IVKhE0c#7sxI~
z_)DK;aNDmMb%EiPEJR(dE<vG>9%Fm)Cc16o9BHs&+~!rCEGElTwpQ}#Fo!U9WYE=Y
zceSe6L1$27H7ww9YUFwtOIG?g4R&^n2BXYEgE`HO24hg9(O}Qe%#Yo71;Eu`tq!%=
z13u&GTDv2BRvIj1HX4ixw@8SW#CG%t4Q4xu20J`Y8cY+Q!MsP<-xo2#N@k?N^l{FY
zm*?}9!~isy`wtq-n&U)H@v4lKotrz7LK)aKRh#BSgB5<K!G@>OU|-zR5;yf+QNOQV
zb@T4sd(FYlbEd(%#%VBC)B<R*JtG*WbrE`c?laS1Um43pU-+qJ{Gh=W|DeH|CedK|
zT(&eC?Cn3I!6>LC3Wub4*BA|^Pou%M&P;=ajnQCw?i@*a=`w=iLaPqLo7z$r!PC|C
zU9vB&Ie1IwvBOoIJX%}VDS0Xl7Q?yUEp7ytuxzJfjVWpx8tei<gB{kKmIia6(O{vI
zXt1^)G#Ea2TfIA@4}tL|<E~flRLr$juM*kPc|@~>(aC24G#G_>n8L8(@QIk<<9a-&
zcZ);Y3nlMsE|Q1uf042Q^vdxYK?e*w{6S;GY7y;TckWUHFi8B!VyDBCX|U53!ks~@
zJNKzhPlFwupux<4OM~5BG!Gg~dr|LPXs}N#r~4L4gJ~`59Ar`CWrAdyXB-a{!-<*C
zhXy-6qIV=)a}o`9ei98f!16a}usvfm*o)uOU|ZECTo0(+|I;+sRs!S2M{w+pAl_|Y
z=*W6GP$(GGah^doT3bZXZAmm?17!cl@Tba`v44XGGy6e<5&jh#>@<Z&gXu9JrO{w}
z#%M4wbLV@m9bOWiBPWvfdvH&t!S<LE-%yUB-Y>tXA|;>hZxqiR2>zJ{BTS;fe8y-n
zF!Mj5!M3L8nEw+R49r|!&s4^q%0r{U%;!skSxnGiPGd9}JL^m|n9rZ0!2}j*A>-ew
zFS6G`WEJ`S6&fstITy@qL8oq;lI`>h4Q2se<TO7TY|lbzuoIJLu&%#DgPG2s1{0W;
z23xmiDP~SI7-3o(EM_(u%vSwBMuQ!sFmI9k`!v|r|7U10pP6W|6QeYkx!%k)80-fP
zX5Kef8f@zyq`}tz1sd#N$}}_>evUMl150Yqd}uI77PlE_usxG#FsBI`%zTbC7?m0S
z$7wM0sWccqWi}cNKYto*&kQt})66uO(|l;KtqY^UoMxiIR8%CIT&nL*LxVLeoCfop
z0}ZCXP#Vl-j0Q7U5Di8jF-C)xjnZIuCevVyFaJwuu;i&Un3Uu+G??e_Xs|1zG+68?
z4YuMZ8mw?`G?>m94Th1Nod#<fqrnnqqrvQdLxXvb(qOgYG?+X<gO&g1X|T?iX=tz&
zKht1*^1r3Q8pdfbX03mj2D`y|bP^3Fu1TZ87MlSy*dtW$BpR$ApuvPWo4*1y7-R|!
z#yT?%c76^t7<e`sEM^J~mZa`!H$+}!K1ze7c*^K6oCe!Lqrt$E<1|>wC=IrFDh*aN
zL4)m?mIm8OqrueFXQ08_*!2J!jAs%Jb`hY#+CXkU(_rW3O@n#oPtagKe})EoG){v#
zxPPa?*cf5qF8~@$eJTy+`8yiy@w{lTyj=I6X)xh&8Z7(=4OTZD4c0w38VoA<dm2pr
zPtahzQ)w_dM(lJn*m6P2^fVZ5Dh<W}8l}O8)M+%>ffRrSi(_4$J1q^CJ5GajFOUY?
zKSqO{AEUu?i9cvCkue%9Zay@au+(%k*b$8d&|o*Gr@?OiZ5m7&F+Up2dv+R(MeZjW
zEO1&HENwa(jDGp=X)wCAe~1Rtl9-(abN^>FnD-oLFybsU7@gGYG#I1%uQZs(ng!5c
z0{{)iEHx7iM#nfogE6n2o(5xHGZPJ#K8Xg?^OzG2=Kc!}M*6pDFom^0(O`sMX)wCw
zGtyu_{}v7AO{2kl7C?issEpEJXJ(|qlIBQ*oskiDchsJs!T6`8!9pg{U_2Ugp~3pc
zXfS4pDKr>xmjN^wi&Dz8G#FZGt~A)4|27(oO=W>Jn7mv#ozg#}!DOY50~{8e$XbZf
zC=Euh^n(V|kqRfUESv@l`2Q^phF6^{4Yq5|WEu=Jl?KzE7Y#<gW@Z`;qA^z*%zJ_c
zTckKhqrr}i(O`=t0UAtvf(8QvG??co4aUD<8cbH|Z_;3N%V(#-beOirxQ)|bIg@BG
z9U2Xm^PL9snhy;Ik(*3|_5GFxGnJb{gQ=+gAsTFv_^&kB;6iCIk$;&6V_yC%4W|B`
z2HUk3puq@#iUx}rqrq4t=S_ntD@{*>nP@DK2D4xL6Aea~Ck=MzR~k&5MuTO{PJ@N6
zG3}a;1`GQ=4R(GGG?<4wjRvFsLW5DFM5dv^a;MT@b(3f?!p}5V=O_*4`&$}JoD{XL
zdag9s$0;;e=qL@ANu$BqztdpnMrp9Tze<Doj?rKS6ExW1bTpVejRs?c{h-0{01b9-
zf(Cp2NNf)!SbLSvAELp+exbokbt$vbV9L|cU|g^%G}tBN(u`3WjCT$+SQd>2+xrU*
zW-uKMrU%eqPE%<xPxVxQ24kH{gH`=Zg9%_JXfPqz&oo$5>USE<VBIJU_5^K9qroz;
z-ifE1UaVV*|4xJ1(`c}aQ5x*bC=Iq)qY$9M93GF+VCEGx8jNS02DA8u28$e}!8VW5
zVC}!qV9gUWnC&DQET!<vRvHbqqmz5l7!Ae*&|pniU31nk8qAtHnFiasa2l+0lm-*~
zPJ>yG(_pfbXs`mU7`Lf3*ftss<}ou3W-tv6<}^x!^|RDx%tV9PE|>;;JOd4OcM=VT
zm<J7J%B;Qs8mw$CG+6T#8tgPcgE37*gBkND{TnnG?vK!5VKf@7Bqm_)G#Hp!sA-G_
zqwk-M2D23(r@{Q$@zc^^J~SFEa$z)B0F4GC%|wH-{}~$0a(*<J4nTvQ|2+-1N^)iz
ztbUvZtN!aW*xujKV6guR8Z3J5G+4n*G?@J#p}{KWO@r;6pureXKht2EzoWsbXQjac
zX*8JT3^Z8&1PzwY7xJA3i~U<PSk)K}<~1t~<}pTt<&Dx{O*9%TV=gq<qiJX`y*bce
z!!#PqpPqM)G*}2ggYBP0gPom*2FoJOMuTOL=R$++6HX%kOoI&(9X+O_!4@x+2J@Ji
z22)=U4JI~~25Ta6W&ku8BWj!mV}MPj!G`8egAGm4U`=B*SlLt>j1iWh4%V9^4R&>A
z8ccH<8mxB`4VE<%4VExYgLVHA8f@rS8f?qYG}zGZXfW%4hX#Af?~fBSqURl>!Lk-c
zgAM&#G}zETpuq}oQ)w{kKTU&$j?rMHsEYq`8cYK9KN@V#G+5g&G}xB^2o2UXBMoLd
zPZ~_`e>B)Xp~1Y#qcm9CWE$)`nfE9_gXJT2>G>!$8mx$%i3Dgc4Y)47(03Ya3we|V
z`!tCLLjp8d_9PmNK}Z(}(_e=+CG&d!M1u|SUjI&meWlT0n((MuXt2D$LW5<~^L?km
zbbqG7)}eI)8ccI$8q9@8gXK-3!P<VJ!Q8Q??)=wjG?>#Q8cdfwL4#?G(qIn(8cY+-
zIYEQ9(P*$O6ExU9vIsvwgB47o!3;S+zmYE-r@_QKDq|!KpN!LBh6zojwU%?D!4zff
z02*w`nf)~Y4TeYjpuq+${xA);a+C%;GCK{X^y;RK^nz)yOFTURqcoW0Dhk%d7snUD
zz&$~ORh&;s_#F+lSavcEmN#D-EMbfWvz$zWC63cz(Z8p`f=6jEja2{*7A8^9muR?Z
z$j8DLpuukZo(4NQPJ<;@^w&zXjL~2$=f-HT{){CNlW8zzfCfv*%>%C*xc-9%GaseF
z_Rma%g-AS~kp?rGnFb3~>*F7#!JHX6rqE!=Cup#XG#c#06dKHEf(Cmzi3W4>mHhIZ
z25Xs_23xyu8f=w_gXR<(Z0j^M*hzo}yEc^u>o)t92CJAK4W>9B8jNGr&omf}?@!QR
z@xP<Nl*VZ=1RsqCJNz>Z_GOMVnCtPP8EG&v>B%(MtM4?J;}jZf?+i3p1)^XDjRxBZ
z9;3lF|3ezg<99Sz^;8<H5{#4`rNP9cX*8G#jRrHFkp|l{MuR<=9}Q;7KSqNg{sIm5
zWt0ZPkJDiHW~9LwxXpIDPocq@Xf&AR^fcJbzeIyMPocpIf2F}(02-`vk@O@QEQd5k
zgBkongWX^dy6NDrc9cegtw*N-G}sF&jRt!%MuVCCM1wifXs|=0G?@MLG?<7c?-zgu
z+fAdvyhmxUEBsH!X|N=Q+sR`znB8O=>={6VY01uu1}gzyf&HMtmVc+g3@2!?_gs>f
z=R||W{-D9I-)XSK*=ev9d=a<L$RFJ}MuP=-(rB>PV>B4oC=DjUHw_I&o<xJKolJxE
zO;3ZppN<B*571!LaT-kJ{|XIO!TA)-C8LLKzlMHtNUV>{MIVpuBd`8~6YRo^4&V`;
zVEu*)V8FFV6ja^E-cN>yQ8CGY!9^7BqenA9mI%tK857yvV)$DsxGbpI02#&5&!>P#
z^=b;b;Ds9Y2{q-yx0?y|sw2HM1fS!<mM=iZ3G6vk5#vg(HB?XmRV@w+Jzj}v$AN<|
z5dJ{$t>r>;R4B*{<wE3kH$#o&#W3^GbK9Fizs2yjUO~so!YpG^(UovvdVUj};Ast-
z^F<GUWI`Ho=$wAR>Ohbk4jhdIKh;O-*b6<!2?8L??NqTZSfMZyrvczo;ZY0_^k6D)
zKTa^6o@dcJ7`?qv7Zq(63sIvYY|Ie7xqPC+BA4~i3PEbVIPmU%Odl31faN_G$l6au
z`jX*sWcYD=lr0tZu>v?7pB^5Oj)elglra@K06<nG{?0zZcs#;_2>%L5WLOD%VW=EQ
zz)pk555P}w;LTO&J`x6iP%N;JZ|VX=cmxj><ckBCFG)vxL^2-ALlx-<+_hXd&pX(N
zoB>!HFLYQAYKw)sVEIh)-~w1kfjvTj%y)+hO{Xr08VcrMA$b@c3li!Jm5&Dt(I%nP
zsN7BJGWx{Dcn!1*7Sa^M7G=-(4Fj>IN-5&N-{@dN0ON97bc><PTT_HD7NS4}3DfhK
zo57$YfrfrDJ1Y0FN(B)jNPvX01uP(X7=1rqQ!bY+o-3X#!l8kT3KsQyuk-;2Hz9I&
zV4)=#o`!y?FP3L#pjZKkUjcy0sL<!+r6UyR3nGSao3kVarVoYPhQNeLqI(Tk3rTXN
zxtuko&^YqSy$*89@1Yi0nMif8n*%D2D37ogQowS`t>9^=*BBAOLJqzcOTI1efgaXG
zf%fUiYX+}y#lzKbfN+HpCM!163CmMKWz|6a)*Gh5zT)8;h9Wj*LY*<3dPH^$s#N|v
zskbql+IS8<Dnd)1=dQXyACAin14*L5)&;VgR-=tcY%T=$ycmIs5O!gb?lyTgU&^Kc
zd$DgZoEB6B;IlQ+!HNt8`?qd+gA?eCVe7>}bAa-xugRzI^<p^lC~P%QeoGBx1ct|!
z#A%BY@WntCNNnvmq#FeqMwNa;h9}X9E?a3>N`Yw;S(xyANfc>I4Kxpt#f`w;YpNL;
z!<rW&ah1X?hv!JAav#s-V#0E!Q~B~Jun`w};bEfcnj;90(4EzCJDfgX_oj)y&E0Yj
z1AUI?IF4C4LQ%&HZ@Y?N%Zp)as^(H4aVp>e{DzYU2R=RkYk9Wib&C2^7@(mbdkLWI
zl`G}xP2Q>t>|TLx!wH7m;qNs-y_Mr_Bjevzt-h)be@%xups|)MR!*XSiwKEL9g394
zvhqI@3C?8^CUd4#?u3$fKj6%F@gZ@JOPg~y1JqTMDdG!`%NVP3-yU8T!~cZ{(!)YK
z4bV-w@^4lO*#iC*4y_Q1X{wTb-3QCdg@^IMUWCeDt1`ixS&mR(gNATdDrkkhb?I}o
z9#qs0&%s1gu_J=iNRk_<@R0*<tFGpvH}}H;C+<9-dIyO!{G&)Ce%CPG?(1_dWAcU%
zRNni6VmwsnZGC~HT!bA7)f>ZKNUwe&7+tC^;7elbR2O)1Xg8ai!*D8RG8run$Lt}B
z4wF!K=^(E^9+9U<hol))ez3|n<tw2;-yL;=Jm=b31uv`O@~GwdMu30)VB*<_6eg=F
z5_vwP**L#n%^@r#jOD4Qk_vV*djNOY^Ij)Z*3vR|-v<(#QM&UTESoI}ox!uZln(2M
z6$+wk2@PJefdnzze)<E^DUt$X8U$4-is`Pv0#W5`8VZFZ^w0qJ^J?^&XAb4*2d{=<
zjuDr#y@2r$;pdJSj>uDC##p063}}}?_HSDSn=qW;Vqk_!(Cs_Xy0^ElTnXK8AXxPg
zAQ$=GedOZ0i(Xo5??>Tt!7jT8f#sQU^nva7?ez8;g!K~aMV-XNFK}l<MZZ#YK9B^|
zF05$89kqGC6Tf};{b0Y50lz&EKMu2Hn)=8*3P1*OCc_}X_nf#KmP2s@O&FdM3eVT$
zKKS?geppVUbd8OW6IbA@53$e_JTP&6usUQ*JQd30v?LVb!dPQ8j740qM=)UppQ$5t
zGFR-2-Pb|n*QbYpQrUL*3shE1vT0cC(N{)Po~Ex08_9(O7?&f2h<~vZP}UfnK=DWU
zI!zIDia{fgV<?3?LUAkHWiv#!e9|q|_i)8SEyy1E&qX==z4wNI<cTZ_WQZ#^YNdhT
znGbvgB)kY2Zh<wmBzai^SlXcIiZtD~x!!k3y6fRs(g(g+0=yCLiSOt8sLYyi(O0Ba
zOo3kIUYaVK8%P*?)|pNtf9KKuYV?XbFvD83<d;|=>b4OJZdKBb<VEWaAd@I(FFA?1
z;LlydLJL1bnQ#Igif6ZlI*jNG4n9*yWCo%yhQ9v*O(JY?-i}P#y5<5dxLQu#^8-Q+
zA@ezdzcY6w3xM>I`JXumDai^&P`uqSoDHOXu-Xf%U$_q|Lo`yup6wQ7&EPLm2{*}e
z7;&b6mOqD-((N*-<T}6YbR(79jlj}LNsPaU8O#cPLj|>`tCjYHvbINNB6trlppB{A
z-(nzYM=UQ>rDXS{+32HpJIHwLlnH>s)_p=)9oe@}SO~L{M-C^jE)s{^iA<?p%Vq}i
zbXxKjW1DXZPmovGdrxerp2b%ksh(vMY%1Vqim-yB3zYD#D_PfV-F@+-*2&CFNM%Og
zS6$%0uigySgBaGR%J@dU1apl@*WiT8OrBs<z5ya{5QdHYUdXmIHs4CL9(l*B9Z4rE
zun->XHR2NGm1xrKC4MAS4iUaK6f|=C(gz~>>vojkAj|@P*X{+B^(#-|O4j5(qQLd<
zXf{Quk)sam+Sd5oU!RzQl`GVj7ot;SZK4oT-yx~zF@pW%Har=%%^niOZQq0ugz#|7
zVdKNXI`r%t4=Wvbk==j|F{!~YL%@lG;t@vnT(L6HSai@Hfe6@TI}Oa1&r+#Fn09iR
zLw50FBVmkUxeW}|md(|OL-H8do5)JZ1YLnS3F&@$I5Na_XVnr6yj(f$&Pm}zr7>(O
znR<FqZxf6315uzD-U_L`FJlAQBPgL>v1l#FryTJ@AXF8;vTEaS)#vIO!@bXTTza;r
z`I!mo`M$l+EiXMk)co8IRqKGd*F>ykbE`ewj6U^XR0s1x)df7L^=w9sxD3~YqUtXU
z*AJ5r5%dk0n(MC&H{5to7kH_jxVq8Lwc*->x`)k;_x3hMqMA!rH=kVHbbobyxoZ=3
zZ?o6lmR8s13lEx$_cnF7w)R|VX>)CEcCBy5H$>tnS5S>_Tq$pcDIZX+S5Z`$+6($`
zt)H8lk>BbZUEgRC+7M*46`^e{fq94s(J*E*Aft7o*@o!3baN0@<d>DX=<wW^)mWHr
zOB*h_4Islbg<fq_d!_oVO*6V<)3*-IQ?K@@y);p4x6Em`Q+w$U-MOKq(>=Ovhgz4{
zsgA2H9XE`bf?8hT)n1xMw`;bv+Z(@G8~sN4Tj#BouJ}`LPDb}U5b7SeVBD=7-F;c8
z$I-aw)wh?g)jG|i->%I?$DHcjl+)QG)EOGxRt=OUr&~FvuTrSLR;c%DP8WPlH`e5B
zTJ&4!NFT88QytyMHS$)f_3cID0fY&Y;N|z4r{1LreZZTvDH=0b5V&i|tQLe%0qVf#
z{!h*(&>HNZC55Ag$n9&w7eyL$7~$}3MG)2uI-LG=a^#cW=|T5a)^>H&5e$oeE~Ey_
z;ZGP!Q%9{M4i%r~J-TK%vlUX+%6f#1psX3{p!;@-ez<zg(Bp?gPto7#%|cW}m;%c5
zFNk<S)_2|JEsM3?iW6a2B6M_x?1eNR&JNw9VyPHSFDC4n#XD0eBV-Q_q?*5ytSH$J
zq3FA{BNd~4cIn1EY4K`Io}kE*Z(7QIuQrGX$Ry_{$-|#UF`c^`Wff$ue|e*Om2};J
z*ftSWyPy?jau!t=HScW?RT8-==4jt0pr3fPmvh&Xfm8aA*WZ%gb>ef<*I2k6KFjfK
zI}Dq5`DJm4)SeuF<+S$lDAkkSIDe(VzRK@+Oh43^6QFvpw>kUd*Kb^_GJdAPT$Ntd
z)m+>2@a*dQAA6eapB%A$aPfNQBpU4g>07ocgFk4n+QR%1Zc_pQC&s{G6|NZtk*AC-
zc9YMzD3WJ#ryqymaKI!PaVvAC#}I^0v6|Vx>tAo?BNpv#<|}!#^Qkp9hjrf(-dOT_
zZsD?(QDBZIl@xbK!y}OZZEwP(BLZrU+WtCAKU3k>DXiup2AemShw5h)?GM}Cunxbp
zt4QPJ1?`mO`9>?{WZmV@vXV8pA0}N9aR)IgFrwSl#j!T4at>?;Ex~9fUg{cpQOKd2
zef0@eIlFJILf2s^zks~;U?GoBd+uWnWq+2}oE!I(3&LX0?v4sgi1t00oP1M7AS^D2
zUD(s159`6oiNI|&>Waa-flZY1HTb-S_?Mh}G9;|QmwnJ}$$4SS7f;q=%(d<S)@LKd
z8lZM1VFn&!Z&QhTCR+FLsm&l{a>mQN65IQC5M-un@1AV5d+@QVBl-T9+v~CWrCo>^
z#RwO29@~AjjeF$0meVhdQdKBwyADy<(-@t;_Upz1-cv;Dpkk$i1(&-xi_3YWo18T=
zxgUOZ19wUHCo0$XZhRjm(&FdvMCEPSdrRw=yBsQB>5Frm=?d3$_q-!iRvsgP&U1@z
zSAq7xtzxLGg(rlspABf=>Uu}SRP1x<vi1}oOn$w;^FW!Q$jc)|PEVwdHe*|w99mAi
zEm!pG9pXApImZ3X=)zrPkvx*Tw<+k>rgOp!=<}^B?}!PP1;W$TY}Z|k=0xvTZa0q@
zxpGxZxy*F)d9Nsn+&!La(o32cPX&6iB6-fLx*Y#he)4V3$mYHB{uSz`{f}BhPrfVE
z_qMXJiaP8Dd8%^i=#7Zz>oHO7HK3)6yX9HyIjmMZSiOJaD&s?-n}WlIY!Ae)Y*x6l
zB@6%YQOOf7=n`pJP41GB%hApBb_6Er7<!p});1sYWt?SjI<&ap+a59Gy6OPsh;>mM
zEzItBDr0Pv>LN8=a3cEdF>IIH{8tGc_LR29wnpG$5HGQOZAm09J0%cH^kFY>ndeun
z!wkf}!`_eRgTEMg7c7>P-Np$egRQ*t#h>eWX<Zkl-lnqeP%7~?8rsw!onElq*WQ2e
z!I4<eIPXV-zLbrzS%wNhf&Qw+_Ggb?zk+(}4RAe`f_DCGLL;n2>RqYl+@#~Mj2ntH
zC65F;dWeXOSVgXXA{*$mHAw!8Ia|?kGHQQ!+>$jHQD@5Od=L1)06z*WUgqz$0Tg8X
z!XUFm^o~JrN?Db(34*k9_Yn+}j+dB!OzB>obBkIH;$@uK5GD+U8}F?WmE(gi)6;Q?
zsFB_T-RM)UtC659TT;qdLgZYEVGNZmsPxNb+iV}?5ZTTNQOQ@{Y_l}w66Qpr%41m%
z8;0^r_8XSSy)53uU+)k#Sd$pUd@$eAm(Ks0b&@7p62b3F2&vO*Tl4-RXY!)=Yr-1E
z){Z>3*FSJzKohl>vR*Snf8U9uxGM!%o%LB&{LwW$pRFrQyCkZSIa}iy%wFpr>hg~a
zT9K&lzi591ePx{Fv)}^NeQTwBIR#D~VqWEVPMR*P7^}3+S0D9w>$QgHYY`&X_5_&i
zc$iiB!8`Q&fmLr9$R*KtR8p_&r)vpiOS+kV>qvfWDzzj2%k%W)^*49R#P97--Z9ws
z?3Pv8Vy-au`l74~7>7%;`5|xr2w(M-cIPs!K%8FE!LYPf{npazhw96CywhLG${f6$
zyt^nxLFFcw&D!^1O_n=}cT-R|P98tBtI5{zUN^n1#I{n_Vo9gWhaxTOm-&_Zg^4VG
zsB+F-MRG*5Q!FH*I$qMg*rC~`W!rtstEG+)k(c_G9?otE?RCE42k#HMm#rC2Tt;O_
zeXzLqp#8&Am()_@PUD&!#>g8-29OkAm9R`s+vQK2=r4Xgc!A@K)-s2ik_<cchu!2!
z=-VTcEy#H&BZVi2<TcEJg4ksgh}}GVbgQlz-#G_+=aq-;P0R4_qBF82&OY~cXlk*q
zP)dDDmURxa-^wE8T>MVQ)NPkh$<CS@!P_bQcC4Bh%!QpL=SjCiUER%#tajxYSr~;z
zLM<Tv&N=2E<suGTw-ArqmT_oEE}WWe(R2568T?UN)LtD+g&gHl=_gAxFZy?CZS>)?
z|0Zw!SYmbZNQpM8n7|1aEZ?U6(6K6%j~p-CW3XwXfbyBw1BtjxdirmJmE!NNNOnBv
zBQMGNkes<VzV_?EvgC;Bn@=2_%{OgRZGH4Sv}Ku}ytCC>sgw1h!qGOadut;Se3UMD
z_`~(sYy_*0X4Lf7-g)2MX|oJm@ZjoQ)|^W{NZ*qU`Lc>x)i#>t!gfmh9|x48Bi}d%
zM=JI{Qpi3e{ua5uv}G`QSrEFk+e1ol&698Ucn_3#9z9Nco<R@YAKiJ_ksJF0dM~x`
z(#}3>O`{jQ56d6RM)wPx&2Gz8b}k|Xa5kO5qFi=<u+=&7)c;oY%e(f@C9+Zu5sgNQ
zN~aY<xO4jAq?$)mA>T52_gV4BzKuu77iCu4uzrZ#@}O&-(~0NtOF5GF40jzgGOck4
zzL4T@sXJ@?z7$8p9>|*dH;t=QZL5}kylE+T=L@fOlf3GuH5`Xudn{XZDB{VnGFzmh
zOTwmyQQ^nambR2bg)1aPxZk+Q8DBW}a8*0(mUD?}%e%|9g9^|3_a;Nc`*v`@ZqL;E
zQgzL!A!$uh?%LcF>$zL{vfn<i0-yVQx@!4S6N;wZGLUT|he^@am1-~AB~R`IR+PtH
zrv_kahF|Ph^QiV*rf3PyMXe~W=ERnvcli&8UrMdvZsi^sl-YYq_if9kfm>@V2qs?+
z^K>>id!PQc+Qqi5;&kofk!^HEr@wu2{$gpv;7wpl+I1n}lyxG3UWveDwVk`uZbaeq
z$H&BvUZ-z6=|jQ^D@5JM>)rT{8!hp6JD_DKbH^>{vFoxV`=#Ob$U358(MhzpyK0g9
z>Q47HtRA?XItt$IYm<(ui2tC$-mmpoC+=Bx#$$`sI1P3g?rGTR>Al@^kNBB=G#U){
z%+n<43>V)S%g!@)01d|PaUkQ2qxdcxaWCg2uaiYy66?K=v3hUt^m5hq_O$Z$vf6c;
z-`j8JCU<Y|bF4mrNnXB1-l2mV&Wih7O!A35?ipg`b6I>{c#+Q)ZQpot_h?q%tKM3%
zR=zhnM|^K-J0*+zfeL+7to-hI`?<jpX+?fjTm3Rw{mJ6~Rvx|&to$Fm_sdW6FFo#8
zc-;SKl45a@f3<c%RHuK1cYumWz_X%&W-IU7@Br%0WsRKyudL1<W<C2N>FhO)vmKph
z-zIs!&N%ztO0tLb+|Hy?1<Z!9?n2DD-I%pw3YZd20sAx<a9{fzSEk~}r1M*nXbKo%
zoehQ#P{0gm3fPImninbp8Nq=b;^#m<K~fBXqQxH2U4iiWKqO)<ij9u#faYTLz{SNu
zCyxh7ybcz-9i)2EW9flFgBoVp;y~qk&Xwt0E3O7>NO-OO9Bk;bOqee8g!V|t@~eRx
zUIz{-fryll9f(lQ4WZ^&C2<mAYT=>ld_v@32LcM%N)LM8*MSFo&h9@D=6pcZ>c9on
zj4=J9A$wkjDFX_adaz^t1xxYJ6UE_;<O@ETZl`@Ti4ws|TEPfsru7@>l-Vv?WP}H>
zMLh2hzqEl6<g6KTF@(P&a9jZ+gvUvoxr~Uo^I71EMC5JD2nCM_TR;J$1fo7OrhE>`
zyy%&JAhP(XK*oWn@OzOfYa+t{1uTYTvjj&$eN?~qg_7b+pU6@5#mAm1gDRahQEUvG
zHUt6+SRGsRrHo6>Y?mqhmwH|weX${0VSn@(0!CLHJ@DG22r+V*u>tX(Ee6pM1Snt}
zSuw_laGu;4E)~${OfJ}N%@OCAjp8v(C8ST5p@;^Lr5i3BJrGP(j^#yM`0S&}&mOCh
zK|--#3C73BMA$%;=@fmhFzCgSeXb}@C}8>nbc#AxbOvK(*{{f-h}+Z<upv24uq1A?
zPJ9__yuM0|AwYu(_yaUp-_=nX>@Glqm0TL7!4CQYG*~f>28#q}u-%cPG#I-NK!e55
zXfRKJ1}h04rNLBu-by6-WFb5bCIx&sLrhLGFHSnEb9F!K)j*Zd;N4dvPecJ4-epNd
zM9I}F0x{9-$>Ea8ammRWj*nbT>^grnD>=2x{YF>v0P83XwoLolovgE?G}sAOfChWf
zIZA_tF9B$<fKeLkgd;$MRnTZK&?pV&KT3nK+W<7!0~!q$(|)5>#cz}bV>btAuw)ty
z_OkG154-Ou4fbU#K!b(V9UknuwZZ%7*Q`X&_eVw!rtn#9tz4X9Q?fkMDTQ0=WJahF
zM`J>W<3X@rDpUBDo9d}H?0EU}saWLogoaeXlI3uz+Y%=oGeWIJuf;82!N`?#Ti);B
zhW6VQC061a(^TIaI&&;dhywvCP1BUZHxz7Gb0}f?9yhJhbc6j{g$Y}=8xz<(PHs9h
za_7CMk)YI_qdIrQo$i=4ZeJOHXV1n&o^6hcIPPky67@IUJ=q1?dSBfLP{7phIUc&_
z<af{c+P#yd_gvrHJI#?nl$xFf^F<zVrn8i3ynD0@WL=@fUXXd|P3C2eERs~#m5o{P
zhq4m=vaVkHnFfp9$Y^~y{leF)fC3g#%Jh&Un=F-`zcD+P0|6yw7hlVc*qS{`gKf-y
zd@Z}$FT0Fmlm;V9J*X*t@I3NCYhyNGgw?!xKsl82P%5YGezuQ8P7gA>H(#YIGF!m_
z)7zNSC&l#6FMFVrfl|tBojby6eeFJ@HR61#-2=S+yUcZuWD~c(T)UV92^z{hTQ8#c
zDB+^2Z64m9Jrc!VW-F7pfk`^=8g3O@P!M@N_i<$|hqN%*B@(79$aWni>XMs9%xj^N
zR~jJ|%TUUkc|P)aIDY{(mpttC++%RTn*%7GCZxGezN~cts?17^(?Z`r-|%|=swR|H
z8FIIDfr+$$k$>*?ZWNDaK@L@iL6>Yfgw$!u-+7(9-ydbxRCpx2@NhQL*yS-I>hUqo
zN2i+*N28D@j2@jQKgtSxM8QAG4=g&VTj<JJu%qm;qhRp|Y*9L{=&Y{oMb4s2*AW-8
z^G_KS1y(;&xK?x~svzO|NbxqK;-I0T)k{ilTH~X#OT^%%(f*}j^d;%5O1y@aCcBix
z`9I1vDphbPb?|=-b1Eww5-rU}nU$4hN|y&?iz=H+?^hOmOfAX|EPtO``osnGjPr?I
z+2iL%rR}TAt2oQs%216i$mZ+iN&ZCzoI)>}O2VSb%3Yp*3C!=jUi>ZUNv3WAT{Egz
z7un~6W*#opD}DM|w}R^bn0wO`rabZxk<5##K$Ihf%bv7SpRfj?*}19)jh>)n3fsgg
zPi8;mE4PxmQMqhWxr|MfP(X<Ys_LCTU<IKCd#XO!SIQ5gF8Upo5UyEnQxk4q2@4SB
zS&LCANBdb<tI1Ta4j4giK#68v6W-}svquJ4MnrXcY8L0!3}mCXZ>q6gUSo9Qc~JZ_
zX$DRFUSZP*!p4`L9kQvl`TAV1>bX;St!q#1X|6h=Or86tI!~KAuYfwA|IuJ8ZQB&j
zwkh9iQ+?95y0`7Wn+EIax_Yzg+LNvuy<N9JZ&H`ON!$G9j_sR!XWwMrd~^TFn+Lsb
z9)h~bOS|(ocNf}rKR(-Ce6zdsNq2c~_ft?$<<g$&%{|X-duq@2)ZgrBeA3h0+tUi_
zr7rDl+uZxgwzuPK@9UfYH8j|{{{P1iu=3v_U{8NRz<w`)dHov#SkonkF$9cq+2LZ$
zwU(G;r%0Bmq_B5aY~15)LgI32;@n%}PJS1_S`!IV5U}L`^9Weq^Zf4G;?K3Y@9G}+
z)|Y;%&o67puWxL9*H~85+}+$v9c(VGYAG3Lt$ao)|4e!Efm+kh_P*g|b?eKw9k1HI
zzWN^mCbTIl{dIMc;Wgv(tUGUNQ}&fcZ@PcCr!m9fO-uRxdv9BF-8s;kvoreJih`v~
zo@8gf@2I%4@$%*eSs&iir5$R0^5Fibx0HOp5%iXv?9cBztFM_n&3W+k)BW1d5nCSS
z41XP<zG;2>aB(s(9kV!vz{IXJj)2)rM!>++AYie-LBMv;j(}~RK)_51mA@ijfwLlD
z4Rb@l%;T2NhJYO#N5B{W1Z>}Q2-s8J9|+j~x)~6#V;C9&mN$WbVa5<JpUDVV-OLEs
z2Bgav0%lD^z`#=wFn8@)5U|Zt5wN;x5U@>S2pDEE0=9cP1nlm#2pH4v5HP0i2$=A^
z5wN;HjDT@}N5Cv6Az%#O5wLU&W;z6nJR<_eF$)6rc@zN?nHB+CIu`^C_XiQM$k`CE
z%`+olk^d?J#<Va5OmmJ1SpU2bFxxQ%tYQ`f?AY88FgFDn0tTCcfYHqX0Xsh%0>&Uq
zL%<w<AYe9=5HPEGB4F|W0%kRefEDl-&4_?)0uV59cfO+Y00Oq}2Lh%$1p#BwRBf0O
z0v7)r0Ry@a8?TFAb1m<-_!?ISda-Z>tYI7hD-v7)0=E122w2-F0>+`5{sRHS{6N6!
zCLv%~xNK+$nB6}@z+zAd6h8^^k}(7fM?=62XGXxzj3Hp!?i>kvE50LOq-hbbh^Yt|
zVFCfGlb9X>3kDD{E5>ONuzfTH%ySX~R{aA3Go>M5-qRsq-U~p$DyBog<mZQgxy+7$
zIZPm6`+tjo#m)x-Q<@tB_L#+G!3fxjMV&=c5U~C8LBL!_5it2l2pC}!0#@)>5U|~2
z2w2tc5irBQgMb<SClN4%9|+j#e+2<^sh}ZX>dX!_1Z?*h0!BA80=D~C1dQ%y1nl%A
z1k8I30i*jz2$*4t&i;RbfYD7s!1m7<0W+UKz>bX}U|(2fLcqNL6avOhL%^2*O$6*b
zb1ogTIi0#qO7^i|5HNGPMaSlcfNfkT0(Ni`0@m<%5HP*@BVg>)B47%OmV)PmfSsNe
z0Xsh%0%o)PKZbxEs9@eA@b?ig!~bUxFz=ZVu!Exr*nahy5wJx+5U~BZb49=m{~!XU
z_!khc12NMeV5W0K!1l4Ey3GdxGiM>rfPn3ugn%8JK*09T5do`YHvQuW*#4;qm}$&x
z2$<>o5wP7eAYjL4M!=5E2LUr&7y@=|CIl=?S)#$EI$;_FEMnmZ7;z2=*rtUdVAf*@
z*yaTxV8a*35U`R_1k7<V0`|4-zXSo3oQi;5lb8kpTl6~wEOHb9ix@?~q<=!d;^&5d
zX^bIYF%q*QU=3pknAdCw*n!_5V63AE*p6`oObS52O8@f+SbO+12$=NG2w0fhZxOKF
zYRUJ$Ngeq1P4izyzydfOCLv%LMj8T!(Et#zGpO!K2pAbaz!*52+W-WNehLD{G&2IG
zHwOfaZZ-rgd<p`Vu-wzGkGyFAC;}GaDYI$e2-tQS0(M?v904mDMZlP*B4Df&2pG`Q
zCMJCG$z_ilt}h1?nB6Ta?G4h;8`2Q4oHa8bVEOD@00ay?2?6r~5U_lpA8j!s2Tz3?
zc!k@GV4Ui13irGbFoOF80_Oc^5U_%A1niLJcLa<+pEtY;K)^6l5wNwtL%_V|g@EP$
zihv1>BVfmWgMf9;4FRi0{vH8a{wEMH@KgkBFb^{w0@jCYnH~X?or-|H;G!X5%V`Lh
zRT6-Jg?KN^o)!Vi{)Y(I)-eRkdkg`~#{WRT7{?H>koh2Bv69mvVDE4XK)|j~kAOx0
zZ3OHy|NIaz!t4l`m+Vgnn9sBbnEZ4I7;)L}5io+*A40$i#AipqPX03lj4%fT%y||B
zj37BX0`}GI4<cY^Bxgdv1{o$0urpfoMZm64Lcp}=hJc;?1p&MGZzEuLwSGdtj{k~)
z5thw}fU*5s2pB630b^SL0_LSWihwcCh=9e+5dmYC!MHoBPat66X%R5qNeEaFZXO8O
z8S$SGup|Hh^HNNj76H4gI9CMh#(x_E=A*no1T0N9oS^v65U^CqaRe+-aTEa~D*iyg
zN+kag0><_KTLg@%vM>aUe<}i|{>KooK-^prFxCkK%u|6vL%?ju5HL>(00F~HAYiNj
z0=8%r0Rt}>0ZWzqn+O<T+3X0I2GiDXhH(V!?j!_EgNA_J{f>aK%m)Drl${>}Mv<L@
zfMu!tAq32G$*%|)WuXWd@?S>4&Mf;C0aN;pfYoaO2-xvIg@A>RAz)q-^G3ij6{knQ
zT5$_R!1}d*LcosC69K#ND*}e0Az&%9BVaH!(}QXRsbI|Kh+H6F2wqg^d~=Zbr7)jb
z=hf3};Tv1uMxHw3eWjjpCow;guD^|7$Vvdyd2eO~33|@~0dpBcz*>Jnz*?e^(;#3m
zQxUM5NeGzfv<R5bZxOK0n5cD?b49@JPC>u|M-eb(8UptGI|61mih$+*RRqju3<1-a
z6#)~WAz=BuKM*ie00G-Ffq>ON65CC2*IwoQhY+wczaU^Hzd^txrbEEWd8Z&?dyz}i
zM-eda91yT%8Ulv;1p(VU9Rj8cAYjL)B48e?NB{!HG!+4R@-qU~fSy3WT6lj(!0Jff
z5ikwrQ3MQxwxJ<l=@9Qkm!_(9D^0&6V25c4So$ae<~E9eVdOjk1Z<zz7y`DxjD~<Q
zj3Z#?zaU_HMiDU3C<2!73j$U@fq>aeLcn4QzZlXGu<e~AOk)Tb1Au_lVRiS@jUixG
z<jDw_;ldHH_E7|k`8xt;HI9H`Cm~>3S}|r*5il4H0VB+efbmR&fE^n}z{o81=`$f<
zHVa0;yk<ba(kCHcZ1X_C^v<kV00LGr7X+++3IgT=AYcsBAYelL3I7HHCi_Pauwyg?
ztSE+S?g$tivryd_0yfe&8v<s78ArgZ*-fWKz`SV)7;<3<7#9rzyEqd9#`<Rvu=Vpp
zz%&2^jPQE|EL&n`1gvr#0ZaSq2-vRQAz+aI3Iy!b+!3(cnGmqUe*^(5pEm-=KY@Vd
z3;v9NG5!t#3!W7L)2AU|j58o$?h^=@JKy>52$<R5LcpGkAz<rgMZgGS2$<U_0#-*u
zz|!Y}fSs8J0n?oW0@hDMz`V)OIU-=^0R(LEBm`{pGzi#T+-wL~I&m%tn22y3@n;0A
zkLXC44gtd~6agd5jDW3L5CSGV6#=Uwa;5_aSiaym0+z=+83F5?I|9}>fq>PGAz++S
z5wLt-00GmTBLa3{W(16J8U(Cs5(0L2CIrl490BY6BM4aEuLv0T&j?uG?+`Gne+L0O
z$L~!qxRVSWL%{AX3<2x=w-B(te}I7H(oaRer2jMm7C450`Ju}G%Mq~Gg8xIn=8S+{
z`2_*v{*NGF$ulBg2j_`^>HZG^`zHvP2XPbuYn_aMB@uZK0|=NqQkx8Gq9I@f<V-k#
zfHA<e$*AuL*hb>d2pAkdz+A==FbRgNTX`sL8UkiS<n{Oo0n6r1`i_9zry*dB@bFm>
zFt@*gfMt+j-w`lvqVVw%jq-CRZNtAldprE{{W`QZfPgX1jDW48Az*G(5U|#t5HL-w
zsV09C4FPkQgn(%iryyYWX$TnW1OnDdL%=ppAYdkB5nccR^O%Hy8L)qTBQk-2@plAb
zBn`^O5io-|00CP+Cj{)?a$5iagO4F#dm%p%u+DXV7y%O<MZoN5N5I5i-RzNCFaj3J
zQ_eMtfF-L^u$$O%d_gZj69`z!`J}ktAz*RKCnI24^F_eo#t^XelM%4^aRf~0_Xrqt
z6amXq1rRVkiM+nVYSkg1b?g8F762e%TbY*nQXqzq!!NtNwi@bh3thaO+MmF)oLj)U
z(1@D1bsPbUujt<)(KLpDb(|eTz~26ZfXM;~SX@TzdDVfq9|+i500Gn2ni&D(m8h8!
z0oyto0@e#2MZoOa*ry<1J0}pZKpFzJdkO-!bpio<F$n?N!9EEAYnmAW6J0n0wnF5+
z#uNl>#WV=m9smKmG8F-PsqrfUc7A>c*pm4mV1BAUBVf;9e*ys${T%`(K8}FZ!)OSY
z-rNx|2?qGJj9?z9aAIr7*~PBMy=O$g5~L<0V1?fiF#9P8n9&Rf*m*?3Vj2RrgLMo6
z)A@%8*wNo1VEI!Kuv9QoViW;OkP_Dj*i}A;fEi7LfPvQ@eJxaBIEH{_{(^w<_D7wp
zvD>A0;A+%<<uJN!FR*>pudNU4+0)qa+{pqwhJeBT76P_+905z55dnJv!s}^HLBPsr
z2$;q62w1{jLcr{&AYl2wB49@W1dQw{H3<RBB90+o8owZ5@p-6G1nlrQ0(KKXz*@*O
z1gvZf0mJ`<fSJ<}u!Exr7=C&L?1~0&!*>MCV-x|~$6q#%fW<J}P8vhNY$qdNp#TC_
zuzX$!STgtu*AE0t{5t|>FoA$ob4gy969Oju0|A44N5JA|N5BSP5wXnjN2SIPFxN#i
z1dKX{fU%7tU~RBz5U|Wi2-u>@2w3m*2w2;62v{b7fHjXJV3Pl*5U}dL$^mLNA(87D
z7}TnXZl}lQ(4${)pwsb)=R~pRI3%YAnw<gtoC<oo4>g#w+Jef*F1uJ5&&Mw--bV!4
z$MOr~p#@Zt#g&+JJRdk!t(}ShAcFxwk0Qe{vY_}1cmf?Zfx>r2106<%+TwU^0ON}c
zZPY|EVA;TUu`hT&IV^Y>FBC=(9mWZON&LN<Xf-OdDW7NLP`^kz7Ve%0w<QT3)<6nl
zxx(~?Z^|OsGz4960<T06@l;G78D5eLIx7ovPeFg7N58b^|3HuCuM~QF7}jIY&yvbj
z4@RG<MECZKnc0KdV+4+92-=cSUS{B0Eb;>$>Y@*>#R+!mp{0-Th^7iHJpy`2h6eZZ
zX=p9x)<?G=7BaXkh>u0bV0jqud;?UzZxv|1+oC2%_znhfgGnf{euMyEc2)Aq;{=59
zq9($8Yw+y;JZM`yG!CovoC*`BhZ!8<Q@|mgNJ(5ig7U=)0Kk!r23n3Dl1>Eyuvj`(
z;ByMU9Z|55icH3fG1_BIa7YGyWJoGzq#;P~@oni2eWWcO!LE;vqr!?R(djs391(lK
z3>=S>y+*&>6(_)MF9c|6?R2PGJfbWJV~gbxc!zSWfa{UCjOigR{Ybequ5T$QFo|<e
zT_%wNYrud90I-e3l|#hbwdZS~gY?OPyK~`(^Wb1CmQ7eFyGkye3}5U3F2p0k@Iun>
zkS_F4yHq*0JeAa7Ocz->9xHfALr@K;xQ2vY93*_`9TbcQso{luiQMfNAW|G{OAk>a
zamnEX^~fMSBBq_lTSNy*F%%dia5E6OU2tj;BDVmR=LJdZIf+f1%4bVLG@4?NRH%53
z20W14Eryi<MT{iItac7!DT-lDAaMGoi4Dj@a{+M-%QHxU7Gb2E-ocU$P{kD38OXZE
zT;5`J4q<xE<>_KBIF1B5h#pxOLRQ$bLP!C>q%nqH7m8!VAq%iPN&~!5!)3#GoohAl
zkdO`fI2A_h3bs7>v3F}ah{$GnXaim>odjtx1$D=8B~;^jOd+*+;YI>y9Db!?HJkym
zVy(jp=flv0xga9~_d!#kb?N*;ri&9zK@5g6hjL-g6yA6&Yj!1E=>y-YJ3?-B5L=vq
z-3z5)LqRbfh>$(1%wfqjEaG!6h_7aa2pJ@YM+K!qtd8tB>4<6|ZfB%N9WoOVAaeFq
zgGM$V5oWB>wj)8hO%cc5@wLZ50Fv%ForcH?#m_N{Juz&#7_c~$Q<rzg8WL*}hAo}I
z9potXoXqlZ0Cb1M7L5~(P#5fcX6zWWq=Oy}Cb8+!LwwZ*kDJ2xui)8DTy-Z#5`u+>
zk=O?5VC;No?*SMXf^Nr%AL23Vz?s>R*i>rP=|jZQ@t`U?Sdt;KC>P|52WT@z6B2(r
zg-;I8u1AJ9Q264AoP#m^4Op#rRmejhEi3^jEKH@JY&rr)3vETJ5xK+2pxl@hZH{8T
z^cIPfgXK`jazlj=@A>pd2lpL?cGE!ym+Qk}tcvtlcXjkZ3hX#WE1iHH*-L=95?MMc
z*0aU3Y2C3KCa-rTFUq~mYP4cQU@%6Hq;0<qsr#PK7-tn4!fio?`jQ~*&#nFF(Z*PC
z7#aNq@1Re%cBR6qD1a}71B}1J&(TBB-4X@@?G%_<Ey$P*s_2KcQ?@n6sH9b)lkQ^D
ziI8JN%t5&N9@35;f}=j(>`*NF<{h(F5J+zBiuD&xd{!3{!9rOX&<%8Em-Lao7@?0x
zp>!c)F7)e%ab}hzwuluxplwJwB4-1IUuHYH(P@7*g<FJP&E^Hv;;7MjIUy}R2*4!{
zg-F-pg$4<H!`04jSLzxX5{Hi-XA9rt{tW$`#C60#U?_dZ2#37&J%w$IRK8?h4~KhP
z3Rph)QBbZap*G#7`8kUsy;N~7`XFH!%WYN*1Ln?<O}i@5Tj7V-hI((iw^bhx)J1<^
z?6zSX8cfy_!JlFzL9{dYU5H8_NT?Si2m_XzqXr#D57D}Cv`}f8J`~bN5-3vI&_Pgv
zP<K5G##|2*Y&LYdOz-p%yPM1H_(}O~!8?{YUXYfmgj?Jd>mx03#j<_VLmtPl`347e
zkOSYogLa!9&D_ReaAc#OsZfKuK-E35IC{=#5`RPtBo1#`OTV}uE7U*|IHmyp07q<5
z4n<P=j#Z=S2F3R>zyzrL0e3M5X=@@emhxCpY<S?vHR|Td!0=``<m_jddp*jP=-y8T
zso~HKA%64&g7*{v8Ii{qw`n9T^3o3N4)UqSbS`m2fzFgOHsSgX$Gz-GtnUn%^+;%6
z0(Su^FnI9TFp13qi`)^2*?JFkJcb{j`aF)?LvN!Sb_rk%H+4|gm4?`_higF7AimZ9
zl^IuhLIPy7*4k(wkG+FN08jW4=x(UYwutz65=1S6+oS&+$BT8VgV*J6SK+7!iSY!&
zE{g3`-djqM?lEO&s7y+vyE;ro_^NXh#i$gUvS)8c24O<h?{WpuxLrrt<*-6}M9!*Q
z%R+jcMpJgJTJ&IyStIq@4Hf9Ii;AxGVj~)Z2{3uxVJcs5EhvZrlfzv^4_Yp21a;E|
zHRf7IR^6gUA{<siznyoLe}+C7%w1#(eNJ5ynCfA!VNqNkrB8*nW8_^|LJ7f~xdhph
zFql=~tww_TYiE{CpO7n*+2q1lzypXocy_G;K3|+>;};m4lUAux1~&Xwa12|5x^Zo-
z0_oju`Z^ywUY&jgUu6}ZRRVF1>Ixt5agG<SGZM97wbx9@MvC-mZ=sxn6oeYwqA?fL
zMY2r9fV<PIxivPF9yxk4j8hGJWF&>RGz^Le7PAx<xkE*Y$qIej?mN7k%od9-zzLkK
zB;COaeId%cf|%oDrS64*-d9MCbkHj%zF(RNmFwwOA%27cq9;S@5<3R8PUVJvoWSB0
z>UKolFnU#({OWirxRehThXp^AEfR$Q3CqxZg3_N;P$hiO4k}-+fndU?;x=dFB`(~q
zL;)^^+r#8@sD3_H2rvWRd59;F4DNb@%@vzO>sE<9r$2E4yV?(zav*h8M+00vNQJ`;
zQIX0on~GvUqP|A)2c)hNA)b9uDb~`5S!&2FdW_dZcy;qWQ}^wdz3u89!JI*9OZfMS
zuWH7qH!soJySS>U=94CB1N}-7lE6vfW!whgT=D4ip$lB1+@&>YTlUuO3gA`5LWk~)
z8w8naKQLeFT6=Ewv+lsU5diy&Y_7kIYPhnuA@NefwdRIfsK&JB)lI}kHn+xy&FGv5
zjrn_<icwAF4;l-bQQ5;y&rr>^!_71_tfjfRxox<m=Rs5DrDpQ#)>7A&HxHUdnp;2Z
zZEZwRIn=24S5v;OZss~g!5UK^?|p$jMXh~6WizHMIn^c;{X*mv6?Lk)8Q&6#d)bC+
zl{)oO>f6heLT#^6fcMpo`_`u1Lf!MN>CPw`)&U<y!#YOMFg(PKhKBhAXc(2#e-sVt
zd^(DTbpmLZe@h23y2C4{(_QFwsM_n3-#Xl*-voSn<9_OOq*~`?wXVdRu3KuIY0=$2
zE!`ve(H$4mdLN&9^Sb3tk1<nK%WINaXMA**drMcU@mtU6x6a?X-?sF=I`#H`bpNnW
zU#)SUb97&;Q2!m{e$kOmi8bBv(eD8?jB@H-Ku)&|y8Bsl2Y`k(<n%e`3_#Ey;OKX%
z4|{j4>BF16e;@tcaAcrTZ2)?CVAII^L#^-YjR$v`Fd1F`<bLYod!f%HlMW{U4Kp1>
z!@kncu&<e;XxNZtE=LWXyJQp%8%k^CC}~CHt{F-@{q_FH*V5BN`K_!kX=oT-p0|kO
zPJjM_SlbYs`;{7*6~gN;UGd6{S}iEvL6Z06VBuR8-iOckf;hYcYahmrXq@FlE%jHj
z#~1o_$t`Wtet#t}RCup|v~$&!lJgwvb3(K$%^pVx?24@^PD|S2-KERES3CVxeiE~#
zP{4tTT}vYrxGdIYt|S#FYF-i;_Su?X;Lab}ZrvEX|C!*9a>*$Aoxv)(gn*=Kt>b5;
zEqxv&H3rvRyk2m!#(9HF_&d|QGY~&8by<36W!%O{wE&enUC*xXxqpgF^=^0l6a=j2
zOIjASzz@0R?5fOnugW4-PlHxx4ZNO$fGr)C@9Uq8fGum)<(q_n4SoH(V@b<N29UNX
zky*&w)Qvr21m1cYq{d3!ciAU557Dk`S-`o{hf-$W?oHvhKdD>fCJ48v)dYbK@Z<fK
z=4kIFa6Hl87ogDMz3;5b7ZE{!wQt_d-j>~!?yPPbmUx^wa<~)gT_~fxm`6B@wAYsh
z!2lp&S)GLfs;Ag2!p+WZ5DQ;z>thj77!dBKa$EPc7>{%rhCfiZjN&h%ky4SrtZQ*5
z-s^mMikC9_j8aq3sfgfwHaKW^lFGxQ{S44k$@{cH%Z>*Is5Ge`d&DVuB9$pYxw~Hj
z^v+c!pJ(TClEwAg20JWn+->nabTg~uSo`&y9Hm&nldRZ0^>uxV!c{E2F&^+IDFjdK
zW`?Xd`G?*kgu>eqf?wiTFPy+?$kkdL+P}@?_IY>Zv)%+PxNu0;O*kc4TjqXMp1|Ae
zhrOlC?AI+%J(SD9t$Ucv_OZb(?`yyyg2ULTC_v0O<*?iB7SIKMtZw$##2~??64KsH
zJc*r$Dc>00c^ez~naf=gpeCsp97$v1I1{aY>+z`^jEBlbrGua>cJ3Pq{><orqg6V~
zdKv`0dAL@(ij*9QRcWu#6HeuG5RrItCPnYygC~SHg$PR}xg)XgYld;k`y+dbB6og!
z=cjzqIKy7y$ZnbRx@{jg(?}ZYH!1nAlMgul!gpED71gtAK+e>llaDRzpLm<T<`fQ3
zldiquo$|QjjL*moAJ!w7yElRtZ^?Z82oicq<x+cG@&=H6IAc6^$w0PkkuuAddmhH7
zSU2Bb^hhh!f7w%)_fO8%mI<%W)pq@G277L`qlmFi6Jkk}smHxbdp21oD_HU;DHl8}
z-PC|Q^)U}&bZw-bCmI^*F17unJwsY?QZUyGADy+G*S7a%kUgN%c;^3)y}J&IW83>i
zKQO>B=*-{_!Ciy96C_xICRjp{!686^FvH+(32wpNZEy+huECN30TL1-KnPs+-shYx
z&pG?q=eg&7?|bXsf4Zx>x~jXn*6LdQTfM#?nW1dp$NctP4c8#j3QK!(JsBvAEeh8!
z7nDCM`{qHu!>}M|vB*YoCo^80lV<`i%?6j>5DU&wk>{O>1mVAP4U;xE7iJRyO7~mS
zD)YR64o)l3aD7Cz?&aX>OvSU_s+DvZu^_Gvf624$U~_}A7ZQi7dV|d^@<Ha6xv2S8
zq|P(9n2EgXlm^^E@ewyw^9E(g58=wt7S6k&BdS7)RweRy?(xCb2pDn1kaBuo9Kx`G
znE^bkEF_eeT*1P^Za=K$kQg7hR=^y!qoH6u6K~><)5r6Ximk;awgO(rJzZZ*<qwUs
zr0o^g-N!zImnv=b(einfvfeNHlwt=f;#a^L)0cdpxIYyPO)MQduI;|p%JWu8Zg%WZ
z(Qs;$a_C#Y*Adr9kIaUx8@!VdBa>5L_3$(WiTGOV2Wzl!wNH9d8&s3NW%bztXm;s0
zX*z_TPE;<(cEv+;CyKw22%IXb$}gVf2aTNMg2xk;qxQ6+?FpH*M<r@kN+(Ltu}_)a
zo*arvf}(bkC7$nS_r<lStCG>-h18y$T6(7A<kN=F)!Iw7yzrDWOfmCl6A2Vh4$3)i
zMHHpTxb(8D=F)DEMc1Bc3Cl*#S2VdldCbD8kszq-J#Jb0BjIJAu0(KED70b+!fkS9
zbJrvHPNn68a<e;SIV}@pagXOW&A#O?^39M%KkrsDQ_0l^rQM|SyXR>9BXaQqOSH0q
z=g^Aed(KPIudyWs$h&g*EA(hZ)O}uFXo7+vRJlnu8_Frfc0NB>^<1_x=B1-%)Czd~
zv20^UrIE+?wDq9k<{DN`dc+dbCFEOk-O;4Grk}YNo44F#;X`K%=+(-h!=mr3N2&d!
z{fxW(fXUZ=h$iavUNq62cAKpC{$u4jeMR3259q4>dVm&$BVrv}jV`{#BpYWl-nhbc
zZ!Nl#EIxl~?mYVO!S~zudr9QR*1h98K}=dR6VBd!wD;4cWSKWVJ2T~dTaPtS*~FV8
z676UH>KM`Ju}x|q+OG<CLv@kZkj=IXu;AQ|ebjE_>p)aXRx}Z3ByB;HL@~ITD42LA
z70YC^Af=YgFI2Iz#p5VpN!foKYfpv$B3+4G<?+M=w$Bf!!_I_l_&hu&F49E8e8w}F
zg}pa<FeUI)C!9J@;!iH#pjD0HoS&ZLe962oySm&TM&x-L)S)JKmG3)<yT13FKW1N`
z5@Ra%vQoNFY=N<qnJQ;lv3T*^zAG|)?uNjZQor<fx)#Mk6_3A^3sO6V=!7j4c6#aa
zS`8A=QA!rkHa-mqSTV0gFAf#C)C`*1?T}{7;k^>%;?3HJJ7%cPay!?9H4UY;2a|L5
zdwIJ8`txpiuMr4~y^yMOChSa=cukIMn|A8=i87P?(ka#%mAZ1EvD;rsALgA<`N5aJ
zcw_fc3<`99;7WF}iP>5As5$0iG(*WM5%G?0b9^ix!FO?&^JogG><>%`^VceTz7(9X
z@8iP!Uk|vQ4eRMBr`2Cbh=!dtC%CQg71$7??-FSfM!ILswqJ?M44&DeWIw-P-`#t4
zS@-g0?3apWP`?f_GlW~%>!pYdj{1iu&@N}s+N6$m_tgBB9twV~%aDnq#*%V}0KYX(
z$}IZ^KXxDDwc&5Rm-SeV=+(}|<Kzv|yaa4%2kZ}fxDElIk~at!zdbee+HjukvofX-
zv@ja~W}-||$GR67Gd0dWdr~A9@YX=?d?Mx57fz#M$u+4au)?cDfjd9aZEt_i4Ez4|
zc~T4R;|=>^qo-$MapP}pf0$yz9KiQOlnrmJf7w&>t(fo1v_xGw?t5&UZ-4^dzPugq
z3AlVA->fWA)CDq`ll+*vD0?v<_v3J<=f`nMVCjCK!^omPQ2h!~{L#MwbeqK5*$05Y
zU9$cvN<?7y)bR@fe+f~Qf_OuYqzFfrK6E&1_NKx`!o-nYZ;*t$u9(IMZes+9(w_}G
zh*I285H~>BIB4M^N-SJW>7{`r<&%S56z3v}qd17iE_ie|NTDQHb0}DQFZecYNP}Up
zntF&yO0Zsdh)GF^*-*$m4od^$5UUm^qrH%acA<~LL+$sTSaO6q`Pe@w33cNL^H2}-
zQrCy?h58Ozx!Q#V?1cs5hU<ohJy8$Odl`ld505Abj|%rd8HdM(-w7KEPg0L~W*1TT
zCOp0*;x$V|%3eecZe&DiM231~)m%j0wTM&_X)7LCc#VL$c}A9VMAfTDDJ(@+hesKa
zMl}vab?il<Qlfg6^x96NUfM+uQu^jHMUPVI^oK`J;>Jw-s5K8o&kspYaKtQ^#0;p%
zEbPTZpkh`zVs~01*H2@1Q$@DaV-JR6pV`Ik;l^R*#~!K2eK`&LKpA&d!hK>F_hT>4
zK0NN6BfhaW?#d_Bmk|TjjpOYJ2B%?LC1b#JF;-obDH$;+E#u#pL<5HtA`RlH_Crjr
zNibI|?|vLi06+ku3cLow;z6pOU>*qoqeKM8a)MYXGlNEw8Al?EeIie3qGf*~0Fj`g
zjL9sKBvl$N8j+-J!Yo;uY`m1jN~H=1By&exC6CK1uL>k<P(4EqCF^iL2Qgz>q=g%t
zC2>YP<86)K0pQ-Ve{R{DV55=JiuufKIoQtRnGt6)FBkxmSEdw5<c&!ACZ6IIk^0a*
zC8RX?30U=R>GOby<gO_KC5_Z*`!K7t)QnR4sE9Ply;L=<GzDK}rHDi|%V$`K<Q$W*
z^x?E>6Z-7obP~#RRgrY#2n?Q901N;CcLP!+GTipkYcw)DnKF8){2NV_o0n4<buoB{
z6XlLG?nh+WiD$ly$ZB=VocDb)qM<xyk`4f1`c6Ho6UbTv$A_h59oRFjMr8Z#X6*p7
zRr?beyPq+i0d`!oKMY5{8_vEuqklhqm2;0G=fp($iv$s)008qi{<}o(J)bN9S6&5E
zE^(y0j0uK7ZXWf@^LS1SnvuL6MDD8m3+30j<YggH$vkcc#KVXe=1WN^iBuJEnvi57
zA|hAK^94V32-nC9IWB6lk^DWjM4)AX8W%tWFH6m#fJ}f01OTuAREaGMl+r_F@e1U)
z3hs^+9)=g1pkJ7+6xyI;Ebxk8TtyGcil*#}9-Zgdql?^3qn+Lr9e|77Ba0i=i@hSV
zywi&V%Od?oiu?DA5e_9e93`mp^pGbdF}ETj%1SbRM!;U|<s?LwmI;<V8!3H?Tbgz&
zC1a&DUotEQugseBCj@N4_a_9bEH9y~oU0tNQda$>tX8tTH8P~gp`0$F9F13@JyhNy
z8Q(=+G58MEcdO#uu43q2#oOYFQR=wy^NRT=Po}vl_tYyFMk;N?Dwoe=R#z%_R@^r5
zsunn^UYAvE*jDY1MDL@kKAt-qy{qcQt^O2QZJ}EIB|Yj}di9m0#rKiw>b+`!W6gcm
z8lYJut#=J!RESY=O(a@ScDIJiEa(ol4s^7b2IWtFP}}2ezEoK2FKOEJwU%89iTehR
zd9;{86v%;JKV@3Z)AoYKrcN-b-uC)5)q0b2CE;$Q1b0Jo=tCK^;*7`jO63jXckNYI
z>vE=RHMtv^p6isqzH0C~uNM(-G^0_y!-{F-)#x9oFgV!wklS*)vCc}W#KzCV_MpjM
z#n8UI2}P~{K&{q=yYU8YlSg^Udx0kE2JGh$e3WKOh+|7wR7*s8OVnsf%t1>Werp1E
zYm#Q`Gso7HsMfUd){N1g5wMKb?od$RK)t_I$@>}{^JIncQFP@2x*ET&mb<N9v#rsw
ztvRZ#wY;ruw5{Wy?QaMeO`Av!&Rs`z)jOi9c(m4L`y_tHG<V1B_x7BRkZS~NIpfwf
z0=9n8G3(f|%-y-z*0JH(xr^ViCDnOg*131kxmMnJAk}&Fz4OaK`$z7sl_-g?qg_+0
za&1XhT}x&xq%&O?-@6nc-HTG)Jjb1mH8@c<&BNS1g&(Q#25DI-a-SH|1xczpiPU#Z
z_t3AUX<0w;i$s4Sr(;d2-E-^xKHyO*(j!<wGrQ9}mDfuJr=zXt5&YCMpwT;v?Acf7
zBhRE2TchXI>hHJeKS1{LM@tA1ylkHC7bWPUGWVI9)_f1`9aAV)BIv&})|+v+&jn{d
zjb}ikz5h_~<!Hiy-r+!P?Er=Oz!6m6XpOdmw1*i!IFayD%YT4VdT<vy2&Wx#xELIn
z9te%@4L2WhIUK4G92!a(^1Pt(%cS+Wp!edTORX5P85_C{ABfT#%GF{_kfu#q8$JoW
z8i^YlDYY88wKkMYAn9-3kY+w?Y(845HE<2}WsiB*u8p!bjiAjvy4OYq&8e%U$Liq2
zmx-fI(xcuNWBum+13W`vTJ8&4<IXR}-$4gQqsO**s1pb##wutt%^B0%Y4>;-N7lyQ
zDolJh9E>ub=r^C-rk&W}nLNmw80eYU_a9A>9{&KHY&RcS8XL#SVpR8^EM1#AjUF?&
zm^z%E?E5&0qdz@y(TE>2MM5|kb~t?^&BWc#$SyqtiJ2+ynfiW6|HFS8lsL^FF!gzC
z#)`*<sd5PK-b_Z(Ea%be&e-hD^_ga#SpmAK#pFTUx)~WKMmFBL_eeBF7_;7wtJymN
z)NI-_VlaJ@#5w#I!z$}@3gdI2pn1!nb_w@|yOj%h3iFnA^Y>(!&19zV^cM^|aP&JC
zeCbT>JDBCL7DYZSNX{(SRW62%H$VNs>hH7^HNF&cv=m3UoWQ%Bq`myiX*nfkIjwRz
zV|+R5XgP;)C69L{Uwfs{X{9)3rL=OTe0-(yXr-EPwU&3aUVF9CX|*|KwY74!ZG5%k
zXtj%Qt%rB5PkZg9)7oIn+HmFC==j?B(b^>8`ZVwQtoHi6)B0k}`f}y^>iGKl(fS7A
zt1aGFJKC?_IKA49d9`2p>R|lU(b209gc~1uH%_!SzBp}si`h7<-1t7e@#E-f<BD(-
zgKrb4vx)7z35wkWS8d`?Y!bfTBqrK|@@<jmY>_!{QN(UhRc+BsY|*{nVj$XP;@f7{
z*=BX#W{=(GtlH+D*yeq|%}=x=$hRY`v-AHd1nlbnO9+_DXSKM`8r7dQCqHX{_<WoA
ziylAdi^1(L><kb9(-{^R3vdPCxgKKyu(75v!>;$ZAP@)_mjEB1h!_GTCW1kT$w**S
z<YW{SR5X+n^fXj-^o&gOw2BNM)*B3*tjxTeY&=|CLcCm}f_y?E;!-z-<RnF<WE7QT
zC2i!`l9Y)xRpe9EAo{mdQf`r{YwF$A(cssQGu7ADH88n<SJ%l%O~g2%!j$EuDHLg@
z_|W{W)V<_E3#vgY8b#~p7B&uW8}lI>dX)$1>b9A~wl~}!St9I>N9@_I(Lc0<@MHMH
zF()29mz@74HdyHIY_R!=yH-)kX;DERqSO{+&6i_MAI9DCk8jA14_k`2uustTPi&1&
z%v?@-;FPTYB02In`L0`vQD{o@N{W4ZDxxGUZZ!?=m2MuA-t#P@=wpUeR3`ebz+f8%
z{=bL80@F*nBTK!|rP*8m3t+I_j@-kJ%=*sRz0SOnuGH$T6?D(kyPm@G-psk)#&3Oj
z?_QSI4&?U?%q|bK9t>4C4wtNtv>%St4~#B+8m(;|tK1yxIvuasp6Gr*(b_p#*FD|%
za(Z`cdhN}0--qdrvzeCBxt*E0)x){I&vP9E^X(u1r42Uv|Jz_de0r^xnytQY67KtB
zEwwv?@ywdpTCH_&MpK0yUyZfa?@s0_Mg4EG!CsgC(FTM6)&`rRfY^%X29rPD%X><R
zX{-ced9MDSvcW9;d;Y5p7W1bz*up=x!A3a`l0_y9eM7m*6g9B6qU0YGF#eeh=Jm4;
z=9}0{0iHJqW6u|jvV|327qy5*&$odUb+N&}wZUxW{$YbTY#+AWU5U`E;Dne>aeC4I
zY=hPPWP_nJ1fyxMZLrk-9Syp4-7;df_p<(x;_-8Tx4}}Eq;#vQ4KGIIe_S36S6)^C
z!8Crq*kI-$wt>rAQ%qauJDP;jn<!$oVmlAq-`Zf7Fy7vnGVUoMZsD1Iq1K;mFv~g~
zS<HFVFn9gj&o)@`F!zzbYcR`{v~u+zrZ&?iCnhV?Cgr94)s0+H?Sd&q#6Pvc>i($>
z*3UFbz(Rza4$a1VbxHu<<his=40?097Z4?<ze;aOcnbK34MzVv8!S~^#9N^mfF27J
z+B49GX;++B5C#Cl!7P_p^!;L;G|uJQoO6HG1}o-JjZzhh$HB%0m71;BKDQF1KUG2!
z9MVtt=n`~oArLLIbRS~h{Az<4{l*3h6103_Fotja<mzA8V733!20MUgCaPAI?Z(N)
zz$5QqO@UMv1p=j^Bv--<ux~%vV8B1xV3bS{t!1LWVuNA)H5)AY26o6S4b5;r4}Q@m
zdF#2kh)1iY#DdP_>hwZhmwmB}<=CLcr2nA}mh=Z3j99f`Q~tG<0zU}WvJO6p?{9b;
zh!<ARw#S@5HiHxJHi5g7F4mIbO*(DLmWZ1jru=qzi5y#5-2Gty{4ub2JqXYgeXfXN
z=6*%X8VQcH#x*&xQ-Hm*ssQfq-2Qx_sJf#!@aSAgXI{7<7`}@c$XJbysqN^~FUUd_
z&Etm|^gt>z1@ny{R9<MQNc0$k(K)S(VMppO+F(cjmJO!!iw)NOM;k2FvR~|+ld*3?
ziNx!_x4{-UgEldLvBBo)aRyN)F%<G|WS-fY9ft%2EE=VnhVtEm@VK7ukfE_$ibXis
z9|VmvfQYK)r9ZM$ME}hO3k7q2M1-RsI$4|TV~SSAwob%+^aA{1gSr1~gAr@D=xV@!
zwZZZ&|4kc=`ENE@cR%UCpV?s9j41K}#I+5k^otF)9l>(^dmHRrQEKTg*<d06u)&VD
zNPlaCt^Chzu#vynVB!Cr4OYpnUz}iu<$vQVn>rrf*kXNqklSCd!B&5=!J;H<ezn19
z|7L?pM?RhVjSYq(g#T=VeNd{=<NjfXL9Ej=2zLxt!L`a$d>|X|<+EKRecV4xu+0*=
zMEBu|QOhLgc5<=VYqFbD!EDb{J&}h5u>51oUu>|lUu-bJUu`gfNTt;(g@U&ucYHVT
z12V0>VJu!G6OVtf!Q}sn4Ho%(8_e>*v%%u7Z7|C|O7V$rdeYB7Vk~0K_uakJ1=hbH
zd~NWv4d(S58?5hF8_eQo8!YUf*<fLtn8lW22k|lruJ|mJJU)HGsZ%$mLCAGQ<)jqM
zJrXQwOR+W&RJ9U+Iz;^Y4fk~zk4E?Z&<4xSeUP3@IFyJq|488X=Qf!8-)%6PzhHyK
z>uTnMz)w(|W<F6|dE(6i_|q^cvjJe1K064CRn17md8&Ysf|XrEWO8kTy#Rw?VPYqU
zO9W75){7=I?8zRne=6CGE>>c`*cZld?goOAW{}?|c#<*L+(5+N`fe<)x4X3`r*6cM
zd+h$H{Fu8z)@j7-E@r-+B<C@~B_b{x!u@=fyIee=N1r(D+6HU+oegI5FKn>*O@$d<
zpf5J(j5tKx0LXy?3n74hKiOc+zp=qwe`A9+fbw;LV?jVi5bF=iV8WRodQ#RIOR-X5
zd}q9j)_(FOgd;ni`^OURlX@Y}np-;h#C*C~n#;+cQm)I~_?^W_O9SrYFyM2g;La&5
zl}%Sls#GQgm%rIyy}z-+-0|}3;W#}i4tl=NZgMXxu}RBIo$Fft8#b5+Ue2=7SGE*S
z69@qnvQb$40A-~g1Z-eVoiKrQ%&_|8C(r2et*}C+r?CDXwZRmBwZWeL-3Ci{CBnHu
z{X-R6JauDT<N6kJ0zT%me<WaWcrl8>xO-fnOI@fhS!iflc=x;@{g}w(jEZ_N5C+9k
zl7wnHP~3Y0OCBs(+$u0a7r|GGZc~dhrc=qMU@96xEls`sx_`34QU!3_1-PRbMSilu
zHo=|8*n200Mq!*GS5HbF1QVxk7W;8gc$gM5hJpX94HkclU8DB6)AF%hI<50cSru2|
z)8E)&VZYd5$Jm{^SZztk@wqoUr=Hg%6uxZYD|EZPG{qW36a2`{YMa6`6Q*dm1&yD=
zny<l+fnha}5cA0!uZ&c#V#Z(FU^c(8!BTbecL4;S@d$305w0AURpJqTNw2<5U5@*b
z>cptLUx+UsQed-NWof57zk|>9Qup#0dwdyd46hbuM!@IFZSw~k3<Opeu?WcLVAXVf
zgf{RZL)kt;Ql3@~Y!$>`&0~pwFL>~?4VG<L==F;Y_U@nCV8sH0VgE~QFju^7vFQFf
zBEBh(150`35a9-!a!HaVGo{*CHFW2c@Kb{(myazSxQRdvad2(1W{Z`CQk!W01ARkP
z7ZxI!<>seSv<Updt(y9R<AQYrPWLhP1Asidrrqmj8!UT@u=`l6TbFQm3hw~`+w0%6
z!KD6z4fY1ywW`{~-HyaJ(ObcL{;gnMKxWzWCmSr<vUiFRcs25O8w>!hugTY??lj<%
zu{o!>Z<>aM>}>W`+!nAW+IomV4K)uT{?Tn?THE(U6cXZ_%Gt*Smx36+sL+4>5G$dN
zs)9z?pNN*W&<NCv>qQhT|L@yi=h)J&IVxAkL151i!|O^KXx2@EEXr#e4Dgq1u&4jb
z28%}g%?67HjPV^4zSQFH^n}DcmfFZA4DrB&GyeNFm^|LPE`Ncm)NNCsojKu*W%W8E
zuu^_hZ-smP1qDhAT5s7+garE^Qh;Tk_&;vZ>Gi)er$6KwX&@zf{kb6Casct-)@?~c
zyKbD@c>ibGU@yRjjEvIVL;>0?TueSs0!X3jP<2VDbu&}}9U7}K{qRA7gxfMt!ZMQr
z0(+W^SHQ$?oTd}VNV1X-rDpQSVJv@<=fTO?u(O0UmxrS#dLu6hOVCv-Z<bE4h~#4o
z9TOTSZ_R{<bYL7d6tKc;1QA?b0oM_Apb5NW`axG}kY`S$cgLa6Bt41si0dI(2l1|#
zkdm-}WrLaiWP{lV{A(NR3pR)oa$T*zUS(iY^A~KeEwD<B-ydwSVn#xLc)84Fd9&q?
z_$A>mx&l*>m@n7c3-dLl2)PJ7lxdCeCL2+bk#FQDp9D4OBKOVf+WmJ09f`53QuhCw
zHrOusz<Mi!zLxk0>}e;A-Z4<`E!gg#*<cobx52Wf+|QZ=@sMDl(U`^=j#Ngco5#2O
zRgn8P!}LXv?FOJ)_utuI*$9hqnSE34B;%;P0&W$l)09{~h!Ho$gnQ3I^ZouE5aPEs
z7zX%!N(ZDz7@{QmTN}*l?>3mtU$nt`a4i1gHki%tZ7_>}WrOX4Ic`HN{&O~%*T1&G
zy#6=XU|#>q29uQFT>8ld+bCsJ5HVpfnR%^|3}!ESP^xSC=Qfz&xX_Bo^#>a6N0ma;
z`FD3JOd6fvtjr%6)!?lL{KsuDRC2FZq{+$sV#X`;|7wF#C(6-R8#O<r^Lu=>+Inx0
ztm@h6;m+_q{+y$Wo1Yh3Eb`ebUR|73S52O!Rf1Oz*>;D1vcYct!v=HIwmtbj#Re;r
zOnl;@lfST53+^ppcKjzcm?Ucm|9y?m)7b)4HB*!u1)i#6{Li5JI^L0w8g-N!HMF(g
zB>iNACH`cCvHZaX3%RzzdX#knJ9{2vnMVbL8)}bB<By08Ry^wx<xJ8VexzZzU<{{_
zytcul6{`N!2K$ywz4VI>_UO-SFsol}u#jXE+tQmoJoBixCW+M|RBupH1ES&l*EZOq
zl8D61H}E9pYa49%->|{xwVE<K#{u^;!uV|K6Z!TPmxcYR8fr~57H+QVY{9Ef7FPM~
z1-6_-yMYw`uD$qT(ykXi*>#6~G~O3(L(D1u?jsg7ZJGnzi~b%HQs4X)>*OeYxYECl
z|0gyW3o5zm;bMUID`pqWBsOI}cXA;C&KKUVlZ;+9ZlEj@eRfh(vOrqqaR<q-8x$hK
z%<y_2t;qahgMIx=HrQ<Ns?QYqV=XK0iWC^LkVzmYm>+q6E9L~Jgwt*hB#N-kzS`zX
z?Id_Qr86av3$piQfDZ5na~{IL%{Gdp9dDoV!1JEU-|VSEI1#x2WP=q)(B180cuCnu
z$<l}GMEjEsrb_qjH#S%;NZn@}e|`1Z2K$I@y*0&QwF4vMywmLgxVFJ&g8h9Evcj_E
zG?n2y$wJ`_+T97t^^}mmV1pfFTaf1YT^{Gjog<6yiENRbxFXr5w}R@i6>#EzwZXDE
zg7AN`!47+{ZT{Q_Ly=DL=m(Wt4K&#5*Bj2vy^XCH7KVS?Oj}Q$cJV<-T7P;?`v)6r
z;3pgGHU29+#V`In-E2dNjKn-c^q=N}d<rb-OewMdr41(g=QbG8FE&{Eak!ka@3jq<
zPlWiR4Hn05r$j;=!g*V0X5jgIbrKhXDVqB8d3`Gna*P=U<MDSxXVEvYAIcm=U}BY*
zy;5e#@%e`h7WSXD!EAv4u))rHNmF~TZ7{&^Z7}TroDG%}4*uHtUu`fvr4Vhs7xxXt
zuWc|g_T;HTO~V%AdqOY6Tfc{^$t!^}?OYu&DmFu3|EUeuAAzrR1pqWMCjA8)4Dx3-
zn9$3_VV1X~+BVu!-Jg;h%*$N>o5MnwpX>WGdmbg9LESIkrEkC?wgkW0U=^4unYgHH
z8!Q%r9~8?va}sfW_y#7^H*7FaL$g+c=N4Zw&7wcR%7=kRu#vWy!k8dV5B<Fj*88&!
zb`JU3278oyZG#1e3$*;+1~XO()=oIoZ26lFwg$qBwrpb(=q{D1)YEiXVYo^Nuk0q7
z-4Co6nAQ<b5ETa?z_b9s24t|01_B_IM$P;2O_ysc|IP+$QTWvc+abWEL}1<u{%bZ^
zxv~6^xBNf1!QB5F8>~M9NRW#Gz(qc-6hsiS({2(9w<!I?2HRu>)HuVIEdkxKpd`)M
za1V8Bpa;8N`Ptzk*ghseR9y@}IROUrXD*LyVnOL47&jnH`z*~@z7dR@7_cvj)1G07
zoBeJWc*!Mutau7Q_aD*8N~^Dn_OQ1j7_3+Uo3Jtqq-eI)8y8657Zz&Yf71r@`EP76
zfxl#f)eDP**u@bb>4ajMW+s&Eay<@U2}v~8MATk`!-1fy5p$>MjP+}6s_z!$hMqD*
zTbVmKGjIU%!4%O7fK7S8rZfpw5Qb&9Ggr5mW{9D>{8fLdwD4L^MZPF3qJ!j228P5T
z#YGTE%NTRlLr(i3r!|lgc~U`zSHe&y-CpJBAP)dGpamdLi*#X>q?QH|`2gJP0Lz*Q
zO3VoxQj%gE&=fz(M;`qR%sAsf1T?qNT{r;*#57)$@htE4$OW7+cer~ft6wN-T*s&R
zi=0MWZ~Iggl_VoTxRH@!C7hxJ1Y#_zXZym|!ce?a1j!Zx$e7?f1!&=xiDibyF+;@w
z02g5>I{?7;Ko&z9N-CW|Cjelj1Q5;Q07`;LO*)wkQ~;1r%KiR)56mYlGFIUoZkYp#
zsGCk4t?N;;bYP?x3-pFD0M^rL2JgL+%~kUgNuV4W@Ic4}nB7F<W7sLP+4v{<*kRJQ
zP!@NC#2i(-eFhS=axfS>VEgj82O%_vC?=L`7!07wBSSM4;$EQu@WHy5TK7m7K*We+
zRZ`<Ig$-;080g~s0)yodyd>$r^^`!iB!3tx4$zqjmCYTd^8wsDZYBT#HV+0td)Njw
z2%M>wngZZG4yk)Jp}-cz9r<e*46Uh)=}jXCivV06Xi~L~RABW%@Y^G$!|oD{*7A&c
z_+Tx1{0f6bM-NMK4T~lG41<MZrFaftV`)>5pc{nMB7gwwp~gcX0#hCdB9H?349TJ-
zD@Cxc)}s*xzz|#n8pB8Xp{`I8cS54s1ni?E+XYTF5P-#j!4)i7%M8uRRNV(60GkN7
zUuYN*02C0^DM4393FzqR)aQ%-4F=QDDe04U)UCsGMRB(S%&`y+NjfFv6CRMTIvRw)
zvD{E5V%uhX>VdR--i@HCP#2DH-zhB5?Fa?S&^iC%`3F;^rbrCepgb*^814j@5^RYF
ziT645Nc3<5nW0vQn{2hAp3w;~OG!H4P*Rz&M<vq}ETJT4p?3iKq@^Lym;}n33HO&2
zsPd*sm~hwvf(bYP3}2>*VdFd>3oSo}@N$LoLsI7V!Q8mBgm3Uu8)ojFg<drS5%47F
ztV5}33l>dHS74tKU<mL<$pG3r!?T5C$qhGHVhL2o42(yCk0Kn0P(shziRNdCO|i*i
z5<WO^-Vi`QDbaxkp%OlNY90C@x>R{=ia_1r>{Bc=W5X`-S)DgIm!|WQ4tI<?7-a*J
zT&98qjl-0}!we8us;6MVTo%Kdv#K%k^63KBG0ZkH3mEBllqIn8II1m=@bBDN;DiR_
z_#klN<zXgBQ1`;37E{f^T^-g$7(^5LqMMm)(9sEyewZkmiomq&cL@(75O1?T456$+
z;MZVS@1eN%Mm$_mTualYh5+JtJ%@)d+n92UsJm9$OF!IzKzYPfb-g^+^~<NFM+%Gg
z%mjc<38<KZVsEOGL;!$f*Ae>&w`&+IcZt9_2||fTrx9dbMX&qcigZE{9p6r7?zqo^
zzyKJNShbeS-U`2$7$QR$z&QKd*fc9%Fl;@_US{QnZ!m_sED5Jnj7*ruQBHE@42c3D
zkvHMKW?nL#(NVjBPz1(1TC`@Wv3f@^lm;n97OK&5Gx?xHND7d56Y2&C!W2MA7n+J9
zNu4&4<j3S`@hGhNh^KbLB`>2&kLK*{I<b8alvAPg<@K7nQ@949WC#Q(72wopTJf+m
znipz3UQK3)z_vpO;-kQ>D3~z<JS1whiNH1ngrfAWh?nl+)if@%CQ#-A_`jPPeMW!~
z2ry*&K4kTN_^Ylg1UMJrW`+bqMA=gj(DERVE`oqjpVSQnw(EhoqOjw;?Mv3Nj}dtl
zL0}(1d`yjLO&v(UG|PWEHXpGb1Mu*835-X>rZose5*pVqekitLSk{*9te&sm!(Hm|
zU<?8<D)-JO6v)I#>aL}_nr03)49!Okdl@n~wm#1aT?$4600_$C){-P~MUi!q=@pp9
z-8mTqHg3CzF~)~z$#-)&4@=MqbO66YZ0z{)oHj&p(rsK0z=YDPuA~-#ttMXlGN5ML
zbQ6$E2bk*Xi5%yzy%S1_ivWsS<3Cor+DUG~)HO-Y*v8qc3F8K&8!VgRwqpZU_$D@B
z3R~&lC7iUO^i4W-gzdO?vjUXYJs(5P-nvNy`_yn58yA4xvJ=LVfDKv0AK1L@l|;yg
zTeYtrBp$NzF583yCz~2Oz~{w^H9vb|k|BB69ky_zlFAvD2z3BXR(MjgUDZ2kE17XC
zNraY;{MHg`l8zEUY&?ozgJU3$pzK_s(z!=vkHD~0cC!?ukL|EOU6SR%XzU2a?3QP6
z)Vv1?X8o!R^x2MQO^Av@x`+dtSTK1-0YsaCZ*)^!@2#D1EhksU?{DsU#9L^E2(_P}
zJ7^KbegG#3h;<by3ov0ZT)t|{Xd~*^lVOAE;%-i=7?WryzGs0d#BY<O_R|d*W8tdc
z;#y+mn#GUXVPxZsNr7CRPin;`5a<xtvP9^xg$s5U7<0|tNW~Ui`UwWhv;7$cqYUBP
zyJJC#s?vB@=<E;(2xb%yk^BP;=DINY>7mFM1owRaV+~HnYqK7Y2Sm6#)SkAmgsqBa
zZ#{erwx5|`*I>l#Y&CuU2?l#k*bXOM^_1TAKp;GAcfFi#u^6E~&YHC<Q2fnp*p^j7
z`|CS<^11mEy{{FBAFKlD5N)gVZpi?KgZ26>n_4<RgmhTcL^aOa`&3jWI;=Qw|NblH
z3<MzuLO|XA411aOeMpTI0#`NRu>5s;Y@W6#p`}1|;*!0EWUxVMkWxG$M=#cks-Iyn
zbqAAA!MT#bB|6BDRo5^W_3bH#DDmIGV0&+@oZgeP+a!H|gv%I;5kG=4gb-p&XbyNg
z%L=7lP>mN!5cmZK+uV8;f&lEHa@sm@!x67Z%s$e!F+JEFkOgrp4D+5?kI<WO_aAQJ
zZz?qnB#yQb#sTtgCKTrbn>w(FC;_aaL$cRn&)m26%7@)31eL|$vTYL#7mWeYARFFF
z?Q8`&8#w7=Ea~ifu(T(Wh1!Q>q~jlxq|M4Ld?0Dvzv@;GVMnY*F6}>7$G9yXV!#n<
z?ZY0pgnIvWvml!_Q^+M~$Rp6s#mR?j!S%zp*bf;?&+cERh?KmkOa;+~>uOOJSyGV;
z3ON!7gz|L;m*E3n<G5l>0<h!(jy|DfO2>AuOpVFHEUS8I3^4Irl!4+1`<Ax;^0Ajh
zZZO}_!=!Ex+K;fXqY2bx)0mYh_w?v{YnX{<J5WZ41A)!Be}B^sGU#@+>gKXwfu=*&
zC<)WwH95N}=$1OL{5BYO7Dq=85F`U)DE~6SvhQ&!k<S8k5(oz9*jwXD>!_Rj1cSK(
zWB8T<C2m44iM#ZKOSet}rtOK|VyN|i+~Q-dyjns?#h+!}uV%J)3EK3CT0AMZ47HxZ
zO-8t!6-79iggKv)2O+T5-{D#O0S2q{#5oE9*a3)fM=^2tuZUb*s?fBtXw0UScE6!I
zGX$=sIL$;gz!)HyFCn(Mg`JD&ZbRGhBc60VSmr}uA`tih3k85lGV>%mJpeZzp{5(!
z?RR}#GFuA7ib6od0hR4-I4$?02bM64`~W@(Xet5&;sa~_NW0<oGYkfZuf%SWLG(nS
z@4EuywXeH_a@LsCX4D{<63H0@Z$vpcFe?!)VGPOv9J?1_ElA>)+2p2B`{SnMpJ6bf
z@Gn;h2SWfI?;oNb-ISpUEjU<_;gWVpYR2b%Z!l<&$v3$$yP#asT|UNJ<<xs1xo^P+
z%fP}{z!o8JLN(Zbn&PRwdB$#}i#(t8GAjE#1yTC>qH6z9xOkcjf=s*}43Q%e2m#<?
z=v+@Kfryl;Al)miYCs%%@m*JCBoL@7USX`4i5-D2lWB&rDUX3A&xKYHu-w86b0$@n
zju+~~0Fu%Z0Nxz;bYnPAgiy8QZeoTtQfEqc4>M^+q;TEh&@J2+#>c@S4X+uoR$&C}
z^#fdol>i2r<e7$ydznpOpaciy)IlaJ1~**%u>M$HSDCPgNZysa{3RH`XXmkW<pDro
z;L&HHs2D$DJtV<l^i(&5OuTr+wV)4?2X9WjP)p)-Iv062S7s!omC(y@xK#IOw#w<d
z==(La_sM%gDdL+O=-uG~c3QE{*OvqGk~-frQynLK18wqeKTg_TX&zh<Q_1LhYH<;>
z>wGDF{`p;Vo9)r1%*E*^6UXw#G68$1Z|h2qu=5PQBEz>(=p=wmhu6ibP?PsGYc?vV
zP}?BNj-a!6jO$tLUHlO8`4<G1=U|%^;c`!PQ+|9vZZ{sOLm&7?QMdtAFl9_H*nT!u
zd`BX{)fE7s9TQ_oP@y(ScRb*1eVzCryr&>><yb%kra}3L-gAbRs-Hq(@2W3Uu6}M4
zoUB=w7eRhX3!7w0&(vqjbQ>|T^;28%WzY5<Sk&e&_I(|kjl@eY7LvmRaM=6T;q)jn
z6P|MvsIW<}7d{*Ks=@W#{hPM*yN4!4vg7uV_vLEngt*E|%ka#y642*d6=w<Vrj#U~
zq1;ui);GtQ(aA;Q73KFZ@#4_b83zUBTvYwfJR%h`>&l)|^ES?#`tc@J(zo$8D=7-A
zG;c+ktu*hX(>T{HIShv4!x8N4!l;sR`{(QOQq^_ew%ho-F75pIx-syj1$wY);1AG0
zK8fO|Cco{8?sZob3+L60JgGwGi&W4MH!EM%HX0NNjP|hZuH+1Jg03R#MtDcXH1P}&
zV`g+N=O=`02gwqXNy19L<BYdo*Rrr6hK47+dVTBMoX^iM8VcPDawA6X9F&&Kn|xR<
zUbvU?Rt+yzKE@0-gAl`(T~<iDRb*3LJSm{Cn!hUKW#?AL_OhEz$D=q}aDeBsp&mqY
zuy;5q3<u2Y(>K@XjZ=i}7TuOBoG6;4X)>-_<%Y9h*p^uM98OAxY3YGvH|F%h#A~<m
zhbi3+^JCaM{h7*ETOC2dRQJErGt_k9UpdzF;cxU0p=SqFA*l_*p>it8oC8uLUF#K2
z=Pj<0BFIS?7TinVQ#Af4Prew9v=(Q*DBl>S#$!&qyh~Eioh#cYvNO3_xvLAgavH`U
z*GNf(J%Pos3gr0~G4GrLO?|hT45Xy{Si}mi&90Z*e=F$57$%6MfgU$(hq{caI=Fx{
z1#A%BOX@&q%js&0`%;OXL(s;KsbVhKADR(s&riRtj-(a1+pt8dh{#q)%Ien;@kV2k
zSkDs4_8)@}AM#_*91qSU`h**3Z5i%MsmxqV2ZPD`unVb`a2(|``LW)IIyVrG`2YyX
zXKG^~x95-g#J7vVrnPmcvHDLb+5IhpKq@U0*Z&-X_Y$gzj)DkTzCvh3=RS}YcdOwK
z<r8X4yGicmZaXz3Xavd!5gw@{*?CIE0^4tZZ~81!URj~omMo_zgv=(mu}U?U)MG#_
z{X56TIAc{{k5n9wEnctY)}?M&jjuJmeBMR%Pv_)aesn9~k#Z32*a0Ih#Y4z1+_H>(
zh8b4&)Y!UehIM+u44kK`g8Be9`qwaq%C>FH+pGiN^B~YELK#oUM^i-AApRuY6mMuV
z%tSsvk0^jcnVD-kLcie!c?XB8aM^T>dqaNrl(L!<*GxiULjfD_zS`}wnP+tkg{<>f
zROU%zYs-nEbWsM}vU<8~0nE4xsrqmM4B5M%HjB?Q2X8-|DwUiAfV8{A@I^|&+PV(J
zoVb{b-7Kv1n+Pop4hN_yyDCL+J;TuVUQ%1VtJyaVZpAL1d5+s$i>)(_RgXKk@1K+{
zc6@5Ae)@yk63D&O18b@YmEo}_DPMXi)Ku%|RQ`T}E5nv6;)(M^m~1bH>QJvMea38<
ztseHRfG@!0ntf8)^BxrO{l_UMsn~2qxt+^1O-)T5yv`owX6p;xH-(mXUG5nGH(|{!
z12WFe_YiAugeaQb=$t(st*(+bFrpVa-a9{wT0g@4*1DAC?A6MBe|-d*^{#B4vOy4s
zZURVB3yhQ1T9h|isgfwOp@Z8QSu9ncT<4c2Zo-#LIRxYEv1PD{uj{6g1T8%b9(fFF
zC~0oV7E_Qml79y^hPPXu(&afBD$&led=(i@Xfve-B{If})84|L@lm-cGNeFD${Yj^
zj)|6PAqY6$gfzP<*aZlOTZQ|`%;z5Rea|DDC2t)rOAK|q$WI6F%*Gs~a(3~Jp>R>g
zMRx~2bvBGWTnJto-Y;c1EXxZqn*)d%w7ewl+rz(^SR7OPc`$RaWPvmqv!~p1f-x2T
zR)GXPbsFT3SKv?0g|E*L7)!}!F8p>*YpH#~<MY^!tRRj2qM1<HNpF!Yu+v(l75Dq1
zOi=o0z_#&x^(K<_Hq+hR*G#lIoj0pID$9KLYQY{ng!$MJ#B>t`(~<WZ9LxOstiF#e
z8R#@sHIls3t4=csQ_m(Ka?7$RPrrJ8VfaPTd<yNwXd;$VV%#uW`Q9r(Y?1P^(Jo#L
z`(alt-5bs(`ZwWlyp!oyx06&mx3tqO>)XUkbLkpC>S6iTDZl~VNP;;@U8y9pNs_C#
zuBc;zBLQX@_LcaMl5>V{xYh=Ovwq0?xl3XUPTFUk)+cM@z~@l|Zv?z2>{^-aUL7C4
zmAyKvY`oa=$Td$fqR*IeeE;SiJ)MIFvGz2Q=qC4}`MbMaXh#|Igc7myX<3q!;gn8I
zE#{7tOg8jV?PY@kmfDeXV4FhYgqIb`s#AKlr&eE+f$i@5_vFKEg<DlMcN?^iL*?4n
z^E1B&ott^{B@6ZBFQ2Z-ykbhYQuFUZgr1Fi+_y@9>%BW}1D6Ss{X9!0)1ckO?=Nrg
zr7G}8i6xFnv*<nF_p!^PX+*XKNl#zZ45mB`<iFSgW*sg_aa@PC`>&2No%IjiWeLBy
z*f$7V_Xk<Edinm?G1@R~nzH}a$A77C`{_k9XV;m_(^#>Bt{?9M<t}ytD;Gw)F28;=
zIXcL>`d<B=aCcJ<fRl^n$+>{$0^Y8)=Hb<w-<4LM#E{MXI)Cqn69d+(6#<{jqME3-
zLqlm13}Rz7>`+GBJd2BjTwJ2`r2cHAN)m0w3b>PzV1V&LFRN&d0Nwy}wC@vZ*Msb7
zN%;h^vBZd42K^Yyh3b!9zPz%4(KCe+20b^twQPqH9YV@(rR}xo!Pduwj<snzf@J-B
zDg^T=V<RzoEvRC*5QU1|4=hho4alC(?yW(HS&%pFdpi1+#Pjm#@8V$(STMZbdZ>qL
zFNhRv-{S0NVyH!m8xzS!D}2Sc!IB;Z?%ZJ69u>N&&GHK8pm0QbPJu+dkN31!%&v!0
zJ(k87GsQ=dqfUXu-<qxS29IKlxOk4U|81U`fvbv0Hp48MqitTawj5TPue5a;;<+p3
zP6?0I6I~*2h)ojbPWza(i+Dc0sv_f$8=@<Qglnt5OV&>qZ+NR~;KvU;A@XSjD5;)g
zJ*mMUik|WGVTMchb&y^uynhxUJuymUt+_r#4$thR@ags11G3rm;3z86>E40Q5z=Jh
zv5;Cn$=j0lXE?RLB|x7q5CjpjW$s+V6w3zPe6Nak{K91pLt;f$eMD8&bcCU3P`YKu
zb8nP%j!wq(me$1Rt^1>y3cVaG7B`M4E)4tl)<`b;RdwD!`21j%z9fc{2t_H~qx^0_
z<^_lt&g`7ZEcrHeU@BDnd4Z}mzS>Br941RFRM*3<kK?eHQovY=zE_EwMKLi^sZ(>e
z28sVFRQ4iXv;yTerYM*@%<-9-rlyB?4|sr8<d!_KZw}T7dT2?+cK_W&xeA^2N+69L
zMjE6@oRZDS5H)Cb)hq2<B<E8k>J!aA)@Ns(V4qkd;`u<F9+P^m$E%?L9u72nK|~HM
znAq&2Hyot6m{k}UkQ70(S11*eBKd0`-ha}|WU07&7%C5YaQ_wzZW$yhy^Djh>-u;^
z>_@(A1<GA$7w;X8-IKRIMQje)w)QV}9k{ee!ed0(dMGj#_3IMx<rSs+RRuX7`kkXh
z$Q4XxUQj;mB{9!;o_j4;R|L;|;B9_Q4ir4*iE-kwH7Xl5`f39?T;!hXHbhRwfggP$
z!_c=46Cq%QBleia9svk-eI^Ek!nLrmb?AlwG>}-iAq>!Xi4=AZhZY7ik1kL~_cXa6
zMre$_!R|%j6<M~R8XQYu$5Sizy<ObIKvaUhlvZhgsr|FJGtV6M1B$}L=ep@ndo@Pb
z0_WxF?4~5w6bBD6PRIK0WGNC>^o5rZ%4#9;v3f`;V<Old-W)O*JC>(h8Muv8D2Ju6
z*^k1%FdzZE5nblYrq;gwN++kTCkLm@*^;x!-M&cQzP|wA!=v<xH<h(=MaW+PZ%OOv
zKxpwfutar|EC7gzw4xX1cnm9+$a-iR%St0MXewLa)u|bRS!DUDuvoF^0p_EJ_ie4}
zkf?zH)=)Kibp{tw)DCU&l5Ww%0o7gqSaF43GMxQj{k@K!Vt?DP*y~5^S|YavOgk->
zkgzCwezh0KHch6$p)MM=zBb0!Vt-)SOW%@&>5GX9(4*Ag=sHJr)!}`m4Jxri5p;*L
zf3_91n!YnJN-r>ziq7Bf4kf7QlXI^SZL#m5R%=J6X<a_L$zp*Qjv~J>a&A`)cx-<o
z0fy?S2p9-Oo&#Gym5$U^jFOwe2#U{7l`KO+J}nh&CECL{N0J0bTD|Y+h4$cc`&n;G
z<vdH+Su8@G_w=&u9ut%qV;{s%lq7W8T>~IVW&6C+oN?zkmxs46!;zHjNHS^U)koC=
zJuaFCla*J7k+3Ou+Nqc`RB&i{BUX7yb`V8Xh1?-#nETFbZ@Io|6^Fu1<V<J~%vpo{
zN-5*4kN)Do(NeFkVTK!7F6YVz_pj<5!Rgyx(p^`CwvhDS=W7({$!JM(i{Ho8dnVh^
zEy>ceXI}EYS9SPYX+pIs{Y)vN@z6Q>U1{&Y*j6`DU0Lah)&v`0bja+dOP;)O%zm;&
zxq@-SpkaE_dF?D`yt(cH-)aK+-mv=#BGk?kW%lmz!>vV*pD)-0Uh%*U_j=eWx_IDy
zvOMG(@b0^Zg4=!4?R_-u7|6FcY%Tair%L$ZJpE5GIwGsc-4bNUs<!ksYsf1T$=-4M
z+ke6?FMk#NdO-CxnnZe-1g;J=n!zEuNO2>r$|&N53|H;F;D)co?7uzc1wi3*SFWe&
zktLr|_?femmYBq=+?{hs+BthX&&c<6tg@-^BwJDv)25HJtMp-&OO&8b4j(Xo7)i@x
zCNWj6&?c<Z2*O3ypiwoVEFZqUGL6@RCRPG(gnR^Lz~NYqu*TS(B7r&m4=4AXd~>UI
zZ#{Z@u5_@yd@$g=r&#+qQ%MXL#AX*H8m)%UsCz}O@Fp>lGcS=V?LC9qC}dH7Gu(v`
zG0a);fx8_CZ}P##K+<_pjfg2((ul&TK$Vka5Wyyb#aEz^Tmddq%O7|L5`5>hK|T}a
zgvWTo3l<j4xOM(~1nM*;%^}=n2o!yIMAllGR_2N)AB5lECrygP&rOsYyHYY7#^H0J
zEx&yJc}a+P=_4j`5JHg$PyTQ_CKeV)B%kv^XvyRB$tL%~NskpBu_1)WQj06<BQ)O?
zl6>q+<^HLs_C{YQgrruE^5Zk*I+$=RiILEe;xL=H5O#{EoJcMH;H>m~lCkfxvKjtY
zk#c92FgFf+pCS3yePH69d-hBqC)_VipZnBIHC0wZCm`i-e4e}7vAa}IIq%_f+$ML@
z{Q|XlC28!y#n8ay<q7Y1CmgHeW4BO<o8SUX2o5fI64iU&HzTz3z;mq^a~!!9r)KEn
z0fm70AI-P9lSwRKh-7SQA0#I0Mm*~me4k2x;;%q>Dx8cUaXIb1n7gvE_GU1;edJ2{
z<qcz+{>i9a8<7*w7uyX;@z6khD7~z@NV4&S&`mF=IUu}P)Ookbx$oY^#DL+AJ!ep}
zE3w$rm#^?#0XOz$cmC#Z-(7dnNB&-VGl%&nArEI5#XKH0KXz%R(RL_YP|(UI%AQB)
ze0m-7O6Lkw%)465ulbwUw+eD~rF{pbjH6w@fnEQ^M!yeYf#19v1U#joVHxPz;!uZi
z4(BJ|n}hhpQGH+~qdrpIXKX_RvqZdf>^`VREuk)_ZUPOWL(K$p-DI`=r)c-ShMQr<
zEs@oyck)@B_C%rvTcRh$V-{OtHpF9hTVg+m$9-#wyAqEFwZ;=)NhDCTCNM}OvbQGk
zOC*W4Cdo-8tF<OyhbkMjKC_T`{;2i2i$scdYf7L*YFKM(oJ3kmYg&#(dU0!dwM0g9
zYettu=3r~)q(s(YYu1KD_HJwT2Z@|-tvOc`xgc~dv1A?vI*&o}1v~l$zhu4`I$ut*
zKn-1RTe8pyU1%X$^ax$#B3bN>E)J9|2}75}NtULdOLHX4iqU1&lI6|l@-E4WL3G8W
zWaT2daznCe7hUy1vidLDV5?}c;9j=t)p+J@&0&l(Q%Z0+CZ#&EHKUELL=hhRy}9|y
z?}AQ=S{;L;1XHvDNotOy(+%R%#iUJ@Vmbw~x*|!JFnC+qdg2(QliNreFhu*M7><MF
zhLoDWqXd_vn3PeysGfcX=|MS*8<}lfOGwgV4ES*mnK}lgxMKfmTT{+=Hc#m>;*CK~
z1!`sBxF1R`{GwG;f#Vb?>Z(BHgX%5!AEW3vm=0=n31U8Oms`4+n3aa}$nawYwSJR!
zzMiFdje=WtEF9oSBKl;zL#1hzMAm={9v}(Jjuj7?Cj~Nc$q~zaeel$dl_aGl54E-L
zeTy3bPKQ6>{xS<mDCy+k<?l*cG#y!^N?o&xH0DS_z{PBa)C2>Hltqz!>Z-kEN43?g
z<CW&6^D&ZCT2@>a*?JPxdfjaIE@tH}eV4uu@PpqZwZl^{Cp<6?96@~QJzc2Fqgk8}
zlQ?@H+Uaup5<jC_H~M5UWw$q4r6HK22nFhHRRLvLitskEXldSyHs|0V(qsjAiQ=~t
zRgPnYX667I+CG_M1xD8}F7Y7d%yzmKxrydZ()P~8{>$qNk%?noN8ghIlw|{fU~&<k
zDF!~y;ERt5)&yJfVGw-D;2jPK8Rx@OmCvUMmU5i>@89f@;6AwZjN7Ei^9*LIl_qSz
z(BMn*NGD6m_v_~~5<A^IrHD_##UnJSqMt9Ofx<AZ9OPydR&NpBmDw$K<{m;gv&ww8
zWrm^G7w@>|wKf?wRQcG%87ih1cGEY+n-1k09F`OF$#}Po?mwBW8jpNTQt5{U<yJkN
zr>xNK!F?;WU{Asqq{ium>7P=ujBJOUB;IJuwHJSKQ?Vi1<Yc)Q{-dX_k<)M?7@tO#
zc8}MPJ+dQAGugWN>$9C;5`Oxj52C#8(I0i#!+8xkT$w*iH@3x*SLbKQirs14rxe{+
zS#I{eqJQdtcCx?N9LNy(G`q0#R>VRmetlxl2$7F!(hW#RK}|kMd?#LEQvv}C78fUu
zQnBJ4wv~cjKh<}G40w5Hfj&zJ!B{U+Aov!UPc}7}0C+E$Yv2lXj*3h~{$K3fXH=70
z_b=>(8d?a17Ft4)E?s)>Dk4n<R3K6Wq&Gnj0-*~^Q)vnaNK>R^K_r0m-m4Jlh-^Sq
zth{$X-MWk0{ha5V@qfoT-|umMT5Ha+)|l&etrqkqR3u}CWaxBRMVcs&O6eUK4xFGX
z;yl4#s2!I@q|X(>x7i|Hz{1^)ij031NiTRIgHDI|)xn$w8>avdy|P%|Hci3z*=KW+
z7jq)1c%lcd^r(FL2=7%R<w)+;piy3WLaFIdfD4()4o^HnxuO+wguSr$@+LG?n^OEE
zeh?abD<PE1S${S(lM(KJj@z$6pCm)>1EOls#Dv4~m|t!7++i$<3EfDIC{0+#VK4S-
zGeOU-W56jZ+m6?>z6?w2um6g{LUAoR;)=1>z9CcNcN_M4&h2uN2Lww{O_!Al<Ij#e
z-FvM&RO4_^lhL0(fv7<!dO}xz$E;qSxl~x#!WDIlX^Y(4<`ac>jP&3{YbJ-({QBwO
zP46&vy5AD6b|1of2<Sow)^%{ow5L<&ubmD;ETq`oe6Wv?LOOxV-`yjOR*@*1g!{ty
zeWG+WUCIO8{yLir!d)nXoDzo<-fQi~xekWI`8n4@GYXHrziPQgrf_~pd|*A&S&!$9
zE~DI}Ju6;`YkaZ%bKTWYN)?B(MSN5ZpKi7c*)4_xq2;+oM}n8unq2R3O!?1F-3fG1
zEOiJW77?ZWY>YP?ka<*7>hy{qSwhw>l@i~#5qU~Zl{!^0_&md>Q&%19INnbBOy79>
z?BZMUF3RX?xgOb$`V82iIHif49S#oeHY8M$6nnw#IB&s9anF0h3oFG>KEGgSycUX@
zFIfNV{Hl-KtNot9E8SAW1Bh*Ih=cswr6u&%Gq!LeY_&VN5V3qKjzL%1F6cFJrmFs+
zNayQTD>$zCa{)OQ7EOz$Ho2xcsQb9$z+KcKEa%5u43%H37K;1h=nI{Gx&d)p-Bw)2
z%b*jQY|mhk@`HHjG5T6cx?(@KqFz2fG`V10m_MC7`=O5>vEhCDSZf{<k#U_laOYxc
zbav=128wc8f4LT&=Z(D#<mF<IK;3Mg#dB19TbmtfH#n`9jWS9+bMMCgX5QzQ99F(`
zWj`y{lqlN@RK^=V#L^V(Y?`(65E9ClAAQiX2_LC5*Vklix*6K6-c6F1b^AcIhn4)J
z(CW?HRQMq<+een@wDL*~`S4XW>M~a3wudh3ChYoy!Ff^tvBU4TOEvl+I<RoPBCQz>
zM&Co+8qeq0`s2cAp^loW&3f9wW*z~aLQ{^p2ao7HjE+Y08XuVQCOwqVagtAxU!igI
zPJVJWGM`d={SBI1H0-(Y`lP*d`p}iYxoE0ST(*hvT1EbsZIN?Z<eyk_*(0=iWf_Dt
zQ*wK+>c3f_wBDw38uT|1^gCxtr+DHrsv0$qdTC4*8Y8@D`b0xA*T?r^o|vPBN%}K}
zd^wtMA;0l~Bk`J?bESyeu{*fihP}7)J2oNVCG|BSDO71>#!FWje6{7@5f|krtjHq#
zxWla1E>b?e?Rh_I&^Z2BA?dqA{K-;ks`MH>VJMb~Uhi<NT)N`zS!{^e+hk#Phb$^7
zi0aHkSg7D2TZ$Av4`U)kbZXY$(QjHiGrvS8OanzMFI<=$LshQOAYbHX#GT<q`(E&c
zph%pF$WtQJA-TDW@>gH(+F)-=s6(<yMHTv_Gz_^}XAHwb*U7ljCL0T-)YpzuJH#&p
z%{_=Y?5bX`H?<7qeJC>4;*;7&A7pxhZ_I^KV+qWS6{*=*J9G7fq5sLZb<A}eSH&*M
zJt#4#Cn`+erbOOC=kEwdxz>S$4$k*u>N_b}a1_VaLzz3<&S(fS=zbK#3I@VXje@Bi
zQDHtplW5vtmL_@cb?gIJY~tlyYOdoOG3JwJn4hE^9nCr}?RaYTCSs|{6ebqyKWT&9
zVQE!&Jt&Yoz{7<^v>iOYnJ7$63zb5&8(rH>E<9x?Y=!7BAKtw7VA4)37}1GldX>_4
z3LcbU&d&jkPNONOt-BD`Wq0jW#`3ANDTVYxF1<8IbgtfyN;WW#mEX^DK^v$*By7*h
zU)@4XIq25tUUkXR7P#*oerWSS5)$mKE~nijV+gLjAn&bSP@1Qk$vRYc+~=_AgMDfd
z+6AViSf9%{a#6V*4b;+1BO~tzQ^iUyeJ2GS#BddhpBxc2jA~0wj**i8l?LaB`s)Sl
zGc>d}cxkRkpOtPeePPpdVVF33OZmiUSFcRA&bypZ{TH+#8rSj8hi0)20%f$~ldpsw
zNi-2_BW*#kiA<()OpMZ|f-6k-Xs~0I(WUt89R(7OoI{Ng84$8Vt&LM}6(@YzaoMA{
z*ygyH{S${cxK7C)W>g%vInj%|LJ<*uDjRkEbe2!75uHY*^|tJx>WbBnIb!B8!)^(t
z%ZF%jrj(`Yx`pXx4QH#l=8Z9t<&5@o30530%&k1yZlv6^x8rBnG&Ey<48ETGA!l)}
zU%%@J1Elno&FP((E%|*jy$MD>X9g%8?=!GJ;>eSlipCg?+g0#f5jWyilp1>f95KB;
zQABT*Tt{TmZ%F2f!*xN7Atm<=$xg|Uh@WbeNxO{CR?}*H?o>;(UtrE_V98fE8Sf)4
zUh{Uy#6jUiuh$H@@w<+JIIG&3(B~XhfwM@}>wd?tb9iIp&Ku8J=A&a|S7I`3vZ8~W
zZiRb}mnwM5g$1cB>hgEL9tkVF6cjLhfLW_XOmUsFxaY0SA!53-bJNJ3cRh9m_X4a#
zM>D;t8+M>XwV-wR0%7j@VkEWU4r?zU^$_tG67k0q3HK6-!HA^{iDl!76?=(QVI-P{
zB)ah=hkHqOj>1Sy3`tMKlb-A)wStk^7?PchCp*_m<_078G9*7APae=q9t?wE4Iz>7
zkW0OgD=>;ALyGJ16zRPbnJ~&6L(2Sk%Hm$idoZdBL#mp1sz<$4PhixIhSV+b)E&Ll
zJusR9Lz)p7-#WUk^Dy6*I+BbOxsa_4@KX!o`vAvk%TQn)3_aJt9H`EwLIk7IV5RI+
zS;*#q5+T=np=0ipd1%^??x<dX{yM|i#KlRJ0Q`z$vR64bgeI{b{=65CQm0if<0QMq
zDy>fUVwTB1TUiMV=LX`{am-p00`Ef@hw*${+0fe<8l?v25D(OQ9NZG8vW0^~@u;0#
zb*dN)VxJM^B|Md%2dXlg5le)W=7Kb%n9iL+K+%Y2Ie=OQL!tRt5>S<3cy}MN-H0;)
zz{l`Rxj1AI7_q31{7nM+DVr0Drd?NO_{{^cP|DH-fJS(xN+W<iV_gB!FJvQ|00|AO
z#hF06p^mJ?F~@tLcqMt%jkxo`+%{)8E9;rJ&^!}p&PsK5vNN1@>TDPZhNoP#pSU;x
z<z%uHX_?JJaf{EbA9=idpE?QcYzRulm@Q?K8|lG!wgEMp4V^MXj&m_k5FzXEu&fP%
z33Y}IG;L8I>qSGh7%+Vd4sMW*Tt_nvm%%>Z8QuWNwwqLec-W4TI&v5cXF&^%;F;PJ
z#I9^2T0HmyL+H+I?62xWX&XUl%8_%1NTq({7MgQGomOx_lKi;@fTsk4>7h7gQ8@i*
zpVUyIv=}}7%?#J#29qnA)?S_601t~nqqcC&D>DpDiQ*FK@TP2513ZHzp3$Cb-)RjN
zE-+jNhtvU!90kL#RmgwBGu*bOl*Tj6hH%rO8Qy18K+%*SH1&!RUlv+Ae+IUeKv(C<
zXNBgFKyxghnSi_zaw28g5E=tCf&~oQ8emr1*td>nNSuKY^)tT#!B?_aM!@tSG%Zve
z`DO+&kAe$&a6Ad&4^Kp~GicC;sL@CxH$v!kR#0&NO@@^$C<~X=lPuABHBB20fE}Zs
zQ-iOTBVE;@zzz6QFnt6aYjFtbC>q+<FVd4pel#0cAdt~4$U+EB^NfO9Hu8-%wJV+>
z7sniGO{v615y-_Em`!oWi!&+fa8ee_I+_}UXGjAv!@VSwO=J++tfCbxP<1E@$7h9u
zuUOOO0*l22YRM)20tCM;X{d}gR4!MYM;WLZ!RtWqIW>*fcxkTzc%?P4*4dyq!#q=@
zI2VLv3nrdOW9WsbLqXDJ4qaELN&~?RhTt*Qln#tAn3tLd2zCw4SDX!L0wZr*Gy7aU
z0VqJtGgS6m@S`E*24MP~P!RG|Jv<FV^Ja#@;TGqdHSIMp45iN6tOhN4#jwtG=qz~O
zhis0OdibRH$(pK@ZXqle)uFBld<%G38UuYnvN^3c^%fpx)(^i8LOS>`iK|nI_~_^1
zpjc0VPmI?2^_Cm2HC()Tu``UN9t^|Tq;vJm2FLi;@s{%#au65AFpdH5!?XaV8C8>^
zMel3$p>!Y6OBf_q#vj6}vH8s~xgSS1TQd!ZkiUn)E^$Hny{RqLq2WHLs9^^yG{O%=
zZ@>j<P3B`Tp*xGGLZN9v>f%qV>6j{60>O$;HkqJk+YN8TI1c_fnZN6e>bx}~5KjeF
zhp%9q?9OoSL^Hra>QJ#EWTpD)8+0&xG;M$70S;64*=jdjIg(!5?ll_GYJK`G6aA<f
ze3Jpb<pEHG#{RD)i>p}D>h~$WwfKaVPAY?@%`hl|X%@1{7SPmzV7P$?UoM`?9S-00
zp}bQCh4?Uitdu1`BR19R>mh4pGlG;3u~gmgP1;Zp_ChS6oj$2MZ)8)Xcp%a+7Zzpg
zWW5FQYNVeIBiFP2y^>tX8<=A-{4Ty6PHH>{z#<dw(ocOkZXXZOyh`IK!ypl2at=hV
zgjQ{-5pk?0H`zG35kd|{Q%@RFS#q6a^Kh)Hr}2ktZAymnZ!_3)L8R3cUYNpWE0HW{
z%AM^I*C+G<2`HoZhRd$sWKmu3aE0pYGNgr>o?8gr8x-Hc3O?6tXl^!=v(nATOSWf2
z=R+mT#FPycLYL@)+P;pm^h34N$!2ayyMf_%%)DmBIdj!b&l<A^&QKW`A*=6S`jmY%
ziH<%ii&f2&(>)8>WTfbL2GNV+8N*0d_#&<WHe@*~5tHL5wBKUF<q_Ove>3FOw?}L=
zjvP%!M<<e3;w(w4DJYFtE8o&_Wm8Dw0vtCJc>DwJRSNcuAY-^Fl<483AcqlVn2N9O
zrEKUp7i8x3ehDy5b)}f#fwM=^0Q(3#dku5G7cL#bK<8&Mi)V1MK7|FrOO0K3B<_c{
zF|bL<ogFY`N8NXt9ke=a%6uJ7E6t_*0_BYKiIBj%`N%~~T+2|b5|zmIcv;PNN?s-@
zi+(@jv49i$Z&B)QI7{_GH;RU6@&;kYGUQTU><Asb?Rn;~RKCDLrgRX?YoN1a(IHsj
z>=%;L>zR;7#&lzG_!M6|ZqB0Du!aHMu`Pz1>f&*)s6LyiT4i%;C}=be#3!BiKignc
zQ^mqMCbj5maS3H6_<+LG8}^AoJ0EqS?YvmJ+C{eu2=@Ui{2PHsTTFE`OvdJj6Xppg
z-(9_A&5@?Ye9x3UCd>L_y<Our8@)%Mpr=qUf*kvRbrghj_oYlTHTJ2X*jck+uINJw
zj3Vo@AS-IfTmJW=y)DWHl<XRqL1^Yrc*eOb7NCDty<zIL*1s!*pyj&Jg@AE-W^|0j
z97(2WuH+lXTeetJyN??CV=ga-(1p%WRbtLP9;||wXQs1|&t+Xdz(tV;f^TgiDBnw8
zRELKtUOMLKqm0*joo(T`dH-m#+S&6^yAyDG93pNg+~f7WtwijAH%GxXV#y?08H~^#
z04zlvi2!QxY*yE7x>s`YRvK)hsG|UhrjmByXn^c~MwX{|*pjif{DGL_D%eHvlNZ)(
z^XVK2rs6BFO<(lZ7rxcIYGPic4$m@0j+-je&?k-6!!rhapI~Tq4#APA5SB*?cU=r6
zU&2^s!HJ7tpn0-l7^NJI85YqTDW1(&=!JbeIYf;3ZlbC6jgTwZx6-X?>$r|JCea0E
z*Vzol-aE#wglC^tpn$No=drgI4&69Mglxh+ZIR>@>F2G&tMYqs)Zw^Wn7KE=d|kyI
zPqI0M;95chC}ERs7b2(|&VD3~pSGbTSVK+ONR3>B{Y-_58@|Wm`Qs1lyi7OxXd3$9
zH~62Gqdrge9c3R-)_`iB=|$fXdy3{Tz#qq+LEK_!x^&V|2?t-RwtM(N`Y2a|)ahZi
zmuyc!=8k2|6JUB;Z7IiQ)LD*Elen&Z%A=R2Mz3&;C7mAIx&ECEcD{k5=pw3!W8xEd
z;_m5*n#U6rpC;~JoS4Fo<1S7%-k9v0LZ)RS`aezfoSwpentH4}*`Yi!KQ%EnHT9Td
z`nMa;7N;hOpG}iK8-G3Z?CGcJcglG3n-k2Oc#4~oG<DN&Z{P(#<Jm0n6rX3>rZ`3)
zBV;V6W~cA~0Hz-FoTqL|GidIZ%B)1)bJ}NfxQpWz1|&|FbRR>=oGeKk>X8iUi`pQ@
zkNCyZdSvI!VmcQ`&@<|fArwI>9ESKsH<iV6Hy1BjE@Fe0!k;a8SS}WSUM#a*jDEJ{
z10Z2Hmv3;c_*kwys#|<w`QqHorJ<WI3hQ3(-241eTW$4<%CZkYhgmKHbl76h;)}Wk
z9Ov3}(97j#D^xpcuWqisty}oO`I0zzg*<p8q;8`sXj#~b<RjNh#LnX5&l?p%tLIcW
z(r~Mv>K2q$*EKWO;nSN_H@9A^yymxB6Smq?S6w||wXV4HN@Du8*pt=sPqwsYw$52C
znp>@5Ro|Vxxu9)Lwxz}qYfV-(4H@Ku7d?3|rOr_qOjfJLu~q-U4u`0<djGio!ws$v
zRaWl{r{9-N17_HVI23e{i`=sw!m7?uS`T@TqylN&5a1z+i!wgZtH<sWN59~Ctu*1G
z9K{V95dpfx>LNsNAYD{k7s`W>^%dDJo7riIAVunAm~C+55=rFSrK1e<6cTuc9Pjui
zS|17(=Fn(@RAfE9t{OMGm6Ej7%`Qzr_B3_fu_MRWoZkD|i+xW+Pwca2Y^^9do^8Y^
zDJ>+!XObiv`H<0kNUsGEC{;Myal(zSUdmRUXI1+KXG6Cw-EdAf71{?2*5niMi-6F5
zRtWe^t?+XjtVp)_1C7%C^`F^b-LkJfLse?Gzu92xUA7*<w5oL<-)+5^cydMcNs!O8
zkq<kx)|fpTEN0|c5T)o&Yu1_c==xB^f)c=j!2uS`eIY8I#r=X(s|Gv#IKYBI%tx(b
zgi0W%gURb4HnEbsHrV@Fwo3|YdQ*}1O8^TNB+nlf?qOZP6^Y|`$3xGZf<7Hh&Ddab
z^?1=zIIFB{o85KGAPT<g@|FkfQ*jpwESORufd!jkjt5vU{VyySgFiarQdd@_Je%+K
zM8X9E3kLs;_`-r+C^GrVf{EBSQ}Y2VSf2b6z=Ey0?6P2J`{EJ}X21sPK6LJG^+TD3
z;)f;MX!Z*bu26H+jl9bUZU{bHO2pbIDlw3Axl@eW8tu%772OeR$hC}$kF6Y}d;rf9
znX@+F;YRg^L$cFeJgw$a32?2rQ~qMD<jpgx3_AVEcDE;=KU2AfJa~S1{UXw}Ig}ah
znH0?|l40mv{bZjB1irH7$Qz;iz8zmxk9a>({lxiWHgmsms{U;qfuhSvlOnj#EdJW`
zvYTR%>~8v)G$~h{O8WAddJWnm-hDd7x5=_q#b~A@%VP^J%S(qroSP=)6uh`Z!YJ=a
zO<X`nAmaQ^6*R4oIChVqWy|@lKKXd2`v%-1BQD+O?c{3%xqBiGJ^DLcXL@yM4gByC
z(@O?`4F>g_9nVH&NO9{GrOG#3?vH_7uq`<;k{ShTu^txMdAE^t!K}7-F}u;xpfGh#
z94oKS<Vn=M;HmGGc|mcBl!-fK$#4AwMUdY{GxEyE^IZZOjo5D0d)L?dHQ(ZM>r*`%
zD0FNC{0Hl=v3iAHOq+f5a5DZP-d-%l<G{Q0{UP$D^7rYhnEBb$V-?1>*9xPbYd%tR
z6~~htPEn`59jW#nCgxA=oJEXeVbxYTN)lE$Q%@g-Tgd2<8^c(5bb3@RVhrWDNV*|d
z6OB2B1}fSy3o@$$j<b{CQ0Y6_G&Ccz<Xtn+GL}f%U`Uh4DOiM7r?u!Be<++iH%dRY
z8yM<p6gcD&Q(2w@iRf)aIrT+qI^SaExK4B8KDUXL$WD%DM*cpbB9A!dzywC&vZr#C
zMkG#7SF_3!Vr?N#R{~dakUNl8f(^D%pTkK3*kD4Q@e!v08?3NZN5eBQdCP`VIJ$Ml
zI`K*(iS5-4kJ3ZV5fp0<If6%{4{e$`lbI*yFhz<(jV|DnPqg>G;p0DSVbOLir*mJb
zU-V(<@@5jm-%vpk9fqd&3J}p75eYW$>|&QnwIkvaNytvUnCF>3xyt8!X9=*uJf+;9
z8`-so#O_D&TvK3Ayxg7I?Q=OPbj_AdX{gP>bJ$D!?I{2RQ!~gLOA=c$T~z9LkQ4MC
zmc_szpi05ogFItG;<$BNTP&upd(M#LF7;XVodhEa3}559cGKR)*0DYhKt1C<)^|`a
zrT?mDah~7>L1C=GK!QreZG~7zJ=xjV=JkqvwNAk!Y_=wulF|kH4hR}mv0Uns=E*U=
zyCRrQu6yMI143DUgxa?VX)d6jtl7H4^gsc6FZ6)wnFHkJT}9fJMOB5b9bcTB7Z{1?
zzpCQ<nEO<fS+rvAF_J;kc(VbIkqX~q_aZootxh9GaZJ9dkw=`_wGR>(JNZ_~dXth?
zQCc9mvDw_C!hvKJsb;9g%#-`>I!<FPE|)M>=3MMO_W*u!s9YwaYO2$vCTU_U^bJ&@
z6BZQu=w$6f8P!&r{T^+OlOLq7*MN?ZoV|Bx=k(kGvApbg7rl<M6x%j_P5vqL`F-!F
z)^*-0&+W^%?kVoy3i5e8=_p1z9q{aG==r+Yyx0Id+ca0_Ov*XCd%?d^S$!(1c{2ah
z?feOanTSu<6y6+gbC5`%qCPk3ur^AK>3I~6>3^$mhA~7~=fenX<o#@(YJ=#br-o_C
zJ)VA?>b_(oVuR{8tCe}i6l;<(<KYld3J>azv&oqCSiS#rNM17jmGE4b{&7VEgHlu3
z*m;pxheM$T<-#^NL$B6bt!*Bi*qb6Y;%+*fwmO$nWw8si#pWc=&E4tRu(P0^2i?4!
zk~bg64lMSUb-BLry4mw+QDS1O7b9Af_2T}L)XpMH7UNKPp4imB10Nssojkqxrf!_a
zhu22x<c#+z<*8o7D;6YqGCoE|G%L$$_Ct4ls~pfT4HrAp2CH?%*o9547cs_zkhRy&
zsyALNtfmb;W^&mV^y!#}uImU>cbR~29AJa7>2w`-t-x-ZP)fd&%bL_@KJ(7ST`Jk2
zN3aIceQ`-AGJUE+g{5|Yrpf=xgxnfng9Yo2FUjXObuPHxdp+eEkn>@h>SBC-y5_nu
z8+&~#Ox>PfgV7dDP*0!HBiLXhkL1pcQ!{<B!Qi6r82NAR+F(rt8*EK8wIXoO22%%Y
zFiqMvzV5>t(Ox$O0tq(Q0|$Z)M!UH5tlQ(MSjonnbDxwrecv<rKvJJm>o9etfcqaq
zwMyB}uG*<8jz7@rE@gWx?sD(pz>ui#!}O^&j!YM|WeZo9^N5#znTlg?KfgKIBQgGz
z;-drk^b)BnV1qq5G6Mh28Pjag$9VxJB5`FP(={lC{1Nw(<~@Ivo!eWPfDI;CaDhB^
z^0gp;zQXW}DsuJDFC{rXr79i$fb9P8CShXO-nVDZ26F>!Fxr03&8JisAVqDnFJCWF
zy(=ENK52u!V)?}e3nbWJJYye)9&7Gvm$<0h8af<!wD!&Hy`a^z)1THCKYu)UIyj*P
z(WSeCA-&JqqZ_cig<A9_2QOWqba0*R#jG-)5PsuIzl7;M8$z8D(yMEccRTn^O$abN
z;PE<ys>QwiEJpZ#D1;?Ym@$-=#dyyK^8;)!KXal5uT^ra!hNi4xR+3CsCH|hC?xFQ
zHydo}kd{N3$$cL^Ncf4bHW-L6+!PYQayI<5Uc{aaR`NC+-5POSCc+T{%*zmLFwUw7
zm#9d#HxWLqyEfQ%*!h%5tl#MXNL1vm4W=oF30sP~W*>D)Aevx<K`cVIqf-5h5*(s$
z05(`uR7yc~&ix}9keGbH1~ZGer5AH|bVuiQK};E7gF(XXEXCBwX_x9<dPK0ne5#`^
z;mkB2F74W25Qln!*p5-PFE$v9ZaZLuIs9OQh3(m31-mww-WMAzdDjNpxwUJ9E$!N1
z4qt3Ahg}=246wl*BK!awtdz{dmSBUO+_S-8Uv03_D8L4r5g<YwjNY@sJSxcuHdv`P
z!3M*StJ&__V1m0gm?IDAcQ%;Ct_`NTXM?5g+F*#UHrNC0b6;$*8O=Q#46|#45xq*V
z^8d~TTPOc!gH`^)2Ak3R-UhSYv%w0rf3U&KcWp4oFE*GuV1psPv%wDT+F%HR4aUHd
zruHWr%zf7edkENI6hT$*H2+|Oo!zy;ssI~o`9k}$=AI4a_q`2<AlP6jyEd5G_cqvr
zT^p=$*9LO{Y_NBl-`ilPc5Sc%f(_>Nmo}IRV1uRY+F%N-j4`*UM}Dxu)Bziea@Pi1
zL5Q~JEdQkqmZeRw!D9Xs8?5r14VL!14R-UJ4W{tB4VJxYgXQhoU>CpHU_yVg!Q_mu
z0XA5x17L$C6#_Qcg}l2?#i=p7HkjF08_eQT?V&p{P6QilRrXFt+O7>&6wxkp*XIzy
z26JP+I~H@9V1vbY0yfz6t_`*f*kDd^1RHFHV1sq;+F+J|4JH&zu)$WsN89g-tPpIl
z>jI_3irEAkEP!BxB{)eaFO@QO1R3QW0c<d)T^nph_tY?8gRPiX0XA4i5NOv1<Jh&q
z7HaN^9FAeywZR;8cWtmVO{rdj4R+g?V1uRY*<d;Z8?2?K(kQ?^-RO|P$(?-F!&u|u
zs*?=IxW$hh@5ra;CE|Dl*kHOnRpr)-1!s0`u=Xkh!3KM1WDnS2k1AnHRbH10*HG0A
zm84hyr482OOCGdmgJqE&m;PlNEQ{>eU)f;B*9bP)sNxSc7)9CdHrVVp8%+2+8%%N6
z1`ANFBG_PTys#f_FsCfCnDr{a2D=3|HApTv?X5$R&c>3#?%j^#xPz-S!u1+?E{8mP
zPUey0&B?Ftrj*|Rr*5q3Q`+CjPSC<Oa4lQ~^3Lp>vAn#_x20;`c;7ZG;Tkll*=3v?
z(sUYIvYRBRpO$+x2`b5dE<<>Zu-7nTc{6Z$3pME+Z<>{OdVsxIr?W}#W7FZ-2G`>R
z8|;omv)yp>VwsWI9pGc!seJj~?5Dzk&8C5kbASzY>gkR|tG;Z@f=6pZLNj24xqoa4
zV{ctCYUvDVd12IMeyTF4w%PMktNmnKb6@M{veqXO?JGv@PKi6MfDM+H(0;qNeJP=>
z)uZjRL`R!Zhtp)!0p^b98|_6O+rZ_m`L&#llO1<sJF^nno18mN=y#+~b_T?D^xo<C
z(A*ir-WJ8)NhH}i65BpT-I<ipIjh9lT-!zD+0l^D0ZQy{EbD$s-HpR{jk33w26j)f
zx4rt<b?#2j+-lEMU}wr|=bC=ks#0&$Mt3fI4_+Syy4XYP+4QNl$D6zFvwpYDslMdE
z-X{sY;QsEu<dz2NZp8l9ckI0pcN}TCyJ>Fp^Skuz1UB>D?dzxR7f<Zwph2;`?9b5e
zQ@q=&^0<fgQ@`dX1pl3W8RIrNWmLtTL3xe=wIe;cE<6R7c6_8XhP2{_N;3L|T?TsK
z{bGrOq^D6jG(#C8gW{pJ2NH+PyN0#zk{yd1q}?1k{Zh%x1*Ow9Wb<j*rE7$>dRR75
z)Az_oK=E*Z^3cV&(Kfcxlba*a|IY@KFPT;Bo>g9(RfW!}i_U2p%xSyM>0X{YSTc9G
zd+x~E+)?Pfk?6dM!Td4T`4gAt%}eG_cF&()o40~4phXvK3>NHM7tUT@a4cCk*S+Af
zw%`U`^blS2G5~T97SCT^^e<Tq=w7_Iwipau3K3nx8Z3poE=68miY{5Y)V&n9wsZx$
zoFKZKWUzeIb@}?`<<yep^zP*wYs;C?m2A<K90MSkVI}|a|Lryy4Z#LG=Jxu;mDg`M
z{+|#QEH!}9jSKNJ4LvY`)jts?mlPhj7Or9uq2wNMHzeZ9V1$utRF!44nrC#mcl5n$
z(U?6X3=qQ7VzDD}C;ty3VF5oPVVM7|NZ3CJVNL&KA#D9`g|N>5Cxrcv62f?k{wRdG
zd@qE-SpN43Vb++wKMP?AKNZ5p|56B}68eJ>W|u4eGa<}(R|vb9NW?-hWYh8wLYVF7
zHzCaRJ0T1v<cr!B!WsxdSkgg>I20g+r8d2a=14azItmD3u`zN9qhE!v)bE6_4+J3$
zevmD2PY83?B?w_K?yo}FQ9j_Un%?(9nC&+qO!k`)X1gndB>_U%=&le3Shz36w+?<2
z!canh5Qaj0*7~^+R{fVk7zy_ug)rM6g)owDLKycCLRjiw3SlV+zZb$re^m%8__spX
z+3$ofB1zky3t_mw6~d_K{z?dw*cHOw5ri<FKMG;21R+fHSA;P2UlYROe?<sO{||+*
z^gjq;SN@d{=KND3EbUK17>VY8B!p@Hq7b(6uY@qyJt3_3k3v|g!xtgU2JZXMLKw49
z=uGII5XOl7UI+t4{9FiA0feylFGAS0zY@ZT_JlC6T_NlWK?rmCT?or{_?JSM)E6PF
zwTYqiXF^z}0G6pW9uUH8_Jpv_KM7$(nu_DUB!uOC6T&vYjNc1k&;N5FZ2XH5*7{FE
z*vtP+2%9AcVN{BhzYAfgFG84pOwj0eLRb!s%dQaSru9V#GyG8q3j~C)?Y|VlMw|A8
zFcJFP^{hQ1tbI=iQ~zBEQ~N;(%laaOMeGS-dcPusrTr*`Vg5-7O9F&22V#U=_j%(#
z3Sl<8LRk2BLfF9XLYVcg5Ek`ULRi!cQNfQwSnA&hVd>w5u-^Yr2+Pc}P5&x{1^!$J
z^ZF`;+5UnMmH-H0%>OKeW$p=K<-Z_=wU7s{{|g~3^AAE;>kmSh?cWGt34aj6k_bXr
zAVCO|`c4SLd?$o8k>~!C5SIBL3t|1=31OlC%R(6T|1UzA@$W)d@K+%${i_gG@C!m%
z`o9#y0(%KUSgIPCm$-1;o)ET9Q3oRXK?qC#CWKx83n454MD_<EEciPiENV{(1Ci|s
zVF~{vgeClq5N7+G5SIE+LRjt}gfI}<_d=NMAA~UGe-gs%c7?D^>pb5*A?*EM3t<J~
z5>fwKg)q#2O$f^ags^zBdJvf%NX@0R)^}G3%lu9VvjdU({yQP;@Gl5qum4I2b0P>~
zaeG48_*Wqe_TLo3;tc=25JpM%H$oWfmxQq3zY@aY;=c%C34a#Cu#_(1|6T|)BnV-7
zKNrFh{#FP}_$q`s_L3cC{huj>mH&?v!lM382y-F_gfLsRzZb$t$-W6;w)MXtgl+tV
z5LWQNB818QFA8CA|0IOHp>X^wA<X)#5SF<oge80t!czYrgxQdnh5jIfW&T_Uvm+1r
zUI?T6Yaz_{s}N@Ui$Yi*ne~5N2($fB2($h>A?z(d2($k031Pl}FNFF29}vQP|4s;d
zC@(lp5W<i}D0P`1gs`-q3t>_}5yC?L>q6M2--R&eKMP?Bzbu4(N`1U5gtZfdFrRNi
z*o!0fAO5EZVM2=kB!p?~BNg8j!X*Dz2umjjVQB;*OymzjSRNpRwGo7{wx0@N8h{X{
z@()57^HtXIJs~XeXF{0c??PDKUkPClaX<(=p(UeE5W<83A*|zH2w^vWMF^Ap*FxAr
z%3la!B01lLFz#I;?3$$HpM<bTKnSC{`b`M4P}vj0KL3&sHu2vR!s4jC2truRo)Cs2
zM(_?mTu=ldEP`Y8J0T1gsTW8@Jv9pmVPLZFg)kC82pj){5SF<ogc<&V5C$UqlMsgE
zSJ@N75`GuLGQS96>o`)|p9^6*|6T}dB?w_8)ISJe5ad@O45j_ILRj6;g)rEj5SC65
z!lD5otPvXWM<I+>+`;B|A<W^Qg|IBlHz6$Qzbk~D)BGlcfg2f8`T-#f^`j7`{ofP9
zvH&5h{?9@ft7iC7f)M5h2w}$nA#9(%=_u`K1waU+qR<0`up3{5u%(|0VS`_Vuz_C?
z!o+_jgem+~2t&|+6~bV@3t^>1+Bdcv03i&jpPcri5Vp?ttp1A-M#d*jw=0CD074i_
z;zuFu`K}Q5QG8bjb0`3Wu;eJQ+8>25YwfV33C{YpUxcvLKM7%pza)g2{vd?aqJI~{
zh-r3(u;gD8!tVS;2;2MzA#CucLKuqgdm-#*l$ZXWg|KIPLfF#35W@1m3Sl64(f2~w
zyMHN!Vg5k~llUbeOiKE%gfKA>#`#4()j15&C^&$p2LIyz^>d0;>=pDOs`Lqp&(q5t
zK^QGR9195uN&@PZQb)0X$X0I?1xg(=4BsKqifvPD{M4r4#FH?pm@v&l=b#n>YONo@
zR!LHU)u=;gsX{2V=-_k8@V<zBrcDBJk%k})6{Lx7o9tE&&T9rk4vQp<f6O2+P5<t3
zP5_qP<3YYxwXVM6nO-Fj3)n(f7Va;Oih4SwDJ!f*P8qM-FI=M=tEHCF#HfeU#b&bT
zsmnR%O6Ml|VX_J^*fgicdcVdq$(brVGVp8+g&ZAJ4n)69MuU0OKPyMSAxG~|3|g0g
zdk}#fG#23XaCIDf3`}eo3Z4;n0bzvn66O`lkCA}TQFKR@6!;5t`{5CzJi1OI@@4}O
zi627gqX8rg?E3`?lixYzt)W`bLO{ZLzae2E4qCT=K*GFq>M_lUdq|j|1_24%+C#!H
zyGR(R7l4FezC*&ci6RC8Bn)F>7_o<h-C}qOA8aQeVHE%phB4?RQ!V`t347H-z7)QP
zgq7X-hJ=BR>j6lZg8nxo?89M1Tl-yV0upvfiTnh6N4Zjm7lvdc;CCb}E~8CBp-nb*
z7YU0eNeOHwW!Oc+6#s;TMG=s&of0L|X8;mLwTpyBeMQ2~0Z7=xuSi(P9ujsl_YX)|
z*)9@RYG4f@Vbx!dF!QfSm>;o7Erx)E<row^`htXst*f>HNSIew-}gw^D1d}fXjn%K
z#kLK5e?h`-eL=#)2}qdS_edC-&sQXj5kSK3_w^8vFtXz?0un|amw?zq!paCp7=Jhc
z2}6<g(Q<!7!XV;%NEpiibe<};secDh!fK>6D2VsR6_M(ff<JtyQ6j-m8>${)<l5gw
z&#6ZgqZWQ-Gm>{bQof+~=6y0{Ig_>zy~>|Z$KCr_-j!VACL(4D$^KB|nuTS#I4Ba{
z8$xI5zCnI%mBO%;ROj_2>DQ*8m&K0X<vDS2h-zg(_8r-N6xK&A%ug*`&mk-mMttbd
zF=-!DbDCTV;bA$2<F*_q3vC81Sj;B<aGlwZ-Hk+b2MoCbh=MnP(GTMs*Tq1j==Rc-
zTM%5%z(uLw@6j|&R@x@Ifu#_@=zNS2XvI|IG+Rc2sqTZ=P-LnFq4$&`WeY+%tF%ei
zL9BO=^EnRRXBBtkI37NgDJu@zA=y@-(gG2KFl<21bzCN?AqLzFK=Yt0(g{FepJK}*
zlLL7INLaxSNZ2za^3w&QWJ@5BwtWAKa3U5A<^bKbO9~~iqx;aK1HI%@E)@Ag6o`P)
z$63eo_S5UJVCJL}$|pv>vIak!j|nT&kqC^@FIO>Gn0w9}DD6vPDecZ~B#DVL)n_TA
zt2aSsg`L!V@JzUZSik~KM~)Hz5%&%h+rjnv$T%IqZVA!ydgAFzk=JuAYD+DS-iTN@
zi6M^yyU0CKXe1$v6Sp%1L;Nrlqr-QmEEWbv>7$1}T7;09VaQl2BvLT40wJU+7-u*c
z)C{vjYAuI&4Vumaovb)b9}T8lmn^%eP3s4Oq=4vOhL^u2U16N0NC8o@)G(%i&|aYw
zEM-D|fVKzX(N2&}!7x#W$eMvDGRP)RgJ=cXg;Fr&kTFOxsc--$cfKv<r5xq@6hyq{
zgc7JwnC@ni8r-piqgO1M4a8LZ@X1rF>2OT)zEF@rQ{xcbZDkrohsl&E011<BAEN5G
zNI=4_--sCd9SOUyp+5y*9;Y`N9{P%et;Z_7ARu81i5wUL5|*`#gyrlaVJ873OpeI+
zFlE*ls2)JVFxdnoO#M>Vz4ARIOz+GNb&&2HfP`6_Cl`N3!fbYtFqUz#g=u;t010~l
zAYsVn?g{`2Yn6er?;>ITXKIv4-`VaWVXd=K01_rJNj+?B=#vBmkg#{gp=w`|Fz(-x
zuwzV-$9Ivi0bYuO-;gjNyz&%YA->bV5I>r<i-b7<NLU1bgdv8<S?za`Fb4t>h6Io>
zkh!WrNcGcQBrM?YX_hd)&sxM$XA<_1Fg4;DULsKf5{B8{-z)t2j0?)T=S7$0`l46C
z^d1sc_d5~>R)vi1@Y;?6NEr8^kqTdeA<DY%h#A~S<2T*}^{nTNSxubXW+X6e2+Eq|
z{zUxL645Ra=6<{9$mIkYgIE9wJIV)<1duRE00|41nIRxyw_JCTFjTnU`Y|gMw#0np
zc92srBn+iSs`v*a%x}1Z$o{}<jL0q$R`>BF4r>c#nPm;Lr_V;0<SlrK-=zmvrB#6A
zUg2wYk+ADDN-iQNee?-Pn2+zGZx8_q^AGAM2avG!=ky!s#7^7eyGU3gfP@83kPwhC
zDNg_iBetx%J6p~H0(8mPZZXJbO9a=L!M=zc=dh+dBuva~`8~}T2LTBKQ36QVqq+3U
z*#>(^*pj1_28n43krsf2wUgvj?;>GlPUi2!vNXa94MH}n0VFK#=**8u*tXr7i)-*s
zn<Od+0uq)*K*FT>=pMw`5ACC4d!~~hoglG?gsr1z03>YvD-tF=u?Zky-is|N<bn%r
z`-yEjWF~|MS7&%;Bv>%#L>|<>Scm9Y!2KU8_?^_B0U>I1*Qh~|QhO&;00{%JooyN4
zL&8u88OQLcb@D_ywg3_~X6fk7TYGg631eG_XAh_?{I&ycTdp?@=TDi8Sptx-kfUm(
zrh7=(4EDD-GkE|Krr{Pk>J{v_i-ci*+rIe~3A?|Ggr)R;LBcf7!7fIKHHQ_k5zjNZ
z6MaL%Ox7LWi~~p*dKU?!I{y_3d(_#?xrc<Qd5dhoufOb0>ZzGTTPXH*em+C*2q0mP
z2}qduvgNu1-L%KcS03(b(~owMFr@w1djJW`Y93z$kgy0b)C>U$d-S?Tnt+7m0!Ww~
z36Uj$gw-0DjS-MAKjO<WKnd`Wa!XtSkT8o^7x9j?yGYm$poHxqVK)IJ%-=0^-79wS
zRo)&F7Vq}{8xj`vS4dccH~AhC#?nE=vJ3=|JScg{aan<+d%X727bJ}R3ljD~cKr(y
zc2*1%&}}=uhlH_At3%9_rFsMiNEk@(Pe@n^fQ0p)jsvz~^;aYe<wxJ=!TEM$7YW0}
z-wm(XL&E&9@u%%c1hj4fNLUg92@|^ET$SYFBuqfUS^*@ibr%V%AGo@Ugk9Z5!gio3
zuM<A#`H1-~MZ}{~VdvDcqDrw$1>iGAr#S1uZr~E`b++vOSFw?dbwwdTpsk~Fj4IYn
zDj4A;)Vs8L=8Jgd)~Eg@+hlXxOe#x-!4xTnr+-TiiipY?BQ^_ZOb2buVoV?y7%0jB
z0%ebqL}9AD;>lo2?rZocB66}=KZm|sa#V1{1-Tlc`Vb-r#w-wP4Qgbhofb&(Q?rX8
zCKFI%fvw<)Ly4bduxYx7;7DoD9Z>Vn8fZ*`OPD7cX2m=`%S25r01Fw?zN7{kj0S^}
zB0>2I`_&4qd*xl=5Klw#tP%NrY;-XHrARzDJDSyy0|Rmyz61xI>V31*y9m6qV^C9I
zmcl%zXy>EW+b&(o%FyXEyOW2)B-Vc?gjEEkaECwnQ3!jfSk3A5<a|$hoSUC(VEd<p
z=&;&1@)9FA-+ms}nO@}^tns>j*DXdS_*4Bh&-5pP5H{i!JoTO+ge}$#AHQ@J-#@<o
zByw15OZH*LnK4~0C3uQlRsGegqE&O}4aBI@WRC35IRMF&ykj<Ov7gb>^pa%AOa4yB
zp3>)N$HyWd43V&D!4dxG4DQR?P1YK^boocTxZ@VLaX2u@T@48cVg9*}_sVK`ll1F&
zbdnA`H8wIF<n@^J?>o|B3$rHK$v(>Vxzo6j-$-(-na^SdtEUv@92%4A(Jr5#y2eEi
z!d3*WWbbCZNq`4XDiqvo2T`bH<-HzbC818x639(pE#$p%)k26(py<^2l<dZx{Jhln
zay5<@J~c%^3JZ%KIyw6u0)()#l@pXsR{ArMcOI;y4N1o@ok^3aERQ%SpuBeBPDyh4
zLt7wYOHjw7qlB`kk|2atA9)xfQZq$Q(Z%pAMzO?kCNZGoe!Kmn(`=%Zbk8z6VdZPL
zEqvkoA9p-Y7kl#QeZ~HVUxcv0^@Nr86B8on<3;3BR6Pg|u4-{XXzh!{=j*OYliU)m
zBL)c#B9Qbu#lif=J0cG4!jF`uMFjQfJl%ZjmwRMW@7OFT8TPZ!9|%**CQnKrk>pn#
zrFl!y^6=#csln^r2@QN=Cm%1~I&rQmKl5aO%Q#ZdmfpwppdS1g!?pu+o={q1*G-j1
zh)a)a$7nWbQ91)WU9LM@gA7rzJpe_z+^MKg?Wv@T$`73E*EwK~DoI!QlyWFt#eLNC
zo$I~I1g(@?p&MnYFHn-<9NU35ksQxkBYOC3JB{LGGPjAE3*27Ro$j;?{PZXgN2ID$
z+CZ-w2<QFH@+6zOZ9f$8nE`#9<u?)9nu?m`St6l+h{|DD*;rqzl&DBW=QEdewfWBR
z`{IXr$MdqDzBifN$w=RSd})Vd=hIu-m##!~B&MTW`nDjfSZFDAumcV{o<gd!l2A_?
zlTTqXstvcqQ!z83ndGu&UTf%OjF`Uk;}eN{U{KJ&P~?72;xKMNOYY{TRy0Bjo}E`P
zM>Xc>9Iye?rCf-Y$Y~>^BmSsGxs?#=;}F7-$}-`*&P8Tudo(~WK0-C+ww6}b8Oj1<
zq)_t06+XjK7Ey6VgtQs<IY!-GE^yZ6Of#`VWho$p@o-u-6VKzyqTFKWxwwaQ<?%dl
zB>^H|L%Oh|TKBwt-A_1k<H*M<aX|%Yq$(DMoG#8pF@y5Dj2-|M_MV5{#X*-+#iQ-<
zyIIDA1>oA9R+e<>r+nDD6oi+hMC<8hdnY9UG-vckx%CB?lqRK7Dvt+>-EDjk`sI;~
zer**uUgwYnydZ}fm#TTN>#`l(A{VNhp<S(ge)w~*jw+BJV{k#zU|SC-8<P+!zM*z~
z+ns|65mh8%+{>&~ughzkrGDzRQ5rU*Wzg6#Lba2K^{<66PSR#Rr7uF5a^XSsm|Y=E
z^uRJ-`#P)L%G$N6jg$-vFeO%InN1x+bk#N~dc7)<Ty1Jm2_r;&bPS-49f(v;m9`ym
zzGWP!rw${cyDhi@BDXsfYIJGlp~OSAj8A%;EVspXsL~}{;*`Q?sjPT@O$fU@Uwra>
z%kY?-*TJEHb4lx5%@R5?5wB)4RAkbN4A+X0*|Bl?>wUDG7+6JZMvI7~MEL8zuR_?w
z)LJ#!y#%mZz=t$e5`qvW>gn?$bWXD7!Go*99ybo3oW7k!+W%P8*Z<Mvs;BJz-Y!v}
zyAx9zYrfEzr>?(j&7zT9b>~ctKkc{Wp+Np@)3@9F^ouhliXWQoIl_y{&X;&-j_4Hn
zACVFOPAO!ZqapQBvN5Wi^_z32H*mum4wONHnYI>YR&^u`0dkXQzMU>#TNe~oB?eQ^
z9q3GH9p5ZmREC2-&tjoBwRW~&#n~-k$)oOvQ)zu*)1bC#S}oME^B<#i$rx@mu)Hd5
z`6_eBP%hK$6#0=4;b=}hxhAQ{p4Z-0&5PFPG#x#D<<prHH2WuSk(H%3?8gY`Slua8
za!t-tUFvMEx{YC=u%GvW^vy{DLRduiiDVOTyFpX``1hd7Cdmy}$>NBH#mCQb9Ql?R
z3>6MsQ<1(<UlD!Of!GadQzpBpZ+LoBs--xHlvXr4rc6bb77ro_VK0t#*<3l2mE*{&
ztQWW%Zy#+bonvKV$4>v@Y|HKP^7D^5jFQs2x-`NzZ84BlSisIu)#_r=2%c!<E>GJd
zaQM?)KnSZ)RDRqoUaFf^D=5Nt`K9=kvbS<AwkPgic^i=?y~XicKjhI=U7yCwqPQ#E
zofR}TRQIWDOOJ;>dvM49wwzovTi99WNJOGIAcTo-PITJXet^cN>UK+AydEpvcBiI&
z<drLDWuUa!m3Llx6F1b~-aae0Bj4-s*bbJ-GykYbaxB92mDnr#Wh0Y^4zZkD1?C}(
zCQlTGtv;YH=}q;;e;!LQ>h`v@S6HrF_3mrA=~F<bA$KlVagz4o>k`^Wqiz$@d3HiF
zH)T$q_j?lcOpN1gcvXW7R#oZwZ=!ZpY+KWh0`SRHqDNX@KsRZ35(1xpVyx`+s(VE>
z;r&E8_@>Qo5?i<Oq02cJF9hLv(u#wXR}V5)wAKwRcLdaQT0h$o=YPDlb@^hQDAh+i
zTy@Fr38#kt%*^a`5VTz^sG8TvcFE+)`_;7oNY~@Tt31>1N6McXJQn-B0Z-eUYl(Z;
zbLEv+z51RICKl}cAn5a(Cp$gPZo!{sGpF3;bazOzKqXYKx~#y^tdi`LMbcFEPaC&T
zC=%DqsWIeRZBz+OV~fk7N3~Q(pK8L_>wV0!AQ6V|+pH)qqq3EwS2<FoyTHZSfDo2N
z-E1}F64TYBqgZ)OCXkq&6xUtZ$nPB5@1V&y*+b2Vu3F#8{3ysp@5{pF9G#aEC*#n_
zzG`wauA5Deu3JQN`hK7A5;04!1^hBsA-na*R4xR4icn=JnL>}eIhR}l6uO~Ce=3P-
z=CD$f3F}&Ro@v&{cU;IbOb0qI6*&;I-wI`aW5gEKI6p&-aIiw@JonE4)Uq>m;z<K~
z+^&^3i#o9!(jn55p<;nprg+?3Z6CjP8-LUpHfgYc6Sqk7nZc;WS1-x7ThF+FV8za%
zLyzgio<E=1!p7eq=Pf$qK+__TNC_{}o%hz2P#BZ!r`rF%S!ykt7eX&?KYL^dRF~bd
zzetzcw<Wn!Ep<jmu3H^@6+d!Umu&_lXw)Lx+$=S-bC_=FW@;zT<1BRbXqWR-G9e6(
z-#SvoHk8TTns-$FSX;zYCAdf{l&k0jYd7(B`1EZEk0jIvvM)zwp<}-{&jnK+w_G)`
z&k-ESvo29{&JJ^Vpj#I@8x@UP>hwdVhGz3xc^{YZR`;6o#)obS(g#01dSI1E<>?jY
zCElZlu2gT}#$)l~Q8>8aoa>Cug>{hZLbLqsoHb{Cm)M+xuC~?QbIu=a)E3OZ@{uy}
z4WjYtSb1J<wK;V@TR~;sT0aA}T9oS&G0d@1fxSh9K{G8rRJB^2Z8B7)^0GB&<Z>4D
zTC%MfB_DcW-trCci_s~C$`GdHgXow>^svr>z@1LMPR+CL8_zm5wgfgP#oII8uy;I!
z)s5ld&JE$Pjy&8QAy;X)Vr!(nMy;|Q;)4OJapgMS(S!#!DEJ+s+txU_GS83F;PZpJ
zQQNAo%=13g;d3DN_RMmp&(Fue)m9o6M9zAZ&$xyyoK4Jk0+6sY`wQg@4br$#eH(fV
zSV+K5_<<U4CDxgt(fDD$s=f_firxOpTmnj9nYD-`p*H8b$qrp0*AZ>gb0r^`B(u3N
z{}7X>N(K&otU+UVY#TJ@E@VZ=o9C-XY}Bk1#Z7dP5(bXucM)l9HH)7a4WX`7$8R^X
zd&A=DOknX14AMlz@-UL<D+ixBG_HqS652_#m^b%o)q%-fZdnqz@?OBD-b}EH`0BI8
zs}_Z#=;dqA^Djhc(yWJwWz9LiIYBduBfHzU-;Wv@)}v(2C^T5F5Wh4&)5vgN4W^Il
z%P25D-l)_@O&f)G0p%IK*Mva~l<tGn4yYS?4%}E+?%U>F+je9F6=kjIT(ft&4n$EM
z(x(h-krY5;PtzCgCuYg5?^?=t4lGg)E84Q|lO<VVS;1lL&wAX1TNLdxuMY7l-KS;A
zUu)(-K;MF#Yz^$)E%@wN?b(zHoUL#9E#bCa>qsa;Jue@zv%Kx>2VIIa;kC|=H+Ber
zeloB--*>e@RZlbWGh8LPE%@fZtHPb4Xrcmov{6_@Zp9=`_i97>Lj%5boZ|joerXn#
z=)SNw#i}3A72DEs$HvICsyPRSx;dFJq4zyrSLaDsR=jE8+*+>yvTbo{Odo&Y(fT62
zix+boyP1cPa{yzOn}tX7uL~Iq9x&^Cmha47pqhLxv&6Zh?oReTut&)iRmg3>u$B(j
zhVhg;y(Pqb{kC^D(b)co8_x@GzQ;xeg>E_uL~`$oaU##Ye6^HbFpg6&R>*NpdO7VG
zQSzH5w>jFKr7J8^V0JSc{G*kdo<&}DNP6LZgF*+e1UV5tMODAxzU8IT%R)kdTpjNl
zMZFzlHC$>%^X4ua^OiZdh&bTWc5Ef?r>d@l>l<{K<YR?##`oWAE;f@biLN?JJ71<7
z+RuPf)D~Gdei&ZgrpTe2DrtCZS(ECHCVf0KV$Ib#<&Nsoow<@!)%&R(n-PV#oSb{v
zq3hPgH&?or?mTZ!k&_VXWf~XJ%HVp39XGT~Sr0M7GpyWJqj8^n+pflo5nwtpi(gqy
z6Vgr1Dt>r~7BkG>-5e3leW&3w6|i%f?E9K1?>yz^Q2`1{J(!)Lz}2?l(F{hlvc6GA
zgk|u>lB*H(%OpIfYZaupPc${VjwnSav$RgATff9vZ%y&(fYQ?lX>U8184!je5?@!C
zM%K4_+4W&F*|Uri=(Gmx=}rXArQZr;52@Y<DI}=#ZLL3ExWv&Ja^p58f7SKm^TxuG
z#(@1}2s*J9QM<m&T^@i0CJDnl)#Q~n?=PXDzk7tOC8CjQ19A?#=_yu1Va~X3Oo2C%
z1-stX9#JZk@ItACQrG3RhS+eL?n=;_w^NDgeb<|~lGPYj2DcV@??!jq2B2Q}SE>=c
zbE7kJ6}(|Abhm$*sJs&9K?CXD9#%`q3VmNk<eV#hr2U@K-FuWrXOA6NW{)~L`%H(g
z6$I7qCqLmt*UH4OBWXq&VitXrs@1XYwwmN@zc}-&!h(B+C_3`4M#;B_57;IRpXp1#
zxlEa_#(Q5)sZ*2gzM9axokk_SA?G>CmMS6lBR%_H)pJN0`oYTRx+C5ZF)oWpER#sT
z7j0C&^c#7@rV7ug;SCHaUah%clZD5Fl01Y0KEfqz#V+RQOzlDUp^?renpeyNu3ENl
z#5LKyoc~1W!M9lWlTxL=B;~jva+9qp+bb1o5uWTVi7}DXDd{S_sY9v9JqMc&XLVFD
zb5&+@F01-wmfdG*T72J-rO!9lg-O~C=^W$nSh(AmS0t%{Ow{d&5E%jO|E+uzA-!B$
zK7*=oHsY5!%3nQHFO#n(8~h4D)co}rWtr7Iw#tv=&YifL!=d#`@cEYLk%L!HMYAt<
zFCU;~8LU^;Jt+4&LacY^in37kTb~0%^esj<28sK9p2WWa?$b@YWS~Cn&T7R=_(m<=
zwt4X+lL;N=rfMfZ2>Z=<vQ5mz&@Obd8W6%f$Zxm}=uk2PLYS=AmC^H(`CjeUnFVQ7
zRWi+lj(Exf)ROG^Cv<rhMI5cXD|6;FtF}ka2&`?pxt|Awu$lmDMUPX6bV`ZLeME3W
zeqjGu^Cy51Rug>qux5veNA0p=NKwIf=kubs!GI7Z>z5(zeL!FRm`g*a^!~o#vQR}p
z2$PHC(bYWH7}%jkV{P;y;x}Q%*puf0Ax!R)jnARsW`mmlYlSeY4|fBw0`5ej*2LAp
zk0AZT%B^JlVId3|A0ABOgjyr+V|N}s>X?=&2w`x?30Y&=^l*%m>ih0!>}$e3U=CF^
zC1TdYar8DkLMpw(VILe0VY9~8z6FbIW0n3t_U<#P>23QPeF6ajfshb7gd{ZS(t8U{
zs?tQH2vI>mIw+tZq4!=yKnT4`5mdS~=_pM)8Uz6m1Oycea-+MPz0cWapYy-t8P9X?
z9rx9Gzs6W|{>pdFkAJHgYfn3ihO|f^tFdyopYnkqSxap<QWuNr)j`>WFot*W=zeSW
zP-^iB?eACK3u$94$4XDN$sP6#6tyx&hpO3=vt)(HiF_LxZX18hC7P>rLRsV4*PhY+
zz|nrn$^B4tZtJskN_o7d>WI#?$B{dMTz*T_b)ZK=t4HN>kYBRqbZyW~S=9V~*qvMz
z<*~lGS`~%pAisfjHN47;1<IF`l(Sb<6b8cX5ZcvPzmJpju0ti!rY<H{%}&ju=Jjt9
zx*^>D#~PzaH{G+oKHoW7-Pb|s0$0PxnR1m*=C)q_+V@mbWwofk-A6gi{MO*JzBl{I
zEREl<6GIsRfg3Bg+zwRT!d0KW1S*Q_spWoEStQ>)p_(_WiLuvYEyuco!d88{nr@O0
zPLg%*L<;DJunqJH`3HMMYoPpZPPBGOENY^_8h+K?Jj!H4FT1|3x4kt0Zk>$Tn(TXH
z*Tuuw-ANvv9{3$h62f2wYBr`cpWpI4vD65q=V1?IT~9#^nU3tH9l|en-7+m+9G*F4
zto!#u81pu@N5&&@_l?g*ERmO|R6$*~@Nl<dCfSTt-B6wlogtynF8O=!H+Q&1FZIjg
zq;w!$591mS#|zIUSDz1co_WZ3N;q4quI*!`LzRr^39C;u{1<Xz)e@Gup-dxwBZw0=
z6e$+(8CgB%8bASpYkUrsU6WoP-Q)cg_8l7|7fAg)E=}Mb4Vz-P?pTh%8KxjazQF66
zZQ%iku%lrz%H3*}eZAxYEJwhEsQaSorXNc5g04cy^_JL43D?Plhkq8rj#P|7G8jhb
z#GaZ8RVooNMl@Jv5*~U+gUo<&L07RZxx5%ni-epjh(<tmFcqj^p?Dfix-dQCItcZU
zc;#7QNNlk<G*Ck5m<|5^WTig1rKkJUn3b5&oDOe{I9ya~oABJ~YeIi{;N=uv7P(lV
zx(N2df&9rrm-41CF8!zZ`o+5`eXR5&r|2L_^>jMi{fhUC=}R`ExKi=o61c<?MZ6#X
zNeE-a07MyIW2mS@qcZj7B?b_J@&UcwN+X(JX2I^=vPq?HF*-D2bqWcPTbAY^u~;J9
z4DPwQ6=iN_ayEn4VtKEWL7W6pKe1WvHivnOKTol|R5G@APH=HIk~wt%xSpuGs<1uj
zw9|AVTh;IfEN1Y!pM$$zf?V%;aZ_Qk(m}BXm&?5;)A?tY3$+u@u9|4Yg71mA=O4ee
z2U0C{)-^^egj(Rn@-HWSIK?P9Wtqei>_640>3=l75BJt-yE3gP8nKQ+Dw+4>P<+-(
z|6K^X<9It;WVbhRwd-|?>N^;T^4;)Sp>g%()iaM-#SC)P$;MgIwH7<<DTo-Qba$OE
z$h4yIF26uMd!v;HY-{nvyeI!YPsVKi*;oFpZ^A#sJE2Ctk)NXx`a*C(Mf0s?=SD1|
z%O|F2Chqsi991l&wLZR;ekC!Wm4W+RcOhS5U5gg$NQCy;udXk9?~mpOws7k{v)9t;
z&-Y#dnXHz6f9>V#d#;A<HzDkJDPLMt<jX~sWoe#$4IveV?c*f>z;fPT#RKX1&30Tp
zx~g6W()*_B5!cPSvy9fUp_xUmZZ<wUqh=`7RXLL1<+Q2+O9dBF*cO*0?cMZXJ}qh$
zshP|+fK4n_rV%=5usi(b#eK!$>8ayFu<YTvb}&-pCiT_X``_w2HVa0bDbHISygET)
z(;3D~&W0JVKgE!gTZ&QEKfUHorTm)^7SP17e7@YWFDxxWzAH}2Fot(D4gAXVRnjH#
zYO(Ro=S-5UDOC=1T4xx~GL~5;2Mw$!$g$f+mg~Z9E%AB2*zIRKO6il;Ay51Sh)Y@x
zXX5oL2^@>1EaorP4kl$bO4xOeKv{f(b!+J3t1HK3GiQ^fRoo2IgrRD(-1H|Xds11I
zPkRdpM99>SCw!ZjV|rLpHcBw2nI%%`O&9YqKh+~m&K-FErITKHx-RNhA<S-iJ&HM2
zM?74<*Hn;<rK%~70l{7NGCh$u$UmCn3${<_%S!BGPTCt|sZkf%_eMsHmr|-fmkOJc
z*}ha9SC|ykxq^K{d!(Kr5dJ6$;e}<)iajA$@}~OMs^%G+-7}bs^kUQTG~TZQWonx<
zgxAtqp^qz)*?M^?YMmzJ&Vk93O&d=8>MvUtr?R&AGD=X2o^Z~(Xl#B#@5EQO`<R+m
zgjn$TpF)_zXoY~qxLLk;DCc{0|ET1#L%eKED6^`=^eG|Vhz|Iw&A9TIMt!5W$kRcT
ziT0>@*PJ>dAFt1@wSesHo`{m{!fFE<u%&W6C)xLU7>A%%*L-HFuz*Iw`B6I*bV{+@
zra%+qFpE8epNnL4EqF1osKC(-)AoJCHD*TsO`N9vS~HfB90Rs8cwlam{sI2%JViX?
zUhd5)kMqXP6}gucG682_VRk3q{1n1oO#3;)K%$<@)cH(>4C8=)A?EZ);ODDcXG-+E
zL%ch~<XL#fY;(Qo82UC%Z=)yN236}8MlyGMTBOEn%osG1V94-hv1RSrj#T}{pF-G9
z;M+;P>j7lUdaps2UtkHxO13!P1151pk+MjT%k|D5LKxc!@ie=XexW)yp2G$gPJ9K$
z8Eax{F8vh3Fw@Inn2`wktaM&S*snquYhO^e&V%CfmpHy|sSA{L`(OH12xGo)pjFR_
zqWeV%yW@)U_iY;dJ0Z+5XP10bX-`*oIxsot-~*4F>`x&~soyoj#H+{MMMLO`UaxPO
z3$05Jv1;?<TlDPV^xYpqnA*Hbl`pxdR#$|u<^5-QAUy)zL<M(C2+i^mq>xU7LJa#u
z2>VcJdtYCS!c;`Fq#Ie|6R+xdybLGDo<h}#pD%yWMR(C^Qevc2tgmwgj*HGBP)`V&
zDBoduKYOY}$AQu#5X|R-UsWi=QC>i4PB-%Fmh26>kc6-$+;tgj=30>k<2<dCwH1ol
zA|@ytm~U@#iFE|8cIIPPdLx1Cet8|n;OvaQJDRraOn3r4@DQ_s&R|d6>lHWG;M(a!
z%{T2wLkDG-Ff5-3GTPj!U(cVfBEnJaq0n2##v-p7w42{C+`E)q2`i!_?=<U1IwE*c
zO#;2%iCw$qw**Q}@eyi<+gb>XNjjn1WXhTCbv$XDZ_m#t#u<Ir3Q{moDopP0p4v!g
z5?Dg1o}6)Xy~T|Uzl%EFvRZv645vy;9zx_^i0&!bwR|Vi{^ktr$b@(mG9bEwVZPwa
zG}}x6{*~()pDPcTvI{Ate1)MNr^htBgD9kkuP`CYp${j0<LRln*;(vXn4C-s^79=Z
zDOVcS7Nsb3G<0Z8HFxJxoPiBr>To}LMZv;+?7xCSeQp`qZ+Tb8;o8~2eW+n%)`pu|
z<>WE?V2u#XT%nv!S;2hxs-UJEBGxJ7YWrbDskT{M@zzqor}GitQD=p~3MWWH*vw-w
z?F3s8%j$Rib@X?7Ot&zgps0nHyY0&|;M24JM+srcbR>A`7A=Z~0`+uQpaaKcQHY8y
z;EE50x{;A^9*%drJYS4ay;#^bIqJnOdKbgBRzSZ1quIl;Twg{vVi40I0tZ;Qj|O68
z1+hh-b0R|xprO<kx#kPd7nYfKFChc5ob%+Ud3&a_WT-6ydn`9s>@w`C274)iT6LMn
zdk^*m!w|Tv8tui*yoVq$PMJW4GEc5!SsVg-kt?%+F-(IaP@NJlabgQk|4Ng?9ZTs{
zh`NA7*oAN$0pXHBfdd?}63ej(M9pL2>lpY;39h38R#+Dc<2aIh9JPk!?8PC$@A<zJ
zAd5q2Eyj^ESoj_ey#wQZfJ4Aj(K23KAa54uLRQy$^Z^jHR?oPH;aL~wl}bf_!EsGv
zVe1&g#5hWKg6qRL&rt!U){ARpnGTx@uO*p8SQK88Pic?m0T7-#&M#-e4(npe-=jJn
zV{yl^xnnuLVL2U_5rG)!43J5-i=`2VINU=Bn6j%bGruxMHR9L;aUw?rs74@@JC5f{
zH`IQDKFCyH9w>Zlg3(&TaY8O~xi2G(G0?bWzMVSG1t62;GQ9}~xd()A0r=nrtWsF^
zZ_7+W-bh)T815n)dx&HS33OYQZ1!eTm6D#pFmw_HNT3;ZAJMzayw%C^8I4e!<Rb}T
z+)~u;Sd=3MmMF>JlS*&gg^HhmUKr>1OQYW+N|WOdTLAd3B!3~CR&|+e9*A<sAh-+Y
z@Z$_QKFp062Hg;PSO|Aqfr1(kVJnI3nS@^GQmpquHipo%FEf)fFwJ*D9f7D!Al$eM
z>h8n;YMGfE2v-e3?JYAMHn4(2l?T-!js>X9W#yBTsLcC<ckffp0O6&0+D<$zH<tal
z7y&<2=j>QkHo-CH6~I&R^oM9zZ<oMlf{GlD=Atx=VFC*CW%no)Q<Fq6-$z@8sGaj-
z&Rj-x0+<ef+UuRrwPe|ZasGU1ed<?CYxdCO`}}Jmw6Rj)k7Fkxg<SIh!x=1lqdnr#
z9{R0-E0jPdive#Um_mtdvIW$sXc!q5nL{|0qmByggr=%%TuI@V#L*Zpv#nvc1P~}k
zpbGq~$$FP+8G%m32dTb?7$73Jfm%6u+OY=y#scbCIBmHk_`-cKD3wYU$0mkA1>$JL
z)6I=OFd2tX9TJ(d?KQ7xuy>-t8fRJH7_fj8LvINEJdr81fi;$>czn~GQ@x(G7;9*k
zicUUzK5YM77!&+pmubtM*$+z!k<$e(GkN0aWwFdxG&ly()C4qjBT?W15y4(S*NDZu
zy{{G*BEz%KB$KWg1UtWthE3S(N)^yuo`mKBnFfd)n^-g)NL!4P74(+1^Wx&oytv)T
zBDu_x#>C{ttxH`<*V)Mu+R3&}0J9%(Y!fI)8tHa16rn^!DVpJ17mH3h`f{eDn*}mV
zU0rjW-$fQ?MuhgKqm2uw$?7SmF*<@7RF;wyss+eHd#-~5q^UamK^JsDon4G{=G58e
zyC_~2P`G1GA*T2PanM)<!UJc(fkS)=aa)qrY|TI)$A-{u;Tg98OfW_!vMEVt4OIHH
zQ3lhw)>K+D3A&C3A#ziQSc7K{(bKMgiDaM+rRxWbL%IC8*hA<SP1pl*7x%E(4;I2|
z7?_Qzk)R~{9@7<rb6BZHAIK{X7>;QVqj=P%DYeYhNkE!U$~$xmD9JE<L}2epV$}-h
zK=1w4Fw~Mj_|OOUn=<x3$*d+g2|p&q4_;8(2D+!id>$6;heSywhD)tdnx6rth--*h
zgl@BmBe^dP498_k<oJd`SXn?4_eIP)+5FBSJ!JWTv#3Hdlqpg2&L{p(q9fwa>39M)
z4}dS4Qubm@s6(lIO(@^N5N@VdA>4@L!*ulNbaeJK#V(LG7KfOv=l{NoXhbutNx;0P
z*l?DSdj;%=Dd@}sI(D4spcDd>rX*obf*x&O-luk#0lRmx1mcje`?xZq6VD8PT9&z8
z0hZp+$GK2Th2=Vlqw6G~pEdBz08ylD9k~=;X(#Ja8oIA3UidK1jm0l2js8oQCJ!zy
z;<l|6j=Av>(*PdsZovry!dXMk82Cyc&N4~B?Q8w0o&b}_;ckM6^ACt@7jPET7p2PT
z1E0w$kejm4Ji5dpr(Ge%uOoYv3c(ax!0LiWUz|d15l=y~(5eMSRQ^}Y(6@J<Q-Hgb
zJVHbFFbt*urj%(^wi)VJ5<`(JlQaXQvNR2)<_?jo$1Ry6ZJV6?y}YasBg!UNwg~Wd
zyG*e%yie}ro?}R<FqQH0W3I$7M9zxHbwytab<eSv&9UStB{J*yA*Yv_D{<!}WKC=*
zSq|o)q3Us(CO#hBs%py|mXh(eL(HTw;6q~kr2n<s%N%`dtm{B5a-vWTSoBz;@Wec-
z0|QfChWbp~Y!g_&9Qq$0GJ_Og?9!YL*^EPH9j+`h&#SZ0NobPeSY%C7J(5$ebfr$J
zI}hS%!xhsO&<vKW>7(aRIRu-cy~=zn`x;(N3Um4D#mh$_R2MM(bP^QPI2O}RsLN-G
zpgELpb2zo7<FQWw^s)tKEQTWdA-{WwF}#4X(woc59vV+7o*DEu1l0lpT_f>c#$5K-
z8_W-YIyrvGGycdnHW81{(H<DsJA`Hs&h`VaQF}o&s6fGES(FE>cpJykai6sj7~47p
z<(!rLy3Ab24tHv#yY=<dUI@MXbJYCuLp}?kG84a@0RCMdlX^Pi8kPw-dC5(Rp%R1e
zH5I2nuXR%ityVyN*a@w&4!X<H67WfL&ZIa8f8o*x$8{i6%OPKH2xB0Q8UMv{8&8#L
zkC;fMB{KRM$x){g=)@Xq#}z8P#*k8}eB^sE4?@bV_wvs%ATW~9V;{CcdBUV3T<wc+
zO19XsEuPA_p4}e}_6M*opea&2&6Zox?{3uivB9<4Q1-bspY0vz4)`yAV4m(`H~T6a
zASV=uiTFw)#MlvUm@#>WVZsN@iSy_WCUQv#l<YUO5lIMD;G%s6k1*w(hhvfz1^CG9
z1T7%x4JXvSVVd2;e6QecrWyCxdV@m+%-*BtmAm#A`L4s|F1_MC!d{8EXvDK@@c0|w
zi$H-)Nd~S@4!#S9>wtS7Y$nbcarmo4vI*3$0#7*IWDdktQ%CT^+Z`57rcNwPZEuOH
zH3>)`O<6BJw?j@}vYoziclzqmv<Gs=XX*J;$P9JpOz;xwR{Knt?Q9HkHlckcVhMR1
zcr=@VoV$HAcT~WZ4V=HbG*@&qf3JNu<?dXF%0gVwd{z7G<E4d1whKAPrD2t&n<|T~
zDs!Vji_5l4QMNB$1})ugUmCPsTn~D=efPym(9%-S+!Ag+2TLqMF1!sQzC9v-K)$R%
zE;FgV0)Bt_d1;B``|P!#w_5lWmM)YNenlHk`3(oxxBxQkLK)^!e_N(C>|mSdT7A}u
z%IaL5#4s7YSi$D4oa$KB<a&Kp^|jLX70tYLqwnjQw_aPTuG*=tUFlf!P+j%O+t7Ql
z5tg@dPIWWt)_TQ@^?MgUsV`pRR97AH)-->ZVQ;nb-YR_GsC}_na_jBQyzO?bt>fDl
zwiNQV^0~IJUD$s8ef5p%hC|+tb|;E(>zz@@#x~bRM&8OKX=^&R6gqatx%Otb-hJ)Z
zWKr9~*zGjr?I4bKQ&e{+^LFWucZ6T=+_`YTW(VTT-`BkLzJcol&Td8S0?5&xeyR)X
zi2szJPWs*dDZmafg*m*^37Nvt$J#OH799G#gv7pN!>b+o1b@1D{3$N@Fzh9GRUPS#
zri$-`PXQtE_;2;<NS%;xgTaixYDdj4;S(>x-d$`&wQsKh-|qsCCe^<6KmPU%^&NOI
zU6CY&4Vc{KiGrWntYhpgbT`NHke%T2m6o{O5JUUg(3ig+tr-QvMDkjags`q~2#0FC
zyaZoY9GhIM`FcHCH&M)>TSQ<I-Ob5!;=7i@?rS|BcG1e7aw(Q)xuB$nxlXALCiw<o
z6C$$*{AYQTJW{1EN;*#5(R^f)A<t98f6Z%!-K4DI9qsw22RBR}ovM{Of8$g6ej$qo
zuI1X!8WW~Fe|0cj*t#QLp<!(_SLrW>u&+{=uQgs>=txj{^lqu`=GX6kA%q3Vug*?Y
zSwBuxY5lmp*n0EWz5P!0#_Dj6T9Rt}mk(PDt--bKiif`mVc(Btp7i_>!thvrGRT!I
z&0IJs|G*n6)pUoa+wQ?O77g)6m)p=Q&^8kAT(`g%z25Jgx){Ts7k!Z=gl#-?#gK$B
zZ^pd(Q}o;;GPy9w&^R#+KHtZapd0Pk=gqF_pc}6*_PK!NY8}`i-So7cLxxGqz~xM<
zc^#bC=77fPZQVNY9vc}+i7=@|aF+)C<MJY&Fes&L57(Ny0LD$Z!}&Dy1X{Q3?&i0N
zClJH7ibRY;8&O+!(-SevCgr;Egdt|Ft{<WhPxXe@z`m<DvoO&rH={H!)}^wtMv*<U
zxPyi}!g~u74yI+pn%ivVVnSgT<a@}NBfqhpNP7B>n~b^5CG<oxH+nMyJczE^N&r7U
z9@K!Y$#au2*hbq6KDwaQimP9Oa#S|0b`QC?K49wtRlR>|;L-kZbG@?l%l%WB%Od_E
zXt`|vu5Rj9RRe3uNO7Q8u9ED)N;O>8dLge-`>R1O<Bbs4)IoWd-uzA4!BGa0#Q=?F
z`p2I`VVfd*WeRie4E8g5Uc~u4RoofbzjAf;ywBKc69Gu%W|n4H!~?F8QGy^xcWB9)
zBH|v)mE2|UlN;RCi3w}wK@WKB`9BYzT&s&g_sqoy9E_Opta=alJr(g?!n|1Yd2wTB
zR4(q_H#&dfb^7l%w;w9-bQefP+e2%OlDNCMl3&U^;O8DlVQEmaFkI!LMO{`{bI3j}
zs^C``u|J(0nM;&>#84%2Vv+ntNCcRJAyFyN|I_HrosQ$vwo-9p>h^nmFEehwe_|5t
z<aQ<3GZg+z@s{ts?7V71?%EVoOwLLQJO{ZV-L7)kK>5N|XbtD~6Y6&UqSLYu&a~h@
z_6<FyL!1zi(4-$a&d*x{df-7K1fXaGcqK;tB<%<b042b=v(3+;Gnt@}t&<CRK^gX7
zoZu!u%c1Fy<uM5(Q0K4EDsy^9h`3^2W@8C#L=5vvc>$e=Jd`TWGYU2m@m0%{EM(U+
zx(}H4#U{F!S4iS4EustN6x|~*Z5*Xl&AohondY4QP^`^2qrJSwUh!D3cwU#|LcZeY
zKF(O8L1BxTY-&op(x6wOZ*>uJC%RvGbDYy7eue9Y5Vl#L6e?1TA=eww6!K2F7S6+S
z?38orsYHsOd8*VG2kHUwF68B{;uC6jkddQ+Sm*dxu)Y+%lkrh{(9{dBOq+-J9+;-p
zjZBExu@zWad80x4QT*|QVO#wqikGG(q5;%wc4TG-kCgc&nORO6>-%I+i5MXaVnz)$
zN)083hG~DYVB{GRz2k9h)Tg~teR9@l;fg&9r`^Qr?xJs$DfUZ*yOE9F_0l^bxjJaX
zI_HynI8~NP>C$s077+j3wOkV=#KsznPoLFVQQN;mTS>96mbt*MecbP5;_Q5&iL@o2
z(#$rwbfdhus28Jus%3&TZ;Iiw>zMtf;3P+fc?sFYH-=X?<8xA_%S_@aE@uPBi-n%2
z^(tM`7LKK5zjc*T`C5_)Aaf8Se>T<x*>7GopI4R5Q)QiS@!aE<@ek1%)y~Rq$-0K}
z9w^pVn>2#B+Jr(KzOPrlu@^p9@@2ZQ@>GqLXo>A!<+;P%=e15FymXl~a|117Opw4z
zhpW-?*|F+%YXKu#DOlrjm&}IOd#)ntSLa3;q8nEwL|yVLtp@636>I3+wD(||R1eA?
z)*<iR^uKz3(cSFP7SLVrY%6$B$glY^&x=zh<3{5$dBh(pCWR>q9cymzr<YEa2zd?q
zEV;cn+lqcIcI`38-CZ%yw)u>A0r%oq_EI0UX=a6-T&6*OaD3Fh_CYMLe)z)1g{cnm
zoO|8}9K=|~%w}45@n?&`JD*+rAYZgj`qT)Kox7Y_!%(_wE!xIOd$p;Kp`#$`2!e!r
zH1+b=c>0<fUSv-4@d}Xf^s*npz0YfE5lozp_E~)4H6~yGtV<#w#mk&ZIAHL-zJ2I<
zn<2}oDbD+Kdmdm-H2SvXP;$ZjjG!=w0jKlbHjXwKIS5C1d_af8N6BpGYDa;bvrSjO
zNoFm#Ic`7vJi^k~kZY@dMYcm>Smfym%{%cMS_aN^Uf-o$`vp}hkB4-TgZL3<&e5~F
zkFQN+Fn5(mY?~Sxuq#BqIVi*4H8$BvlP`HFU3twVMoI|$xT~4BWag{ONM-h9&C_cE
z4n}8{UiM9Ayf_&r72u>Td~=SEJI^i1b|$+tM*eoVA&W7!8|Q>?)6~0}2m4zaZYN>A
z?G+Ef9e1}mVsFm(NXWHJx@nGbd&skXJdn@Jd3!A_NA6vpY}-|V9gb7OFAnogrlN+o
z!i722o_>GC=-d+F>l-rN1VmiU+wi<bk9mc7RR83z<*uuy%`3*oqx}+jd+dpAE1e1f
z0|g1Ri`Oy8o0cEk^=~|juWeg>=oK&|A?%aAU?V3VESpZ>v0E&>bgTsb-pqK(iM4R2
zgiUIodD0F1A?Hl{rjFl@=@KzWrS;LKi;ex1PulG|pSxQv7MJR-nQg<>=H4zSE4fdI
zeXO~{`QQtq>!Os>CpC!YoA8s$SF@j9A93fn7FcTZI5*3`LF~mSf_qGmhyHD#<b~Tw
zkCoS$Y6FIpUcAqrIh1|AXIlvu*gZ%8X02K4%S4sUe7V|Ur*`L!Q}i!(+jiQWU`d~Y
zC&a}r%xW5+gu0hO>;}wbR9~$L-Lxcil>Vq&2TW>5ug<CU%_KGR4Pn2j40KQ3IP>j&
z&*P(2VHEvK`r|`U+gpY^FFqaAsyX8AzIZZh%=<?Ne^&`4L14i%{l{kk1Hs=v1$?>U
zMiz~yE<b;}^p<NG9w?6oIa$zecpS?Hf9wzW7!`cq&jg-@m*xxYIu*+7Z*w9#)LF|+
z^g(E9f6&QtFR?5yj@b~oftx6SFr|Som5nepa5&adUp6{SyWCe%;2%QRzIM2dK*UI7
z_!*~Pg|K{<2(yidXp0DIfyhfgg)pY)5q9N~bj*=gHX=PpLKthfb5rCsf%9$xQ32&q
zHwU5wPeok^N9#pI1?fgdI7LS}oeyS>j<Ylhi;hkL$E1`;#STPg9O@+s#M~*5$?=a!
zcZ$gu(8(HzDbkHC5eUlz$5upZ6*|S<+c=J`)%B|sh=V?ft#gWd6df1J!qzYlH(?&v
z436&-h<6H)ZFh=q-;e7lk017rd*UDetXytzAbwIeA$KEwEIL7vC*k=(!je<;Ojg3O
z<;jJOgx5}qp5Vk+<%v}qiR&AQJLM5?niBV&gtoy+mRVE`XrL=z=QbhfJX)I#4P>gL
zlMe@yf{>pM6IykX=$hp|mM5Rdq5uE@r|>$iXwph<Dop~x00Ewwx5rY*VJYDPNzj;7
zVX_py!EnU+6qdOZ4mNEhHGtY#lUF^3cQEy)f2!b{H2(XkN_WD=oKsADDJ2F|6y|7U
z8tJ4f(li94R6eJf#hl~@WZcj_P8Y98(R-8fO&*FTrk`WWpw-K8s1U*mW~ydo=)|N;
zy-5L}fimGh#y2U>F^QL*GXtFYoSbhfHD#Lkrdz+sRQL=TRZqJ%cl(M!#*M+Og|6E%
z&7r|DnjwN|@>*$Z0iaWQ00rthj!jt!)Y;Q}S$FmDsR5elchXtMQXps`AQ?c5&ngy-
z%xBAf@R_|xFz5c2Y}xQ^cWN>wVhZvzdEMvq<~tFM&N+h>>`l(OS&wpLrgAc=0qA6^
z(}IxRx!k?z+e3qQKXv8K4PJky038p|L{gI(>7~$%LuaY;?l#?BqRuDo-Q9lU`${iQ
z_Hy0|fQ+29t%G?7Z^8%Ij`PXq+4iXkZ0o5^0CGqR;R0J0Lnnbw5&F5Aj>$^%IDlXv
zKmZLDe7cgsHXkmgciY!FEkvP^k?r>97)@51LXD;ZBu!Bojv$)thEM>=#TJnn7k0%I
z$yotcJOKc8GLr*<oPLr1VW9*~k<^W1qxl5A%3{u;;?w#iBj6GfMS_`Ci8Xutx!983
ziV_>4(uW%*c0+e@ilxpju?{Y!gE6HpG-WvhrEXR^9_(d)G%-H<Wd!Fk|IM<9^0J#l
zSwUaQA{1kG1j}Pu*uq`P6TU=}5>pO?<%#+gm%$Y&iWzBE6*)I@qhl-bh1jx(DvH<%
zc{G(-LY2jpm3sci6=j>r6)lzZn_>4hD-Xa`_hYM0>Q+5yNqm%D_4r0m>rmCJjjB$U
z>Z}vhJ=qCQZd8xnxHec>JvLDNRR127>fZQ`_(`jK3p8#svG>}`?=1?|5Z3O!RE%3z
zta(G@@Y<!OGP-7yrgrs7%{EQ!4twpVFXsFDwVAV?hnux}(Y{|>%4qk!k6r4Roy^C1
z>)eLKoBitOg>N=x*gzIa)33R};_5+JXKK{z-Dq%9$@LhH>eBgo&LMFY;roI&uQg@3
z@>La!OOw-;-<OJW(ObLkIOHT?(4h48YUK3>E(jZRxIt4GH{YwLcC}R8I#g@8(e$!8
zH{M)#p_DrOrqR{o2m5?BoWc)$^&bfMJ+ND_kSTd!ZBWK=_8JA`p{7!ZiNV90n^5ys
zb!&U-di6)wu0HaMdlXRh=;rXFptp~LAx$B|O<@L25m%d{;+kTrn&O6=65ci?L7HPZ
zuKEM6h%P+z-Gp8p)1v8ZzWcU0AJS4F+)`xFQgXGWEUu-Zs-<eU<=)$tT1acXaBG7>
zYoP)8RnNxTUn|}bX|jhwk0EVc!fibUZJiJ{L`d6URa>@s+vwZ2X9jKkRc(`TZ6lC&
zk`UG<+&(qjKAqG4a-nTuxP9tvJMn7AW8sdK*0va*j%|*%cRh-mIc>70=ywYpyTYLN
zacu{~WW-j=t98d<*Q!=>SGMGOk9M5b`(~X!i8Aw5ZC(fm^jl}*9FJUI=^Z8aZk!iQ
z4w7}mU9?OOB+^}lRYq}ga#VNrk9R^uxM6`gOop7))kwa;&X$nw7t38THXL#zNCn#N
z7^!Y-JiBUOH>SGtItypb0g_>n!$H4C!nGGU;>1tuXcFIJR^6k#h}0V4uoCID6JfWB
z@3h!LGDP%tEbEgQc3t_#p}*K;S>1Ix9(i%`iFex*&o+(=f&FZ`{nu&xf*09*b2)C<
z^d)!owWRbBaeX~012+wy1kv`M8|lBsIrsrH(1;yKG<3g1J8-v}?RHzwEt`Rq$v)Yt
zfymt6((2>Evo?dN-v(4p4Ar>ea@&UZS%&lChckggjmkq&-^3~dhl=C-I&Fq!1BZR$
z`<eVko_ymQZbM!i8EzICO~VX~FAlek4}7d2XiFL0uOEIIh<r}_)MKQ7+Gco7d31ty
zbY%p&5XiAqJz5?=&`ZnpYH=ttcVsm1*_V`_jq1Vgxlfx7djU(xcZM9hfhfwOVdLRv
zpAE;B<NN82o`Sl&zJ+u#BFET9*^Wk@zFd9^PC(JnO&r=hMT$OI;UB-*_KbPdN%-FQ
zNuyCww+XI<As*z!`*=f_TomW_#3!$DsUzf_I8Q<DDRH-{EU$5<1a1axwBjf#&UI2%
zbW$bZ7^R2gYp&w944SeQCAASg!|f^F?x}+|l!ejMRq-jCd(){U&qc^Iakkv{?c5jc
zKELWV<Mwshcw*XbbS7wfCYWwEM07UHXg0!aHY#B@=H6`F=xoCOFNFQSL<rm6tf<+n
zdb)Y<-DWNHZN1prhSP5!xW9dr__n#`ZR^vw?eE?`hHiC<ZS|bqdg8v-pSU$xvo-v5
zYxLdLGwAlX*!JY<?dR^>Gl|=CHQNhMx0l{+zl6S97JIjH`rT{yck7Ao-qgH%`}E!R
zyLUU#ojtLg{nI-i+;=`D?tHG<`TBI{=-tjSbQgGXm;B5wg~u*c(k^xFF67xR-OesO
z{T}?}9^%X%lgA!Q(jHsw9>=pi<jx+7{ypa8d!94z`8?jANO~_=`(F6jd(oZuC+YVk
zPVP&c*_ZLymrL4LsNGk3wy(0YuSS1>J$ayc=0H1X4+sQcK7*)1fMb9N>Cp;60U9HV
zBCTL5Dk?CT76O6N!{GE#1{ggPf`N^hiG_uYgO!DggAK`r#&B_Jps4t`QG$FtqJsP)
zLPC<FLb4KKlG5@@GLmYFvPvo%nyQMI)cDi1=nb^hvrfTG^|f#7GwB+bSe({7X_{nZ
zYGiD7{(^<E+qqNHmMPU%yics)A=VlWHWo^@>HT(W{WuPdi<x$pTwE{N3|!*UzMQS=
zm^<jm?RCW-?`%2b%uhPlEiO{mT^&Z;L`*#LM?J({y#fNgoJYN+EW8WOUoQ{2?*8n$
zqOD(vk3arGK*_TJm53YO7XwQ#233s*X~y2VzWpB&uqe}iMZk7qv~Y1+zaU^c3Ho!1
z)(%Pffys?|$x*Y(cFrkAfvL^$skw7$m)+7$3)5qF(=EJipNqWxX#TcyTNb|jPSV01
z*K64}5!qcCIi-6!xVYSw8+jM+<)tm=`4IDcNVgwe5U$@UxKdw``M$_4tk^BRxMQj~
z>}7Ev$pL#=ijOMu$}H<6mi>Rq0o$AI`8?CPJv;P%w*Sjq&&Yhw+`>!JjmiHX0sB9V
zfE{I@dE9aI^<eq!%V&=-{|f@<{=W|aTmGLSU@v|mVA7+~tj<yis@%_|jEX29>>K<E
z0o#jHcPv)_D+J6wUbnG$EFA0i69EhPiGcY~2^7i3IWm;dOhM^ozrP}{zMmNWjFIY9
zrEqNr^8o~ZdGU7y%=-@rn6Z!_?+*lw_@0D-oi2)zNaVc_70K=;A429DS0<4Vu-sVr
z)Wx3&SbUsB_74QC&YX5w{pdSnh=hRg#Bc=fYQQ?abOc8IK){Si2-v;>oiZ^jiNC@r
zEgC&Nz}cYwMP#vFecI_41Pmr6tTZ7g)qGmwzS_LgPXw%pTBLFDCj!<_EwU{Risc<w
z)~f9%Gs4*aih$|<Jp$J9mk5{^_XsU7G-Nz7kL<-EEj3#7yVFkuEFn(Kbb-sB?hyPt
z0>=L*1T6ap0@ef=8VQ!%xMaj&RK0IU7ernj^G5`1@fQS)T&k}WaMWL_xzZ~867urU
zWxXnZSV%oIoJaeRN+3v_T)jeECr(E$nUVrbRbjnUpM{g-I@Ba3I=G(t+tWT?#^akN
zkvoa6=|z)`IU}<B6v_Plgn&8yEdu7W_iqs}VYorIPEF-{l3Idm>{-wlmG+Eyu(HWd
z1niiEfEjB3GXlo>0|7hzpAfKUmgdTke?h<i>~A}P1jTczizO#1c&bjFXl>FCPX7Y}
z24HFaVk7O-Y@jfG`g(14iKxdLxtzJg&<9075HPfjld*;zW3j9ob%M=y5<YOB>JIN<
zx5eoK<J*QItsQg6x_~EPQH8Wl0aL5kV2~t5W6_@wFwX+|Q^iE}RYUAaDu$*d>iy*2
z#<gIYs0RKGo}!Tn%AmCr;SOY?J<IEC&O6J}UY>u6fPL2p;}L$r$yfQm3IQ|tR|M=5
zdmLm;iH?RKW<+1t$S8u}1wu5B{yPLLS7JcBxtc5S7X*y>&j?ty=dTD@7{c#g5wLIF
z9<hqm=T5a+_99QCkI$bYAz);3v)ewP!RLR4fL)9fvxSLxej#UW0eO^33!JzdI*Ou#
z)~c)j0Rb!hD+CPm3j*f*69J<?O+vuj|ABy&c>WI&FwI{Pu(AJufDyz=2pA#Kt~%@&
z1dJ?}ch?YdqhnCHNoM2pdU*yJ2?1ODfq(&7rUhg!aBRM@Xtfd~P{N>V*delJ080f!
zvY_4Q+Y7=^en-HLFn>b8zWfUU#=5dVgg%l;9@zHI`MS7q`cccw=)3E!Uzc{TTd2j_
zz=OsX(B_GcIw&@OMZmzw35ZFmGo$F+fk!%PZYei+re46*z&(Owd(k^zUzyB_3YeC`
zZ9swCANh4@#71TsIzzpzj?sQP*~Z3UtUWc<Y`2rw<<XKHzA+3TRe0CLy*!TB9M`{+
z5U}@gN=-iyFtAj7jdBn#2>~mNkO;Jiy|wrU1gwY7y)#O}bA0DF1kCi$2pFD(fB~Ki
z(!S!2oki~4IM?)y>P&i>HHcY;2s)9O<r}hP$WXFNM3(Nx2?}ifM8IzSihvO)?81!y
zfq?Bof{K4dz%qX#VAIC`4FXpAcL-P`5g5W(OxI2qx4Zj@nvCK;wC)E2=J^8w`}8je
zn9olHEaMLd*vda6U@?D%fW;8WDt<x0@DN^B5&s^k?0<uR<^GO<5&v%@U<AVD++Pqd
zAYJfp2-p}}`SXP4s=10yS*W1dx#r^)?2$Ue_kV(brIHY^6aPTKn$#iV3`*90<abR^
zP{BcUXsF;J7I+&(_yqy${%Ztm(ioIlB=-RwE!<06{)s9WKr@C8w=t6ryl9aK_Vd2z
zD`*@u;GOv9P<_PP?CxRA<T_cAlcFGi?mIq-@J|TX;eSHFG$CSW@>C*r(wIDeLU2MJ
zCT~VAQ1k-<3;uzCY5oBLOa21_c0g6~F9_JAy<7!(^5bL`!#C;QVFHBz4gq^S2GS;a
zva)4iupU;skVA3XyRRrm2=wkTFy(W8>8XE<fW3!=g<;}*y?f0BuJ?$rzQ0Y-6Kope
z*0H=z2B)7ev!Q&Q`7rH2BVd!pV)J}(<uQ;Mp8QT93+7xZ<5?Ku_>?3x0|s4BCX>k1
z<&g_Lk%!lVU;dc&Od%g5K?m}KzqOBxN>RD1oBw@|_5B;Rnh$x$=LwWI2;gi2O$&i`
zUWEJ=mWByE32>`=rI^o+-r!MUKdacV5(D(U{&4Ru2lft~RUvGTu%3Li0YOK0@h1Yt
zK*yO)hW`x#%l!=jtN0@V2BhP4DI5l(*LRDJ*-K0nOU$iGEWQ-y{tpqbVB!x1EL)w@
zS6n!egn)_D%>!s2{}Te1`#S<w_7@0P>Q4mhvHf+YY)<$2${L{({2vgo7(7JG-a{Ke
z`PdlLnwFkQka;|o*@(w}*o9y_y`ETs`iE$b2zT4YK-N+$jr#D^G0=1;B!L0ch@cl!
zx11lkw?LL`R;T|*1T33`fWc@F*lEvH(#`Ky-eafxkX?I*y$bw<ZU0<VucTPX?+DmF
zMCgg}_umn)tF&UC!v8?PK0@5Dz)qa_PY9UfPXvr$U*h)*0!9OdUT3ovfW53s0ZGu=
zM>&4h7OAVdULh_K^B)ngE?U<23U_13C$;rFtmVchpkK@$aHd7w)NOczYY;@29L_fw
zTb;a0L!re{vLjC6rO(zf5cil=miov)B>x=(_IOO{mf1s(y{2|>DmhS|y1vYy38$dh
zDqD2f)Lh4d7pgM%=#~;E9#XPg*HB7AzzCFG07^%Ix_e!l9|-~5q#=yab?q8<+0(5P
zX&eC*et(C60q73Z`R&iC6b?VIlc^UomOnJ0Y=qtGXSi_<*P-+}1%zn@??q_|Ts9N9
zOk-1Qh7fR{6KbNMdAy)Q`feWrId8H_lliH5T3luB#t#H6(Y|{eO@6#dSx3C3mmDQZ
z%97U=8MAko38`HA!g9gt4k)DKQGmuPacAhV1CSkV6G4B}dC982=YuRPA|Ok!N61wP
zW?oordffq((!*BGAr%Pa<SaQy)eXJ|O|+*J(TA+7UlMHVKI77KriHs7(h<W^l0Lxl
z`FcMH>o7Kz3mGSSG(peMP5#B6mS=$h`)?62^bZ8=F;T;)>B-z)u^nv*E)a_OR_xH$
zC+N~Awp(mJ(>D+4#{Y(ZHSR*+jtySNKnt3i6A8Z}V5$F#fThv6tN#xXuy}~1{SO4J
z^cMuom2T3$b_q>hqdsghFT7O95@rZ*wC{u#{96Pp^*02}g-Cfu=)Xh2COb<7m4{8(
zr%dPRbb_Gs>Qmp9>5SAH#g|yNcfCp_o~zuoIPF4r`W3Inz3%XwLTi<=^<))^py!UG
zoMvMaU$Up{jwT*`V%gVZ;@*T=aU#5InYI;XuF!FIBhZbVg@rv(p=>hA`NAzi!B%n+
zp!@$20yac@O{JIW_!KO|jnQHho}uVVZ$jS)1HDc5{0=LR`F9A|4XTGue}RD2*(;o;
zy7tlb((WG-u-*Rx0Rz%#*WEM|x9zT!iGNeoIbZ$k#@PySx<J<|mG4ze_ABz==>}V>
z$t38-2!7YdR#~N)rMcjkMYIe*H0@kK?0f%|Q_7{@M7Emcuh`QHBQ+JLsGbf<1~pXM
zD%>b3Q_lTVUTStDKD}mWs8`-=hEt-Bae0w6?2s<*Ax#`a>6iz@V67vnw9y+1iTZAt
zFlfR_Mf3LJatv2J{Sm{h4hF8P!6uY6E`N)F5q?3y3Vubvvi}JI^P#Fw{SyL4_<IEG
z8dc~Y5irb81Pn(Pp{Z(BXU$+L94I3^;+f(1uLzhu?Yr1Sx87jIfT&gX^||OrGhA3z
z_!9eaOG=zPX!*ZJz$S_Bq=4@Qms`G(wSK4>Fl^Wny-fFX_7YWL{Ky8@ew}_Me!2SY
z?)Et7zeT{PX#NQSYuu$f<2`l|Ar@@+n5_PjB>J*Z-D9$Gv?xF?G>K?_mjSexLP&sE
zjpcp0fEVQz6gy9z9GWUw7iQY)ErVC``}YW#-~R>#%+LQbkL4H<8&1t6c6oMeSu+~)
zfh~@dDOOYzT>OE6*^v-1`9C6Hp7Vc$fOXiZ%8X0SOOupl@Sb*w)$`4>)#o3$zn*{o
z_FNs!!vA^%ERBSK(OB(YC_^6yUisMO+<-fMXFJJ)rrG%s+3}Ipe~o|vvquHzxA@mb
zMiMO+AN-DhT|MnczRJ06Ze82{=|Y@G$IK?jGqorHW3u{dXyB;I;cC${Rj|^*t|rXE
zbcd6{KzdJ$(M-BttqIB@M!|F`T|%3A$$MOp^~#h<AG_wk-YIl2r`IX&b0D#rAx{zS
zL57=`g$Ju6FQ@9B2y1+=FQT^+5+xW{?JYW9I8r~1e5@>NSY6DU*3Z-6D^>X)5iorc
z0%oswFrFv<ZxOJf9|&0C4+Kp5&j?ue6S~m&@gE4-_}?O6`XmHQ{XZaJavAK4{{;f(
z^*aJq@`TaKsY0ep<aylM`P5ozw%1`weX>6huo*3Ry&nje6bS(vC1UfPOR;Ays-5oW
zpt!DgNVDgMFe_Tr#Oqi&AM4-wuHcm0Agi0d(%5&M%jjW_?<l}FCrZq*Ayw>+#+=m6
zn#OvooN1Y*)61^4`_l`x&eH#51Z;!w7YLYi&+iDB#t#H6m03#qUl1@VBby}Qp9mP0
z4Ndozc{LIOR^|MiQtL3fN;D^G_>#!NvxAk}!MCi>7Fp|1E|&!df0wzNw2gdS8*H%h
zCj_hvBOV%lGUUQ?!aikrh0_L=EdFBN@hh>c4%%B|r^m$!RL;IAc;Crz!7T>rN0&4h
z+t+T1xE9<}m+7j(C(!!-K*0KAkXAjYz8?tK3fPTT12TEohkW+~0SjZsTJ|e`*`w0K
zlMt}4JvG&TM!>)%1nkxC2v|+@O1fk;>U3v{RwHZje}jNU{sRF!aX}i$yzdDVQ2zx1
zOU)t^+1!gmi-(~Jzan7Y{yhR_Bn^leQFHG3uMjY>n2UO{pzHm#KF_X>0RZGT1ngE<
zC;vbynqFk!cLYoz;@==(h4rfH;_ih=2UBTzeN)CDb60NdifuHtNnTqI%^CS9O@?0(
zu-qRA*c}oAwgL_P3j{3e9|&0VKM=4qX5a+Ma&&XxbG!_NgUZ_&GEi0J3oTSZbQn|g
zGRy`9M8*6-z&=B`h($7WSvvN6UQY|TKoy|#QM4aR=#Qzt6jhu_*fd|+Ok2HtP_5kK
zVhtIzsG~X4kf$<EqatiIQMsWa*H&#b<eAti3qtk#g#8HtdqqOP)c=Hlbw>Or1nd->
z(8bK~-X7H91{FOhmi|Bk)Uo0=bgk#+OCL|fW70&TTlEW)Uo=*k3;v9NxdB0T8w16>
zBm~UFgxijUfISz;AR%BSKM^nu5(35%qpPJ!mG>(Gw)JNO%%+bNE(`&)2$Hja0dW1*
zUl6c|XauLBYatS(&SA#gO~H%~5d&h#o{^EIU0Yps@v;Z4&jJC=e~W-={DOdaWf>}U
zzE5wosqz322PMf48hUfFPU#B2B4EjmjQ>Eu8p*Wt4#_Z~fr)=az_2}oW_{wE#Iaux
zFe@E?Nz6|K><$S5<CciDRc{_!-?&y2b+1r!fehNHdP?Re0_McxT-PIMSR8$_^B)Kp
z?WM(aC+%>Plr6(f?AW@v?0wtqe?h>~{uTjK4|{%7Y`n_oG6?~*95Vr^|Hu!@!!Clr
zmYrZ7K)6pakOVNP$1nl`xF{mox<DTpB_0nj%+?AQOA!U&9T^fj$;J`^FaQ8gF5b)p
z0e^<-np2e1695{Y004nqd`vz$7z4ml*qjD4Rph=Fi&B80jkzJcL{4VQ5DI`e9&FgW
zu12pIqwIwTlG31<F%KEa-Q{rdHXNm2G?V+tA?e+D4>bY;OdD}?&;n-H?Ij19yrBB7
z>hE}6Wb%&;3vB_Nly4{jJt{yzmeftQJajiXw>pR$eZ*-}ejE^kCIT5gYmECusmt_w
z0cp~sH~46<<lc02>6)#p<-1RoV^BCg02)z2Lcj>P*B*>TA9xuKSaVg$79n4?8Xu{=
z8{fL#G`#eVGfU-Zj7Q+A6bFzq>wVFg8;P_;{9sWzzO~UOntVV>{tBDA(~#;FVK{|l
z2x1UVB>;yy;S+owOe#f5{6N6!GL@oO1@MemIfi8wL{|%V0Z1FJN?%@AW7grI6s2kq
z=HnSk?%#><YVqQb+=y#;A<Z^CBm)dQgtpaD3gD5t4;cjIRDBd4Hgrk|!w-2<ns_<{
zAsX7A*q;IzepKpr0j%MyWdulz_IOaZ=ctP$fWdzXU@1QZF!f&qFty(Wu*LQlJa9MT
zZmsxG9~cFo39rT(;=$U&rc4F(2Y5N*XAM#`c~V|VDas3^Wcnyx@zH7&jvOJ!!wE7c
zL=@5f+UPMA->PmO0^l=8ySI;)?t!MBO^9Zo^kGbhrf-jqqNZXD6*x9lzPv()HeQxj
z=kpt>i&Ai!EIeWvPmWG;AHzT5QAy;1C-K1L0RRsv_z3`jUpfT_BOzc|0Vx0<D*!r4
z2`CR`Jm0}%rVU_?WPPJm<U@9YvmJ+T_sZ2t4U=(0H=h(p*_ceZCJpDd1TZu=Tl2~t
zYZsmRA%G3^`S_~@SwCoo0G+h>|0IB2)#>!_OCbqhtnCaK4e&k%#{oG;BvQx|pu?-e
zF&p7sj0Hr8+h$2R83UjKk+{Rqh(!wWCV;smrS^a<w>+SL_6ed_{}ydWSrJJ91DqiV
zU<8r?hPT~)L<;~A-}Y1OQkd7_DaV@X8pCYSt+wTnBtXo<IGoC|<sSmrTLZS{q3Unl
zF!HuoWvUaj!}TJ=KGEURVI%<z(4AB21M7&7A5;_?lq(<!U^ExAK(~GSC_qN+-HMG;
ze-^+%N&x#)g@KCqv?z|3;sM2o2(W(((0|my_<pJ|Jk|Os!<!c0Z;>_R0FVGsD6plD
z2YxsAHvudxGK!q!07;x7DAvY_pD})VzerY_6<^lS!m9VQtf$k(_&ymvOt=kT0|GRr
zJuRy`eS@bJct~~}HbO0+I!!zJgoj0l8|-!%8Jb0PTKz<xK)9ps=xv)(3ZnuhR=^2X
z{i(?&{>BLT%M5mC6U2GSV4f5lUWUIS(l<SY!BP<!5{Xcua>^Pf3X}M+NQ+$)#(D~P
zLJErv+-?lZmNJeIq~uHZ!GCdW8^alX@?W1LM1_9izYb05UPH2qCoDcwJ`&bA{=t9U
zkNAcEQUd+pzohO>P>$Z=B}ALg@&@aY1rx}rw_~o(hDjtSL)$0mT_~6mQg&PfxyA8t
zSWEERNJS?T?IW~sNt!AJOR(`^9yr2U-u$t^q~YuQ?~2bA_0OJdCm02#d5n=sT1II_
zN0}#sP94Tb5_nDdCbit2t7nVbC-C5q)4&^Nwe&y*0<{;mA!ahuf|zhhe>`QfI>Y%8
zD#G-PVL|P%g&|)m1Iz$k*vZY*@9YN1-eOS8!jswedPIlPinlr+M6lN3A$1`acf*7>
zhJ5g0LIdMg<^X!UiIW4v<%BBWRSP@O*`pA0a&<s$gF1+WfC1{TN|z@O&jTn}0o7A*
z3ZgC|hU9>?16}ashtopxfap=Y40Q;Q&<r<|ytgpwGfNTehKKGxOXE<n6TkzB=Md)=
z$|v<BZBxTk=z?IAnYvbYlO-aS;;x9!bH{`Obycrb&oTr|eV3RM)P{oqKkYBcIgjV3
z6-o9N;dH@pc$CA`5BrNSi7OAcR{Cjw0e-W;>dY$sVSiC8{<Oa`1FhPk=MC@uW`Bvd
zDh`K(66$`nzv?V1A6TvRSZS>qlHfunCp?7{UV<Zx8Xv}BiKiZTh$G@DECG=|CiDZg
z$24^hX8BTB34oI;R)~6vpZpgd_93G71I5Pcg}>y#FxqhWEC4etP@cqpRY%T|_%GI<
z{1<T++(6>L0EN%>GD-Z`zz_awMFn3j48Kd_zs{5Rui7*c|5en|R`PN&0+34LzgT-a
zpQjY5Bq+%*X4(JXzxtm;2F{wJE-7R@H`qEj4TuiO3sa2Y=p9#q-*1@p5tyDJ@n3*8
zA4?!(raWjY(t*&Dgaq6?prA-L%5MdfrIGkAQk}m*;=cfn1~mS20K!FUA|M}$f7aR+
zJz8698_5dBlM7s=QB9F-RXUCl#;2(?3%CQIH=D?^n$sRobXo)Qmo9!2g|`<g<Tp$+
zj^p0aT6f0bT~|7R;sC^M8lR(qIsRFiEgoPDP+Bu$IFEmP&mQvBOm2`EO3W7Ji#9L6
z_pX5A60yQ`Eb2t1=tpmE1+0S?X>2M!VqVB7H7neHEJi*cZmqHg)-lQPkbK|(gy7P|
za02Kphau&Z=JEiR8Y@=WC01uV(EbPig^X->nYASGUk#(-WS#1$tHZYFaNdtv<W8>=
zf8oD$$sh8PiTvchK9)QZd_fwUPJFsxWH+|%6K$s-aliF#OFJi^>?XhsM#Z-PR3lpQ
zDxYsnQ#$5u99QOtn*i*e@>wGEG~V&THSn*PvU)j7EkR&yFu)!ZZJpS@0kBv@EIWSg
zU1e=1_S);D5-*3M$qi#m)J4gxJj2vrLTmsRxy~p?aHwfksLc_D<OX|@j!Vf$Dl9nE
zyoo%QJ4RAKKF2a$$2qRsh0LM7`hu((efcX2K&Z>ua2s8l&Kmw?Db|rcg{8xaO_pST
z$^5XtCYK+Q>@S#d21T3ew|O?vANH4z#X3m<AlYAj?!&bt`)lkK!#FOban)j@Ge1Y6
zdl5@-Xibg;v@SGwk?gMp+xr<Swf`4;_x%+`x9*Fc1|&&tasy41bI!Rz$tpn+BuFDU
zXAuy($vJ0GL2`~FNu<d+BZ7eBEExp^`Zm7rT6^8S*WTmapUybroWG!I)|fTxsX6BJ
z{V-re$c9CZ2;eN5(q0&7@!>f5{Y`(N1SGf5*S~^(-a*@6cxd}8&mtoh@<2SsOt31k
z-S)Xg@Z<ErTl;GwIHwJ5f8m%4+8JVo<Y-_QJwzO|q3tg^?MAfy6(*QolXXtfxP<Up
zT7UjvA6UPdxND8a848HMwZDYe$r>E3CeSb1$g}vr?Jv0b*z&@y{e|_e?h{@(eC_w#
zA*BrD@n)AiF2|RCzE$%+93!6my(KKP{e@xAD%IL@h{yB{=qfFv_6==+QB|q_K-*vO
z8@8+tX#0!Cx_1U`e_=EONYyEumIr@}WANYFUti?6-RWhM7((sB5gEG&K!lz`!vQdN
zyWJp!!)6{8*^aiq0NQFHj|FjFcyplp@Atl#<)Q5_a_7Ke_W-p&_LuhU!QHH{DW(^c
zK{<cyFSzytnnE*LDj~XE;*e0j5p1;mwX)%i8o|I;gxkS!N?8uAQ(^j)xMqdWYCTLm
z=Ue;Bu3Dz6Y^ZbJg&YyOm(=clbx3OMI1)74&<cCTGTy&vPHs5Z@>}*1+WsQ7eLiMG
zT;=+s)75F@dm{s&T3Liae)b$~f2H@#{QP5oVVJ?u_E*%|2*tMhp;X?zd-pJwlK64j
zPq34oV6y{pCEK^+i7;q!PuLCj$Ke&i-_x?bm@&Fg_>tny8sHkMA@q>js59xrQ+7Pr
zIByw=9cMwD7)AV_Ue1|cQ$4p*ogsMYV-=O>AzWi&Uhq4w(*p$w(p-@c_2=5p@!&Xz
z@M>Oo+~UEFlYMCmteC~Dv|DD8wdGDYMrhvh6#;q-bs0fe45k<a7_w!WKQYs-HNAdd
za$?{$!VlQ6W96id9aaEv4E*q5ON>@rPI%F`CU<RNJUj%}m_~~|eC~ryB-_$QTsSTb
z0-px%&p}4_(Utxwc6%M1aLK?(?Hd-UZ1Kq*$)&F^RN&Al^;WDl?`$|(_(ab`nJ<M6
zLTl)9*zal4ANVV0GU=hcv&bxWdkfhTT>st2&oXegkIq84geY^)Kk!%MANUJm{2%bw
zd-sUH;IA=vZOIe`$sGkW{Izxd7yQ*7^B4S;s_+N?Qmb;#2n`MQMZ;f!KkygEV>JAA
z7+fU>=cIvSED4t03CF@5C8O6_YKN0yQ}a_;1JH#n<46UDOAZDm)7@nz8dBFgP)Pz(
zMvRPQIDmizC!G0QaS20mvj@+Z)Uq8juz}87b}3>>Jvf6(gHziQB6=4Gha!9|a#@K9
zW3LM%zF!&R@mnhI$BJ9o4fvQ+oHR?j+2rAP;iRX)BgKdJiBgFb4=K4j@iF*qSk&Ax
z(AQvoBSVW~It;c1;ygC$OBx$|YfCk!OR9*!IFu>jzQ1=NvNiTz6{wZa0p6J^eOl-A
z<5Fzz4+0kBLn8LAcC)0X2qfONbknDHIeclHZr@`Y;GXx$GiiOIsOXEt{jAUaW>=0y
z``0q(hbu){?2b3L2$;Hk-E^sdwd29Cs(s?cH~z;lT$oIlL{*Xv*>|S-8`@vS3SfEZ
z$M9uRdM^rB?5Sq*5eZui3VZiUL|c#5n?tPI{?K2d#W5U_Im{zU-4?p4WN)9GK%)Mp
zzp5GI<Sx%&SQo}fuqNDV1F9q_|3!Z-XT9v>QoW_Wa^pZZW4c(J>g1?x9FAv8NoukY
zE{Tz8wxvylY3qOs_H5UI3{#0pKm7!t`%Y6)_TUnp;@j+LbvkS^+b)jx5tp2-SuxU?
z&p69uHPG}|I7dO+C4~f+_jOJxUQuqOG`F1-w-0w|Nssk_^)3BXS~EcKL@Z%%B1619
zHZ_7%Y~-@6JUUU@f>gVf7RR|WHnOC4So$|_{ryY=-Vf8qG{Y2M>{=YHzq<XdXy{Pk
zc?05aL@Z<uQwZ<p>v|>ewsdxY1U{WzitsgF?6lk>V80LIR^~K8e1_u9sv=lb5yp^@
zq+G<!tEuMI4zf${1$#yxCSdYm`10Dn21k`!_pxM^GxBk1p%R1~U*@3cugvn*by>CA
z>@~3v*&5u0M7&ydnbB<=g6^7OUy+Hpi3Cgz4jH-4oJX1uir(lMEzmM?*(8cOsA~l+
zP@LaOTjNf2lY1-QwdD}!Ff^Zgr#PD?C{wb#08M|@pHGf}oytY(6vi4M;ROLpE1_a$
z7>sE8%ey&K-gW-C(V@CA;a+NHpevgGVioR2(_ikr3@iDeBpeoFuo&^2E6kok>p^~#
z0W0IzzCKMWZ8DY3$8Ekq`q7b05Y*-m{k3dKb3ho^P*b_Rs>D6H^+1!fcwre&lwYuO
zXx{0teQjW_Q89{j98G_n>$MVo<J0d$VPBukpyJ9M0<jYY7z`5uJpzI4X!&cIcrFJm
zf04BVtkCk;(tV)W5nBF2P)V9Cod`FACPja|WL%5>D9_nJ8tG!krHLFDEoRtfEuod2
z%*jhXjhZrW@VS-0wn&BE6|j^2#=8HP{FO_Q`8CtyP$yLT-XkBb^iYLx_O5&R<^(z9
z&$)xq@|WNk4gVnpEvo_6A{^>0D4S=m+Y@AyTpi=&$3p+82WvUECd^tx7ecPDDz>bQ
zmcKgOb;+=`S*zS%3R2s#9)(RcB43xNq2;f321ggnh(Re;;PX5p^-E=PC$#*fc+}T)
zfklOuznUAvGX-<m13w$gx}eNzdJW%O*~)I2(Z70HYy8YHt@UaKA0{O;P{1B?4=sP$
zsMlqn<uCVJ`AbmI^;`u6Jyk`^UvZo5D;l@*7b`xF#xvmuxAIqXLLl#vV(Pgd0|h=_
zDWC8mTK)=S)n$Sjgz9AYX7^6$n&BvpG1KA5aVh~z$3lebbN>|qBf{a}Egg?>tIuP+
zE>;yHm`F&h&u2g5<QOuegAMGbl-HzZ8j}$OQ2mj=l63PT_EHjYCEskyx^QD@F8nQj
z393JId9M?ImcOtQ3fR!{mx)H;qbRdxzGlU&Ydp04rFb`uxHnq#{wn^1Jk*yDwI3>+
zUh^2Qa{o^VSV5VgwW|I!jk}tq%c5aKFbSWNPz_f$?)oWoR@>6e^tzALjyELE{}3Z6
zp<rFsCO3jBy6QvaYd(h;Jl|#~QX9ksV+if+jV7lQKek=-xdh1=QRATzu#}2tzP|Hc
z7RB%I8Ss1L85yl;d~9xhQ0bBN+j!S4t-*tHv(Z=;$1xrjdNLNgQ=Jz#N_&`6#WS*{
z5tjMo6SdgxR+d<ydkpnkarJJVOa(n8mf+zM@wJ>_&qF-C6YPTsJTEFmJ(s~#>=Wd1
zEgS!^9_%hK;seMXi}q9p-3&yvY_5mVDQX6b!Ph6n?a|J`(CIY4E36EbRm0{tt~UHe
z5lBPN7$-)jIp}YLRj(j_TwDmF`yF10Jd$0NHh5NrcVdR5Gv!Jy&=TM_$`A#qxOvZ~
zN!!~1sKpeADO?cBd^hIN^Fn#t*W*^gv0`@$NCmlK^zc}MnnwL^+*^~gG1&up`hBNV
z-%=LhPkKm+65$-2kPg@0FUlFuc_o_j*`47bTnXeNVh~Z$Z{<Ib_*R%*jMw|H@3F(Q
zq%WRo;S0W9!#F!ecLz+6%!@6#l^3DBK+)X0j+q>t)iV-UUP)mO?6)17CoTE)nS(ik
z?#UL-<U3i)sedA-PIp2vD5XB&q;J@BO=_86s`(J?UXii%0P)qvLG`7-T(20xH>78<
z#6+Qxv!}b&%tmDl)w4|pKML3zr>~i9CQLy!$G{Pj6!*@W*>6mW%F@H>U7tlNk78P^
z7(sawrfoy6nZqqFvhWLARQVY_PTJQpp-lrZlZHEo8R93L%0upzCkA>_otvZ=ym><(
z-hQSZtf%mq2!BhPb0BN0U;Jt^kKc33+#8~$;PKwMXFVSDCN+_<nUC-Kr1BAiZAjmP
z*~!YE0s7ZFtv}CZITvhF>|zRgQs2zeD!o*zdTmxIX!IRR;Ji^FWACQx*WSZEivS+r
zQLUaVlt#hZcirJQ74`Y5ozu~I$QSpk`@HOC+UhIIu(zh?YF68NRXz_3cx$ZhUmlKC
z)Fy*X29;5MEl<H!y*q8c+MF+E-r;I9(o3G#6k#0&fGgC`4K79k{F@HmBArKdFFV3+
z>YRl1_S`@Je(lxz>p9lVVeb{aE0e<IWYx`C9r#(Xv%=MCfXLU*cQ?lZFX=~IQP(E{
z#y!p`)Y<p)5TjxWO^fc%W4s(peegW;-5H-*IT=>Z1C6HayAN*dFSxrR6Ry?RdChlR
zFSB=_utpweAhW3$k~8rtneH|$UCJ%wHxk;_2ie+oO62H}4r$52F*)$i%2&tl#vD@d
zsOy^NWW>24l&Fqm$;cU-An`GzZ2#;=b^<AqP-H5G78xiHhn7KdsogX%DxcH%!vZP-
zd9-tm{PZZyft&55B&<jgTR>}9ka$8agY*Da?Q_OOn1xPfb9kh9IgGm=#?XY2lqHsr
z2b`g^UVT*YO24!8+!dmIz|z*U9Wfv~4+Uyr@n3aF*Z^pGM`#gBDR3o@W+>3XoUM|X
zhdoA;^__#+Bc56nTHg1WE|^nq$oNNAW=}g~Uxo37Mp|w62)YfBg{rP<s|wzH6{;QN
z`O+htxXijmCZNBnIjz|GI*d0I7oyvnSg)AYsv<FgKp<dWBEr!87YARj_<J1Dc1^Oe
zw`r{?mX>H(eIt>5t_n9Cz$qIhZxcvmki$9;)hh`7)(9w8Q(}sxrX30T>G(bWoLT6`
z9EUPbtmiJj#p=s@c@FuC{Bu1F!Fl%H`E~|td3!MLp-yT3-c~KZeD`WzBWp_zYkhqN
zYcl2$zV7RSII%-a*@8!QUs)e=kJeu!zj{N2l952ge1|a>??VjnjvmR>yge;Kd%rw2
zQ;T|we7n6D3IhfxiZJnHOo4a=g3E$ga7~fQf`gB>*&r5Fykx(HMU3XZ&T;r?l+%*~
z<(m<pr9k=Q*yop_n{eXfV2h`hY-V59O@3l+w=YOHBB(sn%_2L^YD2}02|0$8tu9fW
zR(74;@D5qH6-A7d&BGuSpBK!<NCw$3jnYube9NtSI*KEN@>fuII6$7v!Vb-U!8@c4
zG{~-$p3SjwvIepnjNBq+bL-5xp=i#>{aKDPW>J9|Pyx+<(ObJ=es%EJunH`)O=Y)@
zw0iY^qg@pFMHbC}LAhxxxtidt^~!cMojRpO3bHTA!r6FzU}*kJY#>z2?S)+_j=DbX
zed2yq4czfY9CN$%MwbG49O!GL5|QAOpKD*8$)A%^SbAt-X}?zqW5@K{AwhX_*b8>{
zNX9SDBM2Lz-_Nla9+O7D)gw*rppe7_(2`=>#;J|ipgXH0i8BrQX<hSCDx@^A-CsFl
zced>E4LCkvC68<-Yn1TnY^O|Ed!zZUE2KdDn*H2UqIo2C1s1=-5ZGc=R`JO#{{`Rr
z`VanVG`d*lS*LUfA&Ez>{bBwiH2<~r0L_2Ni$NdhPG*1E9^GQy+bRJamb@EKNzu1U
zeP)-;twmslD?<7lA*Wj+bjyDYezmr9C{^$%Jysl-I4z>yM+WL!yZ8eQGuaH9p{_Y>
z$`3i3)oh;Mu$eg7y^yzZ)?l|JC<O7^*lC%2?Lkk*Lxt#xU7a4FWiUGf;thu+R;}DP
zC7a+LBi}Y_kNIK+E#=Tfpu9)FzrWsbMrrtQ5h)a<6ExC;xa|DaPAE`bvTf4=&Yr|T
z1R`JwRC2{_msp=uHBMPO3T=W2b8tAf3PtaeJ*gc8Q;?@uu5RXp5|(2r*p-Wym$Y7n
zw!EL!JT4L=eNGS_M78$Rp*_&gu7t@m5z(~gSJ(r;RBqhh8Ytx*yfGxl*gQWEdTxd5
zRn5y0J=}M*CymXg)v&|BzGc_P^=7U_!G@EQ^j(NKr%s}c2gZ*61$TVMR(x%7LeIm*
zw_N;!wy|?6S7UKk!BE;R1f?wWX1wS9{Zdf&>}*GJ#LrO|4DIMydwn1Ky7Qf)!a%CR
za)m>sP^%Y{4ZAw>`|NDwkqs)J<craWO$Hi)0-x^M-b+BHlXH98Z#X$^GMC$NmPa2^
z@KYeAq#V|zHGw((QWq-e<l1_F@n0^)A&dNW(d7#Bd#i~V3fZ#*Bca8K+;;W!#PepQ
zu{(qFd&{Ni;t=Q2OIkk8Z16?US4GRzE5sw@;|(<b^?3g00G!o@lR}PVd2ufTM>Q?J
ztcjZ>pvQXneP}S%9&%B$gWsW3g{<plw~PD_|J4Ph$F^~>>1ev;zcA1^7)=+?)<Yf2
zVc-V2({j(ZG4hO@4$L(2cU6_#LyAszvinj6lhV08qJ;Z)ON#y%I2)BE85?7}flf{D
zapvPIiB^?}b3+Mz4~iU6xBQo60)l<*u(b!hL5s*Pgcr;^JzME4uEg>oo23RgZ!i{&
zImI|r9GsDB`*#Pi(qxRs5|PF{pv&t)k{#jN2OXI^m;W#T;?GKBCsMl$_7{d$5hQF2
zR^rPzo(elpdxdSh@7ca|-f_~v*sj|3cLHjn`L7@+8%z$HPOtiQmZy$nT2373Q0^G=
z?c<tS3|FG9;a^`AQ}Y8aIy!8V1+|*1q~BEGE3E3VaWUA$tu%+;@?X3YII4DJ<y61}
zVf{M@ecMNO8%xFt6@@w{1aMD^(yNLv$nFex3e7}`-J6_N8qbW~#xH{ZlmFtp=#=G5
zv717<br;w<@s0AHw9^Agy)ax!OGD3BC^qSZHcv$^gga$@opEZ9<#6Yxj^J3!ie2f)
z)Ie8!Tm;^)FHFGaAh59Al?&<bPEzHF9V=Y&UqR#|u6sWC?DlThU{`VhA?XsJOw**k
zqu@OS%~Q@Y2kbCsdRwo)_K({^@z4cp0Iog8nf)o2s&v%7=AI$!-Bq(xCu0uBWLk$I
zO%7_Hy_y)=qeW@0QZC>r*w(|Y(T%A6m=E|)(Vdukmq@6J$^-MnUB!sV*qy-QMEsG4
zhI5!M%$@8|g<q4hMgNK9B2*;G{K4o%qG*3oqw8L<=@A@CwCA2^0d%~={N1+-dx3hV
zulmD@RBR28R(D3z<{hy;tEZK{c0n;tog1UPtVg0Ou@Il9{Zx?sy9USa;!ag>epli=
zrm}HDiM!zb8u{_lF1gwTEaAo>5$4F@#=Yrdm@u~V;`mj;7|lnw=MrAlzi6SQ`HKk6
zz}W2R_6HlRAsw+dmknM;AAPDMBo4}{v^ux!Iy06ze49D^BE@_+Kl&ehtYxj2KI+MQ
z3oP;}9c0>nb%O3oXbdb;S2F6P5T)cOkDkDBqz9h|K9>x&K6hrV7jOSaIE6t`;QXty
z7Fqrw^qpj6k@u4{R{N#;$j_3|z5iz-V3W-f(MlX^nBtFRKDsl>jVarC1k$Jhnv!G~
ztCj5hd_Pvn{Dz=9>C^z!)tKU~2nu5WqX8z5K_Gp63*<bA%>_ZR1m&xiLHdGaqgyCi
z0phK`;L|{bzRrf<okC+R5H+lhC}<aTYYz{YC0T}N2|;lRuscOksv&3;J31$28q$0@
z99jo|oAzoV>C}RTe1jC=eodN4&T}kr7bLAWR!82|Aj#{UY0RdVn5<i^3S)jFgR*w4
zuLTG(n+{|h;8>DtL3RdmUj}ic;hpk1p|VUtqVqx1dbm;sa&z`_-q~^r-uSbfop$kZ
zb4i^udcEI%E6>clwqLup^Y}EKgqF(GXMcAt0p;EdcDBuQfQ*qs=f0CkEyFB96oMTb
zeX@<6sGdeWxkcq0hf@TFsJx^$py?N8Q<azFlHa7n&C4<09$>^;RI6RQ|A;$cM^lww
z4f@&F|3_WuepTq^rYvI)R>CP()Avrf<hJFRCRrLx@o*$vPN<-)JT<&UBG`}bw8bGh
zkRlsuSKaY*vWN2&*#No*F?GtFBAK*tc@!~OlVusJKMz;6QPkhWx8B&r-%u(BLNHn>
z9Io9k?(uVlUY#Yl4Lw&1As}K#_p%b_Lm%g7FMlL`p%Mf7t)Ac}@cbPVq@F7JiriA;
ze?q|SF4r8hZxG1^oOXG8%yB>(d4j5II=m85*{Ux1-_>9#+6El@M%N2vo`i-R4!w5B
zPMjL5&(A(kgfe7}@jm;oW~ct`>j&z^I@_wuACGt6Ds_g7dC5_gB?*RH#J}E2)`aP3
zzPtKDsVNSt>im?iXrlIv*fbK4%c#fLtNK~Mp_?b2=kz<pKq8<I=&T=x45A^Lc=P&x
z<WYA7@VLw*D%-qeoYEX5Mv&d>>$bgLHeF^@G@@zfsT4|dseQIP`|)28u;-g4mAd(#
zmX&^T79GMlM7eOt)Cgqdg-XhFtWLrem9rC>1wGg;3UVK^xAx}wUnPu{5C~B8w14K*
z>QgE*KooJsbuq=?FESmnQ9u>(s^i7sL%8lr6`5j<=e5gcSBpk#>p3>kznK%dAE%$+
z$Mx9*NDP_CW)9a_N!05j=kkgkzmIuh_(I9T%3esVI{YeJnd>sQH;*waFYGRJNEgYd
z?Ad(M=-&v~aPen+RUsQ>@KQ;4;zO#-dyx;BGDzc&gd^`02wfp5NCNT`0`EGgtp>iM
zptUW7csE;MXN&*75S`M|JllHg-CENnN%!cqcdCJ%Avjyz`AW=y%c-llOro`<o5igi
znMd+UZ8F(Vc0ZvoPEYpElgHW@N9<}2Bb>*gT$O^@andF6o3l1W>nUFv><oh_U(ui~
zE-ug<Zj(Vf?Ti3wk#SBKqECJrW&pdUy&owyR@V29o@d&{Bw!~vn4a{&m2yOFS!hdz
zXyy<HDT6CVyPo{SG~*Tld&S0fhc$uel^Y_TL>8w88{)Irh?zwvx8uR`O7^&rXNbo1
zMWvOVMeIkte1oy+f~?fQ>>?dZ!uvnS>3&V|&m7`9sDOTkQA$mzWG+dQ%@x&NH>3nc
z%G=FaFNapKtL8|M2TqBGlqZjC1uWg%bE=^Hbg?pz^Ilk{$}XX^j2Cxgdg<XHl~H4r
z)d>f<g1l5OJ$C#E*H~O;&!B|M{nXDm3HJ8Q&pF4>3}^)GSJ)6fBDHZuY&2({R4sx&
zE1#a|vJZ?R5~0NMan`l4kt`|MAA7Zx_s)OUr0Ex~6n8yX=IZErdm>MX?F6@)rirF2
zFW8Ru<<^GD)FLS8!3*(2%u%K=dJUb&dW+Pb4-(V}oO9-5Pd!N;=1F{r$!X5q3aXEx
z&JOBE;p6GO@?2|}jEwzZ3X+XA)34T;^C4=n(aKV@KZrwxl9vf>4U|Fe^Irln^$)*@
z<~}^dB+)*`I~EsiOgP7)#Z8J5weq~P1L^Xy+}0+S`OwAAZ2>+ui>(Z{fN-#{nR+Z|
zNnDYs1VkT2PiU{oHKUKDJSk8!Ou*c^tmVYh83*gj;uNdkeZIL^RihdIPD^CN9}=%_
zYw9+Saw6^^iR{CQ=zy<b19h{5Wwi;cgjwhgp49Oels!zx&!wnFlEkI=Yp{Fh^%C48
zEjdGg-Tan`Yz;My7Rl3^k{=OsuoA%ztHW~4@9`TzIGFA7A9MoVs9u`IOPqE_JvvpT
zFrjRokOXFiKAt3N`uaiOGU(pZ>aNCm$`Mx$s8Qc>A1Ko;)IZve;?p<Wh(^Ik^`^<p
zVJ$O-V;v6uz0EiT?^C&T+Tq~#N6<d>H;0TlS0u-oCz)b|vTKZGGCe8V-KewCsjC_r
z5@wU65wG|7qVODW>{^mE$?G|*o7P5AC=|2JX`rK*<#j86g$;3f5{kyWrxKT=QfEbZ
z+-WsQ^ncA153RGP-fij!ub6M>e!w3gw+(jNeX%2&&>52Z_I;VMiP}?nL^f)DoRmTc
zyM0WhkVh~uTIT^bLVG5e$A&Wpw-ZlcLYfpVG!04y7D4WGg!3-Ecx7+!?p~U8r9`xO
zFg}2%I5ab=QYlcX+=h%L-JRr|wv3C-QI7|?0@kFlcrE<ohn?ZKXEPi7gh9pk`Q;Nt
zlns>Vmdx%1Zf!7S%&!&;0h}IThbOG0t~G|<-B)Vpn_p*VZQ`Eobx$ZE_ZOvRA2*3q
z*;<A~6TW2o)K2+S?c&+VTk22SPpbR`UsXQpVlIBOr2)=|6!CaFeY$W|U;Coij_TW?
zZU;~u!f~Vf&7^H9lv)K4wAl&9OHe|4L2OStW7ys2G@YWNhlnO7!Z@EbLRzY$aCKvI
z;5(W}U*Y;9hVv`gWLuq&$M_>{jbDJi)AUN2_H)M9u`r-$`k++D@gPDH0^r{W*t`XY
z0`0(mM!;l&{(iI^)It&ILbW8#iNQlA`X`yQ^H!-D6I{;iF<SCZ8e@V-bRsXxY240C
z{9xFiZI6>2d=nexvfgCp;%?4Hmpf_`Qb}yc6D7g3P6=&5i}%HeQZc+hIe=~|m+DMI
zE22Qo-?Hd&JC<ksI4-}UdGOX&Cnbfix@;>dSJO(Vhjt`|##>Q|kZ{mlNl=V{<(CrU
z@0_%vktHJH2n(VJiXzbwL3@jQpJ{xUhn(tyqjLagu;5|%xR(W<{5zO~%5D&nw}wP$
zs*cBkqLX$bt>53Tmg+GL6{R2r*9Oi35h6o0q8gd|n+}`d-7_rVL{1#dzRvj*kdYTt
zZthedXq9%xJHGpx$$%rCQmS@Ue+(Ii>wm{M4};nyJtX=Otx}zN<1e*Zk-gwG7V1z%
zVqu(z8pLGS#x;kkMG5Cf%QncGE<CK7Xk#@-fni4n?An`TP=#%3O>rzpL;Go&iVN@4
z#!`pYpt>kt`N^traD5ZonoGi?*X9!_Os+->!Yqbdpj?E%(A<kEmN<UH6=~j-%O(8h
z=QEj!rqOMIy5f<1Qt7jbn20mVk@&ko=OK5;*@426qIkBFt<g`5LxLS1(#>wD3D>9M
ztZ(r9;NRaQa2xSeqWd1!%i&7#34JVv=)3QCR9mWxI5ne7P>h$fg=v9Kq{O@(y+u5}
zzg6iSw?!9eHyUhz@y%Y29?zM;jJy8s@5HEOUkb<$$(Qzy=BeQ(SS@`9-yBt07QXxa
zJfsoqK~oc;QXPfb5PZo}T?W2-bVD$PK|%@uY6Ga_0idz}<p@|c+a<Eah7f#{4?cy-
zox&I<4p|SOpd~@h5f}DDG@6AV7V98BS|-{JA`(#o@4!g<N%1!U)P(>Re+cD9F7c0e
z_EQMyH$lo9MRId<25cDlCX(zL3U)!z?kLmy=K@1kKsQVjkCZ?+ilAU~hMZhd*a|gT
z$<RfxnkEo`K$1lx<m(}1{s5L8D7iNV;j?klByD<f0JY!>s1QQs*+GMf%)v{oVc%IM
zk<695M9_-n;+dN>nju?G5mYu1$RUKxA%SCF8`K2_AHo=A^U>HB`3#I<mXsPBMu$00
zbT$Uw$Ytn4D_*%2FPIqvkVHy4Xyb%ou!iAgjHG*+a8-wijSPI4%kXv_{YODb8OXd|
zL%*5JcnTvrgE1~ugLiUSf#wXX00sqNGy=jBlfb$PBUg8Wd`n>EIAR|nWhq>y26hk!
zpa*kAV_(f!zfA3qpml*UTrPubAe6`BXgY@S{RAC30_YE*I(4DbMbLiLCN6^V%pidk
z0IGBVi=jEgJ_eN&Gn)w+wJw0>8cElz1Nj2s4}g-RVgM8_5Tc`H>MsB)GXQufk?tDC
zKn@|(n4qr{ru-^I<_e{^f$%+1;=BVz^HH>lQ2Ii0ine885fNG>9O$yl5C9bdkx`H%
zh{>0Ub#sMvFa?1KLNxZXgP^)GBU7qjkX$CY!Js}x(B8C@&E?YToDh>kdD)=AeGCeZ
zW40A2c^?K<IRfa40J0*9`gA~<CnWwbIz<4*K9k7VGW89dSP{ZVn#4x=Ugls)rXWeW
z0>YSsB#&`r)I}1tP0AVy%e|;$J=7&<g^3mAGU`H!ZWPJ3C&=m*@A~J0{g;VDg(1O-
zoKbE#Pss@T+6jwKWKHzQO?4!GC(@$!%?QYmM3OLuP(2{MD+4`%P&*m8u`J65khC>t
zyvgAMnlp+5C<lco6Hj<tku;JBViyRbD3Xp>2fP9$rH4V2Jk;3$ye7*e{%-7DNFs75
zc_Ex=R~OQiE5-)BJBOs{QzY-31lL3GD?JG2&=zt%y;v@OVLO>30IYSYv0%oKxkQ}V
zPDJd+zOP86Si@LPL3IkC5Khu2nx>i0!QW~p>w<#Xmq-+sp$iy<Xw+^jnfJvCb)h2g
z^n}_a7he)d)`uaO)Xrlhq|m<v;(q-2EQyL0f=3RZh;(IF62mi3ru|ZjM-C;Ggo3u(
zi300IgW!asNFv2t0~D&ArW``_l$;^z%%DH%>1#2C132|HfU2E|vObAc5`oJ*PP8$>
zRtUYD$%Jo{0Cc0IxLG1roYWOV5Nl9AKq->;O(+S~;}ju?v0)0!dZgIPAbmZM!zoBo
z2ZZTKCkY`tB{h%H(_C1B0b!EJ9Et`HrsvG6FFhDB#VG3)K|9EMP{{pVBvGK50uTza
zP<)J}1e+}z09PzuP>G|=2zpM)EtSBc2*P?8T_6(?atbK)#3ss&5(p5;GGi>v#nC`g
z<0sGtVsH{o5Je+tA9&D}>Vv#7C<>XRUW&4x>d`WctHvy={YE-Gm;`H2(%3HFgCYoB
zmJKq16e!VL5!idibk7F|Ir@gvWb^3fmqKi_tOpX;|NVvNCY37v3Ai3Tv31zB-JNHU
z<m=iX8+{OZ70{R@9Mc7gLWIPqm}h|uQZw!~<8G8I+^=+K7+~D4DZqIqMvo&wqYe&D
zz|+?r1~aE5Hb}C4Ge$o$YWiG!Q7Gw_BH8ch=hiNCthxFyC|Z?sL8syfej)FCOzJ>J
z%}nJRH3{y@^@RzO*&vCgn2bTL?DAi%Trr*^F(}F*cvPuUn+W193~<-6eFoB9z?IQu
z+Uiw%0PbT@pc$QyDA`;Zp(4yLB9;G#uBF&Aq5?peTEmcNMi=V!45&n3-awyGN00jW
zks;E|W@gz~Dwhpr9stb6Z$ARf!wJP}L!L`2-9gg0B1AQxXu1L@%$8k$eR;tEA!AM^
zwDTlz0Z{ux7%!ppqA-GaCL+p@;E1o`wg3u?r*2%-k6jJezKKAze|jC{h~8Od76ZUx
z(7WvzblMWpj!)eTXQF^Bp1%_`d!Ldj0?dna$=%Y>Qw-=wL%nyVTQotAf(M2HsmKAw
zdI0L^$ye_rZ~(M2xEX||b+83RYW$g?lyN^95y~zJ+O#9z(Im<b%OH$X*7+H5IsjKO
zmpcGKmDvt1uep!HVEDZZzXpJ{Q_}8uKd5L(OA*5Ne}%AAva}W@^UGmGF*nlpyED>5
z@K~P$FJW|vISkR_TF|dRDJbdHGVAC#Si_qxlF0(>6=H%3j)rngV?4Ts(Hwca`9}MQ
zjhX`UghC8S!#YXiM-wgu4WE{x+@aD<N+gVi+RQ*jO2`SN^*}ofthjSdSr}0tyxnZg
z=>n;lN}fRW#FK+^;)ZF!DiVx^Fb38ss^@4y1({cHK`xR>g^|eLB0*%EO3UqPOnnZz
zq+#c55>TB{?FLY3kE>)Li4x&t+ltTb96Ji>Ct4oDcnpD!qLCF(ZMK&Z^^i2O7v9iU
z1O~3jFgMO0RPwOg7bbxzGZ1|A$|WX(_XR@fqDXG=>Oo6Q8p?8po}sbw6|FhRImis)
zZ>^+reM%geBT|uz<F5lYLq2-?Grv2PkjfxS&HyJFm~EY)37n+rpUvje53$4q_tc5K
zm<EqMB~$)Qtnv-0hct+Rf>34(6)^u4aym5~_IfB$JrkK|u7ywvA^RD1ADqz6%g^#F
z)dwVD{Sxtr7(ZDO`aXe~ig(S>DWezsCg&P;ZYoE)+-xriJX%BwMDVep^yGE;wJqR0
z-{zv@M+}leNoE9QK&on2hJ9N0`sKGL-wcN_a08d5GGGMWibU85ih>MFqj4HcWAeur
zCHF~5HUUg0+VrX3bQ{`fwg9R^2xA*kaubq5Cc=fXP3-(Fl=ACo#0P-%_#Bao;@w3u
z>cAY62S7p>GXiXcx961HkGZsydYpE}G|zc5H1O!cq-*(-eFa9Ja4cX8pni751%ptA
zQ-Qr9l%#2C;~(fVuJn!|{MWjmz6se~fD%!Ct8F01b#A`EhYSQcIh!kliHsx1ors#b
z8>j>(cnUf_(er%IppH2r)G>T*Ogbq%7Jvz6KN^y%9RX#J1Fpv?J4lwtnC~YN<xaA8
z9*w`E<@_eZcvE9Y^jhb~Svs<ba8{W`B*}6I;S@6+2U?iE%cqo-BmU%!qn?Z#Y^W_s
zX2p9v`g~z#q1<~0HtzWzOmj68$1s~@GK)%kGn=(A`;K8Q&t$F$jfElSfE{yn3*g%8
zxsPwYeKPrmyq;@XV5pXxM@wI51ne3~n+;tUXIPk#TU@^W*1a(Q;q~I@PYd6#znw6A
z-+i+<YO;iSy;Sx3`@!pZK-+i9w@WQ=mVs?cgV#&fZ@z=tRv?SZ)NM;-ZSxDc3vUps
zGbW4RwpFnF8kgzHg2|e?|GJp`Dj(zWBl-Cflbw6*8z8h5*1mCTh2@fYnPNXig5hW@
z3_t{5q@4h4jiaqFjIBv1C7f~7b8*A>X7i=#R)qhSv;5}E#T|tF?#s5VIRDKg|Lv@s
z?L7a@qQ%|UjC&s!H=_K1w6yJ@78rMzO|g3zw^RH#GZwdBGVT<--G8;X?<l{w%D6w<
zwqLb)cw~Ao`1ZhY@nF*Qu;lF_t-=;Vz;4FkG1>~7YCA&Q>_VRJ_AhQsB56l%4jgYz
z?mR!e`}{}%^+Pk@;K{q=&BbF?h0|{T6Ws47P=%A{;FICEzaBit*8cwUW!u@N>3Pb#
z4STc|2LEG)wO^vGFmdE%MF4OL_WRZfLy)uuP`zFLUG)8K8;Z6*;CIpI%PNK6pFjWp
z_#JQKFDq>6j}_LA0$@f->#7jYK?+845~Ow*xu(vvmRUUADdbsfT$rhXFome@701J3
z=~YDC=!;47QP5CgBBf-t@%O!nJK|J(>B7qzo-DR=qJfh+1A)9?l_8qRrTgg$LH<+f
z$=1Y4I64F&1XFg%G#Mi*zrwp#-K8QN+<RY>?7n0uQ;Umo>$6WLIn+dEKhuK@(E3S~
ztPakEH$Q+|5BcbSjgpoRc{j{Gr1~bUBM5@J!<$}>M|LCqZxJw=hP~N;B4DKwWxxLo
z0w&jdy8TZCY((PZhFHG!{OBJD*x`tkYXFHt+toi1Fn`a*ncuev7$&ir83HGAX3?L3
zAJw;Ho)yuKNw*<u-9<<daX93%5uQWi;wRhJK@ZfQQ6|PW{Az|q!0=20aM1`@wD5@9
zix~0CRZx`lzS=^V&Ea?up1%}FaEQBEF(eGhaKS>(oC7n7AY$lvk)mI^bq6Hj)Nh$)
z>W|N!CS|H_m4SR+93@>RTf$DxJG4X{uQhZy#G+I^h9$T|@d_3iJ=`891@b!omf(|_
z)QJzgp)Hnf_c+1?`jon>5es-H#7NHzhV~G$`_y0;NF5$25$`)ncaj?j!mP?Fm8h-C
zYezKfD;k=`H_DnT&zI@_@F0PPdPfDsbj*0m-6FhZuHlJ(j2DE0%x17X_8@)~S4X~S
zcusWv6hS{Qhj-0vgoT-DJOnQ{bGN&JUEbHJuDo`4zw+ne-E1<g`2pw8H#c`(5KSwZ
zhp)j-J%Q9fx4H;w-fV4$hR<B?c)*=~Th>t3%Yo$&?X;KQ8rmJMa;YbDOSB4AI7?%b
z=6R8UIUKE7HE#v*a!1G`Gew+`@>$#F?MfsMJjPYZdT??T1c<(e)kPP_N{I&JIdsiS
zN}oV@g9#2qzWE?<=;FMMi@SEPZAWHc3bpJh?HDgc-T<Fv$7JdJniqQ{S;cEJs)ZUh
zA5$fH=)D~Jee2;$qyVw^>Rc}Eya=<JbP(PKjjtFN^I>k2nTa!V2Ys+1s%)+I(J@R&
zIVXy^NUFdov6FB^@KqnaWY(b2@avr)In)N>X75)!4mi%2d%$si$KRzU@rX#|Nj{l%
zJ|bBNOTrB6!RMe!;M>r_GO`<@{AoLKu;ZruGbHO1yk~mdx#8YM`^KThlxen0x$us~
zNlOuXED7JDYY;w%K?k9a;wS8hBJTnF94s&%a!eG{hnX|_4sKyPp*ZgAo_?IE$QQ9?
zavZ@OWDplM8hRk}CaEdB?~5p&@()=S60&kM0%jv=Eo+1GD!yCNAFqok7Ar`I_dSj$
zLV+wB1ES(!?(yZG0=<T7<m3F5?t6mRU;@`D1=jb#&s&WStt*rnn5aD3loMILC$2FL
z4y#d>-uV0juHnqudS%!tM3$V&+J1X^;9CTYz%4#lRF(0ULEk+z0v0UG$^ypkzb`GE
zm|VUFKC|h+hr^NdI@^M&>@+&a#9TznB@FZ^V&HLNuer$B3jIgPVAtr0yZcSLp^Xwv
zhF>N$KC%|@_fHKPyV<1WX!Qk6)Znv_)}_zCfHvFUYrSy7$r#|(6MT^oJ@7*_Wqz+v
z0_NWRG}1je3jvJ76A5x-eQ~!xew{chpT(mz>CHYbhpZv%sAoe`Hf8H(<gxmwD`9T7
zMkmMfjSNEnOm|fb$09}iX9b~{LRrk(s}cf{<I!F!VazTClBo6cF$8y~{orHLt%2=v
z*WhF$)+giYJn0iDu@sqHKDIm|oRg_vJi>%Nbtww1r3V~~hD#OL206@4zLRGu=4aTU
zvaF%Cw(%%^e81pi<$OGjy)$e(6QOe=ayKN#4bNbGMZb4^x@v`^e1pc`@T2#a`qU|T
z2hUyl)o0KTi$#?Ne!Elx3Apu<Ihh0m_R@QH`js1=m1oO5hR^X0kmOzpq4&$_Rn>z^
z?Y!zF{qEnXBbWoTuNE<zIrxcAj$24RF3T6=^V8<JJ00j%PvZ8&*No>|`Gl89!#c6k
z)8FH=dxFa67ZpxMS>V+`{l<0H{nyFAHRi+v>!vE4j<eHH6JwDg`Ris{wQEVaNypkP
zz%$#IpLXVd1%J#&uvKXc?=GCWS%0E*5O~!DdVWY8`f3050jU*S>yuMh+v+C)zwxr?
zM{`eGAa`6keT*0|1<v!*KU9VYIEcP<DEz#(fC*jqeN!E|M45NS6DF7al+;MIi`Abu
zEGXO@+c~V8&0i>5VTggQ<!jH6@_91|Ap=9!*H1z>`_Uh#S0LYC(#yXs_X^%yw75sv
z`M6T}GrJ@V^jVimL9CY-UY^}6tJW{DactE}xUm-gO2lHLI)m?*<zBfVw&VUm);O;<
zc+zmt#nOpkvfN5;CZqLbtb6#KVe9P6+1OW%buqYhIy@*%p9vH5&bPpdZ(eSrWpcV<
z!s2yzw6dN|zWQ-mbf45tXEk{$`|U%Ehi~kjJW8Iv^LnHV%4h%HlsT4?T+m%<d;4<Z
zS$(~@SY_C?si`mJSO?%|(OrjC9hJ<9sY>zaY+Pdt)LD^-&qGd$$vcL2M&a^~l^;o{
z_MtDD=P4fxxwY{Hdc?_u@9j6ZFYz6`!b+&0aE}ewk&E3UZdu%yCvNMmH~=5Z^nJr@
zZ2!%(KJ?6Yg#t|4035mh&I!U`a(L$Qr9Ok#JbO|3t9LJg(2ZB#Z=P<mu{R{iEg|kI
zj8Eah&AiRckwdxBL=6{g=a`*_<FO_d@XEzS-hKRd9<`|`5Ia^^u^#@^Z|Cu&(a@xk
zZU&W}?NHYq!q8YxCOf$;6O{B+jl5UoXveM@i3|fzqvr~#)eozeGBw+cdn<k|-G(Z@
zQmgXWO?B6MENOgD+LmAAKjp>=%bQoh0a<0=OzPKD-{c0k3-Uf>tW4>x3uB}h9NzWG
zN#(HGP!{kRNLoBe$9=t{Zu-zOf5x8Vncvr^&n`upZq7tE8}?XcT*$sMPR4|_9>sm9
z>yMJpm0ydZKChmNF9YokS=T<z6=-TZHk}#%?0@><^Xq|^sEhC4UC&?oN4QD8BdLRn
zEpt4-K1&O@oElZWocZpr{rUM+w`v;-r9e0E%V+l##k8D?`&$CeN#(ri0$;Y)C$NFz
zrTbvxIT3OqfNIZjRRX+J5qH1BiSeG&hP&X;1Yp>pcN*ZW)Vd%^gnW14;AS8bjfoIv
zko%gR#FL<GYkw&<H%Uo1Ht#^FjUQKE(0!X=)$l(E*tv!xXYeC6&wG8rdTJq0{vcr2
z>%rQ6Az#=-4Dmu?e-N;ek0B=Ep@~03Ec-$o{~%ys&rn;nFzSX-*YH0GSYxoeL0CYa
z;mf|Tpg#zh$YvP4I9!h{JZ$R^0*3c2q7jXNJ&5@W0aFXVMZnTE{zkxPLT?eUK9zqU
zV0}Tw#gTQK_sj8a5wNDMm-T&7G?r1#e-N<fURpE)Hh=mD0qcu)V~y&?i|I{@9#)H)
zrimV<iJ4WCoV1Bq*or9(kD23)z1JD@-6nPuFJf6TcK2LhJv{aRFV3epc26y?VI}q`
zJnlj*^u!?Unuh0Bah!SatqJDHq?)c6Z`l5~38oZ$Yk~nXV!OBEs0}4C)DsN<GQpTs
z9ns+v7+A*W6bL~KAJTj2E{Ryx39)@~G+asI?-K-ULl`a+Ag>bHn(lMpV*v5*u`VU>
z+a`t3B#A^M3+X1^mkN=@Pc)vwk+Drw-X>J2Cz4l3C2RGEsb(aba0xQ!qy%pzORFd9
zMI_=#5hLI!u%;BM?G$H29?kw#HOW+Mt`xb5M6?N}5DZ|9NOb3lbHYyxqGfl(Prq-F
zW<-%<8Ih)pPdKua6!0qDwJ#;uHe&;po@5vl!F4aHKS^mViRBfxjyi^NNrsC-Mp{Yc
zazaMYHawg5-dm{@8kfYsO)#d6%Kp%jrp(VJpo;#iR@^K_)+}$d2?kH(xWH=8Na>Uc
zZNtx=Gz4|vzj^;OTfrkc2W^7o;2KEX9eMTUH)r~k?OROqH><WUXQhb0(ca_0$9%ed
zYl5wmye%?#yIJyXH{tEC2+zIkw~E-PcYmQ^1h(&PB0?sb-VsI8U6<srge9R(Fv@4S
zHcjc|X1UbT#8}Nl;7etEy4)vyImCAF0eGn_J|U9ZY5w@hQM2zEo6@kj?=hFY*D`p|
zQJVJ_kSihW#2|$M<<7@Ed_TyQ5B-M;W^{@H-N}2Lo+ne9Cr4NC)F)O?qk!G6z+k7~
zOL2kGT#m_Qfn{?vjJxnsz0hi)uss~DfxWe#D|9D_awaI6<SOzgEh?}ndU=`ks<{YJ
z8u5Cks1(0AFtRvKtvJLkBP_ExZZ6`Yzc|T`E|#DqEi)`iqr};^Bz>pEskkI-F6GT-
zNdeuPM09i39BsZGs<fgxr?|BA{Xl7@MwuQ>X-#B8-LtZm$l#BWWjDoTt=#2OTV<c0
z#UZ83`|13<?aKGU%LfQ5-uIRdOUI7VRm{+NO=?uk*;IVpsh}yU_(m7Aa9Ocl>bT5Z
z*{fE$F;H0=TDd(JwL4dNQfhfXP*u-aby`}rZ&~%LH1eXk3Xt{WdZ#MK+Z8jaT94E7
zj!`jHk~{w08Ya9a-@2+_+6i@1*U%37c8Hl!`WC&Vw5Q{#C6?5#TB><j3KJ2m<!LFe
z_NisJ6M_uZih#U2#2f`Q3#3J{sMYG^c<l8;>s;(?g?H=jM>)h()pNGc(%9EO7=*1^
zXsF*UlKvg|5RHHtV?SYLdZO!F1Z4Gldbi=a+n9auga6J4Vd@53-=_-q8!UH==+8V!
z${HSgLm2HggzONT8bOU*@N1X;Cj=~krzuIZDaF1iEvhM_tSPz0{#A~(gzrcH9byNU
z`xF-c9s&Dc-|{i4rKzl?Ww7PbZcDi)mILXB+^o|5LxTK4Y%~HkICzVI4Ybe_Kt4@s
ze#$>>MI&IdyRGAzpB8vNeJT62%+oeF_-WC;ZAqqW+xOGDecNJG+s@t3{ex{kj6Nj+
zKmTfJJ%1r{D)R}72|4#geZJ(uzT)|GGl;n}h~qGZ=cU<7L{FEc<I)FkyE0TAA1^Wu
zR^e{}(PSgjBUqtUMS0(xh5>FAnvBd2&JwB`#6uko%d%WU^lVzl30EZLJTo1AHu#Dj
zXv`=;kL-qYZX-Gr2<f4IjLPL5Ns}F#vLH43P97~JyqCT)pOHSA-g&1}hOnE%!B()`
z%80kiM5{|Bn(?6@y~R+M?L3_oFVZZVk)Ex)AE8OOhjcBcf9%&~uGQfr%jn?O<7eFC
z<3Mji-^U``2QTl5h^F(`q7T06$%6HE3-#^-dPju%L-xAE%DZ3=eF3fg7#)3|m;2K9
zobt;1ij3)UjZt0USAALTy^5Os@v`03S_99o`m?k9ReJ{-3C#<Q2L(S47V{3}<_@&Y
z4<uv@)YA`E^7al~4Jy(Py+(&$Q4f!nvrjuPIyek<4h_FW_I>jk>T&G{==S#tjoj!A
zedT5RUOw{5p>OGG@Nj;3zI^zHALBYN{ifDPEpPuwE90KuV2<qY4E@+0;jUw?0X(_U
z&b=;z7{>D}&?PSu>6@Wv_G4H-#&&u8Xn%~5n0Mf!Ip<GfEU)Qs9Y=Q%qvUc-6crPg
z*CQOm-9LK9LyX6m9BsuOOi2A0mLQts<QwGsG;ziIz(b3PJ!TS<d_t~*F^|Vpv|~z|
zXgZH<0xXAOp+94~_nIk%a7t}>QdN#gZ<wvqh{c>?+H!&R(J-5S%(Q^{^o;|P*^eoQ
zu_>zuGuijQNW53JCt|U4WU-O^;z{)NW!8+5+YI9WB49%Nt0E6q#hg|pVpsn+LBLS|
zCm~?Yr>b$M>Q$$jqo)rJP9F&z|80UP{~HtRzX!qS{yPm!`u`6FR{VtVpBmV|Qeagk
z9REcF1OHbI3{8POuz&NH2KN7z0{agKOmq^i8iVkD94Iy!q_rO`n-t>rEL7Gdv;q+t
zHx;J4AEx-P4%l>r{$B`KMpWQTtkG=jvx8Wze~W+}ChGmu0sB`3>?qy%KRIA%1nlUI
z#eeI7y|@2Q4%kVd+rM$ZN`g*Gy!y*hzm~<Emixt3_+(ZL7gjX2RlZ-TjLfU*UaN^Y
ztqo4C3+k#XTCY#aZiuXC7&vQ)T>qH9-I$uw6gSvZvC*7e)iUw3B`Lo(Y4lUg?x#0(
zZIfGVxj)-7ia)1UeV%JZj_n`|ej?wLb!1O<eAwwK`_-La)02nnnVjuu+U=|Q&|kbT
z(7HEJ_iLc6XYk9>U~SV-#nRB{{gI}&(c1IT+O@Hc_VEwh<C{a{^9SRfF2)-Mr&cGX
zzU@tQo=$zbm}>2rZbgG&do%rL6ATT4?avOPL9olYu0JN&;9n-##lpbE;=t+m@#&@E
z%cYUC<*B*Vlex9Y?`sE}>l?q<zbtNiUD^1twXyMY<J;Bd*Y)kAU)zgU+Y2i@3%_=j
z*Y}n$_SUu!)-MjWt`9f&j<$av|2RC|zxsK6^6U8L#o5)xPZSDu3*w<LuJP&Bs&kM*
zctCFBzUti0Fj5wcY_*#A-BC0mcJqBTdA)H=%8~TywfX%?oO-3k{j~*yX@V~XveoMf
zhqENzcjo)+ibmfl1`#l5)EAHEsU>ln4AhrQ7HQ{cywUhjI$dT^XSXo$p=_qgtTU29
zv!Q&p&StXIWU!&)+eeqxfj62TD;HY4Pj(gtKURJJ4F6wkf}Q=pOfW7W1`g*E9Gl?$
zUH~3@G1Gm!e>K6zs7S3ObAqY7wsQSxFeQV?SX0%^DcR{@L1fYn=gU!oh1Bmu>D*{m
zV<def@<=!exAMrIV9%NdOHtXbdCCyvt|cm+FXa<U4;|*jsOsCUyNSpzTae2SRa=r9
zIpl_t>Y3VZWONU!u>?PUzrB&w_`1d_l(!y#^Nn|NVGODE&;CGsK}A}oWWn@yrFXAK
z{+M8_F=!Kv<<<maL7QMrlbT$+$)ckLuR^&?l~m5hq7=>24?`8_w#<U>U1Fe$ht*Cn
zzK-6PPZx|<t4WU!hPva~bd@uEns-p)Pm8E>piQtsvLb@DSYq*?wSSplz`sqfsk`v!
zLy!Uz7TPFYB{!>om|*OrM%rBN6t^bWR4v*B({S$>jHIX~=1J?C?5EGrE*)jtmp6`-
zj2-%8f}snqv|AIb{PEBL+64R7k2b+p!|8mt{+M90y==E87-ac!a*$AZDQJ|fz(y||
zJpE4-Y})uQ6D(eshi9ThxJmxj1T+3)g1O`K)C~PG!P4+~_64URSVsStU~&*ME=*d;
z67`MbtqG={UabUwa;{f~f8B+(^bRAIJ}wzk*hsq)v-IDXV3|wGkb%EUFsDBzm>KVl
zv3cP7&6dd@6Ksj_{2bD(fVy7XlE9?;4-?EOkT~tu1p9zdIuszdr58h{UVieO@HLiq
z1j`Nfey2nm$f<0Fedvz~Ru&}OlX+``$^456HpPrK!5IITV4PTr1vGz~V0}2ZCRj2|
zg5hry%tMgy^XxxNusH5p6D$#Jf=T>`31%HAVEnfUR?5W0PMYsXNkQ67=O!13-oQYe
z;L4lV{I@1p8L4LCe>K65$WbC+$bZGx1*&zDB#R(rMZXr~W-5YTUOiu;xHZ8l3Dds4
znYx0082M3Y(j|h#_rzg(eW-1!L}=-KO2tH@rbgYAi2!3O-2=RFggij6Nm_zI&qms5
zcdP$4!A7zFVS)vBV24bCK>c03cQbRS{u>j__tpf<dG-$zY&-g2O)z=12`2h)Ot1;;
zdfy<p6~;hdmoC$+?{ueKF3J6Lv<W8qpG`2<|7wDzpiMA~|1iOj7!F=oMGJly4beaU
zHo<)UGQkWGWIM2OtnJlDr~eOS_rcXvx3>#_rPE0Wy$0z`LWfWTNReJtno^Z6T~SdJ
zdJ}0P3MgGVK~W(T2_PUK1dwW@7exd`MT)%9d*A!n<$1?B=L=+Ij5)?ybFF#(uiqPe
zqXnBD?_C4Sai!AOfL`!*Ob`rg;UC$pAj+L8dj%X_s+sQ%UQ$5mVW-MfH$j;5cj|-|
zWd7R(Gx#qPjKW~>32%v8MYzi2>_<2m;MtIsCg9b{t3K3IfbA=vgAXy+4r@*#$c=BX
ze@w6q=Gt!OnD9cH3FZgOt`_{#Up29O!CT<A^*>B75p>x9m|&(p**f}*`snTdG{K~z
zI>0J_nP7tO2QiK}xb&8^Z=E|uio1Gs@>H&E{87i>CRhx|f0$snEeXyjq5<c&jP}n9
z^ipetMDp1{59b$P)w;Cip&MHf`<qY!I$`>tKPK2sbD9a}_dh0Bk@f$h3HCK!AGLZ&
z|Fx+b-Hu5MYPzInT9{{v(bSeY$d=%Bc~n@fJOI+hUn&3$INGh_&(th1-({p$UmK+t
z*{ossR}*X|TJsgn1QRRb9RF7nES>qc3D!`^`A-uJ#-vJjfpjsr3Gu0j{dJ94_0^Z_
z=k`jcSZ4mq1Y`Pbg8jh$pG~l;f0$r>eE$a%ERa??pW*b!1WTm<ZGw@aLr(lQ!7^zk
z7}Ni+3HF+1f{mtVRQxu<5*2@&VC*y#EcrP$ia+_<;NK>g5}GzY?bp$Z^&9!DPqL9Y
zaG*uz{@nx%pD)L)cK??N7R#a3XDI&11RF#ZZO-!Fqoznm`mtc$?krv2f+>blPgy0x
zT(2VkX@W&i8LwvlF~Qh|PW~~$#w8()_pBSG`6UH$!CY?^Y+#%<dNxt51-gFq$9uyn
z@k&A_<`<p*%>-MWW%P=sWdh3Or)Zrk0u9vvGQqCXOfc&%E}98ut(CJyW3I-#PX59|
z9u+e$D*Z9RPW;0J6Hmt-FZmx6%(>&lv?nCa4YCMvT>64LYpAUyVznA-&=0v7*8wj3
zV}j{e|HA~k{ZA9j8@##z!MUlmgvHbw$lv+f1T!jxA9R3?f-e_lMOw36calUeKbLO#
z3RU9rnkSjEEJgex97l2lf73VB7BSg~VI8nVvPg!CUJNcM^t$tx2{y-c<!=*g=zlT6
zkc>fpn_#Yh<G81$_A09ahs-lJnN@v_x1mYe>@s~{gnlh2SvAEk*uv6iCfEwy<rpdF
z$Q0=!^~cCRCRq6&6KoDr^Op(c4K1LVU^~!_%)d=AH^{NE2)_7)%d4zWxg4XIzfG`G
zri!PCD^&WSe>cIz|HB09{cVDY&oa?Wu!4Uz!M35RO$fC`2&(yPQ)GrXUfeZUW*2(}
z3QC3bg)NLZB9EChq8ViYNZKrZ6#KUcrUa1;qsO{IuKYH^zQU1@ZeVjb4%{GE>wlPF
zIshcB5mAJN40=HP5n=~!vCN~<g6v|We@w8pzfG`$zfCZ4(s4^$R#^<xY&siJDgCQ3
zePJ@$%}yrU8<JxX+m;U1pZ$jkc7n?I+XO3y_y5xbv;9vK45z2LYwd2OCw0{q*E0IQ
zm|&0p!vwSY-%KzMNTW#ZkRw~$s90o4_UIoI43`eIa{IqD!G!-GOt8`a8x!m+6Bzu*
z1pC6o?+1?h+XTDww+UAE#{|Ps?_b?2k(gupUrn$(|1`noAO<*;nIG5b%WT=brIT}|
zr^w|2Gv!vi>X^Gcdfs6DQz$p5i&qMNn_#zT>Nr*=8KZmx!#qQ!ZzI80zcQankcvCJ
zT;UbVdgq@e*hTsiZp4qX7X-dy@8D#V8dF`$Skp)_lJSK$xBoH0qW)=ul|kaH8D-sq
z^hvNb%x@Dctx%<nn$tit!KjQnG!sl3+FSM81S6;a!vsr9hmIFA-k68bOfcEMO)x9c
zao5@Efy<Yl8t7E}@!zJIU;xuL!`~*@F4KRQU`78l!N&fWU?kYfJJ3Of1~yG5*<cx0
z>)KES(zgfK&rJL=!B*%@lwGfuNQ#-A_a@s#aKxPRCUWo8^~{x~AKrqh@0Gg!F~JJl
z%EAbbu$zyp`w{<Rf(bMKWrEd^E|g&v;{J~&SkWI7%=d2-Z2sR&F!6tyVExeFCfFwQ
zFB7bdc3Ucke6#+C2_{RG{OG1<7^l?eS&c(KaW-g3GbXqFznEafG!x7k-a&%70eXJ3
zjLulZ&|Ya3m7W$VABHlG2eVWGaC0oe<}kU*?ruqZ1P^bLB9A7rqgO?}_aZ>=s<i+a
zBCvXaFN}+jUG`3(2f%Sz&s=G@y34Xfr?^&H>;z4b4^xoWO=9&`<Mf|&9K)#)=W}YK
zoeMTw0@+(T`I^!>%BtKhSvfI}Wz~jt6ypl%B=(uGoArJj3>)6iOHJT3B%>xn*}P`i
zs8ad$xw2cP$h9kZ5~3_w%g8gFg(%929V)9<Ifs@@5X2@o;f`WW=MxBCtY7-<DI+AV
zhC;@7txzd8mm`Eztyc=^+&YRIf?1TyJ7xDv<M&EsLR;tZnrx0IMP&p<nj`Ju7B8ET
zGQlzj7-3u?YZvyR9IDj05c1>Dk^Pbu^2R>?9T_#E0U1kjx9R|2(<_9IFdlss>yj^E
z#n59d-LrzBSz|o``NiIYU@L|T=Udx^2N7pRnN`huSCEXKNi6pQxaN^}^Q!622A`M*
z20Pd3D1+elZiCzNW{54Hr(c<8tkug3;X#G>kB+cjiC}M&9qis8=rvd9%^##NVFp`K
z-=$FBkmdJf1-kfpW}W+q&OP3(osR)XF_rn-5r(H<OO?`l#xcy_XPB{t43GKC+D7Fr
z<NMfAjEHsQZEEkeA}X3ft$&3wY8_e{87eV1o71zj`atK+Bw4jxYH$MXw^@2E{gfZT
zWbFYl#r9e|;aZ}&b`D9&EDDvZAtM)T#@LBt+&9Dtdy=Ca<<jN@Hn`s`m<f#qb9;3t
z%WSIGsQ8v^gT{i{jO)@^FsI)vm|@#*7VNaeZx&3cVBF^=zt!gGF8P(az}P=oFlT;r
z7>xyUob>&}f;Ifbg8BUm3zqqt1;cf)T(=OF7LJU%%Fgx{Wr9O_JVoKj@oA1DXT3@_
zGNxr4riJkY*od?Y*752~zIF%(JyU|>6^?>qs*8)lq%e(;Y3QpWxQ*(OqAaLFusLN+
zz@{9%bwfay45z$tl4b9E$<|*mBX<g^@N<U#Axm2o)5SxJZiF%Nb|AaM-z-?eEaWd1
zEbhNpu<hD+>jlBdIK&fmCf7|^%V@<9ZS+zb+ln^og7<}*KP=b|jRkuQLr5W~Yiape
zV^<PlA|L5_>Oz3>OZ<g7e9tLYt_vp<A~eNj-4Lp!epRj^wQM8w`lKsX|IUJyVVJK5
zRO|k#eoR=v{mp{O(paz~zgaL<LDZ4|V8JqH`G$V8U^p5J_5=REvtTpb>KT7nFwk4@
z9OO3(cIeEg`4<c3yxMKcnDiG5Hc9_6dM-t<0eQei_=^Rbpg(I3D;QE1T#ShEBe)po
zfLB?eK2Yb53#wtuJ}g27f3aX8|6svxV*-^nk4GINuBjy0Did3k5Dm7!S+Me2l&Swo
zb2DTC!FBlbnv+bHL-lH@%rVWK+v!J<r(}?hW~;9L8*3_vYqQU4UbBteWAn~?0-2-R
zrCK6vezRaF{$|1YgKve=STN6zPd5ZzXU#lJ;t@oO4EBFmu;sMhEZ8)S1ylH&1uKF(
z6W&1^Sg;)#Z&_^ar&w<u>aZ4!vOYhvk)Fz0n5QWB%<kha2W_<GDDYWH_#Z6TkM=(E
zvCne$|Hgt%)y&nkZGOstx{_G>A(@?tNH$j)CCS^))-bl{8?7;#{r9$VN+4|?(TwdV
z*c&5;NqT83q%$U);wQg-Mf3Rbvj!Rq7X6zABL>klupd~Amubgu7EA^(jjf+OS-=K+
zlTmz{@dWkW{$DJZ#%~r3`-cTnB4~z@z$?AqcIVVy&}VjJA-P>nG9Q74<~R_QAYtiS
z@hVxxXA`PzDXOGzr$T~swUC#eA&r-Fsr4^foRK5fk(2j1V|{ZI4^2(2sI1VRNPBQD
zPHt}<AC&wem(4wFNAG}X>#f|@8fL54VOV&0nCr`Xwk($yHf&<ctjJ$b7SVq<!BAqB
zr4A$W&!b1%2S?&Y7L3!GzA-cU2EXM)`?dR4&(~+O3f(zARO)CqYm&!V_VUH_*osvl
zK8{7q>D8)Dsp+kwXJ=lCx1YhwKM!@{5V5cRwR!e06U_a2nway%x?{}76X;u7;hNLa
zkfotA=gE!Jt(U%SEWMum?Ak$uv5LD)kwzk{SXL}rr?x!%GQ_OP*SWmUHr`eUT7EPA
z)tg#`_TV_U74G}0@<jbPfr(g_>uKhLs)s0l!9aBK%IrM}X0>67ri15-He7X+^WDCh
zUmnD$223{wE=;_9{Ud<f+alik^3BhH)usnyb(Sq^pC;DE>%BjRf7j4yQqt}!Smft^
zGn_pP4?9Y~5k~UASv0Lkxp6bB{R*?r&()HbI{Q9jtZg6;>CF!4eb4kKe^t3kvxgY6
znWe6_h1uGN9OHBj4><-}@nh0JpK07O;_^)O@A>4{z17PXp&VjzB*lyM7$z&WL7l9;
zz+fs?!mg;4>67}UAGo6&YId|`-y9)8vJXApXnAGSSb-=yCad%)TJa_3@pkA?$#P<{
zrB+Hbx=)mS;JjS@JyMVr|K9#rnL|9i+^b<NzJp43^b@z|Hpj!rQ2a4kmysQR%i?y=
zaf4bZ!6`!(j#4$<w$C@nk&7R0{IWlbVmf)&YkS<`?1_vCyDM!KoGMV><xI_kpUasM
zQ72T3>~&9%$x6I6w40R8t9fYbcOvS7<9TLjsN+?f@A*QBP19oM@B`nRvA`F8V^tB;
zx5jEORwt{CT^L(>lFjpq27?tqLsuBD$5L;<zC!=<l<cRWLDlDR6hDWVglg>_kC=8F
z10mwBBcpYy)s17>4jv=p_@nQy#5-l*u)njEXs|J!AQwfIn9^62I(E*r0OGl1PNCw3
zd`o@5P1JZ~7zqhnTi)g=N>ZJfIIPb;H?wA5BuMtT*D{gNTz9o#g>4fXH`Xz|+$`f%
zSLg3EvNQT5g_c+x;uvbOu+|J{-}`QM*DSg#Fu0RZZ9ljhEzzo5*kI@!(kF5|Dzsnb
z>3-<UAm`VRLCqigVN`?O&43ZJQ!WW=?{a58leg!lirXBYrUZ=nTkY%CWI+wsDS<x@
zF3w6>&1Z_5pH$?;9z`9AT+X|A?a5rqO}0x*_n)3lF!Q=!&A!suV3Obj?_8PDemJQk
z>kD1!+DU$N%o*`A(C`ZN`^Tq;zfQZh?Df#C^&Vaat}*BaL2M7fJB{Yu7KjGT_l{As
zZOK?`UO3w1Cof&jtjTA>{mVUv*Zu4yS5?l(eEK*`_hXw0mW(ytS8zW#KBccvgw&D_
zKm~qBbaDTBV9&MRKh?eor_-^Hy0hc1vagUTA60ZbnQA0lg}D(l=*}{aG|~2$i;1Wy
z5xNp=DDec@t_@W4I-78^X6Qe`&SCB7wGxCv9~7IvF-EN0i99CLx|2OBV-8+G1?<=v
zp+sSN<w4K#4TnC-Ph0#~15lXHN+yQol`-Pj`#cF>(&ASQ=$u#Mkew^6!n-9xS4WSr
zIViAlh8Lq{t@BvjW)mey#e!{{L`CQ*y)bE(-fE{u&|wp1vepGX0gRz9oO@CHW;rG!
zHY;Wp(L1RXlRhY#t!j9Pw-D2y^S4eBS3PmoA_#1nr?*hfQqD8PhcZS~8<blOf#Tv{
zdBDM!IwcG=m^k-8GS+Ms>pj6774oX*LYha*!4xUPb&8ctVgmhyO`Nq$aptG&Wcv98
z%aF^YNM3CTBlJ(`&6!o6&kJ1(M|nqOv>~OEfg>gZ=WKI6q-C;yd!boFiVee-A}P|j
z+QPX>IXhk1akELf%d-e;{a_4CfKFe=M~Az~6ZUH=T2)cO=I$<3EF@JbT~Wap^0J}Y
z^8|;Qr#t2_<3w#{_pqZyI<4ilPw#QRw8b_kS>2(Co2fF6b<-wshE6oQjSAB7>SFL^
z=M?&A?uXBnPCtz3n04JH73vn_#;eXeuG0&#G@fKouIo|B2o|f}(vorFY_o1GKlUkQ
z^-<T$AyKB4sgL@b4O%J{lqelHBCFxg`*K=DX+JE5p&#Q=#vn>BODBCI5QuTw0ab0e
zflky)XH9(<b+27IpUE<Pdh^$6%bZyK^M`zy7h^$30yRvu8b?_LxY>o)Bl@C-^RhqX
zoO-qbtXw;I?RprhcJ4=DqO9H)Y9kPjI3~8~_=RsaeY6<Sx|4C-ZV|?mrGKoogTz%+
zByGu$H_z!H33eMYpktn*ZbbGltApkySehsd6o{(cC~F|~VvpA)Y-*b?69dozVn3M)
zlSC3Q6^Dsv_Cx^i$q-j9jXb77M^GiPLm4Ciu*U}qq+&cq;!v`Gx*wn$%76fp9gI3>
zs#7lpAg^|OeVM+dkS8LQMz1{koaeL+B(wF1t-6NA*$X4ev)M6no|OaST{uu0C8BRv
zJtz<kzsu*o(m=j61aa&URz1kYdE#!$BlV=6y6NSC=)M(<0%o(~i0&gvs{6?drQ(1k
z=0`;4N~Ce}k%A+h4xMaQbP)21SJT`cnDF1&)IVCD@8jiMJlXN2JB8DNQFV5ge~cQ#
zWnNqCl8$HTamWyE?SL~ss2I8VWTbvrI5qsf2nV}(+#@*(+(0I8dI;VqC<;V>zFY_#
zR&zc!RypuB-I*UtqmQ7tPx*+EO!#;JJtz}E2uh5ZXQb<Z<%2%zR{KoIWE$L!+n)<l
z1_6x005Ap6A^G({7y!>YgpY^NVL;M~P$2OWhymja0;}r*M+=S^Rwr@-4q?f9SdhPN
zA%aGOf$rrqz;d+^Qpx(`Fg-#^5CE|G06oJa5LUnqtc>VRaXT7z_jN0R#d-vKCOD10
z&<zYAJ0LXysYP4|tNB<0zzG1X+mpOtWJ4FTPJNtOHv=xM)s1&!2jv6?wk%Q1P|}J-
z^&8|00Se!^SL^_BqDu9{0H4kCfMGrwAZa|jK}o_W&w}uDhx%i7?O_}mZV;*YxRR|6
zz&|kt%w}yfdSa0X+n(V$`t*ChDTT2|=zga$KoE1f2@X^j8F-I1TDOZ0l{XiFw(5RQ
z4z9oQuKv<S#IwD3O2Jp|3+etGF#ZlwbXziYt_&j)m^!plaZMVU3Cb0%T}@gLCd@{j
zDu*e+?uKIY0XSaJj28_@=eDp-FrW@*%4-gb1c8H57tJ!n0Uesl#4tc)&TnV#z&7~n
z_-H2RiNu6igCXg9oOj6KN)OknwfzACKR^kB;F+BPa3AQJo!SCg<8Dd|ld=-WooDO~
zEenqx`T~GKI-VCwU>$rGW<n7}5)e!h(5Od;cIq&=G84kwV1Er4Xoi~cM9rCHcv};J
zS-tTR73Hr0ej7l21(*Ud*!SBwM&iZ2y2aHKrb`HTC^1Nn%qQCgM<&23w7DD`*-`Cf
zo)C^Z&6Rmiru{WNH?;r&<l_94BZDNEc<g<cnyeOrzT(-K^HY=j?jSu7XTI|8B@kzJ
zmx<GF6O6$lS-G!LO*B<qv}c#T(a#x0p9pZi03aqA=bHesL0h_6Mur(m6#zn=QDOi=
zBB~wimBHba!7oV=K@wPLCRievD?~@k`51tN^KEsP*?})>X}cHxHo<O{s03PTyf0}N
z+9E`lXJD)e>}wh>vHFMFg~nH0GPwGTOkAFC-KFtKM&}fb<dYIasl*$O3{j-$bF!)4
z>@Sj0gfTl5G9P<}ir2>KdnSV6k%q5Ih%S=G{7`~XA511J9@?bq-a!iMivt$|wph5q
z&JzrlP{@9aqw)APQJtzhQzRC!q{6jxU-0`7Trld40AcQ9FMJken@fQ0G}ULvxR|uK
zkl>I)f;~1CPQaO|gD)#RW4}Z=d_BNd*<a0Xz$Wt>1Ut3gPvRd4^NF4EjDcVX-7V!F
z)yBDoqM6&7YPsy?n=n%!Q}6toA^Va#f6cH~b-;vhW<dwQ037KZ4<UpECgrNG<F-vN
z5k9y>%SfOK4NNG<i#uy@*k~-;qZ+Ps1|c;8bponMze=fv{lyF48XbU+z_g?4U8qjW
z!?Q2M*6?XEEW|F@YX&MoL51YnN2rBTGIL|RxCo$1)o18C2KcnBl;YO35FsX-pv`C?
ze2`AB{ncQ}@H(3;+iwtzn44hk_TavH>{;wfO5_XZIPC-$5JMiH*i+~D33saKl9_{{
zPNO_AP3$PRQwy8Fi7_7!sA3Q0jU5RKhV#g&A|nRvS4Y^3V3-IL*J;$5O$uL<4W|NJ
zG!V*&Aqc#sqMWF5C~?oVIC<VgIqdC85QF5ZEz<!b^Q}><pYhEQLQo6pa6DPci3H`v
z7}#8aqX2->M^~}Hw(ldS02Z7n8E5qcA+njEMzAjIfNRm&4H&%C3@oxYvEk#X&t-@P
z1H=-Urt<^{=V^PbPrSNfT-QxZ3jvs;-m4C7JB#N+fabUs%>;Xkk^Yt$R1q!jkf5KK
zU>giQhD^qGh}v@49Sa;cd5CqZ{cVClE}zhniY+#&KLcZ;nP8HjSQw47s_0<H6XAs?
zCjx{Y4osL^WTF5wG`U0gY>e+|!X0+Bb|L_d><;n)Gdi^RF2-@?0t|&9Pil<hRDYOT
zjAVz6vpIn|(#EHa&FiJKGd1?yxAEu$Ayr8Ngu8`Fi*N`A0D)HqqYs5(CIE=kFJua&
zxnv-?t<g>Z%><Lg5)vN+>RSMas)6=@Sl{)sJar02B^(4ak1fE!NZ{J(jNEEmO@M>c
z3p@Fcf=s=c{ECLSZz<klP8eS($gQ2jv?WCwVZw~bx?#(yK}bK5;UzPj^*AHn%TeJH
zaa9XvMwl{s3`IjgIF5LesmD1G9c3lL{nMzBRS*r3(TsEA)0lcig$p=<LO@AsZrHo4
z2n~Oy_Q)B{0{E&O0UikobZF6f6bmWCdg_4?w2=<d$;z^sl}8R7?k9ff6Jgc_7*<I>
z5m4m@!4e5U=y)b;0G8Oq`4)I{3phMYGc7KG=;<ESUVYB&10WI!tV^)^CD_W_*K~;h
zy@?uad*ERgO^0oe^dUe=1mRDUbOb!B8-%tpzUil7Q$SH_G@TD2tqkkb_YlrK^AM&?
z-|-gV_Vko8P;Hly|E7b(bbx=gK4-5rtPj_E!}U!B@Ln?kLq{-xz7ayXjOWI59nh84
z()-Xsdp|MuiH%{hG;S5ZCrin+rzIEATGi5Iz<-*v!HGj^VpIiyNw$XR5kJ+CS6{(7
z;Eo`Y@fj1sBtMQJm;56f08c%dw?K6|yFbn*+-4?7md7!zI?^;lfoz9gUz|K6iL`MF
z;WRf|344kNAuCXW_Ri4ETA~i_YtAZ*>$D@>dp^Hwfnu9zE_!s5i!!$cecgG5p!^LC
zk_6be*+oy9+4>A;oge@vfX1~xb{pW?tyy|iC;5h1;?7-JjzrtO+Rdamcc99enjqCL
z7qyCzBBO0N5q6w(C;Q|^vJ+!J(rad<tR~m8=8W>@KzbLUY~^j=2SK1ILSrf5kAXpa
z<|?nckF{mMkOX7)1g<XknLK#fcnqr0?xYBTnd#x<L6{zP-YS1F%way1g}}7~SF|3$
zRLp~EbpzI}K%9r{1pF7X_M62x+Mel0?JKDT&4vLpP%arxg@^b&<fq1@o$kzf+tLD|
z@YZ@Bnk>2wiA{01cdnbG^qSNmdc@<cbIIC(O*rsN8)*9E(E0Jb?<{TUmVcBkc067j
zcQZ=r@FMPjEvv-v9MKNeG1^#Z?oD5n4g`9WXdM~t@+nRp;44=3EB%hp-6Y!PLhfZI
zVk>Iz64*^cQo4_W&(>DEyrVLwd%#vf{vBqmDy@b?z|kIxmnDj;Zswd$f(rAy+ZF)t
zjynID0ZdACm)&&dfKk1Lafl8AfmsnVTBbb_BhHxB2WHSWd2mqX(z6%s0eta*24$au
zG<2p-kF@PQ3W+6P#!hFQeV6vl36$O!mhKa%H@n`3N`GnZ*<l3G;l$GbCJb;WkMaHS
zX^M9_?x7L@Kabjo@ye|ezGKPkYF(d1@^zPvwT+C{Z(^1v$KJmeld}Uqjq!8-5L+w_
zEmtLez6WtvylYwUAyFN1l+<8Dlxw7dE_VDj!8m-u8fP@FUI09iKm|L%2rRHWI-eDP
z%T9C;j8fs;iiS5eL04TU;RJvhQ#96why<4X{Xawv!}J1f1_lC~4`nZ`*T2+%A+Ga_
z!^_{kxxHl*!9Bxq2dAOuY}N;Wd>*F0iUEQN-uHSaN3{^aTM^klUVOx2G$B1IgZG^8
zy@mJ6<MC*Rz)T(EZY4+e+<2}&jl**pYU7@J=THnsQ|%n0dv4Gj=3PLbS7U7@<J`I9
zFMUbS?%QA#|KL0?wZ%z?`;o9c5nq|i{O!!=?{)NUC{7RIM2GLmmq;K)Tdb!dr`KE&
z$<o5R!^5l(Cy&|q^(%-`od6-hz5B>u@8#;VCqib=^2@e}bhuB;0Fd1HHviTa$^jxZ
zDjU@uVcWsi?0k|+<G#BL@b;*nZUo3$(qy-mkp(E&ns9R&mZGBx<Zf*|+6qv0Zh{dX
zIxF$(IR3DpnP5gq%TR`~cr!JCpq+q;`R1{=3gILao1+3T&|hM{o|0OYSVx0M#Sk}0
zGUqfv*pi>jS>n7AwizczioRaC#yCMVr659@ZbVeT4$*ELc@qrcra{D}u;lu%;$QLZ
zCiE$8K|hWr1vw@J^KcP^q3^*dXClE@gApfb#-C(KsK#x^<n5uwIKY9xymK5p<@4+N
z=f^{2-Z~tRGt+*huhEWxNL1%pt_Q3MiUS&|9qzDnLg#Comjn=*vp69RfP(>s)iZjl
zQ#p)QVw?biKrqU^2=W2Ig}6886%m^Nq@%yh8JIacpA4G~^LYrTNzO>%x)qA&K?t8(
zY-b+8xa#1f=L}JAty+Mot~z+=5DW%iwDYw`rUJ;w(dQRh#wVUA4HEbrqG;>kCqU$#
z1#n`%{<-i_rD@4kO=KT%(zrQE{Kw(-QybqU<Mle=@XLuB4n!Uk&dzZVAChaHExJRY
zN~3<q2~@+gnxOR=dU86Z_#K2?OqYJ2{@NB7!N%q8VRDdLo!4|sA#ZLpaeMbkkT<F6
z_NUe7DTFTrfGr)sIt#5=A&4Uhw4|y33NP)%eUo1w31y-Kh?{c;A!u&SH^D4000L#%
zj_g||5TYfK4^2C$9VU!$1`{6)0o@6Q!$=w{&kLi)!R(mQ$Cy%3?uxx)<2DjZlw>Wi
zki-x=V(gJZ-vP`D3^3yZr_YySXc?@P#$(uAVIpv5CCyq32`#!84Ugn?nzio$HP{Io
z0eX18&O9(cXF@&nsUQNeBHSq$Jxu3)f)`lqYx>D(!1#OU-zHer(LmlJS~<bVe=)%V
z_f$8=BP*8bwCh#c-#yww{rK@bV{>w)$<6HAULNn&+AQ_@^97IFC1&=&y`CT5`?fjX
zn<XEl{cUag!{no&>rQ;N_5@x3toyWr{Gs=u8PTZ<iAq<J3{srzmh=arRyJ)hK4a9;
zY2pW-EC#O!BVRByI{wkAtDUjS=F;5PdQ!lED4{cECfI{cYF^7LRV<heHKQy{j!YBe
z;Rf{J8$WkM((%zbcP|~|^<C6-;dd-m#c8?6q9}1sUBZlZNpY;Z6?0ayO5ukOOEdhu
zY+*Wa-F7D8WrSw&yuj$Bd+8zl8WIKT5hck!+)_3Y_pgrnrltYwKc@>GXjoetUy~+F
zrW=xfN|x3TLywnEUPW77vX8E04ZW2%IqVk~iIc7@tAk6FR92CtuNEgRAA?>d;bdy<
zEXGWZ7Wyt!`Q`+Nde%}#KU7p6+r^aSx$K_|sJyF4Gr>lVUlFb9bh=V|b6ATg_w;Ra
zdF|7=P_y;M@k&ZG@9W3(7MP`z$Iq$_kezE<zs_8#*Bwv(%LJ3}03l3|wm*ITaH%Ac
zrU2y)z&uhi<|~}fOVUl28^|&F^M68%cOSv_HO_M>zKBY5QSATp{LrHl&G%k4;qI@f
zuopPDp_0-8Gmo%7wh->MM4`ZkBBz529L$~DG-L$U_{6<36<<Yg@~Vtqn0Hi}DBN=I
z6f+w>7pweQo5&hrc2B=@a(T_p9Ah?Rm!}wJFYG7YRU^(4S{Ai+O!imPqXgcMuhwrW
z`Rx$b1Rqz}yyT1-E4R`uB-0WL4^7VS$@p<Mh&^!jS|7&6X(=Fd-VZ7ysMpM8z2FM6
zFR_ql3mEa8d3@@rBDdqmp?7sHdv!AP&-U)c_C9%59?yEa>1&*>KH<f4&7NvnyTLBW
zI$8N@?|heEnB+VYW51;5Q(m0<^g~tI?s>WhaeMb)XoX>MM)q&=hatMZc4TN1^E%mz
zy*cfqxHCI?JijVB`5RG;QLkbM@I_0udxa^Yq+%{vq`qvxrrufzRju;U-A(-+p5P=>
ztf;K}_{nq8r4c0BCssD)O)AAiqmrwJlKX95m<8SH?xE*tAxu-Y(5qe0j}`ioM@Jri
zm=$3vEIjkg9K(E_yEZXS@;Tb@M7u5WrI2alEY<<2lD7|rKbzKnf3Bius>U2KtS8LB
zAla)?ZjN~FEP@<sEY*{R+zjmO6${5e*Rnei1#W_?%Y?ddbr04W8-xAhHVjcUvzjw~
z-E0M6ERy|3e7Cj}L|)CZpu_buFMLJFq+%fvS3^`hotR;VS4I>UNS!yIxLAyZ1NyjM
z8(yv5cjd41U^#|HFWmNIX1w9WD)VOaoXW>uru7L{zT6JNJYAY<;_6LXT076E`>~w;
zq8r!jLm6)mF5caAj}Bt$f;x}l<+d`&Qi9g@XQJHX!wIa$xrNb>L_L)b)NhvG0hpo^
zpDVHbw+YrJX{5xEYVP&h1d}u|kRDAxA6_c1Ep^<EchsC9tn$33K-M)zLG>}19i%;~
z7BvfzXjo=@V^GF&!EgA|Iy*e~ZWmKPIy8#Zk$I=DyX3nYSZK%H%wm+t-0l@y$RHeX
z#tW~uhi{eB66RD;vE&UR9~yC#m;YawVA`@C=qr<rGaEIvrspy`k=l=W>4i>jAMtcl
zzd5kB@UUdwt8JI^V%&{E=zvOrOI;bb)IHB;g%$eC1bg!2N!zDD?{r@7S=FbNckn?m
zGH>SCCZEVk9u3WMe*FY|s+lxiOMi0q&6+LO)85*n7p@Gv`JjJ_Jbkbc_?|En`h0_N
zW+$3?B_wGg&{(M0tWfrB0{>Xic@<LDXTJ$hlb-{EPsdI!H~nHGAx9tKOr`JxHEuU5
z(^=Pq@3C_+)e`UO-Ch?ik6pVpaJn4P#iKgvuUQ^1e@OeP4q?~txkrNel8Sjby9=4)
zM>@cD%g=f2<8{KV6P-vMkD4`N<#ht?`RRSnIiU9V#MLa?nu@6WlwyuutL%wr-9E!U
zL5$H{AC)>aedg5A7hkPbuP@y<BgQNA<<61rO1$z&IK3Xn^DL|9<St~$Te+HE-)7cM
zTmoq-s8k4%TfL+*4YlI5$UdlG)lph!s{|?eVzkbz$<3TiQw5b8i>%>Oj5Y79#;PvI
zW7)mGzC5g1()N$?JGrWtS+?mHI*(+r93xLWIXbSjo*SzcEk1IsJAwK1$yEapoQmx|
zVN#fCfF$4E#Q2tS#Yj|*K07NsE}eyB#cURJ@A9F5tjSwkvJ0QJ-r)4IjvBc)>m$Qg
zvQqbz&W6cVmQA|XY3F4x#BQkvm6>+E`}8Zde(Xk`bjQ(|9b~lTIQ8+hM*#fX!Ad^G
z$vZI!-J}z26p^z<M+|FS5WM+P3wPmjTjI|J)ki;iwG0L$^IEk&PT>1BAAQM@Kr~MN
z{2I87g5Ukxy3*LLm@sS;>TEmhuXp=rPLShvnLvS(!H=J#HH5GVyS5M2Z#NC@)%h5$
ztPhA<?aIjnZo8awT6KF$9tBhQ8XvWN0zW5DTo+hxJk2{Qw=`psb-IOYu(*+R;R?lx
zsM>*U-weO_Wg0>bdR@8sg2tT8`%gy3YQ5XsIqWoQk*)vva^d6X&*iAd_`u%bn0Fe*
zK^N9O#j#43wtuS=8t><>o+#rBdMoSMJlYblJ<_%J?Q3Su=NS2@ij>orA>+j86xTg9
z%=MkIOhbiy`Gd6w&Y$_&pUTw+MSU<H;JiDlv(qKC+Lz+0x+t&va(K&i`_Z$5jqAGm
zMbCG4#-9B;UZQ=l6?8qkcaDGWP#4Ha`SScd057cd)o(u0-(Y=GOZ_HD$L;$|fdgM5
z=%|x|N%Vt!Gx8gIEm0zip)o8TgD4Q%&nTn=&uFf@l<}wfwSlS%Fibs#OzlGK<^>rY
zgMLj0el#4cCWG}=s%E&pIP!+7OZ5IAhE3-%<rn2Wo49*CO#hZ1!xRk%Yb9!r-&v`!
zLA^*-oVDO>h}H=J)o2LwTs}@~IOE9?CKTw)*fV?yr~Sm7>eV5pH3G`Sj-$^^D?E$$
zyKt#BW*<~6WXq}I^{%4Z-9H;FFrUGj7_&Ir#pU)MW9bo@Te#;q-^!03wJr{rg(%(V
z*BZpLnHb1zcdFS_xYW~lBRX$|>q}MP*;0>43>}d>dP7~=H88+RuHA^+<Vc=ZH1iM=
zyWugj9dk1-K|bxc_qQI!%g51~h(#A;MTTi5@_^iYk8;(V$Tmvhf=Iw>2NN|fa`nh1
z+4%_N7YtEJ0l5o&qPaYwr!Q3ynWGLf!_pW0)MHxdKpRAQ9kLm(rP-U-3BT-4&hY5)
z)h;o63LMwTugBrveS<eKS){w@Qstah<b8`v$qI@K3Zd3Ymls-JMXM(pt4_qzLq*OH
z5^+5}rcZi|jgm2$y;{_guvY`<!2%tlehadh`Eka44Sh+BtMDAxo_);GLG&J}#|nP-
ztHW!-Y-XNaeQsIGkGDp;X$bYSQh!p3=7i<*RyeLs)WkByMBD?<W+4wCLwyV+S39{x
zrwlpuk13WKM6(^MGFz^oF!smmtf#Bi7zB5BVpB~enM!#p@N%n=5B%qXV~18vl8)1Q
z{KU&$!RK`Ihu+l2@Y+*uOCFZ1W0(Ey4SKvfwGzv9)5}%8%xPGdpDoJ2s$AKpETY?;
zXOI{^=tVmhaLHuhkn(yt+a;*i%eii6@URCbikGN?l+)qm`<7fU=nK2(FHgbsr59as
zqkb;Ys`e{zLGMtHe$|2{oZf?QmfXNxao^$<fATs1x^q{0&QV11lP)Ew0KAlzm~;a{
zqzU5B1hMabpzBhCtPwk!StKqCQk&_q%qa<YXk_MLY|Kf29G5WCZRC}9wmExAZx^`M
z(8;95@ne%a^vHdrx>$sXfo+{p5-0fD_u<3b6@N*CUPJ5mgCM2~(CkhZpBpl*DvLF?
z6D`>Z5~G46hL3L?u2R;Csk}~(<I^FecvexCo*l__hDv`Dw`4OUXJaMD&sQ#F?e-Um
zONm`f>v;J_(eulbOoK#Nt%01|pkVN@miY;(!46!Z&-82;nnYmL!c%Kj?M}vMHl(to
zx(Bc?+3d!!Zd+)PI&{Q{HfP4}efOm@Ev?g4@gl2=CX8-h@XNjIm!p_UACRDk5sEft
ztCH&C%+(v*c@UE+on$$p#xBV-4?2GNL1?m_bNksFm1U=K57fjK;kz;Myy70;mnxjZ
z&+)FDyRht0MTxD87Y{`ULV3<J#mp;vPx^>^KQvknNK@0$=j4@&KPTBXzH-&J_vUVl
za%_dpT-R-;!wPkk`_)yFM9vZR6BU746}o*l23I@t%ZJ3)i8vl>3DGIeh><vWjV{xA
zrL~oCc(Q6ohhKPS@JTdBL|Mx^=tz;2cJh#4M+c7GtIw}1f7w6y)yKPYqQsMsFLwy)
z_Mqz{aGBKyxtwg0Vh%4iB>ZJ7bPN3p+XDuNY6^Mqp?7cU@{3;#=p8(#KV4BXQU@7b
zUaZ-5k0r<7`%-zIO@=X5Qu?Zocra_BEu#4HiH0LmX-B1Q;G{kouH{XDZ^3=fPl4Ir
zSRDl8xl4&0vUuK|`+@3C<yFMH&7aJhB>|pZV8r2B^4Vq`vxa+qQUu|_-I$}X73#Kf
zZTe!%mk-%QD3Sr2ALDkruoZW7*FlsjIES#gbS+zR^3k=s8(mL~x+kWr#-ouHcF!*#
zZ4@Qmt*{F&T?657>C|-KxG5{alACq${kt*49vgRl#@u~T6IdZ#T?ZeW)??j;eCtUa
z)<2&TVYkf|SomDO3zn&y&a8g^g&=g?JgJU;5a`K}XHwU%flJm#mkzf}g+#p|Kk@&H
z^ttwB-Oop|3m4F?SJQ1P%W=Af;wP&#-=)=Rz}rpfeA6RVn!>!(#b6%r{5+_=ypF>?
zLp$#L0`6#=)Taz7X_<7XFC6|~`}~$4!k4RlyHtKAkOgu)^X94G*o}O$6zkmi4-Y^3
z4IWy2{1q&>N%dRb{271z!8U|3b&Sg;8u{^K>mY@1wUXYAVY6RMr{)8$W-=qm=1cNX
zd-1?YXu{X%&!DYSTI%|lDuL5XHq(7uev&Te5|XM`(9Y=Hn|PayT8MB#2z|Y*Kf6Dw
z%yOxnG^qUkI}0{4b;GY?12k~{0g?*5Kl;HbBqHBHZM#RzD_S+Om%&Z3fdRA<ohg}-
zDfRfgu#y?uu-^N^&rAWPQmyhdRDp42QH3nOulPmf_=)Ux{15Z<0WM&sDS}8wa5)3f
z|Ac}<&@I;R6F+JQ1>&{z>R)ArA1NmE??v|`PgAw@zP8yzR3f5T%t!L;d`0pIBBVn-
zt-%;136P>0Vag}`8^`4R<%2X><v#*KLevYQTc{^JyBn`o^tM*`!}p{Obnn+ACPMYl
z`QvMP(CLouRz+U52FAS(1_+nPsagTFOeCg(Z4ZJrd$AsB%>JW`{Zzw7w5jCHhj4=i
zcDpUy<1x+WS*J2cM#hZa3}ph5#=%-r7dr?|YX%t>1wPEZ{*sRawhc`62aI}*USg^j
z15O4JRssvB174*_iH!LNN1&bG;Q~I$Xf|Rp!jH^9^xF?xd-!>!JM_KsBmcABik=dW
zUjpiR1of=2vcblS$|uwrDM55$Ctk{&tX$xCcqIL+QBLJWmf;J5G0QdKVa~xrJ-j@<
z+FK*})?poe)gKuu6T9(tR+bs2-`Xmkd}!^lPq{!dh5gNCR_6?8$AXLeb|<=wwBM)(
z{5HX!zW(;m->dA833l-{>c>gdicnp(aO0=ZH@w3wA6z+$8i9I!MU~?9ABJC7i%j?-
z=U!DlM6pP-EO-f6Gl(S&rCm%>i|TzEwURopY&Lit^3gBmE=cm~jKsBv-=Yvr1lFBL
z=HZ$LJ^5AWn%$Tm?P^3_^;qMbO!IIREs*_L{Q*O{(GLwVW=#p#)e~2G4E-V3x;mK5
zGxqPw%ZV_ZPH0M@nPAr+o3+PV_cq;lub#Hjl=fNu=8vYEhwABw=5*FWjSQ~l3?Yq7
ziRMgsjV!h1EM1LkW14iLaqCp`Emw^k@8+B!joTNSZ(rBQO=!-&sd49a^PT$|cONw0
zt=GtV+MM@HBfqyfe^{envbo^B#=Vv1d!IG#|7gB{s8NU@7qa4txX499xMB%%u{^Fs
zja;IOD>WvUTH(r0k;`0h<=*7-Al!qC<OkPr6$#`D8sT%BTzMZ?^?+PekE?!4u6~BA
z=_S_;<7y|#weN9tE9AP*xcVRD`a>KE(L!R?Y~X5X5Yl`o(ehAU^O0K1BVEl#<CaD%
z&Bv!&9=mEj@osq%)KYgPMk1h7&IR)H<`ue8h&HK5Je-KG*&~k~f}~0D%~>t2UGEig
ziD);Fv`ZJSI+2}95iRT#ZKRMHqjk-}oa!Kf!Om9s)*VU=S(C!+64SOqIl2?0mDr+-
z>}qG!SJsN+a?|QcX#FY-ZYco^sN)4|j08=H=x~sT!+!g9&6c3(zRA|jj8=3mUU{)q
zZKvzSqZV{zw5|(;Gm)sKwLkE>b@b^w*_u6ZtUh(GYY1|6s2=|6bEi;E3w0Q-PB74E
zG@87AHLwt(zTV~6*QH?Cr5%0{k!~>g?CR9bgx6moxi#8aO+7Quv^8=MBBt7O)3x7s
z!Dn0G(-*Zh`XITaHeJbIqo13#==No6i0nuMiroSE$Kk$$I_OA%{?PrsfQr3|!-J*Q
zMuO^~r5H%d=T7pN>iK=Gal7`&b<I9L)8z+I{uMe@Ptf|QUO9CT<@T?QXYkDyqcw=O
zKw(VAb{Cn3gVkJH_)5D*r%E`Hr^X2Dpu?HpqE@&si;N14j7BGd{0sGW-p5NU5}VWx
zc=@}u7b!w62x%->grp_VcYV0G9X)t0<5jzVMLRnH6~Q~?tG`%bb=Qw$<k@XmGE9G_
zWtpgAsNPWAnH0!<ASD@p|5%0y`nyb|yz4z(QO76YKiSTi-%;|NXuO2>wk*)R^nLp$
z+Q+)cAc<4u^0tJQ{X23^(aOy;x1;U8VxSUBhr=rNlMb0ObS!hc5*0}J>sW@GXICC2
z3cL=#F(n&0sX8>T=6_QEkq@daa4+XgjSuJZjSmA8a+8nq&b>8jY6>xE=ynNY$id!!
zZSj;%x}edQM03MX8y>9#rYGVmUT@1eD10q{nQ#~ychNsfqK-xQcxfUv?|}u+Ra!Bp
zXuWQvZMx98b#7tZH;?+X-#Kf~saW0XC}_>Q_`c@!alAxng5Ow!|Er8A|6+m(UB7mq
zYn&9p7RW3+>ftAio0WQ*q$?O2on~ReHh^AYz*(nP=3|)z7;Pv%XvWV{6++jg^BD}7
zV@%UYjHv!#Y5UoXs=}izQ6bWYJUm~5s!Wl^UHV3^JkCoG88%W$!gBU<!V@lgH+n0h
zyc#fEa{D)*CSt!J9#<ZbK3|lS`PG|EBC1rO2l7>+tJ5<(rlIhNRsNTItOctH_o4~=
zHw2>--`xD$1QW=n>N7v4(__@W(}$0py|bhghkFx?VqBxE6+V@}+9_nQwkg3YL281l
z$nLnKP|etA33J1aj7Rsajpe?*infjG%`<IxsUUF#-l`te?W?r!bxVlQH$GF~(3R)N
za0J1R`;v}Ou`DQCxaaeQ8)k1~%5h65Xr|RD^%bYS1p|JSYIo1)LG6T){nFj%O!kZT
z?j$;)hndA!bHiZyhoOiT+mdCZejNUKs@Q~(RX)~JTcUe2q1TM|q9}Ns&LcJ-wE%6f
zlu#vl9}&=0?#hFuXl4I4!FZN)&)&PUoO@SxvpaFIIW9wMb;mO^dDYP%**{oz)h=aG
zs*kThJ#31p_1;+&S;iRUD2FV{nV}D@IA1v#X{BHB#=c9r>;6OGt5ZVuGm$O6G4xeF
zLQnTUJ}J~XH~nBPp;>&TNCo);X$qBF*SEO-;oag!y};6?1?iNJ=W85ixKjqApBe7h
zJs$pkLw0HZ#fnTU9fP=6_&#bf>E;U4&&sP(Jz9Yr{_Vd_u=fQ&-d#OKXTg|K=P)ew
zyvZd!Mb6M!^iWX3@9q7RmfUv6AP4h4zZ&;j_bz{A43%2{hyrI`ZhUcH@DrBt__pG8
zh7uIx&3rwdoY0Ikot_QU$(Pfe4cWQ;i;>ACrEJeWCk+b)Idv^XiE5_0h+H2_K~hNG
z*f`+<p_Px|nf&tfGW_sW%O;o>tzDLtoMs85r}sP3S+eMI{_L}?zf7=q$OL)%dvUQR
zTBRI)&@D}l_+0M{*`hw7UX!WQ#Wpfh_M{`H!jLuDJ5u5}1>wDPMEH5H7A9?!@J>JD
zZ0j7W!fs5ePihbEXJJmE7p5}HU;6j&a@;Vss7U_RbVR{00(o=C%9L?hh?jL0irs}+
zSfR5H7qOi;qrKL-DSh0qn_2vHIJ||oxk!7sI4l4at0WrUsluQ1;_xxcNnrzP!@3;A
zwLyh=jqD}aKPK209nD5-<><LCp=1WsQ@!T}$x}#;gLC1R^7?ppw~k5f8YDaBq1S95
z4W8q*l{Z=U$jEo(G_Wjod4tPf?^uJLm-2VCMH%QGUrL(&v|#A4X;?O4`clh5NeD`b
zz7DL#PUM@}Z^-uPkk?pm(#mL2A+tf!qVR9TxXktpeJ(=j-H@Ct=c3CF&Ebn!xPpZ5
zEf1=_bw&T-vDk=<$zn$xXZ|w50=cDqoW?BD4FngtJ&1`EajU`N@)vBTaixbHYO(1u
zK?v#9TS(Po$e)nPN*ig_w&u)um%6L4IPowN=9NwGi3$ePfOxJ*{D)0X!)T<#YpN*B
zFdJ3%eV~hYQi4MY$x>))N9V*?JaNeWito0FgsM<9-O;xTm(KaP8s7KrQ;D3%(EY5c
zh`r2MrwGPX5Ku=7!&rY>=u1mxk4X=(6`Got{?i0|XUTLu7j`~MJkit;!e8NFjXx5e
zb%lFe{250-z@`5tgZorS#|b*F+tn_ym>*($!F39*ovh0fP_nfzowj}>a<0>hi_9<}
z>FRvuj|p~lSZwSu{VCv9NM%w_K`9dV?H!kRwvquzB*pdc@E6SlJNa4c`t*^TGcVe~
zCrJjYBs|{Dn}W*OjFsBg1ampqQ`AY_(r?^ZuXA?`bB0{46Ry2-kNdffCN=(%rU%zE
z?jD7lt<+=l^vgSmJsJ~RX_wx3?sq~ub!aA7l8cv!(En<J87Bw{&n4v;cb<(~kEuJd
z_2t$Jmvc(@e_EHx_VHc_%d!?5I#TLy@47e{cUn%(m9e=;W8{su?jaA=Fl3SU+#J2E
ziLmE+)iRUC8l(lxMs_m7A_zU2r{~H$c4tD_jK5h-C-c|?rp_USF9etoKUCmSdbG#Q
z;|VIUrWU<O12R8^)hPUs;vTkP-%e;{ytH0&rjRX0O{bJiNis8k1Q}Cx6Xl0<>!p5q
zv)x#E`jhxYUSYGZ8JKlhc%z&gD_vf<4jE(Bkln!OQ6VJ0H)rb2;V+x&RCjN}E!XJ&
zDz8x0XG1DVT8ZBv>2z+aR?}(S#)t%z!13D0Jnw=N2Do3d;l4ezrj%$#!vyvT7{~4<
z`jDmPj=glZFv_pvF4UK5k_F$&K`Hs3Z?0qu=~tp%=5D@|%up(IHh5kD+;kCP>Sg8H
zr6wJnOOzQoGcc1z+f<MgFMA$U{$bqz{P~^q`>U*GE5>BH%8#av!lFeph9yFoK@!|g
zG*zBy+{*br^{G$9{4i^3=y=MRi!JX99;emZE-Kq(S4zY?2LfTyf}ws=iF2H29wyGT
z8|9u+tE?l)CY~~E3d0(&%EP6RvnK^^4BTn^!cmpRK2_6A-PhiX7??at(!1FDOz?Zd
zaM4}u<~;ujC6VppFYQ`KCKmZ27J@covbm4o;~6wRYD7g>)uygRa4=m^p{1$;iHjPc
zY#Tps6Fjz?pfDh~KgacqS?trBU*d~<D?)Eg>h=y+WhakJeoENub-lj#Ug+@W<l(QM
z@2?*o3IPyn0Fe$b{)-9rwnS(f^xLsoo)egw;~y&GBZK$~LA*Id+)+i`IYdYUh>tAH
ze|U6L;GMhR5o;lGHOLhS_rwZsy9*AvLv*b<EkW#}b4ai-%P5Aase_>qV94p9OG;;K
z!Z3AWm`5=zn*b|V7|Ak+62-GAQy7Gb5D*Z<!YqP_rAwmH-J~*PQ|Y&6k#(EwUKGw`
z5HD$t{~bukE1l(|_3GxF0NI@<0FMx(Ai6pjasY--3`@B+o1Qx}ev^427`BBMdba@D
zq6oeNK{Tmcp}`0t3Sta{L^L3U@My~-<_4m`GL^*&#ZeF-xSh^=fMsrSqp!g*Z_Xl}
zDO@=qmX$fw#RPaDlJ{r`0y4+p8N$hGL;D+i?<g?444%A^u9FSihh8*^28-+>a2`YP
znAtquOy{toa3o=w!FaS&5jPpnQ-Bf}8+p7r$Df1e6a}$%(yn2{W=Y|ynBzCM>DZnV
zAW^tlQLLi?Llc4Xg#!P!jR4wK_-uvHP!YG~91=RpFkdKmwTN%oy=POHU(l9qp1@d$
z;kPQ{9&+d68Wpt~wcae^ivqE4&WcFcauyN=ax(gM=L8Dp1Qy&dTYBgKS{#8*EXG!H
zZb2Ytjvb7ryEH2CiPCRB%B4&Zs|8r~+<D%)OV+c=T!|LAXDiV)i}IS2kY^Sm%?ZF1
zS(GVUL&7qXnR3P+vQ{8gJvO;vqWFVa;rq6jty%WNLXhO^QF#kCp=3N;C%^zM;vf}?
zeykHB<2k_;hE6@UD3HiuredCrP$3?DW(yTXk^UGY2(_bE0r9duQZx$#t>8Js6_Ei%
zfphVEKd^`hB;(_BhI%AwlFC^~;ooCxdq?2}gBa##*>PjaDPh3-B91dCcJkcWcSPO*
zcV3MU`ldo|R0eY(9;Jcg)uD0*6mf)aqQHvCN+qNog^T2_I3mMuNu;+bQn`WF`Nk^b
z1){?X^E>ni7S2g7De%8k;xYXyzPYJUl&Q-Kk_BZy9wKUY&9X--=?HCa4B^=d_1IpG
zT9b=7(lZ&EX!xJ4?gE>l<5=qui2bl;7L|+Ew`<%W3A1!|a3Wt>ZBn>cgw=nH;+GZ#
zlJV$hYvqr&<+~KFyTLs6*(QAF1!GaX3^1VpB3jIy=e)A+@|+rDn2BpOUn^Dr|6}j2
zqoV5CfZ@+D%)rpyF+)j6hosDaAP7ha(kUSzpr9b3Gjul!h%kgo3W#(_Dj-OSfP_Ox
zNZN$Jcfh#4>v^8{``$ml|Ia#Woqg8XXYXrY*Y%4&rv+VQt^dU8m@D!btj=u5-sr8p
zH$zv_!oZ@U?a!s;G0VmQCXt#sX_*W4;NtMj<;1m$vwAxQyyTib#}|bq<(bhA&egHy
z(uX+c*U+6@Y$Ys0836bWaQ-=MLt&9i#d8(rg65G*JfVdq(nhiRst_rT@NLdeThQqV
ztB||dK;5`Fv=K_3Ip?VDC`GV*t2w81b2wj}JC=#oi&kOtZsE0SC34T@ltNN`LNgqg
z5Eyx>uzK4-<!yO#>5*ba%FP&hCY5uVBl>f+2ClgV%(?pJxg_OA$omOA0eIu9b|&@&
zthG3LXFCqN5x(h{)ZY-uE7I2IrO9w~d|5cg$vhKlE-U-lGq)3XwNW<qb`&K>JZ#3u
z7gZ-~N4O@XEjULEsO^|s(BytORNf<;XVBy?K}K4(q<Yl`oii8S=Ws6AP>{R=7(oi4
zq;bKM{R@h`2#p-7Lf%N`m100%t9GKc;}Dr4oyMJ`N3+Tpu{_S9^|K{qYvpW4J9dJR
z`L|qv#r`Ie_SP#W=3LfVgqG>-#pgB@9Ph2@RoF;oNP+t+<dD3yVQ;=hdC-g|uLg0t
zpdD%3*nO|DuV15N%b~4qG5iX;P;5)Oev4;yhAL*$jXsyI8Bc20%K4?`vVRW4rx}`e
z)#m_ZN#2(I!{ZAzINDFP?DDo3Owr`tD$EObc+6*S!x~5B^W<kns232lbX?a)a8%z~
zsk6S2PLFW$*usZwcs`-oG_JBQh%tmAX^RkaRBadZ0rJb(iF5`&&w%8*bw#(@>&|)B
ztP_q-GRRkG@}d^A%C8QW?OdY2l9F6wI_|?nMd0=XMN~iH{OlEH#5H>zFAM5f8f_Fg
znJ?_y40#BG;iU~_$S6??)=OxFNM!~dRKwWZ;wmr}M33h5#!<Oop$BJZoSC`E_-c?5
zUxHPALq4O4t8t7WErx+07~2foB!|%igS~`eewV|@#e}@#8=jiOnS_UXBjNR_$XSG@
zP<14;3Y()1r61OAqT1QX#?jP<-DT$7SA;2Ygy@Vd>=l~LCC7db7#9>#79K8f8`_Mc
z(?)S}8O3Jf=q!R*+CZ!<ZOkSp=9HNmZ}8+)TtVzecoCYh1I(F)fd=5=TUB%cIM?D<
zjE>E<s%l=5VJ<&g7#or<Mmnj%*q2f+aSzQxCWn+APmVPrw!u+-LBLJg7-nsFQfA=V
zEfL~A6gDkbYacADFQx1joUWC#$cExEl0lm~pfVMEz&>{C@-|%TL~zrWoAh7Lg{G%T
zZbvfOUGp#{Z?@qu!O_ZNp$j<?@v@QUO+tLAF_2mbqA^Ypq|c=mPGgWk)fXBLU)Vb1
zO&t{Tw;WoD5l#}@;5}xX(<?$1^ttW2v=Mq_kvFU+J;5V2ir$Rqqzra%2JUEb-XF~>
z%gkK^^4def_s2O=uQ^ZoF_|DviCsf}YGpX*N#JBgGla^O{7Ood8}<GwZeonn#)e&w
z5ov>BMHsPw{3sSpkYB2-1O1?mSJ?}`(r8rk?qCIS#t74@opoB+Q;?>nSSVX7J57)c
zZ5!}X>1^s)Vnzr%a!9`Uz?{q;F6ID%H~4|~XB!~4X3t#GDUS?8-lCp;xHn@H+T!w{
zikHS1$^XT_81Hg*CTmVEja(i#XhL)*hv&B3qmQN!sFQFt3^1x$PodA*Lc8}CGwxr?
zK(5NV6=MTyKuA5Gd*&?Rw0=3qUf+do#fTzlAA_sU+b~J^QF4sM)8<-$cdi2AK{a!7
zlbJ_aIdo!mIl8P>%Vt%yLC$ws>+>3@lFY*nzFPXXKCrCM5B6;|we^FVN7A=3+!|<_
zVr9r_VPxQfuh$wZ4n#%Q`Fys8zG@}bGfMi%icFD5vdv&Gr(UpaVYj<V`WQ)D@S5+H
zErki9Zp4P78D*DhOR9~Jlg@D5LlYe=fa*<KtM-uCHyOy+yG=9ZREz!<T1Lz<(jBMS
zkW!iLN;2hpU<><6&JcXT6YRCiK^1$p>3hi9%U2(zvm#Aei5>CAx3{|_zqW*1)CJ3$
z?&UCq;A<6-b>se>rWVb0<E;v4)*>7gp&!LJM3ZI){bSa8@w&TS6QVQeHGvIT$g9zn
z^7o2C+}!2%b!^C!yRHY5?xrZ$QKXWVEb`p9=W`RC0If<s#Yxq~5CGyNX(be6#B{PE
zyC(AGrZ{V>7`;K9Y^{W^?(kB8>2|JAOxq;tAap;ny1%z=A4Ol>MYEciwYYwX(Rx+E
zIcR;;uhsB%D>9RhZk+QmI_{wC6`_d@#WNXN0&{Zjs}#DgI6a#>blDzis*LOo5o?@}
z9o)Kld5ROKR1TgfX}z0zQ?bjV4Hj^XBATtgZ)^lUl|tRt`{cacqGkWy%+wQ^fu?Fs
z6BO&t45^6i^9IF{^MO^*8hh_yU%p2Z<=ej0+Iu;Q9-?Nid7CM*+*o6K2RblD7=ovH
zUCWWwLRjwmoaj2vu$j}i`GOOQD4>OzMrE+>?o35PV(IyXiyWLGEtm)FLwyayr{&=$
zEfwg!E74<w)rgF>m+0bFm^O}<Z<-T9A6<6s96J^|Ys(P=6j1EHQ*E|0%(}4HO5_cK
z&9+j~C~~MYw@T*tc(m0W44?F+&h@{1bwRi4sV#~q1n-)RB67qzvF~=o`dnw1VlV;0
zL|RSWqc`EoUSBzk!jW%XZ@hQ)oq{(^U7Dq_X@POncBy5}XM+}EZ5Bd7$%{77r)i(G
zvM}g_7V$usN<M9dC9&~lziAdPVt}g%<<dP_LFo(a!N1nOL0XM7@AO@8-M{IRHMf{)
zd~ASgXNcO6{^l{yJjrca@N}&Ym#(cbk+zxXvrq2nqlER(Gwtp6VrO+0TR+p<ndmUy
z3?)Ee4Jt-wsI`#K0)t@Sw(J%x<UO?_e|a`K1WNtx&NDG&M+BXa*{5)i98@g1sNXkY
ziTtia9<2<;NQrv~J*mgd>jU7D_j}W&L}w*~hBb6TysijNq(4fD6P90CJvV3nJjMWJ
z{*?Q5;YA&G&8)EjKI!6Dr4|i-dn7U?V-**kXDCG*Ur@fpc5${nquNgS;?8W6#jzI;
zr<($HclJnS%kixtq^u`nWGiMnV^|e#kjXuo?@kdiZ;p|xT<FVG_|GQTu1CWZfzR%j
z#XBc9@$EMm7ug#vJ?6UOg?!fInJX9j?x@yS-Q9Zs_DKcp?X!1lzplTolvLK`Q1aNE
zOuWr_aI$H0Ykfq>N%>@Bz~1M@_VaJDuB>T1)5Z)~p3cU6Vm?TF6FAJCh6p*>uCewf
zW4Ub}#^PQ(Ld3y08&Ae@0}-qo8MB2I*vCbLDBI(@wB`BZW+-X+@7t3^A)=OSBag)u
za77E<V496MnaeaEA>1r$7bE$~*FKJW-8nx}gJRh>+K^#9FBN6C-I^rUBg+*l6Bm&e
zXOXmYFI>|xk~h_Ie~B;6PDb;7xTAU@U%cB;dhT7-p`}HleGSuNQKx4Gc#=8pxA!JH
z`S})PL{$qcW}lalzn>rAzPy+lDJZv;5yr)`bPpr1S(L|#dbb>r>Rwn>!Zsb{`cU{f
zQ#<=RGHTUw)q-Hn@>aXtxC(LSoEPjpZ9_4Snq6|-Bs*CSR)osiXo`<NdP*@9CNGN@
z>)?8)Eq<!ru;8O+{ql_u#SJqev+Go~Qif%9?k^{_8`c5Vy?*r-sYlaHocVg)`ooot
zhWGasJes~P6u)R*|DtudMO93DvmGC$CDKAlx$55fp-8o?f%d>${0aH767gre{sCeX
zTn$=}+CTSXuJ=&o^@@tnnP<AcfN%7Qw4Ly9d)%%3U{bRAIIR-l)8o%3rTP$}N^T8L
z{dR?Go~jfduYAEWL3VtoNVT-Wj%cO$Q9FZH;lpchV!x_!6t(-jxp6@5iw`<7!8qf5
z0Tb+n?_8WR#r63l-Lu!<-m;F{p1r!*cYV=E5~8(`8-H-tZ~1<9oZq{mvKM|U@7&g}
zuRdCY)vr{)iSw`IzAqLg7XvYWPt*r;e?ipyCGgq0`<BRd?USbo{-1_)H)K~Ut>gDx
z{SEsAza}12e#$NzfLWbYMs0*`cCc>v?94E}Z)HkWc+!QKeiQ%XlUZhB;K6=zb<;Pv
zC+3D0hsaBC^cJ$5SRexYs3SatNy?sDSp!UQBPZ@7)Wg@QAy_WTN3r=HW$;1^8Xho;
zezV6#DvTn4jffMo0pRht9?^+R=`bcd=8^^mNwGdaz!tI|CXQ;O^V4YI5lp;%;F?RT
zM%%)B=CWV6S3CQSO|Tbvt7EIdv*;VRP{({5l3<&IY}oK<jCFtwiD(-k@x)gwqst7W
zTaTNy``AM((*d^VEfn=5D!vqEk2nRzJkIB1?I&HZ35IU@+`BR%3`&=iQW~}CI3qPj
zc>7fa27)$fv2fvh9HCVV_nRbfV%E<C34I#b^s!%`HpeD-czp{MN`3&9el5x@&DI7V
z0V}&BkWkL!Xyl+%55qSUyM}Cz-0`$-XPN=O)ROzs^j=|9XT0v@X>lA+dqCmUg@C%Z
z*a_6-#91?WQ3;svO571YEgWM@79DYqSV!O?Wg2(ZM~hPgYhR<S)AE9vEA?fVn9e#s
zGO&35=`B%CcVC1-e8y-=f!c6V=Ddb?-fc<Tn}ZDM`_>((Y*CfPV<$bslPRK8)3z|I
zQE%11bW7auDc7$x+c6-@;EqUZL6h~)G^0~&(gOqDil6Axo4ROA!a0UKo&8Qe$_g;S
zMo1)S^!e#>oK5uBT;`I#wl&A*5b`pqumL$$$6<+SEvk8PX)Jv1W0JlcF0D)h+pmtN
z(?!dgsL5981yO!OFu&`98D6bzuP&k_dQRsE=UO^fcBb0fptQ(Abe9J8{)}l){rm;x
zV%a(h5mr21rrbbx?eIQ%RiI(%8x!+dwDXMB8e!=r(a{)rn`<?V4x0JCM&ajU>}xxO
z*JTy`C+33~7_oaOIR4(`lDr5uaIN%e8R<ciBp6-$bZy-;QD|!OiWF<Hi5hul^mKbp
z#LclwW&T80_|EwHG(Xz|5hQQ5y76!`bFP-%JRrq`NPSxfMatzqJ-3Dk`L>dYhy}5d
z%@9j&wbDE+4+S^AAr%_)VEG~%3JrMT=$1rd>i5E5x6z!n6Vvc%O@!(x+D<q`<Yv31
zYnq*+{kIWWEm;P9oQGQ@Tlm&_=e7>25XB3X_dy8~U&IqR9WL<rZ#)xKf2zS7IeXmj
zv$pWMMC5g&lk1knY+bbk5;lrlM1CH<4ktg}R>m!?SB&>M!#-vNt2xTYLx>xP_&zVh
z#GH6$+Ux87(Q}*3Nm-Y2prh&o(OB_YjRW(KHOJRK1VH*0FSHo;JaiQ(6I7zm9=<$0
z^ie7kE$pImLeB5LRmEjP9T(#V%p)l%Z^@zRB~wPmSH&+Zi!WYswYY6IIu#fiPQtT%
zLD%5ahpNZ-5|I`tk?7%q;Lu~5WFe0JjIZYsu9cZOUGlOqpO|`ET~ioX?-_rmdEu;7
zz0QMm$_ovhDFv!E%AWHRrV8vU)7KtPU25>{ztjA=*{2!u5PIYJoyjTQ%aJMMmk&w_
zUc7j?<(Y_GqHHwx_TFs~O1SLkWFK&fwcp~IGRFrer^fj-1-UMvlUFD!zFiT~t-H69
zurO2laDmHOZpGK?a^}Y~i$xH>=+hLr5ki3n*SH9(IvZk^ugD6;++)ppU~jYWz`F63
zfi=URn$uOhOW+D>Nq$6=@tUlY<%)jx&Zy+=YbEhYFRS9v@+xv(U7dkz3?2=m#b=LK
z#Ip}yd)Bc0W#2noH1Pdh*YNO#ho6N$ZLg(Nejzf(UJg^W`Ve{l+x+qPZLDfmZRUZ(
z0xElZkg?{I(-XFLYRWs3@pNylTTiY?D_?u%Z*`^S{9flX@!jC;8*w?$lwQX7ZOu=t
zoeKCG7;TMp23pE}2{oLEh*9=i^4HjTc`Wm@Qb=Hzt9ABp+2mJcs{Ok7?A?WIrJcJ6
zE;$o5yVE{5cdDBAKb)W5-+WW`ZDZob=mWn1*uljfCk)FK*v9D1{%ekoRmb1tQFP;x
z=gTo~UtuC)Seh*`oe8$#8kUk+t~nRWHil*VijAt4<&wqnjyb0wtXn=@is81SF1U7_
z$>mrYR>(OR`z2`jzK<ZkPxEOzs4qs%nU%}VOJ>Y7f)6cGt7!_dKjUmsCF6Z|3909M
zbMJJhXSII_x7~TBPy-DM^RbZVkD;8HP&*R~=4VFLCr-1<Qk;DjbYUzs*emQ}L0Gs9
z*QEm4TSVbkWPQ3?_|!Ebs<0u~mn^HUL6;Mt;<B>vdE`WBMCZMTn5BpyNaP1tgn>z9
ztgKf$e`K<(#a-V>EF|hqK}Z+I%QS()2Xhb<Wbfi96Pdpi$xRcLTM*?u7FEV1Tagyh
zd@O?Ud_+4jYy7dOkExE$1kvIk(q1aaBj1?L)R<ty<9%B(PncqdYhzv!1DgcP#@v{u
zu9z2NvCp=y1gc-MX7cM>JXFFaBVv<%<3NnE?;<X*j@?XEi`g|{dAbzapdPAx?`A-y
z=7%rww;2*v!xgK26DDpYKnfKS#}eLtNl-CP5S2+Z><W3ed395YYilb$moI^#JAqj<
zl65@MV+)L^!|Zg$i^5s<(-N_K7OlBZA5YiBw9r9~<d&M_vTy@ZrzASlWaac^6}c3U
zY08P~Ddo3Qa*T;m^eAMm6P1evy&pSBP|{4*sY_O5PBq+4HkQMhj3<Q=Bs-1Ab8e<E
zKD+KLOK}x-OV!kon;_J)?$*SsTUVKH^U2+|alY+i>dt%`Yk55(aQW6vcv=Hrnr&LR
zNaU^fi<&O*v^4d!08`ggx#ZjFX{-0s@5otS4Uh8COwZa*N8w#^m(mgnGm?<W`O6t)
z@H-U(cPcgS+`5%f9C;^pFr%vbPSf(8C-BTxIlr3pJDrhC4FZ|ng_+O0GyBq0Ixc1o
z$}x2<XO3LFI~sX+-1PE*z}=~3#+QY6X9Tk5G_xAJ?@mW%T?1#m?ao?T&e}+ibxhCt
zsL8Yf&;A;jy<M2C>y!0qIor-QdspB92RVb=7|%Y4#930~pglP9cevi`IJjVrK?RP|
zC5JI8r;Is=wkJnQKZltl7b%!~P@BW<k}LW?hr1|Os3+Iqdafu5gTU)t$uoJ<ukCnA
z^5k4-BwX^8-sK5L<;e@?BU|&7UGh)+<)G#BwOpvxqVjb~?(G)lYoEDCJd>{<b<fl+
z%g_wS>f|vaxo<0ovv_y!oZmgWcbV5fU@8pkqY>Qo40PH7OeF@Mu(6;Af$1^#w>9rO
z)aN_ZKX|SQ1%W`P#H^iB1tNG$pqQP&hN#mB9wP|C`eg%Lm<mZjieP52SwVPDLDXx@
z7!r`*84Dz;Ai1b;{URWS9pt5F6g}xK40~tkyjd9SSJW$JF@Y#5*eNm>%q}4*;g~6E
z>bX<#t`Gz&dRkR{NuDCGytw0CajRgdA9wnIeAZL>;wqM+SP~GGm<2tmAl9XHuC8df
zC#PNhVMS!=lv;6@OYwsp(q2T-Y{tXarVkecbC%4?9@ag4I`XjF%;KY2!DD&QgZi@Z
z>t$O}xE;UpJL6@YpUbMvz%fN2Dxhu<2m187d?dY`WF?!dp~7doyo0`C;x(9dpdh9P
z!u-4#Nt*NIUBv>)Bau5P+zJ-F#U-Et@U`;d@|H(Z6PfI+mCJIKs5^-=3KX)e<?_YF
zA+JGmo0aOtnJNm8r%ewY8~7(^6hH3hEMOO-U~eh7%u;2-nt9H=YUp~^1=iS1d9Vn+
z+WmRS8VT5gv}SIgYOb98x`Ks$adq>>YA4ssixV};U4=6&5A$C?4AUx@_N#f?Srcr2
z=O$@woj`3uaagb*2r$9&{3->C>(Uj#b2cCl6~WX9DBZQLNdU;a%1FIaUlx6@_<4Q8
za(%gL!)d{W%II5F{tZp8c>oS3*4@yo)p(qwvGsX;yLsbt*4$^&jU5Gzy+Tb4?;88f
zBL)?k#?5gfu1)F@O|MCtce<OV{4sz%zUYb*(`rsLD_vS?)|GEwxf8Ik+x*$J?48gP
zu`^G;Jb%I#{bbw!Aa{4-2}H5#fV72Ou!XRs<q7i>BDTx$#ujSrJLIb^J+M}qm{t~-
z7WzyaV`eL7W*S{@YvMvH!mX{pu9f>+#hQPcaAvb0Tg&m)Hc9O)F0%Gx#%)q1?GeuH
zCswWG8r#t&Axf+5W6%zjm=1c44mCH+)0rK*tNvQO9gS~0^xQh_k98Wxn1=gyTK3*)
zE$Ae6;m%p^bO^ZpG|a(PF<YiB$#M0mZlssygQp+mF7s?X^$EBgP)*{cogK#r@g?hW
zP45h7bns;A3ZG1nJslD<c{h;;;vd<SXc5%)tm|Vs=GyV@^pX%llkUJ(<fW4C97R8C
zN4vW*S#dGxxg`fZ(++N&7`OY1*~$bx#oEt5@_PG|J>TEvt}%Ju6mT&j?0Ma4_LI*s
z7gnEVxTTdH@7*7#@cs~!vPm*{yl+^$Z^W%{G^TI7q;I0PZ)&yg4cUvC<1gm4U%YjD
zu^97Wx#Y!4?~Ap77a}G^>or}^dwZS41k6JFw@dnWd;9lR`wz$lz`_F%odM{j0ixIe
zc<BIX-vIgA044b#_1%66PuM-}e%jX*#WwvKEraZ9gPi0;$f-dN15w^fL&xs&a+MAV
z^$j6)hK`XB^WGg2))|&w8x&<9mQxy*=^GY|9hPGsR+t)A?Hg1kf633zcdGOy2fK;t
z)t7uqCpibsYUv!j)Y*gRS`O(ejmQMToDzt80tV|>kXM%ipOIR<OKp?9{3?vQ!L{$z
z#WfmxCCj=A3b;vF1SIkz8Qs;s&_Lp2w(L*2u8c+|k6O*V3V}3+E6H9eJsAs$G)0bG
zxD<7>i9SGS%z>TH!gf5V??fp1m~G?ujl1Jvu?DgB_9QOWBal&1>hYMlaUJT{Av)t3
zmqwHJUZ+}4gn3P5D|J?sPE_{MKcSC{u(!9-$+@?u@MvWsymG?-?nE#7<m0K)c%~_{
zib>4yWMf~)sM2^IIYZlB+0He3e5veg?8NZi#Pp@9{@8K9HTub^@sYsk+fyfizN8a<
z(^G5Hb8E<Ur32Z8zBgTgvY?Z1s)gT_-+eO{h#%5<^Q8};vWWj`*|8amBITIevy>&|
z!0!vovRL8Q*cs?JW-Kcvx%X#2Uz(v=Z=bw0%P4}!%+0W7&7_bqaAg4ng46sDryZy#
zgm28Ad^js+F?(W~etz$S_&&Wl#het!EZk~F!D?=se4g^;+m*ghBaV6Q$+=S^b2ozL
z-^9*nt@k*J&+ARk568Y;)DgVaI_jGB_HN_&#b$c-{kOI`^SX|cb`@_OA1+o2FS<0p
zaT;8}?k{*vE?BrPGFdI!p%=B!F5HM)a^YCk7m4xLA5FDd^31{na4<d@;RygwN8ea*
z=U@!xU}Cs*u$<o9ds~DlD{JxM%yL|u{++W+@o~#VaVzE6cQ>d7%BGjIrx{Du85^=z
zI!~51Q80D5uRedV+PA*iPq8*AvNn8nZNz<TG;VGD;o8KDwW;;BHx%nLBI|Q!*WbFY
zFUGAeKU`mVvA(vxzCp3^US#9r*^STc8(-r#wjXZnzS!7X-#DPy1dDD$bb%J#n?&)O
z@Ul(P{!Q|YO-jo5)S~Zcb>Gu_yl0Gm&s_GNwf{Z)#(Pf64@l7u+`1olJw6<Z{~%EI
zL8$+O@WuyG%8%lrA0>4^N_%`f5&u!H?4v^eN2QIA%9NkbqMuZCKdJr21f%?{FM9CV
zQ1`Qu$LI6$pH0g?oA-aV-1uxw`NdZBi@oj_2ahjK@n0^MeR1voa%tm>2j$nxqF=pq
zzh3qD>J$I<df8Y1{;z=>UvE-wVMVusb+<x2w!-7LBFna-`?q2@w&E$b6GgX^b+=PJ
zwr|I8r<ZNt>EFJ)v7Jr1lOwv5r@M2{W9LEqPGQ+jasN)~#!eaKZiVP>rS5K($8Jsh
zZe7`KL;r5m#_ki!Z>^%=+I7EmdVG5p|E;_1+w=Z!eH-8UDfb3N_l9-%Mm+XL<M+nP
z_9puGrZ)E8Q0~u&?$7D&zxCK(jNe}_+h6J5U)$K<pgedldhk*A;IqfU*Z70&vV-0J
zgM+<|1JH~v9u)*7=Qx$7H=`0p&VDk4Nq_cK6uq!jN1FbedK|mb4MJvvd5t7qovc&o
z25-;Y61Hp(VK!XQ&XB$|-H~p%cs5HZaG#Ln+>&0dS}ccJ#<^vK`#N_|hO!vFJ6B{>
zYSo!xv|{|wvgrnt)p*t9kwagW+8yIHv+7Gz&7rL4*DdO=u1$B|Ilp1m9Jsd+Wi#2d
zX$vLiRL?YdZ}&8oT{(=+^uvXoRAK9<nWi5dU))u?31c_=<UDjwCtLll*=LtmrIt^^
z*v-GVy{@|S=ILGYukO=Lfd?=Si!IOD&REXVSr*$@7W(cghjUo&c)uGdwSJamxqEGW
zs_Eb+5vSER-w$v5vQKAQ?fHFKn|cz?X}uq?^Lg#fvux{w8~b~E2Sj2(XC0n$6om4W
z7#hlWp&U)b86u_vKbBvvLMqxJrb>QdzFd`3nNa)`^=Y1pQ?$CL#MS7}U#L)Hv<?wh
zXLic3P-pe%5I@cCGhcC<^CqE$1~Q!Ikp_4CDG5#9+ZP^b9?K4qI3w^N|IrztvJMF?
z;hOnJTB1(~C4mOnJeAs#{ih^#q(?7Q>YR8JB6(JBF~9Px!bXRruF}`}N?qjxLMc5U
zk>s(SDy5o~z8a&$WBt>dp;88#$L>8g&=T#GGSoTo_OYR^GF1AU{%PK-bB4NV(ndz-
z9jc7j&s&E|8=E@at1>qC=#)Nh>GQVgy!B0}jESuh2{8z{O$h)0BIXJ5O9%_fh>QH+
z<?^iUT`t*McG>@7<@H?T`)^9#rT%O3mOl5qd@=pkl_CPX?T(1NwVQwP@y>_H{s$t@
zJF@&%B<2T^7o&D3HpC(B%r7O+DM2eB;qh34^~J=q0ZDZ+Ntr*1Jj1+{=zk>gyfe&0
zGg?#c-1p72{=1Sljk|Uu$EhOc)`wizpnSKK{N}s)<uCJt-{c2W-OB)!ys!tCZ#{V0
z`XCkm0FzPB5><G$zA$U%2+9MLyttC<0F(zPdEbe=#InHLBPB2OQBeD%`+${~_BafH
z@}5=|0#;s0b@wkTFS{-l;PQIw9|Bz7cPp==aR{*TmVSfs2A@3oyOmegne#iB_qgi;
zAm&x~6n6HEO!qW>NAmzNufDhRJC_God0PXOt%KD^T;2r0<#oQS{|lD~Sb1He&1+*l
zfR(p1-VRuK-=VyL$!FiKJOIkuo_>C0<-Hi2=?AR5(b<6`F7M?pF7KC>H@!IacP?+?
zH!knp<{}{Gt$lb0h<WdS6Z3Zee=)DA;p+yzJ^FxCx4Ciq<I-@kb$@fy?$?Il?cc>b
zo<f=*VqV%0G0)*h%<HMdhtL_zCeZ&b<}s;K0b(8(9Uly-N+t7mF^>We^X#eg{t)wa
zaPvtgm+<-IG9ACfJiZwoYWa?GUTR|#{V>YEig}j+F;D2bn0GCfQtwNh3S8t+%o9l|
z2gJPkRw`M13L&`^lO+TY^9CV+m{&DNDzKcw^Fz!-FX5w67Ad$e)aV%1k(lS(r}5!X
z%#%++#AuYIphD2@#7uygchMk-9zHl1#s`Rbj#LjwUdEBj>|8k#^K@x`h<Wp*81q`>
zJ&NyQp7BpHkC)1vO2D1)P|WMS0*HAk+>v78gh^)wlUnj3SyT0j;(69jYLm!D*8*bR
z<~hY^v7|#Wukc*vp_o?;h<W*y8q7Z5#k|!po<lJYF|#wLMJ9s}j_1j@pw-|Q{w3xO
zYkU{;^dy8hhb~Ig@d0AqsK%j~H^{9iSXO%^=AG9RTocRh=6Z1?=J6sC0t8Sbo?-v^
z0T*8SR0>W7qqk+~3g2rv67$G@ig~yGLCm{_Q$=)>5mI0W!>o?PJiO4phQXnjr*tId
z*^q6`e;4zdPY}TV5c8~p$deAmyh>0;?@f^<Ngb+F`5&zTF^|8SYoG9;>US}Zw>B|u
z>K2i!s>IV<hhpA|xn1cuq;Ixd7KN_&1`+o>&myfR;t%A3pz^7Hh<O@EVqTK%3DzHC
zo*RPfN%v1NkCH!uiY+uqU7lbu%sn515+0r?OE@1Stnow4!yypde;4ztF8`~TCq$(c
z^mj2&|47W+0K_~LH)V<t_DIaT^<B)PI27|J{v_rJ{Z-6kJQVYy&>X*sd1t7C&7R_z
zmlJ-7d1Zv$d8dyx)T-SK$o(be-Lm;NG0(7l{2>@;`cups|C5-<2Z(vce~5Xl!Qr`N
z&evbgqi+&EB7AHZjIsMe%yZ0%S4{!LyyJfn^CY<r#k_jJmP-_BW{<OBe4D|RJR{|K
zjsS&^C{X4rinpr!F6MayV&2XVF;DPF%v;t&Q!V`v^B$|H&-^Cl)c|6i?va?+BF@8j
zB<5XE$UJ`}=823gNN@fS^GN?L=0W}@<|UG-PNC1r{1o$gpnnzfiVnrRSFrlWncu~{
zvqxf{n;!5~XZ{fLj<F}no;tB3fN1Z@qjCR3%sX`?=C#pm{YA`U6!0z&lK3v>vBR8x
ziFrmg-^IK$VIt=b#XRo6ig{A+AJDt~5cBxp0^>i#yt-dv-iHK2)-4RN%XcyF3?Sw?
z0Ak(}S|Dg^l{=gNH!&|lQBR$Ui*>%6q?L%OP^goivZDvuD$(5-K&7y(+RKz&kx`Wg
zh<W@6@DB;6XsSVR?tqwg>hEG6FZy~0o`9|z1hdXp{VwL^Mj|%J05LC8u~vHN>|#MG
z!6Oxg9ze{awq+RplbA;~4~TiCHh+kDp`;RknCAhAc~jUwiFx&Z5%XxT6Ca9sHUEQ{
zXZAzPi(vU7<}G*Cs4rYf^xt?nO{GlSE<o@;Vq<q!f4r0r5c5or#5|27F)u&pvfiPX
z7XgTQ#Q!Yj-DADh0El_Bq$g4i#XOB8F^>=s^ZY`^0=`AwsBN{=FrShhnyIA0<dHeF
zgo`;2ZlDguJUuMA#-GGIZ|B+jG6R1X^LXgR3r_JKiFt0+*_$}lBz!ave-F6`Am#;B
z9Eo|FzEJC{n~|y$57GGxJw})Cq=5;CVxBbh3x*>xZy3~0lB6fa&qmB41BiJu;86O4
zzl(V!e-iV?Y)F5Kc|08m_Ofz7%=0F1B9GqOtbr3ilPJnPkUbyx+Zg~cPxnyFJAEYP
zQ9&xNkk8M-LWjv;)Bh0jcmXlb5H{+m;@nAp1A;IH#5`^Y7V!^a9=4ny-{!<}f|9)0
z4>2$4mzZ~+U?~qG^Ha=A{VC?5^<aDD1n9qrdC7-j9{xXyc^SA1sh;FrNmz?PGM}Gf
zUf(~6d7C6IKgB%r|0?DYK%)UMuZH-Sm{$qJ4rvt39goDk97rLELSPFGW+co=pfF7%
zTsQbB<{|zh<_+K>NqHweAtHoQ$O?Rjd~oo-KZ|+1e-ZO)4#hm)fkQDb<CmDHLYbaI
zxa3Q8BL5FD&;0LV-bWH4JV7)bJwWwS%%g?ybHhat5T8RaFYl+Ahk%Gs{Sfoy@dRGp
zMA=l3Uamihc>_mcUUPzy_HxQT6@SK0F^?Az^HeB>@Q}ZXdB+aLyk->P$)94L9{xzo
zGk|sf67y94D(1-?iFume#k|>n5c4X(i+NzmAwvt;+gsJD|0L#d{YlIlI1=+@P=uO@
z|53~XABuU)HqqgUN_RD~_s5w&EHgj+oONJ|gZbfzGjJsJII`ErA+u-_dc?qg6Y~}l
zTr20u2-=_v2qn-g8Jih_uMGu@3&ja~M5+x1jEiMYojU(W%#-;p<_-Q3^A<Mq^;qs1
z$lp6>cF%YxKNU~mwav`(>?Tdle-!i16MPr*eDn^*yrgodi<nS2LP`%rK8k}k+d!9w
ze-rb7EvLUAqnFtO#4)&@4R-m@VqUb(p_teFo0#YOOU!eCV8uv<Y&=fdK%4OpK+KEA
zNjDGND#M^Z;YsBIG4CDZS;mo=hx#GrMWYCZ0WmKZ@)$xX^i#~!EI(uZo0ylRm$&d;
z%=053-7G47_g675`<IwEcO>T7K>IY0#5^G~fJHO^CFU(0iFq~uLCjM-6!R>O#Jmif
zd+wM@5kSm~`XS~`l_wH{e~5X7<=67X#IgS-=J}Ib%X(RPJ%%J6iFpD)#k`?EiFv%g
z#5|WnF>gJA@Vl7T3`|RokWZ*1F)xWiXn=qDZ(?5ae-`ryDU`-*ZYZ!}NbgOSSK>DF
zCqb|l8>j^c<*-R=jE4bYUI7k1c_iiy+fWp=K-KZEe;4!eAbr1!c@2kRo;fhp{Wmc$
z<2Ny{01)%!55+w9mRuQ6;$y31BAaCn2_)-`gx3oQqBlwYLChokKM?a4eu{Yup2QX{
zxn(y0Ma&aC67ytmlx;_1p0Uke#60FhF;BCc;5s1Y0U5u)iFpgZ#Jt9zVqOf9RokJM
zx3EdFo^UAU;Q=wvpV-FJ2oH#Pjl`{u1XI7nykYWDJ=uIcn9F|@^FIAe%&Wu`;9AH(
z6C8?p;t5ZOLF8Y6l>z2AG4DMIAm%0glbAONh<Wut#XKm?VKe`F!g&Wk%;SQb`p;tC
zz%Mbchg{<l#V8==k&&M|67$x6iFxvW67v>*ig}v<P0T9;#JoxhL9;_KZv~gLl8^^7
zfUh7BGUflPm?!vuMa)a0Xv+Azn1`k;!$Fo4Jol*zu>U6Jy@OTrlbM(QRm>~=CFVK&
zA?BHT{tsea4*X=fzviFCynN6PF|QIcCqGTzU0*_gq!jv#m<OXsK7T#xgKy$##rwaD
zc@O>vF)!!4n5XcYm?!a5%zN-RG4DRy2J|;EkBQLur<j-VUCcxN5c84{m&AV;^X6a`
zG=CEFGXAre_ZD{jcQLQxNX!#I6!Y|cih13hsqR0;JoBGoo*?2sih24lV?fMHq!9T-
z%oF)%F>m1SVxH7LiFs&3^MpT%dB&jM#60`o#JmTGVxIADVqV$6pTs;7#D!BwVxHjd
zVxAJI-Y+qa`B2OgITG{4F$(UuzlnLXkV7$#7UKS!m?!aH#XQabt76_jb?r|v4^Dbf
z>~02)L%n72Y<vm@d+IMSFQ@LG#k`Z&Xx^rO6Z6(e{;Qbhtx54eih0!`<Ts<w^okt3
zKf|#`6E%guMFfa>JhgjGf<MGO(GO1llbBa6r&uc_*RIpS#yI&RrGLRLj@bRXm?zju
zPWeBIc}jm4^Xh2+--vm=FxGz+^Co|Yc|dsfP|QpEo0u1wLQ|sA35a<~e-ZQGzr;M<
zLox5np_rFQ`X@2Z`IZDBjXEIaEvqMa|GSt+0*HB1fSAX#iTqbF?^X&^&ykqt;zW8g
z;NQf&dVybJULZ8(yw#DI=k<q}XGA3A4TyOtLFA#BH)r=&yRIC~>5MxR^Q^GyoUAt%
zUjCbymwNh#m^c3qVxHD_F^`l*^Z!uHn}kWf{3kJQp5UjLcT9zbOWXJZy$H{H<e$a7
zDVXMk>}a~hhZS96rZ7OvQ#cg!oC%*DiFp&S|03p{>F9$Uih16LVjk6>#Jnqi5%cE%
zi<no9gAoH_Uh3A2)Hh^|uv^ZV@LF{Q4ixKN+e(h7B381>3HHv<<Mc5J;VYqPRsgxO
z82={bNuA~Z#Jn?;&tQjQUM=>!m{$mhd7nrKFJp;+iFt#+i+Q|<V%{tu=Cu<UZ-!F-
z67!(c2FQ4NXBAo@y*m^Z<q<sjK^)BkXbHkxIA;k0uDSG--MAbO^YRGwK!!Ab5%XjZ
z#k`l&sDBjm$dAOlXRt#tueTy3td|Q$pb3b10x|U8TuBQ7F|Pz6!hWHjk&5TLm^ay~
zD~LG_9|DK!Y8;ArXZ|GSr2}GK7xPB@cQH@yFJfM#LarX6ml)4?G0)^k%)<g=-ekh>
zVjkmTRp@?so3!8`VxHh1VxILMVxHD-V%`i~<`f|2rH4{%QXh$V&E<fYmrUaPo0#Wa
z`+p+l<&!QPiFu6@DXjtWCP2s9ZB8K`te^uwmZarS%nKnF0>nHAe30opxM<Vl-^Dx{
zAMZmkkN8l`WBs$3xA41|M|@ln5c5o1VL!#Z9xkG$LoqJ}N*1r8*3{z3ke^eeMU2)?
zY$<2&kOIWK^VCtEPsv1nh<P~>Y1B}>>rXLHGX{Pn<{3Z%$bh5ZV2Oqn0|H%0ye|oe
zdD6r!(&aCM;rw{8T~F(+tEu0`ytWpiUVT8!L;Ow5gHynNiFvvD-^IM};d2mCYe39<
z_lKD02FsxTA?67@Mf?!+gsD(MX5Nv4tJtoEh*R`r*wgge>1tSt%BT!#2O*CwGAAae
ztO4CJ9W^&i;#f!6SGHA+d}6k!E`mcb&vut(T-5CG@fQiMUK;HbrUT_so{6E7RQ75?
z1q5YAFPBbF5RWY^snzs}laR!>jVH<m=k!&qI`+S&px$cnQP9H}MZeBF$k_kHedGPb
zXCY>IF}KGN=e^0vfV5K>2z8=``aP7eg`h9ubGFf`75XY<pNh;UYEU_d2!to|-vZdd
zO)TYn3!AAd21JA7LWA&Q>}eReh#U}@4FS4+mO9snhZIyIr^cB8s^Uz5fIuxEU5-!!
zb*o@Har8R^1ZYqigdvu~%`SAIi9iT&+Qy99aUZ!}hb#zDfd+vvaA<ZG0R|D{!N&X7
z2g0**wU|(Vy@Ddz5h4f62Fx(=Zr#tr*@sZ7&qQ<D@__K`bcyw23%-xKp|%vN7MOK`
zBxxM<E|&!ev)%;4M2Lbx>ARUsx0lcmj)7nf{wcQ8wFh-kY&a}k#dHUaCq}A897|l#
zwIukig&<&xEY)y#e)DX=RJa=j5`>^BRBn~dNPO!~mG@ad!kYoN51!<_qxQH)X?>K;
zr*4>igDI`)1<)mWe)k)Qsr*C!d6zhn7Eq6U<MqhKP%$D2v6l9<Mlcy}H5uUYFtj#_
zBmkG!ih(ZGnkqD<yDE|S%Xv8iR$k&&E$V4=>e9S&mM+xNFo<kd{;k$yA1(P+Nf7Y`
z>Vg#+?%?LJWEiLbD_Gk|3c=U`P+kGpN#Vq4h*X+a11SLIVV}^YE38yXaMFb^1fW4n
zEqy|*Y(V}o*@LJ4l?MD!s1zBDO!eEK{DGSm^_YF)8!c)l4J>E?HC!w$wE|LF1yQen
zNZk@?CYz?U5?y86R1^uk#t1=a7^QC*cYb+hDIzjwkf#Y|%qvk%EAfqLy`)~^?O^$f
zhNr5yVFnNkWtX%!K;AtE8^3J2nylg#0orC&@-{rB{!;a{A{Gr;c^9$hbL|=|s`6OC
z$|I5JDwO1jks>^_@-CPs5(6w^D`4eOyO(2Xxs~Fzr~xid5(K(zp17*jM!yUKUr40Q
zd_+J+0NyHh1%dcH6W<z27!qPI?PyU|d8F^NLHj1Qt*1^>b!H8)<YEH)$YxIQXY|Wp
zs77MuolZJ*jZe%o`is~D7pd^kl@lh#4HP!&jx_3`SR$_SBP%Z==)&<BhfiIAl{aXZ
zh{zP9kR(#rLfhF8z)+`#T)`H^&zR2<T9iL>)Bx?QgbIpjSny-uOi(*2LPN=L4lzvD
z>M7ck9wU3D5yM1EF^pC%Ou@IC#TjHlTuTB1;VTmXH}6_928ypORfJfGDOe=HASP$j
zoH6&K36T*s@3j(%@K5v+^^B1{g{vqUTEz&d@N<(r55Jx9(hGT|09bjT_6ELd!KZJX
z;z{^KBMn%2TcM{lG#xT;^`7G{HB`8q4_J91>*s)#hoQruDj*oI%+`Xu9{sdFBE5PY
zUrYfl=-?$!7@vY1y|~=$xx_N=XYO0_AXyM~L|XxC16^UaQwm_^fyjJ&93zgbyavKz
zhyqDN$c&<b8!aI?LcXMudM2ixECsOgFp{`7I8F_u*YGw*ezEaHB`rp9Q@Jw)Gb_}m
z__|l5l?z)N=FUWXy@2rAP9(ZOc#te6l}FD~4%_ij^W|KvS8}LKW0DnqfF2p<f1w6Y
z@-8Btu~K92?<P8K>3KQB=*dr#8}%9&4ALb+*{&v9$qri8wz6vKGaz9IqYx4VhPg_Q
zR^mv>dk-ji#6pKkUKDS^5PUD1#Arx&8CFZH!lqxEmK3Vt4Bn-cbs`2IfC@mL=Z1KN
zTih$K2n5_<i{~aW!A-qjD3rtn7kr#PM)>NmE;E$6D)D_(AqPK(l1f{DE=-zVA3cTO
zyPGTzD0%#vxJ^QnEkhFCK8??Opxu{>Bu4tF=VWzmyJLWZ=5Q2-$iO5-l`2Z4h3D*u
zfv)hOl4nuMZ8<dp$vCG7KUDI}pfRY=BmCpRhe}>r3!NMmW@G%)EvG!%SOZE!jXy(M
z)WWV5>|lwxO-HMM0TG}&++~AEPz_G2p$rL_9Uhp1O^}fSgby=lq75RK)xXe0W7Ah;
z))Hb@H4?a&EeQ~LpaxP!3;_-;$0NL}k0GQ26@E)RAgt}8zYc(SO%Q;{!<^$2!vvRt
zWPuN?93b)}9_HzIwS)#+V#sRyQ&vs`M4rYaxx&02Y-*C>8qKIcWL94!3#rKy*;koR
z8Z|1+ywK?|>2OtYM4ZkLgB&Q@h}zZ_8P{Z-VKFQvJ`6$BYlw{*JBMkARZyA?TRDeF
zI)|pLC`ql1F@nR{5EugI;oMl-({(UbJ;29<OMmzAXw8}tW+zg^762d58S9E_P>d!7
z-xITw1$;aZvFEEi9kT^<GlREfv?d^^2}tre0kJHES`S3LRBhD)g6e@fSD@r3Q^aFc
zgME#}#FY<>)DCSt3<!zPKPX&-;zP}eF&N-#S`5aXmVj7HoDab93NY-_;gT2({VGOM
z4+BpL8!`fsZ));kFt7v@lH}0iuAt0P%|xR_oe0cGAjaEJ4U#5LU)W7%k@%<tyMIOw
z>?>ZpV)DV#l4xLzgBYV+GQqh#I^r4Jv=@<G8tH_Gw62l1y&Xb$$tB!-zSMYjWEU9O
zTIEIy262U{m62Wm$D>m8k_D6BuZ7gYC?1-CBc1^`-Uwkm98>@K5XWnrfGS2sTUW+l
zlE^X0TTrqzQ!t`_RqM5Df|&ss2!fj-aHN)ct`NnIiPMooSYarmWeE!84(Ju3Y2*FR
zUw`V8IcU`a;k=9)^=B6I&07624>IMz{1|E`I(C`o`WpRl0FI|;Pf*ZDr;n+V#zUsZ
zMf4AGJbrrOLmclq6u|Lxf5Y*#U_{ys5$C#u`%{R6f8uy><00Dh4)<C@vi&wrIuJSk
zb9h3Sz8Hp5{WX=<YerKL7<J0iSDZdf>0*S50u{J4mXM&U1)-p2F$Q6K)j@!tiPTAq
zamBiK5mc^XxkW%^Ex-@`1d^}bHR8>Sygn<GlNYhIx>0lEZhbu+sK6ED3JT{d1}h|(
zkT;k$<~1PP^gkKB*$TA?w4~-Pc|kWG%y|-fT6-o`33G7P8?&W^d6YV)W8-AuNbO*y
zt6EJ>Xhn7*g;<RtLKvTK)?>)&8!Ax?$-9ERB?1ZH2eWU5@I)9{j}eroFK0Agyx9d|
zM?g>D1tOOS;P>DfiF7p@$GNCp)tfnxj)1s~F>DF2`qi=4341cnS)bvzbYR<i?6$RB
z(sx|JafUOMWD<M`#RU3BmlQMlyN+I-7?-CDt}os~nA$2+UNa<Oc#Ns(*ELi)pzaj)
z87o?BZc37Sy5N=u<=v-5#1i2RW@5L@z|I<y#)+;=Z{9W~MhWZN;hw6UlOV1I)&&Gn
z6xNYSGgedz5Mn$-_eu2r5{t_G%Pr{VjEE$L`v)jQC=YSS1ddD7^Wq8TNcVxz^lDxm
z{vy=aGL4@52`aw4LBiZPVy{{PR#y5k6;f7bBBN%b*H($#OmoTRPDBV8*yIej0K<Pa
zv24nrSBIL~IPrc{ISf}z7%|xlfOzE)TqOYFVdm#tmMr?A1+HF8GZ~*Atxl{I-feqA
z(Y)1108UU(9&P~L1Z7%M7q|k71R+_0XK#Kt$P;99L%o(kk*I6ai_N)+9-Kpqi3>=i
zecE_A+S;c9MqBF^b**n<#pI$hHbcvULEKP=!h-?6+{PcuMLZe7zkH1!tb>3WP{C}|
zj@_(<%v#~on|ZTb+_6hnZsOKm(~1tp3fxzou4jN4Y>^B>Ob%rUM9dm`nzDTMXa<g;
zcSCMr5^;pZ&x1zQJw89gKx9D|onghn8&<EB44~mMc=ZZe0(yoD9exlb0oG{PsHG(r
z?;f^#r)5>u6Z*vMg;sy1;*7<d-V?`{k9r&W8xA$R@O6D{LJ;L>Gu8QpPr?(FR1MOG
zGjZf^=pf-v-j`$Y%UuhCwyMs1C9Kjfhla}#0X1zZgdtn^ob9L@weTirUkOjy;GpI)
z(3mIBD8mE;xz|=GS47ZF<TAASkizq<jrC3orLjp(0wlZ~cPz*&@au>4b=aYVSG&Fn
zNO+n@5}pYl;gKF#YY+rFho2h==lM?I4Snog1t>fa`Pdl(o28FuJxZ(VX>Zl<D48`C
z>r@U)P;=YvlK^aIWrhNT-WWqnrC1XD8D%_0fYSt4^h9Zx#VJUnPTl&vE!gC;TGzEh
z2QQ*NOER3#3qv6WD(Yx}%1+T0ewusi2Xe+xVnATTSGr}OJm4~#N)cWFicEz{N`u;x
z>#bxVk)>}TTkRPy74Y__iMKG^eJfQBZf?6O002?@#M_Y`%Q1$LzUN%ba3aouplKIG
zR_^UjstB?9vT1y!jURRr2QYZVC-ksP8Vrq9U}k{9`+#i`7ZiE(6=3j~mWaeh2@j0x
zAQ{bv4qotg2k*Uk>_L<};NaCAIe6V(n-m+4X|+kx7+RDfF_khIQz&Q&qm^I=ktF~V
zV<;6~Z&i&^w%CC&Z49lFt<QJqZq<u6pXx5T;iLp%s=fh|!VnNEfI$&D3%$}}HmDY6
zFH<r>SuRv7%9NClSj_XH4K$d5i(Kj}29zAv$3sVj!nYR033`E?hY3(T<Y0A61C)3x
zhu0{AsUrb}67^D{Adwxg$K8#BAxO;h9yy;)H9&&WJTKu@z#u{%y$d4tm{O_;G!>$B
zu0shbz|u9O4;XkV`9r0yUqz-H{l0!!Te<BKNwW{56>&S*5}WOaVw7}W-4dT~^)66z
zKVBx*+!Ou&@|PNi#D(^Shk6uiwdTx$p^<6sYZ>LuJfq(}SI+i-S(&W&`MAC&zxf8=
z7EUYbZt<W*|NMI^*Q#%2l3Z6CW>~JinuLRtG6tc?gbL1CJj(h?kbOSmc*ATst?N~#
z+LBL#4%B%Qli#KsOXug-?txGQ$MSvpc!S&s&Ytc#^(c(ePqUIUXkiSC1%qrn*}|Az
zYHh8s+h33oh<Y!z2u>?|RT?y5qN#gc>X#e}<0YIf^L`^uFduJ_i8`+yo|ae<drl=P
zPL1Vyeq77tTApMbc~iC%1*@r37P@BF9g;irh*7CNY6r}j5c;<m-gF1|C1ldYBF(g8
z_e!?SPHcW!$c@{<d|7bcBV!=W3f$RVv^kR@$Db1_LDXYqgt7_GiIo>jm5RbAjY>!C
z(|2RzU5W%UFl}92N#`vVmb1N+`~-^%i&%1Tcj|Wp!(Q-!g-WXyc#BKxhF&ihm8Mpx
zFjul~lW{gRFLRy9V_7MD^jv<oM7i{xyl~ZsnZI!Lc$NUu<J2Yt`wVZz;kCrP_xhv}
zc;bnbV|W?I_T%$CcU)+A8*_!5<J519J~3XO5N&zdWS~Ox@#F$5ao?L;Q(nGDHMf=5
zKvIL+4O6SZar$ANnL|eHbCXKy=*Igjyys}ddUS6bq)R;4J2NiPdwoVfh=*I0fl#WF
z7fb2Ndu#T7U-Pmd8K>IVu!)2_s?~|NjSNQNobOiADYXCC>ooJS)T*we!#r}4y)s2S
zmfl<v@bCOs?o%?C7fhK5IuPpT-8Jr5(Ur&Y%)m}g)y}|VLuL%S8C<lzV)>d)E;|jx
z*2su4ifdU}+)Fk;TX^rb`Pq=BI8Ng*iloPtp~@$hd_xtoNXcF7c1lnrQbtd5+il$0
zhI&c5dFH&CWpE~&(n5`oh+TP6GyXJiQP^{uKF0Top9Z2|n{db{%&Nzlo6JO0bZ<dI
zSw|a#D3vDtby=x3msCy(HkaVrg(Nb|<o9kt53W60*q#e5-rxK9=H_#laZtiYnM{qq
zpyZO?6X~2T#t`i76+AeOroh&ciCY^{@*t9CDUWa&({_wUzw#A6k2K51a^(z&{HAY7
zFczUkv-MKJz_XY0lx((`G46rzV^P@c3Y8HC{*Df^Uf2sDijZ8;!3*n!-DTy1g`eX(
zNe78K-4@OR*hwP^DnuCw_UTDbN$c@hiVy+S4;pBafC9YCXh8?Djy(mP-~!8~PtUk|
z2I6R(RbtP6JS`YR1+ks-6jNd$+YQhc>(6hCieuC6cEc$1S*=^AgrxI|rVE2bhAw+>
zlY!9};`tSaY{^$nlV!f5WKL=E$9MHgAIL6I8lZqKa+;kn-!8}Acsxkr5o4dYsUPG{
zoJT1A2+jSTx|aS%ysnI5wx}B>UM&R|7(H(*P|6>ll!_ts^$nG56L@hssWNjx@tFK@
z;ft$}D(|ib98;Ww$DHY?%=*%J?BvJ7{(u)=+56v)p&%LkXFQQ&cil3%C?TTUg>AF|
zH*&%o2ce@@r+Ey?C+B;oeO>z{^vV@gvI{7}fRdKj)PhqP>v{z2^Ev9r9%0F@(1pb8
zAUtI((89Z|azZ>a^zhHxRGjjsz_9xT>PmtJ$we>kNmLb{4HP_=Cpc1QP*r5yBxqb&
zG*Wt{s@Q5z(4>9mB~E_*K`8ufczwcwd`=KCr}Sf_DV#sPW_hkOFxS3v2mP$I3(mP$
z-ui89N8@^<3XSF_yB%%uSf@mFMO@&jy*(8ZBTD8GHWKY1Sv=l%<yD2y(s5_iiLqQe
z<Hr%HZt!z9uSXs+Jj%W#>?Wl3`c<xRRYlX9{RpVnir1ZVbSwz+78%*rr_Sj|n$1N|
z#PS5}E*4?9ZZm|fx>y^=!a!RRhx%IKmed9_F2}N#3t3%<Q&G0fWRg6KF1mCJmDD+t
z@0U*Btw}=E{2n@JyJ8e33`EB#KB60wY@p8hb}Z|`*<>O5&Fka~E$_9$PP$P=n3l9W
zOl0m5U0=C#5%)Q9ulA{x^zm8c12nhT(0fw9bb$_Uwoj(3RoLq*t^@QnW2T~UmpxY%
z?526*J%=%E$L++@czW%Eq(6mHdeC;L>_EDeKV5{M9Gp@P3!_9%i{Gj&dFzl`OL%Nr
zE2^}BQZQMI2HSesdZ594BzD}!Q3RZ^ox32sqArs<&>?*bCIWi)p=;D_UXu0O;<+(Y
zY<~Gg=dl)YdCB_0xcy|sOpOrk1>Rocj&KP1tGA-Ta$<s3i2K~t7wP<W21_d>v#=$>
zoL65!v3lh94`MW&_vP4yh%MyhCz*6{&tEq0OPBl5E`Kq2Et09#_8@$WV$%6_r24A2
zUrw!CBD#J2|KaXF`<e>cf6-F|1V}>fBtQUBdIu>9Akw9YNYRAerAjXWq?gb;CUgNQ
z(u<PNn+gaDigXna6%Y_9=5X)-z0cX_(RqGe!hEhZYpt2N=Jy>LO|6b&<hllvBrTlo
zV`QdG+dP^H)EY0pX8V0~3Vh4lrs}5anL?!Xe%H5hVv?q|d+gP_eYye)IC=SVaKh=l
zPid$VN%$eVADakhZtgjB+?u6Mu;|}Ni;{_aJ^SePi$xdCd#7p8rGu=<eo3CL)A0&2
zzudO|FL7m$ZktHD$ll%?y#W0c`m}eTH+p|lIk;#1bYBq1@^V}IqI+7ZYzOy}>os-t
zlD78e?wW?J9Z$uuE=zLx#(<aKjg$`FwyAiJ(d`c}Nq$-6xp#so{rr8VLbr8U@=uTU
z_t&#E;XaB#hWj=@%ZEu_CFMWK6sCH$pYZD)Vf^}hR=Ce1l~DJ%=ib3fq4WJIl6k`y
zx#rN^?{-0-+A$$FS3?wHqJB4o>983$pDj?@?jF7C5VHRj`o6ZFy%4AVGvMi$_U{j5
z`hTepz4o(TV;MLd)zmmNyLGxHH}F@`QSCSWR|Kk!$op<U<0M@8Z0nKcdB&(t^J=?C
z=ipG_ie~g)!JCMs%BQm<Aynm2Y>kP7akPqh#^=B946F)0C7q4ExM{Rp5|N5}Mvl9L
zQi$Lv_*a=5d6Qt%sCI3Xy|xlV7D(Rcrkj?q@3ewm?4dY}wmjuXV3jrj6+!p8WNli(
zE{<E-B4;Tb5`-OuQ_fSFUEhvlgB8>Lgp~)b9{h!Y9qx(M4VJ{1yta#@e?yx4ERJQQ
z!dypUUJ$e;s0G;S>COdK*{lR?iJzas&}i%+vz8fGOx(w{A$CGJdkxy>^yxwC`iltW
z@jAT28l~9rRUb4t6JkjGR7(j#WG_sIxND`k4f5xcGi~8{MJfa{7?g7#I8MJ2<k#iE
z;j=7bDJ8MOx(+i(aZkPggirMC@9JLL(5E{DeC!_;^{^J>HWbp*y$%o%swx+GQ=v6N
z*0uwHAL??x8cnW4WLz7StVf0%!(Jcja*Y%CigYDGx^mZ2!HDt<`N~$Z^?LYgG$TOF
z8Y5DdprJ>>I=w2`O>V%XJC{rTRGfnO%nC9Y_d|uX+_&P|W5LTb(iO=!CB9tY)9>Jz
zOAyvd;JI*c*mp$FY!*8SJQ~-QE!J&=6X(=7i>0etIjibnOM(#;+d)i$OmF442W6SS
zXw#}&`56tLk#G0bqymvl%PWq0n?8#%5|X;oAji%2DfE#b;{9g*@+OCe(AX)(NzAB1
zM69G2G6e4kt8-M&5aO?{Y#BD@;>9^!p|bYcs!pRfXtgsVC=~ONT+^`{WT1O4x+{B(
zsTZ3Z{?+$PobR3tt%}>L=905+jo*vaw&ov|A2t*oAF@Bwe(*rM-z`?{RG6On>q9L{
zjY9`m42Gu;pv4YQ<`rITnNd<?&{!t-uqMhU3!$%?X5C0ys^iJv(?K)yY7wef_;9*o
z;HHv!H5X$7+%C@J4b(NPrgWP5PK~yE`PauPqYu71KVtrh0*au3wdlw6O!G!J02nqb
zg+9d`P+aRKBtbfN%kND4#u=HZ>ITR`i)q}!5m6<{?}Da<dyQ`<9#y)B7&#OQo1CPW
zI8=fV_pT2U^k+d&f<(6e67*gG<U_Vl+paKq*JHc4KK#0}^M+@Z={(&CE>yZ^9r=ZP
zo%9Yt6iyU~xO19z=LZ=)K5B}Ox31vWGA9y%-bO4ErsA!(pKt>(>t;9GuLTZnrz)DK
z&AA000+fdde5bJpMVG*l7@qDss?!wx%j7@CNkax%S`1a%(I*TVa3XLU!R*8klf5O+
z$wFL=0f{8&`d4XgBNhl(HW>?(*VYZ>vs@PjUCB3j`N(`9cgOL%(vRDvz1Mnj30`o@
zZA<|-xs9wfk`6u{$P6eyi!0B60}P6L{1e7^wCNR9BS|N0rnq=V@{8NYY^66(HT%C=
zJ+8Lg*s<yS;xbrm7wgQ0`-UP2c+VgckO|UB>2B|*ZAXRC!>^YY=L89B37xg!vL*hq
zqMoL8nuxea0~U=f+Q+-*JB+*0F0M4sv0<u!(6hL?YiW`&_cgsiKH8i=ZdxI)O&ME7
zJI~@e0l@E6gJoCKo*_X5<#MAHYs5{O;)^lM6scTcNT9EZQ{4Ej026C>0knbcYrA}t
zk9j~BL&<8&;aD{ou;RwCZWbaVel@U=v!Q02XGFoqL67^8keXkol=tRFy{>r)9~luI
zd#Oe=YG3zYE3QSWx#ybf)HIPrQ7}hZQT(tJ^9+1u?B|iFcr8g}J4rSpnR!RNs_u!d
zu7o)8xBOeSKyoe}Boh{MtddaF<IY8Ue^zon#v#+y3mj+m-S}|#neX+d*@KMyjhfrB
zkt-XMlAijnp7UjyVFX9pU({;S#$o>s@p;|o(($|sv~T+QW98&|4?Cb&aq-scSTHS1
z-+PIA2zeH*h0E#oA6%|R9YU3gMEpEl`vs&+IMW_^^&|6d99Fo|@xmPk0t`+dsJXA>
zM2tqty)g@OJ3e0dFSUA{vo!awvRB9XoaVK@c+(A&_3t#%i)%$Sncm3u9$^-9-AZa<
z_S|u*4KUe5^?&Qm_iQiq>}|S1-{aXe+Hh?nPOY1gtA*IDmH?+pWjKuk*4^l{A-26R
z^~fdAkIbxPOVs;%j7KdN)M#bI^4AL14-zEM{m-SDa%30*@@db}<77e3fEB?VtT}e`
z<F6Lb=o~{6^;-&R#ssQAKg*Z(H5&<%-Wa%(Z@XkFPaQEQKc>|Br`ZN2u4c$LvJe#M
zvyu-Ve{bZ1ZTb-f4kD6<1mig;PNo6JM$F)Z?yP;%1MQs^$;$hjz#wZ?-z@O&W&$&y
z_Oa<&%X9KJ@x7*>H5&;lpoI0uQX4CDf1Dm|{*&0!N>CBEanjQgwu|$wBk(+`2Tx1z
z?=V6C&i?ant&Q<zuuT6oib%(59n{34SX;CeAIWevlXq1Z6xDIhXM7Y%fOp3*6f&*E
zdeNQ6pj-Dv-sXblEq~Mzva?@^NzI8S9+tB<mwU~ek5gXPoRV+J7Fi?!1;nuYzI5V)
zKti0_DFL{jr8%yx&!#IpRDw6p-!Xc@Xms#r8bBM3LR0<H`TUx0HC+k(NY*sq*GH(3
zqg+={DPvV8LnA3wfFw=F(E_5Cc1f4nRyg1SkJ2QzXr@W0!X>?NzM6H?^l$x=*IN09
ze$mzL1Hl$Dd=|1x^Vh}#>RUkdvH({nK=NDy{dTcN;Ns-Yf(x&%-VI&NZJ~OCql5f(
zZT)MzySm;Q0IY;=+mXyQzEPu`mQU4`rQH51p0gS(2|{CJ@Q1S7>Aye2{1>|2#rs6A
zb-BP6W$E(}lD`g1uC;sTvPzy4oSpm)#cmi~R`7Jo!fe`w%JfnilUU?TRxufD!(>VY
zv=ZtGQoLaK3WXm(j;3sM^_z_otB=}fJJ)y<488|l4(p@quCJ_9sud)Cj9@kt0;sDg
zIy_W#aV2%mDm0_Jt3o^!-4Z+9Y<XRIbjdRnJ!(5WRyll%MLf9gG5Dn^<UdgKaXg7S
z@%Yy1^GorveW#?CT>GbS&Isbx1E&bdH{QQH{iT!wQjLhZ^n+S)YY*bEcU}D@T?0Tt
z0gse|gO#4u1<2R~vVj)mKg9-d-u~fTVa-b6-;-4DXfxw1g;^OUqr6yagTuddMg0nP
zuKTT^*F`^kRb;7OlCs^>3elq7u~OZ};4QS1eBABs_&dr^?sY$TsGQ*1o$yFGG5CLp
zd5PWs3HC1NPJXJKQrn%<teo2Qzr?(;?zFec=^y@oAm-gWQ}m4$Uer=p?rr|Isy0oD
zwx(c*VOn|4c?v1eROih~HxIeAIblTBLM??t@+-!JM>$qZnSz@$9C{ijWJJ!~j}%w#
z>-oNNll3NZAyPqy6wbF5t2wOQd_E*?9S+rr>vbgdKfO6n!Y{zvC)Q8SJWoW;BUxbN
z>~O7q+rB1fpYYMmVb7HTAtdKD%8^HLnzR?KLgb>S+6qP(4zIZ08xg|=5$hwdt+rZ%
zzWtik7o!#zsKyA%ZA@$Mg+oZ3(v~)Qt^bWuf@;W+27|5|L!9g~<(q*~<+c8~-xoe`
zb<ORh*?~AT=gYZF?U@1H`SYQ-57iyKUZOA5-ehX4ZI92MYcG}b=Z$H1jm2`w6Qxgw
z;Qjrrj{Pz)aselb5&Cln*6?eP1l8%6j`LRoeyMZ~)A}v8RZh{#?P6-+rH}RbtGID#
zhJG~c-{>6@X0t0n0!HkjkNOHt_{Nj4_Nbq?jxy;euJww)gKK<z7^-%JR6rp)8FZz`
zFIj2N6&WJLBf=ehDVW{J(S?J*Gy$UX$mYs^E>3Orc?^Glf*4#&koSTIp?S43VAlDU
zXrw{p0Bk5B1&=V@LddrzqhEvnt=-Vw=15qpL<(+W);)>u&H=kZMD;Do-(COm2I9n$
z`nhP&)ySyW;gmG*55B#%Wl>)+x_k2!vN7aG`I1jQZuqJ!`9^n-f~DTKp!4e)Q;(Z$
z_~3312dQk|*GDsGkSTB#$@~{dV5y%KT>e$s*nEf2;mYmXCea*;&tI_ap*0+f#FxTO
z-;n03j8q-{k3xJoX6^JCw0Kh!YM9|e7y8v6$3mvr|5lcYhbQowwt8o$78CDRJ57to
z&h2^3gpGQQvDb7xj$oR$I%9l!_y3|5Oz{1T{ok0szOwFXvDw&tR4!&XT0b(_$okl8
zsm=XEXCzOs&*#3-KPQ(wA-?NF$s9^iyrKSIrizq;eQf7%!6&DU4!Vuk2ui;Qg0tF&
z;WbMfDzkj!FTqH-#=<kD;}6+q;gsip4ewxIo}*UKf7BMsVHPVBAUg4G9_-asuIvoh
zZBUr@OC1e|G+6gfo^jFhd7&E>ZF8y&TCs2{Ul{p<pkD3Ev$LtE_VeGTS_VM|dw7yQ
z77HO_Sf@o9ju$8WaCY(^A<5xiwJV;60xI@fLTeUH$G=sTW=~#!-p@QG-m#oLCHeB=
zg~9GT{Vm}GP?%`GzBuL@3tU`Z=cSU#C-*#x%V)nCqjQlCDIRvEu~0HPm7V5bUSurR
zH)GHBtp<r95Qkh{8f6+`xBE4qcPG{&({C*hYjG#bSGpo~dQl`FGfMX@U3J5ci9Xsq
za+BYA7jo;4#^qKH)JwWimmc(5t0GxrCB!^A#5#!0Dw;}NEMM9vIS~S%w2&E%<g^_r
zK~*L*wT|-3QYWivU(P=@#nM(Pz}xp}u3{6DrS3<U8#$Gpr&Zn2S6VfjAd*f87hR;_
z6;v$i@oWzY*Aw{ulYTAyUP32!WwE(A#7n;_L+Pk6{(0!MTLm|uBUPdt)7g{69<6-;
zkMLdcM%U3H9i&$Ot%o2X7x-vVk0Pm*FUci3mhWgrI!#wTzv@zkI=${5`-hdG6D|>!
z9sgTe$*K-ZW6p&Z$DvYkAdj}j#8GoFy(6es^*bg(x5BMg@zp)4R}Om&mDV!^TDv4S
zwWMXWOrJ3OA=!!si4;(nY+=*_-E`Zn^RhAM{#mT=0Sa8sc{FniT6Q#NtjQO&9%h;8
zM4KsmwJG}VXXR_gybMOIyp$u+R}`(MkvwEjhl8)BJKryZ*Pej6-;sKt4o1mac?l1~
zqCtFmMs@i%V4~O&*7iN>j;_XE?{SG63+-TT!&JXf;)M~WzaTs``b2v$Z9sVVq}e0T
z=#`o{Gw;F$MsoMk#9cg2Z}M@Mx=p_$?C(Ae<)0^2Q3pd%$0go{e<wZjk&t)+)^%Ea
zYb};Zm!RF9`5aU&zv12nqbT?I4^*4tztbVkFNcYSx#Z787~Z-lpVLPA7mD(q?F*bI
z(Kt!w;ZH91VGFSn%3iIE(R#B`%k~ZB+}V+EI~}dt4z!6PvGIg0D&ucr8=!!}O!U5f
z?5f2>z`Ykazn!z9hQstS8!MVFcYa7+m>Q~G$fThl<}nD%G!h9EcT3`d*`otDis$7{
zY_x)S?hDSOPj;5@Da_kjkv;eMPR(?|<&eB*mS3*lUoyCNBJyO{?1}<i)Y4!YWUoOn
zGv@hM4asMSUzgF=ET`4!WPOyRH+dTwuWzId(g$C<KafeBr@Bo=fA73iL{aLACdLg9
zjRubFp0qv{^QACZvvZL?_>dW)<_?@Is!S9VH1Rio2VD)<7U6uy@sCeL-KP72G6l`B
z2nwU+Jo{B4E2hD1TG|>EcE5)+r<TGa5yoc3eC@b1U6^Srx0!WEPv6Eor(7P5mmV>=
z?~&{`?8xgM^O+|B2{Rdvt*%Nj4l5?>j3aA+EfYmk$4Sm=@V}IGPE5OUKZ1wKE{wxZ
zj}otO%01Cni?5I9-K{?5>YLoJ1bghnb(O!b6oCw;=&?QI>t^A^$O~xvo=58tu3J4?
z58#RRj7^W~=Fp1y&fiNPcfx$XO}Gfd!mOre_52KCYpKA5mAUnpmb@rD0!)_!Nz(mJ
zG~=YMRLw9=J~6eic~{Qf@$9a|qjp@P^^713-}j*_?}X7J#ua8jOYQq}-D35~N@YJa
z$=6xiE_!dM3xclj&k2WYt^j)4pYeE~wl1%zaVQuR-HsHbuv^}8U{2}LdtminF;7B3
zC^awn?%F&v$1`pD!uj}-XB-2g>$aR*wTq;S|A=|)`!NMWdbSR5R@rtb3|AVDZ9h3Z
zdV9!|+YU|tkaOs-LW@K#BrO@VWzWTakfd+t!1A;(Z^7*@pY^f>$0Jd%o)O6ucRNR(
zRn9S$pUk41LIQjw&T-^_#60nmVAJk#eXGOlqGcyhO|D6^{KMR5cFs2*a!uWTf0*C1
z?0j@cIXyyL^BU#NifmU<bUryOURrih8ZghHlA#QZY!mGoaVhdt1-i7Np8d4BA-F(T
zD50}=(}td*i{-V&m1UlYKn|52=Np#`nAdU?BkA6$191WsRGb3b^LX~-x}r*b&X+Pm
zn@Q_D(vE4WMgmOCmbdwer5B%0l86k6{-31VO~otwg_x{Eips&}q9(kd90!Yu?MGWr
zyr*kHVYG2~AGo}B3&Fe}HSJ)wj>MW8t(R7@|LLAE_OO7$otbyFpT5Mk=PqFEau#XW
zYal79)=cy^Nw-?kW;69iwdio>gW=0ncI?GO(cG0g3SS)`=G8ggK}+j`TGx_78gH`y
z&>c_T(EjKj&ATP=_ORzQi|0iVg_e6`lIrRDKw3yH3;z@S`m}=?4I_5?e;F>WNs-uy
z#R_nmOv0dy%F|aNfo%Ww<w04fJm+HaFM1(kEfZfHvmWw&zkg45!mLbo*gux#09L@(
zieZMs%f9h<0AK&9q-hC=g_1@F9pCa{01O)PEV(Q6Lrh;XeM{|kA}8=B{r^rvcy}dB
zX`j94S`8V?w9c9H2xO7w07xtX8C_4_JaG6-C9$X_yjnci9`2O(W><ilZNP!WA*;MR
zbEE?jYw*1CK<QPRhI*d+U@1*BWXdrLs$zM;%1#Q|ghK!BrpvXiU<*7VSfpnK>A$w1
ztwuO2Z?6W}igP+9Or&cIuYOn2lw}g{X3nr)-Msm{wx!$Sr9k4U*7c)cTG3y1Du4eY
z=DqX$ys0}pz)wN?NI~X2)C-W7&81gtY=A<rBz_2mkST>Img2??g%pHR&XiIKdxg(Y
zYC@>AO{s2UsSIbRNF9y;OV&g3ZxQ+46M3gGJlz=X@^!8hJZBU+jW?FN4h?Xe;af)X
zTbV+;zf)yG=yLXzj*$G*ct8Mz-GIo#kA|GaFplHsn_$3v6kQ5|zGolUgro0`VHl5L
z+>QaA#()7BCjNCMX(A&R9{87xacK?MDox)rLq8x59G+p=K|xkpSW$TPly$B;BJVOe
zG#AUn<418o<m<*?*;+s-5!eR<rl9D0V;JA>GpV5=LHiIEKiVr*uO3c)rRpss0gv`M
zDtv)lMBoIBMX8mAi=4#(4|#^>W1nS;X5vH|^TV^4C9)WraI_UM4BKlgcabzqX8a_R
ztoXtix~J=GwODY53|GMc3mVT^N90SB<{Zo7&GX_+C1;l=0_9ri3(YtNS~*_RGbgvQ
zre)Dj#DJxdY$+I?!B$=p6HJZ)I!(?8#ejNov>y+c4Awayvm7!;&}9sF6rO)4h9Q3q
zSm+1sSr?$36VjY(Kf}Nb(GW>l;37&O8pE@N9^XeYf6roULecHFvZfGutC-*c=AyU9
zg`<fq+XxXeX7+M4-!RkU8IiA?oSh%TD4h+G#<SPqg@UuMH)Nxi@tg)2aQnVk<sAQV
zqo@q|waOTf8lH2Rc>SHZ#B(RUC~}tK7xbLu>{aH=`xx&0L%}677E%<E_x+p{NmhC9
z1?x6S<j)*$8uOOUoP<<1$Y7nThFMz3LKaK`O<8B^MbVui*y_kdGn=8^<m{&~VDB1J
z6h>H-Md7(Qw49tJBa11DTtdv0U)+L0W}Qn_P9Y$G_X|0DaW>ck&1dS$FDe79hJe0c
z8CM~!G_CCAc&LCJVHwYUilSS@u{u~NwaL+aMzUqhvUFnt;V;<dv)EJDfZa^2bgk?<
zvjF>6b`K<56_!a{mgQ{@SPd_5M~={qXB}^0jkUN*DNl7k&fc<rQ+tfR9C?F@8G69N
z>-Sp;mc>2#8<rZw06<F$u)dteYxdz-aTbVxY0gRQK$1A}U;8^=el#6FUP?59#}a*`
z86o!!saXpbqX}Svk}H#@c+~`eoaAcSM`N8x`Ylu!!c~(NscV|Uy@;dtKx%UUpiyW@
z{W}>Xt6>W>%ZnLBrndeoEMu~TGv0D+5H-r{!ru?O`9*-|Dbisd&+c}>ltOMepu=Ay
zCpX4A&`ku{<{G*0@jD2oI$+v;DPA*=a_UtpY<uaqHSzFw@I0oJITkPo7UY9<m|x;q
zD{$<&vF53jx{*V?oM<{}0X@%3+GtAtq)KQxQeKlasGn6)OF=1R9mp?Wk+W&x=Xj5=
z<{n92?hKI}i-ywTpC6&1;s$7)b@(Y#kK{Ja8Y1?63r~e3*aT5R4N#)<1V%3*NTUM4
zML^MsNmZW+Fj(VG8UhS2DD7jI$}O$Xl~-r8)De{Y1_(`}fIWBv1ji`t5pNsfp{jS4
zi!oM3l)PR9#Ro{5s7mOHITVFaTvSkQA_6QCEKYF_;8<It6TLZFbehc`!zMV7x2ARH
zM>+Asb?&pcaI~P9&(`^w*I!)>9@KRxy$BMG>QKa?90eR0UA1XW?ka=WmFm`kmKdci
z{Da6!T@C>-f5pSH6Z<}#iJuT%1jc~*L@|wB=`@hRy^^X)QE3_G=;-Jr5bN5t<%o84
z)3*{k6nFuufSzr<<4w3tO7qQV0l9*;I9>1z5dx5l1*jgLVKT;Ep9q8~*%H@%uL!?o
z0%Q9X;YVcT?P6e;;roeWs38}OuoA1uQCvBJDRu>bwfNy^`gxc=c%Azd8+X%{!bt?O
z6R+4wf8sjKso=5q2k1VY+3G_;a4b&~;g0)e5Rt%WlI1Qy!ApUrUq&%0kOL=Sd{KWu
zy?BO3GN=pEA6mhuti;#!2gHtKX++rlBJ-^!0-J&r_t233{Sbjz)=m`t10wV%Au<xp
zeuQMMSF(S1b%jcR&#J@sIfCU#fKMLnYk_Bo7vfrm(XpPyuyp&Ax)|nyn3i$OFu~X<
z7~}%YM0yZRpTw@nPt<bOh7!o_-=UcvA~~;<12xuR3><zE903YSkZeR4c+hL-kMDWG
zlV;)*p<sWgAm1bzP?kLr%AxGi72k#Md_s(Rf{~5;06@GCO#A@V<M0vCYTqS9d=+5T
zrF7{3+RR&3v!?a^>^&5Yr<#OiI1-@q1eynUhM$P|AQ;!Fl5Nl$OExS%5=|fRCzJ9o
z<cJ8MK(kwsi6VnVdr?t&v4LzwS$y}Q5d>fak!JWVjU9?98^#uarv7OS$j0zTU^2n6
zxyCA7XBgUS1V<8?Q*bQfvZc3Qs3<`I@RPtX*BNT41P}?Po<p<0KL&B<+XTh1k{n=s
z1T=g5F>I0m@Pg50!=mq@==JbaM|hhC6*@hlVjZ5o4k=cQrp^}NYP4pYUxS^7FeRb5
z1Ic;!1?a30G}$l@eI!j-F!x3`m56n)+1&!6K@JBLlLiv~w<q|Pb@|Q`6emy)-N3Qf
zpd$&?6zia*7)1{ZqmvL<Hjc`HEBZ5m`tTI<gERBj8a8JQazPGUUgLg1<cKbG{H2_!
z9afb?7EQMl+-Dv6p`-d?F%In*d#jhB6TxqVV39{tZ;|Ia7v)RzWL3|m4upsTo~v}O
z8->O}JvtATt(j%50T)Q>y1T)`$V^8<idY*}HW4b1x4jgAF#LT^+6?nITw|H;c#b~1
zngw^D4hq4sfzhGO-fNF`7NOaMoXZ7{rghx?IpF>WXcAe|rNE0z^ou8G>fK6jA+0NF
zlGYa64#hA4iywBa!D4#cceqO~iPUrC81Nu<6UGKF(8MuYB0%9$ebRAv?ZG>Af-uI{
zvl9BszrZji$gqp*qW~ATBAXS8>EpV<ixYuZ0#FZKS&Kv)lJVkVQmISY$87nHcsg!;
zdf3C>*HKbg8Qu%k;#59^CBa@weS9p@sn~xaF!w$YzxFtY{P}8O^)H*IOH8poxu~})
zVIi#J=8LA_57eNIh&Hw+dfxVlzV<ueqJt_SwdmyMYcLX|uuVNY_qe!ubt%3z%pjMx
zriQ@W8%8<O%iKghd>6sVdJZ~LE`w^hZk}OwJ~j#WGnf+rdc<*>kIhoNLsPax(AdD_
z<#GM>(CGf0zCyRi^$yKXFYc>MSs)X>_2mmxu#aM=CwRFE);I)XX@^y8Ib;gay>Z7#
z>N$a{mh`8q7qG|Y0_@1lzj?m)IKJHlU=yA><&)AJk<n^xY>L3xx#pEa1R5YpIZFI5
ziGXFoxCL?O5|cp;7ai@Ner?C{j#p4uk&E?YPVN#0v!A=PdUZ*hm*Vc~!^C3Z1}=#;
zm+PZ{g9uM9VCDj}4ycFTVIO{Xy?w+te!mAzx<s=_;Kmfz$41oVZ}Ghr5~QQGXK5k_
zQlOhY!@#flUs#Y&X7Y{%_?vhLO-IqIJSH-Hd|7evRtd$s<y1QQy4WWDevbkV(AuB6
zn(HHYgBbl`^?5LLpc3B^OE#2ZzV>oj|MR3_*V^U!nk$lKUjSl27X6ZQ3am9H6~1}7
z?ifh~?4y|sVAJl75H)hy&j`l79xAKj*LV)7pgNyr7qkiAcF^x%-IH*6&RWafNon6k
z_jx9?vix$LyZ7&7LliZ;U&syQt0}@mjsxGz^{+}V-wlN;n)A!X#l$o$5um4EFV}az
z+<eu1{@wZVvFD|d6Cr>@=EE=bV%w-SlF%8f^K;@`tDnC=Lzn*rldlAyqp6$l&`tz%
zx%x-52VazUKXveN>+(ar$hdXNw~RIT1plo~eHKb2GE@aAJ|@yfj4Ht;ua6sYRqQCu
zBTc-7nA9W{bE#IEGggoh)C~Pp5eVj%BK{;CRl?t;&qYn)1JI}eUq=EU5XZ$YxZV|Y
zP{#YzbMZ6_3XOneRR3G=Dcuw+p|v6mX#R^r_fR#))Ou@EqaC@Oa8&Zh!%K`!V(1S;
z6q6O%)jvCp73^|p;AElm58XZfKmvelkh)(j`{FN4_u$h!&%Eng5wtQDI!VvGwp*CC
z(acJKU)Jq1Qz%&u#fa0P+rzq~G}(8!)6{kFWJfZ~@p|Q7k0<o{iY7I7J8w5fu>a!o
zl4hqLnsB6soyB|w+ubR)bT{x9xFX1uiedR;>)Phb5yA`}=9^MUx1ehby=F{8WdqIV
z9M1mY1r)CG^1}Uk>tLeV3zu1|NVl9CBje(xo{M^lw1Frc1MAl8N$4|9_MEeKty*L2
zvsH#A8tJMXy9<rBeNhsA)=+q|c?s8tGyY-kNBq~{{XYA=qeC?K5SOmjbNFSt<WBBA
zt@6NPC83RXA9__acJ!0@P1JgOkq6D|WqYndTzgTA?vo2NO*#*w55JZ){kl-m3HAG9
zC{KcfPIu5`#T=UEfgV>uNLf!cXv~AHH7RUFv*Ij|f1{$_XDO}6b4SrSBnf5|u4<r-
zn5WQxhO?7|yZ;7!(*8R$SE2OJGDlBvfzxSH8GqE8u9|NxSgQGl!EyBFucP0#^6`Zm
znG%z5*^G?I*M&*!BO^n}LhGEYMj1n=mD5<rOGks$znm875|NzR4yFEYcDOZ=%UtoL
zK5NhT%WAV6;@A{@uf7VZ)=ZRQQ7-_QID3iuQbrxPz>pF4L5h1#vCpJfO>)xQTgAHv
zak|h+96k*x!+n&%KiSVTt!})PZOGDFBr|e7a@Z!FYmw85p4)idEKzk*{$Nzv+VWi@
zdzk#Xp7%t@nTPa6JPDm5W4zz?n)Q=q+vd$l*nz2<wY9l1i=9c<xTN0xJNN#>H-?Wq
zFYPw*0jJhBzjQ7U+Ngo*>Ua4B05r{a5ZIt=$X6v6_XOEgf9B8&VER^rj9jE}OquLI
z9c>02eC1*9Jr=N)7EgG0+n@bh+fKn?>qRR2LVx8jT<UBH+@sdH_m<U;;@cgT-{NV3
za|Tkc1K*iwG6v0?3w=vx?@f0}5dz>1T9K_}_P3?+)(%+VQbM;}gW!1^Bljz&vLvs~
z8LcU0#L!6x5)G~#k&J5Ce0wurUM3l-t~q}@<-Bf6KLrU@5Bk5wywI=5Un`%~RdG3v
zYE-~TG9n)VcPmFUT478^3xAd?pQJZvu=@8{9Cf^X#4%;u^;xp^RhaaFynvnBaeq#x
z=4Ss?+uMIh*?JoBFk<zl1)?eR<m00&F>fXM>TQ`^()pH0PkAG0v%6TP=x;o3FH^`^
zUf{=GqoQ9h)Y=GdB=7s%hkjL{7W(s3p5|i=wNxRRCqgccT?efUM+w~8orz_(Lbs1{
zZH29W$I)og4nk6V<8$OjJ{#qz74u3!FSkpPC#~T5WuXK=0|6Z`H+cQ<5cHf-6sbo$
z3<LTl>4;Y_-LqhnTH9CX+t-2)A{3`p1{uz7ykROB%@F5?r`jFSaCB^sNF}tUI?j_e
zIF?#($(FaKxj9v8=C`IPHu<IdRBiH(SdYp-p3QKGujCyWA5-5r$nX%af-ye3rMWws
z7DweI1g0CkEz6wcX6XbY(drwS$Yy8gYzfYegOnvVb9@>r;Ycxk^9L`o{lveB*)Qpv
zxcFz)!#CLyt-<0E?kbm@G>mcuneCsM-TAM%2wafIIfRh`{#}cgRrdu(s|C>hI~|lO
z@XK(GB0{x8zN(lUOgoCS6;21%$X2QtyK}P?O^Sb$n|)^FVPjFWI4`2~lFr0ArLF9B
zM6GJ7zH#J>oYG6RZ<^|`x1KH*MW6O+WCyt3U?kgcBk`gLQqP^(;<gGJ<7?_94x8zO
z4Y`WV(rsP*l39>XTNVHQZ4H$(qu?m{vftugRr1ky64~EXGo_2&lJhW+p0mWO@I6Bq
zUbiS5wWwzH-Z3=WeV6k-;F-cP!8o<vs2nI?f1j@g@|_^loWkZY5<%phIf&z^JEqyj
z#oH_x&;|A%Q(Gd&c)#ufU8av4EemhREuXz_s|kAUUFK=GdKM>-iv!4?k_*nP$3ykr
z(`|3ZI|+ZHYky$Xn$*1q_8~I7)lg(CcTTu+^cKfWI$xB(ZggdvvL4eqd6BCw;i7Qk
z{+lrN_KI6H?oyr~SL#n_I=m%(So#)6Yw|lAUp9IwrDnW&kl$5z?CtJ-gY;>g{X@^#
z6A8xr@TIRS@7q4*i3bJne4bmW=o-jt3~@GGnH**BACCMLFnh!PcS2|Hk4vO)L&H_x
zzEaPTbA$70nDsFG$@9=MPy1hIRxaHR&D-1GZ8;j>x4p@G?(=!a`t~@Tdt}J4!3_~r
zle7)ihL90)pVrie44a%&A*1q5t?7@_HhI5?jH&%>&5UN)g3*VLE1pOvtJg8e5x$Qb
znJmiMA-Ap>hE7^Gy~t}$`y%ccI%TJum{qc;9zYJ7cKZ1tr!VcRe8W=Hqz;i|(r>f<
z>^<eQwV#Tb={?rB_}A_+0hwH>?>QPnXW}ITGY0Hjeh{zErsWqTGcxYzk$#7~eOO4z
zs0O*m^9wQKj%zDBDBUo*cSgg18k<R;POGUGw$Lad&o(^c_TzqqZ);Of4gcp|yYH$a
z;jgGw?aX!`lE|o~k{YTL_bFUp4m8(r<We)OJ1QTz1_Q2*mHm#`FwyMem4}g+K4Wx!
za1=!QRyPsqhPda6)8+}j9He(MT^A@U0R&f*=Pq5w3MeC2`hIo|Jo55{6rq!&xB=Wz
zocr-(bRS4QA^1O~2`YO8%FIh*@Ing6^Jffj8i8TCAlr2dF6Qdrk6~%lPxegwNcp8E
zmIiBfnBy4M>f-%a1+tETcH6Be*Tzn*OB|NQm3|BP*E5uv5y(o4Ar%8%-@tLg(<;v>
z>2G=TF5DX4ukuu%3YQcC){(h-o5ljK!H}c(qa2)0@g;{KRXJ5YKeYzlk&ha!Q(5GH
z)GhE^^|}eY(QDrAVF(^=1g1luEYPI#lKLiM4AO6(;qoZ*uuu1B!CsERMmq)SqPOrx
zvspj}RdQHWa9D1??i!d&3Am;=H2k)SF%U+15QRW~VtdO_V6jgB5HY;mmVPo4hU4x1
zrY;!sIoK&TZprs&jY7inu!+9N)^wWw4&jGqdpsWxare@N8<jKpxT>J$+-8Dr-d`Ry
ze@%0pe|7$3`8%r|CB8p|xc{8%+~g{Cam}gW)A3V)Po6(cmlRyBNb|YMn(SK4mwlhy
z7@sdNk0=C1dSZZILCBnLq?azW$r}0oNfdO^dAT;K<^ZrF4cbJ};rAgmYmE6VhR|&K
zmol+()@)OzwBpA`Z-=d5<8jKJu3r)y9wI2<2#@}l=z1l;UoIj3ivC{+7}{#a0VP-G
zW9rs#@nme_wbFj_zQFq1)bKU(n^*giC`R5>pZ(GJa$U;w+ad56FaE_iKRstby|_e~
zTVfkRNjcy?)GcmVkadiD(6uDdyH)`T_wI`(CR;n2Z9BZjhDlg~T7w<4>Kw9@9C8aC
z@@XBT5Y#y5@D$n<tx*PFSW;tFqO%;h9VNu=Ah>allp>#Gag|rr2m^JvrFLBdC2^+o
z)g^V2CGaCC?8j4w3LOcfPntux|DfoE$FKU1=t^UJr)OzQW7Dp#NT?xFyX(?B>QaZd
z(|@@#*7^c>Ptw0!b9_tXxe&tL>Z<@_rq`*=*!gCPZAm{aOy%GAymaw?AHy)|>P@1>
zl8a#}^|93MSel8<e<4`<2`u9hmTm{jB$mZOm&M|q#c>~dnUuv?<iNv)Wz)wtj565M
z(2*_Z9u$gwLMdEZiu`;;vE+7@u0pwCnr%tu{M^d5D#27CG^a5?hioLL=OpK5va7mS
zcC4#K?mne%Xl~U>&@HiCJ@>l?6S>)nxpJW-hLf>Cr>`khvtYw~Ug=@pM=kW?bYUR2
z9QXU#&Ux-wfc2IygSjt*{4=8w5%))21pz(z{HTJggaUv40<X{l59)##F_4<6Ri&$2
zbSOjkQh|?tVd(wTq=|x*`)+COsrPrtcgCHLXJ|l<+-PZP(Iak`7rYA)z`)ks->^7?
zp<*G{ROzDp<Hf?HWQLx5dG@+=L1HBvrX^B|CGnjl&I=_2p(To9rTxjNqg<tNilq_v
zOR<QeX&AcTS!t1286mm!O=#JoO4&kD>2Obaqp4A4pwrMAwH~6l63y^^iTj)^f07Ak
zBV_g4lm@*<TVEu7lKk|HOJhPOvrUCmGKNT%ynU}H)VYc5vG4>Xd2c$^br7Jp%&rFa
zg@6Oqr$eseX+50T!tf_`_`C`H-LH858Jr9qoi7BhqErDlp#HXx2ixETQ(T0@DozS3
zZuI85*Wjc*Dmd%Yg(r-zPHY~*9I9u_AxsSM2zq%-#{4zfhBfezDdWQ&`U?a+N1E<@
z2CU7@n2=L#3lzzari;{zt=_zw6H}vKStCegA_c?w*`$skiuh+Lbl#)+3BWPw0t$oL
z$-r9e{Mzu3wUjosnCnh)leK<lwIlI$$eOw*swKXr1wl2=S-Z7~z0QT)wYfG{`Nhtq
z+&R%<M)1dAYg2H!E4RJ}3DSoGm{15$GSjybH1egXGYE7!Sg;-n(1W{r$c5&+8(y9@
z{3Fo0Kp5Kcxqrn_-`u*ZzXAS@qHk|;+N!NTz6!WLguMT#J~3b7U!32e4+<Xfv$S#@
z`b%*g*c5QRY}4Q#j@$X$_0;c^O=@dRUsRnBCku9an>GxZ_6?lQikpshOXmJke3O2h
zS?@?O)$G69{L7=sTcP>Lri7-X<?d+9+V!g2E_Cxr+>N{7M+n+JEZxi5hJR~}9Uo;k
zaSVOeueU>P)xa9{_Fv@B$SG#i7YB0_XNvC)gN<=&N<zT$u~^APDa{5oGiJbz#aO92
zl|54<s=g+3Y$4e>$q@)N4g^-28+PQmcW5MZ)Z#kKQ&a8fTeaCc9Su7>-8xUNJGqBf
zdfqHJ8LKb@blDm<d!KixKko9pS-XMgx@q7P`KkGfiUS+#(}pmm2PnEIM+rR`ul`qX
zK7w9$Lr!H%NX`?YaubC34z9tq4XwA{tD=6?BGkDLke{ascdPkr-n$?T`c>E4*r)zx
zz9ot$rx8)~Weo_VcVwwC3hC?YwKeMh-X{g<AA$Ef8TJo-=tJc9^SAVyf9fBle;Ih=
zWp`g`c}nJ$q_=qU<&n+Hx8WUY4KKSw7?w*iKk)Q>rWTfpSpllJVGY#)43CR6!*p+Z
zu4hk)p{K0pRsDAd&T&+`ri^-!-mOjQayhF~)UAAMN`sqp4TK)OrVMFJ`6L8b3V%hZ
zT2Q5XFGnPN1WwIYiig@238pc?y#}X}2L<{aT{{N(O|SI4A}OyTMUf$Kuc1AIOm_vm
zvSPN7T8nyr9jtUnp>s%nc}PPXgxGs|O>y{!-LR)^_Wn(yg*C+nGy}7|$lrZ{O$@b7
z8@+K1H4#UZ!(*iu*hBIhy=(z{do}hKH#C|lP`T=~!hrG8pewR;)>`V%8ujto*i5(j
z1pJvXZ&hxQmy%-khz_;<v+?f2vWT88sgv;#k%=6y)V$?!#r%mZ-dB8k69sz?`2LAf
zHB!-Jdz@lIhtb7zb-T%o<)Dhj$xiFq=XQ?Gc7v@(Eo0JVj?Mu4zud}OPaCtq6AW^d
zCEPU#TKH&2z#!N+mUnjVir<;~bgj(X7o?F`N3b$lEPUP7{rWTS@OXpKhT5AB>o+TE
zj%!{Ouhb^~L+1hB?)JagNp<}uO`|{U@YcO>)9CGL>6^pG@w1DHOCv|JvhgVTY3<#+
z#I^DRS&+>P%_D4YlNpV(O59%@{6Ave<!mVg;CbE3tnbaSb%E=GgU=V>)IJ4y*<4rm
zoaEOzX^D4ouhX4J=13P5S9%_!`a6ZsbDHVzwAA0E78lZ<jXO+Hb~U`y`SA`>MtUdq
zd|rOi!PvOgH1buTvd#sL+R;UN7n0N{1Gel^KR0E3Zpad2#PVaDyU7C(VEiG-`-2O%
z+_+_w1rLgpcwgfOj$-_f9XF?%{%Ywj#rp==9k0dq<i(Uo2Yc6w^h;c(@vE%Yi@7gL
z^SyJk)pLrCC(_bD`^Djt!wU(QCCQOXUhHphd>@?^J|2Ga9|`=(x3{3>1T?EsA8i>a
zVgYBwP+eJpcMm`|rrbj<?S8U!rP7N`e&F3D8VN_bSw{HeZ-8}7)aDwkbqwHOru<GW
zUB1O4?sH*#ot33D%{<qe%EotJ7`p@WR(}7fY%0TJQ7ik;SAH9>CPuDqmyuTe`c?yg
zG*|@an>tOC^w3@7m6OYre-f)?{A)XgYk-V3c-p*3#3w|q;p;M$9LP#B3xlyVb@J4Q
zQG0IQCV`8X4T!)E2pZ5i^I?BZ=}*kSKU10-0{9nMe(U~vuH4EIU%@2ngs<=VIo}pm
z9Hhg)*1ptH+_+^}jyKlWy5+MKWHY$;eChVjElbdrRrzFn={h`KaAhcT*hr-U1z3rR
zvOK7IO(9~$tzG|)CL@NY6-Ad3plS*fZdentWEPe92N}A6{9dC*X(?JuFN2Aj8$ZZR
zA2eJ0Y|YW_AS8D(H0twwc9bV6rHXd)7}v{ICQ5u})Oo)OTF&~EkyN6)H%y1XzgV>2
z7_dxAQ@3L2M}O3}ob~uaK$B$3D<~jNU!?89_kS?}3ly-FY)_D4yFQzaXv*8D3ff~~
z&?C^*_iX3=-o*VMVxIf`U4beZk=N>>+A4qc0qRklj}XXFi5KusJVeyqq6H)2=g)tp
z$YGH1CU#lq#h&yAEm=SP+eS5}Aw?GmU@_o_#>)0O=zoiO%`Z3qA!ldWRx4@pZm6)m
z{E#?H)s0~sechem30XwY8lZ0d`3DjD1s1-ur&s}cVj@T`wGF_7WR-=%L~s!96Qice
zlFz|^#k_%4&R<vOn8;f0AQMWGjLQSIM=1IO9QCOEfPSChtuWQosN?&Zzt4Prll|(c
zpUbm|;o;c?zww}hY$@!SEP|Vl{wwC)X)%Io^q}_nSs4vP6x!FQqm8+TU>mKdWt8}+
zO%9z6ZofR3U=6#Tr1{;@Humh_ugRzrY3Aj|O>mDiwHpfXXTPo5mWDy<PnPyk*#C%m
z(1Qq)`gzQISS}r1zx-79uI2hu!}g5>h;|=#FTfvcu&;XU=j^9?(7noyKPX^>rowZn
z^Zya^%s!jn`CSYZ1kQmqE@whb+Q4C0+PWqIv?)zk47J%EK~&l-&mC^H)Y%Y?qrj(^
z{}uD14A1{hF%Lfw8Z@Z<vCFh#Fx2|c_<zJa<^^=o2eU1`<b&x#!J@f`{lVA&N6bTj
z`G-IMe~Nkfo^OVW{pMO4Dfvcrxvjj2c0nlaP5JjYC2_lj|A=`$qs4dsUt(U!&O(p<
z>-HlhuMg9HXrQLZl55_Sx6M|3%1wqT#qldKFY5li{r^YIYv4x=Y<(DBRd()t{3ZMT
z*rMkO?Qi#kud+sZ-8Iw0-^=WJ{AU~gx0qK+C-tlDi?M>m!YIi(<=GzN$(Mye9e5}>
zmEhMJ%M?i8_E1oLdt!Br)EOG|UomgKY3fd;eeTj|e&HZ(6XAoFAH3S*Y*Dlvbs|6|
zW5FA@Q?4ZLC#}PT{&)xRUonq0k-)^3GL~(M4WG!@d2q3pj_z!IBotJ<P1zHA1{-fI
zn5Ux@=PhtDuVB9aKVsgYBu9yOl5*k7DPU@Fg{YP3YdI;J6`m6Dj9WbS;Kggjr;W1z
z5%VnG+<3U9GlBVv+%PH>C%%5&bs{rD58vRK$Wq;19L)`tw~(&3Yv;UeYFH58X7V2~
z@7?xKUYR>_yIJlf2a<PhaER+9Cohl+WJ8DUSh`9`Tip3yV%`sm4mp!FzhNFNEYIy+
z9r1NnVZ*aEIMl?dwL0^2ZYz}zCheKX$Ilm6J*+0}rF!(-?mtqXZ*s#o)14-q3)F0b
zpC~;D{r2VAy>aZeHoer@;+HZp*=K;{h<UjY9^0SmPANK%k+DyMuUcer@f<!OrD6#(
zBYJ6Cvu*a7)E@z<epkhA3*Nca^GumP1eI3)5A~O>{CWr?)+?}LjT~tH_5Ss6sKrK^
zhJUhfzLC$-?KOK7wj>sHDi1+;l%UU<dvpb8B+cFnSuyrxRHkz4{P5Y=YV@@AJ+F>0
zsy(h<$zfNnbj-FpL(ly+eKHamRgzGx$r1aSH!<(5M|$bZO^RKGed;#KM*ifsWpoX;
zcy~OnDuP-4@%lwY+Mubc_ZOolVys#^x9y*I(zr&}c7JQKebgU3#}iZLM}hoFu>Gc9
zH~39e&CgI|;x-umm5YW>F(<FoKe{HL^Y`u9^5@WWBc#}IW6OQ^YU|09Z+yAkzbLE2
z-$Z@m`@Xq8oF(IJCX(gHOdgFt>==u#SqOi08Pprf9k+K_)91Vl=jr&wM`EqZS)C9L
zxkXRIUW}q&I~C%vAPllDioX0NKu(Wxf1oFhp%(8a25^SbBp%Y_Eba~R*r}8t#L+42
zuV$`}cC=a8t3grmMAlJ~8-?a!b)tweg**MyZO+AZEs<=eX!?i}k^@c5(he0yl4T4E
zp}i&9Ij%r$@Co6xz!ViPBlO74l;!Tm6IC5Y7+QK%qjXGHDK^c0!Bk7~G5!f1wGewU
zElrjPMa|5!S!`gdJ_r8VEixeXaX2M`(npKD=ZA3?y%*|gft#<L4TrYQP;h5=(911u
z1pYg9x|Y+yD9_-;X|uL0Ige4cnQ`EaElrXg^c^%gnS<Twhri_P$ssfMi|O4Qk@aw$
zK%GeD7&RtI-Sp4QKXL@Fy^Cd@)HRN_Zu2@Qj6J?SAD=&5$=}{CEGhZ|*r5Ne>>rtn
z+@^w28EadL%KfjTWeR1o&l5SpZ=D?YcK?`U#uFLNx%I>czk=a>tOb$du#*37Qn$B{
zNGN5~?nCAa4vuP@wu@N8L0F0~3j!rs3>mewTvaUPHZWL*F4M&cdWAbx_}E~>kCF<6
z)@is`EZ%9y9#wa7i<ual>4Ef6kHUtKhAbiT<s<UZe+wzhls0JPbhc#<2wL17y;_y#
zc^3LFC(NJIl7WWFF-_R|`=4DFE{@U3j(K{@qt=C!du+{hHyZ4|$6NW;u|4%t$1QWi
zGP;3^&VeJV(ix}sE*4|mbE&-q`BG&Ex!Fa-He-~PaY{uBkK2C7HlCcyP|G<yR>{FV
z^SnjkSbS%-6U2-{`UIqoIA|cc`q*gPMzR<;R)*U<p4{{3D4^Auc&zd$DL24S*LKTb
zCn&FR>qknmeUH9*x2lRyP(bzayqI>`obem=)1(L4X7~EVQ%cCTZa(}}ef;cqUNhA&
z`f9$RL>aNa!h>(E%p0%Q?nS;<)=5}<+;firPG||FO;a@#PasaH*m_FsiO}3$9D-`R
zj=yz}aon3zzEs)Sb;e<%FpzUtD#7oej<_nerBEqse8us402fc+@Q4h+A6qNC*`ePw
zRz8u)d{eGes9|eNE5Se4Hg3tU{l!H2Up;|u73DW-w<gR10fo_8TOCixW$dHUB*BgO
zB)YqG+^Yf3;@6*ijgPoL9Xu*mw2+{#sy)hj=bf*06f1n$HwjAYzMXt-#PWJ$X*N@2
znM15(@Rnu*q?8lTz2Tp!vvrz)sh3CYF}RzLS-<tr9xByl<cKOn(to;cl>Pi0*tyZ+
zeFOV=o#9JQ@KYPF)-`z3*j%Qy5jh<(-;mG2Pxbb)Hu}eKM^mW!k3VO<PP1vL!n=##
zLgOhuK3Pw!eNy&a*W%N1Rp;XgPU->_3<G(6D*$J)aj*PM-`Jc+@T)JyKG|OeZ9Iw+
zIY!HvU$9YS09BNAfhO4a63*4Lgb=;ImolzH)YeV#aW#OdZ#*^wcJ!}XS50y>ynu9b
zLlk^Ctoc6CJM|W8Ysl^Hs}3VB#(wT(+|~6|CI)B7hWfXgX=n3h62pW$QAa$z!VvA>
z9%7%Ne@-ifN6C+lj)ityUxmJDt(KV9;QjJ2v0_qP<i2y`eG!(j_+yw7Xqxt%-+26%
zWU+51%80zz*pvnoWK9#aT*>W1NI)c5>&RWI@84-2eJ#de*;j#AR9VKal1pK`#v*^R
zI2QJ=?gX_2|9hG}x~J$iOC>Sw{KI=JsGaIjD#~qLFcL@ICHXy5iT4#aimD3cc?atu
zkCB_S&eS|2)MU{+{ZV3df_kmX*SQzhmHvr1S`|5Y>_<UI|AfBkV%EzLXSPVfx8w^e
zGci;>!Q5yRA3vCVX7&+Uj<;CM7wg{*@wp!g8>1OuP+`)V)OvVEy3Mug$zh=<(_=~#
zVyp0ICN|u(xvVb>RoItDD;kXeAM+&II1FrBNU6&J<Q8enlv(LmMK^D%Q9B{l)&>R+
zHOZWaTNLU`<_Z~c47c54MM4npLJGM$Xi{;ka2O@*fF^Ac0h^|VOAl%<B`P5(Zl3~)
zsn<3s2Y)nNB|RehZHVl{gSJcvz-FTD5bZY>I+G-#$w!(a*ueW;u|nk*d7UI#ot7KZ
zgUa){62nh}IkmG3sU)!J@hwAX-&qPw0q5bOhdIQ?7;P1uVP(Ab4-$E2VaUxVZaT5B
zyaK)Wj4Y9;{bH^Ei=?yuYwCah|6##4a-@_pQc?#9OmcuU=qPCzDWw7mB8Y6T5mKWY
zNkvLhNu@hR35Y1oka%IBC@LS`-|zY5`~l~AJJ<ERuE*p4U}8=)?z?VTq<gL4;SkBt
zK#+m6*N_&aAerg58dH<TO+;yKm2{}Pvz}4H%tZS$i!vh`i!`z!8~(aB7VsmCf@xW!
z&i6idOEw(md3`EK)+YUV`x`uxH-e6b*xeDm7%jOF-Iv!-tQ#N<!)}rE8bf$S<><xM
zNOi+{<NUFB+!Z%Jd7eXp8*U)XufXjP;K4Q;qz|mrkso3Bh+TSBak&q0k%qWtea={-
zNpAe%APXN{J2qXC2e#GDhgO5D1Bwqj8iWpkn_Yt`kN9sM5`<`jcsB#0jeup39!n_9
z*ei0uZaDMQPayW15>4*SZA6q;MGqOMGW<Ry4mQM~hD%L&F^2?gY$G0(8f#-1!Be<)
zwGbH^6K_!HZae(qN+HGHh=CJc@IA&OFHxKp^V9)uhk04-UT<*-NMc7?($8HuBv@b@
z!{AZqqWp@4B80Zq&O<Tldl_MeDCCYY0|QIP?C8j^qUT{zk~k1lYm^)Uc5yf6aD%ai
z(6w%uIJ)TVzkpqqfj@w>61{4uCb412@gy9&vEAec$gpK^Z1DqUIcL=TeWXRK?1v9^
z9#oUCvhkHB4ptlbk21*fS0<P_qF!@OY~{1Jb&PNHCEtdFAEZyzkC?EcjkY%?IEkd(
zQ+&*BAM05z`H!#T=Ln<&%Sk}aa7||NWC3RM@Wzf5DR*JwsBdxyH`10rc>?eIcfa=c
zci;kY_|FyU9EQGa;|3s>Y~+rc|7tp(9tl#XGH@lhQ6h8wCt>|8t{b=!R~TIe&Hztl
zSDfO|o#M2b;_{f{4w^bgp5n=v;w_)zYo6lopAwjxI=?w};b=+_I*nR3Gax`PA#}`%
z6RiC#A(rMyE-+=5Dv>cQSw1b*JT2WnEi*SQyE%R7X!<gA2F*1iCpIImIHRCDbH!>#
z(PJi;Kqm*E6c=MnO1D6&lP{i+RGXVo-<;7nvQV#y6GYBxiOp&&&I(q<X`Wim>Uzv-
zGSBLeXSGdd^~z_BHfQt`XH5z$jW=g?`)5rOXHEBK&7hX7fEA9*%G_#B2t~(=BA&-s
z>68<5u|zAYxtrm0HnOv}M+Cb~OF3kew#0-=XL6C~P2OsRCpN~z<DF;F&09fG&+52a
z<?no;{oXb2{5)=|^xeEYcazTK=H2mkUg26T_?XQ{bRJyRo?_PN>GAjGOoAM(?|aR=
zm2)*W%@a!p?-$H_)>seG-aTG^7f6mLaM|2nxyeeIj}o(PU6>~q%ty#Fg>23TWh^|<
zwT?YMe{I~_?uAJ<8a#iW@-VwI$%^sGoXzddg`SGItC$53UCYQhR@T#yMWSp%O!#8P
zdB$`un}Ys@5H9Pdit`D~c1eo1mfogW*(Bk%UZi(y%urwHK0{%%P3e9DJjj-qxai_x
z%R2NvDseGR?EPadyZWN{CF+J$jJ=QSQZe*>qN)80U9RQ(aV`s{;)@KeiSf-f?_MP`
zR`1W(biU7oF6FMge_CVH6l7f=ZlBToesaY=IQ+vz><5n{`%Xvp4HJYhPo)b*fw&Ok
z7z<52Q;*=`_C@5NhmDE74jB~=!--4tfI|S6!({eyP|fmSh+{;-ht>th(0#|r*bk%2
zOZA(}3%4D$im&gMncU@x(J{V442kK}QQC`5T&#$GfFz4aHEo<G#?6a4wYDt#j5{ug
zIlNbN7*ce4#q9LS@zc8FhmST(hq50BpiUb{PRc?zQdgwJ>d8q>q<h`0`x5-4+N{?(
zUjGq`TfO~hlE?X$tTRmGlV2i!2>3)F?0nMfz{LHrzTCObYM%Ax3Mg(eKw==JqS;;n
z>R~hfhvzMk(##ed_iGdX?a0oj29J2-^3~M&BOd?9%K3zAmFfDtQ0*t-S{L36DcB~`
zbRYayY4Sc}jvHHw4HBx&1M@R`1+rXADY6sc{)C8Lyl^uKc43`4<I@q;t?_6@l*N@f
z(Rq(xjX7}DYK7T%fkeIRQZU#S9vEFxoQ?mQ%13y*<2w5Eqs#pvmyaPUx-4r?)ZLYm
z<_&6{QJL$TP43!G>_HXaO|zsho){eWrr8A#1u7W(Zet_cO*zxCC&*o|aK-wuyJwNR
z;WIb3tJaU1QXH;(7|TVs2gY$fzTlz}i#Nz})7x^Na8sZ*ka01$?rdF*-qJeQBxbK;
zE>Ylf)ZR|kt_+Xne)pTt983nbKyelhwVuw?sHh<wyGL=?8pmAvvNTYs9>upNcw&^h
zK-c+T`dy$au`suyZ8WXoz7yPOfbI5{=O3!4{6MnrM-MrwN7OS~j?Jy8SfecD$i?7o
z^Uy7KVtE)ETw4L=d(ujhqCL@zy?5Q~3JV)~z$5PT0$b+Iom`DrXGEsUPQP=ylZ639
z44ZW4SLWTlgo;^*Xe1^APLJ#cF^a%T>%DoukCP`@bCW(-4X{0$I``O6-@|4wqYGqA
z>kO&mNsvoT_}Gv%LBfZy5<Qdayp^xh*eV7-x4qhJ=T0f&%`GW5Al4aJAVrx+a%*;S
zpWoZ=LHp>hG&*9$pkQ7FygaeUx8vE~$Sc3ekRqF7n+V#l1`r?a6&XU!w`qenWipo5
z3I<^^j^)Nxj$aSI*;~lmUo4Cp6CVvg8@mm|w6T#PLv^3!{3fxtBkP7xmPo#Oh&AtM
z`puO~>4@o|OUfI}J9m03#^FBVap8oml+*6m5Q67!G?Pp4otBmu?~m}uge{I|`yYq=
zScxW3vlu@+a?pihcB%ay5>u&0&(9Xr6?9ZsEc1Q^SeCf|=k|8?3di2##M`*Tx*>AA
zRjiL$eI(_ORB;$*)1v(3RyLp!%1sV0x)qufiys;-Hm6sIb3_1p8no_>7OzN*f6EX=
zp=jIXFd7L<2_sZkUK6{12oht@)d&Ia+5ZPJGmSjVmH(U=h6B+<S|4E)s=jeN#$zq;
z2Y(cAr!LU`P@^)#5@3U|1#MXu*uE*bJE>N_u0>y#(+1rQ*~;*W#If9_*3v(Y)oKq6
zI1vB*dI+L!M(=qOwn3-~C&)&e+K@GdVjfbs>Ldd>Mq%z-aJTE{jQau~aQm#;=(;b)
zSeW$V%bFQ~-jArDH^%u@FT~i;!20M_d|IQ$jU%InG0H>a2dE@G3Sw7*v`3R|c<5i|
z#^L=*%0-foZJ^pVB_T+%Mjh!9Eyl<DD*h=6zXB`g|DJ^0FW&j`Sc#k$3R8bG;yJHG
ztf0rgpiiRvsp6_q64q9cr}CXmCFtCPeCfP^I<gmv1R01`eBRN+4R7a)t)T@U4ScKb
z@^;ZmayZoGV|)6P#pkY2lFZ~24MF%9JZ2*nHi#CE!hhG>4*703+%S=S`0HGNsEI<6
z-Vd|vF;)FI!(Y*6(UPaJ<TIte1trQK7fqGZjP?R)zxb7Rxlo`wstF|)b~#(@8b}@8
zm}4_o{_Mpy8n~BH`vre=Y)h+v{qGkYZydVnlh9EnR57>MnB7LG!Vvj3Z9{kUNoCfa
zu+h*FF09X@;~~BS`>3OHSG7XfZ?qle;RQP14SF{&<{)hH?w*J-F4YEL)6WJy=T^fX
zFw}g^a-@BJNiSW`a+{*L+sn-ucMk4B1-&X%vGWW3z``E6aGazcK4v%Ey_Fm8Z$K0>
zA>8MVsuqYV{;Lec9}hffyT@t6#BTwxeVk9d^j1@Q0c!Jwez2=ugC{LJJ9j1IFdPdq
zTOijwC7~CfC#NfoERm1bv_KO@P^Uh4JR97C;Y3a=C~_}lKN)Iuxl{ea<A9&)c8qUU
z(>lMas?90fSy4^Xz+wr97yVIM#F5`j9Wj0BFYx~a7TLW<Q@ZdLNS3|QYSduT1x*Ia
zueCR7ZR+8=-<3V`B@-;x$nuS&+^OOJ4ixEL+`BbsQco|{+k;$c&j;mod^`8@Mw$<J
zFlSXVNNTR~=1bS{${^|aTBo;>%+kR!iw&NWN&Q#-QwtsMd>dZeyeydd$Ojhq`$b@(
z=3|4y&js=?hcOWgO_Y8;gE*ZCyJ#0lzmNbob$)1Q{f1JuGRfx85#n5MzL`bZmQelX
zyBBX=?%rfLb(f&r-!r@q-O6=WwBsQTeC*2;rlyJ!gAgM>ZUqYTOh2Qq%yX4d(v9#^
zx}#%p$gD&xesa>-XP9$=7#HoRo?W-q<&X~v98vVYkhud=EIG<*oW!Kv-HTx}71Z3H
zxu)jV+H9<$%$xC4Q-kh^Udv)3eexE#|GT9nOW;Crj9?^BNvue!O-bCv$otm5o`>s`
zn7=lzc^3@EN=q~!B1CPRBf8HmsNG#)Pv(w|6Uz-`|D6`k9t3xHmoZTJIun^j+j712
z?-941&51<ubwvZ(7Fp+4#rmYuPxb8^fexXFt=on-4XrduzjO>_x__-Rb5Fs`$X<+<
zIa`6_{im5*>UOlvWI4}05e9Y|bUs;A=~r(7_M=z8WbsGJtqY+yUtFYUr?*w~Yn*t=
zO=u8uyZOAb3YwiG#M#zdIsX2CB_!J<TBc3nMWUCM7cv#ZrX8=@G|QKKcTk&L(lldk
zU(-DAnpg7*FG+%iWa5ea{J%(1x*V^(RudC32hAefn)T8PXj2n5<GZdNC1hR~2c_rX
zzYf9{l`Kfbjv9Bph-8t~5c*tqd_W|LH=m}I#O>n6HpTChP1G~@Q6iGd*lwr|Yp87n
zpJC}c0&b`okn+4_EWEy47!qc!boLYana0SjsoC~FX(sz-xQ$7`BEKnq!+^t7^mOgU
zmCaxGoI-iVp;y=qugZ(+E})3?d}g;GRkjVe_a}Xgu9YQm8&!Wb4_QqL;}~0E%d3#b
zMsTx?TEyNQ<P0iW^=VoXE^JwgSNPbnp3KpABOYw}(MnBezem*eC(?4f6A{oik0q!W
zsL;SiZYo;8>YRdd9gcci%`Ggix9&N<c+Bxapx}3ge2`aeJN8?w#(X?zF(}zX_@l@U
zw*9A7drVGt$&2rxqi;#y{&lQZSNybW6xvu%bAIz{yY%TBTbJ2leRnSejja56@|mvS
z-443W&7LVuoZ|6Yy1N$j5WsQnZM7OAA~9#=EDquoSQ{P5o{xe`hh&C4Vv;@m8L~h(
zXQo#FVIopkKnP*%)x%MOCQCU8G1}95&h?<9<@1G@eZ6}5*U&L4AB0%LXuX0Uxmaxh
zVYYa$J`rKLI3ovPjyzi5MQyn!=J~>0RbKtlu5$5qAB4}fpQ%hE<q}*4M0iKN1{6x<
z5`7#*_?Kt{$~|&Pf%zimcfAHx*W{8zKZppP&;~U@@{~vcQ6Wa}Asu1)lqU|NBK$i;
z`r7iTsrjN}(%!?yuJUQQA4D&z?hN0Elus`a5R)|a9<eBq&!}_|leXU(vF?%2Y{(ar
z_4OXLUz5*j`yh5XY-iLNq>$YsATAg0J?18?kTc>Su8_Agc1v3!cRK%6T(Qb~+}Bkh
z@BIgH<@TNNyO9d{YXTRqj(ShrD^V!;>~K+aX=ma=k3!+s{EO<l-jiW#3QvE3xTtxu
zGZ_K8QUp3Lp~dJ!jS{|6%-|@Y!~dBYqkW}>y+A@&+Gi@>^-3w<vV^|s=c(k#D`mpx
zB@K;zrqfEUluJ2E8ry%K&g!}HOuj(U)YoSwZ|%x+m1W5rVV`H7f)p#X&r6xb`^=UK
zE50ytl(NYCJo{W*vC_Oi%Bsp|uF6%h%5GW8y8ZLq%Sgp)*Ync0qdxB%OB8E-9Hs4-
zKEHe2qgWeQAnmy8GvB_Z_%d`^+WF-3{9BMxUF3Ng7e?QOUSXyBCyp|1r~JDMgW5_B
zsRc3~(!PtMu1bx$%QClAcNZrkm6}S<%X%C8zMm;kYOZvY^|jx9Ki{MDs-Zykwy*Ef
z(wfriwq@D7VY^G8K*}vW=Pw1s`+is#R&E_}ymT*b_rtcfa@%ylrJyR`<y}|h_V>$|
z9<=W+{}-v;v3CCQ!%^Rl-%6A_KRaFyTiX5jvq$;O*MiI8yS|@J)|B7=UcMZ0vis>2
zgy{lZKoc3y__!jNZU!fG6#w1|Ob64$UWg`3`>is%VS4#KqGMF|R#~GkeZm*y;*9;)
zI7%`7QciO5_IqpRdNBj?g>s3$e(U_}m_e0~a>-$P>w@5`L)sVQQ{w&fH$+6P4jVbi
zr{(Q!T-3QbVqPepQRTNO?RIt4?xTEG``-WPqhqcY6mmxWwiHUQj{7(%<Sp%ODfeET
z2rN`6*!A016;VO~Lcbsg@w0V`3~=^9AyiPz*&7anF)=c-up-%5S=f=RTpaAY++63*
z@$&PWyTH#UbU{E{5GE!pC@Cf)D<vT>E2SiNNkvg!Q$<NtU0X*(#Z6N@?Ha4GE;d^q
zX>O#OWyED*Y<Bay;brq=J9ASrOFKs^vnw_!4{UY&?bzJytyCS;o1D38@ce^#K0j9n
zXE&cAw+p)Nxiuc52A=uDp2GLNT}Qmd+k6yEeGA5J%RIbuYy2*HJV4=QVDY0spXfk|
zhWqli!4;FiDvl4z?}ZSeLj1c!R3{&*7lkUjhF496>%>Pq*pE=KCn(Gi^erP5L!;DZ
zqD<OI#<pbDH1eYZvW9<j4KX@-Hpcu;Z1erNy1BTU_;?+1ykSm!<bUz{p^3(xNrsdp
z+<cP5Vv=1UC1!!*?44rzDCKoRYW`xH`|Wh|(v0}S44dgpPya0I=&aXySx)b>ygRZ9
z_jBx*a{S1--7&e&8F|m*^V=Hpy}snT)fA>J7v2kd>R$TPC#R_DV^Q$4;@cg?_r8|+
z&XzukEc0zD%lTCH=xe!u#<RYa=Y-gbd$|=|#T88-Uqr6Hh#IcSOsam^QC*Z<GybYJ
za;^5s_u7b*m*FKZ`#0(nGaI7%8lP`ArB%NgK6({j@H&3;b@tBdjGdOu(bk%+w*1nL
z)cTI;#*WO%&idWX0@|D6A8)cM-e$ji`@Z*WL0dO<rMvWVcX?G${%lY4%f8~zeN{jE
zN*V^r76)3_2dZX<s&<E7HV;?y4$p25*DsHB?2R=39Ia^`tNAw8usYr~GBJNJ(b_p#
z-!;|TKeatJ^<i_W_rIym{@J$C+4bq!rM=m{@3Wo1X4}8K>m8bZ^LxH~e_`b7!r<8Z
z-rw*0zb=hYKMc+;?|oQa`Mo?k{c+^`r>VJ>iKEro`8DeM^=~`tb4weu+nZY_oA1`P
z_Gw#NKem?sY%PA=Ui?Y>xViIXf9K<$o#nO9%RfJ_{@PpL+F#xIZ}ZoGw9kjze-F3!
zzkWXXy7%S#!M7h@{`~m*<M`<0*N@ZF)Bhd*Q{XQ`z@V<EI||Mr<uFuN+#7=wG0Hcn
zFX@lxQSkXNR9`xnjM8}`VAxPLoF-vW=`h?-KAMGg8_73pd^Vnkx%c_QaO3mIr`RZl
z^F~b-Q>6xJQjQ}{FJ_+ON{tGPnk(n3Y#M!*N1ChVU*db8oHu?|z1ZkAQ|UPRs%Gi6
z|N2OQ@$1^<_K<I%mq%Z}{PdOpX1rk1Qn%V0%OUMF)>6MdND(nEG-++v9L-kn{W#Xz
zxII~<6Mw<9t!Zbb!lKG)ysde6zRqp5(6s&4{!+`m-H+q#umAhh6~!ocy`$yJ`cRs*
z^F&AMw{2>v@zd*_ZAZHcjlQ2II@^E#x6&JbDtO~f$FFa+nJVYWH=QRx+oz6lZ@hi;
z_vHKP?x)GO?h@<(y~GLu!mw~H0xn*G()Hw|twaF>jVmP1n;0q=(i2le;tr-2Kjs0!
zdy%4<2Ett8EJD3VMZe?Kc=WS#CDD9=JnM;=P-PL8i_d85NK43~E9ok?_ePNF@1l)V
zjg=L5X2q_<qD1|h-kX66N~>jTn6A2VHfsl$XjTg+@2#BvaRU*OWy#J~UQ2krXS8G!
zV!I%uEjW=C_ag^{kiqhz(q$+V?Wf@b-BjgI=@8~CJdWUT4dE%UX(@fpjIjhQopZAM
zVYF1Gw$2JQ9*d`}L}TY?(WGl9z-h?1!53g*QWrx(Cm7UH@FcAOIHs>!*h9OA3o*r^
zFJ7t?zlD6x&~%+y=|>>Ax*>^lg9El!DgE*d_bem9xlc%pMT9qAMmx}MZLj_2`#7^|
zQKUUiA^-_`fju5d9c*~5Ei#ObK}JqUo;g(w1u}7M$)X1u0wc-^eQY(Fhn6y<=+p&O
zT<vqqM<dw3|MG@w{uTAc@;+SAM!xy|Mj%FX;GYpvX!Z9DBa`AvRI+HXgN}jV?2tes
z_C)4GJ$BZBUA8B&QW_^OEjaBh->M|npgC{QAfo}A5*e1P?W>pW@cMRZSaKJgju4qp
zyY_Mrq$q@!05J=#oco796<$%)<KaVb{hKw?);t7`FA_w0Mal_d-04*W&yCIptMOo-
z)@8c2eb#Nd_iDJ8qAOSfd2qN6zNsjUpsb+-qCL?}rQljMLr2$=XPaSgutqrPU^3#3
z^7}*rsjTKtn0w}htJ=ggT$CuwxFbb|ApT8|@dT$pVx#?m>3jl=dSW$+>r~VK$V<5x
zL_m?-gU#-Dl!SUwwbOu|@$Zilf39!{?myyUwdE0dxZp<o0W>GO0}`CQUMV#C=^|hl
z2&z=QDZh6U93kpY{LpL59KEW{%XApry0l#XM~lq%xD-dl>aVO(nePJ?9-$|5UknbR
zhWC9QVog}NP9bHG$fm?dkhZl>wLWFVbTZ;!SB&&m^wqC%m;4VxKWQ+<V1VXv8xrG(
zUw@{AJ=t6hsY6^xf4)3VF-&;^e8toFwpcG3^+XJqyIu&qiS+vJ5-1w0PtU)JW#8*f
z`p5V|2om|?eOz~7TUxGW#lY3&X5SD|bnyhxlze_fI<|-@`6H+ggjf}}M$@9O(Go?C
zvZOdLf*XOy8uMHMpO*(Xw}&36eow)>e_s(jb44Xzrx5%@?L~63t+d#Ogslss#4iQ$
z>c8(luxh9-m;LM6_}-Kfd<V0n2#Cfr84X1f$2?{8Ql$SfQ||slS%_K>jfiuOq>B1y
zDf1#uQ6YQibU-#aSB1ukO~nV_K_ZznY>_q$kg%7b*)l%@;Oqik`JyYESkUu!JYQh;
z+#l9ee@{|4KHYY{=!RNgzj80zScyZtn|%HcW@CWHk35RG_H#;_n=pRoQxiW+SM-#V
zyT5y1n%gxoIWs09#`BUqAoYZxqVPZ7h1OjXYC|-Wh@rSpayo9`d?k53MX|^WI;kAp
z7n$O61Doui|IL8XAqI+tzVD#d0QzdCk8~c9c-S@mypkgN&k9~xE;-Q-HHpCL1keTE
z(xRIc+xZ)mNrWObuDevI4ZWcMyHKS|=6kPQj}QDLaE`Fhmdx~<0sDmgwsQcLb?)>X
zDl3DZzEwQNs<)Mx5#ozu9;-`sD8~oRD)`!E?Vi7Hu!dYdtH=!etj2xa9xOZh#3$TZ
z0B^C`3EYg)@C*+lIa24yRpZKf3q$;K%dxmii(w3}Jjo_%{qWd=*^|o&Nc?G;W7^I2
zW6sgpMT)o8M62%2PO`<ubbG-_QGOCaDT4F39W>nc)cg?2VpaF@+eV&fnPrsFR&aBy
zhX=#Eind1ipZ)VYIvhS{9cIg_Wl`f(O_?ceu^g=jJjJkb_*!G~{T?RYvAKSh1}kCf
z7StCkuNKLVA}$RP)J(s_`BV)lb*^tjbp5N=UK1<YjcLH^T@pWoZjpGO&MCX;agTCa
z_ZA&5@s7&F>hEP67KQHUaYAjX3~ZLP;Q?Z@JdWfEC9){HU&6lpZ73eyr69HPOZ>~q
z%_8Ljk(&%OhFx^;I>a4fi*uWO;34tcdfcZxgbynpJ1D`J4zevX!j}6r*FLD>L=UaZ
zzkNeoy^tP*^GeIC+-h#f+D~&)m0%r9dexM?wg=J*d%rLdd}B>6;ZE4eQZJ_D)u8D?
zVBX0G+V$6M^Wz7>?Mt?Qc>;BR2;Ge`__ch@Qo)<~C`F<sUic2?KOMtNv!<f;k9={j
zbwAfwgsT2QF+7j$6)gPkiN5aZ9BhG}`<MUXsCg*SibJQ#z$g7?XO`AeIgl2!d_tSJ
zy8||JozUli6EoVV0hP4&Ke&^AXF-<rQkKExHGH&OU_NRX75epuR;;$g2v_e)z{THe
zuy`TUpm}V}q`@JxLN=XXFQxwtqF%4&`#P?8VZB+gN0?NN6G98ZRpeb}_}tgr=>ynx
zx14^qi{x(;E*j0q1~Ty2^spPLwPAw?Vz1vvvzXF!IXJms+;!D~oyR>q%Csu+Gq)Os
zcCFZV9%Xi~zfzIbuc2Ms4uA3<eoF-6WVOTU6DtHYmEhxIfh6;_RP7%YX)|!{C9A)m
z5Nx=yxz;*cl+6lxroshw+Wjp0$X~K;*m_gL=MXBdK8>QX`kiv%2`tvL*fX9$^v7tf
z;~z^K1dvwD{M*BgknB}PzR9qQ0(r*~{KQb-O;$8odLFG2fW<5m97$+B5L@6MZBRw&
z6;FR=@eNnIRb?O$YEM>|$HL{&8p&3dYIXExdKJEq&aCEYxAozYNQU4jmW3#A12VEZ
zQdvy|A-nd7c|leO@=(-Y1A_wxm#SW&seE@u5F0O}=4HF(A)fxhI@r*sZXvj}$2TQ7
zHu|O7W*~Au-98l=GWQ4l^EYBWx_cyVsLo-qAH_Oqj%0)f3S0Z<5Zp8UnTK47c2i6b
zslv2K^=%8)airR>9-Z}T>UIwzC3UP@X0-mUFx)w%3R4=iBV!eu4{c^GRL_2bXfElu
z?9w#(tIP6nYMjzTUj_d>i!%v{Ue`X0KQt~Hgoj2+T4Um+QZNlG3{xOg+neA5^NTPd
z`1v8TI8EzR36eu#v08u}xFTTF(aODqe<-kSV-T-iOz@DN10Ayl@@l9K>*EUTVO;1#
z3M_}pq&cLh+k4TYJofg*i`Vo)DX}tZ21zV^GD;b7dGPQ-McdYCrhn+<9Hex{jP!GO
zc(*od_AF#Q8>U18Gv;_S@uY}ri97pCp8#Qy?s!ney|rFjRz>5+bq2{UPy$tp3V=hP
zk`ovt1`L)ELCB!M57B|`>-5Nbi6N&UTz^qu87w?(R%^im{G}fhm<}rdz+=K-ZG_lg
zG>N$+@;s*)6|Y=z&!Ll`t{0d74=IsDkv?9K4Q-ScEi$^U%__M9)_r(}M3nl6rL1H<
z!COeDTm)xukUH@YjV^!o)+`~RyOvbOW29q&EB$aCt5+OS<>G^Mc7~EPKl*xIAEAfo
ziqZ=@;)-b16SRvdR`P+ZO8YcpM5IuBSzxb)L~ySRPij`Kp=1M9Sm!tsM8`U%;{YXR
zHghoK3|oI6$h>2Vq~9SleY^PC&Ba_8+}N8nWXs+;Ef%7aPQ_hX5MxusLrhWNtbuca
zKT|lYkZk($%o#|g7z*fgs=z=*IbyIN)R4_JGkbWkP>7Bh^ni_qijN_x=g<m|7kTz}
zcxy5WfBkw2@D+hniXe7H^zUWB(^?2F6m`X~YFg!~Flw7al~-4#p)`)pJor^g0sm??
z>~}FTrD)UNw_%+L1ft(Wssn3G+(w{>I2KMj79}oJCXR((nD0c7t(Yo2Z^)+T|1><M
z^x_oL1%{GQI@Bhm%&4u*<bB!o-(|Smvdk5h+rM~uvLe`tV09HXU7vH-q3kKQ%I1k>
zW_Hg!L!TM)Vfb=+HMUE%&av4^J$Q(x*R{Z;9zyS+rDIT6ECJ^EGfR#?bbE%`Dn>Gb
zui`9{IFs-^=v3<5ZHD{o7ZH|dBCRg?{5N!(inRRw1p8*z1b=AF#o$hCuxqY>S7>F$
zNZG*aXW4Qg+-%QPtiU7`qa^mOhCj4(1>6<|7JZ>uv;(g7*ZNLn#1sX*<*Od1vd+da
z>eVUUTdm~mhU;OOTc{EkwCW)R6s1@**CsnS2dVrHZLzB^yQR8rQ8^%lxNOJLMXl|k
zl+F7yzX+|ISgHM*TQ=|@KbJ1zrIF0~G(wdxczc8l)m87Lm@{s&TKnhg;j0ntb-fhO
z>#xuWsdIm%B7P2fbk+san*}ELU;8qr{A8_ujr*C3uJt8@U=AB1%}2oCw~ZdM(U5^&
zLgl5=X)XfC2a_8GVXDd=cAa_V$e<}^E<+@BCCD?_xi64Go0ow@2mZRW3hHq=^&*nf
z*Jj|oEa#|Ov{ik8P}6)JS#DbqtBM>Z2o>JTkw-eFkzNIH$nH`!uaC+Fg~Z6(3tTn^
znee?-swz7&e`Z8&H2%zD+Etn665q1G*nRJ=B9^uIF#N573~o+>hQsQR6&k@+Dy7Z#
zGj;KUt({bb$Lq~^i7l-aDPTGb!tA+0w#(JtHl-+cvuk>HzB4O(zkZ-9@UW_E3ETLT
zQnrMm@A8M@4>dhk7_E`8fxNP36vPt1Gy!3n#j!jC=#7vtW4;zsl~QsLFK3)Q`>86j
zb5Kz!>%j>|O)UyMPGEIk3z{u$wc52}$^(%&-a4-^jD*S*TA%w=Wx->Jtc*v7@sO~=
z!C0j(O%+9AWM)mEeU5+oLUwykeY=qlLt0kZEJ}Tv4<>F0j#=rR=mH)4&_Azxtb>b@
z?1I;xU5YC^P5IOvf1k7Yoeg1oQ}3<)3F*z!?Qz1(W>04QTjXXZ*ZWNg8Nr(^*(>Ft
zinP?O#@+OQu=TQ6^GiFhB=?tD#dO20SYiNr@y`sKC^sRs9>d?S4cmkZyUH$&l~IPy
z{roWi5%QQUd&$7|<}XS}v5vL3t6sLg)EWo=V$12ThK$<Nnr~wpMS#aoy<JQxpzxKa
zkSRvlGLl99dBf0t<J|sDO1I(remAuer+kp%=O7QYPM&<2Qv<WCOpD=Xh64giy5G4^
zbvcrU%rPkXn;xSr4x<Tmqs!FM@6*PxDX&*E%=1`GF`oVo_UWZ5*3cl%#{ALOGUM$g
za&MT%0O2uyx~J?~toC-p(^}m|mBaaC{Z2AH4PBtZI_9G_#H+M2G%zp=F#p%aEOX`{
z=qT%)mJKZ)<XmMq-91BH4Ti5ya?nw0XW7)5CN_m84Ebcxb<FGOWeF?&gj6F#DN9#8
zz2SRUhzETaASRE8EK0YOag077vOcFF6MrKaZ=aJgWs@DJdYz`eP6jc1^7T}9lwrop
zmZ&qE{>-ZClT<uJJ#0F>p5^>4J|oi^FLK%Jis<#!8Q~AFMWp7A9nQ-5^!4Sru_=hC
z`b+HXIit@EO+U|l)!`EOj5HVE@OI?dZhhy(EYQt?s>PQSr?H3{fn-8UcCf`e=u*HH
zv4cV>QdojaMWwzx2n^?>UuM%*VZ*;>Qw@!d&7rzO%C3G{kYQUCVk1DOq$E+c_s01<
z!6@d?Qbs<ZP<m9AcJXaVRHNGh_<k|HnUb(p8idW?gl*>hmvWBc#Ph|i^g<uZWH{f9
zvv>Vnl(t4n+rCFcvb@e^y4~3e)kh}Y<}@8=OaA?g<y4FHEHabk@BgpvIf?o__{sAx
z3>A?oiZEJW?uqAT=8tRP{v<wF1BS`@5ZWGCv9Hdt)XBcA&UQ~f_&M&X$@cvNb+>~c
zD4is7l6m=Wy}mOAHkOZcQ4aP^AJcrdqWQ|&@n?|btsoWhCnuOvAw#7zT@8B*LW2-y
zigfH4f!n!dw^UXQhHBm9VxShitn*oKm14Zavc8P2?w3M-LBHqYX1#j7&#`-rEv1`T
z-t80cF!i}a!gffno7Cy~RrWW6>zuutKB0GjYMB}3{?Lq~i=o455991qN?seR8C73@
z%yD;|?T-=LfGiS&uX9nYYp7FTZ>V#3Z+LWFrr{KzB?V>kmj~q3U1GUJV=$&(3fPto
zsQ>oUJqL9L!`o?|*K(MD4jxim{}%BNNjQrP^}eOx^l$Sp1tEPa;`li-wXVU>QaZ7u
z7DO`&<05V!MVmp0?HsUrZMftvM}7^Pw*5_AV`L8AxqqByF`8<|Ps``m#bjs2Ttecc
zk>>5&HlzF7T(EHb+p;D0;X-!2^eb>T{G{tTOpBSMpkY~L&u%UqrYJp(%m`R%vY+`}
zdvL*-YU~7$hS7CPqM5c;lKj#mu3U}z@Na95=k+9umPX14K9{y9VHk)Dz4gj+;2?<m
z>ON~wE6n5I3sv$j0KNsTnk2Di=gAA7zO-09uu(rlj^Ym#h+iaK+Wthg?Ozx&QTR{h
z8uLht8_YFfXhF+qn{|R|we0-iz6->ez%pE#@+KAuca}yEWm;pQ?AnR#_f)(79cEa7
zn|C?r-mv{0)q`gtP!U3EtyMpI-n@!(|FO%kd?@-y#+l~&^FSJDjs6*}`xZ2Xk~}nc
z$hu-&!2UNZC0mx!(!cQQC4!8oqyz#?5l)pMM46QZqWx6^D4>mtN55B<dtaoyO+&&@
zlSNm+{?Rr>FgW1wkUW=KEEZEW-6fAavNpS`q=xi=i`0$I?qeNpv`6-zab2HsKSpFn
zUNtnOvi>_pT9#y8zWsYo=q~BhJDXkW-Z9}1li9MY%MQwAP(c3ABbR@&DMRrBVrC_O
zC%)#-i=Eq<VC(avA4nLxzIG{$4tWy&OT>n{qD4Y*U2=!ZvgpLJiCr(VnOf6L;8nb{
zu`so+PZ82h61AP)Fie-Us&!vX6?x+%Bi0&dJL9R9tt_-QvpBPTqezR)B4#&BGb=O9
zaCLY<7Mm<L<5J47oBM24ZQFcj^Zneeb)8Fpl9>IwJ=-Slxmu4fcE_|=-k%1_?dK01
zJ02b#KqV>vS-*{dvWhz_9J=%=-V?8F%l_gvlp=P+$+#q1Q&03tnm^ZF1w>1L#$eQs
zUoL5r{~S^PV@1i`xjf!qRj2j80=LHhpXtc%oAtbbOGKfg{kQ$eHsx<0O+pnsXjA1k
zepa?R6i#O5hbx)0jNQ6buNZX}A#<<w)2y`5tM6BDTwTw6dF#`g){~#(t52(*4t-RA
zw6wKkqI%E)zM=My-O^u+-m0Ni04|d5ugxHxj#huU6`BZPRQ+D3&D1)L!?0*xnd(LI
zTL$QI+gsAQIovuZie2>Yae4wGCT3M#24ixA=N&l%4TMXpilYTRnB=7glOp8|IkGw`
z4ND72?7DpMvw;;D*Y{tIi)z)T;4OrEQZK~YIKJt~k6TKOD=x}#n5f)lAd{r8zqmJ<
zDf;m81j}2<_g-1p5#`3|HS5UjhHLza!$vxt_rTR`$$?QF1{Wc2(@fh<oHHgOA7;(W
zbyNG9BBN9Kj3e4oAO+@b<#2PI@{UUVi^fb`+V)jF%|?z7_N{KZ@(ORvh07P$6p0_o
zmDqT3lmt;-%1at5ykCr`R{6$_a8rFsxs*A1#%P0rF>t$W#)wDApN<i492Gv4M~((r
zpMSkP;)MUQY2_RO)~n!G_#spw_<Vvh+s0Zgpg#k*J2S0vD>x(D;EC+B2QIDwEuffi
zoLFBf4io)K2`xp>nZWnsY%Ol2t~kQw_2Y%mrdEN=qDQu>)f3OW0D8;qOlPHEUQs`C
zn0H*)Q#M*OU;5o>JPqmleI)VeP7;S|WpCU2ifXOSRA2T=&)<Gci;;Tlvl{nKZnvyw
zhTUoVBz|L4@Of?6-8UycPVRPr&pm3aNSh7w@8ht36fkg_))p|dTiea79D04pH%eLl
zB(T0P>Ce5kaSjzdw1zkT{aFj^zjsAM<v^~yj&wTgf;V6P4gR3$`!`6y<GK0+sxO7~
z?WOjM{oF(!3iKlX-(k0qwerYk`)c@~^PgV$N_6zTnCti#cG&y!P_^bp-(=XA8EZ|;
zul+v`{~R#~4Y1exE~tgp_+y<)Pl^MwindoTOI55o{t@0}`sN>P+SZ##*Byg})eiF>
z`J!S6IJytDkWskYmD2zzgW~a)yHNsHSW6)-oX^9%nNMZ}uger``y9LRI3GtQvIH<|
z<LLO7V|4`HXdy#eKrk9sU-N5Mtciom!-p6y#af_><M)QQ0pDs7%{oaV;gWXd;dSO}
zYu!h;dpYqY?4V({xXao@T>sHUv1u3#XvMK5U6pscN;N1}3>{3o*TD`l1Ue<&^_^#5
zjA5;%G78E}3d(-h*Bl}-isTDlkQ}-uZjMtFs3WkMVxa1w#3*;9D2IlD7Dp~MQLSu+
z@xgl-qQbvS{A>%L{3QYOOXAsYue<S?0R#MZd7t|}TFb&zCR6VZjJkMAWe+Eq$yo)D
z@g1k;2-=x4%bY43XQZF0N>ZRq@M(yyd?1e`X8zpulxvX=TDBM-r^`QXk#OvN5zt|s
z9CLt`y(o&IfC53)FJ5H#yPG?1va-t{HBOwaM<9-<e~O+d6Xn0_PuNsklit9MZqSu*
zXG}f#^Xo=hiwJ{(g#I-+u`-x^FCw!Dq$O+^8*?ne5^l5cj{!6pImSVtx^=6Z4M3$G
zdf5e`-bNp=pi6;Q^fC`!!#XM~EA;kMYrR;1mxNk5TyL(l`HKs~Sk0#Hxp8>Mg3!Xk
zi~=iB$b2EVNSGP;k^2@Wl_0HAZ95aSl8&O`yIX&-VI#hOf39_2%Es25pA=~2VYn%E
zzUGP5>4Mm+dd}$;cM;V^mfM4*Xt81L5tnxbvlC37gbOU@gebk-Z3fe#I9>w^NUmw_
z*(Fmg;~7aX_fQF|8hH>;_CZXjNZ4eH9prA<IBX2iT82IDyooesf8bXvj5CC*{UIhl
zo<$WN7ad${Ir;E(sH$~6gDO89<^<0<*V(_!6CxJ*#Pm^Lh;@aQ$#NCfm)iM~Ix5{|
zlWS&hZ>_GPSmb3$HQD<b1BaHuv<M_2MwAHZ84m9g$(IA0(6U<gJ1^@T;F&4k*ZG$B
z53Rmdt$GW)fdGF(goh;&0U>lFd-@<K0I<O#m^m_WOd$V6L8uFeAq1Q1hugsIoT3KB
z-^;y09})u>0DyrCdeS<w$}ZwAxHKm3eBE!;`LPa&dFU`s%07vH45MAtC6`|4Pz=%8
z8PYq8ook~5E`-s>+e76+d2C=n4K!xfADG4XH9?yv^s@7X?*djRf;kS(VaG#?A6;G1
zN|4j`E=1;K2^4$o@eD!rz<fqunBn`p+CvroIiuZ-)>%<=$luXXzCy)UU;bvRc-Ktc
zVq(0K&?Yd`6~!%lzSxdL$2>%#qM8WwARXGo!vjj?C|iP8Rw?H{Xn&0$F&dLq`p&MU
znItMeWEFS~hSuFL<+bzDz0q^-$vei<WygM1K^N`$E&xE`0pR{R|LI>REFeQoFs<U%
zF3d#oJsVrY2+{$J{s2Hl$Fd4w=>*Tf=_72>U^t47jSm7iEE5q9_H-Z&7Jx7pJ7j^m
zfeLw&28zyE6AL>tk<kS@FhJGR=#i1ylTa)n%NGFHys%xP#ZfG0`Pl-3Br>`-ASuiN
z#u7_`SmIa^=~xhe>;e-65;9)@*~~^00B(T5lKp@Wggfqhj<~C%Pwe~tEWUF;saqdF
zEg_!}fsuT-IO|TfbH^$q%<TguoeFM%Cln17-8BKQuqwTQNd7|t3R1kaiRl><*#MZa
zvFAeQ+riJiBqFY%wB;`A!?+2bJ#9YBbHGlamuVkEPw9oIY1Z9}xpEtKY@9yzvK&rm
zB7fT$4}B{-_jjh1Md)SJd4Px3F>HVOdtvl9zykz6m9|S_z_0v==nu;rO`(6Y-T&XN
za?#<#^Tm*Kyf&8?mV~Y&kanAfq+zlEFf|jIC=KI65g6)~;F9VHNtM$lbikN8GZI~%
z*Qp{6Q(^>9D-cfdkdpCAJfofC{7NIzU2f7?ko{RSJuxs%>7Bho(s~Pr49s__t@cC(
z;SZql=m8!GV;>ekVgKvZlIT^WD|*`w&OUa7TVlx<JK}%2X&*_dxI`hx^N_Pq$XotI
z0FE6xxq{sV6!rl6UBbUo<S9&4ea86Zxej_zml}{wQ20Z*Luh60>!v@BhPG%i#9f`u
zyLu&-lDKr$X|$t~F}ep#VC8A{PDB2irZW=g6zF&p7z<qR>+l{`Q@x_2cE-HkQ}~Zf
zSK8#+4=_i_@zWxMsMOq^wu+v!m~N%8R(Ko$&qgw#0r(<4V^`mxeIwm{jAt4$F1{PS
z103Zc;d}KUIEc=m?(E=5R3P6=$Bdnv?dhXghMRL#Bfb69MrY_^!mh@hH2G3mre@SR
z%=8cl5R^bkUAo5G7v){8hcKga>eJJAxP+h)Z2y#7eqawlNAgMV6m`KaMfJbouO*0z
z(0O&hCA<EuK~Guxz(5@lPXN)|Xk3ZvcHQV&1vhva08D3Tt;o8-3Nk1gz+t1cFt1Q(
zf*m$m`w=#GLvL>VYTO?H+(q*30>?EG=_|;=RRCbndB+cM0-y*Rfb`AqN(H&1itLRh
zASB3IUO;{r3AOTSG@b%OY1VwF<Wvu9%V1%?s-ZG52Hy>fI7f`z)vjR9zP74MsG`p!
z0}Z|**#NLQg26c(5}lwMvoXph)mEvXM*tHbSjAN^0P-iE__pnH=oPjb;_Aj=6<19{
zfI<#J|FvlTycT#0W+nky9^ZWjrvhLI$ZYk(dn)j51N$buLPmfI^U9N^d<GOdMf8%2
z>{U*CNYm*mF8mO>mDb{2<n+c>AU~R41h_Kv2C>qIx^FyBG7X4Vp`(Jn-7|*!tM`#a
z-p-~93CH@<q9bEr#x3F*5~N!aW6?5`SEcCaFp-pWHBvm~4uLE)#^yx3fzXN$j-ud?
zn*?&`-S;TSuB#m0(SU4>rx(?F#_&`I%9PRfcaH+eKsv#-SY4<H1U*|gi2(&LHc!G;
zZU}pq-`s(UNySS0XO7v%Nwk>#u1@H6H-mkSt^pI=d@BZ1C2T?<*mw=;d-R+DfdOYO
z7=$_}mdeKyNrXdnzs3k1!j$oo8FkUB3sWtWeu?D_a}<@u_R?uNLnP>!uq4oQJ0uD$
zJHs8+L+Cd5`~o96#F<jG<vbYW%V&<wE^CoRv}G+Nn`a*E&`TYI?xP?faHt-Jl(`V8
z_1oft?ko|6HWd@OzHbT6HCGXW<i%bxfzDol&h7G&pk4$hRTC~rr1zie|A2ayH+MBL
z1$k`9wDy*TjJ)DC2c-;&c7x&BI<M6t8M525)}dS!0wR`(?*dD7;jR!O5#xOjDgd>z
zLYY}c=R<qcteWALXV>~G5(Kb~%Bd>h%r4LRy+@c?5NZI>6&Z3E62j9du;c4Yb^v(D
zN&-y?sv$`40CdQ!@b>!B_Axt~dFT)URo!wrunq+w3CxL<gx%IWHERJjE7}6={1H4w
zH;z?gKG4)Ec{xKL2`r{jD&pq@aWlts3tR;h@WMPir#XUofu-9Z%9NceWIQVj5~Mz(
zPe9+UCg3R$iz>_v_zHMv0sf2rJc<A!OlLGBDFq3>6?8@n2<5uVsk9jKwZ%sCymkTo
zk_CZY;>`>GMtz<er`pl%{sejgU~_vh%TzBUk)k6T<10ag;s{WJyet8@0;hu#2yTq@
zOgI2~IE1GH!-)iQ3kSFv5pE-&mvN2R3xE-TzZ>NIP3Ua19h^Xb$G&1G0M@D?H~}r;
zMS$S#7`4FgqAnIJ_!LTg>y3ASQVA3i2<}A)JGyMc(?CzNDN=k5r+k1FDH&b?p2i~+
zAXtRf2oL(@6NQdIc-sp{r{N&N)Y)hqPEh>tUV_eAHV*8u6Q9BrcME_tnKCwW&2r6P
zB0EPGAp`&bxUlVo;1<P=B}CjJ{FmihMF8s69w<Qv9JJ1N(7VG`!np`O8)S(8SVkV9
z!1p=~MUX#n-~(fJO-JAc3jp55ri&2IH4byP?jE;w#}NTEfyK$0jmeZCLLk(%a5@nn
zyUHMVD}hXYWkHB{9NQ*SsyJISqUIP<Ru(=iz6v7<&4K772yD1Cw(CYXn+bvy0Wbhg
z#hvtY#_WFF{-j6z6p72_6^q63)NBTjUGOiiFTe!(WcNM`U0z+kd*~L4Ax|-k#Z#2i
zX{oi;nw1e}mGBkqJ$jQv=kqq#`H^RJb_9`4k3$o{!HbZ8_N=yqKb)_b((vPX^kMx`
zNdIYL5dd(IE3YPN!Cl}1fYK!x$JQo*Bi?~Wl`(;ME&)tkz#7+UE~hcyI;XxR4JUuk
zD;xx6^3?_lm1<5v(wE?S9L?WIr`9sh&9qQ|(gq??FAnJK)-2u0K%RRvqlH~%AL@la
zo(D@@gVlWmQwPF4+INpO5Dz!E{MK1^-nWPJ#}nKlk0W(JVwaBStkF@YY7|LsikCtc
zjJ=C^-3w&2Prhu!m+;Oj=|_x47ZDc=PH&5q1!_`T($p3i+T=mziZTY5ESSAqpj4uF
z%gBqMcDVt7e+!F?Mna-(%`e3$EPWuE5_qr}#LW?|sL0nM3$NDu^L6zcF2Nixxjf?f
z3??95ZjR)aBN3EU8*=-hEWum?o5|Q($8-%WV0Xw#sLzv&2_taXYY-Hd!^UmtVg~~a
zwtbPG7LSnO1r|flmUIyxcnbicMn2N}7#5Cq@=^h#of+6P6ve$5?U2rtO9?pIO<@x5
z%qVi0Ao!Id$LGbJE@%Qvxk;>~HsH-p*vEK@We=0mU&WpVE`X5Iak^ig@Y%%Z-?W_&
zR~IjA@d_s3kw6wFfr08$a*2RDu!oziIL$U8rXuNq76_ak;iLhB18O#{lVJoHr89q-
zTJ1z|RB}nUCLhP)ThOo3_*ijwbIl>Wr9tOE7|jN;c=Za;d;Kneu0`%qUliaESUhg6
zx}yp^{LjPWmMtSOlLH_$QD7H3JR3g>bw;xt?>^EqUCMj!jU!U-9U$ngNNF4(<h<Ij
zP*Kd%6C5oFMKpnvaXis3hvM5gUgS5I_@-`0X5WtN@-mZ;@;#OuTe$u4$9^g%!_t;3
z3cFDj3**JzFr<{<e3&6o=`DCWy8jWWXeRP>^v=Qd*#sCv@b-!>syZ;sT-5nXKknCt
zg5UL%0l?YOZAnP2sutoM`qdMaxUm0fS++w+<W0*F*oEeQGP`!VZ>iNPCMW<}bj!(W
z`*|Y<q<m=2Vt4xw;aQbDg2iT|pw6z!)aIGoX&b$QGQm$ahRXuuRJ46qz7^OWjjj9m
zh$Z?}FNAQOBvAS-Xlot-{LekO^iKljoc-mVA?>)FS-m^v?jh5C3Y0xN9i<-_feMU3
z2MXN?OgM;kLD5}|`1*-E&P^-E-IhBN51F-l;^Y+>ZWCj%5F<_~@qC!c0lLS%Nd{~H
z=0ihJ?5(ZfgQqNQu!F1nw-*~M)=w)$<ip+Y-OK<qq=BLXM%*O8z1oYb?t?I%Pzgep
z_*t7lK(sh+cK8*B-KC2?)W=4@@&!OEt^IH0U^D>SGF)#D43^hFnEM#mQcr&jz>$D^
z43h4@`%`|Zhzdd&nOv+$c)feo2^$r*yaBe+Nswuujnac36FC3+Flya*X?JI;qpSFI
z&zhNze*w5SzFpv{L?A~toB&MJZ~ou5Z8Y!jBs1axh;NJFlh`Ou0-epT_k0vOj{sRg
zJb%uU;5(C$>$cK7w3y+ioO@kFwd2YJ+WvhQB2ez!eIfhD)=%zK$l45pm+Z2Fe+91J
zS@%4CO;QB7vQ^=AYNt#98K40sL$+WHhz?GG_}cC+&$9xqbOzcCY>lr*f5Q)2Mc#C`
zRfpT?MlmS?f8!58c$Gt4g<aiHP}9fZzrJuH)Z*Y4JnrCCV?PW9JSxK>BnYK5YYeu(
zvF+YC)VK2Jvt||!r)R<&pa|BjD0&DSgDi8nss^H$l2G>2qKk&nYwgkM1t0)Nt=4P<
zl0bkYk659RfEdIb2{GAi!FCnVGhU3|flF%<VgzH@WqrO&OqUsD$=|L_hae)%pPSeC
z97(;awtF48|M{qDR&}~7Fj1dN(6;9I-S3kgiJG}U`|9qa_v2$4m3p7Q?yCklr}_T-
z?fAv|bm8(^-;;9+2aI!)8$+oVEovPO_^QoClbvP+7IWB2mVJnowzUufYCQUJ6#39i
z)+TTCOK9SKzUq>CF%fAGKKbhZ16n|(zuX>SAsgB`Skh*tgdgRl06>Bgxvyaw1nOJI
zV2|GTNIGpf_J|k^0Kj1RJo@zNkwR_k{{4G*Tj0CDR-?&~A!rfHrTZSo6*%l;hCi;r
zkO_V7nPCYP_z(gQA(n)aAcYlLnBZgUX}BSW9a6T9DN3Psgoh=X*da3G0YKtWAVTKA
zL^_-}BaP~{cOi~BPPGXtI{MWOJdE|1;688ps8~Nz5ppDxO*$!6hBZn#C6%0gqLda8
z;87))U4H*G%_FrSb<LGdJ%UMiUaHyUjZeCV!+sZTVV0Xt4p}FjdFr_*d{M6XC!ps!
z(?p<!8j94QhbmfVn|$(RMha#KX5lk{IO=16+t7Kbo11d_DX9MVxhScnntCd#sj6yY
zRH2gP3V}G@@r<h$$_2<Q?|n0=qn*UcRSmM#I;@^ekl@Oy$#w~vvdxyrth3Qp<_ZZ-
z5bISO6Z+GQB<Lg<&wSU?XH6kUr12gjeOQ=IUSwtR>sFqMJFkvzkYI_l`FiN0zWsg}
zqQ3znl?Mru(5uxD&<NH9K6}xJ$|eW9w+}FYAYl(z$;3g$l9mi3)i-a2^2Haf__IzP
zW}yG$tv}6}(MOPZ$YKUHSFpU*KK&$F)jnyUvNKnwm@x!_MP4DSKj;wBL>%~Z6Gt51
zOofjnU${ZdHJS8sg^?0_%@?&`2s}1rWRiXMm}R1Uwh_mEZIu}~NV3is{`ipK7Vf;=
z*gkP$wNDD6Kx48iI7k)8A<d+aOfnyvQNw-KUXy|=jO;}M6_7WftyZW+@i`Kqi!S<{
zT=juNC~*+@#TC8akc>Z6#Bq%)_|W4z?1LH61TIFL(n|_HxFSRDdmCRCRQRsF{85QA
z|Ge|h`%5he@*Yo^Ve~z7$MHJe*UMDF0uIkNB)GwAx>FH?dL|_7LjpQfbRvnteBuAI
z#U_6LO#(Fjy!$>OLeYdJJuVdO@`n*}H;fb{=?lMufmyC#vhGn3E7YoiGo+`%4RWx9
z(yD>mDyTjQ(FYK;5@Ch#A&DCJATOc7K_=>!v^YdcDvZd(RLrosP=o>>DKN}6EK$F@
zltX`6nVb#HunrPrf`=dT$0>#YgGnV&Dh!f}?|NaawwwZmUX+TxYM?w1q77PP444_u
zs4D7h@oPYviuK-Ok0^ZcTi)si3_jKm8IS;W-$2VX+~<!_P{AL0Ifa1yagBcb@Crd3
zB8Bilf^H0h1O%!<7x5vr{>5%d2+UnCYJd+$kl=S)bYLA(7!P}q01SC>g){$RDa%>X
zvX-{IB`$NR%U$xam%jWZFoOvUO9Zo+#ylo6lc~&P4s)5#d?qxbnM_N70V-|unij1R
ztO`LamGJ2X4sdXvsYt?bP^^JCJsA&ivLHxtfPoB*;6or<!V)+l7!LYCAp6un1_&Ag
zI(;BD1g4;n{b<`2n&66Twq=6etRVHEBGHLbw4xThC`L1?(T#GnqaOVzNJA>pk&?8e
zCOs)iQ>xOHvb3cx<)}ly#!#xn(LH&4D17j7Km^9rdhr0-K6c6^BYLVIMwCjB@X?PN
z6c49gjE5^E(FDj*wW?OVDps?q)vaz722f!ESGx)o7=*Q~W<4ufwVMBew6e9WS(PYR
z-AYxjl3=ZJy(?a~YS+B-m8)>gD_!^6*TH7h4Ulw{*1m9!FMux|lCYX!_OZ0tX>n_B
zd0Nz@k~Pap1sy4)MqjLPE~h3aZtzNFC~9zp8pMILt{oQj@(`J}@$a>HS|tg@NEtTT
zwo_poV`O;S+xJY>SZ4UbK77zR9|)@nSAfPTr~y3T$zT|_d!1CKJG^A<qXvYKMGAxp
zmO}VqxQ(GkO~2TWYaG?Q?sXD0pc0y<(3X=FM8`Ejh1(j)Hn`TjZ+<_u-~K{IxbI!e
z=Bh>wD#!u`QfY!L%6GtCK+rG~tfD_C9KnT>pcAQmB3uB`-UI)WxWp#rRD4M=U!~L+
zh5G<;tt0^z0yBlShuzzYuO(v=(0C~}K5=3KV~I>$gJZE`ZXhRo$}WB~yGuSr4R{!e
zfx;yX+W<0_v#ez&#RG&!$RJW$j6!^X?^-EdF^i#M-|mrFTxX`QnzzgsArqOwa3X};
zSU`xpka@{i1m%*^kpiiqBfVVNM6Tql=tVPHF<s6rn2XZ3Cak%F>o|;=L5RUL*H(m=
zo)<JU9qFTpxzS&tLe}bx4<A_43<e8z3RtkvQ(m~B8K(6h$%=z!@Z}kkFg37)Eo`jB
z!&sXhih+myElnfKC~T~>vKjN}8Z^5o&yF@+i0YRSdj<bo*#0)SvAkd4mLu6-#P7kz
zZSDVl5#97sH&M(TZhA$5+w;CRzMuNrj>y}^Fc#N<k<IQe<~ZG9>~XmVp6_`9Vk`@P
zIK)-C?|zTD%o5u%jjLHOZ?@TM825<AZya$~p`u44KRL=hE?<SG^3z|V-h4}4N0)mI
z<`9v2%0p!hOXa-hJ`dH7JN<LSoEd~dA9`Ji9%rO~3LkW2I@F_nBx=R<q3(X$qpJn&
zb_Y1!MyIsYId#*plfCTWF8JP7Sp(Oi9qVpbyV?0P31Gy%?sji<$Bk!bFXlb%ch}P_
ze*O2s6Q0C0FML)Gk9cgCW3-EZJme!U`N`+$>6HJ!Jm$r9^~-NQ^NdbIIXo}=(L1W`
zls7%;wLFPL`v^`rg~#1eFMGaQ{PKODJ(htXcpX7XQr?7z5o&-J+!Nn;il6-Pi%(+t
zO#QTVbOV!>Fa7CLU-I?#QMRPAj;3Ct8x_QXx7LvfOSJ16lHgqR(~qalPoDki?=2ww
zlcR)P;~H-8WQLDM!S`(|86lhCDeS`)P}%zx;E|x7<RPE|l2*z2NZc6AHQ?VMAx-zx
zz!2yW6>JJT6w(5AV2<40<bj|E;*>P-9Fs&KRfGZsijWz6!_MHt7wp{#&LCnWU*y>!
zr@T?T&|p?LU6aH^92fyK$U-l40~LJ1%~1bPCICn#5TO|ufe`Yb6iy+%d;{EZMd47P
zRg}(?Sc1J#kQZv9#PoxBA%+Y#Nl=kR8Xk%JEk@4x#TmL+8(xYPenlL1;3S-o81A7q
z!2qTuMiwr{3i^e8qyU0s#UQ#tYaQUfF@_n)zz>0qIY~t`Y>E$TU4m5Nr6?euXv|be
zMJQZBCgjCFNCFl39wWqoJxztin8A`TLIf(-0>(q&Ma+?qp&FK<@vI>qa*8bcVPf22
zSCGILf<+u0B32M1Rq&#Yh~Q$xLnQKrr!;}ZU80Uq<E1#`o=_Mgbi&%b5NBBqHQ>S~
zS<X~&qc_@(p5=kV6re9`0TS#US7`sDV$^^iYDFS0qSyF}RTLsJ_9CDBVhW04yYzzU
zyu~$i0xo<(Yr!HR$YLt4qCYsKEJBePm_hVq#XgkJHJ}4pxWX_nNGE{eMasfHM9oE_
zh0-w1ejH;8mgGi~Ku0PS)L0xkm;n_a$Vq-fN?HXq2#Y1e!%zA{P+o(uWI{X`rT--5
zQ9=VS5+WgpK^)`-G*ZPkJY>`O&nbEfKIFk&T)`-*;#8o65o7{71c?vy!b5gsCJ=%o
z2u)X%;wg3{4oQV1T!UQt9$A`YkPH$*qC;E0rSoycPzGgTGUZY#B~mJ;Q@V-~7)%`w
z!4-r8J3>(kFv2=a#W1wvWBUI?9r^%5USR=F0utyUS74(cJ|$Hs<6r2adlVyIybD&i
zBtSZfK!PF;aMmfnKs^}_c$MYa`M^5v1vHqWR0t;_ROacV&R|wWG8oJ5m`oh7fElEW
zKe&PLRHr22KqoZ8A;iw?)Xw1`BX+_{9z3UtDO85J#Z=&c%mmAJcIS6i1$0g1I@Bj-
z;^%#KQGW7gW-i7zz(5}Kf-+WRXTd-m01rCILa^k4;lu+8pbiY6LvcC`J~TlJ;6M|o
z3v#j}HCR%$)Bpiug*cL<Kj47Lz(Wd*k`avKA7QA5stY)B&4-#nh>j>%=%<eQ=Z@NE
zt;nQ5B*WUV77sC5GF<-w324h^P6dz(sonHXH;85d-T`dx<yk6{LNa7_9ppsDVq}@3
z@A<=RlB5}!Bu9E=Kh)${;-pTZq#3~GROsMf+(CJL#W2i_S{lqv=Hyfe4bd19Bk13F
z)~0P@nq*SuUT~*BK!b0J5<VaZXetuiE$MNF=KJ)IYz||bY|OUc0)$G9B;<i4!A>T$
zRskIlZGNghgesKy4IvoGHL!qGWCB?Bk^ku9rR0GO6=*arja0AzI*8)0UIT<;Dq2wL
zgH>Z_Qp4Jjz&B6<Xl=zQT;_ki&_uS@v|{E|pr$_@s)sh~vqr0l4S`ugjz3)FU<gLE
zT7ttME4iYBxmy2YlzO0RR>g&8=!S}E3IHb*@unphPKWMAi4N45mS=UMXLPP-*SIHx
z%0hg4Cs@ov6ok&_Y{3?!!Nh`|SIC%+nt_8c>^3c@>a<1cV3$A8CZX!dm=b9y1fa9}
z11|XHAIj^bwj<3V(L^?<Rj}sCBI7VPm_Ou!sJ2R`M$r@vsz3a!R0wUWQpKxgmpRFT
z4@lCi>MWiZ!GuT>S{P{T*c0HO!w?`%ZgQ<uAge!cE6pyLKR6h)cEyn<sZ>y#40vCV
zBB{1;E6YY#A+fEvmY6HV+6wtY!`LH%<N-QuQ__+E4Dj0DvH&9lXaCe;%5p1%t_6Z9
zDx=y>Xj=cKwo1iqsw%6BimSq^tol!_k}9sMAwI-|JETDxnC4bUf~3fRKcqmc&gvCh
zs{h~x2?WppA#KX$$(W++dY$Mg1nAn0>630t%}xc)N)jbml2ky$KU#$hfEHSyEQBto
z`B3fdE~->;4AO3|ESQf}T(96NiIFhUB7K1*cyFe1N*uVsg_1y!aP33l1CpY{W33kh
zk!{kp<GC6PTBPmX#tvw~10%H8x;jkzI7|aeg{!46@m_=4@-3E$m;R&|I=GMk2XC@Y
z#hAX2)Wq!a&THMmt(YE$(gtl^@~l5RZH7hd)Do@LdPO;08CXbyC0s*cq=4&qt`FcW
zBPjn76FCv^g0P#EFASK>;KBfbgo5IpLR2WPHA-$JE$;HxAwK1S8ywEdVud8IfDGUe
z%AP9;_<&Tw?-v6U4hYoYq`-utu^MmD7?-h<C~lIpPw>P88-ofp@KGkzK>t7}f-)}&
zFhUBzLp=CE3NVpB0B{!bT9AU(-CS`ETyX3NM){&2RT!=~Aq^uT4JadSGFY<U1|Jk_
zGOFcU4eX8#@QM--aQZ4Q4jeC8o$%U4@Cr)>`I@gkpznUjF#Gm{`@-)H!v_!haP1cJ
zF;7w@T~a0u)EUpRp7;%%a>ZJp1$zz#3mDoyq?f%Jm0DOuIA=va2&10hB35`yOz!{8
zPmx7mdIf`Ng{K5DO<Bb}r*F=o1CA>3DYH;7PlXi202OcX+LbcWFtN$lXdT-n8P_GA
z!N4BZl@Ita(SEUyEb|Zhk42jWKIxOB_R}HK&>UNHD%l5q=!XP%4bsKU6~KTe(+44W
zMK5FyCZhD;?X$g>MLF|KdZja{2=&xhg*xkW_W%i1$m!7GgDlg>&b$#jUj;opHBw(S
zR%dm@Np4lxqiSk3SckP(hZ|Q{h4PLyTBo&I4;Ns%C0t6@0JV!J!d)niqUV0~TIaQ1
z@3ryN=#9n!H8M?x!9X{DV{UTIUGueKFE(S(3$u#KvqHnsUW0>mW@JugWe)#zV{bNR
zcXpkyawVAsgi4ZNIBDJ{wr8idYOi*Jurf6?fjwD*wY;mjRxoO_Hg4y(Zj%KoUxQ?`
z01Wg`;|A^%#|lI5HgYGoa@+GVT17T5H*`n0bWb;RSGRRvH+E;Yc5gR#cei(cH+YA)
zc#k)Em$!MJH+rYHdapNox3_!0H+;vpe9t$1*SCG&H-6{0e(yJb_qTulH-HDYfDbr<
z7r22RID#j*f-g9OH@Jg8ID|*IgiknySGa{=IEH7qhHp5BcesatIEaV1h>tjlm$-?a
zIEtsZimy0}x44VHIE=@*jL$fY*SL+}IF9GIj_){+_qdP$IFJXqkPrVkkr%m<A32gI
zxsoqAlQ+4OKRJ{~xs*>il~=iyUpba%xt4D^mv_0Be>s?kxtNbRnU}elpE;VRxtgyz
zo42`}zd4-8xtz~Ao!5Dla|0(_0xeX7o%cEM&BHuQ#U)_D5)^u&!+|JF1)%#mqfcHj
zjKLCMfhbhN87#pQz=0!(f+MU!p$mdPI0B)=!7DU6sTbZm5c(3FK{Y_S9^`^Q$OE7I
z12I&(AVdSIV?nH!x~|6^A{e?Tz`+vefmG<h6GS>9yn3bQxuIXet~Yzx_4*Qwfigrp
zH~0gv8~PG(f<IIP7K{Nmp!%^pySPK$D-`-A^t!fBJGMu=RP_IPE(k)QYr9r>gE!;@
zRnWV=bA>v1gFZ-wJQRa6+ylM)1-{>Vy?4dF_xq~@yuf=yUkLm=jJw2pg*<TjE1ba-
z5Q9HZ!nzlFwHLz@Ai^a?d!TCtq075JsDsCMg&r({#(P7tFF`I8I#Yke$xnsKFG00)
zMa#c@%+LH1)O=QW0~`c8Ei8ejPrTA=g**rXw~v8T{6fcLL7;O(u)jjmZv`hTK^IJg
zC~&=3aDpE2dAXlKG1P+|2zy^_eb-CH*S9@ah&|b-`q`&_S`@lG_=7U&L833c-&@5y
zh{Cs@L7>kAsvEl6!~ED!I#-NCp*y@kRC?e4!X=0T<lq0pD-c65TtYPv!z;W)HMIO1
zyaGSG!l*}m<zIg0Z+<n5!z(C5RXF|<K)&RozU4~==4(FZdp_ukKIxnOR44-{a6&ck
zgH+_h=Igms9DTNrgX_b-R7At@7sFI|{yfmaCB%a9|Gl4cLZvT(GMoVxK>oKIIvhm2
zKg_%!#KNI7yH+H-KfFVsM?Ab6x~u1Wp^HM#kG!GZ1I+`3KS4_fF3IIjUBM-yek~E?
z4`ReKOE~#^NAR6Mg$ENB6s2bgu}cc?5$xx0WI;p_;V4|$r64U@4j~RK_|RX=CpRPZ
z^!XELP@zMK7BzYlX;P(2nKpI$6lzqdQ>j+9dKLd`R;^pPcJ=xdY}l~MCKlub@>0Zi
zuPCLBIPwxAg>aM!O|=Azzq@e!DZ^VW7hZlH5xsf`lGr;(OAvu8xul<8EPw?QHq6b@
ztDkrC?(O?GFqXjt3m*=tn6YD%;|S)ewv!t;IC|uT_Q#DNv3oNgzQUU;*G^hFmz){r
zdx==(%b7QK{v3LA>C>rKw|*Ua_NXoAHhd_L79u^fDG~EG@63~GWef5RDvuzyiLv}~
zS~BJp@^KyOK}1}CiL@T;$3Fb@<Bur#mXL1=`U=dCp#2Ey&!7M76VRl<#(+p3eIU}O
zm`lonh#-0V;jKc7Afkk(mNc7(Abzx)k;eZTZM+f39Ch50#~yu*Y7B*zP_HF8un>}<
zG1hP>C51K=swI$?xCbSIu(%QnZaRv{!T|jlFeNOr+_I=B38FGgEVU$v%a8!X5Hint
zdgn+iq$F_(6H#o5KE0OUt0nUulkvww4LuamL=|0>(MBC*Do7#q80SbNg}fveICd)N
z$)ExwNDqjL`O_bMUQuSWC)zac!Y@r4l`m6KO-R)b<)QMYPnQVQA6QF0HPuz$bQQ8u
zpYRZlF_aNySASSb&L50Uq-i8xTS}{?Vu&U5(Qdu{7Tj>f9hcljBNbAaUn;fKN<?T8
zWz+kHddy9K@&Og3Gy0)b*j5L;ch~=X_Z>1K?|`D$JbUpiZs1x|WYx<7^{I17Ec6MD
zlSn<>365V-<YuQXj(j4cY_}~J<&;%kndO#Uez`tTWS;qwapW0?J0am9W?fERnb{Gd
z20AvPYGB$mBYypJlUX=VG8)vR35LjEpoaDkBB+r@XzGXkX`0xR#wkmWYDyJkCqZC}
zrpkq8TFIaF2s(qCrL_f^TbT9UoA18;{u}VEy3pg5SS}e)5K5HsMwD0zdZHqz?!o%0
z$*r;+s(kYCNgv81x@U8sG!LBg(oH`d_0(UkhM*?|xg?dJMcg%-c%KkO_1tyeo%h~-
z|Gh@m+4YDM+i?dT`Q(*fp85aglNWw?yneB-pe~%h9{cRI-=2F#tC>xY@Wme=j*O@u
za-QzhU!VQ<-G86C;u(XV{`&2|AAkGb87Ke#{r?|;0Tkc>30Ob_9uR>ERNw*`*gyw9
z5P}gzSwHf|kCP0ATleTs-hx6wpuB^FKJlOgNmxP?o{(j7@diYQu@DR{ff4{(5Dba3
zhBNpiB~J)iP?Y48cfbvWK@{Q;iFl(?xn&?38Hy<Cat17nqaRGH;SD2#8$JADAawys
z4|{^PB7PB!VH9In`0<3i=;H}|DMlAuM<r1V4h!-a11CoE1bxlXS(<_a|MbBLEL@@s
zRD=j_1mTT)<f3kZ2-W{Q@Z*m$bb%6B-~@<vGKPDMK@X722O^#@hJ^W1l4BI*C`n05
z7Ga}>wCG0~U!lV)!GRL|fT1$3L<?EQP!L#n#TYg;6H2g1kW0f0Cr)BRf4~QKLAu0Z
zXfci;z2Y&7^UX(=@D6V<W+cBT<u<w5O%k&15(BwMG#ny|D^-bqw{&EzV0f=Hh@vHj
zsg)gnQVd5NDJ{mlNHSHm%20W+ByiJ|DCClh3o#3b-c;y985%$=Ji&GT@D3*^S|uu}
za}4aH1bogwQBKGslMtb2L}+0gh23xs8)8i|^Wu*u{8LpWaSIzgT8+g}f}#g$=uUas
z)Amu%JoTU*7J~malFeaMqmJx?GW4(peaz$%_6cS}&X5YZ1PyKWbfGfsGn|3^q9l>a
zCLqT#Do*4A3p(}bTG`rG<gtcm{%B=!)KMi5A+=OAtj3YLAgIOgGMN5|1$Xp7rP?{f
zg=gU95*$ILnM_GV$J9wh_#qdEgwU;-)$C?Z7rLe3Dk7fyiDyF#6wi^iC!!r8XIa}?
z*S;3Ev6by?X<J*{-WIpH)$MM1+gsoM7P!F`?r;g%5996wx%g1-a`6$5craJF$lZr=
zFGyVLUKhJj>Bl~n>s)uFqa5Mg#(1q!UTa7Lz2>#Xc-gy+@V+;^=>RW$%h6u)nisw4
zHSc)en-2eXIQO~um~M6nTwvGsL%H$zu6Va`-u1dSzW)udfQ>7i?RHne3$Aa2rSaeh
z2Y4R_7V(IQh~VbBL%a@#u!N&q-A7%xxe88khgTe67n2yrIliBX;{jd{*EqVS<1vcs
zTVD63!@2mlv5uMC<lk|($K^OLkVEV|1k1R{>n(>n1ngulf4OhmMR9|*{9h&CPs~|%
z?|-WdW;egNQOyOfk<0PiHXHEDSuO{X@d0N)|G7p8Msa!f{9F{uS<2Sf@|gkMXh(--
zA3bicdkrnh<`#JyNWSx<Io)Zd;A7C4j>o3E8R>LPn#-P6^{Rhjk0RH(&zZfnmgBKx
zR^R{n%lJ68qH7)7ez<zQ>4-J1iH+la#G}D=Cbf@voM8>a*T3#yF{6QZY$<QU9kwp^
zwtsu<1`GQ~SN5@r!z*n7PZ-1AoiB&W{9J9HZXfO#uRE5_ZF}1m+18+Uk3cPDX{_1Z
zR}r_rDLrh}#e3fOzMneG)}v@BaohWlaysfgqka=Q;L8#8wUwQ_cq`iA3SZwmXz`1N
z>u4OQC<gzCjgRrhV@L70cB-v|;9Y}Tb;#aE$VJXQT8I`$Pc3#o>dSK)$vo3W$Bwl@
zt~!@*qvAbh9zXhY4{xyiOWr`Ob=09nd2j>b&gyA5$leX6EE%~+K}Xr6j^KA&<?a7U
z;cnEi68ELxL(1-$;8XBnjdVzTd-BkhKKNG*T$x9k+NlONHpjo=4D#^}g$D|pQ2D!)
z;3sNu!%_ZFc^9-oC}{`EI+D=~r8gxRFoz0v?e3Fn45JrM=|?ZB%iV~4107Crhra!x
zdZ|zwEc+P7QR0z|sGPd@Me%)9@KO5Q3uXEKxQ5xQbB*ZxgY>2c{O4X#3=e_mLv>Lr
zcE%Bly6{68CzmKs#o-V^;3O&SfL2d_c@$B+KM9ctis*%sjMJZ;`C1PsW)CV{3?07V
z_MWdPh_1n?0vfKbD})az1aK&xZX1ds_Nt;A6c8vfa7L^zDEx2xeggftMO**0<wp7;
z^44#s+Aku8K^DxQ7YIQTAR-jZzzk%;2CpCo<?kDCP|4!J4Qv4-_8|^_&<y$v9rC~o
zsG%pAK>vPXyNW^ti|`w+A=df<9j@UTLhKvx;Txzyz|bKct^on}feWi_AIQ)QBVr4&
zFev`-C-&hAuK^+mFe2!X3n5}1sG$oXq8rfA4$F}G{GlJZp$okb9kvkWx}gm5;SY<V
z9MG%Y;DHMpvC5pwAKtLf_5m8!VZi*s5_4}2ajy)g0w2188ir34uR#GhaT8s!CsMHu
z(E$u2Q79(y0*7KBOfM7h0UfAe9r*AP{UH$d&>!f~4<lj&dtx1mu^0clO!`2u2(LjH
z0Z|a8f(;=N<{<GJ=)nzN59ai6*s5>@BO+aXVIHtSAFAQ%ZiE=TL0jrV9bN(J7Rm)7
z;tyPa2~fZbcEBIhfC%Ow3);XR7J&!gU=AWd{&-*xm>>}J;UVn+BH&>M91<e;fd{-`
z4qTwkpb#kJ5F*Sm8NMMNGB6peFZKMv`5y2jA8;7@j2^1+CF3C`{Q(*t@Bu@TCxN0D
zyMZ1u5D$}a7{0L=A}#g0!T4q`8Q@_Ukn1EP;u?}+7;@4dzM&VcVI5+x7pNf_lHn7N
zqVJ3jA52fVrg0>}5E_~*#Gs)Uz!CvTuMEF1D|-PNl7a4KF)05|5*^lI_~fz;zhNy$
z%^%b<BKXoTak3Y_K`@nX7vs<^bFvY$@(QId^`_4s-f|tF0RgA4xtLJ_r;-ryAu@N8
z9@=mu9dRW!lQWS*>Acb{xp4N@VJlBUGIz2hqcSbeF(}lJD>~#V>c*$?(I47i3Fd&Y
zk{}*-z>~7T3;baRCPNvDLH@cR7r5X#tAPs)(jThxI=uiFlAsO#APIIMB0$n8c&-YA
zk~W8d9&8dKa5MLw%O+2P8rKpc>QnljD+8&~C#H+Ks7uOt4iO<jC_S(-GZPJ;?<i+a
z2_wP-HxU6LB0*{ID1~tmqoNn#Fd1pD`Fd|Lt7|9YQ!D?wVJ(gCLX9p!19U)t0vbqh
z_@JRgp#em{p}OdSM&lDkaS{PPv?%N@LRB#tYwajE(d@Ku3oUaPLGuoabnOh(Cm6E`
zGcZY!)DER^MUAUPeS#X`VGHqr8j@7{Y_UJ%fj#{a99dE%c~dJo=N?`m8h~!Mh_el{
z;1*OR32vd9{J{&JGYM89BIK`b_8<!&!V9=lQ2l{WBVh^rzz?thP$2?6dm>A<)EW$q
zCWnDGL9sG%66VY?9&+?PV=Yu6!uo<SKCdqx)QeT0;TfVYEHkr7BO*)<)Du-N^@b8c
zd*T2S&_D?g3o}$hyCEx06%n5g5_<t2QZ*uyp&S2b^SPXG_{8uhR+UxF%T=RK`|x4-
zoE2IjB3YN!A8-^x`;1$0vJ;I@DuPr2&-E&glo<2VEn}@23zHSUf%+o!Dkrq~<W*L&
z?@D{ZTCdd_vXx7L(H5xzUjY&KoX}Hka#O3!9Gxuez5=tPVjO@Y7hWM1e&J%9LQWNm
zPTSxXn7|*B02Yz}9b{n#{L~4$QT`x;Pz@DPp@mRMAqhw!7f1mc&NB)RlVHosV0W`a
zLu|VG6)Qh=*h+Oj<C9cH)l7{K9eM!*gJR2oqCnm9B!;pwui+?@v@8u#U;nit9rh|2
z6j%{fL%}rzdocrJ4IM-^G_O>-q}3m&^(g<Y)<w}l_=XP|%@rcz79z-1NBb6ClTlrx
z;wAx60cS7LiZuhDu`o?_LhIFWPx49^mqI5rGy6;yBR60rQSW|23>OhheboPEaucbx
z7mfCUCRWGPAs1G#D8_*nQUSD>f)?ruBKW~XAmSYorgDCvVueB(?olZ8Ar(Tln?|-|
zPqrjZfC!erWFHa*U_cFG)*t+!Q2BHRV4xqgmwV;m30$BCcmNiBHg89_S>KWmhv6&x
zEH-5kRG~ILyR!G}H#VuEYLkLndjTD8a`uM7?DoO=Xs;jK5`e|_CwgHRp06LilJ;=#
zS7R?&Ij|{gk}5eD8mO-u;CCep^DY0?6&i-2C?U}wrgcq;;v@l>6-&4%jS+-ZFDP%a
zh0($I@Y8^&Vrqv00qfON?NV?-7bm|GF9FekL(FSmG)H@QLa~w+x6&?8f{3A_bQ4zk
zdZAbqvl#s{en--MnM@suAr-VJDRLoqmm+WGL9K!}Dz<JYj`t{-w|SQU!17}p9zs=E
z1P)%|A?_iQ{zxC7B^P4oYs{!01{op>*&om<khmenCRIDC3wE(W4Ly(oBO;Tvi&CGG
zQl*eO-mS_ub1OEPlZC>R*%T;fVR49pAG|>sq5)UXI3iv-mit2<ltCGOmmBV(8j4{a
z#wi*?XE1VMbb|LCilJ`6;T`{!;U1Ksc%Q<So5>&AQ5h&?9Hz6b-XR*)?;fxrmIvb<
zz@ZqTxrokT34}nMgJSFQ;bV;=blgClB{@4tZz@AqEADw1#1%*SVJb1$N5Ha#S6G!>
zrWnj7eTE_z$~hO5h?c1)F@9kj^uZpF!$UTf8&=MDbK!TvVPlCwH`XE-)FBoGj~0mG
zRLoc^ej%bAuNv0kJYHcQ<iSMp;T=*Tv|{1mUZEYk?>I&&AK*Z!-6Je6VW@pmI|v#T
zd!&DRg#QXUaJ(V$h~gdkBrz5lSL8u6`eGc&SyaHGkyq#)aOD?%_dMD-7G$It#&{fH
zxgJnZDzq9Rj(07_!FK=UAs^s0cX1jbumJ^mx*8IOr=gm#3%e=m!Iq2yoEO=laYY`f
zW*n-4ZTz8|8##^3IwIIuEfVH<4bK}439h5!u_el`o5`-JBp<5bR3d_}du4^>svU)M
zunn8GYg;Jzfff?FC}cNoQh|3L8a(=e8&Y8$5St%xyFVVfV9YwNH+!zj%IZLyDuR2s
zCmNcnSs(7<B<`WLTe}*Rp&!UNwjpA+ZQH!fTbU;?7s^-}gmYtc>K9aQt@|QBv`D$B
zru!nI7-GRN+_*2s*y<c3w4)-vi(%!Q<rQcl7v{lsXZPe{r*3xR6}SPgWt)!A8^cF1
zqnF~{?&?I$T8;lx87e}kf`lS;-ZaBg+_r<eDr~nHXkoI!MHv=47Lb>S*a62O0>^jU
zA9g&)d)&u?oX3Sc$9<d~bbQE-oXC%S$^Bs&mVwEYT*;e!%B4KWi5$s!yvl?8$)h~T
zw_MAw+{%-j%)`9QbG*y5yvW7;%h}w_f85R2{LGI$&B5Hu-~7(y9M0SP%+>tJ+2P5T
z!OxqV%H#ac<9yKVoX(+~&<(xO`FzjuT+I`G$a6~{Vu3;~r(F0UjlakPKHU)f;RQb3
z175%%41v@=U=;iz)r-I%$RO31!5mVZ4E&)8Qr#RzA=N{D)IZ(SQJvIRz13MA)J2`t
ze?8TOoz(wb9o9)*)@j|=ab4F*o!5{3)RUdqKi$=--PnEo+JimYJ%HI`eb!06)^DBE
zbA8vlz0|+`)0JJ@v%T8A9oXMJ+{fM7%l*^OUE0^Z*W10`RsG(Hz1IKT1N>py?LF0z
zJ>Q4D*+1PJmI2z){nHVC-51{7=N;g&-Qmf7;`^Q3|DE9#e%T40-48zD1s>xA{@F|Z
z;XNSYKc3Vrp4(S`=5<S=Rh%e3y#?yv9Dbk$g8m22p%Q{V=quqIjJ^e|;2i2e=~;mp
zl-}p9K<SyG=#AdzfnMl|Ug?qE=zo9>&VdGK;0F@n9Hig}(q0PAK@-wG?KR=&-9GFS
z!R`NlKo^*y?#-SJ>Yf?e-tEmE?bV*`>mKgwKJ3T7?9blq*WT~nKJL?g?(6>U^Zp$6
z-tGII@&o?|7@zPTAMC}R>;ZrA2jA@rU+&L=?%jU!|Gx71zVQ=Z^EtotJ^%1&K=j?7
z^c}zMWk2m#AM#P3?{$IlEkEsZKk;{;?GgX>H{bY8|MyeB_wk<fiT?*MpY>zE`Dq{Y
zmw)Kn-srvl>$%?Op<d~k-sz2=8CXH;&w=WVUi^dJ=aqiwi@xG>>$`P+=RM#Y_MiXz
z-~R#PoWOwu3mQC#FrmVQ3>!Lp2r;6>i4-eZyofQQ#*G|1dKBovgTIj^OPV~1GNu2@
zl`LDjd<iqA%$YQ6!hDy@rp}!_d;0tdG^o&_LYJ}nh%~9vrA(VTeF`<I)T!q}61|Ew
ztJbYD^~Ji!HLTdNWXqZjYLu$lwQSGT3F*NE8FCVTv^dAc12co<JXj(4HlztQbTQJP
zan5er#f%$Mw0btO<jGrejiZb?v*yj5Q-*X5IyA<&Wa`lHP)TBryLtB(?E80M-qJrj
zkjZ%XTp~lFd;4Z=g-qw+#5+e*Ry?`#<;-V({tZ2P!MD23v9fLbhlv)cO&4jwEKv><
zG^(%0tJiId7InzMCYZN6IT|A9)>+^FoGvRZic~*m2n{V*q0Kqk+($+Wh*|$p1b{T$
zN5fGE_9sPy(p`w5M9pnzRxbTuHcn0)j!0sOnmw0cijKX-MjbhLkVs-QB(mN)WO$H+
z70j3*g&}^Ob6#t@cp$}%mAogL2me{&!7)P?iP|{=)<GUQiFoh>lMP;J1(S#ciKUNQ
z`sJmHW}Z3F4@H>Brclbfq6}D)-4jbbZQhAzo<X6AW}i_77MB%tX;X<6CWv68k^&uL
zND&@12qrUmwdfa;0>vi~lfq2;mK8(tcFbNs)R&kC+7w}edm?<vnxZY_a842Rkwc!J
zwn_(?p1Q`Q4sw*`^3JZp4omDwWW;uBvP!+hN@3@a^TJ>+CR(5{s~Z1e0;H`n!(?z|
zBw{Ig|D8row`6>K9dE)2L(X_~IjW6z&(<2Ll(3HKUaiXR>sYSE{!3Cdm-(ZQJSB}2
zELX}@18~C*E5}a65>L!;#T`*c5HpYJ(t-!%+*qI{9@H@kmOySRG8>g}7w&9zILgL3
zDX)B_f|UqJ&TNK=0PB^MvWnhbG{D-a6doXEane-z`|z;8)N{{0(J(v`HuFSN&sO97
z(sb8eo3)G~FTh21**_?aHboc{M1}|=)TRr_&%UT&s*1Hnj?s^5(=uEwkWpaXAr(>J
zC@<15%ClC8fa5U+8m%B=cc(YBfwF#wblRFP#q`&CDw7L0{@njVwLiu5GtR(R(W#H;
zuD>pnk7ch%d+mH~j(bFWC$zgl<P<2;?*#!rknjW%zmOrG?r34|&Tqtw9Iy{dI!V#!
z<IOx-^+Sun(|-?sOw0H!hbrNmkAC{$-2Qy~&g;Us2O=cye*F|(hj{pR@>9((^Stv8
zc~qlxS1E?*^oPI%mc&sW=z;mv2f_2P&wdn4nl?r;3fEL{gA5^?a1_WUZ}5XF-XI1D
zPZ&N1LL!1JT%QN5b0PO=;~2+qj}32#!yM{xhdk_|4}V9)9}01ZMEv0lYgoi2DshNM
zT%r@7sKX#a@rMMN;tiX~!`?6>FpwA=J5Y$idC+2nU@ZUR*BsS?2euG`JqSk^t#Fjz
zh-z?ejH7Sn_^3KU2aiS2qZ~^W5_44I2X?$;sZ7wVLW%~D9uOoUql3pb8lz)tGNVnr
zx2s>M&XSz`7X#M_$}Wb4JEB=x3&LTHDj36!eoIYgOo>WWvT~HJ1Pv@xxk^!bfRwLX
zPb^m%jvkB>S+?{gE_KPvVxAJ0=M&~GiRqYI%JO`Zv`r^tqK{&54JNdBMKOR9jc5o(
z9<;dTO7tNjHlY)R<MV(TLCHd6Kth<If+J%p;kS39a-L1%mLk=H&r#}Ap7iwRJ@ctP
zg7(v%iwWp12g*;qFyo&9MJW0dT2G2j#i40TXhi>+G110wRG;TlMM#!m&X%Zy7OD6q
zuUwj(YWOOpCDF$(Xfaa~*%YTI9NP-v2~T5~k4Xd4Xj51rs4n*4rx6rtIEc#7sUVdc
zN@XepoeEW>GG(e&Z6Q{lsnw-$wSiWJASC4QR4j#6tX42bSDQLiu&QOOOI_nx)B4D{
zw)L$n?BWY($`Wq;BBw4<2Tc7jj$(L&B=0zm=+q$(ZxrJ))wqW;l<}c(Cd?m|z3hh&
zd)ZCCM3aCmNi;-DqSKzRWTynGYf<S;53JQAD+`G#i~-D`#&)(HsjWM4>sn*%Rw}-|
zZEis+T)6O-BgF--YvtfK4L+s0$Mx!PqeB1P*Ftxc(sfF9kt<9?loloYh=o2j`x3*F
zBt-8pAYx<T4R7S68gP<nKT=^CVu(&2$~fSC^DDY)Smro0$%lEz>yKR6Ngv=??0V5#
z90jlUU=a4&*hu=?H4-!&_tDW(_7cz*pf$tPoF|6|)LoB&c$6b1@rFB`;*P9%mo3il
zi&6aHbA-6YuO(;;1R2$&%vi)E-e((OoZ}rA*~mXG)N(5_WFCjo1Aj%ZX%8q9^^W8h
zlkH!EFEfw%e)AshxUcrSAx_TvHx*|VXDYHb4#K`<YY2YD=;V=)Y9!2RSX+*r!2*tQ
zR_$t8^Bg-uvSbohVVE(-2vR*T3gQ2jHPMTHW}`3i=t$Q!(dnx+jy;lTNprf>jQ&Wd
zH$CcAc1*2EIrXHA>}d~!nn{{|wTr{C>b%Yx(xP_pNv%ARdkA_aTJ{Gm1eQ8~q{2=(
z;jDxGao>@|c_h_Xv$W%6XMb=*&M#TmcxmwqgMnk4rb8WSI|FWc+=Ck?9LedD?KvMw
zdDJabg)_;)iYG6G6|44utvPM)kl<V23gI_g{+;N6do14@F?dK2zGQ_Dyy5+Zc#(~<
z-4_zP;1#F0`XtV9jX2!j9#3e-VMy_Vk6M@?wDM$YQtZnH`^yF{XEmN3ZO~HN+Mw;n
zEAAnWRB-zx-2*mf2X?*eZHWIH+@OVnlde6_-N@o4r{*eaGoXvq;T*>ZNfoNz)T=*J
z>s<Fb*sm(~tXpL3UH8D(&z?TuVjY?iVY}Jkeo;uQ&@Mri$QH{^WW1v??R1Zb-Q6zu
z67RjJ7WsSE13&66wtT$uNGGvh5es!d`=+r#&NwjtdCr1^Bsm{Pn&}%0Xs1Hj;;aUK
ztC41!i1D+f^+q*{LFNDsa76r|#d&p4Knr`Ix`|g`M8V_tz*xbJ#W%h)kspyQhGh9v
zFZuB=oe=5!h55}#-}RF}eeQR^nQ%FqL>`TJ4CDR#(O16s#~)ksM+E&}SO3MS4D4KB
zvL|E|N<aSZ5B;SR+;IO`2qr>iQDHW5fYUQJ#5aEDGf!1u4qd`q*AWs9^nlJMffVQv
z7T7@cS9}pTfqj<{9*BV%=zTq~fh33!CJ2IwhjD&k4s}p?2;orEgn}Z-feqn;D0orO
z)mAk45I5+6oMsI8hhT}t9Kxne<Yp73WpqE$5BWfaRcM7*NQKov3+Dz{h~|SV<TqPq
zgDt=c%g_Qi_=V{ch6%AUWq5`~=!0uGhHi+4X(&OXB!&mkhGtlYUkF^oq*2nRY4i4l
za;S%7$cJ$FfPW}g2O)^UMTj2PIVnX8a<YW2!xLU%C$94jTxb*hXA>ck3!_MirD%$|
zz*4W^iK7!WmI(h7{LqS+2ryn~hjGVGEiiEd0Vr)$i%oTlxhN33*o(d>Ot=_w!3Y<;
zIE=PfjKJs?$+(PW^?c_bUEBf}k(h=GWsHR+jM11r$48AB!z3YrjU_jU*TfCM*EQ;3
zc@Lux%8&}Fu!_MpY%H--WHB|McoO{3QpNC1(cq88pgs5S3$Z{omK6)Rpbv&s49Dg$
zv>1)@WIpR*1$6*Y7g&9M2niE8AQq`HWaW)lwUM~ikrxS)A!&;oS&=4*YA8ufa<D=a
zSqH4pc6}I;BPo+CnUQ`7lO$P@H0gDUSas*fNnW9kUgK?E^Lg3E62kV1WO0=H$dq3e
zH6yWw{9ykX{_qQ;vxy^Ndk^UWE=f(5wtaFSl-`(1aIt)5DV9w|mTP&I5&4$kz?N-!
zRk8JTJ6Vfq8GdzXmvM)e@7H}qX-NV&J;2g60#*;|Xc7X{kkY1DBq3RGqHWReZ2llX
z-o_22gL`Aa4^xSlBcTt1W_tb*3#j##4Fi!bNl<!ulP&p|9tE4RnRl~En-JIo9d(<`
z=$g?uPr8YMgjq&T`8{+JmBZqXqPY_9@Cw{84&}sN?j>0D@D5-x4}!&5&H0=O_6peG
zWn%G}C6Nor<_}tS4>>UosStdrIg4Sro9_vq@hPA4NuTu@LBa_}#4wLdBUuf@55K^e
zD6#*Qqf<^?HV$6)dE6k2@<46_>Xe~Fpq>eu{Utg|I6A544`Jqek{O`8vYPe@q9H1x
zBTAwr>RR}DLhs;&-$M+SDJ;UapCs{fm|0H8mO29?55=I0Bf+3D3Kry)U;|l?TM?cl
z5t^eTBJYq>0Lr0YX`)XGrBN!SQ;L!(3PQOMb>UN9uBa>T5DN*Y5}Guc<s@^X;}3=A
z4cpYCTQ&}38l({lo}h_dGg=Izhl#uAl^v=pA4;Wt>ZgASsDau-R+>N-ia^aKEZ$Iw
zS@sIAps1Ti3!TSVw1A2U6LhhlJ?hY?P4}k685Tu461fnM@`zZkFp4Ae3gGq&vdI6Q
z|H7w&3ahaytFtPfgvuPp85DH_La?_h(eMknDiivMtD8t?k@1=QfUGGog(Yzh{fDgS
z=%lnNt<y@a)!K`;svPgo1zLfpR|=*iLJUKv72rk;Um+R&@C)g>qAsyD>FT1y@~YM<
zuk%W;^$JwjS{(0i23Vj6TnZFMi9)P%C+LI?k)aR%8iiL8ulCBY4ePMdim%0?2djq_
z%J8m*x~?{%4th!y^KhC8+cXRNup>*dCHtfiOB`4*FsZ-^LgA@k<X$`>MobzO>VT;r
z8?x?cvOCMOJ!_vR+Zp+=1e3}MqR_HH@e7(~M!i>PJF%f*!3_$DvpMUtRcrsXSKF3A
z+ZkBU1;5}3#1IXF02C_PNkF<2<rQq+ut_m06Usmgv^TY?sk2y1w{>f`gDDciA_}=s
z3`gq|w2-BiBvU()qXcsqovCd@dbYn1dvP1BcMG|ZE4hiLwZt(Ff`ABY>k{A~t|+8Q
zfh!aD;7zTQO(l`BH6d&l>$t@tvXkq&uN%3QOB_o36Hk*;21X1``-#c`il;jh^6;gr
z+cm8VyTxm~J}bMEfe4pi66&x7-%1k#lTz5gQktt0%8;(}fDH?|qdW1O2rIm-JGaM6
zzUAAq$txMldlJwqd%g=s<6w|L!Lc#XKfoHk!a}^}tH1k8t>_CBg7E(edY}w&Kv{^O
z2ZGQ#m%9dtFb{}837h~2b`}eQAhsi6st}xQ#h?d>K)WvSv?;ZJnUSvd>oxhyzbA~s
zfa<?Lu>@;?1z2zfoWKoFAPBjz1oJQtPv8j3zzOnz2u}b9qOb({pr}hgMn4?HOP~+c
z@C2{m2xmaQSVqEG0lZx~#qF8G^hyU0@Bn4NLW;n}QxHKF@Bk8!4eCPy4?qD~EUzo<
z6H71-YrqMYa0!9{2P1LAqA&&}fe29S4^I#*`e4K((Z?eJ$cTUiM!N*yixTH~#VWxM
zAsmYB_{hUz!ffoPQvd(}00b;l2AjMB5hMTrAOLibKAJGf0)YR?)#}DQ@dW+=2h~8w
zV;~9{dc&9C$Arwhf2?_ee8ju_1nQs%XCMm2%*ZIQsFiFIVfGWZr_AEJ%GIjLob1V?
z9Lf+h$^fv&=mP?qtjf_0v3aW*uN=#CEC_lq4`;9h8@mMMln?x%zPwB@gX|CS9L%YJ
z1$I&mvgi`rP_Q5?4**%P-rzm?uwMf05B$K6R4AG<l{Mg?q?X0L?k2_0tS6TY&QUte
zog6`BV9lcJ&C75;*^tfOoYAt{$~-~NvU~~AfCWpy30Qy}obUuSJr4HV%S-SC%!||h
zAP7%@1!DlZERhe2Yh|i951Pl0JLeBbt$E;(3$H*7!~p*m$HttdLkq+JC!I@rv@p>Y
z%^?_l(k8mm)eHdFtUe{}#o@pQB|X+CEzX#+1anQ-b#2#ojn{dN*D_(d37gfMMGKnu
z3a#_kB*Dxh!JMhnJ(J}P%1{pls1kH?%wQeX<NMZtTGk!?(b!DN0Pq0kLjjvi%9jnR
zDXkNFjoPWL+Cv)?tqN@Y&~zdaA{GkUlsXcJjaXZlI`@Ek@x|LWK?`t8*(M^^q#dG}
z4M84#)*$W8y08q{Jle*s!f|a$UXif;u!*nWJ>6t5*locElMhU(4>PI{*>n%S4cRNf
zZo_>i#Vy_SiQMX=+-RLX(9OvnJpkVP-hXP^{}TUhQ7CMv2vbo@j{;5-#Sjax5G<cZ
zsq@g=;PBfqk(BIRBJRE4@)_UhGv6Rh0i&z{4*&oNpa9W*;Zxe*#WHOPE8Iz262hI(
zaBIIXk(CrqA{Jia@0sD~v*Dc00TMvUqpSlXZqhdnr6*1-po+7g!_`>f6}n5~%wgk1
zPMbM?K0BV)0KfrsP|~a*<We4`Mouin@YOU`4>3-~WAx-366IcQmsB1OR$kv&PSTs)
z0O8Q(Y;K}pJ}kYG=0Q=ceXbm9j^{4v=5UTaqs#%}zyYHy#&<sGBdX`aGL?YN6J<*2
z#3AU9?v2wd0W09?p1#(~{Q#d1>fwOs;gJ6gseV3=uIV5e>B6E6)_dtI@e89j>z$G5
ztv-y?EZU;I&C1>DoBY|Qu0E`;>-72RyV72_&J(>S$;>Vpxqj?+sL29g?boi&RsQ4G
zZtW5f4h8@KApk)QVC~cXv($Y}uVCiT9@z)R?vx?z<}U9kob0_S>+gOrl#K6W5%2Tv
z@A_Nsy0WJGJ`>I?85;}j{r>L@Z@dAoEACG4GNE6QF|+eK+zQX|89%uWuO~Mb@iW0a
zV@?zwJnI;*@h5M$9G@qS{PCe{u4RF?32)gbPxEZ7@_9lFR^0L~@eaXV7KK|d+^|{d
zu$eS&@->h2JbUwa!gM<?6YEVDqFetA`fwS;HV*%3^fRCITVK9Qe<v^N^e#~h)u0ai
z44xB?SoiL@N6+<b&#+#9C%G`$VQ&(ZdKTQnSQSm#Z147c-^S>kQm#$+D!~n}pq^&Y
zqTj^3aMEt<&G&u}`QdD3)-4v%Ao4i7#EpLzdhhsJANikuwQzqY|IHQY`Er9#685|9
zkQ}~`5Bjgq-+-S|rO6eeN%xU#5`n!Ey8jZmUlP2(_MQ*>!%woJ-zG?&6?`sjHTCS2
zj@u)l`Z4kR3Eld_PyE;a_OhQ+V$K!SW+$8)Y*Rzy{G|*AGY<&!atf_rb|N*=u!#^I
zC(2Nr;k1eEPyY$s*wN6e3(f!j_s^pMp-h=Pf9l?WEB4OcLWT_;K7<%i;zWuSEnc+f
z!9zHX9X);o8B*j(k|j-^M43|MN|r5MzJwW5=1iJ3ZQjJ0)1^j?J$?QJ8r0`FW$*Y2
z#W*gOvW34I-m8XG>Qt&#tLl3-Zrm$<TYrIjbq`#wSHy_j<0mf{L4U<)5ql*t?b?ND
z<tgLpFIU1`2g#a6tClTRtz4_UDz???V#bXdYSbB7@?^@DEnmi*S@UMjFnKx#9eV0K
zZ?9;Hj_8yjRMf3qzec#Q7`Sn?`nC1uZ(c5kzt|@BrmSAErfe6=do|DByI2c}Dcs$g
zZS1z-su5e5_x1MekURf>2OnPic=F}VpWo?$`}+0OQt{@lE~`If{Hpy@&R+k1jMbto
zjHVi*7NSKR-QZ)$H`(s-#+!SH^GCsj?s>&Pf3RUnFX#{~ZXy2wtfm@nveSn@6RYwL
zJr!4Eu|*eOgz>x2PNcCaY#?Os9t&&ak;Zyx;fEhu>KSmW67zXQx&<42utR@@9C0Ca
zcyrG{B$f2%#~_Ckk;EPpopoGOZySftHWu_oNvQ**K?!M4y2PKOL6A;CL`s^C7$qgC
zpbP{g1*B7uPU%MJjv*lmx|jE_bN)W(`8@YI_j7-*>q|3V7jw_8Djo4}s>#hP?RLkx
z0dwKv!(GIff$SH0ei654ZT!@75Ga>eCHJ?N$@OyjN?uvP9$IPyzS!mQZ<av*VXAD?
ziH4laDuejLNB5x;2D%#5jzbS0sd?wn6%}s`kqn&Ki5$UhB{5TYhad^#Xj$$WW6Kbz
zq)DI7WQ|G4&ljlz_D))QoOWzuys3uy{*fxS4Y8+>pUtisnmqpkm0EZny~t$fmisv-
z+ks1VI>-5=9#6lAWtF!@fXc3sdC;%*x*tq^Ep-origkIi1Ld1F-q^&4YQG^-Dfd3g
zjj6;eenk9xz7$Fu%-e?V<}X+ZrP1!?47QPxwn{Y)maq)5#LGCm;euq?-$)Ollnef@
zuYHrE#E+Np0;%u%er?TqV1?Wg^w=qDNLJDbKasQk?rGtzs|abg?vO+ImyIJR?W;Ep
zu2tXE*|=@xeL;JY^JRjJ>uuYSOA+C%@v5X-AGC~|L-x)zoI;iy_!#jH12h7AVnHuC
zZMt8`dGyr@euWs0b<2AW*&20)aq=7{xqsmb4|Kf99Td#&5Iea@AA|B<9*_x_vg$wN
zALC8yR@!WNnIn*H>$x1s`_EWLUZnFEy^@2I7wMcs{qcNI>;8?7Z1Z2gw;tHF=Ip|G
z<G+5<{qcnJxx2x=pi_R<t}ua^$os*+d-mGHbf=~tX*!&;wA{GYzD)P~X)@(wf{SBi
zR1C=i)aEZA&2-T;FR0#0`+3mOU*UIGJh4vcva$mroMDMjlm1Gacomk*e^WhvC7EF=
zLf}`FTFZaZD&Gwcf^KzQ{jmEcuO{K}_eo?Fc&v11ukdP^-MlqjYQ1W*lO2m{xQ*Hg
zgPOqiSgHeC8>X82&Og5^Vk}*I<^O}Ii?I$|P2YcKnygp<t)$Gg$H&E@!k{5r&>tm?
zC1X3S*BJC3hCC`=z2=-$s>npAgCEgk{avrA{&Uy&Ox%vKgi%ZT43TtWt9_ldLF>Oi
z{miFfcHAGB@93tzzOR01#dvpC%c%CXPIqCb`adUazV|}*)t&h+GcWoKl$9C3kU5A%
z$mrNGjc4?zI*6q<=r~A@zxfvKa5rD(;ZvjWx6_>tk~IxOPnE%R9!@x+mW%-okGQN&
zRcg6jjErgR_`Ab!NBMP`NB&de?|*eVlJ1>0JPJM=&nA&MDMDp2p-dA5xLTpQg(6Hk
z*E1@?(@FJuN4#!n72;Z#le$EsZoG{F*L}cQQ%zRy^*=?f>uS#0hI69{X%qQe3ftQD
zvifngC;3uw{13g~>ScaE$-f#y#3<~5vi~p?Dyuz3sV;#~YlOmE`8ai*M1#EBHARoE
zI~yp77`}UrqrwAus<@0MrkKf6`7wm}aHUag?Nw~wK7!orLsH$;<R=eC>L>e+#<eSx
zqW<fGmVX;Fs$o9mFAT2`qra7ESkua){x0}4&4+f&p0Ot?l<<E`HysYua!sjmH4`1U
z*@mwzkDh$w{4gNCU96y@<cXloH0gM@AMaBg)57U=J;1DQqqa71{h1@z8>NypWqj9I
zWKH;PP2WGsiuUz1_zp1dnZZyqnt$-vtciK<D^uh4NtyGPfp;6MKF#I)hn|lb&2_&L
z>lNE$#Sle;L6@OSEH;PJV=muM-y>4TCCa=zSf2ppQ;qfZrM?&Q^JIrU?L2eOpL}b2
zhxp?C^|$Z`<i}i^%cp{@i5(&{0z%91%&jjuj1|!mdR7Ak%<YZq<(uc?Hk9eiUzfQn
zU%9BR4$Mh+;<9ovWVg88Zn>~8@VO*-ybuY(a!K_p<FkXCg>Ups^?Wq1w0%-)vz<E=
zE#)TSUan)!K7aakkLBo1pV<bfC*H5$o?+D>ST{i`F6?G;U!;5~zWCOn%8laWjQic^
z4$qEEhIVB{E$jAv2(kH$UKDvGcn5N-H2HPA-aC2QA++5~C;Qq{HAc(>#a(vy7VGa>
z24M!W_)kYFEL%TMYQ|ihg<j5nN^qzy`xWD&S!G&X&2wB(ChshnFEvgzwO?sV-KF%M
zj{h)mdMPifgyT-$%`gj}O3qSORjIkM=3$B0FMro>485I^>%Lpju4C%v@^*1&*oUEn
zF^-W!?MZ)Iyx2x%3aPoDZIZ8B;rkJdjjQB$ht3yGO=Y_^p_%H@H+~7VU%~yFnkp$A
zD}>~(f9!gCxrASXOWP#H{N^O7Y0Njki?6N5`G>GCzv?>wO1Vd5Rcc;dyY2H;Fy7Un
zQ+|~#UB3r+@KgFbm;d+%>i$8cSAkT^b^{vUAKls>e<;5&+2xmo{?C(DVtTWz=ug9=
z{NdV`m_7Z3Jf)e=8q4a%{pT+)1i$P5jJo@mSKHG6^(c))Wj00XXZDJ${|3Fi>O8le
z(KWKvwEU9#;l?pA#%g#_suZ(V%AEd7<L+%ss`Z7{Yly5wF`FdHpu*LkP&@goVYkvR
z@L>IrZ~i0YGcPBTbM}gQg3#A3(|aGO9n!Eox!qmq1)eoMN3kYVk=|X{JRgYq^h<8Z
zv&O$l{Kp@5vbXLr?JbG<dpAhT{R8qAEybhjk6ePRqwaM}$CEn2oz$lPPS+DsHtz)g
z`*q(}U_m*y6EpO*x$m8mFZ>e$>AeJ-<hy@{xCg?qk7pvk*VCJrMV)tip{Q=7>}-?t
ziwFebk3o^04Jf*Xw=aOmU9GlLM5`}L(g7|fVut#01{1|#8%th0Yqe6h=4-4Aa)qw?
zB_E!5l_GGQLaqHhJ^4NUCiuB;B+UiXB)Od}{3~C|SAM%Fc01(rB|K4!E_6H6CNb>=
zmeyEC=|K7`9ud1kj5GvEg!n28c*XtlP%#*dlyPl{U5b>sR5)!{A+&YKzUug1`4yIf
zet^pguwruSjdhBOFd>~se2_+ytF|Ajq!?hc%6cQrr76apnwY~o@0&-xFi|PqiVS|h
z=(tMj=li8htBd_blwLBz*o!{05Dx=W7djy$oDyL#+L3*<up<0|ZzRl_QKSfVpRDUY
z25RqfwdaMAfxT+Ts(9Lz*GQ#U*fQSfxRd&4$3xw8^sIWw7Ti%Kc4IkmrcWKOsGf&a
zk$!<>Rq8U}Q0wW1yQ)%Giqr&Vbnq78WrVuF_$9w&VX(RE_9CP97KuOnpdweK+DoqP
z9?s-1uaUbOS$9ERdlA7KtLfz$703+tCNKv1!i^0gKb^PbCr4tN;U;(cuqW{AEbzRl
zm@sDezuBahBtFy|p`<J4llf@e3v^U9bG@I5S_x9y4X8|H=&&LaEkobRVTZ3*h?|^{
z2cwm0nfua9W1W_=AF;QRYiZ&15d{XR9Mx43h`u+2bgqckcPC=}AM|~ifct4`Wq8p$
zlO^KOuOF4dg9&w!R$3F7$dtX957K>~179cZJ%~Tij9Z`yGmmrH)wsa)MvlOv273px
zlug(&{IQZjRD;2>Ft?0I8-wnTm$dm@U1M31By7yfM0jYR<gKPix;JX>uPB_3-_ZS*
zawEbZEJF<wk+iY+kPG!Z4BXXSTaJanRhoHj1pYW{ph#(0FBayS2!Bo(h-t&OxiYq{
z!Td-S|2a}Uba2%wHK$o7>-wqsHKi0kzl2xf7xR-&hw-Bd>+_!~zAeO3xD`fPUy=vd
zML8u#`W1@T`f6ZO8ow~aEmNVMCk`0N{1?RDYO^pne3E!B-TO2n(vJ_NH<)4R+R)!Q
zh>BA&39I!>jEn?{j>t2IVj_86zBQ%LG4Dt6Jy4lph#3upKYjyuHKFMp)irbOi4f`c
z6KTW!W(y+X<@chUoOF9pierce)X$=Dlq0-D@<R3;UP@}M&05Z{de(`_iK=>Dm1C2I
z_%Lf~$-rbkFNB-so0rwe@Fxg&f?76!0m%Dh6ljoa4_}?Yq14p=5V!)RR_#m=o^;6;
zEIrC#KRE3^NDg}YvKQWWg4C#vw?paDtxxcU*SsL&sSRmHQ*_A<n!e<uPMjp4E%ey7
z>*g%=>K`ZmGfy=cO5pgL`Eg-{=YmbrZY)-D?B?|@5I5$Ue7d2`xD|EZ;O;m{HQj#+
z_Q1PKL_vRg%}_k`^U&P~NWssx?dsBtQ;(<yc>}Zwz4{LJ2)~L%&6*)Ql)*?8g?rQk
zrw?65FGe0f4RwPIrmdy}u!BK0BX_F@|Kpya2(R&rqC3E`KaaxCi%c3moGil499Ab7
zudDFM#g7;;zN(?;_w16nY%4Sw>mKP3IIsB9m%vptE}HuJwZd$0vVOMHWI8Ej5ceY0
z$Uf?6YNU(A1AfTc9{F#u&jxtF*!UD_$6;Jl@<2a~$*bLz)7!Yw<(2QdX?wLXd;9yr
ziZgL7Bi-`7PRCjyzCDaTr%%{sLe=JXDHHRll29znmpbDXsV1~qli3QBXM2wbl{49x
zZci;H(w-T~;JS{?HPEuD-!m%j!vDOnS#@3C+MVYaKeKx2F6@VoIsA=g*r#iyLh)ys
zQ@&YPpE2zf9hcD_by8f^{VQ@@O+%8u<}BZ>d}~^6KiX66$%I18j6&MT-G02UaS!2f
z9?l%pq6^yVu}w*@iI@m$UMytJu(ek~Z5tWN%vaZZ4}Fre8yF|?F3Ovv!+31|D(93H
zmJ=0Rn7-IPc~jOf+Nq%?FlMLa`?*5>eEyF=H9s!8eq7dAc8~n{cWU{^J{i}pe4Zag
zl30SMTS1s8LRz|WN~5@%)b+DCoSM}0yWY9%J^4Mk)be17=AY%i(<L%IeGu_`EMl2n
zefe^6iP2%1$!GZ*ewjIKnWbQvwRV}UdzpP|`TEB4jkD#OuoX1Z3J1>$r{oHk`pPY%
z6>f(W9-kFn{0d*%3V*?hK<$cP_lnTeitxtD?X#6TuvHPJRZ*T*G09bN_0_vZs}c^Y
zl0K_a_*Ln&RhfcS+1gdP?p67zRfUb!duOZnVQY#^Ygfz_Wyv)alKPse(VCjWn!3-L
z27XO5ZB46SO}lpOLHC-@)Y=u$;=i-CN3eAa)4DFtx}M~^zWTa>(Ym3-x{=SiF@D`7
zZQZnB{c-KOS@*j6)cTW+b&IogOW1}L(}p$AhK=Ngt@?(Y(T2UlhJ(+BBYwjvZNs@>
z<7w@NOZSHB)W)-o4Y#w6=dew8rp*^Tn;w#zp6Z)kMw{LaoBwBn;5U8KHvI}V{cAS^
zx;F!-HiI@cgU>cYU|U$GEga8QsN`0d`c}Bn*8k}hK3kFat*ErE=z^`7+O62`tyfc9
zaT{ClXIlxd?L?;SB%bZplH1AZ+bKrdsSev|KHKT|?F>@d_M3w3x3$}u-P>7H+wV5E
z-=A$~!*&QvJ2^Z%xsp2{)OYfXcJdu|3Ve1x;&%$uc8UsiifeaDx_3&acFHz(KAr89
z!*(l}b}M;yKmQ-Kv0H7lTjQ`>>$6*j->pyEZ7A4ntle$u-ff=RZQ0muJ=^^P+iPRm
zYv<YfD!JF8zSn8A*X6L+?X%Z|-|J1=>nqsnuiYEy-W#0S8`{_#KHK{S+aF=tALZE}
zliVLy-=8qrpLE!t^4Xup@6V*|&lc>@U74@D_ZO!27dQ5=sGmPz2Upm+WuAi-$%9q(
zgEgarb%%p1@Z~1{U@PrlyWn7__F%XBU~lSR|LMlT!P&tf?2yQGc*Jw~Q}Xaw{qV%-
z@YLb(%;)eI{_s5Q@OQ!CpW4HV?!(Ke!@nDc|IQ9cFd}e`2;wDP!9F1xL^5L{)R72#
zNrXod5$Qzok3@<(B4rPeYMMyBNu>Ejq`kk3z3K}7CL`wrNPy7)yYW!65pd+y6#<7+
zQBu;-B2lz7bVyo8dO8*+#%tGD*qE=~U}NRD!LEE0&dqs~pPNfqfKN<VKvML!tc2Ko
zSxFTIS%v$mw)c6oRPO1hE2XHTGBl8S+G?5)bdCPgx}%qX(Kj{Ie|Xm<>7}V!*JG5u
zxslwHlxj<+GAp(oD^^R}r_XGk^xED~vwK@+e@oLLtIvTG>ul2R%+vT({GrP`A6NUq
zXF@~IMFL(t9eN>d<dK8-;QQ<)X6jS;%}4gh%Y08?Y?!ZmyRY0gKLvunlub~{Xpl;5
z$jki@aWky=I99_TRKhP*emqR4G5mpPgj{k&;6cPacYGNRpAe2$nTXVLi>k4RR`QCj
zn2a`xj?sD(8+sV4Vf{+YKkmVFy!mYWWBUZ{_lc1+iI&bu4+E3xUcJsre{D3IZ1*fh
zkC<YFPc`|F8rzoUJC^3)o^Fg!ubWGE_IhJB|Hd`qZF_2FL3XD7QKoflR%2C`Q^Gs@
zfcLg#?~@nbdwwVQ1m`#w<UFg)No&sWocIv<^MhMxp6k23iXVA_kp(YO3p%fqzi$iM
z>I>h+6nT9w3SBM=t1SubD@jWz3wT>L)cPrR<x@;<dDlrfF10drtun5&>SIPVe!V)m
zw6^cGHa4p+cD*iRyDoLRK8?_jFwjs|*O;==nDwDKxw3ieTTA6`%e$@CoU_*S!Y>)+
zU*;OyM|RrtOTK1Je61<(%-QKI`PG^Gx%<Oxcf)c|X?1VGx8CC2-tvyViQ4|6#s22K
z{;I~ovXjAz<)OCz;pv0nhL&%YZKE|^qnm@H3+tmDhodcB6O98Ct78-MdlQ`}6D_|d
znvSMAdZ%0eOt<gP^#7dc8Jz3*GuQQVesE-=XMSO6VsY=!;=tJV{*xc0lS{*=%M;Tp
zBXg_A+pAOaYZII68yD+SD;xV;8yjaE^Oqa5-#2G}ZGB(gKHA^@e!0E4va|SWXZiQu
z>c;-^_Tl>P!>t|S=3nCG{?DC@pL<6q2gheemuElEexF|cJ|mGx|6lwh;4eA5W(A==
z3_&ko-dmB=5sBo|&eE*R?TTd<f4b0H`JpEPtrEko^*OIEnNPpiyzg`VK)Q%+f0kBN
z!BD2O=gvZ3)yHqyieVJjwW|w9KWHWkJn6448vl4@8hoc+Q#@H>QuTDPzoulm+^Qqy
z`h(ii*(#^;;wJ;OW%G6JtNrgD)O}iP@;%;J9H=Y*@dXQ^yrENHvD^_wFK97XU%A?o
z$o1g8PQ&N*fedk%?}H6ho8Jg3u{RzzR&S3N>X%pyHP-A-SJ)1`f7o=j3DtY<ejjS8
zJN(fWMtSqU=K7=6-ef_`;pT?p&5;ievj1yoJl&nCa``db()8<asUwzj^HFQ_@8hlU
z63cI`Ef>F<Mt{G3^riLh#mVySk8fY>ickQIZwX6A(W@GQ;3-6_IWlZ5g#q1FOW_Pg
z(nuzxgES$W$!9Akm>GN?ioBJk$;rq=feJ%PxSlV^iWFSS#j|=auf|FHOL5Wg7HoY$
z8j#J}gv&5FuX)Rz5!PNSEG^klOEeP+aT-R>>mK4_%XTQ~<_de1iPZ~rT73)WjW=CG
znq1)qx!W6=^?sEOc)n`#&3C?yJ`ZUzXVG5~f{HBY6v0<m<?NvT_7SNcDP+`lnV&$0
z?s1Mn9)5t8tv=x2N@4hx?}ryCR#skGidD3H1w<-NPoTq9F94G7kmeCE^G!|qmB=g2
z@>iH}B@YB&XDR11F)$PPC|3{92g%q1<VT9?|EMMZ*g#4@$A{C>!&iz0%UhY&D6tm3
z9NaWqEU`k$9yTj`O-6Ikx}{u5GYr26Gq_0ceDG_}=Q?GTK9OkV(0GBAwyJ3M3``>}
z_rX2$eyR9gRM~x^f&73-%8VT5Q?Ws5zvAD2O?_qm2&=s;fm_PR)<3O6aPIDZ+KC*?
ze^v)5C6>Zyx%16!HE&MzvR5fy2rX19PGIPSzs3~{V#EY_$DG9)#6&;epT>L^x(6Or
zi54jDtrTo_I*yDM*cGXc<{Fk)E$;z~a#-<$$vFtu{z;QKmn77fS<#IDCS;ZG6M=JH
zELR6tK6a2Pr3CA^*79;W7Q)=H2wK^v-2~0aW6HUftTe?SK`K_&gaoYAJr(eI%>9&C
zn1=iQ-&PVPYT)PKdqLp`-$GiiNN-qtUfE@UUD^#9Wn2OV!c8;uWJCzdbNqwi0>h<>
z+PeIu`~%QiiMo$l9eH>dG5_`);X$x{x!yjN_^Ogip7dgS=p;Dq*Ao5B{XoV9Qw9#d
z88h4&P?KN>6f$%;C2hgR2tXI$T`XrLwr2zhx#f;q=rE<mFV`_s5q%ow7b`E7B2d8}
zFe8c@OKT(4UO=I}|Hb5y`Vv&z>#3ij4lN^zEQKtzIxZBfY^+kMk+}5mTgbn*9>H@F
znV-?O-4FbK+@p$=25N>(!YLPiUygD*u-Isg^fI1a9(_#GN{Rt~T5Yjz(DLei4e8e7
zyy;<tbULy2;EK|Kv8}hE_B!JKQJQm-g%-_4w|g`uzrA1BEwfnT;>#tHGYnKGT<;f*
zB2XoK2Umm1w>gdPY=tS}`3P0Q;n5KCDTIaMz_q)O>!JX|X75Y6lQ=88lcihNYPJ#{
zy~4Wtn{mC#Fl<K+avHx6<GJn4qA}NXVEDN-U-+*>)!f5GA9v|_3E*xlm3A*4H|QXo
znI!m^I`R2GwEivQUTq$R{?}aY=~67@B((3IND3gF@b=0)tr&0R<BlAmyl09up&$z=
z_n#3uONv6VJ7sY#tt)~*Hd(QHWK3StF1s6r2U(?<P7@x<dvr;4payfzV{OH<&Zu>O
zEjHw7r0TEH5=QKh+mC8Cnl`+y<<)d|XR@s-zo;%12jz7>Bv|2<HzDZK`MpUSpM39@
zPDpRGe?$sqAG4IOnj}GRf_{_2SBEB9KT=FE*Em*BY~}_#LFbxb_khl_u~U^mJTu+B
z%US`P`^3!~i@6ud{yHIwDlb4Dj!K{j?(M(cX*ekIo`E&rz1||&-<cA%2-Z2}GAoZC
z?ANd}jR{nLC=_Gpo>{&ap`9d6q0>{@U=2Kxh8^v=R9_bi^>9Ukd5)FGgt*J&^xf-T
z7*5pURV}7qqt)qcx2M_Gz{M~r0gO4i7YJQSjU~!2{QVVA7|U#E9i?%Xj!*L2KorAP
zQr}Rwj04a0sT~+CfVf`<Z`43cXOmAXtp!*bRFx`Pw`mR6#+u&s6SCsTB|{j_o4~W3
z*_b6LjbTOk@fsU<o<SJLhEGkDJvYTvVPlopudeBB2>sKMFwVAR1432yeUVXR?srNr
znRDRzh?S~@z!fT&!O1R~&xV}F_2?r-7Nv04L>@u1oA*=P7_#M&0@phGZ>|1R+N-7&
zv8C#EnxbK+P($-{hLPxWh+m}|+c!XrI5%0p(v!S3{r7evL)cHRh2WjxYtL3F4Tz!4
zfjAmzyW5K8fBJaB+r$Nye)AkH84;x3aT!q{D0ihhR>=&)O)<6;FYWn08V^0q_hnTS
zjq2f}3=cKU(^kxPt@-q_Eagt;()5>F-13diNIj?IwBn7L&*}Tg)^bs_gYmW12`hVG
zrGUAaVV_4UqOaTnF6KL=b8CAZ9(ZJ4ENuN(*El_N;L|j3`j^>5?Tq7jnC9=rbDAxd
zw7?|3vRF=c=|dH*G~H^#>UY-YI<=iLeSf)2G{wiLj+^ffV>Hz2G8NycI~*NGk7S~`
z3W*lqa$~x5l@?e?{9q+&u~&^ecIJv{tJqF+47c`L892A0>!n+Y+e{qo?ewTSYwmba
zk1TW_+W+U7b(FIH4r9mC5$_)kcr3?5?`g%zZ|cN2@hs5Ij*PBW>Pq#plT}Rq%xaCq
zSI+QK42Q@~gsi0XIIHW59qa|2+J?oiCa$baEU)&saBj>sD=@vbe50bzM${uO42=#E
zO3%O@$yib9(MtTvEVU)b(`-{NeXg40GL6>t>?)QZcHPs?X+p#_A{@oZEDX14pGJY8
zI()2*G-L^^^(Fg60+@nfFF|2$_~z$F>njZtgbZ4;0$E0g#qQ3nKzIJeKI8R!PnV!#
z3S;OIS|Jj>1vcJzLa~jm5&s>}cz!m&h6O7{PPY)(e6!jqS-)NIvS*%$T*LXhtkd2R
z5u6se=b<RQh<$<=Q3s<uF2%rwAMQF{&B(9WJYJRpLZN063ZhmBQIUHIhPOYdsE>Du
zABEqROp$-)h~UFe_=H_~dm&ZG(DqO%c@=Wul|bqlVHGkzF86!V7>LgYxw~7kC!yrH
zsypau;dV|kM|U4(MgMGDU(8Cd5g+|pmq23&ndmRu9|SGxF7JQt+O((7PsOwp=r#Al
zXb1F=ln4(_WA{v~U4}b#uMO_;C{^GH=T@k~roP+|QvUZ>l~q-R$1g+qRgCM$mHrYb
z+({#xiJz52qr@$UCKLK{SDT;+qu>`h!7VYFMX_jk2EpE+H!lmKb$s!w%FuYl2ZT+8
ze;B{9bgV#<bQO_e6f9?I1bL^&3&%l<iPSt>N+ce#Oe~FIFWEsTIeZK+)q(wogs4?{
zv#3Y<^s1YKs1=Yh{wlP=h01*x|G+kQ<_OjOUJ11hUi<v0XS}?sQsAU0p%u+|noc3f
z)aXn^P>+OZ!x+^+k%Ua7VCuNwM?_G&GHpgD*=jFbG8{tr#=e?4iARaY!d>tJ2q0^Z
z1s8g*bePggJg7RR;Hv<~k0^~0!M;%bVQHlFF_=$<To4Hf6!B<+z>%JDz9e79zetFn
z6(V3lX+|G%R0H<tgl7}MgLDvOa_+w(;ncaI*BQ7+tfUG(&0Dbw>d`6xkbIemg6A{B
z{#9aJ1nvKnY57JVYJMr8B7uL3iA(7*R{DZT*C46%;jI`lg*JD(hI9^&=LSoZ=g24T
zJYanlv`*1TS>Bf^dK9_IuCPkAryPDM5`r@-JQ5;u7b4a=iu^B4Wt&zgLqa)X^E^8A
z`FuKrm|v&A)#9%j;Z!+K1A}NsRm`CgX*K#3Z~BZ+y3^cDk+5xS^)c^`t+gH<q^cvm
z*OabhjN4ZwWdw73h8rb;A=5!Z(z~zS{FOv+h(u|KQKurQA``)+(RZ3$QXxI>{IyUv
zX&HU9?>Ru!;FqW^bZjI};my|j^I7J-ZI-gs_rHH<1FQtFEP?DX0X8QD8B-!>M2{@F
zmW;_}bD}rt<yh2YKYxe@>G{+qy<=O>fd9!sCK1-%T|Tc;fqz2RkqW>H6_YGD5JSW8
zm`0Kjoq?f&ak5^hqw+^Mr?pTL?%6>}A9zQpZcyY7fY9rSdD@M6I&*pd{mH|;&C6J#
zdG?!yIX#392T_nksXe`B>`#~Em^Y2f(|ugv;9sD{D$V+q<=$ql(lyj$ftP{qFg1PY
zlqIOUh+s7Ot^q(jT|wT8g>H^h8%FYnuol{0>4&i&y-5Pso>6$wX^<O;;I=A!t{;me
z%L<Bly)vtzjmJXEczs$GeQe&cJNXwE_UCoi6=aC|GNC@o8ba_QlzfWM6|m6O5lCYg
z<W`XcVHQ&Eu5_|QDNT6sg|)PAgm$8cQmsP5bGevd8KI^~-8jN0Eh0z6g2N=rCL4u&
zy2y&xp!JVS^Bm<?^^3ce$nQL+X&bo`Fyu|UQy2Lc4=;WC`8KcnW!76zNV&Gq>Q8bx
zR-euO2&kGuYoZ?II<1L&mYP*5c~eCP7F@Ri9TvEDDG>6j$G)|~2d3*0@2+|@DHXF)
zxx!Q+t7d##(}&&!xAl}=^N-2Zd5G2@D4%S(HmQ*uBLEj|0!x?V1-4nGCq;lqsTsA9
zBTL>6K9-%i6w0O)^tOn)EBLkjo!7ib1{ag=IbntYTfAZA3y$jPiU`q72}L<%AC}|2
z=NnPvljQJPZ+hX~#QXmZh<f`*3Y)Rtkpt_nmP?l8o$3{6jZ{6@q0wn8PPUG%-=b{y
zd@i9#n@<e-qA7%#<lDk1sziuaK}uvl)R>J|#P&3_j)(`Z);!16Hxwp8K+@#8A2l<q
zWjY!q!|Zfb)!k00rJU<t%CY;E<jpHq<s|0KqhW1Ws3q~fqe!!dRkPMxip&b?wk4f5
zMe6lL3d=+?kBU6pe4hAYlXRsdKCVg#X*9sx*3+*pp`$}wdW7m+k;g(q;jLMXMOOu%
zqBL<AT23hKS@H8;Zjp^hBFkw+R7NTx>>S~C;L8vC^n6aU0(CXyb+K^`g6vHtc|{_A
zTH4fOTxA|sxe|$p>w8p!*m6e##V#+IcN93Dc$MJHo1M=a9nTNJ<tJz%m)J6SPN<VM
zkmj}7s7k~05n9;-Mlt#4kfU_m8?jQoT8I*NCxyMCI#Ptay)ozOI?+VuvG=t=%z7fi
z(kizcLn8+J%9)iHl9?w6rqG%DszVVS_~N;n4pQ$-=T9+mX`Yr&4{{+w#Xe6b7Xy_*
zW~&`_LpXYGc$KkLX5AUdVj^{u@r}U$X(3xjl(qS~W|Q)an)6J|X_&L}%!RtS=DPS2
z^DH#F#{${|m$>KKzJ_Mzl`qk3iS+p#QD;Vje<UJotPE=c2deiFjSJMxI(J&UkZ}%j
zSNN-NeF{eaezHyXmtd^HF;MS1Fj_jmFh1~w3f<m}BJ!h7D)Li=uG5$1y}8mlE_89o
zQwjnU^O!pXD><z{U`rk95#p!$3UCpj|G}K#V(v9R9aQ<!7aApU&xLD$<x!+P?d$Cw
zKg@3|XXUm31ka27r?rE4Ld92<lBdiKb4<(&!W#Eba*JZfW(4c=AOkOPv>&&Saet5$
z&#v)3L<zQxIK8e*Ac3hJD83do=SdFb%~y=CyHm>ue;c{lx6Q_aDrv4evT6#CJ4NJ8
zEZzFgW1M55j*DXQmpRRh?U+u><X}4)r$YI?hm+cWD5`&5`>DdnzJt_dr+0k9xcO$v
zoSMCz9$jvgo0Cj)OBO8TpS!J?vn}!g2qoV}qa_k)JRjZ?IC|+G!~k7HDa)d)>QHk2
z_^9X+JF+~P(HWtm84eT{Ix4`2HhnR~)&fCO`+uNh<?x50OO$h-@uRC$W*}ZUFkMMb
zrDQUcyUx+r^`m_HoVe>b4KUCGMu?$#h^}>UR?rwJC^JVMN>lfi%B8FWs)3As#_(VW
zmGGy4Mv1nZgoSLmyZ@{Bh#&dr6Z7$iqA*le0>0((_QGLne{m_uJzN0(S(?gX3EJdQ
zxT`=v+d?<5fb!JvDaOd?Y<le}*d9bcLHx*}{e{1k8WwHvfh?r8l#fgJ;QiXA`?bbT
zet8=>ddu4Xuz*Xxrzo}rmC;p_D_{e3kWZR-5RYv$>WfQy{FRIhDMkq8722x}vXnvx
zD~lqfT>{7><Qyv#t<=5FCpjx9TsyUx?GM23^+&!}o4y^k0)PK5AzN>*l69;<^>+tK
zg~p}2{8I_M{(Z@Q(T`<w>oixiOLc<jpADfdwNahINNKAIYq^T53URv66?S%?{r?lH
zTH1^!d1tWYzsRh(O+~XsAvbbccT@01<?%1OOf<{@y<Ib{WIp{7(krog9P$r|RmMV{
z9mUPRuM;cD1sy}qKO$2qKD!zS#^rtjZ)pcG;x<q5x@5Q}E_kI4f`6C(Z5c}0%t-A4
zGSkYkqijom;I;0>W)_>8bVho_Z6rnzsh7EFQnJ6v4G+S6$(yI^c~560SPNN3T(tcM
zSE3FVzh^)&qtg=%kPz%crg|(@n^o<U9^9}Pd0>IS!;jkdM5s1p<6Toi?#e{Yecza5
zt{b9Jy7yv%)w(ezK$`3Y%%pA6qYli(vQO*X09QLW8sYy-1Uo`XzFif+Ofhu1{twcD
zi2_7!MDak}`iS4U@iMe=m!?;T{!mDjy1(8QZu6>lM#*B6c4%)Y_wV7pE|~?Ertd>i
zYZMY@DJasLW}*nCQ;uu$lxzJ?Ox1_f?9!83P?rPhh&u8cAsq4zC1;;oYs2hLFDMp?
zw=RS%x0HYF3nERBzwi=Yz@unBqUOuPA6oC|E(4O%6etbc-xF_Rg>Lcl{RSs;z81uW
z>E?OdahLPJg4f`uf0m^>ijux0BVnWjt`Uek-UN3H_81{XOuo+Hjx71wCQ3Xp)_pD^
zk97NjRKsU{CG}RBAv;2lec4RG<QbtdS~?@N|IU#Hx#_|W|Lk!*4|mR>BPn^FTU}C#
zE($Acqjh`O=`I76{t4rHW7xTML;nu{%$nxDwmFRI2!wS74*s`tJ3yBt0z!_gopYIt
zEGdPPGv2nF8Ch0|LUI3>XEM5?_KHQqZEa?BRU?r@E&i72*qT-fKmW>c>gzGVR8f0Q
zJDG8gdzmuc2WzwAn~w-e5j5P7C;0ljP4rge=TfZoKI-QGm;ZQj$FS72#%+CWa@V-R
zx+|XBY--Q6T4PjHE5PTOS^bOk;e4~{gD1%s_~rfL^h3)w9F&&F{M_+jhdzqeVPWRT
zw%1c*g1G6_xsEDdvA)r6bmdGNk*2l#I{Tvp^(2S&VH|4}SBQj&el6*hskq}ef|}(<
zW22MHaD}~P!O(BXjfD&q+xUfr-=14mchXloSdztu)%t^$_Xbbb@2tnT-|mt7(>ahK
zeatTvDCWI8BkHmlKPz{9j2bV0exL2$#_s3&PfdqE#fge!^eN7b9;{wOB?MOrQR%qW
zKeh(NGvR*q89uo4^@rG+dndJm0a2Af-{6P?rsb9Nb)x<!WyduauaV9Y2dYtZwio6{
z8tAaWay+YV;HX9k6IZbsmxk(V0q#hf&wX^Z3_rDV)||*6+z!co-N`w#^N{~T#>l|~
znhy43KJif<{lVL-gGDK*3XIx+^7gsm3Q`h#pC8dQka=~;QyP-rAoWujR_F1<7ir=@
zDc+)pC$dKnDK&+|J;$_#y^-T;D%8$t;s{p!YvI4!csegtZ$<@_g77!(GB0y6Bh&1x
zek1-Drv}r;VL`n}qhGVPYC|*HJ|e6$pA?QN;Zg;(a|m&1Mx}++{f`y%z0c-Dwf&Y~
z1z)0~2;R-ak8t<-(?~O^7VrK#Gy4|Qe96}S<agM*_q7GL;h9K6a0=(~4+l%odaAK}
zD(%2_R??|82iN-<%ka!D5GDH=|0GgJyYJj=wl%T-+nuK~a8@VIMXy3*!t6&_GRT`}
zJ=JXLq%gzrQ^U7RLkB;*T+|%AHuqgzB;Cq+o?gqq%I_FsQm)U3*`b}>vzVQn(u0)#
zs~(`N^XGwhN>**{Ro7>=^F9~P>Q^1)nv?y)AG<XlPX#=0y*RsgKA0u>)2)qC>e9WF
ze)G_|i|s18BfT^-yH^D7c5>}+x0!n}yn5r%@!A)J+WznZslQ&Wv4p%Ryk+1zrMACf
zkk6dU7ai{@mp}!ddAV}j>%k@gwOSXEV(YX};%qGX9+uWZz-eORgLm-nh(=huMEIY<
zou*&^0>~Sh-gf?}hm!(N6c|an)B}$~FpeU9jj+M&9*W47JH<CyecrtM{;wc~=jEYi
zig<VOo4bpj+{jMegIJ<?90#A{u7kfpzHBN|O7e$xzOf>Oi*&S7J$09l1{3ttHlWgL
zv>|;RWE4fq3D&;tlmibsC8(63PF^ZB9_KKnts@F{0_6JNr7$i@9CYmnXE4#GT%z4e
zU%<#8j(u$@^9PWHTieJ<5WX|)*Tfn4j%vcFXn7iE2*wqglxkZ9W)M_eYA)*4x`=J~
zSp9X$?j&s(dpqepAN@;tyPFDap?CbT@*$-oH~%7%Z^sZ~d<j<cnTogx_X@Cvh!W!o
z5lZt~De>V60M)TlmO96R?~FL#<RXBRGSHvzZ`g?=CRWqe!dis>>t=aYnxFXz6=N}_
zdGCJHo7-W|MV2?l)jH%&MP1q+*n1!(Br?o}bV+(NeDZcochCrWWKpj*fnaWd=|Yi*
zM%XR`zOB8MsC!z-e~jU@Hp(D*bu5iQU?^R1b%Az9T8q=|V{9oK-(84+1`oTJ%8|?5
zB2bLEA;Xn}Ohu~jcEBU`PSh5b9q((b(D1S6u+xaD7EPTFU0R1ykoo0tz*cBwPB@Z&
z3r5LN(mf)f?4Y}fxce3E)H+@hA9!#bi0VS!Yu2H$JIkDU?{-8Enw1qc0-hQ^W0@>^
zoT{?ZH-XXkobX>Bh@#ECSI8Ypt73;o$DF896RlYc6+6n#2^%`JHu|9iTj=_n#<5qw
zem2;!(BgWuD^>Ai@^!-!kGx_-vzIfZE_Fm$Qjn{iMEG?&I-^@=d~j2?P}<pd%T&W1
zAPV=2-Xkj<xrj^$0)xiajHTrBnQY70R)m_KwEGESH6De;kn1=xaT7ngzIaBavC1>8
z)@$hIdB|;^RBua3XRWQgv`ia#@&R_(so~8r_GIfUyndMbFzmId#fjur^R~q8?yr<d
zhF+mu9UaQl7Jn>CU!}J&#C1{oi*iOwYEnXOM1=W^S_$iP=)M6$lXygz6qubEP(}xw
zOv_X(b~azSyzd0F*}z@A@@`HOKSh@0{-D;NXQ2nMkbf7P6jxeIYBvlI4*&u>bG2Lu
z#4sl$)`f^b&|}&lue=~!0i+$6><v`Hegp`a5(Wb>SSG#FNt#S)j*H%cG*ak_;IE%-
zbWT{j*4<f;yV!0TR<-y{GJA6Vdab*fpW_nuirfG~4_jzeDZ#bPLB|he9sD${#Wm59
zYGou4B%ZTc2nG>2mEVkj(H7?Ma0urs8a?swxj{R)L|BiKB$0Ir8}s~b;WujK?pr+8
z8y+X%sdXpsu+~b1@XXg9Z#VB^Q-x^qMHwa+w6{z_C0tl@PN^2r!J2r4HZRX<qwYU`
zFHybYL1sI*uGkf#k+Z8+sx-V_@BK-kB@%%J8m{xT<zFwusN9*mnMN#a-W}U|`AGDe
zI(9_j_SNAhGXRhl&%3`|Ljsg{!^U0QMn2xGh6&V}466feV0Hj20f5Qi7yzN@9_A6g
z41hJUVN4*v<fRpO)(8vGAhAkPQNuJbP@r@HjnqWX(AI+hzzVqjK^cVls1){|=m|oi
zH`oA0GFB0y#{vNYBw~9&q8xFa3#;faI0*Zd>MKPBd@J!P97x2X;UCuTB>3@Ap|Mba
z0NH$p2bkX<I&}w(V)!asRzsgRo4L~gGd^MHXAal(14j~j6=&Ecw&60(O0|IEOc)3V
zb_4_Hj}l_c3s^V+LP*_-L}?$O;jRRwmXWHN>mqT_b<kj%w+&&kS6&w>$ZGp1(m9{M
z^%aHt8Un~5Ti0@rb3it*rEk_%LKi%dQNdHRe*(8OZhDtXA@*$G08Bo?W4goQtoj}R
z3%%ToP74EHLtHAI9;|!hwIBL`0x!s=11;tFK)0|+DC-h|(gYiEd{>HI1YlMW-m3S&
zfWV1JR~O`XK;nmsJFG~>#d$2qR(7tW%EPHjgiis|dmpjg;2bNuxZ3Ot0IVZm03*pH
zQ~^a_-AllWYI~3C%RG^;SAkVZIdXR_`a!!|eH#@S*279kJfQ7LfqXF_7x?Br-Xy{h
ztK3-lg-12}gJ3OeRvw|%0(*gHLSR9!n!zbz4ZFZy*9w~RFC>It+nAif>FahEG<Fbz
zC0FdA0dQ`KGBiSPDkto76JR(wQO+fCqNG8>Ju!Y)#&W#5gc7C+0gz}3w!8+m`c5`<
z%k{xlk0{`#SM$^HW;s<Ag<Bx$W&oKX#E9(>EY1HFOYggNGg~t(DOb6n;;Yf+dr3$w
zJQ_e?kyIjB*er~4NwwFuN-VtIF#s9!p&h;rP(>voPAb6w7=*b}mtuJn6X!gULl6*v
zfKl^zz7-F3^=cky0!6K=#XxFY2-0KoEht<!90Z0sB_>~}J{_-eUFe4Ef~<uipWEFg
z-@=;j<r}Zj`SOLbA~W8%Mc%IJ`f{8a#=u1axy!??l}I}gv<nbMDm<?hcH@CKV?~7h
zo+4mEW`_9epoyhK;H{V|JSrl<8CYFKyc$LlEdnI#s3O+1UYILncW5F-usZd4g*HuA
zC&0{IiUI&8*?M4G5xR+3D5gHw9CDSWG|PZNG5`aUaM(zL765+UArJQhjwuJIXZzmE
zE3b@)){XagRJ7;H_vZ;kCX0tkNCV&uIjb0nXQi47+M2g<VRA?0RuyE?&1x~X29dIj
zCAR7~2$oE<W*Gv2op6@{jRz{~*~fjl#6fs{gN`qdO^@wUg|U}N!*isky^sZ--ELO0
zfHaoRCGq`ngMuqEVNH$n9fAew0ecsG2m}izROm1_7F?9;I6W*DtW`q-*@Cjv)(^Ak
z+nn1(!6sq*nE-|iTT=2cyW^oprYvX#d{XiN;j7T=#nsXI8qFEyvV{+gg6k9(Br}IQ
zIt@k#ev{?|fkZ-+v*aU6+D%53*|sAfK}b9IIv6<&Q<dcG-c8*nL+1>G3P(Crj7(DY
zv#LUoL5U`O80w@E_%;-^kVp}cXk{|0MgYJ>3{XQjXLxO>$7rdT8`>6XU&)?=1*1<N
zRkwAqc2#|HQ370qqGBSnFd$-pl%q5VAYixU#^8;*97Q0GnOHr=TOmkr2o`doO72nt
z;f$apadqiEQi_00A~%!;(0l+gs^R54OcINc92(=jOuzGxDa2hfWh<OtXS~{ET;XB%
zskVXCV*_=2v~bsJHv;&MB3uO<splT9iis9R+)@!9>j^Yapb*hz<kAy11jkHBi-x~R
z{Paj+0;4v$0}6*aVWCT3U>rDD#bn<g`s2Kzf_G9=HJT(o3NsCR`~-M)_q75RkS%?{
zMZgxXc3EIR<iIzpnJ`{pRKhoudcTuw21}kgd1HILI}h3&I9a7=;8B(&!H0!7$pZ3N
zFo31KROb161F8vtmikaySZrV-T=Nm-V*rAf;uXRA<^uxT00`ZH=%~zt0Hm|32;V0F
zHS$}mXR`$w05R*rXX~$4kxv=Q@L7Bi^H`kb>}x>O`^mJ4u&L>r;n@K70PjTUpqpX&
zqX-!+);saB;7r&gGQrM-3pWOdYS6+OOT7z6Kr|>2Fm36YSh*H{aUjt<@p(N6%!d_B
zHKmp@?XAbNCf-WGhFwrZ2S@d$b5r^}oN%sJfI0z;_4s10DlMmPBxM+#I~Ilo%=1kV
zZyE!H;TjU=bS41Q1j{!LMwmd5SA_{vYt;roG1w$3Jazp7LZqfgq8VZJ`5pHtwG#lx
z0^ogU_C9oK@i796MPx|QVF43yFe0jg*9l7&HAij=At4IeXiOki@5DLE96Ezd4g@2d
zu)%-JP0*iV=-J%3W<>o0yh4&r0w8!I6Bydye%h?k<+1btHJfZ{(DwmvU`!B>MgWpz
zX1t=tx0Awbw-IUAqg7qZs(j}a>_y}CP0CMXvMI6s`c2vN(vl43nZgVDH7(it*g8Qt
z9dbCkX~;zpp93)g&2(F60t2oM<XbYkUI196YP3ugH*Qh*3L8m{Wr~lWB$|MtWMWEY
zU5KW37#tu1&<0x~-iTGvOM|6nV)d7yn2HcCY?9oJiLV@#IFph29d@Ms+C|1ZHIaPy
zp;15+98=51fCVFQ;vCk6?9d%~6B6`FIqhq67J!5jAD_qlP|NudD$RO>J4z2Jyyh2S
zjVXFG1HVC6wl|j}3|f1Rv<t;RN40fg2z9SV=*oJ9w^l4ABbHS6@H&VkZUZII4EAFd
z)|nX!(X;{;n!;}{kegyb+)~t;OGBBk;6+Gb*Ih7DkttT&3?M^Es!HFEq(55+FgP~^
zq>v0uwe^^)4OrurVv28Y8TsD1+iHQ`xSMJ1c2}<8LL0Qz0K2jcwTZIMgat>mhY2@T
z*ebmfg!40L?k~>22ufro8-{_x8F+BtZ{hqEu&Q3be%BD%r)i(s9s$zWeYIMVYPngc
z7DKQNC59^h%oE+mk&LAw_pn8bge~#5NK_l{kyYr!Q|KK<*0>F)gtN$dZ8*I|NOEqJ
zaA92{fnKhiqCo&`G%2LrJx1+r4XwvH6SYet<iuM6_JcOv?jF4x3z=Qh2;AM*`k;u+
zr9!((-YB_<AUW$3Q_9744|lA^J!{>2SQy7f;mIr_32+%UY!Hl;Qin2mH6*DFAhu=D
zSiMsQ?B@@nQ2_vx%e^qe#o$v@P`!rtCp~xr?6_r-8f2nSW{xv!fc4E&p#k9~$Blhs
z#6iSIao{vAaXD5!?A{g`2)|v7z*}&u@IiS*!iTnU6mUhUJFq7sTaV_#)5XY=Zs2Cq
z!VI6jAw4wNj^>LLMu;XUrj!-pyffA^{_c$hti)tGz!5M|g%*ea+z8$SqwV$GkYBrI
zABG`?odDbetX0O+h9?%72}^^tz<sf^$Fr!(9q886kn4N5KGawKGu@ZlH5s=MMq(}V
z>Z{BS;pkcTc7p_VOsfqb-O%x-0pJ*Wi_V=oPXP35&%2-|&eJ+93yHWb?=)_4rxk`m
zxCY~g<~!z`F}S2yHw11>(8vveny)vB;IcA{w%YP$#y#YV&|}71FY$ydg~d2H?ZqU0
z=RwT#AmU*8;`R9V#Z*83?JqHr>xnWNh$7S_V|=4PfAYvo^canPf5`ka>VTOe<s=Vm
z#=D6ZU?I|2XD574hg;rlbB({S(Lh-=`Z-PrfMnpCBpb?%+A(bR{(X@CU7+-$wa0`o
zTo`VpCx@x3)jxeOq%=SV#$dniMZAoceWl_K&0hBaG?2csf|*NU_7)TuFbnfdo%3>+
z#0QY`DGw`A{BFc|gI$(_b{8bs{`#hsZ<CJ5jM|8(+;c}9H2{u0+7wG1E<W-w-TD(3
zC)XbNe1^&^BLanG;I#Azk@g7D{K@I)5qE&MX2$WQdo2G$*eJnmm6$@^!^fXeSXzY!
znZONa;5_b}_SR{<te(Jr1Ym-t=F<ifHt(jp4dj1jIQzaW-z0fEl2jxp7VKixK@C8$
zpOehO$c?ZF-=^FuFK|6DAPji(0AP14`OFi=t?5{m|LB<j3QICO-zFFu$o6z)_r%hO
z0NFxK(2NDv65~T*IJ*mg!~!5qpT#||6@8+buN*l68ypAalfc$rG+3B~1)r`#tW*-@
z<tD4t5deq<>QYL%XJhu2k^m|?^fZHln0v7T>znU`CBuS3s~{k%rQ;V6CsSiLmPkq~
zW-^z;?5IQtgD=jAW1ck%XX{*cLz68d#>eePxQ<rIwXMkh$dsKn(7i2zSm40x5b=WJ
znx~do@ckG!LYdKW*qnB{H|lsTe$@d{A1MLQ70Qti_05#b5x^E!hiD2B0fP_#H1ofG
zY7->04QRv$!BSN>?@#_uhWkcmYjcqK69{#8(5W~U>@NE=NPhp}AFc_DLFzqNG}Q3G
zSp3659b_1e213>_<b2q?T^nV)KU%%px*6eV5X4m-Pi=y=V?k8pWG4df&a1}+$EFC@
zX#mR5btYjx<Pp#w!>OSRh%7%=6Gnm%<_7VhI6#O49fr1g+Y1E)64)rwSG^|WU<|wS
z3Ex<rcDmTJofH0vLT!y#M8{KssnW-F9{W3|f-@C1J&$X+;)G^=O^$L-V-Cyi--(}l
zDqPpa`lNDkc(3E}tvgF?#=k@xHb~_+nL?tW;%<BAqHApi`FfvRe~WDlLTz)D8%`c?
z_7BIP_Z?gqhCOZpfV0nuSt(xqS=UeVPwB1&<2Ky+&sbQBCsJ&WZm>|!>W;L(l~ged
zbiM<<qQ@)+36JOM{!oQwo)l_~I}g{Hby@*!(4n2_s^{NQp01t$TyL5eyZ^6-RVN%_
zJuq|I;^#6JN^_C5{7vwVt4DUAqm?rB9=^>M!ILj?<-TPRlYSF$-T#~;D&tvljD86V
ziZg~kG-?pK`L2E<Dn$l6N-Z$wYa2jxuIEZH_WrD$5b6z~wFAWJznLq^P9+%P`F`I@
z(S6*-5pVd|Z{0CRIv+|FU`6`PouU4)DoR-A$%lM{WIJVxjAx-mA5xB%m$LC@g^Z3V
z>MISr*+G9~Zl=0X$QJq!izxBsMvK`O=EiYSY-VHM;l8rq?av3%Nigyy$(K)AKYq-P
zkuAQDll2!UE-G#mC@I@8VJvcL@mPxYk*9aT`%o*#2L3Q%-R7+hHS7?oXPxJz=W1RN
zsIrQm5~}9A$0l6!rbP@)-xI?f8S&3cg<ST30Fgj$zYNA>pSJf|GsqEk$md8O8K%=0
zTAK*_RjB3K+anw!U{Wo=A;#D*z#@_uFu_dmF#;v`dL;xjhB1N9U-zxjiNf*i0}Q(M
zfR&6KR5*#rFjjptS1De2@rpm|@c(fJI^p`$%o%+U$;T{bP=kfbU+vQmlUePP#wtC7
zrOFvX9Ec<q#rlJeAxy}DPd9SN@y%8EVB!TF)LgTPFIXg5G1!1z`$fTJV|J$5X`6|r
z+G!V|Y}i_zfdeJ$c;QbE3~u30+>z}=Cs+HRPzp3Czk-8RawO6W3dtlB@)<Sgm+dtu
zyyD1TBTykZ6Ww~X3KXFqF*@m_+X+@5IFusCfnH$Y3l7QnLxmjIyn+usu*-f}5lrY(
zgetzE(8DV+?A|x>X;HOr+s!Y<sPoZ7AAP{rj!<v%h$(j8GwLSKqkg_zMXccPd@}+Z
zzp{IkA*ydO!agIQL&YbQB>xN;K3jAGc;F*I<Bz=JXNXcT!AX%T1-$%Ggxw7T1x)fn
z@Lr%6ETHUr7UascYTyj&aj=6P{9v_e0JjUWuR`}3#H~n(A$(Ax20iFYDR8ifyDd!)
zl(LE=_;8gobgmSozy}Hxa}7+~FE8cbUso!J!!xX71e@?-$o!!SA-up+3$)6EtO7h=
zWGgPJP$3wtlCK&t4}@x)mKh0##x%CddR+{g(5`|#`Pc&rVH8)m`tgF0^&<u&kli=f
zat-+TqZCx|M_*J?Ab(t=A3?;z5Q}&re2kzQ!x+JVYVbvTQ0;%SbCLpg=ZhNP!x1A0
zUKb&FM-|2+UnBSeAOBwAj9JpMmbSblE_12NUGlP*zWgOHgDK2m0s|AnJSH-esmx_E
zbD70#CN!fd&1o(Z6JMap8^Oj!tq==C6I<ncx`6{6=;tbwK%5k7Ku%D`gPbcMk{n(T
zgCYP?h?u~{jt+){J{%}NHHg82grLqIP)&g-IAlNGh6N_PVw-WPAUH2*J*rT&q87a<
zMl-6>jdHZ39{ngtLn_jdlC-2IJt<04s?wFRw52Y6DNH>I(XcrbD|3v`-Xc05d?ZkT
zGsRv!gtm{KJ_(7T>IV|7LL_|jqXx&*X&B@23Q90Ra#p=6R<o+rt#Y-iU3~#nR^ZjI
zQso6>Ju6z%s{dB5qF}9Ved|^!YF4;f6|5s@D_!%d*RJAquYUEaT=#0%zW%kaTZMxp
zBgHi@T*C|Eiw7mJW|)06t#(}O+FYVGHLGk5vsOXJ%BT?-Yj_W;_nF(gR#}P~V4((b
zFfDA2Wj#Jr=579qEuUIB0y1L8jkpEX7|U20-~LuURZZ3zys(cRysihuVgeSRp$cjU
zk9aW{M($!~mFgBR8T+V#A!dOBqLO70z$k8HsBzOU_Tw5!MK64#1P!W?CMve|qy^ED
z%~9#L2DBY6HuJk*QT6w~lp$_>AJe(3QG*Jzc!5=zFpKjg&=(R^Oa-s#4+~GQp(FUj
zYNJS(LI1or!6rU2ia#~q5!BZy_f_FOM2ss+P{qJdv29}e7GrJEcmy_n3XW6Un8ILU
z6W8z<t(-f^3a9dmq1<khRZ#;UmZG3^vBNfmtmQ3pIZE*mVG%aSlozWIAL7&2id*br
zs^Ir~W-eEn?aSsa1BS>(cJQ1G0k;(xqAzA{vKB?zWOSf_YUo%mSUSNgIy1V_j&{tK
zcPr+kyp0KMzTi3*gJuzGaLu<RVW#Z`4NgybDP(^1Sg5eIJL97Vm^?$mMva0MG&GeN
zKIn#RT}ZRypc#O{6sm(Q>|t{y9?9zTQ4maQadCQCN^#?*mkpUn*TC6Hfwr{iVpPGD
zSpO{J$~L&et>yj-w;aj_qka`e?rR4)jOo7Dx{-2jao-CH-KICb^BvXTie%m}mT|cX
zoa}aoamVT&<B!cvaDCfr5NBaH#3Rm1e*3%3XRcU}ZG26Hf%DB^%lJq(o@0r}Y85~t
zIm%Q1ar!QNm7xxs_3C@-JH8xjF|WwXRZgmN>AdGYk5!L9{d2~oS%g9#dR~e?XQYb?
zA9iFq)T6GXYt1yG?~Yrfu@!B14_Mtsx3tthmD8}3z3k#Pc;8xC1K6S+>u^}R+5cpT
z^TxgIc6YSLk%wq7<~{9q?-MO7@%O<K{=_ved{+*S_-vOW4U2y~<RdTn$@}T)l>fgx
z=F4^U%WppOj!r{4JTLmuN2=|VH$CaOY>7n&X-+zYN8VB|d%j=%@_nDZmVqJoAWf=L
z;DkpJYQPuV6CZhspZxKQZ{qq)J+*g)gOimn{pnL*^7alAx2&>`r(UBQ7sNrh*0Bjp
z!0Q^6@LcuNzo*Vmp8e|o?H~fgBZgh$8gKyRhLdK&_<1WCBdee)>;o29+4~islAxaC
zA)o=8mdWuR-7pgV6_V0?PYnnGA5np)z{4ReAP4fu?M>bXcA!p4L#9B<HAG-3OdtuJ
z!8h~_K6t_2iJ%NJM)E~o4Sq@-(aQ{Wh0{SvJjg*2K*KEfLN`!>7vziuZU4f6Y{C$p
zK@kMu4o0CA-pe<@9atRB6l%rkNC_s~n+0`Y7FJ9@kQZabAe0OhTA-nlxZh*!j9{1{
ze6gXXRN+{_AqS#R80H~Y)W8d9T4P}0W2m5D<Od2YNLL6V9K6;60vu$VK@0?u*r1bD
zG=rz~z}7JcC2EQS{t3ral~t4i7HmRa>;olGf$uqj9N^PcaLgGvi6fjKV=Z7j1RljG
z$rz>~86uAw>fxu%f*&@99frjScp+KHfgy6mFk;0n_DBdmMm#_wV1x=2T%0BL$TVt7
zGx~{zIl?EbT?}~^=1_w!bQ0!V#Wr>$-tZY8L`(q!!xkLD?uA7rI{yYA{$f@jq9TG#
zuxJG#9wRUQi7#RWD2n2CvCdpv!zbv17rfRh8bU0hqAL1BL&l;MoxvGIUsvqI`CJ1!
zu*EA3!-IUnCtBnz?8DSpBwH|z)A)xm3M5Ht<OpyiQ%TLmp~D$a!Gf6NH=v|eP(!g`
zLOl4SKLF)56w4;WLs0?{QW_;R*kfRvpcu$OUpymLe1k(i4FH*9xZndH>;)E-QYu~r
zIuyYspaYTgfG;>CM{a^4Py*3}1u2>$N9vGOP{K9DrSFYpSrSPhh2lP-16#VK^MQp>
z0%c(?rBWv4Q7UFr#!3++3>^vq7L>v|N)ZY;!a7{VFtFoe`u_tR_P{|}VF6mg5u{L9
zTw@?Q<y9o(VB}(a5F=p73s<z{KSoMGej*NdmMXl!Jt2;Gk>%R;fI9vKG?b%N2&W-b
zX6mfYU}i-!Bunq0j2x`M8LW&yzya}8Cne#)Con-G%uemxPU0LRcFqbPJSU4W)P~8$
zRp0>45X*LU=XYj>bV=ko)F)=*=Y4)re)4B#KE^k^03Y~5GE(Jdy?`7D4?4^OvG4)n
z#KQ=v&I_PJaYhV2FaZkS028zea;_saU=p^}00DAEIF6$~-~h_N0}7N<5r|_TVW@_-
z%Qt$>hn_)*jwo2@r;hsPj@l=##H2qY!`iu)4>?&fVE@4gbjxP0reO#v-uzEDh-LxW
z0c`4}Su#>WE@VNT!CXw_WR;@t`NM6F<QbIYMs{RB(4<)2WKN#s8NlXM<ltf00o{qk
zFw{(1CX7wu<W&%j(IAo|=-+tOrfq7PWK!l|aHl^&gKv@&J}d}mG7{V^>2Zc;{QQq>
z3L~9#jJN0lgi;M9@Bt;s&L+Ip0VNP^eyTr&>XZPEAtcE)tbkQ)!dLzg0Og~m@Bs}K
zC^R;WRjdFygyOGW1B7BKTTp6*QDbOQ!`h9&H&B6SeT6Dq=6}YJM84LvV&+w#rav62
zhc@f8Mk|U5L0L+UKUm~p7)G>WLc|~|xuS!)R{vv^cA#r!#f4_*hKeZ)0H+l3CMF<G
zhyF#07Sx!QXLX`ybgt*uxF>_oLVS8BS<nI$j85om!4{;!#Dbn!(3p*$0faGZH!UaY
z#Kr4qmp{-Zq4vp`5@{&}ptJgeF8HP&%Il=EBh4z2L^h{Zu;$4g<1j#&Kk$L5!b+x2
zQ56lUKm4p!2yLrk#j9=?I?X~4P|~dG?4A^Xg-{Y(80hTali;9(5GYM<a;;S$t3Pln
z%{G`nKp3=!#gQhdRa9FHcwdkrX}54I%TCuJv8}kC*elFh3;6@Y@Zo{*fjV_l(vH9j
z_}bsDfFlIw|IlH|aw~(r#eyg*qvB0yTK}fDTE%UuDyx=?tHP?R0#L1zDz2s>KE#7N
zq(K^(CRk8HrNn?gpg^q7Di&NS0P)2L3{U|fZOZb=n4)WYov11V=-Q3xlX^?dUIook
zk|kl1RX~G3YDEl)7F(b!gf1xhQ0?w6s#SOl(r)i8ppR8tui!RGk~mT$c>yJOZ>D~V
z9KgYajsTHxtwZ7ilA=RowU+~tZPK#ixh4!-r0w3$j%dMyBfQtTM$G#}Oaog5tfepU
zUW3~5t(K7&|Ew1}z>ok3Z?ay+n8pv)#O(6UYu&=Fm@bCW1}$CktUo;MhDGhv60OyW
zMLA>{Sx^EdTti}@0PJ{f58$jLF#nMgK@sqRaGaFy3!u#4zQBQ$g5s(|RVZ&YO70~s
z?()*1KJft@B+kon1tqLN4CoNbp6dwo09C>77Yh^)5LDuzz=Wc)8h6ncmvNIQE|a{^
z@WcZfj|w&T(I(Wu|3D~$GVcgD0t&!GJoEqxIFUa9a2ESokcw5_TyYIt@az~y`Jx|I
z7%n*}jUy=yC?jq%ShC;-9~5h{s_9z|^iB-?iV_cS`YJCD9IsiO@Y+T23R?yFny){g
zuYbre`}TwT!tV{w2M_yj?H2PfSJEYA(k2zu8P9T`01ljj#aplidmhFLAlg2x*S#T?
zTWCc%cSS!0W1rk2SA+{p_Ww*!p#@)xg@buTs06W1X~jIJug;+Zjw<mfyHGD*g%rO4
z6>ss{m9o+>G0NCz9oHop)1{uhz#iXK5BM?BesPd2^A7`%MXQBA@sp(flOfvB99#1$
z<;Q;XhXj8O(#;JPynrX)hariDFKo^wqV(VGv%RK8Is43drSqr=b=7EvI_vcJ3<*}q
z>CoYWEZ;}Z#1T7h1wA}9QeQPzXSKvhZdTNzR(~~Ehjqkp^*ySlSf4dor!{N=W?Q}`
zWfc&-bRyghB)llETHiHZ=k*2E=#9$3G&;?Oy#P0QV{Uql=bE)%C$?fQwx}>`sXQw*
z9PKqgSZ7A&WLD-tGyk?`Z#HM+2`gWcT0kfzHR+IYOUoX1XQ#Gmul9woGBq#(K4C((
zysNoZFlw_lZs)dcw*@O-Lu9YO3;a*x2JREn3PbNUawoTP+p{uiMK&)tbVs*zPd9Z}
zw{>4Pc4xPCZ#Q>$w|9Rxc!#%mk2iUjw|Sp8dZ)K~uQz+Qw|l=ge8;zZ&o_P7w|(C?
ze&@G-?>B$<w}1aPfCspM4>*ArxPc!yf+x6wFF1oYxPw19gh#l9PdJ5FxP@OhhG)2j
zZ#ai{xQBl@h=;g{k2r~!xQU-Qil?}WuQ-dhxQo9yjK{c)&p3_OxQ*X9j_0_J?>LY5
zxR3uhkO#St5C1ul7rBuiIg%&2k}o-vH@TBPIh04alutR8SGkp6IhJR+mTx(ice$5;
zIhcpJn2$M`m${jrIhv=rny)#Vx4E0YIh@D2oX<I(*Ljt5gC|@<EmVV@_c`&+!#rHY
zC2)Zf6nde@fhk-Cp!+$aPhK&Mff87ODO3X*D1j5iK_r+$B)CDL6M{cPf)yx19Kb@O
zmwMs71EDJc8dL+M>j5tKgFNuLKM+Hu6GAkkIv2>gsqcE+9fF~oLL4Z89$1AQIDryy
z0VBYArRTY!UjnZ`d)fKA5{!W|OglIDL$DjV5_p0?RD%_O0XL+2vO_z$Lmey>`Xw;J
zw);c1YybPSTZOvgf*%w*w|j**ctbv5#l7b{Sg3<H=z~?rLoq1BJ>0us?7P0>dsz58
zz{C2$7rZwFM!~;BxmUbc$OEUt0vb30F?_na7y7jqgAyEqCQN&vdj+A_yFaJ{$cKd<
zC_%@2gRv_CE)+Ubk44H~1<NbJwS&dW$NbFKyb|1eS9n7l1bQtffu~zM(|d(H5JEL@
z!5CP@FMPZe1UfeeJ1i{yS9pRFfWcLm!q<z1C+Gp6pF0{9Lp|t$9|(rmgS}OVJ=}vu
z*`K|tt3BJdMWM?ByX!%sH$C8M#XFcnxT8U!&qJyk`mp<h%=<w#OgdPML!n2!KUDhP
z|Np`zm;&YB11u0jF<e455Cbf{Lp8j-8^8iTzyhgLedcd|=YM`Ri~}qvLsm$>5>US7
zv%cnA1?PJ{=!-t-n?CBR{#7W0CwM|N@Pk$4LosNAo?AuIZ~HjNKJ8mYG#r01T!rY*
zLoHl_EGU2A`?)Aox)LY@8dw44hr6N20mb_RFDQW@$iks(!dEQ2KfFVsQ#>JPJ1?xf
zwgZGIJxYjOQgTqqy@UPy5kjbhmp^q6P5n~h$6rQ`Xq0&J_wL}kh7Ti7L@1D;L4*pG
zFjRT)P{ue98TkW)uvRT4gfcorh|%9nCkT0JG<p<iQl(3oHg)<GYE-FHsaCam75{5i
zty{Tv_4*ZTSg~WtmNk18ZCbTym2pJqX`m*J?_fo`WK@%qON<`IQMQzo5-$EsDT(7x
znG!42cq!&*@(`?d1Btzhq~s7dmi-bhZfxZ-Ov&6L!9p5%aN)z989Rn7nX+Zfniq~c
z$gA2=Zs6kRk=J-Iw}Zs)>EsDZF)v(0YXwz;W*l-QYpGYaejR&u?c2F`_x>Gxc=6-4
z&g^TEr@UH>^u+NKiI~56Xq;4Yi}0{gc?Y?1l;zJ8CB}e7x^YaZCnL)I5k(2PHVbgT
z0uO9zKPCE8;y(xpJjlR<5cEeu1|3`o7XdSpN1u%JDMk~wGCD{ee~k0TkN=J`x{Rlp
zOq=H*e#rX~$RLFrlE@;BJQB$ymDFmChm@#qrZ}u{@*ptW*eNe3$6#uvffDjZB`(C|
zf*X@G3b8?dHVbpiG7oyH%Y*I#^Pn-wG&4bh7EE)q!19}m3&m=j&L0?M+{wBB2s6yN
z_*n9B$w(!gl+sEqy%f_-HLa>iC;b>_N-CYagqJvmLTJmSN<0XtVi@HI7G*+n;!Hh7
zRC6I$4}(?KiD*?(o;i_P^`eY)^@rD4YmM*L&0KXN#W==LrZ7GHv5nA>4&})ppk}&j
zrebha0@6**Jr~_{)m@j}b~EkNNo9TsRn&v5IHVR+PBn2Umh|)|pZ|mO7zmAid|h_W
z5nBpaiGiOp_(_c{0_rG#;{#Y=f+7ADL|ge>NS{EhxRMKfKJ%p06o-oAml?Sk3XDLV
z5GmYo%XJs$oORxr=bnA;*%MQQ9{Q4T<Qd02C*vR{(1SdIW#~wnatK<Ds=29Qkq*u?
zzQPn{=xTwrjyR)<m7+SujKa=ZBC<Q~`s0?abxV(GkR@a&LT-x2pDaz$DJFmHI|vPK
z@)Vchn}1%M@x~p09P-H50>ckjWYMHOLLyPd8&hOK$O(_Kx+iU{NdM~etn$g{D1A!T
z=pNRST3zzmZNDA&+;xw<nuDAmL=#q^zJwz^qS@C8Q+8jT`Typfe;)eilkC0TlRQCQ
zdFi#^p8M{-{~mm+t4GL+Ujjr3jPTW8pZ)gTf8Ww-dK;Mj`r8xf{3qvupa1^-{~v$>
zw9fUEP!j<j5P=C)-~ti&j&U#$f)SM91SwcS3tkX|8PwngIoLrDeh`Eq6yXR-h_im&
zj2{ePO1bWVAjKu+gh_eF3yl)P65bGpIn*J~4xt2ZWP}(>$evR8p#-U&PdHLziW|^y
zlq@+xiAfoQ8;<f01MU!uS=8bdhvX``j6@_%F~widz=d)2V~kB<qEUq7hhI44FH)qU
zQSin^JKhnGc~lEOoG=)DIN>nG0K@O*WC}3o!3y#iga0QC;)H@N@>-^f!vpo<2`gLz
z3{BLCa0uazd*H%wgs|2;z+jp&fZ-BW@WhISGKPB`GIaSkgcHDUF-xjakGa(4E_Znu
zYy`0u{Qx8^ph%}UM52hBvjP`tk<5m00Ty7`l1?IV8BNwoFrHw@8uz2TCSBq(wHQZ}
zV8N2jAqOSz@J0a*@(W(R6Q1$BVec;Ckb6X9C#Db+ogV1SG3?5S0Yif+X7Ua{{K}C?
zDMlowbeA=P#GAAdCPwP0kiePB6nx=DfG$y(E6Nk3Ar&bFx!?pRU}R#RP$`|}<WGP`
zVn1k5sVC&22ZUZzM$o}n6Wy>S+j!Fo8F7NOD*u`$n}klK)woO~REmp{J{77_1>pJO
zQ;&;8g9}nK2<u#mEF=2kl*-V98}y-*O9Tj~6B#I9q=vVJ3K6V&2~cw!@(YECuAP`1
zhpRk+3oAHPs(}^kV7X_Ts`-PM&rt`RQq)yvRwGcgRMTa~Fb16ZLl)-o!<>${6S$(G
zvPPVfP7-1xf5<~99^nUHE<!`Xz81Ez#hvV^A}o!(4k@&~ZBkyRTchCChO!mzaEV)7
z;~p2e$yM%hncH0FJ{P*tmF{$@TV3m37rWWLU_ZFK5AWgwyy3-1JmMi<@OpP2+*P4=
z+1p<CYNa3h2rqfvk&bfQcN_V&#(u3K4gdf0*Bbd1@HXyS;QOY-z6LJGfc48?|NfW1
z`7Lld+(F**;v>E9)$oRi+Yj)@qrUjvMt=iL-~(6q!WiZ*cj7x=5QlidBbG*qPkiBh
za2Urq-lB)c>kj;q*u*G4?|L`Y;_-s`$1@J{g^8?VCqG$%JdTHbWxV9`;!eswUhsYi
zoDTBhqsdSf^O&V4-zk@)zgE6+_&ki{EeE(9?!Yja>0IZ>$=AmthI56%tUx@!nZOlZ
zvz-ZD=uC~*zFaOxc?X@rHov(XUdD%^DP8FxdDzGMjdXc;h-frhBhG!c^r%U#mVHcl
z#02JaF2}p&ZFsrSrIz)qtAdYAzyCTOv5x1d(~)X9(;C>pMv6VQyy!{4w$*TsN0^1(
z>^kG4*PveZar;5+0H@>F&epb*`w@>3FIv}1lJbjTY+wqzL&&1mUboS_4R<hm+wrb$
zw?~ZaCAFE#K)x@!Eu3N((>K8~-g9~3ox6RwBfstlx4aq7TyI-L;YqSJnxzqFf`bL$
z6jyb&mv``lH(Y`0uv?O%5yp7$1I_7J_>U&8>5Eqf)9nT~^9~Mbj)S~^^QgryMsB2W
zu%Z|b)HXiy8;>K!qusv-kB6ge@8x-W8#l-K`)Yw(B9(R9{aCQnfrRu|b6q^_w)ygi
zzKxYn{d@dS)IGc*bTxUyxBuW#M;ztB4U=Chs@>3gH>wh5??MF~dq2B}3;vbDPes0G
z56j`Hf)6yi!-QDDhc(iHcK69cT>5xmF@zN#cao<X++f`Uo0Ac4lzyb}I6)Iw-}n(A
zr44X^N+4L@f?F)*?@3ulGJFAct0cqdS&=W}k8+J+_yQ~a@Wp!NtC4S@<0|fexIcow
z6?La&AH#r3Jd&Z6UQ^#G)z=C>cn|%hh~FRA;QM#3fqsANzW0`g9W08Gq7|v=FA*Wn
zIArk`ekh~o{NeLPN*s2A5Q;)7+JR7vqMD$>6b=vx9ziK`Zz+<&_xf)9h!2L4FZqlD
z9lpW&%+D&cZp69*8voqSEV3^uG>|FEZX29}1G}OdL@+60kUZK?DJ)R_kmCQ!MO?&X
zNcsWw1Q4nUP$Pz67S6yI41p3dq7=^H3}(Rzu^<W+@Ef2I%;W$LZqFa~K@P6)3?>a7
z_}~nv!6=qM0+AxVoI(dPVjsTY8jh_W(BT@c;l{oJAHIPaFbo~y;Tk}2AL?+;_Ms2|
zP$TFt4wd2pk>U;OFe8-DC>rq^GGZO5!45N`8v=0>{c!#Kp&z=z4(|{h=+Nl8!4L7_
z5}l$P{A=Ohp$<!N&B)6i5OLD>0UFjJ!~DS&p^p%s&kwl*AG(1Wv`-hWK?G@W7LCy;
zg3%DsArDh=DgRdS1({+WdM_670UfAe9Vqb?{UH+_u?zKZ5;2hm*P$D$an8~Y2i@=*
zv=I|EaVrWD6^#xRuYn#8(fEw65woogcTgkb<rn4w8}y+X+HOdQ!5hToFVq1R+%BYy
zFe3t?1*YHxvOov?p$&#W4YI%t{GkzcAP&^v5fpF-)L;n&K_Bv93h*E!;6VpU@+9|R
z2h2bXT42!7Few%>Bl<BJz9AksFd5np`23;#PVgsBa2O_y9@_9I;~^>i0UA#51ap!q
zlcE~CfgU&z65VhZ?9mra4fwjD`;;#k;9(fN>nAnh8j@icqS7C}!56M!9gxo#s394W
z;TEA{^8dIFA9@eG)Nv>C5E{no#-PC$@Dc=f&kyl1E`0$Sl0os7Q7L{B9o9kn6w?sD
zVK8&e9|Th)DAO{b(igr#GsABh711!GvJ~SI4$}|#)XyIda~+@o1l4c6G-3wT@-@2w
zA5wEF>A?_p(iDeMHfb{|z|JlWvksMS9p;iDRC6kOGA#qsAC)2i%K}Bf!f>PtBK@Hb
zlpqg`2npgr2gZOHHqsx;vl^747!+^}aG?vbKybRCBmKcW;WG<v0SWRT5RiZi{Q)PR
zLh9NuE1Po|=)oy7B08b3yquCD)^RX1!a>uoyf|<jk0QO)OTExc>Oe6gv@!-uGd2U!
z{QtgE`NU8oZ14k}4;nsH`Sw8@M^P)PF%i3P`N)s@MsvNUQbFai8wRuczH$#?NJBT&
z8l(;ycv1VH!AD#4C%<96=%GawR7s%{1aZ_U7|#ZUu?v^&D`%1K;*Snpa~pBf{9Y7H
zKlCU_(+xRrOvQ8@kD^G8RO+Y!9_SDss9{Xg&lxQ=9tzYl?~y2VvO34Yb?yNcqQUB-
zt2^sJ4RV22{8I@;!VKgS2}nUB6wq+$KtBD!4C+%;y)z3QK?(lg512_K0<?zaRO^n^
zD422>niCgW6Dp0aALC(4A@taAH6z+D8x_?3;sL;h^%<T4{qiz4A29~?^h0ei`2T=!
zD~&=$K`<kp&qa|h4rO#kyCE)n6%@@66@397fK?-sp&OdByv$JhhV&?eby)eUSkW*3
z@Im{`6<sqTT*uWPq%=h*jb5R$7Q1gNwp0ZF^)17c8zs~*k1aPllNi5Y{cP|psg?T_
zHd)^<PCxTq;ni4=Vh=|#Pazf)pU(_y)hT6l&H9nd?hY+nODo0!7h)C`Sm763wkj4C
zq#Csja$yPl0SRIO3D98{bih)ZfF2bvBRDl9J~bndR#ZvhQh9+Cupw2`P-8dN8sfEF
zkF6SSEWIigE^Rg2c$GpGbXRlrPrDBtd;tZOBF>V+Lk*K5qO~=z;VZ|qFaJGJVlTEO
zOZF{G6cV$Q2CZVv^43N<@Yv8HS49vU!Ao8JfnA^CZIL2LvrqdPw=*+BaWjHnsnl`-
zwhIMTE1r@ZHR45oauPYv95XllsI_5Fw_E*zbgPwGV{_7!QFSx6DJIurvC$d#P+%=^
zDQA&wyS58eNM)f+9dKa?onjnnffa14Dr#Y|GJ+psBqQG8Voc{3SavCt!6BDIA6Nlr
z<4I?E)@K#M1cpEfdX^BD-~?Wv4V?B5I@Jtx;05}DezQOxoS+42U<dwFRd*NiUiC03
zaTxA$(v(vfZxwA7v@WUdft8aQ+Eyy))fdp=DV1*+_--G{Z~6McF#j`HZ;`?mhT%-_
za`~(^HUrmpwZbXcvUZ_i{kkE6hq5ydQ(&QC7`hS_WfyV@wJClwgNc!cyV4tPIQX*i
zDTx>zx-UXMm@C$H7(lRLd(|;FH+P}(E+G>WPx!{{Hc6+Him4SYiE%C+lOeV^D?avj
z)6W-Tmw}DWG8K3y4_M69p%_>pj-&z?q?amgW*+qKBewS{;*Kf67b?ove3ih$2xJ_1
zf>tgg4q$;N?!l(G;1cwKP;lWc2&0esfs-@Bll_4gxFD0b;m8JfJk~3D!(tF)kOfUw
zEr_fi&a#Ho&^rol&1RD<W_c?L510#8DQbapnt~s^K^dY!SpWW5Ba(TU5kwx8K^d@@
z8}6YRieVn^DH>$wF>rx)wD%o~!EnIg9hBi7l)-zk0-D9i9|%$zK4cu&bFtnb8UpYh
zuwj`W;~l`E7}lAK3NQ!;S}Ec#A8ghsWCsogdI>NUNOo^6byqARdKmPTNcv$d2Ukh(
zl81$un0uxe>}G$Mf*1ao7sAMy%ce4ZVI1_KA)_NjZ~+#$A?U6b7qAx`cmWoOfjH=b
z7t}!(Fs~MfAy)c$D}G_6Nv|5{LOx(&9^@fL^5Gp=;kIO<<Y0jy=`T8TDIem%tN$b|
zF5#=MlRP{c7?Z?;lY|04x^}!_0GZ+)6s0mqSy<%3H2)A|9Q@f>z`-AI;fLNqSbhO}
z<%5vp+DD2(kH<lo>j4P2!mcv{eCc8wo>w07AyK85sxtx`fDo&z;bO3wtwUS1t)d>9
z=_&L%BTkyGGa@0&W*n-4Z~Wn&`x=l1TO$T}E-nUqInNtBsj;=9wFPjp#c8tVBp<3F
zRx~2B{h=6s2(buqJ3)K2r<=N$f*)#Oq@7}U1&0-?H>K61AGm=P#-X(N;kpqdr6p#t
zEjza%d#~8ex4Qzo#k-};>7DiA9vI>tmV3F^vmf>tx-&w$tDC?HoSavX7x-8iwo|6{
z?-zg$u@Qqn;wZh#hW<377-T^*v=_4VnC&#<xBs=`!HXg2t_2oq0T<@sd3m80dQNx@
zr#NQ1v!k1l3*5$ckfy1k;2KLt20M_4Su0)$g_c5g5cS57yt={LE1tI)Y9Y4MMHz4*
z!^3xr*uly(!pgJUAF}+)x17tpT+6}y%DJ2!usqDkT+GWn&HZ5+mO;(Y9L?7}&f)ya
z#oWxbe9phT&ENdX^Bm9XoX*c&(EohUuYAw%e9Qs8&lR1}yPVMzz0k}2(EXgx8@<vY
z-O(4l&=I}N*`dvsfz#Jq&L6$gA3fA5UDDlL)Jc8SH9gZU9nnuc%%4jiWZ^?l$6fdV
zknP9=dL0q`!3BEV16;r#5JA{I;1vAf*#C*ZAIRX?m%$v4oecbe2#(zxPT|;pJ=lAl
z*o|G-lYQBh-PeI#*t`AM!Clyy-Pwg5+NGV^tsUEiUE9mO*w0<ud!5<ko!q&--oO3c
zJwV-`J=%qR+N)jIuRYuMec1cG*U=r{?|t6+-P;@f-vgfA2fo(}9^Mmv+ZTS~k-g%@
zecC(T1N<T0DgM~a{o=!Y-Fw{}mciW(zSm7Y;ZvUBBi`ffo#h2S<~Ls7J6`2cKHWuL
z;Y<GHLEh#+zTJnu<vrl#dtTUSUf+{G>Y<CJk-RB-odxdT9DINUzTOAUp%T9S>nq_L
z$esnR;2iD%?OlNx(4OnB0PUG!?ElH0>%AWA#UAa=p6q?#4bEW(X21s&;T)pC2M#|9
z&VdsS|L{4X>ly#=6@l@6U>BHS@(KS9CZ8D=pYaLb@DX3}C*ScW|L+5T@C%>u6QA=N
z|M3q$@+ZIYFaI1epYb<e_CMbTRA2O4-|qom@I62EL!a?SAM(#Z@)<w&JAd{yfAvov
z_jP~xdB5~$0QebS_*sAQq5trc-}Q}O^LIh^Y5(xA|Mat8@lC(_bD#W)zx$7W`z>Gj
z#oq^PU-_SZ{iWac(?9GNpX~X*?*ZamB^Cr(xMEh2#g%h+5;Aj@@Xom_2?a(xm(Yhr
z4<7t^{0K6n$dM#VnmmazrT@y6EL*yK36o_tWie~oyoocX&Ye7a`sB&+oY0{}iyA$O
zG^x_1Oq)7=3N@<KsZ^_4y^1xf)~#H-dX38Qr`WM%%bIoh4%gYWY}>kh3zz3IS6}Pe
zy^A-m-o1SL`uz*|T-dmT3mZ18Pu9J|j2k<C40+_-z?3UnX2{V)2{PoQ`e1SHjR$5%
z$$3~f^iJjyZ#rY0G2`6l%d~6TraCyX?%j}ijpGeGxbWdEgWf)l{Hkg)cV>8~BsB+U
z(WHx-MlDn{a~~eaWQBcB5u)Ve%h$d_hPe8-{2WK4xjw%9`HhX6zmK1&>Rsntb?@&(
z2`oU@91$!qqeu=V%>TfjbfJyL5J7j4a~)Bl@kh=KA#~Od3lpBR3q?fmcMc*mD3r}P
z*)&833$a~6M2RyrGy`2LvOq)>G3Li(k5bVG<WF2IcGx()1c_vlN&@A9k4_?|+8cM|
z;DI8t&7cTD=aAt+4p%T!LKKLcc8-J8?czZcTvk%yP!|eyg$Ku=spfO%oOs8A<S62S
z4{^rG=M{0rW@evb0(#n@PcF*nP(Bc`WTY<X;e;O17<P{=`AEuXr=EsnU!$V>r5Z;i
zT+vxJm0VFm2wQqU;xUL2;X#arG9#Llr?r_KtZ;fDOs=Y3f#!I}r0BzjvU!jV5hYL<
z0-@9S%0dq35dX0uISY=;ZGO3Z3hqa+_`w)1?}UqPy7Q5NUAOMqrJ5_QokNZbtWo)D
zio!&TNC~!1%S@c;k)a5$50dB{IRcYGuz%wTBMdnTc1CM90n)qet#?|REQQ;?3-WE>
zs@o|crg)?dF(2vUi7aa=Qw_;7&ukbwHs6eM$U1kmA5qNIx(f>)ki%t)oOp1@DSeg+
z@X>D!#3q?;c6SG@Z=B;a)a1BW$%*7>he!z4@~Nw|50W;6wZlf?L2Ns}9oWb;D+vb7
z)%d~4N0BJw$E9VB^UK_V5B}3Kh`5kh;)-hocjHs_OcWU*guvY{Mbk^Ai_gwR9XV{*
znvKDtasR{u87X?s5fLe#Lgfsn(0fG)T^^$%+b+h&IfQAeh^>KcI}SWvauZIU9$Z}F
zPc?aa<i<UooJ>}x`Vdcj^)8L6ctYBT8hrOrg`O1nN|BSIROA;`{!r%=mHtwQ5DVsx
z-p{`kGjmvvWP8ak?~fnqXaXOx^rIH?z@GsR7?NdVh6QtIMK~S^!3c(fd-SW|{B|Kb
z4}{=#7VIEZ{Np+V&PN`E7=tok!3$y>;t<mtOEI`1!WdeQRvzGi10{&V2U5_3JbYU=
zPH~F%^>BzvNnCnlD4$Er<1F4#84{m3HyTPJhg6(kljxEk3T5LM$DoiGzX--KigAo&
zEdQe!$;ZVrs&S2MJmVI-*v2@@agA@BqaE)k#x&ybj6~Vv7wbqy@-U-Rl1LpppoqYE
z)IxuVY-G4-#ey4F5r;eoM<K6(#qyAbJGHuGCIz{yPM+qI$=PJ;Jb52ea>N{!@Bt}H
zxvW!-GL@n904rUIA5~V;7(#=TBU#c9PXuly`p^d>adHnL?c^7~`K2>CMZ-x-vyh~N
z4sr&<f^Zn43dXSH0<C!*Y-*F6-mGSF#JSCGQquziIwwKK+0Ah9fOPG;4LZ5G&URk&
zo#}kwJlR=K+uSpr+7#LmpJ@_rj6n&|QwbNG5Qm-kfe<~BM=cOK5`7#gNE(%)0{=ZA
zNoi8i7?POhF#`6=z*J&^A=PF{<%H7Otdw*uC8<ecN}HLov!*XSDJEsgQVH6WBg}Y+
zK!Xawq53qXfYE6rh5FLb7!{~A&0#AzvJ8xp#1u;CDlA$8i-_vv9-HdPOtiYPU(_Oi
z^3jJ{*=j(<O;MyGHHHJ@q!6a+#TBS3BoF4AL%W6puRje8U&-NDz~WG_gw<<a4x892
zG8UkY#S3I>s8}3IVh)4tQ)MlC1#?6;uy>^_WiI>INp7~YxIArWM@z**x&W;q`2{ST
z(AA5wB&;AYMI1CiBwi3g50UT(EPkO0H+VuHgy4oB{BRHE5<)HhV6Jna>;Dl`=s^z+
zT?sR3>yKzO6G-BXq0+KR*Ys-hpC0(ER|dk7Rv3ez(liEp-P;xTf^@#=wQpwd%N6~~
zm%fwqFGm2p6#?@%y>nP#b^4-U0*~~*e~GYq8%(+f^TopTohKr|`;lKLfeTi^23W=F
z4^wb~7jY;qE1YnNOK`y-gs9XZpgUquprN?GXt77`k>efvgArUX1tG}Ql6=Ubg<8eM
zrt|?0Z-8VR=Ms*SKQdl_P?>OuYpHtcTheee<V$!V%}g2i<)nsr%o_fRnMudlG`qBt
zY%a4v;4J4ki&-IU_R5>t8Rs<Hlm)CT>|OqhW<jr+&vrg@puarmLjNO}Du{lxNM#FR
zfAE6~N`M6`n5+`sdISt{F!C7u!39tFLm4wBgd37q3m_N6ADTciBZ}(}S<~7N`A`B)
zJb~nv0FJg_y@x#VQH?5NV;<3{hj5DR4{+$#AIomG;Ml>DJg2z|^z3t1`09aE*f+D<
z<~BgRjTLZ<JGI)5pt%|C6?Koh-R|!8SLDrZdUsQ3o~;YM$t~x1lR4gTS~tK29S(lC
zmf+!@x1g~KVy>S0n4w0o6-;IdQ|LnpQm#d-HSrN3dj!}Xx%H2gF!H`R!6T6fc1vJ}
z)>{0cfZ!OWKZ?<hab$TnGMC3axZ%W`=X~cR8<VB!J;_%5lm8s9n6y$Ll9_|ITj?BO
zy3>;ab&g0~+f*M~)3=g!4{SZpUAH>e`7L&&FBZdB<Vx7bp60TDT`O-_yHMHQAGf0&
z?vtG7LA6>B+|K$XqVAs_G<_*9u)-ToumX)ie)5!;9M>ZE2e5(64H3J%B?QcLHJTX>
zeRyMu#Nh@vY9ZzDik|c|;}YNPuFY<8M<L2N$1ylk1=t5x_5iK@?LClt-3yiXw6}^x
zejj|{CzbdCjmq(Hulxv-bc&xb^i&3Edq7A3f&86)^P%#5;BTM%lAwNGt%CjACz{@c
z{5wV?p#&7W1QtqgLb1nSg-WHk{#>Q8sv~cCwpM@oQ2%)(M+hT!WHF&g{XkpZPz}X!
z5AW~}@=y&ivmX3V3;G~|6lj5SgE$g4ei0N^2O<@N#1U6uNg*gfBZzKFVS=ZTf+`3>
zELei2f`YH7b~G3jFL;A87(wjCI8gy^;^$@Cr-M+zgE8oX@{}1t2o*z^dqtRM#^3?7
zg;wKGf2o%f^T0^TbQ8(67(Nyg+%R|`<_#3L7FC85XGlFCxP&=WQdM9Mf`VWE!4Wp}
zh9bxVa!7|xVTUy&g(?__b7*}}ml=4NhYvJ}eb^L#h=_@33=I}qckq2jp;P3Ph>KW=
zSa*nl7=n>_8s<QWPjQJL*ltv4g<9nYN^l4-(f?Ji2#c{Oi?c|JwHS*w@m-mw6aA16
zz37X-2#md04YfdYT9s{yNJR@I5lAr*uCNR&fQiT`LCTmE&G?MbD2)(Ajm&5e*Jz4~
zxQ&+BjnMdwOUPgJ#8f7@Zbv7L;b;`rNRHXKd{%URN1=}P#g2A2JdP9%^;bYHVT%DN
zkOTROHjx-*H8<~2j5UFVE@33R0Fe<XkrT-awZICnu#i6nhAzPmU<hiTa*Xn*X7j`X
zW|ta=D3XEoQYATeLQyI;l#+|Jk|ybrC>fK|H<K-i8FzS-EBH^Kp<w}&8TpuvL&cJx
z^pcg-lQZ~}=Ma=}!VyFXd;8c(XrKg;H~%;4uu(Fj56Zv_tdNl*H*F`O4r6&1(NGNy
z`4RlU3dP`-;pLXautfLp3$kE=_n-{2zzh1I4sKZs9SANVd6OjNKm>6GcTiM!h=Y(Q
z35BT;i1{;^wUkihn1`8|k~x`bR+*5gn3*Ykb1+4Qc?Yh5eB~&Qgqd)Ud71g<nUNTp
zk4c)iXPWxh5g3IFBleLq19LMo4zTc5C~*&FX%cEV7R0%hzv&UakxU*zjQrpm{_qPh
zgpmH=faxNbOSw&%fr4`|n}ca?Fvy*r8Cc)Bo!uFe*?EHD5T4?>SnQR1i+P&lsh;L}
zp6;oHK1h{Mqz|0tGQ?vpGE)t_Q2!5rIT93D47xQA#h``WPz=hj7~BvITIdfH2y@(U
z4-e>tX2B20=?}c1hWdb@mm&*9SDol`os(%(@Hv<zrK0D_qU>2<FAAeoR8mhhqcX{w
zH>!s=nuqy`M53SsXiz<wVw{okmepkv?*I$jFb)?r4(9Sg{*Za~@D7VH51IE7O3I`c
z#S5^24b@<CXR)Cm!3&@F8-4j>YB3J1K%gZWE+?v^aVn>CN~d*dr*}F@J{m*wfLm}i
zI1Gv|{O}6|S`yKjYZvtk#V`(Fs%1;cWb$Bhh8mn53PY317GwGmyr2xGr)7heDIPHo
z70G078kin{r>Balsj8~0%KxfUS)0xTe}{)Z#2}%Z5}aWf60oos7Ud6rsdLRF55<6y
z9s#N1va4J=m%>RFn3|kwcn=%(4s123A3>@hX{xP?t=X!r+sdsls;3Bqg-(F0Gs6#x
z;VJJR3u>4W%mktrr3~<~7|uqW!&Iyu!LGG{tcThb%-W&qs;f5#4oI3j9aycN0;k=I
zunDWM3(K(S^{oe_2TH&{_>&f$;tjFZ66)Za7wZrGpjNU#6T?`MRVELtAPY;Ru}hk-
zmbw=F$_rl!mW>LL?Ewoi_Y0#+sGV}K4a>7V>$5+5st-#XMS2s;pafRHdInStezPRe
z@C!t%5)?<AWi@PsvHzj`fVCvSiy(0ijD)q^kh7e!vp`F>Wox!)+m5fAB<}zQWU)~H
zCqf>&B*fsSXCZUMV6KGWvA@8#4#~H_P^$)et!PWQg=@Hnt9C*g9PfYzT%ZRTsuQ)K
z1YiKQf+Iahq7S%WVsSx$y0{i&i@2dHx}%G>iW?k$zzSlK4_2TA%4$GWixcV)wqr35
zBkH*%1G=QEySvM~+-kbO!3E943UHefo)Dyn6s0$zNYlC&>Tt5Ri@Sr{yVFa()vKz%
zyBoa*YtKWxHX#pvibxnJuQri^Y{3n<kekqJt=7xF?d!fbioLsG1z_+Ckw6U5Kv6lt
z2uiSdNW`l)QU9(#<_%dkt}dYr#K3^+t1h|wz76ca4;+2*3mm3^3&qgAG2spMSHSpl
zRy7f<)%6<?=n<#46N1XL3T&Oy3&AVQ!Yxd163iRpKnRSm!6<PFN`Py>#7s%s688WL
z#V|ekP=?SsR;Y)<GQ+?wti(&~!Z6Gm>cA71@Q=TwWW+GOF~JYYa7<z9!RdO$NUXw4
zEXHHp!cKe`hk!gFp$<x*t~c>{&x8#YS;Hlv417Be*ua;=Y7<QgxnEqWWDLlG{J>^x
z7-%dKZLGXp+(_eKmpd`LE&-;M>&Hrx#DZ+emrS^X%oBtF3wodoaqt_;qX&dAJ>%d9
zZomlhaQ_IA;0bZ?RkA<``D<Lf(8|AA40^x_P`nc5i%?VS7=1g*V2sJbOw6IH$vdG0
zZeRsgfCiqx4NgD^yr2a0z^8lT3G#3V5XDvbaIs3DKiOPrN}vzbV1JPyq$^PkFci#Y
zArG3e&I=sI#eBAO@Bj}`22@lC^(+NBQ~?hl0oouz{agX^Y`Dj)6G|`+$`xaTAXd|C
z3a9oFhj7kLa4sA7%@h3&L}m)c+s7pFtnXYB{NT$qVI&}JqVY`7WGe*#002KgMP<O!
zDUd?~0006&2NA>xG%Wxroyls;7%LYC)evK2a5D2S&6;q|9%0D--~>=?(Mp}hP3;G0
zkpFR}(9tA;u_hf7p{f%PsMYJs(`dWWE&b9oEz>we(*Q8g5cB~oz0+ZBwg#OOKrPgl
zaAfmfm9pEq{*Vv+u+&XmUEU1U9?{gSzy+I94e47F+_1TxD-Y373?}9c|CkRj^w^QD
zY3kr)Wi`&q;B4R!t$2yZBayscEh&`@*WEhSE}cVVVAeD3*30lf+K|?7o!USv*Em7f
zF%}K1>j_ryYfd2C<G=_}?bP*$JjG4eQ0xbdHwHX>68Ye|XoZpU0L7Z^5$SAP<6zy<
z)}_Qi42$uXN_um(Kn$?(t|>7<qixzig4(yOt*c$u0C3h4RNMC)4uw$L@QvF(ZT}bq
z3E%|T62EZ8AZFfbSPM`L3)6GpAHmfgp`<!TK#J-Oo;}1SkttW*-tqC?{N1YZ-P*5>
z)-??P5AZ-0z|uAC;Xa$&HWA=2Zi_8Zu(Z_=r?*j0nxGz0<F&9+53XgzsB`xKf!^Q^
zLcS93PzwpX;X%^jE3T>_jzg|Z->~i0yO0fOt>RAJuq_TQiQ&2YP*$+;kF_A?nil2-
zln=<M5C2+BLtf+;eiA^p<Ve!wT7IffE<sXW-w}l6E$!L^;MR7|uv`u<GpCEei3_z*
zhUfcZwUFp#SPZfN3+K|Cjy?}V4h}}n61zF)^HJx5Zl`!2L3$3`6hPAo@c#e+fB*`R
z<)DtRg#IbxP`7BM<o2q|IxZ6YQ0tO>63^M`^6}}eKBuA%L8Lz793TNTP185P>b5QH
z+Y0NR!mqch44TThvQXf^E*!!B>^e&94`l524FDWK2es`A&ED<4>)*)B-r!XayzUbg
z1@GEk7~G!jF#7G`5bk_F?zGL)4G<3Ke(%{D?Vh3zvrg|Z0lNtg9QHo&o|*6a4nZ`{
z0pY*_G`-IP|M09@@Seh<3}3Ve5AuxR@EgCBV=VzGpz<n@-%|bnE6?)bK=I+A4K@Ej
z8gKHc+VP#D40Am4Ch-da`}2`e@;M)qW1ZqDP66QF=P7RDGcQ3nZ~ydoy7Qd!4sbs7
z9NBqU?-)ft_42sV0wDHduh!tM>|-zX5)cjs0019=Lk%GIUyrI)&nd7l?_AHdONRF(
zkJ57Q_xDcsl2TrK4-+L#`1RiRf3Nti9{7<`uZIuGSl<@1%k^Hr_?K_VjUOp`5BV-Z
z4C)LQ%lpWkZuyvR`eUs5OHvJi+xaN5-h{!+Ltpx*Py0>0?vC`)t>43W>lOiA`H5fq
z!7tCLza+IVow}bANM7q}@xl5a58R-J>R_S2KKsIN{q9TrO2Vng&k}O(7CsEbzcFp&
zAgI(2{MV2EfSmnF!m`}262(vr>Y&(Vk;Q<ibLOA^`A^L2pZ_Ghpy2@FPvAg;1q~iV
zm{8$Dh7BD)gcwocKwh=pO~h!hU#)@fxMc(xQshXI2R(QQmr~_QmMvYrgc(!jOqw-q
z-o%+x=T4qIef|U*ROnEmMUCz}SyJgzrUt!LYZ_JRRH_oW!D0oq>Oo@OiuqH<50)}w
zTg{%8dh+O6wr$<Mg&SAyT)K7b_DqUauUUPv^hUe5SMcD4`l^*BEbwDu#*GuIy&GBb
zWXhE-U&fpnsRzfMLH?3=b{wl><2;{6Es@{C)gW7^hMf_zX4<uF-^QI=cjUaWeH$DX
z?W{hIzm0q57n)!#bqbk3OkVK$aq5pz?#7;7`*!Z#G5`0j9$V~Lb;<^s9;i=wc=k-^
z@hbQlp?rq#<G07}Z?<>-{r&$3Fu;_+%g?i70;{STZu0Smo8tVrCmO8^q!1x_lu;(M
zdB%CCG=KO}2bX*pj4&Do{Q>74W$sbtof1zhF&Yy;^hTLz?g3Fm5@kHmp9?eeN1b=T
zIk3XU_7gBkC6{Ef$+ieIGO=-5q_3%QWHHa5UkJKq!YGZ@2bOWhfkhuOe*p)Ud%)oZ
z7Gj9OQ65~BE2b7=#tKVL<&wLwOn-Peke4Cbd^65D1qyS_GOK~5G+4eQ3`r*^rL<B@
zD}@qLz2@--mIu$;a-c3XHIhhyiUDVwTKe&)82@klv5z3oP93MldcM+fJs)A2$Deon
z@`sp<VjXB!6mdoMFoFCe6)j0Gg*IAgr^PMPX3eUG75LCnM@+Ezspgknuf?w#;rx+s
zN`amuRv=@GxyKuC?!nbq2w`c?A8fJ|6xMBvRnA<2Bvf!&eaJQIS!x$%xM7FcvKC>g
zu)%e&d-9bSzj|unho4&NQJ2hv^LbQOI^&(U-aTtsEJ$4Z$+kI?3o>@&jz2EgA7(R7
z>$-=320Cb=Yl@iXsO~X3>5`OzWh{S2gXPduWq~EIUm9&SUU2Aj7wgej0ehT&cwq&@
z#fqWYYOKL(+Ps{1R$3{Aho-x3yQ3{SZvVagIe4UMkls5Zbq(T&Rgw%RsPMoOoBM9Z
zABWt(ycee`AHYXark0WsvYa4&Sm`^Ycm5QecRW@9AIFcojmx!1=$e^DvMD1o)wO4`
zsU&;Ly~ee3MJUph9U{t}*(;Z9DciNL?OV#v@2_+IJm)+<kN4+u-mmxT^(^3i-+sru
zVXxQRwb^e*Sf^Rkqlx8FQ<Td!5#N-wM~cUI)QPI&_=77gflEsfs(~-*j9qTy{+ShK
zjyHUk?&V7eRr($Jlsz_hAv53~4>dJcQRZs-6(;rQ)06_8m0v}nr%P)^t<RejBHw)&
z+?GhVZ01@2^5zaz!sDh$*7?UQukE_TgSH;|fF<UsPELfwmpiav!x*g(d)KuU`}vj-
zrvGkp$g>BwaU5&f)0hS_I|jBv1+r;&Ad9WGxV+2by`xmG3S`0vTiW3B1zvincN=Wv
z1uIy6ys9CJqfRu6gN(ChVbq2&e0GR7?{r|ZUZCRFHS}j*%t<#`y5%X^eg8i@lk~ci
z1ZgHiJXrC4<9>m<%*H*wuupmHM;3fy-}n;3A%cHb=c#UQ8H%oe7cX#}$mb}q?=xm}
z=?-HL`ub=JTvJeeaf(<$hjQ@?jWwrJ)Tep-6>N%d5;Lt=;tiZ<$>)yixlxoXH4*uE
zzRi-y)ReLO^gbKrlaPd`WirFKL%L>Em(GRB=$Sebe`_0uM8P9&|3ECXw9`c{CcWtq
zTemDzpW~voH-jZmk+r6RWHl_g>tADR6)6Z-(yF@_G*K-xP`P?eJy(DK`So?dfyygq
z`D~boooKqEEmsZJnRjO0)x`F!o+4hQkrI>d;O91O+OqMN^s=LPSdJdZy1|WJrbFII
z5IVI@8%F!xN5Fuj=*DBO`pk(Ng0TwJ+LjH*IW5kFkDni{YqOiYcYzdL^s8Az8cYg7
zT^!|*$A;`Z$|Yt;e5apXSkq=qKKh#qcNc%vvwb|?_GviGN$ZLFl-F39{(IJE(NAnv
zl*}6@#y<vhJ+VD%FmE{?uLy^_+d-8rzOqeJ#%Q@aur^M8)z@J1vBO#LyfJIW5vnpw
z#W{;b%)a?gRKJ5hb<<L|8cm=0T%`5%v1y~#M9svPis+~A&gaV3GZPavwW@Kny%fX2
zjqSK*=*L@AUNl2Y?R7m`9^S7Se=Oy6!iS?hd<&ExT+WWFpX~DRf4yn5;s5_f@(Aq8
zve^lqY?|kJ7W~QD_8^$Oc_aFnk1FZsaf^J*iI4_D1r@<f3TTi~(4(e=Jp8*q**XfX
zghR4zuM?;krH~#!C>-`Q*H#1v6?E{jP4@IYQ>;JS`}LGm9GD`fzVf2I;^o~PUdCP+
zLR`FbubwTkgmZ+4*!QSgV(qz}Om#mPyYr&FZ;AKaQV;9TJdu<pCqkNMkJe90ia@l3
zh>t?IWTE#f*-&TB5Nxki%_rOJvlae3mQotey_1Kyoz8hu>$@kMt9WxQnQStdZ~aC;
z$li-|kuMD#icsw1`JBD5@iXw+Ro+9zx*yAY48Mm>7kpk_9$M9I4IFii`&_V4<|_K~
z`!{C$nRt=><cl`<o$Q}JSp!Y$opz=q)2lb47`AcdPwGjoX0mD5?!Gek9ysZ?eiR%2
zG~F&BaH{y2M^(!xM??!8-|KPzQ}oc|?mDjiPab~6r+<grb+bBq(&KAY4W4$#Uix7z
zEnlB2`4#7q&qX$b%U_kJ_lS~_<zKv{U@L?Q^3)95)K03C3H7M9$m*W@SW}abNby*k
z8Qv)Lebb8E>(tGfC;QhWi_&|pXqgDM7Q;uo+mkUX=bF5`9HQ>LehfiGX{o{#ksj4l
zkE?~<^P(<+UmwjaWy?2>GFJpSy3sFVUC$Of<$iZN^QxraZ*$gJ3}zyjlDs&J*s4J~
zi2rgE)2=-rb6&0+t#0;VI<Z;%a#gvON9OQ#<Xo>qMc~Ke7mw;Y<~FZ4_gG3VGDe&#
z-`eHv)!xZ@V>iqrDgUc-`ch;dy?BlkTdi_sDzEP^$~49I^8O0^-RBYM>w*q^v=*zl
z0w2>gQA%)+a)Z&Qp#b6UZ*I{p@w5g;%iC@jiH0r<d~=*~v@N?`ai$*r>o?;*n7hgj
zdRNo?Q}vI$4gEdsSFx?fawj*Bzr1U9bPE6T-hAfw`NGGRoz|=W>Qcjh>o>*-oNseH
z|IzVxH|ExvmwMvbyN3=Myw3y6-u?}7c=soY;Z}bF@=T`HTOg91CYf7P?GG~_pB@tR
zI~tMJMxCa1@ej0e2XShgbW$x3D-&4&w`{bDeR}!j*Hr6yBof5ZHZQK0J1fKRxkMO5
zJ7h`oGC_C(o#b#D??!5OAioMZjefYn>r8;!lHh)%b}O<H2c#A1p3EqrzQm!<!mWlf
zXahTal^DCkd4|&BilfhF&{~Z4@@)0vtd|~pne6$lh@@dqiVBVYx`fp@#<aOT=}<mX
zX02y6xPF;qn*G*m_{YsGDW*iJ4ffljFXkz5%kw}voZW>rQ%xaMT{r)BJU`M=EQwB|
zK4YD>O(c~nz81sR*(}u=AcGX#%E{nF&IEPp`*xW}X~CkRLq(85di-ze;qlU$NG`Z1
zQSh3emh|%5<X%B<rr49>XwsuD3#V=uUu}~RmcWz@#RGVPCu<~Mf;3~+RVO;l+k}uQ
zHrA9^)Rx_@H+p<->wJ#aPFuj=3ufWoh;abkdQGvlacVVFv?DO7W>oN&AYN}94GR<Q
zg5p-++sH6A-E~J~6h!lveQ%tdZuAXZBTJni%fdqGq!3besY0e30cv>~Jx(dW=F@0G
zE}2OouP;DtEs*!))SLzT^b;Xco}h?x6A;}YvYDAK$gMMqp!5~f^6oYw*B!A^3Ug3;
z^O%s4KwuA2)K1~b2sG4xn3B<|p7gl*rI(x1K1TmpaZIS2{vi<an5=`tz*D|51})%!
zzV59{(cQyFzcB25?s=J;ivM|_fKOA*8xxxR8>-o3v^ixjMxVro+THnJky<hUk2)hf
zR?{tu;>;g;TVAgpov2rUi8<=+iVA&`b|Wbukad0}ro;UX&1MXB8Uk^4k)_wuyw#{n
ziSpuv8`?$PnTLm6+{Z#Rh#8NIp&F+&&UI0D)cAivzOB_q=}JWxbG-B-3MB@`L_Yc!
z*?uR8qZdh?w5;2VjEhGuzz)v?;n%bINVk)vb4!q%F}9qF@1qdU$yzHIxC}Mj^H`V_
z6XIYiCj{LwwrS8N&HU6oiQ;=Nycq6I=4jzeoh04gGhz5^b1O!75QjD()DH&}hsAOS
zKVaa0Z={YBVoV+(pCj%M55#z3;GOk@FMACP*Liv&8Q*Tijz|n~I%`Ze-4{p0j7i{!
zpFnquVM3MMLTZr@=RrXfh`1fZ76W25g$Z%Q3fvtPGKGo9a!I+-B%_Ftiu&Pod=E=%
zLliQL=3&p=UId+9q91{~Cg6(#?<8X2?rOtD(_HR$1d|bXzAuI@!nh;>=1zb=3&h~t
z@W{WHelNp<D8`lNiFj$DLX{&{*>Qcu0?Ke?_^}<U#}rr4X6;9n%&Y4ukKNG4WG0Vd
zcxhTJf`=n06P{vB-#*s=djRvn!Z>9g7DRrT(2nmG)GWJ^7(Cy&w!k)2h7Zb&d69-`
zG1UK$V94b>aZqg-PJ!GgMhKDMckLiJU^E01VO|m)N`c%$A+C^FpL-hNPA5Fy#wY}`
z_*EL6h@d-O$Jik6TLewwGBa?e--2Q<NNSv66g)mVmXpz-Z9Xj_&@^Ix7-vtom`=)Z
zLOef8Nh!VmQ1s5%!&hyH`_ISYqqcJ%qZ!NV%sV7vp$oP9pH0gFcxx2GL@Q%E^o^Mo
zgN*ZCmUF7X0y{xZg?b7dM;I`)#%Sn~2@eu!W)X^G-JTj7h+#jPX5btcu$*v-o@o!6
z(4|DaT8<8l1)uiDxUbytk>nKTnDmaGsCWy%B87B!GcOb|{1B33w4L>ZCnF>*=TOir
zjI2|9I$407qHM*uVa82WyQkN)qUNl>E3mgG#v1ZrJTNowK2Jr3!GkKTGZ_&tw#WOm
z7=lXCHG-B8MTe1dwTIb=bRmPFUiQ2dBjbYUax9G}h9Oz4zqQ2lT{){mxzc+c>ape+
zHXg*a|4du>hKgBjokGkU)GlIKvla&7w=fZ=+cTe75tV;YpN=3^Ns(3rxRkDS0XggW
z`BJTx7R&PlCCGnzQBBt2z1CT*XxGTsUYwjb-IRVU!tX>>hvame=U`D#47)5{Ti>r2
zZ5Dm1zY@0Ro}D4~_=F3(CYjaq);?vEBzxaW4B+;-%TFJ6)n!|}jh_gc3tE{BLef9a
zjOjw~{CFTYwDr~tfoykAn!B4k&-0VR<@(bV(Bfgtoq5pJ*vL=-e$_L=3Wy8}`ni$x
zvvMUuhtDA#n04?3iSa}hDhy25a~mf)7;EKazkVB#Wkc^m<3~33lR|c&N=Us9-Q_>Z
z4;R(H{EB^x$d%;y%_0g>uYcT|p?J*NC!3V?R4MlrW6cW8HOquW{Z1Ep;15el;yK-e
zS7C_JZO3KRWg4roT|opgord0n$iHvx1f}a8>(5qaZ=0o=+jcCLqHEWB2pzGxjkD);
zaaL8vpv9>B{-*NG(R7){-git^GoyiOX9ilvK1baxDxRM5YCF>7{_VM7X0}RW9O2@>
z>WW`=OJ99d=;B&4eY1PjePZ?L>gvsV$PNnr3tgOt@S3;Wnvb^Yv+mfr2X|r~AcC#$
zyrtt!wirOP<b6q7cAjvZ|FHV}crDyx^~t?8T=(h}32uW&M3|AI&B$T?<QP0THk}+-
zNRF=|Cv=k&C&)>w<QK=}WY{`^Z9U~eB9mKB)m~3CTYu%Up6<V%fnU!&PhWpsxc;VQ
zJ*#^?dt&|V>Uz%c`a9SLk!>Sac;mg?MxORYzS%~B%SNI9MiG9aIDMm}aN|SGMrrp(
z*~CWq>c+?8jSARiCEMmF;mxZ5M{R6=HrxE-vRUK5S&QGSOW&+7+-#`XZ0z1_n%Hb!
z-E2ADY=v#Lv2C>rZ+(^9>d@ZmG~4QO+3NP+>cMaIrf>BXZuQq}4Rmh}PHYXWZhbr6
z8is9?*tSQ6w@2l+ziV%gnQf1|Y)|-aPvW<y(zmAzw`VTM*WKGcCbs8Rw|^dQ|AOtz
zv+XPh?<~sgENSm7o9(Q)?5z6ltl@Xa={xI%I~z4So83EG6Fb}Is~5`q&Ms`1!nV67
zyt^;Ad!W60XtsOgvU}{mdxGCRP2c^maQAo3?w{`6vx(imtGoY>ch6xIfSp2hg#wbN
zfORMka|+az0t=wPV<?CW3Uv{Mrj|n6L!q0bAlE4LClm(w9*TXB@yZ^P{2sH;9*g-N
ztLq+Hz#e<d9!JI=XVD&4?cSxHJ?_app0z#RlfBFEeKh+%-<5rS`F#PMeL?emA=iE3
zfc+~m`yv_pqDA{+wfo{d`x2A;l56`{Pxi0D52V-+q^}%Ymp_ovIk;hdAnSS{7jPgS
zbD)rMpjdRERC}P@bD%PLpt^Q&^W@+b{7{YkQ2olGMxFejrq1DQ^FuAyL+yY=otQ)2
zj6=PmL;c#rJ3WU6lZSWL4)2{D-iIGy*pCda92v<U8S5OGm>-$C9+?Fkna3PiWE@!*
z9a+^LS@#^-OddU0JF-1FdI&$ZV?VaPa_k^~?5K0>WPa@Idh8N#>>6|ImT~;3==gE%
z@splo_sQd@YsVfZ$Isv=p6n-HS5Ca;PkeMve9ce%Tu=N1P6A?10y9p6icW%SPeOW5
zLMKnc)=r+AA7TN3?>`7N4{#1hTnGRF6hZ>UTwD=wI2|o5Jp+o7fu0G)z{<?T$;Qgg
z&UuN0o%a$KA1}AYWw;RkWl<pkNimV@l45ewSCwS1-%^s(R8>;Fb=&clu%6~k18wy*
zZN^L;l##xc?j1w3dwSQ5k}<}X*2Z^lSfm74YIRvLI@_2jKS=xhkgeSAQjZ<iL&wKY
z9Ut^M@@hG~DR&msb;<5?;m1C*=zk>K@L1;Vlehlv&Vx@ShMq}<cs(BSk}>nn#e0iX
z`Chm5FCO++dJs_H6Nrrr^lT4Q9u86^2Fp8ym5zjIZa<ev2oJEv%6!M_m_*11MW}p_
zG-!yrV;QZS8XdY5t?G#{$KjKs@S0;WMjo+WY~$2@<0{AF%y#2$$HnWtPKdBi)Cx|z
zGx@@1`i0f*3j^n5{TxEf6yf2cl)IrRwTUmYGhUiar#d}NGoqxK;a^$gy-H|H4;)Q*
z@ysyCXVlJQJo0^QJ^R`{`c3<*tipF$&U;z*3E2(R*>1^iokMaQ=W={LzDxT_^nae~
zTA2H^Dc5H#FLXc8BO>4ZZGPpi{Lq*}uUCZ^$|3emaa&#S+xQaSpCu6sC6P6y5q+iU
z$>kw$%7<D$zF+(p|GuK@umbz)Q^fM8q|WN1%+L6h&#7fKeMdD3*|iBPwVCU+uh#3*
ziS@|?_2sn<X{!y{c}=OGnns74KW#R@CAZ`rw`3HzW>&P$G_;d8+6zj*W{-XSQqh^a
z(OG)Zl~>iBH{D&o&{Ougw{W=k!)9+qN8eaYf5}{b(^h|V!(jR0VCBM4TmQGoop1Hc
z!=KtlzI2VO4UYU+8R^&^Y3>?p7#Ld`9h==6>pUE5{%@>dZ=$1jvgP+=`}S1-{#4K4
zOvmq;F4B*l*&p-!KL*F<wtmkIjQ;FD{53K@|LtgDY;ut_vvjb&G%>q8wzjhRXJuk>
zb(_4pdb~P&wmSWDZTf`#b7g&Rd;RCx`rP8i+{wnme_Knd+Y9TvEC211Hz;d=DQnyN
z8-Mn<_6~Orj`z-v_mBTOI{WYV{QN@401)TEUutgMN@9B?f?3R_w=%aQ1|^`Mt^4VH
zR|1F3;~%}B@_Lfdn(^FvRr!6XBE}zV`l<>BGNc^)v-PSAhq4rWHh%O~7Y)C=7;odz
z|6Dwhr<*GFp#O8p_aaQ5{#*SoAI3{9svpnwe<_`;u<MBDxl>a%UG4V$!-IjE^4VI?
zrT({fYCq031|Dq84b)crYQ=(Sc@63+7dm2@#cc=cJ}vbS1n%S*)K{$xWXe4GIapu4
zHcZq^;Jw@MdHs8_ajET4!<Ws;O2>hmyNwqmz0POz=TKwq?yt5;+ROKv>h_j;Q^g;C
zYpOq3Bjw$BcdxnOXmhIi$**tCjVHVF9SP@`@3%DlcR>DL`f#|V`Oit?$bWC{x3>KK
zbGWeiYq-^^gb{#=%wr)my|=>=!o_GUHx}}IB+y+wAH`y(fMP?rC=jFA{K>h`IY6fo
zD8Y1HepX=`#z>T``{_c0R3ZC&JeN1eQj$Wjya4@`LUJC;1TyUqrO5VZ*-!bHxcpLe
ze%=Ww+e9HI>6krQ@s_#1;KZoVRO!rUVTaRZFt&ZP`nqdKS0Kvd{rYNFUC<{NyvS$j
zwYPx{>3110$8lc~;%c1eH1R~N#=Ed@?IihMX%OTM4rlPtP5u$^-8@+N(j8H98q07&
z5MJzqhQ|DSg4)AGRE*m67&_|qAK*N5NOupI8rD)sluFdCNW?^``yfO*%lMyO2eDC)
z$n*&3$t4t`ifBIHL(2Vj0AB?3MKLhL7e9zsw6HDHVr>Wcgy;o06C^ae9TvA5&1T{Z
z%LGu?7*QV%P>I^<;Mbn2S`E!UsW^^^7h-8`)qUKVm<9%+otrlO@-GG%%WqLkR0gEd
zrj#)sKbVyDtNs1g*jN6KxP;&eC2OEsez&N=g}VRg6ZjT>FAdPj&POr`6*xJ@ULNb^
zu2%aa@#B-)7=}smYtjdC%yscAqmQoFUze`BHI1o~xCt83j1#LE{3PDwb`TRMwkh>F
zPT-r$?TQ|dG@qR)h?<Yc{!ihY-%d`8gA2|2Z%j$!76mxHf)(fxD8LS~rIljcmYV|>
z62Khwb5x7l3~N*~Dwqm^c{|<f;4n?Q&%|V`{7p^JY5c9UL`?my;NivOu`lpb(9P#j
zJHz2E@-s<Te17>^h*LVRq6RJ*0~VqmdO(uE3LpHU`GXO-%}72w(f9=zEymu$Es^f-
zM$f)EMfeaM16JB62#KErRL;HDhYoX+PUe{}Z-=rbTe9#4O<CiPfiKBUKru^)TM8LA
zN(8z9zYof0*SE~T;ewvHA03uR{6Z}U9mT(XcJ9-edNkwnJPb)qXMUB0^aYBYga3^0
zY0pFTeIEy@88EP(L((7-pOYd$8s?f8AhY?q!{Pthdc;qq6!+t<dhP`Ox=9zK0DKv;
zh@$=R-`NPi3#Wq~sh9QWY_BLqFC`w>w<B|{GF&nG8s2Thf7#m%<#uZCEfA{%yR_2A
zxYhCEAFT~PB%)*{solFF_06r~ZpFDTPXYy`a=!telX?2ZV~KRhKS7^C)a(4_*C>%{
zcoAZ?WK<lOdIDjqHo$%Z%p(o3tn~&cA12v39nK4~e<3H|PsDl#TMN9-G;L=b<TuZW
z6u#=msWa2HV_H>KAo<s&dgd;{-%G(-4!Ds(r{9am4Z28XrHKDU5}y4-8w;BE>I<{<
zzZCGykmsa6M+a_6r2&%3Z!S3AYA@{ky-+0Do0cdG8c0Y*@RY=HN-QI{TeiUbiW;b>
z(T>YIbNq~9!P6`%%r4Dxns{HuyGy=<aqzuOg5&k<W26B<zJxl8xqUKH%8DKG`1Sb`
zeH-5Jp_8XmXR70EQE5XuK3X0T6i7AEj~I6LD955rM5UK(5Z)UX9G!;Q#>^)#rN|Q9
zpu_U`&k-s1_tlbZbPlu$O+p|y=*%GOCeT?vdZZbO=U}>dRwIV<9J|ar_x_JYutB(*
zrWcjBt2)(~(E4A$bQ~0Q)5KonW^W1X?^LN)G}nwqxt;efZg%WcLo(fO8nt+)rw_eI
z4CCh$=!{pFVD-W=rX5|lSAkD3NK$38O|G5yn9LKaj7=V23_s)C#a>KviNRp7-I;z}
z2N%z#4zT7L{y`Yh>de!&iuPANU@doGa8<yaxjrapqoTP$e-ASXnunemBVAZ+fus|Y
z*IHC;$Kwwk+KX}4-&U_|S!Xa^9&LQvPt1NnEf>ym+6bENe21Bb(wkOR94ucF$~TGR
zTlN1E>nubwQQS~{{iJJh56t|S6v^MYU_z{ZcS~wSLnv20fFl=PfLN?f4h12f432lv
zSDEsg*P-{+IMt)v3Bux#%eT@zSl+3i#MnFg1(){Kw>~pSIns5zP2A(A(LxJ%MxHYn
zP`=7Hw69XJ;yjds$`13FjdPr&hOi%BO29j#mY*)tnoz!SgyLQ(I9*k%_}wQQ)g~i0
z|DW*Qyctpct$-N~f_77_V+mpsWr=Yd3vd=GG9P+e5Xhw_9or*98x>)hudi0%{^esp
zdD^wk`N`HA+yZZBjFDSv`iIpoRT<l<_R6sggD+}6CogV+)I(;bzWLu@luq;r`7_(0
z@V=(!?v8iXpC9CVwGER)JN}KcmVY_CwT}6oMe6=HcS<k9l^&WRQl7x?rLe21mu~o(
zxb%}Nu2yTK+&EbI3{6uM+i^K(H(p1pHcRcTw#(jb94QMeP)xBMejndusQ!cVToj~^
zyq?$~>|~>szJ%?x!3gOumxJEdcLjK)c}yiST+N8Rwu;3|duOBj(82r1_OTkq8>}7k
zdslu-!xQ-K`c13F3~N)6H;7c1J2Jakke{^650@|nQ%hfDzw$?wVfdsjBb4OqzjL`S
zI>Ee{v{r3T8U?b~uvhfIOTLe1w*xWjt2C(jug2c@^`tkTK$%%&V^}N8yjw0lyF6L^
zBJjCF;q-RylS#CpPuB-oO4m*O+(txv1Hx4XVr#n2@HmkQY9PYJN)Jiqsw>^55J5C7
zTgj?3-!50(Us<dlBW5x{3YB=kwwoJ*p`M}*eda4SAJ0RttB#^c3=-$ew%8ZuV`^<o
z{rI038tw7yG8UvBGucd84kWhIat;5v!ku**&W;OyvchmpN_<-CrjMG!9QFZTN*l!J
zeRdsGoOi>GfD~SKuv(A@BB0jMs?v4{X{n2R-m4!qwZC`B>_uIbOH+C3iV(rj_(#%D
zMS`nQ5$zH3Dw@=ii=oIVNli$QfagsG4A?(U`370(FoGIaeGNS++0GAf^YqtH3x4Mq
zh*^AYCc?bjCDzaZkv?(!Mbtxf`Tg_MXE=IxbX`xCS$8{<VZaDQi}2<*_sqgNWfG9R
z4mhh3x=<27IYM>KSa}Gg^50j@rQ51j0TH5_=5^oI|59kY&Pn`)DvgL(8C#0Qn6dIj
z5tL#TZ)FlEUss&F9;d=0-n)PKtT4_X5Wl1WeW7-TxP}Oh6g5{!5KB?0rqGOllr7D`
zZ;h_Nao`UWq%c|iTo{str8n(`>_kw*NAVXexPK_HR<$3ec8q_owha|h6{Q%g$?&{b
zqYo1t+6K=e(cS8m)#|w7ToC*8%9Y#lpp;mNMco(lof2}d;<6B7J+hYdqjdkIlCx0a
zufB^HA;Q`<7&1E{OTBQpC@}47=g%A|!s^1dp5lLi5J-ChsMu$*!;(SvPW1teNG0e6
zNu5Li1wuu?DWDV%Kq40uRTMZ>%Da&nj`B$gJP&03ivo+=AwtH~r;NdSUqIfS@OKo@
zAQM=FTIjD-6!Lup4~x)6MJx8PX~C*$$EE#4iDVJPPp2e<tFH?X_3vpgh>*ZqL1|Pa
zV*k_#^BM7W#^NdL;8)C1Ef-MiHczJd3_iYRCiAqXs0VK&V11PgZgD83D*<UnH1AX0
zVV|@fUkpUZice_@%StK#k+L^X6AiFbYFwlZkKjwl_wFzj@$Zn}c$x7=PqdoEuX&md
zqGA})w1Gyae=(+c-DiH-o$g_Yf~{jeA6(gRv^Qb`S9fIeS~4|{3I%GWkuX=MgcxNp
z5CarAqnrKmNeZ(mic#k}@)e3Mh5$Mrd8;cRAKvpeSdY;mJ+p5*hmQ&g3ScCo6Jl_x
zugN*5(;QptoaL`_{`>D8z(oWp5g}GY*o*{tRGpd?O`3Nv9aVbAk6vR|=G0QE%8R2i
z@~=sGdubsP{yP_yLR|5DQnf?}+J~;7RDnf0HYHFfhMvWWUXB%=iJ^z_bN$g~EFkeu
z>M_cCz6(pqyD~z@OY?q!3cW(e*Kf!-n90BQJ0J5VKXab`>3^IY8R1Mgu&NTH)?;?_
zV5St;{7GECp;e(vaG@TT0@oYPn``gY*%__G0z$DcEn|hWd8n6^cpUnM34olgq;A1N
z*S;f7V?@KbiXAU_&e$Tqb20X(G`>ta)Fx6ma-~1dfmEuJ_;uez>n{v1u+Z`={w-?$
z4sW>Kf<F}Z=Xci@W=aRLF%~JAg7H$cB5Kc6FZ`k;a6=?mutb(P4X*H1Kb)skAbPcO
zmGzMr#!6_lDrJ2ZK3rs2X{jL_NFoYS$`mXpQnq}&L9(X{@?jZTXH}N(s=Q?Up<A8$
zniYK;>0=uqf0}?S3I6bH{^S0e{O*A4H&o#j`Vvd~)XH4`YyHtsE!7r+5$y_tg=e;w
zT^V&_Wd{~iy9oUz#(pLie$wOIQt1yf^nT%adv9Dme(}>HTcMJc`BhziW(yqoF}Ln-
z3oTT&-fyUgQic9`12skoF5L)HD9sOTv&%?{28|$D^-!dFKNtUpo$qNhENPe>5w&@x
zQ0Hqeub^0-Sai=wvJ5!lO+R_@eV(q2mR^%pQ%3b+`Eq<-OQRm7M%DN+OKuWw-5Zeh
z3yhJp=Dwy3GT^F^E6qPLD%2xY-`SuyX#0?ApHN4pZTER5tHw}332W7rz>JHKF>0F8
zGS%QxrMxfJ-zyV(>RU)M&zHVD!`0Onr+}#xs11vBGwl^S8ss9K3~y_D93tf()dnbY
z2bJc}s#WI_@@J)BZCL0-$}KmkCLg;dy*D&jmB_YvgElqf3W4S!0pe4ckDJYxv9ice
zPZ1IL1U?@Lv2pYXs!i_bkWnDfovI1j>Zrc4{$krzDWax8*@RXQ%X$`r{1%#(qEjHb
z4Tw)M>If%SxD)6s&zM=nZCb4M3w3QmQoT5LV`+YgRFIxNa#Wz)$L_r>0l~9HCyuRf
zBhqYMf%wIOUQjOlu=&%o`6J&8!f^%3dZ_tJS;B|NlvR{X%{#_Vrl%wZr9#&0D$l@s
z8MxQi%ZzHk>O!3~&ZgQZDem@$+^;JX3j-@Z_E5|U0rAl8eFcX8I_xWdc7AwPzBq`+
zVCJg<O<btgGY<ol(Xqkr52*QB1|}o$A1ONSStjLps4VK8)?PQ5ub0=i{L-iFYou(p
z^KOX9Jp7*?s)eMXFVZ!gl5f_OZ(&2vk)3ZN(Je63B|^xz)#)A$X%C$jnr-_Uk(FOD
zPfwQW^WQ^e#esei5RP`HUqS~yZy_3fAe#)XHT$BHT$JYs$S7kPHx&GEo#`*pT!(L<
z&V68{Y=GtaKr0=(y@`<`%6M2=kS4*yT$ca3sn7aH7oQ5PI6yOtxkj{8*82^5Xn-V9
zKF(HxN{Ib;X2j>-vj-V4R?N53t5f^@VE?Pac)q32)86sRhIb)5zkMGxD|JtA1Mz@P
zq$Dk0Ll)*n$bXJC@1Yfv#z3aT>+-<^0XT*tGAijeismW1$X!P9W|G^>+T?Q((uL-0
zNmIVuQ2uP?_Z0$CQF54cQMau}!#>gTxN_-Aes_z`ADb7v=lz}UN38(O_=yeul;fyD
z^Y~ypgkQDd=G}4q-!z|3*!MMAxi?UT+{~^ISl3=p*dV#vnb8$??{ib>1(iS&!SC1A
za@VEufC%b!G+LHG?{imBY%jnwj0HN!sG-DYSIejzjE{{YIYIIjN2Vn9ruZ1K&=D~a
zw58Y3rDiZ18JtJU#TN`imulob6-8HTPJw-MVTN-2>ZuS$PlLTtp1lI*+$5gddKlFY
zj08*55L3(Cw75A+Tycgvg1+_*-IMYTs17RODa)N9#^m3H^y&;1=U6b=)AL_t5uQ}!
zA78XbQyifr3nzQO`Qt*~o|_Nzj8cMEDbU%@LmRz|H&vOZo0(=+8GUs8KVTFM)_k{A
z9e1LkRHCS%?H_+X>Dacx2eMK2^8Qbv25;5O->NZxaN=j;>Zj!V%N8z|L-XMwRXNiq
zYE^8A0qQ~12ExiQv+hG_Pq4a~DGiBOQK`RFuS6@cvp6SJ)+L78L(OopG05NSe2}}y
zh-*h)cl-qey(|(*Tnp@Q6#M&k9@TPr3DU9hIM@p)llU&*75s{LCAcp&D9%dheXZ`I
zewo2@=BGo9XZnntk|+hcN_*wX>Pi`=s!AuPs^EJP)$?mF&iyhk6?kP;UZtZa(<qa!
z8m@_ZeL6UC%94Vapx3`ls@qH!fqP|_4#NMTuo_tCBUc%lpDUD4)Z(t;r$wl=$|`pg
z@uc@3L1g_9R@~YV-VlOol!1S8K!|QKzbR+bur|}WgUYgd*ilY49(ZZ^XD$1ZmO^Gm
z^i>o_9A%WXW>LDmCJTR#Y0aNy>d9fU6R!a;ApW%7gR3K>WNw-et(lC(LuAGKP_KOE
zKU-ICl<n}^lJ3|d@bJAh5h=Pgr5EmL;WrdxW`3@YbJPyetKanc!DZhNAEE%k!7SS5
zylX*hoZAe3^>D47J(B2O3dj{)I()JDWnD*C82>uou}}polhk%(?Ds_N8_pscHtBl}
zn0F;^Bm3(d;SPztQ|h*B3`1M<@Bi*@8$xWc^nH0LEwL!rLvg9zbPF{olSWdbk8;aT
z$}3~=mrdsLX2!DtZA2|KZ#bVyed%#kOHHKH(I1*Qir^oKhh&YDZE=(Z>I5&_3K~I+
zP;>)!f9bttItxijSEV)a%%NPxN(hRI{0AcNzZAzt8s>Xn^Hlc1f|lV&zZc{?N>W-=
zQLyu50TS2~Z-F}i`H(2l<1cfCVoJZZNmCBZ4WG%XpgdYpTKLSb=e^a|sE%+{-#fPF
z)R_^AdIlthf2Syu_ZgCRe{b<Ui+YsFbgu4mYIjB_JtwKYjyCM!W;zR1|0jv-jpr6J
zjQIO)KYLP$eeD}#M<T2%bnxEd)eysTDJm3c^;E!uG_M{-&3e^oinO2^%P4d&-(qA@
zE0I&yV|i+1Nr%9v^+M2cbXhM=RCMv+)yq-wSJKY>PKw|8Ze}U^?JQ4!U%O9KkER#0
z8WZXBvoKmznMt!ZDl#m%S70^1VOnPS#bae=eAB$rzUzgM^~9FtXPpsgy%7JW)^%Ph
z-wLcJcOInv!7pro$k=_@hJ!K)+nl=I?J#D%;__o^&#~7>XN<Du*15u1v1rfR?oYoK
zNK#;M`a1oql<`3>*WDzpYJqTBDdU>+L`xahVWQT<)rJPQC*LZa9~KV%C%5_|Q`7Oq
zk01Z}knOHzEOl_E%6!x64_nw8JX*Q767PAnNBMW>K&HZhsC?*kzs)J>Cu=XJl@AUW
zzgIlFb?N5nX4UM+#@&4xiW-DD?NNg_moG&fA&^E<Kd1>#_`)bW=6P`pAKdu*>-w^1
zCsNgfa+}52WRDM~=bQ3%tZtvSgZ+swsk79DZbbW%m(89II&!cA&lMOtqEpHy@IgyJ
z=k`l6p%{m%J|;(&ef`{3H|jfA!{5K`<e%EOE1H){+POpD!F?biGh$#ocy(#8B#p5W
zqjgWk`F)hCyzExhefoNcZ-)x4DK+nTKb`64d{Ow^)fXSt1jSxZxT7hwx{^^o7iqJ8
zsP9^u$VY595M20|l7H9nOuo1MSXCKSC5QFPeQmCrS-#8eHxu<bGMO}w4C_UiolFbX
zL}a!VA?&jr6pyImUWw`F5|h%+%8HTwR%!))$FmXoK~zc4&lqEgeod4jxaaIqjJ15T
zUw^H&b2H;?DS3PRCv3%!{f7r>Du(zxjsM`6%R{P_SLQ0O7zWm}Q;zKU1ahVxMrCzT
z(Q+S)j-w3p`%bN=TL^W-*B(#7x!m~Ye2dMA(?zgUDnH?sSJo4U#hI=j>xZ*UU4oq6
zGtR(k-oH(XVOl)RH)<YO{4d`8{JnqP^w7rp<M@r-vYoX4iyolTqpE=yv|Rf7OYTo=
zX8r#>ty^+YZb}V`vhrv;m<V~+^5^)^v%ze+eUCO;`7_T>=C$2NU6(Q%@d}Hi>8%oY
zx0`!^yTgpvw<X?P*NfNyt?h4j<p27%BoOms@ee~+X!V2D!u)5Rv>NzLJPB3xpH;5F
zy&P;5)2eZo`e2_PL77fK-^4Q5in)!g=J`GUFS-HNE*tfGaHH|$UkG)5<D1Ukb@21h
zLsi!EP2|A+aEz-|UjuCLT@Ovn;<XQ#x%^)T{QOs#CLFNqlP1%h`ufJ)M-Rwh4i#st
zu<PJ691mz1+`6VlD<>M!`P%M0N~)uU?y;vz9EfO~z8bBt%n;t!0ih{bNVX4bryaO+
zTaHd0>gMZ6?{f-MC-2d46Tv)x=OYE=aM0yFoXJ?5MyY-;b0Mo}6!zsq#WO$&ZttKh
zOZ>^Q{UymHa6}hI#~|D=MKrHmqtzl4IjEr8@-wlCD^iY8qjfxT-6{Go?)LK>5#|6D
zr^~8s5!ZsTD&b|M%YPB6SL2ECfkZpzEH&JiXC+8SN}ctP0;PYcPPlsrKn?6P<WI4n
zYote)1&E-OOmx+)RVNw5*iy!FWV6J*ZqBD=1zA;$@wOAXH*Yn*z8d+c<RR~Otqv7S
z=_hS>oV^jUvY9p#hUZ4~A}UU7*U$)NR7tNrk!WL!>0+dgh<0260$X|?GTzif{bP+{
zaL}Mq(Z<q?g+?$v|6Hh_ncnPn^#EITN#q7tOh=g8S99;l%pC9m!>cHei+Y99ywU-W
zF*?-xvEX`3XOUinBbS?A`gY00(a@QF1Pvr8pAWW}ta!?o@}GFDGA+~nb4DlVrW)>6
zB>`#RJC-LL*Maz4Y{+gOk+8AAZ}fIUYNts<bv5L%=~K?}602958+~IKovP$}#Z)wH
zp1l&DSO!feJUaeR3rVr(G*#;;KP9djFgO@T5FMc_Gdc&p{l@P=rp2~Aaqe^<##4Dr
zOTF_ym|6!+op)&?B2&WLon)hUn3&82?L^>~mm(OZbE%NuI;dzoD|`3saMV)j9SDpR
z{>x}ufr!PrqGM%*<!O76I9BI=cs#X%8=DZN%H8WJL}y8OQmfb0!)I5>CZ!Hc$7HXs
zF~7j@f410er;Z=r=mYX`RNXhB-N=`gwuf@$rghn?-Ct=_OnoB+Iyy9vw!dx55;K}v
zlDd$=()@99ZnR+D=*VE{c}ar~!`DDWim>$jO^!z_jAlFhYzuUpP7bYIe%GE~@`gY0
z&A&WN`506B{ufe*nUfj7g8%*Dr!hbSNDqv#FhB)#zSnanQX<_@Sa%8n!Hj7GC;EZ~
zLe4i}O1zB8+tF00v`83$X=5`g8>i1w;QP~Cn0_9yD1NekiOCI%*Sj(8eFNJ~&!zPu
z3*t;ITBmnIw<?LSRpJ2<doD#(ml56DTnvI3?VmqRZ+0iR(k+rgsbq4Oia}IFevQ{t
z8kcQtUcgWI66uX(qGkr2;IffD>T*(-rm*qPZWIqAHM#|b?N_}IK@%%(evvJoVkM`(
z_V{`DeXvxGqn=Y_b4U9r7LLS7>dvUwpum?1duW^L+%{zYL5}R_4R46!%!*o9xK8e-
zUZwiCl{&wVs&g?2EKtuQ(pJDzj?ug}b2*(-*0ecF4!AEptaHKYzIq{kasa^j+-Y|!
zI|`t^5&8Xz2dU_CCrqr?;+qc82I2+)-pF}?2B1QCVCbc})c|Tw5<dWJ(i@;>X;5uc
zASp6zWLo_bfPHld0-}cep_0FlROyJ0CL-v?8*U`#(5nEbEffsIs)1p)FE054028_H
z3(pul$>+xsCIA~LNR05-#X^`a3}w8iWxL8BD^kNzRFFyl@SSh^jsiLkc!mP6anT6X
z1lUl*0%-4nfLRYz{!p1?JOdXKClC^;^cNi?-^&I7AyPowt^qK=^jRAgd5Hp`f%erE
z1yCQ)G8TEGm_3-j5nQ;JM18wW{dxcf&PLd9u~V61y?m~9ZR6+fa}X7fnyErvHA2T9
z(6N6eSAz|rk01^IR?mSqlk0c<DpPsDZ*K){KD-=abr}Gw|2w!nppK&j{t<&tycNet
z0gY!5{z6z<DtOWWCbd`)(vt*btMt6@BSQrSMrJ`T#Nn)HfV#Z~CfW>_Za9CBJ0EC9
za#R*%H7kk7$T5RQWq?1CsGO`Cj)CS2>@z^bNdkcLopz8l03uR7@F6^oY<jU-HzW>s
zZ^V6kLa2DsjFxHFBC63su->}rGLCJRP}u)EltXd1@D|ago*E5=R-xOM^TcalBPs~>
zW|$YA4FLdADpYAzb(?^UdnNsRE5cswd{jpDD7f7n4Ge;@)KVSv0L~+}p02YUc8Z7A
zwIk}QVd|=H9KrAfg`9&gg9(*(*c$*qWt7$ax{*r12{$s(&La_n=xymPtr;xUl<CxD
z^6a1maD7Hp@?~GG99k7{G5_|cWjRDe(`dy^x^^GQ*o6=-mL{Sd0J{;MR$>i8Rpc&d
z#)j0ubL%)l3G{7PgqPZ7aR7}1paU=<5Ja7;3hz@v0a!Z{N<F_`pt8HWy6F<O&L&?0
zGXRUfq&jyg#U&Jl#$aL6iudy6RI9b!Ls6`!UEcHBt1q$im0h+DT32x~{KZtbb?Q)Z
zmF1!GLq1(;CTzD4;hg2L!gjvxrb4@2AP8pHa>JO)T1^`X!D>}Tqo3d*byzzDo=O~U
zErO-yfI3+~oWUS4hn}W;TlSgu_-1`PgbLgn<xY-_&%fZ)Lj&>vKv&h%9c#-0rM3W~
znf2u=p(WMPkEF2FYSCJ5*z7C_no=|1Lx6MKs`!D*9_!=hZjtnC43UW8WYK?rqu*Pq
zUcfFAj0Wn#g%*w4abp6J%P$q`nBM`gJAt}ZiM?%fe0kM10w@JQ7i+?N6F_6xDsL5m
z0ay3BoRA*FsX=&Uy+I&0hZ&&JgmITDz;hKQd<g~C-5wT7fC5(J2`Xo^Ud5e|G}tu<
z#-0Opfb$c4I2a2eRvMs`3jb6XSPYej*Jz=zIRZ*Z!=ao%t&iHIL3WY6+1Ptd&C^?o
zvx4#^%ved0TlG=E<P!sVE&~Z_{)k?@he&K-ThwEvIQ2kSSCsB?q5u;LD}dJPGgjbC
zgi3r)u|<>M>ac((1Uo?X(rdi)#rq4SxG0dk-SE_=s_)X&O~@p89F%ID01qSBp0*)V
zFbHZG%L51v8jIY%PwRc3&r-;A4=N~zkg#AIP^T6lkNmxzV3lU5@?D)3QrR6*Y>^3J
zCAS3l;F*C7kLpeSFf<qIOD<GIvk3I|KAevdqmX$&trD+{FskDi6+2=%H^E?#_E+;k
z5g>pnGo<#ZTO{nRvG~)k;R~Zqdoj_s<L<?3$lRs9(e?e%@|vcf!0o#xum&TEb(k0h
z<SPXU6oKmKLS6xpYFs9K&Ia1!dB7hNX&O^QA+$~svt}ms`l5-((U?(r&P@v}%mRD%
z1a+~USbk9gJyx=5HfGPgLp#&T_!K2a7>5??3ao<>1kHLC5Dl@xW(&$n0Cwr{Hv=Q+
zog=TbVeT4Wkyw)XHlwPkft9X-nQDRta+1qF5~KhWZnlC&0ARlDs=?^4Ar^wdW^<=N
zC_V5X;NUY6Dg`_Y1A#rwX^1cBQP`9ODQ-<AK=+ol=j1t*1gJLFb#FpJC;;V$N;;^2
zYck2DIKDasN6#TrC8<%$=DvQWDX(6U(^Oru&Ea0(PdKMIk_cdmIlM#`CuD(~?v0Xt
zDXa=)W<~iw_^uaQ>5-4MBSslFDtynn4klZ`|HEHGU#zdujB(V<=tTEoD!u(!g}Mp?
z86M+gS*2^P`4%>7jD=xv?nI^QS&*Z%Yffk?xEp{d9?y(MmE=u&Ta2{};h-2SG`30-
z3&;UfP%Pj~3!}pTP@vCl3g}M)j4vVp5&+?jY1AAR<_RDWB-^QJTipj`(EuVA`$&Ka
zf&C(Y#Uer?V7frjTa+9Ypxy$`<uKT@ELe{z7K!e=g2lo}ljreJ{wG)ht5t6T&>sdo
zcuKI4!oF*4nDj*z=Hm_;6sSm2xusUC1vYSwW^W(@z;t}{d+D|EQc)rOh3<5U?u{?9
zv^8DEY_oNdbN$1Rd;NEm-!Uu5p3S~ywJ|DJeP;~Rio=-zJDf7sT@9AIX-?JFZL5pz
zbE>DFSKROgKvFWKa%o)0&%#6ikHoUPh^C#gpu#G~r%t<1Svp~GfE0jqd5CyjRmH3T
zLQf^gEI=`p;Q~O4z|<xy0G+bPjQk0k?oV;7w|Yf@x7;=JX@p~H_*t+Z6i$X}p^zK8
zE@%NoU?CQZ=Z7IE=+w-y-!HAWUl9s#xP@YkP?F0*(e{{<`%`dUrt+<sT*-x{XB5W>
z40PnWK|HbcC5frLSCZWS>xQ$P<`&+7@=H)fooWgw%*H<AfPzKrs0fx&wjb1%03alf
z46z%^!iRP#iFVxpo!(;e(YGdp8F+7BfYcc$Rsamn0~J{a0nw4H=-RN0Lh>y5diOTl
z&ZR+HyVV;Z3+@t)1xxx=^YyS^{IfP`E;2amsd|Kva^;=&Y;pLNe>z)T)}CP~_QShB
zCG44|?lKW3!BV&3ZML&p3pE2j@8Jm^`QPM@XHNX+E%Oly!iZ}kg7-n+c>|$0=E0d(
zxbqloa3}{A_bEiU&Ez2klwU$l_~sT)0dtE)D@uvR1ChbB)JmV2%Lt|Xx~4-B%VKi?
zs~PrECceCErj~h$mS~SWTMnjkZY!7$PD1HkQe?%{!Tt5wLO^xO7PWu6-o7PSUxmYa
zR~V0%!EPu!|Ngg0C~AU>byB0Zg`<gXdpdJ{72R!+`{)4+P?aYg8v?L7w%}ABgw0tB
ztqz%+RqPeaA=f9BU)kV{>tUZ}>Cjloy0ztTbJz~FNCtb5gj(1f#O4qxUeVfRevDTj
zn_iDHvIA*OCGyTNXIhnbkfP)N<=+hy)g+S{?Y0#y3eu+`sX4LUy%8v8>hs&v@mv-$
zI{woG!p%Y->s<Y@b|~y?7J#O0q2nrmVOxPw|9CTZ12G)|L)Aep+HNj4;Rx(ayZYe}
zES%8%7CQ357AX5^?gPUL<|$OHTJo}NT6FxBL;<$>3e^I;aKtoxK~c_aRId#<gBkeH
z18}Joo9xH6KES`7L7zg|B;y5KHVP)J;?`j+`3=U1Sq$;NJ6k&Q2t$=(?16YRD$47D
z=yR{LfC}hZ$0?BgIB<7GqK!E4_VdEw^WfN<Zd>t;v%;~H!m;r%p&PyUoDYe!-B0J(
zsEwpqO{5XG<>CWlai{qZ3nNyu{{&vAkGLpU<%Zl@HuI1!#GZo{u#enexd}VDY(KRA
z;@{HU1#RtwO90?ZeBD*W(wprV=9aU(x}z8B&kB1i2=|Jd?2H6Rl{w!Jl!w#@ARr8O
zZY$akuawB_33@h@6>__%x(Y5lwOmm7thdYOThw_!zV-&-Aqi)5th1dOs(QY_F$hy{
z`x!zHs~w2KJ%I2;9{B#71Sro~!>@wZ%h<26N2dRps$&j4#Sf{)SaMM5?(OlP#Gp@N
z_|ClqD##ujct#6v;a}UyXf|IdHYYxWjzW1M1u8rh<A;e3vjbf*Vsi<4e|2}*7J-FM
z0l9+Mn}n@p+nv6GDyDy}jZRZ=-6d~A1OHMjg!jiefB{6973Bi$ps_%$fRgSNEN$iw
zkd!M34Zt&jA4e{IJBnp&0Q@1u$+HoL#^%VlbNgWFrLb=W8==@AT&d=f*Wlbw02CIW
zLizt_I$RK-Xn87A6M?X#Xkl5P?x5b*4jeYV490XM-Dn)k(nbI{_PGse&O?VgUulU{
zg{=pcP%4gIK(yI4`*{s63{(xKqN_acnq4!!?7{Yo){X=6r1)KICYU7<XGT5C6^nCx
zRL-k=Dbwiq@vkTYy;62^OixVOMjO>lvRFdzQ?Ffw7azNi^lb30cn@N^*+S%ueum$I
z_kzcg3qk=e3osFt5tU7}9MJ$7du}jg30446ApmH?y{#j2)TupHr2~RfrnWQ~eyk|a
zqTZbN*UA}8oBsDe1`Bd)p!lh5@%-lR{MkRZ=^YC-o-mhr;!%4r1V>}T1~JqkK>mOO
zHI*k-(Yj$KB>l-$J5mAMh7E<r+OA+ZQ0RGp;Jxx2A!VngUav(<!=Xab;p<LZK?9kD
zy9?<N07THj<V6Gy5a2^cqV2f4p`hP4M5Zuw-4@g!!7=i|6%tV+hDq}Ap~&ca0qxT#
z8;7D}#YRO&<&TfVCd#a`ex}qMJ#H#GZ87U|op{Ht<CK>^;PCY6gooR)swC*-s%_Dq
zOs9iMhJ;&fL2%})?&qgcKMVBOWjwY{rI)>@9ddt*+^}};{uY0><?@7O&|44y9<3f&
zOW?Skc2(JY%-G2N?m*={$HDo5l;Ak>jf3{}{lWHFIn8lvw`)*<i9mcS`Tf1&FDY2o
zVKIE<QFqa`PCKA2x_7ZB_1Z08(Z$1!@y3Cwn_)Fv22lu3<+^R_BZbQOshI9x;@8~w
zbAsLMG@v)}ZH@@x0@Nuwijk=}Gl<nHkPn~yG*#a)k0*sMmd_z}5c(@jWDK96NFpKm
z8%`a9$a)F_N%#D!^pk@8z{B>ZjCILYifj}2jq!*e!Iye+T6~FjmHu0H&Sm)mg|Mp!
z38i!1t&Ww{bUqhwHcEB+`XJreK{W5>`hwlND9fl<E-!C>RlM@nZ>F9%)n%i;DDaz9
z`xPRNex-;Q4T@iV8<2|wafNA}4x-~$V}Hp#(|=P~kny;o<W>;ZZ_(o1cqOrtg6>|H
zqKD1<zY+sfQXfY>MQS7j|5A8EzEWmu+96T-+v*ClK$C;mCkqcVi7GU2mP9q7`8tTX
z)kQWY@}I9JwGyOzDd+R9rA#biK=E4aWyV6yN%Ji7W7ER925U!d0lQI&X3j#3Yb_Te
zdDmJs_oP8WyJkX=8)4G8<OjRuqj7EP+hDr7W1Cll+$J1xeNz7eo<L#0O?{(QDPDN-
zia+b{fd)F+`qK;=e(?Xu$1G@2gN4af?b8pDQ0=3}Dm7oF3K~NE2P77~`h$)kOw55#
zH*?JKjZ^qw;zb<PWV4AcSOnQH)^|PoMZaA?_NCWhdkLo4VHY86)={B>110Nt;ZF|)
zX5miSi0#AXRQsS%3N#?Uf<setB+?8D$t0688a2olZ8j*p;)q=%P@y;z)mF6%6qy^b
zIp>_ad6geHlrqPEUSQ!14$1gK#T?nZf)72YtL|43Oz2XCD!!o5!z(e&UN`VyEj4f1
z#S2BK@yR2fe7?_)&~EU51@_)E;s#Hne7-ovtKRT@GeR7<lIxTqqHi+7J|mz*#V3>m
zd>1}obb@!@BS8P-kGkm_QVJ7BCSD4<{85D24Fd&4@<Q%j5Ed+e?0OEI%Cl<V4CYa=
zf)>1Bvuc302a>Nr?-|6aI0zwpP@)Dspi3!mu!*+~Z4QiTiX-^o6f{(>6s5oi3IdZ2
zOuP>+<)9x`8V5r(tYZY5uwlmhp$Z|qz)=Hi%7L1KJ6}W#EvgV97Ml{U8W0bIVq2CM
z`31%>mdbfm%$m-e0zLKE0}5HxR<`=_f{gVe1|v}2H^!0;^!cL{RPYB~RM8)QWTPKB
z#KI1H_#k|Ypc}&&!GCISMSL*reycN*0B7fm8sNhbBgkD95%@+C#v@)M_yQkZ;fz(X
zvX!oUB`p7ADa%>XvX-{IB`$NR%UuEk6TAE+FoP+~VG?tgy(}g&lc~&Q4igh!Sjri(
zM#ZS`3PKAT<$Ah-102Z5DU<-55^KOsOvZzoE8x)_UJ!#K;82H{z{HIHg#$nQCq6ZZ
z!GMGy&K@vLfGGH5KhA~)CcI*rXlWoeALzWLFtni#eJDgDD$$8jw4xThC`L1?(T#Gn
zqaOVzNJA>pk&?8eCOs)iEsD^r8T2V@Ob;07mQeNJBY*;2DfHr@vwhg~NI=X~KY-X2
z9^s=OHTd03vlx$8P=X1Hdn#0;D%Gh{wW?ON>I;^#f~#V6DKFqESi>sTu~roYWIZcd
zsmlM*ucq~>Ssj5{+bY+&S~ae8z3WxiO4qmA6|a7!Y8(`qD5`lO8(z>}JSYLRzU-rD
zt)pVq)RMHNHDzj%Z3;R@Mh(1J!+J@5&)U{C%2Lz-3pJR-XH)Ad=kb9tXS1Jb=~T)Q
zaPcu_j4h_N*hR+N7PsngYOv7Yg?;qkbUo-56R-dcRZv5Byo<pwVwbw6IJbAn*hdWv
zF$)y*bSr}ZhHnu=jhAMzAK4IUc+;CCXe@;@NO`R#9f*!-ZfdqQXf1D{DPQ_(%D(tr
zOmEd|n94nk8dR9Y3!1`&S$r>mzEEIb8u&ziJa~Zx9l<9^o5ZyY0=)wMFo;8ZDfa)4
zz`aF*uL$?CVOUXODgQmnYXw_36-%qdBY3e<Vk~09@C6f_$cDvOb=*BVIFwh+Bz29f
ziW=Ck6#ZPw9k#LKDO0)1Ns5OCi!i~Vpjd?X(4MqNY~m9yCBE1Da<|0%-ZESHE<OJ7
zf!AaRw5`ApbosK8rKm|GqXPv@LkD@U(g|9%xzL6_bYZYe+bsj-Y)mlo1J@y#Fl$hP
zWQHvVCG9R~RGQI3=`y0VLWQZp86Q1>BpL$7X%wuWprMrTKPmj`K7JJk&A1DsLapmv
z^Li@r2$rRN65w8ItJ1>?iWwnI?87L!2FC_UvX{M<pXSBGS&0W2q^<33Puc&zyDi7C
zu{d9Wc^lgL&EmM<RqmgJo7?Y#g0<Z(?|Ca#w-{-6idWn%{|fuuS)?(!w}@kK`<veG
z8iZF2uJDDE(%$&?GMF1?;}<^@VAw=6)+U~jip!Ycsage&JTCH)XS}@yAEl<V<~;X;
z`i&{a+R7Eua*}iETQt8p&QoP$Oy_(sV%8wfdk&YMvsvhx!iO7;uJok~=~*jHXu8v;
zXlN-L-TWmt&>zk8OT~2SUjMqg0baLK)*!WFmwFt^4)!})0=#Q~JKPVAao`0Si*p})
z-0MUOOXR)peh2Z(|4x;_3trmgP($GpulU6?zVUWSy5l1+`EEr$@|FLe{GruQ4$O1D
z^NBjU<3aEFDqDikIa<?9;Ssmdv)=9zkNn+RKV@L>Jx7ab6gJ^egc{66_Pz%m;Ts?P
z-+$O0+0N0bk{X926TkV+e?H^kog->BWgSS(MmHXagKVv16PQ3(HYi~^=#zg=mv8*}
z%a7YZ<cCHC%SJZhfJq7m&4KB&Rx&o$KvnDm3r|)*01AodG2Q?M;AerH?Xe9Z&0il0
z&GpoP5YQ17SPDG+kpW&Hjl^E#X&?s9lr%&Nl4Jt|mVyIv5E^_#&ESI<)LjR*;9v~j
z;=$mhq!GKgAXOk8lElLt6ah5Mf-iIf6?j3+IM62S$0qn78WjHl585CTHsQN`gW6ri
z-#B4ZfB_3a2qwgv17#r<HcUTs*I-=Xk?_=4kfD&IpJB{QUWj3Mp`oNep;oY=0fJB$
z*5Optzza+oVN9W6lwe-O2MP=bRrp~Xpq2pY+hL$V4CIj3fKyX6gQfI9)e#6JN=gCV
z3B@>7Q<MT0Yyw^E10_%a?m5C7z>`x@3>p}TBZy#O8DKo@9m5F87nUIy0*@Km;ib%i
z9ukHeUd0G#;a1FnAWp?EKE*B82nQNQJTT&2WC{~RoFvxBGfGM_+R1}C!Y7nn3SAcD
zP=hX16683=HD)8+)EOTn3;+TH7#KnAVMQet1|IGrR1p87A!1FgL<JxYBQD;FE<Ob(
zdLng^j#^~HC+LC~pw=oHLMxJ@Df&Y~wxSZD0U9tLRqVs}WCJ>k#VZWMfqcRyO5`l;
z!_r9PSP+fT*oQFsBS>202w-GUDNV$o0~%1lfQaNbkYrR)L$6>$Jm{o9@MJdh$|l4^
zP~s0!3MDkiBVLH$7|a1(EaOvrgF+q+{)l3>-~%7X1r~HtDLMr@6u~B-1CR88FDN8N
zZh|3D0?%LtD2gIR%1~2KLN>G|?tNug@<<<b;y$1QTB@aJVTDifWMCepQ5NM;8fH?a
zN)ZGM90~yzl)^bG5ehiMIyl8JpyOit1043iKt}%|09t|(gb-FtV;?G|Qxv0K)M9!7
z<6WrBRHWoSCQ3hUA`V=ZD!jlu0nT=TW!d$BIobs@gkw|qrXfUT=#0)^Mny6NOYMNn
z9IOBujEq0T0q;a7BjLa&FhL@$PV2l*;0z;mt_mM4XNeIMg{6g4-~h|;%5`Svc0$E+
zIpjLTCuP#-d|pv~;%8+V#y7kGANWEsLM3Lsz#QlfI?MvE@B!e&!w87Z3!p=ACJa6>
z0Se#%6O;>ao+C9t613F7|4l_VexpC&0LZ`t3UpEtcw-(>sD+lxHd@VwqCtm#=vCOK
zjq2x($|tO}q(3A>*`1aR9a%D9!3b2#WuE_LU-&58+)p=nCIH?6Yucq)5>i1PWI&>U
zT0A6Ug(B|x!)$&e8ieFUW@JCWq*u;lO^zfQu%=VcpkLg9+hxTtv`kqBj7-v`Q}B$>
z0Foor-*?8QY)+bELZ)3{r$0c0ZgLVn3<zfulG+{VaCT<;+>dKw1#0?3#aN3jFeuYd
z0v|Av>TCjP{Z9bFCa3y?r!EQJ7($R_!wNLTCT!&$;ZHqE3LmggfHGszG{p*_LnrcT
zHZUlqjs>JD7&LY!HI&^5d;=A1mQ|?2WbS7QIV5U9D`h$bY5K#UYN)a@tFwlf5QL@T
z_=80HMPE28CL~O;hATRZYcw_~2CDxiR7_}vUZ|I%0B<T0Zejx9WT;()Xg_^vct$6A
zHs^U>jd~*JEVQR~ZUrqs!RBO67Jz{oK&<9vMT^NO8YEc4R?~5k4qBYfbYZGK0_vQ6
zDUg-||1GOO=z?zQ;k!O6I>xLJIb?E5#ihcgKMX^H`2!z(DymfK5;f7E?rhKgtg1c*
zt5O#@%|Z__60F`VofLtCFw$5E=<2|e-k^gJ2u*EbZBrDhKV)mn8kj#MShHfqkQQlE
zI9m*4Uyl-LwPb6`GS?rW?YDy1E3jG#`2)h>;eYUfI91cmj=&4t+TN~!BlPC|z@f=z
zD}tKEfEX&G!cAvN=CwA(Y@YvWs&>k%w(6_mkF17jt(GA^#DhDiff|VBRZv2s#DG7b
zfUCkP7ECJs%*6=oPyZCH$<oP}maBP<s4Dbl*?sAfT8qp&Ma(jiBSBJAKtstwMGS1#
zSm-Q+9w_)g?d=|FQ&>#VUhgb`Pg6{<-xf)b7*Zj50VQZ}rC!P$#KDA)0FPj;LgE9F
zqJv_YmjQw8&Y~l^2FzHL?cJ`<X2F9apclF(%=sit0yjmfl`rsSgW2Nklyw*VkQX|j
zkpK3su{y<<rVrD&?D4{D+_J5g3I@+M1=4!1(gq3YXztSnt<-8oIY`-7Py!}o17M)Q
z3wvn~)T|>Akr5#g?{fcenuPBQfXv^%z<-p2;i>{t7;iK>?js%U@xq}z@j)B}4$Dpj
zC9FUU$dJyG>j?BfQ?c(B>k|&}Q{bS$gOafsSJ4-Tagi7<k(|%&!~+^{3N_f#Ce*<F
zFerf{?+7>o3cy1=^Z*JNkw5Tn72jHqZdKe&aScrH>hwkUj^9%VE;k8{Aqfp96K*m{
zvfu6=6I=4A(OV7FP7K_N5&v)b8ZQnE?^lg**){M9HwE~LuRoBleJrhC$ZkKVFZ<5$
zd*HAR$1eH~^ZGW@BSq3A_0t%?a-HA}n_h)kj0Jl7#R>%4K9E<u1yxx@#Wzz$KlCD<
z%;HpJ3rp6FPJRCcUS`FCRYj)suo^{0JeM!cp#zN?@hF>6E<1%2zW@|paoL5k&>%6$
z$Y>nLB^blyoV~yu!&MLHanNpYjv(_6;}1oLg*?%dqu!Gsy3iX_^C-o~eAI^nUyabM
z4HmqBCclRtWrZ(H&Lo<2-sSVWg2g!740)aNrT}%*L<KtIbnxuRQ@Cl*;e#u`N6n;>
zI!gsTG__GzwN+m=!#OTg#3NRBwO4=j!fEw9nkHD6wOOBaYVl=Su4QBO54vQc+WjNC
z7%y7awO!x!1I6f!&cQPp4TZe`Hfm#ST8-wCHC`V!VkfqyBx|QID>M*oHY8YPHs)hS
zW<V=8W@rDlX2S_8KT=pQC?h55k5Y@u7WQVJHfpE#gP<}sFabPaLbR~!xJIyPtF~?5
zHg1yzDrduEufPl3PvZ9N60?dz=eBVlH*(XnF-FBTC%1DyH*`n0bWb;RSGRRvH+E;Y
zc5gR#cei(cH+YA)c#k)Em$!MJH+rYHdapNox3_!0H+;vpe9t$1*SCG&H-6{0e(yJb
z_qTulH-HDYfDbr<7r22RID#j*f-g9OH@Jg8ID|*IgiknySGa{=IEH7qhHp5Bcesat
zIEaV1h>tjlm$-?aIEtsZimy0}x44VHIE=@*jL$fY*SL+}IF9GIj_){+_qdP$IFJXq
zkPrVkkr%m<A32gIxsoqAlQ+4OKRJ{~xs*>il~=iyUpba%xt4D^mv_0Be>s?kxtNbR
znU}elpE;VRxtgyzo42`}zd4-8xt!1Wlyie8TtY2W1D)@=@6E$JIK?G!ff5Y*pv!?N
zIEA0{xuQ2-F_3{0Sb-^2LmDW76Uad%m_j7H!Jrd@KSY8RD1jWn!lIA*-@SvND?u7m
zgQM>OF8G5y=(#@-!=w{JG@LpYz&fet`q~`=p__snD8U{y#U40;5^w<{xca2uIiX*I
zt~dMF@wyU_figrpH~7P^6S@+3f<IJ)6@&pdocgglySOVIEDZW3FhaKb!?a_2v^W0+
zy5qth47#>gg*SLZK0HOe-}_algE#0yQ^-RxD8oI}dtT%_zS}!i@VmdedcY67H{iv<
zzr(msd{)SVro%!SH~}$qI=c^gwHJdD9D*i9`=3{ZpwGKMsDsC2#U3cZ#(M*?D*-MH
zx>9S!$vcJ0D?zniMa#c@%+I_M)I3#qgB<*MEhqt}Q@qkwg**^KHE;nLG{rA;ycPU8
zHvl^<B)wI5f)a#*Q<y^6XN4#1fu5Ip8Wcl4?7<)81=o9hQ-HnOU&Yv$J*uO<+LOhg
z%Y(Y_!J#j`-$%ten8LTG!Jp5=sS|pz`vc7XK{Z7BRgA-+KfFIodf)%TC7Az$<lh4<
z5JNFsLNyQrEWATCwEP>u0zbfls7w9jXa44Qel?5(EGPq1K)w=4KIN-E<~N1rbH3+;
zzUY&_>7%|=D1#?>LN)M1Q{+Q2Xab%$#nET`IKaN_H$^lQe=#@(=+8qfT!Jhh|KIbu
zC``H%C_@@pf#iQXq0529`vWg1!5_#%p=*LwB)dPn!=Ot%Az(W%q&&8pLeB%lB_#uu
z+#A@>A0dKDc==Pe(9|y_fBaRnm_~^wfA0pqOSrJ%LxQIEC?O`0pg|=FQ4Ty*QO-g}
z{=yKfRZ9t>iV6u*^cT|!L7f(f7BzYlX;P(2nKpI$6lzqdQ>j+9dKLd`R;^pPcJ=xd
zY*?{l$(A*H7VTMO7zuhRsmbCySdlIf)uiMSqlI#mC1s_Ai$7CJ<oHvj#7Z?@i1~>;
z1nXT%V(%g;IRs8+zr%?aTWRbPGPg*ujQ$NgxbSAhj2%OkOxZH#gX0GBsuq+RI5~Ud
zEe_0WAhCNmb;3f-3s=xuKb52zXIx2I>C>rKw|*UacJ14_clZ7se0Z!e_e#_$uNI>{
za{fdj=5JmaC)L;zER0m%KyDai`SYZN3|OEWN2GcxlFT1blz=O<{{kGaz@_q2Vm~GN
zb5Ov62pq^je-KoV!GmxCup)W%sYst<G-0cvf#mUrIDh`gsG|SMbc%_zc?RM~ydHi0
z5y&8g9FoW)jXV-btjJhMiTPrZ!wMz`3geBO?qZS*rD7_nAb(Ke0!%Kr5y_$t7xX8y
zFT)&jpr*DQ=pHWz3R6rn4>T#kGc)_^zPPwRY{uyPaS_IxnCnk4!kBwcB_5M}6w*i~
zos`l_Exi=esg`8&k8z@ulF3VWks~OAvP^2kfqW`PQGQ@i<})YC#1lj`4`Q`2S7Cif
zRutul)2LJ@st8wqbd7b^_iD|IRVPlAgA8Q`+ruB)1nsC$odohJrn+J(##SX9&6M17
z%{>?0bk$w=(oLCE=9f=F9mtA9YB8l$5|dI1Pk-_mXpjGr(&&fRWb+JhrGJ$OxH*EG
zv`8YKisJV@e*qTQ;a)wYRnLR;`O}IjxzMLGPc}U<C^>$Kk(;2x_|plGz72O=c5S{H
z=bUxkndhB7F$L(LFBwOkamZs*4r2Zs$P-wCj$|o?oVBQ$nilq`;5*+N3}J+-1{mvy
zD~cE?sZXrv>#H3Sd*iJ;Ua4BP_Nc~KLV_ZsrfB@R(iEIt@`t{G(%|M!a22k(=fo9X
zobkpTe>|-){(wamP1YkM5@ozGMHYgb(CDgr&bCVQu1dcupL~kaXLO71QT?dYA)lT0
z+HJob_s6Rl$O%F;Va4f7Fxn%Ue4Q{Q_vDpdp85agoqztw-RB+26XTJG9{cRI-=6#K
zy{CG5f~@%EKZ3&e9{u#yU!VQ<DXnI=faRZmJ&($7avt~f-=F{f{r{gj)l<Su09Zf+
z9uR>EG~heNp+E;d5P}hu-~=gHK?`0GgBjG|207S44}K7YArzs_`cX4}AVewSx`%-f
zca#zy<sB^~$_qzWLmS=@hdMii61-6nVkqHyNa2SPpjJNMKusxcNJCMs<OC!hg$!>f
z$~y>{Ln~epi&+d3tKjkxk0`|yeMtis#?g;3E=7q%0nQ(Op^&~nQHn&dn-=L<M?2mT
zE&OmoVD#aH!W1J6y^E76!mtM`$b$@?5QzU12A0TbkxC8?)Q2amaEUN1(IUVhgg5Si
z3&IhCTJs14X~+<UOIX1ZDGCZ1?or6k<>L@e2t&mviAp@)5|_EmWo54M!&>yikFao}
zoa7LRA!g1BT&Tq{6T$^pgds~fi9}^EIV-?;0wHP45Av3DiOSSs97}?QN-}30k|^OF
z-WZ@jexXZuz7w7`+}$M<a*t@_#1vqXQv;bvhFlTxUuiH!Oy2Q_UNO=r#fU_d>XJr|
za8p*mq{ti%@;6eMLNC1d&m{&^#dv-cq#>0c7o6Y(ibTv4DV0;4`uWdD<R=X&^@Ke3
zaL{VP$T=2U;v2F=8*W;mB2J(dMbH04lh38J8kLDeN^v1lr#=;`{wv>m>M@aMZ~<xp
zQC&-oMMQs;QW<-AgFbL_iT~X6Ap+G4)a<5EAbu4u|5=Vgeqj*MvD1>{V3j9uVTGnf
z6|jL7toCR#HGc@RIqHzpiMYzlYW!)IXsQeu$Z%7C$bvk7h*R-$^42s^mWXk}NkM4j
z4|xDZBmB_IL}WNv*S;3Ewu7BifMt=^8D+M%Jxc3xOO)HvFt))J?r@1)T;m=Wxye=T
za+%v)=ROy@(UtCWsasv^UKhI+?8kQZ(OrCe7rgk0M?Av&-R|yVyC}@=dfD4vtn_0a
z;2p0!(oqikZUev8(62S5(cl05S_8iU-iCb%Y~OU$x4`8PaDMmOU;pkGzXVQ)JH|_1
ze4y988P@P{`|;g)(D%OE;4gp&Y+wpo_`=)O4t(YNVGt`=#L^(Ki7mX34c{2YS?sWQ
z-ErR$m-xiyRd1$PEZz_MSjIrM@Q`!dWG5qV$ML9djFoI&+eNv@3fAv{(=lFrF!{-0
z7BlqXE9G+Vx5_sDUWbpYWdN7M9Ty(+oax-S`1V-DZ>I2<5qM`e517JguJfP?eJSzQ
zcgy7<ub?l;W;d6k%lIhtq$&NQ4)<8UkS1>q4}E59z?sjL7WJsnvJWYXc)**!rFgZx
zjV?2q)UlTJRPcdmSI7SY*6=iSI#3<wS^pZ?MzM#M6)kDkvii;O0CTXJO=o=Y`qRob
zZa;<%;B*+f+1YM#KjI-`MdunxQFif*3p`<W1Ub~$<Mx@i;f`f%8{X9AwurBtBsNd^
z$M!vUg;Ct%`64*RdM59?Z?_M3;MX1Cj`zZs+ihzk{7AJvvorubaIf5Z;;F`V@(hk}
zh9giNbURWsz6kGqoH-o|?~%kaZSm<`n%&=4p20u8@sICs9<}&|$cZ!#RurRw*~SNc
z<58q|u-n((=`ghGoxE;u!{#?{UoCDcB(iF|9}14TkB;u@t%GOXHBa8qx1n;WcaI;4
zx`#J{jwWyP);s^|c%wYHQSxd*wHtZw##F%EU8kT!?`C(0HHvN&zjLMVS&6UNzd~@T
z;N#5hAfZ+8VU2X0oqh5Emp&R;3}C&do#LqmH&oZa<y3?lrxz(aPS6C`O9dYzFp3-E
z;FLhPz6G~PihYq%iW-a{8(gWuEU*$^#~&pd!|;Vw`r!-p#@8a>Ku1*uFZsk{CEaJ)
z$1t1{k7Qtl*Z#OZQpQjDWcXtGNg01O_THUrlz$!P|2o6(0gGasC`BmhOGCsn4q5bt
zAC!UT{2}y2N*r>65QYLO+Cfl=Vw#-76cP{#9swzMPbqL9__m__VDI>nqWP|3$k5>%
zqA&fZBJ2M|Y%8E)1IJ?fo}vSpg6y_|DVC2bx}gM*f(Co!{g5IV=1=MZa9qFzT!N$@
zRF43k>HsZb7-j(te8CVXp(08F4bXu2{Gk-EfC?G#8>aBf<{%Dq&mZ<-4z>^tBn=(-
z01c>tD3*W%jpFE-0s}4L4AZb8;(-#pAP#~r5wgJ$r~n$WVH11-3mm~8x?v8+up$6a
z5DC#A@BtI>Pz{g52MzBVvLORM&?5Gs5;Jfes39BFtQ+>h62*`GETSK};S+64`p{tq
zyCEL30UtiGDaxV06b>FNvFJjv4vUTzVKEG$VI45cA8v8__CW;E;T5$4AG(1WxNjJ<
zp#=YX(F~!HD3&oBMi3qFp%NL77G+Q=_Q4nAO#JWx9jIX)Dq<aQu@FTu12xeTEy4zg
zA{}=S9K}%`D?${_u_8io6tMysVQ~jzF&pSX4wJ9wG|?9;q6abWDB$H6=HVLjp&HmO
zNQl83z@;zL0T$X0q>`{A0-*(_-~_Zl2mHYehF}e};0*ks5q3Zh*5DBsa0k|42?RkO
z^k53|pd#Qw2WGM+_hARlU=3P8(Ae-O$_@_Ou?7rb7EqwOdH@T2p$CW$2Ufrlm_QYL
z0R?*C6=EP6=)o6o;QRbRE4k7u`=JP!Ko^QY6(rFuj{+RK0W2#56T@&A2GSQyEgApf
zp&P!h`H}%1hM~LSAqTS|8HNEGpur!$!56Y&9hT1*s394W0T`X4^0p2i!tuNOp&xtj
z8=yhFYz!KFfig!h{$BALGBX=|0UDBl@v4#h&~F{M?=-J*F+mg88u2qNf-uoxHvM5V
zzhO6*qT7@LA4W4VbFnciku&$Q6iIU(pkV~rPrTr<1P${QyWu!lQw9Bj9&A$~U2!kT
zG8v+C1T7OOBy%(^vH8~FF%cp;yE7TSfiNv%AsI3$25>A)#489Vsyxyk>_7?hfQXPF
z9&~^Vh#@8Y0YR%l8H#}c$p9C+Knnn;3s%w}B6LEv;1-ZT4*~%Rz|bFz(kTCIZXce(
zDB_STN8l5DZwX(ZBA9?Gp|CN1;RT8g3tpijieM~l6h~iS7*GHqyr3-&FTIZR%%Tnz
zD}n~=ayavn8p#s9!qFc}FbAvjJa3apn{OY?5gl%jD!?%z!Lh@>k1)SMy}Gj^{%{?-
z0W`laFR5Ycjuc6)A?l!^7`cy4-BkR10ZlD}9u#v;^AtEo5Ff^JDLU{<nK2BNEibEd
z@2Hd&oAVs4lP(_>@R+nHgcBcWa8e~T1B-%A(<@1hf*Rm~74d-@CY3X@kp|xnEZuV$
z2+|+!6F;kib?Pq~st&pU)DG4l7i1+w(a9gqphA&=6fA-P3C9j9v{?T!bXfyb3m!oU
z009t`$s$NJ6ZwtbEI|!W)FM<=6>6Xq%Jmxz0Szi*D*Zu4$&v{wf=G9?N8i;Sh!hj3
zU`LCTDB|J2`t=!}Vf-qSEHBj}R+UNjK~49vE-m6pMUVuybopTMOBJsh8Z!}5G5uoE
z7vNz{6E7LM!9B@K4Y^NF-LPN(>tDx@O7VgFJ~m`4LSs4BI|Y?2C5>f)Q_}VUQLkcA
zOYmkFGg8qp1LI*djV&G<(HXy?{jPK|&(r(rP%&vR9ZmLR^($qILQcO_Rh4!hr7sdy
zFdl}%J%dppC-KJY&MaCBE5-pA+7=dA;TP0)DtPsyeANzeVF~~I0SRIO3D98{bl_N<
zpy=>{0V|?eE8+~GRZyCh6p)n{NZ}f?wGAzT7Qn!AFV}LjzzCoK7{WCJ(E$apF&<_C
z2k^lVMnFf~)febBUj2bbnUr<2vIg+M5k^2?nF7v^Vo666A)GY$R?`@RFEjmNVKvnv
z;2{zhGyR+|V#yIqr$Wt!Hw=A&28|6J1T{)IGXuYCWc{IJog#OQ0#CP(`})ylE8==9
zB2X=2e1}0#b9QH~Vi>UPXo)v32{ZVlR(KQfJdc)3@wX!8mnb-uNhOUM_4g^l7i*nY
zRS&gn>EZj(!547tQH9Y~!%Q7;!3ddR9BP3TYHKQLL9zcTf*)R_BHp25Naq*OHYt>W
zBa=cOSb=Wg$!_shZw<l(hCm7OmJpWU1YW=m3fCV1!CB8h2VS5bgqVos!3kQR26jM1
zwRI^5p%XR^2T%Y9qVNT300)`@A9`Q}rVt8Mmvwd2bx{CcR~KGi0WC)W3z)!+DNp&(
zL4ccY81_zQ(a-t%VKmXtevQHxh9Uj>VKSXh`XH7wofj*@_As*)8rrWLhG8-bFEb}|
zP2CqD{efi7mMI7m{hSdRFu4#Vc|5%{kR{EN(c$|*GYsRmDkOLqMzDT4lQq*9fm?Gj
zK{1eRY&G#zP+|Ez8PgdblQj_nfv+NKvr!FK(_;UDvoUvYHYd~A&d-%`OdX1W72XIc
zZ~=s+qGslS|286ps{-zn!iAk;hG|#{DojAeK__ITGUNajbmAUriVH459|Q##>OwH~
zs2}pVBKFxIc!3Kpi5rYeijxBRU=TL7f@8m|2CBI$)C?R=Q7T?=D~7Be1apRr0;A1>
z;M6QS#p0v2!tqM_R+pj{G-oOJ!5fqz8i0kHEyAT?+Cbz%8I-|<x#1qFp%~`Do}vME
z8Uq((2Zi6E7zhU(-a#4eK^a)sDry>>{6Qj>p+m;uK^5yAqG15<;TmANG2Q_jiUF#%
z=m3KNt&sxm@<DEy0(Rm6t(PEKeZ=>$pa%cupezhC`D9i|`oS=t_edx+lsP%26Q>yH
zCV!NI7s#3yzG$Y$W-@+Z9Q0u$pW{Su0T#Fc=t>wDOc)$^0TzfsIOKvC)Ik<BuNH{m
zRkS%Pej&0=uNve6K44)U<l#l~;T>4Pwq$|iU_m17?>TTOALM|z`{XPxp}6%kJp7ul
zmGMYc5J?WNux-a13Q#HD0Z}F+pn*jmNW(D3VXTP-9Q*+ndgvX1<rhpCKEfHhd88Pw
zc^qE49)>V0y1OD=ST4q)gXJL~U?HZ7Lbog88ivrftD$0id%6=`!L_0umZ>Sex*{5T
zyDQ=%$7UR=L2vwltI4~Y)7v7zIWGSy#)Uo48#sx+v7*8WP`|-RzvCnys^L{EBEbEj
z7<%ZiB+@?-e8G2|$De{9Y9X<iB7*^k6-M~6(W4)@ffdG~!TI6G4dk&QM!owx#P3_L
z*3QJY0?Czpvd4+4_2C{6;vQyv#vQaDuo=fILdScY&D*>vlG+7%A)A%KKQWvCe&Ofd
z+b{&=jiP*P?9U>KK^7nbh41^C*A6pI94qj=7=W%?V4)UpVIDe|7ixj$fQN8~BeM%U
z$J5!(KRu;2`=VjkSYSlGy&0vmqJ>N-DPX7mKpoaU9m%<(gNvaSGW=YW0T%@Qg|mnq
ze!U`oUD*9W*nyqci~ZP#J=y<(z1Z0y*p<E6m)+T=-5-`=8Kynjqn+BdJ=>9e*`Iyb
zxgFW99ovyz+{4}5yB*rs9o^X-*vTE-nLXXjecs#M*y~;1-QC&Y{oKpl-u*q_@15S=
zJ>H$29jtvB3ZB}x9p4Qe-xa>!_x;)zzTqi;;06BQ;~nCa-MREZ7COXq*o7aunT|Zb
z<PpIiT)^Z#zy<sP5mw#<PQf2wo(TM*3}Aj4%mL=hz#oVJ=FQ<0U>@aF-sD^U<yT(j
zX@2HUKIK>5=wUwTSH9+Ne&ut1=X?I=gMQ_Q-sxQ)>X+W+YkupSzUaLk>A~IurXJ^Y
ze&u=I=T{!+g`VtL-t7NPKI+3B?76<|kKXRlUhS)%?M>e8vtI6rp6>ZR=KX%@dEW3n
zz#p`}?_vJw0bl8<-sH_;8Ls~AP5$xaUh?Z+?+^d$D}U`ZpYX@t@Fzd=rGD|}-ti$n
z@joB&t)BHQ-vcn;^jE&~$6oez|G6YP)|tZOSpW~t!3S6X`F-FVDgpVCzY@-&`B~r!
z&H)di-xZi4`iuVxqMsR<zxj**_>+J6qyPDv-v{8}9A;n!d_WP-Aqso|{-fX=I063Q
zpA(F~{?T6%>fZ-;ff)e8hd>{S&cPYzgBd4;1)~g%a&F;3PUjH9IX7bl!E+7;LX;?w
zqQ!HH5bk2e&>;Upg(*Aw_=r&Cz>66-x`a8g;!KhzQ4TD4a3IT{93MuEsZ$`$84VF0
z&501Fz>_0O3f+}5sKBQJ3r3Atv#Cd}K4dE8Iglz*tqDQeH0su@kELR_E@XkX(mA|%
zeVnVrmxU{4fv=py6PTH+z<ADG3H+DwUcP<-d+^{dv*yj5JA3{NI<)A~q)VGVjXJgJ
z)u*c|V+}jD?Af$y+rEuE_wCE)di(wjJh<@T#ETn0jy$>Y<;<Hqe-1sm^y$>ATfdGy
zJM+uByL<l*K78tTxWt=3k3PNn^|zO~(hfhq{Q30j+rN)LzyAH_xU>HcV1VK2Bg;Jk
z9*AIq3NHWXnS1;_2w{YWUFJavWsuXH4=fnu0W-mo<AGtm;Xz>ua9}uHMip%+VT&%l
z=$wBH&Pd~eyo^(0jymqhBWk?C2xO4bkyr*EGkBmEb2)4XM~5GV_*;`j`rtts)TyWl
zB0_G-rHfaT(PNnE@snUQuZf9fnrb5WW0!8e`5TG5oa0KBbox*N3wjwz1Pjb4l0ykI
z%(*0o9wNp99^`;1VsA~(NzM!*V2G%q=j`$r5p$k{$P6r8fz3JCAXWwoGdM;Br!ycn
z!+WE$KtvR&!bxkb&8>;6Zd@2B;5fYG3T&{#?&g85#s*0u9C+m5fmcl7bxs)`<ZuNu
zB}D&$2$Y33$;>VuL?LY@j7I6frdN1yjJMz-iBY10lB0+RKAf9syjPri>bCM`TW^T?
z9t&{5zWG4Jum-2LhZB256W~3v<a2Pu5>L!on*v{)ABmTha0Q0gRB}ZLAw*klZ^s})
zga@hW%S@BXhB&TokM?%1FfNmLg|}KB6RHoBR^$OTM3k^-2>CKuG7CAJL&T)y2#Rsk
zaLPz=)tbTb$AP%KV|CYFt64^)QjZ-UiLRh{4mmEE$SldB3S%@PC9I4zGv|I;h9WUL
zS~5l+kaKq#dDp3>Fv5@%D26FxgJ;@Mvy9QwJ}(M2*_Ojd_16*;VoGM}5Tltsp2+`V
zo-);Fj(X|=vcr1ou3rv2c5?p4jLN&P@VB&~a^e9Vr^tH_%e=z@n7B~NTqPbUUo?F2
z<d|BCr{qY9NC->E`|{C-Mn2&cQFw4_?Bes6x$44(VR|)xFrrx`%KX7Fc;ozHe*O0A
zwhSUJP{@D(evJ=6=gjUmWe7nCsI&{+rHxspBASK_MUL;O3>$mn&}CRqhEPTDGDHZ~
zDVQ~bQ>5(*A(+-NMD;yWo$7(y;-1h#(5LVPaE9|K-~HCK2QFN~AJt%AX5MfQPjv1(
z4%5dCkBG$7WUGIHX`;nw2u0>lkT_E;4mm>AoGStci@wp~Z@6e2MC8m`vx@(s8Lh(%
zIwTQTWa6O@{qYBNXyQ!W=|?T(vBo^=ku%Gn5DVzgif{;Wkc14!6VHf9Gwz~<9teR5
z6A8)Z)G35}RFgaiK?Y^Of)~U%#3796onmmKlB7&x$~?e>Ko)Y9f;?m-UnxFpoZ=K<
zgrzNu!#^;UGEJA5hj_dJx?Kv>e5aHIE01Z&V!a1Wi^9e+j<Kj{N^_djtfn=uiOp<Y
z@tNA}rZ>N-O=m(Aoa8L0H^phrbgHwO++3$Nf8$PRqVt+tVur>f!9jKmbC2_=MH}}C
zP^+bk1*$~mDtQnNd|qLhT=Ec=RHjgd))QzD4Ut5J<WLSq)J++^j5+@*;e(4}6lff?
zC`T#kfscmtO&vw3F>qI~fS#rwo}iy;^r4S`&gLGxvdu4WB-5Zq?34yADn2imBp?BX
z1>rD86^xNkKPDAMOKs{?ql#1^Rn@6bJ*o%vq*c6F6{_Lj!3D)eRk3o_t6&Y%R<Byt
zvu^3FWNj+$bSc!(c!LZ|7-DI--~>6?<`0CxjXY|RSI_9<SGihjDf{Swf)@3d#*l<r
zk6|~F@~0Ahlx$Nii>}PNh_e^;Y-KMi+7^-atEL4lW*0iz&KB~tmtlrtUbI?*5|XyB
z)$D$9+gh`B=(e#fEh}4bnPnvQGp102b76rRSO~T@_kb8~T(ke&(EXwobWD>zw%gr2
z?$4N$ovbked9F|Swmz=t7(RJGURItr9O;EEf7(lq_r`aX^R4fC>4RVWBD23=weNlc
zjLQA4QWA8aue|;X;47Fz!16_Jfgvm(1jE;$40iBJAJpCnCz!(?a6xuC^9xuw!MTV%
zjdV9-3OQ(kSG*v^9wOlnSo}g0Z}5aZ2*Hg%{NWxyCPaDs@#7#5IWwl%!yf!<nxCH7
zAJG6RuBuGR-!ZkkTyCmxJ%HitSSGT@sB2M;@#QdMXUwfAGndg!AvIrz&2BC)oG&A1
z>(JTEMWuruJ(Qn4+d0kp5j2<md_h3t$Iu3aGa{y}nP2}XfeTi+Ms%m^4^wb~7jnQc
zE1YnNOK`y-gizQahCFFcqyfjj=yYc8k?K|ZgArUX1tGGAntaFtl*`2h#Pk6UZ)|29
zT-%YaHDhIe5c_`n^K6&TY}s%irdspy5NZGT>_MJZ+MiN1e5`%J250-T2%WaKwFB<2
ziaXoeHg~oE67F%6n*|>=aD38@ZFWc7-SWZrx}SYodV?&_&++%O@o8d6^MeaYfCVdf
zU78nXCJb`0H5vTD1yA@x8KWk|8+cd?SQo<|n!q(9aO@9}ll%|)P{M0Gfos&v@5Io(
zhdlC8jbdM89?_`Bj%w}?aJ1MTJMVe@*l`(oXS@FjXFYdy+UtQ+pjp96XL^C1P93OA
zeZxv8q}98v9j#Bj>t1hq*w3|fs*fA0xO*^s#LjiHf1TRdfxFt-9gentxbA2lJG+w$
z>E>QsrxC}r6*y-KQ|Lnp!mdTfHK7?;X9nh(Ir*!VFnRbnAv2MPIciLo-CFztkKnMW
zKZ?<haU`2YqL;@#xDm|Lr+)RC%htciUes0ymmIDjcySg(p}Tio_m|<l?}-Ea%LrfT
z#Q$6Gt&@BYEMMNuH$L>+E`8kd7tzYRPV}dr?dm`O>DUK9ySYy%@0XwKX2t7r>#^dI
zt488*+=D;(!7whc!W&Mo0;wT?d6`#vC@24U{s42Z#to9@d8lzmkj6tm6%G2}4ZhSP
z+`tXBAZ%17ffT4Z(qewvCrEBaC7&`R=Wq;{Q3W7KSx_~CXw@8zae^L@f-1;gELdPA
z7=trNgS%yeBp4kqh=MyfTasW*8e(tFVNWKgZbGPSJ?MhW0faKhgxW@g;b4Tv=Nn0Q
zg84>v_~d?x6$wg!X{iAVO5g-FM+R1)FqvkC%|&V&7k~z6a%QLx1xR^>Flo2O8vWD{
zC*}>+Pz?9*4(}ij)o?mu!Vk5e4}(~UhiE?g!)H^tV8Z1mNT@MakWi91iHT;3mw|~N
zsC}UIRaj>n_T-6~sELFmij~M5rWpSssF;d_^kx6U98f2P&NhXsNQ%Ybik}#ZgfxrJ
zVT&n<i}Gd+C3a%tV1^k;8}sl_JtZ4FWgxD`8r&d%kme19XCB2i8`*e7kob$oWLZ^U
z4)>yFb#fW06pn>7j^%iS$VVaSxQ>I=j^>yg=!i<in2PoIj>CbE@;Hx8<!2Ix2TwR0
zs|8o{$dBh3kNT*I#xRiPP>{-jkda7s$Cz--^#@9D2&&;+9|@8nDUu^ek|i0Eu_0v+
zSR4J24=w4EFA0+^Sq-&7d&`w{0eMV*)EEaT7|Xx{35k=0q?5z}7_Q)xKpB*+bU`~Q
z97TDQ7KxKX$&*I;lTf*iZg&4xzGaGAcY8@Gl}*``Rhg7cm`v(599xNIU8#aL6j0G%
zhIo`3CMlP5NtYiP8w6rq=JO6U2^-p&8ot5{fhm}SNtnD)3#<SOeEDk9m>T>bjSxpM
zH#wG6XjUv>eIpW&lPO=IWtrpG8ybU3n#o_Bd6}P?nWDK{r0JOxl8&g!j+A%~-exxx
zqLyPxTb(IUpovhfNsq88o9A*FwMm0)2~cUE1ORA0>cCj2qYui!3ap@*kvDXrp$^k2
z9??(@eyJJ!zzW6SomA$X#o$Z#@C&kVi1(ljvcL=apbp+y3yxSdl8Ks?6-an-1$bav
z=?IDeNuPQ5Dfn4CBgX%msac=@nV$kWpdly;1$v(c8g~gQkj7-6c;E^-XqA)MpA+h!
z`^lelAff+Rp(uEvYl#_&g$t7gnW+PMsWT3+09~VT57rqP+UXrMx}7hY88^aHnL(5M
za3lWk3!{{m{_uxhBcHtKR1|`VbTFc>nWU%4q!21!R`-fgDy6eUrAykRPWojj$e~I3
zq*c15^Vy}a_>06TO!~lZq;o@CgF4l~3-th>o>7R!&|>3I49w^a#h?rZ!VS^DjQ&uF
zpvMjO0Eo~S9{hl#{=f^|s1J9_FtR{<McOq-I-sZZrJ{+cSK4Tnm8qJ!sho;TmZe*w
zI+_n^s;bBXr8@tQXu3<Hpaf}vL=I!42J@Xr78>sW3*0ach&2vdBTD{|fc5YW1~Lx`
zs2RG-tBA!5uy764V0z-AsGGqH)u4L*(4MbW9^=3Yb4saJW2vbsuH#Cs<!Y|yimnFb
zs-!dzD;8e%v!`9d55F*{pb?}ghgiQ*4C4T;%C@V#CJ&}}uQAG~qeQUhF|C@x3(8=D
z$|ipflNs}1n7sC_@#z8Sim@51u^Y>=9ZRBl6^8b=M#K=P5fh`)$r-R<Acy4-@2Pq~
zB@e}rn3)l<SF^IrI-WB69SNJG+;|U+^$y)dubNS@k$JHmi?m6rv`fphoVu=iq>N60
zvZ=!l1v39J?;s1@NE$!&sEDNuXJQ~eN2E4YvzfuQwScquiXJ@6s9LMCrw0zW%0rG=
zv=bAqO^dgAtG9d0w_NtLdb9^h@J4Gy9ungXA%`03;G&1?5B;!RvhW%+X_&<(53C>y
zzNEOjnzjdP9&F1C&k3FW8kl4P3!?W66kD$nbGLoVx~=QFuZyvN+at9q8_J*rR=|OI
zR1NVnEYa`_v|Ad4N2As?bN`{J{D8cl!IGPC5C4R`+>p8vv%0WLz13^I*Bg|wyCd%q
z2H(L~a9Bx=IxNKSuHqqj#9+1m;kduRzJJNSzfiJvd$ia~zx8Xs_p5!{n<MX#23)WQ
zh+6*}wV(uH0KD~6M8KjCxL|4QQHLsN9@C4z5iG$IjJ^7sBY(gO-H{JgpaeRbN5wlE
z>JYu&F%OdJz?uWW6s*E4%)(4-!8O7KK*b8+OB<dLtNRqJve8dNYaZ%wxhIUm^V`Bh
zOvFXJu`fI$EeCQ!M8mNm5AM28i72+Qp@`?f4Y-h^Ky0)|%*9>o#iokHGhzi{@C%VZ
z4AD?nw802Uuz<V7vawOMujUQOHnpjt48+ifTKqLB{Kb9j$A8R(VO%4ofD6UY#H`^B
zW?08-gk7)^vq**`ftVQ=XdCm&yLxP-LJY{8%*mZhc7jYJ<3I?Eu*jov2}*!+GWGvc
zxr-Y201L%nMEY=zKuTR0h{>qK$DXXqyX?uJOe5-W8<zl=GNo(8FvYCF56YlZ(dx)q
zd&{`2$-FGh)7;6v93Y3VLz|%vN}#o}VXZ=S4To9EprH)xI}g{uo--R8y$Zn3Y_Ze~
z&++`n)(jxn+!@`h!^{j&<6xe)F~X?<tp)7P!jjAKY|sZyzw~Syga8YBpbT<=BR#YS
zgkVJD@CR?e2=j0Vk>Ck(09~>`2x**SywK4vS`2%@2*7L_Rh(DDoFMHx(9n#~GfmSG
ztkAWg1aDvkR*(jszzt472)v*K^U$vD;|cO`2!YjH`Ea;O&_+pJaY~>M)o}lYkszz4
zQ4OOM)8Qcx53|*K9L+U-y>;*a4`2qzR0w4)1*}v74<G^BP)KcE0b*^xH%%K#Fb+Ky
zYJ@OdLv0Edrx}NE)lR@Qi}%!n{SLHd3O3x%pYgL_4I2F5(y-wxkX@-^P1n>b1poj5
zKX6QDz}YFlN&)}?0#FBp#0jJ=0GXZ8C7K|cCkNFKYGlwk^Dxw!aMhV%&;H;9z--vM
zoz1=d2WgOarqI}*fw-2<84_C?fT-MC%-Yzy*`58_q%GR3MA`r_*Msx{oW0u7ZM}9q
z8?Y_gmvC$IV4Nb{!TyjB{IJ`-jbu&@+?mnatiS~jQw>=R8r-nJ4lMr<(NGMQ<_&O}
z52N(o0e*k#;A_@3)ym*=;1IOviO-&q!_R#%1r6R!JKdhmN@if)qwU?xAV}Jf-QS(z
zuq)oOLEfPj4IJzVR`7C8Amih}2*K^!X1GH&PT#=%2mMC|tSlP&;KA9InDYS43Z5BR
zonzx*<U!Z0#6S!N@}9bSdbL0du<*5{VMh~g;kbg~C$6*`Uflq2-Gx-*XB`fOP~u>Y
z;;wxlbqVKni5kCf%#dc~+*k|13=2kd=bFLXnW3wycSrl`4Guobq2Vyc-Q{TV<!tV;
zV&35&j@_jV01qHY6~Ni0?dYzX;;<3tpKg+<QMV`74;RQ-zl#5-nNjMsz*v8-Y&5BQ
z_YjEQ;0>~F8t+gGdA#Vk(&(GMv5>w>9!};U?%lh94cV>fzTUT;PB8@H!2DocumG2}
zAno@T?Rb<AII0hCi&L{+>xV8Hu(#{L((B5OvA|wP!d~WtgzTN|;RE2^=FYdwPBEjW
zk}--4wQ!AB{A#t3@7GuivH%NQ)1v-953>#qwtgBbI__#x?(%-F=uSxL4&oF*+6wRh
z0Du4rkn9kTxAZ<S<50fYrR!#^(yHDW{7~`&EgC=C@M-e!9#5_kKS&fm=^P*drA^v5
z!0{$7^Ggfz62rD9tPBgwz_L*1FTW!(|MRIz^MYjaW)A-V98d=(?g~BM^e*h?0aXlK
zK4ta5^0{$XVXyQ6!t`0ssZSpcQP1vEPvV^20O5f3XrHt}FEQ#c@@3B&AguQ}a`to&
zp=!_egGAaK5Dpwb+G{=cfZwrpFENYS_qCh%k$)h6&-lDK-4c)jo4@&JF6<A$`JEpQ
zg&z*uVETfz_?NG-jvq0~FwT@88ov;?u+Jctulk}n-I<>06ae+@p6QlO`h}GGx1X-8
ze=zR=?zG>S4XFGHV*A8DmYXdA(@*`{4fQ%t{nIZ2;a~s&@BypT0Mifs8EgCp0}Eu|
z{LH&+>0kMnJ^t^H_T_IdSjPUVQQ7rx_U;e=`|tnp@;@v9A@7$zf&~p8M3_+FLWT_;
zK7<%i;zWuJs}-x5aiO|u8a;jl8B(M~4<5puM43|MN|r5MzJwW5=1iJ3ZQjJ0Q|C^e
zJ$?QJ8dT^|qB%>BM4D8oL0S5iK7|@pszhSkrZSvY>sQCCUA=zwSF-3>vSrPlMVnUb
zTDEQ7?mP-sZq#bt=HA7dw_v|o@AB4is#ow}hhpCzMx0pjV#bXfKQ`)t@Z^d2cu~fj
z`QtrV_wMqOrCGFI!;np%Mx9#qYSxG2j)qOJR=(J^Z4-P~tKVFC81>2H=9i#4Zk}%+
z*I2ssa^}sQKZnlvHFC<_tWw85nH#aW_hA1O(>Kmvt%BqD4a}atq4MbM-M@z)Uw*jh
z>hs<sZ(qOMV%5|ImWv-{xFTpA@%BS7ER*JAut5hOgb=Oz5(JAE<0!;%DPH=*i?4#-
zxh_NX*o&}46Hi3(#0f>5${PY%gi#}IU}5FOuZZymBW3u3MH%j5q>jWCha|E{BUM`w
z$ffiN?W<^nQ&Kd2s`)Xm5Tis+$RoGpvP&<?N)k(?ev!wkaabwlKrzMSr=d1IdUMUW
zwEVJ8JMYA^r7-0LX`E=h(kDMYMdYVUgKANSAw(l8^q@rt{ff>!C#AH~A@_tdBObj{
zN15^r`YqG!=DEzEI2Ah8AyN-YRn-5eB(*eFS!Z<*Q&%S{21==_;f6MD1idF38*kN1
z9%Ym%bDnYDNz)&G)WIbm+JcRSHh;i*N11z+d52nSsg0&uXT4D-ntPs&cG_^Q^~YFb
z{ZZ!~aB?NqBUow0H(z}rv$fub#^JVArN)uPQ-9DS=$>Kyl}jI341^^-SbhNqmV3bA
z1r}n6IaeNB3@xS>VtU-sV?zryHe!Ex$(0v*Gv2u4j|p-Z;wiry2Ns4ax_4ine+F7Y
z$#%|Y9&ca~)GLJjQJ84F<|U{YaK_QipJMD<)gUsX9*5j|Fgn;!g5-f^9)I3xk{G|T
zE@<m(!Iqjzf>d@IqMn1sJ8%EJb?UcngsNesR8AlEXUA%OG28F2s`=9&VF8vcQML(k
zyO?{t@#Y?|-DVn=ME$wOV3+-wJZyp(CrDUc=LS&mh3?)vcG+i7sc+W{x&~~y?)m)o
zuj;9VAAV}72lAYq%139dLB2fm%}=f+L}>j1JkjJ2avONziC^6xx_wUwcG|}$|7R4P
zWmFV@7srQfmRdSQSh^AEZlslz?hp}`Ze>|wX%|Te1xW#6=@jWk;SUmm3P?%0bg4W%
zujb91IcLuK-Fs*5{oe0qq5C814}V5viFU-NXt(upw@9rPhtB#7UvJ4W)+-4sk|o)T
zZnFEV+w%PdZ~hW3T24YL!hV>(QR}l%M&6$=*+_KsvffDbEdCvc*FdNQa=oO^sfcDa
z_=FX1QD;~oi{dxXQC8ffcAHiYL8fw)Th?|bb!d2ZUV%Btql$YN7$)O_Lkm$9J;^Z-
zT}{cHR@8#auZe}f0{P6|KIRS96b-CZ(;Zt$Pv>|)^|+Ghv595t63?yB5BHe+&lYKE
z?^8%6q$d4FWvUGrC*7|0v2U|Rc+6#Jsk^%;+H1OU7J~2a%ow>YF2jYq)x@3!m$CeI
zgsN0TO5~3hc^$~kQ;5Xtl6+Z7{Wk>XC3~CFX$EGT{>iO5P}`tB<0~dg#N4K9)wdrR
zWMcD<6yc%K!fO8KwX_MpN%~T^HRK-qu!M!$YPms#>woNh!U!QGXJf0tjyB2_aeJEE
z!1q%Og3Uwg)|b}18x1{RP5uoHg1}%@Jm1Tlj+CpBgIe9F;eE!F243l``KHf};%`h1
z5NRlud$FQxdH#+MG<gzO<bwff3b!G)k`Rq8ttj@sxn;0WYi^jwl$DI@qIS@k@;8cf
z^kP?BP<hZq+$y3-CT2uH(I_VVWV$S2ITC(1aw?kqbL>UI1Eozk<=)M7&l@Xx+-{T9
zB|X@8$KII&zXp(&mND$iTzNV?2Z`UQzf`e1;oz1;)21eKktE?&b#_id>`+E^Mk<uy
zbK7iuURv1`sF!1u$)q@uUcXSn%bBN+ym8Bf@FHf%P_K@>Ur_gXMt_z12w`d{aHd|A
z)YD0Vtf(q!rU9l~2}fU8&4k{k;c*&#Xmw?l%sVneNOFthwr;oSZkqz9H@=VayxqIR
z!a&VqCGs?5VJZRH*ur_R>?aXsOGQNIkM=*gl}v56p(mqZe)PnRxpGF(R;GPJ>Fw<b
zqnAHoWi+t<Po3x0><;wa(x3J}eSX~T@b6^y;}z5!166bcG0t_t?|5VBI~-v$bKO+2
z-q(3x8K$pJ<L^ikrgg)CeEenafk?01yn-`L)?6Ro9iIgA4rhkux&B+RK1pthE-bTi
z12O|XDFGcWY^QUBJU(j7&X>#N@o7T`N?LL81Xo^}`Qdx9;%WLTU_p!d5sQI3Dm@xE
z(V+QJ<JZ2K{o!jO5%XgY0)4XwJJzqnukDZR?jPn1F0RYWT8*&b>+^njJy53QfUqId
zC=Zg>nA3|P&(;s$fR#3d7{7vXfqu**7{n5roCdPdztmxa#67Qf>J2QQTw@p6f-UBL
zdncem|M4xV;;&x{?4>?i|Mj#U%;C-}ZLHK)l58co)C+I=SF3z@6pZbk^`vMbd{*-^
zlo%@=kCj&QCiQZQ%9#(A3ux4M{K)E2*g{7NUG<0EUv^P$Ux%wt8aI5sJjran4g8a8
zbNIXG(VkGn)g5F1uIL5(jE&?@rp)_aB3Un&oEA4G#9O*w?ne39aBi@jc9np<AM5`S
zqGLSEJjCvYJX-wGx02K;(4+kL-IX@`$MTqN<$u3}g%(yEm}|Nl^ND)2i(v87z@FJ}
z2mWEK--iNQKg)bNH2b(H#H!smY0=5shb=a}j31EAdd*zSXtx;>AJX_R<rupWUKjMP
zt-9v9&)dYm`DvsIt%H;&bv9wUrtH&hQYOh@>J9auOR=_mv?39kVAeop8}Fs+tOlyf
z-Js#n>gMXKKC-ZVFL>y{XXT?In`Z|ePcQ4JJ|2$T_;(P+X#P;;ATcy}Kyh;zr}*92
zW@K}R?O?9VyDv?0;#B_7^GeZ)<;~WhMCW$GmHhJ4-{;O`9}k~=R&v5u`+sV_aoS(=
zq1@w=+HGk?9wx3MNyB*KeL5-Y)wS>Oc9F{dm<0R&N9};$(E7_GxPw@XOoT-b+toTe
z_n*qs)4zjMMaz^XTxe@f)i#Q@1+uRTAB%(({({L)4kfSUVX!}v@M6UcF6A-H&hZ=M
z7*o|cjV203Rq}m~7Z(V&{nVaUIPAl`1#jxn5L{4KYUYJ1BuSAfTJGqP>S-@IB3<=o
zkt$0PGU-r_+4a_@ODi>34^ukra{zAT2wfRLeBVz9n^P_(#<r{Xyqi!Z&r2FuQ2SP|
z7Tv2h0;r4hB?=pKPRce(OeaYy_6XUgg#iL2bmY%laPkek3LP4@=vV=NjlVh?;)^}i
z+dZlstq5`rvZQ8oU(fgzi~1I^(NR7{dq=|}K5Hzy#G$LtV7kwsnA+A`J-S6Bp`cfO
zx?Oh~A>Eg<?_84;m0Wd0bInClRZ>|hDValq(nhl18dTO(TUadnqRy9AQUI0|7waSp
zt8c|QWLHER!>pE|&x~+RRnYy>{v>?gj*-^=BnorIKF(sT3L&sg)qqc5ik;%SVt%dr
z%l!6CIQevnL&w3W+5|OUYF`7StwI0E+Z3;kes6!xFo@2F7H+pQma@4bW#^m;<5wX}
z_^yJo)`GIh!dHKYv=MmdyF*+kxlV+O@Z&0q@Wml~)eXtpC6Z1hU&45JLte)1Q?97K
zz>(tviWT<b2BNP*N+fEjlj(-@SBGD(3Rw=}B)eIk9J~%2x;f)h;se0bu)2h}A;CIi
zvU3hE2YnYmBL8T(YI@{7H+Oz5>sV{^z9U0dA`|;<6p8#`N1P6SE%~BRYZM2nYIUTw
zc(je1rN)abdy93;IQBVz>`fM&$?cTVKM9SJh{ReJ@6Gn9czsVvEowcaa>Hor1a723
z-R#|%KV8OHRoqy|*svmHM_*ozC;NWai)xcs9(btLS&Ve5;9z({90YwI^&)Q>YVSc?
z+^q?u>SL0k#k@hq*>Ik-zA@s*c04@E46)NoM&<lz&FoVQvB0ydqRfbCY@ckbn-!Z4
z|EiZadi5@`zB`YyC&|+z!zWw$?mM!l<+$*PPhb+9r_tDQ!F#`M)@@*%>D*v!iF&!P
z@;OtnUn=i&RC#g-Zb>s?%dC54Ct<ZCna(yLoWS|6C3|NSH{ze^S#EGx%=XzM|F6Kk
zHmqT)5xn-c-e~xnuXHbh2#K`+;Yi2tjcvgVi{teFK)Yy%!FF$Th|zt_aAU`4{U!J_
zVzf^jM13O9vmB~Ek*ePk{n*5WS1DgV4q_UN3}J>BZ{-JhBZUKypbYpBcfJpQn)*XE
zw-BV;ax6Fm7bwijpo9YJvb!<E>u<l<$U{6g($hG9;U-Y(p;`g*F)eMy1$uSUNu?04
zWJhHlP6;35LR(<VzZAgnY3cz}Klsh$!sC!42!zOM&^!2ZRCg3G`OXNZPVquI756TL
z_PK{C^%%~_2uH&*iRYihw%~-8jSTgSqk|`zpfg-klb~9VvsjFh><yubXip;$vk6x6
z3@VC;-y?vo;hQ|(=59t<Y{C6U{rBAn*fY|o5+GI27rAwWbCu8SXor`1Q$HcXhJO{f
zP2$QEVT|*i<Bf2S3Z_oy-#jWvem9BR8k;s>vDitBeT0WUotTboi8b9t8?V7aj4V%+
zV8Q(rSfv|bTK7u#r=kU>J?AK%%)MCwQjYzRF-}>YKuL-b)01-eK{4X)mEp~hZ1|J}
z9bD_4vatEP7K^V3*H2;k-Wp5(So<*VWhl@!b)I08Uvzz2nNGLLtCxZhdM1jQDvD~S
zWB5ItC<<fHvkAx@be#JKI1eFlo*1oyM(~N<cs_R@Yq`*r50{%@4q&n<+5B`(YYgH4
zD$SFxFIYGx5GR!nU&*G~n!J7igLo7p{25Kreqz2<oQC1euNd30<h!vti-EVPRF!hi
zqbKUAQ=|=Ts|ky8ISkckTT-Psd*)nOdh2Qc4$VO11msCPdy}Vx-|L%v<Ybge<o7oE
zAT32l;WjztWBw!?9-`B29UxEpp*Uy=Zf|b?ApSGix%vCG?;BSuUv<u+7FJ`z@lm5g
z@OmwyR&zF?;DwgmugCdtKGcgxLpCLG=DP~{*%V2ahO9kG`SLN=AB$cmdD+HoE=up>
zJP7l-Yj=5(<fBTC`yQ<D_vF>(@FxWObymC4XYde|<8;i+;{If?0Hs+S=bTcmtde<G
z<y1nK9U=qw+2^Z&hSk!CgcJbx14!N4DJU@iULE;$H|qO~>}6Xi1Sll6WLKeT_dD->
z;cA{(Ne@~Q-~YnTz&tJUN6#Fvjt&oe9PVKp<jSETh^Py#gf1YZw$(C+v;!1LvtDJ;
zzk?VsN2*dV?3c&(sj*?Z7#1-!3Muk~@!t|ACQd`(_E-5dKlxXw1nj6XT~tKl^n1)J
zySS?AzV|d{K9j%6?CdnWIDKw#(`Y$C>-oEDPoB0GhMTa(KB%qAGA^Wr5@2?I!M`HJ
zVfr~BGnzDYH(<qnpsIci%Xf^^Ujm8Zqrw5Ws5jOc5j8gHEVjOKvIfeJbdPZS;p~m|
z=7}m<Lh!bsUhTTS`c}5*#MySaWOg4Jpko<;dLdBwUR>Y-`9SiK*#<6SNv#yIVRzHG
zM1<c;=_-38Wpjzhv{e5}d4q!S&suEx<=k1i6>rYHBkrzI5_3kF+o0~IK&i<75H8Wq
zG)mU3yleRf=D~nKnm`B*WyU5dB(Iu(C3-JT;L2wyX*GkUl$rNrEl*llH={I_xRjwb
zQ|XZti)#IOW?9_g%2enPy9sC1LR<yp=()z3F8|V<`Bf<`#51w=etoO@WUB_YP58c5
ztg~4sy<LB2yFqk&tlav~5u!16yCrkGwRAgrCeF4oW!w(YQJ?bjh!Iswd2iiz`^=+C
zdMB1<yYK!^|BPo{_4c6jBLRV}ILyvS)6R(U&e+V(`1;PLlbz47-3f->N#5Q6q<5$8
z>`vd`{o=km6SzAYyE~V;J72o{^_qM=u)8?3`)z&q`^oMP*xnMu-ZJmriuB&kJA145
z_txC^)&uu8V)r&P_kNY`Z8hy}5A5yC?CoBy@9mxJ{f7M}GW_1>{e2+)`|!^1qx-*)
z-G841{yvTUeU|zAy!7`))9=fH-+yL)|6Tw6@8tItj0i9iN%)8$86sGl2(chS9}r<d
zL^zI!$Rd)K5s}SAvOyyGERkY^NO?-6g72dk_o?~zX=L_kwfE^P_URw&GX(83;`W)c
z_L<A}S(^864DPee?%&+lXFJ_zhaaFB4><S^IAspFv=6u~4tO3M@CF_5;STt-4g|^$
z1e*_p1`mX14@5Q&L{ATH!4Jh44{!4wipv~IXdg;i97;Vnlny$S!5zwG9m<s*$~PY>
z3?3@Z9x81dDxV&zz>icJkJR{%)URZYG_;R2EsnGv9Nh^z(#9R>WF6_29qBb6=?@+m
z%pMtT9Nj%Vx(7ctVmvnHJ2sIyHq|~hvp6<?aC|@L*aCNKnRRScc5K~zY%_RlJ9})m
zacqBj>;OM;WIS==J8_mdanU|;wK#EmaN-_x@&I?@k#+L0?8LMA<k8@X*X+sTjgu#*
zCr{z0-i)U{e5bxLr+(U}{uZYJ4^9JvPJ?i#!C9vvWv8Ldr(uJq;j^dDHcp?Po<_jW
zFpOuBd}mmhvncJeXp6I$2WPQCXE@whT-I59*;zvK^*H)0Y4$96<1FR$>;?QB&v>57
zcm7i5JWcyN-Qqms!FguTc~%7OJUi?BRoQt?^Lg&zdEV@K{>J(1)AKj*ivq@rLcWW)
zG8aYK7sVDAB@Zr2gD%Q&7v)(O@5(MJnlCB`FRErQ-fvt~pI+3!FA0p7wS1R#GMDw*
zmkkz|jSnuHf-akJmn~VBt!0;O&6n+immRa0A2u#KPcJ{h|8xyrU;u#Q974(oTmiz@
z;{gB)nE>IguLwAtoQ#Z;3PnvtNrR%Ir=?+LpufSy$aaH;gN;?49nQnaF2KVjBFHa!
zOITh?Tt!}5LrGpqMbkxvS64&X;Er1Q9qMdtl#af!nW4@tlNUy&RyL-Fl9s7KR$Bem
z*Nu()3U=uY4h-)dZwxxJIJkH|cCj0BVbgNWdGE%p<DNI{&WU+wIr5OV%~QhgQGTG8
z+t_2_@uy;8KAz(~68C)z6MXq2{P^np#jOI%KL^U&1(o;(W1@n+KZht4gvwyUrJbKu
zPCnDHkB~@=2-=O1n8IkAVWl2nWdpGaQ&9$O(fZ*rYPcBnw3zU{7-j2N1@GARk+CnP
zaVAgV8tvoN{No8<;_o{pYQ-n&y-LLXPSg%f(sxhMolCKKjmOR59Ui6{hNm_sr@hWf
zvz$+JeVlF*mtk3ykx0z2{4dkpJIf+AtGOo2<!jc%g;!qwIW{pl-C4OViFs{}c@OvV
zT*6+vbi5A!_S&!b&7<l!>E8<ipBFwjc>8F&C>&etm0wKwQ5^ohBmh_HlU(YPQQCJ{
z>U#}=&MEI|DbN4@4!is=DycH4sS1<xe!R2#?Mih*YR$8^HT@Me*rS@r&$St=waJ-v
zQSJ2!ef4E)4QW+P!^cgD`OS%I&Dp=2Gk&#X7PP+TZp&D2%NuX6De6e8?f7r{!|Ux2
z`J0`EC!JaEK4#Z^{Myz%vDIBt*^@Wj(^%72xYbvA+V{3@pm=_ub$Rf8!%*q=P)+af
zbkoSY$&u=BBON;<^=)JCkH!eg<6R@4X7@g|e)wG5HQCrdxiL1mxHj4Qd-6m7bld3k
z&;O<ucBcD|razodx9!jL4$XF6%yu8l4Q|hmjD79B_}V|QIJmI5bg(!!{cY#s+vtDa
zM~;3>ep&iNT>5mpJUzQI@%887ub(putJ526>z8XYo9pW*>kEI@=f7{vpKg9%`?bIO
z>-(Qy-&VH1oo+3k@BCcfUH<iZ?fm!V7IEV*abx#j>+)b{|7h><WdF~}!O8jYpYxNe
ztE>MX{wv@wDXR{lpgRgdD`-1JDD1_dxb*ULYTx!JGD&zY4%HS7zCddvu<F(o52x{)
zR@e^Lm5gSIxs2rL)|Zaw%KB|B4%e4`exn+Nys6hvK3SxbCTKU(@NTNis7Nngud(7w
zrDeV6w~@xm*&4^*gq!+JRrB>8Qx$fjP45?)y?>76>o-?_YY#r$`Zn5J^W!51OvYw#
zZ8gywM=NAM)>8X(5YMIm+Mu;=Z8Tfr(f6^|`i;*88i{O%Z4JMs%1tZn$J-jWX9+H&
zuMOL;D^rW#_V@Aj=HEZMqR80qcC_sO97+>%_|(yQxG_<r|K{$8w&U%&`bR%LeP}=Z
zz0{j{#eT1|<NR=Qs?y<e=ZDMF_Q~^{dmlUhULGxP|M>ioTL1;X_?IvcWQ%45g0~#4
z<xaP`6a@^_FGbVcmqjt4++_=*83H#8pEH4mdZ@TFbvWsH|1I@UiF=(bCyJFazKvz^
zW%`*c8!F>M!B@KZlgbP-?;I`1@NhLiVXt8IrNZ=5F}XN_SdgrJ|KXaigy`}rN{T>O
zLs>dH4N#ieKU{y+Kd!?SZT9xpdTz_JTK8C<2GWiE;I_<hN~04i5Q1No8J*6LF;ai?
ztfw0#yOa*0kYsWLk1KOdf(?sc?|+gBY^KwFE(wVhtWZ~(UP@H;?c^|$7XO2uR0iCy
zBuo^66F*}LG&$FQLTGX)6f5W-x>6?>gV9ny>Z%<sAA5V=`wsM;D=N8jjOba#wOrp9
z*}UHNs0MltT4MCpvFg?7XG_HAWl3&VX9PM!gb=+9nn+fxsvt_aezmab{e-4CIVZND
zNRON71sdc@-=o!Sr%VG;a(Sz6Qz_DY7B}ENri`u>q^lH1ef;;t`P$A)%=r#mE6V?A
zr)V#=Zfz$GH=^a=Sr3-{Y>AdsU>?ykD0#bActRQJCp;mUsv729^b47uG!o~ZLtd>P
zw{uTAl|S)?>XGK#5h3r*i@o_jc5g@I$shN`Nl=Y1)T-(ubP`lm5N9zeNr<cLaa1f!
zCq|_KJ3*xg{39(GBI*b%)j^j93z&nq4O><Kb^9Pp&}DrHMvCfs|4|C@a!hpzh1lId
zFD8G+1Dz}PxY0&?_rBMk(Ms)-)M2RD3oZ{GekTWV6`(!%uGn4`Yowr-&_k$r4PQn{
zvV!41xE|%HKVlI1tJ*FZOsd!l)smEduflR8Cnbn=bJ|djAkJ+njQA905Gv8}VCwJb
za;{y?%I!oB^zTsqA+~~(RB|BInMnlsO_hc2+JZndU_kHAH`gU9h@f|vOj@_t#X5-O
zD`ildM5anPTHTut$+8KsvbIH10=2?VJH^=$ov8S`0>5#;3bB~06jfA{p^@r_r_M0~
zr1<OjGy7Sv78|!r=LAW$-QI%sG9?_{ME}SeBk@MXx<Ob?n3Sa@=e5c|?mGUv)T%cj
zH+%m~_URneSn7^}KOsRB$~u&g{VvBM76kU$bZrDiBU)8Vt6j`YG|2dHa9TP`A&`^`
z!ZXH<IVtQ7CfQG09=5?4p$l!75}@IzI26>iDMr`_-31~cb05aK7xY3gUl-53f|OBl
zNo=``&J2I|Nm1mYPd&M(>i7{@tECFR&mC@}%d!e{t%8{iRc=2#?<kOd+M{qEg<;$y
z)kwdf@N>m(65bgqBzxoRuGnIvMQgOWISpiYYn_t>az%9$d+=t>m=^wbUmG>FM*(t<
z<Rd%Ki?sc0PMO=Uj3U8;<7px7tcWFF_?S8}E$51PaXgmrB2iT6#!)=H`s98~q`Chi
zZ-YBiT|T5h<j=x?ahuA)G1!_f<GBHq-Ls-wWaJ56!9LL*+}sI;E`>!9l>+Tr%7zyz
z!?a|KF@sFGzo_I4U*KupUaxC7b<~26s+LFw@kZ#nZPKCCZAUf)zDyG+MCZ<T!7)u*
zZO^0cp)`85f0*&$lP`*jti9NEl7CToaEq$$a`R)_=#)N=&=9UyQv}H~;BvzS?4j>H
zjMQxS>2yBju7D=2Pb0hSNpy@0*B((^q*^myExq*ZWy)Huwr-KBI(S0yGLrcuvXVyU
zNvNAvrSFHR6dm;28<%t_r=LEgvJGP#fB8|9XhZ>rq$fLvGY2AkQbvnDv$D{zY8lCg
zzba3plj4tL-kOoaE(uaayo{{sB17-LM%MFmVLMwEgbaAVSv)|d%-=$!ZD6x0Q+nF%
zkLy&RFbj0<nJH;!7YFjd{B>Ajbh;~AbFt!tP<iczZu($mt?f)c+!9M3C>AY~x8-+y
zILKpJ&MmP@$#qmfrxtpWdM{foxutGStwG)u$;i#d$EAa(=y8o%>cvgQyiJ3PuVKwX
zTy2!&@=x~H5<i@ceGSnlL^MPPYdT+%Isn=-Gl~TqV}^Vw$*<ExM`+34o_{t^Si@vu
zIt;@jkq(HcTNC@RG3b!F%6uPH;GGzSAKYvUpoUVv20aodr<?BHd6-zS#D{TTtI57K
zR9L)EzY89M?xWly^~A_XUx<IH`qWq*c>rZR`#LMZzZi9(n&9<`X14uqQ(YLR7ktfW
zej??>ILEHwf&S&!IrkH>rt#e;RK0QYl+7)JhI_ubmy4Tso7-l`_uP*)hUn+v9TYTc
zfeSYZ+>H*j-WH1{baZ!6-ekTriA@Q8wEB(VRnXnFabgrYkCXiA*#|zhjKwD_{w%Mw
zKJsxs#bPi$p-PE@blOnw2d)V4mDG^fW)8~duWSk!DWR6ePu+~vS*QElYTRbrtVpos
z?8HPd_m%r#xivP27I0{U;X4a*m%%ria8|*<hG{qOO{HsA_Sp5R6uAq-IYTr{<9{zS
zQq^C~%pej`Z`EU3!qJ;^nucx!(lq8iUAp+o#qB5F`Iq_p`pt2Ime=ZU?%GYzBr}(C
zx0<YQH>1809jg&ReB^wE%z4_eCX<N#FtbD(U1}GlKAurA(#3d**4jfeZE<89qJj)d
zR7$C1X@ny^%w$oDt`pUby-`RW9fHb{r9wm(TSokbNtC@ZK5Jc)JgB5Hjo8hz$)=KV
ziSK3{TGfe?Whdx6l3dB#b3_69{5L{qXMW5+r3E7)H*K%5X+ND}Z#n+id*iXQe5n-u
z>)jW2VYJXZTG?An_M5jI7JUb_?{f(Pm8D6#<0*KiovkNj04&rxKuHvh5JfAeXo<d;
zxbt7V1kqnqDq8UoAA&~}84yJ|YYMI>Mt1qiDA1CM^n{ZQiKwpzqaBr{(BObH1@Srg
zLtj!%(Ji(?k*))<yHTJDI`p+huu;!*Gk)5ije@Q9kXsurOL$%Kl7N4XdX!(D9&zd_
zf^~MHs76dsq?<ly8Sh+g*DO56pn9bBBzedL=Z3G+x`x6ypm<iNu_CEtX@TXJuxRd8
z`%6SVo#4b@y;a8qOE@f9PH8B}Zc^QX3Uz{nHaO)LY2p<i*T22&7qRhrma!}9&?GVa
z*Mo?VC;@Y(M8QbedLnY-K;DuUoNvMhHwIS#l-zS_e^0=<7)sL?$gVFbye?L{2=i|V
zq?s1L#EbK9xnoO0p#aE*Xi$Y`s}GBXhT!436XZ%QQkuPdt}$_s`1sV}pclcyOZ+Jm
z4Z>0Z@vk<+2Y9Sn{v-c~dXWnVrS}SzY=(EKQ)M+kmb2kfW?<5Ix4JVtuNtp|qtNA2
zD5NkEi1S;nx1!|HuRBEYU_eP-Y7<?cAgI8YEJ~&q#79fYzXS?F`L-Rxs7#XsgX#ZX
zErIyah|oT@SuQX!2IP|tf71mTT>+_*^87_bQ(&>IbUYJAGG#8do!&~C57Yml_;WEr
zCqp73MdE0@-d%Mn9s*dyD*Xxps^G+b4@z**5PGozN<WP16oV)fc%xoragaPUTOvCH
z?DCyq!vre#c$6$WC|w;{80AIYpKV7HlEx!6tHCRdR=7kv>8lC^=*qXPkVRlQ5~6*3
zO!))qg_(S_vULUOCpgvSGC?F%6B4!%x6B3&WLB%iL22f{u1u&Jo?KQT;-xY@FOMi%
zAv7e9r(4L*S4N$bV%67<h6AiYfQULi44?G5DPRoU_vY#~A}#cW37{6QLL_~rf)?Vl
z=&0Rs@p(JUG!uX~V<aUZm}%B8emCSza_#Ha-PW7&Z~mRX0ayyIwaXCef-!M4YqSvw
zh+@1{u<B3%<g84HGA^Q3$Yw&jJh(B}N}cksfNcwf@T6>VH~Lf{vkoW$E9CS@P>3TX
zttX`vJvz&g62{4Leuuhvf^$ZfTHNu?GoK>9N%ET)g~KH1b?;)GoMOGUVuNeFa%geZ
z5@q{2Geb}WjWJk3o?1hX(L9vqg?90*Q}I3dQdjFzZKN!74zuFmTNOrXOJq=pBTQ36
zHkAl{iWZ7PNtyu^^90gP40L^p!W1X)?4ry$nkvh&%ukT<(bbk8ijmX|6}gEIWc?|Y
zDkyZ@EXlf&DhUIvga>w_108c%-K{H1D~kKFO0%hh8TL!%c)(aOG9L6(1q`&40B$t}
zbH0*#-3qR8R6ANClfw9XxTqYSpqhF`rcof}*Ihx^jnELIXr17fLMsrBKv??sQxzfu
zjgWUo&?fn+w-yR35)}i~q#~Y_U4-gu9riq)qRhJDQ&%-Hw7Bm<Ue5CK_wvFk2c&Wr
z0c#a85Gkcjj0tj$%F;1UL$wN?OXxKMH61|51Q{=o5y#DLo%lf5ZQmqEO=7=HLQn0|
zNr{}4g)o00wQS_NC+nRpOATV3_65`dRioQRdiM$mzm*7*PAm=~IA;08fF>zubx{*t
z0dDRNy>F4Kx=0!>L{n5H#QYW>Cum(yh#wT8X?KZ{s`Vjhn8(N5nw3&kKn-I!@=aff
z0(LK5oBY8d+ZYvt_S=4zI3XKW5i*e8MYUvN@sW6`Hlbd3i&DR!B26u^X_KtW^r^Ti
zRq@2L53<7dzVL6Vs;UP_)cvfGi)u92ugcjbQ=F2qy<~_DOJtHmMWmtpJfoRnCEnRc
zXv4Hzrtd5nrTN=5_xd#Jv{8uPKx(&9I059AMCd;kSQi<*H>~&_fph^NABT`nIa0nO
zLbU<7?nSdcOHp(HGfjv%N&(g0EG2mr6m-t7s9*{n$6O<;1E!){O&83OHlV1fP6r}#
z$Wu7af^i|&ltC9&mWT>Di&D8CsB-dANl+@%IkU>yCReq6#-qI_vRx+!nHp3)g;JV8
z!g&P2aRuF<FrX7pSOxyMiWrWk3sEChq~rNPAE{*XmGQnO>Tu>mjg|Tm@Q||B?Sh%w
zI)>^m-o<*qXI~oi>^zIVUeHAWWyV=`?~WT}vWGJ12A>yYN=dP)b~nt8GL8u4xj?R?
zTyFm9*8bY8-Nso^P%KzgoHE3C+%y28cKZ}vgPi>E7tJ9~pz1BC6-h0!M1zS|bY6<6
zh()z8ZPX*fpfM{aeIro#)x;afGMR96^u4^B+VcIn*8S^7-P$?*4#ID(Z9&>20ZxB9
z=<?w9brb^RE!r2zJq#t@i*X76iU**)2D6*<j5e^2CV7v3!;c>J=)=1`8mB1c#bk>e
zVNb>0h)z<41klykj@IvtH7nk38yf{yMsMuDrctA^Vj2FAq+7>xI6JA|dZ)Yo|42lN
zBM`FDuUNRNe+r=3ZKL4FBg^uNJ9<Pyod)Ulk(b-3RABH~;b+?J&+n(H<;KR>mdCY`
z!omcK760O-f_@BEPn*Te$q}YK0uR#axVBEzF#3Q|kbfV}cxIG9SzAu!GZAR~A6?{s
zh-BWNOa2Mf(wkRaBf9cadTkW4k16LJr+$-DXb|c-zcFqTd`gX{Z#}zzN1o#D3b*8L
zcbL#yL&MMO-b!5g)0X3``oziowkhM};u>^V1htA;Z6W1y-z~KnbEntt`Cqz76iE({
zJV^OpVs8a2WPXVi{z4T2zNEj<XmLEHw;{LSWYFVhbf9n4s`AwK&D3(%v9VSYE~`ay
zsdK`$a~%5-&~8B<l+}~*8y#RYxpfheg(C!pt`IM57eLp6=RmH7Fg0mTjx@;rQ-kjR
zZcdiaMke2kY=w0%7z)$1jMKE`&kI<f1kUG4v6PKD<R0Uw1|<~kF`dphb@JCzN;Rq)
zBk-n?_rEKA8J1Ay?^*VHs|+J31s(Fu-gaMo|83FE8;gV!WXZ)Vg<?X#OBjC>^7%$f
z9pqewOfT{`z<n2=v9~0?0HrRDd}9wif`(wmNcRJr%I@^<xWM*YLK_3@_yWwbOb^Bb
z9D3iqzM%gkNS#XnH#I{hN-C4^Qqd19Tdb=X%*=}cinFbXThA-&y;lUjQ*_H$fvBnS
z^PTq5KUEj$dDy7w7t!J{$`p7=!rR~^KE+b(4`k=kCC6P2`Rd|RSZAAfxI~rtuaE+q
zVpdRjF*q~<Qr#1}DpNSaT3ACzvIsH;LoORh6v*VcI7k)laNBJ3ij#$Ww~Tpb%+yS}
zb>+JhmO=n_X}mjW=x;>aZ6bA2g(fS9u@(n}v0!Ytl>cr}U7dn0y#uBE)+{O6bMd}M
z4<eA%qyp`C8vf(oL}K0-TTpq}KSpR#mMeGzLRjxQWv6)-k_K0)21qUG@$o_oTchB4
zLuhrYk!w^C=_Y8o0YuX1Z*R%OhggTg!_glL7ifB3)7X<Wfx8ixguC$D6j5BtW_TMK
zb)irmp<!aWcUOb8%U0PQn?skr?Pd(TyNgGRe2pdLk$;3ZGww^u`qWv|&_7k>+lwr>
z+u|O{LY%JYm*2c`AiCilO7m72bZ>t`;BObm{b$9eXsXOaan?7cUq!FeyhP0vm|{tp
zmgWsjQTwfuu)Sv;lDnPiQ<x<AKy;r+5^G<;zk)H+z4^=UY#K!9CPtBII1#}?Y*@jz
z#Y4@|9RHOoG^K5m-jfqYw<{O^xRHA8r{kSlu+R85t=0P0rj3F&@5h=6ihJ14`vIap
zHJzYH=o1G^q7aJ01eBtAdj5D?AoU}?z<j+bbbWXaXi<OZ{8AVYK*xim5nB9%pe8V!
z2mRczhW!~=9@8%cQV!x@1W1ACj)Tey18~xNmO`Y~-sOU%J0ODy`rB0}UR3U+sl8`i
zLj)U?rhB&FU;6N0Sr`Fb{Ryf+XDBml)*$=EHpx@0ZZ-{vU-wh$&sQI4UQp8bj&VHt
z!T93`O-%TZF%8f358+P_?R;<Vv676rqsRJoxOeLqiBz<69smA3MafX1{y`|YEhm=L
zqEhWST<0d1HR7mw?iTBy-qa*83$0AeP5#uzb7-Y-Tm84Hn=W8p?K=P8ntt|ew@-Pk
zl%x77k^wypty3HK3e;jKd90^5jf-_NMBTnl|1vE%F1cG`{bkF%%Bs;stJ!tiBEhaZ
zg~w)Q$ExAsmujijr%X2WPnJKG*v#(Pb%Y#0>1&zY()t()rQ)@nBj}>U|J(*mGWAsk
zr>F(TaLKVr4txI*N!|HPA6KQ6hW)pbovOl|LN5_WZYAzEntj8C{wg`WVRh==jhf7z
zueZGhvu?8U+Ap5@tR#=GrG^i`TIE>p)Cs)bw$JFN!JV6%{Kw^|{>#Jcsr=xO!;O@p
zdqK9(T251z`qM0)eXsS~{O_F&?#GX-2%yH~6Dx>JlBf!yl_a!R_OVbvpj_!<YOqS*
z326l1v{4Tdd_>ehY2-cZqR_WRNmi|fPG~Za?RX2)-}b8QXVhxgzr*U6rvqblm#n?>
z4zQUVq=}5y(_xNZoY1+MtBFkM%uDwb;E`eN5&HT>&oh3rB9AyCoU!uX=&jnk1A`(R
z5)v}=34gzGodGV19+|(d{CZ@5rxWffM_{#UmBBY}Yba6tSxLUC5>?!y*g+~0jjHIR
z5{$LkwaknR>~i|aBV*&aN1kx1@tK-vaMqgezDd|GH#OFptT0dZ{4!~#-)PRIruppw
z?KI39^oHXJedb%M<ElmhZY!P!lRf+Qf>u`7ZcLV*Dx5J;iHm(W%lIFw4YG*9@<7|z
zgb#<7rJkmlR*d;2dfz<ec~Ew~+al#RBu=Qy-{dwl%zn2}4Oz?3oANW2dyp-4W)MwZ
zdg>7NsOxR)Gg<mo8WVJ^Y~wAO*N0@+%^Fya=D6Y(y~jyv;ZKEp5-Zo2Hzeoz)6LyO
z?q+GQS-HGs|GLre`YM_4<+oKc@s5F&dBK??SDRM`>n~>#9$ppYJ!u#zS2L3LsBZsG
zmZKw^=H*p4Dt+nIFvWXA;l%?@>&GoWGsB*=Z8u#$8B99af823-a{06i{N}euH<^V^
ztjzbg`R&@1$=Ra!%zTL+y+ZeF+H>{)aMIO^oc{5f_{GNgk^>>VpK*(Gp2L5}Cg?-$
zr2YfyfG-Zswy`?gR|)CUb^AK8R<NE8k;sD~yVLRlY6YsPwG76G%ttAxU!wWV|3Y_Y
z^Y(sG%vUOh5qoR=FDv<u?8BAvTe&@%Iko>)u!R2}dgjq5^6%_4f5jm1h%Dev`(QX}
z;N$Hd$Nwx;Z^=bHgA`8$pyED&mGL^rMG7$WYW9Jyk?xhg!PURF;td+Zx1RU3_Z5~d
zzi<j)ChODCl!mB5J^aCx-T+Q@b3cKl0DSZB5SU9kGG=Mb$#kl#r(BVr?(MNoRFL%>
zxifq#$WC2e+~YgVd}Fei<)rpi?<bxLodS!b4KfWv0mJWTEs3VM#C0Mkwuk?wc&Sg+
z*X|$G0V|YoJ1*DC+kQ&y#tZ6;B6f?Bev}#Y3mPwHS{@^73Zt$#o^mW(XStd<q%Qtu
zx+AIn<{dUYB2;P@3^7}pq!D)?e51*W@vSlmeaqP2CtH+M#ce9BuBOjWvf(b8$Rm2w
zP2V9?CyVW83AsD-80oV+utW_vgE10l+!z)Lvg%<6U&$rWcx;nZoE54Px++;#KQSKM
z!16#%K1QyR=<{IUhzYfrdzx=k#`8!gi*W`{AcFseBCqn77D$Ai&NHpB1tqXN*8||F
zfRx3<`M_u*CdWhmu$WJOkp#+>{gVT`WY$t8@KN7L4IN9T*}T*RR~>nZUSmbb|K>x{
zRTV-0b*W2>s!b+zu2P`!&YJrEq=K=y1Z5u2?$W~qVt7rt{^K>{w2^7jm<<y-w_#=Z
zLKr{rlcT<zL>aQr6bbo{QM?Q8Vn#wyx8m|jKm?%=#ZuCFJYpY+dS~#^(=^W{gXi5Z
zJ~O2m)A9=AcLq{+4&cNB1X~jUmptJIlvrG4dUvy02OyO1KY&TF*1&kmBhigfF+9S3
z<Y<01rk;xbQZrSHzx$IQ-Meu=3jsEX_rG{VN#?V&6KmU#saZlU7ii8IT6!NdKCxJ#
z6gA-HgGb_2h?7*z*|hAV$wU6h3UuFSEZPyE^}rAM1$)o4nyK1FweC-nrV=U1#5eDU
zK)FTs)uk9DH)CRH^a?~)o9UoiTF;wRlhq&gz?HF@&rg?%Ojwy(5{#lH><i-0_A)#6
zlH+bx-G2GpHL8uSR4<T=)yP#7xc2_6iRVT|0_54MIdNTJ07b@GqSg&dPy_02bFpip
zNhpcb6v4IvEM1lw;_g{cdB+qc;0jG*b0%iSH?|zR1I{sGNW$f^8hEQ>NKoI6oX5KX
zdd70PTf8q*X(5iB{Y!%)2R<cjBp7D>p|LUXgR7iWS1sGt@_VHRYOj6bl;Hy-p`~l2
z5W)}eLuaxu{#rR?2Tqs)F$QO;$CFKyGyll`_)tefpi8Yljuyd;$3U{iC&^56U8W%*
z9A}dw8B0yb^cw~#Zo27p%VM>u^@0JmCX5GY9z_07H8#@r+b_@uxlh!{Mma3Wj>&X0
z9U)eeWx^}v{>PmE!h%)d;gyjf$(#w2HNOH<6Vj0!g<DZ<&CEY+qrq-PARrh+0!&bN
zkJ*rr6sSsY-*g9=e^tGDXmk)aX$t}P3rGOG51bN@q4dYV)`4CU2nGWZ00E^ls*t>V
zfP@tdgz(~X$mqxbu~(`$F<tL(s)7Na3%GW|1|iwNASJc+Ymn=(l<HI1;sUGWnH+?(
za|g8By^P8_o48?wM&xy|q7Wny;F|WjD9eOqlpB_E0!Xe=;w+n@QV@U`$W_0%bpof8
z9t&(EDD3J-Lja5+TEmZd0P(s0x~~%eGW@CvqLK!R*~oz|8(JW{r6QHX5hmLOS2k*u
zOTg@dq*TF>EoffZcfb=<)DIO8iIgnB+>?n~ZoV7b@cG~Q#RUN12~a>CpX|Qbaw86R
zB~!Ccc1UTU`~`;XSQYr~U#|aciy`>WfC~G?B-c-Xp~WYk-jkBl%yI9ZZF}o@A*`k5
zM(4tVlAVWkXh`&uDvhIRq+kIi!Zc^>3<|6@13rFv*R*d>=}6J1=={nWCXC9LDa@Y>
zx&Le={Fo%f2#R3YkKjl-O@-TE9w~YP7^XQ;d(p?gCIBdo#8O}SGi`lbV#|O8&b=tI
zj0<0W*>R&?Rg1q13<3NmR7JN{SWv)$sX`E`N}OekIkCGP-+ogVoxdOja_Rt2DuR4q
z^a#w^jgE7Ty4oo~h*gZjLk03nWwck3c+usB2KvDm1VNo*6Z3>$4yvhk1-lmY$*Msf
zN`NL6)Agf3k+RuEjr|G)M=?oY6EHND2EV$+!rwQd-%T%xgBvM#nKtzcX$WcdqKG}n
zO-!FW$t_{^`&-J&k?>1Wq|^jIM->_8wB|mugpC9q9*hCk0$?=$aREk?PVsiGI#x&;
ztk!~(L{Sg`$hiuO5WtQCfKeC_jD-k%09kcV0vN|Ql$>TOr`VlqnhguO#Y|IHe-sv7
z+3{rxZ!d{r*8xD2vUj*qZW4D~CGoVuT7Hgqma&*|iGIVK?$Aga2R<^K1R0)PXPnf&
zUo^-=19V+~Zx`3tdvqyvbvXuOp_?CWDUjH7^+O@Rl@=l9#v>S{9OH<H{UZ*y;m08O
zp{_;{%|jA!wvNKl$Mo<!pAuWKI{<hh+G{Qfn?wR5Kz-6Mwby$qju?A>D8dMcNE?<U
z#Js78dWvCE%^)xjIUOR&L;Vhr53nT!eQAnHHydWj`yc|e`$@vp(sgqhbp0k;ICY}H
zXrQjW#8lx<WIET~sx%pov;rVj?@Zf-eCT>|kZ;q(Nss|lG56AxuA_!t_G1AUa3F8V
zz8o;IG=Lk)8G2)~X#uDPj8VS@q$c}GQVE#re{v=V$YQv-P}zyClHB+h1Fab_1}FzK
zAH{}%F(4x`LxNmr<t@WG0|0}$vNMH{#L49)qQ;Zt&Wd1+To_4@ZiI*C=NseM5{6!v
zawK!0ZQ4;d@S#((s5Lx|l_t(>Gd3~~r|(#rDI5J@LLam9NfJpy!VgLymyXbHvQ+J1
z_!V;@iE>5BfJkBbkElK8v`C#=DIQ)+_i^rMqfdUru0l}w&A#&_6d;AS$EcDrPk>2b
z<mM1kGyn_u48OQ5NzD_n33CA6Ms|T5Ls+vgAV#;(jr>~F0k5AJbyMV_ZY7pmVxnoi
zJAM3MGyp)#)XAcSrqQBhK8tKd$EY0O*oin9^t~(sOaVXHS}@5K@Y-bVGlE+5%|Rq+
z6H~?A@VE<nwP<q1-Kd@HW8$!nd*&a17ojffMkZoz3PIjdl;TqQHU-lAPv#d)@C@XS
zf&`<XcT^$SOCZIHDdshO6{(`j1T&EwGre7Q)m>V(Y|>R<GliIGeYY$nBLHRu9CP7O
zju;cIwtpdjIaH66V-)WEk(387i8hDw>##3N-=-Vo!~;e8{r0jXh~Q6-b5VTW6Oz|~
zV6F+7z+96$S)5FnOJX{X%o<xvA12p=WPwn>kKpTs>Cwf@TD7AKKv0<UX%xg;8|;JG
z4o5@9Fp^R@J~7~F2Ea23khHXb{cgVo1H1Lmr{(}TralJTVUGq#;wC^ovaf80AG@Vq
z8SGLG3dARxlalq$ctO9!2hc6MYT2{Sf=En{Ud^Jk@L=y*kd;(O$t=Q3=h<;8yAtp+
zD*DN;iH<D6J^eaXqwm_tj_Heoz2`tAa27NMB=+BnWPHMLiWfdolQUk%qb6+=9<e%C
zKXG5LBz8(4fXPOBiOGvZMekPKaz#YK95Ha&FL)*V8!ijK&8b!j5~vOUm8}yA#z<~r
zAi;np8H`K^1HlYAP5?b?3zADV9bo{6#=P2C4=fls--*fCg^p=`HHX-mJp)XIuy9!d
zpCbSvT0yNANv1K9I>2!e?4uz-Q82{kZ65Hx#&Y5|3~%}BW(OQ?dj)qi2gO6d*{#Kw
zW1!_>rp@XYS^!bs`u2le&tuGp1e_fKh<I63gjk<p!1m1XNm}s_h~W2zWYx)L)M2vW
zb|Zt)hP?~&uj*w)!WU9AZ1kaqU>$%UfkQbugehRWRAIS~EJ#!b>{T({kX8hyb;Sz+
zEr}1=-446)y*3Q<oC1SPi9tGAlAz_HY3IExtz2az0WkpF`5mlVS6MFuDwvH)bA$qf
z5H29G$YPlu197x`xnKvf8cDqFz8m8IDj8nS1>iuF2nqu_!-zU9)e6Nd7tcZv0Hnof
zR{{^QwB8xF_k2dXcQfvdv2i3Cdc7TQ!4!+Xh`xGuJ^2l-X5LDagyEzZ5awON?NtbW
z8&dw-gjwI3gJaV_jlEAMAjjis<a7YV(lDYR)<g_*Mh~Py4O`7o(71bEQG~y4ik><a
zC0r)jT)-J^ZAe3mlF^b}pR-@^k|`yIb`vJXq`*!9N*V#OI6JQ*$CsnA%ik0Rc4BP*
z)lu9XsJxUbr312EFkS$hF)>ofXqK|rqB2dM!b{F?VmXM_z9IQOcwcqabsRw%`GuUs
zM+s2y!YoUT)BTfQF<%8g99S81F8j9f57nQr=^S|mQm)_@_!em)7Ntmp%c_z*mj;Ie
zkt}D?JVs^?XP^S+O{}s<#8MOs8hRzWS)Q<j^;aO3a-ywJt>l=S-roAD^aUWhdp+%m
zEfM}o@LNFw%TU)<Uw_vYo_Sv_ltz0CEwTA;zBY9jsJ7RF5Z0f;V`L(YgNd!d?N_g>
z-Tl{t8CodBnVZ?}u#hN}f?O`KXhgQ^BYXc{5`sKEmn<Ar`#slU)O<Fh(P?JYmFW9@
zA_E_2XxiN<^MVUi{{aBafqdOD&p$YXQpkhx_K?&M1O5-7liyo`*wqn4C<BigI)(=o
zJyc#OyZ<0{E7q3DL;q{^6YA&~SmanN*qHN`VSz`27+kbPEd4C45+50`<nkh5gR^Bh
z`sW%90V843CBXwUrQ25^k5z46e2d7ujsjl95eU=3IL`g}{s;rif$@ooaBtwg?L6Y9
zCsb@JAm1H0yB+P~ndzohuH3k+<a}RKwkq)n9B&DZY?VAS)*%4ev7-+uF|h1aGjdPD
zBjD(Xf#-cGT>Vmr0qV~O1(zH4j-#<u1Sj8<u_+;IPg#=0_FeG#Bs=d88TP@dC6sIE
zYka{*01#=2hMF+NI%V@l3`IRJeXyaPI>~_e#1I$R$t^Jy`^uX9KhbM-cD&)Q^m`m}
z@^=%0y-D_yqD|$EjSKnk_ov)jta2|$zIHz5%fx_X0Z$KD?%{5B=7KU5mytAfVY(M2
z41fz@HJ@a!-VSu>rzst4$nH>fyYUWMGJOi^b1<y@TqbJzx}!~T3Ifu>eA$6|vB}5!
zJw4l-&$#R@aH;#d`)JIy(X80ru)N0WOb_gF-w$;gvmNtA5{_@zAznl+^K3W*3WnJh
zTA16S&FeuFz;P3imLzrftM}tq8+%&G(%o?HICB4NC`y%%{)JD3hfhTCK7H1H<X)^3
z5P4(JXIeDgRt;zOi$2mZ`ja)%!4mt-5^g?+;}Lu7K$_{UcObGG0~lc>B(D!k)W@dB
zi)^+$iH>Iqqt62{g3`D*3%7$Sf3#9yAY$T)`cZ%X+7No>l=(17rbSS;I|z+|#bN%l
zTfh34B3Hx!{Jjrx1r%UtOm^-g#wkUxrEaAu@QK3jXTWXPCV+erFwJ^2AN5oVP(a{;
zfaDl<DWEp3)m{f2ptK5}=!xlT8^1B|<Z`0;K3?WWBWo3g34eb3))z{TNHVmEuk<hH
z+*!V^wrc~Y+aIO<oBYXSyqW-*3ITSSijd_eVPMKA&mdu3%9#8bN!Z`8hMyR=q}Mn{
zJ}(H<bV^|vihB1SV(Q6BYD=cqJVPZksALoNg(XAL^8Hg%M(&8+(#Nr(3)?8McDSnI
zJUKuy5uG80;Y48oKx~=SK4=$1&j4^J<AuTP`LhnM(w1q>^hcY`Nu+_}sog73ft{$t
z6GFX)-Ywe(X`E%YYrvZLH<-e#KLE1ShQ?q(ORb!DQ73^<Q$?=}lUzjpLZ}2lrZYR|
z_ZMt*JMQC;`i{NlO285iiZKx|yc}8XXi=Qn1zOtR69&%0c-`;dpWh#~LgOqEpfj-t
zM08Iyl2P1ilgQB*N5f~Li2y}^Ok$Do-Pzpd8p3mGzZ8BbUUc&zpZ35)+*3E5aPhy-
zoFMf@a-uU&GI!kFe++Oa;%L6KJk^zs_)9o*u|5)*E;lKo`Cz#(I8$Za>?@Tea{rwd
zReenVme)|vlO{c52__Kcg*&plf2(BTzHlupY(7Rugh8XjDz$c;<%&$K$8w17B?YY3
zN}!K2j0eD=AxmC4bQz!^F(z(Bg+F&ryq>&(f&oGQ$GaC&J2=L7|5e*9++<v6s2{dG
z_&GRQCKohQ9a%D<Eb-62cCNU+>6N}2krd0fN%L;wYqMX(6DjF4;>zIDZ<&HC3!JO7
z_3SUIu%5@1;|`C}T|n~5#cA*BZ+}%VECF?T7_9*CXR}_V<`;(0J74bI!OF^V#L&AR
z-Hc%NY$?>3kEWSqpxWu?i09$eOy+D#I(E{+dpPIB-_G286VvboWgBGMVCE8oJUHXR
zt05oWh!tlEaeeejIFdWfP`S7`%~)LbCtl-~F_u}^=QN4koZ(7#QCcC?swmqfC!|zG
zORtqT_i@`fZ=TNyjygx^!`sD(Kt)r&Ah~lj{l`llR%?90Dcrrn;esryH0TaazG9x&
z^a3T@hSmb5wjV$}G>MrI?ZAKjw50N%`_ppE+N}KIs6D3#5bTR3;Ay>FCP9-|@3vT$
zZlG;n3J_K&8HH=t^8W{UK!(3pEV2*f0YW6ZhV%n8NiBhoP`a(siL<or1B@R=*fUZx
za8M!PCBtL{j!mR|@x?3ttdoZs=#=VDGiLCCU>>uWF%1^;inLEZ5OTDS8mkCAk}78W
zpd5o(B<c@3f-C_CKHb0p2RItxbIBKPOq0zfzF^T{wj~d>=@-eW|GbrlE4#en%P|k(
zsL36fQ9~r_eBsXy&vD^S%~b7!<460HKngVNzEVR*a3Io53CSd5t{F1))@e2+yuyf3
zAW&iT5}}5)3KV4<aW>j$>o^i0HIM>_a$jKKOAX2RLj@e!yn+usbla`e5KH7Tgetz2
zu)`}Z{2esoEM4?#%#k|;rR0@UUU{*bf{<(DOEsn2Gj=o{U~j%?gs9Q*fCIuCgTktj
zAZ~90!ag9NL&YbNG&>YNTy#Qo(I7zMkFB)}Ldp^nR!s`6{tWT=FeO0vMd2*8ghjif
zYyZ)vGB|@d_~DB`ex@?eyglsL>E_3t=x>KlBr@y(6e%@q|FSd0aA27cBY9|KM%YL}
z3Vf8HDcQKh?s#Gj;DID-{4>KkK(Gk`n#&)m_yG&F^t_BnCnJROMW<+@3ipvPBfXLV
z<jD83OQ{f9ENo$%G#5gX9ZVyftBpONP(o9csvj&cS3g_;0=t3ZCE1{zKS)6Ze*i@l
z$ni%u`cXhE958{}!3PMsF$@qWM+PIrN5+PCHwiiKZ@!QLJ{SRl!iA7}J9J+>dIf?n
z<lz<0xFa6(sK-6>v5$WIBOn7Q$UzdakcK=YFfMV(MKZFHj(j8}ADPHVQnHekyyPP}
zc99vD41^s))ON1*M%#3w1~ur7Mk2v93(DY>WQ@lt|51P-IIzG4Lm;35FL8<gEUN~5
zP!4Zo-~#9Tpp`qwnDa`o#D2^S3rl!~Cux$sQEpFj7r7=jv#HH(a<iM>{3bZVDb8_{
zvz+EUCpy!q&ULc0o$h=mJmV?Pd4_YECX41qZb+M-QPVc~XrA-z$+>tOY##uf5ChB9
z4+drgLHOv03>MeV62{{dkywJ&GOE#ya<ro!{U}I5%7TlaAfzI_2n$TA(v`Bbr5`PU
zOJgcik6tsSGtKBoK>*X6^0cQQ-KkH58q%8jG^aonDpEcA1}j!6WM9a}7fctANOUYI
z`;b`PKqxYsSPWws0ohhFf)031gDBQ;)kL3j|Fc`YkrXn(f(+o0*10N5b9unZ%!Ef*
zAjJ^`DBOw+_e!P{rVuNE6>M!V+9)%8VIMn~+YS=71S~*971J;r;#@F{zSS)wm`z+V
z_8|j7%%TJbJ;@<}fmo_cL!Tw=M>ZI`+SyhJ8W%weMe-^}?V*E{XX>jA?rPXg^47Oz
z0<Lhca#-3*C2Sm<1{G$(f{ZL-7OQKXFRa&;>}}8=*}Wb#LGTH;R`4c%kS%l5tKRjF
z$+jTCZA5hIzI~LJPm#Dtawn2krUs3^p1Lmx@+*=3vKJ~yxx^;2F)lns_K4VR;|R;>
zSqQ5_1_C4nGH;@WZ4|h}9{zBJ;$gla|9tNu@^v3ROy?>0!Z*Gb+3o03oGKRQ_QfC`
z%7GIc-5UvlW+)H@P*MzG51J9e=qN$P(BayVbOKN}elnD!92F7!wZsgW*%Dy9y>&Qc
z#pd&#i}i{=F6#;!U$(MCPAp}UPyu8*#>Wo0XohB)xdbSHW*fPyOz-A7i7Bl?Gluev
zL#(;bhCcL1;?XEDD`dHdHr1CO)esqK`O#CMvJ5265K3G6CJ8MHdP{PuPLsOS9R_Y;
z&EaSg_SRXb-ZXJb*y>%qdLgSe^{${0YFzWW*Ayk}L2f<Y`lbrGjgEB*{p;!z3Ru<1
z_O-73pb}_PyV`IBwy;sG;%osp|G!_j2!GKh<C1k7A>U?}wRN=$0;Rj%?k4wbpZ!KM
zn@n@KRr3z%T{3$c1mEvQlQp{Z?|~B>O#l{i!Joon^C3LpJXyGn9d0Ik=uqMozqo@o
zWlw6(x@J`7RHbEYTvszZ%NQRMKTodmm77}GL5rgd=IU~fzai!<A5tY$d-I+1Jj&x{
z+>%N7^OyHLNVKR#(UY!p_3C@+AZfbOJ8cfMM!o7*zdF{l4y1}}z3X02RmZy?_OC}-
z4dx&_+S6X8nQNWxYX5L0oLrzA^%EXFdpq8RzU{6LJ?|X`2GR?3r7VpS9z&49PyDWU
z#z8&njbD6vag%Yj?(hu}|Asu~Gp~89>$*Uo%E&q-nvHI3uLh-B$0ja8t87F<Y@2`m
zkH(&L*~4D2ejpBjpp}hmyn&3~b(r>QC#qziD|@Qg2Np71`{g^x?O1m{^V7O+!Q%{y
zzE9%AMkj+G0Feq}g2xi0FMa^^J?rHke?O%m@Cjw(`lQG{`pf_hf#Kr|K}SFSpYr&t
z?|)1+#8v)*1jSKEJix&aK*KEfLN`#s7x;_zY=UuYLIRq>5FB6tULXeU3OLx@NGweT
zcEs9P$R+HW_Ke^MW=lVu)>GUcg&5RIxS)g3o>Tx#QLx}_$)J~Pph?)E_#Hy~oFEW>
z5({)0RCu6Nz+X}D|3(Qo2S^~{8^~4j5!+OlfeRGS$*fXFG=rGzK*&9Z7J3Qv4N16Q
zR7Q{j7Hk4g>_a3_0pT$M9PE-tgo_zS2qU!LQ$=4q938eeND9873Nj812H}{@0ue$5
z50V53kl;zc0TX^iB5p(=2FUqIMLbyHP?X6MY#SE_NG5v8BnnA(F~TRrT>XR<*Gxk$
zgb~+hL@16T&-_>(RLk-K0~Z)U;E}`^MuiLvVMsV36qZb(bc7N%q96_lA#Q{jqM>KO
zjZI|3C*;Bx$W<K*!X3IH9QwmF-k}AVff-yLNbJMvWCJ?9#48MgbbLY?a^o!Q1IBRU
zOGM1X1P3D`|D!sBBM6A&LtV_ap@SJvfpf4UIJjd+OhckvLOc+pKNw^-B+4el!$J~|
zLoy^Z6k-wzLKwgSP*mbZfCDvB4DqmGso+B%_yiWD(Hm+6It;-kpaX*JfG<#^IBtR<
zL_)%lgc`D;IQmaUL_#*)B;lpxN+L)So#8&9gG|yS<&6YF8st(&Bt$-BLqg?5*2xew
ziw^z(7LY<LT2Kiv!a8WgFvwz6`hyPcKr?dS@>PNn{NPA*;t^8hMm(ZX{2^^9;!xPi
zN6cd}R>?7zVGV?pDzJbqF->WyWX$aVED8lQtYStWrXXx(+q_LuazrvTO5n5$9H4+1
zz>7b;{{iA`CKlDeCoBOX+)du>P17`@XWmI3ROWj<lXumGM$|yQAWCSCW@&OnWntqw
z?50=xW^azrZwlvEN(DHuKpyzQBWk2ru>c$x4m!*NqT~V7!~+Pp4GW;dVpa=2EI|p>
zz!JoYW5(h%a1p1-fbxCBDW;-7)IhtyLkXnO5TIfac_(<rN-2&^d78m_rsqfiCx8-X
zfbu4v+@n7vL(IjM07Y0bU;zk(N?2-yfg&i+3{N+p<?`8qT>>RbLeVou<1(6oO=P20
zts&w0Ltmz&8LVSCj$=RQBTDw;KenS8*ri7NpHkR?&XvS4=*vqs3qSg!MkLI_FcBjF
z|6gkEC0}+KR%)eCh^9Y417V^OJ~)S2LXpiyXk(sb?F<iIA|j56i>Ty+b!JQ?<N+4h
z%_hjz@-&ZLmZ?9S>4gxDAT&repg=}!LP-u0@%*Bf<N^LHrzJ{EMxX#XoMEA6gLQi8
zOK2%|Y2sN<L(G8yI8Z@ZiG(V2WpUOIHp*3|dZk9Vr9U(&c}{AjUg~=Nz)D(;KX9W`
zB*mp(LbW)ms-gp{ZsLWGA6;@pcYbGhqG$;irUeP+B{0o+3dMRNQ;M$UX1eBO#wN+o
zrgYB2ZIb3m&;k^kP1$e(7pOtDnq5iU7k`?;bV(~HMJC+P#N2e2Kj@{B21$x4|0pRO
zAEo+3E)XUW;%b)4qP{v1Hcn<o$Yr}W;xJ5?KjZ<L(#e-zPzEKbKNM_6AncrOM4fup
zD$T+UU{Rg|?2imVc3{y<Fz4OulF^{U4?N6Yifl$Wsy~RTzCxEjOqZpSM1wwPMr4``
zklukhXsC#)yjs>0$t<d>*DKgr{P+X4?4okyK`VjM!-4<{1X|Ie03#gc@aW*XimG(V
zgmXZtl=943awVu{L|?+GoTdq#+9{qA&z`EOpS~bI#DhDiff}%-NJK)GxPU*Dz@6qP
z7IZ1``~(ObPx3hIy8=myx+-k7rz#w0%%y0BipsufguY^t7I9HVKm##$|AY&a)l0am
zbw(%aXl&p{X-15T!-noGuuevFF49IwgGf;neL*CU?w5`U9K1nyf&hYuEH&bTgQ5df
z!It!>?8C}pt2WC^yll|kO<BPMBgj^)R?F;E%k*Z%oV~8%W&_L$ZHJu}@VFK_&=2w+
z?xSi%iq=lX+-v0K>dx9MiaG_v9;{9ZtUpw&cU^48DlEsAggJ27NkqaWWCK%_0Ns%7
z4)`l0K#&Ackl~tdjjS#Uv`f;mfO3!m)T#nTK<*}D?G{CC<mzBA<-r>?O}&0ZB%pu`
z_>a4`DhTYrMcHl%7gG%!Q`3|{cDgVOhfoTyaD+fDgv`$2#Dff<|H(86(I&{i@K~pF
zN-hX6LJ7b_JnTRTNRU4m?*|9kftFOybg&F`@7*ND>bl-WFzqQlj1)bL89Qw<a52&z
zo&|$(oB5gy1da;~3Ir$b>q2e~G;T_@Z_Hh9{APsevaUb4ZgAkQ?Dhlg+HU{ah5!@r
z-Y#+@XVDgQ(H9|83+Hi=5RHwFgiO4IY$^o`EZIJ|)~+p7OmxI4gG4_ZVvzLVN0f>^
z3JgK5giw}5bcIBj9B@8$L@vMXzoCPFLU0?)&me0A2D5+$hj7fT@xw@PyYS}@@1zRr
zWRI~x5bM+q5V69RaDhZ}0TT~5w?r@f5|#=R6Y5V6bMhPU|Aub>2lkST!`%!PumBnB
zh7y&8FMLfGx^vM5Gq1A5Di4fnz4DnLw8nG<ECclD9LPrCXu{zG9_xm{)Q~KD1U*!=
zLwB@Cf3&q>El2DkT!OSopEOFFnn-g5<fgPszcfrEmQl`RO<q;<(8?IvTr$#1OUJZN
z|1?l*&wlnN9Ax6ecoz$ZA}Rjm$dGMG2Q^ejwNx9isZs$nG;B6Z*H~U<R&Hf7Pc>MF
zwOI3r9B)xeSSJ=G1%>{sQ;)S<zcpNIha6AC6713?bV{wV>h`vET=%tK|20g=aW-5v
z3b4TNOzqKDFrG*=U^lj7KQ=EzVn=*3WLLIjUp8iE|F&jtHfMLXXMZ+mhqh>sHffi(
zX`eP~r?zUZHfy)GYri&Z$F^+GHf`6oZQnL-=eBO|HgET~Z~r!M2e)t!H*puYaUVBw
zC%1AhH*+_)b3Zq9N4IoOH+5IHbze7jXSa55H+OfpcYil{hqri-H+h%0d7n3Wr?+~q
zH+#3Yd%rh)$G3dXH+|Q)ecv~J=eK_EH-GoHfB!dt2e^O_IDr?qfgd=6C%A$yID<F1
zgFiTgN4SJfIE7cZg<m*^XSjxMIEQz*hkrPThq#E3IEk0IiJv%%r?`r*IE%Nqi@!LG
z$GD8oIE~l1jo&zq=eUk*I5&6#Ce%VT?6{CC|K2>zgGOLN79fF=D|sB4f<_eikVkpe
z6@wTcffblSHJkwwL_r)hf+;it8z?y-_(LOD0TRRkEJ(SUFWoyNITD;fHB|W>;DSHM
zLy-FeF=#m;M1z}W!JV%;px+!JEV(Jf0TSFnM%+OZAVC&1LY-^5k1shU1UjX!+@K?Y
z7$^g#bAvw^`jR7oC-_4(Sb-RDgPS{grKh^Z!Ge-wLL-2>KWO@=V|qrsIxh5ql81Uo
zc!M|O!$$DBuaAT}c!NG<ggg|3GTZ~N7X`5YdaskjuorusBfGMD15qgZJE*$0mxMfo
zIV_w(6cB?yNW!cuIj0u`5)c9=V7ifq|3s4Ox<9Ccxs${lAc44h!;<5Il1sEnyt_uo
zI}&jENYwki=li~|gg3;2k=FtejQO@dd`QRxAXGyZh(SjDLb+Rkk#obL!-B($geM?@
z7ifejh<r(S!W{%TtDiwJ)WaS0K~aSK$Y(^!&-_TByvo0M%fCEKD7ieu`W-kq#1DN(
zyn`v2`WYDcJh=IiBf39$LlpEuHDLKjkb{z2yFX~T(EkD^m;%<{11u0jF<?S95Cbf{
zLp9Vp8^8iTz(Sf|eAj<{*pGcRkOM3z14mdr5@5a7!@bvM1lWr`*_%Dut3BJhy+$a5
zCwM|N@IyxA!`T0LMld|6lY`yk|9wV8!{Qf%MwtCP)B+~Rg5wkYkc)zrBY`rUffZoA
zsV{jPWV=7?0uuCrEHL?`hXkbi!#gN>wgbYa??SwPx+xI+x-a=X9K7!@Iq(C#lA8j?
z!#qdi{_Z0|@Be=A6FTvK`tc(HgcQG$6GBFKx{^D(7c6-#FucPjzmh}0p)b0alm3pU
z{->in65PJ-!-6E(zdx+ItABbN0E9As0|^pjg(QnVQ%K_YQ-;J!wOtVTsY8N<5Uh81
zkPv&<2xGW=7yCVoIMGVQiy7Z>YXqy{z=H`FHZ&=bqD71vIeG+1NF+&e7k5>Qf`nVR
zICtbtOvvpbv3s?U0P+V5|KcuOM{D_ugX9c3tVm*(HG39qTD5E0wsrd!Zd|!@>DIM-
z7jIs@d-?YD`xkIv!Gj4GHhdUy*{>Hb#`#s%pS)U)?!@UMiI~56XQEU)!?-b8c^A2T
zmgUbA5;3sGlG9mlU{8OdkYMsR5=p<*t6RTTI~u8J)T&uubbS%FKiRZx<L-w`^+0+0
z2I?z@=`&e>7v=e*YPAm%PXi@E{t9#6MSh9dw|D;@eth}!>DRY^AAf%R`^$;}jij@$
z;;`bsi^O1~DohF#BdxDELgF5O6htVC3c1mVpyg`2jid=Hv=GC!9K0w(4?n!{q6|Bl
zZA0e{YN()hvVbT&|LwT*&O9VeQ-~q2R>W;R{)8No$RdqA63HZ$T$0Hq)AH}XKFA@k
z!2dAWWiiGWL<_o$`WUE~9{GVq8I__?F*D{k%q`4@#w^pKGpmy)!m_$V;!A(p^yf`8
z(PXhXlEOrSx;Vs8W}!R$8OlZ^-oeo-1@rvMwy%m=Ge{>j-IUW#J^d8aP(>ZpEGYj|
z<`*ifyvPbdYBA*~1JlB7MSt?S=njs~=qJuU)pYJwByt6dR{#lmEYFx|&CFI@buCs-
z<yQQaBz<PI0>LcwLCF&+sXNNC@BD!Z2`^@J)W=JKB$eHE-F+9{c;%f}Q%_8}7hg=s
zk%yctL5qW!|8vEI1>Z*00t7(n2CBvjTp#T<wiOo&G&g@3cGw??{XzCDgriW{;)aEN
z*w~0On|RHB7R~OCYWPIBs)nPH@FG*FB4pw0&fq5EOM}gn-k^mZn&_g9KH6w6`hZ0i
zOezCJ5@ozGMHbM;v+Ev^>B^cfuI<VvpP2N~dZ2s4HVbT|)n1$Jw%vXk?)a*?C<;I@
zVTEAqgpDRv08NP-@W2HhobbX8KiuL~K{F*a#-jKe@yI2gobt*ozns0f6=(IA#xL>$
z^Uy^fo%GU8AH15Sa$TME${zI`iFr<+o%Y&oza4i_JvqwY+<pHY_~3;f-miDaAs+eU
zm0zCu|K^>49{T8|pPu^at-l`o?6u#X`|j832WWm&PAk)UU<3Lr@XdM${g~AE9{%{{
zpI>l7knm<8VvvCREPjxXWH?CqpIX>(hL}t!3cV{88)EVi`aKYW5tLx4!ekqNAnZ|T
zF@-?RkOgw|V}k@VAVHwghhHE}APbBMAfh!v7rqdNF{}?iqL2`M^r#qKs9S_g;e|U`
zK^|i8#DsPw#6=0{c>3^!6)@q25e@_@fbhmWaKSS`C~6+7@rM|^APFmY!a4@JhZyb<
z1yAII5K#~VvzGWp8NLyYag<|Q%5x3<)uJC!hyzv(rl2@T!hcb-LKbQf$O~ox7Ghu!
z|5YSWo+m~OA)ZiK0VA`&E!GAkwIGLoV1b*cVZ{_2d51TU&<F+nVvea)<tkq|H%uVx
z9?__ZDJn#>;~7#6Zu;M?&R~kKyrU0tiozqo)CdCEhLZ2Fq!`YW$1kyvLpbxw<3O^D
z)L>#E3S{Lrx!FzZW#K4aLY61UNwWyyQkRk#%^Aq)33-%pAj2$3EyB_)1G0fZL;0H+
ztPoE{L31P))L}cT0TM}&6Bpi8=t3E~yvAjw9(amI7W#;Uu%VMr1LUGI?!X3pPz4jI
zd89>p2@-=LtQa8KXKhl`6@>j_Bv(6S6Uh-KPvF7|32o?3dD_$24dr74fyGhI|DX<<
zQ3s=jtj3JIkePdcM3Kal#bWvpA-+|`l4nq4DI-J`2#H5JUoj(}K!T_C`4p{bRqN!=
z7MD5^glsWsD_qT@wYe6AZ0}p^UisQrzy1}lffejv30qjh9u~2QRqSFJ+gQgw7P66*
ztXlg~*?n9VADPuGKH?FN&1Uwp`>5>rCR<w5p7t;O*oS62>yC7o1Gd|ctu<(C4QbrA
zw$_mCZnptj-@-N>ul=n#cstwL-WIpDm91~n;f~IF79XNT?R2RNy?d|$Mwnnj3NOfp
zT`Y<X;bj9Ve=(pt@B<JqG6frs*Oz`|HXg2x?KW(y+uj1#xzLSnW#^+>|JKG=zQm=k
zH0+CC=<cJs30Cmzu5l4%;0AJxGGM>JMU1f=B_IA72uScJm-lkk9kH$Nee(-i(vHf%
zoQ<!D2~1+>o_N7AmNDSG3W%}vZbC>1$3Q+KzN4VB8vO7NH@Fd=4x{D6@p$ckT?|^m
zB{{^zrEPE1(OG=Jc*a@Qvb+>TpezuGf&H*T6hO*jB=AF-{UnH~E^=gltX9e9ux*nO
zT)OwJSjxIJhdZLXWk3HJRA1?mDVV7zh#<@gD(mrfbnFk<_{SUGKo~Fb+*{{fIeDuM
zF@5#y+&Tjq)S(_y4gE1Ad4y*k;Soazk#MO+PpFLJn9($>QHWOe|M_}%&a*kHj1N)&
z8rbj|iK09asa7LoAP=$1XYzp$bl4g|-)NZ1%H!tlarU*e-7}_x-ED8bXCF$YZ*M)D
zkM6*cvr^thl|TJ$cfUI?_z1CX*}c$kr(@iFhWEbty%u{&*&Lo-Yr6Fu4=nc^;lRcR
zzO51PgYUH;|E9OE6JGH@_ah$k4S2hqlw<%0__xh<M~S&@IgHDB8}4|x#aTXCjMFzA
z6kpPvmpo$Fj{Ld${cmf9JK#=xcIATGhdX5J4vx1R>5a{}HH^L_dCOTEmIk_eu?=-{
z%iM57FM86Krw*4bDH<6>`aa~Gj-wCh>Drz;d)_;5a-SV=|3hy$*17(>dDP+;Uq=!-
zSW%4jS{xs;jYpE=fpUG{=e-P%`Qb9Y4Z7DIceRLXkv`h;eh~NZLMr^aGoPQ6&)sl=
z-v-<vZ#sVL=pNqqd+P6cA9bWq9^4T7qITL1+jqmmWw~ry&~bax`@<d97<^gMwwG}P
z{Vl8gy<d<Y7ktRs9rS8`TJT|wbd>&f^0<^fj#rF2Wd@b|sRlQ~cD$}Y@%#&g2ML(a
ze&>UrENgf}Tkz0+72E<Xusw?-h(H8N?1cy%;VxEd`U)Z&hQSx=q91&Lv{s8CzyTfT
zBKV?j`0%3S3}YXLp)KMe8SVn#{GkHTA_VOMACkcr{~}NXV<H=H&pxtY1pQ$hOtACn
z?jB&F7^uTKszV^YYd^?A76gJHltJ${rlH26DgePM;G!M0qaYfoEldFk1Mn>LFD-)L
z|McScNU#9QVgc>q#Lxj89uNiR;_~QAFQDNC2O|UBVhhni^tNFw5^yiNVGPYe4*A0c
z&mtLS5c`5KQ!eFFiliUXj|dsc2nk{sX2A@6K@cKgAV|Rs%wQHC5ep=73Be%}uM7^}
z0RP?$4lvOSd<`A)zzn9LAe2A=%cAhs!U_pu9Lk^xMqwb}K@Xfj3uLhjc%clG02O#a
z4>Cas%D^9ZK?}5CW`^+>gK;3nK@XZh3u56c|M*b%z#$v5VIaDYAohV8tq}&NAsgzf
z8}^|ZL2v~Lq93~98xafw(IF4JAs(^;AHI<-%;C1+4j!s;@WOE*I?Er}5gy+R8rDI&
z{NWxWa38=B9o{kCx?vhLkRY>R4E<3QA+jLw0Ug5-9q@q~myaIdFfI1M7jVt9&|w<Z
zVIbB4AN?U5$MMa;!5ayJ4hsS$^AIF)EhPs+97}Q_R+1a-A|c^1592W#=z$>EaTo?q
z8~<@2_7MBf0#$xt9<D(jszLRNgc!WxQUpRBVBzn)=@1734^+SjNI(m2z#rBC2+%+a
zgmDpaAP&&L5tc9q&>#r@Kp*D73F=@L|8Zb0>vA9F5)D+~(@@bYMvoP*a37SQ3-~V@
z_8|z8z!8*S4*a42c5x6gfe0Xz2u5KXFjE%&0W&po6!akpP%#Mx!7MVb^FXp2=s^y#
z@y&)|D19N^k|7?tp#v8%8Q@_UE-N1HFdLF#7@z?f`~e(%Asf~q0exW_k|7xavMs7l
zHA6D9{DCF+5FDU^vk(j#eBn96Fb3Zd9Pj}-eE}MhVfiZZEPfLm)<FZqGaJG%JGavx
zG_pAN@dVw|AG#A9vU4pmj{3TjIP(!XsnI%ZvmCv19iSl$SCF${atwp>9lHS^1QZSZ
zfga+MAd<lyZPOnVltJC1^P00e|EqBU*FiZ|W<W1A8NlH;H&hy%(qar_I{JcVc<L+t
zVGfXBM;n0%;sFQNNG<*02C|?Ul%W`w&<k*(3$(yux<DBHK}nfZ3vPi3<^T_fpcDOp
zFw27O;Nde1q80t&7I<_Jl%Nn$0SS!C2`2MOL6a9Sa~!xd6_emI<&;iGfe5Ih2~bn_
zMhj5o?D5cXAYSth{qsY`5d~>;0Y#A@?yw)ja3Bzs0co=&(V-6K0wk3ZB;Tt8e-j)?
z>p}+t8j`acw6g;(HS+*9P_5zdpur$DuvFLKR6)=eLX{xs;Xd~>R`)XuOOP#^4^kQO
z%?yq<`w{m-vLCH6I872l|F7{_d#_MqqCas`4%zWTC(<lfb+iPvET#b-*byJ50b8vz
zBjwNqT@yuzfhhffDP=T1#-;|NVe%F$N9O<yV&P1*6kW=|NjH-qmXK%kz)Ag~45CzE
z{efT|0SWX#4+x1Mx|AT`ff_2-Vk=e)k{}br^a?GZVI8&>>Of9{z)g99Ab@co`g9=d
zbRbaHANq6-lwcr~z)uSz9&!t3pWzus5IR2;S_y(&3w0kx)iz=CQ40bL#jsGj5FRlV
zFZQ7ukaHkbkRt0d8+-vCNVNhv6h%GD6g6-f9`9yxwzhP31eFyZG>~i8Vff+^YX?GC
zAJx~=c0YY>A36{(|Auu8>DD-t^(4759=em_VzNFR5*%0%QjJqmIdC6~Qw~v570I@2
zcQz)%7E{OdaCZ^{O>sXvYZy>eAeS;m6>Rnj<E-$49B@H(VSyEX;dJMsUb*RB=YSVv
zmI!!(2+&~`Zs1>;VDRu^2?v5;2jXA{B6t;63s`{&SYa1f;Tj?~6$!!-l7M=vmwJf+
z38Zi!#uOcv*B{2=8q{<g+yDvCfHF<CWo7nd{gh=vQ+@jsGv}cUkf3JQV$aNiP`guQ
zVADXa_8_g1JpI9Fr*&dE*EkoIX`L-o<)Y34_|1Gl4k->D?z3vGlN&SZYyBZ?-Qs@B
z0#-9n16guz{|91%;dWO)co<~WZt?amhC${CSAc2rH?8q;0eEU9m2ej@+@#hYT(}^r
zwNQPHB5Rm~qwiZ4cwB+iUGae)IuIRvAs#>y!3OeO{Y)Kjfe_b%9BP3T-byZN!Kem;
zAI{Am-ho-_;vRmXbe*y*(Lx_sA$D15c59b1M`8qk011NNf|P&+SYQo~cX$o<23VjU
z09gy<AqrGL26A9aB~~rgvK_=Ud%J`G`i~OuAqbEl3ACUK&i7>B_X?AM2xQh}n}8DX
zAqkK`36$Up>mqGW(1#ar7;x`yPmlrop*v47hRebih5-fp!8sWa0+%)cn|6WYA|8f8
zI3;yI|5>mbl-Wb;(>w7N8d4Z2dsu@<S1o=MmPyr`RT7$q&ozCRo6(^Iwe!tb*e82A
z3}M(h&9j7w_&l8x9D5nTt`=7B^NEK+QjgOimD4;`hKTLLax>Btua<{PG!Na=IVsKr
z)p^F$p%_?!yW9d7yf`j^W*&I3jL(=ZS}!e>p^e=bN0H#USc4p_;!Mh8kF4Sz$|wsk
z;f4kR7XU~hYN#J(+8=7#A9f)NoQNA#%#qOo9wK=y<}_gSf*Sf^9P$BR1*6VD(j4QW
z4e#Q_`k^-q0?VpeFjlV47Bn!p+6&V{tl>2+YC&q$f*-s=8KR+1E}9_Lx~*YD9+W{D
z|IUpY?x7lrVIE>B8qTI7a3O8X_#KLYXTsqf9!we5xGv;cll);Sl_5FE0ZEPO9im|f
z@8KHSx+2~o9EyRlVaN!7fV9t|_446$+2U;8fV7ohV})c8Mwti-RxpC|0JHW;`XM-v
zSxKI=nzh-i)utF+Mt0I-7eIR#G6=2*;uk#P7sx>$xKb>r0~cU{8~kpJapBy;VHaS5
z7^LDIU||>3K^C;H7A(xJ_oBJq;kmt|8p2yMU|}BQp*!;79asUbWFhQeVJdA<EaoU5
z;y}P*<S;N{z=v=@@_`qMyD)(JKGLvBb}zUK#~Z>=E#6^AJc6d{L>^$mA;{sg|G{L(
zZ~=ebp-z5*j5nGfFnm3VL88flt?MBW@uI_%jU2+89JW{<@&Ojyx*+g-Ag&=0`MVmJ
zg})~p$&>sq>Y<R>VzUP#xi@?uu#&mSp&E`6vv(S!QJf%Dd?3u&#=S4n?qSC7g3320
z$2BR(BP1WHflLg7Ac~>Gi2O#6T*>bo&*_36YJtJk;)*SX6~cJAC8Hm>ffdMs$@yW=
zVPm<Eg^YQ8#hFE<#e9m&+%5>+(4o7NAX^{qL1pd%$o(PIkF*~qdMfKYj`LjAS3S;e
zG+3M0u5YxudGHtd&cz*qHBzY2ncD{AToyC}%pF3aQ%@u;-7adq82oNg|6rjOaA6*{
zco%9x@9>6aroy`ET&Pl=)wf;AubZk#dOd1^j5E5d8@nvR2QAK~2DzQx+npc?eJ{4S
z7;51d-9;I2p%`Rgq+N&|`h6h!9pL=|;Qd|T2fp9~{^0$6;Mw8d5q{wlp5Y<hAC_Sm
zBL3kYUg9zS;tf9G8$RGQ-ry<T;td|;Kc3?^-r-Z;<W=6^Mc(5T{^UtM=2xEJXCCHR
zp5a}-<VT+7dH&{WUglZ;<r$tGD1I4+Ug9&}=84|sk$&fMzT%U9>7_pCfxhQo-suru
zvGhR}lA~+pg&#0FhBkog4Z$B)fb2J51^mGf(tZO@!5`dS2>f9T|J=Uf-F^)GK?vNQ
z9ZtdR%^vN^e(l>n?crYT<G$?AKJ5qJ?F~Qe=f3XK{_fL0@Ap3K`~L40U+~$!@e!Zw
z=RWNLfAKlL@I8M6Am8rU0q^ym@BKdXHDB#XpX?p~^F3emH=pol-}F&m@>QSmS^x4~
zKk)-U_H+O3cOUWdp7=MwAB6w--JbD#|L`N9?2CT&EuZY0Kl7nq_HV!VJAe99|N2`$
z^NBzDb^q|mUisZ#`%9nujeqiMpZYhz`hOq$ncw-%{{7RQvD(|+0m7fafdmC^*pPzG
zIUXq*@;EoCVZ%x1B&N7>j*dlF%q%LrVv$)yi3%AyglLhX|3n^b&cT4eBhfi2JZefg
z$EjvbP78ImOr(>CE@nYxwh78Cr%stPZQ=~dGib|~F=y($sdQ)0nm>aMEqd;#&ZJ<Q
z^1uppD@&I!nO=RWGpf&XKy`jy8Ww5Rs%Fu~RXY`iTb*#V2K8I>E?2rpb%7OIvvAeJ
zIH?XkD_QR1x`~P6h0KF2-oBXuv%UN<r$m)2QA*@!5u-+l%v^aq2U4Qzh6*h{jCio1
z@ZrRZ8$XUbx$@=An>&9FJ$k`v%A{Mrjy=2f?cBS2|L*+Yx$)%7n?H{}z54a++q-`c
zKfe6=^y}Ndk3YZu{rvm;|1V!~;0;J%fd(FU+&j1+|Hxp24n7EBgwieJ3V;?~h+&2r
zZpdMW9)1X7i023>VTmT5_?<qo+=F6^F1`q3jQ&t4VvRQ5n9)HSh%iPu^Dz|G2F#pS
z&ITBfM~99gwBciZFD;Y;j#5rZWql;dh-H>2?m~{1UVaH?n8=A&WtnE;m*g09z_0;D
z^4Sn&8$uFkWO;I`$-@R?==WqIhMWm#pi^EkhM0yn$d8NBRCj2jjy_r<nSxGAX?aQN
za*iu{X3B#IDNwYg5GgQ|hz%mZfGM0o4mleg<rI13cyeM|4h$an*s71ZfFuN_=NJOR
zMcAB!jYean00VA9{0f6cFjQD<3PMP+Y^By-|2rR~+IE)(izkw^%eLZ<OD=YjVv8=7
zNwz_U4I9YBgJ2DvGsXrsT)~V8QW#RFs&X=;%LY=^I|;0IZs6+`8ypkxz-_ve(5dAl
zvH=eYFH7+i3McDt#r$Gy<i_caOfq>q2vKgz%-w;+9nqM0k1YA9OmodP`*Uu|I(wMp
zK_Xn?BQ}#<A%X|=B0SzPh6u62vK=!cC%Z-(Ox~>HDJ)FXNnR1~pT`W#!>tQ#fQ=9$
zyy^kRaUz|94d)1PYdNRxOn0SM-i$XaeV~ZTJ9z&MxT9mlT6f_WCh1C(=ajR;lI|Wo
ztT1UCB7)OvGovt}V<bYgtVp}GK{=U^|FOBIe+nZ^Ii~u^G&Y?sKKIiuxgGYaa~qC(
zm3IfOG9ac1qz*9y>Enqk2r5$z@5(Q4B0J7M4}I>^`*&%1%rvb_3Zd6KEGHY#aZ1JK
zJnelO5fxl#)q2vwbW7!*Uk<X91Y6FXhIrsM#Zs%i>g+jQA%zVjYkC9}(e9WhE-@gl
z8hvQQKpLTpKD?|z<oE>wFNneKEW;2h(2)l}_>cmMkUrHb&lo)5fjsGgdy8`yvd#vi
zf0ZMEO~Xd#f^?7+jA2+aJctm6bqaUE;1r9yf(Pt%3}OWkS;>mwoM7O#vUxyM1010h
zGjzZVI_eHtz=S`l;Xr|~;U1p&{~dv1rVlNuagEO5*9R>E$DCbpj`6XfdhEEKatv!e
zdNj`-$<xR3{E<C|;99<_MaM+)hZ%BU<F*p@#W4D#59+`KqrlUTTFAqZoa|&lmZ75*
z$e|VDD5WV+DGoU*a+P${#Su5)0V1+;mi5up5IyNAc>qFzu-FAL2tkN64yYL1z@;(S
z$g~aUfRw0gW+_!k%V<sy8>cwMAf<`T^?0yQ$7~cP=5Ziz2(O#uL|`%>;mmZVas!#N
z)~m2_jAOiNp7gAzJ@1LneCl(bdW<JO{|V55@)Mr&6sSQD3Q&R~bfFBrr#~CY&+<T&
zo(jz;pqSCKNBEE(<@Dq{|7rorj*1j-OiKYX)!9rPh(n`SsF0wBl&7Y#)TM!fsSjs5
zDVxgFNHo3Z*bc&uN${YjKF!n5c$(9nZXl>brIb!pY7Fh6Y^2QThbJt!9DV2`q}aKK
zx3=?(E>U%?DoZ9x&#KWJx~WVf5r;9VV2qW9a;;Tr>s#ZRR)o-%N_K^-T-AD}zQ$D?
zI>;g6>e>*u!Zoj-3T$HUTFSyA<gk2wtY1qRRXvdvIo=Qh63nQaEJPs=+vx)!x+9NT
zY<4*M2$!~6drVMn;G}0wr!gK;*kfRhs5P2IC~50f+%9alQ}S&NfqUEB5?4ybMF?_*
ztJ{_q_qV7_?m?JQ{~Nwi*Ob<cE^kHDT$5H;xI)VAbdT%IRvcs*t0j&pkN{s;GzS)>
z)y_R;)*b4!cX+?3#U&f1kN*CblO057ZEI@`QY!2s-{p`ifTmF$7}%K!7RQ36E20ON
zBf=AIW`!@@;0<Y*!|MF-WJ9c>5i7I9&3uF$EL<@Zr}zr&ATfm%eBv6ZSi&fEF^rq4
zV;b8yof=)iehcyoSVRH7s$~v+31W&kV8UCw0K^?6;SX5+0uyZTggyYljXw0@9$yB;
zg8cF2FppUvrnti$K)al<9@!t!5G$nWY|QYb;J|#wtYkMJV*mkXw#FDNg8v-o{|ven
zh32y{5DlV5|2O);kJeG5{Ud2Z*H#Xp9MXp}O=(DfT6=`n^jSHbLr;4M)Mu@<A?7@g
zUmzh1R=CD|>+26wWMLO^a3Cw9fC)@w!5@H#!W{@P=2?5<3=aH7uLW`sWi#6!g~);_
z0I|2`<U<z1Y%eZmrjKxVgCOMa+n2sQ5Ig&$+!^d3aQob9+=@dZ_{z|bj4Mibb64K<
zR<(uhox>OFJGd(Cx4j_}@PQM2-WTyVfB=pVf$KZDDF`ZtF$D2^Pn_QkKRCW64sVKE
z{L=TyILK>TWLW!yA6Y;GELhQP<vdv+Vu-`F#o&)Dc)}mb7&ai-@Won0yBPk!M7A3d
z#-SIz{}1^<LUlZm?dDYQ$nw31Jn~Tub6;Z~(Wu9ls_u_)G}#|p@A?JVaS(;;y9$PN
z_<kO|fm1x1#cF5!WZkYGxXYc#YComjJN_TN&%N({Z##el&v(MdmDE5Eyu$WQ_ksVt
z-j0v^;0f<maWJ0b@<Dv$TfJUbzZd6Rl{v1h;5$>8LLW#NcP)JGMQ9^IAW#<w(q&J3
z3C`Xhjfi@4khkAj{9=>gz^Xrr(GPN{8%x5M$33_)&f_P4`Ml%T$uY0aR!FuSuHZa-
zY@?&k_g(u3;lB6R1O9`EU+v@%UHAEu{tc{O;q5m+{7Ef;>{l1n>^wjE@jrk1R)6pJ
z|8@YVf2U*&{MSzR7k-3SSlqN<^{`|__Z%}fNq4YvFOvnV;0;k=1;iG6{t#`sXM0Jv
zdr%i`+#qYd*BqLpa@8PK(V!3B08U}T4ct%*<3?vQScA+{F9CRfZWUK~auH~94##j1
zRS<+8HiVO9gh;pnO1Ojw*n~xR9|{45QaFW}RfUu#A6S@#TexrN#1I!p9~gCn5hsR1
zC=NvEh4BG~QMiV|MTQJka$u-&gr`vu*j|!=1i0oLuz&<nP<3Kp1;&<ZgZN&=wsW}W
z54Fd8gQyQ9_=tN02(yN5(eY9JaAe+44aIN|@9+-tPz}jrDEv?h`XGv=Xo?8b|3RiU
zho?kdqcR^Dbr4suQn4tDl0}R1VT(qRi@I1!vxs->@r$?!g!)H}wb(PrD2%4`XCc&i
z3L}T_CWg!Ci_I8}&lrvL0e97SfX1)^Mz&w%0AD(o9rF-UUv(W`#UjrZ9o#^Hu;vY=
zhal#L9rdV2ulS74gj-d>4jOZ5nsN}!)Q`IekOKK01gT8csEhv?kY<Q}I%1FqIgC1x
zkP@jL3|WyDnSe&Z4s`H_=+Ru4b&wFLknX{e4jGFdNn;`jA0-KkiZ_l&)(1#H2+sju
zJIRwh>61SRltI~()*)vqryc!}4@s$%OUaZ;Sq-&7eeIQY7MV_=q!8&5{}HaR3@Koe
zRC!8PsUBImm0jtT&y+(~Ns=j`m0UTKR0)<?sg`5emi^dhhSgxUxOdm*m2a7rYe|+=
zS(iD69(eg^dZ~X|BvR2Zh@0dbLg|=~37I=-9V&uf2=oq7DINCc9N@AGo#~mM37Wf5
z3#<SOm<es}=p6jujxlF5Q(2Y>C|oIEe@H@+uW4JcIh*6rGs<L}6o#7wsGGIfo8whj
zvI(3yQjo*hV!U_`{)Ra^Vwh!VUB=l{yQxyjxr;f}oYq5)8xWlbh?pI921pQs%%cvj
zr9Aqe46MKkra2JzFm}hG4)J*)(NGPVIS~B73dO*mbjF{>08aPt{|mBUiua%lvak#K
zpbq?53$1uFuBn{2MM@2E1$2O21(}S1`3Mtw5f*wqD~6pOwxOEWp%)6GAqtxuTA?PI
zcqocla)3@0N(Zixg>z|}5=x>g`k^iAq6rwI9ZI7~Xrth{0p2!ithqeEw>;zk3-W~=
z@VOlLIUrJ+pH3<eT;f#%0hRo~CI0XW#Z;O8;E8|(p&|NKI)aOGFr?Udrne{#YU-l4
zWp}^`r*Z0GbDE}W%BFv&gc*9Hc>1P#8lil;jlvk7-J}mKXFOWeH_B5DyHF1fIvk`}
z3{6H3#ek09Pz=hzBHR!S=;#lm2z=ad51+`62Eq?k>JPhs|Bw1$sV^f7)HkMoQ>G}I
zTz<-?xP_|`s;hPyZ#?R&%PC&L>YKnytfqup!+Ma1dQ75#1ZS{DF+-*0(w}H%9Pa=N
z+&~VhMGk#KO#YyP_3#cXG7l;^5ZJ1%s<jKSa1GU9d<T-M1hES+*d+@JZ3{vUtRShg
ziZ``-tp5tI0V}WrORxnyaLkHJ^RQ$ChC!P8H~jDml3E;JDuSx@3&lVV?z(Q-+HLY+
zd=v|%yHHF}${_JN5WAoZH@I#T7&8Jf52D#^{Q969V6Zi7vp0*gIjggCh_Ig22ra`&
z!~m))1E20$5U{`^spSt1s(fN455-WL0^zX(fwZBj|E>W_p9NyFSBj7K;9BqSUlBVH
zGTWLoyR&DDwrQ)jYb&rl%Sq-K1xC9({IDW5^A56rkI4~MuBuwfz$h%@bz+KDQ!5aA
zTMJiPv52CotV$47TMXe~tzXoNWLq=-%C?t_xtXiEo2zzi>qsmkNsgo-G~*3I*Bt85
zq^0W*{m@^sP#sSxn&u`CtRM^Egu2;^xFm}pTf3_4*`6EQnTY}m!uJa?E3q_Vxty!K
z%gemYyR)AACDVEx%76q`(1V;*4HHBz(eMk>s~n{#rT8^<5|XO?V7|nGlmu}PA!WYY
zaJ(v$yv{4X^Gm<=JDkv~CGX$`1manZh)aw+|1QM9um>W1#89^q!n(hpz?-SSzc93w
zYqs_)!4piu6+DIbizV-H23c?ir>Y&bfCOIPy%&T=+oBJ+U~3UFiAISa@oT{^48t*O
z!5EAseZUIfkq=gY1X<fj<BJ{Y@V)~w53$O^yyL<$jKoQ-#F|UPGLi*i#R~qL9iH&4
z9rdl(@lj%nAnH)NMQp?oyu@KF#$$}OO$;MV7j$JL#nvGY@HN1mgo=S{9jVA5+<*&6
z>cwSC#(T`iecZN1N-kF51;5Y;#1IXql^s9Jg59LF)<L(><_+p5x6Yvq#K4Jp95_ep
z$D7Q_og9m1j3uUk3&pU;(cuk)ILVHr|6kJav}o2PpePVHxE&Cyy_ig<VC>1ctjoJh
zq%=bgfY1o3j2wO#x*`=;*V`QT01L&CM*1+1UTR-CXv@l@$-HdM*Nn~UR5R+p9hktF
zRJCoyAji?c56Zw*@5;(}JI&OL%h~MC@65}fd?JKUp8lW?NRYSJ0fS_94WlW{#i0xe
zJP+5Ppiyfb+v>sVJhSl3&<*X$@@yjXEFAfa#po<j<UpX?5yZ~nt|P3_<5JBIEz%=B
z!4S<IfB*}3pbT-)C17+1fRIMy&<AW#2=hP)lHdt(AYZZo2#B0zyO7gPS`2qk2;96J
zbi7&L>>>;N(d<mpPYu;DY|`6-{{(Dc1y*ndp1=)J00_H)1oNP<5abE+KnSDtUinbE
zNB~J?ZF5MV57j`3jR397Q4Ph^)CM9CGIQ6N+|E&LzhvM54nPL!6bOMm1<o`94gdk#
zfJ%uy0e)S<Q>`6HKn`6NY=BT-Uu_CFHxPs{*Z7QPYAq0+EfDzJ2-Zf$2~8YcyVu3R
z4@xZ^;L_T(+Siahzf%AJ0MG;JL<YHS0?s4=03ZN^ZAzRF+yY?RB@M_fGJA1Q4Z$V`
zzcUYCjR|u-+OZb}+{}7wjos?d2WOyqrl8uyVY;(j5HG78pJ?8CoZJ$O+q%u$!TsCK
z6x;yt*rvn*xsBZIUB8l@{~gW!+?arE^Dv%3yu<#G5Bwm}{*c|F&D{c#-K>xWGgA$C
zTpZkx!YnKg(NGMw<_(OQ55=_M9lmnv@NM|@*2>^@;Q+P<O3}k{#p|6iA<f^H``)|l
zOk^P6z^&iQP)gcR-}_zT^6TH&0pP(F4La-zR`7ID;N;{`2;Cjpz(#FS-Ul8i2FQFI
z`M|?eM-KDA%_c4ob)98j&duSluEanLEYhIZdVIA&46xw0$&pDfF5{3w<3p~tHy+;r
zFyE*Y<is5aL9XXSzT7AhnTZ~m&G8H43~O+XkF~(fu#iTOJ`m_F5ZJ1GnuM|5pyJPL
z95FNAcYY{&Ug&4b|K~Zr<Mb`u0N?<nGy%CS+^62WMQ$C6j_X3%9F%)x{eXk6)vcE*
z5WZduu7&CA29?Tp51{A`-mvV;@eZ|c$)v6=rcUcQo9fM^<9^QL`mGDtP~WqD?aFKG
zH=`mf%n$el3yfI{>%Ma8zDfCDrTS2{TE*<n4(i7Nebl}!);{hwo9(Ey?SFns;jY^{
zJ^=dt@0?riH#2-j37@!73-f5l&{hi)Kaa&A3$WlfOnUM2!0h4h?98F0{O&0JzVHPb
z@TWBJJT3vjod6C100xi%;-2!D+we9+4sYCE(_XknJ?z544?geF$I+!G-zX@5^8&l_
zrquGRo&gXb|J=b%12r$?OTV@`Uo*U0#L9rODl7|*j`Uxm^jQC|O<zh+59k1p0oyLz
zu3+_M&$e1$GsR%%b5;*U?;WY7_hTO^wJrD9p4&LC?W?}_835$D%>d#M_ko|bbWbzt
z!1I0&9X?F?T2l6oZ>MN44r*WUY%dNO5Zs5|_?rK`hfY<hdim2k`Kx~-nQ!_i`rZ&=
z0<~ZJ#J%kfVEeZ(4#AxP;-C$|UrMDP`#1~vG@}gv?E1#>3y{0~F#`L=ubl5K>#{BZ
zX>ahd{_4KpOvEq!HGBLj^A7p`{Hf`J<?kZV|NXX!+XCSJ?{D8}KlShL{tzGz1^@sY
z&`b>A|NiTLvjDMSgFk`=4IV_8P~k#`4IMs&=nxjah!rhf#F$azMve;a$<o(R<Vcbw
zO`gOkP~1wEEnU8Z8B^v=nl)|S#F<m)PM$q|{sbCS=uo0XjUGkXQy@yFO*KX%=Tz!c
zs#VGDs+v{nR;~(FCIuT->{zm8&7MV@R_$7!OS`@`Deo6tx^=r&D`r<+HM@QNGW^O`
z@L<A)4If6FSTRqxe;q#r`B?H~jKsLnomcA@U&@`i23{Om^k~whO`m4l*mLJ<-d4Yc
z?XO?0cXVrojGY@LXw<!Z{{|jhxM9`0{occBT={WX_ulf8wOl$!-ove5$DUpL_Ttmw
z|JKUqUHsN}wfc3Hmsg)WZnX)j<K}$)e1Fxq-^ZU{|9-RG>1XBUvi}A|i5p_Nx(AkG
z^ogpLg2>@#E&`{sk3S19#4tk*SMqN{r|xmkLlHYFrW$o{<BA_;I3tLhs75rd!VPDn
zu|^w5>k!71c9Bm<A0yg@Hn?Uh=p6xngiXd9mt?X@CzHw%Ns+u^QA#Th;szF0s?>@Y
zZ}L)xA6S$*@XF4Vd@@Zn*JSghD9y}BpXjuT#yvRg(x;j-={oXG%Ft{xP(cUP@J&B0
z`bD0s$YG_J7Z06~B8DW@h*C(M0+diqH|2CVLoa=ZoM^JrCqz)a<3~}0YEg$F|5hVP
z^`KWzWh&E7Z^bp&#6G2UAu+R3N0|o=TCdmD=1Hy~OA}hQA!H9~)>x5j)wNn{uN{k5
zX%Q;MPN}NlCOmFTy(bzjx6Mi(Wt35L9&+As)E|D-!6l#Y%8e#Gf5Lf3nR}FZ2VZ^h
zjV51ty-_Bbd*-e8-h%b@M_qRPQRkg-x<wZvYO&?GV~-gdDC3IA0XSNd$dN@@e<UR6
zo^wTZN*`EUgoQy^ehCMbd&1cT7Gj85SRPzdEv6P?#tc(vRZ~^BW`B0+b{C6#{yFHO
z36h!SJQXAd7ML5__+zohCY!^MzjoFeSWL}|Wq({oo2rWmDkdCq9G&+gmH+$4@3YS_
zk3BMuy=Cvch2Dhh%p@awMvh|~s~p)ykr~R)-eiOb*@dh!I`*o3e7`^4|G@oP*L6J~
zkCDSt#;ciE()=bZL+VYh+V0-Xz=S&F47?8B;4YErAU$~ey?gs>8m9Dz4*yQA?53@S
zm*e}m43~;K4_qUADmSwF#J$U3nEVyba>3n;$ju*2Y96@Zy~m_<(CGMZ`n88y=KSk<
z6yIPVZUi>tM{C8WcQ{sBdT;!*V~4BH`#ls}Sn02~vFuOW-|C*c*Bl<$?noGmIQ^FO
zeqAr@FRFd|h%%8Se1FLM+v`v5RiEMIvTERsUtwa~Q~+NQnPu`2dor$ndW)CTvT2in
zWY}h}r(1Eskzi5@aL8ZOklw8{Q0vdnhlz)@z)311uMS@wk;rK>yKZ4g0!9vH?mUI|
z7zQD)Rt7?KIJKgoRCoa@2l9+2E#4(!{Q1_3PPz%{u>dr&&ncEd^5EITx$%8n!#mVD
zayk-Dg9&nLA3q72_s10NW2~p*B`%<noH$=;31Mfp<M_h5xqXh%J8|vLPph1a`|hI(
zv-`zP)b7)Ag>(uIa_GYJ)H`}@;T*c+;GDsv&`%b%*lc!feFmkyiS$zL5hjqFb|Gs#
zdu11F_$W2sy)ByVPZ@lsO@^{>$oZjpQL%`*S<>ALF7^+?@d|FH<hJAgWuZCn3p(<n
z?<yT2AJy*5G{`eMUtepc0^)C=4u<<;3)!cQ=R|}yRU?Z2a~v+`R6zL|M8?-)D*5%U
zmV`HJCAtY5eIc}RFhM#F&wRQCEjJC)$wYFbV?JpOAGa4nhQ;a~wcDR`Ma_99?2Xf3
zo#gVZ;TlJhdc-;WBz|g|52xaW)eCOM{<K=F25DB(a^%F6s@o1wI=Sq})+v2fCJI!A
z=tP%Vh3B7W+(JKE<552ndZ^XmVp^WKMth@7!?2;nylBe-Qd(AC8*e3<a8bxcONO|*
z71oIH-N>k2{$%Bt`Za9Oqq4~nCM?>U@+xPql<r*nv`1k!zS<cgu<Y(ccS&Q;CSFV_
z&ZNn9V=ghg=vhp^uqMfi>HeUvb&@$h86_0otUUc%Ph$1avF6<B>xa9TPjc_@+*gb?
z^UpvP@A|zSv<q6#Q}au<7r%3qUH-C2FI$p=Mk-<r^4-gPo6U{9NZ1^0e{rT4+`#Vo
zBg~Tc-5bl}&`943#e2$QM-|^#(F_wWt%#4*5C|Uc@C-Mys#n47SE)ZDP%r0u?}9oG
zV8o+j6IhgkMdwx2ZGOtOJ3;l0ohfeGF+56+Bo?zh3?F^sq}v=Rf@gc#;lA<ON>0>S
zvweIzzKP~-PV|jueJLR^EO(3@zKLe5Ow{{Y&WXq2=w}C1;eLczB^OSHxj|hWzvmfk
zF1)gHL;uD3r57vR7qplgw)p6m39H44^UDrgfwr;&!%5gkyGI`A_`jHL+qjY>jX`+F
z`RA@HJzzt|j0S)7e>Jz`s&HyG7WCCWAC~8;ayd7SWea$-Z|kOc$uyA|7w}Scd`m}F
z;Y$`h4k5D)x?vnPCWekjibXs$@}HmdgCE1S^0vg2yU}xWhmpq29@f|J)e$+}_krym
z_YUXjo)(Y6!<0RpAU0fJj-c9Lubu1X-rQ%`AgxD#cU-PoQmp6p9es_w>}(baY=(kJ
zu5D2MA+2BYU;JwJ@G|mEdpxrdmsGdZzT@Gc{q1lpuwF>QD|~Z)etIgXb7d*RC*^Vu
zf@t(w81;&&SoklB2PG<6!4eTLvGQEttnJ3X9P;sk@0(@*?R9?M;oDb=oI5gd&9b5y
z$*qsqXYYm#<NqF%*W1oXbvC673sJ)_JQOa@v_(3y{gVf5*MmNgMk=fPCiK4eVK5Lp
zh<X%|#g!){quMmRjXS>gqiw^C@54;Ozrrs;+?GG0hG!Lfk8?cQMQ;TMPyPf4mvo+p
zcv7}5(6A9JWsh!#+-&@|0uHIESkkSV)|0*mea)5{eIw<sLHnPA6rZM#KD**dcEE4%
z?$34@V~Y=q-~XLAEkqC<s)9Bh$4=WWm&849hTnClx)?F|*~oIPt(*(tK&@-C{q}k9
z+!jO`>N2HFUjFx|)o+ja-q^h%`iL+3|LtxGMXtQNI{9jHwYOpOefg@!{_ip5_r==f
z+h!IMxF~duGg`|zuwo+lO;5K39jx=u?HuKE_QOB-EbK2>BW11*Rdz00cW-p=2q|<x
zI@@iUU~Q_DE26N4H!9sq>&9(3%yUGW!jym4yJb~7nyxE|@;%aSkc-OSZPLnZHMmP0
zU3z=AzdCslrKp79Gc=8ad|s$t&P)QiV0T_{2;!!RAk!ZO*iJ{sSr;{Jx1*^B&6*PJ
zQBr17_q320v?$rLLW8r7<_QvE<q*3!jNBVad>qpGoCqKOqVXrXo9ifP)1!xHu|Za<
zTfn7RI;N+g?ww*TnQ(oN)Kv4UgQAXQ{9{a?hLo0OAIyngQ}ybILfECZ6RRj6qe+l#
z7pm`72`AH?(p36WvN&6F+eJ(6E#pvpiM?3AsaC(~6tyj&86(!0#Hgha(`Gz^R57FY
zCn#2Wn5<W+rF0~2XxL?RM0RtM+^I-g?4WeAfHN%~-R&N4AsFWtljkNJ*Vl}<$5v#T
zz^!Is5yp78O4y~MPV$-7&n|5{TXNf-e#a3_hs9oTpx-xrU{O!!jYNV~486=e%n#Ey
z7e$D$&H04n5zHBQF80wzO6-T+fK!a_54k~HjNZF4p8M!r!eEh6*vl2)7onC^i~JSu
z`72htU!bYzA_=irP9!c_FVH|FAp9xbb|`x%Lx+P`_sWEK*@IX9ZQ2Wc^cjJWVn`KX
z)>d}*G4mm>&I)x#`cSdUaEYye<sd?Lf;Hmc_2WUdO-EioB)$MV{0^xv-$Irf_EKIw
zbAcaO957sO_Nn2Bt*V=KDM~IfpS<0dO~RLos#doJsjsL`f!oUJaHOht`P6+KK8MmZ
zdcH2XV7)Mjd%_<l+>)5d#3uvRk2s>w8+z%J-L{4@^d-~g5=_vRGJHRd|DvVoDqs|T
zls45DKczG}5kuZL#oFPXUj|UM`@L`@z^u+-i6KItT@ndUj=S-R@8@Fe^5YxCwP~qF
zaOu#S@wjm<+}(6Clon;WE%GEfiS5hn*sU@A)mDLfnNW!j)6!e=r3qGCHh#l8Z}A~{
z{{$;rShBkty`P+_!$WfKGJLq&X9g7BeSGB9?S1S--Zi6+D%5BIO|vha^8{HOYeN47
zcpKk_-x5yP-%<ZnNfO$1dw5wreGo7IJTdQKXE?u6=-aq2MgLv+KHHqjKbK-!W<dq=
zvs6fpA_T|ELJ%`$ToLFA$Y|vgwf-dje*5aS>`LS4<v1N;%rpnW#0_e=jEEpY{RmLC
z<vjN?m>NK1*cB80<&LNko1q)j)PW?40}+v(#fd^mk)u!<i17dhZGAdS07Hon!=sSY
z;N=0|`3VN!RHz?=pB@YHd@OMp@$SkjgC;b~HxVxFm8uf)^6|1RrqATufzX;xt72qY
z*8<<qQDP{dy|p`eoIj-&gQOOTrxbZj{}%D2tUEen;;k{_)_rs$0nwUD`($~Nc?98S
zjNp83lA1rE_bZLApNB;o$qxJCYFEweMJ0rRn>IoEYruwOaBeIow_LRSAUKo=6>^KQ
zQv=^Khja7C`>@XVnZt$RF*nsvTsg%A^nY{9q@nG2LO%5)V%%M;&!*FevUs?l{&=D>
z-h*)pF`w^&q->qQ?<-BaXjq;k#d#1A-fHIfra0?$4$F0TXtm|PWcZVJ74haQQ4OCP
zA5LW!Ou5TZKDy?CIHdf!B12_GWxEr3I((QOl_AdCkmh!5q1pH)Q#y)>e0R$}tBk}b
zFHvs-B5UQ9hnmTgqR&ci5nKZCj?%5n+Vi1E6kBf5*J@hVz^}F1H{FgA|H(yT)WH!L
zQ{4F1$7<jifbzdB2reGiw}J@ZLALfUgvLXvOb{W;3CH0Gju(ix>!v^6@^H@Q;l?LJ
zu_;Og>=8uxbR{xcd|n|3k*qu~Q9regN*QHcqVPfvKV?LQn)Rc`Da~0<mraM)lgGVs
z+?yE2LKe~e)DhzIh%oChB!cW+C1A&<cx=}jntH7CC1PScRjl0SOj*S|gLY|RZN>ai
zHX?Lc{oQ)J)73jW%n074;a=$ZXEqL-I&J%94IBNf=pT!*;qj2lL3~rgc!xQ=(6~*9
z(ZXdOo<Ba(1GAWRW`1h$>Q(<!(7n6?BQ}jZMAfumN7LftTsx{ncmb>Ru_4zY(r(Ib
zapvdJ@M?0{GJJpf_6+$_Faa@K$lh5`Q*r!>A%W8QMWIjV3jJI2Ph4infc306G8D=7
zyJ3dS#JY4j$;XnCi|Ic$KkIE+F8qn=-Vzeifp;FYj_$IqJfAq4cIwfvagu{1qB#r+
zG2vSfZpQhGC3{?#edvV!f6L$H%3z^H93YBXbfD~IvZ`!uqpzXa6&^*L;E^&3x*}O+
zYSzkEUm2b_u9)W)*B?4edd1U5<Ol10RZ6AQ7p0yxa#VY=RJs1?Q*}`bwf*39R`M-2
z{vO8(=zpv0D>yYfLsvnLNB2_sSGn%l4%^w9tl&e@Xxb>Jr-W4%4urP2wSJD1#n`II
zUDub-7lhC5M0Ujp58~to@jin%{xaCjSyrhaXX&x;!o(MkP7r@Y;`n_m#MKho^$OYc
ztpZQxl7GFHx}!w*em%_?pJ<LR8%*1{LmSHG*xB~^@weHs5SQffZyQn58?`jcl2q7^
z8Cn?^{IhJFKz82>yv%a$>S#`i#Q3tUYth%7)%AYjd-arOiQ$Y^%F^*1kMbg{Ql12{
zYF`bdDOj1Ls63zL$YU;c>ljQUqj2#_a1_3`QSeN}*qr{k-b(4)yXDxIaoKV|Ea#px
z-lqaRjN8JqX(M5onI^gEoYtAnyuYfS@N;9fYh||Ubhhj7Za0W-tMmSBjN5L?^k~XV
zR@#R{mg1YgZntl2cbs@6evKEPK<kZ-0R<~w;?Dt-`$H0*J@nfHcQGF_cZNzlYlF5s
zKYBhdA&UrcPa53$4B!16w===J`$guO`nfxGcX!%#_iNDZOx*5l=I&g{?)<g+`s426
z*WIO!-ESwm-{E`9^m{A3d#f^gKXmri?(VI-?rj9^ZN}|wW$yhf+57cjZ~Nok&ey%&
ztBt+AlfB>Y-$eS~`@FvoWPTs&{64z-``GpONzm`pxZh`)zt2m4Uwrs|`SJIkufP9p
z{Qh_H`wC737>FP~B3PCP(IrAHh_DAlcrX!xCnB?ms8S+HBaw7~NH#+x-y~9;5-Ab;
zXoh_%zI|%heHz_;T8n+U2mAEF`waMf#;kp&(tYN}{Tl=OEHnG8oBM31`|OAV48s8j
z-vOuW0hjIpx5WX^g9F~+13vr#f7XFO>49M5!L^)Hc;-N4^FZ|U;3ncwjNwq6?@&Va
zP*V3$%HmM^!J$m>p)CGTF6&Uf^iZMkP;uZ;Y35LQ^HAmVP!(~c#&D$0ccgJ8d!(s*
zq-AlW{oqI^_(&Ijq?dK1UwU+_@yKA{$Z+P!X!Gdy>Cu0PV`GM66Tag+vd5;n$7UAC
z<`0hV1|M7Ck1ex~txAur8;@-Uj%{a-?KY3^ogUjGP8=9c9QjV1WKW!RPh2cc?mswj
z4L*5*KXJ=Cd02Yl-gx3MaN;?0;<b75==8)Jaq7cx>dSZPCwuCzdm3PI8u;KeDEKrO
ze;Sf?8d`c9)_D4O;52;ZG-C7g$?0h%;tb1hc1;Yx$(}{)p2b+4#XdNT3qHf+&*HPr
z5=ze!8_$vk&XQ-&o^GB!J3UK5oD&$%Q~A!H%bus{o~K)!XFNF13_j0#hCk2FI?pLR
zf6;jUa^O67<~(on{MG6CYs5u9!$kq##T(g+LfwlZi;Ln17bU?LrTB}otc$m$7v+r?
z6$2NQGZ*hRFW#SCR3R>_87^!1E^B2k>vS*cEiM}#Tz&|?Y{XwSWnDIxUbZw|whmmj
z&HO)3;PkQ+@u!R7PdDG69@#&=x_|mC{`6D!UlU6?&Y>ty;0h4FZUF!==r|aE{Y4@W
zWTd1NlxQkS3TiYZ9St=TJ>3mP2DTf_9BeEa><AuCb^#tP5kY>bo5Bjx5~>O^n#u~w
zs#?yfy!x6dhC1r$I#k)ZXgvcHGb6p5cT$W^t!zw<q%2c|t+e~CsqWj}RkTa5x2J#S
zaAUxM+1}aR%h_(wnN8c}#k>35dak)cuAJD1mctKuTihj$Jo17(?~iy1k9vze_H`fi
zmAva$km$!B>CaaiAYm0$_BlwwF1Xk~1REXV^Ep&GKTH-EF5?tYF%hA8FH$loGI%#q
zauTa+hLiTd$pzsQC!-BpVhqA#)$y?!X|dsZu`1Saiav4gqT*7f@OK`?H{4554@jt<
zPPm(pbSozb_d7|~F<Cn-+2H;&{n=+WuL$^Ag8jo(qwv(mr)jUU(k$oFT)fin#AjF*
zW+V|aEWc#B`ea$eWi?i1InQT349Kxr$nlJQ(Vg?sB`LS1A@|{auJhwp&TX$kmR|W6
zz4mzj`Z~oO^rYay!5fdM!f;%XXI@eD_oDEGV()jwf%p>NjFP^?62IkA?2EFlrn0<m
zZ*ePcqmwIw>nbB(yc_L!|EBYO?CSf()T)R#RsH2vxTC75&ovoqHBU2Zqg(3|`|3*9
z>(eSf3>|++%56+qZ_NJLnDMhIGru{dyCq|zC3m#7s<17srtQmA`>XBtyseIcla8#n
zo!M2L^DW)uzq*SndUB_F8mjsVe)UzH_Pwe7STy&sd1c^T{b0%XV8!-eRqxQ$hvBzN
z!)-gmbuA<Bjz+3iM!SZ`X7<LK+dtQIO*HgRY>rGUu21y-o@no%YWXzv<IB{-&Q#yg
zRQvf<%l_Bi!I_SWneKzxf$h2Bk@?<>`TmK;frZ88gT;}lrJakVPhY+bAAO&gULHGM
znVMN0pZ{_A^T+hU+SKOy#^w6gt&NS7jfFoObKf@SPPe|T|J>jG`R&iorPW_cr@vOt
zcYbW_uKfJHe*Syw7jg41adY?J*X6;^{?Xpy$^M^{gOl^)Kj$Y`S6Bb{^IrjfQ7n4Z
z`Q6b-8bRB^>VjT8n(J1sUd@~SBt}X1#lf1wffS5pB8z@)(NG${X}RrCZSkipG3Vi2
z{koFTmva8U7KiFeKfhLsCSko*Up7&wmnLX8T>o~m)VT0g-mQl6=?cp__od;6ikT{h
z-b7Y|50!IuZj<G9pFX@>X!Q9poM+JZeyKI&@Ym9(#;Wg~SO_VbVN>-=Z#<3Ay^*Gx
z9|Hs~gI9*lwd<d<B|W~4G}mo@&eu$0Gis^-Iay{}ac{JxVSA?9`O_<-*6V|+$$$IX
zXlvu|?_JTP?6=#R_J0hf3E7XeH6Lz{7aF|2-QIG%JzMATeXPCp^!IXa(iQuE9c|}_
zTay*`pF7$wPg^JczWA@R<L~9s%J%oqoh|}s0M5URg_1OBMIw32FxsxPTg%bF$GYVh
z+PiXSdbF!tehhukR>2cS@L&%mccvaE9q+&89!d$%Yci@>3B#K>W<SOsPvyd7oyqx1
zwti5WLFb%e<mn%-1uE|4uRT|sS}r1!s3zt=)xG<0-A__<WeqJ|UA>OBba4DgVS4Z3
zMo#~z9#@Rno1Ysmn<8pl<9O;(n|UEEC8HF^Cstr2zZw%JogZtg@jBvTH(G8voz_T-
z@gdEq3g-lkQ6c=@p@G0wI_>A;&^W<z4b>@PlA2!!2SG;Sx)-SexL--$Q36i<O~^55
zE^1*6nWHfa_#dW1FBgl|);Q|x9x5AobKd(F{EjR7Y3B&hy^?FCt}m)_qs5~N_7}X&
z;HziVtJlw#M99sS+J2uA<OCH$_R^c(V!^2iqE+hG3M$`C=xLB~;_~Yfxrsj12;THP
zF8x-DEHDL^ui7@H678f$GWRh>%(ftHl?1x;pPy5O>Xw+34qGcaz`H|qfJ48ggPI%J
z^zTm(j_hoiOJ86f*@KW4?-d?bA@LVROFvh8>{IxYq$qhfKA@cJy+Qm=ip+EVq!hIy
zy;>4s->r+ixj&Az!wO`+J%f^zqYE`^21v_9HC5zUtZFjys%#V;2iJ>Lt;da1Dgpmc
z`GZ6~f#q7*ieNrd$hJ|_Dxh&M7#n<97mAgp>=QytBj1duEu)dUo0!F?p9w(EY6>^T
zc<;Y&^=CBFyP#SuC42tmq5bctVO;qbH@+*joFdI<=w-|xCPCAWL5nnh_z%8EW$KR@
zRN<<oOBVZFY?X3ZI;2-|rGb+|gJo;VNWNNv-&7bm_SmpRvdv@i@9D}*yQ)?7Bo55)
zF#bWd{F4GQAOpuJLb9aBOp9U26%G7&M`y`pnG!1K^H??wB!0002F+6hw@7BHmSHq}
zXa$+K09%%}C<>rP*t<i54cUQ7xGnG-|FZyxy?UmG{$OORw&|{Sj07wFJpRmnhSg@{
zmhBh^y|>$2&|RTGU_Q`!_+TYpt6J9!s|yP-H@$eJ`j5Mo|2CBxE0neO&xDr#QI)0s
z2xN?enp{PX0=nPjP{@qLMNHL1Vl`vb#I#$*%tV7t4hN=WvJ`_*lu(`#ChSQ;ZwP2V
zZDq&?Ym6zdTTX<9qvO#qmk+VRzL+jBh}3lm{2;#<hMiwL^9)u&$0xJBTy(k)$C9AQ
zM7`a)Cu{kUVC&^_|IcmrMOWk$XPX5x>nrbnch^xwjqQ=UPQtNnQR=8^G-0-=Skfm$
z6|^_X?t&{Kv1pFbFsFv@{@UOKL9ZxTaR;y0O=u8*_jS>Od*ooJC_d7ITT!;3%_$1|
zRnQ<DB!LFn%7R?>LyTyUq`kOeS{#k5PDv6qxN($#cz<%YDat&+!^cc#vMUM&MExlE
z7r&(v5{s*v9(@^D(LE!2K}weB8R8pL#?75r;9O7$Rn6C}p{P$$9iky+h#g>j`IA!K
zD1|`%#t!wzv8@JtRJjZqAQ)q6w^4(s+YW3<La7!|fO$FJg}{E$Zg~>(A6m0V_q!Pn
z;ps(Tp|vNw-qW8cZrq}3yWITP7Fy-bVd`q2XF!lF10g?@&mQ*9%~;)rpH^?|<tljG
z`ZTKh9!SrmVBLfKBGsDdYWcZeA7j?qd+R3I%7aJb&!eube-+evkHYS2SNOF@Q|M!Q
zZd}r$9e+e6$kmT<{N+baV37G7Qts>=P8`T56SCTLnH2>_l`ABCgsZX&T50|$re9y>
zam#{~k<X(lyGSwnuSn{6x^Nv$3qpnhkSrb`Q}%BSiEU7$DPww?c;^Ns_^|~h_skU4
z(ZxY>VE*cHT1>hNMr*PBq`E>lirMtR*Y%b&g>Xw8S&&$aZ0;}r<3j|mWf`~R8U@!;
zKCOD#36*iS`qQS`S@n7a7ZL_;Ha;#r0(p;1>~b%DBKA!hLSh|f7V2W75}$Xnzn;{7
zHZmWoS%9pM3DI-9LfHd&*{@31q7EazXHQ?HhYiz^y*dAEp16+9#46nmk0P;0_TC)d
zhmXJp%~e<WD1&rj6~A+{Er9Dw{OfOl935F*eR8pJYNYP*^Y2NQ>dP(OrQe1O!uHYk
zqi(5@qEaNLE5{n%M;*Wz&gN$%`4^)Pj1xV_sApPlf2e)T>4{i(oEv|3V)DW+|AE2f
z{H&{t_;peK5lwIW97SW(fYF}c%ge>B+l?(VqkFE$nuBz6h&FQS^`M0t`L4zX+HZ<P
z6WhAmC|H?vCUDQfJl2-zbAoTLj}oIXxtwI)XYG7!8H;|a0n7#3oqU|$I4rg&O!<=_
ztuD;xfeR9HC5;r{dV%)+EB6dSBB`FnPt{1Gw?X^4*`&>+QK{ONvok)Lsjtiz$FI3H
zxPZqXjRY*w&I9>dx-5c0^-~WatjZ9O+=v4_934%6P9MYE@FhhvLnGzuS7Z|UjYjOX
zXlZL%%jkX=Dvha6pElugar==^-en%YLF1sH<@JC!cg+@ff{9D5yIW3pg~7nsjK#QG
zV)*YWsne80RVF~%{uQ8&DY1*z7|kdjUS_!D*WSZ0{^H0sLI)catCms4Q42@8naQD*
zT*luw^hT5L=vAv8St>?$v1KG|-if}aLde>XA`33ANF#RhY_X|kToSq&2G{hW<=CqY
z96(nJ4jj>df!>W!ny=qyylEgLP*&S3T-p!ExSI}t_VV3!RxXuee!iV%7sd$9V^n;_
z<i7dX;V?SjecwwkxHL`5HJ_Yk%E@{{7Qn%*1C>QFNKuT+Gi}j#k~&}NB#8l{(lJUN
zd`KQ+lE7$+8B<6-F{;Z?R*?%O(i2WPD59|zf^krh#y|qo6eVUA4sj@K;Z3#yk*))X
zt8tJjChV1Fh;h#oGk%&M4T8;e(3_ji%LIM0;=q3nw<xB)k2v*}AbLB|l*4z>s4ZWN
ztWU0wOLji_fJT({3R&nl=cb?XhNj{epmbKNxhkb>X@TRHv}o*A{|k_Mk8={P-e_P$
zB<+_iCp8u2wkU7HggU@No1F5C)Cr2v>sK)QMO?xy%eYkyShASGs{v$aw17Edl3<iv
zJwQ5spkT=h$-BdcFo9G66x_4we@`H}SPIi7=q?V0sEv~;#Qs|bYo!G;^5O%UbZn`}
z6#@BBP0H|WjbX8{Py!-%nM}D!TC11OB{trJkMBBipAsUx%>RtMURXLXA!jT6Bac<n
zD%n4DN-iLj-YZnR72c&mnN<&6$-ZV8LQo0!YtIP0>b&+2LYK>7(1Ii&-hZXeih{?W
z7DCE{1t)i@PjrEUVFDv^XxUyc9~X*$861lCYdM5dnm!E*q5FHa4Ccom!}`=`xFEz>
zux~mdzYF|n6|9Eh`HPMr$KhCLc_xfyOPy^yeU!BxrvF3p=VFCU21P;(B`}0rw>2nv
zsv(+I=~qZ_IVa&;aH74YP|7Aa{V=*y462y#gU-p~0C}4cNzVYgJSX^YHKl6;S`HDM
zeutzW+LNq5+YS_(#v?SN$t!_Tyu>&fs0jq>E3_PtM&dXUWBhtd`2*{O8U3=d^#$t3
zIn`$~!63?UNn7as%z9IjtY(XYlFWZynJ{$%nVe$ea}_$?Yn7j3SZFR!w~(EmtOgVL
znx7pt2Sl?PD(dhse8QJizy!AM!_{kyD)4~|pck(~rF<uY7ZS2)sa)|1xjRhM6Mzpx
z6h(Ci<BWg8Zs_Z$HLqTETW=-2{&)WRTG|6v$cI|zk4RuxVvIr5<fA2mm4^agCza}G
zlR_HBY(|XpgB!EWRL>sfv;9IN-6=k}8h_50-2jw<12Q@iaHs<XjXQ-j9VXj>0?x^N
zu0vHk&iPfJO2XlFgl{3=3K{D~!4L?u;ZvmdqUcsjk>PyN?XaTkWs25wCi>t=>T4B~
z0+r@12J<lL6y2g3$D;ofN?fc<bV=lxUN9*QyisMKvLp!(b%1MW$~`B-yfH%YXel!^
z`Ft0u6ARn;L2il{h`1<qilNMQDD@X)@VNTrkLE*}p`*44K`cMSQU!&?&62GfD3h_U
z3PeyRCdlChi>q~cNqJFUR!KHh2>pJEJP!n?M#_V^PGi72tFI+d5Y8OwSIv-W2lXQ&
zsWjHN{i0%coN}_6R5M@Nzq_2a8>y*A-a5`NjZq{TgK>24Cd)-WHbCDV!9FNdzOhhT
zl`Q|rff8}2=&pX>?Nc<LPhM(W{<-TtF|4TXLGFu{C+`%5SHUFm7lG^Lu~2E{PV60$
zbxKQzTurq~#LMbFWAKLq*oYv*1xe&_<NZ!T5M10Z*+GlgFPqp?vwTu4FKr>rA4DY=
zwc*a9^UG3`SgU&hvqx9y52J2hF(Ym!fn}14LaQCJd}F~Y<TU!|iLSu=uJ*mPBx+V9
z)Lh69(G^hhn*_X|bzODBfCzP~bF6fYFQ|T=5PNe*T162(jOEBP%@GCcp1XVqfQW2k
zRSjFk{VnlAHY_5f;9D2(rILz{BuaFv>-2w78043ysV99nBkeNvmQbTC9*=036aH_S
ze@pE;D<fI^qg+0^!Q7zo#U-iIq^#{Feca<DMtO8(8rt7IhA~d^t&OBET-$j{XW2L{
zz^1X+w^47HTtbLMcbMD}O=d}i{d0zQ-9Yp{E-LRrEuzUrY00J>D9VX2T{J@fqS1i4
zFeZ?RI#dF!h;D6^mbwZKKId0bG=+>|DP4L3C!?E97tBd)z|oT(_5kUiyKt@r!@^5b
zdVO?h5<2uOTJ>&_>Pe@vpmdZ|W~Gx&u3GC?x7MDhR=skP)Zn7)1l~9^f=3V%pWpo%
z3qEm&R}h}4is5;>kkw*^dhYE8B+54P40qkphhN*PtTdK^hZHsUFPNyTV=4a<oUQkJ
z_GQo!=UM!9g3gL)GtSEYbnZhZdMJ`_@Oe@^D=sqC?S|i{h$q5$NJux(&a8jBb>|y(
zTR02yiv%l+o((b_fA|Qcx<3|EMKaO;7sDY@P1%=UBa&KZiGdKUXg!tCk&EinEmXrp
z;1MfF17mRb)%a`ZKB;g_%zwG8x(faJ*8LmC-MTOO?S<c1+k$n610Dag(dHuV^^gmY
zHR+O&?qMkio(#)`93Fro9t}6=`BcyHDcR@KH^QgG9s@+TTf-0Xc`><S2e`M`YtaeH
z&_LQM+fQ{nBaKSpEhC?R)lWC}Us0=5S}_lO0d?!S4`nC!Tkmw&W5ESo<VVyb4gN*K
zUHwyN^4(!_{(O?s+@iJ~kub*rS`g{wHu^a*5K-`%ru*}|DJuDq(e;&4T@qp8F7nlY
zqU8L3Ebf*rvzem<Tz41|tleh33f44k$0{nk3uibpPNb+Qqx2mQGWkLq^#%EqH~5l&
zLal`L%5zv>Ve-~6xttfpyu;*g7IMw%I?g4A?P}i=lc}2#cXe)&-(KaG+U<TU^v1~O
z^M;QySKgH6D2oAcV!vh5<Y`eg=5ZvIs##3|#Y*2z^{?iRuUzw{yFf}HFewj-!cVa`
zg5|P5#R`6+3jrMJCk7)ypztx`7Muw7il7BAQK>0V-D{+hw~mXm8h2hRluw-%u9@Z7
zkA!s#@}R9AjoxU3V92ZsNtii8;h1uXf>r@cEo2t#QUF(%;p9kz?t2?{e_@>{ripsW
z8r2N%UN91-Z5pL+$(s|fKntADT~m)5%E{bD(e=t`ycezBDAm*X5(;(7YGcTjvCqFN
zLMg7gG{C*|_pef{pfqgIFMHc{?cLI%oez!~QLRTNQ6Ur?_D#}cNyvAJhAP;pktDq^
zz!3jU;_E$2VhT8Qad?S6><AW$9YO5}I+p76?>NKvoWmLd?f3%CvP=&~1MPd?zPg|r
z6Qs(mhJ0v*ju%%X6QpAvRy0{x(wmtVqsh;HmEU|)QSY-Vut(mlPzk1@%*%7!$NW%R
zq~l?uqFcmBz$u;~LKEMFB=aei;J%Y|EMIcm)>L?3bPDfikqDQpH2)czk5|eHE-QkB
zB|_i#gssUId}S%9q6IC2O(4+A29N=%0v88LQHR@RvsZ&O^qXbuTNB0s)UPYQ<;Tye
zfn92!4r;m^k+(mh9Mxb?RUWex1wLlR+Hk4--K4xag;@FoN&Bx`Qn2R|{Ei+(l5n5|
zT6OBb@Nbb|-xXO<y4~|aYEzUc`T{~YpIQ~iIc8A3i*!A-8+ClV5X;secwQg&zS-C%
zIvBMDUa1Fz8UpTFGV&oe=n&zU&VmK%o>$cONIyWjk(brC5$fd8Tq<S+8)^-qFdm^{
zV!Cfvy|weN(mgi&E(6=GSVVUhj~dxJ^D~ctNC_tV^s|l0vk!y+)KtV5nZ;Y;J>;N{
za7*lx4<1ZAv_oOu42SLQj|=?m0=xbwAB&;POp;)EZ8|S{z0FHjUD1#)tI$xtrY>x~
zS^Rh}qV3v7q%nm}RtUoMxh1po1^&w)LG8_5eq+-l!nUwVj6+FC4r2W(t|b9xhT-^9
zruZRk8}*;O1g2G`;QNi#P7fEK-28opH)+k*H@9pQb$L6hm&yObeclfg^{wgvN5LN1
zTN1C8v3J1Fv`){xrUX(u=>+EL)nFS#dq9)MbEoIRfB+@|EQ8eM9{_)#LGWOn7*(-H
zaOE=oR77zQ|02PPL{~gaP8f|q{bwnJvi2zxMD2hLBk9B|Pdq7IQK`LWU4zv&Xf4-l
z!M}9jKeMm``Uc~af6mZmxU2#8i*1lMPCuKP!@t{`>ho1QbqWQw-w21tcZToZsbj+j
zO{jUMz6*~%wDS|+V*!o0Vn+IQxOZzAh?F$5ZU6pwqh%@4|DY7ymgCFn(a#+?TxQ2t
zG~=mwZWrmHzgHzP39U}fPW;d%aA-f{w)(QBpDtkj-evB~x<R)1{juC;icbd5qyl^D
zn<qE_%U6%3;IW?CGAYu}5WPP?_0zP>r1*BR_4F_EN~?xD+Kn#T7KwJ<&v<OU?pW17
zoPICeoWf{R_h@CT*k)$Wt}XQVQD4){FYV4K7$vXmY_&dG;(Bg-f)QF7@=QJCDVO{`
zsUhD#BB?u+^zoI-X}Eto*{P~b&*&tB$gCvpf6Bh$On3D(y?$--?TxC;oq2K3fh<;b
z-g}E@zN=41*He>!=B#mSbm%>~+p^E#ugU%L<<mdT&W6tqvnTUHLJv2e75*1&8_{(7
zY`H(pBH~+(|JIkcHu&$~uOfk}J7X+hQYoSult!w$wW5!i917z~7gL8<_>IdT`KF9}
zNFYZ<O|)k2!!B|ITeMW=TG+T2J?V~*Af32pO+SNn{k{&1f36;!$yKUG=Ph6}F+d#^
zb4!mYVR2lK^`(~JvyR+!KLH+DmL8$`N4MM)w#svf!@?P>Uq0Qe$vrSEyafU!nU4qf
z^Xq@)lI)TFo8#Xj`#Zh*wn`*Uw?+lRDz2$a{%7^+Ri&uXFY+A{WukE<t#qP^F1xmw
zv7z0YezK_eRPI~e-0FO$cQiR`?(n`&+%GdV(Vi$bf9gIxVP?=^&ZVxkgr}K;TZ3P7
zJfh2dV|85FAi!<KQ-5dg-aA1ntE|94OLtYlSeWF+J|FYwAFEB$$e^+y+qlH`L(39(
z(@ZOdyy9C+ZgV_nJHKs_!5fk%RAsMU*4NM6v($)!W!{?fH*J29Eq!JfLsxQY|JbAJ
zO<aT=9W?C@CQh#5CiSaBQl^sx-WOV<N+g+XC#eNL6kmg^T%O;Mn&VG5cMZLrrO9UH
z{EB^kv;Ni9HFI%k%}k>0<LaE?*FqPY9K((0UlSi*73MywA1+fjR&aaY`b~&gUoOql
zv-XqBrDy#l?+wM22U^x%O+PXpKWf?jaQSE;`DEX#?egT(y9@IAw_EphE-g;>Tm0O1
z&B??};X5Y2B)49n|7==c8vN0qtr0o><3IkBP2)KSQidw?Cifgiz*n2#_L>QU2ULO6
z_Kmi1eeSFB^r`xNJ-9WzXHz8VV9@Tg><yJ7<>Yz>!$YQ{XXu}zd5!<Vc4%_<ev;2s
zs5~b2Rs~#E@EzR?SAN~i?asuh`>&ii{P*Brw?2`7XQz3qhCxT95jw2{;iw?5?eE9`
zEYxl)M@K-5#sksu?GP1$9?2p(glaAOK;KyZ%E0jI-y4Z~&7qr5dV2c`%2p_y!dFQ9
zG-G6->alJiTok?lUTq7M#GDUd{W}QZl8cI6UUxK|>gp*|;-`IctQQ?@{aXHv&<u9e
zP>^u@Mm^V0Zf-fDd(}(9Tds$(Ox`5btj?$Z9iuJzAwFq?$cgLWXO$@Njh^rRP8GOH
z5x?V%usrLhz-^{bT@<og%=e@3Ql(J);AnV^t;vnM;(01@Y@KCM640Im)^rDy0a1tT
z77-@B3xS#~Pf$y^4!qXl#rjp=346oP-=|cVT*;j#qor;@U%crmn#3c@df&i4Q!k6{
zM=_Zz(+Da;2cD#P-*5y3iyz0qz*ar%kSqOUYPW6Din9W>>aGgrwLOM|8#o@=ozAE=
zkO2=CfgD$d8SA}yHkyl?D8d^$f~x~Alz3I9o1l@m^dht$FDOG43LgMR`6y;Lrvu~h
z*cWaJhedn_iy#<R_74u+vRPB5fU2RfIwp=*t8ujpp*HM|S!Y2i{N_W`Ru)44b>U>h
z)F%=<*2pmgCoO{*lwce_QH967y9AO%46iCP@LD%X8=gYNZr+i<Kcu2m0OyDP;HWPH
zsX+G`qo4;25?u)AyHw=0tIjzBB1i)mj)K<BgZ*RlTf>L$rnz@Ac;5cxGgJO*T2^lI
z)==8c9+H%gWcyH!e>(0D6kA+ndUmr|2O?GOK7dQIRKa=5qA(57u{^?kWEg&R#-8#o
zshMg;-vU4+Zr%7F1pu4mI{{uX&|G$QQcdeI6?5q20`)n4Q?D1pBa78%B8J?2h$y@&
zae|U5n}+?<)4_nJinL4A7OhC|Mo_y!{@#<UM#@%EZOau@Dv^RzV(V@wj9X-1!<=4<
z7#l}@3nQ{NLkm05e$rt4RKu$Wp@P$Ta=OfA%EH)`Xxt}xuR7suFSBj$X*}zD@#jz6
zqFZQ7ZUu3%jJs$70C`ze0yjDeAj?*J8Q%o~Fr=Kt>fP`}b)a6H>v~EUL_wsw&YKA^
zcUfvmxMsl=9G)=(R~V4>nV1>h$V%J}<b^SPGX5otp^q9Cg#KpiG};Z&F$~h)<b9q>
z19jl+Umg%S@GWiwVVMjDM@A$Lu5wddv~8Qq{wq09&-aa2L3|tzD_KWDtG`3MG)N!w
z*T|E!;f3juBM9a?0_hqV)A#JohkDThUF!MrH2h2iEHrC$h1B$=^Ar?}=dAZ3Wv&XH
zdQC6QO*`dkRir+-QTCCo9_t2P0+T(|i;J>d`U!5AAEP2^kdFa*noiBoR>x^Ek9$75
z+xg<l;}A7OctsRg>cu!{-9I1Ygc^RKcr%)<k?Ff_4CG-U7zn|FfMs%@5gQOFA1let
z>IycWSG#&>d=Nij3kCS|K>)!QK|#P$1YqGCKraZ2#exOEK*?7%Xl@<=V!;5Ryo48|
z+@ye5jv6br>m92a1OU1KF&S+z2^$2gtiA!p07KGh-tff*7O69NC}+nGc(;26opm;T
z!x)3i?P5VALD1{OA!5;z5yK!qB<l!(u8rf&TaTon05OQGZt>R%f>vfEsHIwQ*B}N8
zV2v=E{!AZ{pAWC=I)PxLc{MPl3{WIW26R290kWIQ(>NU9a$N`&<7W9p>^@jp4FWxY
z<(7WKx?>CbVG^NHQu)~b6r)!fZ->->{&#+H0RV(17@(0){$OkNMm+vXwrZdBkit-9
z8jfpQ6ZjoaX0Y^&KIG3wRrZT(aT`G2<eNw5PJuFW*!ySO+B{kSZ>qY{vGAaH=b;@2
z8ndiM?VuJVn2(J#eKB$d1J)Y=U;o@|@SwX)l&Ci*ucC?(t2#Z2{c|Dz#YWPfQBtg0
z2_n}CiIUe+6rc8Ja|f`D<KWi9&cAm6a6HJ;K;|<|U3^m0M@hVEVN@v>q3p8lMyr}O
ze-{J__>ZfJZmTk*fdf;;V3cb7b+(k)-AZU>6~^Q(NP`{QAQMX9P&geDdv>GkT(h=j
z5)fh$BX?7U{#5<ct3<p|^TGiA5G=A<gM16{=9h<Qsb9eX1WZmH`cM))p_FbA4UUq_
zE^O#m6mt}l0=57nQyECkO=kYSVS{cuDLlehrOWg~zmTSoRxg^^L$ZbKQvlr**0}pi
zMI{Pxi6W66=jW&-<($&mXOgs$Bp^btkQxAjK|jjJYSAi*ztq49$w1Vb&{AmfY5;n!
z$}9x1qXA$N4qTh*1=_(@ZPzJ7$9S~7Rx_uV&b2Lv8PjB@C1)@RkEv*zo+R9pLbK}u
z;0ZY$ZuEUg9TzDAO^CL?gU$*LJ1W_4w9_3Hh36ndg@Z`KvujO~TlWhGc&LG{>-%=m
zO?$U4<t{bH5FBi){ib4+O;<k*3S4P7#oq9TL(2e1ble{aybV7VDHiKu4AnXWL9+D}
zk2=%Cb;gpKaXSEH7V0${jY|f>n_#|a*qSsnvjbo+216PHk!eFxO|h?AW8KBDsb)~P
zo4g(o^w6LU><j#oggrM!r<)Bi=PHW;t^QI7^>qCg_4@wfO`Lks5DZY;T5PJQ6P3<&
zyE0AIEiE4jH#pP1LpFHbImom5z*#K|sA2z0Q@&m`baI{f5Wt?SDf?2#)Y1@P+-&57
z&87ih25<(0Ca}8Pn3OUwtL=Rz56EG;xX{^2%~ITiSVQfv5G+szX!*y5La<=tYNKlT
zu!<_9SwjGey|Ocfg5u?KlhC8d@@Exr1}?0WTQ|~8>+_A#Y)K=}OL@>Zc$?-E0%-4$
zDr^o<W1&WR5#yrb5rz&WnQ~CKaRcnmm=p;J#1Bp+lZiBtu~O@y-;ceJBDkPs!BlVq
zk5u<rZIoj(xi9>W6ygEKc+7vuMG}T!?K@9K1JY=FtQv}G96|*rGl!xu06g$B;^MXx
z6;C8F&K`IZ)dhA4Wy!*V8SZ~>;Mb-KWb-!eCeKCROyak~#?bh5_&$bH0|1J#gIOCx
ztxdyp7S+fft9pQEC*ox>|7A776$ul~`4e1$Y^JlHkyN6u52C<Z*h+4xM_rJs#XDEr
z4Z2T#@7V9-BLYzWAvJ{WlZu#|LP>5aNpmSLO@eQIk==(2o`D0<&=7u@jv6$37OYf0
z$+T{uDqVP)XeRQ)?A9*3+AfWHHfqh!Ofh!K;C_~}F#tCPj=2bE2kaf~mVcpuIqViE
z$0vkSCyIw4g)xWm>#?uMh|_-JBmjj5+V*lFWXNsD*=RnWajENtV6Fun#{%T$%#Nl^
z?_%4I%o>_ZA3m)C%K>5josjDd)2)k_rE*6ffTFSKQ)sA<F2onR9gcyCVWp(;d}4ri
z2Ea1`fSQ^h{^GA7z-}wd+Z-Un*2O}U>@ff+ejMy8mt!;JbwBmWaF=pGAR);dMcVt-
z6E>X?NW0>qeUD`Z3^F~+nL%q4AU-o-E9ubU8Kjk7#BnOSGVnY)=F#pQJ-KSvbik1i
zbK6F4#6SY#GYbYGm@!ze*q4;2gv4VCFG7?SXM(I-RoWIJa&5M5{O+xHagzoBTn^+V
zrXUg>vs+o^f{cPYU=ecD1ZBc&E(`yy$!2oUwFw(0Cm|AomD<8WLjWxrIH?{Miq&%*
z2YS{Qq?T>k9s?YjbLt~K@DSkqC^q95HljUm4z)Fl08E8&2)SxL2LMX6f>|wsrm#|a
zz;Ok<(+D8XALR2f4}5piYFr#nu*_j?Ltt#L5Dw<xR2U??x#)5PyfVbN^*)vcK-M+C
zX}9a~!VXI!*pYyUr!{$~^;taR9#cZHHp-0%d1plW{;3(&W4Um<;ei;V-UWr6I$4qM
zh13ii1DFv+52%*JqaExYD*|46@RuGIAT=F(HEcJu8HsIP^#s7n5`%W)k8gadd5nER
zjwQ*AC2_C>VdP_Ith_AeT;!qvF#yu>4WeILQ6~$|pNUO#fC1H^TtHHx#R?r3>R|bN
z!47OSoOE4%HzNF1HoEQ$AOIN=G!}e@6?I&$k&Im_nt>t#Xp`fvBmrt^y)$~xJ%VPB
zHU71UNfbY9goMo!6Gs5YUPWAYe#71~{YsL8<E822&AWtKE0F;<DE^wn8NaH7W79tk
zn%=X}<56`oT7Z0c2w4U<6~ms<0jV&fW^*(w{y)#?>c98f-1RJqx$fw40cSKdp>46s
z#>?`3PW~awrW9BjB3z77k-ZuyZU9K*?K}$|o=?WDEGd3GinaY$OMd%f#ie`+Es*UD
zcmW88q$p+M8Hyr{iZlgsPkI0Gm0*^8^-u3Y_SI%wMv)Xz(_|oDWkAsryCOYG`%huj
zd=2vO<LZc0>C);ybbsQOQ`8w)rJP$}31lf2twhAjsezuzK*E72W+0Zwc*_0^oX@m{
zQ*n!2j%MbMy^`B1OPs|8D59htY0A|qIA*7|fBjIN21suM%w=)K!t>Sst0ce*%w^3l
zz@>?2&QBYy+1f-yZ2X(2OZ6CB(`!-vxIcr(_>K%7F1C)iw+6uw?!Fqx&_*NA?wjon
z3CY07$>fs?hvh0e+52yUsuk$C<PhkZZ!axAna^Z2IDTDoA^LqA&maUDnRYkGrf{L_
z+5zx5*v}RFq}@J@TmeG32Tg7N81Mi#@vRvdw>FFnqvuiQkL5wf43-th?LSC8h_hpK
zGgyszL=_VYj~aOfG2vvoo$r<?h8JlPOFv7iAVdW&JEsJ0ayG5R{8)#h;UGqR5CNbr
z*}ek1t?BX-nndRG6wx9Mz++9oarXN+4=gYXAtWgwe1N;Qb4XTqnAoqtJXhdMJjU5Q
z^S*kSO2dk>(_JmO%A`jKf+ZxXS?bK>8qu#C_vs-87M{IkM&@4a0USLtbiXT&uUif^
zME_}5biQ%VVKR=g+R^W1WKw9}T@IAgx(hj<VCUT-#XVSafN>4ZC**Gi0-)Rcv3D?V
zr)=KH!RRL?4>mPYC+Lx5^zl(0+>+yQIo4!fM6ZXn6O4YQ|Hl!pa62)?2eh9aW2#_c
zQou*JYx<zc>gDC|e1{ibCKe)xb@ze4JlxIBTu_1GGm=LxO!tC?0Z19VYE16x&Brc-
zH05JWxgCn``@FhVjANmF_C^(-OGQmzwY4ZMK*4(0=_8mYn?jtw_u1ZD#$|85bM4<<
zj}ey!v!V^7vYTFKw;*nJ{n6ss!`Nvl1ff-rcoDtA^S}{kHOjWo#)^wJZUmD9#~+9^
zpwyvxAFrIvJ?*D5-3Xs}vVeRTT8)-2#W&K;H!@_OE^9yP1nvYx-5Btl5>2pG$J_m+
zi*kq=vre?P#6?)*&1dmEVsGqGnXb1EM2=$tW2~eU0G^HR{NT07X3LZ0aHja_Ng!5G
z2LF0NJfz}#GdUJ2CXr+i{r9g;b+5b%AC`o15uEJ`#$e&`*e`Y)SDnw~3+aKscVk=t
zMK}hV{nCSBQVC+IUttQ2k^BD$6o+pCB##28SdQkRy|n>FBmoG_h-H@sYSQHG^&o-D
zYmo7t*uIw08y_ECju+h}$bN5Nsl+l8&c$y|Q@BNuV($3K{B(Lb!`Ib9Q4NT9$^?7}
zAeHs}fP||y!B11;<@iDLj2UGaAcp0PiTSAN{Y`5`(Cw!5DyOI?`H!_6pD_<czx{%o
zd~}l9l<7G~UjYj)z7DZ4XDC^|^F}dnNA8vc#)U0xqs3YgYD#lt0Qqc8hBTHFjRgR)
z6_$I!yI4AUfJ22K3~9}qvCm0cp)oV~)MyTp0gfkkufX|sqLPoQ>ojlOw5^vxSY^8e
zu1hSz6=wnfu%#|677Jc(=DdwQ3Gz;rxjvZWBl8x*Bmq*rnOXn85M%N9&hK??dry>s
zWgav`5@2*WywcXBG`R~jwIId~orDSc-ylD}c{Ib2R!H!f*aIS_Cx(PU!gGtr(HBq6
zcSj2ej_FKhmi61&+UFW1aOyr6ekf6x_mEHb<3hameZ6przY&hmy256WnMavNuCCud
zawy@cr<=SJWFr4opE+9}2~3sUDWz_=+!y>>Y2D~2U22pm;6>RG+kfFXsNvmcXfDYJ
z#!@~Y=^i>LCT0rPz$4~jEsf|k+pN-RMg^}(#WbvjXrI%;CvpV(C?a?OEC%Y}^^!IR
z9Bj<Ut)%!z=fv|-3Jd}W26*jWNbleo-hO#+x3EONP~R|QdGKT4Q>lFL*Y{DyA5|p(
zIn*o{wSHhSG$W#Ld`Q!`oAZtSk&mQh&WNi6-s>fTs|%cKGj;5*D{=0}6r=WDm@eSy
z$;D~!tEIoHSmw~4TUhN-$Y--&<;D~vn9lTnIygBwj#xU^Bi2YJ_of2P`FQG7ddi({
zjszZFv!|Sm$;Xb`1W%_I3F4VsuVd?{(YC=h^=8hoBnM|)1a*>!H{vAz2W&u-zZ!XD
zYtJl!B$G`(q@<HkGD+i*Lzz*68A)*mjUQDO|2P~sJ9=58m}8oGrawhWxh9)!y7?xY
zarTE1nk&Jg+<$gJQzv&h`B6)4;AmMTD0q$}11)?i8srinz#=E4C7u;2rRz;vDW+V(
z0>ToDmJ~;J{&*t^I?u(Eo2R;6bBGaY)W!%O+@%B5N}L!fQkkjh8sHlsV3H}Y<k1%_
zvE`jtEV2*f0fHpEhV(-;NiBhoP`a_=iL<or6O125*fWwcaZn*4Cd6a}j!mU}@dYgY
ztdoZs=#=V@GiLCCU>>xXK@Ar3inLEZ5OTDS8mtIB(kf>Bpd5o(B<c@3f-DgSKHkI;
z2RItxgUJ_fP@@eezhKc|wj~d>=@-eW|GbrlE4#en%P|k(sL36fQG+DweBsXy&u!sO
z%~b7!<460HP)aoI!cs#<aUkMM3CbvAt{F1))~Plnz`}@7AW&iT5}}5~3KV4<aW>j$
z>o^i0HIx#Ea$jKaOAX5SLq#0gz=97wbla`e5KHVb#45j(umdbE{2esoEM4?#%#k|;
zrR0@UUU{*bf{<(DOEsk%G<Gx|U~j)@gs9Q*fCIuCgTktjAZ~L4!ag9NLj@?3G&>YN
zTX;fr(I7<QkFB)}Qpyq%R$U6M{tWRqF(p9wMd2*8ghjifYyZ)vGCYGh_~DB`ex@?e
zyglsL>E_3t=x>LQBr@y(R4FxZ|FSd0abTGdBY9|KM%YSG3Vf8HDcZoq?s#Gj;DID-
z{4>KkK)?wBn#&)n_yG&F^t_BnCnJRWMW<-83ipvPBfXLV<jD83OQ{f9ENo$%G#5gX
z9ZVyftBpONP(o9csvj&cS3g_;0=t3ZCEB2!KT1Ibe*k3_$nl3Z`cXhE958{}!3PMu
zK@1QmM+PIrN5+PCHwiiKZ@-WMJ{SRl!iA7}J9J+>dIf?n<N+4XxFa6(sK-6>v5$WI
zBOn7Q$UzdakcK>DFfeh*MKZFHj(j8}ADPHVQnHekyyPP}c99vD41^s))ON1*M%#F!
z1~ur7MkK*B3(DY>WQ@lt|51RTIIzG4Lm;35F@cHyEUN~5P!4Zo-~#9Tpp`qwnDa`o
z#D2^S3rm27Cux$sQEpFj7r7=jv#HH(a<iM>{3bZVDb8_{vz+EUCpy!q&ULc0o$h=m
zJmV?Pd4_YECX41qZb+M-QPVc~XrA-z$+>tOY##uf5ChB94+drgLHOv03>MeV62=1-
zl30S(GOE#ya<ro!{U}I5%7TlaAfzI_2n$TA(v`Bbr5`PUOJgcik6tsSGtKBoK>*X6
z^0cQQ-KkH58q%8jG^aonDpEcA1}j!6WM9z67fcrqNpvhJ`;b`PKqxYsSPWws0ohhF
zf)035gDBT<)kL3j|Fc`Yu@o}Ef(+u2*10N5b9unZ%!Ef*AjJ^`DBOw+_e!P{rVuNE
z6>M!V+9)%8VIMn~+YS=71S~{j71S^s;#@$CzSS)wm`$8A_8|j7(4qtfJ;@=0fmo_g
zL!Tw=hc+0x+Syhp8W%weMe-^}?V*E{XX>jA?rPXg^47Oz0<Lhca#-3*C2Sm{1{G+*
zf{ZMI7OQLCFRa&;>}}8=*}Wb#K>!N3R`4c%kS%l5tKRjF$+jTCZA5hIzI~LJPm;Ju
zawn2krUs3^p1Lmx@+*=3vKJ~y!2~C?F)lns_K4VR;|R;>SqQH}1_CSvGH;>=ZWOq~
z9{zBJ;$gla|9tNu@^v3ROy?>0!Z*Gb+3o03oGKRQ_QfC`%7GIc-5UvlW+)H@P*MzG
z51J9e=qN$P(BayVcmhy2elnD!92F7!wZsgW*%Dy9y>&Qc#pd&#i}i{=F6$~9U$(MC
zPAp}UPyu8*#>Wo0XohB)xdbSHW*fPyOz-A7i7BmtGll|<L#(;bhCcL1;?XEDD`dHd
zHr1CO)esqK`O#CMvJ5265K3G6CJ8MHdP{PuPLsOS9R_Y;&EaSg_SRXb-ZXJb*y>%q
zdLgSe^{${0YFzWW*Ayk}L2f<Y`lbrGjgEB*{p;!z3Ru<1_O-73pb}_PyV`IBwy;sG
z;%osp|G!_j2!GKh<C1k7A>U?}wROb`0;Rj%?k4wbpZ!KMn@n@KRr3z%T{3$c1mEvQ
z(>1#E?|~B>O#l{i!Joon^C3LpJXyGn9d0Ik=uqMozqo@oWlw6(x@J`7RHbEYTvszZ
z%NQRMKTodmm77}GL5rgd=IU~fzai!<ACe_hd-I+1Jj&x{+>%N7^OyHLNVTv;(UY!p
z_3C@+AZfbOJ8cfMM!o7*zdF{l4y1}}z3X02RmZy?_OC}-4dx&_+S6X8nQNWxYX7h$
zoLrzA^%EXFdpq8RzU{6LJ?|Y32GR?3r7VpS9z&49PyDWU#z8&njbD6vag%Yj?(hu}
z|Asu~Gp~89>$*Uo%E&q-sts>!uLh-B2PZH=D{V+ZY@2`mkH(&L*~4D2ejpBjprs9M
zyn&3~b(r>QCn{y2D|@Th2Np71`{g^x?O1m{^V7O+!Q%{yzE9%AMkj+G0Feq}g2xi0
zFMa^^J?rHke?O-o@Cj+-`lZM|`pf_hf#Kr|K}SFSpYr&t?|)1+#8v)*1jSKEJjB5e
zL<24Sf;UjX7x;_zaDs7gLIRq>5FB6tULXeU3OLx@NGweTcEs9P2qx^B_Ke^MW=lVu
z)>GUcg&5RIxS)g3o>Tx#QLx}_$)J~Pph?)E_#Hy~oFEW>5({)0RCu6Nz+X}D|3(Qo
z2S^~{8^~4j5!+OlfeRGS$*fXFID?q%K*&9Z7J3Qv4N16QR7R8n7H|Sk?1Lmw0pT%1
z9PE-tgo_zS2qU!LQ$=4q938eeND9873Nj812H}{{0ue$550V53kl;zg0TX^iB5p(=
z2FUqIMLbyHP?X6MY#SE_NG5v8BnnA(F#;&WT>XR<*HFVQgb~+hL@16T&-_>(RLk-O
z!xk7p;E}`^MuiLvVMsV36qZb(bc7N%q96_lA#Q{jqM>KOjZJ6+DD1))$W<K*!X3IH
z9QwmF-k}AVff-yLNbJMvXahRD1S}APbbvw`aw9G51IBRUOGM1X1P3D`|D!sBBM6A&
zLtV_ap@SJvfpf4UIJjd+P(z|%LOc+pKNzGoBnl_Q!$J~|Lo#GE6k-wzLKwsWP*mbZ
zfCDvB4DqmGso+B%_yiWD(Hm+6It&3PpaX*Jz%NjvIC6p@NJ7Gpgc`D;IQmaUNP;%p
zB;lpxN+L)So#8&9gG|yS<&6YF8st(&Bt$-BLqg?5*2xewiw^z(7L-CPT2Kiv!a8UK
zG00+7`hyPcKr?dS@>zlr{NPA*;t^8hMm(ZX{2^^9;!xPiN6cd}R>?7zVGV@UDzJbq
zF->WyWX$aVEDA+5tYStWrXXx(+q_Lua)dH8O5n6h9H4+1z>7b;{{iA`CKlBIC@cXY
z+)du>P17`@XWmI3ROWj<lXumGM$|yQAWCSCW@&OnWntqw?50=xW^azrZwlvEN(DHu
zKpy<UBWk2ru|OOc4m!{RqT~V7!~+Pp4GW;dVpa=2EI|p>z!JoYW5yyia1p1-fbxCB
zDW;-7)IhtyLkXnO5TIfac_(<rN-2&^d78m_rsqfiCx8-Xfbu4v+@n7zL(IjM07aNG
zU;zk(N?2-yfg&i+439UU<?`8qT>>RbLeVou<1(6oO=P20ts&w0Ltmz&8LVSCj$=RQ
zBTDw;KenS8*ri7NpHkR?&Xoi)=*vqs3qSg!MkLI_FcBjF|6gkEC0}+KR%)eCh^9Y8
z17V^OJ~)S2LXpiyXk(sb?F<iIA|j56i>T~^b!Lnt<N+4h4JXLe@-&ZLmZ?9S>4gxD
zAT)?Jpg=}&LP-u0@%*Bf<N^LHrzJ{EMxX#XoMEAAgLQi8OK2%|Y2sN@L(G8yI8Z@Z
ziNq>&WpUOIHp*3|dZk9Vr9U(&c}{AjUg~=Nz)D(;KX9W`B*mp-LbW)ms-gp{ZsLWG
zA6;@pcYbGhqG$;irUeNmCNRx-3dMRNQ;M$UX1eBO#wN+orgYN6ZIb3m)B+ToP1$V0
z7N|kCnq5iU7k`?;bV(~HMJC+P#N2e2Kj@{B21$x4|7a;3AEo-kE)XUW;%b)4qP{v1
zHcn<o$Yr}WA~8&tKjZ<L(#e-zPzEKbKNM_6AncrOM4fupD$&9YU{Rg|?2imVc3{y<
zFz4OulF^{U4?N6Yifl$Wsy~RTzCxEjOqZpSM1wwPMr4``klukhXsC#)yjs>0$t<d>
z7cAIW{P+X4?4okyK`VjM!-4<{1X|Ie03#gc@aW*XimG(VgmXZtl=943awVu{L|?+G
zoTdq#+9{qA&z`EOpS~bI#DhDiff}%-NJv7KxPU*Dz@6qP7IZ1``~(ObPx3hIy8=my
zx+-k7=PDd$%%y0BipsufguY^t7I9HVL<2E)|AY&a)l0ambw(%aXl&p{X-15T!-g&`
zuuevFF49IwgGf;neSsv9?w5{99K1nyf&hYuEH&bTgQ5df!It!>?8C}pt2WC^yll|k
zO<BPMBgj^)R?F;E%k*Z%oV~8%Y6Hv)ZHJu}@VFK_&=2w+?xSi%iq=lX+-v0K>dx9M
ziaG_v9;{9ZtUpw&cU^48DlEsAggJ27Nk{@FXaiG}0Ns%74)`l0K#&Ackl~tdjjS#U
zv`f;mfO3=q)UE<XK<*}D?G{CC<mzBA<-r>?O}&1EB%pu`_>a4`DhTYrMcHl%7gG%!
zQ`3|{cDgVOhfoTyaD+fDgv`$2#Dff<{|Pk+5huvN@K~pFN-hX6LJ7b_JnTRTNRU4m
z?*|9kftFOybg&F`@7*ND>bl-WFzqQlj1)bL89S{qa52&zo&|$(oB5gy1da;~3Ir$b
z>q2e~G;T_@Z_Hh9{APsevaUb4ZgAkQ?Dhlg+HU{ah5!@r-Y#+@XVDgQ(H9|83+Hi=
z5RHwFgiO4IY$^o`EZIJ|)~+p7OmxI4gG4_ZVvzLVN0f>^3JgK5giw}5bcIBj9B@8$
zL@vMXzoCPFLU0?)&me0A2D5+$hj7fT@xw@PyYS}@@1zRrWRI~x5bM+q5V69RaDhZ}
z0TT~5w?r@f5|#=R6Y5V6bMhPU|Aub>2lkST!`%!PumBnBh7y&;FMLfGx^vM5Gq1A5
zDi4fnz4DnLw8nG<ECclD9LPrCXu{zG9_xm{)Q~KD1U*!=LwB@Cf3&q>El2DkT!OSo
zpEOFFnn-g5<fgPszcfrEmQl`RO<q;<(8?IvTr$#1OUJZN|1?l*&wlo29Ax6ecoz$Z
zA}Rjm$dGMG2Q^ejwNx9isZv2SG^{pE*H~U<R&Hf7Pc>MFwOI3r9B)xeSSJ=G1%>{s
zQ;)S<zcpNIha6MG66_KtbV{wV>h`vET=%tK|20g=u{K;a3b4TNOzqKDFrG*=U^lj7
zKQ=EzVn=*3WLLIjUp8iE|F&jtHfMLXXMZ+mhqh>sHffi(X`eP~r?zUZHfy)GYri&Z
z$F^+GHf`6oZQnL-=eBO|HgET~Z~r!M2e)t!H*puYaUVBwC%1AhH*+_)b3Zq9N4IoO
zH+5IHbze7jXSa55H+OfpcYil{hqri-H+h%0d7n3Wr?+~qH+#3Yd%rh)$G3dXH+|Q)
zecv~J=eK_EH-GoHfB!dt2e^O_IDr?qfgd=6C%A$yID<F1gFiTgN4SJfIE7cZg<m*^
zXSjxMIEQz*hkrPThq#E3IEk0IiJv%%r?`r*IE%Nqi@!LG$GD8oIE~l1jo&zq=eUk*
zcsG1PCfI^C?6{CC|K2>zgGOWm7a)O>D>)pTf<_eikVkpe8G{%gffbyBHJkwwL;)N$
z!YMQY8z?y-_(LOD0TRGLEJ(SUFWoyNITD<KHB|W><bprQLy-GJF=#m;NQ0Ym!JV%;
zpx;~}Ecq$G0TSFnM%+OZAORONLY-^5k1u&91UjX!+@K?Y7%T&(cY{9|`jR8TC-{Rk
zSb-RHgPS{grKh^Z#e$M&LL-2>KWO@=V|qrsdM@;Vl81Uoe8V^7!$$DBuaAT}e1kq@
zggh9-GTZ~N7X`5YdaskjuorusBfGMH15qgZJE*$0mxMfoc`Tek6cmF$Ov0=yIj0)~
z5)?uvV7ifq|3s4Ox<9Ccxs${lAc44l!;<HMl1sEnyt_uoI}&jENYwki=li~|#5cf!
zk=p_ijQO@dd`QRxAXozzh(SgGL%Calk$1zP$AZI)#3vwu7ih#Oh<r(W!W{%TtDk`}
z)WaS0K~aSK$Y(^!&-_TByvo0M%fCEKD7ieu`W-kq#1DN(yu&G&`WYDcJh=IiBf39)
zLlpFZHDLKjkb{z2yFX~T&;vszoC4P0Lo5`7F=T=@6hkb$gEiDU8^i)X#6p^1eAj<{
z*pIz6kV7mi14mdr5@5a7!@bvM1lWr`*_%Dut3BJhy+$m<Cwzi6@IyxA!`T0LMld|6
zlY`yk|9wVC!{Qr*MwtCP*g_`Eg5wkYkdK0vBf&D9ffZoAsV_MkWV=7~0uuDWEHL?`
zhXkbi!#gN>wgbYa_d>jX`Y90nx-a=X9K7!@Iq(C#lAi*`!#qdi{_Z0|@Be=A6FTvK
z`tc(HgcQG$7eYpOx{^D(7c99gFucPjzmh}0p)b0alm3pU{->in65PJ-$HFAozdx+I
ztA9Ei0K_tX0|^prg@lX0Q%K<WTZY7nwO$bUsY8OKP^@=%kQ95@2xGW=7yCVoIMGVQ
ziy7Z_YZR;Cz=H`FHZ&=bqD71vIeG+HNF+&e7kgQYf}~qGICtbtOxW#Wv3s_V0P+_L
z|6;FPM{W6ogX9c3tVm*(HG39qTD5E0wsrd!Zd|!@>DIM-7jIs@d-?YD`xkIv!Gj4G
zHhdUy*{>Hb!U0y*pFCTQ?!f6YshGccXQEg;!?-b8c^A8Vp5^Zo5;3vHlG9mlU{8Oe
zkYw^V5=p<*t6RTTI~u8J)T&uubbS%FKiRZx<L;MB^+0+02I@1G=`&e>7v=e*YPAoN
zPXi}G{t9#6MSh9dw|D;@eth}!>DRY^AAf%R`^$;}jij@$;IQJqi^O1~s!R$LBdxDE
zLgF5O6hw%N3cJyXpyg`2jid=Hv=GC!9K0w(4?n!{q6|BlZA0e{YN()hxPT};|LwT*
z&O9VeQ-~q2R>W;R{)8No$RdqA63HZ$T$0Hq)AH}XKFA@k!2dGoWiiGWL<_o$`WVQV
z9{Gu78I__?F*D{k%q`4@#w^pKGpmy)!m_$V;!A(p^yf`8(PXhXlEOrSIyl5wW}!R$
z8OlZ^-oeo-1@rvMwy%s?Ge{>j-IUW#J^d8aP(>ZpEGYk51{f-<yvT||Y&qp91JlB7
zMSt?S=njs~=qJuU)pYJwByt6dR{#lmEYFx|&CFI@buCs-<yQQaBz<PI0zoeHLFp4H
zsXNNC@BD!Z2`^@J)W=JKB$eHE-F+9{c;%f}(@##h7vD_Ck%yctL4%{1|8vEQ1>Z*0
z0t7(n2C~KrTp#T<wiOo&G&g@3cGw??{XzCDgriW{;)aEN*w~0On|RHB7R~MsYxqRC
zs)nVJ@S;<wDrDj8&gdrMOM}gn-k^mZn&_g9KH6w6`iNzgOezCpl4ZU*WfsuJv+Ev^
z>B^cfuI<VvpP2N~dZ2s4HVbT|)n1$Jw%vXk?)a>^C<;I_X@y|ygq0>%08fb<@W2Hh
zobbX8KiuL~K|3Wi#-jKe@yI2gobt*ozns0f6=xNg#xL>$^Uy^fo%GU8AKaRya$TME
z${zI`iFr<+o%Y&oza4i_KRL?a+<pHY_~3;f-miDaAs+eUm0zCu|K^>49{T8|pPu^a
zt-l`o?6u#X`|j832WWm&PAk)UU<3Lr@XdM${g~AE9{%{{pI`7okoabxVvvCREPjxf
zWH?CqpIX>(hL}t!3cV{88)EVi`aKYW5tLx4!ekqNAnZ|TIfX#Zzy)&jV}k@VAVHwg
z2VfvfAPbBMAfh!v7rqdNF{}?iqL2`M^vD=qs9S_i;e|U`K^|iG#DsPw#6=0{c>4H+
z6*A$45e@_@fcVBea=|k|C~6+7@rM|^FbOMs!a4@JhZyb<g-_(85K#~VvzGWp8NLyY
zag<|Q%7YF4*`gm&fCE+xrXV;>!hcb-0vBu%$P02I7Ghu!|5YYYo+m~OA)ioL0VA`&
zE!GAkwjhUpVu72eVdWGYdB-=9&<F(qV~(j*<tkq|w@e`H9@41FDJn#>;~7#6Zu;M?
z&TxvayrU0tiozqo)CdCEhLZ2Fq!`YW$1kyvLpbxw<3Q4j)MR2I3S{Lrx!FzZap5Rm
zLe?k9NwWyyQkRn$%^Aq~33-%pAj2$(EyB_)1G0fZL;0H+tPoE{L31P))L}cV0g_3O
zGZ)@e=t3E~yvAjw9(a-l7y5{Vu%VMr1LWc|?!X3pP$d(od89>p2@-=L%orfqXKhl`
z6@&p}Bv(6S6Uh;#PvpW132o?3dD_$24dr74iN#UQ|DX<<Q3s=jw8o6QkePdcM3Kat
z#bWvpA-+|`l4nq4DI-J`2#H5JUoj(}K!T_C`4p{bRqN!=7MD5^glsWsD_qT@wYe6A
zZ0}p^UisQrzy1}lffejv30qjh9u~2QRqSFJ+gQgw7P66*tXlg~*?n9VADPuGKH?FN
z&1Uwp`>5>rCR<w5p7t;O*oS62>yC7o1Ge0d?KNn7jcMGrw%3sDZn*(l-@-N>ul=n#
zcstwL-WIpDm91~n;f~IF79XNT?R2SI*nVU-9<GfoH*Blh-U8RT(2Z_o=c8KIW>>q!
z<?b}R3ts5%qq^~xZyc}7S$D*?yWb5jXh}ON|MPM-yZB|Vexcjn`5qX-&#P}dUb|ib
zgH~`0zAtfU+uL+>79R#q@P;`&y45n+9JYNhd`oxT08?1E=5R-JJKSOy2X3|Z<!*|d
zo8jce7{$GHE{R{<V;{SVv#+hNIXuhb>X{hD=D09Ee%xdyC+WKPrLB@Z8^Iul_!=s<
z@sqjS<@fA^!QAa_mF37;3UlMaM)vZW*^C!_NEyxXQ1dpyoDMOsxXpRi^IGgdVInhG
zt!7SfJT$y#LpvECcFr=P1>284>oy&LKJ=tp+>dy0m&kKw(t^>O-rqLY9sAv~<t!ay
zZn&e+lvZ_VEzR9XH_5~e&M$03{ao>$|F^ZmT`!G2o9e;s!yU49ho)Cu?8RRC8pB@F
zn?pPe9rwB~v2OO5C2crh3)|SsQ-{lzB#jIfdmkZA2eJ9X>?uQ=JyAAwrVj_~ELS_*
zznh0GfWd7fk)svHIG(EUA=`K)DITWA^L?(X=vN!=(%gV|ym4oXxEAT7tL_JJ7cQiL
zqq*YwDfPPz*Kcl+o8hJ7$ByptjeXzd8+W~rI#MW)ZhU)DJN3rQy&)G3U$!mipgG9h
zagBeMC2e~dhp*wXT9EsN=yJhFh}}W2q^kuV*GNamZzqpS>En3Ds8eQ8xgTqEBW%a(
z3KYk_P<W7l32BcDK0r{GHN2rM|9D8d3UGlI*q$X4L?A*X_Cf?l+-0>-kBK&j@r%0j
z;}@h|EkVG64!ZQb=|6X~;Q6u-Vzeb5%D9W2{ULd@c-}7fP{uDD|M|h!+&<a>y+775
z`i#f>9<eY6b*xhzf%Jku<d}s(_^}LoZ>*u?s0tvg0+)7Zryz}N%PENO_p{tREkWSB
zUWOie%9jQ4cIhuVz`^*^&t>A=)k`#1KN!oq<@#vxI5*Z}_`P`J`(|-Je^h@KWxSs1
zz0cI8E>)y{lpXjOO85wZ7-+!^enAi<VIWGu49tKQ77z;@@c6)?0W&NP-k|RMVISgv
z0?mNQ&>;`ZfEo%y3I47u{{n6;q>muRp$wXU6b1qw^uP(S;04P-7s@~hQb88<KogXp
z4E#YBvLFj)1_*i32M1yt^q>i{Ko`ye|H@(?z(E_dVIZ=PAfj*z2VxzlK^sWS8}=a!
z<3Srx&ma218@dp_8V?=n&l|)LAG(k&%;C0(4IZZO-@b4lI?Er{P#c(RAEIF$q{|=b
z(DC+x`_MrQ^8z2dff_Dv5Vhg^`0xWEu^<*v8@dl2@IeZXP7c{GE%xCTSgiB#0UfAe
z9kkF6{oxC<Py@k%3kd@L3Su2n5fnu+6$b(gO>rPrkqYku5&N+I-cTFpfgsk982$|l
zCGGyG4lPgx80G;R|MbBcOs+_Z;TtYRAk-liPR^SKa3JtN1)P8cvfu{%VGV!)4YJ?|
z7a<4W01X`B_;LUZg5VGIVGx|44qy-m<dGitK_1aS1$e9k&En%yaQgN^3A!Nfq+uU|
zAPF2n3Fg2b^bQ9JK@*7JA&Gz##^EAg&>t=`BS}FYl0XR}Aqfb<EGjPJK+zlM!TqdI
z1Bqc6e*w&tAs)Oz^AJxN;DHz}D<0-g8<c?<q9Gdm0UUlo8`i<_et{a4K^XwCEuu~(
zLou`bffer$9HN1<;42z_;VHYX^~4Yy@Bt}*AsUq7=qm9nei9wl;qt=r5{*(T<;)*6
zu_*J9^xV=P|GE+!vT`jhEiLe&D~a+Bkx~k+(k92yAG~rMqM`f7kh5U%`+`yoy+JU|
zlKlLE9^!H!l%Wl6axs;mF}p7+&!Q>2ataY|9h6dK2s1O40UUmkAeNCC)#CRAV><eR
zXL!mR{b3G}U=T`)2;u<;)+inQ;Rd+C8kWHrj?W8np$oFWV!Gf5{lPh*GYfEm2<89}
zh#&*~VIa!_-r&I_3ql3`0T+;94hSJ4QvnH#$_XTLJ3mqvE^-{e(*%>iBkdDENr4Ec
zqX|$F3P+1TLu}#Ba3EfC{`_(=!Lamb67fEeAm(omNmDKp6!G@K6wx96<^mM^5Em0q
z^g8bs|G<H?GIJoJAt}8<D>aWMsiEQsv_P+6;i91sFHc3+fkjEwL<xc(?s6}0bT7Ma
zM8Bu~3W5<ekkDvy4{I(I_mB#M@)RYr3Yk>r5;P|IGDHVr4Ht6~%|b>;%RtM58sK3K
z@qrq;)G9O4{Z!8-SCbfs(I05DHsNDzVow?#Zn1iE4$wds&cr*>r3|D~BMIX8ct#JT
z(;v#9IuF$!5;YQ#Ko9hQkO(3?2?8FfK~pzXQ?nomG{HQl?-C?+Qf;9Q<Rl2>vk3>H
z2L~cR2SPttRS8^`5awW3!BapBA|7&!SD^tKKo2Sxvq}jfO%wDFf6gXhazYD&`@9cB
z{|&DXITSDU!5ffrAjXgq>rxwj0UlCR@;q}jJ!=Fn4@OUrS98l(LGMZN;qt(B9e(Z&
zxpg3ZbV8YoUH8%tH4iT+G!_TqUX9X8Q85p@643hfU%>(ODAXuPGxG*kSXr+Zb@g0p
zD_vs(MmZEs5q1|FZv^+Uvxs3e1F<uoaK2!!FwP1u$RQV2HWpd|7*KXD^pu<UbPjZ3
zR*66shyWdE;RXnm3H}Wqj&C3mbs!jZAcXc&v!E4-pcQ(d6|lilO^_fQAqlG1YO9tA
zkihu{;ylrTY5idwu)#gY!3~fA4JL9`Kk`;z)gNM2ZE5u)=b;RcAXnEy#moXh|GQFU
zVDd1x)exzWEXz<~9~K5X)+iq|`=Yf&<$}ZlR|9{+{QwOe?lN1gvKKRJT>YV3+v0A^
z!bUCc@>tPcx%4jSHAT?@bn#UK_4O`@LDKqFaKX%4-ES7_@>)r=Uo-S4d(m|ZLQ4~r
z$taO_Bi3%4j!a206Jb<e?~fid4;_9%&X`mX>9oVtAr}B}Ey%$ZTH&qa!WN8bAo!s>
z2I3u<r7rFP7)-Vqxe+b&p%rA7m1x#xCvqf400@vE2rftoNPq>_0BMPKQEz|+`r&`G
zKpvt%1!N!xzVlMmLLJ+|Jhiqv@=ot60Uv?@36dZSx&UnnqE-E&38pUz|A=5#KRAT*
zAqkK`36x;^>VjQKuXhoT7;0`GM(=qmt1C%QaLeKsh@tfQ!6_53@t)Nxk@qg*ff$6+
zLZbooydjA}vo5_-U!#E-WbzIDfm})UFCiBl9FdA;QWc;0=UlRPf0FbxPb*h9FP@he
zx({}((kv(UVQcp+oze??7{0dEM(>i1N%JTjQ7O$*Wrp`IE;f1L*jo1zDeKQIof6PS
zk99Xp9gLwBQs^ymp?l*3XyyU;$k%-7Lgmt88Q8adc@qhqi#5o>D$b-l_Q)#kp^Ug7
z6K-fAashx8qK5i`mi@t&{h=4Qz=^s6z#14W-~ocy;yw*kFRGy*|HdI73RN&j3=|0>
z{i^UV`l}y$vLH09ngzqxNUSjfqnouaEylS{)4~>{MlJZ^8<s&D>I9Psf}PzNHsoO$
zmSKFm;U28P80I0Cq~UBTA{Wx8eBZ$scqSa)VHxgW8PvBf=2?^cK^m7KImm%Ijp`kw
z;rH$V8{D}f-XR=}!J%PD_<q2o&qC$$0cP3aY~H}6l>k(Qgb+xW2ozN?f|BsM^+@_5
zC>M80o|1~S_?*|q7+gkn(xMkcx)(Aio(BRLJOUWVK_9kJET|(FVxb%KO?-1<e8Zs^
zVxbtM;vHh47t~=Etj-pSflMqJFP{1xqS`yGVXQSH7Un@7|GFa|-k}xXY8JdL7Nk-3
z#A1%}0S*cqMh+tr4Er|qBOi3(s0%}=@uU2j1m}jjaK54I)Z!g>#3O3CPUHb59D*D|
z8cf20m+|Kv>I4|ZS2H@<A2xeEjA4?=p`GiY|L_8|2V#`RnjExO9`Yd;-nk(5dLXc&
z|Nhz<nB}i6o4K3&FY2L?*rKBcVyQiQAg<A=$-x?kP@{P{lUJJ{IGG^ISGQ}b<fiDh
z?*h9wrnfbzw<9DUtbt4nf*_0mf389rcXPR&o4@;;F8IL~9$PJ}*J4@$e4AP_`k@<I
zfgGTl9{?OSn)+B+8@R`tSw>mwz5%`UBEc72syj)d|MlS>ROTLt+aFAPIs1W<^INFk
z*S}vJ#_M}G*`gnu_MUh1syi7N@=dlKf;Cb|!kt?7>U$P6g1jAKl1ok`()%uU+!*w2
zQDVUsa$z2{w-;=|-tdNJrUI*xTfbdA#>3pXvpOz(4XM0?wKdtCAG$2U2QAJf_QYJy
z=bRuCd@r=u7;J$E-DMea!5C(NlwF7&27Mp~-O&BP&<P#U6MfMSz0nCh(b=KU9X-+?
zUD7SxADDp|F1^w#9n(F%(;5BIC;iYtozXR&(;3~=OI_4Mozh>O)nT2`QJvHwz13Cy
z)?;1KbKTZuUD9cN)l*&9g}v8z9oJ>O)+L=C|1_N$k{#1Oo!6C}*PT7se|^)RJ=(GT
z*o}SIYn|F1U9t3G7LucD=7k?JIfgbs-3`GXRzTf1U<Lfa5Z-+QP{AMQT?qVP4CsB+
z>3t0RK?vxb9Z-SZ+1=gMJ>KX2-R&LU?|t3d{oNCu-WmSg^L^jnz2D#c-vj>L2fpAT
z9^vJE;vHVy^ZnfoKH^1w;Yof2ES}%l!QTO1;0gZZK_1>!Ufn6a<VhaoLtf!?p5<L0
z<6&OoWxnHS{^1Y)=6}B4gWlo)UFkQ#ACSK3>0RQ7zTq!k-IqP)IbPkT{^PA4=X-wX
zM?ULczUycH<CXsEfxh9@9qQ>F>{njw|Cv7HcV6o^fa{Ci>!qIR*}d-How4AW&euZS
zQ-BW6fd^86@p<4JD1q@ApAya?@>Adn&Vddp{}q~{@)Q3GD!&;ZKk^fQ@f-i~D}VAM
zp9k9D9AE$jcpwqZK?-<)_NCw)I)V0SzY`Qc_gOy?a-Royp&5Wb_S*pXn*sN8KlW$8
z_HQ5fcOUp!-}PZ%_H*C%lVA6FpZ0wp_=TVN&%yX}ANjwZ`FY^_pI`e|zx7{#`K{mi
zb07M9{~Ufl_q|{F!T<QNpZd%H{NX?S0iw-07%&o@lfok*k8_<A^5}HVp%jJ=c{Ot=
zFp<M%yc`;A<B+04gAy4M<Y5qD|H6q46+*;#PNPDL9?yYP*sNv3lnPloe5p_%L7oaJ
zrZ`IJ+|i>8DJ@O$s@c;k=jc3b_Ub8}b61|8bGmfv)21mlZ19IRt=hG0+q!)VH?G{d
zbnDu^i#M-cyVjQN{R=p-;K76o8$OKKu-S8r8#{gsIkM!*lq*}lj5)LB&73=X{tP;_
z=+UH0n?8+tv)RO~Tf2S@8}GYZv1{ADjXSq)!^~c#{tZ01@ZrRZ8$XUbx$<+XcRPO$
z9k#w%_o7?Bjy=2fw!N2o{|>&Y*$pDbl;g}Jh0P7kAeY-fwK1LXBHEl6O)#SR@cjGx
z@7&yW0uHEMFXRx2V1f!R|9ID8|2+s{X!DIh2Mik|wV4g-wZWcy@HxgIg*<F9#%TE^
zVn~E4uGrrdV=xF~Zv0>;jbAa|h+~e|Imlv<J~}oZFXy~M;*dOukU~-w3XwuHiP#_l
z3_@zSUVB!hKu0<6#m5+jLY4!A2j^Xx<vF}`C4`XY7y?5IS7dWeHdc+10t{RUu_g>w
z!Qh*mDF`72o<9ysC}%nzniv<=MMq9Ah&~Ewq>61&Xr&O&*9ILnY(P>$N1Zdq1~y#L
zj0jQ~@*$NRa<qXIp;EFXh#RPR#Rkam((0=NVHssPiEO|_t$6-=MXh$K3M{I_!e^|d
z&OX~14?;*vEnasZ|8a*j(A_gjKGl8;Zn$gl2yMB@&1aSfSDcp(C0B^x0jRSwhKwOX
zY=9@S&2X40e6cp>C1bS?!|!}o;F=;baPlB#L>puyga}%CaO{TjreMQ4LWo&Tl;(c?
zV}Rn0oK`G-SeMH?B(KbJj$?2Ma?HTZ_sV_el(Ry8o5~C4FccdiLcSI^Q>%+(B=T>U
z^A5B@IYp0gG?6I|GfX*9o_B9HN8aqQz5`{<u$CUnO!j{ww+t>Ir=X=yF=^@Z$t<-k
zV-4DN-who*dhgA5*?ylEq+`wC%S&11gbHUT8_<CYu;=KjcpFZ^`XRt1(s8dqkxyPu
zos_g$PKbth|B&&o{Z?G%*Wz6v#Rhi%4f}Fu;~l9ObX(I$BWX3VOds05Mh-Bv4^Mnz
z%owu5c*-xoQ0&fk7Pw<$c;LZ^ydZw_rgci3UX|svj&C+euV+>YW5D^nSwg^x%BC=&
za`P1)h>A>{t=DO1_p7Q7u?I}P{=5JRXLiNY(H*#u34d5acW7b5JwCBE*KkW81+1V2
z@q()5J!OOB5}*e+BfiOmkTT_f6K6{J7!x)Ig^p2SWejn!QVHsVG%QUs<Z!`9%}9X^
z^hY1mkqH~IrXRMDM-GpO#I-PEJSmWaE5rfCC`wTr9ju`hX~>KDZNLNYyP_98L!|d5
zF-P(M|Ag&g(Tidfq7W2pjWN10#yDQ^UK`NC6Q_trC|2={e1u&#P=N{;_HmGuQQnK>
zh@(u*BR1b~8zLV`J32lhkCdb$rF`=vEoB24$k37}KMBfEigJ{sETt(+$jMWxa+Rz+
z<t97X%2>*Bm9LzoEpI8xRO0fKj@jiWYe`BKH3MCbP#-%WnZ$Y6Vu#3VCduxVf;(0c
zk2(-XF|UBh6}4wX__}5`h3T+v!snY2+NS!v*&}nBg&maO0XfU*Fm;VHo#EU7JKgCc
zbyo8jWto;U?b44=2(K>s&<8UGbB{$81{eqWr$fI*$7xEmnB~LJgTNw=V^rZ7)?}hZ
z|NnzgjdGNt8%R=wLb}n8R`jGt$!JQ&p@Z_l45Td;DM?KVA(V0yrZQELPNT?A5<OHd
z-w*>5B1ji5L;((k=>s4RBM(~)wJrK^6r!ps$0cq+ni8etF&+_9WDxD0%b^4lxtdY1
z+G?!*F>CqI`qi+ql|ODRDO}YmR&2KQtW%7uS(<?r|I{^_QuJ$H$*P>e-ZiG|3G80q
znnzcdg&9+I%PEk6*;w2q7EC3~J-l_8zEt*Yz_5i7aiovZp7w~zn`BqJdW<L5%1wwR
z&MVecOdYs3kFgcUZ1uXF+m<7@yTxN~e_Pw(2$#5(JZ?#WtDNQ5vAB4AgdBVe|E%OH
z_X_M_E^lS~T<r!&y1JdFb+L<2@7%V#(>3n~RxsMN03#Mrz^qj5!dbPP0uGs2R4)K=
zhe`M&7Qn~^8$O{AKy;%IeYi)00YMvoBzVCMM$0Mga0jH;g`x5Fhcp^`s1L`naVdDM
ziJ^E5#%@5osBwx}Tycz@!dAsBK8=gF8e<cucsw;W&5dC!V~OtAEIlsGk8^BdIWVz3
z$T@P5n@i*5IQhg%E+3PRGi4#i)DRs`3owwt1uI}<vz_(FDY(!JIOwhwQOHClxZn>!
zMBxsFXfT*RaR%K1L(OQp$DQ-+k3n$Z6o5F{UGg!DHdZzl-qJ@nzM&R!|ENqsj7|%P
z{UPb%B@eA97BX1HVHHvdr#)_MVyA)n=}=$!H>57#bx)nvYN~qFUvV|8V-0FItvWTW
zF6paJ9oH1F6S~0ZwW)!fYF*R1)W7a@u!mh_&ltPeT`eYjyUY(RAR!j5P&8fgixx4!
zfzV>`2Nyo!k7d9a5NuGOE&OZ@e`LbYjbI?W<=uyTAi*!6F!Wu57hlcZLmv6C#-y<^
z4{6jxK?3(jIPU8Yge!b_>@dr%PhAC>?wT~W-2f_5Ox=rT{J9$+O~*f8-iu3d<jO|P
z$w992m1{gTFHd>QIa-$N{-)+3hc(MZ?ebcoyyw6cN6yn5bdSRv|Jal5@@30?&~KO7
z3TivWDfEE^NZVrF3G6cx(9&<T)Z6P|_ube1(FlLvg>Iv@1u%>lj)D5a82uo}r3d78
zdEBELj+}el?~XQ9Q9I_-bOmF}@rr0uCM)A1y2=f27Q`!lGK@Ei<1Y^RrX{{KmEXYS
zZ=HF`b3W&uC%kd1d`Z)E{`02}{pLANde#FQ^+Qs9>|-9&Lyoo{^^JF4!0p33_=6wX
z;zBFF5d|y6x$FM$bJ@ji@3Z&Y&)xX4+V4`tE-SF1($L2@7RjJ)bi)>q_OSQCkGD|C
z-t;Ku=!o1Tp>rU^ELC8?SKa^I_|Ja>^|!xq@ehBXu@(E*|9}2hSO7RvoH2m(XMlb6
z2$Pf^#KsxJB!9lvfIx+S`p1A5h++>Y4iPwcjX{C)cWg0NOuAQDlYj(eh8MAb1W_Px
zVqgVxW@ayVS#gGLWakfIhjuTh56-uPCj$szR%m;nO#KjF-(U^Ka1ZbB4)S0PbrU1}
zU<>--git7jw39qf#(~wvSWPm4=yC<t)P-JXWnpL*W4L~%r&c9Za+NVmX-I};C`D}u
zhMN(G@G*yU7)2`9Je$#R{3i~a#({SDhLn+qYRHFD<cFORi1kN^w{{Hg6<_3lS>-nv
z^T13B6&MLs9elPI-Qas&_6<>28<Qp&rC32*xQLVl|5jDN4#iSqL}C_p)QVH|im@nx
zls6u>c#Bb#i?WCrv{*-xNQc3=i;_W%zW9q7rDWVi2MIVCb@fueh>Ww?i^f=n$MB5o
z5RI8Zja+zhlsH;_fCPn*7nr4v>&TAn=#K9QkL(B-9HxDQ(GU56kNK#N`-qR$U<-g(
zSr*rfl*B|^AsJ5b3e1oK)i{t+RFKmM6$;6a4XH=vV~~-7kP<151No2#8IcRQk++y*
zGKE-ih;oD1kR6GUA32c&Ig;Te877%xD9L^V<V@1=f<}ZF@yL@s>67XR7}Eh-wDS%C
z`4^^$7md;jOUaZ?>6E=-3#||fM%ibch!_0e|B2ovE&@rBg{4+0AbRrAi(TneUm2E+
zfi87Kmb_(_uZNanxt0zXQ()<q;!%rnX@(_r4y#5q<3W=Y=~s05O=($8cv**ExR-)c
zD`xSR_GgpLbOuPke0ZY{R%JK(uneux3RIaE_W*Hmp$?xJ8`5A6NSPM=&<e(&njWT_
z#;{2D01UGrh4-)wv(O9rpbn~O3t2caT#1)o^+ZQ;1#|#dwYY}O2%JXeCd4^7?PZt_
z7@W&loX+{2s1}{WIh{6FohT*;lO&vU@CpPNl4O~j-<h4qiJaZ3oWmKO^f#W4c@|TZ
z3t*;|cf)pfLk_W^S#sf-bzz#V@t>!;|DR}KAPI#Q|Huyp;t#+8M?>ikO2{(4`J5Ux
z9%Cp6?`fD6Du)-konAF^ddQ(2YFr;`p%|K>Dpr5!378}*4k0R{eTAZXxQLJWNcx~{
za#KJlV>i~&3-!R8Z2^VGa9`wL44C*0#;^?4(GAjoiT(hEY}XC<u!Nil8~iY!{?H4k
zs1HM`Ewcc45V|rFTAgvFqH#&4FFH+Uil$|$ookAVIzU)%Dwky%mtYmAzeuBqGzv&?
z1{TCE0ZJ{aDPeH&4zbV;<RDe#kTP%N57k!>?@%4{P<?4psD~<5y$}o7U=4B?8&;|o
zy<iP?=MTBrXS6{Mt?;8@N-|<9|EI0$s;>&Gu_~*xI!$>RNApl$t3^CVx-$F#3_to7
z4BC8B1q{YO4x5T;hN@`tAa}yrpS=J_{b?JXnijpV4C04rzQ-+SF%M9wXsX(q8$he$
zO0MN<uIGxb@HteCfGtN<3{Cnip2?YO5ewB3RsOJ>cGpnyU<^}<7R*{Q_IjzWDVncA
ztptjS_h41;a9Y2b7T~&-;+n1#OR*Jeu@{S`wwgqi7zOisH~c^y;qnf%fQoa$P+KZh
z%U~nbv2YJMPymY-Cu<7>JFK^Huvl8M^*VRqFsKTYg%BGqtctNiOSDC6v`1@V8jD2N
z(nC2k8{qN{?{*jJpr29e{}268TC?C6{s@(mCJ(JJ3yVaxhDx*2S{pap3!1r^$-0y?
z5({nz4BrZ@;3Bk0Yqxicw|P6RO3NUC8W_uf1Xh54M`R7ZBPr4V41P-&QTLyq1#r$`
zrTiedZgG!laSzNSx!o|g-%_`F>$#r`x}lqr@fj)a;03N>R5>_CSt=>TpsTUrcEu2~
z&VjYSV7p0ayTAaiK`XJM>$|@TyuoXFe48Nea0Xm(2UJQJwtxg)pt!>`L64#jxiDtC
z@q_hP8=Wh>+snP(E4sv+AbrpZtdS2^fCL4LM2{;N>ae-3F%Mpfy=bGo-b=srYrhu@
zz6inv4b=*&I~bq9|EI{rsDYtO4qF@Q5Vr9vzrB0E4eY=VY_9n`Ao}KR5ahprArF}K
zx=BQZEejY`XdB&-3-zhM5eva5jKV4GrV>0LR^SD|&<MpK4No-~?0S8ObgzH`vVHaq
zm*%l}u?)q4geBZE^Q*!~jKoQNfh>$5r;rQAaKU@=4KMh^IV4(t!LJf_AWVoB<5w8I
zYPdukp$x3VWo*W09CJ)eAmjiDjZnpMp@L1@Obj)+cX1D~U<?$b52LuCo<)9QY&S-X
z#)C}AXspHrq7H_U2|D>th*k_9ychhi3<t%jSWL2j9LQu`$eYZ`XMD)fQ3#Vcsz^|>
zff1??g$+^p|Hf~z47NKD*npe<3K)p0yqFxWos7%5oW!3D9ihw?rA)w;+)U&kn}yN7
zc(JL^Ys--$$hz#z&+NOrY#4wL3wN*#aBv_CbO(SyLFCW}Y%mD(PzaOo32>lUvj7M*
zJYc<0&iiQ$cQ6QvTo)ibRE&%rx4X=l49)w@&)X}_g@FWYU<Foi2A|LkQ2+?NfCTe^
ztGx3G@=yp%by@ikwMei-5j}25pbypngN@Lqbzu!~l+Ums58X1-MXbsF9J*xS01iL~
zloSXpJq39*0S*8G+b~5nJpn2Wy#GuXNI(t;=4OD<Sqps%<(3wO@X@3!VHS-RN{tqz
z+z5jP|G>5E77BaPZ@~}t{1=Uq)nS^_Jngwt0002c1C&GtWo-g^Bme*)052UyozT_-
zAlA`Ly4Ue_a9|B?CI)LW4-1_MAN|x_7X^uobr((8>d*&gV0EWp)ovlRU%eLHN*GHh
z*(O}qqD$6hjn-|w)_By`0I<_h!~tbZ*O?8vK0O$Dz1NvgX!8)6?0dfckPrOe%l=T<
zO^w)SQP{1(1>Rx}B>WcLP`%hI57J-^WA+U?nGbMu+{rzB>cD8Awb9G4aN)qPv<b{@
zF~FByEzOMD7`xeLokwKg*=%jv%m78(5Zb35-g>Lrg2CEuCJpBM30A;wQJ~-CFbIj=
z|I}?3X#U*?$tMPN92fb3z5z!L^N`5WjTRw2U<;ne;ee^dPz=?vn}s@ewonYQpt5s8
zMBDA%hXUU3U9scc*#Pj_Q`FvY9SH4h;_!Xf(eaZt{*!kB43OMq9FB^%kjSw>K|G!o
zl#LdJYIj9stlwbWd<+-d^4KGOBPAZ=>5Agzecqt$)&SrDP&5H$?bcI{xA6@aHcsa8
zco#q$U;QwCR;8#!iWX{a3syzsnD&o$cMnYX4c~C*b@2|iFvL)fC{hmQ=33==WZo){
z-lok9*$~=aKIlj*<|8v5*vk)~6$?6P3zt58mTpA(FrfONvjv6cdd}o=!FPcE|0sg~
z=;K=GQ*`JnE=7%Q*5*9`roHM%8|fqScJ=6)xnK*UD8hYa3%)*z#xM)9pfdS6?DK%<
z;jrg+ai6H3BdUJuvfAoW^y=s>0d1WC4gdfKkN}Qe?L(XE;zAA^Tv>k}v-14rY{3ue
zuFP?vpwf;b)IRR7dhJn^?O2`x5a8BrO#|WX-uG^?<sL3K8^6n7t=2mWI!^BjV($bm
zr}+*=`_AG3kO7D8)~_J&5|6(#-b}_I;vH5G@s1c#W%3XI91-vFXiD+oVDYhz@$6mJ
z3?L32-|`e|@Zq8k=&tg5p}s$lAS|Er9s2SyA4P4Q0pgGWZ9UUCU-am@|MTH;r9%I=
zK5zBWLG)4ooSO{+CII$e57&q80AVlo;-K{6unlVuMNrT6<vR7?vJ9)7^>6_UJX`nM
zvGs2smz(Y7UM>L@FY8{u<!L`fZqN6$8u#Dw4yB&=SDAf}j~#oT_+3fX0)Y9MFWMFV
z@0pMJ5Fic)0010-M+|`Zl~1mV|1GhQ@{(`4iRSv&LHVdp`(my7)gofC5A>F)`@1pw
zwGaIJeEZY_v%QbZj(;2MEBU`4{LP=s!%r=+Z~S;s3?i)?1$@lX&iu~L{e=wul41?J
zJN<GI;?6<OdB6SLul{EI{gHyz<8Q~aiyJ$<{9(QR_iy_k?@+ej|Df<c7Xb0jRzH6Q
z4IV_8P~k#_@{IY@C$HN(gX+57W0+CnMvfglegqkE<Ax35OrAuUQsqjPEnU8Z8B^v=
znl)|S#F<m)PM$q|{sbCS=un&_MIJ?(RB6X<-IhLu8dd7lrQM2A<#;caF@5Cx*)m9u
zA26(C&7K8GlIU8tZQZ_w8&~dJx^?a9G>TU5-i-Ia@&z1N@Ka;f)ae^skl!+E2g!L&
z99eQlwRbIF#++I6X3m{G7u_&fbktrLN1sNmx0fx7k^BAi_s(f*+L0@N#+_UDZr;6p
zTh3csxW;ddhaX4IG*&C)gNuE8xQt({Wml75pL+ZEcJAH1|9=O+IXHIY`eq51)|&kK
zkNT`xpFErW{G{5$-^ZU{|9<}B#?z+_7<m9Arxjx$1293r_|b^Lq#RUmJ^T8jutEzj
z#E`B3A{31rX#mp)HV#L8ik|@wvPGSYQuN3~gjggoxd}6*u|^wjtZ~B_2b&Hsb(RV1
zpon%PGNXBVK?uTyl-%gZB#S(5MjWT4vPvs=(-BI(j8P9QYr4tDpKf5gN1Eoe1W=x3
zmKks!a^5-6AAZ!yC7&?MlqO7n!g*(zdzN_zPd)LJCQmuPSw@<B=B)G1LiO}VO*Z{e
z=bdo4L=!M6ujI5-Pd{BN%S_KA2T&%lB4-vL{UOVs|9j3Hl{|f7c`TN$VgV+cSndg@
zmspA^W>I-^InfwfilI)rVNWzsO<Voxh09(n^%YoQi7jZ>THV`<oLFMjYg16iCAVC2
zR}vN6sT7^}Bh~*G$KQ8f*ShvdTze+lwfCkE$sSqRW$(&$aj)%)P*Fq(h3u6*5=FKa
zviF|J*Y~H_KXA@@y<X>>=ku|2%Ew4^>RFp-F>bg04WC3t%!&FdzH}`zM^U#u;*(m<
zOQNMx6(-E-8GqgWUqJ#Fj*>R?YxM4;iafW~9{nEyDsVX$w$VjqAunq+39%seLmhc9
zoJWJpLiy=1hor%cxSn|O(y8o-kEcs7qlJ%jgc&Y6T*o~wjh@ZZd5HE8-jvohbbYJH
zDChOA{$r|3+0)LY*^Vu_Gp~iUs#uQ4-ft0ZJ~W?~zvB`w<W};Z)oLkU%3sJ?^)%3w
zGT*PAemV0hdB`5+^`6PC#qVp2_FsWfu43E#drtXZUV)uEj(%A=c~EA*JGqc!%MW93
zZ8taPFMefjZ51HntW5prAX6OiVW&%&Nzbn@5}|xjk6FGxP@46@b#Gp}Q;zd75|28I
zetGxh&EK(o$`PAtWiKlpW>|Q#*euwuL~z>3DZdSQzV$eN>HFl~+2(R_+rRWUBFEbY
z4rZk~gd-i@vrhh3e>pY7VL#ITZq%#7|4~IEy;G$#9gFciJ}kWs!)3Huf(DNI0ZfX|
zFBf<_s2knzj^V^-Y|cq!{yVqroRBK6AVK6rr7p_bfhvgk17gOPd;U^k!t7)u!M0GJ
z!@8<h!McOmD{$Rr-yvHuTT7Wo$WOcu`C4T!zdNC_m$h;B1)YL=O6ciu5}S1gJf%uQ
zrq0i=Z>k;j1<3#i6){kf>!|Qpl6YMQeb3@vyr$slR628xcfy+qQ{ZnVw+_fRf7TU8
zOX=u;&_Q1FjlCw__$i>#38G$7czaENf3IplSi@!B`{mPAzW4eu?bt<5oliOm*M|~I
z=`k9E>7R{{KFDNcK=@<j3~zmMgb;QXP5L=yX!eX){|dm*0z)+MKQz(`rI15;@ybK-
z$(gX#UX7YgS=(@^{3lJf`^HsKLg>-l?ea7#8C*gj-sS$EQJqW4_1#8aG*#A_b+R7;
zo7lS{$#_vt%&BasGVksb{JX>Ox#*O}A>-XkCL;<384@@&c&y;>DyMeX^lMVm9r6Df
z`$VYXOfvTtpKShhH@w$$-8m)y%~OLJqo7hISMR`NNtmZGM?J`OL&`r_()0Ek33xDS
z{Oy0OiHi42$0~;Y*xl(V)s<?Ba!?;HyKDEETemZ%+<J)hudtW3?6*;RMR2)K?D{Q5
zy*sr7gN(CfUiJ)5$R~l)?;~O521#=NwfcKMiq+b%*Lxjp2%o5mQX(jly|4_r5sk~x
z^8QcOI<{ANqS{zVn?YCIVi0dYkP>-kKiy&Rq%aSa>Z|2_?^3~LW@4hQzUTgfpk|w2
zM-%mJum`@e3byl%lMQ`Z5B#4t+b+o*H>8Hfu-z7$d0WJ2>rx|nZ(5vSkTTKy8|D+*
zqhP<6IoYzT<r6;MY=2ZY*}5I;^Ken&?%BlT$KxKK$9f;|;w0(jwI>UawTY-LR7X2P
z+ZWH!G7CwMK~NKXV|W!E*-0@SOufDYmJJ6~h-D|^gm0WyjssQ1R5ym*FG1Yai7tY<
zM~L7TEjxUrF~|1GGU5?3v!H9kp`Buwc%<(`=j;1ZeYEgBcudZ`cv1&ii$Sb4nB|_3
za4gRdRwuLeiV+rY%D~w=18-7vm562$;^7Q<UhnOCDV%6E<m0+;^8W9VRHU2~%RNt2
zrJ>u6?<^Vk=`HQ!!R3IH#sReAaz4XFn$+5}VH=qmm*KzeqJ51+8Sf8rVUli!Zqr}z
z9tU|G*F6-;pAQ$p17B*rbG>u3=@CP+zNk40^QiLc_y$=`fzEx$5mF3QuCh+7v{JSn
z<oh=rvY=v{cUiU-XG5QF)xLc-<n>AF#h2laLA$r*z0z#I{73T*A?96G>ix%hytwGd
zMe5v3pZwZD{H}CmtevM_!Fl>Yu*|cn>zm=JVZU)z!MUS$TStq5f+}2TQha*8d(fP5
zh($;X+2&T95AJ7b5%%Neg<JA}=f6t)8nQU;Hv`TuBNiy`vfoZ~qU^VH@n2XW=y{m(
z$HjErMZG`{#M14FUPg$mF9q}pKlYO+Z~a4kiT(8E-FEtagyq-=;Vv(?0&=;(lp27v
zmBhF*%@;M;w^hr0KL$~UReq4RZ}c43+7J9s$4)}kqI!hL9{8liX7ysL@jJ+VuZ2HX
zhO_w00jLP6<=!fv``qKr9)R}f-jJ_DTVm&Hvn!eG*B)+5&T&JI#Xs9g<?vT8-)sv^
zJAbs9?bEz^X}{MV(sGztKVxSSK|jsLvkW*js@X%%$0+O%Ye21;T9;w*As@HO_#dsw
zQTY$HJw6Bz{y1xP{n4*cuSZ`uID+1PND3<{b-i2{O!@k2H)T1r`s|il>r%XrpD1;t
zRL9p3=i8#5YumiDhgly(vLbU-Q-d#;E7%?*iB|5g7IoAIP*Q}i;@cB~DM<BzPU`P@
z<9vGCvGB(eg^zO$Du-RNWP@$LM^%f!9SF^wh&VoGdCJEPL<W}*M(++=0RoIi?Z&DK
zl_F(cS^KrZc8Z0z)#{Gh`zmKsqH+?lTsa+UZ|UbS+zt+%e1V;Owkft^s<G}JB;yW-
zj7IL9gn#EM8^h%zADS21)z~#tSlQGT6uKm!=*w@Nx%k3NmRE0?$rC-%5OD&LL{N|-
z5E`#U2LfSM1gjO;BV(dMP3(YI*9|rZ_hn(~O^UAd6LkqgDp8S6&6;k@Fb(e~2_k_n
zZ?D1pEjw~(6902yD9+2DZ_sr8LwXsmc@x@o%B;?5*ki?$%3}?WR!h3)ng3evx!W^D
zZ^?64{UlfG=iaB})VoA0OKha7mbIdaxvhp<MsK17T0|Zlw8JGPk$O<cP_Rlcr_pBL
z)y&*aP|siz6GB^h^m@4T1qbR75@R1?(Rq$MU5&)b{O32hh`tR)zVsAMH6q29d|_eP
z+*PrEtolOk^vAmNe>-D*1!A>4M`0V~Y~H5yxnDQRpm4gA8ln44nJjxrx1YfC>4}tH
zL3n=?S@G*rMzS@8vnq$bF3adnU;E{3fAkc?V=_cs2_{Wb)1#36EvX}2lk$<6KEfMa
zu%J0$qMv50U&u4Stf!Y3B`~;)YV$2|OCwli!yFt)QD>j3F}>p+u!@~b`xO}6kBLvS
zzcQysZwD`c*5}FYoXc+QCK2xia<m$%##ky6PClmq9A3I5A3_=O@{xI<=lE=5b;7e(
zRq)6#M4sNunM#5wC$Vckt^Y3}ydTjMljK`T$Q3~bVav2Y&x_*ppG6J)$)>7R8+e?T
zuf@XiIGZ=N1<{z1&<Sm8f+n@trfzp7JZuoDnPuqxj3~&U^Aa2Qyl^c^mt(ZburTm*
zi7_#zv9Dl^t@<G0(*Y53`HeVlJ2bY2;HQY^g%Vyk_y4GA)jo;I<|LZ9#~98c9-Tn_
zv!SYJR<BB!YFvt8e~i}rf0yNXhVC(@0^|mq#D_vJLR2YWS`^<ih<Slm_{p^0fb<W(
z=?`#8A%Ip-wqbuL#iAdbzdLgk(lBDCk4`R0)`Y^NzZlPK64r<?W^3D&N`Bw2i`X58
z9TLOa;k8k5eK->9#c*7S2|c~xx1{IM?$=n}As)9Y$B=Hd8WUMJQSdb4LqGK69pjD9
z2!CV5>f2i-4Yw>fG0QHmHx1)<*uKiXQ$ETt5f&hrHbhTV;tea|JSXftSct<F|LX)Q
z>>gvU3chIv=eZP%Q@b&yVFwqUWxLsqn#OW<V+OaqDfC+r-2y2OPT&k4gFNGi*mT0Y
z`%r-~!dt*(Nc_4tGX3EQvD5Hdg7J7yI^3H?^fCUH+)fZSVi(+mhqaG?&4B-BRAQA(
zd3$K^wVw&=kRg5rKH7+kpEc|bWzemH3wkD5tP;XY21(dk(Ij|SHu0ST&Fr8dOZn{@
zf${1ycvvXIhYrFbwC8hRYIsR2>Nd+p4IwNW(S7ofHo=hB&lD?dS(|Pec@iUONy#&e
zfZRYTw<36Um~8rq|E)yh<M4zzgw_pY()d&uF51Tgq4y@C_aS2C88Pf|I8u*mm5eod
zb~x;^5_vp(?a>M04U|j+^yR>TDM5EKx?!Y*EdAvT>yLxT7s>QhxREK0(OgpU#E$U`
z>6HBI`3mAG*}S)60J>NjlThgt-`Sy5<YY;Q@sONFzq{e#54zt;32rE2#r|;d2x5ET
z+RaTu7>T$oJX(w$rD1J*XgP{H(;vyn!7EL5^ESlf#we?Pw(mz^Ri8X0S^oTM*;oZm
zIkb%J`4JWeu4sp+zey0g--6nkDCPW_9Y2kdFo_%|=6WaP<f7gj4nJnLh?Gtan|f8s
zVm))1@EmlDl%2(~N$9vRD7iipLLyEszQ9+`L<HIQHz02`mA_A>q-p*3LeeBnz~;rJ
z95M|1ysc;KlhtIkdy;P)a#~<;A<UwampL-1<)adI!*JA_*7{V{wrBjemcf)076SLk
zHO!8AxB}r3u=u?A1K)2eH~r(k6<cg2ENlln@>4U%G}~#2k$i&f@Wh}X#?EzYIu$n}
zv77LC$U$k2ZrLoA#vHqCXPxHoh0@;iSS*=YCT_v*7j?>v_nL08Zhj1_?Xz(@^U}QS
zkze_PD88UMZ*i(?aQ?j@oAl}QgZox5?psmMA$|@yJUXN~3rYfkZXp^Ge;K}BNdMV*
zZYhd1j_iku&VsT1MBiDwKqc%Zk`)^40GqHCJ;_u&A`VIu1aNo6+fk!GUVXYeHP`rO
zZZ4E_;V8GH^c#JI3~De7+Cd#-%Rqh$^Fj7Qg$wo<b`=cqt+}j%O2UVLLf6WIq1`W9
z`$b*B40Vs}2gVJq3`0IYIlc`J{y1k5ShVL&xwrBCUPV9AX>mAO;BIxCi=cX;Uo7%D
zNC8k5K5bz6h`y`tL2*1~=lb`_>QJVH@*iJDG0y9SC6@N?jias1zmjI_PTkGlBIgZP
z?*+rZ##q{&=yfI;)B0<h`W-EQQ^(^NSEBe<@G>jW+U`*=6C7Mu2*E4FVD~xSR3GD^
zLflGX?@H3dN^;5~#5=(mPL}PJ&@93}?T+HPHIu466Y1(vuD_B+Sk1nqT8Uj+dG5OM
zXP6kw==fr3^<~{^CVVZAaV?*3?X}EWf%aOV`Pv)TwW8p)V!~QU=Gxn$wbHt^vfj1w
ziM4l2YwwTND&XstjO$f=>mOv+tF_l_%-3sO*Xx4U>j~=(nd^;3>rHj*&Asa_6YH%@
z>mQHS+u$4Rj2j(%8=W#6UD_Mn<{Le(8@<6BeT0qv%#BY)8v}J4pL;h3CpLzbHohEf
ze1&fgGj5LXZGMxva{b&KGv6F{-JA&CoFr^cWo}LvZO&YguX{ItOl<yK+Wd92`5V49
z%eXbiw>2-b^+$Va!F+4cb!#bjYniaMlDV~7w6#{Zwcfk6F|oCIxwN%)w6zW2-eKI{
z<=ftq+1}UQJ}}=tblpA*-aaO5pJZ;I7Hyx^ZJ+mU|DD*rSla$~w0#NR0ho3`{5xRT
z9f-~j)M5wbwgV5@K@fM4SvzFKJE-~{^1dC4$sNk&9jfCUYQ!#@X_tn7msWO{PG^_i
zVwb^fmoa3QiMY$0waZex%UZvCt#6lYa`*c3F8lE=2VxJyw8zQ6$0fVRt+U5tvB&GS
z#}~54Puvs8+7m3^6RO|4f>Vl2?%i146FuI$iP#ro+85{Fmyq3;)Y+G^*q3(OmkHUI
zCGKOh_T`HA<?Htq`t}tk_m!6Sm5=vT5C^JE2WtEW>X)(y8afA>76)2x2ihSAI>ZCr
ztOLE`1O55~gT4d9$pfS1gImW3{~->InGQ|(4{ysJn(7?hu{bnyJ2VeDv>+Z@W*u4;
zA6nNR+VmaTP9EAVAKD)u-bEZaFdaGaA34b$IqMv`SRCDRJ8}&<aw8tOXB~MIA9>av
zdG#H6PafT0K6-F`<byc&WjglbKlYbB4$wIcv^WlOI}Q#x4j~?gW*vtWABWc;NAw*(
zoIHNCeEj(MI1+J!V>*fAKf%kMMC+WySe(SVoe)A!h{Th)tdscSlZ5({#J-cH$&=*e
zla%9=RKzKX=`@Z1^oi_gy3T2a#pzSG)6C2LD<lHIc?u=F4qO5vS3Q3K1|0?yuTCTa
zK|xMVMUAGRrlLhtGtkkpFfv?YW@5j_%E`{A&Vk_N;t=HJz9A$abyGxMT0%u$Mng$n
zNk!9Hg-=gI*-%?8Lz^aB2d!&ha>q#b=IvBtQ!5)&BPq+Y5G$=7Ynpqu<_dNhHFp``
zIb7>=V7=??dEeQt-<e&@<@vjNJi4wqpIo_c9+m?hd`+H`MqatW-uDLYiwyaQMfiCR
z`AM4l=O_3JL<aDG2$Zl2F8LZPZx`|=AQTrJ>iacJDKA_W|4_#1QQ62N4f{yR#K@4%
zNXb#0&K<n87akjoR~U^pw1~kr#TYz{RU^i#r^i0ridD8IDEJcIMG;cRh_@fa)!N6a
z1;$s7$D2DQYQ-n&KTE`KC+dVJ8Qe?Jn@X{HNg_^>?s}vdJxr@lPJfx1ZdsacJDu)w
zKjU`XQ_F&<i91g%zh%1mW?2xj>SwY%zCZI0dTtZ@yyMl2do3@55_6h%bDYz1??t?H
ze)rPz=gWZiudcMy!H@IZUgzK6d+miU^v*4;{9X8vSmgJ#sC%U7YR%5SqBwN6827xS
zy`dyG;ceirxA?iY(e>r{)OQij-wl0y|9bv?!t08jgNmr9Rrs$}PZz3^OFqOlS0{8=
z7iZTH7HiUT>JrN9J{{I2F4kwS)<0cs$b8k9($VyEsVQfuxuT#Yy{hHgSnJF6*4&kk
z`9~kK-nL~|w9Pbi46k*(DeKG`>#VKl&R^>;JMMn{p|^0lw{foT-Ee=|dVfXjr;@Hu
zV?PI4HU_Gj2HzbFR?ZEz4}6*2`qJ3?wW@ujwr6B{aOB70NZ0mAYtLBI=dnNE#=dWi
zbsvnio{lx`PIUE8emtA(*qiEGpB@;T={lR~8Trxo{m1OykHN8@8)rX1fBQ9X@Oxx@
z_RHbi*yQ~1%%A<$KjYsQ#+DbC&KD<EmX?l|zW-gC{<S=Pyz*;tb$4_1*WcBj^J_nk
z*XB+){w!_It!^)#Zm+EEEMM#_Z|<#~?``ZJZ0#TI{yo||Iz9Y*dUSbt`TyX*1TM(f
zbSv{ZqLFk$w*8g)T|_juevWR{>z+hrNzWhsRRw*i7>xury$^+-(gjRQZ9jc@^Epe*
zc_2rxx@hPHHel_?r|RObuT-N^*Y#^kMhbM(h3p1u-i{U<7wG5e*Orc#Syp@g9H=du
ztZ?W`xNcBaK3(lTT59*X?%nr#-#-Jn2KDcMHiz!7{rp^C@w*KNA!j#isGRGHqZ76t
zY^eIvN8&bkY1sH-@pHDM*RR3G>gBI_8j0*iO*N~dC8lNeLrt~ola<b&Um7)E-3<)^
z>%WGY>$iWmN0W2hYH8U0)1NMU_e)FT{_=2v!K+)XO^54K)n329v^F1a&vqqVa{TwP
z<#c~#wCwKJkFDp&%_A4j|7-hraegqj{`+fNp&%N73(Vr6s0PhQBwq<e%bk8@HX7)y
zo{gb5#~L%DU9ovFjKM4UkD0;!ozy&;x=svy|7JU>CA_c9NX3enUK3dTng1kX!)2W*
z`HNQmP@6%gonqt|Jr;r#w(=I9D2&Y(Qb<(p<R$Bvdo21(iq0*dr7J5J(N-=|y;P?5
z9!t-9hIF}O?z~=IdeIP7<x1eKAzRK3Z7Ld~GCr~bBL!4hFc|_kWA#^$dOOhA*$jFk
zDP|A4A!V)+I->&kyZuDLl??i?Z^8&drRpkUJBh0Potz{YiNBZ;Wx(@N^0p#y6ktM$
zL37_0!B99Fvw{C%%5-yaBrWxW?vYO=gRf7!-h$t8M<=%p?s%4S&sBFv)h{)9RlqL5
z7-m0Rt1jIh_C!)nw$%Fjr@>B8VPqGhi#}Vlst{Vab|b(1-H4&OAy;%>*8tB>AT5F~
zV@p!6nd${Nh1*Ycom!E8Qhku;kSa!4n7&#9-S#iosZ3=Bi|=J`MhE(Q6zvn&tNKVQ
zg>3luw-ZlsGAkJ`I79IbAuZk|GOUaW5J5|)t48=1tfC5&2I2!tDc&2zZKTSi3nZqh
z9vF7&i}<aaZB74m>>QA%2%7Jgq#pWSrD}k5Pf%4sA_*!f$jg!;Gy!fIt5Sm>rd9<0
zk>&O8=nBq$fXxYESVPy18s-6Y`w(2nd36|0nz~yUDNXTuP<0lK++4=|Nd8I!dgs6L
zV2ro^`&D~FC%p;!fcuXl?|lF6c5*oPEXJMxlKoksMhbcs(=QgU;m>r3Ja6DHu~T{M
zuNYMRvZ`GcmyVsMo|O*mQkbjdqEcsD88ecrln^i#L4JuaY?5s88ofB4dtp~`wUNY$
z*$x-zXU{vzrvRSenQx$es<P5!m~upedT(q0beW}w3i(FJUVTf?mcXDHs*onhOqEiM
zx-Y#D>k44Y))GYpREhX}lwe1;i^bm(+$OHR#p5nhRMB-t#;VJnx`#-x;_Bg7j+3|^
zb{^S}!=U$eTi<o&s1TSs1}|Tn<SP~HnsPM}LDq)nFIE2Wd=R)rqk0{Bz3cBtx86a8
zrQQ$77Zh!>vMv>Lx80$D6^VZ|Ruzdeh*1^OQV_o*8e+2FHzt#%5KKl5<sD?f9p!h0
zf_BsAKH1=mG5L1039v`#I5f<qE>^@3(+&oayM6+@<#oYuGe1teLzK~RN$f9vI5A$(
zpwJYeKAt?I9|Vwi>)FzPuU8$<Ijq7|qfll|`Muws+6rV}sHj{=;W*DIHL`IuX{zvz
zr0-J|(AE%#3%(F#(HNs{Mho3sTjByiFR8EN_g*cU&>=2%b<q7(RA8qle)2v2DBG`Q
zRAoKNv>-ero(|f~hMe_B4638jpI@^47$Q`rCW;zdJBUZTKQeEKG7I$by`w$a9z_O3
z{mK6qx1t;xi?0|TdJ$CCF)4aRPLbdp>KC)Z!;_HjoL>M{$<wK#s!3J(BuUN`+sFK3
zm0Hdyl|=j6j_j{vOBMK_d=}J4GRAyZC+kmJcVI`7iZy|J%!`?J1g=i2>2Zt?TBB3v
z_Z?nR@>xNFwKs=u@@lF(kErS<j{vTTUa4(>wi4(>2vgJ|<UZwbguin)R<jYH*ZuNh
z9z1M)9MxeD(lyCn^rAdVvu3%Red6EEoVD=Y8jCI8dqDXF#CjA}MyvZE{GL{se`|D#
z9#7}Bb9%JnpQw0j%^>H60D1(2%;S{u<luDTL_Qvo)ndpj%Qq^YL-CU?OFq*}3xHVH
zCgkw5p45>~qRQLJF}p8O)x7=qj}7024Fw@tyg;VxMF+|@xZadGBVD|0i5eVXfyq5F
zC2MczMD3ZqjCc`~;eyfpQF>HaCKAPJ>Nc_1bRz%A5>F8<2F2#A1sv`p_$*6!q!y^S
z5Ax{M!jIC7^VE_XK1`|A$h)AJc-Z;5bxD++F0r#+#F5z7=?IBM{GBit8|Ap%qus^C
z)|0`RD2;q%O-!hv(<PY$K$M+OykcV*@uwue%m^Q#qj-J#)huBVmx*h+h08}dpu27k
zgAjwTelwNTZt7t3ScTs_?BBsPMFBPXpnHzj-F<U#1Y>f~xS99lKWj=Y-euf^^uu=1
z_oDQT$;nbB#>>CdzK;UKnNDUVB?W#&A2}p=f1#ahzE$@jg3BAR={P-{a%A${F3-*2
zd}hj3M!arl^8sB~+%#2vL!Z%>|BLe<E4S*KCWp3M4>kH3rV%Zaw2Q&tujRQL?`gd*
z6isOFXra2!qCJ973HMs~$@nbf*5c4kG$x0O!sn!wpZ)2N;Q2t-w_0udTt0Xlt}|ST
zT$tVh=IiEygj`A^#aEuA{VuR65R{}^x&Tc*N_UC=YokevNxf2~EmvC{gtfcG4=<px
z(*L~=gEV?;iFWSGU(sO`3a%ORfLvFCfUv_j_(OC7<0*R#YwfpGjc4kq6BEcp^lSCl
zE4I<fil))MVX}0VZaw<=^B?OEd~?rp1q|wu!j?EPL!PP?@W?Z6^^Oj#$Q+Y_@f|kf
zN{N9BFon~YLq#T<ymbOYA5&x(tv>X$bYPb0Tuf^V!@S0seIFfS^hTwGlRzsH<!**W
zE4mE7uk9*8@#<Ep99SwuwzEHtU%nk}uT08Xx<e82rYwD@gLj2p<>@&I#N5B28;#|t
zG;jc2$~$pJ0|vU+!ssS`Px{b7P|)kPi0Je`QE)Mbzgzk48*}GMF{^LKIYcnRGZ<w*
zG3+m2yJ(Cyc-QY73@%QWa?hjW9doiCkp-T>tb>$9#gL*H<rFQ^caqxQswH;<MWtgD
zy=0NR4yd4Ls!3Bw?M_s?zpR2J*^SPJ<o!3)7eX-(%F-A}P`ZM|l>9!P3|DZIz3)c*
z9>m=^SOpXQQX|y3^YI-4x<9o-jn&Yb%g(bTJ&HF${~YwG#(fUB^b{ew8`0DQx6x!P
zei&KbTwj;$Jjy=xDC;?jh+(c}f2Ac2g)e~O$p?*jDJ4q_ynv)deV5t=n%sAoi*)%~
z9TzI;Fl#xgp@3bXz6lfl2o_%ElKVj$uK>OJcygQ(;`J>F^S5CsVg@glkzvt-X3U8~
zQP^5E`S6~+B_AaBHb24yQVvk@OsQQQL2_|arVY?dJQ?BxL8burZx*bX9>mN?3~bQ0
zrJ+;+<ia$lA7-l$h=oT~B64Rblp3TpyZBvV<GlF!)e+#-P?1@I6v`SA>7e*$D-U~l
zts3Sj{-INI0pW};;WsM}+tsPFYM^rsSN4GrviN%+PDp%ed=3u6=d<C^{6ruwV6NJV
zir3%+9XT%!oYJl~(hd%R2@Yb>vRz<)Niu<1a0J@F34)+DO%4uaxVW4J3y2}ZyVWMS
zAv>{PzZyh-JNWZFSe1<T0v$t%$FtG%ju^`pJKMJTDrtIT{6h=m;)IX-Z-f;{U`YD6
z)TwzZAsSX0mq>6a7wK0>!d(sF)MaqSesr4{R3Xn7{Va<U<YTr&egfF#;^708)UNSp
zEFvVs36&r1P0^EW2MSB)6`s`KlfWpPV;l`s1%veDoA$^f@tg@U{+*@*LDeG6{#n_2
zg0;h3YEzkD5cRO6E%aVyjWa5%(PFPC^Iv-=OpQc=Rfv3|%)oa=&r=8w%i--1w)2-&
zXQ5p1x1;5RXjDQ)9XuY6_+1w?f$jQocNvrA`@#j$KQ6<h{6<5*$7j*gxDw-YHdts!
z0AHpks>)F2$$<FHuvf`dFJE?8uf)Ilclruo%>&ElL9O!!B`|C;#voeCp(3I3eL=93
za%Hqh0i8lNGsfBN+EgP=ibo#%8XD<IRp)B_HBWX4Py+TS7*OB{2P!&GDrp8xwgVNM
zi}h5Srf8UJLXSqm;ngF*0{%IQ>u33&K$s=pLfz+u`b~v~GljRp3$tgbnon66Ln3Lf
z=tuH28v0CT;k2nbg_Dkj|H&7*SQqJ_uq@A66#HJQFwt0|LLzW*O$}^1aOLkI9FLYV
zLsQNSleLjxOMfU$iGq*Lik)JpvmJ^9gqXZ8*8<S8WM=576;d$UAF(tcVevaj*0t0r
zBv=_DxD6BR@SM%ny0oaYusf?Ln<kWTw@8i`5^YS*i}6t)!P+XXxJ(ePXVNblAyp1)
z2Rr1_IKS4jvVmdh(MEEOJn4XrQu;ZhhAL(Auz)m1VaFJZXLvVSdZV`%`W6bWlP`a5
zp)fC5+AB_W!;`9`@_mPI;Y=Q7v32R!_V+vCh23sB&*vV$lNXt%Mai87EtbYYrIp%n
zw^57KRt`BDs^y3mmEFeRIxu`ti0KR!d02n1jT8(Q_fK)q-06``=&YJOdLt)oAtDe=
zgN<79WYb==)Y$o;gMvGtEA(c_Ze6k>ZYF|d5(^_L9kTpl!E=;!dRMsYpnI-&yE;*-
z9w=H#WL<O_)a)jSC}dq-8Q*t<w%IvWy2=k!Gee5KIVr8IfF8hc=9)ee1?--<)CEFr
ztm9M+o5cexiNZE)H^{;IXYZvF3lAiUbSkU$)~F2fO4HR6>rTkqO?@O(sf&gmwPHp7
z8y8qnRaFm?{P3q#F1pstp#1qcx#Fm-?KvYMB9U1R9hr^}@Qh(5NWQg^)PZX`k7>^u
zrw7{9clp)p4p2%cpmYW(ozN6k0Q_Gxy!{%YE26M$nCu6dVu+q%%z>&5fa{<UdS~?p
ztOYSaEVN+~Xa#h0y|mP2NXV&xqJk;p3y#{QGiWrr(e%3+$_5-g`q2SR-tQ@rW5M+O
zg(;&Rx;POXb`q^(9;|ZIrX(aC<&;_OWRt7fJmKEl8P%-Ygh~r3978J&vm$tfAn|z}
zUvc201b8{=v5FXxcNSSCR-o(IYJgI*nPD>bMDI_uR#>Ue0v=RV_s&>otYfJ!NY2)~
zox3vVN2gf=)k4k+=sR5H|7qWYUil9vUE}wrN_kUgs?!0#M->mid0EMq(9YNYcIeF1
z>ojq_&MOouFHGrYI;`u3(%kzJQ-K<3y})ovR8n{6RozG{u);ugtmwTJ(UCvY#+zsc
zK7j|V91V=Yk1mH_L3hbTVq*TwxvnGMqi5Z-WZa?iyyvdSYinDu&Ongk-xm57gncKa
zAVq@?EBO|Visa2SOM1o&P{m{5X1t$k*gmKDe*Q)Jyx(bn=y0$7LpdXcEyBTl#a@Yy
zP=^K4SJ-~8-WaS`6mJ^*49tJNw)>J+joOO!(>G9uuIH!hq#o;yj#?b}bvxw&7pgX(
zP^7(Q3{AN?Kq*j(D$Xfv>AVr{*hf!8e!h-Q2l^i6f2HgA`fiLyZg6OEZb%0uBGOJd
zA6S@@*Mr0B>#*K&!ohWB5FuJE#`9ne<5rx4{JV!tC&md>RVCDZ!@(xs=%c<Nllel<
z1x8ehu3vf&=*f@j4^U$7Q_VPxZnIHpR918SWLmHED>50o`N&*bpYql`kJM&Igz#%4
zqpwT8O5C|)mP2d?J0rVIqbA9PRhWoK8kIX$`BZb=H`ON09ACQTj<<spLA2z&DEU>f
z*FvSTt77@9=mG#wwu-?>kf?l(c!Wkm?mwaj|D;isr?Ic6k+UWctcINz3gptJM5?AZ
zcOzjPLcD0J2Se9dAQ%ek0u(D}7#ve7k>4zc`2d*$yX3>wWVkrfp}RhY9pA2xyrGLq
zz8=*G@Az&cLf<e%+mt&kXn__yohHLm)s|AY520(6(8T-nx<fR{GeuNt)K$ii6=UCj
zm!#t8%HlxJ;_bC!oRBoE-#>fZb>ZF5A9lWYRz#&Pg+!TfZ1^uplb^zVKj~;focd51
z1%ZadUlJ4cRy(QSv>yXMIl`gv2;3mqZjfWKcF%@0e9Jk!Hpq@Y=uVdD-cZopuD37G
z7`_P6<W@rJ>Y>AL%2G(uF&<?N*5!<M%!<&ICu^lQAD7ko&I@i)cF325X{d8^9d|K*
zRDUq=vePj9z(~NUQV?MYuS1jg6^rn{Q6Fc|Id5smzb`}}J~l}_lq@$}4a*}cW`&d#
zLc$ZE?>oa6Wb-H3@+;^;Kfops=y@&3hFqSTlT1OI$7Z?fHhI`D%h<Oj%#&nmm;SR6
zDV4w`t?x%#hHH_xCdizOVadu7Y=uD)tT-EP<%?zN%VUU@Z?JU0q9qkaF3JDEEfOV8
zCfKZ9^G#p{g?m?MLG5mTAE`xEqTmMzNBe$IcARDf)woF4Ku5?955LE<*9x81guibz
zc8LxlTLI72fI+o^_Lj`D$R!5EBTQTVciPUEwD#n6kU8Xe<t>C7Wi+?48OerLT{xUq
zcwi^Puf4|Fd98Sh-J#vUb|n_k(ax(%vB;X@6&NYOLL5(78a=7&|EH=f{)1J#Db5QE
zje=X@e)<x@^q)4U%o^dat=(b4i*~T<pVBWe)R~DAY_CjbM6b%cWW^;N<*YIt?JL@X
z=9_OKwjQ-eZGKcA!zIZFW4hgw*t&!M<qeW;O`rc_*8t!vI7Q}9iAc_!nt6QFGng5M
z^IM5RUHUrNe{vF-X65|f*V5X&Tzqr$c9~wMH(K9Zu~E?BYpa^2{15+iH%Qd4;^P&7
z@xfioohwS~ZE%X_@#+0B!L&98!RcCK*wUvhph5kK(-RRu5EBoUL23!~f$QiHyqL#E
z6&#PabC_2Z$T)W{kYI%!S0W56f<}=2XDLi(?OP&5wgEPbWDqYu@}_nrOY1sm@2|8$
zYr19&T`)Xc&B6)l84OeZJwe~WXZ3NMt%H2<dfBv`0UbUxUoTr}Q>keE2RXfdGyVQe
z8~d=|gqC;gx5yU{JAd&lHqf9uX0UsMXY&Ko4mI6W%fG)qXjy9XKPVNC<?yUpbh;C#
z%hd3kMjQ?AtwLS&?}`K#;rY?2kv}>lPOTIkt8WW>8G>f-U8cV+8f1&#`;yZr`q>~w
zDyXxjadi2=JhfOVUhA<HlR~|xqW5OTR!vJx-rRa)J-%jEZdH3*tKMbZBEhaBh1X_c
z!>Yz({JnHzDzi=XgSjtnY$mttTEY$=bT>?{X|+YcsQGNCD)rD3f91d<%$nt)DQcm~
z+;a9(pZxybNZYu{7+0>8j{mnYm8Qay!XOz;VI^_zbM`f7hRfuPnuXD~*D5kMX2iYw
zvaWOR+5b54n@=9vOiNmQw!pd6uKU=$Nt`)AgXhJI<iF0&hEI;OM{`5N_Lox%{tK~v
z)Nq_K+mmkb=vP(1%D1;R#NWR!BY}$BU)aFpQah?pI;qO$vTjyND2zKpObuS<KP-df
zA2aSmK@N5_&>A@&?UV+#XsPmr@L^3x@(o`h266AI9wx1tU2V3299=kzt5lWtTfk<d
zk2WesUza8R$FT187n(vTA9FJN1$kxJI)!H*=zGSml;-RVh&-MD_W5R2&Yod`A&8UQ
zd^j+mM6Z`yvQzfrSwN@kc1Gnb<w(3vl``bIxP}rX6q0gTE~<#4+CVAo7?;yaCz$AP
zXx%Y3v@3;CM#Vkj(f8p~<2Svn!Buse?^VKXiK&U!NU2$}=lIASgIco!HO-&JbYpO9
z@GH&-44JR34$Er=d8~MAZg1JY6SA_(3JS9HRFQ~<NuBNTvkv{WLQq5omjv4q5?c2y
zi#$y;t(bD(=>K$|=0)52uixmuCUrzp^6EuR&Ezjj&3N8S{m}r^Mz?I~6T=vWqT{;}
zUj45LkFeLFbfy>rR$7eqB^?FJQ9R#s%^^jhO!uR-{67k>KvphKu1QS`WSF^z-OAEn
zw{m{TF|%Cr@-o@&$<Kv55-q*+(?SykE;i2$m!3={cw83bJg6BcQ8Sizf8YE|__-c7
z-P`-aXPI;Fno+)M3aM_I*7qC!WJWw_TCY2Q(3f<yd%xxU=-j6r@@m_?gWSRfj-8F0
zUavYDnJjq6!k_5gCH$XF^9uv0Gkw*K<G%sJtL#osIFT~qjADG#oPiTIA+1#-25vM#
z<9F+A33@!20~upAySfBxc<1tssH1+n<C51j5!9oLPnkSe4pPvoqPg||!Z+x0wpJ;p
z%akK_x+((C%lHrMA1b}-;PGVP()m})`f$7d!oB;(zmwzKdBflX@<-aueGkck@2~$p
z{AZzhQz`lpv~V~G9oGs`Ch4MnP(o-HviJ0i^)3wzFaN!ksL}Xz^KoZacYetnwG$3R
z(QObT12>6v59Oxv1Bj|CG>NQvkn0yy(cJQBv9p_wrepn`C5i&{uMc&jL#$uPosk;B
zj_UFf?!RcKdy>s8M|3W`sQ5~C^DL7P6dILzjN36<l67&3OFLZnPJ!zZMSjsU9lvRU
z=BeT~oDo(hJyiJRRGPB_4vU!{v?Wa{ZQyG<USn%Y<JmagN<4d8Nt6WiTm1D52Qq`5
zUUq!|F1-nXn$3>TO1SpD(&WSWm){P5&D7JaSddiClP;sJX2AGn*;O==SM>TlgS(l!
zS?qt_P`I)Tl0DLfCu-a?9HfE8jp1Qnt4<EcrCt)PJ2^%9Nxtfb_A=ImEvCI|cwX4;
zwx|t|0WS`L95#tHHhi5jltVUBNHlZ=R|cLb@+pruKqK{aA8AE=SAxhFxB*v2k*w}c
zN5;dk&)wzs3;7Lx(7?E}|8Pdn-f1WoR584xh9R(N*3S<kR0n)8i)={wZGJR;c>(la
zKVC*mZ6x6%lnO&~(lm%66Cw~3lzBZnis%w|9#)hX++Q?F9~dKxUA`@M?~}4>2SEV(
zhqJZ>qzvC>j)LwnNwg!JEomq}%sW35yn!@;;i>4|y*PTK-x_*&n&#Yo%KLVe|Bljx
zX-TQcTSIBPyO6{@Bzs*YF?l!ucw=#y8Q8&Q9fVXiC&H!JD&V{&QJC8FSY8n*B}O2M
zxwG_JTBd5@uRsvWbA<ROA7Gb!C&(uTn$FHntZF`_VGTR~PJ7DO&~=~bfyI1^s38wO
zB8sT8GeXUhO~>&$xj!&jf&M40MKcn-6x?c%xAi!yp1N67%Nm4A+Yu#~STPTS@!Z%|
z4`P(si6zkLV?-B@>0x_Xj~k7X)$eyAl%HrmKAkNvWn*qgwCt9&uZ%z0%52$6?!W$C
z{K;eY=qCCi{a|jkVHZsRpe(6~=RrpS6xpgT;@TmA7&+HFwGMcK8c-w7&7p|_QSH!B
zhT00Uwp(gQxMsoR9a5NqOAN^NMC=a#;2dEC^4yp)iTHxe&{q`)LjN*$8tMQTm{#a-
z@;ynTgF0~a%=X>b^Lx_*!m$|i4-QJ~UFM`MXxTQF{8zN6mgg6zjOZN*FIpsnR{n<E
z$CE!4sFFhs5=9u1g9z4Y68QoJ%kS(qFUu~$cC|b?Isuj^Bxu&q9J%QW=P@X_kE;Pk
z&RP*R_KLBVhkk6ys$6Y!sRYi^fO7}WaZz~b5~6H>u7X?TzR;j*<zhe^renwSm6_eF
z!`><8ZO^|w3{^!uEQ<n5Js$=w2IP_5CL4IJa5I{{p5?b~48)@V41`{-0L)VQ4%&b~
zc{oX)>#kt48P!WK<Gr{MTPPrq2Lecb2r3eeDi8->LUw_mI2`x}7$}-hh34b}AT|sT
z#z%TiE=3NAJyX4oYkzlL6#@Y5fS9rt7{v|&tEnx4F~BEjRUi0|?`%>ha!{_18{plJ
zIds;^@HJx$GN+vljRZljB!-9|mdqF?xlgi=0O$(x&AReH8Vc+Lb65XZJJO+-84PZ!
zRM<4gfC4xpj79)UFY@dDRbM9vY&4?^rj`K;MJa&x2s$9Up){S-0gi1)C>uA*CE#|!
z(y9>X9xSK$7tRw`&;yeQi;~L2{ihH;SAQ$C=Ig)HvoipA(hdXE^C;a`rmn>iFJ&us
z$@i%YmB-=umIcA>z!HO>YmA|PdsR5ju2^XRV}oBVgC`Z)9fz%dw#|)09q@*VYahS6
zz1i@v!$4zZRcRemqlEHsk*3cFPhh}eBj6X1g9FGsWuioVFu7$F%s7?tQQY4%xo<X-
z0nF86m5LB-8zf3jQ$c*(tHl$*G0%dV3)(Jj1K>E2rGd;>y6U*ZhF(dcYe7^oH>u>j
z<yv#QmOwiM3Iq(Rimt1$qJceAg%C28IQLldosMQw^K}tS?ssXhV+&+N5gZ0*K;llW
zwVY~vs2T-?*~BQ_RiLXXpSu)y&Q$MXfF1}AS*cFB0{95X!8Fw_;Q#`LRfBp+f=3iH
zY@)$Y*zAJZ9tAN+F)3gLFfx^aJiEy%&^=(#!5~FM7%R7%*7XQ$2y1qscREokxNdpS
zO%ZkTHD%=}#5oyCW>|o;oSbV+bC*TZMv{aG#X+h72nPKi52s15DE>knFDwI5Yd}k(
zDJuc!sS2wwz<~yUQ8<9ZLj_yGRxMYuLdQ6?oMt1JnD!N*h85FrM-yu>3Xdsk86PFt
zOQAV*0q_V`n+JVQQrks}L>H<R;GjK+#|=sL7;SWfM-e$mQ4c|=huI%YlA3o5`gm!9
z_N(`H;my15s><!EjyODQrS+x)$hN%)2E|=!wZ~oyfI~|FM>OHD1j1GThs4IZSVA@T
zL6B@+g@d+?huU8f8}S<eWD0tJHX5G<g15u`(s5PkXjTW{E*6F~1|rixNw>$o>WcLg
z!=>3m;qG#JJ0K5(7O)?%rT}|liq5$6i8V(_6le~RLa1fvJ+ILV7;fOQjD}!<56y2(
z6||!=xNnuyVcpa7kOch`o!b=sSCfNWn>wyaSwI!{U%Jv&)-Yh(@*u!niiYg-UQ<g$
zgmI&hFD{!7fEmD<3>v^{*e_B_z?7EHi5!5%adV@y6C0&?NU?@m6A&Cw0%!&h!XP-X
zaivkETzFZ9(Uc*8!(H0hKtXYGIf>|@B)O9^I1@Kc+PwqmuKD%aP`0Fz_qiNs7Q9aP
z83D9@lqzU^n9fFvyuU+;ibEJW6lG$e?!yMSjW1Ft5J&)=Kp_)pP-msu$+#PPCPi{V
z%Ytd(23~2NQ(9z>jg)@yzfuS{jPaL%Pc8~D#P#meBs3t6zKc^OV;P3fz$xsYWEcP*
z^c8V-ONxd!a))picpcRbb_iq3iUTv<`&uiYMH9sCW86WRgT9$qVnvFf^Zn=-0jC83
zGUku0S{Pa_I+l~Dda+oQJtD^r0*m=CtAU_E8fnZM;SPFfI`tJvBl>DD3cP|V=aG6)
z0=fKg`;w<tC)w}z-Cg3NKr&;by2w598)l|Z)J;WcZl#~2VEu2hy96Ns637e<6@%&M
zLbF%Eilw70iv}vv1?LHOZalxEzsaGxnXZ;iw%~t9A$H8*9+R>$05=8>xk+dT+-<F<
ze_?<bOrMMMGs3BjjF%*hF@p){a?Hty(|_h70R;wHcd;O3=q<-th=A{~^i?95X+npu
z%$Uts9ZgwkV_OdH)HaxUBv*m4KzKkK<f>r0xAU=;Z|DI~G%jNd4fWN5_~F(cVqju8
zDQSd&7~u01;2i-#4GoY0@s|)_vkT^922kLtV<C!nF#srT80?3AX7lO(y|hciP3k_u
z_(U@@@~#PQ*m!&p{hW)IJ=-K0WP0#y60Jpo_)dbYq{H4!BCT{E9j0+80Z-Cn9&Fy$
z!&bUx0FK!)w`{P31`-h8DKH4Ziot=!zNIFU5)P^ElcF@a$gu7e=_`oHg{kUcbNzRO
zQ3C*u1>F~uzmXoZSzh6SjDkDh5ZG~&66qDUMZn5vBPHkxJ`KZ4h=$^%S8&i!K$8wm
zu8V`>bRCC*&c*N2vo<Xe0H?;Z+F&O<6gWMIeR>ER)S5Aa+TM8tm<r<&STO+y0J>uZ
zv-$xV!%6D`hh^|KBY-kbSHRaS=v{@?usED#`RsZN0%LoLa4-WugF&(z3(p6^bDx-3
z-pA4b$m+(|t#+OFaRZVF4kU2H+nO@W`Xmlw&k~=cMdl7b-x-m=PrgGFfqiH<&=+IW
z^<Dm1wd{?D-_xGj7{H7mx<I8Q5$$j{LIJq13xDBd0aDeztBUJ@HX?D2^WFe>R-)fd
zJmT7~stDX;N*wBCEXu(WgprG(v$}6N?ShR0!~n?0Ul6?yW!19ayvf*f2N+Np#tkGE
zSj;itpbnN#zT1JV1`@Bj??$8xC8Mjk00NK^MdQFHI8n#hDuvj&!bvC+fHpX8N|K<K
z)*D0io{#9ZuE)JHF^Lj`4WeFJVhAKu?B%1Y$#3|3mbFAFI8mArY2Gf<T#gL1Arq)d
znDnpMJ2d@UtKl;RJseV_pa&>tKOsv9ree4g1|SV))M$o=#r@|UU3qb@#Z%Yf4fkyw
zZs3HjDy$o(Y&<L1?Gz9?Yf6Qq+aZWCD{xc-Z)ySZI6LnGhbN<ixt|KX2eG#QK2YB3
zEjyPhq6e~_f%^c0DG{V>JV{k(QI;-G=`9y9JQu=dUz2PO*;So%8A4J;jZ=X9lmG>9
z+?@0f{XhA6vjvDp@BE-s@z42x=$?cXrzilTT*@Q(Gs;pmT4{%fRRulPhCBqKSdp>3
z#$$H@NFK`yUfDfzC7M+%_7b~NlCXjgR3MXfq$^b|<D42>U;Cpp4v^mhSW5_RL}n@j
z=25^L%w@qp(4~QQ+FuK;(cD0{Q-6`GLlX_I>awVe=y}R(d|QSH7h6QwFF-IP^Ot>3
zwb00udv`WJ2`j@WDdZ9h2C(IA96h%{mGTVSSOmK2*9(i!W|L2A9VZrCcKm-0KP3el
znRe95rgEdJTdx8H?C*+u+<G^hQXWFGho-gm2D-sUel;Qq3j@e-#y4tWvAoPN{U!O>
zUAMG7f*rHF!CK4%mY7(0)L;t4gzMR@Jof}KqG*Fy#z}e^DJp2zIW=gRt6?tY&mtTR
z2Qlk`NC0io`X$(XL5GjjaAR6m0WInPL}&nxQ@?+C;ec5PDNzyO3z*wZBd>eH#MXjx
zU4awv7-!GSduk=hwR1{N=9<{@#0LnHB_yg*`ou)963`)h_MpPSvls4AcvgA=2M-KA
z&83OevtfqlzpV<+*X$ie3DlL2{zrqO!ZV&&P-62Y<aC6CZ-X4~w%`uq?w^UzTMh!E
zZi&H6F>t4BzR0QQ$3<?->S-g4$S;g>Q6G7vh6&HCDZYtb?MKI7nH>Gc87F@$A=DSN
zn-gOyZ(@?qPck=kYp{B8J}~p~K7S?-g2j3I!e8ufW@mm^h7q484W5~9g@^!<5_rWI
z?B(m;c7t@KLk;W(RmVNPJ}c%gVcmC)%Dxthn!aplQv41D>*B@_VBYNVgaDtDt?8%d
zU3tzQE;hXeU25+XE*X{Fynmt(aW@Y@i{tiV$E6UYX5Af$m^ofIN1)j#dr}K0E?U17
zLJ1t!?a+bJKF#>vf401(l`PYN@QtGgEP<g_=^0Y}BHjHWLw6ancB78qPC(SPKEE;1
zcw051-6}(rZ_F3#gu9mbN0tclDI%}f>$_x`uKIg74r2jhoTSuMutc}j-T%RE%bVzM
zqVV}~5Kc&j`0BfOXxZ;ZN*q*7BGD%L;=-n~OHP>|hhqK#&UOW3aPT<XH@l_FwiLMn
zM&QCe#syG-V{q9oyqHE6A(nb&rob1<fImUv@D%{{AZU#3U^;qR3s69kfS}x14r!n&
zUGA<WBuHriGTa&4-86Kq_rdvap*czRcP(2vj+t~Sesi44J&GK2+h1nY>4k+rdlOY9
zAl@buSQkhx>s^P0t2V%o)8eoKAV%h=B~L+2vrk86qAGWntr17J8Zs)Jq8{f(Xga2_
zPDQ`{h8%rxl-7{xJ<V7K3wg5xA7_24WckjAjEN_5vnYrV{(T)S){Ib9oTdOMr(&K;
z<G9c`01%sFvk%$CF)#w0$|Mm;bMEBbXX$fvcMLw)n}KA2!_m!4aGss0<b%p;4gH(8
zH8Mo2Y?q)#iJx$V$v^;XsRN6}foB`JZlRBYebSU+dVpMH?)Pv>fLwQSD&PWQEFRbP
zySioTu@W%Li)Km$jLrw<S{f8bH-UyG#IT{02uW`V^5>UVBP`Ae2|f{X+rf0kpqM1Q
zS9UnN<7oMBYa+ohZAq-M{u?X1-2EgjohKq55`S_%_;q@}$NAjTeJF7e<p-@UXcV1%
zka<9G{oTu{NTeNa@QIg+y!de9Y<(a&R&u+Tw$*Z1XrkP@-e0=-{)FIt>e|?zGw*(N
zpN3mzlFVQnwHvBqXzvYrQltw0Xgb#NKBGp9ReIHs{3W?qr`0F=Ck*hBX~Ax)N4x+I
z19iCnf-x5yVw_#5qwrVz$U7w!1_6Wu?{A(-ZxET@etU2C-Hz#dP3<Sky+3`Qi{(Nl
z-lx6kRhIhaRJBsrEW>JOwnK@RMW(-9o~aLrd>}1zvNPZ3vsfoI|D9`LvYO*nIo|V-
zYUu8LOgoT#baveJ^5=yLjy39=K29qP^7T%aQhllsOndx4?Px5P^M3$@KzqN16=w7u
ze;I1Hp+nk?5)l^<@WCO8B_>qOBDjq8VMUT`Vw#CDmgt{_wABz?cU`npV}%Ox_#==(
z3TYdLG8%bgYtJl!B$G`(q@<HkGD+i*L!nUu8cA^n4Iot(|2P~sJ9=58m}8oGrawhW
zxh9)!y7?xYarTE1nk&Vk+<$jKQzv&h0b)yS;AmN8D0q$}LoIwN8srin#3Co8C7u;2
zrRz;vDW+V-0>ToDmJ~;J{&+J9I?u(Eo2R;6bBGaa)aFPZ+@%B5N}U)gQkkjh8Xz1X
zV3H}Y<k1%_vE`jtEV2*n0m3A^hV(-;NiBhoP`b4OinFxs6AU0m*fWwcaa188Cd6a}
zj!mY30Y)tTtg{Ci=#=V@GidaI;2yQ0K}{C(inLEZ5OTB+8?6XD5-Vu@pd5o)B<c@3
zgDepTKHkI;2RItxg9#XLP@_#Jzhu#1wj~d>DHzGB|GbrlE4#en%P|k(sL36nQNtwb
zfZ@*$&voHW%~b7!<460HU`jOY#!^E@aU|kQ3CbvAE*diQ)~Pln#NvohAXH)X5}}6F
zN)%-qaW>j$>o`&$HJB2Ia$scfOAX5SQ$-xw#DWh!bla`e5KHVb1S`LkutO{^{2eso
zEM4?#%#k|;rR0@UUU{*bf{<(DOEsk%G<P%}U~j)@gs9Q*fCB;?gTkuOAZ~X8!ag9N
zQ$;9~G&>YNU4TM#(I7<QkFB*2V#*Q{R&5Hc{tWRqF(p6<M&T^9ltsIvYyZ)vGCYGh
z_~DB`ex@?eyglsL=?2K2=x>M5Br@y(lqofI|FSd0abTH|BYS9sM%YYY3Vf8HDcZoq
z?s#Gj;DID-{6oV!K+p*Rn#&)o_yG&F^t_BnCnJRWMW<-O3ipvPBfXLV<jD83OQ{f9
zENo$%G#5gX9ZVyftBpOPP(o9csvj&cS3g_;0=t3ZCEB2!KTJ^te*lFQ$nl3Z`cc3v
z958{}!3PMuK@1QmM+PIrN5+PCHwiiKZ@-WMJ{$pp!iA7}J9J+>dIbV7>>(D<xFa6(
zsK-6>v5$WIBOn7Q$UzdakcK>DFfeh*MKZFHj(j8}ADPHVQnHekyyPP}c99vD41^s)
z)ON1*M%#F!1~ur7Mkc{D3(DY>WQ@lt|51RTIIzG4Lm;35F@cHyEUN~6P!4Zo-~#9T
zpp`qwnDa`o#D2^y3rmQFCux$sQEpFj7r7=jv#HH(a<iM>{3bZVDb8_{vz+EUCpy!q
z&ULc0o$h=mJmV?Pd4_YECX41qZb+M-QPVc~XrA-z$+>tOY##uf5ChB94+drgLHOv0
z3>MeV62>DIlURb)GOE#ya<ro!{U}I5%7TlaAfzI_2n$TA(v`Bbr5`PUOJgcik6tsS
zGtKBoK>*X6^0cQQ-KkH58q%8jG^aonDpEZP2P;-7WMI$+7)%$BNpvhJ`;b`PKqxYs
zSPWws0ohhFf)035gDBT<)kL3j|Fc`Y(G)Vsf(+u2*10N5b9=zb%!Ef*AjJ^`DBOw+
z_e!P{rVuNE6>M!V+9))DVIMn~+YS=7ge*jZ71S^s;#@$CzSS)wm`$8A_925o)S?6j
zJ;@=0fmo_gL!Tw=hc+0x+Syhp8W%weMe-^}?V*E{XX>jA?rPXg^47Oz0<Lhca#-3*
zC2Sm{Mipwof{ZMo7OQLCFRa&;>}}8=*}Wb#K@bYJR`4c(kS%l5tKRjF$+jTCZA5hI
zzI~LJPm{Pvawn2krUs3^p1Lmx@+*=3vKJ~y!9*vtF)lns_K4VR;|R;>SqQU21_Cq%
zGH=2LZWOq~9{zBJ;$gla|9tNu@^v3ROy?>0!Z*Gb+3o03oGKRQ_QfC`%7GIc-5U*p
zW+)g0P*MzG51J9e=qN$P(BayVfC5lAelnD!92F7!wZsgW*%Dy9y>&Qc#pd&#i}i{=
zF6$~9U$(MCPAp}UQ~_i<#>Wo0h=yjFxdbSHW*fPyOz-A7i7BmtGll|<L#(;bhCcL1
z;?XEDD`dHdHr1CO)esqK`O#CMvJ5265K3G6CJ8MHdP{PuPLsOS9R_Y;&EaSg_SRXb
z-ZXJb*y>%qdLgSe^{%22YFzWW*Ayk}L2f<Y`lbrGjgEB*{p;!z3Ru<1_O-46p%Q3Q
zyV`IBwy;sG;%osp|G!|k2!GKh<C1k7A>U?}wRP1B0;Rj%?k4wbpZ!KMn@n@KRr3z%
zT{3$c1mEvQ(>1#E?|~B>O#l{i!Joon^C3LpJXyGn9d0Ik=uqMozqo@oWlw6(x@J`7
zRHbEYTvszZ%NQRMKTodmm77}GL5rgd=IU~f!y)D@A5tY$d-I+1Jj&x{+>%N7^OyHL
zNVcd%(UY!p_3C@+AZfbOJ8cfMM!o7*zdF{l4y1}}z3X02RmZy?_OC~o4dx&_+S6X8
znQNWxYX5L0oLrzA^%EXFdpq8RzU{6LJ?|Y32GR?3r7VpS9z&49PyDWU#z8&njbD6v
zag%Yj?hp<U|Asu~Gp~89>$*Uo%E&q-sts>!uLh-BM<*~rD{V|dY@2`mkH(&L*~4D2
zfFKTlprs9Mz=4e3b(r>QCn{y2D|@WiM;0<%`{g^x?O1m{^V7O+!Q%{yzE9%AMkj+G
z0I>>Ug2xi0FMa^^J?rHke?O-o@Cj+-`liS}`p^Ilf#CxTK}SFSpYr&t?|)1+#8v)*
z1jSKEJjB5eL_;n7f;UtF82F3!bb@hoLIR?}5FB6tULXeU3OLx@NGweTcEs9P2qx^B
z_Ke^MW=lVu)>GUcg&5RIxS)g3o>Tx#QLx}_$)J~Pph?)E_#Hy~oFEW>5({)0RCu6N
zz+X}D|3(Qo2S^|x9LQDk5!+OtfeRGS$*fXFID?q%K*&9Z7J3Qv4N16QR7RLW7IXqo
z?878f0pU499PE-tgbNx-h$FP$Q$=4q938eeND9873Nj812H}|00ue$550V53kl;zg
z0TX^iB5p(=2FUqIMLbyHP?X6MY#SE_NG5v8BnnA(IYKDJT>XR<*HFVQgb~+hL@16T
z&-~aPRLk-OLl+o9;E}`^MuiLvVMsV36qZb(bc7N%q96_lA#Q{jqM>KOjZJ7nDC`0l
z$W<K<!X3IH9QwmF-k}Ad0UBH$NbJMvXahRDL@W@4bc8|~a$_y*1IBRUOGM1X1P3D`
z|D!sBBM6A&LtV_ap#vIJfpf4UIJjd+P(z|%LOc+pKNzGoBuXd5!$J~|Lo#GE6k-w%
zf*8aBP*mbZfCDvB4DqmGso=vN_(T?@(Hm+6It)Q4paX*Jz%NjvICjDyOhUqtgc`D;
zIQmaUOoBGtB;lpxN+L)So#8&9gG|yS<&6YF8st(&Bt$-BLqg?5*2xewiw^!k7MMaT
zT2Ki%!a8UKG00+7`hyPcKr?dS@>PNn{NPA*;t^8hMm(ZX{2^^9;!xPiN6cd}R>?7z
zVGV>8E3kkrF->WyWX$aVEDA+5tYStW<{)fk+q_Lua)dH8O5n6h9H0Oiz>7b?{{iA`
zCKlB|C@euD+)du>P17`@XWq#kROWj<lXumGM$|yQAWCSCW@&OnWntqw?50=xW^azr
zZwlvEN(DHuz#ja<BWk2ru|OOc4m#8VqU-_F!~+Pp4GW;dVpa=2EI|p>z!JoYW5yyi
za1p1-fbxCBDW;-7)IhtyLkXnO5TIfac_(<rN-2&^d7{C2rsqfiCx8-Xfbu4v+@n7z
zL(IjM07aNGWB~|-N?2-yfg&i+439UU<?`KuT>>RbLeVou<1(UwO=P20ts&w0LtmyN
z8mwbDj$=RQBTDw;Kei(p*ri7NpHkd`&Xoi)=*vqs3qSg!MkLI_Fp(nw|6gkEC0}+K
zR%)eCh^9Y817V^OJ~)S2LXpiyXk(sb?F<iIA|j56i>T~^b!N;Y>;V?pO()3J@-&ZL
zmZ?9S>4gx@AT)?Jpg=}+LP-u0@%*Bf>;e8PrzJ{EMxX#XoMEAAgLQi8OK2%|Y2sN@
zL(G8yI8;Gdi3BTjWpUOIHp*3|dZk9Vr9U(&c}{AjUg~=Nz)D(;KX9W`B*mp-LbW)m
zs-gp{ZsLWGA6;@pcYbGhqG$;irUeNmCNRx-3dMRNQ;M$UX1eBO#wN+orgYZAZIb3m
z*g_PXP1$ro7qCILnq5iU7k{F`bV(~HMJC+P#N2e2Kj@{B21$x4|EMV(AEo-kE)XUW
z;%b)4qP{v1Hcn<o$Yr}WA~8&tKkNaT(#e-zPzEKbKNM_6AncrOM4fupD%HXcU{Rg|
z?2imVc3{y<Fz4OulF^{U4?N6Yifl$Wsy~RTzCxEjOqZpSM1wwPMr4``klukhXsC#)
zyjs>0$t<d>S1j0B{P+X4?4ok)K`VjM!-4<{1X|IefFm5{@aW*XimG(VgmXZtl=943
zawVu{L|?+GoTdq#+9{qA&z`EOpS~bI#DhDq0UNNTNK8VOxPU*Dz@6r47IZ1``~(Ob
zPx3hIy8=myx+-k7Co3Fh%%y0BipsufguY^t7I9HVL<2E)|AY&a)l0ambw(%aXl&p{
zX-15T!-j4xuuevFF49IwgGf;nfx#q@?w5{99Kb<$f&hYuEH&bTgQ5df!It!>?8C}p
zt2WC^yll|kO<BQ%Bgj^)R?F;E%k*Z%oV~8%Y6Hv)ZHJu}@VFK_&=2w+?xSi%iq=lX
z+-v0K>dx9MiaG_v9;{9ZtUpw&cU^48DlEsAggJ27NlXGJXaiG}0Ns%74*07hK#&Ac
zkl~tdjjS#Uv`f;mfO41u)UpCbK<*}D?G{CC<mzBA?ExG#O}&1^B%pu`_>a4`DhTYr
zMcHl%7gG%!Q`3|{cDgVOhfoTyaD+fDgv`$2#Dff<{|Pk+Q76d2@K~pFN-hXELJ7b_
zJnTRTNRU4m?*|9kftFOybg&F`@7*ND>bl-WFzqQlj1)bL89S{qa52&zo&|$(oB5gy
z1da;~3Ir$b>q2e~G;T_@Z_Hh9{APsevaUb4ZgAkQ?Dhlg+HU{ah5!@r-Y#+@XVDgQ
z(H9|83+Hi=5RHwFgiO4IY$^o`EZIJ|)~+p7OmxI4gG4_ZVvzLVN0f>^3JgK5giw}5
zbcIBj9B@8$L@vMXzoCPFLU0?)&me0A2D5+$hj7fT@xw@PyYS}@@1zRrWRI~x5bM+q
z5V69RaDhZ}0TT~5w?r@f5|#=R6Y5V6bMhPU|Aub>2lkST!`)04umBnBh7y&;FMLfG
zx^vM5Gq1A5Di4fnz4DnLw8nG<ECclD9LPrCXu{zG9_xm{)Q~KD1U*!=LwB@Cf3&q>
zEl2DkT!OSopEOFFnn-g5<fgPszcfrEmQl`RO<q;<(8?IvTr$#1OUJZN|1?l*&wlo2
z9Ax6ecoz$ZA}Rjm$dGMG2Q^ejwNx9isa8QWG^{pE*H~U<R&Hf7Pc>MFwOI3r9B)xe
zSSJ=G1%>{sQ;)S<zcpNIha6MG66_KtbV{wV>h`vET=%tK|20g=u{K;a3b4TNOzqKD
zFrG*=U^lj7KQ=EzVn=*3WLLIjUp8iE|F&jtHfMLXXMZ+mhqh>sHffi(X`eP~r?zUZ
zHfy)GYri&Z$F^+GHf`6oZQnL-=eBO|HgET~Z~r!M2e)t!H*puYaUVBwC%1AhH*+_)
zb3Zq9N4IoOH+5IHbze7jXSa55H+OfpcYil{hqri-H+h%0d7n3Wr?+~qH+#3Yd%rh)
z$G3dXH+|Q)ecv~J=eK_EH-GoHfB!dt2e^O_IDr?qfgd=6C%A$yID<F1gFiTgN4SJf
zIE7cZg<m*^XSjxMIEQz*hkrPThq#E3IEk0IiJv%%r?`r*IE%Nqi@!LG$GD8oIE~l1
zjo&zq=eUk*csF>0CES8F?6{CC|K2>zgGN|_79fF=E4dt?f<_eikVkpe8N(PL!4;r_
zHKYL&NP!$c0xCd)8z^}o_yZ(d0TRf8EJ(SUFWoyNITECSHB@;X@Pa?cLy-GJF=%-p
zNQ0Ye!JV%;px+!JEIBI30TSdvM&yAMAb}PzLY-^5k1x3;1UjX!+@K@D7%T&(cY{9|
z`jR7oC-{RkT)`J~gPS{grKh^Z$%2ww0waLBKWO@=V|qrsIxqNvl81Uoe8V^7!$$DB
zuaAT}e1kq@ggh9-GTZ~N7X`5YdaskjuorusBfGMH15qgZJE*$0mxMfoxh$lC6chuQ
z&$^Oxx-lRDA#ehw8+k}1|2ZjWggTTvN#p?%i2FA%fs*rrl1sEnxI4Vd`$*8cz2iF)
z=sObdJ4k$k92og6Ai<b#JH&^CJOqL@Xu%j{1Tc{M6&QIp9J(w#yhwNg5`2M1pu)(P
zgeT-dkh6Lk7(+eefgcow$di0Vm^{soM9Q!Ho4Y*B!-SH{L#*e4lSe$!cf>oOf~lv0
zk<WvhFFB(7!#7BQA6NsHj|4d=xwZR)mJdBJSOO|!{XNJ+F&Kj-SVJ+$!aG<4y}N-d
z@PjO*ImUZE*o!^cTLU@B!ZL8g)gwXHZ++Z<eMW@+*q8m;r~TTu{o8BAGI)X~SOY&~
zL_Qb;C;WIuG(4!2|HIwqeMU$FDR_c0XvEpi!!1|>Ej)hF4>>7lIT9>G8eBovoBEQ=
zLALvYzWV_!FgYiP1f=`JJ1BX!2g0Y*dAt+4z+1wn-^0H91Mn}o@P9fgWPHqX#P0V#
z68wJf`@`@nIVu$Y@h89WFF7G(gr_UHqkqAY-$KJb{PHV#^c(u3i}~sAIO~5pDbRcF
zXT&?m0whejMyR{10|XL*NaQT@cMu^$S4gz@Lq*WvG9*{5@tVj_oj^je-sM43>>VT|
zgu>ku*iRxwi&rpe<k$_8tb_*_Hhd^2;>3y<Gmhlw5u`|xCXw_bCy<vlDM-47laoiD
z#fIGk7Q1%~|4AT!vL^E4we*%hIY`ow<BDWvTD5E0wsrd!Zd|!@>DIM-7jIs@d-?YD
z`xkIv!Gj4GHhdUyV#SLYryV<xAh4|d<lSPFM~)vz#r(}nBgI-8$Pm}c6WC2OEq|Vn
zjFEMgT+ez3f%+qbgp)s_{aCw(E!(YWrm0uAel0Mzz}fz4-_E_;;+TW-^c~b^jFV`z
z{shYNhgGW|B%Th6)H+t?Jc0Zgw|D;@eth}!>DRY^AAf%R`}wCGGa9t9<hWuqfxd7f
zD^3cOj;*mgLgF5OED=bH3bp8_Cxn{AO}CRKWXM7c1%k^#fg=3S!V5E`?IYVb+-)J8
z5_(6A|B1xguDkCh8%s5ZAR3D^qS)(?$RdqA63HZ$T$0HqoqV#b|3>qJ90Cg*%@SVZ
zU;;7**Rn_;KMpbmB7S69rX?vfY|*(6iy{*zGttaQP3z=|FfA~V5Yrzx{gE@xH92c@
zH!_*1PL45_c_<Hmj=~X%cXZThLO#c`L@XqXadSv0J^d8aP(>Y;)KX17RV^t;TLu^_
zuN3GCLT*82DS^CHi>Ma;$w#0(JW8V<It6v{xs!NB!dJ3_MWRlBB;#|YTshmd*I$=y
zcEe(e(x=8N5Y$4Sl}M4Yx~1d*20VYd;qr?bnUHj>O@&02-g@o57vFsK-Pco6Q27^N
z|4Yb`hn&YolcSg#1@c4|fFW@!5N4}8$eJ&Dl~h<3IeSRke*CHUVt+DrcF(mUmSW<M
zEk+h&W{2h2O^?aZE)Q$|41~)-ESAO}1(84nD?%vNE{$$j-1OK^`CXdnrk#Eo>Zqaq
z!Vg(!;RLflAX(-cRA?E92~zgDCuO|I2JCFT^2ui=eab%Q9=6q5Tk5*)z8mkn_1;@P
zYXp)a5Kdfa*b>q5kfv5<QQ@2M#vOkg^2jBh{Nq<4LxmJB|6ZK(&OQGe^w32gy*<Az
zhZPvs2Ks{Z)?I%c_Sj{A+?uC+y&ZSVBvl;=CgzzP_~3;fp7`QP^<*hVj9;Gl|K^>4
z9{R!FAt(Ckt-l`o?6u#X`|iE}9{ljdAD{g4%|9Rg^woc>AEo*6xUEj_nN8`n+E?qH
z`e(X-{r>&`AApV{1QNb+kYfBSen@!OZJ44!x40n<Gx3=e9=4V-xM3#mP+kBz*g+3|
zkW^&KjXxqLskWfPAZgG7Ir@RZ2SyMfRPh5aB4&_OVK5<qXch>0*h3%w&_4W-LPPYy
z1e_S-3xJCdD!!11E68IEo|q65fE7hYZAlK)(}yRnV2Lll@E}wP#5eB23!??1QS<nM
zOvdm9OI*Pd*WuC_?$Jakcp@K!kir+HMT#rH5r}~l<RA$d7m;A&fVb#}{}kjP3nn~l
zLUMovKNPr(D`?>slzdnqv>=NwNCzvB5D6Gr#1Kz-41$zF;D0P3l3S4DKe8ao*0_QS
zkG$g>NMOW-fKf<a{t}oy^qVCjb`NP}1r-&N5E7`TNq>wXP735z8c;Eocle=BQXu7+
zAVDBZrScuCRMR5Gq{9vgO)OGC1tXBa3)WcTAsY<lJn30a^Jzf}Oc2wvJkif(M#!1a
z{F4GrlZJkJLLPa@CMj=G7HUP%4bnNv;>K`=gGixK<}}F&lXy^Thy)V-<b^#+T2hl@
zPj#HB$DX921xO-+Z2^tu!`irvJh(w0Sg{0aNSP68vU8J6FosAd|B8g2A|Wgh1BOY+
zvrJ%kksM_51TU^I(vw~lt62r!QBZaeSu7<D>R4uVWIE7?S))dL)Qw2SFotc?;xT@R
z5aP0ez%;Z~ff2$AgvK+SvE1=b?A(+7v|3oh9`<u`s|%hG^0t{Mwy|m{8)OsmHvS<N
zvzgWGW;xqg&wduPp%v|DNn2Xeo))#KRqbk7+gjJY_OShs?LKIW58K`rAMuC>Zf#53
zeaIGmuodobi948n?Blk&bw@hP(Ohmk_Zrc?#x$ra-D^A-yWD8*cAJ|H=5p5@*@doj
zsasv?K6kt6aEESpi;v$H7ryZoZ9i-qkL5a-8`Hh6cDuXY|Mt39w)8n}a_xKH@aA_K
z`|WRg_aR>gKX{Pz&8<6}t6%>5x3|GP)qrzr-wG%A!tK>Cgh^at?nyWv%tdgBd+Rt9
zQ#icQ)owa;i;oeT7{@t&9dc7_j_I<v!Lg&ShhuzQbGXC3I#%+M8;4v9=hw*VwXyY_
zTx9L8H^@xZ@|NwDTjt8x9J|f3_=a3$bI=$cTvqd%mqcF*NB7LT^`Mu1e2pVdnaz3D
zGko@u;{0k?&V<ZujJZMMG4C1CiRKGF-dyN-9D1I8PRE~-tY}ML`YrZ|ahTJ5*g+dP
z9yiAHsMm~-N!vNppY4aHubYlelN#1a?ngZG8)is5{|UtfHZXV9>kbU#S#-1ZF*n>H
z>R2CJxU<f$tDiJv6<fHuzGm-#39Q`jA~?#sHTL87;g09J<JQO)H)?5p4RAM!(LSEW
zm9-rhXR8~~ua;c5zddg3sl#SXl7<Pzy$>I!Bi#K-H=Ntu9ybr$)|2bDo#kzB=FQ_4
zz{t0f$l(fOQ196Icy2tF6pvw78b9<sHM1p0Yi=~$;l;a!V~><mWcMSyC?}G~3oUc~
z2%F)O(>ON*p7Pl7qeu7n2F7*s4a(w29X6ClH~8(St9k?K-muG!X&V=GM7`(kxCY15
zLbtz+W7~8=ZqEf1cDvxi$L`>l+1-MVYox>H|HPBWru0EQW8jH1z2uKIy1_Q;g(ZxD
zFDX1o&;-NR1s@<tOB>)2mpvF>1-W2LbJt=BA`l@He<1=Q_JUlt&qN!<_(fj&@r&Rh
z7a`z42VS(UcCIh_^MKh0G2#*rW$b0r{&+oGcCQzFDB~Ba=RN49ejjc0-XH4#zRewe
z4_O$aI@hs|L9DtTa?rvc{8+}sopsW2WF-(<p-VfqlMqqH1r^~Z!Xwr~`L+Zh^L_!l
z?_-~q((6UT=m1CRg?|^A=hrWy0r?JN_T-}e*kb3n;Vnk*FTA1u)Pe!~<M`G>8JI8b
zw69Y(WmAr%9|W)aOzQg(f*5K64Srz||0dxeOaTqhpcYav3s{i+z+nY#EDqp6^88^R
z;y?z`AkENW572-b5<&^sFD*RoE#MC!#=#7npcD=Q9`xV|wx9{kKo`tF2~=Sg=s**c
zzzqCh7Pepuc*YC0kP8oD9O%Fawm=uw!UEG`AHYEywBaD`4<X(#4i91-s6iWo%p3OM
z4&y-^iq9YV!5j9l!Bh_&CeRxI5g+ytF3f?t!VMnckmLIBAau(g5>Xq{Y#*Xw9p1|y
zCUN!lLI2PJ5c>ijynz~MFBG+*|1_}&T`?h2Q5*IT9q<7T$qo_~ur2oC7m`f(@BtmD
zVIA<068)hM?+^#UK@Sna0TW^!|BlfYf$<m*!Vih@Ad*oI_rer6aRM7r8|VQc5|J1<
z&JJI#0^^P?SOpm70UPwe8iwvjis2hJ#URu{7KqNCLhvB!Kn0$F1h(J?{GkniKn=Fw
z4E&)HazGB$;1S3#2h<=43_&08;0g4=32`7ICvqPmQVmof%Z5-bc<u<}Zy%Jv3m$<8
zq+uU|APF8p3Gl!lF3$=PK@*4|2@rt@N?{ysvI+g+CUbHp^&ts{FelYQ=4{Rvy@4JW
zkPdN>7{c)v`b-((!5eO`^ppV}h=I1^Ap*5Q8HgboqQM`);TN=F9Y*gLs6iQ&!4u=c
z?UM2rZOb2&u>!#%8gi?_|Dxd++;abv4-mltAI|a@qCpwRZWh<VE74&cXb&)Ju`KiQ
z(fk1y$?_6|uQC0BFTnvX--6cK0w4HtEGzLW;jk{NG7$ZtFV`U&_Ad}~%NhF*ECJCQ
zLbEUh&>!dlG7mx-7O^T-QyExu|KM^h*pe^fu=Lg;Ej?y5aZ?$<!7C9W9o5k-xX&=C
zBQT5xtN76$=l}`uK!J!L9&lg`is2yr;ReRQ8kWHr$ZrgI!3(zFW4xdX{lPuqa|?2T
z2=G8BZ_pn^GA$Yo9)2<*kkB7;;X4sQ3I0G8kU*@SKqiTR4uDb@ZgL#{lk@x`34YQ-
zF|-tjpgNo&LucZ*|9}g)d<^9Z@gSTs0y|SR{ZRO(vh;coAtEpnhchx)wDk6Y7}4PY
z@4^>1(Hc$f_jK<Uz#+JB^B|%DExjQxZ*MB8LFP=<L{T&?qG1$ik4e|TNsSaq5rQ5p
zQ!}$vGxx7Z*=GS0LKSf^)TS~MrS2CqQ4Ybf7-Mq|-Sp~KbS5}+NDm?rRWlaVf=W;H
z8c>cJ;2{z5fg1j_E^m<mkFP0}lNiL&AEuK!<HK#7Pa0SbwYZZG)Ib;1ga{B+Qp`X;
zcM>7U&uHjCKK;QA>Qhy_a|<2;3I0G2v_S9vlL!$49;(4tf7MsFAPF>~K;!QcYE=*P
z02uV3PJ$pp|JU#!w(uZC^dL4gT9sg05rGb{6+?^Ay1o?}prQBPQZ?@sAr^H-JCW<E
z@+oUHA@q;`baeDK(MS1WAH3l#4<Zm{kutU67vNz@U#~ZnbGL$!_N3HXzg4=zwfEu_
zA82o2*MaLA@m~)jOlvgF9#%6s@%H$_MxXH@G`1|^)EF<3FFOrnMHU>2&qm8~IBm~l
z%QgA7F(KkXVHZ|hXF^JSR8dzp8&xj|HB+~UK{-E>H`@@xnl3R2i!aE*D|kT`TmcxE
z_AWS;o;;NfbOBq5U>1k~9ctkQPPGX*4j;(xAXxPvUiBc%R#shs2wZ^|Tmc&p0zeT0
z5t0CJ|MM1ai2w;U4<QT`9p2U-#sM1|bR6^m3DjUFp%o~(m0C5FLmk&9iC`Yg00~C)
zEsjhrRFp40<|$3nUrA982XhcxR%V?rXv;E2?~h)8)GmUIbaC((7_igO!7}-^F1OLP
z4AvhIHZC;xO3`8VXiph4)=w?-VwY5Si9t&_wl9d`)j+m%`z&7>Fd8XSUxyQ9choDl
z5qcAXPggX}WYKzQHgnZ3Eq3-6rL<!!kREOi9e&}_+!PcoRmaqU7d-GS$l(@TfwAo3
z7R2fx_`y34;vJ?XFYW;tly)8UkuCJW6|6RxuvTkl(j-Oz2#_EMNJt4tfCbusZU3NE
z|IOeASfC$5cnjn~3RFM_a=<_9)-ATc4BDYU`_?;D^71kPAA$f0l3)wGU~v&bTK(a1
zlYj`Yb%;eYACdqGlt2kE_bwhb_`bLFh(YT10r=uqw)ismN;fTjff$6ZAKKFNR8L;(
zQW#ygF5-b0!V*WLq4>O^jenCe`?6!BfqA{r9}X62J#%)^ffeyMDv@!HxvnX{*DHhX
z_VN-3JC+;4c>kogE(_CkW%havvn}}$j2p~fvD7l-ml%fAELkxv3)5rDcQ4deQ71WH
zHS;Vdurb@R(}2&BaZDYI!4+(1E_mU8>q2Sfq52MZFOIG)mcfA^csr4Ry<USH|Fl9)
zM52+j;vN)A3oJn&wu2Wi#UX~MAFlZzve_SaK?}a98#)Yz*#aJD_$@9pRsEtG`e7XM
z0aXnn$b1nY4sZ?^L&N%kD-+_z@Yyi7Ey!52FaR3=+QOhOwJmOeYuth#zF`@p0Z(`t
zAs#xSXG0#AVHpaz8}7jxjA0&(NgCt^BY1&s4)`66!Dzza9hTu9mVtru!lGZvAK-Br
zmV+GFQ>@-W8o2Ksupy!`;vK@l7-HIozV8Q;dM%DFAE*{C<OU9sS_z1iNOV#Oh@e#s
z11v)iV3VXDz*3Ew#4Yi-j}_W(jKOApr!9D)sCmJJDEc6P0VIHd9P}X{|IMO0ptc(>
zj(~ZgfWrZ5i@_@1K^AyH9cW?hZlM^?M3?zOuHS*Kzrz{`yE9~A9^}D0^5Gp^p|NOT
z-(&$EpU*4`DIes(v}I&5Ea9}Rb3gJy7t}g2$~r#=@JXu9tRv?ea<whqp+`XCoAE>*
zWFjKSfvCqM9KyMP-T_a5p@2Ihm}!AMjNz8a0ix?+1NkDj55kxUn;iI89`ZpJBsw8D
z`yjAk13}vwrUkTbo4wn6FzO+b-~y<>`K|G!9^;xEtU(NWI-Gl%xe)@G5ki=U`|iGh
zjIMhx?%P?q`<1#oLh`{H&O{*)!War@E8tN(*W0}}oWt>gA8rA*|J?$AKgJaV7_KX$
zAG*O6$N|3j;lpPGt`XwD4+6Xed|HgTzz^InP+Z09T9#^BAMU|p?t#4hp~%;>A8;AN
zy-I>R+{vGu!nG4F`XO#LT05cEs(``bq&p&B!-ir!uAh&>X@MgKd>L+8=t=^?_d?5!
z;o=-c7H)wT=7E3ncj5-eXs$vQx&gg2yvd;)(A|5l>tfr;>N}d-mlIm1)53k&LT;Qd
z&?8;a5dy{kf`5(S7R1nAmVvEl;h1@d9YXyeLY>t8fz(Ca)K5LtOMTTv{nXiE)LH%2
zTOHPE-5;2N8ESpjXWiC$eb-gJ)nmQXeO=XYUDs8e*oPh1|9@T9n_bzRUDS<T*j;_u
zk-gfV9o4U$+MylRr9Ih?9oxZu+q2!;p?%t6ogHwU8P46-dtKYnUEA6H+q*s2+x^|`
zz1+z?+^1dMS^c#1ffkknZT5v9dijSo0O1S4A65Y2H(&+)p%5B=15&{sBwh&ofea)*
z*Cn0|{6PpLo*hy_;uW6Z5&q#LzTqj};wwJk7rx<7UgA~0;V(Yp8-C*(zT-c>;X{7p
zUEbs&KIT~-;V-`7N&e-5KIMge18833*@5Fd9^^&7=zZSdksje?e&~hX=zkvNuU_ey
z-sYVi=b?V*rM~4$zUsSv;=i8dJ09&fz#q(h?Ij-O|HFReYaZd#{pocc;p4vN>E7zM
zKJA14?wfw^qrT_SzV5w#<q_WPCEo9o9`M!v=CdB}H$d;lp6}sa?iGIW8$Pund(z(m
z;Zwj4&VdI~K=pax94JBcRi6^h;q_Ah3(mm~W*-)sVfIfS3ueC=T>te?KlN9?^=Ci!
zU!Mow;2dB826#Xb&S468K>DZP96mw%rT-I9|N50*5w4#HdZ8J-|M}m*`<ub~umAa@
zfBLK6`?KHsm7n>YANsGK`p+NxwO{(V-}}K|{Lg{>0fL9XW}gHKRCI2N!71ko8vJz5
zAdffaV8GykP@zDE4h2G#NKui*Ud<#Td?S&d|H*_48%q3WkfOzm5?wxw*s>!Jk|58C
zG}x@yN|Xj|9>lq^p+$@=lj?*iFyzRR22ZBcNz>^|q!TN`$STlfim{Z=jUCJ59Hp}<
zU^Qcl<(wV1&0w*$a}EnzwRg>)O}lo(27iPL8$OIUvEs#y8#{gsIkM!*lq*}7Y;D=)
z&73=X{tP;_=+UG_3qFTBwd&QZTf2S@JGSiEv}@bGjXSsQ-MoAI{tZ01@ZrR73oea3
zx$@=ADZk^@Ji7Gh)T>(;%?wuY?cBS2{|-L9`0?b+n?HB_y889(nd_r<uf6>F^y}MC
zoc+B1{ru$$-XH=Q<>1Cc3g^7BK{KqC|Fc0{soC+L2yYDNn?(^B*k6VkZkSto_k9SW
zeY}tpVu>c6h~i|YamZqey+KHZ9WZQA)@?Qzh@gV2G3X#_2*$|624wtZp(2I2h-8u)
zVnIfVPFBYcebQ+5WR+H4Ip2y(Zpo!;5cYBoEJB9Kg9s^<C8H22G^2<OBESIVjRz(u
z*I0Ix!=q{lf>{m>9t=2F3U{8<i(W#2c}^iPq<}>>=VUV%87aV!mk^1<Fc%EkL7IXP
zQ&`$%sG{PAWvQiU5np@cKxb;JuD%+YmZQ$PA%t((VZ#Op@$l7H=a8|14OlcI!W4xx
zc#fPo_Oihgz*3TDYI~xF#RkYQ|LZJ`6$$!gIf`t+L$#KEi$%4RDhuwh<2Gn6t?s^?
z8V^FiN-t%3Fp-Be?A=34KK1?!aKMMj3U9&VK`59ASPYmAC0K~y!LJ)2icBFwY+xz6
z%^-MdgVFjpF|`{E!!d+dFnc62j`HwlL>puyga~+ga4wD^r(nZ5Li}0In+E^frH29!
zU6?F>$j8e&L@&+sm1Oh?bky8I2n&Vhl(T|_xk~KlFf<n;LdG^XQ!SHZDDv@~h|X9}
z*<_q8=8?k;Q;wShUYt#tSNp7SMLDyKr_WLk&Y{pv0~`n{gsD?ZVfuJNOLWUvb9m*J
zv&T;6nr}{c=fi!eS~D2;|B}K6<pAsGCmYz23b@IRt@;~lL5r-kLfUaLMX}Fb&ZLwq
zTF#G!c#!kA9oIakf-vN4@)R3T>Us3%8GiYzUrcU|AB+?R$ufTEyBs;dR8M~Sr7=^;
z3jeLoep=GMpBw0^k>P;{LH2_B)wxb8bAid1<2;OIBW(y0ObW>0C;$pZ2#!icu3(Ug
zt6{+d!9vEPoHr>-`7cL)d(_U<1U>kP&^y#KAC~f<1xxtD8rvg`8}300#VLnh`Y@pl
zZ%CPAv5zf0B-jXlXqy4PMu@N}hof*~#MK-zHAz&>5@S<{lMxG4K&)bLnlT3)wkk?1
zY@t8=pbkz@2|4|^|AjoXh{iM?h8h1!!5m&8jyTG3j^gm474HbdUQloY9*7_w|EL==
zK~RlXl1CuMunbx7q8NlAL=BT;jBXHek~qBB26O;NI%+bGb_Ap+J(rDCq~eL6EG2B#
z*Ca|>$rAHu&NmvT%2-y<l9AY?E$g^}Fog<F*+2#|@C3|Y3UipmET%D!iA*E<GMUV5
zrZbb-%U?con$&D&G^>ftY!Y*s+DxWux*5!C8WTy)Kv*Oe$PQVm5f!rFqB`G6w2P%6
zleg5Q4#aUzENDkb3JMa&^106>^>cv$-O@n+*`R=u(`ABT2PJr*(1iv`VF@)TLpR`1
zh;r$m_dG`F|K<fx$@Ie$<BN<w^x;m=+#^+>Aq5ih5Ym_e%#!u2={XHpBNnYC1>!h{
z6^?<=Hs+K=JMHODgNjoZ71gIez3B$dq|~t(6{zCSfdQdLRH-u6sZedvQjc2It0L*E
zRPAZ$QYll$d}9nqkRfEWAO$&u#t(rI%{{Jw1XiWhF#6CdmikIbHg15PHMQk2B4Jfz
zkS(J6p+p-A+f&3^Yq1(~tN|f=*u+vcLzaCiW+kgweOC6dbj++^no*Yxb#|U}G;L@Z
zd!E&P)~X3g?PxE%$yW%58GBU>Dv$tNSxiP2as|yj{3RM`Ab|-=>#aZZ0gPLW(Mr&j
z?j+S$|I5M__84%i7NcMr9#|~woI1$vCb=sP?~3+3;w=Yx&8tcDsu#TAY43Y)Dc`5A
z*F5&UBz!d)i8-VfT=cCk7T9s$^LAIi1@=yV%UjO?4_Kr65if%M8{rMCz`2J3hAgB2
z+*=H{xP(E495|6GUIZc!kno2rfWZkjkU}4U=!PHsa1R;>f>kuOF^)@|hdj6yGL}F>
z8aV6^X^_ZNN}govc&gnf_ms99XmD`?GuUI4wWi0QvXzO0<yUAq%3c1?mxmMPF>ANX
zf;qEr(!AxG&Y_Ju8V{V;?B(*@Im&Z3V4cOY=X#d85J)ZzFp!{yD_~>9g+YZDcp--t
z|GPp8mav2t{1FH#<be=4Ml>nX&|+XjnlSh9G^qW-2rZx@5JwYf8jzqu=kmf|`UuB2
z3`36QnrPOASu$aAZ9eruR?1vPtT^T}Ebl1DvTh`{95Z`tM*X=s%Qm2ZogLYGB754z
zsrFN^?QCdoTiI%{Hny{!0*CIGJKk<~xQ#vT?z9`+#LjHG9p>iU%$wNf+;E}!p#>z!
z!WEB<3~>wd1v#vG4F1ppDg3dFO9#RYE4)Rijo}YYw3-nu_Q%CD?uUFJK{KRiwPe%*
zV({%%xc87pKCIDPY|KL%^*9mB{Sgik6GrAVCm%Zmb8cr_;i}yJjd(YZiZ1^*|L8;4
zZ_#~o^rS;L=yPnkw2KpUrBl7?M8|ryq`q`)1GRJn-cHu1zICf7n>c3=d$`3xb_%oo
z>sk-@ZVUZehNl!V2Pe!G5{C*@=mQD2zJ<g&QJ7K_rsRa-IH{4a`0p`+Fpx00WO#vu
zE3j0iw*bZ&!%<Ry7^5HL@O6kfFOPe41D2vEz3D4=EP8LfrmvuFIbf0R*x2PiZl`+f
z1#|n{!)Et_>3z_DZ#vuuhxi*X{<)DK{N<Cq`LmC2pK~ev;ZNWB&W677fx~?6hx_`v
zls@mbZdJ7QwjLnHcxC$jMVRtKUs`a*H>7X{Oe6mBk#Bs*74HuvS8CmG|7eyc8G-Op
zg|<RVCJp-V4Xu<S-OvrUaBE5CfDm{&z#@Lt7e`|jB#iPR=YR}?VFes$SU~lGScMyS
zF@hUVf+iSWD5zf{*n%$zgRLclAjlgmNP;(5T9Hso1+s3qQBETGZ9e#HIjDlS!GkV{
zgwF<q;vj_Cml{Plg6_6;=cImn1qnz%Vw52ZNFW6)HwIUrY5wqAQt(@t<_U=hc>%a_
zVyF)Q$an~-1*~Qn`4Diz<y_xj4aRT}@9+-tU=5V>B>Zp-`XGpeXo%ILK5_Ph07hGD
zLWBr|1^5(+lIUlZC>WQxfz>BjPxW-LQBIwRiJ3S@p-73hQHl+6|B9$6M^xrMw{dh%
zIBZX-ilg`%t>}rcI7hOW8?{)1w|H*HpkW+F4$D=6pD_>aw0WGdQt>frmSGLc^?JSa
z4SN?Iy4D%lXhV<ai?)PVR=^JBa%N&87?>1}bTp3TIE1f(j+aD?sMwC?NE`8}j_W8#
z_4tmifsgZ;iN`Q!2WAIL=o*~`R{F?~=lCD_sE<80knB*9wSkb3xOK+pZ@uLQNI(dc
z0bCymk|8OQBT14a8IqgfQeU8r3V0d)kPj~jlQAiiFKG?8aE-kMbPs7uZG;yG*%r)@
z0tu;;bHtOcu@<lZltMX_oMb>f*&0WgloqLzMd_1B8I)4F|BhpJRp3>MQYU*$NtI9e
zlUKQvNr+3|<r-btWnXE6B?M2(B?V_h874`Wb!nF$$r)~d1RYmB?{Jfwv67RqD!f3L
zg=v_F$qTpO3bOE*q!x{o!4J_`a6^-mWeJ5=l>*WCAPs4m=OtO0`F*H?FqhPs@%5RS
zDVm&Fnyq!3q3Iv#xSH%ZiRbWVWb+?vS(c^+nhG_V_Y|A^IGeRuErNlYFzA-=^lJNe
zIq%SZmZJ~L;0mtLn2D!zj-d|K86DDK4S`7*{NM`40G>$(p2pBh_W%sEV2Jmy479)t
z`k)Trc?*q5nH%t%kp)L%fdzJeTIu+S4|!Pk$te0M|2h~}pHK*(`MIA2TA=m`cLAE9
zXt$sOSxfk72e43sSZSI6*`NqIpb%Q161t%kdZE5}oU(*@S}>WGb7)e4flWgWvcQLp
zaSzzp7~F{*Hrkyr>JKBbQiNfX{4gT^01T3ZT!i6=OjDWl=~Mr4iF1IVzqzEQ=%fpJ
zUQOqUQ%a?!Wu;B}q)<v_CD@<2xuxQOrCHiqU;2t9Iv8oC4*?fB=EDeHSUJ|f3-utM
zi9v|QpmXG449oZp#;^?W(GAkDjQ&7~lj9HFa1Vd@jLX3fI+`?&v#0t(3)gt0OOvD@
zidbQ~nwiC^rRk|=ieH;5s<(t#tW~N%=%J|^|3{|^kWW~ms^n5fW<vV#1#Q(d;rU#Q
z@eZ=k4dftVtMU$!l&HW^5AP5k^FV-w(W}2IV!R*=*kBEz*Bp;(7`$K&rRNXtNovqR
z4z6&gmr695%BtmRuIGxb>8h^lDo3$8N%H_=(^Wp-09=I%F#G@vce)ru>Tx0l48}kX
z)9Mc|+6@IK5244eGrFUaq_EOqt%bo0%OHUR>wf$~81s;r1t+fa$*vviu^$VvAuF=y
z=B|X)g)oIfzlEX#Go#aa7_tx_@*raIS$az*55~ZlgmJJ%6SL1+o;2#Hkg99<z$))B
zUHMuV8!Is6I<igcv`-7QQEQncn?}hf{{=2<IdZ^}0rL*Dz>SUp4CJ5>w;*E6Kqc`}
zbN=uRCAG7J5w>INv;8_94@(%4%Cn*u4!gQSji|H%!?aQhxPdFUgG;zOxuzkN2T0&W
zI5ZD<MXj&$4Hh>U>HwpW>ks`9U9_MXHJO;rB@eDZ3#~-Cz8bd;8y$4JqtPjy1FJ~9
z5GAtEdBC8t`U)_ATe!E2ySb~o=SsCHf}@?W44K!WIAjcBD3`Ay4Z!fbkg<2%iCp5d
z9*@co)2kRRX&Cq5PSe{BwEHi%ySv{DzTqpr;n=$;@(y319BkEwCTnD{QVjAM9i3MU
z@Ub443k>&58RB!l_UgCvIlli3|G)t(z(H5OCGrkwpapr*sGo5QNT8CF#1HD*Dt)zR
z*D;4I86Dm`z#GiL9lW~*Tq1tp3doTUcm=d*l#EDF!JQ!si`yLYP^lPvI2!E1HEhE-
zJhC7hB3iIyuJCZ7;R)><OJS%5MS2;=a0O%F!pflzp)12P?7uiH#Zyeh?5e{bB61by
z38?VHo*@rRFmmdYxOJtsmT?8@ARXP%o=*(LRqV!Z498S@#UFA7UjPh{Pz=&Q#-0(U
z21rSFl~?2dzmf3{`L{xr;8xx_8p}`&{lLa;9LJF?$&*aJhf6Q0zzfE(zTGH>SgS?K
z#RP$%qmuy)X>bqZfC~2@{|A!f50G$apn<O{_sB>Z#guHzw~WgqYss)e4uQZ3p8Oa^
z#+T~E4_&CZm(dMO;07e}4sPI1w5n1RILnno!?|qD*KEskTq0;38kTUpvNR7x23%v1
zww1v}^B@P`49%P&4_-UX)LhHhEYI^y$=WO*gb-_mp$<s!wVaWyF{KWP%LKs87<n)T
zX|N2CK)F(|$(I4F3;fPY8_)Di(G@+#_S_!$j2QjQ8T0VC?_>;V;C`R6#FsIx%Nx<K
zQq304(k&gn7(E)IoCnJw2PDEmc@PLSL=Jx728=Kdga8SiAP2%l3xTl5iX_y0XbgG4
z2;2-AiMUtaJRkU*|I+a6(pQbu01VTjfdp=F1y_&;q|gmguwzIt5AfPOo*)l|5LdsI
z50Q%mT*TH2hXndy4Pyui>+BfTz{*v<9PMnxe$BC24ZvmK01i+Fwj>CLO$D1Y0S*8G
z+dxN;JpqLMzgry|NI(uUR%wAyTxN|53|AP0K&#C4Tyaepq)iyim1?LE#1NerL@U^f
z;nAP5DzlBL6K&bMO9cP`06kz!W#HQ;ut@>{00NNMa`XwtEdaYMzL*UflP3q(P-$bJ
zIP+lEoUqOs?GI9b#)Bu<vF6==kOqO5%90_uxP2JQfWDvchw3fS&Mm&Z{oBE9+{CR(
z#ti_KEk_*S|J%(i-`@+}pCR4UZ3(P453i;U)hJ^5zz^K*-KQPigyG$;P{b>gqK(lF
zE6kF`FmWx$2_^LnE#~2F&|>l+3tA8k;h@tirZ1iVY0@AEezh3H3g6wU+W}s<^bOpb
zR0j85-2crCakLHk4d6PSy94eS1zu^=fLESy1tcd0Q%(+yAl~0ChAL#`6pqGzfPZ5!
zyp53$C+uALzyzp}NG|rufdC0+j^@JU317ejX^;lppofeg3rwI7X#mzQ^@WR3MjU<P
zrLxjU{<J)9-vEH$bY$eoEeJ+#=t;iI>~WWsewU<N&I$<DdUXXbD+Nlk>4m}G5Q_vc
zbOoi1{|cNS2hu=skHIgnJ?K?Z=#f6Mi0<P+p5Mm}01gmG6X4s&P3yO-<eXvY#cq<5
z(YG9S50+5J{^DptO=`^k1^zPXgy9NTVBX!32GYO@oWSaYd<%{o>#Z{D!49&vu1P<x
z=t2J9y^sz14eaJVxWhg)?}5Sckhl6E1>?gHc-1)g{#^S$uu@P%r_2PBlxy4G?cW|5
zt2gfCp5yX<=)T?K>5l7+{_DT};{)*D5-+&)J~W=klHH&MiIxUjWNCy!@+Qwka$trc
zh6?zn1;*e8*1!p#!0?fQs1J`N<?iw8itcoz?u$N0#w`KHod6C100xi%@&5Bs3-SUZ
z|Hv$9?8Z(RLCW)1;`2|Bu0cOXLm%WB00GBs+%(YiN6z(58}$K$x*S&Z#ZDRTk?C2F
zB3qyK<?8iv1opX}0qTC-uyFQw|Fml#FvcM0NG1)3-yAZF(sVB$b}#s)n)h+E_ZXi6
zMef@SAP#{a`8ho4>ZA^X?D(4jy`z63kl*=PI{D&I`9%)^86XZBVBC$(`Kb@GgdZ@Y
zZ2FvGw!2><sBilPO5YG*0>xka$*t}VVEo4~4#o}p+W`G>RQti-vA7Q~%Rtb+-x$D<
zx7vRnz)$_LN#7ao+Y&(e@SgF!?);iG{o${!*8eZV>iwO8h*CZO>;eAn-<iEF{{a2(
z{{R7Cf;e$y00=;sPyhsR1^{p%7*QMpgc2=Y#F$azMvfglegqj(<VcbwO@iF8!QV=j
zEnU8Z8B^v=nl)|StSO5hPM$q|{sbCS=+Kz=Xz3%GROwQtO`ZNsc~a_Bs#UFC#hO*?
zR<2#Wegzx$V#=pw%?6c5?(AB&ZQYXN<yP)ox^-hl6`NP@UcP<({skOZuvW5m4L6ks
z?C@g7cC8s}tj=0v%9Us09h_P7X3m{Ge+GTEuw~LVkCsNA`e(6ji|5?}Hd*!Tx|l=X
z#+_UDZr;5;j;1}^+PC1vjr;3&>)qm8NRK~%YTNg8>ea1Z$9@tx^vd_*|8fW4oz^|W
z{Ah(oKU8{l_U+xjhp%~i`op*K(Z^5s-K~Ch<w4d*o^F;~Nu6%U%P&EH){Cz}2Ooqm
zLX=ce(6DY=t1!c-x+%u4dt@<2AGK~_i5z|u(=a^-C1kNh7hj}qz7*HGhr}6gB+3|T
z)N!sZewLAKC34ilk-HUPL^4Swm*h*vBA?;~!6&E0i5KM#OOB;?Fr?DBBbfv<Ofkn4
z$;mF2`X<OT*L0~HSzJ+bu42A{Y#DxJS*AlaXZw;&KmP=jNi+8hN}u!Ql7>J+8`H-c
zJs0D0QPuhkv{Fkig>O(veF8=vxyW(F7$P@Kai^I~4GL9K&!QAl|5smyH8)LHy@?!Y
z<kH7RTIu7*)0S>gXC`2A>eZ!TcP*>cSeIo?omE&=ZMcSqX&7SY5Md~3q#GH!1P1{L
zL5D^xIt3RwG^4b12&jN`D=mm11CoONgp>*n-LTo$KG{d><U3r~TG#iy&wJmE)*UW7
z`{vfaZo6hN+@+HIKEHC5Bw%5GoPO<z9hK#5Nvf~Bo$nNLqNaC<wC-p_#rn#}Cq5ta
zUMc>UW|ZfgzU9N^^^<;rJ9K<OApc}LZRN)E?m*Y9;PgO(J%K&F)IOraTK82jtx3Q_
z!qxr$`@os$YOcrP^1(HqnJ6WfET!<q<@ABV=DE^=!akelINSBSkjFQSxUHj8b+oMk
zO1<>p?ggE6hqxmvu6xhqR?;2F_21m@2k$97cpea&!J1Z_*ZTXNr8LL7t_HuWP0{sP
zyi41^Pr=0(uVV97uUPw}q1>KF=FL{7SxR5y^g7(>XIuRA_>Ecb=Y?jjfzW+lfk3CM
z{(OI0aTlcl>zAhsUl{#;1Zq%(_2u^agdY<hVjDlDJ^68a)$RG;dU)nnYxOU$?w*aZ
zuBJs_4S7A5*s_}abhD*>x67GwlKas!`PuwmQuhrG({^85?s0{=e%_lN(R)5L6Z>gp
zyLIzT-f6?{mMHGfCvW->n_mp-JsGQc@^h!?py93urTuxiUG?$m%dyds&_h(d`W?ZJ
zw9M-vtiAK`lX|kkrXIRqh_Jj<3K8oH8qaznEDWG1`XqOqlVrw)(paYAcv;Nd?$OsF
z=|s)+mKfD`fhug^Rn(xek&MvOc6cVg)-{%JOK5TpGn#O~5W1@;eCLq?a~6_`@7iem
z{fe&)O>4=|v`vM+G)G<FZ|gp4>5jz)_HUG|)ky`td4lhC<VstsQeG^%qGgoEaerGc
zqg_hqOAOO!^|ao1AJgRINGF%xfnHs4E&CtYnNohd^+|;{oyD#!NGF(nP-%!vX?puh
z;J?E6+3Y<p^K7%)ogBDcN{yw*dphy^witc5ITqnIZbLY<SIJvn(wYn)h#uP0G#fwU
z%1P;;I`toNI$vYy;&+s`E}~tw;*%I+O2as7(sunA%ki=9f+uwu`8Ar!^iOwEeYIxP
zta8fCMd@9rS1ialmzsnhujTi*FL#7gX=k063trY|U-rH+aSP&Iycs9;Ht>#*xaM@H
z=v<3w()Kd*6?C|c^Gnk0mnPypw%4M2)9GA}D@xQ=)-@R2abp(mvqj|iZ&Ih3z1a5=
zV$0Rii&7r18nTB(k=Km|7CvV1;y6x)qOTC#hR)|43*mfgX2o%-uUmh;MMez~&@pB?
zB;hx%#)cyDcvw;6M5Xy?7yNeEou_s(4~#1jR6P_LITBwDYuT@fUrVvH{@cI>uY2ch
z%M(9I=5ue&7P$q`tGC`^5&S!irTW=w{WZEb!|~S}V;}hxQc}90u62pCg$iRrZA0Dr
zs7mdG3&ZG%#kHV@zQ;E+U(EP^nrzB3rj+qg;bWwoYId^v^E7RCvUzN>nImY}J28HS
z2I|`~<?G6SyPJ01eSib_D`DfG9j=d`YHvMVgGXNZN&TZc;jhj^p4$#Tb|w$vb<;$j
z$uQ}iRo(e`g%qZ{p)!x+;;TB^cp8Py!hhM6ue*bm3=??P<Y>hs@Y~rV$}P*jwRWk4
zE~!^kTh)OfW4c#R*E7zd-GQZPy6<|lXM(e;BgfSACxuU*NxtolTnE$rib>l1E5vY=
zN=6SA@9GPcoA88t)1Pled!@csbr!Ll8MOT5mELga2=l)T*5TfneX1_f88bt!y56tM
zYQY!M9+sb(U#(@U<WOBhb$#{!<ej(IzN%6diFgk8DS)ZDag{`l5OjTtj{dr8D%g;s
z@A#Am<htsrd><p``IOSzJup(?`1T6!o3B7xH+il+Ud9rRke{cxLJT5F>c=8+A?_A+
z-zUPO_ux*s52T5O=s#)RQGOhc9NPE=hA(5Lv=5J5WUjE}Ta3V8sXcbrQV|j^^lQv`
z{5T(fclN&(d6T5GjYsO)$=>z|FEikgm+0&q&ugPrnJ=4u`Aa|gO4F>j?Ed;(!kfQ*
zJg{#+`}a6MSOOv#P}?({;wh*)v!c7&ewE9kZD97ljnaVj3FCiHU7!8;^3~tl0WWOG
zYZqEc+<J+9N+wT|r(7U@9*0U)k3Cv2stc%ogAU6iPpyZxix*E?My^+F6nxQH7W=0(
zXb|<i1i(40k0K<WXz0Bzd$zPEacs*;?HxYCIW4go)a`n2>m5XGUGqPshPtH9+IMGv
z2}(gN|J~cu`H?O(F?h>n?M8MpW5_09=D6d-$IMQDwdUyc;QoszyNzG2mZTe~cCy~u
z&sPZE2>y55Gs1y}mtEiR*P5=Ic#7onH9pSX(K$e}BXd9{cspA7v<WeiIh_)`AM><*
zmV4xQt}XO{`0s3a^vTiG`;SJWSE(d_Yj80Z3UO}-AOZ|zDuV|iUPC!vY%TmeA+U1q
zUkFpGG(5c(Ol}H3ZGL}RAN61Qr2oZ1iNWbH;op;g51$+UcXd!YAgqw5L7SrkMLSJS
z^#Hx%esSYOC4MrcqqSVkMMZr(SZPK@b<j;c_?`MEBlUxbrtz3ISdKcKb|<^%dmE}a
z@duO>5W269v0{{6tuY-aX#4iVM#Q58xUD?L+{eqD>Y%vu6GVe`u9@4ZEs(LBrGls!
z^tP}$MRg`Oa4l;=DM{8o&p&{m<jKv~+ZivaS(&2Y+|$MJxBE&C_Hajo?G!8XOHFVV
z`%$Y3byrKwmN68Gu<?jG08<^lhz|x~OAq1S!h4|9nzH=u5~rGjZk?JpwZxfvc`j_5
z#G&0f+Ui`VJu)qX@|OaG^MqhhukkN!lV4E|(>(?ybb;PlYe-dXS#3>DEm~@A12LN0
zk=j2~%2xH8teJE)4cNyqg82Eqd%J!2o}~!2P@3$<UKRpJ+jI&reG0O)h_>qY#ffIN
zIun47Wqqra6SYDF?c<xDl;g^O7!;Q((hnBJ+Dk`!^IuMKqQABv@aT#HYq-rkECfgJ
zZjXZe{ghv>v+JSjMosIQqbuL5i>dE>COfcts9WJq<;2e_w+Qnh^)5-hAe?4RmcN!&
z(l4FYB~Ob#7fTAA)0Gy|Uz#3Bkp0|(Ep@Kutnzvt-@;Xsg}`_wmDa|WUJP<I*3jSG
zLf90Pr*#gb%rzxJlV3syixSdtE!RvJO4s61S_Y{lM`(x!{i|Ji!Y|c^^8SKY6fQO;
zUv}_4^h@=wu=N1K)H5&oWkIkT_tw@mFC^hzkzs4Kfwp^M6-SQNLi!4x@;%d+kGo$w
zN(vs>bFES;J;%}Z)90(QGhDen&{u7svz3$<lQ}@i@DV!nrFUqkgt?2l;0f~GgPF2W
zNw~r#2&P8R^Q93Xm9^|aj)%~P%{Monwd;sG#Noz=T1kYtT`iB##?h&%KTl(S&JEAX
z(th>f>ZiKIWYd3QxN;fn*npyQkzzAqsO%CROI&>O0_@&&Y{x<$*G0`xLS*E1V)%D$
zu*%Iu$OG!Ywa=dJBP}sS=iVdVyeJ<kR@9<7R;_7QJ@e8s3IC3BSJ-JsJh_BKXdWV2
zFY9vd>`70{3D4$l@lqlldJKb)s**kPP&{9+u$zoEGoFlQg_gfg-eL*Oe3Q~n*mjCL
zQKeM}x_j^=O97^31BA=+8P!?dvjO9Xn&>%g9F#YCE3gnU!T#Hv%6EXXVSJc=(4-*%
zv1r8~QawszR~bsy$)DE2V?Pw#9A%7z-a5SMg@Nf-Lqkc3TNs2s61r9seHR(2Tmv=2
zm&=EI+pK}=W24F>UtxjBuq|l1;w!Zcvym5&x}&RjOl0u|k#H9adlME}i_Uz4dFc=6
z2M68eWq(P_z~;5a$@pT#!N=(S!i%sP!3QLS+2`?s7DP;m<~1EOz4cAALUS){Tu>+c
zMEC=bMw&(CILLa!h*OtSATND@o97K8R9`cL?RF!MV8Q$%mx$<-Vh$}B=O03N;Sgfd
zV<p(z>CFWFqfuvvu?*sE5jjiRKeu^W!X2<ts^lEedFVrIxU^=tEC?=6MBHiy>(0aY
z3nrbh;B=B@=-!lbb2!6sco`O^gd{j4)1}skfkbeK)pWE4;TbtXR6j!X(CnT*<N*e1
zehB9Wp#0<rDbQpg4)JJuoIZ%>Q8QiNDB<MdbmFnY%y|m@5s~mz-}+T&v`ZAP(*`_{
zWQ|OVe&Rvu;;|Sph_BB~cx7P$+em&APza$X!gZ($dDtJul$O2D2$IC*2XI`Z5CZWx
z?#G(KX!@M(P!IG|7Kn(#Fz!e5rZL(i-8Trvzj-ZdlLa-=ftiRBK+~Lq)<Ss7TgUdy
z(DFGZO17GTpM)^MN2X;?1!KXB)pWPW5oyHmuL}ggj&gW;E|3`Uz?2Z_ONDO+n=6jX
zk`d-avk7OrbPv;XB1Cf@W<rd3$_9B(1p6YP_7+r$v7_4S*~_@ubhimkarOqx&x4X!
z-BC_PDT|ReBzC)dhH3X^tnPJO*s;w7a7i1M1ZCahiM>06M6jrd+Z(6)ubI~iyu6qj
zBWT<z4S4GT+%Vir;|dwuES!9ji3kL`AAe}$*D3WMKzQ!mkI2FaE6w#r;n!_!^~n(%
zH#0Q_iU%!5Nom=lWLwf6;?^2I)&lhiYgg6@*TjRFj=~*CU|xd-=6jUt1;y8^BR9s!
zuw;ZdnJ{mszuCa^K<IAW-iW$a(sJ6p5zn978<gE!grGGzEdADB0ir(<@l6Z!*_^38
z?Iy432*+baLZLa&gFE9(<N0iN(*sNc%kw_!BvrruuQ4;h14$Hbxg~TQeYT7kq_73?
z<I{|9dpJ|djn0l`k0CE~oxa%2Ip{~^Ru?MvS@BEG($Fr@%d??b7ShOgrDj;*VK}2p
z990@j$%^tG9_$~&Ho@ck9Eg0-LZ=@vPJax)x?<1$gvxA~wc+q?BTsP}z$Sjj(Q&M8
zA=Wg1ZInI;;rW;es^lX6W>M77c+-N(X?t?g>UGa;d^+a7^h=tDLVPlf#@YHy|GLtj
zaB=VLE+5;)DOD{=rT>&_WDd<lP_MsGXQ5I!pUmD$Ws^&L=8~;t@(VB#`7!}k+CvzT
zz~aP+XGnxNG5qdf_-f&=oBIg5k51y5EOGmIM`C!yhF#fw<aPZBDRNdQG5ibV`iuRn
zC(Yqf9uVo55!WwBVExNq<);1Ght(VlM1x!EzwK1@B35fVoG)oz;K|Q?^gLN(^55;$
zwORVlz3QSYFU0maPZ{SEj?^O!<6q~Js?Un4EO5+^xEysH_xs%S&LtWK2*qjR>G;|C
zz)aB5gN3bBU4v9^nuij?TyqAuEAkR_r5v8?r=UFX0LxmBuBh!^`s?P!8ja<$HO#|9
zx2GYoYWx~YRyL&rD_7Y6WUUc|LSo4w8MdlvV#h4cb^nex3i0DNCjB<1qBo|~H)ft}
zloo8vetJBmo2YvPr(ve5fN##TY%W~eT$JBjlGrRboJ4i4d$tlE%V&tU5IwF{u0DA(
z@#)F6!HtcJl_%4U8=LTd-%V&jFiQE@%^lr;yLbL2eBRvm`*#ri?=bz}QR%<q#(yWD
z{+&+#J6rj8zW?t6P6n}(DFn%21u{gB47DV~T*+{MGJ-%xW{@e%$W%>aR6m(|icGUg
zrad6jA-2%0Tl9ik3<_I}dRt7ETg<LoEdE=pge|s=E%vf4j;5_E{ac(<TUS@NxDK|s
z5!)EnZ63jGUWIKwy={KWZ2{NqYyR7Ugl(aWZQ-(Qk*4iSIi=Xtw)pC{#KHD;#EvBE
zj+Eezw8D;z-j1y0j-2a`y#I~@VMj4zN2zQ_xoJnGe@As{M{RZI#=(v{Vi(K0t0B0n
zd7-eYrMIhXxvS&4tLwk3N7&WR*fl8IHEh~7>fgONwQIb(YjUuA3$ce|-7^*3yREQi
zrnhHqxo6?JcgKIvlCWo$v1eVjXVbKIw|~!eYR_(U@7}@QeZ)SVb>Cia-$7yDQE%VL
za^Kl?-^G95m9X!YvHzfK-@R%7VgLT4sr|>R`%ez`pCS%CSPwh}54;o(y!8%zEDwBL
z5B&TO{0RpE83%!72SH5-!Tkr%rVc_@4?+(Po+Azc*27C;K)AwTgx+DK<zbZTVYL4t
zfp8d;aTr^67}s<d-+!1eb(pw%m~?QMj5s2)9=#AedZ}=fqIZ;Pd6edQl<t3&aYi`G
z%s9#_J9^c0l-+-nGj)`^dX#r?l#e(rU_CArJT6i=F4j9Pu{?h5dR*#%Tt+x9&p3Wl
zcKo*K_+9^T#nf@->T%V<@q5HcHS0-@;7P5*NuAzFz2!-R>q(>kNfY6uIpd_I?4-5n
zq^<v?ed^@H>dD80lMcjbC+lgK;AywQX^-A%ujOf<>**)|(|*F~K*s6kveUt)(=Yv}
zLsO^2tEXQNPDc=DB-XQ0!Lu=ivu}E5<CbR=u4j|}XH$g#x8mP_HaB(lWA*Ik!P$R^
z^Lf_u1;O)0h4Ur7^Iw+d%dY1u{^zTN^R<lg^|JHd9en@@#B&6t<ON-T#4aZdAQ+Sc
zCR{#|2n00>MN5aKr=w*+(=jtLu(L2<VPoaG!okDEsmYBH;N=z;;1d@SlD#gbEGMn5
zEU%@etfsE*sD8~r>&8u8jZ|IwOg*%|k*T?{{`K3*I5X?JX2!BsFZ``_`fTW(ZSSbq
zrPkkPsl;FD$8+3wbbst<H{i&n<MgW1nP1-}=d%kh@W5*D!L?R*8RLh!evh1o9*Ye>
zl??WDANG{F<5d{vCG^}|u+~S~+OK@XPub4@wRZpz5#TWrs8$f95dKWwA>`d?h}K4^
z%)RF_@z4Fg0ea@)au355{lZngMclNERBVkjdKRTYh|)}ndbSy*W)rRA5nUM;ojgvs
z{UoO0UaW>sZ1qI!9s78l*m%RN`0$_vqkjqd&PfK-Nq6&zglXda2QQ4Dy=Y2I$xBbM
zdYfW9lj8I^^>$2}RdHH8In8n`-NhrrGCHH_d&Yy=tVh1D?nb@p%FlLg&-RVaY2C_k
ze39!Moab1X=RTL`U6r3YpYQ#%z%R7WwW#p%cG1J|l1I5E)&G?|Bb0ikmG+L7hVGPl
zy)O%xF9TkccQ%*j#=Y_R`6hhfO+-^gcyeX%tIFYzRYi+caYgU@cHaYOHQ^&QX}@X`
z%WI?B>f(Cq$};Ptm+Mn18b9wf#^*N0FE?ebH>IsNr+2lct+eJ0x4kcJPpN4i8~>2^
z=R@w=$HM)O8E-l=-*<d(?IQi|di}0DXS}=NeQ)9K-go<b#kHSGW<Iqn^jDGw-u)SP
z-|)G-=kxfF!S=s{b*)2{yF=9r!<~a)r#8Q~d>E<e9Bt?uT^$;oTORHCH~Qh|TWjBV
z>zDDRvGLiz<2}3MAGRiY2Btn9Pjzii_y3t0Jf7(r`rb1-*FQTqzdbiJ{^RfQk1u0C
z2Y3G)otXc+w=h1nNcz6Cv%WMj`)ho4dF5nza&2X0e`WS`W#;GV%)#2v<@K$N^`EEf
zKNf%gIQYGA^ml1xV`2T@^3lJw-{jRZ^6JL+@00DnTf3V(`&*~`+xtg*r$_r27Z?Bg
z@?TB_C^_}33%VkZj3TxJ)rCC-G@oIPeoawdJe!RB+(1one=<fZj?<vF<a3IU*<0Js
zwXeTqNIDMY7}S*xXDfRDp8H%^Hj<Bxpt@>UUp`u_pCV#6SpVi*8Lrqc*RbL3#5=1x
z_aB1|@21}4d*ZGdHCD{jxqW+U_ocCNw#j2@FxRN5>PK6^&hH;zn%@7{0YFe(H=C;$
zdSVzw?+rEAEcFxljPh=_)GmL?lzI4bsHJXoq(Cd4%eb|E{ad-&yL-c}4S%Mp9lu<b
zuNyaJo4x=19Bym+_g`lOirb{Ud24APMfCpH_LiMhQn69K$%odxKht#&FCi3d2mj`K
z;xD*weQZD4S^M_x{>aA<CkJh#XRmH`d^|hZUHJ3gNJoh<8Uz=b2cT5V+Ru^K$}u`_
zOl$KIpig!4kxX|KaV%&T#ezr{zqP_pHt;|<9e=vM1M{`>`EEMtN0%U0$x_y$Xbvy7
zr9{Ob1xFge(zPWz3+RkPq!P=6U%o1v1;1XZjL(-)OIMQ%67}vpSoV^USonpOtFB%~
zTRVk)qBXnsU?r<>Sf4M_yl8zTyE&}JC0d}Kay2)gwRD&kw{Hzb3SrqXsX_owGe6{0
z7g}*XmC0C^?E&NP4c<{k<6?N_PQ371D$~g8z-W=Tn(E`^c&t}94^dwF6f=4Q<bEM@
zTNSkLZAybd^W7H1P}}1;!RMHF`gs6RM{~D#;dA*=(NWJEa3x<vV#g5Ky@GF{t~ab{
zrS;)^*clkZ=BaPpqu<9BPt3`Z{Zp0Z=KvK&_OLh^az<iB&^H?X7FJY_;xrR@BMW+{
z1jqplde>4nwG7&5v%z2aJh6Z1RGFqUsRj0EBSl4->ZH*f=Rpqd)YnwQKXJ98eV%@l
z=+`i)`N*J+Y(78j4yQhx*NPSXj$TB_N%e@4ZcurPq2*Gs!5+oyR3!<6aXxRUtBhj)
zCd;P^#V2ETaovVuo@>XOGpEkogUZx_+elfu;n^Cj5z;LVtByoQt0yBb%7@X>aH}Zw
z`fw7RD(IZDV1TSIJYNf25W#Q+{4s7`1Zm#$2mDX!0s%R?UQwhRx@ZVHk4A2+V&)P@
zh@el4bOIRM=B=L%hm3L?6tzGycfrZd{eOu;d>9@#!3(ae60IckJZ1nJtL4RNjw%>D
zC3N2yKb3?kU(|Fe0I8~rbn|inJt_+gytJB}YvaaB)zU&{V#u$-H;-l7AAUPKSje_}
zzi1lIgZUREG{9A`Uq}tg3TG3i`hn$O!m#E@_<p*r`@?CT4l3ditdK$>b-V(m_)hEJ
zDwD4M7NhCGB*L)<vgK?KqXpH7J^d)nh3v$}nh5_RtiK5dE|Re5Mq?ay)m?uN307U-
z8{s~T>Eq&8_(-CtvfG^1TcAZ?8krw@05bXNHuYkfV!|BFukzH-`D=wt=&@I!S9?xJ
zwGDUQTN%tjzEUyJsO!^0w>t5~9LVsH@tWs=StM3cM@7n9!ryeKe_TF8#gCE>Dlo(j
z>=*U~P;8|ve7+0dFokyWaj;Ny3>xOt7$xS3=>$`tTt0`p7WBY??{kNb{BNLR61cMG
z99YhHsL<3BPu=;y)e0fQZRX#4k6fm`3yLb!Eh6dl70&;;>#9(GrKNTG1_#{3G$<#~
z#Oab{8ILq|ip^ner|=Rg%a%w@3kK-M?-gDO=mp)?@a_C%Q%1zumL7V5mKN*~CWzWL
z46_}vpncbOgNY&>63Yl}<3!GTA%--mQeIuK&kaXcC&x<|UD=IARPEns4zuui=wYt=
zt@8yXC~T?lJZ9}iKvekqiQ#PDcU@Bw$0+K!M**IZLIV78g^q>AQ1t@68ru3~_0KXW
z)~J5A>~%UN<76U3ksal!eR~afw_={6pNPZM{-GRr@dwX^B$jD|3NhK=I}t#mPHSjn
zGFq!!?>}<^V&ZXevCSiH{lxWTH+~812EP!{%B0pY$WRUHMu<{3Ae25Aa0gYo;WX|F
zG3kHJUIdeD4#K+bQRtf%E<dC>eqqCYG5^x5mo4L0m5rie#r6}LmlPcPVec69p9DGU
zyz}}HL2D?~edUA+ZNKy)R<VAF=S&Daia{3e$hvd$IPf4tM-_CK)87>uS1eEo5--ZX
zFv$r~aQvQB3ZHkUd;T)4q7#ML%A=|i7zqE^JS%!r7?L3XN>@1RqO$dCGGj|kk?L5X
z0|#4T@(#@?J3D!(wk`64iz8E=Fxqo(_p9HDg>jg<PA<0|Du-HyQ~OCm6?1-j@9pSa
zvnuD8{YA^STfn3dv`=qZppn>IJFQW#>_o-N&n3vGPo(K~ikj~sj7AluAf%VW%>$k8
z-iXQF-&&6Ua5(fmOsf!C9~ppixS+&?2nv&`mtGKK!KB2z)Sy8|>Y}3&i@0SV9Z<bo
z*`vavd#;lx5JRv53-zsDI=?$nD*y3w&4TMoz3UAroG&-WJ#v6(9LhcBdll+O{aee*
zR1?SmYzyriW{5*kCQDCLd~K)-1H)MlzfZ{s%|-0v;~srwm})a=tPSRUgxIj3Atmjb
zzOpNDH9Gk|?IJJLIK1(Mu_tDRwyC+_c+)HUWNyu*sdZ|2(`8R<fO!VdPQ$S5H+!YP
z4Y#dRR3Z`A+0{;am0fo<JSphmuOBQ~{wB-A<Ooa-FZI*I4}x52b3uzf9B*_w1bLr^
z13-6>8cLMO66WFRgoIqkA*I${p*_zOlOR+w8Yx2bO;q|TOd~C(?WRp?)waAHF%XX4
za?fxft+jz!1P{{qjTPFlzi3U5Q^c=+`~l>u8iYcT1i+u6i&>7YMRGKZC2M7ACQnWx
z<IzQ$QI}q)HL|v`^E_n=d#?dg?8)4pCmy*cxk5%wNKq?d>`nffHSp*RpLSQ5qSykf
z5zd?wS1mnw2Bvlx$G=ZUqdrVxnIcQ=A~c87-VV;Qo=EC!V%UE3WG15hjbE#m^F%X<
zg}GTMqE($pRSiAGR08_d>bq7d&pWx&VpnfR+`B={STU#efBi0n+$FHarJi;|q+lEP
zr5~ZlU2TM?xKMWBi2xbtUkPNK{BP<hBZLZi)fN$vvJ?iF#Gh^!x&2)@QHxxEGr=u}
z5&e$2;VG&3)59(jqYK{hJOP8tQe@o<XavR`Y(^D8FJU&mY7$ta1m;GPjzp!5?pU1+
z*+)VyQuU!8QUFio8$ml|25BINb$ThNXi<uHKSK?OYyJwr;BUxbAigOo($mU2FDZfI
z>s<Zfo!byMoS!--C{HT@*Bxpu#JJQT(ozS#zUnwnG@yR%dyY4xop`#-YoH3z{~JL!
zcpFW*=7~}8$n$W@Dxm4t471sy4kq!gda12wsf>VB4{Nm+W!0=K!-Zrln|d_P&?pZQ
zFY%&C69|yO&s%-dQc+x^yABim2o_!CRhnanRe@e!y19>|V-2mM7jMIoC5`e9kbx1x
z7Hsh%VTuiC6lq)8>KY{Xwjjb3QURjnpVm0rhvWgYX3fxzmz0RwX!&B`d>*Ww;>&i8
z;M1&YOHZQ$QVP_fdzPs=C>a!7jmRTYt2N7M_Xs*g#XJ-g)I@-j1H|Tql4$D1<a}eZ
z)}DP5ux{R_K1V0#fkab#L|?Bx>(r#nsD~~zU!oHsl(EjWhs0|d*YJ4JlldTMVLT|t
zd!f#nR=}v15hVbClRGs=JHh@i;UPt|LJwF_i&AJF9E|pAg&^q668!?0&o1V{LRe%_
zuf`M~gd7F-tVa}eg1;<+v6KR5=t!FIa84$HQJg}Vqiu(Wn)ZX#bF@$%Ai6&w9#|}m
zAsU)!(g{>Uw5(Gvkl?qx#Gn3g_q9ZmSHY<}5gn3Hl>!fRRt68nQwuWc5M-Ad4j-(h
zbBRSOBK%Vws0t$<QTJuqQ3R$4h)!u;lg6l=VC;>s!oCK|t=p*Q;XHAXUfpIwzI9@3
zUKyDN!VM%|jp=kS1szGo7V4Z{??{!=V!2(Ke%_f5(;!kSsyu&rgZbK}IZ!1iFh`(E
z)Xqymlbz<5mmLESM5`Jqfq(F9)bpyaDQwGwuLnn2=m8f-&s_w{dVcetjm==9cOk^)
z{AFht1$nSuVi5w^ro3Y}0`n7V^76WD)?)L|kMcnr1z_cZ%jWcuG=?)0N5McdTq;tr
zBMf%9Q5|7g%&3ydhH-SgGTlO-^q_$2HyY_q+vtKL6)3EL)Ii|Ns0ti{r)6}fm1D+a
z;c4N#97nqJr6k@-1A1wEeu!tW;1>1O<HFArm=%u_{Z}Q1ttB_VmzV^VWX;pI9kH|c
zKWDf!KPl5|8M0agF(m7iOxc&*QZ99}Db=G=WPio3iU8lRq_?8-4+h}cT8gP4xCcfw
z4lQeerujZk*+GP@EYX+|ghP(Y93ttm@MYd2tPd}~mvZV+TA;($h<=<)k}pI=rOXp-
z8t9UVuy+W*4vZiE6{m~M+tRlsA=n$a^Z_herAh*jNE}K4^HhZh>!`kTQbBmL<nme|
zHF%9(GD;5c{BZnkkVN;b1*KIW=iT*|X$z@^rD-Dx$zfE;IB+;~<+r!upBkWVpzucJ
ziXuyuMVYssG$_U0X}hYcx;#q07toa1yd`y3k%LO!xZ`pbLMxTU7I~?Zj(wNkMnUD&
zI)K|$%XHTG94%}GBD=a52W|wzheTM9sh;mOId>5K;8I@6cx`f@LR@#v{QhetIZH7i
zKYGQm6?abE-&R`WT0JT_9{t|nH>Jr12jY4>SU$caq#B>$83kUTVKlf@h5I_Y-0$h8
z!aks4&_Xswyn|X?ClW+#>Z)V=#TnWhqvUElDeAuyqpnZM-B3Xf0zA29SrQ<-mrjj7
z5b-~N`pq^eZ!3c6T~2Wn*zmYYHojz6x>T>a&fqt#5wSE?Bfjwv)oJ!r8cSD73i+TY
zc56at4U5(Em8o5Ns}#{-VN~(z1f}{-!S;kDIyjz93H>|;?d=}P7A^DUu8baB$8lVD
z9+%>Cx2eaoNq>+=+K5VTkj4Q`Z4H8-N5DI;AbNsJ-py0ap{a+NsK@cN??7-pG{WGx
z$%vyk(wChfP#Ud*Zfla0z3}%x5>iz$gNy)lPTjuWB3jI5EvW8-BffpaqfrCyVmX$q
zv)N`W2I#VQbl_ox`W-*@{SGw|xiE+H3WvLS*tSWxw(hVt{Z^_M{w3pRH4+CxKm-z3
z&_x2k`*H9JVyL<#L4b^`ku27C|6oL=cK18$9e4E3<cIgxn)9Fsv^CDh?DRHKbZ10I
zo2~9Gd34B8hESb|qYB!bx8jzrGjz0@HsOlkBif|bC1!eEaA(>$5L|!*wSsoMdfKJ;
zy-BZ?x4580q@pBgfOW6&6O`Wht5XhY^urm3N4lD>x1dJ+MX@yoLbhglq>6q%r!mn=
zKlm9uWNmMR1BYIa@}XNOvB=0<Ial?R`wVRQR&ZT<ulnwb71`K=^#*<IPurR15cj%i
zgsGeLI8d7aE%6cSJTXfEL>q^JTL^rq=lqiF@#QD+%TBiuqRXveiRQbcVkrRkkj$4D
zr3>_BdT;xs?(a~Os#NRH7trFDD_eOC8g$kipT{V=^xZ#aCiL0-?P>tP#ho;}(o_xJ
zC1Ra@<7k?VK^mcIs<NDt_HOYY`+g>R)X5)oDyToSaD=gIq;i~IX=r$PVOWn!Ostb;
z(WfN2pbrQ))Z;LB0N{GR5&k;uxJ9rQ?gOBrT=|Uk5En;VQ%>he@-rP{3L8TvUh_W@
z8pW1gy?8Wep#05nkVf$_?RWgQf1EU0)pfi-SpQUemYR-V54odjNMo|dFT2qdELvo2
zJhI}U#+N&8HOy&59^GpFW|~-1g9(04uWnvbNW0K`U1QS1KF=k0qLV_Ef&nE!rMxa#
zB=S~aU9xZ;T?~3jxsJg|6KOq+`9((kABQl3f6!x<>F+hsE7?RxTaz4r6)U}%7OR=&
z*?JD^5)nXKKN-H#4#7~{6jO2V1i~?Ir3>4HF}09suu~yiL!Or>1-kY0X4lx&(btS&
ziC4o~;9axEVoc4$46V5{!j@>^qZ!I@+J?8(Zo}w$H8kNdlm0M$;;}cK23-vfvWD|G
zzaW-HR+ss>m;L))28hVP2D~!=xcsX8F=yuy&Vi`br<Q&v8Wr?Y#`K4%=MP4De}{gm
z)MB5TgrCxr_pHgu;1_d)Ke&US@L*twa?97gOt<f^BYe{_sKM7x(APY}Y<t-Ee$Sh{
zW9F|S^m)~g#wIA~^}A%ET;zjy%{CP*<`$)B8jrtkuZO;C@K_Yyr0G(w0Mpau=Gt#z
zmauco0$lXWa~NqjZ4x3dt|%ZuP_;DtKdO)OCp;!v%2g!@#K%_YXEGHQ>wyIX)eQgg
z5=c-Sw5mJkmqOtrXW@G$iaD?;1bWgyaTle`$3v;2%YS#Z=Qb+vr&ZJ&Q?^yg-xpr<
z!AaGi+{wds2IeczO;#u!aInOWvYaKp!5qL{z8hz&bQcE@YY#s;?`11m?mVK`uIqCu
z4NBoQ-TE=1RPrM+l3~yuurd*i`vtTzBC0i!f`1s(E9tRDceISqdAR!>c59~ZUfz1Q
z`U<5ZACLh^piM;4IHT35D9=dzJ<oZ>_LWv~slUPt4R{rFay8u_AN07S;-VR>MS!Qi
z$g;MG`W8Fl<~zC4(BGRB@b=!QdjV)_TW~L~YN1*8KrqGAZNu$G;?wNEbiWvTD(Q>k
zo1?YRZbaC$F?tOEGtK;^wP=AeZ*Gx<&v1VxBnA%gEka9MN(~!edK%S>9pzE<ri|2<
zuvF{G?bfxQ{YFchqS`bA<&Fr=giiw+wySi5IrDkL|2Cwccz|{w;zfH58gffiqCDFg
z2V>w(Y;{y=ts<xLL2Can9)F-eYSV?UQeL@*wk}9%vAMo>S4HnyN6kFVt?-d8UkUH`
zAHiGuLS#oRPzQJvBQUS;m;aw`F2m8?7ccEl7WljkT0oRv_}XVM5&TjJAAyVX62q%_
z;=qfmyT_vn-LWq|rl2AJC1a`~PyMWb9<XNtIkMqp0gUkWWv2vb*OI>H;eY$a>1d?{
zx&-Prn1)mIo3Z;{8KIP!FYBRaoyl|>0s(JMOFFp7*D@o8>7_69PFc3*L@8Ezc=|cJ
z_d|HjB}@khoC2m^XTys*lLD;2zS4Ilz`Jh_nT$yUOI=8Y4R6w+&!M#ZR-}22NJ?f2
zr)koHRt&v>Nr~0yqD}(4+>_pzf2{pcsSaWM)?>dkk_E*V&1S}yjWVU2zm`~kTQSa2
z^4<J3W47EXCS`rhA4l(IT4InU;rxAk-K^a7waIIniQg6#)(uaVzfb(JthR3{y30HH
zSEJT-qRM%8a^r5ZXWb^>wF6PRw!pp3<=Lr!|J4aoSTd_llkIzBnXlhKYDRbHVfZ6r
zn4e0=)Ot$v$NMQIbqHjf^?_^l*2cz41l6|%9k>547`<q3sdK6<ODp|2^u57pI>Yr=
zm0H%0)2GjA*IgwnYg=w)$Y`{w_Ht%^A(<P&9iI$1dpBpBrRJ=AaeH@M)ygmlsrCJv
z(!j@kz2*`<@qXr3-o3M+{f*y@9#}AHjt1(@VD6y-zv4sG*s3)|$w9g6$=z_icK2?G
z)Gk_!hK9*go5ASUS__?7WVLK1xd^Aj#!Ou!!m5%$|B2mr+*6M$_>pn+6^o%4Z@XV=
zN)6BvQs3&ABxy5fvxKC2y-~dJYTK|R@6;ov)(hqSMxf#wgO<bxCy^nk&wm+=<o%^#
zkz!U4yiIb1G_D(?W_ua6<PX}3CfLW}t2J0u;%9>kbw(&8sZ#MKRnjJdvxjLVrw-L^
z13~9;oQcI-7)@AAVXxuy_Cjc`iCHCbR68y8tuCMFkgSGfVR(aqwQHq?#XTP0U*jRF
z4;~i?klBkYovt`cjM(Kn)RsGEC2qfUjg9jgaY>n&#F$xOi@Bc{9S!CCc9LBQkH3kp
zeV46!Y}jPwn&xTqZobdrp3S<2|NW?T4M*;<W6Iw~p-qX-sa6i3$JNC0BV6u8m-(<c
z_@jO{MvJ*mBg{3WrTQFv?I26`s$E3;e7B+pKEovru`b-~x<45?QcUkyYo@>OVt2{f
zDmnU<s=>lh7-Drr`A2{d#pYMR;S{mFswc+38!s}yC2T&ZD$$Mmt>4hj0WD8v34YX4
zRLEcdW$aGy<HlLPlgABhd`G%v3ymjF+IJ>{pME^aOIXMJ*$?*UMk$<noW9b1=Gp8F
zK$5aQ@4IsY;#7CH->14f+iB|fqogCLuaWINW~5;Ek4K1I)1KLpBI4y$lZ+6*?*c|4
zzHD}c4}M>r3!vUrH$9E7#5<KcW1jtHa7+F#ELnu3{se#Z{<GY43J+8+OG?mY+rdwb
zzi-baKW=m=T%6wQ`NyHPJ$k_S>Sk5?g4gQ%w_%5IYsv5*%h~V$dqbN48WJ1+$zMq8
z+U)RS;D_iuxF1S$BuvssvCfBVO<+;Hl;NE(@E6g|DH{191l&ci;TTI)#|h7M#`vOW
z^%x4cq|hz;?-*_7qJ>1oUJ6cdp`Mugr7nKgkuI66&63naxMj+RD(77=Nrm&HH-$r2
z$UUn}sj+_s@Ij`jtO|F!`Y_DZDp}JG;SOP3lGKF}__-9;88$wtR}l#`%1gfEho1zQ
z(a`gU4#sn%#E`!jRL6AJ*69n)=erR`ZERrCMN{ytfFdaF9R(Fv4fGCaiB%34ja99Q
zU=XvX{5h>f*-0)90WKvx#4d&#lX^K;D?q^b%it=1oqnuiV*Sk&dHpUUww5wi*)IZ;
z0?S5@rTUrte5KTWSvRR)=)zw_INuz)ppS|k4~K!R!+Gcp5*Pp!b%jt7wiZ*tak|NR
zctukXR@)Kwx6nucKp;t`FjHK3@<dMTST(}fnZv^u9C8i2&<u^ZhYU4(H>=JV#OH?D
zEu^(6cRVJMV&5WFPJWdc&e6koGb4B+K@%<Qu^l(fH86?%z0HgB1g*uVm<>*(>WLtl
zsiGKqJ`gT1-8Gu@5lV~cbkH?Rr4)aq7q9F5ySthZwUhe(jalWgS+Su7b(X7{hQ;R_
z*sf?HXvAgfjp7DUgFOth%_`lg=VV1s)41sPN=h7Q3=5}a0v>V?^}I0&{B2g?Wg$={
zEOf`<j(J75>05JWJA1}i%mww0#+u{?w6CtvbV@)Mr-L2xh64dEEBhWUP_Dt-k#dPg
zh0<Vz!q~<{zNMvOU$6L3P`NJ<RtiB}DjN^3Nr%m7EyvaNTur$W8$8Fv&f4-Nm(}Ce
zBJFjolMo_|piUm8V{c~U{^mR2m-~g$Ps*~LT5}~}IJ;mwFQb|HWK+wAf+`Vt9VN|X
z8T_8%-kysOi!3>c!21d#0X<}*+SUPDaEaQU-3X0W+Q1RI#7vc~B>@kWz1JCgN}KUv
z-+AC_Ma_#)w}>{*QmRlHYLb&S2t>2?K8_z91`<=$$cgEMfFx1;l^WfsI1Ny}Cm**q
zhJqH!KogTA%rSp4t)-lv0aL~&v4JoYwu(}B6mB{c*)x6#mGVprqohSjf_k{)DwHlS
z_ORT=Px@Z95$J>xHclm7-LI(%pz0-5L*N|~iFui#A>?(1y}`Q@1JY=XwU0hZqyW`0
z5PS$@;t@tCF0U7HMAm`jW@)(JsSVF7T;gU7pn0eWQ)DPvg$g(_q_EW~JsWlRE?3r=
z$3s~?x*V0>eII|5*Bh~>8ZQ_5opWLy!pfD4v5mB+`D}%&G^oU=EX`<^%M&D%LgLQz
z7AI4zda{Q#9^QTWijHm#@RY-W46iE}M(EaK#kywvR&_>yuN37bVt-PB<|*JHK%w)+
zQy3HgUyKaMzGCcMhgE6}iiXzFg9-pR2-|;E5err(QE+7PQ6tbGFjFrQRBr>JFZTmO
zJpd3$S;O-VNeqNthWdiQAN@cym!nk3{2>#iRRA>u6qbVmKq6DXM|RRvZ&JY;y1BWY
zxfc<4mvhPBDG-kF0DEIGP&5btagrVFGdY(<RwF5(1(%}pg7yhC(6vru?AN41#h0XD
zyK=TqZ2|`Mo8XH36C4Q;4o23_pm5m_m`J`WAS+flXmgkn<fJ<J87B$hoQH6C&T;CJ
zo5MK@!k|ZsU#*{F<vL9rVKufI95~=jK9A>pb<Wwxf+5dCK!CwK7{o)m_#_kgH}TVd
z!PB6|K!haSADG4Yc2-&IM9o)U6z;~a5(Ty2DV`wIY32xn904i<_(y!oC9UAKe(ZVq
zldqHa+wP#jnw=O*NvsAl4%?;h!36}t?ATT}E16(Hh{8tbLOYD2^*k=@I9QDaSzTnL
zrX+)qLq!bBfc72H*}?U!!D^r1!9g(;64Py`S0rH=fUQ~1?aBw)w&wU0Rqq0Mj`CJ$
zi}Kis6s;2!=7a@F66iQ(C`u?O^wpccvF_ZBx#JeaQ;*t(Xzo%d+Zz!F9El@FXg6FK
zs9L?ZM_tHBg=V@N_6>CO5KS@H{#ENb!#ErqpbCls#K(aPT5@z+a3_ls$O8vrd4yIr
zB93^s$l=iObuD%g?FhzbT?jynY;e0vJS(Em8CPYE)VOS4tctd~MX1Wnb<0zSNmT%}
zF%^t#S^^~kTiJ{O^W1rO$P4A}X8rD4r(AM>8eoCIWz88S2|yR%R35!OMlxdNiY|B2
z1eq?_C<x_-2LGx7lPM^$l8-?kArJI~8G7Ik2!w{CTC_4`!kxw1KNV9%dFv4V$UgQ^
z9F9<<qyGfk3WMsSiSfPA*hc3^pI}N9HnIdaa|tBqg9TKFXO1O+4a|O+k=uz7*V1WY
zta=9JqYzSs9bwP6VU)ijXqn(bR-gr$x(mk6sC$uE5FToKSmTNXsL*hGq@;Ie6gUPj
z(}(K@$Z|`966Sg+d<@*FKV+K?&`N?#NbnoD0X96yR$qZqzYSGL0VhY90U#KrIolRu
zE2L~&4u@b3bn!q|Hk5lnzTXUu82D(0Ye78toH4F3w*;<p)bm#C%^v!kdufoC371m@
zfpKm3z2sa}^;N0*<ij9J3$gfWX!uQ?h<YP5SowhrI1~bcN;b?wE>BYIt0;rmK1H-C
zd8xt%d_b8?P(-s51+m(xx`tqeCZL8VARzp1bP)uA1k^%nTC%-+pkex!32GoDKowB$
zI-md&0#PnO^S(7*oG(I2P!JL=uZsq<ca%^^L)q^-+^eO)RuJ|CkO8OKczeslX=4#1
zNMib9-7{c}@uqyYk^B))7zzHAEhb<9>K;U?Z57=iroZ*97>x$;4d^@ZDY|7xT}z<9
zPa1(4MEe+_?bqtr-oWwg=&Tc>>)I{vfM_Vqhpfm(vrL?J?=6%t3APnQ)sBWbU!KJ2
z5<%b?(osETyZxoPNZNhLqObw5;~UP*7%+R{twvlQV=nX401b36QTp3^1I4g)GX*yc
z1&9dx^~DrnI4b%gjJq6VCdvQ&km5NIu^UPGuo-eC1jT7FW~~GRHK3QJMYx3kTJoUI
zQuHMe19#nSEaX>)kO0ebkbWiz#y2<CxHcy5o4@<rO#Zi-x*g`4Gvm{8up}0t2_Vb@
zpgKg#>xX=*A4WT=%~g-D8^ZXEK8#avm@D%@)#Ix4)69)86`ME^90wd25z%<S%(s;y
z2y{o>kl(-v6{k*ZOq7$ffZ+x(>`gMNMtnq2skhF3MG9nriTyl8D3c@yfDs|uP!b4o
zb%JfdysH-0K|RqxGILLSAtwYtNKHp7z~z28WomcdaUK*4qVO=F(*Oc((TI5y)NK$1
zZ{`hvAxKNg00tT~kQ6L=g;5!Fc*7QH3F`z@;+wm7U|=)|Wr2?CQM$<ddxta7OstTT
zNU};JOFsTFY0zL5sPxr}TG!ixDCNr?EH?^Q0s<`1*6*f*8_+R-r!e$m5L}A^$Wk&l
z5|N@yiG~|u8e;ym3&{X67HE$G3a}8s&uopVnOr8p*#Z6}AmUggHk553Sq}AN@0&aR
z!{tqykpwSA)fs?B&JCl{ZkJR<z+Au@F5K!Zhrl+>qHzEe2M8{OBdj85^#MeHtbH{A
z)d%93;53SJ9d;2N8*K<&ZJLhu^+%WHq+9nrtnW|Hy^iYZvY0@)$?*jMhzKwo3lxN)
z`*pB1RuRyE4tL}nlmsM1f~_7;oxg(dI0A8%))&3OK#woT(wJy13FHJTkC_t-62i9Q
z6e&6-^R#S!sLjDis@~)<(4l7e9{P=Qk|H`iao#G$DjK_H({T7*&7vl5*0Q{0=(}zE
zrE)#=M6*S1rgeCHOcsDjs(2&A4wjoBq-dvkr2uBYWfum;-b{%HWt)Ayw69BL&#^Bl
zEE%^UK+~YkdFyh3zzj<BZhkod&oGW=M1mmt_zh>G&>!VcJ|H-;nd%M*`b7ae-yAG{
zIl=}A7E1paqs#v)rWjcuw(d{fl&kXw9GAcpLI52)1!2-=hW#3B41lnptLGmtW#(l+
z?rrv2i5>k6yY$mCBh5gSOR=yE2Yq4FX~b1<<)1+wQF})Z563V(jP%_oHlQiJoS~w*
z@}K5^@<0Al+l8CB-RJ&`r62(X34psI3{r5PLTF~JVisWvIysf6-uZ9f9o#Rfm9J73
zT&~XCqh~uG0sqt^E{~wRvkX$Cc#4du-=RRc*`TUH-_IIRca$DW-s_CNd4JwnW(V*3
zx3wtVkfK@%PJ(+>*Rah;_%U|{FDqA^bY{sAxJvbw>}DU>5$SV=r%UG1z%W{93NqaT
zm;5>5v{0+^Q`ZIkz}!S4$>zFCl36NJk_9Qr#&7a=>}m{5b{g_L2EugcD%*)bms6Np
zh3lTdBqcc_blsx%5f|#^6lO6IFJB_B15GajQWR^bnmNF?U=rB<+cX37(1I{`z_3KE
zO{fZ>kM7jF)32X5o1!xXe^8&KLJ_`m|Czaz5VkEuPQ}J&2CC-l?FN{q<MnO;&@ks`
zJ~Qwzko_Ht!tq73!_JhY=8Af)Gsdw^CQwz1RFpS}nej&O@SLCT3}@2tE#3EP0zXh;
zmh$4Zp?ob+gIN>?B%$aE2U(qcm@1Y5em^G8rVIsy5;vpb@gR#}_<!cSP%|sAW_7~V
zA}EjqN!yOLlUy^|j`ZY#65wH9lOoJ-v)^i7i;+ZJKa@;iORXS=`5rD2)&5e9FAz?a
z;b=Go*5HDI2rz#90|uN7Owg@5);Ar|5_nLk7Ra7_f8ikjnuny+sUkc8D<5l=oI6b4
z-M_&Fq$o`Y{+*H7^~O(b$zsvUNAdl;Cy4TCSWSx@dd#32(62IjNDIKLoh<p?>mGvk
z(}x}=$;ExaKl34;Ew{PI{B-;lO*gRM&1F2P_1#^OB5C$9oc=aX=>{|Xi#r%_Ra8vy
zJp`HzHIsxnV4@#y6V#d?ksBmflpcqH9*0S~-O_|So)#X!Zj9f1oN}0oV`mQUTzVaY
zU{$<j81VYG60;S@I%fzxcUh@+XyZqc1EnGWDUWuYS6V1tZ-tqA00v*i)mKaV!IHp*
zJMvGm%5U1;`q^N0!qO8)pB0}R*stFHGa9+GRCigL!77NX2?l@y#`mXJN>UV$N}m=a
zDru@Ji|pL*+#Is@?t8crc|HcOl?7bo5X>@)_W@&XNu?z1_ga!ay;<OOOVD6vDCf!c
zqx30|$5Wc8Rp1#hIz+}NE+jjV@fis51xv62QRud~vcA7G6KrrOxIM+d(WI@bu8)a_
z%s$9;d-@nXp~}+3D1m8$FFq>73Vcl@-Ep1on!4$IBnXDrf?z;5(2stsJnl)8rm9kJ
zgjyjw9lV8FdD;|C8)iY5iqWNJIr9B3IhFhqZ*V!NM;!F<8VKwLAhC8At}K7Ejoc~7
zPj&U-b&eo#vr=1Q&4>&r^OrL0&{q1^y(^9YZ8P5Lsj*hS+OZ3?E&@d9Hf4>z4Z*79
z>_o}AS?b&Xu1D&>hp0L6D=;|!M!fL0-|3=?3CmL0G1~xGngKqw)l?Vx;3)9>KOmHl
z_tU$pH_JA9{o?UR=);11LQDh$p2ED)hTVh0-n#OtVm9!^lj8t!YdW>gAuP1~q|I_G
z;%7u<5pu$BKXEPnDP=|ljejW_KBJkYmRaeglp&D65fB<3vhxRxZ$r4X&r*YE=AjvK
zAU^cv$FF)x_GiEbh?NE4bwNwYsO0^-pYzV1<(bh?{{&bbxH#C^05|`TGJ8@t+he3R
z*C0=@uKwkBRpvkWwizD~80bet0bsN;zaRQ?H{j)sC<DnBpkX#d286;}&PJR;h&3@&
z_Z#P)0BXR3G5Sh8fa5dz^;Z$QvjJLbMH~(}nWK$XAj@zh1(-Tg%GHA<9CU+P`q3Jh
zr#FT{@OFjU7VoD7S`C1_y2Up@<kfpA_F$WTFjd4ds9h#eU@!o))g>GIKLBh%lfUn#
zKQNDKiZtiN8c&tp(Ch;_Bq-9PANMWM=C5BCe^HfEt!niu)}$OYa_#E%E7-8+w9PuD
zjiNTQU7-zu=ndDYY6e39@bT;+xLLj);+l2Vps&3ZtIdko|JQ4>xL#)!Za6F1!?eOG
zK0DQTqOSx15QHeKjT56&;1~*<1Zl@$%cITlv0wl|1+lVc)2>aCW7gcdb-VMjJGV9&
zOMd*IN!2G%-8Hh**oVenEEb-A>qe8Q3O+*c2xT%w{X6*Z)VJC$Z~i=bu-sNzq-!KS
z{P^gTRe1e=;(D$P2GWr4|9@?`i8mmDAA!<Jfl7G;4_3%gx6e)qTGfw7gh+THh8cQ9
z9)KNs_~As_kYW)R5AXpZiYYo&4I{XqHKIn7aI%_;HKr(_hPl;XoOoWylw*bt0y!j+
zMH;yqhc+s?q-@YE!6cMXQsktRRYHm5kw~FY0vb+*|F=vaStf`aH$RG*qnT%_xu!o!
zTKOiNamqO-oplD-5t}f@^4x%TER$z=J_TZnZs2&Cr6_!&BttELI$GosAjD!Pr75yi
zDW>pUnklDY#R9?-kE#@hcm8-o2|Cop<D00zS%U}>Z0PogAK|4_6il8ddQzIL`dT0y
zAY{@hvFYVkEVAmcmn^ds^#KAUznb(zG)^sn&r!d%0*bV`?GsEOMA(CpGI3O4VJ5_Q
z1kO&TfB{A<{;abH8tA0z&ogNF!QdXXpg~O*_nx#*KNN<v4;!r*j1nto{O}xvSv2Yo
zI)p3{2R`1!5eGOQ;gbm%a8RR-C%<G7VYewG|Me*t&AJShh%d|h;><M<A*sqDp-}@R
z>ww|U4%B(!PR?2F!y`%ilwe9U@y1evM{y|fObN;;qb?dU2p6h0CB*W`Q6N;I^%A9;
z)Jha-6R|eiZ2O3kA2pZ~$8%t0@k<TL_)|q3+QfnnJ$UQ=)DTPTG6XBXl(0iAE(~5Y
z<S}tHY|WKVM5X1KW1e}kpMub9<WNcV+cI}VUZ8Nle8i~I@PGpX9EZ~S5g~GW0>VBZ
zpi_k?lthaZK3;%=bkZP1<BzVn6Jp8|7G`Y<uKo-$I58zq2u9*8$dpCAr+ZJ*r!qjp
zIr-(Ae}1Pj;QT%9-TfBGpX`H&4<$0}|4@`EHF)wf#c^=y(IfWo5j2#|6sEvO38bQp
zO#Ch=<{(~4x&}ZrtOEp|Frd2p!HOTSz)REf$aOq|xL<@SC#;Yk3Oy1m8Bh*=GuxC4
znFYfb*2!}vRN2Bl0y^E;BMK>0RjT^I0(JGn1t8EHIB22`-1);4Rq#hqSkWARXrmtq
z%)$a2_#J$Jz#GH>!E<DALVR@Wczd&u^al3}8Q|j)AV^#ZvG+sy#UofC07D;Q0gXNK
zv5$WIBOn7Q$UzdakcK=YA`_{|MFt}ii+m&`BPq#AQgV`wtRyBgsmV=F5@Z~?VaiA-
z5=Mb%TXWovH)>D=;e3P=P}86c|5k~{c&riy42lB_TrdO#Dlik77|<R-Py;_aCpa>2
z!E}BQ%N=w~dL?*bKW>(VCB#CMIqBXhzvnrQaI>4<{3bZVDb8_{vz+EUCpy!q&ULc0
zo$h=mJmV?PdD63<_Pi%P&52EwSra5X%+1iUxf^^$PkQ?VT|5@HkAhwZf@$gp1U<qa
zeDp&Gj}vGL;}Hu=EJ14?{U}I7D$<dXw4^0v0Y^|^(vxz81uK0iOk*ljl9phmHofUc
zx#?1zdK9G~s3}i_D%6q!b*M%)sZNLL)1n@=sUwAh7PC|`FlYk|s*49DLgtixSgda(
zG}%rx#xakO46GhO2fe6~{}gM;3ZvB7*{<ej3K?WU261pJULEDRK6K?~#>*>_>IecB
zg2je_Mbipf*cHPbRyQ4u6dJ&=j~(1?2aQ@n7NWrlYAB9zE+9tW^5&7wHclD)kO3iT
zQ38gt1QEe#Y*wi8&lL7U8xe&qZZi}Oj<h8sel?@_&;iOd304MtUF;`=J6tst_qbeP
zY;LboHjq)H3bkN?N0v~F*G2Ca+LKE6KIjkcZm*gk5XD?G$df?aHoES8FMQ9mTM+ct
zBEOa2KGX{+N^r!v81ZXVi<Vze@fQUCy$FEgTa~6{!V}s!7oRM<#O}uNglQaYg;^m3
z1Dc|lJYfSj6fEKq|C2aF@lf9o#z&F+$`2o^6V-g{YhR84_jE39Rg8U0;}Ro<!49_W
zjtGG>6cC~)F0QZ$)mUM4l%Qkim@P^`K`0(mxyn|y%83W7;)vXA2{r!SI;H|+^@(rB
ze`Q~oeH9HdZ+RjtzVb?{K(Zg>V+UYFL$uah0u)p;j^Tagc>UZ&m)77JNLdCV;H>CH
zGnypvh*X&$0^LTdip-Oehz-9?X{=;f2A7UVrZ>$KhbpDLDp{4NQ>|(d7gw?7m^2E7
zE3H<8I=Ly7^{;3R5m>MKS5Yu^uY)b@j3$;LyvDD7Th&}i+d72<p7jb3{OV>8+gE{j
zNwu@BZ8{eF|JW^lakmQWUodba!0fwm%Ea9eazks|zG?-6+%4~Ur<=Fbo@1I-=DFU!
z`G@&V*}e_ZZ+f%I8et+h!V}J>0-ssoREe?r8t(9*Kzzp&R}(&bc=3&MTtc7PXEt%2
zvn+#3)3;vktRwE_j-M%@EPpx7SN-gw)lmj`o%zV&VDp$C$r7*SInaY{WpqOh$|xi{
z&4pehTUbKrPJjA){|)t$NPX&}Hb+~nuJx^Rz3W~llE%L-_OZ80<YG5F*{#e5bELiP
zZqE|VzaICulh_hdPSB173Xh=Cz3)c{x7d;HcM%7p=?U6Wmre<fA;^FzgMU2as_u2k
zL*Bi;|M7TSe+UN)SHAO}|9sbfogh+qWE~gPhBv-fgH)}<6Pdu3HYi~>(9?cMX!rW<
zYk$~4B!@uM(uOwRfX4Ak%zL>rl``1XJyz@^3m(=z^d&U+u1`PuZiV;Zc}B(IH*sR8
zlfe&&SOqh|<B8TkKY;}Ab@iiPpwl?`g|xwaQ+S_!XaI-7@Bs#+x4-{Xp*+_C;F;tQ
zulQd{WE_UXLmUi2G}OW`ctaI{fxvi=CoG32I3OAf0RtK!2X^4EfWywA#M5}7NW6`P
zWCE~x4+@fCxAX&RQ3d~D$U?!y3`$7uT?N4?MGWHB4T=c}uEY+WA0osL3l`xhv4EIW
z|HTMiMg1v7aFoDwltdH4!CgsTvS9@pxIhA}%qw}sGnmN^m>hL{p_o+Pk(5hEd4wrs
zfhQEjK2SmxB;F&$!7qJ8xuAiCJc9gDmG#8~({YQ0xF8L_Amr4b5uQmcBw<wqVM>5N
z3bI5TL?KByB1jlwfw13I#KRUMMVc%DxP@VXc%qnKqLFylBZz{{<&Rl`4K?gS8G+45
zm?A0y4Uz3Zwm@GncmWX@UP_RmRmcDmn#2@VVag<mNIan=9^#QCB1o)Z8;%y;?1VOm
z!Y+WpUFjhq@ZlWRp+8_FA8HU9paJKV#6G-^HlPDd!~!u~hbX9FIM%{Ga7;MT|3t-H
zjB!L_GrnUvg1|Xa)W(1tI-o%nOh-I|!#s)vH8e^l#6v>*!$N99qj*9*KqT@^WJE@T
zB03=<h(R0_g(iXoIAkNnAWs~o3O?+?P-H<H(cwp+!w`4^Ixxr%{6aRKqbCpoB{WP*
zykQ)kqX2mXC1?XrCZ0>eB!e^&8}0)-++<E>9!fOiLPDiQRwPAAWL08ho(w^>{NN8{
zfhpLc29>}gtiwkT!!2s1Km6bhNMi^>pCu3h5u$`BGGRu71SKv7A?C&-B89Gy1U@Qb
zmN26l)__^D0t@&O)Tq`=+T0G*;!#8cEP6y^5&~Gp&D=O;NGL<36i&Rv{{af10loMG
z954=Oa#0P4!V)OL-t^7iM2#el=AP_<X3`fmjh9Y*L=E%{qnIXYs%A)NRyVE#aE|40
z3g-zC=W&wdRe%Ev?7=Tk;zynp3&erqphGP%${s*XJP4C1umCzhX13tN5|ls<EJ3YI
zrY%wf7=elmJReE0qAU7C4a5sPlt3E|K`SQFc$R0asN%_}CmOJ)d!j^f7HD!BXmA1w
zKl+0**qmJ%kcBBj7JxvhnB_+-XoCXH@pwa9Lf;+iWl_c?6;Y!#LL(aNgg0&#944MW
z2&Oxt0X&)`I`+dqwxmE3q&%X*UVa1tKE)mUoJtUbztCi~1mr+||3t$)3=};=@wp~o
z2Bw&G<yRiXY5GGnBqkf-!*r}A744jbN+w(8&hhkRBl3v3n943}XU9;&9&nM~c*0#h
zPxSnyn)(BqZV1v4LWF1o3V4JksN@kL4>5|#9`FxzZlc9_1PY)78!D<cZ0DHL#Fu8*
zC$c3q*c=FeLlvmiNw9)gDrf$5<6U{`SboG@`h%3FC#GsDr^43{z@*mrLpVN#Q*de~
zWXq(!Dmug}C~_$J<z+~SCwZD@i<ZD*YS3Y30@R@AQNU+2xhQOc=4^7NZK6zWUS}=v
zW@@s8EkwcEq>UGN0ULPh+NlJ81t=O|*R_(8WztPf+>L1Y|HEHCX_2_-gPH>KWvV~y
zLSiOiuX^b%{;LFaBW8-kUCOH@5(9Sm!ydFLo{;GVb&!+#gTi`5!{RAO=;>&^QZ4KN
z7x`(y4#^OB2N%&qbneYBDGfUOz{C*d$$G@3`opRIYjybpc5P}(NGOGRgr~Vc>M`hq
zmddH#>t;RC&9>@$#loJ|k3V1wFh0i~#1bh{EC{fGp(!m2JOX1L&kxe;sb1$zOh=Vo
zDbTQGSeB|s2xgt$X`AHfp7ts70P33#Dh=X8Jh%fJut8j&1SNEd3;06`@Ts3>ftVr>
zQGmemG|$A+E0MV9tk#x%vI2A3oQrCxsQ~Op{3{oE{}C8@L^LF$NVtGn(ZsxNr**>4
z#~QAcdc?U*tm)PQ?0AIeHf@DOh!s^47*Im$lIfYm0UU@Y2r$UWW+OgKC^}?SZCTID
zQtU0tYP8S<%^L0As1-as!fn}Vw%ks(V6R8u8SOr<Hq`9ViWqAV&upOs{xmP+QtC&z
zXzp|jzgn)Z0`1PW=u}iJ!~W#K`h&)f7sq<+!-lL%m_vxM1SMpGHbg}U;7!`@z`#BN
z1z8XVE$;f}2<);zyf`fjJclV%Eh}_H<$_|@ev#E$?hgi2Zo)y-=qpK30t&c*0L`nc
zg1`=N)b6UVGSvVxMNJ8K=M2|y3Ar!~S4h=T|H$nuPCVT3noxrgd4dca&vs7d<$}N?
zlmI-$!w!^y1^L7BlCYsMs7eKm2+M%@?u}Ex?(Bg?)UMLRSkc6+@zg3q7&k5BZEzXO
z*|5n#;kdw|RIu~XZspd1<hqpn+8p=VuSdLY?E1s(8b|-$Za?Ji?h5d39B={yE+k8G
z7kyC}jZrhnupbu*((EWo+yqVB=2M^ml<mW80UJcwgh;S*N%R9F7KtE|M5^qg!6Xz+
z9HmNFmr0}v1N)Om_%iJh96AhW1<SGhAo53aFbjOJ3ELbTPs|0!OMn6~P`>a_3K<I+
z@lWkQ5<jd8Cx|60F!F@6OrS6^b?Grh|Dpf*a464Fa12LrbT7(G+|FbH3#9RHIFU;H
z!q|x6JS&|s2Ww2g^1;j&Ew4#KdyGibazUTYf`CMiIvhUq@oyMR4&Cxd(1S)#v`CLM
zNpD-%h6FIyWl66zOSkl@opeZ4u1n7}P1kf|EhSFsBv&;LuAt%0IU}yfv`r5+Q5UuM
z0H}b*fhS(fc(K4KrXpdUOxminQCGE9U-c5NY86C-#A*X}p(R&(C0IH$R+qI|pEZ!&
z@fXR&c5;zZWGK;2HCoR#UDx$@+%YvQ!7pV(sOV~}g0EcLwO|i6Vb{bRYXeuK01F%s
z)-tUI^T{<Awq#E>We0O5iUcWF|F&jtHfMLXXMZ+mhqh>sHffi(X`eP~r?zUZHfy)G
zYri&Z$F^+GHf`6oZQnL-=eBO|HgET~Z~r!M2e)t!H*puYaUVBwC%1AhH*+_)b3Zq9
zN4IoOH+5IHbze7jXSa55H+OfpcYil{hqri-H+h%0d7n3Wr?+~qH+#3Yd%rh)$G3dX
zH+|Q)ecv~J=eK_EH-GoHfB!dt2e^O_IDr?qfgd=6C%A$yID<F1gFiTgN4SJfIE7cZ
zg<m*^XSjxMIEQz*hkrPThq#E3IEk0IiJv%%r?`r*IE%Nqi@!LG$GD8oIE~l1jo&zq
z=eUmVIFI+ZkN^0GcS9&#|H3U?1CSs2<ITf7e8eSa0TMj<lgj}re1wuCxs`jJF^mBc
zTmdRvLmD7~6v#m&ph6_L!IKMuKSaV6Ab}jn!j-={)V+g~BS9KmgO=w3FZhEz7`Z<b
z!<P$!G|agc@Hw0pI?ojXl%s+iAVD5@L>@>15@<mq==qlqIh0?5p=UbGAvzL_0W)-Z
zH~7P%Lpc(Jf<Iit6?{QA%=x5ix~p%TEIj!oG(xHS!>5yar+Wmg^THoIxv87PH+(}r
zfJCqlJ4&d-H|T>$$b&I3!#xDMQWQI}3wuf+yRz$fvp@ScB*nA8!>fP0O2~tm%R(AR
zK{2E`u0MIG8v_y)|3W8p`jVT3lmEIusDrwvL>?f)xqkx_JUK5s`9-h9ynlqfBSEO6
zM85BPzazoFBSFBI#5c&nlHURnpgFi-yh+G|AY6kMjDbf0L%LtVl6M26%Ywz9L?|G^
z7kmUNsJu#qLLL}-tfzr7)I%Qpfl{RW%6ml1?>tJtyv);i&EI@YJh?pBdLB$U#xK1{
zyaOt%dKxVGJj^+iH@ZK3gB1M1HFP;jki(O2yFYxn(gVXKpaR(6gDez-F<inm6oV|h
z!!_i)8^{7b$by@HeA%CU+OPdJkb^8RLr8c%5`ewf<GtB?1lp@T+q*s7%RSxO{YNlE
zD1^c_@PkL>|AR4f0+D+J#g{rc_&wlzgfvXPF?@vE&%-TT0xeiR(<6B(d^r*@LmFHG
z*snU2%YnE1!@vIlEkt=IoJ6Jj!#g~=w+jNP=Xt?DIVvRlC6M|(0K7jKKa?XssiOkO
z<9tX2|L`M0@gIM^S3mPRKlC?0lox_WjQW#L`WHa?El|A0OaGH&|Dr?snYTWW%RZ^Y
zJQDoAN4$e907Rrq{s{W(gyd2qBny$qVO9_#L03q$_(RpuA2TFZuJPK)Pu;>ovfkxE
zQtVwMB!$A=Ti8z{M~_!PiX_=BlB|gSCRV&CC*#JBA49GrX%eMMmM)R>Be#&(H7Q8C
zg_Dy<|DMN+-4+(RcMFLif3i06;x+Y_KRHO!kRyv^XI!~+>DIM-7jIs@d-?YD`xkIv
z!Gj4GHhdUyV#SLYH+K9Oa%9Pq>#k+k5Lj4$@@_TCBj-<~V*ci(k#a4~WsGv=E$o(>
zmcLL)#>je0u4p}iNM$4G<d12;*|l%yuG^X_?B2u|;$EoRAMe?}gL@o9P@X=5`iyl-
z4cFg7dH%qP{evVFL6u_H>YTTbA7%OT>DRY^AAf%R`}z0x{~y2rcN#;r)7FyX3e^_+
z!i}&FQti6A)-nl+d;Ga%AuTl2qMM=$lFm2aUc!)~4Le-ut_c^iki-o+^l-P6dZX^8
z|A~Nt=p8LKIuAVY$kS}C*et?mt<ji@PrxLVT$0HqoqQ6?D5ac|O1cPC?GJJiR8X}`
zc#(sN%OaG^qlNw;$QX?Hk%gI>r1((A=|pTQO`z6nGo&}SlgGlH%0%K!f9mw-PB-Bk
zP0rxbWI{VR#$e{6Jp6g8M<m|)Q7jAtU2CAVjF}V3Dn%WY)KX1771dN#T{W&NRbvL2
zExBCiib8HdWvYe7jEgB5{mEycJWNWXpF9tpan62#MM7A%ibX<Ce=-X+qFzV)HP~UF
zjTS^2o6<+eD;m^7pP53rQoE_-0H!>Dx(V|O9htb)Q&3sG7vFsK-Iw2f{S`G7|5OAX
z_!4sDA;&V+<S0hRg+h^K;7IBc1X}F~y5@^uFEuvC(Ju0~AAc~`*dLCi1ynAIrLb7!
zjG5gS+G9UXcGB<ixQ0+c!W1N9X$)Ej6|f4q_`5W^iSg5AL;aWOrk#Eo>ZqlT`inng
zp{0}01c`*1Z&0CyAturb>>if?D*G_B1Is6$i1aa=pnKYmi|wiHz8mkn_1>HB`>t6?
z3PCz?1>#Fm%R`!6p+%+d#vOkg^2jBhoN|$8y$qF5!UUZ0%02%a^w32gopkyBzMNKI
zW@G4!(p`TY_Sj{g9rA0g5*GK|Kf82wB$$|o_TYsdp7`R8M>UkG8abZ%|K^>49{T7N
zdxsq9t-l`o?6u#X`|iE}9{ljdAD{g4%|9Rg^wnSAu6~y0CuF)py+^mD<#Io+ckGV{
zfA;<VAAkXTTp^I~4T2N{37wM*Kae1?)p12)ba6u(BJv<9M6gwEh{!vZCqNH=5QHH_
zRhoX|4~kuiE~t1&8ni%;eyFf66NCs?{s0V$JtTt>5k#~^*h3%w5QzKXhZHKJ4<-P`
z7+(mSg;4Q@JX}E@V+aL?m_RHkP6|wNsGdGTafM5Kfr16$iXgsm4_+Ki5R#h57j!a)
zFI?gZq2NxK#&8cON+A^aD1;QgaIG%JF^GW_<RA%&7nNWGfw$;~{}kjP3noYmLvn}&
z1G#nuE!={VCe(r~zHl9|L_#HDgcC(V5i%LJhH(VCgi3Bf4g$%7DO@89DopZ@Zy=!&
z7y?EidD%-}`tWa;px8a65f)Tv=t4-SUM9z2rv?Hm4X9YlJN}?2DTuNl#)w3M1|q|E
zB+wsYc+(=!v_laMO)XMDg+h2Sn@e1zgTIvLJn4BpEl7b0XPQ<h_?b)#G1HlmXiXaU
z847vi!J62-MO&~%K{s6IDXF{yL8KrlbGoF2N-XF#R1yh(@}iz073oN`x4O~P15nb?
z0wj^pHh>bUf#LiDGxFdDeSqZ>v%zLaqNxyx=}ep8ROM{a|3WcfxMXa){31Eh6bfEk
z0i-0A>Qt#3yr-;;AhMWB8q|?Y?YuOT*U(WPfuoW!i~*bepoL}rV4=i?1)OO(YXdC=
zmI|Q<J8Qusp%enB{Z$pPffX$1=Ej#k6$EY(DJ){+Vz$LX1aAEs>|`lhS<7A)vzgWG
zW;xqg&wduPp%v|DNn2Xeo))#KRjpwA(b|2y79X*dEk5EAkJ-ldwfkso{8rmr-~JXb
z@z}u-2(pJA{K6lKs6jOF;fWf^01f7#Mh$kr4Q_y82AQzNc84GXKUiZLGLXRxW&j3m
ztl|eKsDUkpPy=(ABMvnP#(U{&UHfulyW5?{ey5RN|7%#6zUgpBZEcGW-2xZE3GQq^
zVp|IkfM68RcrY5Kkp&Q}A{Zb*!4H-Y4+n!F7U+1eA_$_52iJfgLtp_2YOsfBJov%C
zkO2q?f(8&oBQX8ghiq%>4tJ#Ez19Wqf4T8q0T*~53Rd!x2gzXCx+BO#F0wfu@!%yW
z;=y3>hmD`%;2IEvAf9+|7ATSB;=-631c?I(z`O(yz@Z=L0LP4#5e+xvI5IkpZI7ee
z-zg6`w!CHXpb70gC&vTG_?^a|k-U>NmjDDTKmiDLuw@WDV;?Sf@DTR#=txhx()~a|
z3B()+HM7|tn)XIPW(?yS^XJe|HV1zHYmRi({}vyDF7&Q>9lISP+8p3zw1M?91Q3Yg
z!GxHxrJvysdemaZzc4nkL7;3JI~WBPMnTBd+-49^!XN#J$Bd()jXN`m!SRqat&8jq
zV)q)}@owCXq0DY`09x05DFF-ovEp^Oc^zC<MhW&X<8|!2-yrz6!rfeh8mzb${^+(p
zKKuh2$e6~K#`BcuJ?rhZJ03}v_sB`EFWLh6<L0of$PW__5D=FTS?~uOK%fkoclieo
z-h<0wE_0g40t7A~h=Z%(k3FE;AEKBvo0qL|RHfVF*08m0OI~%WLy5sq-tN@#!Jm*5
z1|9j{*U5t|b$5&X>S<TIWcGn*{1%z&|AeHi$GLH9maiS}c_$1$v|jhGhqUeKc)Ppx
zUU<XX#U374dDjIy_gcpT?T43q$?+k0sY70~{Yd<O)4}-3e;(fA#;?lnUZq2;+s8nr
zuaSK`-~vaUa^em)H{1bx(BD3_qPIrpsg&+SOZmM%CUAjgJNzH_xz_jw-9Fr5U3Zio
z_t7tHJn;K`De*nni@vvQZQmE)XCLmKpB(d@Fa7MP17}i_1`4CUk6@<*`bxt7*112Q
ztk0hGlw-cs#c%%R&Epn;A^o0&99+Q|s^|9b!MfrBO5$Pm2(LdF%<_0|a;T3R`p^H2
z=N1x+Np1@F`eD{EFiEJ7|Ip0=|4UGE6p$O@F9T_ZAB5x{z5xM&;~O5UKhyz-<e?kb
zZ&IYn8-8%r_#)q43op<C2w9LI+`$?ca3|`<Fvg+#?!x_c4+(eTzyJdt4g(*8%^m(F
z3g-eJcCQ7CM;<;!AF9U~`eZbADL}5F8``FN(t;qmK@LR<9!Q`G@{lj^A>$yT4d4JT
z_8<>cAQ$H1z2xE$il7KI!7z#-5d<UHm@qHUzy(SG3qe2<!9g1eVh_O0FO;wgB~dVP
zjWYHD%<du{ltC~A&mTllE?f~X@Ie`V0UhYV6}2G<_d^?CaUEt+1T*j+WWgA;gFCk4
zA)*RE$bl9ff*+V+0HuYb|HdIK1VJqJq8-2kB0vc*P=OkY021Wl5a}Wa7_l&*Fcz24
zFXF)xg9{=a!4Ejm6a4}N@vAVR0Tvy@6!YQ>=|Tm$!7h-?Fub7_=K>%FWEbT^8GdmL
z38hW4Nl==kAL<YqM@kwCf*5K64Ss<TJkb=;01YC}A50+&KJpsD!6S1m4&a~={h`xL
z5)HZz9rgeX(ySnq;2U?s0qtTO3t}A1zzIr$AmBj{o?r`r(hPLL43t0>W`PbiK?%&j
zA7)_-w!mkivMHaEAjW|XoL~!dAujg88mcfNw1E)BAP$mD9U%f72muV@pzA!L3ecby
z@nH|V0S&SMA8H{E|4fY_)<GuGp%(Yx5j-IaB5n^bk{YsLAnU>$_KOAKK^qRz8$_<Q
z`~e*zv+MRD8rI<oA+r|uLC(-29yW0>@WC6X;S@cyATCoIU{V_v(;rMz8^FOb@j(;C
zvN8RUF81LU-p#hqfg0AKFC&uyCo?h$VjsYP8c5S01QH_FfjC*RH$^Twky9IjlOT+f
zIRQg7Tk|0CAu{P<HMM~l7%(|ovmg?3A>{&AfMFi6K_9L`2AQN7zTs0ILLFpb2J5LJ
z38D^E;0Z`z3vR$4+5iaDU<=N`9~>bE<UkD|;Tm&54T9hh^Z^f^Ko5cv2PBk2_d!C{
zKm}ONCgWlS|8<fa_dyA|01}Eo8ulRwk^mBv01x~@5tA|zHlYZTAQ6h76vhEZfzlsv
zR7ZJKACkZ(b(BQ=Zy%OHF2I2W_TU#lpzG3-AkcvY;@}rb03D#M7WM$eT&@O8fd%Bu
z!3qKm#A^wb!01W<3`_w8_5lQ{08LE+FTzj+@u4?k%O8%@9}*HAnCt7J;TP(RHhXb2
z!2wUT;TNJo8N?DIelZ?saUH<SP-oL0{*<<o%r-YJQqf^j{XtN{;ZN;?`uI^$qro1V
z^A~1w6SYAZMsw8$bseICHgS=*3c@){>{V^`R8y56ER`UX!5dPM0cDj|^Wqn&q0UxS
z8~WiF|JGq0ej#K~H6Bt`8NeY@(^DbW^I{?+I}qb&rm8>vfew%W4;rWl;sFQ7pcoL;
zA8ud_u7Meh;Tp$)7rI~zM5YU%(jV&eUbi3@iU1FGbS3>^M0cY9-~mV>Vki9}7tA#g
zlmHM^0SUV531+ki=paaS0Y}HdU?0&Rk^o3M_G3$-2(-fqKo%n0Z}<qz64-!ABVrG<
z%pat*71z-p2tiH#0R_+@3p{}!P+%8d%@Z=S5B<R%IdNx803JX99jZVSC?OvIf;Z7q
zIvGqABNZHYD^&@i+}6Pxm`fFZVIQbL1a}K<LC_j7Fd9A+%)T~kTk#jRwjk(X<Jy)b
z|KFB2W$`Y$uOOQ<&DzdclgtSHp*JnFRh2<FadjXE*D{0fZ!eWLrL#&m@o+CQF4A_l
zf(-+y0Uj<BAE*Iy_Y@uQw8Y|p9-ehl#j{Vhm0Ka>ZGur6IB>Mal@8QE7v7`@9`;hq
zAYXa3Ag=Lf=pbMH!3_9Sc*%7OAOQ&gK@YTm4Gs1t3j!Xh!FsRPdbc16Hi2Qu5fhqM
z5A*;S^gvI70Asz9Ae@pQQkEb@Hhq;~eG`EW;P+#9!WO&$fAcqgi69DsAtHu=PWf<3
zakdIFfhD!{2SBn0et}900#4g;58yFq56&O5KpQe)YN^&6R<*>u;WY^YJbxhz|3Os}
zg%w(DE6u>nY;n@RT6h_j!4(e|AHd9n*MSK`c!ce?AY}M$GgB1@<8N~{Hct^8Vs$tP
zqFN8PIR|ov38IJzB639)iGR3S4flv6A|6`Uzh2lC%@#02_lcVm9DvhnYl|45l{16Y
zb(xF@A>*$GgB;9)7i7T|fZ>h(f_CT0cIiMD;I{~7p$NA027b2*7!V(>ksyedAdZ(H
z5LtO$p$J@o7hC}wYI1rBA`y~6lQ&tDivS56u^<{29U|Eu#sM2Bb{zBo3Dkf_(Kkrx
zmwiKaWMTP6i(nqi00~sqE)W3}Ffb+Y!OgO;f!PutEDRke0Sx*<8%jXj|8N#LkJc25
zF3CD^f-TX4F<3A}&UB>{AQ=xG@a%(2j5K2_h5ccL@#5a%qHRqP%=onHycy4Q*lW>&
zok7)y34<6sPlyLMQZ4t084p-<m7h7-AM#l(C)aSh?t=jmI`bl(cfyNH*KB_{A?ZOC
z(Sd<^Gs&({J>yLsctIlVf*fwa6%MN}ZlS9Pf*;0%Al~6x0OKBjp^fK)8TNB7^uZPK
z_?Py$k7?8;MgRzqAP7uI2}pni+Q5+kp?J;U23VjUl6ni|K?+nr26CWa57sWWzzo`f
zVLy31R#Xu+0Uv?@36fw7x}cQ{LVf)qmXn|e;CHQ4HXo7z36wwy|8#jblU36^K?ZQl
z<*u|jXY3J}R=6MyXdC#MS-=zH;ki%%9{j))9ow2O*nk5g9*991hykIaAqc$zvtJd2
z2la=eff$IvI}6&J*O*j)ffi4Zv`xD?Kbr|t*PtVn7FChCSn`Jj1EV#2i6KH!+ZM+d
zdJ`E{85%V^e}Nd1EV#e9N|k$Z!9ltElC`5DWQbcZB06;Ul(k7yP@{8FkDKvkakqC(
z9gM*ha7ZtB!KC?OY32bLU0N_~kS=N(FLZjRk$}K#gB---O;n<h#Nr+hN((MQAHahb
z2ErnUs2>iTAQIdkctH!ms2gZ29<Z7&;DM{{!efKCFsh*+|HdI7fLAbdY%V?%96%s`
zFi$U7{4oTrAC?;;@@*eqd@e+8RvDwl2LtwY{B`T%7P_V`_~9FvK^ppmy$gcKja)b6
zff<;ArMuxCuE7}QftaLWZa{(;>c*wt!5EGv9NvK$?tvL*8Zef;mHZ(-nE^V;VP3oH
z9i-tI?*SW(93<W$9E`!te@GgCz|ZBv2J_*L?_zG?z|WO{dy`~Gm7oZUw=vM52C{$!
z=+sG+Ss7rHO6rWXRr|;7#u#u0c<6!`^qdz^D9H%|7*GNj$Uz_U(=D`Pj=SLiSDF`C
zIvnP>7`);gWPumdffmZ}7K(vQ)O#>e{T)`FJg#Ba|4Bm@=0P6DBOl(u6%dOS)=w7V
zQyAT%kn%wey8T8Z;}X3683QCAbRpCq13abV9;t)~J3Vr~A$sZJ9fSlW9=uQFK_@bT
z9P%7Z!Xd&9=pFh57+9J#;+q!Y!x+w+9E!XiK7}ywogiv@*U4d|<slzr;m9Fk+6e+1
z9RAv`;aaZU-AA6}52GG1=`QO0!A-qS>=V_=;Toz^&Lh0N2fiTSyCCFS-_!6L%E;jd
z!{w!g;#-O0EhHbVflUfx;|0Zl#v(q$Rpd)v>ZjhlZ{ghQ;-f{z6;k@tIinxC!4=5i
z<oSUgZb3Iry&!C!ATB=VucfAW-scO$>%pGY|6xhZ_2C{u<{p-Q>E*Q_(EI7L3csnI
z@CpCR^>LD)JY45Es(`@&6Fwts1BcKa)rB#eXn`bjo*B+N23z9ii~aGd$1QGw7v^E4
zL3#iQ=V-n{7P{f%p?>fSU-m~{)`jq<357fe-o1TXF!twt=3;JwarTFw_zS}84P&H@
z;TEbgUzlOkX~Cv_h#jV%Ag15?{lWUFAN#X^`>((IsXzPKq58c){J&rP&EFrIp&8D<
z{L3Hx-M{_0|NF=P`r)7Z)t~*j-~Q`g{^Otg0fL=CfBpm-ENGA&!GsE%HB*T2Aj5?T
zBM!8vaH2(u5-Vc#=P;wkkrg#gG+C15|HYFIn{gb7vg5&zF(IB*IWXkMjWltJoOu(d
zP?-=38a;|MsnVrPn>u|8HLBF9RI6IOI#nO7dRUv@>k2k(SAJi`nmvm)t=g^|+8Xk=
zqV0wi{tU_8kjmd(A^ynReR!9QKOuM7rMmkzZd<x`<>uY1*DYMRjPE{{%h#`5z;Xo>
zmTMUC<i&L@M{dhkZeq%%9iQHi`7gV`g9{&4J$i2IwwF<#UQN0&@7J+6&+c3s^lizC
zbqmK!JhI^C8~iPYez&r5$eP=-YexHXTkE2;?*{JNG<VtIZHsQMeK_Q{)9;dZZT>lD
z-`zKSZ!gz<lI0iRS_U47V1f#Y{{;*=3qA;8gc43jA%bnCV8=N;q`)B$=TyQWhn1WY
zVhUKCV@HXwI8$PVSd{1th#_XUVTT`<IAVxAym1Z;Fz~R*IaBaJ<P_(8LL`x&XqY6A
zizLZIFU~+2<Qq^rgJhCH4q4=pP%a52k3Iq^WRgZ^sU(v`ItiteRGwpHl32dUB@btQ
zspgJ7{<x)?UM2}<ljl5{q?=m8c_o@;)_EtOd5Q@`pGp3iCX|g5Y3Q1RUfIi=aS}->
znU)?orlfX;8mOj(VmjrapYky0p^T#X=$@u}h-8R4>Ud*_E0%a-iXl1!ON-~c7-Fv+
zW>}(!AdXjIw9-yX;Wf-q|BG$5+HTA3Q*E6CZn)x(OK!R5o{Mg}>aNRfyY9XVZ@lu(
zOK-jQ-ivR(`tHl`yU=zEaKHll^A0ZqAB=Fq3QyGxEd4$Val{f&OmW2)UyO0a8lUs;
z!XAH|mR4nfOmfL4SJ?2zDzD5kigJlSMmg|q2<HaQkXz0MCx&as%WueRua6q0&~nj6
zA1!akCoj#kQoK0WbktH$UDdZpUyXIWJ(FPv3>%F2t_?)LVKdG;i%T}wJZwP5y+SWy
zNY--CZ8R2wQH^(0{A?@DwR!&yIMr6uO?ctr_T0-ku&}K-4<e*6V%I{X;LIX6hyX+4
zV%L1Luy&M_^UmOs|DAX_FnA!d=Q8*5q7aFnV+af;W^+z9DUy)_495xqI}9np;IQo}
z2r&ikh98eSyn!#DlolgTOOC<JPfz{AgC~#u(LKLmhYcG9$wQ<Zp5vDdSU4lX6n34s
zIoZzivcVL7RT4Vd8@!Ii2FSoK|JOZYh`DksVgo$LAMXZ;h5YHReFU`20d=Op>`8Ef
z;o<>bst33{Fd+}ppw>NTkq-=taD>~s9tBT$v7WU>1Xz$+HY$My5qN-n_X8I)3_%#)
zG0+)g<DSmy7cSC)D}Tf2Vb8DtzqlcTc053xhBlB5A&3BU9$4VmYM25WoI?nxD+lIK
z2u8yxjf72;|HU7&#fx{4agA)05E(=l#yCQ(XRrX;Im)pD5xl{BG^E`ys%Qui=<tfp
z$e-QFum~WIu7*9@KsgLa21G6{Zo?QxIW8wN!eqm7cl_cGd!)rCg6@lQEG5#$*v66x
z0u=;NM=^||k5JG8Ld>{EDsPEPtT2QjrtIau5GO8Yz@`@|aHL;o_lXVI;V>TBVKUzU
zBKn;zh-|Y1VR-b+XqF>)m5^OI(q;$`XmNl(v?Av~=`t)#VFSAJr8_r<%3Ln&3$?t)
z9~xnlNHF6M9aIoGfFaL-3KS{LFa&k(au*N1bD{A9rnt!90S~OL7stG#_i{Hynz^qW
z>x4}<{}frX3z30#97PT7QsF%qq~eZP@W2LafQ;I$Gk3bvXxU((#VC4Ua_wZOPbC)5
zfetJWTDXKiu7OX2xZxh5U}b_ns1Kn^^_I`MP>D)p!k=o@T^~JHSJ71t+QBQV;}UDQ
z$SN+grppjWM4$1t3fFu&V-8dG*xrtsRDb+I9i8yof%<U^dDL~VBLvTd=I{z}D0Z=o
z6-QR%3fZmp!lfJVz)B;FS$Qo^rG!nGJOnWYX2^mU#VAA}qKY76bfdGZW!`6Wkl4n`
zR<V!GtZjXnjZ~yUt+(whx@gl{gk54D5BkO{gNt0MeMS<qZLVWCpt$3KE*r=|2I#Jf
z|K03rce~u}u6Ms1*6M<HyyPt}c&Te$^Qw2f<V7!g-wWUEiZ{OC6&HQ6>)!6l%^50`
z1Zs+sTr#3U7IzJ>flWr36vWoKvekh&{EG#L(d}kygAIfwJU0rX=E8*2u!VJo;r%|*
zJC)!;h()|M7J|6LBlb^;Pn<OmJNOvIyx@VC(vMI8R4V$=M}ft1kLQUc6iCR!jgS1X
z&oFq&{=E>`t|lXK9K#C7c(7a`m$fKQxynu60G6?)Whz_Q$yw%*l*KF#9b5>GNDK2Z
zy8LA*n|aHMRkN4bd^9&Nmd0#DGE%-V1|&E&Dq4_&9MJLyL8Rp#S3rXFZmf?-|C=n*
zQZ?*?m)zVps~H)Egz?5Iapg-(SrVJ>w9!C)AyI2uf2J-Ps=cggQnNb3rw(;vS8X$5
z<=NJImNlno?P^~4+Ro0<b*)o9+gG&3C4Tk?Dv$teSx`k5hd#?aLYNk5Ab|;LJg`21
zaSOka?AzfMYFwC$X-pp@vH3HRrz-}F7W!8Q=$`Gm#nEnHYb@U7n0LKpd+&U|n_~R-
zw{ru2=YdbG;2WSfgC#Ksd=pUN3&#RG3~q0BCtPI=ceryQE^!mDEZ!Gy_`hZAU%L1i
z7_yK8v~Mx(Y7+z%a_B@^cp->9M8Y4k07fU=5DI+=q8oqs!##v92<Zu(|L8`ac^>jG
z=%`!*328X8G@y2}s|)ooDM+{16?+UjZ-C<cde#PBaf~XbJM3~HJHO11cD1Wp>~7x|
z+|%xLwzsA3`ntQ^F+GPX-wb1ZUpw71R(P)m{z8MlSmGJX_P4AY30k-UHezlRRA_-0
za@e^mq;QE#Xu%(XkU|~`VRXueA`LqSM&}7~57o2YAC1rgDg<%Hsq`ZaNHFSwc@aW=
zgyS1WAxF0n27IGn-5<thV_Zc2^(AXs94R`V#BPS_6hu7wU?(;8P1N{@VgIn)@4kbp
zAO3!g-^<(Q{`Ap*{ST49{F+VyJ7CE7d97dj^!GmeBes9-7k%}2|9|=hF##BTDd%VW
zpan=E3$B1#QbBD-@da{ldt=}aS`Z5Uzzm}&2ySpxw-9^A;18XUdyTMj{xE_i_y_rb
z1lJM@xi=N+;Bx&GVA6IE@{kYL&~4Z-57NLD2!n(E5DqX$5IzWmWON+mSAJHoX6c77
z@rD;+cXCW94o-MyP<Ss=m<m*Ag^h)U;MXr)=!IXnSYc>={6dBvXNFZ)OcVDoYgmO%
z_=IDaKV8U%U+9KyA#!#&g?X5F%Z6mnhJim86%$AhSFlQ`fC~D61jKg>9@q&+5qks?
zg9L$su!jVe$WKf_5Ro8*Q^5;Ja0NovTDJfUf)x%s<`2fu{}1G_d;)`t@^BB`a9pkU
zim_Ndb|HXfxMZ(jXXOA3`Ij!mA{TRLhQQbs!bpthVvKEpj9;jXjx>z<@{Ai0jaE2~
z%xH~oh>gAoaEk|B&FGBYn2qJPjnx>1<_M0rCXUh7jmKz)YIZjVRu3*mf>wcudSzt%
z&_P<@3f~|FS3r7`sEM42i78l#{t$z)*A2jc1fe(;f>30Bb`4M?4f^m6#I-Qp&<(dh
zeEyJ;8%aifagOb{XH~W~CZaXxfDCP61t@86DtTuu`H~wDlQMa0G|7_mk|8&llRBA_
z;;@o<_AWmOlS0W@Z^m33Vu0|%UoOdhN(pv6X_W4Q|CBgMmEG5r?nW<B`I7wSi~d!Q
z1{MiOAahkA3rHXZI5-AZV0zBRmd{3d8+ecmd4g=I4-0vT6sZNccNO{2fYNqg-*64a
za1ZbB4)Smfw)8Rla0~jNn2hO|Bor5ax0NVoXOsh#Due|OmYIzuYhI>>>B3)a@tG%y
zlB3C)?{b<t1Dc_^Sgcu^=<=GWDVvNXb_(?_QmB>CN0qeMnW!0?xtV5i!JF>ln=uKT
zOn3~sabV=IZ6RqE^H5->h!sKh6|Z*{*RXB67+~LEh!ApoVIiKWbeYCETcl<M?2tfp
zw>WJ9Tk6SJ?CG9Qc`otUaLpN-_W7RdqM!3g|DTHGpZIAm0m`45c?^MPadvQ(<??E1
zMxO-=pK>9f1G=C(!wwGGE)j~EzWAIfXJCJT1chJ~(1xNZs-i2(qAlv8D%ur9_66hF
zY**0_`GBK2s-ruKqt|c?;2B_TF`&+MWf@{FAOZ``kOC4qq>NRh=Yph4%A`$7TNh%a
z5Sju>x}+c4q)&RJSt_MmN}qVQX76^Ic-V_n>ZMq!rBgbjWV&(Xa;9OIrYIRygr#j#
zAXruLqJ8S8e~O}D;RZ;Mf+X|~K#CPKN)^$=3ytcij|!>0a0{*=3y7+M+F2E35o8e<
zI6_LLw<c>Tz>Pd(p`V&*p*pJIqCyR4|El(es_Lk!rP`{Xs%D}Jt1cs-v#OaFat`5F
zNODo9pSo(c8e*&JV7gkLo7t<uls|0|tTK70gT;FWIYRG%k0PWG%-{;HV5zWYgioOk
z-wGkpa1Dw|5d7c@#-OeusjkLAT=xJBwBVTczznp&3;LiA>Us;6*{K_VtlgJb9D)UQ
zP;Bz4noas<0c#=zD@-Q$ub`^116!~T`>?$hu?%al6}yykz+3`r2e1H?V%n++D-Iqz
zv4Hrn3)-;@3$idNvd~%`0XB+Sz^Nhxky5~s)k6-lK$uQ(58~<+=6WDPd#*j}4^I<h
z1o5N%@HGAa46B801Ywxd<Ea%p|7CLVnRD>6|9Z8=skItwZ&(PMUkkRkCbn6-wOlK9
zF?p~fd$!_0wq?7NYg?ST8Ld*K4-Gg=Y}5#7i9y%E3-!RSO2L@MV1(pg4Al7z#=s0;
z(GAi-o&La>wd4=oa1V!xoe07YMw>>kbhsTv3%WS9%u}@*t7&b^wWNl+$a=bRdvL1j
zx*w+l3KqKn2fMYanY25gcPmsxR&{Np4__c?)U&SsP_sz!4zkb<<N$Ng^A4(2xxi2l
z@9-7#@Q_B4yvqx7ydVqMa1E^ZAe(y>yl{~YlCQ95Fy!D0gFCv*Q@Xedzws--^Gm<=
zYrjq!v%xhFE+=kl^bOD!|G9a?55O?EO!2fT2y?(-4CL^=%%{8&C=aZ7z(0Gmt3|;P
zBECk!3(Vk=%$JWJL=f{JsS((|{d&JAjKV3b!Yj<eOvt+eb(ThkOV38Lfb+B6dK9wo
z74iUc`wELtBM-(<sRR+hMxn!!yS?uUv<i~J1kt(ZOAzlMZUk%;B@8(4+rn9_#aqn9
zUEHcKEKkxY1vrdBa!{gw^A5C7o=?#r`fv*{#|(b+6+!q7J66O5(Z+9lv`Q=?O?<TF
zdBnyL4#rCmjakJ7oHtnP#f!|yjqJ#eOr-hCT6us3d4)^!&}iTrHQykDRG|($%gO%G
z58y@%*W#m++HLaS{|dA~T%WAGNsPdK%(>gjtq$C%dm{^|2n-~Q$atg3kPOVhEX>0^
zzhJB|L>m^&K#Dn=OUA&Kdm1&;01U{iH%MWw*!EA;vbp@g%{UgdDp+9L+zq`fIQ~k^
z=Zwzjtj?xt%n0)iUyvYyW|uHbby8Cd{R<(eSPZm~xezkSzyQ!y@lOC9z<=}0>x|F|
zt<VddZtXlU?~n#skO%z?7Po)|Gb&X4AkRz_X_pr*ds(9oa?lJ-(j{%u=j_k}^9QbQ
zAo<W}OB}|~=Fwpx3zqyK^ANfrO+6!h(mn0dKb^%XEihUDHLftvX5qVowU%1&%~xRz
zS1<-PognJK|H?YO)8-7+S*_JueZN8tFfJH^O?A{@ArDOOf`moMiblv-aRurSA>DAV
zR(;i6P1kj8*I?__0CNRj01S~(4AP+1V$rt}DOHT-Xyky;Qt=K1c~qA$Xy~dI%uo#d
zAlGw!*O!ginQfeTEikCS3&t?kSn<DO%v##U1cG3+Q~?ZWa1Z2w3iluftK|=oFnVV(
zz&2Rfq>I&>&D*{0+b%50QbP`c&<JD<6;oHJgvAeMS;<(@4NTw$4)P9eP+-3cWFVQ_
z)x*=j&E4JI+ng;hZjBa~0L_Cn4^sziV-SQ^aaZ#o2jy+uWUa>8t=+rr-S>^(nhoC6
zQV70h{}k$g1ZxZy7a3gYK*>yC+)a@OV~_^S5DA|w1)(j_olM`Bo!=LZ;dH&<)6(Bb
zA>d#!51QOr#*ha2Xckh972iwE6&^L)o#8JI<LbQOXo1>!zzlNWAV`%5f)G{Y@CR<t
z2=h<~kq`=UAZ@fD2!TCXMNXK;kOz$*-cb>m0ao7H63{GO-!ZP`Tb|G}eilgJ23K$e
zX%GtCAO%T>1oN=J`V<QCPzZ+hZ27>+NN`tgZh=Uk57*F^kr3ZcaSgJK<q0AWAQb3S
zYu{X+&Sl^L4p0WoH3*AN1+z5)4gdk$&{&f`0f>&!UTzjhKn_3`dV)}GX^sjQXcUF;
z|GV5~ymU?ws7?^vR(q&GWE71Q_aJG7eiR{Y7SV(2?tAE(PRvvQ007Vf%~b}&ZUVC<
z001BWjlNi)u<QZ=>@ptQ*y4$Da1Eh12COs>Y2FF(-QoTq1#az#b?$rP{s(Emh_5{r
z6yEDb!3^+h7Ki!n2L0>P9?Zf{?8d(A$u3*V4gi_HSR63y(vI&aUG3Cz?b&__xHk{H
zrw-l;bNRpz;XdxGZtesz?ykVpM|HeS(G4@*Y{l?_JJ$(2_6<8n@@}wm@*oRZ5Dwwc
z<2lzsp}=|4AP2X;6wq7m<$UnytnbA>TV>Gi%3kozpjg`g@CN_$!p!MnvGAcM{|${6
z3ReJwQh@d3&<N*F?rdpPTd(nM{Raa%2F&~v`2f=gmJdvT3ZlhxwJivdu=Z^)ZK3c5
zOppd?&<%pw2(rKg`j7@=USw&>6oB>NJ#R8D-t=4?^!yG0{@z$i@9cxH^o#HG2`?>x
zs`-Gb+UxCSWBzDYpu<w2MxYPx@_w{P&{S8j+NjV8av%*L2o)bh>xgeX_ip)%-1tLZ
z^#9K60N?<MH37rU?70ujPY)KGulz4c6;^y?_izb&9YUH{<gge0Ul2m^ZWOL?1?%1o
zX&?=q&<U}x*tbC0w!burZ~QF0`?5v!k8kt^-wW9Q@WsFWj*R?)qZKtO{||$#4*($r
zm_L43kQDPLFPuMp0{xMbqR-zwa!k5Ce3wRAr%uw`_yZYI<Vb(r5RychQsqjPEnU8Z
z8B^v=nl)=~*dR{lPM$q|{sbCS=uo0XjUGjsROwQtO@&ec0H6oZG6DdY_-Qq&)T#rb
z3UC@$>{zm8&7MW;6Q@nKZQZ&BChzTBx^-oC)1u`{8h#)zX#t5>FJF*yu1LA%50#WF
zT8z25)+v-nnar-)#hh95X3leQrUe~Z^k~whcS4m))hbq>RwY<X-~fPu1OULA#+_UD
zZrp1-{{}vi9JAoXjgv%@T={b5&7D7=$&1`^>ea1V|IAzacJAGe|DvAyv+C8X05U+Z
zZIwpt+ui_!KzzU5zlWdO_jUR<`N^uEzwUGX{rS(-hn9NuBd|aNS;{Ux1s7y+Ebvq#
zuQl_=vkeyZ8pJR|4TYNTKo3VU=A92mlt~&9>67P{zDQ)TMc@+LFh&^}d{DgA%FAFI
ztr!sJ!Wn-AvbzplEKnWdh(yvuat2DWNhfK7F-R$=B&|lD#$&A~t1=KL1FNX$(Kaf_
zBonP6pS%t~G}o+-nIqYR6V52hq_fVXP=mk(J@qU@r|}%vlTUHB6lWVlb@I_pMHl68
zgE+5aX1Yfw-3*w8D8<ypIT_`YQPj5DN&-K%0u=xU1~t#8L_1|w(f>0u<?J0}V5QY9
zer}PgR$cYmv{hfJgh~KmhXr5)KhqmlSO~;1000hrVnEnmrzP{%UG0)(#cQ{1=^k1n
z;x^pidZo5pbI(P0N^8Y!OBzYpg*PN}c!{@OyU0y9Uw!xGcei!zl}R2Z0cQ7_S?g2h
zGJ=!Dw_k@JhB#uR{$2Q`Zz~qJn2WBP=N4cT#+b#1B__FKlli4M<dv@ZM&)h$x#dLb
zZUNWj5l22bXPtLuG-aDfx`*DMb@lch>-eE%=$mumxoM}LrqgGoL%JoOscC)ZmVT;}
zXI6dW=|*OCx-t6d<8X#LZME0lPU@?>+1PAMO{(r5S&Y$Vy8pyLB8Q)W<$jTAwg)G?
zaQPese5HH#PJB{hu2HAv<M^>mBy!$uoHMiy=e%>ziE{gDUdqlqPF`ZZ4(5>FiM#a8
zHvc?!**gz?>Tf`H9nEfJaRqndiuq<%X6|F=q}(%ueRk!Shq`v913b>e<LA=n8so2P
zeR|{tXTE#y*>+y(xQZjk6=N{h{y=S0TA!x&(^o0^@8_p~-|&YfN1EdFVI2PY_{kO3
z)UlFV4DclY97zHFham3N&w&qo*!_NXpW+xvULyJ00)sOTp@rmqBl)08I0!-wu0(zi
zL}3c;B*CABC^*;XhSj>kxO+&$cO|5WJlrIgd5}X^)BoXzI(U%}tJP2%R`W+V-ocD}
zFykFYM4}O;aYTZAgBjAeM-Yct#3>>%Av^SkI^Gcu7i#Z>Dnw%%fy6?a4d)#ptP444
zaiqW9<Aykli9Td;Ia%aQ7M7C5J;K2YSrnrfS(FDaa%GHL6hjtn0-z#60ze)1(I31B
z5iiC_NJAo0k__1+Ir?~wyNNP=XH;V<RmmVWs%#$LkVXH3Q^z~v@g-ygi7~=K4z2ma
z7%dy2NXF+&a#*n*2OB0x<ROcB_~RW(^G7j66wHte6PLaWhxI^W$?2hTmEQzs+Ysl!
zYq+9=!BNK^{V}|20Hc|<oXIux=MNhW2P6ulCjUr=X^eY(;~V!tW&rJGKx`aIlm5u3
zKZYq!kk}B0+mxK^yctf4R&+G2bQv}dMxA>Y5S}%uhl*}h4||GIBKc5LH5b{>e+G1t
zw}_h%{ZY;VqI4v~3@JZG`cQvx^LP`rXi$YZ7L2-#bRTsRGi33|hqyu(pY$ayWN{*3
z+|8H$3<p5<Y1Q(%!mH%y2QOUVri~dxs#LY=I+scup87O*Kpkpa<$9E&A~iD+waGP(
zDmQzQgdba*3t&a^SG$q~u5(3fVtZ28#^qzLY+=SNQi>ACV$c<MrO7+a$=5d(wmyed
zY-s1o*u-_CmNlWEN=!Qv%+`b%*)yA9J^xD|(2CZ!K_#u+s>ci>f<&*(Fh*bOc*QV|
zv5dnph5=IxlHuxax4nIb4J~I3-WHdPGFu7Kyf|C#vZc1S1ur;rYqrQX5+VFBryTWR
zw`;t^75pIO`S3FjX38U1%Vn>7DR&F=`Xe9i4T(Bpb`5&P*OV?<Qg;<>lND^>7~zF*
zgvD`;4Xj|ntDU4Pni-CMT;oXZ)n-rifl@4bFr^*_$$LxUJ6D86m)o@CN!+@UVxVuq
zH)e?tHt-4w_t>_t*nki&46@}a6o??+m?iT;$|Efo7)S04hC|X~eHw7UNp3Ak0+eMO
zcNru)o`a9YoY*;Rzz_>2$3}}RPyc=t<FajC@7C@?<>j*3%@RrTNT^(rS=nu-ScXaP
zygX=>q+$bB7;~cIs)G%rV!^kPtUiid52=RZ7WIHLFHfg1^wQ!ol$M312Lx$uI`ty_
zAf!6s91~!8l+c7`#|BcMXj)rzyouv-OW>#yF7Fy9-jeOBy{uzI*V@>sEHfE|jj4hz
zo6yaW^@EQ+Z586A8P28@RIz<yG8~%P-+myYmA&mpb&T9Nj`aq@3~qLJPZBs`$GIPM
zjnm5eqtH%)B-*`i*#UV2*S2?@Zt>WFBh?T%SvS8GPPj5Ry5Mor?8CWx@D1pI#|y{!
z(~iMthf5qzul2ZRp)G4GT>m`dCokDCtbmh$ha67Yb-7*HL2;5x;uSZ?dCqmdbDsCy
z=RXH}(1kv9q8HuhM@M?nmA-VQH{Iz^hkDedKJ}(cLK1UG0n5i7b2cTI>qun>8Fb8Y
zvX|ZLXGeS5)xLJNx83b;hkM-RK6kp;-R^hCd*1cFcfR-C?|;Y13dj)eufwUvg_n6M
z#4ZHJH{S7&hkWE4j}snL-tw2neCBz86Ulep^PiVI<uyNg%yS;}r$_zcMNfLxn?Cig
z_x$QvPkPtG-u9E<!0cyV``h<k2p-sg2W+7G%)<aDBJh3hfiHaGW8U~1K>q8=Kn6nq
z9Px14^7Xln6K9;m`~TkufB3@>i(9`0C*ntc`pe&v^QYha-(P?HHt>G>pCkT;-9Y#2
zkACux^EhFbHT~PabLc-I`@e2W0Rh~<0@OZ&5wr#jxduzX0R%q=ypHyxK=8Xi`OCoY
z+d%wNzzpoa<B-4*TtLpd4gj3M6AUuzP(c$+KMRCFducVg;Dum&5`EaL86=Pw6hRcE
ztqrh)4)ngw^S`s1KO*$L4;+aSBtjVs4j-gID69@Cd_O8YzyPd2EaX9P0k*eLDkfqR
zeE^1A=&UZ(4=bcUE<BEr8^R1ULhGXroOr_yG{P!GKp1pCHtY;Fyh0$X4?i3~Kup0r
z{KFPRLwjj9xBsx9IB}OmJP<(?KR#?jI;6ljqz^Z=Lu+$ELu5e%#6vAyLqZHhPn<+j
zEJRT}MMQ+edeOF;xCTiX8`2?%ZpbwP86t)Vhn7*MuxUl=ki_q!MC#DQ`oqNfD8~Ie
z#!ghlJw(MUT)`N8M*0xMVT48#w8meo6?1C~V5kS9=^G}=2YGmhdMgn8xCePyvJ=r8
zZM;TlWW@qW#`If8WVA$M<it{J##IDGYBa?`jK=~|!)$y<VVp*H+!lIk3ufSjjkz3=
zkcM|^5s#6Ja2OcMF-L^7i)uVbdlW+VtH=D9NAwHHRE$P|>_>e(N$(@bP+Y;5EJ&Et
zNK6^H?f<d~))5I`e3DoU3Dud&DEvp6ti+ELzmgQmdnCzx?7@Fz$&PeM1r*9_jLPD8
z!KwU7IMFO=@HJg~B!pmwd6=VlLXz9zr+0V<;Mu6F>_bnq%HkMFqtuU)EJCFe$e?se
zW_-!JOv7$txs?160PIV(gcp7Y2U>6if~$#+Dvo=Q$h!E3trX0<s7k$zOQeKL0(nci
zG!Q9l%e4%^&NL3d^ve+u&B%n8dvG)CA`pJKht_n>*L+Q0D2B!~%_jj&%EU}dyi9qt
zOwEkMJOoY849q48I}1ya;;hYh5hEo5hURq6=X_4y8J(AS&6!}$*1W~!go)C0l96LM
zIsar4P2A0;B)ie{5bksm!Xr-YOrIHBC&{u4zi~B|KrdskPkORXV`!#(00vKEE@q$w
zUeE`1u+Lk_NcMaQ<U|wi1kV=nPTwR=zBJFjBm?6_&<h<A_aunPdW-BFtjUs&*1V^_
zkq(8ri0!%^40Q|jT+o*5&hI473QbQHrBUE$FJ?F<Jfp5CDkw{u2g?ALBCC!fJ1CIg
zAHLBaTClMct<ji+wgz<(7H!fgT^RG>uk#VGa-^34F_AtRsBT~qA*Bu?jm7C8Q0AhS
z^6?!erP4Na(>FaHS;&X;@uwH-se8~Uh$1j@2nRaj&@lzk*Sd&2n+Ry)AespYHvfgw
zMP<}RRT=!?Cx5Cze~6i1f~exT9I)EZ{{c~%2^x@CB4Gj<MRn9tHPuty6-Z^NZs;@o
z@UVU`hRd24=9;8Got#b;i9o_8hVZRXJy5kIth%60R1FS&FjmL}A!GGWfKgVOP*!9m
z)(=rte?qmTnvTVhh24<|X`lsK0EWKkv|r5(BK0a)m=00m1zzZjSZdCiAyxK_gfEZ+
zVMPMO{1CFq4|%Y$lz7PN*sFf!*L_uqy}E`0(F{BCClT={e*%elptpDGCzf$0f6}W1
zxrX;42ZgL4midNy$cKfMlx(_`Frv3C@+Y{7)=Yuc)yx*1N{N2ht}OB(e*cg%484bW
ztqX%il0Oj3>(Eyu=~>Lk2iW2aL4wG9Fjj)N24lV0nKBy5$tsHtA#r^Rbr2|QIM#<a
z*XekNmXR%eAlj7Wu6}sVnOKtM<V6*|*_@1oP<SVD2!%$t1b)zmP#}j$5Cnj_hFcH>
z;kkrMaIwAZTi?2bNI-?Vk_ADC1Rn~8kk}(VQe3W;15J7-U?_xdNfA^iq)5<=9_j{3
zc?WVR8-D0oNx7V(>LGGyroI7KncxRL&6UXUp-GYkN#h&QWiE=i2eZ`LvdNoFU6Ifw
z2Z^W$Y;f7%)fS4t-LIht)%>-Qr6-XfDZZ%(e$Yyih}z#!2a3p>zW-2&zL})Zz21Bv
z2XzoEs%1ohYMrKqFRj(Guoc_*?XtDyn=2>=RLBEox`Ix)1|)DSBuE2b&;oe~g)3+T
zUO)oUWd<Y&i2^?01ZIXSc&abR3{;SVaA1Z38UuuwhlsFX3|5DH_=CO3gU00rjVJ_E
z_y#111SI%_F>qc+#D>&;h^)c}tJx)eFxch|uo-?xX}|_~_=Xs632fM2y|UhJkcS}t
zSZU~nj-80vbtZRlm&@Sc+|Agn>4vN#8?fP6iLfItx(55QVi>|SdsQ6hl?Hj32XM@l
zpUqg>%-+tBhTCBod9b67!Um-k-HWZBdcaBFG7hT^2|JpHdH>kfkZ>-RSs$>K-$#Bm
z`t^rUNQ2Ws0)6O&MgR%_y$2*{nW_neKL80SXeNGOV2}vqQJx1mzz=nxV9Wr9D?o+H
zO#{UM+*qFFkl@*nkb^?tg-(!zZx{oAkOFlO1n8X$D*9Oyc_k5vW0Bz9hO(Mvo@Rkv
ziRw|NzNuYjx|E=e=Fr7vg^6b7x`rZBn1AxG?1`al<{La#m~hb9m@ryJHp|t0V@Yw?
zv`r#3rVFhM2XYMETv^(#^)1rvhIx<&u|(gtAY^hj%Y10xf+mP;A{|GD<cr2JNsfd+
zNY^2nT>s)^oJD0dxq?zY<w+*#4xSEdcxBAMhC*NhCja?@V$cFfdFhx2i9dLgFSvws
z1%_`B1b+aGW3~%yb|$b|<3lc+c`z+-iDsh?-RMmSYaUpIsfTWe=zjI)6L|-D(1(Q(
zXPNn9P?Z#X9omst=cDGE?d3()rHOfND3Oo{18Qi0=rGcmW6rpYaQGV5F<8C&27!Lv
zZ#ZO$Txhna>w8$=kieZlW(fGj=*WgANiGJ$0IR<hVI*i{kw$5dC~1N?=}<^%Ilz@K
zXz9AR6j_i1kl+O-$loN|rq%X`NWc%Pi3HAl2%r{fe;{hRsNEWxj%#?QlL84P0#%v$
z?MIxapN%Ixd!x&!p0Zh5Xy$6K2J7QyY)`$2=>Hlu-%0Bw^DW0}>tS^XxRz=oRha1x
z34ASXex8fH?(3+==BUmeeqd@NW$Zy#U(1n;pIs5f4hf5v>;bo{PSygz^@qRE0y)Ts
zaL@w8_=11pY|-{?lhy+Kpm2XEX=7jvSr}%_=!7pwgE2UgevpEL3Gop>l5V(yG5Cml
zkb^JKf=CF5pdM<ft_gJjVs)5~>Y+EeFfAAgUX9gpBc6`s#_^O$=!ddidXt%Qgd9*+
z$ga+tnUeC$Na!hw$dYguDbA*fU9n5aSf1=B>V0c9*7Cj>^XbS3C;nWK$m`93Z~I!Y
zHD(BTDn~V^x45Y%bP^~nhi({}?%RQzivNae0!MT_a#;_e3$MPU*UpTix`q!gWRhr1
zn<Nq`u8WA?l`>z6e)w9FKxd^{&g>ej_5tujSM>$*k5+f}R=0~+mv!hkkm~sclw}Jo
z*Y#cJ^<MY&UkCPJ|8<*CY`95slBh+v!E}{j9k?OyYlfRQU-fC%o>{kcS&#K=zxEN)
z2OOLUVF&kc7x!_WB5F7Hb4T}dSNC;i_jY&pcZc_Qm-l(6_j<SYd&l>D*Y|zr_kQ>H
ze+T%07x;lE_<}e1gGcy;SNMfz_=b1*hlluxm-vaN_=>mqi^uqk*Z7U+_>TAZj|cgX
z7x|GV`I0yJlSlcKSNWA^`IdM2m;Z<Pn3wsPr}>(<`J2c2oY(oC=lP!Z`JV^+pcnd~
zC;Fl{`lCnsq*wZ-XZogh`lpBbsF(Vwr~0b5`m4wKtk?Rj=lZVq`mYE3uowHWC;PHD
z`?E*;v{(DJXZyBy`?rVtxR?96r~A6M`@6^cyx04^=lj0*`@aYLz!&_%C;Y-U{KH55
z#8>>qXZ*%@{Ktp<$d~-dr~Jyd{L9Du%-8(Q=lst1{Lcsd&=>vDC;iel{nJPN)K~r0
zXZ_Z9{nv;6*q8m;r~TTu{oBX=+}Hix=l$OI{oe=v;1~YkC;s9${^Ljf<X8UXXa44Q
z{^y7O=$HQKr~c}<{_Ds7?ElyP?dSgP_x|q(|L_<8@hAWCH~;fT|MXY?^=JR~cmMZ?
z|M-{x`KSN-xBvUc|NPhg{pbJw_kV!!CvYIaf(8#FOsH@n!-ftYLX0SJBE^apFJjE7
zaU;i$9zTK%DRLyqk|s~0OsR4u%a$%*!i*_%Ce4~QZ{p0Ub0^Q9K7RrYDs(8(qDGG*
zO{#P$)22?JLX9eQD%Gl1uVT%rbt~7dUcZ73D|Rf|vS!bsO{;b-+qQ1s!i_6;F5S9z
z@8Zp?cQ4<*e*XdvEO;>C!iEncPONw_<Hn93LyjzYGUdvaFJsQEc{AtEo<D;QEqXNR
z(xy+NPOW-1>(;Jc!~c#gdp7Obwr}Ikt$R1`-oAeW4=#K-@#4mhBTue;IrHYupF@u>
zeLD5()~{pFu6;ZA?%uzH4=;W^`SRw^qff7XJ^S|V-@}hDe?I;C_V44*uYW)P{{H_1
z7@&Xy5?G*t2O^lDf(tU(po0%W7@>p{Qdpsd7h;&9h8uF&p@$!W7@~+Hl31dNC!(05
ziYv0%qKhxW7^93c(paO7H{zJ1jyv+$qmMrV8KjUy5?Q2?M<SV|l1nn#q?1oV8Ksm{
zQdy;yS7Mo^mRoY!rI%lV8K#(Hl3AviXQG*=nrpJzrkiiV8K<0c(pjgScjB3+o_q4y
zr=NcU8mORy5|dh}p@$-xsG^H9+Nh(CLK>;0lTuo#rI%uwsivE9+Nr0Xf*Pu*qmo*x
zsi&fvs;aB9+N!Is!Wyfrv(j3tt+(QutFF89+N-a>0voKb!xCGpvBx5ttg_28+pM$C
zLL05L(^6Zlwbx>st+v~8+pV|Xf*Y>5<C0shx#yyruDa{8+pfFs!W*x=^U_<dz4zJ`
z5C9?h1PL7g{{Soi000051keJ9000082L}ub3l0wu5f2U$5Dyg-5*Zd19U2)S9vng+
z2PGmODJ3H<DkwBBEIKtZK|44-KSX0cCP_m+Oh!SJMiH1t5J*c=R82@PQjc0wPBd7N
zcUeWnS`lSjRy$pkv|kpjU>nC^8ed~-ZDU=?V;)6hnyqCdNM@YKW+KUHCQWOdc5G$L
zZ7jlWEX{8)dvR*baWhtOp}=x8e{&~UcBsyFI$d|AnRhaCcz}a=aL{=@gnBcedN;#+
zKVp5W(S1YheluQwGmC$Bg@8xXfJan<HEV)6c7i+8gG|7LN_>SulZAZjg*{q^J8*`r
zfrgLNhf;2cwO)xqbcwLWiBi>xR*8#B?~6xaj755kOPY;?WsXVMj$3JwO?;8J#F1Xu
zkzS3Ho|cnX*^^{#lv0S5SfiDT%9Uj9l~~l4W^tEShL^Y6mucIXY;~Gkg_^<3nrok%
zWs97;@tk9kon?ETW38TQ+@53Jo^-CCl+B=YexYWfqHpq|Yl5U~oushPq<i0_e21oS
zm8Qh7rg!tEa^R<cnyA3IsGW+bbm6Ik(X54!t$UiS&A6?DzOJI;u8N|s#q_U%)v$||
zv4Z5Wji|DPyt9hLv!|G}hUK)A)wPtYw#oIji=DTN<+qsWxR&O+oWi@6%)74kyOX56
zld-(g*SwqJyp-#`o#?)yslS-7zuNY|o4Uc!)WNjs!KJIhoZiEx>cp$}#G<jrquIu}
z>&UOR$*9B0)X~bV?8>v>%f8{uvbxNz^vtlz&e!hFxxLS^z|pnE(dW$3+~d)^@6o;G
z(!<5ny35q#($w4R)Wr1Ez4_F-+19}E*2BoxzWUd}^4Q1g*~-k?!}{9A+1uap+|1P7
z?A_hr`rXUY-pcgf(beG2_2Jal;?U~i)Y{|o+vL>e<>ve4*68Nu_U7CC=Goro+3o1u
z_vqf`>GAyO-Qw!q_UhvK?BnL`;py+?`S0lJ@aO&T=k4<9`||AZ^zQTa@%;Ak_WAYv
z`S$<+{{R302>$^62^>hUpuvL(6DnNDu%W|;5F<*QNU@^Dix@L%+{m$`$B!UGiX2I@
zq{)*gQ>t9avZc$HFk{M`NwcQSn>cgo+{v@2&!0ep3LQ$csL`WHlPX=xw5ijlP@_tn
zO0}xht5~yY-O9DA*RNp1iXBU~tl6_@)2dy|wyoQ@aO29IOSi7wyLj{J-OIPH-@kwZ
z3m#0ku;Igq6DwZKxUu8MkRwZ;Ou4e<%a}83-pskP=g*)+iylq7wCU5RQ>$Lhy0z=q
zuw%=fO}n=3+qiS<-p#wW@87_K3m;Crxbfr2lPh1&yt(t|(4$MAPQAMI>)5kv-_E_e
z_wV4ti~k=_zP$PK=+moT&%V9;_q);YnoqyJ{rmLc>)+46q^J%61}NZw1PYi$e+VY1
zAVp*p=-`6@#<Spr6jnHp6%b}PpoA87=%IcX0+_-MB$h~G6ejMV!VWEL_~DB%rWc}y
z8gdxpjW~KYV+<#z=;IDi1leMQITmT;bvxRi<dQbT;A9Ier0}4PM^<U&ax*63BoHyA
zuq6;ySV4vjQ(kH2nZ?aWBZO3<>E@fbb+KlKBD4wTop`#IjSW!tDMAM&Kp7yEC3GM{
zpMAQ)5IEqJ6iqZ3WfRRlBGD5~qXx0Vizw)n6wjr3hAOH;JH)_?KytPrP&O^>AkjVm
zX8$u%JOK7{Q4AdjBT_6K0AY|D0`4HINSkzEMMCtrvB{{+qPfGV0<qJAjl8_@YOEvS
zlf;3y=DKUI1@Qu47j8%y!$`#*i;$d_H0!RFc47o;2g4R5iW`DJDiA)j<e{vs(L^H5
zA%dW@N+j@X;)W%Z?h{G74vPZLB5pwI4?GmpB1|Op4utC}6t6N6zy5Awt3T*0LPj3A
z5Oi<8F1ry)vAz-{2)O?6l0pmk;1h``*$9#cH8I01&^`)tED$x3Kzneb=?a95%7=7{
z46aFt>`yk4D2tCk^hB~sEN<xf?%DiVvI;v4ZL)|n56#=LKuHKFia<LE*o8lf2>+N3
z5QYXAg+H`*&<{KS{t2MS@JK1(vIXHPAQ^b;O}OF!LSA=(cl)z>fHe=qYX>n1g3LhR
z5D4w(9o&u2kO0QwPb3{s?oZyd_!Bkl0j7XY9-#a4U+;~2BcLE?C;uLqq(hDn;2pFO
zi9>Q1L<^wE{8z$0)a(ERI{&4>H-M2W;t$|4c*8s4wIbeu8|c(cIj}7tQ)~y$drW#W
zyl2z>_u-peui`-qARzC0CCDD2_JIrli9#4H3f({&6d)CxE_KF2M%`NA4+JW3dpB!=
zF#4tf0oo3Cx-*tPq98(W6e=3%0Gu1Vferw%EN{LtUI)4miB2i+hv|uefd7g>5VlQF
zK<8>m^#}qy>GjVa_=rUwBsad$0j^!{+ehIJ2Ozc;YjA)wpFdi(EI}+O8n~LCKmH`L
zC{7VT9RwZ2{L#cn^siV+1fB#35{)-T2!oAkU<dY5$NmBC5CXvz?ZQyG+(peFQ`=nb
z*d@FUlrU!i+J_F~1;kE<CvO2NfrM~@s}$rxAVL(7*%q?IfdH!mDTrkXnt=`#0BUpN
zv)%bRAToMna*J8?2Pir)xV)*6Ov|ER2WWw-&NZ`^w}j*DVCSk=%5s){s~PR~7>PER
zEgJx$1qLNl!w$s5nzC#LuJR|qz4?Poj#ObPlTfHhcA#C`OeBEdq5nfq`m;Q0;-Ehy
z7dwBnK|m?sWI<Xfkn6e1VYJxCAv$m%aCRV<0|8v_d^t#9O7lO1yBQGnVbNt}gFf-V
z)!qs>Fp6#sj>u>lI4l7ma5&T-5Zwo_O7OM1?Xhk#_?ks|fkBZCFOCn5L_{%kEOdxq
z2lOb`f%fsIcv``t@EGGV{UN962~t9|6M;XBC)R(O6+GY=QVB$MJpnP29n9+h@{|am
z5?nJI_yEwhNY{_>31Ue2=$onpqEUZvREzEVC^7vJjl>0rodX3>m!j8KSpF42_*jLZ
z@*t-c^dqkn1?p!DRRYQFQCt90>pn2pD*!19w0n&~KTz8OTmMo{7~_(hRSVaKRNk#Y
zEg-`_a3uoCO^>W+O|Ey)5s5>1L!SZ~Y&<OChL$;`9|a;B1OWtuM(ra+EbIU;`lcwt
zZWXkMHC*8Y@*j1HA_gKLL)|(@5M1TqPc4wucL5aMQ(aaBR?ydWdxa@v*ir<*+M_>K
zVN33I3WIVY=GXi&;O+`!6Mqsx7dS-0y~cBIk&sdggm~N38a9<8P-E)Ks@xV|Cl5(z
zfenDrhEsj6e*Ulo3zbBM++l<slp;vaJ^~6ds1a8dJ4jZAJmG@G<75N@vO$)t5PbL$
zx=?KLK%`s{DvwOd2eH#WynHbin^`+;C=`K`5RXVCq5liu@P?WP1cbTiq_NSH5>I)8
z!87~0O0OJH5|FovE<~XVVc-Qi+JLzLx#}mI*ul=CVCS2}V_SdDbdFLfAS<wg42}~J
z5NJV-P}fzVnohN<mBMKNsURMpERYCj5#dmxdeykjHBh>sf?oIf1%-Q19z=1?Sl(LK
z$WC@og6*JFD*M^cHVU%~<m_l$``SE-hcLFy?QRRhh}aIdxW`TIa+~|y=uWq~*Uj!`
z^&`j?*$2E00_Aqw`=4Y;@<pPgE{e3FybT@MMbUzedTZp}7MV9r<<0PeAe<r$Z}`0@
z9u?ef;&d9JMZYH^Z-R7S!g)Q*Dijw5aAyPv0{=CLFy@*Narroo0|N6vlPHn43P|P@
z&$&^&QMWv>Tq3-10~y4qae^R2=*ZiLAO=mTSO`PMpy-DiDt5HgWdj{O>i{^&Kn8pW
zgBJM~gc`Ndk3)$9c-77bix8qhg}8hm=-32JTd)a}8N^8xiTm8^Zg8FZohVDU$SP7`
z2}>lg=mOE%B0#}GHza`<Nl=s<O0Y7@@uCZ2)L^fY5R1IV02G6!U4uZ)6{@y?7yA%J
z?jQ(iAec=Mc6By2!XSbq5G@J^f=3J5wRU(!K?De<BY-Feds8N!OAUJYKwOH`FxYjj
zPQnM5o?HA=?xO`=AQK}E!u-D`AqD7&MgI!`ETL@VO;~?VzfBA%5Oi?83r&s(8M=V+
zyMuzUhwnEKrk7TKq(D~LAU<v|INo4gf*?i$@p1do0jHBRWRMLd#9~^}HvnP<S#>=s
zAP6cTK8-~#tusc_vor5>E;WQaYbOXIAPRMZ4%ZU{w9tXTayL5@2`!?03CJx%<aixm
zJ~7Y&b(1?V*gErK34o(79>*=fvIAsLb~_+?o<n$0qJB~+6XLZhxswDh*JI#tNeiWQ
z{y<6%)o=6yNjzgt?1K-=QV<8|aUeHvn_y&?kPXKofm+cFdC(%~ay{llJ9hX!H`4{+
zG(A{1f+!<bx5GjG5DRV4B9Nj&!2g3UJJeXyLpwI;4=x2Oz5*-fB01dhh<^wx$MPTg
zW{F5RhT;+hix5kmw+MNIDO320DuFn(5DU=qI#<>Lol++U5d*6L4kFk={k8*}fDTcZ
z1npu82a<+1gMj{^0z{K_7Y2uNxJFzN4K@Hdc|#9+m_o=fdU=oso6rn9xHUw>Cu3!Z
zYbPf{*8z=qEZzu?4YVvYRf(6#e8m-6xY7*%@Q#}RE0n`4qsV-~LJyUc1mBnkH53B}
zd1bKJkS0MUU0^Hw;Ccjsi~fgm;iFj%1xvCM3nEYgi@-tAkOFoEDatqyH<JP<6A2}t
z0(lT}y3+;^GmUh375$(BCI28a(Gy24@LnYlM|l7WDX=Um(34Qo4?ox-Cdffi5)E~8
zI>p5c*AtXO=?{Uj3AjR!+>$pc(*dXCB=jHxHUN}D*^eEdDgeoSrT8_p@^~shIX%b=
zKwtw3=a6<867UuUynqkS)hT3v4Er#a2!V5OM=7EZI>)w9iP;s9Ct0#`J!H}Xva=5n
zmIRa{m!zXByznO&f=DPQJcUv>%Yq?vS(%hV3oY`4YAF!#06oGrP-96uqClB?C2wcx
z4{2Et0;zzr^C#&;VN#+3vU8WjSrWX`C3o|a(LgTNB@rzE1WBL*mBtqxw~-N55Dzyp
z3zZNGN00)MoktTlegB7@bx9FmMwrE!o*@wp0Cy4S;EIQFJ(Z}Q^w}8b=^3k4p7pt(
z{Mn!W`JVt9paRM)1HwTE6(G^TY^uUKpCTaU13MQrIt3*lV`m%Hxe<#wpc?8B1!@kp
z)&a5L40>Y@&;uaOAfaAq4iIV%G!-D0U=9W%8u>;MqR=AKNf9kDpM5c-C(#TUx}nJd
zAm%WnL|UXqdZb92q)IxZmf#M!`56{he-aS`H#!kNN*7Uj5|0O@*CC`!`lVnRrb7xi
z6`C15=aoMf5mX9yc|Zn4LpYJp1#KWJhY&PT5DnR|3A|th=Hm@hhbeiwr(%Q;mLR8Z
zDi>$!a}XB^QUCCO=umAO<1mdXD={>TS+x&~U<IoOcDx{VT$&tW8mgjdq`=bwWr`Vr
zXAx_PQ!O9}v>*cVW&>8h3pS8DF#wWTvzay!3l>BVybuEzr>ne*4E+F|xBvuNGZ(2!
z5sLr>)PM_(5(BaW4<Zm)&I+yCQd|bfRkI4LqE|cO^Qp!W33)K2z;Ld>Fr?X#4Wk;W
z&Va7$I;5pKoSMOYsyZy<0tz+yb>WJI12sLoa8e274^}XoKoG10Td=|)0=Cix$toB2
z>VEU5WxSAf1u=4qU_|f5H;RI>;I^eWC08mab`KbV;%Xd1+E_ravP0ShUC^#Yx(Q0^
z1}j?vGXG1Yd7xmIQH28G4G~EY(ZF?NR$s%i3Oy+b5+ew<Q>z12FOY{ST63_8$1M)4
zV}$jvaly0MaD^||H99*G$bcc8Bbh4jT#zKTbOSByfImpPF>yGDCtDmT+W|(pt}sia
z^zx-eaI;0~4oPsTlOc<=Sh0pvk@O%6+qa9u;#7@-4g?fbHzPZ%nln@zwZU4syudSk
zgSBrVxV31J1MxQr@uoz0VK_s&HDhE@G)8R%4l@b2aXTDyOQhW3vY{}f+z<x9U<H6k
z4P>ypZs0#;Fr=!m3ETh-%LEM6U=FI#1x4TnMY^{~+M<JX84!6g3_B3Iw>30(clRhf
zJO2{{&43SN!gbR#xlhYg1}g%ClfGRL3&m<IoL3jui&GRy5Tc6^ci4kIR(3wNzd0&3
zfijk?Qd^twy3`oE!ZEu<stS=eq|^{S&FTgs+5(4Q!Ol<u@=6A)aDF=wha#{DvGAfq
zD!oSvJy+TnQfd(Mmc6W5Lg4Ud4xwfD84+295B-2+TCu|MHV}HrmngF;Upo*~@~ciZ
zWdxDJ3XB^gYz~cOq*DjMAZiYW&;=qI3+4c08N9(mnzuu`BDWj8d|RZ9$QSi?#smRn
z%tWsWk-hyOAuX^E!eFs1QKMGS0_|B8Xgm;m+(FX15yzPV$w^^JAOd-yp9H}REdOML
zOPn1;`ou*V#pV#fLt4dK?4edH0z=AmUA(*yoCjXQ4JACr<`4_+fDVjo7vNx-A^;AD
z5C&A`%COwZi!jUHP|Ne8O9!!Nwc`!hFgT(>25kVJF3}Hobrh={%df1=vpg}jjLXCK
z5$q`u^iZXZEFBC?q>@a@RBXi>ObaCt3fw?1p-?+RngUo%4bhOU+)x6lFv>;BE8L<N
za!e7iaK8=_32fXK^*j;xyh<HW!`ECM**v7ck^<ZSPD8o~RtzYnG^9Wk2E&`hcJ;eZ
zq5?o5#zZ<gseBjsFp3Uws1G5~cJa{^A<_elCUg5J(Ez3yEXqaN(niV+GXHH3*#Oh(
z91TElvmD(Q?67gB@zW`7RzgY*PU0jkt-*Kep-27B=5Re7J=9Xo97&MT?OM}Iz0q{M
z7x6<C7wQm7{1RPV732BUQw<!Y8apBiI_dDCC#pB;0HNv7q5xtE=^!92kPc~WhAPo_
zW_=X>+z~uF5ni_uH9Cfa3D9Gtqd5`SEHT(2(SHTODk1<`XU!YD10V?+qX!xxcm^P<
z0-?AmAhLtk0#r~2K{g@*lLYZ^OkvU;k);!1jU6$$20`0NEEKTK60#lHDOV6DdD#hq
z4zh|2Va*V%JrI9w6hh4riJGPkK@YJI1L#n2{!piaaHnu8r|YVxeE%vn1ITid+h*J?
z-PB!he(DCUC=4#ED}nmmGtt~D@!S&;cVf2+l%sS^2i`HpURKbL0ukK8-5<cy1$jWs
z3GsDdr$)itWB%P^d9`(2Cv{YZQ|iriUxTTd`W4G65u0EGwU-3Xb*qbzHGw&+wJNL@
zL{*{?4fMLICr+!h@Zllu4ZaGj0uc|DjbZVi;ym0H9Uc)8+#oRq4vq(TilTUoCp@MC
z-vU11`vFcr`mLnb2D`d4d;_df>3N`sJeN19qyu`0)CJx8<2NzZ9AU2%f!hKR0|2|V
z{YncuBOwJlMj+ef!$J#j&RBw(Q5d%g>hj-nPO$sz5@@~>5&!#sO|}VP5Cw(q57fXx
zT6d@aw>9FkfBw*aJ75K8S2Irz<?yiyDJOsQrx1})vTH;ujY6*ew@P`{faSG@P{e?`
z;|8!I2qWtgj;#?qJ61nS5Su_>x83JWi;_z#=amaZG)R|tE)Ys95KPPFgoSZ}P+o43
z2ky(cEwSq<p|xB)5R0%6>U0p)FgW591-K<4w31h{f(%UQ21u(lpAPEo(FMAsg<N<L
z2rL4^5U$_2M)e1iZ|Lk`9*t`o><{D<yR8wPOStt$237#wa908nS?mo3xgeVD@z5##
zkOF42s?3BBk&7}Ek5khw5YfOhuM-W~J`)R{5}vy+p#KZ*dAu~{zCzSsj5&57!bpr9
z#C85)%mHrM^xhso&;{s#JQk^o2(j<9!h*MH1yLX&(5O4MBkKZBIW5q-J|W*5QNL?s
zaGN0U7lM<vS}){VJ4WWdvEU6)GSBdJE@^MR0$~MaPgv|L5Dg*%jKucw4b&-7zZ0q0
zv=9a3S?>O~LXtv~DF7)RSpqZ&MJSg7w&MmO0DeWUAAR$i7U??)vG4oX0XE=fh6Ok&
z;06LeSSk5gZm22+tO7)T6)i0GWdCIeQN#Fv$g5irLpGQs{S|q+mwgFINzf1a_z+Z5
zm%pF+>j7_n8JH3wbGdI3$GsAV4iaw6A!FYc*Z<!Vfjr1j5+%&vEX!G4a>4B!!OLXe
z%fRd;?Xnl>4-?Zo{`7AUFE0}M92oZ>6U$%!!VM7YtoS2X(BMIY2^AK^x6t83h!G`D
zq*yVcK#LhQZsgd}<42GoMUEs{(&R~$DOIjy+0x}pm@#F}q*>GEO`JJ(?&R6i=TD$P
zg$^ZJbR)VXMwPxqy42}Ys8OX(rCQbM)vEi1VdXkeYge#g#f~Lg*6dld8u9T;8+L75
zxN+sqrCV2ShZg=8b>Q0}R=mC)lDY{TFIr$X{*nat7pp^6j6fed?z_lei@tgH_Wc`p
zaN)yzsYd=eIk08Sd^HE|-1l=|!+q_}rvF{r_HCSe&E*Mf$ys0^=DGxSMwxFHb3g){
z6OFqhUrT}Wm`ja!ckkbQgAeapT(<L((4|w)e7&!4;KGR;2jAZPd-(AQ>NZ#3{(b!U
z_1|wkwW;I|_7iYG{rZdQztRFEaKQl$l<z?ZBb1OU`WUp3zsIQh3cw3Hw9mn(HcZe%
z4?&#pL=;n0F{c(<An`&IoqCJI7cGoYsToJCk--~R^ie7|*!pout9E1%h@?gv2&g22
zGm=0gl?<xMC!tJ|NGzcer2{Kg$@0skBAKpA0l`#=OajeB2+aZ2bW<pJ@_KX5o+@P1
zzAoCR3PGRRK<-Zb@}!E-p8NzfQ2#yYR1_y#$RJ3VNQCsqn@G@E^wO2=1hhw^MD$71
zO*53r(>fJAv_4KTRn;UxD&1$3%L+;YA0Sq>H9S)fO_it|Kh0HFQKRa$)KfnU_Euy|
z5+wyP`tc{4#Qb5W3x8}#_S%g=Wpme|Nb|K=RF8eiTVlcG7F%>H@`j9k2<m5`CDWDn
zp;$tRC6+_8qf<9$PSy8Ke*HanUV;^h!HO96aa0gXL@D^;gfQ!(UoyLBVV`KC+4D-D
zVu@y-7A8j18H+L2*guYY@)%^1$t3yWj3JiUqJ1oz`DTCOiA1$AcZ`m&c&;MVr_e&K
zk~g5O8oH;V|1=Wm4uZycYX7R8izbrA0@HeHuDka7Yp}OQj$#sj4*P7h(^h+Jw%c~Q
zuby8t`)#`Gw)<|p$MZRFzQb;zjW$lMI;?%#<w)wm#oD=V#=%yuWed9qCF{m3xBT+8
zfrtbMd@qcpi%4w1e00)F=Sy?WJN!I!(;IIglEk|b1+#28YJnDpwjwAG*kgYxnymBa
z99(dJZXs>~e|D01=9_n3zu}B#kh|rdxBmJ=qj#D>>al0j8B36E0de1}ilO$6$dAU_
z-Fq)zsl`(F{!V9<^9#z;$)3OY`uBg*8S&|_K*#Z)^ZHl78Uau>0?bcewuitS)ekT4
zdy3BTgue4J#1eU;hW|f=(S<JP?hx4!L=>Xo4L7&}90Z|9EMkBTbo3(+i`aw}aF>Th
zQNs$BqTo(;<{}89DSW$uoP8`IoE8i(h{fWDDwg=7`XR>>N~}*Trqcx=Fz|_JYT_0>
z6h(7PF+WxmP8PiwLFKrwhc$6WMD}3=EAYYwxbsH_{m~C3;Q|P&h=&L^u?Z0bEe0i6
zL=sj(4_?Fo83fsc4MdQHBzPkaBIv@F_R)bTv?vJ<TO&>YbH6hhDLcnAB3_)K#ZXo$
z8=**LhqBW$l9{rVfLi4&E%Zu?#j*vcv?YNY(*nVDGA8C|LPThh0)ixgj&>A=2%Oc0
zRn(9mR)AFuVE@Mp^Z{X!1X*7}@{lAEz@r1`hyo}gp+;fOWM|0h<t^>Uxp(rionK7C
zJO>0mo|%oE_9T%r>d8<2;1e%-&?i7IG#qrMlO^tGLJ-UW5kWYrTFXSAC89u(JqjXP
zZpcF&(N_>{7Nnc)BS;C@Ap(C`Asd!Rs6t=Th7KIjpcb-35~GvEndUTK!-++7s;5(+
zijt>34Jv`6lPH(6WFMYLLlb}j5n99mAA;};LF~wj7T{wqtB6Kc@c~Sa9wej$K}QLk
zwGZBv^rR_WX-kvJ63oc6s1%cFQNQ@ppmt8KcFoTL`KnjG3g|a-dMit?V2-Cg1RtU!
z0~vZ31OE}k;Eu|%LK0%(4>EK>1Yxl1M=>gbi%wGoC7?xG{ZRsVpj4%nutZ^FqOHKj
zwnkl)ZEY<?TifQ=Sgu`(JFq~JhA0Fc{=i2+TCh!g1a~6I<t<NOt6S*mr<T#BZhfX(
zUD*z-xfyYVCqObgE3_b5+pWrTv71v^z@Qfk@@IXv@Lp2brx)+tLN)G`2_3u$67SW+
zi%8L5+a@9r&X_?a&Kq0pl9wWMxJF3&kqzZ4cq-;SusxFj0RS*yy%&N21OkxX`eXtE
z4gdfwYIFtw--iVO$OegY009Iv;6*Ty@u6T~;sv3&SQOBJIamMy1Z<(gMNP1TA+nER
z8vhwL6dtlI!SR3v7??qRHOB%#Y#&mTxJEqIk9}*zf*N~>#)t9-08%_4E}x3W^=rnD
z6VYUy7Fo#)d4?h8d>baiIh7<30FLjIi7n`1!{*qp9-L?&E8{22ey&e5P~2kqp5Y9n
z07re&T%Tk>0uoX-M=v;Sj!f4F9EsS%EmR!lOjjDykl4?dVQ~gXo1+?f*g|~mbBisU
zAsP1}^`z}n<}(ZE(w(-oIY_ZyQkWVNXYjH)MqO$}>%jpUpe+UpFlas7Q_gor$RrZW
z?b+lx+gmL25b%?Y2>`$W1^|FJz>)3*1V94KK=hUCv*`Pr0mvEl@(=)!00sa6#s3;O
z00K0i0T`HL3kMJY0_>9r0B{-u5a=`l1aN==ytzJLwht@-AmsXJ-~p{}01N;C00Wqq
z6bRTi3+lrJlna0W8pnXT7tn5Vz@X+2IC!w_qX&W;9N{@<fPEf70&_gT0}lXz02<KZ
zURWIC8qb6Q1dsp#U|_n{5P-eM-OFu*yC6-7u-NA!?ym<C5&$T6efTV86Z`wkoTvcO
z>yzmF;JZGz007c^0RVGn0ssjIbu#d~fClJ52Ou}c5FBnF24J8*fA8-D7*GvxjMzRL
zw+{vqQ0Zm}yw(3ccGr`xVRPsJ0FdCj2eQ!&7<=RI=9aa4O|AjOfBMflK>xhrg$#qD
z*XQU-2LJ^OAMw*;Uh~N~00mmS=6{+40uxC4Ji{(_bELuS;r><iQ>l7Y+Xn$2zz+l#
zV4n#jpx%nsvU>rr_$?UR93&useuiBi$KMC$>t%uZLyv*?s=3VzGh_R>#xsEM!w-|Q
zwGInC!m9=VV1X@QJNJvP1RwwwFtuMZv%EXFgCjh17&hQDI;69_7K6Y<_`d)I0EI)o
z5bUx0fB^yUKCly)?URU7D1{rW3$&xb{eihytB=9MkI1VJXE=cXSiih$KOf6F40yu)
z!hrM3kNa!9$FnXB%mxAoJOF@zC&T~^@P>^ezz|#ja7X|U%#SgvkN?Q?xHAwxgaZIo
z6TJTF1wI1+4S+OYyN~pO0Y79s5ez<aaDWoDJ75z$FMPr<^nfdz01faf61YMi45jP4
z6nJ1CoJfO*+QGByzDazdEMv9%Z~zCu4+=1V`rrl$5JbGgGA7iwUAqr|)4=<{01C*D
z{8O<4&;bFkuWSGSCeRPgvk$@3006)?1*|cT8-ic7yT5}0eG^50^RsO5H^vja1+m5Z
z(1FK;xI(NCVEe^jyblsUMRO=d+<E}X`$S5#!GeJYAZP)0xe0toGETe;Ph`g+5&*li
zj|o(-`7#GRh`?T80tKMGDkFhgh{Xa-gj;B_W<Y=m=!N+bvj1Bs00<z3WJm-Y(*Xlm
z$T!5lj~ukW>pT0<00YQ`Y|w*#WPt^^1#H8xb!@c-=mk=EfCQj7lsto5sJUCH1_Q{*
zL|A~4g9IHwHo&uw25>%7(765ZNRVv7{j$1mG>1JzNtI+tbAY%ZID-Qq0Ig%CP6I}L
zJflinls51ZoB)PNxW`T`%QJ$xU>gE<1F}j}Jpdqp69~VXD?V2|xsW7<zH9)H%Y+6v
zIROB$WFWDBvk!l3%+3P<TJ(mR1Aqg7!JIoeoU4z46vfd4fB={P9BYPj1AqbmuuNb%
zbz84YU`zmbfLKce0XR9A6OhF`IrXas5+i^!7(NIvME?$?%#*uJXRA2@*aGOYN(Z<+
zxZI+%RFoGYh-~nNf`|u82&R=VglBL|d~8lH@&ExC0*2f>diyn42tp6(h4Q?QWI)DF
zW3&#b23i~tkz<f%Ku>dMhWVU4Wb_7Da8Gl9h4B=SUSPCdNWcM+Py9Gg{73`{Ab|b!
z&H{SQIk}`s;RPEi2rHl!!(oXg=uqxViyo9v=J5vLqd)?oGJ}EzNFV_h)H7!YfiBcN
z67?Snos$;Wfvpe)I`W4d@P{^_PL{X^ItbCY7||MK9#U9O0l}@A(t!fd0H@S5ZYTr*
zP15<f(M91=S-~t2O$kqM1tWzEB*oGKx-K)_BL6f^)BVv>I`M`m=mK;Q1b7gIMK}bP
zz=Ad!QxVNaHua+R`qL*0R6)&BcbpnQhzZ}~)3zwnLVXfFNPq=M0P?F34_JUn^||?R
z08FjP8o|l}GQR<>k28?e1n9>Xk+v<g${~ONo)bkoe1PBV1wCMbK|2E`z|TQM01SZ7
zN9_<dZLV5qOGZTtNBz|kD}Vz~H}pGz0x&=$#H;5)0E_#`1wjCFypIMr&H_pR0{~Da
zFo0#HxEjF#0cg1XA~Bf*0P4GiWlaDJFtdPjMgkB303|q-3rS=J)<dO}!WoHwMF|Eg
zR%7+keLWS~EX7)cR&#Jt@A1|M&5r}fR{#45wQl`Z0U1bgB@q`r0F8qLWrc-ifQ0@s
zMhNHyN;m^p2)M`lF^ts@aDV{<C;%EgSOE#v2g!yO@FS6EgYhbfey~S^EsJ9n)N1fN
z1XutP$OfK+GDuj?^-2a0V1Na1fJ#kR{HQs`TT^q$1`kL81W14$+X4qT0}Vg`2e7qX
zpa5z`$X>tzYAxF{C|kF4033r@K9oWRZ~*b_g^8ue1BC%nOj}EJ08SeM2k0**SO5e#
z+5MQ?{=<MX7(ZD%TV7>ICg4;7z*ty-u?5gqjm<j;pw<S^)cSx014y}_gG~FtFcz4u
zfD-@%W4UkbTxw+i#!I~bm_nOf5dWNo5I2C8kO)|lcm_Wh+OsIyKgF<u6IY<rOwjDR
zs6#n+n?kHzSjHpN$TR?Kok0(XUUoZxY)A%{>)v3TUTPHp2r#+YWB>w?GQ15jc1zu?
zbAWRVfcu4o38+^A&^Uin*ld{CWFUb6;9daWUHtg5reik(_||}<-vqF)bRz(Ut6i%@
zfO^%q(5(-kY&eUnRQ>o~%mg*7YXCpn0s$xh4sa6p%{o$;&2L430H9U^puYP+0GjPx
z-|bgA3EqOJnG7WeQD`jOi3MS>C{Wl36>6;FN+BUpVsKz$f>?#dQcH{Qwv-4GsVFT8
zQ(iX3);IKqOn6=yj6eaHxc@G!22wBp>lFZnjm+HDj|2!$XEU(x9lUC=IH2o7LL&h6
zlgYi)1NLRZ95#peHRJ#w0dJT<4A21zm{|&-01VhQaIjyE%ZAjAyW;DGOs=y26~?Bk
zxu6sPlUsmnsN@LLgUz+TZ)G~9o4}D1NIsTdj7<h#wT}z*OwOEN4-i9h@PKDMfH!1-
z)V<6Ft~%9KWBf42+SK8j<zWcfM2qlYg6M)cQY0X?fmk4ej&g$%;AS$whYpAVP)Gti
z<%KS=8F40ObM}WkhyhV>1BtQ-EciBM;Swueimn2JL?tgTPE!oPUj%@GY5>Y_y}B2k
z00A~OHm;BBg=70r(f|27R|Fsddi&mW#4sknI&rl+RGirP9AtA~fI^PnH9i3MTgQpb
zj|cc<OU*iSz+qCDz>8zJq*TNAb5Z0J0Hy;meQN*=qdjl++s&QWhU3gx?poSS+yTK>
z_gq_c+t{bA00P(oVqSoA<=$_-IRn7m{7}7HbmnLN5n%YOjG*RA5(H650zm+b6%rGF
zaD$8T23!#5McRaD5d?MafV*~sOVXH4nCFTx2P|kXlZcb4XaRQUVuKZHD<pt_<75p}
z-xr1e?yV1yZR0nt53RKihjp(7U^fKlh3}<31_%H>usFnPfCebVzl{KSK!(4;2&|6;
zC~0ez<r?!hm8MwXbLsz1OI;K$MSpWT)@}fOh3zwNQAnTwHzrGg3;+h0V^IWYt7CxS
z4(koZG=jt5namGtZ985|-D1lI4rn-HeoW8%)@mRDhEresa8VF;Z2b7$v?zrj5L$|$
zW_IX+O%Mf95C&mDCU@>;;U%sN32cJUYl0AGMk0f3Kq<Wt?7=Q<lW3Gji4=p#=bwlN
z6_CzI;G{{Z6qovEENzC5Ww|Zr>RzC1^*w+CsD_9<V25_&tYz3W1&6@AIUOkNb1VP@
zsD_??xRH+SMpHfV^EcYoKvi})SeVUq#8yZv&z7E23~RbK%LD>I0ADUp{V=)XUOnYD
z*^tA-n-j9{-Rl3u6g5%2?o3#(Y&dZP&{gSszx(I~UykYi)xc~Bgw!QwPL^G7<w$2c
zgVe>g1_*%ShVR`{5yYx*XPM>!ZvijC2XFukbfAR}&=YDV@C85cy<Tu}_6A|-00@t8
z!ybuNL5Ej~6@pj<$r1`)NP>M}hgH~zB;cW0sTGA1@g(hq07w8ZGynq70~A+rwgs~J
zRllt~*9Nd*bEvr(GdJz++8O3ChC74rMO&+LIV-PWwk-gGBme?n02qS+RqpDOD`^3s
z?nFoit6Kobo@Ek?JOc<xrb__A-Er0>u?5fo`#tpf;Bw?v?nJOUS>0S%a8U!mI+W{$
zGuYgTJAnTw97v~=JYJl(2Sw@qNb*>d!3kgi2-w_em{biQf(qzDVlL=i^HwHsIt`!z
z9&a{ehI7Z3Z?pggKez_+nFu!!ffTS5ooxXXfR)U$0j!DZ0atK;*n~u(subu4q*r=(
z9_KtjDvcoQQV)q`X_jaCSzHeaZvZVz$%D|EmTC#{#@69xShuY90IqX@zncJ32mlPo
zgo!nPArOE7urJw6-E7r>1{Q!3zK<ufI*0#dl%rq}^vbm-)$TO_^0Vv$&|E1CZL51j
zH%EZGe>_;2<IR;a%eFetYybin$NYSN0+6`|@a}&XIOGm!Qh)@DL)WfdHv?c>drdvU
zKLGy_EBDJzgxNmV12EnCATbDlv=g7rhI=#14uGa}fW_=ZTu#i;&T7Vk1sV1_L=P7q
zp@V4<3GyjBj!3SCNN10*`jc1}5bgS+p!M2$my|O5?3XTBAO)GXuJeQ<Y4wI%AO$b`
zUL634X66PG1P7}ZL4vnnWh2-NVZw+6tHF{uaG}MF5tG5HrtzaWSQQh(N+vPeL6GK}
ziB#DO0RRLZDrU=+h!i-7kRI7kNfA~~b9yKk05Cx%(xgh4GHvRVX@?H}rc$kH^(xk^
zTDNlT>h&vFf9|k^Eo+u*wiZct?7(;SsyQsz-gb>)CB{B7{$i!rME5UUGM1v?69oTH
zkR?%o7c*|`_%Yz9PbX8ZZ22-~rrcB^^#EW<=Fp-?TTV8iDCm!yn=%k!00!yUvS+J|
z3i&o}+@4D1&g~7}<G6Es?_1RS_|$$=1tD+l{P}Uow5L<APC8pCq+1;5vF`o*(`t!s
zfyCYvQl_Bb*R!uJ6*}}7ZlPm|2mk(8;rRFS@9+OVUDCBTAc566lSF|DDp=Wp3p)5<
zMz#S685tswk<D|@_%R`X!f|6Chapx4qKGA$SeAegs<<MHExPz3j1Nk9B3-fQ1sxsF
z(1>4Le$;{+I2h6h%8gyMK+BFvDoIrm9mEnNlny!rM3hy2H>H(XjuuM?Ni6?qmK%!s
z<4q*!92XB+UpjY<Awi^p+ah^5m(D(BZBisxB&xY5hi!CViI#zSx0;}ZhDNBNi7u5#
z2a)jk)eg~Mm;^pR99N1bj~=%VFn$DKPglse5e0LW2s0Hp#);BJ7qR%mP99{SW2QgN
zkdX&)dC)=zHCE8d)js_wXVpGwxH4>4tB|pSUd35~q(A5gl7t)hc;ki};82B+C0(>Z
zO*WhGVuf*<ntL0UT`0P4Xy&o|?o#f;J8wcjIC<_?WW*2&J6-r=!*N)+gD-LOX|<0C
zqD13rEHO;w#v#p!fDAIHlF@=%US=agEQ?s$K@=D#A?8-DG;wkeDXagia(!Lp5rZgh
z=+%W4yu^TvKT)`mO)U7(V>8bF^aDf^xB#&VFCy3wiwZ##{PbJ#L<K0lRVUS;)mbNm
zwbtx%*@2!=Th)&h{*;~DGjxc}pIW?7btJ;@fYU)6Li!UYRf530NeBCMfKC*kMB*r2
z_+a6Q!3TE`jX!t#Er=*dFn6&ibxs9D(87qITo*{EV4oGPu08r!T(;m$*Qu+%I_vDV
za4+dsAx83Te&`rGbofNlf(><w62m6`M(c)!Q{g=o86%4#3O*v3osA`gzhzG1TWxGS
z8SHeh$?~WAv&s%B2#NVrgI$iam;Q8)JNsGr*#gzATaBgs@Y4TZzm;F74>ht>g`Jx{
zn$SMy#KTPeNWrQ4p@I(J3><FBM&JA)iYWM_POHF+KeEve=UD-I(nAhDI^YdqbU-gH
zScO0Ep)JPcj5+=wpFeof0(>l@1L&K|`Ua>&f5gL29q2+HV&RM-60wLzJR%a4sKg~Q
zv58K6A{3)2#VG>A5>vb)7PF|uEpl;-RqP@d!zjivZn0ZY+27N6fySvEsX4C5)DC;&
zjTpp0EmVnw!@k#oI=V0(bu0mJ+>inl0HJx$vxFs}!>Aa<DuWnPfnRp8M;mDCg(9Hf
z&^lm+B*a3EI22tR2l%z9kg}AfJS8eqsmfKdvX!oUB`p7ADa%>XvX-{IB`$NR%U$xa
zm%jWZFkJ~ssCm*V|HF;ILU|l~SnhJe{9infwU1`@r+PfBN<XYQ72x2bA1!d2GD8`U
zSVSTT7&|9A)2YsNva_A;bY}{pQi6BFGb$;dCqDD3&waL21pNFbK-o#kdj|BJ@$7&<
z3#!nCx-+2+eds#}%Fu&46rvVoXB$3vB5`#g8(nZ)JR;#O4DDlDJ5%GhjB~AQO(k3@
zoeDZ)MUB5)<4xggj=t~|N>Q}H3N3KMO@nH#ujRoh_F9}!OVq;-z>hNeODcz!+SJKB
z6{@{4XOqa#g?-qdW;Q@l608u7RZt^oOH+X`es=$}shE{%$k;~<1VIZCP_rzC0ESg@
zLycp`u^-vcW?lo!p=d;fN=rE^3vq{zH6}@_MRiJ5Nw?TNIrb@$73^b1)-7s8ffgy4
zN)l)>w`TI<b7m7A3`+~TPIdqkJoVmL`~X<Y(zdp?eH39kU|6Iec7XeUt(qbcmB$`7
zDjHqeZyzPx4iHx<M?LOs>5>HKZ6X__y3to5NZRz}FtyxW#VT5`JW*8gENS3IbknQe
z^_nOiuLA<=K+@X*;=^sYEo^a-%D(z)D!04kZB!D=-nUHG64mXjd<1c?5(uJB_5JSU
zf>zAVp+f}PLI+>H;)x#(xWgX)@R?qBx{v?ZD+vN-A3M&5TM@@sz5yO!ip>=b76Vwn
zATCQ3!gXML*r0@DaMX-NP=Zc!7qyp+VUZ<x&log=F3&K;jiW5(DTgH<O&YO8E=y(P
zxR<F<(un>}yye?;xdmU&NSMc5xT|FNE3^Fyn$#@kIfGcL@f(Pi2RPYt*%{4ejN_io
z)n|+3na=oX!kZ1P=tT#0(B>#~`;v>V%0>jzv6D2P-`89`|C!NG^TRYeE$UI<w9l5_
zuYC!&+~#({xXR@3(^j33RyT^&_;LkrY_02E$8NbtW$X@P47INrcD|t$_S1+x5M%Rt
zPuJK`v!g9-O)b~P(`Jl+UuW%W(<T4gFXr}=@F75Ole^p#;?gj~8EB|=xl3Z+;kuvJ
zZWEhZNy)4?zVl6LOpC3DEl4WA+1-YJ>zhWCz-z%1uJAF#dUS2pVZ+z<@P+TE7L%Yj
z#xp)(WNVx&9PhZH&0$lJlf2|6KRL?xH13qMyyZ}fH_Kt}@*AhY95cT;&c76JmhU|0
z9i9Y-@gtv`!UJGFKl-av?ed5teZauDIDRU0A!Wh?2rVE(U7N1;wSAoBUEg|i$Fd(A
z1+@(*1UuT(uJ)rN8b4v03Om4=4R5e724-T%CM;pOY(#=~YyW$RWR7yd13s^Q7!G_Q
zm5pq)!G$q=7Vi8uCS;^abgTc^hZV|O_|5;P=P36)=aX6rS44eZ8Fah^p%uFp>>z<r
zAQ3z$82Z`shv_W0J?(`$4QTTx8>knB>f1*Ka109{U6^?8lkb?Xqn!CW>R+Ce&lPd^
zCmwD9LNsW>3vWcB3%|nMChW2a?UMlr*q1)~)4w)w5WFi5Q-4-k_8&_m8h7-EKmW46
z807P3nq~3-eh?mG1PfsBpI`}~iLf777$EH#!tLN61a3tOq=1Ss#``%&@Bv0zh=5;c
zMFzG3Q0)ikEe08=fb-Ny9!*6vkcbVu+i|QQjf|j(h>AH)g(z6TCe+D3L_!oy-6FU_
zB2k5?kO6Zng70+{?Zy9t#laDN^n?Cw1pr3c6GmW(&_V?=1_O3Q2h?9!xIqVI#THgY
z6y68!IYvC3AYJH55~NxS-p3l!NEwz$X)OXM{M+xml*dp5F07EpP{kb9;lD6g9$3ok
z0Rt8U0n~W~3^v9DUZGWdU<f`9kzB<Fejydoh!s}F4dx(Q$&7Ji11R7^7XXzJ3IY=T
zU=ZHT5ekX2kipqO;oM{cI=DqF2*Y52f(?=Z8PLK$WQ#7kg|tx1e0ZTI>LM@3;w<(9
zwxk+5kU<pqMK6NGFJ1*TAc-Z!LpA!tHD&{nY(hM6W8-{dH%5aa{)O*_fg9Ax8CC^2
zm}0dwP7j(1KIH#_H;{o9&=3$(1v&u1CZGdw*Z?n>qAYHLAVh+)c*PF(pe)MCR765H
zB;?fXV?P3i1mWO5paVe~q)vH7HeO>#ieor}qc@5qIerNcIEn)9fE9?sAbyVsECM@F
zg)k7}3!&t{*}x~ZU+7Ij5IkU4ydegbBUOYURgB>>9mkzy1u<UYj%1<@#=uLhLJA;~
z!^{;w-lQN}N;LH0RM<dP`oqh_%tl@XGBgR%xQZK;z^&*-8!XMOgis8CLJ}N8&g@Lj
zJj@rirH$l4S?U%i#ZVWNi$5?DEgT74$|YS|#aP`9J1izlI%Z>{&|^wwOgaWQq(C0<
zLKv<iOr`&T8zc=n6ecaa3=eex%%lK1Y$YM$LlTHU3?zY^c%>i=A~lpym$ZQ9WknwD
z;b6K7Jcs}d0f8PmP;0)XoZKO~)Fv6+W^Q%`WIiWlLMLOYNe5sEGW^?5Ezj8@gB5gu
zn9Sr*TIWqNjyLFJ=+OZeMhidsV+MudD0U(l7)L20Aw&v^Q|96>?gKJ*(=zI#GeV;;
zl0kY>1@s9G9U$CS2*a)fq@y(BGg5`JFiQn30_5Q(Q#PfFsU%BUN?iIwG*smb;e%h`
zq$5oQcy?t@`VHeGrB@K8Ka9$l;DXd>OC;n$2;s~o02Spl(^Af;Kh)?{xTrq}Lb+r^
z2~7XRCfp+fHBKbbNFE5!W}@M=OhpNx0}fJYHb~8iy2Xit78~XyHT+u#fI}3_6j!Xm
zOIGIZ+zn8nDNHg+s%a=~iYb|zX>{#CKVpnO=%UbIh?!afA$BRAqJy5cVR<Is6j}vq
zx+ZM;gH>+Azey!k2I6d5%5GNDed^_{^yOIsreG4LVVWjlhD9wjLCTyA7GOadm}<>^
zg>Wq=8GII~B1u@vjQZ5fTD_<xUZ{xNXLgFh<&CL7;6hbaprI06mmcf&+|5{Gg^Mnw
zKM2ETfu)VU2aAG__*iJPPHP@8q>vIRTjdcg*gyy&X|sk15GY0nxdmtDOd=r+I_&=d
zv_NIMnkY^B15o}8dA0y&`NL<GsaJ5Pcd`-F(49XBteE8MuaXr7{i~hcRxAkF?xc{_
zrGQ@K!5+0yw01xWG+D%!z#@#NKPVutdMQ;DCO(MhVB+G3{!31}<eN@~Q~D^7`op&t
z>5(>$lHzES{vSTXgFB=_8u%nvM8burfIo<Uks_%TsA%J0T?asp<Y;Tj_Nt2Usb3A|
zDqQBj-KV~e39{1Uv4+qHmC#f~!>(F|3e1#SK&#Y*Cf$_l(|YJskczgxEiKT^RIF_Z
zEl0U*kOp-@B*-m`?uZ+-0c&;uaI~u_;zM_$gGl++=G1Gn-s_L`?XmW&!}|XNJS+lW
z{V5^x4IzRq@;HiHU~M*NZq7XHZDn2cWEeX5&b?MGoSv+T`Hi*^>(?IY!FH#ZIHj~s
zMYjfN;(%)mi7UBU>$!r3IiOcqM1mz`L)nOc&B&|`EbAg<&-Qc=)za>S<ZTMLN~KJo
zUWfw6u7Xr}Z5xs-33cq(D&QjJK^r`bux3Rhlz<Az3AFBM2iQP45$^m-QVdYi!-xQC
z@~{7<&;91_a&WA2@Qu>M0{|-tH7pRMGLF=ECfIhsB8UJy#Dfip!1nME8k#7_Hrc_>
z6Tqx5zcy^nU`XEj9aUg#9YM<mK?@CQEHbDt#geb;=9s9p0MV#`-FW|R>GrMH#=zFz
z)9(Ho={oA!;H}>J1K-Yv@d9o?2rl6+Z*M@a^d>D9Yq1ECkO`rX3U#j$mq_9aXji1H
zTLflult7#9Lxv?<Hf@D9(Xm$aLl%aJ6KaK-=w}BEOEi@QMSewRZH1mx?}%K*A@{Ac
zp+j>T@ecD26l>!7N(BppWyV4a_`1q+CU8UIFGDI=3Oq1E*?<IF>-^$}7f)~Fq_Ta)
zuU@1@3qVo<A8;BgQ(CM=TOf~MlAFF*K?=xlZcNZu@IuJA;4W+2BP(iGv{@c!7#}N1
zHE#=>HFIG71~%mzJ`{0p3`_s~aaPa+IBPRHr?Wao8_8NlBd-55Jjb&<H(NVDqEOB=
zKIgMO2Np&a<Uy8{<X8?365J+Qj@RxpLMOCB?~rmbryHyxwZu>g(4iedCArA#JukFI
zZ!|}%NtoI!nMOmlX2WNl<jDS;oD$+ecQi}4v`cfy50j96NKFWdr#~z#M!&R9?=(+C
z#}89O5+sr(c*&sZDeC5QPbalfFZEyia5ji^38VnyeC))Iuf@tN$EF)oZ#7qUwN~hf
z>w2|Vk2P7BwOOAvTBo&IuQgk@wOhY6T*tLs&oy1wwO!veUgx!5?=@fdwO{`=U<bBf
z4>n;JwqYMOVkfp@FE(R0wqrjwWJk7SPc~&&wq;*7W@rDlW^XoUceZDLHfV>oXpc5&
zm$qr2HfpD~YOgkHx3+7)Hf+bXY|l1r*S2lnHg4y(Ztpg4_qK2UHgE^Ga1S?e7q@XA
zH*zPpaxXV?H@9;?H*`n0bWb;RSGRRvH+E;Yc5gR#cei(cH+YA)c#k)Em$!MJH+rYH
zdapNox3_!0H+;vpe9t$1*SCG&H-6{0e(yJb_qTulH-HDYfDbr<7r22RID#u&H+(`R
z*n%}AID~`UJj?@CR6-UQ0fuAv8<+xBOn8KUILi@(7Z|}5n1VHwfe|>t8#IC`G{PES
z_#gN~BTRu2yn!r$IF5tdJ6yOClz}yjxE<tzKgj>XgZslUp!gq11CM7xk>|LRE8HMt
zxGB7W5!k_0*ntxmK^7>&kfS(*XLuz%xtJGRlpBE;D1(`IgFjGth8w{r_=7b}0T*-w
zk8}B$-?_QT0)|(DBDlFfpn02{`Be0IF7N?{zxh^t!#CtZRVX^6cZE89gFZ}!JP?C2
z+=HS6hNCz7qI*T8Px_EsI;MZaUtsz>;5n*)g*?2tER=y041<gZI)<w`F&M!hXo8tj
z_*PsvqWgn7%(_?Dff2y^H)MD&V0eLs1+P=ZuN#4ycZIMMyRjpCS$xAAP`E7^L5!z5
zw{L|!{DC!Offr20FUa~7P<S^~xh!luSA7415pV%jn8Le%#V6RogX?)25JNrK0UrQ{
zyTkib$UDGyMZMp9kLx?Xn+1l;!=Kv$hj%-~U&T9^0-cuuh0g<zXSkL7!#6kqA6SEl
zcLh0MIH~&sia-1>RDvm#{5{CRFc3o}Si>;L!aG=lu&;qE@PjPeIJv7l%ey?xTLU@B
zf-+de$Qwb)pM1}+{8Y63%g6l8*Zj@r{LWK_GJL`(SOY&yMLrONCN%g|WV@S_!_XJ~
zR7eBX69ZMu{5;q~gKvGrNBAe8xDhBr8B9UR(|Lx!!KwShvGal0zkw!jg_rxoJ7D;!
z|3RAzd9!1<DMWiEwD~<yyW$(WueblXDU^G^TSeg?z7Zt;;$Oa$L%!rwd*o;MAWQ|D
zV>p*{L5ABxwr_joWBBG%d6vU?+$Xr*w|TuA!QfBDJIF#KggI5<I-j@s8<;&-u!5HR
zgS@}NpOd&X9QzdTL$eP8%}4t?G=i;%!{i%5KcM*(Oh1WRKZaxfJ9I-M@O)J;e-=1@
zjYt3ZQ@{D!diD?d_ILmH_ruZWf;9ky6C>Tiy|E)Nmys;~x*0Jt?4B(nfBeZZG9_0o
zfwug;F;a${MI-)5mNa=1WlEJRS+;cf5@t-9Gilbec@t+&ojZB<^!XELP@zMK7BzYl
zX;P&}Jvwyw=GR1j@@y%x^M?OVqhbE$m2qONjMJwp<vHvYmg6TQUSx?Rr_NzLl6D^Y
zQ>)3}J%|0&vULmBh+LLs2cosRwyndrap%^(n|E(QFC^vZBdL#=rm!RZIh5y5B1Jw%
zK9OuB)uSw~4*4y0{Tg;`*|TZawtX9SZr!_i_s;1>tdXxC-%JVakjt8hnvPFi>5;CH
zd;Tgp%yK<TH^3$7ZhfrRNWba|v1@nu61v0b<FRMo-q^blyx{w>GV<o+yDS$+bM_1x
zH6u9k$CUdzstdf<d|Qyg1|575!U!dtkirTr{OveC$T9A?;3~<bDW{xMDItgWAc+_Q
z`H@8#e&BL~JICaMEWG~|@msOQ7faGdp6O63(TEfMvC$tKT@)_H_~zRyMI$VG!wY2!
zw8I~A&g;yGcL1cQIw3u(<UnF*RPe$w%{&v$G}T;_%{JYn3Ap2w`Gvy{9hzbgTTBti
zp%GI8uP%S`amWt3%IHT&_zqh#yg`j9^dm%(Bq=H(PXcr+K?yZfQWzEeZZCcIn?kuP
z^hs!nPvW#pAgDrP2)X^T40FskZM_xOTy@=**IwWJ#FSu#t%MwT$O%!bH-?dwG+Bgg
zq@_QEvy3EbxFA%^ME&WGz!~ZD$69Rt(Y8{Rq;-N?aIbwd+ex>rt3XEksd6(rtSM63
ziLRB#ALfiOMWX*fs@<%NZW<HQQ8Im9nBj&Uei-72B~FP8K4h^)ldJw{M44{@7OS+J
z?n(Eik$*Bdr+o4`Ngt9)x@YB-RGygTnr*%r=bUw>%^HWC_(Ky`oUJ4*JEY-LI8%0B
zn(3yUej4hir3Tkdu}o3RDJPVkn(MB;{u=DC#eS{ls_*;-YvjgWo9(vUej9G5tud(3
zy6wJ7%e0M{C+@!e{u}VX1!waUffN}W@x&EhobkqmdWRgxC7+z~$}PVf^UO8hob%2-
z{~YwtMIW8?(oH|zrG6CVXI_@byhkpDRZ=~rcVs__cGPv>o%i0G9>j=mNE+r}*NuP{
z>xQ6ZX^sCfPV(1@<x}!vjr<Px9sBIH-=57B@$yGnEm<-}8Gp*if}DQHZ>f2c8sg&@
zY0IC!dXxU}l>7Yk-=F{7_;F$(`Y;eNxbU;-n1Ty-n1VdK@QLvps)1D^PUQ6Qi78Zq
z3(hM^L;moMd*s4kf1uJlxS$#@aG?^Z!c3p;kw7PWA|Hcr0v9r6!Bq7RhdI>Y4q<Yd
zZV=BF{cyq?ECQ|SyrB{NIG!@5kOf;P5n6x9f-JZ&8HqIFG#ZSNLOwCC_LW6xz^TM(
zY(Wm-$O1eZvxq6^@{Vs9K@rvY1rO<1M?31TXO)oFJ)|)aQ(T8SMu;2~{o#ch9dA%&
zFopj|-oXb?IYEmhAx0yN1E%)9qj+9`kq}RGKgbBIBU)305ptoHN)+gNcU0vnSvk5a
z2;@YS`ot^)IUPb8vPj1(OBrVQ33=Gzk&(0oNHpcVHB81zVVnX<oIoW{>g9U{?4>nM
z(}-E-qLtay<~A#bwXM`6NYcoH5sk32TOJZxCsc+V)}RlGR6;G0go`3a8AT&ZGLuGt
zr+~m`gkR_-WOBqHIa2hATwsKo303Gq{bnU}kwg{(DT6u!X_<585?a>S4-NBj8ZUSu
zlAvh{AEtA(i4?C4A3ff5BqANsP{t!KEYc{0bUTLL6sI}$TFhwTqaCq?r$0pr$%6lC
z5|`ypr%6@nQkmLRr#=;`QI+acsajR5UKOiZ)#_Hc+EuT96|6b!$5{7KR(zZlt@wyX
zJkomBvhHK7tqbd1=~`Ez^kW}rU8_6NVGh4?1F+W+>@}uQ*uh={u!-e{Um5Gybo8~c
z=1^>42U}Rf4i>PCO@}+y%2s^9)vlox?Ns}5)_CysuiPLkVi)UJ&U*H<W3>%l^?F*=
zN>;VgV6AICyN}WS7PvYrty<mj*VVT6wQiN`n`o=n(;8Q|$o1@UgIiteW^TCg=xc7J
z>(-`ax44oO>|)cgR(w$Ry6IJK+w!Via}c(>zI|J1pDSL(n!_ERUGIMR%e4Qz7FV_R
z<?MMU_h0)imb3Eh?}8beE4B7@yyjr5f<H%J`<kP?_-OEkIXt1#7FVzsW~=rd{N8Ke
zm%trX@rq@$5ACXUu_NB0TE)wa@=}<^Io9z`@Bv~Q#{<Wzba6UhoZlTE8ObiOhj=Bd
z;hfU=zVSeBlBvvLd=UA>Qif_jmW<eRIJwGU-futRp;`$C*+SX1?QI*oS$8Bi#bG1!
zd%59`DT^7;b0xECzkDJ3Zuhu;eRF4FTid-tHn#$1>z$pp4|f389ca$;q_bM)Yec$2
zJ$~;r5WHxh{CU$c26NOL4QWbOjuT+8&>yf#>3zI69g<#<rbF!M*L?q&&S#dIqfb2Q
zQzy<BDVPBoC{&;~Y)#Dg0Bk%a6c0KZSvRG{a-XACW^VZU*MdudI4Y!$W#YLXlEpTI
zoNeQA^JdPyj+(N$A?s|vZ5<*Y$uai8h>|2@57k(ZEU4s<Uwo(}{9r{wy-{#))C9d{
zg$X(g?rwKngV`vVnNP&Q=$Yiz-9fQ<P4MwvcPwn<Ey2e%((&%V&B6!y5C<jl;e%w5
z#0Kz~!GhvQjtcVQ+x}?8LbeHy5GVoYG{Hv)P@;x5z+?|VKfx?k;#ZY0LI^^*ginM}
z2%Y3L<R{67FnEEJe(*xBc`XSz&~cN8e>~zm&iYUGAq<$r0~!B1A+kTxzLL7<1Ru!Y
zMcM7H^@Hao8+Z2yJM@0;UnipjKH#=Ed@wJ@`@;nb+7lo2@s2m7(tO+$$3*@>k(sQ6
zGbX_zOia;vAv{7QPG<=Zrrwi^<9+QY`Fc*4iw<y%o$odYw`zM54Z$0w?J<e{O4!W}
zmvr4H-pGAQkiVe7s{|Q_|8?u&;RAM%WFJ28hxQlrx+$b9q^#V0NrXWQGVnqWksygE
z$Up{KtltXm2R%62e_l7Vf$9F(ha2cm1`VSl56FNTOaci|4<($<C0MT{#9<7UU=&CK
z9`1k$uHXU3U>C*!2~c4d<Ny<pU<~|W7p~w6pn)Vdumk@;&>z-84wm2wNI@l}4<+^i
z9I_!BNMiO%LI!D&B-nu(vO&JQVIOob9<t%@{GlJb!3TYd?9k!)ykQ9O!3ST$912U)
z;DH924G2kMt^9!rvq8i5AsW~LwEV#e%WfZR4;_Y(C-A`=sKM>XFdK5O3;!<;O@a-x
z;r7r0A7(J)rqK9UVjp-xzvvDh(19ARZ}6_rAAnE?^$#3+uq2evB-lX_191=)5&N>?
z5J`d&YfvZB&<mdr3bTP8N`eW6f!T5p%%acaRzeA8U<P~v4a5Nq>g_?wKojtTN+K#`
zvT6KCq7Y7i2twcrc)%ajpa;z03RG<oaNrHh;1T~oZwAbO2LeGK>VOFD00L=X8mn<1
zT)+&>-~<$`08^sf60r650SUC=5rjY*_JIeE;1Q6Z4*VhNFt89XK?shZ5QJb9#6ce)
z&>!@XAN^4uj-UYfF(t<B+yc=X=mGg|Q2&I16nVkLkRcwtA@05o8Q?(}$|@e3FB_0S
z7@{E>`~e(zAsg7C>v(}0kO3LO5GF>BAqDZQ{Gkz}4;-RFt$ZsQcp)ZlkMM>N9PmLU
zc_A8*A>-^&B|;J%*um|F5)V<5CxOf#_V6UNaPOefAAS-XcG4xvj3w~lCruIyRdNP#
z5+jMwAAph_qT%+4P^}^{_eOFEy@4!|()a)TfgYxkB#^-gF|sX@;Vo}(CRO4kf072j
zjvZKXUd(bYkpUb+vLsls6<dPXkb)Q}iYHnlAEZa~LQf8ipbm~l2;zYTykHoV(I0rg
z3#>sIhynDxAQ!aY3cy7RP;fSD^9p=H2<o68eW4`E5hZ*L9t6@P6wn`Lfiw#N3HksP
zjDVtupdN)l4hC`;^pV?;!0P<r2n13){ee42K?p2k3A*zn;3}@->b<ZH2}vR%n-478
zG6?z3BERncN}~C=&@ibIKEG}s4iO!e&n5!V3$YLE@{aC!0UYFNFG(UAR?-`IGVUyr
z8pdrs*RwrQA{xxl?IM&NCUij?v?TxNAuGGmL%Z_!6f|{?&m`JV|D?<!x$xiwkqc{Z
zBoUDl`3^v76h2SlD-o0=n6NGBFeNgSJ+A@Vr~w|B5Fe<4NO4jRkuUHdvN46B6#c<6
zFH<(|fgH%e8h(Z|z3LbJK@QA-6ktRMm{Uu};5PlSBtXw#<lr{_VGMM0Ak6d%9>ECu
z;1052j!1$yO9CFM!B7v?P_N(!Fd;cxj}!Xz4({L=?!Z%cpgMP<Bs!2J&XXj*lO#0N
zAI?(_kU&t;vn1l-uu}CIp5g9fvMp_}`Jfa&!7$=5QX=)!By11&{<G`6a6orrAG|>&
zNrDLL@G7%`7vKRx(+)5jldb;-(Cset08{m_R`u>|6d&BKS=k}tpfFiU!bJ5`!?Lw2
zzcB80Vm~F3B*+ydYjg)aF&=)>$<&oy!Qt=r6D183?zHeEk&hCmm0AVMT2JCa2lPqp
zl@rNs0K0OngrPCT@GoI7xI|$lZW1Tf0T6HEkFKLnKBFaUN+rg0o61xU<X{&_RR~By
z2+)BRc;HQyfZ6Z?^hknEN#agPVrKP}6@-8la)A{{P*4r9BnsgOiq>e0RtSus>PkX6
z(Sc|EK^&kVI>q4*jKB=+5mP^vR715pJ#`?r_B{1*9>%~3OtmHOD<$6ZC+9^X(-K+F
zum+9N2=Vn*33Xvn(mwxZ&sPbwCge+Q^^X^j&&kjsD~%N=J@Krd)gPo4CeW5c(V^|!
zt`Wy|NV76rArx|j;X}=pCxija)OBuMY*_s@Zi&?})fGTP(i1(`B!Uz^HLMOvHzpjH
zU<*+XFZ5iaj~?O<9e4rAW^@d<biG6Y3z|SC7$F5Z;23Zs1vr6F^Uohp!3K1q8)y?I
zj_oDjLVQM6G))#|^#TNXzzB@-50D@PQUDEdwh!ub40s>~`aylKKpvdn1X>^#hf`=<
z;tIw9W0_WIKcgL^?h^2U2aMndu0RX0HdDd2YlVPRLG?WI;RuWX3Aj@yvUTrR_v?h=
z;Pyf9dUvdTa_|4<7A1H=7<d#W!H(>B6(?<1C*naENU}ep;qSa5h6VE~f%06VL32aV
zAEH%a!!mHu;SG71A{X(7BMu^2HzfBi?s!uF&h-;b`1U{-Cy|nH>-Jxh5+;ApgnbKH
zJ2WeMR~QU4CEt)Gk#b&SHzx}AcCUC?yHX{e4=Q2O$@ET&(@PZ6APCZcCRAW~Z$d}?
z!51QrB&1g-A}1!W_a(NMdpoNw$blkY<TQwgBJKg0vY-+Kh$M0WOb7&k`hk=E!IMcj
z3o@u1oNG{70v`IeCAck4d!icPHy_}%DC8>;OJewJP$`zHA3o9~&})~Ag3;vbEs0{7
zX^$n6nM?nPuL<yA5n5s$_P__KAdmr>P^q~JgcId_Apg+d7{I^>d?6XCpbGSD@F+nA
z40Ru*7ZrRU4*Vey-q{y?02O><9&&LCltz+`h9nk=h(M$B+@}%V;1A|O7D_3gcL?-+
zz@b&5s00OMVIpSQz@d?VQ5mEkkw6IQv?xY$>y$M@`e7vbwnAc(hl9A8YsL-oz=MIx
z1?<@coYx<)S^s9h22f!J7-1bcAP@qf129$vL?8})fDzbX7E~br0>K4302Y%06*|BL
zC_w~JPS`p?3Ak@3_yMGB!3#_wAF@CZECMr}fEa#ZE51P@6oedpCLzc{hK|iib|@d-
zz^?!CV<{@(uJ5Hm@?jVFCMi^UH-7Iz6mF%V<{JXFB{)IewvVQ5dKNmsw~RUvxX%Xy
zp{DmBdIQ-7ptq1q0u@By`h0*AjGCJ3xhJBcHI6MIfMp7P;f?r!UoOK46hsj;$O+(D
zgJ$Khd)v2z0vR4*qD=w~lz=2=nj~zRnn_}(!JrCAq6$>arc0u;OX9N+d3v|6w0&U@
z_5ihcq7v#ykyv4$gT-LNL0W`FfD~j6z(g<L`jeeNWPh8!>zgLvp$X_#B{;za-~kOf
zfD)2BkY^zU;2{n=fDwWX9^fGbgmb!&8+xlj1bizW5Lvs&xx2r6C+OrJs>2kl#9;r(
z;T^i6q~?0PNkS3c;2t~zzL{yh?Hk5pTqWEfnqdMSni}XdyQW1T^7df{5|6a~K?ynl
zs|EZdeq5`4Km<g96W*C5NZSW`VGja9!*xO*fWxkpW>1=k7)+swrr>%6$O*ut8;qk7
z<U5XBT*lX&%{M4hWJ07<qT=9TA5tLy7JMe~d?^4s;P`whR)QS(;T{^oW!l`(W1JTr
zftjB!1$-a{o?BP!APe3=YjUU^E}bMUUDN$R(=naXJN?r)J=8J1)7v4_MZMHV-PBdx
zAC_SmRz1~Ioz-PM)<J#LPkqyA9n@VN)<Ip@bKTZ!9o2^&*ohs}c^%hDJ=p(!ec6lM
z)0<t{jos9d{nvZl*{wa=pPku_J=smY9bA1Gx}DW$9ooGe+Qq%vr~TE(z1-P-+qM1L
zlO5ef9jn-(3G$dH_Td=fTvz778ireYGC<%7!5>gS;4=UP{DBY-J_Am{9~k}z{NW22
z{?!@&3;f{+7``1&f#C_>-~~S67yjTK9^xN<;0ylXL!RMD{@^2i;t#&!5B}ma{@^#h
z<53>u6@KMSUf?7C;5|O&b$;Y|J_B5y;@iREF<#?2{^xNX;e}q{S-$6a9_Vvk<fESG
zjUMKaUgnj)=9&KFKmO^jzTvap<S$<AGr%9fzU&!Z<+r}%UtZw9J?Z~xUf|dM=G`9Z
ztA6ZvKJJgc?w9`N#s2NFzT^cS?HL~LhhFc=KIW%h?lXYyyWZ~Ap6v;~@ef|B@W2ud
z{Urq61m@rzZomXe{|3%M5=y`HCE*-Y-vp@O9Ol6FUx681U-YTK^_d~{RbTW;-}F)6
z^;uu_Z-5QXVFgy;1`y#Kp5O+W{|U~a6PmyIJ7M&tzxWYB`forNm?8U>pAE8~8KPhM
zm7n>YANsSO`m?|Ik3adBU;3Y4{HMSAoB#T=fBU=t9KK)r!yo_4{{{f!$+=E93f|~+
z&fpC;=T@w^f#}>5g8~T}M5vG<B89q`DU8TQAv22wBTg(>Q6c|EgA5&-R5(y&LW(gB
zcFcHgqd{i6KAsC{ux81bC<i)(D3K<~gG3kR<mk~LNRdll7G1isV9OO&3&u17R?<1J
zU~in0MApPBW@)LMo0FE=tF&{@QAvB2?pU&B(PqftFR<XjgbN!!j5x94#f%#}ehfLX
z<jIe%5u=Pbv*yj5JA3{NI`rqi=SrJCjXJgJ)vQ~)ehoXe?Af$y+rEuEx9;7%d;9(k
zJUH#YqKg|pjy!o}Uzn6Te-1sm^y#0My%LT+yY}teyL<l*KD_wx=ZI53k3M~Ja7~)2
ze-A&t{P~8hlfREY|J%PAK71)x+YKiClmRoTm6L&6rp^Ds-v?{}xSK->4X9s*7G7wZ
zdGu|_;e27F(qV`qjz}V8q+y6+in=lQ#T+YSAQo*h49G@-2PSx0jV<1g!56$qhzKDn
z4oReiRD4lllG5=LpES}a31yU0#&=?oR$h4;gSwpaN{?LL@PP?px%h(#%pfAe2P<qj
zBY_6OWx^cgAgEwzHEvnX3L5|jr<~{La@P-Ao<qnACQyORIorVXg$XOz^#h?Rz_r44
zi<<Dm6Om%cX{WVK394vW-1D9&&4r3;s;YWcrKhf5$RHbY$dExqH*f{kIbUQT0~O4C
z@B|?^wpk-j89cG8By{GO!Jt%RV2m!uCfiV)YL@?lNCr1N8)>#wJo_lI+6vokg5bW2
zZn~!3@WZO^MrMZ*c07q*HBEr?Zoc~NOIWMw{tF(1e|<m&fZIqy#RnVc+H7gY5b{F?
zk&4Sqjj|@VtZ8?a_G~Z~Gf0KBLK<V>4SOb(!8Sj9Fy{v0(%7&GGMw|np5>?saL!n2
z$ZyYr$->8bVa(!l(MC)8MV&e?ogIU(KzL3$C^$$f!`qw_jLU?4Ffq)`JbUC9h-7SM
z!wqFn4%lCa-KCJh1XE6$07i@rm{H?QaYHkkJSWaf|BWHfN9+5CDS@doj9~hFVvBRi
zSTlI!lBd^B<(6L#c;>)qc^Wek>tX`hyI%j@Nd|MAqU|{pm(B)S%HpVTk8?!K5bLg&
z<ESKtmZKvf8_b;T#V@<5_kL77k-?*yFHfG}ldH<b<JRz@h+vH<!w0>`r83I%-hVIJ
zGK8SOU-{;n#eDj<aemqt8*IR%E~7_HtD`In=w>;{OS}!)1pZ}$FI-K3fBC`HPC=^`
zoFZye*Z{ALaSm)C&ry%UU$Kg(vJI3;dFt!ncAN*kDcK<lmGFl(su!3w+~X65J5Dp2
zz>W~gaE6f)mif|xLw|X2hqLJ)Yp?;e)s*9EwHYF6h-exko(74oAw<Z2wJ9D-(KpP1
z0}WBdBom_0AAC@UCX{iUepmq)S1kXd840rt{+Iv`tr&+J-w4NX=x~a3<e@Gcn1Kx}
zu#SAZO_vmSMk&eT4_;7)EOIf7K@374$00^H0trbPMl1t0Xk#2N>Bc$sag&<E#wku=
zAWn)BHswQ7B%@S`c_@bx-8-c#pEpTIU~-mn%m9}-H79Hs!x(ewr7wR8%wP(0n8Yk*
zIdsWOV=8l*%q%7{n+eTmGV__ztfn=Axyx%R^EBG@B{hXPBxVTA5e00=E6>=69l+z9
z>@-@$Okhb`Ua|(`ASV^BQ>2m=(4P1tl0GHIPb>ZN2La6|%Kp+0N!*~H{zMtU62wpy
z{WAjzUFenmNzY=0u3hbXOh5lV@r%dkLmye>%soiunNJvD4IOQ%z9uQpn35BKF+veq
zOfZgONTC?@RAWssbkm&fw5K#xQBZZt)0t*KOhyHZP<c9z8URpfKy@lomCDo<9d)Qt
zo$8Rb3e}v3&Xg`q%s0GXgcdd?3r={0XZY}k&)j1QM#x233!@LahAOX-Ok)P(8Pi!7
z!x2&?**z^J2{i&Xr-X&p*CKkK!~$@!gDvc15v$lZR@SkHt&n7wO4-I1NG=!pEIi@3
zS;In>Jf;n;R7bm7)@JsSt@z6_?s^zg7-6@vfQ&5M+L?Rg12odu?K^NA7=8T07GRu`
za+wQB^2su=fh|TGpLPGJ*mma?1tVt-ri)4Ijsv@$9S?WQ;a%`vQoQ8VE_cqGURttu
zspS<9d?~5kOF9A$<JFdX-%Evd#5cUxrSE^WbKmdEbHDwy=zX{=VEisP11LZ)VSXVC
zC+xOykNNFjOz{RypfneMutOvKA&XyVVhx|r#~-@E2R_`x#edMNi(xF|z?i}gc2H|$
zDq(~&SlA!ZAP1_73`x}Cl)6mL>1#7^;NbY>uf+&!OpEd4C<AB8t*A1SvCJPW|Axz6
zrY@NOB4*!^*~&46gBn8#o;8~}%i@tUlidtJIDf~^@&q#>hAfz07$FN&cw~ox>km_8
zAs25rF)N%<iAw)u!5@Ecf*l4S<3WF-3@83YqXTmfO>^2GipYW~{tz^emca-mL~bsI
ztB-JeV=&}6?ucG37$fJ}*4`uEVw-$r!j1zjzS@p~B)djnzp=8zK9rt?b8G<eSJ{lE
zC$XO$oM<m~+RA43wT*oiX;Zt}CP-*~v7_x|cU#!s)=s*)4eZL68)0d_&AWk3&I$vX
zA6YPhELg$FLkorrZ#cCV{E>xE_(K_!{sT*`VT({-MiZ%4#EJbOaeq)eA4UM<CsO?w
zb!b?7W$o=f<dF|+*t#3@kVZX5WO9FmgTww{xy!xRj=zjs*;1G)wt2(d44eYX`Q3TX
z>HG8D1bzSL3f?&!kM3;YES>01f4a}5{w$^!o!UGNoqw@2^`=)H>ctLD*tg#8ad_Rq
zX3sj+yKP%Q>-OL!b&Q7tGljyL!W8;2!mMr4a7_p%)PebUU@Q)5BNRS+iuXq&K>nCq
z7-0%1EvqelArF~{G%&>I2RU>dqRY$U9^FVB=RFU4$q5VIRgY;aUR#b=)Vnov;SbuK
z{`$Yfe)g=X{a<ds^W39N_P+6b27o_q;qSiqUO#^8*NbOc^1k=YN4~O^PyF5(-}>E-
z{w<kr`>IQothlX*hA$(TyK~VF{@}-xvcQUOIAIEu7JT9tfB1_N-X9+ibvFbJd5`f2
z@&f;8CZuc9pby`mN+r?_-Czr|Mq~-NfRnQ;-1mHL<Yhc^C@XRf#_$(XaDjrwQyNHB
zwNV!ym;oRdg6lPc^u>WFsDdkqS}nMNxp9IYD1(~i2(ly~=SCai)PdWUgUd#PB}f}L
zn1VyNY&$p(Jve=(0fZi?ZdFH4<abw%U<8O38M0smPGE9gFa?&DXkDmVl%{a^$A1;q
zh5E36hBts&fNGPG5B=6#$n_1DaS!kC4)S0PkfS90U<>-7hkWRV&qF?JriA+ST4quk
z;`A3(P)~`dh<VnC0t1N__<W+ph(BnFktm69q=`w_8jhGCp7@Dx^knEm8$p+Zzo!3$
zp;(EJXo{!URezz1v%!iW=!)Z33>0Qz<gi;1$QkocQkAC}Cq*isHW}8iTd8M<b@v>+
zrWxM=jfR*3h)9cWL|9VL4&S0>UGf)|l#Ow;jos*js{xLbw2Pluj@}p>=_rol_(tt`
zj;aBV>nMrE;AR0f2S&IWpT$-3NRQvhAMq%UIkk`N(2ueKkl5&Sy{K=v#Ro<(2$Hc|
z7m1M>sgWDWksX<ln4wZ!P>lsh8U2tCCyA0NsgfrNan6WbI(Lw>q(*h|k7}_DCJ>M@
z2}d)@8fftfH<^<<nMnXdld9p9K<SVN$&)qtlQ@}_+300c6<dzTbgU<oOKJa<HtCc?
zNrbhOU8_NrSZ0+W2tw^tTuzXAk>QbR$(C(-k(sduMsRV@^A0YV86yc9<d6${$(McU
zmwRaotRM?^Ie5qz8T^2Z0p~L?$(2heRVJ`}3sR7c8D5PAnb}tw0z*lZxn7nTnVC76
zoQYbViJAKmj-pA9i+B!t_BH%5mRz}6m&s6?Nl&ObkE+R<&+-?qxq@ZMPOD~rlk*Pe
zCpr3{46MKkggF@ZKy!+r4$Y|?(qIjE85sP)3dDe&M24Njpi1|!Tz+^D%3uq*pbzSR
zowiVjJ;RuyIaqB37E~|?%-}f^W}Bnwo`({j^C@=q$yoOZpYj=wn0Wt??WuP7383`J
zpBM-Svh<#F@Cq>al(6Xt{+XWvnxM<Jpalw_5Bh--dV#+AN|Kiaia9xg<^&UXG~^%)
zb*LE3=@`^m957m)Eb0%rKn^Dr7`8wT{9vR0@C%PLT!L|jMzfx_sZ;y`iE!Yd?0Iyh
zsH7LVUQL>$OUju?DvM7FrJD6*ASj@)DW&6prCGXcTRMxU2%@K?5B&z6lcNY(7&+FE
z3-yqmhQWu#z+vP-48r&g#GnkM(hbrejQ+rfk5hB^fQQh*4>Xz!yrvI#`XoA97(-e#
zMOvSg)urr7SeII*nJT7&#i^Z&NrZJ;pgNlSNvhgd1EVUBXBz)WDkWqgqz_z>R!5Va
z{y?II@eZ=k4dl=`dif5HRCB*j5AQ%K^YDLyk*mAfIJuy!*06cbk*I@_3)b*?{$QS<
zW>@6E3Uex{i<tqZ3a;TQuH#Cs<!Y|18c6e?Va*jn-w=#G!w<hOr-<>R7}q$zKn&#I
ztp1>)-JqEA@T~RfqPg%$F8UnNDj2z-3=PPy=x4C=kPCq*r1PpTlxnUQi?JE2u^Y>=
z)P=5RgoW%!L%KDh{KA~dSs1cFD)P`c==piNCJ)3gn1KPXKeMvS+MR2990(g2i#m9E
z^$zUnqlMV5>iMl5i?m6rv`fphw)wGT1dL9AvXk=$6uJK|?_dkkxEQ}c4vpG4%FtY-
z@^b$04Vzc9fx)$2TcbIPsER6$D(er#5DvB)7=1XgM0&JMtG9d0w|(ok9t#*P6)#&v
zL-Rma&$=q#5OI*94lAm-{?HH01zivqv9=};tY8bO)VR8ev-aAy(u$nP$*+f$3rr#l
zm-h>bS+x9Ov488juM4}eE3QvVA~LEO$}o8-N<+lZg=wiO((ntm+ZfPDok2<th`S`R
zzz@rN7$&)#CAGZWK(YDKy0UA%*NeT`JC3v~BJaQj$AMO72(m%8D#IYO&vALfu(;<D
zxxe7Pk#W548>p<Cx7usJ_lv*zOKsfSA@5KISz!MM#^@QgU<4uwN&FDLsFGKPHXUq8
zlFm`R`YXW`Ou^R6za7E{tWX^JKvz0@MZjnT44fIVK)A{=50Lu6M-#yn%)%|~!bp3;
z9FhgP#tP!g8Ls+DT$lwxiW$T(1zu3X$MKxHo5Du>!bgn6NsO^EOdlL)Lbkv{Hk=vq
zuv_N~N%0a_bW0gipbpQ`4dhwGgR{a)OvYtw##b4*sxk#!@C%JF4APLro6)8L7)f(g
zSL9&Dj`0rkXF`>rR@Mm`$}kN55XNF$zh{idiLA(<$iy9D3b{ZGQcM}{Dz#?0TYo^K
zknsy;a1Z2Q3it2^hSms^)*10ia)msphrIvDtIW!+tZa?UA>{A}iZHc~0c3M|PW*s{
zMi9h~(G4qQWbd#BCH1PC!JPAp%HHbA%goHpd`Ym(AzkblmEgOtG!H<wTV61>l95I8
z@CMaf%u}4T$s9Rj?9Atk&PNQ*=`jecCK&2q1X`OJ)Y?+&5HChh%Zp(LUQh<g&<Ks|
z1d<HD>r2imtjg((&<Wkb>x>@ljH{n956H_-#83w4#~Ho6jKN#b<$TZz?a?1?zYOge
zm~02i@CHV9LU!;6j6@E6um*}S4};JMpYR5~Wea~0$A?7Ibw~_$pa|037!q4n)eIl+
zyU`pC(n+n<*(=hWu~Jho1!eFF-QfQOHD(0!psv^R3Gy%qZKYfJptwemMO|HRMxYPY
z;DwD4&Wm9UB7D@w!LmI3*2=up_A3Sr&;VjEOMrmaP=HAh&;Sph4RHk65m49K+ti$a
z&ny;ce*j!pZ3+h`7=!St@ocMN9T=1y81Y<crl3*+oEZ0@S95I`5zQHTN!qD=*xCyP
z0000vFiT?K+9QBT0ssI4px1BI3AQZ&tBt*hy%~!42G$U1USK%$aMhX+&JOJlPSC}D
zH`cA@+<Z_5d-utYLC~o!7|QUyoM9Q-O~1a4y{-M)v2EM5eMz<r0EYcW8sOT!E#9&V
z+?pZW#9axfHV><&4$Rm%`N01V%<bHl9o>Q9+^n#}CUmQc!LTVj3=Vf<ny`7_aAFO<
z1}7#DvXBMg5DqL|Vo&l3j3y0lFxrU$tl&+(9Ub3&OWv@JNn&u`wf)}9;6~b@-te8`
zuRGtFQQwg!4RrMhQ{Zt<0HQ!$zaZq~pa|0a++A2gMNZ&d%m?%51w@<}`QX90#c`%!
zNGL|if6xe3e&wGat7T9I-7trWz=iry22m|9T8J3^FwQ3KF6MmWO1t9b4FKpJM>U??
zfKcOcj^k<k9&QQfZmG%JT!2wM+EbviPH<d?zTMqjqej3&Q?SXVpb2jv4J^eN%n90V
zJ|%F@=N&ueE&k%^ecJ%g0B#ij0j_=9pZ>QwP8op?>mCUit2<=(Pzh^1T#821pmytA
zFkIX%7_2Y_*4+(dAPt(J374+Nwm`_7jw+tc>KYsBm*nDg4&(2w3(KJ1s~+uq>+1W`
zs1Ga;bE^+d5K{a=SBW$3wrcMD>I96`$sx?I{(J1nj_Hk2dd~jrDBkTzJMD2)?RE}F
z+y2@vJ^=6C?|b|0`+|8S*$r7hXl0N^k`@>bAMsiA24UDZrZ9h5Kn!bO4Vv%?%KjLH
zs_&i7?+L%L{|-k1591JE+X&DA0AK(J!0jr(v<t5<cubP99_x|OqbDCF(2n!t%JOgI
z@}zzN4{+PI4FfiB<3$hu!+y?AJUe7Q59^W9sDv)`BtrC353Wb=MoE9?0B`}-e%r4A
z^<ba0I<GIpAkPIT4RQY*EGxWS4<BF8_Mj^E<3RQUZ}v3q+6yoaYrpp#>-PDg4tb3C
zm~p&~@AWBv_~P34fB#0deF5We0k-YehClfkoA~*X$&jBJU`zTTqW7PFq2&DlBjEb3
zpWD^m0Iv`G<AC|&pbfe2MxL+w=SubMqzw6d`i$`lb36R>k@~$~pX9CTsty5TPw=XK
z>bD<9ys!M@8v5_@tH-YyfJoHbpB~A7{i5000$~2<zusft^yhE>4=@e}000_rNef{9
z<6o}X|1Qc4{+Pl4oC&`F0O3#IK!ODg9z=*RLxyn;9X^B@QQ}036)j%Gm{H?KjvYOI
z1Q}A~NRlN@o<x~a<;R5yUA}}FQ|3&XHKmcOnN#OZo;`j3q)9FpP@+YR9z~iI=E9Xt
zoj!#cRq9l#Rjppd8nUHQu3c-&`{h;aSh8NN5i6Teowc-W-F9V~RqkB6b?x58n^!N(
z3~&7=wWaUxV8U;QbsId-)-Se&9Y0pcaPMTwl`UV!oO$k6$em+a`{r5nXr29Ry&D{u
z^lHCxHNS=(TlQ?)csa9PeQzjk-o5?ZvvtoeKU=<yb9G%?`EusXoj-4Q`#5A<`KDio
z{LWUtxAM^c>XX+EwLo><gkwklGC6ei?cKkJ|5SSVzugei$KSTwu($VQ5z_~!;shdx
zpRn>n(4Y0<W3WL7A9QfO1j_<$LJPSf#u{}5dy5}s8Y2*=3)5Q=LK9C!F~!Ry9MP*>
z&TBD7pK>|vFVhBk=RO&yD^W!se*`i}r&!z(sc%3mGRc^_k%bi`(;DU*w3OjT7G?NT
zvbP?E<g!aIznqB3EP>Kzz_O$nZ_Lj0u?EY*bX1eKEy1L-PCHE$GtQoVk*6$jSRqD4
zJ$K~ir9yi;bkMTqyt7e9A6+g_MROuYnzG8A)IxsxB*+$ZT=I0LO$!P&Q?VF@G*wks
z-AhvcQ)Q~MEOnF_NKk*kd)2skb{i;BgnWf**Mfk}6)99%MK)PwrE;~{mxxKztZuC9
z#>{)9dD7YLlu@S7dB}MuP=EMQCzpJzyH*<O{0ZkBW$sbtopjetR~mK4{YDvS?jhG)
zbnRW&A9=X#Q=NChfmYj`j$O84haU#1S%nWGCthNaBF7e5{W(yed$OIFEPZ4lha6b~
zl;xLjWVt7tTx1z$7=Go+g;Qc|8OBN~Y36j(flu})7ie=i_~n>qu34awOFr3}|4a^f
zCWaxVx@xN*k~nIC=J`ezGt27uH;}dN3SohW2`6LjhzU(tg7`d}oP6s+i(^g&l1G;R
zdHm5%pkYvRdmy;ktsCt&1p=CEm!`hDamSO*nrv%W;gu|PNcM+HYkt{V@v*G2)E{gs
z7AVxf1sa@~d%pSRp1KGBO_opn>1Jc1{W;xkfj}1sTWju1-1CDNf4q3(?~I)6Zt8aH
zp4o*bs~%hUA+8?MO%^O4Sqe&h_10hS*%lqk^=I-=wdbBw>8ZD+p5GDY5c-0MKfZqZ
zgG`=m80Ftl8Ck6K$Dd@8w6obl7UTKFfBd1kZ-m2js8isdSTR9z^dlFn;MRR^c0dT$
z&3^!VpFe`fKY`HiekVlXgYrj0(ZtUu*4UroNM{g!aEB;1BuEWe*b@_`(1$<&gw6_g
zD3E-_uqVnepi7EK5Ph)1g*<sj<z%?AAsVNLK*VAeWh2BPc4KTiiB&?pSdb?k5l)K3
zVHLF`87;QajnCmC3)!TMbL|dZ#3<Cq^yLqOA#6MqBgX8)=rL>TagKF-2et@84r0)e
zj|WQ_Oo$UOHCD1SSA1h8HA$B^k`ReF;}1V5moa_##~SZo1wWh?sO`-|Z}RBb_B<ww
zQ>OBhG4n@0P&p8FoW>eMStZnBLXNOm(wKxnK?aJkNoF>)GR4RM3XVCGF$zSKdkaTD
z3Mr6O9!`Y%(B8g!CCl<{ES0o-5-SFRHpG1lOCxm2Fl;qVdZy(E8EA$7GxfR8y0jt#
zKd2{6syQxlattS;R3-4T=d_It@)rj^=RmnBxY_wqp)x5`83Ve}q}&q@`~+!8sRD-#
z5Q3u#VdOXo0y=&S!-*k0**&;(4|NiBAS`vMU{Xqun$iv}{wd!@Wg?}M7BwlS$bb|?
zx>TmBqy`x{g;8l}3j^w7kp7UKEW*(~m<GreG-`|}ZNZkTZnYlcqH5w;Aq&Lt<7JrZ
zDouXzJgL@|C+*0937WcBzG|f}b|oXCa-z{*0R=c|1Z-kua!;l9)v=GQ2uZ)7*do=A
zvX_O)GV;1i$adDV3t0wcWkf*HmX;u2NUCR5>)5AG*0dv1%xh);i`NW%bhWn?sUsHB
z4%v>#8ei<KT{UY0N8r}D`t)Z8LL1x*1&6t!CB#B(dtB<ek)%+4?uDY5UCc%|12xEJ
zb;aw$VmuYQ+_jK0&WPT+YBsM@2=931TfAaOVIj(8ucoS#-^8}VyYF>GD+D}X0vFi8
z2S#v$6}(^uH`u`shH!)>JYfn~*uodaaE3L!VGeiL!x(miBj8|y`?{9D6C&n``}>7^
z-q*!1hH;E#JYyQy*v2=;agKGoV;=X|$3F&gkcB*CA{W`nM@Djz7lMK>@K(hZlIN5A
zdkPl+z{*#~a+bBc<ts1b244nqn8iHi8!Uv&XGU|Hx$I^CGPhaGW>#~Y<(y?UyV=fg
zo^zhjTxUDG8P9qKbeA*G=RW^A(1-rP1~RY#84!BRD_F<}5PfJxGuqK&hI9rbo#!un
zfe_1;vV}4lYElm`1I#!_s#U#eR<rsQo#bH#T0Lu8!+IwRp>?iTZR?ugTGzkkwM-U*
z>R;3P)qizMJ5Xx^Vi!Br#|CIyl%3aRI~&@iE*4R-z3pT&+u5!*^I&}aZB_@n*Rm#e
zxsjcgVW)f5$8JlvtNrb3`(@hRwsyGRa_@QPy58G<)m)2`3&dVWA5sMPX!xD(f43$B
zb8vU6%e?Nkj634ymWjM0-te(3oZK8w_OkokYLKV@#pAjzdBXK{SfKdtUFp%sFEpld
z)|~v;DNl=gA)fAugW4?%*}1zXzHgB;T;I|zdcObZ7@L#)=znQCxR*}zS6TKav&zp+
zs9y7=qx|WE(K)$$4tAgm9kllD`pv&?^0XU!?ND#Ks&S5VYP)^vTQ?PHd14I_l?O)T
z=muduW3F3;BQ$su58eqA^>@GhFJUkC*a-u9XG<RKbyxe{FOP4#M;kIxpL@tL-+0X{
zUQx02$uH_5oB|yvAM$tya3Qn3d&nanrzDU+zGiySb6)D6hYaOuZTZQUJ@RK?eB4P7
ze7KMP_X<yY=!x!p>GM8Gzx9bSa&e!M5kwmQox{yy`V@|ic}Vuw?+WN0Ul`%Dn)vKD
zey-o&eBUqs^Kq~K=82vE-tT|?=pU2dpd=`Qlf=6Yz8i=e0l?|=J^p)(_LDf|>kJ4~
zwfP$i^((!?usH{0KxW`Tx?{EvTtMy01!=e#ny8X1$sEPlBjY#{)p>_^h!W-*LAJv@
z5p0Y0vp~n7z#Y86==(qV^S=y)J{M!YBD}97tidtihpl1-BjO3?p%Cyhif=f<CG0qn
z!$G&8JRju2_=`aNDnfkQLb2etGNd~qL_#IR!YsK5mx`9h;D>vl!#cD>JIsY)pu#r9
zk7-N7;|M!1e2gxXz%lf|Ak;wA`orV@P&R2Yjz;9eOfeYIAf{ii#7o4)OKg%CkqJA@
zi8-W0!HYzn@Iy9a4fnb)pF72}6GWy{L_~B&SQHH>W5iLMCV0x6Br*yEp({fH6k<RN
zX#hrI*qeKhxyFE(uhIu~0LHPh#iW2l>_A0T#0^v|M6Q!XS9HW@<i_j3MVm4TQ9OvN
z$^~+u!_p~`a^x7qprj+|#-pG`X%s_1Ohrcgf^GDTcznlwe2Y_32D;IyMxvM60h)RE
z5DvMj4k@VHQJMj%6y2LAe{e^BOt@uO0czw8eWb{Z3>iS7szB+b*c*y6L6ex0oo+ag
zgmepX<U5>TMvobaKY5ag<j9);w8@(UELq5hKw%wr5}|uo9{BksatMc-QpvU;NA*IC
zovIMrp^^BZNt~3*siaCZ+8ze_27%MPa5=n_xssBpAaMK(a!eE55D0g98xV=gs$|Qy
zbW4S~O796upem$(AO<HA3Xid-f>KC=V90h_pm4aA-BHW)8$}&5iamVGx6p^iyuyUw
zhsG2~Q;|%akj%$i%;Shl)^V%<!3p4CE1;1Es``aO5i7$~3UZtvR=^39$%R}f6tA&F
zs6@>+Yy>WFg2XfeC?pN@C=7XsNQCIVzlfpX6wcsGh#0blvr>wWVI9<99oE^J-|C#z
z0S&%k9T@TqYakYKz&=_30gZ2{hkS@m5eWxt5KQv;Eq-Ag`^Zcg!A#Mp66!g@exM|N
z=@ovED2lv?+%yX2^bI};oxuQ3-x$!O$cOdnik9)dd}z#Zv4+Ov&hils7jmHOJi*!o
z3U#;}pmfXtYE7JYhtNnPeNfQ%ysUn}L`u2D!{f;QB#3Tkgiq)ka`*&AsD#M;1afGE
zKX4suu!TREl1iwAbplc$-JMEk1XD<gk@<s00GCe~2$FG9DCL_sAezqkg+T}md9Vdj
zfSE>6if`!#5qSr5w5Aaik&@Y;Zy|@hDG=kV34S0-PT3G}u_kG-st`F3IyA=^1kv*d
z5U@OyGbIPXsE2O<pq^VPnMAn<HoX;jc+@zY2?iaA1GOFksRw>AL4&wZu~3Ic4Uj^S
zhqO5qemK)k%?EN&2OQGStLsoWnNU>%QG+m16vfpigHZyRf?+TPJK&os&;)BRf+8}4
zGWdlokcUs00!7FLBS2MUFoJ<#R%eA)Wtf5i;)0|wg*ONXW%v{?;E#E50)6P#Z&inU
z;DaeB13Qq?Tqpx+7z9)J1|w($Bj5uspwz4D1~&~L2bvakIaKDHR9@=W?vsXYkcV&B
zSAhyu7~)igRao*&Sn>P~Jms64xCyo>SdV#BYv7J<0NC2|BGwU%j|muSfF+Lo9rxkQ
zm$1~{k%xKzU_DMLQ19HsPxT6EI1<p1R2V7`2sKCUWRrTxk(){j4jqV(nTL50i~+S2
zHnBn`I?-IU+TPk#fB1wlpb;a`2Tf1}fhg8{FoMvij!)nNfpCJo;fHAz2((q(d3b~E
zQHO0sieH!lQ_#{f@CQ>UQoPmMfe_Gvc!NR61x<K^Z}0+tZ~}GsgY-0tdnr&f;TqJy
zS%Lu6-m#9!-CX2!2{yr-0?|{xNzVi2oAEeP&~1#&B_wodjMmAeGYVLNS<{~th;RT<
znuuA^i9tBESrM6s>l_H3?FthN2iQAPPKnSF-5pfzS9uuFSM>>{C8QY42U>03aXC*I
zxz(%x_1@>o+D71m*EAO_&84yR&$pGODPUW-)!OwXSDfeuyG4p_7z86Y5H1*oED#a<
z#b1Ho11jQzN_fp*_=Z35hb-`i$2|(r<(mqUhMA?=t??ob$y^6MQ_%_CocI`lNL1_{
zPSefYcaR5t5X{w0lcGJ#{uPb{Er{98-~bBM!+TSm*xdt_huNWCf6yivAzrRvi*Nvs
z9AQov`Ud5t({E^6@RQ!2*kPbtDWt^_9qHchwc^*x+F>YzLa87kRaYaR+4Oy1fneWp
zao<mX-#4%YdEf&2HH!3<g*On0X9ZSvK^!^uhep^Q>u3Zq4WI)~;01=<qR`W8!3k^s
z=$!1iUDQpJLe{#_DbSpV&;WV|T4j^-m}DG5-4Z_GvrH4*^BBZPq_e`_ftcOf+npk!
zVa1Gz8)l-$$Yg==&D(uhqX^<5&S22Z;7Z|#dAN`GX=0vuVmKj(J}J;cfnuep+AC(}
zx+2>wC{ll@ge=H{H^_%@$O0#@1ukeEF-BuDZr?1}o^SRC_9X@<$kxS03QgdGGVp?p
z=?5pM8+LZ*jp>Fd@PakSr8nS$ENFyqKwt&_1J4!agjENeV3XhK6EFImLj6v4Fld~B
zWP(lz=zSkf{jD^KJq<Za>?7d-DW8sJ3+T0%@1vcYz}WNDPIO97??k}W(Nr7%9^{hl
zRF}qyd`Q?bC5RtZid%*ybc*0x0iD?6;@{Gd(XpHkEoru3lM0r|-<joGS>|S@YQS35
z!Xk<i4w^bniv6($bzWM7puz#{4UFBzU^Whzc8Pu{QG<ZpkeNi6@Rh4x+NrMUyEY~x
z(CfYC>%R8uzXt5U-s__f?7}u|zHTAVaL=Bo7n*kL$A;|4mh8!<?8uHn`_So{06hC3
z>te|f`(WkI#cYbk>(Z{G!$$4Y_G`jc?baUb(a?v2<KW7s?b^2O+csU(*6rQq?cVn7
z-v;jB7VhCD?&3D?<3{e}R_^6y?&fyx=Z5a+mhS1M?&`Mg>&EWv*6!{9=I-wH?(YWg
z@D}g!Chzh#@AF3Q^j7cnX7BcP@Aro9_?GYartkW;@B7B@{MPUN=I{RY@Baqy02lB9
zC-4F{@B>Hi1Xu6{XYdAh@CS$R2$%2)r|=55@C(QA4A<}t=kN~q@DB&^5Et<gC-D+D
z@e@b!6j$*TXYm$y@fU~j7?<%Gr|}xM@f*kS9M|z3=kXr*@gE2BAQ$o>C-NdU@*_v`
zBv<k!XYwX@@+XJ#D3|gnr}8Sd@+-&kEZ6ca=khN1@-GMTFc<SNC-X8l^D{^DG*|OA
zXY)39^EZd{IG6J|r}H|u^E=1$JlFF*=kq@I^FIglKo|5uC-g%9H}peC^h8(mMQ8Lz
zcl1Yx^hlTVNvHHmxAaTL^i0?EP3QDZ_w-K(^-ve}Q783MH}z9T^;B2&RcG~9clB3?
z^;nnnS*P_{xAj}c^<3BWUFY>)_w`=~_FxzGVJG%tH}+#k_GDM~WoPzgclKw8_Gp*(
zX{YvTxAtqt_H5VoZRhrG_x5iG_iz{YaVPh3H}`W#_jFhHb!Yc>clURP_js50d8hY!
zxA%L;_k7p)edqUn_xFDX_<$GqfhYKaH~51`_=H#Zg=hGNcld{g_=uPIiKqCAxA=?4
z_>9;1jpz7|_xO(o`H&a+ktg|*H~EuC`IJ}rm1p^uclnpFhxwS7`I)Ernz#9z$N8Ms
z`JLzap7;5m2l}8F`k^QKqBr`ZNBX2!`lV<3rg!?Mhx(|O`l+Y-s<-;9$NH?-`mN{s
zuJ`({2m7!W`>`kcvN!v)NBgu_`?Y8Lws-rthx@pf`?;t4y0`ng$NRk3`@QG;zW4jT
z2mHVn{J|&u!Z-ZGNBqQB{KaSd#&`V3hy2Kw{K=>M%D4Q>$NbFK{LSb5&iDM!2mR0&
zeYy__03rDV2_gXh04x9i000F9&;o}5000OF2Mh}f4i69!4-OI#4;2#<85R{C8W|xT
z96}!lB_bawB_k~=C^RoDIyEvuJ2*W*L}NcDNkcwNMnRND5tv61NJ~*vO-L_Nk6Kes
zG+2>$Sw+QK5oKIfJ6)8tUly%k8^>T8Ut?-*V_nE&9z|rDtz{%gW}L}pBFSkcO>3QY
zY-P-CEW&Oq&2KP!aca$RGgfk;z;ZKxb0=ALsLpmeU3aCKcQSK$fP;8&(0M(CdNZJU
zH^X~BVtuR8eM4S<GmC$B?SC_cfJf7SM^u6}Yl1j-f;-cLOu&Rne1$=ig?#OWJz9o4
zaE7gchL6;TQf`Q~UWq|;iLl0rQq_r8iHl0_i$`IMMS6@&nvH{Hj!D>#TWOI^e37@r
zkzUx5UX7EUmXlc7lVoj_QizpUqm_%wm1NYGX783+ahF$ym$%xNY1^4>b(&m-n!(GO
zYoD8Ci=4WVon?ETW38TQ+@53Io^!6Bl=7cv&7gFCp=REpcA}zhf~0Jnq_EJWdf%jc
zho*6rro^zOck`xm;HQ9^sKB_Wor<Y+;i-estA&rPdz!7yxUGY}uA<_uiuA64qOZl(
zu#1(kg5<G{sIrB;vx>yCr_-~On6!rFw3Dp1$@R92owtkSx0va-mFT#Z=DM81yOqql
zuGhPoqr8)`ywdBvo%X$#=)R$+znH1Nn6JOuy1~%Y!L;hZrK`f6-ovKq#H;tkqp`-L
z*~Yo+$gj4^sKd$B(aNpt%Cq0gzTwNVy3DQi%&^MN*Y3`_z0a}0(Y3|V=giUE<I%hC
z(Y@u;!^PCP%hco2)Z6UT!}Qd>`P94F*1+-B!^qdZ`q#no*vISH%FNos`r5_W+u!os
z%+%fN-QD5(-OJM6%JkpS)!@$c;ndgS(CXsU+T-)v<kaWo=KJN==;r43=G*+{+1}^b
z?daV1=-%b&@%-uC;_BV@>f!n9<L2$*>F?$F@966A=l$^K?egmT^6c^S?(_EX{Pyzp
z`Stwy_W%F?00008{{a0797wRB!Gj1BDqP60p~Hs|BTAe|v7*I`7&B_z$g!ixk03*e
z97(dI$&)Bks$9vkrOTHvW6GRKv!>0PICJXU$+M@=pFo2O9ZIyQ(W6L{DqYI7sne%W
zqe`7hwW`&tShH%~%C)Q4uVBN99ZR;X*|TWVs$I*rt=qS7<I0^&x31m0c=PJr%eSxJ
zzkmY^9!$8f;lqd%D_+dFvE#>(BTJr4xw7TUm@{kM%(=7Y&!9t#9!<Km>C>oFt6t5z
zwd>cgW6PdRySDAyxO3~?&AYen-@t<lA5Ofu@#DyoD__pMx%21Hqf4Joy}I@5*t2Wj
z&b_<$@8H9W{~u4jy!rF!)2m<4zP<bRyV3EQPrttX`}E=K-_O6~s15)IDByqu3YbKH
z2qvf?MPwA{;DZ3hv*3gjRydFq5N0@_gcf$_p?(+wn8FSumPle0ChnlZ4lQi>;fpY)
z7ovt5av0-{IC?i@3@4`O;|@^-*<yq_7HQ;lJKCV+k~YNPWD6~%@Su%HR%zvOGbZ6A
z5HX~%B@k9vL52-eUTNl;#mz_~gjAyG=9{>6v1W!Mv<c^(c)FI24N&$eLI)*486cD;
zbRa^XeY(LAIN+2NO*9x~6U{y%(GyLh2C>7-DCm?F&!u^WDyl*|#K4O{a<(B*HZANR
z(LMlX|1(lN0QPfH3>^p~QY;++VUQaF?jWm3oOEDCLiD)7$*9btxx=XfvD1Q$yu9#g
ztRvx*#DTZwx@)fm@d98MZb%u!NW~tDkerq@>#mh{Vgzdk!xl7(8-hS85I(fvp{%XZ
zL?X-~f}pcXB=B(Jh9#8l6G^)cj{?pjZb0h~JQUL+OeFOVgzG94uQCw7{&HfgKj<t%
z1|GN&bZ@>cyAesTz7iw|xc=~xLJRod6Uivq2+{{NF~cm-J_>Uz5H*oNdvK%a3WSWx
zhjfYzu1SdOPd1S#i;qC`M6yaOZs_{%+5B0u3OfvOvWPPe&D*g+NeDQKKsyN7g+Gf3
z|CkLBh6WggKeTqx4?F<=382XENGag51>q_n8F=eWxZ(gpUUz_Z`?Gm~H4nsV2QdhO
z%s}7}2<_(`+>OtW0LJ1^Bpp!hPu{fn6E*Dtrhrc$p!@S*?~QsRpde@`{~np7Lyi#O
z9kdXMLvj~H3!upSSHeEj>;MEh|E0h;fRQZX58yF)!#m-%BHn=;=+sR)uq_}{YzNMJ
zOnNiCXVd-n;hSBr;z0`_An$r5$R42ffeZkRLKrOy-9Q=?AQhZ0b;d$Q-CE!e1S)WQ
zH*0|~`lbQ_+75TRGnPN1AVP2yDjMhjoEyA>4gj$%Z@w~K2f7f6PATt)>4}1X|B65m
zwoOn#=W0mx2m(Cm_0J#phy@-bH@?sTu3hfiN8t_!Ahs22aDX$PKU%abK`bd6xSF0n
z{v@&}P7y#I1RcZt(ZopfuUJXM1I`K(jXp@O1M$FMqZ-(OebljkfIEahFh#pCR4#W>
z^T*USmpgU|uLC8_8G!bo!*~Jlli|r*fJz`CT;M7NeGrHc1!T5`EO8*f>Ocx+nSy4Z
zLj{1^-1uyFz7B|t9-G`^7X1N=4h$}DY9!OLDA)m7;Hq=ayk#!oI6K(6DwedYW#4K>
zI|<IN4Q9&*fM|h13Dppg*ra7MaFss+?#&-$f}{#pnS?@BvIFhv<{|+E{|_C4@}K2V
z69@hA#}3G@4FXDmCkygQfn3j34x`0B4$*-FiL(Q{90=fY2h2hWlbZh-+|7WnkBcrV
z8}x|>uJ%^AfmL*Ca70Gaz+njhf#ae6i0D3eRf4b8&6{<L!PhRz3k-^EcyWYiBqWNV
zW1&L?JD^9g4z!Oy$<qoKg~u41=?^(gkB}0goe2D4ys-lGtl$C1kV+u3>j}t_>|kC8
zkf%fdl^~nhzz2Y~MY?{3PY^@GN8eN>kd6AIqgreqNR8=_Xe2H`?Ib9Gx)eRX$`Y^u
z!pABMg$FscpdWgzXi!00s1iudo8kh{TK9p$UI9o^q2+4~`jOfe|KO5x!Wft2u3ES@
ztnzLRY5^Jcfh!S6ZhB=!t8%@Ajz}EB8~YRxVdG&5H?+(l{U{L8AP68JG-@9qVqph(
z(KkgEmaCyntl<hLkpHM_6fqD18S2(Kg5U}de`<lOzzZPpo(i)fu!6q0+bc{V1D7HI
zmN)&e3S4%#Qy7$!F~8;y0((~=ocNOny1*d{@>QODi-eR~AVl1%_OPoIff`e1*5$hR
zI(<k&3v2*{Hk|5n_49`%Sg0g2<PIbBpcFxR_7PB!L5;Yw*g>>9WC|A~9w#G6kPX6Q
zh2X=7(S@Ru2QuY?RC#1uK8T(6@#TxX_{`dAL!k(igm^?E{|Q|Hhd0(dARx?5CytGt
zlzPe&45InZRf^?+l7Ku;bRh~|2m>$B(FV)~$W=e##13{Ag*)FQ9@_%6rgOAP0a<|^
zWN@5-fItgsh}y0T-L$G#t&~m!NCoi_Wr0LM3ki=h)vV67u7T1875LiMFDTrD@Gy#O
z&Jx$VPPVdpB5ViYVcF1*_EDN$pl3__+Sq2cFt*L@ZVSVR*$%h3$4%~XoBQ18PPe+(
z&F*IPL&z1`2fPgu<#yW}pkz?;MWUoGinPJJ4jmar(SnY8YvkP)nRia*&G3UDoFWWw
z_`N3{mE3aTbQ+;Wzb7JZf^>kwdOgc36c+_>X9NfX|22p(=$a65{Wy*T3Nt~IC=s^`
zNahsJxlz1PH$1RhBD`<|8N{e@f*?ca$lHe?2u-P22xG^f=!Y9BcC^%G106l<0654%
z27CyE7Wo#08nx1oLyba@*47A%5TZhbxO^b!;6zPZzzLHX#7Pv1``qhpaGm>|C`-4<
zDpFtxOC+)A0@2wbK*2#bB!L%6P?Q@=urkW=q6=cwV6T!83%$kw6ojT-gF?-fs<wa^
z`xr&;AQ);Om`xCOO{G7m5e5+?foM@U5IkDYuC>D>3L;3bKlE5Tf50A<iRV&-UOteQ
z<}?g<rK^+h!6oP(Kb8AvK^Ms6NP{>Zut`V(|2ksPf&fb>8+jAf-`8&w0}2EkT<?OD
z<3WZlVEpc&Xzbzp4TR~b)gLJ!E7>4EZZJ6Ba9x5RMgsA1`_ciYlQd+I4JFiKTG2NE
zVg*`tJt`mwDj+_NMJ}x~M$)r0@N_OUggk2}2qG{Fb%PGq69csHfxvP%I}-^l!h8$J
zEkfjY9bi5&&;oUnJ2Kch^I{2rqc0xEEx@t^WKecHAbOrdcu>NAR45bUwJN!j1TW`f
z;E+iSrFH&bN)FX;^dd<-14!(H56V&y3FvVkH*lPAWR{Q($3lTx(F}OdBIj~F=0iKp
z06h4zL*g_&SXY85Ggr66LH!U5ZO|f+|Dr;Gcr#t#Skps0IOq>A1uMP+E9W9P+!Bd9
z1S`k#ANq!gN?3;C5(SGeOP;p~d4nlc7>g=_IJ6K8(DFK1)&iYUCkGJ&s{jrp*g^fa
z1Dt>kQ<wzpVhIPbhBl*s{-6RxlXVy-hjh3`ToDa606BR>4}6$H$S`_%fCrq=3_Z9t
zM8hX!g@|h>CqmZ&k9aKLD2@%ZEH!nBndp4RC0V%A4E_+0oB%77!z-oee855vmy`tI
zhzB(k0||*`viOiDK_*>bEBoMj1fh!nh;!kySq>#jvJ(p;Py&m<LD7%`cLgcTI1o3J
z0w)s*C7=R$5OTWH1`kt>c6b&2|DXaTAP9QILD$m)@KpkFga@FI0?VQTKnW%N5QGha
zf*cej(NH(1V_dv&Jw$1g{tzgffGhUMEqS9d9gs>+LJuNf14CJq|JVVlB9Pv9ieE!3
zkEa5Z^Mkwq1U8^>5Sf=D0dG;j3-|zCok9l4un%U55I6^SlrjpTgKP}Nm|X#RlO-$H
zLnbXCJNqDENkA!eNjkd13x9$kiiC2)Qz&(_EEsZ^m`N$L&>}(DmI46}&@)^FWtOxv
z3YWQ8@}`#lz?KC;kPJ9Gf08~GCM7B$J9>GXCBZ9QayLR54dilN643%ckOV4VX?)Rf
z9Vt--@o*!<Pzj-M1}PBS|9LcV(|6m6mlP3Zhl!l*84}R|a2J6Nuy`2PbBXPFpN+Ae
zp21q^iJ$)Yp8y)50y>}sTA<7_ARL5H0TK<(rYfxSDFR|Xu!B*f6FZm~AY*46*trpo
zX`mkJ5D01xwq{Vypf~0KJpkei71{xKU=9;%4mA}ZmS7GBA{zNd5u?x|)=3d9V4r<)
zqbJb}9r~fk0U+jZq)3{iO1h*>+N4f;q?X_gyZIRwcYhKQ13NkqLrND_dJ>OEq}O4j
zPdcV#TBb(|I2oE5JjbFx7ZF$rcX&VsL_;`{&;@NED~Av?Q4kH;zzMuy1?J-oQ->*i
z`ln)q50+r3b1D~W|LSuP7YR`if#{HS9OE#NDl0Kmj9Rr1i(mz-2X?$5c3_$uW?HJI
zs-(o1rkD|U7V)Mz)dGS*3nCzIHedz3U<0`m10tC<o@oQIU_tc23o(Fkz51)j&=1pz
z3qYVXbHS<<u?Rpw4Y<%KF(5neAOeCFt<$P4#+3xA)CIOWtfE&t;xnqo5eY474#2Rk
zz;LA5kPW9=s?NZ!@Oq@gXPlbheyutz;sOde`gP^1g#<M{yns>)<quY1oIpUV2b-|M
zAOg111<WcJ`U-#bw`IJLb_OwWi(o|X#W#w=vEcTlIW<=-D0UGzf#zx)M(S8V@UlnR
z1zixYNy-UM|LO)WTLLzVq<FAkmvMyx;SCc>5YfPOWoBQ)vI;;s3KAm-wu7q#RWFc-
zDq6F!iN`GxyJLklv2g*k*^q@V*EK#n5XgWbol}`A09}$~wsZq6?0`Q^yD@WEhbvng
zE!zP~`mQvKr1UbTMX<9;>JCYus*^#Bw#W;>Q*SLm52Mh1y*MmS)hOsdKtgphvg4{b
zgSAylteVRUJkvK^`xb_Kix@c&f0Gb%YJ?buGpSoMM+QY>)JEV?lXP3R!*RDr$_+9r
z3P;KfVE_zP&;|ZO2EgkE!+WHuzzN&{49x@#)L;&&&;>={21)w2OB$nubr}+QG7viu
zySFto|95x!C_Fn81I>UBWWsgRgSk`NRSGKtgVVlU5DUm^ESy&t+nZAsNf4)t5PA56
zKUQ`>_P;$UHGyK5tYTZ7K)cpxyTXCHNSX?fccj!1J<#d~B?_ys>I@}duVk<a>9+%O
zC<2QR3p0wO*1M$8v!#7ur3Nu?-TRs)1P+kq5L>375usK1&<{DL6)qfa1JRd%i88A)
zwgW*W!un)XMi4CQz_?+;=HOULI&~CmQ05>AT~MO2U=A_H!5)01eS4%U5(-M1!b<9h
zd{J*|Ob}7#O!%r0-P;cm(gOP+3>w=KIcfzh0G~y%#slHU9aOCwp`0neoE4S?BG3o@
z|49(Mz(Ppq#MyDAQk<kzYz`HCq*(05BAUe_aHL!Z#?MQ^c;F@6fWm-#q_N-*=<vvP
z0S=id0^o26VNg}EJj<}W2)67ExI8bsbP$YIJKm5DgEI<b&<6AA68(@@N8!q}EX&Po
z%M+8!y9^+`yb<py5%iFykSrY#jHH!($yc1k9ZU-)5DMHtFQHI7N16g#ObyY{uG~-p
zsbI=U$}8NW7j;Y#v9P}m5eaYH7x_F9``k($fy3Ke9^HJTz>)&oAWlcR2w4m$sC1-3
z6$WH*q<wH##0w=V00h+wxTC|$cYzP3=n#wg5C&}*Bux<~eb8ufw~rDHWXi#%|D2>U
zt)$#=)8>#3HSNyP00cW5(tW`W8)q6s?b2suq}1RfPBPOSytg9C)bnf(*CWzMebvm7
z1Rfo)It|rG8Vj=b7x6<C8|n~E{1Rhb73NviSPdM&6CklrqM(xwBdVf$lMWM_4lxQK
zmXHnt(gNx5)<mKbeaF^E5zrk0q!ZzF8<C@BXqW^&Mn0Moh|Lm;9TNXn5Ue5sk=53`
z!8-uLpf#$X5t3&BqAC-*n*t&`e=R^3Y7k^25;92;|Hc$6-4R_n5!l!fm}?Nb&BQ`+
z+bogWn4NM3k&>RBAm~u5$Z*ySG1~)S*hX>G9MPz4>Jao03o(EW1?LZW|0)Q3N~d=E
zu6_!rQd58|hq-Px-r2p~1t+L(0E@yPv$|5K<~<YCy%N?v5pgGWt3WwQ$8_f{W9?-H
z|0od1o!tGQM_qsi$D9yf7j|ky%sy7&KBiY&*L6}ybvYH^T=zAc>ZxDhtP;TqHeh>6
z0A0Ge2w6jzwu-C8YC%;s3ekYCuIl2qN(&~A;@%Lf!zvK*z}XoV4>A73T|wdzQNax&
zW8mO;kf$h$$9TeHD)*h>3cerWG^FE7dTrpVE5kR#T9uv$ddPEmhe|r2r%2!`tVVtl
zY0VM(N)f*;5HUcoUmLKrpfeJZuwz8BbUrM!fai@>m>Pv~oS-fS|E}i<`_C@%<||RL
z@#kcm5C&1e=(EQ`TDPYGxHaO_fBx`)J75K8S2I?A<?z7?DMx?yrx1~lvTH;uje@QK
z*h+f!facYPP~?ER;|8!I2q)_km8}s#OIAZm5S&n7zD?*+tCCNf=b8&eHh7nRE)Y&D
z5Kuekg@ti~U|w#}2l5-bEfMS~;k95p5R0%6>vRy*FgW591-T_5w4ztCf(%dT2286p
zrEco((FMH3g<g0N3@ie|P_E&)M)xO^aY*fFK8<gC><{D<!mSabi@1hE5M*El*9~_i
zK#|MtP?c*?-yRR0(hn(MHm>SS_+Ysxv++5V?E(=EJo7ry|M2ZI5%DQ8y8BYP=FZ1U
z!|p3Y4alft2SSX-$U$7^56O(+ovrWf0R&xu4#<O%yoeA1Pb)5{n^q775+aSdV>`Hx
z@RZX6vg;H1y%G7lMh3?T8Gj)<nXC1JzO{2?@*4}@@Fe#fU*`h%>MIad(DsD|zXH)9
zBH&1KkKaX|68T$^kxdIxV4mv^fGZ>^CYb_|0+J<QgHVKWDPTKpAOhmY^!m{^!ikZ-
zlMn&lj~!qGZ+2LKlLBsl@PxIJpaqAjlE5mk^j87HX}|VhmJm3M4~q=D1wmwnnbKdu
zmwpMDl9UAfz>g0>C3tE4puZmQCYXdN5i$q-7UA40|KaE$5yu>&_I=^~EkVeJ93@dQ
z{mtT>)+HC>&Jn*%2EjbcPSP%W@%}Jz&Fa7Z24V9e0T7X5`6F1+;6a256)t4h(BVUf
z5f|d)CDGzVgZMCR<k->UN01>!jwD&q<Vln%Rjy>&(&bB-F=c*aXT_z)nK@t9)Y;SL
zPoP1C4kcRD=uxCel`du4)ag^GQKe3$TGi@RtXZd`OQO}QMXq1PjwM^x>{+yF)t1~R
zY;D=LZ{^OVTi5Pgym>ED)N7S*U%-I{4<=lgWQP|17Ik3UAy&M`9lE-S94}gAH~x}D
z_7|%IR-Q;ddv3hQUyH_x7dL(!d2;2;jIV}1|2jIdY1E8WM{eEtbz{qo4G$+?-1u<D
z=I}(e<Sa4}b6p}kBh9#rIUteE$v*Cpv8Bj(%;iR`oVoMH(4{w~F1$O(@8QR%Hs84U
z^XSv7zvtiI|9`8JGiN{o3pDUR1PkQOs<1@sAVCNtL~uc>8m#R>2{Vk4LI6AT@Iw$~
z5>P`D75wa~xEw5TMFKgLD#Z&~WYNVCYqar393^U@1sO}EF{-~}?2*JDp9<2b5r>qp
z$Q+wI%8iPglyWI0H3Xuo*=#~83FxYn@X9Qc;?m16v7GYEqDJY!idE2bQ>aM9BNM_m
z{h3q3H}8zFPCk8tC$T;Q6%j){3+$o||Ew%Ds*URkHSo}@6fKHTM;}F0P)u8*g$#m(
zi6lyYyom&zOiKkRNk^G<3PvOet#rE+t75e%R8x)BR9r_AWYm2)Ijx{1@Bt!MVlApw
zPgR>bl2%tMO?Ihei8>b9TZ^?8qft^IqaS~w$;=;iy70$_Ys+0|+Bu(Hindl?ZLwOZ
z*k#t;0o674-h;d$V;_S0u}MpO@r@;vSYoLZJvWnc=2e8xRG49V1I9N7D`MD(Q$Z{l
zMPi9j>tf+KyJ%sbXrf8fOrv6nW}g;5zS9|zNj8~5l#5cCWtZoKdE}Bg_SvC*O#3<D
zcp}kFP9?!(EFP_9H7d52$y{#f|E!!Y3hG9yoVo+1hxYnwy`qU^v&hOe`)st+R(ox;
zuLD^|rP-EyZo2EX`)<7RZVc%j<JS9czylY2aQTuZ{BX8gXrqmp!4_*Demm;g@v)3X
z{PMN4%bCP3L?Ih<&_fs9ZXhB7!r&5P=^_#vMtA*n*cmJR^c7WSJ$B4nh=g*lMnNr`
zj#{9lAbi{+2#?))hbkJf@j#tkdX;X0ZwQs{5_;^j*B(LXqSkP|>$eww{7SpeT0-#2
z*V7qGrfy+!<*kYVc#hzYhTP+mkH4wSXji{bXJp4QUy|M1{+GP~9?(n9aGwDuWE}-+
zFM$yp5(9PPzymerd=ykt{{RuQKd2P#Q1qK0@hovDYWPDKUFd@G4v`H(L?Ig9aDyAb
zK@fVxA_nL{M?dhe2u@gGczD<pHLO4?5C+9)JmTP;+GmbFY>q&dh)xTh*F<-5BNbTe
zQ2?)Fi7O5$7UJmw5HQHaJ82P(Eb^i`z<8iBM#qe6>|l2Em&Ba7<01R7ffaaRgW>t3
zg#PHqm2d%sRm4LCoZy5Am==Q)EFuZ3pa(BvfDD3g!UiHpLK3`z2N85ZP5bCT6n2z^
zjp5NJkQpEytAw8EO%XB9IHN1clnqhXaz*IL8O&y>OGn`nm?YvQ$b8v?S`Je}o@qhj
zR0$JvG~pq%NC82T{}9MQ3PS|k>cT35NDwRdDh9jb1^s}4NrK$3Ab7x%2;k8HbVLCZ
zk+|bCWnwhyDU+B2JRLuisZTa00iY3L-_hch&w<Lw83Iixf(nWlJRG#4C6Z1(?YR<n
zG+_wlaEKr{H7;z@&k|7}2qFdXEjRQ*kn}6aISZoB{1K!C>=1!JtdI>$SoESUX+sC7
zI8hQ=!iwOrB2bNbFzLhsJmEWPQ(u|Xr8-qY;JMUJSF#UJsG$kKa0o48fDb`9h9HCF
zMGNq;m{ml>toUf=N)O^vf}o=W+}a27WJ*(;;#8+rT?uObDOHgDRH|%bs#8(-*TEiW
zf{8tBVj<)l|3L9|C0H;AR~v$l){%h>$%}yqVnE33SRn}mAwvg55Qed`w4@>+DL7S7
z0$TJTc_n~HO>b%mOGp+b=yGgtWu!*m2A4#@6>f3grCXJ_0}B$tNkZV^4}A2a1?a>_
zb0Jb)<O+qi#^tVogxOv24(Pk#^=-tmYY|m=A|$@ELJPii-T*a=yi$b)40@5Fg$`&7
z`z-~5da>UvRHIOt&_RzNvEMxOs1yknZXy!lj2UENzP&Xsd?BKTYlx&D*|4sKr?TA%
z12h>B000B-TOtTRAOHm(P$nSY006*ZNM~ShfmjfLY{*Cl5I{f!dISR>R|*C)&Jc~=
zMF9<%|APepK)@D4EY%8om?8U+rj!E%;wJ+W91mE4gf+BSb1Z<x1S&<0hlFGV33x~>
z2r`R+Tq$n=pvDnG^Q({?z-BBt5m`QJl&zeQXBgtofWb1KT}c7~5V=5^*g_soY>orx
zVT%M3vw_O2=m9l@#yR%y8O~4&a15x<14;%YAmL?m^a9o9DD{BAk%%qa!p3bbb*M=V
zi3GhF7H8nJIjWI|E%cW_x7flNl2IU7f0{sXo->3-ooZp5qZIcog{&cQ1~r@G)v>m8
z9vq+n;9{Tvk2dr`{XA%cNW!w{#!I2g&BZti!MhUxfCCHw0B?YU-U$eR1e!tVF%Rg{
z{{=b&lS`~-Apjr&3;+O)HE;j~Xg~unFvk`SAOHjqC=mcaH3lG%Y6J-200G$ZfY?kR
zSOCDu1Jb|)a@_zJ00006kZ~yxU~m=;hzT<n00BylfqE|h-{yb;&>tZ2W)mn650Ci7
ziOv85J%9w}cz_2U0003rAjiE3`N&J22?Gcq0RX_jcdH?QfWKRr=VrG*n$Y34&&Azp
z=O82i5bXgW+RHLd_?|UUfvFFu(ghm$fNlYRsrLc^^3DVRD9-9+5O@I%(18wCZVn-2
zoInh~z<?B=;0G|E8sK;_flf{!3?v}b&1iV86+UgWQ{BYo&;bA-ad;18qZvH*|Ayk_
z?Q8wUTmzL~^`dn!`N}&P22dZ6)Ts^t3PhgcvLAivlW_nF<oM1EH3tMHKzD$$9o^<o
zL)_afU+}xK_O>Pv0z6<K2rPg=6G#BSEp2A~0>JWHh`2dOKmY`JwgJh!0@=CyVuAW&
zJq*|{pfkNTlQxyZJOf}q1Bp3dOEK1aylMad7TAKj%fJ3g00LkESz9(aBRq+dxW_Yx
zXIs9go4U};u?<WF1!O<~sJQ84!6YjX7!ZK;TRV6$KZj5SRS-hEn7beRpPlQq0dYJ7
z;k*HHh7$+?`y)L3Q!=u{04*#q43NJA5kSn-Jn<UAY#;!}0{{rnLJZIV|8Fq42V}to
z0EYxv!2@}-0pYxqJA?L{H~_G<#!IkXKr{f*08V4J0;w+;NW{x)LFO|D2Y|uAW46Xi
zLoH-O4-mr%(167v0WnNMR}w!yfd~8n3N_#;Bcux?^u+NgGh8bW2XFubp#TFI5N?ow
zMjSjcyTXDywgO4G5-bo5pnwA*KpQIn9S{Hk%LV{o0t7id0%<%A0045Uz#vOGAyCG^
zQ#=?bxK>O!MazbSyS&!RkYFqj9nidugTw)0Hf3bS0wIA}GzVxTt_SEmRs6&tG#7XP
zf)?19pTLJIJ4Lxezk6&V0SG(-@j(0fFLTHP4(tUcP=MbHGZMH3|6YW^M7V_<YX$_E
zfL{17C%c6LfPhj+hD0DT9WVfk)WZQ($wyN>#3K+5Fn~<RhCDz>7Fd8=AU6`T$6Q;0
zUMPhJNPvHv$uqbGpu2@?FaVNFgavRpNYDXlTRZ}3fb1)Ul1q@3TuB@}u&`4{b1=l2
ztjU`+hm8}0GdKVOD7#!rwPh?wIs(NyX@fQa3Sf`~fkZ`ugv$upxn>iBdt<Utt33c9
zfD>Rpp@Y6$lsT3xg~V)tmCJ+%kU0Thuw;NSg(HxJ%S_Y*fM4_mpaXyd*g>L`xuF{n
zhipaH1AqXS03vG!dINw0V6aTMxq7>=Ou$S4cz|9@1Obq_|D1!6%apnLs|FY&fHQDD
z2#CZJ1WlP6O>F}@0oa1=3rhzOJ-$RExqOoyB8Y78hJuI(OK>KZFob8w%Yn?!HSz!f
z5Q2*|ynkCZSYSdH>4o?#kYt#~RKv6tsfJ&Ske1VsW}r`VXommvylM0XSkO;%fQ9#j
zkY2#FUZB7T@lOMpPy<N>2q1t1RnG|8PBbB<P~in3DhMkOmdI&|CP-2AREt#fP<ru(
z<@-Ph0kesM1xO%)95gg%2mv%KJ{VOX5Ji&~*a5c~g+TI$9q@-X0MC}V20ds|xp>ha
zrI%8;PY59{pwfW?(15HoG;Sya2CdTn8PYmIQeg21|9@-=PbfkuT?;BD(*qhWIYlEn
zt<wWCQ#bL3DCh!o5CnJ_g+(}om%su&dQ%tOOFTuR{905lYE(xp(|r6HL68aMLR2_a
z)JS!gJV<~ANPzbn5D!>@Pffc2aR5>U${`uc2#UW49gs8d)C54t9`QCa3`-$^fTL^0
zKzxAZ?1emFf=4?8CLmBpL;wun&rMwsJ=LvRz)MU`i#T1@9yx;oIDmSazXK?M2#mtQ
z+8zW5IhD*11c=81X@KdBpad`g24w;Rz}Al&5)2Rkj7u;W>p1}UzFWZ71h4=(W4LT2
z00CgohnqQ;q*i8~R5yVfl3>`Bz_4hQR!v1%|3~pnSOmsyH3uzKpLOlf133V5C6HEA
zS9XOEhm2Pl(a{4aIY_uxSZD@FNU&&xfL@@4Gk^t#)4U}sSp)$G7$ATG08)yDkY??U
zY-oW+8i_V|FO%qpfQ(qPnASzDhSWoV1t5WJI65wagzLPoWbgn6SO5nIRf{zcpu4;~
zHHU2QfCNB*1W2+iaDX$=00eLVVe1772-k`11q=vRxjh59%{vDmvW`8(E@S`)aL--<
z*^iu17<fgy6;%g7H6d_-1Y?2)KmeLe5Wq!13^)V#^EJ9f){A5UR26`dg#{j4fP+0*
z!gGLdZ2(gp5Lhq(no~N?BoGo~f$w5C{{fJ&n`2ki4Oa%ZJlYEYFC5woDcbjN178sd
zhdqgBh*GFM3#r9Z5`(yRT}snrO~m86nY%YHEL)7dJV@<K11MJ?^Z@U@w*$zAWVku?
zWk&D~R{?;4m<vt@AOJ5b+!nhx+a)^(pw|E(U|5&{ffay~OSp^829Qk#5(t3w1%Tu=
zkR`*qdm{jLWw-!N00E;n0=PKg4Lbx7*phSI0a;3n3%O855cVZaRtviZP_!)&fCAuv
zF4<qQD}~==R|E)va3z56D-Z+-TIF3{g>@6>Er_5gQGyr+%^IFq5QdQgg?+Fg&5EuX
zijpe^hb$(DRnV-uya;tu2`H(G|JZ`B>#fsr)kAN{1n%uY4io^7L&It)1p^pg0l3)C
zG+qQrfcDfj31eT!tA>zUIy8hd0;s>9G`u{>-#av7bMW6u4geDH1`osl9iRZ9r2q=R
zfMWxP0WP_0uwA}`zFsipFjL@W#5$m3N&$$u1;_?b=D<8a-4JBgtD8Cxbh(C1<o_+%
zWKdQD5kb{NO#t?QHZ%th;MN1sLk6(j(Zpb|yWKlBkZ26fBPQA;eh*W;h$SY7F7TsE
zVp1E31v0<`e{h2mNM|y@hYpAVP)Gto<%KQ~8hDmxdiIAth=EaXgO9ohELb;_P!l$p
z3bg`)O3kh{mQxHUU<81H|7uuDb`?7wo`46IwmcpX^6g^+u~Gk{R|Ft|e`8;JBrzr!
zyLSz{Sp?btgk*DI07>>=JU)Q@vqz9UkOyF8Q6)P7g+O}0b133c@IaBfII65e{nJtE
z6o9K^v4U#=68pV%U0l=!S&TzXU{>4UwcH3PSN+7>dqY{StpEbpf@od<dQD$;6*>bb
z-UF#UVcceJ4iR8jE{q6gQWAtwNCH8Cj2nuRbtWlqzy)~5Bu@AiLBQt@AZ#}vC6nQV
zfVK#8z=8}ri9fN57GMW8p4e^9JOWU-R5r2u<zWa&-vMb^J?7&9Ia>nRSp8andqaR;
zVBg<kfB?vYkej>)XaHDbT>l>AzyV2snI6|)4zh&9>5y$co=!E}tzlS9xU9?V1~}N>
zJ_8+v1Pa*Ww`|A&U;sdFMVAgc27vCjMqyHWxB~Xc11VR$LpIxuwrt=4jEm;YOg(n3
z1`@cq`!x_9ZDF|1pl&t}RTzS&m56X=hYsL`Q5Xeb5Qb{<2Ru;caE7iEacqJ(Y=VI2
zOd^A9s42yGY{-`Elh~9_`4oc~W2A@&74XhTNTpC26?<yvDs2Xqy}2z|>s|=$`#pdI
zs0NOtV2<8nv(4B$1&78IIvtR0c`N_}sD`E1xS00sOsl>3OSs@J!CTHaSolqQELTp8
z&z=5K62rPZ%LD>Ifd6HVPy~rN>bAY>o>`U~M4@vs_D$=`bhTC_?@YL_Y^ZSqFxKwV
zzXIunW&UXeF2QVI1lx_~RQ}y{JxOgl1KTCH1_%J@?r#(MkjfHpZUN`#J&iWO2XKH4
zbfAR}K$Hl_aDSk1f3R=~&v1D524Uy`5C8DVCW&1^hhF&=f>?ylQVL#3f_-3zRoI6l
zK%!t7mS=+TAnk<!NPsmo00PJZ8^`gyWikM+KeMFQ1{h*<0J<KNxARq7AV#u_I|KHu
z+px<yG8f{!Er5n300LkD9)o~eUTc|~X#oiDL`a6PTY%06W*Fl<17OLkOMu8t^4x{7
z1<-&2uJi#>^Z)9;?nDSXUqxM5&`|>zyP4~SGeBLBI{+_q$gJzUWBj%awdn-8@?Pt~
z319&TK;3HiR1F}43P8hXp6Fv+S0>0h4WIxe&$epz^ZsVuw*UqVgP(|S0})68QaRcd
zPyt^lEgKk{b?$Uj=Y&fMs}$&mt4EaOhygsPs*Q;3S{I3I*_Li$T4YZOZ(uD_!GqQc
zmvMP<%^uoju(z}JfU|P|#hZXq2mlPo1dufVArOE75HR1gU31j{4Hf_xE|4t?JCA4P
znG4|+Ov}87RrNK1_Z#g3I9)Gu?Xc5BK1YDU*F0DNWYqPt(GEM+Yybjq#{zwT0_eF0
zSnr2#xc};Y=u&`$kgHd<wKoIE+kvG$$v*%Vt9Q~)1mLFE1DM?bfiVc+v>N|SjN7x(
z4gjokfXhV2Vy;ZrKI_Yag&$5kOFym;(SvCi3HX6Kj;Jn;xaW@`dz8=@7G3+MAa>yK
z7n`E{^9KlX0tX7r2CGyyf(i@5O1SW$LT5l8db?Gsnm`W#bTnHC4py&)w;B%Y6%r!B
zYOo-VMCsC8GFTX2LWH%FAgp8y4W4w_%qGoV2mm1PurgbwM5Vx$g!IS;O_i{in#)7M
z0DuWJw{q?3^()x0UpsX0XZ9@Gv})I~ZR_?e+_-Y*`g4bcF5bLvv$aUFV+TIHYRzG}
zCjS_23@b7Ak?|KR1*gN350kMJ1)m^zf-H@i?D;e3(4r@k6>Iu5>eQ-Nf8~~Ht41NL
zXVb2oI@tuQvR%3c%Rqnu7`BHKFHV!}=;X?kds4N0xi@&C2^)UCZ_)GYX8V~Hr2RYi
z@YzcnFK_<5?QEj9ZgG$YJ^c7$t0lViQaxBmnW)O|@BesN;)xeSVB%pBkAMlvMV*2T
zI`|-j5gta~e-&DIo-;{YxFLtAW!NEzAwq<lgrkum0vXwa_lzDTN=O|y2)Z~US~Ajj
zBaV1cC?bzN`uHP|K?)fni8&q?OJm~c@r;oQ5~fEj%7LSzk)R|AR|~W>xh0opCI8Vu
zEJKP3qC{hw8DE)as!3Zc9VF3ZUT$>ek2jH^lU+P_!3o|qh76&Ga*Ol<UOM~a#mSX#
z*|;a8F1FEuC2L9wUvHCII$NceYU&jp9YoToTsuUgViNcOk)0}@fSTPt!00iAJ#Zo8
zMikyzB8*w!U^hw^UBu!KJ9v<R&Yk`=Lq;Fc;Xw--)L2pMTl@6GU0VC7p$fHdtwP2Q
zja_Gjmj0k4ND^+~<Bc0`fO8f;mUPhuHQ8{&ixt?ddT(-VcCjhHv*Fh-z+U|uFu?=?
z0Vcj~kr6{A>~!Ie4cTGgPQum|*w#KGj1tYSvBY4O8;3L_0y4<pN=6HPz5khw2(c`3
zY6nrIoWz`NsnP__L+HHo&IiKPM+~F5(O4H&@Dc+u{zTzMHnHGC&(TTy(+?0y-~z-d
zyog{!EGkG{G1!8|Lsp~(o6XgSXRA$6+H3dQW(SLgomM|q_+$5SEY9s<U%Z@^WybJ;
z(?J_l`XlIBf&|S;2m5q@P86U-^66ptVByKd7<UkjKZrUm$S6s8hw><fngxW^!id0K
z7g?u(pcTLFJ-b|Ow&0B0x$C|=@BOxbFzsq>R&#Po1}`8!k+figp`*mW$;0BhfudQ9
z;BgiiG><Y0J|f(mjU|)|W=`gAv0ObF>~z4%_PF}9$_^<|iMm;qo&TQooBp(ZJpXJx
z+CtfSceXSM5MTr>pqb#7zp!QNEOJ|pJ(|!z@WkUz{YU|>`k{gjBn=#a$wuS+F^VYo
z!%(YOj6br`5ARt4eB#p%K04qHVRWD|Em(y=@Ubq=Da||npr1c@(E@xdq67Fd%l;;)
zM1RENQ61<49%A8)DN?bDR=gq>v#7-_a<PkE{2~~`D8?}Y!xCdWBO24F#x=5Wjb&^j
z9OEd*Ij+%NWLY5Cc!5W=Wa&GpT4Hv*5rY`?<t&l-*!x;QNFT<7kR_0g8&aSGAaw70
zmav3)Iu(OHG=?uNP(fsNphz36>xUvBA=Nryg(Sp6k4TgqApa)_H?q*OmbSblE_12N
zUGlP*zWgOHgDK2m60?}bJSH-esmx_Evzg9(CNzBs%dojJEe}-A#A2Bpe3<TZ(|lk&
zvbB$HKB#<5L`y%+X%^|=qaQ8!nl@t@k61(^2`RfLKJ%&1ee$!P{`6-G$WnrT0+cK%
zASgl;s?de@Qv?isC`9>5%Y#Pro&oKELo2G$jrudA9R27&C(6-_dK9E4<!2jSn4@`h
zAsb!rTRbB1E*0&ATujp=y|9BWb(uw8IW-G9ghdU>Tmw+?{LaD>70XeyzzQvJ!%?Gp
zFSy|$EC<`1RBzP84gl~p3e2jDw%S$Gd=;$EvFDe_(Eo*f*uZEu&{7ht5RFw(Lu*`9
zfiR$kG_%;XYslC~3j{$65s(uvh5&|Hl|zkd0<s_3P-kKz>!N6oWg=d=Di4o`jy-Nk
ztW^z5S!uUfMtN2&p_Qy?Xyz_zM1dA5FiR3>F}QB>;&peE9S~~^yH<7p6ijuWUi1K2
z)DpM2#sw8+J7C$ZV0ME00Pdb5L6*;6mMkjW+jBuB-40N<D_6blaSxLO@Nps=wMx=k
zK}g&DB{8?`UBxO|u)R@~QZH)YMtJk9-~Hk!9=`(u?q1T|3F5<V$gOO3vC6*!uPV9A
zWiDAV%U{8a*AnGzErA4quo4KuPz8SP>7-W8*8ibH1nWWvW8>n9C{4J<E`Bkdes?>U
z94rYE<{vxohFlp3SiljUV2<w<4IV>S!7#>46y$YbeAu9dWcbvOMNooPvKP0f3}Tf<
zc+eO$<1o)K#F4`+<}uSH9$%XALQYF&?f93gVM2)lZ@lK@w7CUuhDe;}TsgI*ST4hr
zOP=&B=t09+tN|2=nkP6~d>I<gcLe03@73ssB%06(Yr>x`t?5lib<*ajbpNuOu+l07
z)WH)qqyN`kL_eC-VAI1iTrKNaAGOh@Ua)~Hw%zV_!MfUHFxYlYkY0O=)(KOEbBwL*
zWe0D&SLN&ygB&)vS$4p&ls4F?Ef8xnoBvVQXi>MrE$&rq*U01kjDvq??sFd|-9Kh`
zm+&D$c+<PyC2G?&;~D9&wb@N_UgEyN)^8izn@ia&IKmT7YgEszi7m(~!};BYhb!Dj
zl0a<5Gp_MD1ABITR$|BZ_VJB3s1}kSIm%N$VQj1XEi7-jrOjbfnA5!GHorN}88z>m
z^StL_3pme#?(-w7!5l+BI?~}3ah@+d=`EH7ixotmqrxL%PQUuEbM5nxV|~KFIJtsO
zlp<}y0|+f3Lt(qF_PxEF=WSnmc<s_4Bt^9iID|Xi^RD-+V_HFSG7CH4nGJ97F9vsF
z2PZ6Hx@<&(czb{Rjf9SK$wNM|djF`7fJBvzY_!3LK?K+F97iW)=t_30*oPJBTlv*T
zsOdO&J?pcI?65N|g`O8-xPsS$9b_;HHi8EUV=sIMah>PIAHGzl0d5Cn<MyM-egDV+
z4r<|}3nNE9_Cxb_oNvEL4OCS2-y-h^#lsCihz2cq;f*MC0b0l7L}ECRelh^z{NcYp
z{`UqBio?ZY`DcsIM2ID1+VKqF|1nV7dB*iQ$T;Ce12zcdeTKA5#sW%K1mej4%|!(c
zpCK^G0e;|Hv_J~z*k|}(Xh7d&@P!COMq8j@8$eZqz@BH2feLufksy*;G=q)Uz`tdO
z4jPFJ(#WjXlUa;{6>x%~?Ega~M8ViCf*WAcS<DI<c*i0%UrP;NJeZuSG)O-rpj$j(
zsCgj>-Uuy_;Ad<gTyy{d(uEtaAX}&*T7Y4K9A9X}gAE?Wq9j4C@nC}Jp^?zxjnvj6
zfWpH$&riJ!HQ>Syz06q%A|XNyhvC7g2p=$D!4QC5T>Kzth@cs!g$u$U*jR~LsGu8;
zp^=m!S{NY`^3~8_M>c>0E_4A@RiPkUp%X&k;aDM+YzrCO-4_l{HlRab#DXwb1}GFE
z8IS=j?1Q=_V_=L+xfDnnreZQKBQOeMKcq{pp#vF2L1Zu^I5?wPP=l6OLOhV8KbT`S
zXbC68!#Z}3JF;UmbpN7cG+!9FfuYzTT7W|>noH*};ho?E9(V&8SOF0|;aQ*q5O4xI
zNQVvZLM;X(CkR3$Y)f1yArl7U^_WE@WCKQyokB9CbcoOq?gKhZWJM}fT%e;lvSd8M
z<2$xvOwJ>m0KunZ;0{>9C`jV_h`=JS!&wN!B>vD%KAa7>BLBsnBn*KE#)TiAAU&Q1
z9G-<7Zc}z33R_I0DK-fz7GVth)GDOFC4J0bEu>LK;;BRfBbtQ`prt<mjnJs1S|G!h
zRL!rrK?#t7u=qn8aE)HZPz-=V5*&ikFpblIj2rePlHdVdDi<pSQ5V>YKg7VYWC>sj
zCSj(<TpbQOZ2#s@dS++h&}WJ!P=*FLqyQf90vzfiP^EwyXbn2hLYCmc$Ba$TqyRdo
z<s{-m5{N(yB*CDxr65QmHPn!sw1Dcd1tKcqWc~^~hyW1*K_YrkZ~o?>7-GE?Cm9@P
za>4~@ekW;yCui<S2dD@#Jls=l&)p$|6?DLy2&Gh-r%`f_HzZ~3371@iWJ9J9EXpD)
zk^y$m;uU@*m2@RCD&sy}V>@YMLU!XfHX|9VAv&o=Kj;C*$%Qa53q*bjH+th)Y)iM4
z&?0~yVs0f@>R3+h<f#OvKSTpr4iP>?#!;pa#la_ABBkSS4pzp+RQdz0&<QS#&ALPa
z9>h@6aQ^~Skxn;hrI7jqk(x!1`hy_YOE#2%S#W|ua!}`hqLJW1^sMF`l8afC06HAu
zm}bM+=xAWrC~WN^Qc}aibpSX-!BD-$D)?k+I?v%i)t&yNm*iTC5@(#wX`P1G4lrcO
z_(L*Ijf&K%B}^il9x6H{Dj(J-_K9Iy@TPA9r$3Y>Cp=tOjwK`x=cz1bDH*6@>Sbfv
zC1gq_Wy&TkT;^cXMJ+Ue&fp9dV1XLgYSGDsbZsXYyw<Ds5nK+9{us?(`DiJcD2*6s
zdXB>B$*Di!0$Gw^rPk<BUhDZBj$E!qk7}hq2*Ydn10ED<fb1yz$WMue>$sLHlxEJ9
z^8Xbg(Si-c(3N)Ui~vDr#86<crqW<i#-PIvgv(d@t68wAKRhMG&}R#<mOs1}oyG-w
zx+foX4dMC2#LkJrJ}X_35X2Vham9j^DNhcWT?#Y?9w<^Dg=+_-K$nSZ2`s{V`a=dX
zYnz^hY~n+VPUbPXD8wLTPx`4@bY+u1sXs(%yrz(qc21TaDVI7RKE#7NsDT<ZC0s;8
zil~4;h(MKIsTJgC=b&8&fR5;_tIam6jxDNVP39_`=EE82!qN%0p2fAs&<xd(SwzFK
zriBU&RbYVY*u*B`*lXCfs9Ds?x&|&S5RO^&Z4PyZy{wQ5bwMN$?v6Hz8?*s$cK?8M
z_-ifVLwllwOgYx-7;Lx>rJ{aHU|g%ieyl&h!y-VIqfR2@OycaC#gjd*+Ga!RDh<dU
zSK5_NilIaEpzhiJDbDJc<E#s{#;v7dY<td0SBk4yxa-lvtGyh}(AMj@;_F<P1Afs(
zBv?W=*o_EiZ>QS8wk|^YtWW!x?eUh#;-<i_n2HEC#wfJxDwGA>@?p)=kjutx25J%>
zv;oLSD_cZD38=vJfUBZ*fDP1><r=Uk#Q-URj0oW714nTFC@=$eN6T^t<7`blOfZ*F
z!v=jS=ZuYO%54WMf(XDvJlKE;tPd02;lZ|SmtpKcMU4M8tj8*iiY%_<o&QD35>mLV
zP`DiN$|6G#m+bxaZj#Ab3sj8?7*71+uIhFw3C2L%9+dMw-0gC)Stu^!`h(*ZNYYAf
zKTxjadhc_LZ~1O58@sU#(U1+{kPg9b7T-wbNN8N>Y+yv@c9cM$?L&%XS~|IfIU#ae
z^aC2sNEf!nog`=nP)j)B#YoCUYq`aupsxd|#U?+lxS>OLX0a154;i0D{-(hG3h=`*
zak$LyuWTm=bL0YVq=uz{2xF8Dl<>J4u!6|3`F4&kBZww(5{-Tm3r>#)_pvtdg<k*$
z?n)-TEsPbUKoKv;2+0L6$V?AHv&xNfrou&^HFAnUGMA_`yYQJfNB>rIOen(P0~S9A
zwKUKqvjsiW^E>ymKmT*M)ofaDB0v|kK_7It3A86hB|<l}LqBw6og_tCWKD^V=?o#o
zsiNt?Ekt*;M}PDZX(xBOfgYAi5T(E%7UEad%g{13NWU~p$Ml}S>Cw(<G^lGfyp~PU
z?861>ByzM&2enWSwTnnG4I#+b#E^XY1IM;BQ9m_QN40oJF*PIsCRxIpNNS?)u2W03
zSAR8FONJC@!%de!3UCh0lC1rn?9jGszJ)bh$F*Fy#i9i7T;DZb=e1t%HDC9&U;i~=
z2ex1jHenaGVIMYPC$?fQHe)xoV?Q=zN48{7Hf2|~WnVUCXaBZlZ#HLlwr77fXot3F
zk2YzSwrQU>YNxhpuQqG9wrjsOY{#~2&o*t>wr$@wZs)dc?>2Auwr~G7a0j<=4>xfa
zw{aggawoTPFE?{Hw{t%?bVs*zPd9Z}w{>4Pc4xPCZ#Q>$w|9Rxc!#%mk2iUjw|Sp8
zdZ)K~uQz+Qw|l=ge8;zZ&o_P7w|(C?e&@G-?>B$<w}1aPfCspM4>*ArxPc!yf+x6w
zFF1oYxPw19gh#l9PdJ5FxP@OhhG)2jZ#ai{xW;wECscwhSc8X`INZ&{Je)-(WPuU1
zc#FTmDVzn0n>da095Hx-5lq1;SVI{YffKwzBb-7btp7oa|A9X=!W0<68^}V9H#y9`
z1B)9$8CV03*Fi4$gFKM9KMX^U|A90_c@}87laIN^4T6iG!W$St9hgNOIDrvlfg)ge
zkB7L6R|1*edBvHz5qN<z?0Gl%Lz=s|5qyF_Si=->K{rHsoZ~s8+nX%3cqJ&pp!-9g
z3;Ld$g{0>KAGA23yTvzrLq4Fzr-wRRsKYntgIUM}F(|`5eEMXJx~PMCT$nnlWBIDL
z`Zq{MtG`2|_qtrj1Ch%@892c(9J!^p_@5Jl5e&j6?0Jg21&epOKd1w;$3-0&L9u^>
zi|0a%e;-~%`&m%C5&St^Tzj@}d$;4oH@rcL+y8<Q7`d;<yIaV^A6P>cc!62`!m&?5
zig$yW%L2T=#U~g67o5c@5WHM`LLHF!qn80O)I%Nc!DI}4!JEawS3F!OJi|-*!$*8x
zw75J_dL6{LyqCOMyu&FZdKsknJVd#Ruem>bgA?$9HS9QCkVA{-x<B+d$^SwnoPy5Z
zgDeaKF;s#z41+AZgEd_H8pr}a$O4n+`_Bjc&=<Wmkb^8JLt5ax5$HV6OFht=h0qhd
z(IdUmGriM8{aGl(Cwzi6@Pk?812JrZh?|AG4>~zuz1EwBG_*Z2oCVU)gDr?S+?%|K
ze?pHNfijfA6zF`SyZ9UMx<7C`AKd*LZ2!Vr%(*|jLyPnJ9|-!Di+hWog1J|Mpx;Bf
zfBv>lyP%(fzDs;sXg=o~f#-uh>z{e)pMJWVzKainSp<5E$2k|cxGlIlysLhT!+x5(
zd665whcCXME4&e4zFEA3EHr|hpGC7rx}d+o-mgU~ytzNHf|65uj#~q_PXRxO`yeE}
zxxYgrEPFVhz7h08pHBh$=lJ@!c>BLYHvmK<S^fwXY-J>iKUPNG_)}(NinUx2`KdEv
zWRR?Pb&L#q*9c>{dl&nWyO_(G6C>Tiy{RK_V#010huyPf<c~jD5Od{HY0KXmBW1|#
zG*S?0Ql(3oHg)<GYE-FHsaCam75{5ity{Tv_4*ZTSg~WtmNk18ZCbT!*|HUS@#33b
zIQ_}9rKrvuK8=R?n^(q(wK8zyHkEg=+hCxdjChe{l$=E)^$2q8%XpK&kw*G4b_`iE
zWv7Q%D)#63@x{m&MO!{?B=hEe6TJ|Wr;ngMVw(mZ^><O8zneMv82LmHWKN+2=UwF2
z7J78))2UatejR&u?c2F`_x^pW7s5sY3w<+X{6#KnaBfOpyQxr)M(+8mbTLc*EZrm*
zbd6avlI}xDKmIO?O1_Kg8&JRf`m3y?*J2~-poWloCku#*^9?xR=n@Jjg%}Dd!p)uo
z55*K!T#>~VU3?M77-gI>y#Mt0AP2ql#;YWkx8Q=0sfjM)gCJr?<VO}|Dk9In2mzGM
z$cB(q(jq4c(np^9loHYiBK?WdpDCBL62i-13y?D-jlk^<FO)gOh&uc+i9;ja@i3?R
zycDVu5{W_cL>dJhl+Z#AJrvPI6<yRS@zPV~mmGDxXo^8>IYp(5fLv;`2>r?DqB=M#
zqn|39G;>1EK#g<MQkf)ZE-#bnw69M?ZPnB=B}B6yeKMSay)5*ZXo^o9#Z4u-hVy48
zBe=-WPCo%<l-g>oy%yVSwcVD{Pfqz3+)Buiha4XXdt(@Ajgtl3MxOeEJlqJfhKo?|
z%+(*);7qk2f9SQ>AOCz~WeQ#=<n_1SIPZNm-w5~Rb<W=EuqI4+ajI7uf7~<Tl$!>b
zx3@C7f$+~&1LYRwlvQ4t<(6H3c_}XVkj0iw^7^9@WxnZ{u;aG6=isb>4r}PG^2sMD
zeS#+F9;BB#8s?~_o|@{at-jhiYc6u)k4;)(x01o?kS0^|PQe=OwAEgl?Y7;1+uunE
zJB2a0oH!fqy!GCj@4o&1J36i9ru3J()dL*y#1&th@y6G-#wAfDpFFQS4L4#Q$2H%a
z^Ugj0Jkd{7QUvtUO+Ov=)Kw?z9dcHG9roB|pPlyFZNDA&+;!ib_uhT~9r)mdAD(!q
z`Z<}Oew_;R9{<WtX6pE*-g!Q$=!?G|`|Pz>dk`bOA!rzmmp8)Qx@U6NsWr+-YGWtR
zU&@O$l6r^q?d`uG|NIj*GBbbRz0)bDP=-IskOgw|Lx4|FA5vz*hhM;Jfbf$aQvN_D
z{ap})8Pwo*_~C?v=wn30-~!j`a|$lhVG8o_!Y2kqsuj-3Jg(EnC#FydF08L0Gx@_e
z?vaa;{XtIi;KD$>z=cW_OE;Rj#|fSAiF^#g30$ZZ4U4rwD_#+cS(FM$x)DBG^uq~n
z*onLD^M*$7gM7-ELKbX+MtA)o3$oxsZEn&Ckl?UM2>C?67I>JmiKh}Eu?0EABa6-C
zY$vDS$p1UOVFX3o=NDR(<RmGHL9JB+UiXj&PEL^@`xwD>ZuEy2q(nYYmEjaZc?TcJ
z<ODnxgcyxLPoEa}4)J-xN?;^X1q1Z4pxjLnM#u$YDgmeZRT7!WR3`AUpb{d*>J!oY
zWPL<Q$}o}dFlC75C*)CwR=&~}M6uQS)=(Rh{Ba5dae|z9Ig<X3aGTZuNh6|}i)G#u
zpZSzs-TG3GE=eN`WHbWOs#!{R6;T;=Sc5)pQVGVq(jsMGMKIrJgjn9v2o5y@P~i28
zk@yUfHYA6UK9P$l*i)Y=Rq0AKXA*-EL>4M3gE~Hmn}S}`UDn8u6g2}9FL>dV!g&iH
z>i<JFoQSUsKP6v%ZbBd9*hVN#3{x<>L_L;X6{}g@o71eKr7Jmwt6x=0(87w8rCCp_
zX;tf5+1ggOz7?)<mFryTT35T?6|Z^K>t6ZVSHJ!huvzWLVE0j2d>j_B_=rb55_{Of
z?qjgZ3+!YmTUoO7V;_iJtUJ<S4$pD}wAT>rHKtM8(Ov_zspW=eS?k$!bhfqTP;F>O
zTUyhO7PPEQhdUO_SbRX%vcVPZT>Ej@cyRW!+#oG#SL<5d`u4Yj#SUgQdtBtoR=Lw)
zu5*36kKuk7yjU!*V%_oC<u>=Zj+HE<sH@oHnpeB%_3e7YTVMOyZoKj6Y<A`ASpT)<
zx4g0y?P}ApSbWg;z6n;a;xemWbC9;b-ep{I-z#9$n!_ExUGRoEoVLuCSGgDF?SWzU
zVGFO8w-WB~idlRu#ddbU=3uOfc}HOjo1?(^Xz`AD45Q+fSF|{0EdE~n;A>!*#64E>
zlBu%~{VI30L(ZaN1<Z{C)0oLw)^b<y0c0!31Ix&Cayp=#;VqvT%}}w2fMu-XtWx>H
z@j!5z>C9t%kom}RhHF38jM{X#xz2&!a6jUqTp5R1M)5GmGk~EAPe=mNhS0;LDQyTy
zOTrVX0LC-S0cgGv`oY|A$D9RS>d6vXxqqHfKg`i+L#P1@O&CHGu%HG#K>s?^s!&BO
zfYEDU)I!&ehO{1FEo)leS{2W5$KLkg4$!&-(WaJmUJHE<XvZiXz>oy2hkylSbK28f
zQM9YM?QKsyBiw6i_OqugJ57LLMt?x5wD<AgbVM6P&+vpEn$QG2oO{{OVYRl^aBNj@
z<8948a=P0MI$xw<255*8oZi3+Q{w})@pw@@RKagGNCFrd-;OzIA&FQU0vPzVTA{hY
z@P>CT1>%sAI?`EcR=3<m9FMggfZ=lPxI+~MS3@mGZ8eN@L**}D+&V-+kYntD5d}%c
z9;$&NS;)yBzu-|p_|b}#dIRj<xC(*`D;0EvUFGh$hRBlwHL!@I=>JqPhas9E352gD
z?pE0cFbXaSwr4BvPr=7E(xG(E&B6!y5C<jl;e%ul#0K=30g4_;jv4Z!=Kg3zLh=cZ
z5GVokR>4OHl#+%vNM#S8Kfx@T;#sCJA_zga1XzMlh^@rK5Li$};E|FIVempL{osXU
zGg}aFpaU!MkVM`4p^C3G<L_$OhcKiP4`gtK%>Ib}QnsHJd?14t$ZtyYvmy5FWMlj6
z0Kd=Mos16nK<47`LBHhh4;P>aQ+&|JJKk_i0_sy7aN-YgqAJ$GH;}@Pq~a6?FbE!j
zDO}GfcwqLv0`9cp8JfWP#t!&`4=K<A9E?x=u)-bm01L37`~R*Y2{w=|rf({EPw-L;
zDpb%bydeaaLI%GB{g?t7*stA`2OfNY9SC9{e83-w5Ji}03JxZylqmoULKtX)40u5h
zB7q=Afegri7OKz+u+RX(;R+AT4cdV9{9zy5zzfMh$It-}$bcG<0tp;YDHIJVB(NaF
zVGNdl6bJ$y?0^WaAP>i27sdbyOko$~027d44E$jiuHXuwfglR;5EIcK)<F)I;0j7%
zDYyX(?k+0!0UWX+8wf)9kiru|ks#QC8nQvcykQ?qF&@gVAo{@@RMESR4;^yQ8(t9~
zR1qrTK@Wyt2skk*MxhJ3AQt=q55$ibXki~BAqvPK6#vly2si;9;6V#HVIR<e6Q*z#
z$iOS`!5gT7`uqVNvLOU-F&om*9FYPXv*82L0Utgw>C9mogmEeMffqDP`|trBs38db
zfgM0m<5<xY$q*b;u^?y=DFQMF@lhWIvLIT~9|?jWLy;@cK^Jpy7qfvL3gQ-pLE}mh
z(00)9nnDR?U<P~v4a5NqppHe#U=tcbPGZVu?x_h0q7Y7i2twcrc)%ahpa;z03gB%K
zaNrHh;1LXP2F!p50zn_>fC%hB4{2a2n{ppqzzodb1XSz|GcoD>fey(K3AEr5f<PMf
zfd`J@5s-im{2}%Pu@EpJ2#%l-f`AmnK`!&qAOGZ%F6~kuj^GXHaw*i{8I;21@X;IS
zVFO1|2!(+odBMq$As)Qp`h*V|;6WG)D;`uZ8<0U5q9Gdm0UUTC8`uH(c!3&_0U4s<
zAE5#mu%IxNq8UU$HL0%+PR}1=02vkm2&e%UzyTkUKm=kS3HrbvMj-}x!3q|E8ajXs
zIv@#J-~*+?<u(%?*n#@g?-f4~9HK$7yel3<lOU`UJN+RVcmW)`vls0#De&PuL31EU
z^Ar7{Ghb2ccmWyMAsRlg{1hu8L$E&k^F5<M<LJR13j!H(Q8N7jKlO7uqr&A<^E^RO
z_}IZT`vpD;)E|%m95xd{d9Wn?LE_Yc82@O>E1n}C-Uk2=P!5cM4#+16;(-RdU>JlF
zEWN-Qlz|uw&<k=w3$DOlv_KMh)JLzt7lMEe>e3eqqALwEDd0gbks>T-!9@!J3H-nm
zjDV(ype=(y4)$^v<WlC4!1ny%2=r1+{eetLAqa3|3Cc7nQZBM0>%r1(771c8RZu+{
zv=x;RvhvX%LQn=h(D=l2_#o3C(V+&P!pW8b96F#4ED{|$K>cFCA67vG7NIp$upoB8
z3Pu4Bdb0)mp##7n3ffR9=5$W$R4JkX`B*R-O4A!cb2Gs~vgkoP&GS{MZ$JIv`=TQ7
zWH21bP|hGTQ14S6=`%l(LLvP@`2W1??C>-x(o+aG@D>>~SyNS22a8pcf*RoA7V&`^
zu9ZIFaRbp$F)dUWI&wonG(^$j9>{?lQsNIx)UR&RALPIcO2JBkfJ*OV41m-w3&H?L
zMh<|~AI4xvS0Z1p;1P_#59}ZdB8ecHv>@Q28ZuU6GxiFO028Ei0yP0*?Z6Ix!4AlT
z2fB0@3gQq6;!O$SObMc8{ozgJ00}A<P75L)PK#%s;TfWjHKo;ARd8JKbRRTyLyJ`@
z2K7OY4^Kxi9Tl}J(7_Evz#IL64BVg#IDsIL!3sKH6bOP-38DquU=&7S6{sN!{2>MW
z;Z)<0XHUy#qYqH=f%+2ELjOf>7kR-N{Q*}CqHcLr$M)g+x<Xh(&~6C=9PaZJEixX?
z)6JSSaYfVoZjf5FuW%oiK^qrt<5slh)?4`z9;sn*Df0MGl|bV`7%Y?>B#b0iENrRb
zu(o0yoZ>5+qLcDNQ-b3utcoe@HJ|WR4&-1LZZ-%?Aqdcc7I;8ll|bY0!2k*3U<pED
z2_kwMwiSY)6>^~!9I;~IupkQI2*#Iu$2SO!p!NzPEYU%G{Xra{Axp)<4vfGI+;U}Q
z_GW3eOk;L0^Y=~VavsLO2y*r*Fl;IA^gR28F-0>JvjH-%6(4|afdLmO-~m-dQyHOF
zbh!dJ>9Yg8%NsgC1pjmlRV@Js2!af#P{*#&S+hZH+170@7%B|7RncMksIMS(%+1h2
zJpYy;T=j;{b8rinD}({inssQMj5IeFAVbm34%8o-^;tL5B8?a+E*D$Nm5Bp#Drh)#
z6;)h+wO#4q`p|(Fz|2^It6e*66k?4k7$F5Z;25+b1vKGe$Iu^4!3MaZ8+ueK-T-f&
z!Xf}Dcv+NqjdvtKpa+b=C;tEmLLddu;ClT4VaI?6QlK9u`3mI02~MB|Qj$r*_bIMm
z3~E<>(Kk5CGWIS3A9%nBj^GNkz<ycQfA=>CZgythG#`$@2#|nGxx#M4&x(al7{rcn
z!*BTd;XK1{X#ba17{sq1RCD;8mO(XGYPVt)S|A2mKoANd3EY4n@IaeeAPYCN1X^H^
z@c{^0AO+ZPZQC{qEK(~rQ<#5P7#uT-g+Vn%PBE>Rp3&j@yps%xcq`0U7(Nh*>5~^+
zH8eMni=#m`kzo~iAu|=4p$WpEr*kyN(KHvjUmRMVvw|8#S6mf(iOrKVa}YaK)6Kw-
zpzmuG)L;nIz$#Q=j<cdQ{lORRk0A7zD_mzP09h&sxsZG7F~}h&tOO*)C@1d0o3fx1
zK!_l6p-=n)Q?j5}e1od}As4dXhPuJMEY>OD!IYmu<_PvHsv(o}VPMZf!tgN`t-=Mp
z;_u=i1^;Sr`}&q3+|?|KPQvuFuiGN-=K5VBv<dED5uRcl_P__K;HGW*Vi~&%mK5=P
zU<}dV7{I^>d?6XCpbDxEASpowGIk&I*c5yq4*VeyPTLoJz!bn@9%6C|&IYN+h9FW&
zjD%wV8K@E7;1A|O7KSOev&aB_z_^*BtUkqerNU|2z_^j%V^gFqkst^V_AENn_w<@Y
z;K2%7fNKe5HKW0b3%hOHpbrQatX#mgUEsC-0kX+(25i6-W`Ggap#uUT5IUfCRX_yd
zzy}zC9cDoV#xM|EpaW1c8BC!AT!0cp0P!HM1C+oByMiBp$`-uf6!IYp6k#WH!wHDt
z7ytU=8*bu6$boAnf*ha-kk=%O^5G3$+(Ou*5@4KSR3smEA#>J(uen2+Z?{Ftj=bCE
z8z}ZEG@<E=u)W`V7CyKL86gmi&<6s+z4suGZ`uX$c&7`(6ht5heSi}Fo3UH_E9T-k
z0C^(3WeR?wk@z5Ea>EEtL=kYv2~r$~q9w@h9M8uB86IJ|kpc~rfFRhLAl{p?34*@C
zpb7}03gGR%3*yQPBFlSvkBjijePIvwK+L_O5+(?hT4A=oWn{tuUc3Z^PGk-GWF%6&
zs+|CM^W4>6-74Ur32v|{G{FVv0S!8U5(fRIXCVdPAr3l#5gra6;2{N;w9x|{kN>Md
z1iULBe45fX`_ePLD<b6{?&B0pVr0nS9lD{YSiIB;LJ{8J9)v>G)v48CUESB6Dcqo&
zr2-xd9Q3H%y+z>u_F)Fz&&&Nm2|6Icc|9reeZqY}1Vq3TPMaXS+y{DL4+4SOxk4Yr
z<HgSgQ`U$WSYeH(pngEe3HqcP(4!Gp{gKd}-Amr&bEsCRLc5a!?%-h`QeX_}fnBGf
z*r6lGx$frcqAAFMAMRl$mgeMxe%*QD5eOS9;MfOJAknd<4zl14?&gZxLFx%Y>Z{%#
zs($LP9_zK<>bZXEvA!LszU#r>>%+e6{b3oF!R*PN?9aaK*?#N2UhJ*@?f<tv?bm+m
z>z?l89`489@Av-ir~dBe{_FWZ?+qXDvmWsaKk&nT@bw<=6F>49U-1t=@CiTc+ac|j
z0rSt^?H51u7r*l%-|^Mn^FjagEx+<5pYTV&>+y;mn&73oVjqrS=CNfStf9~GCj)w)
z5c~lJdOrhDz#j-f_%i?%{Neb2z#qQg_|^XSzrY`U;P~4C6^{S+gTMEQ-}r?;`Ile$
zeINLRpZkyh`-PwRonQE&U-+e;`i0;6v48xxzxd5R{Cl7Ig+Kerzy7`d{sAJx4}V`W
z7|gJ&-N6iB{QX$i4%I?J{!ko5;g8TlRQ?tYJV?=^L5vy?a`Z@WVgJH~4IdtiII-fz
zj2k;1{K!z|L4OiW+8jyq;L4jRUoK<ma3Rl_3rT|1nZc<~lm&$<JlGOqPlF+6mNa;h
zsKJIJ4KAJPRpnKK1FITrcNA;Vom(?dY#KC!zrB3>`uz(yu;9Uj3mZO+II-fzj2kPy
zW681P$&@QwzKl7u=FON5nwWF$hKbQP&P^IUdeS-6Ca9d7!}=97)}X1dW_B7iXwjri
zvsR7z2Agv$R@^{z?#YeiPtJ8(zPwXt=)(~~zoCoSb>wWWGkXplxpL;tuS>r^y!i3t
z(3^vgK7D!h>)E%T>kj?9{qZ;4n~yIXamI<)UU|@+N8LHrLH}1@c=vht-g^A`cOZc2
ztw11j2Eun8h08T4pMu`$Vjq6XZMa^C&Z(DSe<&gt;({M)=b(u<=;z>sFIp&Ii={n>
z8gRk+hMH`wxdt0*%)CO|Ikurj<Y=I=R@!N1afW4<T5ieZV%8ATWtd`)NoJX5c9y|8
zYOcv<n{K`dXPk1*NoSpQ-ic?PdhW?*pML%cXrO`)N@$^m=6U6riZ041m%d=qXrz)(
zN@=BlE%VBunr_Nzr=ETaYN(=)N@}U+Bx-4@s!|G06V0p&Ypk-)ni!_0-im9kuO0Nk
z7v<<F+I<-?<7PP-xVGjTyt45tpv8q|g09j|OD&(M(*KHWwwQ$>iniW<3+|!@RZDKU
zfGYdN94lm?TAngQ%f_(99?NFD>E6IlpwA*gh`Ij$J1rFrg-bAI{7fp1GzBlraKn_1
z3vk2|x2dcy=e&~dD>r;#f@<piU;;CU$ne1m7QZVju}RKRj<Lw98L!3VtgykaEB~sC
zZ9iCi4k0VFhRr$K!1jd+D>(T>&nv*TLZ(BT@WT^HPfT^ydOD2tVp-f1=_rt94R+XK
zLu_@~)hf%z95Q5p+zl9xc1}SuP{GUxPiW*C%JDLzO9oFAG>OagX23HQ85q;|-|Q0i
zS;^%flEDpzCk;6jh99kW<Qh?a?B!;E4*Hrm4F4o{>3-E=L>&q*T1^w+m=1gF-jW@9
z?V~Dd&<9lfy3Hh1e6T^>gsW)`ArB>;IWzI5eXQVX#;m5{!7Q&V6@B+>46!%V99jn3
z{P01`8(<Fa@FvJ`&JQ)0Q?l*uPkgQHS<Avlq+!e=fByQX`o+ud|Gz0^y`ov?C<h8Y
zz=pL6ZyV<b#`p;F0pyjB8HN+s7ZBk*m<^9O87M~uzi>f}^(z>`C<n=Y^$=`qtbpxH
z9&ymOy_U5PfHbUD{Pwr7Kb&GO>KF!J^zjK>gh?6Jz@ZV3xTSU|afwW<p%V*LF*Y$n
zAi6L?2MfZ$PGn#X5-Cmcw8)0j1dd+MWB<q;9x@y-im@C<o5at`VJ|{#0DX{S9{E!C
z!d+3}2^l!r6aQ$c8zS*rTp*$~_@D^BG(s7CSe=$cL5e|2a*~Z%1|iC_kW7{akeu98
z6xsBJ4Qv2ky1-%q*JiZv1#55R;G;mckwIa3<_ipLC0iJXinXl(6$PZi1~MQ6W1IsU
zd^Fn8Rw=I)pznJd0GS^<3C&Ikl9IHlLl!FG4{IcHFKf8RCw8c%W;B5v)GVht|MHcC
zux6dKi>5pC1j{&KgMe@<2LttF&o<q2P5ETgKIcRT>(y;)?=0w`m;r}#e(PY_+@?SH
zppH!_LreXz0xlGaQA)-o115ljEC0p;(vXUD9PKoyNeilrUuIwfygaE(`Gm1uW;9#!
z_=6XeA&XoLV-SPThn9%ZjhPD7h%TwYM@NcOke2kNO#LG^P=N|!HFc_WLdsCFRf&0Y
zi4u{#s#jy@5=SI;tRziSrY6=hY#75BEo-Y=-wM~b%5|=Et!p{d%2vDTb+3G_D_;8w
z*ue7juYxVCVd1*g!|Ihyighbt<?1hH;LZ_jX~$Qo>4zP_<FcFu+e1unRI(zq2IHVC
z70&uE?XktQsEus*1j5>gsTQ`!YOT3un}K#r;s&<8ZTECnTiL!gx4Z3axn@h+Vpx%M
zoh?j1KJkmh=tCb2wah)ZhX0vQ7-0>~?e4-{BHHj$)-&xQS8m2p3@H?&wCXHxwa%N~
z^^TXL?xhxd)yrP;n(Myn9Y+m3<G=Tg2EFQ?Z^!mK;P`^{zZ?y)eG`mdkSaGP-VMw*
zykG=y9wrM;cmrnm@Q2LYV+uydMTLK8VuI--#R`o}Xu~_!VmRWz**opDCZWz3qj$!K
zqo8q1g=5d?SjIH=@r`plQX==*#?lHhM~BSgVJ*qNNDirzYy4wUIT^G`jxsZ*d}JXf
z)fEO=#)<uM3L~gl7K)LDhc9!Fd}u}*YJSIw_3;Z^OcY#r)-y&eB32l~xELQbTx+uI
zsaNcdvNZ^FQVBf{L;o|mREjPKqaBS@NJ|>govQSu$*SoFbDC40&OoC@>j*eRI&z~X
zH5J<N=|>k@)VC`2smYq^Rr3~CiiWkRF^yEpV&u$w`GqW;pk^T^#?5^>#Tzz(-CX>k
z4vp}KEPk<xHGD!Jf9M7u_;3$y{~^WP_BOcpa*8_CLBofsgb~VcW@(V4VDiSOL`)#)
zd`p<Y8EAE(tds#)6r;a`=C{8I1#p2AJiNs)xR$LL@PX&M;RiYRpb{?ee8WMVQWX`(
z7Y=HNkLu(4-neHv9x9SE{J#_-wm*Jhge*)UsLOt{KTeT_T)d&$t#CpmDv<?${J{xz
z7zDUu{)sYF`~Md^-^)Fau5^DWA`7SZL;Vudk1`kmn-$K5ob?foZ}f#6c9xab`7&>`
zm)(dK(XqZ6KI3t~hHjlAR**aTb}Pqy?kGQ$-94k~yziK_e6PD{05AB#%e^&yH`L!b
z8u+{u*#x?s^rjw<cggRa@rJ*9<ljE|%3GXInEyPCh3#^FWWflsXoXK}&KEAcq3T}n
zM;1Qe4`l@X58SneEuIdhO<Y|O)%FMQ{UQ8(7-6EHxO!sLfow-Mm(BN(M?S1k_HN8W
z8ugGB_5BeJW&1<>+&AJ?5}$V|0J!miQgjAT(Qsg+U;PbcKcL(X|68L!r1a;!q3|Dn
z`zKQUNB?*KXE^yMe}cDO5VvcG0)YCre*|cMfAW9{D0$<+fTMRO6{vt^Mr>(Td)0*)
z%(fR(phKr{3i@CKVrL7xw+VdlbbHZ!dqI3oX9P0XNH^#Yjo^HVkqbsJ1=!VGw(tw`
z0DjT67sSvH<dAl-LWJ^g58dEHNw|bfs6QHEdIBg~uE1dB@Cq6jCrok>7Px<0Xb@fq
zhHxT=20@1CXNDd0g@dw&8PJA__l9UFhY&}HT9|1jXI6wVhjo~DcNm9)5{P`5WPW%t
zfT)LpC|dtDFcnr0$Oa~iL4pre2mZhh3X=t`@C{Bd1w!|NHi&~XSbQ<)56$;<-2ihv
znEx1mkUB1B4QVG0`tS`}MJwIV4YnY5{!ojzXha3!h=_<@>xD0^@h6~R3<e<u#Q12&
z*kH+c4$GJU&FG9t293z*C(6i-*NBbdaEuO?C)`+#-Y8NsCRU<hd3qvQ(+GLyC}G(s
zj(9?j)(DU22#$y5C+)b5nJ0jh6^Y)}2u5IYiy;d}-~`m?1yewDH;0gECUm$*im5n!
z2&oUKID@d51y<J>`LKFyR$<@pCHL?S?;sD>P(<0n54NBWC3%u5i9;3va_|^z3>Gr%
zh&xnJS~OXcCx?>;p_9YNhf#Kuc_LXrxsyC8Qbaj{adMQ$l9WmrQv9|_dE$QM=>K-`
z$do?`l|spfRJkWt*^F74c*PJECq@ox){B-g57i}vlyO~L({znt4QghEAt{1lvUZg5
z4S5-p88DMl8B#MQ1?^xt{)RCIVN`-ylZAPhc9NK;MwUuRn1;EIVR#UW$(T!71CDu_
zYM7am$&<yfaj!N9^Y|uC7GaxNTAgW`h#8u!X=SC^4ySo1su`I3XO_d}U3_2!gTNSS
zCY-}boW*IJ$BCT8DH+<u1%Byrj?oYKAf3}moz*FwzIT@uW)QMTR_X*AaB>>2unZ=!
zn%pT;-Wez1IiBTdo=W8z-<g^wAfDuzo3e?X;3=Q$S)Yt4aRByXN11<FX#bw~8K3jX
zp4{1=wDu+d+HeAjh|_dcbmjy`xERT4p%;pw!Z{ghU<Ad7L+_BCli{3-K@PcKq9=-?
zDQcp&&<e5;qA(bji@^_Z`Ff_ao$c9W|78Mrm@JuzqcO%~J6ecpf;*=6qmLG(JW8ZK
zdZanZQA)ZiirJ(+$x-KkaujqB4%(hdCZw%Zq@*>aoaq@>Dn*845L!x%5IR&^H;Vi7
z4wR@r`k)N0&<Zcw7xy53grN?3+9lFp4I{c2{Ll)-K&ZY*sKlUE_mF2Pc@N593%Q^V
z>OiQr0F$M2qhTszA2k|OFb7|zm|n@6nTmm}(Wz7PYhjvcj-aWe>i?;yimK<Rs-w!O
ztqOs!ie7LaR+~BpuRx6lI;EnjtF#KLp^B@rx~sjqpJ}QW-SvZ6P^0?;b54MZ@<R@?
z0Fs1(r-%WlShB5wdaeGD3*>NJdtnRYzz^a2azQ0$d?AvtbE&VIUI(F*aFDE+N`FvE
zueKUv_d2ij`m6jp4*9CDkH&A!IIQLwuShAd1Dj+88<m2orWvIVtH-DNqX-0<Kh}^7
z^-!sRagxNKY~(-;YxxbtpbT8o4brfd{&12+G=BFml4HUT-<k_+rw<{kFy;Ce?Fu{Z
zYO6$cuty5C3@chgOSC{*t4GV3T&A=+8nj0`V@%7M5sOjU1^;h@qz_z>VX{-G{_w1S
z@eZ=k4dft1CHf9PHGaQP5AVP=^T3LH5w>G1M7bcg)_{azGP8Y=3$r+HlInCOMh>me
zu{>*|8PK$ci@1raxQolUjr(>~drtF!Y<o6H-=LPJ!w<jEv4ZgnL6xn)Kn&zyxBgJA
z-B6?QaJQXnd~@r$6{{tA%NMzz47y0Vm6)ymFb}!FlI*&<VB@on3%tQAyu(Yp#k+ry
zYfb~1iIkLP&MG!|YNvl83tS@)LPV)dn0E3&3@*ACsLL1A%d&HusIHqOu)7yE3xg^4
z4wU<HFiE(UYPiNLzw=AK^=rRGi@em7mQE18`|}3B8UHr#U<-R$7{5RcH!DQSuxDJ;
zeg5zbNa(%AcEGkEzN;&<G`pAJOAO)QwR?e*yz8#<d%q)0!X<3NC!BcsOG&8XP?R(e
zBzCtA^9{eJ80uiHGwcujkY|48d%9b8^3V#lpj9?3wiSH4cuTW%TBoF&Q@L<3vOt8t
zP^0fVHX@9|SB%A3ti{Ev!m-k=l%WhjIIYw~3<yb~3?mJ{@WqFbmw>vi<PgJUGPC?Z
z$AJ-@cUoO^+zq{(HNU&Xe+<ZhEXY6F#jElTT%aWwCXwefkXO4f!@#~`LWILW!-}HA
zzktb$0mqoUvQ<3DpA5>OEXvB-Fz-+XSx^UWiT@e4U<A#HQT(9D1+!u_XC@c<oMGa}
zqpZuj%*&x%$g08zt$-!@Kw{)eNoi>Wv^*KI(866Z4?26xvXjfbOwHA7%_RKGsgeb0
z*9wbl8CE+~2bl%yDjCEu1zyn1TC%5O9L<G$&F>7)@oc==Tq(+zO}6k&-aHxdpk|Sb
zQK%DQ9qbrWpblcv4UpQ-@-xly%+L+(&|yl?l`;if@C%JF4AKzLm2t7Im{B8EV&ve@
zi17}gm`#<SVS=g|$}kN5kkATk#SabBF)h=Z8PTb73b{ZG`s^5%%fDYmXGZV`->MkD
zPzLuv4ySMrZ$NX65OkN3xzg9tJ^Ru#P5;$ZZPmxStXM-1f1n8cix}?ap;yHZ18D^5
zj2PXpUGw%1YfxQ|441qZ)%ml~S54P-ZPzuODg})hm2k#GH4pBlW?s<1jKNUz@CJSD
z){;@Z1RU4yY}bzs*>|1Q;4%nY#~12g1dJ^iv&dQMfI3Ft)rC<9UQh<g&<Hl{1UjwB
zmE73UJk^m6+p*2ic)ci<4Yrvv4{_{O#83v6Xc=ZrmulSFa{bz}ZQRGr%e0LdL0t#R
z@CNgyO?B`GK1B|Eum*}S4*-5Zfxm;$2%qo<Y-S68kkL8C-5^N}b)X1(eHgpjTzxGm
znLOOYjok4q-@2^am$6+_Fa>4s3EkiX<7WQ^^B}p4^a=7X2pyJY`7pyqz)%G~dq$uS
z){u~mkl2J_4a)r9SyH{^eBq8g-=Qo94bT8$Fjjy7;!u!O5zqh+pbaC1;t|l{zC78H
z0@~X4bARw=|9uLz#}|WewVCa;3ceRSz89H2b*G?RsyrC?z+xNz7rAX2CCcPd{o<hv
z1poj5IWSgYVC5r_R00410wCfc)d^lM08{?S^=%n9_y*SSb6&7R^YGuB;MTV74^B|f
zD!AZWXXkuS1}KQsiNV@Y&KJsn$d>UXg6_#?KFC#m<yr3KT#i&;4gfA5QW{|8Wv=Lf
zjOLZ0=4@UGRyPk?rw(-~MESrEbZ-CWKc44%Vdt$d&e`;}gh9K}JPf>7ZJU6E-%xF}
zz6RAM53-O2;SdhgJ#7l}2|6bYZ?NQofwqX=$HkrLSIp>Go>XG+=v{v4%K%c^AnBMM
z?OVL*l+o!wCk-U_2~)s)PN44Opa^<?=Lm^S?at~2%?F_91?)^1`C!c5rF^G=Q`Xkh
zf6xg1{_mflwPjES-QbamaFF^?2Kk*j1t}Q)Fu=}^HFN##Bs}eo4giooQr#ZrfY9w3
z5AHF}C>e_K89LO1?Q;3eVpA}^PGDy)Kj?)Hu14@pQ$W<GunBJ<4cuiIc#7l}4=xx_
z^7gy&)qd@f{^bDB03a0sR{sCxN1w&vE*UA0^~tFiRD5RlPze()XE?{*PWSa(AZLWm
z7p*V_e%=jbAPt+a2|q8=w!qRvUob{b_4AwbNM-FEkL{PP3(FwsQ=j)JZ1rMuv$re{
z9IOvc5MBI0Vm`F^UhDXz>jXY!)X7Y`ru_DC5A=s2g?4}U&|diUyZ0m2_Z}}&gMa1L
zJ^+_q`X_w&VpD|A*$r7Bb7jC#K(`mSpZg5;1`H`grvQpsKn!bO4V&-@a-SG3EBZxG
z`mry+r!P{ekL?iP<p|IK0AK(JK={%>!m}SXApM+KpY@A@uFpR^(GUK_OZ_2b{Y-xW
z5Afw)4g=or?d@N`;t&5e=6hxUVMO3Sf&~p8MCec9LWT_&>a$hP;Y5lREndW!QR7CA
z9X);o=`llwaV1TjM43|MN|r5MzJwW5=1iJ3ZQjJ$5()qSIaZ1h0APg5pcjDh6z~cG
z00B9jK7|@p>Qt&#Q;rOoRqIx+#NKfQ8&+&qX<x^7lxK_IS+;H6zJ=Ryq*c0g?cT+k
z*W}KgKZ6cUSyWq401L(~ZK_xCV#bXXV~rbG@<MgWCSS&!nIpMhnmvC8{dTTn(xpwG
zmdV$r%A<f$79DpXD3rrYQQyX$yD{X@y+6wG9bEWWWtN8@M=pG{ZsyIML*@Hm#PsQ6
zN*--Mz4|!V+PwdlMEqR*c=9cICr7VP8M*ZB-8cLd?)`lFVV9T3pWiuOp8WwpxQ;OY
z0BC?a04_)=JpC4A@U-*l^X(mCAfzxjer%DaLJc>h=)ML&1QD;D1R$|Q03x`KsS-<k
zU>pMg&>*D+NDQ$?8>@PdL(ODaOGh6gyT=xNek8I!4{t;=NhOzLa={#nj7%E#prleP
za&oCM%j1r0vP&<&1T##jp45^pc{(dI&5x{^Ff?_nQ4>lo#iX-NJMZk0%s9gma!)@o
z8m1f2=CS1$IRE5uPCOT7v{6Ty(-YCGtocS#OBw3N7PCC-^U?|xeKb^2M<sR43_K0%
z9xPF{G|2yZJiCxp3PCNkR$Fhyb(~0L-N=@Fct!LbTl&#Vo(c7lr<+aH>E=~ngQGQ9
zX{V(&%w3<os2f4C-LsovG`mL@V)S9pmW9aS2Tg84i?&*K--WlqYuBA9NP6QW#u{~o
z)Qlfx4poSpDeu*+-FOd1IN{soC77XHoNYMETr~YG(}mvIHe$>SR=8u2Kc<UejlTg{
z<089}rInH|8|Iq{mElJgWxh3eGLAvUIcJ?^5;<asFe|HOxAd`wX3#Pg+Gdh=X1Zyo
zVd^>JUow=8oK}b#IO+L%tcYunyw+N-rJp9dY^S4cm>g*)`#Eg%_@R0sThy^=?v3DX
z$Zr3)#WuTdzd=Tu;Fu??>|BPB-TSk7R$T~eha9(P@rEEz+@hQR#ys;-11H!k$*k$-
z*KW*J=pJcSt{g0Ripy{wawKGrA9Zrc=U3CE`PH9r-cjZrW!||x_uHkx-5-9wQAV13
zWT)MB;&b<Bb!9SC=bdmoPyKSux96Tt&hI7Xcgn4_#W;2Sxd-*swbDlxfn_0AmiT13
zC!Abl8D^N}<;jI=Vr&_P%wWbps=;k_@bgD5ypjv+-7kOp>z_i}_dcSDiyXko-q^ag
zK@KkJd+VCVH)KJ&%bYKL>l4fM6he$}kYiZ>AV#Gm$B?P5kQ~UXN1JN65P8UA9{&Fj
zmO_T{l^HH%hbn|&IEtna1XfOa9fV>O<#j3)D#RMCV4P&s;XZ%B%o@M=VHLMxjkWpX
zbm3Eo-HND?9TMXn-}uHobQrgA(aj&-Fb)I#u||LFkc<jB9q5?Iuf#o3iibqxb3RC~
zZnP;g_pqZF!BP*kT&Nysyx@@Xfk7ks?~QSsqe3o}vDx|Kigeo~e5giAepphF{%B$$
zHJC_R)-pefq!+{_=_6&xLT3K3nk*u?LR-kfEWZ#J4Br?IIkGXCR%=Bx$<dEow4ylM
z`kyhK*`{9p@|CgNn;~sEPIBf2m%C&eSgfH-lcDi(!~zRE8Nv^FqO&66ENA~d^=T@5
zVk95z%!)FKX_0>(t`&sL$~&^yPUG}*OS9Z(L?vpMbB3)O>I=!>Dss_=AXF>LK$^+w
z=}>4vbfPCk=~F72G@>b^c2@KqG1ij4<oTm|*E37_h+#*Kmd+YAZRtzjaXN;OgBUKg
zsr9gTkqbeOq)%-NK2ti?sjgIL0tMi=_<=<i>LXm%ct<PvVGRocXC6M3M*%tc)v)@@
z7FqR2KEg^FO<4m=WW^dMFTxq9_LVIt$UrfuI#|NOq!<}MfnOWKQBk(yhvDeQPZc88
zCBjl4n^a!oI4N0wi1m&uYsErX$i(!~44f7jM%EO&T9Eu81Fk4+Y-Rs@5?5s42dq^H
zV~wZRU&M~G+d^PI$ZDLP_SSfw)$L@BXvew&*P|7I$a8T!-HW&u4ztB>Vd0PgLQL1F
znq>$X`7w-xe$%VOx<_btyAbh`cSzr5h<fihp>Ubfxf^jAb@iJORAfL3*#+=aYmfm{
zO!q>?)JISKK}lJJBO>N?;lvKLRa?M`!48(lft%P0SqO?B_v4~@Ir580?$^W(X-5W3
z5MUNh)T&{V?%g~RV^MM?NFzP*iCz2O7WbH(+x<e0tAs}(7kL>f7OanzoXC+ZqsUYm
z=95kQ1^+JD%26C}kfmHCLT%Z^DbB!kuRP}MIbtO3@N$u?fzkgo_w~poa0Hp<?6=xx
zz{zbUk}Uv==e`nRBx0U(pqaK^0`r+j3N<ut{hWasz*f+Y_E<3nT<Apq2&9!>?U7Y1
z1xG{L)9xyU6h>laO#i5<rS@w(7QJalxWd)1hIOoEJ!@Lm+Sa$mb*^>2YhL%-*S`jK
zu!TKrVi()k$3}Ltl}&6%I06nP7`2vB?IXTUyRYr|f@?>;ZEknl+usIvxWzqga+llO
z=SFwB)xB<Zx7*$ChIhQ>J#Tu~+ukEV!57eM?H{F<->F7Lwtp~if*0K22S+%;M{)y(
zH{9V5hxiRfl5mPw+~Nsec*HgS@QGjC;~zJ8#y39lj)VW)<P{hB$Twc{leb*q8Bn>(
zS?+S0|6l_d*nkXT4)GO?<O4OQ`OR~_^N06513x$U7rsD<JOBGf(RI4hN5YJARNd-V
z$2!(u@nW%M-RocH`bI|bb+TVQ>=+q)+0}mbduD*@YXADyshAmTtN873ue#iCi<!Ec
z;O=<Wd(?TAU%^`&uztt8)+f%c3?$y`Y)5<J9glU$xBc&vmpf(-e|f+!-ZOpYeB3=x
zcPb;k^R_KKuSgu0T;P~O`dDb{hXZ=dkKQvQnZx9*F7df%ChfYfdgUpydEf{BGPHNR
z@jrw7vMXOR%qP3^Wq+v~bETKP<B&dnQNHOX2m1fbx4maHo%_l2zUjWt0Qq&#`{$QF
z^wAH$WWEo7)c0ooSC@YK?GFC>cOO+m-ipHU5h?LM?{h!6%RlkMJ;yUY&=|k<YqHNf
zz|-41{WCrOt3dmkz^qF^3w*y0EWkgBvXHQbDPb0fA%||DvEiT{f6#|;s1$`rmQ4vk
zzS}^r13}GrK)7qb(AYt|>p=<JKefxj$hbeND?-v6Li~$A(3rm@tid$tGOhT9dUzFd
zL6dxthj(DJ;Q)?%kO$$)DSsfLC_KI!WWxRvjvxHGAoRfn<iQ9GjU&vvCRD-;R6I2l
z4(NkI8(hM3=tDEqk~RCNT-X+YVF+mmBlrI(lne<6b@7)j6vVc8LObjYHpDtNyhJ!8
zJ55|ZG(<v6yhF|l#8Iq6J>0_yEX7Hz5<PROkiZy*P!<g-!G*9GRy@N$Tt&>l#H#be
zO-#Q|l*8btL{yx^8{9=d^t)u74A5gnT>KG*l7{ioh?tp~E+Ukgst=NJqjz|RmT@F#
zG(uGr#o)liU-XS$JO^}iLS!sQAvC>b%*9d5K=i0PdKAY?;Rgq6g*^iaNScg$SVXb-
z25QVlN_0PYyo?`Y$8_XGUmV8cKt6?h3uk=CRJ=&vxW{@tNI$s;@}fZtxrdP?$&xI|
zTo{Id?8ptd$BZ<`1#HNd3`U3~we<h6NMoEmD#J$z!M4PzkDgpfPpKZ{;EZ1|%A-We
zqfD8H(TI}t2!0^R6%5Lc*vJaev{5_1_ISXU)JUCl$#(q8J*<#@o67Y$tu7iUu}GH^
zW2&nmh6#~|w<Lxix`*vM6yLFhT+jz~c*_baOR)e-4Y|s!bdRfy$o8m8`UuRwWX$(C
z%k>fqseBy0$^~*5$uvTj%IqUSaVnB&Ot2tJ!K_IL8BCu10-yZJ&s0s!04rt4q4zo}
z;lU#WnumYk7X|AV%G{K;Q5!N;Er0OL)%>?*SOLO(kI)p(<iwV%c`K|@hq}TNh$svA
zsiST{6Wq)U1<QpJWDmY99W4K`nw1Go<s{GYG|yd<g?zvoI2tWjx`##@B)cMqa8NJo
z#0>2ODM5iRd)cFjA*As<&j1zB0o54ba3eTcJu;M#7=)jh5twO$%+JuyO;Htv;2jzQ
z7yu>E4du`dwG;#WB>1eapXvu<IH)Tr9Z}M&+;kWkq@N^mK`Y8oNnA;K8Vi;5(96(=
z9W}^_;D;TROj!Zaj{wph%~AINQ8@ZAUt*6S=`aM6hPV2KwV*H>bqno`rdD8&3(AFD
zSc?%d%Kx;|d~5_Ra00QI2P5#u<Y<=OkcZ!-2t@o0c9PRLh0}^)Cu@+1wn!g1`U*IL
zBZZiUH4CFRq7)#4qjmo}4r_26av(&)p_Ff^hkO9kDN!Q%P>45Kr{nnsZ8_2`G1B3P
znO35lesHSgX&in?uFt%OGZl+Hr4K$RBhYwL`j}O=$cK=Ei~32#eArRrv4$OGR8x8t
zgkq*erJOMZ3w59)6-+Q-+EVs-hf1j@ebCiUovwaBN{=YYUx>lgY*krogii<~a`*&A
zsDvN=1afGEKaeA9u!TQ(nM$Yx(SlcbwW3OBgi~OP_W6TGc%4sJ2>0<<fCZvAV4yJi
zg+UOKv^WL)X@s_Loo<+tcd$%Rn${^17+rE5a`+*1snd?&hxw$MeR&;Gl7?r6R%aPW
z%k;*Tm7oVj7YqLtm?5c$ZfGSJ6d10#hmCbXdFa`Y+z4J>h+Dm+fT;(5m_~;<*0@lI
zo+X#HkcSrP5q_}PrOgL&PzQNZR<2;yg?P{KqEa{sSqZvUY(?853)g^|f?+s?Isl?6
z*aT}Zf`2lCGWdlokcUs00!7FLBd}U!FoK2PTfYTdWtakC;sUlfg*ONXWuO}`_?CHa
z0)1%Q$5n@X;DaeBgE|n{Tqpx+7=%;!1|w($Bj5us5ZVCjhK>a$W(pnMAqRcf)1ak{
z)<r~V=mvTChSkN0Zg|>F)!k$X!*9@CNkyNN1tKYt5;(El(&<@iAeL@`T`;^TI2w}l
zfgWo}E9d_OoqAAIk04q=l81S?LaM1%M^(wDg$rpQ8A<`#bz&A^wM<4OntF&uE4qxY
z^{IK7has8OwIP~<Je;#l+XLROwe^QjD1(VH0)5y7MNo*ky$2(x6kquSK2QiJ_#u86
zT!qNs4W5TL01kCn+_U(FDL4g%Edzfzg?dfl6<!EgU5Gargk0E!H~0oG@CPSQhd;nn
zu_&HeEsGHP3iV}(mj$F>Az~)JQ;Q%P8AO+q1tLtnRUk48i;dz#QDUF6okNMExC*J*
zjUJ7SUxf$<SmlWEH6w5QSoEEeLH$<USyLh2$1Sv2stML<wIZu+U3r+*t_?ss0;_k(
zhq3=+FDg|ch_O}#c4Q$_;6~tsE~OoWjVlUvRS?FYDd^x2Uf@lpT=wXO6F!S>7z86g
z6D}BrESM5gMrDQIgNEXQO6XE={R4l<0)GJFv4~<InkH!|U-K2zi{ck0?q!QLBPkZ&
zL%CT*hE_mo2qk_8d3Zrnve4bsQ<}}KSIO1I${l0|rl*ZTkNpTXzEyd!BmVV=$buO5
zeG51V2V}vRJzb}7(BqN)2LD||LDmX&4qNsD=!?miMt<ai)-MGfhB8=-X`)xnH3IX^
z<WE)zPBtD-{sd5d0}SB;QcfWzdIN>{Te#I7k5-6A0FGa2gop*EZ@A@L-sQ1KS=0Yv
z4{Hb`O+w==-jtXoz%r^;j|f&^dIv-%8fW?Gi^*bYmJcr86tDtYK^dwHTNyGIE-U({
zamLY%Fz3TLl%n3|g>YxLfM<C|<|syHwc&?(*cL+K=dAE&q#=h4sns6&XBRYJgSKmj
zs^BcBSAVF4EXaa4$cJ#q0w=HqE{LOuzUYbW<SYP=#P$bHCI%-+Tpm7)P2hqu@B-uL
z2PbF~%f@Wu=!Plqf;EV%H{gOSXoPTRX<dHekWdHRRR{JUnl;Oiivpb<;le|CZQx}O
zo^I`m0AxW@+BMsh+_t0K1|n*nX$vJpKqekVydx=5UL^|Oi^5b#t;IJ&+H(I6Vl#T~
zg<doE$Oqk}ScdrOwg~IA`Yd2}K{Db(@O~vTs>R6g=jVnKq9JDB1f4cD+q?E}{mR+K
z2@7gYAdzMZU9tws23v<1$XA>X<yFhIh7j$xh<>P6hX`YW8A^-rngDO={|51XLWmJ3
z@e(KTu`uxzH*w?`U{B48;d$;Dm+={=@fx@B8^>`O4~h5GmfxO;6x0?6#}<symaB$h
zZ7J^%S8_2@@g{fjfk5#mmvT=&4t;RFj)3tT*YYjraxGu-F9-857xOVE^D;N{Ge`3@
zSMxPz^EP+$H;3~$m-9KN^E$WlJIC`p*YiE+^FH_UKL_+c7xY0V^g{nP^g~DVL|61h
zXY@vQ^hbyENSE|Ur}Rp<^h?L|OxN^H=k!kZ^iK!%P#5)4C-qV{^;1XnR9E#?XZ2Qh
z^;d`WSeNx#r}bL5^;^gFT-Wto=k;Fq^<M|}U>EjbC-!1D_G3r(WLNfOXZB`y_GgFo
zXqWbBr}k>M_G`!XY}fW}=k{**_HPIGa2NM+C--tU_j5=0bXWIvXZLn@_jiZ)c$fEi
zr}uid_j||peAoAV=l6d1_kRcYfEW0IC-{Ol_=89Igje{5XZVJ9_=ku1h?n?@r}&Du
z_>0H*jMw;$=lG8I_>TwqkQe!pC;5^$`IATalvnwcXZe<Q`IrBP`IwjanWy=hxA~jL
z`JC7Jo#*+U_xYa(`k)v3p(pyHH~OPT`lMI-rDyu4clxJ?`ly%ssi*p?xB9Ec`mERb
zt>^l#_xi5~`>+@Lu_yboH~X_k`?Od4wP*Xbcl)=8`?#0;xu^TOxBI)t`@Gltz32PB
z_xryG{J<Cd!6*E}H~hm#{KQxM#b^A+cl^hP{K%L5$*26vxBSb;{LI(<&FB2i_x#TX
z{m>Wv(I@@VH~rH`{nS_e)o1<Icm3Cg{n(fN*{A*5xBc74{oL36-RJ$@_x;}o{@@q>
z;V1s$H~!;C{^VEw<!AopcmC&x{^*zf>8JkcxBlzL{_OwP{_W@f?)U!h2mkOF|M4gP
z@;CqUNB{I!|Mh48_ILmHhyVDO|M{o?`nUi4$N&7-|NZCx{`Y@?@F#E}!GZ=4B21`o
zA;X3aA3}^MaU#Wv7B6DVsBt65jvhaP3@LIX$&w~dqD-lBCCipBU&4$jb0*E2HgDq0
zsdFdKo<4s94Jvdf(V|9=B2B7vDbuD-pF)i)bt=`WR<B~ss&y;Zu3o=_4J&pm*|KKO
zqD`xIE!(zk-@=V6cP`z!cJJcNt9LKozJC7#4lH;u;lhRwBTlS%G2_OLA485Tc{1h7
zmM>$@ta&r%&YnMm4lQ~#>C&c8qfV`QHS5-{U&Eu0EqgZY+O}`w&aHbl@7}(D0}n2I
zIPv1fk0Vd6d^z*x&Ywe%E`2)n>ejDg&#rwt_wL@mgAXr$Jo)nG&!bPTem(p4?%%_Y
zFMmG$`u6YR&#!+!|Nj2}0~nxy0}@!Efd?X(pn?lB*r0<CLKvZh6H-{Ag%@I&p@tiB
z*rA6Xf*7KRBa&F6i6^3%qKYfB*rJOs!Wg5BGtyY2jW^<GV?Y2Q`2-0f0RI3i00000
z1q9FnhX4Qo2nPoY3kwbp5D^a!5)cm+6A~E~6&)HGAs!q;9|t8OA1NgxEh;E9FDyDW
zGC?~yJwHTaKPE{-K1@bIltvMlM-WI$QB+MxFH(<MQ%=QN5oTOfJ6)8tUly%k8^>T8
zUt?-*V_nE&9z|rDtz{(0W+KUHCQWOdcx`3OZ7jlWEX{8)&2ckUa-oWHD8O<vesgSp
zb0=ALsLpmeU3aCKcQSK$fY5n8pn5mMdq0PKbYgw0(S1XOemL!ZGh2W(V}LZ%fJan<
zHEe=7c7r^SgL>10Ou&Rn?1epAhC6VEt$&6>frgLNhf;2cwO)xpbcwKqiAKhWQq_r8
zdx}Nxi$`IMMU9P1nvH{Hj!D>#TWOI^e37@rkzS3Ho|uzX*^^{#lv0S5SfiDT%9Uj9
zl~{3>R@9behL^Y6mucIXY;~Gkg_^;knp}&Vx}lt9@tk9loo0KUW89u&-kx->pOmej
zYt5i^exYabqHBVrY@MXAp`>xpq<i0_e21oSm8Qh=rgE>Rci^Xhil}s&sKB_WoxP}f
z;i-estc8!Qdz!7yx~_x1uA<_uilVQ@^sj-Hv4YdFjO4M6sIrB`v!|J~hQ73l<+PKm
zw#oIji=4NM<+qs8xRmL*mdv`Y=DM82yOs94lcT(nvAojOyqn^@l<U2n=)R$+znH1N
zn6JOu_Q0FE!O-f#rK`f6)WWph!=}Q-qw2(~_r#*i#ip^wquIu}(#Wgp$gj4^sKd$B
z?8>v>%e~>tvbxNz^vtlz&e!hFxxLS^z|pnE(dW$3-0#u7<<h~$)Vj;m<I>dI+SI-5
z)Wr1Ez4_F-@z%r0*S`AK!QI%z^4Q1h*~-k?!}{9A+1uap+|1qG;riXn(%#DC-pcgf
z(beG2_2Jal;?UaT^XlW&+vL>e<>ve4*68Nu_U7CC=Goro+3o1u<>~SG>E7b%-S+C?
z`RwE7?cwR~<@xXE>hS0N@aOIF>ihES@$~NV_VN7o^7i@l{Q36(|Nj6000{p8{RtdM
zu%N+%2oow?$grWqhY%x5oJg^v#fum-YTU@NqsNaRLy8<pvZTqAC{wCj$+D%(moQ_>
zoJq5$&6_xL>fFh*r_Y~2g9;r=w5ZXeNRujE%CxD|r%<Cxol3Q;)vH*uYTe4UtJkk!
z!-^eCwyfE+Xw#})%eJlCw{YXiolCc_-Me`6>fOt?uiw9b0}CEZxUk{Fh!ZPb%($`R
z$B-jSo=my2<;$2eYu?Pcv**vCLyI0wy0q!js8g$6&APSg*RW&Do=v;9?c2C>>)y?~
zx9{J;g9{%{ytwh>$dfBy&b+zv=g^}|pH98H_3PNPYv0bjyZ7(l!;AkPPrkhQ^XSv7
zU(de1`}e!k^_ow=zWw|3;p^YezhtNl00t=FfCLJ7M1Ke-s31jQ6zJfC0LHW6gcMdd
z5ET$+IG}_UcIcsg7y@Vl4kVUHq7x?KZ~_i0Z1~}eFs2uxh8l7h<Bd3aH)9JYrsyLM
zP6XLvggF*z<aImJpyZM?wBV!)Dwyz~jYn2#<#IC~;badjn6PCJR8SEH4O3oe=9$IK
zNF#()qUq+FxNWg!h9I;F=bd=ErVR~H_6foUBS0A-lp|~aLZ5xE!B9BiloU-g7-<vD
zJ|fW*O``_6(@QAnloZdUd4?*gLO8V0i$HR!A&@pI;2_aH0BZj;Qak|mb5RQ$3?tGj
z8}wk%8Uo@Vt4Nt_Kt)3ItdYs6%%X|IsRFs9f{nef@M^3h;d8`+x8}NQuLbo2;1+90
z*}_Q09*dBilr-zEm3CqT>juLX6v`TZKq?SEwA7)jt<gL(3?YA{lgcCTWU>Y&l<xCL
zyAFpEP9keS>km8>(=yB>^$vt<Dio(O5WoIrVyi#tBoam)x)5}4zAmrvNU^>W^ar^9
z^kRYv_~7$MDBAo{M>R3SEYLm*b1YCbk3f5Hqv;BSjLL*`iVUtti0qFxk0^_eK=eG4
z$}4N=`tI5MQId)~3}uqYGY`$%u|P)%7>YnR2)Knmi3tCwO%H|!=!8GCZqN@r0R9P}
z$nZ!h;IakbDqt9R>rJ@g0771OfOq?|d4M$!#Onqv{DI6s;SdPz=NsIO&yWDV;?E-+
zQ0`COwD=P>?E#vAPaUB9^Iz|cek0%?Xea+3nWRIG5a1iA@Q6cl7eou7$ox0LKGopR
zLpuMNz&C)8B;pU?Equc};k6>Z!5Zn*O*ybCAXDrH&U;L{GrVil{rBOUU9aLniyk2F
zdLzglp!R_b0EJ>0EehR08Wf-toGx|7LPp(G;12{UaC<jX!7%!E0s-0%ce*o{Kb#=K
za1<&U=>XgszL5?9u`F-CGTsKZ@Q6++?}zDef`I>oKoGV~P(bHuNc9K;Jn8k%ANY7h
z9V9ot&;hPp?%PM<4hJB%6>D&SGoL?Nw5&fYDH^z%o<II1vM5dwKpg}f!~D_2NA#~)
zNd%q*2NI1pMhJtAYTyR;QOEuPjt~OD6z%qQyA9+nYW|qo=5og_;ccLVIRnr>bQmun
zdNMqD3(yE8qzhb`pbi2NqJYe{kR=WTSQ{{bEKT5ybesTCn;W0)&bI-P(L<A4%%VR!
zv4O$mO^sw)76l!NtIjpkmbirD>|p0ASk97`eXAMm_V@@jm`xi1q6G#eRKpF#!<w^n
z2CniaKt_`3kt$T>5eh}g4YX^Ui3AWlbol?tewIf~9Q23eV&@Mv2*?DTEQl)way?f$
zj28PK#0Cxo&JE~tAb`u=F9#V+Y5r$$H|xPZD!MFf&?g?a+FRiUHqouY5gAPj2PFU$
zj)wZ<q5I&~2)<UgJ=U!SU#n;@FetL&#nGXUfGCEJl@1W#fF8v<&_4bIPbyRt9%FQ*
zKjbt$K}v{rAn=Fr!s^emf+rk98iB~JXE}E;Zv)6vB7jD4O>N)<K-(f+Kf?EiA>pHM
zsuD;>{jpIkw$G!*^hY!j7a(>D6hK{y-d<zbR{-H76^5#VoK(<{yH50{oh{S|B)3O#
z0Vu8ez+kTcq$tnkwFUh!tqN{Qxnci|OLA2$oElVlw+5*o4Ew+p2qZVXv6}U`-bu$J
z2=R@43MjDgpu`$l=8%3Ah-eT5P!Aflj}WnN1HI^*q6Di|&l=Wng%iks)D?;rfFKNY
z>l{IFRfj*RKvvxa(05N&SrAY`U)k*yrjT(<5CChB{z%0wwc9BS%Bh%N^GATUE09e5
z2?Sf<5C!uJ&%HfDN-7XyZBI*BRf0f`sUs_LSA3m196<#%=z$te^||`_gAy!MQW$cF
z5qeOHAU*p?C&HjcTv_ZOSOs!~3lfi$5yZy^NwPxl;X~&_amfRLazUg#GAtj&PW#~U
z#aK*c?Wmzp1Uf=I9&v;%gya7kXdX}x=BAUyMo&sR<p~DM%;ze>azIBwUM9BSge`2L
z7wJ#~<^trZpJW0DJ97e^ZxWAf_4(2{Ql)^X;EpgjPCz}NMKwM>*MwsF)Tma9rU7(<
zc!aV*AfUyAMQQ3(+xpf(*}@5Sy=xW}?m=}3#WiJFYg`-q*gg5RgHVa=W;@#`$}SMI
zpH1y*^CTX_$hNk(Jq#mS``h3Sx46em?sA*^+~`iXx|`LHA6H}_?ly>%*G+GKhT+H;
ziITb~qK5G@bYvDqOFHJQk#<`o-ZzD}!Vh9_iYR>H^^SN{Y@3PGX@nO0o(Q}NvVjQS
z^(?7SoD;mAksbupAjAKNYeK}u<2Vk;%K}ZJMA#}Im`nWTM)^kF>Y#Fo^kNNR5F^G3
zf()P|Zy$dMG^JiK3><f&A8V-C(Nd?4bo6Wk;Rr(*@G%Tp-1`q|)Ji`N6$;=@J0mPY
zhzb?L@`0oy6EjsoCQN1!CsE|>ai2TEan5(5B;6vZFaaefk;I`3L}!WU1P9k}gkBs$
zQEM2%$|%>1Er?Nry*k1x?%IM*1e$gY@-$bbs)AnZBNVxVpr?Cawm;C7+11zr2#!EB
zCmaYKDri^Q;o$@j7?_R#qMYkbd3Y{0sO1A`=}osl*SI<fA6#ng@KL!B6>Nb_j4X)q
z`+5Wuq~jGT@UQ=bw2?Pq_5J)dF`z)wq4g~+IUZryg2n6J3B?wE-#wTfTK!=HS!qLj
zYcM$9KwW<zMgq}s`?3M2lQdzV4JD*vTG2NELIqfLJty!7Cm=qHMJ}x~M$)r0{?H^S
z16Q}hL4N=Op-?yJa6K(R3mXV5ce68(&?3lpfZQTPjJE;i(*i0`H@WkIturr_066->
zaohqdI1mP7hXbJJIf4fz=of`D0bZ+;J4euRI~ER@q)=Gr52eIV`$jL3#53l^KKP(4
z1yO(;=Wzj-2}DK-+Hfoos1?po2Q6|g*JD1kQ-|+!Gg|;o(_?iZcrG=BJZaYtub>7k
z0x2p4Jox{zLyI*%v{Qrr&{DACE3k4dlEW>I=!dX!EdPOTm3V|=C@xNr2(rX^iI6v#
zB89G~5{N?!uK+EtQ)Md9DRpuXEszS~0D>K~Z#a+%=>UaC&@Pm4AZTba2IvnbKr~lZ
zVQ(0RYs3}NKm(AIH}sH)DTEB6R|j>F3C^H{TSGK_B32}rc5(uA8^DOi(v9EPK+7^y
zlxT^{H(ZZ}E6(5#?wAR%LOHx5ipmEp^k7Lx;Ei=qLoHyCRrZPuX%g6HEBnBD1aXV}
zXLI3$Sqv3RvhxZcFan9dLD66WbOkBNI1o2u0w?nbBX9zB@Nv4M1`i{Rb9fc~Z~`MB
zG|~SPM=H=>BM?V*&<Q56EGMv&P|^=R*dT_;K~WM7b#pqy)eG12lR@bZfszThGLPJn
zH!8CMsN^K{00K1NlR(Lj8=xxxXb=I3fV9$hCqOwo*b6;C0|?iUbQu!v<^;Wf56#sn
zVSo(#5S9pGb8bf|p%6O7rcj636^;j4vT{9Sq5`tB4-a+(lmeHeqbt4eCm4cACMP_F
zQa8(jA#ypHltK$F;)7_(E${$6z$H*&Njsq+nRo?nW$6!RsePmvVUO@9=_6rMasskb
zm%>>RywW9i)05FaF4QFvD$oN*Z~~LY7aNz65LFNjH!=#95C}Jr0&$&36E}Njopb+5
z5nd*k!+D+|5e@!!5$Vv1hjBfWh@SG<80P62sWqPSnV<T(pZwXM{`sE($}9uIK?W5d
z(V%Rq!aAQKAm#%*7BxBqB_LsE8`HTFi5Z|6>JS5Z4zsoaukZ|da}Ll0AkP4yTzL)-
zdJZ!cAe3+p1|k~wMiHUVBGE|^DiEK25u+#J3>TWA$pIke5Trsnq(oYzMtY=38l;rK
zHo@5$6gPho(E>F(5j{#5PkIuK=cCsFq)FPPUizg$3OEy*89K+6Jr@yD>UMPy21G+R
zkFW)5AS;9rG)@o=+K>soKn3RW4N-?FcbcbSgb$Per)?@1Wy*67_XtkVfa(7*Z5-n;
ziz+KIB#c<K4~akpspoaQ0CrlM9ANsXph~2`vjJm@8GmOHX?jyC@CUR20`NuyRL~1F
zkUK5lky(?OH1G-*L=U~t0v3m>x{3__;GDY916nf|r%Dlt&;!+=3ysnOvI7qw@K?<0
ztlBbM1-VtR>Z_nvJL1!+#_<Ss5TwCSuE7wb+Mo@g`l-)guId`3quQjIp?;`3EaK7$
zGun0EdW8ZtJ-uL32;~n{5S%^ms{uQ(!vF%dvIWN~7xc=0@rPx-aCQX|a*1F>?Zr2W
zVzJ(qr8fmvDF}8A_<-PQ96-8QJ&>|NYG~^^q?v%EYml-d@UlW$2MGUm8B{0`->?Pq
z77bb_X7e>Hsj!owATfVnJF_ZK_2PJ_qBRA3c-+FUI3`#P8y7jN4OZB4U30SofeaYZ
zIgoh*%@s*sOE=Ks4){~F8v}=OShB@&vKv68>DsbFN-te11T;IO?r;R9IvKGzixX=&
z6G;!DkbQMGEKSuY=|Dh0bu+S)syP$2PW!8p+Y3C?H&y!<e@lxLIS_x75N$ey6^1jR
zTQfukMPt-P;SiH;>$bxIw?fJdhV}_TD!aiz1%Fr#VQ{-^;6Gsyq^OVy+z<?o6b#jH
z4ydpNLa+uyinm3&qJec84=E4|I}o_HH8NLs_9#3%(*n+b4`lzMb<+d6OuJPC3j%{v
zzFY7L!)h#=R~OS8k*u^TTuVnPz=J$Cc06W>_$xJm5|*qoTbaPR)9AXw0lPwq3Xd10
z)et?)x&|Ps0)!yJ&oBb;8V0FQemDS!Adm>J(4s=>yhRE<RoWL&Y7p^Oy#fIbB@_;g
z<`7s`pAmso_|OkFrWGgrZUcdrdWkahyAV{;t4tPU1X02Uj2j<(4vR&kQOCd@dJcrJ
z1t9tg=ip)$e8E9#w?VohwA;LSJEV)q7xOm81mR?~0IdyCz5O5|DzFd3K(Q<_qg0>*
z>sb_JJP>!>L1?TI#c2Y^DPczd0(F3&1knpDRD?&I9YO!P#6#M|=g`1G8pT)4p;8P2
zL8^6Ge7p=?2VTMrA^gSX@Cxpb4v1_Q;Xs)n5Drm1RjRxNtegn03<BQ(%k#2J2a#yC
z^9|ZCIH3>*YT%wO(GPZY6sOF}tDMTmJTb96%dQ-JAEBNSK@U@!$kKtpLh8tn48>Ax
z!L%>}pTG_D@(HyQq$WVc)esHm$_*oc3ZFcryuvMd;l>p43KIDck07soA<q**&-2R>
zGEB|oVa-7bEGEDW;1r~=45F_Wq(8L<zgxw0wYyMq0zKfxLOMF7d>8m2iVjhz5An}-
zvC$Oa(EyDmaQi6H;H4Gp$wQjbM9K{=eGb~d(&zsi4Lv}!7~L1{ka4E5(<NP2Kw1q>
z;v_0<!F0=^L(R_Ta6K9Q(@xDCM^Mr08q-I8(Qv#M@k13A>JUc!5?Ngp;kngM4IHBy
zJ0J==>d>JjsyFK3pz5%q0741sARsEB4rN`2DzSHBeH8lK5jr{%T(=Q3Du#jC&o>$r
zea#Yo9TNLj5Uc_Mjy2Z2!8-tQpf6gW5n^WmqACt*n*t&`bS*#xWe{W|5-v#){l*j`
z-4Rzh5!KickZTaHUBp7M+APu9jD2ziQIe9KAn5?B$k5dcaoPj1*GA#f9C4^;>Jaqs
z3N4Th1LqHO`UiFDrf{0Bc&evT6M!lQxoiJ+-Oc^n1IMRp(2B!gXu9&J+C3A<y%Nej
z5pM@}sX#eMr*zx>V(LW&{3sB--P`>EJX=r)z?=|W_jPL2%R83eJ9bxDw{=h_bvISs
zTK6@Uim6|btP+t4G%$Nd&|I~e2wC%&u{x{3YC%&K3enJ{sVd^KN(&m!;orckzA6y$
z0NEB64<(+%U4h{d(ZCJzV&TAej;APyr+C6+D(l_f{=FaI)T7-hdTNlXE5kRw3YDDa
zdB{_Ffl4}_he%tntvY@aU(FHpN)fXy5G~-ZSi7&ZpfeIOuw&%0Xg(~oz~+htm>6Yo
znV>HE?dAfD&n_|MEAg=Hw`7Cn1c3kU57odySXZb0w>9FEfBvw4I6wtuS2Ie!<nWOR
zCkKD>rx1@YvTH;ujUul6$4Ym#fa9fxP^5smvj(v82O;YdiLDViD^@&P5SbufvW@3T
zYm!LY=8_9VGbopHE)Yj65J`LHf@N`kFkWj=2kM)-Em7+!akW`H5Q(r4>U0p*FgW7l
z1hyq1v~pLnf(%Nz21TninXc*X;m{K#PFr{o1PlVh@U7msM)T*AZiwt#4vlEL>ks4;
zwyhDH8@Tfp22`-zZZ`rD`RfeTxE?y~@z5##U;<{7s%MN3j*Bu5e^bpa5YfOhuM-W^
zJ`)9>5}Ug(ovZD2yfomxLe>9Jj5l^5!8nW@q;>uv%={hM?%p0fum$OWJQSIW2vP5}
zvVyfq1x_F#&!{`L!|MD_IVzyKKGEJAF}-U<aGAjH7h;pNS})*RJ4B|wukZ~|0?+Ps
zE@Lmg0zm~}FIea+5DkK1k&7yc&JtL!67gHl13?Q;5T4)8e=8&@B54AU!jU5|gHU90
zCSW^j00Q3k^ZL;@y-AV2lMwZ;j~hS(Y(`jsV*+cy?}2raoz;e_62K?m^H-6=T<`T=
zmJl+G4}^@m1rcO{3DRG2mwCCDk#q$8kdF^RC3C6!l)oPC)|Y=N5im#l79rd#A?P5X
z#vIc1eIflV(Z_!rB~kx!{LPY_(<K+y&JnmA2D;44PSP%WG5#<C&EEh129fe2anFGv
z|1n|w@ZZ~eZ`y*f|M?FP{sayrSkT}>gb5WcWZ2N*Lx>S2PNZ1T;zf)ZHE!hC(c?#u
zAw`ZPS<>W5lqprNWZBZ?OPDcb&ZJp0X1XIbb?z*Pljl#ML4^(_TGZ%Kq)C;M+&66L
z(~eD{PNiDa>Q$^+wQl8#5MQsZVF!K{Th{DZv}x6@CAmR`zeF44Zg>@M?uMLe?#7FD
zca6Uzcm2KEK-C=;poIy~P2^9-+_!P(*1el|Z(q4n4<{acxA9}Sk?&HTYk4l;xolOh
zX5HE~Rk`Qt+@=5Y>~4>9TkbwvEO*Pf9(T`WemznyrMq>`fp#mKw(YsNb<gFUx_HRr
z$(KWRKDYMm+`D^UCtu$DdGs1%pJU(N{d@TF-4loE^XGc``Sri2ztlcY{Pq)2zW&lP
z@IV9;bS=OE8)UCQrKGxV0|zT?4??6Q1du`tE5uMi5JMDk#HCbFp+g5hJc_IdQB1Kg
zs94<4#RgR*@y4vy01HPRyP|Qx9&*wQv7e5>?Z^Fs91<uakxWv^9;3V}lntmzMM^BG
zdPF%V^UIQ<F8BLVp)mCu^US2+c?(T8iDIzK+|;1zzn#?h4bJzrkh4B0>%0@s_VjFX
zP@rfDL!kd*9@){KZyrg9P)J*PvrHR{(r~9qDTVQ=OLfXL%t|8_6{SBM-6s>r208+t
z9!7Pwq)(j;btoAz<q*&ZH(jb$PjAI_)>nh|C=?UI=*ORE{_@A2E&QQDSZF(n6-i)&
z+N?!fb6pbKY^#m-Ta3O5V;_O~L5xUn)1By*PhNQiQ0O9!?HOF-C3N0;y;XPLhgzVb
zg?$eFgOX7AHTa>&wxGAmEmYVinrP<iQ>Ry=*+&J1!+fUUha=__sERMnxXX<lhWKEV
zHQJ}Klv_?Ho<~CCl1Aj@ipQ!>cft%~Cug&{s+@J&`A-^s-r#1JlU91fXdVgdE~ulH
zdTRfwtF}7o-xlt$=BvB*`fISm7JF>6=b9NsuFF<?ZMNHXTRWQHmiuZI)KJ6YrN!EZ
zT#Jy-yR4Y!7ToIKMs9G6Po5rpamE`DyN5@5c-O&Kws?dF$1~S_bGaawyu!*a=X`J#
z9{IbgP#)99A{A&E%PE2CF#U9>qItTG$+Ok{oSIcQJHMKb+<kcBi;qt?o(G&xc;lOQ
z9#G_o)^GXe%Y23spH=XicC1=hy`t@-c{cXhxmPN%&#Q;?nc(P3vU9D~C!T%zk$fim
z_~V;P`uek_zke6qFEsgs&;9^Nvf!-Ad`p3up1$Y3u~0%!)$qqKwy*`*5keb(a6<ny
zzOjZighL?octs1+k&b@UArYCNg6ryFsA^E*Q48cr%uaN`Fkw$NhHDQca-)LW;V@g=
zK!p%d#J=B9B8cpHg>tsg0|FW`OhlBTg^<X*C7z>+xq)I8X~ez_l#hlpaYsY;K?5rE
zf(EYh2L%1mk09xy2dRh$2r`ig5ZtT<BS^#%QbCViv;Y|b$pj5RaD*d#qYfb00+sf$
z0VkN~2n8FXP3+=6Fa8KRzU!e|o)N`NI!PO!2xWz!GqR0&vXpol<tiI=%7vv;1)y~0
zeh8xiyjAig=SV_BXkh|@9D$8)90mxEwS`o$P#{!5RSQhli|_SdkOC3kK<fV>BoM%3
z1L<%=Cmtb2UB)D4zpLdd+b6km(z2XZJi<Elb3K`Hjhyc6&@<Xe&-lR8Ep?D5J{_bR
zaE4PQ?nuH9&cTpB9Lib4{2nEoAdor!L0N04LmR(05NQsin&cD62;2bze^5ailnAIm
zTcU;y_|TsXq683;1H_fa6kfV{1#*}tQ=Dp&rZ&y#evq>#ld5DNn=nHXg2514v;ZG}
zpo>7<*b5clBQB|kMpW^EON$mHqXJ3C2#&Q6*>&`zAsuN+gQ}9psI#XFQ)y4Fc+;Ft
zPOWZ*&;RHuSGwlMHVQmzN~~~>qb>v=m<vM~X4e7`wBU`wp~4Yf;gA0?Y=DtYy(mOM
z@X%$RU<9-Xt3O5n50HwK5|rrcOQw}q)K-X!sby`0R@++GUPxD^Er~m<01<p71Rnmt
zM?X|BO?>1Qx5A~Ztzvsz2elHp%Vm#pnVVXD71tuI*n~z>M+FrqOS)J&?Q`)Nix~Jq
zK=x!$7R(EZ_V~iQS+EA2EU^O=Il{blKoKbD+uB1M;u$cogm+OJ-R({!4%pa8KeR#I
z09&QI{;g#)AOHXch}S_7fIt9Z&>l-bzySb=g^S2=U-zUS0NUtK3?P7j2B0VfDF##w
zIxL_MXNv+FI7bQqfPgG8xTgS4@I&^|%O0m^!8#6QI3BQo{to}huIE_5h1~-R4!dZ^
z@oBG%R;*$c!|59U0I`0ijH?;5&lxs81d(OR;~+Bx8iGhOdWLM~DvCe=FLsY5vS0@Z
zpF_TOC}Mk>{2nONnLW<<Fp1Mk1~Pym9PIfrdy?S@M<n?izL4}e9?hO`93l(22yvDl
zy=X@}LOxfH1sM!|4r|yU3+QbRF0w#|WVlDuiEhu9yPTg!Pny-|0EKu#!D&a3p~~mT
z^riuA2M1_iwHPQsp5g3HG`Be+kqE4`$@AuC<8aIHb&obC000LV007?z$F~y@00}t5
z&rWVnpxr};8$-CtMgTwp7yy6|Yv2F~(0~R~aE>e-Kmh*;XwM-4AZZLhVA2Q>zyShK
zX7*f}J+S~lj@hGu2aLJ_F#rGn4A5avARylVJ_o%GAOHeD90TB9z_`y5gOxv^-?wg$
z9rVp_f4`go?RkI*&hY>aJOBU!XaI?Q!ElE|+!7~G001zcTx$q`+u2@cw5@HBBp~?e
z3-T4!UFiq_?3z7tPI8CoU1m>Iz~}7w^OK{@9$Wyx=e_^{d@TV0CnqBrmWaUuHXZ|u
zmz?13VE_i$LwEW<fC1JBhlblDarR&!0gHA9zDHf}UQ7Mw5kAKb0N{wYb3hx;IPo{=
z&h08^f#Vv8K@2Kg=f3|v$1&JBdwTwJ08n7>2jBlZ;~k%j15kj(VZP@%ATR;1SADiy
zr^q?X!2IiAJNfeSJgD1)01mtd0t;x*1QM`rK))T}bvG}+&mjT=#3$G6F~Z>44*>C|
z;QN)wfO%K`_$>3f;+;2u_1|M-R->@Wb24iHfE37ruq&?wOaKB%0ZywmE_<?m>o<1G
zHQM7jpHn;%E5JjbKl=lK@k_GxO926xzFM+6=o^JmfWG38J`;Q%dOJ1tz`OS-Job2o
z5(ohBb2~b-F%0-Y41g~T;6C_RKf&v^2Gj-uFoJWqI|u+m4fuwL%fEA=fCUJL1YkG#
zfV{$^I5N0C)&l@gyF2>w1vvu%4KOrYa}WRUYCXVf4-2flb8vtRTsvEHLMZ$O4sgE-
z&;Yv<0rz{sOhUm?frs&t2{Sk-7UViXEF~xtHTQ4;2Y3$(FaY-81__YEwre->gSS|7
z56^o*_rL%OfRFb3zXI3+0cbC6001W3LMpsF4S>J=kT{ClfmU2Qx{CpLgG73xGi{)^
zz_UC7Aw~Cyfx$DlI%E%9YsFV=4-v4$CPc&6dH};~#6euXmVt*JP=RrY348#uMQjZh
z#Kz(gfVFE61Pm|rItM#2KwmHd1$f2<5CL5HMEyGiTp%%LK!6GG1@+1?Tqpnt0EJ{Y
zgcpke1GvX8WWR;XGrE(z_Rs(Wumt~Yu!D3=fd#+?XM3<~9JK}T1yFc^1W-4MBm-Pn
zIb5&?11QKtSb&UkgdOm;x@(UH5I#_VIQdXWh8#cnI=N*$hc%=~i^RxtFt{Bcg99Ld
zrz53Fb47FXB0>}uHMkO)2!==)M@EdwDx$Yr+W~RAu|@Md03d)8u)dbdJx=Vnh6IJQ
zYygY1ga+t10l2SZ*sywQ4|>bX_E5=MTR8wY02+(9j&nKoct=RQJOBuQ33xGQ_%;A2
zfcvrpkpnmJvIM*YfCo6WLlA(DBRToF%Z~d#YuGRXAcNb306UDpZvafeB({|kfGi+B
zp>%-7<4P%-%1ALGfzXC;7>NIPpoCm12|<7ctt7{;!_5QY0I9=AxKp=Uiv=095MO{!
z_ech3J3K+F5Ni-c{lK^ZafazU2WRlk!^_TZh=uH&IOog{Ul253@IU?N&i9DV_c#Oy
zAOQ1J&i>I&LU|-c>4g>=2r6I|zA=d;IMCx{i*n>oT=@ptOThhDGJlE%M-Tztd$woz
z004l1*K^SN@lQfg0UU6OP+%i}zyW_ygWog>Y>0yeWsL>}QCtB9>&%bWTB#T)01ePd
zIO7IHSWg<29}yLm6IB(+QqYmugjR^r)tJ#Ctsdu!QYo5JDkV~FRGM#af-OjgKY)i&
zNCZMa2`eZgCuPv&ywd+nA}=*HA~tPP^(j(U`Gb|Ptus{(D1}oLv4aFyfCR`s_TYd8
z@Kc&o9|suJkaQ8E?4RvxPxc^#K23mh+*1cwLZLJQ2#`5QG{Xl_O<%ABBgiu{FoN-%
zLj=Hp?bK5b$<jL&h+4?XR#l5URn-b1g911JaO=JUD1iODLAWv=1Yo#@6c7ZEM)zm{
z+3cSLFaRMn0t3KRg>w-M5P*TBuMI;v06;!mz|{n>04}>XT_gYj5K?{fxQ3+FRsEK|
zi3%n4hyjaLSxr-P)t%0q#8K?kbI8%^S=Rl8j{`8)_P8`<W!C(7$7t;k3_SpdbA(%s
z1!r&s`kF-u@P+?JAcI)Ax52Y9f{l-Ghyem9fDfJ5{E$-x(FPT;BaTo5?fQs*5Jz}D
zi&>3QYmhtys7Gy(xg&D~+Z3;4-~a|#00#indVP<T3p^`52W{Yh1VDfUps_4)05Z@3
z1aJUW^92eB)~WLa3<y@JB?G7(I|q0%er3ZUWB>=)0qp!&fQ-)=kVL8tR0oi>0DnM$
zza4M@`Z9tAK!Ayr53iL!3?KvSLp7;AReUspLlppmjfE3ifO9q2Cv$*cZGb|ZI0N{&
zn&Zp%c(4>uu6q-J{t`K6MciOzfWUjX03bq<6%djIku^Y-jab)^fCfEy*|dn+A$_oY
zdsdb#%*B+uqw_fbaU;T^z1P5d)4ue$Vl6=q*j;fu0BuMHkvm={?A>4$00`hXl4Ae@
zNV2hIkEQcnr*i;m4S?{Cg$WQ>0f0EqvsZ2S*JKcZ05AZNGu{8AOK~FrX1%w`t+)32
zHUbd1&pkN=5Lbv}T=rnefnzv8jgRCVOh-Gp2B5Pn5P$;UfFr?PrvnAgWL5+SfM6v6
z<Z}-M0NK+;T~-y9)g6eH8Bl=;g~D>3R~QC|>V$m=p~C7d5ZaL$4u={Rh*T&ntCR?8
z8wnkG3eIXX+NIHA{lagsgxrk*&m_Tw>riU|1p@$H0kGHN9o_gy00CgaaOkh(#XD<Y
zIGgKGJtKhs@AF8wvjgj84+aq7bJ*TE4geAO1_TU33iwzGpa2YrwQvAmh|`A2HM`vN
zg+XSr^NkN16M&U#Ndd621<-~+Hb6TtT=ZI2Ul2N<L%@u4M>FQ$$>rHpZ4U-a%)=Bn
z1K<EDJO>Wo)dToK2AEvI9J-1;<SBlSSp>}yCXf;i5k-`U6BdXqNFza7Q5txKFsP_C
z7=dIC1AN$k7U+Z{7}H+Z0+xB^Xr5+&sDl;=g*8wpiLiod`v@wr5~ZlB9-z}8J7N&U
z0P#hD7_bJGWL5!401Tc0_T{xIW{=>_;`X4>^P^S-5CL^d-fMg?BWSv3JvmGKSMO}&
zb9iI_?HyKqJ^%&0#(#y62T0^Vb-Hs1VNgK8h7-7&+`_uU(Ag9Kp>r~LYk&viHca;4
ze;v5P{A8r{T)NedVqH(G6}N-c*$N<lEQsX=pjP;0)|N8>(S;AsE5%(N*<MzVV7RS`
z2<AungHSkvKd=iC+7f?QgNOPCU3lg}$^>QkgKOS^vR;EnikM6Q=ZH85D<CkCP!p(7
z0W)1^d3|cV4B&b*<Ori)42A&sWe<k6Vl0k4eAU<TS^#lF0AEO6ZexG|umgtky9Q{0
zNmScoG(h%9065;>cVsco!)SoDJ&vBV$&KJiq&K3=>;^d3&L#s4bp#5yVyJY-0AK+B
zE`~&hJ~;+}ZKoz+N7Fa){YdyIR<V<{$=$W29k^H~OUYwaYY+i}qu%$x&;;gd{)lP>
z8HFEkS%?T`ci4bT2!&7>hG77vZB}O1<t-R_Yk@#(fp}&@3IlBbDY$^^xSnf}Fcd^l
z6oUBSpNNMO=*>r<Bt~(R(qd=+bcTf$xhzm>Ul45SJ%9tShJFM9#3ovNwbF2C%a+>#
z$!@{|FaT>1x~VI(djm~p@VxBvywIlTN+!5i@XTv0Rzri%jrP$88@e*H1Oh;SResO-
z;5gd;yxW%8i$lYf%dzA|>bk@<NF;7c5HD?*a04h+<16XITjh^F-v`tNKbYMAST<zN
zT~>r7HZln1V+{b==5E>Q5x@%XV*%#(R)H(Qhj6fqbfAR|kdt7B@B5zbw7&0W{)S=L
z0RHZ8y6%WlNrzKO6@f?u#R`gEID&m}hg8^yBbcF8X_dZmaOL!c07w7~phyC+0}8kB
ztGzK){=TE6)&}_Cb67bPgD>JmS`MBufg^+Do!XQ8HzD`nt1SR`Bme?nfD?m&N>=KQ
z3vB@i?n6k1lUo1+=(uRzu);Hdh7`I4cv};<+znd*4FKObXAdN=?b|+tlj~H&jRg!f
zfTr^}Umyd+O}GOf!gnM(!&Aj%%TJ4zj~YKUC!T;5fB?g_20!(;3h2=PSeEBlTUH|=
zIt`$J6Cbvv+j2QCAn!hqV9*0>*q(=20}wEQM=@CyI000NEE;f{uYPa)_J>T^6Q(kO
zewg{1-)3m81E6X?|LzE4F&1Q5Sy2ayZ@8>SsRPVn7H4Vjy?$zE2sfkVfT(i-x|;w{
z2mlPQgnu=FiVuMH>deVCRt>OU0bt<wFtU@&cUJbe{$)3%tolbi-c&X|11NyPO)|$m
zxi8dm1gQAIiv=z=+$1CHlS|A7u+%|&fC50d23T%&$G6&cXHakihO1Vj4L1Y0+HvJS
zYCQlad-lRU1keus$YqZWg8)ODaL*jLG9&B&7&-^I%T*-hx^!&+qYk`S*x;$__&M*9
zIG6^G*dDF3h~UaCYsLt<esqrz7X>|fqVV+9F_(~ndf<l-ZHNU>;PUp^e(!&$U;PGL
z0EH?`-Wa%1OjA$zzy;|{FCm2wYZ&EoaDNv`hFBOj3yFp8j0Hyp2yL-^ohxYYU_ocG
zVj*mJ&KCjz2skj*X6X>9a0Y!jYDB{!LTd{(p0h*20DuV~SF&vB@+HieGH1%%u)!bB
zoH}>%?CJ9-(4azx5-sY_ofV@>mj>0Q;s_2L_?YrMX9XKop)IJi*cZm%D-)TrlFb^1
zk`sJ?;QgT#sw~{Na_7=5Ym+A4yn6TY?d!K8H&ib<0NC;W_b}qbh?7k~X_#eTnhXRO
zh@tp0=FBy3*6r-M^QKXsKYxQq*DBW0`x1?Ajk6!lKdxufuHE{s=G?k>=hpV=Wfli^
zcoQ$q*V-XmEq&8;WQnBl=+a}_v~9h`RNGeKS?^91wfFGi$CEFg75DV?>Wx1;vi?2%
zzwP7Guivt|`MP01gwa+TnjZO?hZ;BB33#AR1|qm1gG!-iAA}J~I3a}<T6iIT4QBPq
zSGL6gjfUP?rAIBEh2x)wopdOa3bcgyB8)j5vB4`B+6dt@J>0mXbUE_)BWAB`a72tt
zt?`yW-#n5|Yw;viByHFT@`D+kB~k}%>g=;rCMyR2r681H3aG{glmK~VbdjOCrebQc
z`6f+uZ19MfMBxyPe@EccLu;dKQfF)X1f$0f_6UW{8cxVY$uKyD!&)d?Z1Kubb%c=)
zlm0jpMjfWrK}#6bP?2d+`}70bPWzbA3aUb-5(W-mtwx25{-pEA5o_S{%^GWjlM_Ca
zY@tRq+GNrT6|4ceY-d7l0VlMIF&8bhG)-GAwhi?_BeOt-(ZVC{Y~c?Lty$qtx2k3L
z(>@@C5)GxVw1CqZgg65NGRQO<h6+y+sSOCPB*NzgPV{>Ol0dbR1j9c#{P4ru2~|f6
zp{()M7F6`o0y6$Mv4%FU;6u;G9sAQy4@c<#(nBh}fI!15CzzZr%~Zu>lbPA-EYo~D
z``l2^KUXW{24L2_Q$JMrqx5Ic#BsEEPxX>hi|xV_&IW3r=+Bio{ZVly8|<?|I!<)*
z2%TBsW5p)xvb#Yv{&YF^AE6u}8^57!iBk_I4+8>hTeNHfcT`XcHR41GslqctJN`K2
zk?*Vmw~6!AR>Ga>0ixx$;q!<JG;A443z>{->l*yw)HP0FARJ04_<*pqHk71I)j4hh
z1@P)&xU)efus7;YDma*cV&6ES#dpg@`XhMf(fdTE3OP&uvyazjo4xix6777=t>$F(
zXZ9o^J#FzY*^dd0_H)7p9fvcOHe&n#6N(f5Y?(?|{%F(B?5I$?+qniG8~DaBHt-b{
zq{1Kg_*L9ICL4bw&mX-|0X`D3f#%@^dg%M0KjJ~A4Q!zfuXqLuQ>elfvap3Nd?5^D
zD8m`ju!c6gAr6B<2^{jUhd%rv5Q7Lr9SX6CMm!=Cfha7SfRARqXd+HpG@DlZ3528h
zMhjZ-l$<<bUc^&@7AF`FEsnr6YcRnHdLTR6QGyb-ky8sS<-dNNU@SNQBMp8<K@j8*
zWgDQv5nl1c4j#^m=p&j<5~;{VGP045d?X|zDalDvvXYj(BqlSd$xU*ylb-w}C_^dA
zQIfKhlPqM-2DuaRdFEV(Yz;pD_Qp3<k}n>u+J`L1qq`95q#wJ)iD~fB4;9Spm4=MR
zD;{x#elfF|&U_{`qbbd4PSXT7838q`X%iD<vzy-hCOD-Df^d?voY71qH_gdRYi?ki
z>U<|Wr|Hgk(vzC#j3+ziS<ih&Qw;=c(6P3ljV(+q9*-E7fA)bZkUbGutl^cfaAGWn
z;v^lGss>rGQ6*!}=38DeWGGZX1r@A;qb6Mz(dvMgZNcrN3liZ5s<)T#xl}+fm8o86
zTGP=ib4Fp<!aiuAF&en&2vmqhDyrc!n4Mr4B;y!PmKrl;>_Y{ApalqWsT4s3W2c^}
z1}m-D4{iL?t7a8YG;E^(Bbl%?f}KkT6kl{xmEuLGiGypH=9(9~o|P^L6IL~xKnoM#
z<OsCDnk;)kxTPJgf{HDiAUDv7kPeS2dMImOGppIn)+wzUSnEsLioShR7D|t>30>K0
zlYc^uv~@b|22vXnma>+!Svf-OGNBDcb%?0-ORV!e=-A+<A{8otT`2U(6f<zcw$6Pn
zbQu&6%JraeEfFpH@G-T{s#Ucujh=P^<yp{%)+TO^E>&<#3Ec`7JAdHT2>!4o?Gl%7
zCR3&0(gA{Br6a6E*+hxZE8qbWxJi^_980!!g!4wv9Zc)&fvtO8^P<ne%Zf&X%lq8|
zE5!-MVlO^upujNy&<VpJ7=a*z+gLtYP{sG-W(%B=6=(>8!#2J#j*SwJ86mhKe9f_I
zrW?~5t>k+Q26AVFtO6o~#K=fi8&CX86wDIENl(5qmJ57S>lNh3=))_sw%lYUS`p04
z60<|RoaJsMfy!%sGn`F|=5wf7damu3UJ+7f%iTH5)RS$O$sA{z>0ug!J~W~^D&{?d
zcf09=t!%fj+E<2`W{^IJr010AZnZ)*oBlMYEeBhc#ubDXt{KtRid{pVnr5jk$f`pf
zCTs*q*0#PipkTXUT*qa+l-o70v*K$C2RlaiIA5`ot?c{=36;h)bIpW2q$7h6+BB2)
zf|m^=S8BWe+ulxepN}R&6}U9q(N+VwzpbH2bXDE%em9aUjW{WPP~K3ZH@w4Bi%8_V
z-~L8#tN$I8fD3%h=h$e$6Rz-uGrZwpLbk&rF7cXKJK`0eIET$}4vcfW<3%!e#6j+H
z0Y@Uh-oXw>;Zd%Uvz*e7p18eRj^1GK+dKQ|&nw~40~Lfpt1|yN)CeANp#$BvNC^*z
zOsa+k7QN|Ce>%(C?42Xw#2v-d#y6tZ0w%d56O`DSHXe~VsFQs`7jO94%kEV@q{cdT
z(uOwFFhL8_s&ivY5;7ijxK!+e3d&VG;L9WOh7UgQE*(WHYz{8}&HaA0vYZNV;65iP
z2p;+WGd$+S6Z42~KJzD?My<u8jmC%K@zM)JI8cR;E#TYpuAd9h8y@=*iSJ9V56ZE}
z6OT3YAR4sj#W$R=1yXe`6I;o|@59i8-rv6Y&WBn!(k&EuJ>Mr1D-R{y+_~&mKYTui
zOY6mhOQnoIJZX=Msmc=mv!0(p(J#vSGcO3vb-(^VQGp2_92e@(#q?!y3J8qFPxzl2
zlvH>W9$bXM3Czxhco9xGgM!ciwY3HWY6t=%2%;<#PJ{v#WWtv0!y`BW&LzScxKU0Z
zN*KsSB8;9uWnMh&TNQanKYSlhl%Ji^p#3cfE$Cld#Gg=Xfc6>18VI0I0HIFUV0U!?
z-dw~317-!79D$=rV0S>FhA82JC{`kL0=bb6MGZ_f=mG={Oio~-7LrSR)d8PiUNBg}
z57gXHRG?ho9}n&X0U999s0dF0AQ9%EhU}nDaG(c9)y1%eHgtk6Y(Yt_;2*Rg37R0+
zupo-ON*FL*4PuQpq{CFa!Z4skCv0FCgaIw=gRgwzRNP9gWXBNx;U|WoC1PSf^opaU
zLl`*0ScqackRnf1gNsl?Jm{i7@S--jNG8NXFv<-v3S%_PAz85C8f*y@>O?p!qOQn|
z2r>yi)WJ7|0TpCW3FbsP^gt%0gK5w}FD&9EX2Ksl!mA7g2#Vk(VhK(>f;P1OBhGze
zIGV=&bl^Uu13IeXM-7E9@?t<9qcIlaFdAes7D*4#$@}2|6@&sB5)TL@0=nSDFr*;`
zF(kRs03k}B;YGp^(4SCHVgD&(P8eZMAR#QZMwj?RD)M27_~8b&07a#O3AE9?U==uS
z<QeiwG>9Qi&_GZ61I1X(Kk@`J%t*>m${LISr+kGPzznAtPz!Xz5fFmMfQ-n{3lT;o
zhtxq*epVn^&=x3*Kg1C&v<OvNC06bPQgMwtyd_1-Wn4DUT-s$t%0)PsKppgg5k6x@
znZO#jOgf|`El^AdZ9v7CKsx+n8sftdfItfz0hS2mAE041DA16oz~A}*gcpM0SyBo-
zfItTIz!%O>WKJfQaAC4!W*BT{X9@*f&L&>cCR{?v2KWaukQ+(C4$~n66>I>KT;xgW
z=0?WNH+ZDs#X%6-3OI_R{}>`73St<rh9b5gJ)($AdLk(9Ln{gsEPCTC*5W9JL38Fr
z?VU^<v>Q<j1E`cEoya0B=ESSSivA=*-Ek#M#^i%JBt-H_Rr*6T<Rk{+!&q?S99bkr
zBB)c0P29BPP@tqgBubL#!p;23Bh-NbbxbCdRNlzaOJ1lyWGGHZs6YIHvS`By;6x^D
zWBkaC9coA&oX%f1A+F%W2&6*?;;1&<%!5t^amq*(c4Re>+XjUHgA-s>P^7{{RwU_g
zO-V5+MG9$7_$Ou>DUvFwZQ(#T_KQD!;>q}jl2Sq%2B|-AX*zhR6eg$Z;owd{resp4
zKj>s8kef~7q#0f&pM0hsZKqdqN?0x>S(+tUs-<GGrBT#E5;zRQSb-Io!J=v$QJmIm
zh5=y}s*4om#XOJ3K-Glq;eH~>cJ^i{@ZFL6gD&Kx{;g@cnJKIC4%ZxIPe|xX`ok~~
z7Ex*_XFzE29FKn5Dz4T6JenwqMwJ)Q0u2}ti^}SO^uSvf&{P1X$GB0uqyrAr3QbC@
zg6afGk_&RGKw$X;VI}EM0H<(9QOsnWKbR|$bStSQRsM|stCn)sE1VeUIMB|Sz*p1(
z7)g<>Zh#5MSiO!wA{?hbykDpmmZPO5J{ag(cH)4NOGirNl;VU;iYSTt1F@#)ipq_P
za%hZ_A3nr`JD7nPh-6SaLVuiqKY)OWvM3cesND422Gq^n{A$9A>VtvlSe<1m>?OHv
zr?)0at1jrb8V~|05Kcq`sP4oGVANF9>dh2p)+p=D3Mft}%CAl>Eo2Q&Jgo!8hOz+A
z|7^h{SS^Hx$Qq~tWNv_INb4fvLvW_UL5&sQXsfMa<d@RPRIqBe%Bw%XLn4&bn5JRa
zq+#K<4&Q$1SB%x)dd$3Xme1*qf2G6d=xxqYsl`73*x39^stzriu4`~2iA>%qP6%s>
zx=pcK(6J`#t}<&;oI`UN#UoIHHYg1UY>dUy0IVj0?*NbR;B4mRN7tGFrR)j*eMKk$
zY%1J@&`Ke~CQ!f*?fbz|9jF1loT^Ve!U&uImelH(ZU7A^6WU_$9koCn(F+JLX84Y;
z^Kh^C#s<K`M%cVeJd`htR0I6fY24h5U=r;HBmxM)Lp;y`2mntAHK9cUtc<NIHkAwX
zf@{2bjDK|P*yRMjYEi8KP_1OJzaql}<7@Ihu7@3(3Z%>lY|Zd0ZrBQK3;ZlMfiAfv
z?wm3W*Ltl#fNgfHF4^{j*`h7%jz;a?Zp-%n@DCqQ0xeJjJ&^FO@PfF_c?w0tPDNS1
z#t2B+KKPfL`4Uj<QWpP2KltE*%-~NjiFa-Qs@RfJ;3H887EpkR?j{INuyNSlS~|q$
z3WIRy)bJlN?@dH7QTA)C6fdQ`ru)WY_rl|QnE?H^6Aj$&u41ou3^DG?jU#i1^?rp@
zs6ZX5FZ(+2D>(&JNJZ<IWwLz>6_~&Ue+K>#MK2i41cLIv(eaxKg_L=*e}yrO=rXWG
znJk-CY4nn};e!f~2C9e;8T$l16!R}Pvok-lts(4A$RRXWvo&9{tVuH+nj|)Nvp0XU
zS@B~!uA@TT&E8~Sx&h+e2rW3bvpc{4GYGjRY_0(m=86TGKo)KxO(x6c!m~gBGeFZ!
zk!mcGMuV?v17R)X!IGPmrXf2AG(<<VL<<NBClGhsi~$*^KfG%{PqasWG)UJ530K1r
zxDh1~37UE-&uS+(hqOz-G)xl(32TEvkAMlp&A{F(^6IO_0<5#eG*Ab%Q2zv&Ozu!0
zHBu+FQZF@AH?>ngHB?8nR8KWkSG84NHCAV}R&O;|cePi4HCTtWSdTSXm$g}+HCm^&
zTCX)*x3ycpHC)HFT+cOK*R@^WHD2enUhg$u_qAXDHDCv}U=KE77q(#^Hex5XVlOsh
zH@0IxHe^S(WKT9_SGHweHfCr4wq|cOXLq(|e>P}`wrGzwX_vNXpEhczwra07Yqz#*
zzcy^gwrtNfZP&JK-!^XNwr=k>Z}+xu|2A+3w{Q<PaTm97A2)I*w{kBxb2qnhKR0wo
zw{%Z8byv4_UpIDVw{~wgcXzjUe>ZrCw|I{?d6&0&pEr7^w|cKPd$;$ybpt0z!Yy2b
zd)If-&BHw8gd|+S5cGF{vjHjO1b*8$fk#|1aKR8j0V!OA7z}|Du)!jb!XlhOfA4`m
zECLh^0UN+Vfp>Vpy#s#_ff!r^g3rM&_=7yqw?7a=gYSVfg!mPxxQEa9y8(iKlL8wI
z!5rYk94NsMTtOkAc!S6Pw|`3ljUTzX+4vA}fif(4H~2%2`}YuVf<IgX6mUT|gm{o6
zIhQXREcCY|6vCAILz7GSlH-J!??N8*H<begIDkVw=){}HxlpVFIOqdT$U`wG!#%ut
zS<Jbd!}(CyIi92Vp7%L8kVT)rLzg!?QOE;@!-5zn0Wn;-nfLdT7sC($!X+$uegg%6
zx4A#81Evqf91KCFgM)wXLVu^HQG|L<kopijxlo*Xs;_#hD+M^PL4M!D5LmdQ2Rl&6
z!ya726>tGg0K=t2L4J3Gj>7`52L&e#ffnQhDNs96aKaqW_m_)7G1S8x<Uv_Xd$r@l
zwU@h4Xgjxy__v4u`%?6`JdpVu1h}x*J5Rg=DP*}A<o7&;xPR}sKY)W0<iRy8xKNZs
ze<!*>G&sEjgCvlG!rucd5JNFY!Zi>BEWE=tocbBS0zbe4hbQ~PNBqQB{56yVEGWZH
zAp8(0Jj07T#N&j-Q@q7vyvB39$Af%MC<7;O!Zq*%PUJ%|T!MV#gs)F|IiS4C<AgNy
zd@<w%#?Qko$T!g2yM2>FgAai+hyfHRe3tt+8!);*uzDUGJsVs?Pz<?0yhDF8`W{I6
ziOYI_lY*^Ff|TDwuD|`NkGhnTg0hSIPN+TG4}sgmJ>TDW-QRt#+r57S0!~DEe+Ri1
z`1dXNI<V{ieSZUfj{A6pTfKX4y_9SF5THFyyaOyOf|2J$r-!+ev%%8$#47x_Kd6F+
zlX-$)1FJ&;Kgc>DWW24v!y;_DIN<#d^h1+F0q!UG?)P`^ze6`HLdfex>|ep`*Z%P*
zzwYzC@1r{K3qSGq1IzEiHTZZphyxqUfjqD}^*cMN--G4*!<R$BF6@Gj-vX42ILi08
z=eIZH|F^OO#2$b0ZWWrtCeI>b{^p5Ma!t$-i4xiPvv~2MJc->R-txz32p3qeB$itz
zv7W^_Ll%-6a>?I4iTyx|Bss(+N{l-#Y8=9Gh{u{EOP(B((%;IKFJsQ!6|$#3i~5RP
zia5moqC|QAZVeHbX9y>Yi@f?{GXxexiTrrBb^8`>T)A`U*0p;VZ(hB7`S$hu7jR&~
zg9#Tld>C<J#fup?cKjGFmx&S|o@E1N@<c9Yyk5!-_3hb}L+<&LB=Jh>E8UD<RO-(q
zOqoOaogSikb!)kzC6>00o3%vOEMYU9-EY;9iWuKr83F|?R)1Q#mObmypDN{MiO*&W
z8GLy0<H?sde;$2$_3PQUcmIB;<ji@>Vg8(1(yp_UxxjrYF%OH1*^VDrl;P(jC5Br{
zwwVU3sK5ggyhtB;O5^FjAp-R0L4P7da0mreA}+S3Xd7?{so3B`8JFhprySv?8{(b+
z>I6D%!?Pset{4-)gAd3cg&dN|B8@x}$t0Cr@-6u?QwA9O?vn@#KyD#L3C-Y|jW~bu
zk!X&U#OP<j5g9bGpD%|9bBHm^^amIX+v0K|FToU(%n%nWu0h)LaSjU3uF&TxC^(T%
zsw~+6rYnKEkw^>YXynmHCM~@b(@Ztpl+#W<{q!wPNEww>Ny?F@oc%ImgBVG}f`!yY
z;@TrbsVuri3ovVZ^R*I>^9NU5{dqIa4SAwf30r~9b<JJ%G?Py>VZ3UNYdoaYt6Zh=
z$Fm_w=?airuM(r15qnhgM^M#Wm)&;VeHY$%In^Q$SZ=xGpgk5*2Appv6RWTPdz9Tv
z;K2&+E1!IJ(q~|c?oqg{gyo%>;)*T47~_mJmg^eI_PAsfSS5*Q4r#KajFgR4UYX^V
zU49wnn2GFo%85t;X(A<3mYL_Cef}BfpoPwu=9-@a24_fzUYhBqoqihXs1>`0jWDgg
zI!rcdOnQiUr2ZQ0u*Dvm?4~)%vXHXXUYqT<-G2MhcglgA?z-*18}GdJ-ka~f{r(&9
zzy%+i@WKs09Pz~a?k8P-`ibkuds0f*Eymk=hw_~)SDf?CJ^!3;K!yOvB4WISi=QE6
z#raWL;W|T%ow`-R^|m(K>7BGe-<|i~eUEuSnEau&Mz}~(#vd`RD5szQ<Ku!Iqet@q
zhF0WlKVzpoMEsrm?!EsWRDP7W!XJIMD@F??_9%@ME#`ni9xgbsZA|%Lv}|sDIDtYE
zEn>guQF{Q#J$6y9J-lchBJl?ov>*vXQAHwLxCa;Jpaf3j0}x8!LY?+!DDZs{gdr4R
zc*xQX)7_#UN?-#?WOW)gEFyLLg2EMU5yRnK0Tx{7PgfQ}mj4asHk^1I^fZz($w-1M
zw<w2XU@@D0k%Sa0c?UR#P>9n2V}x1M;ug7xmySt-R`-yGS4fc>)8NEIs#_q0RQDw@
zkm4-w$b*QK@WYD~V-c9y5%k`1IxZ+Eg#prDQ^I8yofTpTy8wy*BwV7qE<O^Hk<8*1
zvJ{|VaRQTPER7Ahz{W*rL=2eZggh!}kvd}J7Gjv28~t&H{=~?LP%!0-1}PKarB9UC
zAj={!xeH1D5}3i{9nKa~4-HA<3N0Lh!Z_*41!_SVb2x)Ox*`dX*zqJ{Pz54oMJqh|
zaR}B7%J7B&44DAziv26cfH<)WDELyC@s#I00T-iWSp*hY62m&qD3xZWQC8P*jusYj
z53=acj$GMK9!g^}ubfT{I#gY0x<Z<;^yDlS^bjI7lsS5S6r>@A8^rK(Aqv5Tq$lOc
zz*35lhHXxyF_q~|X<Ad8-V~=f)#*-o+EbtY6sSQJ>QIUQT2!MR6{$&OSwEP%52xY-
zs!_#9JmMi$s5*5YOnsbEx!P5)nx`N8h$>axp^kH$l^bcr##*s44Y#rt8)=m*H_lqu
zv#P_ac0I>j)yh`4zLl+Mt*biRLDj0_BdcFk>|(px52(hYtZ3y%TjNUCyB7Aah-K<|
z!b*xW%pxAt5W^huYKzT00~>`v=o#GMjY3?33&4=Z8GJd9Gwg`5xz#Ns9XnNbpp~+g
z#q3qLilmibuUlKiR*x<rnJch?9IomECWg?5b0lL;P%Z9mx!c{(^)?=6o$NG(d)R$|
z%0At&4?npi5DuM=By13v302pOSttj%aXp7RsEUvO?Rpo$0j8T+!+ValmKU+|k_l!2
zH3Z~AF;}G-P|A{c5z|e^SQc?CWb;c`cO+QAAr^7d#QNLG>bJ1|)mX<k5fLSHB`qY&
zRaz#Tow5wXbfy|mhT&4;y{^^6@i^~@iCpB2P1USGK1WrD?6R)xqMEIH6coe|k=WJv
z9hlh+Crp<zjqunm8~!mi_FGjWpBc@Za_n!{T4sCz?KIcOhZ4#$k2ReJo)IaBGEV1@
zZpeoerc=d0<P;br8<@-={%@KY-RSk~BfOKPtC{askCrZGsz2rif1B)RPk)**_+ay<
zg*;D4t3%Qs2KB00?H7Cec*$?3X{PlXk43lt8rQkT2dc?z>z?-G)p1pataDv#Pxm7p
zlU;JBmqd<cn4%GPfP)*r00t~vTMAORHWsSwhCAG$5vE9nJD`Sa19QV2w>I{=y^HM0
z4qHk4NCqbE0EQ|M0SH3~0uidfZ8yN-+k-$vBQSx9Mj&Dk-=4O$i$H`R=$i;q0K*_W
zkqoBo!yRdL2eaAT@x>+^8yiQGH8A0ZDg*%t5eLH^Do*aeIGf&BIC;vYz;bv94dWX3
zc;GzY1tskPo;$b5J`Ai5jsvM5rf`E4f)E5LxS`_Uk#{4&P=u6Y;SRqD8pg>?Y@y@r
z7bbu~8Ia@>HVk^__(*F!jAV^LNC61{MQ{Tq$g!SeAOZ{y#{woU9kXO}!|PwKn+fWU
zq;<%0=l$4g;DJPrI}{-ZSU`l!fs~9pQ~?N8Km_Aqrgm-|UGQsT2M8>Z3_K{}BBr+n
zd|>e+IOXRe{8$A@zft>d<Ym!LrAs<&4|<EZ0~>7TiNpj$4t3w98CU=U7;@p5<L4zG
zjet8C3jh2~SwAlLz=k?P4>wupARpwIL_Tz2aevT&9x#B970aPNejwf-iy$98;qd_^
z+#fIa*Z@z^pa#0&;r>cM7T)5l+(Hpht`Y<z2nL}q$N>u$u<zbN8-}45_@W<rp}55A
zBElgZ^uijz00`V5AMPM9a-kXjAY&hffiB_!8T<m({6YBOA_n~eACRFJI`A!K&>ytn
z_S8cgbkHB%!3H_6`}`ppHb4jJjvRF0ahA{@RscS*BoFlA9oWE;lINqy!7KK_z3hS=
zqyr;*h%QKh3xS{!+@b*C!Uq!Y<**MfJRu0+!1v(d0{ddS(jgo+5C`?b8?eCP3ePWm
z;0hTd1?$2Mvrn$%q5=iu8}_g*77;#v&@GUG2#av5;6VpmZXa~OA2<;{A_oeTC82~#
z3ol|AXdw)G;SV0cB0?by!hjZ9kqTh(3&Y_R{c8=>U;zDLAJ)JY!{E)*p$@{J8Ze>=
z&X6bK;T+^*4KIQmz<>$=M8P89;SQKU3Z#+ws?HQ*0S+*s2*AJ}Vj<g3FdVz_8!dtz
z;J_Mfp)GPD2%3*B_8}a!K^rs-5_xeR>oEwcK^unb8}@-7VUPzeq94AYAJ2;e(?Jry
zAs(~=ANo-)tU(GSLhIUM5SX9{2B9CYfEp|U69!=)9*+rTuNiz`44R=M{b3M_01n`x
z8Q=g6;NT(;G5fxu8dT69;6WSqP$3=C9~9CN@xdVTFdgt=9_P>>&Vjt*Vjp?|#HuPC
zs=?*lfgaiJ9|IB}`SBte5hJKl5}Ojls`4TLQYtOtD)q51(xD+AlI<Q+8|dL86ml5Y
zP9A;IA}Fy4;{pl)U;qYwp$y2u3r=rH#NZMt;zjZaVC1P3EdmirfC)YT3tqq<&>#oK
zKni>=5o~}B#-I_t5C+D;2mC-E<bVlCFehc;GedJ9R$vUqpah!i7~A6Wn2`<lp$Mv=
z5rRM(_Q3~;pb?5d4*UV-s%{W4A>{@E2t<J#Fd+z}(I1SH2#`}0^nnPDF*@6#2%Hlm
zh_ETYfgTpI4u@_S-m(`U4H@F$8(Q!JkpUit!KvZ_614#th9MfF!5_k*7qr10DzF!-
z0U3}X8YnL=n9~#5LKKoy6r?fRETTE@00?FQ6J`M)e4y!W(;x022)q#tY+(qPU<e@3
z7wUot;WHio+(89}up#p>9HL>W&dVt6(;`UJMExNedLbNER4$SYF7Tm7>(eUpa~^l_
zJO{EDkii|IArE<Qs<v_u<+CBbfk%76NBw~wv>^}gk|EF2AByxyuXHYm&_8RG9xu=x
z_VaOkG#c0r8NvZRF9I*~axTb@F^Yko0D~>^p?0zm4B=o1<Un<RARc63gT??0{NV+z
z;2M;n7`{*ocA?*Zr3%2&9~jk9vEUbiKn{?zBK;vYc_Q%OK|3#^8T~;P`gA4xz!Zjn
zpO_#x<M26i!8q$KBQ1gmoHJHAbr23zDwu!)d7=^gORJd5z!=XUEdo3t5l6QaAaSrf
zFEAMYFXA5Ya06i!1Itq?)4>trA|F<dCz@dhq<|g$!CSpS6oSAXCSeFpQdAwOItRfI
zZ6OHyVF+TO2*Oo!f>o=Al_#R10}C-4^z$3+6F$SCxaa{!X|!Ke5J~-^2Im6%?$IWB
z(bmfICvVRwf3hCsQ$V@WA1?5`c+XgO;zoyV5fySvgApw;0$=kL8yK$|;6Wkrp&Cqf
z2a9qMfABlYbQs{$AKnyB%i|u(p&YJ3ed?5}7SkW#U<_<QL4crCYsA|8AvrJN3(Ex#
zq`)Go4IO_XX{DeMs_PD}U=}W-Q!fG@ya8>~7H$0y6EI>_JppX*U>5E`M0}uC;qf{D
zi@+jyl~!$4Z~cK+;oxs)btmEht_~L(pg{)%G-Nv#5@*&}_aRO1a$<QRTD_D5jkOLP
z5?lWw`G5dx0T&CH01hl77nlGD#=s)%_97xL;A}x}fq+x(^&$-SaM>zxb?{>GK?RZF
z8_HDp9<mp1j!F-9cNO-{_Mrv;0%G@&cP%0uEcW;GF&=7E);RWg@3RN*@jkDV1!L4c
z7m+HH@pf@nad)B`@Bv$8HhRsH1B;PHscIO?ROEWL5(O+2?gFa%f*pEnFUlx2B4{fh
zr!I_^o{$y};2;-b*A{>v9cbYN3Ka;Dpe?`9BCa-TCDnqvb`^kN6?S12$dOb3k?|r1
zfe20*g-`h5fS_0XVN}y02xiaOQq}R&RXFk18~3(XYt<wFmRFf`9>8D-T39a5K|r^%
z9&7Y*!t*{ewmeN1A1aWEp%o+G0e<h3SvOaGvo$Ybp?^74VPatjfWT{Vp)?R-2-w2j
z7{VVGR3B^scBOW9>%xfJf?rcm1+ntYWGx+F)L<{-j)wtxd2xCDVi<^xV;vXL@^ee4
zmtif!O3e}nJr+Lo@sKfMWR3OBcCwL!FlFPSj(H+|*EfBamlElr1=FDygp6Vn%YM%+
z6s#Z#>_QPtU<1rgFHE37r*Rkk!4zn~Fa9j(;(`r!CN55*cn)|^6*zYPWx@k;U<iC*
zc#7ZyOrQ)lxDP@X3|_zl`T?7zKpvE!1XQ3e$(DrU;_3QVRL6KLauWe3bO?w*=5F{R
zau{%TIPUURhx365K9q3zf_HE5k}q%=Zclk{5Ci+6MsLt@Eq53u`9Co*bGKBBJGU<e
zq3MD^QaQCy{Q(RzIyn8|Qc-Rm*a6>wfC=JQcI(wI;8UP2A{qp_9=~B2{!{qA^O9XU
z9a@k@2^la{c^L9Ak#|r^`?!<GHyZvE8T_#q+>@yJ6-I&jO7RmX_ftwAM|?jyFGjg2
zi%}bTfstu6KPAyb|5Mg%u#iP86wKfU%m6P=0GIPZKz{)WE#jB|{bFwFqL}F-nU&eF
zMxq=9LP5x4g#_XrD(DI%!F()Y7jO$puAm<l+aDTxvai5@x?!r~p={v-9@IH50C7?S
z!yCLgADUA!hO8+G5-(`-FO2UZya5PO(jq|HBD~>8*nzbP<M@W`ND(8q{o?t4`)B0>
zACiC$5+N?w0S|Ow3d|3#&33t`K<mCw2X?UxlEDjf;1`l%3Z{Tt-C+_=z#6P!AAZ>s
zbYKnq!4J;+7j(cB1Y;fw6ADr$uuH}w;An-of(xT(5!hf4<^dKIDZjhu3w6N2-Qv>n
z!K3N|V${IEi=b_R1fwA@bQ429Cy;oF#2X;5bT0)!WBPvohx=vLpbnH5rB=YbS74W)
zn-^h#222446oDN!zz_Uj1N!#_Kwu4YKoQ(Q7EWLn{a^()fG?B56gFT5CIJM#PwX}T
z2|V#H_<;+=;1;-m6!PH;3V|f3LJ5ii7#0E?y5c*^L4BU095SewQ>2UXfeqSxIUGY0
z+}v7%Bp-6YYZ@cO-6J1NAp(;`_e4BszyXWo!V^fZ6Ia~)WMKo&i^u)I6Lr83{NV)f
zz?aQ$1$vpTFTxZ+fZTLo5_o*M+dDAgge{8sDMSSdfPsqgU|XgljV+=O{)f&0;eRFt
z&~F{r7Xuj@VZnEz43NMgRNNw1e7P+m#=T$)EMf}(e2&F0;?gf7)9o6VJMq(h0T1v%
z)B!^huqSy)VHM_kRLVshXk|mp=R0nzDb5_Xl)!*<-QC~aFW?~wxc4nQVFl=+3^rgA
zhCR_u03Oz00~8_b-~k>?K<k=4*n8O;K;XRgeA+!-yRSXl{~}86;WS7gM#`le-k}>B
zO3lq3*5&Ig)ZLWY9o|nK<>_J#kee>xVaV@~(j^@Ppl}~x00}+aACO=JoSffx!sek|
z2S5M>JmI`80^)rE5By-_{X!okqs>zWOJ=ATRAGjoKzGbX33f!iREOQIsN_=~?8E*o
zOb9PBoF|MA9`?Zmc99-<wk`-BGVVO~<bELk-l81%;T|5PVZ@&A`@R<%LAc+dmUX}c
zlD%E#;JI{Wi`s$lErRhM-ya^o@graIDIfAJzwsr%9UTAiH6Qag|MUG}8I}R`J>T;~
z|MX42@-d(DAwTsifAmYg@?YQeS6}rzANOlN_ZvU<TR-z{fA)c2_a|TYe}DHkzxQch
z_J@D@ji2~~fA@WV^V?zcmqGeNAN7lW`iuYil^^*@AN#dG{GtE(ncw%j|MH8<9g-le
z0Yl#0zFp?w8hRakGQj==!5>J#{xg6C{2>qkB7?vTrTh)dz{6jcgUi|-?Bb8d!FHt%
z2J%N@APIkg4i-F^aNxy^0ylOX_;FzW!i57HK8!fAqDYJyIeIjx5@&{yHBSmmDR3o2
zhXWx>97xe3&5|}z>O`oMCsUsUp9*bBRG`tAN=argc@rc~h+Z@Jllk*0Sgc}M3T(IR
z<xzoWl^$HXbLrQnY1<B!%XOw#yj8_&)oT`Q;hukUy3GI=@W8q=@ACDBIkV=?oI88|
z3_7&v(WFb8K8-rH>eF;6t$qzVw(QxoYumn!yLQPp=xUJoT>~AY-@hTDBTga;x;MyO
zF+<Kf3UX${iSzaiTsU&$#A~EMhXO?nL+F;&IKKp)rt{}D^=ALw5c?Xun9V1jW<Im^
z?8%!)uikv_&G%h+<CVu=di=Hj_uhH&%~#)j=;X)VeiHsygMtD!=pA_C`IlgT><tJX
zI`Xj>VSf|qx8Q*oYB(Z?1)=~Vdm=J8AB^Xv=%9)E@ggCG=iPW<j_Mg$V}?YM*yD*i
z+NYwBHCU+Pi%ZJrVUoeEM;v$EX-AxM$SKDham=^^9Xiqx2j*|QAs5_mbmc~8op#=d
zCu-LelV_iP{t0NHg6ft5I))yKXrhWP%4nmGJ_>21l1@r#rIucbX{MTP%4w&behO-+
zqE<TRpr)RRDxSY!l4`52z6xusoh{?asJ7mUYp%NP%4@H_{t9fc=#(mJvBtt0P7=->
z%WSjGK5H7S!cI$VwaX3v)Ik^KSnAt^88D-$IT<K-=o{Fku`Q?J^+tlV?!F5zro=)^
zZ@sl`af-eA?#u6~0>uk(z?_=f#TzJOU|gjxw427a;f{-F!v)unK^L8_Ye*mhZ_M$#
zQ9#sh$hGnFsx;DwjB?5<$M$c>F29_pxxAp`O2stS&;bd?8O#F-%oyTA2Pn+Eu(#lr
z`Gz^-l51$gGn;epwn%Twi*!89j7}gZB$o|3+c4J!2`H$^L)IuTheEAilfc6gWy1`2
z+?K9PH)>bh(`qQJ*3Ea{ezz=l;PIN9#v3kVKwb?r{)Wy%E=0jh2TOFMT+t0P!%GHB
zECk8Y5odsP6d4@<llkTdgGa&}LYreq1~rIYcI#1yKDOnqcNF`$v<uFA?}yfqkl(^@
zHpdWioP4S^NrW?e^UmuFxbM>cYOX*XM6vBQkVMfzp$lPsOdt}KZ96j!7e21%hdOPj
z=)#<DZWNhod<?i0Z%gquJanLR2DLK`y5qP29THKR(58n#n9b{Xb%RA7TD1jPFmQqt
zELInomcR_&%3Q8U7dp&Af)1qNaE;5rHqapq{{^B0<O3ixME9{S7(#tb3m|whU=A2|
zL54Ncm@tH4j-YKzBH6&%2M<_2@C@*N<~X1RpBS$NRuE--AO&XDL5$4kgA=#tlQOO`
z#W0HTPVFfFqZ!W##WaRWW{6@2LU@r8b1dY9n#jN#DiWOX)iDjj=^Vt?SFtxp<U4!p
zBM4CdiLIGKVjUS^>(KW<qbc!PQCNci)QHJxNpXz(;=&iNk%vNLW)aHB1M=*23Q=%!
zm8?|FG6GSSgB&C{nXKid*oY{WP>dII{NUll#=mY|&K#CR$Tn!`t&()%gv1QW2}^M}
z6qMqFqRW5_j)9JBSW;|b6Q;vZFhKnwL~OP!=dL!{N@&gD3X<^0HAIP-Gu(p{R<x5d
zlHiVX>T{o*p-M@RgPiD@bD)(vW}~v<K}MP5gqB)pq8NH8haw81j|znRBKJ0eYV=dg
zXahh0_eC;y!qXplSjQ!lVW)mjK^GrwX)EJWk~Xkn95k(|O~)b7jp|gRnM27=f10V9
zNz<kElE)rA35#720}z1Fhn<Si4Wddlj7OQlOmB)+n&uR!T*YKIN>K`Mb#<(fddXDj
zC5d_Di4v+jt6QCS6h>rqt~f1Jtzf3KY#ielO6#j%{|eZ^3U;uBEvz~8%2&fGcCm~t
zEMglA*~l{Xv68K<WdXa_%PJO8n)NGX1-mh3RF4rsX~$dB*#{iJ<Fu^hn?y)(Rk~tz
z2IC-Y6z<9~`vt|exD9P@b~~=#3QV^M;jPPv3mHh%K)A#G?e&6t+~2-Mxy%h1acOJ+
zjEn@YwW8?<CxBrZedr^kv$+S}YQu>koPoRSMcGkg3t!TfBw+xn&Nz(m1Y^`zBlL}z
zeetVb`F^Fp@cM6l_d8#K8CbvLm_bP}=-=PmH@^bbnSvz@V46DkD-bR)h7U~B>{hJ3
zp8*FKhEPw^TtNwJs7)UBV4HhDVF<e*u@-9_GJW9qqcDvveCKKmMmV^Bw|y5RG~(m?
z3VC!dtZuN5T#_UQdB{yRGLmmPWhNKdT~Pjtl$ZRiGZpyCHO(@SoeZol!xqb6W`>xp
z9ObOCLLkeq@n%RdggnFIG_YtfZSIke+ejnN@365xfN=|y^6SuvZfQp3`r{w}8)K%T
zOAeZK<qGVPb_S5n>ZHd}=`9B<)8^Q8r?L9!P+vM%q&78OQ_bO3<Eqse;IwQR(FRbv
zPS&%ILOWdTX-da>TC}z`U2(1J<x(rtzpnMEu}a#F*cmgxfQ1tB+(py$Su><y!zIqU
zi#^O?5&nP$FfMThPUvF~-N-{8?y>GY;CS8bem7=FF^4&%m^6|Yf*9;9jdF-A;4Q5P
z2_lW~5N|jGybhI|GQbLBFj&$HZ#bwP9`T98*BBK~Gf6UzaE=ee;-A8}#1q~IjfmA(
zCfE3@JN~Pdqg>@47YN8V?%<0|+aJIf!WEzpRc-s(AEda#F4#csRVYFK5|X%rKlY%6
zIRN6_KIeoO$PEmnW9A-Jzq&sPaRpNB;en><hZu&?P7?1T(E1PuI5bm^LOW~inGty1
z<sQb2Bst+57xFlm1G!v*3(6$OHQz(*cfhaQR)de};So<;#S30Ij(_}=|DK%1kE-!s
zG5q1DOoDc7kK~x*eBmvh_{>k9@Sf*8=tVE;TbaJ~KaTd!`Ei9Iz+x3n6?$g4zy`5%
z!5>%Pgg=zw^gXQi8n@s&pDsc6LXg`Z&i4oO^DzXJa)RupS;w_c$=yBQLmv6KhTOX`
z4{6lHS>pGHII`^z^s7INM0xz<pYUMKdn(fe;rO%dKMwfEVfxqqDg0Lo{s(|JC4j0Y
zDh7yv30PAL7<dgRItOTM5U5`yp=_h#fESp65=elY(t-bHdE=mgq&F!eXnAxtZFn|(
z<W(Bmh8a*$MWjFq`Y;4<cMHjP37Nrln6Z7BA$?mn1VCs?Md%NUz<s8%3qt?}=fz#O
z01Wcre&B@}#n2DsV0X+Sh4OF@-H=6Bn1x$NK^;MR5GY%$uwmxl3MkkpXfhBa2!U!S
z5Nzm%i~@%OA%_V_hd9)RpOS|eu!jKHhjs{vUNMOFXACL#FL#KCh=_(aRfvDMe~=i7
zHnoTYK{KEdh=~Ya4hAwLRu9+4C#fNWBsB;Azz-*L1*-u64oUz8PuGJ)XoNyIeLv_A
z+sAd?&~r;@8hc<oJ9iCsCk^@l4r&E0-OvrU@OJ)CjK>&83*m{E7-ITGG0Cwhym1Ty
z@dVW9Y1YVL*@zC?m;v4BjaUYb*r+Mm$c^WSj^l8R9absqSdQ+9iHsmuz7cztB3k3v
zdG=V1@EDHk=#TXXkV=-1mZmBFxQ(ZWhNKmW?X?I)Fm$K^3qzm;;>QJ05OqX{k$CoW
z#z%{}7=0M254aeFz<32?ryBW?dwWJ=;IJq6@DA@F57z)j^}-Lgpbs^9lQ}s>8R2pV
zc~fBKGyGURQBYe%S(F=gl$9b{0-==Cc!@?Cf{qgZmE*FMOj%P_iIh^gm0YP|13^ob
z!hiL+cL3>?P??lrDV7UYmXvaq-I$h&xECZ=4tds$voR0k1%<I;UU;K*s&Nf@Muss7
zgMNZ{u>lT=8I&0?lwwI!LiPmhFgp!bGXh~%lG&7%d6|-unYC7zOi7uRxsPu+5Sz)F
zT{#1ud75~bnxjdSndob8AdigFWgxbirTLkW5}K;Hn)j7*wRxM1lADp4fW~l_?Ue^Z
z00^m(XVEF0(@CAxX`R<Oov)EzT;P~Hw;KJB58)}E<4K<3$$W=NVgeDIbfpozftw`Y
z3d=wOy1AY<)t-$q9Pv4y$QhjX`JVbopY^H#Rl9+o@F|}Gx}GQZU``g57I=pB>7T}F
zp!+GHWu{*X$|w!WaSwWl=yX<trUX=o8rVsqC2FG42^(iH1k*P~?|`1L(VeGJ4!c03
zHEN?bN~5>13b62^J{Xv&!4HAid&8ri6?%^jMgoRdE~#mxp0;F3N{NP2J+;=PsP?2v
zDy2+XrAPV|Sb8m*xus2666mmaFEkJwDxg^grM)$!v=yeTIi_V=O&Nfu)aap8b#}8@
zLGM6{6r>NzunMctqndFK@E02EV5oT_4c8E(n86RLPz;gkjFDOlYIP5YmXr6O47acg
z`mhd>dJ8})JVhF&K{ivr5e0AHW|~R=l?loSr<xq9>PF7?rfdeQsk*APTB~LDswNn#
zx$1$tx`=Xxs&C*5<cOeKYO219tFs!cwK}ZKYOKi0pWb+<MAd{>Fr*dKb4q}W3{(!V
z0F$9nsHM@UbaJkaI<Ee(3*}&5m~ji`zz^-pb5Rv&nIV(TL#og!fLhrG)%vFRH4sYq
zue%Cl{YtO^TdD{<4h3tlp0;q^*s4Y<uwd!14~u0H>y})3tu3VwxtFLFR0tF~LD#Sg
z^&qO9ag)W6ZRJo5dkGH3pbU7^4brfe{&16D6o2<HlYhbw>$(egrw=WAGV#h8`Pw}D
zDy%{_v8Bqi7%N*-*0jp{v`~BhY%{QCR%@lts<o4ewXzA29s5yu_HUe|4_bg?&m*b+
zu&tc&4zSP-<<Lbl`VLSPf51==?|?V+z>AsjwsG4<y8yS>V1<41vzoCB!zgf{x^*>H
z4y%x|NK2#{(6yCoxtEK%nX9>*%XebCPxEkXipELcpqInL55SPJp8*U}Rj$BL4CO$$
z{t&L+Fr@NOxT{Njfy=rfYbS@B8M~ki$|$>~Sg!ss54*sV_?o(WqqLmsyw3~0(JQ^v
zn}D9HPZODnt%PUV>NkZtsGI={cq0#86slTick)mSJc=2%n;GGYvw>@=yjv%}iy1-d
zgE;mMqRVqYDY>Icxzr2)zyU1415ChBYrU<M0Fpp$zn4nzy%od;&e=Eba0`nm8o*Ev
zL)%5lplEore*ORsR>;28R>8Lbzq#wPK)aakTMXjBwwQsF%B!#cTfi|a!!u07HEe$e
z%u2;GQmr%(Ggi1N0}jo18tWjgLF^CxfM|`ze8?+z@~{fGpjJc-w<BD<h6}WTDyXuX
zRJ%YjupouNFr@waH!y6&Wo*W0jK<T8!_1Pdv7ro3_^s(w3>Yb*DI*QQ(8i>Zn2ma`
z<?zFS^0WLP$esb7gi2n5+zrcHH_e;IjqJ#e49P~i#>VmvT3{z9CX)O#k!6cA#Gt=^
zB89{t#HND8z+lR#;m4+Y|FdHp$*t_luMEp}Y8EN;4q|WxbMTk7aSKDB1$jJ0{D8?K
zqhmoQC@1NieZt7Gtjx>I%&$Dj#gYfBKqvVyWAcl@c}C2z0Sh~vC-Y#m$NW6W+|1)l
z&gCq_&nzofV0WvK$+MAOoa|B;c?I|S8pQwwT)@qCf~au}&Xa4-{|wLpO}*$0E7<2w
zw?I$r3>)&0XP?|s#RFq2yc$rj4t~-No!ZX~B+dfO(H-s4VM@@j0tH$C42wVv(h$+I
zF|xksQZhzk<>1hz@eZ-*PLhyfk9r%*Kn(qm(Hc$09}Uz&E!3PD(y~GdyHE@Yy&9ye
zz;88ZL$C+ydK$nW{|5I^4y14oY!Gyd;B>Tcy5QH-N&C}7P1a>?*3~=9bW;v{PzVcL
z8vVwiXT=W_IRyD!8r`5?0{0GQKwj_+8-=>cVeQXnP1uEP*zB3sbW_o_AqjOnRrAnq
zdBz1BoEjlD4{YGre!UvwE5U+2*oO_;p>5VheJX&EcA2pbL(ti;F^sIW4#hJBZY>&f
zzy)HU42wX-N}$xJJj$LO&SNdw!7bbXP1>en+HPwb^YF)RRSaTKinC$Ygo($#JwY2i
z+}DlWu3X%-5!G{`3~V59?=%N{;8f+12WL<S^8g5ozzJ-yXSc8iDV<d94U@$%2ZgZM
zq>;Sb<=C!r|H{-|-N2pQ15V(Lyxp^*UQhr9V!#RApak+Z1oHs8q{IpG00=CGXZaAs
zLl9CI9(+Tf57&^9i=f${aShoF;B_*-^qk_KUEr<!1r5*uUocmEAmdGtRT0nt4}euV
z9sw_|-HF{Qv7K&Aw+DU};iNEpnE?o8tJ-YK;h53nn4#KWM+)hc%b;-&JJ#Zyq1>}E
zqg^i6K<>&-0001R19SBSXC4AsB>(^*05o1xn(*cVK<1Hr;IdJKY;X-s#|2h24-tL|
z@O<3<pad0-gB_lBhn@#wV1rm~8oe#%nV}4pJR5s5>8yO`kZk5?uI6vv=2-RS0Py2A
zr2%Jd|L2?T$ax+cd*0`gFn05BcI!}>U6c>}Q0Rva<%*6OhrSB)>`rYP8o~?C#GriS
zb_rGp4&-L+XFzW901H<j4&qSW;&w8eaCFkZ23-CbcAM#oEa0kc!=0YyS@i{=?&hez
z3^g_CsV?ql%<8b=>P#mMGsX!}pnXc9@8wVki;n0R*-ri5>lK{`u*e1c92)sx&FqDJ
zq@WCY7VVg^2aC|~51)%@D+XfF4K7&-7pV_ou;9j1k)P2I5&Z3RW8Lo_!{q+y01)ao
z)$Vf62kox%@Gj)2a-unZqEk)TJGbCF1_j}(1cmnVly2$lIt26t1yoH6m%s+nuwJ84
z|EO7h^8AwWH9x>CZ|>+W>TnJK4M0;7aOQB1^=2IJtD*C0kDaF>#&&iOk}%SNR&?#X
zb#Si*fmZ36u?kS|=-nU&(r^iv0QE9`3p`!*B6Ia+55QWFRp;*V>5l5WuneP4_KIJ_
zXWutNd(85n!up^D;KdI!mPMS;wx2J%O5jvhJp@q|cYh!FgMZgyc=-L2_?9odjDJ&(
z|ME6P`DlLb1AywbPs5nsH&f`H-EajzCk7$abeMts${$i}z>!@<3b1$u#c&4Ka0#3M
z`=z0?vv2j`F8qss=H=e_To3aA00D1~01W^D27mySKmG+w{Coq`-l_I#j~es}|NhV;
z{s1vf;6Q=}4IV_8P~k#`4IMs&7*XOxiWQpx0B{507Xbi59PD`E0RRCVcOW2HQRPaO
zEnU8Z8S`O=4E}81#F<m)PM$q|{sbCSXit8yh8{(lRO!;BL!3T^8dd64s!8?Ts>f98
zR<2#Weg%t^rcAPB&7MV@R^i2r8#{h97?LAK0j^LAP@7lpUcP+?(hM6|aMxn*1|LQo
zR+{0&Kjq!x*I4po%9XW_^_yAqX3h`UYCJd>Zo!b_Is#ZQ?rvw+tzGv8Y+1J8b;@Sn
z#+|zyu-v_U|Gu2z^>E_FUw(G$5hQ>M<1Tb;qB^B<>ea0$j163SP@~(u|9@Ai%r<!P
z<z-{Oo?g9iwhuzQfB!|`+y?ODn`Uls^?LsOIcGNyJY~uWu)qR=5ywCU7vu^({~m-;
zEw(VC5C90~JFP+h8o;l)g7%9rL=j;EkU`(xDaJ$<edFgAc~*om#+)1+u|^vux~L=_
zJBnaFl6EZVfpH7~Km&soDCtHemt?3!8D)bdvL~lZ?4Dcnp)yMYX=JiXFTVscOcHC-
z(lTiXEHh27%GpItH?`wZOgZPIvraFad{Z!ac+0a-q^?P^w{@=ZGs`&bL^M%F7bOnQ
zLchB5QAvFwrkmX6xdj+PCx!7)Mn45LR8hy|G_Y&HDK%A_`niR%|Jx!})kIH6rL|UD
zZxzVVSd+S^&0RUQ@}ApT{FT93aYZ&+WyRFB*r9I8$5~0=xuu`k<VjH<dAf0Roo<Ac
z_P1k~CAVC2A8a<<pSrPBT|c`aX104^DMlXxZ@H-)e)x13w{gz}IADQWOSj*htTedK
zVy;;S%h~u*W>cHWK{Mg=gc~?xjW^b;V2g3u1>BF*+@)3ASiR|;c1N!4UyfgfIp&Bw
zW*HobS*EfZSXQ~YGGf3<QJJEYi5KU|T$VX$rI)68<g3hd)#$MFxu)pcR+jo`jF;xR
zYp<Ig8JHI*D`%BrD$cq<DT&%@?X<<(+H1Mz<{0dc%aMk%|EJ#ukDsw`x@8@o0w2on
zoCxRpD5U9Tyzx=(wzw$DYReZVZ4<w39$#;Ad#BES(mbcnG52Y4$4^JyPRK1TY_e;*
ziMAVjZMsLAo=NXY9`RnBryLXs<Y%2-@`<)~X`=N<oOhJDN11nwN8Wg8j`xQjaFmhe
zp5TWsetP8n(OsDr*Lg>r)=4)#b@kWpa`lAEaenl$%DH7ce*L-UcHFhn2NsH9u@@{5
z1dDr!V;8U>1~IfJk6nzd7`Gq>EX3ot2HM1Lx&xp;c2SsJl<$BETwn$L(ZByujb7#G
z4(8IwJ{GnxLhkF=Jiq~q*;VF#`P<)D%x9Bgh=YFC|0)KmLWdKv@vt1%t4E-UcoTWR
zVjljWmQ9FZm?7R|i97U1536RA45~10E(Bv3Z3M%9U1JrSo6I`==MSM>0~k-tAy=-E
zH-Fd;el{Uo6>YM_V%!59;JAkp|28kd`J)@->7YOK=#M4N(I&Qg9Ty#zxD|@gl9wbH
znc~=uK*{DFg^Z(D>H(P+)#HvR#8N&|xJL*25s-qk;4M}rJb#!`aH`D75=Y68Qby7r
zU8Lj}F*!_P7Ke-m6Im#qqzqU{&>v-kg$T2F3s^7)81%}bAH@;KJz}$Ls{m&?`mu{u
zh^Ji-tY$X@#Y|`V5}16eWHIGAPqG|SnU$I3|5mP%OqShIC;YIMR|1L?fZh`*@uX)$
z6<QH{zAYd8)QU2w>63?AZWZ}t$~(~5&+!=aI|yB9NJYAkhNi6>`eTaZdUDd7U^Jpw
zW7$AGx*d>?)TTEbM@gkdHDwUbCi_%IF(Q*c?D>Oy=3@-}icv_F((W2X<*85KVLP0Z
zqZmCkYWdFhlNNn%re8%&O>sI_h3eF35`|#A_;E)1>0@5kc*iREag7riWgbqH$Jm<s
z*0@6K7HRcIKH_?lb+qalZKCVhR_T-7fYq^wAwdR=K~~CE_8`W{00|ze6P8+V6;BjL
zKb~q6xo+{7`cP%|IG4iF`a`aU?Aa=A|I$M)=C5e)q!ijVyIZaBAOozhY;Y~hiVX08
zw>Rl*^;QWC;FY#r8O#S=$J12iR`0dRC9M?;Y1rqwlqXm5?s3Hn6yLT%xaS>f8!`}x
z@mh7YIGH0qh;dPOy470ukgalW65sh^$-OwquOU-3uUd9@C_o!;f`?Ly3_Jn74<6|Z
zGEj=~wuqYgXsSO(2@7#xrM~nl*{0Td3qozU!&$L#7gqrbOY!4?Ypm~4fB{Mc*LWxG
z$Sj0)TvknvH@rfTpHF^Vy{=eErZz^hO?>O%9XENH>g__3({xBFS9uwkovf3!97dWf
zqsnEH=9g>Sg$8fg%q)~}l*ODS|4gmf#yHM^dCxp&$1#E??QnCJu7T1#KlaKbU<927
zEjQw3z{`E6(k&p0=*I?vCUPEhq+_Pu2{W2X8nv`|9i4$009VqV9+)vCT<J_tNf|IL
zHCV5l*(Z1!)UQ^SF`hsZL#KL5UA6UQ+p%d@GlCVr26nK8J#1nZ+t|lOcCwYdY-Tsx
z+0TY{w52_5YFFFZ*T#0XwY}|XGlCIqh%8Oioa-kwmfVkRM;ClcYj(HW-S38XyyZP_
zde__D_r`a=^}TO?_uJq926(^)K5&8;+~5bN2?@G@=W|bq7`kovOxsZkb@RaD7sq(U
zHNNqS)1(F;2YJXvKJpsS|AgZwM|sLQ?s1a0T;wKKdCX;=ahAK><}jam&QV@-o4Xw6
zItO~kGtl#%|2*hNUv~yvK=hHLfF>P4`q62<bf$;g=^21}&b!csKpZ;aQv&bTzfKco
zpu_BEM|;}S?h3Oeg(hl;d)(WuxD3SI?r5KTP~LubzURGk87Mp7<IeUTS0>$=4ZPsZ
zPI%*5=I|s)yy6)z_F^HJ^5>2$<Q2bmljmmdn@_vn^<H<-hraMyi+t$`Z<)-eUh<v4
z&Es7^c-YHE_M4yl<$pEfuk7N;D$>VBb-$h4gFg5E%D@{+fA*4}o-&_bJ~~A2lh#N7
z_>(C<?rR@=GHagi|JS#D_h--f;tu~;M(zqTnHM8{0Hc292T%6Dzx~^+TKT1KzSl2y
z|K&G-Hu4ud@WVdw)4uZa4FDv+#>))^L^}b5KTe@CuArPJIg<yBKLVUT1N0611HJsq
z4GzS=F5^DLD?kMdKN8G96YLEJL<a}_KMYhm7qmc03A3fR1~l;&ktv667&7e`o)HoU
zRI!O|iJBQSJQ##K8JrCe<U0@S4JH&kCmccVyE`S63>I8G`a3`*%t8(P4Ft48BkYql
z+X`T)2Vv0{KFJ4pcn3b)4x_jSd5Es0@`oA{!y`n&7}UZIqzV3uJ1Km^K2$tFoWk+z
zLKQ4T+Veu~|B$~hJV7dK!9Bb~N!hclP=;M-7mC3NX@H{u$&?on2Y!JVH=M-507FUS
z!{oC&LJUMzygOD*#3V$;M|3?$j73|d#X~H`T~Rcz$|$VimKC|dn?RXe#6w8L#U&I(
zwS&c0^ux4k##n5?S$x4fjKoF!4%tgaTHHos)Dn%7h9Cnn35pkGz?7m|5S!_vcX)@N
z=_GHwLJaIi*?>ZHh(>3GyL*(zYed8^lt*d=j>Dt1e)JB31W0&P6MpEhRams8_$11>
zhfV|wa1cj?G)3{7M`d(HdlbR)s7HOojpED5ctpIBJV9(E4}l~|i|mton6D!I4Su+X
znWV{@|E$SfAO?wKNf<Fml=MhJ1j$t7zn~0Bj6BE%B(s4uk#y6n1!2maR2B01j@<x;
zs<g_hw91_c8KJ1jq>#y(>_MnZ3YAomRiiciGY<|VN~C1Bl_b8Tbj$K!I0l(Zu_PVb
zVxx%yi+!Ont}>fqND*lO%wl+=dvL!^X`Wly1$|ftz$7ud1dFF!5wk?g05QvsED*9(
z5Xpqh&MXkT)Gx3IOVL@ST_}f{#3Ow%O-8a5ud*4>^oqJH%UUxL%B0IKXiBGq&E2#N
zxKf5B@~^9ko<qu@d59Q?$*_khO;_0)ys1NodrjVqxMe_r%FImZ#7=`To4-1n!fL}d
z|GA3A03br@20lqn*~qY6xIqGGOxkIavgw)V%+C3w&-zp*SjdO7`6Jr;rF-BcNjj`@
z5QqFaPs>QpQ?r!+LKsCVnMsmQ`-IR4mC%tfiaz=y-m60t5kdeW8j2C8(8P`Obd_GQ
ziRB?8iFwcoRnZk?(Nd{USNcx^d#ZjYhKpho+OeR;LeJ&I2?ENZ1aX*3w22h;%z^?7
zoorEj(gzIl$|W7mU2#&SaMFrQ($CDMKXS2VA`mNKu?&)izXFEH7%@^rjPwMjRUi-)
z+J#++3>vCR2PIRBTm&spf+HP*h6Imq@eO%^IG)f%+~B7__0vA>34XeUtQd^^|M?@s
z_@h6viFw#FIP#-YfucX!C-1n1&nX8XO`}r*hkD3|Mnw~GxP}C=i9y*X>j4LLsnUcr
zk)q%w`RNC*(jLy?2ke5)d#F>eKvV_E13JnLK2;E46^wj9HN+^OP0WWSt)6RG(oC%-
zVaca$!c_T*)2~>ELE=Fs)kIBv2UL+MeK^)u6|a7{%A}x5U=Tvy)K#45hDG26I4TEH
zC<IC12Yuj#a#(~t2&8Mcg*^xwNsxru@>hWUDM?raQV@*(*@H#!9Zt9j|6y2%g(5cS
zAUFaBK)8~}AO!?kgu&>YZa|ZFI86)sRy3iQWa^!Acp`lfRHWbs0Ueu$|M49Qk_IMy
zrjo^<dpJ#Y%vo@;7Y~&Zk}U@;sfTXhr4gc-wc**4)fS$GNv<^2N5TnHnwWavhj7#h
zYHf^l;8}Z#40-S&Dd7i_)!KY0hjkdJYxRn3y$Sz>FEJ&Qm$eCTCD*$}w04~sC?Ez>
zm;)$+f=jrDA$X`E5CdSi0(syBC@6$o7=p4@h9S6##ckZjRR$=CCM^&QQeXpdPzJ%_
zf_Rw+CC~@X_1tyHhdh7+F_;60-32j_20$PMa2SF`7=k?Df~egJZ&}%A+9udZo}xum
zs3oj!=v`^(26+Gn-CY;2O;zOG7C8h5<o#6qsaYsGlQSU{;-wv)|Gfrl>4x8p!;|_W
zEXkkmxrV&j-q)#zOXZcRts{Au2Q(ZTVck@n<l4lL2Aeq*dB~qnYOx#4pL;!2mD#V#
za9gLEhk3vfV9gt<p-9UaSG=X*8q-^U-~=%!nIX`JODF`JAl!Qx0#tz(PRIkBP=Y7o
z2g$Vw6Gq{AU<0FA2h9x(V1NQrz*sTx2T~YV8^+<A_|=<W13=h?OJD<V-~xY8f_2yf
z`1K0v5!S_!A;Y*|obcI4ik2wOVnP+NP2tn5#gg)&S}SG@lBJqjD$%GpU;Nn=Kng6F
z0$%VzS^wP>ap={fNY<NJjCW|+`b85+UDxEnQ?Lj}abQD|{~a4={nno<TjP}nU}f8`
zNMJT*$9$Np{Ss4B6&bs&;7(4m3toggSkvLL*uV<mU2Wm+fC3d}VGLH~(It>>py9yi
z20$1BKG6bVxB@h(<y*FiJm@Gckc2f=*FEruEAWRVo|;V|*?y1)`JLZKJt>E|;xmRK
z0-+;eMG73!Fr?j-KP6TuDr0%jhXi3}<~-CA<z-<p)|`lAlARc@6+)I(iaZ|UAuOax
z7A=v<U&J63anKf(LDYQ$heVE9a9H3@jARMaR`@#Llvx>0_T-69unQ&zF^CLt64=xo
zg84;dSGI{&uAWxrgjZ$*7tw-Q1`AV#1van=$Nk&n|KTE+_J>6<ifCDck9{U^FlJ;{
zX2o!;3cLn5N+p|6o;23upvLAQ<YJ$2)@OQ$OQsrddFqrI=W<44ao(>HwUntsv7U+J
z==!OLnr9>p3VW_2%h{Bwwh28o>OuaBe-3DPK4W;s8-AFFcA2Dw-ra`ImlqLMDS_L%
zonVSK?3ohbD;QXRkc2C^0yfA8akv5{xCJc$q>nD?kY?p8FpA9fhgB{HCBWPy4vb6C
z0x{r%@#qI72o%#s?eXXaDByxK2rM?xf-6`Aap>t}ZtA622jpD`0->5cdy$iRouL)d
z-|mLsPHQ<<ibsy5tlcwLX+wr7(Mo&=awZUF|E|PGo*qs#q%*l*Qgz>xGSy8TMnAgR
zdWPTc)>`x?kbFR1k;RFAJ`B0eE7*GG5t^em%;-H^89Pd&LHce&p_*y-2b*D+O)l)i
zc5tvtTF&_ja@L@j7K~)N2GV|8osdXhG?44vOTIP{_4bK=2v?nO<Ajk)pKzN9f7=Fs
z@EA`Vs-W>2xA7VeiyPPR8~+XnW>u|_9`_dVAt&-8H}WG#@*-yn|74fm-iaM#7Y`2?
zm0=gN7BY6BZyDF}INI?p_wuL6@h=ziR`w2k_&r`p@-$cTHD~j1-tsqx^Ej9DIj8eF
zxAQy4^E}t{J?Ha2_wzpo^gtK%K_~P=|2OnQNAyHj^hIa%MtAf_hxAC7^hu}mO1Jb&
z$Mj6s^iAjVPWSXr2lY@F^-(AFQaANeNA*-!^;Ku}R(JJRhxJ&O^;xI&TDSFE$Msy-
z^<C%nUibB12likW_F*UXVmJ0<NA_e__GM@GW_R{yhxTZf_Gzc~YPa@l$M$U3_HF0(
zZuj<Y2lsFn_i-opayR#LNB4AB_jPCYc6ax8hxd4w_j#xHdbjs`$M<~K_kHL0e)so(
z2l#*&_<<+*f;aesNBD$S_=RWqhIjafhxmw>_=%_ZinsWS$M}rb_>JfIj`#SF2l<c}
z`H?62k~jI2NBNXj`ITq+mUsD=|A+aQm-(5e`I@)+o5%T_*ZH02`JVUrp9lJ&7y6+m
z`l2`bqeuFrSNf%A`lfgKr-%Bem-?xv`l`43tH=7R*ZQsJ`mXo-uLt|E7yGd%`?5Ft
zvq$^1SNpYR`?h!cw}<<<m;1S=`?|OLyT|*y*ZaNa`@Z-4zX$xl7yQ8|{K7Z<!$<tY
zSNz3i{Kj|u$A|pLm;A}6{K~id%g6l8*Zj@r{Lc6M&j<a`7yZ#E{n9u6(?|W(SN+vz
z{nmH=*N6Ssm;KqN{o1$v+sFOf*Ztk+{oeQe-v|ES7yjWV{^B?O<46AFSN`Q^{^oc7
z=ZF62m;ULe{_3~>>&O1=|JVNQ=l<^Z{_h9>@E8B_C;##{|MN%x^jH7&XaDwh|M!Rg
z_?Q3rr~mr5|NF=P{MY~e=l}lqe}M2Oa3H~g1`i@ksBj^}h7KP>j3{v;#fla$V$7&<
zBgc*&KY|P?awN%;CQqVFsd6RDmM&kyj45*_&6+lE;>@XYC(oWfe*z6EbSTlHMvo#*
zs&pySrcR$ijVg62)v8vnV$G^`E7z`Gzk&@bb}ZSlX3wHct9C8hwr=0TjVpI9-MV(~
z;?1jfFW<g?{{jvycrf9@h7Ti7tavfw#*QCDjx2dH<;s>XW6rF3Gw05pKZ6b}dNk?M
zrca|zt$H=<)~;W}%Z@F3HtpKBZ{yCbdpGaizJCJ`E_^ug;>M37Pp*79^XAT<Lys<f
zI`!(-uVc@yeLMH=-oJwnFMd4v^5)N@Pp^JG`}XeN!;de2KK=Uk@8i#}e?R~J{{I6Q
zpnwAsSfGIiBAB3p3o_WCgAYO&p@b7sSfPa%Vwj<Z8*<p8haZ9%qKG4sSfYt1qL`wJ
zE3(+4i!Z_$ql`1sSfh<M;+Uh3JM!40k3Rw#q>w`rS)`FiBAKL;OETG{lTSh!rIb@r
zS*4X%Vwq7u03rDV2^|3c04x9i000F9&;o}5000OF2Mh}f4i69!4-OI#4;2#<85R{C
z8W|xT96}!lB_bawB_k~=C^RoDIyEvuJ2*W*L}NcDNkcwNMnRND5tv61NJ~*vO-L_N
zk6Kes#aa<&Tva<=l(b(Ktza9+U>aXzYHed($YUNwWSXsIB*<nW$!R7{Yn^y)Wz20X
z!fq_hZ!pbqGgfk;igGBxax;E&Y=3hnS$3$-b~;^mrI~j!b9jKzc|D+dH^X~BhkSHm
zeXG%ZLxp}g?S3;`fHY%(G}C}bRDv~Zf;e`AJdlHW(}PUFgi7p%Jz9o4aE7gahC+dc
zkJN`!ZiuyBi9vLUu!V_6#)(qZiB@}xMemD8VT?tMjZ2!1gJq6M*p6FikxhJ&x5SZN
zjgy|3lUCW2WNnmEh?Q8Qm5a)iWbTz%)Rty(msf_Dx7wF!+nH>2np}mN!J(R5%bIJ8
zoVuZ$W$~P2lAUIIo@3meW8R*0uAh{jplq$6Yt5i^exYXaqHBVrY@MXA(4>3cq<n{_
zah0aT^QLmIr+46|fSRblxTu}IsCtU2bm6Ik(X54!t$UiS&AP6GzOJI;u8N|s#q_U%
zm9c`;v5e%gji|DP#IvWEw1&R4isiJEthUMZwu_y&i{-bN(YTc9xR%ViuI9R&!@HIC
zyOX56ld-(g*1VhIyp-#`o#?)yslS-7zuNY|o4Uc!>cOR}!kpB?w8q1v-ovKq#H;tj
zqRhpnvBsm>#<|kStLw<Gw#lf&$<*x1v){|T;mfkR%&qjyu*%NY?#{Wr&#}PKwZ+lr
z%+cKM(Y@u;!Nt_N%hco2)Z5zBz3kM)^whoi)VlH3!^qdZ`q#no*vIVI%FNos`r5_W
z+u!os%+%fN-QD5(-OJM6%H-b4^xx6d;Li2o)YszB+T-);<J8;a)aT{q`{mZ?=H~Y1
z+x+I)-sjov=-lP$@%ZW9;_BV@>f!n9<L2$*>F?$F@966A=l$^K?egmT^6c^S?(_EX
z{Pyzp`Stwy_W%F?00008{{a0797wRB!Gj1BDqP60p~Hs|BTAe|v7*I`7&B_z$g!ix
zk03*e97(dI$&)Bks$9vkrOTHvW6GRKv!>0PICJXU$+M@=pFo2O9ZIyQ(W6L{DqYI7
zsne%Wqe`7hwW`&tShH%~%C)Q4uVBN99ZR;X*|TWVs$I*rt=qS7<I0^&x31m0c=PJr
z%eSxJzkmY^9!$8f;lqd%D_+dFvE#>(BTJr4xw7TUm@{kM%(=7Y&!9t#9!<Km>C>oF
zt6t5zwd>cgW6PdRySDAyxO3~?&AYen-@t<lA5Ofu@#DyoD__pMx%21Hqf4Joy}I@5
z*t2Wj&b_<$@8H9W{~u4jy!rF!)2m<4zP<bRyVLcWPrttX`}E=K-_O6Ks0{!HDByqu
z3V1|+2qvf?MPU@^;DZ3hv*3gjRyYt95N0@_gcf$_p?(+wXaWu-mPn!#CgN}c4k~Q;
z;fpY)7ovt5av0-{IC?i@3n!-NBMwdk*<yq_7HQ;lJJO)!k~Fm7qzWpS@Su%HR%zvO
zGalh&4=tFmWe-$P5e5xYUTNl;#mz_~gjAyG=9{=}v1W!Kv<c^(c)FGi4N&$8!UiKi
z86cD+Yyd)^eXhY!IN_8OO*9x~6U{y%(GyLh2D#IVDCv|G&!u^WDyl*_w9tz{a;hOv
zHY(sC(LMlX|1(lN0QPfH3mXh0(kmPEV9*)@;vlO?nruKtLiDVm$*9btiNmP^xub%O
zy|D0VtRvxb#DTZwx@)fm^#b4)Ye?C`NW~tDkern?>#mh{Vg&03!xkjU8h}755I(fn
zp{%XZKr&1rfTW`eB=BgmMkSQ)14+9MixQ3^Ye4G{JQUM13?%gqgsUnPt1=M3{%T^Y
zKj|nEh8?;PbZ@>cuK`K1z7hloxc>BFf(rQH1Bocv0AdF<F~cm-J_>Uz5H*lMdvK%a
z3WSWxg>;Gxu1ARMPd1P!i;qC`K%&YkYv}s!+5A<aiaQKxqR2B3&D*g+M+hj2KsX4v
zg+Gc2|Cmh=h6d<_KeTSp4?F<=382XENGag51>q`S7<lVVxZ(gpUUz_Z`?Gm~H4nt=
z1}y-B%s}A~2<_(^+>OtW0KVc6BpXofPu{fn6E*Dtnt+cTp!@S*?~Q&VARuTb{~np7
zLyi#O8>j$@Lvj~H3!upSH^M&D;Lt-l|CzuyfRHHS58y3)!#m-%BEG>I>C{a*uqq%^
z>;}$zOu93?XVd-n;hSBr;z5fZAn$r3$R42ffeZkNVi+w7-9Q=?pc9-fb;d$Q-BjQY
z1S)WQH&ekd`gQ^V+75TRGnPM`Ai{7IDjMkk+#0@-4gj$%Z@x0#2DSi+PATt)>2ZR9
z|AasgwoOn#=W0mx2m(Cm_0J#pc!eD#H@?sTu3hfiN8t_!Ahs22aDX$PKU%abKrAU5
zxSF0n{v@&}P7y#I1RcZt(L_k}uUJV0o&*OHjW<RJgN<t72KG_M{sFEK0>KpR_IA4s
z<SuIdnA+xY$1dS*poBRC&^~k+FCcm{Jb4Sy2qdHnT$#WQ0uiEs%(jpv4g^>mFo7&h
z;EZ&f08pD7pY6`K0g=%|lUvN9KRmI4!R1YjWLg#l9f_;XHPe>3gyZaB=PFpvl9qj|
z8SVB62{o848vvpO1|?L(4aCEmvvdZo@+Uw>lIf8uROJy0Mad1cYnzD#5Il7F|H*!q
zM@<~`hvZ`C4>btL1f491D+O{rS2>Ip`zXW)4g}5(=yD){%iS*r8BA&ZXK**`!9FUw
ztZdLH9=O_D;RZI*t-%o)O$$dQ02Gdf`s1Pd;MEAeR<}LYtp#7JXfH4*vf;(ip^$(m
zhK`jE5a56w#X8VF{sd1dR1_X#bfiDzG(AB|h;|_Ghw;Md&$5Ci977s`$gXEOcQ9`Q
z$WtPKMsUq+-~&M0B3(bi2Z$lzqi?DbNJjm!Q7yL5qs8<`G!hpeb_x_gU5egbW7$^#
z;X@UMvV)vd(2u)L^rxLI)CeTEM{xltt^2@WuK=Vd&*rrS{V=TxZb`Xe|BOp=RV|zv
zRC%`ssUQsdz!eB2H@&f%^|;<i2P6vdjeH6yu<@wG8d~O%eiVpk5Cl*U8nurQv2X*u
z=$oPht5we$)^LRr$bZx&iWYz%40Y=qL2zY<KdC@g-38EhPgPkEP(feW?G>hwaZ3;Y
zYmfd=#VxhlDGbV~m|ycpfVV3UP5cQ2Ti_4{^9s+sK|)F@5MpglOITHcK#i#*D{@zS
z9XlLB1vKb^8cy}O`uU?0EL2h$a)%LmP>LWu`-msPphjF->>yYLa)b*KkCPF^#|BBV
zLh#{3=R$GG1A%fuq&zY#AH+`k;PS;-OlIw<p-==mLOdXGge`>Q{~Kr?P!Hy&lf_0)
zN;~BV2FuLnD#3C<M?jt?w%~*<Y@rwFPy^-y<f@-&0tY*D0-bLXk8Sn&(m7J4fT-Y(
zFgQ*?J)i|OK0VijV*1pmR*I$pbb@$<vOpl9#e+p@>QvkM)<D_933k0}78LG5b`Zri
zWm#)n8~fNj`L%;kiR@-O+bGH|5VN06?P~KR9>d7CwzoYDBU=00;10LA$4%~XoBQ18
zPPe+7)sG)nWFPJ}h?Cb%Z-0j2$QOx{x+tQC@iKH|7DY=s=B<%-TO{5$g}1^FVsMHm
zeBt$ucvNhwiPLF>7W<wEya}>_2;cQAs!*I0yq%FA1k@nI|A=cs#Kq${4#>*_O`=5D
zDj=9k{N_gaM&0b7a*6a}4Pg)?#tDK9pd)V|fCx0DUNH<Dd!ip}sMyg`myLAvYy;s4
zLm2Qe3|ib95Ngy)KMo}d;7vOtEJBD16~gj?q(c)kRe>f<W)LS)<n3{vJHc_zccLWS
zBC0S!B`T4`p$kN3itq#n*KmYh96?cQ7{SUY*NZKPQG>lY!Yl6D0#5{*b`A10SEj0h
zUhG2@xr3mmdtf#|(3RQL*a8TSKr|;D2p%eESK8s>1P~aQjsT*Z>rZ)jE;Xp-18M0^
zw?NmpItd?KYVPn+xepa=flQ1ni1Pb-1QVp=6)Nzr|AexUH(~Yt{5CP5K+>W0Ei5@6
zVc3Gj>+T7~7JlD7m>ydFVFFoYLwsv6INv~BfFMQ!(Q*5-0jHBRVUP_aq+(jpHvmEf
zSam%o00<`_K8r;ztusc_vorqCBq#${x5Ghz00N>=H|cOaEkFw!2rPHAGmy|C$ajF;
zB1DY00p`;JDo{7M^Mb82FO>i|`oeMC0xUQX24jZ<pyxS)2PNnig)#wNtCBlM&~iH#
z4w$4+SmzI=#8CT2FOkGE=EOeupezMZfE?#>0jCK>Rtec~ED)#_&R_>EaxT|nKD1MZ
z?{hO-08Z0mbs=~zHH18A*AK6t1}y?9Dg-?E|FT1iH9fRbgZ|J`u;MGQaxRj?Esp4i
zuyQQ_fp3*~gkmTzPM`>~#CeL4H<%)YuBZ}-Lkq6}Ew58$D$pr)au6+`3gG~P9kg#a
zpb6;!g-6gXm2e<vXfp=r4<|r0S65+g7>8@b712Ngkdrs`kcTOR454QScAyE)po3dO
zG<+gfB$#$`0(2X|h{w{6-`GIQGE<ajiOM%zkA*AF;1BMo39v#rydsLq2Q2hpNk`y~
zc2GktV31YziVSHI*k>#Iz<LC6i~MJE;e%NW6-%=73Lr27ioik9U;=anDakkxH)8@P
z0|_H=0(S6mx}ydUBaL%-75#7mBOo-<{}V?l&|V`DM|R)|Ca^3gu#-^I4?fr+hR8ut
z5)E~8I>Xfq*YlG>=?{UT3Ai$k+>$pcvjM2&B=i6RG~km!$&VYLD*tE@0f~UL(s(C8
zIXu`4JwO8p*N}7>67J>%y?_tR)hS_s4Eqq42w`(>M=7EZI>n|?huIa52U)UmJ!GN+
zva=5lb_A3Hm!zXBz3?X(f=DJOJcUv>%Yq?tIhm9~3oYV<Xvr<`06oAZP+>_sq9B=g
z1#e~P4`-=;q!?k4@F(dbVN!AevQwABSrWX`C3n-4(LgTLB@rsn14nQIlg1Ytmyr-v
z5Dhmn3Y8EDH;@8xoktTlduN?<|49*ECYZx{o*@wp{&o@R(29p~J(P%^^4S>X=^3dt
zp7WWX`njL{*`NOTp8(1%1HwTD6(G@|Y^uUKpCTaU13MNqIs_#kVP_lDxe<vOpcv{9
z19}d#wgIp340>}8&;uaP0HIuY4i0(_GZi3}a1I6{8uvyKqR=AINf9a#pM4RdC*cei
znxV-7Am<RILOP^GTBJsLq(~a1mB2Q^*%=f!e-hCGH98SJN*7Oh5{>7h*8!wS+NECl
zr9lcf6Pg)1$CW)75mM@Qb`S<cLpYGI1!^EGg%C7O5DnR&3B5oC=JO3vhbecOr(%Q;
zl>n!0Di>wSa}EayPSAkq|1fPF<1mXVD={RDShWv|Kn1Dib-e&~TACbS`l+Bwq`<QQ
zV~QDnXAx<7Qz`%mv;YF|MgvsP3p9{BE#Q$^lbJN|3Km2Uz0d*{hpW1Z4E^Aoy3hk!
zGZ&{y5sJ_Q)SwHE(gLyr4<PVY%<8P#GF%0@Rk7-;pjSKM)2YS*33d>q!BDQj5Tx0V
z4Was}&tR_V8l<Dzq?w_9s5&g-;t4a_b>Di00yRCoU{VO>4^$AGJ@BgmJFvq50=BXR
z$0`@}%6{>OWxa5A1rc(JU_|Z3H;Q7h-j<~|1y?Bub`AJ|;A$K|x>!AsvO#KS>pG;G
zfTU}XvLo=aLTU#H|8^NvC=lPU1@jgSS|?`nH7u&IlcFFofM7ebDp2*}c&MT^1$%hh
z!mv0dSPdH&Ihzeu*m7NSvjc$)7}7bAc>>K9NncAh(BcmGQ?wfchjLi5#c{G5K&0u~
zvO-EPT`B}LJEZP#1f@C|u{etpYd8~052BELbvG<c)hOveKtOdfvXiPg6SYqJtCHIb
zJkvK-`xbvoixfE!f0GbxI)oL5Gof2EL<U7;)JEYDlWps^!vVKK$_<7F3PCEn!9WFn
zNDX0dyKCS-VGyLLpb6X%42~2G)Nl@|umwV}21AOsMY^Jabr}yS5DGgGxVJSjS9kU(
zJUi0@&VUbO|Dtu%1G!AQRRjwHgHyg+@Cw6fESgsr(;Jbjv?^RnM=HRBJT`VbW{3DI
zHGvYAtTJ1gz`E1uy21gwLYfMX7o^k>J<GZVAgTg|Ai>Wt0`M9Js!)D70EZx;2(Qqh
zLh8Il3O!ZY7f@;t@m9S80S_e<4vppzSXQ4AfmQg>4>qP1C;V;$ftPxTGW5F;RMM+V
z7G(rc!Ul{RAAAmrMWj*3z#e)Ig|G!6`U>aZVikPBL29=_x+1jOym>pMi^v!AHpT?u
zWV8US4N<-QAR#KS55qvQEHR^0paSbz6l6RQcicf}tP#a&0>>#~M*sqLfS&}>3oKNG
zN1Po&|GLCO+QjG3z(E?tSInVO3<5!_by<A83~UEp!VMw(#pmz}?vM_MY!~4`nII4j
zQ9M<uyalYR2(AnQ-vG<=vP%b%XtnbV*)TYw5C&@Co-WZ3c6Ah|%*v~r%Evr0u{_JJ
z9DE<4o)SS1Q<})qfxtrQ$dC-hQf$GrFan^!4fFyEwG*T!K*iJ$4d==YBajN8JfytB
zEqdX`6!8iY`4EsGuYDoU6G6}O%Mmh6&E;XuK?*D;zzyIOq_7O4uNS00wFSRh#dNj1
zP;vr2;Kf2ZI;DIU_#lc7QK%2`&vvoV6yebTjV5sWDAC}h73|4Fn$kqd4K95S*}&50
z{~QfHK(iR#7w(X8rm@o{T~<I!4Nl@DDs91Z%b`Qf&gXDF8U52v%^XKi(d!!1M}5(7
zych996&30bM*I?4T@~TE)lUr^qZ&IP3Oef0p(Uy}>foU2u%ZA`3F;sqDxeN!U4|;L
zcVc}M`rHvZIuTsA5i=@=f!WVD8Wera5`P^M`&SUG0s@XT*1W+x0CJ!&TA&ePX8@uq
z4r-eMB0F>~Km=tFWFrzTNf7<U6e8UbS2_{Z*b$Ix5U*XtLb2K`(b|lCas^S6lAR#w
z0ISH*)eLdk1F_de;nN&(sAuXB^zaHTkPZXq4|56#b?T;Ynyz@Nr&1GuDhIi1|90KY
z{oDh`r)$uP!(eE-@~7H86Ue<1$~_Tp2X?AJIY_5;+x=qdMFspQ5WL;n{Q*2%U<bgQ
z5MB3mYSha+mft&eS6R1pP$zXaRo+_nHI|C0Uy-a5p$RlFdq>b*wW<hN^OvzYtH5eO
zQzZ(~(4?s<;<8E$8qVS0z^lG05b*%n78VaBp2J;%;Stfm4f0~)z<7?QD2S(c!ec7y
z-QWJbAK=uZ-70!&kgF@hH@*s$oacGSQ+a_(I-Z9}Td=J<eiL8K5%fwCvn>!U;ICM_
zue6{u5;Cx3<gsWzEVRJpiUpV$WpSFIF8b}}0*lWsG3G1ru<f^GgXRQ)|Lzaez(H77
zr~S7z;*)>=uzxr}1!Y$=O1|Xqp$R7kfAXggkT9}qL@SLVuKdSJceQ}yrG`+XfV#5=
zumT7n>l2Bs5jiVXJX;W&AYZbL=SpjmNZaO;3q><1mvb%<M=KCXd**^=aey#hYhVZJ
zo4GAf>nU-ySvwGlun+2V5Y#X@;^PFiB_XtOSF(Z(O1TC_t2LRf>F(js6C_Sscn|~(
z0>kjF-nd5d=aO!S>{||vXuInV<P)~75t|#h^A-kFu-tAp0ucG@4Ar<EI_>e$Dg9sq
zW|OLCj1P{BG7f)J%`Onpz%#EC4bwgo1)ma|yDy!q?RC5~;J!lC|4@uKb|Aqxj2xtO
z{vgc!9og>Q9zC!H>3}>GnTrTf@3gXlwMhj|AR*7FJGR5>{7yM4pt?TM-WxH!YeaCG
z!0;DhleAhd;9EOHroON64Nn5k?sYC>FTMgn1z;~&=qnHnf?<)1Dv8b#Sg#WCTh9YQ
z3r-N8-_Cz4Bq<_k0+7OyBQS$dWO628J8J*}-uLtR(Ko$Gk-n1<^{$T_Km%+>Sb$>!
zYryY;b&{RchN=?4C*bo}k-}W>^<9<_GK>#|jJgF8WPu6NUvZatxtEc21pSbY4?!h!
zsr!__9`4qce<=|#NBb5b+$$mIAfd(_()E2I{VmbQe;g%I|8o4zlAO~e7uL=ZxEuz$
z%*#&FE_*TlFagcp|NaJ%@*;81fg%4fVf^sl+k0=?g0cVk4-ozY4kTF6;6a256)t4h
z(BVUf5hYHfSkdA|j2Sg<<k->UN01>!jwD&q<Vln%Rjy>&(&bB-F=fuASu<w3BQ|yJ
zEQpimPoP1C4kcRD=uxCem6F^yZ0XaEO`%SuTGi@RtXZ{g<%$qrudZPSeid8R>{+yF
z)vhJEL4`j>8{}?y6>si_oNMmJi*|R7zaw}3z1l$49TlL33C~sJPsQA~ap%^(n|E(t
zxl<1(9(=d)W4V#<Ql4vhF5kIqRj+2<+BH?V=j`0A|Mcu`k8@k@K3gnz%efwR&t-l+
zQf{TYcFuuzE1S0Mxwv)D<(;~C$m7YELv}v5_U+uedtWDC-u!v=8e^Yh-`@Ru`0?En
zhwAg^dinYFzo);{K2QAi6HvbX(lhWt1QT>EzyTX%uRx`wx^DvqD{K!!q$C88LJKRz
zP(ctw6mi6*R8XNq2R}TDtO-#}u`sAu+|b1aRV4AotkwVvM;^PPaljsO(hRYmj==55
z{em14C?k<fQpg^oyh@Y}s8B^pEUAJ-IVbbWlA$j5`%<AW^&9idq~LiAO*V;Qu*}@l
zpz6P!)c6g~_qLF;J}B$F6VLYaY;#bcXbD50|6w56(VuT1NrzBKTY9rh8;jC#r%5S=
z@u^F7$~4SMBNY`TKpfpi6UPQR0-qj6b+x2VoeXs-88PJ$&<8hNs#Z^L#dX$KgY`%h
z6T;}npJ@K_$DJ+wp+Q(^JBk%aV1wGMMO<@T65DL6jrLoNz6oO=f%-v=NO04g=oL_2
zc?D4DB8}}CT;nBl-g>=Nci)FvprVC+4h5tVQTR3Zp~tqMx63V5*e9B3=Im3aSEAWR
z1%<<Wrs0Pp<`bxjFV48jjU9&gV3al5r?He<PADEoLgSJ~<m8ISs!n&p3}Yu}v$?9A
zb=vt)8hzg2W|xyzdc<fT3G6PYqn3JV|EjCDI_lpR?y%;oyY~8Pu)`L6Y_jK?8AYzk
zR(ox>+jd(!n%|cDY8BK_!{epJ+J{_=kj}fTnCBMU>flCha0^hL9(-}e8xOk&NP2kJ
z!B@6`ga*em*L-uiAeX$t$}i`9a1|i=yDL#1%f=!VXc@~Xf$T8-bf}_v+K$Py)%~2B
zRX97pnvdLlc;btXPdA<ioKAS-n|B^i<cZdA`RB`grV^i3@SAq5T3EfJ?W1`%_Sv~t
zDzMM1hx3`>=t{D4t<@)<efg1mCj0o~n@jrov!%a(7u_#3`Ge2?07$antjT;!ftjAZ
z=e@C1LQmB2$1t|A1=tlL8-Q>^|1`d_hBbskAoO@e3(}E}e%L_~nxKN~>|iKrP~lMv
z<Vnm<bigoSPd0{YPbG4rg52RSTii&65K+Xw-&7)q?0JQ9w$K9t8Zk^nl%j=@$h#$;
zqlvkJVijq`z73R*hBI+TL-s)fD)fQ|uJZ>3{n3vg>7oa!hzAHXp$QP&tOX-b#1T|M
zk6yF@83NG+4M1>&BYeXSAlL$x_OSscnCJ)v8>3C^;yy3_2s*y&p<A92#Y{RW8=wef
zg`hLCjd`+^cpBv@8+6KrrBVf;bme{sqXN8D@+Id;LPKa_0)ZTXjcyzU2#&P{Rj^PX
zR6tb=OxKI=^<a<!5#K=U{~#m~z+(gHaDpcwAx2%sBxb*><ty7KxpUI8oK`%-I`wls
znQ@Jr?(EPr+DXs&z|$>ukS9JJq#JOCQzh<5!Vk{D5I`KtS;PEZC7d9TIRZjiYp_Eb
zzc&zR4y2mo6UYeM0Rn$eAsdwls6bnyh7I`8pAD)65Rn7KmBtiax_Je1m?u-5YLccl
z&FOxSvnP|PWFMR`LlT0)5L&bVAAq2XK-}0172qQ-s)$BZ@qtT=79^trNyi9|wGY{K
z^rImiX-R{slE<jCrwdbQPpx><oK8-yZiUbP=qgvb=EpV)JZnm<aE_xc1Rt0SLl|b)
z0uZ#|jlrS95nkbs|1fNTkxsoRL_zS-Wu9OJv<Ry|MgR|xinJ1y=<7?Sl~>eOh>EFY
zZG%?ZTG(DlSEVh9JFEZ^d?W-O{=i2+R4`3^<QBKWrLC=Edt3*#61mG|k8+utT74DQ
zBCX(rMp8!w6(~!(SUK%;@fnL4_(DMTWKR~%8;bV$!n|3i2AnRj0~9^NymvrRDCpbT
zLmc86Ft~(wQ5)UuPDBpZ*hoLJLEHdarMv#EWilWD00xNHK@fmI0AkRdOF+N@0EmT)
z$Z%ixq#yv<=uiwGfPe;|C<Q47R17*Spbuw@0vb3+3IKqBEHJpI08a2j_R-58r)R-B
z4rMqVuz>y!|H!WASiptd6ABKyXvXnruZvc!Viv>c8vp>Yex{788MDtBHa-NAWy<3q
zGXxrgNHcndZ00J8Kmadx&n2>O2MM1;zIP~Mdz$<nDASoe&iF8i(@O?2gd!a5`7(Qw
z@rXwx`5eBG^f?~Qo^Tu@3%CezmLI)nM?XS7SB?c441JDj+#w6-Z4WN8K!#+vN7IRJ
z&z8HKpGHrb)#nI>ctgSIN06b)=g9P?0euGtXkfJ%C_tX!>`pYdIU$k=thCAV=4az@
z%kXtiHYNZ72N(bV-w4OI6A%CiIK$6QZcm`yLxvkexXMNVKmr&5fDdcn00_{422ya2
zEF3@p{|IQ$Apjt03_xJg2oS&l0#Ii5T$w$w06>n}qk#vEx&bi&000co;ZPtT-v2%a
zy$v7$0ze!C;9kJE&k=)_KcL^YZqFU`&2N9doB{25fC$d<01i9=00L+LiG9IvheP}l
zCr<zXFreIO2!Pw!UT3teZIC1&`05Mt71dq&2mtJwJ#tQRhv{ABPgKC??D_MPqs$&$
z0Kn(I004Y10RSf_BN>;7!2&iO1B;iO;O$`m2G~P)`aXaG)d+`%+aq!IU?2gDb_Tvj
zUGH8?{pS%r#|{ASh`4hg8_qcKH|WmoDrbS?8i+v*DqZKk|2@Ys*g1Q8{&N6OVDAUt
z|2*RzpNs=gfW%?G=Q$uS0k2nmwp*vjIn2QP>tH+i^7A~X+k*fOyaxgcXwL)^ux>!V
z9pH60FTc+r0s_P**X%LE;MorV@uuMWmB)a2SN`}c^Sa`lH-PouV`EmMu*!3?Y5;%~
z$bzsduLMj00!RT)t2HirvVQ9~cFQ%|<2j#GJQ6FwL!dwV1Ay^Mvh_;=0hqp8vO4G^
z1yX>%;*dTQd>(o`HTJ-}_b5E}c!m-P0Pu4=I<qkh_(2SSFAU&5_*g%|>$V2W1_CgG
zbGSPQ074D;hKS3*bD)3)2!{k<H~4_O!lO7cxIWec08qO-`tk)i0{{&$G+T2I|L|%(
zz-tc+ti5w^fDBwaTXRAv{00tizX{L)yAlESd%;XX!BK&S@sSBLI4Bn6IzcQYC=)gJ
zZ~zB*4+<~<_TUByki)iXH}QkFSaT20dqDTV01AMQ_WQpA*Z~1(uWSGSCfq_QygLnm
zzx<Fmirax!Tsyjp0eFK%dZV*!ptr!YJOLp^_lSYPGq^fr4_j-+S8NXvu*4=r!`FHM
z!)wGrT)viphaOOYafu0h0J24F4Hv}5;t_zgYYzkrFZDWyJ1{_BFaia5#sv@oT=+!&
zI|N)HF=s%43GfB=$}wCh00;<$WH^Kuiva_;$1h~Rh0HU$le_lN00X#$|7^H}bWDK-
zzy)V}uxlK(1@MJXcz^^@H;N<!Tv$0=s0ITl$U|6wjC+I~@U^;Yj|LFFP=Gl3P)LRx
zKlwVjWju#9q)3az$a65b9Uy}PAb_VMrAc!|bMzuY6cshN5}61FNf<{)jLIsaw_Do*
zal5fa^E?0`fD*92mdia(?6`&ug|ut{i@Ssd=r{qmuVmP;dTS4Q%ggpq$y!@E05|{|
zi@1(+Irex*NW44%2!IKAF=zNT04RX_x&)B`m_TR012^%y1iS=*2ROAu5P*&&Ir+HD
zj{Cl9*f0VhgWH1uJB+|@08GIowv`irEFeCibb!U<N-3JkNHHOS$cAqii2rz~gj_0#
zL4XFWB*(79%>&{9sl!LOQ@2`+1sSvuUw}^cNCsy+JVC3FY7j;Jz_<Z%hUq*9XYkI$
z%g%3zh3uR-=gbdZ5Hw%#KmF*=_lVE;I0OhF0P|GN{?ScBc_c>Zg%%nJDqt19F^MEN
z(Bou_a^z23`3Blc!2MV<e~N`i5CPtMwrBVN0DyqkbI|(nPeM@v9B>LzU?YFP0e?_~
z-!zG9kb?zfjRpl#TnPp1%#YVvsTe2#4bVwA;|4@nPa2gU5fzmaRTaom(2?MTR*2En
zn9(7v9_NZuDVkC$B~oovns0D|El3AIfCo`fghD_GD<~r;Wzgij(*H~%FEuqHHf>Y&
zDN<Jfgq5(ZGgS>Jg;Nx{g9KQB1js)2;D812Q<_sB2N=|lbP=NLpY3Z;_8@~kO@MUV
zQwLZ=p)>*rkU2;+!v|1JU$_G!$TKo9g7KU~1i*mp)Kd@1(mNH1TFA;)Rf{}T)e0el
z0yqG0>%Idhfc?8cxH29DV7P@85Co7$_h<mw?4JZM03kI31He^<a}f*>fPtg04MRBq
zKt5c+)da8rF1t5fBme;rQhoEdhNRV1{g%Cn3MKW30gF{xO;dE$oz9%ZQS8-o$kFOq
z*8PN!12ES1xHM&D*8F(KXzdUTJphP%gj<aTXLtnqnneik1^-AOgIKt?!Lu=fjgN4M
z0Rkw151rTikW&T81{JU)j!*;b`iOoIM|eGpS&h<akURva$83<fBYOnf6t86900vk9
z2LRN1eUFt3JS#niY~X+dK!60Gu`F-^GSC17Z~#{G1quk(sq+O42v(>i1E?K42Y4}l
zWy2w400-Cs?EF`NjL#U5M5+x`2avQKZ~*!;f(1Z;iIoqpl|Kw11MEXJsXbMEG=f7F
z0D_H$6I+0DHP|O}fM9KaLY+7R__&(m%l3G%6i}{v6M+5_Ic7!NU}b>7d$|B0LXi~^
zk_C}9K$VSH*N}h)K6u%*h}j{1uzh=0mMqN0l)IzzIR9}Y!lAv_z<bla^tfUzK@Qkm
zaXWx)NCuHRUMB3_U=;ue;5d?F00Ky|v1N~?^IfNN0BQ|@@QsBD5LW?!IM1`!Z1~q?
z5P<+N0Fg7@|D#KBBLHT-x5=%y_WCvg5V+4hIRp?_h+|y#V99}FI6#e$<Q+^$JGlm+
zvn&vR0^oon!Ct2e1<zzw1PFj&B>?1e4+H?&(?wlY6_wQ;h?N;ofe?kla-CNg28Z&5
zeF&k#>Mao3kr@t$8WspuC@ia#2x=P%9eE1QYBSoU(PI6=Z@7fqjRDUj!G!D3Y6t}b
z0A2yG*Ww-B_(%W&V8U?dujIwMYG62<>rg!-fdB9FNVvNL>tzoH5aDy!-Z%~b5%>lK
z3_=R{SPGy342ZRG0AGm9hRHR%-1CJ&X0r2*4;vGJm1{`>u(1WmhCepIJ1|`IT2@~W
zI-f(pjB`gb=HAKW*;H*0229Mu6gLCl04Y2N4&c=T_(BGlT)`Z=iag{geverM%@HP$
z5)KhXl!y}+h%HDXL0VB7c!e;is5KaYWDWy-*nk%Bgd-T!Uf2SbdFE)IW`D4Q77&Fs
zP$-G8f@=E+DzOr!sHz^I(;z!y5XAuTMSvKn29{)20Z0H0o&fgcwJK(h;LYOppwRQ9
zRs;|MbxYoBd@v(ux@SE(OZ->wY~yoyWB=_PR((DI1-!<8g^veF<Un=0a|q#3K){9*
zxSHI;y2H@f6ab-fGI(o%2jezO_TPUUxWoKpr1f07)sJFbPpcKTgVoszAb>20<prQt
z_+{3XGXT+r56>&bT^`w9R*+!0t%(TcM*;*<I08Vh3lZ89e^`Tu`UYKi=0VZ~WdVe1
z-hi@RgGY)OO#tVJI0q{rFpy9as89hjU1xcHYP}5LdNbq*qh1V#0QhAOhP7fWjy!zT
z*Ya8baYF!KNM3GZfB?7yhV#1yXn;vn+ha69_DBFY-rjd)G0($jfVDl2p0vr0;7O!6
zqRZ?CIM>c50}Oox3b<mZbjJW-0RJwAM29{(27qm+CSXU?H}U;Q_$XGfleNj+wWJ-m
zSSCx!W7cXA0fD35_rTBu=4<|lY6KyLA8=WS2xfQK08J1DQ5c3{0H$qLX4d5`7<p@f
zKx=_`W<m;sYyc^^fa|!PYmhJ$L{Sui_~D<3hZE>cNT4J}ag@?xXa01Cg%!ChP-<Tg
zZ0bFL1E_|61OUV)T70$AaA?bx+X2aL!U8aWY7n}qE3<n8O=s}D?DM?Prszs0xLEMa
zYb;hngU*fi(FYs4GP?u<K!8<#&-mat+Wx%Tme`9!!<Ngj<VEVb#571G?n@A_Y?yEZ
zC{^Pt>BC#)k3QcA%!WUh-2YfMWX@eygd{dH2<2l90NLhl+3FF%3h!e9=J!^CE5V0w
zu#0q{g$<CCV21Dep6|52?`QsoVb}ov?r*y8h*C+1Q%MzpPz1#aie5N^eQ*a=*oPyS
zp;c*>zH)Ho^o0OO01Ti=0=NSTxA3dIF;xD(qomdb_~3I`ITV90;ze2xo-u(VgXEps
zllwOz_u#870Cyw+0$_j>gMdm_>W&L-0SN9xNQRSJ00QW^Xx*^FGk}H^x&(Mz6Sv$A
zTL29J-#BLvB(Lq;K7^C&RKtx03^jnJ^Eh811H(<Y10ce8Bs#-W#bnD*i<XZXKQ$+w
zfE0iL!>tBC^|uP>(EnJL=U7`-BOp2rpnww}wx!#0IWHjZK9FGGgKOBHhgbs;Fo8!g
zSrs?|REaDaaGI}vZ~OKKP1qBrGJ$@W`I_HmXto2OYCiw&2x2i7WLa5J2a0dFtVgi}
z%wiU2Y4E*%YG(*Hqvn99a{#)VfKUhk47h}UHGql_fcEOl$u(9DuwMaS;P)`HlgoEj
z_PG9KH>IrlM?KzDHa-I=fWl2O$3D3))N%x<_`!<>E;igGBkYq)%m%R3L3@A#K)D83
zZgt1E+IHtqcm#&4R-_F#1Gw68<v(gY04IC)!afAh4*kewj}3zWLz{5V9Jn$g>;M=#
z2e`{sB;~qvZ2zMUyja-asq6ST?-4ne29DSst+R;W$}MZg2)TZAj}R9HJ$j<>^wlw!
zkb-*PhmUNCg;3z~_Sk;!f2Uvl23!b*DofrNxKT_~Px!zE=}a#ng^y|&<#TX<7fFU#
z7&Z%uh3$+5M+Jy%v3#8?Xz*Y`XR%@-Y<SKW0ssg&FwA!8P^fSQeLZqS!y&?I3pJj*
zL%{%m2_RRpZ0YhP%$PD~%G|KQAI_XQck=A%^C!@tLWdG9>d&1Oqe_<s&8FfA4jlNH
z@;qnd8dae!sI=G@#@{OwnzEA38m5vHe1PBqswAo`+_-Y*(k*L~Cf>Yy_ww!Qw;{Jw
zFF63%@&ETQ;>3uPO+aawWnh{N1Q>{+_%i0qHE-7K?71^1QlCG6gGbjY*3tVEjc$#z
zA5K87XVb3T`mW~Ox_9T!2I^%N2X}ZAFV45xAzUqe(|mM^r19v|W7@QBy~R}9R^nOj
zP87BG@Z!glFP|0n^z`bDKRdGiJ^a7z<I}I-vby=YVL*h*RvQ{0`I(0rH{1z$piTxN
zxFCZ{p=Te25lT2Ag%w(OA$|>J^~zVa$pMXq-dV**EuMwrpN5`vD3l7cg!m$iIUTXV
zD;L@b;WItlxTADA^7tcWuWWEcj7zQYmOtM>l1^*!BvmAB*9`K58J;O(2W{%?vy>()
z2LGiXlwk^}#s-xDd1iExp}D4FYO?tzO?GSmiI_y;5RHFF;L}5Eq;OJaYx@Ml#}D=h
zh0GdG$X3ZPIEBNSC|hjt%29TNkq(poI1`2)rrAMD7}QXaX;Az01KUpfn9&NVLa7o4
z4qvTCg^T{A1IQ6;;PcHIYlM>%K9y{t1~u7e(hC)=0lI8wLT&*kw2CnoEwwaFTP?N?
z^*|%DK!wo)B<^hC4-KtZ;ZC=zW%tuQAcztTrLVMr(;9_10|GM0G#Z8qPZ6072(Ku@
z=LSyndjyg|wUPwGKREpG!`lgEM+>5?@zoYo^wI({{y4ElHm~4A&&D15(@zga=>O7#
zD!qU}!z(A4oG#5&#bcA1+3GCQd^`KxP|rVCE93@X*1S_cRQRLxXVA!Tw0KYTl2eQA
z!V}I0YM|)Pl{o=Yu_hbrvq3secmfHXS>a;^C+o7iK{Wn!IW{1o93dOOqHKv%4<-)-
z0&H8fYyx*wPzp8TL<y<FGeSH5IOLJ<tOB=*^VC+to$&#p<+kAii3&7qDM|~PjBD!}
z{NdC!PGKM{iYWMiuyi(+q)pX1ZUY7I>S4IEfhMpw>W?Zon1Ev6IHARN%S8Gkc<0gk
zM5YQkOa8Nu*Jqo(_CONte9f)qWb|kDBq2R*@i5ts361u1!Ui3OGgUTX`~M?~6aH+e
zN>~15)6eXvP`lf?1|J*v#xOSU6&0w$ANcrH+&m^5e<aTzy-)!@6tRKk;RJf<`=CGK
zL8c9C!49u@1`1QC!WFWxg)V#{3}Yz68Pc$ZHoPGYgHZ__^00?K{2>s72t*wUv4}=I
zA`*cpESrFjX1!=4PFggZR{RNsqxnV)TJV&dKw@6RQ-KyI7!NIuz%*+x!3laGJK9yE
z61I_33oPZoew|<}H~=FJenmkL<PT*Vpu!Pe@x%@u&Wh+GnoSa^$VD=;k&b*MBqJ%w
zNm8<smb@e;GpWf<a<Y@2{3IwtDauijvXql7WX%S-6Y_cHT!w57KL7T{H&l`@9<ADk
zEXSj}5bC5KyTplU@X-$y%<PqhjK?b=afE&`vzg9(CN!fd&1p{41U4A~HLGb86J)cS
z-uxywr3r#?lCzxAOe8nW$xLf*V4UiFCp@R=&Un(3n&^xtJLg%?eMVCa1Z>c;wvdf2
zOf4Re7?ywbfh&+b5m~I^m9KDOEQjJG9hRa7S*}qfW6tJVUNWR8R6qq4tbwB@T^7;o
zfR}B-?W7A5;RdR=m+!e$Krof5UT9j=(JXUDVc5bxXrM6~xabH}h=wYt;WC(=U>GFh
z7*3WNGi2;T1%RLh2y&^EK?Gx`o}mUSt=Nxj{L-st6;L#6qW>eAurz|5O9vERbW@e$
zMW=~_YnbMm7rUO7E(jAAHJm^T6X4_sw7{AydqKFR9j=0kEu0`X;E9k9k12d8YhN>~
z+0E7|ts7YDOWKOQeN+}okgy3|*=m!2LXEU_I_(Bh8xxkYma|zoLhUq>4MlZ`sP#*%
z^E~L-;Hp9uDuA6R^vD!5aKpCFeJ*qv6c5Vvpm8k`E&A{=wa%(lwJnXFb^+yC(1z9~
zZjCNga9au83Klzn;MNELu_f&imv1IhrQp&5f?uU0tV7{MiO?(H0TZ}Mlw%xAwsnN_
zM$a8g>+FH8dtLLQ&%w)zMuf}z-2yAc3C3bCK4_r8F#pgA!yp)eAcNajK3Y)4_v2;@
zoRJl141&WpzA=uC5|0@nxFLMav1_Iq(;BVhdkhA0XN0T*B7?-pNLCw9{7V$f62(bR
zzA}~zd{gTc<j3g4E3>xTWF}e>%*zt9L%f{jZY6=rYko7FO^W7os9Ach?Ur5<QfJHE
zIn30PZI{U$XPWV08iPJGqB$z&J%e|<>4L3nx3Jn*hL>iLK8U2}l<01?LNuHHG^i~H
zTb9NZgchzD(bkGxL!O#usV>N>Lmj4T1W4AlzBQm=yJ1|%WxSNzHLtVcYYGQDM)){i
zv6HRr{0Iq^#x!%yggm4pgAm#@llFp_4I@`-yZ_tXPIRA-CPEdsG~Cfv1G&GgAxU&q
z-R^!jk}HikDSuGjP@^}z!&3`M<h$SgMsKVC9h86ze9h<BXu%V%@P#wH;bB6y!y_*7
znpr#I6`weV&2SEkbG+k4GIzv5?r{N2BEa6k4oBfpu935x(vF_Ey<3jnVDQ^J`{~as
z;n4#Xgh8t^|2fnM9&w=q-L^;x4~I;uh6WbB=}vz-%iHXoBjLmy#mvSxqSpc@xkD3`
z*jqLrkvXW7eL)v*_}R<uRX(J~I(N!OHq<ad3(~4{V@nb;9(6cX?1Ku*RXgCzBl3n1
zKJYFjMJsF$F8|H_ezmfk3UJ^)CnyLW`TsLK=EW29h;KggC!I#E#gmQ3i{kOp3qv?i
zg^w-Z+w-oU3(*@M`w)rmORo>gvBwjSHS{1FwCKe*oUjE_bxspo(Zuh=(1YIJzWL6F
zS~$`z6nQ=0ClV`9CEVP(>{ma0K8H)|#e++wj6XbSkBh0w68^KEpFz<t%K9@u2+noC
z{y<TI2_765>d(dWWpN4!jKxp*pBj`@coZI7guw~S&W3mqPB?>t&;Yfy1_Wvd0wM^a
zEE7(M0u^Y&mh1y0I04Qn!Wy_yP9RDc$c7?}o<L<@JnUN)c}G8dA5fH^ozbBEEeI{>
zUtGkWP;7wq8O0h1picmyPS{{~bpPI5!~+9n1(+Oxqe)<QK%s^x;esfZB6tG1kq$)-
z3^nKi1Px41V4)V0OMKY@pI}}vSiuj}+)z}YT;LxM?gRlEAkC-<PXHhh=Aee`piXe0
z2S(M!utqj`f-Y=9Nv$9tv>*wZAlI-Uio8k~FkKB|O*W*%RJ_74poJ%FU>Jk}E$oA@
zeBxBxO0Hzb5dPsOhN2~6Vn6hXqoqR_IKfzmVmOc@Pf&x4R6;!HqCfCrHn@l;#6vL3
z4KWI1G|VAcu;3bO2@~o>I4q*B$c+dx2|n1tH-rHdWKap_L^||<CZvOD&_FLN;w5SV
zAV9*a3<U^^;3Z-SPC!C7wErW{ePcM9#{G2QKBNOWs^doug)j1AKpvwp7UM7)WHJ^>
z575c`;Q$qg0vZwz2q*%&;KVSbAq6ocxzPY2N}u6L!Vl1&P*7q2DPv9;VNM_+EVV|L
z_(Ur5VTkzQ2DSi2se%c#(Y#<4IBw(_@<}v^Ax_XhPx=GJSj<221TxG>%23K0i~y&6
zg&M#Nrx;KRc)}4Bg2#Z2$j}QBMkR;XK~jEJAX(5BD2qSD5iPU`Razxh?gUbCjXS(0
zMapGdHqcz!Wkt$GIGBJP^nwvSV?~+38n{e4q$Mp-ObBg2#h5@k{A3#9!x4Z$3mgHK
z2qhq(AvGw_kf^}l`Tv9$g5g<G3Os;72KB%f&QD}cCYEqvvSel$Y-VQ)1zpZ2UeYF9
zLdgdB2QrWwNx=@&Ap;d`0FqqfN$TcC#?3c)q~Xay5ZVejilhG+A|eW67_f#Swje#C
zh)jASDDFcm3KJ}P<1E(VD273E=0xqCj2yHZQ49m9lp~$UA}!{`tHg@_C_>$FB}~TT
zgE=Hb@<~<tLp0<h2I0e4aO50WBt{~rQ;bdAwB%5rq(3A|lIX(C{0b!4fdO@lCX`g(
z$kIz*s6S*VPDrRf0D`h)!wBGnCTwH;$c-Iph#j2HUp67G;KT@|LkHq$Hr&jEP6ctw
zNECJ?HIUl|g#UvRU{p}3!bDai>2OU+F)2j~X-@bjW*RAyDyePZKsfe`KYZfJ_=l2K
zLK+6CKX7R}c&QX7r|aS1PC%w)Ql>xXq$ZG?P2!{(UM8P>rXFplS8_^NE+tu-C0eSb
zVzQ-C)It(C48vG~6_~-IY8+9V)@z0VVHK*26y?P{kH$dNgzn*fBFJ|3rYP{;k@|x!
z<fQ(sX}XyytMU%l9A!^P=u7&;Fc20|YA9zwXz?76e%dOo+5tS8D2hgv7tsO@7!Zrf
z>VfpYTNuz(0H(*dQM;rA4%7-wN~?nE1WA$$a;iXJ`2%4k=}-Wta7IzgWSu{lE0T08
zsU}tajQ^{aa@H%H80a|A&Y8eh*Z~+xk*#ik3CLKzj({Q@r$4-3s1}x^r6oQX=vj8+
zfRal`O5~K{giMMkiTVSvrs#^wjf-+<jFKNd#DhDSff<NoP(VU|oPa-ofQqsx6*#Ee
z^xOv2&E5QJ!iwsHf$3PCr7G+txoxMnCP}L<=(idW0x1wqL<6Yq#0g;3RMhIt6lT^a
z>&yx$PAJN+PAx5D4Ng3*1I3220MP$z0VG&0goel(r~zbdfN4nUBH}}Ero%yv72s&A
ztzzVt(#ce?YPia)Kfr?`l+~D~Vc4W$;kFLne(6_?)!%x|ymFS$>5hM;!|3R3&Qhtx
zKL6O*{7R}0Et{@ua3YCJ-YQNAYl*r|v0BivChM*;Yf+p-a~TCBR6;f=4G3(E#nJ$*
zDuV9-kMQ7Z=H^G&ngFHj3I2VBC;+S~+=S3dA;Kn5zz*&E!I2%P0ll26Pe8&5oB)>8
z>X&W+4JZ@ZV(%TbKpxQx2ry>&j<54@ulL3Vz`{n@yi7clFN{zF{M2dO+>Brn?FJ|U
z2*5);&;SSkPY5-kMFOmhtt&Q_3-p3(yn2j(bnV#X1ixxgtpHH1WU#*?!vo`M@;<JI
z9hwTH%n5AG@G5TD3T+GgEH{BJxh3wLG7Z;ytv`TmcC0Sh_Ji4?E$og)?cQ$7_W$q?
zA5a1<Py;=X@UHNJxXpPAMZ-=-S-!>yNZCI4mz((#Q0!6`|3p9d;DOBGPcVshZUCy-
zl2YI!Q3w`LfQjxV2v4wa*xp(?#O4ZvaOl+VA2RPvL@-hIYpoP7rM#y5#$)%w<9nF^
z{k9Vg-0!YpuXhYF?#hiLbBFbQg;S_N9jPz-I`Jzx1yo2y>zHM-eG3(szy*H>{t!hk
z7|aBM^1spXn+k=Ld9i<mF^uRkutb?Gn^kG_lDFZ53XcY=hz}Y21U(e<FE_I@KeMeN
z>`urbG*`1VU$d-9GaZ^FHg~f(f3sQfV>+&*Lfy^YWMH}h;@$`?IJdJqzyC7`xh8C`
z0Tkwn1(`q=ZXr!3%jUwfKmRj8(@c?SERsfpuVw>bE#$$Ho0X;^I|npGN3=u>2ni<;
zcifBt8K*zIYd=r4M}IU(*9Hkw!x6YqB@hXkdMVFpCpU+*OTRQs69oxpgF%mg3B=97
z-YfFztHlDWv&A$}2enZD1ei?jP#-l?C$&;9HB&dWQ$ICSN3~Q>HC0!&RbMq$XSG&u
zHCK1FSAR8FhqYLbHCdOnS)Vmpr?pzIHCwl}Tfa42$F*F~HC@-WUEeic=e1t%HDC9&
zU;i~=2ex1jHenaGVIMYPC$?fQHe)xoV?Q=zN48{7Hf2|~WnVUCXaBZlZ#HLlwr77f
zXot3Fk2YzSwrQU>YNxhpuQqG9wrjsOY{#~2&o*t>wr$@wZs)dc?>2Auwr~G7a0j<=
z4>xfaw{aggawoTPFE?{Hw{t%?bVs*zPd9Z}w{>4Pc4xPCZ#Q>$w|9Rxc!#%mk2iUj
zw|Sp8dZ)K~uQz+Q_q%mNCrrXESc7}lchSwmJmkbAT)`0ZcYm`%DdYrx+c$wnTrqIL
z5I{jGSc4c0ffBF*Ba{Loph184fj=+;6bu0yz(Rp{c)`5`e-D8eSObF7!7liNJkYm4
z5JQ9afi#5p6{xs}&-l9qf`69+8w>#*-~=5g!4O<QBA|GK$N#r~PXdh}xw_f-5O9Gq
zEO|HhLyr6R5Ojh+SOXMrK{teWkRv&lFB>fM_ar33l>0-IOZk%HgqZKb9`rYr0|hvM
zLq6!lo5#6OtOGdc15U_8F(|`5ym?v7xtzoKP}n)1qxhcpIXI9-pT9$wH#$+s1BJta
z7$^ZTT)3I{_mdaH5Cj4yEO~wd1%J1>Kdb|$4+R|zL8XI(fA2znr>9YbdQOn~5Inh1
zoO-ISdaEl1IIux}-@*`BxT6O<P{>0cSi==?0ZstJr9(k}cY}_@0<Z@~Ck%lW<U}b@
zJ5h839nklei$O8e10C!^SxkGi<HWU>yHIF5w~P3<hyVLh^tU{aIUNMJu-7|JyhABu
zxfta4JcPJ^@3=pJgA(k4H7vMLltX_fx<52Hy#vD}l!C(F11u0jF-(Fr5Cbf{gEgEw
z8o&ZSzygOS`@={4#8<pElmjd%!%iUl5GXvui#){Rgv3+4#bdn2bG*lcd`>7sCv<`}
z@B>cdLor~2eB*?#PkA|@yvpN*H1vEi<OIgg!!5`+(A&FxcS3^?fij2z6exU_`!^df
zx<9b`9vnRzU_wv~xj(!^e=~X?NcoA&dViOKtxtlK-$Smy{i=_;l$V0Ci~CNfJ=+g~
z+rvHI-+0~MeXiTRe+L3iM0tM)xfb~ME%-XH>;HX!1AdPCc!gWNdvCpzYx@wOJx;s>
zEHHwR=R~K6xs<cP()YwF{J1|{I~$OBf?ETtLjga?dLU%Ht-k{!Y`Qq${Sfp+lS2XS
zC;0C7ckjPLH!woT>qP8d!R%|e?IVBgFaM_dKB@!1@DqPOu>3AqgO7KEIIsa7$OEfW
zzq6zIJy^a!d^r^C!Y=suEkL=5qkMmRetSdye**-tA$|PGyOoFzn>~z(`I{$3i8V1p
zC{kqO4`arR@+fwjc*|d>AzWa=qF8Pn#d;X&3~4A5lfQcu`-voJatKP58hK*mIK<-+
zkTy%6OgUtwzm_kD#GE;#->#89^<mUk4FA)_As8vj^LJ~Yzdb`bVPq7R%@9})De~+2
z7H(X*bLrN#dlzqBy?gog_4^laV8Me47dCttabm@b88>$P7;<E}Tq;tGn3fHc$`!ew
z8Hj1~)VOI|4!P%V62&X4uXH<_acRh=GHIqB!n*Zqx}+(dwvF30Mc6K7JEgg5$VH9s
zt_*=PcB{XxU(pK1SSq={v<;uSmHZuic=6-Omp6YNeR}ol*|&Gklk(<0<ur%hJZV?j
z%3S11rML&9VzT207G?NJNr~Z@G7c&MFCx%D1T)e{p3{2rZwLVWanK(K4;&&vmWYFi
zwgxGxiVZH5!Hy1p$`MYwA>N^mp#Rh~OluPDhA5^)@80_n$RLFrlE@;BJQB$ym5eLC
z&6EMAKKm$wB9L23QGzqMo+8eld?=!$B{BMuP{ajG?8nO?z#KwMGW`)qL!P#5sLL<I
z91}zZi#t=F=AiKG3Vo!4qLcWl!jcVOz#^y{inM4>Mjd(VZplh5y%f_-HQkicPCbpQ
zlTt(-b&_)ADM!D}*dPW{vS1mNk-7Q+u_}zL(c;S)-HZ)82K({n)?EE@6Hd5hRiaj4
zaaB{-Jj?W_*E3zziVkZ!oOK{vrSS)}AxZ%&5L>kpqZ<)<Ow-3t)m@j}cHMm!-gr0F
zVh>nu!6czR7*PhCZ!0V7um5|J?MvXo3jQmfe0b7lV2tij_^pKHotWZ^Exs7zj5Vgq
z8q4~?WR+JZnTQT)u(Yg{ja6Qm<(6H38RnRW>{!Z*N)f3dB~q4|=bnB38R(#e&Y0$!
zodX7EM~7aT>87228tSMSvxW^Yt-cyeHfBtEh<T*`8tkye9-Hi@JHaxMvejOj?Y7;1
z+tPQ+ft&8S?Y<lDy!GCj@4o&18}PsdADr;Q4L=<5#QW|iU4DL*%g1|GN*6B1-+G5~
zo-9|K^Ugj0obEt|00$#tyoG#-SaEJNR=Lm+gQsqlX#K6uczP#o&~@LP_ugX`FeZOy
zol&k*l<`N5E6VA|`2V?H*Qn7wfSL99+R@;tj}U#|p8M{-|CApkuJA{n?26Gsi9Sv%
zMGHEhkcW#-Y!fqn7crY#pH85dL<`t6YP1jFxW_Ka)rS_%gCzdof)*x0sH;$f3-{mx
z9hA_Cd;~%XT%eQw2=zS=eh`Eq1kYKzVY*xNLkVm!Nvu-C21f8Bb;^Lk6>b5;SoPrw
zu;2oJz`}^L_-{D3>BO&|$B~p#W)f$)ML8$~i>K_%B&BG{JHRo7M5G27BGlp*x!6U$
zbZio{x`#9dQi|1}CMO+AodO?}IxmT#6lr<K9zvu9AZDZ(jL=Mup7)N^aUnq{1W@*9
z6E5xOED=N4h5tw<ft}oW5t5OVq!zD$B>=&x6PZNgX>7<wH8O%DV#s7C<Uv7<*ij?5
z5X0Qw=npjT=S4?^!YNxs$e9EWeWSF-Ss0PYT}%>~!4&51aMqA|WJnrUVBruH)=4h3
zF;)vy1|86#53o!^BzH^+920rN9i8QfL%^nWW(ACy01S)#D~EtOu?r~ta+vXy=R5)T
zB4l9%7FZI)I?z}ZXF?NL&CvpP&a%ThenmffIE~2$ayl{WFm<N^i)qN>leAQ@Ly62#
z=IGf`kA4(x5Yvl=CL|Y;mb51WJE=w*wmFc#6s9qi=}c)_Q=8rtr#aQ>PI=l>pZ*l6
zK^5vyiT_$uqaKxI{ZQ&Yn2HalJ{2GFhzC@i%G7-*^>Ikm>Q=c*o__4(sZw=^I?hp6
zZk+WRX}!iY*s9iRoE5IzDC=Cyst&T!^&D|Ut6JIGR<)jWuIg}yRHurMt9BK!iQQ^H
zoEnd@nw1-CeXCsSI@rP*R;lLsYFHin*t|w|8k4PTVfUd})1G#ojE$;0%qm&RTDGcL
z_0(pg>e$wX_O*qTEoyn&ThFOB9%Kb=ZmY^O;IcNaX_c!wq>7K-`WCv;g&SCddycgd
zx3pqotZkF~)^oVSu+kOpc%24T)<)L5gLUrS%-dbL4mP{wmG68p7FDt;_Z(A=@8P!F
z-T!ki7a#N$@PIePSk|WXzf<*|eXV<q@2;1?5tguf_7U93%2mN$jB0YZ!QA~$7{noN
z3_cFr;dp#Fm=#vXg~2Og7rz)V_DF7i11!@Gdp91>h4GGgjE@yNILABfhm7B<jvDhA
z$sq1WJR+N46eEco%{YZ4@(>3%fB_6x(6SVypk*vz*$sKfgCkCn40k|n$=2nDJ9M06
zH~V(Uku`FX_K}QC<N*v-AOaAE5CkGr;mdA_gO~|{2uEZh6OKRxA;fIuEEj<YLFh9P
zqyPp&d?Fc4+lM>O>W(MB8Pr{6@-;ktq-tcs4OIvN5GW0XJYf3FgNgE;v7l;JOaI~3
z@DSRjJ00r4eZmV#>H|D|jgfs=R~?^rPd`rK1}Ov~2vTqZroU5XM}VOStj0nfei5`y
zJNU@O#@jDU0E03d2|H}qS*Y=G)_4@D8ibGn5Q^Z2Oprr8$v^}cB8`PitW;)9=0>>1
zT{jcp`$+4UrLX&uSAzeD9C;{05U_xVSpO&)d8h&qs(^@x!>rxhP<Fw~#tsl*BpG^G
zL`G6xjrYK!MQ_4SM)<J`kA4H^-`LA@nQE7G<b34rxW>DCA~C{{qs@6~1{Qz-hFm}<
z>3hkCBjybTghyRdSf2|%uAvT+!)+Ei$Okznkq;eY+8;Ea2MpeG#d742AO8#Y2P4Ku
zPk4L)33=BGJ~q&kGpNBXddPbTW)YXN!etSwwgh2<K#0GP0}G7@xLmR^j9&PqAHB#b
zSThoibnvAbU;u&}@{xzZ<f0jp*~c*K5)WhmX2t#>x?E-t7<?e37oU$y?fsDrou?-o
zy!VGYaR2eI`y&|}&;h>5p@UyF-ybV@&z1I|k9V-)k;v;PIR?@Pg5-rA(b0$x?NSQw
z1Hln+IlNqauy|Q(T`r#pLL5dOm(2e~w&@5*=XK8)Z(t$P5DqYW01s4;_3Q%vwhpf7
z;_?XN8~X1p8t^@W4=#|w_>S*!;6VpsZ69>NA3X3qA_oeR<)DU%`~Nax7-%63dI1n1
z0V6~q48njGUXTi8F#N(H2AyjS)S&SEVIS522g4x1(!mbGfEqNS2-2@7;^7?VqWv<0
z9Ke7HMgb$>ArF{93aHTOu<aCLAr3O32*AJ}Vu8z2Zw$XM3^9To;s6V6;Vp6@2%gR^
z_8}ayAsaB_{xX6N?GPi}ff}+QyS`x`_%I%PFC+Tl8vwDiJTDz6@EZyd9{`aqszC}U
zqTAkr5SX9{2%#Uapj`YR69{1+B#sGet{Hq_44UB+384t$03Mnl4!|G|GBE+S?i;A#
z0O27U`mYhQVF-6oBk&;+_b(mrp$_Zs9HxOA=3*auA-rS{AOF&U8e+{I?C{+Lkq><^
z9R4sP9#A8ykpi3X8Ld$dvtb%B0vqoTFwy}MDKHYVfgUoV5r^U3_VCCo@c8Be319#Q
zexVG=!3$JQNW=gWE}}*931H;u1Tg{;N`MJI01IBgAI=~L#y|>!O%ZH>4aUF`!Vd<<
zzz6<7ALf7wOwS+SK?XiDB==zj#$XIeAik3DEkw=<-ESX?pb8uz2&7>je1HfXp$O){
zA65<92q6<#jSzrf6v!bHf`AG^5h;~YABZ3ciNNuCq6nTc7~!HBzkwbaFb{oj7~ruN
zDhwIo;Tv8r^N;}^hJmT#K?1V@8HOPmqQM`+p%=2j9se$`7pMUlkRci_ZZ4Yg6W(GJ
zlyVfPkjpT_Df0jbWFZq|0Uvw-+Hlez@*oJn5DaW#2$*09Ce9b`!ua4a9o&KSh_4X$
zFC3yFs!Gck?GhtM(=`1d8hRldR+BE6OfK-DHtX^l^Rf<m?<@_m7m&dnqGA7hFRHq+
z|Kzd|zkxS<!8iSZ9<pKoFajAK@httJIFIu>>%#c_vNr87^W0%Cf5kVW;oXoS9N;n|
z@G&3j;@ljg82Cvr+#(-nXZyr24u)V3QU?g)K?XEv46wi-Uf>F>K^cl6{Ip;f01a5G
zKn(q%K_3(gejy0vASo}=A7rv82o4^!G9#YQAOB{-KUpymPGJc6i3x;q{y;GojuPKC
z5hIA;DP^=n3E?oSf(fpYCmg}Kuu7?{>){d+BfwGuag#d-QTNI+^M)`ZB+wu9uk&D2
z^U87>(*XkKA|G6?Cz@dhq`(dR0ZhGN6oSAXC}9XvaYPHSMmG@vZ6OHyVF+TO2*y-%
zgcPfYv?rqB^Hz^G_3|6+5-!6btLOnXY4cB64>|qe_Uc0Gr1TbjFvrSrN_EZ|r}Pfx
zQZT*IA2P4Be(p$l;x>(~0UMD!fAKB!bWgA0;iv%~8WA6;0abgi7#lG7zS2C0As+n!
zKI4--?x7sY!5Y%XKDBBg{UHv<z!nk&2>(oUMzYKwlrkg2uUz6l3NQl8)DS3?RSFzo
z2=E{eu0R$t!b39x9=t(a*Hv8sFcUO_L_Z;1#Y`6RAVhq?Mdc6_ivS~fv_@}~U;Uv+
z;~-#ZlqcfBtr8X*pn>-Sb5uW70%`R~_dz|evr>CPN~shhJnu;F&lj~cFqRGovQ=QQ
zfC=INBXWTWfM5(T0$($N;t0(a_!S5`6i+h(VG~xZ7MAxi6(3kHJI#~mBC!{AjXD$6
zXBjoX_TlvcLsI+iXEzp8`%oR@p*CyGQ=|4Se@{y9@;Y5FHtn(jt8oc+c4rxuC#WGB
zi;)__;rG75^Nx@<rD_<=v($X`0{^8;6!OBU{(>FkqW+49H6X|<=7OW(;#lb^S>qrM
za)D-T0SMB87GA(WfdC2K4Ijb}Bd}FlCscF2brpbM6?S12%&<e1Fe3<o2v(PMS69-2
zz(+|m9fH8-qD)02ZcT?$U%{|nuhK>_f_DYhD1%@gz+eb`lrFyOEsV4_e<dt~GaJeh
zRq^5S!ZJ!V0v_b{E}PV2*A_5h;cq!pVPatjfWT{V;WQ9o2;3si9Ks(KQy*+$W~bF=
z??QR|G#yrt^|CR*YAhXK6Hzn5PxY5Jm$qpEV;GLiQz5p(@{&8L)=@FSI?+-0Kou_4
zF@ZIrRF5>kfN^Zqu`cd6ZU5JHRv#5_>EZR#p%+ffQV$Dn1xysIAPMkd5lmnM(2g%m
zpfIbj2mRp`XaF#}feVOjF4V0qQi6CCmp>bqW@o|!a$pF2KzNGa15BU{J{J#277Sj%
z1o{Dsr9d8(pafK)AI%kY=R(^4c0|k9D|AxvCUXdgpw@IZBZAjo{bA4e)s6`vABf;H
z4c0GyHuo|(^M*m^m^Sw`uODhN_aGKyhoOT1Qu8>LJG&QT|AG*pEeIyGLk-j)z(A9Q
z(jPE%)#ia6_6!J^V18@%P5}ch2N@%xVHn2JAHHE2{*vgvGJ{_^9bS($eei()LWPH6
z{}#CSr1O6tc=+xx8vp(h83M5v-13<H6gG$XI`Q%V_fk54<%0o3ZMAe(kJ*7~GcPI7
zH2<>3a4(p}OBBrD2h2b(P5_7ZLNI?p`Y_^$0b_3N!iei4iIteJN}?PHB0<hVg$Uvv
zDCi0%p?ol67jgtz#HSw`+8-XeqOYKTx}mntRW9H`jpsrDDReNr!He_3DH$WXn(+|z
zq80-K=`z9_fZ!7`BBU|G8+?QvTG}v@F1wCXF?1R*q7JBml`ilh3F<%*=7JscKnJD(
z?c^C<nR*JkE$nol2g@KCyg&zjAsMD%3cS=EDB%REp&It#hfhHV-oPLJ0Ih#P2Tp-7
z=Aj^=AY}%+WdE*%4OHkWybpR9ferd#9$;aS^xBKUPX`VgE&whc4%aRqMhy<T2;TKa
zGI`=ib}{6#@{D#!ykX){)=~gdmh+aVUuF&LfN4!?1>SlEb{MLC5C&-A6kuQx*kJ?y
z;14$7Z%+UO-arQy!5wDd1bXlfR$v48F&R!_16F_%Kp^bOZ3B=11OtN~xIheUfeT6@
zAFdz~OyVk(pcsImA;1AFyrUe_M=HtzgVb#Z8b*ZjA+PgVGA7}@tp!N(As4*nF+{sP
z^5GOFkIn*jv|9!ovWPA|;p9G$wb5=CHlVb6`wu`+2mZhxPCyTQ80}V|hwV8dP5}hY
zOa~~TxBr>itp`IO+(O-?B2=IN7^-Lww#6#e7b6nEf0O{d{U=fa9LICKF_6I#7+WLC
z00}T+wK1Z#nHnQx+Y6=uBc>qOT00{!JR>w5pMm%TLHrl=Ko3S-Fec%8kf#(@fv!cR
zT*P5kG^BjI0}XOyCeRzAl^}6-9M0n$FyJ8xx;8F8VFl=+3^srgh+M%<03P080~UeY
z-~k>?pxc~W$a}aNK%lhvo60|YtFc_m0|QF#AvH?jMarcd-k}>7YQ4z^#{D4?*x(-0
zg3V9q&E=fcTiq_!AgS#F9*8^dDty90K>GFp29)o^{Q(I!;JN*rCw4u$bpQlF;1kdq
zBmX4b7xdr{DjhKNfim(sWv*m~ilG!{2nuqie3T$Zx<NA-!OgEo)m`1(&pj?mNG~+I
zCy)*v_Q3>tkRE#VE(~2V@SEoFy&&SE9QffL8il>lUEl@27aU=z<D!Ojzyy@MUFhHn
z*g$8vs2wIABPQPB{lVfX9^*59<1fDBDL&)dq2fJ0<Ud~IP2L}tVHr-o<VzmqUB2Zx
z{^Ljf;$fcSRi5QJ-sWpw=3}1Zf1c-op5k$y=0U#ab^hpsUgMMA=!IV7iGJsEUg@R2
z>6aeqg}&%Tz8zG48L}SbU!Li;p6R_l>Ysk)zdr2I{_3rM>WiN2J$|U%AqmzwF#qa|
z-rHp!tii{<Cj<Ik5d47z`aT0lz#jxb@H4;^{NeC<z#qEc@K^ruyTBiK;PBhQ6b}FI
z1HbPH-|z)L@fTn5{T}cIpYsp@^97&r9bfPvU+^WL@&(`WF@N+ozwk{z^!uLi1wZpi
zzxF-<_A?;$AHN+UfATB;@^ydq2fz3G{`7JG_IIE5JD>S~KloRF_*=jDVgL9=U-Ok;
z`VpV{LtpZ{KLh+>`@#S4OW*oIU-kQb>xuvM``-LzKmC^<`n})w*<bkK-}q&}`vHQ4
zKS3D^W-#T?U<MuuGj#DsLZLrX3K1$4NYLQ2b_yAGQP^&o!iPL0QZy*2VgEsl2K~8w
z2{We5nKWzKyoocX&Ye7a`uqvBXPrtxiyA$OG^x_1Oq)7gx)Kh$8YHULKo_ZM)kx^H
zl8Ay1j#pRAyh@GYm04D;QmI<S>Xob38fnm>KvBaGx+OLGE<v}cZ{JN*1=lqsxCSp~
ziS?#Q%q*~Ay?p%wPE0s)-Me}B3jQm3aN)j(6EALz?y=y=s4Le1jd?U(yLc&ozAQMi
zVRVQEpPrl=a_G*kVds{;8HH`ZxJ4&6-uE|Y-jI2rR^7LG=jVVqFMq9F_w?S;83V^&
zgEjEt;gQq+el@UGxpU!aCF>QeSgp)lnMH?|R`yjTl~-3~RnSukF8|12gAV>=O)(En
zNMVH*UWg%78KA>qhaP?iVu&J+NMea5o`_<KDz3<4i!QzhV~jG+NMnsQ-iYIh31-M+
zk3K&5OC~=KNo0{m9y!x8uH?vMlTJPfWt37*NoAE*UWv|*NN&mHk>MoaOqXJgNoJWm
zDT!s8YOWcUK^=5q4vSQ!mH{&$nv(%o9m3&e8ga^a*Hk31Nob*lx~Qd@iZ0637N{@^
zX{3_&SkR%CUMeG>UBH1t23)P^!k}r?d1sy;j=E_L4$T;-A%b8EYpjJv@zA8UF2zrg
z(nxb_ufG0zRHd>GOYDby@`8>ltGZG{2PAOCDGwwtV~7hKp#OkusC3%79~|c3sV9e{
zB5O{kadsOgFKF?AEINXq@D(=bY$H||B%lBw5ALEM779z!O9Br|=v!>T2D1ok!aiMb
z&yb=Bsc^&+Pb}=g79YxI8gRIffnGHzR~0%Rxex_29V|f*SlW)t3@;fh@lhn;o|-|s
zQDkt8%P@Ot7YT4&YmOlq)Nr%DLPv2kzAFz+kkNT2eR0%McUS{M6JH$@9YfH;Yme0=
z5f0X3j}2+XQ=eTWp9OUgMV#A25=93ae$?(Uf|R81(#(viah@}GI4*}b3&S^`QMml-
zF?OmNr>fiV(80GEC@pHuUAcfxN#9<JcIU+=N_NDs?Ef+37PEwodg@zt5w7R1H_4|f
zf1+a!2_2-tvB(*0gN`th3(`T}l{0fQtz8)Mx44$um4P|McX7P3uL>iKIo8Hm5;o1!
z&bi)pVa~WYoWD-~p`feoYagY!v<@*Z>C?$A6Dng3`u5-7U_1Kn&wu&;-*_w!F=HXT
zh=@5p!n;jm01gzniry5MhOEfURDg2`97<9b2uiSaD2N2S%z-L`U`}X#qujQ>*QO{e
zVRHX#VVcf|KS^<ce%9DSB3{A>W$dAA3_`^yVhF?_0%aM3h=@XtSdgo@aEUDnpocy(
zw3;E1b{xA`<mSXObF6S7+ejXrR?-FDX|W(Y;QyT|IEDgK(C%g#aKSOqfsGa33tw0y
z6$&u-xP{z{iF}L_427sDI$U8A{;<XkU4n*tbYguBaz+x|0mw*7QYIO>h*!K~wmxcd
zMO_>bHfARxbMTHuqWsV(J5)*!ow7uNIGo7{w#iu5h#75|WTbLc$V2*L59`2$G8ohk
zD(J$N#1x`PR?-GmjANP1Z00yJDa&Za(q#rwqcpGSB4wqqn2VA}A7%)PT@WJ>fzSto
ziqQ>js?&ZY$-oSh>CAX86PnnpXA7}m3RBq0p8Pz~NY=TiNzCIxmG~h*4?4DXHbR~Z
zeddOiRIG1d;~2;ImPId$(Tr+zqa5w1NB_++(TaX_q$Dk=M?-4Tl&Z9(C|#*bUz$;h
z!gQn_n(0Mbx=~m$Lv4*9V>=KE$VA`(9zZQ>#7aT}cs4YiGZ;rtqX5xZEsl&&jjB$k
zLe)H36;o4PNL7c`)eN*F5;fQ=SFy@At%4P+1sQ8uiPhDn8Y3cBGb&E{(FtJiL?8OV
zWm4|Zu%&cj2xzdYVSClir7E_kEBTbA)-n!bJi!=FHOR9t1zE{bma!SQ?4>e0*~&H+
zvsH;~XvZ;wm9*|qpfv_(J^R?wYId2a?d)m|)mmoG)ggzi2{^bg1V-xQ3QAzZQufdX
zrrZMxL)b-c-{)Lg=_9(fJf>0=%l}Z<rdDxKEmR~dd)>%3V!OmME0(^ylJII5XXW)S
zc%8Xk?wa>X=<Td}$6F9)^ar=^)h&MI>)!Oj7r%AdZ-DJ9PgWFU8PAPLDTV-HSo8!I
z##PEa^3fD&K=>Wc)dw(c@k>d07{tVk$U?D;U1KQoW?z|alw8rap3dOJ@>KCSSlnGK
z!Pp!!rg1!NjAIu=X~#WoD3EO{<R=l?oj#6dBieA|p(R<#QD{ezYrJA4r)kMEUh0#h
z{MId3`N|CKsX!X+5@5hW2@sYaPbdtNQm_FNf!#$P=)eenzycVUKtm_=(T8sAVGs8J
zbRVJ%Xh9R&C8eMP9fYfsN&gH%3=Nh>Ic{ZXVp4<zDDLz!jZxbSOc_TA$^a{jL0J@o
z+90F8QK?Uz>J*2%)i!!Hsyn^vg3!7~wvIJ++hEy!QmNOfp0$;T-DzO2MA%b8_EJ}!
z5;Xe*7(=)M6w>+T3j3oJSJ(v`^1KQqOkxsO@JAn%K!-pOy4sx(L!N>0ZI|4G-R|~B
zBCb%1K9G(l{Sd<t2-(|RU|1jG00&IU!C^89{3VxWc*5-$k??w2vDzJnSW5OJJE4~Z
zP@edw$7}JgFgr&YN2bR=-qeea97iSZY{xxbag}ErD<(g=c1bYS96PDy9Je{hWxjKo
zyZq$hodM3_wrdyh{Qu=BHnX((afKnkVio4h_Di_HhJ16uA6MvvKa^4KJ`~m(x0ttt
zFtP7M<k=r)_XpbZF@#@sV&6Pj2b+0lR|(%k9{I3F!n-jKY1D&EdiRGo-0Tm)3*LSl
z$pFzk{sh&od`2)n2&kL<_{iIK@-nKtDK7tbXKG&LIr2Q{L(k07V;o1O?=tEmI}Rg;
zne{jOyz5b~dd|nF^_aJL?30-E6!G5X3r6#Ux9-=Sz}Y2GP+uuZp^qUL{1#!y#7pMw
zlDWG??eZQ%_IK!ge=vgXJlVw%pb%KQ-U1l%FuYz}QjC6-qv2v&zdY{I4fnxc{`5~B
zL74t}OT`McW&aMY5PT!z9|qBTs5gKGQGf?1A_-U!3mAG0*gOVUBNCVa6!>@+_<$K`
zL>m}@@TF`IWg{BMfhXsI7)T>1ID*Y&3?-N>Cm4b$s9330E4@_@Y$hQ;v3$Ek2mZhh
zymAGr01iq31?Fab-S>Ulw|3a)4|6wf-9T;R#}j?9HPU7c4JQry01g9XCf(2tw_tGo
z(1l-UKObR(FBn;rr7B+$BT{h;1@Q!I_+xHpTXBdEbC>~jXooO}hj0iZa!7}N2#DkG
zhPSmMgxH6M=wAy(6*|`<JGF;H=ZLqKh<eC}et3zE0EsOIBa}FYJ@<M&m4k=H2t%N4
zJ^>3up#KDV#|2P;ZrkRH4`yy&$AnRscCM%oP^f)acm?_f6!{Q!64qPb5Fz*Q4(}ij
z)=)o-!VkBg56jq$&xk$|;cJd4PXsnCEV5Gt5d}`AjZRiu-MAv(m?z>mj?Ki4x;G-|
z7>;W=g6-&yY7>v^=uDxeL@QExjVN)BNRQ`ekLrkzv}F+cs3QGXhyO@)#?V>MRSpnV
zhDk9GewBVl0ay(aZ$M!U5Y~Ukn0yrSa7O_SA$g4%kc|b&Oyl(g?SM3`rYr^VPAch4
zEa{SxNFp)mP7Jw@Hu;h$qLVX8lPfs`E%}ot5|lhSjxm@g?EnXgC?fTBT0`lRIEjD;
zA^(&^8Ck$qWlxzRQkjyd=a6T1SbH!8f$$R$rj~2TmTl>lZwZ%dSrmiC1tuwNLD3KS
zpqG2emwl<1WcQK1RS;U)P?jYXQAq->unZ(Hm4w+$hB+cxp_q&rmV^nJh&h>!>6r5r
z6_J^ki>aA}d26aQU*BkZ0Jxc#86uJinw3eDqp4*fVw#|anlJcA2c=<3(0)D<m%Ztm
zzp0i+fd)gccIfjCfoT+W*%Rfk3(e`A&k3E)c?+um3&?qW8R--Jkdak~HG{dC1D0AO
z@PT`RmEW0N_$8h!$RTRuPUcx-=sBM2S)T3*o}Cq+Z6cHONscRl4$MY822q>ex&L12
zX;tjmRQkz|<=CGB#6}qqplo=X0OfB>s5<Y!gQ=qr%CHKnV4W~=4~TaY>j0t;A`RA{
zoG!r+t56IpYKALX3<Gr!ANGv*pbWRL3;M7QD|!po0DnM$zj!s?iJ-2fOjQvDaG+l@
zDUYJr2toQ4L^?oBhM+%|q_MZ8Me3wa3WHH9q)ck0R!V{km8Gt*iLPm$Kq{p}N~O2Q
zrCaHxOA4lRD5kcV0f%LNSHPXBLv2a`hM`jquwaZg@u53$q6!kIDB7p~unXk?ST1o3
z<-iYzI&JBMVK0G<W8<S%Dp>{*j&1O!KdO1@sHtgMW1X6*o2s9e3XbFOsi68}p;rHg
zM>?jWimIeqs;o+o1sS2-qz_RyqN<Y!s)#z)unYCTqchQr#o%V;Pz)0Z4#l7h4bu(M
zFp>VyjP#Ru_mGSg!ViVI3lFCc$I2^<Dif0`HkHby+U2T0I$q~ms_Ck#&&ICp+EC+_
zRPg$qXiBdMI<H!JtHm@}lomt!pasE2HZ1B7bt)6@01Mqv4)VjC?|@E;2MqP_4h=I8
zRQM7ItFZF33khot?>8aY3KP4qg_oA2^5$ISunNN}uHET)_v*4Q3$rmRvolMxp0=;H
zG!JYRVle~`5{WhZ01U%g6Tpy8e+mr6P!1jI4}01T+$j$pOSEjKu|>P93<CeMFR=^C
zAcjlZgMaD|^RNrjD5*jlG2~jaXN$IJtF~*)wxM^klaz`<C`1oNrxWv`9V!#B&@l2K
zKRY^q4JQx9P@OLEv@fBz(yFmATD1#uwJx!(*B4#yu(Q)<jVs%uE!(!4tGS!Yxt*)3
zZyQMwsRVedI&5&367vqXFp@X{4CT<R@}mqP)-Z$T58&{Ag_~xsdkcvxwb-hyBYC*R
zAPxoV63#fbl#02YtGvt0yv^&pCkMKKq&2!EMDxI09{VfcP<B1B4t%P;{?HE}Mq*?a
zwh1Q>t8fbg)x8PJyI%XT+Pa|}y0qc63%LRd>jw<nX}J`WywB^u{|o=X0lc=+OD2PQ
z6v}XZc?w9y;EKEHE7AZA2CNeyd7_b84%mAk*~$+aOcQzOp?<Z&-9WYqW3~cp!Y7Qv
zDQunuEGF-u1q=dQxCpnC_AA6NxfHT~#IU_Q628FT!#;7rJ{+z5tHMQW#7B(8aQZ9n
zAO=@J2N$^%w=e`+Ai?Ov4>5cz(}isq(u;RFAtju|VJyaDe8eo=C3~<63X%`ZwYWkQ
zkwdV>Mga@d`ylfGu3k(wU`)n)%*TDayk^WLSI}^)Aj3(~uj|x`R}iU1Q4CPP1$4|H
zBC5c6%(8xL$(M}DZ41aq0(XUU3yW09Mj;OncEiM^HOWQ1K>_~->p&shaHEtQI(nSR
zvrNmijG&v0Bv7CQz`zK^APuOD6uoMN#k5?_RSu=R6Yr3Og)|Amm7-0d48+h6upG<%
zYs=S+&DpGyxXdM`unWZy%0bbyql-`)HUxc8s67D;VsH=TPzv|J2H3_3<)#!si+9vK
zuGXy0`^?Y%{CM2FCFRfui9otLA!)@4Q2daJLjcJ;(G7%kY43mre&w%7@u5SE&z0=Y
z8_m%jU6^qiF|524li<MXG!K#nVO&7FKY>g0zy>8<(W0!n8I3x!?9n%k)3prHJ`xB3
z_Y&(c1gmQlTUb=<pfy8K&^SQ{Tp$L@zzE%|1mO(CJ52x6d92Sljn!Fg$vfR6J$<lD
zF%KAgP{kkyJ(v^?&5;pY)ir(9TJ6?vjl^8N6zEI`%D@JfW=M3<2j)}`dw>RsFb{#i
z2%W$N5_SuH0L<Y;*v424bdU%ltrKEvS0zm(KfKm#4cD2i*<}pUMM79m00m;u3EiLs
zhc*QBkh3||3GxsK#r0tMpuIzYORb%CL!b}V@QREO(>P%baeUbe!nce3+Zw&uM*Ia0
z&;Vb+P=0{iO(0JZ&;Sph4bBAJ5m4MlEZ0hb)P6Q@eNbViT?$+G5`o~aL0z!2?Gohe
z5<z`$r7&1fY!mlDUBfLCVVxArN#FT=-A3F500930H^5L|;NKx2PXYh{0-)T?v<U_-
z0Q;@N*_{;L#|G9gZd|ZF^Kjaj5Yt}m4@$tw(Kp)w=iz%G2G94-JVDj@{SwOX!buS!
zDo(@>p2Ge8-vMsm1RhTY4gl88Od8<d4KCv+4B<#2;S@dz`Zf>#whkRBKl#899PZ)g
z9pWzG;j5s?g=DZdv9)+i3}TmOnDBn!kY`<v26-kAuy6(9AP#(eXS~u0-X;xfFyA%t
zurN--Z5`y!OXC18PhW831^(m9uuR&Z<3OJ00X*bKQRL$$4b0UEP#||oAnE0h2qOOB
zu1H9gPUWn;2S~^TlYA5T(8h)Zccq{V5{CcgF3|^!Q0k{1g#jxDV$co5m<X+?4`LA7
zTeFHa(GN3i=fGmqhpxPPZsP!e<IYs*3GN4lF6@Zj*+T-H(GHyIywcJZ+SCOFdaDE+
zcI_+P;)Xf|iv$JhTnd=L2GUSiIq{+J{p*qv?9I-(#NOwBp5q4&01dEA5#Zkk4)6b)
z=tUvz0Uwt=vA+#=50jwF7{+acEpG^~1sKNSFR=<xVB*~%2GW2Dn1Jrdd<)au?zi&p
z{hqn<9#4L5?128`ys!*9&hH}cy#GEi-Ri~iFueMp1bW2}%;i2bU$8g7v`S!3?F`3D
z%fuM3@#(G;`S<Z4kLND0xg_sQCV&6z&BXHm?dJpV<4)haFh4QucbDC81=c18xI}I)
z0rp~#OKc#E@>2>(cm>6P2G)QHov`sdL9I*g?oF@tYzy_xB=vv}0S1l$4FCWJfB-GO
z_nyo35_8OVDewaC6OM}aWuy0rpSFF^On+bR7w`ZFZs0p`_=axzo4fcC)3^=x_yO+|
z-CFIFUnU_x`ZSCA%cS|p4geQm@(1n;p&$F4Tlx`G3_>k!(jfd4!nalI`a=Tyy&to)
zKMu7|^|w#x{=ER>!28UfxxcS4>wwJ3UlbSY{jXp7*x&sA&F3Xg@3wyd<8T26?%dZ;
z{sa8%K$XtnZxpd>|6;QI@lXG+H2wep5kjEAFXP625dfgUK!W2EUKpoMqCo@z1Q^7a
zQR7CA9X);o8B*j(k|j-^M43|M#|#<#y@VN4=1iJ3ZQjJ0Q|C^c%F6Ks8dT^|qD74!
ztqDvVQl?FvK7|^!Xv>vVtzN~NRqIx+9Gd_D8x|}Cg9ycjZQu|9M2!_Mc7+>P?p(Tc
z$F-E2S1-|b#rFOM95^t)Tk-@SMx0o&O{#VsKZYFn@mB$rEdz*9)}m$055^e)pkd>J
z%92f=MxB}@-o>q<!s6#z_Uy#>Zt0_)TlempjaB~!9$ffv;>C@lX3bmqO=&-uKZm}v
z+^*==t?%`HT>EzJ-M#;R2fsD>_2u$_kw;(Mn%~*$tfhw^HG6pa_3huspP%md__=TQ
z2aq;mx{+<3TYz~lKm~=GPd^7AgfK!0!Q*ei#jF9xLJbA$=azS5`)@-L8OvZo6Hi1j
zMHS<!aKymwq0U7apR(<q)(D$1M}Hbzu}2?&1oFfdb<FFQe27GHsCRDZXEAyF(np?d
zK747NZfs04JsyMPvP&<&ByPwoo$7|bG0()Q8)6o_2bN;=`RNvz%HiicG_BhbOg;DH
zvrnzWywfP#0wq+YVysyQx5fBTCc&4=ajwwi^7OM(OE1OLAV4J*Y8Nay4RjX|UF#60
zcgzHpH%c>QwN?LDSKKt!oxpKa)-1b$WtCbHBL*D5l;H;!W!AJcw^d(7Hd$rsi?!IB
z^pO)WX{dA-F@3BdRyI_trR~^dzXdm3;F{%@CSVK`tejPfiL_h=W4j67qU3eADR0Ha
zH(z~Obg5pT%8}+UX#ItcA9P{5Wu2Q6=E-207$z90d-tWdVv9>6H{xIqTSu8WV~R3j
z-sXuBCVFW)87GouN?BwEOT0K{nP(O$<A{r)_AhI?IkKB*{kcb)U0v2o9%Ym<Y@TxZ
z`iY-)cFE_+prtv|A93DM<{o9<nY!w!rJ>p%e!x*intPmvT57PX_Qz<X{aNQ7ad0NO
zrip3BJ8%DRZ6>&!ty_kwoLfBh$Ih4T8M<z$^nnFZSm1<3DOm0iXBSwAA?9p(c0sq8
zTZj=B*v-*3*yzXo*#+la<hC4h%{hOGamTN9vm96ypXqMBcjrA*zU!R_99Vun%y6I+
z$Gxe!Un)i%!J8~5!<Az?m-%wYu7|zqVUh=ydHh-OC1O6D9;WS=_osPmUphVcmvrwv
ze)+-ty<TfpDOs>}8utfSYk>Kl`=DZtfcZmcetQYS%J-7(72_V@0LMMFcd#}o%pct#
z-0J+Xz`~)6fG-i+&e*3Y_rY&|CqyBv`XxY_bb~#LxrYT=7?pb5f**vb2Lf$}n|$1k
zdY%7!U<4=l62hSBY5usM!g?r^?bYyxx2T5*{n5S>!YqYX#A27~=dVxAa74<0g|Pgg
zE?B^hdAEQCm4M-<^gU1<5@aA7)wK#bmZKlLSjExI<heA)kv(7(qZFx_JQHTokcSM<
z7QHwd5+21GU5pq4XTpyrHKmd<q2wZgQb<I0(v!teqyX~)NuwwOjW-!3$X3zFqP!!2
zktCcZtHa4p*3y=z38nkGfjpvY%qF{(2`fvvt%zMxme8T)EtR><x#SXe*HT8*Uh+s~
z6eBi>D;wP8Mz=9m(}KP{oHeouO=-SEXfY{AF`}u>x#i3zgkjq;<*ArtGSi;-yo&!b
z6=%xNt%)D_6P!NUWQ}*Mf*;nX-R<V#J$aDMhd_e`K@G}J%=sf91%=5vJY)^(Ae3DX
z#Ys7gH&2oVh6EWf20m4~(z+NU10*QvO@K+nReVnz{SfC%47$E4>Z6BdGucCP>JNin
za968<N%Po;IARU*Cd6o0Or;tX9%O(OEX8V8wZe)F@L;MmnW@-73XG=h)J&(#2SN!4
zPO^%vsA1Kq`7F56vkJ2&(6Z}S^-7egwn3|Z1uRP1kO4vL6`d~xClaN>4`QrRkOFPe
zJ&-C^m=KV$s~qDC<N6X8LKKO0<%zEhJKCa{A_GqdY-&~ekr`yb6r>f~Eztj{kHppx
z7UF>7V+ALw1pV_C@3Adz>k-@8>J%0P;)mt<_gJ6+Lx!-0E>7C<($!Yix_4P2Z1cJk
zz&$HoOtFnIqdVT2R28+?MXy!|+XeFG2!ri~Z%mf)(v+sxzAA0WGU6*EGw!#&T{!K1
z1<cIWve&;OGSGqBJKYTUb-)kyWFuPA4h4_M8oaFVSLaKDMnKrZS>$R4^qXN3-GY=P
z)~g^|;@}UrIDUh5Es90tN*Tje#Tl5vRb9Meni-?DF|P53ltIiOPj$X8eS(g8ykvbD
z;|VPhagjF!Pbu%U9XCdDBUrIzE_d0>Uj}oS#XM#*m)Xo`Msu3gyk`G4x7p2ahI5?d
zJZC!B+0J*4b0ZqjhLg6$z*W|eNC9o-E>soDhemXw6}@OiH`>vUhIFJQJ!wi;+R~TC
zbfz`EX-;?A)1L-)s72ip5_EyWgWeESQEg>Y6q*OGhIOoEJ!@LSx+OKhb*^>2YhKr&
zCA9{2u!UXgTld=7yZ-gCmA!0P7yH=HPBycp9c*Vm``FQ*cD8Mu0c%?u+u8=Vp)=ru
zZu1%iE$KkG!3||{ms{88&Oo}Q-Gwd)V#KT75MJ@U?;T};8R!6bzy&_=fxAMVQ^^3q
z6~6F;52Ymwhq%BSzR83~+~O10NlX51@r4^ayNGEAfJv}%jsySP<6ccn$X`nGlAoO4
zsS@qWQGL>pm%QM=md(R$PH>D<eCIs>xL`E?bAfw2F*Ikn&0XFamDjxGIA2WDlMeBv
z%bZirb;>Tp+aG<r((1gC`p>K0nwG$U=m7V1&<~^Yv!kQuIzjr`#~zrl?|klxse8ol
z4swxCo#1=_I-0`E6fkB@LHYp3-~#`gyjvXbh&i&^f1dVx(=!8-CwkhW-gmJ>J>{H#
zdRKGP_`iGJHKf0}=oina_adcZ8fwn!84r5Bn_f1N-#O)PU-r!Bm+7>3yzTkEa*jV9
z@4zp*@PAKyg&SY?S?X_5tl=CheX1PY*e-9N<_~>{BSZf$k&-)~e;Cv!U-i1dJ;!xF
zoAj4_{mXZH?avQ?zX#m;$7jCzQLY=*-+%l>O0c5<hI+6OI<b>{kcW4`u-&+wdyt2;
zqLMiIzs<|P)Z4$^XupMfKlbB2_4B>iC_npCKKzS63!J?Q^uNzT!4aImF}bj#P=;MF
z6G({(X$T<eI1s}S2g6~M1#Cg7=sy<Zz{`WU4Wx|>R5&9%J>(O?`2#^FOhF2Cx+qk^
zDHOsVOcE1|r&ijQDFKk_gNahX!r?1HDpU+4M7s~<4KxfmC6tXIbVAx_JToLgW}rhd
zw8JYLLn3jd#X5>$8J7MrkZej1T5+Ivc!yrmtUdn(jJmtS#6Utf%nde_#5V-KNBj#%
z)WgvOFetk~=ukONWJE&Y2i#hP6C;WkI*fa`!KVO+?ixkCkUC6+#12G<N}NPnOv5NU
zK`V^I-I&Eq<iAe*#OMgcVvNNsxrfFQKic4jdw|AhltyXX1!8E$WDJl{6h`#pJzV5Q
zBHYEwTaIA-MX>9{Z5&3JN{^6JM{Ep~xLFR70)}~{$9km4T=A5hkVc_+Mrh1FcN~gi
z?2jXZGI5L!-1A0GJTzn+M`8q!Q-cqP1V|Qgs{T2pr>K+X!ij$>hK@9#jx2`nxrf9{
z5Usg|UC@Vh=*Zui$fsb(03k?&tPX-yL+k$#Nc4Egmefh|s7T6sihrCWklKZEfW`!(
zlc6je0*NPD*~zAm$bsZV_=w4f?1Fa0$)?20#2_eT$R6BCr*#4v3_6{8XcR?BtVIz@
zY8jX@3Yc4nDt}<gti-ovKmnPwNx8(!a#<JIVi%24K<a>&X?dIq>IOSGOT|d6U6{U~
zP|3rg4t3d;xXjDRq|C}ZCRoS^c7Y(JnxcE?te)biauA2fI?TjK%poI?bUK`9A(;??
zOCPk%*p$uLw3XX&APB-bfAEm#8KGf;6g%=s*GNoifsvQM8tQQr$)wHYWX|R!6x$4<
z&T11RQigsghE<x5!yzJ&Ld%%YAejG{ob*`=MR~!OP|l{zq^Gz>=d>1mpe=rMPoM;q
z_#BG(ghlq`$u@$Z<O-vou#Mw79chp)V2BOhg3Y{0OgdVHpRk=>*oD{_o_Qpp^VCU3
z&;lh;&mlm?=eQEukcYRd2^w?_ND|Qy1yP%TBx@M1yg(cX`Va_$pqH433k#qJ!VvI*
zphr>;Ye<=LC{O*t5OAo6e1K8s5C>~miYmFVvw@&8!Ot1F&*cb~8v>kuh^MnL8GeAP
zro0CXeTo%Dk3A?L+4xZO7*nap2O`@G%BjJ8a8I$Z2KVGqB(jl4dZQf$oC9r&b)X>Z
zdrumq!FR|IW6}pTeNxiuhkE}M3V8&E@5{<AjfrkxgiZ*ca_EFam;`>%hfXL5M(6_x
zvW8pegI}41Nl2<t9o1=?1V$(YsbHKwV1%XV1n?|}SB+KhVT08PAYcfD+mMG_D22;m
zguGCiZg7rwAW9+<ROf({E>fCu_#Qeb(V*Z5(L|R-SsEgehW8w!WCfagAWB5+RxE*&
z--H)rtyO=hhi<qb?t>J00oP=W5^!xsonTX#IMW<@lzQL?Ka`0(1&nn7S2&3cd2k+h
z;Rj^(!+a=*b+{xwWePrp3D1m)IX$Ruoryv{)Qv?kNPQG2Acj()1Mq<YOt6L_7^NW)
z17NrUdFTWvNQ7M&f`tE7h9Q87myOw(RR$<1BQ21MQeXpdPzHtJf;E{3CC~?;720*k
zhdqD-F`$E4-32j_hCnC<a2Ntc7=k_Ef_gOyD|yy2dLy2(np#~^dd;YA2wQ3B26+Gn
zuazl*eWZSE+qNZAwiQyK$yV@bj^=m|v^^YfwT33?hOu?PU4kIoKpeKQhKBmvor$6i
zy@`7TA$gdG0z{WG_0ekt*uRhlTEP%`K%5vtuIWP@O;yoTsVu~h*l?PMdBBY^4VY_r
zMUXL6j>X;a@>qZ91ThemA<zd*NQ9R_*?Sm*3^9^U*n^i)g74u6n|%r8W!`yUgWFjL
zpN$G&fPzxkRWbkYhf*+A?d4vW5L1|7gFx5?Oke|W-~xY8f_3PFBz=moDbr~Qo)6jF
zm=ISGI+FVB-xGb71o_Z@#SOUuA(_};WW5$7GR~Y?+~YA%8%fg^s+uw#BhgI|aR5`G
zpj-n&#AwZ2=a^APwHnEFip3I#1VmO3(g#7Eri4{nc^FfObv+6qsCUSRi+y3SInqzj
z*xUtT_}X1Y*aHWJnq0N0;`P$#^&u#5Ug+iBCO+Dq=mzYKif#ymA+QrIAciY&4lLH<
zm)L_?;(|$V&_?Y8f4BmFh~LFY5M=EKX|UYOmC;>Nl>J>`@cD@XvS1EQkag8z5j|7z
zp^|ryhwlGlU_yq8Ygtib<tzy%CbHGzM-kZXgVv$w;4_s63u;||z^PB^+`V`Yafp&r
zS<y!V2M?-NaCqGtq~W9JWQtwgY0_U*`QaeOW$4;nVi1Gau%l9K+99~yC63~kaAL86
z;!coaHYf}&u;QmkQdnSvmyp?!wHo%BW`AIW+c^?O7}hZYhcsT}Hin9A4Vs^@h5+KB
zm$;e+##e!gJw68Dn~2jfdWVa>7A&b}Qz_&_UWzxS7J`~s0x_rI(qWj8<g}WmQL^Oq
zv{(5xAdpFreSTz^2xYw(<x+O!1$JbB;fHxJ6B2smukBNGGK?~X7g^@M+s);cE-B-^
z0#pC>he^1CD`10s5Qi&Jf?Lpn2qI=>Hs&Y3g4+RVe{kYrPy(K9->AR@Ef51PAe??s
z0`_R?rzV_kfC4T+1B+q<Ew}<k5C?H)<9Q~Ebzs|d_=#(|FvHlTojKR?H0y3a>xga}
zvaSgk7NLH<FltdiL@~}6G-NnQ<i2hjumPLz>4xUm+auLcqe@aA1;Yp0S4@Uz!}deS
z{)v2GTVsuhi_VLTZYZOYW9}m$1@z?$LzM&49||(;_qY~2e$6uRVU~93+Lo$zH5sQk
zWYn={spukWSn7$LiB{Y~^4MF99BKHF?3?HZLY;{Ssuy_tt}K-amA38cKBghi?(P5P
z?(X*P?*{Mi-fpN6@A5Wp?p_Ysby7jG?Dlr=_lEEImhbtV@1pR`GO_EKxV|ze?qWHW
zGI8i<DHG1d?gH1O^G5Il_ipl5@CG06=g^0(6N;~)?+Ul@3%76s*YFMJ@DBIz4+rrO
z7x57%@e()j6G!nBSMe2R@fLUS7l-i}m+={=@fx@B8^`e+*YO?a@gDc_9|!Uv7xEz|
z@*+3#BS-QiSMnui@+NokCx`MVm+~p6@+!CTE64II*YYjr@-FxCF9-857xOVE^D;N{
zGe`3@SMxPz^EP+$H;3~$m-9KN^E$WlJIC`p*YiE+^FH_UKL_+c7xY0V^g{nP^g~DV
zL|61hXY@vQ^hbyENSE|Ur}Rp<^h?L|OxN^H=k!kZ^iK!%P#5)4C-qV{^;1XnR9E#?
zXZ2Qh^;d`WSeNx#r}bL5^;^gFT-Wto=k;Fq^<M|}U>EjbC-!1D_G3r(WLNfOXZB`y
z_GgFoXqWbBr}k>M_G`!XY}fW}=k{**_HPIGa2NM+C--tU_j5=0bXWIvXZLn@_jiZ)
zc$fEir}uid_j||peAoAV=l6d1_kRcYfEW0IC-{Ol_=89Igje{5XZVJ9_=ku1h?n?@
zr}&Du_>0H*jMw;$=lG8I_>TwqkQe!pC;5^$`IATalvnwcXZe<Q`IrBP`IwjanWy=h
zxA~jL`JC7Jo#*+U_xYa(`k)v3p(pyHH~OPT`lMI-rDyu4clxJ?`ly%ssi*p?xB9Ec
z`mERbt>^l#_xi5~`>+@Lu_yboH~X_k`?Od4wP*Xbcl)=8`?#0;xu^TOxBI)t`@Glt
zz32PB_xryG{J<Cd!6*E}H~hm#{KQxM#b^A+cl^hP{K%L5$*26vxBSb;{LI(<&FB2i
z_x#TX{m>Wv(I@@VH~rH`{nS_e)o1<Icm3Cg{n(fN*{A*5xBc74{oL36-RJ$@_x;}o
z{@@q>;V1s$H~!;C{^VEw<!AopcmC&x{^*zf>8JkcxBlzL{_KO-{_W@f?)U!h2mkOF
z|M4gP@;CqUNB{I!|Mh48_ILmHhyVDO|M{o?`nUi4$N&7-|NZCx{`Y@?@F#E}!GZ=4
zB21`oA;X3aA3}^MaU#Wv7B6DVsBt65jvhaP3@LIX$&w~dqD-lBCCipBU&4$jb0*E2
zHgDq0sdFdKo<4s94F~`s`2-0f0RI3i000001q9FnhX4Qo2nPoY3kwbp5D^a!5)cm+
z6A~E~6&)HGAs!q;9|t8OA1NgxEh;E9FDyDWGC?~yV?QQILq1AHLX<`km`4yuOHou!
zNH0>4T2oHNS`lVkRXbgjv|kpjU>nC^8ed~-ZDU=?V;)6hnyqCd$YvtRX(ml;op^0!
z%xx^fZY<4jFwJo@R&t?=awx!ZGk$Yye{&~UcBsyFI$d|AnRhaCc!1D(J)n9w!+Sr6
zd~{-ctI>T!g?>2geluHuG-H4?(||`*f;DV{ICg_Pkb`>DgG^V1IKYHT?1epAhC6VE
zt$&6>frgLNhf;2cwO)xqbcwKqiAKhWQq_r8dx}Nxi$`IMMU0J0nvH{Hj!D>#TWOI^
ze37@wkzS3Hp4pRRZIn}&lvRk8SEH4S%9Uj9l~~l4W^tEShL^Y6mubA1fZLgDbeda*
zn!%=;UwNEgi=4WcoMrKxV|$)s+@53Jo^-CCl&7F;&7gFCp=Yz9ZStaPl%u?Yq-)Tm
zd*7sd@}+RCrgpZbo0zA=;HQ9ysB@vHw6>{v;i-eXtf0}Xg^#U!nyt;^u8Q=of1<C&
zxv++nv4YdFjO4M6#IvWFw1(xhlf$)%qqd8zw#mD;koC5UoVSbRx0unml<ByZ%(|}T
zx}3wimiD`oq`Z@{ywcXZo8r8b>%E=mzM-eTn5n;*ufN*%z?-_k(A2@S>cOR}!kos#
zq}#)$%*3YZ#H;tjqOr!K*~Yo+$gj1@sKv_F)5@;w%Cq0gy}Hb;;LNi1&9UyzxxUY`
z!O^zG(dW$3+wal6;L^P1(!=V~x69Py($w4R)Wr1Ey~WkL@z%r0*S`AK!SdM0?Agl9
z+Qa(V#o626)7;1M+|1nF;riXn(%#DC-pcgf(bnP5_2Jao<MZp|)Z66L=jG=6<<{ut
z=Jw{>{N~x-=h^M(-1g|+<>~SK>D}V$-S+C?`RwE7?cwR}<@xXE>hS0N@aOIF>ihES
z@$~NV_VN7o^7i@l{Q36(|Nj6000{p8{RtdMu%N+%2oow?$grWqhY%x5oJg^v#fum-
zYTU@NqsNaRLy8<pvZTqAC{wCj$+D%(moQ_>oJq5$&6_xL>fFh*r_Y~2g9;r=w5ZXe
zNRujE%CxD|r%<Cxol3Q;)vH*uYTe4UtJkk!!-^eCwyfE+Xw#})%eJlCw{YXiolCc_
z-Me`6>fOt?uiw9b0}CEZxUk{Fh!ZPb%($`R$B-jSo=my2<;$2eYu?Pcv**vCLyI0w
zy0q!js8g$6&APSg*RW&Do=v;9?c2C>>)y?~x9{J;g9{%{ytwh>$dfBy&b+zv=g^}|
zpH98H_3PNPYv0bjyZ7(l!;AkPPrkhQ^XSv7U(de1`}e!i`I=9^zWw|3;p^YezoaM)
z00t=FfCLI?M1Ke-s31jP6zJfC0LHW6gcMdd5ET$+IG}_UcIcsg7y?+r4J4LGq7x?G
zV8RV4Z1~}eFs2uxh8l7h<Bd3aHzNxtrs(4hP6XLvggF*z<aImFpyZM>u;640DU|S_
zjYn2#<#IC`;Uo_%l&~caR8RrN3{zfd=9$IKNF#()qUq+FxNWg!h99&E=bd=Erp*jc
z_W6MZB0w1+lp<*GL7#oH!B9BiloU-g7-<vDJ|fW*O``^}<BKThloZdUd4?*gLN~DB
zi$HR!A&@pH+#u0D0BZj;Qak|ma}f&~3?ou38t`Bc8v@=St4Nn<Kt)3IuyM(#%%XY2
zsRFT+f{nhc@M^3h;bX*sx8}NQuLb!6;1+C1$-+p*9*dBilr-zEm3CqTs|LdsBnlgV
zKq?SEw%DPpt<g9#Od)`vqlzQ&T*3w=l<wn5yAF#IP9khT>km8>+cJzJ^$vuqDio_S
z5WoIjVyi#sBm#yVx)5}4zAm%jNU^>W1PHkP_)<a&_~7G+DB1vG2Q@LnEYLm*b1V=w
zjzD{Gqv;BSjLL;{iVUtsi0qFxjwp+dK=e4GN-S*X`tI5MQKAYv3|*4QGY`$%u|P%$
zD2hNg2)Knmi3tCw4G)F}=!8GCYS0fn0R9P}$nZ!h;IakbDj*nm>rJ@g0771OfOq?|
zd4M$!#H$7@0D{aw;SdPz=NjCN&yWDd;*TR5Q0`COw)hh@?E#j6j~$@<^Iz|cej^|t
zXea+3nWRIG5a1f5;D|$V7i0^d$owb5KGfX613Leez&C)7B;pU?EPTT|;k6>J0UPMl
zO*ybBAXBUc&U;L{GrVil{rBOUU9aL{3mzcvdLqakp!R_b0EuE4EehR08WbQCoGx|7
zLPp(E;12{UaC<jP!7%z}0s-0%ce*o{Kb#=Ka1<&U=l~oWzJU$^u`F-CGM)yu;D}Bs
z?}zDef`I>mKoGV~P(bHuNc9K;Jn8k%ANYuc9V9ot&;hPp?%PM<4hJB%6>D&SGoL?N
zv@Ad@DH^z%o<II1vM5dwKpg}f!~D@iNA#~)Nd%q*2NI1pMhJtAYM=)8QOEuPt`Gvj
z6z%qQI}PM6YW|qo=5og_;c1|RIRnr>bQmundNMqD3y=sTqzhb?zzzZtqJYe{kR=WT
zSQ;pSEKA@FbeI58n;W0)&Zhy9(L<A4%%VR$p@G5WO^sw)76l!NtIjpkmbirD>|p0A
zSk97`eXAMm_UH&Tm`xi1vIPbuR6`BK!<w^n2CniaKt_`3kt$TB5eh{~4YX^Ui3AWl
zbol?tewIf~9Q23eV&@Mv2&e>|EQl)way?f$%oh77ga!@-P7UaCAb`u=F9#V+Y5r$$
zH{-!RD!MFf&?g?a+FRiUHqouY5gAPj2PFU$j)wZ<q5I&K2)<UgJ=To{U#qAuFetL&
z#nGXTfGCEJg^my0fF8v<&_4bIPbyRt9%FQ*Kjbt$K}v{rAMl6q!s^emf+rk95`oCB
zXE}B-PXowPB7j72O>N)<K-(f+Kf(uyA>pHMsuD;>{jpIkw$G!*^hY!j7a(>D6hK{y
z-d<zbR{-Hd6^62doKnz_yH50{oh_6IB)3O#0Vu8ez+kTcq$tnkl?DAUZ3=Elxnci|
zOLA2$oElVlw+5vE4Ew;<2P8MWv6}U`-a&^W3h|A63MjDgpadIQ=8%3Ah-eT55Dyx)
zj}Wm?1HR~+q6Di|&l=Wng%iks)FlcQd;kn}>l{IFWrshdKvvxa(05N&*$+@bU)k*y
zrjT*V4*+YA{!qm&wc9BS%Bh%N^GATUE09b4=>uEf5C!uJ&%HT9N+}RxZBI*BRenH?
zsUs_LS9~2i7$F5S;DH)W^||`_gAy!M5*Tua5qeOHAU*qtC%~XaTv_ZOSOs!~3lfi$
z5yZy^NwPxl;X~&_amfRLazUg#GAtj&PW#~U#aK*c?Wmzp1TsQA9AShlgya7kXdVy`
z=BAUyMo&sR<p~DM%;ze>azI8v-X*r+ge`2r7wAv}<^trZpIqVwJ97e^ZxWAf_4(2{
zQl)^Xzz#4tPCz`c1vNfB*MwsF)Tma9rU7Jvc!aV*AF#!PMQQ3(+xpf(*@6jnz3UYe
z?m>1C#WiJFYg`-q*gg5RgHVa=W;@#`$}SMIpH1y*^CTX_$hNk(Jq#mS``h3Sx46em
z?sA*^+~`iXx|`LHA6H}_?ly>%*G+GKg5k&)iITb~qK5G@bYvDq3p(blk#<`o-ZzD}
z!Vh9_iYR>H^^SN{Y<r2*X~Y)$o(Q}NqJaqC^(?AToD;mA5gr88AjAKNYeK}u<2Vk;
z%K}ZJMA#}Im`nWTM)^kF?4WXq_<{{!5F^G3f()P|Zy$gNG^JuO3><r+A8e@D(Nd=k
zbo5LE;Q#{|@G%Tq+#3*T)Ji`NB?{n8J0mPYhzb?L@`0e^5;IM~B}`@zCsE|>ai2TE
zan5(5B;6vaC;=rXk;I`3L}!Wc1P9q*1Ya0IQEU*w$|&cHEr?Nry)r^9?#cpB1e$gY
z@-$bbngU<!Lln7#pr?6YHbBso+0@v=2aG^8CmaYKDQH*P;o*c27?_R#qMYkbd3Y{0
zsO1A`=}osl*SI<fA6#ng@KL#s6l{S^j4X)q`)Y&|pd%J3@UQ=bw2?Pq_5J)dF`z)u
zq4g~+IUZoxg2n6Z3B?wE-#nNeTK!Q1S!qLjY%n<AKwW?!Mgq}s`=SA-lQdwU4JD*v
zTG2NELIqfLJthDMCLlhGMJ}x~M$)r0{?H^S16Q}hL4fc9qEI*Ja6K$w3mXV5ce68&
z&?3lpfZQTPjHdzS!vZN#H@WkIturr_066->aohqdHvk4>cLSj3If4fz=of`D0bZ+;
zJ4VoQI~ER@q)=Gr52eIV`$jL3#53l^KKP(41yO(;=Wzjd2}DK-+Hfoos1?p&2Q6|g
z*JD1kQ-|+!Gg|;o(_?iZcrG=BJZaYtv7iPm0x2p4Jox{zLyI*%v{Qrr&{DACE3k4d
zlEW>I=!dX!EdPOTm3V|=C@xNr2(rX^iI6v#B89G~5{P39u>dWvQ)Ma8DRpuXET9VE
z0D>K~Z#QrW=m3RA&@Pm4AZTba2IvnaKr~lZVQ(0RYs3}NFawa2H}sH)DTEB6X9sq0
z3C^H{TSGK_B32}rc5(uA8o-Fh(v9EPK+7^ylxT^{H(ZZ}E6(5#?sy5XLOHx5ipmEp
z^k7Lw;Ei@rLo8sBRrZPuX%g6HEBnBD1aXV}XLI3$Sqv3RvJ(p*AOeZNLD5hGbOkBN
zI1o2e0w?1LB47e`@Nv4M1`i{Rb9fc~U;-i_G|~SPM=8)=A`nM*;0YzLEGDp%P|^=R
z*dT_;K~WM7b#pqy<qOyIlR@bZfpQ7BGLPJnH!7n6sN^K{@BuU6lR(Lj8lWowXb=I3
zfV9$hCO|nn=nFhB0|?iUbQu!v<^;Zg56#snV1Nw!5S9pGb8bf|q7XX8rcj636^;j4
zvT{9Sk^-``4-aMplmeHeqbt7fCm4cACMP_FQa8(jA#ypHlwu1l;)7_(E${$6z$H*&
zNjst-nRo?nW$6!RsePmvVUF-8=_6rMVgj;Lm%>>RywW9i)05FaF4QFvDZm3pU;>lI
z7aNz65LFNjH!=#95C}Jr0&$&36E}Njopb+55nd*k!+D+|5e@!!5$Mp0hjBfWh@SG<
z80P62sWqPSnV<T(pZwXM{`sE($}9uIK?W5d(V%Rq!aAQKAm#%*7BxBqB_LsE8`HTF
zi5Z|6>JS5J4zs2KvG5FfV-C;*AkP4yTxkvtY7R3MAe3MZ1|k~wMiHXWBGE|^DG;B1
z5u+#J3>TWA$pIkd5Trsnq(oYzMtY=38l;rq4z~Fj6gPho!2&fp5j{#5PkIuK=cCsF
zq)FPPUizg$3OEy*89K+6Jr@yD>UMSj21G+Rj<5x4AS;CsG)@o=+HeWJKn3RW4N-?F
zcbcbSgb$Per)?@1Wy*67=Lk;Ffaw1)Z5-n;iz+KIB#c<K4~akpspoaR0CrlM9ANsX
zph~2`qXA=z8GmOHX?jyB00_450q`~hRNxCUkUK2kky(?OGY|_FL=V2e0v3m>x{3__
z;GDX^16nf|r%Dltzys8v3ys18vI7qv@K?<0tlBbM1-VtR>Z_nvJL1!+#^DHd5TwFT
zuEG$c+Mo@g`l-)guId`3qZ*u=p?;`3EaKt`Gun0EdW8ZtJ-%R42;~n{5S%>ls{uQ(
z!|(yNvIWN~7xc=0@rPx;aCQX|a*1F>?Zr2WVzJ(qr8fmvDF}8A_<-PQ96-8QJdm<M
zYG~^^q?drCY>=`d@UlW`2MGUm8B{0`->?Pq77bb_X7e>Hs<4xyATfYoJF_ZK_2PJ_
zqBRA3c-+FUI3`#P8y7jN4OZB4U30SofeaYZIgn`r%@s*sOE=KM4){~F8v}=OShB@&
zvKm07>DsbFN-td+1T;IO?qCF^IvKGzixX=&6G;!EkbQMGEKSuY=s-X~bu+S)syP$2
zPW!8p>kB;7H&y!<e@lxLIS_x75N$ey6^1jRTQfukMPt-P;SiH;>$bxIw?fJdh6V~j
zD!al!1%F5lU~s!^;6Gpxq^WQT+#n2&Bn;GG4ymvOLBIw>inm3&qJec84=E4|I}o_H
zH8NLs_9#3%!vfBL4`lzMb<+d6OuJPC`vHSfzFQCr!)h#=R~OS8k*u^TTuVnOz=J$C
zc06W>_$xJm5|*qoTbIDP)9AXw0lPw)3Xd10)DS(($_5~s0)-&K&maQu3I?iBem4Mz
zACL&K(4s=>yhRE<RoWL&Y7p^Oy#fIbB@_;g<`7s`pAmso_|OkFrWGgrZUcdrdWkah
zyAV{;t4tPU1X02Uj2j<p4vR&kQOCd@Y7T|41t1y==HOx#e8E9#w?VohwA;LSJEV)q
z7xOm81mR@10IdyCz5O5|DX<U2K(Q<_qg0Rr>sb_JJP>!>L1?TI#aRN!DPczN0d|0&
z1mO!TRD?&I9YO!P#6#M|=Fq@F8pT)4p;G(-L8^6Ge7p>72VTMrA^gSW5DV^r4v1_Q
z;Xs)m5Drm1RjRxNtegn0`~lwp%k#2J2a#yC^9|ZCIHCXsYT%wO(GPZY6sOF}tDMTm
zJTb96%dQ-JAEBNSK@U@!$kKtpLh8tn48>Ax!L}d*pui3E0t&Sgq$NPb)DR8l$_*lr
z3ZFcryuvMd;l>mZ3ljMdjv%joA<q**&-2R>GEB|oVa-7bEG57V;1r~=45F_Wq(8L<
zzgxw0wYyMa0zBZwLOMF7d>8m2iVjhz5An}-vC$Oa(EyDmaQi6H;H4Gp$wQjbM9K{=
zZ4TPN(&zsi4Lm@z7~L1_ka4E5(<NP2KuQfx;v_0<!F0=^L(R_Sa6K9Q(@xDCMo`h~
z8q-I8(Qv#M@k13A>JUc!5?Ngp;kngM4IHByJ0J==>CmAisyFH2py{xp0741rARsA_
z4rN`2DzSHBeH8lK5jr{%T(=Q3Du#jC&o>$rea#Yo9TNLj5Ulb6jy2Z2!8-tQpf6gW
z5n^WmqACt*n*t&`bS*#xWe{W|5-v#){l*j`-4Rzh5!KickZTaHUBp7M+APu9jD2zi
zQIe9KAm{+A$k5dcaoPj1*GA#f9C4^;>Jao03oL*R1LqHO3J7)Trf{0Bc&evT6M!lQ
zxoiJ+-Oc^n1IMRq(2B!gXu9&J+C3A<y%Nej5pM@}sz5nNr*zx>V(LW&{3sB--P`>E
zJX>G~z?=|W_jPL2%R83eJ9bxDw{=h_bvISsTK6@Uim6|btP*hvGcbEb&|I~e2wC%&
zu{x{3YC%&a3eh01sVd^KY6}|9;orckzA6y$0NEB64<(+%U4h{d(ZCJzV&TAej;APy
zr+C6+D(l_f{=FaI)T7-hdTNlXE5kRw3YDDadB{_Ffl4}_he%tntvY@aU(FHpN)fXy
z5G>%YSi7&bpfeIOuw&%0Xg(~qz~+htm>6Yom!K~C?dAfD&t47BEAg=Hw`7Cn1c3j(
zG#rF=b=rShBR=`(5BqlmR8V#`qvT5tAD3`)@F#x?;RqwUMzqo>;>v%lbXN;FUTO$M
z3aC4504snHvOba68j-VN#j^!*3GyY|c&@Z2iL`AlxllBNayjP$akK)Fv}Z0@76%C9
z#RhhuzM0z+w4M@Io3#Ux2>YN;2SE*kBR)=GTM|MmcO@&xpp<M-v|5AdneHAAJwf8M
zg$F^vA21Bx>WynOe=g~U$G+vzh_<@^Kt5sH8nL;7J8xh>1<UPrA^?%T&QOi(q0$}?
zozf2_U^c0G#`xg4DAVva#q0tR4LtKY(ID+JLGUTDx%<+&*<Qy>^X)4{4aNU>V+Rt9
z!^lBe=MTcn-;v$!?ZE?EfDXt*k-3Nv^iC@)SesPf1QPO$x??-5zVDQi0;=m1?Y$Ax
zyG8_e2@8KAHc6}X0=~6FWa=9W-|!^x>|W<0_TnoLRPgnJg}wsOAQ%?8sFLU{arG(@
zzx6y2w%`Qe>FxZtLXskqB>*WLDFQPHMJ87Qw!;P=;C()?AAQrC6zMw&LGSvg0W-j6
zgatSyzy|vsSSQ(8ZKx^%Yyv%h6)C*+UEgI1A;b7U$f#QoK^B-G{S|kamwOpWM$ixW
z_z+Ywm$^Ur>)~#F`Iiy_bF*&|!o3n>9ujKIAza@V(eDy{{KrueCC2~XEXg@ta#8IZ
zfy-c^%e?F)?Xnl*4-?Sb{qAoNC@&KC92oH*6UG1jy{-4AEg1Tb|NajU{sayrSkT}>
zgb5WcWZ2N*Lx>S2PNZ1T;zf)ZHE!hC(c?#uAw`ZPS<>W5lqprNWZBXsIwLM+&g=-2
z=1rVAb?)TZ)8|j1L4^(_`f%T{qDfO8Roc|)Q>am;PNiDaDph>Gu5NvpmFriqVa1Lm
zTXw956#f!vV5=ckytW!*vWXinT3j~%jKuX9O9NGQRDk~V+cuHE6m8S4ZTmLv+`4z!
zP7OS`Z`{L)*)ERjxGm(icH5dIUE1_%)Ttw~HD@O-rDt(@nA`sn_gP`KTg>r@Yi_b?
zlx!)*wPQ{*+SadQx1C+P?d{RPO$sM&TygTYuw~P>ja&M6@ZrUe@5$QSdGzVkuV<hB
zw^W-y&9|ptU;TTi@qNy>-@iS6@&XiaKmrSdh(G@lJP*L9n37Ke1tUa{!KNJC4?+ne
zq|iVPJM{2F(^5zwLj^Zf%Bu%SEb%X?P`psZ1Wg2SMzh$^ibfnygV8@8Vxmm2pNyDo
zNBesG5hx*vEYimun<PsV4X9AXNh-r~q&Ow%s}iCt?c36!F6;YpOsn8Yi%c}5LNH9)
z)Sybgp48BdP4%{L6Fw&6oRd!U>`e2|rfdO2pkW-j(Vzcs96<+AMs-><Oc{%^usjU;
zT#&`6Cgtf-NHJ~n)1ClPbe~HQ8^{QJcmQ?PmN?BaQlea>)Y1t(eM;6%E436>R(m~3
zloG(`$De5O@`s%*{F%X5W=nEaNnVAjEJa#<v(>3-U#vFTX1fjP8!+|}s2{<A^!D71
zVgV(VSomCyRo0%d^j%QnotIm5^Tmh-Dp=TOP(UaVMPGt1N^A>xv)m$ueWHox%{+OE
zC7OLwK)B0i7H;@qJb{|H;)}D)m|=$tHd&;74m)|}h~jZ%Gb~{oj;(mC(zGYZELPGr
znyb2*r=0hMk!KBRX8CBO|BS|wz2b8EX{e)?dTRfwpVlqm3}>!-Yp%QY`fISm7Q3yO
zNz{65w9{65ZMLhExox<sPC*SdI8M5>eZ;lM=(|mOIc~tI<}Ks|w*aN-z!O(|@vnJs
zgokz&jAaW)W?=ks%rj@pamXW_ymHM0Pr;GC%@QRsZ7fQ`mVxj=N+3H(FWstWnzkeI
zYO9?&g|g|JdC1&@7k+s5YSY<2=YS`EdFJ^vUg-LgZ$8XtDB(E;zGn}Mh14s`KAL4=
zmtFg*_Ue3kHlN|mts*za8hzo_ho8u2u797swxFM%R{8f=vHs26Z$0_*pU8M~Ch}3m
zWp?Tw_gY5@J5j?Q!`Q+WURMZh0Ky5;_y+$Q*bokZ&?6QsKnFVdVTVLqf(op&gP^EE
zg+(P$C@&jP0lQ?q)({Rol%P!taA!kWaU&H#B$4`bLx~@rCl<xo0uKa8#4ZUDiV`xS
zIgq%XCDO);Q-qQFG%!9H^28kt*~bj1;ENfs&L0l+M?ZR`3m&K<9v`^GB|cCy7Kk7b
zMo<Mke8B=_2;>qo_<#|N@C`eBU<**%hX$M=A|nhej6Z=3`?$EH<?wEYXnDpHFR3JL
zfZ~%8T29C^#>r9ADU_*9P$?63$`p8#mG<#V3hXvXoR}jC4Y5TD1Y!g=vT+z67}ge4
zp+bRBp;Rm&oiDn_gFp%dd;_tAk3RnZ4-KHh37&8S7;&kSm-TLzty~}E$|=inQqc(M
ztWWh|rZsW0Gegf<r##u?PPEtop7vBwZM^wSm$)MdJ}?JE05K?K1+#mUaDqVM2nb`b
z!47Ne-aw!^kZFofAR=JL2mC<=ZBXK$0Hui<G{8fCCWsO~9F7lD`cik*CKkg{9!zbD
zNtx30ruG@mok;4EeQ?4INe~7@Y{3G20KzQ-VWTfnfRDAPA{tM{hb<{ukc$cg9U>Uk
zK4Q1gj(#+xBmJpM5`)g2CJd!JrD9EQ8acGGbv^x)D_rGDpV%O<tSzyEIf}Xvd{_<)
zV2~XPKEQ%D@`egVh=o7EpaK6yGPR-({Xj#LX#x@0;;a4;0X#ekQc6%_uQ++uT}>+?
zDV|of2}<p1U0bWsw!|G)fCxSk0uO)SqaP`VCO&Li+uz1ED5ZUEanrL(<0kh!$W`uX
z@g>}ixPlWJIUN;JU@Yi{g}BYNCoEv_i~i8_JXs)bDA4l@@@AnLY^sC~NTdkz-ho7+
zknd_0p@?U^pc33Q?Q^q>kvUvrBmK}uaR2+2?ece)%76d>7yw=cK>z{)fB||c0Raa9
z02V4DLw(bOf&geELok2<0vbRf6r7k(FxYT^I!vnxWWXFK0008Apx~YQ_rMg{$1Zp5
zp#<ajli_&40`}`4x|;uE0ToV9C^W317_(=+DoQbmRm`Su0KmibiL#|)tUhPZSP?>o
zsg8df5n%-4%pD3cnWq>60kk+hmB_*!AZ!l!-eHL7S+aVZEa&q$qr)OTFB!-Xig28#
z%jZ$XeUEI8Up(3zjXqB};G2sNU%AnVX7rfZQ)O6?fzalt#vQU?Ui9Q53uI76dIqs-
zRGTBqTc*#VAsy>bfHxGFRs<QQYz|9j0n<&sg99><+6xrm&TeL>nb+))NBs5K1Zp$0
zZJ1^E9#;YYaDV{-@QrY6I{^WRfHU~aWc2(wJ!Gh{gQr{s03?6`0O)WA4uF6RWB>)`
z$ie{xfB^Ii0s#Myz5oOujQ{~0AON18@s(i#fE%AD0}p6VieUf%02pAyp+G>p_iYY%
z8$bXA@bm?^y?}3<0|q94K)z{>o;%nZ-}+WL1JLt;5SZfu8+ZT!1keBx{{rC(_jDyh
zo&W$`0J+r=K(?)&PG?VhAxSW>)X7urr|(Y@0EqQ@;C$o_!+Q|s_yh%Vex5!z`N`+W
z1pspX3jnyc5&&SbGL%sX7%ZRxFn~eCK@M>AFyI2`fxCPkz<_Fm1H<U4GI}nMfJ8fk
z-W88`uA8p&2b)6&08m8RH=qq?l=vHP&-RqFaPbWAUD9*T``-Ir^PA_q=M%X5z%ifr
z#Vg|g6A=ILm+NT`2uL97P`{SdFJcZe7=J)mA3pjv&uR1^U<2xbzyi=Cfdrh}&uiy*
z+{ue?bA*5Z?6LKEiU4@?0|2}z$iCz+KwgtG{>tWX@{M(10O+fS#;BIC<e6Lz06>8(
z;JWc5zyu%w6d1Pin6)O$w|ql4TY~|cI}e=0JP`xHL2y6#1Ay*3vhqU#0cgHiiaO;h
z2vQ)05)2UL6G7&Iw^2I}x>FCqJCA1|fdJ4xwUaX%y8s@%0Qb58>sycV`@7>pKy4s^
zA~1)!gMc2)fNwaD#zT(@Sb%Uy0CZcAC=|ShBZKHmJpkaexs$J7fHMHd077Fx^zbge
zdp-X}lQHy=K=g0`**m*gTf!#%h7CYJ3CIAt3IX(E!Al}RW`T$Bxd}5Us1zKJ6$HfL
zaWaNG4+n4n^_Tzy6rE*QQ*R%~7mSVE=w^%%P{h$AWI=~?DF~yx6%i2@bPfbX|I(?X
zbV;KqsfZ#X4n)BKX%LBr=iPa6u5+Ci_jO<A{+{pe^TEJ_l1NN8jTg$W>+WrKCYj^b
zxR?Ktb}`uF3jh%WY4<H7z>pyK7%L^Gvs;?^;tocHINU_l<R_|`Q`OX`86&s5Uj52s
z5gS%x&?5gg2zjSycSCOnMmA0xcK@W5FQlc<I<%xC7)d8{!}uQcL6Ii9n+`+%tfD}S
z<_>?~AHt>Zb}HZ~UfcrU?L<P1#G5Y<O>ilA;{Z$tke$wFPBH)(4C2Wj$4do*8w})?
zd*iy5+QT(>MgZU{hQN04=?z^nWF+3xAMIb$4mpUoh$Jzf)siKtPUsG&Dn>B>2;KpZ
zV$C2j)zYq$$w+^0!LNCUGmQVOeZZ;inWJ)137TAHm^#$dE<pv00m`|g4E@i5*W&mc
z9+kZ8{}2fV2m`%$xs?p!k)<vF1~CkV&EsGINDR2DqYgmpn+>(cvqG8!NJ-UkjC~kj
z)g{l7hDaTF<fzF@FaUDIcn?ehhYSh~w&!TVZ$<0M4YdPkB;N3ZKrjhZRd2kC2?Ey}
z_n819NtQwkz`piO|IDtT_TSYBtP%jlDjck6u!zAlO~{m}qz)VbeYvLs#dX)ll~n!a
z;pBt`9weNSlc2`!<=HR>-@(^^#9q!f=dk&7-to{3*U1bf#q;IRT#_bsED}5=v~a03
zKZM?49_BP8;iodx8(?nuY2wHH#5O5@r7Y70(CjkOdw5{Bn`gdj!2lBj>^M#Q{Wxyx
zE2+B~&m#ysZ^-jpAz9MUVmXKX+m5;1JshYxQ}U~{gGC&o;j-5qM)+AB!{IXQcrrlu
z5qCSV3;|KuN)+0FssPOHwI`_iOl?F?Aw2I{^qC#{)aFpgpb@|@w_=b3c(2Ct0BGTb
ze`6gg$0)*N76K7~zy+n=esh(VjTb*(`&L}!P1j#W=~>VX07E1qURQ=8r-7mnWd)rv
zK9xI`+`MKj?q{v0hm=_3#W^H@Bup>cOk;QoG!01*L(&h;Og0A+_OAL)D1dNm$RqIj
z_({*c7F=;-ngM6PDXS`((;`kH-QR9jh$hV(#cRq?G$p9wGUnkS0ETwb`n)yU8!Ii5
zB**sG_O|IVo-+(6DhLAz>goZ@0FrbvnXij7;M(JU!x@rZ?D&vA&KEMENvMk;@RTjp
zI*SECioI9QDx?lT^f*n;FjN69{@3Ot2>|k2-5G6<Z=SImf6)CSDS{^%@Sp9q8S9(1
zym|<LktzJ%wx&paf!CV(E(YMC2RC-N^Dc+qdi<XC)f9L`S#QMFA%sznR)5O6G364%
zph$|p4b~FWbl8JI`Nc>ez?-P@O!a(@KtrI$5=^D9E^{?8B<I6))r??m!b=@M)VqZH
z7Zml{uWVQ)un|d+5EAbBhv+qv-Y%=~sRTAd0D~bwU=#!uqq5=vP+W^k9?A7)r%OA@
zHUFAo-nII067RncJ0ysh2LL(+T;q0#eQeI3G*r!F1C3M`2?6{)Pl4b7Fn+6WnB!g-
zK#`_xRXu0({G~X~28eNRka-3%{16wYXmh5i2{Z>!Ve-D3?D(L$ado%3NXI`h-huP3
zo`7EK4ghQ*doA-`IftrDZhE9WEs{~2_VHcOM?_%5om9JAWz*9$@mU*JXWDkFnDVvV
zS$pE~^B!fAJ6k{7!RItC(?E-a4F3g5?gdvK0Ia<|(;Wc9C^lV&mkKSEg#-NANZav{
zGlw{^@74IIeIUZY6GjFQodFitk4sI0B>>*}ZKLUJyK}0bjkY&D>I`D`kJIM2Enday
zwBtN8SER;_xH=eVO>zhlXqJT9Tqt9SpS)qm03*3d0TxZ*4E!HwJg?hd&;1~hlp||F
zM#T5K<vZ{*CTzvsJt*pbdlBB5CCr{E!V9zImwTF%<Rio+l*~Nds4*Wu<^F9TxGHWT
zo;=CWPuZUGgF(PD&e4|_Txv5J5F|;~#N#OE&T7WfxKwrcuo7rQJHw+(lfJM`1f21C
zH(I^|VB}za9P%+BE1$&FPO@WxZVwv;w$C@1jJn`Fq_{}Pi>5$yM=m!&&=C+QwhZW|
z4y)9A9mf}pb^y!TBb?kfpU)Rwx81?uhP%PRN+h;OLijAe<uX9tgET5)TKJ!#{)F3Z
z)$Ek%;;F+T9Iu<~<4T^TD1jt-^T`eXYO))cBg6~c2W2Ay&Cwvm-S~?Z0)DMt0eetQ
zBG8fuj?0E!z?fx{IAw3AJXs=Z<hP#Nn`FVcFp$W87DnDYB!&$l6V2uD)6zED`R=h>
zILr?7uML52TWNX0cmY(FYL`{5drIcfQ&)v*Fn)16UIEMC{JCd$BT0LDnenQLT<q~c
zQ%vlCuZG`|S<9~gSJltCw=w!O1pM*<@y^ETm|8hsdo%p$5M#GDb}iU?cB~8l8UZ;v
z1N=Rmz4g?==+C>eS}hD-M;zbTIT+_2!Q6u+aR`XS*|q>EzOV^Z^{EP;g7~qQnV@-b
zbT2jwe^sBd#E!VI3|M#r2nc3U%1YrTLeEv$KYc$6&S=w%L9gu+VZ;T}88TRVZX4%p
zQubnJgaX-6WjKgm8CPY5ku-6b=l&!{nr_>b%oH<{2D{5Gn`h&{R>|dkv~%5~&xuBH
zZH3@9Mnn6z6>Y4xai>gu_LTuI0YnmduQ{1lov|U%-G->&q_(p*vWt0N7v3_Ou2ONV
z<|sP)GW@+C3>Z7@ygM=lW&i!J!4HgrAd{{pp}iueNG4~4H~a~%8&V-LUbEvDd5itY
zKK|q)FFXhwxFOS0<=^$fpN8NjC~#9`+>8~0Uv4lM5xDhU)kRKR@$NIyTWyz%{ON)T
zSi4LDS0&u-{z6(`BAZ>S(9I0-G0B-GkJ$}?&?LWA^-7_p+bmbSXS;uV>YkqPxx$EX
zI573svLmFL(O$gT_CXg4bs38R7)aj^JTg-y&X8|wDf#bH#sN89&sG9|cGf7HTdx}f
zE(MN+fYG+6bZg%Ms%Lh@vg>pLw%y6m*<&iuj>@2_i2mlm2AJm!o-N_*)%fEo`~A?2
zEZd(LLSnhm0AUN^a&P@}G7;Ri9_)9L;5r2WA~(9%VU~EPl>!ghkYR|K*#%9xON83a
zLM6^%r<Odck2Y$L;sJ&v7MdZ5=s75A2%MS|^#AsIP{}`##Hk9sr=+k?nf}JP$iJ<o
z80lQi({a}^jPv~*$j1OAcGkjEfK4q|zG$E3C4IF!OT;@MVt};&-m`LPfgMH)Oh_F!
zL&wJ(AR~b7&)eHcTe86}S=;Z1<KtOX0A-`?E@IT-i|t?-;nq<{zlomvr^)o7Oi`rD
z>G}HrZW3v@HUT@M#=K$S*t25i|6cr{gEf!DcdAl)AzT|Nwk3~nrBnS!3KEG_xC~j(
z=p#3pY<0UvfGF5l7ksjpXwuGAex4k&dRFIN@oNPamLzpe?4$#DT~WLbJZ}~qB)q=H
zt=S;wVadw`4R{)n5ajriji>=7X)?j$0qrDXgai2C0N_x6=ed)|IN*c_z+?s&=jtG5
zeoGS~-q0~_NPPGGrYBvA1hSZys1C^bN>DT)WkR(a&SK@ujYGWZ3H~G#wq~ddDa)U<
zT6gR7_wL*5@voch7-*LQS5?7Nb73=D-B`f6>4;%bhUwP#;3_A>9Sg$f#_8lyn}SII
zefUF{&9F_~=xb-cUTQodqVwLL@beF;zVxKuPc%|DE`FNxN^>|2-qcUEVzx0C3Hw`B
z>vFO?#pnQoC>g-Fu%{7W7p{)RTjVva!~=zEl^uwaPDK;jTaLR`j5ex?|DdpN5R_BS
z!9t+MkC9J44pJ>9=gHX8e>hAlQcC25o)7?l{)EK2^K8sK8KosEN~+8?-#5xSG`Uy-
zw7#u#6OT1+ZT<c+UBt+ClE8V<Z%5{BnehX~z@Iy^HnHn9y0w0}Pg=S4gXa5g?N+H@
z_|T*3iH{%FMxVIlw(IU)yo%0wOb0W-5mJ^R`&(<j_AkvBVWC{|0jCFOw}N@A#d!eE
zU}+><TFCAk`P_1P>K#SInR4UXREfbCR^|g`zju!f%gv727QQsNJN_|wcepndqXS%A
zU;DQo*k5*r6gImmB=h*H@VvtM(cekGl(1*I3)YrWc~foSmo9Q+LU^6Yj>*uIBkPZ=
zADV*yoLs)T_<3de(#e?N@zEj6moI-#u{ss~P=0<SsdzkiazjBZx-ryUl*+*iDURd0
z=8zi=@M}jUibNftl1`Z-QCFW;LFR=gX-Uow(espR7+Ch|tK=)?#L*P>pN2Ucf<v6*
zw3Ew&Iy60PwX!TDGu~82{og)3LQ#LW(<N5tdEvI^hY?rAwDV5M*Tf?Z?oVjjUAL03
z=JxA2NA>f;C1;0fv^{)$Q(wO_|Mt2^B4b9w-*;?p#C#aEwdVDirDGRbGttopM04wr
zhDC<p99AV8OlxxEFz>U2!3+^%k$X9Ig5(Mfh?oU2s@Tw8ztcWm^?Il6)voAo{gf0+
zz1Ct$F2$|_+!%xoq6Zm;77_7qDaR^&y6S@iLVRG#wL60M99KI6J>G}@TQggrXv*WY
z4kFjAhz)d@rsILqV4z()RX*^mY|A9H<jkTaC&xOhkD7=ku_`{GWKrzQ{I>CO$^1{r
zTreTjH>*0y&}VP~|C-R-S3dSrWCE&MAUr({q%^Eq!)fsqxq~Tp#n&f0gH(>rjiQuG
z$T37Jlfv}BZTn3Ih;)bE%DcihMqF{tZ|4=CkRRcMX5c(0Hu-Z(;fCV{c0Guj5<MGn
zrDQ?HL#}g{BvN!T<3Ar#23G-QN&4!6Lx1w~eLqAx*1MA}Nk)GoqCv)!eOPB~FuLdy
zFXjPJl&2u*@?UGyiVf50hyFe4EAtg0^4|;=^)`K@VO$!K2bk;uR?n1y0jYJy(FC$i
z@nvp)u2gYmZKOjjo79b1PqPJ+ivgPazkNbptv@&{ea$8{l5}7ZE|Sr7??gF6W8bLb
zA?QuMP<q(`J=>)x%iJ5TT&Js-|LC&OjX#cBc6+DR1LengMZnjKk>yuD9if<|4@ym+
z;!?5AZ{S}nfsq4)Y}(2j>8?Jwi?SB+*o|Vjp7J!clcEA_bQUODk^r6+dcF6(k`OyI
zctvoQBI350Ch)c)LA4vj9$qylvel5NeS|_#Wrk49R8Ac&an5^HLsE*N$$A0e+@&(Z
zvhvTa;;(+0j3y5k&sV9{8NOq7+-Bo#z+KP{jq5FVKv9fBi+XYc17<BiTpLBVdP^Ck
zNQ2V6ap%b}C9-2s!wUhKUsR+ReM}h#kr*PR%H%lluk1G$Su|$f@0L8L^yJl*u*Q1@
zN0Kr+vac<(8*?hOq|RGEd2QR+m|GVuC3kw6$*4&Et;`>t^ltInLec!|Ax+UPS|Kf&
z&aIV^a&pGlG<ELT|A&1W59K8UG954jFj&_))ut!ofniPmE$nzPQN$_16eSrcF=>tI
zClfa#w!y!nrL{VYUWLEdezf?Gr1|T~<lQKx!lR=VwUt+scMiFV7{65ribkS*1MxzR
z8`rdi7v&h%+#N1VFEs~**Lbi=T@w&t)*$Gmw>f<^dGkBHbBf!@vW&zmOB^(E_p7b^
z*f0Hk?myED?+9$9O!UuDS!%@GbpH`|RqZpc%)W;ByJJNjN_|-zRR}g)3kh#crGB(?
zL}Rf-uJ_2S0W-ig6^>{+PsZe1n(LgVJ0?6s&RKX}`}(@bhauijvqKhYnV50$yJ3~e
zu92l|+lMo3k2E>=m&>{La(<Y8UMc<*jsS&L=fkB?yL-a03oIS_etleWHy3OV0QN)K
zt<4q3T-Q~I_K)c|WBvhZ?+bI}^e(8#Fn^x&Kb3T3o3fKud%ouT%8h}3ogkE>@x~fx
z`0;l+x@pWd{=8L#rX}~*c`v$tNK^IawQDk>g<pZ+9p29UT^#hUs`U>Hef@mv{P~t@
z&p?Z<*PrWIA8-x_)<gnA<v9Q)rr++aFS^-{z9{|*eocTn<_{$Ejkoo)$86+k-|9%u
z8-;Cs6V<FsxW<%d-@Tddl2FUT#(p|z{~S@5!c}t9C3>ugLfn{6!irJ!75SPHSzXg1
zk!HLYs@y>2P%>3+8D$_PdihZUp54S_KJq~&wlnEazI%CESsh~TWtdax)K)5aAX|Eu
z`F^w9cLg1Xszt7(>=m_H|Azvj_N-qY)y{m6FMBw)YCP~@t!Cx&%NrBltHSrgQtJkI
z8K#Q4l>h7f;HcdDa1#4<P+9om52M27@dW4k+do=9Ed=$qc6$7oRJ}qo+fRPG8V2z<
zt^H}67}Tcr?H98SYjfqto84JCyOTZ_5spn!S3Wpc)Kf18=&ijU8vLGm2kZUY{hrhr
zRd+9A1BLam?wSL;y_G8!@Ges6I5o0zUTlqhAIRe9XwV_2);WE}SJ$LAUUo#btD`pI
zR`q|nnK=LF+qHkBs8M0p?Oc1?_Ws<hU*W}_!whguTz9(gSe7-oJ%8NQD#^NgiMJQ?
z;)C*9T6p(Y9E;jZ{Q4%>fBnJ|SoPP1+`$?3THn}W7^rU~3hoVno#lJ~Rw}J+lD<aw
zV4cm$XUBlZ4KWB&#((l&PfKF>;~&QGb({C@C3#PQRP$bq_f0Y3TBXv)I<8RVmQA+x
zXMM)M+Zm)-E7=TaX1{{!X(I}v`)!rE@Ft*nQFAeyN+de2myrLdA}-C;$c*P-5#i>K
zx`X{@;jif~(Pl=A%sW-1=5wd3T>vsqC-=NqtXUC43kLi9rYUhnSncu;PYpI=)5?|}
zNBs9LXhO&sGt!Yi@@M!TzDoDU`xpFN9^IJa_HC0E4WQ$d0~S+*F|I82gwIlAVNBns
zWatQ=_FhwOOUP80?D5+eD~&x-<7I)H%TVk;S`XiRlXsqN=xNmVi3bk-@yB7gz47gE
zo`3gF7FJJt({o4(o5TBm^?vv3*+r8aWrl%Ifu^-Dzpg>}^GJVk3<cTZl`KYBqdx_D
zh$ZV5#Tllku*J(*^h@Qu(#BA@VAsVP@S+^?Wh7v*<iIx-?jOU{elkbY4)yRN<Op&N
z4kE_S4gj_wrz-J`Ij1f*4gH{VdYrt&@B--1zj|6WVppq@IXvbV3k-O(N4V__J*6np
z-JgC%=L}j<<pXGg2tEFc#jcG9BK)scnW#Jmef{e3&^<k77~M*l4nAQ`7uEx*79+A@
z96be0f*F^R(gJ;`(yIf!ecWsy3R^3krQizN>!dmodFC&D)(5N+sVB!e=oATJq5%14
z2ec(w&PT;JAVwq6i@%CX&d0dP?139S1T{!xuJ+;c2|5=<Au4p3)X*UMP)ETJoZ&>!
zl5zi{{8dq3heKRUsuBOt#?>-TM<r@ls-`HHP8Ep;^IHI!I>aoCz;Gv!M&Aq81CSJD
zNeV!bSUpX#E~7J3O7d9aC48utnME|7N(8_x#7lIvCQ6OfhZT6;352go8WKtxWy;!2
z@Pp)&&j6kzg0S`^R1&0#7)FmQLM@lO#&Hr6$mKH$9^KLUMlsOL-BJr>sk<ou`Nc!Y
zcsbss6k&0u#y*251SWb`Z<?(}hNQ5dv2x9##Td@=aPVc^7+w^jxC0xHWEM*5dr}oI
z_<QV$E`lYJ!of{=U1K_WWWwcDo;-`UdCDshKgDa4irvV%I1jUrl5!9nw#jGHoR>2A
z>FMk?<$UOAaHxmLA&DFeaJfks<^qJ4Sv7{rFGjPn_yR_902;#O!b?<+XaEa8IZx(P
zN^A(FVq<Zy47VgTEKsrN7{#o0<|y0*2p*by1y$tbpjzV2@uzwDszO}W&k?uIIr}9u
zioq1SKbfp$%%H$LKBSyzNlS)GEbB_w#<*IZ<nlO~lhH(@&K-2wO)`u}!fi>Dm&VMT
zk6m4styt2YbyNDbq`p;hsZpHYN!k)nI5tK$Rvkvyq-Y+#lHU`zTxG83wh%uOxw_<G
z=9j1ER#tqY9ILBik%7=|hZr5cu|RuU-7ovJapj5z#Po2m%rsdZmfnb=i0C3-JAq6&
z%r1Q{OF9H6v+E@ug2il7Rg?NGoIvVZ=3kCb$+P6&!WBI1qZUa3jXXNd@02>_Q)TZU
z<KgRSWHs33i^E|04He?g2Y3*BCO-DP%MFvv^teW$c;%S+<}!X@tCAQv0H1%&O0kiZ
z8bRGFkku&r!E5Hd4k@-IR(OSZ-Hz$A(4I86qVz_3=@)pR9#&p0FurCc<=83Z^t#;R
zt*6aAfzxAb*n!NGhcCZBZ$0upkkapd`Fw_Q`G}ACtAN}@&Jwb5(rw;K8UBKtL#jN(
zH^6(@=L%11MJGRMNm<=ky>d8+*5b9kzj`Y`X2;N+461IJ!)w1-O$)OX{5Zg>JC(lW
z7q>xj)}`5tdA(ld=qVax1F)Ef`NvbrunitJ%#4`P_pw^Mxf+nL^QY2$n`5(=y~B)|
zIy=wXa?rZ&|L`5Aq}7@+@?2-CiWjM|<O5bS=HN1cH89Bm!>#m_TEBaodQM9^aXsa-
z8mnD7XKmdd7ONhqJylrDh4eX}FUzaRTdV&Tb+p>40(s<=8$Zc;By2P;eL;rD!{>`|
zJ|iH5E_q?N@o7Ts6UXP}=UKmZJ@oFJlWm}s)#^_%*iKpKQlAROGo|I&A3dE?KKIeW
ze^PbT!os*QqV^(f+`=P}aZSHP?hL|3mLRPq)WL+RfL?xpfRGDPOFCgCRNao5CEBlP
z-r>~R+S*3{-b1jKB*>}biEv}Ou!j8lL9#u6t*Thi>w{musMG74lKdL&86E6v53bcD
zbfh<q`Axrd>^4p|WBg@-zL55PyeYw=+06ghwF@?R;0V2V2@8s<%{VmAbYy~5caE?n
zXTA-qU1cBnc%M|s{aW;Cyo_AUc^G6mXmQ92F<4Q3vX&)M)!#ehXN94_@<@3{Papa9
zvD)05r__r*1E7vap%z|;b-{bI`oHTh27WSrS~b;buFtR-JaHm0Z=_GjRCM~`#G?UP
zLxZf*eOnDQ9=p|nz1i>#u5RL=&Mp7fVj~}0MJ$B_1c0L;U@A;nPLa6Lr+?{tMP6As
zU_6iXQSQ%j-Norf+}i@{pNG`t`ztef7v~PCa~Usxcb*1f`)cQxg8X;Z|18vSNIYY(
zq(NM1jIx*5><t%2yse2f_RXF_Nw^1VI+Sl$6)(msBtNs-8RXE1!OzF%mQ^y28KZ6W
zaN2tA7vmqn{=^CEiPYCN6zc@N4PkD|fcJ{-GRHG2NezHZwxeDL&edz*57z!^&$Mw#
zd%W+I_rgI5lnWgE#i{XjWc@V{J!U}m(c3>fzpU&6^z7*wj#mG5THu*TA%3h=)(3>4
z5aRg@PRJEs>l+^hr1J!Sji4{FJXi~Jdd{d=E_6l#^dB?+*Boj!MOBh$QgKmIg?<_m
z92V{LP>of>BsP@=Hd&%;F@;JRmEpb|Wm<3D^_WgG7L&xD=hB%HYSgNgv{#z6!!rYy
z&Ix&-p2b-(C7}eiBwJ>;wWXU0mv$y`zOT%DmBp%6wchI<>gYLp=<_P-1S=cdYL0J4
zLmnnh>C!?ty>q(H6Yew{*DITx>a$o=IhHx3Fv*WAo_wpgVY1R}_DA_@bAzgGGb{)2
z1yj>U2<}h#J>Vr|eo4hzt;MQ}X+@*O#$3hLzQxu>#m>9ME?C9>R*QYCibG<HL#E2r
z2Q60%RjyUGT&q`cY-@4sRdIUR;xwsp{X@(3FDlL}EzW;bT=rXBPF0A|Rw7*0m9Nzm
zsp=-(>UK%hU9Hs}tLkCU>S3<xY2WJUqUz;++Ugao>V2!#J66>vvDGJ2)%Q&6SE%Y&
z+3HuX>fhGt->Vw%vNd2*HSj}g;1|`PmDZp?s=@oM!KbPr(6$h`S}0#zC{is<x-IOI
zTDV$UI9Bb3LE8;;wVU>BH(k^syxSsz)o$HtyA`Vznb;PYsdoE8+wDTNsLHmedbK-k
zZFhRrqF=T}PpaMh(02EWTFfs;wHp*kIz?q!jfDNIH3qgc9N>WgDH4%FIUq~cND>zF
zk_XHO19In3RN}}88N3jhAd3bGinSvTz!EqzqM0m*!=&iUYYMj`;>aqd7?Ix;?8sp3
zKd=I^9cc(ob-|}swrBqO4<#8X+k8q!O!Zq#kvU=gJp2P`?wDBVcFCjmoDYsP79byv
zntO|iMck&a;H3|!DmWnD4RET`-<-mZmRBH(34s=?e*acSE?kfHhaxI=@Zb^zL(<Xa
z)+_jP+qw#jSsk<(0W07JFE6V*?Wh<2>aYfM7EMMLBQ-GH!^OSeM=pofBZG;f1b!Ky
zLK5b&MEiX{DuSOP<)BW!G)(@|fvuueX+lI`{gu=~4zUAyG0a{4;ip{j)hy)uYI-%3
zQMD}nwJi9$ueXH|7<m{z$-T4bQoPmyS;Yy+#|lBmX>cPV)wnz4lr^nyP!K*q%N#;G
zR!@4WKeqZdKex{1sZ+9OAEZ6?p9QU}TWz?b@=j_~SC=D%GD^kbz#`~_CiszMw~j3B
zHb3G(t09si)PW^YIakRl4w2S0FvYwROKk50QzdgiFTPOa5MTvEiVA`%*G*L!(hwX0
zVMhj%9q+u1jULJDR-sYla8yf&ZUnLW#bEbKIAkPM>(zf+udB62yR<CN^eHzeDjS0q
z%Q^}Ugjo1+;~jPNS*;0pyt3R~1w{O-NwEA*+cZ}+$s3fw0#uFzauc;4N=FJgbYkZ_
zMQ!d1Ie@G&9oTL##jz84qa$r!gYtmTU_yBC1zh(}=Zo~gms_`Go&I$RK^A^JM{GR*
z(x&khej2lg)LxWse;BS#QR?88#K_CtX_D5aV70TP)sybsjj6o*ps))udu-87l|vJ9
zxQ3rJoh@PfdkM$|nGS3XA^B7@-f^&22Z-J2L_Lmf=mksUXkhqzp1G@Y^JC+sPge?~
z)zAZ@e8YcS@EdUKt|NBq0(N_}b6cl(XP-LphoT~RTaBb6G)2~$*Ek67s`&!`@sIjQ
zr(Yg0Brin>`Rgws$*O*p5O)xMfN;}I=90B*j^uFHPZv^;*g4?vFwBxLy03hj)6+Qj
z!qwIre>uHOA1e92&>Eq+3K0oM2lo<35&5c7{2beAm(n=>T|>Ut$Yi>zRX{YE7RCKf
zixFWz`QL{d8YI0jCCL5ldfDJIQ+>59;yKJV$%b<B&dqbyF3CQYIGnAL8u7q3acf8Y
zoxvFAbixV$>+QtUO6+BVhPns$-=dmQ*1t15M*=r|-jo_WP`xX7)9?Qe5`9(v1W^wC
zgi9W$u?QC24+?)4iKwC7IgwQ84m&bdt4rNa*i~!&eHC?_!h$b|zO7GZO|<W=d%URA
zGkI+M=cTdXe@TDpU}VMHp<iF-tsFY$E)<3T$iKe7e~Rn_K!j<1AT}*T|A(Mys_>_v
z)GOK7=P)I*U(Pe9p)L!bXT-*MkQ0z~IfzO1)ssgVI=fm7mP3g<S>BjrG&e!#G}daz
zdl=y<@vMGzN?bolg4v(S;$zG~VUHbQ%2YrtJgl!=^3yWRK1xx~>Sbt|&mNV3e#AM3
z9u}UKm<^&b@<WjxFlL<)Sx>Qfx$Ft`*e%y2_J)Dg%HeurIe4vR*1LO?A|i87UL>t5
zzc$liT5IYMHUDi;xK}i_#(Wn<E#XpP5i*n>iTas9xHzY|^om+HpE+iC{VvaY2haRm
zJ4H=d$Ok7Wl!0g%J+gt#ZO*-l>uQ+ivN+b`!WhcGxo_LZ@TKP4mp_g|d9THa>E(!f
z<`VbjytC5YPZ=H;M_5Vmlnx3C9~Vt!dY5k|s-cX@V>B-wmQo>XJ-71c={1OG9-YFb
z&A%8Y{gwc~8uCn62Fp)oe0(QVqogrw9jI28ZoL(G#_32lL}rL|dM_vI+U0$_e?3Ov
zd!FaHalwR~jX_SkwA{F}PvK<iRx2;jN2?|2+JZmIa(g1iD~x}{5&nyJe)RKcZI9ru
znwFEA?-d^zD$YM{o_+MYaa>zytvS85B3<iqjOL_j0juW7?RPywf4X-U{`-U06p;DS
z13^CC7+}Ljm){z}Ki+&H5-YqlB31Z!>-EK6;q5V%FORn;E}shTOey@7CdM3g$c*0U
zX3i6TD;<@%o8-iozc&}y``kw-4)78sR#}mRMA6u~gcdImB+`<8+Jdg0ri3|O3Yjl2
zEI9nxzuX`fn{)SViB-|2blQcHA20uXy%$>*d6{In_b<61aU_$Ywy^NzaLqm)DOI;&
zP$=<ELZ3xV$V|2w2bCG2vgFH5aO~yaq^?x4rA`}27l|=ld_0L7-UegVpQXn9MHy|k
zr(oNQAVwiS(cDV|m)mhrsT<<R1Pc%!zaHM~GdxlK-6Fe6*uww-6W_4~LC7PN!Goug
zEe*CXR1^YnlC!*HPlND9g9Y@R7^yLhX3}PfT7|QzaRl0sX9%8sc7&k8<!C6|x5XX;
z>qiU&8R0)13^d=?du3a^zg*UT&q_EEbFDvXv%N@s@v|&zIcDTkb4Ls-<q@ir)^H`a
z`+yxC=Bi70XK{4G*{&*6%-#7(&sH+DZ1poo?h_lSmAaxh2_KkcKFw1s5j;#_&*rdT
zqRMHa;Cvd(S%`i;f?%$e@`0BT;VX!n^ia~QK<W-~xm-nl5O#Il?QCNAyDE}Twe%fT
z|84sKM?6~5QIPYhR2-woR1ti{u;l#JWn+H3Voi_d)%*`EEBLFe5T3xVasu~CA+P$2
z&3=QJXP3Vd1m>o?F8*+2&l<)J6lLIezdvs8w!70z%(>%~kU|?8zOsXUT)4@Q=2}#;
zkpLE0wD3YhZ=*797?jScb62X*Jejfjp2goWB7Pb2R2Or4&L$}@AVSmjr`5wbn@Vk-
zr<S=tZJu1St#;<AzB=>Mu4B%&K8B~pb;cJv(g|-`0@wNu8)z*R+ciJBiS)Rf@9^WA
zeOGH4@}J=a$In^p;YYbb<mWGl^$Ki*oO^;~TRF9px!K-|!TJo9mu?Ufhe6T%4dlQ8
zjrsoftxFPhw|Lfkp3K3UUzFC9zUjMijn2M|*lQ}1s`lOLw0~C-(O8|Y@9*;O<6RnW
zd;d(a?}wl4eU0y18t(pba<u)_QnJ_Hb!FZA;RUB(&JV(d(i2^7YJP6xz0&m}|2I+K
zKlaw8(#~1iKT(qvAJ!g~HY^-poHJ$lym{`u@H*h)oxh)4PD_5wv{w%Yd%yXF0epGz
zEI+?KR$!j!P&-q<tYYBE_qgM5;e+t^;Y6zX{37V#`*!Mhh~pEe>w&XGFJx~c<*MAH
zy8*Xa(xf)oKWI1y<+Tl5e7~7tLdisY!HBBse@mU_a6jJSe`WL{>GBKBMYdnfFAmZT
zqH>));a^KfWD3G;{`D^pReXJA$Ey_kk0W!&><r5(Xn;23VAASdWOJh_@ivG-WT&o9
zxRJI+(V;0G4Lbgw376F7@!u4Xopqkh7xOrpGd+kPxLef#B1VisjJ25AVQRa8gA6l`
z7Uarb06+ek1`%fk!tRSwxQ9qd<{pE7|3VCipR>GlznosH_Uh5EWwT*3H57zl9a{MJ
zHj=TW9^*8|)`s$p1oJ+3-^L1+I^;gnC9x4W^YdM8`hV<>T@}d6NGdl85a-o<sFZP{
z!V#Aa(PGf?ZPX9Vdvc|nm_vtnqNlRv8klvzN;GVWS*RdT@kqoXTONO+Up5)0P;`wo
z4}Jd4*ce;Xhpu2Lhj#M2{xO|>_eQ?`Nz4Y0L5v9GAf1@2?peemZGar&g#vvYn}KPi
zfg;EdL&dFzq(m7B_{?giT=p`YsJn_fA`TOJ-|PfO$G!HNfoVJr3cux~L+89IV7%b!
zlgR*P!6I}n`7GU}ErYoj`37H%i&nI{Gayet7``0e*H0B*b{D=kV!)oWNE4X)3OP=e
zP(L>U&-_Q_`1k3YmKKTO<sAm3AZ<k8T~U@6rhwsD)rgC1V-nFDB!$Bb8NMJx#9(eq
zyl-Bhqfyy02b7MeyM~x4V76b<A~bm9rKlMp)g#giIXGpgMZ;%{|C9K|You+oL1uM%
z*CRf<pQu_;AQ)))1^GLqXH21vm2H{0_;sZJ$Iu@*&kocqYU-utT!^vZ(=cJJO&xQM
zM)vPo%PE4g!$+|Qrj(Ec@hHHKnVay!y0|tFw$S(e{L-#|N#_(w*b9D$8xU#$%&2Ba
zM&Z~=<_F3HfJL)s=#pKFC82X6;-~rz*t$${8u=eOsE&?;+5{oP`j9>iSSu)V-?w8c
z*%MJW{s16rG!P-&kJ1IQ_Vw|m(3ojcCj*PHH>qsz#F&m<k+XeF{lvkke)c|+pcn;q
zWG=qcFN`JtkR>~LL~db_=mLqUOpNX2#5=QMz6~+XBpmBeG2ids`x`X&wJFqlGFy2O
z?>P!DiS%394LN`pYVJn~ZlE|rIYcNTRd}KAzl8QsoL|X@q9w?lV$Rsqy(v7T7tgg>
z%&AZ!SVlt81H~E0Oi2KaLm&%r94QXu*ehPnBXS+#1)_+o*<@Y_aFLD|5Wm9iv<Y5Z
z7pf`-FXDyHS#Y1WpjZky#5el6BoHDScn-cP;R>>lyc;swwU-7*PLTy|GDLVS>GBGk
zPtd|Ln<!(1_*+ZJV5soSCP&Mn@Y(wbWJyjHbK6dFw~$3e3EYWzx|qV418x00h{>4_
zp%k;e=x2$N#|`vxzLPLIciz462~-5cVMt=q0<bvsAtwOP7eybBP#k^$_7`HDzyCm9
z6hTjL$RiR{<Rp@gV)SY}w~vQ35Lpe0{XHS#ei^LL5M)vjvp5h|=8B9W!hVK;saIH&
za0qeyEMgI=?<%YcguQLxZEL)+>k8`$fibv>C*kC(v&08Bg;re|M6#F@$zpdGhiNF$
z)1Kl3XSe{}m4EEKsD*_P&6U3dC3u7qj>Zek7Vk!r1!+Km68twbi0jOie$I`%GmQJ~
z)P%6O+&&%Z1?2JqBBP4t^WGvi0I;7HtbTY{9u8)@&ZkQG$H*lzi$7>K=aN7Rm$=r(
zm<VxAqe86Jj!}ZqDB&0`iLo*94U{@ZxQKu?N2U2CwKse;vPcOE^dz`;DHOzF&D9Ik
zxQo{~CW|(sKq4RkL(5CYD9yI;%Sx1g;!5g#o4d393g!kHrFc3GCCs>u;%`J<B7E_n
z@XNiH)Q~_v@-EhXi(Cej^Djb|P>eo4tPOogCpvQtP%x$cq?yR4xOVOIDV_ZorE9>=
zLIJ{-Nf)lZL8e)W%d?B3@#3$ikO6pDMiy+D&K=iRl2>$I4b2&azre@NE8+$l+A?(K
z=1^@y=ix3&iE~bw)QvFr=uU8nxXD}6)EBw9is6@BF0mj%kYgaoI}_syzck4qV!9!|
zg<q8v7l^|lZkfTlUAakp$a8pD%qB{C12tiVkZa&26(Qq__>zbSsips?C{p5rewPkt
zO$xmz1*np6UaDvkm%6O&LHjiF(IpAi4bul%%$2N{-t7Ds;<zI441Hl5x%>v{{HLud
z!$iVOT|``1guuNRE-1ZZ`R%-w1VxaJ=iVd>#@sw?3}ra2H<#ZH=VyM4gf-*zzKV{J
zg=-eQxOb|>Y}j8E@#-%_efo`#@T|(s7mx!dhY)yKA8PqG{HvQvxfo|00KP$I_F6=F
z?4aoVLZCC_d<1JkpFa2|01I^4zRA0Xi(!~SAWPUq2*$ZNM#&^M2%a6Ss$a=1z65+m
z*b^wgAId1%`}05^<eKdFV?SEkN-ddAzeD+Cnh044ercA>M*XJGAoBn$c>uUDg*T55
zebI+v;8Fg}24^VdMejk~nk~;V9S(nw@=4oG{K1?xwrPU<E^uyY+PYrVMlArDQZH$C
z6Z9;?%h8teSV1&<`<0JvAWzfbgpI<7dk3c}N(u&Ok--o@rfR?R7U8BW!GYq#9`ar%
zLj9v3|IR&;@1xiLnQ&`>YW3Yj<lKN=P<5LT1q*M9?wkMh*|PJ_AY+R7V*nxn{g8J&
zObqPE-;<~X6=!qqh+nxpF(jS{GSA@z>WD`&5fDk`i?m*Y>i_Y9B1A~UA209%F*_m)
zbn|1Bn~0m+oe1LxIZ^6%#{FTULpYcguf&$Wc&oCyd7^x^wa~_v{bup*>RVG3NR-=N
zVfdXF^nqm5Vwh{VN7UK!=?jW-#USu7jjwD^=`u%)O1s6pk6LdOM@S6WTfIRY#MO(a
z{eCq?#%S)M&fTPB-3u7MFPVTEJN4o5bV*ZKYzj1(LA|?&ES|K3P9ydB#UpY})Y1h1
zzDFv7D3JXtxw$sgJjm7JgQ<Q#N`S2nOVY6kca0bm#*M=m2i`+S8jC5-(0E0cxV=b{
zon)5gHSsz6Ejh}CcIg`rb=dVk_)eC9LvXMt+?}L8uyGNqpMAue8HjNaa@B!(8P8-W
z1`%&`=|@O7tc8JFVnx0xV*e<|6JZT~q{=qlmi;KWe72G*GJ&Z2Ec>qmT*TvGH(~L|
z>%G6kdSv$YUkhHZ#Qu0Gu00=K?O%M}1_Z=wHkg^RzREk~0_ncm6w*O?_PeWy%o;S0
zL@vB<Y2=13tOu96@}K?=vrEJ)HkrwLVjjLJJ|Nv=#z#sfMe>W&;wmS#6!_ztGC4}|
zidp@fcTwp6+g8c<{`(NFpgE;5zI`JkPqNB2B$wx`yR0r?4Y_HpSUC2#S)fa||17Cy
z)f!+ZJCN{D;h&g9HReh3dQ0><NQ|_nU1qs3QY@{%te8|Kz1|;RhvVFFRfs4yp3sYx
z`Bql#!B<D8bS`#8w~5n>X_r7?%N@yXROU8H&eg3as)ggSxWJVX0CGSmhQuoZDis+J
zYV;6EiIN%%>S>*pD(jS-W3R5?J=<BCeu{C(yNPUxK`V%GzC)K+QOxx5^)PzMaWQLl
zKTDVxe~v5jX$8^jqbsLrk>FETWa9yM7>Vs@5f0Mi52JHixQWUE*^6*Km^p7@LRQkM
z!gsiMCz*rZ2mg-e)lY7`HF6S$YnF9e+FGno7599HYxaGl;`MPka!-mme7DCA*WJHN
zxo>jr-a|)PwR-~FZzA$Os>%lN%(f`y%_C+PBBR+Ngx6I>nGQd}f#p9iXp`8&h#a$I
zUQ>GQDGs6x5dY5}Y(wPK?pxou0;csbnoyAKVyq!#7Go5$t`Cu7h)lsVr2zTUK*C~F
z?8u^5#3F12pU~$3Gkp=WRm{fgblH!<$=`kbL;@MrALK=8yDot=L+uJ)48QZqv(Gi-
z6urcCqmD824%`<Hj$!FK?PCn5!;ktIw)&7qV<;PX?Hz#<?;|kaBJ>=v>(ya{Ify@_
zNU0Bl4uUX~7Snf#&aCbvkpaYn0Tb-#OlUV)FFbk`Bp|-nEK$NrD|&Hd9yKzDdi05<
zq7PL;pQHUl1stJ71yftv8SiTGZ;8Pv^OBN4HevBBhyG`w<t}}T*Zqdd{({+_E{ig1
zWssO|G|j(3ewLu4n0~j4YvUoS#jMIiPGL}oZ!rU%%%)7_SZ5QZpIxVq`yaiiUIfQn
z82r}#^2gl7X1C<qWzm#U?vX{<VZ87{v5@J{zP~H4&e->JbWwInpY=7SQ$dlp|9$=_
zOJN(hCP8295;1?_dIX*bMmp2~Ma?5=IPly5rUmAZ?RTGt)4|$wF3=~G+cDo39qyAa
zxdT+?b@HK?C8xOZJgU0#*oo<BnNR?g<Nn<@$F3g>MHab4@79$`_&AC)BSiO#85SOi
zR^5~^{;YIf>xc4!^m&T#!J=piw4bM7`M=M6XxHkCOUdCy3{zTmt8`{<*|cAkB7O@f
zKhc$A;7XwL%B`N2@ROCmn3Ye9-_OdX)PmKl1!NvsAp2xB)A>j7$&b6*tEt*6<qInh
z7k=Co{Z(J^vvOf|aN*bR!uOVipYbQZI<(hb7OZ>_U3*oqI^OfEtzhl+$I03!=e1WS
zzmt1J@(Kj@oPU%qto>bB1IDg@?fC(Y-QdCg+3Z=LT-YFMSI?rDV4ae}<4f+IqBX^%
z)ljf@A>zoDK^qCy??b}KI|_Z=N2uLfeaKF+-T$<AyZVq3V!NOExvj7}2B+Iskh?~)
zyN-psc$XccFZ<Tm1EVjyu7x|Eg*(1q_KcAGH+v86obF`B9$>$m-MOEBdPv6pQy~6z
z?-lXt-3!L<ck~{boc_aN|F&TNb$vOE{c=1Qd-PxLQQ_%PIrccYa32U7gvG|8`G<(F
zzu;Llx!qQmf`<sP6};!1Fb#CP*BY<t@5Tm^rg+3H)0#*c?No;<V6Cq;yG0+SBKg83
ze@rg-N64@}%^Arq8qQ@EAu#ySmMqc;Y7u2W;L8(PP?G|us_ZBFtS6mO$IPlVv(G$6
zA6-sWt(|KL_|$oKw3S_|{l>4k=c#J-3(uqf{qz)A5l-ib^L<R!%|n-kCmZOh^HpwE
zd!>U7eCJt1m;R3_4eG`yq${7P-HPz5^PGY;4<1hsJ!(1E|ICOh<%+xF`a9ncHL8f_
z?$7u2p_4DJ%qjcLJi88laOJ<2!1+#U;V+SY`$6A_3a2s7T|2&u<EbwhFCEXX&CXoi
z-doF$zV-EuLF$9aIjtM>6HnB1>I#DE0}`*tY|gAa4m;RAz2$s&`q_TrO~~7#{F{Ss
z`sgu>4-*Pq8>Dz2`4md2UUkpZyYHY>Zxb=$nVfFuKui}%aIlK`oaCONu|9iWWq1ST
zK_jpmd1S@9hL~j=%fIrtXQs{MnPX*U<e6*doa}l3TF@)c2hK4}UU_aAMqUpc=6pOJ
z`PFr}qw^Y=ydQ^67*#rqb-Q^LM6JK_E{r*0@+qRQ8?UPSyifKi2~W5er<9`2>|2&y
zchkH0zH^GK2Q+j_PyH%;gb3rf@>O=mOj&`K6~2*&<-U}3nr}_xMCZ5SdkZPm&W=Ud
z{`Ea4Pb=`v>?Xe-Jc;0Vc{WU$;K|ZZfja-BLZ0bjqq5d1Lq&Dmj%7gG!fQc@ZeK<<
zA2!Tbg016c-DutQff$zHZqtgCl?$`%BmJ;csjflTIN~h`D!mbw(Nvs~;wJnpC(18-
ziqk2hvEbZq*-H=Ba2x7(AJh3&R|2@M@<}|NT4EP0M0{k5q-YJWo8-v_k12Y83>pu-
z9twY4((M~QseO91K1P^+<R=)~Ov3vqKgPjaS4i&&+~Xk)y2xok)<C6hVgrLA4Q+an
zQNV!Qui$v=d4R9P4k|<)@&?!X3ZjQsedXYeqt1l=cWr+v=CoFljqTVJ<8VV5Z_w#y
zcTX1+k7d7Ij|ZD|6g?3f!gCh{fsMF@#h9#Kyxci;&3<)D4P5)Cf>OIYXq0`|^yd@(
zXDV$k)1qoCKLj;_p)Bsi{U$f1_XFzZF3N>`dp+v!zpOf10)6Z_v=qJjUSdvfa5T7H
z`gu)(^#n|~jJz|=9}qsF(AN~$xiL-?3F3=uSl`$vceP+Yx;_$IzxFbR3vK?8K}eYn
zILN-$`Ih_At#5{+`=W-`->;irkCD-{e}`wSUoGWo2XHFaDD)#zEDY9UikZw|{oL8f
z&L)10I+3WXFcQPvM}0WtdAGdj88lnc-?`>%`!q~moU-O`*8?*EQ$}v-HM<MWcpJWM
zs;q^zr2}ZgCP~l4C?u|DX#iSV4AqH@=a`y0r7nfVrC5f9rUyi`C_QSWVMK?}S8Gb|
zTjeT98GXCforgN0sVaUUpZEXPAg<Gj@3nYV#<F^$3?D(#wia7sr~n{8qNgbCkHJEA
z!UC@t1!}ptGjFj9JQOkiQF*a7)aph%Me@j%O(6opw!az&313c=Y;e!*{_W||dPZhb
z_6n<#J9i(!Boz?-$LJf*<^H2rlHTW;9+_lU<Q$&;^$G!az4%>`_h^yP<?yvrLryt%
zr-<DICt+}0M3En2npCyY6ASW*$E+t$MyF8o7JhrHtx0jkGUu4=m3U}{O2M&_mb_hJ
z2`JX$Okti<A!w}+?4~&Q&d>1D{pA(hDK<qfAa8)X6!gUCNgP+|f-&bdokQwf)!RIR
znRGh6>dJnyq}D5c*ICSqQ(ne*Ma(y=bT2-&%uIP#aKin>H1Mf){?m7r#y6kZq@TB~
zPq8gMRIWC=&S@X-H&YT(E%3m9Na7P}+Ln2Val^3M@s3wEhtE!hP%arW_UKCF;(Au(
z%#*gg*R-CWw&-Y;T$h)|4%B8aXGih}XC?31erJ<sX_w{Pr2XyP4Lw4FFPmUBfN3qO
zI>_ar(aT{K56oadw*0`_&KraevyXD6#su$s4Y{UC^M9>FKe<>N^xvn?6Lw-f`8**v
zM;+&Qf3<h<B(ge`JpaPU*w!gh*K=R<^z+%wR|hD$F0?6i{*K=ss!oap(=Hb0Sn-Y7
z*oW%8Lr;7@4`wFJ>fKiH`4aj=qIaq6wUfKQwY&0CN86}>jTrFW=~6_W=bb{&i}A$!
zG7fzV5e+rsax^BT_CB~gcfz-)=FCE60_PQjDBH4b>@EjGGF}Z;#@%jA;mtgZt}pKP
zTQQ?n9e4w>;_qySWkzr42@)^^n(NhYBHb;&_e>bJD4X>N#NYR#LHeWc^dj~-A>1pM
zoTGltGt}v0U))@ndgsx%^n}}ESNHBcd=ovba;t6ptZ&TNZTdmK9X}RX8lGP|#g3tV
zd>!7JlfM~leR;d%Sps8oQJ~*@^67m0g+5w5=Z*RPmV<)}<vvs?i!K)I6q)0M20_b_
z6U@%c(VwTNqU+E6u*<h*YGZEN8{?rGRcaTr5d{7qIkqs`h1rdo5m-f9z-Aa9I7Zbv
z9X-YDuKeKjXi&t%0+BV}m+$#!M7dkb(*uH#LvtR7t*!3A81r(JExs2twzCn|6<UNo
z{_uL$2~-L0OmURDw+BVXg+OFHN?&643}ovXQdMb>c#LUrl67=AR))-;5UJ9q$-!s^
z)>*vX@p4#c9j@b4%pH@oaP5$T5!Kz;-E{_L>H}uf)4q;m`E}UG-3@<~Xd%vQw$}=k
z%NQ|CH!n@ufbIPb-vnJhUENo;esh(wQ)Z1>&G3zSSYS3;cHwiKsq~?1QQa<Nl*o`O
z)l|?BbEDS$`L8>KJMZqAxi;RCUvLWRnw0n)9OHzCH4^o7Rj!A~H<Op0HeT{*EW&+o
z^YEG$MtQ9h36s2eMA;s6`55&#8s?gxkN$h@UFZ*`i2E=1X$IOg`0ao(9l_ls?jOg%
z4AXx)yEX7d>w$tDY21gO#5qMmd%o9vs?PrBZ^sX!gPG|p*utUu&WE)6qi<iD{_0%f
z+TnP9^cfWY=DoDz*0W2|KZU-Se1ONywge;A?>#y4tKTdOcRG0c)N}eenE)}dWWEbS
zeQ$T@mg-&#z5eF*b^PgV5ordHkG{baPa6HU|1%Z>08%w`wH?5^1-Mf@!*eFzUM7WS
z63AO2@Xs{7Ks#B)=Q3n7;;n&wZQu288_YMPr7naazDwVg^FheNsFvbXMm%-Yn|iQK
zaciXVPf-W<sTi3!L(8~!Z`R%W*6xaNCRH~L_~TqT<InTEnMJazS5b}IqbH^0zuCec
zs8Ry)u`9aJlRo&5Fh~u6-53Dj*pFpQA~87J2Cl;MS3*B;1hcjCo+bUh7~l7#@V6Ub
z7gc0GPqDQl!cT}vbW+j>FsD^g`~gGIhb4YzPX3=%pt(gdvDGne^}0i2GUH-$A-`Mk
z?Da=^+7(HsDNkhBOGZ*2N2b(Q-B3~C_j(}ZF_Yr!o!VZW@^DtFd^Wi^GWA)K=k<Zq
zpI=i)z3p6Auce7GK)e$OMGR#xAr|ORM(=cW-q0k2#M@`ckScg2hD3^lNbU3fZMdan
z=S-(d>~FCD5re-65ZVXe?M3iyhs=Epo-;J)MU}by_e))o>Xsq)Aa&ZjEzN;o$4I8-
zI3zQu$5?F9Dza(J$>!X?G{nO!!H(<UWl}x%X_xm?g@4eXf3w8?2V_8-zqxF5ge4^D
zi6(h|0&!pDP-KmW7xPeB5@;8vl{0Wqd2V41MP`EUD1Sksb9Mm^NBNH!5Rf2wPXqP@
z?Lar=22gh<|C0(Sl~k#VP;!+S1(gdql~q|KUzwExxs_x|C1x3xD3)%376+sFBp4Q6
zZJCx``6O)Fmg4o6?GTq%LYGe|e8xbN<)sHgU`}hHV~fd{jp>+=37L`Em~^39T)>q5
z1{eL151YxEo#~mI>3Bt1UIww3Hw6=cF_$Co3d}G9by=GEbed3t7^~Tug1MKmnVPie
zny=YWfFYZz$(p-an&1XqS@w|Mmx8>Bn@%#D!D*XNNt}h|B*)2Z$ytf2q*6qt1Qys9
zlIfk_37(5t7ib^^L3uszAewb?nQTE0yWpPh37_%lp18mYvXGtt=#y>14?g*Kg+rRW
z8Db1J{{l#eDhFX#019RTN}x${Id_Jj3Hn?ET7?X1pbx5M3Ob>hVh{&vq4`9R=WuWD
za}d@Epdu!rht;4Q+M!X&kRaMZmxKW%`ia<SQ7Jcv=Xq&AQa$<r4XnTl_xTm~AbVz^
z4nxW#(qIki*%kc23dG=~j_9Ps&{FrHWcPRv(0~iOpbr>C47lKrg!7*(Dq!|R7*P-h
zB(|Xv`I=)Y4rO|#E_7#VI-HF_rjGHZX}Y2pTBl};rg565YUTzt<)*Jdi_cl2blRqN
z+Na?6r??fUiE5^VYKn%6g*19l4|oOrc|HH81d$jy<RA;~Xcj`M7D{>}rn;n}>JPg>
z{|=|s6}UhS{J^UIMo~iM74Qf-Vfv@Jbr1;Y29(;Nyy}s^+Nc3Wd>Bcr#j0k<>Z`yS
ztjp$!a*CkBimc9Rq3>3V(kgwH3Qzj5cSd?WhA@rQV-34d4__)4_1L9dK@P=$li*Mc
z(2z6TAPqR_5B2y#{?HBg5RXE_530HgI;RhrMh@u$t6_nwkE5%NN@3a>tOMq-*9x)9
z`g4p*u^TmDAa=138nG6dv1j><+$v6);A?B74_c63ky8vKsHtJ`4zkb<<j_Iw`3@7M
zufR|b?~pU|z=vM(vN791yC4hMU=0`uB>(yqyFiG-hCv-?U*y0F=$f$pi2)mH|Fu_(
zwOOmRTg$b^D6+jY50}PdTm%j}X0JWN55Rz~WC08mMXJD14CGL>{s5}o(4X>Pv~6p7
zLF=~Qnj=W-6}tcpib%IQN~-=a54)g`x4O1Hv#?zYxsfZmlS{dktC3&JOVTKaY?Nb}
z`ZGcbq+uZoIU^4p<fR;lbMjCO_SqG9>lLGWuR%Mdev2c3+Z6!|fcf<fW9x7JIJIC}
zwU#Tq!%MuyYrK++xou>VN)Wo&(*}s?Gw*;4NqH8)Kn?@jLD0ZtIn#O<*t&Upy|^H|
zd+V<No0PEYuKw_M_Q<%o8ob8~zws--^Gm-W%N1@#2hht)^FUul%Pz6U|C4B;4xt)*
z{?HFf_GFHyxHKmZtbhwGHNY@CzK46X0PCYaO1BKP3+5sV6bKCc`MW^#zV%DOC2Ybc
zOuxwsDX3}}&;Ws++D64-joi5|(f|xBoEAr^q_#>9{!1kP$`3(27MdBPr4_{8(6~19
zxG2oTP3*)^OtC7gDDR*JIf7o`=u6W0YwJP`yc;AG*rfqHBnJ!(W!x4$T*hbXGfND`
zZS2Nx49Bl1#fb6_VQ>X>AjWus3qqg;I6Oi8aK+@ZUjt_(<%pR;!p3o|$cxO#jf_uo
zj3|1*3OAAu^hLYMt7C+07qXC;JTeald&rTK$c{|PrEJP149RtJ{{=Y53RsL6s<p)j
zB?|y&t8`HeP{0M9oFhdF!=Vhkrwq)&EX>E7%5$Q5u!IY?<jQp+4@a<hDwV(SrM`3l
z1?mta-Jqqu>^!49%-!tG-`uFhJSR|~1;D@v#2^jQd>7*Chw(ID^+gU|ycX{ehp;3G
z>cymd0Sy|c&D%V};0(|KEzqwi&UI1>yHE_v3>Rg~yfQ^(N8ksl$`-&72KPV?rEm{z
zKvDj{2oRSSX)AjDtg!z)&?RlsCta!cTQlU~2ZqqRYSC-vX;J(jjr!{r-EahGAZ+h|
z2Bj6tJ;{h7T|L~4(nW35NBzhuT{G6K7m`537BvsOrej>t|GjQOPV>+PPyN$$QM%MC
z)KrVqVJ+5SUC?S`2rK6m>L3JOO&5gdR_c(yNAS{TK?htA2GGC=1FQrJea4UX)k96v
zV=dT&?agJKCTH!kdod3_98<&)24%R;cu@+(aKnEM*o2MQnJvtQofi>J2hh+4!WK((
z;0F;!4tjtFhA<D5*9mRFW4Pc4>da8B?T*DjaZH^Si`!XG4JYvD$CkY=M6KDwP25b(
z*?6&9PyhvC&<Wk31hOUs^ANUV)Cuxn2<??)`4D?TKu*^^ctW5L)^LrCu+?T^4I2&I
zIie5frOWBP#(`bjQ2YfA&;VaxQ-?s`O~6qT&;Spx|55xs0r4Hj$9)$<Kn|(qaDMP(
z(On9K=M{#q#YU#S+)aQH{thBn3aXXIV{s4s<=$bj*mv;`mnP94uEg*y;7!~F0000s
zU{hbf;vm3L0ssI4VBh$p2{bMMDgMR;ZWjvJ2G-zkTwp=-5Z#vW(}?X4N?^_U*WD|}
z<a!VW_=nMJ;nyY(7SK?|cQKSgki=L{F2c>@^}FIN{^B$);~Pce01)8#lmRTh<6{oR
zK3*3<F65F>a`TXK>M)cYln?x%<V-%{Pu>+w&I(r`WY*BKX3-6rjG4s1c%)_t7zhre
z2I*)(YVsfpR{(RSEo$k~2?-|+aNyx%G0RZE|Jz`$E@Cd{@>}LE&QV{0<}(iG%z#g8
z9_Ovz#B@#<cJ6S}Kwq5z1)Qe@#ZC@^-sIN!O2~draL5I{To(Co$*q+SM^FmTz+;=<
z6@I`7)qd?f)(Kj01Yr;c-N259APYyJ4`Hy}fk=&HA+DCG>g~enx_-Q`e&zs>=K6%|
zH{J)hZtuIU)NB%-1s|RhUDf@z-24RvqpJi*w(wq|<$)^%wgd$fT?&@a2GYP<XTc9C
zr_S>p<|rQU^Na7XKI>{;;{ebA_cQ@4UgIT?!o2<#25<9{$rd4eWA`8l<Sb+d*V-M|
z^I9Ne6W<lA00mUu4PhV+mS71SpBDU^|FR-K@-mOYC%;j$uJ5!C=e)oSYaa7fU&1us
zGXs0b@(^?Spah}C5A>BmXs^C&Pq#`CQ5Jm!6g6{9@AOcg7Tus@@=W!(Qtx74xmd4H
zTEFl41oka1>jMDigpbMtuTm9=ncZ*&0T%}3^l)8a`It{mZJ>=ER0?o-1;u~{)?f*p
z!1rnKfDa$|zcTocFS&-FPl!+J5J2My&;S5n00<EFvM;}6-!t)ynKys)Y|(34u;{NJ
zDX|ayT}%7;Wcw;_0S{2)G_C`_pX<+0%#uITCGJ|rZ}V;OyqnAXlj8i`ueH&CPt(uu
z0AK-HU*oT!{pt_D!rwE+z}Ax{{|)=kBLH#liV#cw3?4+7P~k#`4IMs&7*XOxiWMzh
z#Apx$25}udegqj(<VcbwO`b%VQsqjPEnU8ZS+WTL05(Q`5dZ*$$eb3$<pi)m90C9W
zVje}BROwQtO`V3^m{ICfs#VoNtD05oR<2zkl2alCm{+o8&7MW;aN|?9ZQZ_w8`tB^
znm2Rq4B1nhg`7=>7L^-V@L<A%qozfi*q<!LjU7LRNKD8Pa*!=w#=LcHVa}aBe^yEN
z0SMBhzjVY2ph0QVKLPjzNz^E4+O=&DKAc&1MQD|G{{~LAlaMR-f*(hYdGl@N&7CKu
zOH(=k2&jQhSM3`1N7>K4|9=NxGIw(F?}(8{pFW`;A#K#Zho5zMc>497&lHefKY$6S
zi|W_!0dWifAcK$=$j?3n7X)p*_;!<pp9d$@O&>0VV1z;qH(Y2w20sKbL=i_Mu_*^R
zd`ueOP-GFUcf!J@MH%7qutXbg#4$%5zdLcpwB#AfM<KV8MhGFg!AurIhGbGBj&_7H
zN-3wLQmG!BBnuaPu;lWhRfK?I9?Ob>f{P`)l(EJt*JQIzH*dTWO|7f}M@~B-GDL_l
zB!mnKb?#(Q%{K=nv`|B7ixW_(?%73AM-k#D3?cmR=bn5Tdk2a~Hx%?xPd^1U)T0vJ
z)FNCiEmhHZpb(-I|6r_X445$PAqN;q8Z}53NnlMixK2d{HdtYSCAC+Hx<S&|JG(KG
zi&7fv<_I*%>4YCm{n4kCceqgYw_k?^H(YV4EVf&R?upUdF8h&(5hLN)QZYW?Y2!?T
zI_X5+%)TABUw{Aouv~o?+Qqnmnbb!XEsRv+Psr|pB3@h=iTB{g_yss)jW@1MV2cj|
zhu4pV<foK@aCIyUOWdPl9wp!iV`RrL=D22?Z*I%uk@ZP8F=^hB`K*MWg-pVHG7S3S
zCvj%FX{VXed1PSZNsJs;idiw~_<(kZ>x{hC8Y7yYCcA92qyCs2X%gc(?DXad@*pS}
zYiRC?;7-VH|F<t1+ibu8t{H8M`Jp?ls}9OqAFB7h3>qyGTD+miBXS&a#`#_vaLqTz
zS#XPq0oyEVy1BHQp6`)H<jcDPrj0hnf~FK)+IUtTS*`#F9DTa+!;d=s>13BSq=91>
z-hDU7n%;Y_^Bqax(8C(rao7F$-~DO*^~HASq>aK?@0)Y+#|PE(gUNyB9X`z>2N$fc
zN9Z2aSJ&#DBk(=qol=zGqLU-K>4X-J5QZ>x14vgmk3Yfy1xeAN4F^o%JAl!;hUG&G
zZP<kta1p=(77&64u^;~4VF)GAP6!pdT=>YhLKe2keEOOPIAqbY#Kf&q^P^u?x@V9!
zbfOec|1gfq{82fCa3O(VD8<U8fd+#Z5h1`hLNWY-3ndsN3^5|&L7WIY_xPiShKQLz
z@|Qyuw$O}c)X@v|WerxK3^D4EMP;DD4{HEJOgYqwAt>b!KNzAEUAzKgve?8UO2ZPC
zSRx@0(hVihjS+M(hz5uFxFRM{j|S<ZAtYgthLJIIXar>_r=&)GWkZUOxrf8>$Q5XW
zX;ravPbtO-mMs}<i(xP%BAMuqEoN$yxhhVc7(>fSDRPLegaR})$w^hF@ROp1W;9Dg
zN_`n@l|G`wWFT1zAt>Pracct<l#nhiD1nJ+u!bc%kw{*e6L>~4(kkw;FgnoTm*E^|
z{}bKmk8B<RlFRf*C+Sy4X%^I=9mBviDTG3)Si_nhyNAL4$WVXG<DpZzXhk!6kccW2
zAp|{WNJVOxgnCpW`Pe8%pn;3;DFmem(FZFidXaayabWPoX-;*zQ=azJr$6nfCr3I|
zqS}U<d+P=cr9wD|BsC#3RcW#g22`q6)v8xDl2D7fRj%Tuq$YicKCA(ae4xsq&?tt4
z<OhwlspB2sC<fQiR}6<Sm7`-_n^?(usduCfA><$iS^eQwxQ31){5Ta@6|1zaHrBB@
z`|4sBvQk_S<2?LmWBc@R4_R2_9ju_EEU?CydB|cO@>rZ*E7jT0@`JLL^+!HF|9cR1
z;Nl(DXp}WXOOBQ{q*jszZdyiw0b@MYxW|o&F)%QK;4;Li2EnYDz|oJf8U(b~NT4kA
zkq=o&!<wqCu0KHQkLMnQ6$dHC?_?pr>_Sx`#K>B6<(riqV4xMq#czI5(h3ahV7>_{
zuWGSZ8O+i#S=x=QZr`U`U=Vn`<+biXfZ;IPjxJa3eX5rJyWy$S*A4mwafm<S1`H5_
z!v+EDK?H0KY4C#>GPUqxHrtO%o!1}WZSjk@lwyR~n7mTttUqFmV2Qx>#7C}(DKPK^
z5jR=CGQfZ-j*M8A>O;WwU@16oQI8?(qkX%;1+Oq0W`AH=7Fw>yjd4+B|Le*EN&MJ_
zEaE8S17lbr6Gn2LA<~ZJI@!<1J?iD`{E+oc1jB{S2)byjXGSlizD)jeq_;}qE;O1+
z*?6C&HO-9W7FW`r7U@Qqq3I#*VsfO`a~GBjYE~B%%9Td7kLE$cSR<Lw82E6jb&bYG
zY@{8v_K`J|3he)KdIXKwb+T8;Ukr?z*fYXKN}t_aLTn`0%EtEJNF3#9&#0!|K614&
zAcOm6+uThv29&uCZW%#Cs_dRGr<ePLa-ZAY88gNcHqvZ(%LuWk>bHE`A?|rMq7?^6
zc)}IFaE3SB;SYy+#3ep)idWp?7sq(UHNJ6<ciiJ22YJXvKJtz?|Dq9Y816=39q<<Y
zmgVzpM;Ge5Z<^QK<~PTA&UL<Xp7-46KL>iyg+6qm7v1PbM|#qgzI3KH-RV!?$OyXd
z>zB(2zE%HkJ4_+-9dzC6Uk7{G#qRZu(7^0xM|;}UPJ@k%-R*CO``F9AcDkp%?QzF@
z-oZZiy7&F=dI$X5`QG=s|2^=BCp!iRPk6&4-tjZXKnoVH_7iM`1CMw7z9m0-v{xPj
zmj`?ox<CkLV_il(8?@=Wy^&^|!}YI+ee7fZia=vd_P57<?JKeo-1i>#x|ay=eLsBQ
zKZNze?>+4!tC*NCxAn+>z4HCrnC6e*`OrUy^i{7cBX1w;|HHLD_F=Dm%LrfmzhAy$
z%zu8@7at<WXTR%}-x%;;U;N~MO!e*Wd;C*h)!~P}{`0<4!LzK`g+=2KeXywk3=aJ}
zKLMN>42XmHI|sH)zr<KS_H)07sK5Awz_W0``)fPQ2tocELCYw?<U2tIOch0|3TTi8
zXplDb&<9{}9~MlG6g0v9$_#m%!1J@f(u=?!WIqeczyI66;rl?e&_NaC!OUpF@moO@
zM8X}MJ{(LHOtXqi;}8|W!W^tZC7i;`@ImnlLNeS4BE-HkJVNKgz9meHD4e}9ybL*n
zL;rKb+q=Urv=dXK3TyBUb?63bB8P5Bz0BB!OVNki|2YVG=mx{$!^Dt7`J+QLltAcX
zLrYY{;mgD}1VAe!!7#+VJ#>sFBt_;E#ptWVNCcEwqY7ZC2jd_Ieh89$kcZoP55~9$
zdB_LPLa`}gMaZzjRn$aI6t&$bL*(m3VN6BYJ4GgJMpb;m2290gM8!O$#Ayu1O%b-K
zfCl41v8<7XJ4z2+m>Pcohq!UAVcSL!j7Dp0jAXpMWyB15#65asMr@ozZ45<y%*HD`
zju3>$YXrc7Y{wyqHh`0gcX+o))DS>Ch<>28gN(y!Bu3q^$JfKhdQ8LK+sJ(UL}>&_
z-AF-$#6#;dNl8S)l%z-*si_v53c`Vg^MHm~|6{8M37KNJhj%cK?rTYv%tMw;jEww9
zj=V(KD@u^GKcOrOfxO7yXuf?LN#uyir~FAQ;Rh{ag&C}fR7#9{Ajho$2SmF{#Lz#c
z9LkP#y`(hCO=L@@{73RQORI!RRpUpww9Bb1OFOxT7lTC1;D?A3%)ungT_A?A+)ECr
z%DY65GJMOn)W~DROXovNcceMJM30zbuK3W*#4HuJI*wYIpwT2v(v*cZ;!2JZOp6H2
zh&n{iq==}*%*L!aA*9Vqe9StuOS*)@ywnh?dl2A+O*|qpgjlKGipc_u2+Xpq^N@z-
z6q9?fL0-9smD&Y;PzTE*v*Fx|&eRZj|Kqp#08hzO5833*F4#=&R8ROQPDnvcsd!E3
z`kq}NhmM+}S)@<wK@x=wnf25P;iM2wv(5Ja&jHO$^qdd?_0I)G49|jwdMJh+3oKN*
z2TVh-d4L9Mh!+8S3<28(uW1{9P@DTyi2h_y)!T*>*aiww&=Yl0b72KySTp#lt=no8
zp7|N=;w(W75)O3?4+X@^$WDV`6cJ^G`7zNKRnjG8Qpu8qe1NaqNv~X~(DuSDasUS#
z^U=oeP<KNTayTV)F^G8pvx-U5CPmXURnxFx44urK0<<k+P%nL$Npi4L8rxENnNP1N
zQh#^{E_@Y`VaGKk)Iv2>MQPJ}|Hz$g05ZlHt9~d3nIZ>VF_=6}3=ajH_40=)jhAjT
zh%;SKen7yiK+J>G2MjyaMG=})B}<6lhf|HuM}gIgfYnw#R0>Jd+<`MWs|<8;GX#@{
zH3J3-8M8q>3lC+5WUUO|+J#+^kQtgFGd0%4WCSg!BCVJQAxO>N7{ttwhxqa>a8-;`
zItWSlC5AB9iRi_I-~w{(3i-($pvfIZtSDi-BSobXKg}J73Jz-^OLFkkH=+}8sE2%*
zSKkPk>rn?`yN9d<2V}Wbteg<S;fIQ4h<;GWhE*|sfUpI<hilb}G>Z>CSR2gvR`@s}
zn6g!au(FBhhA!eLvrtro|B!}!NL4yIReu#S<3J&B*jB~R*@c+atx$)^sZdrG(PgcS
zxAKQk-JOUfwSFK?ix5p<xE==mScK>XM(Bh)B8N=Sq*v_(a$p2MxQAk}23+t1DT0P{
zH3+m-+f%XzNniw`;fjRu14bZ+cgUAqAqTwGTR+91ceo>9Fa#};2V5uxSs(_a>56$M
zMBjLa`h>2x@(nwED99xTF_}d>#fWzCgGR}Rv8`Jxdj}!d+kEH;b1hkGC<aEbhE9-$
z)s=*jB?oggSD@i6O{z~~2m_w%2X)BZgRlleFa%g>A8GI-jF{PjC|QH3hs&)8et^k@
z@L9v56)%$zc>sr5|EyfKF&c7E2Lv2itteWKdN-Y=qoh@cr-j=0Ww)$FF(@F0Qh=mP
zu>@-n0+iAdV7LN#=maP*gk2B<e)v-%IEVlq-~w(XS;!!-C<QnG2Wa>cCvur=kzfkW
z2R&dQI>?t@z$HHd2MiGcJ>Y`BlnQmo2F(>wpUs9#>0W&hSz7TL6=q>+$Oi63VTVu|
zXlPe?&=Xt;1LMi2dODBdB^p^!0!BCjMz{hYTizQg-Z0?@H1GpxK!cS+10|>@b&#Jh
z$Oa-+f@W2M>MS8*xPtOch~_m2X^;nt64AvuS%5{%>qQG`2pKw&2l+{*Fs7sW^jEQ}
z2ZkhG#W-Ig|FwpBn1?NS-n^odLUUjEm1JU*U*H*HTsR?1IFtRo2O+4FQ|Saf;3P5O
z2L!$sQ4Xki@See<B(4AkC@6)(jhRx|q*spRgCN<1sFz(>8F1j1hCv>#s9AqF*`J9a
zprK=g;7RAblwxjXaeWAKxE5S61R$;xS=ghLJ&00BV!eHwYvpEyum&YS5@>j0f6xQ0
zc-e$#gD{?=J@NzhDGokLpsu{ypCQ~hHi(n0*Q>STvuH7JxW&m`91Ue!Av54^IIZVZ
zW2-P)&w7V^Sl{F!){wELNS@@3Cbddt1U+chL@b`z;$)Bo9=ZvW8#CpSHi$4$g38E-
zR_2Oq|1g9j2ofzoW8aWznl^}Z)}mY41*@f$Ck|$<5GxQOhkkHlMK+juNUC^QW^Cb=
z$@Pbl<!6eJ25#BZ2f7xw-Cu+V=f#L4N&#oPRR<_IrBXneEGDmA(q(t<gkO?`PJjkf
zHiUYn2sWN-gpdb^Ipn70*H8V~sel#Txy5b}S%(s6ipEk!CdY=RioU*w^eyCrAY_((
zH;u+@J*#Bjm5`%0*9{f|iy~>+U1?HIY0~zGFlhr^kOwV*X{}JNF4_fu`qW(MB1T}0
zOJM}0!P21SqpQsdY1k|;Ok|dgtxx5er=IHJt_-S%W{2p9mi7ljkOg_r6mYnLlGTDb
z|3Q_n=2fvah_9Zf!YPI@(1%PAg7dI$8jF{9{!}f9sO_F>gQ)9^!0YFQ>f}M8ZUyYL
z7;MGi$;v2dsRm!BHtysxWTSmIa-f=%<&(%h2#n6`2|uw;z5=+uf-7hPgS~=r+U`nL
z>C`suKnn3NAqFLw8?5FEOVENa;DYyw?o(oM7k{5_C=({ihc?iHD_{h0@NGYM?u<|e
z999Pb7dGi3FJbG3dGXXC&xRt;Yhn)ahL~+AXoFoO4ie85DA0nw-JdJyhwl!k@b;#D
zAYgbR27PD)48d(ox`JflAtl%&Mo<DJSQ2TVYrCF^`<8}2?`&bKjC_y=WXYO;{}vr|
zR2-^FDmRAepV3)>jj^eQNW(GOKKCoJYHD;G9sb6a%ck&8M>305F|Ck?E!hP~B8!Kz
z1{Eh#g$PT9gpa+=iheK{>n6*<)CyRy6!%KitibDq=m)1Q(ZF^T&~%7G6Ls_j^<{4^
zta5g$;)-W?_Tvz%hxPP|C=zMc_HEy(L_?NtnDT`vL}bx*b74qiDb=w0_HbwRcE22M
zhxe4uig*XA<j{vv#fWUD_kF)AclY;y2l#*&_<<+*f;aesNBD$S_=RWqhIjafhxmw>
z_=%_ZinsWS$M}rb_>JfIj`#SF2l<c}`H?62k~jI2NBNXj`ITq+mUsD=|A+aQm-(5e
z`I@)+o5%T_*ZH02`JVUrp9lJ&7y6+m`l2`bqeuFrSNf%A`lfgKr-%Bem-?xv`l`43
ztH=7R*ZQsJ`mXo-uLt|E7yGd%`?5Ftvq$^1SNpYR`?h!cw}<<<m;1S=`?|OLyT|*y
z*ZaNa`@Z-4zX$xl7yQ8|{K7Z<!$<tYSNz3i{Kj|u$A|pLm;A}6{K~id%g6l8*Zj@r
z{Lc6M&j<a`7yZ#E{n9u6(?|W(SN+vz{nmH=*N6Ssm;KqN{o1$v+sFOf*Ztk+{oeQe
z-v|ES7yjWV{^B?O<46AFSN`Q^{^oc7=ZF62m;ULe{_3~>>&O1=|JVNQ=l<^Z{_h9>
z@E8B_C;##{|MN%x^jH7&XaDwh|M!Rg_?Q3rr~mr5|NF=P{MY~e=l}lqe}M2Oa3H~g
z1`i@ksBj^}h7KP>j3{v;#fla$V$7&<Bgc*&KY|P?awN%;CQqVFsd6RDmM&kyj45*_
z&6+lE;>@XYC(oWfe*z6EbSTlHMvo#*s&pySrcR$ijVg62)v8vnV$G^`E7z`Gzk&@b
zb}ZSlX3wHct9C8hwr=0TjVpI9-MV(~;?1jfFW<g?{{jvycrf9@h7Ti7tavfw#*QCD
zjx2dH<;s>XW6rF3Gw05pKZ6b}dNk?Mrca|zt$H=<)~;W}|BfwtHtpKBZ{yCbdpGai
zzJCJ`E_^ug;>M37Pp*79^XAT<Lys<fI`!(-uVc@yeLMH=-oJwnFMd4v^5)N@Pp^JG
z`}XeN!;de2KK=Uk@8i#}e?R~J{{I6QpnwAsSfGIiBAB3p3o_WCgAYO&p@b7sSfPa%
zVwj<Z8*<p8haZ9%qKG4sSfYt1qL`wJE3(+4i!Z_$ql`1sSfh<M;+Uh3JM!40k3Rw#
zq>w`rS)`FiBAKL;OETG{lTSh!rIb@rS*4X%Vwt6uTXNZ@mtTSzrkG=rS*Dq1qM4?e
zYqHs<n{UDyr<`-rS*M+M;+dzOd-B<*pML@xsGx%qvRbI2ha#G&qKh)xsH2ZU8mXj{
zQd+5{mtvZ!rkirwsi&WU8mg$Hl3J>%r=psws;jcvs;jTU8mp|c(psynx8j<suDkNu
ztFONT8?3Oy5?idX$0D1ovdc2tth3KT8?Cg{Qd_OH*J7Kkw%c;st+(HT8?LzHl3T91
z=c1dgy6dvruDkET8?U_c(p#^+_u`wczWegqufP8S9I(Ix6I`&t2P2%Y!V5Fpu)_~S
zY-2zGA^8Le9RU9TEC2ui00jil0*3$q00;*M3=0bm4-gR#4iXR#6%!H}78M;D86h4V
zLLUbuA|ELwBP}W@G%qYVH8MdvIAcF1NkcwLMM9KD5tv61NJ~*vO-L_Nk6Kes#aa<&
zTva<=l(b(Ktza9+U>jd!YHed($YUNwWSXsIB*<nW$!R7{Yn^y)Wz20X!fq_hZ!pbq
zGgfk;igGBxax;E&Y=3hnS$3$-b~;^mrI~j!b9jKzc|D+dH^X~BhkSHmeXG%ZLxp}g
z?S3;`fHY%(G}C}bRDv~Zf;e`AJdlHW(}PS`ggC&2O6-L_T82AthOK{wLV<>l)Q3`T
zh_zmcL3D|*g^5PSiBi>xR(py??~6!bj75!&OPY;?WsXVMj$3JwO?;8J#F1W&lb)E9
zR@sweZIn}pl~|*di^`Q`?v+>6mS%C6SB96j+LvkDnQU~LTZNjzp_*LFnrnHSUyGc&
zp`2y$oMV!mW_zAv+@53Io^!6Bl&zp^&7gFCp=Y0>Zt|jQf~0Jnq_EJWd*7sdho*6r
zro{86a<8X%;HQ6@sKB_WoxP}fim7zrs)W(3g^#U!nyt;cu7kd=qT;TKqOZmDuYi@Y
zg43~#<gtyYvW3L6r<t^dzO;(vw3Dp1$@R92owtkSx0unml<ByZ%(|}Tx}3wimG--n
zq`Z@{ywcXZo8r8b>%E=mzM-eTn5n;*ufN*%z?-_k(CWdZtHPYr!nDT2q~61(>cp$e
z#isYgqp`-L*~Yoj$gAtfueHgj!^za_%Cq0gz2VEUy3DQh%&^MN*Y3`_zR$71(Y3|V
z=kL+I<<h~?)7$yey35q#+SI-5)Wh`Dy~WkL@z%r0*S`AK!SdM0?Aglt*~QG-!`a*4
z^4!eb-QoJ(%hKM-<lf5k-_h0J&h_Ec*W%FH<MZm{)Z66L=jG=6<<{ut=Jw{>{N~x-
z=h^M(+~w)<`03u_>fQG0;rZ<2=I!C>?&bOK=<4w2{qX1Q^6LBY?D6#O^Y-!l_VV`m
z_5Atv|Ns90000R80R0IZNU)&6g9sBUT*$DY!-o(fN}NcsqQ#3CGiuz(v7^V2AVZ2A
zNwTELlPFWFT*<Pf%a<@?%A85Frp=o;bL!m5v!~CWK!XY$O0=laqezn~UCOkn)2C3Q
zN}Wozs@1DlvufSSwX4^!V8e<XOSY`pvuM+*UCXwu+qZDz%AHHMuHCzM^XlEpx3Ay7
zfCCF2Ot`S&!-x|rUd*_$<HwLAOP)-*vgON|Gi%<=xwGfbphJruO}ez{)2LIcUd_6-
z>({Vj%brcUw(Z-vbL-yCySMM(z=I1PPQ1AB<H(aMU(UR_^XJf`OP@}?y7lYWvuoeZ
zy}S4C;KPgmA5Xr#`Sa-0t6$H)z5DmO)BT!HzrOwZ^x^B@&%fj-4FCox;D7`QXheSq
zCa54qVHD`#g8;^};Di)bI1m*OW;mdP7Ix^Nei#B+!VM&rNTL%a-eAHFDQx)Ri!i1a
zqJ|oB7~_pNdN(5rC#LA*4Ne5vVuU#sY2<Y~&Y<LyGqB)f3MrKEpp8dXY2|V=8sQ`l
zER?V%4^&VQ#tc(lY37;5%}67JRHEtTo49SUW`-ZM3Fn=7x~9zxQ1<zO1|mQiAe16#
z@Ijw_uE9_^;glqeG#F_k%|0U0BTb_Qx%0~?>68@DrFn)bszNug@QXllsv(dzDcm5@
zJ^*U}Gg3SN_Hz*n8WbZ^EE@1&&>8~XAgf55Xh20m^sKSTsLY~y!>IzflY))Etng~A
zBjIDjfw$(mYp(_U0^k;FNXf!T#U6{0oR&1}u9bFT1gi$a7BtElfj}w{KDOMUtgX^S
zQj8&iq_avS@NBY%C6w+HNxKe@63!xPK<f`Y6x&ivB=ru2>naqlG7!K1ZepuH=`0e)
z9lQ{9Z@w<C5lOMW5)=ry{`^ux3i#j?$tc<caz`~W!z|D~3Ue$_HIYDjaHHu8l#I%T
zbeasVMu_Z>HjyZck3jT9vPvv#==$#2{8_S!I}B~I2s97P+p$1K2snyBHwd_eKZ^+e
zs0|N>2Iz!8v}(`~JOKU)pvdq@Dd4gN;VNJlc<W8L;s8QkcYt^Mvw46u55%hmECiCw
zK;aMw?dKZYjn9w(#^O&T8c^;}-nRG?HSGbGfX^ME`}1G#jea9wAZRE59+{*=ju7A)
zq!5Wiau;L^pvn9v!amj9z(YF!mB2TEku2g5;4FN@JK?n=uE84V)J-|CDI`;@2F`m-
z`ZK(1)BX41n_aKsVGAB0?|LH09-#J-3;>Oy7%d9jKpGSv6Pzw}#!5!rQs55+DsX!@
zOF=REW)4tKgUmOq>z!f+Hy8tDMs8orSZ0I@7@zA~N$wh)O<Des5rae{#Vf<O?q
zO;AARYDo160zB#U&mZ`R#T_I!zR&@#UGCdQ;SL8NwiRn|fHR*zTC}V{EJ+%;nw~%Y
zB(f+@5kMUT9mD+5#7Ok7SV;t)1P3CGH%179jcT9<_EE?F0nQKt!4&QGb~_E^E^7Xm
z+U9b{F5zjQggFDyK6Dr_AbK)9c?*yTB*Y6`mEaBn5u$+1wvZ(b1Xvm<fh<e#jC7a)
zP@5Z{?arqGk<mkwTg;+AKB0lZ<xP!bS{4NziL1^v)0Vh|<LqGPDp<~vmVK)k?e-W6
zHJD8s0I~%JB~(KV#KW4id<L%aCqPD$>5(c_r4b56Ne#4Xn~4MvJaqW~$$pkcO&s)x
z<YMO!H3+B#oh*ne1#&%CIm{OOFoXsU1Wpa;av*@q-7g0jOlkgSa5v+@J}SB_ZO|tk
zxY}Fc1~$>H!7&+43x_2D6pn`a<DvWDl?c98w>{R41z)S^FEA*w;l<IRk$@<Mj+KrN
z+<+d%I?z7;1Wzhd6dq%Aq(9^|JwZx{b|3JE@xtoQvVtcZLlS|=u4g%SFi!)>QzC#w
za7}IC13=p%T|dGXh#}#lZ>kbVM*Xo-Ew<02#q@_X5*HwL3KT$Hir!vh*;fGJV-<$F
zgPc;(kGoFvr=2a72qd>haRDf;`@mqY0Hi3-=9LBgFl`EMNx5SGj7xG=Eu0!udAA0o
zAPoD!)dwUuy|J40xZX)eBn<J5d<rPA@vy`iTIP^`6o_aL1P~7zwT}?7Py@f{o1z4(
zRnHpMaD@}df7CS!7JMKKb?Y2KaCL`2r9f8Q1<-d-RoM?vL0{SJ6{eDL%MSo+kN#N2
zEw$Sz49cmPU-L(Rw=0lM{OJQ*;1C7#3eUYoLP{wRVr@@LSXF*Njj1Cma#wtvI~XAa
zGvI+5PW8F^`NI+{R8kmnhY@;EiXc7v$S1;}MqF9!AXo)*gbNanlM%$n21&9)@Zm$}
zLUG9hfpS5lJTfdF#7_I*^2Jz8X6>k<Py{kUJR)I)ErjF$8)zO759X$m#YRs`JLL%m
z%gpC0!E!)GK;9;{;Djw~;TP#p1Lgwcs-JA)20L>Coo^D4ZT0!mIZ~y7sNjw;I8H!3
zuthaKJ=cU{`qZdailzZ%f_Q|oKp(KhgGFiTRNMO2K-q!`cD?Hr6z)NH7{xVZS!-My
z``A7CwS!QJ>}EULD9SDnv!6}vYV#x>#mKg{w_OY)TKn7J4!5|+P404=``qYGx4N6v
zj~`cLAMQ4Ylh;jee}>`67m1R(D58e(GIV4XMN2y7t&w(HB;GfLx55u%aEd5=;q{Jq
zRBXG6(`m#O`<@8A38H}r-}Nl3P@EIIoe>@c)F8$Gh-*T`#p5^*$jbsvqD0s#Aec-1
z=0^EO-R_`riTq*>VGtw636cz;BX1vp2sEW)Q4Ab^q91Fh*wIp_jdb)(1K|im81PXH
zTiiPkYSc<U4mAqkO*<njLWl|#!t#NnV-qt?!6r;*5GPUO?Qx$w!Ew%aq9olSt0;jb
zERn>a3q)s&_yh;nV1!>7K~ZZE!OAH2i!F#zgS|3BEbhvJPXwBF4e~Tsrka9Z>|+$U
zgP^B*V75TemD$zU!Uv2%G$$Mg9w}&7+Tr1Z4;Yw^0HU1hPkDGQHK^qSY3WV3K-aiB
z2_IZ)?(k8$j}&ZyOpGju^80Fp5~L#*De$lVgtU=2VfFp|HZh<;(xLS&EIA%w*n-9D
z{t3kve&0Np9$NiT0$FK8d}}Z`-#}e~AVvbwar>eHr;{{cpbaIYVp`ER073;=bv-5!
z2qqvti$yN2Ge*+0Gyc#dC<9lw!$E=Y0i#ei>2N(PU<(@vEO)ark<cQ@cYxd?M2x2a
z=EDLhP&c{rf~_+zmH;^V!g1UJEH@AaV|N3f=Q)B0CFmE0G67zzk~>Dwayu3dn50lx
z=MSaCQ2RzNk;F6R#6I|-ECo@39OrQXw+TdM3EFTh5U3T;a0e}NF4to|v{Q%gb2D22
zPSay`A$Tq|ggj~253!&IEdnVj1U&fvvO|kCJ+xDU{?Jme;w!LnE|SA7j_8N5axDLW
zZ<Tn2Vkj<7un4lmd5e%Ym?DL)s1k@{3$Xw#uTy0y&?$9t5G=3?;Q)div~M@C3F!cZ
zM$j&na3E-CGY04nCO|Y-S7C1$hik+Y(l7&%lQ;B`hbfc{p?3#&unEtggIhy1d?HpP
zn09gkbQ-{j$I^}8*g(rNQ<P|l$~Rn(g)7hC5AL`LutGV!B8tifEc9SWM&ONiP(v(W
zkX81I3~3VBXDj=_dIWKc{AY9FgINp}OR^ISA0PsYz(LYb0(1o_$v6-<QvxRw2_j$u
zckpq#qXrKnjdOSv{a^wjAT-hc6Gth~ULp`jckl@%uq-C9lTgwRKG-0J$U#ve4Rv!m
z!}SZ-^OHg84}r1?xH6C2k~b=&0jT68^zZ>Q;FCbfj~bvV|7Z{aiGZ}ycqTwOJopPd
zFarqJkaQUm?&bu)fDg^pDPfQd`w*50VRLRrDWecN#ime)*%gilS+a6HWRe21vkwnu
z1e5}oq@ydp@Fy68NG2ydg;F=mf+2D_nUrD+E#iY{$t~~zJ-{VUVM#lqAendtZ)NEZ
zXQ_Rp7-5m{C+Q<$QepzKQ<uV761>tSchi&7KrYlJ5h=g}MqmPy#upoxkq}i74L33h
zl@JIwkOFa?M-w-DXPtBZNfBNqn8SIVAt4R^b`j~&iidGMl!%`4*%;>O8L2g%^O>Le
zxu5*mpZ@uu0Lm-_!a)WVAkv_0s=_*-A|U1iI~FxM1SKG0XB*SG5s4X~80ruMdJeOu
z0kHrLdUFoY10c`<p<H<m4tfqV6(E*y4hA9`_eK$;&?3=E5h)O#eG#K4@eCK5p~(Rt
z=MbbqI;2Eeq(*wANE)P;z&63z85B2v62SsBIuSie7f*T;jpw7+0i;RVrC$1_K?*n%
zni)FBl|2^`QtEbh5C%j;IFYagY9K3y5HwC84cf2?zd!}%^9@mlDR-KuVuTNt0H<v#
z7iG$G4i^bd(17XxFl`*;FpDZHF(iywwGWFx1*zwCzW{bxnjB#Ish~=vz@q_UiWz@r
z5ovl;DG&&@@B#2P161$}Gmtwh;E`FAnKKXz7DNxfzycPBtGb#D{otIuzyn${7pF=Q
zi@*cbzzdDS0<r@SAMjVq>a5x_Tm`vRvFfX!S3Ba<sm2ircMzn*P_Dxeq}rejq57%N
zV6N&Kq@&uTnW28DIxOPy2{YPt-+F}tH9fyzQV8V_R1lmz@T&nku*L8Jwz37sDi`$1
ze({H8zi@U15ps)QMD4{liej<emZdiZS1AZ~4fufIY8*hiSUixjL2790I;5L`q-&6}
zBJi?8dIt#qb{SMC5Z|x`^Ck^iCuZ|CEUU1SqaZPXU^}xaQ1#+?sG>CmdwAT!us9}I
z4I39Zs|{Aza$R$?1Cb0E(m9Z60?idkUrRU8;tu#zv>OA5a#*s(ak3gfr0LqSLP{@P
z8U!>ur0!q@r8*h0IExc&I1@<^qmX@dH!MxnDCs~zKy@>+ld3rrwNCr1lKTrh(>GQ7
z7Jo~N6gd!olMrn>gcXJ}p<6RV21R4kM&S^XZR@tf0k=ZR4Tcs9K`Oh$Km~tT4PkJ*
zYv4a&5TvTG3EVIYjx-F_a1N@l1wpU|LyEUWx}t$~84oEC3Of+Ew>2_XclIbeJHrCc
zfDdH<qIJ^)xlFrN1p5JlQ@&de3&UzGnpYRo8<DKEDqKrPDZqm~Hg-H_hxjWsffAOi
zGFzL#y3^>o!U4NNstS)6q}32T%en?2ngWI(!O$QA@EQiIP<}T6haa#AvCyJI>byk?
zJyqHlP-+nIR=olN4<!^1jph(oR-X}pRrt^kHl`IP{B8q*mwJgZ^t%vL(yL4sWdu>e
z28<gYd=866q*2Gf9(oRjumvC*3+Lcs6@0-#YPUhUBDCAQc{`+w$QScA#suMHwg9aS
zQN8^jAt|sA#XzwvF{4zF0_#~6WIPae+(Brp5ye>o$0=b(@Bw##p9Jv>EL4O?oE<^`
zy2L};#OKh!K^nzZ%%M{J0YR#DS$w<<d<R~_4I%u+=MW3-kPe7!7vVse9}o^vJXNZ^
z1+2UXuKWSt0L$~TO9zo?wet<yFgT+S25R7*F3}Hmbrh$}%B!5p$2>8yJj<>ed>^5n
z5<w4Bn#j_Dz(VTCkPO9AY{9l50-?YS^b!iS6Qm_T#nm7U=gJKtpbDQnq`bl{df~<t
z5epLe5Ro9SeId^iLC^Ec5i(58<zdZ13M?hS4d4`{uneNF7o<P61;1OxbhW!sVgfwi
z#X>qdrF<9oAc_uAs1NbacCpbE;n4t%CUE;G(%_{P?8!r#(nQJ)E`1K#z|!acEDbzB
zvl!hM?vQb&vC}18RzO+}PU0jgZNYTQp+n8i=Wsn4{nJj(97a&l>l)KXebI2d7x6<C
z73vU1{1RDR72&znPYoQS8ap5gI_l7&C8{^-;GpWTq5xtE>L4H~pblkShAOdlVto|)
z+z~oD5nQ(sGb)CG+0Qo`6n)JSe;pG0R}if70gg4+yumvFa-c6-pb=tc0HP`mYMTNg
zJ9I5T1Z5CpBN8r25dFp!BHa;JIuX^_5s+&TuU*7KvDz%r+Khd21yPccognD|tI5#S
z3~|~6vDZf7(;RWAXX+625DP4j4g=>8a~cSB>ZWj-u6U}aQWJnG2f1ticHPbW+ylp_
zYtV|tU}(DXr`kOe$h{KEJrQpQcB?=+NT+n${bK4x1^g%wyxrUV0X$o92f&;VUH5fr
z)XO`T-#d0!S+{jiCv`Vf-dguHmWrugk*pH22{SNzM$lZfx(HeGm$5plz-mELH44(u
zq^T<6vT6$&&f(v{tG+4_@c`Kt77rz!!(D;l5z)X6@?zn@c#fwih^KhMV=C+2-~PQH
z;MAktDtc;=t1H7dz6zC`=XuCed4Wngo`*<Vu&p|N6JN~{^hy!4Ef6f=uUNaUwxBZ-
zGO%Ohv1mRlw!r3!1(+CRahsqn`t9Zdi_b1G<}2~A?YCru<^+KM?hn<#L0DI({kJvZ
zlYjoOe>Xq{WmhvwzU1(+2`2}C@~04yFtTezD~%$q{KranwSeQLhESw{y0Zqb5(pvd
z6N#-6IV)B?TM(NdU$TwoN^6ox+vbuBMKdUub1o1^D-cP0=7ME$fiPZca0lv}xh+xa
zDRH$~I}nSo59)Lf)i5~X;{>)PA+&N=vXTr+xduh6HJPsI?%~iABu-m+5Cr@I#qh1(
zxJL8ml5U9XTMmtAyXz0+6Sl1pn;W?E76w$X+-@fV5c%s2)wmuy?eWkl{ZImCld5No
z4~~m64u4b4E)dedGp{2J(>@agpAwt9FP*FHb-Xm-zCzXiP>eTrAi+3{9He#rAk6$7
z+3wyRJg^1nfIJkLiwIHgw6cP=Nd-<IA<w8gw!`ZDPB|%{x<1j~8!^3WL~xtH@E2l}
zv|2CVTRTLizOnEPPXf>GbuMEsz5+o7U@utcD-aEWVUdd}iOv#OuM+WF&jVo#P7t2o
z&VMT;DI!?{kiwB7FoRHJawT9pYw!Wy_w)MEH@!)bzLOC3u8$fp18hcEfKvi%!0&-|
zlAYCtsuI8^;PY3J!d&n5U6v3sj1Pp2x&;wrfeF%IahG|ymyu)y{g96jK_zpk`;@;P
z?$(!oDG@M7`xYVGD<SA0p~f82^?f1zEz!q+93@fza{SGboYN&2*3J>Q90t0~%TCfR
zdolhn0nOh3{sxiqB5}`wA^$O9{P5q~dvDr;vH$rG5dH)XBv{bkL4*kvE@ary;X{ZK
zB~GMR(c(pn88vR?*wN!hkRe5mBw5nrNt7v7u4LKL<x7|`WzM8oGiEv?Hg)bSh?D0}
zph1NWC0f+zQKU(glH6Bp>C=u)p-!b*)#_EOS+#EEiV)wgu3-m$6<gNqS+r@@t|h4<
zg}+4_<Z6f&Z?1-%YwpIAc6W_GBX|A9(m>T66`+L)&t2p%#oV`X=hnTOcW+<0Qx7K|
ze7EsqxsmTuo@;q7-??m6uV&raHC4Ii?%cKi1nn-5b6f60TP%0WIUaY<Wqv(UuBE$o
z&VhC-o3`z_xOLCvow|6)<H?spc0RZE?cBS2UngJQ{CV^mW1nN+-u-*{@!b=L>htG%
z`T6y~r@z!bPyF^1P`>`sGw?tJ6Lc-W0UKnmK&7O*PXh-lY!5=DBm|H`3oFD>K@dX}
zam1xkNTEXqKRk-82~kY3FsNAE(8UH-B=N?q)&L7f9=oD(Kpt|^46&b#!0pHVf*cYk
zBauu}$R4A-Y7`BqSVc-Ksft87C-cjap)U9PQlT*Q8}rPh;CTy8Hi=@e%-qzV>c5@T
z_zlkYwve+vDC@iv&-V0eb5Njc2}7X&Vj|hmpKl^bhfqjcdb3O$i_&nXNhyW#sY`Xr
zG|WmP6&0mG9NlLV#|AP2A09?^wWLp-40R|OG35}@2RB`+R!?umb=Fsd^=On5!sy2z
zY5wxZoh|&CL0D)ziWNy<gW9Y`TytF#+ia_i_FIg;31c6D`az6HaMPVAmQZ4e1yJZB
zjSU)H<0W+7dc9S5--lSBf`xq!4aAaB_%-;U$F`ui%PmsaM;dA7>{F*$q}eA0g~NoV
z;fEvU6R3(W&bZ5s9ftT|lr`F?v6Nd*D4s|{<B~??<ci0tPItl#V<%^`xvHFX+WAi!
zeb(S+my=d{L}?-k>@KLImU?Rcs;jm->faXbu;#0~_WEnE!xnpNvgeu^MXt+Mdu_Jc
zc3V4|-<JF86x2||<E6#ghg^%0&bzFb=N8=R;6`q6i%^~(d~wDb51WTbczD;rShk2{
z2FEkkd~>-Vm%PHtFXw#l6e9V%t5F`)#-bE#8Otew?lApysHA!Nj>)st{hXRpI6J?Z
zkKBED;){<@H=YNaPI%*+cOFpWiPmrV=gWk~5}#A>n|7>NSiPd{rFk~?*|}FLu+OW9
z6Pn=YO0sjU)hC{P`H_Ss`}pIVOZxh=rN4g{-7hrxgU|i|NV4Fp$$U$JnV!Dqy|GwA
zPu1{8F}AP;*cn0_fpCKVG`_KhHH1ST^oRuu(vgmS++h)$pn~h}V5n+P;ZY0ZNz6`k
zz%XG?Him1DC32I3+~F`=+)#xOQN+IASR#n*iG^~uzyksrF-%01qJ@yiyCt5ZiMfGd
z6=}pi4U~_DGjT^l_Avu0{9*>K^9Ka|(T^bUf(NUJ#|JjCi4WY21tM645mrHuU$7t<
z0@=h2K41hReB%xu*aDUIp#dkD$Or`+qfPAMJ}>?VI=<_nTc8oeOgc#$p$KJ#pfj?K
zd9svv8s#b*bjpRLG6kS?<$eg00=!l7CFe*&Lu^q3ff#{}ZY;(Jj<tnVuuvdWKotv2
z_lxiGV2}b4-$3sFAfyk#Lj&n>!Y3jjMqS1vX1}ZDE88czbJDV$Ry4vo^>aO$agChr
z><~2CNzeGe(=B(9Cq5md8*qkGCGJRq56;1mKpe_h!~C8loFI@n20~eDxI-JiHxOwK
zq?+UthzQ*A0e?_I8<q&DKwF{)4fxQX4YC9fkpsk)#uQ$<i3M_)CsUkilBPDz>3)#2
zCzGmVADu8m5{AJLTd)8hfuM^(-1v(W;3F=pkVaJTflG@PB%=aJhX{_f57~9}qaht>
zNrS4A$EdTX3sY%Nt$5R%PEM_Eh0p)!Dp$JZ$2JN)Yf7wej-xIFAD9b67-q+U53t~k
z!J&c?V&RYfFld00PQ55ZKk(3Hnm`1$2&+Ft01uFg)Do8H>r1AUSJYOBim7F7gI3#G
z*j`9ir7ej&tN;;wBm^G*z(+q)Fim{q7PrEst*v5vTnDuhxyxmba+#Z2eN3JAKb8Og
z$FJi|``E`k=Q!wO?>)}3i;O~)>ew<$R3vZCaqN*1Qb|Tb*@R=HbF5@5q>>H^*`tiC
zkMD2af8hGzdAqLbbzQI5{qeX9e3q=7k1;=M5zCLaYI4?D4q4Y>M*${;El*p)KDneV
zpuNSV3YMo_2<9iYwS*Be@blj;m||E&l;|;`_M+dHZ9KU?k6RkOAx;1npEn<tKUc*7
z04(7%5lJQhq#+4w0v!b8#wK?MUD+<c0AJ^k92hbgR)Bz>gz<Ce$`^3^__GLW!`T2b
zSzej;60lh_*&6PZc<IB?<?_;&s3IS79d%dCIn!gm<Jh>GeY@7LRwg@@xeK=c76pLn
z$QLQ4!nLcyn&yxUub!V6wHV<TOSSO0fLYl%0-$u8Tc(B#XMJkY8isej`)FSR|LLK@
z;Er<QCo7n0f~45euIk+^5UZust{6T2kB&rteh@~Iy$Nw62mRL9!o=9{d_Gi|<3BEc
zCYF6ZFio+BaGZU$_>_2UFsC{1sk!Z=(K%#nm>J`$WqM)HT=$<Bpj0^AlT;^!C*)5p
z*{C<@VDBT!-h9}c_4ygpyLKy0Qwjj!C;<3@c;CQ>BqQ|O2W_s|7JN5}6E&grm;nS9
z6hP+oVFHM50?aPxp1c?VI70YxO9GhR>;%$B1d<M7vGd+?eP~b%5bk}sPl2a2fs~Jr
zNjZkx>@k?hBSZLGP7J_8*k@s0rqc#N)NG@I9}U;ICI0kZk9wB}TE0U-46Ktm^^e1>
zzCa>{5fpDC#&^ON02B*c{SoAEUoQK+DGyAS!t5-tZwQQDVr2!E9vKAN1jqlr<ZWk1
zpIh49ykFcWaS5Q$(E%Vr1q7UsGZD@uGgvgaz{wBtn9FW-=(tJfKSMHT3=tpq4R>S9
z6$46+gtb~+TD@#_FvnvU&jkR9wCe=XLG5*|`GI9wAIeW*GKfR=(p>A2!F%O#ox9<O
zA%Hb$75?K$|EG9m3fP+5;nq5*gTa6*&;M6{@nyG8AANt3q_?}VsbBJqO6F{Vv#=kx
zVe?j9BfJx5-qKQfH^{@n(sAPR(#baF7j9s^h`E>jj(q3*;g0-f)ASQ9^4}jG9!|wo
zJt3<80KnfJT_sluu|A$1$fi_7@or7zqSozRjjum-o}Sa^l_QuI80~?{>sB>?O+cXB
z)(bVd^K!9g$*t4rhI|nc;d&Zd^yY26{uUX=ivZR_^mJ>h*>@Q1<Vtp?;f}KrW3e7K
z0%O5PhtTv8KpV$STte@=kX$kp5f340?T}mAinUc~hGSsBu37IN3rq)0=1^9@7{YzD
z=4U|n=VmW^8xln3aMimQVvOI9;|wxl?FO3JK-+g2*2WBbO8j~TtC}`ma7LFXFOBEZ
z*bV~VVQH+&z!ozOk=|bKueDBXa1P-fyi3@oky*)UTYK+VhCm=+r9c3XnJ|`ZY33lm
z+fUa{`b2SZ)oY@H!l<U<#cF{C4fI-l5Y}v)Okt?ebUnE*`gfiWNJCb2$e6Z&4hP!(
zJBY5WITW~rCFMpUYXneZ7QiXg(KXFOuJh-Ha47xNh3hL5NO%@#SQiuly0l|@U;?>>
zsrDfNtN`q9kIE(daTFHnMTilig21%*N}lgx`_!85H*a+VU^?U|kWRg6N`VeReePEI
zi`78^n0*)-VyBfP1-|60bEygj##@>?lT)Y=@wK`p|1=oV(4MTlYiAiJX0)r@=%pX8
z@ys&0qdP=dTO30LW5_RY&rgMzh5V5;<`>YQ@jgVwokCfdr}W4cHC+4zy3t&1wy6(b
z0N$$BoL&Q)C0ZPR?3(}}xjhCpuMMIpd5u?v`*Vl)_HNmIxNuPi&;~@3Y4<{Ow!$nd
zTl4`0z#3NVv!e;%$$M>(46xRE8>9t7hHGn>BFXn~I=i&qdwYid<H{@;>NhH&mqNb|
zSTm&Rv-!yK7{kJw<j$X`Pd@6gRKZe);;y3-j>4*9TxD5}Nw9LM_Z98^;IF`|b_?3M
zh6|6O!f%iyvdy*~%tue3Sc>#VnjO$-pgVED_2Yfk2HJZEuII)s<!R6Lag&hhq&1_1
z`GM_(!EFKrfdMuh1`dbM7~hdH-;EU%LCBH>T2&IIw1<9rCI`>hy6(chTG0=jRihq3
zEfJu}yPCdh!0}u9bI8!Ybz9?86w#n0dlD{+cD!;@f2b$==Tf0wsW7O$D-U$BFYWV%
zlPElyW9XFj&p1<OTaj!uk3cq`qd@oBp^W*M^9jSFxx?6UiMgb+Cm)@al|CEj@aTF_
zw1Q<kfgEq|3^5_F%HeS*yoP34J|0<1Drsm)Y6hPBd-Cjg)|l+7ay3UzeC#=X1{LB=
zhIAWljgz5k=N_Fy!%-vYH+hPdo-X^_Zegf~XUI1v&cU6H3*}i5={lC`?Qpv@Bsx{H
zTTK-oy`E<Rp^=wI&T)VEs3(AM?e1}MOxAZCWy4Zgw1J?-RxqA?&`hMMN<c`oSbiiV
z-F({@__FjAq6}aaSip40*pLi%B$-lN$!Vek5DYKTM<FGEVzbsIDFB2#``;!l?%Am0
zLC)JmHtD|!pkzmvGv{uOJ{idCuwNPt=^kEi89Rtc11pbh(bT=X#`eSB`z|9n41fe`
z%*7|MK4i$hM`j2h?#L2Db)hvdYE`0B(}Kt#7Cf2z$>;s_bI{>9{wmx(JMi+qgh-@C
zm_f2j>RJDEeMpH#V0t5t3i-x=e6Ip9X8;b2g#VY8&8{zJ01q4|LkMI@LA87kpxO;U
zf&eFQ94lh%6*!I^;Z!0GE)my*hp9w*wPQU2_z-Am|2#Rx7L{)Ln$rQEt}Y$~{F9A_
z63B_!+?Cny*fHQG6OC5}juG<FCIUe8lUTls<PeSV6Cq?$AldkdHh72j=x6U%m@>az
z#a%w~A+L_N*#yapOuyR*V2m>akeSd74MKLR^XGI@oMG6PHwj;`|5g2W*C|K7uQRK;
zcvJi62Cl8}?PvPkPpyAw?g|Xf@k=-KfIvG~hTdhFrSBvG0KwGG^Z-~aYpT7{o^M`y
z83OomlGmO<S&`>KWbMJ)^MO0(y$}>Y8OTukepGCA0|$7&ZTL{$u=P)q1xXt;(19S&
zCwRDSkv>p7v<azcGvd}3dX2DxT6rXyWt@y-Tz<(19rSd9Ajl+XU?zkc0(|*ocF9Q~
zdsI9jTiA|*ifs#i;*5tKXB_@R6t*oWAirh^bH$4YCOG2dOS2GuqO9U~*arO6zCIsz
zKWMv7kC})C4N5U$7VZ3zP%v;ARP}jU{QHh203x*o%~#HJ>iLtjA1~S&;K)a-o0hb8
z@S+zt3^^4tKB>(`M()5M9Br&S<E*)4_Jq11;7Y=$xDOi56W}<acg<!hw<sSu+y4}(
zsv0^JXQWBcS9bk#!HI;_eQH8a39(R{o&50Yi$fqc%(}0gUkf}AoYar!WR8M&jA6O1
z46&vp{h5=IX)cg{9+`ArE*`V21U|t81xp<9!mw~cta3?-29n~*1&$a31a}}f)Tb-s
zEID^(ee=DeXkbB9tcD#vu`1ec4<TF4`@BR}qTmxo&mH*|ST_SuRj?dSCy*t;kppb~
zs+09jWA;xU`;s<`kB1AoWi{y^Q6=fy<YS;?wSRs!;Acpf$I-I5(|?8lw52O5HVtk$
zL%7uxf^f4Z(Bt@Mk0#oh+K0aI1BD@~Vg6+JPfhEsA5r48_I=N1e_fkK)7&rFmI^db
zM_t%3Wch?&&;q9&udy68U^te0P_FZm#FxuX>29?0M8vEGTa3MOG@*)}=PPfNGd2Dn
z>~h#F@hilOHO7C8TyvRfk(7G|m`l)x%VCt$?f6P8L28$L?)>NXmV+6tHiIa>%n=9d
zcyY(oxy#?vj~M;DaRInt0+1{(U-KXXba32eGt8HK%Hf-bI$_Ha(4L$O^;8*b_a)aE
z+{=ISA(eURnO0Hn5={H^fDD);HinhvUUKvOaZALJVw`Ebp$?23_)>;s@kwj_z;Xxg
zRDHkh!}q#p;xuO&s}CMd{s<7IcygOQ1ex_eOz?x8grb975)j^@L*z54SbKb&JMbdV
z$$RXV0_u)Gh2T#K^EPG!2LdN)<V9M(f4VZisXc%6&eYQcINyA~Wr39WjjWIEK8F!;
zu>y_qc77yez=8o8Too4y0Xk$ZMAUr@^6ky}1p08TjYS#oM>f5ZtGx^E_gQOM+H4tm
zF@IWy=Cao3FYjbR9Z208hKn|-wnJD5WXH(C9j5lz!<KJ3<H;uNIla|0W(!Rn>XuU1
ztdUBAxj|sO<4?KY?H7Ng8UBEezzDe$N6wm_1DBj)q%>6#zdSgBFSFOaEb!3TRy{zo
z+cp$AMto3J^35tJXZn3o-0EKb>YLV8pTju!A>eT3dech6*;Dc7P6<$)A)RbVSCpgw
z3yOCfhvRY!9j|7$1_%9u!~vFM_5w>5I+(3tt@N#m!(nUjvoY8XGsIbkpQ<!%c7ZEj
zg@U8bJo$QmPYb)vEL8wPr2rNZnU6|7?X+-@JrIPrW@;CA|02LLPxJj=)uu*{<8Ok5
zUF2(+;JirYIF>>Ba7$G#e>0D{zv$5Z1j?a7ezB=d!hqY)(7>3sP$}K^bDf^Ow#hkZ
zB1Re~a)4v|OnV*7=&u&r{Lqne&YbhbF-c4lM=qHUUH|-Bu#OUD)iB*{p6WlIAMZ@%
z##1a*zVIu991_cfgC12zUf<h_KQqqvLY5MlyZh*ew{I)Bz|Zh#1>vqD=;`8O4^O&I
zE3;?>_qhxDTwQw`x!{A)DxM^lgaA$V0eb|QogNdVK~CZ(Z!PqF&=}*Wx&k6Gx0P$|
z_l7!c(GI<|o|pZzFqm}EG(27-+s>%IH*8cI35JyHFdjn{H7BHSOZTn%U{xc;yJQwZ
zBh2~Qt@jOIZ~NGjA#tTn&p5Tfw68aQ8TlCiC+=>wnL~!S4!XV4IH`ci<Dfw?nksGy
zK<UD1y^d19nr;Rh6?3(?j5A*??&z#$=oG;2jZ2i*CNO&x{JRj1kvG$jLQsS7qP0Jx
zDi6}5!<q5ifw@q7=El}|<Z9H*D+jPk$XHpc%P5+?^*P&}A?R;wC2TCWKk8RVP?V5;
zoC`{m{bB5K9@GMg2&^SPk@H<6F??#hu>oORC>8*rsXP+Lno$x2qY%T@+p)&}>>By)
zY778i#hkAR_`M<Bm#ga2Gg81n59H~FZY=%YJTX*Y9M7w;F!)5E`1AwVXii&qs_0Jc
zhQ7})5ywLLlB#i`t}A7{k83jfMY=NiA}CB~jrwc(30m;nM+N`;GLtRg+Z)S^4OlHl
zB`siR{b*Zxx+5X`6ya*F7wHiP1Vt{~QJwA6xIVVL)EM&e>{FvCs>Ns7vEe<z)N84=
z=mA27&!>v-|0-rDnnLHs1Q)yn;bCEXN&}xoBrhra_bDbO@!9(PM~|;>0-tm`d~=$1
zSv`*QZm&(hzpwOEVEfOXg;W!@nnQ#AcgsINRsN`H+HG<(j2U)%?1J8X7%!qV!5UUz
z1Cyj-sHY2k&@nuxwXv}R7s9ZSoZbSx=j;0!DRGl7qj1Ii*q=}1p5DYeu+_)xNT%or
z7ZT-#z9O*d`V+L`n>rgiIPYp-l4*)n`Ff7g57SH=|8*%xsld<3X{vC(LNGjVVX1aR
zMh<rL9CKXeUlIq)0q%I;%qVPp;qF(nD|05)7nzuA`W=%RWzK9j@qd2vtdIX5$ESGi
zEkt&oh)uWmDHZM5_OJMh0X)6-p)na;_Yd{?y2M|6ce6r`+GSj|+xr9lX0w;O&i2~4
zoVSbfO1XJ#^5HYS1Rj6pX1|Dk%zZw?oPa`ejjsV4>;h$=rT`z~YoHTvl2n8g>eSC%
zRH)}%C*W!cu?%CWm4K;1j&heNn}*k3+n)^4DUzJetE<SLMB?-}iK-veMa<c3d0zFy
ztL58X!fgKdLox|(Ga>DU+WTwm-&k+K*^A58M+F`B+l*BYwX5SatC=Q)UE+J6xVg>O
zj@sH~-$f{!$jjvBDfT;bdfb2bWkLQ^gx=nS-JsEVxo0raSj#yhhn?a-K7D;R-h|m6
zWS&c2ZsWTL^DCGi%+`UPU6&DADkkdMMDVgcahdWkJF!?(N>M+&sdF1sjKYe(D-KBH
z<CYQH1O;4t<H{21V8^C0ZOZzPMcr8MP<tk0HIJnsadX6}?a5zI(XaX`zEf;!0Xl5#
zk5l{?MfRsgG;G{3`aSrah^jZ5InU0F>Rbau*B0Dp#SED$t%X5Ztt_(p5ADLv&|cGj
zxUjk5JyUNs9jn9Iw9h_|-)<3jmm~ViXFdP;Y)N4a0@szl*s`W>c|^m+<JGb?-S>{v
zlK2h-8c&};^!+rrRASfstr3P6*)dm9U(4n%YeVnsI8Nxxh(<{bqTgA93<V1*vr~}p
z`Mm<8X`&2gz!X<C8OC<5q)nivDpoN9%i)1<7yeikr`dw#ig#lb+o*~++{YrR2vc#k
z>I8FrNnQ$G{xLbt`<<_(%?0(x=l5A-ig#h`&TCnDrtX(JtSEvfP}~Yhbaj6`g*6PL
z_tmA1w?2c9UH;d*$cH3(E#N0dq#1*IhTBV|;CKUXy@N|)AZZ@==nU_xZZp-IjC&DM
zQn-^JPMxjE%xRI5QG4~_OmNNp{Cz3B$;lr3%$ltG@}B*$M!t<Zv#xOgoQ6kRU0M#A
zN)qK?<K^EMHzOCGp_@ArudWTJ@%Jrd$E8@vA9I3{Dzy&>B4pHyPxfE6sfB3rfHX?4
z-sknKeLT4@qy2oB5|mk+H*77X)&IfT-;b2H5OG5P<?n&8kM|$Vr<~B6a~b^4{2V7F
zV5qvjAXULyK_UZ{6SYN=OE=(gDVxf!404x`pOzBOc@1-^u$T52n7w#ebq0Ty5X)ai
zDVDh;IJ`oB5Xe}5#?D&^d)@G0wb6l~oc-#u?}bmp@*(DK<86lC1=Yf|ZiGX6m+b2)
z)!c^#D5;+)n;el^&m|m`Qq>6$e#LLh;qfy66-=&toI7y;W2v`5x_Us-5$<7?dh`=3
zIRBNK=d!2GUM5ogb7vn3HRoq5BKVv%@<_?N%nn37{gHeWk@j4?B05PS52LY`n9h}U
z@;|))6}8eY{bMJ~MVuF{z9zN)=OB1Gql)#?7r*;a#;I>^>6XLJit^>u<kY&T7%yuU
za+=*rDEVtuwy8fq&a7}3I7$AF|I^K{7Svup@SoyMVSetO^@1A;JPQBTRO$v^JJu<r
z=HCYWav6#nlew0v=osYB`khTskHXABuvAMg^FFvPbM86w<2vQab6lCpZ_~sfIVOmY
zb}Gw5%&OiiX48C7+<I||QhxW+X3-#{H`6?(ckerkTqkRnyVCK{=*mY!tnFwd<#@Be
z+3<p0=k`w-_WTS1@8kXy%~q9rsk~{zSQ<8>zuNzW=qHi#nY$dYV4s*g7D;MHx22P)
z?Y<R%A8+R=+g8;a_K0(f0yFRD+vRHOCp={?@bvZa)|#~B{kkSi>G6+L%R7@a8&cvD
zUa_2Wndhue?{}TPk^6xUK8X1|`b!a^8mbrR$j%y2Lz{m`mj^UdeLW7?c&8gCJe$j!
zzxLKx{qdoCi30p$PM1K8V1@ATSkfhv{72re6uV!Wh`;cMSdP`VY7~%~-CW;$wPbzM
zsH~m#XM^jR?`U7CzF)qyk6_L2QV;2m(SL@cBEPEN-->>~i97GteDrP7=H}BhnKpi!
z`oypkxba<i;i;RB-&Z2FGUZaWPe$2I+7)ZHv{RE$%{2cwG{0VYB%VcPkLaHp_hs-^
zti`IeOt~4?x8oGoAGzpF3p~}1?+@Zi32FIhrW)EoT)6?Vm84HHxGbjZD>7>HKHkfx
zy}fvE(rxXV-rny)xhV#fKZaPUdZaUgkhoC@{$6j%${lb0Iu0iI_P0%xZtu6HC%CB&
z@y?Mht)llVGL0U5IpdEtB{OtN?*B&=y1w(JcV*P@S(k3;$2iRqWg`2>*C8HOXH_L`
z(HxhkY(0*8%wF6^9Jk?`qC%%!0GHxX|3PG3jVs$Vrr`-ZLSpwwO@FqNZ!_V#;pU0w
z=H;Emsa<K)>mS)owC!Tk6qw&OE1t3si%RSv6IZP&xqGVL^QCF55k%^DI<@kupl5Gg
z<Gc8!W3`=5o&3?dI}m?C`=bK?9fKbyc;(WhCng$~&KpG-##=3RQmvk+80lY4OMcbE
zdsv(QlsK%^^H0qdF>veMA>kB}RYFW?VX*U$*Nq-{N~i74Q;{r(Fn$Tw7z%6OKwKD)
zjXpKH52&kyLHrObl87RCKARL4fq=H0B@-!a(11dl2+iIGa~jp%C7F^>@VczObWz}r
zg;50BF6-%&;erE&1cmu4t{qS9e92qFog#<=TcFTpoD_QVXwtO<4E8=IBq+tFNTGzn
zIQ&#JeoQigr7?rcjMG|UjRnGKZ9^&)%(RO54th$ORCcCtk4)G(6u2_c+$#`}2&TUT
zVGCe*W((q$3T%Q3;O3*9$16Yti&6mbR5=Or2E+OY^SKI>)N&f7e2LRNRr6W9Lx-_S
zLFb785-NtGutcqln0A;rUE%p2d7M0rE0T71H~N!Q{M-bk&2Ua|*G`wTb)Y6Y8|%*(
z8Lbs*(z<0jOq6>#RoIHv`>-xmOpyRqz6Dcl`J#&MRD>$4;RHh~1|;BV$2x1OyGECJ
zM!nicSCXHWzGjRuZ7bz~B9fTW?yNSZ(VB0La0CB&Xg}&YxXCnp2G)K3(}FWrX~Uf$
zQLG~PQ(44QRgjf?=)>N3Kp=%hgm(}w&(g#+Re6Smsz^2V1K86~r_Mxk4?VTBb2~ce
zVS{oz1|{U{%pdHS${y>Cccx%9fLXaQ>zm;gl7RNL8R3mY^#rU<AHnt?xYN1MXv0*s
z&$7p^M<fAw84)W&=Xi-ivPVSoprYTCQ@V%PdCaBbCx~YwoiHv#g7{>kjtqr22*(T3
zPAibJH&XRlq|JJ~Ts4PWzj~SVm}zIx#rLCm3_Z-U=^`|1-Dl4g?5q)237uI4-F;7y
zX(~?yz>WgtAiOXIZW{QZ^k?)RyGJoX(NivG+4Lg_uywl7fUT#EOiqwnji)y%z}trn
zdTBuB@<$n0<3!kwg=)I!DF)XkX|RAVkm)*eYGKyAt6wYZ*;GFf`ISvOsrU#bDaq!J
zs*01W#~2hPScgmES4`yC_~gTX%8yOs<A@=%rpr(I#NLS7^MgyWa8J4=6=pk1JCY9N
zjlbWJw(gpt>PVSxoO1j}RiBZ9O|?4*&4{^3nM;<OOF1*~X2!1InUU1#%(b@u{nJtt
z6ws|cnJkCN?vGZNON=~^+gD1AAkj6xR0Oj_CctCAJ5}7TTRd;ziYB&#8H0Fc0-r9?
zoam$4KyUO|^56E<NPi5AIim8B9PG;4Or4~D2c0>ka?*_Ls?E*`Z;_LkvabTa6STLI
zjUuK$?8IkYFcyKmG77q?8}^D{=H=oP(}wWE^Xv<w`5Bq?$7iOW3160Z8u3CR@a6g7
z)6R<0E{~)yyngOp^W2_k%&X1O?o1KLWfb{|+2@V<$AR1gUMKVa>eNr`B8<kYOhrm|
z-`<+VuYJ$>2UePSc36J3>EX%J4X)2(UbdF=R{u;?kb?GpcprlAx>#D|SJ{e5kp3fl
zl6kh!mo^R*GP!4gvPQp%8gc+$yr<bWKWpb4VLNlWG<pGYDw93<1%b2+c9Z^X2fPe2
zx9{_OVw5YFc~kC{jN@U-QE5)FlYAa(UVCUDn|^)*ggTW`?nhwlc7B^gmlS(x)N-Xn
zFsJyrv>|HV<@Pi=)5_xXOxARabrL@DAGrF(d{R$pa<FeoCfcxrs(0*EO7OHZHIB+9
z8%2<lYVZQuB@=)0U?ctC_x;+E7O0fp&QE^HE=e~AzHE>=RjN4OAcAB$iL|i<m#oCF
zl13ax7W(<U$MB1NY<L@dPo+({f+weqemS@^t_B!73Lr{3E5yWgi<E#o{m54>7bT}n
zf?l)}Qw5m5rRDB34?ccysPd!rlp4|7C9_6zU$~7wbDOH?`Vsm2e9GvL@V=JdoWbAs
zqMo<U&j${iebs4rG(Nt6`Zbrr;|l*E$wcc(SsR3ZV$+%G3q#d1ixsN=_IV~D!e&y=
z(VF;vctA?$08pkFy$YnQF#~32Ek5S}&zD#a|Lep9OR^I&L#MHAGIn&X<vqr*cnRoj
z-fLUaXhbfMGqUi&kIsST`|7?bUQLh~?u9FR@7$~0465Ajg3;T|$6KuRvy@UC!22Ut
zCni!zyyY<YHaOixzmE<FY!MoTW-MhX<#L+Y?0=&DTf$SKZZ41ig1qyyF9+<(J*(cy
zw1a>8Zx~j@i(g=Smckm)zb1QaoK1m!UtWu%*eJb{r^@*`yxfQ!c)LvT%NF%Zk;2kF
z^X18Fy<10X+-N%%1v{`o`dY<WG_C&*n_0V!nM-RN!t#sZ&V$Fhymm`x1&>UPc9@ht
zrmb>fs2}ipJo79QXO9rHBPXuNAZ)8{j89(B?U-ew2F;JGp;cGUm@3<E`Iqx6J#Trj
z*X6O@_VaEwa8Un=V`8<!y)u+TWu+$-7ZU$BGWOgvg7_<?J>7LV9jJq)*<!9&&426y
zS#)R=>=4<hgzAGtZ@e2`f6Nw}b*DNiRwZR#waWCN{A0(fe=-}UsBCGl*9qLhdk_Qu
zO(m^bHKW>c?2=74R{eaf#+BN#Q)=Rmq%=cowW4ZW);)A9ijBYbPkNG?K+}^51?`4f
zy>~}yh(?)!3K0J>C74YRyoNm^(>vQ%YjmVW_+*{oC!cwmTImONQ<!07KF)rD)q|^>
zTD&o3N3fna#%fbQ!p9GYzme@5izs!=&oI{WR32J}G?MjE_{l-P6I$_atlp_x^Fdkt
zsl;RgYezqQQf_0Rw3DT*wo}~>UT1d%$+cdwLu;HpQFm5J<D6FAIU@}Ri#i8e4af6!
zj#o6CeCnL8Yn%_QJ0GRt9AD?0rs49S&gH4bg_m^~Dm5-P)Lne1;rhPLbx`Bd=ekQj
zG%nB8U0&6=vR!xONP`5gCvj`K3DvuyHQi6tyDMpWXw`chD=#hTJ#96;&ewZg(e(B?
zs`tLG=@VM-6Q$`JU+<fydG$g4)u)<%FYEm(HT@gv{oiQ@ysr-!)C~MwANWJ_+Fbp$
zRn6<$_1BLygWwH8+*&t;8g8Jqf=@IAD`|yjHG~*x-Lz=9X{&YXe8a6PTDN@~ZeQ05
z4Q&XG(h7@j2ustt^Pu6*Q?2lq4dInqcN?~wZ&6R!87q>gcRz;?_qXfMK%`wM$UmV`
zwUm=HkjQUZ6pIO!APSN|IZ2|T5ER}jA}-e$S3r!~qZp~P@FPH?-NuyAFveSO6gve)
z0!M!)D(z79hZ>AfCe%HKdd!YM2`zqbr<pZ6>M@Hbf+)^36~|MMt`y0FFzWlGhNyEa
zsp!V0FEnHjQC<Fy){e=&y#{1hv=Ir+A4JrO2}{T6JWzTp|3^z2-<Gv!a^Gq<^Jh%%
zcALZ>t!yw<n`~k@-|_f;qg@$Tdme1l-L7KVZqRbarLQrseb;VWC%<?ne_Ka8-R$W*
zlLuP5_TAvv-e?q_qT)(>xV?QJO+_M%W#sQff}v3jjYehQ7u;sz2;y^UJI|j`r9YwJ
zB4#CXkXP)C`|O?n*B-)7EM;euHtUGageoE^v3k1I;8^_~kftk0h#8~os>?qUsx?oO
z=eTPZ7LD{J+T^y?@x`7P0sR-%h!Qg~7-2|c#nyS~+4$-;v70qS9W^H;>oqEwMfHLo
zekPKI^jbGN^m2`Jl8KRnCJB4n_x8Zrc!mV2J(}H2=TB(So(c6wv$9?EN%eh$?r0S;
zur!IP(%q&<YJXKskzb?A2Wi(@>33e#@A5Fw={8nh>S$vpwi`u!u+_J5_<vO;bEfKH
z(I-e?Bc`dLn2AicmJMVt>p^=@gT9S5cnED`6R@v86CJ_*U+cGq6Y4aiDHTN^w)-?j
z)q;xmOiEWNA8Uy+kk0hIcD+AZ#e0;jr#ofa4JRjbr7d?2XiY}lZ=*iF&3bHH`(V%J
z&A~Tz;>6%V3EXgU(cs72+bDJx8`C>c@J7L%qfkZ2Ue(@zQGAj2_QGO)-rl|YHY>Cl
zS!Q6<LX}sK&X_ZO8Q+*yOZl{IDz{HFs)~-ge<#|*q|^jt)YpUw+An`+f(vNUUNWfE
z(&1l=j6RBtf*<MKG{L2}*o+(sOhm588Ex(vuCW`v=6kn}i!y47P$E&&LaEwSMDcEu
z(koGKivJn-wi-p~@c%JZ+6hx6G$vF=L?uVw1w%x!V0aCWOh=m0okspqx7wE(Dp8vq
zc!o?Ii5MlS6P%@0CEDeBsLwhjX*EU<UWAQ(bGAt6$b7i}U39#1=0ldTQ~lCT$WIF_
zHa4X%@vO8JR`Gz5bu#9~8SFv$Lyp(ikBVD89xAha(YDKf=ZZL3=9#|gfvaKhIwRK2
z?d#eY@_VfAuF&<%Z}0AI{oNA^A~C3}LYfh%8}6OS!dkcYQNf-c?*9({fbS?GXxb@q
z&qTxAUJSU-v&Ed8$u~L;u6)z_@ytn!mr{jeEsYlv7C%=nKa$85X}C5H_Im$J{I9nh
zHXyRKSrU@uQh7*Ex^(d-uJqR-<a8F>gW$0BW9C#VO5(rpzl&cQLXRX4ZF?VVXZ@Vm
zRegRr;GU<HLBngx*7$tx@=k`dNTl=GBHGLJ$FB*qT-HIvdw()cXcVyUyAz@$|M(a~
zRs7eqzhU^N5oO~{Ns)6gCGAgx6N+sTjzY_<eCxQNMKOBVdn!CFJ27IJ-IA&LydR{p
zT{Az(%spDI@r`NZen%-lN(r6I!ps{rK2sfd8UcF^mQnflYEAm5w`w(7<%;}fACH#q
z@nu`H@O>&%rnM(E{O`X;|Cdi?c_a7d6&suFY`dQowd-`r<HI*$D+p2OzjeJ68sD=%
z*%%xg!<A;@w-jxybp#ww_hh^j(_Zsv&z*y9m<l?GzUt-ftNMx%Rp@$?G5Ezbq6!@q
zelUtQ{GBCtUi!Ai*k>V1cCBq<oR?Zx#R45>YV>cj{qxm*o->GZUA!@$D>~+7`qAGx
zGDpIGJ$W!0zWi3`ie25fNsg=PjqbD~^CHlD*XVl$xvIPQ2Ub(<B3$xMBO*WgOr@@5
zXjdd`e$V}R&)^U>lWtbe{+N=rhP&_N_Z(8J`{K(-&vWMa4`&|*whGVX-O{X?k!4lw
zynpCE`Eb4{)llU3vuwdepQnX<FQlU1I6qo=UEV6PSXOtNLsYYSUnD^FOO=Wr|J)am
z<u{|3A1~LJZ+TjoP2@jbX<BX-T|M*T<cZbRgG13ZIuxC^*2ZZhw%#FdC2ze;JW6b%
zTUx6H9kzQirvkHjgY|NwY}(?JfvA5G8z0XYiT`bd^04HkrkvCY!Cp&k68*AhY?AV{
z+i}{d(a_&!Wh54zzcYPHF<mAqxGqES=v>jdMT%U{@AtdkLgq@g3}Qa~-K9mYc5}m0
z(NFg``qLhur7PAfp5k)#%#-h*Q!`7}El7`Nw{_BM>)ZF3N#l(86n~<Cz^dSS9apyr
z)?OKAzr71G-_%Ytq7^_-OP!WGm})bi*}<j5B+=1!EJAChbkir?u_qm-*gA`IuC*u%
z9pn0<o;PAHmdA0XGUJzuK(TT&?(q#9?E;<*=*N`jJbpydqu`&3?o&3{s#*@|k<8>^
zXLG@`JkF=BLH9$+CWs{GRApypbG3Y))QFS9(!saVu3|d)%k4RB37&e2mX^2Od8sEM
z8}|$nY+0?O>~PxcIDD%~5=Z9L5xLDr^yUo<))#g$$Z&h!(=>e8)sYz)9hWXS{1gIQ
zbpM2<&ifHaMs!#}heZeBv~71gRg~4!A{Yy6{XLBK#iXWqc0uvoyymHIPHjxjoen5@
z&hu=^?8L(_);?THe!Q>X$Mr6;qHIL>k`@o~>y8ZH5fJA;6ub248q=HviokvTX`Xw>
zf=V_@-uQ=X<$&la6_F}2=!U6MK~<m6AzuOLOkPS}9gj=EDUQWloYR|Er#%cT*eC6i
zd7uy3DM5G*B@@I_2g&ryb8q<)9V<J?1`&BC)1-)R{<O>2k1cK~O2ReBOC;TM1@dJt
z#9yI)yM8_Q^pL-VD6n9ccyz&`SVG{{DaVDg55GFRG!%GkpS|Gl>cZ%wzu?lnAz4G(
zSI3ABoW$i{ubs9jj(siy<yRd`@BFJytB4*IU(kN<+GzjTf8wvm$dKISO8fKgf;}oI
zPfB%XWXD7HM=Qcc7cZ}0_)LG@E>7Z<Gwjh7KGDY%J&wS0a7?9L=_BzUqM+=~RdMc@
zG;1F(FPRIffHeX<VbxC<;`>-mTox1d)wf)8pTRy<AwXmFUo@hLq|rWRi{4q5Bf&+#
zd^jsuI)8QXV(Q(Ac9{nvy@4y9+xEGUz69_aFA6NIz=cy@Qd|TN;?85Ht;T&u|5T{F
zYXwY(?NH%=y%^%pK$nl!4kbB6!s2{2kgQV@D25|$<@|Tz`CqD^8$ApbOJ3|b{?yfO
zM&>WYEN^hG<zR%-nyZolg&;wG51fS4^@P#p3|{JI`k^xwW)}eAEGb0)Mp%%wu&D%o
zZ3a<rqfbzbyV3o8yNC3J4AF@3W)>%LQYSqAQW=H2<a3V*{k`l!GdCak0ela?p1pY2
zD`KaeRRk5AsHN(`AEi?(%32jg(f8E*;d1$!#)i(uqnVY8RGQH3;46buTs?<jd?c<Q
z4O$B#YN%cC<Pcp6S?<f}0G41r3DNMh_J|rErynF(kc|pc(eF`%ubk>KC%!Ugcy(*e
z$+(ts_kuackJ`E(AJ;rM4bOW<Fu5{s!v)llT<-7Pd0K4hS)DPzHExP@Dzy^X0C^Hi
zaro$$vHI{<+0Q4Q;>w~TC&Jd<*m?4BU)(I~u}(L@Yf0z92Rml0|9IFrQN|yq)-3eP
zmeTaXzM`KZL1D>-F#izYZ{M7D+QdyJU_btf*&BxJHucZBIkXQsOj_xx4+Nz}wJ7f?
z2M2>hoz6s#ewaw8p%Ev8ADF<<+~@D;JFi%0lu~EnB6kPwD5CCa3s3MJo$O&1PrJ7*
z_S@h+e4rAvQVgy`8?Bb=#^m2DrMixMfQI%zH0AOsnC7{YP8FpCF!{VoY-hFg1bbHE
z^k=4cj!Nv}^lD`M3`5$*ZQuQy<jec(Z};TXo?V>G1`sF9F$FgU+K{j5x3#*bmSZhD
zaO#DL7E(pX>*(e$iN}SM_(;TAzywPuOnJTBE`IA4{PXT)II|1aSb9EFLwzbv7MOw`
zD?=qt+itgoJy~<6{kQU*em4xy`S*3`+iAiSRA!g)wD(81;Z7OX*!!30k|65w@jT=t
zt?<tj&pwV$h?(%fax*MN79L-|^&6~+k`5yZXU#}zRvG`>DOvn4%`?^5atfY6=TxVN
zjhhJbf;jZK+10TxZ^O1|jDyL_>!%BVY)|pXtGoZEsw9;SyRqB}0HO-R6Jcwah2=ha
zee4Uu@Mt4_{-lXk*s{#Ui5rq|SwwCW1s5<RGHoJA>OjX3jkKfD7bwqL8Hk?&N+s5%
zYm(ykkgx-Wcm?Gs(%6H8D)xs<DG$UR32@vds#e)4ZA|e1NDf&fN41jDiz=nHsa1F7
z>wZ}H21QI3iw>s$*>{7@PeG?mQhMCTJ0S2uA<vja0h0kv2Y7Z_(CPqwfLXU<%#F-|
z__-<0o>oMGwiOx5<N_oMRji84Cz`JKrVtegQl42Zn@Ga7Va4~`MCeTT1O~lPpnRJl
zjK_(c1(e(=PzZQ#t6y<MS$PdB99bwZXN;-?v3@cUjp1QS&VU|$w-Z*!z}eEpf(x80
zhS3ff!#AGXf2PF8G4~66o_B+=`xxw2wD^l+TqZ)v8YCXY<e6#X{aplCU*8_EQzU>8
zGfdVw<4G2ewwnP0X~Rk_Aa?yq7HBbi2N1f&qm*aQbI_w`J*?cy!2E2J{8=pgOH#OK
zm{SEV5lr9S!ov5bq<)%&6fj*NzaREx;F1`EZRC&c0sL(kjsQ2DIfX4aSUgmo<3#}H
z2$}c54Lt_n2j#_AFdW*cxCD{}MN(pbp}3NP>joVY9Q>Lr5*uXJXC%4is(m{*!5IQy
z0>H8FCirnhaP*`6a4>G1$kn<bIPES(rn9fRqmSB%qG7#nH9z8aKPr7M6nQf>*y@J<
z7yKhD1NU!Al%uxUSw&oTLv)%by2emmZWDP%!i*>>vQbzQ3XuOm?Bkti^+M#<6!;+-
z@uU#mMHjZNMJ5oqm<-_=fMW(w|C^zh>BgA?NZtwNYw|}+GFaQl4T5f*@`bnvH4YXA
zT97ePPgj!55TO++ZcPc{{c&xw;>y=>6NO5v>?#6k%Ix=X$~Cx-T3p?Iy#qIW9Z40&
zCv;D(E(j+s&!@J^u2x5p&~{f%o@(9NP}P~neIHUxXF@MyP(5U^7A7p&ltY!GLz*c-
z!U{;iI9>`QmkzF?L-(gRf=C=k&*-~?g)k<GL&8n`3W*~eK>nd{<&p&tKoahBGq;;)
z2NFjY8PdTi`*Rvv%8TBnAYL<h$Rv@iLU<gLCxOhh58CdjM5<%A*{0x@6ft!WqJBfY
zQr+sW8=@c>q056$pj+uhL+dt0=NXdV;D1RBqbTA`CRU;qD}1Ob%q&E`k(JOqE1Fq|
zdPWr4$BIP~MJE{iQH3IzSm9?B$YQh=5vyp4wL0Y{_vsq0Nu4{AET~QqTq}e(ty&&n
zxyej<22(JG%o+ngC`6@)M8(-a9z&v##iCFNeOQnJe@zkkb4DaA8|ORfv~CAsnc|vF
zRwSh<t`S9!A}Mws`0RIi4VSZ2qOigfM3Fydgx|>;aH`rVY>MUyTzEd!I!_e+6Nt+!
zR9zmat+{n^Ga4%T*JbbQ<OI<^S^7f%C^{1>b~r*H@)Dz>4>3Pc{7K48NpyJpbM+DQ
z3;{7uxE+a+a3{xf0qpw>XayizG=&<oXAdu2PkGMv@gthx<XMeDk;z<DBWed&OG?`T
z6MIIdP4=KrQ1Z6sE+7y?D9pv2-dk4>Wt?WWQ`d4ww7l_kt4GQU$mP<lqo#RY^p#a5
z4N9)5XicBdQWawxt>xWB{dSnl3U=0u#%LA!*EvmYfqs6(;ua;*w~_cfBH~$r;sNE_
z(OU{XnU0nvB1oUS#d)uqsbQ~!5dVk>Zwg|i9%pJ(BN58mM{tUYhI7aZ9ZbPWNc@?O
zwT2`f%PLe>T`;GkkPm(M4M=j4g&njhs(of=Yz+Nqs5UFJfkor&=%!M$)op{t6K%vx
zbs;#JklP;HhN888{R@5+mQON#=-0%sDK+smhUDYnGwXGz!`ds*+a&3q5<P`tRa2fw
z!E!Mtt}dn^Y6c!WX5Ke|uF1lUWn7veuxS=8O$Xy8oY*9Yh#d@f1z9j(RaS>ZqJ=_c
zKL)wZ^65@{6WyYI+!Nd&M1*5}H#gK1Nw@;RtJ!1G2Oz&+$G_lPC#ETtN9MW0xkMD!
z(O-+j=74dh?lyX-?n)|`@;MY?bkwe06QlGg5N^UAMT*oxvF8%FG~I=AneZ+WPAV5?
zth{lJ5gi413qQaGG1y*@CzX%GGfAjOV{n+9@J$uy7>VE9O<*j0+_)EQ`~cTPyJFQ~
z_YQjtOufa)i?-{tQ|p!NtkrvZYdWam-mvC?_jqWtn(cPE-6kz;J1}PVbxdrv$QmQ?
zv6k5MlBo0W$$kxqB+wNvrMtphslOcWE=G&bPop2d*HFjHFBm_cF^+&HMf@TO<?kG8
zUd00#P}MDXI@##+4cyFw$TK+))*A#O3k1Ro1-|lngTruaZiu5tUmiZ*-HgQeUDp&R
zlM!z#d<@pEKhKID+=%X1zpB;tSci6+LXw~p5Jh8(Yzm4sTQ137v9BCO=N-bHZ!1w)
zl&2UcuR8~xv5)^zujK8Pb>7k4n}~>H2HeJK@DdTswl$eHw7Mhu8YA(WR?=oPQWwi|
zoy7MM3%$v6;(KyK-bdb9t5mJ%VuP=#i)!~k#i$sr(2#B0JM0+;Zqpw%I`7>G^a;mZ
zZo<J_{0FT?FI2x+kA9LZlv%u;!M=<8jkWzWCFFb0CY3jY>*hCe23saU302s-GNg2x
ze73O$e*hBjCMY*i*o!I^#|hp`(bBo^v%lDLk#-XUi@--g1VlLDP68c#x_~44A$KH-
z!<9S<Tx6RevRY!GD1P$#^q%<_Z*E=rOm#jpM?@T9hxQQHB}_d4t;^@uvSZP4bVnje
zd0`y&--XE}Z0%Mds!*gfe-yR4dm^$Bb@QuzR3X~A`stL~D`+vYi5p=p=&d$}rW0tz
zBWNeV?OBRAauuFiP*fOp<8LO^V+w4F;l0U&4#PlCV>tE|ppVX+_~iT+#?fp>;&J*H
z3<tkXCjM|2F)Y*&=hD%?V<jS{A<XruzS%$jd0{K{bN%RFyJctl!aC<95oHOTOr5}d
zo?EzuI^6d{l-RB5r0VqZf&9nk3VmcHYkKL?p5$37MO3S(3`)Je5naB{Qt|Ubja`u#
zZ!~cvI*xZ*LVunOPei{c77FV?znNiUiG6?PnNS6j+{9>euUBM(Y8KtGw)M&_h3IiC
zx@kn^kR!}7S1IhAaz#3>WeRQ`g3FJ<wO}pBDZPKA7bk2bsSVBML>E3>KQvQuHsbCw
z3p$g|C6=l<PUH?Iv8^CGpgV&v2?tDNcv1~V7K1$)gE~gkUJ$N*FXXj8mZ-X+dqf0+
znVkC|q^1EX7!cs_kWdA26%f4LC%iPH(|j%EhpKT+g*;3;_bgFR_QU8WU-1y~=U+vj
zO}FfI7LO6~=R^!8R*FVki$4;@*_~S7xz`~|2ujeBhKA7*)|iad7T+-@m+Rvf4ula$
zOd0$;{t5|ZHw8se#MJ>LKm?nAffzD5gULJ-g@V=vcn}e)P9kQ51k?#o*(os7?ob_I
zJsYgNLt*d02+`>L8&hojg>i3;S?>{1QY>O!Ec!iDp5ar79%9V+1%zx|>;{F?CSON}
z%4?T@F-{77dn!N@m-P*Ywj=UCoC&BixJsv_EV1zWBBkFSaQPF#P05oWtaJ!~+-E@k
zkjqx>pk0qTbXWuo$t%GHyz>WxCU2EvrVz~N^3pbk0s@Ne%iSR@ClZe1p9;?cW-4Ev
zy?J?ME>iU<bBZVWEv^S()ij>aik>)%z<vDA{(^*iLEr6uf-B0$y_oFi7m=<tMExOf
z)AE(^AWlv9v<sk7+t^DTjElOS?-^juuo(%%%g6{<)(a0;&OiOj4wlFy#m%wsJCG%M
z2w+*pYJ4k%ImM|?=9%V}U=~6~xYu_h%gU#~O{KHq=tc2M8z-ZbU(852we$B(A;zDJ
zO%{r(`ptZ?SUw=~j58%5EHn03{$4~Me2P*UBM+{!NNkDoJjwrUL>Aqif|l?s9)MWs
z{;LlSJ3wte*g19fh5Od0z<3Af!LO1maIOS_AtKU}pi<nG@{fjaYwyZ3I(NFjRi~>*
z>WJSA_LtS(_`?+~ys^khmzVe#?;eZZ{kPAmUNTf@nk-_Fr2gvTbL+>t|FLPj9(m<Z
zdf{!7M(J3&YjgO4$eYL2#cL6ni}34L5--4h538|NmVLe>ygU3BKj@<qx!uG%4A-n;
zGGf?84O6tMr#n+b^&&YM7b-0did1DYiaWBp?H66$icO{FhKs*F)b!P@dpGj(eC_RW
zk*%v^%XaTyC^X-`7S;dgcUS7&&>&`|*Ec7F{adR)D(~ZzZ1(H_%zd&|GBOkm4_O|$
z7&3VI?bfZizUBw;)&K6^TB`f@_gYtE!`kZdyZ0xQCL1FD?Tx<FO8fp_b%r^K;?#KG
zRQ25QQE}fzn5qW1=DxnAn>)%?JHZI&n!rFDa<pM#FL(H+xekvrKi9Fhrv|yO^&zJd
zgs+7a#$$rD-4mtUOR({pak;p7nWFB(B(a)#$#~_SagS6qOXJU2nPBbWG}~#EG|c41
z_&}0ED+-r==62YxSmJ46uWXx1U+<iYf?s}RT#*%)NmI}K@FL;bO84{=)Xuq=`Pf6m
z%X_Am=kp(&x{Sczr{=tp$+r{fd0s?Py>p^4a3Rd?DONM-SMeQ@#MwfWl<Ztl6zox9
ziI@|@zs&rLTVh%LWRm|`jV=loCvN{VST}S3U#ZkQQqP!wzJnq!-;3$>=kHcjldo?1
zcf?j!)h%Kr&v~^Vq>WWwEP8-fJ+B#}o0oT2@x<Gjy=CmuM`o|;X6ECrmfo^n#m3p9
z(v_B#fxST5&z#<CP5bqGD~;;|7gyiT&-AXe@*Y`H+gP-g6ll}`9tY8vxHyz_H)=$0
zyyIJJUSpvA^;O?Pp8~4Ql4|-&eRD6Csy_VtC#ljoHyIH$upr_Z(q(#oV)KLEx6+y+
zb?35;UaQ`v8y^`JR`Lzs{jADryJdUjt9$7z3c4S8*|#cNBt@61Qf5y#l#Pp>3!M!A
z{2x{~@`y8x8O?1IHWi1y7dCxd5D@nBo)OobnM_-oJHK+S+`BXTNXu}0GT%ZlMdoSR
zk&P~;pI&ok;dSLe_+rI7uDeS$gEo4)PafR6>oz5|ZoSfabZz{19k*@7dT($yQD|0s
zWw8S#kE7|J@Oz<R-7l;4e@$)aMz2psaU0GwfNfiyE<QUO`ES8vG<0X>ol)c8OC2{@
zU|pJ%#@ko*(FcFXt42m5qyqNrZ<AOU=p96M?XEp(_+Nkqw!_*(guAQ&`uJlj)Gvri
zuFY2(0wsf@(_vyLO7(mLl}G+3Qh`ZlHOw`dBUT37P>%moGS_hM-;mhfixQj<=Gd<;
zGpX~a4%W<U&YJ;LmrE!H>qtFSGN0^ng7BT!qKYbQnn874D*CC2DwUh~sa%Xa5=RXt
zbQO3GB?myB{{4uI7bKBg)eF8<4pE8(P2GgWoLLgG1lkW2+J#WgEJ;!~+K=4G3HD(U
zSk9|PL8%xnMfLYsWdhaQd_B|NcZLs~cnTR99G)LgeA0GTOC%Sc3VGemvp^uWIpbKT
zNY53nH{u)?YHp7;BjH6=ErFJjY+`gkLg;sc7e||!J>=K%7u);a(i_)x|6If+g3c_O
zQPL5vus;x*KIobUT&xNUGkj&_d9MIEAC$p)iPjqy927wdNRi(P%2lX(p1<Eh5(>f(
zl3x#mS9MG1_NlONJtN+GKLOKCxG_KsDtP$Y)f^`}9&2K)7T*mKf*tkU7*_ODk3mSm
zRQiV7el_AnrS$RoPgoUiM}HDq<1abWZZQ}s)5Trn^4|HvbfRmJw8;3-EBhN3qF*O&
zzIwQcVdfM{UkT_I!w2I}C?n%h(B6mV&$L$|e;fI6DRU|Qb2|SnX^78qI$;*TB#htr
z;9GPqPQ~Cde@>9ii-lWZItG4jG=f9G5=9zz)l_{8X;t<tnm;m7{`(^pgwe6vf$_D}
z3q9vR=Q%}gEm<J`n(qkKv`wF-m*&)0+s}=buyZMtXNiTg>Etu{;ek@H3&7g|=4hg=
zn8J|_ec*=Qhr|a86^s8C#_3@)GUJ#sqoE*f+k{!!LCa{p%;cl*Y`<QacN>q1q_R(T
z71jrRQN~a8P1(IK)C&52@GTtld9t0;{c*&Ed)VsTMz1&6=J-TXh*C}bEl)`i=ihLF
zFvbr^+6!SrKdM|8XbNE!CibJVGIrI<QtVP#dj|VdfPgjX&JL)mW<FL0f<@3>f1$nu
z)ybmwrG)jv+SKEMVs%nH-g^J!e@VW4FDg%4>1~*D7R|~@o-vM<`=Wd**fjO2wVOxL
zJ*sA3oK|4MFM0nvy{;=Y58iQjhdAF6c2lf<I4Cx&QhcXBz_9kwH;y^&>$^R{Tx$OV
zZa|U0;Od;^H+MOK%jl&eq@<fA=Zz0Hkc*%X?G+b|V8&3Uu?)uX=P3V7S%Ke_Qlux%
z=U!QQdYFb^rL}Zv4SxDmlAuASJ+0|qa$3}yMpUU!{k~5>8W|f}<%|2_31JjPANq*k
zQ|>XwsCYsMXh5{Fxss$tEBntix}W>1H4bDv0U40?k+Z`GZD~`R*&Vtz__96iYBw8x
z;HLICWKbi3V*6Loo;J5lNN#p(8^Y-Bkh;Gu?{Gty)&qPoI6N|4p<F=;Y>3Jp{2-Nk
z(4-gq)d$04<#1Lq7z2z}_LGs}2y}Z>(%+MWk18JRj6ct!u%?~IYXowPYn<dA|M-Me
zK5~wG@8lgyxyVOea+A9}!Z6=>&SgjQMZf&!-uyYxcRpcPTnPU@3O0oho-PZc$fDp-
zxko;xG7TXd;T_o3hcI$M;0k#i>}lMPlPzv>WIVW$$uj!tU;)fO%i!!aR{J>EE_2$!
z-5heKJB{s*cekr<?|p|d;O#B=)Da#7b8oaG+HiMFCSLJTXh-4ezIMb9Z}E+X^5Y|K
zYU07&@{IR8jsNVS1PenJN_e_Zi!ybLn1T(N2zD?0P=`kNLl(lw1R6Y{4?lEc4|}*r
z@cr=c;19p}1~Ek)>JV_DP(lb|$nG@CA*<`BF-9XmyZ859ZwyTSa&n_MGR&R!@Q>ee
z<#)yTy^jp_&#wLNM|=D^wEoJ`AN>|@gO7Y1JNsvU@(2HPG~#~zr)>ULBLE0H0;p{F
zmm#Vr1XlnBEe3m3HxgIS3v8f!tpF30a0UM02TD)}f>3-D=m}z=d&0nh25}E4sDl2W
z2v=YVet=I!(GOxE1UlhZy>NB<AP(Sw5#_*joZ*8Pfqh6=gygd!AoqO_m~rF4EPKQ{
z&~tJl0C`WiZ&5gf47fQ~SR+}eg(@e7$>N2Y1BM+UhEGU_U08*}5{6p1g)%S#?J!LF
z=QwGIg>u-2X849zxQ5@Sa&>rzt)qv5xNKy?U;J<dLLdvRpkhQ3dj`P;Au(e9a0Q;=
z577{Ueo$=KkP9z}H<@sQilBS`Ad3D#iuoV}1m^z<H&_(w(0YmGS5bEl@{kYMP=wtu
z57ST&oMDUpAP%o56TSG0z!N8OD2GpwZf96Ia3>=1XL`yw4$Nq8&PX}XcnZ=;jT2^#
zeyBOx$c^0?Vc$rF;n+yq*m>kgZ8Q>kn<I|v*p23hjgu3P)5wS8;Es5hIQPhhOUGYM
z#|8f2Ym$h8P{32BU<xiFgt^d(nQ##=Xb`Vx5T@vYLNJktbp(Y4i$&23LI4H9=2y8O
z40$0Ax@Hi^&=2L1gpfg!^3WGQ<qs;!lH>y-h)9l5<_h&@4zR$FgM&64f{*05lNZvH
zKPfmtc_BmDjYauUK6yDxi2+PWjZS%#QF;F-RH=-}pny__IZ~;WT4<F}X*pn-lYiHh
zAoP`4Nsj2|K*?1Pt%o;AF^T@L2X#P@6m$ix01hP~f)II;8Cj91D3Si~iZ9p=!XN}4
zSrmRC1bE3`*pP(Npby|+WSr3r-H;1H=ns@>ndE~aVR@E3M{NR>Eb)U5P=x_cFq#)v
zn)Zg8s>zzI`FF2*nv%mSvPqk@IS!_IZ;g|i7c!f>$#ah2WWJJjkJD$VsfNT!n!O2|
zxXGNW>72!RoNXsL%L!F`n3I3@mX6g3AE6Yo@DjGj1yDeOBk>YWCxV(7n1)%3FQE^G
zNs*3u1vZ!z`Ot__mt5d*H}~)k?;!sV*icjj!VkHi4*@!$1qwVHf`HX|diAD4dDu%)
z0BH~!p$kZ%7h<8JIhr>&p^ejL9D1P`Dq$d6kA*X$(^H}*8e!pAS&ajY)aiuPiJ}|I
zq8>V$F#0$%%9=I0m5S(C<)C$(`4scuYa-bcz&1v3aEeHQ4O-Wd*aZ#+*%eFJ6ji!D
z4(g(wCj(E=4xN;EA#@=!)};{&redl%WXgCzYN8pJrpakIY-*-wdZJ$%rgB<1bn2!U
z%9Yd84sr0CghO-sW~Y#br)t`d98#x;8g2epd4jq)h5DfED5Q<G2SOkSNbz)?>ZzX!
zs-Y^Xqxz{!F>G95rN{OY{gD3;t?H_;3ahOOic^YR7viW;<|Dj9s3QOi%`gIndaDwa
ztA#Txz51(_daJ{_tHuhf!D?f>Lae;%tIc|=@0V^RH=^o@lgSFL%Q~&dYNyt!d4rR!
z@wcsKiCp!RbxM#IM?tFZ3a|0nsZ4<eHBmnAK&wrWsz*@{z2L9^3a|m|ues0)vXHMB
z!K6w$6np_}k?1+L>a0VDZX<A&)x)R}dvPL1v1I8ty~KDJTXz~;u^oG{AS<yQGP1{0
zrY4)A9g><)Wm_0<uE7d(8;fZk`)DkCr#14je`8S`GP9$ZuDGOwfcZP`AeX+Q57E#H
zt#GgzaSy}@6zd?hTQUC)67m!L&<e-EwVlbe$3PeN@O1@x57Cedy`T^4z_q!+pbv`y
zI=h7r_A5~k2i{bsI_jtxC%4H`x2h?Ra2s-aOSg7gdVniodaI9oOSpdvxLoOEa~lWF
zBAnogv4{(~i;K5;+Xj!zx01V>l-rs^YfB$_1rF;wim3#bNjl{q3;YQbQA-s2iWRbp
z5&Yn~{?H5M0Bi=43wx2f{vZr3c6ArwpQHn^hAV9xVxesSx;mS@B+9&odvVstqR}h8
ze@DH`+q}*jeyo|f&icI7yS*%Xf5O?KT`Ib1qz{c)wZEeX;)y%h&<pj@wi_{^$MAaP
za12HY4#yA;W7Pi*(_p0jFrY*w6Zi0+USYc!(F;qc5BW<$y{i$$J37ZJy(;&;CX2z>
z3x$l!!H1i18Emo{Cv+bivL0;05Jtj%TAk^OM#ENp>Z1=@AOz93H(l!wrkfG(APe14
z4nozh@4#X*Aq@5K4r4SAiFpw`?88FU3q6btD9IHId=b4Mnb@bcF351@&<gcS!JlKn
zDJ;fgOvYtw#%GMi)ab%sG!Ly8cIpETPdC7M!w<qxzdjMXs3=sza17-T#s0v$-4KcL
zAjNqMyS>n2u-g?>Y!JN=4VekZbE(Ml&<hAkymy>8VVuUB%*mbX$)60$ySc^}6rPaz
zKu%Y>dlUb)PrDJaFh=qqRBX$VNhlA;V6X;3$QR+t1nk6N+rG1VyA2$X5BCml47?2b
z#cmtQ%goHp?99(>#-m(8M5+X=3_NV0se1DcxqziXAq?g4z(N%bVK+v{2o5Nj%Lehy
z;f%Y!tiZvHrMr9#;*i4zL7<mxyl)H5`^?Y%?9cxkx_@F+bsz-JRYCJW6H<&T;1G&N
zu@0@v(EiX5Uq^PJSjj~w53P_3bn(zV+{=3W&J5hNP7BB-)(aCN3nVEFk(kVTqsagb
z(=jd6GtJD>92vCx6wv^Zs{264@DlBME7KqhI9(K0O1r~b4hjtxw#yGq-4m>eu)fyR
z-GKkee521ajn!GL)mweNHvJgypaodr5$<_L;TglWVhqOI6(ng44LukWEevtZuW>C5
zbF4Qn&DD9W*L%&^=qk{*@(yBf1$CgXP>~Blpan!-KKwA&vf^+S7#Q=Zs!)N~eQnv7
zjoFv&)sC?TtzZ@TKoh@gK}0G9kj)gbV9;AJ4-!1tw^G@e4coCT+W@`Ujd2A@*a~F*
z6flfS<aq_dyA;O&1zeEYSV6Ts-P#rM+Oy5v&F$QrT-%Gmiv9qK(xux>ArD8;iuFX$
z2v^Ta0R`*O72SZg$&D+^{oLuT-s=sx(Y+W@pasIv2*xlC-t83c%b2XBa6*u~YF+;n
z?*Ik%ObOGawNnud#!wmN?b=t(-VN^H5ALk)-593O3&(KXN)gA^+)r6|1b%S4Mj;Gh
za1Z5R3irSU7T5?O2o-fqiwZ6)=ndg9F5@#UhZ4>h<=_X3V9iA_eNS3X{1Bc6trXpG
z1ZaSL?|=rrcGgR}nJ%6yFizu9F6C1mWqKptQ9%hnjZ5<|eNV>)$A}aWG!JZ`<x9R4
zu-wf~9xG5z<!$cf>uuwNAqYHZ5bGcWX}%PaX;kY#&_}T2LQw}?AO_LU2oJ3U7tXJ4
zt>z2<=8f*?5FY1)G3OeA=SwjUO3hElAO>^!6vdqsreF+1z35NQ;E!(Vr!N27kq#9e
zUI)>@2H4kJb>IhpQ4V{628u8bg3t(_zy?v53w~hVCC2Ogc?@-+2v<H7mh4wrei#C&
z*rQG$Y>w*FPVF(R>Q6yzPyhvD;0fKJ1jr`@^U%hI<q7g22n6SJ`M}UZ5JBf25`TdW
zN+1i3VCF!94W<q4O3@KQp6|9I?bQy@U(f&z@C8ry2Ls;(H8uea@BlQn@Dl*=e0}Xs
zAq3^{dz3&4en55MZVCf=5rPoITbIM^ZV(`E5L-8crZ8-U?GyL#aB6<(PJy(J*zYf1
z>Jh)yO#lD@U;|I~1v?J{H6{Q6AOHm)VVp4Z0)X>+J@HMkk!*ks7|;I&A~6r)o(W4n
z={q6bF468faT9wW1`1i?MWN^}9t~mb6j3S!RbBI=@$XB&&pOZZK0ow9Ph&$501zKx
z8L;z85BFQ$^i1*eQJ?X9Fb_Jo4pAyp`M?iZ&l6l<@?O6Vt?=8_t;0V7$u4FLo~V17
zfRf;#dz+62x+f2^a0TKZ4z!MY6yymTI1O;{@;*VHP{8bMPa1Fk_s%T$JzryAQ1?RL
z_stMtc<=YQkJW*{6oZfP(?AoR00pk71kqm(Ibjfw{}M4l{aSCACBX&A?GyPR+K!bE
zM_>xk5Ot<+5Pr}I<6r(!=LuSH1Y#ft-JqX}APYyJ4`Q(GkBR?*Kk>c*!G)hcf&~p8
zM3_+FLWT_;K7<%i;zWuSEhfZ(VcbTJ9X);o8B*j(k|j-^M43|MN|r5Mj%)$|fQ^t}
z1ONa5@+JTQUpD^PDd6Q$qD74!MVeIU$BY-9G87V3>Qt&#tzNY{QCPjFUA=w<3q?$?
zf>31LQ}WKASh578X(`xCh$mA}go!bgiOn=L5BZ4^;s@+t!i5bVMvPJ8QpSxPKZYE6
zW6YT~Z|3}X^JasM6J+v~99r~f(xRItrifMbYSuy~g2RSd_UwuGC_&MZ&!4F)p4bqy
zja&EIf~}yKLf%cxv`m@!LYxOhh$-6DtzXA3F=J`&-M#;RPf3|3NSioyeiq=X*-p^l
z-M@!F`gC^sUG?RvpC7S2asKov5yl^Wq%+1J{`>>bpK_GY$De!3Iiec{-&wA?=OF4P
zs%Z4%utN_o+Acm3M<mfG@hmehv(IL-X#kmoDltYGXB26^4{uaR7<q8yQKD|HxI(Of
z{GsFuf_@BAj3L>8LJ9m#Q38r9jzI&POgy;|BDvD)u}d%W3z0@K$1L$g@-90Mf}0R%
z0009JXpc-e=k(6TFK;Yo!#npZs5L*anuro1v}lk|Ll6BbOga~3G%_<kDi1S{ZnEG3
zo^H|sP8b{Iv{R()M6^DBWC``lKToBKA~uAmqg4M_Uv)@PPiLidrAIxA^gIj7;|Uf`
zYXvsgl0b#kx?|KT*2`&-rSG0AgvcaWX<?OBSZl4lwWC~Bv|yZ_78vK(YsVFq*lAH)
zN6&ND{c1rW0%SK{FRLZDUQV;+Xxm8v=+=Upng};edk1FJTzLy4^<af5I!1^i%2_yK
z{pcmQVlgRu00fOS_Gz5*8rYa)Z~6U5T#HW@(_o3aiU#79UslKyA+ERwW}9WB7-gN~
zqijW)AlQgkpE;wnWPx`^8a|b8rs$nxn1*@}A%26pYOr!nI_uJ65}<3Z0hl1@OTF&;
zfpH7~AcKz<=vr&HzgyaBh-4X3Zi)5bLWuuH?B=^7tltJaaKQ&>3WL5cn#SeB6@Etv
zA@Ex~@`e5;ymHGguQ+bW50VGo&EuUWDhczGMUl^Yq#SeAS7)75%}*yNmqKAbmlYwP
zn5VvDpy0xE+C5CYb>W96Uc}d7#|E6=*A+wvCF_G?o#laFta$6M#~!@nPrs+F>685{
zFb8$B?j0z;?=bl6*Jr=|mbO1V7xK}EHM;49iOssZ9u$TW?`5Gx{^*w&^|{Z02Sgx8
z;P<(1jBbFh%8(GaKppFJ;|ORdhbIO^5Pg{99b9-I0jrll5|*%p3*6j2AQ!?=^+O(w
zhzcBLN1GwNgAKkTh$lS3!ow8Mgg^fTBIZ!Ixn9(ahlkRKEVK|6B}lJXP$*O`8ZpBo
zCTfI1#9|g%H$=(7rizH-2XBPnz3YfUFaD^*Jd^+jF??|_KGb3y<!CW3M(#e>S(Y0w
zl0*t-XCV35n;r=R$2k_#kmWL*8+BBja<t+YiW6jqn5B?OR-}@VGzcLNxk*kIERkO<
z$26*QM@-UZ9-bqJSs0>9=%8{f2`gnLuh>ai)^b*LjNGWIldgh5QXe~t<za|p5MVB(
zm=76dL5>+re`wN{&xEFXa2dH{(FPmc&`md1c#mlakeLz@1{>HAplFyP7i^%8JY;bN
zafm}7-SC4Sl;;mm^kOe?=mq~g<w+21#511Cdj}=pum^0Ylb!C==RExp&T;xf7QOHd
zELrHxXjassp_%65^7M|nA*LL;&=V@};mvP8<Q+%Q;St^eB`$a(LY~mV5yT*dZglPn
z1@ea&#KI~z*c7Ml5Jotgm=7(mp%+@n1x#g1Q=by#q$z!eAe4YkAy9FE6uoFxwVITS
z_H7>Eki`nCBT|x<v?0DB2pi}Eg_@bsAIT&L7jTLfy<AAH1`);)o|X$G5JU|4fvZ36
zN>8e(RS<3Thf0r#)vY$xu`KCo->}gNGR|flvVd4L_<;>!<j$-QQG{Up;RivOf@)VF
zRbU5OA?Nf(usHQcH<bU7utv1XA4q*GTnsYU&=Q2Sf}jLJnz-0mKGwL$JxXNz){UoS
z=N?Y{Y(%1gyXchjH>ObRf*NGR)iS5Gas4S2f=iHf-a`>WAeD9<1YWmL7Yfk;u5h6n
zLdGK3zV}sb-;5YtKGnfttuloWlyC*lG091BRYG5?bS1kcn4VK%#XXi-hdPYcz>wpD
zgVFe3e<)(S!{uRp?>pkh=9j-uv8qL|v0vET!-%G}>O5Hdlo|U&#tU(ADMd_T9%t3W
z%gaZNFA|MhNE9JKHi$l2k>aLRR&uC<a+IM=+#Xli%7r`ek;>{6T`r^>BxQ0%qT#^J
zN!iS222_ZPdu9JN+xN$`(+4)9kq`2%I2y+o$Vj6h%5}U$9Mx3Not@Za;K*5&ah|ho
z-qB5il;aq4_D7%pe946HLw;GtwBOd;W==cy&9EbKE{stieo*$K`nZQIu<?#oY*rSJ
zB-K1*F%NkFlhCPNb*n=?YJcQ|)dg8cF5ZC+vS8!Y<uLL>%HhgPH=7|NzyLBjJ#FJ6
z0|O(#^p^`#>fDK=A95y0tFeJoS?D7lvY5tx2@P(4v^usVZAC$j(I1D7l-yxHh%q4P
zY<?qT2N-Y#wFSOaS72ZV*%lz77YeabZ+3L$?zOS?L}+0!+}+wXNW2Lm3?~Zvn&icI
zl4aL#k{|!%-)$Ip$}QRk3=9I(j^4IJu`vyP7-PvFcPOg+;UJB#o8~re5X>`P5av3F
zR5*t?M8MJ9l9&7x7<huprT$DAVBi#(wsev8q40VXSsb~j2h#QN(O%>tf2B6NKe{f9
zuX82qNpFQLB*c$i$O5ze5IZ>M+jM8Q<JwaPd?!D>ypT7fqY%OO;Vq)Vo%6ll|Bia#
zB`-&ocfs+~>V~>5pXp{?TiTNceGoI!jLl1{7t1U?f4czn(6_#XRkwWVi!~3i%09Y&
z#{kM*zx(z%A|vgveX+2y<=`{3^CNHs@0EYOf@6U6#fMccgbe*y4k9DEUw-yi$8xJv
zA6EbGaI*KSpAi`ZT>IxA95Sljeeu6)%<V5}=db+)^P}JXNJGXGGU9yrzsl0{>%UTJ
z2kXm-5qJVeaD@a^zy)N$26Vs&gun=tzzL+l3beor#J~*HzzyWU4)nke1i=s#!4V|E
z68u0%aD+C1wv33q0CbgQb3tZmhc5WH{j<Rv#K9cY!5!qm9`wN<1i~N`!XYHWA~eDy
zM8YIg!X;$FCUn9lgu*B+z%Bs37<?6dvqBj>1sdFeF7(1L1j8^CLodt-8Zg5%M8h;x
zLmJ44F?7Q>gu^i`!!@MCG;G5-#KSxU!#S+OKD<Lc1jIMw!#=FTKMce}Btr}!L_+^G
zL_~DN8pMDWSVT2EfsEjQM|8yflf+3x!%D<}O9aF&=z>9bzASu|`zSn9yu6H926S-6
zSA@k_j73-&yjZ~iS;WO$tVM>%h+OnVSlmU$_{CvFhhUVYRwPDTq{UCVjv2f*WK2eM
zSjK~E#?>1EXiUawRK==Ux^476XuHN}ghg$vk6skVSTsgqJV#(;#_C|jb$rETybf^0
z#%LtR>~O|#%*HmPk9@30U%W?eycv!Ii(Y6vSkZ^@6UhAV$8!wG?8t~XfJby-!*;X|
zbDYR@GzfZx$A^@Sh7?DStj1>~Mv<%zko-lHT*!!FJg<lbS%`+|;}d-l29W<+$qzxv
zVN}WLkUxn$$BHaP?1;#TtVn#c#(zvne#DNPOiF|65T=|(rDVvXY)Wdp$(zYMui&L*
zNt~<1NvhOIsnn026i1-U53>Bp(d$RBEJ?8(Nqwx!uOvxjbj$jHN>|)TuT+@R>k4de
znRV!f{VIoUNJS3m1>MjGaZo6E=mtvDOT@U#c&y8_97<v|%dxD?WW3C^oXfbJ%Fd)q
zr@RrU%*(g@$I^Vvc%i+n*ovAd2Y!H;e2|A>;}cT32YJYcRU-(9slC)pjL1aI>p)9i
z+)T{G0G}Mj;^a)Y3{9*2Oy(TN$>fln3{LByPU-Z`g&Dr5h=zRHO-TQm2G6>aTv#M=
z@Em@K2I9-k!XQoTG*0A{Mdf_Y<W$S2WXq@&P5T5*ymU|f0Lkh!P5#W!^@JJe1Hg-T
z2Qq6+SMke&=!f1UP{X*+0p*e5ghlz}5DSe(47JPq6j0~XPv!(rqkP5@HBA$Z&|(2U
zntO^-iG~7+2HM**M1hTCxQBOm2V>~Q6h)2y?9UF-P!7$|%)HS09L@Vg(T@bnBpu29
z1JNFFMknP_nBj-7YXzC4i07(~dl1jT00+gJ(!=maCKb-i6jC51Qi?QE9Pv>KJ<<~W
zQMq)}E{W174O4}=2b*)u{NM){^V2^C)Lt-#F1=GkiPAXz5VHR~Qx6%=MfK04B-7bA
z)H(f<8N{|jvD8AfnLgu@WeciL1yxX$1<JxwgZNX5=u;OfOigWwIxQ9X+rOav5=C88
zI$b>}-4j<Wl`1q;R^_3jGYBF}wiYEwh$yvVKvsX424p>k+_{IE%%6K8vR=@KbwJj%
z^VO%wR9AsjS-lfjtyM44RX*9)Y&F*#0ak-hIImb$f>5|#D2E*Lhg^6~cwHz70YEQ0
z*Nfm)ZsosF=~hGSf=k8JeKlCbShZ-Vhhqr3M<btm$UKOfhx9Czb;XW%WfoEjrFq>q
zf6&*1^}c2}0dLJ!kTqGmaim<xg+~guVIzzCSe9~2HNgLb7mK})clAq%u~y(9i$)@;
zk3HF-722Ww9a+eSM*@eXqqnmtx|}1nauA1}8&>Oh*D;e2p;IA(n1`~P9iS!JuLaw%
zWg1ek(WEU_VLOI-Dz_Ichqm20o26Qb>IG)$9;ebg{3!^p72Cb#+rE_+vb~3-ExJ_0
zyJ+Z#V_33sXbU5P+v>nrgE$L+m^c66Cjru1P34D!{0c&SOntyN&vlAYwGYn)Q^WJz
zc7>YLt%%btUBBHEz)f1Zvpa}UA-RLNX;4{V7zngePuY0aRsddzLAGA#g@FjGpz7M*
z<<Umag1!Qac@P58{gA-q5P9fWg=pLSU^;@Jgz^7Ui0+Mu+&l;_*j~aIsiaklq)l3_
z9X`(r+~o0xcSzb5!x3yyymHviT}mEssE2$|UzZUFY@oMD8@_ws2f-yX*9D(Y85MqT
zV1?)h05srj;|Gj0SF|7ut~iuE5GDPvUPGy>Bx_y&7~zBH2C69t>Ai@17+_`12hiOt
z&$VB?tC<-R2NkZ48BPf0C5&|_CWs|n1rc6|kzaq%+;>u7XX^)0r3g<I28GI23?{lp
z@C47wAP?gQeei^GXaqmFhhxBoT=0XZi3ac`2rw4o=E4R_XoNl*j3n}dMkt4O*dg*N
z2RN4F_%*6`@GM~v1lf^?TrdS$For-XjCubUOqY3wcy(9#b(ywhF+?th+<DFHt%w)$
z1G316EpFqjdj}zy<9z6c?(JY~IEF^R22YTMQKp0rE{E>zUbRRy4~ti05Ca_ThjobM
zg1`nvP=wg{sA(vz#cSaXCWv}?<a*!-7Cnd?wyXykyMf@3*KFia`lE7KhlAwd!SLY}
zCbJpdEFne+Bu?UTZaOJe5GXJPQ)m_Q$pmZ=f*^AqVYmW$@B}DO1i9dccZdep$RT{z
z=jnPV-69NAfCF)e2I;vgHR_;)PUw8t1F@)s9qNVUC@pZ%8zI;OF4)tH08B|%kQ>G(
ze-MW|*5C(WmXFTfX{af1=;(zoqiFviUwLqzTo{XP@GlB0kY1)BSx|yTID$qn5}q!!
zUdA1MKm$LB1~ectG*AKxTZfUNDd127;#C4^ohoCvf^9|!7B+}!kcS&92VnYO{3TRp
zmW^qEjpUJsk$SGV^UIOSVr-~~1m$Jx=;lJ3hk0laV?MOx=_qnG=fQS1boPX?$c3uP
z1mB70dk_NUksnXk1L4XYe(+~{nrweif_Y#AQdtLr9t>ePjy`T9QwT26HU;tI;DTTS
zLFfg&00$6iB0p&1ub2ki_~2#vDzz|cgTT>(xNQT0nBe~4i71EjnO8xe>Hd%f(F);$
zKo0VfW4LhM=;mc5kdSCF5`X{LgAF<1gJ6Tv5o6y1DViCr@`VVm25uasWU_Xdd4S)7
zKx@>XIdPcHMFu8p(1#+%yM68kS~F&@{))VIkX3t!d<bWL+T8%&FTp142R|`%ZiGD`
z-owPFUTbXU&7p+B9Ray)RZb-}f|zaq?ZM~<K{x_<(E_b@nG;WOg6Qso-~#{Yg(nsa
zBcW}=h%=`uhkgL-y*8qG__9LzZU4xhMOIdVC~k?E1`v|mo<eRjj%S0g?%5TL>h7a;
zfP&^Sg+OBJ*m5n_9vx2@FG}!)Xvl0ufGvqoZ-Ovp192h(|F->_@5G1=cbd&^(BKsV
zhy3P;asY?D7Eb}!${+v!=DRKkyXK$-hVVxJCUmytf#~t>g=is=F%73D4zKJF*K{_>
z1$oed690;&rJ7zi0^1^Wf@lO%(Tzq3BtXCM(W-5)m<CkqN^J0~1|c7DK$ap`R$Cu#
zCBNQ==m#Z$7(tK)c{m?%xPlJWg8m?%D#xrVCkX47FjzVUG0<WmC=g}exk3qVf&d3C
za4{_a2Q()LHLr*^Px6A;alD%$>LrLeM_7{nB^-sA9Y=C&7IF?kblM<rh;6hT`QRZD
z_(ga0gfA(_zJf9b5;n*Oakv5}F?V#%^bq%O)Vlb!n1^GC5?OF^!pH<I5CbmIlVWeK
zkuP~Y=?32Ei+ulJ11-3MMi7Ts_k&?~igjS=b;$SOE2ww7rW(p$o$m&oZ}%ma2vdgw
zHn`21(RlL0jXH*sE9eI+*X(K^uzrvWsW1k8SQS@K7(WOSJz)bS5UoZ~0wpk=X-M-m
zj|g_3hPY=@{B6*DVCimvBzixLJO8B}`7*FJ@@1J}x_6*%!ucNlVY!cuI2&@0y(W40
z4@Ot`$q%Ln-Zrq1hX&~d+cFFm!-kLt4ut5^1Lc!B{)&DuB4t;+J_QTXzlSgb-LD8-
zVn1Sp00$gq8ct=1j<S4jru^S`BQz8K%l?YtXAK^SGjM32rwAS6cYah^;ReF{CYFBE
zUz`MOAkP17h<9qB!w3HF|DETTGQtr5tLPGa&|HgX{_<yk^9TR;hyVDO|M{o?`nUi4
z$N&7-|NZCx{`Y@?@F#E}!GZ=4B21`oA;X3aA3}^MaU#Wv7B6DVsBt65jvhaP3@LIX
z$&w~dqD-lBCCipBU&4$jb0*E2HgDq0sdFdKo<4s94Jvdf(V|9=B2B7vDbuD-pF)i)
zbt=`WR<B~ss&y;Zu3o=_4J&pm*|KKOqD`xIE!(zk-@=V6cP`z!cJJcNt9LKozJC7#
z4lH;u;lhRwBTlS%G2_OLA485Tc{1h7mM>$@ta&r%&YnMm4lQ~#>C&c8qfV`QHS5-{
zU&H^7EqgZY+O}`w&aHbl@7}(D0}n2IIPv1fk0Vd6d^z*x&Ywe%E`2)n>ejDg&#rwt
z_wL@mgAXr$Jo)nG&!bPTem(p4?%%_YFMmG$`u6YR&#!+!|Nj2}0~nxy0}@!Efd?X(
zpn?lB*r0<CLKvZh6H-{Ag%@I&p@tiB*rA6Xf*7KRBa&F6i6^3%qKYfB*rJOs!Wg5B
zGtyY2jW^<$qmDcB*rSg>0vV)`LlRk}kw+q#q>@WA*`$+CLK&r$Q&L%_l~-b!rIuTA
z*`=3Xf*GcmW0F~>nP;MzrkZQA*`}Ls!WpNWbJAI-op<7yr=ENA*{7d>0vf2GgA)H*
zsG)}<ny8|SGTNx4k3t%$q?1xwsil`<nyIFna@wh<pMn~ysH2ivs;Q@<nyRX+vf8Sv
zufiIuth3TutF5=<nyaq6^4hDfzXBVqu)`8ttg*);o2;_SGTW@P&q5omw9`^st+m%;
zo2|Cna@(!9-+~*ixZ{#ruDR!;o36U+vfHk^@4_3eyz|mquf6x;o3Fn6^4qV!{{kGa
zzylLpu)zl-oUp<RGu*Jl4?`TW#1m6ovBei-oUz6mbKJ4VAA=mS$Rm?nvdJf-oU+O*
zv)r=FFT)(O%rnzmv&}c-oU_h5^W3w~KLZ`K&_felw9!W+owU+RGu^b)PeW=QwbWBn
zUA5I$W1Y3uTXWsD*I$Djw%B8nUAEb0qn)<eYqQ<9+i$}ix7>5nUANtL<DIwOd-L75
z-+u!hxZr~mUbx|hBc8b8i!<K1<Bvlgx#W{mUb*F$W1hL@n{(c|=bwWfy69sE1OOrV
z1PLMl{{Soi000051keJ9000082L}ub3l0wu5f2U$5Dyg-5*Zd19U2)S9vng+2PGmO
zDJ3H<DkwBBEIKtZKRPx-K09MSCX+-DOGQAKM-Z1v6-Y}_R82@PQjbtmSzA+0G+2?v
zS`lSjRy$pkv|kpjU>nC^8f;@+$YUNwWSU@PYprD@NM@YEW+KUEB6MkE%4sG|Yn{w(
zEO~Bc!fq^uZ!FDkFwJo@R&t@iax;E&Y*}`w&UQLoccqzkGIMx<!+AW=c|D+dH;8<6
zVtuR8eM4b>GsJ#G?S3=UfJan<HF|?Rkb`>DgG|AMOId|F?1epWhOL2ykJN`!ZiuyB
zi9vLUu*Qm1){0i{ibi6LMTCq?nvH{yj!@W+TV;<*X^~BQk+;T?UD%Ocjgy|)lVoj_
zQ=^rO%9Uj7l~-_<SJakfhL^XRmtWeKX}p+#h?!p7nQU~LTZNjz&6;a@oL`Hay78Q2
zd!A$3o@3pfbEcnbuAh{Cp=aKqcFv-9@}g^$qr8HoYu}`Nwx*l&rgE64!{DcYh^TX+
zsI=j!gS4xD(yN5?t9!hxppUJ4nyt;^u8N|s#g(yw)3J=?v5oYyg~YR`nY4z#w29@k
zlhw79thUMZwu_v%i{-bN>A04lxsT?$oXxwh;=7afyOX25ld-(gy}Xs!yqoL2o#?)y
zsK1!6zuNY|o4Uc!>cOR}!kpH_x7@>}>cp$}#G<jrqwC18waKW^$*aZ6)$Gc%-^;$?
z%d)!6t@X{Z?#{Ws&$7YMw#Cus%+cHL(Y@u;!Rpet#nigX)Z^0B+w9cD^who6*1+-B
z!^zja&)2~E*TKlxzw+3}?Aglt*~QG-!_?Zu+S<g~+u!os%+%fN+}+{&-OJM6%H7_}
z;@`~l-_h3L&-LNd<>J!X<MZp|)!O9L=jG=6<<{ut=Jw{>-sjou=-c+_-u&p><>~R_
z>fQD0;`!|4=I!C>?&S6F==tyH>hS0E@aO&T=k4<9`||Aa^zHNZ@%;Ak_WAYv`S$<+
z{{R302>$^62^>hUpuvL(6DnNDu%W|;5F<*QNU@^Dix@L%+{m$`$B!UGiX2I@q{)*g
zQ>t9avZc$HFk{M`NwcQSn>cgo+{v@2&!0ep3LQ$csL`WHlPX=xw5ijlP@_tnO0}xh
zt5~yY-O9DA*RNp1iXBU~tl6_@)2dy|wyoQ@aO29IOSi7wyLj{J-OIPH-@kwZ3m#0k
zu;Igq6DwZKxUu8MkRwZ;Ou4e<%a}83-pskP=g*)+iylq7wCU5RQ>$Lhy0z=quw%=f
zO}n=3+qiS<-p#wW@87_K3m;Crxbfr2lPh1&yt(t|(4$MAPQAMI>)5kv-_E_e_wV4t
zi~k=_zP$PK=+moT&%V9;_q)&CnoqyJ{rmLc>)+46q^Ax51}NZw1PYi$e+VY1AVpym
z=-`6@zO&$j6jnG86%b}PpoA87=%IcX0;oa{B$i0x6DIb+LJux%_~DB%rWc}y8gdxp
zjW~KY;|wRJ=wlC01leMQITmT;bvxpq<dQhd;G_#KsPLeTM^<U&ax*63WDql`uw@Wb
zP!R?WQ(kH2nZ?aWBZO3<>E@fbX|ZO8BD4wTop`!t4GvKDDMAM%Kp7yEBy=D`pMAE$
z&^O<dq>M5cS)<H8BF&>rqXwySiznxl^v<PuhAOH;J<M>6Kys=fkTov!AkjVmTK_ZB
zI{@}`(F`5%A`&Yd1YuAc0`?%QNS1U!MMCqmVace>qS?c#0;%JIjkn0~YOEvSlf;3y
z=DKUI1>FLm7Hvp5!$`#*i;$d=H0!RFc47o;2g4TRNgIDaDiA)f*rBYg$~3~uAb*^5
zN+a%A(nchd?$b!S4tw&AA#FhGk2@5@!b>Cd4utC|6rVB>zy4Zct3T%$5{4bK5Oi<8
zF1OK0vAz=Y2e|&+qJj(f;M0gF*8HKzGcm&~&^`)tEYLHJKzneb=?WB#%7b(o46aFt
z?2k2#D2tCk^E7e_D{bid?%DiBa*8?(Sz-t>56#=LKuHMbi9kIFsD(d<2>)nJ5QYZ$
zgg>-)(2qL+{t2MS?no)%vIXHPU>JDoO}OF!LSA=(cl)z>fHe=qYX>v@5zIi}5D4w(
z9o&u2kN~pcPa_>r?oZyZ_!Bkl0jhwH9-#a4U+;}}Bj6usC;uLqq(hDn;2pToh(mH0
z1Ph?S{71q*&-4()Isd7^H-L>8;t$|6bi+I0wIbd@8|TzbIj}ASQ)~y$drbN<yj#=#
z_u-peuigQRARzC0B*-41_7MyKd4d-$3f({&6d)FyE_KEVM%`TC4+JW3dpC0dFZ#v;
z0oo3Cx-*tPo*=?+6iONA09+foaSi~nEN{LtUI(<$h)yZ*hv|8Ofd7g>5VlQFK<8>m
z^#}qy>GjVa_+W({Bsad$0j^!{+ehIJ2Ozc;YjA)wpFdi(tUoMC8MvCBKmH`LC{7VT
z9RwZ2{L#cl^siV+v;)oxq6|Gqt^@DDV51t?fqm4me}Ef=KrltSFH|mfQS-;tHkUhg
z39kbs%o%|8p~H9q@sr`nTYyL)p;_Qc1$q#O5Cvqmg)DI(!0LbsW~qW>oPz~`+T8eT
zcfJmYY#y83Vix_ei4F`dZ)zmdvMAUASm3I2&%9+W;W#_kxhj^ltYzP7Mmq`4P7P+W
z27q9JK?&6mkl3W<F>sYX0q)HoWP+p$SDA!DRk8!^>gFN=<o^yGg7Tl`Q4<IK@y8Cx
zP7MN5fhP;{N`YL@RStv2J_gZ&1BtT(yBrAMatF*p3X_`u8Qjf+u#bx_%Nq1~2d?&3
zxPeu4Yj6xk)4mZ20Da@3{)p&4ctwJ*)y<oAo59yEdJ7DSY<O{mXd@(wp<|sx1U;BX
zu@1D4Kgp8{7j?%No9PcZO^=WgqMZo*VZ5;d^sM0d#*j!Lvg--Rk?LSx2au;k0FfY@
z*1!jVwne&rgzpbS!bjg!C6JB!qoZ1EA4rYq4`n1SK<y+bfVvbtzseG@0K&&93}pv7
zxu73<t!Pj|TPPAp&YR)_&|3F_!CnDKQK9AQ4Em8;7ysara=aLq<gQvcHLUV(4RS#k
z_JJ!ANN##%MXPeXbB;y~q8s}Z5MkdDi8i#%A^j*2(I5z*AT(+pA!1<%ZqYYI6_%@^
zO|0PxCy@WB%M&vYK^W@RIfCHI4u5iitiTH(@tz8^BA|l4xZ5jC1p}8N0G2oXaSB{^
zw^JCDlQF;M4+48vAeQ)(2(-W<3i4H+duxQ0Tp&c;s`jv}6oDF3XV&Gq_&Rz>f(vjE
z1T~!MbM^B_Bv`1VFysy+^Pm(#diIe`gh7qCve-eiI%EnL<Q*p?NRSP}WQE|vhtY+i
zlLs>8f>e2ATRw=L_VMM5z4*-9QA42!l!SLQBL4|m_(nI@JfI-VO(%|xo|JmZ6AYsH
z&sB=$fRcbbOK9N<TKK{(&Y=d(1;|xDu|yAc_Jlj%<Q>}rw5D^kN&!(p9bs^sfPw&v
zXNcOa3*EG;SFMyz1BeCh5M_Zx01F9^GS#fkwXT7p1s3?)*D@&FgY4jmY|awbyH2*U
zdm?NH*<snxj`mTSU7%-6``XxMHZQi#?QZkJh}jOexW`TIa+~|y=uWq~*Uj!`^+U)N
z*$2E066JQ=8=zrO@<pPgE{dqZybc{1M$vMPdTZp}7MXWW<<0PeAe<r$Z}`0@9+li$
z;&d8;MZYH^Z-R7y!g@W+DHQhvaAzb41OGJ$FX);Oas4=s0}3-ilPD3l3P|P@&$&^$
zQ8zoVTq3t<Lm0%Uae@Rx=*Zj09|%n;R`6oSo9IUyDt5HgS>qf%>%cd{5C(kk0v7rH
zgBrEck3)GvkJi=*ix8qhg}8hm=deUgU0?~58N^8xiTm8^Zg8FZohVDU$SG71iAW@|
z=mOE1AvVFmHYDK|Nl;W9NU$=>-9igu)L^fYzzV(2U=xI<U4uf+m8!bn7W?o-?jRWI
zAeikBcTJ@~p78|{B!Os8IFLJB(5|(+;|U^2us`%zJAc3)m5Jw4gI+$6m*(^fccrV7
z@WCbM9zT`)aDf)c<Vb@!AFxSK!T&i};er55$QpSQ*5B7}69Wq599-9eliv{rEnxia
zn`rFe`yGVosns7UAS>1&K5Z~K-EduhAVvc5ar@E%r;{{cU=1bIVp`ER073;?bv-Qb
z2P_~yjzuo5Ge*+0Gw^gSHH18C_Xi^233YQ0*E0jK@PWW`H#^e^Ey8>Y$Sp$TcpYFq
zGvESslRGllI`a|<fTJ%S$1T9p17T2hJs^6XLwHcaepDzE<FzWelLRm4W8aWT45fAc
zU`h_vZ}cKbJOfDVgAdA55DDmUAUAN9aAc8S4aY)(T5$|^&?4t@J?29@#{fL|vP0rD
zJy=(QC^J{L!$JMP3Tn_IkpH4WfOs=n;8@c`J2>bMF9j>U0xRbtIouM7I|M7o@*nz!
ziAq?8;_?KBFiW0i2zi4kRTzsZfjF?h3efU8SmpwqQYQy71E=r}B-lay)&rJs4pW!}
z?GgzGvW7OJfd0S&M3Z$GCWmymMqHr`H~=|$GY@>2LcuV4c3=mVa11@THAKTFWQB-p
zCnrMJ0grer;3$p_v@A7siJ9np#wA&}at!_ukCp%{l*22f=zPF350{h#;b;dnGy@5V
zWwQ8?CP5}zU@QCJdIX`10Elzpvsn%$OR~cXB0vI$z(LBO0(S)|%s3D?qXH+>2qeG)
zb`Wy9qXrLCjdpky{r|uMB=84%#6j2N0`NrwabyRZpaRRn0ze5R{Sbr=f`S|rCCX4Y
zr(;~Va6Lq6l>QJXmVhhv$SrxJG98dgPBIT7fCEEWl>gWPsv?lycZy#_E04zll=FkP
z5Ck}&a1fc7Apvhsa0~bVU7ZpJ!LSczi4Zskca-7@p@VD;#h6_Id6Ok8*Fz>QAUpdY
zVM#zKbxAt9atnWgA&P`@!c!=9vn&{LmzYT@u+Snw*p>p}4$w1P1Z9@A;|Z6!SMsKo
z{=k+6L68hMJAaZs6(%JtAUk?_oF&04U2-=<sSM<DT@v8}L68J2U}=2OaUCg91@Ukr
z!%zvKa0V$5-2ZtranpC(iI)@+W`~KK>=_cu0B{#^4zPF_*K>*Od7q83o}R&4=!u{H
z`JVt9paMFe1X`fXG9Vm;PywP0&88}>^C<#iKCpvPqZ2!r7$9S38`!xKj%lDC>JSK8
z4z^}c$e=gn06hSL3>De|c2EuzS`IZ8AdyfG1|k~yMiHLSBGyR}E?}R1aib@33?2HR
z$pIkcaHL3@q)NJ^OxmPQdZdxC4!ijo7I%LVF#|g~5kpEBReBPSN2J$bq)$4gWLl<2
z3OE^>89c|LKNk^L3U_u821G+Rji3c;AS;6qG*6%m)?f*@Kn3R04O53Hefp<jgb$Hm
zr*kS7YyawV5Z4G#5P|2Ab{yj{kt!=ORE%1+4~9Sms|R+sAa-Dy9A;XormCdGm!_Bz
zcoy-dIpqR>01F}@Z#X~&w}1n=GXo--HJ*tBtYAU&a0@elalQJh!O#!WISWCcHFLqL
z6k!NK@C>uiC^H~C?jQn!6|K{%Eyk4usiXzAI;^5sJK{5{#?c5ZS`NFguDfug)?f{%
zTB^vvuJC%K#AlqE;eM?;EaI{WIr??ws)YnKJ-2{T3gr(}V4OiftOuL0ydVO$q6N$<
z7y1f+^|xiWkah+!a)w|;@WnTZ!m;4?r8zZMEGTvnIDzJB97gI`LGZFiss&mQuSseN
zPXF2lFG~V8i==k2V3%=)0?`c<Nf64wb!BE>!*U8h=?N0^2eyN&1XVAPhbmgLu!+Yl
z61!uCHL-C4wAPS?FV{6bI}pKuA)Qm1EC5}SWVUnzE$V<jOuI32ScfZH94*@cO8Txe
zi=^~2rbV!`NxBY6psJHWi?(<Rz*BE7Fb|&4eZ4p=Pt_>rKtMuuGqU5VIfJ!TORSoE
z3p~>|T>BP=dy5!35Py>pb83VbhBK*KGe-tRW7J09P?L09x5II_NSX~Y%LzxC4PUSe
zRG<a^69&NB2E%)#reF!#unWz!3(rsvrl18y&<08Rw@VtMgmoDbc`^_?5WBZEH2-&Z
z`6xU)GXuwf4`jl1(}THF+f@oH0)x}OTEGg(YAl>r7u%at7D*7Nix7GEgFjYwKlZ;p
zDm8&(maJl1mO#7KXuHCJyGUvZk$0re5IxY^1|<rsu!;;MV6S0t3hCDab0`9azzQ>p
zq}IEn(6gm|VWkE!Z{7QvCG-uD<`7$^pAn%|_|OkIrWGz6Zv)Yne~B`yGPVOjCBph-
zR7Mai?7+BT!sXytN;-8EY*6L!2U<{~tWXXy#=#zZq<wp&E5f_g3%E(@h<s6RYD^GO
z=1lmi5Z&7k65;~;zzZ7N5;;l*E&!iJvBm@8#~oCy8=;&kz?>D91R|gZ{r^c2x4=S3
z=)~D^q*9!uR9p@fe56?H#Uh%;B5<T!2gc7!!FJ#!*?_`kTn?<T4(IU5cJU3FDFWXx
z2wzZDu{_JLYzVg84Y)inymSzZRy*Bb4TIweVW0-{=@R{rS4ZK>v@FZbY|9gq%exF9
zy}S|cDG~FKrI0Kg5R9aie92dw#T^U_B)|#TKrft7J4dPlTl@^l(5~4)0;XWfNy;nS
zq8D{c5v;Jk4$%m2+!y&g5&PUq9f8B!Tprzgq`;yA*&t3wY6w{jD5!L#LG=Y;aHM*0
zSHue?ED!``jHIK(%6EYerRWfg`Va<f7bHy)Cw<Upa<`A73}ni|rT?6yGOeW9aMR^r
z4K?k~$`AxQ8`6ED4jX40MD5aNWu(vGBu+BZ9lW<9%GC2*4%Z{nNPX4JkpvzcuR0CY
zAT4`;5kFM1p$^f+FCo@dVV-1-)xZHf0m2F;3OegBqAIF4>oB3~5TgJRr2^st>)_Tz
zq7r?#)<+T09RZ{h;dL94qh)BA1U*JRniGc25{MlV|5p&KA_9@c*1W+x0K%X(s-O{)
zX8@uq6S|uMB0GI8Ko)8cWFrzXNf7_W6f4~kT{;oi*b$g(5V_67LQ&f+aod)ias`o+
zoSh)&P^-aU)(jEb13}nEanu~qsBP*H^S}x-a1I6M4|)0rd;dzOcKWV<3aC<3fGmf(
zZWi9xo!tc|sBHj?ydbl>QmEuT6VkmB)IAY#Cw8YmIZDTL<t=0FMFsyT5XODn{h>!%
zU<b#X5MLK|YDCOFHsC&{S6kP0Qb%<;_1;|fHJs|HU*W70VF@^3dr1IYx@rhnLzuRT
ztHo+TRpklFfUmB~;<pM5ByQr}5Uj&05bvPb8TJk@{=;1%;t^574I*RT;CPUyD2m5;
z!ec7+ec%YbAL2Bm<4SsJ;HxXcH^W+$o(Fo!b9skKI-sXW;3}*{eiLZT5&B9Iy)6(k
zK(JpMu&|&r5|XfEM6z-|EU;kbja8T$g>jakE(DI}2><)fF45*IQL*voWR~y+PoU_t
z$3a@RrvbP%;?sZr@P9o(1!q??R9@xqVF@WmfA*&kjgYcyL@SMgt^n9ddi8+j)rL^y
zfV$HLu<{2d>l2f$5kN~;LrV~rP+z<)=uxYZPkZN@3q>|~mwhe}PAd>l8|Q_EaerW5
zZJ-D88@es=>nY*2U^@_oun+5W5YI3;;`0Q#B_Xt;SF#cePuT`ct2Lue>h7Thyu^iG
zcn}OM0=!VJ;kZWkCzEj~?PWfVZ(HmS<P*TH5u=N^hC>ixKn2wecO*cO$?i~<Yf#<(
z4xQ2uDquFQ>P+}xxhRwIId$y<p$t6pI?B-PGyn1MDKWbHQo7{M$4jH`EA$M=sAC60
zjK;`8T;~tTY~Y)X@9hx;T5t}?gOR+55dTgqE~uMS@B|Vfjk;qywr=p0;{vkl6ZgFl
z`MX92X9*X7Av&3>^@6^&b7b<%3f=G|_Z(m6;`Zt*5LB@Cg$2I?(I6t=NO5o9MV%7)
zTak|q3r}F4=?;J^Bq=7T0+0fdBw&M3gmNliJ8d8W;-~cb(Ko`0k-n1<|K5)sfCF!K
zSb(DfZD8<(wUVF(hpLjmERgh90mEmX_F$F}IE)XA47&wEWQLj2U%{7t37C?U1pUB|
z4?!h(N&KF_9`GiZgeeg+=ld4H+$+K8Apa4^9D??J!Tl{k$c7vxQ4;;l;+)nc7vRnj
zzZ?d^Jj_ngE_>1bFmcW3pZ^9y^CIETfdLTsZuuiv(BMIY2^B76h>zhzh!G`Dq*&47
zMT{9WZsgd}<42GoMUEs{(&R~$DOIjy$x$7Zl@43Zq*?G~O`JJ(?&R6i=TD$Pg$^ZJ
z)aX&9NtG^T+SKV&s8OX(rCL?!xg=J#Uc|c9>sPR0#f~Lg)-20?yv~kIyVmVnxN+sq
zrCax-K)Y1&=H=Vh?_a=yQFd_Q&rk=%9az0f+#ze5#_yChZsRXWV}GnVRJ~brv*yHx
z{JBV6_;BLIjUPvzjF@U?qMsX!CjX7tbmP>CS0|R7SnzM)!G#Yeh`5}c#*vUU4pL4_
zV`QKaYbh6`aXHt-HzJPI*iO0HgpVg*p1Aq*#L<0g&&b_7_|oGOD`)N;x^(vW_3!6D
z)p$7o0~ByT0t*x{yQ#YJtOElZbg)1Kqf#(71|PK0!3g`)a6=9|r0Ks4Lp*RZs@hsm
zL=*$e@F^21Ofkh3J(O`q8f&D;1s7fvF-E8Ma#6<+d1T7Rp+E%kK_P8alBhNYTJlMx
zj=V64tX_kus3e+`@<AM(cRZE<`^WFIoMRt*JI6j`@9i8TA{p6x_7Or>wlnN4Bb9_A
zWn^W?K^c+kkiC*5m2CO?{r<WCxbJ`N`*Gjz$Njjj_w{-{#j54Sh9p|67!76Pe?Nza
z-4G4>_>}Wla+qRvA3g$~eLjIx`7=NGq-THsPcPL^W>ac~SC0ZP7YY?j!C38=sumTx
zY@UsyT30M7^Q951Weg(c-^#Ot#97`52(TFkzGO|Mu`u5;$Q83JF;tkEGV_6bqc=UQ
z^JpaACyOBLN!13^Y9^K`12)!qlQz$@Xj5j~ZnK2WrK+3prNx|?mCMFXj`g6pD_HLF
zd98S`iq2SgTI$_?YN#|D0#d){5JA5!oEDAPhL>OYUj2aOhK;M<`0r_XIu0vp;Xli9
zU;j2Qa#R$!KD~aC^e!h6C2UL`w=&riADwH~H!73pruQ(~VY%Rjhvp?`1!}~)y`F2G
z(BPS+Hxl+=(g8#If3Zuq-!&;^?$FiUYb1tLOk2<~sXVW?v#Yo$XUSvSrn^rO;ZyU+
zygYk|lPS`-en|1ux3RyxW{oZL#{Yw6BK_LFH>uT?h6JDbb)Fua`jeOBR0Db@LUFVT
zF1sg{(Z8n*zQ6D0Yzz1>)-<w-e6uXL^Fi(K>`yDnOE8I`=b@K+H2{bXnYP!z9z1TQ
zt`YM2%Ds~8f#%<F@;>r`pnT$<St?pB;L}@C&z`1d`(bMubMYNq>UKk$mCgT7z)yot
zwD&9e|3&TzO)YN2+vzWEc<>YEU;~*?y%QGYyqzBgBr7dOmr16cN8z&TZpcW!&A4;c
zP;`N45%Q?=$0Hw&fL{NHg@Z*2O}1zPqfRG+cQ7`t+xg;V+|^65sZ>}tdQ$EZb1dQI
z8b+$^LlqUL`8Af%E};k1ZDdG6h0jo-(s4o+fV!H?Hirem5*{tv$nBYRWBW=XuQXe+
zfpR}=_~vR`y=#it_CV}pGL!}MF6F1!WjJq`|4EHaAM>3$Zbv~R`xCjV^4_DWhjRQk
zrWvxMm+@51WYFFjpLXm%$*=*@Bf7{3HnP!%UV99pq{)uEIlRUyhoHcT6CezNe3T2d
zBt&CCd35kHrLrNoZ@Y!550K6<7o*=VHemP2x|`=(Pa$$Ex%Br;m1k|oMydDg5OSm5
zy*-#9PB=z?Y{A}r;d@P`0Lfrefk$846F`Sw@DY7)uP|#0B3MEdAoC0SF}Mmr+?F*`
z&Egt#cZ;l2RGWNtH2a}EhuwY#$M8kA<kP;6|2T6-P2gpjUVaTCSm(I3Sk6W)SSXDL
z@ye7zL%-;c?x1P`HZBmmPX7>Wt+2+HEP{NV6}xQ3wZGSY#1dBsQ+aWY&<2Mjkx>@4
zR|SO)$MPylAZBr1NtY<1-RpHPbcAMtY{qzgGFZN>k{2_7a8kT$O7#LWt1tY49OsCI
zvdWSBQOr6>>|zh>NO@Q^SH>y|!&C;h6~&F<h`v9bg-NA<yY3S)@v<~d{w&J7KkQ^u
zUO41s+1eEsN+_<Eak`e)?#9#KDfchLas?{syA!uBTUcu!u~0e0^N@-xsMV1G4G*%L
zjr_<wI|coG!2?9;QUYJgCiBRa-4^8kHItv~Q`a6n#u0w{1$oTc((B3QXHuUbW~wVp
zc{fpOZ;YNTmkBkLHxQhD%Cx{}-3~d~2z^Ukyc_eNnXcVW&mx;Lb0>pJa@i{U{F(SK
z%_$Z|a(q0J3N5~V$OP)qi>U)>amK4~Rdd~#U&YT%xY=7$Orf&g(#c1=`5n7?1Kg#*
zvSVyWZOjRVp#t+Ju2=w|sd$~l4-kMEG&Tp1hXBh|=yY5+*bWC&{o?1s0wCJaG3qdJ
zQ7-a~wyYByOwlxh?Q%05WOKB4Q)JjRVQ1~3=|O7Z<M|<fbr%q_6X`Zo2e43YF-cL}
z&!&dDppRSnwOB2b0BLvl!-tkv50+%C06@>-VTDO~pmr!jlIG$24-rlq2x#pR$QVo=
zhPkUkl?E55Knz1T8?qq5G#pC>UGD6?BAp<#3dDe&W;0MFz-&7(jT5_ssV&PM-ZYD~
zn+%uCdgLfWVf+BX8Ab+|g4U_T({Suyux@Sik6X%0n91^kzarbGl<ZgBXuKrhm37P8
zfr2w2u006~s!=a(NbV<sq5;3K(QX@!>b!06A3V&1mI@$)C;+TdC&N!D6btUp3NC<H
z+y<rN1}_Az$}s|2z~$9GE@c3$SW95bg;2wh02mBK0J)qHq_hGU8h{5zPo_YDFra{@
zm{y&P)ocP?raJ-lSTG3U48qg+0U#uPnmy|fyzNNGwRZ-hHwne>kpmKSxVLB!qmZkn
z8St=W5P-x&{L-j1Nrlrn<nYV<B4Jls2iSGGr`4bC7c1@B>y?<=HdKVu1IV8NI|9%`
z<4%H<az7{_Pk`ia%j6t?1}an}0qNyy0D8Cw*(c~*i>H_&Q;0~x8O3?g6fOWZL2D1f
z4y5}xDr3FrkQ9u2-`p`#8}NGvGbNV;j%UCpp+mevM#-8V`{IIE--Y&&5<1+1df->q
z1NEFc<X}LBXB#NSuF3t27)^CzhZmF6zZH%K>f*uvN|Eg|yxD=dE2qJC)eh+~k+yII
zh?m_I%8Eo&2^KHqvUa?qf9jn0z#R(3jMm?Y34aX1pV)zpjWlQmq>8vS6o(XZQZ*n3
zU7%~Sx@vWk)N)>Eb@42<vvD#Mjb{l^@L+04j8u-bZ(8$dd-11(s~wA##zLXM>6+|C
zBnTwk<*uq0NF8s=-qniH;!;PEh7<s^4$z=FfJ<OP;E$=*joRgC!nA4FrD?*nz`wda
zK*)i$6!eqYf|$g2Bmgsy_XCjQq%PP|0(4IaEZTc9e5F;!v}*|h*cx>}dSN;cJnd*B
zQcz{^isq48J)nXEE)!DwY96OO(mNFN09N%`5d*mgl_tPF%yh5fX%U8$w%XmY*KKfC
zB*WB-3&w*=00@xfn+2?&$|`tZjhI?onUJ%+O@U<m4=&^oR~8Efk3s@K0|l_vqu_v*
zdZz>OMUG!-MeXTz$*FT8mF?t|jT$IO&(x<Hkao;St`_yQE4lzq(HYtYa1hM7ull9R
zS4?!=a45Ux!E_G+W+Sr|krPEH-Zhb42Uqcf_S%6#?8)})Kr#df136&9FrXiHM7H+8
z>IKAesZl_S0f#Lq;h=ah9)Dqiq`+e3x$r8kVLFdVtyksLfzf_iY5cWX3iZ)`HXFbi
zXhs~V!fmfP9L2#6fS4<TGM7}FAefglkP3~1nX2d=5&l!_0B+;APoZypveJX&Ga9?V
zy()g<iAeFmoa@*0)jDJ@mlmLAFMBy|tbc7^Gr|m_@GaTV02(o`8_7I`kZtie1x4Jf
zH_6ce(0C>Tt*7ptu|cigXK`<R@i~v<C<0VKrqZqfbtGye$$ogevdeE-1yBaCy0Tr|
zIsnMP)IsL~H9&=JbWc(OFaYdv+{2valSk0^P&|A<0gD74RJKxFyZ#_Y%PT+z%nsSO
zw2?>2y~@3Q@u5nwhzSsH(R>w*{}ePNYp1W+%}1<F@WUkCON#R}OvWlVzj2_xVKK7#
z3twk6;Jnrhe4|KEXLLZCfEXwOzNp*MFnD>HfUmVut5EPkv)r@ZCvj)_1vG*0exUA#
zS@*&a!C8mgNDvQFF9`tSO?KB&o8md9zjN)6N{Gco=eyi_E?}CEBMmbn6rOp0%9^xM
zNGTG=+B8m$x>Hyu0SVv{repL%#c&BGwk^<`J*d|2MBY8PLeh=Aqy&}a(dNBTcF#N$
z>?aC_nxc9Fcn1Hmqu$qs^jCZw^2ki3d(4TUnpPwEx+#n=gqpu>{12s+jD&!!#7zz%
zql?&Y2_mD!pd-k=J*W;lG{1tVb}~+P$4Fl9+3DPb`1Vb$5L1PPhg!vy>peGrOip0a
z+0+g2FazKKf~2>>>r1Hqy9*dP;zem0DudC7kWT;yMBf;Qo@7uD0Ki*4epn)cUDfWA
z!-dDQkYVar;#Dq)V8th#E<ocls`mzYMWMzf3#$8Z!Ws5d27`xWDIKZd!CqtmX7L>y
zkV(31qvG!}XHlSUzzqS&jD?^y-ZLF9&<%hpS|CAng=<FEHq+1wypmCiryu~Du}Fwi
z$yB#urkp<WD$Lrm&Z(_+Q%IGb`pj$w1tIl7D=Hsuj{o^(<qXS$3`}1DW^eq?rzt=N
zfm7KG1=sCvLOnIi^^|LA1I!$};%*qV47JOpNo4ugg1{JnUBL#jV*R6*f(<K}WlB2W
zOpYn&C-9^aC2o32Yd~%A47CX*6S8{PkrPG=dKWw_0B@jY6CZv3gW81nJ|2q2LzQL4
z1Mo6405ky5?S)YlTh;f%Xo{`scp!DKEQSDpk7NTH8-%$4@FURQ!kHvyQ?3A@TTh-o
z0B?Q@f-6f4+5pfbys-qlMF>m7PWn5cP`@!1rwhK$0;Gk&c<k{}Q#LX|fcG81=v)C(
zJ3Smc41^D|Y}Ldyv<DWn`u}zC_5?ma+JIv1N3iJ&oMVpSOkO5nb015giI}Trx07M1
zOJMq3v~L6;@Y(O$9z0VLYn%hQ&H$jvetE#R8b_bB_~7w%A7sMA(?!YWPTnj4!b@e=
z0{}0}w!@G$m5Z-~@IkcrvyjWjvj*81&fc`~DX?*6Cjfg+!14k@{(6J}-ru-oQbQR?
zRRR~c%)M8E7Jn{db_Bi+ru=C!kjUDr9=7OhrPxytN8*L27>~}|Oz<E5_3%Kk6}Uq0
zZ_e!E-vu+uMdBU@l@P+DMSR&6<^;Sno=N0rtNMDMPXxE>Z|X)=jvrDrN|kQT@nU=#
zCUI!)B=&w<X(!=Ym=hP?_%d?#AP%_jI)Xx47UMoTdELo^BJq-E6bNeP_aur;HC46{
zd2p5%gO0v68FC0iQjk{y3zl@~@C;iCG-*BmBmk;nfQG&4vKA_9OqhJHw%Hqh{hur-
z%zTI$DEe~^WKa*QO)#W0P+y)u|83<^(Dq^on|Io;QNA=8ZAbBg{P7(mLJpuOU#Ab7
zhJ@)*7&v}-u9~y6F3+2FKkp;AAM$Z}>h(qhuP{PlM!;~@jN2t%x)u`a1!3IUlqM(A
z6%dRKz^ZRy5=R_?ivI;4z%>d$CSH(?`Xn*(jcnx{c|uA96;b=Gq@<)d&8Rc97UZ=x
z=+A<OhPhIqmwoNsf$qhN_~<ppsjeVBJj-(Po}NB~4)`^bb>Wrw$suoWl8M^+&Qq3a
zkQr=np$#}3e?gm-UbFx{ilaGGPLVSlIU{69+yE7{Ni(%jAZ6|ac~Te6q}VT{f7G5c
zc7S(Ji|W}&thFSC;wjO9IA#;3Z2j}x>Zu$sFNB<JSo!Z3ntnEZy)DU`u1sq$PVflQ
zSInn$yqUF~V2l20SP%6(hJ^0oJN!tdoE%0KUsEuNVlC45mvdeQfI?>6^d!Dt5yX?$
zJQ&@V*fM~h>04lzwMrQBhk{-ZGg90Jh|mEX5YG49@c<c;N$Q~R0?hX9eFfElYk*FX
zGyY6w*5~#`ig9PbV#lPhtC@VutH>V|1D|JkNg0+<DubEYvwpw@uU!5nyHABede?5<
z#mrs#T(2M8J>4qMH2GJ-Cy9`9<yO1=TmSe3hGOM|_j&-rb$~a^D>T&<4K6NA^0rE(
ztA(2EL7kRiw|~Rc_BOpkB^fz<iOW7j^nXTF5T7j3Ui40nrtf_+v+)Wusd%+C49*%h
za#dQ$1e6y}wMDOyP-YSLuoqn02ODC=Bb4zFJVoO5<s`qg<dM18G+F+824r>h$%7uS
zG~iXBT0hhf7qsb~rE!q+_KVemWs|Zs-Z=Q3l`)e^fs-K+e(lvn`!zHGC0_?5vhr{G
zU8wu)-d~uxzW_XSuiyK--Rq!WH?e!ILdwVGE@ada;PVD`!-fkNOju=ouyK<Tw{A44
z`NN>>-+$RpPXpN9W62uYZ1J-ZR&UnDF;k|fBZ@v{xXl(`TO|N~2!|cQDfIW?B47QM
z<LQd`sPuQT$az7dEKYm~o#m=$E%Aag@DSzrXageuZx$C<VJ3f52Lv8U#@`nNoN9bi
znemO5^-lR(`fAqCqlS67q<25|a45>AaFO;T><cSfrCzTzO5kG!0k8|elZv;b@OjXF
z2h`%HhomU92L>sCSD|&oazJKb8&ul<B-+Yb3eIMarzJZZz_VnXcQ+}Z7ln~{#Il3+
zmJMXD?Llw6%(8==CLjhKcs0@CIIjqEybVeI?ZD+u6-G!F`K=$XOdT-hrn%+%$4aoG
zjkXxi_d>B|=#N2j@sd!6<1)$1>uItVgu#?x+HK3`LU81e;07N1_wAcCLk)k4v1}#2
zl44#j0I6k(rAhnRTp)b9S?_$CbyZ67Gp#nQBTfBg4G{g+KeFOppj2}J)CB>(r^5gl
zf33g<(sB#{(s9NMz6$`H6<}n|67N;XkV;f~?GpRtLpvP#f%f)6?+$pzK~msOVWf__
zKK^l+x^<HK$cF52pGvk5-r{W|9D^@ZbCtDj+2GwWG5wXQDShEnpae1a5)ncU(!fhc
z9u8ALztH`g;L(l#EYF(wF=a?@IDawD__`BKmU16teAD|w5R5~({po{!+J~fDK=OfY
zds=~HqRoF9$kY2R4`_`e%Z~mo&OUf}|MaH_(kCF^Wc1IyFR>EfB=iOaqxk2KQzBjv
z4WRaJ)iT+?CIBb?^+TQlu?1sQh4^TxpNiJG&y5jx9lX!R*T!fyHYbuHlo`!w%g6=>
z5bF3wMat0^{+uk;-P!frjgPd4R!Up|ApV*83-fC4zhYLEJgP_ExBp(5sdekWFX3|_
zKG*1dUR_y#AmPw3?I8GV4B|XryYWhQC^D2HkK?rG$i3{M=l;^Wm|ooo;?K->t!#DC
z8sB5t&Eb^hTR(P=<+eskt8d8(<*j6ny|QkgkQf%lPYM}1d!ots^y#*He>B@H<@T1l
z<>DD7J07<WN1k#n{WqYzUvu8}FWK*0HFT>mGU(^-+cyd~%<GiNf6moUsz#Y-X*mA9
zD!pbjG4cB6W1oW^xxHJje@klNZ%eSD2{6tuG%@DRe<%`dMB;TuIz#1^|B&Wkd<lH#
z`Ng+flaL7tGkm@9L`umAA7h1H9a*MaX**iAr@o~ukghNnCXk`x)^gc!tkbp$4MI=2
z<0F4D7zHfF&8!Jyi#EXGx`rxc*4Ki`DH*m-NoiQSh>LLE2hJ&joL6`RaY7DvOgBxG
z(hDIAYJMf*j`9Sg+0}rAt-A}Vr)1CMoLg^{MM{KTjo}2{#Ugm`q^iEMdzNWvm&d~+
zZ|-HMfnjoEJc5E8F%Mm+7Bt)UaB&*{!6y2cru2G@te4ckCbQbru4bx+#@!ux{EwR{
zfp>5gWW@f-bga_$bYG6g<}|m2s^PyUj92O7RP^<7{}ukxXS}mKVa#<WYK=uR+pDBc
zZrUc0n&ngaiDZDMw~Xl9S8uJQIxQC-OLf6ucZE7U<7IRNw!K#9=|(N<Zje9z(x2Ak
z4=Ww6t{NV-<RWoj>N2{?oC(yyPj06ps@Q+uhMUA)6ux`p`LYK(tUI9oXZYWfvVNMP
zMqB}_#k{PJ^gs2n1cj<)xlf;PrxPZ~Yr~B1M4OZFkSpSt1?lPVw+)u1=Mfrt@y@A^
zrZeuJ?Qg+Jw`i@jERNQi0tSZbLJ7eOt1P(;?SG8n-s0afi=5808-#dvCc0Hje8&gM
zVpeYI3DfJ$6J-AZ5l5&ZK{K9#qN7<$q~Ra_o?tuO>Ymt3DZSG7+j-x>vbTmb)qcGB
z{2ffLP86~oBLAvO-928JNTOCg`Zh?D&s}wg3l-{_#N!m-T`y9!EYS01T6a9mX~V#Y
zb?{SS$qjhE1%0K~i~ZuB`z80L*tg7{e#`vU{pCVyx<oSg&go~@-%np(#)^a*KT7$G
z{Z5&SbEg-c|Ec;j?536lP#IHO48fgJI90hS$A+y^{@a@ng|5;2>_Z|gMtKiQNttxP
zBsLy&8ug78`lz(ZK<&y5t@*E+_ALM^VGDoOX5K}?IEMPEYyod{fm@-UCEtkRXMTox
zFKS+wV%5RV+EDRcBCsyCJxQ0X7t<$mzb@^T_!`@%iav$<x^z$Z&sJ1PZ|n!^u9#l-
z*mNy**Mi+C<cd?RIq%l(w=QQYNA;twWfdw`;9<BHrvrY5<Q)rdiU{<ug991-ZofE7
zncbRBZy8q}f~UIX0^^BqY12?d-mwoC62EX49kLy-&u{7wk_>t|<oLV(LFbu}G)Z*W
zm9e3qPhD6x=jE{HW?-JJk&q1|dtrPXqw3KS_g3LU@;zN2)QtS-VcJn%OkBg2!ESvm
zhk!TU^}l(lymT40g+GOlHxwOoh-m(KXu{$f4?UUxYGtwaiNM%cO!58&g6`F5{NkTH
zuxEw(@hl-uyRnq@qlli=E3;_T{Zht{TUT`=Ocb6YuYMmVDl`T(-;-Z;;G2UtCtcMK
z)qp#!Zl|<)&E*AcZF3|iQxwhIenNny<P`;gSR6(vN@V{!dNn|-{^_-rw{0cyj6VGj
zVKBvL%ToDdY}+cG$>d5rj{1~L_!NM=C=)cral8min5^gnJE3X49Fu*fh;{UAXCPMo
zqfL7-sG}DAm1BI~U8~CMMvrWh?uQw}2NnF5TogaKLvqcnOHx>Bn?~y6KKNQGf0-Gs
z9d`H>1{Sv%%@ZUO{bxF0+lx)AJUxmb6+2|%jFirnJ=eNt=Mn*=)R+CC=z9H!zL3MZ
zFDeRdR~}WTSQr^9ZMeN^<q50tXy$iZIT50qYlu^@g9*Oz-n-N{@!$CrnR2tGIHCyf
zboh`(yF1?8c@RCO7QhxaQwD9Neb>K`KyAC_7hm57*{ewMnO|c)>P-3NCrD16J3j-t
z2p*B10##0<qO_07)e;eXAsM|Fr9w;wfzl~AtK5`V=t6~#tr=;2wL-{uS|m38W4WTV
zIJ=BEl=4$zt<UmBDvWxL$lcVv0ivi>JhVdnr>|bC4kpO7SWY>?Ig|mx7t}iB<TRvK
zwZ58?bTBkF_|vjZml6D7W|)j?pq}JrRBWHU>&kc6F6wc<@>J`m7^l0|he}zpN}~;X
zRQrW%E&4iL)MGq+`%fW#P!0XI@%&q_o(+M%oti1R6vq#ghkX8~^Oe4xWVK&b*Oz$f
zdD~PCt5~Vd9WAK)$F`X%Vrb>H?+LSQ=$59*N=SLiDzts3Z~93{S;Q>=Z)G2^@8(&D
zGrm<Ck(ZPI2Zg0Le&3+>i!aaWcP-wgbHLUl=U1(0T0^3CMOR3K?=eapDi*^3)#r@a
z>NGr@bI^@+r(KfCILxh}+#@iZO+9n^!r+LVA}!g|Qb~nnGRoK_-RxMswWzSLcU?D4
zV1899C0<Zn@^|*7eo#;;b<l+OTOibOLo!xn*j+M6yESrCu`7J~=uXg+HHQIDjQ%H*
zWU#!<{H7jCHAU#|D)2+UV%LCu{8`O+;IMGbyz8eVBMwbZsCcxCAX4`LGnF|{{6w3N
zXNN`>nvh%i*DXmjQ<8_R6B^q&bXkwuN;5+2o^c&K?tVP!nrsj?!kND1xWM$2zi6oN
zSBi)@svrktY}?D}eL-HKt7GZttrKOhw_6ZBz`>3*JNFT)ZNp~%5w8-oSwNgKWmSZ5
zx?4u~B)7VuPe=Lhg$4ZWl**d=kN0dz?hVHm$*i5O)#SM)DVil0R?WuZyQ?>~<ZeGW
z{+k?(#aS+i|4<xNo4cGvA+NG7gb`V@Sk#SxKE@4t9c16q`SHY4zooDvTXCz4x)~Z=
zc5(3D+0s9b(HYCWeU2ohw|Zd4q&3@wdQ2ZE!wS+laQ;#c%J|fUwwOXQnQF4Ya|?A#
z`l;J+JOX{m6e;EuXCYKLdB%aLT{1Ii%&oa~QkU_aI5_PAg1Tnl)w`S4VPF;;;?o@+
z0d?GG4sEXM7x%5J4B0Ib`386m&llD3g}g8WEoK*6ar6t<6^b^5cv!Kg1KKVa0BZEO
z3YKlMR;<1F@H9)F9gs^JX|W(^Y8H(jb<J#9Ng?O+`4W5hGH*N?mK)ZleUfIqSAyan
zj-Ty*akMCD0b+=Auv=gDY{A0wVN|cs)AHABve2BNu9;CKzhNt1=X*xf6BT@W#J#%B
zHC9l%e2ijz%h;9s*NxcUIkNsvS15!y)q<tu`-IP2*yBLrJERsG0ViLh=DmInu_bBN
zXOh3&wBo3zp6IZvgWTBHl+f-r>N>f)J!)akwD8Xqbd!ZTbX4r<R3AN)#jha#b+a`R
zo{}$CtfP9bM5J!8uRLBR@dWFzn-b`SN~{ZYkTyLkf^fR|o-4bhLT5OE>(qA05{6y3
z{a`%-8<K7)5029#FaRl9q@$zhVOA2aOmx3ibEzd>Q+ef~R(cKTU<f+^Si-;p<(UX}
zqG}jSO5TmG`+3g_Ahx=+eGSZTecpE2716e4T~T6PTcUu27pLjT5&5%|R_RCZH=Yow
z494FdS>pb!^T(vfvb$L?V{J|#BU{4;33}2t*Cyr-xw5eATPa!<psC>vs*hx0!EQ8y
zc8s02ueikVUlLEF=iMjcbhioZN4+#O)Vb>$P6t9ZEiB6w5YN?hPrGs&*Uej-7lOB<
zNK`Z35*2(JySY@2gvmmPI5wHbVR(8yjjFKMMv-4rkboG*GVUbX{sReU_EJAgrp{Wl
zLGbg*ZdSLD5J#p+8h(mdVZU8UbW^H-0w{p$tF4D{Xy~m_tIfh-Y!Z~zBWn5goujlV
z4qi2QBO?CZ2_%gF`bIFxv}Tbzx1@=A9hZ?MR=?`_WK~>p9nRwV`Iux$B_Ok_BVWp-
zK)0@NYfUBr6dm#YK;k1e`-bfvxDK;kW+R{&@xIYw2+l#=gb7<(d8Q8v8potKoseXM
zJ?U2<ZomdY!yzKy)0FqdhVBNtCQW7Spt$eH7I`91mFcKWk9i24qVYvp<_RP#6n4`*
zvE2qj85}PJJcrq42p=Tzh|}Nh<7*CvQC@xv5ib>dKc-*mb84)3C^qCU4)Ca6rlVZj
z!XD#@OHb*D`Jm_xE6S;dUjFqjANPpf`-{gVq-oKtjmIGhuWAbvy(}(*l+5u(nWNZ<
zdUqCY`B7CMqC8K0Jp~<x{iX%)636j$n+}|t_QIQPiksd&V2|G$cJIJU12n@HIF?*o
z)jtP2dA5)Qg7?d9p0bUR(acXXd0N*uk~#<QDKA9goF1R_iU*g$wO^(Ee%_cszg$&j
zBmc7QH_`i;!~+$LS*|##%}hFhG>5)#mVLQ?Mrc2~ZcPT$Rb6D|x>cq?L7r7er`+<<
z>*ntYb?7~)t+suv3twuX%OdNOsSES9DyAQo>V+4*;IT|!s(TS$liV%#-98-I3w{+)
zr=7#_iH7im3YoyeJkImb2VMc>hl^9P_n27Sfbm{=6!G4Bm6R%bOS%Tr11&S&{MO!M
zd|&dVmi$Yt+ABBoUT&Cv%W`@NUhP$@(&5PM&RQ2ss>N$10l9{vEHf1wNse%jk<Hx7
z;hF(Fr?;ETrYOF=hjy#`>Z?}s?~w;c>Q-bHrdK2ZMt#KW#QuG{;?~lD&*xWO){Ta(
z2NL4@#@6dUXjEPXyWG+8!U+J98I0GsDsXo~v4LCPudH5>!i#i_gjl~JcD}^K-<POq
z6x-=LA*r$VxCwa+u-*`8^Rv#CbSkJ;D6Sa|s0v75ILw++;ifmq_+ibygXbM-QTO?x
zIp158Y*|#<Y$Z6x`Gby@vBOaE?JGT%;m>yR+JZKuFG=`zDh!=XC10A!abe~Rl~f{k
z4b^<g3mbmdFzpXTVC&jyp1vyTmpk27E<&>ePM7Nq8F~U)0JUyr9jiBd8Bo8rdl5QL
z6UEq<g!SdG1%LVkut|qJ-w9?One2c-Oa|pFvV>Z&8@?ZJUnWY}iHMe7wPidaH<RK0
z3b|Z7zwU*W(D1o%RUegc61U`PxZdDDv!-0rCg{blL5g15MDep#$?P|esO4#?&(cpu
zcFUGwUq-NVR2IKaNIO)RQT~yYf3LMLlCcK<l-bC2J1IiI>qDm>99n+sBR{B*b!a{!
zF+6+B?MdtETedUePMGrGETHHIB-xBpB~MS8LDqJk#9lMNa{v8fb}zUz_2rLEzZ~YB
z_r5qz3LO7lNXoDI2`S`;3?o}6+m)rWKs~z1%E4RIr;Ah}R<(MJ0eV&iRK9z<D|mQf
zB|8Mc75jQ){dcUzxX}9w;fF4Nt_Sd1PdH4zcO2ez>-<7CB~YE!1_Ybh%@aS&FU#i4
zi`?9{UAE=VVHYsDrjj%CBt*`guV0ygThrj8?ymF@NaMH7FhsplPV;MnW{~|bF<wY)
zLlfSJr4O$BD`!(HffH%emXZ%3JlD|{ynbio>;7^ts08^>T<5>WtN!w8#{Y#hfp|iP
z=w4z`|M;w$sIOiogDwT6O2d!nsvnC%TJ1>QZ=Y+uTfaWNF4`<_a@c6ng<xtQjrILV
z75!h>tHJv6eG@5#n@WE}q<_f?b_?qDJd_tJnX55Zdt>FVVEq-wWKX)DgQv2f8zSzU
zX6&?=i@yy~uy1~2pYy(WZ`b~lg5&2mj!OzoU*9<WRB%3g<9wmu0&jAmS9E1-az!b+
zi8Q%MDY`2)xoatU=r?(oD0*5qc{(fJ`tPFYmcQbE_nQ8TRrE@1^2$`a{h;agQ$_C=
zP2R5+eVUtmx)go;n|wbh-uc{gXGziTYm?tkMgPMl{|m(ccyj=~(p|RZyC|hVk>)@t
zr68r|AT6a}{pMg3r4Z}p5ND;(|C&SnmG0eZz89+$me?GYsTBU8IsB<o#Ea&L*GiGi
z&5>P7QT@$PpOm6MH%Bii#e8j!`Kc6p*c^MIgon4_>6Hm=Ed-P@QKW?^rA$(4A!#Yc
z>9@q0D92m3#5*e|{1^8AHc42WC~iPXNW9!g&`}S2FJMDpcpjG0PQZl0l2et_z7$FY
z5Eyg`7y}YJdpBcCH-AzOe*rG#l%OSkq0P)r;A+%P6KVbM29m->U^jrIPk<zjAnN!Q
zt$po`({5S$Ru-Gq`?2Bg8Hg#VL@ss^PcV!}oWNiM;xi4;xYv@R1upoc@-DfRApj&Z
z->P_|^RTjo!HcM6pu_A-P?QgUJfTwBZ-3?akwB74@z>U;OX1c@DiZ6s6i9?^80nIT
zXYHl>;welujHDS1Q{M;6%#+HmB)qtHQvOV@B2zW*vFfWx9k=2LH9^&y7cg}o{7O<c
z<9<(;eniU8Rw?$&+vs`nAk4N{x%?EON~2~sN?-uml`2{pMzvG)x9p_bt<~EZc8+Zg
z)ZW;uHE|J|{%hmPZ4qZDWPQD8YkvS!KO)H6fY^fLB@vO#xh;wX;a3{lZM}#Lz69$e
zZSsqF;ZabMR2%ydSYs5&i=iM>M_D5~-aUQaEz*%A*U{Unm(okpLSFJ6j@mP$Y#K=z
z<~H`+Fm?IXl&7s)7LmLLz3ETiD?eARKGn%c?T}O_V&=~@E|=7PkAQ)WRHL?<0jcpZ
z?#iCd6?E&{KOLVSZ%2)Kl^ek_c)gEY-5<Z6O&ms9pGA$*M~|VR$EBhtB4ILKL}3Gn
zR<NGt5m+cJ%)09IX{OGUbF{TMY3`J0%^a;hKum1b7)%WlS#M!LlGt^-KeDx@w0BpZ
zLYlsU7TQ5V1@9l9Ug)SjKdL?@JT+-;e$j$SIu$rN*6?W83g}FU?0lNq^HxjU#vx{t
zt9$caXT$5xt(?wpnVl)9h^H^Y9{UqghI-nX)wW->e1FjTrr~tiM|t)1xSI>NaZgXJ
zv4?-4)fyf7?6j3@`K?WH&!bb)VS9J~=N5UFNaj6KGZS$vHBwESSQn}D?Qvw0KJNIl
z^2urEm`^Xi^0{?b7Yh)lWpQ=>NZ^)Wio6}-xJ1q^&a^T#IBnm%8By9CNq?FiX<#(R
zC@|O2S_1JeVTqmNJ!lgdN<zg}BgadH%=5LBuD(lqcKe;PX^BoUt3m|xZSyjthl(L5
z%-$9+Z(iEyBUmnctg7u>L;s$z_}bLD59TXG=I@Lo(l2bKe4{TC*AAXvx1AhvR+lk)
zo@_hBD%z1aceXj{5oc8Sbd8&{ge{kU@y1om@fWY>ODpeExwLMGg?YHfK4Q`GI2#S}
zh`o&7?>1){nTDMZx4-KRN}0yeuN;#^<uVzJaWWs~XT^T%#CSbay7!MeBKX_HOY7zs
zp2*N2U#bI-ed2!JP%`V(ns*ZxF8f`Vz5Cp2y{Jo{zIw8`w7Sl8s!AfL(Er^fsKoxm
z+r-sVDeM{V`0LUs%y;?*0u|>go-0VI8%m2&kv=a9q5K9fD5UH&+8K@28QwEnI%L0R
zb&O)@+x;-)&VBLw!|5)A-8}NP#6gDLR*5?CH%vFij<1|=k3Dw>_c=*?z(A14P8$=w
zoctPtPDhSE6**6qy(Y%zlcn`J0+gw!)PlasEU>lL|BNQx>pz``n`?nD^tJb4+KldJ
zOruyBPwuETtp@X0MaPv)c1PciUnLkswjMJtgVA<9#rfb@K2;3kv!|jDf@>8rltcbZ
znC8)ZkdRFN!2H@+&De5M=Ak%?T(o!^SmVmREr!aNwaoZ=Q;hw!=Mv%$#E~aQ+%jWc
zWl!?wysO``e$iE6i2ve;;(!<3U2PdlcM^{>$gyg3)D_hlWj1^yp<32p6>H(c^f~4%
z`JPkk_MN|&i+c}>B``4y&+l1Aa=l~Ij_w~!r@P&`uOq0n?%0R=n}&o5Yg3IF)7<G>
z|6`%mpuw?`Yw7fGBi~WcJ5}8-JD#!a%qEWAU)jkgd8Mi?arqT~)7z`^_h2F>n#j7%
z`#fFsWTT?2=+XA8>P|b=+q`x?^oFKphYVd?0e#~_y4{>V8mF8d|7co>iF7u&VARX0
z|CGS>v*YjL<DZ@9em8tt1*SG?-!vU@{d&jZT==W+bAF$oiO|zRNmXk2WlmCIsqoK;
z#>M<-8z1<|{<yIg&)>-|@Bg@`9AkM7W;~xhIhecC#dA0xvh?I|G5Uh%XgMAg^D^f8
zrvB3NvyQJa7de@-ixr`TB2*Ep)m^-&J5$2%5dK8fKfBM4WQYqrwr)zIa_`WFYeJ(+
zDb#XF-u>=BesrNO&S-_|Wn<^d<U~u+30m)5;_vS3;0?`|Ol|JN9b0_xdpS#{m~t&@
zCnSkum`*Fdm@!(s1pRgf{CQO%MPihXYHyh+yx9OXtw!EZ3)K0(Uy_VbcccE!L}heV
z%wU%^Oz)r4&zjX6FQLwF)5Ji@wtKgyXoG|_n$fQEWf!M)Vo0@}bh{}nn=Ut4ibDIw
zpRVg<>7~*CXI4uTAKlWr(&$EAM;PRnF4ei5ZD2aFD|Q*#e4_87%euCAIl@npdz3`v
z|FK7Lp}YAkRYH^Tes)LkH1A4Hq_}`^X@v=g{pYKa*yN}}MiM4;JVQNcFkbK1d;WoE
zFJMjX?*Ep-c|DltRDRE6)EHrhUUv)h8(+rUXWo=fK32OT?n<fcohMvi+jkVkn45}B
zV=s6~88!;a3*9$1@pz*t_pVPMI!)U&f3MtLa{wh!RW2`GkGM5nTJS6PtGc_ja>uB<
z(NHb8eUl{b6_XrQKM$7Ka-oPOuQMc$mFv92Q|;EJx>cr?q3Cm%?tOC;(DV_c>&FQi
zkMdLPJ^yNO&CdK|xQ7dlL%?Lz?CRWEL;85_D6<5KK{5dMxYNvtceNoc<-IwLl8|$h
z%LN#<GH^>o<CO8RNnRsIljW7!)Z>X#Vwspw{3~mT599T!xn;-CBFtI7+YH)SH59Q_
z-?sd2H#=w5+{sdNH}AW{H#_V0MV8m$>E2pLZS-BMkXpj~eziqD8}dmAD$2OXiQ|h+
ze@q$b6d~^Vxh^BnL6PfWdf%;QV>F)v6*(WW+)<RYpBu88ZY<!rqlo=JdwI5@tXkZa
zIyLj1CTnx6r;iqJN;jFW)9?`?aoePwu7^UgE;apzhsgIYOBDB7-dF$747PXtek;3~
z^hP{Djcaa#_jA(+J?0?zcl+Vc2Q7WDs<78zoDRn&+c!P$T=G5~-@L!qUiG);F7?pj
z#o<3Ta&k^pxSGB57sZU`&5hj{dTtlE7W<w1Z>nOhRXSbd-{_&P*;A{acBPMPv73|V
zzje)ihVGAKH??G91a97qtvRVVe_<zuI#r9|Qy9-t%U){uynDk=Z*!G|jAoOv&F-z<
z7LkKr_a7FrL=CVHa_5U=edb%|R^k}4bxP4_vCrVtpBh+<?$3DRut~4=@QstOoW*JP
z#;DWm@ZFdIt;OtHqHu52UxP$tayPA?FNu@D+F0CNN2^8B;octTe>8jbD}%tpvB3OB
z$8W=S%3T=LHvq0so}K0yrOGi;oKVsVqSH;);r=!w_saOkSM0r$i6O*aMRImVP20sC
zl;zd>`yvb9+on}Gzb}WR>}AvWU589g6u+q!_>rsb^Jt>DoI+`QZ0Dt=D%a1wkR8cO
z4f8SX`P;?*r1%B?5bo27iQ<Fmq5I$Npd&dZ0ey|-=}fO&(!iIij*{l45ZRUrV?XTs
z=f6M>cV2s;R>KbEy)}Hlt?O`49?2_=|7ueGPhjap(vj-jFaF@Ppz-^jW18gbv~m>(
zwPOHY|6=S{(~3X?=5yHEI3KYX;ZC1~q#7wPE4AtvM70fMn;yvoM1(@VEo4zep3mh5
z2|8}NOx?BZG|Y=IDCFG5o2h2KO|Qso7CS;53~L-x@nX3dkJ*XRL?R@7vRL;b?#PPv
z7!(*Qt}XN@SRau)dRVdi45Ft3;eJ$~*!dLCVsN|7?A@>1z%5UX<=PLLf|AEC_NT?*
zN*`7)I@3J^dQtiPDQYtk`O$l&qCXLRmalf`KMHL8wd&TF_Pd+${M{m_VONHN+fVwC
zQOz}vu5ftRXwcm~tn(^6QOm`&)Nlib`VpWbO=)0q_uV^sS%RTzupG0hq8{_CQV(B7
z&+#+CwO=;JC+6b};ji{P#R`>TEq?R;@~r9-eRgZ)+Y`4t&&lcy`KzogrCh%Bq7<XL
zVLvfMzN0w$Dq;^$0+xs9hRXLpHuMNDMSBIN6x5ht!a%G&%dG#38Hhbh7d>bimu~1w
zG_3U}m#Jz096)C=iaIEvb&{q@+Tq?o(-gU4GVo_9{Pp?Z^EfxuV)ZI{d#1c(wW*t@
zf{$bM@+iU4)Qu|2;w-#HHBmw(x;In77nIV&laKpeSl#WAi4m;qtsg?1gKEhi&U7=t
z7lzJ^sRNvQn7!_QA8IjH87pUe)FkbRGXj@(`i*UWu43W+`vk5N+y>R1jlwFfBGBKO
zQBIms)JQjH6%H<S7qeHwRkgw;%Yf?a=IpHD-ZBzBSYhR?svTM35FR~LH2czaS@UIs
zyH+@=a2Top%p`%;r<O%coLzL3(@h5B%fR+}m3xuE#DYX!DBk6b(`E|CeL3i6mdgO~
zjAC+&DZJ5a16b}3^jC9T8cYd#(IYKNxJX?ZL$?CWKtt=%6lW_mQFz)K@)sH$d=*bi
zM>zGy(`LBP@4KRZ0$_J6nlcdOf~KBXhTfn-q=V_xOA#dg$vG*_`veZd5h|@aT=z?+
zHEFr?`FIXW&hOWr^M4XN=i|6fpw{!p6d=VajQ%+J^ZJ@^7hJ)d_;7X`{-LR)_=@Xq
ztZtgF6g3~mn43=l*_^~4K`trYalRmR<LPp~{p<BqYpxtwA14em`7>8}yiIsae;yXz
zW$wapP^7jQnsLOriGL~)KgV(St#C~Sif)UGUhI`f=HWQJf3fOjvsLr47n*(Z<71!1
zaa@%-q^M+*$(E+gk@D}BdUJ<Y*9=1};j%FKg1jlCUneRyjw<3~-wtFtU16QX@%Z7K
z#r{a0^Raijip$-UZ<WFPs}_$aDXVu=`MnZd_4;(2jF`bk#Vzx=;i)55sOrh6tec!k
z-E1wH)LsPYf}5N*Xj&+POobeEAPzCUj7&qb#kujPiclu5^7m&=-*@Hi%TnC;=ctnA
znJ+o7FcOq87y9{0NM9E7uNE^Bgqi*+oG!goUe_J-d-=xB-*u^_v~gMi>WjEi{y%(+
zJz3gvwC*E(ixq|!#pZ$~Sy#>pG|xsc7tBMtr>^hzOgVfrFLJv%Crh{%1I4>s>o!*;
zNN##Q$iJ);wAQb~paB@+I*R@s){5`n&PrJ1?n*Ps8PFmX(k%{=rkLIPU<OmB>_#S|
zecfX*z0_5Xc^uQP6^@!olq3TRnRU3yr!e$eq<Kv7=^AgJE4OwJedwQ>`7zY^GL;j-
zFm0J-^Bt-luM&@Ejw7DxZqn7DG4*J*^A*!`KC|9Gbh|F;19FJ?9)`@TH!~@yK>Pet
ze7~<t@D_vIfnNg0S=6T!zg^6cIXFvd1_4i5O#M*pqNyl_JjUS{F38e3!XIbi`>WjS
zOOo%u^3s28^;#+)e-}w>l1g<h^eh&2rz~X>bdy(ku+;Y1APzUFYrjB$<!>s`OLF>`
z(A=@Ww1wy=PwBtbHazcU3wp!YwIWRdvq#oT{`ukfRsplFfSH>@RZRYk+UHqh1bv^f
zt7B<wR5&OCp+;7?-{m?l{N-|C(5Fmgv$)BlI&920%v9WC^%9It<=0Nv&e?WPj?fV;
z+{Ww#7wyT@ju*3LxF|*85F;Q~H@r$ZmNFsll*n(!_Qoud)%-P{8Ii|oup&w-RgW(f
zbpLqU{o{rMBmTgZW6J~e8)Wg9!1XAPhIY#Gyj#n5%B(AYW$raf-NY(q^*eWi2<0U0
z>pJY0X}d&Xb6Rb0+!XDF&m}IzZR~fcMSlRtei;qd&&^tMXJrY@Dj#q8lu&P$sMRpW
zYJcC<pW~-AW@P2+M;850u7Tgo9UF*jvb&DmuMGO{vr*@>{h^gxn7U@9Bu(NEP6WHu
zHD13%AMyko__om%mG2sz3;OE%cVvZCxyrytI$TkatX@J@uq=w?gQ?<wRPe(jahUlP
zmbg;pfMu~pSJlTov^^rC-2CTrGRm%2x6-MgQDlV2H2u06Yyj&Ot7z(ug`M!lyassl
zm!S>-w}iq)6Rx!?P{nHeT-}%x+3aI)X(?kq-4{yG_#reADyA&Hw#X+El-C=>h}v8k
ziTX<n3L*Vf#9Wk*VfALj9yQs@$lh*d737niKKdZ`!u76R<K5S8;y$k#^9XEV1h#ep
z8?i)M|A^J?FyWKy-|2da&r@P?57@5W4Iavsm0`Q~Esre^lte1&ZF5a}ImB6dboC*-
ze3xs|x4*2Io6dfp#n`7^-!rE;Kahmn1Pw7J{YgK_J$kENLX%WXQ_2r3y(i`&g9$7-
zCh|wVE)6MMjeP7DHTa;3*`3>iXeix7Yljow1wF1>X4uCmdErdXO3bT@QSvGn<yn+h
zH&vhk*9V{5ImFim+Jk2%qFD)TcH`p9CTh7m+HYTB>b?Eny7jAGm+1xPza|bR92@`1
zqTD7UbNP8L4qOoB=!nynh$rDxeScUITo5&%Q3F`^4m|vl1$8NfjTkvZ^TCQioCkc7
zMy?2iKmCjfTS75&6F)D8kFIptm-iu^VP3BAtWtd@ft8Q$49#m-^5D!iwIvhIdV=wj
zKv^`27E;i$+9AYNbPdNR?pujdq>>`TReyI+2+rsk-c0oQQ}D8!cHae+0IGDs!wo?c
z6`xVhTPb`1xM2wel8;B#h5n!zA|?sbbtz@Q@i_6p8pG*biXok5?1m)}7l2WhymL|w
z$z2B55m5n#tSwmP-`!OFZZ1)-lu<agy&f(XqHZ6-$Ip$sbSpBwcv~8Sn#b3Otczdp
zmedGQ=*@Q*yzF^yq|1F0p|-yFe5#L&`?jcL_vRS^?(wMHxdc+-gFtpaB)K6DT*_tI
znM>Iy8fQ^Zjz~S1ONc0A7`{Fc%@&5e66{KuzZS{nW?zbBV-=+@EHO;O>mqQ8`Nh@u
zBD1NvT1b&%#1cky1ZDtBN#rjl5z7y;Z_fE%ymg@>x>0qcm&cbj#Dg0tZ6nVKja{uT
zZrWerbtPV<WZ8RYuiM9kNidRss5^``*(Ee@WE9$1wfyAjdeFmDKz7bvWpu&v4irPs
zgw|)DD;7X>ssO{$N1k~;Sl^$vye|zUIB3Nc6xD3Iks4diX=`1N*{-YRg)XjI?-utQ
zj%&4-V|flWuZBT%)9$*8%(dk_Ab0-x(&w*^nOmkW?BU66`zak+u2+0~P(q>Vf(XNt
z^NJy_+Q`YJ18RkET`W|xgt_Rn{Vt*RjW()-RP(9ad~$$o<O`KxnIc)oq>-S`O6dFc
z1?9!vzjW63hG0@mq)+9qU2sKZsAAS}yjvY3Lp^s%L=>3EGu@5*Xoc5?zh<RyjC9H>
zhO15Q2@glZ%G>R>$W+0UsWXHL5^+Ln0j2qNLdS9P8qcKh+X=lVJnH9@mON9|=Tqk;
z>?xpW$Au~P^XWTpC(WKr;WR!QMNj*@os3=he9!T-J<n{a#_WZf#!RHfRC@GGiQ}xk
z<J{BeS?jm6$&NEGqQ6u>nR^yJ`y_g5)^$1+H}B5#xiWgb@_hac&zIXg3sV}4-RECg
z7iPblPp%nWzJZJ>6ZVrcyHy-#8dt0=c^TG?G9@p|0kAV1l2sFOwHt-zMVysTql>2b
zI;qb<2y_w8RnRJf(+X|p3MytrsAyH>-!fCo%4LOW7PE5Y-zuBt8e7boTFi=;=DKas
zI?uli%f;m@F)MnV8`1yP37QZO-nCiWn#$rDE@msdXeE7d*;R9kP_z}fxL(QoEw5<v
z;o{~K&95af8~QQZ&6=z2P8&*#J91>yfaVXr#f>h_jf?*lmj~Z|ySuo&6!UeXXuILx
zPHgAy1I?dLW4?Zj*=^O_pe_2rSM)P;@#k3Q=Ig~>IpAln)6WIoT?WnHY%w+4XhzOx
zQJPNZI+;7L7;3HsAMR!_*ZRxT&F#<yeNN_H#~xUBvwJM<mthamOa3}8?VCCOwRJvl
zUHTgY&<>Zt?9gy%H}@knytIpQ7{pYnbt1E}U#)cv>plqr4%?TG$BIwWOHQhnj!T?R
zUUr?<b)DwK9zVV~u8ut!x;SajI%)1Y?OHnfh&!u(dIsW8By$so6*y+zahDTRq#wE`
z^*N-nLTULe21faGgNW=kvVFB^&V)YJOJ239%Y}9hSb;80nL$V=4dVFfx#->{xf+sQ
zO?BIE9b3r4QB!Cm<C&4if$Ch}Vptz67PJ+9>os+Yu0X<r&e4XyN+8I!cT@Ung>Q1E
zcUeKsv*{OhDx1$M^wb{s&NkeZ^Vowc*DiO*QFCdgDc4=@A9Jb2(5TdVT)I?@JJVDe
zHa`}sMgF6iYj6&FZuD3)UG>fORF!>u46Rzz&TOO4m(Fyx=G}#k$kTtcQB6yu|JP#8
z;0~-Y9DJ-6OQ+Em{OP?FtSdvK{ou!Zd*lV3W=B|1?~BJ;nY_nJ!u{jzvGiJ<XFXH>
zU%E0cs+VX`ZCTHr=uqN3U1+@5J(jI*2ku-Pf;ca}DURuYH}zfPS*NWQqd5IAOKimf
z2)88ujH4MZwxT3AKk86EeQJ(01uj}}DXy4+cyv`DRmEfUy&nVBxPFQ@ooxxTV^)$!
z@EN&zSoWGGrDyKmLj#XIt4B@6A(eYxBPOU^X{%Ihu1gwPK5CRGu{ogZLI}u1!&TtI
z2At{M_b0&ci?<vvRGMaBagR3l$FwQUE!^o8147KSsY5_AUep0^T%ME)0b|hT)_xyE
z@0iDMK4Lj+`AQj7T$JMd>WSIx?Mhb3qy%nx4^vY*$9T^hY#gKLco~%ZSbw_jxL2A4
zhkQw;K+tLdq1fC5NUIy@#F$Y=7hhb<Ky$3`i9eq+{8ja=*N>~J8IkbayKOr^AA)?<
zNzK7yG`d0)F)ICww&P@X=%-6n4fWnV>XW|&<_p)gBxY1VmQTZT&;%UGfmN-Mk?%`c
z{vQB(K!v}urP)c^v%p-upcKXi2~2@G==o3v*Z}c?oE(Tdqr)Z8U=9#^l7nWzI$xP#
zzdi@nN*?Zg!OG7@A01^EbneVFc3D1X4ml_^IBUb$m;=nq*HRp_G0z&=g&-Q&>99l@
zkn?pHVQ)z?Fyx&1pTyPV@Ill$S1b|DC(D_0(|%vrGt&F|AqrsV^b(jpn#j@|G13SQ
zdF1G^LwV(v|Bd-?S(;|d#I}@hwysxW|B^u;qinlo*QBG7ma;c)%%dC<N3?qD<TUC?
zq2%P)2M083i!sb?=B=L;O=RF`=E{#3xa6sB;kYz;5E9rT#N^@RaiEameD~gmR*WDh
z>_>k2XDyF@Z3_xoS{EE}u%j)aM?Gt!EeF^pImb_o&DaC_Re~;DO@Dp?!qrAGs}_tR
zYEt09u7F{VY8<aoj=~?Yh_^Bhj465P>!5a;_dO}m!3vM?hcu`M7&F{M6NNL*F_@r^
z5Xx|dkkMB8)Plo*d2ola>ECLq0X5Z-<7%`S;%SIj8Y7wpiLL2_6h86+P4RGwy)nic
zXn3k6nGl8k$OAekK@8*cg9@|2|DqYsIGAGWrvz_EML6CF$2f*Vhg7U14_D#93~*q9
zcI=~VwxmEbMhPB%-~usPL5p4xf)M&JjxV$!$Vk#qVi~xB8|8?}H`39MoXlJ`Mlp&4
zb#j!iA>WZC38hEGBRP@a9x7kyJW4VmleC;;2D-E<IaLD~Zj+NQe+kTB3UipmET%Dc
z*-K+8bD7L!CNi4|&1g#VnbNGLHHpc~YckU`+5{#whbbgu42%&4WCtwKc!(aj<DBd~
zn#4+Q$y#Fa2H_y*6RTvh0@~9$M9SyH_KDAw{S!g_9FjjXzz#>`pr8g#S-}Vz&>i_D
zp$oN=Kk4}k(7CIfj_HRc|8(IPedt4ro4LoRI-?0AT!EvB=?AJvDo9GobEf13AdF6w
zmJ)>H7f|>`J=b{C3*~gDJ^iUoQ#4eb`n0AQ025NfLR6oI;|2g+noyytRHix=MM*8{
zRI4hau1a;MpgSc?6XOjo7@>uXvBDDE(3w2=!87-Wf)QwO*20Jb2B&Jr79^?048(J$
zwEP7ls9LgnQpgc&9PCaH3oWlP^gfIQpkob-SjkqXvQ51#WD`4C`*0SXa>T4(jNuat
zjdrl61?^@VTUy8xD7CM(Y$j9Tmty4gFrqMmZ(H%0R=|}r_sGX*mSKb?v}3n{5l0PD
zpakPasU2dl0v%3z|HkpnlCXsRg&Ut`sL*<66$T^c4Yr#}?}h`siWLue$zfjfVp6^A
z6>oRm8{b;ex2f$74}L2tUraLM4eQ;OeeWv;cH}p`-{tRtxAWig%5%U4uBd&;t6%_6
zI0GnPE@5=hiY54#agGtLU_{{tN}QAyexSo5{Lu<sP{ItF(1#zik%v6o!^VEVt3Pav
zV;uuV6m*~iTN(2RBZ$GnfKdV@PL&5#MDlbx<*t=?N>#r+_&R+N>@UVT(_dsc16vMG
zms9a&D~owQWd_cf)6Cs9YdJh`2J=kcutrgSr_OO6bDMv|XDj0wfO_^$pyjz{K`>b`
zx-fzjqA-o%{|?t5qObxj-0)&lEa4H4u!2AQFfT&r*wLC0!;5u+X~5ir)TZ_aA*>(@
zKM1X(VlYApJ)8n)_(L3f*n@QUv4=~H$O_{K3|kdP;_i*lu~!cBVZ#BJUTLR5m1SeI
z;fPsi8>-O3p*8>seC@~5Guqq+j<=f%?rUe8+|x$Ox5F*&5+t<0*EzSf)%|RCXUE>@
zZZ>A+ov=UShTqL5XNMQ<4}Ms|2(3UxBTGE#Ew~}pT=0h#G~o|oc-jwUFrh3~Z5c|;
znh-Dc2gv;)@_ZN}jGCCWW6&YudhIqJ9q@-RUU3XE2-_cI$i)<L5h9hF&>x!cG+?ZU
zz3#EY|1a>qHWaE_?%j|#1EUagfSdkw{zhFlQ?I&&n;yrkZ#y_$w>sFv4t26W%j;JU
zw@*Q5;OmtA>t`3cw1G4CwyQfFaJMkt*KT%o=N93;tvE~>V`9KWfpDS_g+7en4S&dD
z<CF-@ssYn-z>r+kM!-DwmT+{JJBAiUhyr%cngSTS!XJBpfpmG`4n#aTL{Zp+E~N1Y
zF`QI|EbN}P`hE79rXtJaScSk{vkJIpK<{85zF&%e{MICYKg@5s^Ur4d-b~*w)ra@>
zp|5@Aci-)UzGd{KFaF@m@%!25&GwhC{?e8om*J=W*{Nz)=F&sNh>J|(yGREK=Ok8u
z{|er)1X1v5mB)FWr+FoJc|<pA+R$jC=NNuq1ObR}UVsRIF$KH^bR@C}j}Qg7=0#xC
zJ-RY}@%Kh)wj+k3B3R=WP@sb8<x?$aRkT4Dzz~BoIA1l$UoWVG86bl^7)LDlgSe4{
zJ4l4s#t5?%AoMmH;sk^DwuDCLf=CF1Lb!xX=!D@la7jpoU`I~*w_A%~1d|3Ct&m*6
zbq`z+1@l5_$<<q*hH(oBftr_G`tX36XMt8AYm$)<3kO^twg+S|1j29$rSJ+~;061T
zB=8Ug?SM#%#7N4P0d}^90+wZDLL1`b7gA79nW%|`)`<fHiYXX>vc-u}Xo{gI|B7*>
zid)ATo`@i>_=<2eX6G{-Q>TT@wuP}+il1nUxA;|lp^LJ?i!$ho@b(KF#$@A=T#?5a
z@jz0ihZ!a{DsfP9ks%GqRcs#SQmnU5(4h~5s2QpxL*s*q#P~*s1qJK?E`PQqeql-M
zC`axHk5H%@^H@pC_=@-#kFddy^=OZ91d#fe8UyK%qWBAVmSA#lgR8+=UR96>DUbU>
zkOjF@4#^G>85<M1j$qe}2gh7_U<6#`7`~;FE6I{A>5?xAlPq}|DYXTMhj7<84mqil
zJIRwdNeEFOWjD!m8c9oQL>H=&7OPMUB|wox8AnDbk!!J(P3e@H1VBfb{~Ad-l_9B-
zP>GaM$&_5lj%ij^_T`CQ2YglOm01avR7sR%>0qjHmSUEcDhNXDgj`Di50Md*ed(8f
zsgjuC21c-rk%JGp@F9xfh>VdAnNew00GW{~nUncw$yJAjp$(Y{Nsj>!nz>v?Gn7?X
zgpgGN;HMxMDVl{vnx;t_15-(<nO>{eeyxd`uo+uaRhqM@AM|LOqu5mDP-tGWA9X33
zrj?rv<(l-=o3OZvz{xq!;upj@gLlbJwWffQ(+(nL8Ibc0bwC6}5DAJQ3@N}EkU*Z#
zF+F>E81P^OX5gNmCI;~tM$51Tiw79eATL`m4z1vxet0yY*_(#t|3+aU1#*B|^oWXY
z$p`~#C<fX&8n&FV#h?Xxpb#3NOgNzqil7%Nf3rlOa<B?P=#~MxpnTV$6-sv;x{)5*
zpdlKAVriFuv0J2P1rO&ujkW}<1UcjI1w?=k;(4Bn5kt<Q59)~+>?s%*mzl;D1)=~C
z1n3W@rVrj=qmM9GpqT+GN>uv+if;g;%gIw*8V+8nrSp|_wMeFAT7+lXrC$oBV<v+M
znwnuMjA^Q-*aoM=c#G8eO8T&H$<{rDaE6fc3bY^&ZIBqRFa<nto`^66zUB}4um?P#
z1V9G|Q?Lhup{Png2L1pC!r%pm_#8+Y7?u_o=zxHfCNxoS|CxbdrT>|wWr|sH3Z{oe
zt0bDDcRHH6s;dTh1EkffyLzj=d04<&kbH_touFhgqz_xLR!6fBWl#oykuQf)3L*dp
zdqAFukOHMJ1f2>8HINIXAPoMH3*j0V*P5;52?HWP23}ADquP0;%6Kr=asIFjp4MB0
zaC)zbrNIiY0V}WrORxoNuth1OEENwT7Dh7U4ZbCf{lX7$fT)X61DQIW{s03*fCy8-
zSBQYE;t&|G5U+r7u{Ou9aDcM%nxroFVkmZ>pyv<1@M!4Zs#p3m0D7=H%d<V}vp);8
zSB9*SWQG_xL%mg_{gMu{@QsVn0YLW(<e36ffCyC!{}`_@1Rbz}{y?&U@w8mau0WTu
z&OxexVXA<k4S(eimzFqUfV2LZv#}bqb4#~%Yqxj1oI{I7(6|ImJ41tslJCL_OaKm!
z0Rwvg4JkmLN}vS(un$0&3of+>CEK-takz;awku1v^J=y}1{h25IBtM(-{=Qi1h+n;
zvv{kztIN8r>$>u!w`W8LCwWHkU{@doFR#D^y5<;=&;cT#t^VK+H6Q{a(700|0x*yQ
zJNF8|yL!Hht(iNv%~7@%r;>%E2}`gARuB*QaDZFD1vU#9r`s>7`?}|gzUiyJ1RJ{~
zVw0Xh45g=|X5<UWWu&O$47xCmk0D)x;SS*l{}_#F7|>u`h)}ZA!Jh5V4)-e<_YkrA
zpba{j4+^{pIE%V+yS^E$!5hrMYMHR8;#bC@R;_AAX1HXif)8a-3eu4RHNXQRP_E{2
z4_iRPYU>!HP{X$tw;jyGJ?z6j40i1sBGhGF*2o#MU<5T8N&GOvr=kv3pa<pw4KaL^
z$zi@gjKx{3#TzWdArfW8kq>qSsC(;Mk)|1~5V*(@53Nu%RV+AHyv1=W$8%h_T?`_`
z1{kP7!kLj$CyYvJXa)T{8NLt&T#&}aQ7ZH6#;{7qjqJ#e%(Hg9Awnk&vcN)nJQ?u7
zu;(<pS8Ah?5e4F#9C}a%)w;+?1ILi8|H`Y(%Bd;I8&Z3^un4`d3>J(Tf=YpsR9AO3
z4h<U_?U1Ut$5#9hl%3%VZSbR~{KgpE%FXP|&-{w73?iaH3%-EKk@2v7i<ime2j&PF
zx}baGAPV>32AjDEMz<O6KnmHT%*zbT?+nlJe0I{zA>&ZGetQ{7R+zBF4`xWalA#St
zU<Sq34rV}7ew-Qi5}xf0IjJnq4-L`rOwSx5%A4^B42(+gkYv8a1@tf(S`-g%aK8wB
z8Sp>_ZOqW_9MLPy(h~i_Q9=khY&b^nnVTUE_zX+vFuU4}8Fat}Vn7UwfDR#c&5l70
zAD7aR<IpY5)J?s`6P+G0O&B%3{~7UsyDZfUV$gq^ambM&3UxpQ@0-*Y?9^p#)^ZHh
zpV7^9Kn!kBY$rqqe$YtckOyW!2=PF2n&1Y&B@2FlvxubEgXjx%KnNAB7_#um9EH*7
z(OX9#$YagOXD!*2&BJN!8SNPbQ6L7I5YRnl1o5!2)}smVKnQQuTlwG(NUTMrJ#j{$
z57Mv%t*{6rofy)vnUH-P`k+=_jobUO)RcX`V9)>!00y*F2*d3JnG^vH@Br5!N6Q@n
zz+KrdogPLo4m8GTelT30EeaJE7=&=b%JpMLu-f6>4zDH(DP_cmaSxu`+l67(nvtCh
z_ul_1-5u-%0000xKucht|KBE%Ndf=>0#Mv=gb4yJ0Qb$omfabk=LWd<2wYG&@$lJ{
zfY4Iy4@+RPkGI;lrr~)Y28}n)j)BzmO&G*r!<f;HM({W$&M&{M;H#V8``zCH4&az1
z-~bTaaHIkHo!~K^!3@qB4i4e677w+C4&BH&`M?htuHoa|;h&2Rs1V2|l-P-(4QA}d
zy})rVMhUp<4KK#!X7FP0&<a-I4OHq6_Dly(q6wGg3~}JzhM|U0u-GnsDliV@cRS<!
zok?I|;{opD#qdVgkmEnT=jkitn?dB9whVTq2~oguOF-%4;N%;gTqShrU37q4pva1m
z4`aM&-YW`+1Y<_${|Ade>ZYy<Td)N2sSSZh2qC5qVxZX<h=zwDs9Ye{crGP+p6GPj
z=QR!hH!eqqUf_Lj=)tb&)O{X+3GIOS7`oumZmij!8wIU!58{38fq~+IL3%6{1>h_S
zl;8%-aIcBM54C2?z78tD&g?)t?0+8UI6mM2&;V}~0s1}Q@qWIGo*B_D@G<!q-q7Mz
zd=DbH1;$lrdaY^-Z(QG=$4%OJ+8_qbKnaw9?u=o(&+6`|0`LCbv-6HgfL`o^?&G#l
z3_0HKBHy|I|1<g^>K+CUk*5z!08;#5SBO*dKZf&bz66bQ596=|kTed|h4C7n?uwxe
zzU9jw|Le@`|MGZC@^WPI#vVs3zu$m906sqTtPAr$qYHPQSK0uXnyp2hhPG!f23q6>
zZ^$^JaDZ0e3uYh<l%NUDu=I*Sdg2ZBQUCR<TlH~t^@1J&0*(L;000Jn04*Q*cN_LT
z)5}#n@B{xCNwx)7{`Vsi@{d2TgAYfAZ|@iI00VC0jgRP_Pq&dTvEIyNl`rs+F_=cX
z`AE|Fst>TB|3;#J>;P~9CO_b-fcm&!$IcE*zChJ(ybQ_z9QUwr*IE0VFZIOlv$`J+
zyr1>HZ|M5H0O2tF)E~60-!JI!^wF;wL~jIFZT=u~`{1vp){p&gB;Xei4i_Nc$^HHA
z@3Z3H|1Yk;{s7@m;6Q=}4GQdKWXZUL4IMs&7*XOxiWMzh#F$ZIh7936egqj(<Vcbw
zO`b%VQsqjPEnU8Z8PlW_0017Cz=;!#M=$~aG{~tloX-p4t{wG=0Du6QO`Sf48dd64
zsv<dR#F|y>R)548as?Y!>{zk}H5svTuk2d3ZQZ^V$g%2Nx^?Z|#ru(FO};fF@buZY
zW`m&siiT9mH1A@@jU6w(3Rg1RcD*KF#++GV9wTlve+C^ItlY<?O`k@+lBNLGtpWTE
z2WDyO)(^rN0H8tS0@kU0{|4?jvS{KLTk$KNT=`agTZ}AP9$h+U(!s4?$DUpLcJAFx
z{|=uX-rusX;?19Lx5S97^X=Vht?pg^eERk6->(n;eQ|iY_Ww_A86%9)CbU)v0Wd-M
zI>N6(2OoqmLJ3{cPr=V*(Z@m!FKfk!DB}6dmngVEa6=O#if=*{S7fn87g4M5M9HM_
zMn)UUBE$$Wkkc#*bZ!KapcG#uvPdJ3MDn`~f}HFgT9||qD}KZ<!ViD$$>*|mqKFd6
zA(I3%OfkpIZ^<s*k|oPC*OVxpD2xzA7ilijMT~pK(dCgR1#0DyIoWLQOEL!~v`|AK
zGZRp<v?)+gM-9?uKrTeNOq(Ul7)KL+xb#OKQQG0+QSk&lv{X}1MKz@uMaAkK|MpmY
zv>$jD88D6vC*!dlH%b&p6HQ>1j?`3#CAQc>R|OU$TGUFGO?_H%PN5$)yC;fUWm)9b
zW{VTnSZ}`tS4CvErO2B<$vu-FQLHdxPt3%i#4|eLSt1TG&?T<haQEf6U+%`m7b1OL
zmCTuT0>127N;N|+ALtOymqC9grnutZ0EW0BUEq;y98`QMFJlD{eu!j^Ocr@7eJy6W
zWtXACIAwyySw^yfWqvOn{|Jhrm4|w!Nauop#yP8%Uq(7<rAvyrXnuT#3mswx3RxeH
zi!P3sEeg8Yp{^y;nrp0$mUwBi&qn*Bri<<cWwxZzCQEGyzGs<p$7V|x|2N$5j~G#8
zaf4ELTCu_#Z}ic|4?k-3M-y7ya3&5~5?@>(X%tty#&#ZwBM)f?FZ^)I8TUtTzWr&1
z7ERoM8t;ORPCItl!Cf2YafoS$N4Cb1W$Mxiy60}!$4bxFCE5{X2`)5QLK{uCSV9aj
zwCT?Z%lr`|3M%Pvqx$RH(M9hi(8*^DH)z>Hmgl3N-g|+HXTBXmmI&MkZHM;<_SyI6
z-_+Vuj)yl|K`_beOd!F-Us+Zs5I1N-6j4wMyt=YAf^gw_Vh}~VmSF~gSdbvPSb{J7
zA&VslL=5Z+TLrJTKz}rl5cl%O@e&x9vh~k~H$>I{QYH;lxGQR{|6m9)_#q8lfM|wc
zA%vCu;Riy9!ZZG`g3nSo5D#L{8I+*J20M5?e^?4?i=cx*(l^0^R56JHVIm<OA&~JM
zQGYmuV;o(i!<0=!gqgX=w2n9yVtmL=e)CN74mOS@WQbW+6vGv>$U%QpaZ79DQ(AK5
zGeR12ivsCmJpQOgHtG?7Z<J#wMd=_qri@v8yb&D~5=K!d#0my<Lll<qDlS~gA7+pS
zB{bm-M%I#pXBm(YP;n3E(18w+jO8plXiI;natUGNWDGqyJW!6(n%C@3DNz}k`(Z^I
zrxe*enB~N7`Xe6T%nCZqsm_6jbDOWLAvWbXPx@$chWTJ;|3-)*i`E?kp9IkdD$0qG
zcK8rs!9-|66}nJ{Hq@aHZKxaLNl%Ja^g8xTpf-e;m8U&KqXikLJ{tuwh?dl(Cq?Oi
zBx+HXwiGxR9iBd<L5zH;>6^sx1#*H%jGCdN9p3N-$!_P1X?3)nGp(6SX_}>W*llLL
zps7E63RJf>gdb^oXI3NTQm%GYIEm8gL-r|)URZ`7J>;D}?$HWqv;!4GYz4@C7LQiM
z10Gj1>Xq2)R(_1Ntp3P{TL*#;S+qkMPm)Gl$I;J+;3=$+%?t`M@C&b2*0NRkMFvm+
zS%`d8AZG=UH~KMCfxJ~3*K377^3jTAoHDPZ^~YPg|0q0E48#|VYen!-8&ZSxB4nHe
zZdrhkfmB@9xW|=ADl!0s;5Njw{>W?T7;@GjHY&A%O|0+os*CB$_PM1Uh%Tm8Sh(?t
zw;;t(bJZ)B;l2U6?}cwl-jD%7thXTJ;9_*8u?&9nLZIbEom%^GrP@Nbb^GnFK>dN=
zf)u!mB3!FK0DRqv0M))1&dMk<0EPH=*ux;XK?X*F;m^u~pZbU{J^1MjS<qv``rsWc
zWbvo7&e$I+ZUu|!0bLVQ7!|E35I<<q3Lr|@y5}{BcuBnEim)RCCHQcZ;|tRnA{ipO
zqsV!&tPxiYn8{y;$Z$C<WinfKzFhz_l&0ak|1`ImAjNnxWy?HgmvW>SZVnPHzJ}*C
zcVWYH26RP3jAlOHC>{hX^p~BS0rv*l(bi-HN7#|*8%blMl*TZeOTdUncRG&B&A^>8
zZ6jIabJXe;1V<X}X;#l}z9K%gjS3oTCZ{?BHz;nab-lD-gc#PemJu;V3T*qr`N>eo
z^{$m&v0p%eBcUd?jIOGtXs?$Ywmvo^Qn77rciY?F26wo{J#KQB+uY|yce>TRZg#iZ
z-S38XyyZP_de__D_l`Fs81aS@Je$zfK9OSqZeMnEVYtsmc)}IFaE3SB;SYy+#3ep)
zidWp?7sq(UHNJ6<ciiJ22YJXvK5~wr|DX$#9=MEroAL{@V-yAlLd<18bDG!O<}&9<
z4s^bAp7-46IpE06g+6qm-#q6(M|#hLUUa56o#sbRdeoQhbgB;>>QPVn)T_RAoM!;*
zSl2q&#SR1xWPk%S_`1(qz>yD(UF>B)d)j-x_6)S0>Rsr9AVke_84b+Jd<Qm1jA0JK
z7vAuPKm01Fypaqb-tmuLJVrS3c*+|-@)enU<u!kKi3ncvlvg}hCsXhz5B~Fo4?S})
zL;4b!{`BTZJ>bb@Vc7#-vaNr;;bZ@q%;(<nqMuCfeNTAKPsH=XCw%BHb9>k4e)pMS
zee)~-{MGvz_ot_R?SZ9auF%5E{}$4RLA4*9==(nVnBj;VkZ%s4179-2AAa#A!hGbP
zzb)l=e$YdM|LN=hGyDfV{~Nz#>9VaLhE^a3Q#%iR(1qR^!0-UT{#!25FgEq`z4qHX
z^veJX9KQC0KI@Y{&9gtZh`<1xK+z~c-4nq713?K?y$4K|HQNfQF%j~BK?rO?5nMsg
zsKDIAKpsrL4zx4PNI}ON!M7+v6+A)WD8eJGzS4U<C%i#G(KD@(hOa;eZ8)WI(1yPg
z4O++&eK4GXfCp`;swo`39E`#p42>TAydP}CAbdSIBtkVb!56GUD7?evC_yQF!s}B)
zJVZlQIW(=%1$t16ao~rY|H%h<Fs%0QnR|eTd}u3yU<gDT#5B}H#PdVUa6`(Y!#Lc)
z(+kBs1Vkfb!w=lV#7jjKw8KvP!{&p<OpFps%L-zc97_zDWiTT1kcEx$2X8Q-zPdD8
zL_#}EzE-3_Idr^I6h#hvJZCh;5KP7;bj4MyMnO~#{F}vC%tm8umQtfOtZ0W}Gs6VA
z!hz@qOa#YcT*YqmL}oNRX?#Xd9Kz)2LuH)CKs1l&gU49>$9BAtg5ocZLO{zPhC?F;
zXV?#O@r8S6hsvNmfz-t73&_j(M8c!TWgJDs+ej9CM|}iIixkP?AiZbPM)LDBl%z;l
z;RhBQCa}mO$+(AJ{|pOn*s_+C41X-i;`qdm<Va{_zk5_kJ-kSFY`vqzjFU`B>0nBo
zgq3^nuQLn{eh{at#LBFsg<h~psML^??8)TlL7*g#pCn4B1VN>AN0!`=g4?Y3a7(WQ
z7N3d^JPDt>#7n$vg&tBs;JM0+uu5_ALb<evr~D6Nd$tS|kFh+<=>SV>#KExSLjXZJ
z!rUebBZz%sEUj3?X?lpWDl5xyhR_6&duYHvxrcqC1${t=va&JD6pOe_5X4kW^FYkT
zj7-QB57~sx-rNt&B#7u@4vUB`S{Mg+8X-kA&eAE6aWog-42#N~O=vsJ#B9qhcuTm1
z&h7k+wju_4|L}zj!LO*gk~O=ocpwI8xE0~VjN&wzn^~}$k%iw1#$x17fWw9szy`{^
z&;FDdROkg0^DV+MtS1?mWoU=gTB|JF8TP!4;=DqJXw3t95|0s{=k(7E)zA%HuU5zh
z-!h!r;*)!rhTS@>aqxx$b5LCACt47;0vU%pautDy2N}~A4CT-q)zKYIAfI_i!{NTd
z>IK}=2V(H8aTtdITT#hy&vx3Ac3`v8ITsw|(JHmlD@7L{y$8e51_<++nd%2$5U6q3
z6J}XbxM<RW$Sr>m(Oa=afuK_E<cII$imt>`%+QBC&B=)1hddojR`FAe@Y6lLQvlIY
z!x1tf|6>SO0kZ2_1{2c-<ft+Gbc^Cdg-d0K#i9jTK#l<lpBtrA!dwLC35$3zg1%Ia
zar}%vorpXI4Rk`%#-h)MKqqO~v9bsr!#Nnk8AEfjG$Yzl8u5ppG8a_63~9*8ad^|H
zp%HJOhkW4GuP_(VK?h5_hnMsQMk!P%A=L1A8h!xRhUkZJyw-sL*YD!adnlo>xK;P?
z24igtR&9@(S&MuaHn-SPf>?%paMdBoQ)HDewYZ;mT@HXfh)@*^bm$rq)zbybREGE|
zf1p#u*;YR52fVxpyVM2JxleT^2yIvdO)#Qy=ma(DQ%x9$Meu`r@C9j*1wRlWVt52d
z|6)^@g;~paghf~w;_-%YKruaPhYa~CpM@^!nNu1a2ae$fM{I|9nANT52i027`{~nL
zaaDqdT74L>47pmsMA5532N)w6epm(+(?w<xr{j!Bhh-KRLsCV2A0*8XdYFcAbz9xJ
zljH0Zc(@a)jEH<42znI=diaWQpa-(eNrH6?bhr~3Lk@W8SsvkscA%Mt83%OuK7<Vm
zg>9!{1K1&QSc9P0iX~lQ^H@uaf?g1XFxnDIkOm{bCmqoRD}V=0hyp^O1tXYTVlaY%
zuwC5M-9Abk3KENQRI3cJRf(Mw<GqIrF&Ay{h98NCZyJZ7C68q=mu}Sve#nQc|Lv3v
zQ4?4FKC}I-?sZix;a=@^h-qNlZz5ajnTAR9hGl@>9qZfoxn5<xlIm@zJCTL~gWh}4
z!ZK`DLy`t+`y6<fli<+?7lYS=09=7s26#B91-lw}$W&?QO2usp?6ov+;M;FPhiQPW
zD-51KwbgPQ2+aix&OIOvj)x2p+@zurEF0a@#o<vq-Nq3E8M7ZsC=uAb2P3GFG|_}S
zU?ULWhu-ZKB#xnYU>&I<-coHVFN+5frd(fbhwtNHZ5W4m$U>QtFfshoi7-<`n$vth
z4%MR5a6O>UvLxs#<4*Y#3?^HlWgNkMACjS5G5(XaJ*q50pkP!Bdo75#{}Bibw!{#I
z({`<h2p*4!1d*go<gb`sj^$vs;4cu4NJ<{#h?TI()dsr~To&dE7rv6VY6mqwm(MNM
zfw<uumSsNM;YG-UO$9^A0W2Y2*It2|4}mTwZk%7H7lxRIDGrN#pcx~wRrM4IW#&aV
zJ*6wuq!_M|IXRrMIO8js)9)Ks*TP#kz7lb^h(V?YZ2;ZS9gl(l<aU4uF_f@9hUMfP
z*00b)z`9pNu4hYRT*mogjDTc4hKFfE<<UB&OkN9YwwiLh)o%h}%i#wUt>zV;3{)0i
zf@o!eP+@_H<yrP<Fx%l?*pUV6hndX>&N!!D9%g|6<|X!BVs-;r|A2=rKxVGEl`>3Z
z`sL_EZWR92MUIANh1TW+G9)^MWyuZaD~V%ywFqafUeJ{(W^v|$Xy<pnW_h+8ley@o
z+Oc#V2z{nR%fTmqwo{1+Xn^{YsTPQPmgcumXr^TdG0x)3jfY0j7E_+Vg&j6ZR%9Nz
zXpX+uj}~kU8)7Sfq(`s<D{up7wSrmNf_GJEO(5oAj-r+JhY#t6CFq$@8H;MwsA*;v
z&;F)owzNjks4EQWV4UNKP%AaQm8)zRETOi*<Y+88Uvjnxc(9uwvztnMA4{7S!&=^V
zW{5wwMcrP8<OUIKAP=85m(iXrf3~zm^=C(>h=5M+f>hRY|I7#a^<siR=(2cgj?t(I
zreg#J*zF!EyLsBqUfArO6PeN|=Y<=#?v%hD?EGFbH~uWJcxQj0g)n-HL4F9M1`zTM
z3$KO}NIr;um{@}dZ*-x{&kW8j`)mEiaNtU*4KFFN$nFmZ@emjB5&v-MXx^GiClXij
z6=(4lck$%rGDi7si{L^=QB`~?M@A{@hd>-gY3~dN@+0E#A&;oAc=00-@h+(wBxmv_
zKk^`l@+g<`DW~!(xAH5;@+{Z#E$8ws_wp|X^Dr0lF(>mfH}f+`^E6lUHD~iSck?%g
z^Ej9DIj8eFxAQy4^E}t{J?Ha2_wzpo^gtK%K_~P=|2OnQNAyHj^hIa%MtAf_hxAC7
z^hu}mO1Jb&$Mj6s^iAjVPWSXr2lY@F^-(AFQaANeNA*-!^;Ku}R(JJRhxJ&O^;xI&
zTDSFE$Msy-^<C%nUibB12likW_F*UXVmJ0<NA_e__GM@GW_R{yhxTZf_Gzc~YPa@l
z$M$U3_HF0(Zuj<Y2lsFn_i-opayR#LNB4AB_jPCYc6ax8hxd4w_j#xHdbjs`$M<~K
z_kHL0e)so(2l#*&_<<+*f;aesNBD$S_=RWqhIjafhxmw>_=%_ZinsWS$M}rb_>JfI
zj`#SF2l<c}`H?62k~jI2NBNXj`ITq+mUsD=|A+aQm-(5e`I@)+o5%T_*ZH02`JVUr
zp9lJ&7y6+m`l2`bqeuFrSNf%A`lfgKr-%Bem-?xv`l`43tH=7R*ZQsJ`mXo-uLt|E
z7yGd%`?5Ftvq$^1SNpYR`?h!cw}<<<m;1S=`?|OLyT|*y*ZaNa`@Z-4zX$xl7yQ8|
z{K7Z<!$<tYSNz3i{Kj|u$A|pLm;A}6{K~id%g6l8*Zj@r{Lc6M&j<a`7yZ#E{n9u6
z(?|W(SN+vz{nmH=*N6Ssm;KqN{o1$v+sFOf*Ztk+{oeQe-v|ES7yjWV{^B?O<46AF
zSN`Q^{^oc7=ZF62m;ULe{_3~>>&O1=|JVNQ=l<^Z{_h9>@E8B_C;##{|MN%x^jH7&
zXaDwh|M!Rg_?Q3rr~mr5|NF=P{MY~e=l}lqe}M2Oa3H~g1`i@ksBj^}h7KP>j3{v;
z#fla$V$7&<Bgc*&KY|P?awN%;CQqVFsd6RDmM&kyj45*_&6+lE;>@XYC(oWfe*z6E
zbSTlHMvo#*s&pySrcR$ijVg62)v8vnV$G^`E7z`Gzk&@bb}ZSlX3wHct9C8hwr=0T
zjVpI9-MV(~;?1jfFW<g?{{jvycrf9@h7Ti7tavfw#*QCDjx2dH<;s>XW6rF3Gw05p
zKZ6b}dNk?Mrca|zt$H=<)~;W}evU1BHtpKBZ{yCbdpGaizJCJ`E_^ug;>M37Pp*79
z^XAT<Lys<fI`!(-uVc@yeLMH=-oJwnFMd4v^5)N@Pp^JG`}XeN!;de2KK=Uk@8i#}
ze?R~J{{I6QpnwAsSfGIiBAB3p3o_WCgAYO&p@b7sSfPa%Vwj<Z5(WeSA^8LeA^`sY
zEC2ui00jil0*3$q00;*M3=0bm4-gR#4iXR#6%!H}78M;D86h4VLLUbuA|ELwBP}W@
zG%qYVH8MXsHbOo-V?QR7L=Q_vK$u4mmr4~#OHou!NH0>4P*Yi3Q%y8jk;PgOWn5M}
zU6iz67Oh|#$6y+4V_e8%9z|rDU}S5pWh6*uoWf=z$z~#SX=BQ1CQWOd%xx@rZfC-7
zEQN0@&2KQxaWhtOp}}%9esgSDcBsyFI$d|AnRhaCc!0xsJkWVPpn5lmd~{-ctI>T!
zVSY2jenjnmG}C}bRDv~ngFTRgdeehU!Gufgggse>I&g-qfrgLNhf;2cwUvl}UWq|;
ziLlj)R_=*J#)?#8j76G_gzt?@gpN+vj$37qN|TRLX^~BQk+;~9U5t{P?~+r=lVaJE
zWNnmFq?L<smRHo4W`>uy+LvkYm|NSKY;>Aig_^;bnq$qHYm1z^mYk>Zonw2RV%nZ#
z-JWx%pKGq4lzyOQ-l2BQqIQC#Yx1LQm88Ajq<pWXb(p8a;HQ9ysB^feo#Cm2^s0H%
ztAvoPdz!7y(yfiRu7bU;qvEcLqOZmDuYlySjg_*3#IvWFw1(BRkma<K^|Xkcw~OVs
zn69|Z>A04}xsc1ct>(I%_PUd?yOY?vo8r5Zqr8*ozM=NMnW(>*ufN*Uz_hu+(CWdZ
ztHPYz!=>cJq3Xn|_r#*H#-qW;)7i$k>&UOQ$*9H3)$Gc%_{yx`%f8^tvbxNz?#{XP
z&a=MHvcb`|#nI=?(cACQz2(xu>e9Ex)Vj;m<I>dI?9{~c)V=xCywlde@z%r1*S^o!
zz{uFY^4Q1h*~-k?!_?Zu+S<hW+Qix0-}2kb)ZOgd-Qm*S%H7_}`QFRo-^}#i(bnP5
z_2Jaz;?mmV^Xuc)+T_&d<>ve4*68Nu_U7B(=h^$`*zD-r_UPW_>GAyO-Qw!q_3PsK
z?BwR{;py(=_3!BU@966A=k)OB{qX1Q^6LBY?eg^P^Y-!l_VV`m_51nu|Ns90000R8
z0R0IZNU)&6g9sBUT*$DY!-o(fN}NcsqQ#3CGiuz(v7^V2AVZ2ANwTELlPFWFT*<Pf
z%a<@?%A85Frp=o;bL!m5v!~CWK!XY$O0=laqezn~UCOkn)2C3QN}Wozs@1DlvufSS
zwX4^!V8e<XOSY`pvuM+*UCXwu+qZDz%AHHMuHCzM^XlEpx3Ay7fCCF2Ot`S&!-x|r
zUd*_$<HwLAOP)-*vgON|Gi%<=xwGfbphJruO}ez{)2LIcUd_6->({Vj%brcUw(Z-v
zbL-yCySMM(z=I1PPQ1AB<H(aMU(UR_^XJf`OP@}?y7lYWvuoeZy}S4C;KPgmA5Xr#
z`Sa-0t6$H)z5DmO&DEMuzrOwZ^x^B@&%b1+4gdxy;D7`Qm_&aFCa54qWEAM&g8;s>
z;Di)bI1m*OW;mdP7Ix^Nei#C%LJuUCNa7PF_P|09E^PSWi!i1aqJ|oB7~_pNdN<<?
zC#L9Q4^ITyVuU#sY2<Y~;-KV`ILzRr3ofYepp8dXY2|V=CgEfdGpMj-5L8e>1`bnR
zY37;5%}67JRHEtTo49SUW`-iP3Fn=7x>gMiQ1&T82P8llAe1C@AVQygvcZry-jt+_
zG8k2(%swK`qfDa)sZ&cQ=9Ki#rFn)bszN=?P>Vovsv%G{F7zPLJ^)t#GtxT%_H)q;
z9q1xbDjfu25E}yaAgf4~bU;Ny^RQ9LsLZ0-!>IzP<ARN~$na{cBjJ<8fw$(mYp(^>
z0^k;GNIAnu#U6{0oRBo@u9bFT1ZxMw7SstFe?Te_KCRfHtgXs4qKhDZm@`Tv?o`4C
zB$V#cNV^Vq;!PoJK<ke?6t|*FBlQl1>nIeDG7!K1R${9^<`hDP9kLK~Z@w<G(MYkr
z67&bS{?wv^3;5vENGH|&p@%au!z|D~3Ue%wGmSudaHHu81dPgpbP5cvNr>!EHH|2X
zk3jP@GD<3J==$#2{6R8`It*1($T1Ji+p$1N2-t~0JqWmkKZOYYSWOUy2Ka<Ow06*s
zI{^L(pvdk>Dd4gN;VK{*c<W8L;s8QkcYt^Mvw46u55#K+GyDO}K;94t?dKibjn9w(
zrs7W{9Z>F1-mUl(HSGbafR7%a`}1G#jdCO4A80549+{*=ju7A-xX_40au?JJpuqe`
z!amOQ5QI7ZslYdYjTGV!;4^T;JK?n=-T@ot)J-|CE&x+(2hMv;x-q<0)BX41n_aKo
z(TX4-?|LN29-#IC3;=aP7cC0iKpGSv7Mw11#sWs&T;LA`DsX!@bAc}U#sUG_4tKgU
zmOq{#LT?mG8Rh^S8@OQ(0I@7@zA|11w$O-9Des5rd4hodia-#yO;AARYDo160zB#U
z&mZ_mg&ia}zR&@#UGCdQ;SL8NwiRn|fHR*zTC}V`EJ+!-nw~%YB(f+@5kMUT9mD+5
z#76Y5SV^=4&I+OoJxHzt@4#TA8rXq-)Ukhn6NEr8MLRH5E_YG$$J92LJ9Y`L10~EE
zfcBxocmeT~;mKQoNFX6u;7SF05Qq>3WVVGYaUj6zfC^@*0%Mqi1%TSz_-uE+4v1_X
zo7`d+{eg)N3@&eKB-64e*nw8ys&mi0WiH`3JJ`7@mb9#8-)crX3C>OpW~&B(T7f|c
z)ew-_q@^)%l|KRQ%^zffqzYG=ghExa1MTYOA_3(84jqE>pXE^#2mSHK4#-Xo0#bn|
z3-U^VT+dYwYsEeU(SZYrvje*v2;g!D%t8v2n*SNx&4RFxi!Q4g^mzxa_ExxoRdj1`
z1V+=m0SN$k<DveD=stKwg0I!hn{}JP*DhKM42o=cafE0iB#NP9nL`9Um`AY=w2wc@
zlL{Ag#~7RG4>?VbkP@Pu2>fBZu>$n0;PJ+gNFcK73CNM^U|t81r$hjeAe+^|2Y|Lk
zx_*T34@1I7-&7@#jryabT5KOkjp+|%BrZVhBq)Ho6g|Jn60iWm$0!VC2RXT*A9}55
zP(fQL5=hRQ;sVfG_kqD)0Z37y<?9Ukky;o3;F5B>7?<R(S~xYV@@@@s0U7pzD-lR;
zdSykca=l}YMhJo%`xFpi-vJ3Ww9Fy>C=k&g2%sP|Y9AqDVFzl_H$@eetD#M-;R+{^
z|EQ}IGY|n8>ee}e;K~kva)GSC3n1~H3bP`hg1)%hD@*|cmm&a`H~ldRTz0op7?hJS
zzvd4DdsiTp_>%~>z#$6qRi1lmgp^z$MBJ+Ou&We-8dGQ1<+}JfdPsr`a1aDFoa%G+
z^9LkYs3bDv4kPoR6hV6S5loOljkvPdL9{w#3K!%ZCnHFZ4Z>uF;KPT}g`$%OGUb9)
zd1PBYh@JNF<%_-e%-T^yp$L?OcQhjZ30v?6H`Y9$Ak0lCj*Xs_ddd?FqWRBNisgWk
zfV@g<;R#y+LoLjq2FwM>RX?dj4|ev1JKy9T+XA$vbF@kUQ9&JKaGZdG&<baW+O7-T
zw5nIFluiSP1@91Lfke;>36C<>tj@KrfwBb__}bSpDBOeW(1~o$64$#<wz7L7YzNt4
z+0c&mQJP(#XG{Cq*k-maw$1Hs>%xfH4!5|+P404=``qYGx4PHO?q>Bv$Q9WKybTiN
zcH0}EWKi-&qNFa0sKLAr9T`T^Vvc%i<lPpTcTVNa@Pi<nA`EZ%y(b=(+*aar8fitp
zCn9fxbb!KoJ<BK*_XKcfBnSilHHa?gnh<gQIF17fGeMIm5w{9R<`mDlQMgezJFr|L
zwO|7o#HewC07K}=+s7XWO{rAqV#k>12OBDOwA59@96jrRH^@K+eCVPT`Tm0%wbGA6
zbwZEU)(DFbqC$nZd?4niL`_{#36mMbNfe3u-0N;|o%@|AOSi}<Q~(J`B(dlM(ODrd
z!9g}8p%zI{6dOpeGRoCr3u4q@uab}oz0Lp=gr;4CLd}(`x}X;O=tS-y80sLH?GJZN
zr9Yej1`#BIXiqqhJ6zDNwY%d9B1o`5^jJH8z#f%}=Td`SK9HB@6byHztCR4-CFmYM
zmHTkP7RcmCgE$|sNl=0RIa1+*086MEc@x&(*KZR83d9^---46hL53}0{O*`&?BV+z
zgz2f(A1WX#)gV4>FgV<BU4I}(0`YPC(gCNFG-OZ>CDdYC(Ki4>1zL4IEbs>`AU=*o
zF0C_0(z7%0bS^c7JZtv{BG3tSV-D9d1Fi6Zz;ZV`(+DlXd<)1eLgaWIU_LY80(Fx+
zGT1uv0ttYlFCND&z|sR`P<A~adY(ggP{MvxC==tgD!G#cFXv<4kVy=sb^c&V4%Kh;
zB1t?0NbG|T%2E&s=y4!7aFuXmkWdZBLV;Rg40g~W=W;#fLp#O*JovIh;xs*2SAr-r
zSGU7K{g4W3&?1okqC$XpGh5(T(?dHr=npRiE4~6N=OQ`W5{WwmE64I5`i6;0Scc;A
z1cfk5o>vHYgDF)Qiz<OQt&j@P@;X@N0-aJP2QdSq;0+|$LH*VPm0%82m;~(t2?w%<
zHlu+4zyd^*br>dxbht)bp$s?xIe9Y=e3(MOFnV@i2bEw9J-9VQ!zW~gh-)V&Le~M0
zcr4&3jt#UdHFb%Z=zPW{S-4^h{t%Cq04tQkE2Zdsz%mb)lmy{u2Q@SU35jL0_>d++
zCR<=D``~&6p^E^BbK$dD4kb&nlL{h00)@aq%Af*w1u4up5I3U&C({Tdzyfv<a=N1i
z4^xeHcoqHszyc)j2YSRo*W&{4MFMeT2biD&%fbRc2_^jygbjj%926zWP&cPzT(xjL
zL}`@%5Ga*^EB44Od80BNkV;N64<djALs^vn*a4~{kluHSUqdU8#{!h|gS8L@IG}J4
znU^5}Z%<GQ_yAp<LI%LF4`zuFI0tu>(g~r1Yz)PiT>*KMB`eoMCN3a5`ygRSKq+-e
zI=WH|e}W;3gmS`DD0Q<e7;=}GNhz(+B0<=e0^ttOGh75^mbB9em$_H+rk4J|mIXnO
z3^+S~l0FqCB`hF2dU>2B!7E*IH$tfl<Z@jS;Q~RB1T0`_e9>_oDNzOSa3jM|388QX
zDG=QMc{Fj;ciV}V6cJ{JiJa^i63PH@7hw*tco^4niS2oxjj^7d!CL5vpZ@uu02-hI
zI-mqvpv*EL9E4B-q72QZDy;J<0%AU}gHfXsJD3<CV`m%Kxe<<OpdRWF2ucpNW>CkV
zH{<|40CEf!+5vVz4iicaH5DL`Kn?~X8u>;MozNoINf9n!pM7zoCt(a7`k~1IAmnhQ
zNSdTdx};3nq)vLIkiZVR`56{>e-beRJ30|VN*7gn5|2lu*I}ejI;Lb=rbh}m8JZb9
z$D%(M5m*X$c0dM1LpY7F1!^EGf)F%MpbXVe3AI24=EDtBhbevfr(%Q;kYJ~CDi>@2
z>T?j+2u~1!=8$$A<1mpbD=}1zTD1>_Kn1G@cC{dOV456eTB@e1q{Nq|m=Smu@uoTD
z0)Nm7A|P)#Kn1mc1GzH;BAGRwi36!%LGw@xGk|fu`m4au57Q|NL7+8r!KxHd2tnWs
zvd}0qAUp0L0)iE-)2c1Tl?17@1-3e@qE|cOGpfeX2rWtuyRfdiaHQ2x4X0YF$H1=e
zdZff>oSNZ&tvW2?f(beLb>*ss1T{UifKm$O4^&{BK|rhro3Oed0=BXR%qkc93V-#t
zWwnrY1~GDlU_|i6H;Tfs;P$0CHCHSsb`dy%=4u>9>R3VWvPZfFTM(~FS_w}7$_6h>
z0yc}JcCcWVafJfG4HHQa%D{DHW?#cH3P9Nj67vVPgR2BpFOY{STC=c;$1M`OV}&)b
zaRIc|kcBVTH9k8Kz<?p0Q<*FPU6N$BbOSBwfIm#TF>_dlD_a~b+W|`Yt~86J^fIPJ
zu(L_Z4oRS@lR=BNSPQ^YZ!RzoozQ)~I4n=qDCR&wLUl8;<ElA>wN*>3np+Dz(>GlE
z7KVF^7&#DslMr)igcyc1sarEg21R4kM&3}9bX&K>akogS4Kk|<N2(2AunSbM1^z<@
zwm=1JFuX@P3YDM@yU<L#;0)w23R_SFY>=dXyQDEnSeGG@Cj+qqv3pzpLvweRkHWJv
zGhht(Kqg!_J(xSSU8S%hFgWhJ1*w3n#=?1Z!M!<UkpywN2$6?B_+w@FV*uQvQWGd<
z$tt#03AAgCwksUCi=?9vc}MCD(F3h)P@=F3tH(eB_DTk$kbXTdhayl2sW78Rdc8{u
zJzLrrR%#IQ=Dn|3Lf!yr4zXqW84+5A5B-p1TJgg1HV}RJmngF;V>=L3BCJnFWdzZ}
z4~!cpOb(8vq*GVH21O2kumvTW3gi%D9sI#Z+P6o#BD`z8fSaU_$QSjt#sm>%&V;WD
z;l2GJAug~Fx}dQwk)u@L0`OTBY&;Nu+(Fg45z46o%voVcAOd>-(4PcR3oL|$Pn;b`
zI>kv^#pGbYN1DZ7ETUR00!PYqVGO+$YzJPV4Jmxa<d6#NU=EOM7v7MWBH#^z00vbh
z%d{NJg>cK<kjwMJO9#PdwZje7FgTq+25K;$F3}Hpbri2$%d_mvw>&Yr%*z1c%Ny~Y
z5-|^18p+ZT!ANS!n2g0*?7^)-0-B%=^r8v1bEGQ3#m=A%?WzrIb;?P~E8L<Nc1#he
zz`qXB2yomN`8*N(+)5ph!`xgR-h8CMq5|3=PDfe@S_~+tbfiHA24rxgdT>`{unSPa
z0zqKLNIE*Ld>8moiVm@;4`I-DQPLEF(g%$ucl#*HK&Bo4Y|2SG(@LrhI86@KVAJoc
z3_-B7BHb72uyLkQ)GvKjM(PYs;v_Wf!FwyBO+5-ndOahZ)L6|NN$}C}y3<h|(z5p#
z@k13G>JU!+5@THz=2_NR4IID|AgNHIpo0!0s-k*>4ikzFF$y4%fDQuU0_gD8M4}RX
z$JR#?&>aD!6XA6mk)vg3m;^mWKAIDV%@T?o68~2atRe!D)z-YhI{?C<HL9Qyl4k&-
zDigY!0wOzqEkG7(5M(0~GD#5s#uO~w5nVbF*w_)6YY@BL#6oe~ERoxoopJ?{lAfI)
z=1{A^aMlbl+XG?PMuF5E(Wq_e5c7}<Ghhw{=MQ=R`UiVTr*`_TehR2kQ-Caoxo$Sz
z*}dHbC#Y-yi@G4Qx>Bg-JrmTu64pHtaVK`8KsidsbmuK&?L`IuC=ke<-2I_PTVMys
zoDg3Zc4}12K33p9rdM0nby7!lIThbr_cfgAsbAr&5>W{_V0%dbUAkHbSwon%imSzH
zK~>cW%7Cw~>f*QB3MP)?+z_n8DiH6$*%|f@F%HCCLE;f%!3`o~-r#tUrzncYc*0{U
z_nqJhz8~T=q~l6@YT&CY!#BfPm7WKB$a8szN;;sYNZ=~0Mt&1%%@O)a5x*@EGeEFk
z8?ddQGZK=pV??raJ}j+(=Z#gE8ijF{pe_dguIC8*&o1%iD^aoW=VX-t22a4~v&TVN
zx2FNPHR98M{_uZ2Km})4Ggf}(@KFgVM}PLG5RH(sYeXxJg02AAN_zEx=GBH!<bb-v
z2C(u6C+icHtr0*=Rzph=l~7;4P3Tdpl24oGnhQlXc$a@J5Kb!)P&?;^g>ipiUTmNT
z^BcM?5$q}9wO~6Cg|H9nbP&!kIO6jJxg{aAqF1s43{S}hOsh4eZtCu_1-!(CUU(1<
zECRYvuHm>w_a~EaNbP4njc<GG59AZVtr4S(xQ0UzWIzSi4R<6!k<0E-m1|Jn{tlhe
z4=P|buIfzqV7Vx>@i~?40-+2%^E%4^@a;1Z@hLI7`%=2*-p5PB?knUB$f#onLX5`9
zL0sn#%8cNht?%s-1Y2MZ$b*r*h!6o!D=w&;R2*G(SkvFz{w&zWsL{=W5CQ4VjYgzX
zsnJM@fJiCZNRbi{P*GC9q|zbbMk^plNQjauDj*^%0<xF)_xCyHj}zDPoa=t>=e~EL
z9JtKq-dY`5yZP(jrf-~od)N=VjA2fU{0Ugid$qrEds`!Xem+1h?TY;o^7st?^GzCM
zKlwYE`vv$72Df4wk-cpEkmJzh&Yky2E8?SXtR!i%vl7+d9B{4}G0{3HT#Bd_i~+9=
z?;pNV>$`QQHxC6`&K4#?u0%PLD!{>{-K5ssQijx;a;i+jz7u=@<rlw+1t^USwhZPj
z27*sY^^^y#@FrtXZa(xMHJgnf9)0<^^o7W-L{ZXNc18Fx&+3vieRUIq9TqD8ePi|C
zIh&DGA#oeUf8%S#Z^e1nUb9m#!1^wXSx(8u{Wy^)kAHnZhk5?Qfl!&Ye?^@qR|rXr
z+_FCNldA@4?7VBW;&0ZB5)b4<H|F20o8(}PvcxV<ZJ6bsb$IHtF!j;ANWu4}y~*I?
zp?ex0Z)X;!KU<X&l3B$s&1~9Kn%$N4U7Y!1S7r0q^6{nFuMTw=|GRHqK3i+_)MGG9
z+~w`o#g@yn1xx=0g)FpP`S|*=%iNAzcZ{6vOwipc9#k>|n}lnT51jV|d5yS)o$VSD
ze%^HJ*z%%}>PfEQ@4_00<0DhOxKP)TlG{VKc-3wS#e{zx&3KlgOV`wFx;&HNU=sTN
z;F|YnCJWmc_oaidp^YuWlt`IyRJaQcEjk{})QP$C@}=(19fit~sF9Dxb;X@OhbAAZ
zJ(2C!8vedI{GaM_$Nx~&7oV4x=?S&DqW*X=lkzSe%Czyiror$VhJX+?3?tMC)NK<O
zl`?Yl0j>RA1C%d^wE+kB@m5WTkjzyhutvVrAk#&kH-o64mLJAK;^8y~e)CF&nipPM
zcLvZU$f+v!)cl4Kp$FROnd!y(;b+BFn9FMyg7u{sH*4~DU&-XHO^wPm7VnLfYknc6
z+e}8<RT&S6a`vhHyJy#@_C2G)QujvqnMPd*H@krj(~>?5y-r5?eC9W#%I;(>*ST~X
z6SR@N^#zx}WM)d_WwG-K9hV1+FPJl&H8Z&vi8K~ttdH#Cto3S@w71KgwRbf+^q#pP
zrBPohw#$ff@;X=JVCC>YGuP2c+9Imj_m(Elg3Ikzo(fBQOa(e2|K%9^TH7u>HE7f=
zU{RyQExparBc$<C^}O%f_n=voKOYi1u-<6OVWXLO{0|GGJbT+}E*-Tztxpa~6ZS=(
zagd?wFe$(J)M-7;7elXGHt)PvHQK{G(Z2a+GZ!jsZT!%@y1hU7?wG0GBjn$<z2{r_
zIVol%SL63W*^LWF8Y|ZY-dI?Q)4aEY>-|)u+6rE}hJK;f70V*O8rK#-hdfFBeHhe}
zf7z#b<dy1CaLcq~TuAdX$VKDF3k7kZ&%d=Dg?9f8W&R?v{`Tk!6~Y@I_BU7JIIPXh
z+92~DjVB0wQ|s&EkH!q+<Gt4A(R%~ul(B*llLox+cQ68seJdPx3+3!W#@GK{o9CDQ
zx6ke1uM;)q7LXMFOp{Q5Kg%`XF(!TqH<I=KG>-E(ZQ~!h$KH)1UqRg6;fUR8o)aN_
zDSsQ*^R1mX;rM*l#3lXRmvcY)OrJz~hJUQT4~ouOaY|WQ&&z&MJs#lnV$$1ZSivLr
z{kxOG9zbN$d^oHGbjC-RAyAIYF2n)3woZkpe2V9?x1|H@&3aW_+t&LJ&_6I&CH)T!
zcwOcxKcF_5dfEj3B_c$yn~)Pz=>_{FZ=$zlop#>ZGdgNMU#aR8--ZnaXs@k2Tr^?T
z3C_ajq-8NZnlrq9*_+FG%LaG`xh2gi$-TCqkCGo5)Vj=`DYJ*uphlM}7!PLzZ4smP
z3kQlD*0D!a5O*LsarJLS(#huVT_5%&n{ET>-Kr!+kt&3P3&&VdWOB|AV5ZoE;W$%$
zjt);adoaP`Xp_nrm7kQk`sPdyKSsDV>CqPpc7<W}3h9^jEEe<OMw>7B$NZ|zO;$OI
z#MZ<|;=fQXvD)cBx=L8LXXFf*S;f{{g9y2F)Cl3LK6GiZPm*Gak~#>4b=5Nbqmaxf
zOV2P-)Lg{U8&HHch%>WeUCGx=`Rm!dBCxiwUS748ssyN%-D~;HTEPVQ)g~X<LXv_^
z=hG5uDHG4N)Y<Ojh>{^AHo`{G>MF9qQ*0bo7zB>Kdrozekh3p6qQO-D`j|Zl`V~di
ztFmS>b>1(RwK0HKsoQW6`qEb#an_l!@?R>!+N)ZDb{_X;9&0-2uXN5>IyJGG*LgB_
zg_%nGk+SvFQ!t5j$xOSAMK+TCbq4{T&a<uAQi>8!Hw54FIdAu1&Hg_}H^#t|vkp1`
z>}!I3YV2(O%+W*wD7SQiy-sz3>G&Vl#4lptPJ)!|w|B_QFCUN*e)y3sYb+xKYXCO{
zQW~3DDsh;z>KE}8$4zXESeS{$6(pmnDUZZvc<>e9O5<f%p&^w!^y>0sm%9z3OdK>b
z{Zl4%{C+>f=732A*4AwUncP0~@hLfJ!EKjyvupKN$UsvNyOT3ctha)~)O+m%pmMw0
zRwtPy^iEkaD}w3hBa|H4=pmzBVV!$G$mVPG(B4nuWaN>>BCci#n0od0sK~`*6;m&#
zRibAbo+kg-^qvu-%!dL1$c{@n0*?VyF*#zG6#yvqGW8>dksVQ_z>yIc3Xg}x?t{@z
zuV9L=QJL?J$SgVZbp`+r@aW6TBIAm%M>$XOA&|8*kZHkFyY(cM7Uyso(jdc{VMc0_
z50o+56n}CxhiQ-nm{HdcxXGOh3CQ3ENT`dtf%)~tId1!_6C|2qiJJx(gzCiSQo$mY
z7qTGhp0}YK&E!{gn;`zgA&uY9_{YMKSD4dYLy$00zE$7wCGhNq<S$Y;0U<L`jt`bl
z5!HA525tPy<+q}&@rVqUA!_nC%Nxie4bvox%3eSy&Ba*dul8~eg#PQ0JL5BsP^!8o
z^en6O@sAY}3&0Cuh;Au^fBj4l96+_1w!0%kLS_3psSGtR24Dq%03^W=4cEb749MF$
zc8m^v9!VafZgAA{GXkckqxf|eApj&ePh}b*Cqobb2#SLO)|ntgr2q)5jt72gV=h?<
z0+u3^Fp->Zr&3F&M!BR6D>9JujEHAaBLRr8aOR~r(4j;s3*`hz*Lr}DPCFQoc8`Ri
zHbJ78VTktbY2CFHq|rM#VtzB+Y+oA$P^s5Tu%wuN!P3ppcD;hh)wYR`?*l($L;=h;
zs2&fv7yRh^Q<uhQeFJ}2qWK=2iwW2~<^d!d!~pqEM5qCWsxy8pgc=@>@mz;`0Wet0
z0aT9!n%Et>&6pn^PQ-x9REPQ_#=|U^z}pUL3K};7z!>uZGAmDqWp_3n#MJULDK3*(
zf*ZaX*?rivY$MFTm4DShNZ{N*>f2^l4v9h}utuAb!Ao`!a`MLZZu*hI2sUMJ*>`8n
zX=VG01qK>T#j`sDWXT+W?6SDa>wkRnjAa)4srfUx?cuxbhY-@yCD3t@4)gr8QY{@d
z(Nx8VCbT^1k5Z1fOB+{Ek3w9^KtH%2LOVGRfSo}XMRWW_mC`FZ$cb&A@-%BWdxU=C
z^@(^m6gc^*2#yDVh<d(WU6DVbR;GGg&U$G3lH_l#pcrk)mu`?o3MYbeEUj%cs>Ix(
z&nzj=T=fEirH(1#!>dv_xD3QF@Zm&2W(f$zchV7JaHKPE#gs(W%E|xMZ5P%9x~G1x
zOJ&%+!3D1j%mbF@1aP(7dYAT*xgt1*2D(b(<LdU)>Q~-?vB~4Lx*o9u{i2nkm<`VB
zRCFl{l7-WMF5hRtRifw(g<J*T@+hP{3G@cW7}hKQz<_b-MWRw0xU+{-2E~lfgS^p(
zTqJ`JKp<2@AV5;A>{pHKX2IhTWvyDrWFM~X!De!z-Qd`}7lF<lk{FbBevXF>N^rhA
zE6&jGcC(MGF_<6ZtlW<mdkWv}wu^jh8P9ng0p^`AETN`Ki5hk0J&PSU{jh3-L4>12
zxo|23h$g$>!3@M<26=*8w-H@GEm=qj1}!DIbR<iLH91QHh?OKF28wG2LDG_m@(?hA
zk{{nP2mun807y<!AQh4rPi9C<4!;dF-9|m^X0VJVK@sZrl@py2&z+-T5E97_lf)3M
zVSGRi^wtJnCT+*PLJ-XE`k0}#8y*>$gqsrXx0n@+rDh$0l+*#RWS8rC6<;A!OR*Pm
zHi@brq>DV1Bx6L*H%DGl_phbiGay-a=>QlKXY`A*JYC8I4egDj!C;^uF9}wp0U|aK
zNeU@JFYop1fo;xnF>3<qfRVl8uxmfa(=;Sr2S5NwjG}jg8XyV4@}R|C?MJ!LaVQDC
zsiKb}(eF)bAYP8W-dEuh1(Zm-2-1MMp!plI@en3W5S6kcXb$Jod0|))7oR7LOAA~{
zp+v(?!z2neA)||<?ec?LNg{0cu5|5gk^#-mTA!yg`9LOzDA_*I-@+Y};+}yjoJM(<
zT7}D}(2uqMZNLHza_pk55S<Jcx{{ePP;_M!qY6qt4FIc8{>mubHsrKL-o1n>r<8&{
zZxt6fgSm{XTCFEoZ*YeO^!|&h>pNd%M@-T-=slyAf&xg0$v3<@rEEr=yqlo*%_RI@
zs>m)}1(+x(O3@(NbcVgb+_-DkVTHiTmNt>W^Q1f_wUBwpzdBn6fhkRbE%67OelwWS
zJdEM2#YC@|or{2+hLNady&d-PC}}n2%se>a0CIgZNgtI|I0Dv*o#x53(>AI&zGN>O
zXm9clt+bt|m&5o`f2Or`%2b#`+mys$3j7sBo#qZJhv)RGfUO%zLHtfr2Ieqg5~KjJ
zvH%jd?pzTiDQ>{T(tyh8A-#A2;Y@a+Ld2q#mGEG&I2?`#m{%q&-0qmo*6;Vt7~XjM
zLm?5YPKs-O0g)u#6-CJlqM>}9`C}+(^ziB9`jSx!l_xn|GYiQC#AyKNR4XG<p~QR4
zdGal^iliQ)9wY{UoM+Q2GzwbY^1rcDBMapc=kuxZffh^_M$UAezvGVkgI6*K&9q9R
zK2Ab3fJpHiM{lR=$*7e4IT3#H8*L5ak+;&mNzk|<L<fV>fpY4*Zf)s{&>t{C3<(U_
zrd#9$Y-a_Ak&OfxRifqcHd7NaoSTd0HE+OX4M+@p<UqWptasA4?q|eZ0Okz95e~Oi
za!UKVwO9<;OaZ7VNvt0XmrrED18_`}ODXB9MVAYeboGXdQuI3zKe<ylC+l2}-Ml_5
zjD#Ms%Gow$Yy~++l6-#xaC|E|j082HFyKk|EOL4s@XYdw2R~aoeBY)Ug6+9UxjGCY
zE~G>^Q?z)q@3w-SaE_fk>AuVJaT!#JEBSkP2farWUL4^xE9?ZLc9$~&vdoLj{EL5x
z5D#|7R2@bil=6Q%OjUR7IP%mX>cEr8vA6jzpH_6nulF^c_S7WKOjLG8Y!lcHKE!L0
z0uiucmt{rf<*VEPB1dD@2LSIj(S&mvI6ayoNU<y=ur31<<qT5qeAhJ}2rLl!$bdXh
zZ0^q7G8QiiT)(FN&Q~4OtOg!YU)|P#qUQ6oE`mMJX9{*&8|C~yXW{s*6K1U}gCfap
zbDW54Spt^VjYt5W6BsZ)IJ)@J%{}=V=jU^2rC1xvCUjijk^N-yoxY?S4cPJYrvmA@
zQomEACDLpr>$<wruGuk4R;SNXp3%RFPe=Hgh2|vfw1QSP2+X@?h-jFlJg~=2x^3aH
zZj=K>krek~j6uu8aVdAapU?S1!BjntieYCe<exAKhVcqNSU%56Vqbxw#`>VL0J0Qd
zmRG%kS;?z~z1!CM(v@t-+RR{_BhE=G4LT2UZeplPu?aQR#=mEebgHX(F1a#36YmDJ
zxjnt+2*%Q8FO0`40c>~+w%xZ7q8Y5gZEEcKeOF&C)f|7W*SHkar-!#~y3@oY($4Kx
zn0wg@nKCFgKoW?j>_>k^YAS0H=z=L&zdrdKN+9Nmf81}lP7&FXn3(-MO-9`+&ze*9
z9<milIY0hX`Kc|lJdqA<Ao~-~U*{%4=RJ`mBICe1=&Xk>Y_3mVIn#wq3i5~*QxN0p
z+TPZ1hAz-Ee8P)-=;!9Lbb)_|X5qjBB!=Y3Gh1Rv0;@Bi#5yyY&ujW<-+gQeqCQv9
z>VRPyV}j;fP@Xxn9Yo^=d1m*~%$x|}>F49^IS?Ye2mn(lm)%LRkBQfXH6fB8Ae}nc
zolkHiyNk1I2A{v}VWOoeMURvrn4T9UaW*uEA!exZ{6T@<<Y!iVuqsA8uR4j`h6t~s
zFl*h?Yee!|!<8NFpP%T1iRuoj3diqP5v41j%M02cPB-NOelwNmN{Tlixdbf7c#{BX
z;+@)VIxK+X=;|7NL7Vn?gYG+m>C%baxD5I6Mb5z&Qnl*ns$TzX8y4_>MHO<_7mA!*
z?{FOfh$OwY#zi|Cu+mVXq34}Ub;uJFsD@LwR+|IQGrq}=%c>V<Bj)`1$Qk|1o=_6c
zNigK^r`BC4F5uEFKL2Z*r1P6emXi!_RT2pekSG!VO-=Tf5@~}Hh?v)6id8B1Z8Kgz
z2_DtGb*h_XrI03XoPM1M`W~EQkGyNs_+RQx8*k#p;(khdLC+m75<(r=nKcERLz>3t
z<>Sr4KT;BtFAOz@D9HejXjq+jmrjIwsA|f)ych38Lm#~Un5o6EQaK#)vE{%g^nL3X
zT_+C;#sf1+*3df|r>Y>^1q%gC17#6SzeB!_MyiAuUQz0P7D&AcF?9^j`3ml2n1Oy^
z(4_^cL*G60bNJ8|rSdXF3F2ir2Q-8Nda`U-xQk?1DEsHnI+?08_!Sa!L_jhto(s7g
zme3KFFtUsM92WBl=C(;XrRa}J+;US$b^psvkxZJfO}}JHxnZ4ZGoLDkFDLRB_}~A*
z+LL_xCuc4-15*=)<U&9VE)p(&6UP?yoNJ}u8o>t3^2eTHqv}cl9-Z474-I}|+TMYk
zO~Dudw$g|g`PlwQV~vNjCy_+l>|{WM0DM7w-?Sm>&UNM_YRKM_!&}TUKnD-)gRcJE
z`VgwW*$GbrW^@?ts*oBhI$h);GY{7xEBYxjniERKVbj*dmMGcpD(X*2ypsoK=riff
z0Q%vlbk(*fBXIpY02vk@!qkPI*k{&UTSv59CY7WSA?(&5+q0K=i6D=&=Y;qkM6q6T
ze3oR+D9yc@T5pp7u?VD9Rg+n@<;r_2c%dNF=8~TkGL(4EwlVQ7vheDis}r(b-qiNi
z-=yXU(qIK(i2#^$pgAf)2^#=9vUq1S$1+I-kygPAO^*a)!aIJVL^@ixj-1^*{7!UF
zljZa;#f2S>XDx2f-M`~n$$G|aa$4JuT*hHk2e3j4ToNdGuu4}==-A2%uxuEQH6lT4
zVW+XDOW65c?J<N;Dc&SR-xOFn)432bK>n;O1h>q5*F4Qis*50vX%Bh#URZDs8tdu=
zOtmWJBH8Xi_Vy76WUZ_!+02p8+4#8p$wKZMM^ErkD?fN2fDs8`IEPHYE~YOD$*UN=
zxr-f0<6w%~#P8sSG6dAZw>E!>j^yA>a%HL;7pv`N@#U_UbC()1LY;$a`&;F3Ks6&|
zKkDn-A!jLt4`6}4h3YJQ4|nFMuM*Sw0#*#~(xx^|yln{|^Z|gJS~)AmzP6DmDXOHN
z^+em8m5l)cNXpj-{gM69jg_|C`u0bTn6^~|m0hAY+`lcR6T2dP;pr>oewe@Yy~gZ}
z7xq$8W;?|>%#~*jPCAYt)p?(1YMh#XyV%HW%{Tc^^HhiAj}+?#{@mH_@^0t=q7u6Q
z<&pu2>P@99I}fgW+nhpQ+EaE@RJ;BVZQ|GSZ1URdKj;bLl@smQThAUgU-|y%vWf++
zQJwnpME7RS1Y*$Z?6R0>ZpU3TnZXO{7F$0)=^X9Qorg(+UFF3lb6<+~O#a5-flX}|
z&NEEKrmIh-irx>vQTSlSDF`3?2w}w=RS4|$MQ!zpbhWh((QKy6(YPD}QbX*Hk-&m$
zx{h%^(r<N~oRRxU=WVKVP0UYRc9HVS9Hx3h`rpU7W|29s?)VDu<=wlin)>8^$k)5)
z;btU$cEPH@{T8C1T7I*7Mx0l(KpWPTUBbp*NPVr#;n4I^U-R&9KyqLtaO=TcMgQW*
z_dX?8KY5tqV*<~_FIuy`>Mnxn5?Vgpx>oVDZ9<m3*pHGA*0vE5dyd#(iGCQ|Xe4!V
zT4vz?wD~1l!DqAVp>Tc9Dl_-6Y>SoNI(JJp-&5z&NlBl5(!zE7=r7qC31T#u?otCS
zMGdkFdC3!~Zf7ChY7Kf+`!@>qndi~r1E+X8QpT1F5xiiD^8R|Xz?@mtoUEtb;>e)I
z^x_p!|0r$pmLlzmVj?~m;gx})0u|EyvSM@ze-&J%ZCZ`6c3C(_l+?y64h_ymr3r1V
zksJ}F$Uc~#i?z)tGxgvnRB*PEGNElMy=|pO5W||IDrRtC*6IfN)<IA6eM_T!k@(*x
z;^jSUi$T|s{_w1H3u`_51Mfe9BV!8JV{gqWS{Dj*ty{nYiC?VBApfwD;=)_gWDP6g
zR9e-|)x2bJKK~`M;)%@R0s5hsjr*&IVp7&9yKlI@XqSNczC?TIsM<C&?Mt6R=(k?2
z?>$amDSfTHKKI9~e>L9TU0t0{V^SAee93$le?eC89MV2b7;?uZ;>^Pp(Z2Vyc-t6{
zjew`tqjPy>mhiig&uaB5_DjJ9)l76Qfv=ZFzhr-Vd2}VG(v_&X%%5Qa-OmTHMT>Q8
z%LTs^NLzCB&K5tm()>PYr)OVUd$XYwa{i~Wcg?DLLgX6biRp}_%zAd<J|x~Ah5lQf
zn9Ukyz$;A6U@|@h!CGn~%%!vSwmxTH>HyHmo1_!y)C;8Ju5j*GD$iC<y0>*>x??wv
zr@3nITzKPc_hTGizvPfY?p59#jHtkL)sRY4V`i{&h2Xm6u*TG#%-tGO$T`Q`+Q>@t
zDQvQM(Y!$D7!h`h-&7ROqsPm~k@j6)jIpI3#@&EHEHk0SFzh1M<9N0rLI#sF^`3}4
z2Yee@j=135%6ba$RnJ#&(EZPh&}sF!wr+9Ri0V<dy{5w6V{!S!vtynd%|%1n5{h}%
zW4?;b_g=?KC|8`dAih!zZjdpBI^-p%kLRi!s0)9s;ip{>4nnUaP5wPzt-4uhhgqbV
z=(z%Ip|AIZs{;%<?4L~B*lR91IX;7j2v~F5Cqco&0Y>&=lgWxLWvmQU2ob3_w@#)D
zkdLc$85hZEUM&?OERrUAQnutv`xOE#Urg-|tyBiWOnxoutF-O5pVAiH<rY&r@3)!6
zkxksTI1oM2Qm6>jD1XAeq0-H>!ir-go93+~rm7XNs$^@;Q_2J3qFnjc7q1yxZjpfR
zeblG!o3);;qs}j1(eKBn-(q%|hqGp-K;*>9$X9&HN^Ngdcs6l?W}Ip6J+O=$9V=}0
zD4K@o6x^lCLFM(x6U>oKW|V4M6R)kYk&kU|{h@XAr<ID_vHK2BD(^;>{K^aXW_xKg
z>WSZO_z>r%GB8=Jj5`V9e~x&)eSuM-y)n)gE)Q}zu&89q_dOS$SL<r(*#^1K&FD{W
zXIpz+&Cbog?I%4o)oH<N`*s_MGHaUMmYtI`LwShTT&<NDcS!1ZzswQGv}}{n$MF8!
zz}YiRu#o)r7bpMZvOa*iF&nI6Z~mcmPllGp{0eJdn(tQKKXTo4tZW8$Mq{vdKFrH*
zvLQujXpXxpf9d6+fpd`$H4G<ZBk*n5f~u)xZ<%%e?~KtMN2Yzb#MO;z$d$3yt7I0}
zRr;@ahgX1NvhaoVG;OlG;1HZO)D&hTd=V-ZEgm29;1$;IUJ~*lS>d>e$v~!a%uiRz
z@B{XV;1!?NfUGPM?Yu;`eAw_6ON(MR`OjH1e_t0Uncfx-cTMdUWxA=WTz)zDEy#Uf
zoURqp%QNn;jpUemnyYLg^f2JYInT)lC(2c|>6gO;78BmjIt8lOeqDU1IR#?AQgK!|
z@b)j-X<v%U(+7O`^Yw=`r2G8!{w{{?D9%0}rYPeS;TqR(x4G)QR9h-6y1s{Uw_K13
zpI>>h0GZ&RzvG$yZPaltL=P0W^hvk9wzt+NlGnJ8>Y~>5Z*2!Vd}Mx5O6>Vre}#!w
zeSg0ta(+$djEfU$g@>~v>yPl`5UK7}R{yBl!B2*~kt%B-C&(cBwWtBcYF&hW@Gx_{
z9q(kl5h1EEGQFOTf71O?7T(bA(VJ5=8b7^Z8aN*D^ykB$-JfsvwNE6<?l<sjZyKQw
zbLa4^l}bHdh)vOxWjp(PFVqQ4wl!K}s=w-akLC>2H0I>AKkYY+7`=})LAl~n22y&q
zBPwDhS9gBzHT6$!dfGb7miBl4?D>9kIrhIdc4x>{-j8NijQ9LX&s?(ybNp9pESmo3
z&&!F;O&xl>_D8{YsXImg+0Ry`2$0kbuQGnWdL0aV=BJi^!y5bIUV=_?<%fuc{@&V0
z7>3v)shYsFM@j2751C>cXlFJ@geB^9_Bf%xOXc+bIy$6eU<TqSk!ycWL=)BOlC#g1
zF8%#bn6VTmaw4MBV6*Ho(u3V+RfQ7x>#G>l9yKsrW_-qxUp;X25|#A3<OTht<bj$`
z@wVg?o!^ir(jyX2`HwLh%u@<!bR%Mju|;-<*2Gw%yQei1(Uj=xiOGVl7=&T=t`<WI
zFojj5Z0@1q$dq3om{%I$FJ{P819GsyT#JG6Hvk6*gGkmSg-rx2N+{?UlRfz%W9Gar
zBi-<fH9=hLm9BChXOSDWfh@sdSf4|P;R1iB+3)rAziJeU-G@M>k{IqU^4(v_XwgUV
zq#zDQ!1_?Z0gQem=~Mn{jB<%jcR%Z4a)lV}8N+JK0XBPOHDkjOO9T%RvaM+uN+bGg
zv@tv%4rk1qwm`1Il$`Scv6HX{s4~wE04X)V{I+y3;1;2~RH*#44;TAOVfD)l_zlTK
zg-DSJ202__MTf0&Ibzp>u?3M#{9D5O9F{6Y2Huqv*(8{RB$hviAiV|YQug-FAMKPk
z6|(hE(iK$@@YbsveRdDRuMP6YSE!j*5Y!V3@qJpQ6?#?PD$!=*-Thjz^epYZ3dOoI
zrV|if1EG8qONcg*Ex-NQu<X%FqHq|5-<r&Bvx+Y=K-p6?0^qDO`m#LU;>QHhNOJ>i
zPc9zs-v~oddx**XhX(qUQ8_u%_xp|fD(zIDS~ctDZ$))pduvZ^=upg1X-LFxfIE^R
zK9r5%qG&QF$+~)>zK9L3l4Ov??TcXcNLK?yxle<a{v?(#?-|rx<{^XBcdd~6jc~}F
zWJb(NR^cVcW1c!bwvOdBk`OT@l(pfp9&~)NrIG+77CBoqG=La$K#d290+E>>uP2#_
z`W%S9Ddq9$qzoaLMBY5eU9(V{<qgluZM`vkb0njufP@zheZUQyr5XRkI^8ee>tw+F
zPuAyC)T&6rGZcrzb?a(CFgR1AMZa(!G?J4!Sw+(5_$a<+z>!8}79*Dpd_+5!D=k?U
zcaXkep`w~=zOdU`X(V<Af+)p0jP<`V$+aG_GyF3C5sJ{uS!V)s&jh?SgLfn3t(WYt
zO?&`BxFbmqxjy16|I@4UABbdCllR>oCp#AS7(PXvTf`9uz2qD>7zt$ye+`^-tyOpW
zRr~VPRDIO5yp?mwj;w}%ZN`P<-x_REnyo9VNEPa=hVAjAjNITa3ZI-PkF$SNTGgEQ
zJWNz9^<`g$_)C67`U>6X`)I3c`8mwjz}a`C2&Fbc2QRdki_X)S&svCEJA5JKIZ0IO
z$yDP}XJb~(RdPspdy0N+&gUFl_B?IB`;*B1+xQ%khP>x}N5}&7viH7Z$iG!vO~~Li
zlA1Qz=G=fJ)HhI{ZOz)D1o;tf`dE)D8UEq&qn*n!zW~FU3_WGh+3t}?`hDWBsw?h8
zD#2?vW0(1Ppkc@}R~4%eRldhX;$ozXt0x-~k8GVapLiHQakqWq>-8k0t<O(H!f<8m
z^~MEmA2Oc|h&_!qrIK{*#u@&xg8D;tHx3rM(74CnM5i{%tR&yKsJ^eO)p{e~OHVNW
z?N!;_3_8SQxrsmvENf-Q3iRedc~SU6)mz7tbhg`v2G5buF8AtB$Dm$JCcXvCIyTv5
zY=$ZwVpf3#%VtVk&d}JWc4T~{A(M&^6U%N&2mkF4{&LxX`d|F-J9C&1H-`Ru$oI8%
z?JlF6OognIlr#U&E$hW<z;7NT`j@>YiiAwM_$n8V74!W}!nD5rf}fYrUD@=N_0BXN
zvjvNn{g(b<U48cuQgE2q3+672eO;(oUF3+-?S^Qj(FE|f43sIi8%TO-)Pkt9+(7l`
zIyZRI>&>yCi5gSq^EEzhpCs!f230oO^@BUU`m?{uVNtoISXoYJAlax4wd7ia@UT*!
zoXbQG)Q?H8wdt=SpsPF91xQ1t#z`J!dfyuIa&`k*0Pu$g4AVa0bO-*^n928PeBD1)
zYhzqfr3@P^*qY+ItHlNOb@(c-`da+!Q~ZT{A76#2*w?*0;eGee>h`_<pWQp}c)mVM
z{<z-4)c)!7L!aWIMMj6W-=5#xm^R)<oy~m_722r})!5}VR0fOLC%#VuUMNbkW&~mD
ztd6>~->E)JHhqeOn%9tUev#nuEK1kf_Uk>#@f3ax1#@PBERb|6pkpYS12Fkav=|4%
zR{-5>JK(%2<|5mXG~kMD1H<<Th>3j6<W{sY>s&VkW^zj@(ptO&|2Zc!*zpRSi-PFr
z*IFSVTCz2_u>(8}cp#BrHU{dV13zTPZ<{{dV1bSaOm(zOb|^QFA+P>yI5jJ~n)m)b
zlQRpGP}aYb&@IIP<ZJwUDXw2pHQ&=4@rFAahXx-N)BgB{>IFYNcmhAH`9A+jLHKB!
z<*xzj_T*WMUEYbbPd<_c&=7BXiBGxs(rts=F#=j=4K+2w_4f?~-P8Cak{;m$;Lc1M
zMgwM=hQVi(Dq7^A{DzV)JDv9oqHij2n_oyge1-(%f8oN$vY1X_qt{d9P4#z8VvCT)
zyT+>|WLNEH8Tr_yABVB8<@FF}Vy3cEY?&P=;B4V)*c31Mq3@UcdKI|2tEe2$j2Sfy
z&y8iEE;WxnR;*GqEVT%~eUToXPi^i31T>u-qb4)^R}*=gQ(CpHB}50bw<2`dlnJ~o
zoj-yJB%H2*vVmHQ!McDxuVJFDvXN7Z(V4>YUX{jcGn>V%9DYk2s%2B|%4UTvX484s
zDQ5%^Ry&#RAceeeSs!~c_RZ#6ESC5C=BuYaRV$7Jsf;;V9`;-Q-mt1sutclao>9pn
zHnQj-7RGX7oBSUVr7fge9XwPVt>8Rb1{?t#Vk2fx^lNq<uQ?XBUM#uhLA<K6ugqA5
z|Gc#IYUkPLZ|U(v!Ar|3?w_yetH1j3wbg^JLWH*w*;GAw+fMCSz0S0G$*Fp)wR!8Q
z`k1u&SgHCtwfTCe`uWq_{I00_UvKkIPz^|J3&>WzT-bKGL^bfgw!mkqLG5ipFI0nv
z+kz)lL+08-mQ_PPw}pOJz4E8+3SBh}-X6xLc9pmNDq1c4OnbPTT7+7Agq~WYNqeM~
z+BK*4YaVJ*{_Rm$)UID|zn-8Lo!TCqtrk<*9#f(g`(JzPGqt$(_P7^n@x$%$6KXf+
z+HWkY-Td5s^SfHYpY{a08VTM(VpAvcc97BPlrtR^IrT)fjzm56B$JLLEA?cjj${w@
z6#tHtE9$A&J5m$W(^5Oqvej=T2&ua2i*<vQ^VM%pxM>gc;|=?``9PV|(Sm7x`0nW2
z-=imgQF!^tTxq9s=wx<zf*^(>iRt5?R7W2`aHeGT7P8c?`rSEKt+5XFe30_7y6_l9
zkJ_Jp1d&5&pk*Kh9)u#N&ie^Vn3)dA7Bc%J89xc)<fCyj_Z4z#q|Zf*)peExxjqmi
z^D-xvdMD~pV=@J4;s+3AQxGo^Qn3EF#OkoO8k}jO|3FT&?9B60Cc_64VD#icxwN5L
zq=7EVu)0Lkpx8idGZ9aP$T9cp<ZBWuHESNk8Z<nwO^B(Rh*dittZRonX6rJb_UG2>
z^UH(e)HVK_?kM|1VQ20WLuh754`gIN*DFqJR)Y%j(VDIsJQSqKOdh1@545r+wF#2T
zlnhUgIj$qSi#=bfx*e49g2Jw>(fGMbp9(?a`?;gZ_znGLb5Mr2L2)g(S8hO@55&uy
zBq`r*;0hM5>v&v9keh@EZ-9t0@%>B#{nxb(OtlC7{|@?h8&0ZgAN0#lg0jAKjS3oS
zrGYC8K^eo4g1L_3BS^<*kTOEUAPtg9f3Am$8U3s;mPVOePL$dO%Nc@|cPUaW5aq}t
z{wlCuRbM{*_<uqiI?8E@Qp^Sfpobly^Cn1ViYaMI>C}#|XU4AQ)OHWg+%N8Wx;7EN
zVIX%wKb<M5NBX%ssb`*PKyl`V95ZxgxL>+b{lkm++aBOMf;9PjG8aOpa*iG?i0IPG
z&_W;I5WLWLiUI4jKr)%)s^&Th|I^C6t>0y$U%m|KJnH{49sTvpb4f&eA6wF9UN3vm
z&GNb42mi0@(fe(#qf%5eb6taX=0JL0t9Rn0hY4Do8n>^dd&}x(xp_A`sTbdpD0SMR
z%{I{D9b4W`TR|J1o$u7EOc1Qn&N1lkFbC;X9$^e`bhSfphH+}to86qxxd3R(MdQj{
zE&qWLjKg*V*7hTt*MP0@(}M@|L(B3MFr$EBRfDjwX!j!a{Hcsi-_14DYs%07qAfIJ
zlPc)UE~xMR$DMz5-HMxbv6<MrH#cO;f0dAF7<tGQXkTqt?bsU2O%HOccj=7!b;up;
z-01zXKqZbR<Wg(ULff??o>14$@H;red5J=+gk5)*@@WY+ocqbzT~Ba*#``Y2RqQ~)
z{HD05yS)PU^+|+I8V+v$XhZJtotwF5U54uJ1+Ew6{JZlsV^>jsrr1UBuh8>lyc}xv
zOJY^_T;+hpKWx(HXP+mujb#bSe>uPOM<f1@x84+vi`stIdHv6caD4QS^_PWg-;5gX
z^qamjHOtN!<uA$m@cmJ`edV3F6CAdCkB$tMzn!K!fw!yHO9!}6WwpBo0WY8+<}m8G
zam}{sUD?>0hth~kS?cRK(@bY8WE8=ol`y7y&7ZFE>_dFM#dn720wLY(!$K2ra%@+Z
z;^cZv{Vqc!y0-EHF-d!*DqgOCt0s3nwY?}*CYFJEvy9UGJ&aUBqQ72MuCkX|LQ}lr
ztFyIRV{H(lbt9eS#a%Bxn~c&^mvVjO@`vmRU!Ps5#A&=rb6*O!88+m0%YS1me1mJs
zRQw~d=TFMZk0u!QT(2A_!?WRvHTqqXCGn_ogG$B2FX0x<@3)3$wCvm*deZg|8Eb6d
z(!XXdUTn=7XEvH1HaNS{rC&m>?5MO|CiY2dBs7q3F|pm-<UDI|u{i%-XwN^MrLaNa
z>r>{28ocjK2goMH$5TOxylm{x4Y?!PtJAa9MJXw_?T(IT(e%YFt~PYS!LK<q>B?Ox
z4~h81%@r+rJ-2fL?54`Z>L%%vnJ#gyV%hh&Yyx2uD*#<veMKG8H}E#fUn=r_bnnys
zkY4`JRUIP+cbz2u-exmQ`7-3wRTLmw7bgNU|I&P)Rk|ep(Ukv}w4FPeHB}KG?tgpQ
zb0V<S(3uFsN*okb=EsVfWn}r`ef7B-KR$Y}^L)Ek@OwAQTYCi?*%+<R9tL#rZXb)D
z(2s8;pW>!n#hP#59uO}n-g|ZKMR#aGfd1W|ujyZZUj4O3E8d^7&=dYOgZ-z4opnnP
z{ypzo;#MCuP$v9m>DuzcKOb(;g%4Je(T@(+GWA6MZrt^F^q2mr{wv(?Ch`gLO`LM#
zMXAk-K={#rE!RbkcL&iWJA{l)7)~8hn2r|RxuN}ET(xFJ#($=M`X^Q0>WK#VFX?C!
zhznDBf1f{Lqt?oveNg_`CPg}}0?ky1{8yZtr@evmV4gwKi`N=KH&IDguGQ!RT2lIE
zA|u}_1MgTH+9r(5YD-Gxm3@Pjs7g<X!PyFi{+DfTisf*v@-PhVgXfP?eB-Hh+8w(n
zxiAp>D46v^cNiO=$T@T(5zHI)tKT;hmEp;?&e!Ob8$kWS{m-;aYIhjTg)P6KpV!Cj
z&OQurCvdyYTUenybFq%MaD|e541%0$`-XjD&rooBtUbFx8G{iQ?y`v*$5e@H4tw6c
z88O65o?G$nz4>+72NRZ}wX|Xh<~vFb{D$QGs12IATGDyB@_;0QO@pxb&s5&3$|3O>
zdGQm`T*)ytrk93&mM8Bv6z?sJZMcyc{eBMD%i36|?R?I!HZ=5pWj$_AO=N9677fqu
zt37<^sV1XP$%W~IYJ-|BPKae{Wu6>{_7Oa<XFlux?d%$6NfGh6G{n6#i>~(lX}0rD
zoHvD#s<c^g=1$I-I-6~ZZP9mkk&4H%Y-jl^Hl%sa67Gv9N@hv8dGXke`0HI<v@Oid
z5@$_B2<C;esvW}0qLNZlI}ieS(KM!YLrb?kdP9kC{DneapyufJH0MA0R5eqL#k{f4
zc{@E^wHIflRvU)y${SS%T7QvpuCQ%w)D*8<e)sj#!lGk)FZa`{cfYxQx#ZOKf%{p^
z>^Jwni%u_2xEsjab>@G_Z1LTR!kd^>)fNR7UyL_zS3~kSSDTAY^SGuF{E#xAIcs>s
zy6|`Eu<jEz=jlg0tv)okRtuT=Rc;?gfxIF5Qv*!FrwnO6d5%4L)aAWw8PZ`ypJxD*
zqEhF{`f|HJ{N975b)G+M9sjmDV$GA5k#ijpn~7KvPev=(sOAkS{Cyx9qKX$os7I&j
zJt9F8whT}*n;@}cn-4z^MSH&e8rBXYCDH>ADg^#*f0sN~Knmqx7(Y?T0+?LrpC>$h
z>>_NsBV=Z$X#KVu4I!cRF3DS=YHgLkcV%7aOY!+Uvi~H519+J(I^}@-o9nkjs+nBZ
zDF<C6lPNcY9Mf1Mi6Zp}3i8LR6jrVdh*A;g#tmj4>~+$}N!391gi9voSRGLvFp!<#
zn#n2#!WkFr7QNgmxY^L(_b56krP+F2rVcbv*^r#Ipzy)0zOA*5v>iM*>G!QSrb|O&
zSeM$GjCR5?rpoT!*`6eyIi5qO>;UE5+u8ibMbPOk<;zBsWXl5x--k_rHNT9RL#T7C
z+VPj;A(@qFG>Y}+Q*bfMops?+dS>5c_lOcYv%h%<n12KRqg?hJm^-p`I?7p@)LFOX
zh1Oa)2{VRM@F}b<VB7;$6SzH!{aV<)(ORBA9au{C<@r7ifu~@0zxQzS953F*hMyaf
z-AqoE59Z8KiCu0AEF$j$&=r3D*$O{C`u<rLw%Z|TK`p})+2Ub3@*R)0@QY}ze)RYG
zwuIWN!Qlzotw)nXJ>K>2ZqNnzx2W&6o?QK|n?`<qv8Z44Q0F^uObnBI6j@KRAwq$v
zk0D`G<Mp-I5xiR!)8}{gW7W2^$#yPKci7J+g8Q}JUI>4s{D8oPoluv6#L2;TaE++d
zTZP}ESXzyTUi6Fl5DqHf^t;ZHdIPQq(c2jA(A2J_Ozm{mU=S|z$(8AcC*JI7v0uH~
z4%a@PXLZr0d^0!gI`j5KuP#Vu@A7p9jo^(e&p2Q7C*twuXU)CB=6CPAh;fJ?Waegn
zGU7-gS=H1d?%gN@x~l;?*E|Wgy&$?ZwlzG$^2Sd=TmM(P)5#ufkJV`(+aA;aRSf<x
zbpzAS5dnmvUCY8hC7_QjU*7mpNWJlTm|J*ax%XTR`sN=eVc`POUjc2xk<oUA$QQ)0
zTH9%P$P@xV<bh_a;Nf?{K7#Px>Q88@(CM53D#z>Z|0JwuM`#?2W2hWYkgpheYE`fj
zE0F8SZ!FJWP7t6Y!vuR*fqtye6oKw+&2Yp97=%F!%b?Axf>Wz?yM6*9gbo?niKI2c
ziV3X^YG?Ko2!*1jJO#_i&<YUzS{Q^NN7tQX46zny!wNsK4sM}wP)0c%uOKd`atvWi
z4v3G3CebZrY_H@PgA9f5he0a{OxIDen(~5Atp$3^MD~Wjg+$hT0?So6uWc!8Y|?nE
zlI6T7^Bn?n4V80o!ss_vXir`sT>hX}6x~M<Ft!$$0$uq{=1LjmhFy)a#R!FM2+dzc
zER?Y|0sH|z=w2-UQwdHtF?27Du>#BeeTaP!gRoGzHbsD9aD2a4P`EX|5}J`c$m$6r
zJAEn#&DU7cK@;dKlh(b04!tThwkpv1=B$h-<M|)w`o2nkE#rJl6Al*>E|wRhHoA07
zO1YLD51EU+@e*vup_6TF9LaE18}>a<1O<c(!;1t`jbH?~_%yWh8#Jm6ckohJAI~V2
zE4>SvEe5l!0MfrpaaJVmCzLiZ1tDX3@`x9IFIMJv8K;A-G_yH#D^6mWNu(Z(Zt~=B
zqoG~HWtM2H@4V2FAn6a-SG`_ncUH6vO{yVNriR8~h~IfaIV-BqvcsfZ<N0d_#1}~5
z_^ZIDNrD$C2t}6?`#cfHAeifh-5wsjSjLiHO+Gv;6i;CbGm@Sns~4AN(;M`;zD^-{
z2vP;LQn{;Q!{ri<IAPm8X}>1v-*+TvIJD+fepWka%Sla&qV&!iDItZ9x^l?#Dd~BP
z)Z;a!hkXh!AkvS)e0V#)|AvKA@WL1`^y@ttx60T`;^m~8d!H0>k!9Q?r93C4?3i-S
z5fXDz6KB<m`j08WjGqJZ0Bcb=dcIWSC9!*q#ySG5<JJ%Wr_`efDTEU4H<pd?27Oq@
zSOMZ{rU_SK`PXQ|E%N+LH1wjKK!b$tw5P6bGvi~=$kIOH0#D)Q@&-!wHj)c>NNX6H
zM)TMYDmFF@MF?7L^>DQio`KO~5%@BFUb#2u9ZsC~B)Y8(N<R`)Y$gOnDe||09DB*Y
zHJjEB8h=ugZY^OS(<f9@Ch&CHcraVAh9-DS6WXN-)~w1Om9eE^n5w+chU3P=(%g|C
zjz<7z+O)chr)KR>O*)2gp8DEw`fU17^#?7GM=j`i5=$T!H%4ZDgx_hJ(HQI#`rv6|
z$BB-N6nWbs5b4=-Khi|hOXY8)RDLNe5a1oc2n_-JzLm@pAkp2V%pBvAXiglk3eCbm
zpJQOhAeMMMQ%fn+aTzKSaNq&S1>u>ph-~|-ELkh8m_A`Iz`@}fnpn!TxdNp;)2hHR
ziG@iGaN^F(EBq1VFCz1NiGVg^`NPAYFFg6_Q=Vv!X>Cp=@se3|E|z~k@61DeonH#4
z_ptnlJo(m~;4t>uuok_yuN^biu=uOz)9S$6(E(<2rGJD=75bOlb`2hbaF1HW*0I9I
zCeRRhfvCNUpOr)kXpBa?XDZ62m&<s@2*OFW(qEKKdkFljw<pu=QCP5-xTECVGM;Xb
zcYPn{07;63eM7-8+S0z5l9-#O(K7(t7VD=F4wJ_+e%N80FBPy|H8;ug3wg_GU$A(o
zt+%Zdh4X@Km2$h5a)&wkFSANNpW-JGe6F>i0|~-2Wjx3yGam^2Z>482Jk}TOtRI5e
zmnpo#=`uB<=sgqJpL;ABrJ?Ku1pNaR)=lEY&!W9nkfok{u^_n~B2PEQzKnKd`<fza
zJ5v||@c}?(0K6U3S|wh*-NV`s!OjpacpgCrJfkKP!M~{_yo6O?47r$i?b4Z_m+o=n
zw7H~I=alOy!_hMOe`*Q+mTtdB@fJ!4;ZE*?`vecgpaPm67Kbh<gBT47<+RtzG<y`z
z>TteAL-%zm%F%6waqWddPs;w~6ZYlp_-hEl9Rw8it>F0}5zV*gfj>R^s-{26B&++5
zs>+qI6qZL+bO(XwLm7n9!oCHF-m2qxeVf^}l#{}CK}nYM&y$43C1BUs3V5id08WaG
zL^{8!n>zda6nkp_M=w5&ZCvPLtO<6_Y?h1q!BeCo%4=4|db&+(hafbtDt<r>0o}I!
zx60B&;;b4#IFhZ7%b4^X5UN<*Zm#bRo(Z#-W}qx_OuNNPL+q@uKE-p$%*B-t-R_y!
zxy<W4ixqc}7kNbR(dD|RX0PWxC*G`Lm`BSrQ+94wA-v<x=53J*Rl^yNdf#eaLi+tW
z8CUqDU^N%iZTV9gXXok73w3MKG3Uiq{)zoFneoxtr|HjG=THI7g;R2D^L&=HpuHrS
zEco2<#ZC(ktmTHNSN;#I4`=61nioZI9vxZs?wH1k;G2~qGh@8CV(|=^dh%6`-TchY
z!A~jJavr)LfV%{O%PS@(#N_EM+&B1pwitvS^E7=(6KrTq=%ER<MFcMsc%M58_l2g^
z%8Ge#gw#`_$|#E52z=G1dd*r*rB~|T>eS^GmatVsdIfJ1Rp=5Hraz0w2k!jfz!meQ
z8{EArc!}ve0io;3qf7R{dO1DpyBIWC5!Ar@Ooja0lmE~My+_XY<tZq35nt$>^^Xv>
zI`8gr$idl+4x7rl*CNHr<T@PD9j$pij#uhrT;DhE`U{mipBJRKa^$Df@r7kXSc_O@
zBasOP#o|QPKzYx8={;L(F4vDww3WQpvLtJ7s?~NEi>teaEm#gJctK&15A6=-Cow&T
z&}Z=XA8!?E{boGDCsZ^&P0pYlW1o)4-kVVRdg#d{fPHpDL%LT$s^#7TtD>7&FO|>a
zk+CwK51!~i@}%i#)AGeWO>BG18p^g5g4mO`C2`>TgdMRs{3?wK7G&m?UL@YATEieC
zY`^?2fgD!jsqhR;=}*AUfym5vKfPo=%^S~fNa%dXCsMQmb){N&9!OcD24QWQRSpV9
zD1oQXAFt16CeFhApLZLfTp|{w)#E<6s&6Sfy8ZAJQ9sI7yXbmU)Qh&e{!_Vnu)IQC
z!&xczaUQp0P*@yXRiNcCw)2t<M%C-GJ^%dSiw*)W3B<SmE%};fH)csFO~#x4{=SR=
z8S0E*2wp(fvA_kei~<j6u~Y^>08W|tl3}rLUp$DV3|JIXI_rr~E<k5S2M6_=y7;Mq
zWjvU3L3R;d3QMos_Ui5GPs14EElJuI-`ayy6$SH7ao~JhWJ1qKhY3nYceNXQ6P7X%
zx=A^Ip`68j^~?^o_$h{CpRDdjxT*UQc}RPW1yB6*<avruYgldg;8{`Y755Cs`R$if
zWy)loiY%X!w&K;8;a5V#=c^aIko}gzOT1`*j*#1zq!zEB{Ww+w_|ENmGJYlXR^fzy
z6A^Xz*2bk)&-X~F>)a_s1o0hu2*Wo-f`?)G>Zr(~H|QBMhwTbK{gEfyN02LpB>HD%
z;i@MBPm@_&^{>Q)zAa{*>bUzsNaJf01x02(z=+t>il{d-c5~s2Zc<V5=skYv1{mw2
z8$xzYyVwD$^!yxaZLgBB_8tMcaAe#N)n_C)+mphwPedn?rS?FuXn>1Y+WL?DcDWW7
z25<$gpr*<ozlm&`0GAye`t=`b#*^EYH1`L9X_i_ig19tEYerNwOCuz|RCSnwrhMh@
z#&hkhBDwlJW66xMSYB9#U~IY304+F8U#JDqo=FulkVG$1zbbgi;#R+ENEmCg{RtBj
z;?pq>S6lt@L{Rpnlw=v-KQdhEWX-8;?bs8+3VKV&dLe#O*M5j_*$cv=-=m*vw;5qn
zQ%M}rq@7fNH@Z|NoXl7QX@~c@R$_Q1&$8VI)n$|#!93H7R=%h$kBy4#8+e=}d9rV~
zh1>;jk|H?Sn`~UmX!V=SbpWo8$}FdgJA5?SvxKI)?l7Tw@wz`oaUAMtch3{vO(gq1
zr+L2`c<r*m4Erde?ty)Gxx{Gs@R^6qk|(3H`nD%tWT+If<lg#!0E9q$zf;~F;GhEz
zp%C4{9a5ljZ9nz>{uxAo(DH%z2|w6@-}T1=Q|`eeM1ko60-HZ^?XcbR*UX4MfBKB@
z^XG3+n|p1Hh#M3MB9n6vJ9_*GGNj0nBukn+i87`C%9Sizx_k*Urp%c%YudbtGpEj-
zJbU{52{fqCp*`9BN$Czo2PI1OKujS5hQEC^It<}K$)A!AOP>b&Sd~Xd9wJ0g0wvbp
z5K265?b(AX?M!`MjI?PZ%AY7EQm*tW)mO?Ohz*%!#3scEqKz0eawG~lvgFB>D_g#d
zIkV=?oI88|3>jN5mhMJ|>*sD?id7Kh$y@2J^w4-8`O)qOZ=^VW_pm7h4LrE;;lzs@
zKaM=P^5vUrZR%(9PzoL?tT0ze=SmwUd9Qm1x-LA#@Z|lG7jOQ2`ts|=pI<kg{rmRt
z>H8x_tp5D@_WAEu-(Gy>`KKO!`l(0YfB^pgCtrgKIw+oj0=l;#f)zf9-h~uG2%m%r
z9*7}`8)j%BgcHKI4t~U(XkULCqNpK@A9k2ui!a((B8eeRC?k8{{pg)KO8|q@KEb>O
zq)G8W^H7pb-jqR<f%t<$lo_DlPasxikcmHA0^!dWTjsar7ybaT<vN*cIc1emVyUH-
zU4H4MlvG*?=azF?38t7<l4+%xXj-Wzn|HpMrJi+038s~8;+d$Ni)PU0nCp~zW}0g{
zdgzsrM!6@Wi$02IoS;rx>7SPdnkk{1+UcgJrgDjDoo2?Gfj_U(x@DfK(&=ZEDPlTk
zl)4()>!+m3swl9Q60519vHE%{ol)NZy5+HwCOa#jq6VA6u&frF>#kFBYvq&b8dnD-
z>%I$baZ#2KM>#o^fNu`vID#*}j+E1H2~(64N5H5Q6L7s#1Y8Wi{nmSLzWWCJZ@)RD
zQBDgj<Pb<XP2>P_6Xj$AGRT?OTQbIhl$--B#jxCQ8Y~w>a>*Tk9P-F4pUg7G8guM%
z$s*TmGRh#U%(BZcmm_n@G%t;F4nyy3^u-x(e6!Fxm&|j@<*Zz?(l#?aGtodtJvG-=
z``kj-C2w6c%V~ow_R(L@49n6@gA6y&a*zD8+fw)4wcTLT{qop*=kWB{XcNBn)q?9w
za=#T@JaNAV2Rv}W{T72t!sRUg+;8Ui)*G<C{2Ci?>zhF{n(MO9ep!^|+>U$hy6?_=
z@4o*IeDJ~#PkiylACG+U$}i7+^UgmHee}{#Z#?U?Ur!V+n_$m<_dgMX3iaZTPk#C4
zpO1d}>aWj!`{h{gef&6ivxG77-;X~`;JeR%|Nawfr4M{z9LKvC(=t$u-Hjsy1H)Y$
z0+<E@Hcw;rD#8CQh`|gd4}SUUU`xOd3J;2Kgd(w>22Y4W<~{HWacDsX{$)HGSTGF;
zR3HO$M?)6oAOl};9t8v8hZG8Nh!~uLnMg>SCS7J3%Rr(NNoYbMN^y$0dmt>zfeIdC
zF$W(g!M|Dvgc1}Z5H$GzKnrM54jCRWfu4)QI2PEz+tCn><7fc~2-rpf(qdsiKw~-l
z&;o%`qa4>L*cVFBg3$rtk1Z%z3&K~(5&)qIi=?6@FL}Ht4(AF7u?#D=r^!&_FN&Bf
zWd<LZhB(k510Bmj+wfHmG0|WO#rQxI{BT1x(y$n`$Uqas<On$8Fav&^LI!@(%U`}Q
zWArlPIJA@lV=hulQ!r*Cb(w)2;BuM_w5BP)2~OPQ08FCv3>}z2hh|jf8B6d+Ip5hm
zQigM$>U&_6J}?CWUc(Vn_y7lDNzB{*!VhR#BsPmd!&EX*n7Etc?Tq=0gg$Tzy$s?n
z5}1QK+A9Os0Ky0V-pGM#&M=@Qpg}o+aK~|&k)AB2A_w7l8CB%rGGJf@Om8~7FT}B>
zJRRQyQ6a%{i~|K9NW&@tdW~}YBBXx!fI&xE3}YJc3xQy$90QuM42(mnU!ZChE&7Xb
zl#zgFq6Qa*y3&JY%%mB8<4Su9R}H=tr<37Bch13!j_BhOuL#O8ph4Hbe&;>!iK}6y
zXT{tVgHp68fmX$o)HTInP5L_Mn$p0pVBWByJd6XHFm~C@jsua72;?|&=m!p%R7(mK
z=^EDxz$r8#1BpDWZQVCl!4icFe}x7g1_Kd941*6%^hqc{soUfZhZupt)t0uTuiHu&
zc@Oj>?!LhP0S@et7LXO{DiQfn1MYGhv!&EEta`wCeIcpjWmIHW`ADHofdd(!!7s`|
zjoBhHk>agk3ryNk4ur9`(=BlMa;sdRWG5rg0IomIaF0uLhbP8Zf;tk6Vb9EJUI7c3
zJPi!u;+@xb)Cg+t#*x(Hp;&h*#@&i@*J9xLVG1sDYKU(vy<)f_!;xuHgFC{9b4+3w
zJ?RG+WWnPkUxpY~DuEkJ0gfn3dCK7UFpjSrVpz~O0~|ORmcN|5EIv}nLxBe$yf6$^
z%z_t#7{o$&(hGr*dCrg-)D56a<vd5(%3$vEVX1+NgZX*T!^0Gvg%XL|_yiKjJ+z~H
zGN?rV=y}pr&HxrI`9^B|BCK!hw5LA}>QIY%)TA!8ra4{eRI7T`t3EZWUk&S6yE@ji
zuJx!lZR=I%F4v!)wWx(y40|SmQT2KBbpX)=*%*7-H$hVg@J#7E-vAuLo<jJDh*3sW
z``SayHl?;LMQ;NE+}PfzupE&CZg+d5_++5EQ|Rq*q5IwNHutoB;aGBJxF46ug-Z0H
z4<*jz9-XYoC5)g2<wA!!0{7scq7Ct3&kKepbQm~%0R>-ByU7&Spv5t+afxTZiz)ng
z#y39klH=>*CkMw3=CxCguN>qeCpijDu5p*cT!=WAGQN43;cnDr!Y8=`6WU-CKJelH
zCih6pEOZ+VsVt`*Tp%HnGXQOfPudrWc=<)GjX_5=IqMhi`Z1$QZ}*9PUS#LG*U=vK
zu~XUYX9xQQ*FN&Ln;n6m%OKvLJ!QIoJ?-uLyWU^UcfuE5?s+yvlvbo%Q5a$Js#u9C
zkY1B}<O3(mFai_W5!i6lAO%X;JaXDmhAYsa;Q6bPq_wVfUqIQI0#m&CP?67J-{AFn
zmOVIVZ};}$ejK{zeV%;}eA}0A_{FC*@<$$g_Ax&LyN`Av-0=HsDu4M?SV!}FKYQqJ
ze|*!gKBcdp{dD&a_ui+z@$)=vEG0J=s$jz8`>K-5dqfm%m_#RM!3T7J2>zh|3b`-|
zXK)Gnzz5in2YGN03djdf#}EtHfSn`?bU+70cM_3c1Z5ytN{|)Hkq4zPLRnM-u!n+C
z<_n0I0plk<tAlmEkaMxef-V?6FlY)gh=MC<B{m2>IH-fL$AeMggU<tmGpKcL&}0d;
zK1V2oHOM|rh=NKuFHERDQW$MKI3@FE1Xmyh(O`L)rx#Z+3vDofrC=D5a0ULr2k0~i
z4%mg4PzD2-3uXur_YjA37!g+>3VbkAD$x&RU<4UKS1Ire{tymtVS4+p2O$U?S0D}@
zF=2a!f7nwcWS4>v=XT&wFtk)Y3AA=jmWe*sb(|<LRwzE8I4{^Yie)$dZJmgU)T4?c
z$BLu4iLm&I`?89y=!zw<4*XPv$TN$gXp5zYi{vwmwU~)+=ZnB-KFOGg@t0iua0N!7
z3Z?L7DWQK5!3B76X8v#mm*5Y>u!eka2L1pIuYiZ6F$qf-5d-KC>*x>dm=8ukWS8)V
zDsc|>r%pGO4;|nS!LSO(Fa{ww2Do4axBwjWh>ren32PW!!&O|gvnsqeickP^vG_c=
z*Mckfein(5(5I2k!;z@qkrqj1A$f|_Q<5i%l2WFUo;W=%X?`!MagL>Z;zN@k*@`ha
zlFhS|FR6myfRpOSlE!3`HJO6G@OZi<d0yZT4R;dT=nqn0SE3;Q3JuW>{_qOrI0+qr
zhY*2}5HSew7?uv12g|?&!Ih6HF$+c@1+4c@DF6eku?H|<dOY9`hoA_-Aq8BJ3(yb=
zWzb0wCSlm4CCVt2(Pj#WHx7XYJ)vVIJo%E186}SyjJ_k8Q9_w0X_;CDnH!0d8PJ&)
z`I(p*nWI^nyyy#5Xla?LnX0*%Q+Ar6Ns_WTn?C27mzJ87`I0YpM07<D_Lo;JL6vzx
z2T|EXS5OMwz!z-zm3L?aV)=(<DV@}bhuDw{M$ncj!3Rc=oVqmzhX4^)kcbL79EcDJ
zQb347He}c%Caam7DyVTgBrqzZR8ay2^Lc#r34Qqa3;N0bpL6G*_qjav5}+Bdp9AW1
z1sZe5gP;P+pemRMl6EiAcRazCpTx+ZI%uB{YCI9Dpc6`=7Fv7DqoD!Hp(r_Q!HH9d
zU>7f;3Z7Sa_uvImfKGbhd6LJ5;&`2CNtT|c4`(@+-+2Xo=o0x*jg?1NdoTt=5DaIr
z3S+PZ`%oP4AO-E9W^CqWmY4xZNTTqEcw&^H_A~|57N%6TcVucj!4@TFDxbNzra$>R
zZpuJtnx;}Vr)B!4c$%kC#)8phJRCWqm^h((+NNger+*r#$U~_6X{fB}DRd<cp0|}X
z5f4fvmoPza2O)qj0S%rPiFCDad!TGWp$|+t6Nwi8KUD&zf2yZ900rw%O)i*4QF3Rn
zs;06^s~D=8R+6i_8mqHftHX1v)EB8~+I7V0tG#oq!78j5r-a=X2O!!zc-L~mx~#ow
ztH7G9VcMDuv<}ruJlOiGHaV#{l?O)PU@9?r?+UN+DzEcOuk{+QFmZ5PAeGGa5%(Yt
z{|c}HE3p4M2vR_T$rUBhN@-12FV|WEs6Y%QkgW<kWen>(`~tBOd#(y=u@0ND6HBps
zHZKj!I~W_WAgi!C2y=wzrb(%oA=|Mf`>-dwvAU|V;@3MZyMiy9n+T>!oyP>Z!4mdL
zv_)&Q?-~;o0gtqU54aFQCSj#0kq$B;3RhtNwO5O^S!=b4!2~`k64(H?a;6gS5VoKP
zF9{p6b7yuXfSL{jtZBP-YumQBV^7ovx4kE~wh2JEdbh`yx9V26)7H1UIxppbicw`H
zJe#(3$F_PKxPwc$BWJjZWlT|`xbx|=Pb7%ZNjvRef3f2_-cScbKm_hm62XuHC_xFS
zI}~{^2tq3o@L&XIK)Y;M2DeLO%fJOz2@%k6PFx@kszAF(8ZT%Ixm*Wj_%a1?Pz;OZ
zevs?8$ty6->%2+{y=5o8%iFxT8mAPCyhJ&@+xxuN8+dLYY04W1sF0v2JGkGAzT#`W
z*V~%sJH6_wpEZlQxpGr)c?H=>JKM?s1d7%=;s6FjfDa~tx+!sCs0zCyA-f(Cj$pfa
zQXmTOz?}Xthx*VB*%%4#_%6mPzae?2Zh*hgi*Z(RrX)<hTPMOPT*AlO!r-97E8Kf5
zxS!p7w<p}EGfcyCXTyt{r<qGa`cRFPh&_W4qpq_Gvk(q!P!g+P1=Il%hcE<tuzC5g
z2Rxtz3JC{R;1nGJ#Y!*+{s0HT@T6ZM6c5}HWY`hsAO#T7hgIpd9nrzXn*lxSia2b-
zU8l##%g1=^e18nclh$>BH^^!mzlTh1H(<!ZD#Rmna31JA`oIN7pn*@a4{IO>5aCWE
z0SY1j2YZmZ(g6xXFvf6D1GoVH3SWT>sN4~s9LlK+10q1BHBe^LxyDyXfamBB%dm!$
zHwdg($7g%TifqisjLgZb%*)KodiKa36c6@CWbxAtlXt1=!VhrZ#3xY$PLaScFa(ES
z1yXScpd1chY|9YQ%>gOPaKO&D48a08fc)3HYv~WY;DwLj55xSy#oWyQ4A22B&;w1-
zqxj4n1f$_8Ka$tK>XHtxFsdif0SdVasaqX~fYA`K3PaEV<mnHqkk0-v(H||#3YoxZ
zjLQ(g#t?xGRp$?7s8?m+!Th`~AY9Nljng@;(>vX_2aP|K$^;QDKNZogKf(%2@C_;f
z1AFicDUiBMF%=4l3(&Fu2k8vb9kJ9+UDEH2(hw|x8Ua{sAdaK@TXgKfHSNzlt=4PJ
z)@|+9TIbXELkH~ILGh3n{sttgump#w5|q#ZA|T5C;0`rV7E0g`RuB~_5Q3}l*R0{!
zpuE*59TaM;((jrVm%s#Ea0T&@4}8G|UZBr3tu8kG)}?LQr;Xan9M{0HuQo9Za4Ep|
z(+i&0z|7GMxp1l}VR|0n4hshnQ!5hBuz80N(vcy%?a&Uj4VKre57=-U`GDMraMq)p
z)~RjX*NxrTO|h%}8C2I3buq{J1EZ469QYsxoDdl)Py=Lv#*%RlTmauLtrDUT--OuD
z+Ku1&t>62NlHA?@8K|dvn@SU}U<CR)Li_;U%%Kidpa+xj4DHRYE<xJ-P2m-8;o0rq
zoiTztkq?Ps#2!?sMgWF0p$bL)6Y-!5HWlH@G2s{P;x7*4I-TL10f`V%3gImik^Dq6
zdIh`v61^Y=USQ%p(FuzX+beDyEgs`b&g4yg%rmYT44IA+hT|^*57MkjbM21)%Mwzc
z&p)9DRnW;uo*YW<<Y$iNX%4qgt{H!s3y8oA%P`$AfyCWOLQQ7`vmg%B+!F2Z#^@Lc
z6UGk*YZJY|1_w;$EMDDe&ghNq=wZs{oFNLc&<j=G64e~kq6D;jpsFm93xp{SqCgRH
zh6oTz6YjA82@{#<WxnW-?&_}&>zNqon;{OrCDbqhqf4tv`~ahL?Go6)1ZNP5?QjN4
zMBXyNPNuu+iXQ9D?(EN=XS2Q;U%sl!O+xX&fs^M2^zaf*5)W<Az{d^~@K96B&KzbA
z?dh)WO)l+{(HI_a4n|<MGyx5_{zT_6*O?v@bl?SLFbs%r4)tg0Dj^N(Xzu6U>g%rX
z3-99X9vScM5%W$H@qpLw#0zCmoHQ}yEg=eZ00ymn@Wg@c3{UbUf87p06P!*5!_Wqi
z*kE+P2MbZ_XD|ryP?nd_29@^;O4ku;hVx9?3v@6D)Ls&=z~!Q3?UW&TN8sZjj~pX!
z@=-7U^=ysuGBLYSAO&S`3BVqKMi39tEL@iW4})-Yl9vzNK;TV6_IRNX(7*($fC%DV
z63`&FPR|l_;p=w)^a(%ps4WK#&;VgDX?_6sPM~KI&;So$4OE8s5zzPAUG*_x5eOIw
z9gKNiFA7lE5rZJfpT`gmL6)804uiml2PfbnaSvaO<P<*>o@<SIzxR)?-A(`i0I&m-
z76!F%0(vF@03ZNzFlCI;`vM^Q*d6&Wv6gKhn33QGc@Ym@KMBYF?i=y>YEOt8kq2df
zm7=Z^22bY0Am1?&szv}<urDusU;J)O`?in!y}$c;*82e9_)?|;wNL!%pW4U&63M^+
z{C*e@08z%sIcP>+`OC*|P$Yl;n4I&c&j`PU3mZNxbtRuaX!;s{1R1g+wrC<vo<x~a
z<w}+<UA_#-i_aNE{wC#W*sZ2an*QLay3(ziM{#`UEc171R-0yYX023ZL<&5ZRjppd
znpNvou3bN7$N*04Sh8i!o<*Bh?OL{N-M)nzSMFT8b=5in0AL5&FaiLWIO`XH0AgaT
z2^L^i@nXh}9Y2N~*(_MEUYYo711(adWm1e>k}@nQ6Vl==I)o^Z3B%J5{qbQU#Y?=G
z`3_dbom;oad`v_QQ{@k6Lq3Rl{|<hM3zITsu;sflNEH)(WuyqC(}v|BBVH)~?gk%T
z{CM&x!AeG-Uj2IZ?Z@KP%hxYpvxvipm4n#*e*XRa^QWx5mW&{<Km!j%FhK<qgeez#
z1cWfckgj{GAt_Y3hlzIlq41+&xcF$6&qR?Tmoh||q>W|HV2K}r_>eG08E1^~y#H>*
zF-INWf^V<0`uZ!d!2oDLtO)WNY)2)RWYWI?X$)yWDW{~;2$;Ho21+e+yC)JUxY$UP
zD=yK_pDw@L=);dnkwO$Vu_>dONhVpbrFc9OWlKHx<g+Ckn*=maK^f~&z98#EQUF?r
z5iH3;AB8m1w4Us<(vS4H%~DNOf~T8^n81l2&v^04Q++`7M;z+RR27^5RNIMj&N^Gd
zhCtCa#Whz5|CF>>Uj;4n$N7Xra)-VK$Sbj5mt|H*N_EvU7pkCz7Mm-sxbC}1t{Cas
zY#VAr3MLK`CAKSiIRlzWE@_5EmqgT%T6yQ?iq~fE#h1Nc%>t6Xviyp`F9aF@zyJgs
z%{O6%AA6Qw8O6EPVN0u|ctMyDF@g(^B<8r|lk8nMWRc_Ax2%4Jyx@Vs<~vx~kza;c
zt%f}=kDuUZ-m_wz53H&UBj~_6XpTXSx#*ZnChKHGFUT)hR9ZGV>Y`^BI=o&steVed
zu$J+jD~y;VYq4`BT57ZNMS3iy{{`TJ!}3}H9H`HxJ7KEF#_gQ{i1FszB~^{Usc*rd
zEW2*QB~4qbwaN190&p(y%L%y=KD=^C?;d=sn=|L!BwmbQLY&S=C$DhJPiGRo2TWj{
z_4~j9vVqoJ2d8mxtifHZxl!jGP|QiMY8cUhC;bv5uDFMI<tsD2cjx_s4@o2=P`pv;
zi?qG0-Jj?F#^0A`sU1?m=R6N1$|OJis+#Y<{q*n>Ab$A)pdR*><&XaXa0~!I1G5&0
zpZf&3pYN#;C93$20r92}E*POE3WQ)v*f&55R?vc$D_{gcvW($rFl+5#f<Zhu!iG%n
zf+s{_3PYB`5yB&IBox{*2;?dnsbUZ?<dX?ixI-THa8NA&9N{ZAhC`f1MGCZ$Q7>e3
zLn3NPhdzX26s1VO3^Xw%(D0NMX~vy0Bv3+9fQS}p^u#Ha(Tr!b3lKecj|z#AV=giR
zjP9`!2(?2BZX9D+(6~oF_OUK%^x!M#h)0Lr$q1szMV26BqI-xV7l>%1Dk7msLh6Q$
ze#B%ZrwB+5VuOa2q*txFlP3sag9&F4$0bD75PgWE9bN#XCH1IDTGo<}oQ&W-G8Ic`
z^#dLl``Hj{){u6zfr$;d#3gu%n@if#na^w=E+aUL<SkQI`cOp!K^Mjt-9ri+dj%qd
zX-%y(6Po8lXXT^`K`fCITKo``5!x7`GNi~KbchH46X;L|ch+l`=>%v%pSMm0Vk$z-
z;95Ujf=yD!h$8uTphEpAP>NO*gH^Pqv;-uMQuLyO5~Wc>O(N2&kQAimv}j6I+AD%8
zP#j1pk3m5yp?JK|LYp(mg<Mk83E_06C|zk#h03Is8qj6}(%VNqs*h>SG&gDjNmEZE
z)s;Z?BUJtAKZm+iu12b;2IPfFbpws(_yZf6y2mmo>C~6xq77}p$uLCmiZ<lwCqWqs
zHu%7YEGmU5PSGo08v>2J?$uN6hy)$@0FAo}MIV99qCeaUSK-WpOg_aUP`kQW&Z6h5
z>VsH2yto^2yy8|iy~kSF8a^f@Q$ywQ!X=phfDPp^$2l&%!uYI%oi^ZheC^1ETOX1S
zF0^45TzExon}ZGC60^0kZO0&(P*)?2(~X+#Y<9JqMvN{q9^FvIF3W>j)vi`0WCGVE
zNR+&K`opRX@q%tqq#}347bLl0LNEOBip%(;3<r6yKkS>7GPU6ngW#t_#A-$CZr8yN
zX3J;O2aQt9lRW28h3JOC4`}29iRN9&AYk;GL5QMER|rmk2OKLp)pvYmWx~x60W^Og
z*S#PD$$&*noI$jPn}lpIgoQk0u}C<5(a>)<e+*)l4C9D*lB;&gwINk`q?#+1Q;XsI
zTPZN4AwanYcY;%8Gi|vcPL2nZeH_dGAQRcm+ck3fs>x(%(E)To69wq5@WOD73%;lH
zN4nP4u0ONLcm*oOJsL;{I(WIyxA6j??|El`tQnMTesiWb8)rIa#kyC4#+*rbk7}CO
zy73UTR#NQ`RHKB{62-KpWi3=r<1inq#>y~Wfmx8;8YKEC#ivVZ;Rx=`*vB?Do3%P?
zW@ozAFvLcAvvO3FL^~wHw#qO*sX=6S+uIhq^s<{hZXrK=g!+KSF!DjiP!FRQ6iMwc
zkaCW8bmM9bfmkoXNbQEi8!6~k_eR>GR*;B;7wYy0z3shVknls0orXA8Voh#}pVQnP
z)b%TPK`MS!xU~AXhbo}aj#6;{SQQ=(PCQf*4|q(A-yt7)$uqujgpm9r=Xgaspz#!F
zoLn5dHi;u6K6IF%AOpUrc+$7)iwvM3;?{0R$7$1zex$o0C5OiNRH2W2sA3s&=C{@T
zQF61YwiF-fMHVrX^)F*PCLbkw+)o08446Xccjv4rG6009Q<C436<x<UOv9}sr02Kd
zcP;`?cBrrEBe@7;&dJ*LmSD>5awj_7-GFz_Z`BPM2t>pU{*k{!V;TJ5MX)C?9FX_J
zOlS8;*iWB&qP+O(AHjxxL(UPxUmhg(#(eNYf{F}4q4URI=?yY~iikUW*ZTN7J$BuV
zSI}eiTQBV_UZKd2Z{HvP(pLrbALRVPk6jh6;>Rphkzw9b-X)M1e*D*wff69!{uRAA
z41J%H(Xzzt{kIBTa=rKqKDsl$`$NEU`n)e7K%t3-y=lOqBL@0Ix&*YqS^^7Vh`^wk
z1+3aYI{Sj+yTB2|B;{kk52TrR5HA#DviZw^%_G4WG^0cSi*;Z@nt=vsyFs>^z!FFV
z83aNo(z^`Mz#a6MSHLwRoT)$n3m6Q-Cp@9gTRtW9n06pGDqKRaxB<I^!Y*_lUr@d&
z#KMlzwlOrX38X(L;6g8C!_)BvC;$s0G{cT@xIvmjkXi>O1d9@Yf<!QdKLo@;6vRO!
z#6mR0Lqx<xRK!L9WW+{v#7Bh0NR-4$q{K?J#7o4)Ow`0pti(h}1UD#wI6T2S<QSnN
zMW<SaFQB_PWW`o=#aD#ISd_(Cq{Uja#aqP1T-3!~<i%d}#a{%*U=+q-B*tPi#$yBv
z6!-!gJjIUT1-NTQg<1zxP(>iH#%sjJY}CeWyhgCdfo}xIa1_UJ%mJ|A#&bl+bmT^F
zB*%6XM{`uic$CL%WJh<jM|hmad_>23v`2TuM|}jyZp?sw?8ko$$b$p|4#)rwpaFs$
z#})vK4?xI+R7i$&NO6S743Nlt{DLnCgd&W_j<LLuoI|iEhH^m3lvK%;TuI{Vt{TYz
zmXyhv%s=!0h{>76$&{=~kpPRF^vQDA$*;(Oll)1UbV(UWMfxMkqAUlO<huw-$`V-0
zqI61<Tpr-FN-Q)wsbor(tjZbb$*x?<pybJ$6ic0aNdYm*vrNgOgpjSAN~ZkE7>UZb
z#L2mY$`IsAsx-%}TpsxAidh&yk-S2`gp#@xOT2{1IAF_iD95zi6|-bZviu0RWJ|>y
z55(+B%*;!r{7KFf5Y5a<&@{}!5kRg0j$uebXwipUFs;($6VdcZ(i9LhWK6MqOpufi
zu(-{$d`!C3OS>G+zLXHz9L~Ml660)1;-nGf^h)N0P11Qlu1G4H;h^Y@&EWh@=%f+b
z?8@B#>`vbF%?w0J?c_`3EKkpzP3~+?^JGcdgb?R!O7_G~&gsCdfQI2Y2W*%#alnTC
z(~?=(2z?NWtHK6`t54mKPn3ku2=UIJ1Wzb=(4vgc^xVtie99SF(D_8qJyFgEjZgP%
zOZrUE!BN4jaFFB?2Yv{ge1Hd?gO=d92YASbk;AwBD$x*C&-WzJ@XUbToXHB6Q1OIN
z@;pot<<Smp&mCP(CG}7d1<}sDP!7$|937n;)QVx41sW2Ek6MNg!<ARisBU;6ei#NF
zv{D5{QYzJy31vwk)e<+ANjTNeHD%BqEzUKKQs7k2J(W_T^wTsI8YHwstZ0XAJ5Y)L
z$<L4IhZPjm-H^>dbx<N*Nji;FN_|r!)sqj!Q$C$iN&Qn$4b9*b)kp0ZD?B}|u$f^X
zm0?i9VQ7YV!IECMhjtJjtTa{e(9BY;O-yx6P3;poMM+CNQYPh9@YvN(-P90_!z$I3
zq-@q)9UXq4zC`nidswpYxCb!xif#ZvX@yi$RaQNjP+}!lUp3ca-OFPQkGf>nQ61Oh
zWL9SdSHZc5)I(5*BDH<x*M6M^Uf|Yxofl}0*K_^RUzNjLDOX^v6n8Dy^o-Vl{Q{?x
zmsF%!f$bc6s}x5Hu8#Fsk5z>VTg{N**Q(%$eFadAT?uHVS6xBFIMhvC@y>MrT~=0X
z*@m50iDAZpRoPf7KakKhpu-9l%~q7?xQ!!~W<XlnxChr%q<he{S<r`b*f{U&*{!fx
zj(ORbRoGVK+GovKYRTHGC0k4R*@hF^t4P_X!>L&ihgaLL6?I$5auqvlr?Sn8ot2mg
z{MxQ%*jyRgipAT(6_1e{272g)+Cw-qdBDPphcn%nzjLUz<r<lKskjx1yCvK)yoMII
z28Yqx%@y6{DFt451&tF2oYT3dz?7}ox{%w?z>!=D`MX)jPtl>;etQazQZ3CL-QNY?
z;MF2k$cJYXinRN(dx!?DLpQhW2H2b32&r9da}{w&GF@tjc+kEf@?GKo_1^CVU+@VI
zS``Yw%sF0AJAGi)E)@sYi(Uw+U9MpxV%nQT`iSlg-~83z{mq*3y$7MlJu?Z8bnAy+
z2sUx3kZO8g0f}Fbzz}~x-i^W1oIulh<%hxSih$+c@z943{#O3$;I$>55VndC{@@MH
z75^2A^jkmC(WUb%yk$7uT%d^Vt6=e{-BQqD(fPSqm<5Umui)a|8_rckSdPkw2O}8S
zJ}Fcg;RgWiU>ZraE=>t4c8OGjh6mY=)Dnsf5sCt3wH!pE|HUGIs5dNGVhMqU{u74@
zE)Rkb3VO(gFCHE&i7bK$HEQh!PeS3UIbln&8GaDtljsLKyoUt;66D4s+YG@CEvA-k
zNaOK%Vrqe@-N=V+8;}3ppnQm84(s4G=7{7GCP?lRP&Nr7u8ebND&_UyRN-OKsW*SX
z;K%CYxa$XxtqP9Kg~(du{u&8HxCA6hrG<FnOArS{;DdYU1!#B$KG3gW*bKB|W@jF(
zNI-;!!i{<p2k7IbcJK&o_6UApt_#jyai9u*c+qx<2Waeye&D*u6{aWNm?#Dbch(2j
z^9Xu2S#juwX*mad5C^Q`hh>01e0$q|YouDGvV)EY_FYk8>QaxOhiDjNfPUzH>rzpM
zhepcRlhEXksO0Y(9&w<Df$l$29*=WqB!H%fPPu4)Xor{odZ^SLOjPy?RsM*3*fvn+
zFjp1{TCU}wjz31mH!0u+Q2-h{nuLP5H6tj4T(|;w0F6Nq5ttqZD?uhHpz4WmGF3P(
z-8fW`^N1{#<tz#7d+-P>!G>;th<FIKfYt{NS_UlnW2@kYe6Z(;@CZ7J;=wHFsKe_h
zo};_2Ym<lumCoa3V6JGO(QZ)eZg>!mCMLOVV^)#hMuG;{TWg)3(P(olGl7OdVk~&b
zlGMTm>x*QO_~?dM26$*Sb8ZND;9+RsR+JWxxz53UPAzOL2@ZSPHAXjjIMk1@>8`-(
zexvPp@Q6zOH!SiZpcd-rjys}GiZal?>Y4;5GJ>Z6_7p+7ggm$i+TaJQP73gLh<Ip&
z;5Y{y!wt7?hXIU-l8EUre((F8Gi(rtc-T*L;|Ky3VU|!}E4$!?hzPuHxC9FDGK;<c
z=5L=^QGzz(EDC8e#+sPsZ$+|IkVvhKNUfYmo=XmivT|^I+h|3C>;UBDtx@MxnHJg3
z-ZHjt@;JSIwpG~f?^xytn8pT{tK{OQ&Q%_{c1Q?H;%PL#6ik-xBxf?}Mua@@VF7gt
zgxGHCPKuj3qSzzvOR(~M5}jyZZ`{a-mqMZ}?udp6^Dp&q;?D0hBT$a;hoRt-s1xvh
z7|cQjI|P?=1)pS?=<x5uhMx9mf0*zLH)DAJXmbp&T(UOf;o(n&z+@4h?^IFgEXr>b
z-=L@pqvI~?IkWBX$daLW(bFER|DBdK=I1o~FdyFvP1k9VAaalxZdO8aC8u?#qHbR3
zqEzVzYt9GrK{a2latjgfEZ_1rcm;Uif-m=qje!Rmf(ONBrP$_DuCd|{_LNWm@0F+~
zv^EnAzLf76<bLZnE6ek$DD!~sX>_ZmGXDrdZwEuac4Fch8|^n&8MyINEfKHL!MZg{
z*I;c=@n2IUb{`2&Pi?Kh_H-5<{+@4{jt3eVB30K4R^K+*cJc3Mby=_VjbE*MI36$C
zmMdt3Ilh8%;Q~kob}binEJv|m=a6{+;Dy*w1z5@rf{3;`3$=!@`J6Yr)r+?LJoGou
zc9j6RgxHvUeW*Daq?4_tq8IFPhlyvOyn)U^uF*MY2&1bnbbxkqGse<qUxu)!4Q$|`
zfTm!c_iTL2K^LZUM}CRb7WA-B)iz$#d{Aus{=I|GiiD?%Xlw0=Fg=~42)h3ywPI)8
zV0F3A5_F5Uv?i-Y*LaSXd=LxwsPhU#_lH@au}mgnZ+Do#t_(o$8@M+KI{&rI)qB#>
zSpGY3lAZO*hkZQyw%I4|u8{lN$Nk*b{oTKPOF`>(Q#IZf{^2M7;y3=V#|oYHq{FXb
zPZDttI#f^kca(Un<&XXA2PNA7|2Et>{_f9xd-eYC7k}@^{_;2f^GE;mSO4{A|MqwP
z_lN)Zm;d>v|N6K8`^W$M*Z=+J|Ni%Xfbb`9Ai;tL4<byca3RBn4j)2{C~+diiWV<o
z%&2iA$BrI9f($8gB*~H{PohkzawW@_E?>foDRU;xnl^9Z%&BuH&z?Si0u3s3DAA%u
zk0MQ~bScxOPM<=JDs?K=s#dRJ&8l@P*REc_f(<KnEZMSV&!SDMb}iesZr{R<D|as4
zx_0m4&8v4W-@bnT0uC&AFyX?64<k;jcroL~jvqsgEO|2J%9bx<&a8Pe=gyu#gAOfv
zH0jc&Poqw)dNu3Tu3y9djxBpO?b^0)<Ib&nH}BrQe*+ILd^qvq#*ZUUu6#N3=FXo(
zk1l;W_3GBIW6!RAJNNG1zk?4iemwc|=Fg)~uYNuI_U_-qk1u~d{rdLr<Ik^uKmY#z
z{{tAHfCCa(pn(S>n4p3SGT5Ml4?-BBgcDL&p@kP>n4yLna@e7VAA%U7h$E6%qKPM>
zn4*d+ve=@FFTxn3j5E?$qm4J>n4^w6^4Oz~KLQz~kV6t#q>)D=nWU0SGTEe)PeK``
zlv7e!rIlA=nWdIna@nPqUxFE?m}8PzrkQ7=nWma+ve~AaZ^9X;oO9Ayr=54=nWvt6
z^4X`Ke*zk)po0?sTBxCiBATe8i!$1%qmM!wsic!qTB)U%Vw$O@n{wKzr=Nlvs;Hxq
zTB@n1qME9ztFqdvtFOWutE{uqTC1(M;+m_jyYkwrufGBttgyopTdc9iBAcwT%QD-n
zv(G{st+dlpTdlR%Vw<hD+j85jx8H&ruDIipTduk1qMNR|>$2OfyYIpque|fpTd%$M
z;+wC&`|{hbzyAUpu)qToT(H3hBb>0p3p3oX!w*9ovBVQoT(QL$W1O+Z8*|*T#~*_n
zvdANoT(Ze0qnxtJE3@3P%P+$mv&=KoT(iwL<D9e3JM-ML&p!hlw9rEnU9{0hBb~I;
zOEcZH(@#TY9ktX`Q(d*yS7V*E)?0Jkwbx&R9k$qGlU=siXQQ3A+H14jw%c#R9k<+b
z(_OdScjKM6-h1=ix8HvQ9=PCx6JEICha;Z2;)^rhxZ{sQ9=YU`Q(n2{mt&r}=9_cg
zx#yoV6%YU+`2-0a0RI3i000001q9FnhX4Qo2nPoY3kwbp5D^a!5)cm+6A~E~6&)HG
zAs!q;9|t8OA1NgxEh;E9FDyDWGCw*tLOwfVKPHnz4@*Trm`4zoN)<>;QB+MxFH(<N
zQ%=QN5oKIfJ6)8tUly%k8^&N7Y-3!=V;)6hnqXvWtz{&_W+KUEB6MkE%4sG|Yn{w(
zEO~Bc!fq^uZ!FDkFwJo@R&t@iax;E&Y*}`w&vrUpccqzkGQxK`b9jKmc|6d0J)n9w
zh<tQneXG%ZLt%b1#D7HXe>Bs8M^u6}dV@WXgL>10Ojm?B?SwtUg-lw8JaC4sfrgLN
zhf;2cwO)xqbcwLmiB|22M8=C$VT?tDj7yr0gOH9;*N$87j!b5cO2?2~X^~BQk+;~9
zUhtArjgy|)lVoj_Q^}NLqm_%`l~-_<SJakfhL^XRmtWeKX}p+#@t9k5np=gM!H1e(
z+nQ|4n{11my4;;)@||OPo?@n-Yp$P^-Jf)Rpk{xfY0jc|@}g{%qr8HoYu}`Nwx*l&
zrgE64!{DcYh^TX+sI=j#gSD%F(W`^rt9kURd%UcmkF9%}t<B=DilVQ@)3J=?v5l3o
zg2c0@n6!qzw20-jll8QSthUM4wv(N=i{-bNptz0cxR%Vit>(I%;=7ZhypyrK(%8J4
z!@ZWzy|L@Po%X$#=)R$+znH1Nn6JOuy1~%u!KJLioYup)+{32o#H;tkq_M`M>&UOQ
z$*A4RyzI)e#>>{;%dxu5t>MhR;>@%5%&+dwxxdh}#nI>G(ZlZ1z2wro(bL=c)4Ijf
zy35q#?9|2d)V<Tz!130@$=ANm*TC}F$JE)w%-X}++Qj<W#M#^5?Ay!o+so43$=u!H
z-rdRh-OA$L%=F*U-QdsG;m`Hq)cfJi<l@uX<MZ0&)a>Nf=jG=6<<{ut=Jw{>-sjl%
z=-%b&@$Bi{;_BV}>fQD0;^yq(`RwHC?&S6F==tyH^zi5X@aOIE>HG5S^7QTV_VN4n
z^7i@l`}y|&|Nj6000{p8{RtdMu%N+%2oow?$grWqhY%x5oJg^v#fum-YTU@NqsNaR
zLy8<pvZTqAC{wCj$+D%(moQ_>oJq5$&6_xL>fFh*r_Y~2g9;r=w5ZXeNRujE%CxD|
zr%<Cxol3Q;)vH*uYTe4UtJkk!!-^eCwyfE+Xw#})%eJlCw{YXiolCc_-Me`6>fOt?
zuiw9b0}CEZxUk{Fh!ZPb%($`R$B-jSo=my2<;$2eYu?Pcv**vCLyI0wy0q!js8g$6
z&APSg*RW&Do=v;9?c2C>>)y?~x9{J;g9{%{ytwh>$dfBy&b+zv=g^}|pH98H_3PNP
zYv0bjyZ7(l!;AkPPrkhQ^XSv7U(de1`}e!i;hImszWw|3;p^Yeza*#)00t=FfCLJ7
zM1Ke-s31jR6zJfC0LHW6gcMddkQ5MRIG}_UcIcsg7y@|04kVUHq7x?WkirftZ1~}e
zFs2uxh8l7h<Bd3aHzN!urs(4iP6XLvggF*z<aImNpyZM@z~JNxE1dA4jYn2#<#IC~
z;p7i6oUr8&Qb-|24O3oe=9$IKNF#()qUq+FxMi_sh9I;F=bd=EW=#!H_6foUB0w1+
zlp<^ZLZ5xc!O%C~l*9}(7+J&2J|fY>Orr*=g9|9=loZdUd4?*gLOZ~Ki$HR&A&@mI
z>>$xT09yYuQak|ma}f+1{34Po8~k8U90Kkjt4Nn@AVos-#Bs@}%%Zu&sRF69f{nPm
z@M^3h;d8`+x8}NQuLa=(U>0#m3ByRm9*dBik~HhCm3CqT>juLX1WFu$Kq?SEvgDzx
zt;{^~3n74@lgcCSToQ*Ql<xCLyAFf$%^`6>>(4tB%ks-3^$vt<Dio(O5WoIjVyi#s
z93n;@wGeb~zAne{NU^>W1PHkP;BvwW_~7#hDAoXy$1^d*EYLm*b1cv^k3f5Hqv;AX
zjLL*`It;Eyi0qFwk0^_eK=eG4iYsyG`tI5MNs@{>3|(@FG7rt$u|P)%2#P>E2$+RG
zhY0^@%@2kK=!8GCZqUy=0R9P}$nQug;IakbDxes6>rJ@g0771OfOq?|d4M$!#Onqy
z05Z%#-w+7x=NsIO&yWDR;?E-+Q0`COviK7<?E#*EPadHA^Iz|caw8xhXea+3nWRIG
z5a1iE@Q6cl7bFXy!~7@0KF{p%13Lemz&C)89O4h)FmS^=;k6>ZK^*ARO*ybD3{&g|
z&U;LHGQ3;U{rBOUU9aLHiyt8GdLqakp!P8g0D<BcEehR08Wf-uoGx|78b;k#;12{U
zaC<jf!7uuj0s-0%ce*o{Kb#=KZxo6d=m1<CxPcA;u`F-CGTsKV@Q6++?}zDef`I>q
zKoGV~P(bHuNc9K;Jn8k%ANX)Z9waxu&;hPp?%PM<4hJB%6>D&SGoL?Nv@Ad@i5a+>
zo<II1vM5dwKpg}f!~D_2NA#~)Nd%q*2f~auMhJtAYTyR;QOEuPjt~OD6z#rHx!gs~
zA5+_0?${-~4U{lv0NRHR;|0V{h9_?U5`lzjfvXebK_EgDkl7Zp#DM^711E^(36g=1
z6aZ>-<FnoQHXt&3WO9pH^am$4Fu1&_kxa{?;09!YtIjpEmbZlC>|p1rSITmheXAMm
z_V|c3n9Ujhk_84ORKpF#!<w>82Cniaz`gl{Opa7xDvwa8Np7HB+e{>Y-l6|PPx`Yw
zYT}?jBo{k>tU*90;ABBsDUj>A%3-qD2O&0aAaHIVmjeM@?tD2&U`q2pgS*)e_F>Uw
zS%W_Dz}4OgH!zBB4UWTT+BYNtpl>+T9}wLKuSD>*y6v%UF!-89ae+aR4KI!leMCet
zbS!j$U<dRl)`9l%r+7-iqVE{vGW{W^=?PLov;%=Zj3?HAniV|X7?KD?c0B<xQXS0O
z0P>UwAQ4>C8u$Rvwn*2H@Bv~-_~@Ie1fo%Ya8!%!`zSH}!HmQOh@ArkP?w_DS6KcP
zK=??7q4FT774##o6b0&M3nc={?NM9+QtLi2*ed`j3bcELK|fHt0$cx5?ib^doK*|A
zhE(3IK`Ri$K5zvB$xV-}XHBkm(D4XDa6_L08f-iy5r>vJq#p$$8Uz9KgGTKmL@e9@
zF8Zb@!fq9`h&5c{1o9tsfdU2~5JTNMM-W`);ZG}&)pr3D-cwx`1X9q~c6)`XVb~G`
zz}llfQejK(b_#=XBIeipG2reB<Pv`ZK^8bf!M(<FZ;z1D3WRvu)EYLGAW&oK%BtKJ
zUndVoSV0Ybu!d88u73WI1PhfUhTLI<9+V<T&pyHlF{lw&7CT5*g*@Sc#N%WH0kT1s
ztPp(o5V}xo@<60q5Gs#M%LlR3KD>M}7n@l-YbX?fju4MW93lS;-{6Lt2lRuv>7=pI
zlM+vPg26NUxk|4b&=HV#i7YrF3tzwmI@W->0J-WXm)OD1oM7jh#A923&UB7aDIh7R
zLkx}+&<|wsj8NBAp_)#$s+GcN0Hq)vpezswWD(&|qI%W1&NWc7kb++K`UQo1P#!>W
z%~;-A*T_zGPlD~BQ!4w}&^8LQ3*_u*Tl?BPiN`Ot&Fyag!id-ox46em?sA*^+~`iX
zy4TI_X7wY;71;;84FctM+xwqlNb*IZq%MlAp}Y+p*+tQUj(Th4-4>ZQPUX$;gCLwD
z3~%_oCmt2tUgC5bkww2JB5#6hV8VGlODYuS1aN2M2Lk^!$S>xa5OMi9jspVoK$9qu
zwhBn*6wkR)xKXz}uv{Xzh=Ul!sBwY}L+Hrc2OtJbDOdbL$DHU#94dCS)L8=^J=?%H
z#2^NI{6ZG_280^5(vL%d0(jNV2#XM+LWQ_|An3RRO;>OUlNrQG6p8!X>uzwJ`<*CD
zw@4~ZAPGq%vFHNP*&#T=!8jZN7e`Q397M1(%HbjlV$@)-j^K*C!hjQlrd@+T%@wMy
z02liJMeZO7>K~X55O#I;Grj<VBM{9A2YSZ}+O_s~H~|C*rXzqT2YXW{o=XjS`9NHX
z(=XU{u1>-Sm!4bvQ|@C0Ss)W54Z{4t9^nM&aK--$04yPE<V{$APrpqJC=hgTJqt~a
zhZwSe@w;<^v4`*X52lw^f1E&8)*wD{FgV;`U4S4)0`YPCvH_=)G-6;4CB$M{(Ki4h
z1zB}HDF6s5AU=&nF0C_0(z7$~bS^c7JZlFCAOH$=gAUgN1G3P8z;ZV`^9U`Xd<n=c
zLgaWGU_LOg0(Fx+FxWctA_;(_FCND&z_J5kP<A^YdY(ggP@;ZPC==qfD!Fq6FV|z=
za7hcLb^bs~4b^Y-0!ch$PV9pZ%2E&q=y4!7aF<|Yl3)$TB7s_w40+HZ=W;#fLpyf(
zJ~xvE;50p0H-ac5SGU7K{oo2~&?1ncLcsrnFFVv&(?dHp=npOhE4~6N=OQ`W@`!&3
zE64I5`eunpIELcl1cwkyo_7d&gDF$^iYkFPvfv8P@;X<x0-aJP2LS`A@C_o^LH)J^
zmw*mYcm(Yt2?vsfHiLlvkOD-Lbr%MQa=1oZ!3;G3Ie9}5dYD4PFnW2A2bYixJGeDO
z!zW{9h-)V&Lbm~pcr4xsjt#UdG*yY0$b7{WS-6r6{_u{M04tQkE2GGKz(Nm|bOhg+
z2Q>r(2YF?%*pMbcCRt!B``~&6fs6i!bK#>|4FyZG;|d@k0*Ams%y0sB1u4on5I1uI
zC-Vp*kOFxSa=Nny4>OH)coqGS0wVt)G|>}BEAU<-5J!2y2`8{DDbSNp(hon_ASTE`
zQNj#$b2`O^3)d5rL+KBJatXLXkKB?sDzgEn<RtU}0yO}XLfMZSpeg{#eWmy{wDNc<
zKsh~#3qMc;3g?h^84~d31h{|?&($enFbw-JmI#4!a7QVi5IV=UP>I<UkSAHPay?|S
z0<yCY5q1QWBA2A2E4c6{7=lPBCp?8xH_L({bXl2{A`30@gK8-d?*Ki*HBe(oJD@<B
zdL?gX=?`gH5CW-yv-2nELt#>q0<v?L#90!&(j|BElgvOa)+G@u@B>GX0+q%W9k-DY
zRS*w1G7FUu3P+Fvk)1~qH+}zyopnhOU`Ck5nVuoR3;=f#=-`TnaXpo&p7hxm=;;}&
zRi5>^pZwXM{`sE(8lVEoECa$p2NfX9z-+3*I-epS<^wwyH97?)AY*46)wvOiIiMQq
z5Cv)uwYCASpbUCr4$uQ2${?X$X$}x-4m1@Yl3)%7A{zNd5unf_(@7C4FrR%fqbHFJ
z8M>j#0U+iuq(oYzMtY=3nxslPq>|tcxcM0tSAP-#12;MmKS~!-dJ>NZq}L&&OZuf?
z8m2=EI2D>1Jm-}^7ZFqncX=QNL_;`_kOgZXD})d<PQVP-a0$2|1?IyIQ->*ex~F1<
z50W6KZz>mO>T?kH2u}a-fap+d9OE#JDl0KGj9Il0had&32X?q1c3heqVj8NVYNWuk
z0cDCAfoBnGic>292(kbI@>T;<fD1K{J1_u}S+kin;0hK*54ZpW7^kbeIt={)owe`-
zS~C}^N)d<f1J6(kjRFI*^9~>oSk4Nq+EQEw$yKuotfE&t;`6D-@d$Y^q`q*jzA&WL
zU=5=hs>*<_>^h{SI-HupeyTbw;=&0v`gP%og#$G`xNuSl<quLYoIen(16#1a00Op>
z1<5KG_UeA~r)9X1b_FqVhhRkS#W#wAvEa6)I3-sqD0UARf#PZ$LfTkAu(Cs%1zFIp
zMS2NJ8V4&Y0y6(gq<NrVmr;cR!3_~f5X``JWL96pk_tTu3K9bdwo|JERWFc-Dq3@}
ziN`Gtt7C-quyMh&)^LR{*EKpj5W|2Wog<kk@LZ52wsZq6>VQ8;yD@P%hbLPcDZ2qi
zx~?!wr1bKoLvXW2>JCS6s*@p$v{<o*Q<3xl3fs4f!{Stpf(`@}R5v3#tC}-Z8@0h&
zxwybHeS@`cA-J_@kpuBJ3Gt>xcwsn0x;0~DP&7tu^bIo!w{bfhb4#S);If`Dq}uQW
zz90pF_zYsOyK&$@Vlbqqa0%Mr3(MpS&tMLxkOe~!2SvKKN7|x;br}$OG7LKqy0<kn
zcX#(FJUjmb1Id67WWsgRGr3R8RR#+JgOk2l;0ncRESy&t*NamWNf4ro5O>&vK2~-<
zw!b+lHGwjgtWsN-@Ve9(yTUQMM0yI5H>A%HJ<S>iBDw;EV8O~D0`e*bsc?Qf5QiXe
z2(Iv=L@K>U3O!fa7gA~v^On7=Swi3NXbz!e_Zbmcg%ACJV_LDo@iq{8$(JazDqlMg
zRPw7%Hf02n!U~KVBWw<hWu#LF!60f5gdCk`R1?qJhBuW^lhAu;p$KTCcL*I+L_`SE
zJJO^`Q9(oRO+fkC=!%N;E?`3F9Th}WgiuvPnh<JU{_poayK`n|_sn^oxvwi5CiaVI
z8F1%oCmTF&HfR%T7U+nwFH7&|`4`>`1$hn|Rx{;v9E*s`)*#=z)XH5cwW<OCvE%g7
zLf!p_|Imi+yA2*Nb2S0Lw~Gp)G0bvwkN68ug$xe5jre<(QDlSbJ@#wGHY{L+!7#`6
zcGOb_rxI4IR`2p0(>jqY-Jj=&%YPyptnnK#>!rb(Z-Ys=p>LK$+a(tmYJD0htW!9(
zA`!SBP<VC%85zd;MsTRQa=2dWd{g=mWe>e3gWj<$&yW*hxmfn#;()b(55F9<*c{`G
z-nr+Nng(~kgd>*W?5Y_N@JrmF(V*<N5}uHY=&GRiY?}!GZ#@6B(0lFXLRToC9fZGV
zm61ZgbAW}x9fS>w^b4gjy?-#ulb-N@?<^mHbwzp&H8fsD@z8LoY{3;s(ed!j2~N=u
zkPOMtL+N4Q1)toY(aZ<q*Q^Tk0JbUM<F8>B-Jp8G?>xV1f?sTYlnJoWKVY$-N}PR5
zj`&?{ay+^mq%EZV$!bK<Bzxk|^^X@iCT_L!Y#MO!{6d)@u{%0)E$mNTWfd&v*A!#Y
z5I!R!rBNa~Qvz(2fa}0^aw4wL=xFaLlZi1Qaw*4rn81}%ceMgQ+gRf<$Gs7Dq7eJB
zEvga>&JLSuCu;%^iq79DLdSXoC1+5nPrzcDVe)z~Pn3r^JI)M6@8y*Ij<(Z4Pfeq9
z{ZO^fy7eb!<ThtApM}7JALKm~SrvIh$^OioGXo)iHWvLPm{W1%7iwqj)c?x{TS0~~
zAtIPwhO|}P8GLD_NR*?iwgx=>J|^@Xw(>G~F7^FfT^oDFH*Jo=4)$Sfbg)$TD?N4d
zzFXgg+}E(MV`)_9@z-OJmR&YO_fwQJPq;7Vuy)fA?T5DZpTn$7!qmcM9rlz9UcYj#
ztz-{oRJOcpvf<Et2Vuuia2nw1^2J-jn1=PL-<VSy&M*tE&wrbHLpp=n6#2r-jg%Ut
zI2O;N(PUP3_aAeS*)OG2`y#vC&-^+50d!*Kc1nMk-|?$?BTG>woymXBaHl`?cAU9J
zQIe_M_*<=e9PT6NU2}A!JPHTY*nh3AD^g^)s&R+b`Rd5k%`K;63-}U(9~GTFVqJm0
z8#{YtSr%RU_p`?%`UcEGWc6f&MX)R^;^4l$xX$4U^0*md6%?*aS-ixCd6XTpWpbZs
z6M=na-0(qq@z?z~dA6(sCqIM{ONC}IAWOv6>C{g1lk468)kA|BcZ|N?nQf46ZMf;w
zYH1jE%Wef++yEvw+^`_<G9Z??7;evXKK;tx@|^wpP$MK5aad%*u*ni9u46&8XV;g#
zjg_U4@`8yC*C{`rtqa=~UAW$#zz{<c*<hYO$ndkikK0cinq8V`Y3e-D(~0@YKi?W}
zf749_Ho_VqCX&-NYnjblG9`?B_5ms7qVi_&A`R6l&9SKl`vWGkXl-i@yZlj%*^rrU
zJp{LXf8KY2uDC9{!_r&e&LEcF-H&%zLH4fw$QAngXA@#aWb1d&X-h`YEM(;(pIFU7
z*})lY?wZvnfAi|WZ+~<A?Lhx~XAF;EMBW!wyYc3qerKb*$NF!kZyOTZEY2%#yUVgD
zE8K2;PbYXnM1*8|<L|8AGxmR)IZ5)&7P#ls_4~3CG7`7J+0+~{y*SJG5Gj|_2?ftd
z?Ho*~zQ2*vnTw)zW(inA0=)>tP;l_Z-?;n-g-eOAtw=Jc9ova6XUwkiLzHqlGP%7C
zcHSe-?1OX8qq|=oW#57x7iA&w*sy`ahwp_qb|1yapcT9ix$)o5;8#WFdj-L}(fDI|
zbblOO5PRjp(Ma9XNi5HoQFOZ;ypv_v;=|dyS59!}N9HheIC)E~cq|4_KOb|nMgMAF
zC?5+#{VJo06UOK8@r+z&J*LO!4U*AVi!#Cl)hL}$IdE}$V!<R^)F@NJ?!%&4p3Jo>
zk1rpVE)<;i94)i^xP0lUdf58nmyc2wr@cwG48FY8D`jT+XFX>={k&Rn#bo^uJLzlm
z+O{!pX=d`bZH;Ts>+U4Kwa<0llU1Hyr~cTtu&GvVMEFp?vsO{(zl$ib{fHc<^=?MQ
zSL@melrXKmQae9uaAGr8?#EN@)OioY+{v7O{&HWG_~lOf|IT@}Ki-7*3Vi<OH(l%b
zyPfWL7U^s@NIStjN~o^ui>NO+B!6~T`6Bk$ocg3s@MmjN@bBKCuc}USZ*$`uW{=c8
ze@2G>T|d^Oh41{FtoE+1X;P<cE{(l(cGlT?X^g*F^W(?;=%dFUZob?*Q9RwDe7zck
zhYK9NCPBp0&*5Lx&0N-Jk+NQsVP;%BXTTzJE69-jg3^_jTsFWJeRRJ0?=CKJfAlLJ
z?er_Xtd~FKyipsT+3b50sI|dRtR;~AQaqAlOIIvoO=bZ5pB%gCnP*^6h>X>%kfCzn
z;Io4#Ee?obdiTZTi}YdZ(29uF>)V$ECZ3*4Q!e4Re5st6dzv!Xe!_lPdoMl9LXEk@
zjGKNQaj=BO9M3PKZ?WVnVG(;z(XZHU99mk^&SKAee0ru)sn6_!CnL&quhp<FHj}i%
zaMhjF%vwns``Y-D`XuU%gTeQ_tM;B;;o_DSs8Y=R0?}biSl!0UMAy=hWE+LJ<Dd0v
zVU0~v{-Klq)U3+6_QV6br<02A!8Jl0!Z9H|9JUVVyf%HmtBF_d{Al3$5%BfjBT?Qm
zqHCccC<mH%pTo(gPHr8hn8vm1n#iX~A0FWH+O;coRmhJaxTPMiF}i1{!#^%0OW8zv
zrtPMrdloRKuH<~^Y|m+ZN3CVDex~+SZSZTz!_<|hQEWTCMXKZKUN4^5Wc_Etvf$@S
zfBmNEz_+sg#T~UIe7Bun4Tbxzf8CJEp?|x-)23g;*YLxDmWADQuh!pFcM_DR5MORo
z@2c~ZmhYdWdc9*FYg5Y=AMWCK#Ts!G+&^$KpMzP<AJ3N)ekB?*s=0SmH6YuE3LVi^
zjY=?qt}x{dRFZvQc1&F_&%|z-I)=R{$k9L!y+7t&;rg_W^u|W3o<uJG-u|-!sg~8b
zy;{n1Yrph3)ai~=evZT{7r4*y46noc{<~g9Z;yBX<|<sgwYFsaqUBWb*ztQe>;C%_
zZ2tW7dq4sOvwwJe&iFu<mA)GH=oe!Uu_yTIL7sx5M#{OUx?Je9=kr<49-_<*;_-Cl
zQ>LR=kT_c~4US)(XW}h_2p#uRM9+#QOfP}1jAiSW2_|zqeq|ctG4nitod;vK;|1&Z
zT3po-oGMne8coT8qURTwRy^hz;1|XI%Ov!$$WI8KO6553DjLbnu0{*!{b2Q^W+ttb
z!mUU~tZpk=j0dF{!`D4XD>M@2KxG#h=VLJpN)|7R6>cGtafpx<e&QU$WX@PvFFQf@
zk2}P|bOMb!g$b=;@40fahs82<w@SyQK23k1tc5pcxzgt$%#1y==V5MZY?{yJzQknA
zH$<24g59N*T^P=ZPwJ;aq3T@%3p8ewh%ED~NKt%Q%^BV@HXiC>j3^`Bsxx-6*i<C4
z4?aE*wa_X_?}%p{iBGy<*Hs<zs~xLR9|?^(FuALIIHSJ6DCSApe*W*j6^AX$v1s#t
z)ddM}^KUs&(E^Gn(ezV&x{QvQT8v0Iw7ZU)&7hWAEix&GP#H5pp(`NJlk8Y!3H*3$
zod>G`!c9+HB1KfeJNaz+&-SPVre&?_7n*+-FNF?%q~l&*mbo;bgPTZ{pmmAX5kWdY
z4o_@1nn#wD<Y+}^c};bH#HWogVT@%%i}+!hAg@f#e68}>m9e=uq%4J|tctv@ywqxR
zuwO7Q1ZEqnBK~9r@>kg8`H%(80}whYQt<QN*x(|>7{N601iE-j7shQGKy;$6Wms@R
z*~7e;3`Lmh4h*1wd2g6uMHxwL@z<j~|D;w;U!OK!ZLBT-Q)P9RJ;DbsMkDlV9>rwc
zt0X<9&HV{XyZiM?WmD5oIa2PwLkF4~Putr+JR$P2Oc#UV!>kD8x=LBDC5zAHH3ejO
zmb}X}2Yg3i@|gUmy9vJiDeT$=wD_mAB(7-i`&v(^c%CT4Jo!=M<ng-UFI-0E4u!u@
z9%tPp>k`2P0iU{`Z(}(@2&fBuvlt2$1OP&J1<PSRk_qg>iW&jH2p>`^VcZQrBGL`#
zudR|U0)^I`Hv3w@@iFFe@R#TU{Oo94^xEJ}ExHQ`q+{tcQcGkVTHz4MoXGf{n=a5X
z-Gh6`p$h1^(Fy-uRlVn|U<m-mf~_y~Boz$OMUz#e`ucsBJx&L}bYMwkima(oUrS?<
z=w%q({%<RNAvYae+S1`E9VgQX!knj=@E&{CsRv%U5qgnd=SNL-ap>@pneO!uH>$E8
zx?X`BJrU=NYym%CfTYRh;d!?h4J*GeW6s63>gK30oC^$KyIQcvA?jtwSJVE}f`cE)
zHcs+8Z%NeosQ%nPGgO}&KkZBL8vS5V^5~~5#_x2XY&ZaD*<=lt5&_uNc5_Pw3-yOy
zvS_{tiW+f+0un?Jz*`GvBLb{GL>PU!r3(Zl5@}E{klzbH6*2&jpa@WQvhxNs?oRWW
z1MS}4WI64WLgJ@65k;y@b8$Bz2qI9{OKRb92@D-BT0$aPsutoH?n4~r&U@=c38TQF
zT0{sEAOifvQ+AUBwd{rAAO`@js5SG0X)4X%&HnfcNHDUDYB)3nguxWR!23ib6O^=w
zTF^u-k9R|fY=!s>{|#=$z<`UR%)s~~b|AS97mrWjlPdz9GR%AbW^B-K0A!=J=TY1!
z(Km`h*_;T8!etXpq~d-Ej_pYW;{WwMX=d=L(qyR2N#_bR;Juxc)loec%!(5JxCLsT
zWBjqew<D;di==A+(i?jTx;k6AJiQ=kqMO3+kAmnTV7gkks_JsLpiA<JU*~$%QHIl}
zO+3J`%n<|YP69KccHYf%{M}i0>;P0x+i8{<r$WI^DF)*0D|+`v-1R!-Uur!XIlm<Q
z8w8o|+#j#Cr{G4?>U?Y7$pV0_pWd!H0M-Lt9#WQJZXw=PbsEwxgtRfZ0GuD&_4?l*
zLx5OjozP@mZWORa!B+m(u+~fX6`Jwe55GokwvIz~K0)@xAw8vI0BK$QCz_#ZiY#jS
zEJf#75V{A+?<tUG#s)YT2M(RqMCj?W&cSIFTATL7o2J0FtlrtH?QOD<^)zh&)!0Ef
zM|Z7J1jYfQdXlYp`&SNK!89aWJd$C9)I6jt+pQlsN8A^$r!vOu*W)ejkj-v0Y!@@)
zEGzhS+MMx*a*q{KKN>I;AenFgZ5+-xt{owuZ}6nqE;nmpTZu*@E<Ztvt96UX5rt7i
zS{)oH(m$Bfr%h|J0)W$M*5I3W!bLsJly`gus#X+LgZfkPb^C}S>RMhFpPp92f`P-K
z!fCdFh5%VqcBwvn%RtaFzi7C6wIG5P!-aeFA1O&Rt-HB`9CT3_6#0(kL)r>C7fONv
zE+AJN7)I)a6_KotbU!fTp)_qL%X6W`1Tc|!8I`CP)X0ZWcg0b1nOo^j9_?AVCagHX
zyauk7ZNg0e2+2(dq6Qr?U{8x@Fa_kk_A3w*9>yj3;s69LL61PpaE}*8sZ7OX!PRu0
z>|`a!C#0N$&dt?*l^B@6^=BTL>JGhAPy@ipZCC3Wu1EFZtPIWUAo9hG&ID+9o?#`6
zc+^K_(2*K6vS9)OfTd&p+*SV(*PP|odzm-{C#jkH5VJUl$Lxv7p=KIMmDHdmwwU-3
zLWHzX1fN`xk3W?fblV@b07Zc91$Z!o2%bJ?F47vTc+Q-50f;18Gebc%wcOvx_eW}5
zZ%)sm5f$dN5vvA$io;nKE{4()A94_7O?Ap|0sR6)^fMpK4a`JiYv6&|d}edyxhSYR
zVkrEn;hePyTTvUa>|OX(b3#9vr8VJqUV~2@(n-&V@fCct5}Bcy?J;g~jbqHd!lGOW
zwpaF!R++Vtmt`-aM;95}N5PLg;t?Xmt@P0Yw1rxZgb5kOdj=sBng1T2BH?4X;=mli
zY3Vqh_$`#Q{rJt@SeUU|{g>_Yo-_bRCL+tnK|&@8b}>Q~OqP-2_oqSk32_UCDK{$O
z5MgPI%2yoEC#+XyeF=HRCk?O?hs8g_RcIDMJs9w_Jnn$}f!Of}Bq(3|m8Sj)i2%&c
zwhw0pt>m?@OwPll`oXt=_y{1uKm?jU4yG%WSTQDyo?VjIx${vX^{RS6Ay%17&nM-Z
z+s89uA2pPPwM>aHQ{ZnLl8r#bH@5Bu1BQ-(L<Z``5oY7bm;&k(G`o+>u1Ut)Ts#?g
zEZ%63h+!a}dT`)cxY#tMBn2G!pArLu9>9Va*VWF}Jg&0qKdW<%S@zjAluX<yjv|=j
z{i!BCEe$D^CJZIEWGkYe)5iNg!1tp<DDKq035Ebuh!!*piWo<!MqX`giHEsdA~MnH
zqVK-57Xd(~*Y-D5vrA2#SkauyobUIO?_g6PL)RSteT<ysGDZ<E=4CxpY{&FGzmY#l
zQv<v+ke708eE%S$hNrj~LG*43Wn<bkVNdAMOb=o%!NjK_+Mr!g5eU!Ex>*1MOB31u
z*dA6~gV!c<^^0c_Ab*)s?h#C)xzZf}eDG+|f)a?R8u;U@3dS3kw%OrqE<{)mQUCZe
z5qpucU=?}_XEg<&rhwo(FoQINRS#eYQg$jLdc4(eA`v~l&nQe^KmEKJ3Tor>kp&I_
zJm~aKk!Wu@ZQuVjHw@_PP-Y7vn*Rndkj{w{0BACC-})Lui!O_F-1^nVs)R|R64;oF
zn3RyfWe-GV5M=IN<GyO$rbzS*8z!e`Jun2V%rw_4GCUBs8@^-%$F&zQ1Ckzgkl-)y
zl(=g@lkajd(%o0%o@%E(oBY6d*z9*HG33b*01#288ria{lDB5|c?s^<bh?y?UY>Y1
zfVd>z45@*yj5wWXhdsDp10n)hnwQ`rfaKk;4sxm!2^tJ@Q$Ue3p$G`$A~q@}O)wMu
zET>gifHfF#MxN9mrwT5bicb3hO+FVa4#bt(5KPsfmY<K89B6v8ad9pBZ?pbf8@_m<
z6&|D<%K?a9d+;xz?XvVGUn3%5Y6B)1tzWhK+VTCiGUs=B#3M7ySOC_YDr8GbNT$X|
zi->lEtI%6HVke2>lF8P3l~rZQezGaT!A#>!b@Lq`yp#<Bi=c~3?>;!-S)|Pn6^WN|
zMEWXh`lq}N-4p;7b=^eN{8@VEK~#Gxa79-f*m{Bsiic^LI@4SLeiep2>>_{w1^SRA
zx_^L+045UA?l5uxyR#qad&72zea)g22O#En5#*!(m=h4P2mG=Zqq-qO8G620jUqo%
z#yb<Odq0x6;CA_X{oN4S60vs?aMK19J%EWz!zBx*mn`6Qib;-IBmBnM0)Z&gvSdNY
zWI2~o{nQEmAlP|Qg&HcxpBoZ24e-vzi|bu==#PE0zZ@j&eZL>V3nZxdNT-g2{h3o_
z2OfO0i^24N1P@UqdWZ)`M81l||0L`{rl-OK065WAN<{wTBB-b&xd-Ud1C0PqQr#a|
zAERRI%Xd?G3x)~*l=M^>@PR)jv=<<zx<S^2gGk^wBP-48I~bP$PgjfkZ3bBfrGCEz
z5^0lu(hM)Cx%p)3U86&Sw%UjM=~EO6`Cpcok(KMTArPdN7*1pqA<6>FusNHx@~KCP
z#Od;^iQIY5^+L=h?EC9vpNA59K!P|B-ytn}ZZk<OTRN~J;igL21p>F8+6pV_w_3JD
zYAZDIVW*59F2^VLB>@yha=Rzww=YhN8uEan61N@a5hSO?vqYtPGuBb7v6rf0(yCCs
zndcrvfCNeAXovd{FJAP~YS5&a67k{AQSr4C7k(yu?|A5?MW5&ZEBC6F+W&zQZG9F`
zX>3p?VERpaAK(J0N;YO$sKZg~*ScNIwwn)NeFr{M?iOkjSXaNGm^jFCW4qRaONl64
z%l5M@#osP{&yn98nXOUar}@b~Hc6~4P)i`enU>&s-8*3R`;QqESu(jpGWn*C#QB=U
zoY!e&Nq-8Q(eMhV@%d!w<&;R%7;04fg%D0t(KGi{COoE{jYV2zH+%=ZOhL&+h#Jwi
z!X518qa40k@ph0#gQr#wwSRT$kOd&7@RB!eN?%nyEfOcTJ13s}nK1H<k4yLf?en_U
z;O_qOI3eqSTw7x)6s$+=ZBN+RX;DyHUtFF}ze}M%`d#~H$+y$6sdO2)U6;tAO0-dC
zC~6w(^>DO!e%@~mG6C~)HB~n+n9@U>7v%Zw<3|KU*7us^Ir!ubjJbWdH@L>xqiBg8
zdJJ~cM2(bXkZllT#ScdJ3Zx~lMg}2}jMjLDYpz_eYVo~Wj1FqC(UwWp(@EkrqP8*l
zc}&4f9SMLbz%p$LCM^wA`GZhjh2osIwiN@9&AL3!AC!Dty)!SM*rG7)RDDT3_v02X
z_g8R>30MSx6KWB9p4BHUU$}`sz2bFwh%n+>#gqXP1%MQpmRulKj~KZ*hTCFYSPPtu
zl8`u_(Bn(349UPy0xVUT_!81;FAbp&2`xZe^rMv8deV%%4##qvkdl`h`P9O>^&%k^
ziFhtGX5K3<_craG*ofmaSc?EmbMqO_@9Gh2G#h5;)wmlQ&y$lOD76^Vm@izWG1rPK
z`IGruxi_GDNf%agUuwkMBOJVN_6{12E3QL?O8aL^KXf;H_;~W)^SQ*4)I6=ZO0V18
zsGDn^7VwadzH9{=3<PZ^T0B4k%q<BJpM4;?`aYMV_aqU@4WLxMFqpO`t0pNW%|)b{
zHzy(c{`mZTw+60okYxUor$|vVAwD$GA_Tb)dDabCsHgf7FOAGGNCWu-^9Q_<O4}=!
zr8iT0&-sa{LQwV~lr}||NS9WO7-oZhS)PIbj<=HlBhAeZS}jWN)|Oy|_jx_EAa^Z9
zz+08mo6f(s-#PU0g1v$)4I}=}Yov>uomKG8=s!R(q=dv+*3k3BgPz?Iebvx+a!>;&
z;1V8ZojtS_V_kw1XwbV51RLNbq3FFar%GsM6OM-s&5-Sx`K+`GSZs{q*c3y`q=&5=
zGsQ*%JP;QMMt(0MGn5_;bN1#mqX0b;s8rcJMkiWRIvxFlU*5Uv*9|r#3<5|u`2X6G
z`BY)`()fD~88cORy*cF1uYa=BHEw+m<bRKS=dAbroY>ez?avgVO@}C}dh$Eg;>t+V
zQoV(5I38`WkIK@GA8<qwXF(63uW^h052UW1_0K=EJp5QSbY1Y;*H<sVcO%aR9PD_x
znt`%UGg)UKAh=giRls5Rg*W*T+she@*Z$6ao4wMMrb_EHAU|^dlf;GEUj6X$-23!H
zjor11x3_)o^nir_Q2VZ4>Xr5~S-0Z5qF{caee})t)zzf)j}G!8clL6XN9npm5R;mV
z(^OA{NbDDxP{UYOjfyX^NOLt&lQuNrKVFe!*O6PjJHetcy*ElR$yi^bk`$TO6%S)L
z+h}6x=LglqGdQldxH(lF8955|&h-~MMh|y=RTZT64`jN%6&cF9r19S*TA;;BJfHo{
zwn4sKW<>cz$LI9rLAZ%ltBqjRK4nCFRgUNKb$4^s3=#bX@>kK@rrx7EevS`32-0o)
zQptY)A}Nm&QuiJgr#wuoD9O;z?}KLn=2L9LL6J}$UAZJC$=tKeS?8h=u2}?1_dN90
zgQM6<)xnqtM%-1jQVU_XqS6<-1IalI!MFRxdKIna_@{J^)tV=DT#7;}39piCDb53C
z<TBk=AjD9R7Q|s9_`@S1OTw;lGhO-7oLEB0^VjbL3hdMl0&n~xYo4>-`f&H0fv#!m
zS%MpBBU!_ac9jxxwS{snWG}iAi73K}zmdhca50Du5OKq}H>tH<_HNf9v9d`%Z802z
z7*|O`g#^8}4kiC?E##it5(pw4e3YNS*+Rml>soZXX2{aUOBKgXcD5<##-nVevm&47
z%$bbDwUiw<2}aVLcA8wpQ;v$=jh{DSTVo2XZ%$@$o|Jumaz3npb<V!UqfvtLH>#e@
zZ+vjo+lDwEH2^>KCuVXy)e^hmMDvMB>0-V~O4q&1#D<VI(Q7_0ecSDy!NhywoCEj8
z!lFXXy3S|~JC~}Wi_>r4ooK9WRMnjO<)ECn6&Ot;Xok_W>hxJ}$AT$Xu&qE+B4INl
zpI0gl%%mey5s)E~{L#~5!6mw~o%ff2(7^VagWN$jDc%8fo8*AehJus$QOzSK#y0R&
ztsi}){CJ02`2L}L^JV4wI;*DHX>rEQTnnvFpRzbAUt?sZfw9i>JbutoOi@s*?p9uE
zCyl~?oc)}$!drWJ&K>fN)&oDOi?yafFtf1^V?_(doqfn@sjg2{g``v2{+Fn;W1<CZ
zjFDR;a}BDAvFBEFV-;#sETY6XOQm~ctZGwj+Dpz!1oy~?)TTKdiSfQK=)paxP507T
z;GuZt(=V~|_;(LJD51Q<oJ|tI5y|#-TZoj5o3O|{SFH_cF!gku$<XjSFQgdFEE%kD
z71tQlAI6f`NLk7oQ!IEQximnJ$s{O2;I@y3hH#L-jXL(s)mMYp>gw{VqOfvwcbOr(
z4|NZl+OcOtUky2K)jjGw!s6m&hFyC@@~oMcY~cL@@`CAkWOCB7iuW+6H_q-b*^5}m
zVEA^&;0ZyLP3NE%{7OAHZ!@SzJd;!#R#*RQJxWSzLFV%9=cF@Y1yb5?L%>m6^@S%#
z-dcEIJcga~`O9zK_|JA@tO%uIw&)5i0j7zR(d{CXV}+s2>no8}uJN)8w%nCDu-2Xh
zG?hB8Q}s_#_4x($ufMo$1}Cj5i%M<AM23}?tw&dBX_w2OJxpaav1)4#6~FlHg<q6Z
z_wgwk;lBaL3JdRF#IC-&(lc!RieE6y*o?()+JrU41|lhhXBsx`QGC2hZ{R#~^U<WF
zUN2TjkFEqzbpS|ZQVikjldn2vDJgX5%6fCRu|~u#@mdWuzq~6uVl~n|xAO6)R~}qp
zS;x5^udM7SR?8mqcM>@~g29!7c<zWa$+N~URX$GO8p|L{a5a$iW^Fk#en~Dc^vzc@
z(Qrs=0Fyhi1v%696K(U~n%i6IL^ErIRquBoq_FPO(z?nylcHH{Wz1`#jQrS&0B58<
z^Q?858*B^$ll<}l9%S9zu^wHWN<IG$Qxhmb))vuO?ETs;`RLWgQ1#0@hxT*V%WF5v
zhr+Nq-^XVdP>1Xwk*&NRn}Jn6{VYNndUNu(fN;42-VZSba#S?E`bPL0j+D+!7Z=(q
z_kecg;OIa0bC4#2<1q1j%<%=cMzvxG=3Wz4D`~jdcV4I%fQ__!Gr%wTCH62LudwBo
zZnV}iXwz9|M@5%&*m~3xyfUMTHOez-H+!6CFBRD0yfX9lhf@~JlLkWU>$(k?13ML;
zoB2;3@O2L{w6C@84lgTzK#%`ozh!*%)cYRRbu{gsQdwH6PpGuUy^$qbFBz+!GmaYL
z+i8J?j6y$O{UZ;T>L|aCmR`L?w|$Se8+fa}$iW*N>09HKTq&OKd#@O*_U=Tv#&7Ri
zx&CgF@{5^i&b!W5!gqZKRQl`Uj$hu0GM$;~Y<l_pjk~{zF`ZQZRi$~G`iC#+(2Rz2
zY5n+iojGQpU`a`7vP)3%>LF_OYHoAt=RXo&zux^gnGJh6!rjfKq&&Cj1R>KiN{u$I
z&9mL7{pT0mrgmsay;-W(O;=2_@N8cYPP$pIEBr7!Eox$U{Kml5s;&I`_NDv!%|q^I
zLtlT<TvjgJ&;07b_H?^_#a$tCIA(ntb)Q#n_sdUBgvw6&$C*jRX0?yVHRdzhQU(Gc
z%bNFUz~>j0e>vS37;qQft+xFv6uz95nc4>De$eqJ@c!WkfssN5S0kat2Ds`R14Q}N
z0{esUr^>=Hnk^hUMyfaW=b3+e))7q7$*)UPo)V$(TckzA(ltNgu6wpwuNg4?yr#9v
zAhGi>OK0cOpRh^#BzeF-`+B22nT>xH%Gm*ld+}bISR@?!ePOm@xI%?kNxoy*qI1uU
z)?2%g154lQ+|T8^J5)?B1$GDaUDYFqRCE#sXTaSum&j3vlbdyPJNIa#llLAe`gi^N
z<C}-ZT|MmQ_wE`o4|``y2#&lv`iLPqCJi4S_bI>X0ZvS)M#i<A#sK#e=r!UfzXv=!
zE4F4qza~PcBr&!SJcfUGa5}rTzz{6GwvluEsC<B(C$WsUvxvaB8YvW+vX0vawToot
zIi(h)YPiCrP085B0UfPa4u|ie-5_z#gjdO+TY~i1jRem19!hVp;Qbv6J;n%heTMV8
zOKN{C+}IeJ*aKfJwCj#R-09)*HR4)l_<PA%tJ1}ZHh^xq&a&PoKsDumVd^UcmO_2o
z7|!e0GLUc2?)T^sTAnBA5rlmP|Ln(dBS4&~FjjLoJaFD7yNJ<(^+6B}ktxbeP3HFP
zVcQjP_>vw%fJlAP=SJnTgTWkZuITj<cK($5WYE_u^WO;&jo}2@Bd}XgEL&;}Z-1B0
zt+aEa35_m8(aFV92V%G>s{AgbxrJXNIfjG97<Z3?3+YkBrATxes2osKu0wJi^tFiY
zi|Oua3ULzbi5t;)!Nmc7-yYQpw<bfn1?n}U&LT)PIfio%h4zAJ9Fed^kl;_i*@_Z*
zC$NZCY<+qU5?(An!)T)wtE{v*dF-yoo&?*R(<y@JpDDYXVWb-9Zu;0={XwbPV+oDS
z0i@|5WSz)K>=MmHA_QYKJbKQFP+4jv$de@L-ol@*u_((T!mumD3wN75SDUBvAw*ZF
zwG>;C1<4arsb3;2!`5e>lElo09YKp0{3S1N1|n`otdZrq!xu-QBy3p>@<cK!PhZK}
zpmQbp<C-}m8ITeLiS7)KK}WjNiyeNM3RjfhjJ9I+#JABX;sad|J}o&eFWEeuoUMR(
zd|31_mt?-O>^ZgQ5k+BKq=U}p&1-)6#Mq7hSQO_r*fk7Hz{iIfiy#CsF&#k=f<!`3
z4-mjzqB;gl2?I<~&uw?+F=8(&+aZX#aU`u6Iv^P^Gay`&7MKdUdGLZ@Eg9zJ6=wY6
zi9e9U0wJ?bZr6OrnUdiJ1DAxC!q+7hgW@hfb`rvs8!>q><Wpr5OL(PC&M1f)@ef$<
zQqQeJ6caxx9+WCsmEuxCSG{2W_$~=43ECZXRdbe=87?S!CDiL(fD7p_{qwXoFHdWg
zxagbecmPrKSz?{1xNLYxxEkF~^}Ni)wy3s55GmJvI{4qG*vZHt@kKo2<}en;wQR^?
zJzJr>C~ebUp$pLU+X!(8mmchzIMm1jOEnedMf%juH@YMsiXce0SIUHuw9%f_2i$_Y
zi;Adk@TfSBZ`Opeu8Y3Q8*8jrYGp3zr@XoC6Zlx>@#`C5fAsW1(sgMi6G6$3&B0=c
zGKD2^g}udhRDN&;8u^cU1sqUpoWNv9PaAHrKwqXHw-5JDmZ}hv_T0;^lFM#YUha>3
z<RtJzmBXAqAl`~IyldYGygav3$v!z}atq2wS}u>aPp11)6Cd~AyCWqXH2dFyfxJ&S
z{ETl`f=qqj*ldxfZNIej0p(n}joq)+D3bJkK~~~**`{TXA-~LnE-uV~K5HH-*W54V
zh~%C(?hsG+8pE+uiYRQB7p@JyNu`$QqLxTyD@??Py6HBLGmRoMr3CSpX7?%N$0_gG
zWv{!U$iIFDw#MchTQJ}F&Uj=bOuHgz_Z$9HFVC(LAqYN2uR-8%3cM2BsBtM`lIJp4
zNjqg1M`dg-mS?lS(#`gJaQ4QcnoO3l42Wu=)dJydh_OuU5%)J`qCpVSGP&k4X~t}y
z1AryMX!GmJnl|1dCT_PEU~l$s_fCHQrzC5k;K%sPlF1dO2>iAwBV8IXYP_CtgPPH1
z^)}fJ_Bu-T`yhDM1@^6JJhW_x;kG5WR@e8g)vRtZfA=yRmDK)POea}Nqae>EI<xb-
z?0Yu)e{%|NNEVg4?G#beRFRn2oQT^`g{-n+qtDkVE4wT`>o%V~FDDhpZEU=m`XDpZ
zRxlTNq3*$-5{1gh#{<?*vNp+nIVu*dQ{$~KemB+m*%id8RP>0O#wwSwB36e-rho=v
z{k^EmG>?FFr{o{ciIpBq@DrGHy#E=8p6OoK!IJF$2Y(<MR>GC!ZoxOUTCs>S;xp^t
zg@JmkWml=xn^-aldx-_n-~}Lq4mYalIwt+6RaUi2TAVexS`^5YGmC@~pND_of?!0u
zfz~Gg5rst67N;iq=bc~EMzb8jE4z1Dl4yVCJdOIO=*B2i<Kjji8->~1|DZE4>luB9
zN#qjK>Im(1)m)}L3-ON*=p4Dcs;uhLkCV5$(Di7!oAbMrdC9XoaFc&d)gQw*d7hw{
zUZI#<vuS68Q<X+zQWJ(o6I@l25Zzx+@oc4G90Z@M!uO4IZ;2+G&f8X`+z%wxTIXJO
zk+6&BCeTuLpCfE>b#qPv8m24kkn<bXwNiC|uXP96-H~g|tFF|02{G}Y>zBnn17M2Q
ztPUGZ)N}XK&+i&%%KlC|K1r~zBuU8NAn$4wTVW3Uux&xFw*55DrzF<BURVz7Y+gDG
zxW4a7U1_S()BWHiSY58qb~EWeC7!9EpxpQKaqJ9zwNRAkU6^*>wrX>|=6ia5WBHnm
zp_ta^dhH+e4FlT}{8*j6dR@9ABz#f-Mc$GR8=K@eDc{j)u#$mlg8_X!)Yx0FU9{=b
zIOANguno5Do1Ct0gUNj*(|2b7t)F%T<C?EieBMe7vOj$$M%7PJy4crnF%E$)&Avyt
z#Q5x`uAZF9Si@zylI2wfv@QjWdmxcKP<(LX_wFrA)yAv3%C4wd<$?ypQ(!S$uD9fG
z@2r1+n}GFwWkS+FTiU={YNK7D^7WUE*Q=H7n;Y%lD?9WxI*chher|O9q3pEM==4|F
zd9Tr#uI$3l<bqUj<!N%osJKZrxt&vSS8a0FRq-%s^0=(xY1`!Ktm5TOZ}PgS;vLcC
zeP6{VsmUix<;J6?8-*&qFPnU;Rs5Qp{NAhh_ci&CsRVp(3izQCxY88(SLNnj(@nZc
z5JPhiQZ<;TIT)iFBGnvnPBm1uIaF8mmPzxi%c^0v&0)@};oi;RH&r7dnj`M3MkX~!
zW~ttO)O@>8_0G%YJJqUpn@{zZs!@H-QDdsnpPQq9sNP#?zV}!4{$BHax+;<3G&!Lb
z!_yLjQHzyoi9M$lr~6IWze{3VUr9+VA@`Y9zk$s~eJ&IzDYQi(S>MJXG9fE+7-YbM
z0&ynmE2V?baxnr*vC>Lid_gn}%|Kiagl-|rW~*gAa?tcwL#N}Fp3+-{rek$Ul=wpk
zu7-wDf@Is`AMCZ{={ktsYLRXMp{GGM(`0rOo{O_9r(P{Sf+lgX^*>pMd=5O1VBBNp
zI9-?9NgQNJnt_rYncD%99k>7A-~F}@aMES{{4w<>eXWn(jq<;C2?x=h#wDmm8tC{K
zmFl(;%HmX4AvPokPLQIlbjQ_DqfGOFVA)oVx&7j1n<}dJMKh$ZTEmV+Nq^tPD+j_&
zs}+Z~Jb^&aoch=b^~AWI#B*)BWpQt_5`<9X%DWKupceU{$k@j{)!qp;95GMQjA}7=
z>o~}D9Qb<0HUSqkc@#dQzO5w=rgel@vc~hc^ql>q!RbP$DSPb8#@{9QgVFwYn`Hft
z+#bnka{S>wFF?_rjuGaBcYM{fnR`c0>*?IPn+<6vRl|}fak_$WLPT1NvzBc`ob=p2
zuS<&-a68GbRX38tzKU0>Xd$FSk_y{&Yg&5#c1a|Ihkj5_3)Q%b`bq#rw!uJ&^N_C{
ztlQp|`R4BMSk%amD5Z3YtRTgvLJM8fKE%;6><%0Gsx|ssYwS>KoH^P?kRs`?ue1TN
zS%l!M_2b=pnuqq)q_sb~8!1K|SGp&R4ngD%Tc+Kk5+cB99OU!qAkG@C=MgOe6>Yk5
zhr(qY0@nJ3<W}7VNYa}FOm}OJiDpuoe&c1j{?i|j`a^@o2-;#_t90d|a1d-kQwOcr
zxyYco>U?kcrp|Ii%X5l)QrtfGEj9V5yDbqqNm(aPnj@2jG-qWafAsBla>P*GjWpZ!
z#q)04tZ5YWwF)#u+g8RtI*dEBNb4?*RFc!=+%Rb1=^C}YtEr@4bvJI=PxFZZdAGD>
zZ|r2$*+877!^ZMH7eROT6!G#u+{^pgto!?rZf!BcgA4&5*%@}R&+V<XkTLF@GbdH7
z(C{qo9NiNqbd1~3L;dR~-%xytRpRLTvUW|k_SwBI{-=0js^K<=x5YEf+q*ma96pxC
z1}WUicQ|iYm0$QzCG3FH*ZL)vf$diP1$wD&WCPQe;L?|9-2JUyxfGQbudn^L0e3Rc
z4B^N*TWytjL3Lx+T+^^ST+C{qP%k!kWvb(X#NUfe%s&pqFGdtOw%^%5*k&dKy-#+u
z>H64gg{d+3xpp9c7<2B;xRdOE{fo5UfUP^jR_+~vh`{gfZtv|L3q%IZQ&M<T*%~ff
z7xTK%7E=;6_fU~v7QZ4_zv$F`BFS30)iKyek^BE^UEZ&=lhZIhiieB;<|tV&{e?ph
zt{Hx7@we>}pEB2!Z=6o%9l%_piN8`H`)jgwA+S%gyO`wLQ4|*CZz%QE9o`l7)x0O&
z+^X58zuOAL_)W9&iFVnAwwd!QRdj6sn>B?U#GTsryxx^L*yuU4;c~7Np9zfc@n%l%
zQegMxzI#rFR7KS`HDgY(wT-?aP>Rn>QbwCWU6~m#=MbK4(jj+5<$DyzsM^xg`j?AE
znqH4kMuLb`eIK+@ag0^GS<T?lfVYU|E`RB1gu8yNeHb+vGGYA8f$@zt;;nh50ms`<
zSMCqSDe1=UfKaJFUyn<PNvqUuD<)J~Wt4C<11Lt^1^s#zjp$>pX_o|{htqC9zZvFv
z<UjKejO?ATP*){_f{HFVU1>r;J|V2v=a+mDyMi+iQXaB8++6t@bj+yyv7pJZ#Qqj}
z((2m<qqmjcq+2CMGJPH%Ep*d$NddiuzmiedQvG&pK)RpsvmLxU_IUv{RlbvVA>DmO
zKg-tVRrecRe)V2~_&54p%0=rbpI_!@gz!~FZ3UZQ9@@5fdlh(06|6juKH*y}N?4bF
z9P^M?`rumCGpM}gW5!$RR}!B;{`LB8C;#utM&pRF2E#9lhNb1RkJsu(bOio1O!mHA
zt=j*Ft$N)=c(UI1r&Hi>``gT3QKRFNud=uWNigH>9UZ~VZZ7Ain`)|8Oy_&Cg-^Ez
z<=+dw3hyO9-5%AZ3+{{?VV>=LxTGue@6$EsXaA-g?+fit`~8xlV#l7zQ15QN)|Q-c
z^-YR+6!qvCjhdm``Aa`}qqm117c3?AwMBL?{Dop~(7+tFBI#9{;!&F5{zea`FiOoC
zI$Rh)erlHIe#BRr8hmi0Q1Z9^Ytt;prm(`hf9($_#!DP?03(4kzv0fvF~Puo07;h@
zls{K89V=7>WS#Xd(KL1W1Z(vWQ}wsNJRx>TGzDotv|dEcwj{|5?k33(xHH%P?BbT3
ze?9)Rf_blCj$I`uOJB~F`5Alh8y140xG*|JHHKBm$uRAn9GSIRPrs>cA<=jPa;J}|
z&*c--<9}StR6Py$R``IJF4!<;|I*#M*2nz{>&;$M+@tnjn~9uWDPA&tL9-nnuYb#%
z$Bc7Pgi)PTa>>np&nJ;?Y`7`3j&cok+A%rh$!i;C;5o53l7zu6P^CI3Z$@P1e`}xF
zR>H`}m;KSe1c$n+9G-Kq-pD~R2fM+={;2g6_V?==sD#g%t4~nN;t>oTW;S(bf4(@J
zDhR20Yb&=wE#+lZ1bmctF~gEDz~0nt9#ix;W;h-0&o6q>evSRvPwSNxYOk!eQYn+Q
zMAxu{*#MR=G_kLS!nc!?W7fTt8^ITMCU4J3B7Q5+khT)@!6e=hA>m1sm{)UZV6>0&
zc*ZxmYK-<qMZR6+V&XH<5Z?dqju?j{z~tuQ@-g9Tl!CJLgn`rZ7wDA?a{2hs1!L65
z$D?_tM_jFh(Yth%R;Do5D>G&L(Qti<@!|Ma_*llFk{R|Vte0QeP5!cJow-(hkE_y^
z>o;NGx=sCauD3U?{l5NX#-_QGt4iQIgU$vT8BstHoEz^|DsW|Sr-5tg^?KyIK!o@F
z?))<VgVT3(R^*&JraA4mhm8G~;yH@Y4DF4}`Ir==onp2CAddS*HuNJCsIfvhfc*sy
zChr4caq%$__+|N3X9tgpZ3zhQ7Wn%4L3pE?>06Y|>9ePbk!b{|B>XpX_hSg=VgC9p
zN-8pxH?F>rE8s?oX2ODGbNxtkp!?4=UtaFGS7j<Ec}0s7tRrnu#X@g`>}2gX*rs^r
zk{QDGzy6?$?NWrMjS|8e^_=A!<~v6x6E#aNNDbHRbwE{cu{<%(p=*@)d{aR`4}!nj
zMK-a)xVt!|)18kkM%uuVxL~9l;^J@@?=tRh;thv|wt08{PEx$c3@!mJUeMYJn8e+T
z`o6bY%z9nqEbqYv^~T!g-YXC5#&?S|kV(@G7w^@c|3+?&ytqJ#2I7JmEt8Cf-S`ck
zZ$199_9l|oofLq3%l%l+gXLu)W_i4};L_JbCIQG`0QXLjY}txYzdGYRV^|SoZ&__`
ze|TABr%Yx<AgD+m<-!}B%NJl6MQTNw!{bCOi!;m%`6rF`l_VD{VOEzHMqAgCRNxLS
zI5~P3PmIOCs@tr&k;5g(@&Jfrda+l=I)%5O0^)Z_Og+2DKa<~^bdLMVoY#eeH_L#E
zA8el4-9+G<fC__T?>D$LvGmem1%qZkIy1muT;N0YUi-?k4F7gb!9`0G9WMu!&?2`l
zE+l9Z#c|_j<~vdv&iK7-9x^=MfPb7|tSH^d;$yln`xRl*Ie=#iuX(p1aKE`7Yq9A?
z&=Qz;F}YT+l3~=s&9SON8~&b(w9XDkf9yx;^w+ZbSPSyYIIB~lOV*Q2+NmF=;hM=h
z$^kAVjRoV%Bj;W+p7mcvu9UT^9ArcBt4I33Hq?8HYi~W&#bOrwd&i!LW(0jQ@S`tS
z=nEC#{|)`?f+~m@B-Sm$ukn84btwR!>0~XAt`OoMx4c~$lN)}+(t&@me?}*;D#32L
zBSbPgD)B?{NbEcDPrWtcI$gCaPtObM?<4xgifi}Zz=T;|^lB~igJSbhamW;x6dcWx
z717~#;ba<?Lg>o6=8-2bumZn)(1H9k1Qi;*fA0b=2WqX=<E8VeZ=rlMlQm~y<x9ay
z_2a-?yGZS}C6m<cu&xuv*896>Qxe!d2&Y6r@w~ERvX%!>teYtwPa|(16{98fpUuug
z^7KFvV2sKfcHD(EFc!&K19iYlQr~R!$56Y9r60#Y?z>@x|3ZRet6l_3(Jy9W=PpZa
zhzdM*6*zK*#!-bvGi7$?c>=|R6G76uq8~Rv9KQP8$zA+50Q9V@WNZy~N`x&@oY`s~
ztLF++A@Nhku<@>tTco{yJi};$U@Qr99nc4ikUPaf-{u~=m_O>ri=ViN--;D7FU1b8
zN*cznrT}O+YLkx}pBqlP7b!JOhD3v5X=kUbgQT|RHy@LcVfy@S^D6!*sZV2);Oa(S
zHwe?16qSVVq_W$0p`uF}-NEn|*-ZA-@L5sBCs*t)nYja{AHu*yg|UX3vD#62Jn$?*
zAe68xRu9k84KU*IOvFvr_wziP#Tcp!YjzNZO5*JiX`_#eBD?4Ku9qOzH?Wq)NMASP
z)u2DquGj<eN)bq~eqN}|m2Yugs3}J9p{T&oykNPg_f)OWj|t2!d8LdT<U|#EOg;>9
zt8xqY1y&IJc?Nb&7MV!fTs{MPhUEKOiz#8|a0Fx6H!;p`|2W4mi^15L5lj=AN`j*6
zUA<j`_?n6_)?>3af9qQ2`2tbGZ$Ux?uuvtLzvPOfJs8tM=I<n9#zB})GCy}M=0Fe8
z;3By@FHnY(J|=VB!?Qmna@^VE@hs*mJkJlBM^KB%O10Q1G;jU`nVj=%RDj3FisdN@
zQN6_*M`aHZWv&!u9^K-p6Jd5?$4H1W(``tM<vILzZk!j;l6iV?k0PFaqF{^2p0o$c
znPS~0i83qrGv8n=su-F&2dN>!jzFxD09)nUFSdF38o-8{XY~ZwQi;eNQRTlb*jX~n
z@~ZM)F{}n)GZ&evLQ6If=R8UTY`dsRxN{H5eCA_lnX>}BmJsb4zG+tsfEGM<Ri_lI
zAG`8BEEd`i!uHo5ABm3N$`Ho+zZYZg;9sjfh!O5OKfao({WnKAJNUhDnl?5VTf`w*
zw7sBW#cxxhu52mXPY#k?Un~N_pA-u(74zK-r23#Fap#4DKtiA9;ghbs)MBaQd4YoB
zDx943??9}ulK#zXzMy#lx<Z4bC5Xk#jW^Q;a&HbHhhsC;V|g)wnJR)ixEc$f;A-;-
z1R3*Ggsqay)fU3xw`1&m%gBDm=ooYs3Bqmbaogx|-^w$I{v??#FPZ5ABUrQ4i3q1|
zu<MBkACQgw<{7M9F*X3o0|Z@{!@;gf?yk!aW6Bb{RJL62PNgUu<5`nW3F-_8DjC)W
z@KyrMN3NEo^Ss1))^{ZCwmHjEGSjCboh9m(+9DpJ9xLj!8xe!OwT+F!N0!uM@6}_j
z2J-b5V{}W=$HjcJIfAoz$oVzZN1__ulN#4DU5@bL&RzesY9%`rVFGg6qJG#9A2n@r
zu(w!GcoppEd(3>g!IDhpFf)OeH<R-SxX?`ItLyo?dnh6Fr)xh%g<MN8qg;+-lY$@C
zum!G?qB(q(c%hc!b>STWi8NuYPnd82gpEE)ZQ>dHs9(HFIBdn(o{}&v#oSa^NYoa3
zs|Xaf!T!*a#RlMX8<Fj(cRikWwJmY61*4vR!c^j+HdOX95w~MkH)l7D;E<<dIGUul
z<3L5|;m;M~<;z{LWpnKJK+w^0#$Z>78i>ht>(acE>bk37uc+urk;Ql4%abG~H?ncE
z2zO^Ure@AErihb3WffXxt8~HE5Uq~q{f<Tb)&H@r6Vr6K1nk7Hp2mTma3M2gTU&i0
zx>nG_VljVs<F(@)>`btx?zoL+2p^nBBIc^5_ycW$2(d?8A+}wF+<&6zEr*NQcFdcj
zA2_c64Mqop(Hyrl#n&NYo7Zf+>>Vfn?Cu6JzHo4)4!yvKd)tN|`~C{Ti`@+3ZNUqD
z0u64E`Ge*$+xgfa9#JEuwp~$|II6qi6z1MM)J6;`G6lM3!(t=G6+Q<wJ?~y@duN;E
zJ}Kv63+8cg!Fm+K`Nut~KV!Y-n`a+2Bww($ry?rx>}SdRPXW}!aST-iSrURBRpOH4
z=F}sfE_I)B7EYUu-~g(v-INsnPt72NvQJlq8}-JdjPIliPbx`?2tthGx#<pbmMMCS
zMgLfB#r{|5y2=~y)`g4c!sYMEwHu1n%g0uHTnwLHboi^fSIkH9z-)=${O2lQ!4t$9
z5frm+gM4Hg)`+=osp&}#{e33n?-jAVA-f!|&`UY}-?Bo{A420|fAqT99@g@WE@6~|
zuu-F!Q7qL)UwE-N>}@C}pi2<mg#9)Nzd0_6wN1bO!5}39OQZ2*?+HKRk+v%0FCDtg
zXA`gL!usj+oxL#Z&Sw`@^aD@)1KZdf$nB^fywJ*GOx+w>dY^szv!uh?*I#@0wjc4?
z5UXrl3_bTzDk5CtAZQf3P?21W9}B0stQ0#LszT(w*9BFI!On_u(+RPhK_b#s<SRG3
zSbGyC*WIF(c-bb2aoQ~}wTKMKq`3bBUO=J0Q}Y8(fDBxCg|pTLPM{yq*$Uuc2})oE
zWIz|(_9igSyad!XmNO71E*j!EiKWwtdv)RtS8$)$I#2F5gCZWB)jPveavK_1@qr#1
z`a@qL9w1tBDSC|kAw7$=qklq&PZv0C_=qXa5#iC~&Q(C6fsS3(ju{#kAQUE<;gF}0
z8-8IJD)d-!;TNLoK_OHJH8hcj;t@n31;E#N{Xq;ipave{2v9i!cVGozpau>&4nW`p
zX0oZD`UqCysFNCGH-Md0b^}151|F+=FChZ26ce4m8ZH5U5w@v8;0yoW_y;yX3Z%dZ
zLE!|dIvG|120*}kZ44C5KnToWCrsd&eL@vkq8Gq$C7wAbHU}rF`6jYin_ZSJ#$h9D
z1U8~*Bktjus$dfIp)_p4O#A^*s-PcGdnHucA8ertO6VHuDjslnCeHOrO_3;O2E(co
zDh81_7!O;m>LsG;bDN^+?o1u@^(b0aCK@;*r<G-iyB~-fDGZV&zO8{b3?Gt!4n$Ta
z$bk=nfC?I$v6uP0slZcXAqaw?nf-wbh=B`qpcjOJ3aG&M{6QTe!33(I8usCtNg)X2
zz#sU)z<VJGNTDd?0c4;+YCPL%Rw9$4C^gvdej33J{y-jHVV3_e9EsFW2TD99SS}wf
z_$G2@4N4pcEI~r3bK-26De9`CmwPz!VdADZLxzDFZ2G&AwrBiTd7-KWbbu6EK$-nv
zz3)*5aDWtKAQ8x61NeXsHbC-B00iVf2NFRYV!;IFn-5xG0}4|ZNMQq7AQC`e{_<`E
zl)x2*f*)Rr7P>$b@}UX}L5f0S34mc2#KIdg;z7pYXlwxq#^HymnFz9vfbzi&9=$)L
zViF+TUnb-o=#wadyg0}K(<#KEg}iFKA&_c96Ku~PbYRJwJQg+p!-60Y&U+<-fDf2_
z)=8nUTVTHZA+ntr1XM8yBB9IAyBBnTD0Tq}Y@?bZ0$Kl{U>Ex6oq~i29;6UVXbBMA
zgmMMcvt8SbVi+tz#an_5lwc*4d?lKk4~X3#q?`+=U?r&F>YAJ-a2>KG+aD;~AATLb
zt$f&tViNoZlU6~(lf_}Y0bq~>wIAdR%;X*p{g1XOgSQ>xBOWK-AqmdXCN!Z1=79`0
zAQH;GvBCTu<X{650q@@79ZbMe;eFh5y&Br|Q0yJwdqLmPT`2P89=bym#sLW&W*pk#
z8fa?K{o&wOq7dBR9!dhyS9=K_UgDeH>0KfY6k+1YTmfgD$w2@N_dy0WAP97z<CS0o
z-rVC|V(V#M2S5M>G=UV*9p8Cj=7~ZdlH<{(22lUD2pCjhi~0mKmcvZ0;W-*%=^Nf3
zmj3Ar-|(-YQ*z=WeYGFnVIRVLCFWrsbi(9s<BnH?A1=RwVPYKk;T|f2(G6epBOVtl
zq0?=Gn03Ge*j-rcpbB2enhR(hW`8AS-}e2%_GusYbAR`5zxQcB_t&BJeLwhrU-*sR
zACLhVj=%VeANifX`Fa2MhyV7WpZArY`FY>^t6%z~pZLF@`@x^~v7h>Zzx%cS{KH@O
z)8G8XU--#?`?FvD<-h&cAN|F@{DprVlph)LANc{o-@1VV1rl86&mcjC1sNthh!En#
zgZ_{qi%8KSLyQYIdh{q!qr{8}OPV~1GNu2@l`LDjd<iqA%$YQ6+LWm-$*`L%_Ys@N
zGpNv;@}lt@iZrRxrA&Edcsj`6h^HAw_!~qu!zh1QefaZ|^<q{p{(NLzH!5q?sZXt9
zrMk5%SEy2{y3HDws#ma7#Zo0}mMU7cb=zLWJNKzqs%z~YhMPFU-mvS&mOY!6ap9_u
zpXODZxUu24o+D50Tlw#0!I|l@<xE<u>A7TIXYkircGkP7<??;H4w>b^PjM68-B~nj
z#J(vH$4vM&@6vLg*3N1iGV<7dLI2JW{5jR^bhnRhiax#i_3Vezk<>oE{Q30j+gIOq
z&N&++`r9}MNq_x8a*lu_L~+g>2DblFjDh+^VPG)<3aB4{{sCwpfdbl)#yKjeV8bBi
zFkwT9Oq`QRi6v&TpNbt0qM{89#wcPMF&2}eiXxI|B8oAx7-NSYhB%^%C+4_fizU7o
z<BU3<W21^V(pY4VNZJ6Tiynfwqme$UnB|h^z^I~=CDwT3m0eo-qmmqMxn_x9CK=<A
zO%@a6m^ZdUWt4KN>E@9`#%U**ZZcUWo=^H|!<0|*XhWfNYWZQD|D`CPh8toiAcF=X
zsGxwwwBq175DLg?fBG5tUx3Bk2Wzad+7}Hlv)+npuDb5((o^UB3T&{#4ohsY#vY4o
zvdS*YY_rZj3vIO0PD^dI)?WXMZMNEO>+Gw%ehY56{`6vrxaOXVZn`od(+aolz6)=>
z^3F?dz4qRVZ@%Yvt8TykF7-_k)%;6v!3M|5uD%K{%y5EKb>Kxg&+-Rl2E`0pP6h}9
zJIBLmNL=lQ`;E|W$tIs1Ex!k^%yLR!gwk@%GS6I-uPEP)GqoLiF^38n5a?_SB&T69
z#u^7pG|x6<;Dxm!58_A8QcrDi6lBqiHB3k4+DtQ9e+@R)Hd9S@*}-<)ZYxZm!)FI0
z5ZJR1BNQ`83>~PD%Q-?<d~v9Al#}tszY?8yIX+A5x5T+X=tJJ;_@Tmq)SQEjf?kZE
zf~h_{u7ZLpv|ITIJ~02Wx!I<l{%qK)qg2H`xPnsd>ax$S?%1f`esafY%n?HdBHEzB
zApM;KRt!-T(*YBH9KAQu#pIF!6JS9SIMNw79)-owOaHTnBlvN5Iat|{{pMIjk$vXP
zXJEtf=4+fj?()wMtPNh#4z?Xg*x|LT)g<u^{0VS?y0RVp4rs5AJ*5LtkQg=~5rqz9
zfOyyYRWbZvmd&lN7)0Bh#;OM_!u=|Hx#(cWq5!?96=QNsli1R*;e!qUE(7WtS_MZC
zgL9Y#aCbwX56z}B0=DcGdcf5eTp`3HDv>^35Zn)+_%5`8>>TA7K?l;%I|^ds9MDq%
z_%vw4Vr0*1UKsxb2nSa|4`rYnWAs89)fTl}<f0sQlbBhkVS^4(v4<P<P!3yIjvhjB
zkSGh{5)1YRQ6wZCwn~UTHbD#d93vWstfVDx0uhK1a+BIZTd;~DnOsbz9AMdECNkiM
zwESm-r%XeDsCTpwGHniK=};?QSw$5<B68(O+VXOU6%W>sZ+>)G6qrCmPAXGjhP<S@
zwlK+P?4b}PX~Z%1(7*MBq7=^TrZ-Q54B=&EoK*SGGS3OEjyVokd|6s9N=e1uVNQk=
zb6z=+DH&{>v0`oU!WQqTm@ST?cPbbK6|<Lt7+j1R$i!Uc>RB`u<Pe6E!5lg-I<IDa
zQ(Sha!X*Fv5e;f4<P7)Ngd*3Ij3lUIqb#jtY}#TV0~rvbG;NkXjYW+q7ONavd=^iI
z)l*>oG+04JmLH<PpbnI-rcA|FG2YP9er+wJCD}tdDshbU^g{}@h^kiyD4e#uffeE?
zt69$~j+r)ftu<8}T-XX%X{oKCUqu%@{?LVEyuud1C`2Lju^wPtqppNqU0`THR<tU%
ztZI#`V>wBUQH)}8kFBh-EK}HXO+p^=kpwq03tE~5#u1AxZCWSTF0%oS8pS9E;9d*c
z*vfXcw5_deZ(9!5x)!&*?X7QbtJ~iSceuU{E^&{GT-mlZxx5V)b75;-+Dfe$3Uq{G
z5EB1dC3a#5@5ruqS7w$GB-XTwrGYrCi&U~*Y-y4~Z)&HuUd6aqz59``#@;*K`T_?M
zGAdhq8F*j%vKKu3#czJuYu;c?<$m8)Nk2BR3z_IcA6rApJzS@hO%TBf4K_(XT2|q2
z28O&Owr*R1cC!hIBN$Hz#(C|6Vw9<v#V$5+RbqUy8MpYwC(fCUT`Ue7w8e=s?$3%_
zY~#22*vK?4tB|Wg<Qy}3$7NM8(>jb2Z*+kOCxuBBmf!}Z?BNefxd#-8U<)jhqXjH$
z#}-%`*71_Kw83zMkXxJHl0m{Qa$d2WEha_-D{Rkg>2sa$9B7jfx+;eLGoA&luSNfh
z7p;eWN^2n<X+EE|(vMcOrZ@d(Kw~;zlJ0X^S@9HPV7VlsAcCu3F_Tw>IVtzZ2UD6s
z1SGVh!Q_yE36x;#g0*7|Rj>nwyEzro&UwzkAZzvxG-`RZqJh?>fwC9dY;in0&-t2m
zIjVha#b$fk(T<n5!EM@cL%H1WI(G)FO<qU5LEG$Oce|so4s>JN+3QxAyWwqGdDFYU
z{>HbyOKV-Lta=x(Sc0n~DHB<nL=<kQ1cq(#2Rk&vAFtR&CC;!3ef;4XdeFl?ME-{~
z`$Oa;H+e!tVFx>O877k;!WcTNgh;SV53AT{T1K$!pjY|H8L+puT$KS<1Oxxb%qF_g
zvxRh}Go8f2a5}!CzVx71ohnbq7S^Xu;y2jkV)y#`vbX+}u3yXSK^J>l$ZjvTlXvS;
zSvV1@00n5ode;6BMHOt}hK;Xc36q#a75wpsCD@@5Ccpb8#<1~S1U@16a6IJwQHUyt
z;txfXNk7IwgpYpL1Op=nANUaLeegjO>8ipwSY47wLR^SbF}2X=Zf9{Q=y>tE7@<cn
z@7q^7_q&I?yL>NJ;Sb-u#qT|UlCS(j>;6E-=N9s-5`5twdIal$pxU8zec(r*_|$j)
z@3VjV?RTHs?+QQq=bZ3W^P>txc*QCJ8*#pG!3~@5f<LOT3I1>lhxh*nX8=;PP<gge
z344$bg|Kn{kbwTMfcZcKS+xnBCll%5aM=V}`LF^0APlik4P?N2{y+x3Kn1;UE))n-
z{;&y$mk`#3O+u6!%BOr!Fl5ztEz_nIRTpkHSXMX)WjbgrJU9wI2!v=Qgypv_Mu>z-
zXjV(edrg=<M+k6G=wfU^a8%fXSD1uSNQBkmgkA`QS@;xNs4ZjogJ+j&Sk`L(7h*6W
zaR~thi6jc5pbtdg4gNq21Xu|rQF#e*ferY8f#`yI&<scrgBU0iwm<|>aBQGu0xb{=
z{=f$<5NtZ|4vC<1=K=*=unW;J31fg^BxO=Ugca`xh2+HwPgeg9t?+%uLMl|ThO5|$
zPw|SeSS+*n6txJ2x41^Ih%LOB0lt`oz?h4}_!`DohHi&i*+PuWsC>vMj61lDt0->H
z$TrY;jY%kESMy!>;BbvZ6LaVfdSD0szz<$i1*_l<O8^Ck_lJ~61cKOk4oHvoSb5j5
z3q-((GVupQkd9c!1&NRlRA73#&@YWJ2~Z$<R)tkU1QybWjhp6TOLHJPa}J=C0Z&ko
zbas(YrjZ=!ksm2;A(@fWq8}t_k|!w+7#U^GvXW0xk}YXgbw*nJ!G6y|T^osgHhGgM
z8I#R2lN||^H|YpD32oETlb|Git7u)|=v|FK1bkPHM6mw^uyzk!00oNIcUakKh!=qQ
zc!&*%mHJ?agBXxiz<D;25A+9X-^B-H5Cp`a38WAUT)+kU;4kn11?{j`ef3wgmjPgR
zl!_H<bHkGg6b0vXn27mgis>xW^%RXsksq0uVR$T*sWFcEm}ixli&>eT`I%-#bmrtN
zJZO}*2b7^XnT$!Ar5R-91TCuRk*pbgobg@bkZXIG6!K7Ekr)&g<~ka86VZ@sulHRa
zW{KTZANmlNL$O(hG!=#^n`LEZPp}T?V{~ryZn*iF*}0uNDT`ErSl5YG;>n%M;+^M-
zo@S+<<hhIH37&@;3}T0Gb1;;|vS?KHp7Gh8^!fjuH;JF?pr6drpVpa#!JwPor3XYH
zQZwOd6H1{KYM~d3p&44CJfUG*5QnSA6ZbF<BTAwrYN8`r2vDF3Ao>&oYFc)oAH@<N
zt$++8;GZsfRxoNTGg_lJildB`A3Hh%G-{&?I-oi#qeI%GMtYrDH)NPbnO3NZIEtkF
zsiZ~vqd|FEOGzwIT6I%eks9??xV8lFP!k%8rfI6C6B-n5Km-psK={xLFyj(@2@~WX
z6n<9)d&;MM>Zf>@Yh$Sr*FdO)H52eqsJpg0Et;jECS)U!j2vU0jf!o52C3EfD+=^(
zlqznP8mXB&shsMlRq?3~^AzSKs-PK}8~Oi92$ca~`lFS0sraR-sG6$SxvIt|MpOZ-
zA1S6@1$y&1K<zM&0`v`ZAOu1HA1xsaCIAzW;H>na2Zdm!D*+Ega0c0mcw@k=S=9_%
zP=^T-4R){uTQCl<kgaSfJB*sDbw*bG5e0M5TBmxMIO?wA0I%}Okz{zQ_nNQs`fl~=
zqW*dy`bw|2nvJBDuM9$yOq!(x8?OM%ul@Q43R|!Y+mQ|%rniw@j#vfwM?n3!1e}FG
z<M0JSfDbOwtTC}t^Pvyb$`aRV5&%f3wgv^F01xfx50Ix1-T<<bKxT`Y0SJ4OLfDya
zps}LLVpP$XNK3SIX0%P4w4A!Mqv`*&Pm66t=aB;2s8xHkQ%kj48=Iy1t1P7t^f!A#
zR0vgxKe1p7<PZlf5ernH1JRlYL4bPxkPm#I14^KRazF)qU=nky1Z3b3azG4RP?z)}
zvnBC&C6NyC*mn#F1%g@<K)bF(i?x0>v73vOo$I-r%eC!lXQP{{b~b6D+o_-%x~N;9
zKv}jM)d@CtNcyk^TqZmFU<PK85COCjqyPePzz5En2qr)ZL14IYAOpQX3c}zIx}dxz
z0ldQNtStZnWWWV7z_|73xOT{K2IvpXaCog&2$6`nLaVyztG?^YzU}M2?~9GG>rL|D
za9MRo-r#D!2{!x?2XXrnG9drBE87A=kO)-3W{D8Ic$yHgpuGtJz#v$?a^Mfd5Uujj
zxCv2gjj(YPC$3A75Ws+U>2SG0t2*oozbA~sDXhXP%)+qCv6)4c16fI}_OW2Y4z!@0
zFR=kC7z@s70#uL)LA=00umJ|?4-8xqJAA~|tB@-@9~b<8D(4T^@Miu1c(FGIBz(Rl
zthp`h#a|4@VJyb$E5FXfn@f<xmE@)oN;9sI1mPePEx-rWU;@sn1WMo!`=Elo@L_z=
zz(|}Ba!kie48hwwvr_C2OF&6(5P-`02NAl(VPnE$Ov#mO$(M}Dt60XDWCsx1P4aMN
z5k@nyATTo#2^#<c!|VSK?;ryp00MYS1t8D@CQyR0fXbD4%E4Q`D(J)(%)J;qp^CH#
z<yr;ukPk@kiCrMV2@%O)Gs&3@&Cx8)(+tL&j4mI#6vyz0B<oDTfR!-YGR?3H&N&mo
zW)knfoC%@8DNzl!mIw_DE7#f%?EuauaS!^d57$7l`7qCoK*EyT#ndd&15MBc{j}C>
zE^f9STV}b=M3pz!GWcKyq;MZ5AOku80>mII_pk*WUBxmX3LY(bTx`%KZPF)=(npEV
z;WBK+CY(t@3q;_d8^sR{%`)mR1&R<W)!@7!8XwP`(m^fMLrv5x9WFeV9{F%)Y3ohA
zNd$T~6tBR>@ge^YuYg28Jv%^6)LYHfT^-Fv4KA*i5UbG8LZM+0-BPb`cjkN(zyJkZ
zFxBe;JKT)b=<C&Yjn{b{#$e4WEEo;6U{Ym$6Yzip75G)19JC-?6Hu_s@u3J);JbC5
zxq406m2KJV%h$Z}iM!AUz|ai;929H&k1S<oXf_V^TNCXdxuV!*{Lpht0Ss}FvXY(E
z0e#uGjoZ0Rr7t`)qQF;zT@(0=#)O4yNbm>INfWz3isK*(_uvMG+6XX+6z@<997x-C
zt=rkH-P_%gnGG)E@W^S*6Ez2?U&Rkp>B%;64M=bXuh$M|P+@2-6#uiV*InD(jo<mL
z-$Ccy;L`utNI?Z~Tvzf?bFS6}FC7zGBM)u>&hpI@@E`?OZQu93-xY4*``zENQV1ix
zNJOBhNbw$-l@6VZ1may2cF+Z5a14!*4h;v~G9e8JIN|uC)faB#H?G$i9xEG;5+9Bf
z!=MGB1q@?AjzbaGHX#ahAO+Yw<IZf`I1c4e&eb}e6vu4`$KVF97gBcc2Y@vWdvFGY
zAP)|>32p#uwD1QcyjNu&m%y-i|Lqd5pxA{~&$rTQMZnfgj@?qu=Y5XSRE`wb3I$Lw
z2AgmVOOSFzAP@9wO`8A@g#c!)mJi+#(^~`S{6_@(5Di(`2oBy7(O{^0z8?CpWk)XR
zSyTVxem>A)&;Sh(2Bl>Pt=<HS6#)(K0E$)X5uoaS&fB;`1mgg5h4%-urs$&Je<e`}
z5Upz~M+BCx?Cp?wqM%_2t`gNS1*g6e@*v7VL9F$M?IgYHC*1@90022qT46x$B(PWl
z0008;>SmP*>@EP|Zqk506pH8uqBsd%ph)td=#?PfJf6rRoQIY!dP|TFdN2le*xWKv
z%HMtx$MDfXft*A@Nf3|fPfqUwJ?`ax?(DAaipA~#pzCI(0pvdK8(+}&E)@8#@0=$O
zpqCEF8A<uT4+4+y%x>@rf$*zP1-2FqbKVk%P=Y=U3<bDxl_1LAuyIF!1{((tuTcL5
z-r%$T0N(uLf`Hcyc7Vt#q1I4P=NQj2sjl*w-0|kVSYZJ2>yGlsU{)ia@?|g3EFTmu
zUwF-MW}5&77Ptg`KMpug@L2g#fbS1`0FPZj*DjF{Ox<C}EDCzXaWMD?jo|o@zX@A_
z1l)QJZ&?VhfCTz5281q<R=E;u+XYN6_60-sa&O6J|M372@@NJ3@9qb1&-!!U>$9?^
zyT7J0Q3~t4YJ@JuQ1A-kxNE{+5)xk$j%ZR)pxmNR32x8~;M)@X0D7RE`UkW6w?D?N
zpZ04n^6d@)4Nz7QK<@3%{nJeMH^KYuuc0$>2>uJA_t21AU~7I?=9E|ewx<95V|}v#
zAxhM>G0iGfYIeroLWT_+%7a2gltYRYEndW!QR7CA9X);o8B(Oj3>n0oM43|MN|r5M
zzJwW5=1iJ3ZQjJ0Q|HSj0087@8AbpA5-f-M6p#zqQ2+vVK7|@p>Qt&#t*$INQtMW(
zThS%y8dmIBknp_u)3;=oKYkH``7?`Ft-o<g^!d9t4#_pT?Ft@D*zp<>BFD%cMx0pj
z;;<#JK874w@?^>=d;SbMwCGBvKZOoJT3PgH(xpddWt>{I!$jd$zlKfmT9qnL#_(G>
zsmj9HwQnzU17!&<f1;K^sRHawv`U)-ceF)hNxRt9tzW<H*z|Vp-M#<QybP43P@+Zw
zL>P*o0RRICntq2LUw&!S*zJ!TXZZepv4s8q2QWYZ2PER7Nr>3uF8&r|utAKpn=e8M
zCyXk*%*x{ofD0aIN;CJIqA)}eM|7z^2TyE>A36F#vBiuCgfYedL2`o#J6yyu$JZbv
zu}2>#v~WDl%)5ZRrds*%M<tj1&O{v<G{coAr*x<p>ae?~3L+|@vP&;T;*m))$DAz4
zmB`ynrJ*hm=con5Ns>%C=d8-fFRuf|j63(Nt}Y_h;xkY|!=$rNLv1osB{Yc?=YpY{
zfb+dWC#4i7I|W@0A4@RhR54(PKw_LuM}3meN>8oyvIj_DmDT?+P9m>?R$XmV!<FJh
zHCIY6B~`IwMC~<Ltu`T|ihG1bc0p5hWtPm#e1i5oSUZEZfm+#A3D;(~9h28&#Uh4|
zZ^z|G4<g(kH(l74<+fcCdlDdCd8HL6j1J|E_W^MX06>G47Kqnffq(Q?-I4l9;vIt*
zW=Nkch-idiiOFJjV2dxtIAiY$p4cNgK<U`vc9tN5xR6f{sbY;+X1QgTb>bN1jNk!O
z=5L!Jj4%6MDa2+SRem{Wp@()kW}hv3C7+{{RfPyB<iQRYD7xr*X%vAbI%}=B*41dM
z8_MI5uZ1myh~KV*BAu~M#F}fj--dfhuh$-CinV*?XAJ)${=iFV*xG^OZU@_ryKut~
zZ!!bHH~K>1#W{sYqFthiZI?0f+GP@37<y$A${$~iaKuL^z4WW*Ui%uIK^Jr|BD$Ce
zwrh|$W1LOeT1X#J+UbII)kHTvc;Sbi3H7n>NyPU+`+=ts!t7A+HQfAZ$Bn8N+GG>u
z83Uep@4qMB__3!LX8Sw!dF5g0)V}T>C={fnk?74otb6e9$KP=Azdj@m`tRh2D73UW
z>x`ii=(2-6mSBf5{0}kq%U=W~NVNS~O&yzp4HZb?K(3%KcGkg7J|f1!#6WO@Cq!Y!
zDrmJ`z~eQE*gy~>K|&N==^{212@Yv!5fi4+hd=*p)(V%V3q`z!946S|e&kWJg+SpI
z7;$1pmgtZuCXt6G0b&-ls4*cP?Hx&Ak!m!dgoX5Dh72J`EUcKCV{E}8F2o2NInu^A
zuJMXn#A6=Y)y1Qkp%<$m10Sk^4>=%lA;h2p8SJQ)UAVywYdMA}XyJy5z~dEF@P;?^
zag9Ix;Vk~xge~0A3_I9@lb&2iG&<SIv$SIpcGyESEQv`?p7N9aXyhaP@d{gP!VOP!
zU=Q^;Okz@qk3P%BF<jxe#Uug*O4x@#WY7>^C~}b@X$KOrhlF+*rwg0d%O<vfgfWca
z8Z=AJLdIYl8@U0UZ=v2U8o7jY<YNnNu*LrtXdzB=n)96t$>uiOQHUi_k_hwLo-m8K
zP=<Erm@*rNCM*FK)r3)+)U@U`KjKT^Y(f-JIF<qZLC1!40iI(J#Q~pV(uV8;32&jr
z64Xf?k}`y)phTBH+^~s4G|(U13?>#EI#i;H=%F&pgAnWnn@E6w5B^YsI;bE6U1;<p
zh2Wb%{!j=}<g^M;tm#5-`WJ*K#2+{H$2FD!%tqYEANm}r8%qjLtS)4$g_y)b=o!?a
z_SLWQIjYPQp(pDI<BV1X$uXV=kw~IT6hN)ZU5<6ulNzL~VudH*^16^q-lJ?!j4WO-
zyAZ|7gRywkEBolD(7(3UwKoZ@%&Px^*e}@uR5ucZbgEFZ;0#BsOHjyinzK^ig7QDA
zxW~inV2922)?{5Mu0L#xgd3sOAA9{DYhSxv?zSYhw53Qt@DWXqkRvRA_}ty@G1;yn
z)F1MgY**sT5cpnXy>`@YclF!d?=G$y#1M-TK(GOf{I?<G*noMtl240TO-2ufaD*jH
z7{2b;!WXtle+4H8E{p}i7~!x(6x<azZ1!stMsbQ!Twx5i*u^Z-@Y=}11tnBtw)5bE
zFqEJJg%N`cN}xhMG(ieJ=s*(-NkkB2xR4Js#K%C+$Bb({TTM`b3Joc8jr}p?A|F{J
z@L0kv!8>NI<oCsA9%hWkrUd^Jm_P>8M6d~*Sq));fD514z&p4Af*`;UAF%*IECkJD
z0xzV_cg{1L-8{`|Xkr6l)PxB%!38Alxz8KG$3{faJ2H1#D<jB2Fwi{e3kM?uBk;68
zLQLpC^5Gp+2*N`0%mp0CnjF>GfD-;lXokRA)(TtoLh|wGg#_WL{r~|nXl-kbjG+^$
zhPFq1kO5YZ+S=V^MFxD3>R>l{Au>qbJ7z71g@C}k)u2MIdHwBh=ULSqX2`I^*a9z`
zfD~LHH?l{Zk-F$G+W)4=wBK-Tg1hz&85l&W6QKitD9zjcpn?+KfrA9&yWHduhQfNW
z0f!eF;u5F0c^BSrVH5w`AAAVHJ~qA&i|e~12LyP`D>8}<JfYw>?<);5Fp5+k(FEpx
zcrOOb2NU$7<>ror30hzRYa$o~R~GsPi2g^Po7*4w*Z>H~t&SE9-5*Eaw??)AOqrK`
z9jC^5+8e57!I6W!6xoO0E}{;M#GN8;pZnWK5)F`+-S5-3x!MJv$Af#p@1tsj9u6;a
zWSm;mgNHm2OM;BWbBZ6ktvtZJQ1i%l9)&tLeC9C)j4HTS^x!>v1_thV*5A(&C0WPm
zF|}3Mr@HYYa762MKfG*bfbz8ul>5>PeDDsUB&*+j@(*|LofBVB40isQjh_J;R9pGi
z=UOmy-u&nXs>J`@2XEs~{RHb{-~28M#uG~7d+-Me%wlf;BG)nf@jHSQ_s4(!^}m1q
z_uv2j2fzRnzyTz{0yMw_M8E`8zy)N$26Vs&gun=tzzJ+XM{tBU0JV|`z4+skP2)hs
zS_dzfw)G>y5;VaRM8OnP!4+h|7IeWEguxh;!5O5%8nnS1#K9cY!5!qm9`wN<EQt~D
zg4p}OKykJr1i?`dK_6hkCUn9lgu*Cn!jiCoDzw5Y#KJ7Jfs&BIF7(1LltL=h!ZE}`
zE(F6fM8hW(Lo#GTGfcxb^uje{Lo#$jIJCnl%z!zZ!#cdfJ{-Xehygv!LKP^94)DW1
zT)#jR#4G<K#0)URH}nE87=+(L!a(V_O60(jD28+3#7^|YPyEDIV7rVc2~ae}Qyj&M
zD8*A`#ZF8`ide-~Y{ge(2u+klRuo0Wv5pWtwN1RmPRzw^iw#~J0bl&Za|lLE3>lac
zi|G**XH>=$0kvX0Mo&ye?1;r`bVXgXj%?J%bD+hBu*GlW#9WMxX*9-ayvAMJJZk*K
zbsWZaOvhG)$7p1ju@ehp5tMe2D|>VhVw^`=tjFpoi8&z0bJ#*|B*+XnNKOn#hCoMh
z97x6hNNt=**r-T><U;$%NP65zf1DV;o3D|u1L|r9KJkkxu!E5V$@}O?jnuaN5I=*|
z#)SW*#D%2EZ%jyb>_v<G$aw6@cl=3?lt+(@NtY~2TpY@lT$se`idRrPLD7R%V9I|?
zN~07;nJma^v`PDzNu8X$>v&15#E!8v#f#)gcLYVW1WL6G#iguDb-6qy5{W;EozD53
zd)S0Y@HZ5x0#QkaO{fF~$s7WTON_kAvxG~p+{#<*%KP}rV|+}pOw3bcOVuz-Yg|mC
z3`)&B$^|jY%REeEks8zUh%GpVXwV(rSqN_c23xou7s-bLi3VWshC(oz+X<Y}M9j{7
z%g<zx$YjOIgv`d2MdGAP-(1VhY|DTwN9N>Aw-n9lc**JH&0wKDt+0bC*sSbnh&}(%
zj~s!5Em#Y2nyl)H&Ff5!(1cFL%z&H(MdU2b_dL$9<d4im#`f$@w|q|Ew925gPU=j`
z09DUXai3-Y7Lk~q_=%oIpas*!5w2ng_kqv?C5!6RPxpk+PLxlrq|a0A(6X$|{PfTL
zz|a!?&tfD{0qw;VwNOsUr$6XRk5C{6k}j!ngRGj8N+<+3hz4FVpqzTq^&HR)ozD#o
zQ4ifvPE1k}^-UMW%pyh66XC`6%SsoiQX?JGPHBfth=}3aifbUd)QE=g?274`1gL?=
zEnN(Ngi`Ae&L&mTPn1(9b;mc2(iYWH6WzQirP4mVQZ^+Qf*=CJWDt0WhD85W)J0v?
zDi{MZ71S@uQa?qJudLHKWm5ZW5jWjap0rXg2|-k&l2DCQhIs{(2@BKX2YskehY*D=
zfYn%)RaqsODp;M2P#x7Ni(H-2QVoeJ4b&$QzxBIG9I;eQ#nL|Q)a0a8ER|GW<)9@<
zP=?S0C_n<TfQK;{)0rWHGw@ceDyK*Fhi2FUD9Ea4u!AMof^m2SZ><6yh1RVg)jJv1
zV$G3ZMOGXE)=~8WQH|GsZ4qg$h-@N@UbP5#C=iCIf=y5zrGWxbfQKre$}x~1O=5^i
zfLDMO2_oE+#<N!)sn;%<*HP8jl2wgAcm+E+1~(9uO*jKR0G4ZLD<c086=1M~LSP?)
zwGV`Ch$=A5bl6Q%*aLrn0_|}Kj5S#f#0C|>hG$LMr?r`Gg#z2ygjaw9TKI$AsEa?a
zg;0rxwQ2;P(pl`_S%tOBiD=h_XolU$twNYDq=nkJmD{=fADTUby_|%d(yM6bDZLtp
zLZ|{!AeLhp+v_OXg;2>xh?uTQC7JRE(o36*%~-mn+{(3FnYmUUorFoiM}P3yGsvrZ
z2o*g*DS;r|Yu(v|MO?$Y2DuWYh8Y7Lh1<)e-P*O?amn0h*xbD3hi0&g9=(Se8HZJ<
z0;N$+>OozyRb9_D)Fq%Cy#<!+^oQ96Sbk`*u7H}`tqxYzhc*A*h*f3P6S-c7uwK}>
zhjc(+mdpr#K;LvQSnbV`+}&Jw*aDK#o@<DRMiAINIF2rWns$(m$$gE(^<4j$h)qz}
zDv*bKK!Wk?0@b44cx{CG9SeCN0`+YXxwDT|<%sab5{DRvX{Cq|_K1;;1`L+3Xvie$
z$fQhK2zf}<?7atXP+{uHq!V@!D3BwDm|(|UjY^2!Kd{YJ3f-*zgJa1Daq5C&XopU6
z1D}H5PJxH$;fImT2Myj2gl&g**x`nl;fA?}?9GQQZUh1L)qC*aus~rH@rE^C4Gw;i
zlT?g+xYgA7Vuomjd<b8DP)&V^2He2m`Dx=E?&5_&W7z+w1hPAZF+g7zQe1sdTz^o7
zKgfsrT8MFg;wXl;<cd|0cvV<6F@QZ}hLG7!$lh`21iV_+O&EtVz6W542CRLHW7u4V
zfMr=urAcUn4=Px17>Djvt#-JJcJSr9;D>W6-}f2^7vcwa*kXAQVX^23ebD2DfMaX+
zU=L=9Y1Ri8xeIOn2!0p`Z-Aq8(1&rjlHTp!OCE>GTCaBAV!CMO+zH_jo}P9HVab99
ze!z`$9tUU4i+R=uc*u+QwJ$M~V?zd(cJ5v89pu#51Yl@{+jJpY_=84(qi!k$Bygcp
zmf<u`jYMXMl`Sb3f`{H|g!H6~OxEO<F1t~t3n>2p22r>Xz^R02AcB0j2ea9QDu4$s
zErjUchjusy)dgyyRxDoX$FXRKYtV;#xC<Qa2g+&cr@jjsz6Nhl8yGHVeL&D=pkeRj
z3Vz53Zbpl{@SE_psCBmHvJT&S$Op0(YmI=0bhw8T?%i{O26)H^Z)k?BK9+(8sIMLe
z$`Ncs&WmVZ5x~BNdw_>)P+^O`Yq^spM8%6}Xlxt?i91$Xc&M*sUI=&)mBP+mhInYk
z*c({oT3}e>O=zHq^_(RTZJDNNLk4Na5NXmP&s}I|A4Y<_Sb{&;VN7=E;(lo#c5Pdr
zg@fYJg~;ihJ_}k%;;38#H8pDLmWN;Rhjjl~YO#Rfb_gSRfClOjmG8Ew)4qmrkcV_|
zYRXYfizSQ6;^2F*-nd4KvQ80z#%9rCi&m`&KMw7GZiZq0q=W{jE5T;~|D1T9&}dMa
zyKYS+uH$R)8_~XGg8rP-E@6azX1ahQ3xBT~Hf=W!3vS}tSKt|wfr4=mg{;!y<X&#c
zy6wft?U4#xQGkY#VTkE~i$8E)h9GX^7V>C=>BO^zBhQCYYPjc4<Em{U>t+ZiCt3v(
z6=>*gvB-yUXol=P;p1&MEzjQ5jt2EMEqyo(%7O2(kZ;MdUW@7nohD!X?r;9S=8k}H
zytoEFW@oi^2nOe3GxvuDw;?}1&zS#}aEG99fLds~{v`Dd3C<qZhJXk5Ne4Na>iE)d
z#gM5#VAof019<9!W<XiFXdXQ{a$9)t8CQ%NCuxRwpN89wD2L)8AM#o!GnfX3-x!B}
z*xY<D7x-#&V0s$1Flu4XZd#z<EAI*gdF;^s>)Z)#ok3?H2NqU6bAL#4v2bU}8eg=S
z9)6xsLzb-l28rWEXFVtMRGJ?@pW<t$9vg}V8@dO+XoqGv7Cmo>L~ppyaqv5K^vy=-
zh5+zDpP$Aaan;!LPUjiASb}~?<$Nd`c*u3!*mb;6^~7LxA@v8`^aon#88`w4A*FR&
zCwZ&dY3|Go+Hixuu7cs%f;RsS_9rLyuL31w2ZrN#1x_Q2bii!Q4)n?5dB~oud`MKC
zf$T8{bTs#Gka+62R*?0g?}meGxvS#IYWlY(_m6;wX25K=;QDxHh;~TSoJ~~fnPO2{
z@Uq|fW?*}$xdsHCc5F}7$%5=gPgGIycM`7%NN0Ptr}(>XxW7*ChRF29NO%+vUTY-|
z?nVMt(BbJ-`3EnSP^NK3_K)501}F%Qv#<jwu!H3Qa+WUn(MK$BCttCcVt=p&x3Xg}
zt%z>#61E--d`}igfBgn?ufl(gd%%5%Fn#N&1W{NovF-=(4tqITuV@f`(r5m<Rk7!v
zk+JCe>8JkcxBly&eiZ+K>MP!gd%*th2mkOF|M6%0k(hVYiDr!$hg`+tqw#b{qD%F6
zB<pGZ`sX0%$AAAI3-agx>i-sixYukT!GZ=4B21`oAwz@y9zu*LaU#Wv7B6DVsBt65
zjvhaP3@LIX$&w~dqD-lBCCipBU&4$jb0*E2HgDq0sdFdKo<4s94Jvdf(V|9=B2B7v
zDbuD-pF)i)bt=`WR<B~ss&y;Zu3o=_4J&pm*|KKOqD`xIE!(zk-@=V6cP`z!cJJcN
zt9LKozJC7#4lH;u;lhRwBTlS%G2_OLA485Tc{1h7mM>$@ta&r%&YnMm4lQ~#>C&c8
zqfV`QHS5-{U&H^7EqgZY+O}`w&aHbl@7}(D0}n2IIPv1fk0Vd6d^z*x&Ywe%E`2)n
z>ejDg&#rwt_wL@mgAXr$Jo)nG&!bPTem(p4?%%_YFMmG$`u6YR&#!+!|Nj2}0~nxy
z0}@!Efd?X(pn?lB*r0<CLKvZh6H-{Ag%@I&p@tiB*rA6Xf*7KRBa&F6i6^3%qKYfB
z*rJOs!Wg5BGtyY2jW^<$qmDcB*rSg>0vV)`LlRk}kw+q#q>@WA*`$+CLK&r$Q&L%_
zl~-b!rIuTA*`=3Xf*GcmW0F~>nP;MzrkZQA*`}Ls!WpNWbJAI-op<7yr=ENA*{7d>
z0vf2GgA)H*sG)}<ny8|SGTNx4k3t%$q?1xwsil`<nyIFna@wh<pMn~ysH2ivs;Q@<
znyRX+vf8SvufiIuth3TutF5=<nyaq6^4hDfzXBVqu)`8ttg*);o2;_SGTW@P&q5om
zw9`^st+m%;o2|Cna@(!9-+~*ixZ{#ruDR!;o36U+vfHk^@4_3eyz|mquf6x;o3Fn6
z^4qV!{{kGazylLpu)zl-oUp<RGu*Jl4?`TW#1m6ovBei-oUz6mbKJ4VAA=mS$Rm?n
zvdJf-oU+O*v)r=FFT)(O%rnzmv&}c-oU_h5^W3w~KLZ`K&_felw9!W+owU+RGu^b)
zPeXzowbWBnUA5I$W1Y3uTXWsD*I$Djw%B8nUAEb0qn)<eYqQ<9+i$}ix7>5nUANtL
z<DIwOd-L75-+u!hxZr~mUbx|hBc8b8i!<K1<Bvlgx#W{mUb*F$W1hL@n{(c|=bwWf
zy6B^mUb^Y0qn^6ztFzv^>#xHeyX>>mUc2Z40RSQS1PPA-{{Soi000051keJ900007
z2nYxW2Mh}f4i69z4-OI#4;2#<85R{67a1EE7akiLAs!qhA|NRxBP}T=EGjB8Eh;uK
zE;=<bKRPx!JU~M|IYU7}OGQ9YN<~OZQC3b#FH(<MQcX}(SzcC9G+2?vS`lSjRy$pk
z$6y*lVwPWHYHVX%$YUNwWSU53oXKV)bZKMCX(mi+oXl-3d2VM>Z=cO?Fl=#o&2ckU
za-n^4YFT!ufp%`sb~;^mrE_?IUU{X@c|C=Ca$<a@VtuR8eM5?VcI|&O(||{ffp}Dc
zHPeGjSA;n3ggjb?JaC4sfrgKhhJDnAQSOI8ZiuyBi9vFSvU7<*bcwH)iGbCKR_}>K
zVT?tZjDy#XT-lCV?~YAok4k)yw4RWM*pOdokxqP)xr~yW@RC#6lVoj_QlgZKaF<tx
zm$%!OY4Mm`sF{!3nQU~LTZNjzm7At`oL`Hax`v%$d!A#ho|D|3W!;{0@t$SipL2eo
zXWgK7v7wgoqHBVrYm}tEoushdq<prfoAah}hNp3sr^eu?fa9lqnyA2vsdT!jp7W`8
z;i`m=ta<dTe44Gz;;o92u6@3)qN1<Gldyl~v5l3og2S?=^s<DQw1(xhlg72FoVJRr
zw#oIji{-bN>9>`ixQ(E>j?1~N=DM7(yV3T$lcc<p&%Lqhy_~bY)9AjTr@xr5zuM8i
zvi886y1~%v!KJIhoYca#uf?J2#jE$lq_M`M*~YoF$fxVbuf)mKw#up9%Dn8#v-irY
z@yoKh%&p<g!0yhuz0a}u&$7YMwZ+lr%+cKC(Zlc2z4_6##nigX)Z^0B+w0WC^whoi
z)x7c6!^qdZ`Pab8*uU-A%FNlr^V!Gx+Qrb^$K2fD^4!eS-R#od%KF~R^xx3d;m-Bp
z)Y{|o+T_&V<nQO@=KJN=;^yt>=H~Y1+urBc{O8!^>GAsM-Qw!q_v+#1?BV(B<LU0@
z`S0lJ@aO&T=k4<9`||AZ_3r%k^7Hrd_WAYu`S$<+{{R302>$^62^>hUpuvL(6DnND
zu%W|;5F<*QNU@^Dix@L%+{m$`$B!UGiX2I@q{)*gQ>t9avZc$HFk{M`NwcQSn>cgo
z+{v@2&!0ep3LQ$csL`WHlPX=xw5ijlP@_tnO0}xht5~yY-O9DA*RNp1iXBU~tl6_@
z)2dy|wyoQ@aO29IOSi7wyLj{J-OIPH-@kwZ3m#0ku;Igq6DwZKxUu8MkRwZ;Ou4e<
z%a}83-pskP=g*)+iylq7wCU5RQ>$Lhy0z=quw%=fO}n=3+qiS<-p#wW@87_K3m;Cr
zxbfr2lPh1&yt(t|(4$MAPQAMI>)5kv-_E_e_wV4ti~k=_zP$PK=+moT&%V9;_q)~k
znoqyJ{rmLc>)+46B&iSp1}NZw1PXXWe+VY1AVp;q=-`6@%Cq2v6jnHp6%b}PpoA87
z=%IcX0=PmCB$h~`6DIc1LJu!&_~DB%rWc}y8gdxpjW~KYBMm2}=wlB~1leMQITmT;
zbvx#u<dQki;N%N0tni?XM^<U&ax)&`WDqp0uw@WdSW!j}Q(kH2nZ?aWBZO3<>E@fb
zX|ZO8B(w?Vop`#&O%71@NkRxHKp7yED1<;lpMAE$kT~L$B#kr}aU+dBBGDsFqXxO-
z3n}W9B+sRJhAOH;J<#BbKwE^MhCtlB(1S$!0RPC%Nb&&K&qXwZFpNmCgb;*5Z3x)I
ztRiU=f)xqT(}pIaHj8EtrwZiG3pV;91FW)+gwGKN;;JjJz82&QfLgR6B@H7Pi!4HN
zR^sftR@#YCtRWCv5Gid00;xdw)N;qNw@L%aFop!8&MJ_=qe&Z;P^u3k?mkS4IE=Ir
ztv~QoT+1+!*gH_Jt5m$oK>hx!$*umV!$=u-=t2;_`o7!-B*y+qP$1#@<I4&!;DZk&
zq;M0+9@xknvq1VR+_6B|KoTv&jjAh<GAkR>sWQ19F|t40K(Z`80?`A>DzUV&E4*m)
zSIH{wFr*11&^$!1#{wN8ASnX%AfOihF#jSTH$fO0pcDSo8bUwt0Qe_>Bf}%5fXo(@
ztAJ(Xy?5b@0~op80pjfs=K<P0P_H4-5Qs7Zi9=wtpof4rK0^W+i$9QrP`N*P*W!=V
zwFkHYK6`}j&wsu*3XXt*q^<mWWR@N|LV<_y0wfO2T~IB6D)S!-`e4&T5bFH5Lf-&F
z!iYbC(*REIh1;5V2yLiicjdvppp3C0JpXa&&-BiX_uvyB?R+JVS_C0^*h7K#0HqIQ
z0EiUBXp!g!(x3pf0ClQ6mNM-20)HfMf!xE{3x?sh77Xxqx!c{b{NaQVilb1{P)Fd}
z01kBksAYQl)$u~01xR#ic|c5$6aNH61cJ1Uf&xNUL##)T;7!ke{=i2p?l3v>i7s&N
zdY?WFhd2PW%~*sB-1+>`B4!0*Nz%v__5AUtkx7w?0P<ky8s-ltLc)K>QsNzQRuF0I
zVR9jmM+O_^z!2!ej{XarAq0Y{+JV7xx|5nesKz<nwQG1GFrm%>q>mlSD~O;BkKO`=
z0tx9NS1Z_qK!zxwvn_;)0|{0LRzS-YJVPBV02JrQcRTcjU}W^*Bp0>lk57bvaC%!K
znV40<5Y!@9o`WVXbs0z6#qL$ItfejeX0zH&kalV~8#e${iwsK0hJnmxEuWDq{SA<B
z{vcB%SIEjE6v~nzaF;h33I8B?>@bu7EsvTy=np`KV0LN{&<Z|T5LgNXd#`#}E%afC
z5FBWnA>ide0;juR8giJ`{14%976g4@lv&)Mk34e4H^ULkqFjrkGMpxkN&rY45cP*d
z_0cO7fX!~-v>Oe;hEZQ+aAd@jV?-e_Q4AqV9VF-hJ&biAef(*jR=_Ac$mmRe$ccJ|
zlu+$R;E&^xHK1q(k2r>ef{|fQK#z1s^FolkB?1Tq+T;d40K~1*^+SAt7!p4Gwkm;e
z)E^$*qWeO6On*p2aRG8?K>^ey>HT$<fdvpgR$-_+$ms?B*sDc_8rnjkU~=Ca7l7ER
zj|}<>K#CG=Uun<})&IUAmz5g^xh98I!>NIlcx%uL%Ak*2kzjJvGizFx>m7AK!Vuu#
zr+^A8k4m(`We({_fr=JE00p5@`Up`AL*NU)Dax>26|G_qXE=fUXI-SA0SU@rH_s6y
zS9kc+3uYBw0FC!lnI(Z0_SIcqVM-afBtfvg>5o<9(z~6?pq!2gHh&cOy8_X~pGcqu
z4pp$P^W+;Or1XLz=61D+WhDvLsJgQ<_r=%Q!x3JPgCMBkRG_n;KPu5eC6z&U7@-HH
z2;#Gke4-3%%+<vXvQ;8ixFGUC89{_>kR~exA3v0C6rVg0Di_4cB;)cy?4%DcV+_V<
z){YtqMW7?d1OF07(1JL?!R7%4fo?i^tn{ShQ=Vin&48|wEC+Oi<Y{6HPS64ve4!3C
zWG+Cj`iUlbz%wV{`6lw<R-iYXBUTE?3hpSw;{+6hT3}<;cV#H2SIugrcp5-0kjE$s
zM1oqRN<gJ-wXS!qlr6O2*T0s5;U07cQfQNws^+z_m+g~bJLnF~j<&Rq;_L!Jd)nB}
zc2DFnjBb1T+rv1bw#QBGa+~|y=uWq~*Uj#ByZhbnj<>w!q7Er<q#r}3NWPJ#kAC<2
zAo#9`zx_S$f-h(li*tgwGZF-X8e|xCO~|-_EXM(fxu8mv$Xf+;af5rDJ^eToDfW16
zjj#wIEB{o;#0R1dP1y7WnmCz3oJ5h9zdYvl{<zN7W7QY<LLa2iT?9oPgtG+#ud4J1
zHo!oFBNWXE2ZF~7+;wtzIDrHT_QxJ==Z~YOQXszIQiCWy5SZ!|40x@plkmZ%=z3k1
z`gnmB$n;2qm_4vZSb;iX@d5!$h#Ptv*3Jjd9lrs{3R}fq3j)!C@jbR&t|R00cot7|
z*)Vx04+IHFVK;SPj|R1Pe6aAwGf1?E>;f_S5Zhq4^U>f1cGI2cT}Q7<1a4mhF?+Cj
zP==8ApmvqZdnKSm_~K{h8Fy$Ay0CY?+C3w9`QqU?sizLGH7R9u#a##c5eqf62vRGA
zKL5_N@L1~A4)y+kX{>$~D|Ah+TjJ+otdRAeC8xey!J5^$oWKZL?v)0Npf{Led;|y`
z(vSm@qc`-xd@7_24Z<>apb5_q0_XET@zg=bgLxe!CvDIm;D;;^cn1;aK+IxO=%;>W
zcU+T|E6?B$AsB(NQaQb1f9Z#RAwUn9bOa)J2R1|lJD6n!7=+8w4=sQKfv`s%ggq}1
zUnn3)ckl@-z$`7Wgiz8CvDY9PNJc9l4R(V%$K?yy^Mq084}qcyxpIQtqBkoO0;=RB
z^gseR;Dk`939+&&GiY}<2sX8H1isJ$mGgRGmjnAIgoJn;zQ8#&Fe}(YCND5M`u{Lt
zM?fiIS30}m3x9$ki_~z#Qz&-BEEpn)kVq-D&?2#ihXMf)(L-DX6^FG$3XjNF{iZ7Z
zaEAq<dm&I^knkt!V_{O#0<%+yz?dBW_E63=hyh1r4V4gsh=T%gi~})<3ZV}<XAsVK
z5n|SH!I+K4fj#J_jo!#<tp$zWIF964j^=od=$MY`Xe0yDK?xNg(%@{X(mJ0aAm<Z1
z8AUp>lYRlRM(g;G@6nFuaBH#y4Fa+S=MX&r0uA~Y0(o!__;?OB6(E&x4h8~{7}*{G
zat<8XkskSxAQ_S(Ig%V%32pO>8JQHFX*g8xAI8rt%rJ|wZ-cRw-Pm^qV~aHQecxpn
zOCj5sv4)H#SqrHs`4LHl#!{3em5M?`in63EA?5G?=Dc~X>zp^wb)DzAzxREAO1`ug
zOU;xh?U!H$wf{AhsI!UUlS;LZ_KTB9h8i=ab09X3Bs2qG#$XiBGEh26rIUm*%jd;<
z$IF73r`wB*c%jbEi#;fGtC`{|d`YD5Wtqv#B9$=YiOa$JSVuvySW=nCO!3a^5+bf#
z^c&g&UmB8h<wbG1$Ue%AjUBs>@&%C2Z7fF)tWSJdB1sk4O7^Nv6oYx}=0z<ZSL_g=
zk<8*4wi0eP*Tk91;rc5gmB&1Z%4G`b^&s4Ml9hEIoWrP^q=0SRSnpsG4M=RW1aJWc
z!8=o2$yV~JG~%jY&BOZY<xN+y8P>+Is&+Cur;Ua6VNDVl`k!DmcE23^P$Dg_GWJ{X
zr;|1FvRG_bjp$Kc4K}O_J5%#UhdyBi#=5Zvk!nlat|l?1KQXF5CZXGz=<k%|PczpZ
zgQ`TVuHI-aANy9*=7x{~*guh!>wNXF55c2(sMn;jPZV&o?={gG`MJew*xSOui{k!!
z;7@p4>~r`8n~XfB%!GyYM-n=T;t~WPNw2}ib+sZ^x`#9Mx~GK0_GMl(Oa61aCc1xJ
zY#&9ufS$!Qa>=2Lapl^Nu9Mt_h4WChi&6yk>PQ{B(}ntFih+*M4c`w!7NqM|NsVq7
zt|wt`hRX?`aicdrLqi3@$Rzq2rDzRb4A`@+;c&_fbfl2wS)r!8uk-+}BL4kLoDCts
zJ-NLj?R>DRUWzW^k4#gUdvp1P=8CH3sz=Q=ADXWoG}j5;ZqU8m=zja=h1<uGh1-vA
zw|uzWdT_f<=*~UeJDu)#x-Q)5uDbo&)DXmlm^hE4@mXGEH@YT?yL3TdKeWg*%Rl?1
z-jnYf{q99?i2~1saKE)>dcL>t3*Nn0b!WW2INhC%RZtfqi;EM&!JFyfI(Mh4&VYZ>
z+qb|<a=67);a`Ms%T;z+#kYR27t>V#<I!oIKldM^xoG|cRw3!8<nvZqaT~jQ2~t=9
z{ih8l*bei+a$C1YHUIbLRGpAVJN9Fn=%04cuy%euEXm}aSlGSv;&!Rgd#MZe#1I`P
z5m>pSKgGsv^_eO+wN{ID&I;&%>`-a$(6Gi5WIM5y0+t_(bK5(uJUXxG+>?9EQe!0$
zUU%8V`hIrIed{~-N%`&ef9{FP-?O&vNEYu9I@{$_Egbr%E&L9D<Z4%de7m1~*I8?9
zO!Cd>YW}1<58@C4sns`<lOJ?)BI+=R(dK)fFSdlUp$r~(izK5jC3n!Ry9ZuLOf<K9
zY=RFqWpX$XrN6+H*6ovR4{QJ2pnx95Xg%WacvQ3cuv{1$-Q{jvc_Wd%CcQqS;ZIxS
z#mA}jk6o*8^a?+wisSF9ogAs|iKEg>tIHB^_e=`+zSirVvhKbA`0`7S-Vcv^XFv9y
zjqRN{TJ2q2#VOaZhEpC5C39!$_N|=_5obJ7e#lZs?pgPEvYY$_$_1rkpm~VW_BIwe
z-epgZ0oCt27=5C>{{-a8SkyE4Rvl7P3j4d-sijw}4D?Cp6bGK_$IkYP)W|&+egawT
zm+~BNkT>YJE_u+^f1;&rlEik#N|7Ulo1oFJIQ!^Tz+m4uukqwT!^1&kHk8Wjpm<&@
zA!W!CTVm4VPDI}OQ9TsGj>`B<R#V`<FZmy-r47H<u<20(naOp-KC@DI3U_1E#UeN!
zvKUVe`OiKRwRy&s^en9BSyWA#Jr;c4?Wv-lwyx(eUZ<6Rwpba4idY-Yw(0+@`{>4z
zyg^pVF-o-?Xc)oGjuc@_dVhge?hMP==?Qo~mr5G$<3hYL9lq-MqUdaY66IEH#EX`i
z8_G71Z_mC^s+3D=c`jQ_dMrCCrIYeV)*!WIlu=WfKRc>`9eY+#IvC;bG-Zsckl!`S
zrD*cJU;p95v9Wh4rFrt>?|a6vmE*H(#dr3{6gj&;c}{#ynOLcrFgtv(=*hLzGO>w$
z`Ah%hCH?O89?l;&FQfDknv)3aN*2I?U1SCU)Uv!I+`Gbrc*wE=UN8?GcJ%o8#X9&h
zo#jg1OGd=Y-!+{31+PdoNFD${Ghb?jfp~C$_GIyu<7#FA=$I@I!MqZE4hA1hmTBif
zc-jC=+hzPFU~m?qyk4TB*eNgxS_U9M8{o!#)zb1xIF(ame2Soe=AH!jdoQEtuSIp(
zmFCLLL`q<D<@mNYRx@w35NH7RMr!}9!RWh}3@|`=W$*Re_U{xg=i9i{!IOBP6)3qv
zVo4#qUdFLG;oytRVz<A=o+48s`$(0@H_MZV5Hf2Md3u@g4qJ&V!Le22CtYf1N*Kk9
zb#S+1=daE?k>;85RCJYMNw5JT#P`iR63mUlE}Dn%VX!`D7E?(qA-G9w-n(#vl8RLH
z05H2uVgIMkep8Vx1oLhg|KY~n>2o-c`CPHEFF>t*pXT}g{E-1?;`p3Y!8?<-asdF~
zBp-`H=tc58^4MR!i4>`v_LzGs@|@L5@wJ~9^cWV027nL-OoRd;CP5+qWO<VXjtAH$
zi>Ux`trx`OJBv7m_u_!q)TzK!bO!)fj~9#JL9KrQ&Epr70p&t=1pSi&qxdv=5kdlD
zYeAcHz-lU5vke5`L97!n30WpIiV2T`peKvD$>3!?NCJPn1aMHw21pD1O7E|bk9pMd
z!p!1#$KO?)pBta}w9dJ({spVR22f_P&%uz%8EhK*P!Yb2XNORhuvVW$9!`to9pkMR
z2LRwpDjVPnsjNj_p+Jt~2iivzh}gzg)O<0T4#LhL!fKb$zNke4h-<RAsc;TSo_+~1
zTjxGqpG0`te*3ou0dQ;=l)$r_NF5Y9)q8#!^UjU5C_-Pk_P01IZ6&X7iWs$IIk6-_
zSi#tSE5G!ur4SIHls!#F^HD&7-ox`EUok3QU-fl1^?krL0}`9Xe3O7k9tes5<es{`
z>-7p?9^>(t%VaPMreu6#MRb4h-x&Dwzi)!Tq<ZT&VbNt^lVuqPh1IR!O8trrdwor5
zrK4}z2>`kZH^Acn3j=&}u6UsLEo&5$J$>f=c=3~oVhh`EmSHFW2S3g(0F;f0`87Nq
zct8K_jqN)6$ZuWwQ-?BoW*M_0w!b1`^=7GcdKvv*7{4uCHz^Ek-~@k|O|F>h{G25L
zW@L0V0PqmDMF2GR;kSi(V37d`bCd*+7Z=ShgiIE*crTV4>=-H`lTm=kWEuab;=>3?
z{F9ZZe}69HK>fDM0|q-zM%ymRV4F{CCmGus*M?M-w~)qLIcM&9ihK~21#xZ`3y=YG
z@1=9z8`!*MY!WNb_EA(83Xpz^J_JqvE4Dr=R`3N3@c?Wb1x!N4n|H8mD<S|efG_d;
zv|s}KiJxEAWbV^nekvG89eS~duzgnwI}pu-AQ;6QeZTu_-?b_K5lsS@r=z=$in)*I
zUkZ!%d|UUhUdMxm!MK0Ls826@fz5LOfX5*ZMRv~F{;d1)<01uNxsPP0fCg|#CjjF#
zv7k!ub5u2Mov0m*0bK5>Azt#v$k_NR1AwjN8kx!UKv$T5Ae3_F%1|615J;H$g?;XQ
z{RBSoe5<6er!c_0cb)>4Ge(`LDP8)!Bm<a888R5CChIbknE4o(U|$Y_Xxd`f&;*fc
zQR67bvTY<4EKKr`0KZ-L=#Kd^al_;NhF4FtY3Anp_dk3X87v$pJf}DPhVpoogJ-9I
z28<L-pSkHd^DAhqQbTgS`u$eOWW8C@`57p1t=t41=!n~>DJl^1QjR#HbJB>7f|6H-
zorD=Q1%#Hth&HhEFpyJKmF^m-^8%?SP0dFG{jfZ|KdsbtSk7}DfclaWHw3c_SQ%Fz
zcjB&RmR>0fsbQRMr~?VQF;4%Rt@;I?V1CE4Khj;teph|8fsKh5s$)m$Rw#jCE#m7Y
zNVO^af4!Ppo2D33o){vRwfavYkAq`N2g)P<ry0sjfRG#LK5*max8U}d9o}T3Y-OoC
zS1{kpmj0ktj_i`vN)fvYUq{L>w8N#zo|X4*xP_OU9l0M|I%+B2>uJe}V5e}ItG{t{
zXhl24Z=KfuToz}myV_aWfq6F-_tK!hy&nXS7D`{bN%?^&N7k%P+jm!#EaUAgC0Xu{
z>&f5WwzpAx8}Gp7R<`XxS~Yn(Owt(Yr=WRc&)Hc~J$K%^$bN};c0YT6$Jx_io5$HZ
zd1uGPm&SYE&Mi)3*EO)zN%Or|&beK;(BrJDJ1O65*FB=+?RgK5>KnTrkN13!yAz3Y
z%S_f010{R5*O833j}15B_6VWLdpFdc1relPe$TC=NMIBOsBF6Qz<O`n3JRDnv-x_S
z{L9b=t1>AP4kB^9i`}F2cJ~74db`d6C7*N$0VqHxNFXtIfTC>ZMaTeQORO^>o)>&6
zOuir{kSHC#NGVg?i=cs6Nr1u^RvCcuk!<yla&)){I5v7W^>N)m+Z*~mD5?FT9e8h4
z^G}4e1v)vhj7QKns4V`X;MBF3DTs_3k5gZLEz{9L(mx6&R-vno((FMlSBs%7XyEwt
z={G@UA+hl3Zd2~saSdmKk%?uIzQg9p@vp75ywvU+`@F3}2^`O9xw~Z(sjO1<n~i})
za$N>|%wRaOTe?I~DT+w01+jJHG7C8PatV`hnf<;QEM@MN709M5%mTG?pA{&ZYOC-K
zH`P!^20V0)<%jo&Psbn=DS;qyPKiCwTsR}V0mPy(;@Pm#P5}vP4}!;n3co7iAiu*+
zphBdM(lILdKZpmDq{_}l`T<(acyXj~48AU?9n>2$&O5a$$w@%r>^Ayqpv}vatBOz<
zIF$0;WcbRPFQgp3CGo2f$029e5D;<IDq`q5r(YXcL*sDnqr0kp_sSArie=~!$wO~(
z6yfJ&jtSPua&H*`V0UEzGQJR?W)j3QJ!JCi0o}UgD^0$b@EYnn?B+`ehhT<GGVAVT
zks;B~wKD)T&iuq9DSZtH0YqVK(otoYtjGdj+)6)4ffAm|Q~z1&HTR9nuM$WPCC*Eg
z6tw8q=`W8A0LV=cqBfvVUeGL!(glF%?Z5-$=V1NcgWh?qIfGKcD#qoyzNf--BM6hy
z7ei@>3|~Ny#KzKcq;e60=S)14>E<bbr%>`F?OdP~REu$kZVCYK<4%DpxQXS+OpZ{;
z>!1&bm$VigfRn&5zcUqLAOt`JTyeDTBUVu<bjyi;f-=vAOE95U=?|4BfD~0=U7aGl
zNJ1mOlREbIBf&yC7Q8^66oP%3){UsQ79atAR+${JJfMV@Jyj@i2qZ=%d=Br*%kl1z
z{;uz*>LP6uaKfqC`YEq!;iD$xYz*k@8rxS^2F1N=4bT|4saY%VAZp+X)XD)sgvUNj
zWNl|dw#m$gpGWu16kbKdPz>fm)#fpg;{OUx&U>nY46h=9@SoChw^aeCtEw#N)iE>+
zR(}L4;DI4@j{oZz;_Ci*332oVn6Kn@9GRB2PeV-nJJI`=M3A_W=nJ~t_6GJYBDc3`
z9OS#gHNE+(x!y$1A@vvo`1*PCV-ZJAbvA%idkQpw4^UJjk7QX60N$v1lREen1$AEy
zcFZ&0yUPG*s=fe~NJw(YesFi3_uBcVC%t>O0HfAG@w7-bU!5d$j%eLw&I&ldN}B&g
zMM;MSLKdVlGC(r76eV~lkiO>+x`UsBfUnY_#akfgtes+%;NoGOL@tL(QCj8fH!;{B
zH9yzS&~o(vYqZ9x#Z$K*^xudnj6^mpJaaw$lG!LVOS}9<GXdbUY|*&7Ao@M_C@w0B
z6Q-8rAS{;n8(WQMfLc`S#Vm<V6uIwez5%U9_kI_O?W`&M;(jT<0k_yy^ou!2%mXVh
zZuW*Y6X6lQ&^r#~!c{^fHO{QgfNZeH6b@C6;fiuxpz)YmVLDPctFK-!xTx)rmLONq
z;<*??#g%AJwAq*G69Di#m3DGsfa5Lqw-wK0n*F8_AUqBtBFnI$MbJSu9Dr%34BOnU
z&)oMw5J%fp>uzxh3vr|*q<ax8MZf%)k#yya8U>CZ0WcB)#LqN6KK=kI91IYK1eJqL
zQf`3=_m@eRAex)^vkJ;UFS#d1Ek~jN^*RWr0MN`I8*&FHFmzOWpD-S5+zn}a+t90R
zI<86vLGiEjj)L+yxMnj{#hHq8-h|S+Jdgm-?2Dy?<E<8uQR_Y^q;cTJ{qG|P>8Mk_
z=GJ*fQscAJvgfki59>RT^9><HoV*5ih6a}cvZ>Gn5blP~qe+>^h%=L@Kfd!3iz6UQ
zxZGj|W0HfxMR0k|3IzTHr6jN_R~bkj2LK<llFzIMXUU0q0#gRbm)uf1f{QLhIs3C`
zfEA|ox$%@YqPRs6q>ka7_g&_Lsq+-sbmcfNFmAg@tC#e>C($y)^HLnn$|KsoO1&5>
z(<a%nWD$1z5d#Eeeu7Jd0BT1k#5$`xAqq)+?3g3Q_4HPmnk~=0L5|j!=}*L?#=yJ<
znqBf0971HKKTms)1lsaGCT46gx_k1K**{j^vr}#ov%hUrJyo_Ik2OrVh5tM9{DpMM
z{UqJH(g4pLDzt|C^LTS*OF{j#9<*ieRTt_qC~qh4e*Rp_lr&_GAo#2HK^;Y8^BEde
ztPoEHR1Bp`P><b_;Sfi_Ap0As3^cM@4tJN!k^5|2C#pE}G^Uitrj&)pSg57HNW5QQ
z%vfaB_-&=J@S!ozkq^6METLc`iRBYRnn-(^xa&|cxml70CbBgqA$eICZSaXP6Ga<7
z4S2?Jeg}^<RVgdehl4DqP1J2n-P;F_6a`GRQcSfYigAf18ZD-JEj&rn`N{>RhHIuq
zH3)emD5=}jM1iQ?KEO}OHu5Bz9}e=@nVJ?5trUutQZfu8h&E$HStL=RhIkxe7^mkb
zAu|+5Xs#4iM;kLIPc!ETGnW)I*8(%Q8Z-A6GmjoK&oMKvSu^i7GoM2<U!=Jo*4$s=
znR82~;&i?()GRo{`~`fdH`hF@#yq^m{A`bT#F%;Hta;R$dGw(<8EFxNwTM-)h|{--
zx3M_qX>mScII@5xq`)F61(}q~VyR8#AF)WCwMbjDNI$foAT24L8NCEh2GWv>%;43w
z%#N_kNwLf=u*@qM3H2N~%9|R_l*-7TwY;=uS+qTJac!jF(6WTbQbT(%$;RsPY&l_!
z)>AQvp=V3;JjJvTCz(UIMyu*WWR0iQwL>dhS#~d+`j}!>8E8@)|Ga1Ac})xP#t`Br
z^i*@r3s#;N7~H8x_*3ecnZ1cG9#O2y0!><xp#R2R^un!g+gRV9(n(4j!jXo$Cts*{
zo@!Aatst5{>O?&BwC-CQ6+Sy!m1+H;Vo*~1ltx*$h0V~z=}|@E7{ha{7jN^V#^yz!
zToT#jX?$K&izy=oB$I-$EwfQy8+#d_KiOh4Wpg^<^>b^_-0@D+cj~8u6o#fVFTQs?
zJv(;#b@O;!_vz{QQ%B=9r%i2MFndhq^lg{0wbR?DO|aJg*_f+s6PJl>E5y;I9^19G
ziuTOsL5D+xp;OPwhJJYFZjRY*>7NM_9DN*b{wQT=2l{lkz-GJV%mI;4KGPxzIwsFE
zerD?BK+Boqcr<7nX_t~wrZ5RQO=9sPJrf{ajwi7elK#(^yGug!l91yh)Eo)DPU84W
z!l3LpMeMi~?YIr>cuw2#dfD+s+VQ8_2^881*4hc(wG-~O!;agD%-M;q+ll?P!=dcO
zMeHRM?IjKDrB2&Rd)c3ev_F|@FH>kQTWc?O*IvHYUSZr`an4?8-Cp^xJs#ztBI2N`
z=%8lcpnlrnNW;rPGtxmT)j_+^L8sP1_pXCpuY>-$gTb7G;ktv-Uk3up(OAUMMA6aI
zz>#>`(ag)yJkrr3)zPxh(W=(*)LlpGUPqg8$J29;w(E{({yLISPIe+r_KHpp22PHr
zot(U!oFkoFQk`52o!n}j-0wPh^g4NtJ9*7Hd9OS9{B`n0Is1t?`ztyJ7&r%>b`J7#
z4vusVNp%h_bPlU^4!`Ssw%0jg+&Oa2IcnWG`mZw?<q{*}607JEXW$Zl+U1;=%lSx`
zgjAQrLYJgkmkW1Yl6zfJ#$8h9T+-HE(*L?pP_7vwuE)s}nt^NPY1b?-*X&5woK)A`
zLf5=n*Q1Mfr-OG`ZQC+Ex>@trr#&ijk~R_646vlkOvyQ#!zO~h<67R!9RP<&=29KH
zS=I1hX)?`RJIkCvE7^ghhi1y)!CLgJaz%ITBv^?CSgo72;s(ugGbfShnvTn^+M$J6
zx+~D#ug|%2i$hBdShVn9-4%o`2`tH=5-A_5#$8MALt9flxPH1z!Xd#G9?_dQZ5nQp
zOlW#{w#*7R+VVqZmdC(fjGK&`wPj}SPR^sZA0MtGo{qB^$hh?>7LegNDSP>&<FkXV
zIppb_zFb&<Z+3F`?7-dWM5db?9wLonP0xi6E6zODV3ovW+Ejd`D<Vr!EKgivM>A$f
zT|D?b3MM5p<0&(frtNjH5N6cPssN|;!Lz3esq`Jz_RB2S43M^Xs?uh@19N_e3Dspz
z4{AUHnqaz<kS{l;6ST7!8Z>%sPNT+5`%Vs-1UBf-t~5Z#%FK{g@~cj}rNddRwX=?P
za+2vR{&-gFZdQMKRzi0+(+uLqgt_59tSB-ewoH~N<_@o`U6Y%nFRNNE6@vCGJx5De
zL3rcA26b7b<Iq7@kMzWx5-&faNe}N$*r&fAn9{7)lOK}_-svNLrE?3SN^YQk%wxK7
zFDi?9d7&>6=9UY6u#^Asv}f-*NH7lRtnHD$=da~EThW`%cL{uyw&G_(VTz^Ym^aOl
z1^gvfavl|e)h^AbE6r$l`<>W$-*ejU+s;g4cNVb@qBTjgB+n)JdR3j9RS_*nq|a5|
zU`d~z$9FSJq;o`DVfT2w(=jZPbU&R9nDw(j$;qXXFH45IE){P*q`R}*&e7@$=aiUk
zM%`Y+S>6Nik4z0}@@5Xs&_h8WIC{nJ$=<>lbP&{h-d8l(U-PR|@R#Ygkl2djr-wC@
zMN7uJ^zD~^?fDWXpY*ypl`h}lkpOA!;4`d2cIMu(yRbO(<<Ro4(?Qw3ZC}q`ax>}9
za=?Eq*$M8a2b|f>Ns)2Wg?p>5z&@Q`wmt84-utVLQs_~;S!h<*Owz`Ck~T}>e5f@p
zClQyU-5soj%ijM2b(>x>#}{Co!ISIxXIH>9?}aSqkoSM*&tLuAmlf82IV`^~l)4T!
zptHD-KuvdPmcH3!Z59C~Hz}sq^X{DTOUS0(Z<)Q>B~Db2;H=WF%&Hr-@Xe5FFaO)3
zX9wE8r~LasVt#Eqakh&O*<rX^fy!RjnAwOt`}lmAmUd|G{3^|P;gqJE)X3ap(TL-H
z*CFCLU>h-*2#X~}45vkmT#9&pHA3qfENu^wW;s95z1G(av;Dd@&=%332%F?XzPh=V
zzViWcf>jc;%3#7IbD`;QmYKrHK>|b#Kzce;kIF;~@B|1W5jJGLe&L3f?1Z1;i2{ce
ze>Da;b|vRa-}>w>V)ZS}cVt0{uiz6a(#SV-vDGDw1XkG0NhMHKG_#c$-+c_Tl<H_Q
zxjA@W4=Kx)y<J%Bbg)+FS}HSBrY%#cVxzCk+bH+5XSauuz{jK&a07~_RF^5k%uK~+
zFQRD4q0!RJ%oH3{dIkKxc3mcM^M|I(^jp?<eOYPUZf*o>8QNbf7dmbDU4}vRNc<`B
z4D7Z7Ug^!6&h`R+EOmUzTzVSW6d9RLakEbR?16(-TxQWR{61)q#Z1j1<EcdWqAxrq
z_I|ka$U<@jtK=rlK_J-IFetHW{Rl6!JgpR}26#v&!VG*vrB{CT;aTf6zz=w1g>7f>
zmdo5OpEkUMO;!+EB&q|+(|dXzd^1+zq>BOxEJgD9_7-AWv8{3xBxJOuT9j$2NwZqc
zOqBW9m%H_(n?)@&LgP0~oihLL?UoFDr~U7ic=_V?#`f97&z2S2x4hzGYR|sE3*+zm
zz^g?a>y1~x63H6Es!O1yPR3YI&x`){QuAebdOFOA0M<PjEBR^OL&jeco-N+$DgQe<
zw$96TBui%GoEPl<zo2h@be0Yc+Bt!^N$FjiA08!N$k4RUcsNAoR#wkjn$K0%j`4*u
z4O*%e)qF2V<oB1SSs&VZ$w!IKp8QJd@yad}kp({g@|*Yy@_*+S{@#1Cl2`~Uc+;9#
zYLrxVCh4+IQh9XJmErekldu#9EQt<F@Xg8E%Z?t&4$aLDlF9aw$qriCj~HRC^?@gl
zVM!H9sgrA0(p^&NIdROSx^xzYO{j%HrlBiDl}VLPq)J&*#RdMfJ)z1o!AdxYsw+gF
zK{H&T8M{I)$WWV#KW38$hM|8nm<O%D5893qi|N!3pJaUj=p(Hxm$oeb-0TQ#SOO#G
zR)}*7IValnIH`HTV)}woB30ZHtmF#mPJo^v9M*-T4EtP2nS}A=C8e~%60~!oH}`$o
zF0}Y$-aQGK_?>bz=>xUFvpjvtdY*DPa?L5JDaC_vV2Gp13s6tuAo`fUE_+!)p(#nE
z)Tq3J=A!Hwi?lBxY0EkP{6|<5$Oj9{Q;W*kE{x2(%PC5UX=nESGJS48*Gh93Nl}F-
ztFAz760`jGvVX$h>Bp6(3Za|0flPLO)rgf%@u6I<llCp4$Gf>eNGo=2<)`EbUBaS7
zA?%mbi!$`jT94fqoT5sm-OQN4@BH`U_8fn$HNW)g^110-VikMi>mC13=XWE%Z_7?K
z+269i8@?m=uEqU9$y!2dMYFNlwU+k%)oT6LaE--3tnXe`$y<$V|8!id>AQd7_pkNU
z-^xq|6~?VObF_Qqq<-vZ-^FLGJ_{qrKM(VFV+-x{D<Xmd<o4B8CL1hDl_C#1EfPj;
zb{_sBs)Zysg&_0`tbU$7GdlZfWBrfTCUYQ%Bjh)NJ6I{-``n3t!aiMB%-;JRoSV?u
zUHkAL?#D*2c)Ua6S7#&G{-5aohVvIyc*oTa_I@qD`7hc>y3hYox74>m{U53QJ6q%O
zsrvm{l200WaWs_f9xn64H*VC4K+pCO<sLK38vO&WewGujfNt?T>8eDDi}ugA*n?B2
z2W$iPy0^wvyL$XDp1kV2I3htq-piG&Nc6ub``<LzxYh=Pzh19vyLd?GW@v@PWheI}
z>2mnPt&3S#Q;sAn^roh%R$_trDnq=1Q|gVyU5EBI>M`aHW6E9Axt}ExEAmcwT|F!r
zr*foyX5$a600)%k$vu*}{%K)Qn&10h&>8iX=TpnqHVP_=3;gHLf5RQ=BwmvBB>TN6
zDZKsYJK_EsXNB~ewnr;Em!uX(&ZTlrf8hNG`rr_>D4oH~M_v8=oI5{7N4_Kf)RqY*
z<B+$2GZXWs<?>8Rf0knP?W~u|G{QIU+oXpM$P=EPoQp}jJ6j0BKn0p&uX7(h$Y(3w
zF8boHGC`Ej-n9Qs$<eap%lfvvTG5nGE$!y5ho_MB`ik%&lvE=UikA8w5o99?_L3ac
zfO_fubX;vZ>X{&}qdQ+3qMvrej<Hq#%2b5?96V$3J2ZYm!piqvgy})IKBqo*hr2MN
z$^3k$NrtWC*rWNX#-g_fzq{|>$;f{n<utn6P{g|kkB1r>M@U~(__0}<Z{&xJzc}k{
zdaj5wZAH<}&|DxePa0j@kiau0)oCgA<=5*h&LuKWwhI432mAp^-q9Q(<qACm&$u`^
zPDmh_6dR0Gy*@J`l=M07)M5{lq@eCO#SweZGeA-lj@bgURmqg;8HacJUFN$ZKzxA^
zr$lL$GwICC;Z1FEx}N)9>7a9uFQ=8!Z>d;z<9Phhl))*-sRzb?Hj%|**<w?}I7H>b
zo_UMQQQ0`}gELY^U-_)YNA5r+bdT&VAz-DsqJeK8z1Jaz^Tbp%3vf{(wvDJh>k%m1
zYmM7H9OCM(^LzI)ITRI|#GE&W*>*~b@SWBv;%ip>tg$G%mn6?Uj3r)(GjC*{#-A1n
zRXf<dWJ#0|`wP^7_x<w3%_V|=GKrD{#`Im0AuD9%C&E<$vy53&zPz@~&$h;wNPGRl
zOWjY^;h?^Az=jA|CqSrwxhQ3FG2dQ&M5`5}l1-Mx9HZ;J_bf0mP!mMtbl!;?5^K@I
zXEalW#=B{kuZb+Wkl@-lyupB<b`?)ZXfhLQ^J6Je91^7o3}ALG>Aq4DobO){^^c$f
z$bdCdKBM?qy;*vG!Wbkcv+k+kVobin2vtCQG*|Tl8OmBRz+N?yZ-}e6oK$H*UB+3e
zj^Y%}x9t!(Vy<L1fi-Kz6#K$q*w$aA;FR_PH(1<E@C6Bx+G&jaIh&^oj>$A-AEH7t
zZt0IE*`{pMO8NwHbzd-{pI*JW8dO(js=k1T4qvDnoTTz)+f|<mU0`|UFf84!Lg(ni
zTL-~SFpZq>L}&w-kOx8}&={VcSs>urZD!@fWtuT!!d6Hyk!oXdoT}@usM&<gwW^Hv
zRf_Xp06uB-oy6SK-QhWe56TwQXYTCNF0w9A<v6Hj>7E*QJifq$KI9y+4pxe@w``i?
zE9#+I)7wJ7yR!v5#YZ2$dn*<-2~nHH6wq2gzC!9P#zXB?y*&vUl_yu%d6LzKP7t}D
zXsoz_(@V;vur?k$`-bfDF~~-wa$-N{C1#Nxoq%YBXBe6=GvA0V+(6c|^52WWL=*dk
z-^&O}gO@qfJU{cqz+r0dia893{m6K2Ips0TFj=6U(|poYVAfTAh;N8r-goGvw*|Y<
z-T-^SCQOn_L3vf27WyWVo6!H~5w;G8Ng#bRiD+ldlKBi5hYxW2FBECk)giBJ=Lp4O
z5RlK;JFaO{#gA>!nq)~no1eD`Ts=&^?cYy8yTinn@))6`6s```&3>9>k5{I`n<qgy
zzaQ$x;G}H`;}Lvd+8dMWP6r55<6#YrL0r+>C6b49N&2~P!>gK9>>qpZ{H#p=b^rQ6
z2Mwy$p)q3Ns>!9)(O>2NWn_9POuX<q=VL6ONoNxbZ1F!4$6qGrm=2up)(T|RsmNft
zwx5v`HF?Kqdn_ctGvIliK!owOA0lDo`m0Olp@QA=gw_4Q<MUFEAqy3JPTS$lEVD)Z
zus*MLs2m3%Ys3E<gD0A=*U|-QO%KF{X+03Ovbs-tWq6M0ihi;F+yU8(HX$qrmoYsf
znZg6&TGB0p90^l(*RLybSXzG&GZv^_J$wa`r!OA${c~ku6HvL~$9(@``s$CQg!dSj
zs1)sQji`2fzgvg#A{ynK-INpJZeIW&+}gG1Wm$~MfSL@=5;6$dNk3AAiDIwQ;u}%+
z9+&(B>Sg1<;w^#7MU7qVkvC07X*Em5x0FSH;w*R+#3M@n1l{^a&r%p!fThbU2*rIJ
zvb#+GB9D;bFUDA2N!sAJ#(f>pqpdp%U3{xy)bncU#E5HtTD*75XP#ltRq{9fPy_hT
zW$=E7!ov*?mk;*1c!Iidgx~G^|NUh*wH#1p=Yke$B%Um~ys5EccWeYK>Pg_YY=#Zw
z>Sdze$&hotwlE4$F%Betv}JOo**aKDfp7ggnq(EHQ&w~ljfisX3-|$*xO&}>xbTqV
zkDo*ns4_3bUL?*TJ`mXL1zzqr!~3nD8_?f9`FEk76$VjJB_sa?2*_jVdadNYtHJ|$
z4P5(w;UiL(5LiPN{#@n2<s$c`x_-8hG-KPM3+I~qa2BpTC%P9h36A$r$-cJ;<erQC
zV^?{C5&K$hhQb<pfixaJEo0Y9ro=0P6&YLt8N$<N%v);y<z<fc*NnZw&JRJ<1dN$0
zg)f&N2guqbmbqhBA?z8AtJ_Y0YLK8%OUM=b{!nBVHRPIyV|zzaspvP%rE+?Xx<-1v
zuSHIOV@`7pYQ!5W3W7eU3>^!ew>ytAgqXB+>G3&UF2mWYx&$iUHbg6Q_S3#8v-i#R
z(o<l6a6x*0QN!D;$JB5Sq9Xu$*#hB`F&>*OR_M+ks1KlO#W{P6SN0*_45~RL>W#N4
zCz=Ms_D%KoX}kwC%Y9R6=9LXLD2{zG<*)aq7ZH&=Ws4CDadU<%)c*<tZ)H_wvQ<9G
zqMW#$L2zs^!av;+lwc#98ij(S5<mSi7~;J7V&BQ+K&QWh2{G)UsP7FRm=MWKhFlYb
zt)fs@A$LThE{w+%Y5@J!>22owj=+SBWVqgT8`A9tRVfbDYYgcNWPnvaTj=|ajo0iG
z!Qk>agUJjo-wf$B2>k02SQ?nq+okF6dK!eE;jieQsI4@el9<xCLfE`+v_TVg<QEB^
zBiPWUlWKir`^R*a(7UE4TvV|dr0L3Fzpp7GlX7CO!H8TQxDVOP0wi0i^p^lO%95qG
z5HpLx&ZyF#WFYDQ{k4pRewu*ufQA?GRi!b1?f_vWgB)aHl%4Ts(^;UdAN$al-`AL@
z(Ay=f_8rznfex?}238x#5iP*hTt8x3Y7<GbF{Bv<O0(llqz+8Gf}m1$1O!I(C#OGr
z36QEgeX`1*qaX-9>my7DLT9ACZ@PO<NcTUN3Jf)Y(+TJinnE~LmT$aY8>AI#qVz$U
zjgleGdSncD&EOSy8B!?io{eP-71Oz7uEOlc44ok=Tqjx<s{3;61_cP33~6a*vfT`}
zoP}`BLdX(Bf_y|n@>?P@#1J^S>=k5+Ty~5kDht~2A6_@xHho7Z=c{^?H0eqt-?EbN
zHSjf7Kn-ah48G7=ws0LU0dRp|SY*qpEwnvN2#!W1((RFxCfkr?DpZ+^c$>fzotABg
z%l#*nsZXjGQYac(fLJtVSRM<HY?<QQ#Y$9&^qiQ%&?Vg_QzOdhq}nS)yD8&HsED))
zKeC)}j#EBKL=8Y2_YBIW*coCzC~mt^eiaHYHDPaNO0P6khCN-}GZuiqw=4spT#x$M
zr^~&^Xmoc`Kf)+yC*j|m%;i%omymFsFBINA6ZH1nuc>Ly*=e~=j^GK`k-J|wTfhc^
zVtsi+);IaIN#)f041A|6yhp&|(8-s@)GdtHXtO-}@|d2ZFJFH^{jrEE1y*kIyKHY|
zL^mBTgBsd=bKj<E37quHbUtp5@R=I;xj)F6*h~nVeRdaol8t!l6=P*@;1|@m`d~0(
z;5~a|7Vpr&P?+)4NMijtFMN+%<=YQ;QBWfa&VIbch}h4aSKAsR*P(f*!|;w#3gndn
z5l8X4a%uV(<J$eZ;6FQW?l5lNK@(fv-6Zh5R1CgpURG;VQ#&PIYozbJ#C9~)c9n@*
zr*Y}OLW#&jOyr;J-g%OZG4#xc(jY2M0)|i%I9%YLpAR1WS#Hf=Ia{c^@3w9o5V!)F
zE?bqWxpVOCHs%GGbD++stWK~&{QATlLavF#5=2}8)W=TbSzCQFp)mfg<#wV;hAPx>
ziBVe)YI(&7JO4E#%~eqSM2M1tF|>aRnaSG;uuqvhJD~9mQG@)0hr=_?oDrTo7{2Z6
zTF@_~7k4;)`%!mI`Eelm6`_+$XU9IYeC$)4{WS`bMj7`Ks&`KknTn_Cmg7o7Oom<?
zPE`TV6c_kf7bYw;ZO)qGig<@aBh{&bdmug@@y;&V7xv6A!L3GtM;l+Fl$I~Fex+`F
ziH*|pjan&bT`7<HeqgGmPW#@V^u0A|ZD3>hV(Yi?jkUC>)xM48uSy&5l-94dZvNZY
z^xoK*-#C_Nf5<8SJg>BMBKl|f#?J$#ADYoSCjV_IMgNqD{?=u>stNhs+PY>K{o62l
z&;GydN3DA$KMum9ciokLU5#E5-7udX<dumscNM2l%?(|Hp2Qx{-l;}S01!uE-!m2G
z!Nba^MlyKJ9*tjytX4+@CubM|8Q|-tvNCM|Hy#ipgZc3gJu(Eg3Gn0L@|$q}O^5{<
zbcW30LuQR8gA(xUl5Ol)@PH8+b!`*&xedOGhjq3=9gfH#4?HV>8*5w}hcF%k*<}CG
zhW@z8k%Q+!sBk`M<AmV3UgEiv+qgY`f&*gMJn#Z>6r;&aUU@S6SrxX&c;LFJ+7Ouw
zLKad}5jIlc&51!jiQ#<H&i@-P@ZhIV2U$={Md;2?f#r6A!8Y+h71)Rhj(=0+H(t^~
z^>5Tra9}J2AhVAc>#h*k3+|yC2c-&r$(%9Kt&3$R8S9RK<Oiv0ZK^U3AbGt(+3Tt@
z`Kq$js`7VK<yHwojWk3z1&uS&RmeaqY;iT3o>bUUO)!x$-NH+P)mIrx+JhRBaYCLQ
zYWiyGk{zmQ9cn%u>ONa|{w<Z0YU)~Q+7?G!>dJ8%K5?4Sak}wp>ggQ@MIGqw4xQl+
zJa>mmew^MFHT7$18n<W~rf~*2TL#HndjF{z{n;{x#Opo=j7>X?2e&jFwpFz{_2oOY
zeozfQZ>dIa>n3!n-H9{*t#(Q>-cotn;%tX$btihI!}QFywMQr6LA<Pynj9n!|3_7B
zR8{`5s>1bq$9kjUEt=wWRl6cpnT}Z5YxhLrRGsgz1GgY93HM#nHC%J<yB2A<UAgae
zO~d`xefR$~JRaQlc%tDseBbk>hS&T1UY|6)|J!j2(J;fY`FylcW0-hzX!`MY`H5-z
zpX~Bi)(p_<3b-}seWXDgp@~{)rb2fELXNtEqj%-`H{ppHI&Jr5KB>X9A+FUBSa+<;
zXhz5_<IvG_$ZmqnEg<B5SLCNI4~woKEh2SoHzh(N3ig0JtZ_Cu13Lu3ntr*z2O@77
zhg~}#o_s$}Sc`*9;U7B}A-^q#)JjNr5b2O1u-BDX4JRi*NV@jGrDIpA5u)I#mAu7(
zH&W!pv@nenHJk~mfPie#iYx63J9!^l0SUjO>7w`hLNyIRA%sE_Lw`_t$^cADg6?4k
zq72}TFx8EKC?p%Rk7)89GBO`iuw@hkyes<_gF^v?sng1Tkmvzx65Nb*P=Nfqq?J(i
zAb)u;vg5qah%t%`sICI$MMtr^L^6t$p;o})Iy8>|{UA<nP>IaoB5q0{yW`_1nGPTr
z&h%ISjOE@sSwulpKqSZjhb0I`Nvw3pC?D-At=1|1Z?EdX!%OcU)+XFX>*ICIsb}_;
z&$JElGV==)V3$5UtXI}N3)zH|j6<UbrAYm73ZXba$3=2b%om^g<e{2&LeZ_R%L(^0
z;_jFK0N?7+<R$K(mxN@mQmD5~&qWV%6i_HMO0|~OjVlCH;~<Ajw@&VU{gLj4Rn1XO
z+LCdWq~piB=o|rzcAJ)-Ux%hb&w1Sn8hZgj=y0zwU{7iCK&*gp^W!76P#xaH41V0e
zEq?7Aw;-|AwC>U)J&DfW=YI?+RhXt7lggtZDQ6!4cUD(rS@#a2`#-(MjL%(dr8UyH
z5Be2uMzbbbCmuJ@mA;{ShCbcDkbGYa`BSM8fK`}60}@Y?DcA_I?Ae3iTm7;wN%6Et
z=SD%S9C6RD_2|&|q`C?06@&3dAo$XS%7hDd|0Fy~(BxGB!A5q6`2Pm*AC5>1>(FV^
znFF(#H0e!0OV^x1n1ve8fS`OE_{zOk38@|~Jub;0IE8}tO&UJ)r>L~MrD(Ubnl^cB
zU$aIp3_@m01Z6)qIIefdzA{ksm?CGR$4dcVQ-Eq<_hdqMM91H_$As2s2!_JoXe1yL
z4ZcWfzCL**xHLa0Q0r^B3I38cq~qD2=KMD_xBX;?syzRNFaPzq5C3(2Z0J@E$?mv+
zJW5zgIJcg>vwmeqtmZ-qO?wsg#7l2bnDp%{BJ;&7>Qwp=4yo|%`ZH|uFX7GsZO11&
zK1bS3eVfrntI>J@jUY>YviIa%@*jifdDEh7NPQS&0=2QFX36yl*a<ND>+)o`$mrjh
zL(L|t+*;Z{2vIi!!p5hbi19PYLI`TcR~+9A(Ef)`or#<Q=7qvK=ePGb11*ast;$<u
zR<Bx>c1<+L?{fv)RH}u&>rC1@LC-CEwzIv@z0#fg&DTKv!c@IZ+(){&!vRmYW3xlE
z^Zg6wj=~&TJRY8Z`eLftr9I#wRXUk(-SKW%J69m$ZG=-}+_G+IhnfWay!QU?&L4if
zg`LYLi)PAkZST|kfbTZ1<U*IOX+1MoB;1hk8n>vu@uv8_>eun>BIo~&fh<?X8r>w-
zQ3t=izw3bYUCNCrLC<uCJrNa`){I{0(qX<+OzB?EEi1Y~7#BELNULcrTpND*wJ%lE
zRIrj;Bqj0Z=jXJk=f<%I*UBYtR%F&}H}c575TV7k+#~+pv>3e=EoQW<JzZopet73c
z-{FVk{|JxJ(6(E`AFekTLzYc91wd>qn@uooti=FGb_pZP@pHBLVcrXmS2xIGc!`?g
zf!u+jqbh~=p_|EVcq%_%>LL6pHVqpls+EoWuQC_sQ1l!rO?)Q!%F;8G>u>q?bE{)Q
zPV9@!+Yvub@rWg<zL<NYurdl7#GV{g9M_MlQx}8CS)*%WzMj@*DN!5K9G%+28Ggg6
zHRx?kIZW2M=QUMIio9Lnk(83okqQWJ3=><6sCovMo==*xOQa^&BU1@;p`yA2p@EMb
zI2|$|S1W2RpB|xDXIN|d)em4tqv#s<0wQ>SPO>MgU#9uI;XYsE5ofUF>XU)G=oXS6
ziT@CI3-!HNtLh6=n~>K4773HSQ|=nm;iTCc^#sK~={5S+*<jR>yz|O8(9Y!b8H;<{
z4M)E4`WtW0DuiY7rsqC1=QE037%oYW$P2ud7FBaoB3JrmcZ07`o|Hg|stOpDlI|G5
zTdL8JDR3F(5JYefGFKs@Tg_|@rHgc8-UWpBxpmj*ga(CFrk2A)=QB@KEuTowj{DXS
zlxF&5Vxr*Dx1ei%A0F1<xOw^eZp#MO>Q!llp)X=Im4O18@6Frx>4_=<LMFC$0tmN2
zl|eD<hS1DX%U^za{019+CyF2c6`U;?`0;h9z*iwJvoXzkNh<PJC}~(MQN4M{G5z3G
zW4Xil=KE`O`R~ho!Kzo--f4tH#g4@;G0sKo>Hbk=i4Ni4V*MBsP5!-`ax`bP&^#jY
z@MsaHpSHUc?Q?Z6J~1aP_@o14edg<3t$zucXRlq|Uuxy>ITY@?)|kB2e{E*|{pjbA
z;V{=QCn<`2EDhtWs&X&pAKC6xI1wF;oDlw3$8zZ~hW)8HDWjYTD>y7h90O=X4sTyN
zth-)>*@IwTU@UN_mWv3M*HP1nJVs^5s@<Ffl26A>TY*y&UDYVUY5eI&9lriod$0?Z
zl=ZUf{-Ef^m7GSlMa;~7(`(q6!~r)6&e}b08T&IA9WfHTcSdf;#G|}>D*d@@6Q4?5
z3NA21ils3s)EgUP3JV_jB}&|YrH6j^iCLveC-&$2+H5+EF{`CR{fhgYhN!$TzDH(g
zw|-0d^(<5m&MMXqs?ZpC>0**GNA?28>1|xREdwTNzuTnLy&$wi&k}Y2a_lrvDV36i
z!rI<H-R_hiex+my3xe}opS~z3^al~+pO0qk*-M1CEaG)YV>7t8ll_NmYPB;$p<st9
z8Fpb<u1WP-xwxFE*)MA8Y!f1)0o8L-A*y#|#4irTs_ZcNZ`d>#rQ5Vfl&L~g<}<Pc
zxL(uE2}>;e54AINW5q08hcycDRwaA=@EF=H|6Rhxi=F*(uNm)U136jU9EZ5J>atKL
z4>(nP)vCYCeh49J2<bFJ1UWNIPJPQ1E5Br^rd%is3qIwbFyly6%4)VrJvw+3Gwax-
zw;pDvHpDH$d{M#DK1xb<anuCezft{4*6!|ysp}@^)Eo-KoF0c(CX{dEi$j~N3;e7C
z6edt!3=_$vn@|NPge~=Pmf3F1q$kOw`24zs4=0<eZCfEXMZ?PQyrX5O&`qw4Hn3Ls
z0wQQ_0sR+0WAKQ?5#VVmT*J%^7W>HQ8Z>^JAU;KzsK7iX64@_X-3>P_qrQ9eRSBDW
zSI6Oz`$vf{_a9wek4Rno_)%1<`?2&!pi~3xA+-3`XS$bNA!2q`F5w|(_(t4)fw^xD
zKLoJdE@2?kOSZj*C-%GH|NKihejiB2DEY~7tys-792@W#7lu7Ts9Z;X(v~`B3dbty
zC}`QvAGkL92&zxd11v1i&uX_BD^&9VCZ-+6ZR?zM_re04pE!u*+dMPb>=8c#x`niQ
zlViTNfK;v+w7F5mV_V}dXO;Q1ANeEkXq4YTz&J*#c#59q87L_x_}ohAmo>3pQ-62Q
zZa;Cjtl2Y2{!AseU#MW&QNtkTEej)Mv)mNlR|Pyvd!t5d9arp0U)8Q_j+=xPRY2Yb
zt6kTbh!w@uqD;Q(4JHklRg<oIj}Ey%OBz3J=&s(1m@@u+K3_{a9xplYrJBr+IK!7$
zqB9qEhC}c~6dnvwT<1t7e&)xCD_SmbmOiWmy=yPuX&Il)vRyyAEV(+lqkAg0$Sa_v
z$2&^B9DbP^&Mx)fxzPExi>YhzQq`)XqGg!{1``<sj}LD|=^gF0>pN4LA`kORh$m{7
z6`VXY=XTGZNfC~s7U)TQDG$D3eY%vtxpnFX^U7+s0*3|C58kzxtL=>`ah)Wnlrf=g
z8nH#W2leLVlx{IDOSG0RC{8H?$~TGOu-+F(R_^`R)=?`yGM2+0+x;ds@ndLdI;V?V
z0_*5|gQn8qlrP)2b=sq^{;DaBSzbvY>X4LRt}?unqiIR6(&uBZJn>sGGkRoGdiC^$
z_j)HTFA2YM2+5QgyFOK6IdEIYgk0Pybj&^7GvDBRez9VK@95DpTmHnDqSON#`WACo
zZ&L<Q{PD`tYF81_|4;U9#J}7Djl+qTm-hz5=0DPM*0uRw?)korxM_Q(Yl)X*e<UES
zd!|?Sz0<uSkx2S#9v&>xeTYhD4swgynG0Vck<;nNqZ9mPL)=29DtS<>Ak<V^N%fB^
zRAO%yp2<fks_60=LN;Bq;MdKTRM>_~ritlXP`G9|{(jc#6aQhwkXX{Mglkp-Ron-a
zsQBIV<iC=l2H&h-2j=;wigo>KO8xUH$IubFt~tQ(OyM-FXIf^kru4H5i0@GW;do>0
zp|OyFI9$OWK(sMq0T%EAT5fWGc0z0n$4wOv+|I!s?FC0_XY_V*Y<B<n>y2RzAhCwf
zS<kjz{95#n=r6jL^*$DlmC9-qUFF4#OHl!?!~V4k40g+U$X`EROA6;~zeILF<ZnN`
z7!MJo3rGCGUwtVtR>#Sg#}603)>bFc(~leg)@&DlP{&y!G3d`E^fDd2I(dtXhZ#3;
znk#bfK8FubdYQ8EL<uP6j3E04%LfXNWwS(CKf4K|;V^?;u>tdU0rOWJrp}J-p2YWT
zu9Kog3Wmfg#5onHVk?v>*Gbemo!8?PuMa0*2!`ViU2@Et?cJq+D-8I`?Z$=$c2-WQ
z3k2?|1s3*J<O@PP<xJLLJ(oV2OWs7_C{G2VQOpe)<Tl0Z9E!8cJmuJx6D6GDQ83}P
zmf!S$g?-5>^2SainhpuIlZuZy3XKtMV8FW+%I{?$rZc4cGoU1ZiybXy9>hZbiT0+j
zde>!Ui$k56f`=Jmb`;K=oCxmELOw)$lN0<60BVdW>bg?4;*0w0hZVbneg8`8441US
zJ>HO4A}UnDf;z-VE62xEY<-+pf8|S2+9k+bfR2fXO%~5>y2=KKZKGdC%jAVZgV;Mz
z>C}d(Z9VGwPn1)M+@05Q|HUr5z7D#$q&!e3>hW4)>J*QTrPx88G~Z_yDiiKrw_hhI
zHVY^X+e=Z!l|I|awR0(N*()FYzSq?GI?z7I30!<4svo{|PkMjBjH(c~nSrno*PRjv
z_rJC~RiZ5aMpb!B_3!II*PF_}GDNv8RkzsK3IO$h0RdH8l?HKjmktRTZZ#in&44#j
z8r(j%w<K~we?k}AHqNL9flj<doam`XEaG@D*9AO}Z}D$5f=YF&-{^dy|Bt=<ifW>5
z`vsmrfP|8S-XSzWnjoTdLN5Y>3epKkRZ6JRP3TA`R6(UFNE1P&2pXF7D!m3odQ(9_
zDLeQ)&-=aKUVHDgPxjG%PiD=*9AswAn#^4Hb^U)=Z$w5~#<03$nZ2+V7HzK>MN2=7
zr#?}UaNy@BZDpuK0C2Z1Xa0~K$0<%riA+o44A$5Tc+v~#F5Dhax^qj*zYSxls`Xum
zX;<GC-9qm}r)Y7L*t@C1oTd^hBBvikENQc&#V&+OP-1={Wi=qjcyXOYwqq3cA`i<?
zEd1>FD}!Ckh1~^F*lpS3Y84v>&AVyC1p23o&2*~G7w(49#pkKvaNIx96}NfAj|uE6
zDg~w<7bdV&phOLe+nUc9bPI1ga_wDmYk~Gl$*wfhMfFM;^K#Q+7m{yZ_=S|t8PR#p
zp#S-{?#n$bnS8aCW-$7j00&klXOHtX3}jV6yNZD}E-)-(S*kFqR$+pDKGO8J_34d`
z9B}#}ZTeCqP0qaRyLiJNU9eA57g~%i7%aer-rgMWF;X+Won2!D45yFJr)|N)KcsM|
z^U(5la=VVeWO%q`u#E1_u(?O9?rpqERCkVg*Z~x`6jd)Mzg6IMprjl%ouxI>8Z|q6
zCM|G%{}OL0RRbR8zrb05pl1>0_OXw0U*MAAp`^ny$D?+vhk4u5E&I|r3NS1NDtejH
z-anf~ICZUEUYq6b^Dhv`b5PX$r0`$q5Z*7ueUb*CkT8Hm7-@5G)BJ=4GS_UocY$7a
zh&!H;zLZM8*~y&-*t{TQB|COkt(n>%E79uBH-n|#_Py|(huw<TA^~M+c9r7CTiekT
z2ytrG4|(|$0sz2+c<%xLC;)*VC}-<TL2&%>-S&4u<S{bco(CFekN%EjTHH5!`|U2Q
zo4fkw2CoY2R}8ZR1ON9F$MBl##$oyK1cw2p4Oc&x0ZFF^@0_BqI)~dip8+wpAuXgn
zCN5uo3g={8dV2Mq7?$q)LdSA*qa}rWqu>3{zGoj2S$YBTo%yEni;UePZYL`2{M+vK
zw&8ON?sDU>?PabD54x|25U-c<Nxm-~mV++eO{(QuAwug~?Hqv#ZR_bCaP{&hynE!B
zM^3(A1CPg<--DMo(Vk)G{R<pbNQiqrl^s9dYrG%lK_c<<xoVuQ3P3f3arL~$ZyLkg
zlJ9VVxoFP-(p~G|4x~xL+!)7lw-6ZORUn7Wum&V7Ess`ojPG_5F^cJd)s=u7)ekn9
zoFg-x&wM!m3;tB50WLlYN(o`g3H+PQT<BV=Rlr?gUg~&T?hpOkXIJaOPny|3eP>HX
zF#G3IDc!cA<KghX#doMOa(oAqulImw0t!2P5YFro%LG8=35p|~Vojn8jl<dt!!k{~
zwC%v2*SPKTsRjY^%gan3q#hNs$T#NOyW_ThIdkS^Fgas6>`nQWZM7JFL|N>{+)9lO
zC-J90j6U&We$3;MP?z8&6+3i`s}kkCvvBJd59QSos^mO5fSC`utVtoVMs?(t-CM4<
ztoS}tzDAXshi(azGD-U16R^CAJ4`~~e>yz?_(Sj>*8(^*Ye!rcyb^plTk^&h9X*5>
z)9+659^(V8qM57msCx12ZHG+V{`|sgDN+H9MyyW0V-FT4qR-UKJfi)8#QTd51>9xH
z9xzHz$ZpKaiq)~Z4m8TqNyWUHWRyP=R5J6IMv=t$IXmS&PRY!*mCO;_Vw}my$*kk|
zNl9%r3-ywD>M)oaLh|IHDJg;AZ@cj1OqOXSyQgz6s#V3{{ot4(?wM5AGsa(Jqz!`P
zQ`ypZf8Te&PdxdOQ;e)^-H&YH!se2QH4)>$MDfQ(LpKULu!RrpoTX75S5N>F6iQ3(
z#nxa^P&s$i$a7%$g^jWjDT)^lAAei+Bhdqt=0C=MVIe6nFYQ=((UH&ou0b&P@yiv7
z5}Y~aeIXUEdAW+i%a4Jx%kN_1{5`(ZRrs33)UXLPnpd1HNR*$&adIq_(~uSnzk9_k
zP_bh^<>d!}vcD!JkX(KIg!XrpAc})H_pX2tVk1;R*yRrDbZ|&BQhE8to39mq-zI0T
zxz3LM@#`apinj*4;GVvt8GA*?<Qu1)TqE{(JL$Ky=@krqyps)k<HBC2HTv$XEIo+*
z!o3HkFg2Oj&vjCZwc+dy^uBdnJ@o7K^=_*BB`k6yyA6_y^@Z$>g+2|}H`q<yy>|)Y
z9>jxnzj3uNOPu~_6kB}Xn)AWdr}26Z?IZaQI(A$ES6Cd!FDYG7XC>c{QDI7!t6F*g
zf!R`JC+H(=B=yWN0eDyY3sBxDjXP|CYf-w{A*We6*yxP&_;toY^W6gOMU@I(O1W*G
z52A}qRk*i|9BodyM$*%UT_}y~GyFeQ9tj9g7VvSmVBTb58TY22JLG=CDM-1^=-Kf6
z^x?P=qtX;)D7lJc>a3#OwzZTsd6Qz<_0jT@21ms%P!?856P*9*7DVCDw&ndyYcoeb
zdv4eJ90pZ9r7omfxusmhZa}4Az-6rGi{)TSmg8h|11Tw2spJ67nuBs3ABQ5pB@-Va
zB!M(!@RAiLF;oIakhlkA6(JcoY358*>A1nd_v?7zQp?CC-qD@WVM)$0=D_|w2AIk8
zB@!TAXeuqdlDAHUCOPRXt(G5|5K9&ouDa}VV}<i9<GbeZSKqq_Y-9P8Kh`u~oN(DM
z7<chZ-nuiz_lY;6NiJCW&e#3XyR$Q9MxQ%oxC`=Y+`<^hZ`MTIJTiU1<;BD7F3D1W
zr*T(-j5UWWWJ0sPv-Kj`g?S$y)IQv?B~Z<AGjMr+5N|rcuny+Q&0h;;d`dX7glwKL
zjlQ*%?$hfznbA_Jarwy}y1;%cBe}#mp~!xR=9DQcpK7EBM(Hvt)<VNF2eX!mI*48n
zS!7E?V6&QuF9<NpmF18Ryw-Ev4W4&JTJB~VFX=p8cafOA-c28cZ-ntNnIP$p^Qo8e
zX~K|&3i1propdrhETUsW^(=f|bA&G2_{d4_Gs4r1Ld-`4Ec3;=i1#cjtf!kQx^H-|
z)tmXOmvMcw*<F8qdd5V`VV7UqnqMv}!ZD`g>+YGtZnl<Vy)78<Lso<<p_%$;ewX<L
zE*4gWYc}5#yaHd3o5Ga8-JSo=^s&e*c*vuGHVp~U^>iyh{BoDgJaAHzeZ~}abaMuE
zDB{u?W6P~xLCa=)hL)u~q&d1IaPZ*ceTdEayyegL^BgYE9QT_$rAW9O!|350qHhcD
z(gBxtfDX(ed^6AZMjm?G&i~$dID!8-(v~lFw}2W@Kn8gTqGDs{=tDHZzf;QvgI^=0
zuF#5@H^xX7eoA0X@IMA$F6vC-zy4U^Vrt=8ce<!WLvSaywJ!V0{i()Ssp9@83PHb)
zAy-NU^VQ?n6dzrAIs9BNM=pf&t#fbY?K1PG($pcY^3x@n@{&>8*0NZ8PsKPBf$q1i
z(+&GsS1T<uB@3sT;;y}#YYP7T>x4>Xcj%=z6}#rfwgIc}`tibh(#m+o;L|!XlFynp
zVm6P<M|ib$<1$P^O>A%C&1@Fi6Yjrtxoe2SwVz&na2o%OE8{_Q(C<?kg*tS+FB!XX
zqC)-mue~|)nccQ^duylNjsBiX+T-vm+7*U^?(Lj5JY2XzRpE#aPW)*X*-d_xecb)h
zW6@D*Wmy3yyWdpeOF?rw<7plE%btOnb42W{6BQ1<SxiFFp`c|O$z&a48^y-<fSN*B
z0c>YU>@Ezua_am&iwTteAlmOV8IUByQ<7pBOg5Wep#1enidW^=u2wSRV|WC~H8DC6
zk)2+mv%?uELB47r(SzMlCf2bI8RqU?mLePgT8AtVNiQvx7mN&`i;1tnkd*DiLIZaG
zG+RCumr5PhZ1NLRLs;Dqp@-A$S9nVfYkRncqMdlRbKyt*Bl65t16`Nr8P>X=**O>%
zor_^9ixJ8cPjw90?-9J!!Mot~7cyy{h1PezXFn<}J;ex@CLw>3#xk9t)l`+s>Fzme
zzBycQsqPl<NfG8iVqM-08(epL8#sH0#|roQ3BzbE<pE$XPf?#$!H*jeeO%#T@4Kny
z$W<39t5WWZH&_KwRhICS557>4O-5BJuhT(bTJ9`0ZY`9TrlAxUiK<N--3`5OG7)0E
zB?>3%BLi5bg!b1R<Sv%9UAI%hHI!Ih^<GZ9rE1~XdwD=lD)RB8A+LVBr*yIXN@t>$
zQqUWw-b0$)346CBrAd80!ybDke7<?3FP&xJLW1v@xrZD5JDFQFe(1S~<{J}^&k~GU
zIn=v-r`<nte&dsT8}2vjZPpSy8#pcILz#r9@h61cUlX9v+etVy{_Ue;u$XwmN?Xqr
zW)Sc-gRj`-U6RN4uzK#pO7A6(nKQ$$Utc^+Y`E2dDwAEUynlOaqgqh(O{-zr)4=V9
zou{8A4cqJwH(Rud*gaag=bhyXrcbp+`jufJd&4(wgzS&mB!&E(@)!s?n0p8dJzPw>
z5qh-zEGhKYI_|8K&!Y%%Jl;95b0chTp4&m*P7e}%c6tWG11QlLkZ2wd7J~-~qp{Sk
zd8FLnX0R?gjG;V_>{3i~Rtb{Yr*-}~W2qT_^(ANN1UK9uriGyt9Vx1AtLFn~W$8vo
zT^Ui)GmmNISg(q_RGtrW@^9s&^o$YST!1C9sPhU-Mr$f8!f<tMLJi5J20pwD&to(Y
z7z`<*M1|3XB|Ix05obDcX2<+drd7fV6|c(>&O+%aL(2;@dX!qo8Nx*GRCG5fc(aiE
z1RNI!5xnqFw1|fc!lBCMl@hFO@4?WettnS65fHz`OUlZ*usUEH_=cZb5^{mydYSCW
zp1mA0pyRgnl4+^y*A`xN-CI9t(}%G|qU_nk6%9g0Xl{|Ma959_9i2>-=yOq*mpWzb
z!?;d{=a&<@IvpFl9-qpvnDpjVJM^{EjFe9c<+JLzkPBY$0z1mNX7zY(59hA!I@ms9
z)$?Rp&Z$jX@mOW;XE&gDHZ<aN?R{*u>rDYVU1#+#snRgHh<w`LhsBeJ*#novO8mYy
z3dnsa>3{T{?n&2@z2e!)nqJan`l8>#j>-bMoH3_EPoYhG1LdmmPbK5%+ML%WZ<}jp
zkVF?$H?I2l-y3>PLs1+xvZkQVHe`4?rlgqPMMtCIX7SXUbi=Yo0%0m}yUxYD--Jlf
zWu6OCyN+D7c^Z?)o-}6aZl!W}OC_HFy5$u(Ts#6?w~Q3#tPQ2BJW#)9boBVn$8E;v
zG%YWUCfQnEKN%Hp2UEx%(#8h~b#m|2eUkppBoHdp%)M0iNuJm#8YXd(I>xOG<peQZ
zn;1>@c~W92HaUe?l`ej{Pjd@4J>>8qy$Tv8<bFL)xzXr3t)oPovO96G*tCV+Zas{>
zz>n(Ml@aa(?Y4`UoHMD`F_X8i#Oz(IdVmSlOs}XKw*1_Jre1t!Qa?O)Lr(=+Z_asm
zE=h11XEi@cpj~3<9rP%a!5W7x@ll_q@3aK7&o7i`B+WYvhW(x(6tDYL>57%3X5~km
z><*jQ463jz*J!WLgbN=KyJGeTNt*toRIyd+h4ws@s>!V^<9Xqt;BU4W%@3ON&CwB@
zGge?+Z7uUpi9n5p1?q!WEe2EkyIHw+<>$UInM$;%R8&JF_M<p@HR41yIlg9uNOe(e
zZzr)Yec@4d?l8P?S+J|zp6lA=JuhetcwB{oFM>(^01^G{jM^EQqXM&f_hTd1b*Z6y
zzZY69QrI)SAb0lus4H=JKAOeBMeW9CmY@&1Sellk8y5U5?m};0-UwM2&avfWGm9=W
zt4IxMWb1ugdF9D8$MY#5tk7_AtuRw}Mg76;VZ(LQ_j?JO(ds;0uvm5Gt38Ze_hk7F
zB*M5Ww_w*Tr(wMU(d<<iGp{QoRL(Kcl9ilMdi>L4ncHcV0Z;CqH3#*#^rPR8CwN4Q
zv-2Kcu9~dZrG&D#QP-k<CmZl_L0S1Pd}PR!=U$tdmB`P>U4B;_adpSPO!lE&U2T@A
z!M9|pB>GRz>N4QwP0K?by51L?7wNDd$Dl&mT!4u0i6RG<xu_JBt;Gzcqh`K~Wrn5H
zbtZlIOfY6UThsISrBOZ`DSn7${sbnKlCdR!i0GypH&j*Vq$RV<wX2rPG?+ZGjnV^=
zmaSX>%T{wy^P%k;K#~ogcM=a8H)h?n{iC_Pc;eXS!w^P@j*H1(lN_R3s2l4dY1sn(
z7IJ5)6J*+b1F(1d?XZYB2{jhiZP@#rkiDWyO>4w%4&`LN-LX9_mKO^YHJhy)DTAb!
z++S69QaF9TzuzHOw+3_MFF+jUg~x3uef#{rh&!&GvLYRJvie1FzYM03*p(j<8pBI_
zgovPBRH2qiOW<JttcdpaNN)Mv3JdqB7f?5X4_$x8XB$JZ_)0bY*$r=QAE!Zi5GC!|
z0bP>78T0Smdtx25-*)evbRY^e;rTz=tC#N$WYQk*-uo&2Fi|Z8`vB$+C)1Yj-xws*
z##8=wgqUK;+>?VeF=QQr0WwbH+*sp!IGHnw{2<S)UxOk~@F8m!Z3>)B6VLb!1!4dT
z)S?}RQ>ZRS(q<6Cnp0ro4sczJ9ivJl`#0z(W4LB=uyZrDDcY@|3O2n=LBmLG3nvGD
zq7KB63HkYl!pWYDA$~8z`=h+0QXr0Kw@+~B^s?OnfdVCCcZ7#np?pJEDBP2Mm4xIE
z3{ljbu)bQv0S0t{ilt3~{TzjD0344|vBiUt@iDaZhzK%T>Ifv&XJ49(L2x<#%&Z;}
zEdGgd2~HV1C{vAs++2m#n8s1OeUyGJx}hXO&!6@;BKG3~O_CFw#FVx-i?$XWy(Gxo
zi+(uD1g(7Gt4naQz7{l&hv}?Rcy%ItR^iKn%-MO7y;b)%@UAIv$Zta8`&Eh~3D}#T
zeg*!4N9cPZD)*khh&=SCEi#2S4w6wmcW;A}`C!P60A|`Ka`!yY!LDoIAemVQ<-7@;
z-Ylh=ne4e=^c^D@c7m)KP2-$r6N;kdi6!HUHPKB5kE0D!08v|cG_gpEP!z<9fH9_}
zP9Tsgw!+Gh;2<Vg0S0$82s4nOAs@n}z^RW>kR1YXE|Yc~PA<B91{=+zc!Ti$4Tn{u
zKv%B9Je<h893c6FWN(lG_Su%rC~^-o<0S$GqYL#03ZjiNJIYH`U=B2LV)}#x7h}k9
zZ|O!%;iH-lBsJhEDC!*)h(#N|;LpPE<R!EM6YlT=eS=<N_CA&HmeztVvoNm;(c-n>
zws_ZXNb>}VV5nyj0Fv|CjFChK?uY@U08%Q8L95Q7Bjh8{imxdKH0A(;J)nHP3Tx5H
zJw}o1BB(mDnSAm<%>eUL3`krPs+nx~8Djno9-%v!atiPc)1hcYfoxGAZlOdItgp(r
zR4jpF97R4=6`FyBwhbDNqpZk=o@T%yM<|fP%QK3WI$CHKL>r%@O9&}OL3ER!8X>6m
z(UfGyIimhgwGsIY-DVl%WSRt;lPEHJHp&P>o)J8H15K%ovYgBY$D$lMUV<`EptCyK
zDAvcCXsYI_v<#GGU6!2@(ubTUI|}G~Q_I&R+ShzM%<90`_L^V*QHr<9V^A|SA1n2e
zp<jATNGJxA`!=Q;^1`;1_D#0G5&p4;vs?3cP7w>VBOP{eHE8PP3o>BwM&1)mf}Lk3
zQwj>?Gw6_l0i7Z#%sPrg&EZCQak?0?w&$SbE?6KF88C`5Y3jxGI+!McvQZ-M6b`Y)
zQ~5Xrz??zpzn*ce!`|#hu-Q^;R-H*kV8~Fc(zeOIT@w%E%yZn6iI*TAWLx$vy6_Ya
zdCo$XkG6cUnhRPeZDh+b$;f?KN_$n;N)r`eItmVdV3`2$`6*bmk<Aox@L<fTBJzQM
z1T!pd+`n7sv5VyMX6Az8JenPXhc2G|8-YT1FzD6A7e}S9peir!bWznKD39_$DZ5aW
z)tt`Ba!*PVq6aBfQsosb1nyz1HgrJ77TcOVV7%_%z>+7%25GDcP>mr=4P>0CwMmhH
z$pi-7*P!O|H_Y!g8~h{%5H@csp}nXJuNS7mKK7?fjR#DWxkUR;c9l)&KDX3{`{X^;
zMV1e)!aL0M;|`OH;bfqpGqV22w1bbb$Wo}X+96$EVLvcrpRX20zQ$G$2EJkrI+Y0e
zW*Ai4K~>NEd?hRKMYcc9{tNQg{$$u!zt?N+bRXRf%6>!{b&~943J?E=d;z&%Ow|+C
z`?V^8om?ALKo`W=JZQMD3m2z!%X%L=$VA@R!tUJpt{G5$im2wl&-fby+CbB24oZn;
z!^+1TLJ^S?Jq?vq@2>=9U(KNfJgP_4)tsVpO*JBVN4->XAZiwmnjSwn$Sj+VD0Uvr
zIUZCoy#I8EkkyEMYZCXCCI4;rs-G49VSEj2vMtj=p4lnru4Gxr%t{DBFf`XV)LZ_s
z?|pcQf2quv*C*8Dkl$yuK<b>)<*G?0vWr=;1q_)kn#u|eb?Sh8VkATDm%O4Zr&EAc
z1D-yPW0G9W%OcC8UupKzg1<q5w5!a%5%N}8sd;j8OM9LIyCI5d(5MNr@D*~#Sn^L&
z`KDEp&G*Q2k&sMb^E5o2_&v}RID@M>LNe<`S3t`N;*BHnjbS|K1k=W43lVk&8AbaW
zJA&HQVbF$v)4_Zzy+-5vpXP&T2PyNoo7ofKz7wT1niz8D!N)0G70#aTI1jNrGGPLp
zu7WZ6A#=QcRwDQ7fQ7*nqrn$G$;r;>S2n`<^v!S&Y?rGiQ+9lp3lNj<0zcX9B1?fi
z7kvt9pvx^k>n^jT6C+L^p<)YXyz??)!>h0(RBT{XNAyArIWV?kl|36xnE~!S*@d3&
zL&46m-(9-;a<S#qeduP!p?EsP&DK~UtJ^Al)45$@o-{8$ePXnQyci2g41f2Wyp?&u
z?RiE=|7QPAuu$?v=8fcjks4^;1E$}If!*GLlg)uM>Or8`AgTT!ncE;m!XTt#kgAWk
zoHq!g8KM;%qSqf{bQ@w$7-Fp$V(%N`+#2Gh8Riii=F=Y*a2pm(7`|9BEYdeDwl#c-
z=Ch>OXDR*9(r%xxC482x_$=S|S#j&LGR=sJ*od0`h=$vUR>Fu*#mM!(5&f-^8#JRv
zVxzb8&qj^iM(-qynpKQi^o?3=joQ$R*@}(b)gN<k8*@q+bEz1+-#6yAHReGx?kP6z
ztv~MTHvS-CJfLDcsBb)EYy2V21XgS!Tz?|cZ6Z2hBDP{8u5Th?Ya)qeGDU0>r$3qQ
zHkp|)nO!lN(>M8KYw{V*RKD0$q5jl!x2fWUsh1T~Wqnf>TT`!SreBLq*XU2bb(^kD
zn69swe&09Uv^D*aW~Nzerd5BY-EF2LVWz8Mh8T3ww>2|BGdm<U`&oZ>)NOV=VRo`&
zcDiqNc58N?W^O@j?u-81SGT#9gt@hfxsATLt*yBon)z>H^FQ?G_ub|X66TL8=70Ci
zpKP7YpV1J2;(v!vP$Uu{l?1AO0?jr723?>PU!XTwV02$#PF!HETww2C;M`u|hA#4m
zFY*~I3b-!{CN5sATombF6x&|B1pOi@{zb~*i?sWfYl&ZEE5FG1e^K22q6}S95noa>
zSkiD`(n?&?sa(3=zofstbOZX;Nc`(9gRjQ!U+*M-HLLt;(f`$I`>PFf*;ah{uEDZ{
z`?6EwvP<Ri{r+XQ?PU+>il_LBx50|9`^tmFm4M2Xp#GJR?UjenRjl}GxWQ_q`)YLJ
zYHa0dT>omq_G%JzEk%5dxLla-zLuG|mR-4))4%p)d+ix?Jzspi&|v+!`+9Mr|N6_y
z^|Jo;itY7R(2dvP8#M+SZ{0U)6F2HBH{SPeG;MEugl;yAZ?+n2w!3e3ByM(9ZuazV
z_HAztK(~g(w}>I4qwZVdiCdGEThskpv)fzq(Cr2B?Jowz&id_@#O<}p?T!BJt?lg{
z=*~CsogW4}``d`WF)q-5Fs}b#T>rti{)2J-|Auj4*TQc+E%F;9rTGAUqXE7LZtJ5`
z)IKYMVP@j_VVDz3bv1Bn48wJ>3d=|oMsY+q^#YG+3S806nJ!b|lb2NdljkNPX0Vrk
zvs~fjZ~m}c>)mCq@c+ef@sypjT)fQBPxr!Ky*)P2+|sCtLb<9Gy`cpcku2Qm;p|%$
zrr~d8p^K3#Ly{z2aJ#MgQYm?&NAlvL#IWYOQ#_xSSS#}KF7kaP?{{I+i@jAB>VFkN
z`5b2QsZ_|gd%f9{5$vKW*rJW3OCpUJm{M|bi#{R<^`mBhWG(!4H;FB&&O63y!mp6s
z1Xu0i?#)0@?<ty8r>5|i8jQcJZCLY_?b<ExKGOZd{txS&XN5^}i-Vtc2%*N+kL0Oc
zTEJIeWR2BGEwJ_@q$0Q^QaK*nsSl4LUyV?%jT(e008Sx@-d*jBc{OBP!YI}>3uwa{
zpqeWHgZu3rgi(X--3MO*74#w(;aOYTJbH-($$(FbFn%8V_KmM^4}VDS0V^>BT#dhf
z*!)Zg<3l0b#5jKpuhLhBTHBKh$f@T3LAzwF{~OwMI6x^ufzXy{;m$1t%2ZLvS*D1C
z+zhprP}j<tg-FeK{JDED2h^LMtq%bVgddo5xC<M6sD?fL7u;pE^9Sxi`L|!sxXgP%
z@~{XUc`PzTbrzLU&lGPMI8tL>O&nS0`6G8xto)I?w4KtaG7kU9U5~_0B%Uc}WQZ7T
z-4Ah&h@(F@yby^|Bw=^dHnrf}eFNcl<J&ncweWME{noG%tyN75L>teBcdmS%viVXu
zQdEcSeZe#3Q;<~fYD&@}sUiHzGE82zCA>5B3upYf;nnO*G`yhfUt5TV7mjP`-0-@%
ziskVe{ry<E#qa(4XipH2#NrUq@De)}N$6y_@%4}4W%tMM8WTb^h(#olvJwq1eBWP&
z*T@!FND&kTaNI*IBS_bXh8Mv*9mk)YYupMSvAa{>Dk#%V#JI4?uz=UYj@O#9>+@AS
zq6Th}&ej3*%$E#RP4u24-yg+Wxu7F5e^6w5)vMp*$~XK#jctPJUI#SajqB1|3m6$u
zdzg0_)PE}+V}jNTL)}6g#xZu>%ZI5&5RlX~Kv{~G`t|3Z(>FE+C6w>HL9FtX^e>W!
zEWIx4i4?a}*0)eje=Y5Kn*_Po`BK@hG|46(bvs4PdC6I#H18L0w8ZbHFtxl}+Pe&D
z-8U&9fk>D=r#AP)#S+Fa$|Q}c&)i-GHX;HbMY=<^;6&q>_U(L$Jox~}Z0bR=*`W{c
zWRFCEYBRDP3j?H3`Jcd1h^UC9-nY644c{C&&XSR{vtR?Z=Tw6lR+M?-U6<ZYTZ&<J
zUsI~hsu)}X7rKnIeNxTG`+}{QF`{Kj93)i8N5We-vPEW@Bk28FQJEVcb~$N7Z!ela
z71q7iB6M|$p~+9mgPRMX+AJg-0*r(AzZ%6}-R$K#5lSAhE9uf)<5SnC#$LKyEHuGo
z@;<E1cop>hSwIRgnpsF~$xAEQYIfnqrIJxBFpY2<k_j?FvS6{17abySpjOoqWfNKh
zeLvx7uRy116AqA`%i<0GL6Ycu{^p6+P`aCe&1}u`R<%YrP^zf4{mS*Po0|*ZOPwn4
zk>t`@vqA23=YrI3L&f;PFY$L>Ewq%3$aS_Ko!L`d6jf<6g$EGa5KdQPav8&tE-hc{
zBk%H7`5F8nazckYLfkB!xsOwt;So|RnSwttkIWPEWr&or<%>_4#gWchxk49Dp;m~1
z8*~-C^tp{GH;+u>P?hsuo)yM!pPty#?qWcUcqG1&-~2tLJ;IR8IAcUU3K0Uo#YeqX
zv-oTy|9esoaus8aNOE9`0lhU%$2^8?xd*+!XyJ^lYZnV2R9uA?u?StuIoa}i&n~p=
zH^@1szY{1TFh};dw&|eH!yoo#9soO(n48!MV?QQ<Z`8Fg_wPo@A1}a@>e>VizBQM8
z>1P|t)EF#JN(?$iuocI2C|iF^z2VIG;>??*S&A+qgD7`B)9-BPRu~7q%y#ff({?2F
z@y7k;P&${pG+%n0%U#!RclMscUBUZgkMsV(T`!as*ICZ$$Hqw~{=i)&*3@yFpawG4
zH^YC!UD|)aU7Nl>=Wv(A&kmu&m82T2TYum#XQkxwL`Ld@lX4>5C2;)9>hT}A%jbGH
zOX%Cb;VuRu+?6geHm0@nq?ZVHMYh|V!(G6|cUD~%OUJ1%jQq_~g0;@!E?QY%!a3Y^
zQgtEo%|otth$x%8?7R<<Y>f!7QTovDBqor4o_ItQw+XBpzQ=`x`DMQXouz5tINehC
z0u>8mK81ptoX`U(OM9V{5y{dElf5;cH*A&d@}rnk?#1rhxnhp7*dtYp5QLjai!@&r
z*<F<TN{6w$BGUbx8y$uDdRg>swYUKuJagOp3Lcyue(~$Iuwfn=S-f1j8f>Fjy?YQL
z>rL@^mzoES<SsH&<X5U2SMwSsr}_S{dok<*AY6P&)W#Qcnv98Bv2J{Oj&~u!;WZ@k
zA8%r{{INU;nKMt2ia&*kI;q8~6F*B--(Pr_gsx(Q@+Gvbki?yHyo*4@yP}AA*Wfrp
zwoaRfccn-vY=5OX{1N5(2k&}s7ZG(wR)(Hrn22|so$Fmu=n_cHu<$MC023ME+CO?%
z)t6vwCaLp<sG=B-4`}%-h9ZYVy^EmmEBP)F@4`|jH2uN5YDT=~ZV9D)A>v(+s{Y_z
zgVC`>yz5(ywK!w!pc>^XXLHUDBHk6-nHhV!CrG&jYefi%5fq*uCiDz>l46w=jNv@Y
zQe?zTaI9k(AAH4BIsxaqT#`sX<gG}Ncv!-*l$CUR=sv2Ebi$HMBAW~{OC}FU2FG3?
z9ag(cl)K;_6=4cQxr?GrL3Llg&pQIhs{@%#`Sm(^CC{zzZ@EjED0i{2p37ZK0Z^O2
z<gUe(t4CabGcTxIJx*Z~r*wovvZl$IL1MlnTnk8BNx`Ysr|C_m$#uzc#HQW6$Yo%b
zZZe4rFht&}PoD=u#E5biJOiJHBg$QO%+d!D8ICV;W{_K!M;TKoxH?9V&r6&ID%GhT
z_ZXh$hRhVI%9PKhxJ;fI!OH2yN}_0%5m1jKsYz1@WGN8kE_iyRS$3~ymi!UT0|=$u
zKXMoM?LTst#ACU?<Sx{W|B}1#xTH0l<dJzseNGoPTb?L)8Rih>uJ3>3E`Flim6uDD
zyIjxZuE2lET~hV9+BMv_R`<rECk@yqD`yxB#Yu8vq5Choi$D7*k?!g{%9WeUlB?&<
zb;(KY!ktn)J=Won(|M}k@>EVISFZl)H`dfm9TGXB+$Hg>N;dCY?#g>|^q1U)4mqjM
zZ(7KaznIq=o3-BcwEr);3n7sQSCp$KStH6_5*g=m7cyVrNaSlvzFapuS1GQQD0krv
z<+{L|M7e7>{XQ8vO&~M?Vg9$=g?T1_B+u4RXnK!5nkaYS)B0rd6(*l69?{ql<u1Sr
z38LHu$TE5S+&z$8_K)0Uy`CG#n(A#{xPno>^Xo<EFE%ZS=T2rX9+*E5*e#CHWp|TJ
z?Kt}c<z*!iHcQ<^rEJ1+|DwC%9_tdb=U!nI0pF9QCzEN1T>!(vOtJ|iiwckBR9PXV
z|AujuH8hkpPL+N5RfcCPZ;>l+GcW%XSl;=#yt|>Cm>JOjt9+2HVpy(X#JplGu!5OK
z8N`5i4fmk1yZ17p6ka4x(o!1jnZn>=s_z)s_od<#P)Yytb_BK(crzuux?;;5xBIAc
zVv0j{@?|<QwUIuRgzhEKE>$Qt>$}`5UIBzym%=4{5eZ#Yhh`Pfu1eLIC3C$>Tvmuq
z1V>V)!<3WCGWja=VnHNZ8kIbYZg#bB&THz8YSsGc3->w1&O~Yyb!xDlH8MRox!=r0
zjOz!aMmmVYkoS%3^*5q%)!OoJqG;c!{;tsw;n45FsU#Oh(3Tj#$KAQlV*dWEVC>sl
z*Ey^q?^cpo9LsPqDes)*-*o`r%Dg9QAj(~sObe0PD5F}(xLS7$4zx(k%?;*<RCT)V
zYxJhyV5e)}OV(Y?sS9qdOR%WJ0P7>y>mJ3ir@hb0C}Ykpt52nR6CL*^C#e4IAG~WV
z_6<o;WekMI_<aN0bi*t8h9V1gv6iQvzyC|_suQUhtRidZc^|p(K83kaT)we=y7+Am
zd+Jpyn}Fhs^(Uc2F8Gb=xO+{(*e1WA;_0*BjbYy;I;8}cgFblMrB>!-W<2_^{rkf%
z`^WDhA3yhe_!0E+Fz4g1xDWe58C&l^0?J?B%Omd>`EZS=6qt+8W+LgHPO|_|el5e(
zDKs<aAyfbmmE;BkRw@es<cV=Jf};f(+|25l&av6dOO5|=7oY1VACTAV8uv!>h~$JS
zP4Z%iWNxcm?z^(oCa7q&JV%=<NA33?O{y>5WE9#WDQVINGiF*^uBDhrl($`^qWLD(
zKJ!v%<9fU0O#5{RjX`5OGN8)Z@{?mP4y9macZ{<S{uJlZK1JDn1*k~7@hNhuO>YXX
z#+q8;+!4CjZsMAnj%j~Am}&tB-9PSlbe7wSrN%|LcE&Vz-hp(aUF;B}l`|FX(!W@B
zr4e_7f+n`St04Cs343F!h;qI{cj?TV=ZznVk4auOb}Ju=Tr$LG#M2GlYOUr-LsN^s
zhAXEu_Oz5YNaa#wl=igd_6Bsd4F~mhH>Q={?5fSByPW=HfFo@&`pI`(*Z54IbG`6X
zZrhwfzd=Cvf?mJ!k+HXYpYRax>&?E6`+chl1NzwwM2YLrHD4}ZU^X{*bB69o&H#zx
zAjoQvd<*yH_W%d&AjRw;^kfh&)=jKrvo#OWo^;fpNSjdUW`je8Rk)_XAu|+>Y7j&z
zIWu)|$TvB&uxj|Q9Q+6kHA6#~&qDf$6>k>XA!)ZyT}U8+0ARODXF>u=Fr@MU5C%9A
zf})BGAQ$h$i6Q{^UD9QcKq>$*0742ge0vo?qPI3;5eMW%LnQzJs$?>G#a?11oGJga
zOJDn<1ds;#Ibaf?*@r8v8i~6&rmQm@2O%{L$uOUNLjVA7h@}Nvy^TGg76kw#PsYj`
z$6WPk-DxJ(f=NgTlu7{*V?2dQ2sG7@EDQlva2Z$39=C474G>0dg+QCo<W3mMq7Z0o
z1+EJLNv(n)^vB<cLF6t%A0?C3;c=KIT&?2t3VIqTJ5hrszvV{bn@m=M$JOnUxh7L9
zTm&1V$+;_Vk!K+jDrVCw2<q7oXi3#jp~OronmjZFiWi$HwxXbu7?ZCDlJ8Dth;^kZ
zPSP1o9#ynPih*KdfdDv=0stT&prC#L00A7R!o5fs4{XA@qQ;cB#x(!{YT_xP$%6-h
z;3^`_1e8ESZ7=}RJb?T~FaSTzjs$*b0+3<=B)b##oD(Y&Q~=DF+$4~`Y6gZP1pojP
z_>qz-08>AS+$2a{2|%_x!8%Bw!4OtZr0f7<0Lfx7AdQ=Ak<WVZDghub3lu~{=@BIK
z03y`|aJ)!;+2Bi32!uicK>Y!z;6g)+9zLs>f7Ub4wJ;yl|1OoNa#i3&B>)X)Prj@q
zFNC3?g%SXVN*wJ6TuBqI4gk;<rv@MhnE=35)N~gbA~Q(jz({5AU*akk<<|hLdAKIj
zgyS|~3;|_80OieQ_WJ-uC)AuDX4sS{o03;ve;85%08-Iwym*=c)F>fujU*Hr`h-k%
z4)~&fTJhp~k^8zc=ki_aWtT)?{@mhgrH!{wXTTVs<HflZ6p#hJ8rL`<dJ4yEZ=)<W
zJ1cOM2ogmXAWapH1rLCSj;ARtT&4ji4G!^!LIn*0$}hKH_T%(E42c4E8=nF>IltB>
zeo2G^Y|v0uG~mEsCZZCj*0=Etx|L;329TH~I~$@VnmiIS@@Gf0{)&ryq2J%=&&zdf
z$>}V=cF!0C0KyEvF~b04&sNu=q@>85htxaY=HNg2_w;*~Dng)7=Wyj8a7LWF#rnGm
zO+eH~pkNd5WE%&y0hJnLNDR=B8G=@-AOIxLb{<H`!_{r?&>*1Hm>){A6LMYaa-rn%
z7Z+8PrqLh2wqPa!gTVVbKjgEAuELK>#OD+qLg@%wDW|jOO9!YM2fWEY*F#BMF6}#R
z?%ntZH@fjlF=zZkAC3+VREz~uNG#iluaUgMrB~vd0Dy@;oGJitc>u>gxUCrbQ?ZML
zoIw2j!!rPY{x0spE8LSgAOJzFvUVUR4(j7xdwk|j`hNZw>(i;3<OO5m)1p7EbpR(*
z1(54n%-WfanmryEzzItHUXeIalm+@#{(3&YQVfHi5_3IG2NBJ1o_;a=iNOW67+L{?
zBGaKojd)gRRStBEEhFG+;QlYKN+^J(<q<%rr3y%8*~OAbk_Tq4^&VhA!7r5SrhC^>
z8?vP9C6`6YK-&~rt2%GmQU?*AL7ukJq?vW2uLGf)q?S!==740|#qqx^FQ~}>Y<a1P
z>hn-@qX<zC3U0nwsRksceMNS7)0c;l8g{siRd6u^;a=n_SQ?t*tCOZvdoCj{jqm9B
z5ANTec<nIo;>>FLr`t@u@6Ph<^nnMVIT9vlJyVB|C`-TOG#Bhk4+!R<ltmh2>%5gp
zOxizG0gb7pYOg6?TbIXBm@&BrB7HG?-d((g4urJOR%&n7upSsu?utT9KslleQkO(a
zL3qH+T#3AHKu>?YJ+PD?zL9!V@)%GY31Y<vGhImCQM$h@LZI&I&qr0S_Aexrp7qme
zRRT-#dEqC#Xgu3W;NG_mZVP#LZQi&m-?jO1x4m>O<oFCfTf(Gy=?Y(?vjy<j-vej9
z`<WBjIvluGop0afrJZG_S3}Mmr!-Mk;DondWxdL|E>IeU_awU!?KqUmdqrcTvOs!(
z!-wZgLsTfQUzpu@&xq$)n$Jz$zcDTb*+{Pay<3RC=q}*s&>y<%x`FR#{;|08zOniJ
zKA~ZK?@`}7e=x4af;YaVb^@vny>{8H=W>_M&s#dZ!G7izo@9SxT<&oU8RqC##s`*O
zJ<_$Z_um^ou=1PsJs9^GNPl1*xbgO2?&9Z=2R5O<_YZ6ci|r2xkN%RoP(-;49<^f(
zVRI+;uPAkP8&k0z*5pe;9rMbD&*iQR{Ka#*OJ+CsUvd{jX~0?4Ac`n=g<pX@y<>w3
zX9{#Km}i`DD&qW0?!xf=k-N@PozLm6j8bhZDOVs0ux~)5yB@I;>8=-IGH&N|7ry%F
zobK91yEI^6M~Kl<>)qv=eCT5(Ok+_OS%Y&M{heUX>q+9ro*Lx-4LtRwmA<Z;0;+lU
zqf^byT&o4-bhd^Kb_dKpWcht%)e+qw{!ymVE>qvpHb&(e!w%o`c)AMVF=pJb1N5i3
zYp4E854|n@?J6cQSTZ&lY)+b>Gm?(8T~`xC!4`vD@aBD%o8NtLQ4_SvikFN7_aCCL
zU_C`G7HTF_L{(%&7d{lyFH?9DnTsS*Y_(K#Ou>@NAV|#C+m|(m<K{FFBy=q8s_Jko
z0m4I);i7s*%7DVoN-jMVMd8W&s{oN^UqYxl@y{N^vE=spqBVKQJ@B=LsCZS9pFzk7
z#N{|rjy$IeKxD`#5)522;x?%>W2BFk+HYBes}3!aH0xR;oc~6g#gZMfO--Z7*dvlt
zGr-h(H75X^C)|Rz^DSpl>XI!ArcdbscFSPAV-N{|5-3Ss3N@vt8=z<{k_3>4A*05S
zTtzObau{OtMT;<0_3FN1rc97G`hdr|WaPV70V<;EU;_*AwX2!&^k4!YD)@^U2!tsI
z5;M~HMg>^$d=!iT;APMvfC*D;NSETXQW7^!2T_VyrA1Qfe7ehpN3>Jp0o;TkS*|m)
z45Q!}S1LGwmkRzgN)+I4o6GdA(ci%5#b+B7e{orNCpoj#V*J%ZI5l}Pu-XvMRw#pK
zZx_@mHHrX|I>*YGKkrC3CB5%^2mpxVGf76A;vFHB+$`DZ6fB6;l`MWOGBgP~IA2s|
zw+JYK!7_CV;hL8;;h*2oQSY@pUy0#a=ito?`kq2U3O6LJ<4HWi=RwWN2or&l*wS25
zevg)gz_5}g9;FB%+2M@pAxei9E|hdj4S9<Lt`2Gxzn_z}ro=fs$o~#!x_sNoV)mB_
z>h-OPXWjS<%qY_PBN`7#QOK)>et_)V&(A!IERlj<Vec+t$lQkbG&&|gXXLw{-e&S0
z%a<P*Y2CY>YAynsV&c8|$bFlK9`LmV0B7?ou#+T3;>Bf2X@N(0pQ~(uo1Rt4QUCzS
z-L_{&4`SbSh@yD(6)CRe)-}hXD_noHB7KGM$=BPe0LF*+sB26<SqHBGZU)Er;bq6~
zInY*q5%37`6}YpjR0{qmTA;^?pw@8wOj2eU!%r<S@lDJ=k-kfnw6qXlyGr{I3P*C%
zO=2kc4_$J8vpdR`nk9Pu<cGl>%$Ru1qm!>@iBj1yk;Adx<@NxGfy4q^i}uwl13H#N
z34k_nY()l@CsMO{mjh{srn{!Zjl^G2qffbP0_P0_7aS9VWL_nneSdS8K1$l4>bi!U
zy>X}BPT9mgYf&e&o^}<F^y0mElx~=6Vt_|51qwT6{)LsH<q}eig4PpXqcHysiy3$g
zA?3icY3~Eoay3fdD5=R)vI|5A%HCe+UsPid<BM)6THtHBoR%qsCwVg!S8^HDF6`*3
zrgP8$4c1Z&<hP*a<4;VdJ)pB&&}0mYk&23cJ#ceqU6#&;{w3&JS&M(Kz^4l_S7N_V
z-*D?B1)=ONg|By8IQrE*(a#YV{H@gl2asOIq?1^_?Nw(*o&XFrmDnV`_)aS=nRWrk
ziV^H2ruYQE0CGif;!+cY_W4IMWzwu702vxU#()MY*(cmS14!%vH~>J6E8YN_EOx-t
zpu{5?6lu5x_$Dj-<Gx;B44eW<DhI~`5kWjTj?{6nmKId@ZcH!ak@iOuaZ>hTq|8V>
z`;E(XHHU;&PD2I~e!5*UOzcw@j7s-@d=;#UAkTDo&)VVgy9@Dkq%57@(gJ(;T;AWC
z99Rw<f5y30F2BM`>#sMaj!J-0g}WER@#NyK>q!}G0VD*YrLa!f+Fmb!OxO=lcPOAH
z**x<qoF@$i_#g%TzPpn33dnmElkn?6Qr|P4^Q-ubcduQZS<YxM_YYYx1EF0u8v|VW
z3E+Fi0=Vd?XQd^X-=-VQZm$d=ue!j*oyG~Ql|IuM+w_O3NZ|L%Ls-<8)qqghWi@y2
zF*0c0Cs>aYz=T_f`*`{tsi`|r?!uS1p1!OIvO4}EcxmF}JjXfQRpkf1X4!oD8AHlk
zSn`6)6H^`;bC;>7y*;z2+A^jpO7CvWsZ@eJnyl<|j9KRuWusa}Ed3o8eDrE0k`8-i
zA?i9j!ia^zHW{SSnM*t#yqPHHEZ!ii>_C6%yM+o<@8utA%`LB`SjtoFC7ONiLMb}g
zT5?phjhdN`i5OQg^O8!~OOhpCRpHm<mfldEi3l~7mf&yAh+I`+^`|@$s-i@UYcG4Z
zO!d;S>Vx_gF%GrMqH5?hRS7*c>9&kBJ}}l)LQN)KO_m|k6pZCFRa59y^D_#Emqf@O
zt0Ae?4ZFhO7?7fZx_V=V+zg3|tGZUO`ZAd0nx49Dd7FMpbi}Tj_Kdp0rh04%(X67l
z&Y^KLH%%@W=)9{=#JIGBu{xqejH{i0p_O@1-Gqp7@v9j&s+kcnt}D<0LMwbCOd*EM
zSw_=dPt(CtlZbIS1#3FT{~s|f`%k(PVG)FO8zRPaOk=1A_9tRoxmtncT0xCk!M*<t
z<HB-ihly&3D`-dPX-8UWM~!rtI%^RzuG!>hQ%uAepFc3ZS3BV^jO$oC`M8r&8_WRK
zN#^K+n*wo`IvK7ynZY_)@j6)%TIp$BM1_p5O6SRp&eP4Vr$stX+jO3BbSK{?RZG(@
z($jqiY*!GX(V+&q7`CFQvF7RtR-o3G<=vm_bf0hPzB*QQ(T+h3#uUeQOZRra5T&VX
z(>2%YNigks6@R_nzPXAT`?@ivT0vb~8(iBKQ>@S}J<|hUz22w?#^+vd)6=WOQQV;p
zyImC1sNU8<tTaS)tL65_$LO`s==G0W{#4Z65f9c;AgR$)cR_31egp0sY5fe+AJvN)
z-qf4S?W;|VzN*(3jk&IS+{^6WdPA?{Y(hbOZm%z9qMcBrzocg%-mPn437#!iUl#56
z;cs7!h*`O9u-V(c__E)-&S2HGXC}A*rh3or8?`Nk8+-P-t9$)M480%JJ5)C{4qU;9
z3cY)cH;zFp&B409dm4s~J)`mMXO=O5z8j>9gMPGnJ+2*HKJ8>D?c|aAAR@+Pl_?k8
z8FQ>Buh4HjVmMs>2jdb*L<IwjM2Be4F|MI$czcnL5z~J#uK!0EmuXy+DRI_4Vb(Np
z%QWf4G?~UMh0`om%nYY!mZoo(Ze^C?W|kRZmX%<Z{lx5X#iZXqcvsGrnHv%BVgdib
zyQT_=coz#eZ{O_2D8v5}?<)8=yz7P7v`zp;!5_S<<ZryojEHxYp5t8>qRAFDvlaq8
zpu)fKE;#rfylc9&&#dq*=tGDl|2K<2c$Xy+@4`!){~O*l-4<y%%t>b^WKP7p`u3x{
zM`yYi!K3GRmwA6=!a3fBh?(xQnlz0*Lr+j(|JJ)^hbt!i3FiOOyT-+)dj8hCW{4qI
z1vHUZQ;M}GG(@~><s9#tvJ{#Mm9c*OH{L~x1xKwWgyrp%H>Z=mN~bx;yI5jw5p1T;
z@vh0w|KMHw&nJm^*PwKG-jnDz(o@a<;9W1%X}pA{(D0a2ee=KYF4)ii8SmQt8}FJv
z6#KhRl8njBsKop)yo(-cRY=6U;NZXTuEM^E2~$fV-c?{_r#xs$#JhG*rgzWru9+aD
z&BIQ+!r8?$adC6n(}hF<yFQx8-E=$bAHA!CGiF2Is*k95`O}!lSUx<wdkr;P(iC+e
zktB50P8G9o=^XExL$ll^;$7VdBx;FM>f%!x)^=C7Cwlemj`pYi4ey!@Kv|di&Z_t&
z_$SYmp5tBf5_Jm&0@31?6fKN4fAB6looxz>PY!&8Ukko|HTY>-GHOZ0yYRl@RS9$A
z1asv&>+#6>aq!IUAG}LK$x@WX$zyd9d$?!=b!5<-M{_xOU0rc-TwXoLyNFxMKX{i-
z;i%)d%zS|{>S5lT$~#-fPJ00vCmV7{TTPp=pA_Mmt7rZhE34;v*Gf>L`5(P&reJ?1
zJlWpnT<<cM1KSYwt{weVYd`BK>lGbwmu3x@^mkLS+Y>~*>&cwUKX{iD5$}R56Y;J!
z&6osH6A}Vr3=!|bSuduWIIo<{M?GEYkG$8MelO>POX@#(*R6l>E+KJqe!|>bUG$4(
zn!2CsX-!cD#$opzBMaX}l%C^V&Sh428@M*dt2W|Krws`!_zSL|l)$Y@n<X?+C(=`=
zZmvCk_pZsf^v!MJOcu?rn)7$g^>A%X5<sn-R>KBc6X$rB+jywkM55c|(=9<F-h}{%
zYTHcIxt(F_D6E&=CaSi={V51a;Dr}kN&D0E=X#fG_&<8rTEg}OQSTB0yPAX*`6Wmo
z!^8Y3Ml`n{J-3$aw=)P$xV3usFT892!}cZ@`1d*9wWy>Nvm*{xM!9^iH2oLerE-pU
zZFu|_-et+Jy#_uY;$2SHoVWhLyF9Q}Hp($emUWiOEHgyBtNP#YuJ7k~7y4g#*UFP^
zA^&e@S4~$($(PUZE^{K@RRq0D#Jg6NHvZsU-!K2cyAGQoSEH=qJ6~JBM(nk_*SWbr
z#F(F5_g^CFT_x#cI!YU#6(e{5*1Nu-z+Pc*?_cj+{73I{LMu7OyxW!#T3r=)kpfu$
z!Mj`pR=uzi<W<rn9gN;022&E+t9*9|r`ArYaPS|z%gTCUp6-RWf}rUiybE=7j(6>=
zoH+_B@2Mt5m|hJxJIA{$u`xbj=XjT!#yQ?K4;|YR0{?72*^|up0@~TX@4uv-wO?!H
zi+$p{Qb8g3VOro?*i4hJdZs(m-*}hT^@(}$18XAQHL8D)h<E7<dP~jETL|4H;$4!J
zR`LgEuRQBNc$c3W#RSyx9yXb*RXY64m&J!5aA3J(S@6}9A#{nTcj**I_Kt>oJSA`K
zTP%_ePdL}R9K{ZnM<b{4O`b6(R)XT&5tmHo+7mo3#MCLp<Z#D4IS2?_4R~@X=1XNj
zp>kl+jlkzNfiFA)i#sO%k9gNFBHmT;H{KN(GPqUz(DV=96<GDZ#=DO3|69E4SYz<F
zlJl`N;rEAw-+1oemWN@jHo-)^tNXv>UA0bk{=vI~v?hYi{-t+yp6gvFRZbz}HbF$a
z>q2bcKYG_Mo2sBjn}{Ys(z$~W!XLbA^c?RxnRsRrP!eK+|NU=x*XbX;D<r`1^kMAp
z`lP5et%v(g4-Y87T2HMRdzLGoef+<|xP<RiyRLl~(8GQIz!((ya^SHbQRSj_E<?x%
zOGbybt!z(Uws^s@&x7NKWGiKXL*=#i{$N~QTkHEG6IFH{sbbTN^Ysp|I2IPFYl>gm
zjPygK?~mszJ(vs?YyYyRd!y8Mhfdt}>`-E{?Gdw-`=<Z>kKXNiG+w{#6AJ6*mlXZt
zla`02@8tdbV|ewK-l=il`X#+NQT;LW^ebe*x%XAUYc-ko-pUV##wvA4Sa21t;SZ%e
zwvT1^R)>op`qcK`ekO8b_kXZ=-%U+6UZd|J2@q;R?<IuZdl!<>ivogl5fr6}bm=AZ
z4gu+)R0Tw&N*C$PLJ>p}k)~836zP&3@V=k@+q3sM|D8EA=R7YVGs#?;wXXI3aE;ze
zZQGd1@o+zEe8+yYzdqgIzJ2~$*Y}MC{Yw36rq@y3&Ry#bA4<MA1*M$$nU_CT1nEqF
zp`bs4eqOOtkjdI%Pcb@Ha9l(l7Rw%Z1dAhGG)aQn@Qjm$Rz?rmsD1C47^JmP*d=!q
zp7DpLD6U)NsE*sA2Iv#dBIZ&?ht(J9ZR}{06Eu~Mc`}UkEYnnK=%!;uH+}BWU2p2Z
z{U80Vt2bC<R#QYnc<N#VHLkVt7lxd~7b({etPRU2wW=qJ%BK~7q<7eFe3pMHcV%A6
zUH+s$xkDvcGWp*)n84${`}YtrKXW?fuc~f4aq*AvLOR_((1?6&U6inX?GYDq^s0X=
zRr+G=N=^?E<Fg@B{BHPD{ow5^gO4vVRus~s;6RR_w|&iv6oia>WOJgDECc;h_zgv_
z3%vTJB>0{j2}-w+(1N0p+LiC&C%sMkZS&%hv$+fPmVeQ%y0R$JgG;pQk$As+XVHp1
z9_^A$*_EMBwm<q@UjcthN0FuS@Ci;qG8V6P#Wb<KEhthE<+)J11TNIB47}P!dZBia
zFDQGPZ3w(h(W2zXqh0j<4L+053$%-Brx&7o7<Gwu^@wSnC_JWCf&ZqZOd0_=QdhFj
zH(=k0u9-Az_|ZO-pD;f0(y*;sy%ViK${ubAy&KQ{R{3ms(U6JkF-^dCjc<3NICC8{
zQmH8|Z|iE7J8%$5Lq#VB>pOhxL5lEb`y}lnk%{du)S2S|Quc0IK;@!G=@>i4)xogs
z+5V%4I&=P%j}*jB>BuQLeybO%))<&3>dbZ^BKWB7-(XlCpr7^&QKs#pz;DdAcocXP
z7Nk|K@hqn>oG;^y7{o0!CPuHs7t}-9KgnkV353H7?hmQ9_)@E7e1L^8MQOYnQ%Vy_
zg@0*@_$|YoI{T2vEeUOgikR;H;<@0!G~U~ov!Wst(sy?#PX}y}lP2c_;g+-kfA2tb
z#*QIE0Kqh>jYg%R7TuhhJO-*gT*U<ESYD9nkSy9a*=UFx*6pOhW48jaJu0StH$SV)
zO&uS+zvL~r9Lw9o6kpLFNt+BFL@}*ml&)$-kU1~0(t1HGd3tE7m5CHl3ncECC5De&
zeYj6Mt$sXZnAo#IwOwSQYEK>Pdkg9vUr#auT})Z|WggW>4Hj)g3gmg9n1f?dmC>aX
zW?kB%xEZd_<8QD`)pj6U#-3>NTQS4kt{D1YKI$Nf+hFyfWmH63oW{H`?T!vuI;jp~
z=~MS`+e2M!P7)$a6TxsAHz;}yMt&Pa$ur{AOKqk@ChWv5dx8cDg$>5Zncjx2i1c<a
z)#-{JVPPpu0A}tIh-aB0J1V|kLTDk%kSB`nu7JAe{y4FximAXlxQ|*d7s?{mR}5u$
zLhg)1EKg9db%99QHh$xTEMyGbc$D~2Wpp}~I=K~-77A-jD%w#Lyk5a8M>o;Sr&>vY
z1V_jK2vZTJC`Z3y{F(nkY7sS%yqU{I|49zs@-3#;i38!sCZsZ$N3`cTv$7?_I7R7Y
z6a?2EgQKbc)bu2R(_SH3GNT9)HdF_*K|E96T!pkR-l#c40D<F1O41tP^r2v4>5Tc9
z=eA26(-M(#MS_+iC%u$`b}_6G3m926MeNfDaSCQ0B)4Xv8KlO8WHa;RG!>-`;uZbu
zCH$$-F*Kd9QLKUsH6S`;fk<4Thx*KugvKeH4mPF@F0h-0D?H?$oJYyAEhY>2FR^Hr
zf>zJ$W9}DlQ!UsHDD4)<3gm=S-TM*E%)v|rm+1iq;+5pLzE&|uw~3ODqV{x<z*`pK
z)aP~@(Awg}9$jEJ+1hs4<7^-uXpt)ZQJm-}DD_=77zn9=5;+?uro&|vXPq0VQ{6Vc
z9gIDo)s~1-D;Oho>njmsy9!RY5lliA#ME~lR~b%=inN`}>X-45O!|F_@$qe;KrKJv
z)8R@D4YpuJLTAYV#`w?aRACW4(P6ci{2(QY6LaQeM&2@|g}HM_uZ0bM*WOHo?&?b|
zY>b){^_&SJ-P`}uo-77KJ~fqFL+Jp1OE*y(1C|?$+(KFPuBVPBG$*{{B9X40msN8b
zr_BAW{Y?Hr()|iW>XN&0s;&!E0kv&YDO|mw>K1BYjaiZBT}~*YA}ZgXd93Z3F={d}
zx>d2|$S(btYC5&b4@Kx`da88PIzM9kxWZ{@gJWraE>KDz!EsE+3Pid5k9$7QL@?%h
zs4H-nM?E|$PFHZ1?f9{?ZgC0+_uPM?7HCIw-QqK66&E3VUnYrs`gD#)uJ%BHra5-j
zqjVP-E9PshpfelZKZ5VhCg>;deY03RFY-sRJi#D9xvT;@ablt=J29*9xtB2y)hpUf
zT+8<3Hra?tp(xc)p^L!^zhkq<&wjWMM6wyzYP3Y#GF6|bGt_g%a-J1O-Pg&Zy>|of
z<W~X4MuQs`{HaZ?<yw*$wq(;lU*{J6FE6vvAXo%@(3gO^6q5{-y2Zy_6~8gidwhK#
z$0pm=a&+HEjV(-)*Admz6dnmvz)0WN;SX~MZWp)64gAJUk~|2)z9uwRh4q<%;adb9
zj-_4ftqlNqp&i%Mj$RtQ)e}?Ew79Ahb=D|EPo>~vjF?5qW;a-SvUg@HhRb#*(fw?R
zF<muGpf^C=2`H#ztoqX$2D--Hg39_Hd`ig5CVUn*<i43||AH%up3|-NEe3OA-;QX#
zUGn%n=k5=T3am5kiJD6qkfGG(4~1aojv&RZWFK|e6F!efT2PP3t8NYfQ<TjYp$^1;
z8ft;yrkdbmR~{?P<uNT0HucGCnqB|OU8YbS9(Lk9&__k~N!@QhF61u4Rfm-6<zB*Q
z_RWx+JP%W-@N$>Lb(P6TRM|}wLD7yR?#Ys1lpSF)^uOq?`9!-P-{#npzuVi-U(j9M
zGR)x%SMhXLL_s57?oy9^di6&#jjCzkKXTWy&B}4_ifqPNSq%7CeeJRBdNqgkzjD{~
zrQ9`Xnl93UM9HA&=}VYoX|TtU*j85NJbU#ExhvB1xL5rc$bO=3gqOQ)m=5p@gou);
zhu;qaG{`}jMseTWrp&-)uoLHq6GH2xXv@K90<q^v)VmV3NzFfL|H@t1TPKzp%p<yl
zW<7*TgdP98+(nn7G^sOIJ%69Bm)x@NScFr1HVZY6>mB{WRR0i9cXb!*MpYW)=`KRD
z=Sw<`^B*;D5^6?}QqBEKcSS;e0(kvzsviI~+`ei2#LHdCPs~=D2Blx?%u!A}+IYEZ
zESqQUG0FfqzjM=35II@rz;Mv3i<i6D-fOI?|08#Kl&Wo-xgJLz;^i)Z{0q73$iZkP
zZv`)RspS7FcM-021G&slR|5JzU&vh%s8yu@-5#wNB=CVbQxTHqLhkBjCE~obaC46C
zuiO=}$Mu2y1^NUpcNzUSqyU=Y<*r%0+|?s|0_+UGl)K`d9K~PCU2Gr3XzoBj_oz&9
zcC45#cjISwxxe1g`Z<K;Mg2o}0cBhOl37<T>8>8x>wKhWLP6q7xho^po#>f8fSq){
z5K(_AcOjr!Wp}jtl4WL7|9o5Gvei(#4x;98)V+|qBK=e~U{V^Yo0(csj;j9UTT{H6
zQRO!AeR65Wj6M$9`@p#l1`e7GcLQdvRYx;XjVpHD(t;X@6ZMI@a^1=IG5$rmPl*Mg
zHoA>$8bd~EIhX>(s``E;{wpFU7FE!a;j0v*I;2C4j8YjYW~ne7TgzamKpIU=UgeE~
zxzfl*M2g(tx`If(kh{((!<m^3hD~+jqj>OgR~!S!4P3g^4!d;l2Na&}+Ba5Bni2Jw
ziM7&DZ6VA;aT{2mvKUw_D^fV4kp7h#%wuT!7l?<{11eF1zZA7P*pTElc9|apjnTS^
zU{flKaPj4?pOuhI_VCQ=9^x<0G6-+p=I9n0>-}@nrdE*GE4<hBsRcO&@KH4SQF4@H
zxS0gh%yy^O_o4ZCM=!-(ntHkwt0s~g3*erpOxXu2no{b|M;6R!s`&#0l!!g*p1;h}
z6wN49V?!45fj+Fw3aws8VOc1_sp1ueP>JVi8Y_|21dbL+k)Z;Hu>u{;%p6f<DK*P0
z%X}0z67uB6<gq$kBlY~<uP<K;w>MQOg#y3m;54|7I19;gPZaE4S4RNc=o%Fq8-zfO
z*Bnt8L)p1|IuuXT=s0F`AFDOaZSY35Fxb=M<*r6!`rInAwyFU)k-;`{RU4$Q@xO9c
zR1VS1clnqlA%`V7K>i!0D!kl<TJ8N#u_;6+0=Os4G!nt2RIEk;gRv|=*K$SuBX@=O
z^J&mIxDIMnPhNYFK@p`nuTEv*!mPqdNw?y5@GLd6+hzUUh?oYnB^70XBrigU&c0A{
zLW+z%d$8rIGgkIm<r9N_w^m@Uc?@qK3n7E)xRMVcO)aX)v!`EGbV^KYNzSdRz+fhB
zl3Zdv##ZA;XH<AoIU0rQll}#K6<)Ly^Kv!CEyzK=BckuvqI*wP8=e!+Y1hqEe_#2X
z8|vN5Unh~jCd9UW;`J@J?FqN7CiPz@ZrJmeSe6<!8Fgtk_Z<fDT_yLu-HW5+Unp@r
z&$YMv^0!&dzLxk-sQ6)o_^;dIzX9%tF5Aa3HCxYWjuUFI>DveQYEDMnPhX0kB)A`w
zxho5}OD~J>s*0bki=UpjpLK5Up1Tvkv43W^&$7e`PsP?EqORC<uSI~^16N&^fj8TP
zNqjtDN0DSc5+oI9HM$6}H$w2JmlXeIy?-~UJW#2imhlJ(Es#*k=phaB0Q*Uh=GTJD
zv1C=XB$2h?LmZYASO;#XB~O%~cq>8qRe~z9mWt7nl(P=%Cqb?+NxkPmkHgY?qiNoF
zP$Xh0rfb39J*eDwz<!=2a7l(+J9OT4kmeo6SV`JcPm*j&y7C>WnjN-M4|eh$ibF|~
zBXzouJEW{T>?AuheiBMDk+k`qB&=R6{8Frgb)43c@I+6Z?K+0TI&QcZ4S78a<1P$X
z&x`Y<P4$9%cftMY!6x+#<z6D%5;|P5qQW{P<!H9DNUAadi4BC30YCz{$5W;*Sx!J-
z7RkmVEux?<btpy8(;yA?mOR`QC)tzW-;-o)pejQuwV?48UhcA9npFZNaio$DK&jN5
z{|M)$94XD+*g&-zAwA};SWb9F8K~Ustyt)-R3m-mjr5hs28Blrip>p5hYiZT(n@co
z@l9;i@<`QYX*EL`#6}ki(x@Kht&qB>CX83Mq>+Q(O7Fat^&8bp_En{2P>%ark9@RQ
z8_A=5lv91wKYAOKHt4DC>u&Ff8Te?HN?(IFUaQ$der?oZe5iXWqqnzzrDoq~qf4_!
z#z6YFL0IE;a%p8oZ#-Hh$G9iWzb7T{EvXC?(ePF>@Rp2~l{oa0BA1pl^b(tvE%fnF
zT7G4_Eqm+m)h(Q?9Z8ej|Bi8~$vJ2@IT*^_HJ7{n@zqU79H_uSE<y(HV#zthHaVrr
zIcGOH7s|PmH@VdKD%r_7nvn9nZVLC8yMKXk$w?<(vRym};wCaA3hKA;Y?nxb?b~p-
za-_SOFGUMlyqv&IyV=L^@OFEXtA1aSjbHe@>_fk1KV><uzibzq^zCT^pK_!J#Lsj4
zRbb*J+lBD;F5Kq~mJeNN_QA7VPR(I8V84xKG~~z@et5xl4arAbuw7k}ssF)tu_*)s
zn?3R`*e*|2KijIq@JqJK-P_;&FWbfD{~v6Zx-_2cQjo{9U5S6$uHdHRa@?ic1yxAr
zZ@o=k#_X_lLqwejCm#fANjE?Cf%{#$T?oYu#8sfTQp^8jyMi2B0{^mIEm)r5mLP9*
z;w9Ua|0W<HR$BZ&*)FVqkxBSt<>owcr994Ke2h9%yRB^F6;-VSu@=hw0oDl5cG)Fm
zG?Qc+wpEnMdHG$iUGD#~T{#~EZ1HT@q(rKCn{<U=7Grb4#;drMSC6*=FX8g^jmIHy
zVDbh!zFa-{lI@C(M3<Dyzxc~`<+Las9ap$3hg%<JQv)}hqv2y;%WGnp&<f4vK~8Xa
z5fPl<KW>-nan;8oF~lj}?W)#qm;U^Z+x0S5;YB$xAV2aAP=%Z4DCCmuiazwEbO%Ph
zX>a-(s9>&KAJo!R)jnv_+<YgKw_rwv&Pr{zM>Xp-1LTek?Raa_6u$jR8vU2;iX{Jd
z$#%`xN_;)}P);a07!b7A7W@`T8R<O+d96rr{Fm(t!n0kbK}9QpjraWrRxa5tg~PY8
zSMJBE7#II#yCRnHY?l+a9yo499nW?FV1-yx@`leVuWt{Y+5Tm_#sWUPIn4sLHsB8O
z@*}4iPvj_6Jp3-$u4Lg*5*$HtHm)ZN?{;<k>vm1HOs}+f!_NcT5wHHs?OMIEnJxE4
z-gv{zn2X+C6^q);>r=Er#tgi^f3_pW?=2M@xXFpLmshnD4ztS#Ci6G#?fu@{c(}j)
zd!PJ(lOia0Phr;&=YVIsoK}AEgC@o!zUKFFMTubF67y_dvR!>|&PH(xOm7aqtL=Ud
zBEhp=^KWqfVqD<FNb(!!OmaR)(AygEw1Q^;U|jNZ4a<B5b@yi!Jl6-Q@9Jd=TQ>cJ
zaXA7Ox)!vmJe30uHUmD|85OI?Gsp(gIbVOOpDXw90^=(EYFatNM~}O2R*lEFZUpW<
zW6HZToFyx4{ONTA#e>Jzrwnd3t=?;Gjl&CRhObq_dv@2S3R)iwVgALqnB{#%a<F%X
z9|@{)*tB@vd;dt>{ou^f(_t)?G(~kbcjs2+hvnH|A6lLEwg%_v6v1^e)vxUVhX;SY
z7QUxbI%MGVyEA)VDD=jihgsK1T=9Wf?GTQ~K+M{dxq9{odquyEIrozMvdA|7@@d5+
z3_$hu$<xiZg{k7V1VfewuRD;Ob3P4KXw@nWJxX&f3~?aqk5eQFhW3DY`&Px4L}u4s
z<zLSMy(#0<g++U%gfHeScg@tQm#I?V!>Q8C1pRc$R>m4QnyZr-b>_s9y8g#*V;C}a
zM^N3s9or;honrsS9R;pOJTAjDev7HVI=+td;tRx!E%^fR$`Ps4_-lBHz@qp`WO?%j
zDdm@3e)27f$$S{%O!MUH;3vvk)=(}F)-Y7v{zz>^NyN@?NOiFJaa6<Jrg2;wl4(4#
z5bTlxbS!A4`-lj7K53+eqkCwIa^Iz!q?5ksQ*P$wqIC^yC<!q4l9S>y$T?6ndgh#D
zwD{O6B$7Xlab#@JBJ5`|JV}erHA{pZ+eZ8Kj!&RCk&a1JG?}+;JFI50kv-PhT^VF<
zQ!w&vW7fyII^~<^_bFjprm6lKTR+j@WlEfnB0^l(W4vy9_QCJR&8?xsf8^&6!3-02
zQOQA9iCn_SwHSCkM9tu~>|`-et7oqV(zPshVsq|0?7$gAMFRNKbq>}X-#Ig-=ibX_
zCVQ5q6Y)iW7CtuSFE49`%%i!D;n1gNs(Tzb!s&jyr3$j4qBWwNT9*fW(K?YAY1Z=O
z<bG}6T!L#ud#A*&s++%RHXF)Am-<$eT)(=tblX}BcYg1Lx>NohF!ZPi6Iphii@21#
zzTkPvzjBv7^Zz1ug{v@Lk$c0J_WqCJx1>q=l}owHp)|B<xoqdlKXO-;<)z#u{GQ-T
zA+DJDg6;~`9=5WmY?2uDT3$WCzImcA6OFFn+$a9kTC){I+0UtV`m1tvu4>=j26u8W
z>VEAUJIJp_w0H1JC~RMywfNnk>i$z;Fo12I@<cu!=gEtn?)|*))SD`OHIn}0NZb(9
zA~6cfP3xI}{~t})CXp7&T)u}N10ngs3VI$2ITZ6Ab@PTT1N>MmV+X++$d*+&=$s%{
zs*gHu`4|qJa01Hl^g(!!)Xkg0>gw01sq}q@V;P+XuO2k32@sHmS`spnnC`p^dg#f2
zYto#lPHI3(l_L3y@zS4`MJ?$8;}pC71onlvL7MRgw{I>iF}Evd1Ig0K96I1Q4rW;@
z1mK!r<m`9Jdzt;MvwDzo0<$5ZX(D}W1Y>uFeO(TrlKxl;to#m`iW#6DQ?VP9#x+QL
zE2lSkxd&`vl*l`}8^J-*%bB-|+$lgqu8Ukn-Sp^{9fFZxF?b6(2J?ywUk6hOVAA@X
zqo>{xlIzeAG5EBb$pzKF&-dBOS10AS01xYUdl5XgvMj$pWO>ak(B#RYYdI(RV7O12
z$>Wn3jxV-I$BN#07XYtlso`4bqqe+V)aq$uN3TOt*T{I;_O;(Ll?Y2im)I?G76nb5
zqi*~h%dC-h7C8)$dT7%NZkmnbOfphTcybp~W~aj%#ZM{w7{y?ZAyOB?NkXjbcAi10
z)lnn~<usb**2Zb-N*GUC0hxy;hEv(5l`c14r07){M~|3Rjf7W)KGd_PoUmwjF>9m}
z5?5NyLVoPdd$|s&c8pxNDnyypbWZ7bJ{C6Jw7Su;xFbt@b=`uS+9Z<+o;~3In6(WZ
ztz~hI)B;RQgYrv^*}U_#wMau)`YUAYrB`DCnvGv8F+I3|G&7N1pBG?H<TlyEIP$rd
z{aVShAfI9mZdkmo!zuJW<yN(-F@4f!3%XCU8f3$|FTJX>B7V~RXl08N)2M5+*^uIG
z|N7X?up{VOag=%6(ht(lK4Te@ZBv1_M8*BBOTX<uZ`PG}7B`s-n!+7jO9wIwZy5|p
zz8LQ2;iMY3)88Gp3v0Z_E1?O{A~ATRw|Y<P46~^}aos+SjqyzojE-&$7EQtd5>X_T
z3~)!>rcI=T$s6w^NKP)&6t-|l4h)AqQeI^3Rp?hC7MUwUQz>E}YT4OOB!ryZE?e~<
zkg=`sO-@>77i4Y?rKpX)Q$hl7af7$e?BxvG+><V3e(zu#FTmBTD+c7}+{Ww`tl2m!
zdUI1;3u-WE(OFt7aC)w%M<|k)7QuUZ%+EsRW2CC#r0)1-6wRSmN*>~*v8^!?;oJE1
zPp}-<&GlCIzI$c#SJsf`EEBMU{hlbA^_pa*eEBcl`cctD@{Ty3_pP6PzwCcUBhS<w
zP5((-Ce$-+&Q^m%w6%aa=bNje+E<F3Oj(Zn^;Gw3BH@QE2V#OVEBfW@+JbQ_i1oxr
z?)myR76<rSO@iJ0p9akW1m(SEUkm!zSkL`>DgRK`)I0)9DpITEQ#$$hNx*jgcZuCY
z1VJcm_#=}~4YtEs1?CHW{sw{lnX&K~36Qmg2Ag=7j);>4BR)+1mAX~?>K`bde&Z}e
zm<M08?NSzyyQtZc)SN-_HQTALr*i4n5E?{^{(1wmR}RP6zf_kh!`Hxr)9|=0pR!Z^
z^~&dM<27@GFAUcxQw6lge-I?rds(fTx+_f=r~Iyoyt#>UkZ-?Xa%C(|pN+Q#^evy0
zF*?AMiB?zPKm+w8&0#Q_Q!snziqkMudbVeVWE~*BwPPGMwm^60Kgf4?XD^@l<~kgp
z@AKX0aI9*)^J$oJhmm36N4U-Y7<=rxd8&Br%^PdA?teCKK~BGZH-GIn*sgWp`HZ7e
zky@)r-Sf=?B-p=%`(kyXu?4wqfuwymLBdmDMC^7HN&TQAO1<n>3<6!q8a~!@xYXkx
zo3n7Vx7ss06csIVrECweg80R(Suy+OisAY81^|P@_Tk8|x0!T?2(SdyMtyXc$(U65
z=XcLqTsg}gRJc9I+e{FqMJ&%>xeK|Bm%DHmbQj^-f6`qn+#qeE<-c^-z1lx4qnC7-
zy^}&58)C&%!M=NUd+%VBFn^4+5K2~RL{^S*i82I;-sVst{>mf9=0Q~HzeX=X2)~fK
zim?}Rmp#cpa#t}dCY<C?IK_J`@eK^?bBNe%4Gb@L+2G}_;?i0)>_YCE-)2IQwkMNT
zj!|<`)4+{s_$5Cn%#%r%P@}H`+<7S&k|GlL;i&o34CJzH5v9&T4ik#`1sBL?gmbwT
zrZLW`GtTMNRo;b!e2;*zZy$YvT{{bBrYVLUg;Pa5pspm{7cgedPGim=XMXd63@2{P
zO=dt!=l%&#cZmrn;^{8L4)<TWO9M}Lb@_Lu#^dQOe<%YpfUSRr*j<uw`Zi-2_6RR`
z`Se3nggN5$=vWq+0tA^0)40edxF9sJsxg|Ub=<X*Kwggvxoh7w@IvmghyRtkG^jY!
z?-ITHD|gMu{UdiF;dr@gah&Q$2}d)?Jmz1yt3W4rm5cfhj7!v+i#A;#aY7(<m%20!
z#(pVx5xXC8>64zMMM${9JJMh;CV>1X_MB+CpS5Baa#y$rFZTx)yxe7<O|#8$t$UA&
zT5##Q*h;!s!!^NtqHFKCDR6vVf~*^iX<D2oU81XtL>F!s`p-SQ+l7|INx>tEB{^xB
zS?k0uFfLkY<~6bVKP*f7Y3&yolDZ_t(>R+z@A8N^Te|3+)Y)x41UVf9q)p@;AIXV&
zOW%L$JjBh(;}vcDhz-*P4s75}>i+qYo5hw^@lJzWHXh@8#N}>sEh`olw{UKUdL@K`
z-R%~nP2&B_b}g1L<v|o5J(7A%d*!3a6&SVBR9}42U$%>oZ;?<TmqhWk0p4koe!a{;
z-9y(h4}ALwmg#*3LWiXF`95QEH3QFfh3C%I^QIf3(mooDfuc=&43zX3gi`K0_0ZO)
zBgDrMIQmHqLpsgz1musX3%9GHnzv1Yti@X+8t--?q~!m@?Lz#ddj{si+Dm9ps+gGS
zW@qSbIBS06;Shn*Rn+qebc4MbRgPh_?83ahLy!|s4p*0B+X(iS`6Y~uZocW&>5Qw%
zOS<2d)o%7s5jU#f*{(iU852C)1^Y2D$$K)dFfMcTYlabdrtWt-gaS+(&vw1=<Yikh
z7~f}4A0@f*pKKR_)(w;}(QjG(NhAF!)BCi>ICW##VwWAB?LwF;k3bePc+baq@obl!
ztQpB~)1WDH<A<=2f7z~+OSa2th_hr8g8MJGizktJpbVxFVI}{LRVUU=5Fq3?CGU2Z
z40Xe%24fm_<L0z1%;dL-%YU$4c0!!*$`bx3+lAQ6tB0M@+Yx15vR&PVqpvIv?8Wbn
z*z-!<{2~kc%XTFIp;B3-2aA_%S2zC!+tqdZfwV;skaUjlo(ey06rSxu<gq=Xl^W*E
znBR7(u=6x?ykNUvGN&foc(#l0fOmI+<3@>X^1Ml!*`ko#UCQ)JwyQ{CfQtanb{*Wl
zWV?#^l@{)k*tu*>+<d<ne^!)>XS*hreei4-i|>scPe=0+PTcyZZM@rsh-Y-#=N6-J
zX_q!M0X$2xb0*1tTXx`DSm#nBcmGY({ojlC2?_27^Z;Lca%D9a``9G%sp-K5+tvN{
zXK`2A3S$4jja&}+2hVoRBZgo$f{XNk8=iQ!%ht`?p*VKV-rH*$BDca}YyROHH-|#8
z#UEJU1=|JlgrSs6(R%LFy-eBOxjUY9zTyK2uh(YY`S$#6#a{A<fvFST!vLQv{Qt0B
zZOeRhh`<}>kGz~KR{yeH1Rj-)@B%#B)$MGXT_I&i3i#}N!FCat{O@d+Llbv8#P?5g
z;Alf|yi^blo_+r{qpQ3x8-abW`sZMCUwMDZn1BaxyxUcQce@adOqXug*#}NHg;+e>
zb^b5g<(qK_&vw;Ha~~~C%Y2T!`!>+hf=1gvs6E@O8_#yx@r!l2bbm@n+zoc-ju};W
zFUL($`IqgQM~JO395f_<KSFdYI6d>;ML4s6zGS-!6u5sb7+mvC$o5D|q)Gf85v1>*
zDC@_VSM1fVkVajfBy7O(a^82l*aFXX1>)H*G(zEvziO*x={!$hhDF{hjx#0<ks@~o
zp}Eu+hPpMK+AA%jB#nQXU&!yiA3BH>;q89RCEnWOYVX^RXS=v&a6&8IOt*9MTVZF2
z(5L^pU1vuO086-sbLM?!vG`n<YO^3_%fz5BUT^+oy99Cz3deK$b4$jUlI0h#DUUxP
zqKR4wVD@h1_x%!tXS=!%?mKcl8D=cXt$RYUNl(XEIGO{mrOrCFyz{)J__0w@Ktxe9
zp6#*=wzn^qZ)4_cYaw`;(A#Z%Xf%^RTN<QYdX<GxIgnq~>ai>$xEjxP6_+_%F&kSo
z;n}X+fnxXK#gp4S@3B<eAAL4RSRS-^{~xw%{!Un1C9iP>V-@GBY2_$NNKoWOespE?
z$p(iXzyMwSh2=sIo|&m0w119gyKq~9{EaNtk0zqu&eVuTAlr(b;;c{~0&A$ZJbM+A
z#GBLTzq-6`c^QJLfdrAY2iAS=rUnOzIz9K0RYp<d*MF;aAwf6lD-(##KcjAI)C~d*
zEZ~2E!2J?Jd^v-Cyq-~*^xag$9l-76qF25_C`5ZxY><n)awS{0Z+H-&*azp#_F7zS
zOKE-qzCg=vW)aaK7uV3ni)wlLwcRkY?U7J!a}aOIq4oD3<?crvoF(mVzP=`v?GPNH
z<qmv(hx>TmUk+N=$zJmM``0)5GM$xctSP>4Ze7Y<Q9B$bhaz%~UCbqKaMnG>GF_F!
z)B~s8vfSJ?GE7gJMSL5zaW{V+;pwg+s|I**j|m%6Sf!WLG%J}P;zy7EQn+gTCEdkx
z&{u5TAJk!LS&*Go+;54OyNc^vT;#S0dsr43R%u&|X9r7z6~kxKhvs!+3*ZOc$)3Dq
zPI$Sis2MMJN!U~t+l-8=NLQ*P+7h1B2J^-db~k&7;pHw+9rf12El=O(_iXP^*&duK
zneBwDER;|Nhu7v-${lrM3JV7R%#PEVzE8`#kh?I$?}cyIGIM_vzx}Z|Ym}3HGG1yT
zB#wPGNOazwL;O!>mT#<J$&@6@nR9Upa{N*K+b43b$to$*`4WbAX)uv*oU=&gnBX|h
z+aHy`!4kf~aF~$W_y2q<{8mgDV!p%G`j#8YRV>V0yv!8AIyrxa&VN{t9TgGI47PWQ
z@e7!Pi4KAsvYG>G?AbrRE*;RA+eR{EWwMRE_FoFQ$HF~Js$pF<W&fCchWts@(<@_t
zU@Sh?d^#{5Lx9LfNDH$#qgOFYB#dl!o*~1Ioh~PQ4Ix_7P0<(*6FQ2JKH|`Lvit}3
z!*Xz&Y8H}1NV(`8&Z_W3+xBB-(PGuO9q`~2D080DcC}Jsx_spV?~<_;<39g-CErT_
z67QmU2Qkw9!rDV=HV4USiC1>|!Hmbd?4t4X7#{B`TUmeo1omW(^I+#5Gs<yPb~X0N
z7Ot>%wS15^2Hmy5{U3T)S2<qqvbof|9Ga$fj$rkj%fkz)ufK3|apslU^<G1=I@-qV
zF>RQiW8<ImSRHm~`)qA+{3ge4?Q{ay0C>EstruAvCd|h0CgAx_hKc2`ueQ6l0uIAA
zU>A5-`1=Ar4x?N(zgq{xyCG}lHil}yOF3DnL(OY!rtV(iT~T%ThI?LBYouGop>uJ5
zP(NiKXLer_)4{?tOEI++Ca;uh>BAfI`moczto<LI<4+55k3D}A_7rx7<1sFkIEmt(
zXbM&(pNg9A>fu;Ep=FH^B?HN9%2Kn<hIX|YXB2bfYiV{k)kgx52m?~-XYX>^6q4Hi
z?=UXe=aZGDk3JQ|%T|5LSZsMO@-ZT+=Ot(%8pHUAIj`FFE1wKN{^e||&&CDDC4RFx
z_*CkJrEKkdcN96RYLY_TVt-P$?Qe3$dTp(s+7a4(j2E&|igq}iLh0$;c$t2F48Epk
z-IZ+J9!ja)wE3m+zV(kHrDnIVt*s2>@(-My%JU-@-7BfqToMoVr*@wX>xqV!H9E!f
zVx^Ej-u?c4&fZ~`F9(uUJpQ#Eu)jvJZ6DCA+<A7q@7K_jtoG*o&)Mmz`yY!Cz`Yv-
z<l=0eQEIzUI0R5oxB~ux%<qV%$AiZSsRuq$QIC)sp?Ji8?_5K{KAMOlr%2&dl!TF}
z_@vjR<YgaoB7>K_fLlX%QdOnO@Q~M;wnLg0N4!IN1AA{cnVM>4+PyE)T*+#A6y?zf
z`nj|sHJ&c`HL#06{UXB8Va+i5Tt^V2DnjNE%?Bv%qRa+_tYJ7>5yOs!p%KI&l4=26
zr{Wln1g8>(S3QK#FjW^Q+>fH{8v=>pp3TC%TT4+}Z$zS)?~?gAKO553!{h^hcX3d5
z&em0`3HZzysaQ+`onN+XDH#{J3y`_i_E71&+PixgfooFJ@rIYYnb5z6R~K%iQenum
zv^auWPrv%rxx|KRzWaY6UY|$w?yEN*6}!GZ*nLh$Vnp}W{muC~IaWd5qiE!H@Q8XZ
zxj+}NTJ3WqG=fiDr$PG#dCe}WC)}VF5CG9usf!>L-*g2Fy9yan@n~!s_IsP{V^{~6
z47}f~HuWOO2)EyPkE(7n7QI&;fsZ5q%vL}h!R!y9<D`m@X%sD9@c2xbtuU;1s=2>^
zIBjc!za2ME6`dDM!zBC8Sj#@z!`ym9={M`OVQM1n^1V8bd3yf6-*?*h;_cZ8yuHx{
zO#J1y=oUb$rJJC3uJD2F%*y{q)~zSYaM@SDfE5co-?dV*gnRExmTH$0xc+=}K!C(I
zl}cIr)F;h&v&sCX&ee>X4?)|V<_|@>n;|%iRUc=V`xe`*#OgL4<9cm0NFk!K`w71M
z<@b#Gi0=m@8P1TS#nVs<I@#9FkP|>FN#V)X_ZJ<9sg0<xKL_7a!_H5(N5lTFF)k#L
z>LRtfPWLhNu=Cdsfk?JlW92?*#a_He6pu(Tso_5umuoTkE%0BA>qRl8`vu135v#Ik
zf7O(W_`^ewpg@)q>a~wlH_%Y9folnEA-G>au8vQsqJ+LCu3u!mi0}Gl3F8|9O(7T0
zB#UJnH`8d`0DnSSlB>)emhY?mvh`_6Zc(M|<wN0$AL>&4HsMf27a?>Kk!qQQys9-n
zs0z4_iRvqXDWZqu6Oa_q{@<uyISSj{^m-&)6)!zOIAWCGl~Ed{IfgQ!z5d)QvpmB<
z$ei@8QPYHYP10Qv$2A7S8JetTeOFyna~ce{q%vOn&^e)V0rphV?ETAS(h#W{N4-bp
zNWGs@nqS_{PVVN_@85N48h-CHpDx};!7mU*n&%?4m-pq2cm9RqJ712y#~VpcRmzVI
za^Lq+n0}m6nMIHG!5W@4b?^%*a*=pHyOTJlQh`D$UTd!SSU~*aEuz)Zc-W?~$Y%1r
z7Vg)Var8A4mp}VDJQ-tgGe{Q>AFw*yiu?Mjkc`sg1j9p`k*hIQyG06={OaGB4U%Gf
zo*<J~jIQVzVm|rEOY`2<x)Z3;&>zL*xI~YCu1|H!-pDj0dVjU1(&SsPZ23cz_h#l_
zZY1($J{!mwwag7LEn}Ff^n5SG|C^XrAEeIJhtd3X&`oan4ybnzJ*wh{Bp<w~&Jfg4
zH8vOcp)KJR-<9OM7Jky7>}@~2xPQaNT2a~jrJmVKY~N2Oq_x%UC!gxn9SW9|7Gpdx
zk(}Kvu_<ReDfeyQK5C1xG-t?^`yJ|Z@1R3Zdb(x?eVa0>Zd|=*-fH>ox>>{ByX#(S
zZ8+17m`{ygsz(hzl1)xV$hR_sZtAhv$BZ5=F$A&1@pceC6>G6~Z}tG{ZKcJTV5aX`
zv%9-IQ65>H@oCGdb_<?czx8InxwVY`UPL_ED9N^8Py<~1^m-448Qpu%a=U?;)4urE
zWIUYqN7$&1-#3X38H%6N)dmxY=rPJOwHH3z@Zx353tzM--JjiwuP$fMpM~@OFK|~>
z;r{}6-N}0}IhamZn{>+n->PDYmpAiFnI5^zkytyx0h&GjT<`;S33o;4+1ID!B4gOF
zQwbt5Y%6(dpWgxRNeaAC;S^8(((c5!pBtHbuLS3Nc+V}yyGXf(N{Oks1<*#Ks7kqR
z6gxu^xVrZ=p5&eU=~`9XGsAn<A@dx{EEUfWK9W41EVnK^$sL$)G%!$sh7u^lx;-N6
zQj=XBroT{Zcnm2$`R1B93!FjEy{Z=eQ?d2fy<GM7?~<<__XM8KOsLV6R97dvMd0Bs
zVm#axnn?e3y%lx=cWvR}uGy~;>;>G_W&JPQwS|Yf%1&omJ{&ZeUqQJYI?c8+sP{6a
zcm}^b#iL7y1~SK(6k0so<?pL|33m}zUBX>ER+a)PON(>#UwO`X9xMefGT<JyI#c;<
zc=j+QgGpeYACs$TMBu))T+!slbh)|9M9@b5jvadF{V;s~2G`zdgib*ckuClv9w{E=
z;C5b7m>=>B&wjjaA0tx3_AuGo5%a&Bhge%KvgpN;D3&0SOlIXap2IqrrKpo$bJ%b#
zcLhl#b&=+zzy6g`)A2)mRGz1!7t)I9&vb`j1Taf<`@4f}>h{F8vprxKEZBwOdz{H?
zHlqcx7z1dLQaY-5{X9qIXBgyco*ZZR<~LALrN%HU%AO_k=$+~b2k8~;?Gs_o5GRW7
z7GW=dMdx-}+!0qv_{sYYd%x?b*(yJB$qvJhU4wQ~w*y2TsgwSJYI5%)!SKFFrh5XU
ziafVNio!$IvvAa*1c3&Qq$Lv2<>^o=YGPxfKq(}JE&o+<B<Hr#b>i@F4oT|=b&#<E
zA6jb27_rH&r0Y4CYr5ov(PyEQ-H<U~drASN?UjJTd17NUsHmChCK~jj)-wxDWHC=X
z<p{Fi3awf3JhvnEtTX?|?3%aU)g<W{L`$_mFU&6Vh1nUBsse4a*rqaT{(5mlT9
zInl(MT@IuRF_0aqby=vEgtzsD+2xKmyH0<Sz^E_GF78XSOGhgZZ+3Ocak832x3Z!_
zF3c`>yxDd7(*bXG1u8gPm|aGG`FOJn?PuYya)`C(9fGVfavq{_phJR0a2ka16CUky
zIwMFd_lSKq1a0k#2413F0-l#>7lBRde8{!GW*3GUZ+5w^Lf#)Gy)sFvn~s~zVZFNw
zJ?%<JU!Z)U4Q0)N{`?GWhQ{Nj8Qwv|e=|^xX8Gx1okI?T@n)CbPm&}7&J+tM;b(?i
zMC`jR*NrZ>3$qK2nYuK)rat+1Fa;l@U0IA>2ee{oDxsYU7iO2}Q;&blE`;^JW|te@
z?D8KZ!^uHKkJG;~5)ClKOBqA*|C(J!GI+B~IiBds8YDOyJZ+?$Ruua`%`T4!!3(ns
zN9=fsb`{{!F0M>G+U2A`3G&SR2kk;*cvqo#w9DY<rP&4b`)hWY%0ZGHiGTeyyX=Ss
z?-GXz(!>Vj1gTSnV$%m|sj|?ZwoC}9_2Fw0ze0P8C=W6V4{Mf%6ri!YDDnn?nsfk5
zr3H-y)TM?>`e^$3oMU|S`JvnMK1M4Lyj->M=#d)?1MH@l<;SyKZaZk3WNZi#bsEcX
z!TT@NY?Tjnprk^T!FpU6Eexbn$15b3NC$IE3+q*mO*|ia{Cya5uLxAn^~4%Uq6eku
z`vK9JcUZOqiTrrdM-Q>C0LiaG45xE_y2!PlIASey<QWsKA0tJUhulAI*F5C9E>$0t
zW*Tz~7+yq{2hqZ22X-Yx!qW@Tpy^7`u^(Ah5eURWRBr?+M_;!xj{+osL{Cb(c!O@*
zf#$|ME#^y#5nw?UqQn-eax`dNvoIb5_T_t`XGf}q--GU@T$o)(Sy@H46FCmXT)v?3
zypSDVPkFzGetrRtQNb&IXny|=LFPAt(05~xx)D^ChY5QtBrvee)7652=jG&tkDoCT
z4IM`xd<yxzmbg%Bi^uq8%nKuxpz&=~znwwX4*adDNwp9pAq=EC^AI1jUuIw>keX<+
z0%U=<)q@tD)jAt<-Ifl=J&&=9Ikf|obdlqUt~4ld#~4jLKeSpXKdrVHt4Z#>3LUTm
z(coYFEy@m}CH9w3k<ff@wL+X*1X>b+j<%t%uR{v3iN;W}4f^;sLA-NSUEu7vEck+o
zI&b3+sJ_`enILdu3d~IyZsSs9T^vxr7`81GSjHH*gARPIokB3o;5rkc5=b_KrQ#?D
zVW}aZMW8Ru1wle}wD)b6n6o=D<Ruu09+Y&uHu{U=lb_EkBKs+poTK360ZlaZ7BKRM
z&oa~6vX@rsi?x&463WuL$eRbFEoz@jNrnOJ<@UIqew?=G^N4&^TGd75ey^c;;BE{A
zSq6Yr*B4bjE62f?EUteF^!L*)oMNeY;1UZ!lF(IvzCBMNB7Av{NEizwGv<Qc^ms{`
z_R>r{WuV`>V9fSh0%9TIeshFTMu2>{Ir#kwWRwvyE+5ii6!MxG0~9QH#z+&V2d$8Y
zQtQ`cZxnP6HP<UX5Bv<tiy_iyf`kawr|Q*ff^YHPZ?i{(kZtu+)D*CVT0mMEmZ6=R
z%-tR#j)lcVvr;H-K$O2WNY+7gYN@8}K#q4Zj>lX>ev-K6G~&lG!(SU;Kc{A8X%EzS
z#dZ%A^dlPE?_-ruYIB<SNw1Jvpc+S4sU83Lj7!6rwP+iY*D==Q&e}{N*<5PbdXs>r
zu>oT0jmr()U_b}m)w2#e%nm!94(lR9Cn?va=tFx}A&uy}296Xx&aF9B-5nP0{Q2(2
zTv5kRDvKge^BB<r!oQ%%)>y)#BH_iCww^sM@>9ijtGXz`5o=Z@Z+VIU0Fqn_4SGWl
z5fm!wE^1g->>wE_F7S|BCP=tR5a@<YcN$X_OCX{tuD;hrnn6%Cph?P_R;GnW4J2i}
z*Af+>_XIHuvA$1yGk-v53}R2gm?hDtMd0_;+)-<+`W#czyaG{h8D#s}6c+r3T(X&!
zg%LXr_F$};u>(1wiHC>tem|#2-;Y$Nh*VjP+$4^I88mZ<!~>Zbn;EI(nTcZbNZ|1}
zVrXJH>*mNWKbATJ7E9RMx(<3~r-z_%NQ=tt<60WVb?R3l?|Oq7+3;W&L1M>?=8kL#
z{wV60ATbaz92%YgDo$8nV#b4AwQ=w9U>EBF6%3q6bu#kfU1(p@hl+6ewHJ(l#lBLf
zTP58e_FUhxdQuLW4UyWD4rYav(zXm_^^q^Q5AY5DbR8q9hVInnJ*cB1yehrX6=Ycl
zAx|FrZ;b1|F|PjyF|LCDH!v=@?ZcGq<Coi~AGZH&ZR4o0gyLABA(qG;OOlEut-+Fy
zVkzAx{~PSuibc4^y|Rt}Z?NnClVI1};`+D4^@X3C3&)#FYg<2#w^!G(D}S&nzjoJ8
zcQ<!_Z=D_N?j7zP9REH&{%^4B|8HQI%kMjBD(i81E0y`b5s~762h<TP08iW=3PQ66
z<dTOE1B)u@$DutE-2F5tDDf+p9i%0pOc!j%qhZLJ=c6g~6sk*Gt%hj~r+hwp`xCGV
z(7G3q+&N^lQ4L@4?h9u;CUe#4q0z^P6S$1WWXL2nx;B7^ElF)oCIMpdou9w_>P}$}
zPOFCTSVILLfbd?!5q<&CSfU3UmWTnBd=SEPmFlu)8a;>b;GP&HC?qu!zEs0D+Psy(
zD5zj+sv0{+5cIcR#8<9MTpwU>gM#Y%w3-Qr>vyT>hH3%F^*!WA^FUI;Sy2686OjE%
zo!Uu~O#|XH0w6Y&yd{j0La|O%N_BG7HK@%xRFSFz#(~2^b&a?ku^av-1`yTB5fgpU
z`J+-Qg~|2O6q(KzxRF|?4m?%7?sF3MXCR*QS|-2byd+<=s{NlhueN_UulWyn&TIY^
z=ors=y=YHq-zKol4@6g$s@i=7kg@_O!v&-<3ZRHn6?D~-G!MGYjuo(b-e{Ys=AzC$
zPj<9P%~gjZYC)CGgPC+J_A5TFH7@La7cv_c2%(T*0NQAlD-3qEW7Y!ul)=AHSb&Z~
zpAS(bQBlSYC*3NL^$Ivb>AV5(nGj5qgeCdqL_mc<4E1YYya}EuN|}U>T8JAB)T5xt
z@S_CcQ4g3r4k3V|$rA_1koTO+!~v)PdYmH!-zBUxu7t}7AVkMF4s)I+O}_5pH1H`Q
zDLja<?|Vt~Q@!xy^PotWLUGcfK!(gDvRw|X&Q8E>wGo&32I@peLw-hfWfmqxkgmsZ
zf*BzAZQpf62guoJ(J#%SGu*0xL}+k<S6>Je1<QgWL20*$qE{ioeT!5B()J&n4#k<*
z;ePEv%yQO4<(a2roT3S4Tv<GnxA5dr*i5dVF)5eChZ=`-C@)V`i-_SIp$l=^07nud
zAi%ZG*q9<*HA7Hih8e|`<HgC8-mLoSIP$@$b>W+{9Zs2(NZXms(w?zJHNE51+v_=w
zyob)XtWQK>BASWl8narGaGUFhFcYu<$?X@=7xTr!{xM2c1Qjc}&=4Vt?hmVkMdkyw
zrRPT)V7KYETj_#U<`hWLVEQXr*BVRu`#v2xO&P^$$@uPi-J*vT$M|^y5wAX%L}4x7
z=b`qQJJ*X(ZC4;tnGMM#S5U>1%n@O0bOi(v+MG)$p^k428OO`z7Skoq#7`pgU;>3K
zbLFGqBBop{WmCid=wE6f_L~xV?Y})u^J_DT5$E3R<wQu%fMka5pK!>n*J6Hb?ZV#@
zDk&P`OKAvbv~9YHN!!TCiTw3%(wk@lJAO<tTF+YkNfMm?untszf2n_^-o;(;UxCl*
zcgY|&&nG#(>h0usmsM$w;9&#oRbH3;mz^UE-I&6+oi6C+_9FsR_|*&kt9m2w510J~
z|Mj_Bk1OQ&;H@jqmAmV`%g!-c+kna520(>A9Yu}$AURj?iyk9C%t!K*@o(+vSzXbn
z@SW#iL$Z73oYrg%Xu2Eo+Y@Lnf<QveH2I`JX2a%IlU}6xbP;0)lCzULd`Bd1_D36&
z$~rm<MzfL%2CjDOR%oy${KSOPIa!;4jG$ypCGs&{jCCe-fnnBm2M2J!$Omv`XGDZl
znOI;yc{ls{KEUQR148Q_eVDFYbUaajMb33%O<lVeLML}{^mO!I<xK+RX~bLa)EVOV
z&NTp{9;*r8L)JIAU{4us(tDZBwvoD6{Vm?Ze$0mt94XicHV~5X#fdG|ALDp=p-PI4
zUhtKQ{)VoH%d~fop4Qm<V&-VdTu9PLYKWy=B3rCrM_`BKMAD6j$u_QLvEQi8vQ)cX
zk%^(7DJ*1~MerdYjrLfCLRa_Z+G8>P-KRwvh_{bK`A)x@yR4#9YSpf~c9U8WM2b%q
z6aOTNGgBMafIRydb^ogd#|EIeGug+8(6XETF7ydH!id}ztkVAATXPR%XGSQnf@l}(
z7_MVPZcYj=q8M!%$ghuP@Sk0h8u}Kwg&@mUm04iL8McmuaeI+`v;QHH+Iro}wkZ4U
z*-r(M1eKWXy(g!^O!@Cx$6~MTm$3d>)iG?F$o{bZO!?26QEHo=-jB3UOdz*82`jug
z6k28Ouwj$k_L;wt?7Jdtm5DUMl2R&ZgD=XqSnem<AVk_wkEab#a{Bp@sxXu-fo`<1
zRm&m@D){D4Gr%~OPvR7C_3RzjwUW3+=ItZPy+6B~-M`3#iy_xvxF--odfEZS-y%+c
ztae=8)J;F4fZa<(IBpdce3o18bSZabk7SLMMOI8!U<;Tg^0}+%+lCS;r;Xn17Wwm3
zMyGItC7C$vU{Dl&1)M>gt0AgoT*<-y{B$m!9fy7~W=+||1r-%24*o?SF@=mDyXBg`
z_#(ekoHznhrt?@yMkmth#dnJ;X<5t|cNagj$4~bGMoCZuD2`Fu*bDnLD3OU!zC|0n
zd0XU)5pn1=a4S+}%AC{)5X#-cKI%atnl8?gf!f-m*rk;W-8W$<qw<G``8TRXO+)I6
zh(!T{4<;iFONn;xBDYM?=UkReD3PXg@qu13)m81L2@xD#AomZa+`9(v2ScWA;wiA|
zNJ02f^aTaxAzG~t5ggLOQ()?UDKHF5ebV$+hML@w<^=`T6ZyU*#;+^Jm`*fDGfGP!
zSm@rZPAT2sp_rx!l^*VBO`J~jKGs%yEY=ULErW<}BaX=%V*4`&5P*V5_cdAe0c8lF
zfSthw1O^oqMI_)MFsjd7599Rl5LjjD6``NxEEx$^mk?MdciiTL5{ec;^n+&~?|`8b
zo>!1I0fdtULQLc2+b$ijp<Z++6r_lGn17T!v_L+p4s0nwI_v^|ltLc*f->rpr-34!
zSbnD6t1g4rqSKYeBVgZJQZlZSi!P!k1fW<6B)_lO+f~)FqLjIQotj0+xCOMwQ6wBl
z8rFk4m!P;l0r&w-VQXbel7X^lm=i5LtTBVmt(tYpL3!fS865(M>(UvE{Q{@cWGdNU
zmX8#0tzJ;ybj5$cE|g-1#u^`RSMxqSR~DSBcK6Cu#sh+M)Y2a6le(%V6W1Hl468~`
z?EoqUZPhU@E^9m!0^%Ao%7kG^RwOc4(3XVPNmuN+tQE7j3At80vi)<j16#9$zhs97
zWM^_Ivg&3>1#tKtXUFB{Bm`tPKFW+f&RML>NmtAb%q8Im<>nl-V~Vm?2q>PAQuqy1
z&LVQtNhu2z^ZcB1oilS^RI>XD-a<n2{aT6c=;rxXl7@aEu8Rk>#AgT0->YUW7~jc*
z6=jz==lg$=h|>kV&duKP0Hp{POboO2#b<v<<QI8le<vXBvLmvV(71~wH^Yq)&j(~z
z7Lk4@pb#RW`0PPdSxclbMjS9)5VV%HBK!C#mu)IOyV3)+8$k6LflPve9ze6iJ-{Sn
zlmeK%yR~HBrh%DVlssMFI)ZF}-NGP6q(F8dTOKQYAl2^E><8FFLKgBB53n^fi!YBv
zyQqjFFnc5*TR8pk-j{-a)=2ie(mu~@SY9?fFq<$iTVTD!Hn)VwBm1rqvBb<1L>`Il
zE+wN&=?av53#*_M__V98(EqrUz^Z^huY}x+T!4V=`<O(LhpJyIfG>e^f*|jL0)svc
z5ER*rc<MXCY89A0fTzH)CVs<UK{5g1uG}&rVm&+sR&?`%0>e!JkVd8c&R6LD%QIY9
z`|uVRCWnmdX+Ume;4$SByao0@n7iw*rUU-*`|oYQ27}Qsq(*}hqZ>wdcS=bZI6@db
z8UzW6(SjWysI-Wq1QZaF5)erNMM4_E-BYjY^Z9=7bN>PNZ#!o@+u6>0{dzqg#7CFO
z7T9p<P3K3CBRRwVT3{uum3?akwPzlzRBGk5K5ivjU|SFGay))<=21l5lWt?q$JB+8
zUc`A0u%B4rI=WzeuJC^-uwG}gp4OV$d2Qf%J}4Mv#KC9zDaU3l2W+h|eo@1|zh>k3
zPX&OCaqT+S?nl-hmed}%)}Bn&{ywe+IP1WwbrddjR8e)X(mI-#b+prUh+lOKoX?n4
zpRsFc36m+X;b16#poJLf`a=F{B+^z4WvwjAZlZDKJ3ZGgF_0HhfD<KD>c5csJh<h#
zCCTX7peNyzGqtC(rn?ww@C?e^sj!E`CRw@$e7kUQ2b^{mrKXD2<V0!x(l&6hGkRH=
zI8uN0(+h3324ANFC6jXZGu5#H^+`cRJ}!;6QH|cEjnM&(o>5%>-y0*Tn-Zj(LQ4r@
za3rp@3EkQlM5e$Nny$f{6F)S?zHEw%Z;p7<9Dj~0=?Ov0@<GyvC%L7Byi3T!sFqBl
zmTVKQ(*Bn4V&v@%LYh_UonI}%(~U_lDG$gLm}P0%_tq4~m-kFwK6c^C{N9-Lo&Dvz
zmnodc*QJfGN?*Q|ZtHMvi;i#W=WL69*P8UC?M(*fKt|cf6ZWx7uZCVW50^GitG;?k
z`fGs+8#k+;d)`A$M~G^-i$Z+kY*~l5cYfd(Gj4L(0;lIciD!i8{RHoQZyd(HKDvZF
znT{rvHi9x=XY;@A+`i25rufC#8qO*9PhVdLL{&4lv9pT5d~v;lRvdX|F+W76Q&3IB
z`>6e{SdCCyr}#{#<VmL#ZAasyPPA*6LUfl>o3Kn-r}9h};wPA_fgS(qP@J#Pi0=N#
z42D)0ku@;>%x+7r9_xP^m}Ps$Ukz+bzQ_HfN5i$pL9N(%pvPmTi&eK<#WMrA33beD
z&HY{|Ro4}>R@hF{i!1AmSU<})(Czl57thsKW1_`%LSPH;O)za7CRtKHR+hXN&3t?B
zO?oDgS+JkutdFQ#e@R>ab!xgBW&Ky-sN{kEyRL7;*ZMiA-bRVl-{-0x#;9I8=#!b(
zFr9wu^R6$gwHv=yu<HM={qoydwZa0A{%4hiWD)G~$-B4Jy&W@!-IoXY+6L|(z2##l
ze?G(1;@v;eR-~@li|fY?=L}4%4Pj?qkT{7ff<sGfL*LK6-OL!0svKG$Aawo&>qHNV
z&TE9Ky^k{*>|%m5vkac74Szq^8-c3%Wjaiw{v_js2zxc0zIJvz^S#(Jdp4R6anuQ{
z##&REA9&1)SKB_MoqP~fFXp@9B;YpkWhRH^Gm`}Wd*0J__L>nnl0@+`{G)vN$MA@c
zD&+*KsS%0XSL*7cx^AQTF{4jTUSZUkv~P@>pN?8`k1a*NGWpDCCNcI_4X!W@&nu>M
zSEs>!g1eVfj?Xm_<{*t?)b4K3MrE4IH6O26!d7x93HUJ{voX6@j1E^O?w8TB004qG
zb~6CPf&!HA1Of)c2mmkeWqw=Z5&d8=z9cUl!cqq?c$A{I0Kz56jq;-G!4~8&Xa#@(
zb$}Cbg676VL^)$r%~Yv4f_WIYcBPaKI~k!&lX;`;&LH8!jWTr3r@Jkma^VO7_!ReP
zn($=iJrN9`ChFARSAU*joqqM<)qn^Zcv?pwSW-rlP?IYtYC9BcA&1aZLuftyggc_m
zHv6<P4EMuQJ+z!%shkNfroD-xE@c>Ri1~68OIWCcIpN_E95cA|FS{{_!_S0nb+{kq
z)3_zn2~QJ|4nI$%>dzr0SW@}{<KY1_eLo2MF^JB&`4v2kt2zyZB(>kx^a{fqBy08>
z3Uv1dfztz+i}^gQ_IcEev9@Lre|bjRqYMcEj94<<g;=m$q6Gk^Em~Z}Y|E=@TtC$V
zy2;mW6aWz*-$g$nlp7Dghe6x`WMzvIh6ZTxgaiOMeFb8{EWptK3<V6kO?Ac~UI4(O
z7y>sMMEe_1AYU;SxN(C9PQosWV+m%Ks}M_IxEy3Y3mC;B6za%M8^~t}8bkfn%lxZv
zAOwLYFk`_hXb?Y|d=@~DF6l(CTtj>&U;)VR5@!x!91Zx>EvY^oRUcy19QuwErv^M0
z!u!FHx-XHj2xm#y3YrGu@hx0z8CN`uONRq>tDOL#6HC4r<e;3EfQQg+k&g&S%+UI!
zECM126#fa`8}kj}LAQVbG2sbRfs3@3v+w7YY1^0Y48vO`H(h@~02KA4BzR_vmOzJ?
z)>vBEns!33a$`46YY2<(8!Hu4x6QxZfBFrH+6a`~+zs5M$pVn*5`kC*8y?gtIjHvg
zI}?d<UFv)*)vdYkM*x2%fo&MTrGsc0mYdyv*lJ7wa}am+uPazEC6REhb|d1`s_P(F
z>&qs`+}O>m&4}OYz!v2SiUNw?p>$slH<~;}Y%t#XVFv&#fx8}q03{JjkwrjNO#7IB
z^*{ebK9;~8N4O`sc_)AlK*8*@_W+OGx9vaCXh6PpKw4^tL2KtmT+5A(*_Evyk)Jkj
zVxP3LXZ1E`I2n#P@#CCxJ5fiwdUYFB90xO&fF2f6O1>e~F*kq+FW%Jr0xS@Lh}VSf
z7{ZVC6+b+|TVr*X`&XGH?I${b8((rQo8Wu}GIDD}VD?}I1>%+Zf#Uh~g2a2=AO(K>
z`lm?cao*Lp+4M&UzN6*Mrq<Ih5n>?5N&*rK+|~H@QDZke;751_6_7I@LC(wpb1DwQ
zb5yicbZl0YTU>C629={~FCB(CmC_S~#ZhCRK&Q-^r0vQ%aX?$VLR6F%e?t}!WEBT{
z6lw*^KS5GpeSP$kXoAE=MPa}@YVr5+WM7M4KUoC9vOC!^pG2qG5V$-w_T8b*vnPv=
zlRrtbK49$Wh3WAhF3my9L-$-JHr(1G_BNKMCpOO$<0<KdU2#vHo~N@)`OZuRy#X21
z*++bOGC>Hr1`rwSU!-+ViDQLim1yw%t}{dGHh8U~y0fZ59F-*W*<zFfWe^wgN1pK2
zT*@er(#5*2c$1lLhAAHa2dQK>z-Mx*ZQ>y{ZAH225Y<FV{5ZlABlNH%Ddc7}Mp2@B
z4njNg_Uh-)zg*dhoe;VjgnHCRm1Z4t<w6#tHChUqzPFY0m67Y@S)qJO@fWl&wzO$w
zN3l8x)!i)}2Ayj7GinpL?QU2pfTvGQQo<`yb}RQn7qV`WzZ<2QJVbp=+qsg@1;U{+
z5)>lv%^*iLkz!byw+EjH>st?0BC(hWpwK`)(#O({To$hJK$!!y!7g-=1zOlvnF$-p
z98Atj-)yF~J$DgUaGbo}FIp4u94~uv2P1ahvHoT=N&Gz{w2kb85g(KIv3PzKGT1fp
z^ejt|jkzir?6TBhy*ApVP29D$wPGdHV1_m@!jH#gJ?76N)9tE!Dnks5O8cItR6f<f
z)IRa^mtW=ZVErc4eAdm=zRJmU`MSe}tLxt;+-f8Y8R0aB3U=78WJ??Cck&0Wp&!X$
z7s80;zzxR=>7{}K7@=8XzuY8BK(d2<R!nN^;Cup{C*3uS*&gSa!WpKd8%|f~=w%yN
zekjdFyNb!puqx1<$kK^rpHDSWIP%H2iB<B-bqPDVP~=@0@zwOb^^tE`$asVwozwjz
zzskR07pp+A-`za>$hEsMlE-Vge>^Y}l`fhLf<3fna;JVC2>3kHz-+j|&*a!w$=>(H
z$UOf8g1!F-f&niG%)(?&%JZ9l!YA1h^f-!|rLWTAp|?g!z#Go+lkJdl^XQ+lv={)O
zrtJhk5P&E?OUZ)7H$7!3dRqmhLRq^~A%N*hVMOx`xJLo$0Z@W32jjtjA&l@2PWFc*
z3%=<c`rUYW0(=n;j|l3!Lx_$1Mwd5p)XmC)3P~pZ;`%cF`jk5UV-RKDwTXt2%&_O?
z#G8w|;^AZp3{26V;FF}>RS?M;3ByAK-=h}lv_Q0I^m;OF<e0Yyg!>TF=qeRYdj5tA
zS%;@8!*gCM#gHI^d}6DDIur<h3`KPq;z!UXs$!8wQ5UO4<tPMaRO*7VF~moe>mZSi
zMDWbVo3y)@U_T`Y9XuFJy?Zu#_$>y)#Sm}5mk?dJMhOyN08wY&M)9Ws;ADn)K)wn@
zQ%8P#vesoodqDgg@nhAVU6ei;XR|a6L?2r2WC<h=y4=#%=Zojj@Gui7?g1h2N`q=*
zD!_1_);D<|u0;$Vv0eqSf4~Wn^GKkn=b%tOGP2aSNGMHWr>v_7KBYg<2N;M}Nqqh6
z0Zhr$A!!HA;0j1(FtEY^ItNM<3KZ-zyUz*eM^*uVs0RpAiKjz4F+f>7m?@q3?c7N|
zeQSnuVc^NH;%HPG2zDC<p65~Q`zL|*<zLY6roew7OJGl*uq$w280E+kSh)BSz=l!_
z@}&aSRa0@;rUB-xy98$$Lz(>@K=!jAKy?V*yRBSqHP?R)&VZMJ*9jzw&*ATuO@ehI
ztn=@OUbxTysN1qX<({i{fdY~F4+OUM7XrhJ+c=uA1tx<ahnY$zWA6x#I-!3du$&68
zT7UkiGF0+#Za`m!2z*pCkbij=&x~J$f9&W`q{D+~`>d>{Xhq3$B6%eqmF!p5Q@Q6?
z7^FY5;K@f|(HSCLkQ_DDHDo!P%R~k>OR7xQH}70p4sx*V0$Bo6I<IwzHDe4-CzR{p
zEx0@kDeyj_rIp{!xkpCz8}mJc?E)^j{c^UtVcqcPEui>E0!tIYlO-^H#c*I`YxF_=
zy1QjVaKbcM0-IhFvNQWcL4K!*zM~2~YEQQF4=gCTs|vMXw9I*CT@cMtj8Uqk!dIuU
zupV*%;Qiv8xoQ2-jgV1*DI-x941n*S%zGY)y(EuVR#Ggd2zE5Hetcz~io`Ke(gstj
zvQ^UDYFJ#g{FK4PO}xoLj_~?%N{x5gcMAvyrTF}sw_%;X1$Yo$$q<;Y?<n}Y_#X(&
zm6ff#(3K2<x!(mmcYmh-fxrs?Kwu>0kfkWLu$PZNKMi(}6;@8gbh~II<||gN6nzIh
zN8@2-cZ4B^!8c1EF!(+1h`C7wilnS_RA5Aq4*5BFu!xu0eE5vg=na&CI7oSeqQIFe
z9YtH*C2_p-0<3lQdy?l3=JmW{#Jq#HmD+RjLdTD#U+X>0qXSsf1uAc1^J3k(7D0~0
zSL3*pQY`K0<_%pg^pC)-Xw*{3<xT)vr|%Wx!H_j}uHk)U?idAl`65%H=nEpVomIdC
z$AF03EtVA_nmS-`pZ__P(N4+qjO~8>U5GNjwUnD*uY5YhG^(8<wAqSM2Qh@Ye<GhK
z7nOD4c8XTYNi}*uBz>HEL723l)aA|k69AQQjLy*nJ>dS0O?$BX5iVsVMM1>Vay<YD
z>esGN5p{q{Cj9kLo?<PU3QD!PRF3%+fNkqxOhpv|o<oe?_4$$ga~LQV!+^LjAWBy}
z{hcT5K#n>9#b6i_+!#nC6oB5kV}zIlc4%%oQq9#FmfPGN1r6g7x*h<Hlws3_5nr9@
z3GkiL<X;E|H(-B(_Rc#ZB?HQ2FsE3BDIEiC-TQotHU?CGTa3!1F3jEL2f1RFOQ})n
zGE)DP+Ghix3NsT^=qX)TxQOdkCq*z?MDH+0>Qn5?sxUf21|&O(q7-%UCOMmc9ug0T
z-d5KstcC1wk$}50{8`jxzkyNdCXFi|3>2R?01-8aG$AgFgR}AyWbSeH!6NhN(#?Hv
zMUSO{VjaikN;HEgKCwa?1ligErRmE8qvCl}S+~vlFEA>a#sRcx2o((_b?{bc@rV9<
zAq*5$hOhUhN^<>~XzG|xiOe(eMQ|m&Jy=$_7?y}UtFa}${HuceN(g$`^ueTH2%^p;
zu4T#eiXn+1u!zz&M=^Dd$^okt(UELbneW~S$`FGE6;V=lB|CXCP;ydVnp8;K>gYD4
zav-WbD@wkS!B!Z;<`qQAKal2*6lQFu4s52-LQ-C0q%vZl*k;rgYs*#fKz}jPN_i*8
z?5aajpcP`#?dtB3SE|qVL3b4-GC+~#i=|yQ932W|u*<bXaY^U)qXdXRxA8Nom^=of
zNs234x-8pWm@-{s+hVOGUDE+wGnO+()w&iZ-N`N8W@NBSTrYi1*V0taPMq);1S5l8
zdQNRce?c%k*8#oczaW^?iJk}T8=Jo%n46luk2t}32JHC<?0WMC26iyjzgVqro(p}k
zrRP7RAGofc`ml!#f?eV=2wuu@{sV&PUvo9^jE)ZwH^61~cFy&%59^2h0lRduZF&*w
z265}~h`FBsf?)pzyDl51MjMjBuJkg)>(z#&j5fpn3+$pb%H=Y;>C<OC34Srx8%GAa
z>fu;9I2r6JE;A~rHY#m1DjWC*b{X9|F{-3BuHrJjEpB{A&6o^!-E%d*Kico;Z}c$p
zZS!9dj0}QR4;a_X7(e|3b{W^5yk$khSzso0T<^#r*b7$^a@VgZ+N3$tq&dl`A^%;q
zt_f3}$*UQY_Vst|cTL*6O<r>i)Y(G3^Nq=1S01QW4FwM%gJ6f<c-r_#*UXse?*3}i
zo@UdYb<_9aS^?+`6hlUDrm5w?z#BpMP`7EM>EJWR!S|VFpVsS#Y2!bfTp#JyGepBD
zC^CB0Oi7kAgAA)?Gji~`vOi!KV;(e|HX(HB`piJjRNLS}lBsLiP+gk&@{IY0so2-M
z11l%g0czlnqj~{YgV0@?AFe$+6c&4O89&#}kILRdZ>HLtzR$!DdY=rj<Me7Kdk?$y
ze(%1&1y~-dSyI$g4Al1~3|siP4uj45FD4D=VuvYSS<>2_p;3pzV}{2EET|jwM=7ja
z1}vG?KirKUM%>e%UpLDa*T-G9O2&Oy)V1P#WtGo3)N9+1qv)M>wFut*kN{Y7NmvWG
zA?NFd;>yg!ZLK4GtPj<!#mYyL9`!u%>EEpH0dDk)3t5~!wMNs~w88q=@y0T&HgaY*
zBzZS@Q07|&HyfoJHp=BTDm6B$uWZx?ZPY*8X#B9zJhj2l*=ljyYD?JasN3qA+3LC3
z>R+)nh_N-iVQW-wYg}V%^2*k9(AMm;t@#gIi&I-mIy)<FJ8KDY2FA|T%+Aiu&i;y>
zLyVo{4LhfDJLeiZmsfVKgLZD8?c9IZoj<knptJYnw)c{-_g1&}F|)tmX778&-Y>@9
z|Au`)xjlJV{L(A?%Y*h;KHLBQ1nhDuedSa(=v4mMsp5yzty8B;I_D~G=i3s_chsHl
znmONdbH0DY`9X~H!yC?z%AFtAI6ryiTs`Pq^V#|759iub=Q=u<XWTB&C0t&pyVRSx
zG`P7mUU6xPacREc(o#O%yG><Ym*mn+)%tlliL8Mc!vAPs$e9kZ24)C<z3kFM$@>4P
zfpz>J8dwkaXNCx9$6pPs_n!tf>_XPS`pFuYlAAc*ZDi1mj*p^Ko!q8GgH<r_|8QW~
z&;74lIvXfHUva0Mcl*PErMZ(iurETc|I2|XeO|ogzAZ%SgmfiyVC#FSYdy28dhlH`
z2ZnV0k(}{|1GCIHes#XZF_o-=)&JAL9)8)5nZ^yf{*MN>&pq?)p9YpT`#KrkL6=<b
z2!&O^$r>0H0xF1{aYfF=ih4BtR|Bhur9iV1Uhh%O6;KWp!2f7qh8Z@)o~>jJY<T+T
ze>E_cuxYXewke<Zx;*ux(9GO_HL$({crbDXi^=F$cm1b<N&eNqNM2|vlV&QfoaFH4
z6ncG#(;U=^;WInWqKw9(ocp5SS7)mt*MA(C%y0KjG6#l%|Kq?q2a}o&-N_tShnbHi
z(VfhJAvQkK3sad8XQR-bam_xRgG**SuIP=$C#*i}bjkE7KJ|Y!u&-trG#cmE|7c)v
zdr|ke)eDN2UwU7q=#e$BNgr+OqB&UuE1JW?E|4{_wHsis*cor086R^WyY{K?>ORP?
zGykiBdCWyvdh}oT;t`gC!_W1THL$*U^uxstp;WV{(0NMFKN=X`$A1GF+2|)gT<I8F
zx$?%jx5u5Vfql7__&#QiBsuJ=`Ostk+I-XDXL^N%sI62BNq2Erz}3m6`qib_-+r<R
z^Vx`iT;a7O`&H;TBsgsq`o{ea2Zr?Q?D20Bo$t`|ip!bvxbN-T>?<T15WDY(SMaRb
zhu&8BMo3wM`lfhPu9d{P{?WitvmMK8jd<T!vId59RXOw^YhVbCZ!x|e_srM)c`nV#
zU#h=9^RRu2tbw%+UHXp(_Ar2~fr*keu)gp5X&EN=V3J-2Sp$1+zErP&k!oZ9Ue?zi
z*DlW`Uv7PRsrJ7bSnz)}FasV}!Qr{~=G30A@QJVM&t9c;*d<)|P3~+=>c5vrx;S_7
zt=WZ7h>eEIA5S(uTMn;%VGCR~hc8HO^wOnp3D0o52QG)LK5q|Pm%OA~;n%5`0KXr&
zl?69P&63ATcVaWbQK>ubSN8+29>iWfB#$M`K^x{$nN#4$`WaEfD<>%#M}ZmPtDB97
z<am<vtc1508a(F<k3}aKZlzk{J)qfeIdoz}oxhOM<t7+J&M_lgbQ7HFOr5f9GXAwm
zDcMZ{B92Op#RSnbZPizLs>4!DW|tf1wi>n|4TzwJ%TOUAIBpUu2=nz`1y66R+N^?A
z(h_hm$g*C-i?HB0RBBlmWN#K~o(48q1tSgMXZ92QhLXSSCC-(nk|Y^EqgTPkX<+k7
zs5f#R-3%3S0GszgwJj4QJv?C9V1<?K%4;5147Xg!HeCUwpwhZUSfZi-)<_muyqQv;
z_kws%vLtri1&f7l{EU%wH&>dc33sDBfc7>d`L<IAV_lu_Uq>Xr*c{G<!=M6&Nfrny
zO_I}8W0FaGY5*Fnsg#_vznT#Cjha5ODs1bS0_2N)LijMG!5(a80QcS^Kl^4a9xQdy
zCEgJZ6&&Br7pADkLWGnkcbAj7corRN_ipuog)m^j6i@Xz3LJDlD=XBCecur0CyNg^
zPfMNGgZnvTxS%0>8ewr52>a~9rEG8<y?Y@21xJNoQq1cV-z*B;RkzU1PpiIjkseD^
zdZ7Z%=Od-|p%x*&l@PhfRFkG8uJKTW0>mEkrE4D|n6_`pyT{d@Y^9Lk0b4#Q-;)r5
zQh!ZyO#^4VJ}m$2)uRu0Lb=O2LOl+?<TM@pV4YD@T=YdGqH$r)&F<=}s{yE46Af2c
zVx)k7QdWCtmihUKQ#Y0Hi@O(mK#Gx-W9Qpe{TpyU8Y_R*6MwyOfWLbEs{w^=Av0W3
z(OsI+-4@Y3=cDiafW{D^(K*lvEHq3s?doC5<+K!k#}u!_WG_dm!S^Ybn@<w3(C{2+
z-$d#!-{^Z|&<Lf}fz1;KG^GVLNozGx9t9yuHYbP}CI}+Ia|fsAn!%EDU>Q`RJP|_P
zanL{}>0v1hh!m^mlcqNz%jXkkCQd(-%`W=iBB<D<-bAgmSQ{Lri)e~}UrGoT8trkK
z*8>edOu0};ITcPZvyvc!Oc0z)koS)@0ALpP-A~W5NlYt;|J<7YxU$LDoyH_$U2XX6
zmPYjcO!+UiE1zl|?yD&~kNVLSi|E|MI(_tG6t-!+e!)BSJ^xUdO8C$9wH=Y+O6^o8
ziHp0UBX^AnGFQIsij6+Beqdd5agPjk(J#li_-6R<$~dH`@g?@=iX^;acpLJt;IT%;
z%5yz9wY|903;**ULMJvQ=7<SU=KmAynnX`{)uPL7`<JU96w6=LKxDpmb0DK&$!0f`
zOnFVCUmyKg{|k2ceSCW5mqOs=;gCesGK`+UN8m0#*89P=GLyR3@^1f<9FL6A(=xYm
zSLOZnsiu(4jZ;<J#OV;Lti0iIo_u#)Odfl?Z2Q$^?wXe1*6asfD>Lnzn<Py<h(-w&
zZ{2f{A%dHHFnjJp-Ht<i-QJ?PTzic)H&4;z&B1Gof50xj>q`9THZ3nQ#bR8ybyGN}
zY;IqHdfi54RERGkGL^qI3uLPw`*W(k_6X)<&uHtM&we|fcjM|vO?<!9ilDMkft_=N
zP$82<01eLrEm8y`$?2?OMb5~)r?DLO^%mjME3HSu(LG9?dQ34~{k&zL_I3u(#i(^8
z3%qV7h*Tw?i4?u9vBpd%>?QFNo|PUcl3nJ2jW?3R8Mlf(D35f$tyb$gNe010sY@LA
zBNnKIh3I7Z__I9thcS)1T_q(Bt==ZQM%A9icW=?Cia+Z)yE1gnE8^#kD;t*H@C#ye
zLCNmmS6&$slzK0&$n~5g)I846eZbUkczScN(jj({n%$?!>+!Sgx2jUFuFmI)v%eei
zwU85|N-YstX}uF*bxU1!@pa-%z_RjvY)7(K%ed;Zf`)agQlXEQ>tB_#1n1N8pKU){
zU=6$dgf-dqIcdr8kzK`NKXV59rSzbU@s2h_`~X`fV-kanY~iQsj${c6#gz9_iHFzk
zcjNzAVDSM(8viUXh}?u~JHzG6JE0%075q$My%E@Wcd1Xtj8~Yx_FAC&vf`y`Mww3$
zQKA-b`XKUbDnmRZUF8PH$3C5jzF;$5&F@#nRB~&XZO7<;yr8$(Hq2_#yRYU6*E`vI
zF{*A@{=$%{XrL`mqX0sgZGEb{=-2JNpC4%1V|u0D_IN8Wck?MF30K<A)iHDS*pY8Y
z$6$_G*ZX$gPlRU6Av2Zk0}qQ6+XLi0^boV`-K|^b*!fXx&Y&YxPk8yQ3A=vI9b4oZ
z7E&AR!_!4ueYhY4r3Gw62oZ=`LgX-9SNHI}9*aka&5C}u>)r-ebSF^ht@Y;YZqt;H
z@{7&jK-6;ac?f-7x+|DWHhXDC>oybx#ZpBPQ41`>g5WX7rK#4>Wpl};usf#dYW~@E
z*G)p8^WUoHqw}}Te0cBdr1MT1<Z96Ji})6uw?--DUv~9O)XGgIr6s89yRP$5u?YNb
zo>REBs^!gChO)ql<hQDuitsruT1=s|GiIduyJSsi&S@vI^8}e44tG`_ds4=UkH{av
zbc!+^`yL1~@=qwu$ZPXuq*B~r%&ohniJMQ=M|($ars)d){6N3clFM7DbU~1WW~Voo
z<L6>b=hwsC%R8s-Q`ivQr|y#rGa1-qS%M|=wrOR#m?kplx~3k@Zs%N3$V>a(2bD+(
zc$Xf%NQ3)Gtq2CCC@4{6GBO&V>W5QG{X3~Ih;nIc09i7QAl?T5F6tm$YB<{lB6B#2
zRRx#ooDbr(7j-pXmrmoOoi8P?Rq``!zcB4y<QqW0(eROed-SS{t_9btrep+jUKijY
ze*zFsi*LRodWX&cFCbQ3Nu9b1VcHNx2~1h0r`6Zfs(9-vHDLO#D|x|ui0K;L^V-*D
z1lhVCCNXPlGg#+W(KZYlaCTdbl|B?;FmPPa*+nuwc9wr+(qo{xwMK%cJ-kC}&cJ8i
z;7q0VO_#Zy;W68|3ax~{Cz8IyK&XBT%=*~-)+D|UCDL+VhJp_^0;5m^Tcs1Pr68W8
zk~A3%XvJr=pP4;c(($QE(ns+zIc`CPhAXYj4|Sp@npY18a^UI=+h=s54KMpe(ZnXr
zv%InFWIm05myYeIVwu0EiTmy{_Y*>Ar3?8rz(8q#$cG%TOyE?Ax)J5tMLSg|8rJZg
zUU4;^BM?TVH;z}(d>YQb;Ml<({lOqaLznxUf1;FOWtMYWC0lr1rJ6PdVqJ~lUU;Yn
zLs_S=x6Q!}wtBe@D=Dp$FuZ(NaAG#bsoXLV{;4ue@%G$}OC)p_)5=aN$J3zeN=b<v
z-}_Q|ZhKIv)D^P(KJ-<}9EJ(3^3jg?xJ3yqWU!(an3)AB>7qR;^~pg|En<pfkqEhC
z;nSyA;eoJZNK?f~i8MMw%=3ei7%1jp&$bLWEiF@Gj&<mi(|Ss_`Q|LRIv9RqwK<y^
z;X`SAe1R!D+})<WvcDFen#RKDsHV;<f5Z=kQ3dO{t9+F~$t0Da;?<6=eBCJcBBWrt
z5{7ey-I0Z6DtE3cYCmR)b$l^;%g)Q6Q!DG4SVz=IKINrnM5UQC<fvR_Pr8NY;P%m(
z$q9_M<XqFGd1EX7ki@>*!U;3pA}`^!>NT2gGZxHb5=mSGMD4W`z*sSQg7*ueN%|@1
zyKbce|8ZTi_7dOK2-O5yErmOXQ|T}0<E|(4TJb7A$5#U>9MAk7?lu$WVw7Rq>iCTU
z0b`7IhFm!!r??Ngv+)$h9^2f;MX8DdbJ-rc^DK{t8aaDSVD3Jhbo0atrt$gIE5|{z
z3Iu~!n?JHqT$TyHSL0a?J1)dkCs1U<#?h^9I~Cr={k${jTw)`=b+ZgytuXWsDhR54
zZgEb;6)kr7(XaZK&UgCaV;yjie_-VtAF$jyA;Lr`{Wv|#`~mCnY<pb)Z75Rk(1d3B
z7d6}Q81LOM`3d7Q^uf9vOd<v+UYPInPJIbnv81h3rl;{&%<Jr_+rRGV1T&_m!Z>$-
zGpI|G;}2sN8+={K3ZK98_$=Lz-D`8~6|<*tWAXkl6NyXH<<$<%_&v+ZG`6a<I=qoK
zx!^ez{@d~97CfDT4;$Q09kbbH6SLX`6*LXr=e><hLoXmGtCeVG<~7e@?=Z1Sy;T*j
zO8Ve8&Xm4dty!-H6RdZcre8}Cs&+>wbuE{V518rhsPpdDbnogV!H*JUOo!q1AhDbT
z8m&s!B;bM&x2~E8#YRp?JcNsba%!(wleUYd=)<_sWJf`VPPI0DH4(nYLGyU-lUwSP
zI$4;_(HzxA^c7E&8_|N5U}HLnaW`W<>DFHtOk0EOf?>vVLZ`?s80Agy4szB~%RNku
z)8Zu8QrAs)mEK~qh@&W;2^r7n|G`R)hy6_Ql2ygBXT`xE7p&t5Z?U!nVJ_!6Etr+h
z&E_S$V1_noqY&M;SsjKdu>N_-Px6V|eE-9OozMm!@oXs%Z3W%l{=<T4>2q}aT>Ha<
zmHc7Bx{5l?_wO-l_*DLf1v_y&JnA|$8>3V1<~Y(ht~vkf)fdbEuwWgle^@Zk*UNe0
z%^f;&ox(x_XU&*F$BCd3uCtF9bpNnmki;V$yCaC?ahE5V1q<bXY9uM$6evt4&B568
z;9TQoMIQJc4zPND_{9YHnVItPsmWwO^KpmH%pFavKH|0jHC9K{A0!BP!uNI0J~m>q
z?_^Tx7({o&4HKo>01dP@tU5s@2iSSoRmnBW`Bh(f)XJi67=qA?)1uH|aj#P5vZ_wx
zlyfn!n>HUvWUTWvLFjSW&n}Bu2|nce`5D433Sx8Y)PQ+OT7uWKE@+xwSarHbe=VLP
zn&-uKx1N4dXu7MYXS_pXmqv4ZmXm;>Mz<Wx`K=oSCRcaYFfYwIA##y-aaC8}mO`N(
z1M}}RIM%^`CTOO4z|i3CejP*((c_Hp>-6)mYD`Z*gsu&sA$IXpl6ch^yoJ_nt?pKE
zgvN_vl6cA-g>e^<hE{3Gpfj#{oS`7LQEL#5!{&1Ld23zq9DoMXNumB8UX6#(cEEjv
zsp)hskZG`8VKNP-cAWU0n^Le6124KoUE&Q}0tA)bYx4WhbNL~BJUMeP@c|;?Dz4Yu
z{if``p8qF<iFb#`R&^_Z6#YB(FN%;^FqMBS*h7YRZjq2PJk(nrR#SgjFxw9nb%K_2
zS#n!Bh;K{M#}t+u6#SC@R)1NrG<#hcV_gjj2g`hajkJfPHDR{`(Lf<R!$;Qacp)o~
zBt4caCoRMKr@GnJl$_%bHd_{5hI^W7B%VwK%8t-9<TybmCt*Zd&(*Q}%wFR3!~T4G
zT}`=1HfUYlhtzHnqL)`8mAG8JzC?+~9dK?QkAV0yT;uM0V>(D}r6572IUBYS9m+?E
zD!Yl>q8xdjSlw&vtUYY_LqU;8BMMr!ThfU~y4|W}o#<tq*3Sve>0;@v@%OD4?HoJr
zOLBS>vw4#`()INInqb6~mN#mdXMfLA4UtW-%Y668&)Q^mSD@_vnP3O6a_)139@K!5
zYa;hKW<&m(V2H5K9qRWJ<8@+RIl*ZY?<NEH#3&<*9nhi^SGRT2ZXg%iy14hPZ68mI
z|24s6r@j@CO)xBJ$aW4=6Q)l_!LBc)#J8M#-L5Bbw^Ea<qgEs73uyK%FscLNqT|Yu
zYO`cedZKCTUr>XOBBNk)<!q~N)(<(iC?O4ErEh|`bhi>wjpNH?6l}nHJI3{OWA(fC
z^}6V;Z%gEDpQ>8^DY()6P)!1J%2<!#YL|9WxBIHjT}%B95o^>fP0{l|o>gdee>qX7
z=oelPCYxXbBf?eHoSotmVKo!J)EcfGsXzW}f|V7seXBIQxpX#EP=iHySi4%Kl6ZbK
zahv7GSuP3YKyk6R31Y^#HM#g@&U(Kz|Dp3A6AU!2q04gl$Ar1$vb|*bT|Eo33Fbk%
z#9_-tC%76%C0bRW6@9!irLW5{z@YmN1zV~iqYC144`TNvtd}mlx1DghFBDL6f0QhO
zT^{)>f_3%=X^-naU6z#EQP|9uqg$^WgDX8D9P92m>)m|gpX;ov_apI5Zq-go?O~Qw
zpikET4<+2GgW~u<AeflfMb&{#oq^iZ<HXYuso!5Wf6rbeja>cRsB?OJ6(Ic?`TYxm
zVL|L@uqqa^^Jl^NR2xk?OU9~dDIMx44A7uBG&B)?>V>9+V4;_`s8j2H->;+2r~~r0
zsQl_^-eKXjXqpTxH5{udij`d=|K@^*e@DZAVQF8Jw!kDTgTOZ3G<k{)&G<{|2%Jn7
z!H#$+B~!%0mUIHA&O$?j{)%AI|3on4UlEMsuL#ERM+AHJR|JzLi(njaLCA1vj?!ny
z2is?!JY!FMhCJBjfILUOc*dC_&Gk;2ds><&;~5WoFbD5*RJb&!i45OPkPvBGC<M>{
zI*2P{n``13@=FlU)t|`lV0Hl+;qyNQL!R?C{S--+5y%c^C&&ms_{mfIQ~XYl1pFu0
zfeaZ06a4s-gY%~Z^e2C~G#LaFC=F)k3^^+zd#?Anl#7gPMzGxGbK!&MG6Es|@E2#<
zccdXN<VnE-*&(taMA>lC3#82p;RhjV2GW-PY3f~u?Ee+PFn>ib3}lxqf@%Fn1d}6+
zVA=<=tb+Bj453;FJDSj4jL5DQd;R}Q1T+3Cf*Icl6*&wsNtENSum1~zg&I8onW;id
znnI0kg&Nn&nZ1@XORP7{t2b(@H$JF0>5?;kN3K@OnLkK0Z<4dHkSEJs*7OZFaiNCU
zyB6mfESu!4dP7wPLQPB>ENu47W#z5?_U!YnIdC?>ldhR$U$glb>UyW%S#!^6b63*z
zn%x~acYy}?+Fh&Z27C4}r(g2UJ9}oedmi73cD3@Zviq)aqy{gzoC$lVLDa53`>u}2
zuC`*R)*lfpRK+w@D^&q=5TXs2)3ONBm}o2t4N_TZ4BS+>deC^4q=1DsVd)iv*qefQ
z6@x{Zf~6Eg6q`ac6+{1kU5eKn6oWrDURmj`@lj0w1A-~yQk!tuiV=jSh+B%051Jxt
z!&N*K!)=n(a37;G(!yUf#e7kWm90l+<JpUJf=RM=A$Zx{MrABf`+FnTdia^cgOFZ4
z{4j)OsVT`qDOsv1>V3E_1x-pSEYP7jHLf{Cq?x@>ixx}N5(uZ$#hrmE#d978)*hzq
z08kt#RQ1q_1WH?J&azNqP3uS@;j%&xv*=06xtn1Lo7yVG&P)+y`b-QBms~o840}QN
zM~Sd*;N}Ayp1wKYUA!{OVf@Peb%7S;W&m~=PWW{oX{bdFfNnnM;%&xITXrbi?NX4d
zXTM8KwCSKHw!r(esGEu5Um|Euh)jT1u1M?cbK#GQwf5V4WNf8#=+knfTJPE55+1~J
zjRMg8dc>$a=0PIo1i-4)1rzV!ZEh~CZI)dJL&f7cEx<*um7s0PtXM#%S*5xZXSlNi
zYsM?1z|bu`3l?(=uF5)doLGBY_dw;gz{}_7Tk9=e27U)PEvyAI$JzWSRb4@orYiBa
zDh=7>2r`a68(=*=P%s6vW|9C{T4c?Ng3O5)_kl9mq`Q8pHU52TV0J{{mt)DLs05q%
zCyPolqb-QC2$jA=1@f$Qv@%Tm<@Meu>QRi!39-1et2R%ym;ER?gkF01mWNWpQ2a}L
znpRPG+uPLegf4L6gGA+rWNQudpew3;Q@fkg0h|2Qt=d&%6VHwV@o&8>>Wxy#Z&p5u
z9u`Qrxp*kKo}ld55;w7}Ag4TV_2gA*eUHcq;p)lTxR~TPwQWc3mxEo;_qrqw@Akho
z0-)&0*Xq}Jj{;R8qMO<@SiEv`P<c2Q+6Ur+@4niJIm1w2{Sx>3eKXgnv>{w$zEr2u
zA_0CEuS`7T#p8S6q?hd`Cxw?@#oBZ*VTp-duU20)O=@Pn%Y`UAYK!_<C^;r5YUt%x
ztK;N!_!xFLZau?fw{M(ln%Qh*#{;lcOwD)ofsn{bO*Q<BR^{mSXICK~pg48{o_+M_
zXZSY#XoMKH75)%BU;~0-F?6WJ^0@X2P2A5H&2YyP1pov)!O(OQH+thD2<@}=o5I{S
z{9hqb-B)eOx>$iEwKxbhn;ee8Q#%>X@qdF|ZxWN0LU)V6K7Bdd9}DCnnEo%YD`33d
zDY#U*P}!|y+V`W#+gl=u6<o(Z=?mP3^iP_P$Y9qan@9HLYwM&N`hUQ#y^<VP(S*XU
zA7~E7<|;4ye`>t;7wlpyjfwtv(bfG`RBvwmF+0|yBaxcDu?4Pcz;KUNG3*2xZ0gA6
z`miL5Bjjtsfp`nG-+GCHdD(G*Ld=<K7ssA(gV%5nsq>#APW2mOIKu-!OEf*Qz7`se
zo$qppTtcN>3tncr@Hyks_nF|ekB=NCR!h3>e473hYzWQ3S={Q&DVB}niHY3%{;4UP
z6w7&Zu(LMNq}hHFbNcIh@B8<><Uz1J3*u4Q*)28F41812Z)tTkHw*9I+e#y`Yn*>>
zt0kukq3$}^z~Z%N-pKhTJ%?rssoP&18k)nP$Lb*WsE5R^4Di3<;0$HdM_7-NtFx-w
zeoWjx6wmb$`Z=Aw0)D2!ef;Io)`ra4M)PmzrPfpPF7ba$z4dhe(}O3LnMFG9<i=b-
zo?ADJmhH^4F7kO}ggLu{6wOlJ7Ep1hm!(wOTe30N<e;z}R$pB57*hGuXblR?$)n+B
zOb-2^Pl^t;G!kpb|7h6T@>5CS9=w-UU?@Q}Q}kr+Et5%WD-<q(leUw`1*5O=C}Q=V
zNFwy3Ltc9G6ti&n#j*t6%ueCnb41*9Q)u>GjvjaPDJW-Byu{I?Fcr}9YS4x8=xw8b
zUl|9%)$c&tVP^g<Ww<qB^uk1Agx{rmcYI^rez1@PD1;68z1=@wyoG*Q@&+a}d*mRC
zOTbmp#*CJwW}(mUF?-e6_GL}xWOrorvpj5|V>>&LzD4!px=`_lJOPu43kc`0flEQg
zg&Z;^PGJ#^W#Mm{(6_EoMK&7D4i`fNu9<L@-#YI*<#U@__SknL-*;+lrn1oa62f-%
zu-?PRN_#F<K&H9U16Gy1cu71Ui8U^*MW0PGc)s^$IDfj&tyr&eUsU@kRdl7tnRG#9
zx{NfK?zyy$H>-^ppMLNSTTi*Ap&ga`?ucrtfuSsCW&Ke_tpoqv*T(E@dqWPJ53fCO
z*Hpj8<j1alUflD2dAFj*Md|0$-XdWKQ%_`gaHNeSLLRQK$RKt^TjsquQeYtMc0~gH
zek!}{eZD1@m(Oza*kn(h30~J%N*Cn)5%S^A$t5PSFSiZ{i(W^Y55V3q<>nY_TKA-X
z?@6Zmwgpv_v!c#8y2D%YuqSz-QXx(*5Ovy2DT^RKe(LW+9;@0bFL^v)rM|B>Zrm}V
zeb~ZSm_s8%Yf7`+-O1*gkt8fmOUH4ci(!EwMTUZw-eFRkeHKNjyYPwOW0f}V+l^!u
zL0ZOJFg?MuRuPI-UN8Z<M#P(B-i8vYb4pZ<jda~~NppI_(G8k$l^0`b`Ju84D|B(g
z+V;PdD1U#$8JKM8*!}KH285m?>Lb=N{683wU?(8Ng){*M=3N8S-49fkZPR#-x1b$?
zj8q9_{9J{OcKmcBSy{*rX_l4w3=eL~ARdB44RtQK+j7X-8}}5{4NQseS(}Lc79u=b
zT6T}-=ps^t5ZY$)He0EXK5v-{dfG17Rwxg=zmZt%ly4+|byCW@RmdZ9E46cc|COX;
z0(%>b3dQ?|cF!q+jUxREhDtd{9pO`vkV&B|_sBroSdd+xm=Mzbsepag1NnPcm!4;p
zB0A@GFzdGj&Zk-kr`34x*uGR1xHChR?T3=-0KHda6YR=!3buBLli`8PNLK#t-E&5d
z3@QW62*JR8yJE2<$0_TZCAJUF)~unkN!x0h-M06&e+0M(me@RA54~q1@z|i<oAn{0
zAtX=R+~AcpeLZ6)zu#`}7b<P^UleRhP;EJYB9iH6#Zkx;jsKuvq<k_8wx#|wjEsUI
z4LOmbHxPeOupUgGSK;ep9a<~5vqSs4{CRqMh&7D9K_&WAh@FCO(U`cO`Y*|0ceb;|
zpT(gnE>rKz8?7I4OI&jMuKi=R@}gzXuz$wt)TEO_qlJ}3z@<yo(_i<+UVgrOHI<{P
zM#KJGZr>BVOg>BRrT27hL~Q}$0}62p2=(`ulv?}J6Rwt>6|+AKBG%H~&Hb~PSMM2W
zTx7Lay?B=?z7DK-aUM>(us)Btw>GTaYDqtwmLivZ>bP_93Bh0bVu^T=rNLe7ZK|E+
z4zaW?W8r~#8t<_e9J6)CDkt;sO}%b;v1iE^)r8?SqVUtZ5-_(?uaatHcSTH4<|B;r
znL9s`UN39)`##idToK}>6!X^q`N1b{<~=`75A2wl`Gw9ig?D1iIOK8L9NX0uM@vj9
zOX0(t{cT@+*%3QM@5*k<PKyuHxyu&29QaO>k1It6*>a)9T-8M<DVqYY$`Zp20r$iP
zUlCGj<+Y;3?tn{_tT$yCoO7c3lwsGH#*>NHOo!2qR<Z3pG;+IWlX1*{dzeRAzNRF)
z4Kn_$aIe~PFdgkddOF6TEL7RDlRNOV+q}+SpN47hQu|?vPzO)gvl}(+J`h#PPT|IT
zpwr6*qES<W3Rl8&N^eqsXS(~QG0eDb@UnMrmi6MX!fGe?NY+vbKW!KI319HVs4tvf
zD&M4WX66_?{U&hcH8u^;&CigT^q!X5;joh<Fhx@CavP0PZ})_BZj@zNCHG82;}_N%
z7NrJ3`bfIojOC!52Rcg%0ujTe2;027GrH$A9o}VAgcQFM?pjl-dagFI;d|%%q9lFG
zt*aG&%4=;}>KkeAosI)>CW3azrEjXkZ#oj*b}{N86C}>?XR)gZvdIx?g_LrGl4kDI
z#^MTuMmM0UH@oOaj_5gI&Ui|>?k<m5n2s=0%XTRzTnbf{z%{y8!WF``H7Un2U+#H$
z`<?K1f?wMr@0V?&RQr~}larR&t+Zf69=0d)2VZ!Djyn7_ic6&)uV_g{UOX6Gvxqaq
zj6pxI>v{6H_UJOfo-)+xbk7CPr+#7%&W=Tp1G`1IqCbJ%vN7Jjfn6<gr>)bB*tqBl
zHS2lBw)WMT2U|+*uaCUOM!J@uq%R*fPxnabq2=mozh2hH?y#TxE&e-r{lfd4m{FSC
z%5#jFcm&Ni&Jz%?T0CEV6<yZc_mg;*Y7DcuJ};_+`YoRGB%X1ql8Gh(^bW-!m%~ZU
z3Cdt4Ntv~%0Ti%O1!pp_ubZ={T{u3@f^2N2eYM!jqJ*B4atXu!3LU1Jr%2}+Jc&fZ
zjFub+k|z#pNi5o9C*Pj!&(E`c&p584KlVT+(DRZ18bHo7w`Z~V6WOcrjB;pLofdm{
z2k+f@#soa7c^Lj$5^9NJ*dWqbkjbkKS{Xj%nU%~wt(fPj%!QY!Uer=$GcYn+F|y|}
za(-ZR%b+gZLVX2YIs5c&r<RBQTBJLOnTH>S>fnv7g;wKP)`xlR<0+6G+%PZX#xSpj
zG|O@wZOc4p8B9stNqc6#0vFHlmIhAM$vJ?c4Zez^v06lIGv@sl?AjJ*A_+Z1ovHc~
zEaB1V(Xa9~9>q@~W69CJK{<tIL0v@UchG2K>Q1UysmTF|dCpTlC@q}pqO@cn;}ICk
z9o@rQ#K#Cr;9Vtt$=t@*Z*u$tyO>89?^vBteB_ySwU6w8HJb#J9k9j^eE%G<cCrHo
zB*<*tBs*XmSZ=7cfU-4WIhSX?lV=YNobu7Y-q61}$AdIsfoY>^Q&FrVB5_QjiPoZo
z>wNdD_{mzuS3a6dU;-t~*^K8F<YzMkC{gp@w>-V<0m02VO8+@Z!2qPT2W3SE?|mjp
zq^FSgwv4-s9mV~iU_P2*BJBoWp73=<+6Ue+nGjNBu;{N5DH0Pp=DBET4o7AsJhFD|
zu?cnHbML37{ODj5mn@uBn_E1E#nnpouL35^yf6kMD`4@JDP#o<^eammZDS+vkSEU`
zgx0+4FvCw<^ql&h39p$R?=eb6X7MiqMx-$NgMcYrW#&()QpycR<vx=y{iuA4S%q_5
zUX{XIPMEXl4+5riD~s2<=i?~F9|X)?hkLY+kB}&J$3}f3Pks91Cndm3GF9TIr`Qie
zrhf9O2~k6~6ZsV(dwX8(mz4VFJPdpk^D9_I^=<-H0@4e6ZWd1S%YuzowjbTe*@{AR
zYfE0A2OzeX;vI~Rt**f+ip0FDEfbJeG|z_PV{hc=`S~&7Ztlm(54=xh`BQ=<P2=J9
z!#W{XFh(qfiMED{?{%eoZa<x8Ir~jc)(armo(br&|Jujzf3Mm{>)ZO*b7~-&sQR(k
zP{Y?Ord_+;*Xwm~@f>Y@3o>BlJC)jye9wF$eZCF<(+>K5KAr?mUYOPu^NzemFmG6%
ziKeY7w7?SHP~VrYv(Uk$9WO1Lz?6wG=e)`LFsSuxXU@r-@JdH5jpez?czCm<CFPi<
zL4mD_ybnWx&X)DLb-cm7ARckhXyXh1pL~o1SvK;w=>a)gy|F)FmkFyKA(440lqVD5
zm+EB1G#GsG1a^k`NoV2_t3*z7Po6Xod}NegFvQ`)dy}{^m)GP-mYs6S9xChdx#uAI
zumY|VjGZjMi2MQzg3qm~f%+w@>n7{@DjV171m?^t#?E+#z?)pUe2l;Qcv;5i|HlD)
zn!(|fjKXwzHVkmiJaFRxORtf6ZV#IJ0`HeBx;q6vCi}_<1ro>qhXb~Cme-#$|9>4Y
z{4q@)3Ty8d@y`L9x7V>Z+4oe~qY027bT`|V`saW(LKyBBQu{9cb-?1K{y1R3#XHOw
zK7grbwXP0}Fdvg0FpoQ#dCc8p2Ml!ptobb$29o|lV5(Q-_{b1gNnyX&2*3L{tj-R*
z`8}XFOthH1C`*>#y=lP!VCtbj1prh4V*fTXIvhYA_{`fV%k|TX8?!CU*)NFj`p^6K
z+X;UUdwSAwEl7%K7gdg{GUEoHWuD+~)3QGYuFb?_BM48}*hAw-g7_SQr6+<fKte#6
z%X^&=o`aC=Ci!>!=L{!8|2SarAHP=hDT$i;vWLYL(gbBA2T-Pcp5E*Wtf2+r4e>wT
z8n7{}albW)J*|x1;EVCBkz0so{yoO4Aj;Us$Cz?}5|*PmQ-I3|_o-1t=P3sJdD9jh
z1V3ux_<5VNqA8NkQU2M)xq9{(QYQ$WKgZTOCqBmnXDf>CHL7HLk}Ls&*AeN0o8r0o
z^Kg7zXptC>OUL<`ROuDAVGQ-{Yutx?wB{Yid_3<-C43h{eJ1`2hZit*kitEg=wy>X
zApaPq6!L_OfW;@iI84+d$p56fv17(hM!?d@2pAqq^%nudzUQ4)$~x@`r(QUdgJQ>3
z!B<BwlMyg}7V=*?U+y1XH|odrPokQN5+o)gWZ3}}N=kArNOmF@!kpB?e?#+VR4{=#
z{T~8`GVNSp^RLghP&RGj3r5x-jRbHT6WIJc-FUrtE-tIGbI2=lp!u8>&NgR=6i0?v
zaa1_u#eb3_sUDRs&C}oxczEvf-Uf180qQoN6286?dIcKeE_3d$9^X3(gFfXjcXCp^
z`4)XdC~lETE|yAbi8xw_5DSN%Edm}+lrxTIMvbyfg}Y4f(Q<7>jrgG`N-C*4>FtXW
zaUggrk+!X)@G2jHkH50JxSSAj>&sD)2(Cz|xT1<ZgdHGnr-Rr$iWSd@mMh<ph30EH
z@q4gxx<pFxI^JVssyNWDkaC0wqe7&^sVrL)uR8NN9hbWE1)V?66Vc{>Uwr@5-Q4t6
z#t>(zu*jS80741LmgM}H^2MzvIfq&$uB<UO-XYCf#}2n!pRndW-sya-;|x(a4C3_Q
zYL2WSF^)VmdW56`)kr1Y@_$hqq*t?f44aPRnvIk~J3!uOL8wr`^YN$DFHt)xxyMy@
zke3oHd2i9GW>hZEH>Dy(h!px!^&Le;d}OvOii;(RtF@zHhyS_eOAfKp7wHqGt@!Fo
zFSXTN8qY~Z$SUXEAr!^`3X&*pIO1=Na^VR0l|dH3LOCT5zlB##tKeK(t_}r3F)y3Q
z0vNF-F7jo=e+4j~JD~bst;M-5uSKabg{>{x0XH!13;z#$_Z8LTyS9rygd`-CB=ioU
z2?z)(Do6{x3s^yl0R#c*qJk7d?+_4_PN<?%0-|&bMLJSNIsrjIq$7eTtQY;yZ+?62
zb+8Wh9%GHM<{0lmj^7+S$^BgS^_x&D_HEea4w|S7=AjB$oscM6bEopFa=G~q^{a3{
zom`b{y~BL&=e;Io@H@tgX5H&e3UH#(FF_VL+l4u`vsYV=7;Ks)GFsn#Z!T+RCR}W-
zu>qNk$+~;JN7%ILXS5l9Z#}!n4ZhI!<_`h(bCb_`PpZhPoyMl^E>9=j_qMa`jA!aQ
zgw(_Z&T*itrIv;-ZJq!{s<NHuu8mjhe8*$(>{n;O>C9M6r1a;@pK~-1{s>@kZ@U?I
zdKP&s-dlJ+weC3$2w<wUKf7etsJh^DY&VA+8!|qilr&Z|oI60q+kS$(O-axbw3h$@
z3`+(Cu#EaL2HpXMDJ9khTPsy6-rs@|P3=;QX8{515g>pG+*vr^C_goHC)4@eqZ^w!
z>I;AXrdlOIdu|Wd*0TKIm^u26Wf<5`1_ZDp!Kh(Q!77@$F<!y(^y?$hQ{z{*M+L%o
zukxIt<cOs6X2T!GvD-}Y3-Y&GcC*!tmt{`v*EntpAm($~u%4KdKLps8U;KrZF(I27
zgw1%ugQ<y3%HuN=0x;BJofMdg>Esi}R#!~5DuY^o<LV-QMvMaxw79|_ODyrKoxMIB
zhG*F08WEW9K6(ApA>ZvBTxZVb-=F3W!s3}{=frod<sVS!fabU@%8{LVE>&Y)5KCo+
ztjs;g>ck!p@Jpib1^r6^3#*P;#>$of0+=->gCnY7kB?-v@_Tk=mFCBzKLXg*q=?wP
zmDhaZ$=KyoK8J@-r;n;-7a#Ji-<cSB`2Cmw%iTW{lQs8Z!n*1Y0hZW<np>V35c~EU
zN1z+qqyzjfa$L$RJK%rG6>a`*VrXvM_?>g&^8?J%Q>%65^(#k=zK1syt>Io4r);dD
zvQ7M5SiW%#oIbi%T_9dEkU1#OrJeUF!`yaN7LRL9ZuAi`58HhyP;kg9-ZmAJl>LMA
zuIz`Z7A2PN*Rl^-6TX}C)19T}v9WGyp{hbi^5BnxQl`_Je6}=?_Ime!Bk0AC`7hOv
zGNOEqHCi(>zo_P>8&1v2b#5(6cPWMdV3!~KbZ%=Ti^R=(hXm?y4<3a_zu;%`I}(KT
z(-b4m6dZLWOPbgE{Q<jV?~d04V3&R@hwsl{2wAcIduq{KN>Q>e1`A@7#B}GSQxe4N
zOHc0vi_o48aZTFWTny(aF`sYzx$^VevxGNV5v%uX^G))Caj#vKR#>fvo*&W+UagiT
z;hMPabNvH$aVrGS%bzjG3YIW$j2X*r3{ajGS<pE3da3(hSAhO$#7v8C;gc`sQ(QL7
z1C@8RB_-vn)~4!x4-Od=_bwsdMsq(Gi%TCoBc)?tFpai?`{<<R$j3E^POMJW`5qya
z>%BL|y7}KrDK`B4{%xY}advve{(c_ks@ciD8jS<w3sFN2c7O2CvsQsHz6i=q>QhIi
zjE^>y;MO5bmvnO6woXUPnygKlgkAi)2VCV-lB}W1hwjX94wt1X(b8$ACUk1~4mp~V
z@P$w4sFPn`TZi+H3~F&RIL>K=A6D+!#IQ~UzgOT?M%X1?7M#b0Ubl+0dwSDV{zK@M
z0C5ve>3a88;P(+Tm?6KI7$+w&IjavBNF+kV1(vqy5nW<udt!g?e?F1n8Kqm8IycM&
zR)14(+|4VycaJ9X!B<-o883XKV_}+AAz*~LBb<tI<MdwIw7V0V3ttMh&cq7ne2zaM
z;1o#6c$l(`LTp4Z2XS@nclPsE{uFwyQX-gdlnXb@L8ytj-;+?QwaV8%^~&lf+T|@1
zRg<bjK>(d=^<137B?%r-j#OdHWD`1$9;!+k@m6iFSmCf}2!^l&MWgGt(yCq6JI@RU
zC(7=5(li_rab=pDI1{5<CZi1TDmOy3M;n)0&onm=i&}Y7zFf{&>f@h7VO)DWj9^8?
zCyBVo$w|jE>f&XS6)Hl{ic>2NvALQmlZ5`hZn_K3j8gWYJzhiLm(5fxJVu81KVIj5
zKuz;fE;C0_wjK{wToVj2q!V!13X=5|<Jmna?Z+GON&;@SJLZ_Ze}7b|3|posPjG*$
za#vx6Q_Gd3<^EjMrx7HLxCMjHe4>$Z;<M->QPdsuclBkBL(SHG^;G>M*;<o%+~)Yg
z%d%3Is>@f9zTYaItdw&U&$v#ACr|*ei|yR!z2`tY)o=5L({Rjs*Ny8Rw?0TqYYn#<
z8To%-wsSey9_L>$<ap_VI$Vgo=U)E(OLlytO}xYKrM<PI+X&J1z8TpKamB;{0PI>%
ztl<$hdI!36o8J;13qnPds5#{O{klt}=3hEpBH$i`EJs46Q^cX36xj45B8`e^gY9j@
zAdY$rUN53qjH=JWcnJdsz^)EnYFe)STeRXG!lF~|;nYsyFtfdg>u`?<4ar=__=r~F
zlOB=(0=x7)qOKPI1-qO)qAdWht9&m)yIuf#uIGpk#pv+j>`M>jRWx;#6TDrn%OlRK
zIFENdqFwQ;N4(#+JpLni2bR{85F(i`fQszUIO&<dWfI6SUZn-OE|HkjdP(8xtQN+>
z^GU|Hd{LDe-Pk2uQodw?xX}yhSiEO)v9pMnW@MLX+U4ZZ;sPlJgudC=#HUr?L?rIL
z&^Ox}eAY@YLKDQ<W6gFi6$_%G!5UNF&N>6*;-otJY}vp;ZzySa9)HeP9Cn%oj89gi
zv<P1R;AO8b^g$<FVFuCX-NwxJ^i{0Zd}N>B$UWH~J<nBUYK(ezwzH4u9qdMRjUNv_
zk!y3z`#hf7|L_!x<y#L2S`62Km%-Icp6}s<M;B=a4eo!<<qTcaDnHww2u{jr(|w^g
zWNqAy*(q4FD00z?8c58l%oz}J)OdJvAnVIcHkLtL1ofQdY`*KYZTDakk2?c7OqE6N
z2O@YJ(&DaGRKDaPzf`cj$(b>j^fD##rCw*3T+RuWlDyL^SFi04du6%4(2NXW;<6?i
z_68%Z9W<QhYUQd*SxXnpX0Kg)dCk-FJ4yQENhAJ8*PCIi6)MTj4<OM-ZwFzow}vHg
zZbb_DXxoRQxscP!-4{RDk5r7EcGhK{xcTZln@_umi?Wh0=fsC6Z=PLSaq83LpPFNP
zBj%iCA_?$2XmvK&B#rd#a<q7AlkRpkRI2ge5rdg&Xf?}_i=hv<IZ|dfn<Q22eD>z_
z_|K<B6hjF+w+So#(i^#({>4UyH*c*Kl6+^Fqqv(@kpYm;e9yMp6-qrA_BA7qXXf&y
zn@E$%_cyKk-5xGR-=duAcr#zH>L+K=zti=j;a!1)Pe}T$?}^^kPa4X!t~k#!we^X`
z%1~RnT1$nQHgjJA2HM4*bQdbW@I}gL#)uZ)WMijk-C`;CNr^EMjURo_dA{5yk=~Z|
z;A*E-nAo%U7%VtZJzUEgCLy~Re?^A67dNNj$(R@~L*nfD)coz43$@)tz5UL`*oyGr
z=vnr=rq~A`wvsYE?)<Ql9q>XD?@M~1@{T5jXe0ZBRk&suB!!!qQW8VO;HpSli(nw!
ztC2Ufa9!&YQ2KS~o;^GEb-Hx4KWg_(iMEBh#GQ_u8s+=K>mGEH90Fz9W;AnJ>PS91
zEw+T+H?6rZofLn_kCd{xDZY?ek(#L;8OZuZ%xk@Cso)#FLJVeHJ45s(*iL<OeOT8^
zq_K-X@UNeK;9VBA>U8$}%$QbX!_>rGgEyzI;kfqd#U1IrgzP@h&(gGrFwtMo@tb3L
zUQOyH#YGp}e&+nqsU$c3E!aqWGVP`{11p`#r>%q50Xn&A^HXaHcWDy^`5&^(Z4z|6
za+>r7Hp-<uQ9^sxONXS^{@-L<&uXe8I@%N3LL_{cH;3(#b%#dpyW1OvsXPlOV}w3E
zWY`Xh4y4?W_PywaOz_>X5MOGI80WSLGk3N)XGwXl)Z>2hVnz`E`cj!>vFii(TXf#H
z)_-PeEAJW%C~m|&=NF9`h;T=P7i%`uh232#SA@X`xgT0Wa*R_|ceHolr%P4741^B3
zbJ5j%cg%33e0$IVU&_lGRv86%PI)z<>SeSzQkoEF_dZ)ctqx<FQ;icte`bN6`0bJ5
z7G?kus=1;Kmk*I<z4Yt*_p0^AAMa2B&jn_A13E$__57pX0VbGzjgMFlIoh0~N%q49
z<PNt7t<ZM!FtQD-R&NcnMq3_|kNjuv;AtZ8hzJ1&Hnzp^tA}XV5QT=O9M#T_ctob-
z+~fLwgQvgB@{okQw1DaXvBH~BUSvnO37&R|`FH;<Jw{JSvEZ}b_vv+zi#ME*g^=GE
z+DHN_1P9r~(%Tcc=E<Bq4%~dBXcIJ703jd+z`@9937ue800$$<<|aS-Dho7VBfY+(
zZ<(@C*>fI{JyJd~Z<0M8pW{a@qL4SZ`KvrmJ23ttd)&Sr+GiWQ_z>la285=7m42uW
znbzSB!W0j6B?W5Xq2dmY?=GV3$!wj;bS8M1y*rBji>;Ro{%T4%6C=U|2hnFlX<@^S
z)!4oy(B)rad`dZrc%OjM8bRyf9GO(3IX010LB9A496flbx+v{|yH@~?s|gLW-mvc>
z(wO2Lzb(?-EXO!3qA$`!rUEXQj2Ga7X}3H6z_SLR9gkhG4c~dd1;hAd>!|!7+dFrl
zq#gKv;2~g-D0eOU-y~#j8w%_}TVE8%oWsWO#{?_+Yl2a5HQ1nxza|)(s{)6pSVEyV
z6JTD1J#BsyT*7F16ni;p!<2hk<}rgn7*j$bn+M%ThmfaD^!m(Rvm}p}=a7{LeyrXM
zzp%~$ME7lhSY%+x(*y)nGd)KYQjQ&wKtk#J0G++4ZM5g7AMuoDD3%{b%#5NQwWi5v
zMgqKv&XRoNx;DKDmc{`M1&2ZG`&p?~qb-33XOb6v`MpP=XF?oMrW>)kCMeSZXp=jG
z15qA8!TckkkC#zx01Ae~CTv9i8wI0;X&s|ru)04c*h5BCE;bb~!Aj*Az+>=#OfXWC
zvo|APf~Ea6!AQP;O|abas84rb^7e?FerP2Q=4}US^5N=C&A4vD=I%(pf<x%war^E`
zg`#w|57BK{_;WlIy32gJ6Rpb5ofnEuz|pVcAl?yZWpS=}cAqDUsN{z}@J(b|yU!uT
zhZv4lH{;aoME78hg5ZoWId&B52wY?oeRV9E;VY42GdUpwlF-kJE`n$}LiUMl9uNIY
z@eoaWh~Gonya+TOZSF4|Ob<gRbdkf02x-DtAL1byKw^M&L;9rkCMHUc@a&M}Gp$Qg
zkAqmtu<C3)(P8v!!XfIOzysVF?1>CGYs5T-Ez;~ZeL}uI0D_@29&IFWls^SPFpifH
ztoJbpc7^c|2<CpHpglr83gYs!5c%}+F$hL{U`i<jKrlxx=*{wD5X{RY4*<bh&gUM3
zVB}<Wfvn$-kSa9&b4P@iYQi%%Xvrt^S}JEvm2blj-=+(Gu?~J6&;5EnW&8RZae|`I
zJsZye6fFNj{5*x#VF|aqN3835g=EYLOd}SGc?qTDI58p*-RbrT5g3QO)-H5+E%Lk*
zB;y2Y@E;Vc>n{q1@%xlkLO+{8p93*9w$;Pr|8jRV*|68kDQ&Nf`fGw&{WZbR-1~Qe
zv_NGEqyj}Px-xG@zy!+xOfYi#bw*h8oy5m>r3HUXuoGsvvHj@!)PM|ZE?|On+>AXL
zg+`d?PRTnT_D5hDUmT*n_MchA5&}A+%1r`8Gauy#pAJ}f7!ZPfZO{?$m=U$k{#bN5
zJ9ze`P{;G<M22<J13ilHCWS_CBanXl)wQ~#SBw|a|BZrSqPX;OMY<dZYSBG1Z^iGv
z)gmKMXWs@2&^5QE4vnXu6svk{onR4F1h`;_7otr2OLeVZ!E+S0WnOSrTeecdVXb8s
zb*e%7xdO|~AyH@+3A)KN^fQ}8FV^ye6hzaFJa%rP7RcL+6siZDM$2eHU$*6rr_a$)
z_y80__u`CCB0PbPwhbZw;F0OZy{srsUokoqM<DYOij@P!o)TD33M|%3(vl}4thu_z
z(d+H#t9RdwnI}8V)@_@Wz8gh-34<nbpctbn>?VpGqM?d~Z_jhVbkId^uUMLJTqe=z
z$gX=kbZm<3uv@dj?cPWAP5o7npo+j~mIFLw#hpQmq!5vc;(YELfQgQcCe!wi&7<my
zBN)x~-o5j#akPhYUIV(peKNWIiTb&j=6U++<%Z`<B2#mIfpm){^4E!3^`N>6{W`Yt
zig}*~OJgo*CF+IkBeE}Nb9(UGu3%+&h?-6a@<GUlgY5nZG-TPNFwCb-hB*4F!O|jB
z^;v}`J2Wx{HH(Mpxzj;r{Q?rubUCH86YO3&=n8V)t^`M7N+Ipr0(^M8b2PdV2hr)r
zZ4wIAx#$DT$w5u!_GCnzI&yv#y1WQ;kAz*EFEk}{M)x3+FlE*H2y8-;miv?X8n$Aw
z$d;&zz{w+&s52}ly$cY*a_ZThVmq{mzV-snS{vnugu=r`l($p2BU|0O`WDvm3iB?u
zOM~#*@bbSR7%eT^1qqJkiSWl95y7Srat|YJ_f*7~_5^uUI@GZpvLk&sq3wD!_K~nF
zuU=Wv_tB<cww*D7s(ssv9Jr1Oh5^)1`aAm@TsLmA{4nT;8uFdgrvcCQJ->k8-$*<p
zpujma!;)OzM$v0JiIoY6=NL5S6lxuBzm5+BZ{}}04<a1;#Y-^yIfI|eG4XzJYW6Hr
zhC@3%ET3dNW+fS)%6Ra@m0Kh{U>1yeq8@{OgW9pfC`QybN6r<@u)u31H3!E5`Dj?z
z<>QUmk7gww&3ivuu7145Fk&q=Vrw{J=Q469cEqt{<ZkbX%j$?5!zT}^PxlNz-FNx)
z5a=K+`Q+RC$$$0JV}{W{snKA=(NLGs@YvDFlF{hi(b(0|c!seAsj(-9W63UK&tk_?
zOUBZB$1+#PvKhv6q{j0M#|vD>pT~~BC>ej%J6^InUdAv{E;aGmaN>>2L{;oWP02)E
z??l7u#5;!nfL;GTf?dD<PX)WyH&CceM(IsvqfJ(~P4@Ur&azGJzD?fsO@7ptfb^D-
z(UyqYmT3Hzc-fXj-<H(+mNaS`=ny??w0+KP`$GJ-eA%`_-?q~FwhC%TReDF=Xh+j+
zM>~E;w`@nhZ^zJR;XfeQ{{{$VJ{EU#J<iZRUeAwEnMDX6CERjMxa5~u6O)*+k$7e7
z$!(XU%ehHW?$2(7J*%2{=D3++QIr}#k?QP~W*(Z>l$>7ZopCEVqc$wl+BeI#B<sm!
zmfcj=z0E8;O7^_~;+-ktgYulGTe)|G^6w_)H)iIOrt|&Y7N&0(dWJpsc>27J@*My9
zxqn&_IqHR1?Tf7K7Y}A%hQt;7>=gT@mGsV)L?x8^H<sq+mc4&Mdc05`n_LmpQc<{5
z5t33Fwov(`?ahmfw^7A!JHNk;UZ_f0u1e0XjwRN_b=Q=9sm&;>8`!OTl3)KH5bQr7
z*#B)HnB%OFkqT>MFhhY)VXYZTc2BUMO`zyV0DVDv2a})-@;sZU2ugHfWDuYix-2OG
zu{P!g?-F0>q=n!#)pja#bZ?Yj4O&(&cM#}j6dTU{T9xvh@)EmNkIR!jGnuxcv&Z8>
z(InGyGnKb7&C}s;RtktP2%S5SRP($(n0%2!p-zyqn-oBc2TIbdwIq&3GL{O+8T^|D
z3$M)oU(jIScYkOwV05xEd`yFxN}@@xh5;Ik_i=G#*;koF(kb>k^_$Hu*g@w8YACP^
z-dMZ=R^G#^(OwAr7HBxch05>iQlblC5dNGyS@aGpo>wW5d6N1YqxwM$gYY2N(KnP5
zp_oaZdyDTQ>g5)B$Vg>F78x(sJ=YQ|-R1Q%UfM3nL|>(AxLH8C#Ub&n%AI?(oqQM6
z0S_p-cn+zaCIjwOXF2%R#|TaoG)94)x+CzD5NikgrM;HB@EGbnQM`JKPyv334N{D^
z`!-#-*-g!%v_|zc-~fM>PQw{43(4)l&Y|T_{Q!N9>mz{L=1{@{SJzSN)6IsD@e-8R
z+W5Ags3R^Yk_wu8at)uP%=aGaCrMyQb})Ox6^b&{=to?4XH^c$55>sO`n{r?wd~Mn
zToTam7VxGL=DA!KGz>QG+C$Oq1jh0~RC$lg0#yRo!8$U{{LOh(a!0#&>aCinu`b3m
zYcIo#*~RkA1Y~Bhc+KED-{QH?)msBo9!Z~JK{$<{0IdyN%wH_ezs1314>Cvuy`lIm
z-+Ow-{RjAQL_*Bj%5l1|%{n&sfq=bjn#l~3wg-zI*H^R^H#r9hno?!2KYN`@oe0(O
ziaNQrl%!al6BiIcop9(*Bd)Vqi}-2Fnj8^&Q8rN3$GIPoM$pD&kklB*FQ2-EMl-^<
zY6B}7vA>*j=nz{ftX2d3dlBz>3#(dQAvC<f3O4W^kNWvg%KhGxSsMXM@oa_?X#GSO
z$!Y(2j>x@KP=yf4{7bxz+FVpG?HAq*GqmG3>qi0vZ65CXM{SO^+fmJDL$ETMDl(?h
zk3U3l3so<c;P*eP1njgo6w2#HdW3R!C$cF0+7!ELX3X<50#i_Jf^eJK%6FZ$#2aG-
zEJ1gnzG$6O(5rHx^!G3wv`w@RYJ=_+<w5atR%cgfTG8~ee4yMy#wTCnjY5dt^{+%y
z3%_^Y1a<q~`0Z#sB(JhJcJjI6>hk(m&3EV2)EKtrV0b4+ZN#}V*|>$}vv?8BQ%>Fd
zx7C(j+jo_qWo02?i4`mrBwjZWn)f;pru1{OC=g5F7GO=8){7eKD%CW+zeA&}j!`)W
zcYv}<br?do)XW=-*?!7sz>)bQX!`q@=54mi&&>=Sk4}AiaY(v}-WeEoG;~$o0zG{j
zr(N;!t5jweE?w><6~-g!sTTn&Rc?%vnJi&^C@W)n*PpRH2VtC97+b0=vm<$*K&07m
z7zy0j6m59R#y7R|N@c#XIY2KWKzKu&YWsk#O^=%YkhSA^sofa(i6)P_T2sH37$&$j
zI7C2>C_@zzMDnEO2YIsZ|4eAX(j)laJ^6TcLBYI0u<tGEeTi%mJF(V@E#>kfs_^??
ztwFQ4tYNjm8Mk9*KiX9B?}@R{7FM-I7806&M%b1UB6{eLymJAP@OxNb+4AytZ>N+O
zYg{`)XO^f<g;S<!f6zVCUOq`~qfQR|q{wz3+kAwka1`S;B;)le109je+JS9PwLs7u
zlh07JfI205M%<}&`fGXQfk*wsVKj>@MwQcjQ7H(tf_(fauoV1zn62hzn=q-l?WcvL
zfjD)MFm{B?2ys>A;mJ79M=xh|e%}dnm@^XY2ZxUrS%)~$F`fRfkVJJ=`%zC4<c$IU
z<FTG^-@eVlr8`v7!<3V|@&o+InEXW9XN-@CQ4Rqs9im;v`nZA*m<<v5C*+xv!QR|c
z^iAy|3o$+JsQD?VZdL7SuWRs<`V5%L`!!7*?>UwztTus0IF1PQz<;JtURz$eo}ngg
z@=Vl2xVo(@X^4t<7N0g6#9Rr2-6~RN7(1dPlmz5P@;US(n5rTbC*N$QaXS`*D}ofd
zHWaC#Ic%d#@}cT?w{y80#N}v=>E?3=!3jh*5))cK{?hlC7wqVyIv$PKx!2Q71+rLA
zi4T-q+O41|SV3M+8T<5MH=o#mb#kklTs&m<q5r(*-FG1KNcTtM!S8iEs-8k)wAaji
zxDjDgKgZs;*W@)Q6#lxS3Yr_=WqycBcpkAJJ+t@0$bq%{9(d*~Q%DcjZ4RbO9SsIA
zKTvI&zivu`2Saxr^-WAG{gz`9|HAnrh6EQtT<iEsQ=#{z5zDN7HsXoc<zFm<GdHT@
z8+}I)z`)ut%e0<QUofT&dsVLRkPJKG&~Xnbm!HLMcn6XLP$*FX=Hp??o!_1Z{>2_I
zREzl|JalQoX!S>R_sAk1U;Je>FG>@kw{47J<&XIuKqQFB@(pm#34uwnLYJUF#}cpN
zyyV7rH7PV)il{E}R9b+jU<`J?KP-IMuS2ur8;Awx;}yPcsL2}B2}MZO<{cwr`=aQB
zXZkL91r-1p!z)aC28-yNPR1x2<vm^xI!4B7K2h&nQ9_y`j1vQI{zb-`rGfuAJKOX}
zPfjQ0Uzf;7!t#P7y;bfH|AUMnu7zFCgG#(r+ZhTz#936^NLDvX4{e`%prc#8C3)oG
z>c1DlDr91G^d7DdY7Ho3_3Ait@5p{Y8AB`8tD~&NbOea>42d!iiHJTlSS3W$`<ga%
zIOx8xs7pV_Yfm!Io2I~9YpB`6Zz=qM-Ci0d*+)UWF^#IetkjwtaS$%a{hePM7yYnb
zN0t(^9Tqt}`j0cVeN|g}2TTY9fAyltCV__r!P9V&-?$Klxu~g1@E~4ck=ed+Lv2nc
z?hq}O29m7XJ5`@2D}cUoNev}Tpq`bBOT$Z4c*f9mM8H}kv?+8_#!4DXbgBgECpTg_
zQh6H5O0q-=X^j)o7?q#syV_WB7G34$Il9L|0^n<pP}jt&&q{IFBnSh0Sp9-pN7V$X
za5bw!Gl;HAzDy$Lb)WJ%6s;M$lLH(8C}V;ef0ePVCka<;c#<!mr9*B)6MQs;ZX!Gq
zxJA$wx;~ZE{_xXJ*_zzm+(>qg<S`q2>hAbJ_d$Y(*|P^e{{q1fqSTkQvsf{M_y-lu
z%KI7~pe^-{&o@6atN3$Z-V8rWe8K<N2Wi5t@)sEs1CX))lw)L!l(I;+_=}7^sYyFV
z#x~MOoaq(v>6K>bZ}-!ZjrEFa(wAq`s(|<xXGWR0VnSznn>b%{YDSlMx(^8R-Y28K
zhL?az1CX&11btbgNq1^SzkB8+D80ASY~V;fYkW3Mf(^2?pJq-<oj|0g;nH33Sz;Sm
zlp3dbpX>qaECEdV_*hn%+39z>kR8r+fEeqG%!b$U{6wVBkg|vyY5x#oc+F#CtRKeq
zGwrW17VzJMv2t<ZYsWOfr^HifJan|_fG{TZ2w0O+I~K+Wsemx11PEgrX+FlVSGYhW
zW5gsD9Ahjcevw!nsb>2l_i`<_L9I>280_4mymEJBI0>3sQ{dwc!Jf>w+W-QFX%bsR
zL%sBSas{q>JY|jr<&gztK6zzh1-4G9R(jyFRQV(M-1~ocG180Na!$I`;SjglqWUAo
zJd*D7^R?L)Ukg<K`eMeXiN-2rHDGhV7sF>B`(nmLm-Hmpn~PqK7afQ{kAHb(hIqZK
z6K)0gV%W@4D9jG<#f+_weKCL+BNdj(D@WD7?6}GOvlB~3<cDyj56Yy^pi9Q~i-~|O
zhRtqEE1rDBUHZos>*dNnbWEMS`EqeXt$n=Y+gC1anc@lEl7&Y_KK-S;dfc;-smkrh
zXPn^d7pdP!Dc^8u|7DBqry2biCzX|}fX<}6<V;}<O3|!I(GtgO1(Pi1Q;-Mc814!|
zg$iNwiW9y-+`ZytU4`UC#i@e|8Sd9-6kf}kzdnED`&usj^~Ji^iW9Gu4_;%rE7cS#
zHGCPxhYbMO)!`wA_hAY+S1c^GJiH0`kP;kJx%s;Cu)i{!2@|IJhRWtmYuKBNf;Se?
zDVh^Jr8T5vLMrHXDtN1msv<SBCfni~2UG%+i%^j!zXA`wRi>$;609l>t-=>n<;jZ$
z_@=q8+zDDqjZJ;qGn>Bcl>ShkBgwqxjZaNbLQR@NdWJ+z+iXoXU3v~TN4|OOky&+$
z#EX{_>CYu<Tc||J=<13mYTw+gyR}kVlb%*3QP(z5N8*IM(BoJ?S>Iw-ALLQrp<hpq
z<{65tUnFo09;8K>Gz=Zow<pvV)Ip{6IGm2iS<NdAVT_G~`i<k}Jd+1C<p=C5-Hq>}
zYwOeNR?{1cqw2p;u&=+W*{@?iFt7Q2_g(eoy9F-tBULh#=N&$feCS99TX2_yXv;|j
zZ&u!3smt!~uVZtrUL-Wt)HR_bd8FnFrVhY#m8JMUs+jPvntl@W#H49xPV-N4GhcCy
zG*62dPjhXKd#hIFf*#4_Cp$}fb6R?t`XsxiWaC0qtD+=_pl!;%Gw-h|il+OtbnB9?
z)xWoxJO;sT(YLO?c#pGav-fLrs6Sy-pLsi@%~eqhfW;JkwVtCYck^qfFoUHeGXPlZ
za?CLZ7W5Yu!!|Vou-Fj@fj-|6_p8Irq9eRGBdVu^@U88nM*GFhI6xMQh-r9pH%*$<
z_Qo-7gSM+Eqw6D`gceVR$-}OfJlz$=HN`!xRr_79zcnYLv%chZUa+>z&gf32V-REM
zc^#>yihti+-_zrq-cRoCqOS$nboW~He*D$b%GUe#Rr`oyS*u@VqXF~IP}P)0O<m6`
zU;6YSL`$2+hqa9E*80>JvgzfRG;>1FdPZL}PhWv!&v)n4z2d&^{azZb50V~=tCIaq
z%Ww0FKZrvZ#*6!zVjEm1nx%jBGiMIGuo&R;8<0j1a9O6eZh`MP_n%Nz$>$lY+V6eO
zMAtz-c#?OhMY7B12ul)|8j`at?Z*zC&m1BnB%m&XVzXvN%R}!XLq8^}AzX$HN;23p
zhe?yemsf{L;Ez`<yEMgzr3M6LriS?}hHvnWB>hUWlp3+OEWYhOQr?+&bBc++c*LFe
zlcy4pZtr#JWpcCp^r+#J-_$4ORr14LMxWJB`+rEWu2g805-n+rE(##UHfjM<Y*ic)
zWl6ItPn+UD@((G79W?-k?j?-DQsX0kNiqCrr{f<|43z#4DMrb@LmDdwNHO=quD_&M
ze-=QBHQc4HVaTYHs{c1Bh98#$hVikC&t0av0aEO!ACxnd#UL|LE>By%n%!rZp0JuN
zV>~(GGg$+eV&sXc)ai!1GsmVFWo(jna5Qs@t$gaYQunbbCX;?_ic!Y@A;r+?pQX~j
zG)$8A>FXFK{~^WDvx~TyvcIHQ|LCmJT;fLBUs9}mY?`DyhY3ImTcvLRq!?)OFDX|3
zmlQ*%ACqF_(K7Lw9hY>$0Aw?99w5aclxSrDQj9dc*gq$IX%-;G`WeyzQjA`iLi>9L
zbcqq{`sIb>j2b!n-=r9N@h>SxlAm4hpC)y}hI+?WEdP*VNB>Jx43r)O0*N<Lv49r-
znqt3rr`G<MVjq8}0j8MTzf7?jz!Z~NlH5o$M6Up(*sn~gN7JDD|02Z*A86imF2y02
z69G~Tl>Yx9#WpgVH<oig%p8+qghg(2IzWmg^?tciN_ISCyc@SRDuDoD7Rmrp%zdsf
z02%g|6vM2REiaPHW=Q}k=DyMl0=fMm#e}l{O^UsUTYrX32S~B9F}iJ~)qhAaQ2Lou
zU+B@ZeZ(cXfF*zw`?9tf0gz%x7z9N6*c5AFK++t2StL!HZG7dG*%UvOj^f{BzBTm$
zxjN{&%0bykTie7)Z=DBBv5iclKc?8)seXsXHO7H8^Z5ERw?3Bvq!=b0AjL?LRP_Ce
z^Sm4Q!!dvqi~7BEOp0OCZ@6uir>;cwf?cw=IEkZ;m$nKT*Z(2Ku)C-E*2@qR;(Z%R
zw>AJ$414NFOz$x%CWA~ju$m?ymy`JCtPj(4kJ1L#HfR2jVnIfGAk2^5fbRe)W}V$<
zx&9qRwOf;2S5rE>NZP1K-6SnfxEjrRl+AGW|Ki4uaT9l6*Zk0Q-y9p;pZrUT0pC9h
z<riRzm6>hb{bPz1sHAWFPUC$1^$sXK{_rbi`gg}EdMFaa>t2|HN)L0PK189-J}|WQ
zTT`&yNTi;ehpSr4Jql=e41#Zl#qg3NjonF<ra;k)LBeK(^SVjm*Gg}X4KC=XoKz3l
zxH0s_Fhl<S+Wgqiq7hLw6e)6Zc*!JRH~Ey^`0(<TB9j7eCg;%CYsF@7TrK5k@xqBr
zf`nFg3I!5M%}v29-ydl@3rb920fTOIGH~dzarzKKsradjGe5(Kk-8jc9V>7@6<#Ju
zhL1i2iq)}>Xa<c&(Cu0<g4}34sVx^U__LDRL9OLDA_m03k4!o;eZFB$5bepbbw<yJ
zFj$15M6LW*dR}xUOW&EE+`qRpP+;`@ROL&LZ)0!n@`E;U$-NDa{N-=ZfatA>(LBy%
z@TbW@E7sY$2WzQd`sR>pr(?T8p(crpt;vDza+HQ)*vUC;2ka{pKZ^WH!RuGQXi?zc
zA{Vd|Bte+qq%+^_k`Nr;UosG5WIO7*VtG9HD#Q^NbWeCQP`xZfZi$M%I`Xs#HKU?v
zbXkQQQ6U`jl0lPJ%2|i8`vaDUryw7pt5z$9J@uavUajfNw6NSWIMXe=ZSYc!;%Rt(
zf~N=p+9R%j;H>CH9)3*B>ZLcBVF_g=W}X5nI6rzR<H(Q??+%jh(>(!(bIQSGLBdL6
z)OAQO%@q)OkAmUYfh=OS6&1v<f&d=|dmw}F$6tii-ll?!P&Sx!1Tu(?pI~@GXcAxS
z4$obT6eVU%%=pZQ2)XY&JRYVz#He_OXmViF<nV)uxq6LlbN3e3hZdgQ{%aRqhpw?p
zFv8H_#$b1OlOZ$jH!q+0sOp8OCx$Reow&PpbD5g!#-q0B;4DUtd@HWuVb*ZfH0X5F
zFT0e!WbhjM=RlTnB0lsJtIvE={kb0i2zK4a?&%BlXSY*q3#9}=#tCE9X2RA~czst_
z<{`RAyFL#04PEyg{(xXlZ=Lw*=wi~z?sQb_E<>c&EE>7Y6!2#ErhZ;3o3C?4_jv{R
z=kKojy1bouaNu&GMcLQ2cIB<_TIKABuUq56?u1LtI-8$+Gab!^^>@sR!GSOi^el#v
z%c0)nz6hZ{u+;h|zS&F40dG^yafht%>X;S#{+AWoDE=>2ta<iq8rE9?dS>r}$4lx9
ze%^D@7pzXU2Cg5_Q=>sxa6DQD1lk(0#0F9!Ep!8?u#a$f^(s3Gz6a$r2U?UOI|Wn0
zj4{`BXv9FE26vA}(5-!UO!K`*O)54B`E?ND^7K&1Lq*65<3PGr-7VUV3!3zxM;L39
z?;7VD37HV8DFvOQGX^5cTRE+YUtf12E+)U>I@ibAN6;wdu?@Tp|4d&xI-~R80SLsW
z!E;^=PZhF@&E_QpstemNu6)5_UUqYF<H%qxcd%=vE0}@M`bI8^o>7iS#ppdLFDTa(
zeAQTF60OS2i6cmAQ0Vzhu@L76NNXI9imrbE8<G$xuScQ3V{EG<jNzi!lcZ*F$3mt*
zMl(b`XIF^9LWE_a0wXYB6&5v!&BqX!7#S?j1Lrp*;~6rnsp4P5xY-F*-sc3s3>|#o
z_Nr8(Ozt5V&QQpgJ-lh=Z8jP?^1B|}7s1|eQ<||E&?7Ago<`3&Bz#8R9fOAnpN^0{
zZF8>V$fvhlz$9%V7yFzIugtzIeyyAlc4nEyP+E^5Y-50kMsD;{WvD|w=QD$=6X<Vx
zxPii#L%|>bhNH)W&x6P^yvBG#dSOCEF0-_XaNsTillz(sI)q^&0*CE_CP#5+E@AN0
zd(4?4s@HZw#-Od$z8rdvm{+uT{Pi_Y5FMFctD73c#I&LV;>EHXp6N5XzoCP|eI&qe
zc+~9`B0pDXSw|I!3RDSte6a)USKXU}U`#h(aJtc*Z&>_xIo&y;L!{Y}`c@MT#JPcn
z7N3ryCT>Ts<Y(z|$l$+6<lWhxj5$ZT5sm^;z~@fl^J@{g_b5Rq$hjgarblr{p=#Gb
zqM&wm<&fYgE)X>bR-_W+bj5XJON!WpmDcb@Ue6^6=iHP4S;^v!&*8b}@GSIS2}(L~
zW$ermXm8r{-GR<Q&u;wU)#Wh8qq2fg46IE>^YTiN{5Gn34ZLlI=%f`B9RR9+lW945
zrsUDJ`p+Wkp5&jFr|ht~bfmy@79lNEGQ<}gOH1;UlQ-^PCY6fIs~)hBgP41n%cq>d
z)E0G3-!g531#G`zc_^l#PJN9_+!1z+bxnx|lw1Ne*1b52R*(TiCG&>f1~_h+FW&{#
z+jYy&fdgGfOsZrwXA&P|&zr#>}6{OF=-uP~j*Jj2;hy_5m$m813a2Fx&3idmwf
z32VbLt(#AYpPeN8Lj9GI%Zv^;#fL6pIlwM2p=uY=x*VW)I3BpdmBdh3zb;jC${k)_
z4E`ddk_tsRyK|nS9H!3JOh_jAoVXWPYmpL6JwP%%Xz!M!$4L@7LD~BTSOPkU;Y1Py
zChU?DIIIdnR=>K#<|j;J`qPNat8+#f4~o3rDLgajstalAzM$n<I8>q^-Y!aiHv?1%
z7U}%p*R|ksO}@L^{=w_t<#xAi7dg)-LrP+V?a!b9Gv#gDS%)|FwKw~P=P<AQ5evZ=
zg}MMz4CdzVPAFdOtLy6+`uz3GQt0%^xz`)4Ht#xL`JAg&KZ<T%IyS`?cXO-ZROG^U
zbIat!{?ojeB<vSm<?CNA^JH0n7m;g?J-OlekY@QyUCI39J&2d`^|=MFP>+257$dYB
zV>@TqiV_v>;<(G@x3B#Vw@cN07h9J@K^%lY1S_s)6xI)#hvVI9fmd2Ad(Es8PcvLD
zJc%ZQX~9Ehd+t#&$uW`Wm9NQj5f!0gcxo{so^C_H_kbGINJ9a^#RNIEoyfmJ{E#~G
zIBM$KUImjJlgm`hml>9@5E$`Zm_q#!yV4*;lF(q5vH`$gF47+e4fGZuswG*Y0#%k2
zxEIA1j*XmT$4OV(fMCz=Jp8Oo2CJFjYS%K4y7$tImytN!)Yx2XM|f#T7PaMmH-Bz_
zd|&b%4T{bfbKp7Q5>EOUH4t}oD-2~ELIuakFwWckxQHL5+A9>EOCj%|K)KQHhGFiU
zyHvH_F#qu*9{cn71=z-@oI>KTOyWcEJMQ$*x-Pz))31e2v%<wdl0IPw8PL8D-lDrQ
z?6d55u28d0Y57^$vI2;n%!k|zTvo@k)k#@-GN=Mv8q4Xf(+Hg$kkx6XTOQfPHF)53
z01+y+8DoO0C6psx@5+Pd(x6Z@=!viLd0pi%zG`ATe2cctC6q8TY-oZI!qq)gvX$1I
z9BR_>)TcS{1t&m?h4QzAJ}OT<;y;VHYg!#>-0})A#W2b#DWP*|DJ8)i!5&aK;Yh0v
zQATfIQ|Q<fi#ayMLg+o!Rpy^ugr5=5YnJk87OU4VXyrba(<-ii;ZjfHZTOiIAtX&l
z*8YLUsq$6>3(e~WY2q61t6qTlg5R%_!jjJ-0a7e3M|0Kq{dE8YlYMq$UeiWW%XXOS
z7QL38h1OZlHd{X}hZrqaT`l`!t-Bd<$D|nH7zA^(cy>&RRcm=lw!8fy#oR2kA2_#v
z>j*~UA@?%0A3>hDPl6xzX!}pLKZAo^ina0dI*WwxRAcP`MV*lOc6WLzA2a}hbriwd
z+3{f^#~|2F8~dJi#H3D~0j-xGRdBry0D@h$=<xWalVs3IB+z)#2TFAWo8n>ryC9ge
z-gCdM^x_byl*lJnbzjx%Wtw)Rj{XY-qt`Fz(XWuyf32urX`uh+zky&i8Tz%w`gQf)
z6*16a00b*W_(VW;<bv2a44NekS`-Zc5bV7L@C2q}soE?I+UWyXBMiFh4SISEdM6D&
zO!kx%_k0lU=@bs^moywwG#u9G?NjU>Ffjad+u$6by)naZT=rRL5A~~!b~JFj-0nn!
zI**EFI<M~-Qd((eivbYqgXEL2R5&=L-*B2<Yp&JsmE4EfUpil75Gz+Nt$q7YYV!f@
z{^2S9gHuRIYR9E#{f1-oTHEwgJ3M`<rbg=-Mn7c*eL6ZYM4e=e(OrnqW=P*uvDVSI
z_SA?E#~|1>;=wP&--?LGieT#1zL*T1rxYWq%zl_5g3izwxoX^!5bm7cpE!ES)1se!
zR4YlQ6JDaltU2(+*aQ`8!pX`rN8cHU8SpF~U@y>nG;H#OJiy6tS-_5qUx^0OYx0f9
zgs-H1`RZj4p37pfg9QTvLYeKm8htNfw8QH!6FM&MCmn-eNsdNS#a-bRI-8UIM|h2)
zK;tW?{jbPDpY783$L;jR<X?%X90JE4gJ7}<?FNHRC~G^be}`(QvC1(BHk^U$WGCrq
z+Z}^oDlQ$bDzEDO2L${72m~{)EitcaFt6`5Z<sP~Ts439+nmf`(Zp-fEM?K6WYKD9
z@!ry+&BdbK-=ZVdqBGN?tHh$a!J-EktW8Zy{|giQz&qs$U}7Z1F(zg@^%20tNQfa3
z%Q05w{|OU2(vl0+!Uli*Z<^ScrPZ=G&Bs5Q*u-B=3~dQ$VpD)7=4~ZOw)(;_vw(q&
zC_#@gu_DAjm>6k#>bJ$n8^~tK%sl4SF(%e=3&6y-?JWO|iFr@|cykLHKx<}d31DKN
z-SFQ~%C8ax`~y_U)RJl~@)#4Vjzk_(vX3#b@U*{}*b)U=I_ZtJ`Y%k3)@thTFDBM8
zGqj5M$N)_@rQw0m0+<*VfQgw-S(r`*I9PZ6gNX&F!Na)Yf`-1sc9NlUzY)in7%B1!
z`ZJLNIl73Rf}N+fEuy*DPc2qB320)}=Yxkb!x!zQcK)S_P5wrBnohYFMNau!{?)|P
z{%B(V9TOA!i-{ReOIXco1<dPY&C9V_n2cKf#l*CfaU%dGR)qMAiH-C^vLkK*nApcy
zI~5QPz{CVk%?JUQ7>MHQZu5B0ZiL~BwUwpDsfEUCb|7S^P}@S<A584$n@GL@9OwbH
zJq2;y;nriZI~NF)iH0yU02AY|S0l~a0GQb5th<gqfQkK%1wUw<dT2G}9cSmbHgV){
zCwXG}-<TM2)`wtyG*v+HnvV1)&rSiF82q!$()>q}aO+Z<?*Q`!XkuhLzcre;T?Zl1
z@<-O?z+LkRC=SrXw(kdjZkRoVwo+NLrhRLZB{w7V2NSb(y(OvR<i=s2F7_o+*-`t!
zT;3(80{gEiPnUrfZqJToZW!(u6En3Lfqu<&nEM!N`?!DB>&tEXy*nZfPKoColOEW-
z*`;~=VC7ZYS8f0kqkJuGv^>Vda5Eo8?q-tjBm$V2spUmE8vqj%3|L7hw62N!>SyJ=
zbKkk+%T)c^1b~V4BVGQ%#Fm@@OiU5L#Nex18<DrJgPBVs0ZgndZlNRWF4w8gM>QW7
zsouKmym$Gq=G^=*O)TtRnwYtjr7+s2pgMf)679-~wbq8PkJo~->_bQ1hD;R%J7Jus
zW9?TjxusLq-kq8;Mz3sNciZQq?AlL>!NX+ir%q?B@4Q`ZJ9GoNIh#&9jA#b&e{q8>
zA}--(AeY=}K1BkU7)`c2ZJ9gWJ9ql*r~pcMIwf3m4S_6+^hGbD*CQFiH<&&}GWWTY
zMP{^4z=W{t85A0!2*_hNl&91q8%uqbjL5zo^l3U$21}jc9S*zWQTNf>`Oq%#OXL-f
zJ7>vY&!uqDnN7Yb#Ho>B+}?u6NTfhJLWSTgTxA|$3_g<F2=~VZd7TeCwXv3~9D0fv
zEEW+iL%1dE{q5op8c+D$3xo}SN{ARK<W%)m8pTGXdeLI(mWs}d&k}fnA@~$AM2r&R
zFB2w$4EBw<CqfDF!$3rqz+8=+VktYPRm{0ZU>xs41C}h!utA@c?Jq<?xZKvn$U){Q
z-|gDKW=mj+#!#**Yc>Am-Gva*FCHtg9*;?u`bCT87@CP>sGsW^OgU62AlzLhNJH)m
zPV9Tdf~)@Cf^P~;XagV;o$_2A>qa(ZOjo#WIiHoeCFD(`L~s^?@21JXKA!{sJomsV
zU`ob&<y!b>nRq9)BE$vbpeuNs75uYi+XGi=^CL-PurS_Ma)kO)_1-;cCyQG@yy8Qm
z&j&{@hIpIKq!s;02l^Zd?hk*^$dcw%cYlb9?eFmJ-ERAG9<_hBXi=wn@2me_d9NE+
zDb3Bb=^Gb<P}ANIsyuY=z%F8g{WtFG!$0FhZO-DL@BkMTEZ9#QXbk*pZfY+C54$~$
zb7A-L?6<zu5h}LilZ~2CeY%=PfbO0PzAyKXS?gyUKkg&+zIN%N44m5cdFau{;M^?O
z?(c<9fOmKyNK4G=mgrab+v)8ouevbY%}bkaFPJl)ipp(_Tp5Y%t%~ep|D6u^?`w}_
z?eqJ1%YVep|I=gt(Rlwcm5G3U8b30P4}s?BAuc>{FU+kY%poGoPAu$}SePCB(76LP
z!w-MxPUBPU@4vS(7H;lO2)_pkn0pMpvH{WN2vIhrK0^tT@D38z2@;Sy+IklxK>?q_
zP@gfSRwM^2F9oZbLbTl>2GvKJ8;8mfN9RBh=Wchn&w7gJCJNAo3;TG6(xsmBhRHYI
z{+e83Gf<IvFT9VxgCMA#DCxK*+?90lMuqe8mPk*^nLC5Uj@u{x-yqoK?7c~V|LRT>
z)%G88_h}|{rzx{2S^g?W$W!py+gR2gH{w_JUHjl4{r1}@iJ~|*LlN6^h!N#zN&B9*
zHQT}e83fxqJx|_B8;=?f?@1Og>Y#YcFMlkv<5@_KHMo*pe{U?e=}nB;**kq@QFiw}
z^~tVH);`=`TRph2L1_-}%dq&yTKM96jo0q*59v*!zIb|~9!wxrImQ0*Yu?`qdmD4@
zPo&)re|h^YK5g&}3GYUKi8J_}`v58PDF5fA-N7~9zWX=4+IR!@IlVDKh?CWrU<S64
zKKb`4XFBd16`!7wp6U3Ev)S_#$`QKDlawj?KH~~kxcJLz!Dy-4y*X>X!#M;Wjpd%6
z?6*mnt?ln>W<%e*!UC8RZ*O10#Ot1{5q@HL5s{_Poif<YYD6))eSTLlH9aO}_{gC^
zw7dGXNUB|$&xth0x2+$fQ{bKN1<QC|*t_lB9-6*?7q`_d@AY$Elo&|+Gc&W0k^tfK
z&3gTr*r+=C<-T_c6GLL`%}3&esZJ-EmH#?o9g%Z|<bOM2&ZZ}e%eyX0r2f<hM%YLH
zI&-3Art|Z%dWwd+Q`vhiU&)Hr&h03I|7i0iuOWHXXQElSGoLWQl9w58u#YhrK1|MC
zj+62iE)Ns0KT&t8Znah-MWGD$rSn2lje4w9=h(Sc)^d-~1Su=cv+e*P24G^tr@+K(
zzjtRlrN`={zFf${-lnZwcd9?#&RZ1{UvJUBlCCshfZ&g0tUFS7Hq@V85$Ot!dGtlT
zkmYt%HQ!2)t&}h5PN%HGbDuaNUAaL~x1!5Fp+!tIyLma@@>|8Ji{4wUg5PNy-b4@9
zqct#%P+N#Vt9ygp`Kx2iXKwHPI@3|}<cng8!h4(zffRFbtWTO+>fU(@Pb2Y^+qM^@
z_meFPwqDo0QJZH%-905KiVI;sFQm>Cm%|1leB-hdrSPo`!ucT(r0`d)y@3$MQmFf!
zVCrvq;}zi2#NbhIWuLO-`+L6YqN!UUQX-ozeV2Yvygmr(;&Q+1{aivaD_;E09Q#sE
z`@(Ns=Ju;StSKa^B<0W9R|8y^hT;mPwZBzGDPNDE9%S5u98sl;Rn)f_ojMF*927sS
zYRsB!fd|N847RKxiKfj=lJf7V^2jky`ZX=;mx35Oa-PU=<k>}2f~2Y+CZ4IpLu3QB
z;U`WYT|)pzj1Z|*3OHgcDA8%-X%oN^dkQ#W=a$3M0Y@x(SWxt@BbF!_1vp}+fFq{L
zbnJ*p^59aB9kC+75d%g3am29ycEln=kf!sUfFs5XO}x$DaW9hpgeg-=ek(m!4+427
zF;;^9^ocDQ0mJ%scy?fGXyh*p`-w#+C5TkG!tKZ(w{vTPii9DFe!ARA-b_YO8vc=y
zxw;PS?=Pew_-}e&Q#mT8pv=CU;J3ylahoA@<ZI*Ze}acfVwqyJG;)IvDWUvaP4v)4
zA*O^5Z51w4-2l_v)PyBVMLA&AJ3=^KMEsfFFOEcKS7zZK1WiH7oTe)TA(ns*n7r$0
z1~rlgFM}VA&YZl_`JY1kl{%sqbhlz9ye^4M!XX^v#!uCwG<X90)wq>&5u!<|_xGx)
z<+^ZCzu{a4BgkjolP_x(WYn0ii_P&mnZTS)Rqu<Jw_{i?8z(@77$arOPs~v<*>l+P
zSLhVNW@f`I>TUU&g&|VAjPd3fYHY0zQ-(<cVL}#(EZ6%r%yy^{Q56J6m!c4z{F`B<
z({sd|rUkk@r;i|Kh#LHJq}+?jOwra?n-SR{gm{;6*v+LphPnO~?P10UAq^Jc92Q-x
zA78Im&*ky+eb>|(Hi3zXm6tu1Y7xDbi@23>jgG(@##SjqPoU&6-SiG*`N(+LIYcA5
zR`v>K5E|kL0rLeGg)F<P1KMsge~A!`&2@7;z4f$kg|V6t0gaH{3ubcgJ}LT(k$iXK
zYM^~bDBq}e?75)U+EFE_O0zqyt=Meb;l>HwYMG(Lh#~%2UN@ipz%a#J>md6Gu*5Gk
zy}eiy1G%A1sni<g@~!gS(f4rf9Wwm|NS^RroQ1f60h32D1=)xZQCH24W36mr7dF<G
zvNDcVINCGj6ChHFUne3xh6N!4;w^Mm?jb^ZpOHXlQ(TQ0kCqc?)9xtID{2aLPHN>g
z*=Rdwqm7{X*+TzGPLrp(DdzsXI?6<bnm4zb?(Da-JX#JRj5}zUpO#Ux(B^wuj?GBk
z#2{EB2`u!hDFTC2XWxF(mZ2VGe{NldMhxD{yY`I9yqHR)OHK_Q<Q`(Wm&YI`rmpil
zCyb{RJh&&fDH?}^KbFg3n2dnpkaUT<H+~|+FYV<1ZW@yd4uOfYZWcHamJOec318Lp
z;<QTDFeG64ej8Vw3Ie@jhvc#ei^bjz_bntbzUS8Zh)~&k;XJoB$Y0?Akw-oc0nc4I
zVjFm`_O14Ruy<ckP5oWJ=qUk0OG57?^xi?L5UK%Gs&x3%s|Zr0LlSzED$>Nzq)JDs
z8j6AxsR|-W=!i-ODFQp_^FI3-`#oojJ<b^W>g;v1#=2QotIpq?-;Wo-=Qx`2rYeaV
z1LB_lKg8r6?e^_sH3J#;;=C`ob;CZNZ;2Z|?zk}Y&5C|U<tIr@IkX=w^#yJpMgJT3
zww+XhZUUFF(Z}eJLH1T^3n-o2k>Pki7Dw|ftp^Pt*=+ZG*WuvkajZ!P{nUtH{G`Ep
z77Y+Ijko36)yO%})aMN$qZQm82oiMQ{3;o(hNg)%Q8`<9q$SA}oIx%hvmB*o5f3G@
z8cOlE<z(A#S3~b;aGaKsnZdL%=ZzG!k{Y&skbv2Nuj>lX`+Rw#<U-VE+P)jT{rl1V
z9OBPYa@1(vmf>eX&$qzXXx?r7l6Or9iYPtTbSLIgfZVgQ?*7B9m4Rn(NL@TaJ~*V~
zt{HXj2vjOqMe&BsZ5w;44APM3%YHdb5E4f?b5Z&o_dxa9<6bM$*z%=Y&%@qn^TN^h
zmd}V!`ZtIqO45|mF*9HD7rOI4pZ(t0cjTx*dPWrdz7hAGkXN20u{X#nGHU*y0#@AD
zukDzO9)Eg~r`s!`LkpO)J>_9plePHP7k@}V*YW8R1sI71@XV`I{$!_Uk0!SylsD~t
z|Dj*m0!_>N)W=eT8~9kwotO*O(@)5b2te^^{UaHpxh-Y>F{A(Yho|RKS{I2i40uWG
z$G;>o`cHUC41VvWEn*r+{g7rD)yMbgGG;k3|B4cmHO6&V3_l`7{Gr4c67%Ua9F`e?
zE2tQW<3E&`4eP4WBBC2c#TrBPu%G58=8q)Sdjl_tO*0^XpM|@zpv>Oi4V+e=?0l!$
z^m8+B&ObpUjO*Ra`<EmJn7lPz1nUKCS$^I+{Q81LT}3jQMq!*#$Ut@6Xx{_3cQ{4#
z$WcX*Q1y-G^%$)~R19k`?tBz;jOrJD;dq@nn&n5dAT#Py3)4y7!jG~A$tI|jjV9A^
zHckIiJu0+-sUBM;p(@Pk@b`k|VjsAgnAcrh%~$gq2S$w-W*1>(sgS9LH`H$1lf3U&
zUWryqkEVfLjw!)Vv<J80@6c>WEgk^=-D#p)g;8t3e7x=?o2dnMM=SN`s%<<{3olh`
z$Wb#zW5~G>yek?<pJ@0UZnY42MF8mXnG<3O<n)U94Y`Kzvo`bD0aMCYkuf(;iS5G|
zH8Tn1526|2XqMX!`f#W6ZU?^pV!Gf_i*BUsaW5r~m?s7+TuDqmlBU$H_x(<Z4?VF!
zD}dnx?q-4o0@t@$#X36CuhibtT^`f_ykCVG#cS-MZ&R|hTeN+m$qO$z`!^<5hR4Lv
zdy6h=KUQ~7%31K382!`k#u$U7{s^uwQVuAGD@?5C@!_%<x?i?-;e;!f_TbXamDWkk
zke}<g=SL;LD)+A@hBi8lPQ0J126F&PqDTK|VxFDP2D$8kwb=Ln*2ENGDz#30$UC=G
zo?c;MF)^Hymi)}F%o`aQcuefz4<>eZilS)dxV+yZ=U<o@=o20jBVfQ|VgLa;YE2(J
zCYCKgA&J&GCI0jUaD|CU!sxC!Utwa?X}YhR!QF14-*`+6nM5v#nzV_!SYJL|^Ztv8
zCA>i~I=;Wc#L$Kmg5<~^&A*r!!YJvbKtvNKKIO!E>klSIMRfBf-_77O*>oD_xN_yr
ze#^Rkk@p+=^OwZ5^U<040F{SYs=4MjWj#~{@f}!hu5unht1(9ECQLB?TZM0QE8jc*
zOsIdUl}8)Pi`T?9OcAx^YSWxKM}T1%Ik%^UWjfLPF2J)ehWD^<#dN4BUrTMe%9tKe
z?wpgM5vSUq#}#NGU){sdYUhEM#2Ogg6B!ZAz3S9_3c=IRNloyTB&K=RZCU7T=B93T
z`xq~YsYhp+z&}i%NNEx$;w3Q+rPaQ^FGRh3o<SXi4O`1b78(t2KRel^Lt_ZDNd8J<
z1nH}9Rd{R2Km#*)Neoa@e^2Bl{7qHMUr7v3Xg5*Mq2BPkmn+e|zVU0sl_Ykl$qcd^
z{<4;WijFt3qNM739t*GgriB)>knCm(*^SQNvi#8<E%4C9PQ&Kf6(!cI;`coZPl*A>
z3~|vfmaZhRY|ucGQSIP`mY7Ph8oPQ28t^Uet8gwo0>e(-oi1Tx1R1YUJE$yrj*Y`h
zV!=g>NW0tc!V{9{S3PXw<hF<%O<_HA{KZV~Jax+OW$?Dx2Q#rZa05L65o@MbjV%pl
z+!x{TVuzEIhac}Ea6i(}TJ(gg2}?0&C&a(KpB|j_k+{MTf?}eiQ>udM*GRIaj7vU{
z*5N?n@wh$)$S1vNB5Ir_EQX+zkeiu*)wqtxXi3v6=lN(gF~$64oN7zjTpiKpA%}7C
zQc+na@zZFLS57LoMZcnB1bH=7Aw&Xx=mi}@9Ig1)THRLCfLr)Y(6JZG4|eMQjl^f}
z)sNKU@&#9tv><nl5Puo5;JPbD3|X0wBz`-F|I@~dlMcVX()t%XBL<lI!-#22Oo$_9
zx3*qM{C>NQ8o6~S`;l_|yG6Iw1*dkQt4Bdm%<Z4V<3c6B85;<pz7EdBAHM<^EY(4r
z2%cON)E*^c=BR8ViLhxPJ&PuFk|Yb-A@lJCI^l^XO;SAkmDWIB^M?_u^`)qgq#X98
zirxV}-65Tl1a?VMMK^%f8>nX_DZo+?x=Sh2eMwN3FXU{8mZ_0UzLA!#k(_52{HuY^
z`aZpy6dl`r+5%tYc3+tQDatWP`Y<W_<ogT;yOe47S(<kly>=M{q*#+BiE3i-j2O{E
zzdZM5(28bo6CWAC?}`xvNdINTxc)F=+<zD`ZagC<+H}Q;iAv)cF>bIQ7nwA-NE4U*
z9*=SpjIN0*evdn=iA%GImra__TAJTWT7a!dpu&&4zDbBon)fq)5XMhDZBN`EDPrKq
z$F|4k*2LxGCvdsPMdlA{mX_Gw6C-XGys<CIBqIv-hY84t$?prO?aRsdT`Sn*i<iMO
zVq#AF+%<dG9$)T>kV)emF;NkJSdG6-n~bb^v%+_26*m9tQOy$Z&C1RGA_dJd75hqA
z&8lhsqR;>pf2;~w3)gb9gnWSZOrsusqE0;m_Fs&c?jJ@>H|vTK)BDSawOlb``th<1
zEiE#b0KNDF#Nz|qwgbJ2|CJFl`NN2r$OH-`1ensvaci|+F=F<C#ubES%EYEO0*xgC
zP1NMf4CKt{T8(&Gjc>G?#J8H7$eCEnnR&^XS45lNkh55jv;2;=e%fjS4m5%uT6DEq
z-jK6055zl+rk`6amJiMQ<g9-k{=@UYzNVFu{_=q-^ns02po>ha)7YV7)S>u%pq-4I
zTXU<M+M$)#i+?H}I3{0nias(^JM#FBwNtz1(s$$ne&JOhYg!RtNO@>bad5NkKz|@W
z56_5A2Pn-4=rPIb#s}yZ$m%Wl-*A)90{AHfv;{@|cMwcItgS8VwS4$MTlkoK#LOQM
zY+XLgsqH};p#2~y3D1aa$fKCrQBVc6Ks#DOAzHpYS}j;<M;_V5uYRjN8mJKC)*k1h
zaFcBh7>rVE`Gr`PBU8`}E+8iBZV4Jj#aE~&j0I7(BM}t@@iXnI3&&yl3dpvkSY=?)
zvO+ppM|kt)zYsCK<{;|vVAky8#ERn}`H+l1h*-qHvEwBw-AD29XFMXNo))hd|2z2c
z<Bq&2`Q$4@Oyg1gA49CRCF6e@V#s_6#l(VkKfED^X-^6Y%BuNeh{YT~jX(Zlh@tZT
z(-7;&8)C>5ydj3@{A-9I-9rBuVm*2FN;O^bjCtyp6mO+h8grq*yf&q}1%>3lh8S-v
z$oZOXMKtff4KcXlQ~8d+h8V8_8goODOiSs?5QBHM@PrseAN+?QhONj_W^nFGk-rS<
zkm#zeQSMq-dO6b-^qqir>NYQI1}boch%HVlq31haGO0v22gC4)Sj_PsM2r9kIcp7)
z#~Wh&QJr1NnpyjyN#<QaOrb$;XX1BNl1&I(ycDHvIzhalN`@y_h8REz*rJ?e5dOyy
zgO?O&wzGAQJ?(f%29k2OcTgajCGSQh^k6PkrkE6x`+AfAWr(5b^?#Rd_m1EVG5hdQ
zWz83V4Y6RAVuNrc_726E^I0CE0<V)RLkt&^;I?<IyJPxS_**8q_x0hJU*S_^st?Jo
z<1BjnM>V_ghFCV=<diP?;|AOf)yRsIAZ22y?Msa-L=3T4{s$2gC<u5P7Ric{ZPh#(
zFz;Y@mNv?I^{t?<@-HHWIDsMw-sAbRsqm-!5%E`s7&1j)byrhi@hSC(zlIorp@M~m
z`UT*r?5it7471NI(WJ|y_Nz;NHLC58A%<=Be>Ht}S~>7LLAgs2pw{UV{V6LLhBw4)
zLeI$dz&4>m$9O{wJxvT?fUtYQ^xM42<LSk1%BC{7ZCOF@Cp#+dLx2fTA;+@)V;W~f
z29Ivee}G`dd}N>t_m3?hbZ)nwD2E&!oY1)&7Hh^{lja$Qb{NW?uPig92u}Fp`wm(|
z87{rd{(xYo47Fn#((i<C-e>%2nJ4*QAQ-GIPsH+9S%<g8Vca}rlZ5S~sLCIH*Omrs
z-XycgKN$J=sh}ZC$oxgEiN`JdefQWd6~WIg6Q#P3uSJCV$utRlZDIYz`ryZXFX+r)
z5KJ(LdWE25`rcw+qFUUWo><}O;k>k0Ztrd>IL)-&Uz)BDdGPadN6<D%YmIuQ>D}vR
zw(M6Rn75Bf`KCnJ$^NIu49gr*k(j2f)E9xbUlWk9r^9Qo%eag^`oh%c0Q=&4UjG9P
zQWkQtZb%=M-24>?R@l%B)@IMp0=E@6^wZzr-R*~%htud#8KvxMUSi!_8s31o4hC5i
zokO+wVRJ(1gWO%Ts}$iWHkt4E3y39RcNuxN<L)ENmU=kUN)Yj|`Vr&dfcAq-V$r^p
z2`=eT75|%g<9S+Sl6~y{0HL95|AA|Y!7}e<CVpf_3#aL#h+&1iP0-tQG}X|^S95Mp
z>ouetA8Lxdq&KMp6=s^iT=X0=IRq4I3Y{<tZ-+i;#QILt>s^=oU|?Qe|H0ho(6rcc
zz2<|d=|IP#iEzuxp{b2J!=q`te~8Vv95Mp$e3~I$#l5<@dxeRqPzvKQu^l`n_UaEN
z)@Y_2>^B&|DL+oFF9#}HG3{~UBxGc9`)KNu`C*M?!0s~q@J(}jq}sW>J!tQX{Pk!C
zjbpo5GS{(1K^OgCZa1L#?7}RqUGVava9pmXn{1BH%AQq5RbEh=@|%R*cPvA>K3#JI
z6ZOxeG!lbsbf}A9c7mEv{q<s=6dmsK5D^AQ8PledO|uM1Tu^i@g+H>Jt0%PL-nEs_
z4Ih=p>xQ#J*{h#_^#1XDlppNf+V|r5&!&p-mDCo+jb??~iTj_uUe*+Kz3A+CrR<}8
z!vEd}%LFhcd6tJyp5${pvaHParig=B<-B^EsbjGlpX=qk%fl2Y8X}O1IQk|q@8NFz
zByh%q;#md)Ln}<jGoC&#D`)mDo7NFIqsI`7v9q(fbX9~EHX6Bjt}_4g?fTo04W=x+
zubYntibQ`hEEk1-S0wp|e|MdG;cRumBDLhptbCOE!BeJtk!uT=vXNi*)Swoz3ST|Y
z4geXgVourSJhfnlI1k7YeOVt`)Y*YF%7U9B6{p3!=YX}@;6l$Jv;gN5>N4Sy=t4<N
zNl}`_;sYM*LS~G+I|dYm)uekQn6GwPoM=V=jw*M5U@JJ7(siUk;Px5Q{`;VMzrkY9
zb1y1ws<*8Cz5MnDDURNi$5q|7H1@Y+xEaa@bH#;MlFdh!n1|bQWvpmY2=#jkKCZnD
zFqKLjv0i3`?!Q&p+_m#B)Z$=RzQL~nN-SNxaoO>#C#jr7+h6uR@l~-U=*c*AwiDMj
z*pmVZ?Sr;J9;@9}?=^^<r2RdfgJ;@$i);J*lJ%S|4rqv?keVz@z<%&K4bY>7kd0(1
zo;GtS%{r!-zXBM~_d-s;phc749>7D7{-D!tpGsVf{rb7=gw^xfaK2B^GkoIT=xlga
zS`y3pwb79Gp3<&QR__W_16$<}TX~D-v-y?Y0S$zmv!46}%qnblC<I<)6`po;4i{Ro
z<bLacDh|&Rb=i~Ksc1h^b&4YqQ%}whNaufErYqz@WNfB`X7A@M7m3fL<gqVSqdpv>
z43(scaxWoM4j@uRNOcnh_E68j;zbWG8(N;JXg`x<8HSQ{V$39m*&Eu|b?uGDD&*v@
z89dT8t?<mO&eSgcIW0`qF8sLu0$5`iTWvb(`Jo|ypZUzo(ER1*$Cg*FwJxc{mi3`C
z?U`@X{TIJm7n9a{@_i6FY?vP@q1BCQdB`s#LoD?bMdJM6pi~D~C8BGkF<KM=MOX~T
zrC=wEk9&ZWTD9g!aEkmE!uUyxNg-z%(lVQLnbGVj=F`xb)8cCVJO0V+lPIb@cuyM>
z@xA6a>-lB=8K+@}d)5hFHXs;N=VWGG^Q`fgbyxWm@=zexok^bcUYgFYl;S}SOJBaD
z<-3=eC2ZSPY!CA35b?G@&A5%`E^C;V%ijtXvvne4btDbREr6u7;=#%JKbD(2F#QO+
zc`z_Optn#GCcw}BC_H<(^z4fsACUvez3E=2q1ir;hUT)cfMU+6s`r6r-(^pG<gd|~
zAQWy*^5h|U^c3DpH5+4>GmmqL;rz8efi}*MVV3VS;%;T7-lP>Ivm6@cP6pYbM}LV+
zb(uysrDdk9iYliKi|<PN^@xr-`NI6TKT;?L=V0qr`uNkP^;D04q|w;Lwjk_l3vbkx
zP3>r6Z5F}B-i51s^OO`D=|mx#euX<NECcB|vgPWI-{20cukwppj#b1sZ-5miOU-nv
z)TzI|)+6Nbv)|TbC#^BDzWhd7wRUjBBErk#CHP~Lo$hlV6$1r2C6Q1`BJy}z88<by
zxrv;kmMUuR+Js&tt@hD_y<Lz`6x;mb(KUfy`)+S9zWi6>W1b26nMOS&EJ6*folbpQ
zncd1?_n)<esD9YWz*&ENbJY6s%M+qtvhamDmvLO}4<0}1J6`~oZ9V&9zBj@oEV%Y}
z`+7vO{BO9pS&Tn0thV*bdOH8f@_sapPM&Fm)-sct$F4zj<|ER4!ga-&llP<JBt?qB
z0^cF0N(p{x#RCCx-)^_JaOV)c42>B<St-ruUmOHzz0@=LW%1$DDNU_c#CNP;=uGkL
zoZ9Gfxm%2Mhy!iLgl%PqOQ*+EGZRG*xa%YIFSFl$-rn3z1M^vHWq(r^4eF2kmnjyG
zH^m6}7-bdk1q;+c;XF@k<Z%w4>^7Mp-W0P)cQ9tXBE|5;<P|Aa74ZD?u$&v76uZe-
z#MgID(^${?^NGV*r;qKg=K7akBF7GJ`(J;(xjf_<;tEs5_I94?DE}buJX;)YKEChr
zYQH$jCizzce-t=LU#xwBNXLOw7f*`0zM>l-D_<*Hj9(4(13#L?lVXt0(koKz=11rT
zj{bO&gIABy0-R{$bNZ@k<SXusF<lfnLih-LkJ*q23i)x9k7&SwNNC5gkgVh0_MvDx
zv6Lk7rTX|t*~oVPn7~o7jkCvV+8*ErrubD4bf<?dRD)#>2jm=sB6=ufi`@?hX$vt_
z?LAQDVrt<Y{s#?IL|o(@T#yz5a{a!GyS-HQzMP%72mK_J?^pRj4TlO?VqzUY)EL$E
zhRCf|s_){|9}Lxrsy;NOQ7=k@e6Wu9yh$w61sZO(nt4IPw_dnbLQgSZckT<nUM4dn
zjq2hq0!13$L&3~N9!<a&pw9kVot2pj=;=tqw!7;`Kti+#QktOH9)pg+=+K11+==X>
zl}H8kv3^OycjF)*8YX`url1U_u#AwSbg;i8r)c~JP>kJCrwzHzAW0~QCZPSjczzj*
zr9c$ZpF1!hkTmnf{Bb?>=RGXNQuIO@Y~ks$bq)L@7#c(p6OgN^0m<LpL)8mAcSkd3
zy=RP|f$keYe`P?=8mo{}%swSF7F+Z7{8R@&+#U!DY7me=THLk6P$P;f+%;HgVE~(9
zXnP|+^CXmg66yzkfkm-DA!cZ9;Q!cT`y0hVTg-oq0$J5@k|7AsGx)tG`F&^wqQLl$
zf~MfOi<J~m3J%LFz*-0AiYg(KRp+q7?G9n6f`R1G@1Vjx^m3W}nSMf=QoJ{eWk+Z(
z?Z=@d_O8FNJxeHlQFVGxZvHeke*a0a1zPcCWAP}d-@$wQXg^4sH|J#u7C18M(uAU%
zbr5t!0SpOfIl<5vSCXPVkR6iL4*58a3t)z0`Hhk^LejL*vft_xF`4*;;btl!pdP_-
z#*tTU*mIsch@mRP)+goup}XcJ0}Yaf<@EqNG3PI+vDsMBsJG*BOM)It@-+7ari<MX
z#cYq4In!~R`6dFL&-qUsI2=7Mwif9j<D4!g%57Q7UCmqW`-XFGq<b+ECk?NSrA-cs
z!2|#~I~Wk3>rtJqxYt9yNq0S(oB4-~#HT&Zms4t&bZ}x*47OSKA-@NtN#tG+aBF}2
zn9DkM)OZI)d9zq?nv3oyt(uhyTs~V<`9O`lMK>v4dJiRWsV>C)M;6m+?Pb>4mMtOF
zd}E+_JzK|XTIUO`RvvGHJDM5WAR_w%Y-z}Nk8Z5#k1UphmQCs*bu!gC+t(>I)vGXt
z`cEU`goOUWVx8Qa#-<5G#-C;<pb%5Rl}1@SEJiz_+vcrPMSpwQ^mgley;MMD-6DMq
zg>tI~=`UH>yEisU--HMGnw-^leou<1a4CGI|MWHBHk84bN3Lr#TlWeUBiv|NVlKrX
zqypUVu-K7_;Qxfh2>ovp=5-Q5XS0l+ni{)3!q-Ed3kK?5!D7Yotyi#^DRCy0bn<mA
zQO<9y=(>8Vd-@eDcF8PZ=JLU;;*nKNpt^6Mu5lJ#7Q034$0^$LiFsNWFN=w$S+<pc
z?PaaXKUjVKVC%(TeHcx5<j<Lc6KL$E!F<qNP$xCo75-0HO!`nb&foU(z0tx42k1x5
zWjVDq27w>7SFl*g6)a}m$}QG*1&cW`<&dy3IvOy#beTAcMbrI-#YX<XV#e>F0sjGu
z0a93c%lV)6xzUZX$yPdram(u-x!_?j`Wz2720fD;&zc-%^B2;_HF$ps9K6U;0;5BS
zKnJz+{sR^x@NVWGH}n4VFIdc`^o8!_5lZD2r4RY2^YaJde`PUx0EF~0`Oq>E%$}%I
z{n{T{%vY^Nyo;FpD`B9ZAf3e|GzBZPl|=^|!pmakrr*4^9|v5)V(RLnrUH0a?DU$*
z9-(Ocl2<B$gG<osiwAy-ndEp{>;YW;EsTHw3m9_3J7WYm*fk}t5Hd{AOFA#1=-l7-
zmCjtC_vO)hD8{WE$G)ZjwPENhrgLs}uy_)a(xCv6Nzn6Nw*C*oh+&{-TZBteP^rAY
zRb5FwB<-<ECKCZK(=`=>;9{nzHvdq8($M-DT0t&owm0X-j|BGE@V;N(K9uJPJyh(m
z>^V6CcIvi)=4_V=5@=`joUdGHomnvV2B+-o=LQ~5g+-TC559L?G#g9;ak3Plt&u;2
zJi*6uhvvb<PE@B%A(ZVbcBO0tvq+S}H97@R#$5EjU@@$W1|8*tb~Mjsd3s6mUs!Cq
zEk43A7Y~c2+=w3YBX|T)P5lFl5k2_tu$X_C2C4jUO2lkpt4YGiOmLb-2xSl+7E7c%
zNfZfEHUwoE-4n#aVsm&{4F16V4=gr5231weK3|OR`Y%`v@yHJki=kx&jvZD>Ptpg{
zGoAc15@!=G%|i$Yi0qb$kmey_CvwHdBA3#i@@l*Va~dP|)fqbpsM*U=_fR*hKIL<~
zVT+8vakgFZu_x36#dwWTaIM$|7Vy|*FaFUdv8X(ir1p&14kTU{BT&d&v=q-f*{OpE
zZTGmHa#1)}QKs7)0rKN1PF+h0lyA1W-Fv|~bW-STDbUU3N`*I-@}9067r8_iots}H
zXb%p;B#>i}%1Ywr9mRKhqGtj*dNJ#am1uYFXKwjIFOC!brHU07`Vc-DNOS8AD9u}o
zyfeq7rgTl?G(iLw!bI>_6?^(fNx<^7l5ailX^0^95Y}epm&sZalu_l-R~2hX%nuLA
z3L>rTOdOu$Z=K7tQ-5&THJ6vjEhuJHD-m0}%E~l$DmNKgMhGXyArl=4>j=;IzlG*Z
z9;Wmy+6_;v+qBd_U#(|h1CfN`2cfQIniJ<R2jgWiM(bve$woRnEVkIB&r?3s+$zJ@
zY*0X?__^7ExMkpvDn>ig;!yxKVM{zMwstCze&9cz@>$oFtv$*h3a^TlD0gz@6>-5k
zE5g|Qy4YTv$whW`xJ_j~vhEIaH14!-8VG~uo^|!yj>=%kBgrlL!WNvY*yhsLHPgiu
z%a({&#l}BN8&XD|Tf?W>UO(OnA|vRbQy~zyZ}_a#LlaK)b`gKy5f7FULb|cLMz1pj
z$uVZw4h^5nR7{_0AsndEXV4uaA0Eff6{9;Z0t5%ys=QoadE;eMe#hpmQ=prvtg@Bt
z!2RBSZ<|3b#sTu(ftMQbSvj%~Wp&fK`O)EnrQNp4zk^kJ>YfyeIPc`=5#MT@hhl7o
z`sU55*n?kjJ$Pv&a!g2_g5=xoNs)*)oM0b$Q}~|e(FkgQ#*TF~)=>f_$L!lKjrd@C
zi;NUcie-j%uXn#^x_)~*d@P!#G!>S1YuRGCSl{{)6uro~b#20<a6;|emc!OBXK|tt
zPl^@4HcnRDS{(CSV(c`<GH^`0J<-vA;xR~IrXL}ARGja`Pmzx&#V~JjQ49y&tu9YK
zX4%3oz0ck3xX1#}g%cb`lXqqDrr7M2Ddw#`^E$)!(`(z%K4r7rVqM)*yeZZlE3ABs
zdgAnDs)yq%o9%pK;gu;CPB9m<)a~K85LL3U`|<O#EzUOUQ&b#BosBFGC9?lA#xp28
zWN8tFe&EBs1Xje6aV{@3;cQ8vnMhgBMf~sT!g&uz_Tq&3C;rp(1#hBNFUQrqqa_);
zwe`@iP7GkHZfU$KmXbxoo5qh<#W03g?Tt7Yp(|AkQxY4!!BHk-BRP;j+Y?vsz)_^y
z)ca<0Tb<D}hdt*awk9&rLXjq^$UQ2@*(q{uO10gq$mkI-tIBT?go9KgkK$#yA@-*P
zlb<^I78i2~minGL`A3I`-*Z9F_E|^ZZ0@~jgqG>si#v1+Q1*Xf#tlZ#ku2kI{cp1m
zIiR~Iw&Z(}+lvppZ`9qIu={DSz$AZR`)ZNt6(QzU=~gV~%LubwA1>xjg0bJ&QY*Vm
z*aFzKBPVQuzfPSTp2#vk0X@Ja1TR463HCe|po7u@9_Rq3j|WE3Gk>GQg*S9@xDj0*
zMl(3w?_#QzVrn$}#kexP&O2HKE@p*ai?2`k3;)@D*Hajuf8nh}LHm<Fj&`50_o=+>
z1qEY3>2rHQeG;+zOT0Dq*&(EO5G+Be^lj=N5G)ffgZ;mQVDF!(`~kr#Z)L##fMDN@
z3?j0X4#~tnPF0!KSUq8_8-5vP+e@O4C&DtrE|#>vt@|wW#9aJNFV#*ieA-IVp(E-(
zGNNjvlkn(zK~CN4TI(*2Y{YK$(wii0iU=yjrj>WuS0I>TvumLiOW4KTL-vh{GW`Pa
zIYc6DLr;p9l>aCODr%I=VJbZ%_T1XfXKd7kH+Ui9UW%+|K+ps41rn3`qoCP^{;BC(
z%3o8icOCr&!6F6YH&=$uXX0N7c2^e;=0!yXJe_MuJhttYf9m<_>_lQH9*l9DiM?Te
z1%lb5DI70nERmpmevrJ`BfK2Srfor^!ZoPLAOpA#EK%=GMK~t%7bQ3*370TCCUa1?
z+owpsM>wTkdoY7ZRx*Aw$Z7u0saWT_RlmcX#Q9d9a1rr$&RMrfA3JB0^aMLS`U`?R
z%qq>c3tf57;Zj-pQ0;i0@HUGXZW%0(LQce~wjP%xGPKfbB{5ndR>A2E9pn|N4i7C|
z#k^aLGWc(&d>bna{Q7C)x<&WCOL>l+9_J(LdqW--Mff3-$GH!!-cm}i-`9G|H4Y!5
z*i2~d<#-k2%TI2VPK#C@OUI;0_tCGosW%Mic~w<B6TU6R#cVoE**dQttrj$!RHMpC
za;Z5`Id^aPxrwl^FIDBzL;ZUlYY+XY$b<uGex_sNV5w^Pg;m<>EnhRL)p)Tyw}GAr
z;NA4ekKe)1FWRlsRfid!WBEynvDB|fex7A;b~IdpU}wYtvgd`AeuLa;;r4i7tnq$%
z%DjVN0||+GQr<6(y@r1QV}QGm5$Wa*KWz%OY2vagU~Ci*j5Xi50>*}n4a8gqe9}__
zKU(=vf4Tz30`b7uVp^;C*?$3Jx-+7ng87xX3am%{mltYIkDu)H{u>zktS|qQM$A8U
zG<bQZ3J;9g7~Bq7&8ZK#0>-vV{sLoePM1>}!2E95D5qZht0Bs#WP4i_37PklHX|ZA
zLqBoV!kh8Jn0=>OwOThP0xyh(><vZ#5yn6f2b0O7n|lO9Szoo!ExL>{SiGZXj#v{f
z=@l)0xJ8_9ihO8XnR*S5`fVO6_V)DX@dG{HU)y79I-?3u@e^`iB!D*^kw5VoU`KL|
z;x6XAAJRdj=ZnV<Z?0{wW2yMxusJlOk*dwMuieLaGKdzF8w6+FNGRig-CexFzSPV7
z>_?PPFo41*p^rVk-<chbp^DmgD&9_(pfzpArKO?4fd|0=2l;DBK<%ht!6eh)lQfFH
z(P>h65UgchO8Qs7FzqhFQS`F(;l;X&pnGHT-Mh;j4+%*!4#rd9+4SWb2?GSJ%Sj&L
zS|S(!4FpTMTgC$=e}~ZX%gnAV<C92ychl1^>rr?=&)0M!MMudr>3&8bgOj2M3B^u+
zcgscoAs@CF^2=$#gJ3?1!#10KkGp@AOGJ^6*i-oD_KQA~N=v+%Q3<CK)heeFTN`mV
ztKg`%;Dgj9j^6e3FPQIth6o^d@0;XbxH64GbSAzJsBSJ;5Uo%i2zehk<X<#*cU^g#
z#UON3=E+g_y7GR<7&0`A_~JkSPLgB@Ln4V`mFnv6Sco%HV8uXNcTK3$`vgDxl2iI<
z=1Yo2O^>%b9!7Lkx@~;4Ze>p8qTW^dwiL;mPjq-Co>$#+v0}}i3#br%Bjg@1WKwjR
zEhR*~dD}^;Xs>cIL|9H(KO?EhLqn3}R-mU6Ce%1XSiHujb-Jz6^Fxl~;dMB*mqC_Q
zQB%Gghb9Arth&>z%xt~Jw{_Fvk<y1w&cnhrOJR#Ap)++Qd%<Q>#Ha0YV0oZfMC1n%
z1L6WR(4fO}5jg=XnKy((MXf3U<)Y5IQx?sUX4N<4Hr);A<}gJM8eL@<9G=jU^T|3U
z%;l4D^o}Q7G<>{YB`5X|Va(fi`5&6N-qiZecv^PnT&t~dv9tSmYE5wX;@PO&Xuv;K
zmtVe^Nky4*#a+y5lfQNk3YjUt7l0DUTxNaLzC$kV2cDf-CpzjbJOA$Vjq>SUoov^~
zM-mTqmF-ldcZ70)I_e2r$y{5}OihTC>=AfX$UK^nvpY`Ikq(#r?N=2+WLnq^<v#~{
z*J^*<Dv$aVD*dhK__YwoDC8u0j^UryJ{EBvvg?)f@-fluzkzSBH?5`x*(|db?$D}b
z<G_A4%N!*QscPbkajaezZ_mmb<EPlBX~{PFEJ61pt40<XYl1sOA9^M~qjcKDd>S&Y
z<EDBt36z;%Wn_{`;OpKk7jNgf*5=z6zLk++(h}k%;ky6m#$6LJ<%HqHqrKdplqQ;&
z1Gys(*P4@!3)W7r$>Fmi7gb||2P!0^89phK$TYbL-DYlwodAiel}De;C7+~NL{^nR
z``sUZJ)H<$m324x;dP5FY|@nDTCMd4mwx&ip<f9a+y}TconT_hMEittXD$kj^giYp
zOtdKQ{*M#~t4VG%AEgJW->tsSO@K37%hhGKECoEO{KDHFZrs}Pz1-n!!=h>2l^+Gd
z#$;Ep`;N|ycO#OO>)+Oa9#2r0*l60M?Rg)&vwGc^(=`0L|F!)kgZSIP@gCr9(8TpY
z)LwRt&8q8obdUOldbq!e-qw@g{tw>%NiuTFObfxUK8wW#TIxO0h!5dRHS(+Op1Xwo
zw&>JBFUD2sM{Jt>YGe7hn-S>F@m;55;3M6=0HKMqWn+y}_GEp3(e-(CX@Rr6>vhjv
z?ew-Bz<6oweg-0d@SXX|F82B#X>12Cjp5FbZg^>oQv0^wzo4-lJT&&@wbp@m9>-6Y
zAinh=*`s2z^S!diYhR@Nz^|;!%V4?@+9SS{&p%gCcDKi~{MLv!*;(dL$cbImhw^o%
zZALxaR_S`9dfGu8bt1JABgIMs(!gD3icA1}jSf%Jf)Q?ibq5I0E{7h+yoM1U4XAV)
zrrS#b@Fz>y&I4bLL8451(_WvWB#!?B8gn&dw6MP<pTXeeE|3wNs)E3I*^LwAPMQay
zBE1$uq7EXOWi1?sZU;qiY@nb(bV@W}8%Ndwqg;4ENvjU3Xix}ZqHx7hw%G$b7m=%k
zs8nAH^jk_?j<ba!<f}cY1J0hE8LjOeb0Z-}3GICEK00O<>>x=U386XjMP^{gx{<MG
zM$s#TDCRZrcZ`KGfRO~RjoEu&z+-gX>Ccf)W`qwsf${g5ALt`M0>|FE|BE(e4_!er
zT3c|~TF@BbI3v^1Gk9&x9^xSw&vB)VDcn(~+7K|lB;?-Sv0_?GyxrsUv=M9_6roK6
zwyv-yTne}tzYLgO479>a-aTMzCeN%&ct9}v7mm~j2@q-r*&+e8zM(lt5(^xul{)}%
z%n1=>C(ZenHFo2fTYzND>-c1jKh~Hz-Wrok*6n2@%%oiSK$GJew~_%yo6+bIc(W3w
z!FE9iV~7qWHMxh%LNd6d0UW<h=1D{403oe;OBISF8Gnn8Y+&c|3uP=0sy1iMvnP#q
zqgwP0rn(PqUL<qQ02hvvT;4!O;z)_wQ^f<omCvkykH-=Efe{T1%NyVmh$mhf8-5G6
zzE5!yoXJYa&hSSY+yASLr8{?EsXnZMYvG{cbl?^jWe)D)t&?mc%S(uMVl<eR<jx7_
z`Z3Mfc;@sXwTuN#aV3rWH<~tBhVI8C4!=Yc6UfS(Q4i@yhKQZPf(h2ibk|{E51P1R
zmOLcyh;QI`WKaf#{0x(O>l@jLB$zx1b)6i2A{lstFwn>?Ejy7$%@Wc*PSWNQ(hngC
zK$04bJ0a{z?@2O-Rgl@jkhKlLq>K3tLfS@<KyOQiLrFGU2-OUd^xGoYTWo;^uHeER
zndnQcNl*TJ7BrWR540f587J}iM&C0IyoXWyjirdeIq$+Krt-k&n1@pY*{Kln9xOO#
z2b9#2#Cf0E0q%WaNF55NJZl5*!YFmH-uu2NS3|cP$R&j>oYGa&+LZwFEgl18W%DB}
zc-sKVK>{>$z;Tw5O_(Se2dWrf3JU_~8$DF_J#xs7Z2xj&Z5EISOV;;f5tF~1KLkZ=
zr$>AifP5v3>?CK6@qmm#;z(#ngPFiaAAwF5G+FQRbgRo?i+LCJc%F&8_9R9Ro~x4%
z#uA2+;ZqJE?m7)&6+5XUjpepOU{?&FiQrj^I+-4X>ed<<frYHt175s&cFUDf2LovT
z2A-QK4!~0CKuGIQfJj{i!pg|gztmVdWJ(v*k71mFxRW|m=0M0#>;VMTWOn4V)$hm=
zhUI#=_zHV+JshhMjPlTzqDlKQau`^Nz*N`fJ1fqT=-{ZU;z?>)DPruajSSho`%)l$
znf&sBi90^_)qos(K*0$OmnQ@jMA>6sl;g`}!s2Z-9?8&CQkD^QHWPKpge0~=lI0>P
zXOT)uxv}30@XpvWS=I`Yts>W%zoYEXvz~FH?3Gp7l3=j0b2;{}Gloq0N1@`v6GGAj
z^7jN#O|Yi?amGlQ$PqYj01Qc^+(<g{h!pRPLEQ9qDt^QLj2b-6)SC#y9{zR43jR7{
z=}<*PoDQbxv1iQ%obvnel{4m!cg7l?;xmniEOO2Xn^yifV=h9^QVnU&^3a8l%V&6K
zjOcTYn-xS;<Qe;^&jmIGCS0QEZl9WtCK73Na7dift4xtX^97@0(qAMEqG@Ts63o%A
zLb*jfr6i4Mij~ycm{2{q(3LWVi$#Rir&`zF5`OwWkuhAVIqNgWAqb^D%}7JX$VLYq
z88c|^NaCWrc=3dK_$f(7r_PQoM_8JxVJ+SnQ$0?#@NK$7SWl9nwr>w;L&h@eP`y;p
zx|SUOs-~HQFh_@`mSnM|$-Z$iL(JvGO8<LV9t7#f+Il@HjYOR+zY<_MjE^I3y)ewY
z8Af4b2(iUAj|!KZWKgCKkO#U(TI>XUR$}cGq`VD`HO{?cyb~O2xdDzCW{wikRuks%
zRBvF|MU(clKNRW7CTBlBbA}G5olE*z*po)hmN|azAfxQGK)RJES2!R6uR=S`XsA3h
z+DRO0!)JQEdx9J!nX)y~J!q)fzJoiux=b7K&nM6fLDz+E;R!O3be(J~p<7+0zahD5
zB>5o>RV6l(Hu)WF?`gl7;5HNglBWHoL()sX(8SvX7SzdwW<%i7fLBqcAi*KZ@1I|7
zf2VnG#l(~EYzu>Gw178EB2Ot<e}~2IRLA2}sF8vR_bjm+n{BaGSdDkhxCaq$cS>ng
zdLFAJqU2xXKu8Av%Nes>L{3O?@angW-@jy{<Dv{X?M<HOc{UfEdm7ewvy()fQU?h@
zFoK^^RQ4dd9MAe<^Q#ImYAcXT+jR6jf&zEn8#PHJ?hdVZeJmT>G@?(AaHtKoitj}|
z<e0B_tQkHhc<YLNxs(DpZy4=yAb)umaN4GD;R>+)4t};7t;5c~AuynGbAZEPKt_=}
zdlGmm(E1k{)0t!R>0<spocs!y(u+t5c1tO;!4A)kC8MwyHg;8JP&*3=p*~r8B5AUI
zeQwI6?lG^(C~s2Fq{t}qQwuD^1Xz01^P~ZqwMj2AI(2=N8_`1*(7<rbI}(%wjv4f{
zE+(V0Wfiid5mC&kz$0S~mkdUDWi0*rwr`SkW2Ml~4~UH^2WmcZu8$&<+=DkWBai4^
zMn8%^p`U>TvOK5Bfd$&-s-Lq3_KnaaF$Gebf53xaOf+EOQ<m?T8RKRU=o#}Fd=~Y8
zK`_O-W##wF*SD6{Kr8CvE1I`gwC}Clc(|flx1#@k<<{1U0ch1oeAVRk>YaP5<_}jb
z>sGDbui9>{{sUTb5MOh;z2<Un&F$fuN8Os&|3MJ!^8c?O*!F<|_|Qng=+MOA@Q%-+
zdD@|6{h{^PAwER(AMlZb#F3N1k&DlfTiTIF{gKz$k@xnI5BS%8iC_K(zXE-J1*QE8
zss9x=_A6rhR}}ad|79I*a2z|fK}blzbpjv<5L^<7;#a%~NC0^I0ly~$;x{rXN=gtI
z0s(_)Az%hNS{6nICMFg(W+qNH77k7r7biO(H%y3+M@)!cR9IMAO!%6VxRRVSew9N}
z1+IBrQBxhRuMIcS(?;kUncdcvFix{FzGY})X=i3AYmxEBipIspOxZSjz@AmZG3OsA
z&$~`GgHD{<&iM$}!gsFR0Ul069{e{w3rD;~L+-g5`8*x<k-U39Wc0p_nO|{)pQq)6
zO4NgUV-J*UgUbDbk#-^F<002$L;W1XpE*X<OhjlVMLzf$B|C+@k%|g7MdN=L_03}x
zwqjJQ;#7R&o}=Q@vf?79<Ba|{pfQ{O)6f{6P5pm_#{N?o+ph@tH#GMDRT)eA@5<O=
zXC@vR+w98!3yn3un%a0(T=6=${`K6%>!u@YL1)kS_nz{a-ookL*7`Tan{R4<y(w#a
zTl(p3N6TQv_rd!9cOPC1Rec%i{xQ`2Yp7;-xT$mG`Qj*c>wU+|vBu-Erk;t`Hxuh4
z6Z5MRecKZ+Pw<D+ox{`1lhdESPxl{8zdZTSz5B6maOTy?40dSt_0QR%kxza5p9W6n
z-i*%=%+KTY=0~Q#{FwYYbozDpU}5~@;`_tJ>AB_oxs~aKmF@M_wX@ZaOKU$j*4B>J
zK7U=G{k=ZB`fd00+t;PdFTXYy*M2OX{8;|BwR*C>vAMH;zO(*wZ}V*L$L`_Q@1wo_
zUwcO<hi51MR~h@?Q^tg72uKBSNB~8GRuquG5~l4+zk!P;7;47F(3>gXWnxzaObp|L
zjp9gVqCqs6HwUpq$A5}Xv6Q@fyqGNcjHx7!)sJ~ORUuT~iCW;<Mk&|;@X0Yok<nu%
zP<a!xlBqO}<E4^p*ukXUF!NaTli^-0gUB^BltavI9O6JGb{=baZ$=S3F{UNo)(YCa
z8(ri0TFBR*1b4no1sNV$qJcti7Ff1Wf}zIKh|ZpLg{5rXR9WWxJgKVO6Fj#{NjsJ)
zg*LN!@fqz^ebnXjC?0CnkY_`AV7X&%2orbhl`<xI{BLFK$lr*X`$`$(20Em(5uIKs
zV+p=^Wvsne*Wh$8TKI<7F-};kjC~^w!rfo8*`Dj6oUSZ6yD?1Fwx&d@iU{_iY3Pm9
zs%-?E5aAf_AuRh4qpHd2g^vR6B=hGg$)*5boJNz;4yB7oxjb-;sR0f%Y9+Cu;ldEr
zRvg#!`boHS3KzPvnSyu6eMyHedy`nVM>>le#B=ZNcd&}Wj5HN53mEW2SfO4TGRW<<
zRHL>j=}5}i32C`MVBAHh+k6b-MKltf^b%1W<A}+H=7GIr*Y22zrK^e)i$SiX-|g}%
zC8R7%nTiXjrfNViU;YHkrz66|uBfqOw!>bnYPD0tq_L$X->Gi{OXECX`FY>LQAr2z
z@`+??!f=3CiYbwhs&yYhqG}^tx<iFcrs?je{JP5S&&WGXNy=0ny+B#8Eqe<b0YoIh
zRe|lXYAL`$>h>t2;~2H>q;aqcfsO=vVh16FYat;N!LSU97`!~<M*b6y95`!^L|Wo|
zO@VSi+D5!Q*8cO1n>`ILkI^#mYQa^bc<UK2DnAnt_Y;Nh5Jp}cgNfPj_857uz}_G%
zzPeof{&BDQSS5+dhEXyt=MVHAj+oOdf$U!UvIB4LjTbhnAl`H!e5$vom}o_Q{$yO-
zxdeKA2_X`vseI4XD}oRsC{MX8gF|O`P>|_eD5E48o^IdYwn6rg#JJvEDIi)Y>4vIv
z51eIG@2NWSPPCh7I-60UBg45AoNKU@QKKD4Ycj3{|E9@8!2L$jie3#RD+m`)u(&8J
zPg&~0Lc@M6)0xPptaTtC0z{!i-;V&yRGRFunQ=<kRZ`zdVz{AxQKPURKEL9<!12Zn
z(r-QORHu6Et?7oqMXupt4k}d8K8Y#<6>oLW$AoA{*ST(hWsb2_lNQ9tX_~iEu6yyb
z*~4@IQviDB9xNU({+cyY3$0=p=z}M>98qMuwo+a=;apG+i4MVTo#hnqW5)A|%MuTA
zN8L#RMqa?4K<V@5Cj@BT-}Y;1{u)cEqpSj)?XD1y9rbYT^Z{-*5(LdgU$GD1G1rbj
zI$@l87I{F<7v@G)0IevRyS+^9VAaUXtX6OjlfBCLxF_bDrs=E7*t!)XC6s$f?5V}#
z%H0jhkaUDb;|?KblkSH$UJ1BRdb&9B4UsC)xqwKoP-93D;+%*iad+vFnO-D<Ki^Iw
znJ<~xAcTcl`4n9o#{i!_?na$P-<+aw6GMJb?QQz-oV=Wez}w|xOLc3=akY~=tT8V1
zJ~6!2qAcci-o)Eyhb&lDM_p?nh_ttHIi3qFwh>07bw5IrW5`4bGEJf`f0)8pRm{ob
zi>Zo@>nq9ca;cgHKNmZOG2T8z)q8S%s8$LR^9(IhlVlZ-LS&)j#ekM1O<LCPuFSF+
zASl3+1{(;&X~1l+TfO|wcceD;IUjOh^wr~jG@dN`xK|z2w0j{|Je2T<EVGeLxt~rT
z(P)gUUSenpmV@63iD*QW>KYb*z18rCEX&6Ji!7^{5~hRi;3|L?%Ht39+>v}cH%Odn
zA5kg2x4PJfm)>d{&ihzmvS(4O5T|@63PBA18CI7$%>9t79P6%6Kd$?QMvKNKy^uf;
z<<x-!6TC@|Jg+Q)#l@tpz0-qzYxTDMT%(D?&Rh<DqD*%u;eI8~A~oX1A%om$q|jVc
zzb(0O<M9BcgF2Hi$&v`~t<+qX2+<}B0^@1SYnx~%A|R<Z-$JjIkSd+I54HVuyJ&lR
z(g=bYz!KX=N;5ZC_+T_=-P^{8UQ$(@(WNm%h7LUmqUk&WA@8uDWF`FUwlB^H?v`@{
zpFu4be^3f{XX8c2j8{_Y*K5CWFDe=Db_}fRF#q7+tjA*!O`BUB{Q6llaA!w=d1GiU
z?9B_c0~@qR@Xfh5z1h-pRz%JWlh7LX?=8x$2*sa=R>#j?7+sp8#e6r?|55$92jk*n
zzH2h|_=T8-K5pjsgoP-(shhWU<PDGGYAD|&eS(rZ$B&$-STF*K0>w0tn!nsmxv10<
zc;rk9aE#$hKAUY-+9Q`aX0T9FMkJBbzK9-l@&FKas^`=}!f$TPu6c*5m)Sw8q23$7
z#w^wDS2B+ao+x_>(xcL0U<Ay8a)}^*j*K^E@tYRw;~d)Pkfy=rvvWOH4hXGyCAqkY
z1Es@GtkOrMDuLXHK>kk8Op*Psf<Yd;sIl%0tT0BTy^rcET{^@Ql{)UG*p+Yaa<iZ}
zgrEak1r}Bpv**Lq)?FO6`%p01V8gzSVM4(gO->U@r}J!=$LfTyqLWg7uPH-?h9n^S
zPYupDop$_Z2QK8FkDYIYU7q2<uP=`W3@-KxE`M(rygr>#V-AEz@SForpSOH&KZWvM
zFjT!h|1@?<{+v71pdo^V3oz*d>GO3VFP2cPFeD~=5OD1_EsYD&67t*}wLJlj*SPup
zEsZD|vYdnb^2{$EZZC-;*K5{+Fw<<}2kD*B+iobyK~7#$;#U}O84?~12-Pr@Kx16&
zR>89nQa&WWeIGzZ1eP?E<N$&V42jOyBndQBug~7G?c<|vLJ}|jlR`&o^}yve8f@cu
z*JR_)DFLxHoL|5NVx{1Uz!GgjC?ySjXnU#Om5NFQ$A6trA@Cy+dZ8r_1B%;g2M<V`
z_Zd|0%S9bZR0ODV2m<*o$HllC{0=m|p2vs|>|dE@7J?9~_FMN1Rjf>jB@I=8vI#lC
zQjZA4IW-|x38G^$C{;=L%2eDV0>0qj<j=cQ!Q<SQO<Gp6@Ua~@`;^{eIm1n)@U321
zGgo*T-aKm{6(bT7=1Z||CJB}|ByLH(!2NS&p6y92EsIUh>Rp*<83BbGVuK|jr+a`D
zq?xT5aZ0)hd35p-Gsh%`7?-8O%S&W6Ejly~Gl(Y3-=VrVmUr(HkbaTEAt-Qf95#6@
zO4Ol|Pk@-xu%8=DwMy`u(pKZ%p&HeK(<h3oXo_yMr)~-owH!bZSd9u(V)2kPX>yKp
z9FY(VNOyUN&<7Bg84?R&41;&bMJ2_=u~~+b;Idg*$}z%-oB9o%R3)S7cmC`t+AH&n
z<(t^MWm#_A9lUwQharaRK5FL{;jfAlN)+x!176{XR(O(L!2n9IC>hJggQ%NJWg_}o
z{E{&7Q+r<oT<E^8+F$UDM;l3FD)<Huo=HDO{sGU*5^{(L!P=&tQ+zqZS`<;=TvF*o
zE_`!HCX%>)#nN{K<m~VE!T7{sN)K2Hh9(q<8?|tEAjbm%bB`c<H}r`z3W(Jocb}k1
z2@9DPk@SKELwW2kItt$>hCk#l98-KUZTaM5$dlQ;Cv)HUiT4mQB(O<Lc++LC+EZ?r
z6#%{_r$*S4O1NbH`K0J{;>kKZj1WLg)Jw8%s6{|Ty(vT#>I>Qk0Rb3ck9<L-L{EXI
zoCJO#syPhk6a!%`rd2AYvLf#$E+Ee@UTehA&lPi?7E@7(Z&elZ3Uk6jO9W3bp-64M
zxsnA!^2-nqR<aa}#pGs{2vAVV4pCEgmV8((f#-8jCIx92mQf9n94D4iSCi9il4|D@
z-JC1EWGpjf<<Jx+0*99B4Plt4inSr-AS+ECt8(WdcJn#R0<x?Ei&=n>Vtq+$2yVFU
zP@3aN{f00V81e-IDiKnuSzk~EmP8vz3OX%^C}G^po+ah8yIsy<Dv*E}Ja}fWl>!6Y
zvwte-3(TXS7Q$je?MZ74<5ltCnITaMgpy<q6Gu_3Z5p0@THS@JUPlIjH%T*;s;<m4
zEXh$`jpRU8kteCmP$^X>H)aP@bBdV&){N+}Q|Z-!JZq?ws;D|^uu4z6t%#^RNqapp
zQA*E4aeNDyYWpEfBM!9LkTlv^_j00=TKIWpQhDc4%@Zq1Ap(j8q!b1Yry3&az^iA5
zr3>jqUPG97p`d<li65N}U5j;8Nur`V)Q{g_Qm{41$vadO4i4kb!!a(dc=c?FNW-ww
zUP*0ps6o(+&HPkw5?5TPR0o=C0-sV#hk@oV37QE+s5Kzv`~^*_VQiF1)VG&-#XnbB
zD?Qb;ZqN^CQv2Lej{@){m&%2;P_t61ZM0a3uz~4ejrLD>`alOlM889x{y-M}ki`7O
z&m^%RYkgizwzj%PIIb$3Z0`w6Y!D&0$cAD*5x4l=WZmyVZ86sEabfKV1?@>)?J1wz
zAD*?Rvvp)Dci?@ooUo4Ef{y&Ij>69!MQ0rtwoZKiCEgc%7S>r=(8=VWW!~TV;5!)g
zxD9Wg{a$X1&nQ}}a%8E9Cp_qEv@S~2W^QMLtt$%t59aRssfj=S7yX8iLJPf!l+b%e
z2tD+Up%*Ekih@$5NlBrLfPjFC7^;Y%C<urkp@SkKD4-&S-iv|=3g+hXJ!j6$nYlCf
z*E^FxU?;P?^WIl^J{rHig8g}w5aL}QQtP%+b!qd(q{ag})m9MU!Jn*}9=Xm&2_%&P
ztxOF^jDPi*xFG-WEOP2?=j@Hve+(p|=xaI$hGm`SzV}|g+w64uTJcqfPvCAhXGb^w
zL-)V46+mM5fCw49MS?K%!OO@j9pvN>WJD-wBZNEzlHfccu?h72yxYU-*+UTNL3H-;
zFbfE6k&H-9M9>SVS&~dBpZsj^@uOY|T>)j;KAL}q8YN{u>(lb=8xrXSk3zDn_(Jll
z6>R#`Bl=Md{pdup;8u_LD6f$&*|CAwd8^y?q`&>vfYYmi_<0&M)(a9CaIhKl+&b&m
zS%b~t4H+E_KH&{(sJ>D**v!sEVq<!Fx5xYXD>p_Kso9}4nohFSLkJz}{UF*&y-W54
zz<>6nGiU@F9r%VWd3=00Z?pv`G7{)E^6&acF7rsHfWVd5ODYL1!JG9d6>UXZ-Q$nn
zB=x+pNNjnk`-WhzdZH%P(fKxt@E|RxYU}OWUft1t&(T58(T5GyJ&B{Ev!i1tqv{2t
zWaf7tw~)$B&=Ar{Ya(a#g?Do{v7(d_;Wv=HKkrr&$JWY3Xxk}9O+!e2CQpFDxp?fr
z^ZlpJvF)77J^A;CHt)<^-f7Jj0hO?wt-dq5BxU3~4sDWs$T;G3T!&e%QFm;T=>t#F
zhn!H8W}AwZ>2W^W7vmTP{kw`l5+}lCT=;(XIL1W!UH#<YTN%MgRojYjs`7-gEg5+J
zL9J_2$7`}AW|A$TOP6JW;((J--~@BMHoo62nuJJ1j&W;0NP79v>D{E<%?G!~C!Xy+
z@I=z1y*^=2$6Xaj9`8PR3r?XrCPbBM&A)Mcnw$t`sr0@#&SFIv-}@ACe_DU*#qGoq
zv()JX!5MtnWZKrWGB86Btmvl$f0><<RzWk~pHcTR*|zzdsqnd!Wdhy^3qJe#&gp0K
zvlF$mpGn&lO}$gO_c<nt>T7H(US!sr(N8z(eU;gmZrc9Pa{sIJ<*)SVUpu^}EAM=v
z31}sHU(-gvbl;zq>KGbmoE^K_#QbHp@#dr6ZyZr4votI0OV_vA#_kBJ=Qr_)Z{PIh
zmb~Ux6h2>Lp5qspTV<JQ4hMJPDm|3HSB;apl)rmmSvV6J3`o@l%HLy1)m3bi_g(NC
z;Rug#hHcxg>y2}KJ#$QBlOq@qum}7|s^rCh=<>lV2@Kpw5TML-Asb4+LsCEj{n?dT
z7!VU1$ci7#7T&9gToAHaP$&Zlg(Fk|fQbZQM|@$~q40p_4TL5a&>#efVzmJX?2xM1
z7A|Bjve$pVzz<f;ty13Up#Xq{U4=t(ug^bb1zH)`dui?To6$dZldCIyH|f9>Mz#b7
zmvI<xGNJ$rAtDioH%qL4mel7+@6ih~$%rl-G&r9zftrl)86%A#848*h4jY$p6d9Oh
z5jRMXb_&U5j&!qpZFPK&<L+`Z4k~k%C58lfL?N{U&@1`O2yM6v4*KgI>B8JHXUEzq
zlDRn<@rdnvRsMPb4(def>g28`U4?PxFS5L$Svaeq<<o}cE1b_(-v1lFpil397X%<d
zFo3pdf%q~90Lq~E<D|r$CCnV@3VD&+ZrKa~SoQz_2Th`Y;7x!K1*8&=z~TTf31HEN
z1ITp&4Cv)+0E`3ZFe}>0%d5&v0A-PR1H{F)!4?kwudt0=c+>=J&CxM$(DNGr5X=g{
z@(zNsy&4V{pxIjayGh83U)1E?<JY^IdjN|SNID$BrA)^K0AK*5E6WUjx)+$t08<7Q
z#z2V6Ea36)pAg%@irWH)+xEMC1px4BjHI9p<p0}S-P<9CBdU}Eo%f{GIa2Z*?LPvL
zO3VOmy959<$!jCw3|bU`Eg!6f{Nc;G$MOf@CzHC!%equx3W=cYys>nwznudT{xR<h
zZS3hYcI_Qx2!A&KfP(QuF*3`0@&X0;J(G-ZdII6w1tlu2vu6KJc>h~Jd0(r0-{1i#
z)?hE=!O;!sIy@hwo4vUj4muP5D?)JFiIv^u{E2GkarqdDQJHpj03pUnXU2h*xuwew
zcHjuWfU5lcC>bG*0oWN&Qg%tA!rv9Jrv*<z`$<1<?(PM!0@!ebaX9eq>AJ^z(iz3$
zYhiz`va-1V)!MOkOgQ^hey(8rW2|8~u%)Z3`KHg5RZ}Qv5B+11n8Af9tJ=eT)d~Ti
zdSH^_4IUPNnQq1@Uu+;s1xoq9m9Z*OlOzBCt&G{#czpU_%GmOkPn)hyz5}@u7pAt{
zTP{77HT^QReW5*KneiGOMcfqNm(d^JYf8gqAR;LO5NxpzAix!M6p>3LmTN}v+oNxt
z?R#rBc7+b(`wSKi@i!sg>A|-{6Rr>9_VRb-fnXuUVJaN$X*iZN#$c=h;4)sZOX-(g
z>pNmmIIE+7aunWcaf?kN^00yLAoGnziGj(jq@CEk`GG#?`l*xn16m62#qV>c*N=WQ
zKNs}*{x9ion#6n=vf==rkCvq|_RQDeEI>ieB{(3^n?+=ft7Lx2!+himgpAEY0Vx-;
zo0ZndV07sNH#vB#h=#zWwobO$T>&v>`OJHKjd9Yg707Do3<x7XJ+S7&b+r#6V+0~c
z8O=UHGNQ=4meN(a^}5IPEkCW~n`z3J;ww*UdKsEBHcEiH{Sd)lU8~_$9(xAH@ug<j
zH-pYPG?99FdX}p%at)*Td>fkBdBL)L5_hPEo-)!I;BZT`Rzgm2Q9mI81Po{Bq9`0!
zw@_+OSonHcC6fmo<413^3KIU}*oPJtPgL;uU9hZ0AR9~?WnLg`rVyH$fgHx&yMXum
zX#W{eU~&UIDsE|!<@v2;@)i#W3s+~8CXZyuD-_s-_p#(zDZM@S+cSF7Io9iNjq|rx
z+_!pb&Fpj(#Q}2l@4N#t?CjnI{KpdSguOsJ7hy?*NSOew*_sio&&Elc0piKhlCbw6
zDM^40n6KbFVre94`W(mv0QAG?4^ibK6bEqns{p*U6yGn7Or;vilPKs9790;Q0p(YO
zR0M9W$>LnvZYupc5{L*8Br{S+)Qc&2=EYA5o222u-yuzX|0!dOQ6(WQlZwHqp!D{A
z5l@dKc$s^gSv~Jd8LJ?tvQ(`Gg%DLJBfVEz!r%^}oW0Y*YBi=NB0DJltaP``#(+-+
z-R{|a0?$hlZr~Hosn^rD8mG}89bLP&n$2VNJj3<**M98=-KvHFiWPcqN|ncxVkv#{
zN!Mt~*uS`?cOiOlD?h9yc31M=^Z=|pS#$c9N3WCrMwD3nyS~@Qo06DPy!tQkVA3@u
z=`e%8Jn?9;Bqdq#T^Kd_WS=(b68`-mH3fiTaDmT+sZ-M#P#XIs7B>tRAfXd_Lg-kd
zafi8d1lz7nIz;I#70)q)Q+qLh;E=`zk$qE{Fl4aO282->gXe+wA?$($_{(tZ1RFGn
z|L7jbXSEvywa=s}W5?vBzLSa`08ZPP(;(2^m?YaD9ymJaxO9ayV9A9i0~|b0paNt9
zYeX-oG!EYujs?INvI$ZHN85)oYRCG45+^fY*bRZMCb1>efqpQWF{={n$IcROVIuhy
zM>P2^3Z<B24`0sqVDev!Bj6PD#m`8BtN2oWN~*U)AcD<vPm0&FFIxDC3ISwDfe5pD
zyJ+6$o^PO&BesZH5&%6C6#L*ZYyx#G?W6xHn#7<O5>5g!g#(Q36-JCGG>7Y1XH_%m
z9sr{iepbW9#f3#jNa6nUZ$r`MEl7|$4h!Ny4qsJm!a;z?$lh^4R|*GJCp9CbOUd75
z&uForC?JmT3rfl_Yu|oD({YrdjmA{y7!D%g9Hp6@0yHUU_Brx6)DVoqr9+g*`8Paq
z(76?Q1{5W`>aHoIRK^115WvNWlcG<bEOZy30D6gq140h<q?b?tJTCYy^s_^pKIO*h
zFdjfg**pOimO9p4c77UQQ<wdSPVfTm%%y>+MIcK)v#x2!SI0;hsHqEVZNtutZR)xR
z?(7KZ4i9X+!kgyLF}jff*>Et4dkF-o%Q9+m%eS7jeyDJV%nzZ=P~8K_xnMpMLq2-T
zt60@D(rjeV!5^n`(pEMgjpN&IpMeIf1wzndt0-+8WaioPtCyFJg9ip*Uu~8OJ1v#G
zM;rS&697N~!zt+30{bJg940ovhl#D}^PcKskHUKA#_L{NwUEb?HyvERlAc*7{(`>#
zkOj4J28HA-06|IO9#ZRtP-e8+!uYof`+h8PUqCedl>CGd`K<A9S)hFlj3v@)JY0tl
zAeV47qz$3mA`UA!hlZ+R9qP`-w9byN`}!5(y`zr=WECXrj5KhiA1?zUQGjMY=o#P4
zd^Q7vzmhag2G6Bf+y3Fwx$DD)Y2iNwk}z9vGYx{YC>5>2Ixa)!7C&H{iRwaq4#T{Z
zd$JMa`u4(#s!Qwjz>{FgGp2U@x!}OJAa&%+GvlGAQ(s>mnyEIT*ICY97_V<*jC*Vs
z3;?4u@_?^HIFu)pa3<01mnaFz&Z8_DZv=Xyp{%m%h66c7<b#l;7t<arK(ew`Jqu-!
zs0Aa4HaW*nwZBM7R~WghBUa_WCG8<lrL*gd&+s&=fi%$-IwuS~Iqb#4FtX<lAzsRb
zGH<<T%Gj%u<$$k4@Mn!~nZiisZpq(t<qDbN%w+E{9{MuF4+QW|4dC19T+Ygd6a2FQ
z!27>um8J?*aQg-KX|LHfYQc#7_bnw&I~=ImpL&54&MHv9&K%(Y4t!CzvJ4<o1Vrxu
zLTul889LlqF>&M=&-?%!0Loi-Ip48?DQ7l%xb1m1^v)=$Kh>UZ3T+s2Y9#`!X?*eX
z_)i&&s;4Pql=#6=2}89YFP*R8c3f@a59Yi0uU%;Np;$S;CgHm4YETsJ+|}9AvHN0q
zF3E$h`G%2+N^XOCchkb?XFt6fW|?SKuy~a2@!6US3liHL$h)%`o@t%fT@g?NV=gXh
z%eJrSV;{PqpPXeM(Z{Gg;A_~*cxZJqX97I#*cSaJz*l{f!&ji+w;!J_6lD)E3nvsM
zAZSUvuQQFpx;zs^Xvbf)BLqo(KEZMh7fVNaoZMO}#)<H9R{-dKE-`4*HvzdVJS<^e
zWcs_@Eu99x??b~KL5zDiMri<?)b1w)%0C3@BI#~em^BNq4UKWp`>|5c$U9CdF$<E}
z`e~(LT_hfa?IHjT8DLyyRYOn(j;X!Uov#MGre?4Sp}nnG$N+s@y{2XR>vlGVJ=}YH
z^#{mq2<6U?H#j~w@)JiSTQG?D5}@U?Kp4cNEKsb&z>~Lk#Vb0$a0>0-(i1-E!B%z&
zCf>N1j|+NP$=(DdazeHEAs`xNO0EVg6F_V@<_PioUqo4@8$oUy*=#UIR4;h#M!&zp
zr{Usr+PEu5VCpM}zNi@ua488SEguz99Pr^0gw!jfmEoTGRPN9HD<M3ESvb0*;)^8O
zQCkd-eVHzYwq$FzFTHcl0r*CNis|B*n=0*(@nR-`L!pZ9)*Yxtzs(I&Ij)qkohj%C
zi^g*yW)uM8lVynGV~)=}+5ksc_gVfAiZ*(-S1Mi)DPZPDFDycD)<#3oEYjXIGrI<x
zwE-|szO;t;#{#%=0$YZA-8s*?dsiR5C~tyx6YoWcX9t8s1a!0A_jE=sy&h5#aFsSM
zTTAQU$M;dvt@%>z$pXIlsfJDBWliaE2fRANxa)=*0iCSA@@DCw!ymN<Q+0(KZw&vj
zfKrJ|EkELLat<unEqQ6t7WvF0Pw~UKIYM&zFA4-$L)JQf<fqzF%8I!1^0+MTHjF5W
zjFgUA-k-IU-!!~;VoCDkEnBjzl((wdDks@k)yVUTv*F!Pw82cPM=g17Y#?zrtA<f4
zId?F7UFxF~t0rdas&Ozoj=qtmjCtnOFVQ^<wQfta772gTLQ}?cnc^{wPZO=XX059l
ztl0B2I+$&GPO|G$LBSO3ew)#PRM1NSo1w(f#}q5RVe5ego3}O^-JMp$G-WK2F`i<@
zPNCDwgak|fk1}Rs`^nRGD%5s5(RL=s_A^ZxYq0&=X*)Y=`)$^CZp-%ji7l1FY&Y-p
z&Wb`;Gd?<IGd6Z$T@!4#nrOF{W4B&rx6xp?*=e^mYPUU0Q^xFePwe)X&;JlO|5N__
zzV7)0oA;YJkmb<#V?`NmIC^m$=ugA>zn$k#M$ezlp8q#{o(Gf7wRZmB$$54x2&9Lh
zx5YrbFwiTspB?zx_#g3cj(iML7l!%WICC0?xdy{>I{wcS+#G$LL*Ya84{N>P8|_@6
zOYo8RT=<dH8>7*~yf;6zmD+Q@vlo1)cnQNOg39K;Vt=dQ1J@NMfg1Y}d53D$gy0ni
zDZyGHZoIHWHuBWc0>dbwkj*V<f2-4heb_<PnNcyxK~-T=v;a29MWFUEXUjs~NZ+4O
z4*c*S(XlGnQLW2Smm8^`_Tk*GtacMR5f-aUSerfpS{}rR;j*K#b2j>&qj{3k(XEVH
zd8cyhMD?sAU)-Aq!=q-WmNuW99#EVt1f3mN9`M(U5}KT9bU$JA#u@@Xm190R+;{dc
z6?D^sxqE#QZ*+3~WF@-n{J6o{S8!_5_mk&<mC`$hMftZcZCtY5rc@+cF5REH_G5zE
z)UM;;t&E;i%f~4K#pN=KYs5B(((TEfM8`q(=?)WDGeOtbq-ljmR)>kBdN1DC)x1rB
zIK_Q)P2P5`J+k4OvBCXvrN!n(Ky1cL+=yOo=~vt`lH4+Hx@FyWqh>d{-RN@5dFOWX
zn_KR-Ti&T#K8yP;LH7a$_d-4QB3t*{Uhc(L+)I+&OK-a0x$l0r(fwYRd)Yhp``_Hl
zx7{C{x|3KuDg-_Lf1r$cj%|CsKlL1E@%kX>HKE`&sps|4*6Wj(*VGlS=_Ie2n_i#q
zdwps2`r73+`_AjzH?O&EFY5PGFA9tIyrB1jg7>1H_mZvmvX}SD74Ov~@3ouW>-W7k
z8of8Wytm$YZ-4XN+4kN&_1<Ig`61}@Q^99n&*#9_=a-ky;T50XNj^t6eU9(@{Au+0
z+vRie&gb--&%bRS>ZuQaz=DLZbc$H8{{Lirdt;%m-NPvK*6nE_!B|G`lK9e$+NM-_
z6dhuPqKQtcZKp5_`O2$6RZw&?=(G?NQOu2?8BFgKoT^Tt&_4Ce@(E&bV0WaiP;y@E
z3`Gn@3_;Cn4?|KiGZ+qGe%N_~QYdnaAim=(W5#N<hINV~iq(N@>xdF4f;=WwEXWtW
zgS9U8Q`5+!%IedpV4>#@p(*4Agg%|!UPeehozfl@30+j1^KZ_FAX@27^Ziq>izpZW
zTKJOZ3>Z=FUk}d+ABH^)53p#>z6Q@o!e+-QLxb93<}3c-+>A5DX=-kCetQ`f(gBDV
ze}5F6(J=kFL2UgD1rwZo&0_g+9Z^hrIoyH{F$O{Gz|JdD;*N+R!?Y{O#-amd$k?!9
zKleJ{$COmDJwh!y?b0BlT^*6(a8XS;J)w@M2VbE}hB=WJ)yR~1U;#1ZmqLqmn<0i^
zd><oW2n4Ja>&teSfo-C9YPy)x4s%CB{hLxlkWlxyj1cm&dOjpMKTXgqDEaUr6~{vh
z4O%_shVbaq1);z)dlz+gD4KDwT1uMO4A^6jVpGSca+ncI!QT2uM6Ezl>H_5k1O1v(
zQLi(64q>G`*gLhC5Mvi_#C*S*yNDq#7X@X<=BHUmFV=<!qH`BDvFVSn5T!%d<7A?t
z*?b7{k_-iQS2C5@x*i)$?}C8c*C!-n{bklJb3sE8JR!G)F8@yR&$nCQ&&{}iN!5-c
z>Sd-nlxNs`&l^o$ew3Nv6y)o%2fM@r&RD@llGYPu7CaAO_9#M;-DYy|){s77c!e@j
zyZKvh9_394Auni>eVq;oXa0d*6_@<W8RZ9;#oA#h<V#9pbl(o4)Vo(1@3n@G{#*4K
zyz*^sdyZ%OgW0kk686b#8P!Vf9S8Q_q0AIB`m9jG4>O#nHqwKj?cQ|XpKQGy+wz&a
znzFXDYqqmw78nFiUx~TOC7F5wou;@#*~raqc@mm33`0Btd+HOD>jL*`w;Y7R=3PSm
zjV(|Sdps^-zgZwonc)m=^pTmc$b9f>GT0Au(Jmjt5SChxTbF1LsHO1@Yhkx|_VyG5
zLnOmq)Gl(qU*HN0hduRCngP3$(rnf?4KnG2;4mlDC4?Qp9dYA2GNK9flYjbq2!$dM
ze#K=k+!{NtU6=mns&9pNq(WG>WJZ`AB5i%}r-E>l_Tf(|qL_fqUqRFcsZRf#JPbqS
zMNtu#26rgpxMhv^`;RE8ic|i2)cv|RSR@c_q!evz5N&ck`o$V7Ih-*W2&xZ`u5Hg4
zDUPnk9-!L}>d4WidEaFZFZ$7*v<${%6v1LI17i{B_%vG`MSK{yEdfM4Vk4@@WykLA
z+ZlX!w!2(fzWE3Zsn;jUBQuhL7?;>zwZSWTaA;}mMjh$b!y_W-{jdGy42fa7l$i|i
z@yq^u1gW+wPJ0CHd_o)>QN@l9(2Pw%!q#c`*LRp*KArU*UBJccpnu?&F^J|rutGUZ
zX~tJ&kIpKe&Ta<gPYG0Mhei0%*$u;t+~}xE(t%DTbcBa7TY7<4;J+@c!FY?)#DR#i
zWTJ)iHQ^G1d^@CIbzMFmqJ&zxp#016N$i_LKRaN>#lX-0cLrxGee-KbB+A#_B1HJN
zzY}>m7M>x7p)W%~Z?w%xw$Ycq&bWjk7@#5FUSD~yzw68k-qE=BPoF5KPl%l%f_&)i
zTx9fbpBIx}ycc$fjR(B9aui-1GcQSB8%LBtr=eFMmsVD*!xA>%5hN@K;dU!}6#D+5
zgs*n-Pp1D^ptsb}iFTPV#URG!*z5}^q9HXQ#e(QxyV_Pl_jcN^V|u;%FlMA1+MG+@
zujxmA=zUIUIYIi86!cgO7cjW{hw8{07gR@7pUEg`qrX&q?4b{Kfd{ZriQ*Q2%f827
zdJQSpCt$}fnR)+-m&$NnN%hR9qgiF^HLL6w8Qs?w)ZAbV-Al8viQ03NOzOpE9<U1P
zx(9AiuW9?znqMh&UJXYT3#R`H&AecqJFC+>@}N5|ELUD@`1}X5-U*vSL+}sL!5n_g
z$gQ;>V*g*tSbyo$CA}MeHU4pBM@SD;^4@aT(tIZMvCiS4L*wONvQrHnZIRm>zvO0`
z{Duk?LJsA>v|OHker5AeVYWSTb)qrkx8hu9!tbBko4=JP|1ZkeaDkNLlh9*71DdQh
zQn;G??Pb*W*MT>9uDCz*87RIpR(vHoICf|0%GC6(>i<^8&Q|NkuUb7!c79VRW|BNp
zv`&Czb4Zxfnhz0btV>h_XO>15hgd~Tas_<(h5ucT)fl~}lc#@QyJ++4e&&$V{~^|P
zHE|$D6cP_HOUu*wF7N*~B3FJI!et`;0dkh2wJ?%YzdbE{<!G(XG3aP!F*o?(sh>dP
z8x`L9RBll}pXAR?`w#HvzQl>;YMDvq5ty~zpgbmMdov;4*FWE?o{a4KdiAjIzRMau
z236;q@Vnb+?9A4Rm3Spkk0naof4GgxmCEz_@|qTNEav2k%=pU~n7O74mv%agYI>x<
zlzNavQ^t&r%9=;za+f|p*e_{2yixjCW?Y5)(_Z*aDPqMwox_bQepNG{?vG4eMRvWL
z!77&{qiCs7&tPSDqFCO8qr|9su~2LU{rwuQC`4h^pFeU<J;f56O65xta*v;y^o<qw
z9xmFcr#-)QNvL$D;O4{L%dZsLzO^omsn#6*@O&}-Wl_Pr-!D?0D?aXdj?UT}9i^_X
z&-a-mCu8u#ax+sp9QvQRvSrSeo<xpyGstx|;Xx$@uqV(5lk$BMx3iUM<BK?KTe+{F
zs0^phJLZUaNza>iccoJs91Om9F2K0FP(PU(<h~}VjfJjrvPhyue_D5H4T-akO#5=&
zd}Acnr9P=Uvj3(fd8Rk_LYQLkY{YUJuTVVS+(m2k_?WVLI;}?)^k-}6zo~z{^6F-R
z&QoB0MDy~03|dezy9keqU*-b^{<}Q3ms@8DqM{`~Z68W?2RKGu{a#eyCF9hcq_uJf
zCL7Be{UGqX`hw`2_Qf6Xn;e9=r#jl*pUV_KYZb=YznQuFHP=BQu{v->y=~}Pu9y{y
z5bmy+cLVY!?>GH+AE&nJufWwfI*91CzsX6K6J%s6@**UP2B2ZPT{J?Yecx_+&F?db
z28VfGciQ11W<{AhQU%-%x`W$Bk4{tQ`@XzUWmP(2Rrp!zpiUcRzOeO<{Vh(|Wy!a-
z@W)ft?-<q}jCF?D!+j9=JXGAmkUbo2B<QVTCdL-Y;_g``y6|dF+pir_F#BHkFP71K
zLBv?VyPAs@u3>icgR7X{RAMz)Sh8W2{VR!HNMYSv9c!l3_7NkNFJ`IIgv&bkU?S`}
zn#nuBF~~AFz-y8JQT8AL5`m;=IASBXnuy$p-4o;e#|AdV;LX2tFR>;ISnB77vs=3@
zh}G>?ag|oEFX!Ck^+wTYd5A*&NeK4U$CYNI6aq&Xy^tub4ApMPu8Xb|KP>f@`2*^|
z9aoj9#SUYp(r_()Qnm2$#E_h}15<H07%DN|Zx-Wz>s-5t+y%D*QwtE7J+mMu3}ntw
zjx~zY1&Qp;5DcOz+};5q9H;FWq8R&I+Mc^Y*2<R164m~^6T@44AXf7+HcQb;@w0Bj
z5|&FnBZZ!~*gK5jGRK!j6w%7!*VpdbVHpbKikAp8>zQyySq@FWQH;HDnD1%iXwFB{
zov|Dy{Z>qKvS*L51h=(*|G0eQ&mU#7CiCZvM3_?PtJrUmstw|PWSA+7<?m+FQj9;a
z8i^JO7av^`Pv>B@Qx_HBz9eNfI>jFE5b(&>bXYH-0&Z=>!My|@5biY0y<kIRTkwR5
ze8*GspA|co{TqfUv~GO7kqBlwvjx|rXNPJgT0G!p&p@_P(y74<3_;2w`g;IE%@ZX2
zBHUP|F)O3*E*opkct3YcR)$9@=&Y-<i1`*ibA9%OXb&b;w7(=P4w-spa3(`OhJPfs
zQ-pW76lTj{cq6HQk*6*nqT*1;5!eo5cy<7jc|yu!T?ccdb4!TLVzRQ?rkTI_n|QZT
zKIEVX@W7c&{r(=CYbR1XeRchu`gk^n(jMj);~8iBKg?0<jM*&s<c*{~*bh5s8M*`J
z2FOjO?7BYY^MGXHatJgl#)R|r_zn+LH%B4Vmk(dx&x6I;T(jXh%eB5{zU&7Tp~4OM
z3AhZTtVnOuM?;>}J#)saTWJ?sibS8g8Hp9JW&H=BU4riz9>lRsLw_>AoFSr~vfHI{
z9S_%0GWamQITFn5^}OpwmsE_LQ_${joL0>FzubYEmK!oQ92qN@K1<acKH~q~K6s|(
z!<TbypM}F_z-n`B%sEXWc)nlzru{v1x<?C@$)=gwv|V<eBDCNOoT0)V+B!ay1g*y6
zwfpUv*fIUg$~X{5K801c2+LH>hSxXQOFb{<J0MtL#`_%49%j*Vb~;!@f^j`h%@fQW
z35Tgo-OAImm}kC*f-8-UPlXFqu$#{i`95}-pfB|E%47Sb{4BHij~1wmIeRd%R2+*}
zlRf`@ZRU$-g4Tl7Xtp?<n0aVV`b}vtgD4vvhu=J_W;L0)@YfK3G#gXOV%5Y0G(qI#
z2fb#v7?1jdk`bMLxbDZlbH|56#O|B<{GmJ(kf%L8och~2eA9D5Z0kzr?CIhUz~4LA
zjQD+#nI1(rOC&<Yt0R^(jM6G`5-xW*dTG%tpNO-T&h!Y3$d_-)A2HucHwdl>acV!8
zk16?ct{|VuT;rRtOREJ$=6UmtP_4}izkBoJw^(&|6KY41Ftz7wMFx}umdHc%+10B#
zA?;4=*IP67LsjmLvCXjuk~GlI)>(~rCxs79Ef_ymcn(JqCnl(S8Iu1BH?ohSiYgDy
z8FU}z9vD>?39k>mRQ#DMj`1tsb?epbjDV)l8#C6e9e-iJe9>r6lrszt6Dn!SH5lct
zN;P<`%bXXN0<S1y{MEy4@#AVrLnVEV+gD}EyTsL}f4_Dez>QTRKb*L53UrXv&x+tP
z2y)>4fdh4!1W3feU*l8w83QBwiioS#fJkXz_g^oQaHP*g>F=g3{OP`Z`1?hXEXEA8
zgDTu#q@)Yej{Dxt&j#+f=;jl-+~{_Eu@-PaqhW%4exLABABQLLOGK}sJm{mApwW_%
zIFkNT56NH{sS*cL+M+Ov^iPZQ0~{ofLx1ry1@W_2n?xmq-~9aK9p~IO$f%mfXvQnV
zu)?6)B~-*j@Wjh>hAt*?o)?<MaY8VK<Kf)1DFSzUZA<jk@3O)<+a8IqMe>^}(+TAi
ztk>Xl!Y8=HjU`HjtU8Gj^0YYGQVD6go5w^AHY1J`!LK5zyl%Y+s4=PxnaBR!G){ys
zy&^T=*HpRCK-yTo2X{7~Hjn8j?Tv>wxE<QlOK1COcnP5dT&*a={l|UEO#r%4Snx98
z46<ML2w+m@>|b6`oO|$aP1xv&PT|;CVGZ4L{9VZ-Rq|?ORCJ{&5-)t2PE!|;G$}s2
z2TBm3A8n*#E)|t&x&^t)3!gHXNis3JZF1yHrI(C1d49j=jC>D!CtmJRKWr`+{s+u(
z7s<$DqO07;&Q%}`G1af0Wa05+d3_tH7oaPT_n;|gn10qj#^<h9@+J6jikg^u2k7zj
z{imP_;EzH-bDGUF+51|1i>P=KdC61k;lAcbf>d<Q*#?mQ%stLWzSw!9EKNZRr738A
z;5QWpp+ctlM(2_&(8olfpB2J%m6kO5Gry1Bre9mUhl6>*bENky(nM_Z<9XndhjXQY
zr{9m|B|Gob{}8mqy9O;K2I4gaais=Mbe%6mjYb2#p4^k45VdN@Wt<KvINYtu!ks@{
zQ1UMCU7tP4Li;}f86j&8#xqq{sDTXO#s;AvaTBo>+bZ+5fT3W2iSR|v;P*jfnu12h
zOjFP@X$qP#L(?tokE4**MH{X@V|=PAzS0uSZ%Q$S_|2}~@7M0c>s(9y9^bFaW-|V=
z2whBJD0dX!^5>Z|7L+&SaqHE$2~fn)u@EjA<XmLFE2SCVbEcCtttVwp3NkJFytVAa
z)BaF%tItTi*F9a_$cD&mRdHXThk>!q`moQ4CR27|%!AF$utcUzoFuu{0CTtUxKBPC
z5KArBT|+Zq*3vZQ1fJv8M~qp>Xht$vcu7RpEl|RS*J_D!CJrx+=@(k_kZga**Us6P
zWys(8>1>=KkNRzi1nPaxNcvPi6Zs-EBicy5i=DZNth4}PuC7yNA;O!;YDdO}wSX8~
zt$}or721fgoh&%F;FXO-pb2Mxi3a^4-`>D!cNj8YzuawIU%ex9cjbHWT)Jc?nqdvN
zLYC2;8siKnN;a+BEk^S#)v#rfxjjLuUSDp<Jc1OX)&2z8a2X4+fkbmm!gBk$Er}Wm
zi;+Qr7A6nP0|Le+di44)n@O8GG;ktS+#B>O3sm_UCuFTC#h7?dV!26Ba4N&`ba7Le
zh4iNFfxlh=D8$~xK(rtBr{22Eu60zbG6^md{N0*9!;H(x0F4>Kg_s=>TL=4toJ@w4
z`5rz`)gPuZ>$`uje`2WSh1AE+@W;)hI`bLv8F{~uM4^kdC;H_7^UsK9u6=FO;!9=W
zvnJmbjq53Q|KxeUm`fEb;@q!8>UCM}oBKxh?VPQCCw`>3#?GyGB*x1XH6fgdfAS&q
z%ttbJ6Yg==fNp1~=<|U?B%Y~h@m0cTL<@7=I+^>3fFS#-y%6B&oRwXhtb9@iA;@qv
z(CI1r|MeBhOy@@_-zC2!D;Jf)%RH@T-OC}yCAMb_#_u-17}r4tIHyT{SGdh3O{Wwc
zI6h@+kPl{kN3RcDaXTPt&TM!Dc+C0PDXdi*An_BTsbC|DESAT}#+#+6KuNujEuhh$
zlq%ct3~2B)lt)r{q><KpUR+S(=ZJ3`FN93@`b_@xiHM|f$=~MgotvMdDPxL8IfLf#
zUUkXs!E=)+)$g*2{>kfObwP@z;fnR5{VI<ntDczf{ORN27h(NFL~@84wLdW%`=~G9
z<M6J?z@o=s<H>Qk(wTWM&+uLIk47vMA~F;Ax^Yo;Ea=J;LdXI!P4ekVy)ol#x_;@c
z{U>w>G5+gQ)$+4T7Lq1<!8Hcq%O>GUMwtZBC9sHq;nAC`$CXMnVr)CEw=;%be~mnI
z7r*`qS8G&X?Ok>TzEL$1W(qe{x9{g}M>BpT0Dt><`i&|T>p@Rb2?W-=^AD3JsC755
z?y?8;*fbJ(#X)jpA*oEI;{;`HR~2|~9w&&8IbgdZ-Gp~F^~J<Siwk|ocHhRQD(;8R
z_`i>aw5O_ifn;_}#mahw13-3jHabfxMoTKff5F0=w9$(Q<nJHI%^$*TeL|c+MR-+3
z)t(!u8>^}Rq`5m{jz7hjB1NPkg)clu(ljw9RjDvlNuTGUCC{brJr}zET=MKsX=0?@
z165?Vs$7+-=;KJ~6jk}fpYlV`<*I(libd+6Bh^lxi@83R2RF-e?kh}3iu3NP=tL>)
zM=CyjuF4s?^99T!&2BAT^Xj#!zWAlFXdH@{V9<a=#gZA1j77?#V5J0uCTbMhQ6Fzp
zlo|=FlY%#(2kBH1Wt!Bq?lq%mve<)WoxXjYyeO>)&FJPR!v|5i@AtK)_w`oy^?&bc
zQJak(s~HQopoaEMrJ~Ux>V{F#FkN-Mulrhy&H4}24F0NFR5e@Nh%$~<H}{XWU~RD}
zY_T*~x4O}6<=SEmR<~J<*4aETTx`a~;tbrP?V9(E_FD{%TToTTYBmQ}H})M~wKxv7
z*s}gIGyi3I;T$HV1!Hi{QRl$EyTw86ntj+gduw$M>uWH~3%3VRE-5V+zP{M;c+20N
zhI&jEsP0450lvFvZ5ujY&O@4d=Jy!QUEL?3u0d1J{9!TN>aA)>YK$N35X*b$t9j@r
zb%>}l)b1oRZJ|Z0!JJz_h?=2xG+jt@j1)X3v@k}r|L{Ndj1qJCG3creICLoH^3#}*
zZjGz&HLe!6UaD%nJk%NjYYUy!2>GgUbyFkkAu()7Biu(bVwW5x+!mb|bLqihxK3Nd
zkVfQmjP`6y=!Ld$|KDN8no+U8W2<80<bE?1#fCnJjb4mNYHq!L{&xcPP|-6srdcCJ
ztu3YdFmkgkRw^!m33VNObhZ08ewQ56t(jzel$6&-JgX5Z6%%~p@S@aVfaamUd5j-T
zJ#&iD_Kfi>LHWXB{LgCm`Cs!{ZFkFz(mrU<qyDFi<+D<?Zt=dnC9G8-^|C-ot5EZ0
zp@CMB`OBj7TDM(a-uBTdzNl5Wc(k2<GxwFL8kta>r*(&>j6Kl0`|#!6r&{;gUfz2M
zE?I5Vo%vMKW?I^<RlfSN-1tzdkjz_ZT*#^s6N^)$f2kEs_Wye%aPX2J_*3+j%mi;`
z+|sIX?Wi$`FN1B5evH4ccT|(2U1xn<nbIRLjE2c;6n-UFKL%Bt)vlzX9v3FCMw59l
zTGdZAk*OU|b`xq`d-%e&n=Yo&?$KwwfAf_7C{}~z$2*??1{mtdekBQPbvQL~0!u!Q
zS^QN!YeL22BZ1Ps3aNy==7i_>`j}Dy(sdouZZB6U70o7oT^s0SDn)aL8f%9d2c+N`
zO%k{P!_IE9Kq;9iQ|t9(fKAzujqg>jQfHym=oz<=^YTOun2ratPM=R_jZz2yD4r!6
zeR&t1%o(FS+RWmFSIY-Df!@bqI*)bw6r%yo(S7k$orYMT)721$?0Y+O@~A`uTS#Uq
zH5QFVv)UNKj{c6jg2v3X-*R@nkxHCU(i=Rl_v!BuqF=4cgf17acD@PBL(ewwAZ@@^
z@AK2+${T77P9RcPpSTl<A(cG*H8D>Nj9hE(*6dPi`ZFk|{q8U7<!{v3E@4h7fx9#D
zi5RhK7wCA{*ANC~%Lm#sfXSyFv-fZ;)l@JW>6I3c^f~tRvx^;VY{nvXX=3s|GbICj
znXgu#>fce)mPaLMm-aE{<M^W!XTSbcw9rT9lfOB>R-+_xC(^uXqwjgIW*-tC-2?A2
zrHIO3f3n-FSlagj+@T*vY#!2IT}-;<^Ll}(v)ZhG<fFY7dqd*nn{Kq1!7L%M{GYGD
zPmv6R6MwDe)ONL^1I0Qtth7(}>vgGUvH+0!2%$6a8FS0d7IyKzcHNz7zk-(t=Lu(%
znfbS6NR~;JX!wV+ESif{r(Ci}8}rwgkhqL`*mr{f<J7kPO^_Iswej=#-^y4P&$$Gy
zOAa;GcQm}dR1ggwIX-gvzm&01x2CY(TVfYwJ~}zg%cpVvJ)C~o7PUV0;yQ1bch~jf
z!(U$-#u;f{C|1cet_Z*Xlrb~rsOk4gB1T(lO`FykSJp>AuOSOkUka*o-(CC+8rI0-
zQjko&yzn+?665$#ZTUD&cFfr*x(P4;O`}}adsrapgX9>+&<L;>>5GV7pM2yR%ls+q
zKV{7EO0*fxG`dvtZ)8Z$?RS*h(zRHsP;%n&{tI5&Swqw0(?1m+zp27xpv2*dG+mbJ
zMYUSC6B*i&?ZKm-O5l+n??ns1i2R>2X8fQGPkha0S`^m#Nd8U+Pg}dO_&s*7MD{_x
zz>^SVDmNuKuuS0EY(&{V?GyH4WEyj1$(%O4r%2?sXMrUNn`L?XOifwj<LmMwZ%ad3
z=2Huk>rOaEl?Ujfsu1DiTSMwm2hT<{z9n*wQJm~0dQsb*`yD-le1-4N1ioC=yRfuT
zIBvvp^Vz8RN6(fa!~`DlK6})V?M#4V7uTfCxo<_2c6z5p4%UW(w?8@<e5-YEboP4T
z<YXGiJ>{lm>+FI_s^@le)k~W^Q>q<DUyuBvRW#$*%mHCa%<(Gz9JKkx0-}D#mNO#)
z*GT7}bLDvh5&7hu#@H3&>7iZ3D+$-H(e2y7eajd?)AO1R(l<Mck~HZV^R0{5C;pwl
zDj$`*<67~XWYkM&L-Nsl$b+OK#$~uRyu5TFyGAzZOAbDbu~Jjmp`y&c5;gdRU+M>{
zJKtRK&SK%W6Su$u&B6D}8ooStmLkF_r7ubx2jf?Alb~l-1!4!EUc8s$tu=(xnVIzC
z?bBL>b9ZqVXB!+o@8@{EGqM2pt}JI261;nV_2#o5m!Yzk)VvQ$&11|4&xDqgRhzYe
zieG^{wp}>Fa)0Gs-|09$RS7?Vu72I^)3MR@5Ms!9bLOHzitetURM^SR=(*JkB5&`c
zdhQBbz}KI7v2MJaIW@xYmap;Gmy5oyYqk8cVx3}Hg+#E*#=`!qkBoE71m;c^dbpDQ
zZd3ik8(h=6by90+0@{FY{JHzWu!ME3>bV59=JQd1ca&gkC!0ehC-K$qsY*#d9wyP#
z`n3td|76GQg?A3ChQ4e6=$kv)aD5sJ$x8TJC|remLATT+#Yd|iZAQb2XY3{TQb_|p
zp7>^&HT4Sjx2Mbh%V$b<TM)dJ*{}bn=fx$9<y0BZ3MaycOp9um{2i1LztHgga}Aa5
zMMyK&fl9^`W!5ZP9S;~FeLtgRn@=lbj^iHReW@4{x4p@NO5JdUT#$YCnZ*Tc{aUHg
zW%jJ_x?8py(SypWmvb;O{{FM2Cg&n^Zt~Yx@x{8pMPsD+%uz(H4Uo>~V<PXxQYcjf
z!`>@DY{YYMFGHew9ByYKDohw15aN$#F;$-szN6bGd3GdAjlPfL7TnsPZZON>PYrZq
zk9N$l&!QYx3E!<VeK3YGOrfxqv|$J39*dSvNJMy~$_)urmJDsoh=*$!)#etBjLM=4
zwa1s-PHSIk3dlF#p?;7|Zr6HuIepS#u_#EB;UOU=e)rCLW{_54+*nAqWBJ#uTFq}-
z3~@nf50*@Vz*%<$lW|x08&Gquiqf|=*$BLMEWS#gs=Tngd{ba_xLWhX@Wzv4FgIy7
z*j%9}ul`t!x1RZ}wq#}#VZl^bbPt9q5<wVlO$Zb6)6X`kNG8i0>i%m_<NHYM<$2uo
zToChlRlSO=7OIh+Ac%qRPPcum72ST6leOUlYyT+d#eIL`v#fL1ALoY-7aP13<VNUY
zx;Ls{)PJMj)O!e?ey(vv;EEp7<1y0t`CZOyO3O@}hm^c8?tA&(P4r6R{tn+%j0=iM
z15T<kw~MSKsvRE5TZtJWNCc-E-;n|K=YVw27YJ0JFWo?Wo_IkYBwP(Fly>f=hvXac
zTt}71kMBGD9p8U4d3oT&DCmY32ZZO!sdIR|x@R5N?{;I$9qfXK%W4eJk$Xqcsebd*
zW)N@vo9!Kkya;o1Q`e4#z$dw{Lp-<ZW4mnCcB?9zzbz+RyNJ=*_S#VCp-y+zRQ$tK
zIC;lH{W`^%Om52u=3(7$2Wb?stZeBQH06c}h_v_~_pu{het)%x=W>VuE7aIaI}IB#
z&)*Tx&iyl_GOPJ|MEp)*<-<~~YVa9MmQjv`rhoNkz9H?EXDf-Gi~X~xA;Fm+`S)Cw
zs?R}2jDmj7ah<!HB3t8X=)Ic%!eUWMP2!DJx$5m9-@pSG@wZxY&t35~KCF`x9DKDm
zR4hVrFt2-<+=J;wOY+mO;=ToKrEm1b%b2XNt?y5fErG1>7z`s9#=}NnGm?LUI-HEy
zTq$M>i51NHlpgD}jtt(7TQv&T)@umyi>0yj+S~yzq`L@jxEcmFT!g9HpKNYjg9Yo&
z@x9`oGWmS%>6Jz??B*BOe#O=g%#%fR*~g{E`iBnbUYmiN4WDh|4|A*DjUiCu6Hy|t
z9mYo`iI~8O*pZ=*(;t={o+t(?%kP@o=Y*4Iw3JeQHq}49FZt3GB<R>4i7BVQt@i8d
z3<_wc<z|MfUAsO?MI4dutCteRW<3}m#Pum4e#n%ROs|#pm1Gp4YJXi=U^dV0Q_2m`
zKX14s&YL~r+BFsS{;$Gy6rFV6g!Tifz?vcNpYbfjK}V)he#XGdOqzf8&_Hm*K2}?*
zU%9{Lz3C%9SI3)Ib)&e+m1ks8FQ=~c|0+n)+wzyXUbQ#*i=<1xMfH2CHTZ7lSNmhZ
zMUSOBivjPPDFt0SVdk%9r{|W;PR~mxtuB0@zH$HY_2n3M%pccm@A$VqbE`4&eeC*H
zHva)=UJTb<zxbD!l!Jafay{L6Pl3!bXv=NppKA9<=6${w6YH*&IC&Jr@!O-{mHMS?
zDS>q^o4(tlk2*V+$f~p?mvVfhlB`|MdYT#~FF4ll70cIsICAd0)Tg%O!DmlTUmMl@
z{c-JN@ukr@?CYO`oB}Jt%kywiwjLf&TK}e#*1j3d;6Q<XKUok$ZLzitav=6tQP~1>
zNG4B9U49X!38awUDr-NIQ^?|Xk<!(0af5m+LUxFf`0lSz513jdMStIyerPw!j*Z?l
z9Pbt$=BW&E#Xy%g+272AR{@>^=3Ue{{XQea7t<Kf)EOBLyN(%JQ5>AgJALlgB5v74
zXUVvNFI6^VFjJB{+?BIp)u-*aJX;Xbx0W5F@C1bUcH($<ddMdg2n=3$ZoVl%1bpiv
zxbb`dlsHAfF$^iOUc4f3v<Dqot&dY+`^(146v4{Q&RP;YWRVZ%{=o*jl_>DxOYu8~
z2jjAbpiob%Ca!t-1|{!*QE073XJ!G0BN~M^&!{dEN2Acn$^S#4^{~j|WgR{+)6es~
zG-PWf^DO!^KU!ecjS%X@rFTd&_1DU-VZc-!90vo8!#$s0hCO$wmj4uU_Sr2w&G+lP
zb(D<};8Ya&tH62gmTdl$KJUxIp63T*9txk3S*v@Qp7!#((JVAP)uIBLIM2v8&y)6l
zEHp!Sttbs3qedek^dMHA0=|)P;W3(pCZflmEg&wFj}rMt`hci;CSW}wex5_Z(LusB
za<kG%u+dLQGV@SZUclqwK;;Uza*tdp%|gR7B~chHd_`##niY*g^Oa4<i=N`8l75On
z3eLK*>t{#Ej*-|^Z}7tL<mYJF&Uxm3GGmRAcvPOa`-J>^4uwevT6y5^#1DzH`2F6S
z*ZPs)WLJt`8_|c_pP?SHLT7PY0oJlb^Nc3Q{u4u)hoVZSzDlRGj8|rX>YsXb&zbci
z1SbZCOAXm;3Bnts{XvIoJNXL6j_T%x>ef-eXB{|)t}yh5cW+SOhw_&zK}<W(<r2}H
zA3@Ng_spX}N$9hOClwshKb32GH6r#!1UXf|8LKKyaGn}6datt5D+pEha+vta>N;LQ
zPpbc?j7{ov7usX?8NAel6s`zWQ{WA`e$OkIW<=!uD(D>mjw4p##0*FrCo7f&#R3o0
z4e8xz4jM?`5yzf8DYNXa^{DpRgcxr%l4Xn*zFgnBfs{W5=?t0a^f(&-r;Kq)4DA0X
zoria#nWzdk$BMDqa<y~41dSR$(`^;Gk0NmvzB0y3LIo6|NG`d%S7m7snhg{4E{J<0
zUtaH{1#J+x@Ic+G06U(p(~r~>RvMFUc0cH0g$C+l(eQjSB>mR<9ANY4K#m|{^Hxpg
zt%K#HlkIeo?JEWomcY2|hl;-zcyiG;5xK&3>8m*q;SLg)nTa5Rrp1dJfBlGI<+jf|
zuw^mLY!MS4FRYr$6DXj-MSm&gfaq4m_@UgZjOXkPxSfoh)p=iF5-epid(Qmo{qW_-
zMu4x$`*(_+JxohD-MK10i(8I5+_t8-U9W#~buMuFyY#T1c;+geMye<+;2o0I8LrvM
zQBQsCdg$aAtGGHSLQ%io>HczUyM5u+wQa(S^OraIG4rjN2a4zqo)7jydL^sY7DC`Q
zJagyue)n>Ea9z-|xzOe8^ZT~Xr#wrUbl%dQv)En5%MOg#UlL&#8UB%NdKUQqVTBh&
z_zv-GvT*K9E2TY<_3pK~pD%n2cmj-LJjgFF3m^rD14Ze1IR7ETF-UPaRMBmNwKhsf
z+lFhOAlQMVqFh`}r!J=O1W%?0Fx43CFCd=$Vp#3rNZheo6&2?41;TigPOy&gtrv+r
zA<eBm8O2tp9-Gy9xLdQLfbT`EUxMflqU)9H8ze+0h<gRk_Z){^UodTK^^bK9q3*kc
z8Q%_h*dNkZIeQ>__9xDNWS%wqP_cni2{X?IpT1f$=KtFzQfk`xZ?O)lhmT)G0Pd?j
zV#vi+QGL=AK*e$X#B;jM^ZX-^mEuEcMXeopzjyW&u*J$*9Ypw~UaKQr4deCsQ5>1V
z8>jU#vW?hBD=_`T@y;1Cs?PWRoDZ2=;Mu`*R-@VD=HUw%lZSo@kAEkO7&2ypxT}j}
zSptPg>V1Q;-J+UtU1|tXB;7F9o~|e99@<tJNheJ@8`n=KN~W7~wajqUDWC{i!3$JH
z)K2H&W5zaG6-_6;3=QMeEp0TYo@)%pyP@v!tXJ?2khCc(e78`s=r^3Y(n|EPN;-|z
zxkp=>#ld*enCSq(4s8ns04Nd>Q_UG12VnRtK`0&E25Y!A&k{ORRYo}2Fp)Z?CF0h5
zVwm+<nd1=mEDq%Rs#4GTNTIXh(&|EQE|B`{D9^4m!_qO$eJ1UaTl!>bI*62VZ3*lW
zmod~HNj+zVbIVk~bNn=1UGbewzvNq9n)SkUpgx~(4C_1G6Z2w$yS|n9LIiZylE-sH
zkbmSBm2_*TBLDuF^#Yz#-L+1+P=IUxMq{sY4G`Fa%1Ls~?QYJw;AT4v+`Pz_dr!o?
z!}sQ5+-=Q|8K=FuA~FKcu?$yxm}V;to5@9>&rKF`y7`|usLzp1bEIthc)8?k-d^8K
z#yi^c;SBZhnO8+vig8z_@xuK8caAT^(L8G>mbI9~j);>(f5@-Vx*he>_`-3Hzguw#
zU-FO$+toYe*Y4!{(C<U}_j`MVwklG)NC<BW*?uzLVFlx<Va1s*!Yy&KPed3Z@w}ZB
zUoi{zUcB>Dg0RN>`^)j-)Oh3V<J<o3H$(UUQKY#tHZ6p&rYEZ8m_Ul^SnCy)vPKC9
z^e|0eeL2>7%6~m1Cir&ZGwhsM&V&dON_m2N!n^#0$U*0A|Ja1^>pE-OV$VFdz@JM)
z(56ajUv%h%-Tl`@BJLW-{xM|qe8W@#_|EW`%y~ppYsl838nGsA{||fj8PwGK=!<?O
zA&o!^Aiad9bb_EF3ItJ#AWcOOL_iRvgCJE1y+{eDbTME+P`W4}MVd$_pduh*C{h(d
zQHqq4-+%Af_uM&i&OLX}JumLeew(bx<jJg+wdQ%A@Ao52x&A_%U$!ydZw~YF)p%*c
z!<T^_FF$7Lj_}3=0_jK~8IyBnXg9@8G&S&^PzU8VS~`tt|LRPz%t1?LY&=hO3u>T6
zfU?V7v@5IQT7eSKzM54%cD%~pp~`U#>>L0R0{{*ZsORk){g2g-U+sObKX13cvp8HQ
zuag)nAn9qP>(fwpiUfAajJboa^X7Z2{i-g0;RubV{_b@-YtG7?uNHX?4F+a!??$~9
z5CBf%(H?x<Z-Se2Pf%{AxtN|7?6@a$L-F!ZgXO2c%}rHJAEui8qhe0Aq+c5ab+$I6
zLge2y#3q1nEP@(mWiKk_S|Y65;A<_1oYuPBA%Z7u0Wc|4e6M{dtxcp@gq+^~YUcb8
z`A*FH_G`J&-b}C&=|f=1(<U`=(8Pxi;T;XFU3bsF_s*5HYU~{1v2Sd7mvh$8!@4`a
zBGD<R=<Ddqs*q^A?2bT*?w4mJvjhW~3K}){%t^NgLxP6I)_wlQ(Qx9x{8@m|(o_{Z
z@FVwM3K|_U+yR>1>%W%Pm#T}rm(jmb5R!r)=D1-v5keEce;;+<UobpX=)U5#XOz<Y
zo;y~<noUL0Pd={xz9;kf0>ST78F*Oh$>$C8Pd}7CZxuYc!=vHw*!<Rg8S|#k{zA?-
zZ@8ZoZS+=GB$^gqaJU}*O~m)fm%|Jphx_;4n!_Vg_Z7B9*^}|gtD@NrGdBuvjAecM
z`up?PhfdsatMS(9v)4}Y>I9w<K54Jp#mQ9AoEy6v_P;LgUu$og7&ER+A?5zizC8o7
zR7(FxLF@3JRR1=~+5BZgz$!!Z`!Z8O6CF@BJipTVt!SE?{J4Md#?%>M(=~OM9@|?Y
z!g7B=#a6nkIuars_)km)t?Ne1>B$+V&`VmA_BK;o`gsa*`QuJL8cRg(nrhric#r^Z
zzhmCq!{%5%jcaS5Yg6s)A^Dx2y%)BpUYru1dTg^C{CQ3!gX=t<^|rzMYq6fff}ai3
zKLdFdYx91+d$lYZBNXw(Kke?%Lv3V~&~;hHq^w4r%%)BDm*!uP?<(K(>={}}`ZMl;
z%Q794A`@DC>)#4Wrhk6SlMxG(kvjAS-DI5l-jF41wLu@Q)yCqrboizYsSyGrEj(ir
z56{;ZM1=DpMAZrP8I!HL^+gd;`nYpD{3D<(WTI>6p|AtUw>$jLiLouyg@Plkzi(di
z`(?gy`sS|X#754fNC9YQCxUC`qk#(-?^p=iT~Qu$WnL<s-NOz!(wfs+j}G1BA0P_!
zXg?X_bNQ}$us<bS-umzbdHj&XtR7^4WpyY0Q^~89$=Ax`dpixa64%Nlw^a2_JC+fe
zvHw!Wj#Il*|53*7RBIo`ddpe84M8dw^<}BJjyJ|DKmQM9jFx}?U&>gC@nfkRwfn3m
zTt0ffYqm?3xvHn@5m6bm&wA2r)GAEyp#Dgofks%E^UlVf&Y7GTx5#cYuJY1%^+FZ$
zYjY`<+_Ax#O-Wx<D>SQbdwP%0cy*txVk%>E#bzaQ{kdm?57^Xd7MRKy#4+gfYnRHr
zxJQ=k$GK6L4*I(8il68I`K>W9wtAMv@!U2+FhS|h$t3HyVO>K77mO<G!<MP|t=Jc-
z+Tq<9XZD10IgeSQ3k_G2gzw+}`15N+7)G;sZ)Y>(o?eP(n6&1OP{f1JH%VZ%Bgs5l
z6Ehc7J9Z8^*)AM(h+oh=_&Gzi?^ox!5$!9gm#5vCTa_ZEi`}q|;&fRs35Oq5wF#VO
zM~Is*f7WFxW0P^WlGUnXuP16m_zk3-Lyz4QH;^;6Cg|#Ucb*X3PmSh^`Stp|CC_A<
z=wrtpKIb#US2j9vNh-slkIc+13bl2_7L6YqWa>KPiuc#udU9_v-YGAr^UJf`P>zz6
zs7tM!+{b43c4joVju&_72!DGeW#OvMzo?ramT*VUccuGZ%9u;>%x2b|63O`XB#Ya1
zCT)7f_gGR8>!kOIK1Fl$j^%GxdR!}-4_HepYCG#oiaUiLxK;Of=qyzZ_;esd9(8|w
zp*IwCsN!mo;Jf|Pqcs%eQ8#^W>{rTrg$EvQm&$WIUj4{kLJQyi7mY>-CG%Zl(rDN0
z>hg`{o1J|w$fHxM-*W@I+P};r_Fft{Zj4wx5b*G&c5`m*iW6F48NSBctBnRe-A4!O
zIT~at`h0rty$!B@db<UHaOe@_&aqP~DaopG^r;7kt@KK$wAjLiA+kqGIZ>Pa%&ao)
z+@SSF|MVv@u<q*?6O{0Y?MV2L&hjlYf?r4Cz4345v{ogBckKQXK9Tnf;j+a~7GE1Z
zpyV9g@|Ysi0w#VMBN=hxZTux_H{?f2f5mGwgU(QmN6<I4ax|sAl<Tx(p4R9p1f(1q
z1?6h_(t0LdR15?ytG*uA!WRDRMhFY4{~}|lqq3?J=t6q3=2D$$1YhD^>Y3HOkxA1Z
zf;$Xv_GbE2!(3|)mofM6zJdE&+fUH3%hM^wp%Y%dCUINZY3os%4l^q$0<QGPC<Mdg
zu;I)!qql#E?UaJ%?%1Hn&$}W&<mNGYZuue;Qd*h}C-q0PbBaqZDbV)?3F!0rA%Z_C
z@YLu?bn$eAQkpKiEg2lpf)P-_h99-Xvuj*YjDAUKMK(kzb6Y1yD@2L58)cr`VwPt%
zKa53Rq@N4xV)#d$>lP^2Zj-vWCh=>5#HtbZUe2Y;h>#-|G%H%1vKi?n-hF7U*SU=&
zB%DvO5!K~B`s2N7&yeWzuXOI!xDRKu=R$5}J`-t;NYLB!CQG=*9QjuC;k=Abs*b6?
zG6LECTtzzVQSLWhm9DOTl(CaYI}urAPilZRTQX~*w1N41bX3a2Qa4F)k^HoKxjyMa
zIJCUyj-2)jI<B0ljJ-lMpwDt-yqbvRL0{-|uz!J-vHYR<6xsjziE&g<u4CDY_)Dji
zUO`m#Zm7IN8r>5TkNVVCBwgz`;Je#JHcyN=)s7qt2wmbeHHjyD=IbFRu{~u*56`?A
z8_=z>r?AKuYhe;-Q8K>yZ0^O{BCJDk7kvx3%8D;2CJZII_&yW-RjhlcnLVU?7L1mu
zoIm#0QvX%HZ{fn754=WBgPA?PMJh~X%roI*?vn5Gv%gA=!&pC2SpAC6%fB#9N%%yS
z@hdUB+RfUDH%K=>?rT;i<2Ih3kO8xM$((Dv_KwxO{DlMDLH?!XV8Vz{u|%nx`%9~K
zwUL^h-%RxW<&D*)&vgTS6@Kqu-u(LFOVhyXiZJ<7i!*qOR*sR%MD}wCH7r;_g1hXv
z2@=WQJNiNAUbR!18(d-ei&A1fw!KD1@>Q++#}^}4WW06MY*1fEd(7WdE{J(vIsSEG
zY2;01YnewF%4)Kxv$h3V?j`$ieEQ(co2|tZgR+I|KibmktJ??fUd0~XSS*Ts`|`pf
zO9N_Bvx>c8JW1XkdVXRZR$ITXUlH`t+qzd`tEs|KA+$5++j`!Y`V5H*-!0c~2Xj1i
z0NPXSsZ_dhOO^EoF)_T!{~L&>wq?h(TW}!<{kpogO{j(8I%CDRH=NOS?MP*ier_H@
zmgjww=~~p6UE9#N-mPZw9UT1OeIEVK(Du&f3+)Zncq({13HI~RpI=T5`)qfuekO$F
z2iuFmd3z2Yualy3t+;DHb@aYIPVVQ^tHf%PC7-dxH&3X`Et~f)D)|IHJc~aiK9&kH
zyPI+A82-#)dcXACdR|kmljcWmnseuzM3a5It!fl+HE~WOK=c96q39Buc+LlT=c!`X
zt~UK>jjX)q2F{@F`Z_O#>gex=^Tf+pE%}q{FJ4V7siEFBSN)kUt+iS<`tI|nFtJCV
zO$!~$G9&D?@!?FlH@lHTf`|bFe!6@OZEC3RYfpRq-1Cy_S<XA3-pczW*6mw)z8rt&
zI&i{MqksO`LxC^j!W`)z-G5n*bI2yCYR7trswG>130doH0=d2qPRT6^ClD_*Ub^iR
zFb|)oI<i%3%x)c<V%0WQUY^3?;bD2%a_aIQ#Sa+t#an5&p4!;KWZU9cZ%3_}w@>M5
zbX59~HJ88fVX*DWxl5wo_Fi+mTQAdW7RavsYK(&gJ<WIZ&C;ztG*7RKy|&_w>r!bG
zury)u@{mNCVj~1Q>vV)1v=D_4``+t&DtFj@-SEq6nmWysMw4IhP{`O{_!D(zNYT>2
zDrZBuwyO>2v-jAK=zVII?(gU@<=gbktmW>hV0dQkACd4g>jbgje)pu!-fP0E_YOba
zjV%vwEPsa9%^W7LXeEDo8T$LBX1g$($gXCn%|=n^*@4yg64T2XIv1YrKibfc%b5IS
z-j;G-Ey*sZvLjb~&!Sl`Vl8IDAZ+*J)?dC6?=(MWk-tXuAO3K9h78`-$T)uWc)>*D
z-v=|_wld*OB?bI@j7V$NwQW6#Mw(j>Hkct%{{eRZkPd8-!1f`Wq=oh*Lwn}jlE~0I
zSWG8CvL_?gW2N4Ik^dPLToe)Rel2`vEA$p2gi9)7?tB;?gnOKNUCKK`&>L1uxi2sU
zZS=x85ykvSta}V}p#+LkHNpoR#*-Od8xcMiE6uGJ!c6c*bs#%wh$$lCcLpj9i~Q~6
zR!l+Yn}ki$5V>B$vQl`P1x)N5W`hnz<JekKp^XgOnan76Dejo_QCaJe9(u9)TVXbI
zXjluX6A$ZaK{_$;mbS=H9A*{|?I5wfhsErJVw}jxR*Exr0XqxCU2H=>Zj13Nj?d|e
zf3hv7&p?NfQPse`S`*<}5^IoFSiTpm(d!VUOB8*ODUvjbD7N)##NHb?$?NG2vuB89
zEyTA<CARA&E)Kc%Yb7A&F!luYFrx6^N|rS&GPnixxsJO!P9&-8&ZltRJ`+K7E5^^u
z?*K@AAHcCsbF~A7&UGdK;`RKXho&O#4ZLC5$FnAoF;QMj)Q!!l5;uz%9nBOTAH|t@
zNja_ITSZv~O_NuoIPCFIE{WTYQdcv?Bvy&Hgu_!UaBeTEFkf|}FX1p>w{9s-haAvC
zAUpSsTA45Up!swedI?($m>HR+s19vIW+^p^NGC%r8L%$_ED_t$JM&m4x@1B+%8U$i
z^1}4ZdHOLPoJBko!y(PQ4p|=IFuIk=nGupoX($JCj&wruPAUfW1!n;8iRGtDt)VBT
zvAV>^>7u-V6zg9iDU2xEiig=#oWrZ&mH=PLHr(mBgyaHl%jr>LD$)rcb&`1igy0q+
z8AkWrX+hf1V)M7*o<Q7HKK-pqAI(n8B0_wN%mN>Ntf1?&PsY*%@XY-SlpUP)Fs_w|
zsHv3tVv9^_VI4?EO(F#UanUG<STR&ODgA($+Zk`zX!$@>4B9J=w+rO>Yn#0=#a=mz
z6OiVZyu(pjnK^JTt>&E80S|h73vWOU8bTy7Sv1lXyn9|eZbxbcDUj77-{*CI*(B^A
z77aM0^zHoPqS1BZYZha62=|Ra_lMvatmC*hi`Ygw^z6y-4m{M43^T*K>3hLEiMZ`r
zxD60jN+Jnr6&&T~HN)QDMsoiKByE^38W|R`4)4T2vm`z{pz|bnv3GGHEgA4%6!ruY
zc$h8H#w5=I$Cku^MRYL1H^gNQOaX<uL&G?nX0IJXq+;3jY>}$~Me+{E7d-6hJmzyH
zyoMahToS1EV!3e&^C$qea~qjYht_z(RPVw3U1Gv^pBr%q9d%(_wngfb+;&=?+DoAV
z^n^Q!2xiLS{U5GAue^zRX9sR%Cj+g^NV~1|w4^HP(stAVHu~}ccGdPU+G3mAYBZYg
zf`7Lg*GISQwFp}?aZh3-38hjvSW8>4=U4_l(#Imj-X<DQp6Ze@*257)nNWQbFaFjS
z9ZQ%YwX!`gm;oMDY+Lro6mEcJ8=k}H1A?<&EN70E55q)tD_InlFxT`-{Kz=_N(p_!
zi<@h)PEvXa3^-~Cd+{Q=gDCpN#7nTM;vW>vi^cyf{8Ky!z6YsaS!zH@DYiu#R7#jJ
zQ8W_kse6yK16l0JEW)Vjf!hykyjUgyoF$_wpNQa>g_>2Pi^(iP5#<RKMA&?pfh|%O
zn}004L~tt1d8ja*CfdD-Ny0;2MsXY60{)q?!K1NZyoYg-yh$-}aS2i{OSE31TiI0j
z*=Fg{CHm;A9BBi8vf6syv|P;h6oWSQJU-;%?dy@8s^r}P9(_tJ_v^(4H=q}TSX%NW
zGH^&;6ZjrCQlF0T1L9(H>I9XZ2v)IJns^$JaeF2~W{eE`{Q3Za^uJy#1uZDdGA0!d
zYs5;wK_u$}Z&3}^2Sk)(AV;Sc3&%NxCH}dQ7>rc+<gtCd?hY)A!PCLt$QH;_)P?Mj
zf#z58&UBZdQyb8!(1*MJUoJMB%PDzN?3`qq@E~7^jU&}Kry?DcP@tC(#b|<MCH%l)
zN*59)q{%i7PZb`pjx*3Y^(^9?n6OHguiJ+&-DO)SJ8$mvpz86gJC!V{479~q>Gz9|
z!q4#a*_Pqt>T=2I-!Jl2)BVlV>h3OK1w&XIPS$$|!qfzijRaoHEa(#fZl`5zxC*A*
zDk)co?L@p`sX>YoTLaqeiILqav{qwvOP#0B$*=XcAC}|7;>te>H2d{N`VmtN=#A5h
zxS<A~r+fv)cqn=bI_Aouy^KBJk!Dth<&r&bWkO9@UN?w7tfnOPEhKVsBz?3<YV=CF
z5zKc}fVWl#%2iM+)S4iOYk|0R{pyl*O?>g#fVxi%vLroPW4sydt>rxXh-BBgL9AAO
z*=mPl<C=blu6nhz)$NuVW^ckR{_!w_lY>p>Cr0jPn{5?FpDCgd+74*Xc1ZX4{=l6}
z+Fx1siuYA&$fZlQRz5YPo=+6gr8rw5d9M_AWVLj33N$ZV)av+Z8@c?fuLolq{hn_P
z{j>*V{qw!8HHZBkHham<h9dQ$2J=uX#+^;T^K6QfYsz+U%HBfC><%`_jW5LQrBG^4
zwZOeA&TMG&uGmsq`$E`xX_6W6Xa|e7tYoPr<82p?dKJ{a{d!c$Ubvc3p6|w|S5n2=
zRe4r#SeHVo@nX@Zxvf#E#0A)7L&~byxO;<Pxp=)<N|udnf~Rf4ol0Yo94JS`$6O+^
zV7dJfaOBK#`Pzb{ef%Te;KMTcZy19R*d^=F`ZSEuH_3G1qb?~nXv$xg-grQ%YACL@
zPZGM3*gI#)vCvm(bNqM`DRw-cU6%~ILwo6F+WdH}Q{~P>)sly2EyFbUh8BO)8bCCg
z<GfS!0y9#rUuFIspvAR;men6W(>6vo<9pISmXVseJc{94#O{#B*I28JLE~k=#@oP0
z`b^+(`|(@bVmko&`F(u!TJ*C;T%j~Ri^K{~d$P|!+ijvn1M#T*vHqs`3ifZa=lF(%
z<j%K!d?M{-qxJ3Uw=q+1_F?!JF+1dNZBi7=hasnr65gbtFJA_JO|A-I@?Y>TlP6tX
zq0@Bu{^Gx{_J801b@=^|oeol<LyYK94>~-Vjx4962I$NVQVe<ur!d87G<C#diYIxB
zuY5{iU`l9ZN(4PEsxU2XG%e{deJpuex_nx8U|N1<S`j^?q%fmwG;_jZ=2Y^`e<@=t
zKRj0ElUEkYSC$7>eyyymqF2`xRyT}Re|xNMC9m$3ul^la-CtQ{mLY%?84zOz)RO^E
zVIV6Qs6ht%Dg%RA!zr$D8m}GkT;oYu<EvN`7+e!tT@%5qiz=>*8?Q@xt{+QTm#$cs
z9bA`RU01|xC@F3z8*iNO+&Go8ak^sT%;1Ll>V_s}Q%iAE+j#SW=caDTrhdhy!Qkel
ze^<sf|36j6Jhx+0w&N?d9}I3Mt!}4ac2X609vbgF_T0%x*~zNd$r;>vvbysWvzxED
z`^<Q^&~x{B%5F);?#sd5ven%R%-<@-zpsq{zV`fEoAS55;%~#?-=@{S?=X9<ihJ$G
zd+$B>KBVk*SM2o;?)9(k4Py3(6!$+G?|=5(|B|vlR<ZweaR1xt{&&p5l;XjR@xc$z
zgZY$$#fpRF!Gm9`2dkLFHO0d&5$t~sLgW8Gt)TTdA7w&l|F0CZ!T(bVn$`c4f_BUO
zky*i`1h0&1F&VXAGw!TqS{G-fe9dz6&9;ipZhf3n6p(xKLGIg_Cw9Skx61M!PUJa$
z%e%Xl=SY8gH<aS^?SG=6Z4~+Z2ZT2L{QiF^Xd5N>{<9F;gZ~jiV=8EW8Xo?eg0|e0
z`~L?BZRmdqp^g6+gx3G|_41d>TfKRg8s7Z+T6cGOvcI8r^?OSsO2nwKZf&OPq3q3p
z#`=wU+B1WvMon*jFOR-*{XWq2zXzd}VE-LL3;1^k&GEm7(8&Kc2(9kiKM-00=g~hc
z=P-)@1B5324}^9LWAuMPXmd;m?KF)(i&8B84+u?o$^olVTIq;2w=mWDA0V_lObAWl
z-yyV1ObAW?975_J2u&)A$b`_|{I4K1{Y7z%h7c1%E8)sYaLFrm8G*1jBMxgWAY2d~
z{U~)kDuy(XD1jmETc6iPw8wE7AhdWt#gNoDWzvp{TBKst-JORyPi1%Xm|{gcIB?SN
z-S)EDvh-j}%=qri0P5tfSY&x)a?~Jh>bi<sm8ejToK`bXd_ll$n7~mpEGFS3sXo<y
z>A4_Z!Fy%wXO45_2NT{=$LDSvW<BBk#UJqsnmVk5C$mNw%llsuC{-b|-O|G^m4cCH
zvujL|g}cNEuK{XYyPm*e+s0k_b|QG4*j~QAAp?1mTYa>3_ZeE;aUvh3CH64UPk>Bp
zSS5zzWyy-NjU<c)ncQ{>A8h;T^$2+J@~a`R9VGtE@lzKoi9IHV?t0IA*n(L;9(Y0Y
zUl$KUx@D?r!aeo3yTpw@vAz^vDgiSWTF&;U$_^Gao5;LY%&w?rZGY`tkj(sA<?#bq
zt_7V!RXq?Lgd(xPSdL7POX*5f?R_;!baiXI`M7i%t({E(_iGD_$kTA(G%*tl*kuYM
z4)$sP^%PK>8mtiAgkVVY*cO$uW~|QcTJ5YBoxjIYo`xb;FN;uqA1sK_zkpAhBb>2_
zM8{;}`1(ymX>5upsLP6sXx-ZjZ@RvH%M-^&V`Wsu9`4L&^1E@VvTz}?m}Tc#Gcl|J
zg@iAu5m!dVE-V-8NWZx8f=yLU8*77q%~MH_m196p9a>=Vfr-5$)6OEKQa=rCXq?xF
z2L(5}R9dz~nO;R?ly<>2Y<xbE?@%jTqjD$`Up%8JJ1R`Vw<5gRv4VVpB9+;rFh3K|
z(B7c%<CJL4NVW&C!7lu%E@vH;UGWGlvaWoD$vMRcoXM^UjHIWO$PF^Vv$Hb6o}*~M
zQj71?Oul$~aY|*AE$_swR#8bkP1H(1@;R4oJ~bch@fsw!1du;hW|ZP$h^VHANM@gf
z4D*@VZQo={`4bLx$pUNj;vrn3hbAkqq#gZ|W`{h1W6^1O#wMqFe!%N_VyIxMp%x>W
zAE2Vu##0}gB|f*##pA`W4uOzv2@=c5Ay$Ed8d=Xt)nwovoar!5x;ew$mM!(-G}t+i
z#vxKWzL3IgDT_5o>#VF<NYPYEqQIbJO$itUKhY-wL`UKC-w&RN>&Fj|YVV!Hrx?Xh
zOw-uHHOyr6Jov=!g5&YL*8^Lf*OG9%ujs8Byx^<5&u*&ymi%zfr{Cu4fO)p_l_f$n
zhHu?7q?vq!uQZySKdP5it{AEjx*(Tw5?3IKeR_6&iTfuM0p%EeUuj+m52sxwrd*EG
zgjbhhOX-!e7DsWW6wMPxv?Rl4a1#G@jhNjTPVYingzCkku8Xg@+ox|jf36zs6dn$*
zmyxsQ>}|R)T8$^0K$`17l<SA1SI*T_OI&b&6YVUOir+C$9qT)v-U;WMTx18e**rK8
zw6<qx>la<+iMd*K`?JU{S+ssHpG|N@6npEpuH|61x&IznyZN=;?H?Dv{3*I{>FnkQ
z!-gLzelA`wpnRo7iS(DbpU;WJAX>wn1;8KBQC8fKN{zamG*XXW4Y5PDoyf3I-R-(%
zF)seJm&IB&Rc6Lxx|oI3(R%aex#@Qw&Vfpb{q>iIfEYkbh?EIyOEv22IDAj8`J@#g
zOoLp94}W+X=L!Y4KPwQ`E9br|laEMi5fKkLemPG1gp9yL{7c&T3Tmo+Ns=M{WT_`#
z!iDimJu|UjODIZsdGh4L3x|T*=RhCz_$m2sBNIfW>@-195uZ6YiJSbknl#=x(W%Jb
z*Bpq5{e0V=lXWeaKd~w_9?ExCiO?Hu-ze->&cM{IBQb9yb8Tpt5Mca$p#m4{w7-7w
zbn@VCrF1nwmAZ`L{cQ4ER5o_1VjGtg;<EknH~(hD@r7F!5^+ztpG|Pdyo}6THxWJ6
zQC0Hr^xc%~y6iLKCNLerw`}B|+kCA35s)WiB`&vL<$Pi1_9M1orQFI%9P%j_Yo=V#
zi@M<x=G|#0FN%mpI3hw?)h|e^bwi%WMRp$}A95vfso=Hvinp#(qv`0dAgu~OxS9L?
zi;ohO=el>3<P4=F<0K9(MkM$1=MMdPihL4eU+4+57~YvSmS7se$N8M6T`(MGK_K<{
z53UnRyA=|2=VOI#N22Yn-KCR0Ah*7%U9h<}d|XajQZE`KxL(F4=vX`2P#r7Yh=*&L
zXqWCi*A2S@PQNG<2~|3W89L#9Rd9!8R8ie4S}+Umbf#;T&CEY??}q5M?I;K(xE;aO
zjE{Zy_uNlvO4r}^b*HKZEfvi_1F;v_qs3@AY9Nbz97Hf*!~{!y{!o9$=%UPA{3Uhc
zzp_W}5p_rBxN|8`!uB~KmpT!W)EwufO^Tb5?f#`%t%~t8-}S<dkdI85!XytWxJN5B
zD2%^*E5Yxihv3*l)U4eXa4LoS6$jSl-QdBWQ;sMi^91kOqMRYyzmEOU{C8{ckV5;e
z<xdL(tCB9Rg+Vz;ESV%$1lKx&4ZTgms<Lg@khm<uxdXy^GsF4o!Uadeg}1};yb)rm
z5s~?5({|i`OCYW_aF-UL5P+4oz$t7;NLWO2R<qJ)SU59rXQHs}6er}6;$5d(kO=>b
zPGb%&Cy;&A$<e5P;cBc3(Ioy>CQW*URWu5ckIu&1E7H`C#i{7=;;a{<Z5N`P5hCaQ
zfb+Fkxv%Jd=3&|9K-?d>HVuVIc(HiQ{3EL=k_hGqj1dtmeN72CuIbx#?G{s3J01l&
zY_%JO!tNJ288K<Kh;#9y*LE4;>%^nlj##pVvu-80ZxbwfOmu>z-k%mzx*#+$qpy2Z
zNe+vUBkMf;qlmg<T7UWE0Zqc}p%Yh!b~q7C=KwF^l~hbnwRLhMmrpWfwPYzQS<l#=
zsP29qqDWNdu1Q4ADm`wIm(<3R>*Ul;U?!swoQmc%3#7?#!b+Xcpch<TjKJ|x2e-*4
zq;mY-d8_MGG<Etx{grd(qnIknKeC$6;}pAR(1%4Aa9l|TEp`oQat&gHHBJTA9fJlj
z`NLF&6kdhiVcGp@mP9X$A{|H~Nj-BtSx#DLm<(BsRNpj7x$yZ0hcDd!kb)e<g56d0
zn!2>bCCFzbj!kfb5z_MPW+zTd>yL=pW2IBcnQrSRh@ya!e*DAiO4*IOa>CL{cs}rE
z%N1SHLw~Y?3Nbz5OPb4=;C>5O3X4#XyjTbEma@I&&p^uB%F8jpR6uf{lEg0d=*VmE
zFj1ZNp<6Rv$v-RO04tSEkTd2}7}Y)@O1s9y)g;J}d+`~T`mzTtk15-asq3=3bd>AS
zn{K=;rzsJxW7!|3P`lcYCNU+4b?{^XM#-P$(KKq}9OV5pDl9@&^K&HCMC#KmdEV;m
z`hWRq<Gk5SU(Le7ZM`rHcb>Hl=`6pHMX|)r@PdoM$gsn65GfTlvo`Qo=B|${L3vdy
z$Hq-4E|QdS6WJPQCyiY{jV+DG?qXvIbx%3$q73WuSh59IEh&icuqqe@`QJfkTtP=6
zZQ6gBz#1d$bpes-tGUk-p+|`ru2c}my(8HL4DbATawvxBt5rkiNf(&Dngl;M&<iaV
zgckcZU#+0v+`oJ^ogk`SHud6Ls^K_Q=Q^_YVV<^H;SW=)QBa{pcA-v>ywt@)8-C&I
z{6+TJ)WAxen?XfPU+r`dx`kHMVoQ}#DY9c__vm5Qy<W5#T@;ipbV2Qo7UQ|jTj+6_
z=ejSDm&RdX3E-HZ=dy>j&y)Fu?(>87`JYF*P(|(*p06y{TSDv73Yk+By|@zHUG@l8
zR-IjTTY$~H5*m30_RbdSPJ5w~&6>?%Zy`Ihkl5$RtX4!8cM>)01yw!UnR30fTl9r)
zHmfe<<vfYKt{tI8gAsPYvBWYO39OS1cdTT6F$#Iy!Y<K*sA4?R<uARMaADV}bm^_Y
zOc45EI@P_Ubbuc<?}e}eo^58sb-l{QuEWw@m;(?iVlB;1pu+3R5e9-fyXAWP6*^0$
zIxZD^;{{t6!8!@r=`UVla^N=W>_4to&SOz46!cVP<<YMKT|rdz*V44>6<Y~quSsAE
zgIxr|%5msGl_ge;;@LfS*`>&=A`hq^%oLAV)ik75>%5hdWw6&cQWL!@NY!B1C3{<X
z#XK2)-yGHgNXlVZSc0kGE7dw@-n_w;q=>Ow1eFOtpgQMJzti5#x3If5yc))`Jm7!h
zkW*W0N_G4pp+bH$dc8z`sg@Xw<`91qlv7vX&0-__+)K93HV2+?roJZpxuOhSs|BsV
z4?fBN>?gk9C+*q4`D%(S=yZe2j~d=qq-yc+hQZVFRel5kX0l?tS>S2;qK1o-J#U-;
zHna#dww-D0U~bP0ZtTiw>}hE1``S40w~;2$G<>G%lU375aMNf`(|AME#Mh?DzfJT*
zf#&Hm%{+F#72CwhWlZg<1}3n^8r2Z1RDe%#0NS+YzsfH*G>a_RMv1-yaTG)r=zus-
zJF@t{s5`R)FVeE#J_ep0ek=eF*Mr2KsmPS<eSOy>i9fwWRP<tA>n)k6R*+aL;w<m8
zm#u1QQo=u<p{>otte;6_xAfT+lD|@U+}h-=+D}@yMQF9FHBwK>wRcXnYbH{)1bNR}
zcjyLngr#;|WTT#y>v#{6G|r_OPIR2MexJ_&o;1~QG333Opx|}p!Ni)#*1B8Fiaa-7
z=iE+ZmrlF0f-Xy)Ok&N~jT-0u!B6nRhpG3PjnIyZye@>|J8WGsN?pEgT_K0of}y4D
zwi7%_KfA0G-}~-$Jt!4OWvfqb<jE@Se)yB;iCkSyNOy3~`>SVr0&zW$6MFpfd!l-J
zsAmPL0M;sE#nqoJYqBLYLT8;d?}fL$*C%?b<OJn?DlRla6)Bh$AKog0w4!aFCL4QK
zX<r<Qx4$u-R@y$C+t+)xuT}KY?}nlX*|&?kJmp(`YHsyECV1uzyCPl=Ov>@fJtN*V
z8~k(j*m2fAADOpX6N3kPgMbhXBtH<<GYGy<Lp-6eHXUVY8bs~W(Cc6q3hcAs;Hjy%
z*e63Tc)(-1g;oITX6cZa`mn?$ycU4evhBUjkFo-g0p`O5p^w=6!_tTHMRLD}kMGm!
zZw-|_*9@c#2U)*Y-vzVxQ`N`ow4Qvrc>lwzhymeWZ3aT0&F=Tr%?uc2hw7<+CZpIN
zlb-)<`*^C=o>=zz1RJ}B%E<h6vt7dxw{Igxtn4;TBSbd5`LB_C?q9rayz?oea)x}d
z>X%=Gjws`_gnoWGG4c7@*CFHaf;V?Ylkb1IE&uE>X{3t$%nHjAyg!;<_9?ah*(3L{
z%%(9PmysOF(c@Yg&hq2ems-x>r`jOcv&zP+%RZpl`iB$GRH=V`+u!TU-dDR1u5bEk
z5G1E)GE|hrfxGglZGXh#(Qv=eM6b{{EA>x-__sas-$v!@tc3<fo_w=7RFlmMnvkwC
znqB&4)RR1uaHhn4@~3)H?UPB%Z<FitMXU1mYwF+2e`QU7<B$h``^nz-Bk4O>xaiH#
z?~qWss4ErbG5PWBcloIvgzyxH#uS&$)HT*#bTba?F(o)TC44Z|n>59jhZ8_gXRD)5
z(opu<P&o}&-Eov$9(07!kwJ$<$spxy;8AL<YRPowBIZ09nqfQrOMY71rn$&)w)Y7e
z)8;}`rtMrnTzEj$i<&_M;Q-*3Nr@9}MsFMp1}g0nAY7FImRL++0Jq#AR>_4o@;Z5G
zpn0ZHQwdm7X2;xTb!~8x$@A{=XigfSZB)!|@<UIJ_4=VriFY$q*`|cxHRqE(cbyFl
z(0>@cUAUFFI7nkgB4$H{r=K>?iww;_E&qIs0F+ax879yW;Kw{3c@>YCCQ+mFsBx2X
zy1Q&Q6z1k>C?_viF=2V0w5XHKmWD^>Fs37Iex}({rzr?a5=w7(LD%JHTPV77fSRU(
za>CDzn7}Pbta=Hkn=P<z5;ejE>O`N`xwx1<N$m(lx3#RylUQXmScesmPPB!2#?K*-
zWj{Q~CzL8+3zXX|RhP{dDB!5c41-IH=LjXd0D$viCOXj5gf%wi&U*%%?)Bx^yanAJ
znBU55k_{7C0nh;8)B+bG0Vo<s=n#O+GoT0p!0JVf0D#_R=5M@;A^-?Hkf*`CTcckA
zfWHS-hyWTt08TPL*$c2rW<{B-%iB^f5q?8VfV@1A;CFy041KbaY2Ja355f(X)(MIm
zDxMIu7nRcsJWl|L5twfQ7~AJ<*iG%##SAY1Qn@BTqK*)NlPe6Q$P#K0$6m3mC65G%
zt2*Og2>GX87+OjZF;8HH5Vv$#*L8!IbrVnk`F9(0gkea)7V<uiErSGMVsWY@h(X29
z=`bpq4AL1#J+|3G+p;qeJq|DGC#G9KSRQOyAJ1EVMnlD6_GDHd03KPS2%ccDIik@e
zhaziC>dq4TTgc>ZZyvQu^Y81hc`wB+-;^z0;O|+?UYqgWXfnWS`+O}F%}oN4E5=zd
z*aH@{gawVR6@@&a;4n&?(vHJP8c{8VrY|J&o$#0)9eVa2D>{(G%;C-IKa##$?l3m|
z!yr@1F>ez@%+-gA8D4iLazG$y>|U8nz>K?F4hV7RuBNotb3#q*16-=(BGN7an`&Rc
z3(5dr=52t;0gFnz@Gh6rhko=TFQAiDLj;v3rH%kK#bDrb7xgaRKOUQeD&RMK&vpW|
zs`o<DT@`<Ns-qr>u6y!P7EwAX=P)Swjivs@7)beQ#qDq7zn9ZRH3y0gZ+!jZK2h(t
zI`{4CsSo7JXv{I2z1JiClAyCk7x9p8Zg2$pk}H=QiGA$UwrXwue0P_5RobjhT}bNP
z9KeJ&37Y77byP_O`+>Bh&x^@+%7oI{^q;#`-jVpdt*V>J2?HpRv)IdtR7*E9Ek-Ux
z?N@HMUK;&)ua1w2`k(5%#!+hn$P_B)MHP<=+*T?^Z@$|<^48&Zty$9%yxS<H$`ib~
z_8~JNtwRDSMqVZLND1gm6_g4rvH@vI`Urqc`3{85=xq;`n~m{r#2V=+{oG5c0XGYg
z_wl+wiKb|0<Ik2K6v6dev0N_YK^eXEK}k7-HoNdt77(fZ@U)QNtG+ZN;(D%%Vuu?9
zFZ+6P_^$0I@5@GKes5kj(SDMuYiMxdbscC<qC`<3Xwk7u4IpV{o*lBPCP?ebT*O(Q
z4Aud$Md6APG`y8a5vFOlj>oB9sz8Rrfj~)|)0kih4}g{|iG(Oj6``-%IRiZ9de!*S
z#~r^MA0c@I<^(;)S{x%~%1)EOS6J@YM%<NH3x8P<g<k}*)ph$zI_2*xO6ymv;;;5`
zTw<H_c-Lfz1EN$R;b19Aq?L~GkwAyfDo1`hJi2Ti=$P&)@z^2rmW{qF#K1+?3hMDf
z`YY$8+VgO?SD#LN)g0u5Is?MRgeG{k5M|Cmtc$z&@Xm9EcsbcYP^=t)-ENU9_%0wl
za^^DgQUeie|KvImx<*KFMN7ODvhMBqCAVXGD}q{F6Rw5DWp8wrzyk|pa6J2jnpMRh
zE_M?1LKT;b5JX(Q-KQ+lJ)3@JYws>io9Elpj1#AxIN)Gdv1@5wff*8Bx5t8uY-|*z
zvwRFV=A=HCb_W$=w%r%A#&m<`wp`1iza9BukRAQ|@jb;7o~M@U-z4l_XzJonti%If
zhSHA^-}T;8hasDHWYt6d$U>ctzZ(y8=hnXt&^dO3C6>W^8(Z%_tQ8uQAQHA9XkGK6
zWTk3x<rA=71O(zs#GzG^C46+X*xnu`!Dej_;p*G1MxumBaS1!*rGRss9@r>Z2Rqb_
zZ5*z^Bu1HP$L_u@ex%tX_ROpu2F1}XkW9v~IRg;i;~Y2@O56#7ES5*3Bvj`t<QoT{
zF-12`8Jh}vVRlJK%mmmZJwtG365%VK9&j3x!17ofp=?T{vPyn{cq&uZ;XME62Q4;u
z_Lc||asI3sgAGOm00}xL3-e#xRdfu@MIbr7J`YNf>4v~6RW2*h0aHPJPPB<0s`54j
z!b<{kiN6Lh?~Rsi7erAMyoM^#YJTCpY))<2Ibq`U@K3qI``ZS#u!oMM*+R$>C6ab}
zlucq(*3ozV94sbj65Uc(M^7D=q*+9pojA5I&hqzy-nFyZ90`j6AV+4i%WXYUEts;8
z_A*F|YllGz#KQz><(sURpE3ibz2|+5vn+2x*er+;qn4!OMifw5vEa2dQ7~Ku57s?<
z`?!9!VY-(#3yWjR<!WrWa)>Pmx7`~~V5({eH;J|`;G(2gj55hr;uslN&0TC{Q)vO=
zEN&<kEXpj6;lVg^i}iqL1Y-0u0%u~#$xi`LEgSkcMh|SD5_n>vO+|G9%h}j)7%@%u
z6@{qfpVeQZ2NYrguorK8lOT*0!K#An`hyWcfDH({8+^>tbO|ubgTTStXrf*EVCYfv
zst0B4O6(|!LsnmR(9;^8A=*7DJH~GS*fzRQQKOemTLvCpN<t_!Sh9GD^WDvv1$sWA
zpa2ns;su~ApCVFKDL~=r50`X(;``f9$Z_BcfrK+CwniTyf*1KXtvkv2=nM;3mFR|Y
zO?#!q0YFEoa?!mcLVX#4z%E<CD@oUm`<Ks2#5Y~k|0-V4QFAkAu3fm2S-#K$h}7kJ
zv>#`My8D2@neLz{7$ry}-677=EmCNY9;a&Fs-7(;P;)Q7XPl@-;3dKaF8oVXdvamU
zDJzQu#s;WQw>-U*aVtr8WC{Y*5#O-_kGeGG1?%YT?sr{*$=x@#U{#Q6GnQLW;_wT=
z+d{l1q-*`#2U4!v%?S%q`tg*#C1<o>)^g<psZNC?FiqxXTLSc3-F(2~OAi>di}*UV
zE9J-d3{MQU#?ljrZek`9;DZ^UPK=UEo?uDWc1z=%x!3mGo)9Ip@2qDKFeKMQ^5(IH
zxQ;GAf!G2hCG3r7NdXdhSC2YhOQV>*q2DO_?Cp@#0stZFc6teOt05t1I1nh&d_)PX
z<KrNtyCK18p`dSQPy*!zj_C6N;I15{I;rTKG=Y}v5{M+?ym?{vrnJPfz{#pAe~AgY
z?B#36^^I5|keot5Uja7)z5=4zMbA0}gK8i^`q7uUH6{G)cS!KFRflOSwcZIN8-PIX
zL1T5?L2lto$>%v>_^J!K5vJ)5`JkMuB!b~fGdO~Ru5oXH7>0H^pIjYbqxpG?*W2t@
zLT}7t-{{Ac*<5csfr1ds@?f?;4_D2OGoMgSNrr>+9^P>Sdl3^>uPn!&1{Tf*Z|J41
zfmnFI+>**FH8mDP)TML9&qGxnS3c9XvzTF-EtAgxu-_xDEqw<+5B~O7k5Sh?$G7yj
zV?wagD;CoN9(dEKJZJ9BS#e&F`y@Xtgt4~CO9z;xN&Y%X%MI0KN7eGpdhZ9{KG%Ov
zOD)gM$HspnEmyXpujxF98~?_pFG~U}qXr~vkoa6*<q83Z*P{&^x+^vG1pQy^O4hX{
z$+R#V*5gZmR7k$LOH02d5-CfGUaK^4HpA-TKJZOj>w^&Ls~Xu2-}=K2xTo*$l`TdC
zykwBa5nzy{I|3N7lDa#yT|VsXgfG4(!A(jY(qSMA;03-ynNS8LlVV%TMwBZb9w*hy
zkicF5s|g83hv=nA0*pqG7l1H{atO$TnH2u!MV5Gz*lC5S7RoTZG}x5-HZ2>rKtk{W
zYXZn|Wi=|K!Q~a8mksq$11uiAwo!%X^^j0R(rVn}r@_gJ@g($u@J$0GyEUn4h`>ey
z;d2|sc1hd-KMG*h5prB|iFmpUu#p=Nd&9YYSZU&=H8*p#)%Ko+MYIbC#vlTC^*BJT
z^wV}0g{D~M6i$@08cB>703jaUijZZ}%q#qWe*AMJy&V#e{9QnCZj{$djU=uXIkMhy
zm!t~uDge>Tl7cg%!(T%6&YxqlYI;g~OCoW>nbqMWFe1w-6M*Oy!m$ncFV*#nYfQ-k
zW@Z3nDn|V*z!o4;&H!ng2bNTo&1VJD#U)v6#U7FQS@qDdrew2h3W~|9b-hHy@e@Sj
zxn?4hme1e*7ppekuFaFmoI=nI;S&1&O!qUBRU=0KkVSfUMU$-Ay;`D8>jXcxg~Rxf
z-kDINHt5(6uhBW=p)0v*q_rzU4|dI2J1Y}97Muri$eZ$pCaJ{R*vjKnSv~4lw0NOU
zaWH*sl+$sfE1|o#IMQ$CR45At+oelk>j95{$fM%BWG~L>#XR96PJ01*Z!y%6)Tdk*
zUz9RqMLorPPh|+TrE+N3%x2bcmS2lKQ<b_enGl-b<1-QlZ<r8T-?I`!gZkWF?DgK-
zMuWyagSB{rw?7Tu<)(@w!Yyb9ZE}X~63G^baPe(}PB+6zlSpiFRC}&rPibFzS0t9i
z@_`AV<tBAZfP2|44VCucv3&z)FMVo61Ty1Fg8x8hwT69Ia_lE2gccIl5dv~1F(I`6
zyb#dg$Hq%jf&-DHJ|5>w-wlm^Tp^5E8%~D|%s+y6v4zWbMOu(x|8oe<__ww3A2;Kz
z5aaDc<DFdN-O|C8(kOWZaz4uFK+tH64GFNDfP_rI@+Oe~4nl+9H$fzsAfK49mi-%q
zX2Sl>1bvlev0#i9G75}?>ZwNXsG4$JGCgv`l-u2u=e{Y=4JI!P;=OOm#~yy9*i`77
zsqimTk$qGAzA4Z@gugH(AQ>)p$xQNw*-^(~(Hq0!?q<@_rYC59*d{Z%UtD8-kk3;6
zSTZdC(EwI;V8q#o!gcw$Bm1Fpzu8Im%kR@-$Ov#2!;DaPQRRo(XN!-@CydTML8|**
zCbECJ8SxQI{+L0zToV;VUbvjeFq193c!3?HqyC8;a7C->is28@KwtnrdMTawsYc?8
zcHt+*3kIf1NR$36S8rV99{;5D`_m(-e(~bV^^aimPnR<EKEJB@e69a8nR3;f-P}$d
zABZrtR*%<wVsPz#c<Yt;ITrI8>yg`+;+=%dU7JQWwJy&J#yb=mxEGr5@AZ0Ki1&DJ
zepmg=0N<CpQrA3xTy|i;*4g;c|Ei&H*|lKzEKkR4?-H-*^bhvU8ivXv!(M+1mbZx9
zf28+&c>ky2n97wKetj`Q@v-XvKxm@^@t@4fE}23H64m>Y_OCu*LTF{F9ecE|zE|Hz
zjSQS0vlRLVLd$qOz=JhCk!hL9gwWJ2#w7-x^#2!x_Md~$JZ#~iwuod~rY*r*Zi{NR
zWgD<%pR`4<*kTTBv1mJ-upNhj9jAsJmyz8O8#`_fJDyNG-efzzJUjk!JAr09!2vs=
zNju>cJCOss*S}##mCVfwFuaDnX;y3?FT$V&EFLg@>|W$$UWBBMy=*z|7J^ym9dWr1
zrc3}!dPVA}M(YqGkNtrhhB-$`5x}R&(Xyd4lL7E!C&9{fF!`cLYesAU!9ENhqxdKC
zPUbB+`Ylxjhp%`RDGlf;0$2@;P%{CGw?v$$%_s`nOTA&y9&i{ZI*216w-+2d8L<~)
z?8WIUVRbQ53t-R88T}E5YjX(80DA+yD6>DY#z%h`aU-q|K-B~6FPq1CA!0-Dakj#@
zV=Q95M&aRc@LRSq!HBtQ15*KnTb2ZfBpwzP$6_5iZE_MOj*l{2n3Xg~979KkTfjX$
z5NZUl8yYSVFl`+$9U6CAFd42{2a`iU!Vxj<$q|x&U^?kgmD>m-LWBZu++~7uES*J-
zFl})Xa;q4As78YXbx!%KMqfP{DVZ00I%ZnuPpp>-SiLSr;Wol2VA=~Cr<li-)?fyz
z(U1Pb29u%o1eie`%$^+WUl-%21F@vTExl&$hc0I3EoL__CY-c0-L@CEg(=5HWZF1N
z-HY_cB5Vj?bxO3<KvZ<GLs&rUv2qtpyrT^R?rSvbca#~U_z_HY3gdN^QdoW!YM*Yj
zguUlthK}}|a|sWCTgI^%3decnIhx&r+}1;w$2o-Qxt*%~A>SPHG8r7I>Uxg0SQ8qn
zvpwhK>?*zxYn%-3nw;(qo$e`jX+Tez=DCFG%mma$pQk`h(IWL)<^n5kD|Y_q)QJnA
z&mAfjLBpgL2#BR)M`K@=!*y>vg<+xMbeDk@IGx)=9KUkx<jO~GJNcuIl65f`?nR!M
zoKqm&(nL5}kIY9g3p!6m1T$h^Cp*YFdwQxahwClR+IVE8&;R!D+=^LUdb8p_0`XZ`
zaX;#4K!=_RaFROe85K8wtjIZxG1m!mxy|b?8Rt1`?lG6{1mA)qG8p@FtM0dBYyk%F
z-Tqu%^kvfQF&#!E-EH<yY)F8;nuU|{0^B!`G1GY)Rk1n{>aCOR%@3bJW2Q`0p<;?Y
z2Kd+je5@+M>l8jFd5*<WYF)=7uF4$j$Q|dp0OqY&;(zYtX0(7>{dsxBM`zCG5RdWU
zS^=w*q1U@uM*l?W*~WOOLd!z!B?$8m>SASU5$d`d+|4n^%p(}Lqor!26pJEVh~9*9
zS542&a9|T>JZnN=T=4fb(EOnnJ1vEXiHMnwY~IxQvcfCk$L!*Jao{ec6X6Z>GdD&U
zk(eX(v($|9$H!W}^RpiGyYb!6=4nzW9UeiC4KzpC^27xbR_w3E-F*JrK{L*A)sI7G
zHuES<+}1ae4i}GO2}3|V2L417A<9ySHS-8*-8cd<G9n<>BK98ppWDsCt{;u!E~~mJ
zw}5>XVgnEVc!?lLBaybe%k3I*cNGzumEQNh*oK;b<ruN|i4mPAV-6Lto0}TZ3Y18x
zxL87^gGA<9;uhRT%Ij3+@B8#9smdsYQU7qjS#$KKHNsKTc{XqXd<q?@K#7u~N8KmH
z_@g6(ivuL-Q6YF1$px_6<R7WJoyeQE?jtalchRAUTb9HK>6@;n;#k~LHl$i2tm<}a
zJHeI<;QP(dZeMOc(p=G-iwcDKtC!ykquCpD{j|cv<<p@9$r~0L(SD(^UWADA7R$DJ
zyDTtY1K#D}Oqe($^0Kq%?_>}5tv`eShFh4ovWbIu09?J&TT&`GoB%s<5^QK5T$wjb
z$YeZ!z7SF2c@B#>WfF0j;%FnakTDnBVr(mC0+ygShmJrFjYjw18+(?A?RBO^eLETX
zZ9Xa>z#+UVB%%(gT<O=n1y`ZXKjhw*(mT-6*ncy(9H)5T+VxX!bpLGLK4it$tsGv8
zo-H{QVRvx9>&v}tCzu*B@;)}$Kx&~{*GbtHdOgoalL#JwBgCKYMJw6IKTNec*yBas
z8$=unJCHk3^C>!4DXzX?Htl}{Li@S6ag0Ve7t0}k{ZTGX@~=dXnSDp!+jyPyb!Cot
zia^-a3Y&I&DoQDAi=Pk4*~zAN-6N5A=<eWmmFH~mY$aFf&{r!r5uHsQ&$6_*J&vl+
z?T3R>(;W#s${s(rm1h4PLOXstd&j1EzwXiOZSvC#VQfM^H65X`%C9_r?Vk8KTJ7|)
z-2E>T5_{{vvGVKhDF(eQmQ&GVPj!8^CqvnDW$*On!tnFU6(0L)e}0bF-d$bUKeNr4
z{_s%I^Wf}m&;I6A`!VCZGxz2P?*C1fzh2|`KJ<uHjHcDe-~IE+XVz<;8*45~*Wn}C
z)wb#0yIpsghc($J97|>!{=o0x<^7&hUqXo`Ud+ZD%41E|>f{fg59x|T%1y_KXVU7r
zV(!<~>BI_$N{PiwYJ`hD2w*dNCS5UVW~efjJA>B1UOX-N`0Dk*AG+Ih8~w-M*d8t*
zVy(|Ao#(JF#XS?xljy$r(3n3iMMI}7Hbs4fmhoMY=XM<;)*;byF6)7<eNWn0C8uP1
zyv$pvXGzmXF&S?hM&W$d*w+3VdG{IAWEAiVo)S7Fp?5-)E*(K?=%GpzkfMNqAc9os
zn1tS|6al3P2uSZuLT}OqM0)RC>15;k-uuqpxjVZvdv`zVY`#3n*Ylib=E?b=^Zx<p
zeG0Ayg@&YfpJa7tz^ui6b<K9ZWVo1N$TiMwp0cVzY5s2y70oc>nyVBS?MFX@?cCpv
z^j~?clGxbk1FcRqMV1=P_-n^CWxo0Tr?|F^>H)V&+x!#Pf*peYLtN`wb=#-@D0)NI
zH1!Wc`*S)y`nV@uw7=>}*~x*>Qok6#{L=PbKZ6NpVi|W&7G+5rxt6R*j|%l|G`A1W
z?GgWY<ylGFT_dGVy%XoSAXmLDn(}SW!<JjoVV0(v7~Vj5g!<sGSxOHW?aRCqN}qq^
znk-|W_(aS<a*fNQs-K^qI~GH(+4}D@{3F+<EdB4iyq{(w`#Q}&<BHDmtqh%4`J_{j
z4LJ_UNiMYfBiAfA$JM96Gk5>QwTV7T3#rqgj`#fSQfrC-#I+BCr&{B&zd1pRJT?@u
zOR4_%kGDk!&Y}haXFGLWy54;);(oNs^D_1|m!p>WNUzQ(nfmj@ZiYf57U^RYiO?DU
z2ftGt=R>`h(d9uvx6qQ;e2yfUm#Q_NAJ%U-^*6s%S_;RAYspf+OFnsdyv3mJ@;9Dq
zhO)GML-tR^B|OkWm6wN}g2|~v=m0e9^`lQ7>Flb7jg~hQ#YtxSh)1dEVK{CcKy^+O
zxkYg7@|$;f?Xe&c4o33~CO7GmtS-tYrhrrS;?88)8lECy$Qz_JKq<s7v}&N2q0uV(
z&JrK;oeprc7zXWW%%@Ag9NQf0%?`S?Q5~veqf$OaE}`sMEF)H())l`xwBkeRkCQo4
zMY{X@mA(D_*?rnk`6M=Op{G^|6%3kX-~(Vv(Cf2{87GXiP^Ou=gpvJfh*MPi@<8*v
zPhQV3$p>tZ$STr9`G$=msH~SOJ7eH6O(H<M0Q`V3iAdIEBHjUf2yc4KsnNfcWMhF%
zDSI0!kAAL^WLh7V>O34P6lYcbbi0dqHKCvUm^@@CLW$;RSzWzzInj_OIS_P$D{h_y
z;t1)cNQDjX=FsEWCxkp{SW~5qfyQNqpy+PRLxB1kNurf-fCxgJu%8>~;<FA+@QIYu
zc8CgsRdX#i7U*@KAXB=L_@X=NljkQ<$y1$N^FG)_;`&KpK`La<2{AOr<P-+2tbp^@
z4d)I;9PVXu7TtshncC%eCW|my(+CxX!^8-LPYCd!C7i-a^v9%;=!2l;LYR#$g;>mF
zlITD$HO(%CZ=)DjiLDCm1DhvBdC4R%Eh1T1VN{3`l@CJtFQarRkfqfHWE2kuOciX<
zTK%@3oZ^=}FvFtI?mu0`_mxggr{wqvzos%CZ{)L7kP|<Hani*`ggm}Oktm2G=_do!
zIoT8AgG>!eZz}<|991bku6g7um;Fyv^IDR@KRL4gl&KuDMXQ+FWEHWh^V}|zxzF1$
zgwXX%mt6rP$ENGWe-J!0z4?_8utxkwmPir@JM2++<W~r}I&1A%7>{EokzEIe{2^AH
zs40eBbLdjl_ro--oB(6SLZ})1!p%~!8I3#gHTFdaDVQ%fP%stt&ZI~m*nhHXbTT8}
zjsMs+b?g7et`%X}wZAY*yV?~(+&=`oWjT>j7<O&?3pdA{USvF4uaQ*PR>i#zYbH_3
zhR~KLQoegd-%EuT<F18J%CnIhq~v1UHFb=;w#M_71FW82t}=X0&T=EwE7q&7(6L7n
zUz|^>o4}J0YJp$<3FEHmRnZj6l0I~>rlUZqKd3#%i7k2AI(yu2zE+Yc3Sc9gAOy(b
z=o3j-hXJcuLlpkPNCkLo1Ev1J3>gq1Fe?-!1*#mv(K+mN>HX2ZKa>UEJvKwLdm>#P
zPodM5_$5znQZ5-0?Jj@P#B0^5f<jJ)peTHok8H$c#~5}k7a&P`jbYcqFznir<;5Jt
zWeitr9!#28hKPRc^$ylug_OBu|2Fa=LfUu?|3v~6&0OcB`0&t5&o=~)Uts#rU5f_$
z6p#w}pvdEv<7E<{Bn5;Bd8OqLZwO+PI~Sj}nvLSE3dUW#<akiN0}``XqjLKXcMT+`
zf+F>dAQT#2{_Q&d<)QWLH||_AiWg;Y^3QZUybjAG{KB1(7($#!7~<Wrb)JJ$@(St!
zM?&YV)48g87&P-@I6_zn)gwX`=HN)tm>J0Heno-wxOn&XtAt_4;goY7v8Jq=0~Ee~
zQ%Az*d5{Ij3zsGphsx)!PqOi!e)sEFx3SJkvo0t92_RY@2j%av6Sf8@vc6VC>h(Mu
zX+>D;wIY@?kAn+|WW@~`6yx~$R@hq5A5>K;kNb2PQH=LFp`A}oeviCgq?my!33fDH
zg<?^2I-K{fDRu5n7PXV4xYQ~nw7GVQ1~UzJbei8Lm`W1<hI|LLi<F<ts0c7}URSCj
z7C8dd6BO4Co_<v*TQGW0_l%uKFFdSml+0bL3-U3-pj`pyr{Caj2q(Nq+MP7gzpwxz
zLo$FF=g7QvWumiVd^3PDRaWQf#wTNXMz&)mu0};Eo@9!$U<hfNnFa)J5ckis&k6vP
zoZC~7DK_tUmICI8gmC8(Y4E7sGXAE;kQ|k!&j(n+)1+)FscoF5I||Nu)D&;<m1Rmx
zB2KrDCE0ZsnI?c#Q-w8$SuzI=SIIHK{OyLpV0i6)cws8vztBIjpnvW-E1UpD+8Wgb
z;;3h2C{TS`2_y*a!F{ZPctB-Ep9fgK3Kr<cd3=db;88Sz0k~B{D12D9G*kpFLKPyO
zL$13Z6w0*6IP5eOdyijGX<GjY1eDUVvt#VFEM&-!xlZa2Cp!q0^)wami}!AM3hO3t
z4FI$FlKQMtRM{$@nI^?84h(?JtYevC!8je8F7Ig$(n}fqm8VkhSzWl3d5ZEb7cSG7
z{EuE6`>c(j*Lbj5A0Z!bD&;!jvau?j?R--4L_A={L=d>lkIVpJA$-*~{7FOtK_Ti_
z!J?#7B(>PQ2}rdnbUt+m*5`~I^|F^T<wjSCuFxMU<bK%-q+P@?YG8Hd)dz%1nG&e1
zL*18Ik%5!EcZggwM2Id$VM+<8y+Fao2}{X;97HIM>?Y^Q=W-3E1St8`p;(sFRW29!
zTA{K@okFoIQFUxjTAyo{{nTn)RxhU1w9TSVM;JC@Lw^7m8RlM~a+xNqH|P~*g@Y9Z
zLLjZG^7~Y5IC-qsxW@O^vOFjkjJxL3{nZx$`<TyP_>xPr+a%0RjxPA0yGEyIS~<t{
z&V~%JY8l5aVxdfnWvX1<&FZ5xUyEQ^#vKn$dZ<P#Kb0>HMbez(O1ff>VB!iN&T8}w
z7+nR6u%q)uMLD!vyX;wetjlmIctRCO(*$f)bI7OdRcPKK@)aWT0iU|9dUgJhYpt0I
z=jjTtLWR~01ta9>O1{earpu;<!hODWWk;rJBs3|rA+*Dqy?~3y_R5-h72BFnyNCf6
z;&F|eXSDt{2}|-km<EcY&Q)MV!A1R%Q?p*rzZJu+bz(9Ajt~sDhD&stB+Ut=UoFt3
zQa1exQ2)lE4bN0x4yOBPdDGJ^-Ke;i0XWO;mZd}K6OS_Xt}spKDySgI8x?sMahZ9r
z|A}jQlxzk_l`LfBU*)K4w&-Rf+H`D)AiL%~7pHNS%2;viVV9Y>5(hZdQa6~#51m)V
zi_Ofy`}}X085juxBxzLk!K`peLf~9uMG6U-^;f|PVOSikpJmsvh^%%}U6zExI*7+U
z%Z_!B<Y39}D~famzcTKO7zknes7M=uRNqE)+9}0`Ve64w(B)v8G%M0tAzp>9DLJgB
zu<HpVU=c$*p+u7;WpJfM6iFkmDp~MH`CtVVK4M{{`!%k~IDiuqc9P~p|JoC-V{rnK
zy@FnW-n<4**)k?zH8=5<)xRhyFCi~+L^>!DCP0C7{bh%oIFGR<9Xd5W8PQYm)7{#G
zL*Ue=2(|3rg~(mHBrG*z9$hM27E%;ztqOc@P#uP=^=v&jY*W*SM>7V!vBrjyo7#h=
zhpDeCKhZEO`dRu&9)qp%w+{l4I>xl~4%%e|8q0~vZBdI=-IyR4`V*JtI8EJ_hY={C
zyAK+=<gD)@;?1(sg%N64JXMI%pT}(8IS=kTRPndf7=`oeZ3nOLJmpg?WC)<5&&!}G
zMrFo6%g_j6<4mK3;Yz_xbS9J)|8Z-|g5NBLeCgA5GIX#^*ga9z+0(8IY22d05`o<^
zSvXD`%BKs+V+mdPM#Nn8rk-i%T=^$Ecrqje(RrmpKL)2RgMY8<l^u4@T?iv##wM9B
z7-lC60{~+-;MA8&z~fc*g9Y;Q1wP>qHJb}`al7OgZp{K+0Q?Ba=w+00Wt^(&5FWN9
zoLbOfGOxx{E{-+(N}h$f8<&B7am+40bu*^o#1W!HwbKZ?oZ~*0qIj~5yHc&D;G=vr
zt=4>XxHYAuc-=)VRj%^JnzkIrPebJrV|`zBs^ckcT?aSM%@dQxP<Ja)zeZ8dg`9fX
z2#<Z*-B`N!Re35v$$YI$<(kTK4LLg$Lf2ad7O1fL*sc{Ws5jZ-mm@W~p5bO=+JRLr
zt4mdEjWmoqYvxpVue*3PZP>4a#gy_@hAUJqv8@k+DO_o+f4w#MTR~h=iL=s0O~|A<
zg+sQi%o>6<@vA^}@l{YcGGH}0RrL6x1ecgILVg`>0I28$n7Ha(KCr@9HosPtizrk`
zC^RlER)|pg=dD2>aA&zv6$q1rSJ4H>anJ5+EGq-ET<FIjWIp_LW=_9U`H8gof$vqo
zF)8Y%*d#g7hjdj64vGT8r8Rj4I#N5ND<5sF6=VIBKOOE6Fk;hyr=>lyDJqd@uPT**
z6S}ve-0I`tP>Pf`=vMo_X2PkSgFw4|u_K$oJ+>Y9cToXv9r!Xp{TWJzL7gKV0kOj7
zo6wQDtya0M7QP7<#uXF6_-7ywQCts^24!J>4>6${F|C?^;+nRHxVo5xlgA^DGf{;z
zVGl7;bFoJpHB#X<lHOwC6=KpgV#3L2F)1+*>C7|Ph8mHX8rhZ_v97bnX*F^;9`Z|K
zaxEURG9EIf9%5AD5^u%i8O7!KJr$15B!oPb4bPz@=L&sdD*R$+b6wP)25cU<X$NZZ
zQm+?Wu{1H{S}~TU2mBwoRx3`Bf>h`i2VVx$_Irxu1Z(>v6tEE5`O3WgwVE~Jn%_OO
z8^m>fd+HROYc_}*44oS^oa=0PY8`n#L3`?fytHT~jJj%#BqcPLJWUk-=m*ysL`x7D
z)#;vjYTbzIHPq@+);((xH_Jaaimx;E|MQGn;(4ir`HMR9d~u7n5|)g0mN$R2ao-u<
zh}(F;6<q(k81ghCd1PoVp_z|X7PIxT$oI6Jl(1Wpc)|V7^u;@Kk9zAg2^*8YwuW9W
zXC!R3{@R4s+q|rEdijXJ;nC}c^H*sS&S!t`3$+E-@HLCzOa;Nf0=WAghFn9s^Ivcl
zba@nEQ5OU=X-f)7b$LQ0skIx#q%J%l-tI!)9#6bI6&ipAiqeg6l5H&Zf-Z_}cz_T_
zTtfy7d2_Q~1eQv&&o}%N*Df#oixBT+f&-T>{QE8fW*XjaHM}pC^ly<2Sdt8cNCoXR
z1e`Uz$8Cfc;UbnA5Z;Z*J!q(;R9Ml4UxPQ&P%3z-A^6B!`url$Lkj8dgD`IliT8<Y
zxr|h9Bq_TLY`6@)L0`lTNyfhNiJ`p|^t=ooYDmzMN}TZy!F?R5a23tb6vOBXpYciF
zgGS6W#+m!Z7fF2(YY0@h@Xh!3Rq%fI#M|q|g$IUQd*dzbdErsf<PN#;6l?JC|Lcmr
zvdi(5CY8>mZO(;A=W#dZ2}$QmHs>oy7pONEJdyr_fzVz^7rtsPd@Eh#-CXp(x!}fk
zWg3{Xq=s3(EG}v;sgN#hXfFLOUDnrJHY)wCD7ZMdRF=-<>+jyLGtCuf=}L2Nt#~+X
zdRGB=L%0WAjH&stE7Xg!nTgb&fzH3M4^G1BO$=zMe=E~qa{Y~Ddu6}bnb5Bxt)=Ou
zU#&lasT+$x1>I0E1FbJYRExFL&^EW0%79$qv<}U6eV33dnGS;6dP4+81VhQ-H<7e<
z3I*h<-~1!jwq?4{ItUA(o)t3S0=O8f5?KtCR93c?`=+|9i78#VM&TxB=%y<(m;?^5
zN^Y$>LQ<t*fn@`vF{lBih~=NS*5&1osic;nzU}zY0%uBrljJmy7IlCGu))HzQ|fYG
z7-Q)j1Z)IwVUU0~oUK#dat-SK4E>6jAlrYhBc9(|dfk&u4<Q!QL2;|t7T(&55!YNh
zDAvz8vs&9c;6Dtp30RdEmI7NU8r<UHB<Z;9u2>)#HUT(r)ey1tqGg_6eqP~jOn
z^QwK5vKcrpKCFVIfU&%+?4s67obJM(dE36*=U1D5PN;{d!jNlvC_*@N?(8myqYHv1
zG5(}otlxiDre%?`c@WgRbcA!PE<-(a_niZGbPqmMq}=|t3lsw%2!^ls$sDFZ$qKqa
zjjfOA?swxAy59TufN@zx!#J##cUr>ea%8XizL%)W2<Z7srw0?qKpA504$f``u>gd$
z@6~Q$CLF5G;!IikE6|>3T9r+f!kXfQF2QIKsdNuQeRcuh`-y`&yYgN_j~%${Z0}1I
zX%7wyChf+tXVSD16FXSeF7`j7mH&4Tn%6beYoo7E9=jfUQ=^@XznM3^`*ThG#<c3?
zK&piKv_WO*S-JIrcl57kP5%Rgc2j3*g$gdBc@#j0fzZM?Y?*dra1$(frTyG8$|(sR
zf05d*j2wTqDV}Vgod>hqRuXbID?|-jdpdeNu+Vl-?9AF#VD(`~E;Mo}jY<1HDy$9(
z9_ty(ko3Nnb^G}p1EEzMaxp!2PgSy(qaHDk+Pe?RW_-^Q==W#u*O9X^O!ev2*@k~u
z5afN(of@MP(=HwW?AhO6?QC0uz@0OiSm6pAR*VaV)IWYGaiw|O*+Ed6B%Eyk_Ee<K
zD8@nrGbCudVq7<H&E>)m|4pRI3cX|tMbrIlA@5`IV$y8>8*uB^tTvp`195L|8H^9`
z(JyWGC{G~h=lPPAG|1P+7a|Wdm`&0WES)3AKxl7XD-{fC4>IBAYbNtZ2-$e>NPf5u
zj<U?+br_cYGcU&bYO#`H42lw^;MdyBRc+nHA5a@pV-BP;sQ#EJ6e?*(Pk@2Yn76d#
z<?g7a^rGiNRe(?))hVN=p}L%4jzH>ue*x6Uf3w%D7Cy{850of<0CZ{eoU{=+@ce1}
z!7{bU*+^ei*Zxa3&DX2$OKS5y+omm9^Wh<ydDk8}{#o@HximwJy=M0;r(O}CK4(2U
zZPD+bjdm&Ej}GNx;N2bVGCFW6R&p6hcJI9$O#OUzF^GQAyEuGHhwg=bwqs1NdI?Tm
zwwqj>Q40U@Rr-2Tk25cx&G^H=VQ%7uNXw@l48qlEFLk{(W1XK%Y<+|@|62XDuKbFE
z84mR8ATPMgc$HhqKDTY_?{Y;q2p4{a5!W1}|4Ur!iFjNo&v*a}w#;yjE#-S?G-1HA
zMaL88mNB8Rx|rnBauQ_zR&V3*#-*W-^mY=p*Y2OixTxlQ)I=-E<bt|-&ScnE7c%cY
zaMxS=8d$F5-{v|j%syV#8POTvCQubp;a@3?q@Cys<_>q=a_jor#I*sns~?ryB=1Xf
z+};-E&K18zyG2N{T*;-qZ@JofEX88Kld&}Ax1UVl;rFmqsGaXs))mX`f!Kk(pIq0I
z4F6Ml>CdAVnSHe%N<Qw~wHn4;erB>4QQJGOj;}beV^GuUl)1d1^#QEl*^Lp@Zz_fh
ziz~e$W6}y3ejvNTyk?-KrTDi4K*E=<{8Dl|rwS?sBu{cx=Tgb7G&U`xX$J>hCt4Fb
z^|ygt1jDa>v5}eljgV}t6jP*PryfIft=zeWXts`mpPF`a2tIsmEow~}86g<^6&gH6
z6ef^ztbm_t2Y*I{&*qSbax%>$FFPg>DQ6>5SVuxqeK3o5Rq;WsE(|6EYb-ZDAFRaL
zDYV(O&|ER_FyX(dWTk|(4<b%rRmDnLEK{7@;(ge>kHW>DI`)XrU7&P>k{;&*Sa>CT
zV+?m;AMynr{I=kQ7zuKxmQAfQ@_a~U+Hg<ZF0p&+(nM$Fl9cxL>_J?dhE^YSXHpPR
z82K<b)Q>O$e!m<_U#J*iI807boe)ZYYaPiWj-*WNCy?;S4S)NbgM8_{Px{B$$XoYL
zQdFf1=kP@Qq#OH3-&}<BEjCEU$Od`89nSUogikDM91<0vWsyh!`NrAZZj?WqNv&~s
zYu(oGL+AE&RKs}ODnY?pnN?V}i9wtJDt|=dYpSudL2SEt;g5{3uxHn;RA92Ov0sil
zl4#$_<i%IT0?s>RLDG>qLE_A84@!>P>BicQU%s2PQpF!g>Md<VfLr?kN4q<q$qzMN
z>sGzeZ7U$NjuA*v0=N0XYoef>5lGW=(X(lNwen|Pg4cuyg^pZOH$YzQJz<FW9Gnbx
zqD-WE+V`+?nfbUtH~649%0Qhsv~NRPgliqnXYosU#P6L)j%tj9hPmp<YvMX}JD`)+
zjoEC_^y6BuZ_Y<*8JzO!4TW}&Z>&F>hu0c6K4K1kTQi%r{MYC`yeArcz8sI6Cz5H2
zVb@YUP4Gp7vr=>LjHi96+n%eIoA6@BRxz%>*Q>&QAe6ka<KfQW2A<qMc5OTu9U_f!
z*Ah4jnwS5>UGwX=N=miW5YYKq&+inviE-C#`0!}jf0%|uORSU_U3O{=R0bs7n1Q^z
zJEQ5{o@x&Nq6{|eVQ{H3h)>k^3N`H(-K;Epo@LWh=F=sE$#!Szm{>>Co#Pl60=Ep}
zMe+3npZ_6%R8T<0z-!E=#brJNPJpvRiMF$IQU41>h?hkd;fX{vBql+JYt#-@(5T5s
z$`@;ytwdwZYVa5o`U^jbtzW5dV*y`WsTaepJw+gMoMGEPn5D;=OvUphdIps|T=?9f
zwRyajj_Qna!XM+#3uG1yJVds?>NU+4`p!9ODM(Lcrh0x=yofMVM~@4a>Ux&GD6M+%
z{g*%@Ow2My@x{yGNixe0C63y!0096l(MBtt@n4Zm3q72+kwf*mAJNXbddZZtsao>(
zlFzL&zfd45aU@@_kl5|70GsE2$~Ei7n=SB}q{ciEc5LIl`U0&B>`bS!n11`-3An7^
zWcrja&Xx@=vkZGCMZn<Vs-tMJf-BV6Blc6{2C7<H)9z3tQvNzt#-g7kO|zd?&V3ts
zGH=Hgj#GhQ*K9*eG3?sN9r=^y9C{+XxW~=v^(;Y5GD5#`_S+u^m9HvdGaJDE=&Klf
zu$H)6)=QJ-D-{$-ySUlW|J<zK9OPB@if`Zit>&-qx_b<UOw4Haj#`7xi>8{Qz<pKg
zn_uCi-c2%J4sSOf5?IN5R&ApQPsNAObW1*c3M{9IX{~E}?8L91&m8X#^vOsq`HsH-
zbe2V^{6OqQ>W|Yqi<F6TeHd=EeL=@z@l48Y;>7h#-}AqHe!q8PZTx3RSpL+$3M95b
z-^^DWxx_0kb()h{|04N*(fwWSxN1am0}^^w?s*^QZ{%0O2_{MB9$FuG5p*WDDCi=L
zV}U6Naky0yIHe&;*{{|Sn}?vUX1>!m=X5yw+cD#~GLNjX0LI!UHqYbY3z!Hb1BTg!
z)l8`pLi>xb5%@UfYB+1**w*{(g2K2GdRkJ)*c-UG3g81w{|B>d3ETS18~0H^K35*u
zF~E~!XM<xAraV3~z5eFWo5od7DvjX9+!&sy_v<L~Fe}10Yy#aYc)jd24pwqJ2uffA
z|6%Tr+Z-<eY?8a2Z~Z8;O01ly0`f{MvQ=yNEi0)g>K(-~Zse9heF*V-M?e{HLvNHU
z%_(FZEZXdVudz#Z<_f&31ex!G)`Y>{PT=e<GL~GXWj&yk^;Gc_?4vPqP!;gNm7Gxo
z#HK&a=|=D^kD$q>y`T4EAusVJTZ}Lp(fTNVdV;_<NbV9r+_K8DxW_lVOoMam)QmCM
zRt9eoK;3@^TeGbqnMOF-t4f#k;N`^*N*z~vG`$N`mI(PX!a5!ohR;=G6;<?gRb(=b
z<ANubdE|^=s~DUKnIy}1e1xegY#{bq6#~5EF>oNmHsdWeL>5~hC6_ENhv*JLRR*Qx
zf<ahOM1yd~TLk%B4n;K*GQ<j|N@B!OB%u(Mdo990yj-!FOF~NYt}^FcZ71DK0`7?0
z*X}B^Xo3e~$G*k}IOY?a(Gg$g1j(&Mxw2ijf<aWj$@v9Fe+W22uHTMM6hf|ZK;<|z
zO`WvH7=taBNCSZ%fFh<-WDEW;gN==_(uOy)n#cnS4+rx&p0YcSLxwR1o8rUPD5ieL
zk5X(~Y83QZr(8!ALT3g-=!+zw8_~{L5vr}+7<_PL=gRxrVcX}}l)dbPtSE>@6+s!C
zYH$K#i~!J~m@94Qh9@8lXChrmd`&Bmaa@k7PErQ8HXj7Igp{PblW~}pRPTgun*#e_
zLg+1}q=%uTce11wnXrE)`E>liEjOuqoGnF^fD$X)hg_l;Ib<-!j&ddXGFHI)Fys*>
zf662zeG=l{G16fzKAJE7_M~DO;eCssr@-dFL;z>wAB}U-`y0w{CCl$k%D+98)Ox#_
zVny>U3K#?brOm}qj`g@Fk3d|J`FRe}P!1^-9~<)!gbyW9b;bu2SL`~K>GF{66??cQ
zLX6W7DtyRN-bsO0!RB8)d$W2bZ<3;FKBfBNyzW%&?B0Xt$cZJdgAjJ~vKm1$ixRLw
z0Q9gZK7t{v4tNabz~^xM=d4v>Yyjhb0vk*pPA+^d_A^-d$=3TRcG^5Fvf*VG*3yn`
z=%YJq)habr>;HhzejCZ#d2Xkp2%F*5N2RkVRw^2W+rxR#3Y#a16Z})wNEkxw_ZmyW
zG7Ci=|D(}|)2Mda6BgYSI;Tk;{+|Xy)P_0~y8d?FB^;#gp4%Y@vR$f>>t*xlH9X`p
zp=k$uASYxV%UJz`0FuqvNnF)g%+TYhiT4K+dS^rLFG#_DDGb0C12sm(LUh$nD)AtV
z9aQKb73S(B?k}7={y)tssLd<>n0SXK6>>maYrm1kGbMBoc47oJHqsdmhQdGXB@*UK
z)X&$b)f%XcS$6p%*f{^J{tgn|w6)fKJ0jScOR~BQ8_B0TOtkz>ZL;yfnsM5C$&<Sa
zuR1E^zXUc5Hoi0PTZubs(;@aplU-Deth|(ua_0Y7o21&AzXR|5c}l#`pu5t+^+#}X
z++OU-I|ub|+e+_Bv}xda>KK6Sn#wL;!_Ly!F)h{cA<*7C^dG=>e<VmMMvPTYKnWwd
z?Jyo%Ww`zC0Ncnm6`z*S@rqHradT3=;}VU_TI!ciG{&o#hW2woG!N!(JUY8%lL~hh
zydDIpd9uuxv0wzYMkvuQW9yA+Hwdk}M5K%L7wxl7pzfoyO%w&)kts%Cqd*XYXoaq=
zEa@BEIB2~LCEdAc^`ub7TPVWoe*&A^?-S-t@`o6KZ5s}3U7^AVY?biWJF8E08k}j3
zy^>9Q%~QR;b$d1BZDIhnV^-?{6o~IaP}{Q^i13R|8<@vfn<fF?b-rJNDPwXmY8F^6
zg-L~te18zKKMj&%gGeE$T~MI7So-G#{IBueCyp?V5&5I?blYasZ(k8d&A=0BeETqx
zmz2qnxAa^YNplCtXN5VBm2yk~V!I{dvce+8MvSIF(8gHNZBX&6q=)FFGv&eQbQL{m
zFQ5KhG5o0=_K+xm%|~Yi3x^f6LlqC~mrfM3f%%TpY;DMgg~JC8_kD^);}9*b#C7vh
zPEA5$pc=LxC`*PQm{pD=zR;%GXk`?sPp+wQJ^ws{)Wv6hHBnG>mM|<WR)QxSvrQud
z3k%DNV8o6TbJSS7!xSG23m*$8{)H0Yi?wfR@_AN>eFy~BrdiE-H;vKP*up-~Ky=5O
zdxs&yS5zE|pvGw0N@D>(&$yvZMrm)sv0=jb%M=ZRL@(<2Kk4y!^a;_b3E1#Ru^!x0
zsl=D`hV)HBO!P_r^fm00P3z6oRVTFURrKRu8IdT`_An;mOaAA%p0uWnwa1yZ2&cuB
z%=%xT_8pdjj5E&%n9&O4=9e2_Be(G7zm*_9{`<k2K3&8s^<vhvw<8tzS6U{vVKZCW
z`>Rj<Pt&iE={>wml~5v=T$1j5ttzWe*}lnLUz0DilOJM}RCbWTnm)DQRQs?o@o9Y2
zFrxbaE#Tjw8G{n}cr#zJk?Nx8Qs9u=9FlV=5d$g;Wy4Z*m4DEb!!PmK=_>xtH{rbx
z6P9&O@LUduvE~S<WOP(uAH`zZNV3hEP|i*oV+|3%Dyf-+7|`>VWB;SqnwOpWcrcUb
zMH3P-^|t8!wQ+`7@tNsobad$FXofTbdMs8fLqXPff{gOt=Q)4aOF;go!%8A{7=A66
zWNg`~euqZBz6x^V)QU<x{6O2}#LSX`;n)27Y*_4HJ=<uu-Sw&T_b9$-`g}2$hT+%T
zpH&)~>yWf~udfi(T(Zy=L-OEG%~(WpHVxE+4QrCbo)6y8@&xUnY7|?(wRAGxhZE{#
z+UjN2dwJBIG}lQ!NW1ePxXi!`xN6?|`PF}nri|WhhK=-6D6@BmZz{8`suRR1E$D-d
znboANsG7HIwF5ToDVfcsEr`C~@-_a3r`M@X=4p7o*sPdi;8xi7nH|rj>Tv@sz>HNt
zY&@bTJLP(txm$(MWEO_t`OgwoIQY*JUa@u(F?1i)boy^mlhSp8ZUpYnnq*o{<Xe0G
z7<7w;c3+s`E?ebTTlaY1%D<R@2lI~WQhcXTgPx%7t5WTYy%qFlG7PdnNkDVX8nJtG
z`@d$%CuVs@S%dTDrRPbEe%zWAG7alY4EA9UNvI}BSTTuX05+?L@2x-l4TmEsJbq>g
z9U5(8F&obYj8eL#a(4h|0>=}jE7;)UjDbv>0Zh%P2@%y%kfr2J*4VGqH_bT%GIDyP
zmXohsQ*mV~y&qTT%f;V)oREAlsde}0F|#uUU{kphn$`Z`#;gakoE8Je6F_If<*)>o
z2lWGHLj!Tpy(?H)9k@|nutV-<Jd&r!xrnIJXAY2IvC#QyOTB==xi04P(z`cIY?*D$
zLLtI&<AGBI7V}HY-2>SRHGkg^*U61}Emq;ouVgRvnJkXtx1B8rtoy>pm92=3moM6u
zXytv;3%0Usy?FQbj2gESFKsCo7wDg_^|iJ7o-$6Gt{xyEV;zK3XDqUF(m}?n)In?J
z@-EDawoGix%Fk=v#2r>Lq}w08+1sv&P^7`P{PApYBRmMhCT_kIY>s6u{Hg4^hW&Cp
z^`E|GBegB|X}jXNZ*045>dN*GMqg8$of}p^L~T{B(g@d2hO+F<e6p_lWZQ4$-114_
zFRBWS<|Yo}gmgj|G5ngne8<mE2e=C63->RdD?&Dc1S1gZL>_Y6P#WVJ@<Z#8rt~ok
zfhM#RDHCLNf^9vXPZoe029d%pb89CTcSRt7EK`r;Q>m0Xi1A5J+SsQmZ2tD-{f(VD
zHGFZg;Q2=`jG6uZow)elGgNHDHGj-|fruCU3Fs7$_ZOc(x5m;!lCb1n=PFj<{Jldl
zryw?ar1@W?|JHQgRI%UE&s^m~?o4Vg<nTcw+0r=J6o3!pImdjBie&87lPf#fKlm{1
zTVO2q^zZ)N!>#@^Z?hk09bq7}9s%+ul^H5gPngR}XV``9gKCwy9K{eCM(Nhnh&;5y
z%Nds|kxk+M0YdY2UltZD{x1k^;*0iwKxidXUyVx5+M*;%r@vXW_+?+$6wOxI4t->f
z9(_?;`^q=TOuz8+cUI9Ryw}l^6^m{DN4x_cv<BL&^ylXdst;)x9(Zn-wRr!Cc@!Sh
zysbaMLvA|&WXq2cjfXHO437yL4$q!!4&b8k+xvJm*`KRjp0vfvcn^Pm;eT^aCfj(t
z(jCpH5ZC(JbYVDi>+bK~Z|bc_JH549axH%k1bLT;ryqP)P^i82^$?pRb5cObhMleH
zwGBIIwqCsq>&a!Y-y9!GL4yO<7CIwYfV?83?}!D_{pRjKc|z+D3SF3WC=Id)g=BcW
zJpi_Kpc^9ocxf0W>kMG~5yn@}W6YB(WlO}3;#}3E6ZQ>O^V>^QCV99{NSLFrr-GfV
zP$a&Z;JCSQ32_qa>?h)`mI5$D8z25$4mEQbuuFR$L{u0&WT~<F{L^_AyHr)m09WRU
zr`xEUWr$e50*Y|+iL8Eq-ID;BznA%+v%N&VDEFpgC^j{4^46#O^BoZUZSUiv6eF%#
z`$8Ezdi$bJLBy|%^K_*O3ky#@N4}Pn`<ZiS@+iI(R#UO=l@Pf?s8ZdkmH+~Rj(xOp
zT07IC$$JHx;~CY&Ct$gay9_TXfK9}u3aQs<!w02h?$WOt7XJf6i!&^#-z+bVx3EFg
z&~mS5Ic>-%j5z$(zJQjb`TSkgN^U*AA3A8n0cpFU@NbL{zY~vg0wn`Jpm2z!Bm^jB
z+4}QM97%+H-t@7&Cw1><kJqm5XKbK9M*Rnb#?Kv4-5Im*mMKfIBz~q%ck}_4D<Wg!
zKBffHsjX5-&Zr*J6#C&gY1tW2TYosOA11wf89d6ooMNqN_6{)~CSP}%7fD?wr4mJB
zR<;xW!wV0mUf$3o(CeXdEn6~|uF=8htlj5tlX9l%R9-7#kWaOfQ9>g=Yi){wjbH6r
zk2}fLYngG#-hSm6A@;tcP@3j+Kr3nzUdt*YMF&aO5`F`{?tQnDO@f-F>O#PV4~3@O
z3CQl}Mf`TI_o+yk6Cv@foqVpYF>50Vpulq-<}L*BfK#T&9$P`N#<ZCf)irb4jWUkx
zYDi94*SDqHn~VF9!zX`%JHai=#xdI<;`xXpy(`(B#OOUDSGY3{4uKh48-ULh5#xkM
z0Ec!MimU=f+_IICP~x&s5Cu>XA#<A>_b4HUbT66+Um`t~XfPy5WCwfMVL4jHRroz*
zUPHE0FP?DMHT<{8G9w*fH!E?X)!St#o6jtlffNeTRg<GImxCX`#0EG{uqIew16E{|
zJMRbQQGMM8JrH#Z`g4XR;H(`3xg_L3j0>!vIIyvD4!Xtp>f;gQ2zSfwy2WQVV-pxD
z_VEt{;|oEtWwRp4XhNWrLJ7Sr_743|Tj2@bsCnY!)PB`R)y^T}oRrFyIKV*;0#4Hc
z1(sim@BVa?sS+3PzsN{_=gNu~Q1<2FTOzi8l!45t9<9!`h-}vWFjq%`hR|Dg?bZZb
zlIyuIV%d&R*;V(CQ)OHxQ9NO<UK<J(MRY&<uF+>dT<tq8Q1p1TDdn>`Zq`1h*0(vL
zCpb|naoc4@a-%zaZ+bmGOP#3E?e>hq)pSysE?49*5SpC)D)#}nSlNyuKU~xE<*GJ{
zg8~Dgag8CEOt)0f%+2wFt$X>LKaJUfZ1iGFJilo3uR^qT^<q(;g@w|*1TJuBDh5Ks
zl?j8q(42(-6~I7f$x^R~LbFaiziR)P63IDEj-&bT8ObqkRMDLCZkFn6yhA7kLYuCP
z@+$jp5L#`C*SCKV+7j_h<Dgf$=Qj+57B$nl`=LDEr<>6L{4~%;;!_V}nKktkP=rpn
zB*wYyC4}TxzvjE@ly7BrLeam5U%#u#Iw*UkKr%NL^{%$y;Wx)8H<Z*7xw+x7+*sx$
z=DW4Z)KPdy=eN-q2<=@%!(AjWh-7}5*t=2slIU%G^!)nibVIjuxod3c{I;fK!?0Jm
zSFQ|tVV}LBdD=_xT^-5dqI*uu!kvrHC<y@UiUp8hJ#u|{oJ^i`(Yk9_;U7x!0@yFv
zVgpuYlVvdXSriV(78Gs`T8;7K@j;QgxCUG24(;D|qo~SVL$bwIh@E^;w9`6alC3Mi
zC43a?v~Y-6L0<QWDC)uU<4Cq*HtHgH&qLk5Xfjz-sa2o8QnSSvr{QJBn(Z#=rf}3#
zm38(a<?cqdswC<F8?vkPUMP)w)YjD+jrrqV)56oRhT)fa)k#A34)(*FE1!jr^m?D;
zi=<1QQ$Ch`%-ka<n)O)t6`t7DBg3H6OuOG3?C8g(h<7z^-?}#`KxRK4SQciCQV<QJ
zW6o{Qa+K*9P(o@X!sBN0=O5zuw%BLrJG_B)NqYes)FgA07RFvh5K}H)6QA*jhv#L_
zzB%T-GZgARwx8lb6<h4-O>_0ueSng!>qBHlij23SBJS*7QqKJx50l8uIk0h5_&p86
z$aL1%x~-;4toN*80&2~m=lwW_bD|Lnn{Fg#Q+o{6l|LKE!Vg&e{Z;z~tEv@#>@%SK
ze@_Y4*F8%)dIPzgn-4o}H_WyR6uMm$|HBRau^Q%@5DY;zhM(M?#5q|6Q*N$?W1`?V
zr&eXE7Gf(*jC2&n&(xc-+Ym+obOomSbxCpibn|NOnbBITijPuN1q0pqIGE9!pjZcU
z2J0}T1$MYdRY>6QPdv%lT^bkolpKW{aUm`6x0XpFratQ|>nN+!@xnKgS>8=$sC8c>
z+<!dwxkGbw_Gh*S;ZH|9NsTX0sfLd?zS~kI2ZW%G{g-CPA-aV%LX8Knzc<zVR(aR|
zcKgI_hAQ(<`;}mD`^kww?1Mu@nty*U6hkA?$ma<^i$H?ct%&{!Y!i^!$^4~+bzaC7
zT$1jRaO>SsO_%?VKEF@;Z8u+y<^vW8{;)K3Aj!G1)4Xa$W!4*|U2GA4J0PR;LCKQi
zNJv072z^?p8MH;;zPeU)eRuGx{j3K)?lp!YY#E%A>&J#;^T2T&(D;7KftL+BV<tgw
zkZ-nM1??7D0eQSn8sGrhK;mT6=`$hv2)K$J>0J?R3@zm?D^il2)CG>@Ek^P=1lm^u
zWvhT9m&liHAW^y?=0?6T@Aq@=m{9U{*#vw)EqK@j(PI)av*{z%=&cV1iIWpqy1F;4
zxcyF}ys!cU!9y_`o9Q;eUqzq`9FH^HJr<7VfWg?{q1FjRn*DrCKB97$!LqZaZpD1k
zjR>0@#GB%9#hws}71~BcE4h<!5o`PgaB%(jKa9=3gU8eLAI66DfW)aWeAHWfRVCb=
zCuDOqjL|gmGofyl6=^IO7%~>pv`mmV7J}Iv5eY{FbhgQ2JBZRnBLobh@4+rd)Bh+o
zAtYWalrotxs;i$iJw2p5B1Xz5)N%|j2;;DU|2b^-3EZYuMCTZX4UE_AN(}Li=5vp>
z$2e@PV223uDIWf;4x!HUn1k)OBf@ybV8GEbK@%%Uqc@3>60nGsRhy33zJsK}3J`c2
z%SaIy>q>0hN75ATer3&K560i`jXQxQQadKnHnDPF@Lx#T--GcdmkA83L7HGtVh%wo
zJZV)wfq^3KFBj)MIXMT6Kxh?A8JQ?M4x*i*l^jTx`{l!+0lbLt=PCLJutj13HY>o1
z9=Ki+=w6jXGLa-oj(4<5aMg&8N@XP$u}+rvrL+d)xph0W%$nU#a2*{xh#^v)tK5E6
zfkYdlY{)^P>5jGr$a^T#z%lqG3M6{z{rpN3>KlKtjIR#|Tr~nM;efKS@KiXS=`uc_
zBVgJgT7MgC?<#<kNTLtNw|50`rFnU>CZ-UkOOg}mTLBu#L29nSn-l`JNhIxslq4wj
zEATtfTmZg1Wz#Rpqh&FmHJ~7a@e&c5R|&G%CJ3Y;wFcv__mcX-@$ft2gRmZEOoWS_
zgrt6D&alEabs#-LgbKNX8dnL5(?D5cc;m46pk@3i(~k$9ps+N@+ni(*cMuHB{f(FM
z3MxfJ9&`)lE@DMz9cfVZuv7jM*sys2Q()ssBOyOw|0l4qlHaqEq`GF_Lvv}Q4M?LB
z-caB%4zgDbP~PZ$CSE1O<)w7;r4($Y3>Tq%@{4I0tZqyP6iMgS#Da4^PQnOmv+4{V
z-LwDZW&cVflJ6oFYy|4i5hYfFo($#&C4kOcgV&co0f?ina*(!eNS@0~Gd@cEU2y9d
zUTS?<HyF<oj<4V02D8F<VWrb6Ca{FYmSKg7C>Fi*gM_jbHS2>KC-6|NWDYrkLgdA!
z!o~Mc2$hIIA{;Mh3^<oS=($XgI)>*RNsAgIbXnH9?H~@R<Ue60PWuSDs{~KF=EQ>0
zM5qoB=}CcC6XgsTzXD^g<q*`4#r(6^tN;QcAk)|QMz4r+$M9;c@MBrajA%*im&=aM
zIo`b{B}M?)(?D7uqpLe&3~fk5T!~GO-E6J%MXW<FC!B!f|Lirj<22=u%ovlaa2r%y
z90fc9e!Gm?WQ(r#DVRzu5J8bTZYJu`frQfN#Svd@N-9arDQ%;oVPK;74EUM}1!@VP
z9)k$ZNIV$UyE?auuRCDI-&MC(_?oOFMOf91iUgWq(tnulG5fj|;6rb<KoPfE4j^;|
zRDSu*6Ut~U%n!pt9@yZwZR<p0o_P`aG>p48#?4ceJLyn+Wd-Oe!My*?QMwKi!St#$
zb5e?|h%|-y^)c$2D{;D8MzSNo8V<0JuIEWhu(Sd!F4LO2)??H)8%Dh5YG4r@5XxS|
z>lVmU3P`mASPxRJ&C#nJGnc$33QfwrA0yPqiV<BYpQ?)aaTzl%75mdCmh)@u{C4c!
zE)#keJS<#{0#l?$eqJBrcZ+m?HdtB1UkGez$UuEG@qy5o3#=T2udp(dL~B|YDN!vz
zF(-f!JAX4dks6f1gq8@l4Dy7={<vus5y=zD1(;%aX+jxqJKpO<T>`M%+Zi)&tp15>
zCKz!IjNb|uBH96O$W$ak>;5W|i1X6)S^?Y@2~C&LrS%l}Q;m7Ioo#75_!)W-R{su*
zfyQZ^YJD&<$gO~D4~%B4Ui1sRhi0t$<*Owm;EWSqU4mgY+}4gw%0o<NrtudrLQabh
zx3C8%$MM($c^C(_&>!;7{~x)Q`V~M%4hqTv2xe5)Mt1{tE9?GKT+8_<t`+-M@eZMc
z+*^q{NqMz0p1lENxhfk6FjiXye*W0{-7MKo`vId_9WOaiYXanJB;HyJZTTK}K^znl
zo%C0YH1x5-saA^joA0bnc`sKQfVmyjtZlP4viz^@$pqpid1~04I$N|NJ)x<Z!YI+G
z%+QHXgaO3*%V5i#?>4!OxTri}BAUdepUCLK#dJ(FZI21bOTv7W$aclU>6pYbK*Fcd
z{3EvuTkAt0POIoiyog)3M%l3ZGl5Fkir<W1?<(J$!ZS{mD@_Di&15tFj`xTS)%)}J
z`je9eDs=-B38jXj*O@}Cu^?oqtau7i*L{$?cAsAr2!`R-Fte$)`05yGvPIB9)PIpR
zdZS%eB9JMkShvRXHR=tg8Y{Te5mHJxkij}Y`leHqQJpx(eqgAWW(ZVfhq{L{5?BLT
z!Grl0gK}<z8&SiStU~N{pzEaQ>UpMG*_3jp6xi1kZAW}vq7UD*x-|JJiFQG?3I3%H
zq>ib>L;F*-j-kwNi1e}085nQPGzZWi%-!Jg@F`9^)|-c+I1JSZH5*xs>Adweu)36p
z=@<LpS}Op|)%}FE-ieXaZ5Z{Zj5bTJE^Aq5J>ipOLcEJrk%JY*t7trT)Qo)xQ3|}h
zM4QOYZA6MOrH?%`{c8&o)65-sz+QOZV=UlK_*btDk*70Yn1^-x6@YRdWV4sx?mwr-
zK6nouv~wFY@)sZ*CmfF8oU;Nr!12Z1`T5EiYqitEBGaP=(sj1epT-U{#}sJ#30#o_
zL&@>lwFsP|@YMubo*XP3nu@PH6mMi(T=~Z6`0L|cLMkv3bkJ5~sztN$aOuohv|fk6
zt$OjO*X0VMRVJW8Zq<-_p3h>6p9PYLioo2wb09);$|G=^8wEY4)pS{BiJE1^$9m;K
zJ}>;oC(G~^df@7&CCy9%lD~~IH32C|q+1t*^vkAv5rOQKTfsnRKyuLg0j9m>)&3gb
zei-8od`&`dU0HWs)n#2hZe62%U29}r=WzWAa6?~k!%%nQsmq2*+{Ux=4fBx=%fpQq
zz)fqx&6m2Hb}pN*;x--2H=RZ{oewwP0=L`*w>)&Wyj-@t<F<UuxBN%80uQ&|1Gf=^
z+rhfqp)T9uaodsQ+tDN2v4`97z@0?Fon+me4=y`taXT61JDDRp*@ruyfxEeayZO4i
zUtD&J;?TQa%XdphcE26&Rsi>^F#QX<dvz{*4RL!-<$En7du@k%-+}um!Tm1X{T`S7
zzPSB?^8KNa{U3+>qrii4!GlTNgP$%3GjRvM$`5{zV8;Jo33#|7c(|tf{|N{U{r@`%
z?d%Eq&s+3GJo>5veKU$i-yNZ`R-P<Fk$7Y*D(QMFN?~No@*#Bkt13~{51)6Z>#wQB
zG0O!3=nd8}JzYAVR5A=UG*cg1wujIgZfbv&a9-@rFx=ApBo}xOU@+R&%TtYIQT=GN
zV^FA*Eg#D8bl0fl>9^-SAD`|Sms_?4;V~NTn^xQX_@tU?d|+1ZywD!XXmV)L>~*l%
zlWB7Fygl&l9*@cN*s3#>45F50dScTX%d8N_^z77j@WaCwy;;xB>_@WY-s3ZyojXi?
z(fO>FZT9E&^f$}zVa(=#-^|rHFZE`dU$`u`1)}j;EG}JFdtxE#pDeE2H-BU+gtJ&)
zd+z@H_M-2T<;}apg*J`%1d!*qKBpT$KC6Fze&_f1VBvc><i&l!^`C>KzRxevLHBoe
zXaZp<HUVcP6c?l-tcXWzTd7C@2@zHz;x4FEA`$8qR$jog5VKtYhyYk<ECEcWhv^8!
z5E_^(0U_o?KuSUa1cAXIAO#piO-VsdLrqId&qznh!ubEXE{CDz1|7Nn7j!w5sGxTT
z@5LwK>ahqPBc#M+u$D=P)M1FMS(vPA*f&I2d~#UeRG9u@IMgMg?s=r5dt|joB-Asq
zA~h2JGt&4dQpGw(^<zx%Ox*vaE@%6{sLL(>PrBSvK|p<B=6|Q<5Nkz&XGNa>rOW-_
zrRAdjXIk!0a}q|E+im&ypSs-t3N3drSh_z{doonrJp66tN5|nvQ`>0O<!Ci(ysl?_
zYj}KqW4!BVyzL6}bE<i0YHecb_uf?Z`BdB0&(@RauKt<!tC^0$+3yFlgTueN&VKb>
z&-IMW_s!2QpUw|YE$mM$4qh(~oiF{L({jK6i<Z0CS-jm@SlwN?*j?G&U%A>}+d160
zI@;bn-nu*9Iyl|EIo&_`b9npr^z7pF@7151tG{S88Z-F`(O7pxOt8uvR4^eWpGALV
zZdW*%Lo*9jmDdwZC-!>2zbd~ko>e)DNu#=8AeqOo#A2ZO%TSu|%fT#-n!+EMQXaeW
z12sjXpP|9T%$l{u<N2^;KFh({uaiZ3`I_09btOMbO>15+4Azy-R9JOIF>BSA{i<=8
zEU_G_|Mt7Vb!{+PtD$_M#pi5yVW^>E={p>kghjita-}PRlK=T|W7S$;0*BTo?WXFD
zp>#2)#o?x!t<fCiXcnF3+MUT_!_w#f59@N1S0A5zZ@;@aU)ft4{k~rOe@mCc#0CGa
z>vHw~N4lJz)Jh7KjyRn&Wvo2=IHgWLe%;y-&rS;G=oh}7ms_fr0h7AwODe%nRKJ#g
z+$zodgN6nR;W(2c8E~A>lt2_axXX_?25_wuXve`wVRjUS5*WXZ%?i{Jm7+mt%&GE(
zF~hYWUjFoo!da~rKn_z^48hV;$!FSr(zMmNduS&&#-}GEG`k&5+IBBZA+KKSlvvdt
zRv=IVxWdVyafWGh!6uEP6S7hQrbg?#?WuIw4qQC@$OoV*T7<3FHEw-Jsj|O{X|EVM
z8vwEYiOqo?dRu9|5sxP{gt6`vpAyPu)GA`IIavy~@%)e)7~|<R?&w4<;Tho&4t?q1
zL<y<5$Bzu7tPys*`9!TDp+13xp?GbrV<<x4zhiUpG1VAs&O-UoFzybT@_Y)%@+_iN
zUUIGyIsmtX6%Ek&t4!a&IU}qupE!%)tE?rjRHihsNRTZp#0531==sJ9jl24Y2&}vz
z9{pVzkWBOtCsfRrt6cL_jF2|~$tw_FFge1}O$n(|Sh2;}bG83r&&lS2j<c^h;)kMD
zqH8C#GxytGq!hdFDrE?q4lDB+9*mOX#Qmo|H_DFVVt9zL=dAB4kFg@&6Fv(LPXVNS
zL(*wM?R;L`mR)=YQzZmqyDwei*FHk<@B_pN0Rsu@tiFn1=wVl10+wgFdI&4x9u7GG
zzUsvKh6V8_1lQcJb*cp_L)Rvz>)%NwOpdE7eaw5phGtPL)23RD_%)}-hU`$`_vEwC
zwXy-ipz&TA{Pei&*aUbg(N2UgmVKo~EbNqT_w;<wgqu$c2TEL|G+?$3<RS-CQadt$
z6mQ@XM11ZR%K~6yMn6N{Vx32*nkM2eIjr0(je*4K*_ijWa%!F@#5g`4W9`jDh?zCU
z%HNA5+zVTS*U8J>7DVFV69hEM!o=3K#Yh}Sz5k85`+RDu>l;0uN&=yT-XZkRdv8go
z(u-oKhF$~&K?DT}q4%h$fS@P{QHmf%q#2qZO+cCjq=Ph3QBlF1cwP7XJagv!1Ls{{
z?#bRW$zJQXz8|97ctZqWkm)7i1L7#s%5bYZOc}{=?1miTl#586`jXB`;?KjGNeHin
z^lDE6Q4QVsuG-8=JfvCnte?HNk1fsB_QmezLD{3T(J4zz*i7psaON1=1j)r+hmw>K
zTD#BPzDa+(TsWm(puAXAvR9Um!zl9~!zGGHiwI4CWi;TDpX99N#4{Z%#uPPp=p$Q}
zs#%c-$@D(Z`N$SeU1o&|t-c-NR#nf+N(AUlHyxZ-GWk_*_J*nN+I{aD-CryAuIjQ@
zz&>k!)=^P$sfEXtYZLmdqo|3wUZ4qz&7CgMRZm$s>AKe8rtDDCkY3f}NS#DUR#H=P
zq46IRn?ybZ$ge@^A>8t_F2^C!iT%`+7;U52Lz3S|9dR#&7}iQ<N;C|PqoVjBT;j@{
z1oE{bBObMwB``)6{D|LQ0CarnpfNn@4AB8~&x7wQ^fGeL4BDidN{mL0F?BNqw1Wa^
z73EMOX%QvtURN^##whz&SRXHCj#a8ajHH}f{P;m`eAc8_onhgbOyhvhaxG1@ipOy2
zA(8=(1^AAE803A5(ee7Dxd*lCIp56dL!425xPWGt%PF`Anh^HwJ)WhjqlKZ?sJQuR
zFR1w4!iklPLwqSlEpo0;93ko!wBs3U30BLz@dV^O8>id1u*5UlSjH0RHq~UEXfy5c
zCxU|5up-YgL3+)~&9EjBsLyGHr(jv$-7ARG-i)`}XcK4Nk;>QvWj?3BxOO-Hg89lI
zyC#1!0wx9EV&yZ&y%@rEKbnJCf1e<n()ylys?ogn{uj9yzo-t)lYf0WU)n!F-Rjwu
z+2+lzD31pzHk5wBkgL+P<8@Eyvh7clwb6u?xfoG1%j|kHvWPD_C3u5Q2CDI+2eE06
z3J*eEPw@p9+>SJ}32996wL}lT9e_yA#5Acwbp0}h9LV!w9yecj?OC9}s*>^JY^QH8
zs755bw?qkQ3;aPiT&`v)Q^MNMK3UTw?%!iFnaA2GZw}P{PQ`}tGC^S}Ywq`8Wrl7S
zT-g<6iLJKDS315yTW!l!SYt3hf8klGFPusCa$rc{%Z9*8%I}`#*u-$UiBfLcS0QtC
zEVM5PW*IH7)}ZqBN7Okj;61`ek-0cwpon+0+#sN@+TrnqsRuN>XZXp_8MyfJ7%-^C
z06me`5Lt)06eUF@jZ-u>9-DQQ-Mvq$-4kIO9=IPfhYrG!)ava?5Y-vsKL;Sf&yGgS
zkMyP!gw(>1@vend4B;mh74W}IxLfDrs%qq_#@e>F4bJS}wJd|OzP$Esu;7D4#Q`aM
zND$LrF%WWM(b@gaPZ@(9_x??KJN;>%QSJ*1{hU^~8&?nc*izw@qDZ|X{+<Wd8NbO>
zcE29)EWworvB)V*HJj6<XaT<R+7L!RXWVyOE$Wnofg{6Rf$Crwy#lcwgN&Oxg?g%;
zvCoaOBjKAX+C(kCAfCk6nms>cn6UU(YR>bX&9Cl2=L+rP0F7IdD+^;m9+1c@OO1$M
zIpR8b#*WNlC>vZP^GfFVpIWYWKw)o>qI#%Z8I-Vy_*llkVtO8PmC+EXZHG$K5@S1l
zlE@V#SuKTf8E5rZF;|;16M~}^T$1RzoK0jBU=s8N<p#xpnh5eBoSP(Hvf3P%`#4A|
zC|PaMm+d^Pob1`iO;YDe!NIxoHtCN>ie+KS3C9%Z`4p?e6o*63FDT}d_*54(vmke>
zTWhMvT&mY$DuFM}M<>k>pB50C7F3u<y2`qo&d%w}zVOr}^EC3DCHwiHh>*f`ru$5X
zD-hQVcC3RBgBWu|8j`{JvY94oHqb{zioKd9jmoB^U)vNpjzE_$p0q1uS0Eu@Rv^=L
zkRQp6&fh^r<C=w28SLy?<@l^Hoy@vIk@Md{U1e<L82!4Yq%0|966Wl~{zw8n8d0Wg
z7lGQ}2eCJ1?k_?lF)`v`6k}61<(rnrBq~D(Y5U!lfH|wXDtSniQikO|e88q$2IYxC
z&JLcXGj<;V2xaO8jwdYpV8zEe`3qR%rw4kXuR%%UAW}*wyw^&b+c0v4&32h>N<-;3
zA6$~GBt~WxH38GpOJmDMkze5#1CX<^j$u@zG&*BPHENQ$T2rBx#tjPa&D~o5%h=tR
z14|cRK3Xz5;PN$|36IekJK7T!QC~~xRc6%#wYQR9Q3b5kPGndSu6>HF{vXHg<-zr^
za_FFzh4jf>(1c%Ck3!cI6<CFm!$aFHCq)`C{&dkb`4yMaW_aTTSB-l3ezL44|E)=O
z7F`F-z6qQD2^TRkGYf~-MKa?U5|lP|0`kmSJB8dXDHAr1vU62Th=V0&n!Qo;clpSM
zkIMxF`tWgq#unM~f8Of4h8e=$ycvA+)Pbl4py(pTR->$VTH;pyN1@~Kzl@z-v$g0~
zkaar9>;mjgJ?PCOsEtwT7;ue+RH)qynxGm9gCn~3Rl68V=!{(vLE%PR?mk#cjO_N8
zu`3H6|9Sf=Ek^#2N-<yX&1!K4i$#PY86)x$fhB_%cyAwM3UvXn8UO`R6KUlLrC;MQ
z78u$6Ozhx4j-3~G#@V&VTPb2+7|RN92u0Af4Ot{=Bd5U0yI+He_ALAz?#{X^a&}Xp
z?h8DTWcdfh>@*4DcfPAsEX43bRn0to;bOwqH`-7~GmvAtj+I5N4${C%4$7XX>{c--
zR&HKgVM1YBiYT}GRpB7;z)A1HNw)_sThibs)^cgCW*PFLrl$^Is5A|nb_`b1uL!v8
ze7ddj*VPB>izLYdW;$TEj<f)LVGf`Jb_7<x5LRa%Q~`mNp{FwCmk7XzHKUl4)kevo
zy`|*+qGVVx?m65^b$j?Rl0q(iSlsq7!%Zn9<YAedNQvH~iZ)6d#`0eAqYt0qmqS>e
z?>~A@q`a$Vd7$^`6`;B)i&B;4^XP5$n@Gyw3sWqS;*P0mE~XUiQ;O3;FN-O0gqSXY
z+6iEdSUsijQcY%?T9FlG^but*0&-Wbc6mr>s+h9iP*X{yECBw}b?)OQ{KpaW_|twC
zrIO6Ju#Xu1hL|O=R@OsJ#~HGQYIA;7QMKyew}sY<DU}fr&{<Zm15mb#{rO*@G(y8G
zBB;%c;Sn<55X1Nm1Ih*<l8PyiVM-(<g|Yof8}`XMF*N%v1KYM)J%KfiRu4Vz)>w6`
zK`@*0Hj5(vg)#fmlkB$z3YVMuk|-+G6t!%MR|-XYxba+8qa=~y@4#U6?y()6uUlr3
zepj2pgxDjq%49YL3=1M|Q*03p(;<yI)eTKV(A`BA`LB#JDHM5!##tmw!xmkytIM!z
zS}#-hbG{|5T`)MCGWG<tfbz;{gX<vBlvIir0|Wjn>t)PY|9ynRB&hdSbLJ(i|K-*S
zcfqM&=!vq2{M*f0#ckPJEOlpD-%;Bx3$kFxYwo+Z(LbeMVzFD6d{o^q_p9<bqE%GA
zt^IaK-POnef%aa(woXdNq`aUi7pfjrrPjn6ApnZitJ=m?ZqxRw064~N6iT_Cb=q3;
zb$eIc1kOW`;?7hFBFX!?-2t6fT6ebz9O|O8aesb42MAF?22_X#l_8!AFQGDZP?_IT
zS&yhlp>7U?ZZ3~*p7?IQl5T;HZlU+xB1hdQp&nkKVX|MRSuE;U<~i^_`b^04bjM1N
zT4l0Rk7RUD#y2zX5Iz+llp1raMyQfjNzYvll=yq0^tS4i>`wh3m7vK^Ag(ILt#;}Z
z--<lyvK~&Ez-pOu#;QZXMhImW?|U-mjLS$>^8J1gj?vSg=AGaRGaGvUvLj!wKPBnm
zd4mBTkAcYefn2MBbMZnkBLmr610?oAQVk`AnJ<kNKWKD&ATeIZp=U68XE3>8FsEcN
z(feh3&dYoSp=%u!tV3&ZcgNil%Dqs&3Xh=+azmvCLN$+uGK%@?ODGwt!wv6;h#dph
zI-oFXz7RsqqmkjX&%=!hBds1n#UleHJG?JzMhb-ZM&k#D<3}>8hi@H?jE9cS*7UyZ
zcsXY?+Q~lpN`Ew7Y;5IdbmaXg$!2UZUa)?jvEHHaT2803N9`+zp#y^#>k+T+mb}`f
zyLF^S(tq8$db(SO8jn9>hJ=j|{^n&=%wtX%VD%h_9lz?ncZE3ns8_yAZkzYu>G;K*
zKCw|=36_!Gvy%dfd^%qrL~*=UGn9#@4ZUiX>ryX$t=IY5VE(n??!-XWYa_!cQ_m^$
zPH9ZSYm3gQf8jdz`AMy%E*sBjE-nyv=R^1LdYAcWuj6Tc4oE%{@@3><eLXaPKZMXZ
z6FNHOV>?rEX(o7n##-3Wsg`q?5f$e!({l7O@fYaCE+z5Tvjoq%w6M7r+@xD)U;6x9
zUgz+5`6PLZlyW?G{)oAtzWUqwS?zBB_^>xT!WMUPpXdj^E=zbz>3sOA>`mqT06_fB
zL*aK%aw*j;v9+TVdxLkcelxF$XOt*%N*DCEDGn6nK64d*c<$}p-p==pqwk`v7|U4@
zm)oG&h<76i^Xa?quL#V)_MD%ic~*DidOTO;G}3zeVf5h~VlGoJ>lI;s<9Hz<x088y
ze0*hLKjFjS(c2@N56XlOhx3%7FCa(51sQK#((wnfz``&H5xF`K|Fd{_G#iKNg0U{~
z7<ClRPjFpXDh`ofvRaf|a*!HcBFkNuL>R8yF3Wj6I!IW)(YdT*_ejymUs+^j+x8A>
zfkScmgZ$VliSQMS(W5UTD_E~pZ|isFbrkN~D~jG@C;qHDh^#pot>q1k+5BO*vs-iP
zTJu;~I}BSpy}<6exAs91p+!Yh6hlLlm@<bDA$OqD)WMsJ-~j=~5HHw(98+xgDxI!d
zCqr*y*5&9sI9=?%N}Ij3+<)vk;(GbNb{&~=^B=qJ39&Y?ej{rL1R_^g{A<@m)X?p^
z2ch7ix`(&xhUj+P`oDG^ag&F>wR49(J$$=C_^(};bftzx<zto{Q(<21;{{4&UagA5
zR`aE;yGJYl>PK?%&V$h1F)9eKxY6<FL+hPwiJGzbvG+16fLbc$CY`QZ++0WgrR$c;
zD7{^j7hPMKTg<mvx7Mlu&~?a9>xA8mEat07#^UkyZlnFHM9LDKu8Tlqz1_*Q+6SCt
zg?yrnD<J{_Thss0by=7G(shGnl)rQxbv;9Fcj^xXbdI&V?8`ch$P}c+gcM~AtlwE5
z-)FP`M7Qhe?@;J=-Hy@T#_{f=7khj7LB8THj!^p_yKbLl3Hj}>UAM@bsrRY>%1-7G
zL*v-y@c(Pq0l@43(sg7CovveiPPdT0{!7=r7ug;QXMF+yH0M$1bR8e<KXhFYovu^)
zu0W*NB7cG%0PpVr-97+Lo%;`67x4;~H}pN6?Z<gKT}P(S>ALm*q3bZ!-TOb1UhUqb
z({<!;f@PFx6+raZfkpn<3FY<WyrTwTMgZz-#t;Y`v7dI1H9#4@j$#7SP`@*_zGb?7
z%DjXCMEvXq0PN5Gwd=t7%s2mQ*Jb7(U%X49+jSX3h}TBHSpmrD9!D}^48;s*U<oH6
z$4b-zfn0VPFfah@*uik9qTLNtjxqw6wm~s{T7g_V@dyS?Mt2B9;~Zcd2xGP8;&$tq
zSnM8ESP#{quh^Md(0vwH5czdEhO|x=qt=fKrLl4;62{+5Z=bIB?$48QpV@J3VlqkD
zpPkutZ;f0Vd*D91=h+eWZEx+}?58u-Bq*D-$K1YmUncj8=k1x#zJph#>?_feOQulq
zCM}1Iq@*4O9ds55W$n!aFnZ$WO8#b=RENL7<499!U<8mAj7&!A^}v8sxXiUbK6Zmi
z!+MHYYC%aLQ$ZDAJzcQ7VFMW9=ORR&UDgI%NV|yoAl8O`!<5crxHS=?2_VJ(X2^5n
z{8hv0&0O~W11%Bo+U=|=2%)i$fpDITz%mF%?_)a!5D_>g`GZed)zY9vgH)kGj2I6D
zVB5501!gC*IK3y9v*^5*?aU0i9VECHq|hT|3n;_%vv%pC?`5h4p@bN8PVObKs*|O}
zQ{BoxJ`wt<B16aPD6%H|ea@CVf^AJ==p$*jS187}`a>lOQSVjzMa(FQBbj!wuW@?Y
zP3kp3v8gC~qu&Q#?J;2Pf(GQC#=$sE|3r3*IHPzOJQ<uNK2$btu0Bzw4#1>|ivjlY
z?z6Psw|tR_SD~f@ecmz<rQ0~d#VhpysKUnt%w&mFD*oHZ&CtPU$Ed8<sgkgiTAY}4
zKhp(qAs!V=Bw$1XJ$%YNSKTSf=RpvO1^Ml}JK(EOw8!~j%^x1ouTMGPBHmq?Z2*p)
zr05C8E<I?~0}#ddyw6oMwcE0Y+g^3AIZt=%NQ{+PzUNelAV)HL1$T0U&LWSWq#7k7
zJ6JP=7jXX+B^j*nrjj+zJ7|%I%=H97WIG#1<aLxLQ2C=Q16FRb7}T!Q6(9DBB*u}<
zJ{Z~Z^2;*VBMt$DY}K3aW|}1(u3N|(8&TW1W^ZK0erpU<Mhxc$y?J}_wTqxa<n)E#
zVXZ4SFYm$Lc>WIW7=30tl$nQc1*V%a{Y+UEfV-ZIvP8K0Ix@o+fhwADs8!&hxipDv
z{7&a<=9S-EqaOg6#pFdC1Jxq=3v@<48-N6WvqXDPe&D7iza+90;3db1$sLqQ6r|z2
zUcJ&rhrkFzrxzWC9v1+}K4(mbj_UasN0cKRNrPZML%)AFy{o(&|Bo)$w#$%se9nvy
zlR@Neg9fH{U4_Or#okL4r~hd~^S!QkAaEBv49k+{30!=I8bd7(7`QxlF^CX<k|Bx*
z=&*Z9$|!&<ENLnlL9Ax@G60L;8OB{nqk{(yseg4j#tI|O7vs1Od|4O#;QX$pB&h8(
zvD7P3NhJpk89>}UL~g99r1V6FijWVdOmfz-Zlr>a3I@g{W=1pZNyM+-C(hkBRY`Nq
z@jc1Q*&b`IQR$d_w!oYH<)OLG3&*@{dZ2kX*1}-jG5>nxiqP?)1%^RQ>B9SRuAfvQ
zg9=8SfgKCxc&UBy1of(V)CkOKMhT%&Mq<(hi}Rx%H%*Cwpsf?yS%f6UXaK%LryD{K
z*Au4hF|rw$aB^8nL(vb(+uP-+grC*~>8s>+p=Ew%A^^YzF{C@9fUK`|P&5I+%b5+T
zr)ge=F#~Kq_)vi@6tc7spok}Sgn>Z?0L_3!fzcSJkw}Ce57jC@f;c$Rjfk^~@EbHB
zzQ~As>c!w(2A0}<pZ3#UOwI=|bkg$GouZcTYYsB-)=C_?K`;E$SNWgffo^uFHhF>F
z!rBOP$vz2r1WJN0Fv!gCLsKt!(^+h(9t&hfnx>?E%7(55+b3kzC9hA}O%nz|0uiLJ
zit`|r49E`*iJ4uejLy$h;P~5+focAN;sh#)k9<SHbdgyUkAc*wOED`DfY!I27^dWs
z)Jw2647y1W5Z?r2KpBuV18@|Jb-e69&cL2QgcSO+vYP^`a2dqd;&A{CipNwIW)Z`+
zBGRBil>&aA7>4E96u1VV7<Dz(N?_4GkJSPcl0dxKCY}uzLJ`*oZ>@Wncd!Bp0Nrj+
z8|!KpSm<jZ9V9V3Wvh<(=j5|t|GgyAB@cunCK`d<cxAKE76dJS3Ih<cYnUF@kRAlW
z%9IjKiJp7n1i?XSsU~b(&I=6yFyW~HG=`Ihua7Pw=Iic<Agv>`TU4%7b)f`;D*<x{
zj7-7mJs1gd;Nq7-Qh}>yJ+hj@iveh&_O>p8q0cV{ilGL1>l2}ajonR9jK%0@_2`+4
zS3Px=KPp^mhV_jJx$+T#MvI-tJvLk}U)Dho%m)yPHb$R$m5qLP<Ndn1>yY#J;iysr
zv8^XS+ne=uEHzDcnLBbo)5v~cN4vwm(Ud$hA2qk<>h-VT6oJW_UKk((SkAquKAHPQ
z@sN1tSfK1V?b~C3-F~hzl^MpQ1z=EFe6z(J+y5@3HaH~}=ymd~(0!KRv<trl%UG!5
zEOX{MDzIcd8)yB665`;aDC(4eDQ82%R_KK%!a2psY#<)smg%?+#Ig_AU`DK|)IIyA
z>#&}wA?nKG9YwUW>)Y3rG43@-J2byVDxw~%d4=aSkl;uEF^yOr2_=8B>$~UukVDUv
z*!cB@O`9zN0O*Trwsb5Y61CF7kT5dsCO?qIa3XpH{pdQQ3SMkum*=`;QZW!!)~6JC
zD#WO`6WCO2T0|m7-<lbHZg>4Y+RihZ`$_JC7LURV{io)cby8_Y3*Z!AOHkDbPcObb
zK=*W}WkJp^=U&rW6B)hc$1DebxWxK-Up9eB-XFx=sXYvtDZsJ#Q&Bbg3a&wbi`>YZ
zuS%mp5XB@R;R_MQm2#hBRU7<g_e{u>LzhyuSTmMu``jPYTMS|f>KTYJO~0LO0EAu(
ziKHYTVa)9Uk_et-R!BHA3MBHLs$n7Ju%Q;I{@Y9!ZrQS9`@YxYn0~I;PrV<`P%c29
zs7#Q3(#tQ=X*Z#CX*Y~*q<mOJZ46I~l#B?}tTIUe@Q`CQOOo2FtN0a`#?LP^ZzR{R
z3<6*j^J-nv-j$W_V&W4vRSSPUoYc4GamnJppl)j1VZZ9%7FI9CRDUi1jhkVLw!!l5
zdq>v`)CjEZV{NnQ2N3|C;YJ8~E=?|@)?E$$v8^i~D;z~pCaK<@6KEl{3RrJSV^wk^
zbii)C(m<rad^PfIyCH`{x6V)}(gxv0-+UbeT$3ewB8)Qlwcp=Uy8K!w^_PC%$0BGf
zpyhr>7?KF3W^w2ze{};ewiX|qe=cb)4=$?(p#iWm0JIfgR9JZlMEoQOfDr*^n6&C(
zV$39aGF1pRN4(P3o~<HJb3H5luBYT*xDKfSFGhD<#dM4h>mUlHT@NW>iuUD|RQ1A2
z=2ieC;%fZQb~fw{_$Gi|K<9C54-_Dx+za5_G}*GQU?Tu~8;IUtTWmj8N*}hfQi&hG
z-U-E0xhk%+Yhdv?W|FvW7Y#&U2C=$Gnw^r?cb1VE2?fpptjj21Gzo|#7CKPo+A3K$
z>w$x8rSNpd!G7=|`HzGuEBoyzJ))T&_{Xw&6j={Ut^jU6u4^xTm{|)|F%RtK*1BDZ
zy4F_hDhx*hnj+H}RRA%U=*Mvl400f0oT=}0WuWA1Vbp#w6%Y(!6dg2!pst>D9$1WQ
zkHP_HmRn3C_lV350`k}@`8FaL37F3!4xivoC8!&1wuQx`T^#^G0@baAOwUgg*S!3C
zufI?sJB$oHX-VY|hTe_NIoAqx+`sd+Ckd^V5kXG9*`E4a_4du}tPryC&wEx+FljCh
z{f%Vk&vI1hTpAo#=2CB!wV3*y1NeH5!5Rs1w9F%9K(J(V7A38rBS(+Ob#dqfQ_+dr
zbX_i9uw-gjB+ID#fX$COEV{!6E0mUywV^EzKhLpwDO5m>w&8pPy3siDhmr<|kS)hk
z*d}d^INDw+*uI85!m-;<d)UtO2@V?A&gIx{SdGrmb-51P(~`Dt-rFvOk|p3k8lFnm
z<?NQDng7~#o3?8nV-Uw=WLe5`j@`$Su}r#M7YkV*vD-DxS$PlII<njE7)1fbb`|Wu
z9wFlJh)w3dx?H!x7~QV>O4sE&vRC4h0we5?-`l^r4E$1K4`3O88ZpL;xBp|{0GXFM
zw6Oz*IRI|JHvZCeV0<hCqSJwS^dDVr*MaTW0m<UXF6_vm=*VgKf9Z03xsLp$6D$u>
z6!8d#3l72$><>K<e|0$)Coy3saYZKyLnq09b-6GnnFJ?vu9Ix3lU%KnJYAO?by75Q
z!p}J>Kd_G@rdrVHI<&L8p|ggqGfmUenXb!ec_uYufZAcsI&{0P(Ai+r*>K+3XxG_z
z*IBglwXx=FJ*gzD;Ym~5lV+!;Ft$@T&y$uHoHeOq%C#r0xw#HUlAHKmAu|}Br;H=f
z4ug1y+mKU^3CvENe|5RLS!vC1Qsd%D`(tb8>8U2mX(uTMcQb^C|EV*_(`U|4BZ;S;
zkf$f(Q<~?dpDdoVI=1#>0s1S>GzYm5YF*BjO2qBILJhvES8;jG<>GT=#!k^TLKAVW
z(<Rz=R&{8`Va??+-z$m2>DM_7w7ypjI<qe;W@9>Mo5`my9G@m?ipL$&+aZ}=skSi*
zNsC8W&~LMoHgl=pveH=o(dD?+PJuNul5=fyZs3L1M)P*Fa+~qj6yLNmx<>K2=1reU
zKAu~snZ9XecfHiLIQ4eksW<cSF8-Yp+aq?RrSLlsW{QQ~?hD@vT$>V_wmXz`iT50P
zpqWvr==QMG%_wdr($GHQ+pFsNv6|h}kB;5yr?0Q<IH^p(jV-m0F|$i&ac>EGcQ19E
zH`YNj!~JQkd;0^|pUmSOo$g(`?$3|isVpAd!X7<}9=(PheYPI`o*pm4JO&ax26H`L
zmU;})lgynSBcmRp^B!Zn9<Po)##uZkggqw}JzpDoPT6`+dwR}<dCt-ooN_(ilzP6c
z^?cXq`F_-Me%^Co*OT_)*mIG^Yf0E^S<!37&}-G!Yt7SZJ<Mw(!D}<u>tm_cR;|}|
zr`OJ?*Y3R6-mcfDW3PRdGoOXed{I2})$q*0{|CApiq%I<#7A7oN5aTQ(#}W9%SSrg
zN9KwTI?qS;j*ncOk9?Pp!kCZZf{)UkkMbWM6;@wW5nnYWUv(p2nueXPrkAf)xUcpV
zU!6Q(-8;T|b-wytz6N8yh6}z%dn->j(`+da_j(3nrPV09T^EsUMYrpMR?X>lT?E2Z
z%g<`zy3fCMUH!jy9oSq4O1JCGzk?GA|Il?AsaD}@&^VYmovy2Au&D(9rRz|BiF|2x
z-@(Bd{tDy%r$qul{1A(O>AE1qf9N{unjNd3MIFSaE1+K`KmwlZKeryfpY9jqCou;}
ztf$j;r0|Tjpcer#N;&wTRV&Ms$nWXlJR4!*h`1L}!yv!&b%+Q6oh8er&mgxuz#`_-
zTQbsp@M)J1H)85mVo_@}Jl(G2V@M=IE{Ct4Q(}<dgV@Zio7N%B8K6%cV7V_4bh|E_
z0VWyb=Ml7eB{oQpZr9b*?YiU^Kw3^7$#jpwKM(5Mm2FG6>mst9QCl5z5IxlDMXh8X
z3XD$I6;-a#>AGmGWYat8_?T7y@36mgU45EuS9WBOUqn#0U7lYeAk9iAwUJKOWu$te
z)2!;#yfacS)~6MiC*v2>@r1RK|IRx<<XLgp^pn8<rR$#B1zOPQx}a=NI$c+oYViWn
zUKl{9>&)+j8Y4G6_hHwK)(b?^tdJX*iNT5RFbk30$#B1BqaCGy&`5^Vf|;F`*mN46
z2ss;*ou3yN8I$Z^mVGKVAW<h=yKKXzC2fdq*P(Z@)a}<-VCI`a5%@5=T^F7Q+8A5i
z3}5|tC-m*!aztKesn%L-{l9h{*s^{zt}Mu|Wn=A5cI^13-5qEm-<HbZwz)|9WF0KP
zg?=4SiSf|gJs6E4LISyOF1`QdyN?Y|pj3UDUrh4Ju}vkEzwu$v<rl$img@!o&~;N+
z0u=C{!_i?+b#}q_5v^$-xz0rLT>Q*fwVyMS967h2!?R&E2h|P=w&3~vEcT=M&5*>!
z&9(2_{_t~Bv5{bl2xxk+^beR!`WK<u&pBQUg#FK=uU4`3sm>AWG;^)<&&I>SKhooa
z{PZk?>2}@qyf2`qL2`FL?}kVDr$y=hSXKPwL$~X&q6b!d>9Kt2I){<kd}*}{DR{nU
z^ZM*@7f?z#f^OGo-`&x@bw1l@OYXzo`4`dtGttJhC^b4=myzm9h5Yyqw!|~g>AI0{
zKS@+D{amOO8?%S@H;tAwa~BfZnN*9%DR!0M5S1wVJ7HdDzMp4}iZp^cpuYG8#svJh
z5O{7C4M@8evwFWW#%o|-o9$v`V${pMa~9?#^7ohvRoS)?>leH(#@@=lNWaL(7cW1*
z82{>G!kL^ai|J1n(+lemiRZE}qxO>?XJ5JXBl%W#%7-5+TI;l@A`B7^-&^T+9TAcU
zfaZ3^w$tr8A_94uWO+AR1p{u4O}}{YP<}mVo;B=CWwtXqT%Aga+)OY0beMk;ad!qx
zfbTBf%)XY6FfNO_@!aQs?7B6jG$p`yPUHX5b!7pP8DFb^q(}0d*Dm{!FqeX+q$myk
zY}pSs9t`(53^2y8)9E@FI$c+of}TrBK&RcL({+WHq~=oM`To*%*<*)j%J2IYJ~?9y
znNL%%9IoOqBuo1+Z6YK)@f(^7a;F^4yddE>K_xAz*#kk1%KL!}DTUu-J?_LNQdg~7
z!`=B{HhIw9E8i{}r50R)(djyxsbv^JCtl+FH!Jw=W%56E9X^sPF+ySEP$lR~_PHo^
zOu%2et}IH5@3;lca8e6&);!@=-l|H*mlwCT?%n;24MP02>&P3Pd|NFu2_Lk5{@Qiq
zkkXlC+d<l@apdT^KWi|!<>#EjH-0K2!cu>ZWK|m@?kTFT9IZ)gvf1(_uH=+_;iV5c
zNkt$1bc}rkuT1qU;Ct_vdzIaiA=0oW_^b3-iQdI8|EtS|9H1vFtZu1=Z5_x?QJkur
zYD2!s&D6L(J^$_L%Z#huf42B1Bv=p<i8pdqzYZu@T4;warG0#o!&;osl5_Ic*8V*`
zQZ)zviESF}gleI1@BVQ}b_F{@MqAMXQR8$gvOg!ZhdVW3cKp7@b)~Rh8e3D3PXDXR
z%?jSwap$vU#9j!=ow|aM-FyFGrk?Mk_;-;J74JVrC2I^dcP{^_So+>OahHEB^}#1i
zwK(sN4TX6QrD0{QUk6*Wjpsi7F+4i_vhjN0%}vTdar1?R+59LP?)VL45qDg2T9m{n
z_pdI8N@2Is5liKEixo@b4`~%k7rt~TmLZm<L#N}4W5u&%AGL~SE4Ceq=co?pNaSk1
zjg`pL-D;J{H=LZyH#%ID$T!%l@y*j+h)rhE7)P7fDEFaXOKQ!bGb{A>1|=$tjt^;v
zQia}Gy3$3iA0_g2ZEzo%WJ@*9TZ*0~clUGKOJ40m#x2D4b9>Miarw_KCRvCk2%Wc-
z$o06kc`uc<Ev+PKGA{7WC8LSJvRKq5M%lV49J9t;A>Fa_FTN!A=;5O+F{8cMavQ}k
zEe;u8d*-VU-m`pfEoDm0`L`(U%jImRG0VRB`X}_>AZ~~E$X3<1Ze4;`-Sug-dsrRP
zuK0BR(&ZZlk6-A?|3|Rf-?CC3%8;Yi7Vi{EYmBtLv3Ryo*{-BI*SfOy6o@cT>Gn&r
z&XK>>7c9@ab<IbyMYcswNp^MNgt_RgR$PuYjps;pP%OJc%xE3GVkHq9K~pvD%_UC`
zYpnaVmmBR7UR(FalCSo0Z-wuSjz}O3H73leX7Y9W$ma*g>}!_JD=!SbRy0~b&kxcG
zyChZFzCzB&6W-Z|T5qtY=B;I7gN~cz$7{g*gU794mZ7uzIRjG71kUI;3BQk@Quoj%
zR-zY{Yo8htm7~8)g%~GU$PBfX>#W^yzq6v(>EWZzo8J25$C}<!GRu(u<4F3(MM{_6
zcJ1{X7TMU)TzWjdeT;Lm_)`u{c6>iUpRUV^3L5ok^q6rZ#It_i$9`MMl}|9}Hk0VI
znK$_U=Ipr}M&lk%dt#k7U4~9y_&#h%jjPZXz<1m8uN&0O&08pLPtmkhYeHL|ZQe_l
zdwaGj1elw5Y-helF%!L3&)}5vDS<V9asT~N*7*xPf}bM?G(zsFsLgFL{ocA!74o@S
z8Vj~+rkFLd-fLv_sp0ITzWC<1%HnjC$@M)M#TrG?iMJsmxTEt8%do9Cn)g%p@S;v`
zH@aW2PejdOma|5%CQ9V{M7@stc0moW!;?4xd``Zuz||CUN}l1k{Cn;KSa02kVoYm@
z=`q1C&(2^8$#Wzwa*iXH7b1q-1E#Svh}|@J1QR^Fh*K=v6o@}qMl$V`a+|HN`goA+
zJ~ozS{hB~vWRuBv;<5S*>iJ6a!|GqCyc#pf`EC*Q>_ZuTA+*&b>gt6_vjyTwe(Q%O
zaZLoVcd>nFkuSLx6)T#Vt{Iv>-nqrhUy`<BE5p-BClYs(G5VP>joM&NCxd%DI!gmd
zh1c#@6!u=d)mm=fmckXQ@j!H(?8UvUZd=+%M)$S$NO7IuPS{kJIkI_Wd_h<Aj1X3I
z*CExY2AP*C1Qf-_+M<0vvtAjOltAdFnhD2p7)L~-xu2bolKXt!IYNVJc$~3>sWn@P
z&s*Gv(M0uHEZlU=S;jvI$e0JpNA{@*y^9?b7IEadJbsnycz@lgP1UX@Wd&-S1Z5#l
z=8t~t<u<$rb#D0#;_&m4!PjOAye$(@q%2F9$711E<Y?oE@yQT7w6sA<Jvk<*TU0l8
zRH+`2dF8zXyKvl~rARDWD%V;$m}$fQD8i|PFH43ac*rS}lq-+Ff&Mc1(Q)fphN6-r
zrKnVvm%z`}82aEL=3$^?_{XX{DVQc)u*vBQlW&V5T$+BPj4V@aGd~wi5VPCq+(+#1
z4^}0ZBM>#_jN5EyC0_`XW%T2S-EhmkDbe<Qu*6Nrs~0gKj-Q(rmYth7ts;0inllHa
z`G9%FXdW5(&P(6!>kHq0t%x*Ono3EZ&x$1Wu+8(OD^{px<WVFlKH=d+=+SKa2<Z7i
zbEbA3dH7DK1d<R0ZcuW+9s$82!qBIrOB~XCXv-_CAJEC%``B!)j0<%a`65+6)o0k?
zfz=nw%=qiPQ+>YliKGv{PB{z8F_pwA6lM(IZaU^9^nuzr<I)8qKIg@mUPLy|Sr~*y
zX5pD76s=B}3+64JOw8$FDni{f5)oUzt8|~GfWlZfyf|QX5|3ybJt2{XNh{ry5DK=n
zct{Xqw$kb5MDUyO4`C1qO=3csN~iQdktuA-kQPmB)BWE^f$;~){avw^dP9pTb!u-X
z{3F8b)s_(YXO~|0jFWg$8g#6J=sk1Wf$Ybh$?x}W8u`O<$ouT@SO|%u+mub%M-`q}
z;m?PUwK*?(UeFu`<iPI_NRE&D4-uwl0#<by{1Nxk^YFcof#Mmh_TBj^CHMKP;DMLV
z^`xR!B)hi5f3*KhV(7oWR1uKTBX<PI@ke*FjJ3Qltnp3@m87Q{exwT?)H7=Xz%pko
zrNUINT#u+(WbG=fP2;_m$KBM;D`^Q+^ulE8o1PL8E9*wPkn<wO#UX66y$G*}6p6zX
zR>|=mG_EWkNl(98=)~Apc0)rKD+C=k(=>1DGG6r=5U9!k>)gDT7r!aS6i^2CkMU-J
zCYP)DGxjFEei(WC&<C2mpW<wR1)srtv;V=HBI~YZr<#L5u?7ErS6U3_f-JMLt({Pu
zslQH-wn4BuAcdm|2Cjmo{y#Ja6IOy_TztoSP78F3amjdE7**W;rWbr&GZFSeU*yXl
zeDgdnE?Ka;<g3QM!RGWGPF3wL=B~96X-ic86$2w)EM^n&x1ZaWJ=<wc7JWR)BBz}y
zn%KWYcrcm~Np@nC(Tz|*C#U+~X&3xc2%WZXAV?I79?xJvN-kDct|`n&H^*E42<Q0l
zW8gVrp{vE%QYZ#9tCrKNMo5Z2#9nv??ETpblqRU+!QN81{x>N`Q>2^7Oa?6we~oA0
z^bKR8P{7aR3PlK0MRHNmqE@Si#-WLH!O-}0UjUH%)lV?v&PhG4w-WGa`va5Z_kH@P
zZpqdueRQ`$bg~J6MyKpR-=Jl&*!QR%kaR0h$1jD0k}PV#_a_*|I|PPZDl>*8ITX3D
z;k(g%cZ?|@Mg<&NF-1kli!blq;+s;JpOBEHzR**}9tkE&t?zM$J;D)QYOQ7XrT1v!
z=*OS;i~-BI)g>GRw-W|tQh?+#ii^?DBSwo|jbE}A60Y^^rLf#8VgxhBGP)*|$dufu
z`I-FH@Iw~C)gZ@&>m-h|P2Aq^ZdhNB&LPl*c>u=;F)94;OcA1Vlx9r%pz_N^mDPlo
zPSKci9=n#&-}_-Rrtzxf>U$(QV|VMDU`%TPc&i)7^#-RxxRzON%;kDr5h8q&U^_*+
z+vjUgOta=VAlX8&Dv@3fQ#>|1i;PM<*y5+(e_p}$Et)9w2m`p;?ql><3%EnUQu`>U
z4ihPKlBya`N)puM--|+Fp-g2~CrRocu+IK+v;UGUwcKEArFPEOw&I4dWU_N7Mlh!b
zU2w|A4GR}~Cujt*8LIGXUewNUb<$b>_%m6h1``OqKl+TouaF{lKxLv#f0SBt(()O{
zEaMJwCx3z!R{<N2%g%38tm-67n<{LDfTjUGS~^%%6JBr!cu%qK^TQs*+$vguOMan9
z5!ZiwY#PShFFa#v`!i*(D2abDP0*CbY09T*ZCOdJ??hj(+CKEeVN&#JvN!jNSuIUe
zl_`Zo2yZaeYtr}5q+rczvfTQLL~Kf>aZZ40VYg8V4qv~no40~0^3_?c)QkpRH)C)R
z!pR)j2~vPY8Y23iebbkc?J9dEg0RM+CbAqA#(b;yUUE0Y-ZWOJFu_%r3iRtY^_!QZ
z>!E;Qhv0;Ml81_5bhFt-G5m>Ny(dD%?BN@q4lvRcCSyNM?*BB2{*_$!6D%d<Wv>LG
zw{8|0r5wf05Swlfg&qvw^MLaOItTPPw-7eX&WNWGQyz8WG$_V?*)G3i7(-2rgSsVB
z9yl{>M8qt+wXBISzC@TND|Y~l6mW0~PLE8*J?Q<`<a0(3s#?S2P{M5^KuaAmgc#K<
zZ%;2eQj!IyMC~2Q>_?I>67HVwCn<fokHgUIx^BG%6C436wUf+_T#@uB;2>a)3uTMl
zczL3e_~E`9zfuz1%4Zc#y<P@u@AO8gfFv-d<85Jj*ChI6fy!1U_gGDg4F*t$SoP1Q
z<kddSCJfxKC+Ao4@YNDyW`DRs56h4VE1CKrWDCyY2d@FJ4S`uY08G?g5d}$uXc?&v
zekYZ3{%9=PAVtJMSb8v+PvPe4RG@%EieNO*t#9K5sl39CU4c&58IYWHrw}z%XF6Ti
zv~`-%<dI&ov4K330*>@6Iasz|q6~wOTy^{s2w$a2Xq-&FL<?f`JIlK1FGwbiG*q|G
zEIzB;mZ*Gm%kLk%F7!kPsFGW^TgwmRK6HwoS%L2`@E^Ml>)P+pa!FqP8s;>EtTXbj
zT_?s2C9|3tn)P~yJ-AK^bZ~fRPnP~pr|U*S?ckO~)J+TM;0VdD@mC6QZpYE#&BY7A
zQV}S5(^NHBfXaN=L1p)p!YM-n@R}jScSd|%3(E0%l#nIVkOLAj>MzP*-J?!^N(r+&
z=$$c7B~SHzDk~lkNi}k?_n&wj^(e`$S=?y6SYY#Qb^lu&7cNy7s}T>*{wQULIi*)&
zVvOXPe^dIX;cb;FG+7GAds67q!_(31MR*08iRJWPyY9-G3FIvaq-Af^3f!s-bUBIJ
z8oPV8ra&|WIPGZmk6j0td@x|pr_?kG6BWiH_SfG1vb}A<cK2Vq4o<%TAK3Zs%6ahg
zGKtEkZL?EAh7oJ1wnfU`d+kDx^=6{Vz8Cz^%h~jOAF#LcnV_+b@RZ_f{gdk^ec&Q1
z)Fm^l_zsDEac6(X!Z;^c>jcyYu6*ghM0@{S{D=q5hfNXvz*q?Qwar`h7ua=T4p)I<
zf!|Q3oI-{^HZI%wP)nV{0~KQL^AN?IEf;k_VA{(wNY*8jj(!vJ6wVZQ>0UXzQa$UZ
z2wB;e_K+UD(&L?n(;jKGdvYEA55gQ@#_XFA>xYyet`DW8G!&d`%8i>Ow2aD)9V*O}
zQka!fL@~2QXy7I6Eo0Lp-!Jt7j~jk3_HwI~+K+=+{_=I0)!j9hx9Ge_xSVB^N~H!^
z6__bD(+J7MRZZe@{_J$Hehy?}(7GO!R%O2P$-}@DEr~N?Cb1VpvQ()GCaR$k_A(=3
z_H??g;2i%xiY20^&#7kHP=V1@L1fkx**a~4$I?AVMLsoXFR4c@)LqT2oZ%X^TlVfU
zJuTV5P5?$fG~q>c%keEq7pe-RKhZoB#cIZ(ANdv$`sr<P?mI2$I1}7=Oj#4^?d{X3
z_c-bUKGV5`c7uCdGF64de+cAhE#IzBHd0P8`q5~7@YRT>jzKgTa~>FhHT3tRuo6vJ
znP`*WV0D#b6Lk#}<7hKFFeliA`~B67E!x!n0CQ2pB2dFzx#>jy!HG{_EzTWauSZ+9
zYgoZFY@SA2$sAZ^Ygi6M+r4hGc^+-m7>#Q*F;xdU7&n={igtJv?YPopYu)51@y+>n
zwEeb*wekfl+haoypdRB_t(2&QRdC}1D=bG-?2yh+X~HN(V<gBe3L|@H;tozSj>WpG
z_v$t^^B#hcP2Y42aPGIhx#l;!HEOy&r+XcmuD3Pa*karTwcLg^J<FRtSDL-PHlHci
zBq-CqyJ>6r<Trcxw)h~v2k^!OMgjb0zj>Bl@cN|b_T$@`^cc7N?|A)|z>6^f*;?MO
zVuJ6s_*H$!KW_1V9zz(232*-vE)nC!rVTsn_1}(hSC2U-8snG$O;-i%-}oJ`{^P9i
z)6frEkx?zt<=-#Bw1e2RqxFCIN@$1Dr8z<Ei@ZPls(wUAVJ_rryPeezdj2Ef$GL_2
z#`v5IOoKqZO$-xPD{EP@Bv)*bHAoK~%j5vm8%#=mj#JlZB|0Z1YnzbdTZx>lNfNEe
z>VI`PfwE*oE0Gli(o;xcZ93#A1IskUW=Hi9hhsA(NIBa?B@L6j>R5r*SoOZvoNAg*
zcDqi_hEDEAZ06nAtjDc6&s)i_VsoD!=58G3{m{`nYR!S^-sFA8iqXAhubX*WCyVpv
zb<t-zGS70$!Fj`nH`wBCg5wIbpWRB1E6)CTt({mjtW#_qm-j9%`?>CoMqTnY=;qnD
z>>qL0X}US;Kkp<yyI=jY>}g!tSDg}xHr5E;lG(V572P7^Ur7V4r0m0t<W`b%YqCje
zihQhk2Pw52oF?D;khhhnf0!f_8}s{V-QySd^5nm|9IU;bO}~M+y+Ks}iA?(wW&K9&
z_C{m<CX4nad;R9q?agQC_pQA}`*Pjo9l-9Tc$HrHQ2l3gUGA=aTUC48WBvB0wD$Jr
z`g+lq&kQA}B<aUz=yz<icYV5?QvMAdi`CW9PYTq9X(ZR*0>dzekB5_<S7E8nmzi6s
z#45n^(;fY144Q`96<zW>do3RO8Vsf%HK}*-4q}-j0Lj{ySsda8xQ@DI4C<f8zx)b-
z#bTQ+3~tks20t0RayQ`4zz)DVgW}^~@pevt^?SELdL6h?Wka?c43kRhOE8v611vs8
zh4&FB9~*QF9z7by>Y_S&eqS1vPta`zz#&Jounr|lEF&Okvb<N6Uc+}t(ke^VvTWt8
zAoe+Tvki742C<B-)YgpzrXwl`pnF2uXvMhwLt*#y`Bb&g=JCg{32mCu`Wb`XswAN)
z`lv%I>t<Y1IoNX+z^%~>SLha{8q7Y8SKkD|6o8)Aq`3hDSf3$x1XY#VwNu`a2|I+h
zVsud;*glafg8G5en0vLW@9CA#kGq!TjlTvOeLGEiyiN4D&LWBK{(kj^o(C3us%tHZ
z`0bW)hx!pdAHWUi(6R(^=K$d3KfAwwsUCHE(K^3sn+!)?>6!iW7;GxQ+BSZ#T+M+X
zpesb#T;7MxtA=ex6Vd5;Fj$zed4W8v2ihheJI*MHzt7Mn$}^k`cSQ!+6sZT#G{tcS
z+Lh|ZeLwigxoO8Lbi}QBi7VLYfpwAAzq*|BLpx!HhqMqEN^V*3|LSs=dBRSro+Pzg
z_{|gU@hqITs|{aYlEoez5`oz;lhE@-(Q*#Ou2oP2U=L$IlPE&Hh0=%@iw=1WzNU{w
zm}XAZnOj6-G`{d9)%nwhP<1s-HpKnS@|8AbS`q{=?maVk{r&s#?~76dvkh1Ex36Z@
z7XQ)Zgf1Pd?NClXtrNT)v->VgNfO@34@0#%c`z7U{nxF-jI_D_(zxbinKi;wiBUdp
zS%sCkYxLVH0?WbcgtmBYjIm^7XXRSPH21k(R(z03!Gmyn8t=)ytiH>(ZAi17QI?1o
z{8bzdIeO3%E2?W9Z<Kk-)fY5@u#O4Y0Jx(!MI>Qo!jLUh=-Oam$Mu&8Bxc;Z?5o4}
zS!!N1xxVPU%IYF4Z0~l>07pmR;LyD%rd0)99+pr|Im}{Nn(z1oLob&HJlN_G9nT3z
zUa=HQ6F)xU9KVg}yE=}$>eH8lKjOFOzkf6scx&m3`UX=Rb0-&Fmn+R8i|SeeryNX#
z<;I<Cr|sx7Y@H8FGOvW3l0NNC(v)_M{8fH0fLWie%V~zL=h~*$UUe*&D+;{Ho2U=D
z?OmF{^On8nqiU))o*nisw3$2o<eAQ6p7*;9f=nq+J%+sVcXjmD-^L`iS6$=CZjioh
ztMzeUKK|SMY3E6u)}^<!FzAbxchM|HeBP&=PxQ~E2;0qCs2-Na*5LQN>v;HO7YbK$
zk1zNwlAnFsz7b_OxnAgN;8wJD)AI`ddZGWFXVV42UHls*!RD_1r3rud1Meh>6mQ-N
zQz~9BBnP-|7G4eu5MveMXM)G*bqNeO)KOvEb)5?ZO<W)z*G0j;qT;M;ofmRXd>(gs
zce>@_mEZ2q<^$k+RkB;3g-%2dx}TG_AcH=&{SbNd>3MhayHMXD@bWhD_nSVQhrgBv
zY7)MyBDf^hGlUMtgAZ=)Oje0JGV=Opoh0O2rm`LyBIPJNHFG9k_}d$M&-s`+d)mp1
z&T$uoV<N*b!q4Z=%KZ63o4OHL8XKBV(}-KT^<3C}K$nb<UZ<+|!u`vcB$$kc9#wEO
z?sfNMc(#3Fxg+$wbRhRfRq@T_25YuAd=`1e0jfm7Ym$@)#*qh~5`hpdpkp8gavneo
zb|(Ozext&f94wiS3c$zO1pyl1Wc~_5ivope9PALvy+b&Q;X`u?Al+;DnACSRZaeb<
z(^tx@R7WgsCJ@FHCRIor3y!@{s1k5xbh6QVO*XxhB=+0tKF+a_C&#<5_-4gDm?Y5^
zrycGIIkzWq!)}^IhBjo2{PN+WnVBaQvFD1t9~0=`e8CiQ_0st%R^fM+S{5BkIlB`p
zA`c_-^uDm=dk9I=Vh(l8jX~EUvIHl2S>9M&wY7yh8z5AC?m>ijBIOJWm{b^45wdRO
z969(@<23JF{2`F{h(cdQ0A?l}fD<OsSqj0y!}kHn>|}DmNfmF1M$mbM5QqLQX;o%F
zH7V}9ZOa;s+J>wOU$hSRndEaE4HVosZ?{YY{Ats*^(8i%tgKdQTVEU#No~~HQrOV=
zfKi-{u)MRwRivK|di8Aedhs{Yc|&c;c#KFs@|7e)C5MoPp7KpMJQz?KLFHmgNH_2q
zW(p&V`BtX%uZL)AB#?zLBuoipQYprkAq>}jqB#Qq=2G=)H?9!RaWWk<u}m(p#rlyr
zYz{1p)o56RcM-7Q51;h;0(CQyZgR1o2}*aBYDQXrp~+n1a`MEc@gp})eOEJK)U!*N
z$1XRRPWR{Hjm=!@?6_+~I$7MGy176q%gzN)v3Sl~*|w6n_2U(*UC$9upV;KC-W(4(
z^CSI4X<Dl2&h-~^6=-fpo_?0(IjHp3hErnvtMYZh0X56FEQurH34e6@t*kG<wc3}6
z|3fvit-8-@@3Pn6JYfMp`kd>RB7rpjW`Vjtk#;sHOVkQqU>wSx#@%cg|H*g2fnoR*
z8f9M>`BNO`6ltgL@}q5PSjnU1ou`G%Y4;^)P1w-3=RqZJdu#BgxDSZ-FK{*OugBr8
z)3;q{KSlaFekWAx?8(1;w>ev<K2m!+oB~S(s1|VS;-q5OW#@Pz`Gsry6moEr_eWaL
z)rwi^{)o&-^y%iNQYNJwVrsS`UQT&4N#*EjrU-nR@sO`yO_QGJ#rq01j3;x6a?47@
zWHo$}5|pnzop<_>Q|58&<Ea7#6=}BqmkwQ-1(ziW2VOtb?C&6Mr7y2-k#vWB?>s4j
zon=nCR-@%tdHzOYYJlpn*;r`H_U(y#Yl@G5b`GqF<WxDa*>9=H-}+{un0?<wotaM6
zMeL>Nho-R2p6pX-j?Vm%1i66kh0EQ^63sz5;_Us|%F$MWR|HrBOT~G-9SSV2a?kH&
z(!9r_Ux@D%_Vqs<6caZ|BGnBKp4~dun-k*GYLE{KJ@Z=X&2WGgW2vWM8Q?cx&z+W*
zU$7^#Vly%hh#1eOo?~9_zh&lTzPB`Pz|YA~DlU&{J)6*P#@-c>Bg30dXH6{o)YG2~
z`oxIzBZvY3%qY^F>iE4O*uzG=kKvO=uQBsyTa9Q=<SQ$qxdHEZlT<oY*P|7*l<h~S
z>JHD({H5yRrnkM!SFakqQLN{#By?yey>+OFXeoXde@Tb-a!hyp|FC!8PffOMzvz>Y
zKp-IrAiagAbm;<$gd$ZsB1JF(q=R%pMH71ORY2-39fKkQ0)~#%P()Nvnur2Y1O)`L
z!hJu_yWV%!%$~hx)~uPm_xsEBA6(a**Kr=-?<YWQ?QliqCH;8P$xm;QuvIh9*2x#Q
zM$iY&uLjxZEMGG2`5MlBwH(WSOGw|t1*moA9qn86$!f=@i||u)tGujt%<ep_oRTQk
z0hPW(_}6R1@Kfq%5)@Se8e)bYnkvVfA=$Hx!Xen0hlh-3#`b+LpWJk#gf6mw4ta#V
zypul0_EqXN3)!<{#Yg&3Wf||2?}oZpdanJetN-2c4B}&RZ2Oug=-#7uIW!)d7cF+N
zky+-Dm^ar?cJe;o|Em7*;3oYQYGe1&m*pki_wP=AwG<s2MRw**KV%5H%`fKxeDzx_
z1R`&a`m^J?cJ%bR`ky(<gYXi>u|mn%;YZ4!oqqM>{ii2`PYY7dMFx+yrLP|YOerf*
zDeEa8bZ9@hfq-NBz;9lrJ)5GDP*}Bzcrg;JWeUzfO3sp?6!W16yFjkHKygcixFkeU
zbP(>6O6y6c9Vv!IyDj8u^4>M&tzP82pSsl+eS{{~B!9*Hs705q+)N}Us*2M8jHVyy
zqrV2FpM;-%LS(4hvLO1>--~2;>AM?_;H~$Ny}JzB*d&ya^+=}h7hhHeWzLTJicXlm
zlQX4B0Ns!N7WSz#<B>t&a>=P%=dmExwE!svvAF?M&*E63WyF4zOdXN#ixZfSNsWC}
zw+>ywMg=0NZXF?p>ek5s1LJ*Rf4<scq8OIvBhZ_xpG;Wk6BBO8UXuLA_{xLTbDPyq
zmVLy7-L8TC+ZsD^m63;9DsP5x5crrmLMiZNqh$GUIGM4f$Z~q7aYk)$#xWulQ+riC
z;yJ__RyrR@3(((46+@YcV~HyJK<2DPKGUm6?-DxM3Rv(0AKwW7>in7g1zxly+f`YA
z(``ok3f;Ru7@Hc<-8HK{0s;vQi5$!VtmbgW^shYWf)W#tqLa9i$b#HE0s=cpN^<Ln
zr`&b7`Df@}CW@Y-b*=rUXq{@OSUMH0Lo*%Y&eWn=a`pK6sAwIQ`v}MM0neP=b(V_O
z#rmJ3b<q<li`$~ZfR|LX?txeskrb9Hh&D;1(M~6-J`+6Fm9$8c?DQ`hWtL)kN;G}S
z!Bi>vlKjwo^_Q{#{*$q(L^pnlzwdO%-)dcaIBynJt-~^15@6E(TdiXwh(^qF`3vwI
z32?CqKod)4kn&9bsCClv;$Nt09e@RoQ<nDRQH?KA!u@FVN5A%$a<Wiz%~0~3RJv{P
zX5D{dr8DEfRvrl$<F(;&V}ZF;5X#rdKSf3BuxBn$@>>$XY$d#jnjDx({$zQT3zM=h
z1<vJbi6?czIW&5LaVRcESbXUzS~t)jdgG@jl=;Hazje7hqYLWEOvYOcKBDlIWT!|2
zaZRjfh5!>4t<%Bv#|xgKb(SOi)sv#oDSr4A6|H;QQF1YF>Ea&h<y6UoBOE7lrznN0
z)|ryk;!sMP8Gq|?XLMZU)lKR)GUs^}<EU!gd_65!JqA-!N+&14>wspWs&&yGqA5fC
zqCf?aM$zy<y$kYM7XnpO0~M~zF$4}E*`)d6OPMu0Ma>&M=jC;Vrml{iF`7Kn?vhFN
zZ#*C5af;S;-F6}pVABL~EETPrXJTgJPj`bP|AW?Hnj@)b9f|Wu!^8~BRIYHbsN0~E
zE+(4hUua$WQ2#1k?O5Y#L-f_RnU;ocElsknybtWmrZQ;&-k|EwnZ<@GE1Q*zx(TIL
zkPNX2LYz*g>R*4Ob<sg$#7*U?h2B{zTBm{j9B_qV#%f!3&9>qN$F(5q)vp)2u*N1v
zpEUz-?v@}GXjL81(BxuBv7Gi!C*$;6yT3pjGkZq;yEau>4r^~6HnX_n932aw@qkQ8
zuTJQPpw4~Z{p2zGEdoqWLwf=z_tRHLhxMkAmE$=p$GU6QkE$;0Xc!y8KKB9X6Y);n
zr5vhEs;ynPB6>$Lt6NlE?(LN01xQuABS%xZq_p&TdMP$r#UG?n?p8E{D@r9+;H-&N
ziFwnl6gKw^tIIc)EYdyAvOC#=f$Rf<e3zA~F4yl5PVyfGiBC_e=n-JF8EzE=Zdub_
zV{G05Y3}m9{k02c@U=GGr6NnemZmGhbcQ4-(-q^61mw3yN!10b{^{63C2!a}U*x-Q
z)4>+OIL=laT{lR%4C@+W5}QdvE(VF$b|QZX@ZoX%w7^W`&XxfXf6p~vvtS3N>p|CZ
zf@Do^s+{FBced(wWKIMGs3-IP3i#aE)pS&B__cG&!C!Kk0E2G_CMX5jT@TI42_4xC
zQdzO+??UwaT3RV#PB+26pt^N9Xw-GdLy~g}dr*GP{h^%utn9i<0uEHS&Sy%3t23l`
zlh@W<p*{T6t!t&abvO><ykEQE_1-)8M{@A6ec$olI#U<KJ|#;Mfk@+Eo+I?#ZqU`<
z#WU~)0>ruk`VN0_CSrq?aL<W_5>H?v;ZUuCJemSb4nzEo?~qCY{7N`huTJENHz&DY
zbR{Yp@|0WCBfN0&nxeI;j~fHXI+pH2sJeArPOhz%vXns`mH0viQ{g%Q3r326I_8Sk
z0-urq12c|2k;HHFR<w;Hu{VUL6w6`Uc`qfz;+KZqm64>4n25Y)%YWQDO<L4WE<Nqa
zsaw~KvpaR`NXeUT<Ho6O9WYyofkkhMKM`R5A&7-%m_HNGgR4oDwaL)vga-q$Ex}?`
zw{E3bd<Q4eUK*b?|In=E-go7+$xM0x01%9J?n6`gEHJGLm9YcNW9*a{a_F$xYe8va
znk`4@0g9slVm79H2gmlonsAKc;rE(6DtXk;#JpSF6^!#QSv1Dkh_?#ddjXnC#AdxY
zP)uoY@I1&4ILNtYgMGjWK&jYWB4sDNFRW0^8*$9bZ(%+wz#o5`?}ITFx5&SslFxpZ
zV;B(7ClH(8#oBc};&~^ttT>zaS6&&0vSUEmkA;%w$eW8e7K7Xtoj@LDTw#WwYZ*59
zeM{k=P}>F096A^H%KMz(d7Q*3?)AJPcP?8>izMi783_o>B(b&5Uy){oVeghS*pxMf
zPS>|E69KSUbiplKv2;&%QfD6D2g5&R^c^4aynu|EfQN4h{9W^B;x*{^JCUszWG0@8
zBK%&=mbtX$?vp4kTW{OPp`jIo(3D<k9OJ{&n8Q$aXE66Ya8(!I`a<k0JR-14w5yoo
z*TN&QkI#-f3zE9HQUUD2B`}4Y3}zsYPg9K%>gj>4WrlLY_!**~ZN(aAE)W1BegS!L
z<~secjJqqzW7k}gA|CrQ_NM?_D}YfZrqoNrGtI6=wt_oZ-(|C*Yl@KPienR07GEKR
z!KYuS=wyfex$J6(^|vK@-zy3taIUw!e3NfU;0~m^b&>mg@l?02*q`dwB`$Tu7`(Pq
zX4r}fh^vfR6L|H~?nO>1w=Wdceb1?nyW`tr+e=9Mw@|zF(40Hy3VLkOx!GG3_Ivvt
zxY9T)-Yx*0NPJoRVvohF=+S&tmJ>U%7&ctY{p=%Kvz@s0FiGH27mmBfzOn1Ym##al
zpa=hk>poo^7_saKyMHtKUUSvrU5drvIi0SeBc+&2cJZ@KRJRU)kmFkXCgRZ$PGL}^
zpH(4uFzS`Ke_-eHBb%m6Bkq$!4Ul1Z9)JP>fj?v&JsNci91)_sZ^p?po1+zw>in(E
ze*He#Nq(#sH}>L7j^ccUcMGsbgDf<61$OKiyMW?3zF_QSr>|y<o}29SpO8?qleYic
zt(#A|81{CPWvcxNe<l0dAwjEy`gc)R-rjEKSO^7O1-wsdCsM|_LFxAIdx6s}8Xp>Z
zr{fAQ2dK@&H3hU{#-H=*M$ditjCvfJ|8kqN{moo<0QdCEzdm%UU2bUioGxK%<CW6e
zDEM~#kuW>w`aGMC^qE41>o8+)jy@lUfqMRS>%dQdM`548vV3}VmOhc=^J`FY5@t!f
z!<2NqaPjdIAwJJ$&80V8Nc+%b`Y7uD{TCL_Ws?URkx*w{XJ`8kQS%31Zl6Th@p&2)
ztW+%i^{`px?k`vOPb+?(R_U$3UVOsxq3vsDsYuR6?Y8XIz2nuIliZBQPHhXB`6m+l
zK*mJ8_9m`|pmqCR$7&tlh7J3g$`huL$7>~m#@_54wjVA~6mkOW>0d?*u;B}*#x8GA
zKKZ^o*$AlVOd{14mEBpwdFbZw;}`foG;db%ZJqmkAM(&C6Swu^6t4ShAf^2SxS80+
z_C#ss`0<Vj#Z9Wnaex#kuP**epv6y=LHpFL`;v`go#pE?;@`Vh<aq6&;|;=Ddv%HE
zg|#piYTFgtU<T8Vg#_7_ccGtuSKLgyGK<^Bx#gd_b>jpt?R{XI;mw_@qN6dkeUso*
zw=N`cKd1EL@xpPD;7Q8$!=cY7W_w2mw|H|OsLT@#fL%o-0vN`1DORSWD+<o7dLJsg
z*mZxJAzJLo)}mHCo2<bRRIYp=jZVcE6(jc-WiU(9uJt~>{D0Bq?j0V{EBvj?eOJ(z
ztD5+We_I6Cnrf9tsD?Hf(*CW>(FX@uY<<#fK)#ONh*#P$&(QhU8V0*iKid+x_Mtr?
z=bZVA`+xX)Xp(Lh>wepnDwXxke}s9!eetZjlv!!~JYI?$Jp8#G=klq2t)kxiuR9=b
zDMJMx|J89&e;k|9p+l{9R-gBeqfkY6LfW}M5-uaz{3$63TDS5qwCsEt&cFB&p>}A7
z=&SMU{fguYZY;CP{Py)cw9`AWE?@nr4ZZXYgCD?z#lCFjpeC|tiI(o1ny1S%`dz9p
zXdsh5@Zgxf@usucFr^#G^*}PBPi}86r-*R!*Gq?c`Pyj%(mGoa4zVbKbM|p(AICbz
zi`VDQItX^Gre0_d35ar96tUt<R4o;meb@w;ymI+uUp7JAg=x7j>H$EWTloPrQ&?kK
zbUaCY2rH1vH^f2Dmd^f5xm+rLRUno5=X&f}4dG`4F8Mwk^sWV?Ex9g*pddLgXHw@g
z&9f(&0w&xV+D@(|!UXd;OqLhusvw9uTj7FSQCU`gJ}ftyabo&CMb#`MkU<D^#jU*D
zfg!T8G~bIk0R!WzUV7v|YT#Md^eMhZIk2l$NG$BkZ$`;B1dLhPem1~_Jxhh*>b;X5
z7D&h+OjY?`xgHb)_h)qsmWiByA{~2V#&p)k8uK08B%cjF`~E$zr}Ug>{m!W2?e<@-
zFV<cOJ}SHYI!LZGl6jbmDT<TzIOfV3JD=*Fj0e^phEGhD){)XWH+X(r_TlJ+3Vl3G
z+v@T$T}P5Yf4b|{pB~!TxBc#b2Mo(~7n~nbq6P*-P@QE{XP0JY-(Fr(VsNxxIV(~=
zPEXGm7%M#n51KMJNpc)9TH_d1GR&eL1Q>1^p{RIW#+k_LT2X!<Jf4mOfAo3H`0}Ic
zpFM@Q!Jm`veDbzYyAzwR-kEvH;oR;W4QGk0fu^vOGk2Df)e#512{qSVe#*X?9J(U4
ztri+Y4QlGBe%q%|^}5fQI7smFsb1H(pB~5B2vwl!b<nkx`6WnK>*b=D%c@kpPQ&!9
zapaG&wT7`#vYPe!bm;EH1*?`7>U8yZxWMGIHRt&@-yWux7>w4PZ;{Wtcsn9ZRq1UL
znZqxSrlww%>w=cQ!mQSeb^M-B;78a-V$qEuK&c=2+>6b~2ZwG@nN?Cd)WB3id>$|R
zET$9gk?PPlk7qdR_PA@|JUDVt`&%O#^=nS!{s|g*sf!7u=*IXk;%7gv=_>NqfmS4F
zydMB@gs30TKt5WRU~a6U)aF5vSG`KL@g$&?mv6jftzf=&ClIaNpq$X$joCSuicSm<
z6u(c2#F&y156jCKg>wylc!=uAIaVZqw-+#XNtd|x7ZENzj$GW#NXaRugh)wejpBV;
z3330l#2cgB${48D;jJ^qTe>uzt0_vAKz>~)@X~%rUvQ*W(DuD0jKUjzlf#Jg?DYlY
z@itUy*NIzrl}_|{Kh?&~Aid4mQCt}irNa=A+oLeZsGJ(_P<@3@Aq2=UPk7_mhz93{
zXej(5_q$dvLPjK0E@=`$i~1Rlribn2i`?~nADQu~pn;0Vgc13jbpaoAvfL)8+9_by
zyI!GAanIOTun^lJ=V=^{W1@Hv0#HRg4VE2pS|SZhpS$wPSK3}ID6otNvMNOB^&L;;
zTRxMDs?zuFOAK=$mPvYl6Ex~d%ov=)%GHTA^Z>5rP<1(uOK0`G#V33sOWZJ0;*WOU
z5VTKqx!!!Ct6hk)=s+{`I`KsFM<88=pqd*=oNOv6iyA~Azx{rm^_T~*X0CRXJyn<U
z+|zR|4JvlYud(MXvqH>b;%{%%+`Q(T=rp)j|NANr4q20(`GbYw{&9^He+`clrc)Su
zrB<$xPHo5|TWoz`&5^e={y%iNgb!2I!7pmP>pXA5KF$mVQ`<@F{;kWkZESe+F2r6a
z$3Ih_lRVGwHoGhx#p{R{yj297TQ#`TI#pL6^fZC0%X!>+HM>!Nhq`>X6@RB~S?X!%
zSi+~>>UYB8C@ssZAw!X_I~_teUGYb-$fNIfULS2deYoez%nJ=6fu)IrAZ$8CoT|&6
z+{Po}3!rn&R9%h=AMz}~O=h}y9Au*9c@`M&g!BMb0I?d9j?6V2Q1m<i>f!51(@zo>
zvTlgCJ6hym59#Bnl#S^{(`rU$b)>_W(Q%2+A%4Z2t8ULSir}|IUuzcI%j#!7O}r(3
zyLZs~$FqzV_jwQ@p~I_y=jK<toaJtY4o-!_1AgbZD3(Qx*m@1;TcBJOCsp1!z7;8=
zcoi@#+KiffdhXYJb@g1n%5YrtPU%?NvJT~9-bfNt;Nve|ZWopU$#;!?{eIm4Chf{a
z)~WkyK5S|hHd1C-{)4-cMeTckt~MfFhc5i1q^In=*5T$~34e+3t~ItjB6l|Ze4@qs
z#qsy883(K28WYuV%NQ^-jojL+6^$4fnMJoTAFk*9>+2n&+0$_yd#SwgYqp<lCw-$|
zRPg@XaC!Yvbvt{fEy-e2^Yg2Z7!h~#XfyL{Bh4E}kEt2R!YjLp`Q(-Q(XJuJNfUnV
z$v?k_I`;~FcX=+&vK8$=l5p61G!ZDAHIS$t%>;Y?!->7Y_j;k~QcCEIBiohdI+6%B
ze@FZKqv#8x-Tkw^Yexmc8aW}aI_G}gy2nEq;)(e^ajq~hIDl&@Xf)I;%D^(U8OXCV
zPbc#OsPV9^n`?R|vT(ly{4lYbYZKbrmCZq0^V)OC?EEPC>5agWiu_fkir<qN_IEnS
zYD?!2gC`3g?4IR!_(AhmwH^m9+WWm@98HyW*7_9Wf@KezkIcJMwXSdNX!Fv!ql6zP
z%We5|d!|-u9r{oANfK(?rWe8%)H*_X0#tvOUO#KopY}dg(utK;tyd1tAfdx3%#Xu7
z*xYaqdH?7BX5HqiSnJQu@2*#TYP)W@>x~pLz4Lj-myhyOgucWeRYdsrJhifRoKcb-
zeZ2wNi|zyRsP;IbzJ7g69Qn*~ry}fYC*>|pbC?Mo-fjEg#Me7x*MfATEHd}-$9K$s
zV`0`<@U#x|cdUt<EFy=FwSoBH3{+yVAAh$Wxa{INT_FS-2p4>YpJx|5D;jZe$3>Cj
z0h2O8*v<SqhE9hlBj}G@!bDzii_~$Wy$cAxw5oj}B)lfahn7Q7{an<FM#ROCdkAI8
z;XMrzQCj<fNTq9VjodS%7f?soXnG*rhZOC-8toHHa4AM0N)SQHF-(5QVC8UJ2;YU+
zsGw5o%pf24XTH~FVwm<Lbz&micN|XoW6Iee+gMa88RFi52K$b{;D^+irz>1VW|89_
zn2IdT(^_MLJ^G>6c-n1Kcp(RcHg_vlW<TnXIW__sOTLw$R2ks_jc!;?5MYg?^FwAg
zpV9q=>efTKU|~T}L3<+XH<or$ldgh<+{9Qm01{r$#GIs?w}d2|w?22HIqHL6GD{<U
zF9|v?15J;GJpj<Biw0MuLiNybb0lc~y!3!I@1ZD4h&{j_jUuIrS`%TkgrqOAsmSpp
z)tpquH@6FBAolZguT0@MB0L{UI~ESfk`dXKL72(FD^S5l);z-Qw7CFy-gtanS{exp
z&L?@(eM^<s&ro#Fa3_E_=jobJus^P_dO1Wzu~-_E!G#EG!h$C?(^GKiiM|XaFJVU&
z!Pbt#RK`yF93|sIRhHeGEc+^y`)?UFcMqy#H!)9F_qSu0T1@w9K3nryW-=~axdLJD
z&*iE|7bl3a`IZIG3NmPj2@}hWh_lA3Ak<nOdQcrZ)Tv_^L3Qj%oM<`3JX21RYz~+S
zqP|3@PM?y6VxZ~FiBv&R8M{}zw*l@pS6Ku%(cX}SM}p%)HyV(^&=eFCGI+rIYg+UP
zKKemgOb|ydtP>f`alf2XBl>;D@4qEG^{P|Jt_GEu^|xf_>kj62=Q$fEn@9K;W9OC=
z8i>z&A6q~JJZ0>zQW-m$f{V<uD+Cy@A61IuIY8Y7mw=tqQIrD;YO`1wgad!iW4%5R
zS3*RVtkO+_P93|mFHapiXTi(|#WLra6CoOLJ(X;^SlU8sxbZ|>oIeu1MCX`>%qK(G
zsxqjK9cRnq=s@Ja%lxCQoM}I#9$xZi9+FJM<xJf~@n?YAma%D}NHWmpSm|j~`a~jw
zM+~eYO|(V^QH<w0LBX=fMJM>bY(1<@zh|y8L2i2R{QideLo5p$XVlk6HRPfEKcIHZ
zP+4zShlqyxP(;waqyZ+<BQJZJgyh;s^W4n``{msr(8oWA`&S~;q4cRlWCp{NQ^St<
zU<p&EXb^rdAI;nl?PXo8fA|>G0JBf^CMr|lW*9m*6vQD0>>?xgW~azLHLb=pp2jTh
zF22SJ#4l9Fx(AT62f(NCw5swvJ@Jsf???+dP8SHh^*r5rDq|dm?tv-2Jvm<p2v3}+
z73oFR$UtE%$dcl^12VEyfYERenhJm)$#7+~<|A;7IP}944C7rH7;_798wJw=@cblI
zxnM%G01WmrFc%UOVi-!o(lQxZ<b~JtqPX-h!3SHFCmb-Q_u{=W&<Z>RcaG_<Dk?uj
z0dNkLY6{=Pg8M@&-TjikH7Bz!C2#E`cJxwo{8J8~rS9XEG!5`to$PcDq@OODwzKN-
zVB<hl`Ee{b6<v!f1}Aw?zz0~_!OCoE47m8WfXcn<6VeNZA*4$&xPdA@4xI@s29xH4
zPw?P4IfM@0+j}jT><Bgh@Sn(}2pZDyG1G!0z|J%BF6dN|Ea(Fg|4B*Rk_>#3ne%3R
zT1-At2TQz*e}a^)$;X4OYQU+X3|YlsFbkx?6j>pIK5j15LDA~@wpP^yo4kkUkQuvU
zA(b$O2$@#1Vwvy040=SV00~ac+$IB4dL7eh1nwEs5v)E@pGB0ix0N$9O$9SOcLSy|
z>!-2BrE$GU^PtjbD(UJ8Y#I`%A#5!P%iXhDwnUbRYi%@=cpY}oD9!=_3l<f)iCp)T
zou5ZGQFX1E_hNysUegGWzGGhMq>4&cv8H0dfxe-sc<>2^j`JG{bqVFFiZZ}MQY*lG
zT}TWE<m}5c0_(4Tw;**;46pDlCjfdJ5vKby6NKwxrJ>KV6M0^ogEE8b0Qe&C5TG3s
zE;a4;pf~SqiVvRN(!W|y^3h0wTm=`Tc<Z(Ly(SQ_2Sk7f<P#iUb)y>E9^t?yd7Oz`
z859ZelP$i=(02Q@jEnCxB7FPu#WL%ekyk=9eOoK-a2;0uuPRa*H!+C@7_RMkIs<&b
z_Qlr;wOM-!Pha6-C8<aQ0R86tW9yox**KExGdQm14SgFup}grT6O2Q&o<Wj$&z&+@
zzw=kN1ZOG{X1(*+8q;O4&;img|4DB136<$47q}>P$Hxs_xL@tT#q?SNWyk|#sg*<R
zKB-#iITx1}P}A$)_WHdZU3C@M(yQX6MN0lrPX!7B8i(9GLg5mh(GXx2&Geb<0oE8E
z?_t(KPMDKTwyTY_$D3@Q7MQPohy8fJR!!a{GYM>#NmDYASWA|7m)*J{%X78vcq_sh
zOPgl%+TjwZpsn!Q&YPd)*0zg-20-|v{{Scr8p@q2>>Y>O5-t}g`2vDBtRtV_7}BTe
zb;XEjELh}A?SV{8&R4o)&fyD%lNaq<K)7L)S&NWS-OxJHJ)d*iMr4bFGLkDZVpPx<
z@XFAz&4b~n_WBTVGpP4uUf?kf{0cp~>@_<0s>1gJmpxkH)(fQmQp!#n>uy2rkD=UT
z`n+^^+D!L6%5Y_}L8H-k<a5%)Eo*pfHW{`t^QAd%_8`s-Uw8mG)$5vyC57|ko-%i7
zB+7k!hHfZ+DN@MFs@7Uz-SR&6!+9~(bE;mK8oVvjS_^|elWbBfJd=-Y$u~7$+A6i*
z%J9M0xDmN46Cm@QA6<y_8L3@*YV`bm6QTEVIU<T!>s~u@e>_HyxL`&;oa%LR>=yKm
z-e9IGF%CDd<vOy=FzflfPbO-kC#IwPOnq4ivgMsnCNc5%Sjs71mn?@0u4CODE*PaR
zoX{^!cPq@2>Pu&AOpcee1|hbXASZ@&_3^ZEvsEb@3k@790zZ`9gcj4vSf8qdA8$PZ
zr6Hw8U*<_LiAXQWOJDe9L^tqkQTD6<0lwlS6**8UG8b0{DJknC&{yCky+0s}WKo;G
z`2$`2{L)`i^p>tkt6ar>@%t%Ak}50gSGGZ{2q2iJ$<dyLMc%OigO+1nl^<am@m`|y
z7Sdmnd6E4stl!Biu4M>mI@UkfuL1w9%SnvwNNw(%NB)#O|5M)Nr{e9O7gBzzJpFlb
z?5Eo1Pj%$3#`#?>lie$~scoRU`cHQa$99c2cTJFcX6OG~m;3*>F8B6-k1oe}VVS6f
zR0qpyGwBL9XtS7T%U)r<?%Z&N{br=B4yS8*gAVuY9$8)9JIf8a{13r$dIB-R&-8>+
zwB__ga-5&(pDT)#GZ3pNe`X-@v`5ZR>gDn?!}G7f@>ga1g`Z!QAJdjMQhew9+~~sR
zNO@zGujS8;FK+h8o2dO>er}>p0V|kl(1|pfY9X&EjMLNne^$EF`adS!{lnb7&vf?9
zxgMSK@?(zscJ7VJyp)f5UV)G7q8@c-<v$52xS3GU8eNFH_t>fKamMW9TXT;CwjbY`
zFA8{2?E1e-cc1=?bcbL3e}i<lKKPu9-Tfbu?iQy$EdBhjJoR~b^Xr$DKVPO7S2k8x
zR(`GgXX)<qe@k~pubMVKHV3SI8hQ0{^D`*|#&6u#yuCD#A#roGt>x!ea+zU~aeM3D
z+RSs$&!g?Hes9iqCs6oJI@%6?u1?n69P4QR^ZV80-v709=Xz#!J_0cKd_MAwm2xU8
z%0;<2k}Y_(<N*h$nd*mR>y@&c{q?^`y7SXPSU9+^<n@l|2}N3#ep|_Jc5iTr7H*{f
zS{Ty$e^<Jj{Fihmw!ku~bnLq;_Jli(h4C_L)u6{?q7P-7hOr&mcm?VKZ5)BA>6Ih#
z9}|U<)PHVmEofIP*bu70F%^wh1522n6|hc2sd+m;OS{}&sriP}!>xwt#kBt!Z75M&
zVUTcAkndBw<uI*P2YT@{JgI$PUV<pJ5CDGFCs-r-9J2Rs>2CR~@Hr9gH!Q}g--OHJ
z#U~ug85raJ|IOXCAO7?k*nV;;uaM)IOSA7kad*yk9{($M2lAWvo4ebka(9!b+}$vU
zw`Op%8Xg!hns+9DRM3^m-3`mXlS~~>G5sj1K|rmWoR?_BBQO7pyQ4%XjnI6v*nLao
z?x5|ORPIjwP3kFk$8%5n9hJM&YkK+*cb8T>@{~E#Sox`r7OZ^X{?F=5qmh#)=idxy
z!TM<S$_xaIV2ys<N$MTHgvMtD>c8Z!9qP%o&oV)u5HF=0Urf>FSL->6%!uQ<GbN7X
z5NO+qy*zT~d&(ub^MX>7##(hdhY!q34KBiOJsXfmwj{n#*M%y_W7MFPQR)dOveM|@
zIe-f8eor_Zo`EC0zEjHp#LTXdEK)4LHTH1H2@CDXdJWh>KBT$(5tGdd;sS$iy%j>W
zt3r#97o79}2JeKZQQe2TDQqWhGjN(l(EW7*%*Y`UN#WjO1VR=CO1N(-D+?C|t}Zze
zn{&l`berU@$8UE5a#%xq#HCceVH%6EP^)5P3?vr3>&D)iE{kR^H^nqIN8^_l>c3Ns
zy$|NaB_M5;UkBsT&f+Ctq<{SnwJw2Q5(5LKsfm<g4F9`T4b;ST5i0<NNwJRPa^Fhg
z6_f!VlbyIH($ry>*C20-r)e4eCApNHVm`($3rl=U;iT0F)=*v)<fa!5Bg%ryP&x_P
z%Bi%FN{9fA4quy^c+^hfe-&7MdGQx@T1AAsC|`j1&B&ayl;??x*HImP8-2T+2II1J
z^Lac6NJ@EAATc}!vnwn6a94=u&D~P*vm%tlFe~HGh1DzXkJ7FvdX@1$XUNMw`z|3^
zS*#Fjaf^pyDRF09i2aS0tJF<^g36o*f7Ggj+@YDS9HfNZ17NDEt#9Ccvi+C8UpPJ%
zgW6}cz`#891nGCQHajQy_wl{Fq9OWBk715?r}~MQD&2jvHT>6!a&_DCI*g<kSHEhx
z`pMLbVgxIO3|<^R8lPMRCfKU9N6a!XC#l7nIRZSU&hMF7SwF5pfjXz)ozxb5D?@bB
z8XCdBl0v}-_y8v8F4|Zz8C*kJl%|_rbQ7q%9;L;)E680A@{1l5aVkC`i8DUdi=Z56
zJ+ZGTQ}5WWpjlC5!HP~%bgbm=P^c`P;*y8O@ps$Y!zQU?7>YqSGr_42iv*=r;V-{T
zEkrEaINcxw7N#Y$0jeW%YD>6Y>7?{XD`v*+#hlahC7rluUHu^E0_}nh*8-onzJsjk
z&`e33-X#I==S#tMpo;f>xB;b6a$4w;0OpyF-$8v1w0TC8>2diFul-<RP@F+wyk6gq
zq`RomC7Lfa&i@VNt0A56Ot%2{+%+{D^VcK9xi?OCKxq~p<BA<@Uq}s_<-ojs13N<V
z5Q)du*Sy#8(`T+wDUZ8P)O+-nGIvrNAg5Scfr2ew0Za$-g+9BO8n8foC1C0S`tqlU
zrcVlbNPgDTq`@D`vqpJnxW}0-K{xHpBh8Z;E0M*I`*N$KIKh)u@5GHHF7?}yy5;R?
zeec?>FzkTsH?#(FRilpP+mZ>YDLnhj`%(t}ogC&zCEN+CI+=|TS_}A_&X9>Q<B?>o
z^Hz`=aCN0*d<{y0B*5YJ#f^(cAkcD8ch-eFoM%6`FKS{MA63%-g7sj4tYoMh9T{Gq
zbQN>oTNkb6t6d0!LVnwKD)}UQ(fD1KPT*j^49cx>dieg8(<gsi0#6czHn!7{)-<Q}
z&JWoq+?ajSsFEM(3ijQIS&H~VCoBrYz|7JBC{<D;K+#tOW@l;F9tTN@CPtXaOd4K`
z@c;d;n7u%Qzn>xqgdp|5XEr)HmSvEu=~b_|Rd?w;_lyvzwU)4hf#0=0p;p3ZN1z+A
z5GlrR+ph)NLZq@}L!{5sM{1j&bpCwD>GumUY$vrLD(7~JwYf)EQmOYL30e%AWjx*_
zwmm^SuZ0lejg*V2^xOAexFC#rzR^cvzTpDR-9-*4$)=2V8(lt3^tGn)IFQ~3{)IIC
z<2~Ppm0hhVn^X8N+MlkgJhsUl?D^Zu<CI@Oot#>EpgjLeizme~{`$q&Ze`y+yM^YB
z?Ow1Z3<$*&SMTmw669<PnzPR-b+G<1rU~)tW-w-mOg<*~W4~<L6Y#~X!hyd-b6{)p
zn}Za-<gIWXum<A`M*;C;4f@;S-{8tUP_?_r)|8M%xUHJi6hhD>e0Br9V=4)jeMme0
zkb!_)Tne)L^$?;#9lPQkGPD71s6zn3Jmbu+E0g3T0<@3k<#>RGvU!+_g8jieTTtC%
zNR?K&K%lyc+3h(Yk%xUOG;HBYAtGc&w63rAzYIO{siDUOMvE-5<dJEDmcY_(EIV80
zFK|TZl->Y2LN<J9?|`-aGNbUITjo^hZsv?76fK2Dc3wjZV_+`@(cP@kKKs!|4G<}r
zm;g~4!#(sJ8HR<k_72dP2m3J^elZAtI=ppkbmf_FYjk8tY~oBTh9ZFMLdB&k$8}*X
zl0)KhbK@R0#}&-PJ>HKi=7=v<jxV>4f1=FsZHvG;j^yNE;;cjxITGkP<C9nuh#~RK
zdIHs^7-MW4CllDf1=U6NrpL)_vs=*!5)88~nEkv#rHL&ZNk7JsF>(wZFJiem1)<y5
z8E}a-X^6a3*Ym0LxNd`C4yJk0<mJlviJ9c@e(vYVutOOJW#OyV9N;1r=zKI4yktC;
z^ydF1>7mM!P9;5=(6cmXw(^vI5mY-#gwa2dM%HzT-A;n+Z5)ogF%g7{yK%S$vL!mv
z5z@W|gZ1cO=ZPUyN$;3N>W6a1Cnn60u!#_bO6mCqmb^6{d!}ys?C#i<FuKoMY4<7t
z16pGS30P@XEM;t5yO2V5rzNDxy`?=U(^uF69YkpDMaz(u<uZMxJp$6!cO=z(X{Tmr
z<efFd^{I|thW|f~-ZL4YGJW}FxVnP;1{fQYiKx}g{2HkJVdh_q-ov*!-B!0_6tvjH
zPyxRrMs_4%S{mz%xf{C@(>wfsbn{#f<YK>o6VUcAuh1lr)hp$4>N$DGQ)w0_)OS;J
z9_-mD1k!aa!3B!-8<vsxpV{hECHYU#GIr%oPoQrJUGgfI3RTKGG0o$s@;?Zcqyl<_
zRrz^a5^Rl<C7gw2c{&t|AGkG??yEM<mpuH_md7LGNGUvsP;51(Aa}m_jws6N&OE(D
zv6Pf)k?91|{yjSS;Hnuj;{l7D_&b<TM$w;dNP=A8+O@3p33X={(7+erT@0wNsray^
zuz3;rNvs64Em<oksY`}QVKwYj(k}Epmj1xgPS#LBNeWQ`y;SK#QYaPBW3kbEGXZ-T
zE)W7qjJhUzP$tFU@1$xV)<_n#7b`Wl&^!0ixlc)}EVT^qtn78Vgn%uIL%$TX4Sm?9
z4;B%T+LAv1=*gg8f<==9r(VJd`z`u3g1a!vmrHrCI~nX(!7e}`S3beV^9a!t5^O7R
zdM0&l|4F(_<*K?ZhaOvYZWf7c>Cyz#MgU6nWg2e@pV1oUMB9o~J*no;^gwuWXpN!K
zc34Cd7(Irn7D%OA*{WJebp>kDuVB#?hc%l(^omSvk8N$=-P(aiwS%g)nezxVLoN9c
zUsr4Glx^L#YVB9^>hadPMZdaFhjo3A=yH4NmJfMTur(`Nu<wVk?pDT+fcj5|@U_GG
zZt;2rtNQ&%yj`}pHONo9TOm&wp7uPVAN)Xj91j8;)`psf9(*8<H#`-<*8UJD_8iJh
z8Gz~SYN>|ahwntbAs&=r?I!^7i467mx1onJbe%sn^dv9V{$uE^QT`L6*Bjr^UtP2D
zt3f-TN5HU_is)VTMEFw?Jrq?Et3Ho~TKs{Fnm%<cW{`bPlSyP0CPIm%njVJ6ep|gT
z>qfU%+&E9fo=dGavC$t4Tfsu@$kqNAA6O;4==NynZWS!T);fFECge3m8uE01XzD#|
z>K51SHh39YQypXo>h`#DFaLSM--e!3ena=)hTbik=F%Z<UBlY=p+=^QFN5yA_{Y#Y
z|C3%pp;iL@l4|I!Qw=@SXWd-QD?~|vd~4S$?!PY9j!_LgDhkjF4T6dGE7nHP(z?pj
z-UIl!{%z=KY(3{R)GWE!HczqRM*R^TH?6a(Y3a4?==;w2or>t;J6=)|y;R~S?v7vg
zxV!E$YU|Rh+<S4RrdqrImC(=j-*%*WKk!G`(~Uo`dl+CxZX}c>w>s6)BUfV@5j9+(
z=ijT>wyM^OYyN}LW4S8KRM1u5pq2BzCcCu?lrB-kPzp+y7A`O<t?p87>%KJGefg*x
z!_%XAsYm-pkIwxby@DQtww|lAJ;p~praZmomwGL4^jh8TwJzwjZR@=;+v{-D%Ra7_
zqum)Ef>wccQyINS2Hi2hYS3a;gj}DjW#5T!AJxr^Ug!gY`iZU?0qZrv!&TT>o-U84
z0$!ad71bchvrgbnbpuz!&NU7JNpur~7S+*<_QJ&uOUCn{6D4m)%Dw@bzljKcLv{4>
z+uAvg-bBEkRSl5_x!#l<4H64#pGk5|+730rsRAQUOYKnK-J#~IL!=wE)U3|y8^f$a
zL+xHXrlrH3!^7S1k@1559{5QA>~OcnNG}(-^CAayc%<k1NHo*vBE05v?MSy@{Z}tU
z-1umBJjd4h==b|PR4C6*rZKXF7AP@#;Kgw?J4(4R*6TOcTQKqvN2Ze+8Mr?(m`Da2
zwIUdYQFH7JM&s~8GE34plMxTQ{SfO2J3r$D=LVIz8xoisr`BN>0bu^H5w_Vrra$mm
z3eRNvrAfuY3Gpy)Df5@4|BUF(PqrSxF;Y|DBlat5>3a4<2E0>R?US8;;Y>006j+z*
zA9k6LsTW=Y_H*nv=f)@!(^gU(m&&RFCZ>JV&OJ4l1i`v)+rJAAdlyppF0}4#K;63s
z$M5jGGq*?HZ5g}^51SFLrS%|BxqGunCeEbtY6_s<PPanzx!>m&zJF9Gps@wj*qV69
z0JGbIer$UGB<w@%-20;Ax>BPLm0>fVCTCP}#ej4wg*-;CtvQdGc~f0OpZJl)JG*sX
z0&D+1PI7jja8`Xz&85B8bN}Pu2x$yM|LgAgXJIS{&p(Va4v(4Yy`&`7Mx6osx6dux
zf0{akzg7G6>eBm_xlcdrYgc*wz9-ct9etvFoO8TCry#49<MkPSb#8@7mpM{feYfl+
zY<^{K?x_L&=i^sRt&qi}dFJ|AhQ~FG2pE!Yf#sxbf3D$hj@j_-Jhx9BTieGT@#Ha?
z&q5uGKfOBj>Zaz(79}q)si?j8XIwguUQ&2mJG28zJYF~_tJT)NG#LMR7zA6WThi`W
zo~Zj63h2@rT{f2{P8Pm3z5HeBt^^-qSuD-mG2zP~Lk{kvnjm7uh41N0xfOEQir0fW
znfev)<l4|DV>jxVrAn7wrQhA;`+DD}?tIeMFuv8-7i;l8E9Q1zr6_(A;T@}qpH`Dk
zRvT_i#9n5OM|{hE@GbZ8H--91>M0?s{u{USDWdoJ5#)(9L(d@W2^G;R9;PCCAa436
z4s;+1hDN^Ce<6B+@7U3Ag&j;qKh{qEG4wFsKmB9qVQRB6Kqdg-8K%L-cdeId=wY6I
z{>RWm6RC#YtQXB&hq`ytqyN*;!>nILtam<U>XzQz_}kEHmnJf9t@nyEOc^(<CD+y&
zH^`uVY^na3q8fVmjUn5uS;_5FL$7#kzvElF!zQ2KCa1}#Q$x?U_SDcTUjLV&XIe|~
zsRcd!(L?zTe>b{8Mf6;-w3XzY74&xZKZsuH_v4eFX)?9{AbP!zwt5(LFWp99ifZBK
zsS61k{~&t3{~&s%wNymU1^>PK`xfeH?PV&WhyAsJXDF9uxXMrO;=8qyx@(C18H5I|
z8`n||JyFUwxA7*=Z6?0+`)@Y3G|>(J)6gUD|6}O&9PR+sw|WL?H<Q=tZh`?M00IDT
zA<^;T0WdO<_dg6hOl>#-aD{5<k$(MS=y81h!EpQ3(A&OTOEvT?|83~Kr5bu$2a+<i
zM&u)^p~q1K%>E2Wqx>7us~w|z6MtAec34kE^f0ym1<~88?<D?dPub3<B6_9=+yK-H
z_)(1#sUH(b&noRaLtfB|WfCziw{F12qD~ZimS@J7bW;VcBn#V2EbC{AU8{F~Kk>yd
zSN7Iuxy|ItNIHkqkLCB1UrmZpLO@hjYA?VDbSqB+gh^E~qcMhi;e|>>0fvxIAX3*2
z8Gz=n4G61+mUGVbRS3b;=w=hHoIwYsYM{>pf`*NJO{I7s^fWjOrkS9j954#V#X<iD
z_uxN*NJ9lkKw5MB%t~Tc_-$-2^O@XUT0Fu>O4f2{TIvQjg4Q^fq6!2=Hv+7F?!jhw
z<iH$FdEI1z5(r!)>%8kH9#Nfw@xM$e9Oe##*5ALl{q=!)MZnfVZ%lt8M+u0jpBvso
z!dG95w0`ku2t?A&mV_l1i4uv;nk^^~5MapK*Q5cyH3R^3Lb;(e=ZBdV0YA_9*NO&6
z7Gq?eL%&xu08GV_L<2ZP@lkfD!?REKRec*G5OMN8#WOB7BZP%&KL!m5XYF}0PL^;S
zemh=aXCS_K%}4)ie&CM2Xj!KJV1XuP$3XJAf-7kOB`#6YO6#bB|6M<5a223r8W0ho
zWNlJHVP^0x_BO744h>KM;=>g$?&}nHGItddd^uvryC`(D)rQ%<v=f^OKX;dxYFKD7
zbwjLsTvR$w^#xFxuz03Yhag<(Egm5EHp4{m_zbSz)RkuyZ2h8f&uS&J-2b}6y}iBb
z*ogKY7jGme2A``H)Yl7#g4M7}@4?lB!w16vKwe}d0Nop@q-Q*83vuiO@Y7cI6?g;O
z97`}vf;BXNaCd05_6W{0HqZ<*MC+M#>-$wglY4bMfh%gjF4ET;gVq2jUn{;kY0qB5
z@|YL)BJ%9aymj)$Xuaz=Ew)hSbVH@Qi;ikmp|=9c4WQaoG*6`K6wS+hvX#kp#S7A9
zkY*Ph@DG~D5dI%%9^n+tqd0T0RK`|)X@>z~=)TVb44bNGt_5JJYTghn^&NV(@*iqm
z$Eljv^k3AxAtKjE0bS(Jj{;RyF0~z0G>>%a1KMSKjo7cGn?@X_qIpSlU7n8FhU#p~
z85Y;Wf~M`%Rc=i>y$mAhGd)W6grK?;*I2~8@N2hA7C&Ik9#FkJQ^ipH8qh=cEU13&
zmFnF{wq>Qa5FlorrZbviQT*uGJJAy;gIAS>H!EQ*4B6&wK|_*+$7}Sh3c4u6SN^M^
z-)jgR0C~$~P^Im7c}H6NMxGE)C^v>xdoKyPdnK4<iuwDEI~s5o(+KWF1Z7=xzf&*{
z3(#DBkMYrXNw}}Y_Uk$HylE`Txtvj;GuPxwwVztdeY7vij}``5g!6p5;wk3Ui((Q?
zU{;NchAv!*;`8s01b4^fKgR&Wp_-Da{oy>zj_mFGSETRCBsf`)UT|a)l(W@lOT!X;
zCT0pC_E^Q+<x3__P@Plh?%r}1$J)MbeDPuw-V2I=lYv)I%%W+jC4#&MsTX(5(lg4P
zMQ$(l>$;d{<S#p)OF5%&7;T<eCVWd*=9|9d6Z5PZXAx1u0|V>6iG&L0FC2ecd1y5d
z)yng?x#*-%%DKJthK^(<2~$AF(a6$Bb7GnbPpv%C<b`<3DV9gN`Jb>nEd?!>`_|$R
z=i=xW>$wuQ4va(ko;x=>pM#EI0bl@HrbH7D1fWWsq%c65TrTZ1SlP%+SU_<rD-D7?
zKu}l!95iA~lw|NgQOtQVHwNhAlx(;B9FV;jLDTAja7dhrbr|{zthF*pZn1bQ|ChT_
ziMC1Z15+lNnXi}~TGM2e-FOBKfF@lyd|Pq1gt5xz${l~uhKRZEzE_mIU<rGO4S=&#
zMoZ!<LyZz2_AeUx7)AyxUS*}xTJD9r-Q1zow|UFDrK)Hg8yU~yC6v$Nh7lHY<8+QC
z0U2XS(sw>s5RP^QKB9m$Y$O0>$yos8vQGjDqD!A*u|Sye4H-G24SjAWJcD(BUbvXG
zgin@+(H8^O8%QV}tc_EO#ejwJ0!-TIIx3duK*jPP*4SDQXB|Na8x1M1;L4&}c?L67
zD-U0so!0BhwKegiPZyLQhJV6#YUN=sD`q_Yuv;MtfMXSZuy_VtSOY{qqM-wYOy0QN
zYt_7R{q-NCxEmWVJ_fhjK$f|WTL3g51`^Ru2O#AmKGr?FEPR`eLnckz7YmT#0Di<o
z|3RqYgSIt+08<i(7DJc}>E%I)0#ePXds#BdZC)7w9SGLR28%7H35k!~<s_C0E`dSH
zq}VkH;T2g*GXSahEs@i=ewP&hoP=xw*kmU7T(6_=4OPb7X-S0zY*uF6BOR>D18DBg
z-;ns_Mq8SWbCARUM5HlW;AeowlXq78Uv3v2AGuP#=c&-RXjMy^VY#h6^f;}#A=Lu$
zG|IUZC|YqX4jI6uC?`dBX+uR?+ZZHZo+^ps?}28U?6w4YL4J7PjT@!}84Tduejocx
zGz~8|fQG}j9^^T@<Q;iO%%~G^KGGZU&4Bd{jWy~s?R+k+mk<v*LW37-dnRV5OUVK_
zj(AZ}u>}e)gvy$kk95*;Cd}Ux+&Ty1Si)}!0vy0^dm8u)Q%!5E$=4Tu79AgNHqqYw
zOwo8lN@B-Gc&r=M(%^>yGAQRtZCf-_`f4Pvc~#;wybrsN9X_9ghqGrDuZW5xuD3g0
z@8_CM)xl%D=9)^yok5rQ2BI!RyIM}U0-(A6)-$*GD^+~~O@x#eXw>|;^Swcq!r89j
z?G10@%a;fhQEmAlECalUc|r=qIxl4(j>u(yeGzb<HJtMzvQ6)pHss?RpCO^<_}rD|
z9jC+%JhnhtoK5r@Mi2+k7n<gY57T4gB4HumrLHnRJoUWk*mP+gND!-LG8x5Z=0K+v
zYjT>fK9+>xwti8@+ibMt+9z<#PWnSJP2+CbN*xeQ#dY?5@I2n|Pt9^h0EP7Z_1?zk
z`vBkt#GEE=qCgZ>ur2q?Us(%vbqXp99B-97GflkC0PfrTSi=4J*iH#E=nMP9=BJY)
zv~c;&g8e295inM>0RIhnJb|FsEh*W#$S-->gjN}&=oOF}XV>u406wgT^nTOE{=6wF
z4Pxk?4_sqD!>kr*oxgjR!B7-HZcgx%k9n8S{vM`S5uStC=WT8##-vLd(bGLVP%<PY
zdRK;Tsh%THjn1}&O<6h?8m@8r^C7V4Hx1wz=E%RGbn?)bk<9pMZuPCz%UhnB=L$q5
z%rv*>AwVo1zW)e>xv=NN6%$Yd9FqC=UhFOGahnaEPPrg*h8Adzr!3~m$u|=rsrWbB
z@vvI?5jlK?1Rmr|wPEqFd75xJF#v`H^aVgo!Opn_v|E*GOwd(7Jfm+F`Cj4>Gt_9S
zVki9Z-%uW2n1>aBZy(N8`@*dXLyOwrt7!l#%JMYfgLoJQf1!%=?ehfxI6R`VG}{S^
zxdHg2uK>prEY@G&I0Ufm^TO~iBfHsRJV0;P0Py+OirfhtnVQ?!u5-gW-d?=h&--G1
zqoKJx;mm~aSOAd(Fhk)PiIJtMctH*TP&ucN;e6zGya+eIMnBd!7vOgZ@JdEQEP-jP
zvyx^;M1G$bKAcJ;1HfrAxYM6EDNot5#oq~3rPwqpgg+AM$miK6;6Z3!*IWS2Y9$@^
z@;g}XjD)h88-JoXUjKcx?<D}7Lv&~h=%)?XCpN{k@eg;4f&ovW@O%ub%x@Yp6Aj8?
z$^h`i_OG%zgl2`y%9p~y;-^YprN(V9gx9Q2{klQgx4zoQ*i$7hRU>jH+DgXo@qV-&
zDoXK{3=fAe0ZL~>Y_+o%7;k8es*Gj?S9MSWziv_PwNM-DbHe7(MxOde-)O6S!|`ny
zChK@_B3J_z#Xujehl(sQi1l#0`m>S-jwLq248P16JiTNzRnANl9zjm1Ps16Up+-dk
z2s(77R_I8v%*Yf~x?4|v+cQF$sS2;6F)ps8<qb@xN_k>}#zo|jPxp;i3z9!O8-K4g
zUYn)=nrOT+JDQt2x<-}m;3k9t;~!M%?ou38%CknDN_W4Vp{G!uvdLksNrCApl=pkq
z<ODu;2};l<ngDspIk96>t0rJ0(|I^(PuP?$%rqmFE|F{ksWXMmb?n1|p?FiohG|Od
z7<))Gj4Is~*08&oB8|+Dy<_afWacn4jxXi#LKD_HGiVmw(Z7|v{|D0D+=KvC$s<9z
zUYN-Sk>S12|03O82(wU5vQR0sP_47L*#4iSyJHIsqoqcag*AtTR*>nxm^?R2-7rhN
zBuo85OM^N~1AAa1254Akd6lZ<%~+Z;UNhspW-fKjLh73Q@svf-l(7imTG%z~q-!==
zZ!MGFS`}Wq@xoFOO4i!Ab~7p+J`z!gB~z8Wr#<5+H?yK#vwCf-TO0H)$Jg8otwQ5z
z6QSYpXe%c*BUjex!q{n-TV}UkKz;wR3Q)Ul{%jgWvWg>HeYy`$<aif{wsKH23Sk6>
zdS6ehydJo5{b8YSsPZ@(H6G*p?vv&9;J5D_zZg-!84<_VW0R~eG0ae$MXaN-WTBbq
zuZhttjN`E(Gjq!`@yFJQWa~IJo6NW9P(72BYq9=O#_?f<J+D|!MVn8F@AINeWL~__
z+^{J!;&lx&BZRzPh1(Wpnfy@r5QY9w<ZWBQ$oZEd9TmIt3$l?>9P@c$TOMXxzwrSp
z`=M%X^j_Ax^APeOk6omw-Ge>bCT}~jmg|m;7Jr6KgCXyKmfI1Cb}#3sDX-*v_SSS)
zW>_FMfUL9W8+JWLvm3Evn(gDABQtb=SsyIh^irj}AX}a=0%Bx#h$`Ln&YqbgkNvlF
z_rFWJb5cKX!XTVA_?$JRowY7IYa2UXad6i0an^m{te5Pp|Jd1}-r2Cj`Rb^%(I;o)
zAI>Hx&ZdZ4W_-8)2YYuJ71iG`{GJ$K$eBU98w8{~B&Ac7Mmhxqr9q^-TR^%&N*YAE
zB}D;2N$EyPV4gkT|GKXGxzBpeIcq)Zyg29VH#0Bxn^|jS?fKRBGqwAd$b0;3%@`o^
zX2K9eUfP--K;+GUb*wCntP=hq@<MpHP#B&55_x+6LF5@_S?zdW=m`YyRHGZ;5qTPx
z0Fh@35P3~j>`2yjYU>*$ApJWcZyfxW$UFFD`p{Cp66CtKo?&8*Ao9Q)0FmcjWchC*
zuj!ZfsWm)2C0sXc4KVV8PDB0WHvGPVqW~i>%`%t>6Jg{nh9x|-O+XlV7}0k|9?NF<
zk5vziU%D)RiM*JswSYS!54@p6gsF!f9IXLp&X@p^mjw`cX_kg*YrZA6s(*<*)M%uT
z?3e(ZJ#>#4G%KcX1d%rrrls*b5g_t3)*?9m5_uJ0R{<g~lp|0lEA)BMn#Vsxo(WU9
zbDE{oc$jIs<sFgN_uq)T;yWTQ?pIaT&QSZ#$d8>ixm67kD|+1!p0I!+UmJaZ$Qus>
zh&(u8<mvYX#Sd5mMxNfNgM{P;VB{4!t``GFp5%siwH*N8>8tInWmyh5?n<RN1fd5P
zqdP`>gaT({e1C-Hwc7*%L>@T&X^Hh4n-_xP8^#SG3jmR)yC-$9^9vyINbH=#904NF
zKL+LUX6;Yb+SRDTF4byayF<0ruYVJHi<_R~wx+)}&e6j?khV+#B2QtPi)B}jDs-(9
z!!yJVLF6GhBJE?~3p&$F9_ncyqA^<-%h>=#p1WJ1_01-ShLr@1UCilLoX2|cEs?ig
zY0VyX<fywBZL>%8#(B75i#hh?{bGc7mkkhk;G=B04LHKcOS99Ldl^@<rPufT4Rq_A
zY1dN7iLvA*k-IZVqn+>>hDhTvC&qC$VC2yp^T5{-MqbXkp4D+Ik`oa?<fU1Pcx>@(
zU=+0<6Rz8ej~yXpyLdFXs4)MMq_zNvyeI0v{}OpDuK*&i10eDgT;)i@SF}-5zk&fG
zPibsdrT<ly<F+{DAo$eP1KsU0r|YACh&-&bzeL{8EK3HBt<<JaBX`Uf)~E6fA$r;Y
zbjHE@RY9gjsCFhUW}}YIv1h>#U4j52Pvh7<)!mcX-79+yAoA*p*6P2yJD(jYNq7WR
zxy(~J>&pe?GkL(nAmOSx>tQh-k?=6U$cy~x5wq_R3-^fY5BFWfh*=CRC&Enl7Ur#S
zm_!^N-+!J04@-qy$XKlp0Ysjkd+a|%Ue4Y{yksEH2AEzazyKqhOENIVBQ&D;;vtdU
z!9zzhNVt~nKF=+YS5AGI_Y+(T5P3p-zi+|{_rVh5E+zZs|043v0V0p<jOkxQ-ncbG
z(@8r(<SD!o96$d{<ehs((>#|re__aCBN4U^5P7!$LFAPJMBae+zlgl7n+ukit9p0y
z>{0YgfXHL{1rT`#ZyW(451v(ZiZJqKt~YOuysC!atTWp_<3q0>LFG(dFGfAz9IPpA
zya0?m;}|rgs?&&v!Ns>mo~(zXiOp*PrZXj>y}v|W*h}UrX9?m<uC(K<>=Pa*YXp%u
z?!u_x8;ulZ7L`X*x(ZPxeY1~n?c~Bg`6`{9AEO>-#Y^2>HEX_PjgL3Vz{=uDu%RDH
zV%4d&-#lU*N#n7e{9j9Vn_BEjaT*{i*|DOE8&=Zh_1J8f0^WiTF8P?k+lq|k3I7ds
zMd_r5p{V0j$ZjXsO&_-liDf>%2q7m~XC1sI62JZ{N$}?gY}VC*1ZJ&D`wO05Bk6*#
z_I56KZ8GSiagKHN%lO!%8psB9wCzc1O-$YO<S;%zG(eN@TPVTXWsNJprh&}}jyTdc
zu#zE%I8Vt{cCfmV>WmC98ER66?(JQRo*yjtCvv{H5xYG0N#6MmKzaJE72n6G{>)|b
zv&*$4wf76DkbHFDizJsbTubIVxR}r(MI!4A(`j)HUXVK^NSo22G3r(K`cLUjH}AQS
zXYyljj=}*t<p+)@c}hHvUm&5(x6<9^IenZImM}y7BQj5h1Vz?nhD2473x*_3C1J+o
zr~00ZDSCFzjHyOm@Qc6Fon^WwQ@U+gGgIpIMj+(j(ZI^6$S<IBEI1>H8qL#lE*-_=
zZ5D`|<<_ziBj&U<1<8mOxnwDbmoAGH`?axI%vRtsIY9fmLJFN&M=V|zUnWgyi%`d@
z6OGiO!XJa`^@;NUZ8YD@@b`5?SleXT0c5PDMOl|YWtGdC+l&QGkFmMOP0V9N&lN--
z)KBYs?|Pg!twi(G+suU(8;Wtu;u}_QKc|1k@~8O2I8#LILyhL}Sn<92!D7z0j&qyE
zD=FT4w1Yg6pG79kyt%qC+1i|xkDRt2G+7vO_uR8sjIU&CXF0AAJ4{e0EgWBMwWY?_
zvghvWF@dk(<>Rzo@r-b*Z*p;08ZK`(85*h#b)d<Y?sgZ*s<4v2HeANy{!z`&JEbam
z?c#Z!mLJ6yz1Z0c6%mw<;G9Y`KS;Z53XJBIUXhZ+*D;K$6Eu;z7MOP)rhFpt3o0{2
zYa>z9_qE-Feysl7<CQ!8bHjMqi2|s3O#ds<8=+MV>^%U;qZn-jfV`>N5dg?joqk>r
zjR5ji+*V7=+b`2^fxNr~#}@H2b>Hwc^~H&Bp1tZDK)Tauj^RuV8||g7%;dOIIycec
zpL=e&94S0v@J9TUQA8b!Dop(a-ui6g6Zb=#6`&no68Q;`?sP&R+|f?)veZL@@V$1G
zYmXHrYIUcHFixb<PssSyeh()w_&8{5WX`+X(MQ6?mW#`jC0BeQZ8YfEED)WrN=Ut~
ze5l{o_bRqnI(2!|@4pmQ=u67jZcQbK+D(KqRQMC%jR4Z!fS7xewAs6Z5YKt;X#M#p
zoRt=op)d6n`qj_X#}Bj~*yUEqWbTGN+79BZrj>l)8Awn;hX!_K>Ej;4r50c9g7lk1
zY&!6s>x|@yvJc#Iz=gRxs!$263NgO&h{rDQpe02u#n<1-6-$l_p&2xfkz>e(O=FMU
zn7IdE+QN9USDrPK9ZIpk&A+EE1cKhXKNKyyf+hv-@u=Vln~bUzozX=lhTG-Jk1ci+
zhvv{;BHbr-hpyn~=9!!qe1RC(DUrTcS;d}{%JOtsO3RIxAIw3f^7+yg7OfG&!AlPz
zog7QkK9Z}V+8m)6%10xg?W33TPk13lN0|*9kgI@UKQ9PMCVhhOaP3v1$)!29fS01!
z(S>?)+%jgp38utLP!i$q9*V{`Sr*G$maL9I$MKDy)S^A=srE2t1dwMHPVhRcj*;Q_
zsA9iu*0X;DdC>?U?_A{;$P<&}Bo_`==MIBOKz}p2>nSqg&?Ra?`LTwb6pNoBfV^A|
zNdU<E<q@Xq_=V9L0P@@bAkUtg;=AM^B~?89p0`H=!L`tadP}E95g_F80z#h0BxD5;
z^0;%+G;W2wWkx?$gpf!2pu~(3A>@sgJw8GJc}~m#kQaXo<eiWF1LWaKg`4nrKpGcU
zOZXpes9YU9Ng2Una={!jbOwODb3*1L@V1&rOPI7H!~4z!R^nQ{d*U>c_gxDW<zJzU
zKJ8@y4b>}>V{PMa7cms3nc6Gc(98~|V^HfuO(ZH7A-}ztsZAFR?ShB&pM!f4K%N`|
z$g`Nf1M-|x{{nfBGlpZ8pd|RacR*g!Knf#I)Sv?!!4l@5J0Nch0P^7f7V<($=u7u!
zz!6V<<^UnDhe8_=@@PiWZiPIVHs6edTOlt_n<*36h=&03gzkVm7Pk-Xy0xNrKwh<b
zPA>rDp}BVfKpxk0j1~gO%i{xpJh?j{ufz2(khl6DK%P1OLj;g#qH_!6g{3~E%3b|{
z0P++t^Tzy!9-Zi7uQ=QSd8q)97q1!$fQ+|59yw_*>F6DhSCgWR0P^TxFtpzHudh&k
zZ3h5(Lmwp-MMf8cx+dqoS~oeW@JwK<KVO=;1M*-#8q#oVP8)lXN*~;$u++A7VHs!u
zG+MHQ9-5?K?Y;rUj;^pG(bbLd(LAF1myoAnvw<{C_Oe|W0px|~cGvMrM|S-K<Z0Lh
z>vRS4ePHOmS9RVC0C}@{OQn|o2J%i3K%QoZeNXcm=Xw}b$`ZOswFU0v&fb^~ehlG!
zF7Z6!k=$fWfWS!rXfvl5+r~MxZHOMkN79Qm2?GjANQ~AVo!Bu>pf~gWAbpZY;1d`M
zv)?uNAZC!S$qzThg&u368eN<@_Y05i3V}0HKhKwVh`4Mnj*H(Y#}JLVlh_8UsYi`$
zU}eIy3KLisyn36(W*nQ1y^A^$+{OQrd&<U#iZQ9N&FGb1faLsA5m#w1*|UTw`XCyx
zykD@yoL>O1;ViY?0H6xRLdw0D!NCWi_vWf`bxB6Pkzc$%*ys8)_wxt!)ZUex&B0m;
zBpba~!gtjm&t@)rsV(R;2y=A;@_n5S%=KD|#zqPyHu?MfrqtTwmd^E@gOxgA!}smn
zT|#_`_$ED(y(lgw$l~ILg6G}rEYtT#(qMdxsQRe*i(OA1m^>OuQS!K_L^G~rk%new
zLQFFM=>lPekuLsK@^sFn-ZUeBzUap81C+c#0|u0_Qb5T=$r}K&wkV_u&zxOTBq-pN
zP8Wfd4hSYMUwBF2i4lUyQ;3`^>~YGSo&lJ=sHY-zbMz(CDkn0#6}L>D?({8_CnJpn
zD0y8sxhAiid;ThU8^H)AZ+->?i<Wi>6-Jf|D0%wgItV4N?oP=I;Bg4zYI+8+^jof3
zCWEprH6Zuj=~jS}_hdl@Q1Wn$d31BlUN5ll#T>uQlgL??3tE-~p_~Fro;@hFl#Z<u
zR7jAQNwKWd1a!u`Yim;T0VR(M%bfHbvsg;Qh0OJ=aT1dLosvhXpRbIR<Bd@AIt^C)
z<!plS`4+n!KpbJg60(aTmolPwa0HVlzBPq@nZt!=4l9xknaCI4Loj){$(dOC$+(Y$
zB<g16#!WKsTVzZFZ=@havJWb-<jhuk82mX)WT7Qf2a4E}v_A_s1E+p>nA-kOaFiv=
z>!F)R){m#fs*};x>lDyHAwB95eG-7*L{I-jnr_iR00#yC!~}~<j&X*b%MVrf#(<`>
z=aE%`T!ONEk*vjq4A0Coc3me+l(e~NAz=_wn-QIop{2H$Hlc5K-tV9XBH0q)ZY%;F
zR=0PAS)Fnv(vS*23t?)*A<G9XxEzkMoU6$a<I;FI)SPpLO0tDdLa?5e^}yyWnCt`Z
zfuxh`JE^MY<eIWs+u)KqF<mN}E5)Aq8Xk)(9>k!JvO0sZ%gIut9iil_MCvZ)?ZGQT
z?Pzj<kw+l==-gjtHSl@;in=0=sI;^gOJ`)SjChW0UoOa8X-!UhO-dX5@-pxxkqqgM
z3`<;}%fnSUE(ZB8i#(F6T)HyE<9e^gduUw(F6;cs7EyPfeo-JIeHdgZA{Ib&(k;NZ
zqI4;v+@5aL8|i$}t@3qM^;dyfTj28pw9pb%{OV8%CtdcqU<oc1-)1@gP7<xlKrJjf
zm5Sm^1eAw5b0Jgls7Eh4Lqa29JAO?rj3vD2nSLdsdR<48Vx)og!c=gF_oOA$j3pr*
z^-ZrCc&CKS9v&2Z8Q2Mo9^yI#P6CO<P|Us-devHUD=}H7;Agf;@||>HFLu)f`LPzD
zVval!0c-FlFlj(hT_<|XjSAIdDU}wx`Sgv6_ku*4kTJSIkf9zimtJ^{HhUPour!E)
z#GhPYRlE+3=t<W@5@b=eF7^A!z(>uOD|=%qMV#a>@+)7(uSA0Ahg{ItBDd~`1Ymky
z8~4jVzBp?cR%GFZEq6f4BN(7L_ZRQ%$*8+i@=#JQWu_mzlPEzbdBnF$UKQ}XtVJk!
zr2kU#1{lOhSQrh-)W^*cN?uM76$>Ggy&cJj_5z^f%><LX_}kgTOSI?;DpBz7m^`Cd
zfXVYS0+_rf+oqT@bpVq$4={NFQJ3AXE_&zzCa<HwAl(MR<b6qsrLu*9?D2xE$m1lx
zYF6~REp^N7Jdk6{zf<xUl=`xmXb?(XmxbL|(h7DGS=l=!&)n3ggN&U&0m-ziRQ*oL
zo0m=hAuIo=+ZyxNJ0=^|lTsD-bvU5p**hqY4@7mOXnr2}N@e+R2o&wHt9CH!?<!Ti
z7nIQyB#LP;T#~IizWaCtq2y)e2HCsO&!GoX<c>1a8MH;AFyWyUHU+)>EhA8>z8o{Q
zNQRbK5OgV-G4U(t;g$LeXE=dxnZLzT`bJxSvZ(L%mfz(Fq+@THyyRde@x@yvulma`
z*Q`3t?={G1(EyWoKoO*<>szB|%P#Y{ut(HKmT^@EZ!Q3*7NO*wJhst#B7I_)W37@*
z9pwL*w)a-a>-g^3FJ{5no*Q}}Q1YUFt&K((Z9qx^CGSKUub{x<{ZCk3HtQA9=OSu;
zrX7Tmhx3b7f2lTNL6DE~08sLxjKN998ckB8yYu~e6cS$+7AB@dcbJrVWb(IYg6@<&
zzun6eK*{TtRII#olb3Ko#mor(ntX6ME^T<(4I8gw6v&t0B1(0TC7ATn{~cg~)`|27
zj`}722NqHcVMhSB9WoC}FrF_nfQg_NEs^DcfI@{9aJOWdbW1KyXbnjsENeuThUM3l
zRknq#6<t|?<*7a`{{vWl4@`Mij!WC(vGiw@VA)I5M<}b}tRVFkbD|eP)QborFK7uM
z@{k>3xEbVY5k%g|JC(mg9@1WTk%_NuT3JBKvP|`mGYlZ|xFQ}_f1xawrrJMLPh<8%
z>2_wa7H8Rb7UiUu^AC~7&O<Cw%Ru~r8zA!R9aR7#kMDpqjusdCe)P!x_X0cSY6Ww#
zEL4|B>5j;&KEmq`7@1_ZM0xbyDrm^kt~8*$$q^3HH9_{hGxD02n7C@`sd**Nj!`!s
zKZ1S7#yMF1Dk~+3Ha8h&@8~2^xMX+9D=W|U1sb6tmO^OH7|SJ%Ao89R{H{h-cmYy~
zt&@myQAn**%;!@qcTvdT6Ae32YUNY@bfSVF@=#TW>r}p-sBHt%9iK{~i+b^i>bi>(
zq+SDFr{2$}#q6pT>Y|C^s?7FVQ>$JpyY8v_Z>>)*Pw4A4jeqMr=hxQxt)={1`9rrV
zZ=l{cK6UHgde*=7z4>)k_zYTIjS_$B2G&36|E)y+UffVhHuqRSw=#4U_2V-L27>^C
z$YT(=CGrBy5ky|M1%k+fcUk~Oo=OA4$Wu8LPU^DYbTelbuuyI=*EzK`XfWe#FfTr}
z_|RZ(-e4svVC^kn6DeRT+F;x7W--?AoLRu?kAQu?n^V=P(<?uR7jD*~r`Dkj=CN+J
z)Mw_*?q*X0&XBVg^o@4bXD<Z>9VOh&<ON^ooY@+mxof$3w4PcQ14N$8i@-CB;Zu*s
zQwQc#VXi<&Wp}e-ch_%%Ztjg<*n+;I?r*Xior@b^Pq{m^HoEqo`Fv>ft8#ag@bG=r
z;mh1)j@sm`;}L4?xT)ac$>8>v$g8*|@+!_F03xsBj>tof28g_Ip$IMHXu<BtZlQ=f
z=`MO$DC&PQ@>DJmMxM$=(ktl*^NR#}loW)K*PSZkN#^6pYbcx|)10K$ocyLa<;_Kc
z;6<XmaEgv_y7fhhx@YPe&$L)!ktE@i?B?vMX1tl^jP>RO-sZ$|&v%W&DW8N>^8-`O
zJ+q51vNJB;jS1(HU*^+$Wws*an>XjLT%^9bOwwt|Qf_&>9gvNBnG}1Onc9*(>{&uA
zQX%72rhZu(*<9G#f(LFXd~x~SyCv_NSER9U6uoBxxp36BQ1o}9m~Mc`Ly64~jO`Zs
zP$d*G<q`Sm{7s@zld+sxKI;F0bl2A3+BPQo@muT1pQ7yu=}z?1S?edbXvf%}#zZUZ
zU{N6Y!v<>W;uPx^Z0nW~>ydBkQ5Wmg5fi~_;~xr)A-(dTY3qH1knW;IPZ31kcxwb4
zAo5UK03vV3qj?y4u()$@8zAx|BZ~bH(%o6xNAtF8WN3eEf773~3F_DF!*@iUU(}d4
z?uHLph0pM(wr2I~Nd%GC+5WSw0FFEv`f=tMAo4oLv#+%Xu4k&mzh|_LAc(xKul=_~
z-hj~5zll7gdHIh+AAITnBCknoB=OIe?pq=+(`PCBj>tov&xikqk+%pKc}Syxk!R9=
zYvf6Gz45&@@}$1^x9@!Wvy#;LQ#zOjBrxY4Iyct7f7Ui~N90L11C8#8{6MRJ5qY{F
z7u8?i5_$es$|%dm;uwYx5k#J@#HpxwV)lO$d6Jvu5`;byqw4TWd5N9wPgn5voBcP<
z+elWZK@$F`m_&RYP*dq(Y*GQ2bEsKQXj~E(88d99%T;II^5h(5p%726n8N3YZz+RE
zF<$R-f&V{AcWw8r8AD-DhH|Hv!iT`njW(z8>7yBH8VcW>@^}=u5gFd+x*}wyB-G?o
z{p`H_<+^PhBZ`|G(IVV;c+f|lPUENMvdu4P40U^zh>XI?Hhf1O2<BC(_ePQmx?PdH
zTuHuvU#G#|lcZo6k6h~e6{(BOM80Au5xu}myXkVh#t_VtrxPh_PofmG0xh+gTF!4s
zHGkWEeQ$jW<r&V@s2L!jye4Pas+qj0LZFh`wozoa!i}=9)ZSSyAhT{(ZTK<FsL>rx
z)xI@YxcRNv5HqdA^DFx4hx(CrBs7Y+4isF9uy-IrL#}poN*^ds&X8RxDW2arWAM6*
zOz1tlRhD2>$}9ZJw|G-=3}}i8GVdARx5b&4@d>Ri_P_~-?{}gp8Y<*c5W|s7xnylX
zc5R;;L|#-^r7Y5LgWvh!4}JM18aKp>_7XMIxvvzI<gbQYjPE3H+)KgsS?u0tK60}V
zC}DutJvCT<X5uIYW6-UV*IA1DVFjtb&4sJ>?aPz`r3}JUgHjOZB9BWU^&%^pAn{|&
zSS+Ye$r4F^ib`j2J31pwG2ahqDU`shByn2X$iY^L-;yvop2zIaI+FwKh(6os=)*`R
z+v?lo8MEjI(NG}(vzWEYFxs59DKvVZnO^q3l%mONh=|F-X!(@!g~MeamQnhJ!<@^s
z>-)EYF|W^R4Kd0rvh;fDcA)l)3#mVSxy_hL-~>NR9%TmLKGdbK`DT>16!LV%ff1_Y
zoVFbCB5(BZ8~)RcETwApzI1zm*@En7)rX{ONkz+x=m9X_W|QCtS#N)(M=LQBIy?OE
zToUY6AhiiGYhM4LKZHZJSx{;?3rl;amR6`k_EkB<JZ1uWyQ2O_Iw0NMknPyN$IIBM
z{fyVTRX+ACW4Ct7k$kVInaW_V+PF+~yYXXI18I(slLaHqjApvixO6j0b{8SwYL-5B
zy4Xy80mX1)EztfZ_V7W))sYJ?B=gu+;-^@}=tT@$$t#A5&XcJN3aN<6NAj;3r}d0I
zP6nd~q2NA=ZR>kCR9m6ciKnyu3>r~s-DmJ$?>KGO1`08J3JD4yaihJA^6w%ULQPrq
zvZ`PI@n@?umgvu6Yq9U_v9ao#KYP8+xn4v+i6wkb-vhy#qxGsc`Ul6^LT>&3+2Rn!
zMV3I=-dY@&Y$t@VRF+ZYC4`;Clo(8bDfY6X%Cku-5EGdMgN9kWn6w*qA}Ytr-p{HC
zst5w9&|+xMbcuYd_TrY!#nPJ*VOet06Uj8ieSOYA^AOKe)KHN(T~n66>%c^bArCv3
zq?gpOF#NrU84h+|L^2nB5QA_qY`_B+MnE6HFe`tkLWfJwvP5Zm0u~E62;kjVF*?qX
zAtCV>6UOUNRprgajFzgNDeMSQ^Fo7bBDteVbydVI3t7<7)(yPmJBsIwTxEC%rdBpP
zvdu6gVx&G%OtCz&jPVF$kolsh{&<NZC#Zl{epBfzZ8APyi;?XGM&YBrqokHqKdc)t
zFmWM`X%V$TI>iDt!7(H9t&?LUslj@K(@j=$fXZ>M8IG8r`?JvxDx{5b^ySSQwE!{r
z{)VcMAmjG-gpobztWw00$wE==two<53m^^jWvgL)u2F}tO(NqPgu{Y?-jW`W0L{Gy
z*=UfJrH4}S<xXalNYc7Ygq<GaBJ+*~ilt9zaMb0M-Y=Dq(f=4PVpB*~NKJe67G^?{
zi=$a0FFP(2XOtvG7AVxqUjv6m>LztkCx@ZX3m}L4ED``RM;Sjp_mekb^*EZ8TTDYp
zQA#%Gbl19zOm>%0vVv~vg8>lZ!A7jFMF5c<Yd6pJgc=-az|(O#PlCQt=H&o#Jf}mn
zrxOcTJK0E;UtxfWp3KbF`=e@}woYTzZK{3_?AlOOd&}>y^t$ETLhox(-Y1WY>9YEo
zoncgAsrqMTKuNn!L2=VeEK>g-N(`_N50>CyiGF&1NGtwvlE%#+6KXY0jiq7->aU3^
zcI&48kdq^!W;(qt*NA^*k|W`StQ}TD|F&z&K^mAEd*ee-x&)RryoQC@)Gd+OEQjJd
ztw9WeI+acA7MEvg65!vch_HT}vs(}i`aeM;NQUDcuwY!Jp->B@!o_C-gv--0=ykj9
z5pg}|0OHN=oHFn2RYUJl=wVg4@iUAbNc6&%pB0_6Lpf^XJ_$VwjnahNn9%cLOa?3M
zbm`1Rukgg_hwI_2mZEG{N|v$3F}xziU&-Ng{fG@SBtgcO{lG2#Y#i0}oc^A;P5He8
z?g+2EQf$ZSJ|VMQ42h#5ozKcC4mwwS+Mqg$s<ij2&tS`+rb$iRpDAXY874l&u<XMp
zI(c<M@m8jaVFGT%mrJ?3uJGwA$%ANpJF07INq5*-G*fk<M6|AIe*Sm}Q+?2;d&dLj
z0;)m2eA%FFh!YlkmCll+Pqf<4n4W$Xtc3nNv5L%|WgiuDt2zW$h69rz$$eX;Hb5mu
z8z)f0Pxe9N5qp<YdBNA`pCaxB7Ar4&+dIUJkB$#C&_)S<$$U7U|3t7=cyZ62Uf{>3
z)ksV1#Gdzx0mVi`w)*+*{+r=y+d#TqwadP}u^*y&DB13xwqH91VNk@Ex+!-5xpu-t
z9i5&O05hcR#+#Wmljyk05Lb7A-|R?Z>LQ`zC)h>$?{v>JrGXO7e?T(XJl8WiHksUF
z;(ZJc2IvIAj3}nT4&!;mgEQTfN&@BHF1b`R_eclR*O?OauS|4Qqyil#8<Q1)WAG4f
z$^IYrKD<KOg{N}V&kR0GZ0tAMMbB^jejRewMr@z^a#_)zt^J$#{yS!O^*=x1jrg7W
zK?i#RVm6_rE`d=i(V~os55Xw&ajU2&Hzj5ADbYcC2JJLS3iCGS@kjAEs)5g}eOO;0
z1;0`-UE;|dRniym{)j;AVh8v11Uw^)$4{H8SPs4Sy@!yEFN96o4<T8$P1!Pds8yIy
zi~)~TVDG1tZTtRvPPCop*-Z2B%TTu1OaF~duy!<<bkq3FpP$t5i*KK<CGfE__hzou
z=%|1A0|$eUAaO{7v^WR%k+8cyWkRe_tQM?L9zF9XeVp@$hRdqV8pSdXg_8@FUjt=|
z6OA2;3ja2CAs2_D3<YV%9nzKgW)AGoM2*sDpozz!scWDjbD&$Bp(B@}BR|k)AB(O=
zLZUW<Cum@%#@$GE;YOLXkjPW#bP|*0ZIPMjN-h@zJ3U*+u|HMgv@Ay3bI^Y2#F>_&
z+grk^$FZey!hk&w@sRzZ-}OTG7cT96y!)RSx13(?afKf_;Z68Mt`8ua@_4G&P)z6D
zG7L&kWN-i-m|r6t?~oB+6NW9fLw3kW<;+NTI2EF?NmTNVXq_?vvkFU|ip&%ol0!s7
zNAawK*2EuO&KzIB9~ZJrmGc=wSAy?00m*qzF^_~jfTaWc<i=^J#s?r>NcWQZa4})Q
zaBzrTi6mZH*x9NYKBW{Htdxw6A&p}qq9LB_{ULehVRl_jZ&N&l_y`5&Et6LSFnRvV
z(onJqO{#A&a>hf-m3Z>angzq^FOr&bl{lrD>qU7cR3z*835!_wmI<lpu%!a29bvS4
zrbD1S9Q#h3$Xg}P<sT)_jh!f++cxVEzmb_`d=D2?%Seo~*F($n9hP8&&t&-+W^}Y;
zpTO+>GI!pAdViex`4N-z<HV4chc_`ajrP<W3T^4kFhI#8xKr{>X%R{u64CXol6P>c
z<c<EL<bk``#%Q23w@Thu9zL!F8u*Z88^Gjch6hyB1Y*%KzKcgqdR!Y(%c!Nm?VZ34
z<4vNv$McRUIL?L#yM~*vhNpD@N7iKD73W;KHFeMU_qban4`fCM$-7nZkcj{#&#M!Q
z$p68ADtYL6{Kof)?vy-VUQXUg>LEbMqm>AHP7$|NB+z+`^@<U4%=1A@v@ub%bxQQp
zRJNE_<1gB`;~Ie-{!v}HmVlB+ajWFf)gqL<n17T!bZL^fDe51*4@0K}8fn?3WH>SM
za7c0o0VU4~7aNpEK172<^q8jN18&VdG2SOKf=M!>Uu3pb#D*haIT|tWJ{BCYF^jn^
zT4|F9iO56<Ca-e@bj#$GeWt#AMWg$L+7Mv!Xuh}SN=mFq@;`3-f*gck@=SqANxZyq
z>A(<1i6o`+FG^Je%AdJqk1>yvI_O|wcu^f|8VDut5&4~xheR~Ch%;~ZU<IM%3A;X_
znRHPN<y8oE;f-(+F6P1F=z`dDP=Np?&y*&Qz@~^#nS5H4n(#3_znE~xQCA&bw+%wc
zBXPP_@@VPqlspp{^_C6Vk2@vL@8ds8-V;E{JK>Xj)U8e&7Ik#1<P9xS{bKvP;U|49
zrKuI7$(XE{F|7yBek#*gmxf^S7HPXTR+DlxRIPr~EvumA89e2sokWh6>y%KwW%9lf
z(xO*Oe32SvJp!0KMot3#eL~~or^cO{`j%^f?DRMS^+gICiWiTlFBfg(R?q?#!TLy?
zoAlK4l4jVaw0@>$oUWSOF2;f>=AvKCbt;UfWMj|4j}*IzqWsJv!>NfBZhoLqH~A54
z(Nns8Kvp!@lOVEwrEM)NU@^6t#X?WbN7yoC2aI>XAp#5${v`6<ymnvR9o?++we5-<
zG`)#be<{&~m~tsfZ%FfIo8{^YLl|0ev6m%v9tM)sPTFQ**p+^D_(|m0I%W6SqTR`o
z)ZUaB?&Qy~+-b9^)VNqBb)9QLYbGrdNYG@$|4rL@PQa1;n=|z{$of~6$q_O&)6ZM{
z3}yJQT!#a=N}7d!NjWnT$;E3a=iO_6>Wm%gOq=Rz@Xb{;@v*uUaY`=v02jkJFIJD+
z@Vo-%6_Pn^7ul5w^)fQasVOvNli(nd;eggu>&%w_)HPqnt5~p`fmn6fU%7#wfvFSh
ztJ8RHDyz&v-!Tlqa;3`KWtBIhY|0^gm+Fw4>b0WdyH0FcL980%%CJM@-2VZ8gVT~1
zAo7-orgRuCb8HvRJU4axiG_T3QzZqE%>g2>{e+$@_jTbeW!Yn4@&6$5;ME;&;&g^U
zpr2GXSm)fC(nFGFhK4Ve0Wk73UQk>iy^%rDd;}PIxgnY}p4zFwp=n{ir-L=k?%ff2
zSgr^nuXdQa`ag)g$Bv{-HZ+oQkw#VIX{@2d%liH#e0?@pY9!H5iG3qUVpd3uW6v3K
z{)5O%c|gs+q5L029z&@s4R|&V=6Orx`TKouQaYtI$%szC)rt`(!lOY#>FcmX>P&o#
zWW|Am!sJH|EkdEmK@oUsZQdvuw@BGASi<G6c-;y13N{m@?Z1-3BzoLR)SUW;lwin&
zSk27|)<ro$lL#lLqb{1HKb-+9HND-PP8LkL1@by<?|?j$J0Ne-M94G~V=?_KIYu?0
z{mSn%;N$UZlmb2;6KTk`6s_yX%oS}mAwK>I(tw+kJNdF!xgKrH(i>j0*(juR7@1{|
z$2&^?jK=1Se&I}Gt4!paWZXW~I=y$yUNNR`C4UHKv6<o@A>aH$K1M3=xFJpZLs}G?
zixXi@F{(>zxa6lLNbcoaVkYJB!?eU}4id6OWs{Di%tR$%8ov8nv7Z)3HAmASfK^AF
zM}HapC|!>&J;T%rhf6<GDxDN7gj_(Rp#D<tdozQ|T*+S|Pg2E~5W9@52!7FAay9$?
z^v=l3$*G#lOfn(vK+d+A(@;*R#{J$tE{Q3oOL<O<qn1mO<VSs#gME@i=jcgWR$GKd
zUOsX8tobspQ@CP~GzswWM)d2Z(hJanFwHYC=>Z?F^EKe(4Jpzfd_2=^XM@ITsa%YI
ze7u0OG{DDeJEb{a!W1U2<Cn`b$WT)JUf!vnKS+v1lVidmnK3xqlJWGtymZ5uH=Hg&
zd_j=fEEjt`$HRAs2&M7k&sL8X+N|1BdVdwlMNcBDr4ULpDvlD%;tb<5?>13_R^wmg
zs@|<q`ow9b`Msi@^!07Ya#WQap8K>hm$X<x#n|vTKMA4v_YZv{@^dUgh+~SHsIJI6
z-jUO`_(!Qtbey4evKh({Q<##8<-@G<KY3!brz1&{_0#_DN-iRDn!El&i_=y8Hb#ji
zZGI4=3$jHf>4uEml7rLI`N@H{gL-*LyRFYbtUR(!$@R*_L#%?$B$F5k1&Ick$gk_O
zm~yPoNF>_F2~oPsGuizsBgf3q)_b3E<vuqWpfdSo_IskQUR9tjDD8^b8q&HRU$rsP
zshG}>O@PKJjYKg%nqV#TBTJ$#c2pSqPY7Qt(Nfytkc4&m2jD)zNfnr~w4Bm>%_D9^
zA$e`mr-wSEpFu83p|<d~^vQH!2nn9)S9R$jI7nc2y5MW5(S2v5Z@3}fdZkd&X^<53
zW^zBuL{i#Zn!d@PWT^dp((_R%>)rRyHF?Y(pt+9=TCJV59Sc8=D9YZE?|n3B5MRju
zUH|!YOL8&xvxT2%poKFd7#k4vXw4@VTdJRJEe8hU3yYtozWZBIl9?{bFV7N*te_Sw
zGT-2R@I;c!T18z%c_==i=)1}+NdX*m7hAL>Gg*~-D8oi&li(LE`jC!&7963rj<LF8
z`)s3X_Lo)>ukQ`Ll5=`|*5a_wMmAM{WY*@|V06sahe@aFfmB<KS;2)5Et7n<g8RUy
z&3pr2?OmU3H$U4YoY__{y2l{C!=1;vl<^RbMZEjYclY>5^7kJWZT@dpp3&U`d5ZhA
z)tub{aSwNYXB`@+?yDBTI;alr(P_03lN7Y@1h{*AP;3KyyrGYM#Gel3KL!7JeUzcs
z7j07eD9~p`>P7OckH_RW@+kY{1>Ax9r$y4zNjEE%0^Z!l3YFXo8hfc1ybGt!#uxe8
zXM!O(>5XTEX4LZ;QF%EJk7#kq97(mMj;cg1QmL;b8ZP+z2%C5=sm(~xe~QTm;+f@2
zkuFhTHK$%*{ptRBGdp{dj7R;2h;J^380o)DcN01F&M-EfRrjI1zGw<juhjwnz@~Tx
z<#e&||CMxCXEhKj8%ZXv@A3r9Ru(7n8jHWI+Z(&|WgRPjxpo{~pw~5)K*dar#c;ZK
zq`>>nxdz``D4Rx~8hCL2nEU80m|Y)W8gYN;j|QjlClBmTxTOL$%e_(LqP{r7NBVdn
zY~;PE1rOfyqGsUPr;gNaOyIOO-wz`+-I^@MtYpIdPH#3?_xyW%v}mJauf6#n$1se!
zuadEon+CGxivs-qzM^AxfSC93Ut*r+e--n*&JO`Gk68WYPR!fCc`fegKT!;bdC?Di
zp{IuaHzN%O0azUH0h2(yhhH=N@t0R1d<07TLs-@)K-~`HFqIiZ=j9TM-?W(5Bi<pq
z6!Ji+#2lMUX<RB)<V;sfP5|X%;!e$r7RGWhchMaA2hHOi)y<C+v9qR&IJ3upMAu5v
zITrSb_S_`R48T0!TE!6LrnY;oL<;K6tmVF>EmK^VLD{px<}zAciKYH<ZmuuosIrN{
zb?m<qDjA4x5skla{sD&wWwQn+=RIy+iG=&9?J$!UxS&VOH39wC+oG%pyRx!?<X<KE
z2ruu&t(TX1>*cN3Re}HQ<spB?B@4h88D;+vl~^M2_A+0MAm|;uD@;-qrHozbEehKX
zQ$`QncznCI_Ey<e<*;MxPJ>saX~BvAH^J(jNKUCm7w0i?qbJtvT=y^UsS{A_<+FSk
zmCoRbH;QA^;I`bk7Xj;r+E+_}l||RuuWv*hoAZ7>*J;_yih4Q3x`NI*==OHy<%l~s
zK;<Em!yb`(1A89{l9kG3^L+W9V|Pn3M?}Ju4BBGJ<+!@QJ-#PbAIPPEDU#1OK|8U{
zJTEMdhRkAB-DZvJuUzLYoxm_LSqEv&IoaJ0&NW7P4TthR%kQ8IFINZ~W&<E<9!vLg
zuNzI5?6tm-K8VX1Uj}vF3lO8`ek&xe4D9M&&w7LBwUHMH&k_dI)EKX=vg|02O}7WN
zp_)gMS<oFcJ+&uv&{n*OjdnPm&w<i$%$Ln_>R6v6vj(*`?cI521e1qQ@-j`)f@uN}
zO5Vx8l)U-vu^npku8$AL<R!%aDtWT|V`odTV+bYhTN`k?lD<zX3mFn7Imq?GPhGeh
z`<YV^eE}zkZ$Lw&t0qA7gbp-K?@yGJ2eFQ$AsvK<NPc040{&efUQiCGTPhNY6GX(B
z(@UA~3Ih^QP1})!iuwjD8(iXt+NY2Miw*1PB?&}j1uq-eyLUkkSno|w1xN~cU|?Pb
zf`A+!_)ACAy~$B(_iA{agwO^AFgdAt2*L>M*B}J;^pPk_c`_${*vwnpVUmkTYzg22
zNh}_gibW*oX;bo}c~cq|0tKj?lsNlCX&M%rP>IP2bbKeK*XBMJ4EGBZ0;-*9#22Y?
zy_`c8`z8`_!!d}q{0DRes$yS|6g+qlKAhI(j~W!m7?QaNdF_-y<Dh~1Fb0a^QIL?Z
z3l2S%rWuhVI!+rr>1Xk~KVs4_K^;3TEzuwq;LH9h8S?f~olm%0b726g#z3LyPs}lL
zCmO;{p9nFV0~CUe{P>$DIc({;aAH|=NZFTS)@OcW&_Q|-TTZqFGVA!sl2-PdVJE{{
zJSslY7iv&p!FM>-GCIoitAcYg42;J}V@YLvao7x{k5)Sc0#E2OFgq!wt?Zy_U-^p2
zNim2{e@*7Jl*R5EmTJaEv>8Q6m2iloF{EKV<>y{0cqCi)w2HMUj*GsGewtM0lRgc1
z^}TY72W&&D%}=WHK9HL>W$6E8B};snlVbJ0+(;GRovKkQ+bM{Q;dW`IMIA8r2NkB|
zPZaR%39G~A<%yU3W(FLCp|rW%rks&_fEu5b@QC4;2=-iwMhdFnxw(~kq<$TVOjaiD
zdn(uUxfv?UGUng_Tdm0N^Orp&8sKm<%WYXWGPJ2@8Z0VjU?5*@);!`+`Rf0IbVvS7
zUT7Kj{(*yjBz6xKAl(s}hLT)veE&zfgJUluVc$u2kf=ov8z9{|RtHk!EP<6hx(M*X
zv3ja?E>U2yWP1lPGw~6BP)vImIBLSxqs;I_Wii+tYa)$t%qfEydig4AqP5zVfdE7=
zZ+lJb8~bI7eUAZg^xF96?5ni<O#||dwGqNO7L2^JgHO;=z(Pm?WU{1v+~7fQnaUcQ
zwdXMB9uG#ly#;reKQ!|90mKMXS#Y@7g2Dz}WG`x6Y+G-v%4Snbx^`U>dv2_E#V-f)
z&RUunZ9L4eF3(bHT@Fs&GM3aF`C8r1T5;v=WT?+@p;nx&YJT9<tD7=m<!HP2IIu5y
zqr9cq-5c7>EtBry^%eV98?iwQUmA-}475K#*Zed$X=Yhp6uP@<hT%QQtH!S*qo2fs
zH2w6rDe1%U?@dd3vf27yeiV+ctx2cSM;H5ERf?n7JG~NRn@#!Mk{E5P_^I{5uH#8t
zm63Y3nm2tMu&BAs2N4PKhk16NHE%uGx6%n|_?c4Q^j&2=<fs08PmFu{J|$t$cY~$m
ziSsP(cEZ@>w=3wxWm*zEQN>x$@rl`l8<O8S$;5;#z4!Gnk)d<e{NA?Q7vov%S-BfO
z?88U*iFaTV_gIp80lrpyVkgfUPx%Iip2+!oKZhAN52|ZF^>KAC`<_*_?oQMuJ?mwW
zq9bX#ve&xcncL@jJCYBrWV>$he@Zrg92Shd-jMzFXZAwvG^cj@J()AAP#>^>Jl`F9
z;}ObVQG<zjD1&)J63YJr7LmQijpKioFq?WqR8O70i{0N`q!>%w8u*MgyT8?vuidM_
zV1A==-$&$n2qu?=Y}PQaBFTElg6Z0c>s=E}F5ng`YteH`hwr(wKzAvg-+tmKe{!O=
zfA$f6^?UY{=%TsS{`&BbnPux62&HJulA{G_dD!Otl+Gy_>^aQ^Smx?8oP6fnGro!b
z<KLy(ue?s*%m~80-!#5<UUOetCz>ttqb;__4SR#q!;pMH2C#B^NB5(~adjoB?eMX4
zxxgz(G%ir=K&U@HzV9EwS4FATs9-<;Ujd+*S3lhSURyguS-jhy2DUrfig*M_xk4KJ
z(BuwYQ0C&%F%qsoedJ--gy(@5XMU^-WO>AaoHGGV7{P)p!NHw=1~!2|&nU#30@XK^
z5lY?xZ?!XI<xaZOMfa)>vX~JQ-w0;gaC@5O#vX>}H4v-`4q0T@epteEIxU;Uj2@~G
z%JCG(_8fM`481}M2Ln)^NqA~lc$!d<<t>z#Jrhm@{DW=^J0J=}mo{ieb4HVX<x2v0
z5A+DFB8e=BHx1T}p!|o)OR^@23=O(t@_GR#Pb13rfCa(iK|PcIVe)!O(9@hE=ZnK!
z5+cgOA}-gWM`=UCnxbcIV!V<fF*NDqVb+kE7*tL4hJ$dUNwiich@}&^ixbw>0iGiv
z_KZi2;Rc%)Va(64V9V4nm&cLFgK<0`{wjGbw@O~ij0Zx=%ZWrNd0agEx+HX)5Vd|+
zgpvnk*9DZk!&qF*L=34o*V;I4+r)!MQAXovzSY>hQ1szyOiM{FT@B1=e8>tEt=kDJ
zN<P6|D#6kZvm=gjdWK3G6GyHZj)``bAP7izo5{wQFogp=Uq9>`jerIXjuj`YiG;`;
z4fIwMY&kzJRa;{9L2z*#tkonSnfbooV|3FvR|CwHK*h9R+r%V6J}XRzJ0)-RUrL_I
zTOaAv7l%pa#dz<XsZcv1E>Lz9+O!Zo=(VJWtW-qNVEX&Pr(wc)R(b)+{{_mUG~&Ud
zNO<d5^A-d{BUr+)36DoWd79~!r0AMXYAm4%xod(2hj@Rqq2C5!VF3Aq6hVRsJ4A{=
zV<t;v3GWh)fOSH0N_;EzM5=95?ua~_J0dSG=8niqvjxct!xP$BpqABqv$ss1r4uAk
z(8mRuhP0Ul_+0>#CkHTj)#){wd@26eto_hsO_GahAJkk>b^?_761rb43UtTuBM9Oj
zM*&LS;06X56`|y5-YR+7wJE-fyfyJLXq}OuGQu<s^j=+@u*XrIFCkhh7*B4MJPBdo
z9&~BpTuB#**rTkgxb$Q|$s6ZXOM@VRsI)sF*DtZSwz3rOl)P&0J0&kU6nh=UeyikB
zA(T9gJU`YF=fGljVKPmPyx_xJyc&r49MJ+zDk%3IW_&5`5*^xMhDHs}I$zY{K{zNM
zWY6+8-WK=j0RBQ*x?pjWOd*{xty*-rBYZ0-G7bszPfqzwH5P)&^CMj8C^Q=Kx$p}o
z)C^CV$#eF~MKF0ZPBTJ(mAvp!kfjO#&C5I^nxyjaDAb8aFQm%2E;{WMg5O;HcS@c;
zFU?K_+TIo<nupRE^}i~4T;Y_rN}l?yk|zNuc{J64lDABY`|7WfN7bT~g;4T3{O^=J
z(Z5O_&9P*K<)ZhUl4scgez5J`p@A;E{d63qvKLCFaNu!aQqDw*EuzSAr{qQHz;Z>P
z-D!gN|0;QK(C%iL-eDX}IQ~W>p7=fhAI4K)vQU#I)Up!Ri2z=lgK19WVTY%r8MMc)
z!qp({rGAbA66O{ex{_qMTpUF4UTi`*nnI3`Azj1R79`la=}H4#35s2u(<CQ_p#+eW
z>ktJf`-%w&*}D0y4wqaGh<zDCURvi;&1mY!tFRdMLJOVs;z{@-hEN_oiYQ*UAJ>Ft
zo)l*5g$anG93%D;`n?5H;h<3|C!<&cQ^}846N>%Y2}|N}4zeA{)DJYy_Axm$)yM?2
zph2e#{g}fA9wA42n2%TN2ZDAtPf7(Pl!KB@K%cjuYRU|9am<7Um{6^fn+~w%cmgOM
zUjO*kk&_@zlF>^_2v1TPOtK*-v}1z~FIIM#P=oA>R-k;<N{w#AozKD>jqagI=H>Q)
z@B3x&E#}<6Sj_%1*~};gWvjq@_Z-yuGFc57Q%(}269ZFW5#mCVB$(Nax>Ujxf!0zC
zGU$TXkf3Sm5GY1<QMcSGdC)cjGW6CsK@ZY!xr3g##nxCJ?0igEuL+2P2do=c>kUJf
zwk<`|=|S5<Pg`UeyX+gW{bX=lp^1c*PFEhs2DN5~>c-W{HZ_^yz)s33<@{1-JHa-k
z_h*+OZ20exDG1FJQ>=u+F@~AX^*9a}Q=B|YJ1+>JIQJL5v1SkOKxJ^yDh%SA12S*y
zq+}oFzUZWB#cqOPUF3k`4)BP`niAP^xY=2UbDBEYyE7J*5}y;)a0OwBcC#v{e>UV`
zylkCB#%!gzPaJ`!qC!Bz4prlaoIZam%8PSMDyXlL@pGqljI0#q-;P4tU(?ZTv?7xt
z;^2ytEH&8dk2A=K6X(M9PN};8of6cS{ej`o`#U8s<O&*wQx7P4V@;Ut{jNX&E(wS5
zfD}7&HZ8W4J3;YnN;7uaW`~B<kiBvyIKK<Dl!6Ky{=h!9p2kPATdy>p?K=*!4nspH
zgHRg|u#1f#U$XRxLB1Na52+Az_;FRTL&IrW?$3T{2c*|<X)2L2?he1tH#wi@uV8=t
zKwBobatBXN(;@Fje0-~YHgLY0seWx|gYM$M+K0bfv5wu)G|$H8#s<WnM`2#7^v8`f
zuQT*d3v{1hHC@G-qJL!k0VsJn<2bwH$82S(b5ur>g0b}wZ}SAQYXS=K3=;c{rqYZy
zJ@j_WOlI++dOHVKK*=)+Ako7~#h>DJ_#P<~h2j;ZxtRS|$vfa=807zz&|}la4}HZ@
z!_}e|O@KbsHn!1<gt?%5r{qa`9(J@%W8=)WH9fnAWgN6-96VWZDm3y-aYU-LsivNY
zM5B=YVF@UC&|YV8Od{mzJn{@>RCpe`QdeZg!gbu3W%U?J4CuQ0r;--tyaPyt^nr{G
z$a@De@;!C_&!Wf2@tg5+BL9K*R=(9vu*lm7vnB{7ua5_swM#(pAp68N`@A%}Wgz?G
zyMY$*^7<CO1Qa}Wd^8pnjIR;s)rJ*~4y(*8Vv0AS^0}*udjvCY$*%q00ZQJ}XDwX@
zFxAR612qvUHH>SXHN#Zbi-S@?$-9=mPmfuIMq3mND0$<YNpp~&fRcxlbsa!2U%3t&
zSbP0YOm1mC{~r0q`@;TjF#nhhrApXWr|?9|yi_5#nlBS6EI+V2qf$ziy(>2<C?LBR
z1X~)L-1&HV?gW1pH#1`3Tcwp-<)d5g_qM9=wre=HKd5cjJ8n0|Y&TbKw~lUq+}r*H
zG)Osiy47}i9e4U;b_OeVhDUck@9m7??M`s)PO0rqJMMmq*`2N2{XV+8u($gYZ*PfX
zZv|*3IPR^->}^)=ZIABl?(Oa4?H_XNAFJ*EcHBRU*}tgV|1-LOy|)j?J3!_<Kvh3L
zdvSmfdw^MWfIW7AyMF+I9Ktvc@2MXWzBnX~JtVC<Bp*AZ+&`p-9MN(f(W@UZzBpoz
zJ-T0Y^#4nD*WY5VXREHik6kb9U;l*MEOFkfsNbx;xLJ?A*{r(R9=qAyzuAYt4>{q-
z>hRw$;AgS$iz@h^F*yAH+tMBU|8>%x<|AUuI!$@%V7|wS%!PH2l{tI)v{VJx>a^4)
z(D<Kd$}`qK(NcfJ|MaPjW&KkU9phkrZ9VJ4dToOjz5F^x?rZfr#@0AsB-#rQCI|_R
z#Et}9XrOVFP~a5<3|tsE*w}awC=`N+4}}ok!zU#oBqk;$Cn2UHC!?jJV5FnD&q)8^
zJ`+1DE6)Q~0d5WvejW)C0bwyo8F675DM{r=lA2176qGf!)f71&$Lc>;)zH#=rmexJ
z8{exBvozEeHA?C?A(J*sF*dieH#ZzGr+Q?Ou3(ipXhr8@Yd&Plq+*vj;=u0dXs!7o
z`|}GfduPwj&b-<$b6>x-({n5FcXJ$b6ESixeC6Ty%(HOJQ#{z~rI}BW+3WI&*Z&R6
z3sBYx650zA(+?4I3VH7z5}O$E`b&uBUZ|vFSpBnbsh8okufio=!mCok{ieg8?uW~o
zMm<W83j7vhFdL)4AERm&tK<_`mlYQ}6K8B2ujZ4`9F>rHkf1f2XmRJ|{olg!=KllB
zTgY*%$xS)Rdmd2mJgK1lT|xEFTP*Lm=w(Q;b4qdFVzJ*!@$2-Gj)+p1meQ=_Qn#hD
zARv2vQsI;S{`2zti1^Ca?Ui|XRlSMTZ`Nv}lWPOIYl}{5gVO3k*6I@b>Ps^lA}SgN
ze>X&~HKuJgCTBNA=QPI*H^2YYl3CR{aoU<#(3Uv%v1a>Y=7;vFjrQE)Pia-3<|aPX
zo_1ukbdGO#7M6Eqe(9>O>doEiEkElmsOig}?Q5<ZDBd2Z>KUAF7%E*DYWv^l<sHrR
zkIZ&o&h?JZ_s`ES9?g$@S=gEUF?9K3_~hrr*QL?lOaJFy-sR?x<*kLYt)*W(OBXvU
zn|o^)`x{#a>(>YCyGL7pj&=@z?_Hf99iJVYUi|)ZaSDgSfiFK8j&zMlp-`RE83?||
zYB*4x+Z_s}SIShV$?J_I;kBC|sLAh-rICrCP^>K&Ok~k2GaRff98TpjAIenxQ1m%N
z=+)Nz;D_R|Y{@_@N~OAziF}1bR->W1(y3yNe5H3v^<~rLx*zNohU&||Rhe{0P%1Z6
z%zm($Dl-~xc>lf8X=Ui0awAa1^*G*I7;dck`N<Czn@XjrdZ|0?9^12#rka)hIC|wQ
zmFC*D;WXaoKSr8AtdHf$L{h1?)NM|cXq7+v+)}^&t=fDz>wgcHH+}J+SRO+u6bYSW
z(GP^>A^Qf*R6_H}^8Yz3PxF6?<@KrJX`CubgIOd=X_8oiB&D-oH+04cEhjNV^N~2y
zM?a*SpjXXDZ(hN^zm>!=R(QXZSLH#HBLd6wr~fZlUi%%E*Yg+4n@3=I*M<O=*BwUi
zZ!9n2FP3LxwneE8l0w0<Op5r6<<-c_{ueB-8Nl+||ApldQD)dH3=1g7aU$7Gge37r
z$vXZI;_fS|iT3>){iF~=AP{<oP^A-!G${!|Kq=Bxx&i6EDxgS6D4};nx^y2QbOc2V
zMa4oD6%>^YA}9hPAjlh^-|v0*f3LmQ+K2mK&gSHvS#z&h*L7dtk73w_)*R(*9~))~
zx874h9l{?&6I4-eI1HQqM6rbR$ei;!Vf;7=9f+%LXNOmV=WJgJPxHtlB?tI8C_4AB
z;4JAtJHxyB*{130vh$b;*rPwRg$Ts~?A8|c8FhX~4l<qICjI1~idDjM<_<GXWi<VY
zAh(*66*}nm!b^nmESXKRI)rmb<XyvYV<+|i71)7&hcyfy%g|rXQuPp=xU2e1q_4wZ
z2AjKaZwK3YRw0mOeY6VZ3qJGtkB?2#V8>*?m}a$1)j271wJ^rX_%=nw?%tWXE^IYc
zd|3FsO;ERV(*>&ew|Ig8v*cPA<oWif*?N{%QN7ATgDoO^KXdkK+x0s7XHRK2(>#iJ
zvHJV`bGdJrY9@&>-N~&tU|}(|Echq7g69uL9Id%>z)372>bdtpuwWL@yIC<Q5JMLF
z8HW}B)_sF@DGao)?GkZwg$)TCB0wB2z<p4ZJc}&s&K3c_nVcmCl5xp~_d$>DJa){_
zysW}9hS+RLW;<9g&<WtuI)-vl;)zuBd{n+V^@m)XLNMWtAWXl%IuYXl@;F!pF?E`P
z1^q~AafYCK;$4qK5k3ql5IdqNHtWhAGk%D89}|OJnm^oB<Xe#|1XSG!5s<^?nU$kA
z3~Sl-H_<EaMI?n(ACo973@`TB5Idn6B2b+0u><ZHfHE0(<-lf#+(7s-HhMQmc(-`A
z&9#EX&ut9-tg=rnY$)Tbt7_gKiW_RtIt|VBBPR!%uRq(>@74}afcRPw9Rbx)U^R93
zTD$>K_Dn2ogJEFv5_6a=9ubps*^*YPg^)r<mfS<mS}_t|)jsw@sz4nHpRjzM**8qj
z@{T&4ZW**bR#|tj6t!(9NiVX)<xSJMTy0>Itmhvnz9k99{qv^9m7o%tL@W&o_Y{^`
zdul(1=k0d#R=TvQ_SelznkrL0$f3J=eRMZ3TgN=*MG)&&?SI_7>|H5(&ZNJo1k(im
z+c@3LqdXB7?>d7jGjqQ|ck@iYJlnNSBd%=y*UdX4@XV3!<_&gKD{*6AA6ASXT2HRf
z-8|eQ{0u@oLoeG}WP}A*MY)^RIkDxOgo4+)!(qXnnw`^MS0E+4o(8@^Vh^HLUT~1I
z{B;qwS^deUs(-M=p^+R7awW)%cM`Am;nBU#{laS|q=+RVv`>NoFDgi)9cP%MSLPi>
zjzF0P>{iW10RGP23Dw+gW>KJ$-{D@&z~}j$?!fU&L@TtIi;zFVH5A2?VNpAgB@#V~
z=tDexNb;_)Vjxb;N_(#wQ^z5#wu(|7M?X?fD62Sksl3j7ev+e58u?f+IA&aD0{AJ{
zv#8i~%u@T3gf&D$7GOlboQq5jb|P@;?`oNmra@byq8<me9i7(_3>7t?9R8a^b3aB>
zXbY4znYwDp9S0X&e^T{W|1_%?L!-!@4zx7rQLj&P4{OF{VLO6J%ezXUd;~=uZR?hn
z<`m&#j~2?5i``)UsMK`YVq%Ape|#yca4n>jVV{bvPgl38**V5?u=d3;hA9d5-tYYJ
zQ{sCU%YF2!#K`-3SnOh`!XJwcZ!w~pBlj9}s2vzPPuR|Q#3*xNn(g+PTF|}u86O}N
zN%7q{U;Hy(%>OPKs#n3-!CIYVkfJqG7dW26d&ZpUiB%>(f5GU0T_bMu!Mh`^`Mb5=
zD%JBFqnbRXINV#9ylI-CTkA<C_5COP(hm1mCm3&kJBgwmK!OI5IM#nksD{4sO#@?X
z{H0%)uH>B-!W)9#8A(_4Kd8zUlc}@<C6J)uknWUDQRG3+b1Vy!=%1J83pQ9TK{)md
zp!qN`WYSFqQg8M_qALo?ioV{^Z*?{MHS+;zGcF^0G4a?C2UW?y08gAmqdj?uT<62$
ze^o6hW4}X_bDH6)QUCZ&Dg6=HA%zI1LD`)>s8>Jw$8W}<`)a3~e~9T=P^cFQ+UD*z
zt!8<d-4h)a8RwC@uyG(e?ed3nJj!1H+AUqwX+ks+`Ka{K^{(Ljw~<p0lOQHM5#J24
z>C%-OPZHLw7G+o~RsnG(80W+g6}J+PxjI6sHA?brKZbXk;vgLPeK&*>W=|jQkO+F8
zdUKAiq?r;JiWKRDo((MK%%+0*@5|h)p4aQP<WBtVUHh5AJH(5uVPKVgz4&=iRFV$s
zm42I9`cv`j${F+p@3r?5=dK=L6(SwtS$^+k?_E3oPFtC_x3gw;JlAOd9at27*N-CP
z-&IFUqqWy0NHfi!AA-lR@}@G|UUo_`nnaftMw3mjHVW!zB`-2~_Ky|QT(zWUMI<kd
zZQe%BVvxPu3g#ZEU=@z4JB_*$j@lZF0K3J**hzF^Z&B04v>^UOR6O_&$pu1&xt%z`
zlC32;rTN$c^V#JWSoO5XcvGVB6!(9XJ%EX>?9BtLXSL8ctbvYL=m!ZY_d(9+$OP9Y
zsX02dXJu5>%wSo;K$vA-tAO!B(UJ?CMPrbN1?YvSztG;L!erxC7do`}%?fsH2N%gj
zA(Fgeq9~LpuIv9odlSd!(Jm44U_+M_dwM0D%V`W;RG*@XInNfx2rnSW6DYUnSRNl&
z*(&;8WNO1y>Y1EWhSpT7R$BWW=N5*gt1#_>7K{G*wBEfm8ee+9R{EfQ`qQZNp~CbR
zUFol;(#dyNPy4VRp~>uG<b#lmsVLNId-kcqjFG(z&Q=6?5&Ec*9f$IQsjwW}M8Wa#
zJJM*4RY|TNnIL!aY*f}?WzP^1CY8odSN7sP)~7B(?yweZ`fxF5G;`T;xMjnABgZLO
z9MK|;yWrjmwrT?YDU^c4VB*Jur<d5?0WirBXzT*r%w$tWs{l-Fmd&SA=dW<?<V+<x
zI!~avj<rz1D-Qh~;Dcq!J(^UUN#1k~n{ow%%@x!s-w=~#@EVF)nHIy*k38U1<cu!(
zlyl`xn4>tI*rPuw$xuX_q0<w+2#7nf%JMWc`#;3q8d_D|irIZ%VGpmFjrNDN<mtSD
z?JoRP_I5AhBfAY1ZJAaK)u1hTqZ1I%iYz@8o^vw40FbhezWw0`%hfUZtea{X7k+dM
zuL?QG(P_Fyld}-l*f+*cOtQ69z!br<LJ~!@(xGWwcx_o!@UOqh9+DHcZdkneud*jv
zUrhJ=`bZc{8hjzqS)B$yAj=gxl#Z*!^;H?{%-+_lW<lC$(6(8`j%UwwK;0+Qjr?UT
z{xW;w#c#JtuL8Ou)rwg+i~lqipGt|~xvEggP)^&H=WJJa7G3_F9~`(NYJw`iT4AYP
zQK9Hlih3b*GzOMI!Na61#J9mE$zb0|#`0$H`w6fBLh1-ph|Dc>>Htp=4AA6=UbLzR
zqVf+)rYJ;Vw>$3uuOXK0Vo7(VF+rGvJ4KuF-QpG394h`2d$Y`n7+m}pX56d?yH3sU
z9J7ECq)%M+!%d}wv1@c<&q~Me`TSpEFFrEUz)ohDPVCKlxSo~m7!xN)SF078&WU?1
z@ZhV*YJja8qctNjOhr0BxT)1jV(01rT1v4(#qRih{qxWah?r`%4eEmo$@eBob&uTZ
zm9fQ{Q~VD*#wRON=bs_5yVWuO)WO3iDgQLQ|A%_;PqV<iR-JovUvI+0>v=(Hcco#u
zIJ#`nFihG|IiegSexW_4;lS<Q3OYp@iUhYZtYn)4U}V1lI68!t7Q>pwgDwbRg^?O&
z4@7`4)<s9^atw8~h`RQGy6DKXF;G7z(6ppNU3YBSjcHnpQF<!ZbSNjXchCe}qej!t
z962_B1~I*hVWl-U)3DST8WQxoX^hs4GNVGwykNyG(<)RBUZ{u})d^^1ccK<GQv+vP
z=%CzE5o2dvi;|$QkRW*FpjpC+s&s7IWK_|*yvAzM+@$=w?G=05(g9M88L@bPBmgWI
z=>D+XUuG|GtbMTvQM8Gqja{OJAXl;xPFQFlfvTNG{qRo+)~WNkSo=~D!ep~!g<zsg
zgX6|vBM0DQ?ENt!n8yir&#FMriV5`u-ZIv>B+$89WLoXhNqHz3e~p#nDm9SSd4-F4
zB?Rs?+mKt#XcBTi+Kj4cMwNGOC){gW7AQ_}dN7EiX82RH%&1q4sQLH0UpjV6VyT{1
zu#$Tn4Rl{`3rUuLu!3U#hPqsPs)rWex%A*cpnO}NQ+JdTvkZXvJgZuP#xFhq=lVM!
ze<NkG5s&<-FTt3>W5M2sZas?!3i6vs4r6M%RX4E}%p@N|AUs^jW<0t8qXANiDCiw0
zs(5wb{O`y2+1t)~G+ll9a9IwydVqwlH^TxPCQwkh503%eK9EA&yIDy~Lt2zm+so9x
znQN@#3y-;U`<p|d2ZAlkulha}GfK|%w}-Y2%b{^J)>i`H$%BS<pkcka5wKxeN28T#
ztQaA1^4ET2T><U<d!JM98Koxzx$-nbJt$WR`^sV<X7GPvc?6-S?z&GsoS%AKf9g~6
z)UW4hz|7O2!>1ua&%$({ML0jZa{XCU$+MWAXV+(*@md=@rYPNwLc2{3f-7a@p!Lbe
z><zsS&XZfu*y;|sTs5%_;7b=mKRy_W7h=wJ9(r_^aHB_PL1(aFwn4PL0UR~}0yj>`
zwN;q&=_#P!tr;p~9)oROsHVRFRlW$jz}F&#Zqt?NeAQU{D(Zo5W52))+`S&T9%_>=
z-_HA2BQr0XU%i?rp^i4Zddfch?mBf^h;L?Qc==#Bj*jKM>Yi*Eeg=|SSs(twGW>RC
z<kP{(tPnj%cVtaLXe)q<1A57B{lA^5M*)0*@Ywj;=)SHH+<$B(n~%kUO8GH{EFF91
zHZtGC;9<t+hi(OBj3>2>vuuoWxd`!m9Nt^!l?t5LVd0aF9X_EqvEV;Ce>iddczj~Q
z{B?}m>*4g*7?(cS@ayP1ujN=KuZm3ynNRBJ3AO-;7IgPUz>746wz1|>tBsd77H>>T
zC)>uw3qA}xZGsO%j1t+I^R~b)vBP7VZ`>67<8g0|qu)-Hyd@~UbvzQZSPf%(*{AC~
zcq2a1OK}+U>fQCZcS6H`@h<O3EoyS=C(=Jog@YSy^;&h;r}AB<Z^lj+W=uybPT&4G
zU3N5Gu`yLF+>$5!z7{#?R{;yin9|A_tUG#d#|I9HZE^w-X~+*<r5_$x&`BjG-0b9@
z0J9UowAcCJY3xkh#}AK@&HWZLLxJyS2Hsz+$3+7(93MwM9Du7DsUKqc-yI))oIM)5
zzxA#?@YP)Gr`3%&A8e=A<x)PCev)HB7KF6SNPpA_^?i%{Jj{Yj$^V@AGAgI>GgyE2
zCjz-6JiGSb1+;gTC5Q_976#882KqlCS(^`CjCU<K=^__5wSQahaob1g%LDMAk8{$Q
zpAM0Y1+$-9LK>Y=Q1%=1s((JpQX3V%&13WzK-cE<i{}(o&P!1jpy}_HQnSZU3x;Kj
zY=JMlOW%GVFP;@y+IqE^v$3cQEZLM%>9XFvjRjeD{D;z|uQ7A4IG9uN7u?I1&y{|R
zrVY4JmqYYhw=&)ZiLCsLk=OgSB+G6~@?ZJtcsu@~9`4&pLS~bt$m;iFm(|pu)%&E?
zv@&Ye&G8sItw&l)6q%0wvs!ec$ujUu@t-e`&8TITtKp}<D7sBnl&$^KyVme&jU#AH
zA%2aj|FzxqYbSNl0r{0*?CX7{g*F1@5zy>_S+BC9KEkX!5Rfa^ne;KOxtR4xOluWt
zqnrv)4PkW%VS4m!h2D^gQ+WM>y7(Lm0%n1}KTSMX5SR#AiechHfdCBi$!oC5AgTfy
z;AU>t!h)CqkOVV?t$9=f{eAcBcTfgMID{1g0L<A8bJS&eql&xlE8Dr*c?<|yu_5sR
zSP!CBp}wC?+x+s+`blQUACVS7d2|*4evVMZACD>@vnbGufbU#?*oge#Fkt5j-ad#0
zLuL`HF-+%aj4L--bFCOiXx8NyKUNNYKrc~8vETP^us#Zbc@q(5<5-o?QJ<rka+{f+
zQhzurGcC%ore-sA5vbCas4nF{SH^y>6>YVJ!1jZXk=YFO1ZvkNLqIk?1PXpW1op&|
zD*t)w>w}*wXclrDYdvbcDtk9K1ST2B>Xo%?afy*5dvoal2xhgT+q9rnzRljUT^{#I
zUKy&EMwgmEi~ul;X8mUrppRXQT2alv|3F`&2GBN_EVoVrbZP_uLSWa&K=5YzMghWv
zuwEhpkP2W)4i2Dq>3&nnV*o+~z*gIcV|wBNh8dXMTzn7WMEznTKmdA60R6qb8R!`W
zFTRJa82}7c+x(c{$k~Gx0z?o1I02Nf&ZhRoF#=9s7^Q%MFO(n|VJAwoG;xDa03s4{
z>O?>v00nb#_e2l?2q4JnC^)+?`+u-JixTa~Z|(fz2?iCoL{=%s$yMv>GX+YX?<c?5
z)?3$D);PXdJKx~Y5w!F^^6t4Zw<noWPH!75&H%=bJX8p_eGV(B04gGAl728qa5hRC
zft?|B0nMv$>`=EE5Wr=AbDbj-#uhR=<lamnky%x_))^`+Pcyz9w9Y1=U<qVFKFX<I
zEHwVx7`nD}{N|q2s_V*iAY0NNdf%Iihsf#GRnb9m2mn?w`?;^4<(#;fB$Fd<%#sPx
zEl0&feDQ!|LI%g?Y8Y6&-!yrD{?u@;>BrJ&-KEceVh{I!eqZ^_MMr5NTo~F%`%|VM
z_7Q&?nuQPJ)71M%RfZY3J|xbZG@^ZnSonhcrIlO+pf!1fA{5EYY5+}rl4a{_T6lsM
z4O{5p^i_yiCM2*Wyn(-gj_RGUZ2XJrF*vh=pS6*V*-g<Rqd&$f)(}N-^~~#Bi-TMj
zt2Y&8hfl$iKrr=fbM>pFCIgKR5!)783;E%eI*$=z7P{M$+d}NxI;JhR)YT{qAd$s;
zXO5Ye-NkB<0+GIC2DhRuGzvMtJY<%p<;@Am_(YIdX|k*Bw=h0fAy{R@4-i?sc<CgW
z&v686$;7do04m%Le?H1m^aMr-tZ%3|Bbr)|W}?1KyJ)EwsBXuOk+@(^w#>eAE}+db
zcv$D*&t0dG0q(0azyG}6b&eR=GRwUsNvW8GNb2kg!PyzsOVj|<WhpVhbgKqAaqaE|
z4!P+DEOvn^QVLD=WLj7Ol$SK0z23@sF|Lt&T7p}i7pX?0b6!+A7SfwqB3r*(JP8WI
zPLra}7tWC_DZDDnu0`0Ih-<su(m~I;V|*&pG!A_JygG{ZtsU+ADuoVQt>Hc9`w9Rs
zx8(^tWyxQPL&~Q^=2rO`Feu|fxwB8700`qV#;A*k{yD%oH@>k#e6_4l4RF<{CqtCx
zYBPIA;_rZ*!_<brfJRkUysPnTV!ZbVs08V(vH7kDB7;4h4U^U~;Sdem{@P3u;rkw5
zv`iJ$KuA6Bmn<Bed$UDjtTSaF7{OKmW&5?=zVok<0=|oR7jHx_=UjLYwc5g+Q$hAv
zcLKe=^7S`VKycNG@bExCn(I3#iZEp%vU&|z%S)*UX8e(KjOIS>a5)X2_Gs!qPAd+r
zWj(142Gg)Jj^y}W{)&sY?6IFEvy07onu0kuUu#2i?)8lg#%{MgJ^qadNs_lFH~?t4
z)@I$~a0)&gQr}-qV~-y*I+t`!$8|d(3NN&5mHZ?66HBa*G&>6x?y3e?lJiD|ys9MW
zetE*qmdo-)*og1f`;?RGCV6a>5$RETcU)QM>5+A03Kg}0^THVwng2jPs<5_b*yC_(
z{~?sxj0Ms5@VXD`l1?pN7CqWC(ci^nk?q*D&>WJ6TOK^Q_LJcp&qcUhXgOKck`B9Y
zQ}e%A-p)<5{QjBJivE;}5+*vV7oU^es*p>mlyhNfFAuS~*;ehTxUum3;<C-Hhl`%d
z;}K_^V77$=lG4^8U(7tDZEwHykjA9#oBJ4VXFc;+M(-cfh%gKq$3U0$TF>Z3oS_wG
zbG~E*UsYmO2QpyV5Dk8-uI9h8-WZow>R(uI_VOdGJ}5n3-)-^^le;dS^8rPH!GoCk
zX6LqA&At`Ic*kebW0h_6FRWLgKKK{b1F9na!g>|O7F;21WL*L<@PY@zI(C*!hxPb7
zX!ifYdb4WZ=^HbUE#mCa4s_FDy~8V+t}GqtaW7Xv-!6>PXF4ivYy8eH8ClmK{Dt-E
zaq5f{W!*cO7#wgGnVSxD?$oHYI9d#Zkq&EYIQSx;s7d~~O>sc;_iK^m)8!gZ3lr|b
z*#Cv~&Ul@7vgz=<Ec|=wc%N{-1=5=2_gB^nktpZ%AxaVoi~lR@Y21JRhIG9{dgec}
z-ZmZ9^ZpmstIqrj>tS6?RGXccO6FMF6zQ-Yz}HgrA6PGGDy`KrBjaCKFGPafh>&YY
zp?UuY)@x?q4@%JpNn(&366m1AdX#@*z3T4Ui6H`;lbsr8zz<`wP4236SZ~(#LfYqf
z)v15db?f3ujo*WWX%peISRkh;pp%c;fyLW?z$zyo5o8p9s7R<S;S>d+o2pp=ng&oN
zeL=h9MLypEaiu)CdBgl+s02S!_Y1)HmYD&-f<*7o!r*i~it89Ke=hYLWVgP^VhYrO
z3%3+7m`Tv2l(B#!T=PXyIwyP<z}0S=dE~L5;GL~8c2R+3lWAZyp%)OLfs_7OIuv;(
zi5H=1Ty|eLDt#l#hMCoF#n53rK-+ZJ7xt}k{x7VDR|57Bt-xRmpA+w=kUG61-?#|-
z*X!&mf&o{VI6j~+db|J@WC$77LKRP(V^!=u`-vc*vqGaSE$$5}6FS!cfS1n&Bm{MT
zHb-JJR-!;yniq3<5<p-rkXG-QmXPx_z(*rqvz75w440sV-e!iys076z(FI;3lvEu}
zU|O9hI3Fd-vWA`L=xXQXy93W|FI=%;;A=l-)}!Q1#IWjX?E~VQ<#63pU`h*3gH!m<
zXvPQGKQ@{&5jk0=h4jl#?)j(k+n$3ec8Ot%CQ!n;e&!n~Uiri6w+x}7egtz)=cRmx
zg0_|g><l#j)uiMPxv$)}GZwwgPQ7n2#^R_OU9J5dU<VCK#(9#jofTX%Ov5rm4*HIV
z6_7}N!3)Kv>%_ivSdIK63e3p0GF-hSeIn5}sMH)pb~fx~s3#3Bnc1-a>c7Sqg)zT!
z`Acr`mj!X}>kH*)wgzw2z^{}IcMGG_LG6J64_`QLS;v2}4Bv6`xgn&a0dSk*i)2M%
zh4ndZGwN2TdnzuB^JnjfpZ?&-^Yxf_a@bGmpKxhf@{M=S>Kwlrb$_B?x<Q<!;^RR*
zSzeJSA|&LfrLuSsG{nnC8_h{)OYi{t$SIUyC?^iecYmg#ZSZ#i$1TKwz=`be<!LZr
zU~&VScJ=!4k+Rv)YlE^Vm||W6tf=(m%bthL02B-OM<v0)j~uI*LNO;FZi<LnJ+e?C
zLYiUeAxuU1R)~MbN7L*ZeR|RlHE-TdbPg3_-_DaL(ovL$KYdPl(3Jq@V;w<vB?H9e
z1>`EH#{JYn*3GgP%`LZbn_StGvp`*DL&%_d5^#!ssh}2Fj<u7s;DTf=&3;aWye{Z1
zj)X2$vKp!@p95Ip#2y24kB_h6wOFc8x#2-y{ss1c60m6(bW-;t7+|+;*_)Qj07QrB
zz}{-(t=Yf8-d1*-T5}6SHjsyA5o%EXs7eg4Cxc}G#tML;3(!Z)R)GO7A%KwxoHm8!
z`2gi>`J^aO#wnn#HFvtJku(L(l576uOJt=GLG}YAg8mA*cZc&7Gy1Lr@g4-rWO@pc
z`>(HO+9HraFQNYR^{Q&~Qmmbc2%D31U(aKm7C`s)Hbt1Ty9z$=-tq%ytkQpaX{Yh&
zvekG{=z!LY$ql<QVDMRSR1zG+l*<9SNg>YDh<|;(u7uYA_<GpPMg-<Ke+@V(2>3-a
zg%$!NUE(mdUn`B{bKl)Wi6)U#XGYY3&@kpl@MeN~JK#j5c-&6wJDD3MIii*VkceQu
zGVi~*-d#rf$4lF|l~di;1ayfFK$=a8|BLJ0o!JDDjEMN|`?uRGJ`Bi0fx5ydQN(86
z^z(ueffQyfB4?WZFB~74c2Xasmj}J~7uV}DBnGg>uAB6(n}zK^>uF~SDrB&$=qJy@
zE@I4E07hrN#M5mmLVPtORI)?;DQBxnrG|%v%`g$&<d<A&9wCV_Gbs-C^=c%hL7}Ew
zQLu}vuTIXZuv3_Wx}Z2d1_5^18B{_`43oc)1>`Q|m?cDYklFm_l-Xll%f%8-nxv)Z
z1a?_B%>zC{^=D&5%bt%OX~T>x&RBk%$yyq;T)hkKhMa3_hABm`otc7ai=Q(~t@(ES
z++KCwcaOhV-ftG>jr4OzGw1FVj{ZJ82O!5tL+Ab|SV25fCE)S)C@WZ?6=Ollzqp<i
zqH(N|j_cJYFn+XRMULshL8i@C?84S}DPxMOR$La=n=D`kDQn)?@#<{G@-ZtqmM8e;
zF`Ul95v@fw#w#deyu>6yVH@$%23{X)Q41TsCu6)7<KnS4GD|f=rB+gnHXH?vEXa7p
zA+kLYrhH_BLE5Sa+o~$s{(oY5uT>fo6gQdVI&5&<<3c}~@OpMe7Ivpy?2H5dZ&;q$
zBRlh9JByEYmK%2Gj{e2+5-08X>}<KMqbUrgS|nbd^B4bv<&~ayY&`Gi0xHLXoEpzN
z|Hbvr6Ob3&gfF-&Ubw7y0e|%7a^xFVsd&%W3qBbad<))sWW4n%y%5lG{v>?dcH=^D
zWS-D4xtTDI%1-JXoIv^5v=&a>FuE8i%zWkOLUif7<Xl)eoK%Xw82;1jD)+l)%DXF`
zHgQW##F~p_y(vQLI~46=$=JJ%1ZX+mR0;axanMgQ3KEnOXkT7$pRi${^^vaYO`uT|
zMIrXz?Cg`?Ooe^4%zwj_cVu6f;b4H6j*xP=O&FJ$diO0qNdh@h95ubTI9+t)P(J2x
zThFn&LoC|Vsys1;6nm~HHlCq0MfT+Tjr8|-6Rofv@2fW)n@$Q`jhrAwIqtDIH5QB=
zsedR$e`pGHy3ftqp~u*%=oBC6h*ccB(c#n{OULq@LR3C<zZp#{m@;6nMhMT4Wt=mA
zIz0_^*6OwoLrx-wt&<oWAvH6kX6I)gok!kerMWn8oSv3oaAD^DSh?XmY2k868MBGC
zE-J91){MOyc6ih1@?ptIAr>Su{PDwv%kk%p_re?FvqvuTimnTKu8S6~OD?X<fvzjD
zuB#cYUrJrq8eP9Wa$O&G-T3JGZNv5Zk?SV%(huQFTZ)&q^)BsLT>9y9X*clFuh>g_
z8JG4;FC8>q`u*tA;qaxSkC*;zTsl6w1h5i7A_TA!0isWUS`rvs39ujn;|&5llfYC)
zKu`(Hy#$sK0`e1q^&5d6wuWMLV;6DbP;%qccjK~j<92o933B7T;l`Kg#$V<pKy?%B
zbrTwK6aM5T^36^3j~klRT};HCp1&`l?=ETSF6HVj9pwK1KbB{s<Y}w#X=mwq-qrI$
zkmto4p7xoZ4rO%1&eN&a(|N?x<&&rDH_uCdJPE8`ZX(N8yD-b<1ScBI-E}#Hj_bh@
zW`A+LWnVh32S<2&c?AY>UWP*?C?s1NOzkhOM>f_<G{%yB>A0Rxf(!<%nVlF|=6x8&
z=&J!%qrrk}$<CX}QC41Y=%mnHvTv8S0^k#4xw?mj`uzvj0}#jmTi06&)%Wu2geHDl
zr4oE3;1DmkZ}4Vva;=xdEHsXmB(n+*?pjIP^|}2N;ZW#hW}1+{o1A0(B^!n)8KL8P
zUIoUfA@JnusMJb*zZ&~wI<8kiVZ2O8x+b%B`_odCmA3;1B87&<QJ`gI%efjb33P%v
z{EN3S!k0C%!k)3&6+y@KsH}8cZ`rwU`9{5;3mw;^!4%+-3V2deCdqpjM!Csw<pRQz
zj_biwZLI=oXX&`!a*+n)ay_HY7^LUz5*^pOr9t*COTJdSOxaBiu>$MSl0q&Z!U~r|
zfYi`luQ)i&Oe^s%9oNfdaL2&RXs~1V?8K|Ir2EDYhgn94?3Kr58}EBJW<G7aGWN9Q
z^OhjM)F`C)H+=o*x*mXV#enrH68%OJs)u~&xSsDwkO9`$b(67^UP6?HnPI<NYxa-R
z3ihKP2ru)R3i@V!Gbo=m@jfiLf({;1pqZ?xt-ZeaS0G+mhzs>TaXulMV_$-wCT;x1
z^@0sIH+F9%8}oe)p#;-$y_`%i;&_?4e3@l5=tyKKuQ!P1wG!2pXjB2w93z{~u0@ae
zg)V=AYo<m4Uqfr@xZXNO=9{l{@=q#bN)lbYqvLwPsPBy8nqd;yE#C`U+$TJPjeVtP
zNy+rJ{8>}7@-~q1KQ7z-S{1c=|6g727u83B5*}>-y~5|abX?en&aawT;o5cE3h%a>
z-a^9Q+fBy4X0vo$&)?5DysG}I@6&)d)K~b4ATO;@srqo~t6?(t{m=YjJbQn~fN`hE
zD~W*KF+BD%?4sj(tG-@4l|ZQUUtG^iC(2)Km9evTM{32-Vssl-9!cqpbUv|SCAvh%
z^*qj9F+(Rup_8>_A~exSW6Mwn(_LfJ)a?u4Iv65g73?_r&G}gbHE7*}?MK1x6$<RC
zyYiLubX+f+!Ep#G@QZ9pND9$n_+I8EY4!D=uH?WvM4b1pi%*k$FOXEd6aDTdgw~S%
z2$5kU!N>7gdj<ND`TB`gRy)bJqEb#orIs(tz>@}Rm!G_iivP9cXb_#>6uB-E=4VW5
zla4MlKv-6+7G_2lE2myXCl`N?F8dx`ejHu#E0vDx-I+~(XpE?2Ouc5cRc(@b=h=R(
za%vshfvwl-duckZ7gb5e^(aufeAxW$pc)HN<3p%jB>8Km(s8{zQOQMh2bMhkfI%>~
zL8`5Nh#CzXwwnA<^mi*8qW>+Kp!J<WIkiI+VK5fi_1)wD;CgUPI<B{;@qgiZK9XHO
zM}9GenMP=i?Z?h0$TTM??Om%t2N>*aI?MPPP*&-<UNjxot4KJOnN5hrBz6DQ^{z|J
zCR|5DrB=bzKL;{XM^CPLG`)p2Jf`b<-VRuje_XI81xjuDB|{@QP5s$_3U*ipKkiMW
z{_=Z!X)AR(;i2@kxRIE+O)s<6O(!&C@J$9()2|}^#QQgr>DshJiUL2=@^^H90)kgH
zV0BY$kiv1ororcj_|tR&&9L>=9}+{^;wHHYzFU(28_V-F3ousLR|yL)VmGL3Cj2nT
zE-|=aEWXdYAiX+v-S|~W*yY7i5h=!kLI<A)>-^h)#_VFf7wxR?9_6q8STR}ClSp8F
z@R#9ZcP;TM<A84~ed>w%wYBl}m+~x)#K@@>aJ<)invU(|BfX5+>W1_K#ijh(!+L6R
zw4YQ-yb*nqaQ_u>-jUmaFK)4yCquO$)1lp1Rd~J9L#@*oFR@~{{#$c%wm+FuIp|Pp
zYw`JtfY@@=rv+bo0gI7~-K*AjZa&1&GqgW9-VVPf?tDL=+j;FqwzH?OaZiqu7jx}W
zL^c6q<}$>u)-QXJ>yfM`I-Wrw3Qb~?>q3)XG}aF4Gd`~zwE1ezbLYyGOEQwjIAU%_
z??ECvEE+yOKY97ro*FXoWW487im`g7dz8lhRV!V~k33w?SwCK*{|A<r;E<e?%5-{l
zEZ0(XXAx&DXS9SnIxLj@f5q~O10U>5mxR91K2aL^KKevi^ji0c^4Np@6BY3Y9hp0c
z0x>d`DRKuk1_!g`EZwcHff4PM>)RF@<3?@fDv!C^(rc$Z!hLJLbxDj?9qhEp+-rPr
zAlKl!CNZjg`^rJ8Y?+p-si=Q;-xKb0k~xE@C#=_=a65<KVEq2G@g}0NEUgrYOoGjZ
zc+c*Sb%EYLi1p?t0>6z~hv!u&9ko5~W-8+z;dE4QP)GUE&-d59o9uOM536=Au9-Id
z7u6GMlqjqJdiUXGB^}knoJ^&odiD>#D0i(rFm3W+ao+4pBe)|TPB%*^_sZTo?ooXi
z^J1V$@xd<cDK}mh2NPj>y!BG``wPw%QrlYri>Iou1Jp)zc=Iw&-RnG5pR_hBoqhSF
zhjgY15}wm`LaMx^wii<j#_$j1jx$O(acx_?wte^)%e$X2s{OKO9xmd{($XPOduTYU
zE%W_u)~V@3RSgl(OF3=tKf{$Y7jw)+q77EKF26u~8nhUHetcbG^xod}@b15;-r#f@
zS2*if-ormS>kX-Y(oRH`jO@#gH!rBaJnG^c{^&2+q9xtwu^qMkT>kN4@i&FbXGQzw
zt*>kBcIlsz?lg!`KJl_^KzDC0El%>(V}iIYZ(2{-;ohIwyy1_YP4Ul_SK5!`4F2pN
z@Ak?@RahQtN7Wf5*o|EG93ab9#`l0!o8wuznDkTU;7XEr*uMIIga}S#1@~0aTTCR0
z8=wa)xy=dEb`<@}c%~x7dEU>b#7-}Y^?A673-Bd~v4+>{M)w#-#WpjXf^l`;@O{Pk
z?#0{oh8j%dw75WkQ$@*)TbjP48?rX)4r^Qell$EZ-0Itdnwbl%ep6t75y5`$+}h^I
zX_8w}s&QR_8*_%Dcqqi|vZ(Hlw19Lg%g>vGt>)~5iX5%kyZy<$-GK4@l!U<8Yp1o{
z)l9)Kqe~vIL?jtQ`?N|2xL&9-a3SwLaa`}yx>=YcLk?#(k?dpN<z!_%uDZ&=y!Aur
z@z+azLLejh&79}#jreT4Py6<u;qmCq%kVjRRG74&|13#S#+UE<p*!llIYDN7KGU55
zwm->LQFQQw*-Mdp+u=HhCs8d+sjv;RRp_8jBC|O~y<&ekBu!XUd4jn4+T!!-Tlo(T
zhSBY_=ounZ76oQCtslT#)P`$##AhTZyiWMqRiCH?wv1bcn6afW8teUoveoV5VVQe&
z6FX6zS#p{E49y55RVkNAlaM^3Br)Q&D>8Jdv-o76a%04X^H(p|v&yaoXUkd5@6E##
zoD%gL(3#}FupTB|#^VR;jUDNejM|A8%?f!8vVV%7b)ZNos2u0mW}ig73V}bX7^2I1
zAQ?0hSw*fJ?z1&1=IH}s(xA(FJJv!o*dbwb4*Rve39ci|7n7bAo12sc2F?@)q}D{%
z_Ll{2_PY$GT|dAaKJ#J~78HT^C_cpocd=?ZtjGG$ZjMNXTKdT7mV}_L`t*rvV_1}%
zQ7JcOB-jZ!cz}6S)+k}I;o{jZMu(dhl1!P!tC^mAsN`nINAXB(!Pkwizo6KNNVd#<
zl;_=aVArddkSfS<Gx>A3fs%lI#N&(i6}I`DAoEkXArOxAIOQ}yi)WTtPv$<%nf<&d
z!O~+!wZEN~agQLu)v9HR5nxa0IUw`i@PVr3Z)KVu8;Oe^nfhPbcS~V65jXrXOOGVa
zL48s6NM-L<$|NXUj+?>rKtL~Khu9GYQDmX}g)lK%Yi4`z0@~PkD|8!2&o8zY``l%S
zmFUmF67L|{e+L;3vcnbIajr!nhWrAlS*M6qEEi}ditj7lfBYmijC=%<P<LY(`*erL
zvnz>P0KtBZrPAKP(iFpy17GnF7h!ZuQrQ(tV}mRS2Ms+rwH)teIOZ<;qw9&R2aaVe
z%7{Nui{yEPL&*DxyB`ptMQkrA8g}AhwMqjj{4Jh}@Gh}TJ}|#XC0pp=1>vpKCm6Z8
zgmXd(T%Iy`#hr0jsIHUi8hnub#dXx7^x*OIn8=luALDG=zrkW_GGxxP@_~N0`g+;N
z6O^MG6T{f>%#M6dahujmiaiw_YxUbFQ5>@%-Z~Z>oTLs0Wnt~a@ATdwE4(!ncBl74
z*^P%11mY7+cM>>!_&Q=~sYugeY2FxsStH%4rl#<a>kvL5n|>!De<DiESxX%sa=2AE
zS|aL`tt9ZtFG;4kpRJFO#4&>n4VZxldW}7;%Il4Y>%y_U3L)coT9cx-Zhd8De}?!r
zn|4InN3YrA1h3=3k(2Wb9bI^@C3dhtwmZWb%0$tSn626~%V45KGWdoCD`tyB58&~f
z2RER}CJ6%0Loj>~J3}zxa%KLp)jfk(#0=X(F`-xXCi*)l2DPz1{T>V?e?YA2S;C#?
zsy`nXUT*;#U+-_Nu83D|pl4TO#NqG8p4iolUrQJ&+r2pqLV!b)?->sA_(xGxGf^b8
zkQmP&9|+=wm3Lgd7-P$rzW(x`6bZh5QA;0)rhB|<kZASq&yVptb(dn}2Cw~Myn`$M
zC~`v}{qbQ_F#Ml0m-zYke0{-8LwEzLawRCp?hzI}31$L@Y3wthLa)z8k!us7212|n
zio8!xg0-9TII2(QJtxHy`ivS&H1{Bigio?Yx7iyA%<d45#eV0S3J3FBhC7^w)nkUU
ze8~3%-gM`4d*nBspAuD$A=(%SPd!C6q)-rBYJj=JDFD&9ZY=I095>y6*C>@&2h2}%
zjsAJlAX_+UAJQodMbty?-4)XuDplVjOAo!AlNyW?<C&$idMr0}6a*z@-Wu(Ye=5*f
zJ&@GYzpP#q{ydb<>KVcW+^$&*i)|W8cj2_ElQ<g4qIM2!F=8?=AbhERSv~hhbXE@}
zt59yx0A|8~d61Cpf_Yhy&)-sR8tvKP*WY!1;n7+p%~)_t&fxZB$wL3|e9kfa+I$If
zFn|$(DvKDQr$jX?Xt-4e6_EwQS7&96U&ts8&To7;S^a_3@*a~-`=|NsRBXThT(N;U
znxQDA?g@SUM)6Wc?z&0|jAtnd*<?{7ELkYQL#7Wwoxv@Ft@j3)1*#3uk}44(Wg`#c
zB{U+kN;ApLaCQoBEUDZuAe-$t=2_-q;pVV6P}!2mrHVhJ^uAgcD(oX>I7MoGwP^m<
zoa2yW2*nvDmiOeB?!PJ0Z*XBN;rX_|h?^8M#PkcJdC--_Q_!2-A$Tc3+@yyrC4)26
zAW2D*p7=t<(73n4Zh`iOMlihA;pKA?^M*r`7H=i{W<3lCZyLyuJs)8Ov%#|MZ=D@+
zaIF#r@dW3In&2m5TGfswMiRgG2QUrTX!fd4&)xWi2IY2Wh#{Weie8ru7Z%JHaC^sw
zUi)~(MeLr-We+*1Q>RpOPmQ5ayqzCdQwxWF<si5o-zp4+Q0Zixl&txiQ@f7(H=t~m
zMsc1AN^(Y*&J2FJ9nWt?5%l0SnO%7Dqso9}>^KNf^I>qfYpSosYj}g3MZ`mLkj$a(
zpgRdMoOCv?tZki=bWWAbOs_M@uTv@P)2A4Qcdb-4E~=h(yCE`I>4xVub;MZ>qNDo3
z9duKVyz?giTqeK%W{nP(Zt6iaE2^vyAT}DsL8sHB_sO<~HFh>N#y#Z7hNoE#5DqNG
zV7*X5DA7Q@Khc3PMSI%e0Ph$hZp5_;{z;Us$A8`*XxoP*9^h&Fcqz>B=Sw2ctb^4b
z?6q!TM$FKX9?9C778khW>SaGekEeI`9nfk?#DahNa7K53n^qnDgfNBR4SYb7>Czq?
z_3@<3{=L#FdM}tw$;v%|KE@E<K+?&k+1(w0_bmipF;aQOd%EYQvtPmoF{pl*#L?26
zaRXU!6>a2k$LJNrvt&&FfUK~yU~u;IUskVuQ7;O{V^3%G`fxV=7yo7T{^|5frn7p5
zIGjzj(W;Me<|iEVU1Q9EzSe08n#>I<<wk2F$Kitds<(j_gV-MKG%le^{a;hhr@!=o
zJaebifXfSx=@<EH>R~&>zVeHB(oH?|e@(sP0TFd6U80ZFq=1QTHGf3B3_3xC;3_@i
z$7g<Pk&f!^;q|+4yyhkuwM(Wp{xVO%Ocj8n{mt`_Xb7Wa;U3z<vbUIquWEbb!Ad|v
z{jNdJEfXvl(N43Gmd;MXvSJO-d)_VF1)ePf!JQzcsgEz828jHl@bc`!18S;t0>HEg
z{4>@Nl9bCCLYD5T4JwEqC&g#OaB%y0?)D2GLj#6-C77;z-3c;Mne9Wd^q)qpo!-k=
zKfK_5c8ziYT6;Dj`U;w3hWt?@p}>wQ;`aH1sYZLl1|$13pMnx<Z`<=Ot{JPR;?=pj
zw2@%P!3FA|#~TQbmVlww34PWeQ>$Z+Ev~xm(=4*D=1pIv;_ELO%)SQaP+`&3GrDID
z6|x^DHlALEz#}i7J5w((#G|`b%u|n}z4`D+I6*AnHm4~>YluI10^)U-th0l+UHbH`
zuehf`(A3mHJR%;~W1sF;SgFmZR(;;EXTZtcP~Uz|QCIAbWP@PCcQgC`g9jj1o~O?H
zI6i{N*?bVvz7K)<6#NQu<mep6^_sn%82p0zVetiw$%)lIUU?C)esKXT(g&vYU)9?H
z^-4S!>605Hdka(v-TeAFp8P)g5;F@PNTLBrMsHkPFzY3+evlWfKN&q5h!i){tzP5q
zwdaxqEA#bz64(scfoN0gzVaM52k($I4>v<+gi&ed6fw01LVXa?LG9WFxz%Z0yBJdD
zrt;7QR8+G;gW``yVAUR{kWj^wE@A3?Ck}>3eIkg7h#SHg44dEJjQY|Fs>L-_M1O_C
zTwWMK4SjVskDgx$yg4s7xZGL5@&1O2Atm&K2-LsDOA4!K+FotYvuJ#_+Q44wf(TSt
zG(psPN}sN8x)jn`y@&%9`TMHdbXE^rW;6*#&f?Jt#GgOCyw_yQsfMNV1DzVGeD@%T
zhE#p^0?8(@l+%_8P)~%BqjJ6Vvg`f!FgEA}8A(HZ6p6iLOSq|3KDkZHB=f{nkP)5L
zs|eu-#F5tn-?$!c9G+2RvT9U1VT79EG5qW5VHMGB20l0i^^MoP(x$ri9Qj-tVfT8s
z<YfdwJkC=(5p++SBpwEqySJs~-ERE(oW`5{u17@1he4+)5oRpZ0<Ah^xSf~?oiAxO
zTX<Pd8T5CEcR`$yD2x{+fXr3To!Z&K?WkM*hFJY>w_=O5X8dXWd&lbjz&VMZHYZNn
z;yVn~@oGjtZ4El?F8@3)7-^#!Y31KR=kv}Bp0tlUc`>-dwywkBUdOq#j*Id?9r7Zb
zn@(Dfo^)<IY5OqJA?u{e_D`309nNh(ozx;vSw*U`blQ1$xNvs5NbI_<M4msf>uz?1
z0J(DMamQte<4FDY1KfjlxN!VBhpE19z+MQ^mzQKvPxK8ZBKGiN4H}I3Bm<fTYLCoI
zyP{SB380VL0ib{?yev(_?_Q_x{ayd2&Vbju0p(ZxnmR)Vu7ovR3H-e4x3U}bYd4tj
zmmk~x@P`@^%J+TW?OxHm8hTALjI7CMt{L=o*KfNsxJe^~Su?t=GrIUnM6xDblaCg?
zA6s=l=A!1c;?8T{_pftm#%^B?`28zvyE8tVXy9`-ZeTYY(iLWV-?s{{=KSkg@h<u0
z{e*Y-Z;0+)y|@?SuN9wlKmJ@)g4r+9=zTIiiWH|sa?(t5(qbfZr8Heh&bpuebuXA_
z)Qm0Jx9*rIR83~B26De*b<DxJ68n<X_`EuRyP7Oyq^+QZ&*#<VHtJTxMCbAD=bYHj
zHQCS8>}IXT>2wj9R{`<r0ghFmL>Z?O0WKMcKEW4VTBR*M+0D96QrnC!t^<{yf|S0C
zE`A(cGOAtvS-ZTdyQr<Z_+57i?}O3>?UJwB<-fHn>c|!EwC@D#RDPvZD?g|yk1lH3
zzhg#M@U*K|qIK4zOZ^|*2|uW?)u~QCsBeq8d+GsmbxdhfOwD#Qb)dW9(!o8p1EqkN
zx&iHG{DbDv{i@#&>NT(36Fk+x`MZ4dp!F-QZd8YA`<q(+pj}?OR5SW^@qVG^eu2q;
z{>9_yyi*Vbk7%8M=)Ag9xxCT&^4fXfQQ5yvxfWj0f%eeYbo+RF`b2g6Py9czyq+hQ
zbf0?nJPp=;c2#$9`xJvt&SPd1H5%zzx$cX)o)=BJFYoufe60KG8J(4b46zmJ5~hb3
zO`ebb#qvgN_x-YnyoLBdQSG{Lq8e9^b_gw>xkm^ZD}XwB@{GvL7mYa7ee3<`?YZm2
zqZi;y*F%8Aw^@4APKU3r#S0ArjJn!`?`Uu8KojzMui12Gs`S`Gh`a>dH;)fQ^B;Xa
zj(uwz&qvgot4o-I=+B?{Lo+y1s)i`cK3dqO!K-O`b$Y1kW1<?`5Sfl;QSbdA8awgu
zp-|z#gk~&lAa<dc%uEEv)AYx`leqE$l==;w!+7R=fI9%M6M!$chC|rtaUWtg9ukG}
ziOhw%-|J{>3LunB@3z6?L3}2^kCM3p*_-!|n~?ra@Z+}zu>wOlWC*tSE4E1@T4&}8
z(kfmpoyKw4Hxs8nb80{-gvK$mE19qVkxtmyf*8>Qhmb)IWg+RB@EpStIPWqlbXF{J
zAS(iS*J^H7+$DqS%Y@e90BFdFm0P)1jgIA=Es%HU{2y4JZ7nPMPt@+tKBte>9efJU
z$rvtQn;NqMW19(zknP>m(=MT!+{gYG8lAeY{5;?eux~M;zkz6;K*tXM>B<7zn*(sU
z<%z&zBTpzL0&?}X(JrIuAU*9_=WF5e#!QaPsa*^2(06l#548@@BnLR@2%}fGW}7#j
z!NZragvp^C{AZ4n6GyWFmTpedZNBe1KX$I$e|#9dEzNUR)5c_+#H)EjC^~HE*%Pbo
zBO&_1Qiad`mHrbYsqDUfg~El=7rz)tNR}xD<fQT{Q(h_RPfvNUur80?GlAX<d*Jf$
z)f-f)QgdJwpP2BJxkNg|o5ek_ZQQ+>wI423vROTI^C1dP7gLk!qMN_mEq5w>o;}E6
zq09b+>zZHk6CRgp)KflByDy5z&&<PM)h;%L-ycTk%waQaw8q>plO_8q8E0$?tMyhs
zEzp>?!Da&{thvq;B^=I$i|BBjt$8+-y+6Dq_mx>lUj&C!Wi|iD>zpGu73^|GbfUu~
zgu;eeB=gHGnV#i_kbW--okHqyjT>e8)uOm(W4LU@7fSMNI{nQ5MfJowM1C(|&Bi0J
zWBlP$=|08M{N#I3WmUC~22oY{np3=Xve|!8J<#n3Q|5gP>Bc8jhXenM>g7*+iIv!n
z`{ei!vN#-y)txIl97^V8jXt%4h^`jCH4}DA9%{pCV}Hx#%F8gGPf>wqJEUS<R8OcC
zZ(7KH&f7hG_w(_sKNar0-a~o3a|xqi%gAuyZ^#d23b&JaaM6O2#q^NR!pnDy;^h-H
z9r=?Nb1g(xToTW_-d-x~muF6}aV)#-br`V0=iTtF1$yps^LP@c<-zmYtCbld@)*`2
zzWv48GnTiP>uZdo1kc+sMXfay$J(V=J<>RP^IB?K%~;d0e(^}PXlPMj{xC^uZoCr*
zyFI?%EBL+V=cnTDy+==PeS6FxTC(|gh5B%FkX!U{^NDbr^LLuqv0%;f??ENsy-K6g
z$R;nqmBQ_(H7)byH~EEsPG&JHFw}ksI!FrDtpf)|aW8UJPy1ip-5rh0y8mm&<h@Jy
z@T{RXhcHFC?Da7_x>7i5;iaK#bTm2Zs8IN-jb7Ict$obh8+#!C@>m+;2}Qf>Qu$F+
z?hWA^qc0tE9i(h!R`_HxbA%U3avh>^2MeDM4^3o&<>0t2+l!zRkyudX0&F{c;`l8$
z?Xpbv4Xz$h@EIOlq{SGKdlCJ-^;tZ%<D9}AhRm*zl>ZmjyVQ~(Mf(fu#q-LnBXq->
zTj;P}GJc<r(V5Yp(*;8s3W4o>QfJEM4iz$8By!wdl|C`TmTFTyzvUirI@0q8`x$3(
zUbn?3Z%fTnnZjWFFZYb{d_&ViR3-TIR?|;D_06>OKkZP&Zq!uL506hzwMl2kH?3d3
zPPm<P%$~o=YT(Wwf{ViO@60tvkBPBlU_MJ+o3HQSAE!Ly<2SOgdcxG_u2lB0??kEe
zi_q+ed=A4JZM)|$YP&gZ2IP+@_)lv%->|whK36jlFx_s_Ggp8|)MD-uGhI8w@@eVg
zn2Y-lE=#w?ybf4an_kxD4zZE%%TD9~e=#)_$UV`AhAL{LAkEZC+<(w84Uf5G=gk3*
z?-V1+-SI4bOY(`m$rA>zrzxgU^0K!vU;&ye_sItL%lT+yd~_uuGM=MKatF<L(?L+G
zpoaU|l&DNr%XsF*a+ML6tg#v5R^Eto4INRCvCz3wNad;u25yriBVOO`rPg>x-wn8a
zTx4B3l2ykpCwJ)RNDot$;xoqJxz<|p4R;fGz39b0OR;kbLxwzFo5@m@V{l7)xzJ`f
zQRG2thEc>DQQwmTjt^fjsX+%gXx3*9E)1pANhiYAHW_u*ty9h(REZYVCsw{9SjM5%
zjU?R5t11euYm-`p!el&c0;?+IlU}t-;oZG7nT1D3*lyp+5cfK1#xU}Bxqa<yppVIi
z_wOd8J1fpBa@Z1k?E5u@%S!`|{hi*gEMDmvL|zX5t~!~>z}s>2=kldn{aJ#RWbR_~
z7w5kl!CgJTl<=R)h-U)$FpNawr%gshpZ~?)eML3Z{`;a&LJ|@JN$6EbDAE;>CLjb*
zKu`%*M8r@;5b2_H5_**Y(osWEP<oM$CV&Wn5TpnQ8hTY}uhQA^eg9{zb;ep_opbgW
z`&^u}uja*^HyN4ZNyhVhf8WnS;w7qD%kpcmp5;QK^}-d|WsLMzkv7j^P&ieLfsfP#
zRa%CC4TN0lp?O=m;V#?Le739H6swHJ2anIZeiac4c5mXl?1kf%Qgn=bUpa|-V5umE
z^i(^0Pla3fp}HKOXWY%6$+6CicdB2%J$mdcERty1rvBn%qVu^{&sEKA!`jYRQqN`G
zU;MJf!7x28zuu?!X<W?<d_hOL*ek6<`A(gcH~-O{@_XH(=T`#wq{xcRo}3iF5jAv#
zqVSl1lOS+FKaD~zg9FK+yy&G+;R=1^^#$9MFH6Ha^we?jx>8<IRaS+ZT`tSjdhbNt
z>jm8^i>6I8pFEts;!d6tGp&;vye+5}WA@$ovc3P1pl*l7x1-sY?;KhUNV@#>a@1?t
z@@Lxc;+ATW?fGfg(~4fhm#imQyLf)=*gw;Wi4}}qLn@dE^w_C`GXL_Qt9QHcaTnLB
zRbd;hA^#3#gu7D}RmFO7wSXf$HL~UcHcrXXrG%$gX{nvKY<<EfBuDPH)r?1G6>jod
z9s3q5+|2`t(V29&-l9%Sc|;rMgmbe_o@aX$A7*b|lW6&+DA+9Jqo8%2z^#{54Y!m>
zAtE!yNBm@?f|64LbY>NQiByepJT}P?mhT`}D^D#&9wX#(9xx)fD$wkb@qh818fC5b
z)`y=s(IR$9x_am&_R0mzn{wOrwiyA)$EM&`w(+8f<Buz&wAs&F9sXW0I28z0%`NS-
z&`W4gK9vFDX>#zsofNwAE4WHYeCQ}?p2`S$vfNg@{8Q0FXBy#N^?vu%T26l8tXZwa
z*`b*>l$h~t{ow7+YKQgk`9Rjmb-%1|(aC~zHP$!Re?23IC0+T;R5vhhqI8C3>%dq3
z>W74I$1excshT&vw)8j4!p}$f-D(+Vg+cC{<j%;`%&(`Z2X%j=?u>*i{z^T%+j{MA
zXY?9;yXj|8a_+4?72CJlzjc@2<r^ZI#q<1P3qf1OdQx+J`z9uZ1%SiNM5!(FpRp?f
zPN?lb15`YqEKQs&M+Y58vz)-QXsm*&4R{J(eGpYrSf4y%N(UdBqakKw?p8wH=~Zc^
zdw?fU2exCtO8~wsEM(_6lsQiOyASG#XMIR_9gKipGdSy}#LBM(4XA)7DZyAho=Zk2
zfZX4SxWeZPVOOSLBs{$3INNh)siKO468r$=-7h{k!azw@lg#mj&LNMNAE&~`%zQSn
zLcx<Vj2|-XXXL9supgk&EEedG6oi26Ql#AxF3%$wQ=&Xcy**H9gwl+-48;1oq^7a6
zWMwL{oXhW{q>}OjRn7#>e&)>9F#`)8X^Wet7UwT0^Kz8`{6wlwgB|PiV0~W19mC3V
zYi)PVn9m}Vue+7c`y+cdvwU98=PM~k(&hdPjWdz}JG@7eX`h6U#rd2tCuK<7qRKKq
z^e6T(kqSVOeOyZ?jiZ8EUiO@`0>CkqOWwn<s{mcam3falISfaz%}^iJm#^8;MH5RN
zZ*m$($M74kiL!W!!K*NaKQJ50Snqq-`~?otT#;1^B!M<9T82<t6H{Er?)HmGSBbN5
zNub;$4od|_6?@xbgYx9q=Jb7(u<%U}nIdJ`ExP6wNjPFkbSz%Fhr!3?8Q4hV|3Mnt
zBOx!4#J=W!aL^a+ixl-!4q@1>eq~5L|J2UsE>fZ*enVEicwO$6ryRsxzU`ud2HPa=
zBG>zi@(oq;?r_B`?tfjZ>isntx#beXMS~qK0DRui#8zqCu?B);4A`rFF%ue_YHso-
zkSmA6UQZJf$mNiuNkgmIL0FXrEV>4ul9(?Y)XKi)BHD;~;sir@ElB5hiJoLAUPFlA
z@aDP2tuAe$_)aDM?gnpq+(9E(jK>LHA8)`S*9TpXiQzk9Y@FYE{wDT(LDFHZ{8x#b
zy17DUNzgzVn*dgYN$lO%7unMn62QXz#kC5nh5jM-ItESzeG==zaEFo%>*JU^xvw;7
zzb|vkUH4Ys9nd@E#<5(+vDS2kr!>xya`-HwTCwC`ADwJ~++=YWh9-88N$e4Mh6lv1
zlE4C!a=vx~BLiYbYYYziE@?N=loF;-1hldXP4@Vb&;=X_-&Wxs3_BrNdXt-LI|Uao
zXdJ?05_Z`{zZZA-igRu?2_VZJnCOI*mo)&Wq~;1Si9Hh_-Pb^{1Oxv1QOux5nldO>
zz$EqvU#ZwLarS3IlHU#kqxVRHT)EOrVs8O&{Pw6^6p#7FW%J*U&F@s3$g=%@Opvx<
z5__1%_@hE))U%0stg8A)Y$!tA6m~R1g}+Bkj&!Q!v9!=%7Jb#{`cySPZJt_FVasbp
z<sB3CZRI+hE4?)6@}tJw{>s%msaIWIzdNYOWm7x3|2MH`rF5r?gcz}vwIhM?0IpY@
zVv^2~qkka}ZHQ1CDm4-dzRD2Xqgh%IIdxv2PBOfFO@^!~$)5+{=wXNo-J>r6jQ43*
z5}{XJd2Obz*v#{qd#0vjFo`|l(S4JJ$CxWIj@xN=7JlM{C*CrHxydH_r_=u?_C&AB
zn4nJ&lX~wniM>hLhmURk!SZel*znFq`AV<{|MfDs?7W7N*be1h@;}5L<-~DGv2m*7
zC3V@*NymqOUGdwr58-nPyXwS!%z<+@StaId%M@Qc;0`TD?5Y#!2vn?|%A<7p$eRI3
z>h#U1G?%7fm!?`L&NF%UCBy=+v>e3#A@+J7$j4)kq=ac!r3KXfa#<dB`#F5|u<aLK
zC{8*WsMeCV9GjBofW75sF5k>F_AobM^9A-Ux_ypvTf6Edo$eKM+5LL~tt>*&jl}Oo
zlb_OeJrdU_u4J^2bxxf!N^Ik)XPgw{_Ytr2vcLA=P95g>=L=8{;S0HRl?U>h$q!$4
zM|vzY-*+@BKf_1nw0zsj4ITC|W_{qy@6W{Y5Pc6&5&Ri6VWg+LfGQh%T`%8R_#W|2
zDoFSbv4<7-MMC#1@<{f`ujby)e&`nTz<>F3@XvIClT@cElKFv;ybKN2k>0p9X+m<7
z+w4YN^bs9SINlU`q#h?U%kQ<wA0j^zdc5BC)o=XpYxxz54{DH0uEP1SkZJ6ZgoQKY
zcQ9^JzQM{P5w}Jn)J9HglI}2#J*b+z2sU)|`;pC0rz-O}7l_E_NuD{9Km{(KGLLY*
zKEie+=9#7c?fTPB0y6je<g0)va-zr{F|021O2ZTn5*wG95%iQlwof1->}qUVD0h4=
zXDbPPF;(O=mUFIKZ0j>h6Dy`k;&r2;q8|x57D)$oBtGdA?s*j#XLqY>L=)i5mX?w9
zBt3K>BUyg?&SwFI!M}+;-^n9+814^>V)quz-6lmfv20u<{&<4y+G}b2_0;Q`B6&oC
z3&048h6}%P9r`%ZuMH$O{6p*!T><(TnN;UL#2!WX@WS85Uhs7%<!yPUv9|&*Q2}0H
z8hiDSJ11>FFpWJz@*A6zIqy&M^bq;ee%+5?8he!VL~*fIE_vNiShD6*wX0cS{}6jb
z*A5H-Kn3SG0ssU6gX*9)Nns^CBc)}vw9@vdbO$WbOQv+4#OIb7yFV%Ql6`zHH~*Fj
z*Cwvpmllv{XStCn(`*}Fm^U6ze0qJ%sb?$K`Sr8IlN3}VC3}tn#AKOuu<VWIx{ujQ
zG|C@s%u^(Btz$v+z~4p=fks(5hFPy-XzU$PB7B)LHntJj*M!?EiyeT0UvrCF$54$+
zq7{wcsH38qlL^?B^Icd@M<JO*m<HQk`U@BT<OC}lZz0MPM|R&aN=&1m$qV7&#-e?H
z`=l)S$3i8oK*VDPUn36R!HZbWdZoWpd|K$6?ig1E05Ohv{#%Rkn8@F1n^$3VC6$Z0
zPut2Q_QHMtCiZCm2eHSHt!<FmR4G26T`t&U4-6=TH&$?FWxNNXdA`&O-w3go;V9na
zNM{mz`k_o>4-hNeN)`AuncwiGX`l8y03=Mt@cZT>K3vP;!is=3WVZB?r0janju-hi
z%#&_Zz`qo73IQ-ghhx-doK|n=hbmvUHuC4Nq=O8kG{qd4#2z8AYKhNOqg6UEu$h#*
zlP2@}-jPF@EIudOxFkDKH<`OX1MJs#sZo#LW;<4-?!Jxj=g*of<Y<03sYZLtH1=@8
zKWRx!V~<*hATtb!B9)PQkMaply>&@H>P1iIw9np<X~vQ>EZ(U_zVj9_xwYqD*IZ~m
zSIFwm3e5&YXLWBpXbkA(tKR{B#<IgWpR~qGGpu_9T2U$ir+t~k9+kaWzui5zJw?3t
zsZRIn=JJ6+^OkW3YIB7=gYqw85AdG%=GBLL^yd*Y!9ZC9-?JJMwzVPytdIN6I{FWp
z#2z3Q<quT|sx*6IuD0)Dlk2A)M9a*>zqB6Yj2OIq1ZV!l;o{AnKg1rc(iS*;NNO>6
zo^ZLG5#I)kx>AGwR{J@B_H$;7UPO>c^n?S_iiPXTGhu>A+RZP24UQ(h5P(jOwS|5>
zS3AKg^`);xtzqJe8Fc*p-^3nybbK+$WMIN+XEJR1ru@!dTkLNx%pGA!s1!<5!Q#48
z+1edg+>~^%$a;&g`csF4mPyiO2CwJ`dLiP)%^9=sNxi51-i=g*PLX}{?EZD?#=e7&
z&1`_`OkCs<k;$1R@d=y8`LmL<?lwHTet<`!i%eoKvSldgU_qMjH?c=?7Gf;K92k4Q
zaY_axhXu>tAB9nSm(M#aRDNAauv(6B)a=lef4uf|RCJbme`Q{D;BY|nhnREHu)5*+
zgO%>5KMr*hzCU#u-}^!9fa&_5L|^l4`T7(1ZS9HWs%HoHy_VJI2FGRh3@)ax%^s|2
zAHI-yYySrLRQ{RlA7T%1;b(45KwIR<o3&G7zkc#>YIktLo^3|uU1QM{Sn=2R@H=oZ
z=54e-AD3?TExlifdj59~e~rHXkie)-Vj)e_yeHDdLMKJtw&@9C+jV*mQlHtU*>3-q
z6AivFaco93vRvAY<{fZzx8d9V+VC!u*qhSWi?I`v)FI~q44K3p<B=dB^om{x7$Kw+
zt(4mu!7i*72vg2$j}+02Z;DpV{~OEOgQ*mB{+C$ZrK>s7CklI?=pf##51uHZ=Q6Rp
zzl_-vl6;J@pOVgW-pUWK;97K!RVyBj;dS{xVR_#_WHYfm*XW;LzJ$64er$<Lmsa=k
zL#=BMX;d(BZVn0Q#%unA<<)lCR?Kv1pN*(sn#^+_^?#~u_He7t_ZuMebQ82*FAbI4
z5Oy@vQa5~1KGzz6)vj9!96?4ZcdR}<{q+rLS@(cmvpn0AtsR04Qoc9SxF(f(qxc-H
z2Qnd>k9<?Ap}~4aUiGI(;P&bYN-hzp_hxT<b2%~lYq085CwCV8i-jl&Ri5?)A<|3~
z=Jbf<VX}$)B)E+oOWX2BDLXcAT+my#wCmCaPqdyBpHZ#1jRGgNVWUL9N|=eKkuOa~
z2&OGy^%3d|iOM76Q&FDq3%{NQ86eL(BpC%qd`nE3oHkcI=XT};+iiB9aQ$(SB8N2S
zME>bx4KkkQN*48=aa_yep^;qo>6N{wMly0a^n>r`MsX!bP94nwH#87<HdezT#d;_-
z_N=>AnRjw{9&FE^%DMb5j&sjR){<;&6YKmU%PvduxnIymx5l-ZD^es&|5uWUUSGM+
z@o#TUvnn1G-60Fd?r@%qo7~bTmqKmx!!-_+!XWzoN+;y~Udz3bE2;DFO4T#%3A<~P
z=5`qCT07=eY*jeaJKKeJVDNUcWo=!G)Nuu4Ki0t`?cn-p9$e?d!SHzwA=Yg+`I9wt
z17!KZ>T;i!g}_5o2{5Nt@tbZgaCvi%2a^R4Zq)w#dfctY^Sx-mtYU|&-zQ@Nqg{MG
zaq@3yPshn!iSP&7WBER?TzUXfP<ngp+Bvea<BCKqXFL5~wVo!bWZ{G2+jEug246I%
zc8J|d@ENx9=202C{$$!`#7K<^?I{a$MhLca#hl^kM3#WdgSP_As4X4e&5s$axNhpY
z3G|yt;CB0eeQ{$bUK#ym^u6z$oyP6IhLg=NY`?gv_w>0g%UN(AK4&$;@4~La;mw}~
zvx<s?#f8UJ{TJNM*!Znf^&!8_mNiKsHBP7YgW&A5ZfG5Br^Fzo&ba;I`iJ9vfg8Pg
zsFscQD2Vp=;aiC<_O<5EcqIaOq!NE3{6f%chEgEa--t7P!Mi`+zOCCib>&&m{;zMx
zhkvc}&-Na<U6hXuVN4?#GGV+K_ob9-^u=DUMjS1{BSOgr2rFEsUhAFbI2pXy{_ZV+
zOMj%gz-jIaThH`_wx}?z8Bxok{sWsWgPlqDNYxUo17R!epP*MO#1I!I^U_d6zCP@@
zffA0(iKepS3xz+<jkiUE!@$@)&ZHtk(H*?VYnZ<N-L+7waa-I&{Gm9v7#F)1!y{pw
zdFb-UwoUVc=Od|;P}a-Tj#{#NEY>OgD71*#g0hCx-DHI`u#eD1`VTMhJk$GuHVMJ>
ziv>tV>o%L9<#U(>I0K4>dznNpVEO$NW~Yf%(p9==YRSFZ@|pnfr3XKekX&*7P#hZ&
z$;AcMCu#5HK2j&+wE6E#9`osvG@@5w(iKclmrYo1jg!)I_GS&IND=;>UfBYMv%*&J
zUXM?!93nDcjYI=B=`BOCcd91BgTzFMaDeE*%5&{@5*1xBkoJ=)r0pm5`dD$L91z3#
zc4!=2oB2<N;$e#52ffjbXL&`4p_<2IEtV&UEU(Bi7KbzXVf++;Xzk{EH7hjed^1ic
zfHG%tZ7q~+cUBZ@NrIVYeM+@aDv-E&=e(b6q6iuD{J_cixHdnh##U$kISzAeO>$_w
zsn4q$1Gg@Ti6?%<7Kp7lL~rx7UI};b!P<X^pRAxX7QecpQB)&y<r~{I*Q87AE^4!~
z;ufEqlV1qpBkZjY*+#^#6bSl%%pYTm8|jM9%_F&%*iTnmG#=%P`U(qMJQ_FJpp(k-
zEwJQ{UQ?Fw<$@!b5tGfPabvZsYLG-gsmrb6jB8%RikGS1bQ=MUV@tI%5k)3<Y!Ty(
z*oYjFiPF9JJL5CZ=XE0WB)JI0#6shYfUshjS3}g{o8`M2(t#0jJWu5(R%7`k-xCea
zI5tfzR?;IDU5^`%(X4;!=J9TpmIwWe`}Ti@<=H~?ra0YAXns=5U%xz8ZWFOF(QYSx
z*ogK07nV20Q|$ZhA1rTLpxd|O50>X1KP|HC`(EdV=b6hG=%)u;5AsE-l2D(JSBL_z
zb8b~B&)8>WG#bRUimFn}<7X9?DdHD@RHeUFxGm@6*JC-SlF=7GCmomBb5Gqn>)Xn#
zT6JcRTV(Z<!XDDezJ}h1KTe==R3Lf~*LVGq{uv|2ye^9sJ-nkT_at#a<1kL2J%aK*
z>1Nb<R~!EU%a_q7J^`2TasGq(kr7w0?|~PK{f7$GP0w8AaIvV%@_+g0b?Kc`ddR@B
z;bL_khn;oXq90kGDZhLa*0@%9*t17E=4y<^mR6j&-z9uF`ru`QPR6wx*@N{j{;F-*
zcWL(B`I7fb&8Dd3o{NUIQr88IlFv`l9~29J`ShshVvJp6%~2=O53lNyXIfl+Szm~I
zVKj>BMBH44#u$qW56tPV9;7A+V<YmpgUo@Oe|13RQ0?pXeb*1wO99eJ6_?yLPB4wV
zT+SjEzhEWN<;3~tO^`$NR>jiQtQ6r%>Rf%3ec4(QRcD&-Sr5JY$YugU_;BIO!;>06
z<#_BEYG#i$vj#%$Z@OsQR8jr*>m%!cPd4i6;*t5+J>Qaj3f%XnbbtDMf~5Raed|d=
z)b|*vqv1T)iEd)e<adLQys;rY(|k2bN7NlEYa8Z|eqSU9+-h}OF86-Iuo2T9|MFw4
zPC|IY?N(F&NwK@{-wSWP8*ZK&wH)nUYUh~5u<C_+qSSV#kBm^E(&RRj)K-|th;Nk4
zSECO~IW`)e8mC5N#az0~q3d0Bdjx^w{xvDOn;jv#3;B9G&o6!3XzQDH_WJ}o0r<{W
zpb#w;9+7jbK3Aj8qwUj=BpCJnEp@~92h&OAcV{m}Zf`%-{qoxU?k^3`0qH~H=x0xe
z%>9fg;>JVmx--a?*W5iAG{lpwhjL|7|2QNGW$Qs=uNM@kBR-^su+E2MDTn612zkaz
z{POUgm~YUKvEX;U(5zYS6APq_6EbN;QB8f`t61KzM98sL(JBmEI1Z_`&ST*jRsi%+
z*W}+z56$)rwI~X`{n=N^<U!M1xT=huV!dyikBv=z_`Un6IwrB_;dQDKY4)0Th8S#w
zMQCeA9+SCuV=H{iIO1Y-h-9=)Wq-J(ub&SrI*aq(_<R&WCepj!X!(z_r=H`9n!&`R
zn8ZAGg8HvU#tNuMXht73@$>5xB(ugUTZTO;x^FuoDi&#cK?+)2bQtr(fjv=%=ZGbG
z4;P2vWOt*)HFd@{`$jrac~F(eHi399PgJ{1RJkVc#X^jDq<3S#PrgYsp)<ZPBYF_)
zu#%MU!O7YJje>E)Z&Cuza0cA#ME@p$gDH;=2=Ju^)>Z?g8xc}h7mz@NIH6G;lt;E?
z`1pu-*@)=GP!t18mfDIK^7R8OCL#p2zGk4U?Rc{IIMLV9jvk0MP1&1N#BT!B*pQVO
zFZk(ky^5a5E_>g!^;)0F5zx!z_Rp~|osyL^rE&=D320>aYC;2pHEA`W`XO5k5&Ug|
zBY_IPWSA7{`S<|;F!VD7%*nnM3TY;yC1q2NW+orMc9?qI*?MsVa+AT@OklUAvgZ(>
zs$q~cfWjIMX@O%e!~~oj<v;5T%|x?v=Os#COrsINIdrefFH=L{8Kjq~e|$YMq6)xU
zM^K*eU;|Aj<PxCG9!y{FghwX7*C?zIAka(+zjKC}6@%KYJ`9%4c<!84=oi+gp%Lxp
z&h+&L7_7Y2C{r{liNe}U%r3Xf^u?yf)FD4`iN7{sT{A!z#AJc{QLi+3x_om!F6N9E
zWX%vW@Rb3kbW|Q0wvB@sp;3G)vNKBPCO`fbXS4;CKbVqn${C)AM|b$;*rFk5UZ3;V
zZ<JOG{#5c}B|X!b^uJz-Y9C4A;yh$tydHbT9T4KCW8%4KsCF2s@2pyXOvXRJUTg#M
zCJ|i1Ag2)_mJDd4Gx!d(X3hldNY&s@MpzJ`jvlCn!r=Q#SyGERNoa@>o@b2!?l~*u
zb3(8|$p=Zph9;rbuc1xRifp6;&NbwsA=(I+Z>+DdB*V7Lcoa-LK|@1ri4S`ytd<_U
z35%?5CxnoG=t-wMw<NeD<xxk4{F1=&-#E=+hTt|8eiM@x!F&dvhW>Esw+9LG0rf#v
z@HY{xm=eFuFc1O>?a@^V(a%4=)PQobhvN`tVH|06SV=`d16q8om2C#iCO(C#BEXG=
zUgfiCWo8{_W^qD{<OFbRoV&Op?@5lw&gk6+bmI>CwilX_$=d_4SP($AnVc}i#MGS3
z9-*S7rDbjlQEnu^a7}_Qwy{&|k>3R1NfoFsOQ;eC>$VaqPaheyRCpmB)f~;;P!xAT
z?xm(Fx|t4<`<&R0hTJDYEmr+a2+*i$6_YW@?Jl-;OY~F`D^Od(-b?em1uA?1LL+iG
zRh&Haslsx#;sBt)0n$n$LW1eYF*58vgEfr~VIAY9(P3`HYkO3-@KyCS44XtYYM+W7
zz`aaB!)a91k*ZS2D~v5V`~c74k3-lnaXk#eh$69pFLT5Pr=i(y;t-B>*!dfW!88K&
zdVnR6yP~54Yl08h_9!)zMcllu+<}7?5+PMl+^tsVg=npd#^@vh`%eNGwNv7%pQ0X<
z;#Zw=Y8%N^=Bf=I8=Wk@VNnX9vG31ieG@>nK9q)8l+BwqSe<++9ScsXsIaAghwg&6
zDH?odvn`3>HECHAqWl2Y_@W!-NC8)Qu)Vy&bDsjHtp*%0?;0SD$X>5^1Jvxnrb<T-
z0FUpQu_kdrox;FX3nv{{AN!`lf>)1vs#MM3*fpy$My6?f*(f7MjX$86lUANX1V1eX
zfAM2Wqkx^bAys%(AwgPNE6)fGHCcVL))bI63Nd1EScgJZg%8=nE8bWz)R#TjOaQ7)
z-54i<CR66?!6-vd)&|&tOYExC0IDzKcr7rg(4@K>v{V~-+8==~CatC+&2>91s+c#%
z4BfL@K?6t}^)H%1YxHY1q!zaw^=nArhCHmwU({51R;)3}K-G~^7%Qb_?RH3R`!co3
z2z}gtlqZP*zE2EJB7zTathb%tSz4pZ{R=G7!KP^0Jw~(z@!@GwhY@?hE&-fJMKG38
zNoZ&@Q7h{#+BHWbiQdv`fM}QH>>z+yn2BL>O$#UVwqLQLafkF0bHP$r-Rb;(opwNl
zuL?nOJ=zC$8o{2OU=qYRF7lOpCzmpf$L<iEbrPFE$uKTaI=~!V-=<mVXGF$igs*;>
z8_nS3Mv-MR>*bzWPPVqKzb&M2{3PU=GO%k5R#UR?$>z3!lK4~XHO*v19+|m-!GC%%
z5A~ZQ+1?GdvcHt?wdjG5NH(3pBJR{zT`Z}2x7f>PU+}dXlSD<l3(dEz=rFWx1AAWE
zz|-m*)Z6j7l>GNYaC$I%d6gC?>p66?0^-KF=H2_nJ6F5B&!#oWf2h=HmpaS3`4XJ7
zQVd<|Vi_ph_h+-fp>KM8;7t19aRc3eOU%IsheknkFLqzY=2p?O$_2Ac4YO-wvYRQ{
z3OT&*n(Jp{PMp1mCSON?I`{F?sl!PBlmWkdu-FpoK0Vr!n72l6d(qrJqm$R_)w_Xz
z3vTW;<Yd>}=m96eXv>e?PCc@v%8OP#H|1vEUP0}S_Zd{8Oe&Bg1hB79<u;XPVV-q8
zolZJ65;4&No}_d2x42GJa(_ovYGbwJ6i#LKXIAt-7U^z6SS0tjUyQGO){QcF@F^)2
zYeYrJPkcJANNbBNmi`3E54*8T(K2fou<RcgbZ+~c`Q*#!6UWsjlQDzs_e$ekULN2O
z7X2w5ba!SQ>*rG;3nqCh0uW3VYLW;s^*|g?c^vPp?8NLLXIBjtN3`w^8<X;u%@QYW
zB(JrkgY}s|PvAy=)Uw&(TN<VB)$V75q%KD)-1iL9cMKA{2nEJL)j)48mC%r0_+!BP
z<n!>8oS$j(PXf6MWaQdk6@S~O^gB}f#sA=XlL7YdeOK^JS*1Hp;2Z@-iLp-s1COh|
zqmDh{emUL}IE_u9r?Ta97!jdPgyWF4FX#IQc<$y3yvh~XNf2F{c-1^Hc(*k05;GEX
z)Pm4{-=o|K{c$dK;<oO?)v&qm_B_sy=FTTQo9jnypG9xu=G%qeXwv5V%H}@}Oy8%g
zcpdW%Nk>taP}_8s_o0tTOZ=~Q_%c1%6fYI;ld+IBBydc{-EJ;3*e9TOaqSY%6VX%o
zNsNG{;8Vb*!l#FGS|pAplP?C1aWU_WbW7t{zM|KP;?9;WHXP)vtx_y2ku?X3%c~EK
zDp4(E%l{k8`|WN1+sFO)!^Gcy<-Y^^eh2;h9fH~-9p4Hw-->YGib~vyDc_3g+e-Mk
zm5AC-I=-D^zMbm6ou0UzS-zd!xBcYj_A}H@?(v;`^PT7JJB5imFUxm|`*uoy?v$f;
zE14bK=DV-mck2>&8_IW^`gU7>?!HCs(T?x6neV-G-+Q09*HymP-M9Dg=UyLbzyJ9D
zfcgHA`~SxBZoZ8?a^u&%vDdEOI-cD4?e?`L=nyJuz2!0WE<w!rsr9zk+{Y(+QKC0@
z?k^3M-g^J^=I(<Z6D|LL$MR19msnm1MBUOhN~+e<KJkqD_1o#UYp>sV7NKtCT==}!
z%BB3B`VH5*+1eZKZy_4iOCZqy9IPjJL=^M?bzAT1zuS5V|4VGWiT_~hef>|i-q*iv
zy?=xCrV4{M3h)1$t@j^cy?<1_sj}Gr8?avN?0<sw{%TBS+ImY(S^wC2|2?d?)LzWA
z_5NRg^_Z&O#_0S1DOhjp>-@;x{K)L$+W&_2{+GadvYh{d^`id;>pA{MSdY$&cGRSV
z^F3I|4Hf`(hN2|XOs2Sx?l3}8O81z37D_Mp^CE@31f~--{Wa`4q+cxLqs+mhcHt-a
zoM(KrmnbvIT7wKpcBP6{N`moK=UJ~4;*$kvwTg=8=xf%tk;qFn&U2aXKAK2`U(Q>c
z%dU5=bc~d$fzLnjZR|*3!g|+3VX`<TtS1|dXTo}o|1GTN$&L6gV7)m*jyJIO2$&13
zor7K1qyR<y7p!+V><_FL2Qv_ui6rWR<&%$!TPLAUxj9uOX*oda&%6|{a8Wcih(?>8
zE)ZETZ<y~``f*!#P>!svG_ugm{syGYrE5~;(qGvXS#z%%ybWUTxtUyVGnqOnc}Gh4
zNFEDUXs2u_R!FUfQ`AI;g;P;{a|!ic^sURf!vnj`V%R6X)3L&#I61U#4I|05@{@^5
zJT|nbI#zPkY060I@sb3*-6%yIDdE<+jM6zbpb{^sh`PTbcdlFo{ZZZJVu{|8k{wjE
z5xwcv<Jg3SzXqcuVb!4RRuKCZLjo>44r^sqcg{alB<mVnQbemKckX)U3&~5=VxP!)
zD{xuuwk1f8zA;UdEN-7Nq8^Y9V)e}z(Az@CGA0uxlL<?4y=RY4Y~qN;ily~$7&NA-
zXClraI%ax-Y3f}lJNG@5AQZ<m^}=@6(Yq3lj=C@`igj$G0b!CmBHv!>tv54Gz0wok
zH@jwj{=2DH<23}rVj1%XTNuVarrzuUoWVUV!KVY5(c^UD5WUES{|WO_0A`j2|DLu1
zo}p`RL!yKE*zsS$RSKMgIJA_vC}}2DpED3CW(cA;NMb`-#}b)i{sIV=c2MA|e%KRk
zG(rf11j6kwzEqa_Ll6GbJ+6IXZgi3)*eimIY)6b_BM;+cDBc!kI9b9KmeO=XA#o%g
zC<i<>eEZmK_9C!24_dJTi}9=I_Jf1TwG>NgXX?*K4;HU-@cELxuDi!@_}$XSrGakm
zNkew1k*ILWqr(bJ2p}0O(P_!z(W68ZUtr~#pdhz1e_U5$Mpd?D$o4}F!4or);)08v
z1IlKiHRx6p+}Q-T*cN|O#3)W(h75&tLPWV)iDeY_Z5maqMyEjcD>Te@p$}4aKNm(A
zsgPE^BodJvsr6wN>QTgkbEv*m?JpCmh;hdhS4<BJkfM|q2^=Lt9ql=VEPM<0DNpX@
z>SZh*p5w%A#MUr6p566P5O50R`^KZMISIwzV}Bf9Nr^gkm$i3*M!Dm~m4_`Uj1O*3
zI%lx@P6$wd4D{zplzGz44ZaKxEpW%Y0n=MSFOP?gulm2-WYx7JML`X!TxUZCc>Yo@
zIcK08GzcOz99>N0b2dYpC3jQ;whLv~2MaMQWOVdgVs;+VaxhC)l;MbWUbT%|N56mx
zMVJNos-@1hW^904Ta{ol5y~ZLIG#KD0=f!O^vx*RX$s2g1v_?CpaUDa1t-BksC8N!
z*KDpNywrfzchxv-CRX-t%u2%hrHK%bwk0*<9A@^@nD8G#4~WO~Aq;a@S*!XEvk+o{
z<m*=wvp#=*v03L@d5d`Q51|(a2}F0ALfTJ8z>+b2TtEbq!n;${1|e2qB*jdOO8Z%G
zr+G2H`)hDc06mx}nNn+K8fV|%*Yf$}G2%j2tIe78#-SlGnq{Zi*%B;a9Dr6Fl*<kO
zF#TpQ$jAxNYOuE*c5ZNR*((Vz^EMV>w-=#EWa#%sZW^Yt2tq}JqtEHk4Y+(^e7Ak@
z3RZ++F)#7w9W#Zm?YrdLoY}K%_Vw+fy~@vM$qa?)m>g{y=6gM-;vp-md3imHzaDQB
zm-T2dQ8BAqOyc>ZEn<C~Br@t$Ft$JfDTIDU7Fa9o9kY#l)wMl`J|wzxhw65gD7w*&
zMc=pHvUqqjRJre(U<9|Z6hQLPakJ3N-5<mgyR^{TL&Pf%zap$&t2;P6<?Gp@l3x#6
zfW+uwR;-`iKNAmxsI=w390;$3rA3>;E71w3PTL#KU=uI$3Pox?k0_gsNW`!?JbWe*
zfmT`WP+Hl17gtsZn;E)$EicIm`9ryBQ~!lONBhfNg~I1P#2Ig1(;Ih>KzTfW&&Xtd
zQJ50A$X1g!1Q;DUGQkCm5v;1>VWbP!f3MEpoix#BYI-}}yvYOXHtLDH9}mb-Aj|0w
za^06rl^AvR_c{L7^nA&e+BYVSqkgf7MVRWd_?@&|2Evl=9{$nv-mL|p_@E<d6H3To
z+(mvLj_!TyFaiM@BvK6Ku(m7VFmMTDgbml(OydG`U7Y{Ys)oOBn{UU0kLUp5T3faX
z<OzG?{`YzPK9?E}n8kjKQ{%RXIuWUADM_79u;&mY`unUNZv7hfMa5}J+QK}XEODT8
zW2texdemk<E^y%aRpHdd!`GesJC_EjK2{!fys6{U;%7Ka3DE8SL=xLRH`5OA-Ovqw
zrYJ|_b$H?HXlp7sqDZUuT}-?}xK{k+V)47DtFML;xz!<ZG(OFl?nlM~A<4uo)7waj
z{U`edDL{eJZ4PGMY{~r$zlq*`MYIpy!10rB$sy({?bRKVn-~|merYX*C38`=v7aAS
zGj04}``wf)%f%?w#vzRAj)>*2c}w_x2$z@NN!4S1>BO5fRuce=76$Bsmlx#uBkT<q
zNIDW-n8Kc6!KKgdIiC@rL<f5|&%0m?4OT4bmLXci34OE(z2$M*d4>e-4~49S-q;|?
zI-!5x55sugx1T|432<sUamr33<$c4>77@?E_+0QZ;85^725wUEN7%z_VhjL!TDcy>
z5>m0X+;@k<9ekzw)i6BVhSsa#8))bo3erVM-<y>ui^1Z(0k&rHdi3MBN0_{xHOLF{
zg8=m`(092UO{}^dTpt}j!b3cSVUA%?tyeHoI7D6Onb?u&toj&38syk&%ri}vGk;+&
zM%@}njmgP~eFfvmU%=q&Vk-pVO!{LX>#<e7arFy-c)jM4xHp>Y$5Z3}GpyIU6;Ee|
zN^_BB8Jzoc5@$bYry^n87ya3ib9^M>ljb8PuXnHkre$y%;BGT{y^TmTG@taH4`ayW
z^^_BNjUVldi0ymG6ewM-jpkGcMQf*_*EG>f6nK~;-o_sNOOq4cK+d9*cP*2CV(%(3
z5IZ<Fr2?~X88A=+_AAZ$fXHEs2boYcuKiY30w}Y<QRaA1m4*tyPD?z-+VikYiX)H2
z(tjsJ;)Vjw?m{Tadg`G@ru7bhWknkF;5J$}#@~echu2f0{NeR}aVzpQq<*z!@_KhM
z)1XiWD6zl;W^Zub=alyb0kLsjPn8_XIK4g{B)S<iyQ%Q(ghn!5Tt^md-f+<kqnC1-
zMG2#)<dEjuppuF|_TzKP(z=2!0lL4yoNm^#xDLm+re-x9nfok`U{OhFH|X;)RJwEl
zSbO@9tp`$HzpD41Y3o(|vGx4VWVu&E*y>Iz45l-y(%ybjcw42!QE;sG`h~Z4iigU&
z!P^-M5|(rCU;`01)TppuVRG4iPx>oETI}^U0a<>}**R3yn-4eG#g)!tI;2a6vRGuL
z-RPJaXT?du(^&+gF%_rg#cXr<edI%hKFW1P$!Blvw7T<hTDo%VH^rD~aq_G_n_Sq)
zHl?Q@b&L#3e0K)J!jhE^N{eKDMg@&cfdrVU9wCEcJ?%Y@)F+IdD9inGh4>?{6iIpT
z_g>GI?DXs;KwYzvn|RPTR7GSd_ieH~%hKbXF1fZ)@Eg3=m9(TQQ3>dsg7=dMzRN5$
zkjl`5V><+86P)ZD{4q7M!kblTfl%e;k&_YPdSjtj{TI(48z2<zGEU2(-LIuQzQ{7(
zVNgJR?oyXfKZP>1LYr?Zl#9bdE}lJ5V!t>A`VM*?fA~t|%fjt}LDDzhQ0p}G5rOan
zrI!`cx<i)eEPqZd&F}=RS6x7r=CiMg#-evH$O~Ej4(rue6}zcm-ao$GFcjNx@sF*S
z^4Q?^u)f@2HV|Y|n^m$yDxUX<kz?9=t&n+!G1Jy-mjn5GAY1*BVgJ~Ac_mYS+j{>7
z>#dBH%~`=0tBa<!%I7S~e)yMfWtGoa9qTkLKadmM5vl-Xm-(a59{N{&!@@_IwjRBL
zO88^zu?Sbt85LYEWsrc|u%^mUi!wH8Fvg|K8dJ(0P?kk6a|2Y#dQ{E7Vy$^!sU&<v
zR35Y_R4H{BP^REreui4Lu!J<Bmn#d`^e9))?{G*2u+8mo*aFzEQ6aA!pl>}OZmTtO
z{(swgO6RFWj(HC@YdqMESf*WEHX-L>5K!BtUo-E|W`eGrry40yVFnB+osA`mP)8?&
z1YDrS<WyZe9K^KsR!ir#YL}Lbi=t~|i-p4ikZkE?Zj9P{f7^Q2fYQg^M8BrGxvc8B
zMsW(cEHb;Sx}pAsnaJEu{en=#+y|q%yA9c2O44tD=I%lr=?&Ij8vPkk-|+Q1E@hPr
z<j%v!c7({?fU=U^TGbm3>BV(5WDsSQLxF`&(V<KM*D!+NK<#qK5^LtP8s`ry6b>#n
z&ol|YcPZ;@1${#k=03pE5i*^(%O3GT>jIF01b0UOJAMjefT`8_qMva64d|ZmiCvjb
z#B#qcO$+|i#T^dzK;$@uIx5d$K&=AkPz3^oXJa`oOi98@>NLKT99e0>a8m^XTgyq{
zeeFt=Nb5Y4+m2~fQ4rSP!BhfDh1!w5a-d<M(iKd}3jJTgo)Q(Qc24p{b9<SxVUti<
zqa5h15T-%AB-rXq$5>$5<&tyb?`-zo{Xc^Bg7@ANMLI(RIjv_>=RU=<dPQD5T#1mc
za{_w3i&8G3#@@BM*I7yIG#NCCzbB9^f}v^2kR94GN;)rDJBI1hsAg9h#<y7wm4H6A
z0mVxPO{?9m3K%M2Mzai<c-5;w+marIG7(J0y$|7@-N5ATu-0zSMfltCx7s>Ah4CMb
z1(v_I?&;S4_}%JbsBQU3PuZBr#}3-ZiJY=;A_7x7y$e>oA)dVp;|=ZXy-Z<`N$UO7
z5m*`TU0UJ)9pAgn-bYjJTa*J&YYWJ+(--9Ekrs4lOF7H;zP8*7glkz0Xa9Vx0FPon
zGDu{1{G&CYHoOul*+f6$Du6lPFY%=RU1k5scwbQNC;6LwbAcbBA3w<)mI@#H-m2Qd
zuaPjI#37)4r1j*@0U?Ef4Us{=wE+#6!H1+lsp3I{e}p|;!$y2t(z$9nfqvDs+p=`%
z!u}s&FI~IW8o;u%Dig&N_CPH56CdgL;XAIa#N6Stqr)S6!;T5Vgd-xCMgkGStp+*u
z!IKg95<b3C7zxxL!5(RiYWW<RbV5p1I{DP7w|MFGn^gwqMzdN*bC|H+_tB7q(PyW|
z3T}?QI6s<usxmWZti-k5r2^{peMDojomrD^B?Ef!q}-ZXTRZXP&Hfibad0vQe7Ur|
zk_t&iyHi`ndnU%1wjL;8ylY~-B<NJtL<C;}>${+Sz(lFiA$e?NtW>^dV&>-8*&z9d
z(l4d=zOGDs-H87h_q{A#^XrdO%nt(>baDOc%Dv7q@mE4Gonic?r7TzyoWB1J_LQ;1
z#=$J_{mPD6D`jx$PR@N`e4J-23w87SXa)A3**(v#P}41}`*F+lZNq-qM>ZB_$A!Wp
z2Jl#EYQ<C~xzw7#Pz;_vb_}d^Y+BWAT2r^;2(m`(E7zIVQ+jV0!9isRIEO&+%mtgT
zn&ZRnuBXl)%v=@iw+J4+gk-rAJo~*-K?(iE@DY~+_^Zv2vLn3;m3YR@;5oP8&tFSf
z4ergk+stDFzXhL~fAFZhPJG7xDVM~V`hXv087J$9?PtOcpDy5n<s&bAi#=EXY0oAg
z7bhnQL%wn;ews@R9u2*)_*Aswa_QnT-KFE!lLe2;d;%5~X@iAdm&y*7DnyqzOO_O9
zOI5+k^-q@@f6UxEzbt6G-1K#-+JmJ9Q(@(?lJ8O0;;~{y;P@U0*TYvOd8|CZSLNfs
z7rcSRc_6Jk;IyX;EkBmS&kcV2G24X)0#*U<L@W65KoFT_-XG43`NQjJ#6d?Ml__EX
z{PGni@jwI`C?(8-CeSqqKeu9kBAx(6J&?*wUXKEqwV9th_JbF=!u^afg##iP-=&rT
ztB=a^@jo@XSC^MoG=y0|dX-=lodE!B|0p|p=uSUz$gT(ge0jQNW3$Gm$0<<0@mInh
zUT?`CewEI;9E?mNK*BJ{1-A7?t#w#PSs(G|K9kpD9utz;E`%UYxR-UInaK+HhaYPM
zG5DMuGL8bNCzi>Dl-Yj!Yaab;Wo*5g2;Fz%ctC-?B$m|!psr;01ufWBBDBk`?6}y*
z_nkkyUQ`J3C4MEJ{ws+Hl?g%K?fYfn&dN<+o&NxYk~eW7GdkZkIM+7v-M=2!1FK~N
znWWx7yk6Ni06+=Y=TU|~zAhP3<_cI_e6(%^0C21V07PgI;}5SV$^a^RAPIl-dh=Q^
z0O6Mi9+<%7^$wZ79(e=#_HSMfvo^N`<iY<&d;HDo5q`d`08qby=9a)en7kf&L&#$n
ziP@b8pfxlB6b8-knKzvG=*l#Z1`1Q|o$#fQL9yOEMtFb{095DQ%Eykw5G-2FSfQ!_
zs%`FTpdMdu!S#W;zhS+Z(SdpMC*r5KB>p>CZ)o{ih3zvoh}H1Q^&01)rFbx5u!oOD
zT`I??7e>^dH{zgX(Dff><^u-LM<Z}?WI$w26PRJt>d<v;)&qbwMk=x;$XIUS3|nmg
zD-MB#^VSh?Hv7|-ow=lX?>+#f@=%b4iF>!$CI9gG!AdlVH1-I%Y75k~jpep7E1HD@
zQ0d1<bC{=6j<I~oUOgB=>V3B7=7kp`F)W?zqK-D56~p@hTWdpXyf^+0*86rC0>~FP
z(*+?^E2!THH%v&J!``@Db|L&iITd=z1OW)98z7>4^>c|?pYolnBXR(gIzGwA=fgPE
z064W_9xnEH??_FYe%8H!<s5_@`8!kBJK4hqxaizl>MbNgfmri_jB6r{lshq)K2D3=
z6|Tl;RdTq9!#loP?H<SEhi=G30+E-!&#Q;z9mo9x>n+!8T+n&Xm3v-ycXLC8Ti>d)
zGE?VL5#$hf6s%y1;J%wHg%nSX31f9`^uluSPC0g+Pxzzj$wfbAK~c{-z0Oqez~w++
z^>BhBbh2-&M_~Lf=;JxLpb<a{_hwf=Pu48d&b?D1*G&4AOfI~38DWV(lTb6rscATT
zE&^Zi%iOIg;^#*lCah=e)vfk>d>^{`fZ2D#rI4I?l#Cf-QLy?Y!X_xSBBBZ~aeRRV
zIC&jKj%CXZ7;<dc0_N(0)R-*%%_3zK06q6YfN<*0FjnM;e1q^##OE@jzR9^`@;rH0
z3Pbrn*pkAbK<a2X(MMn^0$-G_yx^Eeef}VfPfOaPUv0;!AmysRGhpb*j&o7pq|4Dm
zad#%KC-fbFf!h99A3T2a@VrUI84uv1AVdXiBp`pW;~kNy>p7yYaeers>*Xq9C05@E
zr~(|XcK*@zIv&00jiCXp{Vy$m0J?1>OkFRR!qoM!%^cRy)^}MfawfOYtTLL?$zuN8
z_bS6Nn(p^=e)MLmvrF_FNM-c_uWq!W-aB!=qce3q3h@2OyE9)Dvz+I$A0GHEWIoVh
z)_SXP=0@COw+4;`BSat~M_}WG7SJs}o;4tmF>)RQ3k0mBBw;+@+b=?}{H((hOkEG4
zueOmXhqV&E?h2A7vJWb%3&L`Mp*}GXup6kQp?wcz4Ag&Ok8aUoKfEyWP|u~O9N;u^
z5%LrQ2q%Vx9B4;rLRA3r)@&kNGUxxgw^cZM#ym=U#ugQ1`D}3lAAMJd28hI{M=->_
z*?{jARA7&76g;tA9^(e#mF3SY4MQ}6q{aK|@zO_U1aE*pe#=;3J8{f`&!oMJm;Vz&
zWcGC22~Hy>8y1b=A;ufd<Oh0f8RDQ9$zfmz^scYTZ(^AE83ReYBWH~9`NE`CPfn=h
z$+PG3W)s6_9HdWepY;?}Ny*<lD_3ChA$x`j5Y>ds4RFQCHC{|REzBn4>Sty>cTq1d
z=l1cSZ8HKi<$U(wZRG^Na}MGW>8%cqC!R22J+2d(0|kz1tcMNfoJ6Zo%*H1cp~qxS
zO-lBN{bz9d*^|{oipO#zktx`rRXwVKG4gRoB=G=qQX7n4rnA$Z1Y)~PfwWeHarZ<+
zrNfi1v(W*3)v~J2R+sX)pD%o>*rsFiXaE=hcb6OiU;z+~zFQGNP@={Y8NwX|i3)f$
zR0<Wrq_KIn0yX_f)gDZO6i;=U(;$KXlvDK#C!qgO6f5k9NQ=^4A=dZ(EGr!O`f*NY
zO8u{tj4kF};++zQGAtt49SZd07Db&yiK%juf{^f+=iKwua?&7>eV5yk>PxYAPTQ&S
zHsMslNziMOLsp4e#7n&5kA!)sfb^MHb+59n9CjLAt@=HB*B<4-@mYZilwla@%P@#0
z^a_nG0UC=4hUD(gTLR~Fxlpeh3RR#0m-<7&bU-M?gldBAqJsFSjbtZk9doW-=w3FO
z=NwV#_LY37$SMFXQpxYsA|&FD0m9D_j3vlasVEGoUy}x8t0&rW+l}*h0yq#(WHpZ_
z00*WY&gDTp8*l<Kt%-Z(k?;u|h#(P$9Qar@sc&kozJ2ebboEH)1u!D+);C?o^Z8B^
zK<@Ua+o=at!gC%`FE3ta=Pm;6-yojXzoQF)5gf&V01^-{JH&Oa;G|$D&@|@-XF>hD
z{b?f=@uE*aTnRrLfCw_WNSenS&WWI80GSza$t*RRAA~Zf7a)Y$>kiZ+mQJ$-tt_+~
zMNLo!O$9~=PG*k0kgzyLJeRUG1yzb7L2$$%RvjWl;C1)j%}1v3Iz;zj$@hnsicK*T
zs<)FZ015zlr-@wVSb6@g#gYh!w+5_BIRN80l<QPiZ1GW6g9iZ5!pTch>I*-(q~GY5
z(+hx|SExeynt=GXa?_P#1wfY7$C@uv?B83q6+8ei{|I?Bf=ry+liSXSCFhV?1*lyz
z=S^6^M34s&>vfV|1ymuEwrVRr+?<1wmc7#1H(STIgmCf$<DC2vZh%@(fJVFWTY-_u
z0{0l_<C>wI;(keehtI@UosKl3r7Hgt35s3^8eyoM;XJ?^KLCjnUzy@&H&OlcY-Q@b
zyShRCgA&pwubOeJzjk7LK-81eaMwmsSEN|%hRsU3xu%DE1f-j%oDnMN_FV}haD~d3
zrb`jSin;+^pUTu<J0}psoo;wJJ%>Z;OUNQk4g)W#=(9^DIU={6%9KR_#(YENu=ot0
z{W9<VH60wFeaHa`J$~V`)}^mT4Is9L(?JMAMC|9^1yVmEwvZUxti7WHGS^Z%%?^A!
z%{OM^&Eq)N1BHF`Z~`pRUjWAlbKxUH!^NkJUA*%ktf#L7TRWAPMKJ*F_yQF)5qFoK
zW%OKwxOg`2uy$CLui|Cl6|-xsOy}xUd6RGWFEn|{;ORhQgONB3ONLnQ3WmtK;_qN`
zt&1hiy@K>iLJ%X<1&B3HVb&iV4a2Ou(PHLfSxcmpc_Y>E_&dFA5CG}L9!W&Z55SJQ
zk=1;_5_@N%$|RcdrC+D_OB@0R09QobiKg_ospX)fE)O8qwn@XgJS>_37X~b|zCr3z
z#mH6y6rM2=pc2GvtY6^ml2z8fE?&G`6;8}~)EQ?cL!1UAgk{43L|sP48@ssT*fqdf
zSG-8d%N;g8PXVT#9sZR8mB%PWm_~C7>(kK`Z-JO93z&~~bL+(zv*?%lMF>w^Sg5`1
zA<*d!NRrGfrZ}0?W-ykbp-Q$v6QOiKt1KYWo;j4N2#~4dD;6tXhph`nLx=!I7TgU@
zgqS318HS16Aj0wR_7VMa%Ze<TtlBa}kS~!94`5#iOEHxLSki#LM3`l`10K!_dxbw6
zz3m4;M$0KSa7>s+pNGkUv&C4M3xxnc<6QK7+?z%Fw^dEVl&pvbEkIg^s;Z_e2NeJ=
z;wfE=?z0qtuM%}awX&7oK{_c{yNLn>BlOBqv=eZxff(!E5E3IRy$VBh5>fY6J1SbW
zRmqwKh9P^#^H^%oc+4F#AXW1vClL-edBiRN0WyeYxMCKiP#_v`IJYVXx*>~lss>Wi
zGSRGTnw>0L@lplVa-2_}c-3!!R8seJSd^q2RuLeHj?)qq5Q<60XvR%#*|R%3sWKE8
z^Q-WKvMB*5p@84sZ!qz?slpK0m@EVbb5rVM=>()KC5UO7fGv4~s?TzKYI$M+@Ol-q
z{Su(x@Wf{FWeSzZf>&Nj5sS2lzPTJWXx3Gk1%aReiXxp`3&zAfGwNx6(hSqGh`eqR
zA#V+H^N46yMR-snEIevNx=H_oz59x4DvZ`fO$kXLKnT4PdT%PdhEReay*Fvnkq!Z*
zgwSi~h=71d7ebLHVkiP4AWcL?rHLqtpwiok?sE3{FaEL5{TU;dxmn3Kva;rU=X}hs
zgM&&a`iCim$&md`l)guUAv1;@D4;cA?0yMFiXDHcjp6UoG|xbanL7`7I52%H$p);6
zrUaNvY9d0W=`J34xnx17G9E8tuR0V8eMW8g*<o6RZE~Hln)c50V-#==@Z<;`pC8Qh
z)gfcU-RS4p^kv}mj~Z_A`X_r95Z@!M<J80(_y@liYV632kIRfzVZ@b@#%GhS+P92O
zz8haIP@OIqlX97m-2h*l83S&Z)N7K#Qj^GHOu$(t_fjcfnq(ADO{mY)<>)ZiaVF4n
z6SCLjFkB+Fq$$H=Dyq+9bdILXT*ka!GYna#Z2nY{bm_GIrkqo=7Y|HexD>W?Q@A7*
zRT8P!j48jG*~<h{RvI&*@>!ZB42O=HXt|m5nkmHJOhU~xa>)d?LZ+5V;RXKR!g}WF
zKg>1c=C7}iRrSnCNG{NSHmySa?_fPHOEbyW`dJjn8?WgLQ*3Ym0U{xpWoi2l*0X<V
z>G0H&nJ%4i+|uELCCr)h=6}F?YF6$yh%XBl%S9WCMfyN1?{X`jM~gnUtbCHJd_OEY
zIFi#_S_aZsE3KNUiDa-ak$RI%N-~j(=s?6N#>4#IbfB$+9$7~hig?pe@gAjx+;~IC
zd=o4QiAs7SOk-2Yx)goGCP}jP4ihHkb6V`akv<*OCH6;J$oV3n%m!9(lgdPu>1cza
zd25^p5@br?n@USPpH7Zh%GR;|>0o;wWt&@WTgoJmck505<1`i>vN#H3Zxb`V50rOr
zP2YcRTg8-K@yPa}qa9Zs2uNdBs%dlFZ_64ua}PgPvv1V+_#GwJLh~&<JdORsv^OF*
zzzyZb?LXd8?Z4`Ll-9vy-;-q@;{84ZZQm)mRL^Arpjhg6wC_E)CkPgIK7N0(u$0cU
z0DEdO><At?Un0afj6Y<^QnS{2Zo(b2RCQzK<&D(IEQeR;4wo}F#cH#KmUFXHGjlq2
zGmegnpP^JbmTXVoQk}np6gpP;J1$Rsc=o}J^~m({<7>wi8Yld|DO}KL_5X+Ulq%em
zTijFz+*GIC)IPeY@3?7PxM|W7mpHj=Nx37{-L;L}b)4LFZ@cTox}&n)^()-3x40V&
zxEoHp-}vZmwBv4k;ch~E%ar@p|3_HQ!&S<|P3Ts@3c#Qz$yd?CQ>r+!B&8akD4|H^
z+qJ2nnN*#+>AAD1C<~NTBooynz6Z;1lc3-Qu<%N}hTqiKP0__A@T19XcRivvb0X?D
z`4zFg;4jMK6mh939tR*-nJ*e8z?kU-%z$Td3skGe!vc-H<gX{MuEz>0CP<hh#>;!&
z8t^di^1{((q^Oh0Is@|#fN{7jUv)C0-4tIOne;9&W^oJG;@yIy@a+QVID5y*d@U66
zu3q};ute^A+q)K=5;zWepy~54JUtAY5(7_1%K$xkKs8<7H?vd1i;}L|kh$)HP)FXr
zy54SzWLo2Zydsa<`b`s&^f1=#x_T`C(YHVpneQ}(?+&PW=QH{U>pM;+3r}~Z^A*K;
z1eAE$qCM+Y68U!%sx^~Flc|jAu^yveugWAx)nnC`ww+=@7Pzlhahs7dUwmu5;=n0_
zOITmHXB`~mOAD%&@$^4PamE8I;{D@#K(=t;r5irc7Y?*V6EAQ38jd0smlVb9_kPs>
z!>0eI&F_}X6d~$l9*X3m1pm7On+j-9^-2=|64s8eY3N0jeUK7?_t?3>7H(3+p?y<}
zd|mO0g##)52cZ1{kAv_4-wOXN`On{+zM9~+_k_|Ta1^Mct!ho*a;L8f&dCp*DKZa0
z;5cjr^B3RU+oCI=L!rc#<ew2<fDT&FiF!h;jJIe{V9;Wq?`Gi6PJp?U_Ydyx5!osB
zCW*>utXh0xYeh<n)R+6Ufe%wt+T_33?Se*`$v3(@f&+g>)o=A4fJ_w=_PF<A6@Lk6
zBnWnI3PtRh(|##*O7O*PDd0TY4iYZIFUUJDz7m|M(u%hEdq8oxfXrz!<wM}16xC63
zu;{BF{Y4?lt-n>i{E}kXR)d4CuxuB00i4j}PX;#Stf~6DHm43!+G}^$J%CI%$yDQh
ziQNCy-$K+-{ur|SL9qCGfRmAWp+Q24_L@l<U7LEw>9DxqxN(qg3wf_PHWuxBBjQ)<
zPN=$Ykp2BFhfn(<LSg2#6c#q&9^HW8R8TOETsw~374C0@qwokwtTp*5nCesA1C;Iw
z+u7W|ap^OD5K15MHSqpckVd$Bz%A(|a@+bO!=62jcz_2OWC0HFHA?83PLJLVZw4Pl
z6o2-`ZwhLLSP{YvWWFfZCtq4?cwR`M(<8hsZ+csRlXQ!Z(p!(P&(OX_3C_;neZ#+J
zOCQOMg%#e6bog|e|Jf#y>dU`>{BR{Pqt?6h)o~3P6g=|})`Lb>@kF(4fnsH-VrP77
z6{D(qQiMFCYGqE!Q%-7dQPtL;Q%3z=6%*3*sA3h#P`fE6tiJew^lOUP2dLkIGvN>E
zu-6pRBM8S$pwI2xf%~`j9%@p6G_Vrzl-QZ*4!zTA#qVlh;C}dSP2lN+BdpW?Xp_wp
z!Ev&<r4)h6K)2n5#FP+=T_Ws|fTqJ{8<9DJV&dQ+UE=xr1Tw;r8SIh`3a1ZWki%Y4
z6cGQDSAeAJJuhW<$*$wbjFv!dcwgBb(DY3*qj8Xy4Vm<jPg^nBr-(BYt*`&miTxHR
zv?xhnCj2;-9CZ|Rr#L~PhvH}VPYE1_H2Awc$tgZIMtIE2XlA<u>eX_X64(Wxdqxoq
z_OxXUx-;f&L6WMh_c2MOdVDU|`GWa>3+o9^mR#{1?GGQByU%}E%XN$uGhmJbzc^lx
z0OV=N2BdROMQl(vDv%#a*!FBpBHglTmj4t3x1aFW=UM&ecF%dHVfmAbw{v%j-XcAF
zcP*5m5K;Pn!g?}mBk6J;ws`=5Jb$#JDRX1KsM*7kb+w0+qE6+F7cKJrVafI8&E6wN
z{KE1Lj7?#4Eoyn*RmFl8t#ZoOmENrVzp&m!@m0^;hhW*beF5W_bK}A4llsN%Q{R(p
z%def@{?M6GxY}3Oyy<kAuf6Rn`#ER%`aPUvT@n~;`%7zj30AhjM-e#1_Fu3bjq;Im
zNQ-3KE3I~ky#?hW)1?pL?;P`=!<@7uj00R#gSe58QG##PE(}9ljNHmy)?itks0t%e
zDaIU&J|?+h_cKjJfm|K-NP#?kvEB`rw?PZ8NXF|M?ge!Ey>x}Nj=d%tT30TQ1xsAg
zm4xozDvcB>^=|AH`rpBNeIgICrWbP5iCM}V)g64uw9=<L`8Tf3N|;YdKbM&ImVfJ&
z-k`EG&flPZu1JLS+9s5JOHRf^XzMBm%+iIk;cFm{TcH>V#_J*oK>MgGMu)|*z!b<4
zxv`qUlL}u;<u7sem3%zc4r|5_vuF6Vo5(=?x!<^&O^A0fGTe~=(u0LQBEovo1IO8k
zIVztd+#s#lB=0F0wMAwrI9@BSQ9h{}693tFw1s4-Ia*pbs;#(a_icR!wBH@1<Zo{w
z!g|Qo|Ah5oCf211WW^W?m`OqI*ih?PyJ7z?!{y3HJ-Qu1t+A61zo(S`!g?+L0qafu
zgY_u!6cLyZQNjC@LeFH1`8wKe9bsOGKfg2oXTkq3tS7q~GJU00F;9<0+wTWT^qENr
z?L_RibtCy_ndN$H*PSsT?>+&z{~Ojbr{W{VZh(Jby`1KMu%4fDRpQ%+j3Lvn{=s^!
ze__4I{|W15eee^h0R1<t*I%|HVV=%2LLbnt*77Pl?T5+6>WeEoGM8#ctKu)FrAxq{
zDEL}Ar3W;Q+}$G9{G5NiRQmq@FRVAzd-FPX{i`_IpTEX%6NS=2ks><RaKZ!%BCIDg
zs3*%gOCflKh<Oy^tbMYVWqm|S<rp|3t(h_iBf@&LvwGKLWUp$U4Mhu$q^k0bOBiae
zCrJ16(iRHmSc6|dyPQ)nLkF#nd)Mt3+pW4-N2Tnw-TbMV^Huy-L4x=yMyW|&=8i4-
zh<;a(3gRti89`(3{D_)jSZj`TQOaJi*?g9yP||NuRvW&P>G69+x}A4OIpzW5v={~5
zW07&h8idF3`w&ZxTaK5ebU?)90~J3oeQXviI@|E3yujDmkfS!pLo^?62MVGtFh)NQ
z77UtR1q&)x$3B1S{O1yHf>8VRIpR#Egg;iXE(A?Rl}f@d_E?056^x)8OQYtkW|$mt
z$I>|BlZ0T{oSX23bTB~h=CUcZA$3MFsh_z<>|XON35E=r9@n7F)udoPU2feBV9>4$
z<f^hO+Y)D{Y7GhzJo=U6Q?Q_lz6g{>B9S8xPJtxwQiciWibHynC0b_bZWRS`F;C6t
z4t&jt@$=@}>+#a#GNTe%BI7&TrPr@y%nPw#U?6m&nl#CB^8WC%bDh;-u8HNU1=q0J
z5VWt^R_9dey4MfM`e^2?Lj<UAGoAD#C^9Di?tpn^t8vd&jz~EdB>+qgg1q(@@Wm{}
z&%8zW5gilWODj<sB;T_rKI#5IKs8RAdbC7<ucE;`tz?k+rGr(q@p?glSY9+vTkreq
zOS3-@YWVk(ue<QkvN{Mb%aQ17OxERCTO=|ItOBX8SEi+*yLf#A$z8he=_xoeAfJez
zSq6DFy(*?^7d@o4+(r?%1()p~Clfdcg6d=@@pg!=s%a1Bw);>%WI0CK^O{Mfm(>d7
zen!dT3AWke>#aPiqWq{{+;FTyt7DI+?m^)7yN1lkynCJ<VtizOd`4&<6pr8FNU#{J
zm*<m<_xH=e=18XEd8~KGFiH7P+1;HUXUiSA&fqMQaaZ0!FMz<#H>lHD6>Ktaf=GX*
z-MRd;-n{)eMNo^HlIl5@Aq%XBtc1Wst!nyIf@L$$gP^vYi6ZrIJ&}tQn&4$u_C(f~
z%F`#=Npx?=pHJyY(&o9P+#!dMJOV2KU_b@K<|j0;6nNJPFv@$4(!*IqeV2sxsskxc
zXCS#xNJh%ltBlahnGq({43J$3DTlSQh|YHm*xj+0chDq}uR1>sEs@AJx|AZJY*-M{
z&&%?&BqfQ`G$UqYow*)IA=|=Ff2)U-vS1%1+Cu!Szar^9q$K#4P12Ha@2E%JwTrq*
zR#Fucz_&_L)kpU1!e+#ohwDce)Z6IHN(QMrXHqyuX8ocXkaQ^4-&)__(|M?<TrLfd
z>S?Teha}ezQya5Nc0Tk6o>*x!49x5^kE&%#`nj+|2K5BHNU*OP-KLkE$K%K|Ij@2d
z;5j;gD!`O75m-mt9{4gWH8<%*wS<@1N1GlFW4vC&yKubsO^&m?)Zx2}#2dI&QH55p
z#V(S%US^cuL~K1Jv}%T~E$HP<?vU6T(mrpmZMGUhx&{EtW`M?yv<Bt)mLWK@)T8Fk
z_mb6Q)@i6B!5k|MHy>$eb4n1f(!aJpC)Hz#kt7|;1q6h3h74L<m;(0Eq++f|a(2>@
zA}2}6S&4=B3j&g|i?}mj3kfh@QlV#cg878<a?tH1Gxi73q?wUDy0}yvmNVf^36yc;
zI$pvuPMf5h?XFQ9NudG`;K_o+1>3ZH6cE-u%89&c;6M)<|Jfjz*BQxTS~$AHMi%|n
z+zKR02jFhJ4ztI*@J(nYfD_{rZH|U%L}iA{&f9=oBV?yXsi(p?XK<YAAkA_r#YE>*
z+>Zzz=&PKIKj(Wp%hEN#XphrFU%HFEZgsxe<N-Fi5-)G9zp5VUz7!Z^J{S+5(V{#v
zBv6(Gv(6i!$!iM%8jNosg2m5?s$TOvJ^p##3$0jpjP^sKs)v-c;TBVU3#(b7azfH?
zXgQQS+i4dgcNvhCGsvY9>bXjmL<f^2^4E?|NwP##?-I$}InLv?#GzQOA;QbRJ}j4-
z%;!)}j6O7)P_Za$vGsgJ|0vQ(Esr?HK9<y`s>e1~@hTAhsd_U8t8&_CwxUnRNJ>DF
zvcNq7_@d4q<i6^NiU6tL%xe{iK~*%l6#&avIYdFf8m0eF)$2zn;z#M5hj|R&(gs%v
zPheRRsx-i)u8)hM4y2+2L{(3VQf7#W2Ky_^Rh0SW4yH(F*Ft;4x@(oF>X9w$6bh^i
z9*UB4Ru_FFs(SUGq)(7CQi)PhiSQX7g&Km^%3B%cb>z~7u-SDHb?vp!9P(xM2@UUL
z3gVmUt(Ic6eBa*F(5?j3Qr0~uS3+H41Xb5m)BzwXqN+E{lR26qp?ymNK~=k~wLxZf
zgoM!7Xs`;%qDiGy1#~~GQ2O&L#JV7tY>?_iRgYXO_1!B+ZbuznyCY=vQwqi_!zdxU
z8cA&~XI|uzR>z3D;anzB)kA_wwPJXlW^x@*m8#d2Lko(2>}_aG@*-u(xLJ#MYU5ST
zUjJ3~j(AZ-RZn6NK~(ib$o{H&0)wxacyHSbA&IKqA2$=fH6)?NaJpu2$sO5GRQ1Sj
z4aRd2RlQ~_2PX_zhEw7Sz+pl#;3=<SnH@^?!3j~-!xPYy{2vFa*d#{8jz}Pcq7%VQ
zSLO9}?RBlAp<Bn7<dR#2L(6qH<wU!d&-l)VNI2<VRZkTIAGyo1OWH1(NY+9|y(B2A
zZK<;JPAxl;)@dX*3?QXE;$*A+wS17xVVuK(1-0b%{42jkHqf4^>V+oRJVvR@6eGe5
zA<O~-Bg6C(e^ou?<g!7jN5@Q!eZod|Vx2~2oopFV)gueVdp>wrb46`6MoPQd5zC@!
zr{xUbLnn~+4zjP1|CwSmPG(czdZ>&V`m5@d@SC1sO{F+)-=K~>CO20Ww7C9IuOAuS
zlZ<Od(i^5~Y?Mey5LG>`q+2PevbMG-!?wYEI@I-K$3#_c_~S9M;~1NGGW?9F>WSRE
zDRr5c{mW~QQphDC5pu@ylv8NAp&ZQV<>oWwHo$vqT6ra%q_AaBOV#^SlmC1l`B&BR
z!w4kSx>1Q>qSk%7Hf8jwsEMi`fvD;w{8jY|G%Xsi;9j?YWNq0I7Tr!}hbX{%S%5nJ
z!P$pZz2;$#6}XN=mCoewtrC;Js@``u4J!%(&Owgm4Yfqwzp5T5(a_VfmP9cBK{mF0
zOTL9+DI3(hUZb<JrIY+o>&)t}s)y3y@2QXJ1IG?Lr~k8lZN*aqMZtSUs$;5MqYaSn
zi3fXWm7kC=-!0dmt_90zaZg}r3kZ*WeA$>Eg7NV@6G$3@CKZ94N8(aY740QB$&R|V
z!G^|&$c%8?I0-E@vTCzzq#@Xes$M^a#bzwC;uh+<xX5!Y%9?lq6K2an5{Rl0H$n4B
z(V|QZQPm?KsU_i;Xwc{^MxnH*dNj?rYje`$X;DKKj-n+e@uT13Z}%Z6XB=M+eCMie
zp3rjZ>q{3()uh}aG>%IICd~a+_3%Qs?~=|Ylj5i_V244b=EY_2?_*tVl%boIvD&g5
zq%io9F8G`7Zo#!biym4&sUC?B?EsOto#~g!Kj>-~Ij4o>G8N58+9)^cxWD)i3#iR4
zVOjpBr<txTQ_!uHMe3uyKA`RX8p$lfj+CiW1K!q0(f^{p6z;u2EjqHMzm%?BX|1uG
zPnLEY7}RndbsZ@}_ax?#?$$8K|BVr1i=9xUvi6?2dGOhk{Zq+AUiY_uRXxJp+jH1k
ze^tF<vky)?y&U~n9QvAf`Op}x&ZP`n)@mKl)iO(DKh}Y$>Y1!cURyoq{LWGH)6hoi
zWB^0Mr|WQzVYT5lC_&ITkU~T%0w=L&W}G2(4D>xD0YkUn@1_Gu@6kG7q_^Tth89Wr
z5M(V{5pw>dT@S|jh^ijBCp|xBw(lnl`MaR|5bEK}G)<DCkp)XfnGMd#J@O6x3hk%J
zuq)cCWj;(@C5$3u(wvBo^!Om6s+YL%jW#gw&m~sj4?cLI9GU`^6sgsKBgmz-l`7W7
zR^DngyU@UkqzOfIfq0FYN4sq#TMh_`JL}Ae{Q4HWalm2d;tHIZ56Mb_tbeVALS$qK
z@JY3C|C9xKPw0S$ysiYE4=(y;uZi`0bmiu~4VOj6@4b^s^l9)ARFu?juF>dp*VU@g
zFnMSxmB=YQ!eg<dE`i9fEYUz=LVmT0wGvf5qJUVTGowYbf`zA&?El#GSZk<g87f;t
zc1g9fG$E;a($yuH1X>dW%zvSdgyVta=yXrDR4?CM8FQIL5fLqQx*=FWFjw6b@wlsh
zRlS+pIxAS(5<J_H3r*;c1uOqE#HBwaN>WN8k#2?=>41UMkVvw2X!s!{B>d;Qg!HfZ
z+S7e#z7QMu)+Ee>V76FNMkDC)WPHI1q7Q-<Z(h@V50#%{>=`5hb==mC4>bhbE|L+Z
z30QzLd+N4cGuX~(DAD$HBz0ug=Pw)NamN@CRlV<jw7z#5pJI)FUo!#in_PyP{th+i
zMj8_VJ)XyAD*seH)i84fISczRONM<@>3w52Ia32UONPhR5s$4r<;?HP**=gn#>!dq
zhuLQA+t)od8GCHs^w_Lp-zMd;!*-Y>5!q`BvlkCjL4{of$Xnc$bA-q{a)dj5+PB~d
zcSRoDJl%KdmUH9SS9^C!&fLGC88W=hjZ(iRaTH4OSJi7K@s1$;RrPAZK_v+qJ>hgm
z!z?{SRS)YMhan2Mz7MdXJzd@p<h@(Nee2}?UWWS>A9&Zv2R%6msypy|6YldV{PxfA
zfXi?nkU~gDSBS8J_p9)5>BGQ~?x5%hkaoBKdbrQFd_Y}S0C_jMNj@_FASA9k!uJr(
zq7ZXWA<DQrDqlYOrotUa_nqxS-`^3z+wz!*cn#;n*eBs3rwYLa3V&5Si-_p_aO|)`
z;wyz%7IcI$I?AmlK1BhecZ5YoB#bFwRgN$bJs9)ubaOPwMlr4KAUQ=La~&PPY;3>*
z@@^t<)?5zL*2m}mB&vD|xg11QZ#b_>lc{EyQ<bRd4d+86nN)kPiX7)bBXfBo^E4v!
zrH^Ur5z74p$ahV?8ghp3@%OG0RlS6JPa=isj?3;v@=YH9RrR)xOPeqiD%i4D$EDrJ
z_r`iF-t<=7Qz~szy7x+{460oIzW3gGZ^iH4`*q}%uX-yz`>K9w)(9&<EIz(l7g>c=
zu71^9{V7s;<G9RCxym=H(xC4_TvUD2N&VFmNZCnQ-AT>%@uMe7&DK#(pc5(gliDY}
ztt!g+vB(F%mFuNX8yTK7L89-EMYaFbtQ+flWDwm_tlY`pTPA&6k{?+j9a*RmSzvse
zr*cUy;Sj0pew=szNiOs_pT9TH_bBJ*sS_?-`AmfX`d`9&{lnW&0P?VBEJRh0Y^=Ed
z#s2~8)nUg#C8{>I;|yctWBtTb_bY=)pL_yK$?z~sZ*4^URqB4FP|X7JGtRSqc5uw|
zmjno1FV&y^*EiJ`_0A^8n86=ZgN~vXQ=TrF-<gja<Q&%oUF#iwulc$OGt2*U4%Gkt
zUJNvpz+%(C(5(#5RQq&z{@Qww75#Lj8?bcxbd@KTpzu%CTT)v;B%!R=%)cK)S08^>
z;4*;*7f&sr{+{K0w&Rqu1UV;t{_M&5+Pz^&V*CttVCLr#V~Hl6M65E&5Tr!&pQ<-p
z5Qm{MjA0@f{Qiu<Sweu|`gfX0=wuLdaP{8`8Y9SQHfO0D66BuH0awO>-<}$a3QyT5
zF*Kos(w~GDj!5N&E*cBWRU8QeiPmz&z<Z*q7fQmga3GL5upANp-5LRcBhOyNy(8D|
zV-efLp<Sd*Q@G8QN%V{H*9&Q-=iZv+8f9r|awVvKrwejb&gIuHy7qs-dX78bHK?ai
zxk}{!g!L9gY6P>!dBfNXxR@i18>}8j{Wq+q+=&F0y1gipi)NO5tK_1Bt9O<9(4}vQ
zN<<w#9G1!*C!z4R*>lzPWP9BlbDHa}`}C{84xb;|8l?FZ=Wo!>4_M~r>LTTJnRWmZ
zqoSKPJco3Z;diIl3{Tm^{oZ!WC!a@gMC>e&z`qK86DbW?9Zn;{dSyo?Vx4ytA}%;T
z+t~!_l-eV-vS`}Sl0WHbQWKGL34&I~zXWrYM);XB3T6i#j(?{)>l=0Z7AtYwpFjSv
zh)oQ&<B-JDmcc~iCN)E7`hZ+_=!SCrkl9020UZLYWt+W1b+NZyMu+HhICF`x-ef~L
zqosrF5VPZ**_y}93@_L&v%^hE)pzE;)?k$kzdC~m*F%!^<b+IJ==Y1<TCviby9QZY
zDl+u?A%<v|Jj~>aEr_NTO0sH5i~W@*U|u#e4d?8TKP7Kox;vuydE{$W;5hGCo=LEl
zAg965-jCvtP0j-19gM5-u9lT^#;h(jlwl4vo7Yw&tp#>T=?`6K#fodZuhR6K)bFVB
zFEGrMWEjBvE#TwvlZ-!{OmqlhT3ZC5``UH$Bo+~}Fx1s<N<IMG0*9D$FZ8FIMwUyq
z<X&~(OW{-tI^pMWx-$8LQ(_~Mc{%X8P76*~#f0=j=sb<@+wc#CFBS^cEMIWGbZ_hy
zh}Ih_7KpJXt4Y6fETjDSA%TYbC7a@?qfNI@NV|K5-NhtLt{>|F>w0FnPqHM_ir1|&
zoDO#+XE;=y?Q?<sFR5laLsPcRlI?qz>!l5SV|mJ1y}BGmieJYzE0efS#Gfe>NZs=a
zY2R*?l*jh1_*<Ahzghpts%Ta=^`o7L?G9|38PUsq@4I4Ftozqa17-*_7V#d)=B|0~
z-cH|-|A6(LeC#>C;MgS`C)?j1q|x9E9D>~}+k0|;yDT6NUT448Ul```h?bjDJT-jc
z;*O#zo&fqYcSCqunkmo9-kWpuZGU>#do>yJZ0F(_+jmOOJ~)2xzXTt?ly-xZ>xYA#
zjtupkMGh`Mra+sH)<5lk*mn!;{~G$~WHoWP`eZewDdu2Rtbl)OocsJw_m$H90|hAL
zg?o-gRhe70;^uy~a4ye>lb^46Vo&oI&dySv9hMu!=kisa?<&x85(4zezw?koSv4r<
zaxlEnE4_U61j-9(_r>k_#f2}0fn}>;2L5!`n%$H~Hbe9dy?V^qgbaEQ3T|b>lIq96
z;roHj<W0Ue-(~Nmg7}8nrrhQQl!Zou823{3wJS18z#76@ZR9A6wbDj(i#WS%hMAu^
zi>2Nb3HEU|^BPwMy<{E9Mp-TQvo&COuCBt1An!+DgR6JynJhR-aW`bsWgY4ZW8!nf
z=M{%8=|9fuH4>0u85yiPvwV(nY87lf#NCKFsf(9(j}`8gO4SACwdubVqPV*;r=^r_
zTJ#H1cTG>sx}no*fIj<GuAt=Wa0A-SIi)A6c9Mk$V8tGK6oJ}<X=c#CD*acn6n(9j
zt*4>;b>q^>P>*-=-3d4B1X<f{$lx4G<63J1tcmqWLai=oy7(cUk)C9U3mhcYW{nFM
zKcap@I_$l&QE|L1tjs~0=FcR^pobb(C~r@;bk3w7aTYPM2x>8Qx|YcCJ^sqAkQ#jF
z8Y>Opp{^1;M-EW7hD8mi&l_rnOYe*kzh$8BvOZVf#7N7fGK2M_ns;h1s8iHxFt)uc
zHb45YfKcP|22sh*)&bVRo;WSFY_0J!Vi{;24iH<rOJO^{Mty-#WMm(tL~Zal_AZfI
zw^o5$PRJj5nuuE~1tmM%R4eFy1yL!jE>tgQa$Ury2#F!|<NhESIu#e#Ccfriqrlo<
z?F$%W+0FTj+-PgGzxmNx=;T;hxtokMd)%A1J>p{MH17BFXu{jREje(gr+DOLyZvs7
zaM00^R85r*dikbyxTF2Kh`;_z&Sk2I9^H)}4qn%b)~&kk#i~(hcq!6Yd9{mJJ!IfT
z=caK_yyg*RY=XQX*8HM|c^;=$X_)LS{;qvPe}<~k2+p;B(Ck+BA%DmC4=>qeTs)F(
zjV{skoEPlfLrR3K#^~!m=h&yZ7{{1ZeSHTjTBwz$qU-!&YxI`Xvbmsyg<CIKsmG-w
z^k{g2ac>;u;ILH5IwJ1TmVArcjp-$8oYr#>KR-@a>iLo}di}N>PZe4&1qC6s#UI><
z1_c^BgFLC%JdOIDDV@9w2D03BZ6r-I$|{+J_n+%W2a$Q4XeDq`d$h)6<z?`@uln9N
zprpPdLmlTe1WJw}Q%CL1Xhp8lyn&}k98~K2c|&48YqezBzDcJkC1*xCQA#8>D(Q+(
z&AMPZiI%x{7hUA@yUE5i^J`!6@pdECA440&v%W!ihU@*Jvl=90ymK2aOBcMV9yf(?
zY=;K+%|9yIBi9%Ca(}_CEI~Ux{JhGz?AmAQ5wspNeEG995AS58;8lmVn9Udg7p^yo
zWcRXurSO-{FKMijiw3SG4_;rlt;Z#?)(S4B-slN+tAG3mk@n0mw_PHn($J=w5MXt3
z4@=5}22tG(yvoP9;$w>*=Hj+XjR+JX(*q8Qe;n1Tq_G%CqTB>lyw9%t^NF=MZB*&w
z9$oAmPF~Of3N;Xv---@-Zlqugm%ZJ{x;`};zs=E)OVTBx*9PNSGI{Vt`we%V57QKa
zqs@O}wbdpqzGz!0A;Ri5u*pszm5jxBQ^f<Z%mXGso?Vho&kw_p%l#$WSFy<hI<VKD
z1<2QX4V&pFlWtM9zKoVts81NE+xW=^R&70g8ZrD*U@wEG|05(0U7+o>o6mDsm#5G@
zP38_~L0Ip)WE}nE)rwDL_w`c{(kIptgnMqED3zG?Egx+lg_oXQS4aPZcAM!e>zj0a
zk1(U0V@u)DdX@g>HacReX)4uJbBs|tHt!^n!uyqQ|DOiq`E8!5{d{7Dv?(C(r{~R6
zevY_9$KZ=yDEDHz-WaDvMV?fG%z5iD>EX+p^oL(GI)i<vHd`-D)-HB$KhGvTNHrEd
zSOI_hCPJc5CX6E!{|D=d;>EOi8*4I2pYZW~L;&<~00R@ir4oW#;2U|w&=84?zq0NM
zwF!lD6`KXgr9+^*^UQ?@9vDCex(keT-4)1A1p3pFlA3^S;lVL86y{V3D_cL!{AL4X
zC{u8tEFxcd+aE<q^+t>8cZ;pNac(<-JcEz?6&=mI3E87Hnr!E%MtVHet1QVwKa$t%
zo5`A{HKB(%=;<zXzjJQIj_@Le?hUEvP8Hp{pP!u!1PRHsaDJ`J7m{5Iv;7L=Hx&??
z4HKKql#+dOC09~Dmw{^!1K(qKCBUec`)fs*OI|!}$(5>uF2hh3ea)2Vb?dHOu7H!Q
zgzN0eP~dlytxCf$T%)4xntI%v7;q|qIZ=z#IbP(_wF;PtrB_72qSv^me?T3^>AUuz
zGZ~y8;gFMbJ9b{k9Gn~c6*@vxoRVRBZK;|-$3|z`Z{SmtR!SZOw|)b+uY1YuHipAo
z?jL(Rq;oKecAlTJ@b_R^qNleRMC<Ib&bkBUkmb(G<e~gE%1pn=NzW&kw<4DJDPH!&
zvPAP7sIkVG+X%!^P)QrN#+I>0n}X$OnHAnaOa-n{-^S1ljzQ3?+|^S&-$<B_R=H{n
zncwC5ecWUIks?V3rPVfLDyQEa<rQPeD?}OYHJgd8nu=Goi?5nKprR!re&W6K;<nxr
zSB+0mX440l<Uf!Y##QjQ%FzGd^ez*$*p^8sD~X=oD%CYi-X8>g1>v8kH%KFf5I&is
z2Dr%fBIvp_Wz)!o!`7((_;UA?l)H*R{Jezo=D1Ygl9s;w#vKgi=5qRN5_NN_PUcL7
z+vj-tboUTO?|F(3?JpGRKFoOXkhFaqt>rl*Km%QcqK8;)h@KuPyM7h$&MFnFi)<1J
z$A5Zy2yn2g(me+DFgOK(6xzpdHDr!wn&|2AB0DoUho~AA5r?P{(Hk9dKN&QBn`<2A
zYn<lKqRsm@UCOBUl7~ofyZ(PYy;Lo*z#xz79H=Fpaf0aSRRLIC!~$JeC+B(C{~(6*
zm3v8LQuwc4hOAMuWBz)26_Sv^A&zNHYAbr-tq|Ccd5r)@y$}n%hyp!FTFvuD*z!#7
z1&TUU+KakLL|ap~kd)npK!d7!6{yA5q6t`<;*q~5T(H1XvcMBc@{!=8o%BFE%<S1>
zRSMD5W8@V+s-pdf)9p<bjkYlQQed>bU}XPWPdNRch#+K8Pn*56l`O=LC(%zC`s?XA
zldw+_sA&yk8Hk?VplTbVFs+>F@Na|R1%=UTYM;%hO4pzjQrv+=PmfplW2o=iA0z8R
zOZ(TBH^ZL)DyX^$RXp|Lu2}(F%y_g{L6%lUT&n<Pn)H=09=<dRb|$EECD1vZkc<Fa
z+7LZGQXBJln9M#h18Z&y#$6F$se#i>uW&O{&wSI=JtwtH)3tQ5bbM3j_}<d!R#<+?
zD!6||@D#jN<ZOZ6Jj$*%339!e`&)PclZV0}bJw}^R=DXGg|+a=Mc!$jU)&}LQQrke
z@kLi@W;bI7CumYiFp@g>bwkvSp{y>?nWkSRIWUog(qZL_r~uDL5)ZvDkpx~3UpY(v
zYi=P{o)JZ!T({jI&+}wnpdPO=XKQ*qOXD#Cld%AK`YIX4w7J?tD0286qZfTznSEOi
zJRySBxA}PjnVz1dbLOpphYrLtF`QZaina35jq<*qm~XE$TXh$iutJ1W5!WssyKcvZ
zRJ*%41-%mMAB1cW>=GZa?&kT=j`@Es3gUPZ6jX5gi~C^xe|UNb@imMehe01_pw79A
zR~Dac+5^TuxDrEmDDz>Eb#a(I3!Fc~h~x*m31UX*Kx}I+{Go5MPksOGTAc<R=44ar
z?jeQ~rZ9wFn4@)MadD(DG@SCErw7;*qqd+Tv7To1CU)&Svewuy{>#&wAWp#=itnzv
z=XCoAbwz$+iCvEnP;vHJ<2C-ZFD9}I?z8SAc1~h;M0dBLx?$WiQ&JrXTz!>nZ>@tq
zSjY0PCh*(%R}`B}$cgW)gpx1N6E}$6=i^~qWrwngU!FPpv-QLXvL>0cCW)f86$d@O
ztb$KE#W-Cs^FO$@=+zpkVc#lg`$?IIo?d%=RKwcM8%K$jtZDfrk+wG44kf~V#^UX~
z(9|5x3qnHckVP9A6Rk^nmSRkvb=t5^W<*iilmGJcbcvoG0=D*&=lkJ*d3vkR#B4Ta
z5#exPPT?z#iEruHYNw}Y#fwy`^d(&G8_d{JE{~Gu%M$VFDM<ecl<4Wzz!^p)c|218
zd3p#cMhr_fLFBWXu=d@88+SQt;#o})i7d882di!`ZWI|X<UNw7<%5%r!~MxH#rK@O
zW#D8Yl^m#1GCl%X@LkVK!ASAE6|Qezo30>koUel0bv%?vC(c|bt;`0@BJVv>Vw{d=
zNtX|e8RD8)DN5nv*~k;SatuyJmx~tNjp(8zAt6D-{m0=XBrAZTf1ci&v%4~HC8)9@
zZ1L{ngux5v8FvJ&ANbL)DrVQWY3B&R2hH!#R;w-P=?_*W(4^5scIyk9NPiXfzSeR!
zq5MXa7eTSgalhhs<bCp!`-MW4q|SGBHpzF{s@&M!Sd_)tPpbZUdV{22FbA4|JIe3w
zDZFb)TcswX5a%aFoT?IYtU3B}o7}6SKVq7?PM|&CxNGbH7^0`go5dw@;{^g{S1NpF
zMYa3p;my9>OH8Swr``SHWNJV5%9uVjty+%Yle)b=*CclF)RU$mUP#djbN`BQpB!ZK
zU4z`aCdIywSKiUL!yzA?Yqr@di-?{cqPnKkBEzgx|NY>cGbNhn=^?0123d>Zc`gW$
z1831jC6TS*M#TFTnp4;PzS{HSR*HAUW4v@=jvnZ}SOaaE`}Q<BL{ATcd0I((K`A^!
z^z?WiJmPqAPWmupjXjU(=?y{#6v`NRIgh%CzoRr^@4J10wZ-?0lJ2#hv)56ulkmaa
zWk~K*ln%USYI{W12T>)@(L%5hJ-tE59LXL0H)i#SK@QG4{Vr8I2g0p>T%3K(K2_;y
zuH2ViUf$~*ZksBE=!Jp8+SW9cXE8)ikGGEWY~*zqp;wn1A0P9xD)$6I)i(yoi${i@
z;iFWuACh<t73Z$?a4RkkzkM&<Pm0UV9g!X#@pRBLFLSp#tJN2(JG~1!DJ8k{ZsJQ<
zZ^Sfnb1CT?1og#k8G%Z8p=>H-4JyQ;jpikuYU+N>FtH$%F*KETXQJV(Wvt(*?T&lr
zS*s+xk_Api9Q0<@9HlI`^i`d?|C~T`CL-U15|43dbeKDxpV0x%{*ERW(X1pd1;U@=
zH9i=Lmis!bqNSe_a@UN@%jO}^=WQJ|kZSI_<u6H{$=BlXE{NA*=SGe(zNn>)%V9*a
zJ|o@y!D6}Ko2+y7$QaH$G45nh<Uo%5T+W>7<?p^SzD=uTrQ?0~gl|goU>SPr-SGLf
zM_li9bl;D;kOSc)iEPUsp6ZRoc%ATK-+U0;2|FTjGJ5Cui6yvJbOpd1yP6aIoIie*
zBbIaXDTkQ4`>*qru!2vN11~1VAf@H&IwLDrFPJ?~o?S-QS)Xm}-F^0@++C((BOr7=
ziRkI^ZgdPSo1JVT-HE#k7=A{QBsgu6laNQ9FC?jNiT?BS)HS_1;af54dY(>R1)8}L
z7b0HA;C|X|y_zo%iKnXc8y2Y8Hz1ZSTQTLd0aE+^-f3>k=?9m7?!=<j<xJQ1vyVT1
z$7Zgod(EisJlO<aVOIha2NF9u``mlEB|m*f8Jy35mM2JYm1*g|*?p_NC#_M-a?@=9
zQO?67dc;eUt$E|;YDbt`^5n&??9Kgk>)&#tu(OZ9<JPPW6<Al;6$TXUe9`~w=>cOW
z%;Wa4agp{K2lJqb9C%j-GJc&jWcHt@=c+V=xp~wS7nY{sR#bJgFUB3Uvn;Z~9V;z-
zn=~Y#{NxeO`Df-+*;?wwh*OL!4=X3Grc&z{f_gcd&4%<~`{Zo?(<P~E83FS@V7)8f
zX9n+&q%n%y_5U}lcQi3S_TRAH_3V*3PTTHZ?p(HsXL5bQI<ples?jHBFJRTfe_=hf
z^lJ@s4-M}r$56>NE;Lv)*~PHJ>K7lW?!~O9&t^&E-CveI)tzqEjjdnki-A~ez3vU&
ze)lv(q4nd_JEyuyU?Qy7UZd?`E2r4z+I=W5Z*+`qb8inmw;RY*>e!qrQ;7hoDqXuC
z-nu-5<t4&;*~cxGjBbYf-*brTpPjNeZrys-AANd3quLYLR~f?5oobwBZ|5PzSFvUE
zcJC|Z>C*;QHn;HX#WwTHfuO_Py^WXmG;*8*f_6uLYnzLs@|0sTeGE6cbm>mdg<D0<
zHtZA!WsoSDi)G{_+t2>X`B%zCHovm9yJa4Ll}MDqRoWY>N6v|d<JGBx8}NEKmQ`0I
zH;&}QZBnlLEQlknI<43#Oa5c3TlUr?VK<+nBZjFQ_uQcbw(}!?fX?#P8@GJ+4;@5F
zPl71vne_*~BuaXDqx4}5L`m;WSyh&H9J+0cK1+m8=q`QQ*ZV|CFMpJ0vSyIF*eT(y
z$6b)F5>e9I7<mahQxs*(QkI(VdXTMd$CQ&Qb}%LV$r)yocPOjmU3by%wJAA>&dt$?
zTUaxWV0^mzg=a9Hb()91?fR^o0eT&J)fUwWy4v8>-FUyUGzucDa@;YZT0vVYQZua%
z@$a0z-sk6BL3e2ibZEm@rfGPLuP4*ZS!8&L6rtQHg$G6WX8k_an8F^_=9wEvZj67+
z>Az^^f9_v@jSp7QFvQWUy;=Q|Qn(!@Alw@$C+<H&Z)_M8u%P_iN;H-lXe7aE%%071
zxV)Ye{~d^YsIi9%+EDN4y59QqXu{yv5ItMSsCqRgB6C9GbUk<=Hd!_J1=ZE&?_(Ya
zhoE^Q4H`L17IDW#C5xL=miz`1LBC*TWviukZBeVf0|w(Kpr_r-D%)=_HiEU6Re$~-
zg=JlH{mtW6e4hMX-hXOm_TpNmoVB4|7J4mR`u5C1l62FnT>imf24Qct>^XHrYqUr>
zV$7oP3!C?4cCUTP)$FKmje6VYuK{VpH;g@cOcHeQ=71dVuaVHYZGjgwcXo%M#&`CJ
z%wPXc_40uzBCPk!&1yn;6wIUk!aQ2{wRNY8ar%<#x$bz5aqRKt7+0*}B=Rq;7qA$0
zV&98RVf$9U4pm3TyNxnwNU;GGwunUtVh+xW7iQ+?0^$A*Iw%lGCHaPpJs9SZTwVdD
zd#zC({05QIq-tg_^Fu`P?o%4u<nBKWNRsedby!Q$dOJu0L}@0F>zI)95jDNPp)l>r
zXY_tmGAC%=f0`a@14F-B1;uzJvn|f>tW_p~g|z-f#SR9sbZJYu&I`QB?$<6?sgwh$
zSsH_~{Awm-mGKEzN^eCQFb?)yt9mAh0;HnxRT|exph2n5G;Q{-2WJ?N+6j5;MdbtS
zKS4Ta4psISC{l$J5twF_JG2+~K-iHbk+!ost489XXxdylEnqd@*#*EYG^Cvd#xNeQ
zKM)YeBa1jfa@`g|gm9wAZ5My(wbXzGgx9ciiv$*Q&n>~Qx4CHdD(>cHq1RfJDds*Q
z_m&fpAS#y|k8o?07c(Fk(Y0i`6>>_xc)hDZUulDgV}+ZUx0K(!HHypZD9g#L(GX}$
ziVb`KI7ffEs$mAXlN3@_VWtDBCQPMX56x2CiWg&zddg0KQ|zWb)VRd2lEJ*lfO9L@
zt4e)TtX>8BzvxIISHNbuc?%f!&t6K7Q3jD)l>ol|6#XFm-kg43T~<l4xOcOpOopKi
zhPQaAvrb@<sA;})nL6FRl-x!;?MAlM#_Qv`Ni&GB<^@VY?R)8qokG+1+~B@)rlgeJ
z6LJbuC?EFM>2Lb4Q}a!gYzq%=z9A%gP(xogxj?t;)4MG3xBeuvDvvFV4^cF5jSIO-
zXT1HbO2+pCC&4!V`Rz>O!xk~Lwuf<s-KUy%@))Kcl!vQHFMGqgG(`d068GLMf9sO|
z*eT*~y!7M~Rk3i_4-#74-uD|~Z^Xvx>jP56pZ!Ec^ocb1nmvfWT>k76@dTx$%LpH`
z`&Ju}D9G3vsWg|p=5z>q<kcGe3G(S^B4XhG4(maWU^($vD#DYc-$urn^ewx(?_`rr
z5+a5<ckn41)N6DZ|2J5Vw>?2Nba7~YT_7j!PHuQT-!MX?JvS$FLqPoPINe*!KUmKo
z5=3YF57rY@h@5c94leAV-jv~weCa6lyZCwLrg(nuq@y|!)|=d*#owL!3+rL&5@-_%
zz>uPLYPeQ{%6p|((K{gpm&+K<2a(inBHF%~W>xP?Glsc>Yy(hPZnmLs)O^|IHHnHo
zrqs}=g&LroiS~_e7QXKm)DVvwEvLQ}5*uEvLi=?O6>NtZ;};)K|9ND6cf00S-<xMG
zou&*v-`y`aGN0@`u4`&$wN{CqZ@V1^s{QcQ=jF-V(#JoKR)@a3s61K14&w1+H2#An
zPu`9gb+@xAFI1Evns1bX@E_G0!ZJ=@Zx~T)Z_fNMG-rDQeG*Q%`pCa9QDx=aDr2DS
zLtxl;)Ti=nH2&=)pN#c;h0YHZuEVQ@-cERNhtVPV)w}n&)%rg)7G#EzX8*uwD9c=`
z9}xs&cf5W3CB$3zr=^X8Zd@))s`2d4m^<nAj3!>P29+}kMkR-8GksXxahiNtCmHhG
zL2dJn<l)Hdhv3#Ps_T|FCl`{O4o1p8yz$Oa7AI|@H((v-8NogOd@u;H74TQ4`ZcC{
z+caa^5y|WlavHRleSlB#*lwNfd+od9H<rP*-k`4h>Y3AVm-y!QqBzJGxd611GIP6d
zBvNsFFvoe>E%O3BCf71Z`EA#Y@&Z04_mMZfJ<N={>OSq73Y29u-|kn=Pm)QFPhlNy
z72nc7o&CE1;m#~0*HJ~B`hK*u#!PJu%oG1sQdtRRu#&FqgvR>b-b=3hfQ0!E4g{(5
z#LR;4&yPeXZJ0a8J=Xa2z7k4(hRNa(kBE6)d>KN%6+2IEzhUAeGDzJlV_8q2Hh<3j
z?F#G|4x~rNH^|1Ed&Z3__#6|TMc;VC>*L&t(Il+w9ISDTRRKU${FBWDwk?$iSIYOM
z^omss@~bqqbbP10kZMiv#th$8Q-&+7@g*$S0NFSJ)&!oCJM3ODoQjd1MTr2glSm22
zW_XgW*NwwKh;1N%ua16O(}MW4xPHjc?u>N+Ck<I8T}Q_mDzX_IB}$|wn%N}Cq^5|X
zY{b!t(c{Uh9kgMAfLr<Ohnlo$^{E*>sh)U{7i((HgQR%H6glCP43?Cz9(GAonqqg-
zDaIvegu9A0ZPlGRnU#T65q4IY&IY@r4j{>B6Uk@?Cwr1GaJA9)qBHn|pnW~b54Qqi
zQj<QpIIhTrj0J@iE3)NprGzh~iHh*605fL<DfXOUxD|@dFAPoA$;QEeIFi4T-pUcE
zM~gN9N6}^-orR<DCQ5oF*{(Rs`K_>O5&q}s%z4wy(xccR#dJ64oIfJCdGjn5Qb7$_
zZ=N6=LlCeVmyxnY(H{u)oVgknPj$9SixY(WR>b8eiG&sAEMRgf!8pCwxx!yX|5MU)
z&g$I-;heJ`rBJ2g0E_=5J^c<`+HC#>Nkr@y3VImzmpqDoXBbCXo(N^$Y)^qPrQ@e9
z3a8z_ke(~ylDaGqD3(uA<Sb5<^vpD=>j_aBqO2N`e<eL2Sq^)9;b0)3EI#-;Wnq|i
zaYS121rG3Y7t{-fTnmCwBZ=u5>DR1Oo&-pDAVA8k2!kogil_1)gy?{+=vQex;lOCU
z;>Z_w%fH^$MMZo6F5cUOy2{YR;bl(ofISk*Xac0wRxFE>g*ex_O(MbAo*ot`Mc;P!
zz9{TmGfH(YV?e*`Ih#?HK5d*n!{ctiIh=T%(8NH%9uA(OMXSemF930mk(a`I4}?+5
zFM?As%-$Oi1)5cw7$_8U=qOk3(Q;eEe%__8A7eVL%($vVzgL+dqQLfO3));?K7hKU
zKda1uc$HaW%i<!T0dNX^x{~b`3Vi|<g*T-wjv|2Wp59EMdP5d{5HQ#c-V3Mj4g?;`
zM1QshmA=S*PDyDN2vCPX^<>JL+T`<cAveZg&^*@TnOKH4z*quI;{^7TM4dheAWp^D
zN0wcUhi)8!q!_4O;lPkF>S!E=3Zf)VQ@+s@$Arn^@*#pqz!fj*HnQw5!O*DRpsZYI
z*$Rcti{iLlpnYWJx*+E41$3~N^$-W(|DADcqDAwI^-ShUeSFObr2->S(ldb|LjFm5
zCegi`ykGuFdQAT$J+-KYyHQFxRClX*Dbz|?6~4hvE9-8rUeaXf!+za`;ore*&0ud{
zFilpP90mebaT#JAfV7^{#z>kocyRd8!y|pz+g_%-B<hpS8QacTI1<WJ_@fH~RU8ib
zn~rTmvo4H1>=>RQxR;K%sYyMlrXPejnFRkvQJa~7yx|lL#Q@J41%clWobZLs@!1Ty
zS<&&Wy}^Pp5195V6`bg(-{63G<otkp6u@n07a6>moYHm|^rMm{-2@azY!<HE7lTn}
z?E-_ILz^|hw-}(+m2Jl}Q0Nt!^mkw!9rYOr@7%<F?jRah0+xvBMVmk@{$YB0Gkm`Z
zk332KVtP&{5YHK~4kUIk5NHaqIZS9BUActo??xT3G$TYI=DjjROpiEc(QHlMqYUdi
zQ8E;U;fR=CAOPsoe5)!?;%i<2L;lrcTDi#lhU$D(%Gz6l%?yLohgPMFtkC{$A?CqH
zA18Xk?$&dc0&sA=D;_Wz1vn;Apy@5O#R0y1ibO`YTo8IIUP3+bfcAK*s%?faJYWzP
z9Th3H5eN`?)7RU5MGp_KUW3Yuc7>UU5VcqR`1HaMpbndL`Yy=LOo-ipc4Xzs#q0w+
z@BZUJfbJ7e?FsDn1f{-nuK~Qg-kH*1Ma~Qk*^j64S*v1?0=VJ;n;8R-S?)Ro0zQ%m
z+6E3(X@b|pDcn0~>u~^i{>vwqu;hj(fTBRa=Wj5NQz1RLn4~YI{BVOjF9k{;7G%I|
zreA24R%rL4(5bi7MXBi4ako3HhklS6$U)6NR~2)e))U*D@xDj)PF{|Rq8VQ3%1Ksl
zaBm<3?fpC`OP_Q{(=Y?+$hOQAy+EnJ1}0n}AWS9}hXY)gfb3t47^%V@etTd`h%qn`
zIWtK$lZjAUeXe%r!6|VXi2!-C4aLEM{kuxJqA<5JqC)+&#|-jBiGDN?pr-}4rR!|r
z1=_!D6sdd8eFD52DE`H6eB%XyDCvC>qo~>yjf?K1pB<ymrEuX$uFe?auOfhg0lD7r
zEV`2WWHJ}df?vHa2c6rBV~&dxO(s6*mryf6Q|^|uG&b9r4)wY|t0zi&GgSt3ynDMK
z0~552#PAE%tZSJa{~_rakWl_ysV-^i<M0`o7^1Gqn9`f1oU7?m=Y=?nw4)?C`}L=(
z=O4U2<-rjkPkvR~(v7Ol4$+fZ|0WPx+2ltEmBr*^lisgF@3hokr@s(~rAk0dRTbS9
z8vk^Sdp8ueXS}Fu9_F+KZTAB544W8DUmR=wKkVI!JJf&Q`2Ei;7=|(Sov~%#$<COu
zrVx@nYuOvLP^vM;63Q+_StC192-){NNs_EtvXi9b9@Y0ezvp$G*Y9`V*Kz#r<GzpM
z`VZza%Q2th^M1XakNn+8DpM4l{ZKd0R=1lfU2W$5bl~>w2V^ppJ+^U~mFTo5chk_%
z(n`Li)gvGBQ!~F*tC?Ju)jUlXu1wce+-J}qhT9pr{0z!`KyiqUu-ZJz+CsOcbGA(s
zlOiAeJ57z>IR@0|s3pz%=(AuohKVjE_nc5-bbNVe2I`Gf+AXy~nF?Bia>QF4)OVr$
z8^AF4m16Dd;Ps5RH_tTCYYp*hH8`KCpj@MU>WPwx6qEZll!_dV4C<*YGKuiItpB6@
zK`*W9*l=hiO0Nmdt3D!_(Nw!q$UaM!#$fXusiMX9+D7Je@4J=(%8U_%j7ts~<IAsY
zL8HXpf}bXE1(}2n+-3ce(f(Wby1J}cVKNqyq!&wOh=U96BoJOp+pl)s_mcDDgV)-O
zp|`STi|&v1#w~I^pg#*I9rsqT(9XVWYz79iZQjakbzN$r^wl{+TwWmy{zkr^MlS5v
zXoVB_-cOn6&=GNl@`UeL&BJuRkQ|=0)@=C4Ltyw4YMAvA^bk4Y>rA<G3u<;(${_$6
zA1%(VGU6+jSg=Mb;7$Mdbb}uQ?>*@xAcsaTmfXEblHu%oYnj*ZiA-AdEC!EzOs76%
za(=+SFZO#THiHv19csNgUFweO`>--;;}ftrw=loMaAAGH8ua+xFzu!Y-M7q7FQXa+
zc|To7EOyJyU6qz~Tfctu0qt{=q$e%gFq?4Qnl3PnH5E_A|E%z^3B|C5*jJWyZdr&~
zzve5syfnv<a9^!(>!V-VZBfVNjGqgKbWw#FITe-xe%i0gQ;t4z_}(wypNm~z>0qNJ
zuVeZgyMlOzxcQagJBoA*`<c`xeT7(UmRxN$T5b0sy}hg5rK`OItNrV%gNU_Z$+g!;
zYj1qk-riq(SGx9oVC}>D+DF7XsX;ntw7%f8zIcCqxpe*W!1~(y`UYZSOLAk!Xyc2|
z#@G8B-%2;W4{RK+ZyX^uK~kF#<4v;5n-npdlx3Un!A+WtO<LM5I;kxN<1MDkTP!hK
zY-L*<gIio1TRgPeyi(iz#@m9Iw}oQ1Mas6t2Dc?PwxwuyWTbZFjCT|+?<mIXD3hWE
zgFEUQJDRk+T2i}M<6WK0yLvIZ24%a3gS%%oc8zIC!_`M$%#6RByZq&R%onS&FE)c;
z>^8n!pxtwn+H*GEbG^KGDQ3^TY|nFW&wFF<GVNDissDlXQcV|5B}>>f64}f?olaBm
zo@z@qTQqv4e(NWc-F(R;Tjw6PPMZ0$>60@V8lmjxR?G{}mDsnZo%?K2YS(a^jKgBp
zveLExk<LSlHS6cz9~whB&ad0nU0s`Me|UbwzVX)KPclx+O^23H8Xnzr(#&bcJub~K
zPOEK~o+OD29qCp(7Y8!b?~rp@@4AiToq4RAVg1EptmJ=SJ;5pyEUk|GSsfPFs<V1L
zq4K5%LU~oDhEnbFW@i)^s?3Zv$rQ}b>Iqhxn;GjUoI7{kwfdaG|6^Eh;vx9IDe1BQ
zzryGVo%TrY^A->ExpemO<NnLiUcQ0-zH%0RS-1Q=tgaOVU-KEfreb$J&p!ZfADA~7
zs2+O5&nf7M)2*W6TiD3k*VgXHzsBp`3l1<RD7+>Zo+m1;6V<H4)No-X!C^58VYf!Z
z&aQ`}eIlyu?`rwot@OW(zH+xL`7VC!?*DN{Z}M-9-iQCh=zaXf=<Pi5`-h}Amw)RY
zjNZ=EYyVwIFKXdGNqQtkZ|`NoZ$|HPL;C+((jzf?EA2)9Bk6U<ps<mg29>$p3BqQD
zw%wI^y$__Fd(sV_J?Vd_<i9f6{Vad*F*<~b>r_?2aE^Y0s9jIh)7SYXIj1sCRTsV~
zvV7+8p{Kg&ZJ9%BB$wgy;&;#7UKiT+J}-Iy0yo!_Vfdo-!^?o3l@Gly%09lrL*U$}
zYszO@BN)W&`)VrYI%D|_ADynPT<A@a^PK9deYQB5iH+huQ&+Y8y1=Z+zQ3;e^V@Rg
z-bepOB)zA|KayU+A4$*k?~-2ZzesvDm}5yVo8iRX5QbLjKS_H0$C92it<gUvy-y@b
zPkCs19xhe<4@r-E#sw)~T<(gruso~#pCmnZlB6f_N76e(lJpEPFyUiKPnd`%NqW!!
zH<F&=zmfFDAS6kzN(bfvYwL%r|4q`<#vV(0hA=JG(J;LFv82aqNs{!ue@l7=e<VFE
z;=f3G>c^6v)c8`=Z%I$@?~-07v$wv%Uy`1}IEKS7%ppRT#{WtuT@Tva5Y}+;%(rtR
zSuHh#^^l!VMHV-ri;ATp8cSSvu_>01r*_sytrYW7s-;z(rOZ3f2m21^Mzrd4Y#%@d
zN2;m$DSIJYFMCFcsOA0p(-=R;s6;3FhD$<gsr}!1>tiIEA!IGZ=*Hqru*N=V+fy-k
zHJE1N68tFFc*qP+yeF`IFzMFOL-f|q@8P_uJ@ymFZ}7Zqguh#~qKXcu8LvP41ucPD
zjbWEaoH1TZIf$1VIVGn)^wHf=tW@f{xFk{}Uf)0bd7N=+cTv0;_9iN&gYT}&`jyi9
zrCGP^4zB7Rh%QV@KRaeC<A6V=H(H<cc=^mj@t^id#j^-(nl!i{D{3Y&L<f%NGob~0
z%+T_K{mj-M11cmuVG}?eVPX{m^bOGU{9P4L7nM6hgEkW!4zK`<S3vh54-++#B<U3+
zhfqj?op2?XKpAxy`u096J$^v&E>b@BcJ-!St2JvT)3h@!`)=nQk8xofOc;6FQwx4%
zuMjH>+k&N`lNc~Kir}gUMv%NYzA_mD%80TCV?agB`s!R%Ze-yQbG$w}=4z@T8-y>I
z)Tn}c!SuOT>1RNo+!A2~(r>Oe$F5E%1j?OjJDNbmPMnX8$wIRoX$5PP4~L)%<}}4>
zc<=(vFu4(cQ~t*V*a2Pp$pXmjCpX97iNQLWRP&bd0pv8b&H8$n?JIrpdJ+Uc8_P#;
za)6$r3?I&>p~}?)d1!T#Mz39)HpqUKyYhXRdCo!&xg&vJfMb!ZVam;^v%-n;qi0J`
z;;~!+JI7(#LMzg3CII4&<<Jm920*jOKq}xO4dydGtfzP~e&oUrhmZO$g`v_ci^&v!
znin}Ypc$$GA%?3mMr`1Mdr$>u@ue*IMCi^Hsp-`8^-Nl<i80$@1b-@F8m<87bA5y6
zai3RtAV?kogDPL3BdaP8L&l?&il;;mgJUcw9fRXtY-&-=I=84j6V9sfRR1_%dg>rY
zXM(CNKG#=V>tN2<d{@LolROhe-Or=E##vr)?zL)tKWbzg!m^;%r@L&*<7nqvD|rGF
zT!p0G$$5h9Osb*k*mSgyexgau48E1f;0lW)=XXQ3N$ltFM7LWlr<0@d!thU-8DLKe
zm@1XHqply(i8~&V%LXTkdHU{BDE*w*?DqguhgN><RPmGyIs$|*TAnGy+VqZ0Jzoe0
zFu}wtzQs(dS|~{xlO|@r*H<Fl$cAo(sZ8G`P@Sp_zSzgE4!D>Des6gm*Azpr4(DXu
z;VGkPV`Ohs?a)>%IiQs{&oID;rP&w<iQPPbQKa-u(}Way(*m_mHXoVP=AMzcXC3~~
zdg5Wx%Ok0d$@<9-j#xPV3?S$!a}Z+Axn-NDxi!NhnIf2>vl-o@q5<tu4g?qK+g7T{
z^^)}+NMNm*RUlKl`fWC6qDQzqioyPpr?o%jej<apZ$RMZ_a}06&UEcku=Fd`N%1{L
z^)tcZqI5-LxVv7x<<hTps`=2uos<C7WdwX+hThsge`GV68KZXJ^;OP_IP`+iGg+9>
z{ZoKGr%f{SX>wjW=Xd(s@(xLNZfW%uuSuuoEmUeqyGUG(&7|1P91Gsv5~8qaezh4;
zXulw!Z+EI7)MGb`9gcZHAT3d(MOaBx4WX~P&5YHKJVKIHMs}Yp7<n)tf8SAj0om0%
zT5ir?&3xMH+H%P0FW?W*Z|+9=i<w=EqKVHVl%s_UQ@f22UoG2Y1Q=cJ6@glcRO^_)
zs0sNRvQJ^&ThU9m(XvQv3&l@AZ(UjcuYFT{*+;p&O+aepICtVm#74%(Io1_~ANyAQ
z_l4%$(>W%>mYGtNh7HpzAt`;}*z6Pbms=WvM^BD8I+~f6mU9Z5^R_*Q;60f!&T$UG
z1oLVwhkm0w)R3`w;nos{ns6Je5%<eIy|Od;y$KsT?JDFcAHDAThs)Y@uC{#iKc6{>
zN?{rdAseEbG*~FpEI$uAqOED~-zzJ?(uV;QVPuJ(f#%sXF8=zOR8@-h*Q(DZtY3%<
z3f9zNQV!c$Uq2C3_{lepKrSE*`5{?=KJjyzteNVEE5+a-b6gXZ%#P|a={)Ly_-U&~
za}~9h6CzF)eUxSNw~!~l3(>m;lkyTZA!|aEp;9sn0Oo|c?J024ecT)9OxX8N?e`uh
z@Dbxez7%cxdInR^rPn8G!QF<)DdV!qYQsJr)#ggZ&cKHXdv8C!-@fr2^c2hf!6TO4
z6Cu6@7eG=}5s0iC?Y`BAM|KqydYfQnB-DdM=gA+_d2e$CT#;B-E!t^5Iqf#O$0p<!
zg3eTQ9?)SAa$Z{XMOu0{Bqxc^i&gjUG-I;7%`k36J`+soD70^m6ttu}L=tjGC24$J
zY0ic)2g|M_32OpGz>;W}MIMSl>7i)jaZqa%Vmg)xp@;T9V1VkWo0__*YMnOarR@>A
ztjii!C36Ad2Sw*n+Dt>Ofn!F`1EmGf%W7m%s-qN*OhQlc(jM|L?Kja(H-$K{M&!rY
zf}F_KP00OowY(D}@Zbo-(SAg14I^>icpI>VV!+inF{}BAxbeG>SQ%|l+S$Soy)UTi
zXeu&tyY&6L#p970XCo0K+NDZSRVj?+mZ(b0sJfacO<vm8&8Q~U=vI_jy=8PqKy+71
zbWcrm-+1(INpD2y-l!7m3Yy3~Oe?`kCs9B<wSSKy>mJkAy=lvPpOkounlz2j(QI_k
zvlo%A(>|1r(ny#)q>^B2VMZV910uvM?#HYT(}rWHE+$2>HS@uOop%b(gR>B6)0ZgT
zD3H$xFwVpxyZwRGxXosFsb8L+Oq*c@D-^^46LzpAK*$Af(3^8m3NWn{AOoYMH9~{)
zg=B#vCzTU-<3rj7X-s1vpld%fY0Im@>z@Qj=dXS*5<2r}r83Dd*N~XIm-U*iR&0VF
z3-L~(HHWj~?3cN$&r4+K8VfQTK*OblcFo`LD^fp~o`!0}*kA&&lDwHD%ob9OOCIFY
z^y8<L04IWZ6AeenH_Z&>H^HQ|&5b~es2Sw~y&RM`ac~6Uii%Yq!aOlcN&*Bgyi0w*
zMSXpU556OlG>RF-W2Kyp_5}2gJ-uy(wNL0SlBbt>?CH^lrTOHLL51`spea9rYrj1`
zc&=of`!7$AP9ylK<RHB``5ZJFuzRipiAHM{%%)DVacy?0?qX?kkCsh(hEPt=R0omZ
zq_$JkVW%~q54r?|yoXRV?h>B@DPD%?PRw3v5=qAd`nO*bADpKBTB~|Y>dmG%Q)cj*
z=pOk(_X8=WwIOtogb#sP{iIJA4-R&)=-QQ$+6)jTE#+@gie*ah=~9`D(B6HA+WclN
zhN9VgEu**y=P}C`TA@9L^+q1AU^E>Wz?~#m4-I~ME$766BZ<GG^gzb5fs19u^`_wo
zS5q31P>rxG>j}<A6D@h9I1j{oF`JgjADZZw$DQ~K*7K8DFTjR^k6}FxizkVuaEbU7
zqe4lSMNA^SOSv|ci|Dnfn%pxaRqsGFepBed(Y(Lu2w0^iFFuWPN(sq>6)hbjh}GOH
zGef!xAZPWF>5<3-{Jl(-Li!5APo<~Dk(>`E3d>g_dBO`Ttc#xCD5^;-s;euizi|RW
zIDLW%H3CG{IvuNeNx2x_rd$igbdb}z2KJJJt)j)uyJ93&uaayL&?l*STu@XX4$*T1
zar?Kb$5*oQOVwLHDBWZ)+g2&twJuw?rd(ur`nj%bVYqbfpbX$BU$>SV>M0`^;|4!0
zr{X9Jls2IFeyr-vkW@XBil*t(o)_hma2n=bnvIEabMgwlhg@r?a9X&^^*XYN!itST
z$}bb-LQ!DJ?-frKD^DJAa0zmNx6&%aKbMN_lxa&p+gw5DnUpKutm=z<wsAls3a45>
zpm6}GEy~G?&B<Rmka?R_uc!SY_0Yday;v$6G}Id?(-JFN=(()_{&`nc)kYeX9`5<#
zw60VWOlydI`~V!@^kN7PUQZ+KAyL`BgCt3tL?hvg2c_;}W%#N{ACB6ZteQnMZmZB}
zeMPqdhX^kx8?UPk#6j<H)VNMR<0iel*(x`&s?8e@<G<In&6Fm?%TjD!sPxu8g4euR
zsTG(mbv3D55`CWfkiveOCc3w75eZ-4yj}jjz6tbV!}_Jqd})SiT{Zq#)f0nINzRvw
zmDi3Rp=emX(+I~>b;8SfXQc*SHogQktRIMrZPM(`mqt(5;w!-nQEm=EeIPF0l|<@|
zfVIl&HYT)UyBlFa9Lgk84=BImS-&~av~@s3Pa^ez<{2>>E$L_E=}p|lO)62xq#mO9
zrTR-Uey_&GO&N+G&63m{deTkoHqGi$je(mjN~bwcH%q|u&{c;L-szHeJ&2wj!~zv6
zsR;qz2CtU4@&dKWob8!f*cW6`6!gV(exX3TSWize$WPLc+E7fO-Nm-!Vo--$dWT1S
zhu36>&yNlqXQ!W9=M~$|YeAg>>76&~JA)=W|44djT}0ciu%NDp^e)z;VI4<zNsCol
zm;E+tPH?0Xrtb!8??K6mh)1)K!G#}PaY4oI7Obh!#p!)r7SNu{x$TjYoNFs>N%#_W
z^Aa#$8z{SEvhZ2X=^myNsF^~H6b?}?-fO4R3v%l1?djFy1iw-fZV^XSOtyARmVBJ(
zF}V3s!K>`$Y1W@<{S)bZlhOTCr_0`Z^>+^U&xw~Uh_f!G4{X&9;D-m+f0S-|4YYy;
zcZvt5IS0NK4~Fp$ezP6i6X!hSEYr$t454c!qbZ~CW~FKvf<z5L)H&(l!|Q3R%!j2B
zal<U?!;9hrhxKG$s;nO6l}L$^u(Km<_eQwwIDxeR@EVI0&Fk++eFLZugEAjR)^5Ju
zNq-$A^Llyp^$pPIocO2;O$)R4XrR{URPpHb=FxYnqk6wRz4F>a@!pi;XG7&f*8RPU
zLvP3q-<U~oO3c=-*ON(Q(#H6)R!ECT;m4M#X*~MJBsf_wuO<4a4_s*&^R^pnZYDM>
zRwx9unbfnKXMH<Y-x{95a@TuAp>G^7!K&np@%MX|qAoNcI>!F8FZJ+UCf7u^`b74b
zaq-XZax*3h8zzd+@IU$Rjx@}T*amxKl3!PUr=-<h+3?<s6?~Jc+y<aZ?tkBAH`#Fp
zrG=u@!oLA?z->^JtJfw+)IU^aO!k(P572xV<$C`n<h{xfZ_aejB&Xfb!U4GKOxc2H
z>s-UsYX8)W?C~bMzBToayIdoqkav59cUSB_PEpe&0hPm_KAZ$;zU}|GLrsGhnA)Mz
z*J^r4{&O11T|NX%BQ(lhaL%wkn%PmAX+A%5u=<|;Q9o=-2W-S3!Pv*U-hU*~_v%*J
zn*%V_qgmOX)3DN#B;;HLveag1T5f7io*R1d{+!CdoJM0gzfYCm6ulnPoQ`C9rPtI3
zRou|@%o+QI&l0_UXWout7c8b0koOjxN*1J=7VM46dbhzZGUi2wF^hJe_Ecv3=;72x
zpM2~W5ACJ`ac$l{i$V6SKh?)?Of3R8#q>)*i8z`@9f>XN)ul!ns-G@hiuIX)F|zcX
zYdN{J+}ddQ!Tl*ik0ps=zAN0zP8mxN?N=zH-emc#6t0&RG_Gvcy?8W5Z?d*hW&im(
zNzyYKP~iG3B=foU=jSHw)t2=I)BexwGoM@S=bt%18ZyhRHdk{tOB*&<tsH2+1yO1=
zRmN?uUTvz(8CokUg+<~JRyfLT#4_o$Dyr}G;?zPn8U#!O{g29-(I7A$vT=iw5qYfY
zsox}@MwE%8fc&CzB{T>QfW+Yt+VY{3(;EPM6L}BBg+oY_RJ~ZTwSh&_DHe0^D#zoQ
zS!ocB!@Br;U>{MIGqj;@xV7W4rVfWt9hFs3UpQv<K$puTUk#}qQHuk>9QU^C)E2if
z9ZG5!dHYz^+rB}0u8CrYr0SWF5m1QD$nCAVZRAnuAh1bx2ho5dzl5i<xPwsL_@nBL
z_-woJP_Bz2B4f#FfHK*mQuhmci?MsV);rH|<Ybp=uEvrT0A)3sWL~k<o1(CDIP&53
zQpLwRUvBJ?RK1uxh=QTj9FwncICAMb2tVVmRu?GfO|~}bK;+0T`XA@DFYMC$?iOA6
zs3-+hjRFD4KdRpIL4dS)F}PW3S+*^HRO*G_+CuE;001@V3UTB?L&vHf*AR&0eqO)>
zkW66XNE8N4?{T0(NhDT}r0OAenKgG7rQty4*7^j9VdyKZ!!K2DdZVBm=o$pCPeAu*
zkq|0jmFtoafRYBlt6p-3;3>IOHbpEe_#Pu*%=*OPA+2^wp@B0<8Bi0RVse1eMj8kP
z2#b<jtW7`@dDIyBe)%{_(#zBeMF{?u^zMeiW(Jqd3eM&k<ypU3Iah2|?XxiPOVVq<
zFKF{y(kt!nF<-W+@m(0mGnA*tpH;V_9yiC0)$#$*3=RdfOEbCBjr-uu7br<U+yac`
zW5C}dbjRDZ3{Qg)oK~XDXB~#M!Uzq(DBE&Vni3VgXbb+x!50GYU3>&mf-sT;<T*Fi
zygqzRrv>6rQPX?TEnr-WFiVw%bQBH1g}wmpc_-&Kd{Tp%TA3aQ>j!F#aWpp9WTC9)
zPD?|t!C`gZzHBTSKM=72AdEOPNz&UyLmA9*%_Wm78(J`aBC>W;+!PJ{&Rzh6kc*!3
zs^}2y0RudhT~0avM#9rV2SI%O*(U($`=N;Iy-jT)7mG^xIvSPqA|Rr>%P;B&D)594
z(yE<lU4;O^^m$VyJQ!@*)Xs;qc;?1<SHN^Tomq^YRv>QN?5=^9R~sGPUw0MWcOXu1
z1Sm<8-azh8XPoh|q-TtVFkKmXj%nI4InriO7t&1<uPe@fE$XBN&@#Q3Z6jFLxI>Hr
zC(zi(EmceHku^_8M)?NbK>;eI51Ej#fvgfCYIbCJuvB<ZX7=lgGbP#g%8PL4B8ke5
z_*M4)`0B`u6*E>G+G6_VF{1IAeXYrM)#r>HnX;<f=Zcr0IHqGsZ&%=o-L>~uzuE=N
zDGX^{`CR=~qJwYQfB<t-2XeOtzHORz4k$zLE;s1Gc(I!kz^h04NuvM{dBJ@SAZ_2>
zB1*Cw0XPx}j&J>gn80(bxzA=CZh=~NIeoxI+1VHF-WccOWER#(0_75JR?!O2mxy;H
z7#^slub;cIoHd&C)x97m`G&_)AxrK9_u^+7o#l_xtFj*02NgpARwAYNxwhidHK-28
zW}UoCj7?}($HEjg7KkvbAe)x02rL|eGkEfX6ctvR9|e|bvk{0I;zJcgLN&-Xx~K~b
zm@w3mOubY*$<%XCr?KTeHuZ$jI<e#@l!WMcqMeH?3EZ)luVw)(^)Kl7y9p;A4_aAV
z>EvZGpz9exXX0}iSgbvlHm=rrtQ5WYd1JMxQRT*Z|GhZAD7?9C@MNsn4=68_N{n8+
zC%4WaMec`rP&);nnF?dvD90U2s1!KPa6tjsev{V(OObzciEHE8bU=Dq@q+`}m)v1Y
zkU3L{l68^(o7v<Ml>I6~3neCtX})k&9QO*Go~6dv#S9385g__a&e?!2pb#aB({57u
zFqf76<bgVh{A>hPfDixtEmmO601832Oo$SqhR#7bpY3Ow-k{To5@_{frqgYXccKBP
z79gekJ#vMXv6qN43K0p}V&iUcR!V1u?W**pi1Limd)lnm)x!D2O#o88C-(50BOOhk
zzV?ZcSUpY`{v8NnORYQZRH}}Ee0zq$`XY*@$>oH)$ODY1X=09mtH`_dF5@TkA_Yy^
zq9Ftb<O=FUX`-RPbA3bGlO-Zg=8q-4UT~J|gI0lyBuTGNHIzQ3_gK;sVRGa%OFNeI
zN{*iPUAk!Y@cn5Q`I2{}{ADJHy2(UKdkF7K7__I<T9k;}26eva1=GYj>kOcb$o1DH
zu126ireyc|EKz(CpW7)<ph3*A9K;!iIkq%h2SFbVV%wZmd=PfV=c0KIM_!tuL|U61
zD*%GMLxQORfailJh>8_G9g&UCwweb)V#jJ(alm!vTuKVor)0C0!60fhsJQzvdMrFD
zjv25D!Zpnf48!vp<9zwmff<cL`Dj1$BAW$|Otl;51Vo*H$_koOsn=ek51=5K5`9@_
zH?wqdS1*lQy_Dpv3HlMEOoI_nPZiQXq5zil5>CggIqxY%znX8hTnj`!WN=iTEmmZg
z=jAFPmRY82ff=jm2eaeAKH4r|Qp^c)FM*n*3xeo`^DVor<HB?0g(s092y+wuz=aol
zX}<}~2jnF=IDp`pA5O_i+ft^_P`{Muq7;~Bt!j~hkbFXD+IUnoq5uBL2sBi{M1W2^
zGXWC;c%}^jWR~a(GAqe@Cvjn94qfaGc4+eSaUx7UGp{4H-JjjzO|6dsxb+tB?6zza
zgfr8@`TfTQ-L9ep+#=!b+6Iox<hB1a8ps@3tvzwm3K?$MX5Z}<&Z8X+lEmj1c=7<y
zA-QA#)eHbho?I6#vef1Q(I*KoTk$!NA3qxlaT$;wgOdSAXplq}a81A;LBTkEW>})@
zv`Y}a&j3{b9^V$1&Kw0%f6@~OeP^BE3kGqbx;fXoFB=gSz|&Pv<u0PH3RnWrRhDLm
zCEm21(_v-Er5hr=XdFaRok!+DNUzrb^=9x2x)w+ki;lioLAq6`1(1+2=QCcVv@w>W
zIVY+$PyJXvEJ&egc?pg3#uqEQ0{)EU9l{8cxr!;v=V-?!z*G>izP~R!=HSky0pQ{F
zr2rSE;uEf!LWrdeM4nP<2yX#E=>X@2E>1+F7eMXM)F?MvnNk}!{R&DBX+XbdB9}H)
z&X`9%<!HLh-bCX&PfLE)&E4K-0-g}jW^m*JttzAsnuxR}p1Q0~!BZXt(6ya{3hAIP
zbH+MAe^lo^bh}=1({EKM=fEUO@@n^)fj4GR^^$DU+h8vTno+^$CqkR?sg(Yo3F9@z
zFMoDd5PJwi-z@!weF$d)P9@waQHUN6ldUfE_O{{AL`{xOTHlflmOkIssbqx*naJ=x
zm=9FJ^2OO*Rss?%R~(RNnYEu8i#a=_ncc+>Vy_ru$|rMH)+SjpQ9sH<=1eM<x0emi
zO~OMtr&~0%5c%hPgyJ9DZYK<0?BUUTz_-h$w0aFMO`iDzWQp!4>lQ1$U=uq|F9@e;
zsss~foF|mgz*V=qm$)~9cg0`soxXI0f1U5LRuSjrc<z!|VCADU=p{$skc#@0&k;~$
z4OR6j_Y{yW{}J792OyTN_9hxJP^j@Zk!kA5YHY@X<OhXBCF6~uaSqdI34<&b#?SbO
zQhTPO1|PqL15~#HDetQFaG=5Sg1r!QUI4jF6cK)qG4Q><r5u2w0ndOixU9Mz1C_6(
zLW>EE2d{ok1`jDGPnf=&9#Tp1nr6N!Hgro}bWSlNmCR+BlgTqtxJ5-q4A!T7x4DK0
z#@`>+uL%Qy6~p_VRZrF(6d_Dt!<#bcBT^UX!jna645bl11q5hF0Rb(;aGD0{LHXh-
z?3!79TlQVU8WF91xUW*kQAmOaC_)1oganDBRf=16WD}L5Nthl$-i7ZF0m5&hhZrOQ
z6B)MmJQWy9qni<A0r=UKUzi^0+&~q=V?)YtP<C%NpJ9-M=x2h30g6n3bjz#Z_VfuD
zVBrKP@PLj!d72yEz&VM~#X~WUFXW@0-Y+4H6B9hjf4Jij5qJ>3m5|c7^0M(ORu%5{
z)T+D)Qch{88j{?Dhob=#HjYH}y~w+G#6JI1NTiu9p7w?UH9q(vXS44Cz-$78*C?eJ
zrabfjCoTch$Y%Y7yW)MVuvDz-4?TR<BglMbc0d>`^KLRdC?f(`Zo;2M;%RD#)hc*C
zR^SL!fT%cCp0a{h;=t!rkYGB1s0NJUFlyiF7bry|oXhxZ42I?K#A$e&ez}uZ0@MZ{
zIhq>3T%Ft^Fr0Ijj6l)@A6-fTAjk-c2+d{wmKEpPv*nqYra<I$Scn?w2PrbQ2_k9(
zhBGf7LbImeqEM6k$6Y*BZiyeYn6vmI;7WKF8;u_oDUnMG8V>47i6vGh0B8wAn5Vr%
zO=@zT4rJ?U6rl1+Au}JsL`{>QH#uDcP}s7D>hH*Ky5$j&;Z|KDwwZh~eNP{klk=*D
z_Y<RBaG^n`BdrPwl(s25Y|9=6ke`S3tMJLv?ZbU)pjxbCymVpuNMh9r<&kGZKh;x6
zqs`+Mfm}QKV@Yp?w{K3H4;eI2ryn*Oq<x6PC-*Qd7e~E1mh_B@np@X6pNQ7H+{%S}
z!diclB)#dJ9cbP>^jOl<@*Vgk=^5Ajmh{Boe<Zz<-;&-?i4p<%m!y{&5sFm$CFz}k
zE5L&PNP7Jt$lsD48Jz0FZ%J<u^;^<wpbB*OE$N*Fa)*$=CB0izRJZ;}di^*4lJsu<
zk@TGZDd`O%#|dix9Z7E-{Nyi5@5z5t(j)Q*{0B+z4U+@aFG=qW((>O*dKUji(mVHC
z(tE2hGprU6#X<vehxJL&fP|CaVl>B+Ud?YwuV2{RArhq@>3`;YGfC3B^+(dn`z`6&
zJqe--zNHX(Ea^FrBt7*=|3i!B^l>Cf(sTVI>6wxwJsJWZSLEL%z1-iDp3W~xk1Uc!
z{Vz#Rg6fZ?=lVy|L;aHU9v@43?^tj{ng3DJd;gRq=}G)e(mVVk=>_~-N$={vN_y3Q
zNqUF>D(Ol5mh>i}!~aRrQ%C+gNpFPZe<Zylc_U{9d*_or&Wg94mF_$Le@N21eJtta
zmqW#+Ns``0MWxXEV@dC#hD?~WG(lJ?)KeP5Zvs|yBbvEE<;yP~OL`Gte%vofPb2nv
z!9{*)lB9R(Z<5}nV@a>$m!wCI#MFE;!$FStGa>nz5J73Mxc=WHJ^QHelLYC1NO~uK
zNqP|k$-gAMXR#znkEs2Zq?b>U^oEWly`o=|UI9tc>-Z(<;r@f9M<!?TH%U+WkEB;b
zlJo+OCB5QI$g!k{{+pz?8RFSQkj6ziAU_NLCFvDUL;05o`AVT3V^l_&BuUTxSklXc
z{F3y-&0^jECh1WK4joH+#lIxI{6CT&(d^$zdY=DY(mM&hC><hvEa_b&NqYIyWc)*r
zV@a>(FG+9j|DL3G?T@6Fe=O;_lO(;u-;&<--;&<C@PCl>PLd?OW#NA->FGmNaFD-C
zdWFZ5-lbzn5Am;(p7dXmp5osmJqwbg=XNaVt&=3Zy<d`EDM`}v{3Gdg{F3x;|7S_h
z^PiF)?w6#O|F4qX`TwP)r}RtGd;FKA_XJXV^1qVwLe2gm=|w=aum4lhD>AuElJxRx
z!X*E_q_-eB1hL8_NqWA&B)xDmlBB0gc+MR~lJqM6NO~9llJqY92T5<)?C+A^{eLUz
zUHmQS75*jZJ^fcn?>R}*!yij}MM^jFe@S{pza+h<|B&>g33ne*-Io4K(tAZEFC9{#
z?@yBS3SkiWh<}mv3YEwx6e0hR^zxOweoJ~!ao-Cze@l84f=whzkK$O;TOvt%J7!B@
zl?XxrEablKUy>f_`$dxUBEW`A;O6U*t$V*Dy*-ko7cN<_cqF|9J{9p>()%n;lJw61
zlJrank|aql=08Y!WXF=;HOR4~7X$t!>0K6&4VC=gOM1&@08B-9DpW4MEB?PB>0NA#
z=OIaYY+L?R@ZXZ&C20IBX&;iLcd4yUL=o~u*s7rISklX$+zluHtjeEHlJxSmV>C&U
z9vg4f(7kxGyU`>`Zzu7;ko26+5}@AF{5Sqp(&PRu>A4<DdTuSplAb$b(Up->g?M*I
zmj6o9d;43`YyF3$HyO&t^)Hg%*AVT`pQRV>{ZrCg!3?C3Bt827Ea{0HOM1fpl=MPE
z>FkarJx3x*(yRKXq?hWL{r?+D&xs`IQIB-8yWo7=84LtuNRpntFByw%tX2nm!1S;l
zPl)(0N$+J>*)9E-q{J@5Q@pZUqglKvfI7ZJq-@;uwEVmDIfO>lFG+7jm0n{#=vlNx
zy$V>I#h5w{%HnDMIYMYHjD4fNXf}uTOzf<4jB4tQgWl2xNw7E@Ie+mcUrNfh&&k!%
zqnA>>5-)%FJ>LG|X;^kE*0&vL92-p0O5*gQ>$gpQaeA%3{fdkA{)6o<bN7p+4b>Ii
zoRbswmnm}q7dP8(u2S}hK6|&(_k{X%ScS{(FHR3q{l>RfUGc*oPLDvrf(=-UIOg;Q
z{&0FJ_b4XLZ%*zhhQ3u-UPv;V8dPpik%dhd7lZbtK6deoX?%2B?_xhMko8=sJzcJ9
zp`usgdr{ueEG2j0ou8-VSG5oQG}pCrzOoxA-M=gGPTxp%r(abnU$r-7grXt<_4uB8
z#ryjP>&DZ^oSvGd#<zuEoF3y~J71ab<zr4SM{&Z_;fUnvZGL{GdDPN<nTp%u`YZn*
zrFW>CZ4ZXRD9p5-1IdF>P<}W1AjVcYTYU`AB!w!aZZ6Nq03Du3O=NmMoUU-H@lu&B
zA#Z6z7!+;Vq}uW^(Oo%&z7}oylS-{z+vS1V0Xka;4)ANN5njOO6rrki2~XD|$F)iw
z`KeD$Dz&Z5xAa@sPxH2N`&C5w`FD!>e7bvCxRYzNynPIFk|-u!;<#Sf-m1bxWAd(r
znac(`N8Qn(5ira0PTDb}afb3zDj~vNO@MDFG)CIbF}kxtPyWeU#j$V0Tq;n5R|8!Q
z1_(^Z6_s$2G}lOx6O~cb<5)j&nR}-6i=6lM3H(Rf=hJCTH>lWt<k%A_&_rdY2!EAu
zp-1H~*~*cqkpL|u*f+fk$*0nO`t-@MCNdjaS(*L)c2s#6+H|{}tG%hM9B0{d^2;2{
zpmm2_?LI+*`4YFCzL3+r<1;rT1<!L>Dt~fwe{)xBB&+tN^hS`RRSQGtwp%l%hL_S*
z8p;`OqUTgq8SB|K%TD8ak?L*MFtxW!`p@ys<P-EU_rgYbp9ByjP%X4lanMt|%AI`i
zcuFVh+;ga4J%a<fd&v7EXznB!O4&48%pp5XVmSP)Ai;b_ygIXUtDO$<g6fu~7AIU8
ztU-unJ=-<Q^#ee7GW$iAXU9t1R{E@)zI}u=w4CM3SMp>`;f;$q6USmF4L+++PwwpC
zNB8>2Q|+E1Fnth|n-|Dcs%ef@)z9YNgFO*Bh#QFuXw8$R>x4_v!`bn<JS(p|#Y9cv
z@whqCpG2Fs?t7#{Rj{<RWjj`Xi+~g!d)f}7piBqO1}Hi5t`8A3{bE_|9YFMlHF|s<
zEwS%%H@UNCBCM<1Mxyq$N|8^Qb&SmDd;J7B&ch`1=C#ISph<KEwlL@J&*vpq<@j${
z=AD){Y>kCgSus&+-BcJMA3X(qMdM!RV9!CvK05ZivpJmk^f;~9en@jmw;t>5&dExR
zuk6;fy236Mu@3U2Yx+VV^<xNj@knWbRPEN*IB2%m-)^Np5e5yNZN95Z%;9|#8o?x%
z{ei2$rsHQ#xHtlnXco)Qczcsv*++&36Ya|7b*mE-U+=Q;DTJ9~s{-5TOGdCDas&fd
z4&f71VG;aDYd36z{0vbR&B${d&|@pc$5>ZoRW~+39`fFx&~<B}%4xt#^x$d4(20C|
ztkBAu$yf&gKDyy<Z8hc=YUfofGvA3G)ydeX>wV6x#LRY$S>GtLE&}UYy1TLyIAY&H
z2&2Uiw0)QNu7X%Hop*sY*3^#NRko$qS{SFzDFc-~txYNjm8h&RMLC+cP(HSViS(F+
zSuf?#%*I}87^REg&kQ``{qC(_mGAB4GMB@1b&m`?dX`)$^ZCSEN$hR0Y|0Bitl>-C
zVa!$1(V^2h^wt3&uQ$P$yrfBm7F{DY0ut&D1#<@%K(QfM3agq0m9{3#E#W>STmeiO
z3!@Soa#;Bh{e?Zj=#1p9bh4)ai=nZ>H<5k1Ff&#xrFg>@wkFdpV%74K{0n8xArm|K
zt~b<Y9YT2s&D4T5GqZ1NIu-gdX$<5(EdRuXaHq_WhpM^I?Ectz%fok{X|kE+C)W;U
zw1RMQp8#DcXoq|FQVjI)L*-HJRHMB2t%-PES5kuTK52w#GMF?;sRP@k0}BB^VRU6M
zg_>BJhyZ@7siT@O9g$&+J1H~l`4L#9l#2U7OT1JUGqJY=9K%FdausjDAc>yr*TVOm
z$fEbPFB)h;E?5TB{dCYqmS@3>PC@pmpB}EsJ%lhqXA#zU5fWq4bgrDdP%R~l_>W<7
z#zfHIPZKP{Y4}#q_#uOyG*L5sh}@^m$@QZ>Y`^^u#flBj_n(<BHdrtabZ5p7d1=jq
zZhP%w>n}-KgpA}9v3RxJ)-TH#<moqXC`KZ-X^3^QStMMxfv9-J+F&!puRqq`+m=7J
zRaFFJgH9Enr(m{B><tXj9BTQL0Zw8IhPO;BptK~%ncz=CuPQ^)GElgB+x-s?h-<;!
zWTBcaM_h~Uta7msIR~w%{pRr6=FxAh47yn|wjpi;;J1elBnqhVh*|ux&8t}~xNoiR
z?mf`-dXLG(tJGU__+dX7glM{98ieh!DQ}%<9%;tn9iN6gGr&08X=}O+V(TIFCK&sM
z5c<9lMF$;e?Pd|21AWWeH*{br7Xk+n;wjv$vJXlIIkMi*R*QCIJHR64lY_qCnPLe$
z-&#du0e-JxX*C|v!tCvD_U=~NCOSk?h3|53h~#L-IfE9i*vGP?j-H2HB25F|>2fq#
z=P*BJF;L7;UkH`B_G8{0Sq)-IEMH#AELQ2!D@Vvn<?$jK2xU!=XX*!`uCc~%A!PPP
z4rxSdwOA~pC0KA|4oh?h?E)+BH@gLOVa&tmYchK!v?WoYnq3Z<gH{YZmSq#H<Htx_
zic|{YCoRL@HxSU-Zc#~Zc}mB%xRAt@9jd7`VPnoKmzkSmHGvt@Vv!|E$VZ)-5Eu|>
zmQvD2N;7_Y1E0v_DP0bE{{`<svN9y0+_F&q$z~@SKB^jsqZLTeyah#QQ?(?}OS|w}
zV)$IrPa?texD5K)FhLU+X<`VPoQy;So|zIb;_fp#3HAOKBI_~+uL6n0g1z45F%i*i
zZ}_mI3wGozTm(o_C{&^Gu_kpZRpwinJv*-CW=t`L6r=ENc<hY%B!BAYzJerC3YV-o
zib2FaK56;{TQ6vfh_Y2_qchJtfeT@P5;Cfrx#izu)TTx2o9yEW=eqgJx90SJOzQxa
zdb`<JAX%s25nD=gXbtFkaGQq5q$c^iTe*&!H1>S@xu|*U6^UHS{!9!8qb3YWY{#lg
zLkEWEJx&@L4Y(StM+6=~Zm@^2t%eAr^@2{N8LBWaZ7*V!CKRq{<q1M{sR=?#CL9GI
z4RanNvb@xp)(eFp0&ZHGxK@=Dd79#aRbQCfb027GFPK{_oV(Gc>Jsh=>sCQE6Zb=6
zx?4yRBEOsEwRFqGr+J#?uEM5Jf{F>P8$ktlq^bW<)3!hpd6cec-m*ja3G>4(R`jFe
zi4*!&K=T{8^Vo;?p+Lx~Cnro!a6P#|uHg)GdCD#hP3kaK_;f)t7Es&`Vb&+O8+{5s
zv82@U#EYA>Rfw10Z-Gxk_=!!T1rSQhB$bpQHL6Scj3KuiiC%B=^xC+v(^$1B9-iB6
zDm7ZPrcf5^HZ|KYs&6@(U0^ho%Q-ZGt_E~^3hU+&EVvp%CoCWskwovHrCB3dOkicc
z63m90*Rj@)@ylJ7fch>MDz1i@%eO?Y=SS@>+6V`ujj(t2Ld=l_9tTDp?NizgSP}+w
zV(F>o=!c1K5T`JJfB*OtkP`R#MPZg{SQ8a>w%X896Fd`8TLqc7v_@EfOM{8pX<951
zVC+)!Cs#sgSn$<z_N<w~n)4wXSAwrj3)`g4SI3)*#{yLPn2WA&;KhLJR5QG*$b%;2
zrACORxj2<HIPoAP=q^zp6Af1qbVj(t=J5g!Ob?RXX@k5FKQ3~_qNlpW`?no?8@&|j
zii+GYuvj#rxTl|4NJJT==!WsyvtSdDU}bbi67fuyAg`GZo$<wL@pw1B6+K1>H+3`0
zt1Zh%+r%IQ7kn`<%}v*<P$yRi#@DPq@2%}ZnSA=ZwWGmQ@<N-ncJk($-WBV}tDv&m
z&|H0}_C1?X@l0L)bwf)FbqB3n8SN|UM>#XeZGsZCeor{sV+j(Eh$Z^kH@~!MC=V@P
zGg&Gm=E@Tx?Hunsh#Jwz0MNP6LM`up=U48*>`2bW<@Xp?!UN@Cc|11b@PxWovPuC~
z6V0^oZL0naDdwx4B#2=VCPojBhbdTJk%rhPw5fK53eIDhrwEMew5@f)-v@|-HDw&D
zD5vox9%A#S3T?I_JX3Mg9A&54<mC<-3Rx~KIP}t52TfUkNyP%5X&-~&boG{*rc;_0
zjd(CBnyL0^m97}9PP`~P##=|ltyE>VU)>~)bbzrs7&v5%k%bJt;nXyrTCf^bbrZt2
zL5e)GqII<RHVJh5-e3+r&DbNXL9-;7LQgXw1Su9iMdSNzw8i<Ll}>*XQ^2oUig_#n
z<s3mff5Ui_X~DjSyyyN%6@8zn4Xo@DtQ=2dCU=uYW+C{p`DBS_rQ2*Iv>CftPo3mr
zJd#2A$3C&uMrB@ve!k#6b3(Kf?0thnw4{VpPMfWD4O2hnY0)wo4?TSla{7jg&H>iK
zX8|+0h1m}dTMMD@N(uXhWjuWe^-5M;lUBpFdEQD}VhGTHVqh*jIKsupKbJ+PMKl7$
z1Y#;wGVw)A5c6}}qPBh~V%qS`ZqkX1fn%+AN%2rQGHe8fZyv(S8Z7#`Lab9(`GMR*
z0A}3+sxjY0^`IFwa)cjuDjA!&@Fu?L&7L0?s^ud?WU2zFMq6aRhcLH+M^BY_#S^QZ
z>x|5ZR_uL#b-$9%AvmlA%Yp)l$@2*n`-wf2)4N{v6UShb^d3&ctzOhN=p@cuG`R9<
zQ;#>>?}q&8&fUh8NQ16qrg_&mc>>!$h`DcmrwU>s1vR0q)}+2_!cu*fU*W9SRTGY@
zs<1DnstRVBU(CN_<>Vpf46Du0f3fhqYAUB-&T#d-(3f+UuA0VFTi&TYucu&>f7OQK
zs#W+^v!X9nud8i%s_h29*l1q0&8fEf_~pW91^c&OY<j<#y=XnB7~*(d;r!wk$HgyB
z-xV%6D>$oOb7k0bfE+!y)!Q@O$x*ijo#B;N99j>a4{3|1rO3U;yB|W8dy=96ugOU8
z^hb;Aw|YT>H3OQx6d@{o&sp{%$i9;*i7j4#FumuVZ}+_4Klga{+*9bQm)r}_x#vDF
zPhS3h5(iiGefiv1@4A=q3;+C+J~tJw@Lvy*`WoPmze>{fUhZ9{c;QKV-S_cV&;08i
zW{QC^U$5u9@LT+P<Avh2SJyo{6|cYj>ihBQo!8g!s$VY)DN*cWuS52|48P(Pzh2Eh
zsUjb8t@pZzVZg2PO1HnhAVevKy}TaIQxhmu6KWQ4Rkh}p-ab*TCPFIU+N*#t|E93~
z8qbiLz_$T0aG~w4qblFrYgAoYDobc8@mfS~tAO~ocw>wTI*`glOQj2x)Jl*uQI0nQ
zC8@S1V3p&=loM2ylMIy;Kcm@mL*O-d1PY@f9*pSwMxTon>id>{9TPwIEsY=i=yQ{#
zQtRW^K=vQCa+AuBT5Ho^*Jd2mK05ks>nT5atDL>~?a^T1<D<Y#+8Zj2Dvx;T@}=q!
zmUTIo>e8OoJ`}r=r>OEsQ{{1f$m6-de4&GUj)Od7m8TC6igIq`z66TqYKxo?9`78a
zzpZ=HOS1R~`5_1CwBK`CUS=5HC@0Z*tv4zM4=UhwC8{qG5p^XS2i4!}3eVq6_^6zi
z6PWf;Innb-Imt#j8Cy#d@E+ucJiscylp<YiV1nkia0cb34IPhsNHa@)Gmlz}P<@M(
zTB~AxtEO6;UVWRfTKoC>_6uqqm+Ct%t94$l@4TbdW&GpS1qVj5AYXZiII+H`Os)4t
zeeWx^zRvo-LACz3K`PPp!QHLNscOEN_5DX`LllQeFZW;p!OAA}@pn`xlprk+ArzK@
z&Ap)E{N`cLAnF=)d_I2YvijTW4efLF-f_r5hR&v&4euV`>M(3z>C&Rc;S-I6XxwhG
zi{E;!+0Z<AII#mz1T=SCXed4cO;9vW`>QiWG>`M#HcUL6meQExs2|<Hs5G@q>1ohL
zqp9?dl;1<NsFWalqfM|jV7{|qMDA97Z?LkG`Y6MXNo=EX4FKc3wajxUsjo!|faddC
zd1}y<Ce0^vTTeRFvg86|X3ezIjqoll${KXf(QT?9P4s})oZhQlQWZNzYjLDamUwbj
zENs^J)z|9{qxr#{qX0!yEdux+pC97$7GP3pg^4%wj5jO|Hps1lDa3<)jKM1()hQ-5
zm;fk+%S$Ektrka96&8{CXq+R0j)L1%>4!c`92FBna^#JEoaDVWO-{V+e5|jtN|Kn>
z^DE!zFP=`7b04b;WH^@eyjOr(S~rs{>|JJs8;tIzd4{PcuO5tw2#`oUt?IPIqYq5i
z&(~i2a=_$eS#d1sy-b8qJo0?^{OWgRNgHK%<><^`q@KAhUjI7o!6}zJc=OeLncQcw
z?w_XAyJcObudrX2@HxF{tm5*1WElv4KoRb(shc84LCDdI<pe({h+FTx<d2vedwz=~
z>D9Oo?(H3ZSCr9jN>z!}<qY&&=uK5TFBul;v;6w$`EX?xX8WX1=F$3Q*fp(zmnKJS
zj%Tkr-7~Kb&~jPd>gf`7#!0_uROhqgl--zcEe#tP5%J>S*44lCd=xp?#1?A5(<eVs
z{4lnKO2YQ8;-dUyxuPKf<nhRpu(HT}QAv%ioh0eSwP#KQ(si&(rN?y~vD>8?$|j}r
zx<6oCWsu4+Qi{!CL|jqwQn*As?Htc|B3Mf0o6;uce#;0f9&#c>J|D_*!m2AhwtgQ%
ze9Pw~p0~?-MLMG+S--nOX(3(i3AIf<gK_30ES%F%oKmpBtffMLbN05f(4aPxUE*+F
znus=8oj}H}zKTQxqa>%zHW-S$;y|MhC@)pYb1`4(NLLh_AV1Z$B-#ugFg^2`V&D{L
zkn9{X7Ys#spih)3n&E=^%@SPvIZ)_*-cVNQTg(%bYhH;H3+ysj<~v;=Mq$nEnT6Jm
z1GSh(9{uVpc8gT0i6M-Wx4wR;%FcLTpJ91#**>*z=5+ooo7wAvM|Z5i0Z%jw#@kbO
zR_sz{s?!7cKSTt-KPhbZDJyU2BYC&(?0xm0<AoQOPR-o2=ujp}dYy4EW|Hl0*PhrO
z0cSC$csB;VvelYOExIZG?sbZ1)eJG=c7O)^a_*pLbO^_33$~R6tH#uoLY66ArgO08
zX`XI^OxWe}r1%Byc`q&V)v7m*3Cnufw{N;uJ2;M4d6OOkSJi)+dbrVecr59CZLryF
zq0zL(z1-4G-|C<_Ke^Q<xbbkao9t4zUjy$EhxMgTv(s@^c(+SyBMA%(R6(aNWL#aK
zGMsU*$!c^=A9|W{bBbJ3u>0C%&KtYksb#W9UlW2h>gDQ&Qnka6=Hia7KqGy4G`>|O
zUv9LYb=U0Zd~7XL%44MMRmgL@YvK}5B}T^S{>Fzpcf_B#KGxi=N)LM8&Df(%9_j4C
zqs*Jq^YQ1wSIzHao2HQY$44t~C85@*g2^~LX;xVTL3L61PPgep$%0p8kD>`{l@4H;
z{pJMU7>Gm2W2+WNa(<U+5yuDuPlpqwVeA68r8HQ|f|WU7zR7t9hoz0-lSQ=o+`jx8
zMHV*`z1;0i&ySr|N)|>6sl@1>t@_AVG~OoEVGy-8JIkLE(5@UxcTKd2FC;y<UHp`c
ztDQVQ;|!~w?2~pj?_37<{D4Y}+&ngI#$J(VldeLgc2;@D-Xo1Zy<~S*Ey@j~!1-x9
zB1@tc58Xowu9l&Q-7~Vnaeg-R2?5jzX9dVER3XLJ>FYS6Wj&s7Qiz_j;<ZR?O)4j*
ziMucBex8(lfSb#M-Lm3xIC<uQ$;~#7i|)Bj><Ls$u#4ix2B+D%c9JS>F3MG0?{_oW
z@y;>>2{+JFTM1{y#%t&D1=CYwhGrAqmTU7{&d@s9VwrDuk!gx=A@tEsJcs2o^7t0x
zJK(B}dwA`dw0KJX%;0p3v#p|Px|B}ZjKYO(EF#J`T9AIzskQE=*4Dn%M{(P%JTxLc
zx;L~F{N(elSS@>7TaP3po8~bWE*mNzgvBWoU{o8Pt~wp1C8tj47I1xedWb)jl{+By
zB(!Pi9KjJPr=7)ZY~W%-dJN=_oMqf=BZ#{=lHal9qq;W@71(xsW4pv#{8nGv@^IKf
zu3n)yT^cJbF2k9>+Zvjl;$h}SVxgL_3`t$Nng>~Tt>t^DS9U3|1}@oObqZs+1V!0;
zdBe?5Dk##7@O8^aRSI6)d-j^H<S@m`TGVgsnK>ZgWAVOpEP1c0B4f?l!_fMzqzqYa
zk)Zc$nThw;<X=2ZGP)cSWh+a5T}sat?yn#=(5w;4qmoW8rtvPZWaTchzN-znu@b}l
zC@E~-LD!~XhSqv=h$lZ&?B)kg%G>orJhhueW@EtvM_YDZg%4oCnoU{MzR=l<pZ^zo
zcODM)|NoDEX3UIX#?07vW{`bP)@aC<vPNVnLLp>H2{HDaL6&TdB?+S;MV1<hWXY1U
z#*m2YsSxIj-tW)%{LUZeT-P~&oa<cY`n>*`KVH{0f6Vo|Ua!|YpZCZ828&Udz^58)
zo@ScZdMnp~uGDQO1g#n;Uw4AXGOzuTtC`13TjifaroVnI0<Lq=KR4%HtnMy#q1MOV
z@e0q|o!3o|H<NFyoD$YJuBN5xA0HUTkDb|x`Lg4$mRiHgjpD7sgB8!i9y3O$1Qh8m
zMI8$U*8VZc<h}X~EEhF=f%uJEato4l{|B5YKwtgkpCA+Y6nt#G>A0lAw|2$-l0+fd
zPfR-)hynLUh?--xK>grri8hG*Z&LLO<2VNyJrAUvajrOdN9mgwN!jF4=Wt$eV#N~3
zohM>KCpQiL_`{WD_A<?p>gk4Rjj)u5Jv5SP&BDz`2X>w|uMI{U4p&JZu*;SMdtDsX
z*y406)J-8a>6xEzPeodB9!Gx>w5#06>-CN~{>P?2=;y71-;psvj;~<>w~~ZYC}vlM
z-BINL6MnQzs#lR7mrM7jiwbeG9}`_hTjQ!|I@vwXyLFFyMn+L?pYdZAIyoy~r~dlO
zH^1oKV{`0}c9`UJI*Kp?yv#FAp2D-L=UKQViqAIPP&*us3U!pgaPM|szP@G6S8z-k
zrP1pm(Cq%IK$2jrW}9Mp&2{7>ixWjpbiW;b%o)pLto~gtsy^L+F^bJIJmgeO_(Dx!
zM^#~Wv&~k?X=R2Y$!u5*XOkuTvZO1Dc3aW@+1gNS2-wHNAn<Z|oJpX2oFYUfCvkCD
zBz9ug$^Eu>F4a{p7|C;Kto1?|HHaRG7u9jkx_0uMY(#Kh*-BY<Ph!F`owPn*#~<1B
zV)9ccz2*cViSo-kOA)=1{-t*%=kabAIx|rvH-F3QqF<g`=;6F63Y=&XHaTYfRv=tJ
zTh{G6cE&;Ygt8t`&<eME_E#3yBb!q{)F>~1rB57G3{9_(4jle+x^lQ4O><k8cx5`3
z9-cqBxA~30(C5l#$P{(?aO}ykWz?Zr_oH$gZ3iX3|74x8!sBhe8>5Fx!Pgd-66Dbg
z$1NDt2n<?^3@v&bHO##tWZA7*L7EvFa^3=BPGIk#mKys>s@4F?uDYRpf#(5S`B=!|
z4X9-W^bd+Lh`<=C=sVE~y<B=Gz>ksN4@xh$&Gv)AHy%oN=fdc_Y9yxBMVONaQ!Ih0
z{RT5>=~#{8Lo)e81?0C76Wow2b#jnp28~o0l$oNysMSH+SiW!<sRduDo=%zO9t6k|
z&6t7iC&Dp_%V}2xx%>r*b3#0u?}rVciG+DcNyrtSV>*vKC6#j4zOhA^9#hG<rEZye
zl9l~*hP+`0hfJN5S)HksKPNkCV;I;_m>}OrW~~0ko^Hh9s<gin&lPAUIt=2z!@@H3
zK9(mbXc|}~+k11qos|~n4D;5NdNT{j6XEi}Ye+`2i_}T3m3-dE$I0pn91z>O+gZps
za>GMbGJs_co3W2UD7*NG`*WV?cAJW2p2wuODr{Xv3unt_@Aw-L-f^E*5@xIyX4%4=
zk;ne_$KI*IKK{l+SM|0nk<Qq8u{F4c5=Kc`gvN@I*%D#266LHFg{<++q`vQ4zFQ^D
zyigLPh-KQ@kgTbb+E=76#qy`l2~iP}eN-;4p|EB=_uA~lek9T?Qg|BJ>lP{Wu}kP~
zM#Q&{jcLrW$I6{THw4H5BChnQVr3cEI%)V5nYWp;r@UtMGue7GW!ko6Zl96Ue)97I
z+rTf~_`}}2G`4owH|L;#SiMX=-U<3ZB3;#MXI8;x(N(=d;$Ky-gs$pIGCxItT$Ep6
z(G57|>@O0r9f-s0Le0b?Ul=^tLy}l8q=AvYd{*T0Qx4bjsxldJ?=n+-k8?ffJroZ}
zycx)O=P6({phs`;^VBtAr2outh43B`h1Ziv?%=*aSM_H3&O}1P+UcsEa`gYGdRSQ0
z70v1&e1QN6XcpPSt`a#c+(%dSW>3FN7U-+0QU~tXotJics!C(WF<9dm@8RGa?-G7A
zF93`9>f$>}2>WuLbX6};<Ve-?t7ojib4<`xy-2#MCxgGjGxb53CcUlqAxrB8P$^4P
zCAtH_r`u0g^{QCl_zwO)48n~~a_2nT!3SIfhjFyEar`}FBcv{4HS4lpCQJ%}U-#gu
zmeQmD9J73vi7du0gLpmO8Vq>8U)WGZvV26iazr?QLRa++GRh31w_bg6NuaBGY*@*i
zNaPB^sPn3HvbFi|d*<|v?DZeUN+!SW5hZLBkSX}3OmV(ifJtuYk*arz%GXOo@SIf^
zJW}<v+c_kKPFQ{Taqh!C^-n4~Kb4uQI#8AJLii54swcUo;=Q$Pel7dL^^X^BaCU)C
zlp=#PAf7^{6xb!gwfac9swZ_N5^RBEt7R3I^@Px*e<Cm8p_ef2aaiz$BUSIBC7u=c
zQ$IJ_+NqMDBgS0{VCka@VfqHY;fxM|7qSg6_}g4s%)a#9#yp7gUS2z_nIaB({Oz8z
zO?t&{aj9kG73Y#4k|WqG<4FCYFG2*WkjN*=bAI}tX5R;I37KJ~Lq{%YeR4g;<#w6<
zGQUAWxF{kjs48a7RNGK^58#vc1rkMt*;9|75EGsPT(f;H6@|SPdg8)e6}RXM9`QLI
zyuNPS?pd1e&UDUkrQoi;OB8mj1c^e0n<yNr`hp$o&;rp*$)B#j;_`m=%Y(bKG(=Pw
z|Evv~EI^>ZhJVSVxCq|=qW=6>XtS#KI@b-_4=&rc7c52Kk_oyeIzcOG>}75)m+ub9
zw3fi<@D7AB9zd4w=eNE;a{^>W10wI;_yO){_*d1Fos0B2_Ptr$&+x#-vq;1!`!z=s
zMpN{5kofO_Yq__s|Hd3wGe@lQnE{7Xf643&-+m$!f6KTnq{8r-0oOfCySE+e%v`rj
zjc)nahCIp*VMX2M{HyA*ZORC!Fr&E#gw8PSQ?3=w@$LUd)f-vjkUl57G3)-I(KqsW
z$U1k#k5L{CjOW~}Ip~*+WIL?qH(k{`6Tc?C*NeIkBsA5p@H$Gc3D37=8?b5{p}-S;
zoX5A;)^g&6><TrAeT0oBzv1~rM3}9eUzkUB&)HY1Df|RaoGVY9hPr`z`?bY(81pk3
z0hg$mRlyxLofoC7-|)!RS&oHB9x^`k#hkO#POLjmQdwSzCy#-5o@B7OY&{TlFI`}t
z68);frhSeB>5^QubGOts>4RNrd`?pDe^k8-bX5<_y3#AWKl&e4uN{?^#_KI983iSj
z4DgRECufyj?pN1<c{1mZWt5CYjgDn1Xn0KK$xe{q&6FcmuN1>RC?_0XY~edghvJyo
zBDqtDQa?{fTHnuhx-U?Q=P}cbmEbl1HS6}#G}nPWtBnhZ0f4%wK7h!)`xq~I0Ei||
z<hQN>VThop`yMCm$P%c6+le*Gx@HIMu$KncG}?Rib(!3@US7FV*sH<Ohv&{$4NC10
z?55`CiU@CK%IJ;5a)OIBa`NMInCPnBEvio!UDcz2OaH2RRE)bOwuF)RAof#!r%1;>
zX2=bT46Y<?MREm<CmmqLpLkF0&z8Bev27E3gMneWrFOr0rCLj3o`625P>P*2JqOiG
zeSSV*2qCiX5lh5NfX?}rT?_!e(m*~p2~An)z0xC9&jqxo`}^FRFq4Twqlv1-c0^yi
z03WZ^rIOeOw*1{nHEu3p)7YA>2~@|jP{STL^+?rAlaMughh?RC<x3*em;qxIH<~ju
z@-N-CCzf4Bgz=T6HuIWQ@JH=c0$W_O`DF9*YdV1NdsMDwqD2oU{MSU4K}d~p$c)|u
z8yNtfa(?)ynRt(`>dlrm<lEf0dUi3iV-UxbKv(s!2(xycdwAh}B7ECfx>-YNC!pGL
z@`>OdS4hhvmOV1(MBZB<nuq^|a6yEv81ji0^1+d+7uAAC!k8sHj#Rz!HvZNFU`6yC
zAAzpwmB8PR7P4UlV2wxj(b&nR+t5dk3e2+$$SnMooO}Qb)lD8i<jjBdowL3T)WSc-
z@IX&bimvLFzy~Q|&C6V7w>xB}!dii)ho2;AE#88%`CJ|)$@i}a-SqJKG3okCt37$-
zRY?W;z7{3*NY$%k-S7Mw)ZS?*RErN^*Uj9+GIu?K6L9)5g>^|M)5|Cx!)lpZO+v;~
zZ<Z$MCL*CQqf@J^^R}b0tE2nX{YN(9mGBTo<^n*<MDOqC&5`f9=t-?nECP{H)Wa+}
zU-&+{1Eo5t9}J{l)pS+w&5hYN1yS!y!+KxrKN)Q`Z$Ih&W}hsBDd7fy=)>JyxVOAT
z7eY@CRd==v?n@aqozc?1((L#FJ~Ctp9cFN35XY6Uhd>qE>dZfzYdCpdn!Q6`7%Z8y
zAQg^qcaC^E;m#kpT`1}U;uxs-I+}~_r`Q8?A8l{Dv6R=k@fWwzUw(}~J~mc#a4PYx
zK#I0In>_;;Kat;AAirpGmt!Kkf(MG7?49ek`1P6Jee%P>i8jG0OT($Rx(rYZ;2!Vi
z)i&c%ZO=Vy%;IO6!xOt`A@gM?szkse2?|&|eC|PL7ZyJ!6E5(pjbHQ74RkmgdymQ+
z-t*}ZysBv4^3Ck&Y3|#56jWH{wf(Qae9CVpcU<w;h@0~nN2=b}*HNFZ>@AwReGM$;
zpxpsvURq+Hf|3qCX6r0T{8jZ%0=)PzOQ|}>w}m`2ahdUlQo-Y}F67Gj@^8<CRx|Ry
zr+2CMyp+jPdhq$uS8nZ9+V@KzMlY>NEM-jOoTffs8JJ#Uh)CT$^q`(xf7=Dqo6z9M
z^=}v2fCz7u<ZayUV)r}PAVn$2Ii9{Sy1AsYb?Ve331PRFy2T2@(mOzw6r9=mY(u1I
z{M6y5?&V)UY`1m0SP?VZ>2tP>>O310YVXzVZY~|EdR*bXt`WboB0{d8`aQ$gn~G`7
zJstT4cysozsu!R!lyP~tCF0h78eP@frAZ6L)P7c(7fMo)^ab9GDEiYTeE5@VUpo%5
zaC<-Fim+rWq15^G78U_0eQ+wG&yGnTL9wJG7QwF>22(0MlJxZEDK3RwsRCLd`!MD5
z?*EbWda`95n!}imSM=RixjxbQj;*Y-=t$B_+{l(7{wwL7y5f;ib6zteO;+!a?{jjd
zF=~Y5*kb=C;dsqh9bMAXPF5vNJo9#1-ey*l*AJVS7xDhmTRYu$>Pg0zYQl^ZB?kTj
zJgHhY*O|hv6^_sdFhj=4IQ%*z9g}U7s}(99g1YkULD{JS`6Rpg<&QNEE#WL$o0A_J
zgzH1yxu=sSTCXp*R4As<-{_<ckvgr70f~=YwIYz(&D%?9*A&)M6%s$&yQ2dP>9*d_
zO~1AmmUhi9dkG6eSrJdj8b5cpzfZnOk0=b<so2!d;!hA;{`MNi0`o63#O%w_)Q3(a
zih&&ehu2G?^Lqd2dhc<KidirXbO>w?Hy^g+lJL7bldkJIS7PHO<J1Y!=)bz&PKH2q
z&b!>p8HPfMZkbnBCCc58biJ%g8TER+AV>yUjal`byWVffjI;74Q|#wBe5Xp^Xf_f{
zz=Ahx0tZf9^*BxtcKTMLFPiv9V-e@C$<ujqpE%2S+(Yr{)q)#aXBK0flkT7-=#|>w
zQ%+ol<(c`uJ)VyWl<!Dgrkg_joMA3^s5vF7yRJoz;132mhda8-r&f>68<vHG8C=!F
z5%;d^jY`h4=-MI58IM0Nj=x?;dQXS-?03uFoUGoWWj}s2;oIxeNQw+0ITa&xyDrt$
z&|y9I?hl6O;h0`$$sEKHtS6>y;Xh3*u^>OqJPntd-(OCDby&l05b#Jvd9dX9*5nFq
zYxoG(LvTp8-g5u$^HwMV5nxC4LgY%^MblwDF*vUo9oG908?ysFUU6zuA3LZ+S!O0v
zz<=OBIvIFf>98J;Zc4xUpR&OA)aUyFeO#{It38+e1p+?V-{}8oB<j%rQNuaC$Xe7y
zQt2tHWggJ6$WFh+yWM1enUT_nK&(t1&R@}=F<$=?M~C%98ia4WU5%TzDN0=*IdnUx
zYHfGh^v>6u(7m8}$K^n@!3Iy~yUY1MXbt8ce%mKq`e5)bzxnjTbfMAt+yS%D)gSK2
zP{%pHKx<w(!p7hlQ#*UqNdw+|ErW1{fiSwHhq}8xeELDFW&LE@-Cq+%aiKpQmFgL-
zwgBts9cJDe)*^bL>x0{CuTT;Dcb}q0eooG$M;y8bnV+&+o3exkRlXM9X<|_CagLSn
zWJ3518p(x~Fv*Nu!ITe1aak{<Z@NpN5hHJDAax2oGsnU-6vGbsmd<GC7sdL5k;`x7
z6;Ib-_+E7h%MEp2-kygDh2VD9G(tOi5O1=Ke#^W@O-6GN!1moKI>ovmcS%<sh9N30
zB|-n#)?hr2!$?jKPq1$#a@|&>4GQLc(@z9PBQ?Ftep^!_U8#O)H)}*q(%ONXO|0?@
z)mLEC4--LNE*O(m2K0e0C^$hB>_v6re7Bgcg%}n#*)|epEJZ0I-!Lz2F)}x~bVrH>
zh=g=^3Yqh2VEl-jx4a+9Tpnje0)W{wEev`!>I4iS3Lks#4bFm!jHoPQ5&LEa#XdfJ
zNhgu@xxTSD>o5b?FopZ}#zTo{sf=Lf5}}5biZ1KjINPMaLe($^M&?=5hlCC~s`plj
zeHeOz`UQr?8=Z)tqk58x;I%jICl@c8N7Otm${V4hdL?vJFB*K%w0J^F4<7X}u+-5C
z!brruPx0aiRiomiX_6rvcLu2tNj#(cL1Zdd431ra&?QuJaoDESx!fVs2zCM2aj&-F
zA+LbvnaMlnFZYNtirGCrb!o46!14`?F6i<3cOQ_*a_2H@lGo_YZ|lVFvOwmgcrD?m
zmvO;CScf3vi;;RrS+ab!_iC!NlGn$ko@|E&j?)g7cbJW*f}T9`jI;i#K1yNcI>X}$
zz5KiT`D^J<%2%4cISa!t?%f=zrFZVAb>N$OygtcWe#NPa!Y2ls7g%{b-(GdMd-9=*
zOFrDRT~r@FIi@O}BcQnAwbYm{pRo44)xZR+xOH)y`F4}L(j%kLv!~{<w_oV*$}##<
zOy*2(H!Eov8m0Hr9M>N!v`l?Xy!?<k_M6r1)_K8qN<@6d#I42<`Iy;|nLmVE>fEjA
z9<g`VlV|pqZ@=1KeG)-~QvvW`3Rs>TiAte@WrEugzT{|O#4PM=UVD1*8-6RorJfG8
z+t;Va@q)uhrAp;CG5NYg^OQM`>flaU-@4?>h%Y?7!Cfk~b*VQ}z6g8|etUAQE<GZJ
zmA+fqApG7*Dmle1w&66V2sG+nNw3GeD*;)X@>TZwonB1}Ec+E*(mOxi<0$_$r%iT2
zrCOuMP4#KPQ0szv^oxF9)#HU<Qx>HIiSL761{Tv0V6-0qe1iHT#}%K!3fLQn5~oK|
zQ#_C~NzM0H(5JE91#V-WSq1mkwl65orQA%QOM3D_k6j{d-uY8TYJ7vLvZ69B^yZH|
zc|KirE%m$oXgWhlS5UR3DK90)uBz?Vv&u;A-Zq35q*GP3UYlh&K`(T|C{pxk>Rm4d
ze(_IZs?TbDKKtBY3{@Z^)gDK-abH*CpBxbHs~?s7e(T5A&nur)pGowLl;ydQ5c!Nx
z*FKAd+;*6bX-^R7lUtTg=XYo{4Ay+f!Vx4|NcCq8ZgaoLoBVcidd+v`nZKz&zD$|4
z|BFd%tHI&0FB<9M5wooSUO06?b3SZ$t^GC0@7(eIg@p@EWNqa7{Xj<r<r(!Zx%1nB
zs5aV{H(Yx|E^Ga*T(LYMU)hdjLW8i!v?tA<r1ZBG1-=dwT#R+!dwbV3@P)V2lGA|t
zU_{$?hqw0X#oMk|BCjyP<qWt=Cm9voEKhv(=obFb1d+42&2q7UwAOktRP!4$ukMTH
z$|W`Rv0nM#jnOC9dOn?;noPSnkj}UDgX^G9V<1@VlIl}!|9?@v=+u8uy~M8@r~iZM
zHQiT6JYMggvQ)U$JCMJXld-?0bc5$@)}_@7VePFlg}tTRmrI`*?{5Cin|PqofzWG-
zm14b;ct!3J+!yd(ZfdY0RP2i4%oEe0XTo>BKF#0F^*=l;S-&-P&5PcD>;KURKl$6A
z(fDTmBmB=?trrH!wXf`uA&o~AgyRXJUs32?G?eEXzNo~XrIPzF*AFnpE2i$X&m969
zyZdf|7aM#xchgs-`y$RLTDVdp?h4cQI(FL(PMcX4JGAKfzoee1l`f}xFdyi4^sU(l
z>2JJ}lCd(ux6-+zuZ~_fw~H2Ah)Nx`TlyJ$?wcW9)w6R3OEGeMAGE%ti(Jm-sHa4`
z?L?{O#Y$90*r><u*+wlJ@S6q4+jqypc@kv4-MuM!`a6!%5UuvWA2kn1%#cjX^niu{
z;uF+WUyH}BZw7_z@MbP1DtpAo+r?jk31cgaERI1RCnQ$7(GaP2975{oeM~Y7E5a9_
z{Gu|sIU(-q1_xUmvVA9+(;wBL9#68v$2P@_RRp#TC5rFFyHuv!S4+k41a{{+S)x&J
zAd?d%)L1FhX9xY;8656>MCvVkW9-yJ`r;ukMnhBa5Dz-3=bYw3U>e&Atbqy7e2xDy
zn?C3f;i4Yb)tI!GK=@deir74MrrncchyZheHlkB<hL1?Ss|1ysen+I<{bTUmJc9nH
zSop`3(b;qfPr`n%puTFRf|S_5svbG@1(lINPJMQpIS~(@{HyBOuxG?t-aGWW9Wx4H
zU`70hg0zy+Sf(sd&&*NvY};{~!`Cs06ZMGIbD<y#ouR7HkQ_x>x~gZ1Lp;KT8Zq%0
zc^;{HTvyVim2=vi!G#+ER*BhnmvSQ#vyC^9;RJZSB4;CBY2J?+T$Wnm3~lv;8xoKE
zzT@^Ahdol{X(h*ao<L7KLtW6pVN7{tXYwB=Mz`9k#ofPgh=zWkGIBpfnV?bhO66AP
zf_lCCp}^eaMr5C!2&^4-Q&E8dn_r=UKA?mc`locgE9_q~tvrK_)8K4-bfoGf(p5cY
zx~hlG(L;hV3PS1%m{=hZvy2HZj#NFEWnmXD)DmNPzVTk;PtD>@<grKS-@EK&x~hjs
z(YnaGiJ_$^+~$2|oIK~5!qtxIkc@oqd1BBr?>7}{i3caVKsw>UHDp2#9%4s@HhF^G
zJ@3t^qpwocxH93Ec<5C>RLk4&o9KLz@j?O`Vu<J1bO!g{;k)h1`@$lKbrTz#f!dBo
zn<&b$xRi5jBEKI;8)C{#+7WinN2=cPH%3i%gbNxP@)i+-huGKUg#*+o>Ilq3sbYNG
z_nn~&9*CD$(tZS>;=VAJ&{e%bh_gmsI2G!;M4S#pIT{f635D7IDB}&~w|OYV5o}pI
zN+FQhyr(cM3*C-`H4LhZIy0qGnA>vUV#*3NIAn>1$RP%vgDWS}L)FobbH{1CmbmiR
z*)sMzRJ0fOH0C}N-S5n(W{VVO-Yjx#N3a>B&7xCO%fJN5f;zgYM+k`3s{kw?^I+z_
zPuA(9CVwaYRrQERs$Mu<)wAH6r#!mL9JEVJ*78qo>MqalDr0DeJ5d65jS-eOMh`Tk
zE*^Z9pswgz?xdJgLrsItriK8>U>EU32F{<(>P~c34-aJoiXoCA$nU7vAZ#fElhp)r
zf&jZoWy~3bJcDtx55jzjw)+(37_{0Zh8bIcI@rK|P<)&UU}~qJFr_5$1jYpuLnrk@
zaB#=Jq@LlR=nq`&Rlg%r&j|;=ItV)(8s6?qgW49@F))z3s90ma&|PQJ87a8K9VI%c
z_XrPZXk>3sLeE!fTC1UtNIhpT%W{n$HcQ1bD>N%hYZs}#oAq4ep1u_6k}e6>j-Ykr
zPx7GNJd%Lx)-FiDu#<XxED1~?l3j@45ijsAMU7pmzzz@oVJj8!r}hxjT;7YiN(9&Y
zF+WP?xJd-Jqr(pAXZ4VV<bbFAVQQ{m6KC;5YL>@Y#(Qi~uV^qCrg?SnUPv}993yd)
zt$rSd(ENhYm(J-gKp9dRLN=;6>Yfzh!G+b}i95_WM6ee-q}~Gch#+x{uhb9?H6DDq
zJ{g)f4l$&%T#kaQ@iWH|XfG`RYTx~sjWH@O{$M<JnoXRU3<qo3+n<MD0YA}unuAe!
zXwPX0$Y%0yyi}6yxRmWImE-1_Q-43_`gl(4Bxk%9x{pe3R}>ZVs+?C;8{~VDmHb-t
z;)`^4NJwVcS7UThui7jX)kr`Ig(x=jzkx-*`A%#xR8$CN;-nYs+$4q*@ZdunqwAT@
z3n}PY`*J(Qa1)%=J|)4Dc-zROOMj*8kMohLH%(Xd(9l+*W}Zf}A*G8zZtK*8zrM)Y
z<qQVt!tDGSD6CLd&uRsUu4Bv4`#9P4iS8ARcDky!&Ic*6cr!fF%wXBg5DB?f5LXHB
z=45T>z5>qkq+wI>c?NxohZf?S<Lyq^yco~Cn8BW}FY<WUQE5!~8~KVI+B>?U?oVtW
z#j3zqHdHtfoP7JW2BN>a>9tNT`~`-2mk1_oAWtm6Aj_1RdCT?rHP7t7DI}VblR4_~
zaZ>P3<Fkd|Q<U_3+E5^-RzF$QB#5UshssIxof9Z_?*gCG2zF`B;B!R>eQ($Ks<|vF
z48V8wgwFKWhR=I$WC`S6x!*$E@6nabys7xWg!ry4A6?|A7}oRT5gNiU1bKLl_0h_6
zSO$Efn`zM~*bXiBw2u=l4X+;0fAUVH{!GF1ckrgi9ga$UiD!#71K%*s=D{}mh7cd!
zy46(MXlf>dCE<gp<OGN~A4=<7&l!RDSbN#|lc*mulyBY~?Zo4KC((%;E$3c*n&E-I
zViU3NQE7J`IK&U^Idc5LgTMQ+7!qx{3Q*=H;o-Ol=;|n5ZfsHu4R>Olto~%hJao9x
z%oSDES)avK#Ka@_?nz+_8|2*~w3B=C#XinW%v6g13b++NEZskhmaS>55^=K7Y<`BS
z$-1ZB#;K`Yq~cvP_PA)u6FSXQY#`V7v8pM18P$N})bd2oevMd~e*S5cCX$q9NiEq$
zBkhRbM)Yx`C3X7$={WCqdhC+*fL3o3hj{+Wjixq{rRh5w=mux7F(q`9@N$bE@jHdq
z9OlH4>kTa=+Rpnua>D2N0>~bC(Y0g<2um%*G5PL~-J`Jk9<&TCsh#pF#ica={*2=G
zf$|>A8V{m)rqyzYGlt}BaCDp@@!bepsq|;Hv%3?A<l&S4J(J(nu){EicZw6vU=KWW
zCkoxl!l@}&!r@iIQ&lqAT{4;4Gp0@YxUBY;4SAIfqJNI@R}%ESW9>(|g&>Jj?uR;O
zTo&AsoICf04)6~cGEn~Vturm`p1zB>&9pVm7!`gj#Bc}iZd4x<PzqVHhD?=_y43+0
zOpi8{8zxW!QRsC5Q9)F~)pzM){NjC`Q^qArA6)sMwU0I!If~4duTHa%5@^YFEafkn
zf_)o4G{LCop|mEC`CQ-c?|D%ybX5=ieYPGMnalBq_`UJJlHPwMz06~##rpr1^xVk0
zjKVRBdQ1}KWIedT8^zNsYV+jNs8e7ieO4o}I(>F?eI)}<Tems`?#nSshP>Cx>kRpC
zyiqa|yggrMBpd-&Hpa$_)f<bZ>noo*mg`o3M&dz?vWe8A@_G}QCvTL`$~Df{pH+AT
zK7LN=t=Q9Z#|QL}o1PeTdupmS6LZ{5W3l|Hnb!K7<L27G=bxINqJdQ`bQ%92NqV^d
z+mfFB^(URG4nB=vpF7-$W`+T<yI>|TfCiAIZ~p-x;6YG4{gV+!KNt~kI1+_MqmXQ9
z6el|yFBc~_H!nXAw-EpTJE)%c|0htrG>7pt`}H)_tLY|Tgoa{5{21Y~XNFl==8Kff
z!i~)H<5_M#_pD0qCHdvr#^p9n=6Y`CIac0JpS<sVGv6ULzdgI4BDnB!a$$2^kxOW?
zE2%hZs@VPiE~+>8UsUh&%J6j0-gNKw%n&_{@pE=$;>(YT`H`9V^~J9Xf4+X2TUh<J
zu<&bPa(Z!We{t;V(&paM^xX32-^;TLE3>;RUzXOs?yi4Z-dH@?SX|v&{<F2R`Ezam
z*Vd2UTfcUH{@MLSqtWOWKa2)AU=lDU6WgO<?9z_i<dWC%Xi<|w<GRw$WS-+*Q{8oC
z|3&qvcrf#SQN917djCH|^^_R~t7-CJqNoSR#thaj2p$%(0uNdMd+eDZH|4#UV2~Pn
z%+H&WL{0&u1yBU2{mEV49gzSQ5wMUWV=;HgXJZ(_gy+TTxbD>Tv|CGDENsDq084W=
zq~~Q_oj8#DJ|kq0Vu*?&rqODs;ebrAXtyzg-{3|B_S;+bNg{IR{@O(ai#X0*NrLMT
zl~-jxPK0-<`-9S1p=U4<n#t1`xAZziLclOtRgwUOR6+##U7p<ozT)1A&WRt1pS+}q
z*ndXJRzT<?_!q!elgccHEsS1F0FXfd5AW^kIjGab*e^`w!tRo<7r~`S&NwQpW^e5H
z3m3_|-t}4X+i#T%cxh4B?CZFucFvR1eu7L#Itoli4Ak9W#1qW-QtF8D@*cnYKeXYm
z1vE$NAau3ex4)#iF-Iwk05CyQAF_haEjecLU_{XKVGNtc@LZqJx@_S1k7pmA+F(uA
zl0|2F%W%Ibu1t4v-%4C8%c1q0I1|xe>=0>}sgedUj@Unwq<ygT7Qhixvdi$Oh=J>w
zM@W1luRdSsVCl)2aY@HzhMLE+qn-Ma1g<ET@L{)aO>DO9JUS`K1KaWKdc<`9(iO}>
zr2#K8m>ABn%qwt0(2BR&I++Q4euR0PKfSYs2EIj(V7QO#$$qA`#~=`~HRFB)7^gSB
z?wWssTL-}Lw3=pi;jwi8s)G;=!(nX9{nox+2;4CYfOun71-qZ>k)sxBsl3Y`K%zA4
z9W+zv`ZmDA5?JXJ5hemYEW2#;u3YZ^r#U-r{TnwQ!HLaPWZT}LwZKgyGS`+Bn-`2n
z`=Qi1Caks4X3*Mkbq501#DK6{{?%vu?ZcuRJx{Rsyt@i;OmNCm?AF+6-b=Bs&Ly2o
z1O(dOe)atnh+WKeqj#ci{=}?G9KZwKg#lu#+PJ<Ft+mR5_t%&whw{I_dRU0DY=d9=
z%y&o5OS$4ygGcR9&?XsjrWP0CsAA>6jr&7d!}V~!USa!GneVN@eX#f(^Ud|u#2obQ
zyua)pUK`rA^%Td@Y+ZGKYY=XZSTAP$OjfohFL$F1SpDle+~ulI{96v6?4Oa?>yM+s
z+C;`@$nx}4Qe(`2V&l*Mke0yBS?S5?m!XF2(03Zn2p{al;5Lkw4}P7;n72A*@E@Eo
zKC9U!btwQg|I^d9G{c_p{fU-s-HMP%->5yYYo&qIFM*sU4jlr9HE+Y_y&f0{oYvF*
z^qh~_(p=_%1za%=mAUNO_p2y!EnbvCNi2-2V5_rMf2;lEDs9J{4}?HV1+D5zwc$SZ
zxi_M1T`IM@mu42%avA?brt6hBN45&c{tT%`xhTVNNhZO~jDJ8&`Mx}i4%COKRnVNC
zC%OtW$!MK4gD40nU<9&c^on9L8V;Goe_G9H`tIbG7V7w9y}&==pf2F_i^7ujVx<<%
zzNv+|<1qKsAI|B3bTz|+$hNr`UZnn@x_|h*SP1yW|H9`v1w6A%`Ipb@41M%NJjc>q
zTi$9A4|d1TKsYPkoNB|^`7^Fh{Tvrzv%_BXy~b5>59`EsGCB9qF81b&2`QH&J})T@
zt@sb0_tLs4iq7XnNNj!qD2r>`nM75k5k|mF`j}5lji(!CVP@#h_x@zJwFUY+=1U$d
zWe9BtvV0bP%I$0uDY#wJuE6EXPtYtMB0)>)zR9$_q~SpRI2q&a9U8Cg=;%zgw!kbz
z0~W>SmECT!SH||y+KTr|0&B=%*rU^b**u$PSC~sY!MbXUSX3+HUD~1wA`&%z{1(6i
zeRvHG%fkbk@K6_XNJb=Q2_A9_{HYU-kz|#yW0m}ZWPx3m>kd~O<MgtS1P6e(Fib{7
z$Q%HvqK?s}>S#vZ7!f@d{+zu-jB}U*Yi5j58jGo|bNs(z^C&U@uzB>HzQ&grZyx?m
zPRs==GT8v5OE&Z$aj^Il7t$1Ox*2yMhH5pyh*`iJ0}SqT$0y_^oUVh&4JM@0BpD3<
zvUyt{9pft#^70aKtcl2a{rsIoVjf4K9j2HksUkS(h|MD>(NVqEfb*3+$@O$p&o23S
zaB@@L5vtcZmi%%jnL=mtHlpZk9ty@vdxWB+dI>=(kqs$5JSoG*f7v`hGM&vcp|g3I
zBQ|e8*Mp%x@~q)`wss$&UfPGIw13z<cblXmHjmYHCeL=Ioay!j3ny2!nI7vhF@2<r
z>7Y9ex+|3Z3-pqRDo3AgZm`ouD@Ni$9mmw2aUdhInwcMFV*`XfoxVXIesaDeoMX;@
zF(Znu=CP$QuwK(2wU@#8nnj@;MQ%xGIPTFlK=x!;#@Wo3TVNR?lFsI({ln%35KNW?
z&s~G$i<?Idg3@DdzykHmY_tQSo#9_har)_zIM5OsXn8|P#R6`<E4wACmN_UQD}|Q7
zum6f0l%>z0063*|Ge@FaIom>B=`>n?S5}*7M);&x!Elex=AFHt_djf2)<10CX|rwc
zzii&@0<P;nY#!Y3KAp|mff~z=<Q$@}{STX0apqq(&-Z`Wyg|pO|FC(bdELB%Q-9e!
z!n^;dd6?Xcr)psV_C;sX1BRh2dikG3if+@$T35^EZg=I^E@jF+y8d<xafm5y`5{yB
zRJM6Mzm*r{x-D#^SbUpmszQ0do>vH(5I7hFNupuy?&pMmfWqTJiMJRZkU<l}AO!O<
zWeHQ3;p{GsW5a+`f*%52ZYZIpOAgVJ`F^tB9?NgDt6~)$&FJ(r#ao20B!5HZh28_`
zW-gW@{W<{r(n9lW1wq%(mBGHee-_TE&(OZ5)OkyO&qB!vC-u@oUWM>4n>X<vHct)u
z@QBU3lB-cAZ^MX@ZglJWq*uOCZcv^=2l>?P(VBndyzF_@Ys@jZL3u;I${yC#^Wvto
zYblVr$oIxKAv7h!#d|3$r&H3aSotf{qCy^bZz|O!J}&Hu=WMJj;;SmvtSYy!stBp7
zq_cTf&WX|4JWAp}Y+ly9*-aAz5--LkyQ;NHxH<$G+oU&$!8rIK!@-!rL0v#5<092;
z(eE12ifPdq(`HXv2Vxcpq={zI)C6gIk3`KUW&7#iy+{jQLSuZj%gwbb`J}J))r)*j
z=7wtNsNPgQV}{t1y*<H9O3fkw0e~aMdswENpKLR;03FEVNl#3lKS34<jwRjDRjeCt
zhID$7C#smJ6HxYK5MMRv4*m{GtA2>J4oe|{lj|m$m6uJx!Y!mVKk$Z0y-KfuIIWsA
z<6K81kY)f-iZjH4XyU#Bzc2{ZD<C~4GR*)G!(haiAM!C7qCW_oT(1AjOxn2c)V@GK
zt(x@M4{RNZ^xg)gpy`d2H41((PdJMtnM`N%jOlD1`iRXNt|DESB!%BhbeL>xc4=J1
z-<X<!y7d0b=DiMSqO*D4-=B~7)Q>ldXgNGnXd#s?HRhic7?*CEG-(>|F&xitN{81Z
zodu2On`QiIDEVvV1&6*kGV{oH3qo5cL(e9do3Dh{Csa52IKU+V%rj(VB2{m^85Ez)
zGK?Y5;6abkEtAc%hfyt`TKJm_NCWkt8Jzie4=jlWmz1GCiG)Jk$z+a;PzvCf92%Tc
zO%fc*9o2f(=u)39!t%Z6Ik|<j(@UBee6>hn`P17vj0OwyzuGRK{0yxhql%ejzVfNA
zrz}&3LXpCvub2zl$^PKA>tujz`$hpH-^q@Kc5;U_MwfzY=L5Ynsac_#tpG>>E2b3;
zMuCD97XXEw?KmmRr=ssr7>ptDVfA2`7gwr#Cfrn4Ok_r0o9(}`5a_fz*=g<Ac_FOR
zuCUX-wbOB`^U{8&vq0CClU@I3s2)$9!MSVlx+^G)%GU;e$-Kr89;{zA(5gBbbOy)<
zze8(%`&9aBj8gX*@9w(zZkdK|AL}<arv%361G9=XeBc_;a0k$;=50uQ+I}~yIHvC}
zn^(B<&JofB6zPd}<T*|+#L<+jmBkdLbkwKR^yI%&{oaB>)IK`Nvt-}b<=9(U(>EK^
z*WoSjZl!OExj#~=f25W4X`g$nus@@>ZzxQ_Vy^!q;(hnIzWM$BxS{^(*8W*pfu&ZG
zu0>mPd;4Y$>4!JZudsnGlY#Y<0tY<<iv%7}5h=lPkl|q9ZTtI?R>;M(JYIfvzgGt1
zScgESL(EPBh}FKe6>k3ip@p!1y3!|DG&H6)yecp(A~$%fja!)1C+9QVv^k8S3493A
z{cwUbJe4vmCHLVqE1Zai$De&)EZZ#sXW4Wdc^)=$#^-~M55HV#6UzZ;Z$mPk6`r*P
zvRdsMBtxuyKE_6V)Ohi+XX@kS)OPdF{AxU*htloJt*`H5W9&(N;)u~u>?oUDdr;A*
zsL12uDiV0Xu|TUD<J3B3*|CJ8v81-Kl>RXvpRrWI@l5UUdvasxKIC|(@qC}xbTH4O
ze^h<*b%FMT4iCt!zm^W>MVL<1e4eN^jn71bPk*khBSSI)zE6rKo7={9(UVX6YoFbn
zY$1(*WSG#k)4j7X30v(S+ymtvkOn8(d$m80I1M%`k5&ryer)?Z^?7iFmNhzSpD_IS
zGlmZ4QOI3ar|4i_z3KEgf+f6sDx}vYc6IvK-I--(mTyioGnzd+2Qz?|q&>mV{Z-PT
zAXOSZ<4``WGNeaJp<=?OYr`hym}?X;Gw9;kDVCW|d!{WxcwaL_*MiD-Y3@V+?7-eE
zR%cG!_X)GkQ^YizVeG72@hfi<=?{!W?9!K$mj;VlKRTIeYfXRAFMfaO(wOcc==7!e
z>1J7ljd7)7Ho5JobI4le_p)_VBiTz|9nD7iix`#9eRa}V;JH5SEx6!TTiXcwVp+^4
z7S!m8tc~|<969~PKYVeOZ~msvbnx`zop71ZwZ-X>YpBl)(nBI=X=#hGEQ?Xo-zY_-
z#I<jkIxPg9rHQ2Hano$-K1+quOT~vv#M<}wU$PYlEmwpuR~9deuZ@(wXMI?^d`t(f
zItc%n4|%S`JTU=(UJUs}?a!q$@bEJ|zr@I+#r#HoDTxSMBtUWj-#y<ilWJL?tgQfx
z5gY&j68C-E3&?>1s1r%KI3Ozk@RV48&2MG02LvLLe<m?-kO63Xo#F;y)0^Sz%i6{8
z0iHqNB7gxv23*9gIwDtxF1<Y|w;?W%WFG|dr`54+tWIh&&)3%fStGU8)+?gdp<3%p
z2qXZ%Hfz7RDZ4d50Rf0BF!Oov<qa;SRjKu92}M9HZIF~}0SP0nE~1%iFt9l?2{k}s
zi&&r7LoB{uTO5R6^Mh6n{#e9pjprjW&`bq{?<}<K3<7D62)l@fPv&n<F#kLkfwZ8J
z1Wv)PQPw_LFkZwnPbR@HQ=sq2q$mr>HT?JS<xLE#)+_?q;rx3M&)lHH>?q81&2Mv&
z@Y4ac9fSey*OK_10qV4^>e>&oG*)?q-O1HWJ$yY60Kn=;U#CRQ4elZU0JaUp#NH3q
zQ=1b#P+Hn5_hm4E0zd))*C>pFcmRA5C<tI!+<?Fo0n9{F6aZlJ3dlkE4OaxfFaXJ!
zb-oDXQ#v2`fF!60bfW=O>0eCq1AI+mhHvc25=f?l2MiVf$p^rS89+${Qk6_c41ui!
zj5A4png{;8yupAZlGyz~ivTpc{yDnQ1#ArL;6mUqxS<z;xk!XFz?nfmfez+T#)iHa
z5wHenVi$+!&)k!;NkXu8%$&_ra(`cb@xy{?p+?Z!{P_P7)ytN5uX_5`<R4V;nVT4(
z>|{L;nQ5*j(16}Yt>#5xN@4K}7JvX`^&J6rVqlDz2!J1*b*v?(tertXz1~^2lvoyx
zK!*Y=1AU_yuFpvtQ(z2wZ&?s;is%gEIb$9GPs;MMp}Ocxi(!BS4qI^JH4ZL3JMDs+
z=o?v8z)e_~l-ta!NXAJ&yg$f3if0G3aiG36ANUUKj7unqHiGli_%2R=4*i&8+L<nK
zd3yiO_R_~E*Jg?rKdf(l9mstZ5@-YwA*)dmB6TO8X?lGp1=a&7@v`-H)Mj>Oz`N#j
z=I@nE04vwoSMQaL6&V21Er_z`f5p7DKawh>BQfv&mgZZ&7e`{=RQ*3<-a}D89(FPV
zM$2zg0H!4JUVUBw2Q$=Fo+6)SXcO6LPIKnL>&QMGv3j^M^<(R-;%kn;bIQFcA0DHh
zTL+q|4wRrv(l)kWN-1_|0Pguz)rV4+y?GCYLmlaQQ6{B1@wc?o$?DhG0g~SWqmh)z
zZsl}E51arr?&Kyg1zpg2JcVmyRmX7G_*)F{R`k=iU5fdgP&*$UM5*q82Ac>I;q-Tb
z3%o%M1I7l5DHo)bG+oA2vuvKX$Pe87b<v|N`<A`eQ1p$9-cMtzNX92KF;ONc#ai`*
zk)ABdae#4`C>Ag_RL0WqqjFG_Wy1w<{rxNyFODm1C_8(L0mnn9ina^QW5;ffPIwzP
zPLj7{68P(?D6o;txm8#^1j7afIAN~@&4g=d>Q1#J#d<^~Hw5jvXXcY`UCqD#eD`YM
zWDD2T;!vGM*>txfFi*ec2+U(WI}{M)$X)uJqa9L0`&Y~(^ZZB5i~K9*EgVlsk}PoU
z1ORx;{t@$TX*0$_{m!t6!U4uLRA>mVI|y2=A>pg)H%@W7jwAv&b@}qBg~nmVB)Jw$
z2wt<>NMv$l0Ffe=oT#_(@om#$?H>VyWle@ikiBn<+k@+)7ZwTwNAKRA4js62Z8F+C
zNAJ9r$dC_2)uDft{hT+&=T2_`KmA_LNR7Oxc89VGOfnY-HPX&%?Wd`S<=P^FIBIlH
zMJ`8a85Y{_15`v897jy45<i~h@^gq9aRi0=761z0V-u|3xr@z+J~%<K#UB?~6yO-M
zNk0ck+a|3G%-K!R09A_g3R-}2hp0<|-=Y>rg+;84TS+k9R*&b(Uo-E6Vif$f3*F39
zq?&|eyiOByy&=d7jkLa!`XhCoAxq}n@eo+XH8D#i?++z1m17wf$Na<$R*V(S>9dK2
z=<{55D}pd%I(aHKwIsY<_&@I$sz2Y1^(y~zi=tb|`_cc{(*!U)ugqxO?;GeP&<*>z
zqf1@fDkIr#{^^2;v2g{M6PHqM?B|R}o-EI_PJDw_+kKb!qCDdW)ib?QY!qdcUG3&B
z<MjBLez8@~({gvYYneT^3s$);bX3pP^Q<%Ue4gJMcZH>HMyLuNxEGlK<0JOXxt|3M
zARMiAXc#r`i$tLPn{M9BcYqe%he%dQd@02e3_nL?K>sgh9&wI0e?#9<3d3Nivd|l@
zaSji)CaTL^J>?n<WxxOc_ewaA%sf`lzh>UJNh#o75Z%nn%dV%JdFEH>W}ZbQr2HQ<
zFBLcgU<LqIsd^<4V@_d#jpu>eQ5Ci^1$rpFYIO6;1BPQ>mZ>HcQBcmfBp$$NrTV6X
z=9My!eHchNDZ{OMpbW$LZs;6yHhZOcR)%q<OfhR>*G&L`%Q#N)JvFHS*_+Ntl`?$e
z5)I<P6HGckS)}jTQlL2}&wQ1+Ta$4gqCy2vSuBG2&`dPe3UOW$KOBPy<y?g(r-;Qd
zCN+Hu9->IqyqG}Y)gj|ygOXStI|@iSmw;%v0J^4r+7lZ<4@bFI+4bQV1kjOuzdEY)
zf0VL_pn**E>PFVFYP85;p12Af8?2Pk_X;gxDRcqu)pdDt6M+1xSP)C4hu2kX0Tl4D
z8kC8<E<7kr=$ivDVg`rayj6qTs=~b76m}Yzv}e4zEufCZ5t*xHUol^3hhN<=hlNsi
zEO2+>7|$;ii~u1192StL003oQ4A#9TmaGMceIf=z1lrx5GLEAuYU0Cx>Hz^36g^2|
z!HdGzKnP*j7c0Vw6sFu@Gky$6ItfP%(ryCWc!%^Pu6}eY!~q!d>LRt-@}poc0GKw<
zcwWMjeNF)IYxX*T3wNI0=p@SicoUGv#K!RyRn2~fa=@$tU<kup)(rQA_I1o&lEnc|
z$m6y#^?)`#^@~iter19O9uX()hCY`l@&^Yo!6z{`7kY3rlFq4?0@T;0EdJJ~JMchB
z6M>hyN|$PMhcv?g0B)iq@KAL2)oc_>JuZO(G3c7C7Xt*T1Jz$r)da-G0X!5yu$r-(
zc%bV`XI3~gL}@jUV4GztPw%l(!w;(9`R4$_h-C{)Qdk2wST{K(uX4el-?n~#1(wzj
zg4BWS0z`rzz=V?U1M1E%X)ufH25ON$7NPo|G>RMYd00FXjHW6xeVc5Qo#!EA6u#6l
z8H2tkpk%JW2pXt#RsSTL_2YYxxYL_6VpB0mgqtFB^<HduNMA0)wZ=*e0s3hNYSrOx
zptD`DB!wssYn}wG>+}9ZB*!Nd5|06zaD&C@&;Rs`3s>W2>{&j}ET)0Wuudd`6h7lD
zp%Gw%R=*=-GJEOdIskas?S*jim(_Nh3tiMwluEl@#WCAg`r<i5j1u4p3k75y2fJuQ
z8V~f#5xeMtCvajA9M|3hL6xud4!7`(7F|`gtr`pg;bqRktIn&SJsVrYo1J}Xa0WoG
z9Rjq+2zVyi>_R(jCmIQy_yG?G`2ni17k(tF1AcEs-M*<aNC0-PiE@|?8G)59e^mX@
z2fC4KpmSvAIrk;ZFaxF$!F%7@*1un)Nz&2|vrk69%h(WJLZk;jwWAA~<gVlUzjv(o
znf%EO^}#~I-K_?H!903lK<0<K{kfEngXy<4w1u@A)9%Mw@A5N8X9@6Wibp5Bl!DdM
z!Mr?{PNJFv5I^n8Ld|;i#Htz@T-=URB8WV>z{;2q*?88Ng%0NJc1R=;6dA2kerv?X
z68KV@p1&xoPHc)vX9JVb@y7{jsceAH(XVzaUj6#6r*N-KWvFBK8wBW#M<f)0x*PwT
zJxTin0x*A3+;owSPAKlYh-VCzOQ%ACc7X3ZPmj~pO9DPI56&*D@<|yVSQ-7ln|YO$
z1t0)i0Pxq$i%ayt=X!A@0FKPO2ll)}#&QW`G4ag`8~>Pj-FgXB?HPub-?KE~m6aD^
z)eMy|oK|$wk(r0bY4AlGr-ahYJjJqNc%rc*fMHmLZss{S;@s(GUa$}x-IVH(o9+dQ
zrki;d6z${$49DwTYKOu(qoApx-^Y!z=w@DCLJ}J=H32{IubBs~{%hs|ySXd!pQJ3~
z<@f>FOGjkhos;-CWL+ix%+WKC?>?=iaaVVD9>;qwCk5PpVk=A7wZ})S@WkjoOA;yX
zEP(COS5}EdM`oViW5({6pIvolTAD1sJ-BBDI6oT~OgHn0l_ML#JNkHlMkC=Q=EGSj
zaDq4iAk2(sA3npG9dcymA<Ej;+qqM4Cv+-LCZ$vznR$|Wx3`fu9gUtj_Ii1~eJaaz
zWagne(&%O$vA6QCnWuePNq{JpKsWO+T8`9`V`5qaGL-XVd`C(W-OTg1PP|BcB)bP|
zsgX~on|XG9@&QV$fPc+A_9HV7T(t$eKGyfAk^zCPZwc*PH9q^i#&lAaz44wYj~?!G
zLy}u?Kds^ilCe_Kbjh@u*gtvB?5kV)l*)VR<0x|A`zkW@*nXPv7+5*;{bStwuPbKj
zH%k;p%r*tgw;b8m_RY4>nU{LJ-|{y99cG@QZvL~-d~YOC6c%ZRH$Rv%KSU(j!6HQ~
z&4Gdz4=tk6l`)6sEFgCWPQrj^Fcz@XLE_GUoSg-{&0-M&+P`OkT(u}9#OL5F5Q3I$
z2Crxc;GGQ%PAAK}odIrq99ya-uUrlHm<3mxCF;Z=H+qP7)l%5!Av=qOfS?sqHX{Q|
zq+EBj9Udy~V<mCdN;1_-s>n*3WF^yPCEIT$_t{E*)k@*ON|EKflHhq|x%0=h&#Rbz
zph=Qq<UE+L$E?(22ibj?G)d>R+RmTsKd=4yyw2+RQwQg9EY`Y$)_QW*r?sv1O|1=_
ztPOpvjqX|-|NLN=aNZ==;!XnOjCvIJn6=rewfTXy1&fWPppB(dWDecl6|_0e63J<7
zV|&-eF4g8@k&S(kji%2>`>!K5$08k9Z7v_!I72=;9DH<Qx!`)t=0xzIiPMFvkSz9o
zhRQ)Y8yNRYWf(m+^cXfA)NsK&o7u<bf**@5J~J){2FfN}@Nz%v8+)O0=abJz%Ue!N
zw>fP?NVXS6M$w9+S-8>pdoei)w)Y4Z+}+PcumJI&M{{`WLY?g5+{Nxx4q@<?nN(Za
z*EhCz4aPi8&5})-l6>sa5609&#;#|N5e5fEjYq%Ui{ra%ne}aK(t13@XFLaYkwCgw
zV1T{TWS(=7aA(yl<8I_WM<V9o`27Aj@u#`kv55jF`-(PR->;Sl-!86)*_T5Gx6ADb
zgo%pJ_O(S^HQJ1%BKzR47uAXef{r;<ui8Izn)E1{AR7!sLB>>rEP$z#X?YH@?hb9A
z9h9W(Jnw!0YFpk7y12*Tn1FG7Y3kVNlpfV@$MnCkci&G<_ido(fzVq*?*s^4I?`LH
zQlu+IDG9yz5_%v&XhKjr(h(351QF>{6{HA=f{1hh=_p+!C+hv2bI+dHo!wt{XLg={
z;rl~oa(%Ar{dzIW8f-(5FrRO0GtxDGboNef*Cdn3<PpQfxQg{ChwaquyO1b+29+;U
zwzeN_=jd%GXS{7c71_=`wf)>>J3nUo<%{jYt}S-)m+caj-7<&Wim2VHirt!_-B(+?
zb#J?kD7(#jcHfHZww~H;ciHWX+3kL@+uOC<|7CYTWq-(F|6SDnhl>4?q5ZL~{fW2z
zX_WohJ^S+_`-`XcKfCNN$LxQ7vA^22$NsX%qlV#g!U)7*096>F5sb(VM(hJ4iH4D;
z!^nzZ<n=I$ZW!e_jA{W!y$1tc!9dh-8csN^7@STOPLH$5?cj_)aHeQndLPbG3}>x}
zvvtGS$Kf0caLzqA_zKQN?ZD0Hz$4}WQFY)oa^SOb;P-J5h;|T6cMvLe5UzK)*6koN
z?jXA0Ahzcqe&rxR?I_9VC?)17t?KyyGOG9W#tE^}v-rEM#Ma}^?)m62B$+`E0fclN
z7J@QIlG%N9cDkZ<Bn3c{;>=r#r6maX{7^db2|7>|>;w?w7B474AcskCqTV<{kicXK
zq+5wys!%ouXhe^53|FGt3Cdm2Rm9KLzuWbYix93#Bqu?jh#*rmA%OJ6X~8z!>Yd>&
zgpqb`RTHidQh*D>4eNV=j%IX$ED^@ECJJs6_zG^sxwv6e$*oCU40PjDPtZv%o9Jk=
z2jfI4q%LXQ$$q5h$fV@_`fm@d(0;S%+$0i5SYkxpH;mC&M30NL1b~l=I0i|WO}(Bh
zOAO(Pzlqqi>n4Ly6XjWvRDUE>lpuISO~OmMZbP~r&Fpb2okXpbScDXnOPW}f9%pw#
z9Fs%jJx*pM5hsRBHt*RkS|U{J`I;#UaI7IwoB%x6`5G#pkS>d|D@F$}uE(69{Y(f{
zS`%Hz$pT2%{Se7+VlFYH#0K&SV<+ec43UEbu|X@b112G~HL+d?V7)|QjknQ)8=i^n
zzBk(KZ*jt!Cb>Xh#L`J|lY4IP5L76F%ua$pr8EIPPWVvXEe3&xsrslrbF(`jdAhJs
z&rfXdY%_w(Gp5D|-o3X&?ecD6SC`l)l{%q5WG@$i8+{QbBql!=b59KcxI81XV0Md{
z^_7EubLmc8ODBjP^3j0p?ndME!!5rvAIK&;DV+e{cbx#Z4p8$sN?%J6^LhDk9nqSg
zRSJ-s0O*=*g+V>sEWTmulM#MfZdF7vt=kfLyD)zAPCW_o#3Keo1o87B*(YJC_Qz2N
zu-Au_xlS%EZhWnY(IF@wpDnQ-7qvW(Y!}bM&5e55xQGMv9;chgS%B}5Pu}bv$G$&y
ziho-S8z8~-19Ibg)ki=8;(Jw#o52#19H}R~<$D41HcZwl2DydJ@ph^4<6{ow*zgAn
zctTG})CG=YLw{7cB*HL16ntGYa0zSBChTKifuA48DLRtWMRC(ZdXwa-*b%#>hnCt8
z5@2u)f3SJ(`i+b=6M3S$uYwJ@&<HNHd|sd&SK^y>LhIIJou1?^3xeY4WY0|kQ?)&F
zxu8c2+gdRPX)Yl#AtBZ!!8i8^R4_z$h6rg+0lKh6KY5~cY8T!fkMdTu6PP??=ESHw
z5oQr5<eC6~8Shqw@|Xy6SM^0;Pt)pyQdJX7dVWNcAdtDCvA}gf(!>tNb!?{&0^$1I
zv;mO{4qi?7hwH@E<{&a&k{N+EGp-Q#tCK^y(D#kQvhBlie8X~mQ=*s9c}wV~ZnFHC
z<cOZb!dJ<8a_2?W$;C0}`X4tY`H3M1r};}H5F}v?DN(gu_(Lc_8bc;*8RyWDECB`N
zBhZ;l7uty)r}aLRFO$uOd~rGJfK7B$#>HbaS=&bxtY+`BD!DF~Obr^`VDA)dLLhR0
zj)KNvWfR3pPes)d#7a?uNoWbE8?WH;;3-K!YoHwTJZdRk@L9Z=+s|B#r<&V=O`e<D
z*+$qVfgd$WtTbM5DLzUf@fkHLLOzmjDIVu!@of@3^0^Sy{e|t^aIE@BT=6O)I?u%#
z8t1U@BZnk>1U?n)iMy+Nb?}<NdXu1~JK>S5$Jo2W*!B3PobV9U@EDkjfz`oXE)tg<
zA`<XvrfNccG}=!hPHS@yHXEgq6KYVi7m<hi7AW(x05NcY4hbm)bD7}3no-gdsWbX8
zz;UgJlke(MNK*Q+Tn&feF*mLO?+u3P7|~?S8YgqcMDs34Yq*uO@m15ZEDt_j6@ny7
zeBb%@Ltvs*15GRHaU?iZsh=z5y>%osU1L^l_SEB8_+#CjmjSz5$Jb_`IY{D|JYMJD
zOkU%$>+nz)ihzt&i&SVqqvhesWTx)q%HUm>p>uOLER7*^%$g2unv^LSN4Cg4r-E7S
z<OR=rgiT{IC(@e}<u@LPd0$-Lny$5c?z200YzP^+{9vv`WdM1p^L?1Z>X}@x*yv{I
zr_d*>hCOsMqE6b<FTuR5ENFF~wH$p&@11~xGugaHVrywE%URb_HfFYFp8M`!sa&3Y
z-+13(9MgC|iq2Wcy4C1qbjT#pyo?p|<e=B77o!gITSKi>O^-nt!<c9Z7h;sob=nz!
zzic^EWomc`$k5}^5u74a+sczF+J459CfPSsXyy;E1e;u6*rZFR`!-~rL3bQjo~F$j
z#(Q5+xQ+LLq2f7jmZ`o1U-s=gVSG8(9&LQNw&B=wzC3t}0)M`9K^T95du<zkp?CW^
z|3m+`3IavJb73xO7fYxN<?pTi;|d#*KMZ9jwVvOUd`15}t?ZMNv|H(3E971A#ZjO@
zRlY~NP<7!J<efqS|3!*WvAmQn*b~z`$Y9KyIRI+x4j*K&@lz*e@mz|%0gj?<N`j=r
zXm@yOP8zpaYwO=`J!yP<q4l(FMKbAGRi}f2<fKzzy3$$Dg=p(?ijr95S?iB6sg|rQ
z-C7%ENiABNy5%R3Vyh=LE%Rn68LAFnlQUHINW(Y9D+}6nYn?jT_B&Hy4&*JLo~??u
zG2D%me9eO81-7^3&5^KJQXUerAf|u56(8}!UNe3r9?j};ohXL=`w(A=%}v=on_9_t
zDnBou=dv^XAm@MFJ(4h7tfefOyB^|2-r>}#uLI8OG#iyu1a!&F*hYwgar4z5DG-F8
zB;izg-ggR_4U?TJ)jg*l6w?UZsDxq5m>(xIQ9pmlEtww&8c9}B@*LB7*8Ccg`;J@W
zlS@!)dd;9`va2V#(abKtQ510{v-S!RcjIfyD_SZgCBT;qrAbVe4lTmb!9X@LCR%B)
z?en*Bsj8z%Vb15Sj=;S#M~w?Q1fnTTsa*-Hd<1LyLBanluyN?xiyMn{s-G~T$E<mm
z0pllM3u9E%z7)oxzpj*2C|;;h8Fft~^02h`b`O7}dKJs&X^>V-ysDFL;4g^2TK8d!
zs&Xtv`dPv%wO}uq8A$jdiI`ubCCUDJL!3b-37%&{vK#XRieH(V=<6Z*>~SyS4m9)q
zl(U2}<rAw{v^iaM&Z%xrqA|_^XweHyyi8s>N>G`H_T@&pW&9}JVqS()4Lr46$cxnS
zS$<c&GesneFl%yCf+%GRX-C&~O4PxCcoR*pR8&9ROQ}JM2ZC=D2&lm~*W&1w9W&g{
z_PlZpDwOm$=>zo+5z*{g_`^Ze=Cg0<RVyL9VP>f+LvLu`CpkrqFDLQJ$3^a$F74Mt
zp)%=@g11w1AvW?=fru5dR0Iz{)=`1Ry_1VH7HNEkRFciQR)EcODNdB|6Kmw914y%T
z5u(1D?f{Fs4T-nUy*Q+>5k=+ZMaI&6k<Jja`XTcj&-(ft3V2s=lx9SC-F=N_0N+CT
z=Av$nKu5AxSTl@g9z!T3MnJ7sQz65eKP2PiPnEVqo3Jgv8FQb&FlGm$tDa1v!SR;P
zT)CG~b(tiy(xIaIp(Bl651~l1gHUykrr#v26k^(JQd(y!G}ubOAK%6hHAF9X-S(Z~
zR|T*=JGal12{gliWF}+@Li&^@L1dv9_>R|wr`m0c?CuKsF~2sqN@M(uq=1yiI<YKJ
z^*mtMBoPFpBMg^#&BcU|9nB_qL@COpZoWhlCzFC=V`@Y3<~U?n6qJJ*@1@AeZZY_G
zmI^kO#+qN4szh}<2)@9O%h^E*3<<wBGMj3$nN%d)K8mLoCyliYW(E6UddPmoqv`lp
zs722pBu|%#7`Y}hB6#C?nUX2V_m`O-SuyCch^Bx$x9IH2oF&X@>dcz_6J85zbNYGf
z8?dMkCoeIydweBO%qT}2#3ek_asOtv;Qpj6o~uLG9pD^mW|y`$eZBA(8I{Jhx$`AW
z3Yr}>!)4~;@fw7(w%_|!Xav<g8wh<<o~{HdK3VexiYeNSP@4WbF3-&a{?#KKdJaz}
z)6`HqT+)K{#bz#HFL;wQCB>4UA`UV0nvBV~<8CAMbQ4_5b***qI;r~oVAwGSU7LTp
zcOmdjCt^_f{58Xh0=*9*0j2k5ZlEMjI@GO<YGEp#?(Kwe<UBsR^D_cfkIBT*+7s$K
zdm9|gxK@zz3H1v>fNb4_aoMaRsL@PHCoVHdYm}evFppF^tr2LgoF}pGrzy4|2_&S8
zWBi%)M%0L#!eNbA_^n$%4f!_E%u1c^*A(sw%ga)yxr~;%Er`Wun3UgBy<5$H05k-m
zk4geGZyi{OB$|>5L^|+P3Tm==lx4^!0cID>Zg8c;z9yG4L0(bIKJ~tr5uNsliOKW^
z%R}fVI8z6fa-AcEKXTGT)GC7c&P1OCe_V#X+cMF^+vxm8|ID-TTvcaM4NxTwDT1(^
z_WTx*!|Cw;JP1HBOLm}r_MVg%N<eW{O2{hsrKs8tGLbl(z^NN>Z|=g4n^}!Wt<R6#
zQINZWcaMzeV26$#9l6H0LBblBO59MuO<s4PDUnx3C`W(EdfJ-E(u}`ZbUF|AnE*)7
zgD6YtxF7BWhZ_$x#wndSbeR?>DdM)0>@iS|7YKFHJ)~7wJd(K5Dpqm8G!<l1`M0XH
zl%a%yQdE-0s%k97zXUHYYL*c*H7(QmYW1?sFbncEc_ey1<e^@My;l5Qh8E0=rT&6l
zPGE^+r>1($N2$svG#$2*${?{qm%v9v6$vNOIYZH?_autN3scS5I~_d|_o6ldB`GoA
z7HqN7G|BRh2N5olHXhtyGch5S{;5f&kTm%H(DcNZy%%)lr@_`rLy;mA!84A&;)pkn
zT>YszUspm(HBTAx?LG41BgrpgDV0m9+0do}u2|&@(@0yw<!W(KEl~_~Wa4hur#GU(
z334KHw+>L=+?hUnI5`g>C!}t0mM0QK!bo}R&2KqR!=fk-!-7u|zVutpOUfp$jrTj$
zQnDQ&IwnlXULp%oA5?g###N-2*BdJdP>=vH4kUmj^4Lg=)Xum-to<@)SZy8=4&zOf
z=uQ0+EgYVwzG=$jd5-#^lB>r1Sqq2f1>Io^0DSt5=f%BT<IvHau^leL;dwTX0S$T@
zb`08TAY<b{c%JoNJkLt&H=ZZBL=})b`466_>F^uRi_L6<(HoU3--I*Z@VvF`(BF6-
z!Tw)7k9kt!h?C!gXRp!DiG~PqJ`gT>*8_*=VTw#}c%E*FR2JN&jYG)G=ybANZFWVg
zb481=?;MBc-5e-bE*Co)s5WsZv2rjz;^=^*T6Qg~ad@81TbJ8k1P~VO=Ky?0u3Y7R
z>^$!K5EJF4=-+l8zBWB}NUJ%4)(`f^P)m$5UJVITz35l{gXgL9XOYWtU)O;!I1r|g
z@v8sE^E4if*-+=)rm2coJ7Bp9;+BT-me9;;P2kfx#EZ_R=oM5B;qbfzEzsJ7qp*<=
zwk40hY0exYogdlVG$LfR`;F(>j&bAgJexmw9=qb;Z#?h7@i(5w{s+&K;HJKl$Orn3
z=P4_)^PXtw74z!%jp#cNy5aCV`hV~|*L)nF*YhfSMLX-Obqga)9I8r%NHXLPo@X*6
z+GNX;)2sCd&vOedu_suU_<m2)C|;cFkDZ76nza1Jk$hH7DOTUH12pu1@jQZj9G<r`
zr**W5!}IRkk26WGc+v>D-3&8ro*^M3x=TZ}o*&C{gl6N)HLrv8bvY`VX&DRvq=Vx1
z&(v+!G<|m~%o9pg7ZPaCtdytwwI9xFyYX99tyx*{Cf%x5v#FNM>s3vP^Fj)ghOLQF
zEr%Nsme^`CQ5J+S4{{+iu9{<6m--K~Z{0LwQSE%Bs2j(41d#J`G`i?Fy13(UY!G~|
zX+rI6%E@Qm3Gfwpom>Z?T|=wY<%uxIt6lGlJtR)}m1l7Qu+%9xnRmT9Lh{%2e?A91
zJ4eM{pgPYr`HqThjN()K1oyr;+bL>O3>CgS;QJJYwI$uDhItUc?=K&7EQu%L-LLJ{
zqI|4oGU_-bNam-h<`&CqwGNvTh&F<_rSOaH4pZo&#5?g+B{WFu;uJARlgFBb_bR;f
zwI$PXO%WE>Qbe=1gsSn5=Z$dlIuu)7sfh@;=_tTPe#vK;K>2Nj)*m@fcR|zsubj6D
z;gkO(=lRuE%l?t`mR8kiiBhF_zZw#HmHn3UG_S`c)mE$B1Vr@3(+*YC_X$WIp)_%L
z9(|U{=CJW!Jg@Sx8m8#uIlvBw=e7R9^CY&Pdz2aB@VwD7<%xgnJd-|DyhYq&g#_qt
zJFicB6RU3FOi-H`>qmpb^VH$3>P$<olLH=Ub8bTh3CK#3yz~~PT|MNWb&gJC>z$7h
zh;8XJKyNu7<g!K$!E{TPfV>%L{QXf{B9vN}z*JNy`vlp)-s9PVPgZI>lrF*+Q1^zh
z;-y^*e>@)98s4KkFK^ZRbbcuQco&as{P8&ad&IaPMl6Hh$4?4711S(P-Sr|3ZONrx
z5T%CMth-rr*7a6KCt8mL&V+JWq7X$c+Ihg-)j-DCknip6j8gC0<RYe*Lvyl&<<?eA
zH6G?`WF|-E&AT_RxV4u;5?~(yjF+FZ@ir7c?%pE3zuUa>;+R4x&*63?xrvjdTB-S!
z6}J8oDrT`mrnC0$rQxpGCJG?QWI$8H8vjwgzL2pdwlklt-7ub8BA-qdAfNWhbE+T5
zhAJKbj30Au<9fE%g|{fJd4hVUqO6j*XN$*(rC|&@o&7hhG*r2kMG2R$ertr{Nzn;>
z2w(E1M5}XkW~Xe6EPN`fUh=aq;iIT?PMfIdDVk=e*L|O*EPaBpJJeRO;%hyIi8)ss
z_}Hg$fkdKL$rXc~y}}ckPU{XV4xaO|fEg8g3QE*v0^Tpf!AU+_iDvfUL%=f20<=pr
zz)nlq&4V`Dik_E1oLT+zN<-ukKtXqUW1%7Z2qiag5LsD7xos?Z`ACgj9nTmWFB`Bb
zT=z)}$xXGEEgo+Hf<99V^4@)lT(wdcF{xm*s<_3=9Z8I$Ea&3fTGr+o(DwSErPYgu
zJAtpBvAvSypwc%bByb^+xJY31a99z>@IN=b|54{q+vIS@Xuu`Pg^%><Eo7xyQl%y%
zF7o%)%qX74I3CPCt18%w=EzgiiuLPj6o?7HF7-2za+*#PP%UY4#rGWc@;fy>F0Aj%
zUqL;;YNUSxAh$_TJ)q}qh~tI?+!_*yBGyz++6cZ=<IwZW#wK2nS3?yPN8=R08Y(4d
zEG=^*L!fleWJ#0S&5vc2n@VeUl3(<kMiiIzxaOz@%KE5nrA|=_72U)(sky0(TzXBU
zRNW$dVzBh^@mr6M?kBu#_>Ancib43a&osaRar}V+GUC@YBTS^Sr<=R*2vK{cCP$Xj
zyBT-_<kIw<>n@rx*L7pYDohewt<~>v>Ot~i!LVN49Al-<BdyNnn?F%E`>z|$92vd~
zGU^X9e5rYJJIHvy*_h&m+I3B7oU2Fj8`U#gJu<=`-ISIwVv{jjZN7Emg}I!JiLZ=B
zpv+BknOi@CEbbm#g}yM%ePI>x!WeaY+wz5VNAR5z8S98(tDiwi%)!#rGN$4(cRtJ9
z*$%$jaBR9CY)^M$Gje<vEd$#=nx5-th@Vyo?BA@?RVA!D_rr5x!p5o9;JE}M$<H*o
zgJemv;?$C4L1!qYq!8&+lv_ls8eXhhg{Dwai%X!aOH7DcsH}Toh`Z~FOQ@_*>WNS2
ziF<X3E6&w>72@?S#C1m257pv#D(g}b5{NzV)_mz>AV)&~(&KrEYlo~?Xp7hTmf#54
z5XTcg<Cj57r@<St;hu7#;FqC}vIudxu+J@F9j9*np}rlm(Sb-ciPMPG5Wf*QUp6_H
z3QcL=P=sR$@_}4ziCn}+Xb>0?D%~1oDHqLjhNKIP$(2J=oJHSgjfT8LL*z*W<r70s
zP?mDZ&*i_38|jXaxKtzAD^b*y$n<Tf;?219?K9rW{)}oY9z!LHol-$Wz8|wF&p_EG
zeRh_yh)CZ@WB|i3*jDOFb;VXB#U>t4Wk2mEGEZDxF(@uCHB4aXEZ<Xs=V2T5PMmb>
zd2V%Vp%N;;<UALBo|oHJSlw3WsgN6?kXNFRzo<~~q%9AJ<l$VsYCus*TajFQ@iw&V
zRH5AUJSQ})m`<^zq^+bOOtJYqUs|zPDZGfSz0^4TQN+a~Ks$xkMSkc-S;u*8s={M|
z@S2%(vFjHVscm%>icfRHO8XTbVK1sz+iO0DKg<np*oIc-w%4*nJaJWQ{Lz|^J<E0s
z%f=$^1H&@G=NU=>5s@&(>*pE19qEf_m>;bfO4zfsR}t>85XDiYu9=RmMWybIj_!S>
zSEn7Xuu457ojpM1{|(ja?CI$6`VQ)Ra|1WK9QZe?hwdE8P#&&E4Lqn&=CvN|e>0f-
z2i0Q>bIm|9<@NV$v{nQnrRO^o{BW~^4))PV*4fCuH%N*l1o=Scl(@=!rpsZbCBReV
z$f1b$mR%npkrNTI>;rftgl#=D(5dR!@gJS<W;$j)Re*j-Cc(~0^aa>PW&X{tDf3un
z-L5Zaq7Nfo3;R)BB)`Ne0U|XjOFw!@E1?))6;LHono9#$eWturnccV?M|H60X}-f^
zFFR9zEf%6EkjOFf?y>zi`Yb%qWt8G&EJYR`gO{eFSAS-NIyt)v!)4F64kUXPk^<Jb
zUEKo|!3Q0v9FVB>hNiPf)LV%FoECqDuXP>Bsl6wOVjWVa^6San?s>9}P^=80GKrN=
z>!H0=|8%2!R;gdiuZOnsgx99~Qy}u2IX(%O=6OlXjBne$3?xM!fX5FHsEbcB5q$+9
zWDsVzseF>jW6MgdeC3CCABXD2628CPjG%GUxyPmua&$)Hq?-xR%el^CMgofY-%&jU
zZXtIqA6Juto%&X~|Ap$&d)z8ymw(tC&Vco_czU<tZP{BmAw%G|7Q=EW0xd;x_K@3J
zCnTh3FfomAP?f|z%SKvpVXs1;C9%%%Q2(<B)Sp^{6rpKfd*PomXx2w#1rZY5pM&^3
zDt}JS&L_p$=;g{ru^wC0npwXL*)3qMoRQ<uF2tdFK3_V*HW)Seg8i2JlYNiKJ-xI8
zg>@<)n+88!vCYAz<)wbwg9_Vqa!I|JDPK&Hl+SxV&Osy6|1D%!%F;2Qz4bF9O_%8+
zz?OP^s%>*LPiiuS4bwwF)#>(Pf!+oqV-RQUUhHZ08_;9!1oczO%wsfj=FUL_ARv3@
z0Il@*t%j6`{%*PSZ&Sto`gvIDpwes7u1<ddy>sf;gWrH&>r_%EfHUe3py$s`6iEMl
z1qf116%<c-_POEJ_|cs>9=bvH2RGAccR*v;EdwCz0Yi<v^f^XkZ|?iK{QSx;b3Fgx
zovOD-6^NmmHEV)xM45i_smZ_)1qeD3E6TjMS~@%&H1UoluqVrtjqB${EulF5`>a|p
z{k5+OOt;!H$U*Wo_$*C5H+vJ}#Ksy8nvi(QXnF@-`dJu>^80rV!JY$@)|cD@<Jp%(
z=v)$8r4911v@XWaUJ=*gO{mSz7;XF>)8@<v7;I%hf|R6gG~S;btg%g9!13o9SEUY2
zu65G6i_uR5)~T@GMA7%Gb42pdj7qj_yoIqG(abBQ1?R#Ea(7rrR?}oSU2S4iu9%%L
zRTbp%W*Vw2&d0az<$bN#Ym7H^te;GzGrDkR*?1V7BP>Sk(~4LvmE2?gT7GXml<oGd
z$ETZBD2`icMUU$Baw2@5^SyigVu5w67)-<JmHs5|k^S2i+(7v4v|ZtD%a>@jz1FWT
zOuKEn-E8}9?{LwW?qA&z`>%+=^SkY2B|ppiXQ<itU`2;1s2eo|<s9{*Zw#}p9kf0C
zF&>zDji|Jr`XbSvw>r)%;2bqw_THQ+<apRtT<+u}U-*~9!EOy#S`NQ=98)xvtwkYU
z9<O`}4fGWM#f)XT{XMcJT0Rq09eoz&Q4&>5KA5CXisg)~4(BY29De+rW|q@jaD!Pe
zU9xCJZwi|eb-Ju(f2H-I0UPzBYYc4q({u6XYk$-aBE6U+wo>dwZqG3l$dUMnkpNHw
z{RyuNV^6wsR!&PT&8!ZWBh#e6T%tFyS`j+!iK9XEs#o<uNPvZCHXFeQ$^OuwHNa;{
zPB_#_9uVwQKsXp6PtAD&N_qvE1iiByfCMa|)!FIjy1ou@YDgw)@UFZrZUwsv`X}EV
zou#WFeGM>`46^AgXBtE3Ncz+<+;Z2UDhwcp%+m-eNa~OkHf3z9IJ4@Q^eJs3=n;g=
zM9vdvY|pwnTH?A!M1oUtX?K+-2j{9ozd<ZLkdUHLcaJ!mo|XSinVu2r(1UfnM}jCF
zee)K7`NuZSvo;FqR^&HwR2`isI1dxe<~DO$D+v@`6yDyPyRX$o`E@h=d}NI;FmI5s
zaP1b?a3!H8qkb!d`*`RLu0RHAPFj-@nIyG1Lov@_62JkyKm*(m0W*6;%}D-Ub}L=+
z_e&QD7q{p`r#@1*XD%kw&r;B)am)bQWZ_O{J+y;K96M>1d$?A%1v?6vo3^QCU~bCp
zFkSX$wkB3Nd@}96ai#sTpu0Y~8M-^x;Zn%Nz*v7Ib9`DG{Pf!<EL=68HmQpBE0mia
zE1U&m?xi%XK^vV6(c0y~S>xr26dSoHtn+%oIY}B2dHm!^E*Ylqye%18$=flJA1L8P
z!UCfpN`oPOfnR4_0x2nUthh$_!Gsnc<F|}xw{pg4DS+IsWn<hEdSsmNil*sYf4~s@
zftof|OrDkG>-5P+%%eCbW6e)L&c8S5jCwgGtXliVo;2Nv6mds6-Wf?eNfKK6A|z0l
z{<i$2toDP5tKsUM`Sliblgx-d*7@^0shon~4`gZ<@>CXDv;u~<bliwcGS;dOV9rqw
zvf<vehVXuHGqg<22>x+DafbF1uS_iff97GGX5qAX{mmm9f*7PG%L=I$>=z9w*1Z{@
zEpi1-oAWi}ZoIlt5IKBfPCa`fk&&Ea?Wu+GF#heNpj;s5jd%h1<+@vEeIwJ)UdxZp
zO(B{4A^eT;#wZ7xCudO#QC03X58<TG^IikU8t<7aQM1s6^2#JWW#5RPQ`+hU$L#PM
zw8O~kv<$l9oro<&)hTi!gZXxC^};OUoKH03*a`U?A_DJIKw!Nd+Udg-;S!WFZsjCV
z!33(ha1+(wUaA=`w8#-?*j0NwV*cW3%8eOvvH}1jbdOXdfK@?*WNhM=dULr#-)6%B
zVjxq@xV+85y%u(-zo0m%nvH6U1YA+=2)S3y@oO_Jx#0a>_>0Hz!mS_^Z2QzBi$;98
z8khWO&BCzx<e*<P@3Qd*DF+ZFj3Aq@*Vwp6{Jws-F8lR0iVMy$BSDZKxIzL!yq}T!
z1Q4>ABJR@fx2ncyGiPPrju*`fbZ~p|MEqP;*PHfQ0F?4}DRkd-E+X!HL5}2N*H?^y
zebJT$(MzSO6K_7jd!a-8imhIfGkVvonQwUY<kwsZ>SzHZo;)CA=TE6huv$3qB1L!a
zkj9{XW;vRSw<U_+@!=<C*I-SiXA`6`2O4Bnq{OsM;S@PL6?1K+139P#V5Mu=w}((+
zfgH}P$hwKQQZagb1aKms={}~nv;7=CE_D$>Wt>tK`D5JzHAMxHj#$r|v1q05^0m6X
zL4F&L2si9#I|A|co2y>Ve;dzyMPj$_zY(!47jV`oVCP69L$4=%^T1!^<68Ww(i#YO
zo~F0Jo4qf$Zafz2;qirU4YX!fct0ZtYAJM%=~8<ePVWs-pREbi<CA^K7QOaR=yqV)
zXBD+EHYkqIn>f>%*32$pus<BKRJ~ESFFhsDjh?da)~UrtZn}#69A1ppX^)BOs$f0X
z#Gr;0GzKZ6)h^!y_0C`6)Lwn{UptFQKNnS39P{i>@8Iyfp1PowbZQVjoeBQ$O=}7K
zObvRB{xAVZ7>DQmMfJpSb{<!m-~=Cg-BnMb!;v=@YxW1vTks{6sUrLgB)W|uy6fjQ
z{)SMd{Dzqy(a(k}y92^tKjIspO6sAs9kBu8r$kX85=TE0_le~Jov*C#uBC(al8BB8
z$SC+h0_+%yjtL5&gb?l`|Mf`VZ#l1*|Lr(`9iLF~Tgn9x^{NRqPR=77-gI){`0mFM
zvch>JG1ja@SOj`bDX8!8l!xn$E1`c@eGSN;gvQ_o&4(n=jWHfhNm{<iyMl+HR|K@;
zG?!;$9J~}s-2`Ms2g$65JR*~HYKM^;hder&!upeobtc=YLnVqE9L;2nVmCP1;iQQ@
zj2;^7c1!#YvBV)LTKQ!le1)@n45&Xui!Gi6_N21U<56sSShM0&OmK0Y3<3MN=vw(f
z;+bf%^}97t>W6UcAa{ljL+o-w95aW5bEeG;G#no$&j}ldMke1Z(SSc?a_;Wayj^Dh
zipR*GzJxFVoi}n}{W-tUd?0S(0^VPwzrWxnIX_DIq-Ue19LA|kLU$iZ<?O)hA4lbn
z0_RBb@2QVk^ile70~@L-5X+qR$H1FQ^k>T)SvMK`{5@a$Gko5-cCbe!GDVm0eeZRd
zARr)1p7J1TN^p2mC|OE)ShD=W5X?X$R1zSR-;`bd{V)Xx`QQb%(CzLPph-hg%Wtq<
z;)9iA`LoKX(vi%+V(IIkbc}jnEN?H_TO`|MEX`ag?HvuV5iStk12zJ6iYqBOt0ult
zX!m*<MK@W(v(f~ca)H52K&M$V=Y46>dUTVNpym(h(4^}I=5BE#mwDflv;rA!2NJ$%
z8sY)Xce{eOo_%TlBj;JH@WTJfd9lp@$a(k@|CaNtc;wL!nE%RoRnH~w{v+q9SEjN*
z+p3YrKau(&AV(+j`MnD6MR(O)b>l~wlX=^^df~}LLf>-wlA$Y3&hz;r=js2E^IHDO
zdA))b4$Q6Z!Nkqb26KhBGBN*tNoyRO7dwK3^U|p(Ec)26I5|%>fNz=(^yz`>-Dz!m
zdL74GI^Z$Y?OK}G&oDcJlrW&{1-XF6l6ZD3^KUt?Y~13HoHsNE=E>qiPJ`odavt87
z9&SxvM@?I^?vJsFzvaAGzOz{BArtLtVnJ7W!}qrgXR-{xHR>?vA7?@N6mW80&qfeV
z&g;41{a4OIGUMdD%PnyLPR@%}DhlGeI5KW{uHO(O+jOM#PKq4a2TT*=w7|)Ev3zfD
zd5kw3YTmweBm0)Y3snWY<E`s*-`sx7d8*Hxf6IC50)OSaBpNWtorw4^oQHh%51iL)
zfrIndUuXntnqk#8(>ebm=MhuB+r-oU)oUI~e9Mr*rvJ9hn-AKH(*?ifJQ(k{&GjrU
zbN{N-AO~Yh9=j-W{%LrouDV9VA35(zhF`=_<0JQ&8BWgY6|l^*VakECeT09Wv`KYN
zw1H6Cy{K`kHvr@0JTA|Wzj7W@k^v{@^*Bj03dAitSst5PAHnSzT^uc3$V44}R%UW0
z-zdb%d3erGlfkMrctn5XJVq^!VmiXG)w`}a?u8%S;Vmvd3CpY?U>k<ct(4z#UcH4-
z8a`WSzwCX+@SGF(k&j;QWN%gE7!!N)B`r%8YHWF!mpO6U+KS`!G79WUskKi9^PHL2
zE40_7g&zsdMmG08cIwIbE9aF7t*CpF8MF~gX#L`L4P4O*#L0O}a@d?ef|q`pmO(e<
zXn~f-2Rp1r>hEYRgr@EXXB#9~)pXdnXys}%`p{Su_0g?=2oxs?(qlrPED_hngU;ib
z@_O0!OoYy)$#*Qq2yk*9(mC*7a$f5<dQhFvL78JjsF!UBVq_-ro#kLksPPKE(ZX#Z
zoSau>*><+9<7p(gGy;?g=Irqn&Bw`kT+D+^e#1;r6thSm!f`s(xFuU?r!;W?JuUS!
z*907#2WR;iDs;i+MTCf?nMJ9!A{pd0vGTFbI5}^fUWlC=*}uy%HKmmCZ#fSdmQik}
z(27!@MaLk5w3#(^&-knwgm7|R5KhiR#%9Nv=i=l%?&L7$$Y`dd2If=_i=?vu$azwK
z<h-d7@a(_jynu8Tqa;43*Y{%Iv9;DFyF1uEW|rG=BM-^Th{{Di&%;pU!(W~Wb^lAw
zYZe9Hax?m0avoG*GMi7r`hmh<IS(HNP%u0xb7-T=mU)kH{wwF<dEu$&<U`$Xavl!O
zll=qd*|B(-W^3Z$yxHMeDg2u_I1gJ&<g9={jFa<J&AL<-3abCec_AkOjyO55G~1g8
zJpNsf^Al-+{6hwdJo~?L9-h}<IWPXNoCkGOTrMVo6@eKui{g4NVefEq-kr@SI62QK
zKj~L5<U!rsWm%aDPR?5zM)ZbxJ6OCA<L`vWC1`w3Lq1fv<63uCqWz+1QK5Lhtr)dl
zjL(%P{TeX;sl@mKlN_c=++O-e&coYKKNeXF=PxLL6x874ym~bI34-4aj*75kEBCK;
ziVa_Y*Ot!#tF|~X7X-dIId3_YYR3R4=jmMVZOW3*=T;hoW4u{y%vp;QTqv#Pirw2;
zuo6{lcI{PP!fgQULP2x2|HyegMpX<HQw25L?X|q^UpW8Dd0Z7U7sbEjJnk~g9rHli
z=Q5vraB`m0|3S{{5y;8spOShkTKM!l9KIa>=v!O;VSWxy&O4fG`N>)>y+)DxlOh-=
z=cyxca^8+R-)}i@xh(&4+ppdV>y>}xyjrG0oSe7D$bY6z2`_B1eqD)TGxWb(|84Hk
zAqyTCo}*Y#(V=x$|A&U$zSh&v_`w8FqQ7$9Qh4zeqp(~L$z^z_dg)vUe~A|dDGttq
zC;K{ZS_rzm`w5@=+3lFsg>tFK2LJ4G$H{rik9Iry4P;)u#L0Qk$o*IhPR^_OE$3;#
z<{Mlt(<+u+>O(Q(t(?3M`v#TxJD1Z#O#3+!`_1RI)gm1=Iv>fcKiUW*SuenID;U-b
z9(?(lF;5W>C+BTW6xMt2_1KJB_W@}?Yy2bUsrUJo_4)UWMk^0zcRqctY*=LDSlU^C
zZK?PlIS+5}xYO|E<#<EFtMj`8Jct`iwy+%b$<+t%q+h>VybIvRE7=btri^O1W^2e`
z>uFaO$`<u1wA?7!X6ihCO8bk7IESN@?OS}DoCj@y<4?n*4E3TsuIHun<0r^8Q@?8Y
zkoxsQSl4x|a}>Lqt>d0G;QL$=PR<Ll{WLi}^9U#BEzg$mjEb~;{>A&L;mfuBFQ24|
z=l;rhexK%sRdk+5xn3;C_NxfZ$(-(}7{2CM_$K)XC+88UE=4E}a6^|!qS>dq*cdq-
z7rGWlf?JPm``fB15^Yx`;}^jTbmr~d+e%fMovUB0yWdASvfHh0m@kATa<DJ2<oA76
zZT~9HyJ~Dl^EnL9hjRlb=ecyf_rF^IN6zDNV_jNz@76YtcD;{>akLY-^@+50{F}7X
zdgj8`jP<wRD%mPdp@74OZJet=F1Owk4?pMJc`Afy$x-hN*?LmEv&fk=X6M>@xr2TD
znv}C$?!dygXkmAGVPC~+&;K>u&8|HZk0_aqx>WA|;MG2xeIDSIb2t7&iWq_4avt8z
z{jw%|&4kwOeGc#un(6!9*EE~O-<`{EugWoxw#(F>hJVoO#>si#Rfg5nj(pXUAXi84
zKMmbmY7Pd(toHhM{gLyG&d0sMr@1kHH(ojCz)x3&Io<X?)30%QWbpa)`roxZ&tLpG
z^6}g{k+M(j!qovxc$r=fQ^(19Z_`<<dXHw>f4(ZYa+SS=tTQY%UHZo{i`lE;_m%X-
z5>l`#Crxm1SjS(=v@`K#7RS?HyVIE@S%E|KL<5#2#Qx7wy=3X?@!zQ4!}G?9i88HJ
zmx0r<&DXNsS&C8QGF!c#Yn480p>JzHKD9wdUy{lG8`YCRg+x)v`RJH&*VWxmm20p|
zJrzFTy9jMq>azdDs+uPM7u6$v3xDSHc*kxy;nbmNeN6v{?KS4t%!3mwDk#P=h2ZJF
zj6bMe%g(37FSXtGXzXd*Uc9C3RGKJ~njcVz2sD?F(D=%jAs|lO1@WAlescF!y2?+7
z&yyV#19YN3TzXqalI4<^!UE{RXQi$j!O0E3-aH!e^?goB>HUS{yRON6`=mh>(#aSc
zwo5>c)iOfjQzJ4&lC3n-qc6{^myiU#0wrp%Z30ulHErn6L32e(4k^O*Lo4$0nY!$%
zS6UE9%gQ<v9knY$b&%XnFKMOD|Am+b`Hz@)E9?>Ub|2IK6!U&KWtqn%J4b7=;>0|f
z-(sG6m5W1a^c9&~X<Xv*N^xP-j}bY`%|XX-HCFO(>fA121`@Vws~O<tvsHF=pMh^T
zBxn;?(a;jwpnJ3nXZ@6n1mAiotB1l^H!AZN`i8Zx1SO3t9~>*VJ?o=3sC$-hp_nJ2
ziOIASx#qTF%<{dNCjR=69hNPHkHET5Pa>IAt3b|;KFFhLZ9;=W;n9V8z1p@`?3~a&
z(q{hZ)hS_<md^ow$sz>VVNYQ_j0S$a#9+$LjriMN^}unlbR&KE==Xyvr$OqAFMHX)
z87rG^wq`soEiT+^|7y3>0DYa;m?5YGdVl!lDt^@GA^qJn|5w-(VM#jxgfeJC14xzA
zr!o>eKB+(QA&FMs%}a~kB{GMP(RAQ#J?*0l|2@&Ig4!2qZOrN?BR^Z=T9A8{JLnHq
z9W*VPMlnyGtKo_N`uI+3e=Kw{y3pzRg35M9h0cNepx*5`wim#$g{^${u_BhBj5T7J
z?pC{S>{!@FF%uhNJt7&~KW6US3?<O6q$4yY{Vw>ZYEvWIFk-i5F+F0heZRP4$HMz6
z?4S=A<FMI1GC0I(GW;N1W0>iv-8{K6Qdy_dJ_Cp9J+M`|)k6o2K3h?8i9EGw3%tRy
zRkI3I4MmzKGDuyJ>abl*ucY!@O!I(*?zquN#z-{Wh^;A6ov2nl`A|;f&6ULeuv9f>
z$vEb6m4flQQ#Yjt2(rjlLZU{h(Uj$jG8O8lu=9(DkV+6<Z_QNvvlPZdxCe=4+$_&<
z#Xwo!GABZb1wqVjF^T+IW#ognr7+4$M)8_Kj)_1Lwv_{(-ckTrLy~q}4HEE%w2bK$
z>FW}96hL?g%kw?!v>#+;K)3fk4(f&=VYomM9)NC;PMfrYW#55A{VLSlHZwM;w7~lG
zNerc5f%JZmbb>O7&Jl(}T3-qUU4mZgOB%lE@tyDK5*~>EoKa^U&IP5{1?f(z%Ij-z
z3HqVcrYDJM&vcLx%Fe>hy!vsV04|jpE~-d>^lkpBY^G!q#x4A}PAT>GeP=7BOUTCL
z{7OM@=gEa0E&-z^?sIvY094aK1PH<h*?XWjml~yGW+6Wcmyh1aJQu>)l55f4*(8zE
zoyhQ~mWDK2S;}BPN#FLvBcBkdQGbO1P}dNYnq`tu*&zuKSySLyH+9nMhXn3B>UlJ_
zgA`cK3rJWzjEJgkQ(IcN2d#6x5MujCIRF}$df`}6r);A$FTs<zMQ^sd1SO{?pDvB_
zjaT}Rq)hILiFSLyGpU(mMinp}uk}K3t%sm0CFM5P?faz~yS0|*{DzWF45ih`0jqag
zMJ{K}srKGa?oym&x|F^sFfV*!>kmnc?GA2;q`IXs7;b424xz+Q)WJ#Kn^RwZ-jL?)
z6~cL#8NwcNf4-p3`MCTey>egU!(9<C#bNw5JK5Bqn{g{Tsdwt>S0Jg!b)NQ~%<jV1
zUs$Jcc>7+<{t&Q4oE!htH-;_8kvFKNwQJ=lCDrCp&4+4}O;NuRiZA)>0CF&ycYq!O
zn?Ye0+QH$D_R0U5WRZkJ^+X%O-lZ-a)rNNMcsE2WQY@am4edU9+VF2w@9<~RjZSW&
z4@4rNGFF3tYx0m?kS5;~3LL73=%cTHmLQ(COzDZ}XWx5<R-;@2r6LCYh3bJ#W0`q7
zU{o4XI8;wp>DDrgYx5seuX8nH6E>tJ)|8o1hswYU8@}lyg-J+T6J)a<HmYyRj-YfF
z^2~p0xhM7Dd7ZOR;HMEMYAKRF_I1hJurVkeJ_*zWa2>2b3}(SEoY`@aANe#Cw2mz5
z5FwVN*Jzd*FO|%+-qd>Y6*8`it^iYg)5YFkWz_n`LBf0Q+fB=GncVT_YH*i(b>!On
zN~0S!sePMft_4$>pA1k@b8fel3O<yKjyy33d0M}}GwHZ1&=Av=ExK~&BWB?krenCH
zTXJW*$Vj&4Zc*+nrHGFsoGH%&4ZR#Y6dU?2UbJ|Rd3(iNeD3)uWK`mi_(a2l^SSWp
z3m;J*vj=wr*)jdi?=zj;-v3-kua`BgSJ@2<C0ZC}l(!=l^W`%jUS73m?MS_IJD84$
z)>hFQ^XJu~F90Y<-%q!vHzqQ(Fgz|-_RTQBbtB^QGqKkG-Y)^ZuOgS1eGo$eKm7IB
zI#=I{JTXgxTiBZtxG3MS7?<q&(V6xTJIkLtI%U9V*~=dFK^h(Q(%Wu(?4}Bbo*H5-
z)9$z&&|I(GNEm&oPH8RZ1Mb8Sy=(6W$BeErHY4X{oYZ9+BV4zqyA@oEjkc<ci4Ptz
zc22)a4}J*Y+=<>8o$T;AMrhjYyRdt~6IK%aFeq?uE1KcgVY;Ucif&;Uje8PK_w3Z9
zw@P(l7F;ZTYHarntQS^ArFJ&=g!L4iq40q%V|I{9Y3Gjp<xbaLL_Hn&<ZYdZDJwiN
z>kH3)K;uAd=X)Z#$aO}a(oZV1nGEZp8;2uIZF|1p<7p7*`%Yl=cQi1v;FbOPp)plo
z2Kc<&)%FrkR8&DimwvQ|TsIg?K8n1>J0*%ETi|}kOEeo89g`Ovo%u0(-O{(%B6cq{
zID;|P7eDsv24eYR>=4=$vWZ-;;Lqt{XUC_ZT?Q>6iRcI*O<d&hP-<`!h{`{1!as)V
zER=53jm0gt<<w21CU({(4saT*mlXNoMa<x#hfynvG8p(0Nu&ew*KVX%_`tB{7iG##
zaZNq}C>W<&6HVt9uc;gR?M9;Hn|OUvPv6;i;~`Yo?HEUSz2A5qQl|Ddo|hCWm=uS@
z^9~Xan@Xl`iM5SE?yW4yjim3EajAkaW~2}*3mx9L<fIz&*Ar;{NhF{bSe6IsT_Ubd
zN_m`@V(CV_jl|My<E7TO(wu@)9fpzvnR!QU+X^so+#5;^CWQy-vYQH~MKJM7grt6E
zAUcGBFcU=8Bn-uG66pPbI!h!oo4_2ud(qE?*OrK_pt$7>Qr!LZA&hc{nK&Plc0D(_
ztu<AmJoObb$3RW8!$kUaQU-5x8i^#YX{;N|WCj3-=i#M>|Hbq0r2pc1349b=c^UPL
zLLP&uyJe|N3K=J)yhHMtU>1pg@VuV1-*{e6TInA=Z}bnIr%Z=InLfCJh6KzI5ztW1
z;qW{dh=%OGrUHmDEKMsp>$CGc+X<rR9*Wl>;?W*5mkCKL7};Z5EN~4(G~h>G68a#*
z|A7mJtQQI17~;CcLaEb3mIKMs`<CNNmh0~h`p3`f0lhpB$N72NO=<u5c_1nK$4qdX
zpNC=SEJfYs`{U;wgm??(X1nL-hNV`&kwJv{{Ppv$n*QVGAq(;x^1^6x!d_B8ci<}5
zC7I&^WhLhWCV{yd^eu?Ou5X1(kMh@$xs<Wt`V+u%4Cy&8`~(92EE8BOg*-`Sda4I9
zHDQP@&AsMMRxSZ*`BVr85nUYxD(T(Ld%(KS<xd=2tkoEHw-MObdY_dB*f`{0pq_Fi
zk@DU;)siL^@2oJN?ja%!3-kdI>6YehPY~($kpFZevqBR2losf~vSrEc5x|L^QQ$TZ
zksFNo6c+yJ2FU}V%vWS&rZ7Si8k}QR*t#rJkV&ELN`o)Od=82Rlo7Vaf#eEk_Ms{S
za6*VM!_$C!I6Uw3CJFZ+JkRwHo<}#C8|^3avN3~bIgJ5_)4_;m+$bw?Tk`=x?^Tkh
zKX{(0buJFiyLDc|76c?2^1m!Ce1OCAV3I9)K;|QGOfQfzkQ};I=&1Pz&x1<;#q(-%
zDTvEOf8%+6T)*)=lM0OR;}ld)@-U03Nd@W<cV-6+6lPk0<`Fg)lV#R2^<sI6@Qd#D
zQeNG<w~Uv{Q9+2*EvUfZc`$!>jYo%ipsB|U`B0V7iInZ0Gz=cu&r;mO$sarq#Jtv1
z<*grfj!9vMr&P~Y#D<p>;P5<*|JHx-yoWeE4^NIMu)-FaU3YK~aF`a3*HBl^>*vUD
zJR$oR&r5*tT&56RZ2=$ifKvcuR!bzirBumK+;upatzU^Y4duNhVwXW+9hB6H4p`3B
zcs>Edm!d+=kzzoUmt0(L@02k4Q^7%~zkZ(KUqA1F`v>%?3pDC~`gtk_QN1u?y}OoM
z1P!n8xOBO~&tY{6LKHW@Va5OYc_nXX8Wlkw1QnnH|M+=V`9dYF3_N=G`GsVK+V1a9
z+!r4flG1x%b-_5G2pXO6DIQKcJP5aQ08M*5O<>E7^C;8BBfDTF)`!;VV1SO&n95`#
zUA*Wpo|lVT!0d>&OBk^}7e#ex8xFwH2T|5-0Ch`6*I<OquI+Ujk~*b?`YS-O$1j4A
z0&tLwZfT3YWVVXCMe-7fMI0Zk0rdb#>cF((l_wbngZt@u9)9qcrLi7I=w&>?F^<0p
zJ=4F0-UJ_`aM^D{57fPy8lLip(9?_~TEP)|6J4f$GQR~qj8q*P*h&y5=wWe$-c#n~
z7Y+`D*=9{S7^&<nkSSgk;qnvT#w^40EK`N-+hN(2kAHJ|h|dh+*KmYhL$3)pgGcpR
zsZ5W4YvM?sZgOh~9g$sm`Ntt)jFRkMLJznl_VjK)ptpZ}qFtv{)ZP6Lq30L%m(at7
ztn`&Z#U2$_cv1RDfy*AWsb7e3*`WMo`CmeB>Mx<krH~>7vKNsZ-|oJGQZzsQP3S3V
zkXm7$m(UR3a<9#C9Av~1dZogPtV3VIdT@l^B973*^dl(R2{PXh#1dJjCKMXHVKwbJ
zhZCkGgYT8*DkzIzVR%<qdTrHnLz1z%@u0UKKjmU+fk>geYT-Hy{JuKcSJkCd`zB@j
z5?qH%B>I@pYx8}B%9-Mn&pR;`<rtto9@##uJX5KiPI#cJkFvmEOmmd%_4RfWZVJnq
zMy<N%FUZERW)%}`U`!81eL%U@#Gp}ZAAzaG55JxoJ(&S$X-fa=L7{hkBA~K%n)7R*
zco7OiFF6aRTH4Sd2Zii9gW(FBep)?}wa0|%^R<LD!#jOdJK^M}Tp(M_FiYbwObOHm
zN`DBA3P2M<0^Zutlr~M|m#`E_YZg=`7j%{uaE>y(9DVtLMM~)=2&n)X@EX;QN_Bib
z<xoLLy+!it8QRLP?C_v3ZywwKQKan2{jnc@-6x;NjA$si=|%}MNt;F<z^LxQO@smE
zmC|&S+dIJB%W?fipzbs385p69^Rx4%l$i~Z<(KaQZD&G%bz&(i9>EFi$DR@G0?Sju
zLhZuW+9vWRCK8q3)@>W({_$!>KEsRvC2}SaQ(&DQ3XWfs+=e|(;kA@gME4x;{Per6
z@M-Gq;nYBK-<$l0BcC3+96X$S{Qhq5`>4A$0rQ}1?v%Sa(>nL&&8_ay72GpDDE)`f
zLrTh7%i&cFhSv=Vne#VEbihR!nC7~c&pK&^7CeOh5PE*$hZ9}vY?M2lZT`C*6C-3U
z+SIOdMB(3v4^ptitUTRTrI1vds|O`>xO|s2LE|Xe(Pu3y5ngt^vu*nekkXr&TIDyP
zM`<LRv$UYoleHa?ptCg8!BYk{lvUE3yTY5|XdHfbR~9fudQ(CCFQK<61!{cCAg)qM
z6kbZ!UOGBk`fhA^wCLsF9oc$XYJFNF`I{u`Da8FYPlvs~uDn#SPFFE4`)cjO@GT!q
zI0=M_fzDy;FO<62C%<}*uXnAk1i>Vo#6o>@fel;0bC~2ahX;OlKmm%(`F`Y#nzg@{
zz<@*QLw8AwfUl|Jk=}co^8kj7aiy1;iym`P+T7pr>%VH?SY)?3$&{2ZIX#J}lp|Z3
z1q3!laeVWM&(lL>%biB*ss-uogAmh3V8i%UTm5#&_;%Oc_ABb0Ua_72|Dt;TMfLuR
z>S;-+6EXe&2-TDPe}?KAQv6rZLqmO%Uf3n82P8KICPRag8*-A7ACoQileOS!+68H-
zng1^oy@kq%ma4)ZRRM|B{yEjJm#UGg|5fz<?<#t8|5fzH+FxwXJaZf=HtcBG{oES3
zy)f4Ca(}T0MFBSIY&~2ZdT`BtytD1c#zcidiBVVk@%HR<&&Bbsj??|6{!}d3xV!WG
z$L9Md_V2p8ex7!GI4>}M)&1+|(en1<yH~uAL3qT1|AW2z{%fk;6TQFELkpoJHB=EP
z5s@aniPA+8DH<$*6b-#g0s%rVA|Mt(Pyq=|5m3=k1S~W~njoPgAWcNTk|*GO@45Fr
zd(P~cXXc#q1NjS*mDjqGwbu9gymu5mE$H6#9Yt?P(c4k<b`-rGMem<0dj97uJpiz{
z<l*{}%ghsTHG6#up2II3ZdH3>iXuMM{(MCF=p41yB}=>Qm|~Z?RqlkDA1W-YO#gyu
zb`#-ic8b~O2jsIRGHrvl5Wf?FetV%MF638Mn18D1$^A{y^ZoBr^whthLkB)U>}woK
z$^z5W7rg7AU1||qYkkEw=@SDEZJD3N`d&}y#AF=kh|&UUeq3KgtR0yyp*-q+aT|4*
zA1uVpi+(z39jB7oF7{KV>!aVx_s07kN64?hesS|G-t4$;XPor4)<h4&nE|@YcPx*S
zz8Z<E7k=v9=bB)Gi_WgRc{2NGjNjoUxl@~GdEQRC-y@yexBKbrvL1Cl*CY>y+BiDO
z{3uuQ$Ia#xNL%(QZVyw5hW=4@Mmr3gHNvk4iLDv+4Mc(Z_Z0^c-OjAuQQhq9<nfDW
zK1DeG^K0h=_;b5jFWuQx;~D`{OMZFjCYY(24x(W4pEAfj2g`^PYj_gh1P19|bR2H*
zDdos9o5SbHV#YK1-*0w=N#t6=|4Qi1NuqzaqTxm8b-cU6R0O=609z*5e~ExQ?_TpG
z@{6$x^kZI6q4{Mvq_zn?7B%!zMda+a$W!_7Xno8f#%wtrYL7wDuu%|B=t2S4y0O;L
zG1r4)W=AWT<yIJ#>nJlB!Pf^chXBKz3YbM63`b*`&4Y77F=FFfIb9H+ai~rZ*GiY-
z(NPvHUFhw1B+qq$|J#ZlEt0RB{U;yC&p#Et`3L_@(L-NEI%7?1y+F5#3?6Sx#_(Ns
z^3QJeSbgU6e-e63pkzosDhKZhdw&3Koy<i{*(_rEQIrh*UkN?ki%pa4{Qz7N4-FlM
zBEam5z`hkEyM-<|<D2sacUmJ%)$uLHR1NJd?MJBwmrO~nQ>AdO=}mXo6&X{c2LsUZ
zFE1Xd0MDXX6sbX+jclu2@~~?eAM^ce^DeA#BjuM&)?=`{Cyu?BP(?n%euNsX@FOKt
z6~yvTq6Uy^?A1<j9UloM`KokqclzNT_|pEv%1huSE(4cfeOVi(NzVPy?)1*LkXh&j
z`EwdNCz-5nXOQcJJMjqlDy-=K!}6=FYO6{UhL(gvROwsE(~yg(b7nu$Ebd+6sa3cu
zpH%D#mk2%jo}bvg*Y>ur>}7eNJ9{)|Vs&rtis<OO%-I#WhBH_TDzg26gEAGl8YLSS
ze4{%*{HcM?>QXlA9ac7Rl_y_V#juA<NVt{>1IG(yTZ*1iPA})*6un0|l!0{ltiMzA
z>R#qN`Fll=lY9gG>hBc2u)kOIep+R*Ro%3x2LA_&Ud3M&z0toYdNKc~=r#W<ir&#J
zMbBni(R=-`DSAI$6Zi3*XX=hPOZT&Q*{0nb6xyN2pdX10MepVEzWcuwJ=NmBQ}p8h
zxuRG4A1Zq2Fb0_Re@D^7{kJQ60%8BLqDLTM-u>4Vz1#n~qL=#Ls_0GF!v9UtYyKZs
z^f+2j;1%#Zu2GCyBl)!Hww}Sm7jcNUB^;b2Absznl2UWqrm~0nnnTV1MMW=>!=cb`
z3f%l_iKK4UES4uD?RP(x16(73sn(E5<;GMJT0`iX_s<yfM<zB${|JeFsvkdOY^d4V
zPNb+gGBuUxQDrgmLKwy)irpXDl7*bXjis`y;OUB&H{Tr36~g4pwMBDKiib+0-o64i
zzLXJq-BwbX?fKvtOC!zwRa9D8v*VkGVXs~am9+@HX(7I8e?#dM;(x2z{=vRI!n?g+
zsO~judn-t4*sOgd>`jwq$45{8p`rFc){aJE#|HuE`-A*Kteu0hoiWy(Yo4WF<~y3Y
z%fE-A;yAhn;`yQSUBAMF<}}+KQmaXfTAD{En-@P?xQpv%*Ne)o_Mwi;`Q3s}9lc>4
zGjF>2lj_CWJ21j;LFR8mN4sCXc`KD9sKC~UrBnF!o4?yr-@ZHP?LIA`N`Sc%UpqeZ
zk{DLi1#}uZy*5tjIWYY0QMY*f>n_DS_7orfO6(p*^!s*JHV5qc<4*i1lCId_eB=1}
zJ^y@9y>nFgbU7z0MPrChFZ=yV&&EsjeBQ#{oMwG)^89LN^?g_R2wJ;eg!J(5Z6b#M
zq3Ff8_eQt(r*12H#LxY3kN%9C15vl(?)cu&BrfgJf!o7TV%XmK$FMwFUqStrqUR^W
zq=)JGEWqM`VH%kltiAamM;KZm|6%^fhewnT*POI+*+@JYh-cwl!$M(-xPcLYFyYdn
zw_3x{@V!3agB51OgZ0C#=2}5?;j(D{;UTuhE-NNh2hSH?TuWRZ#*^B+Xop@>Y8;LF
zKRb=AQOdgTA6I`;ZikKh`Z@9;XQaGl<m2E7P*$~AZ}iEWOTPIP0@XM*{OYcJ8Fdr9
z{FBE2Y<SVB^eTF!l3MD3hC*+RN-7Ks{wftgjftNcTg##Ce?pUYKE~HEw(+EQuq34m
zJEr_>96J2czWseq!MLXO#LWCSiETm=Ghw(udA$O@#WudDTfd`zf|f&j!^v{_;n=Zf
zlLqZW!2rdkWAaRL<z#&?PJ3!LWUnG>a*y88z=SE9dv<`S)_&A<z{fIO?dh@b>9FMK
zn%mRi3zWdAF3&Pf`P&nLbc_B=A~T7<J`BXqB#C@_@O>t|jN;}nBk%q0>a#x-y-$gs
z_U3=eJGHIoof<QjpB2)ZEw&hYfP>Uqm7lblE6AhNTg{!su?>eYX%i~btmga)l?B-O
zv@&Eo9(5AWRGvI_zhhQlbhaHud#MWoXut!Da$a2!m;f0JVd6$JxHcBqP<YETiW~-D
zb|_cV1+f4ieijHj(5a%kFz3FomIxBYqp$$Lk_vnGY_b#e+3)E)(CM);EQpOd&;J4V
z_>5A3U68%M`0>@8EDL1mV#P{w2MqwGMasC@JH_a%ascr1@{)n}67&+s+vJtc;a~`j
zd6*u;bexJ9xQt4(f<<CbA7+<^1eVvzD4n>4xyz_}JlvJQtQmn4%cZ<TGo@89)pjgd
zh%ybxqT*9wwG|Zpa*E~i)#;_xk;lsq@bI~dZ2qaRq6$jw63jD|^@A+(I38Yeiy};4
zrVXx6V_5woP(|3ef{L$ccsOqa%C7vY&S?Z^#p2*&5FGzSp?p@oenqr<C9Ql|SP?3d
z00Ph;1OU)5s2iOCfB|*pQMB2YIm;=Yw8g%Q%SHge%J_(Qcvu(1Z2^S4Kv+ELGy#C*
z0fVwgK=&(Sw{GZj073x3_>~{GmZz~S0I)PL2;#!7vEv{B03hhP3q=(`Stod45IUp-
z!0;=(tTx$z&1oD&5CFI;zK1PQYI46n8Tqb40|qrfyYVP404**J@GlWQs5`U3G3dOR
zp*m9p91B#8jv9DC!W<|5LD4gaL5_A#{zr;l`^%$~HrtBc5hYH7weU&S{#AT$oj3r!
zDR_X^`~t3~kqln?Dy9I)p}}Y{2O%l;Wx7*iHw}amI;p^GP3_i;iLD2E)KwdZ2fVo@
z9Z4YKI2=CKp#{OiC0PMh<F9Y~`}N9wwE@G(y^$aGGqX^c3g`*T&b)$v2Jj4;UVfSy
z>7`byHaf4%8VXtsU_H4~cMgdaYVOJ}fUzF0zBK*urmX4R(Z4Es&)*dXt}jovo}gSS
z0CV&SIyO@QihXjw&)f|;U`Z@Nj<;fg1lBI;kZ4qM2LnBJODPXn(Qg3YmE03DMX`fp
z4EU}ImcQ>Smq*zDw4+kGOcv0cR4MIn&I5SyqsSXC!1J_Ll)dJ3Lqg2n1vLaJ#2U?d
zV4{Lr7V|J!f*+o}ctq}j8Pn6X$E$x+^gLyu^6!rMw);wJk_(<_Xv~ZALf0=*9?g`x
zL9|r|aXKmF37N)(+J^2fx_HL`6kuK-%7frVN=hYI1<<h|G4n9m?IxE`^Wrey2bZk1
z(HhRc@W+X?$^@6n(c^;9P?Ij-#4wY{@eU2w_eO$~Tt_*Wulv7Bus~;;pSv=dY`Xut
z|8GTa@XJS=HG9w8GkepMCCP-hka&rO{D(_IORPZpCle&#H}4iTuOXgc0SV)$=J?iv
z^5RmYCucZ^8S~hZ{3=?lHe##quc`=kP4bp%ijGN_$|`JTNCv4lIum1|AWUDZ?fb0L
z$ri{yg)^c#)Z3m80l|_k#aDxWD|&0C;lZxAI``c#;P;xjlZBoG0JwAGk&Gds_u*uD
zBfR>|E;<a0HqMrnZFvDO8y_}CpAcyr1sv0t=kvweMAY^H+RuujAPS>*QBIx2e2}Bn
zlQuAbmZ&A3GQLJ2x^@t+vpK4`_2ochbd6Hs(rUXoMXk=>FN+n)Uhqz9QTXrxEb&rb
zJT>q$$Hlr&+J`tEcj)E;nFG>wu7eMfcDW91D|+6&bpf=rn-#~BjXfPe?Z-U6lQ;$4
z4xXwSd=|t#4GPljH5YLU1;(z#<$2M&;JF2C!^8dt0D7IE^hqMTZ6;R7!vSDz{Ky*h
zhz<8O9X6N=RGWsCdvOK5Q-=~uYRS!^;}2TCG2`LmH=@9g$E=H~MD4FP4TRzab?H1%
zSTa&mI!NN&yU!tk`rC>gYv-cLdgI<W9H5UMG{RfgCJ@f@!j2tQ#J8oLn@N&r<hMFf
z>a3j>rt2da3}+WzVU?72@lyAD!L6>8AP`R?3w<(*GxljtMm8nff1nGxjWkdWX(h>>
zJG-UmsXWFe`SzgHVk9IqO3v}7;Tn8a`fsv1<*7zUP8{n+9x~ig^!ze~ST;;D^2TCQ
zS(#9*U7%PiAK5hYZD}p02btKT8C!~8`*@q>-QSAd13wd+mMul^j+xb`BaYjOo|K%&
zhA9sIC8=g&QfPxpfMYQ_>>PTK^uwB-hpE>HQLhkV^Z<DlWej6h6QZ=ss^(sg7#L>4
ztrm|XGWpS*>(v^dGE}g0Pd<~4rU7H<a4+m!9{GjeHO1%+O9Fh=rFmjEYbOqX0yw1y
z`UJ*mecMxB7X-lw9_Gd?C2Qh<sw2D*RM*P{<xzmCTKAX=mSLt5_Kh&sWgu19QSu>B
zG!_LJ3P?WnrYHWA=?tjDwkvbPCeMJO=(QSJ<vp|FfY{9#aU;4jgI5zp^Z;YU^u%@l
z)dI17_J?zQB3I8VaU%U+>=$pyMgdgtOLWUFM`s)7ugk!}da|0Q6#!vXD(>SfvHr<W
z^pX+9p*K?wU>^|RHwc1^)&xYHL!aIwX#hpJ=|VH>dhTjZ6ibZ8Ao(i*xZQ3R4z(sm
zNQ1ab3<_bf1E$dFpxz@iR#(ht0}BkO#^h`KE;j;1T({}eF@HCwhk8(P42a?BfJ1on
zq5SViaK?f23rBj%KP2v#!|3#4KZBL5nxqZ$K-@;{a%bKVasv+Na^gNi?7pU*6ruqT
zCHwWYOkE3(Le-zw?+2fp1Cnn+5MY4Y`O5n~s<d4L%i2pE8>=XD;U$p7`5UVMhL9o!
z1y*1{9`<`#Y_g#@BD><MA%2wYUW(w$nGqudwfvL}05Dr2VLlRBzG``Z_1n(|;#H%N
zRdcWm50K_cBwj<&adP5Ei<(Pv61k8xKuH0ANY@}0!$&JnnZ!btqMw5?gs02GRItnA
zb6?LGiYtpym2`Z@zB(NjXRi<?!f^z4+TK=$cHNUILkTb>p#?_xXuzA=hmc@tV0G~;
z5dO@L*qw8b%cZGI!P;3cujI%snjoxnUpyozyBHHAYr>Bu7{(Q-?tYeVK-xZ*9iV})
z>?K5q&#O8vjkd6R6F@<Z-3&4U*bTJuZN@+(1px^EdKo<S>A8z--}X8;=qeV5Coj9a
zeFYt`8ixZpaJ+%gNR*ziOb$=V+8K;%TsP;tQkf0ofLx(EYunC-Sd6GHbb*U#z(L!E
zXk%2wFWi}tF8lc@xmln!-QwMC(VuuS-+{NR<wxN0PXR%@C~x1JCMU5==c-7XVxrH?
z$VNUT8C7}s-D?h{>$+)aM<gAO8;zCu&d)LaF!UgU$dx~B8A_+_OFs2VBUDm6Sl;kW
z^}aMBb+!S-3e}y7)Fti9y11|P>6=9xkNovH$23Ro!V)$mn1WB-GH)I;NL0~i_Yljp
zFhCWtHqYO4St|CB<6<ZSds@`KDxR&b+#5i^!n>+LcDPsUyY3h54^3`QmSkZ=R)I<0
zXWppm0{&Ly(;`cRm&e}6tGEIkUQo}1U5QRQH6^cNZt-upI0GZhrh3|RLavXbswY7A
zki=rYhu2#ID7CLmZVDWTA?;I(F&zkgB|?Ajxki~4GG^ksy-TJ#ZN7wjDB3xRi@dR9
z4<cNrYv(@w;`DQl@6JePdAh5dI_FP8r&0FPyet?1)Ei_>7qWCuL&qMGV3}S9y|Lkj
zr~w}Q<Rtz&p{DY7tE3+|zISu`e8;m->he6l#=t1V@*S#TX@Zgb38pf@fJtKTeI9^T
z|9-vR?n}wTSzwwYk?VWW@);iQpzOdW&>mWhY-)LE2pQ=?ZN}&NT9J$DkRDf_)TNV6
zmt^$TnZ4Dbf?msj+UmbWrL3OSQJ8O3)4w8@k#dUhK(`I3-2;R@&}nv%rvup)Y%IBV
zWRWx0H()_P-z@SXngA<8?K>F7<p40HBI{)I^d00OYOxwJ1co%oY{h8)LE@|S07X;~
z9za@=&ZUy!_&vtK<V9}++tQw^Ol&<NWOKaC_sv`I83K|YkP9OZ&()7ScvkcPh|hsl
zXaMo+5BBF3vDPwHPVRy|$mWVH<P1S+Og)v*43o(-YXbNyj9_MW*>RxhN&?}Xn*VZ<
zv<w+VB|v-jlYvHTMvDBZzMt8lVejWYa&fL?ATCdaqm7KrV`Jrqf%*xiMI{iKNDvwb
zJ1M)-ScK}T0-5YeM#nOdTOqoM0<8PRyoEE~*3A0sqsJf9grrKBVfZ$DjKFE-u%$!E
z>e)60MS4dy<H({&8Nxtt3=@`+83N3|tLK^5N)Uwo(%S=*;kig?g-{7``fQ@)Lr?(i
z3post)ymKZ+&0OJ`2^Kn!p9EpiLE6-s1*ZWZiUv7ZN?$5uA3C)z+h-V+_QB-?U28j
zX>}oQfU;>iE#{<dG-d*M5g%PgV#ZUWt-Bs@H4zVoFx<cB%BE=Hqm7l{ksc-uz8JG2
z6Zi>qYesf-c%yhqk?HI#*%c3aF>#xhi&##JF-4QCWjLJ4P`&Ju<O+EE!xRlF0rTKs
zO%Lj!qv>F&xzdH#{bBi#H|-@R@V;}8=?i!u{uTGf()fXg<`ZTeU#ab5&|9*=lc_>x
z4-@@GGRd63U?wAe{FueUd<QSMX`a=Rq39hLuvpZzToq!TlC)f7D0)wkU(75wZgk#I
zi$s&7zrEQ~^is*uXf^OAs};zc`2do5gk}jfxBB)b3Y|&<g)>%VX8I5qMzLb?>cG@?
zB8RO|^-RIIIL0L<hj90oFP-SrSd_UnPdF1j4CIEf=1;P23<0q@Sqpyd0*4dPSFJ@p
zTiYsG1NGKoNmju!UFiNuO)|{Q?&yC)(TjddKhh7*M7|XZf5!;9W@g*`%Zgr)b`nhO
zW)I?OtX(QeA_!zY{1-)!?L7~UiJSkpwfuXu9q5?XzbSerZ`#=2d2fFFI4AY^sVznC
z{psrCr{5pP$@f|xham18JMYx1xUX9?D4vxKbiwMiI2%a#Dl_JIt9yNKQJbyHPh0%Y
z-4}3i7?U`+o4wUTy{_TRm)`dZIi0xb)`!1&A|&aKHyhFCK%B3U#bF#%kXD?Vd2jW6
zAA0>n_<1HG<wUeozfn3ufGv_wI4<10gC5%67j@NkqSP)U+b-s_U5dX%Y;`Xg7RRau
z_B(EIA<vpmo+-JyJ%i_D=J~iQKkXPd%DK`J-yKh;q@Gw{9pIyOrUGxT8Cm4Q27fUe
z<?54nob0a;^a_U~Z+*77r!`17>@5CCE;?^d8MePrH|X1DUmV_d)5~V#SYIW@zRcXA
zIy$o$_Th_Uf5iEBa5k&jNo1XQe|5V<JsVeKlC3I_6<2#-=FLuOIJsfiq1oK=E5<G{
zsVn|YcZ+aW>(!GlD2}g<*y$O^P;3Kqvq50e@k+g8xA5>o`L}!~*6*a8-a9$nF|y|I
zcj`^rQS|;VD|!LvF43T-wb35r^Nz`x!P&7{6;L@W7zcMzRg2E*pLEoAQQQ}U#YW1g
zMSEZ&5>{YUH<FDTR2gv5Sz_30U<o|rq^=9zI3;lXyaYDN!_Gyc4HiL;by!23Auzx+
zxKB%D0LnEK#jcN>vcW?n@*r7x5GgEJ&V=M2<6@6;F|BotJ{2FP5{bpZW7pvH2--A*
z<Fi<b^&m$oEWv%GXQF?(6{Ny&k4T0UZV`l;_yD&onNN;g5Zp7j>&RGq8zMXPLQYGZ
zKQcBP9~Xp$yVN4C!7m(3j`hfd?Y9D-SwfhYT)<_zoyCIn+n}*i=dZ6%S_Q@VyUpIn
zgGiXn;&s8e4j66$k*_@&v=rq*jl|;PaJX3++WAW}t|!}EZqT3-Gm%+p(NB7rEb^ip
zcrWb7#)RZSv}ERNF2~x?-1gHZgE7;%HP;9vLaHmu1MhMJgTSE>Sp=6eYq7WrMxxF$
zq84!y13z0q^1#4P2E}^N+?7*dms6uJxp;K(dc9Tg>QR|L!V9CjseoOuQ8H++WR#0)
z5F(2Pljwrjqo>SjnWENW0|A%uwW#<hSVWt9_>}vZ3R3*D*vd7;EXrlB<sxpub2w&V
zq-@5DHais%7nlk&F`3Cqbx$vIQ^m#P;9$fx#Ls}JD=t$Wx(hNi#Jn`=eeXh`8?*?8
zSX7C;Oqh{D;$5WiI2HW3_9c_MZethcJd<M`OrRQgh!%lVcq_Kx@>Is!r5tkXUB<V!
zgm{9248UD{s0$(M(`9Q2Yi#7y#ih&S<z1?g0*EQW)+LiuQ}MQu9yC`~n#<jVNRKs0
zvBjtAGN#K@?h>_#2--zr3s~_ReEu@i=U#6S(a-eCDIZ1p3RZPR!qr_1gV^ml8~+G;
z3J<A3P08M4s)SE9uEpM4TkLm%GoJwO>s%IIT(11(8-ZNabN!;?>h6M!QOojmktR8)
zMHAptnz?cCPVa~|1nw@ROeN}ao4bDNa-p{0{y@Cd;<UBmSGNE^6I8TKk-tL?)Q61l
zAw$#yA!qQO7L0n`CDQf0i&Fg;vT9=#kpAN;U-d2B>y7;otuyBrr(II~Pd=Ye=z^Tg
zi#9`g>kyzW$XFY@i#X%R`y%n7x&iri-#n)$JOCG|R3BS(fGNR6qbSBK#pTQ8z=&42
zBjqzT$moO9-y-PWg4ly_$&t8<Ib6#eJu2dx6rX>5d62c@MSgY{$-G(e;(88^L|AiU
zY&yLbgz&)xXZ)$?-JL;PCNN#bcw8q3XVu0E)&yTCY^3*XT%!eN-J1yG^*V!%yqv{!
z84EU9inVfczw?|)85@<I?IVQ=$U#Ds$#H?`jl2^R_by(VeYTXN2K%7`k;BAZ#)KAS
zZDx@@w2<)Gmc?t-&1?ogw-{nHg^;3xBl;1NOP9{hL<aY**vx=6$dN(Fs3>Fb(Gy`2
z7{tNAs4F7~3o_W0q1^?>)viI{ov=6txp^yAVSNfa13p3qTl6E&0(00}MAHedMH@oj
zDpJA3{cZ}lr}aBs>y*2f%%;N(;zA}&5)-fx05LHM@lFBD)xstam*i5T73}65tTyj-
zgbDGvSzzXhPP-O-i#`7c3VROov2!`;hWF<CWJ8+`L?R?ipbIGYaOZeX4RrQd>;)`X
zM-8Sp;v;r?^&WzZz4&8!KX^|r$Nqam{K5AQ#py&Gd1F{Q(`i>AV=T8}V6c2M&E{95
z?)*K&6dfJ(;w~}n?xb{^xWuKghszmhhP;9Q2}O^$QbsRQDVsy<M(^f>a}y$ZQ4$DV
zhV?XRZ?Qb1n_*HpCcl5;hgcz*E}f|3BX-C*u83su>Z-Al(fn=6#cE@C-xTNE#y={0
z!-ID@&itCab2H|SwS&aQn10Ud&~tn)eqHlVs=KE~$a9=kIdLD@ITI6_gj9X@-busB
zsT=tTzB$V0(~^jP#dGJu-0EKyz1(uUm(R#m8Iq1!2P2%G!GhR$js3(vXyrt682fN^
zH(J@_&6{#X6RuU}aU@aC4>?R2akCp_aVXo^|L6%6|BIrhxRA;1$UFJ%U82gG-&sTT
zh32z{KePEI(*FM`dN~6r+Uqol6wL(&Dy=>ecEwz|Th8W<;tM$&H<bY-bJ4+twt{=w
zKl_9CY$<xhcQ@O7QTgO&XX1A!v%YN=IEVLs!F5=2AGEaWlsAmeF;%ZcAc)p|NHj`r
zj4Y82JZUQqpLuLtQc^Z6TUx2Dx3?^am9unDdH+!}<$)XHDD4{|-?tRK?;_d@VGk1J
z3pFBT`7Bw}pnM*yv*g|HrE@+%x-wQ^X%{qhHsv5uVDoj+9fe5QT?>tS7sVN;otMhI
z-$8{J+lrp{OW!j2J8OC^JO-M2aFNw#E3cIXU(uV&6K+Kcur-K8$tk^*=DU(~Fw^Df
zeuknqG}-dvX(Ut0f{%68ZnWvs^L0Yks}y#XrFSEw%elXpcj$O*DSEB3o$9Zjjv+-H
zS-l@h-2I{7uFh3coN{pB$BMFu^=a#>_an8R4~#Gry_#b`Z`dU6i8B1zEO3FolB78{
z_JwUUxzyW;(<b!j8+AFzGj)cd_j6tG7ELdBtlY3ExkKmMxP|iB^0emR?EdujkGDQB
z6g~gP4-)r;GqS?-1O2`SXR;H2K}BxKjaw|VAEf`tn*R~`a?Vk1h52*W7m}sQ*+cbk
z>E|~Jv^FNM)5X8trCA5BPZwT(W*KQIdO+l^A>HQSkBzzK&)wF!$B}&LU5NP$$q@#h
zT2)VV$L_{Aa6EUr0g_-SdfG;!-Bf5B?=s7jwbh=Lbx{hIBMBT(L1N@jG*2x**6xoK
z-t8{%n0boHnd9||hLRK2o*ZnYqbX(!6-J`z6>uB;63JNe_S(=gb87II;EFfmfT!L=
z65A;Af%{q2p5Ep9MiA>q6-Eub)~bOgE7@<Y8>wJS?p_LNw7rWL;~bZ1eLi|N&e3fw
zbe<#W<F$4lH$Mc^^`m7n0_7=D7+Q9RbG-ev+p)f36Bh23vFmnc1X4+z>OyJILy6^D
zOsm5@@NDDC3XAY1A48TGeke;#XAX;}l5%tj@gzQ|7<y5UMeH2c>(z5-*&Hj3Fejr@
zPP6Kh*L){jhpbu6N{^5h$B*h<_P&39ekEN|=1k~RceMLsV-e8=c<7RI0!jVMt~TW)
zO@fTBd*mm<wpmHl6qyuWLy}-R#>j{&#^hfCm*A+2kt=iNaJq#ThJR&0dh1h4IKU*c
ztmbAA$T(m6Z}0xWfApC9M24@NI8%1eq?PP@M(SEYfW>nnj(d~qfb<>y6I4TN_3f1G
zU+3=5R$kDY98Zv-dhu*lM5>AVK*ONK1GiIO99-|-)oeJyZFWG+^atj6A%?U&lh$Ts
zA@*JdJH8t+C#LuqM`|#XVr@ZBh+i(Izs=3ahe_g?HTCn1z3~O&fvKdU^9@IARts)h
zEyox?5l`krOYthZ9nmSemvRDmhu3<vg~cR~DNn6e+}*9|!ov#YTd89(u_6zPQ3#4t
zjhMTH*Ebx>heb>f4m_oTB{#iO49SJ!sp_Lzo9P)PzmNrn%LXSx-`>wd8p{&RkEoPU
z`wQE~DQ3=lB&2txJ<(RBII7*VUd6pEXMH3icRc=}hg1d{_f5ttd)~6mgX2b~@dNFA
zkek6?(J(hq<j;yoou&J?!boENHPIy(%ZX_oBz;~ECSwVVw`~L?|C5A+>wg5rMXipP
ze3*=tl4Onh(HzB<gp4&JeBi>+neWt!u3*VOz1dGnHgZO(!_@Uh5tmZOdEa43CcWP8
z0}TsXRLi`y-MYuP7bgTy5bjykav-q}iKpAE$!g&IXca$GE(;lm&ayWGpV7d)USuSQ
zy*_vlcP%#%N0Kh3^&jlH&Dvi9)`>ckqDN(Z$;)Ic&M9`?tXV?*4Yo!5+$gQ#X%kx=
zBcp;cL)y<vh}5V>%aMuK@5vOf9m16Am^j1CmrO;|Ykiz{b;lgBD|~ytLP{c|G<tor
znZp1Bv04>N?kp*AsN^@6y0H{TPQA@~z9?FI5Q91$Xevxp17DT!IhC-w*;jS<fc7Sb
z%jsi=!sqdg=c2Ucl`>AyWpb8YlvL|}c6QTaX(A)FW%Hx?JZ*)~wHO=G_Ks|1h#~b-
zjWIM1@)6p8Ex*)gQ@jDIoFjtDGhivf*j6vM9>wXFsvLMDBuR%)nlA+X@_^fi0+QVi
z?jOjeJ&F0y#Q5ypjupO^W<QowQ*Ma50SW?--D6}b8rd6gF`Pr#C6A$T0hg|rT;FHD
z5w&{kZ}0}#kSaL7EbEgdM=SFJjpeJhy7;V}o?w_B*uQ5CR$bfVJjnqTNIe6aMIVya
zw@OobN`oCzi_}@r1<R+3LpPB`uEEQs%Pi3Xj%~)4PdQ+h91Zd^s3p6~yyMkKQM=~a
zVnuG_;2QW?J{S7Bx0+H$CU!}!&|)M`(UwZKL}zj<FGch4kFpy>L4uEwCCYZE)4Eb_
zRjBLgVHT`<^7_xP=~}mN=%Yyz&5fd7x_Z0X=GhNSV0d4)w)X3ILk-rOn7nAla?+3H
z$=H#NK;YR@+#);vzP7kB?m=I^CFGOM$QSK8zopk!r(e29LRV&5m;5=Pxz8}@Y7FRg
z+lQy`W97Z0RV8zdEg5(TTVE7r5PD52dqAd3*>ZRUFS4g)i_inx-UO%aBEo&P2|W@I
z{H`JXGxXqb5^R|imxN;qXlUMdLx-P1=n?-Q^r+FIa@m5wO`WAYb_SuhY9ua6AGTl+
zdM3=dnhZj(VcNXUeFO4dJxfQ(VT;i79OU(h>fa*t^lOH08X0CeH82Q0UB}|6vcuq0
z97Z~<?AwGM_zyzQYMao*;Mgwm{YmISwh28@S|yFk__n6uC^v)9qaEKS^dc926MEd;
z*!f#hXKsHk7CFcEBJe9IWRKt$p+|PwBJ^}~l@i5VDuwsBb*#O-t<!bJ@ZlLlsQwnA
zXK0u+Ag-`Nx@RJuYb9<ufAg_3<k6?Ty9`3lF5bm_c(-3~-9{9EqGc-oCiEgP@#B`t
zdE0~@(GYE7SV52GbfdKx87i#C=mgQUHVw83y+~bgZf1r2{n`cG_M|vaq3#x;*I4*s
zh%Nm+`Zh^tX229Fw%@Ms7L&bU7m?GRB;Uh)IQ`rfp*L@crg5$Mo4!9TTKuW0_p9#t
zn;%V$NxN(rgdWl91%uFQa@ZpD^o3Nm3B8$ZLXUf!(38n$vyG8LG6+40rqT_Gm1dL7
z!o$x@kJvZ6G6+5NZ$hupC5=Jo={`?7W0ZLQWK|}AB;>AoH1^^)p=WkNzGRp`Q*WEl
z1KhksPj8;bF0k!0CMgPS6MDL$O3YIhes@lkG21OPbFk9yNaLfpppn@OLT|#}aGpWv
z>Ds63TM;Gh7mpt+#aLHlAwVze*`g;Igx*rDpwJ1M!h(kC@q<U8TZEpc;gNNa;{@c=
z<XM|=jP_tO=Msa^Gcd|<G{W6IaqFC&#YC*xJ)L8}2|az!pnJLAg$gj|5M$CU2B8PF
z58!4Hdf;tB&tNI7$Mnc9?T3F7dgsQ?Hw`RS1l*Td{5P5`;geRplSiL6U6hI0BJ^mn
zI)&MC4EazwlK8oW^p)RsGs;%`j8)I>Z9>oB!$ws3286f?*&_7jMI4Qx36G0Dzn^qc
zF=C-Q)Xd!J_jW=~(0Ak9BXRN0UwLqfF@&@dJws@*j+xonSAP<ERxY@=_ri?}TqCFC
zKK%osr)yOVfksPs8XN5+pRo4pwNr@hI}X(j8(%LL+amM|aaNL}R&Saduz43>MjmXG
z*e3Ldhdx67AoOSwQp($eo}27FrENm5|EwM=I$pML!l>Ef8iUY-7$}3uw;6<9RLC<D
zCsm^CF@w;9Y!Q0sV^$M!e-L^%ign1sy&F+Z3_`DBo6wW-cyLC{f<fpt|BcWiS~fyR
zw&3Ceux&z5-)IJ8d!8Oy9HWP4Vi0<uEkbX|IL=+li1+><gdUoAi_k+d2tA<Iwik<M
z5PDHm2BEiFq~q6Tvqk6uma|gZgkGbSRB^@{&@`pHMd)P@x5ktTxXZPoBx>w`6MEFb
z)Ok;hZ9*?h+WjiAJ(8ICo6z&L9oXmD94W!1>vB{3H=zeU+O_9sMTYXj%(Kk1BmvlM
zRJ6YmgV2i_*d(Q_k}p{wPs#p#3_NeOZZfE3bbHc3#}8DZ1iSSEs-tziV`#)0P&fg#
z)xzoJ9w%M8J3e&82=l%})>iO&DtOP)=zBk)0biTcM=d8?=$+%IqHozjfB8A|$VO``
zcll5<2qhr5=(CS65Cy1$b=MpW`6JWSiOK|n>}qK({!EP`1D$#9+2W5i(Sp@RMyXQz
ze3DMF;r+zPYo6Gq<0qRBwvnVJqBuS_vd>y-*Mh!<6rHfs|8|S!PP!^eVjOa#U0np8
zQedRGRWsvKLpMTRSdZoD)C?F^jIk=6B=D^3qk1IWMn^biMr4)yItNA7j?QzGg0(cK
z<dgHOp9!nEIen?7VyUN*ZMny|hr3}-ui}JskRqc@JqLwcjhZ2MMVw=e^u(7UIZ8kO
zY&oQpYG4>#_Vex`ogfJ7>(+r6_+LHxr#G880K6fNUZ7H@pJPPgdkdV}0K35&Am5vM
zJ3cZiC-XE%D!YRY7{B0n?24u4F%61|*c$2`BiR}ma{FZ)E#$M;R0?*c<)Mu*c2o2m
zQMYS%rOG1RWIsqc%X6P-<_`2SbhCA}1$P-oAKHYNC{5^YHd#xbH_Y%hTqhDgM{)XP
z6E_UFfoZ|Os@-4MwH-k;HY52iKpU!$<j(cbxSLb;Nj77THuk>gp-PQB!kw8W3$_(m
z?iDcuSlBC9Y%?Utc6YRN3rnk!5m{e+0wTr_k}lY{JEBV2a{p>j<0odA_Jl4xOHb%6
z^&Ri$?)coUbfCMe$_NU&aGb>R5Mb`nSNKkk;%(ON{3YjR46ArVYEP3bE%SI{T*ZMS
z5-A3J7|`B%vEAoZq-`GPEBY}~NQaF+uxKt#3%oE4eKE92zI1Cze_+&0>EWS>hka_V
zj`?Ns+_;mb9Jy;9#7mOgco=1Rh-BLOP^Wp-v{Tvq!$Y(2RnvEV2dRD*UmjX~^RxPH
zuwOaK3Ua`T-T$b>SM#}tmakWjj`&%Nel<UI;F#(G8~Q`r(_d|$uO8F+YH`;8c*21b
zeaa_e{ZD*bJ>hWRc$U9ILG{TL{}WOEmNf>}st_mk>Z7^-PPzW49#q>4R-gLv75CcT
z@yP)@y1&ICik2hDWMIE4Ss{L+>3JqQ!ZAQ>ogT&PsDdaW=x~EweRcP&8@NG;Izf7F
zst^s*BffPAnxvwUq3_0E^G-i<jZ$$<3Ak`Y#l=I#btJ%TPQ~@Qio5S4_Xm$WnjU%j
zs(8`YToJ05PCvS^zvj}1HQ(s~KVQK6-kQ5FgV|GYZC&#`5$JmQ+j*86ze9n(4yqS(
z0|PGAcn5wvA5r6z66lo`7@Dva`X#_)L=~~#<ntuZ4H6i(7~p+cMMD|l6ZP#pWIc$z
zHn?2%vOx{e_giG2s{e>8k!2nKMKzcnNSIS4O@H$aTqpYKMxIu4J*eiNvL2sOHc#*i
za|~c^)6<yIWu9QTcukTMLCKc-8tXyKR&+g$Heza1<bGsbk_|ESph3#_+NAN?<S(_U
zkh+vPU4g<VmRbS|qpu-HM3FW)3k`OYg0lk~ldcD6N<?0pqbjHwTn`Nvcv!bTqwX4m
z%}Y?fR->L%6P$S|I4h#=T1wr`+~Azpjhvc|>#e~WZ|bh~sTWMwq0kz+q8gbDX>WWZ
zZ?W#$x4N8rkn7hsZjS^PybI1pJT9~ex#zH%`-E`!y81oAkn8tDvQso}M`_$#1Q#3(
z$!-nF>(sag*}QN0xIA=|5*tEkQZN4U7^SOGd@rQ(fyQ0-@5xzpDGnP~ZR%1a>QcGt
z(!SU3r$(mVgIxJu`)Im0iDe`CTTs+%dhL@dE$8n=J?;FL6+J}Qlcp(D{lPG0h@7To
z%Ref5VH$={)m}BFS^o&N(|lROQ1rsmeAkdcM0KQQvZ@9`Evo)H1cBao`kMIWo?g2|
z7;7yx=^pTAcRfSVYq<Uc&`5pt{Ls_=TJKN%Y=G4Bwdt|qfmB2o8zx*};z!3f&HC8z
z-Y)<mNUxDktB6i~|6FTmuNDtkucuGT&MbUry8h$4gI$aI8dUv3x)yt)E;CTq3(;d%
zgNXM~k<EmW2(6B}A2qLu>Pt^MU(-YTzt^kR0?3{p6Ma7vO!Sxl;>f)w(OO+5s|J<A
zCKdiVzCuE`O#^%OGnO_zrdsNYn#;^TsGLB<N4oYByXJIu!&uA<CCx{}_YofvI$spE
zy6zE$dKmAo4pkeHd=KK@2k@vhA>|rGQ?({y>-W!t5pp1R%gD(rEkuSk4<1lTeZJva
zpV_yLtR<*pz=$ORH=a5_uEPUBc~A;(-<zZ<upvYu)PTdWWC+i{qv$dH&nS8@c4@!N
zEk%z*QQGsm#lNTMVcgLFrsyH#e=B;`|0PAQ?0;O*yYQb@^f<Q_y(pP-BL3n1Ek#e?
z^#7Ei2isBf{tJrU!@nwe5<80Cj-t1t=>4Bk^uRlc-j1TTqv-7@dOM2Vj-t1t=<O(a
zJBr?pqPL^y?I?OXir$W*x1;DC+)?yK5&PY+JBr?pqPL^y?I?OXir$W*x1;FoD0(}J
z-u@j$Z%5JFQS^2cy&Xl5%Ce*A?I?OXir$W*x6Ea^%yVg(FJ*aG`Lf`4en6CcMNDx;
z!g59G(#r0Xl|AJvdplR;7grS7zwA@|vfuK{flFUhQ@*H|e>vFsMQibk4*RN};;Mn=
zs?nv@Ln*6=%NfJitLBTVmh4}x73p7XEWaMV^z}r_*OTR69Xh`{Eq*=CzUHjBcGhz3
z{G~P5l(h@xYaX3zUW;oxir$W*x1;C*VjEB<9)J!og2Dg*gLZ*qw?eu|#tXs9!h&K)
zquEiMXm%bh&Rx7be0;kE`T0Zy1;j*zq{K0Mq$K3`NXyB}D#^>L>{HM<proUrqOPfH
zprvl0r)z4YYkkDX#MIi>;;`b;6#Jv*RyHS3*;*;vrM<A{IPYkC&?%!8C!l{O^YmGF
z&$EtgXGM(8<(RnKc<CbUcj4@-3({upH{N*31z&WvzLeX33G3+{-0r>K)+ayQ$NgkL
z5i#ImXMl!N;2qx}!l~dpoxxhsAwFlq?w$$1-yLoce>vcDgz`JWp(J9^vB(4OB27<_
z)D}pZ_A#3H7z!~a<w{I=PmJ}#|D%dt*p8z2WuSF)@I}{9>(CHwW#~=Mj-uB@=GuGe
zO>O0PYpR6lEwj3+$=BKYJwCpvdobOZXOJLb{`ldicSSb$PwgmryD%9tBwhX7@J9`)
zYGWCaNy_}*5=q+P-4f;n@Var9J+m2-op<(lbD7F#TwL9ASCA;drp;6Q%KcWwMS3rU
z?HTf+5z-ym+|Ht9QpipiN|a<L{B$%lKsJ%NO_6&1Ju!qGMQ`k@uKbRox1;FoD0(}J
z-j1U8|B|BjyzB|IyY(IDeN5-DIuzGh_z`wHt~=}FjE>HUuAdyCAlt8fI-LSP&Wt_+
z6&nZ)yQ2kSpH+QgkwhaNM$$<u9WT7Se*SP8XyQ1P8igs!x822hM@QD$T<WS=41YeN
z_MFO>q_EozMdA!|{spL>Dng8%LFjF|qM^SDy+<}bTf@G8bB8+<m>GoLF*KVU#|oCn
zR^^H6CUWXUiUgq-QV9?cyDa&#!VHhQl?>Dex`JUklm{CFP)ceTJ({)#@lub3)a6H9
zjgmY$cwOSR$Rqs!0imb;o6xgn@!`5?njKSS?Fc#pTd1&uazZ`057ooYy9dPv^>cgn
zTdq(Yp!(oy{N5AiVuS6-F>2fnUEug4vJ&nXJKYCSh&kPEM2@wK%S3V~&tOdb;%@ZE
z9ZrjbRmI&>i!WT~TEVgwWyhDOv0{(Mm#xQF@F!HMB|NlCcodXSo1O5uHsNW1LR3CV
zK8WL|6_LZ5xQS0}Bil8%X}1L>K3h-Zu44W%4y9ys=;fV*?_+ffLc^mX;#4qPGm_ku
zULYl6S5Wf8Z$eKhepiDylH)8>chbKRdSc03&ME6fOq=9n@V`drE&YwqTTT5<=zaVL
zLhsNvp~n#P=mF@x{|li93I5*^dP{#L^w572dg<xl%D*G@&i#$htNb@YPm4k5MP|hO
z%Y<IqpM;+KUkN>>KMB1D|Af$sJ$a*>xJ~GF{S!jZ{x_k=nbW&+Be3G23%yW2Ff-?V
z-JgUWaO=sJy>}nT)fDH{{U-F#w*qPA%6YkHw;RB}Pv|i-OZ~)Vv8DeVp@(A5|Am&x
z!OKk*E39&<h+!Qq^w}jVJTaSjIZJ!%#B<>de<Ac-wg^3tMq&FX3y&eBVP)SxCG`4=
z45Gn0gOOsYQ-v8vS>%<nRR2oobrl-<CDx9ytJtH}Hf7V7c3+)fZ^B5)cPSWd-g`Bg
zXd`XTqqa@xSrgCtS+vmGv>VjWF*zJRU6Tp+#cj*`iZ2xB<izsSBwpVv&J!rPtx-~F
zUvhW$PeLy>uI`L}t~ln(goV!$qY?(8=U?);M6@^r6<Mp_g~2%BQJ0~Zt}Z<w9WhO_
zm|hC~P3S$*pe%wg(|AgM4rTB$WoVG{F@$mzuYLIlWx`#gcat)cQ#KnynM}Vwxmh+=
zS+=54KA3|@gO;yv3a96lP6MpJm|6Q?u?^{#uQ0RGH7fet%gr;(S+5KC#$VDySN1)I
zH65wwFJbyP2<J!u^CwV(alveYRo%-KVtEv>M`izGrI{m8;p>zIJaj>}O6j$bWCCS`
zu3MRhr;Gq_Dh}q5cjWvMi)|NNH<VJG$20=4zJ;>(<59&GFvBkRz^keco1sf85A3cB
z9Y~-Q<Do}GQJ$;dL^RY3U8;yjy0Wmzq*k1-U^W`~gV5`WryP4ixojAB@=48Oy_#vl
zrNKe?>DR`UcvNf!tiirE7!P%S{iv^`s_(J5`oU`X>y*5gHQA;@eay83vbBA$jQc`r
zljiP|O~HLR7AYSd=3YmfT44)tsGCN!Ea1bhIXt0OR`<`=;T)=B5^6mhSY!a^kqV_e
znttD7aC8FOTcBcu04`p7Jn&fV*O@0hPXud2DV<f|5nao^S4c98%w9URoCt@XPp$YH
zp_h?B5iZPnFZjGhuPQ~H?NiC4vg?$!`;?K2=hIZSjr&jEqM^dypRI&azc^I&(<Ci?
zo_i!zJ$ps%3`L1To+HB=D!ifdrWL<f8Wyf2_=OrD=2tK@Iz1}txd6CTwsf9mF;6S~
zgV57$6w9j-zp+i|U5!Ijm2iN!2)&2#rRFMIgr3IJX0!jAqW7E78*BR2MN*a9CiISN
z5qi}Em<PWJJzQ&$(ET%XV}62XbJUNJ=%@PRA!B`^)^=x#iX&4)iQY3=%w8c(lYObw
zleR<#p?7<m&`W)J{mt>4LYQ3Ew&>;3drwQFs$PL_zm)#*swKWO)9k_1xrUENUPXDA
zHEO=8a(vbLgVOxtb&K<x*QJzpA^t9*_5qFd2<!IVAGI&%-!KTh4|46pj&B--I)*&?
z2cNe0&$l-^cMJ$X-yP%^nD6Lk?u^;jxoTFr{HCL+vV4O<=q-2l#q)#Nx_*QSeG+PS
zz;6+HJf@v2Ui_$^ogCp^FVebRKkc|o?B1o-(c{=LRocz#Rga-`i2UrP%e@V4=x!~2
zE0H89_qjoV!ncnu|8Doqb}27L!C{-wv#K3^`ZB_?s*Bd4ul3r{t7m`x7NJMJ{})1U
zspmC=&_lnsapFJjb;U0H4TFB;ebZBK9aY|1j-D@78{*Rqdf#f+=vB{m>1P*OuFvH+
zq4&1$vexb<`yO7FrU<A0m~BOmOzDlH^e6w^QuHF)`=O@&>EYXio>gyf5|?J;Kwf*4
z7`k_sLFiHY@^227)DL<y2tA-@?l+;=GWaO`L$)xqjP1j$?1zU*AF`aZZvKp75PDCY
zx<32}Rn#3A-V7B?9O@Dt28Zv(I}Mh}4fo$1W;WLf_(_SRuMZ7=ZeS34%nqJS3_|bA
z;HcLYq1T#J<0#cXr!}&gRMutnab=j2=Q#3Xcw``Cq&#b6=<&#}q^i&LM$-&JukaOY
zp<$x_RUup1vrX{gFpc-t@Mo>kt4kj%^R@^*@a0i))bOs4r9um%811pu5Zb=$TZA4@
z+1R)1z5VeiUFb2TTjSvRmv)r*JyGKtA`??@#v?zED*_Yx9b1Injn88YLhsGZiH{-M
zgkHwj(OZ*xl%Zf+sdd>T?qcQm&E8WYQ!^oZ<rgLxgr2|0)W;*)ex_Rc7N-23m1&Di
z)10P5E>71(PKS0-0$aM=8H8Tsgug<+7yZ|C{KpS{?lTF$W-33-q$X2b4$jD1zq@kl
zQ_i-cH|_apFY(hY?b$+xqNhD($~G$`HhWKDo6y6SpJb451WG-2i_rVPAoOsRY1lb`
zTx9`zKIKnBk8*LUxNKISVfOXH$ZtZgQsECmum4X%PbL)Jd~1u)LmvEt(BowgdbAD|
z%)+N53#)%2^tx|NwlB>4+;~UV-X`?&=6OE=L$@de=mnXC#i5cp85YQbMa9y^EkbYd
z7lm`NLv)+aYdy83C$a>-#L;zeWp10$`@j(N=u|}CpM>7PtEIusrPX9gr|!b1KM6gJ
z2$X2VAB5hcvL!Q7roP{VUMht*g<_t&I^DH8oU=vfefmx4rT#(a4Qvy7)t4!PBg-Ej
zZxMRF3_=e*SCG0z=y6A&Y*W5!F$lfX#eN2%XZ1xcWmfg(ifH9ZO3JXHB2@Y>gkH{X
zLXSYvTwFq@P&}!N?=Aj!gkC>`(8FvIdcnU5J*$<?%iDw=!`@>Mdgwn1J<LK8y#grh
z1osU>2N{H()ygjHCL3+z4?-{Xdsr8xI^uiX^DRQJ|2LtB0W%am0Io?3u;`BjA)zuF
zfeUYmAXdQBt-os!5al^=@$VG9mnmZU>t_ev{s)TQr4qw|o=;nfUVI`H*JI2JQ8{qK
zzYGcJO&hbRSyzIRlL`PoFER_j5(SXdptu6(s&iR*<sbs&P-eUlx0_#TzOy3W-(il&
znG3;~c${^+YKg>J-%jAhG7<trS=VC~0=njIumfpB@wBzXMlil{!rqgf{Q^!vT~-Y4
zdEKXo6GX{c$Q%R#F;9Vj{Q;~Sj!IB|<}))D-Qbww0fwTdaQx2ErN1hAoi87L4_#j#
zEodpVCL-t9WY6GmycFZ=evREMKv<i20<7d<J|Vei+ytAH15lNDH{Z!cLG}Z>O0Q&(
z&L#Mg)bg~GHJ{81vB-42Df2B2zRwI;6}Ol8^2-olj>_QO`+$Q>l@Q)e?~2>Bn7tju
zNJs98Mpjix{9dv9?~pN|i3cl3<SaLnwG^KGP0`C@7Bf|TckGK06U*D8vLxpFWEkj&
zsRu=U_aLq_QKc)TK<q$dh4{sbau3OLUlkA`QcHCPxDg}$0T~5vcE+@EiWU`BoK(3l
z)9_)|CWAf7f*(*-4LnwQ`=lrSJ)A1Qym~`iFg>rfs>AxYweh#GW2A<2SF3JwMLK=4
zJ6H3e%FN{tMXy)$TYB}{;N711a}rGA*{g(6lE+NxL6|0la8892Ob}8X1fC?pZ@vRW
z;T2Ot7Xi215{C~whN=Rj4J6#W^V2bMnD5p07~h(&j32_<jgt6yO`cCqNqD<FF+G4<
zEq46N@QDI0>K%{%80kEuL#6}j!oY>IncIq9aJ{=zZ}7Bl+aS_dFys@gSpy*GWtXFc
z`C9!1kD78gGKUz0=&U4;yUg+4`v{TN=^V{hWAJJ~);TqgB61~6n-xgeJ4+*&))q_j
z`QqFFzIU=!0MG=#n3rWOjiX)j{pbS8V(YJ-V%S0)g+!)~xMsw=o}Bynh(cc>$;y{g
ziByv+!pvEx;IM-Wb)D9RW&6=GxXJ26Q^5hA&d)XiwiLZ@*M0B){B~AK^0)-YfGx1U
zr(c`c4DXLQA@@jL<W4XkLiWFc=oi7QpA*MDdH&#epGi}I|9dn5)lQWQF%gs<9PQ}m
z1t1msn+RSI+xl~$M^f0&oQsuS;ENiu7>lpGseYDWy-TM+9lAGstuQAJiu0&-WIgjG
zOL#+y^yzt24q^*nN%E)?UNj5ZR`h7g!$>DLDGpX$r1^cM0`de0{!Ju7=F<zd1L=uR
zFBtNJHR2AuLZq`BT1a;GI~&~cZf+`Ki!DpNZS10FkjiQ;QID}UNv!2?_Otfql>xX<
z2em9@;G;dZ6usIO-rLs61E53rGs=fD-iUL`S)oMg3i4UzTT-GD;{`^7Otuug_IL>~
z;R~F{)|b*m8;BqcYU*KQDNemN=XRfdlx`HWt>^^{d^&t=ThWusWIcJrZcEW4z1-sv
zY`U%Jg-OYWGZekY-I-4^Bt-eU066WQn7A9D6dNedr2OTQ#Rf1`N<Yt_&??1U)ubUa
zy%`#Yc>o!Fh(iubM5&eX?al^Zc9=vBWxaS;H+?RzI|NpATDJV$dF)SyqBrQ7{XJ}S
z7b^h(42^A(4B=ImM1jfRfU{h2V6(ev2v&@3+ZifI?PQv?5RlIs^a{?PMqx57p%59W
zcL$M$#7jFChS&Yj(amzrw%ZG-MHoQ7s=5q6R%9Smk`3Rq;gdZBFjGv%L|#=T=cGv>
zYu${}K|0AHs}e>M7i=sD+GfUMd1XPylHBh=fE{L6qgvEncL6zV5#4({9I<T7I6zPQ
zy}h2i`)P)vw=8tLe5EqxJZ~3)3lF);<)$mC>y|@5N2Y?<$ONUUuX<wC4oD86K@i^m
zkG;E$iURukMLz`$-JL^sNcYevNP{#(4<Q{xPti39A|NO&C}n_1IYXnMfQX<-3#fpI
zNJ(7&&sz81v+jNKoONEDH|O1cx7XTh?X`dVyW>Md|L}o<{EvwsK>;Bg0s*A%EZ4i%
z=1f_>LQ`{llv0>j+~BMLrVWEb{N|`1Q{`r>WWXW9VS<c?0<HQPXs@!#tARtb(3aj#
zRS8QYTOQ%6bAyv3=kQP^M0I`XP!QL$Z41a0^dyP+SmRnYm<J9w0zX`2=#;>0r=>*5
z{0ii4n~Ge915&u8pB+;<Lc|<NT8zP%B?I7r47@fwn-2h4eu@JK^Z|}P_<sF1Nf6!z
zFtyx)N;i2PgbQ(=J>LQxexxP?z=6;z;_c-KItmuRjaRov4U`fAeb<+3K^*(i@&X@#
z_)8H(%3Kcn!f+6fM_?GTnBflrt%Fc6>bd=hy}P#nkR0|tup`?1Zn=9l+-DeU<!55v
zr1M079r%}f5<s(uNm%Ku<K)OrOLz(Zj&}my2aSUEek^<QqDa|Sir)DY!Z6gNKX~$^
zh<Gs0)>;CbP=i)B4oB0;{T;CU3k8#-#lyFU2cw^+8UEY@0$kw{WLxz3e`(Y@bDc0c
zd19W#X9jZUGGzG}v=kQR14aPAixZWEyW_dXG2f&(wv1l9hq;?OI0<lhEdaDW075bb
z666~O3|ptC+&Lae%i9Q+F|&G%{;(BN>HndA3|I$eR3-@`#X)Lo=wm@Z^Ck0Fe7klp
zqvMj=G}7ip4ev!*wSN4H?HHhd9RUuKwrFAGq$V$yX0uWq9JmWqFf~uLVPkkVn1l;s
z78bP0KxaQTnNiM5pxyRJ;R4c1#4I(uDWDX7B`8{-QDv=HiO0vOh)7P}(o_Sioo%`@
zp!dE_^7@q&&L;(k%p~8ZX39=hYKPaujbveqAUojlYDEJ+VX6mwc2B4Qb}-mH6PB^*
z_N%X`^J|R_{#r`?XF7&qK&J|T+VmC7i&ok1ebqd{rwRynK+Bsas#8EK>7Xlb!F&vy
zj~$+F&~(P-CcC}BHox7pzgap-&%7i}Lv-=r%-G~#w#{8gqxHzWgpm8R${kS>f%P$S
z<FHl0mw~rm-=CoM$pM;qrpJanjE0HU-R9T8iEhl_8|0h9vGUw}QUK)hrEj>S-bWti
zRomSs*84OfCfJl}p`MiyFCavK$n}2NW6gw?DZEnYDUy%Bv&T>Y4Q?Y}8-*4OJpK2E
zW`>v_EuqaP^)k0K)%H6#Wn>{Ym4--AMlWMVTPGfb&K)4AUP*ml&1jc!?JfFG=#YFw
zd4+tYR(nQ@^zfHv^0Xlh*yCr9(yl~7t(-%33Ou?jtD&Q_P%5JnpT~r6VMtd*tL88P
z79w9C!C(LVqA!cDQ6%*rZ;=5JXd2XgQ0L22O|6e0z$N7e`915$7}SG7Co~1JId_>H
z=m_`$eXc0~l#Bq#KvOgED1E$!j%>hz!~qnQ0J2ViPDw)<2tdUHpg;qROvy8l=wj!h
zv^_qGIrM`YrSH|6)8_DLkL7*^py@Kuz|Q`(N$tfyy+3do)Flm0$B)4TsIDe1^9`CB
zj@FeZ!^r2vXI}l&SX1#Q!^9N;>Q|ycW1P+5KBoXSBp)@PGso;+ULY2;1)zZwwIVb4
zAp^&g{jypnQR5YdLL&vJG$=YFlL?cZ0hlMEtr^g?osh>GXh9ADu#>$mt2O%vTACYB
zG<5~i0Z>|ifl57j>N~UQjfpiaZ1+bm2NluC>8$X~RtFx!u`@b(fdi+|p2<`@h=U$u
z&>%vEe+dALXr$=uTd>tze9~z>_ps0gV6&1Is|BDTh=14vq72cO;xF^11*SD6AgKDh
zJwB>1<|%d7BCiZ;H8gc$@9xukS@Oy{C0dz@kDaWpba4Hcb-GA%lNaW11Dr;lu~3GT
zkl6wBuZI2>!R!%$!j&UcOHqM`P@Be(?!=(!I$0&m(tSnZu_QJQvSj*%rG{x`I!!*3
zT7`C%x8$P8Z#j+&`zSDOQH69u^f<_v7}HD{AdR1)L8IfR4PY9;v#y}G+iGU*<u^a`
zFn8c@vR{KQlxO)MC+gPdE-6aH&F3c?2@{{SEY|JvzX-ouYQ(mBTQs(j3vcI{&OsEg
z77g<6))y>xeX8UJE%vSyJ#*%rZHqrz?<*bO{dT=l^xkKQTOQ<Cp7dl2K{1YDmS<Or
z-a&>V6eCn(380;<vBEJl;Lo+JAh+LZL4ns9tSFMK9&WvtF}0#<w%VWp{li<)ew{2M
zP~4TbqNcTGRDOLy1B_d?V!1h0y!D<PoyM4C&B5EmK5E6<Y)vOJ$qty}_-f7PR>yR1
z$xUkmy-NY2#mJ1}9MR+=ZvTBn?}Jz~{!+$@Qh?P)HF}cCo>INyzpdzf`{0POy&i29
zmqB)24a+`i_dhCnR&Kz%aG*7<y$vmfRn6Yv|55aE?bY2rI(?k66T!HA{VzrD??>mI
zkFMwTUaa=Y$jR$B9en@ZVVc0z6DJu6X)lDQ8Ah!ej;Eq(9fFdmg54ZK&mB_kkl%%3
z3(*b%_GY)EXY03SgNLl6jVNQtZpBsHa%B3%AaLuB{HL`d$X(Q@J7@<Vd$VL(V9La;
zyHLmYn~tgW!f_>20%22x$y@6$Ze1oS&mpxfvXm(^-5m3F=2Qab0#hCHiIYNVpVo`g
zIB!oC%*}l^oF}+B-IaIBuW%|;hQ&2l-u;$=`f5Q)!u&hS;J-V+wmtvwo23ft=dzp5
zb<Lc&KTf61Iqe2J*Zh6|r|5GY`g7fcb8{}+6K#s7T<6%2PAa+YqgY)Ye|3Iw^NWAM
z=T_zSn7^NteXRgVF1Z;lczc(g2^V=zN964f02%8<U#AnuLK=f>ueR&p&3sI+BeZUg
z)7KRky-;$~^-c4_pRM<%U#$p#Eo;dpCuE%7(z;C<xd<i!S!BLW-E{kS^E30!saZF-
zx&Nc+$^LIu^u8G%l3TRlT{_7f`+Sk5>2XL(Ga^Xn_?t%z&K61OHtg%Y%j69O3uRz!
zJINL0K_X!|W3^OcIL_lr#X{o6<w2^1RPT$8KPU<h6_8>lxo<trbuS&&=9?mr=6{F_
z;P975_=mOl?+HK<I%KNyAPoeih80MNh&8m@^nc)s=zt_xY}FF|g`i+RBr<d_{W6K%
zPiPsE(wQc{1q$WZ#5f@HMX8*Qea%eqS%>NA^;>Cvly}~dX&?J$*Jp-7(-XroOCAK=
zcT5kPqbSax@J6I1WPH!R^6=XHoaDhG0^})ZNYTZ&3>9)A0lYbK%dMW$gD$n$k)pnj
zQbQh8OGhDm{LS_FTQW4zHjhHLlUy1KE{3Mn<zd|p$&-u8f;%WJ<gv2IOxw1gD^5?N
z?HfS_?A<`2F$sRA@-0>^HCF}a_8>i+d?WcVJ<JNE-I?asK^bxUEew(A&*zr{B{x$`
z9Y0J@Adq><lbdytdl6D&JJXtt!A{E*PJ0{e7u%D3JJUKl{q;W9D8EY~1i4}cc5)Gk
zh{44oDBa~j+Lft@cla`KWC|+XLpDUW66wB2(e!S!S(MzYaw~x$D5WF>(X#vV!uQ>~
z9h1Y`S#+t*ej&vu3MVuKAClR?7myVL_A8-ufFe^yLsjL!`}U=+<$;nrL-eh7wv*G1
zQ9r`ALWH)`)AK+8j}74EH;`P&pXBvSzL1XL4OC~UVI^2~5^M_p5how$Z~XnDI1`2V
z;a^Xd((qG0W5+`@{bvhB%0^%c1DOyag!~r;$Gvc&%HJLxzp2xGeCv@SooPuixZCbO
zWZV37GXjeoewNN{HmhJ0_R@FgkkVTbp`E+Mqq{sy;ZtlsFJ*p3$Wi<eRNb$e1xFzF
z>*|qa%Ves@fr$EuQs_?)(cqM@9~Wu2{Yt__ppiVE!ui;PbdM<D><7yJf9m|w5a>T@
z9)9|rskVSEkKsQhh%la`^u%Ldjk!R@Es7?-18$Q*1Gzusmr==V(KhKD#wqJoYGlr>
z(PjeaD1mgfj7U|1wBZeiQ^Q~5hRp8{pbEdtpe>M<+^&sSRPDQ;2BCY|4l&7oF;~8+
z*)B+%K;}FOVK@StBCe7OvTql@!fih)JJY=>sG>&>Z}z2mIAF#7QxPxm{`I&(ViZy~
zH1^j~_JgP_om8u~KS@WiDe1B3%WvY)v@Y_EZWYvJ?5%yPho~(2=+)%#E0M1;4VCwh
z(gLuRw~H#s&x{pFFVOwJ6}?+o$;(&FV*1m1$`b#~gtp&hk23Fxos{QiR)n5hAKsi4
zB^O$bEm@`zLPJuZWc3!OWpJ<}ic;bh*7IJbJRElql}?~IHH-;7d=NtYFw?d(RFMdZ
z*h+tza@r6|**S|tl<fY?%Y2eTsVg7dV(F7?1(M!NPl97FRMKP#N7A~fvXwaTjC6T<
zq%g<d!6S-@hDcTUlcZ(5cpF~UF`*b8r0clnnt{~a+KjuJ&U850O1$_oK1n{Ul@6C6
zo+z@6PZWTNY=LUsPsP>FyFYnf*3FVvzfMig@N<G=J(ogM(U4mDBXJ_uMeX9(Fvw{O
z)ZUj`dn<7K^>6eB{%Kl#v}}Bem7kgEo{Ip5Z!sA;{SiSYwK+LGOde}Ew~H7}(n^ap
zE7?sbAs4!m0JkD!=p&3`Pvrqn)r(_JOws#{QrnQ6o)0yH4|PTS1Z)oco2*%ciqEP_
zkKc_-q<Hcj+E$M|e3*We!+_l~9&0o-MuktK-k4TrY5Y$pdRdM|0_vRO8GIIj=T6rm
zLJ@ieAWHqLbSs%hs3<<;a?{_%oDmmv7KY51!~E(5!5X-oK1JOPp;CbuYwVG84K^?`
zb!YqktLXW;eSj*Y{GGHIn9gV}NDPCGeU*7et*C)K{5tLUL2fV_>NM7~LosGF<e9_$
zDs|el?QXe12d!TtwYs;l+PAF!SIVdVqoViLvdM?v(CG$4%RuhKkWhd-E|t-3Fvil)
z6OZ9Bd?AgWb@{NpneOE$jx-bsW!;=bF$_H?_=3mqY`O=fsQ*{dtIqC%{dF)pJ`wiL
z)tZMg=4tFet#w8E)r9}o6g}U=8hV}MQK5Xz?efTXs!Kl1H<jM9{4rB_%TRVx1#|H|
zPji30(NZ_sIsQM2URk5ge!1dSRcpy=rV#GnDLJRB>u*D*>omUupWJdKk+J&_o|5yS
z4yHx~vej0hqOWDW0{LIHU;-aM?l_ffvK)_>;==)g-bi(@FyB<!?8LpV|N38wURQd)
z=90Ac+lIXIH$%(@!lWUt9*tGX_6)Bl&9%o{;Mt1fxiz}V)C)n$#_aMN#@)Y$yP=}>
zj`wLb7qT=J{-fxHTke+xQ8y+L!iN|v37C<d*0X2k9sAptU%VbYG*%27;ZN6!7#s3g
zv#8_v`5#3uvN2qt6%i5G?Mm1l8(<8&zB^psU}pTp=KwP%HI#^Z{@&?7ir(Hz<hyIF
zYFG+(1CE^xiPu(<d4s_})+|(BtL0M6+#<OCRlObCt9qsA@!IQdvUtA{u+n`>{`qyH
zkY(p_qGG2|kZS>c<^fCOyEiF8SBjpS=0&y`$~^B_YO1a9`TO%u=G?g;VNX@j4xgIX
z&GsuruVPo)`v(7$RmKFB!?_D}(P~{xy4c%JoaUbi&0iv#uMw*n?Abln{{7KhDa@U-
zYQ>DnZTjfyoP6u<?3F-S(OsxF++VU?o;Ju$mzbKoywJHg`N_|vGo;pU#B>_gJHBHn
zettYGb-D+URa<4xkrIFiiR(Su65=X3o)b)d+CwR7#CLI@RkT_UPIspb&r~!b<@$-j
zrES2_T$BAOrE2p0OXYY_T`W@_-u^FljJIRUfN2(yMO)UEVLbjo)BU%CWulPIZe^NG
zT3Q>-72|jCxL9V}r~%3IhOI+jPH=0sMe>lu{Cad4JaRy5IrD}^MoW-qZA&##ynxy~
zDqp*r)cwqUH)odvW;;qYwE8=o0nGA2-CR$~cF!s=Z|1tpA%Ne^e68S@db-e^W$5px
z6qw#_?A4a3_+#BKw>*Sr$-9+IG3n~e;zSX{%i7;q0Z6~LKg=)~k@+CF2}9ihSP$I$
zovjCXnw)!(qnU-Fv`?K(a``bL7u-(c=Dbg4=<{By3qCPBI^aF!NUsx&kvEZEE2%3O
zp$Dr?$R({gmM_#ZewzYigc&f^RzlT;tMWd&LIgh%hLk1mm@&81RGzD6DV{&g=RX(b
zBlm5vF#ip4*~9beW2th>BJzxcfy^x|RCOgFdZLj5CP&FyKk1HfEz25J3Bb?c0BHMg
zR7qPo)ju&Y9RIRepWlIj!Y~h=FVJMn@(e|xs}{+TQSQ|!;+n}{9bbgo9%SNXd?QiK
zMdo)rh|pR$V$TuaXuy*=Fs^tx+aH&O*Iu9@W*8Ibv^ZUe)jHiB(=2U=fUIPz1Bt~^
z@mqtxu~maua`W#a2M52iDrZ2F3n(C^((l4y2SeK1^0{mdPnm6c1RzmE-xG*>AhB&`
zJ_~e)=8NTgo~AT*N3@~tZb1gYYF$CJhr)xPZ_n=*C7!%2X^A2$A{vslnT`#!vSqWx
zbw*1_`Qn9PUbi-@?^16_XYomXXC*QD)?E(}YsNBRe{$8)-uXL*l8UgM_URB)I+jMR
z;pk<w+V~yzMv^`h=F3;U>#&^IQI?I!wHgHpl8_ML@gMZ=$5o8uYNMJ0o`hsa`|h(g
zLp%)g5EWL<xY95h8n-`CdCBm}fcK(JcNdmz=%_FMNWet=Y?(G<!HWwI9n)w!rOTL{
z8-6iCA>)|iRgt(x^^1l|6$DIE+0K5&%4j0+Vv;;0pr6urPE2PPkax`y$ls0}@U>1z
zm-_XGE@u+Y%9W7rTm<BHm=m+wzM__RUkQ>-4F$alGf{9n=kQ#*G?#QqY$uHUS4ldC
zQZGAcaE<K|flMJ}jm7uH3KaL3LZYcMGwHhllS93f&}Xa6EUPY>b|1q#?SQ2RYF<#E
z<4m2w6{qMhDYk(IJhKjv(Wa=1rhU?cdvGc!q)~{$q~x06xC^8EKaJVvSD+4Yn>wqZ
zhQ@**-InS`zE5s+$=qkv&Q`BYBZKthU?7=@yx0RxJoX-+s~k;OlX`d!0)tLNAzC2o
z%!KN6x@X9-+Zh<LpJ(?3PXi!K0vNIsD-dnLqJ?eiihuvQK0WN!aBv)+ko6GD@2Qrm
zP!u-B@C#2Jy>UHLn=Yc@5196~5%|^w1DV4yjAPsi%MD4+O>iBc`Mjn0E_#<<bqm88
z0wuSc-Mjf$Hc4#Nk;I!=;4Wrh$SZ}!$(dH>Irmhu#mYBn>BGS`O>o}T1|z7rO&WX8
zGSp;mgx9o^%mxqVhlPQ@<P(2YTH&bYmortXmve(4MNGGp2b3)sugVl}-jhiKmT`Fc
z&R#!_&Ltg1+9XpNFYd*6jo(959KSP3cd+DrZ6KjDQicG+fE|8!_=f~2eu`d&LL55C
zn?c3m(zGJ>Mok}z4Z}Mg*U*ZK50so&rSS}cPL3J=iRB@nDQZ=;3mK_{MYILqR4?gX
z(_ieJ|K6D~z>^2<p8g47IR75oCss_J%(=zwbdvz*J7?&V#ZG=;hg7o(J394@aVO18
zJD|YTMr68^#f&S(BxR5~vXH51FmJ3s2B8NJC|5lO%ea1&I4fcFStfS}Gp&Oh-2`p`
z?pZW38`(`-6qP{lAlOY8`cDj|PH>zo9Et?6B7)>{jKRJly+0YCJFHZ21$zjCroUg}
zb>{SIw=<bFK%A%tQH{mA=5CQExTks$ss>zr08ABMp>&KB4a@#&4~hEt@yiLAl6Y5R
zy-axFqtyX!Z+lQv04S34QB$0xg&Ht~7_gN01E(uvXnA3K`l6kBYCLI7O*np<c`6N<
z@Eb78jVfIT$u0aAy(3U!{ef;1h*BQJNQ>LGUlo~k|Dj!Mg<`j?z4feuO>Ikm4tQ61
zf%HcL$KgKvxj=sd=^=eOAgvFP(l-<!@T*n=3@e>v7FR8zZV2y=3Gd<;>$p{1U6KPn
z%M;*rKE*RhApg?)x{yjhAZ5)ESltjK0`XEig@8BGr3pBG!$CBB&{_Oak35jaa2*tS
zY(Vk3Mt50AAqpr5S=XzmWKyY7H1;$qn$sm0mTMZ2Fy$JbUv{KixqfW$;FTf6H3Op!
zr%F8tudt`l9H=>G-4tuibcVHnkhHb=Ut010%`MYGy3tz|e}5%xSOhbY@8_Li<*7z%
zcHU(TGY}!dY<qAb;(9tNSP@|mDF6%;&|{hv@O9LOlN+e@to19eT4V@cFRtyb^f5ve
z>xvH`dg0tx1{iYI(OD0=cVFBF?|A21U@A<_)!7zOb9gc!--M2u^7@?V$q65nJRnjf
z79Z~TdVp#cX@m@qv7RReGV8=Yyxxc(kXtczj}z-GcraFhmmpO&JpsHE_cpLa4}a0z
zPhBY@0r;re;;eBam5OdCK6=u!;jWe41I`jsawjHSflPyqN3+Y@u*pzM9%o#M=kGDn
z*=EzZc9&w&+fAI5H)Nn~1sSs*^o^;zj;%9{&xkq&M|0sgw{hY`<JiM_;|(T;YB9t0
zdF3czr6+|o4OVQylDh$@16VSB<x{i*c6p2wM(XK?fmJ@&>MpOhRLu67-_t!7wxSZT
zmK@UDGWIGO)es;h9fPyRu<&C8A(oO5Q;vMMI$fVSArM*8q9r{NtI<}Wdr+oJ)1cdP
zU)K)1+bd$&gv_4hbNeh}`-0dVZswl$bv6}{d~u}+Li{*v_<{RgP?kn6ID~MD8<h9U
zxdTu=z_FS3`+znQXT_9aHvHe%Jm^6y9rsf&gN5)!$p$bb;I4)igIb@c9g6{qk<34{
z&L)c2Xc?!P<-sL8q|pha0+BIM4QX`_fi{YzU#w~BK!iCk+)?Y=+hlBx{W=^ZZ5xoS
z1d#2(pg!aW)>DtYL{FQk)~Xh%Z_H=d>ChNIpd)Q4l(-dlI-peh$V{B1xfqzhWS}bz
zfgO|JK(Yr15S15jC=y$GYB1+kp*!OXmG9?zV?alMKfCsmb<qdf1mJlCrtJYx5eN7V
zgtfGgA~{^PXEmHr7;!5+pR2uS(Pbb9;MQ^~kc%dbI|_4~fON1BeyU<4O#o1t_9JLN
zQa8a7izMnqDPP)w4jr5>M4Cz-lz$42RZkVJgi~+(xc4EU>u6yp>mB0&dg)-gHa~6x
zd_GQkwBB<#q)9#`s1B(QCBW%S-;BQT6H*7NBC-At95`pBIR=pocr>dc#;@ROzy7xB
z9isPiqb&=VkA@_`GgQtubmKZWNZGIQ2GW}6v6bEC)uOIlbldU(ntw2B_uF*-#<$m0
zM){RHHUiE%2L|lrKWr8<Ew>Awf6F=N99jw?Lwp3Y?Qt3%h-$pKZ3kf5X%KARp_a&5
zwTsHKbiJip^5NV{_Dt=v#eV&|(E|NTz1uchV6eo!8)OY!iEL`s_t_dq-MKEW^zbm@
zQf5=I8k#d`+Q73Br*VL@sBr%g$K838+YaC)7zLaTFG=U*crZk+=xA@$V_@#6ufwt;
zbBwrH$8iUTrpKg;gtbyWCU-p1<8WnlC<4+tlBl-b;>W=!ObdzQ(~K|BL0P*?Id6a@
zXF5lW+&bW9^6WXU-bFJg@+9~?X>E{?Bsq!m{#?!B@Z<}|U{=9{nr7f%D*VidY>LxO
zzQJ|$x4|;4JG>VcZeytB`j|1okwq9J$AS6$SuXJatPZ!^oRy0|z^V3xC6@5gtXazJ
z)#>t(F7*eM{VvxeD>)6LV6+Q&<q{nj)Y^2B&D+g@HAg*Z!x}boAv+Gw1o8puVg&CZ
z%!mPE<il!c2u!!H<vWz;e)*J#?2Q#f-}f~1B*`JbVO0|E_w4%gM;!$tQ-x3ZhJN9G
zB4^TeQMI~>>-to+x*Q@l`VdY7JU`2vjyN!#wM5sD6xyXA7Q273JivNZVKoDyT{aNF
z1Ae#rdDnk0YXOz64m>+lV0i+jvdhxhDiUY~!MOKrd;Am04YU%)qAkR|I^|uh@Z!Sy
zIt*Aw*L}{=XJRJLm2~sPN<yrb4d@VIoJ1I{n#>f}?PD?-N}6WLTZRldY(|cH)Rl0V
z<!8FcOFikmruWIBc4v}iGYbuUkGq~p33CJ4SmrdMfJ|*zz6g+L(7uw`3;oDRg<O^w
zy=ZVkh_z|dt<l^02lbRvcD$cA^kZL`#NMniCG&T}II&$9D#7q0fTnqtnlF?LUnrUX
z1DkihFn=F)bL8M=_ksD#0kgFOi%lg<aJ#OOfg<Fu<>d=2p}*E&qOM#$bE)>5%<a}+
zl<ahsZROf6{oCz>+Re<`ZGRrv+eSNvD&Ndkc8pZEOo+C(RCap)*XdrnW8~jkf1)%Q
zq7}#6t;E`$KD0Zn{dIm6ZN2%|ojS&KAlfCR-D6E@=JNn+qMdf6!PWy)onxt!Ftjf_
zR=432?Hh@vIyQg>t56hSb<rve$2fL$jAA7inSjv+0FgBY66h;7ufsR?&_A>TS$K%_
zi17>UxQ&Ym35^MOc<6V9<h?u$8aecP-w~Ri685XZ_ugT|QOs>k)er+!3L4eGCx?Dl
z%wDKU@LQGW$c|{2m@pI7D8<<5rH(l7moe<Bu`V64VlPo2RN|h;BD;@5o_8cgqIJb%
z6L5#21203EU;5S<DDoV|x*VotzeL}A8NYNC$$lIorIuv*GKn6Aranr}f0+VCCF`ms
zbE~Fvt5FDariRAgEMI0k>D(HAXEKoP`v}cbi=(Rr<o$$en1k}xj)iLt@*e?MYcFv;
z5Orxa1HvaYR>&*GJyiau<J`^TJc^V2qbqPvPoon}y#)}g9bno5l*s96M1e|habk0*
zQg3y^qE~d=SjD!udyjzkHNmC#uGqY|l6>|157qB`zbcM=b?@G*l25NnYt&1gsNe5a
zFMot9zo%Xyr}5w?@k-9C^0<=rPAaIo9^6xZ_$W@JDXvtit3vU#oLQsN<g_+2zV6>E
zYM=Ph(D<t7agTAY8u(8iy+4taj<3O~H-WpF@=qRichw%nKl-B4@Zt1+{%OlkVokor
zW9EO4J-XU{s+At0?z)^59UT`?oDkUK@-@NI!f_hXaryq5d7n^(pKAGvsGOIV|B#L`
z8iU>cZADLu`21hc4?_2AlPi>Oz~ld?=sf}trq^h3%nx>(4CQORy;Ag;PyF)H>?H=o
zCAFGJwBk&+dKi)Lwwq@#k!$jdG=ip{Ls9i;O<yT`^oe8C2yk6b0`cFprS?bev-b%Y
zo<RV`nHupEaq1E9-A}Fe?=|PVwdupq>;hU-DX08)y<c7@P1|BP;M!kPQfCIV7dOv)
zF3)6Z!P1qzOMi&aT4KJxHbX61Q9z$I2TpU)`)MihT|zfc$-uj##2(yb($ak#H5xEs
zrZe#i%TfejI7res!%!CiSc45Tf(;51^r%?0S<m3#yU{#FXlh5TpO1+2(m;l--d~q}
z#LzrWaal)cocE`s_yz4fx!2Q|iCm+4S2u(1{e(YRLur)9&{|;>bBIi5q&Z!kIn4pt
zFd|d=p|G9Kd?etzEs#QB;P~F<tiO70KAO4&EEoo$Hw99RUYy$k|AFz@QOY*8W&@ZJ
zemeLxY!#kLMS=M)?(hP|=xv<KtsZl5%;;lUAauR>tO1;%dsoV-BkF|7&%9JIVD?2E
zv%f_-p-4&a5%ZRL%&i47<#?6=n>w>nmFQEJz?*bD<__)gtd~I!%?{tpzsX~>UPXNo
zwdMp0R<P4`iwj=$K9G+gqu0<ZsSlb<XQO|1lRf;?*Pd>*v+L=>E*iW7gZs;EJ0sA@
z4LDR78FssiNqPDl5gal&*j#h{o=TF&&zXiNPA@}l(%cEUpI1HBk;EMv^0hlWy9&#N
z3R@XazFHTHtJPVBre`W2tNd<xlVUvD>#8cqD(B8n`o-m`+z<!PxbIRP)L|v6JErsr
zOr3Y(ww7@%_;#r*h5vWgFn29=rBw(Ife4bZ$$bf7b)C3_uq)dvyL<X7wUkVzhhcz5
zc_FMWM(d2h5NyO#V3^ajpDpOm_F05%ztZdxGu^s)D)^Fjqkp`V<3ovX>h+#~v|4mM
z1aONIVjVHUHz7evz3ysCD#!I4gCXyD`pv4jf3D^~?<pRAHYh*D6Db5y*J8eTcLAEt
z6Cq9MTW8z<RG4QzSzT;G>+eG0`?4|#L$X!~?~L&^T5Y>0%yRo62t$<PPopC>gv~YH
z{m9{RxwX$5CVf4Ur0l_K6+hAkZ-l=iv)`@(LFfYEeob<=VR`~);p-970`Oy4DhI<k
zt0Qn?yKruSOTmCGWfWs8qPxE`M4El~O8<dZb1$3AA{A#5j-}`P@Jl0>_nzw=wXa*Q
zdE?h}YNO@6UJAy_U|-hgHp~r`{&@5C-qPdpIH50>Xg8M_5wne|x_7hWW5&yAyvZC5
zemyr<avg?WajfNxFuq*M)4n(s`d$yJVj<krQSY^bxz9HwNIQKf33{=DFHCmq<J>H-
z!Di#QrDr*|vek7;x2li68nfDODVGHx$XE?F8v^cp<NFd!vi;H2u2Z;ag1w0MevDX&
zeRi9m=lATzNB8?X9bc2VcRN36yX<!D^tpsQpBldZt8Zua%P%5X=>1*Nw~o=Uc3=v(
zqkq@xazP^+>HqUhDDyX}MCqmS$c5z_EB<YmKF{*eMvjDqb3V7xs2QBS+y3lWYQ^7l
z*HBl5*2z-C^e^ElQ4opXhuTMtF~53UKVR3aAG$2kxYx{YA=uN%pIrXgpZ}4*f>+*V
z?`5CF10#Oj{l@sSyCW=b)XB5FZ#+aX9rU`rK0lhs=bt+G9{c(%<hQO}%68<ES_nc%
z;9F=iXnW~|p+N`e-h}?DApl@@e4VY354HmH+x2^r3ki>ldS+nx%e*Mf)V}dK%7f%o
zI$2QbM9)8A2Grhy3Uv68L=VkjA*u`-|MC#?!V(U;k*5QE7n89<Ow}hDNJF|~h72!f
zua{+`17d;-83r>Y%zxK%ge9%BIU)sFULz|dup!wF+g_X#9LBlrUXl})Fk1^xh~@=E
zY*+whd+4eC$b0~L12w{v3(6PhsiZlD&RuG4F{By$<P)SQi#|n^40t=5qa-q_F$l)u
z(XZ$`dfn@4*Itc*qNjNt(uhnNJKa#BqPY7Q;vyw-{APLZng0{WXQ4&-8?O2NVmo-c
zv{B}ma~||wB@3@yQl^#<Rbh!ob~%+`W)WgkpE8EWhwrH24uS#8M(9Zs;UZC`FsyMs
z+cS_o_RNfhgP8tprBgntx)al<_+T*@B3vC^XwCto{Rqk8a#)eS!C+7+X>IgUa(<H9
zm;fe9)8^MtXL-|1-eI^a9v~h+kgamS!6jp5B9k@sJ9S2io0s;w?&nEW^I%<wSL1bm
z37gW6(HbSzuVxeMAAl1|H9X>m`nXFb8le&x)!)%fzFYm&ism?mM`~hhJ}_#<;{hgX
zBt%T0AiriqpWdd|Sg`g7eQO!8$>tlL6YH5dw_MB5w+^um)dxo(gZauD@Pg-4^fza!
zE&b-|bx+l+sFLKY45PNL$2roeBc~rdnt#tE(c!3|a`@CPqbWc%sL$QGBcmiWI85V9
z^Lyvnj67bMup2H;lUxd9-HLTSAN1xwXehOpehm(APH<V+m+$bkZhRg1bAHI8utj|(
zo$3*Z%5)Lm7$^vlyQX09;<N_mC<0S2S+Ng2#<7VVj7Yrs;kM_D<>x;zkzLFxjP{9)
zAIr_u(O;$y6F1<&0Gf0`u-r=(gtz6H753R#c((jtfQ7)it7bjOc~YN*?w+_Ire2vv
z_%TgdL$^Uha#*Qc97{RhU0uyKE2H;t92ClH3$Wl>W$C7W^iKL_w!+ym>w7gpffj|p
z5yrKZEc|e5ZcXBC8x!s0f&2y6>+I4bYGhq3VZ8IP2=XaY>tlScB&_vDOOLxL!JD{t
zTh1cF6C!PwJ1QTiN1wJrfAav{YC)uspz3-g+quHEPDtew_%4l%3w7zc`E<*fQ7@9X
zI>Lh?vw*20D_P?u(=85+*>>*oW^+uh>m4{qYTq^USNm{hL#al0XW4ttF1Y4<R1I(L
zQ>##CsVB03gRCp^uG?Og%}B^rl7HYSjQ3&A*T`(qU2eSdumr>Li`b884E7a5oHV<r
z{CwWqLoeL4#%0W*XmN(Xha75%CJ3b7_)NGJ!19yj8PwoeTf973s0B?^NV~|_Bk`N=
zMs(?=R4f}ZZ{p1umQFVSumAN9r7Yc-0*RqWL#RE<V&SFHIn@Eh4ue*wzz(7C@;*1S
z-}#^atq5lx4@xAHOk7<HUs_C!YRayT{^nYc#o#+~y=WA<2bw~*Kx|wq^zPz7Y7!je
z5c>2^l9eWV(d4zsf8kNmQWeZ5-|*9zJM^p$>Kn3+h5}8*T<2qb&V)|fL{@aZ?2M3~
z;*-)NP~C?+LFT!a5?k^nJgTe`MY}uQIh707ZDQ#bu9V`ue+#OsvBXW@-2|~7W19Tf
zL4TU+R4&R?3LUzk;>5kAl!X=k{HLS$@cU<dJ&o${iKdr$9*mu&?LO(wrl<)2(<2I}
z+&j00A^#3!8u1%Z1N7x`sev-V37d6sVDU-=D$Y-)@%5{Ut6~?&V@u+H5>(;`|Hz-d
zc@O<tahaIo$$#>B1bWo`@W}R(mp1}>VqA~Z`-Ss36@a}y8alR-s7*QN3V8j+C^2Vx
z^MS|#5&A|_Y<m<y&j4h$0<sf;jC<mSD-CyO01pNE7fB#F2C(8JNF7GQ5D0RqCT;x+
z5*1xKkR!W9RB_r6&kg0hO$p}~@?^INWU0f6H{^v-5Hfqh<<@($oAMOCRuJ7c=r;|!
zaPvvWHi}RN^5`&fZrNa)yx(2@(4`PZ3wlBu928m&d`Y10o&*&1UzM6Y8YcYJE9`;T
z?Z9ehLVx2pk#>oJZf%mLOMs9iD>@6L|D-3j3!|Ts4$^O<lzW1%gv^SshR2IC7>#8?
zf5*@jL@_Dkl3UM6_A|m1n7VzLXs4w3rkGxb{+fn8OCFWVYon~lV3et5(wt(RpkR^F
zXL*EW`PWSK{2lHzGjb7jpYCnMI*Bn20S(584z7>|3$h{Ms^S>tvptbr(w8$dUYf*t
zdA{5|N}_E;v=r4bwgG5Y_43aIXs&q%0j8K@N4<Jdsn&^{cEb1U6ms8K7fxF9y5;a1
zyybnbz<XbA&ym2Bu+94`oOko-1z#1<xHTO@Z<RcR0vygyInDnqoX_&60Ohp6kqm6}
zHXEsVyyZtijwIDaRir$Oa#~&#|66o+PvuyT({q)t-&|yTnQd<}z6;I13!Fd0&{<&k
z7hz*QK%RDE9{Yl%p4HvON<mEp@tqK!3?>1ifPo8HiR=iT`w`+*5j?Q0rF{j){Ar21
z5fV;glDzrHvezaK^-@>gCNPnpTZqU$68|2F*-xMI^D;DTir<t(rKDGIpvQDsUP;qQ
z;^(NMmBfgwKBEDx$i0FwydcVjdy6>r)2s&ZbrJ7dK&c%YL{Qgw)GMV7-ojL$ucDw*
z7$zlc+jQeXB^-I@n^1{daV2{NWg{!;Od8PZiG)K8-MmcDX%+n`T*Q1|B+-+MV}&`b
zfCWipZ$dL(T!Xghu@92?YcY&igb3PJEnR`aN`PS(uEAL-a!#VT2IJrn?iyWroRh`u
zPOq3`qi9*E{pEx960^>ltq!lGN?{P+v+MLO;yl}1Un4eH<w>GgIMW$MIDtrIs;7DG
z$!dyb%+eQ0^VB@ogHz6E6c%!C?W=G_ii}q>cI2=_Npo#*kscDwWj|5KUQqioOnbA?
z$YsXJgT>f;X6i>_3zr@ZWn*6d^52lO)(}C+nGI*!Z?ey5mMwFUA`+E8V&M#^e{0p`
z9A<hBqj*QlBR`{}^g?7Uh}UnFzXZnUfaTvp(Ae4qCfgXlXSw;o?&hZ`z5t~v8%s)?
z2;3GC8ZYZ#y+RfLLNp%EJhMWU_LSyLW$PIe@vMre<N0-atmXNPM&ry4U$9y42kDw+
zv9rppRXq`DJr)P7dCjo-Jd2%yy`9NjyYGcyi+qdl$h-|0RSpsCB+A{1=8X_!GX;<d
zdvg3<AvnOTel3$Bm&p!;IP?)@4@mrhtYjQj))Gppf**00+oO6BFsex+&8{ACH;2w*
zhF`<pU#H#fHLL4@y{pU2%_o_hIhE9g5qZHDl=6T5P;z1ib|TB|s^0p%ESW5VMXI|%
z%3YF&XEjK~hj)@j<kt#Iyp7R_y(fFICwDRL+q;fF4a)sQ`^><N&Kb{xD*85KRd)es
zUL_fuqTW7<_6D1Gs33>AgS~dN5$~+82b-UF%%niECC6AnOp!zg32M<%c1*%S<q>-r
zYI8lk8Irngm}-x`-@W31`-i>(#g=q|%KKIJud`c5fs{GKz`}lx7Hic&aKJ;8fQsVa
zx3j@|tbs>{ZFX1==|YL>JQd~}Y?JMO3H{t%0(4jJ|5UOtG6S;-!-v7(TVWLJIv-Rl
zA?8jcD{Lqjdx;?5vzWF!W&phz{xCK%a~4%|40Ym%P*sXBO7<v&TT!s7us`eXT2@&0
zX*>%-GPhJ;*&tIppZFTuIr)&-JlZ9+^xQQ+Md-vvrLd!L_f~JjTB0zVJtVq9FWs8T
zkPkG3A|ky5n^+5p{t(88_2h?o-nUpGmVo%xiera5d{gfwzWtPFn}hl*%(pn`R)}TF
zfyWnS^9L7gU{`z30JfVeUuGgC<}lP~g~ZF4#P|2E@&vT9XwqLpmwWwmYM*puNPsvM
z@qHL$Q9;VxYI>pydgutPIftWE!zkdHFCAj|a^M#E{fq#Pg+-uD_Xlw<4BZxy+rpDC
z14w=6llWFNPW>2{FqdwmikI`jyLtUB5#-(zI2t9<v#Cj_*h^TfFc47buSa52=CWEl
zJ#ohpY9tOW7!MR^JEq6N1nfQYOgcw1?_-!9SJ=(~n<XT?gP`B%<D(wWCnYG+ndq$0
zn!I{=`cY>r1xGeTDS_P~yQ2R~S0(isntc&Qbq)4qAC|hl&bEtTt`=ZKk)RR#uD4e2
zD8?0z!KgA;SY$Z}Q$GCSF<&gy6{*$zRsbLY1Wg|~gI6gfcH^oI>eBO;1b`%ocOM?w
zsX{0hJu4ndGWX5!=PWy2S`;(qjq?`~g+9D3ta2(dAkm=o{AJih7cexAuSEAr(z*Qw
zxqx(%x+iYlw-f*XASn9$Xg~mfxd4(J03g5m!KR*hI}R{2?@9kkf_$9*z?^Lro!TSG
zk0ceP&+%(8jWta0b94#8^ytfT*vnpu`mk2`_HzrXi9efw4#(9*)@Plo+s)5ctjs_7
z&WYUS1fV&+wJIzA&DYY#l_(olQhsI<hw($g_-tDBn@p-7aaO07af}n=NA>c3S6P)x
zV%vdSbvM}RH+gHR9-qS>@2)h+O!}>2n0q>jJw-fBdbMs|AvKjrCS|o`uj*g3)-9<c
zhY@u@<Ld9PcwKgp>H@l&hgd611s^?;<Y|LbhE!4iFm!$jXih(^YLu*=pQw@nQnwLl
z<(->%u2Z65JPbb?6j{aOG@nz`&=v`#eZuhfFSF$6Q67`%yWsTk`lbFLnS!oopW<6t
z51Z}dAACQ3;2*~WfVBqQZw=)#=pl6W%8PB2_&}Z1Ta^#&1Zl3S9iI4C_rLIK#EY~5
zDI+lKUFi5$3C4a{hzFLxf3Mv?!S@DN=lg?>wfGj7(+5BRNOlAC`Q*U|Zr6X#5?L;<
zx#h(!6w!b5*t!6;O(TsVm<XUNv3Z0Wly%#8dTiFSG62I?G$*>Dmx`Y4;U(|g;Wqxn
zja=7wdHFS=KDLU}wX09P-0rta(E18h{}CT~BY!m_z6(GpxIXmn#_)t1Rq${;*;vj`
zSihK7k7qykwkf+}kEaUHkju<~GWnpBv$w1BgIIVAC8GXbqMf~KP_SnsFpRe!LDxO@
z*lzXhK%&SQ;Heazy{(dZoX9PB#wLCy`euBjKx=HC>+RHwF~yCs?_HqnIG_Lkz=Qx=
zXuY4ed%LsXe3<Y$5`>Mmn*tk;(evsY@pzvu^eQ7jyYmnHD<}V!O@C0DdcMJmx;ORL
zMQkf-R4B<(RD0&jhiN(T4>ddhB>>$%7n{!c$B$7nb)vXOYCINd2Hz)xoGKh$lRjNn
zoV^_JoK+ltpbTjJ@(MVt_o?vQJV84!%abAJT!Pr-^{UsB@bz<d#Qc3;?*~adN(caG
zx%f%af+x$D=z4x0j)elOTX^f@l;Ofs5}$QE$Q-Z?eDG3_2Ly6o9sz#s)?1Mq{(4g3
znyR^^n3&K7pA)*!Km59)$yoROexE1Tpn6}$8uwS_`V~cYoi#WAITE9EvP9QJjnksO
z{Ng%uK?MbIBUA?<3!ha#-?*I&8eRbah+uR*FgSU`iRD|gDCGsmMx@}~T=b7JJ_DbN
zttajkg*yI7gCF@I_KCQka(wTb-M8=Y{CwS42Dl!?UK>>R;K#_~PD<x?Wc}NT<iN`u
zVpZH)$e)hyUoLk3_2Jeo{IsfOzVnGsMi7}Hkw-e)=MR44IQN`3xcf@?qOtswL}=du
zpZFJL8|2TEzTdhYDE^1OJf6E^x}uJ($+)T}CtQ59YQ<_chYxV6VBwG6(jkUp^(KEs
z_5##gQ*~FBkLzW^35;WxRJ7A`80v9CcI&{&k28wDWz}<|M@DZKbLg<j#&z#wVaiGO
z!{GZVzN3J|Di6^^7;#6Oiba^eAH7|IVZGte{A%gnriUMi-^+bPX6#ZlgS7w0RuzEF
zlh(iB`kH;mH2-xf4Yx)jRH1q>lSRt8CqqHVh>mAC?hJaZcC<j)tV}EOTHWQFyV5RQ
ziIj@<<E2VLpL;SDAHA!PR}Va+RBD*4qWPU9boxA3uGaj%Mw0VyF7*c8lZxsr<tGmH
zJaO^oR4Pq#Pkr8&X=kf6n?H2<(v?JAWCxXcvi!L>TXju4D<S=Gf?BQZbxR;Mw@!}Q
z)77CI?xS@9wQKe<t=s(xF!kqt^(QUrG~U62$eaq@^u-)5Nzaicm+oX*&5rH<VB0T!
z8FHCloqaiGeYY&;cUJEAz6w89_1e!GE?`cfi~76$eddYF>pZvc+gl6ltC{4g1mWmY
zjw!_G&6}0G+xOkgibf+l5#vy@Ke72GrLn(Go1goPX;OdfHy2zVJn}$O7hHk`(4a*j
zGr?j);ZpLsi1@Ppuc6I+g-;8sBLO>KMcraVA7prCNw%oHixHwr&)1zAoMV%aDw@jI
z)l(Xrh?l!)xX1Kry?RiaWVkXcbE7Gen(M}--iXGLt9P0T^~qE!-wmZZqeb?zO5YN!
z#|P-SlI3yaiZ^vQ>+U(MiU}7Sg<%=wjQ7C8fg;aF{U0V@P;T9l-DsRweVrI-<gQu0
zDO8oG4_UqY67s=F=i*o|TX#ZvefWMdgxOOqS$ZbG;FI`DuI@PEDS>Ys8PD@5)HwdT
zOu6`aKGPp9$@vGE3##C@evqbkD>m*LgcCLN3@dt31heGUGxZK`uX4P6Mi4276prfG
z#NpBm>fCS8$-E#aKGt13eQv?>sA76lKOm5+rHR_@zKmG;=(EX^kK`La+d%Z@VWd{p
zf1&OV4j4Jqo(i9Zs<|yhTC)F%<~A?57-Tle`$zZ@@M^POGi2yY)+dMaUxpV%fjf5l
z{m73#356lHUtfN;Ff6gQk#sI;q9)y8J<r`XS#n>v<%(B9hK&t9)BJCFF%CWXA*t|~
z|Jx!~w$brlVK$@J%bt90W2NcQv1F^;?c5&hgHbQl{;h>hhy0a}T8#fSab#-vrT4jx
zx*x>Sw%nXd&F0_exXgpmvGI9>BlyMSYUXBY>{40iyOXvQ54sYy1+`0iV`^b@;dp~R
zya2r|63aI;_w2nz!cNChUc&Cnfjs+-ic7l0J<;TM-EKMCzl*dUnML&&G^^en9UJnf
zP53+Ok>5M_LHAqt-eL-UviD%<>${q<MOAqk7t4_pYQBz)-uZ|ZRhBY+NG~H9>VoQ2
zHu`@xT6|<)$*1!Cr!%**RbEuV%ECaWXP&xe-&+Nbi27-x=_DHW+Ju##l@z+-#lHg>
zBz;jN>bx)rAPr5fVw0}s5JusFM<)qSVqFh@(=dq}a1J<{0@(NaIo`G5#muYJ0vSPR
zGpl6noda>ZRs-D5!W>Z?RjjRZ46I?x90J?b?5{@)y~E&Sj!Kt&`-vQ&zyNHLv*Reu
zFM@sw0l>Ek#c&yK4tzUVqq}`DLUTT)m9{06N&OW2{0svMA%?>udouVUtcOj#7@#~z
zG7h=SG4p4&tULg$@YntfP5Je7YD$pA?2++xX$aZwUb@C-ICc?Wm0xe@o1;HZ(7RSk
z!CZ@x+pWA|*fA~mo2aj?lW9I_y-!;fT(9`>gq)5=u+$lr%6wLp@1#;o8%P{s)CbTb
zTBdndGd!TruHOiWXD+{J6IEfaew%8lPkp{jPI(Hm@btp7eXp+9jjgAmgRhiAWE$8*
zi9q|aLdpF~615e8-sTj{Ed#}fx(noLLzt_dpfCoPNy7OIO$ZE2ySOoM%PPamw)Sz6
z37sjzIt3YZH+3L`+wjF?xyEB&9#f273YFcjOshwn1tZIR)A_*`>v4?Ne;DLQGBz-!
z@;J7!Sht=E-JnxyaNT*lSS>-`bn%CU!0^PW`$Nuyh^Z&Rw|^4VrgNU#C<aC}|GYgY
zVD<7xbZd$}(sAeXdMKV0j+SXcpxyxe_M@NX480Rlo2DDMVdHYAIoN%=3~Qnk^SnHX
zR!p7Y)?2S|em8hI(z5%mewg9YirdXW)XWq3YPRgw`^~o-tDWf<h<93dnnPbl(BR)3
zb~xnlh3CI5dU41?)pOn)`H;HM8;%jGG}?tqp)U1)2C53}jP6A6Pi5_8#rCYrw8p*9
zUOadl+q-?cHDQT*>G(}--$8S0(y#2LvmaNf|IV)@{@)p@wdk&tuOZ}($YqFkEw5Ll
za5O*73e*hM&(hMCDwnfD6NDPz*=<YLrCDXjMhyzfKFzeuS!H=rA|%OR;KN!@GU-PR
zvjn6|a?#*<exgRScAw@)k2CT@<3<f-pA|$C3;3nt#>_9m3HdbN1jSyB*|l8Df5`Jq
z+H(GltNXR$=RDtJV&lf)8-Nm$wBNNSoKS&f05mYnPiO=!B;@$K?917P8hhM3o(9Ex
zLjq~~_~Ky>=?w+STx4h1Am?}FiyD5~0Mp9>uZG?=c&%J+z>O!v(<QqvYLvgS<e}nc
zz5|r4*=`1!TXJ1PdxlwZR{St-{alC&kETNK{&W&^ZaQ0NZ*8w0av3?D>SD`jNT&_3
zO)vW}dZF~>H};3$TjzOwN|ly$w{3?t`?<z<G0iWNZd)e&`=s96XgiLuH<=J}SZ^tA
z9?<>~?wtpYAjD`8&bH&ebWhFjWwqDI{Oai8o(H~uOI)j1ALVgfpbS;DZY<laf_s_O
zlTH8EsfE?M6}+=rzh)`tw^{D_W4?nPlf~e~pno4Bp~o+s7H{8^;#r`fc;%zT_Z=Il
zRqEqQrSRsB)Q!&I&Efu&y68Oi0{ZUD^#W^+u@x?knkUX1a+@&|0nMC^kHFu_ADv7!
zS{$TI-xV+J%-79;Q4j9m*q=>u#vZQa$1Pyl^19QcYuOHWkx8FbmU2FrOhk>HRm@=W
zyFRrh{~1W>{dHeK<I@wmUn85nIarZks|5zSh&>^WqlRkT#qivquxib#)LnNpJU2F@
zKafB(us&ZCJtkHmBt8<gLT35TZfS8({-MSi{S%ZIPWxxpy`)bGum7&R)+sIGy&*In
z_RIx-2UcuqAKSG|{(hmK_FA`zV9T?_T{ZU;*!$j{s=P9iNBj}dq;D@pH}Xh~|Dr*?
z^Ed2$Y*YH>!&(uOnAConrZBrl#7i0zWx+4~3?~fa<ee!mSHh2Coi-=}wr?dL%m%Q`
zB|B^)8MfHyO_OseLU>S#FGaDmraDM3%D2CnDGC_KR%jgsU~+>07kl>|)WpC34S&-U
z5|X7?Av6V~gd!p}6d@oAC@LyKC?W_#5D-Mf&_j=ch=LeE1r=$cfYOOHktRy95Q_Aw
zD1wxS@A;l{p7Z?Xp5Hw8%sq4e^ZRFKXLj~8vpcghyL(;N`-ROVqsKW?P$O{nZ}DHN
z;bD8ilVZXJ?5`#ZMu`Mpl#{19#zwW6pItW>FZvjzQ)#nG!`f5f0_Oa)^kWx|@E=hE
zWvqy!Q*^0;$mu=d2j!#q7-6nx|3ev3#S<}BQ&GB%lPh~-ZkFQ%sPGf1qN`;5bu=Sf
znBmSsIR?j8!=le+h+4+R++7Yz622~5z*rWFR&AuZX-eM?W*j(&3vK1cwSpT!JTDK<
zhZ>*Hh%fMnb}zvTm2TsU2jWHj2qnTXnewsZT!+4Mm%1AmUX)mZR%{a_x}hM5{N3ec
z!C707K!9M*QbVkJuAI^4S*60ms7YH?%*QFzV`IDz9g!Cll0-*%fP`jhk~0(2s_mb_
zNO<*Ix@sz+TP^X9JaVoec~#rE9nG`4lz7C?L%1P@+ZkE06d&A+sHPFzIqH8adQo!N
zX-3MkU-F(W66S6s2q~oe{4LX>eM53hHH(T%0`XBLiB%jFvn26;5LX->{&tExsUD-l
z$Gl;iidDPp*N?#R;07WP)k`1`=B7y-DCn7J8kaV7Jn3vVBCH<U3?e(~G43U5_Ebzh
z?>1o^M6hXG*+Hq{%eUN_m<F2UL?zKq1ZP%{Ns~#lm`?Y_-1b`oDNFb;Cbo<OR&=Y5
z)3~N{6LYA@Y8uvTNzDl(>^z9hrwLRuBkf**U#UoE&gF{=w{Lmgx$T+oD1TqDr_UCM
ze9u8`lo2dJ0+WTRrr%9>$+*Ik9$bMhJxa`>pa#mow75IC9zuFQ|BK+vn(0iPhj+&5
zw_$!EmfeJ0CVGvGHUkOk;d{oJGEd`#o(+PwB!Mv2?Y*9u+<NfkV5T#O*c|uQJ#Z#H
zQgjjYBZOz0<XkyjN+_wkDZ;a}^}C}MzeS7>QcEaq&E#nyl>EM4cV}C>A@24n2Wd-(
zhg9Lu(&2@ylyo}6o`Zbi2|uAA?0i6L^#<0Kj&!FH9>!h^Al>0z%VdHGvnBpzDtyyZ
z%pp~z3J4H@5F>67I4z(heJ@XVp71ih_c>@r&b2F5{3y@$hm{nzq}Bi;ovD{QSSWiI
zcx@VW+*NFS3Vb(^;(G(*PEBeiDt=@rua;<ql?biXW6pxN0;f?v<Xg}uMypi1SPS8m
zg2*Zz&VMXnjb^mfBeX$Q%LgCSifD23;G)P_b${;kZge3nq{@ak(8x6oav?_vWmJro
z=;PFQ?YO%cnLG$BMPX71&mVIB<q__vL2y=q=gEa_9?Ma%`>{Yrw{@Q|zPM7&aw+z~
zfxG?n1c9L4$3^dROWiwt1Jm1tE3Cx7MPryHgts$<LJn$;M7VB*zc}+K^){j4H{U~#
zcmu@(`Bz|dH$wP!G8;q$(2=$!S144Z&oMRaA%tBU*Vk6CvjDaHM3FM8Wp7LHdXH$J
zaeI)orFx6)mx{M&ip$~JOgbX08$ZNE2XIj7-H25S{)TR}kIjjVdafwyzGWg8UnXG_
zAigITBmtO)dIF@Z@TVtFKZqnv5k9a`<=tt2z@5v6OQ;h*TtL1*kICsqlv9yOoagU_
zaPF+~fM}KF3%KoYc+PD?%iYwn`t7t07hDvL%bs(^Q0ghpD2e&Q9}B@WFX7EVR^5!C
zw8hQc7%hdWn~U8yRUa#;Tcn<v5q#4QcGUZ1S0yfULL9z>A3~l*i`|ZlPo)5uKcYxW
zn?f@t!C8a(APzxUx)vl|!I>f4x>~hCMOqTE`K&5yBa|hGdpb#=(3QujaG~?Bp0=o&
zvEY<Zf=bnk0O}s+B~1z^F2)t9f9gaW2W96X$9D+NUQ%0h&O3&wUZcVdpQ2dtJag?B
z%2K6eNmf1;W4WYhOT_-9ah-`s6}SL*ro%aVYxDCn&QjrD>r?E(+8i?avl!y|b9_D>
zzNhKcl3#T0Q+PUc8~!zf#|gXJjHIyJ3$w@dF@gs{9t1CZ5<E1RW-W5-*r{75E$*If
zyX6>HaWSU?yHha`#qsy11X<$k`3j@FD)%O)F%Ipwt(V(-I_U|t%9#(pMZ>NUbLM(q
zX?B3R)%a&#@PV7@_7IF28TAo`p>PNR<Xh%hY~1qW{qcydeE8)?!c}2}`y~IV&?eF=
zf*Fyk8m!p@FwXT@W?lw%<P8;u>C99tCufQ{<II>cQFMgPtcWxDR=(wd<B6$0OiTf^
zi2nH=a*mJ%6xo7Y+KCmc*I;lpXwQ0ava-rQiwB-4X~xP}?LmjcH7$=4%%!uzYJmXH
z+rbvwXqNZAYlEuGKt@E|lcu`@l7)&(SGk6k@S6p2C@&$51rN?|RI=*en{HHli>)GZ
zt+C+DCHx-Isywe8qw2jKtg81)>?|9ryg&S9)MznXw(gnC;m@jC>(xsTOm)4Yd_2P8
zGyk4y&}|<9nRxf82@Vyn?d6cQywS{2d?FfNhgEAWt7iusJD4x(7o(JZtnF2*QoE+o
zjR11CWp``Q5XdZ4xj0mm4<fKVh>S#@yW%f#H?W*m%zL3Ad!qECLIJoU_TJi^91)EN
zo_7n{uuldX&N#mfJ#$YouZbIyfm7>vW7YRkSWA&x%M#29>n4OS5bpI^Dxqz94%_bp
z?kW!G5hl*meg4efu%uRB4aN~)>#cq05=Q1p6Ay`MG_X3i>N^)Y`2W!1vovlqn-i!^
z!ZVL+VL;frQh&h3{?6Cnb{0?P><8{c-CM+0t2w!k%WiVr!{E-g=61Z=)NGyAVxzHD
z8%r+27x!#9!>j9iB)EHFdQS^p5zm%rKYT$raVu5no`A~XtUaMwZB<$CJds@@_YNE`
zY#yqJnIV*u!M&ciIjz2fNuQ5Wk_6+EY>7E*Al{w@ub`?q9oWBh^Uam4);$`#%Sf-O
zhXrij)o`Y&c@@51r~=EWa0)eKxxVI`7;d(@iuR5_-W!=^b7GwS=q&5D54c_I!IT<F
zKpb!x&LU%+^#;-aei!A}jR&;UxISo9SIvGQU@s!M^+zb(1e}UiI_IldecH53v{`p+
z)zKUYWi8zULt9Hd<eaunT`g!Y+Db%qhzj?hBfm6)B}oD*7g^{hEZhw1Ejp*Grmf>%
zMYE1pAupc7i`Z|4nv6#_dOvHs_-*92{wW`Qo1AZ_k_D#YB)NMC)LL+jI`Lv}jbYC>
zug;0rW1|6NH8+VMpWB3z8NwP_t>{vY-wf!lD13*;#eeL{X16468NY0yW_RgZLT%{9
zg{h$*{3%7cFLQ>y+OL^PP2VZ{X5`16Z$G3S5+A(BLiJ+&%3+=_9^3Icol{T4o-Ko{
zQ>FMvwHmXW%QmHi;?9|>qS@D-vo#B|b@;gkmAR%Pb8md+T9W75iss&S&h2E7cH!rH
zROa6wng8H3-=91`STz5sbN<W1{4joDL}g*@$ig?Dg~{ZF>7A&A&V~7fg+=`0vdZF*
zBa1(M7FUxO*NPVZbS`c#EN<hMAgW6+>m`Km5-Md0Q@n)jTH;<@A`q5&RR2fOTl`Z;
z*l1AQXtLgT<Gaz4ve8z&@wRK@-Qq?UVY5ed^S$-v2j9*9l+D57%}-sMUluoq30oto
zTVvK+-+Z?wQ?{myw`RMx<`=gX3ERu6+dr(gfBJ5(rfjbjZ~y7q-rii?21cwo<Ol?}
zglUG&h;a<}E`umx+fmba0cA&ahV7VH@-F=_xX96Q%Ks>O|D)*rL(zl(S4Ho?A@p|r
zgV2+el9ZE?{#()8`!7XLU1Q%4q-StopRTT+v7WYxvGES1chvIWAuH>DLwd*Tj{h6d
zJ9FlY+rKQm9Z1jB)%CwvdVc4rJC<JH1=qt~_by(%__wIH!|DCo(!1pEzr*SM+tP~+
zrd_#mWrx%IZy>#h=){F+{nIhJJC@$xke(0Yg<~AqKaLy_SCSq_{}^{-G0rqTKHfR;
z;N8T?bIF$d$!7+WPcJ4P4rP{SGh+vsPM$Xohu*AOx_RtoYT96`+r_k_$!Yg<)8c8j
zPx{@qkGWm(>9*%`hC{)fluviO1MZ%QzT1$H^(reXE9Rc_)oj;i*{Pqi&wbAJU(P<q
zx$hswI{$@rxilv|H#hHlu2;kZudfe6Z#`oF8`9(C)5r3!-7Tn(e;n}YarTeLmq(sN
zJ$+i3TzF-rF!b)TceO>iqebyIim&AszqwT!@vSszr7Y_C^XKg6`5EOg-^x?7Ud9)`
zZ2S2#;af$<bj7Xvl}W6s<c?QG6R)z0U-$faotjsjI$M)fTU$F-o0DIcQCv4vUibc2
zedeo%?!Jcd*@lOOjrZ7W_RO27t8X5ZHs=mDSCzNs&$bpfwe`JhfBdDrdanKXYWvey
z9nVJI)&F`|_O`Qcp|h%{tF)o#<(r<#j-JoodYTq{YSwyQynp}xP2a1xePg|SpJw~m
zD}6O<AF7u>HnsNGuJzZq57f;Mw08_P{fDAA{NE^gBj4sHzD@l3_VMe)z|_RVuZf|J
z$$@Xv%j?r$M`ymw%*?FLj7-dptj&#0FMeBFoSIph++3QR|335Q``q%+#UH=EZ~XfH
zYwhQswO`xY+dCz3^fs`G5vP=}cG@)f6dhVia++d68Otn6Y3`c@VT}u)TTAm=Qivw;
z;ud8O+EV3@J#lC&d-(P?$+bPp;`yU@ncDs{pWB}2ciksPa_zD#FX+jmq$-|mFMs?#
z-zLxUp5==tAD-Gjzwo8~#nb*`YE%5KLoW*lpL@K2a`x@ZXP+u)W9|12RTO=B9sFbF
z%iD_L;W|1DD`8bxGV*^-(ffJVx~_Kf&&tT`a95qI0uO+c=g{F?4AblA-37#h=lG{M
zkwE)%P89zMZ5sj5U7HmpczG%(Oc*)<1!dDIqkOxe%TQ3m`}ar!>5))wjOZodu_Wz~
z{dwGb9!<%B*6=}>r~`tY<AJ&htnr(=1DtW3M)?ve$^3-pw@Vt*BM(5W@{)((aXZ^)
z{4qz*i92uJQDma*a;GOUD=(J1$Luc0Ox_EA)%*@`^UE^=tw`Qc^b{G?9YwG9KNP)p
z|5Wr|y#Id{J?#HN(L+XY*Pz+aXzv|G4@ahy|69>>i~LK`OF$b7uf)*F@V&jerR{Ej
z`o7*}H+0;Pl?NXS+j=RR8#BN|rVqrYtg9xQXBN(p`xI?-H3kL_ao0k1c?~E9UOlC4
zG3DOR;Xk1qL0^hz6J>O_Y`&b>zTb^vm*S}mGj9JV6mJ{ZGyz?+{@kx+F<tM@J>gBo
zh;qb@?`A|MR}?`x*zHWA=1rU{g*a0njnT`jcE&vXLxKABJYY1nihW;)b@i6xWH4`G
zyPmf9KEY}FzsuyGP0>kA3pZDRSK<5zeJRGu4KPGwA-SfU1T*+eG3MGIz7)<qbRN51
zZryzh8<iycef_gXb6eC!N`9Mog6YRCnvBKE;$E3J#nNgXn&C~#=sy%af|zRBi1lQ~
zubUdZmKyrq!=8us`ltpgselSMDUq=+Z&=s1J-xZd<SH?vSvpQ<KA@<2YSg<CDe<Bm
z7K7HHl%*`+TbD_Bn@D-P-g`JxY0ELapcikFNrJvJQ9Py$@<MM)gCNvrgdhXGbZp^1
zV34C<x&(mRrp$f86bo{-Olv9JP3L-d*O?(P7CIPJ2efrb3gEy`@G>Qy0U{{-BUT$N
zTa1e*hy51jrFY6<cr=+|<xA#Gr-fO9oJfM`O3U>N1M)PqJg5%qe!8s!C(3$5k6VKf
z33#vcQFylvr2RA(B0%K=hJq+OP5c=k&k_{J+d$MI`XA2~x#3#j(&C_Ui4^fl$)P9|
zocS_ao7|eTn0$FUotrn9dCAtA7w_q0Wbi1$ZNnV#rydDLv68pTIbpy}xJ;`DjMlw$
zU3#j8Z<vMueP`j61|>#dO`hpG$Pv*TkC7IcZhfzINTM8sf*4N<dA=!ekGNTamOK-Q
zm_qClbAE9XQYZ2|GClTl>?d~;Zlk9DmMXsyPV5)lJwDH-*T%f+D}WCKJiJ%D(g_Dk
zqQ@`~B+tn=O~P~W0`UN*aD70d%DLd0cUh{+N{f1?!gj>@(>DY^|33CCd0*t=?#4{Z
zj)U6g(5!u2X^EvQa}|%(ckkcP&tGb6GQb(txUGyOx$zpS4gkc!&+k)%t)?Ar3bUla
z@le>Z99{4uXv7PT{cz}^;Svv4PYJx~y;q2xU76y1?t9#1Uix<XK8x$+lr!P>H#L(H
zl<ON7@%o$7Er4uP&KfNL9!&6sM|^CBh^c63cdlO4puEEZtnjf?{~J?zreK6~Sg+eu
zCGW`wVS~hku9esZ(~=aw+&SVV>!1iem=(r9BO<<U*HMvIb_p2xu|BRrv6MHjx8avd
zuEXw-+i$(tzYY_>{(bn|en^b*;G*l@eL@BR|MREYM@~Fed^dka0!<X4$P2YxfJnj{
zdjW*El-91+=ce5e6E8U;Gr<s+BDxKEQ_X7yu=!ijGlp;FIUR3%pnRuy)LzKcHy|I&
zdiA8_<lDdn|7G(M!S6?Tz0tz@4;8F1Qg#x{feRYiXPAORU6O8h-Ct}p9F^s7FP5ff
zTvNpogA<=iedm~nI7Zi5#aqPz{-=ZLW(}cyvaU;Shf2ryjcCRL9@u6gMCwV6;5^Gt
zw;Xb3f$LMx-PyW_Sw!0!tm7BaE6Nwt9~qW=6!ioymmn;P$RQ4zNBvgFf1WLn+Xb5D
zcs~~0^;Q+yoYaz<bFCX1MP3{CQ~D!veEa-jqQlixBW*u>D0!4sCQEstq|}~qd+9mk
z>90>%XZMS-E&La6t%gf^J#K=NS*REI@)SdbO0GZAvB!QW?jesJHC8swBlOsVfo|4b
z090DmqGmXZYdo%E@1?vtq^CuT_M1b3;nfE7mYPRr>nq*+4O;C~yARvkAGcb;hlUmz
zdmhSYqW{cDv6_F*aHS}=4xNAn^j{7*1b^brXtyIe`E>lc7rqcH15=X?<*1%CSSY*P
zpftbz+gcQg0~P$|jTGLIzjU0d0FOJ%>$Oe~PcGa>{RvMoeoPIo7FYTi@|xhRjwQ!i
z2ERh-!lv)~2&2w$9wxOT)7y)UG`8iN43f`9AfT7}5C>MltAn3lrz_4pDGIuAV8O4Z
z*0)*eS4%thw@We5tIcyWB>&6=YpJw-oskEjdS8F9pnh3SK6&=?<C|Q(g)mf{Ul6SR
z<{Y=5`A%w6zWZxH+XpkXSJ#zi5L^5Li}yM+?ah*YR#Kc{d})v{Av+fDwq_)?W>>Xe
z|M>(fo9K+vd#5riV*(B@DLJm22=sotkRNrbbWionvT^;~eX9}#e(mT8*US5|8~4~L
zu-1$f>SN3k9pj^aDSCrDir&v1Meo$#ieB0OPerfrKNP(Y7_WN?OseE>MNjGfsG>Lj
zABvv$j-nUwm!d~0`KO|1{Qp(-GXF!-qX4Fv^$6<{1hpGGQ;+0@6Q#!ZG6DFdAMk%F
zdPe`D=p9AO?<jiG|0_k$1zP?eik`#LUy9zozZAWQ|MQC8pZ}uh<#KKO_)F0<{@+ye
zGHK@#ANC>tR`e?WrRZtFYDx$XK$BPH_QoJ7ob1!|jW7Tpchlilf51^tf(D?rqv%;v
zp=qnmYyU;j`v841A^W>tj=H1hy&!0m{7ccJbVFxAtVVq>ZzJ~#pE9gUbdd&5un5o_
zY38SREl(ou?zRqJf~G|IqWz7J9M``TNyUyGCc{(0snBU@=**Iu78z^5ru1EA|IKb`
z1qE>L9aCSxFx71b3^7zIPv7%EJ>5n{%>>-LrbK2PVSY4z^gcBmkh4A|a)8MNEybyG
zK<;idya&xif=Cj<TWz2W2gO&){TATK^-SoZqm;`?k{TAuD>&^H^>I^c`U8AnudEZy
z2k&OJ31YpwrI}^a;%TijbYFU(vEP4^d%RiWD|<hFmmHC~J@Z|u!G&a9kAAoBj8;8*
zB~meI8zZ7lf<l*Jse|Bz4aiNx!b`Jp%Mg|Vk0lcZ+TJf`{6pj`xr@7n<CfNX{R1aW
zvUn0jZ5}sq-Vyn}Be}n4e&l5Z?}&UmAm8PkpP>H&`G`4xgM1(2vicREt}BuhQcf`E
zuvUF8sGXgBg9}LnLEz5B5=@?ScZ&soy9ATm$@f-(eIkLM0N_(ew#n%S&>MNWir_jK
zDc=qJI0gDILDWmK!#LSn)ccD}m^>AKS_kV!f;MspXB0t4u17A437bn$MG$@NoRy>o
zEHob)7lXRr4ITOpy}aZ6v2Jshv5tIz_5y~x-e0O&QVZE`&)<RmGHFV}PyT}br2hf^
z?Jn_7e3hTM1N|B2BGoda>lK?K;59ZnhuoRQG*@*+5hRoAlTF?_05R-F@0%fj-GC(>
z61IfTpyl20gaA~CAQfM)Sh!{LwBqhlVLBv<3OTL=CfVFk2OwK?s2dRkSOggsz(s`!
zGoNvjpoT19@YS=e?q|cIMPrHyH8w_CppvAC_hcDCAQGO|i~Z&TYwN{ckB}1bPtviI
zU&>P!zT~=QsZic69dh8wjCvrDd+E?iZ)H=i-=|Gm7<;#fPY^~=ils5vk6LVza7VvG
z=f6K;szDFX5EFN}pd?gSH^9U|PHuAuNwh~>R0tFE5U>ID_JX9n&o!~np;Gse%aEB1
zz+2X{&+Tcy6+rnC2viC<{IuxHP~I=kgih^qy>{VE!v41Dpn$g7q+8+~Um}d>rAW{9
ziGs33+h>B*I~s?Omv!%g^?5L!aszC+{+WuPs|dSULhS{Rk9y}-Jm$z#!YQ#AgF2|K
zB|JdICw!_r^E5%yKZ|xqYMlt2^1>r+9xRq*Uzx3dHB>&DC9w9snqYEqgAW1HGw4X!
zRtaw3I?RwokYv8_Csn3AB^)5_+~3!)-oCEQO!x~z)RhujD%v8UxJsTboO%U!h9FDs
zeC8_e-wSr{t<l{Jh;7r$5zBZ!762`I_M8YHX^8uu06r>^=C!k5xW%lU{ZzY%z5n)g
z-TFwH*ht-t*WjTmudGgiu)=2u+(V2W2<xcBS4YVMRRq0;<7&ia)1we+?mHQKcdsZw
z)h!nKO6{VuAV-fEFXORR4T^L8f}#KP79IZWE#{*B=`FfoCaJ`|dTbJO$6I7mve=e?
zD|(^qbee&}A+}vL(QJclpY`T+DEpgB<ME9*o274D^qMUTcf7@Bk3z|ttfom2=Od0Y
z@7VDcn_Y0+zIrX@-pz;8n?tK5%o2T#!B+DQgoafMr5bZ&0~x+u2xTO)L#S7-iMNd{
zw@9<tm%Ljk)#~;R@T4sEJRR<+)RsH9D=m>dOm1b-*gM{0gAKxA$6MrJk1ruhLfHi+
zm|+mt%m0_RSWu5RxP-LmXgjoVb;%uEpyS&+2)sEF>&!-sAE7-Fze;NVs3iI@kzGKC
zH-_T9HDQTFxG&hGK|_DTaVs)g&at=-V&LhZO(KXTC$ibq?64?xcVNdWKu>`@Ycx30
z7ITXOzA5Q)W?}lXy0fLac5p_^4dj=Of8dPu2sOQ)5ITISu+zM-&AeLrv0lf$EOu=i
z=uXD-FLxnx2pu?{GI}@HuJ?ES*!b;xZ15V}JAf@v)1%_uvzx}A?(3;Zd>_J*8zy(j
zT*H@k<NI%edz8U`8(cDtJBNscE@P8Pm^Vc5HGod8$8FEyQ%RV$ZUR)F8`?m)Mf{jr
zpSDrL6<v>mFZZgS?N7h)juQI*t3w<A#hz&^tm40*NAu56zN8)Kv1OPAEui;VRPR8K
zz4G&fvU+$j6P`*(Y>_aYWL$DRW{bw<Oylmb!EJjZD@#!M96~=6{cN7_xMt|tJv5!h
z?atzc8TDWO^65r+zxjre@)Gw-06US|L+^!pi+fOQkXNjH&Ve|a?@(i6FXgjQxWyn;
z3Y$#EpWb=?t!M;u4nAFZ$ezXxTkiVGA-p7Y=k5A5^X}^{7Qvjz^}2rOHTV14n&CvF
zwjEdURAQ(3JvLCp9=74^xRS7<fnFj!De((#xi4KAI}V^Z*SNFh30cG;tCFwKoZhV+
zNr4FF1H-_s(Nq$_oQi#2f}N`Qvi@#ZJxtgvk^9J~EF`-#W3F-k*1+VF+TeWOEoCgf
z&&bF%_;NkYoYeit;oTZADt%;hw+d)0fvh8b+Qf}%)P9QzhkrQSg03Cwe})33Mob+?
zI9~?M0aO`vWYq>`MMwO&Hfn1y<oA`Za`>Cf!WU;2;w5v~L1HR0r-h_MG%mrbZYx3e
zD>cn>j?8kJcwXY6>abbzlr%XG=8Sw#BYX(msbzs{-M#!h(;M~E`QTVY_RLiylky$$
zGNR#c@lq<W>9E%Hj(7>)K-0QsZ(ZZ9>z?&4nqfQ6HHXc$X3w?P&UJj9>-<-Gcc0_@
z$FTW<?D?VE`OjbHzi!QQBo;;u7RDVHCc+k`vKOK&4_cmADOw;L4xTPkfyTQSOIwXe
zixY`@@=ShW>C(dTLW7H$urzZKC|fM<U)&2{x+pt4<Fm`mdpaF#5*=@ZmQ6v_oAx=h
z?Ubf?b`y09jWuX^Uh8FtbIXv3WrUNkA?~}bp1iCok#E~~O5V3gdt>Q?-y4?&_AWzV
zow^@~KmQ0{{z0x|8>jr}G+H@$zin^V_t2UZv*8tk?G>B*Z1a?r4v5_GV)n^xAxo#9
zXNQHH2tS=uezukVv{Ztp>I*w2|FS6jb$08Uk9Cum@2`&1X8-H#xErgKMB&il)ysrk
zu1+fsw2r6-WVGIDw68FuYc)agw}ti3Gfuxk)qWqeUJG$vBd4q}CB^TmPGsE|x=&a?
zsw$jUH<mNJR_nJOleHeyu>Q<x-9&XQRrSvk-+vI8q@FX@%bJdD-JD;wiz}1hhKJ!s
zMV+{^OV6P$ghmM=<&tnINkOB2;~;^%ldx$dA^d*ZH}xZ7Wng=w=l(|fUkqlm?m|<>
zf)Lq$lWaXT+a)xA|F<rFd%R9q+tt{=Y<t6Sj|L9x?&OxW?`9btlIB-&8|WS}VerTu
zd0^i&dN5Jor}+55vO{B{)WKxgQ@!I&NfO8L@GHG?%_80dlpiPGPaMuV5V$Zt_<quw
zWfYB<JKZ;B`@rIs%DJJx6}{cJR(dZ`q@*j+4yTw{dD)Y1lI0GaV8}|9?({0YIoO+A
z=J&1hMX=WV>4=NNy|;8tdhP0W(oS|e3@kab;{;UA6qO6n`WKduJaQ1pX%yLs@aA_J
z{BgcJ=U~b&MHi${wFCd<-Cu@&dJQ~2oaeax^fY{Spo-i0`2*B*z2=5!!XC%Zzx~GB
z5@Kqeep*{7l$O1ks1h~nKR5WoKWgIB%Fkr1r|%vo$Dp7N&Vl&-_r*?s6lwp~mG3mX
zb!{WzX{X0x_38ormpZLC{VOw^Uv2T)Ej?egc@A#~cNt`0X9dfb8efQRpd0;Vl}e0p
z=2xww>b`3%oAMvC^E)^)Zp&x_jdr^1-|^msi2iixvuzQ1G0G+S!RNDI>#nQ(OX9>j
znWN?QR(Wv;<@3@mSt>p(w0tfnQmB$XbE)I|+wZ}7rE*FQn*O?Khu=qbXy_k%##S6l
z^FN|9E1t;BgZ6%}eh6RA)2t5*w0>dF+j!V!+Z1)Hv)gpfAqKau%&mZ<mV2LhB6+I4
z({$6derjs9X>JDewHwPFe<(8cJmC0=Gl91ZqL17PJaO9V#lAz)jvoR~I$q^g`gkT%
z;Ih3-!lu$mr_|$@Pq_y{KiZ#iZU`4@FDtps9}!%th4pfL%SLrcmwv=|nMw7ZILLos
zPl6Tep1`2{*sY+i$L|OBA9GU#>LC~Qyk<oJ^}FO#xugLgy{lWhf+!5-G^<N0+5pfl
zk6_|{ad5%X`HT7zM_d%JAtqckkG}1gcI?Cf%d3aX?8Lc5J^D3}@ZBD1k%m7q@_Y>Q
z!d>1fC3A}df+svDKQqISNT4sUsweeiddP+CC%3%TruC13<gp0#oZOVKuDGapBep_;
zdn9clgms=jO#6&xxA2=ef2IWb4n_LTnz-XH1Jq(T+g3K=4A=S{V)gWv?#<+=7(`M<
zS7~#yQi<GDy6R{0BbHGCGn1H`^s9BjpI*9=Wm~Z8;S!~LYE8TWWBmz_G1$$Bgf=#Z
zbQL`PwHd_0z77c@#Yr?0ebfOW6b1n1;@^Y-a>RMG@oVA>>?M=&Yge_Pbc8qnBpK*w
zlOY5>)<~8r9wb5{kPxabUQzxm1cFD`dosffP=Wx{n<&8|k4eyXmZ}HPV$sk_RAjie
zQ8<)Hf3Hc>M`|yMYjbvrf%42+gMbI2lZS@aX&fNJhKQJC0T_7zfar0Y>+A1tWu;?a
zXmW_SJYyf6sxf-+aZrPd3r`XwZ3N+GaRaEIMvg)u9XRJ<G58F;q%quK(fxo}t1`fe
z=!I~CcLopf3o(hlY8;5cQaI4%4FAo;hKLHIRpXnDQT8U{LQKF2AM_fLF)uRaCI0*9
zs)^pww<v%SC1g>bbl!ms;Q%qhsNUyF#BP}P%9;L9mYLSgxhMsP5v&Hid2PftC3NEx
zM16_Wdv6RXV&jq-6KwjIqPO3|MLDRP@`hU$B1>vTh?1E&rTP%E=`Nvu#7-_6<k}<!
z0@2>)eY?L|EdpQ(;?fRKxb0^n!d9F#>S)PQ!o-XiuTk>WK8l7V9w4!db??VLL+k*e
z(XcPOeA8=J-aPktDb^~F$~D$A=nw^j;o5I7^z)rc>6##2^<BW*v+j0zb+Zo-?xdc#
zaz98!-jOj9ec4fdAk|Zxs(`A06YeSj-}&%D?_cpeCX*GJDB$rJRj<Z0lum_=+SADd
z>GJRn9=Zn+y$(|LtH*%Cr(tx|SHV{i6fEjYpv*Kb1dmDMP00D=Y29E1z1Xad7+R6P
zL3(9d*?h}!*TtvNwC2hP3K5EIqeG4|8kN*FuELC9fYwQ-6hOa^7y*>IjgM`|2-KsX
zQ-b>e4m=qiNIi}KNO}==0KTEjzEBp=mC(QFmn1fv2Q@+u-f9+Pqqu|_8*CkB_bI{W
z2#av1z|+SgZRoLqfltxnAr9l6$KmX=y#m}vyF8aivn~SwH+{J#%e@Ctq3x|9;Fl1q
zF9Q()kfeg{p)>p}Xdbzls5t?H(QZG6sTqgrpJ{=+EQ?E!$h#|@QJcMVNJaOT9SX0d
zOPwy1$Et@uX>r>BIXAMRBnI+P7meg6@fz6NlS6%{pG?k;mk2Koy{}Lt{`Hr*{kP)l
zkWl<V1`juiSWjDieP&{2>RH=2zZB(z{o<?U5j&aTKL951TzOl)F8(bM5dYKx?+oJS
zrf^{Jj5w66%?^wh(@<~DT)cLNDCD4|t%9b*==CX>J`TAcq2Cxv1Vp+AG}2IXXx3gn
ze3rxu^^tP~GanF2A;R^0zrhvXiy~zJQSfwlDU=xHeuR40x!(w4)8NBlkR>7uUB}k#
z`|`GyFBv|Q;YCx?U*=tYl2HlF6EQ+XDroh9{UEh4N&TaJp(WX-zDQ5z<7BW|@oez$
zNg3Uzg}*38*v5pwkf?qnq*+J64+0hb(}x{Wdt9?QF95mnX&lmmnO9J<H*G{bmi>wZ
z=;23_&lr6{2Gz`;mGpa?sh7tJED7D2Dp~Rk+P+cwqIPoE%+);(Bfr`z8g>*t#_iaz
z*!<u(g!fB~^A2NTLhsnhJF^Vth%s@=!;(A1A_DX$%2I*$IBzLTc{K#lf<>>tCc3I;
zmh5q&hv~b<qCsLlht!BLV4QS(K!*y^Af!1C+%2yG(}eVbYO=g;j=dR^nhfbrQU6{T
ziR4CT*RL?I(4hb)OXw(hCu?iCNVdKLafJ?i9=MMXrcWFpkq1=)QT)!U^|-n);$CR-
znY4RA)I#L%lGcPbdozg>$2g%)MS)RQ&;H0f$u*$5EpiaeN=ZC^HSv4Ve55#aff4B+
z@%@PZei&yl+X8a;o*<^IX;kC}ar-vPEd@tqK?Fw=WZvV5S0WfN6kMKMZCIDx;qSQq
z9u+^i--jEoM26rfko^Y2&nW?SPqz}oVWJ@9R&3Zx#oijrN+amJD#!H{0}v&%=xBSq
zu!s#EnjGuJJ!ObtWUh-b_?bY`fttczI+C_?e4nF@zGDXYTLK-;1l~%8qX#mj7{DdJ
z2qcA$B^xxx1HPkxrVZdy7W3yAz&)k1hXEjibuWY?EL?!Mc}0U_3|l6B>nhOGrU<hq
zMzB=QDWYK-<qslqF8i^@A`x-60IE_~61{U)ZP9?v%qQdG=LSjdZ~vHn&E=|b07mC$
zNg*y|?~PL1?$Kc2PwS>k5n(oTaUB$|eAC1Mz=w=P-PDEDD>+i=GEMin$V3x=0Gc6!
z5YLzpX@sQ$4OluQDjH|62N5o1i|YH>=(|zE0TN*3(3IC(HX#Mn@JX6G(0yzrpft&v
z$Y}AS^fzK^yJQ($S0y)W4<uKb>@&#{4*`nWpb&WgoDwnBE3qYN)*Pb)6yQ{7S-1^-
zqRIGHx3NlfbIOm##5|Mz_N7+BCgMcR_+9|^8t@WE!0b(a`ZxXh!9alYEZ*45RZZ$;
z$cpDMFnE8d6mU+R1b-cEKw>|*+w5=8j=<6Rfml^-l4JoJ+PVV?8V!WAdB$S4rLv^=
zj72Bt#Ueo<{EP;ql8EJ_Go1k+5EYpN(GAuO?R_nDIwu7B^0b?2%^$Hs8Aj-Z8vm(C
zGuiO_WliO}z@tlaDLr8Ls;;<nqrWC2)Xw;V9@>j-_SjDQVxl%T(-ct;@hT`8d!OUh
z0UR;C7a-0El-1XsLqEGBDO8ZHYf8H22c4dNE&hG)huMAMdMFgJ^`L1BOqdaEO8TIS
z=BhM}s5Ftd*=*Yi71jY(mr0Rm5y=Am!+dlh-i*cw;M!VUzyHAxe87-S>>WLn56zfh
zhpF0Ix#=bGM<gRz7EmO%i-hXxj3X2^=n8s_gAvX7N{oUm%VBuM_LD?y8Ro&I9tsLT
zLMrKQ)qssS`tz|CEzP$@tx%*#_Rj2{?uH=>4d~WO?hB!#rer=Gd->V{sEN|;hSL*_
z@?m0(dYnpQVV)F!bIp3TFtiI*QXN4i?k}jJv;q)P#+R~4fJP5u?=*}^q3W$$xZc%4
zAe%gZm@Zl;K)O@Jc#q{i1x-2|N}tm;@S;FgEsjLm??3zb@YlrJVTT@X&3*jJjPt^!
z6dFsZ<nXv%=eV1dS1=M4(fL!1vEL5kH)Yn>MwDzla!(O}mBh5mq62v(<w9c)p3Y(G
zScjdq7>Ym`n~-!u#ZHQK@c8dhewu4Vq+2}6%N)1f-iCLFX6X<A02F2J==Qx9(G&8k
zf7;yvzc7MS6gGa6D(4aM^1dEwW39+r#5floBi<fW?XNmu6e-nrZ|A0LhW7YR9Tt4o
zH_mk=b}SmO2e>(^P)^&JRcCPkQOAxYgR2n^DZ?M7qkh*#a$*1*AjMBov(f~?q>D$e
z)a3w1npw9j0Hx8nC;)CMvVu=i@0cls2B2-=Zml^;A{~BLKhh7tljv(9If&M}aEsS6
zdZ<WefWQDC1$_}v`j(q4uq#UZ^s9=<=phYY+Lq`@j;weO;I!!(xkbXcd2R6kq5fqp
zzf@OZ7Oevit)y2xk3rf4ARV%;_!`Ll-2SdjcMn5~&<e<1yZ2z@eLmanu=1(OQM<^i
z$O#@j7!e{FPq%ER+oAz{EBu27AOq5Ysq}8K#;PB{F@7LI9i7pZbM1u*;=;l3yK3pj
z4`?nmrQec+$pe_F);pebDXacK5o1K_U{_Rhkf~)*`)Tb+09s#qo<)bUSg4Zjz>EEq
z%68iUjfO*Xa1=SAM#s@~52_Erz>HhtL;k|>AN<v@-~-8|3~X?ws9gD~tq_hx2k1HI
zDfRZoHsz;B(xXl6DRg?NT_o{T>aMeAjZejnA?<|`H+G@>&Ypb>#GVn3&aN_%oT{h~
zkB)eauzxE!pn=}@s<dFkz7~;@_QChs>4>wDh<heyc{Lg5$zO{&(FU@RsF4^e;ixJp
zG?fu$MAjcZ==iEMvQ|g0`><`V{;;pcm+#TsvdT_w!cM2IaifBD^G-YU9CX_FCNFf>
zX;)4}@3@l}sc)b=(_`=OpLb61bkU#RoRB`$0^1&VGN<>86RL=cl}LxBQ@MT8OMo=&
z78UeK+ieuVt>Wy^$fu8S7I1VnTISYPa~9sZw_AiDSmZ3W`(_~{TKKE;u-^^6DrX|z
z1?$Pn1K=eLTpoM!O7Xbt_8Fb4=ig=KqHsb)?@l=XWf!H+(Qcv(Z?=o-BcUtxe9ss-
zaRpZm1J`ZMBd+@#UA25%_lLP^C%YcVcGW3z)va~a>vYxs>T0myYPjV}#=Gr%3I8-T
zs%qeNMaret-p$O%%{<JFlI&)Y?Pi%hE^p>$<s<l)C`pbG`R!(dKW8g(?x@PSV+QAr
z`9Pv=Aa(}ljthnhdYn6zeeQJ8xihur9BRKsGrl<>zn#<ycf`9pOSrr2o;WKp;iTez
z&g`64@Q78IyNc|ndPBlg@J(B+>-$QVx13S0BA1IQ0?{Nl4~g@ad=fttBwj%7_wG#W
z;<z6@GwIok4N^HDQgl9t8RP%RJ-Wo5_LQr&Byoy1Vf$k;*fEa&@_f{hsca_73c_=X
zG8xr0x&4WSV-)R=Ge|4i87%wik?igvmxJdaL&IwKd)BAPX-!=_QF(LABTX>;#)L<P
zna34$LaKWLZA&}F0KCN+y<Jq1^^1eYOlBv0=Bi8vew?`SvNCUh@xZb2;RNH6%7w>|
zCiC$#%mtlb14hB+8O7|0XW17@VkRDLT}Y6b>Lv0NYj{PJaEIf)Dq`HPC*%Eo=}5bC
zCr!M1CBb+d=2aW!e*LoN%xe!Th<7L7T-t&cTVir|)%f&}DW=4QB7g52N4(pM=6tcP
z#|Mo&UV3*f%t>gBdhK|n5*K?_F1|Oo*mvaO2gi#aeJ=KgT^vZhIGDXNk#O--?ZwZX
z7r%VHxcznE;_%i*4&G-(!e>;)XUxE7{D{vtN1q8FpUE(vsbrt&Y@eATpV?ZUxlW(?
zuRaS4K8ssEOL*U93E%H3zCR3nSC07pboBk@<GUK>`#afpE!%g!$oEgJ??$KZ=2zdX
z1>fy0Uw}Y^NYbFHG?*a`ZcRft(U870)O8v<g@(CL<0__M>u9(x8uu^_zepo&(?EhB
zkE9>3svn=BAHTJqfRmq~ub<F$Kj9QVk^6q4#eQOSe&StzyN3NF7X2i*{fLB1Qj(XX
zRWHdHUXr!GB<FN#x9_Dr*DuMZTvE7yNwN6S-nvUlU6+)HFRARPdE1vr1b;P2e|1&=
zZ4E<zO>6&sPX1cH{`;@{Yp3`hxbLr1?5|truh-?TKkRR?=x?~~PbLHyNd_3J2ACKI
zm|6!MbP6!@4KTkRKuHO(xF29y9B`;E!0P@5Urv-|NwimMfQ@0|l?+s70bEHNYG)p(
zt&PYO{%LbPFke1~q#Yrz9qmPml%YbkX;H^$QJUmH@)F9N5g|i|ouUW28FB?_|CAv`
zdS(37sYhIA#9FVST<QbK8A$h*hzr)2eNpkol%L1wkun95cMD*<wV_IsD9@I_Bi27H
ze_y_`8b>pXAW@N5SCQ9=t9FLaBTKPfj0n;a(*6AE6~o_IOoUx=l<88?_4?KAu!_~Y
z9>ER+FuU#5Y;-KGH8!(5IC&crfJR*_hzpiSx>ur-%!3V5Vx4XyG^kLQrC19_uwDPE
zi*|%@H~i|JpV`_!ZAvf!1y@)Fkur=m8U<?Cg0Nde-5UN83`BX=N018QoLFn}#6Vy9
zpi}5y_c>8A-Ox<!=wbrbk%CC;lffGDF(Cz!`X1~0L9xe(!5YM$SExIAM?u%osNDmR
zUL`;86H#`A*t_+CCst#f3ZjmIq1P)>r-(5w1yNo^<SAOL7ja#ai3r;<HuFQ+CqtWq
zLR*9WXbK@54599%NO_yk2<t#?TI}6{Xqf@n8JobvOPHWlR1i6EyB`%5HjKEA4)NO)
zva?)RUF^eE)K}}kVN{r%YG}`%AMY1eZHVhb#h4&wv;`w5v-?WSVvsf!nQe~<TtzL%
zM#kp<^rCOdb5I=Bs5YUnAR0W2fEqK52&-R}r(8dM{<>Yz^?nrkIuymL<gr9-jN%ef
z_numkVl#O694+)%mTpcI-G6CrYFVb0DQ$jJ$@9Bxdz#{*#sj0ha#>F1z*@rjy|%lw
zukPmgvA+wK>gDd(XeHeBup;N>hMx|vS-R5g@$Ra^JtdttvU8I?z6W)kt9xXfCvoR=
zpxjXTh5oXOv%i!-S6-Uzede{Q;>d7jNbKY?9pSH4X?k$y@wNp`I9j<>qH41E<{_n<
zrNMb2Zp0JM9BLw>L*3NRy}e?ds&a8%bEfaf$>%=vLq8pBueKrtJ1Tlrv@ICBk1%Gx
zNrb;iu3v7k7Ssr{yF=}q@%8F2Hecsf4bxlu-ak~~zqqie`+I4$#Vh6A?ZM)qmuJls
z+-CVxZ`bfx1}&)Gf2(8vZsl#*hXVmwhhv9%)^|1Bzdo)|NsQ#y`Av-Cv8+5HpKl-R
zEH}<J!Mlbw7~up}{iNSUCo91zPV2aUB*C?+G3$ssYyR!-y+6kY2`Y^P{Zabszh#(4
zTnA)t<aw6HD!uf$$wy2j@pUS^tWGnP7ygnrdhn!RmE7&KA=_(m8O~e5Nr$X}+%`qo
z6Y6%mKCn+tD7dsA*mEy%=*ph#@f%fN59LRdiDg~k(vi=J77dZl<)3ex<gwl8?K^Z@
zR!8CCt-lmKf+H+8>|V$dNpV%<5L4bCZXt?K9zS`d`1G<Luaoq%cAdS?UJQlI8ZR&-
z_ZHWzukS5s;L=qpeIt5RsjN-$wbJu<I)9YP{eLwPj5a<OfG?n5T#vuxI((I>`$b~q
zV)?hbS5;ma3tlqShVuBEW?`27*|J+v5&SjSht6h3u|LmA8%GI@A1Ry`4J9>Vo@zOq
z++zLCHO?oErHI%w->0zGzw0vho6jv{<M||INk(*1KB-;d>2|gH=?zkNwBfp}t%KU>
zjOhV|(|tS#^_*$YQ@k5%bA$u08cLrUWSQE=35sF+)QBUWBNO)H`$yg%+ltD0BWp{`
zwN`r_?Po0<NNTV!h$iuvS^qK{+4t7(t^WQm@WYp)v=)bY34FBHn^AGh2DP^8BWB^z
z%F()s(Mry;yT8c>>2406&-z^HdwA)>HB-4{acAs-t8LQvQf===+|nHpzkznE>)X_s
zE6qIQE+_w0<DFGL<(K`b=5Jy#fh(iun-!F+p0~7FS*c{ngdZOzOe}avApJv8=he?g
zqv0sNeA!EEmBYu4T^q_WuN$m4x-^*bHnf$a_ALKc$QZ5vvu)63>(1`7&~wK=&@=LO
zjycOs2#J$wS;<|hd+NNnm;3qPR?$e61)Cr={hEl>7*M4Ad>|o_i4=qeMTLI0_G)<A
z|1rZhR&&b4@|H*Yc!5jI@z5?)I>lH`Pbj~pddVNJ+o)RGhzT!G_8b?+@1gM^uop_=
zj)dmsfUR()HfaNQGHTJzu8wb1-t_cTo4(#;<+s6HISKy`&C$qQ?K=&A=Cml+2Yneb
zxYFIq2QvL?C)NCnN>jo%#<D2dJS`yn5SqtLir~`vhv;@=izq~tQE0O`T6QzNT6VX_
z<F><>%2Km8WaUj1+HG%^r9IM<Qw;x*a*YF%{LVDj-Tvs8>>oNNHpnp3Oyj{h!A(Re
zJIu5$9C&-V+(hEp=av^oA9tKn_m}>|Y&qalb?9V9BVP)UEjdJrQL%T%e3gZ2*LWiK
z2IOE}g-yi1Gh+=m!v6}*kWqnj9i;vs%y>s?RkXeHjYvh0YM$4@@K_(K%oS{4m}zzP
z;6pW^=irlM4ThGv&-LZrO=)!(O6PQ`l;_+_S%Mo~iL;3o<&*ql-=?_ioN~Ea{dO(u
z(LSLY@6<d3Fyfm{(kjkek?yX$aM$E*BI8L{tjYyHZZruOa=O&UNAil6qSbj7Q&M9l
z@AM=#A4<8~_fYEtUlH0&Yv_hm&dnEv719?-4u0El-WSTTXTLqRuH)~?y*rw#dA3n_
zixyWLW>V<BxtGcvo#HRwB#_c-BE;Z)G|y-h>eFtq=6R8F*{w+^@Ez>%vu?XuGp&;B
zO(o{KUotf#0t~tcbG^3AePw`4a+o+TGt~XAIz(D{lBMY3|Mb&B<wv3HR+Ig<v+*8<
zu7yoA=DNAg16oQ(&u<qT)Y5tVY5M4Gm3f;Og{|&)dV2fCevwc5szN@?jW_VMdzc5l
zfBH48uu14P)kjEhBz~%yTXK-3bodhu<CNuEv$a`#aLy}Uj}uroNm`gSoproB(ZJus
zRH4g=JBPx@ctkdvLj69m!$O+`u9r;9gf^VUY^P?t`on0JyZH+3#HzUYy?}H;m4}=A
zc4f2it=PR8e_~G;n&|pJl(*8CvJQErkxi8IP|oc+i5`Bu>&0)Hm{pI9*s&{j=4l6y
z>MwJDERPg@VZZlq92M~>jKA##sGyQp`u21m^ie{6p;^lY%KEpom`v^a{d&$vj;&O-
zhY89Vlzc`g=Qm6AwEDPso|(Md{ac#nXIU`cVFvEgwD=?We1(jS^Cx;D2u~lgHMc^O
z&6P%YHuVq3zVJfeK8Yx|?IJO*IOO{WyI>LqzCSuAmn4Fg0w3S7kQzEM=3SnHec`ck
zc4-7_tR&S=NI#?-;fL{Q7jAHziB;`<oaj(-VH<hO;GN#YF_$aEeWH&V%#}UX(dRr)
zt9%ds&bw7If8ZMIe*VO-$K%V;@V`t*;eVKrug7hOf0>YI>A97hyb=2}bi~gQN}hJ;
zC|vCg?*%_FY^ldm^gxSrIt}BnAAUzD9A&=FlSDXwTKA(_>%Bd^xV;Y0LD|9BcYG24
zy>sHjh-n1x?x*qB>~`|!jGzWlG$GqoX$QfqE(P|r+F~GghPNTbNO8G3CM$Qw792Ek
zYac&5ckZMZ#zalL2JKoWE_E(A9HRs!@O(Zc{#h6;A#22QwQq=jv%Au)+K7_Ia7E(d
zqPbOiQ&tz61aLWT%qrDjeBQ=V%<VmBv9HA2$_0(Y2N~h$g`HYeCI<tHZQ+CWCM*AT
zMFkBa1b6qOT$Pn}JlVj}KcdA`C}b+R%aCUP+uIq9W6DJ4Q?v>>zvEhE76juC$ml6E
zs|~NupY;eb{RPgX@o!0~<x^_jwt+lUCu!e;P~%o>W_DBb4|Hkxl(`ca>g~+lEQl~%
zvc4M{C3WZIYwE%?3jVB#d}{=GBSOZ?cxbIj1&EL#!NMv{#>Y(zJ-+-}Hj$%nWD6*I
zv<R8<w`9P0iJP6OX1a_qMTN0mwnAs;+7*~4@<7CXW~8!}i4+^7<FSj~&Ejr8WboNk
zj!rcSjTHDSW<oO|(zhGLvh05FL}|kt1*;(@7aRG~8tO-25_A(0JBUGdqnJnb%t*KZ
zey1qWxZ4ggJ_1orgJ{_`)GJ5ngHUY|DWeTzX<1`y4`V$vT!TN-pfv)v5U*PgQK^i4
z{JTlDGS*;#t<VZp18`=tO=86Gku{itUBm9IJ_Cxez}H<e)!}krlx%u<u^N=u$7n-}
zEdw?P%d-s_CR2}LCT|)^_Kkd@5oD&ZNE$?Wu1Sp1q@tdtvoqjM$suP+8cj*7*19N-
zniz&UtKy<`(i-^evQ?q3B56)0-o~n|Q9;u&l6Qk3E|ScNl=E)D1!U_mq_lAGjkfzn
zY2hGxJ6sbE)q_XKZG7_R3s>?;iKDk3eP9i6nF<^*=Cy)$SQ(4zje-Zi>{}UG;xtOI
z+xGQklTF7>znchW8LN?uDi|E20LU&0Hs*q?d5EmxgK+et26l!Ke<75(0o7RHW;itI
zqocK!qz=0nHBQ4d*leTn@TzCSHlk75<$%OW#QMG*a)Al9+DJ8nuG8I!>xN3mX6rHN
z+)QI^L8Nwf1R7^5(ov5iLU?!5`ZMYUnGxu@NVFd0lyta(I(%P%k(PMWe$(*%4knF<
z8$aG@*q3!gn*`GtZ;~(#7wKyN=OaW`STn($5>XH~i5(|ps#*@nghq_qh~Qq?HWna7
z7?L7Ds)>s5Jx#_0*}>gi^eeuAOyq?3Dw`^oha1bnco}q%Xr%PJNvwb@!pJc!X~44^
zeMcitgh6?QBMkK#{vY=4^Qq~tU-*51P(n#UXrU(bsuXETOXyXKNSCUJNbib33cXjQ
zOB0YTU3!%wNLN5aK#-20sPvrtu50go?|shPXXZRP56+ywAT!C#H|x9B`n+H4UTR_&
zj8fF$UNAwfc>#}|QWZa57wT}ja)-NYWpv0gpXWBl%s~ESXVzK7hC2>4tfsQ=e4VOy
zavX)6#DR?F6#95oPqKA_`nf%TD)U?i+xf&d$D7*J49^DRhWnsL>!=m2x%s}2mctrc
z=y0<>89tKhdpKskTok4RJ@y%8>Wt2{kMwYfk|G;B>E~)JA(0}xSzhi0=p*ez-#){~
z-_n<~=^x?4?J^E1&#Fpx!cvs`;OT_T<2U&#Vy}Lkl1WmBQxjh%RfXm5zmh)b7m!G|
zhN&N~ez82mgU0f1Efw)?<*6O_2eO7MaFi^(C1V&<GeJ5M*~l>0uc#h0_a0852QAM>
z!BC(!3m>>aFI>nboO*_bZr%G!f@Vr4bvwh0WCD2g7bFG*ibO;n<4V_M2L5t}pK&_v
zVAZbQe>J5;$_0NYW&iqn0>AKznO|y!N@fM>Sp^E%7vO`ZrW#-^s;HnADP-PBVGFm(
z=an@rzH(TT$m~h*$~Ot^+e|4|SuYE%8Q}34p1#-=qAO8Bk>8wDH>xVXkU-CwmZMfw
zJIA6Swvj5CqLMDX*E@FmZxY6+z&o|0_(IqKsCl>jfb>=_X-^&BU?yiGMU=|Q>YpW{
z8&EMW(zUx6Lg-o5n;LEdB6F}4RWwy^H>;qUByloeO<9{CYGeD*rwZk^jglbcTFJ|*
zKq(B|WAeiDXKrh>s_{$ozP+W&&!>uVRpaLCO={jkg_C&f^@)d*8T9BEFarm4_Xf_=
z24U)3r)pC0W!erB;bhfK9e1W^jI!AdN_~H}c{u~8#_tHM)+|$@Rin}W`Z|*T`Ex9)
zoD|xK+0rOmtlzH+cwSAdF3y*)GT8@)m(}!DPfNMam{mRL+Y|8WX8@AIyGRi8MX2F2
zk+Gh+RNR!tV-Zrq^XOZ^b7S=~nEGc)pi?%95p?Lt0oY8<haFXIIa9-Np%o>_HsxuN
z@|wzr`ERL#5zA3+*^d<^i1H2o?z1hb>(#3!dovVb)YP5^vucu=SY<a2!`u~O_NDg>
zpYXG=4@MSu!3|XcatD!ycapHL^t%^v45@M}yH(%P?qfbClM@mhIm3^9cihQi{C!IH
zzD;aw)J>z648#p>Do}&zr>I~G#2BMg<Z&daM(b3-oA7ECWHnT3;6xP;b;I3Cex<Uv
z#{1=-!Wo`_p!5^<07an0W8y}a?Ep<9uUetI+3i<UxwW4?NSAE4eSU6M#scUXu&9nY
zm5bSBWkM>*OHIWM%SUzaIad6Xx^hkGpr&b>R$EPc44^E5qbkSU%EU~)?vK{lwIj!$
zC=G0CxNDehpjOBloi|@t0dMv6QVE17$qpz=Yf?NCZFyR$vXt<3azH7Qj@cBad~xu$
zkCNy_a=&=o*<%aO>}?&bRJ$+H#Z!usm*U%1)04-M-Ka(BtNryz$~qwvauSz3R?}l7
zMT+H$y0Xc3V5r<wna<VBlwYYNS5rx-W{&oQGf`qQK55UZs2VX@qj<V840R6~qDoBh
zq?SK?O{1}r)ded=JHX|ZCm?MAkJh)P)>rPqGKWLSd8>P_14X&j#WIP94Y*bQFSLyW
zz|vYTEyu47x_${2yh=#}wL~BFx!PYM>0I7JQzEt)T1T~q;X{6*Ba?)V{Q}=VV9!LE
zvq`IlJtA(2RfB&exZ$WWd%*A+)!>>^B@#KezO_<YRzGRDVk$Hm#bk=!^xjbX=G&N!
z`I>!KVx5E@ic^n%qdt%;-OBZ~%Nsx>g5}hY)@)%*WOop$==J^|O5w;2vO8qg9=P)I
zDs5?IQj@!)`K$*-_y>9<zcsZ!RL^YE;jmM(@8trk@0<bA$Z0L<Y`+MPJNb;l78P2G
zcU05uRO}JqM>49%_<MMDQF>swgTK+f8jE7zPyTSl9&z^Q{Ko8W%ynpmNWwRH>Tqu4
z>OW58Gl%cfWNZI8kz|uk1YCTI<ut!(UfA=vV0TN9REveZQuvSb;R->9{OkRRi=+u3
z#^w4+yerlDp>iBSTe}e?NGf-obS#}Inr4ju(U_VqWy#}1Hdsf`_uG{(Oc|oyu7OR_
z;(M6k*yUgz^s@@pUs-;^n!C!pSdmG!ucac-|I}OJ)J(yfL?rS_Eb6IGxZ%5Sod7<S
z^$lBrT!qO4)IdM-mkXsPnrE+%UcD)hU0o#^Kgb#on53x^gpVkTG`E#6n(SLVBZK9(
zp!jy{EBaWe2htZY%fE43AZ*CFno*fEO`RFjKwq5)`i%!L$&v6wJXa{nwm<teuIIyh
zlwTg|kX8`7my;@=VScJHo2mvRUCovYjLl!?sSuGrkbIhL`1u62equxe+~h_xmgQ?o
zRH@ANif@T_oRN($R-q(Lqu2_RCD4>?1w<rr$LeMw%PrLv;(F_W+9d8DBr>|k!}a=C
z$2ZKCeT?7w#a^5yRN|?ZhLr(%*_EU@)_poOZ<#Sa#DPB!KjHxl1`+2UP|>P9B?)_p
z!)cJV!p*kA;5oIGelQ@2HS;yyytH1sbU<k%sH(AqAsm{%j56(|DF<A`w5hnE#gZF!
zZX9S9{G>0h-?guo)4n0IdHN8Jyyb$1RrTd8J}vl0XshW~=nz$JFU-C10TY6dRbNri
z9saEW8?crO8mrpgdZ*C4`%uDvVDm0|PAZx=lLTpx?JuQO(C<L$cMP862k#Iey^D8t
z&xY<id)J^g82oHFtYbK*;~yb1_u0q`#nJX>?|uKNe+>334pl0?_w5+})G;=sI6_dI
zAX6IrrZ|p&HnDp#McMgIuycy0bC}`s!)C{{UdW8N(lkxTRGgwh`Li4Ml}5W2XC5of
z1c%J3T#kl?%oktISzpewC@lnc2rl56l9!r&@s6Ha%IOWGet@quIF&lU*FXTx2_6Xy
z{RfDIhyDXZ!b5MQ<5!75BoMp$LQNP>==w^g{1p<qN~ydi8oKuP@++nCCi~SU<<**8
z=!#0{x?$*sUFga~<!y$p?I`81;-Py<SKnv4Ha~|_mUMkn3tiDu-k|K-aOygsQU3Ak
za{Fu7{`;$gK;>WO%7?XGhrg7Lx|M%E?)s@mSiKXrrKkKi5Tnv_b<7^RZLP9Zsr>bY
z+KtB0qhBGXyeennD#w9g`?X<*{oQ{ymH(0fi31<E825}uU-p90uz<t0qzKipSByNS
zLdgZa&KrzU$3=BEHzFW-?GhIwqkbHm?#%apD0+DcPyQUAGPq3WHQ|{5m!j9!xI%q%
zJE*E|l$XHCUuh=%>T{c;?yZ}4b~n#&`Hz}Ev}(Cs{ZwZ6Q;qeLDjgPH3W)l4_Tk}Y
zzI%e*p$f*FZY)#wTy43+%k7$PZuH{+{<&ng@OBssINI4zfFIuPi@fA98=LpOHH_yk
zYaZkEbDsA9@x7Xs?U(&{)C@mYe0KfLaFJ4XVs)_WCcK4mldJlq)o$fgu-3<nr%iU7
z`Gu4RV;q0}e3=c=^W;!eNcz~D5NBx1u4vY4y*ZuG-n93r&Z*^Au)l0xV{_X?#p|v<
z-AY`(RdO!{=QC&@6@PAWA2m_YE5%JOB=>`rE}#QYqM|ndGf<=-WV~yWGRS=I8T~u>
zgWQyN1UB~$V-0f2rIaBq*7)!2hzO3<VV;EJvMh5io7543yl1dcp;x)7qaxM%T0^`|
z#EjFED*34QL`5%cEGM-CHZDEK_`U$vA@Ojq!gRMM3o^cq6a#O#_|nNc4a8M2edI`=
zRJ9(fA5&*C*rB&$4q=?u7M-1()V)UBG!$QtF2vWEcAzI^wi+2Gz#4Pulu`GAjP&U1
zAxvhfWl*(gEB8*OPd5G<vC|eImreaj{yLjXckNaS!<pI^rK6d0(d&^gM>zBB&E0iF
zu<yZ`ubOd`j9?^mWq|qiy=iL4c|TwbNtOHbg0q;oSu}SKayG%C3Z5Pw7=g^LW0@yl
z$Zfqp;ryj|5r_=XG*Que*YpX?f8B3FX1%o#-x*}_p~6qO&4K!%t_!Z9u7YWf_1-O)
zHD29jnI^nn+13g?!}8$x`s)%I$`o)==E8D*S!UL9T8My<i(*WE=631Lb!=hOt3MB6
z0vy~?L;h7R4|i%hnQu6j4d(ky;B+%dKe!8J6@^0;6QA@u0fk3wi}UE`92M=pPkyF*
z$V~A=smy3$&S_}_ZBub;ULYFQNLRRJv}(H=>4$@U;&?Q)%weJ4{V^j`=h-v9><I&v
zFItkV8@c`hf1eFb_>DOfhRaBVe!k~`WGM-6;}3NHF5GcQn$p=Gab5!+1BC_=)MNec
z!X3t9m_MX8qs;=w_q!^62AbwNejn2P=J;(TdOG;(NzIej2<uE?#MKG^gQ%;seHKI*
zd&K@^R)n7=`U%3@T<{i>GS+_3189RcvoRCtx~UH4e-lT_>XP`x7<ccxd<Ih0=xzSS
zHJ^`bTsfta;owQpFyRi^>3WNhd^nzCy<A<$)+g4>l!pWIlRVREUJdcRgcTPZtr~3s
zttyAch%MShbwF{@5?vP3bk29*H{@>?j&TUs49mvLm6Zqe-m?_bhA!Qujvp*ws?SlS
zy5)s;>UbaitLPJx788C{@;Y!_)d6<8#m9W*rJpE)7rQ`%+1h~6(|K~j8JizibeJqT
zCH=l8<4-2N$m*mleR>v+ff4$w{(GXNucA~(3XKEG)A?WnE9w*y23@I|AENPmybp$7
zm^yMb4?EzgQs}I%OhS2LbU7>}!A@KZS>Jm2#Ij!N+^c&-#x10A<MnotV<CO!gElRG
zTZ{O|E_jCAEiKs*%iAy0OUP~sIZG`(8hc>IkbnAFQ`9PDG-%mZow_jN<`7?8Fshtc
zaeWg-7kOK|k)d#O5AcSxwA!8H8+<W!OI_H?IL?-_m~~D_h`Y@=DU`8<J;X&_&B`P#
z)UQPF?zZl=MdRlljcVd~F1nIuA`jE)U{3cb(bhuLqAU0^^x$0`GeX^m@cKKH--fpt
z(-|voy>jK&a~G+~zoq&5tfInraK_ZVq7|2phbgYOn&0tnu6CTO<OEb&gk{W?u#sVm
z87d6UdSia?mmn_eW0jA4(~UT=U|%M&lF28g{okcU@+%mvM;&N|;A*caj6c4D?^+D=
zG?S$@nLa?UFASJ`6iL|MllOyW%(2Ecyz8lQW?{E_&(_eGrQ}{{60F}EVE+=Ipd&x#
z6@G7rkJcD4U?O4+DqSL@(VCC&xFkv9oOR{$I(a3L;A#<G(cCx$Shko_2aT8oa?HP4
z2moz-DaV+1EIx33(w#GQoEm8KeO&A*H@)@4lc?tXCijq`_GQ8eF%11@P&|0z^KCQ6
z5>{f;h8`X-lh5eXsyh{Bn<bUNE78k|kBEXg8%2hoT)F(I@VsYiBhehQZ69ScB_C2S
zALwo~xx9Z3Hd^|?lvF%;)npPsF8PhE;n%yHq2B31d*8w-ESuFLO;Tn~odQ&O!18~x
zQeP-W_`nz5iQSgU&eZ=_tZF&xwo#w)CVn!PTD`YBnVbQhyGp4w&)+Q+eogmTg08$H
z(-rca%zY9no5Nz*LFNG8@l?{<?S5i(LAvnUUbK#ck6^aEDx2SXio3I}uz`XHqEb1I
zhU_!&H~WB$7wHAyx;}Wafp<Bbsw+np+gyd&oAP@hycT7I#hI$>+STrUk1eg`z^T;?
z8P7Uht;}D~=Ys=GBb8p=M`X+i>-?f0gGM|(2KI?BM6i|`N8j0ErKwMjV7)Mo5t7F-
zqzzLxdB2JBwBx1!`e&$ZeDc84w~w~FJbWu?I%(O*u};=V%U8}Jh8U1X<P;2Mj;%O{
zq1r-zh}x<5oImP!Y~gSMWu@)hUuIHYSSzUUeAhd@$M63vlbhu&Si9>;pir>^3Ay=B
z#>0oB_u`uf#52SkV8(d^v?)c99@qPDR8?ZLF~5Jh7<5@wV0|%0{awqa>`g4}2jA!G
zST*i|LeTcd&xnp|f4xR}<NbsC5zP`cDz~|RG?aD12p5OdDqg*w`33m#K)M}e^%aO0
zAJJH}X#K}nl(Xm6zpz*3p5cmQTRv=g>7<4B<MI*8{P_JwtT&|<y{n-4)zA9zj(FLx
zPsGi+vI@n|5_Eq&nJwe`CGUE<Z3nRg+<v0dK<F5~`@@HQ`|5WA*U<jp*jZLq=wB8s
z3136+aHSJ`pJ%8JT;xrh#;8*N7&4IG?I_j1z2xBfqjtS6!@oMoPDgGn3Wi?ZK(UKE
z<u?F*5*KekNRA8833BjNe+jv~4W8q^14LIWg&E{erMiXtQEtKAJhsY|U88>0k4%O9
zhSwoEprktLq%=5E(FxLwO_E3V$rK96{13<ol14z!Bp}md=X3W$DI>DGbwITPpqkOI
z`^n@fBXFDKLK81iyV^#d$2B|HagH&;`b5_gy2oP}_!0>XN78x652~J|ukSpUOD8Xm
zxj~bwY>D=lL8Q<`zz2#rh;}dkGJs1K%{IEuc%Pe=>h+S3@XszyS~CgCyR`Kt<YE&1
zoQZ|Vf)y}U4Duija#=?Pkc9esLH{0Vl=eaCCF#-b^bhqkIF2B^-re8|kx&l}j|zwr
zn4$kMjOGZYX51t_HJJMW=6n6bN0%zXmADQOitW9Oby!|O5#=BH3kQ}=08J=2Xtes=
zMio&faWVga<-8F7dJ-XzU7V&9BK+ij8|hsm#tp5&u)7qpq+%h5_PLG1v^%{yJvzBY
zf;^$u7+;Dt=e}Zi?@XO8!kHG+E%o?Vd%cu;jq{-d<z@=!-F2=bAlJ8}%#$}<TI+~k
z#>f<%*+gv(*&ooM!ZnE$<Y#&WnH0Cqdn8;+g98TTHQ9_WB%5@r8D8zHF%X7*=dU>s
z`ibSg<X*-V(WLcIQND*^VpUIinbZ1Su5WUP*XQlfP>(ve1XWv5s}dJvSr`+co5t#~
zQhAC}Tp2z>h6BP$FyRCpkt`|o3Yf@@H{}uEHz7&&^~a6LQlc@_$f}<r-P5D%C^2-n
z*p%c6%7ib%6_SWrev0cQ{7Dr*pB5*;B*+@X<5U^TubnZv@qa-}vZP6}-;pG;i_!+Y
zLO(?4b?ZwV#mozsvK`1r>!nh*r8Lw<WgBj6{Jf!d<A%=64V9U^BGMbHCO2;S%7`+2
z(tkXBFm((|mN90Ky*neFQZL&=tL}AU*6#)-VK`TemImxA2%Ne3lHu0hX`z)Bs*fN1
z{&2H#kPCK63L-~@n#XDT?kEnWDUKs)ug9}JB<1|b!1-*AYo6hXD^kkx4&~`%aw8+d
z=~U&~_sU1UYNG;qe`emD%}@~TsF2TgQl(b{q+df#xjsp9>Vt!5`{cLpbR0CG76ybk
zkI}_Es;3W~sf$#9KyMP>zivV9`z~R}`92T{CHiO#RrH#`fCGge53?IaRRGJd<|}Z3
zrX_J`6(J!GjO-7Sfa?G&)FbqDNV+wWJ^=9xa&Y}VgT7mtS>;H*zS0$Mf>4>!je>|Z
zHil)#t6^zjHPZSm>H6;*m8Ycj=F<PnGtRC7V51~@8!Jp)M{?xHdOsL%x6kTr&))8r
zHY9i%>NJvluecnpeiph)Rb<blzX^MeQFx5g4D3_j4Mzl}3mkA?+Vs)7IVk<sr3qN&
z%A7>(tT3MRauyjfmzcViH|le~M=nc(!Tx4y5Txhb+qHV;?o8%4)6GOv&4cIOsnbD8
z{8gg-&GC0F2q|+s4E5?*9Ym_$4<kYP!~$@afHo0a^x$D#27p{=5!!{+va9`n(6Ib}
zdyA`dVk826O+;_;9?@HD?zzW5aL1vK_Sl1q<Hu?|4b5{=0b74vg&qs@+m;bcU2M&|
zhyaH|14lvG!k`+_1g3W6N3>+KRN3zr)V{RFT8Iw}U_>e6Y6W7$bLU|Zixq}mxlmK5
zm*Qz5HGK761c2QK&2fQdgQKZz*B&@EYX+joNl75M=XNS{h%ppHC`m|tBFFH!@l7;8
zy{sA2N5_`ukJ~>!?q+uDXJ$Z~rGCebFWw35!}fl!v$t7=`KeOz^&+k_QB`0VQ$HdI
zroBKo_OXp4JpChLEx;p=`Qclv4R48^T^}un!$m+L)CR{<*Tdh@tH?XYUuUM=WacLK
z!dKywuL_G_NU9s}2z|v&RJJ&+sfjt*Lr}fvURt5%!xcJh2Z9X`D{<?3Y!Y$xhu`KC
z!u}H?z@Dym)r*_Y8-4f3B)aVa%L-fNKPd!PG5B(7nyC@lF_z#4^Wgpfzp!Y&EX<v6
zW#B}678(JzDvZA`DU~dm)44$NeE}`>!#(;5gc$nKlTZ8~TSDRjg5v(76I&kD%23x)
zK-<K*Y>Hs&tNf)c4i$mH2sn<{0w)MJe&YJfusMo|EheI*eEHei>^YzEFcb7q<a~vi
zN7#NVWayDSg_}JEg(qCS;2&*K(}En14WkTH1+=!nX+ylYsi*(J7LP7!!D62f@OgWV
zOkB=<%u9GIqBS@;nl%wcBhnP*k^%x-n7h>rPJiO>$b9fvl~XyM5%5X%fE#pxO?bqE
z;HW`Nl3dCD=DJN{c0(@qmqpUw%%skM*nYk?wsl1Xc(SASlgAGbSEvGk`xM~-kgdI)
zI3HpKlL~nv7+RPr*@~5ENm5uyQ(;Y?IZA5b8_?AE&*)=L>`5hwK|B=|=O#zA^)O1P
zb3SF3<PMKfvwRVl^&<E*Q}c<Qlso#T1Agk@#V|K0u_rUB2u?^%SJmBo-Y)PWBrCge
zAv*`2*;KM>gM-tW3Fms>=htDbg7e4qu{Rcg!5~!})}hEU`{rr(H_QCZ)29s!+Kjcy
znZ3*bBrNGXT&WAInC<I`Pl(%Df_;D(!~kPk!GkZXN!zSNyjDe*^2XkS1fsVHI8039
zv6f@YOxAlldR-`)#^(Wv2FOxaktCio`|0YFB0IKHr!yx}EAs%Nx5%v&r|Mo@kUKKc
zmkEGMX9?DjK##e(LeU87-tpUL`!rGnbJi;cv(mEcippEC{U>^B4w0=VLXO7e*cgPa
zIWv~@2VfPm=|I~eBmA+D=Du{r*M*92RyCW8Gj-YNgse3%8(Zf0Lf9XljABXpAk*rU
zHAul}^=ftvgY}#3#hT!72I(hUiO6ShYxGNtxl7#ES+YVLh2Wk4loox?1P4y)=!4(f
zv2Jo`d-G)d&4WI^3?BBM$ns$lDC|s#5&n;~=yKlJ?VN3H-5M4A!a7G-z7WpA%|X42
z`A1shKDa<vl3@Rl7R`E@0lmywg{`)IIrR#Hog`np&IRgDT3Aa?OL`h7+F!+d?);kb
zA|Y6Kz=);~01Y5M_D~FM5{TsYk#4J8^4!!g2bM(4-O3YwU~UgxE=Lgte%qmL!CG54
zpo;&Za8)6F0zisfp@mk^%i4eliy*RpoJH;|F#xF;pkK|hD}x8L)H^X?z>xb1k%&qW
z%VNl%Kx86KHm>*j=ME8>#Q^RMx@>_(2U@YEgjyM)pXXHC)+4_Bt>zrD8N{Y!0VQ;Y
zw&nu3r~?3?0JknOZ>_#3$Be4H9ZYjP0uU!t3c=4GfBD(V%yZFnNn%n6p~;~KbNj>o
z^qd70mU)wg7b^;Mtkz<SXp%4^pi8sTi?N*f(Kj~lyF1=5Y`-T#4JK`q)hvx6I+JEN
zgg<tS|GkDd@Zr+_8FF0l;m6X@J;yn<&$P#}9AlpaY<lbH@34m-f4;w3v$XozhZEYh
z&lO#`y5x{cWERsE_6gZ9IA9J_4;*ugF_o;HQ}-5Uish#pI`TeXraN<Ia(Xk{R;Lv%
z7k|TNlT>F1uW{62KyJk55>@mY)S?~dM8Cnry|oXbL}n2HCcQVp<jK;9o{8qfnrDDW
zZD-uL=`sr%rvAk&#$rJyB*dyWq$={ACy%vL-XizA#rI!g8bYQ?3Z~N@EsgYKUf3_8
zmzN$bY85ejFK+lpS}eLry91cA;h~L1BMvUU`z|ABFZpY@L0%3ljhON|F`~4X`w)jH
zzwu4M)`TN(qs4r^rStPO&M~627!M+=;TWq_j-BWfa$MdcZxCFP%_d5VjYzs<*UxU)
zf`#RM!tYUbp@ba0xwA>^xO*?No3-F~?zgs<JBWy#L9XE1{Jhq@_0GH*|3cR5N_+HQ
zV@A3hI@X{6;O;-;rasW6Nwp7=My%elYb&<Tjc4mGY3Dk-`jL|_(1Go>Xgp-uI22a#
zV^Yb2cdw`D{Ct!9nG!SOj>x&Uoa>7H7(vb1*Q2=Vwq(O|`hvg@KrerN$dW%v+kyQ}
z5+=AP{`=v}KPt8-O)P&?bpCdJA?>muK>`3!6p4V!1@HXN&X;<`s6ud2?H%(ghF5>S
zzVsa;WCGUW0RX{wtcvm;E0G`okan!FfV=NM6ushi2^<Pf|E=h8D)=2n{ht&)hqj7;
zDSC?jT&Mq1^wi^as(gV)6R-YJ^r&TAZ>RB9T6Gc?y^qy4q9P=Kf+!6vP*jBP^Wj}}
zl6(IsdU7>3c!5`oox8_|(jCvvb?E{pJja5q61`ymQuOp*e+Z$yS$}`nu0N5}BDtu~
zgN#HP-V#v1HC3YbLUBa?_ZRzc)ArEIY>qVE0sGHg3GHQ0GabR_i8hvQ8ueL%A{;Fa
z1+Yn2m_iu%()G*I?8854=1T2<@&*$nxLcGuPG;MSb5xR+9XCLNi!CZn$zs62`y+h7
zItQDUOA56z0>s{LCPB*{OA*O3N^b=u1lZ%j2d1_d*ll^M2ln@<Fyu%6k=y|2(u=R^
zSH{|oF+OxBEAG3Bsg7}VBtAfn>mRgvb?LLCof0iVHjI+U9H4e;%D1F@<tYG%BpP(`
zB~EF#6T=-7USGo|rJMbHWeC^O_j&LFxO{Ry(=k!UIjdM>`;~ptUWRjy{@WWl*E~Kv
zVb644j(M2>^xzSFw%-+~+<oR^J;8mDgSk9C;OB@-aiTI?!OIxcxrvhJ&3y0ajmLgv
z%MmYWj=s8no%+%1()`$+nDQ9v3_-a!qpmz!CA|}m9lWS_@g=3Bk88WGvQtXl?i`Q9
z`)x-J*|hl9CX`Mk0wByow^~K(KH3uE_KW*&ThH)j_^@v&8gp>J7yl#?K!-dV@J$fg
zEK-jbTfxRzH!Up3d3N3Q(DUqGdiv`Qyi6hz%zzod$Ei3J3`~gson5VU|Ffg#J;<Ch
z<T-F%xcE)Z<-m;*L*2IlhCF0t_x1WXD`k%cuXoelxX)T!H4WdKTzaKk&sZw#b{c+k
z?MCIZxCX~-L-Bsoy5=&zQ#C;*jV}g-;u0VG51T}*BrY*%@C2*7`%&s883Ziw$t2uR
z{wncDQ{4WS|9D63k?+sX4mk;d%TMowH-EvU@Tf9XoP;3p;;bJS*1|ve9WN)UgnE9J
zuKgwAcsN#f5^&m)V*(%SS$|@XQ%hic`aM35?#WJtwb<$CiC7{0+Jh45Al-dFr#9E+
z;qufqu~YEOfhft#cD;n!#AiR_o4b6t+^CtO`F8gDqv?db`!$h+dj1AHF}ds?#K#za
z>NN~xt|ls67TnR{KPb3Qb0a4Cm(uw`vHI=v{qC?Nu^3a;#Nb@<kloLAx@~`z!Wh4?
zH3J4VeF7CXbi8m*j<!P;j0qyA5scS_)Lw-bz&u<$gALzOGI(KW1eU(B7-R6)GBIH5
z5-iBSob1+tH{A^vGJectA6Mo|wEBuslu)n3U)c;Xlmsu`STZ-AyZivB>~6Sl2c=+J
za~$vNs2_bv0ZX?94~^y?d)EnZ{@aACZ#N-1+~5%s;(kPPO_2ub1IyQ4L295b`odP>
ztXy|}=mZ#JS*L#vab>PT6iU~VuDps>wuWPBPw}AEQ5%-t=n?&Vt$6xhK>GNmOp8W)
zhASbw;xZEWsP2t$VL4D&q&LP+LeJslFHJVHK5bNTKXWrO3h`<S;-|ifE%O5EW@Zjs
zFB`{JKjRma=cY+_qsEobl*rWT@Z1jg38^8`5;Fs3c!@<ztU7%ZH{D7KQZF<)L+M-(
zTzGHCY)mtyt|K{C05P5v$lE>EQn>8Z_Fl&4PNqBavjpn6iTD*JO*s#EP}~;2i390N
zl$DP4+(g+E0cK!%FM$hWXxH|uxRr`p@|YxwSH6$__pFeX)~)&&vsncB?;+{876y?!
zer2WJF6x2xkfJFdm*Hyol38g|*r-oj=Xu$kd>O^EdcM~x2116lv3FBWW<A$dC`?BW
zNf~-dDn+nSRCP1y{L@uJZtj)VU#ZQTO>R{BRaaU!yUJ-Ea*O<g?&=-4!5VMz6F=C(
z1`;<v(Cl9m;9ljF)m-tit%Ng32!CsK74mF_gyTWEYKA&hq}(2!xpQ8f$ps5DadV*g
zdaPxq29KURz}G(?6uY*3NRi>T273OR@{vKDRhIg0Na{5YM`HMO-I=M@UbLUq83W{N
zH3Q176x<q^B9JN`s{*rSh^wxaq=%VE))6>`u5BD_&-F$7hlm=#K{O40NjUS30&=dZ
zD9RtWK!I*drZ?d;3$tGjeDqo!R@5<`_(I%sjb!hMM!~3oO8||~>UFM?T?j*u8V8R(
z-h5)$JZuHqcePTZ!V#YuGR(q%7x_xXv?qb4SiN6*0Y3_l|5gSpB&(9IOM;BWf`Qya
zA`U<<6P#^26_zopsgBR62p4do#_1{1yJy3`#xM6)SJNye_6}+I%3=XaP|(k~SBhyt
z_Jv&P9=?VF98rk(H{W`1VUSCE5EI2-#CcD>?s5;sGb9>#D0CzJGk4-dY{7&MMPmUd
zZ&QizH)}%lPZVGCB*Y`L01>I|Yrqk+X*5y7#EI$4HFP)U^ebQrdLBhgOpylhEg<HD
zuvD^=WRDJe$KIF?(%LGiK8Y?Me_Q>#+IN4^d?<VRT2Q@WfIZIo-072%fUCjEA<Fpi
zXa2pd9%>^xk1DB8o<E@#x@VHxFQ}UNx14p}&bc4tC6mz@eQEBzTkmuyD)=jPbp!k$
zuk?-=Xa(RI*#a8-5&m$RZyeeBLSpAIIIeJ(y0(?&?&XhYyAgH=`-*o*OZ(t~g*84q
zPCos<#3Vb=a}k!NUUNW9>iZ>c^Z}~h`Z|Az%WApci()XyxM5I28Y|B337kHsyg
zgiX##bW#-f_X}3FIZgAnbgIYxJnT!Kjfjq5cc{1%s+Ui8qAfl0aR5gHe%mGrD7p;(
z+xkA_z^}Ib%a6pr9lIevp8aV5N&uhq(1ad_i+8L-l1>IhLysb&fP8Cpr1cLK_hoj(
zH|DNKa;Am+%Kg!?sRB8hj0-(35%1hKOgfvb4E<f@*|}>6IiG(Y`lqqBbKjtkRI=pa
zr%Ao!kGbX8F-nJ%0r9S*q@-tSIpLIJo?X9QLPEGQ`A%nRyMCv2Uu-=loX&K2{q6R=
z*z*j#_(IuzS}A^Y<k@|(>Dm2Lp&;~k!`I7W2=QD9ien!@oJmUPfOZVS{=Nu1|4Vpw
z`H6(^Fw_xAf%Ee17UXw*=L|jx7Fea-w#TwWV_7q?wGtk8rbyVRaNP6QG6o!fG?rJ0
zLBIhgnh6#<fiVu_xQDSRP4GPlZ&4$xqzm?j{QY<b{PJ@=@%$Gif2}|>{E?u&d^sL2
zA6{FC)62wO&%`09A_TSZLvti(i-;S;aGml9Rr!$GBfKsgZ;;96bP~bu5~-CbI#0pm
zY~*=e3ewRZ`57B&)EX%^L*io;!7LPF4wnrH!kV1GZ0Dn%2*Cqe!=tzGa+#5A!_l#Y
z(E{)oe|h0w%uz~`Ak=^_SPJ3~rAS2HeV)ml){4t0hg%Ot8J$GYX%o1Dg`&gC*-D3T
z<-;tE<&h3S?5)G$ZB*<XLD**PSPYNXZ8R;J7H^sndw)4+&wQNfbM}hX@M<dd>ET$~
zO|}oM*sh?+M2om37xo^Z_!#cQmErgzQg3}@(8f2&k(BsZ9ZkKL(Hd6yN&?c+sIlL7
zb8|i#r5*F#B0=Cytf+QEvqOTUMe@Q{LK#)EOlz{#e6r(7axXlkK|V#nBISZgh-1@R
zfrN4u1*ZEYA+!qq<V6=P#dXmGyh4FLt$>RrjX@0(YzqljRJd=$a7tDj=ut9hO!7QD
zk>zc|WNVyiOp1CIXK8dA_)(hH0$v&<D%Qf7XixDwT}s550E#d{S^+3G9cjD{4f*fL
z841UzzD>Wmou&XvpUQmBKb+R>lD_TrJQN$}JCc6i<;8ky@)MosW<|d1C>wolX?0)f
zF{mdwOi%deM%2QK7WtHCS@2s=u%0pOsWI4e&<g{d6m84cq^uMTP<V0-+(jrmL5Ek*
z6f|&$!RDKc)i*keLlrR5VKkyzuS1!q$&^|?m$l4}=FZBr%yNH{^;m~f_cV)nBxeYe
zegALz+7W*2bxxHJq!~l5H5sFX1uqD|*9$UCxM?a_^AcIJN1w1$f^ywJas8G70j)3A
zEz{)ZbJ|C;z8&R`v*xGaz}i#BbKa2km6rri0f2b_J$N$j?@iu`?fi}Hv`rn(?>f2T
zThT`gEL68%k~`vQJ|bCM3+ha0&$k)lM<DSFux<b)ziW};)1tXY6nAehY^@ZD#WMUo
zELwS6s9^k3xZeN%X6!fa1lq-{oQE%0y^DqGgTW>xGT915hfz!tWL1}Hd?c}W6Rtx-
zrE3hjOHCD_3iiT~N2`JpG31Y+kU^tY#I&I{8xz|i&&{@CU}`aBCzrvz&^xx!#kGvQ
zsN|Z1stG-|^0Y+Afueb(sHup&oro|RvHN>bU#x)j`Dq?LExYYqBHxw|?km+4q40l-
zOk;bUCj!qU77U@_h`N$i099ID$<+$DESW&1Q&+OQLY0dV4W?#qq%P0B0l9HXQxi_!
z-UCb8c@1{)a(6B4b*+k=Q*!`NwHwho^w8$oQ*4KmXF#=&P+(&eZP|)lv#wOw4#c?t
z)NQ1EKUQVxj3$!%ZqL)I-O-wTHe;O?Fa|?YkCE|lyh9Wid5cSk0%N;9jn?Gtr3$ts
zSBgY0YO)5Jw>Le7R_UC*M1>1$4n*EC=)KWsNNrQE^(dE^0Z>hqK=c7p!F4pe=VGKe
zY{2(7w|W$Qrok?ZC~LxD^z5%MCR1*si<#mYZU!S+^uWilGGZgZOC)tnG9<zac;uzr
zqzcY(te;$~-WD=gL2GRv>lOhBZ;}^ZI}@)4{$d=ENPDMocXkz=)e3WJXXK9I7tgMc
zr-z8&ifth&;(5v<wNoV54!bxk!oF^h?rS)H3h{!H>mUWU3dnWpsGnGYEHLC=M)g_}
z)wSq4l(BLvl>CuB#ovNd8%xRzzJ|bCpl>jyBQIb;4tu8`dn+bha!R>21>*GRPU<?$
z7|<@Y3XX_?X<?cI(AsxJsLwF3cGe)>M0>F(ajcHg;!x(4no9gG=aV*=!A>=<5aew1
zYH(8P?vC!?0%HsmPP7;M-_ssZQ+YwFgLeh~B2A068!obdWEzU6(9GR_<b{M$S#o<y
zwuZ<NO@uuS!H+Iug+Nu=liG?@scHO2Ui|e9Qf~zE_w4~GiW45!y`?9wsbnkHV>mNv
zh$WFQdC)9=)O+JdRrF2cvtC-8V2BnJd_DX2S8n#B!#6~DQR|iZ!fHo9LuY6qC}NOS
zG#0FP3zSv>LGM8-0aT|FkVrM~#^bKP&mn>p4188a&2imY$*}fAVdup}V<SpeC^=mk
zkQn<ESuY8OQcSf`+hoHYJbQQ5Lwim7U7#d{O{3#eGR4<5ly5xwz%B%Pth9=O5kr|6
z2?!Bh^aoI76p;ITX6Rm_^6KILC&4*sOoSI>av_(K$}<Js#A;`E59EMhz*B*N2rt%c
zL+0uTl+6X?J1|IAJ?dB8fOCOVT?u)!QC&loRJT1vC#`o^3AwWo?OqyCAPb^I+oYgo
zNNq}0Mr?DwVi3%Q3GbN>!G{M|z*+?@itB~XNGghSE3WJ-%5_t#b}C{RD;u)=L*DcY
z6Xy=fCG^-JGz{uuZw3tFC(K@SW3qv1&>@E&pu#iYX|e{Ey51rgC{V0X={hKcounRz
zIQIbSy{PG~G5PlZy8&re$-o*$u-0J=D_z>oI_I@@NcGN`f3k)Zto6$t<78W<O)3>8
zSxq5*c-_k+#7#<=WF~{yCG`R}c2F`aGUy~z<R$}2$AOx`)EN@&#!&KlBjT?@P{-`F
zYC$P<B<Ajpr&fAVN37Bbgp-%`01J(%49AVP>Zo;$4A<+#>T$Kp#-R0jhG`phEr3?8
z4e0kkj}-%XR|QN)46aj1J~~?Ufx3EHw;CB-O>7zOj<M{=!^R58*Vs^Di(U2J5+dFc
zr+W+6S|((f$kEbmI;-!<@-#4RG^cf~y};?RJXm!C7#RYr@v8}>m+~*jNJ|D@8BtDU
zfBs_GE8GjTKxODBYg~8%J;xG_3YRePZD(G<qB<J2eMlOVqJ71b^1XzJ*awvmV1y%$
zL>$8xW8nx4d6v(0_oZGDhb0U(Wj0cq?s6F#_epwg(ikejTLoiCAi%cvC&%6Lt`1wL
z;`_9`>NdVn{c)vv$Jk-bK7T!g<xr&dc(mI%r*@hVa<NkjP|%3uUhq)-SXMyirMmQk
z0fOlP=FTj<++PE;ESBxn79~UUB|ry8c|i9m;DK(#xbT?$RMPIZ$U<iYE~a{;ycC<y
zT8Aj@F8*m#IdrE<S{==_<DkXlk|8&{5VzMa%qQOS>jQw+UwvOt?>ANwVDMaqvdPa^
z$glO2-)(ZW$@Z7Q;F`&ukKp~4GP>9P1>{1#z^LA@1NRKqX}%JrMWI6S^#q21FJfHz
z-=q6La<UMMWOv*?ONb~98#@KZ?i-{6h)1s;Q3L0``XEA2Am1NY6zQ!Mo>~(J?|y!+
z@%;J+{Q`3Q5=0wI?(EfAIR35X@>`;{kScf@KsTp(#n?T0TO<)ypSsoCzGqlbRZ$^9
zQw-@g+PL!CusmQqO9pOv(HVXiIyI890#OOx`MwN3uqK^-l;0*zGCQg~>~#QPx~E)Z
zE%e&zYoG_kliMrcgO4_%UyqVaY8VerdmycAU$2riwta!^n620kTQaL#vwJ&M$)*Zr
z5F_%Y%w?ABtA={+M)k*y+K(x8-!~>Fu#|!)SUhMf(<%m0QMFvVGC!P!ZB{a%<Z(HW
zRSda)&nRZKT1LiTG;dk@u3-)jjecE|NH=4LGJ7;BVK$licO-p-Rx(f&BuMg$#_aaW
z($zG29Au*kjtF@V@PGFRWph7)JfjcfC_X?}{rx7l=<-wp3LD?yu?S53ecAH^u|FAN
z_g4j5(IDBudneCKMJKUxOXX;j{s$z^_LB|GEb2%(v4GslUVl+S^pS+#Qan8Sss*di
z8WG&8m))vJ*do8)sYtX*Vc=_w<QN-Dn_LR94+FBb=d`63odh$J)$<sCmiuw?m#Ai;
z6v#-}w0Z(VFHzA`VN~p;^_MUj@=VG|hw$$~P9=<@fN!^hTiA2q*~I_Urryf}W#Luu
zV+Es|jpsig_LJg-9&v(42Im8nF8dM2-$X^PbAkcjP4}Tk_llON=pEX>!g|#R|CgfI
zAym049#1hMqd#l>zf<(o;S*mB{5ZU?)T2FY^+Ob}TpHP?+a{$3dCC!NcXv!H?pE6l
zX5Za4tGU-1O3rS!XHoxPJYOTnY~QNc{YzH_yZM1loB#guV2=3@+pdtyD{>BtL;Jo6
zI)rAf#gXH?1WuJm4$GhSM>DS3z00-y<@_N}DU5>C>eyxamBCBRJgeWXAFJ<mM{-*K
zaa(M1|N1V^`me`wX9$6U%jU#uZ7>0$m2Y$E^L;!|C5r3bncvP_wcSwuz4L&BFP(%i
zN`&o2(9ezWms&4vFQ5L||I!_Wu)BJ8_Iv;9&`Uc)=+)&Vfl>lRLdjQ$B7^*YP0=Hm
z+eOHjSw4K#WM=I-C}VyvaHGlGE{t5(!Xb*k*}^GFL)P-aiwDh?4_`*eT0JUz)ok^+
zc2L&Zy=9}>+OwNn&c=I)zs1IPLPPGJ|EC8n_X590$k{&GeAQwb{9{ngF68e<i(MFj
zT;3i_DbQ+<hiJ+>M6fuwIz%BN<sD-LOIsb|#NWv~CCGhmbxKm9xOqQCOW^JOG(*js
z4>HW1-#&O@7kSe;>tX3z=N!*>Hy`E&et-M$Wf;XRm%=E4HkaZg&0CLNy>M=ORQ59R
zmh0=X(l*!1+IP1eSGRm`dtBR1q2TsrNTA)VVM0^Ez3G#4yL-#mNCl6#o2Bg@?LXcr
zc;4^)`@P+>n?RxH)k`VZ;nfe(QuH2VdD!7Sgosk~84)b&@Odvjr06>?x7p!4p+c$T
zH>D-m={IAjrQ|<n{;<>klU<Zjz{10_&VbLJLrQ^P0yjGYzlKpN2dzd4b_IP)in@;c
ze;*z+{V#a%9uXe2zN>IAeaN2e-|(Qj)4gFQE{*%y+RnKn&OAhQ@ZaQMpu00s9sHl<
zpdXPO#0GfW3w$*Zs1WcZB;u*h<WuE;lY?<#f%{?7GZ-yXoXiYP&pce-J-jj^BH~}<
zpdvPsIC~y48)^J6auDqkQ~xh@u=YR6!FVD$m=%w|pQtmRX#FEm|7lYFfAa=g4^vGN
z((?c94W_537pKP&y}|#&2LDSM49c}5VuLxk`9y56Ixmgr4gODT(3yx0h84Q}%Nr~r
zdV}f39k>!VB02b?w4X>0MwWT6mWBN)^NW4$pY?i>=nWFFL83HRRaLcC_3Yo?U`kC$
zQO)4L)xos7u!?_?gBkTWqB{7dq4{6xV8p-G!QaiX)h(m{p$`5hIrzIRwWK5MP3O#i
zk%ND_vWV(n`M==7{~`zf^yd9{b+GP#uMQr)um3kZ_+RSa$wYncRMY<>c#x<L63M}_
z#s0I!!HK2e$)%yCrT-gvaOVGq2glwvY)%xY#c>(5HEz$8->I}6Z)@5m4kEnIH)wC(
z|J>@kyFA|B^5bg{o(6HdqxI<9aGI#yhmN<uHYbbqUf%9(`@K8g@c8S8&i21QR{G-z
z2*a+9(_dRNm39+do#%hs=Z>=f8$4Jd^q=sc#ecwqj{hAVoMikT@L(U92oE|k2pp{R
zfu;U0@F4F$@ZdMF!T*8>ueAG9rG_W_@UmRO8|m-IEe29ilar*+QTmb*a0QgkM&^BH
zIo<@Qrsel+x3%Zw*{s<G&N+S`x7p;xWEV<6Jmr)3F$NV#9O&uJYYMfs=sT&>)Aj=i
z(&y3YNz$=wvtaR}@;j-D>7@hXq7CY8^ko?yz(na2Q$N>=fabO=i1Z<WhnR$;8c3j3
z{%_`>I-aU8`Z$&f1uu!jC>)EV3h?L?%|TZeqB-b5kr`1AM~hz5LPa0ysuvN>!PakW
z6$cNLhl%E()co*!+P0s!V9FYqkEiMeBmLa!fk&kF%&v+${o2a{#{xuia0|!g87mR3
z3G!9fq8~v?$5FjK^YwnW8>zUE3*Q&PHIT;?y+b5Whfj$4nX*?&r%>G(M(h;8K#JMr
zXq}RC^**o3qG)_H+X2xWoNAzA0F9E-#f?st(;oYbWdn)kV01K^@;dPKn9sbcI_b3@
zvP*0gs-qD}GzZmrsO7>|9OxFDXc`SC3~31W4fqars$2#~{FI_gM`*3p=dQdMbegKB
z89*Yn<x`$2De6T;b5Lpz!gf7+)$n`9Pm>!{n!HMr%MTQGuZjC{Tu&BC(N>FUN>Hf*
zRVE6Oog*^3U_^89zDLLAnhTDCvwn0Yf=WugKIt&~j5ldCT0ZV<N+)jb(l)(-Xbxs0
ziRPey+BGA3(pVm&X0mg9G-fIMy&%TG0wSgeSQb~EI}A$2cxfd&fVBOtFfXa<?Ue{I
zfWSSP<ns&qUO=G%atKC3cLk6Ni^ii4DhjBUqLR2tTx?RHB%~oooaG6xgD|ZT%^{YO
z=Ion_lqsV;@R;%iN%UP7QX_hTv~h(%GzLuiC`IT*t{iZ;I-Hb^r4d+yGi8N7m18ub
zq4-n=$ii@K!px;8?vp~mE<|51S#fd$O+q?srGJe0)}^J@em{-^sHojqzygXYsYSBi
zK}%f~<3cQ)C{ad3VOB^LfCeeOLkWqzW4Q|bF+RrCi1J*$MU0itDfS8DaGlFxJlyA7
za*WOTRx*E*C7>`0%W?nZAIW$0)WsSsjM{k8bzFRigw=@sOWF&1J=Fs>cPZ$*3!A!8
zrsl(lsh?U5sls5ijvD8x37PyXNkMIdu%&{{${}zXA{p)AOKKbi(l81)b&t<lg3l^T
zyw+hlBg-0PB)L&0PoVKQ)G_N%#R@q0j`Oaq<xIL2%3QI&GoK`5soVX&bsy6pH|2o9
zV{E0)df$2eB&7qGP%6n;4yAq=j3!|tMZc3vzDK%cPj||Tc7-e5IU_^V7T`(PW177r
z<73WGGWfIPm0dQ(ZIX|*;;Mc}!E~G~LXIh4=4a02dC;OzCs`^k**9&`G^KtPIp`8>
zl<4TU7qJx^%B`-WUIt@$QXK~tV4o@r3`|e&x7t@ftRF_D4?L$5905-!Sw^EVlsi!c
z`6<Rz^i0`W8JQ>%@@h`1@Pz)pFJWhApE|ww>Isj_Q9Zq77Y1ew_n?eqavvrAR>@G;
za(0{&T&EWaT@eu^CfIN<$tva*G*XDpsGFH*1}mlqyr%6zlV1pCITpqxsN2IUH6Z|U
z|FDn0qXgBHyCpPa^gsG+i$%(yf6D%S3y7@*`TE;zTn`Kd=s8^H#YTn>Hbiu%8=*I*
zY&Vp7iH&Y<GKQ0}@WMta+;k-sT;S^nDHYeMTeRXKlEQ3!B9%*lr#t=mm;LXM9^h;E
zd4;T4pv-(c&x)nAFx*OZv{*v{$^?GGhkIMk+*mtbD}<mj-S_#_jIw>76}g=x8oTRj
z#o>mI6-`dClyxZ_-NGKQf5C>okC-E`G7`^P7W;1Kj+!3|sUD;|8+NjwWvm#VUuZoR
zAR~CK6#y{<tM|iDPo9S8GM)R3D6^I9bak9OnDf%sr&qiQE9^^doOQr)PLf$sE>gbS
zW2-*zQ+qw}><;3wa3SM!@2Cf2(YGod$^d@Xr4)A6DwFpOEL>VlSwB85HdkEZiR-zS
zYx{t;P-exd_%XsEmSvMGXo8%1vA&2Yy(v^U-Yod$@T78_d}Il(;+_o3*PZg>_Bb@{
zbx-F~&^3kgr6i3j2knzgyJ}S2gI$k>1;WTn=`)rBqeUycVJiA<O7H=q$kE6zD6MNS
zPn_-#83Jd5CGkBq-y$hb?p9~UfHk~)2zMzyFy%>5IHPn8(d90v*XL|}WRiPM76Jqb
zdj$F()SJxs1%#!*ufg9nh;XvT8uh)!wbMbN*k)sL&p&R^-(g*#B_Bm4nnSPx2GtpF
zFN|i48?f(J#A$G*5R3C1Vg>&1@i13Fj@p@VLHie2W$dC>bm^1bQ_k2ga{h94;X6B?
zF*phVDA~DyMGx;!9g0p9g)1w*%FrBp>T3!L^&%Oxo7wi3Z;vTOa^vnATuM0_*k`O^
zQI^VCNE(jC2ff1MJ=*J^quD4YCAP694C=q}g|_zsK=qJUe|6|`(i*6mZAaQ@)EV+A
zLnc23uIHcQe_zIl)W+D!{OMG6Co_qXuAeKA%Fi|bz%q;go*XSdJhC=}gb~aSjex93
z7+rluf#4-N=25CP?ezgFrPhu57oGzQj?u0$Og@irJ^RR?nA@b1VH8tg)L2MKq@&z}
zupzCmDrYF64C*UoNbZ1P;)c-9BZoginT6;%gRqoSU{ZPLp#*L%5NC^}z^NiNkdPE3
zpd}K#QimfW1@06x{Gw1YG|^Bz(laRpkq!hB$I#w*+mM+6l}bRClR(Q!@{R(q%L)oG
zEvZ}xQdp5S@WRV+Lr!^^8dhYNG{YUY*m{|ecP7D68b}mI)8p7nS2ofM9%W!0dBz86
zy^9o(prKE*_7sW=J&96FA-^sWjh81={f+cPQXgd4giu8%5>BE~-qB#3da^~#^GwE6
z3uJmwOzwP)3OA$=8e1eE+t*`~9~4`j8C%gBTQwhBa}rwzkE@rDYqW@KmWS`y<5;F3
zU^qRv719Hb51)(MVu<eviW}DEF85L~u#aUW0jfJg`=F7O+!9CTE@XWeJyrTo%t+eI
z_?0cLOO#L%)GQ~HUKyG|{>BmHkU&-l&PF~Y&5)sZlfXcd^s^jv3{Si`;Yt-C>!^bi
zt*Ey6S)eAx!w%iMHy|G;$pwsnfiwSjgHk;b+vU;*_M}NK9R8#ycMZx~P9s0bL*1Mo
zzMdm3Yvwyi=C|HV>288ZC6hZynNt|2ZkhqF5emSyNU|tF?jT1OtNEmoBQT`{_zVeE
z7f$Cl_PgWt=*KbT^&ahCni9Mvrc>Yk5BBaWs)?{|AN`~NfdrD!J0bMmkxocLl`5bJ
zr~#3#B1KS86G90^DWW3H2&h!0DX4%1A|ld7K?SMOM5L*J2s`?|->&O_ve(*Y`)rP9
z&A~IzeP7p4pEFW(Y?vUl%^~lsj-~U65g_%NH{MK}o#EqD)6NFFWLuT8FGFl~F_7gM
zyuTq{p1?UZqz!e+elrc39}ZNKH8QZ}bSTcbaSrkTgL(r%cm{z~94eI#@U4QtpxX#7
zaI7Z!Qw;(&c>B>7B60xBQLmMmgYS1HsMO=uhOL(}m5u2)ux&RwhLMlR>}o@bgQa=F
z*V#7STPrbd?zQ<p&sKdNuF3AF-ux8z9ILiJXnHzG{mqaH_$`!{>HWwOLTkg{i_gsj
zL1Zu}ll{qDZXX`DL7)zYntP3ss=3WefgS+Rs~=L|CL5~~k@q<rUJqc7M;P~Gz?qSD
zoVxbL#QeQg`QQP}GbOcMTaHE@tM}M|cH08E+u=|2Rr@EA+!u|XV~t*c3p<nwv4GXS
z3zWx>V~hw<$RmGV6n;Pgz#vds5RVBNT(pR^sX>^mg6alxHEXybwcJ1r_uOI$P8p>e
zTmrs}^dp10CyUtD*rfo-+*6LlMdaEx&jB)c&iP&)j$H<Y*dyHoXWjGqc&~C4sZIx9
zK^^XB(9#ZzR(1}Ioa9s^si~tLI1C}9K493FWQW?!M6QQ7*Jwpue6TmEkf*82w;!yo
zI;@9X^*V@0UbT8~zJl}lAr&dl>)1Ty7l)wDC?iYuOdRT@8Vef?<N5^r#Rg62FwKA1
zpbZ%myUKG5Q<DBa*kDsd<=#NWBhkOuU@8gZY=lY$ZfpKOu|d>dY|w-b3>sDMIaiP5
zReySx+KjT$9Z+#(H=U_NqFtd`?eHl)<YhZNE?$}sa`k|$;_^u~VcwH#qDu7x*r?a#
zRZpztkNDlZfiDIg;i2hRdU<0~&0dXa6)$HT)^-nraGC}$hX2I|4>+?;UEl(*vSzG6
z8Yjqo5}AtmYYnD7Ed}<SQMxK9#mYL>v^wx$5eplfW?_Sv>fwty8~=k1TB<yJms+y6
zo%(9jPi>amJQ{xRCW;4UHM^O%P?848dMx5|WkRtoeXvRpbz9{i`<bt|QDG&Jta|;l
zdc99i&U&%ge?>lFVS}jKbr(6UDv>Vv4TC%E|G@^SUQMpXX<{-3f&Z{U7Zx@Mlzt}_
zoeOD%STq%VMdnsMony^k+Dd_%DzMLAY*4csV#2}(QIF5oG$vOf53sO7;CbD_=TB79
zeq(r;22c6wK=Vt;vvi<7uc+`KN{|HHw5>LPw}7*n-x$|}Yd|<J)OSq~7Y2B{uM7v1
z0Qaz`+?pWvwkCEG@L~x$eXw;dt@W#I^Jb-#?Njux{3f_h&YjpCHpYvgr56X4+aQb=
zKVsX6G%zi#4dE>S(YD73V1_U$kFodyEGDzTaWB(CLAL<J>(259p<`{b%lybVo>)co
z0SxA77*8w|GtkDsk~rpT9Ovn=0RFExC^y!j$?^tKOuPw`=*_f>W7>!_b2QDQzjin_
zV{iq`LnbfX#F<mzcBg`ue_URAkG&*@a$GBY>02e0h3lA~ga<CeEm+>*<V$Y^chFd;
z1)|ehzw>;vB+le4uI80R0h`)#C%%f)riwkb3LLM>Jde5%z2Dq5ll2OVV}>HS@NwFQ
zOrXgo%x}(6kDjiAWr=I5%!$cYcTmiU0k&36wxeNoz5{SqI(vmU^FEz(ViK-43x6NR
zb3c=fKxZd}zP7B2{rb-vWU{<Lt@s^Q1?V{>ljRK#ydF>$y`##!?+k5@;|Y?5&;V#~
zO}n-xY=Y$tYQFL%bE(ck%y68039v`>4*c>P%Vuj?9rln(j>}{obQY3GLfvrY<Z(g#
zTxPqC>V<w2`4-2sVZ{s%>kZoEn%9IKt!d{u&0&e@n`ON<ai;ntq-5;PEfeO`6cnpC
zod51$a<CJDuGJi18z0I;GdWF}a0zD6K0gz6dQee(P#(pcOBigle|x@0Zeq1h>JrbR
z0iK~-D4BocU`iM_9rc$SOqqnS$iZim94T#xon@YDlQ0%J_{ZcQIXL<5T3F65ohzP2
z4%QB-ON`vq>cyM99o_9hN(|1Jz?D}yC&IMv(D4>yV4l<5L-bA-Id~s8Oo&t6!4AoO
zL)OxvDJ1AM65Aez(_a&jQp352<2wG29NaNsZw%uoWs!r<u<~!ndzU_zAA?;E<37nE
z2SFp@g`cu4Ml72Dl7nmfOd4wN(h%5xEZ`W1J!1E??<Cw|8jPD9#1~k^aee@!;VC#C
zk4dCm7?QX@$&>x<!(kRVc=s<k_;|Aa&iKc<tAEKsBEa=5lcQSggKG7stzO}4J&Hq`
zFQ-k031bt)U2gDYo-trDNsSv9)-~LVI;i%c7RPhBZG43MVXua>s2V!2hLZn=Y@CFF
zEx49j`XyIj8#w4=I{X>#^T?%%?LX7WAm;lT*@M#)Gper@?Pt<1@rb#O+ev(=MNRR2
z9w(xZJviuIXn%hJQetmP+H4v;HG6y&{_twQ8qbW!8DUG*_!;j>1GDk-02(Pd%iA};
zHwh!wu-9r%{lakAk=VXFOgCaUrT6Ck023~b^B=#lc{sxxzfB*NT)1NKN}-`$uz^Qu
zU%W%LndfT*k3lo(D+Z%o!;_#6zG{Fvsmc9owTB}M$)1H&azGdKA@d!%$m$Da4~4X#
zUfD4iw79e(4D+~{p>3j`-D)SXi%P6vZ<hR^um*2_I9G1A{QnXjTuJtDi<}->5~{SS
zRR<?y@nWiAt>fQ8*$ncK4QQQf<xIj&$*)O1-?gj0SG@YJu=#ye60>+l0_VM$Lt5}i
zYzG%Fe4J+4gB?H3R^jp(-B7%C7!OKgtqZ>f@?8^i5;k03(?cj?H85xm%;0|Eg810#
zJM_yF*O<o+3me?oux{R<4sMv8VB*eh3`lPh%wH=#T8}B*B)-^;r))YtTC*~jaM1oi
z^xkxt*!0L4be0l6^nKIw#E;&=9|Qz6!&KPo%ujs!PtU$Dq2GV{Atg@r{In<#KCi)~
zW&Mga|7G3(!{ZJc!(KRW^;M|GR+7usg^aDs-^G2*H%}skGmzUSG`7hZKe8saI<>Y9
z?`&UYY!{x`z5?1gv9g_KE?%nf`hLGq`J<iU{q0-kKPs>6w5@U7S>@un`XfnlCIi9k
z|KhjF#P1j8zZ;O^YP^HCci6ORkm=#Vj{qgD#oq)ZcX$7;nWS((@_Lu~pLhEcyDuM!
ztCwB$PoFV}TfCe_)mq$0II|Z=*-Ofp`MUon%|ZtYRrq;jKWwOd=zC|zwf#LL3Jc|7
z!Gn_)37i7|;6a@6yzD=C(9jO4cV>2UaK<_lt#Pd(7d`trLwkUpHP`>;V6N7wzS5)r
zOL$N~l=F*gCXVPwv0C@N>10Vi^X22a5IiP}+*}vD=6=)0to7lkPd87F)}B%+a`^hb
zI^D+p$I6#aBi~Q_2Ocyi)2+rXXWsZUx;E1(e~P9W!VB~3xvh70Zp<)35UpKjz^*o3
z7cgAz{>X~kQ#Xk6;Ap@6KIheJ35xct$lUm+UuP%(!h<WWA>JQfha41O<jO{1+;2EN
zI4+^BJ9hWpb#a4_JJG9Cwez3N>SDJR2THpYKY#ucyS4VEUt`&geP^k$|HEC+b#FnD
zf{wE|u)FJ7T{~#b!VOv-?I8{(GrWvT=Ql}aEj#B7;L6vFzY|ad{&Pg$*z499_<>DC
z-k9PW8}`6%*K<~)YQE=`7wP95Iz?j();jn423?G$Tw>)KZrZtp+sfxhX4^hcRLR!)
z;Ty|lB>7-C9QVmn*S1!zL$&73!1C51J1uEQZ->IC$PEXBnPoUPTG2K_#||8)_0ssa
zJ+k45c6P55em~T4U>`622F7hD7PaYOBNJuIj;^zhlwDkIj(j^ST%Y6Wthb>%T<78E
zbjZ!sJ?h;rDE5cD$H^N}@6FhJe;oFXco(H{B<RPFBP6Q8VLh*Cy`LU_*YA~&_?(P-
znRE>E-1noi{Kr!tRVsYAuS@Du{XQD#!sWa@k%qGcDw;uu-}~N(`gJVE<<$9O&ROLE
zz)^f@Ii3sL<%6|XrUAeaeHE&AsxOS3-xFSj1Hp9DrYN(aiXIQCH{P^SBYXiIMP)(m
z@p#NZ{q0$~c>zP0bBckuW4*##w^(a@pF?NT8pc(VXgc}1`e6WWRJq`~%8p1z|FH|M
z*)HdIg38idF9hwIyP_t2Q#GIBk(c_n^-<>(v!52{)!tmVO%-|aBwZWN`MaQ44$sbO
zLoy2xdftEA3ww^|Y5UED*!N=DjT};o0Y|!>e-{K#Hx++O37slN_$hKFq&!jJx)_)}
zZN?$o)z2yS(HTfCMHKcg{ytkblS!UQF;Jw3RQw4w3Lc9X`SYkeL`Y`=qdYAS0kE0?
z5XO|g3<6|h{EKUYo?Iw4FzY-rj{!W|KtT6E2NlA<+C~-bo0<kdyt#@fV0n%n-!Fig
zBm+4s9$`lS*ikG}(O?%O#!A4kD|#sMlUmjbshkjg0F-l|GN%Pxn6CkGu-@F-qL1tZ
zd}4pAI{?CAp8!@e;9#@Cfmm!V2mwjjU3j2tFN_0vW&q0yY4VxvzVq18W5`Qe9VMHN
z$)5300Iz_qWK@wpz!MgrID886EcR5IIA8-q08k_!P(vBZq@;*zPJ#@(7<+wa=nn^$
zHkjF^o^Tk?;r3S>Y$L{4p?Op>q5TV=ry33ziMMNcngW1qD2R*>n-LLm1`KM1O*(C7
zxj>tM$i~gbn%8R6`4M-CRvvi3Z!+y0wM2ZetP$cz_9-%c#ip&v^jt&H>Pt_loyHP9
zc4(Q2*KNQy&RK9>5>~_m*!0(bxp)^2nC9Nx>dOLyy%TN(*q0Cm_l2v4`LAb)<_bc;
zDH;rd$nXGNK!eYpn6jFdam-H~@C{>&RCYZE$KVjagQo`^&&AE0R2U;Epi!xr3H)I|
zM+JzC3$4!wG9M5<L?ED9ZHLDCQ<iGajJ@r0tl-`S#3qj{y^mTzr>vK@X(uQrobDx#
zx^H<u#VR$dq)7W67EsPSgd`KN(WN%*!kBApn{Tn^*SkbFjwGefG{|Q^6|+-(^ne)L
z>HLze`p__Uor~&p-mEs<-KM8%pZV_@N?7O}y&WGM9BIej66iG^T$f%EMbM)XEoD)Z
zRKGR=yF6>in&T+jl_G#Lam%`BCzIAXtfqqp=pqK#KYb1Y*f+tPK!WZ7K$Ru-o<PaM
zEmc2~YNAX}YCp{~?Y_ug9zI3(mCJ^(*(6*#exqwnHveNvDe2Mt=(M@%QNq)Q?l;fM
zojErlFfwVikRm`)XgIIcxAYPa{y;4~;YvztPuf5|A&u(rW`alnl~cOj5~Pgc@`FzM
z8fpUPj~sOL3Vd=EoG@)@LIUi=WO#mD1wleBp2Gq1)%;U!>UawZo5}aqQ#FZfr(L)q
z1qV=wRVmqvxM!-4v!DuuC7*5k@n6atUfQMK49hM~?5_M0Pww&+;lTlueL{_|tI=Lp
zV^4}d;CiYnKLFMX9GwASKt3|Em*5HvXY9T!xsuxw0^K72@tFpJ`P(wGv^2jt$i^Nm
zf<e)69vFBMz|@og3W`}vS?@Cd7>-^2Ct?~z2WH!upnM@Ud(w7%8ax4j=C);dA0@x6
z>TH8KCpjIStON!yxoigh?~XbHM`&UOSd_KoudYtRxyT1o4KwyL$xtv1e_qZvZ9b?^
zK;mVO`XL9j-+&{wO;gOTg5pt0Zo3kGfxWVS4dLDB(pn*T-rd20*VENcXioNZwF(#!
zAvq0(!p@h;H3T^Yczu!sKYq-B@Sr;RJRXvXTsGw$+yDT%wRt|FrsZ_ZD`T_qGY4Yu
zYfC4-&;iMsJKr(VUoSq7ZQ5U#k6}y^zLQz-AY5wTIX4R)gtJc}Sn!})k!Z3t3m!bt
z&D2;CF;yjl;9K{IHf`jreGfb@?g9i@5k^fOz%xvqkStrtJHhfiXbf((4V?fdWi~vw
z0kNrPf=NsYXNNk3FYXc#rz{TgcyH^ZcHg<G08>TDN6#2sVdOdP4S)^xAeBY)ff|me
zbB?N6N@^~`)Y<@zfOt^bWl&!j4p@Ybw29{Wd65f&%kLq-=uK%1p;+vs*ktVUmE6jZ
zW9!#naE?elx=n!5uf?eTPM<w~I!&DZjqiik*t}!*($q1XIWzJQW-aQ7350iQ9RSqH
z2vQD1VC>+2$twhXD}~m<4pju6Yn&~jxE|kr)1UH1<@i+-Wim)<lAZk+d&)s;xQJ{R
z4uW-F?>TFBzEFYlfK3g+rb<3}goYErv9v+lf3(30ID&il1UNLroL4Taw!c!DI}qTY
zkq>=h8~nt^#@`B~0i0xUUK;S6Gad#Lk`E+9n}A8aDp;31k0OL^>t1k-Iokkv**6|W
zA~&Q79wEuH$2=N-Bg$F!f@89vLK^@VORDG707yf`q$J4s7G%ftNQ^LB7@%X6EY6Y!
z4O%;CCUa@{>Ik#c=eJgCjbS=E`t`+vqV$=dc7eCesWtR-bzE?5fGzWG1ctJ&W>N&1
zWcM?`JmCYnKPEy^+S}!1zz)NK0dhHUDKu#feofBN=YS^hNEeyG2O!@R_0F&l5|a2~
z0HleaDXy$+ED6pvUSU{#8x)+D1~zXSvuIN`VH0GUMGCoQGwV+FbC|xY&d~L{9Bp|j
zD3&h?DqJLh;B4mk#%wS$)WC8i8^)$+rl1N}%)$E)8z}oV=@OO0+7eV7K;~3MZdeVx
zEXi3D&_uk@l6{fo0UUCbi1Hz*SFksvK~T;I9!ZmZxoSZ5Y^I|f#rVz$fEo9f8RSq$
z)rdR)V+L8h!%9Tt47<2@vGd2o#J|cQ`Lc=*h)myy@c|isnZaaA3dO+Yd2rVAV>oGE
zPx>)e%g^l=-%6gP&=vHq!%Ph%AsA4hC!x+5C=Cb1O~@Y)J{Rt`I8#MCzsc}xpq&b}
zDphR?@HXH!AhOj^g2^=#`O+tP$Ts{EXLDd-v(4JFoRzkB_+upX#cN`Hz;m_6A|F)-
zJM?0AE#jceGbTXF)+-R7X&N1{DuC%%-93q5i^-GPe64A}42mex1>x@A7Ey&Y3EA+z
zcHuV#(W)bGwr7Ofxf-~hK$^CVCAYF*HZ&V>6S&Zg(QvTiSeP~hhfl+l`l@!P8g!SY
z_n!9ZPK3w14ofCS0wfd}zWNegM%?dLC7<OdJj_W`A(3Zn0TPK|6HW$bkZp7cM-17B
zx5YQ)4O`5?$NBaEJ$I<$&EQ69bEu4Xvt@I)q(ELDM_6+TjQ&Tt6oDdBSeHyNfCFPa
z<atme9Qfg;nlmhhqDz5jT4^>NGIiqOCdDqsc*tm-$xchK4QO+!H&wIoNM!Gbz1fE`
z=Ky{XqJ<W)s%c|DSF!0GUv~IxLWYzj1sKq$_{~!=gh~`gI42wD5@>F=8mvhU#@!Y7
ztd)v<kP^d=$KG8Y?2Fy$8VzSN7pu{A%XjNIh&-sE9D-#TgI2*ZHzS=Qs0mx4*6%7!
zkzsY2J{?b8EyB?p`$KqJdz#=GMHfiSv%{Y9rz&4ZWZwB!Cn!E_OUjhC&ousVs8HM4
zwh<2e+#QG@JMbKHn<?%kfBI((Hfexqw&SzC6()3Dak?)TK_FZW&N2qe)TcNBwo&0t
zC5XNoz?pe>{plevrt4&ZJxi?RC?iAL08<;|m8^Pm)@Mp46L9Pz!2lSAc_${!F$q9C
z)c8HgTX16C*Wn0ZVfIxr3`Hi~!`xjQ+Co4@w4XIZutn$qb0YL(iqwXGz~IdaNde!I
zS1e#KSO4i4y~|ttZ#PsExuNnOFh~O_JO>KXySuZD<(*l+AX&np@J^2Fh@0EKRrTnT
z@ZpQG>@y#XA;J`~R6w<x?92iN+n|FX&L9|Y`n8F8s4;Ss2wGK34HOaa9MKcUxGXCO
z&5UNNPz?)SAJ!&=Gs(1s+w5%?r!9rV8(wtfz>Z+7@7ODpy6eC&z}Q80E=4l?MKXk~
z?2KCJeMBO9{5f<0b4F7V(gie#mFAg}Z*O<qGfl>I^|crSH=ffdPl3luF6IaCL@)pd
zjLe@(R-snitkRyH9eo&?2!)ZQEQeF*9%+SRp6#RL8TKPEwv-#Np7F6BfWr&MR_N0q
z-gcn%92>bl(Y^lWt$JE8>2-wjcrT9qh>b)~SfXb{VqV7>cNJ|vpzYYxQ8q(aO8gYN
zJq&8EC{7|L;DDCYm}5s`@(l(mWvOF`d)~|M^xr%_{=Um)#gctV?%lgEas!|8ih~<>
z@9`gU55JjC43o^oh{M5Mt{=<9{AZ58K6c{IrM#a}C-(oGz`vgOBQcr1cmgmZLDhLd
z@+9`dg4L7PSvOsrtvNDE@$9XWM~nF!Zj*RcNO%UfK7)krE0kH|L7MsS7x9+IB%;sw
zj2UJb+4_hS`EVNYqDQ%f`g|T3@(SPek=mR3PUjbV?}IfHG0LKFv-`>&pYE&ifvfu}
zUK6@Nzh3T<F8q`Q5BjQo_Elf;)!6gZ<T<G&c~V>be*q7w-%l8dnO5wZiLUi|zVKgo
z&_dD=ukJ@M^Gg)=H9hWkDl7R2EdiSe`U?*}^gGz<XW!@N&^IfHf(eZJIjs1h13}LJ
z;6XRXQ|`x4xl6(h`G2t$JjF-;4?OtA>-;INo2R^2zBpJ>QT~2DH}PUte6L8?WEUHh
zSQt$oLgDb7%o+clm^q(^{vncFK{W0j+}vrex!0qJ;G{WiPynTECd4ct@_kCE{?%8L
zb1@NInjicrusKI+z{#8NIr@C$=YY#eoEPZ)+_hZMHyfiQ`Qrp>exIMjC#6$X0+KH;
zT#?V-pGQ%!Hi7Z?b0p0I(KUgIoeNHPX-Ss@v*rRW45X$PrG>w5qVb?A!+ftLHQq>?
zge%S8k_^gk^*?)NF6>%Ufn-Xdep68^?M`b@vDrMmC@8hh=&b(SUG^mz|D_xjJm@%I
zbSC&}eL$)r_oXC*sv_85c+fE*#-AtRy^)yN)y%o3`kS-{7Ch+h7xOuAP9@MTE2O(5
zB;j&M%ab`7m)S3AfvFFJsvyg$pF=v#LQm&UyQbh@T7|y494g-7<DV1S^)U2JYiLhj
zXzynhJQ&))7dpUmdhq{;2mil>2Q`AvjwaZZC5CuJ+9FxTVDhaps0s$`FtVwKNxW6I
zX^Z?(qR6g+iC4fRh6uCHjq!Rm&_gy*oq<U6)nsA}80$gxKt&zn;EL{w#0pbG6r&8A
z{u+Zezmk2Nqs(*JPc+7#oQMkS=d>7&JmdkvW<qXdLgX-D6~zSKBT?29n|8GG;V)8x
z6u=rJ_DGg7So70CA>M&y490*pR@qPd`WfCIeVfMS@F)RKj=tjjE805x*48htE{H=$
zbpBsrkRz8Av!DFxpD`HrUt=(7B>F%`vPVXumUFxh3qur+aR~V3ive47K_eR@^I4)|
z3}>Xlc0nctE4&@133hnF=J1{4+S!emRcc5LOO|9c3~VdZM4oN>>5&^%Fbc)C#oxjt
zmW`x1WKwPBe`&Fd!Az?0*0z2$$Dx{ES~Z&&R)09WI?pl&<(jA=xTpdQhXa!1mUEQT
zUt<t@h#q^TDcM8#pD`$$<iRoqYcA-}*e=r&y$@V$nU8(J5y#;8t;WITt^oEIrYcOv
z#!hVNg>l>(V8eD%JtsHqn>fQ*#^6BYz%Od_2-}t13&D-sK4l5fFOrLXaqN#wM2_CN
z<nSW4yK%keO0;v$_S<OAXd0Wf@UL5>3s<iE(jz71d9a=N#o^xcgM8pe2<nf*B*zD#
zg!TuQqHUlzkQ`$Q@t2){DU4or{dL)a<H`W?vPyJxzxmG5jATzmsG$edI4mKHgLdI$
zj<*<Lc9NmDC#dZw{GEP)`gr#=c3SRm6?Jw%qN>rEC(CCKhkiZ#{WIgTfQG+pUG2$^
zT<w6Ns-O+|z5=7@_2tD4g#kJ~nO7}%Q*o%&?w0oHrA?*bvO^CJRR{l2CTPHryxs)A
z-s{z{mR#v+h3g(^`YrLY;r%D>Q4h~~u61U?2$@*hJfdys32$uV*UvA5_qQ~snW;iL
zXO_3LX1lT#TpxNLtsFI;ZND$zWji7&<JB_SoVeQ8?t9|TTH4EWDQme4glno7wC@Ec
zveFArmVX~$aWu(%8fSJ5)@NU9rJeej7BNqCg1*Dv^Q&@r(eUSsu_DK8?&TKqp}E-K
zXQQzbDG5@Kc1?G;*5}_oI=gSSH%qr!`+g$D+hn$3@PlZF2W3FMcJo%3!)4Un1T(}j
zYGU-t)=bgyy-eTy6MwdJSZn)cxl$=|c`?{jrHUqO+I63E)~b*Fu&+cf8?@USln%#d
zqUoq8rvw7%12)T2^nz@*t@6{^u#vE+_sU#{eKW=1dcP7-vJd`0;6bY|evz;&aB84O
z>Qnjr)6cf$3(mD$``;$AHd8ENKGF(zF70e9&?#K0Z}mdrq7{oLs(pNlh{9U^^enr7
z@L=k!{D?rf(u2Z_J4$7Djpld^i}U^m9;|-0qg++{UwBaE;nSsOA(#HFzD1c!e%$<u
z{}n^5a%k<F<*CzAdZW@XXlJZOk4K^V@ExeEQx3bRDVx*8n2m1^{^@8wPo%aD-%+in
z^-7P|x{WnjR4e?m&3QZn`ILILbdm&SH{YIpI<Kv}BJsjt;k*4e{n_NuA9f~MF9n2N
zW$+%}D#<`|2~ZPxFE?9q35J`XGlcS)`=^L8O1}w?fgw2+{qjz3@rexh)vwkDzs9B=
zTEn+=`YrcjD2cL8p)6mp_`<mip>V}oTeEn@sYDwY)4L5XkH!Ac8?`mWC+L5CKa{~6
z!t{kw&s9&+8V{KHSgM_y53y7|p82Fi=H$G65h*_=@S!>KRJprc3d#j;==pMb<f=#(
zINNv%<znOgBB8}_zA#o@8hyhcreD`TOIyfWz1HfX(6dXQ#)V5`zVu0;Ro0?|Qxe=$
z%oCp1R}a?Ry(-FV<g6PIwaYvNLqBtKd!4j;+069EyH_EJyjHVQ{TjsCTF$NV7pJ1X
zRvNDl2v45n%@~G{e|A<onZp(Py)<hd(k$fEq!GEMI0diUd3e{rn*3exy)g#NXH#jC
zQYuMo>d>tk(8tbp#92j1G+paN80K0?8CMW3_d2t*%Hl5|)~V>!yG<R553zjb1~i=O
zQWE`E{AZne<<G1^A<8w$X1mg5D;#$dnbSrman?&%q8Z}y0?q^V+LZsnfw6b(D#*CB
z8$IA=t%a+wl$bZy#_$Ouf_*BkC%HG8M^rI&wO7xiyRltaznKJ0kv~^DW53iTk+(1?
z)qhb215xU-;H}F{GLgmdm3LWc*JWLcla>8H!GnoI|2r}GUtw_cuP|tlejG&*DPywh
z@7o!6|0M<s$C7Kb%ikPZ4_Eq23_3ow^GJ{9OUFQ^h5&XoXKBtpez0z#Et_&62=U&Y
zAhFcOVaBQgPbVeFwSMS5?XSb#?Jci!htomYrao_U^S+!F2=0lJ5gj$KHeMZkb7{Rk
zYb)^8fgFo8Uv2DdPaClD<4pE5+VOnre)mk*f)2(l&nV|JlTANbbi4hG&+R1M*GA_-
z6T@|iHkqA9n;-gb)a691!xnIGE_US_K15Vtpz_7L>9O4<#Xq-CX_gGSoLu+0uh*ia
zK(auDHptvkyQJ(E@Z*qgTRZP-VwvC>qtxs7hY#*2EGqgf*=w#cc*`-J2l7Ps-#xB-
zd}zxcS)0V5u|Nvg(Nj#tixyWS%5<H72Xg3NM87v8OLMw4EgpR_IPygMN$s(vSB5k#
zE<C?JXHZ*+Myqs&+tiF$_9>!hp6z=V)Qq@Ulxnc6S8?CZc)qB>xl=yqt5F6~hyMgx
z>(1t}cf4otHnes6x~q&$u|JUL7G{&m`|xSvBlURIV`j*8XAVcj5(#FD`gx)HYsWo&
z8%Y?bD*3r#9EtES(Sa&=@!YlLy2h4+(%%)AGNGEKzr-IGO8PzZ8Z}DCiZY@!$PjzJ
zI20Al@r9sVbIw!$=Zsj*WQUE&U|KI%Q~S!ewXUj`D}J;687;?}QXZ5NxUV|eF7IDu
zLaOyL8}OC*zFmP!IocC;zCM34vdkn1eYIilm%}$YTf$pSF65o2F4fc4%KqIcXT={#
z4AT?c;VMw&(T2N*_t}UpB3Ipq;swhU<)vY1&dM7UzLqxj#EH$TE^ZP0>iXIRIw?pG
z)ri;3T5H`*uOoGNx69=uyUp()#!ab57-x()@*iuaO1?VkR^LWFr>u3=>i3Lzx(!(7
zy-LB^QtVSVoMv8a{HHCerkAIUI25vRFnQOHZbO+M)E=&2g%cZM*=Z%(fJ-xXWtVEf
zB%J#FW}%~jDlB@xo%a3r=y4BMk!ryk2%4&RG2^JD<yEV&Rg1KCZT!AS$N6*<askxL
zAl6}mRZ4WHSLs3%NqUTypePK!W>ZGhR`%}F^F4PpY1EUluyug<Quv8Wo3-+5Knz1n
zJ5_eTSAN%HCL=wZhvXIi&XDoNd6JTInFwi5yPQ!Mls$I`MdeDL)N}huS<frmJ)m}^
z(LTl{;YG2plq>2LK9!8bIJ5KDl5T=*>rsbb$0&+xkfBRM61UyrqYb6mhVHc0+{V<u
zdNyEJer-C@7sx|B<1ut#PJ;PhY?4@;dV?kg%7_S7{Au$;ac3~BB<AEbH*_*0a-B;Q
zaZhS|oI^ECJFO&)z%D<K;J`kC(k+|PI*LoQCrU%mWfF7T`=DgbJm<49x<1n1y5h~x
z<3x^mFwlRRtfiZNprt;`_?jQRXuk<sV|Or>A8St8&Ge0?lc-$fK&nZXdQO%McnI$E
zdsV42@$3dP{xIXWqZLn1#1TFPEa|e-FnKG_`-QZ|*`ApoJhj{FxcpWZIPtd@+m)*Q
z1KX>3^~Cob?+@A}j;wCuFK5B5!^WkatrD=Bgy<&1#4Lnl^AW#FkVDaBh&Cpncq|D{
z*s}Ph1<jlyuBb5~R-{@ccrJ%aDHEc&MLCd3P_w6E{5Xwt$6IqTT;T`JhQV_-B>Oms
zK&hBxScg<3Mbyo0RWHF{*Fvz2Vittwqgk{}?L#EURAGCNSx>yEZqfW8i1)pi1SVeI
zo-sMdP^D4y>@8Zx{~Ck3QzXJJUYbAN#t(0z`p+0-f`OZ<##IcpCP--*GHQWf;%2Ri
z=y-;*)Go6?&lZ}~+W7<Vmfr}n;&(qv$BR1S35a6hE>Y|PNib8&fu-G%DGtk21Lq>6
zg|{j&h@37(K{Y{<MiK65H!GtU)D)YQcS!Mr(CP_4^_a>}u!^ZzvrPj3I+(z!vC#!h
zxA>~2f__dV$gkq%{VAGU1VKNFrYh9T886rc%$7q0JRyYi6WhHB!T<<m(;?N?A?1v3
z-cAx{wy$Z@DE0}1Pxp_b<>Ju>@trpDBEU2PJ+9X*y*$<~;rCjv^fMkhi(97(W#Y9I
zL3PfP_GF4kACX;ImS7}no(p2jqr6CG@Rh|&v4FwSs}%1JQ~m_~CTUwwMr$=gLbF3O
z@S1%o=*fi>4&8r^L5WrTuRoJ`mN8fc`fCjK#3OpZ603zKG=Q7-&lv29hiN7VcaahN
z7U(UAL@rK{_Rkp9rML?+jHaP_fgt^!gaallW3Z#uHva8ZhF&IKECHfJCzy>f_|hrj
zJ(=q147lgD=`o7XGTf0Q?68W5vwp&63l#?d4SNuF3xWkGdXwNjTf!;r1Yhla|IgpZ
zT)QBN)iH+wyyz%Vo1X#$EYQvI=4BKv8i<vY5M6Fl>5@0oyr;m=z-$rt%0LI2<L$mo
z<A>)?4_O4WZYOrAI*xPr0YFId)S02SGe75Ej{Dj37YC<;b|i}AbIB%~kdSFGYPbNg
z%V42jPLz`d?-QzQ6A#QzxvWx`Y9&qO!G_Bzy!3=bW;>!*mJrD?FdYAO?UhApnmKAg
zPne;$02W;SgvXWI=ZFz7{`P*8@%jr?ZEEKhK{C=$bqk`C2}y2El-isSEiI*aQc?sv
z^oaJ-U8TPU@oJZ{uWEyZN%L!zBJ<7C)op^BI*S-2V7ZhIsP40jL8|-$pNBqit@_wu
zmNA%HXhipwZ76iyBt*PUFczlB`V|^0GE9ijUnU@>t_K^^8JGpUe3gYkW)d$Q(%;3@
z_)u0jU3P5;f@+Z1+-~EiwFmA%SjHe0bz3v@e$o13fTRD^mxRq;;;$*+c?v{bRj$tx
zEHUe^tr#@peowJL@SJCbIcW(`T*B{CB3Q<tDp4?4`N2?m;pd=h-O!`HC3?aqf6EnX
z=8}_5B%LnC&$^eG*964+vPrSidb=LT4N9S3f(^GQ<|txvQU)*3OHpU4k<*geFvqtD
zPk11L3-L|t-mPw=!p;hl$smFsrYW^joeoi|+J{^39ekgn7`#Ol#b%^xceGU86~CO2
z?nxI!s4{p|9po%Dm{1hc>&()1r=9z<D-f3z^0dWVhdS}PHWWL+_~=v4)d2b606O3d
zzR8nl>=w@(7=m@fOLvv%!{X6hvj_cO1}ywF1{;EV3Ob=`{GklV&~|<37nU(NTZky5
zDAK^Q=x_YAHX})80^;;w((&wgsx)t6Iqw5=7y&MR;=bd(>{JGx-p<p2`+`;&xp=x<
zU9dtOs<B#V-qX%A%OY#l`gc?r;M3=?Rmq1D_;xA$6(GriX?%`?au;qW72L;NDX%Y>
zxWxPgI#CB@?K&}VaW7ZUiFJMZG6WK{-b%%e3DHS#Y^5Qh+m1isk!bY&x~)h_WKyk(
zfowljKWp<Dv#GTN)4vKjn(}uDFF<T*MD~wg@w1iYrDbA2ziQgsi1S*seTGVhwO=U*
ziB3|3gU33!q|J1zjfnWay5Q>4%N;^zh3~vO|N3^vtEA<wo1xB41h(;hR$d5=$bxpp
z<F^Rdgg~|*z4%N>-ww5J2;)fner201Uq*G`fvD_ceY{X&?hFpXf5T&Hz*qd=9slOs
zL_V-|{k{4rmsH%3_-c9D>Fk}k*rW<rf~Ke{l;bzm?s2u$ZQ#HrL68U@Px|I4tXaKY
zJ<;l^@S3c<8jqOVhhS-dav7C#vcSk$xK>+GOO?;b=JNpiOBZdZ8B8U@s@$30A?ikQ
zU<Nw&P`!3h^*hvgd}V0*)sMKZrZ!gvSh`^3S2dgVfm8P8Jz7sbYAs%12z!J)U4kNY
z60Ak-rS@yhVl1)CXIIpjx}nHce}{G4R~e!2nw!)kuz0D>PYT+3dQD_lU_9z~$07E6
z<{s5BOnc5hU{LY;dWJ6x7zA#z5`JBOfkDX_Rg)SGIh$!`@>gLJB}0`dVQ@@-GF?cs
z$MeZSvnr6FjWh5ywB<8YVUVf90tSir&)*6V4dl@w3Sz8onzKWd<qP`Nb78>jzag6f
z`<Ak0WO!KBdu<jlh?89q=WJZ%N#Ed6eJGmS=K4{`%sR-Vf1|vwE;;ZYFgQA7Mo=%&
z104v&Pn<6j){PX}LZfJH{Pv((!!HIU8#Q^r*b@P*VG0Tr?_^TzlwP1qEBX|^_Io`+
zc%HaiSA-seIDN{ppY2%wMil=7aq3_8QJ<0cmgRy=1^I$7Aw%8oyfnBD#{49@AAGs;
zjw;X~P4HV8&?O#Hd3lFzq=e_BWeT`BHR`C>jKgL}<DU_YcSQ3lJ=e%XgxwKs{5!Ki
zkPNiQp^N&f*y0QNtDZkdG^RxN&<q|C&!bP#B@_77Sq;L4Mr8!^E^j}_eSaOZ5=}`<
zgdkWju#epiBRZ#|qkD|d)Uob{H){%1D+ru7*%0k{;_lWS`UsS8tw?B#B4jY`N&|7*
zTflR^ob7>}eRDFr%@f^(n-Q$M#qUbJG|giV(r{jmI9wDX2)a;=Up=ZD!}HZh2&6pF
z@##!O_7m;H@g2?|@55o#^Qk~IHt}HltcHglVZFoi$(Por9ScT8@fQmaGYjbjFdF(e
z!WeES>wWA%<JnE>0bzr4xGxlVw`ydyIlslr!=E4iR95zz!t*O}H%Mr>NuqKa&6&CZ
zPulz)7%IcTf@4cA&4Fus_#~qRy~xE|+6j%C&|x*^>(KU=)WrnkzG0S_rP3l(YP32^
zX9bUXSX2z2oW_<ujZD#jruJ{*O^&0t!sbO@zSyCP@8X|dt28eN?UpAs&K;yJu{<IY
zZKs1T^h{R2Vc`Vp;9=o8$5b5v%yucTCi&|+0ca^LWkAa;UHe9UlTjHtd70XC%1}Af
zP|iCt{iMal9^PbGeYySn8~&{&O{gM2{vC>v|GTMR#IWMQGxM<a?~72gWgspMbaRMo
z8_{5`5nz?yX2oGd04(OTnEXv-uAcUi-vq&Cu%%bSge03hA4NW-Pdb*W$)}Sy)0;@5
zpv&TO<!R-W&l<19IwA5q{}dx~8;@-;pSoIls6^EY?~ipxDveT}HycN*$|cS^Fb4B%
zu;~;j55|Tk!Wg=Xhng^cLm2R8hE!a;&~7_?mr>u*rnB2|z=Y}gPZxCCWjZy#jM(i|
ziR-YAW5hPMpKR__F?pR~!V(CXjm_Q9o7?i6yNq|cOX7N8n6yur^mdpq-^6v_G3kT+
zH3oY-c6$gW#-unM@s^j-&3!U0eL8>of5mkk`1985(jecZf&S)UojBPK5CISI`Ut}D
z4r?>Fjgd(5M+i$7B!B#?3qml>m;UO41AmZP9YO<_baEi$S19JYz&J}695DU#yyfGo
zKVvUi#%KPFKf3hkMa%TtOEWJneg3}x=hI(oaBos*?~_#P>>JZB=B*#+|IAxoo=!8H
zxqg|$+ic?ZpHGn1$rq+mVrEMnElZV`zT7ffq+VXqXkDpq{Tg7lT-mZ5-TF<&Yz1;<
z9KJsTX<cXOf-#p@-~O59dogpe^&?9c4BcC<{ImI~^~Zecca8mpfc>wr=IeJ_*H2ve
z;kCCh(Yon+Wh29UBgAYs<O)aFi=7vjwje|f3VD~4zpGseL){bBkK97}5>xn;4mZT0
zPg-3SGd#c9G{{?>A!B<}_X6)JyBjJ;@AEgcI~Yl*1TNY9qRIDKFNQzN%<gmOKiqe*
zGiT_nNMC_g!29M85dn@80Yfb@cOm=EMoLCad&|rlAquxi<zR57%&q$Rqx}U@KLtWr
zbuMoi+{QOm+$%jE$N#u^c=<zJz}troBZA9b9T8ExY+|{g?<&Lpyk|>~4mPSM!C#p!
zzgIuedF?ybO?#25FRyZKOWegS=o|@nijbMB$P0O2fBaYRnRG9X+2%aX7kz&W&jn6Y
zCk8xO`ZPCE;BwEb*RX+=?l&xatX%Q<K~$br>_?_j&8dq&zJ6$o-j}=_x4p4A60N9t
z?DC)A+rNJ8OSJ)P;+bt=ZW9y(D&YNpfd|pV{#JzEm~%^D>(qbXLE@FXpqK6ccX%*T
zQx*M6+#)AAH6n5s-Gxc4T40J^HQ}|TBb2A$5xfP9H9Q52{RKRihx)I|^@punRQh>J
zzh=RM5e%_p6TaT-!i#df`r~mCX1iSl*Bv?PciXQD8I5u>MB7XVcFNUbNN1C%g-JN9
zMYlA=NaB*4y;3Xr`jDMk3;$bthitwfN7HeQH{L@*_o!-C?^vMV`R<KmfdZ}4B;Mnw
zcm0YF#`?G;Dw?&;ah7`XiKqhRyVu@yk0}n9w~I4ucb?b=<kMR{rr4@4d;CnKAIE8V
z`eiizd>i)C!TD{tmZ*#r&yDSYvGe0CId9K>k<fXgGgfvNLh!rDK;;d6D5ma<mWJI=
zkl7J#IE)MUI>{O=f4DKglXIh(dNSN+bgJU;0^x83{}3pZ=b;|cF16C32_nHG`E-`2
zqEKiqcjN6;GOMqo3oXYhZQT)77C1jgPh{6Ve*5Y*t%DT1%=Xu(C9_zn;NA^`7bkbN
zEM_B}&$BznRwsCvpV%ld$bDF!Gd*pUap5qB&#5I+zLed7Uc&YL(u;|rL)#V}5q_qk
zt4_V*MsIz@r!unwVJ8aC@w}MSTkUf1sS{9ttCgI{+t(Jo6hJM{p9yKa?=hr-06jla
zQMuG6KJ-GfaM+5<*;(LG$h;`#rm-LUwPN#(*T@SwsiGc+*n@`b6T*4(dHYE_<%zdv
z?%k1eJYV%fGIsj$1I^(-1!%)t0v;S&9~_MqI^y!5=<g#6Bqeo2iQ{c~%0I^sB!9Hd
z(|a&rh9B^fK3<<+9rr+1Nt|)&lPf(d-MU4$T3UP-V=adpL>)>f;hhR}(ukYIAuq3D
zdo`hO#34N2M?Z>^oAa-q^@*s2N$01Si7%^`)lV&KedciVt|yddiY<Qd{-L|L%g$zT
zEjZO`xJBDFkQ($*rKbU67``dkh-z3mr96yH6NR;7<a`mes~m>PT`2Qef>5_tzhM~$
zsnLqQCadG)wBXU8_IV9w3eA*+_+1N->&n>OF1ZYTddGsR3>hdRyx+7sYQt$r<qnJE
z6A?R<a$y)x{VEOBm;GS7q}PE_Awg6+UF=+o!o|-=&ML3vrpcYhKz)6_s0tA)gmT)i
z6Ihra<}W6Ak}rS3T0P~c{WVfG!~i3weEX=K`w(y5r%zT2M(4T$kL%#%3Uail{AsaG
z$$}EIa|XSMJyyDWh2_g_W$pJW|6+pAvgb_}k2=ME=DV{!{6K2zsneA`KKk#t027F(
zGj%V5&f&g*|MtNtX(hrOSr~v{TT~2?twt05I1D8WIF%=<CDJYY?+@4XL~8S~EWt8<
zXK1;Sgq@$t>BW-ccEsD~EADGO9<o>4(Wm6hpp7PjoRItO@tL*!56r#+&WTIq1^0)A
zrz>yUs0?K|=xWIPnM}6Zyo<a+j)#TOmpsN3daf7gm1s=8Eyy{<bJBnztjztz^Y!ri
z#!kIz31|1hWv(MnD{ef}Jy&_+6@_{W_wZqSOUUtGb`M%RAJ-&D4WD!naVKW!VW)&4
zXzdiVh6w|yR8Ew03rDJ;EQE4@aG0FOm0zg3d!4>aw(U=KJgM7W^D2z}P{$_CdFZ@&
zWAC>!$-%M{t<a|SYT<J)BfVSXg&N;{Ih|eLb;wQmh~2n|YgACB_qd~w?O4m1$a*jD
znY|~st57yNZXp)f=34=xN>+g`#TnHVexgL@c;hZE<UXbghxi@#)?{`vkr?yis;o)C
z>5ve_p`;##xl1l8xi?+JRhw?}NOB}FRAjjFJKBZ)?<X0m`UqVzU@pqm9yb=3;a6~F
z_Jl&k^b554?s#y0u{oC{)iW(tzwlDXY%x7#%uU9{<CUglI0tIz^9d%N^ZS=aaf@#<
zPr!-=VXanjymz^-AZA2sS3A_UTsWgy&F4D{uL2)1GPUm*_8xXjkQvU+vPUrxxt0)R
zMY$9on>zlBr&j3)gAg5Dv#$h=`a`dRKCnwYgQPqhC_Xy4U?KJqlYJj`Ppy|^FLTkV
z;C$ri52$XX*EYjNNe%ZEa+WM^?Z`d2mR0GL8boN=ACY>2X%{YX&bZpsDE&;hLl<h1
zs^KLqSSw65S6)jXhPI=(M}MfTkd{OE+eh~@e+rkKUUo>I61rhfV6{{G!6EYo`;tes
zyrMMe$|ixY9yTO=zaV7Z!s((cRQ+zh@>n?Z6iGF2=$z&2@7>csC(N><QrY)-Ma4{-
zU>sZRYQteIW@D3kMNMsIr^9I0;v6bKaGHwWT6}=_G}pWVL#yxXRO)U}m4D`Iuj8N6
z^+oD;4Zi6frc9;-`O+b%1a)nY*O}jh`W_xN!(8dpXSYfOOMh@E)qRUBI}$Hd@Z*(Q
zXEi#KC{igso($UsUGt;OAlHAsk}AE+9<oc5+P4#y8E#?C49?#STSj%g;$BJUIAnt7
zU%@FMBu=*eE__K&&Ya}b@N2!pyQcgIH3Q#|>DnL1=R`MunNc<qdtkGXlpMo~?p;XL
zJH9C*l{|knbcb=oZ04)Gni4IH<I32rZtgX_Tx3>f)y6H6HxG$wqS(_(VTICe0kpNo
z6<B!JrKMvdU1~H^;@MO;c4JhMxo#~a`T$6(cyc47rY0#QQ${cvw<_{>)FAua*t){0
zmv?&yxo*R|jM;7f%*<<K?o62D)}1gvGrsR+L@hhvp*0ZL>I`CapLbwGP;<`;@%}w0
z0MP`C3`~lnKoAXx!s;{S%tDOwzG{EX{*$1pCF$<zG#PTA)Ihp)j6WiYAyGwNNqV$J
zo80Pj*luv($aj)T2P7U+V5LqnyJT2Jdeth9Ul`9lX~9?OV`C#N*o;fh{g%CYCa@I;
zwitLjz2qF%?l?3h3~lFZ*6e7@eA!upFrGvVu09)fMu^GEe_Z9Bs;Qer)$*3|^rDbX
zi%<H3<Zb$J>Zu5g6(rmN`C$Obr!@`LY8Pdq-mK25YLqx<R*2t)nHLLJJQ8j=&0W*R
z#mkV2wBW3o6iO$5pk+vJPH~*I;LZNd|C=F@p&@v{XGC9G&=@P_m?lu3%DYG6YVr|`
zkrr7c^Ca2cYNkuZapoqJpWC+y92R%!<mq+ioh^ofx!h7kT~eAKqAlubAx~T&EvsSz
zPB><k`17@#KD5|%e~Ax+IT-Fl6mfMdO#G)BdR$9<DogB3ZO(#=#mXAu$J$If<#ku8
z_~x4tXY4W2_IW$3l>CrX%{Lj^0L&w^N)c2#OO-NPlWk79Sc=Bvb2b*x#pz_!Z>k#<
zf7`B3;v697e(0^I_H9I+n3J~Lk!<tObvd89oXBi>I8)(Vw&>Nn!}Q6CpD0{GS`F!t
z;)QVYR9;26n$oQyTtT?#3{v`>W9bSRR(D$FbDHX#A=Q3fwYP`Vdc$Sgf)QcJ5gV-3
z7)AZ-koxy*^#cs}{$5qf&xgwSN;$sM=3&KuUBRMt4F@I7{BSm|4b8@N4WS54vA3FN
z9j$k^kDzbOVfEV5eDZ4FYGhT##E^T~4LRL<bAt^n4OjF#CEh<Lb-Al`Eo#!zm0nZ<
z>N>t^(bo^eURSmC<)-151OudsDGsW55smh%Hu%xbw!iRTNd%%9_u{e^b^v5NNRe5Q
zHh%Q|*lxBST<zK6Nl+~lb4c0b)tj2GddP-MP_~lkJJ(0uZ%zAk%s}T%7F}(<*Ue6@
z%MJNVoqvPz*U`F>W_n@Cbg<ssy;~GC9II%Bfeph$>T~rg`(Upmid8QrSxK@Cy9Au9
zGG5#dklANdQ_K>0^%=%8(~{W(NPH#l@nK}qHSzatTz#k0c^O<i7|FRe$Yu=R8FrJI
zjVCrK@}(@#YAQA-)B@ROa|vsED{>>R!R83k?#8g(n>CHfO`8(kgZccZ4|H_*-Gg2X
z9#b8Yr<->7+zvLn*}vwu>m5c6@^dTc-YPr$;hObG5lK?;6>m1iP{Eg|<7+rUl{)N(
zT><R~`yzrt#*JL?$SFzx0jXK?Us^CsLoj~WKdHfdq8sxhi+f?y6@6Cxm5&=kx5M7u
z&Gv_xg}a!`JNFX;Lwz+4NBIsr>AAZ{F@t|dfrcE7ZKWJlmPH?+XgHpvIl?N1PZ=w+
zKTL<&3`-GxxO6SreoFJ^;Sfy>DU=1bB15{!9kECEdOC%yBYRB|TqJxE?PnyH)JJUI
za2@(8t?zDQOg>_<a`=Qm<Ifv5zx7VIBS;Xz!mu~bV24fr=$Uc9SLD<3kmIb%sX4bv
zF?zImY=?r}B1?1WVPo#Hp%{ENZv25{q5A;(nE<Q`B*bJ$m4eV@y0nR)pKT<E+az)U
z@P8NO^2Z0EJtdUGvC!r7A@VdIcIddVzzOu>pj$VC^4|yD5e(-1<}(o}S!{1yt|0#T
zApDJ-fGS9ajN#q&alS<2B7y?`fCTITG&xB+L7Md(`tqi~(@n9`AExggOYe7L&^b;*
zP-*sRvUIbL(eE7TYd?*z>j(24IVW`MoY=@Yg|OfjMRdXjHLxF!)pi|IlOdA5u2YDo
zaNI<TU16-qeH=7zKx*uXw84m!2}>8maWNQY#vx}#^p*!ePguGj*Inr?3!bF6VdF1d
zrEbNfjl^UKUC7rBHxHD)0k}M{=An`K-^huU;UYBJIdm-~{K&+YIK=0xUK4#%iqZk@
zx1{T$V}tb12Q-=n-wH_k!5Pzuq-jVB$H$9eV?LdVxy}+4My~7&k?%c$7${#<drzI4
z;-rx^wAjQNND}(f0xVn*OChdJz3`ljUBs~m;@F2B|BDOmV?EeV7MH&0n~g=+e?EBO
z%oJx239%x*((S|p8<AQc@&0*$9G#mSJDMyIeL;dILIdF7cT^)6&ZPscM&U9KZ%OCI
zoK(O|K<)WI-!xlcz*a2M<b2itH}>u;s>!!~@colYNPvVMq=h2V2}ML|C?dUDz=ENu
z6h%N(P{dHB6RI>Z6cGh66alHBNS7uGC~7FuML<MABs=)~zyEn>X3yTU_Fl73_MGJ)
zC(psN*0ZkbzQ3P`EW%~qZN7)_X#DiKHx@U5jei@UALek}$xEmBdPt)Q_w@&Mn<40S
z8C^F35krFwztmlKW(Q{`s7~=i$4Ni=ecw4G@n<Fp9^D(m9!K=i@caioLlE%s*e&PE
z_F>Ca5Swv}?nubR=?WeHu_SAOH2c6LF@fW|@;d8cA&<&Zx>^uXgmm+Ktj`Hup8Kia
zPo~`y$Os$1@A%4SK3*&`#K{)Se~>SM;Sv%h>L=L%LVcjbO@v{`9zVG2m{F6NT|e#{
z9cVP=9hZ^E=Re73BQE0k>a(^CI*NAfPe}6NR@9YR9b*uihI)3yk)+1VN597(o#f3q
zUbtHp!qcA^XFlbC{*YpUdYQ2zVIc>1oiv!n9@J=w{vnXWa4a~IRbW|p&Y$TDwrCy~
z_j&|mMawj&($E}^5@jvue_TPRbB_tg$r>!WiY-X0F1YjI$-UbKEDrWlA)%?Yl9C|^
zhYu-R&VEORB%1osi?>8l@s8Fm!c{n<TW7LEvP$YdlnlvGBpeUU0*`b&L}WwcmB%I4
z^Dw8Xo>_*X0~||gc1o5$lripVmL7KF<_Hvtq6Z!i<*fLSF)`_IYg2+tpJRq5XyPmq
z*@85#lb{5YE$o!ZeXM9a`a;$1g;>6rEm&|7SJ>5po_{6zEK}0NnUip*BBCQz>Ep`_
z*-5He2i5biTw+4dyx{I)47Fc0>H}I`OjO;O*Rut!n<QXdA{G=~t3NE58(&r8`SMfP
zW<H^!K&!x6u)gw6T7;%iG6vN^L;JS~=i<1d@S+w=p`Mc>>XWQUef}uG{(i04*vH1n
zY@u8t)@1Ve^K3)u_fNOaK6+W7^a%jtaBPDMoX8;7EY`oQASi906(rDV?ij_<ggfNN
zRYGq42|*0HlNm=^Hh1+|chr_<@3fl>@pKUQ<&Wkb%onBsGzoFhn4c0I*$CX7j>(IU
z<aXm8FmF|oSO#U-LU*BAe_g@P^i)N$ZWyieokO*)!OAZ1$0d*5&iuoA9^dAj%0D62
z*S@p-ne5#j;as8o@}DeJXbrhFA=aS(TqhI}P3!p7V0T8V2ZHU2$mvSi?aGwt29a7V
zJ)ogNJwJBip6p6K+wGCl=UNBJ&pC?~TrTOEXz!dDzCWqZ*%c)R=9@V%S|w&2ufRv`
z5stGQ`9m99(SN((moeqceMNBb<^v&QUcXpt<|A71x843bLPLQ81NR#;TWJGH6NA}#
zsdZw54D_GT`<eCn;X^43LZt*&PY_D2E8;m}RN;JIQheVFe4ktkvXsdFUWhhr#oszP
zp!O+P=_Kp$p8?Mnwp3g>6BTS=9?#cj-D*Ko=^Xw=ZE{l%M;?yeX&ir}G4@*s*b_=i
zzuVH8hfe=Pe|X*~=<U?q>k>>+&}1AnLwSR3MKMLe)`n@l&!Y4Ov9cC~w?03W_V`gL
zrZpr}B2+X~m5$o8Tn(B^Ix=~`aSU|6n<)yKu|h)6b>GUp&)X=en7c6QCqZoSnpP2Y
z0ipVcCE?HcJ_jzA1eY|34I~`3yMq=kZQ%3NuTpjqv5HOc)wT2&S%|Hf%Zwi5|2)QE
z*Wu3+8%*5$269;V5^;QLU1Y07G#4nL(hymPR=>or-ucZM$y)TQq-H5(`AzWb!B)Y~
zUWVgM-|pW19;n+Daen1q(`38|;7vh7i2z&U4+b;78NsLd@Y!Gss;IIjHC~LF@)K-D
zSLxjLZ-IBx1f>|us-Zi$3qOY1zny;MJ1vqnn>%SO)2)E(<^{k20OBEhPtyxL%h<Y6
zxR4zzF}UMbf6pZO!f);e+t%IN@pmCogzl7GIQ7x^z?XnmU(VZsMw=cj92LJU_h=W?
z`iK?+MIF$N!soSe2zML}LMZ3A|99}<>w^HWO2HZf3=%i@N$-FHE)wY!(k-UpA9(Q2
zPHLA;-e8_l>;ava4csGl(|_Q>7N1{*295V4x}-|Z)!+VuRA07@)a%XCiB*68;l8A0
z{)uk8{9bQm!MG9`;`7gqLBChnW!0&~f_4PEZk&d%gP&Oxn>`aAoau&l?=;38t(=X&
zYHells^TDteOkTvoZsl|?7PylKVTL|t4D&@-I(xTEtd1(jL+{qcA>nBqwTSR1LHSa
zqrdjHX+YUSw*5vFJ8#slV7{+?o2Wk<F09?KwKkIyDjxdSbNlCV8^<pWy{5J5gG&(V
zs&>&`0Ml_YvG`#Sn4?%A;M<>S4ha@T1~ymJsI-L`&c*jrB!tf?gU=LvrArLJY9Hdh
zFJy&J00BWbTZo`bmrJa!fQIuGQ#!Y6d=hi?$eBFWH66}dhj1esaF`a7@SDY02@A1q
zH-{CqQ|2jl3BO#EPB}$iOh2>YKa=Vd?D$#D2s6n91+T!0Qcrq!U&{7w^0@fGBlO)s
z&dme7C{F7>?(8EDRiK`SI%TYv^CCrJq<#I6vb=|=c%+O$1jZSzS031Mxloxa%l%1i
zFjDq`u=~!tBSdnHtllMzZIs@x8SZhNQ<Ozl!@SQiUS)N`M`WL$Q?`5Zg51v};mUXY
zEZs)8@~pK-+mlNPZSBL^RGKfN&a3)^cm3D=_rWM{{m*d=Fqx#hf^gBbiK#?>@Y;`F
z9l!8c!Rm>9c#!Y5`3r-djqFQ$YZ@v=qUFpb*el4pRz+I*c*(VPF6+Jn%^ZTzj-&k6
zPp#!07i7-rIzfB;WLvz21loCC^!fE(a*V4WP<^<5q_&mDa9s3j7mw15p7>!Tc58$!
zvqw=h-hWuAMTn^i8Wq8nj8Hc%UzV>Gtd1P}_{@LQ>0UhN+cOeUF$jB#%4X=|!K!Ne
zt50<JMu`KKHKQ&C4gCetEfSE4>95@12u?f&gLGq%6L~VY^Zc#pg!-Ug9b1xlWAZL+
z;hThSl9d`4KNCy_Kf<FKWrK6Dq|bo{#(Mp?mvW7pe1*+LHjgt^!7v0n#5b%%^l8`)
zOR)&aeN_;#9$V5D_n)dD;si=Hf~=~&F^n>@+8DCFXDuIb!k}NL_XuP67X+r)p!fQm
zeXMBslcu_*%`ac1migae+2g~ahr!AttO)32<oDpwv^&z1d^I+$I>Bq<her%p=Zhl*
zQgJLtDbpgO*f4eI6pQ?XK5Mizlto7x!vVi${cIhg+DBtUx!8mq+NG56jnVF05qGb{
zg+A6it+&hS8)Y~wN^2U5y=J4Y0-g8-;&e~j3Ze2f)4-*>n1gRQ-PqMP+LYS)Il{KX
zVxg}Xkz76PagN&(=)Tqad@KgW_e_RF9VXfbck{w66cnS3mJ38#-Hb@S28bu2eR5|g
ztoNeyMLdB}HHtg0%?Sfs+E}~NnRkk<fo*KC=mOC$+t@Q?!#Lj!7R_9|o}Hut4(~5<
zsK(vU)XtAPJ1T;(X{7h+kMDzqE4Db0I#SmLF7$#_c)B%7q?G5y$z~sl-qc#S=7J$E
z7y4M*)WfiJ%ntV&8>ZX;1M6;<lBI4mtCQ;3dv<Z?TF~-ituKxgCjooc4kJ79R0{Oc
zq6b^Zk1*cc!4Bo3*o5~&2M@E{j#ZBL!0tFeIJuIduI_MCSa_#(ek>&V??4_9Mh<E-
z^pJL=yA`?C<DK0xV077)R!_mVooau4yG0{c9-j(%x8UxHd5}CJ`i<?W^}U{yq*hCz
ziTN1pIU+a$lZIQx=wB^dH%OK7e|F;evy(4k-j#atmb`*KJKg+@Kd*?LGhj7FJ2?we
z!8h~tluWz2aP_;|o*QNU!uF?IVn!P_jY`jWu?V+QIBsk~ME!yL*dl@i<fcCR?+lod
znsS6A!idMQ%Ru>$?|bl`bNTO8IU-C8b+|YLm*oy7{+V>>GP@~Vk@eZ?LjB>!o}1NT
zlS?D*IEVmG9wLJm#10g5_*RiP8ZaPdOL9cTw`l<>6JwQdF>)W$sJ8vEqW6tn##!G!
z11Kajg6)z%%cmjGtDb{BO0%$!8zPY~VLbfm7u1DVYym{xM#*60z<Ew>JMQo|p@cYd
zmd`tF&{fQR#GuW{eEvI8|J4_IaZBi3q?_mjZx;{O0-D!Hf(91zv0WL&|Be}x)0+q6
zreddf62o|fw_2i5p$JVjqdG7sR2q(=n;?u}-&XHyju1n8oo}|NcPPiZSYVK7H<pse
zAf<WAG~2HX={2f>j#J#%;?xXw*%g(m<AWeWx4;U^)lS_=3(R2(Nc0$n*`{llz8NJ^
zF0P>(|E}-Sk>7?q7j-K$<(3mo-10;x@cMdm`HKa8zI}1(W-^*|s1n0m^M%GdK?bXU
zKF~#gty0SMN+-db?gsE-nqlhEc%*>)4rv{uk1|Gi+NK<+%$nVJbe7^8xJ-lQZ{B};
zE61*&)Hyg_vD#p4D1_JI_PEo_s~={3?Ls%&23Vb!^oy=y+)rzLuoSz`d&P6vN3gIx
z=~DHpN!D4VsE_7_KJ9g16v&q(KQ_*l{ZbSdW(zQnezfECiywFOJBhn|cyZ-OO2Z^9
z^FYo}*9!0e#<BMPaH!a_gGP$1$C^v;9awx+ZRb+Q6vvF#w9YUKpM%*tzhI~sno--E
z0>5PbM99?kVPN{{&mf_kt*_coGL&T%u4n)1dT!8J(U9^j{Nb-4#==LHNN%k7dj7BC
zmv*AcT0RLI##EQ3bKmPmn>jYAv3Hl<l<LO^5;m(!?tZ&+t^VVee}e}_ei^HUvdfWf
zx0Li3`~ZJmydbSS@*nVE+_i>jQS^3~dGLDbi-xaCiQ9c%!T$vw%oUU0GI-7MMFLas
zdGWFIF52lo;KBPkhW@1A6HCFr8b(2ep6FdVs(G{Kd*j+I#_vhFd)pOEQ}EHFpjmUh
zt^Rv^YXy3LmOnN@-q+}EzC`bdhEpJ7#rnSj8Q{oN+%8@8-u6KA?~Pl;Kf{bxem3Rx
zcfX2zPQPa?3QVyr;7AY?1_|asdQQJ$(t?3^k=Qdx#^oe-=@7^k$&fRITO)+GSW_57
z!j6#;($+~W9E@tP@O%gu5vnK^D(N12C?j<5vO+98>}03Y!GKVftveOIAxBI|2i!x1
zX<_jBFu}1<eMD%IZP>B-(4!^-5*b&_wn8kV1+3h|%*R|*-4)v2^ST1w$|`6|Sj3cm
zgpG8FQgN6t9j>oIYT^%-frNXSgj~(Qnj-FBD#p6Hhue*X%g=}0)DQ@W3JJzW7EWC~
zzr~Y4Fp%!V{lKv}kr5h)qnbcbcZ=_*`ucld!>?rAOK!nr6h~g!x*yaP7Mg)g!A7Ok
z-nZ5WDb$F_$1);LW22jfy-z8#t#n8vuVTxwB1Ky<vH^k*y27%g1!)=4Tj?<;O`@sT
zm}dboJpqCZ8l=+NxUQ(M{^Hoe)@!!5tliUS=7e#Ff-0w4&9rDUfx)~D!vQXh(b~|y
zu~?dZ99BB6nln*EBeByY5-J^kYd(gpHgU_H#2AZN!NwPNC6GgXkfS_a7>*f0X<Zz%
z;=?{llKR?$Hlw3weArh2B<Qu`iXRzb8o%RC-WZEscaN*JP2>tlEC<C)dc*?@i3dFd
zi=@eK$3l+?BzuJV+9V-dsg`Vp%xIp}atO?eEdP=USBk(pR;KKlkflvhq@p9`Gn1Rj
z8OiXm<chWA1xm`}u|zw8lx9%W1({@F_jK!S<wJ94Y;9Ez86x{=SC^elAz~`mpQeX6
zr`T`D9(tN~dRx%(RU~OU&Uqm%C@>wr5Ie0L=@FQokomxJ-5`ymX$(>`m{$EvgiW{M
z$^m33f#Z9nst$Lijbj8^MnLXWTFAl!SZ!8>DY-Zhdoenrb~4<iCL?b9TCHPNp&$As
z5oSb*vJT;Bzloi(Nxi^{N*m9<-5pwyne}`-tJE<Ks_~E-nDsI`aquYFRVK1NGy9E<
z^gNEm2xCKI(t?!SrS9D2qwrhgoGC|%nx_vP0+UBgALd3q8e3qSh{kR#Je*Nxg#LVq
zgUCKAwqu*~;0@?T2Lxi8sc=r&JZ{armZR{ahCK6>JnU_rU(~$5K#HYr_GGunah4m|
z4kEPLN7b*ge|D$QkBU9%#Hk#}fBFNuM#M1vK<onVx=W6MFWQLCVz`J-!xskINX<~;
zr$|yWWW*^Ve9eZ<a1oYiQ{d!G;daTFt`m_m%K#$_Sdt%~HY-~8EnvwbTo}5S-dzAz
zhQFlbrH8`me9*3|SU<wPE~vtbI(4S#lzsu1__cFq@(*biTp&<jJ5OQ{2xQx^MPoQZ
zNd+}@mIP7(Qx`0>K^T(?K9dpIWEl@x!TiOd5LGm88<pY)t0OWncYBI=judlo6~8bm
zp^Fzf&|$$8)N4AdkIL%0YH`Yj^%4(yW)<2-K+Yd~mRerwN@i^)Yuoqe&~{K~LhQ@V
zl#D-n{?W|Nn9dRGgDR(~+E&=k5RfkZ1r$8I&IV<Kx9rsvc$0-FBr4VsvOY^;KI7pT
zDwwgJ=L}}G;;brm+jQz##5Wc8V50dB1q!*&QU{b%!7q}BN<+dpD6Tq?7PKGU6g>Ij
z-fi>`Am1eK3D~RRP^=`>oMWm-Rp2S~4}gpyqeBVMHL7;H0mluM^77%LJ#u`_h@iuU
zMJkW9$kLP84^b}dynR3<^|5`kJ};8<rS&8`d7i<$L(O||n`e!hcgjnUZIR+UnRh_5
z0@i{S{E#l~B_S(U_KOO)CPHmPIUI=4XFf$~MA#`RoXZ^AdK<5!1xKc7*Q`P>;o-l0
zl8(!;+}<d^xQKXdhuNX{?BZU5#Vpf9Un$+FHlm1RnqyK+$mN`<Ngu%)Vyq#j4vT$K
zO)3j=4f^~nPv#knF}3bOlCdEYx#LsV2ex;j!zQ}e0*Nrg>t(?NTbgeXEU!T44mJ}H
zH$21UtX7!fkKUVMIhlmcrq}naJ`bkCY0s)J_@NKMqIWTM1)k8kaLw((^ntgp=8TZX
z>x*^NFn@edoR39blUWmpijx>r8xx*fF-DGJDlgih(rl{s@HCh_rfCuJ@*{6*$*Tju
z6|L)St;W%5OXxqurak)0^Uih0@>*Ob?OMbwTT~S39q1XN{dD0g`O@-PIeUt^j!rLn
zlH$V`^vbG*%}lUxl9D&jE*Qs&X1l{KXMs`V5$e99*{6lgTs_t2lQ&N)U<NdIh_Cl3
z$Y3&BTnjS;G)>lfZ{zb!L3x}zr+%12QPVJH%{b-6v0JOvJA)PiGXy6hESL_X9YC4O
zY6LcPuDHUku2x(5v7B117k0D1Wy7}O)7AVD-A92kL!1|f(a|JWFfJ*05PpkNFek^`
zOh$Ooy_uQLRC&xAz(5Auurd>#L#pghv7Urg)Gkiv)NYGG3tPZ4%Px&gD-0G$L1&sl
zJM2q;f50b@Sse&SS09}&c?DP88z-{-XEICES+*HE!kEU^=YzIehLy`>3Q4fOW!+!^
z=|FNa9cqJc7OI_$1y3U4EubDK1LOg00`h6{B0AOcDd*FtIg7@R4m`7x$J%IPEX*-Z
zq=GfN;z2hIQNDv)!GB|^$e50ZScaJauX8>cIt>z5h%n|>r;uLOzH2CPet1O_Zbn5)
z3G?|;3BC(x>^I}Xa&K!e4^CDK-d;jyn<2v{3`0;gTUU6Sv!1P-LIe-$i?;X7&}{ZF
z+Kyq2ku+w)lmK=0LEWOK8aqS10Hm=EYhbc9Gykboc<2;0r<`Em{h`M3VbhgHGXVkA
zGfd7T9&JYJGs9HIC)G>{qKv7Q(_mXSmtmo+@|HvWGDgr7JiV^p%2QGi*0g7)S4NzD
zOJ3ELH13qNXqK{jm3BQVg$rX5pJ)!i^RI7<7J9LZ1{f~Oq4I~meBaQF8RlT{l`&qe
zjXvZietet$cHX9vX;11(Vp`5uYKkBCV&h9AK>hISH|$uADd?*-(|-0(E$dLn0_Z6+
z;u2w8*DbeXhj*6%E%d6}A--ouOlPMMP85{du@~R{KK}`N*L0U=nkRTe9N}rnfOd0r
zO^4cl{#N8gX1&}#0oBDwy;01hO;}^3xldrsaJHVQol*}~gM0gREub4&+R=ovm-tak
zVU@rCIC1hhUA8QgP-aamn}62BoF{)b`{3gIq5Uds;~BfP3dRhtvqonz!)Q<yJ{~K(
zrc)^5N_k&SW!)xQBSt?$onczy6B=hGGF847rB2MG@VeNd9LvpiiO^bMn+tn3HK{bm
ztFMzOsLG0tnQy#t%KZs=bUb_ckP6$ivkE`HRa{Sa2j*-w0lhtDHfc<4vBs-S5}@ac
z>HRw;Gi3U8cKb787(WsdO^2QxB5*fZemP4oT!n%|V8XFHvEO7@G#Qv0l2kUv<p&Yg
zUetcSrTVV6-ef5?V}*(-L2;d(cJ`e{>R_z#mNZMu;?8U5D>L09-tRQw;RPr&Vr>Ks
zEg|{l=eg%79n%&3#3=dQ#VOdhQ)R$1jErKQQbKQ&S+rw5=6xQR%UuCa!fuh#h4n9f
zQ5CPQps)4EpU*=ZlQ<?;yqlMp|5QD;z=CX>`?L4m$ma_wxXw85^GlnH$n2(UI(EP<
z_ZR(4_EF0OT{t;-A_8w2qsTIsYTGbrlak8*Qycx@8MF{@*-V6frn4Kbq9}@sg~2>U
zd;J&UV2U^Vc8K<Rf=gk_OA5VMyj-Q4SEVbdQuE^yagDKL**oPoqWa(r8_{H@r~jwp
zO{>;F&;%c=l;<^EM~9!0V520(#XIOU0&;F<O04A2weOog*UHRRp~2*)3${;;h)^R!
z=7ARyb3C>8M7N}_LOI&8uAwlRKq0}f%*lDpmCCwe%u)Mc%eAWW68%i!;HMiZ+u1nQ
zMfQ2E;k<WRQkUI^U0n>q^`vh3ShaXSpUASN(X4ai<bw6k9QiiU)UB`Q)?cBw=0>pA
zK31YBB3eAZ*S&a(65b&X>tw{iN($LiUEmr115wIL-l!Ts^O~En1py^BK_!!K1YaW$
z%S~eRtqFC0t5828+%RGJyftI<9ri{9<Lpn~?L-E{**OZB{GO{9y0`OHE@SY5ZsZ;^
z$qs9qZy?UA;MAUBJ8hgGtaB*`TY*zO`fEijRpXjdOVG>?XW!*@4%MW?S3flTs-Wmb
z>~4L69;hNp*-70qUY@ghqIYWznbn|fJpX?V52pVNJ@y~);8J=N=Ru=V;`ZWZG-ti<
zpH>~YR3Sb+ulK9%JMWQ6%}jXk=9QmWlZVraPvr+Gtj?B|OEa>}68yya|0{U#)8X8D
z+DhbWj#%%D4#8Ev{~I1W^tj5-T<Nu%z2%XwRrc0;u)`;8j~{$_!ruBAb1{DU;>(l&
ze}@Ox|Chsq$8`h0KDgWzIQQtj?(KyqPnvEoz39}v^Q~sC>CX3N7QLXg&O^;XKL(EL
z-TgUwx%uv|FZcC=x96TT2mk)wsdw+sues)X3<e7kfN2oGe1jwwBO;i$mH<~D3_*tz
zp$9eek*5Yj`P+%`!?pSxHwVK+q0We78U|eHgW-pm=NeAd8t_#QMks|lvt86^+lE5_
zzh@9n{wITYmdPNVJN54j;uY6(|IQ%#UM4an#2cQj|6qv!NQifQJl^=Kp7P7{yMCQ1
zAr9QsWJ-wF14v;3K7oOO1A#jKNQg1PH~*0k<3j@e6GIG*i2ExcYWYMy|2GMd@RvcP
z{=*<f#r(q{hF(lC`^z9&29c}&jX``BpZst&+5RtsXwPI2^HXD(45IG?hyRoii!&4d
z8w@e)FNVmJ5TEC!{MQ)bWhRFB-%E&02JuIcA5%h1f6~Fk5VMMDObn4JA^v!J^B)ZH
zKPAM{=g*lK;y)5%{)^X44DoAuJX1n!t0-b(h#6J;3}VO2r#aOzrPbX(t7HEqA;wc)
zCHB>o&DQ0-s2^fth?@<mO-)VnO?glL#UNHSzx^Lch~@ud39+uPZ1N3l^G(HnN{B5(
z)&KJhV)rO*dzAL?65{_IgE;d4jzL`cvAMpxxxTsmb7y;#!C)|V+6V^lhgHagN@)p0
za5L|_Q}f#HV<gOSOv>|L$6{4IC%VcDIumh*F+!#lh21IA_Rr3BS3K^0fOqZ5F|90m
zldW-maiY8O$-pB*7*g1*s(7ftBt`aoPu0`6PizXz9-6&;_O8UC((_Z#%aYL-#I_h=
z^Xk&^O82+V&i7V7|5)QQ-Sg1ArtDLFz>mdGy)`esG?O4G5sO;tWLp%soKs(I`E(~)
z!aSF`Dg4@-q3ZSde?5cv^WPanNtu5!hynjI3?iDzAm(#R?X9+=RsTB%vEVO*h_?DK
z4B{eXCRuZgKEtM3wMvOUe#+ykpQ^~D8%Di~dJ$u9Ar{GD@8mI?`TC8CMEHsPh1u-d
zi{+OhrK(ux9tPBP#B<nedW0fm2?DrO*(jpHqq`L?WR0m*$#^xauf!W&@gWJz0{F|f
zD4E4n$$`f*z7Ui`s`rLWkzj}fyDsn39?x8=H)Au5y%8aK`2g5gwGGYn4T3u&(G4N$
z@sHzL@!~Dw1{ip`7#&TEDU3$gOB$gCv#u0!WP&c)${N2t)oY6pr*U!0u<RI?y(+K1
zGmd_V9O-9M-!w3M(VP%Iz`1b7O};`*rdM9S5y*fE+I_&=)v|Uwb{n%d(IRuidGa~i
zgvNc1R4_y0;1_%DedYC%)|U<$H^pGC>K9T$h(hqBVXW{Nmt4GL8xJ^2^Qj3qQR>PG
zg9Y7WZ3{J-Dd|?@hCNz=nnIgN#X6y*DBoWe(rr;G)xJ}ZAnr1jgwj`Nwon&Lw$NH7
zkmTiTloa|%Xx(ITD?9G?x$D*A;BO2_)d={!glU7$kr-bUBLA?5N{2|uOT7t`&~MBG
zeaT4qE5JmeWU{}GO)UC%N(ahitL<n}BR$A}*c?4`<ik+p$5`PQlu?Z2@K}<<OtROy
z=S+7W2cn2-l5eGzb4avKBdgH)`15stu~xR^W&5BfdtGlU#D~ht)ZQMv-+cPu)2cSI
zR1D#VO^-dwKb%yE*a#yzZWS;sMDp)LBr7*PriJ+75rPUw%dooNf-0wz%;pleZ^+#N
z^R%pd=BI3JhlPU9WD`;kf&~E=w>=C?$W(+rXFFQd5KMk0DF%l3C-UtPu_(w0IA~rh
zY;OzAE(qfQfy6HXx8FrD0Dq_@rH56V8b&x{gai)A5*!TkNPUMDKu<|0kvUErun}+@
zNR}W)xnI|l76;12g+uaRABIXM-iR0^0X^y5uq}<X@gc>D3J@4=P_|&&Dz+>a)p>#(
z$0#O>j&A8=M%EtjjiCw2HtpD}K!U)IHS~{<xZucI)9_I*cz5xX2+T!ZP}?<f!emBV
z(4+2RcNm}k)+7$aT6{NkD7?)*2@V^k0F5M9@xoIopN~N9^$nAMyMJVh^lj#^8jcVr
ziM8cWEqr;*4lLsM1!;L4K=jq%zQsHy7^xkyVaVpPnnM^#GT;;nIVo~o>ImCQw54A~
z#GZ|m>M=T_Pj)y|@ZPhu@=FxfGyba4uYk*Jpu!GP0w>=_*X!j5k2-;63#*%B$Hj^s
z#0A$TS?JFnI{*}N+_|})ApH=<1u=q#W?aKHLdmTMxJ*JP$hV6(SagZbEHGWat24JV
zxPOVsTWAgiy<HT2CApBucM*j#PmV0#n@`j`mh?pTCzce7Q@b~jdc8U8y~Q`WdYFkJ
z+A;MwUhqcm-5}nynF<F4thH6KODPM*%ReQJFuZ?tD05Fb1F<RApCVi+T7?M%p+^!8
zbX*G_Yb_e2oly=UdY-{uFDSqHOO%Fue@&Dd@rpWYe2+A3{im{2s?Mf(Cs4lfYby(h
zc<E#}L+bG3+Pkq3P$8K0Ypa98U>M=l0UU`L>xB5GBhJt!__Pg$l>i=?Xg5vSg?ZdX
ze34PHlxQ7Ax%Z<$HnW1){tUJ^bS|RIA7nJjvu^h4&5e~m@Q&8=X5#EX_GPs&nY^$b
zNYk6U9hXq8tvlOc7Q=<<dZ%uO8~i*8MVGv|2!f)0)r~}MW7<kq?st<9u3fO4F1z*n
z2r-nneAhwsRD)!kG3TyD3%?NEuyRyfIMwXFIxgk>1-TD?+YeH?ggkFGXMYrbam@1d
z#&N#hgPMv5s&QSsh{R~)XYnE?%_G8ySH!4KEqsSlmOr^LKJbO#oj-DRf|95mcd|Ku
zwvX|U?0QWFekj2VFcGp(hdxcc@f!Pm{jNGOE%*+nMd`v|M&9FfUHl1!8yR$#jg0pp
zn`=*?*80t>?y^o_H#*OnMMYd*o)kdkb1YwEC+G#u6#wkC4$&C8X>_S-R7BVVTj0<w
z9`)eK*}x7DfvxvTA6PQye;#F>y`B^GUO(~8$>J-p>)023l}S(T^7*ov!W`aul9oSk
zct_*jv6*Hfr+V4P>$nI1xJ%+9!xMi`KI=T!zw)5q&!at42@>eQ!7?rB#{z|SUM+FB
z$g*8zIlBFEVt0|Kw`wcREA8_j^r6VLUz~jxK_<3{<2A&~m`}s(ZA4_1zwKM<@YZ2>
zxC>+Kez^sOrWaF(o8=Q%3iP5a`pLc9kXrB1%02z78{58T^D6I5)8K{Pfb&95ir2pj
zKr31usmDq81s|>uoW5$m9O<uf7!iv$Ai1`JZ`WwcwnUa6Efj?fpH-~+P<-sii(`$o
zkMily?E}#z#Z*3inJYxFa>GC<tHso#OMraMJ^q#LD@m+HK;=s%lzn$p8Eei<^LvHj
zb!Wewz{|{rpFXOKc<?8MwSt!CB&FT*GsUPmY2Fv$O%ahh3_5vC!*kU40q(btCS{C%
zR4bOg^q{YvpeA;EnE%t<EVxdOC`x#?^I^{6j;Q<xb=(b;u(Rx%1%oH0?uG!ZBzrQ3
z@wrA?@p*Q$+-;3kHh)aG+6Xd?vT^)i@l#1<8b)Gc>r|gxQ<8O5$TQg@Or|mB`gP1Y
z#R{Bs53WpNdWc2uT{K_c>wR*s>=Fi6jJauN4Qtu=5V^*1J+l}gX-<i;eGd`A^bpCR
zbEBb7N$>~*+;JQ_+2^l^hzWymLBADn|5Den8@{Z?X~Fam;m`oZjPUZja}YnM9@9gl
z?|X=i6b=uJJ^)r>dWd?MBUXd^9^$SzZx!YUy(rv${y_U*4>9H#PM>1z(|*=EJ@RJ2
zearI5T}gEPF`N_u#lwwjjJO}}5M`MJQzA!2n?R2J#NA{NkZZ5c-Efaeb%@p<isHyO
zO0SL1$>7Owz-5g^GZ{pthuG$`&mgv~+7<pc3}QfRZANTeZEOS6L!|9{h&)(Mo?3KA
zK-~SqaZA_ZI>uuAO~js3^{i+y0-R9OOPDsFNETcCulw#0@enHm&JTPzuC2IPribVw
zT}U{Um%%9?iovI2CNwaM6xN%@Hs@S1lNy{q0}`{yiE~);cYP1lLDX*o5}#@w!wY2=
zf~Td<?fI~uCxVYtj#&BNR`C$@kAzh^R0<y`5^2pLaPC^$LH6Nz2<WnY=NSdEr&TEW
z-1-d(nRCDK5J!qD3nMRi=_XWx!a>DDVh@Q;;PnQ@$tC~75KTN%4<`BBlReg;2qn77
zubX(OkrN}_M_7vRpEeA?BM?%geGE~=6;kDs*3YHqE5WJ|nhefMHfe`{moQbwL%u@{
zJv|I$>{(~Ps?faT{&mR0hP(U;O>IY3o2k^a5J)i-L&WW4h=~MD;y)Oo{yv5n^bdx}
zne}pu?dG63a#}gL-C)4SP*K(D$HwtRnyls2;V<tAuSd{SGF$;HgPhH}ngaW^d0Za)
zU=O(5)GFVUk4L5|(vDg+*(oqUy1to;{a|_6G&F{GuHqsj2CrA#nn7lW?Q4j-xXgbr
z#7Y8Yk%=L$W^yG#H2}_yqp_nkT0acY&tBOuF+}HreGD-<)r{qog$^|RwdA2IgSaL~
z1;CS~&fa+3<#I=Kj%>GI?WKJTk@J~WlbvRd!NX3EhvGP6hA))MljV~eGv`5?TEG?)
z_c6po4-Q=tIDY|cN@des1yy1)RsMw`F3J=d$zn8~{R>0HJ%Vwvh~glN-7Mc0&_B01
zG?*A7`Eex^L&Py}D?A1dJ-%?DsC*2qL;;fsr(Vw}t5R>tlH6~uvMP`jlx&{Z45I_b
zamWuR6maa{+mz);Q6ec%?l2b7A^EHwet8QjdPE6u>sQGQBDklz`1Ui_rcgNvPfVx`
zxKv#J_#mpVzzrq<Rp%>6b_R;6>}t=@7&;`8P_PGp*vU{Vjph3)LLHgO2LOCT(ClhS
z%ObkUv!pf#gk44O5gtR<5UDZ{3>_^^fP+E64jzo80DL6S*atv@4ndNhe^^9MEbdR$
z%g0bWZV=j(a@!@v-vs631er#HqB=>warF?^MfrV(VZ^%bc&M0q<cm}TltS`@{47N~
z7M#ozx1J7zLZ25#ZgJwkvsar`@TB|;an^eVrh9lcyLIsL)IN!*VFUXbjRa#@f(C&^
zCW*+PqZ5fmOcOD2yAZI!Xv<;t$Hb^gFy|vCiMYTd5y?!WG4<EKNJPu*vWcF8pN_F_
zq%RH`g|s5B+oWT7q>X1!#4SPMAe_|#E%&|_SH$T*=d;OFHHY7n%fe6#Ae>dYs4AVa
zHMh>fPAs7tnIxi3=BpiqRSDWr@a5P6mVZdZ*pIbmvtvbEbA0}ih>lDWkx=-Zk{h^G
z18J!(T0&Fg>SjqucHl99dk&u5ClS>aA-YTwk^IsZUz=Eh)?ku|r24wv`li@eo+okH
zT4I9qGUhiil2Y=`u@34Cf>Sa-BCAH_FoSZ9T5^COgH#1u<KU(MV9N7K900e0J^Bc6
z6M<AO08T93BR4I5Z2JB?x3|7|XDC&0vN@?9V-{Fv?udcpJcsQTvT9=>ea#%D;nKh>
zw06r$W!!5uJCHbgMwHya4H>Yw>9-lQP@zGm0Pe)k1K+7Mo`zN{=axB4)K@V3#&wRn
zOb-#?Do$dV8?>6E-vR7cnI59NcKg1E=+kbJ({9$#ZZXkr71W+a)Ri%BKhc0Q-feft
zd3`3Rea5f#<nHS~<*!||JIvx($j}b=Qqg2e+Z=|?TZrvA(?cY5xUjKb)9yTerNbh<
zBd9^dIOv)_rt5eP%#qM(TFPqG2M=MCf}`Tv18f5C3UyDfb&6Bk{jPMGl&UybK;v`T
zzxhC&<h%2ig;V3&zYw}8KKmYG3)4d+n=x%Ydm5Y?)c%y|A!3*po7hHuIG&PWMl`r-
zU$^=4o$r4=#2%)Hm=wB0+4m58m>wd&=e_)a$8qgXeW0yD9A0XW7!33Zu1(bj@s;Tz
zk~>|<NTY2?8ekIxpa^m8?G5dB{Z(8C;rCWq<}sYxL@3;uHJy%mO&xF|vySEr=86r>
z`CK#WgMVr;ruuM1kYOs?LjgX}`O^O5rQOFH#Gh*SJ<Mru{0Bo^+s6?5*f=XlgGk}G
zS-$NYjEC)*yX{{7?YxacN>_%YeA?$nh8pAE2G9?FAq+^|<)997ynlc>q<|T-VT&cP
z=i&A-#8`lpi6PdnvM?1)#xe&P*x#grb@nmDbliI~bss|vV`7MF!z$-T)05tq1ik%y
zuAArT(1Ha@7C?TXs89wCj!%HO@3IdAonJ^-O&+%Q3@b^+5AWen=2V0Uz<P>~P9?(I
zsfZjpx`+-Nqp`hS9dIR~0*S~y68nAHhdt7VXKy~-Uu7A?!$06L{#QpEgarcbw)YQ%
zzu>Kpmm>Jsr4?u$r1vlva_6)ZyahO@gn^33w+lftQWP*1RKyGkw#T4Ce-WW8Hsg6$
zVPkj<W0`%Ah=M45pg#P(bd`072+gOWN}hkjfBLxd2AjGoJxqQ*A2edR`^9XR9m<pt
zar77kcKyMw(Ki_D^Wzl+j(e-0#;D_aG}gRE=%NBf_8YnuU<ErPzq1eGI9PuWq19AW
zz0c<l55N2tp1$wgK1!Fg0@D}bx|Oa>KlN!B3HxMaIbMOE<mLEm%#;v`P)OszyBxHr
z$drWB6d3fCDIu1B8c<T4KI4r&PWa>>MA!8G6aa8?>dx@&ecA(9jR)ZsHj}^bEapVm
z`qimg0;`0`+#mcGd+)hVObL;Q+G_k7s*Al{YM_#%zr+CAj#%g|4O%VH+c4D}U=_%c
z&Ad218mbI`>w|t5gxMxywg-oKh8A{d3q`<mSnlE-Wy8vdXqM0x&h;=LR8B0eZB}LB
zxlt?H7jboPDfKQ_^Wf5zvc><03}Ws|c=0jQ(~4y)Xp4Y_3Po^?oq@PKST*=N2;3UB
zZUO?MzKeVp5xNu}@?E3vd)eG~S)SD^l1q!;!p2t?(tPI6{$v`6^Pddbz+CNH-dH_(
zoMw)Jst*U3^;)mX8Ypy4_`)g%zOJP$Evba#W+>rCp3h6{uD<hq?Yz<s9az^&e66E|
z)nxpz5ZcgS2pL*$m|ockN!l=b)GeonwPI`t-P?EzI(Xtmy9F9+&)7Koo&WrcjSJU)
z_9Xo@6M`n|V9$GRn#OH13;$QF+dQl{`^r0f@3lw!{xXTf-cJ1Gj}~@j{BZQ?3uk@{
z2mK1WhK+pjE1L1EpL0t~Z}To_J4y7X!N91m(sqKLQ0j~6tY-d)-?!7hY-9{<K5E{k
zaqdJ0?F8oSl<4i8yRdU<V5j(tAQeDT@k5UH=2e}#2WguP7qG^=zb}dIzHAm!a2Yat
z1XHD=6aBDMyo|c(t{$4b@B1!61UqygrH5g?@&3#1z`flb{jjpm4$YOej6Hrm_Y}Pg
z^9x`2m+oyjuk1}VV~^MyTu)}~=pBl%_~XWgNi$;muNXwbC{E$2qo;?aj>QQKu%`ZH
z5XFv(7Zwk>87D}bG|owqidVb$f6X9X{4nBSYby8nCY!i8s)~8yl%%QhZs|0Y7-oV5
z%Xt|)I7%)cKED6<@xE(s?(2-33g>E6C3XIdK^$9k&L6Iep}D57xOOFpUeB>zm+!<S
z?=y(wKjz*z8ufL79jl`HC?{WB`gG={`*0CU(M`tr-;z~k0q}nE{jvXG5S=Ch2FtEr
zRcbzeGJHCvKa6<M>C?`Q?m_>=qTpnr$MWRs#L=eu`tI-3C59!M(_4QT#3vURJ|hB)
zFXnXb&&l>&ugCyt{z0md4{w^4gwtY(dD5{99H~AA{ah1KE!TzE@CHcEQctDd2Kx-6
zx!T&1KzJ+FaF8<oMkVADX;z!ht4djd|9L*gfid@nwax?AcfSjXyn@&rb}$ZGFk&)@
z>!#97)}%s0$Mu@JL*b8dGeuPUx7Vq~%YGI=n}paC@!iW7YM6q*3}Wh!7ivbuMsNCM
z1@IlbYa7>fhKQU|)p{t{#w&(CdzuABZPtIEK}=IC5-=LGvrQ?k=eD<caD92$%JA#5
zz3qVCP@^f6K|FbCTCn)UK7)Ab%palRllu(fXp__PzYO9{hxguJe=-@wlbcc(qSJn+
z9SBHTMtUAEkK*@yLG5^Hew!}O<+(t=!sF|844QPkthRmJG5-AK`G9H5myS0Lj}?Id
zA+mY}N)|!;7^C<U2L_xLO5^;LLd5`Y^`$&83`Z}GWJxb+A=Y6oDMHZwPeA~zthnaH
zt*?i--BPm)Z@C?Nokt0|anuzc#v04iswN!%P+fUI@^hTaM;Zt>S?cH1KYy7B0O!+>
zDjdC7T#&v~%Sg-KQ-y)>P4mfen`6I(d?1{2`I*WUj!QAQ`n8i@z0$6!<pauf;%?&6
zZYf@_MOw)*?fNq@XB8L6^XsN{pLnN`f*-S050pnH$d$gF=Tm%7n9V1Y1$-3Gi`Mm6
zxlT&j&9N;MKDcVqGqx?%3_6m{!Kzsu6$Wmq-WhoE<o(@SpCKhXH&r6|z!Kgn01gZR
zfa5~b`~V^Jvb^l?{7R)WkeQ%cieM5<2%yC2XloEaXzk)jAw>=h4ipOp5w3B_BF=+A
z90-y};$7W2UcjiV3xbqf0f|CLAU1U*jEIKwdKiFU1fa-+9>`{s+o=Hn$kc0SDb{@k
z@mA9T4VpNQNy|}b0vHJp0JJ+6KYv-T=zJ>x_7P!GbYTY#vIPY6oc|uQWr*YYdP{4@
zP7=V^#ncjjfRA5}R`Vl<St;SXnNDxKPbHlNXs|p8ZB-FO`XS6A@X3V+xjhJB=GK_=
z9THr&H8wAE5cD3?36mrywY>2Lx!&pc#nst3{M9C5co76J%k^CU!61@`UdJpiBSnAE
z1b#+xs$_A-i*P$1GjTTn+=y}CQzV4H1=K>^D9)6929aQNHX8SrLA;@2<N$t3jx1p^
zh$JS1NMkaHqz!+QI=Lbg;NAe<-e(Zq!_zz)OdyXLurQZRTgXT<PUPo(3&k8m1f2eu
zp5Txa{8KsZJpizk`B+_?x(b4l^ywP>ompw$!`f2MA2ZNs<+7uJ*j+E<s=6(K_Db>6
z(h$J!X_3eWyL|4i!iu7v1#tB;abmlPph5-SHA^AWY?@$tl&-*mP?dNq-+Dl<mHl>W
z6=H4-3dj<f3}V}(FR6l%_Hq*56Y9?EA;IV&a<1Q%_dfgyho`~;H1+v){*Y7brCG*<
ze=5bf5c51*r{89$t38qQk&&~f567O8$>+J~b=LCIP}R+@OF{KfP;pWc8<rUUQ2RKq
zoLyr~DhPN`AB6#k1F=5zG^~e=G0}#^5J3>nP5=b%@Se9yw*i2r(QUJR2-;({mUI{+
zf4=6)VeczS@xg_$E=t1?*opSL=bxL*NqddQ77|{}b;%n`6WeN^olN&;GKkZ#QM#2$
z3^wpGGgD@zN#ewQ%$DIj?}KU;=jN<&{}+RJX0DdWAmW(}BG^@j$si`4NfNJmP<ags
z07U^DXe^y;g3@-^i$*#-wgLuxTrUgIVr^}RprPLH2fTe-&N{RKbL>zE7#l5;!I8`x
zNRmAcV(vmm8+)LmY#w(Kp3dHC{-eVpUgr=A!2q=zudn*ut2#A3>(KdwD<nQ~gvQRN
z9tfDw#*mI*c(9Cw(7Y;_yI-_o;3L04dmq~&i*h8KL>O_RvTL*U3MZ>LpAZ+61|pC;
zcTQ2ohaNA9f-p=&Z&{!NLICyLh=%G~pLsB*0vF^*fJSbG92)Yw8|%Ry%1L2+R7yGx
zqP8fHj`o$-Q-Cu35g#LBf^O5A&#he#8*}8V97PN(6c@hiqI^5&PK5E{w%C&wpaRt;
z2>hUwfEP|(4u`;<&z)Snu5CDaEk~&&*7DtnNA2(VCyyPqPWFle3UZ=q0Z^o+Cvs9_
z<m2pSv~m2mHIhX5D%*QG@ky}ViVp;!(GIpeylQ>x?B^efLp5J?a&6lWIOs@|SXNmY
zOa^y8Gq{J<8`*<bC&%v4QI`YS*iZO`A3rx0Zd==?5bPVrFZY>yE})aeel4!#5*kIM
zfrA}6x$u-3{US2-#AhJH5DwjWXoF7?c1TvDH|69RLJ@d-AD&6DK%tzH9U%l&3t;`-
z4a$25p~OdqVAes}b3+k<s5|GDn6b;Q7b}@6Jak|{a2A9FNIo}BK&%+TorPr5C#M-u
zdhQ^Y4f8_^OI+q(Wn+O-b$vOPLoAwJkFjFrbpo!%G-&LWD~LCNn|>`he9;(HxECn4
z8L&R39}cW!I8=S?S{d!{0!>-fs*855C|^(ow)!)9QZqf0Fu&z;Iaz%@Ho;v0!&ty+
zvhlF&8z7-3O2d;t0@vR8@%gFt>_f)xS<m3@%jIwuJ_-OYBnb)xIZCQ2D7cZC?|l@l
zTZ^$h9-%8Yfou86KUgkjL}A0(5TKGQact5AP+Q4M_=XawCaF1w`AoEop@M%rMBv0U
z?CmrRq4w89B=38Ojhvwf%!7YC#3@uMg7%Mxc+iXT*F*H&_YkX7()T??a>M-X#+WfE
z>tHj>st}Vzgj7V$%NE6AsrnMKyk{Oj4>X-7F-b&{n&y2GCW)A#Ti2yI-`m>zqb{!P
z!P<}(t9j*-N+o_-%FNSNz8~6gwG>8`R`kA!n6YmnDqH*|5lwKl+(7SC1Qe&T^OTe*
zpvEK-r8H?IQxTjbo^`99DfKc*#5QgKqgpyJ4S)L&iMVB`)`tLlY5_P>{g2#Z=SWwT
zMZh+X>hDAd*pb>G<$_fR*0Z8JM~}u++EgWS1a1S*Ux7i=0A?)HK$2>UsH(Ro0VaUM
zIr%~}UAaD_{D^_)hK6E$t;RVBPklK4iZq@JV8>EX)JR)Apr+k?_(XGx0|3g9@pa(W
zgi3f3wKM_HO^6^^x(FmkJv$brFZm3tVN_ER#l#l(RYV+Bg#1@UB<jESFv3j3acUWi
zZ{2`Xao2Ts0JL>P4blmI#{7YW)8W3jj02Rg>dN$Y=6PJVpEzZ|7J?eAR%*s(JQ>lt
zuVZ7xHTd+Xc0IE@!2+~G21~0yLgOWm$5A^a;yU6oIy~cgqUt+h-;$1>ARVB>Sp{_u
zXm+r584W9U#t@DVdKsqBvVQu8%;&X%+a5^yh%{!4HLB>G|J`}rheVR>3X$)G6i0>2
z<KOlokQAd>ilLw#35<=n^-T2VI6iJGLnNxvoSVc0#<qk4L6gnzT#vowCXH#bWNNc`
zJG8R*A#1rccFje$pGKL`nKoi*UU*A&tf5ns3WU@eCoOr|-z<(~_H_3RBe0++Ru1ei
zlN<LBj;PUrnm2kcPr81ht)ehij!2qe+K3dxz3U`^0@;z-w-L2e8eJ=UVO_n~3GMUG
zu)gBd7=*<a@xCKq17ZVn&Xl(r1azxDIULn!(glEU*opiwzz4WlC|8#w#?m$L8u_LT
z1p3WM66lT6FcR+r8Az(UJfsG+fq^AKT`v>RPg|=v!jW?`Z(>(1>F0)QxcejTz%jAm
z(7Mo%7X4pO^g}cNuYgEsjMYX7LcI^^J7_$dM-dsc%8~^j)X1JHg#TKuL{OxGtXP|Y
z_0NsIKde>YSi@?^mn~3b|2h@vIw;t^@JK~>;(|595NvZNNaxKuNt#<gvq1|h&+khq
z8Ek-hOu`QwCKY=<zUZR<NSkG6yvz&Kng@*(sDswqE4`P2WTn;vW7a&+5xf^|E#4^e
zU(|3ykYIzPU2)PwBdf0)J<ymouy||#S+UCvI9LF%*NgB*05CfCrwl}sX(MLj!Nl#s
zJ|^u@%YWI3Bpr9H?@ucY_iaSLh!DANBNo3HmH2BT2E5=o1N`o7sg!8Fj{C<(1k8RO
z0&Lzg3flz?>Z<QVjHv>1GB_vcu<Csq5lD+E<Mk`(V%mts)lD<Ffh#$YJ){G*r0UAQ
zHX<oRx}L<y8|mpSua|OQ;)uY(^TGn_Z_U2Fne9E1{H@yZeC=gIZnG-DMax436tZC>
z06NJWuLF?=gAk;v3);9iEi~>JX#P-~Po_Z6=uvsfNj6#R+3^&)Fdet?zdRz4;Fb>u
z4E!zmaVLPBKYgc(oz=0KvpIR{Va#VMzf2*411Kz1n;RETmk7ZG{?tRqaNdM{9<f@Y
zFkc5C*>*o?@`xG(&00YETSVw9pgM1ea8}fRpGO3EV*rJe((HDXrE}xzK@rfc2V~yy
zWcKs7wHza-BTr)^^j;#~TAuF*?w`d*Jj`no8LVjvgoV^coT}%0--hs_nljec&({$m
zPdf;|35Ym*Cn8(*6Q(`tGTy0<4%3kYg-u49Bf>55Ld2+W0#4`i;m@^sVGS-71C~Qc
zyyt%$RvZ@o@_{hCb}Vu={^Y0+sTw8wQ|G?9&V}8dc^l6!ypPfoEj{6dKk>0v@Uq~S
z-)}BJbF=<@y#V(nPRM+LCeU$bh%9A96g(M{PGnDbP&S`}+9P5VQzegvvMWwHK1;D=
zb>?+))*gyiS9ZpJekch-^OZRZ?j=1VMPNTWe=_CNdgYAcn1Yycan7@g=(-e}atUy{
zNO`*~74rxiyT}-4YG#J;++;F{Q?>#Ku3Q(TbpF6%?h^Mn0h#{+gQ!{Ns@3GG-S4XN
z*;RMtKN!TrW#Mn<r<8Qv0>oSz9Ndh(-Hr#lnIyQGG8x3&8EIoT3n#un63kR1RA9@^
zhU22G$VI!q45GbvNQe#Sgzm+Yd?9@97aeo|VGu8#Yq}U3_4OS5>uL26Cyq<bB9~mG
zX3vYvUQoPr(fF%cz@$a+B?U<r<q)<x2QC}b^ib{88=Q;bd*v(DQv>u%?jo1{bdeqz
z>~D%^y?@VoM6&sE9KN{{cT4f|?Xt^{G%k-svE9h6DJI6f@!_}(e;MpOR|&Y^(RB~+
zXALao;pmRJTXZByiic4bFz+4f-c6Yg@1Kuza+iqa;M4$nscU!?ryk6m4?%bY3N9ol
z&ZoS0e{j<ya6Trv45c`$ksv}YrC&<Tt;yb`vrSGt4ED$?n!EOXHZZp~Up>0OxVG?p
z)MF9PVyQ)0tH~$nwE;y7iJP@0O;OJhJYPi47OpHt3(m)C#FIppLMU97d!E(RbHO(g
zyk|AVt=Qu>YhRT`)p>h0_Rj?Kg-|}%MV0Y1-)y3JFEr{d`&uQN2kR#6%{RZV>wtT-
z=U(ZVt;QRt$u}(bFd4+n*<!V+{{PJ&N?r5&U&$a|@Hf8ZfBc@mNus~$BY(3O{^q|t
zuhF6A{|8_9{mu3tKm1?p7)eBmnz3WYo<;0hwO3b+s<vjS(NYq7$Eb#)sJ$AasMUyB
zv^6>uB~)8f)vQtEO5fM#`r&(>>wN!%oRf22=k<C#AJ6-Zz~I{vLahcy;F<CX^fE|V
zd-Z)aBtt&){-uC>6;v1zNsB--`0~(+x?t5@=<QwTm67{Y7|}R}R@8^iHSnIN5K9>1
zo+uBUZ_>Ud@gIz6eZb^F*r&pXH`=kc^g{iAB%?I$+56Cm;$!jnSaBq+j7FSK`#meY
zdlsvq;h&NN)c?VV_o*-<<iK8?)_RM{H|8IVc*FT1T;Z?)$6((cXGji<CLBan9Z>Kt
z;a5iJ?0+8={*w_C^NHc<i~qrhN&f>Qrm2Tt$V|NUI9}0()?<swEIizP_`m~+rNW5!
zx%UeZ`!+aW2tJ}1PbV6F6sS*YKg?kNn<@9*ZulXcFBL{iO1_SZKtS#V@PxS@?iZ2i
zskh_vk@1bcf!6p~YtzGjFd{xy$K_ZjjL9Bys0i7Qu=!&z85Yf)C_X~xTe4pSXR-$;
z;tBU0sW2je-kv5hx`W9Tp5Q^Co}4hc1~U0V?knRM9^&FX9^a>y$Omsm4&VH%%*}9F
zoeCq;A@n0Ldi!dDiTD`?(Gj}K`umm>z)&iTh`jfa5=)6%WQabD2;{!+L5Pcbl~{hj
z^hNL9!a<b1P~-&n?$qLe4dnQ9CNK=gU=|*hPmG9PJWxY37P>HmP+>%#KM9ZT`36QI
z$V`huaU)C*!(8Z}fSH!nu@4Dh2#si0=V<$z(H{dIDl#RhnJ|KUcgIGAqPKko3Z^B%
zVjgGT(_OKCY<<`>wYw`k0VV2bZ6`rW%f@;2n3W0k`u3m<j^wg5ubr>}^ed`R$m{yK
zS@i#hLHt<n)_(Wb`o7Ez!DBdE?oQsb$7v?AEWUKczw{NnA>P=Z71jE9lg*<Rl?fKK
z%z_K=5;MhK!s>~}DKAhKzxDY)2GRFO>HBzrdhq7Pk+RRktq<RY54alLEV^dlufrcB
z<gpQIT*^~JLVB*_hfP;JG%8=^s|N6{IsXma{L*8n9I$z!xwkr1W&hm&^mu>rcK)eW
z`h9pVs?AbP`0zd=h<vugUPu>g`RbbjhSm8>VGqZF33+UIlcE;`V9|hM7<j|U_e$~2
z@Yp;YCs;F}<Rhb^6J#J+mQCK{z0jStehxL4)*l&qrvl$IrII;5W$FoMxGcLdk7|gf
ztImdtW@xUjp67}f@vx8podST$OLz}flv$k8hYLdHA67DK%{9dzIl4uN=S{jRPe7x+
zD9z>xd1#ekm2W|}%=2#5{vQSr?RO-AqI$ry`9bS1|A#@Oyt!D#VRK>!MY+&-BA%sd
z9V5!K1mmsvHeK)6Jn+LMRdbk)i&7cH6fNnR3a8f>BNFkQ(slnai1{xKt?OUR-v5t5
zlzHBBd@MugW6_pv8svQ-+x%ME0<CuvG5}6B*6f<RAa8Zqp~c{3aD&Zf`M+`<ODTU>
z;U;k{9Ev6-7h!rP`pcIP@RxUT&wJ81esbdjiF4a*R%^)<0jxTNj29nPE+vX_-C$8Z
zOLJ$?JVjbQ@8OT|G!lFjGDEOA3EfK!pik9NdM$ow_#Kr-q&x#d+t0-sKaR}D4pPzh
zuMCn8g#kiu&v5;2e68#KKv*8ycH4xT!twS(M|kWOKWEWOCbx?XEraASY`TE^AY5@6
zTDYP-0=;HNuK;s-(ycb<*Oh)w%)}?BQSMZBGC|hNch#8>*J>dKbDG&vCpnEQ4_-Ah
zfT~aJsty5D_od6_KbW{QCvmjla`I#cIP$ZlkS{qiI1&%{$L4D4dbNJS-4>QEOvAlc
z&{6wwbKTeAKja^H;ze-U5pmr{Ut8sN^2E=~HbLL69eN-5!e!J(O#EcsM}<u`?6SqB
z&gQfZmr}uma~5#LIaEYobMLQ6jz;ZGT%^j-ap3@k?vKepnAaFj>z~Gxt0R*-h!us~
zQ(dq7&`x^3Xb|*g|KOnrq7MjSwT0F&4OP0w_na3N+I}{>x!|bkJ>JK5te-7zKBbYD
zhC26oZbArW!!}+jB_}n`PfFWLeG=#)TBXdZdAlEYMIV5L>4-pc4y6I|eHWV%?|3HM
zyTCmPadOQNF0s4dapA`BHVE_3p`ApWjXztGGD+kRTi(M{n#jUoHWQe0AuY%vIka0;
z5cLgJwN)W%%{wZ1ipbS#yore0OKjh%{(muu$~CX4yPi44Ct?UgsnO~^PoYC%qRz@>
z#=XL?{ELSsYLqe#_8av5+<i6)vMpKZ&TY*Czi`7+2OJHy&=&mA`%&GMpbVFfN?cW2
zMxykSOsa7xRtFnewZsxDUpowo+k^oRsU$&rz7!k<F%sdOWVWnU=9t=`)BK?S=C+&i
zlUaUR^*&8&RQ)cjsoEG>mX#jdN+&d|gD_A?&J2w-JpUrxTePx<L7Z&QdRybBsLs-*
z%PhGi#DQVmaXa(KnP&oxg%t{gz&A#g%4{%4tnptQvt=P|$!C{D6ld*pQLVKgdjo^Y
zUkIZ#S(z<tWK}A%Gz~K<TFzkpUFliYR0-%swduZ*EH*1Wlr5*~+G#Bzk~hr-?NI>x
zKyvg;p-ijE?NwDJRa-oQB<N14@GO$0U3P1o?Uugsk0u$5ZkEIgm%QM(*f6Adm!&4E
zRg|wc{HMSb^Y~}Qq{fslGTzE#l@AL=d8!~rS3aO!u16XQc94eEb>^5=uLL(1GY@GN
z)_(px6>3twA1}EXXf-(`!uxZzmT)|o;X~uZZjP6gxSf?g_Ob2d+bC=8+@KWQE4!fA
zZxSvrhF-Q@bpnQM#VO5h&u?dcQu?{YAdyxVZ#3ZXvZmiujpnDFDw@Ro1EKJ6x9;3w
z@iORc!*9(PR^7K{pDMyMj8*V;iww%)h(l%*QHj|^doRPb(2Zerk4YxH8i~8o51F*z
zmFYu4dsHWH#fOVafteq0a!wKglRVR0BL+wvQPqQ5C(}-eweLAMLL{|5)!0UV6yXhX
zBs`t9O=YiJf=T5m=7!B?*t31$T&%X%uC+~V?hIjeKuX(DTv;<lm3Uv&4;ntrPa3h?
z8;jbCQ)u3H*Nf`sB<mPwJgfg<yDZA}p|v?=gCl(n^zlWIKT}#ovyEJE`vle}plmTD
z!#;8sX0{Mq?^DXO?&86V|1+$~TN-CF&#kqH_g9yc{n5hK{)&G{@#)(opt#ub=+nkW
zD&7!!eX}3%SPj11mQqH!_aalpeTfS6rEwCHF3P`{871o1JOBaI397?TgQse&q~T49
z;E${(ojBg~ALM6T@_unj@(t%BWL<$##J1vI;dgd7A2{xW_nCAE1MLFo`Lk_?Z+drd
z_>R!>2>{d>CQAdQ)QpM88e+D~O@T>aD=;dIZF6XAD&hEzKiP&>!Z#h}Zq6X+yk@GR
z=6j1`^8gVXYL2X)VD@})Lr6s^<;|0v-TO=x+@@$>=|74LLB1=@hs>m#M#8CnC~COv
zu#G-oC$UC7{sOAWXb0z!Qe%kmG;o*74$I<la~)(Iv<VSO`m$4+w8S8h#G+$_ycrZ2
zD;kO$u-{PpX}?GJ)p6TIXjmlUych$Q8qQpAsw>llKc35JX^73Tgu2|=D|(B9j`eQF
zrIg@27)7eJ-)Yl=I5hy|tw55=Y!*ZGDp|RUKr40}lxbN1Q{1fEbfnPZUdgKGSN<I>
zo42=e&#sDZU3$%U&Uzab(S1Q$!Fixk{chNgs;jK)-sXZjR(X9g-@aYSI#ACP!TwZ_
zXU~xwJ=AUv9`|{OP@{=jjm2ilMs^6<Zw;S5$pI^{Dc?37xR5jsQH#UM`VJ__(ux%p
z>1~jNsK@_=L~U7X-95UGw}kXu4CoC=i34<!vZR-R141-Hrm~-HA&Vw~B}{gyvUpGf
zo>nuCBot1kIYUxmqb(?*`zSTe_L1DVLTBhgVxk>Xw*mABFsRcQa1$sfGsWwsNpx^8
z03T1Tga(F(hF^CEppn!EBh$$d0N*Q$1ssHlpD`jnB$!6Azyy}(N<WOI&~_#k?qkmp
zI-tN$5;ilE80a@a8Y-^F%BsK{It=;9SnbFZy%TKsYQF&<D+`J3wKP^D^l?Cn^>F`e
zM6+M9Vm9tyq-gmZ3`~v6c(w{e_}#gPi#94GNF2(RY9mG#Yw^Hj*$k=eR7qcYDXNV)
zLDD5)G*-({HFR)(6wE*F=$?`MW|<6$Y9q#S|DiRd+K3u`EBng|DS#v4c!@odls7;H
zM70t7kiPV~4hCG~#P2nRJlE(<yRV-B<9X;&5HkuLoJa?Epnat{%s)cA?`syHM$Z5s
zo9Il6zyV^_Y~px~=%0yccRHazAo&$Q0h;cYAH9*em|i$W3f2$3V!_N3&oy3ZgGc`x
z3GBq4k1IK^GR~uqkv{2DK=yxeU{;&&H}>fld|Q5wXWkGQi(-!FO?z?-ykV1M$U1{k
zC>P@NkJD<U;oHLktLfy%Y2;@5mR`p)&(KJ<#%Lwc$tBU4CiSt66RFo1^ky(XFMw1M
zQ8y`uGwmD4%2!*5ST3(vn{YZ<IGq{~zqr>I9(1f!H%bFZr?p}zsNcskjspK8@od4@
z(AI+C7!v<r61%ZNYm7)F?NSz&eUCzdA+UM~1IQIac}S5;l7#6MZ*OQZsG0^o1DHB*
zELV-P73=3n(ueQ^sM;W3bqr5jsa`n-L?i_)8#+BCalo*88UVgPI@y)?ivDqd&?<o$
z3IFv<y+BbP|2Xz?VMpF7c6im@41QbML9vBOo{6U`x3ItwL%kJmd3w~u8yffo7O3$^
zyI0h9%grS`R@jX}@BPBBZ^g2*w3>)f=sbP$hynPQm?>d+ddA?RT#_*_D$b2o4Gxgs
zpylG3H;MGJA@Z3zNKpTS1b?4IrPxubjY#kUDA8$FBd(udXxjkR$FXT5mWpV@5q{cr
znnB(7B!voSmYM-iE~RR(p;!-bWA~^Z=}*NG`^62U)Y1Rhh&&FLL+STE7r9bx#DOBM
znKCi*Rl7aIP=<JII6xd%q%GU06E`4ifRQ@6`6tMTkBubnMMWw5ugU_nWUXw(IJ3BF
zvqWn2=m85si(pHD6tPmT91BE{a@Y-hCDzNDC43A7?ZThhls{E06VzCtb%GX&&0vBg
z=<+;@U9z#h#y4w@`)mB^tNrQWzLM(IL=(JwZR2_gS8b`_Et`P~&1-b3-xtL}u|Pu7
zckyqMAqyJEh7Z?&xFSU2U~i(a+4{$H<~TzGmw}Y#cTgRxcz=5NZq}4NwEJQIODG-J
z25q+zg`boJFQu*1;lFK)FX<xvlrM>uS{*ajV*9+b>U-EP;PftC$*^x>NvL-qGt@{f
zGH1YC)>aCmKw}KqdJ@F@-cDW;v1#aVrvL4p_ptv!-rYEn8O)b_s*Tt`N3{_hu=(ck
z+Abt$$xjg%k}yrV8XGP2#3!{Z{`LmdMl>|2PAj1`9<Y`jT%H~b9r!`D5g`j~1b`Hd
z^!*~$M%34JlQuQ_^}c!G5tdHe+PJ}_N{`Ku)l8@sE1s9qXHrh>tJ16*SIsudHC+4H
z;BTbBU#vHQ1@Zi7BsEMa`AxgkM+{MI#8^%m5_dC3@cpvM$W7^S;)iV7$%``5-juu~
ziNRwzp*DR6&kU6DOv1L6aT}u;W)$0gY>4GW=^$gj!N-NRjCD5_Ui#C=Hx73e-_el;
zBoD+|L{>A)H!L}AOtWkNX`dUsH&jf+=#Ix3;o*J$1AWJ_>6=R=sA1A!DM%_F9*)H}
zp?Jyteg#*Cb%k|(8??;+;}K==ygu%Ky)3dG|9<btaIDvN{H?4*M=TQ%*HS_URmswe
zERmg0(33R)+@DzXrPt(X(1ZIy1dR`+XTUyKt+WcgRS}U70@}xh;sceR{EZj`kasft
zKAR7+5}u(-<($kbm~)@c-KL$twsv<%vOXn-t*XzYm7ursenBJ~7)UYH^TLQRZ_Z(#
zAA;(ZmHZovrr6936~<|F5m@GOtQMYTvZg=LO2(VP@KDP5hq0W4jkqb<u+{s=V-p6g
zRtz&VK2u~+XTuokcc=Yfo!$WZg4n=?nDlclSlvB&@m2rPy?*$UJHoGuxzhkI-`=si
z64)#9-2~Yz`ZHEvmX=QDw~1x{AE!%?4`U@SD=6;8>a$VRuPZXwW>veXHX;f3m(EG6
zLJ!x#j4;5D#)9xfnX$V$1yma`CVw=ReLRMR7%NDS)!7OVk12EL_(`=95rIa6URNdf
z)42oLuI*UpwgR|(arC0Uh`jMq><m<gmBoy9N#F}xE6w~YrH>63{EgiZNyQNhTUZbV
zEPv?^Y~#hMiLBMKv!Mj$)fh3JtL%TbzymEHFL^#ZjWe_r6}_g%)Y`zPochm3i~-Tu
z8$8&o(4^Xkq~)?=9^VjdxZQs?V&8Ya8#;3>tpzcQn~uo&J_xgceN2#jccDtF;9}c0
zMShT9bZ~1y5IP@gM`vfV68l?fQ1Dx<9h2M*Z%^S1)sB&)^d5bpInXzNc_ow72TFr3
ziSgT18*x?Gv~bfX#0V~&a{`F3GVwIaB2{=BD{(L!?f36Xxm*Jq>y4{A7uuO3@Q%?`
z8xbXnyk<KR`?nIXYIR4`8^ucy)kyhj0;7;Pw5T{@EVsA(1)k!6IO1X9P3(8IP*D}P
zc(5QXR|$yaAzDCCRvCTOw1e)Ci-GP&wcNz&dPp!IeVD6@L0~&3v9p-_1jFrB<eY^0
zXCsc>2p*5UOSf`wb(W)>_}%W#6CKWk7iAzzl)@@;1iSD+5EWTTyPFmA!2FJ`5K4N&
zaIsc8Z}YAzmd*k6gO#m6B1QlHHRDUXMi=jj>5(h0@fK>2G@8;YW!{Cu_(}3SefGg&
z?KrwYKL%Z2^<b)vXxR}GA|7wbB3Iv_$B&8#h-+55BaL4&v8-VyUsZ^?2AOE5ju&pX
z#oV$2$U^RL@zgnPRqvmXlJ8OwYW26C+%@V79Qf!L_a@Mwk8~@^^kuH|po};J93meP
zEV+8ozpN7bmG^7q_Fh_WTsqUfiO&Luj^etbasP2Y{|Tvgs7~+w#v6a5>}VgrdOtJ}
z4LGKQm2c)Ub(Zik=-ObeiZIB{(CE@oP2<Y%I}PVNgQSfVbqAX9(^MOgCUqnBT~UN|
zd4zcGUZyAJ;EeQ}G2j9X;hmYrW?&qGpEN_1Pe5vxfIAx&JN0~W?Z~m9!*(8g4f{l^
zd5cPDaVxNV?^&1;1Se=}*~eN<BNx)C=LL{WQn{$y=!kFTC{bE>X;#;7QJIVIgu%7Y
z0BALB;oHuqpR^j=DP3LM@tyfsl;6@sasIKJ`RmgC!Z?)v@`HiV`nB1fE@JS3yu0xa
zE7XUn5s|b$Dv#LT%&u*8Vq&B-_?K?bqI>Xq<dE~pkj2ShOaDOd$#9s?NX~yeV(!UE
zX7}rslhHeo!-<iDUEM>^x<~Kmym_ZH{;GTAp!@CL?t!`P@dqbwzeY|{bcTd3OwwH#
zVU2pbs551FIwjdNNq0ICtD{{KseGm9b$j=eXU|md>9l&(XxQneCs7~lquzsiW`a*7
zs61lQmA2r1cZ#WQTJT&*%mU{>9&zD69#Qz@KOPaH3pwoPf;^=1h)V$&JsQ9gl}Ch7
zg+ofu0@E3p(z7Ibw)8t{k<#;>^WhIl)Uv|aqWala)3X)lv&HMZtE{?f(Y*_jXFn4k
zejn5QG5wIKQ1`3$*`i_Z3gyDL%Txfdck^e|+9%y#{SP+-dUtkve^=>l{p{Il@7?y)
z-7$<_vY`Ah?EORK5j!64ah|Q(zxwg4cY(?y)}L+tJU!%lbtL&}H-NHHMfu&O_h+&9
z&(r9me+;7j36L6Oj@QSWnM-Zh)Rq`<oiS_rI=vO{lLL*Z28TnE3==>=W0*$MvO%<r
zYg@<>)Y~#&`PRqQ2+o_<McNU6#*=IEE|nT4bE)2k-Lk8&$YQwyko=Ny&OWUCiON07
zdU=S8v)M(a#5$RqS4z#7);FY`s_kmrzSW-l2~t_}7?^QK2;>Mn$S?od8WvDh9rJ^i
zw%hP=OMmzzf9M}><h7p2Q$eoCaQ`n|5rBhu{_w2@QX;2<^(US!&*_}7@HT!o`Kw*o
z+RluT`GH#fF&3t}zYcf3KQ;#RzvYirL(i3fITz<HxB3rvT0UFoiVUV+gw1Im%FsUE
z{E-rMd9if%VC(nLjj-p(+%oeW{!J<0*3Zd0-E17GR8D==TT`-JTU+Pg!Sa7Ih>z&a
znfj>=BCa2F;RG@OG3L)2fLiHr4F2B?A}6>WGR%L^OS&K+^gjlXf9k3Cl^TxMVvnw5
zzm_P9gpMLA3YCiZlDnZ60^drP3uSvwpyS9}O4*}IZ*+EL;>~AB{ICkG2D+OXDphpP
zmEsJoRAxh(8mpc3IVbcP94E~c*)QZ)n?#~=Crtz%ZIMvoMXkm<?J=SWpjNHz1ii_m
z;I~?;Cwo%@S~JUoy6oGrQ%+ae9a0noiynP+^XobHsZ1p5(Wh&w1NM(Yu4p>W2$;K|
zWGpc*edi7R5yA;*?RfjQCuC%zwYK7kic7EubE(yxx%Y#zaIDpECQs+AM3EnH)+3(h
zgpT$L4>4uQEX<h(3%nn7%8jPLf&~sM6?Z<{o)-dM!@FM&W9RWeZ5z>L@M#h6Fs)RY
z-+abLl@jSCP9XPYFBMHz&`GEjh|Sq*YdEKXGElBJtk&H6z&>vj%VPyRDj(mJ^2lpn
zDK=&7d|N7dtzeBU3|_rdeTwl)HXeB$Bp^MTRq(U%Rb<B+p>)8$1X}JB{N!ReLYO||
z`p_1So<Ui=&rRKmj<<QrD_s5f_?LW_q-?zRc|yZz)N4U)fHHbtL-_1;yK{%I0Gz1G
z<kqBm@WSS~pEzT-0AKRZ?v&NyHmjfd^$Qnuu6|Y)2zEgL*i*lFJL89gE4A<5^vLr_
zm1CQHFxS4ePApuERrhkCIK^`e72cd<yT#|}`L5f)6QRdHH||P#IPvyU*!%43P6bSS
zdB;uh`P*NjDYl_2PoF;A`t_8<g}rEvIDZbem~^#hHAaZn?olTY!tU&zU;QUkS|iR&
zp4p*9b6FL5FF)4dAv54xc!K(ft;K^|*|eNm@aKPvaOTUgPfKSZpu4z!Xel~bisYUg
zh#cX*>b3-m@X7IphzNr?%Jgfo2BMXSXx>=^W&^bJRT^X{SE}>Z1uvyw94>keE?8LD
z%n*7t2)-d5Kj<-$GILRwUZA5-an_g={<<!uBn9w|iyM0*e=8~CN;b=b)e7S@6xSI%
zk<EE0F>-?x$)d$XIkz%tYO1Rw4q6%&>#H=iC@@PE8Wl?#?~{k!yK7iH4ne4jjY5u4
zf$-f=;;!dKZ+0wYW$=nw$SQ&_&)cA|BPOyDK)p<jLH2r{VPvxFc#uQ$qu1T#@>4Sy
zNUlNt<dsRn=!}Kpmwu?6ETdX$AJBTQzhDXW!`fg9!_Pd8U*nfhs`&i&uivwC4af@Z
zHK0i1$n8RO_TU9x2UdaaoF()!Rif`*Cp<&-T_~iFY8gRnz89$Fh)1hNQf{`X*IIMf
z2UkrrXKmAz-j@oVTQk#SvCA%oRd9arF;}b=&NFyle$MZa^2qlj3_-L+2F7r1E6e`r
zthAVneidq(k{=s1<G^Bi|52gkpkBH32S-bR5&H;n$EuIOT4k$3{ZYka0WZh8N+mw0
zy3P-vko~%z=33kICB5p?5Q$T=(Q)7u_@S7w(6O00A`Q;earVOYo7g(qZ#~!QqO{yM
z<Pc|CkV8B?)h_v}uP5sqV8q(IIqhD(yQucL!P}wynt>_njE`JB9sV>Y?QeJ`O1X_?
zJK0o<dtcU$xkT&~<M%|;$_FenAWi^Mc?2W7O?L*-jpeqpm_(4bYNp!O&SOIXU(_X;
zS<gdI{f&YF&kF5~^-;Di%xt55=ie_sB^<lwRVyR<S*y3*+PX6W8<hWWUfzG})Jryg
z{@{1&BIW3#de4fZqzwI3+REDrW?-+IbqZkq+3MHEi}?v0d1UH`z9_RYq+gd;HB&R(
zo#XyJF9T++FKfJpc*URQp-)#*T0W~Vi91QA43{pSTE8Cr9@CUIebJMzW#*#hLK7<L
z#0{=~ape0-ke0ww0`I}bh*_S2W`fRF7~f0Fiy4ZxPfk`^y(2~)<*ThE?~<>NcmRQI
z$XJ2y?CWeKE|H-GaW1Np2%+O^KBSXBbO(m%(?X9|69cQ7vUMq%6aLre#h}SKmOOoI
z?N)};-o`+Wf#!30s@s)`x7a>~!bi=NY?xf!(}oIWrdfdZ(oL?e+dn;=uB)`Iv+7xM
zV5Jy+R4&`EtNNKRJSt`0Wpb~+LTtn8@2nItA-gHLU_BfEnb|YO;6lh0I&Z^+ZJH-e
zYSWj&b;N`1j6e_L>I0gsh|YG5(6u)OG5i0e`{HS%-ma;baNR{DL~||CUlZWMS8e#R
zpqf7MbP{YeL2K#h(xS)P)B7h~LHNtJJ#^h=5Fyg{;$7a~EQLDT)?=TRuiC0*tAH#s
zqji{shdZ*({Xb_s=w9X)ib!{RyPfmExmRX&Jw3-^_i?b+cae7;j+PI1*4MB2z4Xp{
zCu#kiZnwW<+9f_I$m7?eR(D9($UyM7UzzhMd>t!j#?GE4@MX47LY3j_pWpZcA8vdU
zqI8UeSx;nncOHibiEJ@xWDA4z;qyW<I7Yt4CGm%{D4h2JiS5qF<#$bnaP@;jP8025
zo|heT4O@HJ;+Kv-xt$r~Kb_=>U$=b6T4YkT7`bM3{fM`wc&|R7o>Gz~HWPfdQg!_(
z&Hvr8b!P0J>()`@CYcXXxHVo@A`JvjINa4*23YfE7(^ER-M!=HplxVir?bexqv|N}
z`Alu<BH&@`y9<&XNbI@8qv`V}Xr8l)0Wk9>eIyP$b&X`eM?isGS5O0Nz%1)3k%w;&
zl2XoH8RNf#S~H5%gOLu+6#xt#06wIVpbcEaW=8@N!GknG66jR6zH1O@^>BYE23s_r
zSgB4XbwhyOc;c(s1f9Zf273aYdU(h=N-vDtHyUdr*9uPg_JxwxD<u{iz1fneP9l1{
zIpA+v$=@CJ6EZu?@FgJ}jR2vKc|t+*jL1C8M%asiIbr{E5>b|xD6VceZs1KG|GPWA
zG}LJ80PmPXXPMnUCvh3LN*LbQda)A-)-C~`ZZQHlz^?Stj7<>srfCRAo3$6m(FDhK
zYDqcvhfQ4N-o!WQ$u77pL~4@r(od+f@0!Hq_sDmZ54Wn|?yON|JRhI)kQ@FXiCld`
zq3-{XM4bM7Yk>G(DN7Ir+8e<A7sb={oJUi5R-=?BLPUs?#>%r)3#D;q>A-N^7e2p7
z1QFK?s7hj6&6D1>5GeMOPS)!ysjeznzUAcViAns<ShK!@k&iiio`ccPM)1?N(MFT?
z0*7GoEul3IqZ1Axx@Np?Ly|T9E^`pSSR<4vTi`bboI|M<<{@lVF8miF67ZHst7M#<
z!jDLs%~(deVAqpGgq)^?=HE!RLVyVnf^=z>NSu)OB;pV7;rOJ;hl{<%CH!#`pAwAW
zZ)+q|*Cb<=IQ8NXZ)!xB6s6*`jS8j^nRoGJccm`GNk4@O1QD!d<)If=dh~xHn(iXb
zl}R^D$yBj{NX>>rJN!|<MGbeVc8JUiR+3Ol1<FCT!rv(c3KV%{hcFVJE&NS%m=b{6
zD{|*3a^`S$lczwkJN3;af~?X5cNyGD&pXA)O10o+cMTg2lr@#*FL0_T2CHaKD}Q<|
zCBG}D9IWh^qjblwHD+AU^c{`!uF7>~Rf}E3EzU8m6}1a;>VCLP(k)Uw5g8<cd@`;1
z)LtR6j6IF!mpN5Pbho`t;`1xZN}!z^qS5KM*BPb?i7})~4v7iWg-LhGP4^3P&)p@0
zRRfT(oJ#0_)64zH>0IB{RgCi;zo>UJP4DJ}-mbF#r#t#B>w4+y`d@7YrrlQ}O@&i}
zbzhC?0#&S1no$DprQi<H9wu-^E+})lfD%$SsWU7vwXxJ`BFO8`oB&7o81Q?OCD470
zB5_a+fUf(pVDA<<W(@jp4?LQ|KTBjew!(4!$0PD?{NoYJO?3J8TH|g>m(ze&>kzw>
z%5|{AP7#X()7NUP!~A{beGV4Gxt43YmQ5;Fo&i?cZ>XdXe<KWZ1;Y`gtl#tAdNJ3c
zE5!OI%yK&yydPquP1E>ZVSeZbcNz`L_tFp~3fN{Z;SH1QoJJkGn|dw_jt7Vj5xL&)
zHWJX>o5H|TcaSAUXuj{rOW6FGxB2UkCKyTJ3(@ArhuyPDr?0u4cV9RK+%vrSNF?l$
z^UaOv<E=~k_Ad9%xy0_fP-LLO7gh51`Z_i@LqL7Z--&l3>4kJK64@B`j2M$s46IV0
zQ^QwCtPeO4!*_z>m??p}(Owy(fy_VRqY-AE-A8G?5Fa9Mes|yI@$aaod3lB8SkX$C
za_(EUs>`=j_nP<a=h{AtIC-#3|LACTsr%{9x91^c?<SOt?Ar?2>(iMdxF45-kI~}D
za}xJU8DLACKDjX867EWUj(Jt)M&bW>L=*=$M*Iqw_bmq|2O7u*jnBac`~S@&jt{So
z2+#9A;<VdAyQ{j(INfQ_yVLdY&MPionQhO%K7vze7nUUXp==<g?=a+&1Xdq<(q|Wq
zW-$ZYIu$-gvDD{i^A=AKzI6)l|CZ+ykjFRl0d@FDd<e}!4B%#T7a!?kaU$`Ja@sjB
z-~Ot6r{5`9{c*7Nr(nHy$>Fv{E{s-$*-<xKJSd(VXh1)!dfq35aV7>v9mi$6vlyY-
zPWu8}%kG^n-8)4wO+fhB+ELW4tluDk;xQro62t{7^u0t&;jz2NxsbX~_n&h=XyNuX
z4oft-3sl>W`c7mH3__P-Se!mdJk;lW@6PDsz&21qo_(=(QVPuu4Rbb#`ux}@{&D#E
zf$;o~Zl&bgXZnAa-Nj{5Fc*XS+zIzze8LFvV5z%iVAZODPhMd@f+a*|kzJ=|6zfNn
zB)X5D;-C-pfe9(qGmt-lyorq7G+PNMdN=a<6I7g|KF1&DK;f0>doq3FOxz_zwjr`0
zD1h?4<nF0E23U!a#3w(QNq#zmdCC0{-^Wadu?s_RJtoEkRY=^UjdCtab#{_?kLfpC
z3Xoh8#E}I*YDnz3FC7B}W-r<Q?t@)B7hKAdx$Ba7&~c}N$D+^zHJ%gucjVloFsDDI
z;4`3sH=H?x%&_;!V5gK_;xjI2nHzD0J+BdbgwN6boTGPM;1qAB!!}@dfbi{OmVTLe
zh-%+zw%tOpT9+EU$J_+Bpz?TfgIyno<v&ion43H>1rZZc>DUNQ=Eo74Q}PihfQuB-
zxDem`JAp4BSLGMf<tIl+n8EzTlS<K<*z?AJvb;)DF4-ZdNa8{aj#rEa##rzyBB$Ye
z@mJU42JR=Z)I5Ijd0%(#z$L^oAfLPO@y1lpX<u$Ii8TX{vPQAGv=#jhFBal06Yb38
z_~7&h%x76j*}x+Rj?W&{bYxg;M3!|3I&)cvP@jsNy&a`h2Swtu|2iHQ^2&m4aO3;<
zChQSYTr4B!HKjJdN}7^{rT;+^8QtGl3Zv6$g<ugC9BP%%+-j?4IezAwEej{K;Sq>F
z=9tdMhnSG-O_J-IV772UqRr*>e@LRq)7hdL-o~$Pjp}b|O*N$`>oKJdZVAew6dYel
z?kqt<RT@&uz{Q^%7VkH5UT*r)*%%bZsT3iYMiUud#xZ-pa2{~^@kdE6chGktpQXEC
zQXflTfh6gW!118T{_>0KolP<;P1noBGDY|{iB%&@U`PQ1+JUgdaQOUf?J+5EzTA;`
z`SInsC#minBzFiKp5JH*GXGYHa17QE7SeD(=eq><&N?5LD&7X{3Yy{@WpBT=oD!{#
z%2i;ooa=Ti=$M=93H#iUzDyMdsJqhK^8gkl6zgtjhtCMtCWf<w3<>RHc6yZJDnexH
zCcXx+P)~9hAM`}Wc@1ij1de-9njkn0EwQ9T5Y?ZfUqnID&`Ol>rM;$w6KUo7bH8>W
za72MW8*@sf5vP63pqgw=%+ZNE5WfElqC*|-!G_S>HZMy&%LGUzq`4WlDB4%)F|9c#
zPT0$XPc?wlq-1zW36VH@Nxz7Cp^Y96N~z)OzCu$upW|AHfcyrZT;f`wc{w2`<O?8O
zpA!;%aa21Yw0dGIEDWv;;12JU(B&DuO5!`|lx&?~&WoJ5V?6q%FuCqzv}JzmrA|>d
zKaE`>UY9sJHa~g9^Cr>Y&F6V2LRe_yuAoVC)Ta5n2>y4@MLa{~#*xzQn<89ne~~YQ
z&0bn@t&R$Guz#Y&%xx}x;N&b^#&BlOZQvjCQ$VQ6>js6T`gPnzlb1WEOL?Z6t`rf`
zQ(ckMPu%gHeN&n}v%81W@gnbEQJq9I&=<h!zna)UGwXc%wny&W+{9Zss*_m4PIKWk
zIDqOTPF*{Val8jSJEgucvgMVu{BshCuoQRT;S!ht2iJNJ-J-qhesxwLVRpDD`T5l;
zK+IIS)O;Npe*&MsP&|M0zG=zyw^DmaDwSCBne}_ggwuai;zsxPfCV9zB5?u$80gMT
z(64^C0U-ej-LXQIyUXflw!Bxrz2IJHiJFr+9RtwNCIIQ`PsXYQQ^tBEuN805*-Lu#
z`T1!Ic~PlEawFjl7vue3b7zf|ZsDo6e1|Hqz{hzm-@dj055cstN2SHK<$@c}+t;Tr
z&KVcasbA$T=$m?Vw)MnigUQ>%_efB-UZ^Cdkw62SlH6s@*nP&wLQJlfk?s76`F;9u
z&6C6j^)&_x*|J6Npwze1Z*80Q;zcN<FQRDFdj34m|2AC1<$YR3brMHg-Vpu7ao3Mr
zm%-$os89@$>LfZ*eg_$x+Fbv0^VQc_y$1oW@OPii$q~o?50bdkCxn%G_4j%C#@IE<
zL*9E|7j1kNPt~1Il9NvW9)&~<EsZapMqeMr&jJPgzZk?Fk3`U!Ikjl7R6!YiBzw6t
z5~%DwX0LQ-mdYUhuoBgIaC`z(sh)TeoOUvqtWq;oVfjSsg{D&Z`x=Kjx1JQ$x&bjN
zqljm&Bm<Kf)CZ*S6OM)ex4F(JR`td!7}2NH!FlT?mF~#Dy6j=^o{v3nNehIgQAf0c
zX3yS6Q5i(9kt;pea~2=b>aFZU4Ml8Pt*eu~Kb3T&)ba55^_SZv+6R~wKegVO`?!X0
z-Tcxm>U<`xC>ztnF_tlBgG|1e*z-g?+WN!ZuQi3gub*XH(0=P-l82iH>7K03PmDd$
z(`(v^<J|Zh%YooGc<{$@==|@5>*SkzCw~ne%U_G3GKg0ZCTI>G42wJ^i8JEt0<*i%
zqkG1}G+e|)r+6BD^iveaFK+iFkx>SCY-_`GQnGaCpF|G7dS=fwaZL@6bTy~JM+RD4
zaezqRuj&c<uRJtFCJxn-iF9*$pk1<(QYH0PsP*f|y4QG6z(;P3W}-RQ9s<4b9tq!9
z@*b)-KhD1`@y*(|tsZ#O?`p=yn?<1u$v=#4486Yjw9%?RN4@o2F#hSKxA`~AQshUg
zqaW~&I_Tl7YqMod^c64NSwL@_AaWa%e4dqMnBT4u%igQ8FCNIgU6;s1l@c2wvToI}
zCEUK<*tt1cXPh~Eds^L{#zIQZn<wa>l-NIW!3oj@Z|t$Q@OzPVMq%-@OgAfNc)F|a
z9w++>-Or;Iy~+tzYsOuMDmF)cYVezKvk2(<BcJToeQfZP{n9l&iAT%ggaa&p7H$jG
zdo`~-+}rx*!9ND^%C%llUHSOnoj;slF&%-y*$as@zS(k&chY$OH-m_yGKd%53prcz
zjz{cfDjL6iWoRF-C;7cesoA(YX(A+dZd`SEIeFqTG+0)v{*CY${7m*P7?!xQv^OCD
zXAhn6NGuN-KaA|>;p+)`!>zW}HUxg{``|+8m(WE4+t0y&jj2dtd9ykO*sKz69nU1s
zIT^0-R-@<svu;pba-TBY^6a<%#*5cr(^KD-+%vL&<VjM_?tQI%s=G}+-g*}2(VFBA
zB}=@>8DFiA*j>JuSk?N#qT|{7u3s`z8TYq`Bx^f|!pfz1;MvtJnIdZV0W01ZW(rI#
zk>9{y;}ueQL}3)FoS?nA7n>oT*I}P6H_mSWI#_#t9jdur_wMXMGrtE=^8gp1ySMaC
zZ1!uhUJ8c&@(CumO>|*fkQs#(|LtLyl8}4&kyg=6nptvbXrC~g`#=`J-QhxY5&`jQ
zGal5><@ob?$i#n6;tbVEG~Z#8U2zAdQdLkt7bx#-u>H_6-9IOhn`D!q*In9d;zD{5
zXmF<siLE#JL1exilqym{?(JQoI*Cgv{N<DdCR8<yVR_;ol-P2%Rk>JH&Tf6uukeQ(
zgqz$Jn{mOG;J0O?S1{+#aL+FOSp};e(`6Kr3-t1AWX5h}rRLU`M|5{6Tw-%~NyQkm
zsw{yOM`GDgI7Z$_P!@~a0chc&aWiO0GXM_|PdcH~^mS*wyE>VCrq2Z9@kuexrB9A8
z{Kj8|A9cKo<!nX(D|ubCEX;!ogh^f!e~G+-#N}KoAQP7PYme6{Def$Z2_{yNnf-nz
z@8$drNYli4Hq4Xl7!vP08ett>J}s2A_x%F#wdG9{Xi!dhB?^4Zb7wQvdp>eXB#%HJ
zbnP}<{@>VhCHiI$LB3fV?<=$@>M5*GA%;SJ)C?6D$E8${y=U+TK1Qb;Hqknqsgp+4
zRsrU`@oIY#f0^AZ$$c>EZuT3;GgUIrtGlA)<6VjNx6M;Jr?Jaa2Jtk>`iBI_U&WYB
z0g19`z7GvgB5RpzdW^?mKepE1Yw$IeQK@73)Y18^*4I8xuuug2ym_DzA^g)0#PKfm
z#XUltoUhxW^rr!7wOiG*QWmrBOp4Wp0%ycT0itk%l-cXptLT1RpGj6LOAME|urXIN
z!76&?MQqIKhAv#jb#w~L?yHe3Q3!X9j&W)&k4kQt`7uM5FsV(I^LJcZS5X{CGn#5(
zZyTfO>{|5&mZ?<RePIgiSOJ_hYHnEB5|`%1_Drl!?&7`YPp*Db`t)+SB%ayQAoctN
z2{hf(AKJy5b6v%<<K!1Bs}`E=D@!;Ls%XOGGI9OU)}w9_WQBz6llW|}PoTH^i9j-S
zd|!^LTlr9@w*hgF_WC5mD*sw{;c~WA%#@HcnK9nt?h<}w$qU%1Xdg2HaDs#n(|a2;
z#h}0DAV?qysep@E{ghE_7pS-`O8cY~q=u&nt=&gvKa#Bwe!4OsafAx+n_$&O<_}&<
zxTsTalL@bLmDC8O%Ury2MLi@2a_0||R3SMt%Hc@N*Njd#15O*B^z!vD$gsC@$xYFN
zqj#7#<>LLqn=r~>L#XR2le*<ZCMw5OBBj2i%6%#Yqyu<co_7bNHIbq<*3YPH1JFs^
z$h^}{1@G|~l|7`lbCm~U{aJ~Q(FAsOwBTc#lU&_Zfi*6qtDqJV&~S?RDM9Bb;fE$y
zJ@0{rhM*ZLHq{)nwACXH_ry+PR4h(vv+q_J&HoTow;pk4sPuTSAlbKF-IE>=J9@;r
zr<NlHpZp!8?l}i|+ukRmne9y<X#u;c(enzv9&2$Wwd#9&f6WTJ0(^h@-p5d;d7W+C
zv$q_g?o7iq1EV?7_sKGWaU<7zHH5<Sm!zY!bqUD#1#@_aC_r;O8l<NA%<YH0lFa0X
z@m<i0K4n-xKx-^5XuVYE^kPiWeJX17OA`5I?Ml^S#bRW3{^iq)uLK^Xf6m&g*T$av
zzZt}ggYKVEzaxKlEmA;-MAnDYE#K}XaAtU)Hi^UE1vMk*A9{XGedi{HHlsh||H~jg
z+$&e;S-X^Z{J!qtetkgC&+Gr2K@@fG<F>Rul6<3aa5EtO8;0hD%o=?-pzv_Zv^jQ#
z${>yhoPkU{PF5|VkB3Zqcb~tDT(yt>J1^9`-voa6D=hkCilTeir0{U3j&dlVK{=X!
zb#_QcJr`o`W1n9<;Yll}-^tWF{goL#UKK4sq(px`V7RW&tTO!I(p~RcZ86>I(6=}c
zry1s)4~A=%h3v#B8ib+JhrB$T{HqvIGYotcDq{A}K<u9eK=D{XJSKgRXM-k4hKyCv
zz$h|%DZ9j~C&g+V#!O7zLivPJZp3ONVJ3d?B9h|HbzmiD09N6cOCwlaM7-h%kBLvb
zUUghODt4|d9yt?VwH<Fd60c_xH(}>zrO3F`CbEmuzEv%7gC{|hInH7R5D1Tl9Y!jR
z@K|;vI#fg5Iuh3c6H`!$&Ke2VW?~h>ld7|lqz;qr;-$B~CujkHI=R8DO5k8JLn_%J
zH=HkPH7Rw3*QF}aZYGgMLomXHlC(CFh?_~W(nwB5rDXf0q%kLmxukk&q<SPJlrhUv
z+F%1Tfl3Cz7U8tdL8-)!*cX@-tB#aLj`Ui5V5d()1y5RYM`}k$`isdl*i7m?KK<fh
z`WRlC{V^;Lu6st7-zo!l!CC3f34Z$u-i@(vE|<@b&Cr=ie`_Z20gs(F<D)&o(kG|i
zbHRK~N_sVeVavyHGiUW4W-jAXPc@{@w+CrVGA`+ZSo)FTOQ4w;_IMG&69WC2K4^vv
zD#O__#v*wxW_|0xal7I~vr<HpaO!I*OcCj=92u$+85~DAHDE4CGizlv_M%iyQ1)H3
zCT35_C5d2Y9vnf7r7-yE%ePH1{uNWYJDtn!nx*NJtCOF@-H|hqltXuvLte!hP^b5r
zc?m9grk~R-YjV9bbKQYb>ZTy#BbXkiN+pqPQv%-L1=aDyN51B6r>2fO@_at$O}pc`
z@OhyZb3$G|Zd}6OlX|Rnh&Ml9koHpC)C<@r%IVso>im`6iKxda!dix;#_04NJXOo3
z^1L+)s%`ThNANw;#PlZTTdd_r)Z_=97rf3BI-;2fX)o-^mp(wVI-%*GRCBJP{jeyI
z^AW5$reNYT{zAtS+~*vEM*io?CqFa=vNVd@5XFO<DQ{mFl1mGBfyGf+ka3pndn%Gh
zeo6tB&}dN@BZx%@K+#d)(^oI^Nat}`w~9R;7yf>k|8uPn$orJJ60VX|%6Kd_NO)?|
zgg+tRrKu;(=rYNaGK6`NCtMYY0V&LusRn_O$3^@pocp&#T)0E)5rUH=C9sr;Kgj|b
zw?#VI;U>4Awb3zb<Dj@02B|d|TTW4|J1jbodb_A18je_*V05xUtPuW3NOYnKiMVp>
z(o&hSXF9xat=i%}si)_U8Tbk+!+7BqwNQ~g7zkfr;|BFavnoi-xDZ$mkc=&gOqE3N
zW{g8~Ol5c{%&g!Uq!aFUzx>`P)d#34lIAI-77QVvSYmm{788zGP8AX>11ZdA#PS7d
zWza?@a-Fx8w>n=Lta!v)>&4JT{jKXYtQvv-((ppw`r!gO6AZ((Ev7CTwrfPTLL}oi
zFNVAc(`|i_jXql?;d&ddQp`H|ACd^yz2T-eeaxD$<UmZR|Fz!ud)CH`42q6nZMIPj
z5V2oDv%p)*OOcFSXjT)P^+F2of)-;cnuVr?wH+8BzQpdSFC)>{xK#@iHE-fhZL-hK
zZu5G6CmcDw#q_2eY%!r2L12{}lcj&a%lJfd6{r2%6MBMVs&#;J%G8V_<*hlu1L&r)
zjx4F|7B!C6^A@e2o0?Y8&mEs-TTFn<0-2AH%qD~uPq@qqoFXMXCrhr)c)KSM=wMwZ
z#scN5DRNW&F$G(}0S)T}4occ)0geqzRlhuo#Fg7+INGU&#+X~&$28As+&H&so|U@r
z3D34%QhcW1_DrAk+5O9{ig#Q8+z0#7Fqmygti~{ym9X5u4Rk^?_~DvOY#JKe2^WNQ
zJ7^fFa-we+y{jfumRCzS3y@squuW!PCCVK@Knq&}M`X}0nSE)(;&hE2vjiH4zYte6
zoXdxkF1M%k0Z&GFI|9=bN_87Jz|Xy)o`FwfN_&(5l?VU>`Un=|RZ&&~cD>#9ip+3r
zB4ZrK<U~~cd(0$bEO0*sYR%G!%>sI&D+Y0<PPG*C1GH^4gy)C|{5i(9d(7mAY)EI7
zJRsYbj)48Tn$5N@_4Rj2V03{bFvW|-bFOBs^U^k&r3}KdVn8Y-0&yka1st%F2>d|;
zin9URCcuLb7F?jQvMh`0Ja`|@S_)xFgm+jdX7|^D1HOU=QrY|KF4+))M}fwzGOFq8
zPd9B!LWO%2OTn--nA~{w=v0^cJa`8FVyzs!L}Yt0)z$x#eHRD5eMKgSA9SzK`XmPQ
z>IwLi8p@<`yk*H28w_43VZSxhwM$mh>|=vJlQn^W6x^&A0DRlX<{2W`@P^Th`zvD3
ztA|-Y%pjX=3doWLD0^j;YA;6PDBxYB#>xZ{G#_vjQ>JcPCc*0>EK3k~XYnKwjm8^d
zCn|RJ*=%Tlzkh-}0|_IA;0`1cGqn2ke8QC@reH`wXeoODnZa|575rD=#KvzX=FM!R
zGP0ayS^2pqlIeX6yTs@#Cvv+rH5xj>NHYwsMKYg12QJ%U$|DS~E3->-yu)p=o)B~^
zt_&zNja@@Bd1*1`AsKJt<a5#VmAH2KRE9$>X3Y@hlRJ}#Zfp|kRD|<UFp|+_ixqx{
zz7Ed1jb!(WVK_esP9*dumLUD$)1La7icKRDLExA3^25x)K{CjM*pa$d8VRT^Gp{{E
z*H%ks*RR*c!|GaQDX*ipUrY3{1%)FmdBM!nhEhwT1lf<ClBD%G`c(ZlM@U8sG%#-&
zw6@OBMZ>VURUV6GF+qasZqozpK80NX-zg%P1twc;Q*)avb^7vj{or}U=LzXE(NR+4
zon{t9pbMH2aM|usZJM=kLl;XRHCU<|V))k*B>D|JE2>`P2gKpPCP>B(9Mdu@XG0NF
z6q`%Q9iZ97$M~k+HXQh_oaNGOdgm!dEc?93OV&E%%d=#9toi3W8u_28?AruZGsvZ(
zE=wvx8Ro|jCO3y{nnroi`|iE-yV_FQ%4|cflgxUJEv+A4ub+@^cz?S=>`BAiY=h$)
zZs)7eaWrM>6<IIlb{_$Sl;rs6nNHSn{>Vf(n2)C4r(p=jfx}Kenh+ixp+BD@-!Hlk
zMfx%FUMu3bK{P?mn7gx>O)ypxbt}mN-diG)#mmGS48?X(3v$8LPJ;{VW-3Fl6Y_}V
z8<Gi}r3*4gZIcEyH~^m@_2hdR<PdH8Evi|K;z87Bz7!VAFg>eaeS@Jd{cS$k)WimQ
z)gOAiCEel<^pLktY%)MJ(Mz2(bJ=2oZGuZ5a4vlr0m|s6#yoF>%p(RyOwxIF%%A_!
zVm@SHI39hzO@2=EWXz>&v1I;BWeK~V2h@V7yKOU*A4~>ru5mwZd_~lK-_4ARQFYR%
zsLI(bna4AbT9>N)=(})I4UM%QZo!&u?8J*<M_a5n(ex1$V1y=<nZ8-~=1=0aAGW>p
zo&?K$0;?1G>oJ-^rx!*j9m65PU!$5g4A`<+70i2EKP}9PHw~(B5HLZ^HgHz6l3G4v
z(1R$bmtbQ)yy3U*_r5paLfn-2cJCPkWERNtinuAc{rx0^;dBD*La4T}fx1AxsbYRy
zXmIGTK@{qHQkBM!9~T~OcXYhfzedw6V$nPp+1!O|K2GO8`2}{3g4*D$k055^OV1@H
z*Pi<C?j^9BL0GUmtWNsBD`{S^U$tAs?V^;Ke54IFb~g>aflVn!!#Ye&GL)H6VR=_S
zhU~K6&YA6t(-qksWrO6pH<oO#&@Ar+e@&mkj$`PJsCBmC-ZLE7F8EP!<Cxg9Kfdo~
zZ(rL~Ed~2gHW1=`4WpU|G4z%CY{bhyg7xK>-G1NBSYM$<%*w9IX8iQ~{o6#paSLj@
zV#oHeXLAtE!uA^s%H-tuJuRKgU>qNOOmw*1wH-CNZO+PP^|#el`-S6!7l>$X>32I4
zL95ALsx`-xDwI+6fRlSpY_A{$q)}rqf!>D9&;~gkf%eK6HLe^pCF(Z@oUuB>Y+vC{
z=U(ZV5$Ff~`mJr*;xY8EtQ!H^Oe?i#8^6tUF!cMpd?im79KAYIZ73aTrN3zu6F9}9
zR|w&K9%I+}6g<Z}c7MEk50yEk-o_WfW$TJ^1lgwW*sYA<UOjxF=s}-cV<?qAu6Q(N
zZmuj*T0Vb6{F0z-W!lU@^3*qeSF<#Ij1psYmY&389#@aM-zTp}mz`lfQdXR@$Is%%
ze@rnC7`qT;cdFhbomWmYI&&X#+?;=DadIjwY4Nc~%?5`sN@PfuMr@zBHhWZ9=|&%<
zxilF$@2n){d&PTwpGtWZXmgyftIjmauRLRr{lD0|&#0!p|6lNFK<J?ep@-0WC<0QG
z5SnyEML`Tzx-=D)k_Lnx5wU@SAflimsDL5@2}J}1L<K|)9TAZZ0+NY-fB*md?*HC(
zXWf~#W**Faeje<z&RKh(v-juoeo0v!TMzyC@Wks>8Ly4-k!KNK+l#z5BgbAPvXs-U
z7osNGvgIt3er|Y7^%P0<U%k0(H!Z*8q;lQm<!h_s{wzx_IUlpFPu(-4FVhmI8qee3
z99z38n0Twcxo(Usr~AS#X?Njt4?}cqSK+?gxs}+CYHA-{`58-=g2HmElvQJSbr>i*
zkJFnnD?v+$E>6gnPl!jO+H->D2(8i*g{@ZmrDN>Mq8Ym=gSlM8ks(1tc7?|s8~HTF
zn9fht!%wn1J!=*1-y2Ze3lx)mvkMi!kn|k1>ZWQObY4UByLBds(E9j!k=6ZiBk!~2
zINnqAoe#{G)jFI0Wazt?Z%);^Sh64nt{5(*r><6l)&_3Y;(<@yY~@l6-0lB2gJ>H5
zq(k{-c<nnI(}-uEf?h_{eN8ouY?v*78Ts;OyXk4x|GyYSE6I<2sYVQ6fiv}1vKxJA
zmLm{9SPDCZOst=3i}Mq{Qjb$M>`!;0_=(;%wpKsVpK+AoC-$t~TKjB&=1GV@yv^7~
zub@Bc6wY7rL%ogR^ZxA96o2VyV_TDt{W<3t{<7=!wiX-xxyg_K1jhk(i_-ut4Htmi
z*I;L3IB+SK5}>Gb!2aNofxN4X0OkD+_RePqF5iX(s#+g7=w2|8e-9U^ez@V_k>>+f
z9#aA}0}nVH|2R-k#|YFu)8OE<F>v)YTO3b0;OHmz{#pkvNbgF6W02wd>+dK*26qoQ
zg&ui-;}avu@L7YCJLmrg+@r^Ta*rq2+@sgwf9D<}{7?Kl_xN9|$Mcb=dQPMMu^tm+
zLStg%*xV!WY$Tg|e0R?D?D@o$3o(5cEdJphGn3E#!#)0|^%y~^Oi4-k%RQPAQ*-~}
z9=)j+k<@2C>6n=Gn!o7d<A2b{jDMkz<iH&Jzv!dmh1{BdLm%sx^4$N5kM247x7p}p
zX?`XfeT=z!Eaht5=c^&h*SzDdd!=5lXS<InH(KHgPi7XrC@d^YE%JR>beZiw{<r93
z5F33=E(!kYK9;WB2_uz-kCi1{DQB?VM>hJ%yhoV4m$-T_?myi}Hu_juS(Q_Deyu9u
z#>1X}xW`M66aQU&WOI+TwY7}ed;g%1|DE`l^S0sPzjKf8UOo9AijUu0?ryXcRkjul
zwmxGp81rqFn{8#)|1<IN;r|oy@qdwfeE+||JuXiF`Z+hhH2ZsL_Q%Tn&dS2_`p^I5
z9(VpX_xS4N=1(R)lO^ZU)c9+4?tSIScTKN$HeY`D^*`nwga5@n`issn$$+j}CPnm!
zvFkoqka00Z?Ce}g5*#!H`WN@O!UPHG{de4>{~zvA;orH(Jx_X`UT0q`*-%z(I{$4?
zFe48$*as@Wc(}E}&CvGK*8;?h6tZD9$7XJXPdw+iA#tNP=w{r<Z<0ouhQnpt$cnxI
zg3|*8yLDs!7pK((_0WL9dpx7ZV26r(XOJN|n4?oxaVXC$znsCZ`3(0$=-!n`NUy<`
zM_lNGv(H})3+~@yA^UEIK^fV6mUd4C38Ptxf`s4R9%Lwk3dw|G;A^P_vo&>L6{N={
znEC0bnoB0Wob@RcaEykQErtqkz?DhQxzta-c(52~*{SYosy8&p%l~4<MA*XST3CN|
zTWVZ*4dfSyDR$cI7~O76d97SYYX4lT)aeX7)rLEkk|xxJ_Q-@bY{y2oe@`_VE`<M3
zC)ILXT1iD@^H5y0;yt7m4Dw+9RK$D*lH07X(bv9g$F4Q1uZ&9Xlv>;dzw3VnQ{e6b
z^H+BDKj2%7=`MtP&o#-)BBp6W?svxwowfsMHG{cHRp_Rt2(ZPL9hS$4v=q%h?9cnu
z<(&&JD=u4calR_Jtt&2qTHeJMhWoG=rC|T8YCs`fy}Gggv}K;%oprR9-oiUc?W}Q^
znJe4w`u#Qv=6z#<rr#gx#7k?#)bbq3Y0t7Pd$}ufG{7$rS6Y$jCO-lq8)qk?YB*(U
zx>i%5dUiFrOE<O^a=WsOGq?NgGZ%jQ6jTfdSQVm#d#seLv}i)0Jf!P$@D80VJyPDX
zrAJRew)8lrgZ;1+pGSzYrTKE(#qAMpL!aZ#S?Pdt3%s<QU7;30i4&qj7{d<%>LpXj
z=*0)c(9yJ9d0?=29t;RdMv#tgDfp`Kx$-WxaPe+WTIzX-8bcJJSAo>S;vkw3%h*j_
zg$fV^g$Su_8C3udKcs*p#h*gTNFEZf3r3=@yqurz0j?8dXN9loaRz_{1uDco!DwcE
z(-<JA^SI-h++>rj?aP2lPKcRZeX$C6TG?ZS)FGnYUMVTjo6LoA?MOb3umsqXgnX-j
z#(ou+LTlvo)2>`QxH?S<RsW3hqMg;DfNXfoBrV;0YL2FqdmK`dMwAY?y`kGKBwT7O
zE^0>xO_8z^QOCRRxA}I39I%U45qgOBUGM6yeb1Lt`d89K^3(({PF6DG7r@4Yz~aX#
zYR62ynM;s?T-_|+Sdd#9w>6&P5s`I$6h3Hyx^KU48+^S>6sUjClf@gkWPgO72UH1d
z=~0-UxY-vzzJE``#<R~#y!!jhTmYfgXxvvWm2gXMyQTf~wjV#hoy*+lSVvxO8x@EI
zVcLyoCqQ#}{$C21P`LS_ZLnN*GZ`qA{ya)ID}9GuH+kLIB6wQIo3>_~S*1i3cJlX3
zT;sZZ>)QLGNIo=X>$+v|jRQUy-tu_Qo0#&JG>xvws~HcbE$TzNqMW+PAp3D~NGn!c
zI7dh*ZoIXo(=i$92-$(Eyb&14J)VUjaLuO`7hiJg7ut8j_R2N1I)|1ll#)$v{gS-B
z{pnToLJcdd0^QtlZ`Y|n<RnZKZ1hn#ZXAr(x;gKk9Xc?=YD!4~x)UjJx>aIJ7=$Xn
z>uWLOd!nWTM9VIcx41+=d`*p%jl;t$Z3F=vXOcgzbE)EJuTj?f9Y4l|Xr=DQtQc-K
z05U4MW6yX`YoAL3IQVKSJxNV!t4(>G?~0l3_nF2j)N<I%gGIKwDJ6qY(m*8?uKe{4
z2r4@sPBq&?aUSV;mnUnAe4StL<;RR*Gvq#e=YgT-x&1>~NaisEHTZGEu2O3=*gk>t
zill}bv8UBTk5%QM9zS9}JxBYzy`K6lS0m$l>~ZOEOoj$6`<P*HN!J{4QR)kk@;2oI
zN0qD2^)byEmk7*IN8-aa{_ReGPd?EHJwwCwYwBQD)I>Fez!(omMxVcscyQlN%$p|3
zviYW_t-udac8)@3$An8-X-@}zL9%_|<6I+Lw-+QI?zCFnf0uAbE=;XNv>-YyP?Ku%
z;M9J=diAA}rpFc>t&HK{p8Z~7Yo$lcCXkuUCklN6B}(=)kC%qY`DTdE%ErIr5F4qv
zvoHTyl6}^Ziw8RUEHaH#%SaDS>_^8&aP2zxz%Ji!el;4eWx6w(Yt7?lw{`90Lv&`~
z_sHR4)|;;e+v3HpBge@ud6<Sv7Z>Fo__@Z%Uv6qE(&66#%aPoPz}R0$=YSQo*ElhP
zfOS+1>o8~UJ{eukAoRhbn2Ip;{T)d~vhISvr!otLm&2TZMT6b03W^uU)t(8BXKhVL
zq|MZYzVbCK^`7oqIFs3S#&=4&?iL2Bag!AaiLZA1Hr#ck$4TnPgG_6gJQT!OTC@1f
zTe|RRz)h=dx8j#ygex;fY^mkvzyFfS_+oU%sG2fAfBMoLPGvZFN7=JkVa1;FmAmQQ
zamC7{o5eg@rlvLOcll;-;Ey$|rKuNY9(MYz=jV*SGC@Wkv$&4ul^zLfQR_k5Pkp9J
za`mCU5#2>_>*Nxj6KA<=1n+Ks<G*>i7W&-h%?n<N$StnKzE9_-ZtalQe`l&cPCvPS
zqXioQcJDB#`B1EPtMF*AI28feS{^&K>~%yinRRpv50OB`@Yg&jR{8Cl9+DT#r_F$x
z*H716Jq;1{r-r8QiwPk$|3It|oI$$Doc+mc<*_W)&nPgt!#24p2*$bxi`8@C@cpAa
z@(m$6Kf=URg=FIYD32hv@`xf$oFn->;Ur-ZHf-e)5Ai|>Fsn&y<#E1LWR=t0#ogL$
z*}=Vq8^mA-BvPJ4dxQNT<_vBxCd6xrqp4URjEM#e=vuUJn=uWYqy8w5zmWT$F%3s;
zD1LL2E&C9M`vlV1$|J!haxLnhVQLgS&B-lwTT!t7FhbdtSLm|WY1Oo(tu(7A9NH)<
z*$#|dN5rFf7O!|GLa8~dEh;*iDnP=~JktxViRO7C^5fGBhtk=~BLkMf<{lZ%?ziIq
zaE}k_Gphaz_sCWr@qd&@0l1Jry<jsui}E3JP9&>2KC{zK{y~(bGyaeAhznx3+op2K
zqn3{bgIfs>SfNj12)=7sOt$ifRxN`axp_^<5|+*J#E;uI8(bn#h&TnhvY+!wwg@nH
zrIULNp0m3po2LwJsunC`V(a2OF?~9urHI$lf}hv{V0g&6NeCDFd#f4st-`<=56Zpj
zyOB?8YBM}GfcRt#3lBPV{{!gWbHy#1lGp5|*Utp?syTf1j&i!?%?3fVSj7U>2ymK;
ze7s-q@uA$Z|9~EGYWYfTafhQqekww>o9$L@Pzq%p{gZ~=aj4NjD{(cbvg;q{QR)!*
z8S2X035!TJ^r)8ya?7(><6HpS??-?aCb2;Wu*&}2;{$pSx4gG2;Mu`oHANHS5N@YC
zf1t<v2v|4l5A>LghGqW)Jp%tgkI8K4v6&CnfBi9(KfVviRjW(O$M(5eY1E>Z2W{tR
z>So1Pkj+=<Z0NC?Q)@uAzwAb6EywCdTQx?(UUSgPJk6IeD9!-w#s>6Dq!z2+JR(H<
z?SKYo5|Typeta05)r`GMx<(WF<2;(PnAiS+9-pFNGi>Ow`d`rF(s0ImcES`+u$<ee
zs}JE5YubkZ(c%tr8#tQcZtg89pYB7vP}AB?=c?1U`G`E#YG0^yJ?6QgW*<|K|AOgD
zq)7*;h^|(I1lX{AAp#j(qaI+D8-%fM@cVzE$IK7`a{}lV8+vT!GhYHe?YpM?AJF5>
zw^Fn^%pmj+^cX|{@iT96=yJ)yz%#$NzI_v1{s($=z55i;set0!!`}s6y6ZJ^w{l2O
zyBI`*9iczf)r&f(?iw5q;L*ZsX~XV04G5kYMsUt6zHhdWxE#||t$XIey*;K%Axcw(
z6{@W{xF5OX<$x8;wz+q<i~FU!hTQSX$Q$af{UA*+6KhTy2IjA&F2PCT`3xxC1^~_b
zps0C4SRcTi08CyIxQ-~z3IPJ}Kry^P{e#NAz6XybE8zrSHXi6|0?P(m*9EW%LQoI_
z1}GL(C<gH0fpFMEeiX>O7|?I>aL@JOryFchF{25F+25z(%xOMZBPiq#xirB$?hbC7
z;7uUOi-5C@6jc}ewcx`3%aUr(`jBVd+^>3Wt9&$|;0m@3@E8lpLKfezORe6k)~rHu
zCm`+j(0ncvpl>mMiN`38@#{Pw6jyQ|Ad?$-lqr~v_#-@KHk1Kat}p`)m}+H>W@Zhj
z{}!8goCpPUBOVT3$Y1>r;?Y{;(T9xE<zE>cLjhV-gvOy5hXR-Y)MjcebFMTKeCe5l
zZ}L~wnymgRG1zsDFwV&D*I`km;7hfJnYH^rKR<nu!|}V|b2jk^yIymH+on>`?dH>d
zlYbG9WUu-|rkPR-g~5M`M>jU{2q^oBzZD%;2gcOj`Yw2_vSEhC!{1y6sICI}*6cO&
zp+>;wY~m62EVjBX?H}S1@Uq6?<#Ub99fSbGxIv@_I6E&GTMVeZajVDyCWZ$T*grJp
zeFeJI_|~)*R1HLX!G5BEJP5#h)<Iqn9&j|Ofgc6rY_8|T176PyPB=8pWHx=bZ(OUC
zvu_aEyjjodn}7RaK1a*zf%(@C>doMm*XtLXaa0hM?frT01M4{=_95OQ(w`x*g-8VL
zsq-EUqhe496h8cTSpYKHthgX5m>_UbRl6U7@QM<+2to8Ww;+qTW~-fNi!TEF{wR-1
zqjVHod4w^rW(=G+!zO`YC(S58S;&8<J2xWGg$#GIHV<jWIH=X7u<f^7oA+oNu8J$C
ztj&+DJfi8d2)<xVJ`7uVWVU%r^M{PKWBA%_4cpH)%A(CqW2!qajT~AF?bvQ^yIszU
zRUnck;{xpbIaXum<fRTIni0;|iA~URcZ8&wF@E47p52{=3o<#HjIYd&5*Xv_5=W~m
zhgZ}=_POTaCC&%Zj0er!UlDv-ihq>H2h|+7B~GjGH`Y}bzyDPp8EoZIm$Z%gqdYR$
z%46S~K26Ennv4f{NMnLPh$1)(202~bsuu<QD$TEs>hLe-(Od&t;<@)2(CT73cHymc
zqphM9X9NsNBnSvy612v{u10YS`0{P=ao&XWKz>O4NDx@HVVsWY34!p=MnS!*TLm6+
z*&uqSq#60r4DBUw>FC?5W{ie(SO8i;wB!%;*v^I?QGFa=25ty3xXl^7GK>(GC<7MJ
zuPWWI3}eht`s*CuU#M34y3{N87kV7H3R7T1k9fWu0{<O0^a$k3L2<VuV2v<nP9NX)
zg1}|eAL#M7;~(hpD)YnTsQle(o|Ha5$ddtWnNJ0}Jy^5%L%W@VGX0a@yy`HXuTgp>
z#aPTJNFb5_eR2C&*9e?BqvMVa(&;bs$b{OWxILMIR|uSKOlT1sdIWF|_3^bAzYC!8
zUi=F^W)Md9&?Dv9BN;I05c&`F7^U^8UPdBLhVhmSJ;Gct-B6(~Dq8sV#0?IARL56C
z&elFfZ5TvWiy^_dn#+bBnb4_X4tBTlrYmHT1sg8P{sTR3v!TZ*-o1t4suN?giQL<+
zkUP!1iOnOIdIlO2zh;ehX6f-C((JV|XY4vLzQUNZ&HSv0q4zNM`|^eF$>1d|-YFRL
zb2k6gAA&`F!w&c{kng}AjrTGFR$e`}Gdg}5C1@SR+t|!I8S!N!`>S>m9G$@LP^0+U
zyf-haRsRtWrcrnB;UG<m7p6TvdIGZC$7juax3Sy(t9e{jU;?QPa}wZe?i<<ap3q5}
zPW6TK{b+|IO%6Qdf{ioLvg4nB2wrxDL?C#DlLXIJLp+&d3b%N#045^G1b^~R$KLva
zFXpJjf7Z&GChUpFC15qeG2dyex~%Tj@72!V33Ohz^@s$2N6jJos9+4|V3gpyf2>E^
zfasHNyT#wimu87c^B07ys+H2Ygj<C2$N+Z@Nlp5s@VCmr7Qqr|MD=%CqHuHd_mG_V
zR*QxId)#9Z)!JG`yDI5PDC9dbN)`FE1qqm3lSN4Isb-5Js{0mgJik>(!q>IwzaCxK
zNy6^!Edoi4AAyYgNbZ!J!>XEy^ha9Sng~<xpP<)x5SFg22%cS963W#SkwffzyiB=7
zmpMr%2(N%Z%OKDfDyz4J@1%^|!nECJU`q6=aWcci5^nZ&)p~bzzn~08XYF#<idya`
zJIl3$I&j;sYZ52d-uElIyD)Hq>yF9m@ZW1hp>?O*>mFaFy)79S<`B7LI#7pk>h`o(
z(?*2lMxR@Im>eVBZ4;XXk3YQ`b9&7ydEE=vO?kqZ+_*tJ4X5O8rhVP)1#Vz<HVETe
zxj)x0u{Mti{>nNnotL|M?Wg$7cfayk;<tZJ7v26v*WJ$Z-cBHH-<R9Ib^4e4<Lz=m
z>1r5HHM8&N$vM<sXTR&li`T1-KX+;@cbfZ=LfLCx2=Gp`Y8sH2CVcso&RRch_wCn7
z;`lD={O*9u?{1dMZr3>J!Krqm9D2c`_yPE3bIZBucjB`rw~QX`jlG5&C}5-9SsQ{X
zTGGEG7v?s<vi1aFNQl7y$vsxMzB@n_QgSYf?{&AzlGq<PHPm0)p0>~0y>Y95%3dPu
zqvPtQfoX?p|5NUf^Ge*n{r3pubDY$%Xa`jVmuHdFBm4Ye_89!(yU?)AGC7|Qj{?Jl
zt2}E&dhSGc9i{NuJFGAM8}|sGds>BD%gX*dv^?3a6i89@(t`$cv%|<|Mh~nOy!4VL
zi$xEwh78_6e4A6tD$akP{OCJbmPAjUEKzStV&==|e{qjv`WoINZ^CT%wZto~B0R3R
z-1Cu%F&I5}H&=RVWc%C_^U3U(cFo1DZ~b?=RL91C|K%QaMm;#U=j+~myMAzGR7|3f
zewrP8f5^qa0YZTmq&=rTLPHe>7tooaW@#-f+5Eodij_M*tzcGvxW|i^Z4taiYnnGk
zRbSer26r8bwvklxb5s9zC&Z~;@?zm~`(AIqo2i@&d0M;Rpht|o^3AxsH|44tdHU-R
zVO|s2dxJ6P&&M_GpJ>rFtKYs{+j2jsD-Z6Wt9<^;JuZat3u)TN>N|iEblXgK90d(L
zwexyhu&i+BJ{DH~WibB%sWX4L#|V2)p&CaI#cvCZaqp+#wfTo!_pcgw)OZHCxO=d<
z#}Atj<oe-1+~Y?J4!`vyf4E1Tqao{mxktnOUg!32u(`*g`=5OMi>6b35O4iP+>rBu
zBbrsmoJ8adG6P0T45XC2kBc9hD%3OxIr7o(%9+g*@os@<Pq<#b4*+o8Nn9ZDfcoT-
zPU=(u;h3Q***l$$=-lj%t3U&x1~<ovQ<191kH}ZvHj`t60BEA-oYJ!|@eYQ+rj%y)
z9dL_Q4Mv~nfo~nX;|3iIpUimrB|Md?fAgAQ6aZbXUU*qU@`gCT_}sLUz0I$Xic)Ro
zKvwy0M-0G2bwH8Va?O0!3(L4<H<KRPWQ+_J2pSsE??qcL#Ac+bUbjOMe--*HTBJo%
z8OIcPy%i@8AYY7+nF?P@x;35k?A?>{9L<^>sJKqAoedIu!?^S~l_YyXvEdze>T0ZO
z`q}(ug#%WzvAdj&3nq$8W26Aj(u+{bqJj(O#xAllLr2^Aj#Ja?-v9_uJ^(;EI_D$+
zz+Ie94ZjhQQ<0Oq{NWfBAQlB6=<hBu0UTya_|(`&V>AJRL_!EJ4^*JzI3UId!d=tF
zUxmj2Pzj`<D<WF39tZ&738WG%aQGq+cOwc7gyBOZ39{gVb2(B`0Dvg!HcJkNv{<<=
zm}nG*#;MXsv91J&D1ZQvZLY=-{!DUsPXR)f%mnNhlAyUGOED^-uN-bvD+8XTgo?X%
z074wBL9&~t-5gu!FA74-<0{03YMlfCs(hRP>OF42C_eH{A4LGZ1dy3yCeOmKJIDzD
zKe|jD>reu&lF#9_Lm<heUqB2_{w1YH7fa_j1i!<z<NyfadO$O@9+=Im3Xndbcxw`o
zmjb$g$i8sdPU79QcG{&rifVu_XD9Tv$(U~LMN>2<T<k@xHv(*1wGWma@8CUCqij=l
zH&-~sn5syCh%}(V$UGv4<LMyJr?M{qOmfJTpVDdwv^Adf#>U752I#+l(F5KmhPXxL
z?p#I!8k=pvfJ0FSDbUvdHJc6~lj9hGFg17VAqR}fLCmDi1_xQJw&+LJlBuflF|8(g
z-I4$V!-&oeIMvEmpbtaqye~675#&+YG<nxLWUaX!qnIT^^v8*och~IK50S>JalL2*
z`nylvh{%T;t%bbT0TqL^)&a(d)((F?v@|bF)jEk&$av!?pOD%~;5es^Am?N#V5xaz
zSK`vCFX+lJz9P&!d7%4|{#Z5~<Z#i16yB=GF}yaHk9y%&-~J&$CgOW)XsU6#9Reis
zh5&T*#A;}ZAdgWxB>+(e(xY;33y(Kzs$k!<DEpeZKz(9HfIdnFU>_2{1^|$B^GY{d
zpal>8#82Zr8)JTkk1}P0tX~Y)8yrEJxB_rv;vajtdukqK+wtsP5a@NLfDTkudPS%m
zol@RB5vLVNsW2A0fUOjtWsLEWT3#KzMP_Hca`?S%fO@0&B)L1$C{jO#Hhu@N4{ogo
zl|LW@FMe6gUiK|CY{5sCrDahB<$5=+-@OE2ef<{>0L->euUNdaxEWN|@l~IRCD&J{
z0@VpTSQMIYX{qH~Bm5Fqy)gZ7`p<--Us_TV8`67IkCTB3Io9#Zd~B*Ndim|=nU8Z1
zyQZUa54DX-i_8&a9jjIVG{6%jmfq`BHghlS<qU2;E6R^zg7@yFbHUj+>D=D@LR@Gu
z@c>fPThmw-N&pk^xtxs%Ty@$}3>)Z@ph+9#a1lT>2N7P1&r^f(X@0{T7zl+2+YSVR
zmETK(6`Cbr$AM2k&Ez0M{0*;r7+?S<l1U}VkVi{pc0315Q$=W&*>b{AG;}Nls$KT!
z-7$)&{;T+BxV&gnDr7SJ+LLy_N)QOx&LLT2!DW!3)v>c7vhPhnr>3X5@Ck=9@p)<c
z$11{nXS63k5aW&eN}{3eX<nmBde7=wzyiV_4|&#7aXhZy===ZxxX|DnrP(|(Vb;`Q
z`jJt*tK0XJ---b&+0K(oNaFXT&pY+oLGko)`p-YyqljGJD;YNT$jdn)%H|%;b0jlQ
zc~2=E?P|ANl(5t!0D0lcIJ;)T6_I0DVZwPZY!MDyGs3ndob^521o$0VE+B*eEH}$j
zc%xvCU)cdUv}q*#U<vmd3o8-o?+=h*{3n$($4>jbGu7a>DQ_cBpa9^NzicsJ#^Vx5
z7y<azt^|C2r4y_tQ^Emf&N!i(hjp4I*rILXxTGhfC_%uxun0iepl?1H%52j&MNXO`
z65lMsAE%vIy;=8WNayi&YbZK5D{v=kWh^2?ny^SA#}ZePVvWGepEsg6fdyjRwJcNN
z@p;w)N1hO0UE;fJdws%`0y0MmRt#9%YdkO3dw$MVPUY6m`u)b$0FLmhQqpn96is9v
z{=+?@-&$E-7`c+9IEnynh&Mmc#4-Qj9>xE1kHh?_Z0?cxoL%#kN60+zD(F3dGl~H9
zeCFf&$|oK@l}Uio0KM|;N+v0JDj_O_#A!$1MK!f%5F#fC`mO}u8qV!Q0RE*%%2WU+
z;brjk6gxk_cI&NSDa}9D<5ppiJ^=DURyPw0);A~%l|OT=c;aSCnj3)2voyAk$e#6Q
z!m_$ATWIi^&QI1~l)v3ni88!gtCdj#c9&J7==R@)@|)ay(1&1wT>(-iT*3gW=>vdB
zyHt)FroiSZA3K6V<!v5SgjFm6M34ZFYECb=fG-1DcnQ{pDSV!0Kq}G@`!bfv`N1Jo
z6bb+{>3Rn0T8CsoeJ_7v7#w{Clk$Z1{+Gw9<vBdf?4Pz!D^MHvZx>WjjXm^RpOkRX
zq~nALAONsPhylKN2RzTg78xPIZ7O6ahi8+TVy1c{Hbk^Rv&`7YTRo}|qSFY(ma6ij
z{;?hjdS;de9+sCp0f)n6&ZN^(HK}!#U>L3Lu{<F_4+WufSORcmG3~LcjAT9n+s@N5
zM#;qgg&sXyKDy!Tr#R&jkSgC(sAg#_P8fmYr4KAd@QMI(eF2fMG~#ul3BfdBz*G!d
z!o_3gX@Gn6`R2pR)P&Giu}fqtMc{1`{h2A@ZVW)qjL=JZDY=b_E~K7UY&}&)4KB1P
z53dg`H0H<SIO>6671a|jOVqju4*AF!3N%*He7|&hrSEM~+AU*T^~Dg<>^D=X6^#$8
z`;*MLxRyGw(j8y|m4rimD24J+8B{7=I@HFaSY_wfZNXKXT$GWM2te$H1f4{<c)#qE
zgY^dy!iY&)K^0DMu=&9?QwrU3`ugpj7j~dd(Cq|FeJtIlSPvYG&9EyAbnHs^>?*J7
ziN4sCE<!r8Ae#|Kz{3bE-fMSwhj7&9S21Q*)mfREc)+wh0Z*kLj3EFj$lC|lz9Ycg
z-8?AsEl2U&db%T^_?rFT+YhFyuk#h;x<SApjm7Aa?+JjnnN$!6W!*(sZ`3s61#r3A
zHePU$iXm*qRdtU_!RqCJ)w&r`bfs2lxhZSor;fMzYQJl+aYy1hus1!b?s$IBaDv6>
zUDr@ipuj_DFpXj7S*#h{^Oet;X+{87a|U}BPvR`8cJv1@t{4dp-WA{+<Piu32*a1i
zl5`vLRi4@_icZM>oVu4+_3#+N01``ocK%sYKI7~_jp_gdL{mJFVb3Qlc`g&OQ`j;5
zT~n~QhL&!{dUX*KBgEC%<>*8ei?nkC*T3+*pd9k{O>BkSQjM70+8cbeyi=zsRuvv?
z43=vw;(`*kr2AuwonYA>)2%&}?<oLJ06$X)RBiti(p%+?FfuC+(6bW1pvUh{;Ocxd
z!42RTy0(6RY|JJet4lZs+(E9LK@3Os3c^)EfHVUv2`_)P=wts7j|6KwPAN9=h$<eI
z`b#_#w8YrN<L9bpQXgXB{}7Mt2p)Gfv}5;F{vP?|u_z;O{4GB-aQz?Ok#Mb5Ry?Eh
z4cm7ddj4`3@itsKvYQ}L52*jgcZ>(BzXaT_>U#U;rE(OTcO=LK7O_g69vY^2*!OtW
z-x*9Ir%nl(f#F1%41#tS!3_!!=!1OF2gt(+fWCshRm_W3f~zQibc0&(q~u%*9gMXm
z-q58*H0U>5f#K!jngH&4yK5l;Impqt<(A*Ij?`-$XGFWsh8{O&<Bm+NU^ebZEk032
z{l)jbLOR7<q!F@&h_qwlj)XcZ#UgXUbv646b1v+hbBih9dL@<EKzL^FhV{Q4`v-R<
zh_OdiT19oWwZuEq_}?D0BLLv;w%O3E51!pUN;yu(k=Hmpsy(U9)ORQNqncCP`mVE2
z!wKJS9zz>@Q}>4vU!_-b>R309WM>ATIX<>z9UC%XohpU)bF`!rI6dl5gf&<RtHLAu
zAXqpDojcVI0U5mcWg_LK$y_D9a#WzldvRY~&xf%Ob8bscoC}8!e~1FqYp5?JdI<jT
z*|dK2^Tf$Ps-<k4N7&q<k!q<>@YlDACs`>swyvB6%Hpx#zOu}jdE9uA51vz77;J-w
z9x13|Ugl(Tk4^asx+Lfr)9a3iQv)6*;EQeHHyp={%oHgs3kdo6ifQLn5K=^P#=ji6
zWD?>l)#S^4Kv-yqUt)3m-T`5Fi?6)w#Lr?;_=c~dg@nl^qM)*$O43AcpD(|&pL&k?
z`C^g#o>}l=KkY?7ojpI4fWNM+zn=F0lzT)yhYVbsP+y!p*YEoh8i0`vz-k9rSp?vm
z1FU@lQjGm9lL7)Sae1<H#A!f>rU1v@0H?74=fwb*#VIiubl+Bhi$I`IFwosO@UTzd
zk;uTKNr6XYp&qHz4u*ju#ev?vfhWeMPZR{6cpm5@FyrDw7ETTDZ^Fvhh;-m{6eXT%
zG-WFH@~NGjQOXJGzBc3E8x$dy5mL==QJ9IoIP+$RFT8w4PyQ5<IT_(|>TGX%q;_@(
zU^XF)2lXq6s5;|TdMYr7ccyvv?A|Ft68HIHQU3cp=Rek+lNC)8qXx;=QBt$W0>P|w
zw&|#xHwyzQ1P4>f^ASG5LVdw$GjlGNsMK4*mpOyacV^@iWX6d#WC+k6(EMoabyv%o
zy!Nx#EkcUMf}(R~VtVUuiKX8@TVMQ$S~3<=<}-VzDI|;2H2TO)sq(y1>U@E7Xl3MV
zaZc!^_ovbk{K@Uck8+@on?h?MPhAKSI3r*xW0;+%-0&=w`dmA#AvNH_Uhp@E;Db-X
zdg)=Qx58e3oKc9Lnqv!{z26=yEM)D4wfTfcznnPq1lti5{^r(#?4)nV)9|j|@E$hz
zxETI!FTC%6bC3V8aE~sbr{^dR^&H{xaSnoih{vn-5KUE(%jO!Jc)Z%V=Ad(?6vc^B
zCH)~D5o9Erc#MJ^ih>v{t)Z8=Y^fw9n|MT>ImzNaH@AjFfWz(1n0Edl9uID&`9-ax
zi#dHeNP(;~p&jYit++$MWMnnDpqi|t3et3?1e`l#&suY+I2%`&9;O3A1#_Nd6OVlx
zE;^(?#3L1iTH^E--;DdYd5y;5@)}}Yd@ea^^ZcpJ0{E8q9N6XY<_%~Xi%mRUCB&z{
z{!2Utr^lmGgX+1co97PXrX9b^q322RTS~Jxj(15r=dVh_4nfX-TDvh9=N82s=Xt)c
znv6956=e)^dB@@MlZ%$S8V`kpH?xPrjd%T}+81|v=<Koj^_z1PWFP1%D&@hubmwaF
zL9Tc`RO*FlvN?R)m`yzPozv@EI}h7%nLYc5cpL(U<JWH@xLgF&3Zl-qZF1r3A%~hT
z{vjS!IsNM);i`X$$G-Che~Cw*qZeLtCA6p{&{cMH#5s=Ykb)3oRX{=_YmH4j7BEwg
zb7U{Tx>GfG44ZgdiW?B5oS)@Lu0J3C>6c$Ug?0XQTJa{=Fe`4PF45)d#qLily|>S~
z_5J#AnoT^W*c+d_N;prvy=fTCc>~W8wV8H!Xq|NQOgQQ{n|S=JLt%6zo{NH9733Pz
zAtgm^s%|A67Eg9jNgmKi(z<%C|Kzq;Zkm@X#1ud^yr{fy)hM@HI6NQ&6)@B;$Dj&L
z>aIOsDtPT|-Q1biMw2#4T}O<lxx0E?a@t$eUAT9tv;&E-K3Em9s@z*>a&Bee+p5a{
z1@~wJc~A3gHMAbV{ThMs-9QozuYajH6#fRexqHHoI;|~sT0Rq}d0ub2tKdu~v*#u2
zs>TE(LtH;{VM}-FU)<wL;Nzf8n#Sjk3rao_ISCx4`bX*Ju<Y#h4wobPN%B|M_J0$+
zd$7QI`$^K4$wqkhpLp}gUE`IhuB-Z|$GmHYgPP5fgWz}jv<^A+&JRX>K53D9_F&#O
z@xro*QR2BY9la*IU#q>d?;oFLS?uj@Z?2x!?h+*ceX!1EQ;g+fQf>HtSCtybT&FWp
z^a;g6$hR~lesN3T_Q}0#plgx8w_<%$rJRT4GSnW_BQv#LY$3C*ggi;ptPA(El_EM0
zI2xCa4)h7#L7Z_(u@#a~$g@{(P`vD9@@p!3i118IL%^qoCNmh$RiNg2f%Qx2ns3Gd
z<?De*lmgH2Uq|wUc;EP?To~PTK&9x+Kw8iZYaB4khCjqtrI^TLqFRz7*(G8akyWQ!
zI{B=`_qMgP?z@sJ$1kXrUk~jHQ2DG@^B>$Jc1GYp`Gf!99-nlXXgvIHxW}-h-%AQY
zmdJSnP26S{rOLT=Y)YWk=m4+gvk%8FYL%pj3JKuaMEe7scSUvIMC{9cDIys#$oNQs
zO;C<FEhc1Wy;>i+sFPK7e=3(EIUjIPe~(6F`;LIDM=ylVA7aQh+rgKdmJW(SBesqw
z=(bC!uzg3*t<rZwf)b@|!o=>t46(B~mXIL4Xz&c~yw;9YZ*WA}0~ZxH?>pA5FfD02
z<ISlF{?}*Wj7ygIU^jcwqB(!Q5d0`ORmLGM&qdyW;MN!6X7EsV$T!pc?4iq|CE0a#
zYqdD38fl>Ki3msJVvZX=n)l1DpFA(T{I_xXuz9JirwX$CyP)-n3un?5tVgjqM{DMu
zm)e%+PdOV~tGbJ$0xs?ym@Dz}WGD%bS!EwDAGN;f_^60C_4H(_ZK|4IL#=I_1GMRe
zLg0yscjJo*Hw_}fDs7_iDd@p=;c``Xh>qlmmGQ<qUdiSgYkp4{LWx^oN1?<xJ&W&b
z)a2#&%dWWgts=&u{kRtnal8`udszaFAya&U?IO!k*=7zK)-@ZxrO}t+C$($tHFM~}
zjwY(xnZs@PHJcwof7zWJ@UzvvyPqx)+}Dw-T_V(yLgA~7m!*KBA^rx=(Pi(UHi{6w
zf;bSe@Uz4L&-dxxIC&!ft~`uvr~cawimVwDkmzf9!BgZyRya-*<B7>_UynFf2jivB
z+);YQm&=!^K~k7mQD_h?Nu`Qpe(+vxT(WkcMkXjoYn*8*>9$5%x4x175r5f~#HEt3
z*70;gwG$&;LrXPNM2g)1A9IiPrT@M0SSFtx2%Qvf^-NV~v5m(=1%Hi4l}+C&r<Izk
zO$mREM~~-h<8h0j00Tk|sYKo*t{{Ungj4YG79MXH*l?JZW(EMksAz_QEHOPQsrKgQ
z0I>eeZ{5KMW1)kM<%TWk>4zAtVy!eA!`^;@gx#9kdkKmbBg@%=Llf6>J(b1tna<kP
zEjM$wAm%61T@ojR<#vV+sx15Fp1l@x<uyuK@5&p;6m??BSm8bM+9v`@d$o79e;1l@
zhVll0uzW|N?!i}<`VQ^-N&L$1uwEDG_B}XRYVb_W`OJ2@CsaY|$I!Gxsrm=6HV^od
zW`^FrE{?n9ad-WADjZ#+U3Jli_z2hTp_-OigZFEmJ-pu9aiBmb({_r;Yc({l5Pv*7
zw)&~-POz<ElKe+A+6NvJbL-<f^B>#v3>|+Pr=gsQ&>D3j|M}l-MpOOj2?+`{xp=yM
z&o;Mjp+ZHrxmM^Q#_-7mq~N=!;hJSn1S-ZJ$o-(Tdk+^w=zgtY!>-|>WR1~@r~VT6
z01W-rzR%%9lRlMgl&~wbG#AZM8Tu>jvr@G=C-K-iKQvA=>HC3%0RKk;>|MpA=$wU`
zx>qjpKh;)>A-ZLo(odg_`8POxG%LhPHlNWUfU`srpp!z}91OJ@-{VFblTuFrID5He
z-X5O%*2OPr1}NV{xZTzl8Tq!vhw0oQEX|=-WuGcDzY;I>ke|#dPy>V6PLEDny*WWq
zHII<zf3|nd`A0PeWjKmQ@OFKtc0`9-_;&hf&3iH*syU9lF@b1I#ob$fnu0s5mVIR8
zPH_hg;=Au)AUa_}e7Jb2uxU9x>{e@=P136JvQTD_w#0!AT6^>l_2c?=r3_o{xyvP$
zr<T+`oo9_X#OtFnWa+~m&zR&GZA`Y!&ZKm%YpcS?u)@>QbvK|E`bQ(BzC!DaooBZw
z!myTrgO#C@dQcLA25!PeJ?tFDgT=$gPrYSMic>4XlO>9-orPM_kHD7`Wp;SOwaFjK
z^MIGK^#$L<kIC-8ViUdO%UfgN$C7AG%`ziYLC^*}PG8aY%8U5b&({Nxqcn&b5+q<>
zLD$oyKn(+k{ON-)h;v(Y!YMH)6L)o0mI3iCN-;c2Llero!IQN7n4FXTejm*Hr`?z>
z`AK%**34TjHPNJ*5-6P~cWD3N4dO~+MS`)`(K@FDU&`wTesYIlT(~SkF2d7>9oBIK
zbpMBZi9St<X#B#p)&H`??jx0Q;|rpQvm${T*TjA7Ke#vJvn&;mpX58<z`gOH(q=12
zuo#ySlEh^XYm=?8u(p(ZBzk&KNMnLVbiuokOV>(Y?oc^gLZ666b~Zx_`_h?8HK|6p
zAl?Vn+-d;`(o?!OlF335MdtYhRnTQJUQ1kpnsi=G$2)TD%7}V95aXgpxaz^j=@tlC
z`TL(3H%;%$9h!H}5BD4w#a-$c%GQgqK}#aT#P<RkmLiH5d<Tv-?6}xC=f|GBtb+7R
zavh7>D)c^y)Je{ojCKci9UW8N8Um&4xN#&`B^&<&(6zHStUh{CQ-+of;0WVX`|vMv
zjZlh$fmM7xm^o!-i7HxMrYpgiiXL`maU_K(2OI?S!x}<chAd(j?EmMQ&eoZ-3^f{A
z6+$wi(Y0Ky<m0$aP(`n=A$Uj*7Ne~*c6g@*^1d=DmnbqKp+(ADbjhA#3~d!_1X@Ou
zM6xii##vxl0v+xFWD9swD4*GJpzud2SrkacgUB4mXl1qR_rSdRK`}>=491Ib05Vb)
ziwVb?p>g_fvPCBdP@ZA>6r)`azMCL;cFxKyAWc)0{1TC(*GLp%7Fp7;`=VN{*|MXw
z?}%=zlqU(tHvwlzD$Fs(XmZYGtuQLlnJqgy-ZEJdVUv(b#z0jxL@lcYKG<r}NHnfS
zTHYrk;6NcPWy7AK{v4^A!ImAZM7OcH3OZYM9Dn7fnFHKdhNx^|l_QBLVY*m2P!|oc
z@N5<9Y@WOi-sfY5%R2e%3*(RM=txF1lM$ZSM(#A3PSOgRO2Xs7{jA$UT0{lu7R7i+
zrD7oBBTbC}G;ADSm}-@c<2Edo#qkATR>1IUBwbBltt-=sN|YGGaq5*>VHGWlfgE=*
z%`}W?6&3-o(yz`Y;pyh86vO%wd%u<@Zk+y8%<K?E3V(BRxXg)-J2HtnabE?oY}~O~
zYKx6KT4{BnwU{kqY}|41AKcMOi;Bi&5&1d^>?}r0CXpR3`Y+tk`>s%xf{O=OJb>;L
zPZwe1jtgE&1~L+C+>wDXHeln9bXhZ?#1Mvm86?q&pE2l_B@kaPK~l#lI!^%#1kl(e
zEdLgEABtp&V%v^nZRV(fXAn-4734o5BUnK|FoExWP_(Lv&Z^`;xFej6JJO{pn&GY`
zmQ_H(=GO2Dt3xD`5S)!Ww*0{zt39-_l!yss*$U;b7v+}53V~Q0f0VrYd=URq`Dq_%
z=Z`q~M>Fu^+vCxHamT0SY}~Qu4FNGo;)d)qPW5+Y+&CO>C9BP0SvEHR?3Si6=)mq9
z;c7~1Czih<07v2KAH}{0vKvM*L?4i$G)8-gB(@-hvnzAT_rfU#IR)U!7Qqxla>tgH
zTtb=VmX$t@oYrfNSUV|IrI_vq%#Z{ddSoHH%QlBwwNiw0EJ*Nxd&`NpEVlxdepzW@
z*|wt<QkbP?gqk+k0;?<?@;nGxzF%~NjXUNSnH1kqtS)j{vx*(2m`Y=m@PBbfPsXMh
zQLX#bsx?kZ6r>Z*#vREaY}^r$?F13YnYo{{Qo+U@KV!ZMda%91a?1)5Hwtt~$SP#x
z+ij9^ps<gN-B+hLIqeu(<2lfwi9$stF;X3TS?|{2JW|NMQ{~(AaxCO7mVz*2<BkAa
zfbYGe`J$Qow-zg$@|6sI$hyx@B8AD^RO;lqqAJd3|F+e|7b-`We2H`234X%n+g7$T
zE5w!+HbM25Ca|A<$rPv|9?G|pVi^^t8w}LR4{Kg_;FwT**hRl}5XYGl*090?nOq~i
zj4x}(%cMU@wX7IlsSehktCZ}Lx9_XqP`=S3x!|PMqBDqtF>Xe#ym#3vS6sAmTR~4)
z2QjdW%Qg@NCUGR>5AHa07--~4Dv(Vv^==i8t5onNAv;SAMO%fsr)2G9;1o_BfR(Xh
zWyes6(@<-RY<R1770!_@ZGy+%G)vJyYGz~oM~Kj>(mOVkex%l%mYOjf>0TBZy$#lV
zN?49oKdko+j;5$Dp?O_>qLU(q?mX~&sE*re9b-StB|>CV=rDWV2U%q*6oG?d-o${6
zjEM-lajB&iH7w=)0}>xfOO09hBoyg?timPX>(BiTZUAKo1dHK0C+lwT-E88Xrk%#K
z8l0H{_}fzE8$!qTXbl`fHJ+eR*G?A>wlm9OP>vw_79Z-bN8kbwKSm<W;b4h5@Ig@=
z=Zpq!snW8lLJAbF>uo1325eb`AQM`XU$wA($Iwu329LZ2n(aHbimic-c0=2@>Fp1Y
zvnK|Ze_3_ruy?S+-RkKa-`=qcAB99OLAqM4w#W)ua~wbc9F5+)ZS`&d;o|)>`8PnN
zf_``#tO0T#IbX^~e?y$LaK<PIS@~n=54U=P(aNDudUxG2nm2N^RPul1?I|bZJ%AQ2
zNunvx9k4@-7UDX<XpJsr*ZL*zhYM=yA?G6V1#3j*O|!ukiH`|Zpc2$8$lT0A6W5_9
z+65>B5m(%;elZSr8;FHySgiAXw_+<P54>}CuuC`D8`58E^Zn^S>hRN^r(;$h@GVMn
z<b@-x-_JT)GMAsvFV7Ky5&;@7wka@{_DL)bAy{KUO;La>y|RJqkAK$`!@uhIT~X&W
z+jsO7#Uj=|tLTmFuO~pGK*BrVLp*ma10F(A*ehLN!E0!>(imFkAK$T{%Zk5~?K^_y
z2%2V{kCp5u+_E$zf{8RVL)PGn@)92$on?drHcnYd1p_%`qTWq>ca9f!Zf4K51V!eT
z-ZyC8d@b3|W^EN&-BCS*EwWK13!o5RZHYeVZb#y&Cv=>B2+0Hp+L3ziFY&DcOjZF?
zO+;?=w8iFX{)oOs<-ArVRE0|5UIJ(X<EHg)h(v)^pxU$9L|ifu!9j$2VD_1f9l8^1
zDpkqd{m_fsN|q0Zgj(<8ZR>QhnrnLq|D@wu9PPqfoR?`ahwPUf##wZZxpcc(K+g2|
zjOxv}$*FPNg%^v#^i&>tzgoZZgnG&~_}Sq(A9FlL%7!v4Nx>OEJG3PcWj~Md5mnQi
zKUVo{|02#Z;d3&_A?G!)w^f^pJtJAG)Z+(O+ziD0MlqxPlyn_?;xj2$MKn67updj2
zpDPw|1RLYzrv}Jl_gQ3<HFCGTa-iX)KF_2(qZk>CnGG+7+>w862!3x*F*SatGzHEY
z!)A~K_SXR;!`hUXXQk{a=7<=?X!zkQ48I44_u6z+w^h_z|JcSGLiL0xWaTyKL*zuH
zpa)UMQ!~zeEM5|G{sCwyA}(H1!%T{(-bWt2pnkbM<_HPwHdf9Hqo2({pVQ-T>{7I`
zP_(SR>$P~(w0IFW6rE+k6j24~h!Wi#>Ymc9TECr%<F&Pnw<0OndZ^cz41$KX$wJ<m
z)4$ZKA7I7UwM!oXpMQa-Ifxf_$WG^ic!Q7ZYX&`vBtFu%&eGOFg{xBh=vPxia8w7J
znGCMVQDu&$as7DxCAkLo!aNr!b}aPV6c#tJabI0jTN^v#SQ?M3GIqA2OadP%MXk9*
zt1O3rsOHLsZL6+Fnz*ekN=}7^W(zo{!V(9ZLpBtB{pHLg@2d!O8N~84$p~t5n8o>6
z?P!rolF%ew?d184N-__%)1p)QY9;9^xxwA;u`R%A3F&M;^s^gL{~bqBRRw(%#T0U#
zFPdz4@c4x#deDUl7VO)E2Z!)i#o6T=#9nyHO)x02#li4CI1eIk1zOAQg=IKUGhod|
zaM3*~MkqdJR<p(kuCMp_fNz$nNpOo$73jJl^g*pjecDA==*{-uclatceZbZ){8Nru
zvd+}NM>`U}eM&cd<*=!_-+JmWao_<}frdfgG3%jxrhH~NzQ&dva*K#rtIBSxTmoGr
zp|#ek#WaCo*~su}v@|B`dndFVHEX|^(4oIeciC+ro6*C}I`kXgTy5-3Gi!To_Lgqe
zQfl_bD&cMAZcj&J>uh7s+eXIw-L89$y}XI<ewy{ZP3UnjGYxLkS2S-=HhZUG{?0V9
zkG0!wnK<bGyI<;e-zT#Vrn`#6<b9srwXx)r?`<uDYlq?hp9R^nBjEEN*^!Q5{FNPt
z%wbzr@S#`w`Q$HYY}t|cg)KV{z4}Zy|NJiTONaT`_r$Tf-=90oCqMt5>|p&K+e{o~
zB{Bt*#^sVmRV=38znZqS`1~_*&Sh`na?|9^B(8v_ui&InUW@S#whGxa|JM9_?eFQ^
zP2V#2=8Y_VzO-04-Lz0^{v+99QKM;*m-R&?d5YI!l`T6G_Le>;PD@!%g;{*QO4g4{
z`ca#>K54P>(_+ae`P=E_1@h~adlsvwSnK{tYqJ*XUaZxtuUBK6c4L#d;w^XnaF2Tj
zxkZgTZ?_0&?(*x+3HssEMbwTwjTiE_$(A~Bc5O>2!0wWq?y%%};lP7e{>42y5H+UC
zK0g7?=EUVkO_b$7n&nadHU&vs*9>-2$J}0CIJO$pTZBp87%fp|$?(BVh3}TufEQd{
z@GTc=?8U;6HKu3Hy*?lA89C+u=In1tLzyo%r&|0zbbZh`_9U$5k<-iPKR(Arzv(@k
zaIOPilhPmbCG=>NPiw;C@<R@W(O=qP)<LP7=O6pNz4j*bR=31{uevLi<izI=y8hLV
zTF#!(*wFdj*?7)%@w>$G!dR))RWaGm@uwcPp2_)f?8E%vEnBjH*2wB`Wtk5-wBwk5
zh4U@2|MPP!*`$PDtKUA=CCer6Q9<w5H(7Gc01mcX0pd4<{a5ahN2?J==aUF<dCle?
ztIb22fd6oh*2#tEt?6PX5`@~}frXdaS&|WrLLG6&j+Z)QG5H-Cu?f<7oyhF&;5KPC
z_h^5IPhFlbR<cn|#>gaI869f^@3K5_%fqUR`&ms$igJ&cNDtRJv%DU|!xyH+jiw7P
z_wH;th`cjXTGQh@fS+Tka7L)UKd1>D%zL|6wGf*o&{`bTjpOXUJaF(`88XXc|Cjvt
z&gQ>8?wV@JTp46Fjw%%$HJM}c%?CZlRV;~~<JWQFsz6Q;u7@iJ@AT?(^|PvQAEe<}
z+KTCcvQg`deFXIWA`BiDdNc01ntIkg{1Oi}*jJT@Q|$2>vGhm>bMY^nm=jkO^j3h;
z*M)|Qu8uidJBgn(c;#UwAZ4<|pUT2T9lVz*5MDfSU6>XXTycW;%U!S{Pr0HeEA>Y%
z`^b;z>4&bp!+kVX_#2)}&1CLufV$q;*`xdI&O)cPj`m)ix$*lmkb2=vYH*&Cw0sBs
zOjYoy**n?FD?T@`JnDBK9xTRoMW~kCp}?Svfa3w2z=^3i>862$Np)48ZdJOA_-oa#
z%0LtLm+qfU^N*OvOCb&d3?T(?<0L-p3%BE<`uDV)`PS-iVl~($^E!lKTV^l4(uv_y
zaHDIT>wkN+)v-fb>|hlAYh|U3@=wgcxsC6q^x6%waGf*zMl5@dnP+`GToiZBx4Yr+
z!AEt`S7KYe7WbvTp5!c8dVA&nVDG-7n(Eeu@28WHkc5DM)DU_#fG7w;=v9h>B5-Rc
zDxxUGf}oPnr1xGl^dd?T6c8a4kuFW7iFBn&Rf?21ct3l8`>F33@5y)a9OX1)WM!<i
z=Dg<rXUgVw(7I3q;R>3q7tMTp>w5F{VnuOm`j2-9kGEIkRDaf8Ga0)QfbNi}v^G5z
zm4#0~d;crTQ}MC0R(dnz+)_JBC-rRNk`k0T6oat4E{^tnBlba?Zz=>cz$3V?5Rd+v
zrHTTU2|SastYAn`5`i}nuJ`b<U^en8Hh{;i8E-|ya&l{nvBzcjwQN3<^~XcPhoQff
zz8!P<5^fkE&jc}j9sc>^b<w}_2e43(zjJ)UWuhzeTRs-#C)j9>?H_oZKP@kP<fAn;
zH6C)!N|);*F+kfLa@27G<L-$iP+OReWo|z8u+rea-ap09H`zejmAihGopG36pW()~
z@P2YOJ0JkF^$&<^>Ji7g@q-CO4;EZ3hZl_Zmww(!-D%u<<$L&7zo46UaPcD^fg0xl
zPtJ#d6H4P|lt9S_HfVRw^NS?7p_|cVO?}I=#xv1B+=5ZuV4mUc+G0C$#@E!?gl!i{
z=u65*HyX+k>iToHUQaMz(05OrkdD%nhjtQLC;8V(0}!1<Cie{3aG&GEWK^OGJ%BfO
zT1c>xtszsNeKs2K$afMVMgI{8dj`VNNn^e0V}KfaCc?$(kb9)?_h&-)Om%-Nn^Vuu
zA3fuz%{DaAg}l|kyhWTdRC!-<#KPn0Ku5ijt|64;BC}EWsf%ZBTNk9Ah|bH}nKOBF
z(0?wf>kNK|)`Sl8>er2@JDxZqc~*sHksITjuW(v-$Gy2XY$J=Ue?eb;YXbM^d!tCE
zIEb%ictF`eA=iy>&KMLRmKQh0Wu^o>bMfNm<6jhuz0+?nk#of8^YO)Z6s1j8LI&NY
z$)fSUr5wO2gAKEDCEky2I!eS3S>5_%e(Qz4Qi~bntUCl{4%ar4bwebMf{{Ao0Zw~B
z48M~zzYA$bQU%ag*|yFVMUj@b_-r9!?i*jrr{~I;bW{+$FWPqHWpmmM(eJqP)eSi>
zEncLKUNqS>oY3gIds(u54wv}$4B_@YL7q!f{GZ<r+zcS4X^dbvfOVwxAi4AHxPwP=
zpG5k_8*rl&=RF}BFo(epX|r}rL?zG*ubXzNKEFpCYI+?tA1sGm0#-!NQW`$jtSHH+
zjq%(a<P|`dDl%pzS=!<6C7)gkMclCGdGDDb^;%SToMa#Kj;q;1{7INj*aSEDsIC&s
z&G^CM)N{##My)QnSWf%PJ^(EaBl>OX=E&tBKo<5*5b=cUM3CiH7S~{u4&J>!(x}n_
z7u&6;Zf(R8RC%<^eZNdd)cixl%}lrxc8S{}qri|oEA}P+X24OFc8BseVEut^FE4LY
zr!`k^OcyrC#_qbV`Y=AF8Jl<dFFP}&c0VWKXO0h&={$F#?(-9Ob8idZ(0zO0C0ddj
z{lbCS*?*9eO9$V`HowZcuj|k0NYfQGre2k9(d2Mk`5=-x9%N!n5NPOn&z};`qH}yi
zU`Vv_b?O&{JYWhJwyv*kID&XHK;o;I@fYD(jC|~x$)Q64Cl=ejTewmj(B^W-HrXa3
z6OYoh^1UU+w107e+g7}KAgbY7?^NKi%?YMN&p>e#tI(4*<J_iOCX$TN({E&`VZ~~b
z!H?C@C#sV|m$yDJb&bZE%6!7kD>d?*J{#DbAW)hElOl{pJ7{II1dP8Iy`yr=C+gnt
za}hm-vLzOu(T0kBBD9i`6E|9EEZ=Vls6OqBmI=L^^BYT5r)Qwt-~`5L7Hre;G1qXx
zRR_eanp0eATn&Aq5qu!I2aOrnq40D0jeM@}v+k;HHGJM$VKdyFOjPx}sHQf1G(~kv
z#^*uf4X5?^<=sntn^PPCwX2*TR2vkZ$+hM2Pfv;O#o82mcKM~%mMiM8{u;*s?kf`*
zd)ddn!+(KJY7Hk=>S&j-M3-tgE?}?M4vJ|+)Z9p4<ZsnsEr~KoXrnMStuTpsn%x!~
z_hS#>kKq`mu(-F_V^|Y}_(Z;8Q|_z1eBo5Ad@0%k9Q*-K{<yYbir@NpzzhLEH33YK
zfKPb`(!xL$GVshxAPW{`WC~i1eDC_=DH;oua|Q9d1PPRA5{QrkjR^4490**pj(?su
zT*zN;Tt}MxzAM;;2RXISxJH4<EtBn}VtAVAm&{|MzEL|H6Yy>zPYC|EDghfpZyyc8
z=mQC30DdJq?uaIKM<8n0X;^!1IYJaAZw6L(DdyG@|0T@Fc$}uuP}Bv~4P%y}67c8>
z%SCB)A5qiU7rnHC?v%oaJlEJNVL4cNix+%)%YKGKID4Rb2G!F8azi6oaeOSSA2e7`
zcdK(pvpjgYt~(EX=Zs5o6%M2R4ig+5CLv4cth-ds1OSpU0nc^W#%l_M5jiD+JLFP<
zTRq!%O4<Bhu-%apUK4!n-1A&o16xSpajxf#qhbzLXvskc)I2abE;v~@FTm;ruGru$
zTxyM3I2)qL>{Q5ezv!J)jz)7SxNQ~EzQXe<T4S(>@1tA7q#Q58pTDz*{|chlK1c&s
zjQ*f8F3BqJx%B#cser?r0G~GgO9}qW53a(Z7cF-5kZ_SP5kiQp$XdP7-o%KmJtC3}
z`_hK9Xj9t)9=QNYe|?RI^XyZ9By*bvGlx0JLI<CZ5M7pIx>_cx!y=X^L0B>uz1}Md
z78bwjF6K}m?jx@e<1YSjmCN=FGs*;un6Bo%A(6T!4unW1uD#0dl{_LWRmFNBy7sNc
z8505+RRh(H;bf=I%6^NHU67YG)qK%1zIjlDVtgUKeH;;dj(AYUMhEmP8m%yz2UZ25
zFn=-I`lIJbQb*1uaIr~U0LY8<NlWy}^RX!idB{t!rC!aHgHFq7cqk<H_7QG0Hb<}h
zFlEq>$JNg%=&Zl`6{5)0q$t30;wv`%sR83W$uX4%+0Z_v$aNX>OqLM*0{)snwxG#z
zd+w8jNHfAv3qa-7Ih8lDC_0%QRZ8gAQ0)N<|FBbiS9}TAcY+UHcAgG;+l0UBeEOpC
z+tFCa@2u;&*VX1;o&L(EKINf~DOF$YGjNwDJ#ZK8)%a}j0q@m!BClO7TvC08VcAIV
zA1Qw*uZ!p1K>PG18@7MMec&rcc^^dR^7Grl1L?x@n!Jt_A#w(6F$;GJcv@<bpGL%<
zU%<H^#}+Y^M*woPGn^NQ?8ftNNnz<^wtKp#!N)5vA;j`Y=%@7$bBi=PkvN)#cy76&
z&a$DLiBV3Rp~o8Ek#&PBw~apZ8`kyrj013Of`&8WM|Oyc-`0(%EY7^!Fv?pyGj+#g
zq{Kv}99-l4JG=9NuMG1n(4C<?=B^X0%Y_O()V4BoWhVJwVhAnc98Ir^$|;;bG?@14
z(TB?8#HOR2!QET~spG|{Ox_8+*~Oo$!*0Cf_%k{;&tFzNk14loEj`bG9tAsD+V7n9
zjz916^ZZ3)t8G@%)9mpF8-lO9P2AZt;EUr<x)1?1L7}(_mN2>w19~i^uyOo>9-A4^
zBb9ZGjuZB^`9Q+<$MZn!kiGG0vX+Dvz|t&r`DI5%3Hh}s$TGPc9P@KJDE>kK(k|V?
zj^$o6_kf)PZYFc>eDV!DutjAXQaZgNwqKH2L{Ffm54n&d003g~nrEdNIIStHq<S5L
z4A{dAW-g7t{KmQOXz=dZadQd63HDcP26P^fpb#L&>(?c@PXaAuHj1EEL<DcP%-|`i
z5Yu@}<O%y?jvKH3<{mi?l+H)aYP7d_csBs+8eIP}0kSC(;KKC+_@7LL6!wq-0gHMF
z7uD$i@5>c7ATa#P#V_G%)r8GA@MR%i6tCcpX9m_4i^MnZRG%{!^mXp*bAC7AevH#Y
z;eyA>H@Nx};k;C3bEi!@MMyno?35;?*Yc>X1#FDM-isl`WiV?~nD^{%3lZ+_+1=fv
zGL>O@VHebxPoC>R^WA9|NYP*=_zEo2l*JM+osaj(y5N<U==J=h{b|ksX?KLArS~EY
zZteD0c0IGneWAw`wtfwm?HyDzeXRG>kKKA)*sptn4G()xIz8g_oYL})J#U=_a01zF
zPXY<2#0hElFVQ}Gu~|_$lc+p{YbBfhHTNA&o%l0paCG0fGAeRlLWlu9GMq<Sc7X$I
z5p<9f<4A)!;(r7&pho~VV*$gG!un(L_JV_t5wb2*j58C!(lXA!60x_4ci*e03_+=U
zT*0wc!HG&<f}Y+f8SrwtxoHb~B8j376;bznC`br3|3&DxtJkOAUY+8P80YUAB<z-X
zb=UtE|H*GGXep5x{4FVBVK9PaAlO^@%~+#~oKm=MkEh}l0RT09UJK?+huhLGtqTbZ
z)1$#vLX?SUu`P<!X2h|hu?iPs4~UWHvg`Sa?p&PY2m!?O1qm2Fm-z+}Xc}kV(BgAX
zI5ssEbTT>N#!$kIs@QYW-NQlx(u4D6!MqVP_+w>}Fb(~sDL4CM^6lj0gVdqqC8b1j
z$FKNIE>MDq@2bP5K1ZgNkZA)?Iipmguja3DDegh?v!m&K7t;$)rksH+kLDk}Mdfs-
zicD%GZOg>((BK@O1vH0*=;WZODfTA(mCo%4G7r+(tTQ-wyqGG^4KkF+`n^ddk^K0~
zbBNcDH|BLguU*YJH2WhjPO`loq)8=bm~!Ww^HLj8*73|ZS_4!yZMgZ2mYQxrPrzfv
zhlEN5u^WQ?6b%7pYP)g9<qIGI=Bn)H=W`NM3R1ao7rAvNGyGmEiAZL^@0^O?0^Tt&
z7w%vjdH3Yc?6$sO&sRy-iQP#{w>~Uw_#g|-g=v<PXy#M#vlF<3v9dTFf&hDl?gwiT
zfM7DC$T5;qg7kjz)mr@&HRf9eymC{Rf1)U(l`sFub-f1GMLN2so_#ihs|25`l^F{4
zE@4S6H%iT5RZ(Y8B@kmo$^<dzLwG@gFU>X6%p2Iz6BRlmPFIJ@y+_`-4P_W*vxU{O
zHe_HSTjA^z3%eSH;0(643^uC?4iNB2YDNVCl$`4=@~(dPDvwaE)teEA&0KtW<4Cp-
z&%3_V1aof@ni-Og$9mTDWs=zvhyrA!|E&rBQxgbwDrX4IB14I=HBtvm<9$lwGOjP~
z<k8klcz$%3_9-=?9RR}9P}2phl4*#S2r!-us<ulwkOqLHNezn0?<^<bqts5C3tP-*
zfe>;8zKYH3qd)@5y#5xQ5tGoNqCD;5_J#<<8Yp}XVNJtYuYvC=4X&2jvINaA8jVP1
zNRKq8=>k;lF65;F06+rBswSw~wL<}Ia@$Sk2+N>}Jx4+GRjHA+2@Ve1iakN|M<3yP
zf?aHPala^Ao*B7{_I|0hgc`wO9eYIRcnk2+IZyA7SgW>z(Y80L?Jusk11U`o*CDyK
z9h`hAeyQ4Bs-4F&aBFrl-|7jac||{Vn-_RLg=!r80<V!HaDYbI%I)-0&u}!g@uh?h
zfHQ`EP(K}%B~NCsh5Vk6O5|mq=$5cgJ;<UIvYzgFX4{uo+4Foir47(q!P}P(OsKZ&
zRX9ETt+K<sp)W&*w}gzirGeCSdQwUmGEeV%*4g#Wwd)uVSwdsk;cZxr;A{Z)SUsW`
z+(rE2>$wGFNdO!|k90bF7z26~#FmpW51ZdB_*&b18G5!ivfw!^zy}~aN~nI+_+bK5
zeR`@sy-yvYe2!mPy@7vGFrl7~UPKY-bgm7?4|`<x%9sG;G@)by?oQ<_r{t9yvo;8(
zO8E*TcuXF9YQp|*n$2_S`QETd`XTg4Mu2nE+MhiRZhRzc!N0h)CS-5tvMn#*sDbRJ
z6~!!ZY;7<0)fUxgbmtG9I|#<`b?<WA5`3*}&u=dkpFDOZ?dd|n$@v$p!z%nEa*sIE
z?0VlkUWp!D7=r3=t?@G#31pIr%E#gPd2357>&Yt2DXn>ku&M>%^3VP6G7UT{&$WT-
zD;ayM8IRivzO3Z!PgU>(T*sLqWB~E>FFvKUq4yk@(sR0jsOrA<Ocp|zz_t(pJILql
znZd-^2{iFpR<ZxB|MlmH_KJ^>2ht}2{dMZf^>!KZKe$Kw>buKSKcC;{gclq4g?^;m
znL5y~{<<f}xqHRnZ|-pl0vIF$DF8nuc5z|2TxL@+yOecJkX%-CIIoJ=F8r*+|HM6Z
z68_0O-V1^B{+HaNwkQCwk!01(;2vQo{g))i<NqV~$R71C+@p2Ko&Sn^{6#+L2jC8~
zQBh`akJ&mgj$u15iP{A=Z||MCWe{y&d}E~cMW5T;ml|)qm%EmeLw~qOa#ZWLC$)#%
zV}<OGIpW{kqltsgAMR1r`OCj>kBO|F91QNUE&Tr5W7y+6d%GD%oES0%<SS;#Y7IF-
z_GO+t(7xn@Rui|r^4A$S1-jy<D+s`{-!aqP(SX|rx$nK9xh$xjwGSzVp4H}&tc5!m
zu!QJ4gj>2*m_@+s0M9f}$sVs)f&o@Ev{|Gb9byc9we7?5C8&|HXV-EtTsju=R}uhS
zm5zyjxW`Pzf*f+>qUF^TgDRmB8Ry#TJc;&Qf4E0w)@0Wot=C-oSEkRnH1iJR#kx-h
zJ2AM&;b%_+PJH^96;mi|#A@C#m2%R$Nw6(jlE2L<pTRxO2jx8&?iVYiwG|R{X!Vgd
z$mF(pUs^)Q4F>n<9Gz7$wh_)%XVQjYyoXJGJiSf4hv8_H^pq;@H8EPstW`UZ>Jy5#
zANi(g&Mt@~4iW>;;CGt*!lkDYEW)I}x_R4_f9hgzkA|0!w`&Kz8risViGf`>YEx{e
zIytThL);w9xb3nwjC5<lB|f>`C?(@inzGlVfH2joxEDz{NV#KFe>CscN|R)9hrHvF
zXAfhzzR}Zi)XLb;H?bAZfSX@;mXyhKhUAR?;T}J=YkpV@?zZM|kUsTdNYF@dU&-B+
zJ!J7;xX0t24DNA|r}mJ0T&`~Z*zzyjBT_d6Zkb=UNrC?>_qbK#)mYP27+f!O$UVM#
zX+Y-skKCi|>Xg_a_gE43hkMNG_+Ic}>OXUjLWMi64`>oehukAZNHM9YliT-@dkhhm
zzokS!ehyA-<<R=WJ$8vCR-WsX=@kF>+@rYrzvmvqsNpsc-+$vC>yL>Xb6^D2;&wGd
zIKl+aYA7L2zI<{zchmt<)$$(q0~jV=KEYu``XJL?0#O+R@@>*#N6XD)NKSSbBUgWd
zvu9&WznOQU<avAwHSlT;F;D?QK*#E6vW;c2nVLb4g<zleC=-2c7wv;Y2TN}6PVz9g
zi!)3GObu8`9jbB-lvrL;M5>&-FLu3=4Gaw13z%}ar;0d{fX%<E)GqMIDNy~pQ;gb<
zU-*8MgIMKkq)2z0yUj+X$g%7E#1o5bTG#=5au3L4%K^3KsfEqW(9H>&#EDdCi&3c3
zer{bnPNZN0SR=w_)R*_+!%X$=RR}DlfmOs{Qt-yb4`MIN;?uwTOB=cuz!K20{Y9cd
z$EyrT<uKk7{VV4h-0%&an2U6!4E0IY0R6cv;Wr&KvfdKfGODkHoAG{X%-TG63S-kv
zA>U3n%^5qH;N0TN|8S2tPu#pZb|*$Cp#<V?9fC?mLO3$X`ab0v<nTLU#}0;Cdu+F|
zxpthiSa~Oc9$2$y;r9l$gythDJ3=YeX`-69L;8Bf%QKXQ^t$aqnA|&)E@FKjPVE8P
zrRRU-8(rjBNlL+Gt(DW1UldxZm-W31_TxEo)DLOg9rNNTgr86uaW)FBkde>e9$lW>
ze3I;Z-gfupt=9Qbu6m}t7I2Yty_8``HM>qnpZ#r_B0J36fy&;yrD11=3p}f1?v2}_
z=FOg{uTYs>!!nr7cg8u#N+PYdeAz7Xbqw@N17z;>33&gc;nm(^TF(xYRd_b?m^2{7
z%mxH9MP6LL+$;S{<6dQOhO<MYx8>V=E-3jZDr*?snzbMAH;>gru8bcbS;+$so9`oP
zG&|50aX&7R>n;XGp?@tgxX11zdNSJN80!`qhi4K$f91koNdP~)rls4Lt-7fW`1^E7
zLW|rfI_RLVsd(lHP*RyXBon9o)|2v5-57vz3nH`F${f4Qc>6*8)_S{7b~X3~{2F7S
z5w~v!JSl05Lw#_>h@LA6PX_s;%QNY!vaV960RBAB{8>GT!4HgZkh8W44Kd=u%)=9y
zyEXNY5{IQHu{G1;tlPrkClHv&HsH(S8Lcvb^2U?Y05AB1&Qq;&yk4kpQw<qlKk_Se
z{RxQAVq=@wgGTNZI|wV?p~K|X6Qxs9zNZC-K2kU~(${OQoj%AL6o?trRIjx2eT=Q{
zkhjZDS7%|na0kHbCad_DM>p`oAY)uKipo6h=ICSF2qldBqjKw+<m;@D$U7;*X9RsY
zM(+(&)GFSv*>g5{Lu*}QOszRDMcS$;=gVIQgEhjJ;!Co?QpAckFA7KBwNB-U&FN)d
z1X;x=sfbMJo~&}yL`y3vj%=tIL>TNXJ><F5WtV?H*;o$YgB(3N%285_dE6SUq&04x
zDc-oi7icc@aMD)$Zk>Rd$Zd*70oR-L*D5PlLqd7)MsXojPN|7p$mH#ZTm}m3qSxQ=
zRf3V1t711YpqazF&3;@4Ee_~AC7sHjR1$I4p|!J5@8b`cRM6FZ7w(}f*!bp5aMGUw
zj9qVOWz3l_@6<#91ERZk=S`Sphg>?)IXC!lFPz?vd_`|owm<rDr}*uc<^P6z+-kz`
zGhDYu=BCH1uRb`{#pro+xl8}*xbb*BZMo)~I%cOk^uOaC%LNd~2G_MVmEh)Ty|+@b
z82`Vy$J*5Z^%y?!L+-J5{XQ{fioreht3O_Q7P&X8SGO~|thQSGY;WcE*Wc66)V3O*
z?X4#I?6oWdc6y2*|7sV23w|fTZ>~K4)<_l>Nvhjj@bTIH{P6eZ1K^(CV>>L&&&=c9
zH({sTtEfS5p;goz>5zNm^rRMJZ<+M~xxP~cDyiA)R3Rs-;1*6u!&f2+E!u*^<@*Zc
zQzI+57O`$pMCvhpsvMVNn1<izJwK&<KkSzDQ&InGOym<mejHr>FR8u;o>Xa1U%v1D
zBI17UKLOR14#h{kpa2rrqnAB?`dhw6LELtO0YdtLI#yBx1MH5(+miB_s;t0ayFinq
zK=D4tvQPj!{E_8%MQ<yrSqsj#^2vR1uDeN$sX;$Q&p@vHpb%=1@K%t=miX$gz*BOF
z)7c)(@|b%7SOmZ_E{G>O$u~Bi>tfy$lffrQ2KNX*2zr#not^KS+rn8E6nNQ*=XJh+
z<ra6f6}4PE<RQq_$Q%Xa6pAPD)F<)PR)&%SdGeF|pKoz@=Z7$V=I%(M)>s8Hir&Lk
zJhkw!U|_^pe%RAVR|7Z1<P>IUO?HQlEF+ptn5*p*G1YN8b1}*@l|gFa!P83N44P3w
zJiJ09{FqYI=a%rC?~w{gQN+q9@?ccmR#Yihw6aq4PKy}#hkxT95wHG@d-VVJ+#}S3
z$W;}-`<*(`!Uf%?G8sexu15`Qg&#={?@9_KU60lb=F4`9MH$5ERQbubN=iOqk08O;
zE#$@A5LDa&-ntt$<&Jc5wGb3KX@UqQCC8m?ja8nD{pgt>lpp&}KW@$};jvw)TS1(?
ze&S?O)P0GBv%VhFcw2*21q}!0&XrrhHAB&Qg@CHW3a)6cWG<zPRF?-lQP-(4a|uQg
z(YneZ;SZv<=KLapxvs)fLJ>mxcm6-_(Tc9l%-|l){=q#eCmdH!2?8c3C@0^zn0#HC
zPk$(xy&(1dT(bS=xQQOWw&2u!cg!0KRHr2P6cznhlxvz2Zz_n)-%bnLPHwr*1D#8C
zo(rj0zIP`naZ)+<L}hAKLGolzTKjf-<Ug%P`m?>cXZr>)?~;S`pWB4a)~8dgu`|ki
z(-LXzEkVmeoG|WZKuteH0{)00t;im=UBw>KiU}#e(Ys+nhM6MPnSBPZvtYLG^h`->
zw$1L$vE&RTxo09VckMrfOajB1tCN%Uo{gJliNts_%V#S%tC(Xk5^@OZs2Gz{;-E5@
zE-PHm4RMYePSr#+ur_~9bOZ(JgvB%ybI2tK-FbGd6vD}rEP#6!OIsT2$&B018CMPS
zfWFz1a+;>Al!Bpb5e?WIdS+=Rw8j<VNaDFiX5Jk~8;T&WSmzm;XP-!U%AA?2%?<N7
zg^%9JPnG0KXG9FK=zyr~Dl9xU>W}qEgX={dWREdIgCwa3JKSaSd56{`0#)P>t%<^g
zw-uoDU2hm>)EO4}=V+0!@ES6T+>J^n!M^!J6ITwQM^iIYF8y*jv;3oZjAIFcj#sm{
zR{zM13Itl#S{Ka~zFZhK(;G)qqYk0RTk?m{qkvy_CJ9#Kiqt7F8BXCIHiSixnGYI}
zZ;l>9kB&qsQR>UoHq16Q#IQ7P(YciKt(Zix(OO#|OpArOV!TrV;eEwaLoRCvmE;SS
zB>SPO*40GoG56?(BC92lUI;Ro$)|vQjAB&zpip}Cl`?BNmr*$&vveB&5AKl$-!_Bm
zU@_BdQq$N235j;;QLl*Z4L<ifCNKIWjxXe=g|NiZUK!M5J{{$MT!23dmG7tE0*7(#
zJZzhQH)0wvvw8NN?o2K3t1_obD<(4VUYx|XO!*YtZg=K2n{uLi`5J?JT!H9~i+-m;
z^-7rUdm*eSP!~#>4)(=M!9(t`3JY~2!8R!|*4LS0EneL{h4{Lb*zbzSrDcu*Tr-K7
z9{|+*62w&-R6iccNKNjNQGDyN^(r;*7cdh5*Yxo>1;8@uTdpedA^Moyt00yEw`#zB
zkz(t|#)@V@TRk~_kLNJZ$Mepz`cN2|7SY+wWJOop<c3S@@ZAr=8MVFeEk!sI4|1AI
z^v<;%qK{Mt`q+(F9ziX0!(CR24$;SzL-dj7BG0BP<bYjudnNI^AAWbmG?(}~br_|C
zx9u!pdNXdgPGPx+XMWSoG_0IiL}vPx1x>^=S5Bj|cVrWz8dZwY?{y=pTpRCAM2NqS
z$#pHHkF#vjk%mQ>ALA(#u7#auh}?1XDgXs-M<!z58QUGwk6fed-^~yKM7=69D#VN^
zZUGsiphMmwB35MIbT^OD;GGoo-Cfz~5=5#i;;OevqY7f$48wr;JVrl+jA!<joDTFa
zUuH{C>_G{{O6y?J(q1NGtURmuvcag=Vs6@l8Flo&y2qsl2)|D#i4e5GDMTy{Q@V(G
zj%8?|7(XpEt8_gm5hLQoMmUw}ccnpm)X*gg=Hl8I>xxLl!Wof*eqw$^H*C6uiAs6#
z38m(^BKtY5lTrkaSm|&MWq$*Jwb`Pk0kE<tj6V=H8`ibSsC!bN_lSs1GgGH-*w+xK
zV+q8OQfCT8_4B$Oc0;4gS4$cbqcD3kwfi<W@M#2{j#*%9?_a=?Nib_`l=SgT%7&(l
zJ<}KwLtTLs(M{5Re{?kK75j^^!=PnEVc8+U9LY@P_~P>ft>Npv^GX<_m7Z0)CXY;?
zl3ObSfZTV+y|==}l2Jd%9pdI~={pAn8K(+!yb24d3t#LMmZr2lDs2<(LAg5-4Y)B(
zQ(6+G?e97UV(vFI9D(cMyQJTlCz?qNx;CtYLRZH>;(0#&Fq2sB{T%PB!r&e=$NBE9
zngxu@?stFuPG<g5J@_LA<LwHuCN*(aKw?*F88U|B3givBS%0FairbZuFg@X~MeSA>
z{zE_JoNn1RgB+Gl&02{XjBY)mlcpKJmS<!JAB%$N;I+!BEaoKRFT(^~H%Re|QB8lA
zXc>d|WcJPyNIJQz`HQyCanoEgh=>IQYBTcQ6=HXTjqwDpGp_4;<MZ)$!-y3~jbR&a
z8>emtw59NG0P^64kj>$;@a0ZUyT5RqH0b!e`lIUlQaPen>41yOg#P`8FTBuPGl`#O
zeX2GP&(l1iaTvu%vO0h_yT0)RevI&?k7H)+(?x7E**UpUn3@vEa|%=sIAw*O+NVKN
zT`f#$P#Z8z8uAG)i_A)A+oiScli&SYUUlVIS|`%jvIPEWdcbIe+R$*ar&weHuJmqN
zvcE=WCD5v56kx2gdlu((3pb60>S4u0y0eEmr}y4M*2|f!&2UM4LsZu4lNn>lwk4BO
z@C`3yd%9-QsQ#~T&L7OhYlY3W-o@S7-M@#64-CgW?Z)@<`q1YrH~$78v2dN!2QS%P
z&Y!s7uoj1jph44YI#JJ|<4Y4hL$DAUX5AIy%7cc1P$D@CH6|>26qvQ^yzEo9@>T+Q
ze$c9WK~f^OI3}A+gIB4Zb0jmrAv4#|7}v$iHUH_Afo#A@%%V%#!da9H7P{;{V`PH^
z=#7ZTHP7*Vs0)LZxk7f#Oq${*e~iC=IhU6@Ui9|MZ0T_Z_XuHM!UU{9ewyL0wDIA*
zEsQ9=7Zl3WW#rAfzbT}SC8hNn$0PmEHi<^Bd_M7sVL+C3my%aX1y#yo&C0}(I-xyt
z4v%o=B_`WMeUXgf+g<I?WjFSlF{>pI&NSi-gNKd6#E-*Q&Dd=o9&G5>A%fd5ri{CZ
zPrap2y;USE7x2vpi#DC;R^)>+HDKa>e<hNCIjPri^QkY}d^|aY)+3><>C97)*>+qZ
z-zh9QSl5*W%r;)pD!6l1P5$BXCPjVO`0+bA)>1uJh|vlpoz9#9Vz8+w&Kih0mT||f
zXBL3(0$`oSuwC2^i0!0WJyO(SM8^z%-RR@9kK2U@dRURZOe~Z$tx=a{&G0XEYqEuM
z9>%1iLgFi@RB?G}Pq`^i#W^DwLxoIz%z4suAoelxyhmX({t2tv#@9%fM-;26kLSUK
z?4mmR0W+DJmLus{*ZUZl^|+`Dt;Y#(8xjVM?nNvy$_pkY%K-D%uOwe63tBqHY(g`T
zg-^|&%iO-vo=JxPCPxstHsHsua&PAQXmuBzZko9T(d<>I%wN^ElgF^i7t4NBJaC^*
zP`_gxQ51sv_*F#OYIu76ela}3=vcZMU!?&@{Z;1DEhJ~onK;+|MeR~Q7>|a#Bkie9
z>iH$>*Dhab19&d{u&utkH1<CA!t$kBCh%z>uhj~<A%KPLQrUEC48gRzs{(AbI@uHs
zHLXn>BA$Ay&oU-8_;J1dVa}d}{Ld4H<E>#V4r;vK#G9?<$3`AEyiQK{-qhtuJ9%5E
z>M?lz=U8J|@q6$0h<SyU$gl39sm4E_J}!Bt@@;?g0KqrNlX`J}rt_KJvrBtkzm~q#
zJ*ndjOINdMSyjBM*FLr7-g+I89e#rL9GNb@^9soW9C4C-VZ_0U)Yx>qh)pVQxkwa2
zoSZKC2lrSc#UHs-{Y?$`NmEa$hGZkBd-Pg%sV>j$COJL6`_rX*0zMFVeZeQfW%@#q
z+VTb>iH>CkV$b~L4JGoj%M7K8oBoA+G?x1y{K{D2qqf2s#m|nf&Yb-Ezue=sXFjk~
zP8m-`tDUkUbx&Q-NxWKpJ?~lIDd&Q`+-m3N#m%Q~ym&KPeWSPz_P^YtWu+#^>+XPK
z{&uJ<O8<#_r2hZPJwC{z004s95CjBp0FY+vAOfI}ZqO6PCmha%LL$)^EEa>tVKGP8
za7Q_gaB?2y;o{`u;TGiQ6&4f_5h6&42+2r@N=Zt}%SfJ(la*IcJf$eFrmU!<qN=H?
zq@}58q(eGusAFVodfvp~*x5+yvuDm(SpHLGv|*@>w&(v<WxVNN`>!ga+con44QBLU
zz>FX7onpX@9-b6GPuB+z9(;Uo`fr#q<ng_~Va9N(=Ra*m-+-_`Fr$iV;ETUu#y=_}
z=?}?Rk`PS!hsqdY7p9XE_D_}Z%)_Yie^D8$R$|V@#K!%B8P73b#>}`7*TnPgiB^IC
zP#N=+BN-&)ofI2}%J@%`(d((hi>I;wo@BhnAQ}Hlk8wTM{huV`KRw3vf_wi1$v9IQ
z9$)7BfAJVA!)aBK9n~-YCK-Rdjm@r!U3i!FH_4b^msDIgTwd4ri=J9t-`!td&QKW{
zB;)^^$4Kv~c;EA_qi1xcr*XOG-F8n!Utiz*{_6JrsowsPh5n|E{&(A-YE}mtTRzt^
zJjT|+x~0Lk^`Q?P!;L$`@4H7ojE;U?8|~=-ve-M;wlmhg@wI1QqU+~G|M1lM@O1yz
z>E+p(+21n*W3z*kvrFG+XMfEO?|vJcnOohN8=IW}GCx1RIX^MGII+DrHMjhqRmLCx
zt1_CrtNyt#`0B>juK!kLT>V#-k+B92fQgS&Ak0DkrZPJIPbwo;I6;4sO_UM5$140M
zl`-p&%7`_E4B7iDb6lUktMY?39iuWhK8;c+U!jHToxeWgu0WW`#-1oI$-!D$Xf&hG
zUAjJ-{Jv9P$loG!ZZ@^jrSxi`XgT6rx@Yz4PPEyt>%MSF(ouYzWDr^N8RKojOlcyH
z{mgML7q(6{LJ!-SELcTjyZC&Z@W&hp7jV0D+^r3XT%Jd4ENVvz+MJ)3+&X~yv(&(a
zzj1?H6u?;A5_tTCP%D_M&N+nlB@*fhzF1h5ARbE($qt5F3TsF5q}<F#Cj)PpOX~KW
zZ;!?j=(rwnrX8)9Ri&@Jk76sB`@2vl*3N1b*G2eaaC6p<(q)2-bq|diKxF{W*<s?@
zN<^zct1e6JcwicVJ(IPO_X`ywkL@IYiuav5O5X~bUKP`=4Z*r-WK{y;*`Nu9cD_Lz
z&l%wcc2Ll%0&P&F=q)qNIkjk2;|=i%=}Fz1eR|f0bc1%;8mT!q^Nu9A)%cZY(@s_w
z!Euy|)R3t&e$5kYtg=F)NK0Xl$#hUKYSCe3EO>7#kJm$>r2}wzKj<QxLCxutA#(C$
z&Rz-mW&*WBeMH-L>G_6s472ntz^JKk^qtdYp_t#VnvsrMjmo(-;}7rj8eyhS4)+AM
zxATP{j~fd2j7G~$$J|(Ro^I(t!*fftGfh;|#00#QQi|O4UaUP7Y(PaXo_m<L-_o~6
z=z00_c%R6VI!=*-^2R99P}Oy_wsS~-e@Ye{;!m;JdKE+&iTW)@F?CdD(2T>+;3Y7O
z1j6Y)L@t41_$_k#u9P>3z5d4-Cv9un&lhN&N{SN!@c`@{_u)*`$p8)3CX9d<D5{De
z2!eIp=GZ55A;JBihl_%K`&$?mo}Vm0AmJ*&>r=o1z#npkHjf}w`jM=UGXuCKNmg1J
zlnzB1U;)LFIqeb}+7D_3N|HorPpaDj!hp$me{f2GB1AayZa_B$(3Zdk-BMZ|>X98S
z1A;J`FXwa`1Q(@(K3Gt~4)VzY0{~xa|LQZ2K@2I{s)@^GCH&})DP+$zlc#^RwpaNE
ztR;VvA8IenqvQ}cqCZXGxn6yx)qz8EYXXl%<Ufk*@o#X7hCzF2fOixJLN<r|*h#QY
zM{m?`rxBFDTODV4ZvcTJ*!Z-h!<Ai<dmf+2Q=5SX1iL)$n9qQ}CaY36{7{Z7X{7#W
zO;$YBlHX(Y1gZja#=R_H-%M0NXZ)Z;vdf;wr!c<sDlPcp9fjaZz%>*wyO|Qf%CSLz
zzgTm<`skvu$^Ah+!Q3Zdk1L~%HOJp`1G3TH_tqlB(~&r^1;jV$HvSzXs(~A)?>idh
zmA}EHMs{O@s=2#NdnK`L3Q8NF>Ur2VFHj{s7s+u2i8TrdEZzSesjd^9r}mSJ;*US>
zGaBbnmoi|yJbuDY+W~ViPLIfQxBbz>Bk|K^R&Z!T!?BiQDaa$7lj3l#CoVn7`{GIP
zUxHn+eAxo8@P0r{f25|eLspK;yk@+$9F^>BjrYhZy|*bqXCAmMzy_}>nbq}qIAyx`
zsz|ifEPv;L^sAW$CJOngW$S^cVov3wP%tnXgqUcsk{R?Po#)0=WU_O?ZV7N}`Y4Bz
z7T+-dJ5->RE@vOk4<O7Rlr3OPgJ?eMS(3?RNBS;uwflYxczFk?{h58uu&VR!k3Cp(
z!(X}#zcTgOaX*O+zcz4f=iTP3$cBcUZ9n7Q>;(1mA^w^_Eg_ia#aDn3jN1uqes6r^
z^B+%IqeNCOpP71j|My9<FM08imBRTN;V@m+UE_LA-f^v0pELR544<69$NqI$YS?`{
zF%HM;e7`Prgix$==KY2qN4v-=S?<^PmLu@UVBNxSe*L<BK6n*5=u16^V(j7<`-5Ro
z|3}|X+KkX5Rl_XnGG{vu(xV)X$-_9&h5&Kia}kh&xV!JUme(GgAjdy`z-nAH*PWD+
zv!+J0khz-#fNvxXP=BrFK`v<2tvE?un%VeZV;B^0ZE@l#G84Ucg@vU4a612IyD3$v
z=brY}^3VKy*SWH+S_wgkc{UH4uOHnSSQutX{{B-LG3${QG^P>RX_<c$dXB4@<5hIt
zqXbu!0o1C`nX)*Hz7>rBgfd8Go_xzPRL$1C=Ol~|^pE^KQTV~O>qlbN-m`rjAqtRN
z<fV#u&e3e|ss*&YB<e1c^7hE+?mSt2#a#S|xND+sI{)oW){ZMceRH_p8}c>mmtI68
znYsLq`R9_}Ek!4o<H6vQQezrjJ){~x%RxBy;0Ar(UFy?@=vuSN(+iueTuu9CRT<W`
z-Iv=v|KhzQ>#-~WDQmb`qEC6klm3HrX-2i8zpL7+pEX$Xp+f`6>y4`TL}00Mwg9x(
zM)u8czRr5FPEF;r%<&iJ9$=p5mvDR*zextk*L?Iv7*9UC3Xp!|!}(+TW;CJ@@T%e%
z@?1;MOGH|Qkxw?E+GfduDDlhxg7PJJ;$AG`H9g~!sA~PsQ0=<t?{0u2vHVhsKuaAZ
z=g)45_}{LlXrtrGDxu>Gi5+iA#|6E5Ilp|H1y!q)1xSTE!{4mD1*C^h;O}bt*|40-
z>b4YpL<KZZETgaoV{gP|U!>Mad6ODY_wfFT{mg!}4JMKN0%3VNR%m1Ee1~H#t7#Oq
zP%;;rtc&&Vz^>6uK+!%hISPYk%pI^l_1>pF&*$Y;EHoc`@2n}b{*Y(H4dUBovAp7}
zLW74qBb>oAM)`jGe8@8fXyWzpm}m;b28;fR^#c<iOId82Cr+R3y{5uyd^Q6CgLuj&
z`Ilzcf_)+C*$A7JL!PmQ!82kt03dm_3<L>#(zN@KXWS(md4)YWp6l=QoxAA|&lsYE
z*QDvXHrbda1m5#}a;7wJR~YkF2QNxQva{je1w8S$3OZ8?Jr)%dYz5Z&iNAk9WL|x5
zd)Fx_&MH`=CkUOXolqH^mc*W9g-;m_W~ht|p0UC8P-SdbIh*|-R7TIx%B0Zh%Fr4H
z&qzPy8QHm5*()*4o?%ZE!xlWkng>I>^aTq_)J^FjM+G4USFsJQflTJa%_mM^0@Xy5
zb(jN>+X|ay@QkkFS)}tBNvzVoSYiTpR0%szL)_Cfvvt5uD6#(Zj7*7&{KgfvtZ`j|
zj{HqzCdL_sh(H*r;we$veKN~sGDx3x($p2dLIh*hBUV-*qQnRMfu`uAwznHaSbD?3
zz-t;GtYxB{O?)x7Yj=etY=0BMHZ%vOgN&GkK!^;(W+Z|`#RNx)>fMB>=M0<C9KD0b
z>R*o&iN0eQb$t~AKQ^wvd5<XCZ_&?ok|~$?WkYKj4i}{y+Kl`T;8(8kT{v|&HiV3C
z3@9T;e;T$dWN?BAUIuG9U)Pk-LQI1cAQ>@TAjsT?leEPtRRe_CWL$hSI3JH~!ynp=
zVI*wW-!`Mhq0RV+$U00zVOdiuzN7AU6PTyuVwyC&T(x8sOx8E_=IN4WCKbO9klz1o
zGlC?TXH#5WK{tQtNkbC%0oQ69q-!&Y%yF`GWs};oG6z64w`AEakTi515=yr%y8;d+
zs^>Q(MI8tp;*9F}WEOKYv<FZ|!p<{n#+77T21FUax}hBU`HjlD7N)Sutfd=om!-lu
ztrQby$aLQLG$i4@u-L6`eC<UUfEQEsIo%=qYt6xFlCAEQSEakgF|36uwP#PYX{LX;
zo=(8)9#A1TFQzY!V5uF-<Q!N2ADc1qB3hjS%ACU((opIvz%p#IJdFjM!2+PM%u8fz
zOJbD@4{b&VhRuk71{Guyz=P+9n3m=+Key4!6wpjmP8ks<ghlPsazH&fm$`FG2QkNJ
zAPVXH`)N6alKYYrr~BgwnJAfKW_f14m<L06=3xsNEX#7Eob(4Ie{7!j!90eViD-7u
zn3Gp03xOJDgg3~bw%7Syg@{^TDIsU9uLP)wAgxbFW@kA<B_Jm_vSRE2`81Z}g&6D#
zIE<9F4*;^zAY9!{%dUtM%*h-800$X3v+}%t9#ii8yfOsHMTc{ca=`WQI0-Oz93xJI
zfq;M=B8Zs=;Gh5phXFz>U}nmT;d#vH{EKnPm!&O8c1JLMQm*l;>~E5sK1rg6BzuA)
zU9%#_WiL07q!qBHHsmXKBCt449w`%(n3*DbmI*JB=h)V)ndMrn?HEP?6juEz0Zm93
z;}AZY2K#u_*)`DO<e|{0><XO;W(MIIb}b;1Av7M0W5URXL}TQ3Hoy$4DupFVy*iG3
z1!8^15E|#40c}wXGBR%SA421q)R&`eSwAm^c8Xu=(WW-QJ<JlY?Bcq!7GVqEFfi-u
zqxC*B`DI}mFF4GS6;xpNq*AbqsT|gFHDvi|n>Y8pp%x36cMPG?EV;@HVe%Yvk*8u%
z@{iDHh7KL6v`G!+cSv*nBQ##LLBmMd%e1Et7T$pCD;YIQnpE`+g_#AA1HiukO_c4^
zP{((`>I|VVs=}RE8TlNeOk@a{Z>!ti)`o_%=Y^%J2=a`-+{ZI9)1EI~tcKVDVYK8C
z=JL-{*lwwJDpCNR14=n`70pHifM_qu@Bo-A^w|i2jSPsp0f3Q<_M>VSMrxOTKW%?o
zx6>2HGf@})7HjyR+UOz{oc02`n~hM#f;;NaMgHP|DvWBqr5yhK@v}f2OHz=O$c6-n
zV6Zfe;my|ka1?LxlY6;@&R)}CVpl(l4Vqa)Z8)GGLGT}m4TLDB*>02Bac_VoVwQ}T
zR&8SNjI*vy`e{vuHBH8&O(qYU;>c<eMoktqc-`G5tF-sl51Xdl8!UI<@0Gr{S8X;-
zV~T<_I~55;(;8<1s9PwMUJc6#so8!PbzAj=-pyv?gyx4e{JIZsYhqjUYM?fx4+cdD
zlSLTypa>Kc*7U&a!6V+*snrhzT9f<D7X2c5D_cl-TGJ8*a!I;1bCEADtZ9tY^31hq
zYz0bZ@QhK0j@?MhaahU2raT&A41nr^pa#h3yb`F+ILx4<)o9UsnZYx<qT3ieW3=xM
z?T}||dx+j7whc&g=Y%!oQ6LRB(Kn8RL-CMX_(laXd}bFV8TG+2idh>0i36C00+6Jz
zrly)EMpE?33e0DP=^K`H+Z6&cN5qd~n@T>CqY$6dx}OSuoOQizxCr}Fqgz5o2bMtP
zReK&#Am59+^om;bY6u0Y9qDOJ?}D*ch-miJLz}S!#ac?~X6EZlace>!q&Hz7HQl(=
zbmU#nv70@ju1(+jd)|fhJs1}mBYhNdL6>x+2NJPjGT6@~RJbb(4T}U#Aj9#9COo!!
zg(<uQb+Cwz!5`X;Aelp(F&;k<QxdmJWA-mWK~{U^|N5K|-KqbuZ_Kup-KA$v6)Cxb
z7^BHQ>(<m81+lrX^Z-7L(Li~WeuE<EJ^NnqB}^$D5*`JKp+NWX2qz*cyacgNW+uC`
zw3AQ=wy-xerrdGNXA1nq5~kqY@QZM`k1NZSC>F5B=X+m9qN$(t7NupzS=R3~g_3(H
zy`Y;Yr^_VR1JzrO0F>DpNE6?y-=RS<7y_{(!-;5X#{b{g6~maENRSz}a%BOpe*7|y
zsUUV|@r}%Pj>Xe3dRXRa`tVzpzS?(R!!%kWaV!_Zy7bbU056-y%*JO+Simm_dl)%^
zurH|9{scbc)C$x1BbKx!Oe%iZxMU2J(aXRdV;D9g;46S{GKPrJGecI>kl){Z+3EZ$
z|CmenCX30WFz{(t(r&}a{lVFBxuK>0cs?Zit%-?8kkt~D9<lqkZRa*%l3+3^DvLEo
z!)oy(d#EXe+L=Hq<kOiC@Y<=*=}cI`3GGW0<6nmKR$!&%iA@rdF$KE*XwqD5*li56
zab`y7$05vE5%txU|GQtt2T9?^qvdGg!NbOlSLmg3v>M880gqQGLHo;sV)e0C@GP5V
zolMafSTsiF3~O2!CiNDxob31fT26)IHc6g%E?z-(IKC3spmb9<X3S7{7aOz!tGP5J
zHi4|^nl1Q$RT;mV1X;)3ndzP1r~4=HFA!+rBEk&>($p`0JYH2ik^wW0|5*7^Z>P((
z8PWLrhu7XqO~6Op(x*QL?3&_D5P`Lp$E5KgV=~93@fr`816LbCnT-<1!L!&^wmRt}
z0(j1ks}PKxKwYDs{2GX`3OYFZC0MNieVOlq^sI^Mid6BsRmZw-^t#%|CX&zkN5KuP
zXH7Z+T>8&8l8e^-dNxezR&~|+%;bL>)@)D&f0`8kd|dz2VELzIF|So|lO}P<Z(`=k
zv!-ibXD-+NIv)1R;Un)2)TUk<*S*N5py<u}>YLrbUut#G55`<K%v$ap+X^(_dJwtw
zc$t?{yl(%MGZM3HCb034Wi$HgR-@du%F}J{`t9_~+r~cIH<q_kFub(eExFG)3yOC#
z>wacm{`K5v=N%CF41i<{{~2g96~BwRQTIE*uBrC&FS_aP_8tO9`i2b={CnjPW{kCu
zZCqaeShCwGFii#SDJJh~9bDe)Sl(?e<~{!1>t@ZA+QT`YRlgH+>;4h@k23ZHkIgO#
z?1#E3h#VK&dUoJ(wx!RsITHQvRmQ>Y39TT+dQz5E&!kS+thf$CWt`HB5@a>$u)<C0
zMoS2FS-lcXQU9M+M%gRFaZbYV=E}^hr8CK`VK!=l(Zin>J{M~e5Y&JpLPavs_b69J
z23}~DI(A;te*Vj4<Y;u-zp9LbE8R}EI@1y=pI04PBFww+*Ew>cTK=evL$79K2v=`D
z;I)R#ek`yozM6h&<9jd2{7vqG%i7T#RnWB-mC=8wjF))DFH}{;kK{^bmbT7nzLd?o
z^u=rXT9uCJN#&@GyDJm#uYK-(mwkV=|CxEZ-RR#cW8Q79`LK-vx72orpV?J1S3PCb
zK}cJd)4k$HqX<@_!<whSLUFDN5Jl_mG#Jp|wE<kv`&{jBmC<P93_n$Ndgax%JI`-s
z9epZyTZj8bQ~vwHT<_V6qb?iKy1aV|*FG#gHfG`Ixg_s)s4}j#ie?mcv~&%`vLt->
z%62yb-S%M3d0)xiM>?j{4(^cn5GGxY$@rr(#`P5|YSXmObcwTKb&srWoO{<z9&&oE
zj)eAC9cZwG-^@~+y>qBC#<S-h)$Tsq6O;Rv?VL&cjm2IQtuKq`%sZV+-x)AeM$7XP
zZ21<4D&u+UJ@$OdLzVGD?WGrgRK|OQpKi_kWT=dm1EQCM<9{CEy%#Kvbk-?w;&gtM
zpQ~v6a1e!aUKliHce`;$nAM|<-ZXSE{I6esc}|_FxOh+NbS?<M8^uwEl!Vi5LWl);
z5a80pVwk&(uOP+c_<9BiiXRLMWQuF7AFsk*k_BTrGJpVRS^gV~`!kB$j&aG^_Z@W_
zGicPiCmjIeA=(m23K0s!2@2f817VZHwLrXGk^A{Br)y*Y;I9N_8RaYaSqa0H2l1)<
z3Q!>NHJnXyYw$C#em+*1H}q<4%heYW?y!l#;?q+o^Oh4IoI)a~keH;-A(7i2i@D-y
z+GQp0GoMP8+5D&#lt6sH(B(9e<~-lhFdTAoH8b2n8t2bkDTPaMiv51#8)sW5tB$of
z?8$UkdMD6!<<&wIZ7M`beEi1qgNI(uW8Ry5C50XW=e`Td4vT^T1R{WPyFueI5FqTD
zOL!%tIg)vT)OG)w5WtEK1ayrz`hnS3=wR-S)ky#lm#>cntj*GVdyZhoDS)J3gV#JR
z0ZEP_o)l21HvrAp-~)3Rvom+|qr@j65M~O%xR12KMOXD0r+@)8`oZ>=S<Gtu^251C
zDp*pJ%AVv05~cwFkQGYcUc=)p2X0Xm9`N0bPWXfcboxKZ`?6;eq$NCQ=DXP_qX7cs
zWCbB1SOvekrr2CI60^kFcPU@O2(JMYq%IR>(hdYr${&%deotZAqB8-GKVcocz{=!A
zA-v^EVdgUnceN#fj!4)paga`2^S|vjrt%kNNt~fF0&up%^(WHYfY66ioaF45t}-$S
zlOKKCW*x}=NxTgAlo-HR$v!%DO;2^c^fprqsZsk{1kw=@{2Hgh>hgf0GEN7*+BGMz
z>P17M#tEEGBpvw@!2EXi9cyDwz(5joJy{3}X=#xfIoN7u0+FnVq^o#E(hKIbXrJ~C
zU*$kD<udM8F#FsEd@EcTK&LP-+{~@uAOW~gT^@IfhPJylyQ+F32pQRM=B2?BX8;L1
z1`z|K9DQ}6mjtM>IEVFkU>>$}E0O&LD?~sqTJDl?#F2|u@*kUxbKFQdyek|`A;GLS
zs(T0{bg?txWVGCQat{9%OlQZ*80PN)1iXj;AKvc#AIkp^{QYbg``C9g_NB2C*=Dno
zY(+?8i|kvd#0+B>LS;*+Y{^oREzKC&3z1~YPK9Jk!kl@3zPEFJI6s^p&wnu2+-`GS
z*X=pa*W*4S&uvP3R3^EqQ99FoNV$q<2Z;MluOUH7qF(p!mP=KglUB7j6RTXQcf!cr
z@OOY0pZmn&rLW2C(WTtLh!>*t^Os0TBGgqH%&1ewTwgWx({`B+&{u4n1OVJ|CV^je
zq*(D?0?^=4yvsCzz@xr1MmWz0c&D0bd!h{)a1PDU5v;w^UimsOB8!EOYuT0Gp9?Ne
zklY5JF*Y>4Jm@UV5cB@Kg9;WX_VNCU*ChYYyCN#BERNWV9ew&wUZ;mm00EkZ#(#ot
z84FC7Hw;>ll!R9^AYStV?@GJ;0&NK_DT{*f<a|!H(ksvGx}m>THbgmnjl-kKfc!}l
zv29B*<0L3b06-Ac8zfvwi3hRfm&8uv)7huWg&EE25rV2{vqQj*yr+F&XN5F{!tS@*
zfwC<@PA=h27vCN4*Pr7C_GpL_0F>9kLHB<?X%=_v)hl@j4GNHk#*Q=$g3+M92Yvq}
zX<P9C{DwNG;8k1Ac>*T@AuCSDOQC-SA-itIZC_T>98?>>RUzm<B#@yvEP?l4-4!Ng
z0>BI4`4KG+V6joQQdPb6sSEP(+@THzI#1xx?0>+SGUNx#0Qji-GIX&JICK6Id?IHV
z8PE)Ecceg3$7-3WgPu0Y&UXEqnnW`MK_Vb3eQbB;jA3EHm4+$FUb2{R?7ikb2dPFU
zAO*0tnBiDN6>2Z>yyFtM@w{eA`b~46@~7+ESFSD#e7EXmfTB0-F39(muSUK(Z}cM|
zeN9B>sZWC&kXfL3Cs_mlU_2`n#2h$1y<71nhRh!PI|VyI-oXI%OHm7$@(J2u=AX)+
zcS1<LYjY5vXsVbS;-=hxD&tTWoSw$<>2PAKq^pd|g6aPHS}{%lFh9a7Et>$871$w3
zH|#L79jhTG>q#lq0h9+Zz{6Q9F-bI`D3%HpSTDU2bq~biN@jRhmB5p6hfxkP{hWCO
zP-o0hkP_$m(?!mruYRsTgLfV<s<8@W0T9B%%z(@=^6j-8z?}0k5QO(6^5X#odK7@?
zJG74uf^d+Uj_3Azc`iUL5(F*eoPV{b%$>E7md#20eWE*Y?&FOipScvnx|nEg34(zl
z|E5-(Ub9*lp+)552gbJcp|5O&&R|)FYuALOyH8ns&{$V-0_{XCHZ;kR@awLH24MLN
zH-{))W&E{ud{eoet}<SISRCAWxrRbykS72YCQX>GGNzul{3$3MLT6qHJHyGHkxzOD
z&YESPFhn3(xpcr#UKnuTL=wzmgZ>@x0(hEBcvFT-qhA&||5LjnyDxw#h2SvFFh0$|
zY}5%&0Wg<}a;FeFgyNwv0Xbg+qy@0VQwyD!<<J2$z$*M2Pz)o4&9HbVp3t28z>y%$
zSgQX$%^(fNz&!ts3GnE-IssAx{f?DQN2p@;6a}0G7!^Am34#nEgtlEG-DdnzlwO-_
zs5GQsKc*9-@c3<!s#byqzzisaEnR8E3V`3z(kDxsG*a2s0Sqk?;Rv9*YYBKV$rF!g
z;Q<UzB|_xY|5XFPlA25iLcTefa9LaesmcuK01&zz`v~1U1ejj!$TZ`)-v4YysF4;@
z5$PfhBI|8m?`D|fUzPwIP}&_^BpA#(V1tyj{Dy-@c-|mX&q#yXTE;X|h=dV9^bW(h
zZV(RxhN}0U&6x6D_Q`)X<C*R><P6sTxJ7xW<y=4lFBPKJ4aDTivm+W<s~Bxn0a{k?
z&U&G8odCd=>JTRZJ<%tA_;y_YF%m2SLd$|QR9)s1u=<MEHJOa1`vCMn#CAMr7ifVb
zu=N21A|9EtH3q`EX!0H}uQZs2`vQP~7EK-kOSvlWP>^vlDFh)XT$RxLO0L7djJHtk
z>XY}z-R+%?ZD}o)pEc-za2av0SL^DxgKZR<U|rz(x6QB0Bs6=|$-UCWCK**d{uvgj
zgC-ec1TzPKXjKyP8ADNQ58I^C7{)Zs#&q;HHHTby5K8>shyzmv<On5i+a)@&Z?CYL
zg@+J`4&CAUfHWI3FwTHJ61A*_>W!EA@+Klf%D{LyM|(=vZ{k;~CeT-cAcTaH1!(?n
zFBusCvz5ZL&BG^?WH->Ygm&WCyOpxXgatEDX?$58rMZZDC0iYwjm<E7>Jwp+POzxn
zIDhMj1ua7(-f6ESBZ6=hMqowvupSzvHN1`RqP{Gq3ylQ2(0H{0M+>J5jo^P6y3j~4
zz#4eH8f56ReDlu=P$d|ysG0^C`X)Sdj=Kv#^nB}P*{>MDz$+-&FX3wfi46vb?|-2S
z1u%t}wwDjmk;Z>s$dL^Z7#R*MRm;f7$$k=*@G7@Y$AWc`0CMNz^CVt8e7PefV$gVY
z=EK_VdA>(F^AS2eP&G4rDYELrl9lzc>yTdvBjYXW{U=cE?zE73ld)C=oW7u~2mn_x
z4%9*;fRCjkl8h|MsOlH)*qML5#emUhI2RytiDwArDTgeQv_cTf3Z;r>hEI<#&|)$S
z=5_%JJVJWidP2yDAq{6nx*^xUGAhEb)d?~_erF$RGX48r=T9$594Cr&k=i{~zMKO~
zbpOXQ9_!nt&41u~J1*uwnl$}Co^eD4G-<wMWL@u7dd>(Tb=)D~_wqlUaT}E}nFO!_
zWV%1rXuvUK6GXyF)no|C89l?&08j{l#SFkUpU@13>scBBLjX`Sl4na9BZ2@<Gl&lb
zaHtXv{mK}~?+EAgq%@i0-2t2_0AT(&5d=7OcuM0XiCDBX-%k9h0a(YBUeQTt{vXo#
zFsDu+=Sd$OX>2`T#+BN{RU5N;tfKTl$G0>J2Zv~~imY<ys-RZlLOt~3Iq1I3<h
z*jF|=SczS3`Q(rk&bR{92P1&uX$12Dz<)?188WT`kfI}vlMjY@x>|M#cDw*$8}wmo
zS<DL@#KV}7rgq=BRb!ocKT!rO4`80}%fAkg(Ek#_g=J{DJRHLirEd}0=1f0~4{A{J
zDW#jnrA$>L5my||8Z2!4G{}|&&MC$fH3A!6&q#6#3=q6O?i>yy?La!fzO5OEd{*Bg
zA-<*qi~yS|0T5CKomB5{>qkDZzJG`6Xhw)D8?Uso&0)V{qwzIqI>`~nko^ogcK*tT
zLq-=^;-f|!eDck^n~B6%436#mU)odr8q8_b-Pu;1BuC#zL(vSbw;75xX1O|`KB{xA
zlMIH^z=W@iRxnaab;?x&1fyy&r{&gKo$yvsfA}r*9^aMS*D{~PzR{OD_6?G@6F*Oc
z5SpbF_qCFD46YuZJlcD4b)ppXY5AKUVtk5R<YWKs--oM^2ZbjqR~duw#^>fCne(}q
z@l14;agH1M0M8yPP`94TdWwhj@JeIi*_GX0YI4sryYsm%VEgZ$RdW~I5|jSR!C&Vt
zQo&tANEDoNpTltJwYnoX7MU^JT=VSWh8|Uz96>G**&vVYDqb-Y4+WC~-2x(SqzCe&
z$1uW!yTn7~fxykG+!{Qaki!3`%BcU*(_qfiaLW^Q>WSv?(yD-rtuLw=dPPetwmW&5
z1bLapdYNT<nU{E3lq}1ecv-pe-y|fOq2q-Py=*wVZN<Iql)dc@z3qd5L>r)kq4!08
zBEPTq<q~h_I&YUwZ`aNhV#<mu<BH>1q8rCGckyc;va46bSFb8x^EO%0ie9jaT~(4^
z)V!IoYLjEb>N(ot@nL?^zs@7@BU@0?wNUZ3@)X9eeHnfSX9FtOK0?=m&gMq)LvgY`
zx9WUKRM*A`84(rQRZyM?ey9(}>)4XjR^LoQvk%GIw;(&&;w!9na_tt?hlW+~B{p0O
z&Ry>#_$JQzW?oyDByw<}LFt+67MDHJ_=)#A*K-*8(nowVW51IgFx9DEZ_8fG-1P-g
zSd^{5-=tpW?19}}y`C@b7v|;@80nLy@goQQgJl0B1MgR!>31vAuax8a3zxO)Nk1y;
z7HgZYSD*UbzU22}tA*GM9n)D)J@Ye7$G;)S|Mu3}YQ9gMl*f3;_pB%WX$}5w=6+gj
z`Q$w?Os&g%H_<_^^X)X;2sO#E%rwm6xL!8V*290jyCh&>t69~APpM;LfUYvmsYx~W
z3~vRDiU)pD4jeNK9Jdbq>=rl?6!?Xn^3M$XS`s)_7dYJ+IP)=Zb}o=Mw-xy9G;p4S
zp0){ER1R7)3|h7hT5$_n4GLO|4O-6(`d$+Bqb}%YXVAvSpv}3Ut*xM6r$O5s!N0|W
zca(#74TJZrgZJHn4}yaK#0DQ`2LCMyKB^1;*BN~LG5BOI_;f3nb{Y)e3<1JJKq?_%
zR0!lk2*cG7#^4a9xDaSo2=n6*miiFZcOh)UA?)8mIDUn2(n4UIp<M7#Zk13TR4DI-
zP`<07{K26DaiM})p+b*Ch3i8_-i3+|hl+g*75^0qr-dRo!zAEgk}6?Rs4(dZVKP_4
z{(n&!<LIIA2=m7g7WEO9?;@(VlFnC=oLd;JXc3hB<eMp}7UXy-oqhW_uzd=%Ez=Fh
z3oIUh1gR8|eM^$M4oEgS!9+FD1f5_{1IPK2<aOe;QxY9fk!2xF_NaLE7RJk!2`<~o
z(c2Mmf=Mnk@O7t1WND<=uY*Sjh=X>bwhl;_z^sdpmm-6VvJYIoML5($g0ub<1O7+>
z61=Pa1Z^jWn(j+YLgHGI<N*mmP6sz0MkQ3HI_d0Nph>ZRl5em5q1{SmPI|{+pmQUx
zmpKHG9Fv`z@h$q14pYboQ+^7Qhf~t+zQcrXyV2YGPV!(`LB_ajND68{MlMMTL9(j)
zW82GY&y<+2!&LZ<Syu;?&y*~!v+ts_A8U5gAS)Tw!iWTb^S2WVvf^!jF@|L^;J>7v
z*8wS|Fxzk6Dw%}nZtsy)z#dghx+CC<FX2(DiA0qI+sDb?ru%e6F$51XXi0MZk{YUW
zBZQFZa`i^scA|x9BANctQxe?~Nfs?h?kNmWElFjj2~P9LPIUSkb=-aRxF_zo*>u;Y
zWnaoENj)XL8y@Wt2aX~zU(o>>R3$nLlZt)mLS?dj@CgkyA9ZD$sg(0i89d2i{?Bcj
zTXB<j9DbdAL*3}&JW<oW6U&rXR(U5sB$*D-MrWlKUyY89OYm-CzGxN|2c>C;9A18x
z^d$=vdw2(%eLNqPY|?TwME+E2J^6MPXz%g<K5G9U_|6&=G!DeXjr83{bdgvD)C1PH
zCAw3%<?L#Ge@pgc2y2IJ9IismvV&v9{w}GwDH%n~t>4oe`qrUtRd=6RLET+Hd)9Aa
z=goI$zEdMQQ;+Fo30l|GElD@0|C>SfNi3t-t*7gwna*#*Hh=7&nQZXr%~A3{Ku$IJ
zeR&!9^I+3h^=#JA@uBR1Yc_r)ZzxY7qbtiIYi8Gx#w`7y+o?^+K;1^czS8EIxM6v8
zsAo%|cKFuDUyb#Va?@Ppz#~oH*6{rdYEe{>%$4ArNl5YbB{Kt1s@Tn?tgE%&#~JE3
zJI1e$RoZ6lEp3Xlge+E7+Sdo2=pJlLy$SzSa%F$UyVLa@qfnxalD!pn%B1DE<y{Qo
zyS&oag<GGN`sFkp#*t3B4i?tLhz!Efh<Ikj7DNKO1td*@%fhK&=XZw2q-!u+g0Wdq
zx1_ri>j~zeA^6IZ_c2?C8VIk`e95n2bg9uJ?aZeYMCQ34EmBzqM~70`(CcNU$k$#k
zKf!a5;7o<rq&$ec;H>?ku|4BWnFp8sT4f$yxkbA^s)bPdZ7N$6<79q5!sb;;enrgx
zqcX+{UArk!0AdLYocjBJtBmD|J|(6`3xgLVuDi=Wy=S4T@a%ri%?~1b*V`2C1XoS2
zbD0l$DpWr!yro!Eed|sCt(2-G#oGU=jIOO3)-PIrw4JGcdvtWBfx@DPY<w?#8~L(d
zu^sv9gYKXW>KN9YmBC_uX2ihk%5$40rq)-Rm{~(T<<^x#Ryhe%g4BqrX-feNWoov_
zDX-h#4iom~T^6_^A=%`J*=o6^Okog-X^84DSQ$=HRP-89Kg}b)*EvCF)OUh!gp<TO
zGX#HQ06cr9q0pij^#O%oS`Q}=ooc+m-O2UjeSTs=IfIyOH@HVOS;iece43##Ez<Ji
zl{xQy-+PT{5gPEL!J7!Gs+cOn3a6m68TWhHBN$FZ@DBmQ#8b44gYw`zjDmSxpC6x{
z2_4+bmNxYo3sO2!{cVCYCq+++<a9sx;&mEV*P%LfgBbDF7IxZWe=j$uX8bK#R-Q0*
z_|(VsIz!44IjC?hPr;%U{E;g~baim%Mf>SdzxyTiMT1XyUKSonSN5mh;`Qa~W4!Zs
z?&;mi8!}pM*NS(PId$6NSjF>Jz6p}PV3L9kR&{5QG+p1Zmr>zh)BC$pRFCAhk}eZ5
zzZJ04xs@ofrS~gmndZ>*uc#Z>jPB!cuoMd6(_aH#6CF**(rT`~twLs8``gaACjGn9
zrMNzxzXMS(yq|L`#7fxdaGGn!7FBx^<aXJGQEa4?Q|{uT+&v8oA&1eouoDU9?)l=P
z<xgE7)i$7=DFd>Qm%7jHCTJJ681u@fP-N5_Q=h6Mc&d2Q_wyD++s=$0Tj)q}Twjp+
zGcUT7<CvZmQmgvOX*gxZfw4!dj4Lse+dUK3og4Es;N5reUh+z}!A@gV0{4Ou3l63z
z0m)9#he|9ZWE&mfTw`OTrKJ@5&Fx<1Jm`>?)u`^L?|SBz981gN6b5W_UglK<c%Tl5
zoH2bk@lB`XbF`ra_Fz0%c*KlR^%gM0i@s|-neUC99_6@M8wUTZE2ExUJ#=>iC%#(c
zt?Xi(X077^i^V4hw%`+GLUN&V%N2aJWCrCF3|jyhEPgznjFIo+%4{I%@wuNzmFBWf
z4pp3O|9)PQkXyVa+O20f%Hj+F3s0(=>TNd;C93b`9Qr0}=U~#W>n;|$I)PBF<fI$A
z<vgIz&oEpTRxuk($m;H7gDHtYmji6!xI?$rd%~!U?>J{#gOLI>?d}bFFURoY`}8uG
zt+UM-r$++_^`4NN*<3EruT!OO;a7UikVjZa>4$A@+qiWTNO01(SB<DR(Fn4vBKs!F
z)TPpFl>;tT>YseVB|E334MZ?|Y$wRH{a|m%d0ij-g4b~9UdAOI5T`2w<RWI9=4M3|
zHMl!&I7PhcHpIuN{<_O<|7h}ESo15FAIawkwrQC0`|N3(iQ3Ee&csCHnlka!v%jX8
z@%gx#lDA4hT-{S{5g^WK&A>CIjhPJ`&*7T{M)$7`kRj)I{>jOJpeJW$N1LRCo^4al
z{vL4+m`uR8za|AgBqUo)KM@-<P`UNxWu}`Gw$;_f=uC--b__nDLESq+=9YWr-p-qM
zqGiDf+xRcXg$XV7V5QsMX~}kIaNFq}RT67FCthc<JT|31(DwV?ONYdY%=JV+DdgfF
zZ3`^?K&M9XmiwH=Ktk7I6GT&8e^KbqMe!Flb#UKCj?M0i<;t57{gwWYQMVjQn+QE_
zV#k${BjwZp`S)qpk={woPxwqXN!qnznb$`oU#QE(^W{z1N{xY@Hj_-0uVYvrDt5gT
zWPb(M9c2w59bTAQhn%x)TvFIA$UAIM7iiEIyNzCIOTNEZJT0-5uAetJZ?K0@4Uh}Z
z^C*616ZY6sE8W1MlKWF%(>c*bi0Q^3O_82DK4mMPCQ)s&_(bTVq0v+sdC9?ol8c(x
z5D>IgvNXv_<ZdH{QF+8;w3K41!q`ZX(~j2I1SH8cF?)h<SHs`R`=|#gJr^?iOVix-
z9nM&Bcks<;gg0eZOXU#1f9QMCZ@G<YUR!3r{lIy;DyNqf^75`(h6mzX3P~3ojw8BC
z@qa-;8<e6m6J2a287G*eLc6w8c%JfFmcGXvmYFJC?-osSikAtPg?YL`#6`a|Y3jyY
z-?R~txKRRCt;I8YCV0a&FQj}h&kesVLJ}}b2~a$+O$>oTm=9qfUo2O8ux*1u1>n!$
z@}1;rOCv+ZYNK6YkF;u2pcfOdI_HLjfNLOxtsCDYnKBzj%3ffQZGh?<*{p>G&}&I4
z5aSKCpLToTCE@Q$h<@%&Asq<+*%mX@RD0GXRWE*#uRUy5rOb&sB?y072=!WXHcLW=
z2cu+_-Z1kHJCDA^{C0Fada98jZUdm%Mvj+03gtBFIHMrgVcIY2u^+$gxg@!B3p3H0
z4G5Fo=A|U@38J`ecFanuT!mCJghj1YK4SfunIdj@<pBk?yuw@XM@L99{-<R(d+vq4
zL*|#^ExzIsX90KC+2ga6NG<S-+r1~|xtyw^ulxk)n<_ISS_CW-N>b5`mo9#UTJM5u
zcB%Iz>*-q??tv$+!%+@chy^yan<}f>)yCEh2Yf?o3gKXn(IKTw9+t=|j=KCV9YPm8
zf~qqfuL+AUDh5xS8)BQ7Z(qh)ICL@bleC>MZ`Hcb0=fiRXc%)fIEDm91Q12!^JM9;
zA4Jq}hN7K~;hU!-TY#(2=ENM_$+HwmUo4-_oY)XZ$O*>>nZZs{5z+Qs+$0qQNV3C7
zwmSih1gov%keZ0P7OKchyk15c>JW5`&X(n4k!%U?@DTMDAUCW8m4W5+#hP#8q;1@1
zmEuKgKo}!Qq3tP2(FJ}o9IFH3N+Du5a5^z1y7Ih8C|E|HC<pD9&jtz&bs4r`bk@tU
z)nEhy!^=YY%VngzReq+6PBkV7>~x{4z(V?z<^4sK9N=FqlI(VuLJ&}sg-$gRRiO|=
zn=bw#@@h3s(3y(vxOyxG5rPt7Ml>*j3`W>s-`!;t>joW=`jYlY48T&fm93OCQMx5V
zx|ArzI68I(3}+lxS|=8{f;X8VMi$a20#N}5<_WNbibDj37BKnv|3(5kU||wM*vLxA
zh^Tl>R6$bb0{XOOz~{ZF;vc2?MMW)<R5MYCNOsW?^D_(y$2tR4c?#!Yp*xKPk!`vi
zMnw*hku#J9y3;sGmTw~HlBmcOGCG^WHU!{C5K%L9r;#F`LN-hx^JK_yFH7O9zyf$G
zCIZJBLDdp1miD?L<cj-FpsE++4A(Kdc|bA9J>@(gXF12(I#5uD4VNc~-Nv#a<K<v;
z@{<4+2O354kSYl!YR!X2jd8vlBySJdg-rqrpi2xfiyZ-p$V1c-L?{%<O^!#k5LvP@
zf=5*04FK{`*3j#j90DV8NabmvoF!u~h&@3=)<Whmfpgb_j=<Wn73fK{u$_146ggCO
zt&htaV^toQ13WP=k<BOQ?}39B<6)3lHb56LpWx8Cq$dlhPc_ySTr}CnZO*!Fy~j#r
zP@kw`9IDKakWp(6QjFDkC9f+ar)4g*uZ$~>dnR7lmqKCgHWfDNV260~lbAiKlET*2
zTQX4VKui94^$c7Ze-B)KUS$3$s#~54qiW@`Nj6wxHo!`3_Gj3urBZ-5Eok3<{7tYs
z`xwRc1YJeYbzRI20$(yoK>5aFU&~<7k7o;>q4Lo))d@-_pt*BKsECJ{mIO@BBRy4$
z{zkWi2~pwD=YYLi1QxIC)g?jz<5el=^zULc$Fe#6?ul2Upuo9MILv_}-%){j8qbWx
z<}rf<#Qn<aR(-H;xae<~r;pXj=d|ZRm$<J;&tO6&srNlfoHFABF>6&vxM~(sB?|=M
zyLPsUfX-j2uAt9S6w8FGG2PG3IfJ!Uzsay9F!!ab$~=>cnA14|$F9mb%a<og-;K-6
zK_4a9WF(jmk<z+2d92tIS-O>m($n`!Jr8lM90~mE@$F|tsVTJ5(xV!EUPVkkqP^|8
za&dyf;h=>D+t=BuphK$IwXD0!RPx*cTsAR_8={oK(~U*iDPdH2Nw7VaP{naOMLGE`
zoC65661v*MLVCc_EjdG+z5gH5IDL_F)&^VPM$&Tt@#OnUIe;VqUT0xg?nC)>4v1iP
zlJX%)C!aJ3@Wbc_bXy=%7m=8l5)=Zw@PQzb(Ip??Hcm$xm!+O@K*lYUeqR2rZ6j$i
zq!@9OpxQ*(D^PTDQxJk0DFQI81o4Q9&8dMO*FM*vx4RbpQjr_z(A6K)vYVgOmEJ#C
z8}#css}DrPl!<I$lvs>nD!SO5HsxVrP34k4iL@$QE!;Rn5mPIMLtYc=GYS@jo4ER;
zIed{J&ryhVu5PNjF9-D)<GxJYy8j$)<s0+VzqJR<Q)Q-)NK8&E{lvf3t*b;X!Ecus
z8NhHt>p1%k5;IFJnzt4;zAi4ip<0{*KN`WYVdZr4MQVYDlNJ4e8$62%6E!&L01PSs
z_cF5<m4{R=cQZf#7*!iE*cmW%iKLg34KyD-Cyn9#OJ(Yb4?e_6@s>gjGSL~h(Ie_8
zqXaIcJ^@ISt)e;|B`BY@n{9l8vH=A|zCin`GSyd1=4={w0Q3~czj{1#NF)4hej(fO
z;=bZqY+DU<Xj>RcV*Q7^@I6qffJQz`hZ>Er^KF6j*;Rw=*5c}v;s><mb{E?`RWb$r
zpVJ6?q)T#YI^|O(eZxhFk6(gZ<bW9JpNYIxZCp$hp`Se5^TiE;-I2D<LH=)!aI@QY
z&1b-0@ff<(_^a^wEj$JVQ*Zq^_>+hcO7ZW|g)n~m>CR##g?eciV<e@yy~9G%3<*BS
zNJYi$>~r8yF%XGkOxJ74ipx~i6oRZxBMSe_{)jr6MwTR0>u(U4$va35h5j@&YhJbf
zB$=%Wpua(+Q<gM4kh~kD{Q;4m)P-KhOn7&FA^`j5Wys4^5nl?^`R!504Qv%RmQ26V
zqNQPTqaV<$9kflcA%dD?i7ND!#vxeuIa#u*0Tpu9#3-Jn129nXf+?NMVH7|5b(<4R
z)c*xoZ6h*=cw^vA4?#`nu^QFE6j?gbxB*a8h*<NO;t5EQl~?|84`>>Pkz)QI(ikvz
zX<*j?_netN4F`h7VHAX!k)UPwpfT>}<_i(9s?kU&4)$wPhGKxcAt7XBcsPdx*cl@C
zhpn%jRm@2U>aMaX<ww6Xerkt>%&1?oylrB1IX&_BXE6Wz0=iV0KAe{bd|!?cSXcKp
zzl(k5XRILu`MXcuKR4+nWrP~na;)XX=uBQr|7;jSl#;)S?W6vy1FjqUp9`W0H%RHE
z(Vn2`aH=6jGbTa6L)k#EM7IiuI&}4kT|FBqr5Qxxl#J(Z;9!Zxi}7!$<Hay7;6Dyn
z!*yS!q4k;QT@ki7mmRu7-eHp4#08HrBS{QGlW4vsf@@BXzN$9bBe_n3!s=Vs6x*-4
zpU@}PZMcEv+wS5ZA=g{wxXC_>s#ncl$u<4Z;C>1+*jB1>Q&4%hqK$qQ(n(OwuY{J$
zneHu{<w?^Yt8PD5D6P~D4kLZ&PG%UM7ZI;43Ur8yYRLe<=Q|sfWrB*JCSEXg^k{iH
z6hCzY<}Q7MMm&F65ii6-%9{er{RXWwQ||l&+dR3(T1BTC;~Rp2jX~X+ZnS!p{PiTa
zghC4}xn~d^@Cdy=B+FJ?l%sRsvDIWK2M6eyFZmN0@3t)Nr>I${7Uq0m`VhU`V#7*W
zl>qWSDKSCTqDF`+%Rk$Xs6!LAXw}wa{!&9#AQOKn%82;G`5Zk>kEK(Mlis+Yc=mZP
zB83oiZEMagl)o~bcPRn+@b6tZ)!5f(cvxIm2`aLWH)n0-kEvGy)NfDV0IYWtcR!*@
zAj#tM8@Kv$IorzC+Uov+9StD#uac09DVRc^r_Wxm%2^Z<EG%^~P~dlVBfbs-%MhsQ
zAC;fnW%h7yF{oPsj!}H|Q6>tfc_F;S#ROQAz%NZyY^i?1MANPNrQ6Zlj;$@~*IHtm
zdE<^V>dZBEb&<xjyiRzRQJ7ZOA<)ruYG)eZ#%H6HpotYa2J&kL3^ah>vqIiq?Lg5<
zMxTzJaDBSU_}*V%&*``~UB55uxc?tmLlrzw)X`sgJlG!7o1owC88Z}hJn$x__glw@
z;f|q)`Xhg0MjT^4eu?S(cl=T6?MQIPC-})oR?O&b$48ZuaXo`Exswr*lfGBf0gZ%-
zO8p`2lL_sUFO~-5uk<I=?@W1~e71i(`tYRpc8-A)CfeWVSoR=t8GP=!71Q1w#37h<
z?+#M~0R@Slj{+zhQWuzrs0hk}23S`#R^Si^6E)P$rgbgQNya}03nHEKa;J-D=m2Bq
zeAMYeLg&0j=Mt;ovZdjQi{UD3=jy}Qg~y%ie+-re4ZnxSZpNK%MiG9XVwYJ@mmNFj
zug0$aI-UO$`|XM0*0<A*-Oe>_+Ak*5PtLe+0;ml++Nug|Pbzjl{d74hj_DA$VNY8q
zI^9n`{qe^@S2f|MNZhxgxSdMWuIal!(}w?8<Bo&hZGj=_9N^1`tePPRg*d1l<nm-$
zI*JHAx#v-p?M_L67L<9eH?ZO&h6GL6x*8;@XijF~r|X>8tO_))Pc+@+@v(lSck^KH
zFORQHnW56C@Gai!cF!ye&fYlU^&2CeS$w+G2%??IipXv7c$8Q7Gfm<9BI(9wWWZ+y
z_oC2E=Y7A47w+#OSIT6sWC-fhtE64vklcu30C?5wwdx!$@#eB$PfNXU&j+Z$)<5lS
zd{45_(&xc1!S0m%>{5)i`Hh}^-=zgAI)pW{MvKmW`_TU9rSFHtb8^;iS{nQYYvpno
z#ctE510|lz${p>ROUs1B$EOD8zWkUVlqEbcJbV@Yb@sLkll95(?M;0*PE+gHzk$D<
znWJ9#M+JR(<=*>Xb86^*)2GYNpC32WC?a392+P+nip9XXpfbhTUH?aA^cI$XL{}MM
z-7sU(|D!U#=e_89@BRN<WfZ;aWkVIeb3BUi?EwC#GU{`i$K{6__sTws;U18GR-7}S
z_@aY*Fe2J2XHYpcua_mfLo|0t{ln1pe&lD@-19GCie>3x&K+s5ISQE@i#d9BR5P_d
zXNQ}-t#vN@fMqw>d#^O?nm77P^!u|>Gnq$wSPrhYy!Jx>HY76zbq~|ti$E_@t@Zbh
zvmLB&5>iYsoXpZ=PTpD(X{z#X`M$W`n7!}#4Ecy}5|7%@co^a8{+Uml4mUoxPH-wK
zzy--mBzYLW*tMoD%F7KK=t;kx4D*0utOHkuyk8*F&dX&Bc7Ku;3mo|2ktoQ>7C$RE
zkVZ7W=?E=nro|+R<<IlqHps7}%Z=&<5?rx@9#`U&@)vRc9HcTubl209R~szko{CiX
zR*+;lgnv5Q74<($ki`~0b#c&hib~_iaR0h;VYfVODvaYhA-VAP$<4IF&GSO*2}u)U
z>uHZ-r*Pt;Y59I}((dK=LStNe(;{n5g#*;(k_tBz|A|(S6qd)Y<tSJ{fy)JYnzGrs
z+s17|c4`wE*ElJg4XgOQt#FnH?plm);(f1cz=84d#A#Tj_{A;0ATv2=*kD=n#>d2q
zngMRf_aJ7brOaac<3u*9%kY(`mlqrX=PT)EqYZAUWr5vf2W`<(v~$g`q&!`j<NH6C
z*4-ba#k7TV)UuOP0&_+2^%Z?{5%243qQ5$n9gAH)UWLPLM=rj5&3zSLxK@~dRP9}`
zyYl$4UF60)c-+o@@4ZRRqU-VkXYg)j^Y2qRx+#**lp^3~GGG3qfnZoF)qJ}P&Gg`j
zTW*NsIXk`-nCq6$?IO|Uj<pH}%`))8)Hjw_UWP|nKiKC5dvz3nY5Dme(fa^X(k+P!
zfm2wDp1TP`whJZ&x|?VoV@op}PlS>17h4gCP0dRxeWT{yD`<Cmr>;Zy{4>_=PmAby
zfQp?jlCidQmKQrh6cLnildpaFw!x`J(Dh@eMDzoe`;(^ft*R;Benvtb3t6F)Fxj}i
zWSa8$AH;udBQbATTDvQ|!8I%(c6>Rl&8*z|L6zvXpRGJb+Jf`m4z5De7QtewP7LIJ
zaMq7eRQ6mouIDNDZq<7ZxF$4UoI8I{s^4M0fhAOwr=XwLRMzwB(D~K!yJAqFLh<GE
zf?{XxQuN0R6uEF7u2LdJlSZhf%hutb6=|^%qT2nhA3fE_3V+W$KI=qbxj4Y{SjHpe
z#mCDPPBS=c)3!T`IjteWu<H@?m1|5HTB<?Use(Q86aT4<>2ADFgg&pE;Dl^5V|kxS
ztjHV5DB9(g@II9`{%&#kmTgvZ-V=Ddg7L+|Q75gXfGmWR9?MaejS~=Vz*kdeO?wH7
zRBU>r3rn`HBtN}8d;KE2dyTy}!$oy#KBr6fYf7qa+4rzR#B%2`j&Iv)nnJanU)@AI
z^$H_jD83d16;IiOe#$!ER4;cjpKQNZ##u>Ngoc;?#LL{beky*c(jNHv*$g(*16?L)
zX$*a({&}+3<ZPo@DY62|dbwY*`K426t<U?igz6>^+eb<!*R%(nM%@nbD?TIrIG;It
z^}GfjOK(__ZIh(7bL8+TUGPG?R12LIaVMR4<;b6$(HrxZcB8?n$v4NTvJtN<w34>_
zYAVdFCfXMJ>OQpiSN*b<=~$W#vj4#9=3VoqBT={h+Sotn*Rx>s>l?oUH!a<02Ln;>
zj^75yPN%y?)p;O>e7D%MM({8Gk_5ZG(+m%O@Lm@sGH=ljrIA#@>Kiz_-BPfi@PeZ`
z3#9DJ+aR@!%NmUl4=w6!imY#Bdqll-5>-A`dEn*BAw1pkNM}MVqjG!+e#W8imCVb$
zj9P2Nn_aGuKDChtL(2-KOMTiwjX9skmxZOY2JD0UAJ!MIkbX2FSPzVm`6GCCoKu(T
zZw3iJ_eFn)a;}=~Ue!9Tbks~d{C-HXv~*ckte~T?D)U|`tJ0c@S@}JK{%)?3hH0&*
zi<fc)O_VN|UFM5B%7337$W$})l;H-R?|n*bn(^IiyPxah)o%M~rYAo{-_x8wKMvYQ
z2i%o%9X@Ic$=`TXyXSxD%aKLTX;VWbc0*A?r22(hYGIa5lKl9R99L$l@&JMzo9{8~
zlwyn=n9s5>D&s23HZrWa!)ieIC!7L!gPOd;7?p6F$9vmY#%wJ&_Aru%^qQz!{G8c>
zFiC&E=|&DXBx(PX`t&RP+g}K`n+^PI`?CCCUui_;ZXJ3+fb;boEoFWm?f#{1-oJe}
zY{D{83M+-|t$iAuzjJ@euOhCtMsK#qH*8IspL=|+%0Fl)GuU|L%y8ZC^u$j==95KV
zH&s;L8TO0$Epk&y{UXq^bStYbbEoSsT2u8hy&Kv^POILBp17yod~#)zc7MJ%_#`wv
z_TRE-V9#@#KN6t07_iU+075+hrueo{ggqCTc-X2VRcBO_$?Rf!j4#9Q;TD>->+fag
zky&g}Uw85!zgWHAeRDYO>rOxK+tF~Zqv1-o{emy|e%f;W>to3tIA3nC?$~+saLM;i
z1Ltd<5Y+0#myNxS-st!u|1_y}3Y;$~+=^_&d_^^EOW4h%^^9$LeuIc?WOC}XJLt5{
z(nB;O_}}cEuyiRruoU+Q2qP_Uo(BLIE|7cWRSjg7Iu?X`B<Qt{Zr;>;4r_=c>%(k6
zKCkDZu9WZA(r6g=uU$QmX%Q$jVk8@aP#oD&&c2BlG0|xN>xZn-(5hfl*dL1!;J5Uz
zf)-%y5Qg(M%QiL;?O;Y1)q=DI1`!Je1=xX=<(u^y@u>|80sFJI;#*S%TM|XAVg7g9
zuYZ|{<0E<%`!37y1$fT9Xx##Ia#-$k9=e#(aDeB<cd^f7c*+;7tR(o!rP)L0A4;nP
zbP*VCguIvZzu1kn|3ndF1hH(Z_U(l<A8m8$Az%!lOw9K<J)bIasB!VBjSJpurVqV<
zw%mVN%j!Vu&XCGun^kq&4*5}-nk}!RKhM>T@5;7oqzjcvAyv`~tjY0$b6JAxo9s;h
zR$&S}g2>!J7RVvbba2Y<NwB`J-;8a9XEf5$G@hFCvow+<JTG1Fdm1;OjHTI~KN=`>
zFwfC<y@*^Y-l<UBV}1hynl$1X@M3k={~b_)uO7E8II?_YHf$8)hnT;|cq3bU`kwK&
z?S(~K@q5+q%|;`D9h^zMz~uZHXVNarRurks!}>{V*A~I|vI$l$ad}w+Y%3X6C#Z|~
zu<j?S$~K+v;qC$YnIj2z{sdnRl<!bw&dhF*m#9LL;6b4Zr>U_cTvD_BouvS=w2Cj8
z-iV3sa=8lf$uD`#yX8NBms$x`NL4p3;a14q$**{+VA`$t#7^v{&4m#O4#iNT)%2zu
zyEEzB5_Q~XC_4i^cE&^MVu>o!reRfk^U&2zIht^W%D+!4wEwA$Cp+@kvZ<%R6sJ#O
z{JCl(V`>87JY@VBf9+0#dYSBV#epyeC!)}$d8Cp?foiT%OT30bxH86GQ|px`ibwO?
zbwzc1BePc;m&eq@H=9z};1@0cT{N^j!!>+%HFH0mZM8BAvmcMNX99jNR%T;`y^>?(
z(S2gC`<GjR-o~EfxN!g!Mi|SHL**oy6<S`f_2lXgj_D5q*i>tU{TD^2c0~z`;xihj
zk`?MM;Y|Ph8SJtzOnfqIWJT@2!hJM(bhO)Zy2}X8Lox5YWovp4aj52v5dW$sW^Ek}
z1D)Fp@7UQz&o0YLXksfpuqTz*7#Fd$-!|ty^uLi*ikK<;Aj=W3OyNo)Kr<xey4)F~
zLHq$^th77N>MPkTcQzWKMG<30Lu~deus0y)*{Zo30PKqrU8evx^)kO7JXpuU{00w}
zMZmkvFgS+CGW7zoWiPIH2$!(I^)kY$ecWnz&+v1E<=3Wz8O`zed9FT;<r0|>p{B#E
zX|?NM{f^gallMYz#06mEh4W3|^?{Rt&6t=4XgOZorkDExSueQD<TglOjs%Yxm)*jg
z;LF+k$_)NkutqG17mmQ!$-IXYv8O8hRe653dsc8(iFqy#?$?)$RS@C#tsB!FLoYfS
zj9*gv<QTW#W1<9Oc#TSb?MO?$?{t4(l5fW-!5p6F|I2}iE0e&{b<J$Mj3*2vGy`A`
z8i$*dv1kIj4<xut2yD$1I6sA59wXaxpA8`4_67)R2Dm9e9K6ff4uZtRITtfoS@Zp6
zJziVr0WM$8yqx;EQ~ba}s@eU?U5_)D%5Hr;b5E;Xnjfn*q5hmNpDmZ|qAC2728UDy
z{Fuy%_ptYm7jVXN=`Wa=QW&GlSokH}63N0L5~9Zv!u)h8N%ES{fk_ma0kFW4G;tO8
z89spEiNV}y3KAV)x6^i);fuT^#P8WY;s1_5fO;vQ_biWbWX@{Yhq>HXav5cP8}Cfv
zj>bYIDR6Z@Xbqm1_Fw{TM}hED{P9@9{0aDKb5PbLpEnd&x#g>#<!r*l;|L-Q?;+X%
zkZl7R$nnWGJuqy25TN%Z93>EebBu`l6d+U0RmYQ3%*l2s#}QU1X9RG&w_xH!W;Y?y
z@F1ZYH00w59HcFa{{r{=0*@rHzmo`+@d`D*@#~{|+p)V4OhWdM$kAXQE|GM}RN(e2
z$J=in-tKLVNT`x7Alt7c(|h#-oQ%S?<Qq{Ss3u12+Pq0WfsLEPjb|7xPrQCdKz8cS
zovh~QENyJgpX;x*SejNjJ5<E+<=j{a*_uD@b#HD<ImOH6$DeVsy<HPye~`Q?!IFtr
zk75vM!HdyiLHt%|2FV4J-(^&1eC#hgV*s8JdO^^L-YBNPEu0wmDRHcCu#m|&!d7>J
zBv?jD*|yw&pJs8Weu0Y$x+5mz9}A{EaY~aqydCE&l!<0l-cR<s$IPAY7_=idAs|bh
z^bW>~p#yj!0=O*+<}J$IKuNfG9sHxjsV-e;#9Y#jO8b+a^=~qZ(wx?7)Fv)%fYQnK
zYP=cj4L`=0Dta-J0L*TsS2d*JbL1SJR=Jpk9IZp*xj$Jbp*-B>yw7Uc?MB^Z88-^b
z`7;5z;8b{wrHTv#yrq;^(?~4#teQ-Bs%gQ)+g~5X2^CnhT57()?35*papd<%FlPb^
zXu0u%55}?9au45Kdr16RST9uc*eSoYdjanu2z#JV(&#0pz~7)FlT|L#MBsp#V+j=Z
zih@Feb46<fB|p#Iej{YgKb-xbj6Y(5KVMS(!QX{=W)-O~aJ#Q^WOS<3Q{I+&?}f`*
zo0rSw3d?~vZEvj5>L|P*)vR0(7d_ql9RJp#Ao(22Fi(szdx3&3CPQNC)=F!+r*nmm
zu9r%oV}!d<o4Y|)eBhJ$;=%7-`SYAQU*+l+IO#}Z3<eHe_+UlEKLo*rzdjRqQ1N`K
zrrw$RcdO-MSyG3Ng4eyOgjBe76n~=RuTunZjmXx1Lt%o*>KjqBB=mf(u<qy47_Dh4
z?@<?rxNiPx8TaAK`_H(zV)9<x@8W!Vu5M+jPN1l9Q@B3Pi$~|CcqTq3tBY&?sCdTR
z<x!-(Fp*=uRK&_%JPF7esVm>7)5zD}=vegH`>64b^vmmu(gh%qZFE)70w=$&f}oRv
z6$KWc_nKN!=u*^@-v03Fw8B}UpfFGrDnaa(;Duqfj)~7{c%B`19)~ji(|P`flopT0
zqGlJlc8S>tJ-H^G7O`%6qvQ41zh`$vI+vy&-fLIrp$m=koDp=P5y8`;3eRCp_FE7?
zE5QQ82xO8k*6YYZXUJSJqUCr&tFngKA~WmeS_S>`mD_nA=t3izjXRBtrt8W)^FN}o
z1yk@pp^<7@&{-hKJhL#|qr_AC1)hn&r+Sm8bQqqGw_6LM+??sfl(9v)-{+c=r3;O!
zqM5I5$RGTJS{3z2dAGQ@rroC>xh!Sk9$<TU44E+p(0N8f(E=TbAqMgQ?(h4D@xM>e
z08b)Ee){ZA8NaN4^9jc8i3;l@H4d4J+<Ws!5et<!u%yZu**1xW#4gq>azDF)V~zfY
z$AW{eiwCL4gVPE_K*IZb-@z|MKS-TqeQ{NoI{xri3BDaBZlNA~@Z;mIXrFueXVZ4J
z13%Fb5jkgIBaeni3h#^uuzm(O6M4c(-V{%wEX)v#7u|Vi`7WC!QKGQ2(d*^KPsq>3
zPDb5@$19^hy_tD5ME*pX87o-GZ;=>78BG6m8qbX%?`0QlATax3SR>6+8VOULSBBr;
z9d?%-K0_B8=h+z_^$T1OAiIxcTp_yLXJ(8Y^8>Qy&%YY}pU{{>WIkNrY(jH3^z?*#
zxcJOY$uLe2i>1AJ`w2Mz>3;Q0?|lAI>5Q@XY@o1Nh5c&fuG|Jiyh4a=9Wjarv87<(
zJNj!;b8wh}Y@GyMi4<reSAAjQBD)v+$HQyGmrx~kh}o6)hs*6J(`r|SfB;Y?Gx(+J
zP<?FL*opi#@lB>(x%tS#T?zgs0Q*7Ov>&CEHY>jMr$$8aL(zr(qmPsi{$>0jMRKc{
zR*!-oQtyBCyWM`(`KV)dnKC;TP83qVv%v>X`*7+`mVWpPLp_pU*|uQKDZQhES}=Uv
z_JmNJtxK(H7e6)Jemp1JRz`8%+ZK`etrQm_bhSW~ww#-~^Ll2Qi98m1waERn*q1Vq
z{6mxsFj&f%!F&8ILdl*I=9WwaN*mbPDEkcW<Yt2R{l6XHN)B5c|Kz6rq0EB1T!9Dx
z0EPxC#vRKE?oz&4elpyQTda3{cq*`Ru=Fh)h-C%<47!E%eMd3?06CbrYYY7lE|4``
zK7U>H|5h2*pZ498wk*_7{p3ZX`;5+QG0YkjLj{`tQyr-qJ|8aW-aa~J)?6Q!GD;UV
zNYkwT^f)5(n2SZLX1v<rx$}Oj`m>1_uI;x@SkBg(5Fy%%UR7L+UsLOpSzxT%bu+CI
zKZRXyYSqtG$ChrMupTP5+$ILjjfHvHFTBqX(Mu})T({hxcjkhui_Oy4Bq50~7icL_
z=gkAlBE!4R(sRAF`yi2V-R6L=OZlQgXZ7A}&0?i0PucZ#yoas{ghfJaXOa>vOgwox
z4B8^<p5JtN_w~Zu{^kskTd&K@_0R9+%l}F;4c{K!^^z-&rp;M(CBo+4!KIYXy*Xht
zucvX&M|{3-iYGEgG7WG!!)THC1P;&*Hv+e{ukdB?6*|qh>mDru`3r2on4H?0d8FQ8
zKg0+9)XDKke{~YtEu#F<%+r#qFvT<T3bT=I7OQ*qh>@Y4Ch>nXqY1msQ_o!Ma+1g0
zEG1%A-lbDI&1h;C=KT;dcj%Sxk!gOdpu+gOH$L<5{<R|8R!<kDppVre`Pb%BeM)X^
zwQ?0koHDNme1d&GAJi>Rf0K*c>Gyq-X((L!IMwd+@Y4qayn}R_QOZTzc?3A{Oj()b
zdUZuf+K*IZs^3L9{l)=BNmDw_7=RC9`I+#vV!*$?^Yq8Pr>#fJcLk|#beho=@gL2o
zPp27sbz9CfOt{g~H=lG_7v)Ob4-;9}w-x0|SNWnJ`2l{^9ey6U)~soTTqL%;y#6|u
z9^7diWEuQ!EE2~nSfL-u!4uaVPNx~0y0cXNj4T8P9sIBieb4`-H@I6}=1F7GNw*ZU
z?S=P|oRZ*n2g@$8H)nspSANH~>m^jbkt4V|GV{!^5mE6y;4k6#rg}|Gdbp=jZ$`u?
z3x6$*k1rzZnjTW+Z(9dMbYoLccV~DQBySl7Mle}sosaygpmkoua87@fQ3X%C@uB18
z@9>>z_oBN|bGLj*&9lV2l32d#!#jusO(AjKMbgiRy}3+OZ16XF+T(}E_E1A~)ZdPu
z+=AWX%dOT$R2uKC)r@rZn?Gt?kT-h|k)xAHuNKV~%T0vmE&tiR!<<F6ziwk&s=&wp
ztnSul#_VJ?&#BQ{{fuVPKQ>;auqy|?Vnn>ZdV^gurI<BSWe~P#`HGsikg0c4Y;P{J
z)#Na!o|3U^@NeslruDzgcX1bxDGutHw~JNo{G5Jl+4jdE4z?ux`jEO77Nx&p9un{A
zQPNWbxvO~cg2AgQ59aogeKRmi@ejUBDTqS4eJIHiT*bii(Uw(HmB<mH(`!&?n-tKr
z%;`J=<`E{Qh^#iqXm89_<m@MVm%0n76}z)1R#C4Nz!LvV8hwcfB{>%;$MbHK3s`z#
z;%+{n6Mr<2zhSfiSEh|3`;5C%Oj)AO3C6nXcE3pZA=A}EPEo1$CCfSr39E#2J{_T|
zAKRKfJRF4w?)8dl|JI6A1v(ZiEefcl_V1BKuRcP=H;RJO`F*?KUfIbaB-mXo3kLe?
zu({0H1=ec{8{xBPuoeH`<k0bQ{-t$K-jmQwdHoUIyT1M0T-Po2Ozz#Uo9UMI7|l74
zf!!#mt<W-WGPgdGIQxx|sQ4U|$si^hGqhvOa>A7*?_dE}qC8W+`Q1{|4_K%qVIs80
zl{Q^!|L7E7iQ*UfcspaaVD#zoBJ$=3lA?q9*S#+vIu)Los1li1#vO!o{xBhp7P4uY
z`BJoRUk4*^?eUukB^l0zkW4h=ON3^t%uHo%(~c5KPqSC~t6N8ke`sp4C$3*Oz%&(;
z6BLWGrw8^HhMoKxqfUzlUL}1Q&qsW&gwE2#BDZo%rj$gdt5}5G@bQHq`!d@wV&v0u
zqe2Dm|EY}M+9s}h+^CDVn||qAbBckJvAFv)b2s;}iE2cAiEzSmcg}RD=7HCB8G*>L
zODpz;O-meJHp#lj#4Np-1h$J+cF=e8Nq2_g1q!RWkk0C9N&%Fj)A=({AaLrARrAY-
zj}k>@wz<#im%Tg{47`5fcCPPRm6zS#Ru{$6U2EsG{JiohY}o|TL>ig#i7!#NYm^qR
zw~d7qXi@k9Z#aGO0YZH+6HC`=?hU_(?H}$0MNrjPxmvvVHS*t!)kZP>iWiXUBshiA
zSOxhbN(K9s8i-nU85|7&vijejH;uC`&U;0&DlKe@mH*`AAxnu$I^i6Lryb*Fh+U`i
zbtuu9oI8DQWG)ImLpe0uWqo5rJx6!O1T#EqAZ6g^It^Kz9cdg8iC&e<-D0lsa}S{I
zy!o#~q@By-BM)(6L8_DuXOTr2?N$qu*wnNuAjtd_K_Du6C;eGQZZy73+$iXkO(a_~
zd{C%0WF3u|*~qfhr@;S_cPwWb7-J9^$hN#j-ZU4-a9ZiGIb%~P^P@Eb+Mj~qGY6*9
z%_CWX`K9nA!&lbAscSY%Bt9`hSMh}_j$#o6zUT+Z?AJ;`(b8Yx6VXJdrdopU24$$x
z`aPSQ682_FDMQPP{TJc0Q;xlbpOm6s>PO<^UH*A~u@SGap4&#-`rnq_SSPdCux~wA
z{t~nU{b6~ecD)dCNp?Ncy!CTnP-zC3^}_7`#om1fHMKno-`^yGB(#JoQbR9NLQ{GR
z0aS!gR6vAC69fb)ib@F(dJ9cKQA3d?YN!GNQUW3%BBG)qh9*T+6cj{+H=v&5X}^2!
zd+$5Xyfe@LnLV?2CM#K4Ykfa;&CXS>HgRWP!LJAMy}Kl3;}53+M`Lfn``!~>10?%U
z_2(7m7S6`y4>8{i*|z`N`*`Ov0lZy#*N2g}?9^xD63#Eh545MIInQRxZL4iNxDcPw
zJ95JCok7PTMaeMFwo;7;Cr}4eKIXE7`2;%!Ke(Rtr0~|4jcK6)!?ZZ|Pv?0sk4+9X
zW-)mOiwTUpz=fO{x)XlW#o&nK&IgTIMDLS=)zPz#5mdR+f1@()2>%chK^3P_KvhR|
z-m1?jO+6Nl70L|z7b@e;=C=piqtHcbAFZpD-#_k8?1LUzp(?d}NJ|SHze$8{s*G0<
zVZs#>UxseBe9FADHsihV<<Xs%<vV_B^L`O)FQIq7TvJ;A;CE+j+V9RsZF2ah>Q~>E
z5JoU9WRw6^WL4R2H+;@AV)=Z;*X51SZ%-LEj&8z?k^X^qq$Q7ad9bgX-SLoh79Y7S
zK5~0b<PG$3-AYb=Sd{2+q~?c6QO~Gt8c{o~qNGEjWIc6+aFOzSQGzi0v^I9GTOehb
zXkN2ujK`+Rs68Cbsi8nNA$m#UHS41VG{UMY>F#2rVri5R5W_DMqr^wtZx)@FPPCUH
z?&A~KHRJ1~5smNWcPS-0%ea|pC=4IqamV>7svw#=VqZqax_L%nW{5&a=>Cw%!GqCh
zABf>0F)9yZ!gJWq4D+2Tjq%`%HIRu;9Oh5%j>@o$t5ESfA;X=qfYF&oEgC@a12C)L
zgeJp;^qKg|%HS}&7{c%d;dNVFd=5K7BY^~qIoHisVwX_167L!kRUZ;tXBX>jm)IfZ
zZ==i#HWkkx2y}J}HEJa5l?q&g#oW*k7#dDweVXJIpGdV!qMMDQr2+#Xk*zB!Bi+RD
zndA!42`el3)CA&#iqa~Xr4o;ujNIfIZx><TwrjpwiKg+TJdI3|_e^Q9BB_LsUc|@o
zd8Q`GB%@YHtYwj0+mk`|sZB7_x%LynP;NhfePRHOc*Ob6pY16@W~vQgPD4!iv%Nzy
z3udEPs?)b6q_UT#!x}g%Jfm33GAm0-&vOJO<1^>X(m8W8G27F5Pp2AoXQ}U&mWT4B
z;Fy-ORFteX;4#)HhXtl-YZgD6rKHU+96X)xUi9uSnL1^WdYUQPUL+&UR1W*BLB8`I
zx$&N5S+td`eW%Zv>^_%S5IBK$v=UV_c4h8G`Z0p`Dt=H+_;NlXKj~~);_-%a{$4`x
z+(@6?^Se%;57!h(PdFc(8=dhitLRIPQ-N`|fsR(2x>KS0O9JD@1ga9rOhmJ@1gYBx
zUU1KiEq=zIQ<mElnaj(UcX2i=|K9mayU$OG#=70gJE?J^zu{s<0HT)8U(phbPOv{a
zz&An8KFGmxP4f~7PHfT4HPB2tcTcFb?D7-Cgx9%AQwe#+e3u?*3g7p-G69#F9^e)X
z7FtHLGsta_!CGW@GW1p171hDKMcKUL_IZ%qxwG~s`(&?Np1u6=9(kz&&lV6ZaDiN4
z#JaA@lX?%4D$CWfz$9B<u%ofysXf#FXs&5gA^JJjGP-d5OTIzm71^p_x8=ks!xY4s
z{EO$Wyr?Xctvbt|QKWfclV?;Gg*&un9Qc49@#3@i0JXG&+pj`nRM`CpjPWY$DO)@v
zm2{OJI5a=TBQz(byIKetEPQ+V%BOqzM`-yz<t32uA{8s6gB+0+npYL9m}*glwFQig
z{s?!1KoEYDXWYxf;@wzcQ(2^=mCp_;*^^j;2q?>DE{~~%QwLx)1DNF*mIxHwa&80h
z4$mA<f>=IhqlX6TKbBOVxJK;JTr|jR8Q5b-W>Hoy%bz1KZ7X5?SVk?c7#Zhw0GJ}k
zEL4E0mjZVuSlHp<1a8Cxl9Aq(UeCTJp<23*W6GtmOhp&3xL$7|@mZ-?<X=Ec)7Xn(
zJR)4By@@x!Xvy!Uu}Ao`R1(w!tZgRn%;FP8WE@i?j>WXqV(dBpm;+M^o*7)o(x~aD
z@Q}^je~03S8{|e-HMgrc4n#41W;dHoBPXCEt8`CP$zHpu^adrLyBBy9%Ph_o0qk3C
zg`f(djr3XfIHiK2GB1$5NnBsC4G}c3N8w>5d9HjU7qLvST}9z)+cyxa$Xdxn+vQe^
zZ~ll63%1`VwfnHO*0%*1_T1bNh&Zqc9mH|@_FnLLQ-|Jr3n5lL0Z{B7Wta~j@(Hjn
z1~5}3V%lcM1WwkFMPcH3>O%?PK%&JBZf3!~W%+w3&z`X5Q{cU=79oe=x&CaQ3|MOo
z%zFpeZrj2uDc6fh*?iuOr7ton2lN8Z@~ok7^F@eP?T7=1ZZEhpSIi-tdQod6#1}%X
z@OA;4PurGph{M+qHE%3$W7L+>d<qYnmT9%MV$HGQI8bNKNRpW!via$NZH;%`H{;ui
zNnESw!j@}XAJBzf+5!^C3eFrUR7osUZbPVQ<piIVJjFs;Uf5u=B0&NI*d0ia@_~|U
z0;AmmlfhZYu$%z$5cgCdixq*%9aU@InjK`Yd*AI6dX;kbf&py+mP=;NK<=W4FB?(t
zTQv5J1*T#WyphJ@j<!poq3t9n>Y*JiB>fB;z5PfzkdB~|;Mr)_cVw3LRjj=<c9Uf4
zGL4-`fKk!x^mL{SocSrbz8GN6+`|@ef~Cik>+RyUmpC}*HN;Dt;*L+sPfoMFB-5!%
zW;|+dC7EUa2#jiQ_hhm@8DP#Jz}{mhUaaizD5@_}cZ2#ML>{WfNJcS|dJ(v@Q`yX(
zpLw<Q>fAV@1z^GhX}x5q-GVyfSEypJP#E(DmzCCym~^;1=_<9=)c*ONWs+5d0pAx2
z{K`DlewFD-&mDqGvyx$A!`CajDb1?si0B5rwjDT?ii(%0c7-vPGYg%4-R%=-x(L}`
zat*;S$8z-yq8KIpfs%7czJF4X8g1Br`l0SS6?Uym_|B!&LA2e8LL)2u-C}?Cm#UT7
z2CVT5P}x1uT0)Dpa+l`ArU)yha(^~IgN{l~Ry%;b0}!XzM&FSTG#rzl`oQ*VxFPkS
zpk(uG6w{(V!jp8}kHXqPu$HTMDELkB9f6T*z-s5uK8R$b_eb#yX<C)6;*aD_0d|!{
zi!m#K59I2ntq7BB;}`io9glh<(>LJ6T2`eq?3U&2^hoPEnK^=lka^2F0ra&Ap7=s3
z(2p#TrH=!0_YpNu0*SXa3ZXH~?0!g=3_@=<UgZn{_8}VP2c(7iGKV+sjTnGM5STEm
z7WkgQX#z~coHYo|dg^{_FHq(%a5ayU#U1FC!a#`z(0I!5^0g-^3rvpfi1OA)3LJ?1
z1!y**v+^tF7%O#+rg!KY*JANg&|wxU^ff$^WpzO)PUnT4zlt9Y?nj2&CcNlQ(a$h|
zS}i~=<wxStmJ@vt2vyGxNUKFZkM~!<qsvNcEj8d6QapiReZzTgm@}jGt|{e?wnRaM
z@}@$$PAb3Vka3fL<66A&wK}cG1gpo2m8?OfXiI(s3)ooM@QDZ87`x2<S_8fodW@9>
z_uywSr#&^rGXoPZ?U0BwB#6dd#dikQ<pz8b$HyxHW^)4=x_#L82(usVdV|~DY#Qc;
z&je+JO^@1|_yKATbPy?&GyV{F!btH;uE%rN9K{ASiZGSB>{3&R^?6PUCwK-4u{)gQ
z4Emg==zSoCaewY)rT-Wr45CI9c#34~G`?X<VzNkw99(~`piF;i*%w`yhjdxZDezjd
zq#CyY!PpXBwKw4iv+~Dj*=Jm{`;1K&Opc#zG=H%t1<Ba9%4vC+@BV7VL#^wN&s=}j
zSiM=B*4m&&SkV+JSsnauFsPMwI|@J-IT6BRw=SQgksy9Z=64jh107=&)2BCh;hZcq
z1I6SlL<D{C*KWPeFD}<V-!F^_T42KHP1sb9<>FXm=I`B_N4yw)I}Pep`l9O4`qUlQ
z_S8Vpo&JC>bFCQ+tt!CjmSH}b1^*6_0WdWV*mCuv7xlUhJIT~iYIGy#ss8Nl1g2ch
z#-fTe(*d@3t*8t4Whp*b;1MV9t8xbem^t413xu6af?Tg*-Hpm&ZHJIsWtB$RXuwP{
z3F5=lrq3{o(XE_%1Opvn@ozCQdTaKndE46DO~89H`4HtHHv)EzGM`dke*AH_?*{WT
zKw7c#<&4^7p6i?X{!bdW`d(6A&T<WNc{88#Wu73+(}2&jnR*!%_$(Krtv<Uc>Za1#
z=Xc2E-DDQXi*6_z_hUFyogwt8Kf4`0I!k7Ghnk7n$nXS;@%T&bNJevjDVsKz!pgLE
zn5Xt3CukQU<6ZUp@j)xJ5^(3%r3X`{1Dx=eTzhoB@Ut?(3mz0+(nAQ+JGFYE=FoSj
z#I<#yhAWWUcV@8ZPbUI;9)FwWkNN7af>Dyc$}bPkMlv?MpD|Dvdh^ou7D48szw09I
zkz(6y<k+1`Ts7XmTJv^w#z3|H4s2@W+`2zaiGy)I3qc&>glRu<fBESvJspvoVF#Qr
zrfsT>!a6QJufD5{_3$y{M6NJHYEET-i^TK|q4Y^aUuWp_TJWJ2(|moK9hzq#x$nE%
z4~eSlnOj>;TU^#<b83R0cqS6NoI2yGVUeU4=Fm0UdyCSi9vg9vv6DY5;g0@<OPJ)O
zpI~NqK5|MtNMe+tvPS*9c*@WFKqJ3ur%V0(K8#WA+GAz`Kher&mb=+y7wtZ{bfpOC
z#|qkibnD4haPG>pU-am|7?v+9j%Mapvr3gXV$Ec3A-}toD7BBDg?G@jhrnxg_T*a?
zhX85Az@&f*nbJ&8+03<g-oegXL20(vFfJ+b6_Esx$5Q$r{>Fy&IXe#<v#a=;m9Rzr
zl-n`IIrvC{@TQjB^<z@u(Ot_yQzc%#pAiNxJRY&Ly&GsXB9Fq1QsMIjD>v(>=(Vbv
zL1PR!d2Ww@M`b==h8OBH|3jlBleK%V4UGA#%B!z8uFhTFmALpuP$2^+$=oKF`!=OC
zxxFBxf30E1%}B}uG*89@a#uvFfDC3UXT|uK{ZVD?qpqAt%2yFjg32DA>7KtFvyu?U
zhZYQYlz*B(v8P8zpgb@?{Bw|uh~YOwH_7hRvPYL>`qio}yMe<q!bND8V^!`m_0z&;
z+b>M_$9&ulRgCy}&o=FSO_S+RjFft&)rP#PvZT$yZ$YN}PeGEFE_;`AS08kaVBBeU
zBu=u<&Q$~y&8|z~i&OPl2MX`Ga@owK?Ha`gSA`VhoU8P{5r*le$}ybkIUbkH=t!R7
zhmP<(h}q?Idiv@ur?c<fWrRO#-7c{YRn@xts8{gYEqpY>MB_-zHjnxvaU!uAE(y}b
z^)5+DT^g<_yI$A3rs*?jx}}>+HMnJ3nrOObAM|K&Kkpo?>5+T1xWVJ1Uzg_5OQ&8p
z{9l!kr`~{R=RhQah=)jO7&0Fih}uTQGpW}bvY#A?7J(drVKt06&kYczjgK(@XO(f|
z|ES8?u-oF~VCEHwy9`!ykM+61tP*2)x%~}$4%7{1-z2)ryKC-scrtkI7S&xbxM8o;
z=fU%LARg!#O>-CCM>%(mJyfzA%sqBK%6&leP`j$R@7RGy7oJi*cGfoRJAU%f#aED{
z8l9RJ0p}j&O&cH8dfZ@fvhLBP_r#+*Q<|1%o;<p|Og(x*?^A<i_~%DgHXxn`j9R!T
z-XSs+OF!${h>P7hl#ht<G?vt|N<1)Bu&vY6M7_}}_2f{Y2&0!7R?9l$+)$A;)@#rH
zM(cBRLsykzyv*ITY%V+*D&E!UWf9zHbNTa7i9X{oT#S}&0q^5dQ|vM8>_*$-osY{b
zV~*Kg)!JWv;BooE&SM8^8~5Kh`S_YMqqkkB)`6;Xk1Jp-u>YTNmG}M7XZ^kIpHMvz
zkRK5E|Jth5`QNiDt$$jT2T%NBRR-lA`p#9-t;$n*_>es3|8rtx>{Lx=UR`2E-MvqB
zNmI9SW^ZL*Y4}fKWyyafR#tWuJnL$x=`MNGeY4}<P+d>i%N}|dt9rTTT4Ue!vHPu`
z?^pHq554PeXns)H_TLdJd!Dw^(aK-N%3rw3d;fu}{LQKyogV&2uJYag<tjxin(9AH
zbZ72x?r&;XoE|9Ld*#38Dj$9Nm8+DH{mE5^{NO5Gf8{EXJV*}>GLiS>Onx{YXt*6g
z=PC=hq}CVO5&ytdP9Q9P=PKvuT&32ZxJuzMw@t3n9chbGj{OT)>Gca&neq=@r9=vy
zs}$elD#bUs%111+v){Q&E*6C!T&4K$T;=Czwq}?_$tG9Xf%pSg*^U<L6f@f7Drtz;
z#F_+{?Iu@w(I<<}RUZ4!Razm%sGJ<KKe@_hi0@qGXQM5y@&U*1TxBy*`Wshi|C6ia
z+vF<8P8h2oAO4lAEUM?&<SH>N!o!?9QY1R~IL)-m%|H*Nj@#0?$_yQIHQ6!rcdk-R
zp~GyGt1K_5+2kr0rKqc!?BcGp^dDShhB=+9jFjJj`_5HnkgE2fLLGnSDi4cqag`@j
z@B)KgDqX^xT&3A2S7}zTXOpW;lgRkaRTg%!xNdTl&A)J!FIa>VS&S1U25FmIr5~NE
zyw@iTE3P!l_`y|PERCddl_7MlGUEqVsUrT9t2`)KUehrkm29xZRR$3WMX;r4g2PJ3
z53bVUzr|HT{=!vCY;u)pzj2idzjKw0Ke@^v;y!W@T&$JORT}?STxIrmuCk!>KX8@1
z+rM*_q%E%U>53t8@H<zTf&T+nIryEcy!V5v)cJ+0jOI1`ovZBlm8(4PD_0r&J6D;v
z$yM&*pWWmt(|_YCYc{z`S5{X#S2;-MDh2<Zs~r5nRnjNsbgr`DCs(P=yVU&~R~a%K
zCt7@di>ox8iQxybe&;HUA%DYFx<vjXSGfbZH{%anWz_Fn<p(-fX%_uguF~kAxyl;8
z?_8zszv3$ArJDYktDK^9m9)Qbl{(^o<to#D=PGR+{+_GcWAq2EGVG6B<(WTom7#q9
zimMd+pK_JFf5TP!(YeahEw1w1AGpf1zjBq=gK}ulpIoKQU%ASR|2|jw<Of$7_;0vM
zH`JfF%H4nBDhuRTWBvtK$wpsRpmUXvzjKwY|81^v`xaMe`bVyEP!x{&!Bxurg{y4-
zm8;w)>w}L{{wr5m`kkx1_k*h}{lQhfrgN2gTU=$$53VxvUvQN>|Awn{rgN3#AhX}O
zN=Q4w_7|=)RHL0W2nqSlRhrVd$|B|8xXN_P<o_+MGJlh+G({mY{2>nCxk}DIa+Q_8
zaFqcN{TjFf4dOs!Y^LW=zH^n8aDC)1i=SL&%`aS~?Erfs7G?OiT&2M;TxI?iS82A%
zRfcRB{MTG%#}-%F@gKR$*?;CL%PIO6bgq(PldJ6bXRfm7k6h&}<qurt#oxHf0hX@@
zTU;d%1mN1@D*f4<@E}w2E{or|O4`5TDjj}sl_wzzB=*XG<|=LJTqXD4ag}^qTqS9f
ztE~CXRf_)uS84N;tNaN5!ByICag~waG8D3Ri>pjAK&Je{Rff~KO3D^jxxyOqldF92
zldGKlg{!P2Gbw!MDhvMwS2+Pm-r_2gf8{FmesY!7zj2l65RE@_mG`!|$_IbTRVMzK
zt9<ZRuJQzgGZFe5S6TLxtJK@#DtA*@^%fYa|ADJ?`OZ};Z*i5gKe$SbEv~W}#Uzem
z{S#Li`3qMWvhWwK61BxuKK+fWtol2yvhfdGrRl&HSGoNMS6TL*tE7QbzH^l%2p<jl
zp70M`<-itK`S2%KiTVpyN&6#LIs6B%($qk<*<h2aZ2l`(Y4m5Vvgl7-rPvl%iT<6d
z)W9=N<uZfN(C{s;@&KKyOZksnW$*ultK9JyuG0G#t}^i_SE&VEUtkCRC09xMg{!2n
zs?CA*wz$f`Ev{1IZ@EhJzvC*aQS|l9{|&BE>|bz|Ahz#Z<p7<lB>&_pt^bj$%>K_@
zWyKG!GK0=lB3X|M{^TlI+5W^;8q&GS3PuMySK0InS9#{IT&4LISLy!;u9ECe9i=h0
z88AAK_PEkmY`3_|QVM(&$@-9+^(mgcl+0-SD_2SWBUf4RJ6Boi|AVVcMs9JH{;(-l
zHab`7N@h0x0?r0-$;jWiO1D-f0sxz%bCq}q(-HVN8nTn}z?uAKuCfx(9!K8fD(S0&
zf8{FOe&H&s{!6a%%ulYe@+Vh0jAKnDu;rszKp$9A(eO?b@-_fVZQbN5GtpaIrS2wI
zc@Fg?lg?FAm}6T1j;l0hkpr0NTqXHCR~g1OxW!eL{=!vOQ6Q-VNTxsIIvRe|fHk!h
zzV6TLOknH7v2K_%)l;A)G{i9JCs%n1Mj)`c4g3vPnf#NhbV4)Hxk^{$CRb_r8&@ex
zzYBJI`saVIKf+{-t2{{9<SH9|S-`r_E3c2Pw~nsjAq5ncisl#Sw=Y)j^JT5c43au$
zLWg#*z1lO+2070D0!2$yU^5)(9=?yX^nF%^W+won!>!NOTj2%GkVXZh+*?FF8V)+a
z{GM$9r3YWcL+U6jw+W*!F1`9HG!b`%`jjSN0iw+&-&69LNb_YE&U|Tcn0}ox9^p|F
zB%%)w0XIK*oQDt*9v62S2Qf@JFR)a-e4wN_;c%SK6!$VHl%^H_@(jSip*P9RK6=R)
z;)7!02}cA|AP4dAMcpYez32X;h`{jib=pg35@Q|V)uDgGRl1@7!c~SdqyHmUnb5k$
zReoS;YWd&hD$x_aag~+-fva@-pKz6e{|j8DA)TvyxW!dIm~#3LT;<J8uJYKw;3~EL
z4Ohv*LPumbxk|l>Y*x0va+MC~Ev}N|2Uj^j=PD6@%T-qVg{u_#*IebNpIoIJ_ODze
zuF&M)aFwN-TqP4nKI4UZ$qoiW-?>Ud3C4sN9#?sVjG#Yrl^K8HDsf(p*qL9sO84Km
zN)I|$>G`)@C8vX=?tkDa4Zm}hZk~U`Rp$Q<SNVv}RcijiRmyEA71&7){u{1R)pLuh
zB>&D;M*oScRQMaNQsJ*$<)c4yl}hTyrF5=R?l-Q|<quq?`2Po7CC@qjkOWqiW2R;C
z+m2OIifhf!49jyKdpqny=PLIba|BYl|HxHh|G-tMY;u+OvA&;N<(n<8vVzW4Ui*!!
zETeOklz-wXO@45d)qmtFXa0$+l*yD`9e$c;R?PPsS9xZWt5oku{?1jB5+vwc<=A(w
zQV>h2|H)N~%fdbF`aE9<de67gxys|S1#E8e{BFN-l~BH(``fY4t(elNKe)=bf6rBV
z{)MXy`Gu>T7Te+~`)0m#mC^itv*VjwrRQI`O8jqJW$Rr44@9RJF+7iEz+Rv`d`N;9
zf4nd_XIhyZAb_UdU^aGl9c)>=dXtI06vk+cXJ;l6Kmf88%+JL7bu7&*m#zYl?=mFW
zVE{EQ;maqNwNXq~@ff%h;ubd?$VwGcL>kabz|Dp^7Jzh-*{5SCRTD=*fFhp|ka!*r
z6y5aep5X-x4@3(C1A<t8XRIKZA#uUQQznR@-hP4sZd>GEdkA=TnWLri^!p&~qQaUp
z0Kv>N9r7Zii;;VQ4Ih#&rrptgSBGHI;(HzHVO-d4V%N@f0}Xad77=<If44;l1!m*A
zq^U?^5P!Z0f+=!W@XgH>>-uOKXDo>2G>A%aBs1{bYXz0w#XLHqd>Akj=j}V1%8f*c
zUw3pB5ZZtNUTv*85ko+&OsVO*WHrlcWE8`h-SraIMa~i2h3WthEn5_r`@{iYz@s%D
z+^_VQW)W5PGEKL%rV@jEa<rjs`}{!oTxD-}HVApI`nQF1Tvtoq2f!cl>n@z&hEHHe
z?b2g}7JYhb`Jv`L41Oo@Ieht20t!`ZXWMIFuK`y^i@8WYKrJuO)j)$6)s+mSi1{sD
z*)HeOl6H?RSqQ@P1fWIMh4qUKlpF4UEYnE1fC1$fjZYst^T?0Xdf~cxq`LAR$%F&8
z*S*!BVITB}UX<+@<BV^`s^AHn8I;8CCShzJK<KkKh5@Z5SPh^zsowSo<4hz_SIf2m
zsEL+pGZsPtfHf2LIKqe^&m(RheW$1PtiubF<zgI%LH`tmcQz6v1Jb`?JsC*KuE1Io
z4$_yo#kgC?4n5S`TgP;;{zJeuKS{ODB&w=I6JLo?J1qI#{hCC@dMrM(EdG$%{C0RZ
zfF>x%JQ^(kc=#Aqm?A5M`N)kXSIszvlAdXR0Kir)4$4YO@Ewk9QOCC`_@80`T9vC=
zX`M1M6vFJYTWq(wX$lobfRF4^4B%vA1WtN)q7FX0Fuq{-;O$ZOsB5v6>T$MjlbpX@
zz;HOJbuhpNUaUNMQm?n?jlXZ`#OVZlm&qACl<~F>AVKhn%kpDJ9yJ6|8#{A9y1$p<
zN4<gqXf6clCJ>s;8g=@n*vm%&SQ)!vKO7Q(0+GT~XAKiI4&I1_7yv4S%A+U*z$kN2
zikDB<%U!IOKXe2ILA_$S0O|dxUaSr?0aRIQK!+I(pdIqgDz_D*K{=q8EgX?r?{d0Y
zJ5QA8DwK^MyFgEd5|9-aJ7-U`^9tN&RkHTwaHFM)wVEArtFW@GAm9msr<tzZ|G?^a
zm!qXz__M90FQ>yH;<jnEd)Jjf$$@g?APB6kRN8jJ^5~%#Qp~lror@_PJ*sw;cp}T5
zXB}*GsWx}1j!0?t4Y_+r@8$7ZAtoP=;Xjc9;ejg)Vxn)(+`jl|<D*na+XUu4LE3SQ
zMQPwR+q!=|f@zGkB&1WpsUp(UaYA5QA64n{1wDBJ0}CL9HESiLe+@C>G&l_g*7=Yl
z2aVcw>YTAH!0PcXb`Dgl`5h}Fix2KblNke}A`OHe&WCsG#BhaPe+=;?KM{#b?$8Vm
zuHfpNuzjDro!Or-!?6f30<9XFMFa@UpgC|ia9rUdz))Igz=Ce=y@&@W&SX_Vq`_Az
zmI9M{CU^_bW>_DAE?A{+i&Z*_?LKAjIiPuN`-3x63YNw~d-Ze@kp{wShv>VenxFG&
z5?-*~@&G^lHs!@c7~Pc_rL3yJ=^WRoDkiGf>jZ3XMQ?!RTc4U--A?|%12<)Z;eeCg
z>pEF?LKiQk_4e&}CI5uh3gT`haQnDMD<wgSug0))YLFQ?WHhIBowWyC-325l>maSz
z7+4MiggG9VBBV1g%8)~<pBSu5F4V0Q#&eT^WRB*tK?0LM0ftt0lF@YvX&p}@z(_!k
zXe6v#Kr|jW;T6SXMquI7yORj`jsvPV0ACgR#Rg!b+>nX~m~h%&k&LD;gziAar-kuW
zB*NNRU?5ixY(P%*S9Gm{0W3B7F8RUssIh3qcq;%(x-AR?m`E)Rl*Z}XM!hc@lRD0S
zY`YEBuHJc3iBF3>m21TFrYWf#Rjrz^!AgfJOX*N$BzhC7WOB13*Kq;&#$zBbI#fwW
zgKt5V%5<pmvIr|0K64wu8{2gQ9b5!<0r>|nVh1r>P~{9pl?nq}YXc}kBlwE3Bf-~D
z7=*vl7#+iJ4RpLg3sl5Iy+yvtHYAfeR8;f$&j8okKnyYfayZwJm14D0-DpDq%z%To
zDv3B?ve2l4VkDnulKRLf>1@YNnM(5&qc~=9h5-P$4S4f0g3*}8y&X%c35-ZWE^}OP
zdI!2Hwx$}4#O<Pp0<Iu5!|fP77&ZTlNg$d^U?p&`#45rl!UQU)o4{&k_|%@t{vuW+
zv_N7aW+Oo@jtNN!SFQHbAu}ThX-5dYFlba6gEmh4O!;jdt^APZwRSqx#y1zsuEn1*
z(hZye8%spyC1R?yfx-ZShz`(et<4W=KhYF_M$O2R3iB#5DGAl^uFzofG-fPi@D4$b
zRp-0(5%#KG3Mh&XTx(L7hgW!sY|9bW<VJ^jfo9rn^S56c>`;$TgF*o_jKp0qIX;@3
zGS~rQCQ%bf7{P!pt5y)N7G3_NB(3BK6PovM5qLm3ccOsMXZnwAItRIcrz&yh)#7|{
zMr_o?I&l5hL&B@@oMZ`tEYP#f_V%vH7-?04G&LUM(si{azBqKx%j8?774>5N*p2s<
zW>A2Mp`PH<MA%mp|4h|Xjk~v@6~ttB83HhAj_5;SfHp-$^$Y>pT{yU-uE7zw?Wo-k
zAtZ{H0EO`_BMPm_g(6FxjdPcI$NQo2Izh+4!%16EWtoCD9jdf5ZAk3p4**t;EBe1f
zl?3JF5RBwto`|iOb)XTLPaY`M8>^;6l~=}_V1d=0FR1%ozu3nWQ$Olhe{_aoW`~j|
z?HgC?A2&Al4vA%S>0c~_sZ$gEyG<Tdl7&kxF3_P$N^JKgR4F1J8jI1&Z{xQN)!O|u
zDn_4+vdib9?blv*n-aOC0y<P_npl{-#<yl%^sU15X|?<YB19!Uy`%ALTL2u|FxO{J
zI_H}cB@(K2&_&Aq#qL0g$b92D5y&2VX}&r6_F{mL>WbmWX#zlbz;QKxM8|4Rb0znF
z4JZ03_W|Im7?3B}KR(jKc%}o)Z`AKCD%p!-3?Y2$i1&p7j5NN_%3w`f0A8BUv}z5)
zn;o4r2cZCHDFM<-(8Fmj<W?JT15g5hHHhUu27pLPPsRD5Gysgh$>Ts+W#Ow5FbYKR
zF)a{aNWhFy29UA&mPO@P(W;GR9Hv8+nkXkUxONMw%nrE08&%jvhbnXGnwC)aLj~h{
z2>kUxZS{AkGE(|BKyK>k%fG!L<+%w}iuqnD7<zOyZ)ndqySm09;#sDtS#2<iK`4=6
z)<f8YD!Yk;ssu440T|}(|7v(^5wPMWM9`tivivhC9pF7!@-gL11x?lNj?CaKsIr?5
zRT4xbo(6p}WXySXpBNJ?u_yS#b9FjYNvhn0D&xt}cw8X%X_+9S_M6*~8L}@<7~D;$
zQI#O;0tC(7*VN+-kq=t5f$UybR0E;z^h14bk)SpJ3<G!*0r^1r3pG_UYR}Y(F_4w>
zX6`+ljQ0I+)zbIZ`x0WTXm*LP!-J2L{pw?^hPP|ZGlYH>umkE3+0}a6Hz!eIa|N45
zF0r@~Vm6-KW3?+)w<~QJU~EeYiKSg)acaeIqH}z^iH7kP6M<MWKH|gMFKO8V+Vwly
zdPkBLhWpu^9abIRUuP3laCW1O9`I#@;<U+f&bwbaez@dZE9Si7o+1mo|Ft&O;5u8=
zk-CqJ&Z|PSvdULqb@7k`+ze89CX?-83p^~9reIHFx`7WFOVmrpvyI}-4Ku_kcx3Ta
zt!LcqibuE<vqn5KkxpZyh8gcQj_{=(k;_lC!ygfNEyP{PwSDx6@MWX~2g7Ln5z$zF
ziG*}IS1G}iwx?`N^tek_S>|@sn8allxzEWW>v-vYm(%HST4l^#Bn~vYtFo}GisHZF
zDitU8pxNY~xERKs7inR^=(!nNxM7`saFwPW<A#?f-P7rk8&N!mVc)2m#XC34^)0TF
zeTo+e<Kc6+Qgr9=WUxK%elXnKE_IWuv=@dQD4yDPz@4kr-RYgX^ZJx?oxAfBcf8_j
zs{>%3VmJ4$b`guryPoWlAJi0i*<_z2?>OfnbK`Yi{cHDk9)9#j11Y7C@Y?sHM-Pql
zc$bH&;Zb_n-!J@V$m;}uJ+^MtbVzg}di&8xGY`v-qem|%y{1iv2zy4IgP$(VVryeQ
zd+ye0DQ*I9yys}$Mr>+wjG|{!%S^N)=L|AZJl-?*2Df;)C&z+k0+Sc6GCr}zGh52@
zG%b--oOJR@eKIeyqTVGV_Ev5`p4DsmqLbH^b&tRsuY*$S$%+a2JL?Pj;|tflio>Ui
zM!izIv;t4QzG`wzrg$#r__6D$(*-w<r7RvzLbFB2YEW*#Do2miq#g}D&VH)DQN$!A
z>vjFD;`n+C@7u+0p~AD%-ZOh1zUiItj&Jd9`|Kf+?l#@)nfh+_8fHFK*ynDzkMD$w
zZG+LhSbF1sUVvrXYsjbXozH`Hp8<B?|I1YdNJj+7qy@-c36Q%Pu;WgE{DT06R{@Ie
z1C%xb(1<`~kw6utzztRXKzhSm-8pclU*N8YK#jCO%`1UgHv_fr1nN8p)O{7G_dZa6
zBhUa5WGE73q!fhF4>Gn4!a4_;_yw7M=PLc?j?*A}DU3cjLHo8PpU#QPp%8bVK~~#>
zcWT7s%q;D*{8S_ptAqy0XfXPqz~XkGo&H1{f1)Zf*kA!_N&t!D!S=Y|Biooy!Ggt6
zU?0y<TCI!`@p0zMP#03LK@OAaov5QCCw*Qe81a3w!Gpz1!8xVTlIW-%W<-zk!Fxr5
z_jaE=`5?h}SCkT-Ddas<#KLE*T_B4Es1G4ZX@<#l*YZh3$ORIk)h(iN>!}FR^4Yjk
zIT|63!{8082dDDrnshfbmmHGx6dnvf!w3l>GE5%z(8O&a+G%l)=NVP(KrRb$yX``(
zN|s&FQAPuhkmaB}*e6^(JUHabrBeDWo%S~XS>0u{dJoOGxflXKeCnf=2no*qr)3tF
zj<1}w9}d1mgNS!W<!HoIOv5coqs^s5RAge$lt$}ntZJQ#vspN$vaoa-{n-k7Dgua;
z90vOkf-mtwt)S2xQn1Z(oHK=JLpvK$54A_dx=`r<ax>ZcLwy#$sFE1NNiq0SXWFDg
zJ4{16O}{E{W3=A|@<4%QP@xeb!8`q-Im3+N!{9@x;C<cjpk?SOWbhD_c=i=z#PI2j
z<IAUAD8#dO;tH0bFGPYzo`zX%ob6x!IB;hfxA5g@9Q+h1X1CpP4*7KSol`sUu@~(a
z>5%5TqtV1u!9KV!85;DZ60vJK?36zw7Ye2AiV7#4lHrRuxGTcSG-AjyT<O-SM-i)s
zq46PgoR5!GALUezSnQT>GwFgE$NQ{VRoE#DQ;#Ejzf8DICdu0)@0LZ|rMU=+!?D{R
zPQDkWh6@`esu>Lyb>?ZE`ZzzkC_O+nisMu`wj?uHwCB8v@7$8?P^oo^_4Q+)<epS~
z=PJEBl{iFqy15eBvMM?5<SB#9GM}gE-7i)PcyL8B{@`b)*#m=Somo2$wIt_mJcYe#
ziD*+fKEI+o*_|P6bHnG0%Im%hyZm^soqSMVbK<eX^G>FF!%BK5up^ktVf%<RH|2?g
z0lV?p>voMquOgB8glg|suYJ}uK2G+WSM__hrnxlpQ1_bq=e<jw@i^vZTD5N1EnhW$
zn~JuRmdp+Bw3>T;c;(b-@#&NzXQgj?>uamai|^lW=o22s1TaT3I;dFaOi-2i1*nc3
z9MV<XGu@U1zDlAV&ymcS)9+SXui)47jB@<GtyI%bd^qu;k`x+O#FCYJG{jSK-7Dkd
z>pZQIs7y4tU$)MeXe?v?GIPw@^hv!$=02@25?NMz8U%N`HP<E*&*|9SReP1b5!{n?
zBvDf;*Zsn2sSEb|a}OJr5Tl--_v+D<z7+iYwDjeb>-UN|aBJgM#`cq%GWjw5XJiTz
zKrw6r)0(R@r+q?Tr5t8`g)+st#~NizF6rI7cPb%7OYS>YnML<0%jqX}esGnw&(G|*
z@heyP!dZXKj+&OBw|(zJU1^0kHkH~9i}Mx_+0QD}Jv(;RQ`Cfj;ZQaqJmb<gF(0>-
z*`E9L(RQ~<$kQ0^kJJMe@8TO3TE5KPR!X5XOs2&MuLd!zu9HsCeM)5CjoUoIu2kVW
zc6JLEOAZj&@wH=3%6El!-F?7$aHSBz$;Fe|$w?U52;RdRY{2ngTi#@h@fqc>s{LL*
zlyZbL&MpJn!L7>*(^#ervb6@wKr-~5-IU?nc{4Vw$DBtNu|j+OGb}~-hNdGMamH_z
zpSfQQJ87HA_i$f*-BL9~pbBMp#L36p`bHYg@d(Q(;4Ip^tsJhI@Z7LEj!#;u?hV2O
zpXi<-ZZfQrYFD-Ly3nkoXp&vSL?Yv<l4p{h*6dYpPogC6sA|fglKGhP`>L*gjq!hd
z&a_L`qoLZgYcJpW1#vI?@dxAY;$Ns8_q!c?;z$gR+QnHS;X+juwpST%F802oyS(C5
z3E{l)4WukR)e(O1RZXuR+{7*G!EPOUo5|bQI?_hl+*|6ko&6u24V3Q;=0Gze^5?^b
z<3}WV;*#DeQzF?%c*vaAi1>XI%t5L~dQYC#JipZI)mPfFeMwYeZwS?2QnW*^*i_U2
zmCu(RC^)Cn&cX5xB$Y>o&4lk{ANB`r!`acm(K1xg%ZU+u1@ZDN7^dJ>Ma=93EkQUd
zhBzV~5c&0zLLaE|cF;YAyW$vHGA;f#?4F`Yz34<=f%-FZgv*eanBatrsk!@t%&AIP
zMu@ek&O3>;$*}~HZ%3|ca#oRIbtJ^N%DS;CRq3gJ!&O?#ejA4BEr=pc*SHG3M#t@H
zN>A}L#%ym}z@j&@+IoE4#Is9$OtmLDdcq{GWwxwIqD!g}r*mAhZwAH4>U@A1tsP-I
zGHk??g}N__v$?Rpw4JvO8H=u<UvZ^F1XdYusx!_x=?GEXpxsy3Sj-*BlTwev@AEyG
ziJVf4*>Q{`+0(5<@NKIp8Z0+pHeM(+iZfBj_!94N+z|e8q@BP03(S(nb#85`MDasq
z+Rac-k<Xq`xkIxoZgPPf_gSMc*}y}6`EkzTfulR0FbqTv))W_J-Zk{j@6#vdGk;{o
z2usZ|JIfSa`8Zq}5o_P)nH*H2`^^idJC=xdD->$3kv&jdz9WyRgXg?wG3FL>e@;)0
zIph5@S>D7AYe{<i`Fu|Ku8Q)<4TIS>E9f{C#}Dy3K1X0KVMN(bE4IKsZmX}JraME^
zpXiWlm<?mRkGzq4b}yq$<TWf-7FPL09eA>Blmx9<7-Q?xb76bvb4@zx2z!xrUF{9u
zbkDG{1Rdkd>KpN0S~tqCh1ZDlpE(@ODR?%)!A-pCrmkW@<|B6ZoN>g%z7GHDBWYos
zpE+yx8wu;=C!dtKb$c|WPb>5UoOb*O#|@bqGYjc#%>_Yh=NDo$TXwwqVu5Wg?gk%v
z<<0)`*n_HZte3Dk2iwHptyZSjaJ{Gx@v-Y;O%*Y&`b}er`lU-8Ex_AIRr6P2#uJ>n
zhlxt{y=JF3WcV(gkMD|BuW-57)4|jF4Wsbn#Fc8XtfI?kX{}Csi^TD2-iPr!BHs?B
zI^aUsijf}@GaVnDtS>0JywDZ++$zN(l;<j@6oiw0KH*@OmHjZpUE!GFAQt^3-)=ox
zIy9Y)^~F7b%LB!-ZWWW7r#MCSjkagzx~6%m-MU%2KTzAcDJ#n2S!1{qG5U=gyN%l;
zZo}fhayqXxZRf&I`W&YzoKG~R9@OMKd7Ov8$%C@=xrHZH`BL8)Tv8s?bN+a?ng^0-
zfIb=;102ezu8dU}G8(wh7N-QuhlnHURo=q7B*~{;)(<?{_QJO7nvFVGV#iV8a;qwx
z5dM@&THyw-Oc+r``0)1ANPBn$p)Rkft>41*tnJ4T25g-u+}d_hAj2%q!_kbxryC@|
z+x7|kSkzyNKjzLV%*}FK*`Iib%Dtzw(_-a=iMVE`U=prf(ou-pNs&<)H*2aUGe7ec
zeNoy+Zx6cMAMWhxE+YRvp*M|d@#LGLZKfI(a-R)j{Be`86<Cyqv1pQ)0-Y^XX#^hu
z#a|V;s-sm&U5E-uyo!l*(N^{%of73epgYCV$+sjHayZ~}GTo@eG3yw&zV`Pi6bm6i
ztmi9_*(`y_EoQrf8t6tPOp<q}-5&j}+lYfe46o&;QAv*w@QsQc^T)W?keM%$=tSj)
zr}ljXx>2dY@M^&ygngdR7%^j@db_@zZd9fjC$mTzHJNs$jxXiSxQ_Ewov~>DlKIt8
z^1azT6CPLu_vyUDveHMXMY11HPQ-<=j4SpC%fHNSModkbS)JM$DHb&?(8-qc{@!N=
zmBo8zm!)^MhQ1DtLMY(tMQj)Deof0vQ(Ch2G9)&~I>x8qx}(JI_){f9FX_*NP#PfB
ztT=7tCQ&)GTSVW^2xMUtO9e}7wBNFYplD85<aXSGFcwGO@RB4S%6=`cU4sZh(TU38
zb~SELPAPZ@-p5==tDo#Juxn?0P26S6aGRlXCnRcHeVYl#6)X{h@{AM!Hio1$+W2S!
zdbGA($qYO+utGh<WQ?$|nrO=ygSZcfhfi2|pq<YV%tL!&ISi%`e+UPvl7x|%1W}3#
z#-cIGGtu(gsB86L0a}!{W1{{V=+sQKL0*(RGP((kRjF^|Sh%E50`d5?o4k#dKp%Ob
z93@~Ig_RiR8{ijTBlD6)EOpwE#7IjzQR(QU1=z~7Vk9-%q;U}0<Tk#6Euykp%-|{p
zC1}WLO<cA&mhUf+E!ZR~c|IFqi#qr;+QuJ`E2J_kGj>WXwM!pkP@!vlo^5CxM9(&g
zPE<}_#qc^|uzAj_Z>f9`L!=o7)rvvcf||FR3UzNpE#l&%{i)zF5l)3jaa5Z`e4j*K
zr0D2?Y$(Idfw8x=c47LyK8i3_V$$ei$F@8pW%;&hH=2b{8~-~ZbdLnqK|(*zkm<5v
z8;OCt0)$!vskWv><2!UUAcHF%dv<p7tXwoig9V7G78PxE3C@;t#u_z%@RHFAhbXoP
z!%}aklw+VZ(9Svl5?;Hc6Hj0x8L<>$GzOwzwp6~pR#w3_juo(Q4uO{x1)GnCX+$0r
zHq-%O)qM<i&KvJCFx-WYzO&D0D4k(vo{=B{tXhiEn`huA848UI&=&>SPFhUPw{3&5
z;{5q6myB4@?a~WEvcm>SI0o?*usCF+O??vdU^nLI0iv6=)T>znGXx|IytEu@=U*{a
z5sZXE+Bm3NP-U_q?`kyvjDh@&lpbzMS};;{C3+L8q_&%X6T>dO_8T|!>G$wm1*;#I
z!VVko>ACwqZ}sP$?)v6tAz$E=%J5Zo^gC4P``QROIl>A7DdYgwxf7b7A=kaIyH>_*
z7BFv`o#yXFi6=*s<r&OF;^jwh`wkeNMx`hi3q|ToK3~B^yMQ@q?TT)ZcdQ^LbCAaU
z5VzMvsC8+Ki;QY~vi`i`?$08s$(V#uMidMsKy^z3nJeQlT@q0iiOvd>gEF6H#EA?c
za<68-V61qr=+AG6VM`6PbX+oyci8TU*7pG!<X^?2uDpoZR4Siejoz^bGy=!!o1eF+
zkJb;kq%Gg3<4F}UYLlHgy0jl6z}>Fs2@)VgACr&NLZ(=-+N6D+O=Bw4hcJv-y+Ys^
zWGjmGOQYauPzD>=n`w@G`L&0b6VC3H1@Vef)ab6scH5765;Q}9DNL4;)4>doxAM`F
z)s7NtNU^ms%8ss70@#ovrKxk5KbKtrm03`(?s5XFcD)j3kA~;OPjXC2+m7yB1&2M6
zwu8Autt5vZ%g|fJm?eWzD;P{p=@)rJ^9(3{1+18t6hB0}6}v;(txd6LM;k*j(?{7G
zJsnpZHi*#6-i_~~wDO{wNJVY_m&_Yu>0g(N-KBS0#)JxtQ;*|!O8T^~W^t|<SwI+?
z8Kn)jUp?V6u7{pNs0n*m%VTj~STsnu{^j{{1MNH^9v_Tk=&W^pw4{7wy;hW@1W4~B
zMidokQQ&Ep)up%w(r~=iJ>z9D6xA*#-=S53b-b)E0e(d%DoG$&bEiS;NEo%S@Bm~`
zPGQz?b{AUArbaGswS!JnevF(uU^2^xBg(BAu;7IQW8V%}9dm1z!!EVI`T|y%G4Su7
zd&cy3K(Rt+yDwIdq33w}P7OnpW4^$G;SOu#v*qoq8Va%tc~w#4Zo#FvWD#q-a%}R3
z5Kd5PJDO_0B5Y&qt+!qxZ?~ha-B<?=o&%D5NO$LBc3^c%Z&@4HcXe=vnCavZV~>#s
zJ}anw^Tmds-pw7?<pyt`0q>O{LO<`o0u}ny89{b=WuJH<{<gMth-e5XvLTY67VUFJ
zuv1u6&&*fLEQ)ujV<+p5yQ|T6+r?&lhdzD*-@72+Q|@D3k74?dR#^(>6nx0o({8*H
zExzQ;#KDeD#ynW<c<>s9^HGZY)+$vLeQ-5ep4s|EdZE58$oqf-)(p*frT9s}Tk9r3
z6EyVH!rdmZb@|*|sXT=&{^_uSa##h0A4i0L?J&Q09hFNLD(Ou*qtOd*aRwU;H`tGl
zbvek~C#WsaiAu0|JVCA~8ouDDg&(fkL)V>O;cSHmr8;d6K=dSb1iO@3mx2X6@s>1C
zTwnBI)`v9*-qeoAKBwNV9mPCxjFg<gG$dX-<!GqCQ2F+9?`#;u_MkVhdg$ezH+XAf
zQIRUWoEUNLg_Z+UHQf8fqGWx?kBgib{T!?)0BX%1FFZ^qDqE${mHOuH)~g*)5&?0~
zGMyO$ocvKv!0RrZs0{r{R4%l2w?}_F0FqMdY{)R=jW@#18xDDa20|G+`y`tu!2)iP
zj0y`6KEAOea9UF7L?uCD;pGE5QJJS8+(%H_HHx13sJgNN*0=_U$5Zri&NgOrqSBx{
z{5oS2f!!?XLBj&u20`l$VUkW%I=bs`sGb|I*1KJ<c(HqvsGK1v!k4D>E^zsDNFfzx
zQW&sjBT<ZzFdPGq`Q`oPi`qM`!H0YgGh&2U8ASQ8yaJu~c4KDmU*A5hWJNiFTX^?I
zv`v?_R(RG}Z+H|pWTnTd-mmAOww@lP*LhVQ&l_}2x>>M=&9$oNsFi>1ffXlR$4J2g
z#2Gmvc0L_l=4|2l&gwX~tWLQttBs|<v%Zc<<UMuECGa5|tc*P*QaAX(+YVlxsD)2N
z9r8_n{Akt5Lf%paO_#!*)<n@YGM8D$F1!56!HwuwS20>k(f8e7dsw)ti%r-J<Hg(z
zX9zULI?+}Y@Q^)G+bm6T5|i@0Jt-qqy*l#v*%-;0odRy9^!FAOYB+SblW!Q{sWCVt
zd{>8cm!3&ng-{y{PO<vjZWXMZ>>R+e6h*gRUzbgDP)g*G&ZdPWRXvLwr6Apb>!l{L
z3ei)$<gfa*w4&onU?geV5jTr7ZrG0<j!&-MX#l@*A_~8dVKg!nn~&l^1qUDO)j$h6
z+uS;_gxQ7G2*kTbOEW9PU)L9mJY_?qa9)!O5yhg**jf)O;hm5*xAbXhUUh({m7)AX
zIq%Ax&G5|PdQ`lV%udp*#DaH&Ep^ChgWBsKb*I29R=OcW8!HFLqUL>1IZMA*I8H8a
zA6p$Sdc2f)keKvF4QqCpb|A`BAKSKy5n2N^mtWJTRP<UKle|4QW;-}>_>C`MZqmDq
z>4wW2^dBCEj!cXS!+;(n3O4+Dvi~iYX{DTuvR-M`x#|$DQbNLf^!=~~IpUWb?U+xA
zR3&buiJ|EA(Y~l&3v9fRn12e#fM)u{m&>;ruYHZSWn<KvX$?zjJOA8ZZ(7i9OKG!<
z1T&FFEQDctKZJ*lQw|ti{Tj_nZ8td;G^W=nEnp}U*DqepHXvVpQQTys48x0RlOuZ(
zD^{<iX*X<(sXy(g+;4DpS>1}Vp?#423FBaF?@a9`$xffsZc+7Cz+$JY7#=moi<1~o
zj)tGluxbnHU<I4nzecx<>vZf|>re`%iidVoW7_wIc3L)ddN=8-VN`uWyN>GIO$zPC
ztWllU+B0>iXLY(UO+6(|_s;8dJ<#cUq|;ul(_<6bcYCe>X;a5?Q~!&m&WW|&TTKrH
z!Ui^U9=r(cKcu4_5~`}EdpAvIKwEcUZ`eb`x4V{Mj|0CA?)dg_TIb2$P|0T)9#6p<
zKQMm6RL{TqSr9P75~WW8Mos}NE77Q-Flbhk{){ei1-xx0Of@fhG%!*hh#b9wk)3HC
zd89k?Ds1$r?yIk1ukL;udAgxH`R3c?({Hb!;V%*4V<O?>O5rbe>Ajw4etl4HWFu_W
zd3~a=W%61$G^mBf75-8{Z~STVxN6Ir7rOHu-(KHrnY+0D##C>imtIY8dE24;E=}*f
zcFTK#jZyK4DFMBuQv`j|`iD1RuXpHAoz)w;f>9-gzv~G5yr{Rlq4&WwVlE=$ZRVZD
zTl80Md=3o%w5<2pdt<5O&Qf&CH!$QpJ6Jo<+k^t%7GZ!~-4TN$=@aGG;9@ffSCbS0
z&67(j9ByXm;=9kOo#u4klP#_E*x?K3?_A~m$Q_g97nPtH_Mj{R=qmBX472Raq(s=1
zyqBfy?n@jB&lfk24&?7n<9(UVL^mn5k@>DwU<IzAO9KUOC#x0gjD1hd1eo0N;cx68
zu2VR>^Q}Xp-)t1m-X}hXYQtW(V|Sdtakyz_scuSp`$B4Gv`_?__UD@}ZNBik*j=}-
zyWPoJRx!yttvcHu>q<PX-KhL>*mJ+WUh~1HlRcg%#Gf>Orug3P-22t!{?~VNW7>*0
zWABH4K00OejQ8zau=m4~-RE~I%+2q&4YEm!g+5m;!xex7pWKQNi3tDp^~>_|hDa-*
z&JVi;V$(skL3kWVZGYw})kjDj-?>WJBFk2K#`s~2XOrP~uF@pp!f7mZgWtD_<E~)v
zNcvqmSIJ=(WR{%XEoPrp!W@|Fm~l_)6027iiq2K;DTc{KCI!f?B~-EJ?WW|hpHso5
z?szm1fT;|1$nV+tGIX(B^h#c4f3EO{tNl8kMi%u!V{2SEw%$o2I!LLJ*e)<^-mw?m
zsY9|dI%O7*QRm>07%*24wqZuEtZ@(FutM3kxoacbk8Kh1Hrs-n@|UuO=pbdOQKVhl
zcH>Qu@&M1<k9!v<Wu*I*S=?$KZ-SJ2kJJvi%b^^wrX;?sK_(&J3*&T<@(DQVIp2lE
zNE6?KKos16|Kam5nfHdBmr(g=XqC$|*1XNx%F_4zt6jb3nA8mcEgA2)=L92DvOtl4
zF+@t<VeX*GrH5C+QjmfoJ2UN^1BvXZ`NQLwj`4)20mxZ=Txy%HePU{J3ZHw@0p3Sb
z;l3@;T7?MR=Z_{!*|(>kFn26TJb6Zs-%Dz_Gj~?FSFjW!TQd~Pxd~E^rLgFjAY)r&
zo^3Z_;8k@6rz=ogk5CnDm=l$CnO+Fxd@2L`5@aHWkxovwZ+MOyKw%!eW3{vG`?FQO
ztP^q}ou&o51wVFMK|1U@6mC`a9UL&;1S!ohw2Dd|6F<W}D;NBZYMqN>QAEmqwY%Oy
z2Pq#PGM(IS9>Y<bcevKgOu$}KT5z7Se(s`OyOOi8#RgS!V<^KJeF1tgd9^Yoce?h~
zWy_OI8^WQlJE7^1!Ix$Yp7VHagT1iOB29?qx1Q8zD?o=2%@Zf_F!|NDN+pM~C<ipf
zB;%25Z{1v92vCxbO3I@1!K3`IAkmXL?;a;?X_WFDiOG2&!E=CVcxZkR%VlJYxK}L7
zj)2_8X)ME?l^@e{3Z+OyK{5v!ziLQRj*q46<@|rxyAyY)7yj}8gTai!*mq{^glr|d
zv1TcIl*(QRHAE!KjD4%dl4NTvSt2_rV#bm+Q4)p5nyst}iQl9;r_QOf-1oWf&*%5O
zKL5e{eO>SEdd+K|4>3w$ZywEnw~O!zTt6KpDbVejhOM+S`Rg3IVA>%9+hDNm-8$xG
zofg8m3lRJr0eMZ?v9@4Qw|M?GI3y^xDTIwgOZ5WpgAd8sRLjQWJR8pRtU}}%1Eq1e
zu%i|Qd%5}~&SEEwDGIC2ksn9tmlFc)l?yM3!Q5EI$d2GzRq)dMNy!lsI=(Os$EJjW
zi4pY+%M=!oWJzU-x8#8ZddC?|SuN%fAbk%58~f=arsk6gZ|$O}S;#nt2|(dZ=|fJc
zjDplN2wH0e1J}m#q=vq!^~&C8i$k8Nqi%E>%H)rP+Q)b{3&OyU1`U1n7#W@?3QH&v
zZhO-kaJI@*l&udM1#L4D*H@<z;M=+ZEKHf;BhKn8_a29-GG&3?oj-AvD4xD7aus8p
z4+<ve(;e(aAzF-squr3`EUI;>8GY>*472(9jQ%dPyv`nS4)<Au1Pz<R=WZ9I$;IX6
zZ_XID?DUyop18wbW1DGX{rdE@@8oM}pHWYG(TAY%&V6Y7s{1HMd>}H*PjH4(%`FQW
zFd)FBgVnSgye;hVkg1q|7@W23$n42B4t|IgRd;3<sU15~;`s()L-Ou<-COVCK=O{0
zP_Zjq^EsYKnIdVR!NC2!ETyIX^S1mSa@!x87IKR?9X~)yE5nwVD6m1w1TbMVINB)m
zz9yLdg1S`@PLuLx3MHp$yMA)xk&MKEd1-T}XK<6?k_P4oq>9Cf1H3-M9jEqsxNi<k
zbbH?Kc4zdW6g#Qw*3Uk@H1DncVR*{Ir*=X@(znHRc-lIFnam~JUCkNzf$EV!i?hVx
zRdtJ<)I&`m1LVQuqx7Ndv34-Ol!M&$gvg4wWnoLey~xW;9altKYLxuK`gBsrz%~_)
zV>MEK=*m$~ul1&W>ZM58B7Vkf-wd%Sx0v&*V=lP^DHz|7NE4lL4uerHDT=Z%Cvic}
zOY*sjQ_^O6m80-i^6lJMP(ToGjNpI|Zev(dC(s0RT$znC3E8}7OP!iHWu&ViL<kN^
zN9j#x!%EUAboz&;4xAsPPbhWJ+h-Rli?N`&z1}AfIofVPeW5Wb{Fb!bOA=U&vnsc3
znDnZmoetwfFK_f}j@V%$n#G}&n(LJ%sX}KQq}!KH@s@LaQxJCR#gm)c^hJ!1X47kS
z?jNkYGINVx;}r2@hw7btRG@4*MCMR7U7pAavm-A=W}WzLhXe`>#a*=-w}*B-)Zt5f
z19eRxdD$@qWDm3hKfI9x%bV0X?vA<g@@y6Zc<rE?oO+B<9B=3Lz{<Pw_jN3LEPIj6
zdlgd3rMLpX_r(T0aI7Cs28)qD->=~-#y+yhr94D9kg{&e+P#QoRUYGeQPU_^KeSMc
zC=jUbZBr_qzN)!J(9HC035!|2oz9^t4qeyHJ7g8ub%CSM7pWI{nO=^`o;8IaQS;Hx
z%K7dEuCCGx2e#}W1DoSa!x?_hB=FF_O)}Qka#4!KT>aPHY67>{bz~apL6<)8)9pM#
zHtkPpzA9K(HfytP3o=WUzd)TcK^;Wus5z2J<AY_6eds};d_35AetI$LpeNzfpl@=7
z$Z~X^|0Gy4tIH^G#qWsCRoB&x7Rw=G4li!zK!dYKY({&=Lh^)>By!`$8k5dIh}u@+
zWUN1)p*BDJIb~O@)A2?Y_A)u0#w&3}4vrhPH=E_(UhytV1+wbYXeb_241rNM!BW@J
zb?GRmDacRnm@S#yL*5t_W#22_iD}waBb&+P_7#)9<lWqfJi&b#%ZumWt5<h8ns+Ej
z0c1u17pEQN34juu#NaFmxQFB*l=Ka>*6mIPRS!Tyij@5<DQC~3G9B5ecD9{;JsEoz
zcjOkzbP5Y+M>`fFg3;ZuA!`26aOy}rcQIlCW3&;A+US0>QAY#1Wdy?@xJ&V%;>Q92
zJgB<p&N_-oiU?BLG3Jcw8LG3?<1S;}6F2v|;0UA!n8wvJrimKHJ)>+CW8gO9mM%=i
z6C{limS(sII7&w&n<G3`O8W-cyI5Kw;s_n=fp&^z1Zqs~5y<Joj8l2s1DMc)d+9~z
z=%mFpSv+X;ir?vUkRLn4kc1SBR{s!<e>nh$6yxZ(>{ycsRDmR5ti*<t1}wUCqx1^%
z2RoLK9+>>-^Zdht%XZcFWrcfq>GEwkoikbE(a=TgjmR0uEXj?X#Hbqrd12;{=+C=V
zAhqdl>QFh)ayYfuQOqrI3FJ^@ajKO9n@l)GbGTZXIUA&t`aHNebGRSV^PDQ^wU5-G
zy-M3cLZC9?x!cS2YKey%5>8|$UoOH7y4iAy?mXnhg<ck#666oxE3{0){}KJtLIWI!
zpm=$k!MsCl9nIuKnqHH~0a;F|p96Pio<h7iLJ^!|PE1HX5oC;0xA#n8S>|+K7Ub6w
zc8V9WYZvzLR1c09E?EM$OmI!W=~zQ+Ibwuj7=*wYA`zaV=q^z~fjxK1-f@(_K6(Zk
zi+yR>Sl`Vc@zhk}dA!6+83`K=rocPzr|0;F@p~5-Bv+p7-BB2YP+hJEoD-RhD)A%T
zV~J%>u_Moskviof#U3g`D=YoLQ<}3viq}k<l`-`~uoUxzH2sPU+4(-WSW}0|@+?$V
zG(nc;sjOgvkY+_2Q|LbSNBaz<E@Q#CV%xn2jS@Zy2QICM+Xd6a5@z8}uq+ZItt|F~
z8dq%_2ikB7H;G(j0(Ctc7h1;ON22tMMDQ)I(mhEV0Hf^To;nK@X?ydYCfS;Y70Qqa
zmt3%l`XLo<jLPE`l`=8a%ePgWZmZ&@IeU4>%p>5ZWtDHlC{I4scl1=-I4`{Q)L-#5
z9GFP$x^lzN^)W*$cX81xj1CWv9Vi?psKLi|8YN(lr`XwYV35ZvDUA_V>FBIF8LXJ-
z^3QS&5UBd!T;>|3>W1^ILg?xdjD8f#?-R<c!6G>b+C~GRUJvPr)pv<wx{oP482VJB
z`t;)V>EEiX%kR^@!?arJ)jI-UXv@@{BrvaI_P<KdYfUt`=B0->Ka^g1XmIfme<j)d
zJs&dOTnxm6u(mw#*9?hp1vNe`1AB${Au!WE{<oQ%Qo+=2BuedjAQwh?JbPfXgiji!
zpAk!7qEoQB{!%pj{u0g9su|~F?t{+^LORX0ubDG4nNu<xF=KA#xI;6@q+;{V{P?pY
zF4y1-CK^ZdV5d9h1%&Biv9$50wHNV>8hq?S1kjFFA50fbCC7_jQ)fuC{iIQ{;c51$
z^QU-IliD4>%S%U`Y!GL~`-7>w&ho4pzOtR8I^)VO$E>S_u#o7sIQg!2`H1fOch)|S
zY<9de4EKtjI#RRltp=8p3fg~djDbq<AS}NEvT_TyO@K;e87pP6TA}Dw)wT5S6n<zb
zHoM~?1P)K4Mybxh#tV|McTlp>@<x!8l0dCkPO?6OwILV-)%~K+a%CJgQo!@gRGGaw
zVtbXvCBeewdXh_OH644>)v3{r%7jZed_8XQ<cU!RT|STi9!BwwxLC_{rXOaG2eRRv
zrR>?<`eFCiTpf}e?~+)(=RYYMOwBdAv2!7l?(8C!R2FA$g^_fybHh{T^nN6i)q~N}
zgVj<n^TJgwb$Jt!_w_hFJ?#;F4PfPdb}cW8Arw<Lls_I#rDaQWZ{212&VRH!|52T?
zbdht)LTxt5<dGq_Zzn97mtH0qHft+S$!eo~%_GFpH{!Z)%v~4m17UDaFrD|MSsci8
z>10+W)m|TgKwHKqb`)A()DLY(DzClW%4Bd`^OA1#D?4!dB<qD0%?sx*9L+>H6Dy8H
zdRSbYNv6?ff!z19<*vK&JZPpbC(Xy+$e9O=18sSlm)k-5M~PQB&>X>_#RQ`+BClbE
zp2ks}CcFt(Cl*!MxA5pADEgi5_wFAY0*pHAb0}G{1nM>d&%EKsSvd0JXyB+|&<<<F
z`J)j&M}y+thbH4e<#1yoU8d`ZKs{{%qhLR2z9{K6{wKV6U9>yN1P_M5Q#`=G%=>Cn
zox5hicwv-D{u=UPa%|^7?Bk;@0ls<{=2Y_;(a)wC-QSz7jY0<s)K0^ROR(hK`w`1%
zn(d=k48~Xi7g0-hk-cnjjK|_wH#nZv=&}^y_goip!-GhVU0xrp>@YQ2w1XT{M?B#@
zHDjuFHaX5<FwuzpnnQbBOlZ$6Ka4tg*3^Xyg9F(s2u0&{K8|~6Z8+;HTnl1P4q=b5
zyrH{D!yl<`?GnriOS-z_$QvoTEO?(6G6ui0%FjkzHMz8b3A>S6JD3`FJ=w1L?MNiM
zn;k0>Ei{HsS~+~}q35}e>hXuiAgATk4%tCu<WgJLQ{UgX`9b0GoVj@)l+zIXu~}Xy
z`Wg0!UbVB>tc6DPS!0$xtCw9G8I$C12Kl6ZJeGYRC7YE6t9ObuIg_(!MX-p43OjfM
z;06X{Vh)pX0@Pt+qpYi$bmj9*L*7D*_$!k4t(9Kn1##qmluC;c;8C28bQohiZgp*)
z#8cfwu#J{(!iNXDc+|<ByPBYR(JD10rLguzA)|XfY*6Se;N}q*9`R9ei49gpUhP6F
zp>5miRepsHpSa4xou*AK`Ap1fJSh3SAP;Y0W;=H@vy){b{VbOD{wUKFnyna>W0n;)
z=~w(FrCjV%_R<Tj)f9e#c%gD$sKpsB06N1VEAZ496YXe)ppuLKVEOTvRfpLt+=CgT
z@$|S%;*oJ_@zUS#hDCGG$@9YG?U>z2=yc=Qt;P5;Q8fnToVo6m5A>_v^S{r6muGWk
z+i=!ad`NVt70Qr;)C1@);JL8~#zZNYBP7&qlt-R~iouRG7GQ>!=O1|aVDu6f7R6?W
zzjG&5o3FoM<M_?0)VNL}MTw=JD4?fO1{Z&pDD9GVB}yFojanB{@DT5#l*5dk&tb8s
zD?6k&7%x1AC1H&ooUPXzYSu(kUqHu?5Awg@r3NU+M0g86d<o)7eRwdeO3XhZ0RRA?
zC?^W2gSUXiyA&m@a*`r%J2|eEd85&3>@6Vkqa!cvna&r>c$T%}6(7+?7fV1sWsnUo
zhBd_c1(I9Z_Glk}{`=~8j%a`{;~owxoBJtuc(ApFrL`q&wcQbICqXqj%#a0hb*yk*
z&O0G=d#mG-1ni+F4_xL_+iYhOSBrGk6ZTZ<wliGe@&YG#i)YF?t<47=d5ebB2X(mV
z65sGdlDrzqyfKDmJX1T1^x<O2>{e*Jkx9sZv(+uj(R<PNal}?i2kvp)P){mJ(oPL;
z4^(BK^JuR_aBnINSFtVFjTfTh99DvQE_<@;#^o+)zAlMTs$vvPf7-)0XIXKXJtqPJ
zCB4D@4|?22sgnR@&(N@X0#mddc%6i<+!l&@*rb_t^uX}*cjN;%RU#rDJSHJLb}ATb
z0VHi<2bp<ZsBvifn~evo2oNbs-wnvDZMW1IBw8KTs626S1V&KiFC_sZ?O4kRw+hAS
zap)UL!LZ=-1ZalQ;?UUT>!UFr2S`q~6DdktFj?@4_MnW2?2m$SJhQ{g0+mVESJYX`
ziBGYP0k_fgJ3Mpkw>h`xllhOV_u)I-@hlpt0#kO?`)<5mX?}ep&^KfxWhZucG;X-Z
zJCmI>U}jP^B7NH$qm{T|hub8fYTN_CVEsTrBeV^7GqE@9t#E#|Jl(2q&W-Tj$JfiO
zzL^tv`!T~~CNOD!d-PP)LfFs%C9X$3C|Q~(<qZC5tv+|Xt>WFTK`Hw+S2cbB`elU^
zt1pH~Q7%8L7bristn_MyG2>l~<?5-Z)wp5O_^%Y@X5hvK>tft1-7M8vBhovf*FU_T
zSgF`Srm7`n+?+mOOPZ+M?m^g0AKtp`^I@TddHTtROdi2B)|FN@9YB^Qr3Vngp&Tid
z*%(I6spt=q&T5Wg60@pnlOjr%%1lZ00D_hVhEw${)1p4f4uFL1_*bryo@zBhHm^Hf
zd6%oq@5$6cZ%0`WxyoCIQWaakZ%3XMY`;Av-57QIGgqm2#P(5{V`qv=Of^>L3UO0a
zOE;cV7eLco;CMr>WaNSW$_Nl5zxc#96v(L>JFr+Is1qp|NUcylfwli&RUfNxzPXB<
zF~$E9CZ~o5o-lB-K%r{(ng5Pq;Df50$^(_IntM+>w#&b)yYzv@>PFS#XtPamI+E|=
zvJCLBhH=J;Soz+e+l+O`m221DP@mk{rd6$5FUX8_j8jy7;D^WGs|_;pfAeqyAinRW
z0Spj21CWC^)7qd&Pfrc|HQZT=L{mlYP)5?biG%Dy^{WophOuPaiUV+*CH{Nv(VfcC
zaK=an000K>Lxr;zxA7e&*Vj#DSjXv(J8t^hH4E&2dz3#+VjJX$(V%4~#3*a5flLqX
zWlvU$9c*+=oY~NIyk=n?bt*}kUG&s-YYzF#^g3Q<$EA-23<_SeDsDfWde)*{Fva#A
zzf-z?yFHL;1=oL=#Us@Ib^MunJ?G4Do;@eh&}Sy2#9~yb%=vWE@K86Kd9ce>GTsiC
zyo|szNm)1KCJ(b^XGAlqIkCm*9@)^k@R&KjQC=j!dL-Jl7#OAKYI?P2P%LK!VHYai
zV9UrZhni-D%9X=o7^TbSS?14G&F)0ISHC#Z?piexm}+*wKF~woaaNo}SGi_=Mf-Nc
zkQrr7-N{<_2Wun8?d~pb=5*D2t}#9quqP#bsS=f#njkT^3E_OOu1f9Ee0!#|)X*;3
z%;WlIo9B^?%E=Y-(yk&>w}){G;vOA)N)EBK2-S{7wOcb(+*T}k#%sX4E$<0sikjzL
zX-_Rb<khRwIpO(m-IwtO=L4WSn_OSxLujKhB*3fR>Ku*96HAy*G{`)Ed4K5iN3RQJ
zF4t8?drmaa-0iovth<sOg_k9JIX+3|ZfL_q*7r(#=|KX)?=H8`SagN*fu?nlB{m6%
z39So;Zv@WE--OOq${D4TJ$p2z5U`V>U@Rhe#cwu4t{cgt&%+WaFf-p2Nu%JNtpmRm
z5_Xs`3J&R(>|$CrIMR&y#8BotL<znnI6`EjVpo(_y2tk!t~^o;x+)%ZRHj>{Rk&em
zP2t^kty+t%0|bs*2)sYL{P>m7+;%tHquB7cCyi`g6qyO`(`S87-fLw*qGJSy##xPR
zLnM;0w8zuzz~1>Gif_?0GMIK4s;!YHi4dt}YaAkvw_RAx*@KW8r|!bQ$tC0)X*lT6
zR1=|(FA%TXYkLD%=Q5!Yj%pV#HnEQ62Rj0MYe^W8VsDzjaJQux@w(ZlZP2jcK&d)n
ztML*6o~%}y&*&zOKGcQTxu&*;i`^4VD{Q-ZkWs-IVhDHyGr*Zo`K~u9&q~{HAGJ4B
zmIj)s3$aKHgsMG+Lk|GeIRg9iMa0pJ2FNkiJNB%E`ySz9r#-l;OIzgY26Te*$*2~T
z!uXMmjeAa;3cLF|3Mk;g#|T<Ri|1eRoQpDGA@{J!SZ{Kzr;pLOK+g5LOn=ep9fW+7
zpT`)RpgK^~ZWzdrBG?ry?qNzTGp)&V`PgaMk4s&WXEDj|rA~`GxwJNoN?)IM%R7DH
zo@6Zeyxx_gjSQF@!ZNEgbe1R$j)us+w4P5Au+$=Zn+1gIr$cCTkfHp=?M6Z6(paSm
zr^4<TsMXt^q_^|=2X~H<J-#S&3MR-;rCi+@RdDJMY&0i_R)N*<PTd*d_mQGTNB5Wp
z6|H0|znM9tVO5QE3lVehMT1d%=IJ<1U`1vJ)#31-e0}fR=67x%DTzK(*#9K&#GBhT
zo5@eHQo+!ZajhmnGX3fMj)+Co2sM>cJ+JBTF1CMh+j1fL`OV<{MXD~8JP$Efyw=HJ
zzUvR!@}>Am{O~j%u-cMx>f~00P$sJ$4XKZI{QwI4vJZ=5w&Vto12yWxsYp`WkE2K1
z^esfn{CI3^E+wZ=c~@65QyQ1Zg|l}NKnHO}AU9ltS7<i5?{pXl<Vq?L>JED>r7jaM
zO`Yb*BHSeL*5iEb&dZVT5Ei~Ru*7KuM0tP~+J5q_aUi|qz-?A3@oALw8OW=3nPxU_
zTfE=Jc#D~6R9q^&hz03+LV2|xCWJaDuZ0cI)PG;JjcW?}=y4)wf>rp#^j^b!Tiqby
zu!Z!Y9y+Q#B5c^F*_=d!@+j{sroy9KMbiK}-84oW0<ZAX7Cky$=>dQNsqh}>2(>4p
z6pV*xE2!%|t~d!eq?^kNs~x>V<A;vmb{%NdjA~_`B^ei&ZD~GtwCuX;hj3buMrRH(
zSZz(+F}+5eW?eoQM4&&#bC;hhikT$EwQfqTVGwpoRW?jw9!h+o!d^<LtBom7X4RQ=
z#`5TkDK3Ue?ig^CC`=>7D#f9kT?q2U{4%xTB~p4fdx|H7kVJ($(d^ECsAW2Jhz{h8
zNdiYj%GBzOlMfs&PUC=CYY_z({hwr&js{%bTWvJZi)KFLH+bTK#LEd2)AUucM~Gvt
zM!Am|op-cenz6SspFT5>oNI25J6(NmnEkX=WUWD7Pw)Nb!?BJH?}t|FZy{2a&Wg^+
zz8a$-%bBBDgjrY(Z=E(hP`~&j*p+>dd)gBR%TUw>g>q9l#S4gyO#7Aq80Z#!hpdK3
z{2jJ*H`{{s531U$gPKQq&fV*6baP3RoGFlrDC<zdkTKQzzh;otx#eKJ!e6z2THuOL
z`AzKk46&0t#~=CzBQy+G`K#n+-=AuIbd?rt;T$k`V&VSt2HLgKn1Fdl$=bokSJo;E
z1Kzlut9|+ESFUoD7OY!mM{Xo6|LkJuNP{IewNT*wQRvn6W+GP^d#-LA2Hj{g2wYAq
zshgC%y3yqt_zPDF2_?71))1~TjXkw|z#K{$JZA&_FwhyeR>Imwd-m#wp}D~KN_3z%
zLC`J2(~-40$@;eel3NpEYHQ60>Q~~3MkQIpM)v{L)mv9TzVN|rK5GbEYk-E*dBK4P
z2-|NR;1~wf&WADKh7Iql+qC&=o5T(ZT&sAK{}_AchUEi98k&|w1VyI1g95Hob@$7W
z=c6EzC~aOk2nbC!fWq~X&^x22rO;|iL98_>${Nc!JneQhDWDBaGL4p`2<Fob7W57N
zXekjh6>R?8n*V4p*+4Lj8G64iid`42SQ7$UXXBg>5o!xjkq!|%8gf9Moj2J{mkq6-
z9DKMfxSloSnT*>BbqazG|4OOOk#+7vx*>YHVU@geo>HOHJ(mz5cBpSSTYh+?N2n$!
zERrPL&>4MRgx%X0?F(Y}^Nnzr4yzb*x0+^30B8tP@~#+D+7Li;%#ja9BQAj=OYOW)
z=ZCmN2F06%J0*u3<OeIZMMTg?1x?%6Nk@~jMF*@$(IrP;t=SQIlgr#pIIAQBzA_q3
z@Q9`wh{l*i?T?JA?2WnZd#)rdhFd<$ge~02H@4CwcDgj?YH#dg-x%-mb7pqnmT~A4
z4T;TCNIAxE9IZ^GDARK^yPq6*8X0@RIiwR5o9c^hILe7{Loe#a7Usv^YKvXVkC{)t
zYU+&II(l`x=E{2Hm3&VmxRuF`s8Qme3-Q)(Q8WWcp&2~XfT&TTXx_r9b}IM2F~wZW
zze*Mr+`xMkqI-2|`U;D0JjspN54xC-1Mz(9JlP_bXG9WU3SzA9nXVuxp65s@+JQN9
zc#h#H+Uy~2bcPfT`{luxd1qn)QSsciQB*bYCJNVt6n0{BrxUf-<E!Fg_RkRCl1XwK
zi6`3=F{Ym51S>OX8Nu^ZU3BggGI|OmG9DL`g4Gj@T{s0rQAh4w7d?gw1asOHT!)Kd
zPASBXnM63aB=ff=`>+d&If8S{m{e9|m7daAE~?P+L9&cN<E5(d*|M0yMEhgOL88}y
zBFXs|uLaz=))067biuV;(bSshb4J&bqc5iB>7|_XgjOTTbx@IpnY7Ip*v8?BCwU=>
zgQ@7U<hu5hVzBo({(9lewZiq}TQkW$E}VysrdGG7KWZ14HKx>AG-~jGj$<?C+B4?$
zC@x{r#`O3{*fT7m!b|khMP1T|3xWp=qQkGJ&e87#uT{ax_T0=jrG8z&d|?K<g~O^W
zLEPY(jQW{O9BGcWvYMH+oGF=l9#F21G|CR95q9jHotM$|sF~iF4+^O@E^q-V{#;64
znLSyxWaLXY#smyG%Q1wvZJN3VR0jakoP{Py<)9Ek<2VXSq|i74WQn9$GN#ttBu_EU
zK52)Q^2`#w%_AIrbA}|FD*l$Ge(sz{wu&9X8Xt76JzHL#qPjHmT0D6z66#1`^G1Hs
zC?y3U7FM}ROIU<@wz7I8f&ScyGg%^v*|rEQ`DWf#4)!!+tPnsOhRUu1fD%yI+XUJ?
z3`iH1Jxl<lp+sHuIdf-o17x8*8#@q;7kMp?F@UOo#){HSD$dG;I=kI6VwRIPnkU5S
zM#Y{YPrjUEi{z+MNXsI57Y^)LdWcxovnLXj0P<!e)lAs!lDIpLSa5@}vRSlB_a@}1
zomshJ;gT&RubFwHCvy%D9VbKzWkU(2jLtx&HGQTPs}d^3qK|$8x&&Gjig@qH8poTA
zBdM&tvNI7BwYCtQ#Y2ON>@R0QdB%HdrBX)18HW)R*W($d6bqZN#RECu7UL^<aH<xv
zl&4s5c_m~V4#`|pu0~Q-PeUa+D~g}d<k3;_>2SWqnA*r5RwOAwm{e*>S1Nc^Zg*5F
z*~g&(73IjVc^MiMe8*t36i8A*S&OSG;VX+TyAzO2o64`EfQNbm^yEp(F?-4t(AIpA
z!WJAwIi_^bx5%{C*bPaQgw!7(6v)Tjy>v;x3wyU5V{J_jEw=@i6KDyxG4GA3moPOk
zoY1Wvr7kI`buA<lMYAbI+W^pR02E%3fnJ(p!$#2v&OtYfshtS4OFhu^JygZo)C>x=
zX_z>XIjdRQGL}x21{^pKOItK|zf`Q&6-=9k1v`$>RuzINURL&g;5Oo{QaB%H&;!lF
zfHsUl#9U&lndmq|*ajlzJ_~&&Z&0hQoq7hGwOAHNRj|1TneBjHG6vP!g2S*-Z(GQQ
z6wT7|4x}xi2I5WSzXIP{)B(ETwg4dVSUnpP=o>kjE;{Hn{gOTms7?vYI8<|qpk6hg
z5@ic{&W1xFi<BKW<;mGl$jfdx>OsdU8!T-@DWz%x{ym~*ClTaUN*OB;UcofUn?SqZ
zD#uFmP#91%fU*nGB<HU#29)sDFLjiH4lI)M>S!2bLb>i2=+Q&DI7+JUSXwG}*!@i2
z4#q89rmN@!6O9MJOHelexh_C(7DKLEO67D0Y>6ayBUI@C?vOjwJEDwRLLkOS3P&WA
zSufGs_Mq$WTw*{|7hAlEphzN=dijydnNcrkP+x0?elQRsEW(#;f#(G}wh=oW8yNCc
zMVdl$L>`W!p;Vau(Cxg^v~r>;N(Opb+BRNFnSd#No($@uqija1*rFj7Y)p^H*xq8u
z-{GL;1W>~w`Qm-bYAp2WBKZ=E=OdEb+Oet-0P1)GCCqDY_YhN^<fx|ZYjdib2<q$0
zj|>R)+lvqs21;EA>9X~t-pbZ8(b3#PwTaB>41R30NIuX;eF;g9NGL_YO&UCMl`^xZ
zF0rK`C^W68PwvaXctN*-Ak#Q#8n&m4t`vo%=zj4K?Fki}jNC$Dsyv{&#)dfwP}h6P
z(|G8l7uDj2{1rrd!5Ao|=PALqy-SMLaS`qgsqsdX<is*=Z0+=!Tu!W*r)8jG8JEv-
z%o49Q2FW!&)7{iIzN}I`TiReuon>4wjs?37F?Xhw$Ub0Z4?SF=oKjKLp@Wh0UNq7@
z11ay(CjQQ-FiLyQN^~TI(E}h4_R{VtzZ=IyMRQm<3Uyf@Pd&qxLnzJc%;AiohaQcg
zS-8!(XO)}zuo;^>n?x#O7m8@&W)m~2oA8(0i0%z3s8dCs#7U10M5Y0KCc~_S`emT8
zF=g8_#J`Ios|T6{AgA%-xr8a;=f<V=;PxtmVU?6O4Ji60I<@ZuY5KyfJfQuTo8y_F
zDU0N8bgEP7po&WrTgUGm8%}6Z06TY5h*Lkel5TLr?(ly~wJsVh!KuX4ppV?aPqB<E
zO5g?@w448>9T(FkUH6^<s%iwqxG|*xs&Bv+$PTW(6f5O7_e!|{%6Elv0B|dTpnT^N
zl@kh>*Q26~O@iHT9q>h(cc?l_DLWzu_2LGz$;uRXW8|g5Ekvlb^i^&ETfBZj(kwLj
zc7c3v!A*|a*;co2ORyDPW(+N49IiX`hCxHQ>}8$%)JG@83j9%@Vq>7Pev(AmJ6oV?
zAn_FgHb6Fv%+Yoc9+-N(zQ_aZ0+6R5sf;n*C-C3^u2&XYkf#U=11vPEn_}rCHO!0L
z07K3iNbU$Ax3LAEr)@h%0DVwle)QtDV*Czh@{oqOGA-34^nt_v+_T^W4D|dJ$feRm
z?WG|b6cCuoX@exM?xC4<F*=qxW{l+z?J`E8fOA7eipvP&MFB$%bz=gEAyL@C7Qz-f
zqiEmZUo??tOT@pZ4FDnr^b>-PK;s-jOkp)<0%R<8UjaW6Zc@~mQq=jP=rPBgV+MEn
zqwiSpu$_2IL_6<{KFyVTz&4{%DIPEdg?T5%@;f4y&JP*sERsJd?qR#ie+)rkiCHpO
zBo9?ymX}#h+q*0P8?iw$8%T{9jk?<h1Cv$TC3co%uFhOF6mM}i(uE5(YlyD_HBRE8
zI*5|aBB&0WsundzZ0p*TLZnaaloi;oni$SGjOn->XL9P1wl4?bU4Y6)OQ5P5N5Tr9
z+Dfx0Gk?$;j^_v=gR>!!S=DCE8al5kDa87CZH0Cs#U03UT=_Yz%4`QB!g?W?q?FX4
zG|aZt7*$HeNu*LsH4W>@7A#IVmJJgG6v}{)8KJ0BV1U^aozbR@<(ya8=CM;c$9eY_
zs98oBGRL49-^fAdx~qCLs67u!m<2tk2zn>a`&<vtR&2D@Vsu2!nrX(GS(A3lsS(U4
z2em}FMZnn3iB~PGkRQ2Jbu4xGL@mTxY!RitXq~}mym)A%baNY5sz0}QYhj!D05nD#
zx^i{2M2U!;YjB)hT~^!KSs{)^>CcQPix8&n$ugWH2%v%ZbcJVcI<8%Ow{@~P*<@Vj
z%69U-RG;X>%E*-1QucLefsTt|T8}snNSb7YbR|FIl`o;KxWpZ>y_yG&QgqW1+W4^C
zX`|}Beg7oTYj#YuKs|ybJ@Ijy_KAb&Gs-m+{8-}wY?lMY<a3-@mo05&j*D%++0(VI
z<D`~*yToW-4{m04$I~BQxi8_tYBY?HYcV~|eqb-8!bbiz3E$c^epv+D0()<SNx5nO
z=G|niE(NC!qHABn_Pu5p)}!2wb@{+qJvEc4WoCWdSn7tMk6XhDG{-L<JX|g%<B(8>
zkqD|rw$>gM-)!-4Oxg*egjsL-E>AwXdGMz7N58c<!wnHIoBHL)mf|NX_r)DnMOr2e
zbdYjQ$c!~B1a&V*!1#-i#kiR6J*UAUjvK)$hs)vPkmtcxS;;YbyO2$1vFl^8w+7nA
zs1D+0=A#E69=poO-$s}aX|Hb!R+OuUk5l{PT8&YSJLY&W1XM5Qi7g`4NvY)CMmecd
zNXL^$i_4Rk>b`t9BYw{;c%G7#|KYx1wtxYtM*4%)zzHf5V%H$5d&|QyN|0fxwK#^M
zeO{?s>Pd7LjJur=axhJ1ELL{W(Oq-hG5b;Vr2!Nvc($*dH0lTzx3@uTP3bKD!-VTw
z1(}n;*7o470<!2G#qOh*l@_M5t1OP6YuRsk(r2=Y$W@-a0vnU!=&$qDczKKVy<a0J
zl}grLF8iX4#^wGqnUC^sy6*4DJ08SPaJw!r`7&j+ebnXZI(NzY!j)HaH5YO(y*<X7
zjRtVH*4&yJZt6Y0(EFaxCrahH#bLu6cL_0@9>RoX<yy+rW9VDoaFyei>+>D1irI#q
z<3Q8{TE`az$U<r4D0E6rTx)82cuG#^NH;^OL;6M4V{R7u_dMKAS2|^1)lqc0b^Y}H
znV7K+lln`#7w%`bB;8STy>oZ!zH3PXg_2uYt5B_5#bX^M_p0ZoYu)d@3RgON?{#kN
z+1iDNO6PVSyq~H)*RVsOjKot4*CCsr2bDcqSe@!TT452&p6$YUb)KD)t;**g9e7=L
z{;?XRidXMJ;Rjw%jSi}KKeKdt;QibtLgm7sQ{ICMFVD5A_ze5Je&F*eh*H&eG(x!E
zcl_!>)r*tYo$4>Xz8RtFH<OoF?>AS{s(R_o-PiS(78)qk{FjJBQ~#C62h{@JJ$Gsd
zc>gLwEpX#?UPIuAg;uqokMCbM1null+5*Vs5u_|VC`v6`(*NTs|0%9==YJ_z>7?yy
z_3XYyb@j75=fYf1Oe$L5?|)Y8)8cCV?!IOH+Ov`%ayMIYrK623{iPAwZuZQzM<2@d
zmt75Wa}-oM)?v|Ke!a!*^#0mo-52^RZj!q@Yb#kjN$Ri6({?{|q}Hmxy1%L<%-!u2
zRO$GO{{HH_E$(N%A=N0r{~4K8)=}!`qYz$ErAbk!{wRxuD6Qz|XuDYLl-Q6{SM&z1
z9ACI{*dJ4wfr%Kv*f_@>_K&}}7;hGzkT{s&=$>fyi;?O1jgk2o$n;7%PBb#V1u`#X
zINZrd7|J*`lyQD3;}qfM`C;sZz)YvI%%rTW?By)i;2gJ+9RF*%&DFW7E4iNGc^-s3
z)OcP%N<J>S!25nd#!A73(c7Vgg+*72F0K~&r`&l|Uz{~o9358@kX6z$S$6qadGKm^
zXhlUub46ZqW!S#}Wac+qFKKvD+3<7?mwF%H(}%B|!`~`wOmA*(o^2_7-;(p6Gctbz
zWcCcTeq&^I{LaXH`f6ffYI5qsWdFZ!WNvP(?d<Fj7al-6fRA7<-BK(*1jM-KL|bWQ
zQv@BqewuDsR!a<<?3tmqvh3EYaLs5gz4Dy)1QD~_C)&$zbzYZp=t$G6$bFP5e|~nT
zy&~`NO+*M4w|-@QZ?<m2o|7Gw1yA#gv-Q*Ut8PClJX&#PxTC7@d5LXPG`B%@(O`x1
z)7vLItM9zLiyZGrH@I6oT<g0sJKTA<<W&QT48n7$rgXF^l2OdMtEOzc6~k|kap+$8
zWM{Ih>qytVir0^^nlU_w?^n(|%{MEwessTT?s=(0XU5^$>NhWI&d-fJs=d4L3Ks(T
z2aL=Kk^es#nbmk>`O(DR8kwCU|DKUqwQFSN>>8OyoGHIEGJ8e-nvto^Y5GFSv<BR+
z_sPiY2~Xo=`ebAd|HR15t|ZwtGCR46M&@CGCMHr{#R4tTt3t#Q>Wpff@}X6cQSm1_
zb=$aXqLHcf$;iyj^7>?CR(vutyZIc3J{y@AIO9GUnW$fk%(&Qc8o1xlUyaOTj9-mR
z)?bWFtxra#R=mErJ7CC2Anp&0%ueoT$Uc36Cqti%OxIl_la^>?YJD{_Q}R8&7@2Wj
zjLc=euSO=TU_oUQMkwYNBQyK6ky-IC8JU3J8JT?F8=2F;8kr=&7@5FbBeRBRWbXT`
zMrPO_7@6AN8JYdR8kuoNzcDiHIsY?8rscnGWMcoo$n+UF`1g!VkDnTukUuao7d{!8
zn*Tu~v*^!^%$~nwWJ3Sk$kh3JMyB8Yu#ri-Yh+&e-)m$F{F#wyzlYlUf6U0FkJ9*J
zWQz2Lmnr1H$e$eFd-p}Y_DYHNcSh!Ok-ubQ=KR#ijQN?7`GTOJ6hoN1-c^g(_g9Qe
z!1qR`-?v64<@ZJ={XcJH#{JC5%>3TS%mM$_$jtmFjZB{%ssFf<S@744%<SJ7nb_})
z%#?49OsTI%CfTl$Y5QL=GJ!ubGC{vHG8w-bnSB%s{CaXyWD8`PXIwNyHGgMh>U}XX
z^S>IIu?V`@Z;Z@<Z;VWzf7Hl~*)=j_{t+Y7y$4=@OakEd*NjZRUyaQCf5FJ)-8C`?
z|J=w#ePd+$5dPH2%=(d$dHauy%>1uLX6!FUW)I~8@+U?nZr8}f|2K@x?B5uf3_mh5
zqo_#XlmWjOnX&&<MyB6aBXiH+F)~p<HZnc`z{rIEFE=tVUyV$SpBkBoe{5u?eK9iQ
z{<@J_1U4L^K<^ZhM#eT@{A)($&EFWAJrt$>&3V`_MrOY)Z649c?4i)>YB!j_v~Zg4
z?az(Oyst)P3?0xN-Xv@L)yTwrGBOhZ#xdU-nFM0>n(~X0X#&3X*~r9vV`L6d4A<!p
zjm+>}BlF_FZ)9Hloss$6nEEo32D@uyUWV@)nTwQ{ca6+=_^(FhHF$qK(a6M7h5pRQ
zTm%!1%$uK$O!qHFX5RNk=4BKxo@ivkKN*>qOTpW=R5r+8jm%sE^f~IQk$D*ugrsrA
z{J_YJ`7<N)@^6hy<R>F@m;kMo>dEGQIs0hj8WyTUM^%e^QA_i*{=utQ_4ccLG{<7Q
z52iN*iknA_2~(vsWW@td=zy1FhpCtPk|ZGGi<E=_nzT32RQL;n(h<_kC)+4UJe)2U
z@Cv{^7B59i14C*{A=3|rHy^!{31ri8qcI#4Aj#-X-fBFsJupR(9(>bxO#;Gnc68Jo
zxP+tDk?Q$y;?V|RjL&dPXfK_~HhBa5<wxpq+4{+F58$)It)Tkx=joJmyrWvyqlDo>
z9RfwU?dW?1r2&$BC1A`%^@Ya>boKBg|Jz+76Z7iCzi4EhrIP+bBQuil)yVArr;SX+
zUo$cd{~aS!{2wwhM|X|PSCcmXgpsNA*Nn`YpN&kzziec}erROY{m#gg{L4n>%2y*(
z<X<;3oxe3QRlgdUd|!;rxZfF>aX&CJC;qmP$#F~hA2c#M9lkd*McDuQMrP*^j7%)i
z$Q1b>Ffz4wjm-Sq{X`>^n&Hgcz#*cMd02pGWa9qF$dvkbjZCe-X=H*DMArwNbLr;N
z{np5&{$gaJfxjA=X<EM;nY>?&%(OGJpN-65qLIn)y^%?;ZDm3c@zuzj`<q54pB$pw
z=c|!P_>GaN`=>@`)K87f@jo*%lfM|5=D#;Gf!`RJDnBwZBmU6HMEumq1pF^DG9CWh
z$Rz(iBl9;#rqg#u=8fMOnRMhbz#ki#s3`Zo-x!%;pN-7xyGG`1qLE2OG%`bfF*37$
zU}W<DT_dwZWY@@~`<q54>#mV$_sPgi`_;%i{SO$KxBrTfDKz#oBNO#ABU9^FBNP7j
zj7*NdU}Wb0$jI#bPZ*h9e_&)r{jrfrvuk9+|EiJs>>DF9<iBWS-u{`93HpD}$dvj+
zBU4jOMEV;e6Lp5}M@HuD@XEq(jZE@?)5t_C{>;cE{4FCBedZr9GIjoEjZBo{-!d}o
z$p%6`8<}?$|GJS`_%kC@>Kh}o>&(xL%>2J%Wb*x~k$LFnMkeon(#QmSV`QSV{&PlV
z;lE;J0zMg;xc``u$@DWLlk#6RGReO&GRc2nWaj@BBNGSQH8Lr5={_5osfvHs$h`Ca
zf|2R)myFEF|1&bL{GX8-cy9g5xs8l-o5klo)SuhxKKF6t-1ggZJKN^~P$UTqNh*mX
zQ$qrckmNQ<igQTHASCE25_}U$Rf2>xAgLcCX<i{|7m&~$BpuX)9_GOy>A|Sx!DQsY
zY~#Ul&Vx0`gYBvZ`%Mpy5)aM>53a`^+^;-%7Cc}(9&o59FU*rq(vx4!Q^3em(8g2f
z+<()^90=7f4Rig)$jtv@WFC<E-pG^+bA=N@Nzwz(Kr?5ek@-$-F+zuEWFo&cGDBRQ
zy}vOs->Lm-WP&x=yv>kg{8+MN?5>fC_-tgp)Bk~y8GLv#!u2;sW(n|LHZm!{8kwXT
zZJ&)y?=MCsmUv3v8=31NuD>@j2X>82DWZ`Xbr}2A$i#j&GAVy&WQMr@#>mVE{%U0A
zhq`_;G9z4nXk<daGcphSYGl4U^ox<X6Y`Cbng2s0)90&^N&btGd4OnS8t)pJK13t)
zo$F^KQ+U_NbpBH#ldjjJ;^1c^^WLtJdG;G4^W`^2CLhtr)MRh}_l!(0hvqLv=CbfF
zMyAc*H!>|=O#T~2CTLLR7b8>mPmD~oJ<-Ut_+(__q*Fc_nY}{gOapC3LAyrg$zP1j
z<Ucer9Zh>+@ls@0J{g(79~hZK`yC(LiVnS|thH-op8B1UnTz@hMyB`W&qn6i-x`_s
z+I=GbDI-(lTO(6<4Em==rsL0y%vH)C8ks>uJE!znygnJ3slOPRXG?EC7BV*9H8Qs-
zKO31|pN&jjFjMLmBa@ulz%3s7TO%``EpFGy4E=0mp4I)0ktw=sWDW>@F*1+nePd+i
z?i!i!Z;VW>&qikMw?=08FGi*nzsr&DjLcBuiH8ii@J~kOk>47bOG00a%)OtC%!WTU
zGM`7L{fUu@{bXe3=<gbtAw(lHQ|)^rGxdv+>Gm%enLYn`BNP3tk*V)y`*R~xTU2p0
zQhoi$MkWc=cQFJ;kqJ5|-^egw4wU`)8zb{P-K6+uBh&WxM&`_~M&?YU;ZKZAvoA)b
ziJC|w!>u0S?~TkupN&kipBR}+L?hGoJ0mmcTO-rui;;<kCjG|990lzfnciBW{_0<h
zOiH4WY4JNFQ%98Idm~fvlacBAosroK{*jUC8f9hstC5-52<>fdLY93pGW&@}CMl2N
zH%6u%(a2Q)Y-FN$jm)H9jm%rPZ;VV)9{q2O%+bj3&96o#m0Et^uSRAQgUXR#jm)HP
zjLdhx7@6rmG%|1fYGkH=GBVYFY-F158kuXF!v5%8BQw3{^q&}+JfDorE2fSWpN-5+
z%Gc(fjZCgg;E#;VUa+9ZS0fYn$;b>P8kuFk8krPdjm+>rGcvtHzZ#i=zcDiDqfCfK
zX56lk8RyzI#_=N~Gv`|)Guk-#XGW&&?~P2iZ;eciZ;Z_4h+QMIfM{ge|K7-~{DG0_
z6Zy%=oHhMpBNO}C$aE$enHZ|{*gr5bgNa5a^bd?o{I5o)%^w<>xBjA$=}WU~WIBiL
z8kvo-ecv0I<{G5>L?g3FXdltYY=-^b$V_gOM>WDe8<}+98=2<c7@2@z*2>RDCK=pW
zooHkxelaqKz8aa8L?d&An`mSX<N2J4M&<}N(a1dd*~n~ye>O7Vq<jKe-y4}B-x-<7
zUyaPlT_ZD=l-ZeRWNLmgG9@%PjXxWiFZezinex9eGRXwx(Za^fBA<=SN_F`*qLE4V
z7mUoX-x`_5UyV$wZ;ebcIF1Z%Of)hne`92-^TW{sk+Hi*CPvgBzyFJo*}nf5BQyCA
zjm-Q;*k>d21kuRUlI!9%utqnq17&N}r>C1a+)~$<atuQ?Aw%ktp)h(=EyYR%=V~xG
zhfJaiATfl0)gA&Gz=>2M6hp}*A`#lLc<L@3Jr`PS2n}||i$vm7BT<ZAll0B}#>P!7
zwoQg!WK3R7``1$iw7A(%goxru<fTFsCz^N=B<wwSnm45EJ+`m4x_SK3H~@LXl9ps8
zj?b6$)#YHCRZ?d0U^Q_Kx}!Uqdl%F8Ax~>-O*t;7)8+%<LnJ*PwIqtrMgmRrkqA02
zb@6pg&U_r3W2Ra@nzmWv>{yezUn4zJu$sI&r<<mDSD&OQ@Z9DUH!j!hNv@i4_G!~l
zn$S!$(mWcFu*canqp4=Thf{2&H^*Fp!EKsqU8nZ~)w>@7;61@$_%($L2cw=83$GBE
zD!E$a$XrW?_`XJYPzM7pG@`AMrq@wBk@CraMjw5fCI>#)qH#Z*WbeEN%Q~mFZH^)K
zxVG|XLtjFu#dMfVNZWc7Pom?Fbdx-0`s5ZGa9{n<CfO$=^MvL@xW-o_GoL>c@AJvX
zB>Rn#8S=@<bS6cl?;4rtuSTZM4~<N;=mgQo4CSOFa-G3HH!|@e`MGL2!C-Nsk=b;H
zXk@13es5$3n=hXb7$Vs<GI=bokh)6zVq^m0=D#yCi*6mT`o_qlxh4F`$ZYa|^4Z8d
z^wr30f)S0(M52*N@<drgo6vYKQkRA_Tn+UHMrQICBQy51k=ZOFyFSM`!mB?qO>sJ*
zaZizvC|Ytti>`+gNosDwA}sW_$#fere)4pSDe#&_Gv5&UWk3N{Wz(PuUe37j`ra@l
z^G1eHSAKI+K7xZB9Vx@aL{zx8%Y36Gs;MeEHe*UlLVUhaZobK?d2&NjW^tIh5-$?l
zI3X&*9Eng?Jfkh}=1DwHVjvm6jCSGPJT+=fhzKnI%&EjHB-%NR&`Q9RMBYHWM4?W9
zp{bVSR=QeGFfHJ9QP!Ov28pJQr@a=<^f^UBZXt|-M&@cXPbHsrsneb=+|w(hk442q
z3|S(mTGn~PZdvU#50He}#gk~Jg)K;HS59RIbp%)0iydkvlf}~F@~JO&@zj`xhQw3e
z3wBi&M@KX_={e?8(B65a!AP(OrJQ>EwqH{kgH|oo((tuyFa_c^$zr>C@eEDj1DW*j
zc_V5KVY;K7`6Q~%xvfX$>BpM-ay12<)z#dZN-q?t`HPDOkLXC;R7;$1&z<iO3R7~V
z+hL1QgyZQ?V#N=Is_oO*IYl>W+$_Idqy})OB_)5)FaUMdQ1rT`)|LgY;#Sxs6D-Po
zX4(w2EOj~S{(Nr>1jCO&-!YfD1wxe!o*{jq;o|W^_;xe^Qb?kmR;t$3H$)W=cGFaI
zRu`ClGf2Cm4P4kW%5k<R><P85reqgDRXiA!qoJ4#czla2T%ypCTyu>^ds5KdRQ{AU
zL9^UYIB8FqVhx&N4S0p3MR}lw?yzf>wb<GG!$T+LR2&~Mn+K~7ovra}WnR^U1<l<{
z8)3z$-z_gR=8|5b64GXq;hPINwlA1u!BzW^<~voRj&(92O-bq1kYjX>Fu(~>)s+2p
zD3G%TBasH=yQPM_0}>BT>Ik7tM(n95kMk=6RpPF9gwS-MsBj@X7;)txNkQ8&(=;)5
zM|BbNW*)7RLV!oC#<3@!7^v2$vmB)(Ba>*@28t|ci6^6|v`All9HOoSycoe#Z+VW>
zH0@Q}2~i8Jpb~EceIR?cUt1s_2Z<CPur38nBLvomh|7%7q6*qWXE~EmM>b^<4lb$-
z6@_ohqnv|5$tc?CCkThP*$Q|$XN}R|5jOKmR*)%OB!Jl%KXGJIv8kdw1vT7%M2di?
zqYgH4E;C6>+n2~QoKd#Tpv_6Cy-?4?FhpiD7iTyT@`gs6dy>rLb&-S4I81Qb>_i9Y
zX?4C!PdZ0mN(n*yShOu&!xo-3F}K-i#};cGZRP<dY)&>$aZKu5Zp_wik$MMw|E_6;
ze&EE4mRjZhBcbuybZkUTN!1O_53(_8)7-pGG9}@9;0&4r!!LJ+Uz@2Bs)*j_AHr<7
zvsY#Pq+*Vy+5p$-GgJF4_+?bXX!tZ(LTN$P#Kxz%EFxXICS=uIL$xnoqDExqL<Q%3
zwWWFE*;<nDlo8e~Jge65kytd1u{xx5(xZ#aW8A^3?FD@uVp7KShJab<wJcg=b;)Vm
zLwjpK9=u;J>C(m3i+kpjVd{H&G>4<lB=#>`28NifO+lzNeWP){8exaWat>MusI>{6
z+)P!fe5*ZQcG(op1aI8Srfz!Nrz)1L>7BPX=Rq|u%@EnvBZ|IRJ&gmKP4xZ;v_WEJ
zxxuWaz=Riop?9QH<mgKuG!3twhM-uOn@LN~pi5N4E^91EhUSM^likoKZAdcEKD5KF
zUDqYFE|zkpCSLNMSx&q$fb^B$U2l7yaf&m0;Kh=LDTgb3wd>Xm%|a(=_6qv1nz0qB
z_24CY3h!@fcGin)gD!@z-BcAPAz!<xhESi8xtFo9VMNem#+@?m38o>C!6OmwrhA7q
z%9!#R8OEFToVys47ebZXraHitoEMy&aL?>SiSAbLl8m9s{K6xtnt5|A5jg2{HuZGY
ziy15T3LEaL={_?igwPV+v-ua$)a=tst@H}71jp{nI<7^BwAMDpL-GL<NADAFX>nxb
zLC&{ksB-#9&uN6`0TEf*1_k@on~IJk4EdxfI-tTP#e3H;nM9_xGLKW&+_hoc(XKtO
zZKal@o%~Kamioqp;(M=^D*8>$&3Tyj-HF*pN~9#1ol9Cv$r{aojgob0;{J^X>Y6l_
zn+*ILm6Vl4wwjMCx7chw{GchjkF3?T?xD|CTa16Rneszf|Mr7htr7msC3PJ)>)M@^
zAGP{F687)R^Ka?g>RhRNq*nKMVe65Ne|J+|=gw9yM5X8b)}y(tmWrm<10hd+l-nsk
zKBfHF$EngAqWtW5z;oG;Pxv2nJAG`nj8`#7Kh*vp2b2q(&^(ZOn6fzlzD@>d4xlVW
zsR4tBeE_2CO(SGzH6(uIK$F6}3hO!<-TX%dOykJofZ<k^k+}!M??1l!KqNDF9t<Dc
z9x<yQCaWjBR2d}_m}08qFCUCM1&*AnpKMhjq^eG72F@C7&-$QV6A{gqA4i4jhb05Y
z8@7jA1BcG5&XsJ>G}TW~?#w?|oqiQK^jdZ1{r33I_R>ng^6~A_gF%$*nlt=6Bd*)a
zmfNpeKPv1CnVt(Aat&JWQCnnfSS?gte;K%;)-ZRl;r;ob*T)+coOagC8a9oBrpdG@
z(TFV%dXdEw6(QU;>ty9Uu!1o3mW1P|Br!$*dm~fqShcxJL6X4@S(pCGi;PZ&=}I0{
zC+I1MuP|%+U{m*bO$&JGTI#B^M$Cvg9YX8d&Cc(Lm|``eI8NPWnz^!X+P-<f1H_%c
z?Ro<{UU@+x4~uN&39i+=UQz4(bjW*+Wv^A0+wjP>OFnLc6)vOI<Xk>)U)=Xud8_@L
z^{q{3h>yG+*D>*96~UaW;g^#4D%K*!DC_6nFWGlz7=;*eh3q@=6tnQe`lVI*nTGq~
z4%W4oJkH&XKJTM*MR9%hmETFuSDAzF=3iH9ACTN+5gjPCj?+Ii%e2STsU$zEB06!)
z7<(v&hq;aM8zYmPh=E)IYEb@}k*UoU*9=(@qibP0(k01p&cdJmA=|06-kUq8twp~v
zGTY!`Tny=qF3Jq;tdj+eX#(l~3>_kR<#BC$?$j+8gy<8pxTwSK7m+!!iRY2!F~n+i
z?z_KQT7<R0F?7pM_VwtBzNvdEbkHB4@L2UD(;`lRoV!wU-@QowaN5NCi{S^Jg3foz
zF#E6eaI<ZeKGG!RO?+xNo=6(2Ml>?}Ob@G6<swv0UOPhG+ee;mxi{cc1cQY!l?mJe
zIfdcWk0j~W!86G|kniAqdI$&$t4d?jm@XgK>s>|#I@${s2+yrlKggM1bCj3jJ*q~I
zBHzBI>?JeG)_%xhIDl2td{QMU*5AVXVavsL!*|V(jDEB<+}Zauay*>2=LN~#%pU1!
z3ehxCbX05_!<vbc*9;0ABBXxd32o7}tPqF2-A7Hz12?PEG!+L(COnQLkxn2*trhsM
zcgC_4(!33kl)>vC2Vr_i&W>qJ&kM4+vDd6O^@4l?Idu1t?@^E5TXjP#nnB~}fCKO<
zcp}ro>B3Ymx^qGve~KP>EV;Zlacu1HRr>Q0P9d`hPPo3j9PkGB8^18l9+I&^&%iK_
zC5t)7O>=vJW4&?CY&X-Enen=EOI_!+R<7;u6^#gEcp{QK=N>krgkfmje#wrxMF@`3
z?6IhJEmst2^&Wu6d7IgVinc!A3wx5={}>8O701u1t|50GrQbZi^#8GU=kHLy|Nr>M
z7|dce`xax(zK0NF>{L`_D~3o~grr4f#+Kb!v!x+PNJx?;V@=kvl)c9Kl+akRGvDd?
ze7#=p@Av(Ae?LEce*7HA^#`2ibzH}JUdQ8cp7&d)>Fe1i@$(-dpFg_pZnnG9z({#Y
zZxdteteHQsH}cjk3W^wqkEN#|rb$Ib6*D$7Me)+7vh#FAg?>KTQQ)YNNqQY%D~}RK
z<#cw>zjv2bu|A8(aWs1wz_{e@e{V?<rl=+O+W~n*)Yx?7SrCWY`IbU<Q_xcbaoBRa
zxSGDj8D+;7&O95V3t%I#;)~d=hh=!$*!UCq^9hhL8{xOCDK<6bN|FdqmjYQwPUqF*
za^YlFZ5{UaGT<^lH2SO>>cTf1xdb|fir4F828IrS)jOKSX24Tshor=db~c9dMWOm5
zBj$#er6NzF3kC-qEnw2CMp5CmjN{c2;%3T4Ns#*mp%Q|5Sjw{dvihuy@ob#-cE3%)
ztcCQvJB)kL8#Mx$lW%;9dR9;5ohC7rT{#3Ufa^)*5F4K!3V3#wD?>P$m)A+|MX+6H
zSX+&mmR3ddBOdOo{tKUtbxC24U%9d?>%CMz_!!)%%IEc1oYy&8MY6TzwyLZ#54oCz
z3;cM?b?AYK)(@X9L~G~8PXq1DSEl$MBh%S7Og;G-hy4Oh@ILk7=G#1U+5%2Y_e`v-
z9U0QLV8mP1A96mGoD&c^B&voAqMQrMD*_tWjt!hW;mI~!dQ|HcCL!5s$}Bg39P67k
zczQYT;fag9wnPTT?&&wUc*+RTCgi?$aa#1NaNt#r-n^kAE8bVfj+yN}m>)>mxWqkT
zY-zZi#QktV@+eugS)_jKtHGIDh5kyfZ1|*$N=YpOHmZ@QkO2y~$zyMVpI+nG*OjF#
zro9O~_-RXzarB?19L>lcbdOgXX&y_fAf`!sLKK{ip9xBLS*9GHTtxekn!qphKl796
z965IRT*p6r;*Beh9oS_R)kS^LpD4F-=+rFRC{^_QD{@fhRQ?+Z?<YUwueBvykPilD
zlyAlEO^BO5DIa_Y@_!mUG5a<7gS&H|ccbvwves~oU$gJYreN1q=dIeg*U}20fw=J)
zDtJf9*(zpgjFG+Yy!3cxBs!gjc;74u)(~hh*wsYpKFC8~S(fDdi|L37Nv312K_A@P
zh$&9f<lya<iEPW8+CY46nFCZrRakm(-@0oq=jwmr;)IjHPmA_1o@!cRtC3u9mfCgF
zn~z`CpXMB|u{w@eJsG?|^TPRai^*5D6g|JBy+a(Ib;ldx&d=}h`=O|668)HbKiGad
zOkkMQCg#_aXjNm(l}t4^#OuY!*9i6o90o{A5zSLQo59|)uZ7Nv%UhyYQ(t3BBLtPK
zFZoro8i^)7)TKZ#Eq!TDG>9rNHSw{&wA)OY4~)`(=wo)x8S|X|%qycK6WSa0IarU|
zg{DdcP8y8eF9y-S6MavdJ9Tch(+tDPvzV8B7~sk8nZYi8k~pu>f#dU}n@f|aQKu{<
z#G2dNM6({kO*F@u`cg}Eb^}CxKc6en+S1Ur4)T5sbEM`ANLpYi@zIq~K3fUaCkIpB
z%l<a^RqcGA&*)wVz_z*Tah(fvpj`^pyI;p~v$M>)itb<_GJTwMxB0fGf3xoX6uY@j
zo8|0k<fR86#xEM#+vG^5gw^*;JgaGr5Acse-kEbecRSMcG(Fk*L)AWcS<_D3Jyj%F
z(ihXJtlmHFzc*7g7__XDk+kf)-NIM#`>`D5#_dvvP_b9PIh2Q<a^1e-RH`)j7`(q4
z?-|aDV(e^kU<&%#ujxdKSw~5JZN%WXiqrj<P~c9n!|;yeePhuTtb%C6rDoxeZ=<$I
z(}Inj&4XNP8b{G{!Xfv%#Xg$kys!UjYs>&MW3iF&>F)e-gZ!c3Z~fD%2PwwL%FdFH
zwBHS{<>JaYLO?ZLB0D(gApcM0!Wn`CW#LLX$;<Jihmse*N3DNSj`m-8_|wY<q8#TJ
zal1B<-B2LXP;)ixz8;I%bJ?ntN?PQ#IAgwGlHZYEjvwMEBAXgsY~Ed~F;5MnP9T6=
z$~PIHe8yp)5zrRHPNGBULHjBuJmstcs5ucjK$5y4qspKt46i^~xK&x@=u?U)ppglX
zVX8W-i+ZMN3pjzSwCE~XH0s*CCQVYlGW7aN2SH$B3cBmNlhp^#wV5nXnFuZ4-C%(X
zO$o(e_s&iu<0xGdR!B2<$uWSarjbxVE05<CjCN(r3PR6d=hXCL)wuCS@r4|e?MQ+V
zCYQ`<zQn0#4IeFMouI>;6cB?XV?romnT{}4K%V%C+b)MQNa^y|a>MiIR6Ps6(q}mP
z`+@!l7@F&xGFm&%SSSf@gV?l!vR|~~%AiWe<n6_XPfReGO!9v*nT7E?S~#&d)NXYz
z?_M5X1XWDSXr%15^cu1Ha({^|%fFdSBjgG#GwuhBv1pW;@i|kTBhvXb*S)y6K@sQ|
zX3*>M!q+}G)U4vntS}$ZY}$Sz(nwr)#Yu{qh_}y?x>b=WHBs$rk?JO^i?$-{2(G^>
zL>l@<f1wAiEZ{c#;RoosxV+AZt0Lgi5#MH4o#urr5@N~&Vjp{?(@~Hs)Yr1a7r=0_
zll?M7KZ46vMSu9z<<dm(W&@t4m{K|EHZ=~Wktqj~DX|o9@t1Z9K(o*>o&hp*6*3Rk
zq{9M^zU>!qz0om^MI8aviCmKnUXwX0bu=PC_DQT<Uz41IlzatxQ-EvX0+Y!EOxQ^@
z4*X+e4k&#OQ1X)C35Rd5bV*FIsH~q=VQg`!XivdV%OBZQ6n?yVL--Gq8KCO(N>yxD
zmg|;UQ>B{Nx~g=Fn((>o2hFO&QtG@K8XSW|5?!_36>D@G4W&U1G`FVQEm?E!&qA%5
zV(?>Ke(?o9lrpmN8K83TpmvCcl6Nya4*OGv$z;0QSWOF_3QfE$G1>vpeSS{&C6mb{
zP@>RMLq>XE+@)9C^%@i1K<6}&tM%t;z&<J2Pv>en*Y(jRSBouAn8%&4rk)toFc^nb
zcBdG;m6G{&PWU14NYLxsh<vS2DIYdcUVVF8xSx{Vu7(}t@C4;!ztgpzL*DJj`A-;i
z0epRCo6wPXut%s=vpYNEv;^OE3|7jWo5C%%!UAPb-pR9=F=&hJP4F_x<a80bjK(>g
z*LX;Ssk2;Z9W+!>NRPxprzwI%-kkzf4GC3psi~IceU{<~tCT>?OX^2V*U@EmR`05;
zj?>W{ES57g-d*aknL!IL6|1*ZmMug5-|#29HcpPKo|3C#t&iC&ICcLYDO2VXS1SIv
zX{gDW{No2<Vvd^3@$6|arA#BeuD_+sK&sdR<&Ts}u;B~e@Qxa?Twla|T!pU$+KK-<
zV#9md{G|OUUVFh*yPrw+F7MhfJ@EH-C%kXlU$Q^%e;YGXfpfAHyP~ix&w-93ATrub
z>3Q4?3kkt78rW(`%!~-tBsOh||4Yi`%Y)12N#@_?1WdWSXF*j_To^59^g=lYd_{N5
zzI*(HUhk4LxNV_FIe#v}YKzzKw*C3{Fnp{X{@`7%owA(E?Hcy4hUg&G$G6kw)u9UJ
zVx@zyofl&J6r`5K86&2YiAU?_nVA1AW%5nAgi-z_W%7xGb*3*FSO1YR0aFN%^owFl
zDHFr}DDOVWSEQiFMmtYp^_bo7FZe%3=2xF*d{>|IZDPJA&Kq^rtOrxX8=GxiFEnwT
zmH<mMi6NL$CY~qYtJv8l5TCe@mWM##SFz@x>(}_a-V>b<o?m1f59Jgx+6^M2v^<zV
zoMdgDF6(Vcl9qnj`K$a-{Dp`8#rOlnldkR+p`&g^-2DZUU$a|;OPf$!Qu0i^$#65H
z11$-`A}pwgD)ud1Qh!(sJ1iE6fi+I~?n&MhKejxS_kN!!h$2dE6A>}o{#&MYlEZfs
z`R}DT+=B-NI4y`jA)IM=jEKYY&PfXu6K<WF=Fk*Ba+z%M3D3FI<MOLlOxDQT>5gRe
z``~LqLD!xb`o8y0<b}q}BQsP)weq=eM9D}8x0pNk82kiQM*_$8TGpM2!YvQ`zp+ff
zpj|l=%QTYygJoj4ta!w@O4*vX5Pz^t><SahWc<-GiJ|s*^vE4w7SN+J3XR48#xmE+
z4i+eW2gH!S+Cm^Bk3$5a!ba}G9mD=$nPgl0D4r*@M>f(@_7cI`)6vJzOAQd4%vgLm
z{>CzEb)?paf3VDtH_!ZP;=vyCk8q41&WIns>lUqJdDq&obdWeI%X7!UZnFtF0m1%*
zWqwV=t~J4-f{ACQ`8kgh_Z<8uN0P(@lO=Z$Q`;6IoXwhBf3QqMX8bnGyWYw_Sf*7T
zb|BAdxzg~yW3oeLnoDMy+>QkTZn#DyzVS_KXMw~~(tYv;0yMEw9BFB0X%{myVn;I|
z0_i@U-?c&o7)!rp9{774Snws>mGH_Jt^^?Fiwr}>-9nu*gm*GpoN_+hi&{^$TT@QR
zXyOZE;rEpg4aofN_)3xSRZR7`^heC&o##B&<Vy|5<39_MS)Iw*TAAJj2W3q>-;nV>
z5>EVCX_rf?i+ZIm!~DEhjDK#+=!(Z2WZrGMM>Z5HFy3|V*|7^E3f8jddEu_*k+brA
zDCsmL-*M@(DddK@=p!RBFtO{Tk?Reh*mlPAb^C(HSw*p9DA=yWG)s6^h79gZp;NS&
zyaSKR^wJ^i(O=@wCtqZ~y2DH~iyB9ZTAZ12-2J55<Xg>%-ORN4Jg$M{lrS{f(XQlL
zGm@}V!f47WWtt72$4bw6a`W92jl<mcYDU*PXHAGZ-TNvnL_{o*g-^PRMomG_W=R)r
zm#yA^qv7(_sP@g7**As~5;uXubn=V#DdbwF%*K0}lT9d#y~@nX8QLz@-oa^l!bi38
z1cX>bz*CPtiSwXXmiCQaG4R}L?%Z}we1{aCOqOaLTxN2%R9(}UZMIbM_Ph14t$a%5
zo4V&d<8_UDX_mXDWG0qLL;k@sG2H2@VwbP|!7{a2peQDmNjMjuAvv4<artj7^Q3#(
zhdopIpklWDXH9y^|6rL5(P%z>Naa6RX5QaeCZI`jwE89!%Ov(N$V%J~m|7+!0dbG}
z0Tau_*tRG)+UK+xF|kael;z`6Oe~XgKQ{4;^uRb+*5%VF>1u6}sDH4`g;$&j`=H9d
zu}q-{={i%N*$5qCA6jnUejNf1Jy{Uf6~>uZCUF1l0gG)&A2_%l#$wO4N!||1dtogR
z8a5$WJN4Sd0}@a8^drYEa=#NY(vfuGGqYM)@#8ZKw#EAgYr;e)qdxv^y-am|*PxPE
zXMm_^a&TvHci%*tw#T4kHfQHmk<wtP3r%Iq>cXB?qn<{k6M3U&50F_*EYtn_#8l?A
zJ9nV)&--^oQ0{$(9$9&WS3C86C&v22bf_u%*^EvC^=VFjwo!V`6jk_O<cq+74{jju
z-&p2J*~mB85yK-r&rbDdPj@RYu}lhl`ogDmCYH(4f8|Js_HD@Yk^VneCi!nHlkzu~
zImP5MkdcwCmJ&|JPe=CJMoK0hr#z&xkg3;v#@evyyZABjZ)0sPrUdR;;yGz1mKnMO
zTcGr6{f%Yz?$4h4CbpC#S@sW>Nhqw~L{r4Gj6%gCHKv3QZT53!(j2CrG>pQJbTY9_
zPY7#*NN21;)SHVkxNnP7XQk`4GXB9bJLN~O6LUX&``J}242sWGc(*-7>|$b>C-<c0
ziPc!A1;$SJ!i&SZiK5vVPp6+g?Pp?{%((Z}Z;xNOx}}5Cel`8UGFzEgCLoyS`!^xC
znmk(O^;$}Jo#@!%a<G9^t$3qO)ynGZ3Pdd6_s8_@kJCPu^rW0o4nqGavCI<&Syzce
z7nxWlS+_xPOiN<x&NInF?8FCe{`*WUlej)5DqW+pZvJdT%ylz`|F@6j@28W%+<#-4
z?1sB6BlM?+mSu;F_W7?h9QKzBHX1|xUxuU?yZvBdndJS?{^Y$^PY=?x_kXwXE+y}?
zG)Ga0AQ%(7{9|N7ehBQesQ$~yj8c2v9xtMIe|97<tR_jyI!ixV{RN{lP4PcQ=C!d4
znIHf_RIUpQ@B_~E!3}Oh@4f&K2-!>{^C9$D@zATI#*gY_j+LA@?610i0Ns?Y33k{1
z*5%=OZuH&t@!E%VYEoZ51pXXrh<)PO`}9Nz`-$VJ<2Fn+Q~F|-cExmC9JfmZ?07&k
zK1|AmX=Kj)Q8T>`IdubFKEzvR8^jCEyXMNq9v(YxHxc>Fl2hSSyxx1?_C(XY`4O9M
zzouH7_%td#FRadWN2h#)pQsId8GJOS=21g;M?R|DjbBn(>;0-E(#9~+;Gpwc&v;!3
z(oI5E(y61J`9Jyd*6;m2>+dD!2mr_ONjwk;FuDu4&hSgVcX$FUesyVXYg{+MHfqW*
zL}1D+QuL8*|08sQ#q`DF5Q0Yx0AK#}tX!cEQHLEsZ?c4w9X%3sPahMH%9JA}CgN~~
zef(w?>Ym9v(KVM+P8&eHQjwcQQl1Hc_Fn03A6hb%oF6%fq?}E#yqtMC7s8u{XBwIQ
zgW#d~D{Vzz3X?tZqrG$QuN*JTx*htZ?^)=1saUjaH><O@6NROdZ1C-~cR})LE4jc&
zy7%pmmf<^J;i3fm*$v4LiC10<;+%boi_1E%W*y1cP1AO#bjmTwOk$Mb*6gj(6AsiE
z@#5DA>+2QmF}LK(1&?zTRfhJmMxZPA1A4rM_ZfLM`okS(m2j;c`8jV}Ai>u^%;yGQ
zuADAY@YM!Bbno<9R9rRxLuRt!_V)vjN0xTYlxu;=lYZfghYCsR;5VZ-`pIBWzxNh~
z>n5&xqK@v(!r$%xNpvR2uN@lUp3vd6C<$|pj7;z2?@@nl^;X8Edi9gm_qg>7;(be2
zM>VclcE4VHVD?xse0#9tge|7>Q=evR>aC%(HcDT5WoBl2yl!kvSGf#_!-NcZ?;L1;
zx%@1C)B1c0d{|b(HVHbuGpdcA6dhH1Z+7fu&z<i_-YBi<W}C71ao&6X#O6KZ;TcZT
zIPcVLT%uT+_Ru4@gq<FOcU&S@a=*G6&i^Q5=(Kuj$k$Vkp;JAmpFA%<l77Clsk$>?
z{XKVaUT}seeSu(-+-nd!LZWJ21*iu*4P!zr-qH4(ImH_ntT+W%Y6cT^)9j`ZxN6m~
z4xOHBeJ5};*O^K0TOFYm(lZn14t|fmd`4aC**n*Lta`tHd+FT_f&!SfyaR)s)ePN8
zKU0P0Btk=R)x`SQhjXIV6gK5_zeG1|6TI3nRQI}nq%@U?SgiSUtb+s(-xr4kJK`i!
z?l>Na*6=R9)YpfUI1N?Sa0w}Q&T~a2P*=KWw&R#`9Hw~iz=m-0`g96-Tjl0<v#>oS
zjy0Cw2y)dcM82v`rIJ!&coz}`^=B|kAavL!QPShGUB|I>)X~fPonpcGNW+c{lGbim
z>>+AKCTl)XIyEN1Ixt@x2@#h)Ea5iJNb~aO2cFu##JP6G7*&vG`kIi>1%A~k^C(H-
z!Lc%7Z^tN6hAP5k#6#pdDBp01CE_qM9}VuGI%4f)hViXT$sP$;L<Pt)oDfN^it`CP
zA1n+X%nMg^NI6o@JbSCJ;?PJT8&0!CV1KZRzdSi7?{d6Fai2@P4HIU7>(9J)c~ES8
z<FRPoJ*3YrS4Nor1@ZXkz6ZJNnGE?%jg+A%X+>gIq(s>Cp&y&<NdMD~#pl{ipL-&w
zLouz?$HH;cD6=^3JZSutRt8YlHl%w{tjTU#^>_3@s`H{fqr2O{GZKCGt`|3+JJVnc
z(kWF|_SAXGe(7!}DZ6?|Y|HM|nZ(87JZCA9@$F6lS3EFA)n1&ABKlP(8>a|*mN1P>
zheqhvGAQ>ePo<Jej>SXKiZ~=b$=vQs=lO^W_6kt~e>FG94A(F6zPWU)#Es#6tg0|g
ze7UAYU?2$*LYqN+7hvTL1sSPSxr<dTM936jVc~H&nDdoF!--ui)*?tO;>2|ipZ-WK
zSrhKlI;Dp4!K2;ItqzmIr8g$e+EEtIzu)&97r3k%CMh!YR-&8;97HGZP2}-QIF>@H
zXw?t(TR@*J+Er0NhI6>ooew<+H~bz8Bb=i!;#C<eN-NlUJ$>z3{+)<MU)cA`ax!cC
z$m@r{esWz3B(SYs>~Q9mK%((yxnsWoaaqBSr*>OFbns*F5Y=w!;}@|zs^x}RKNA@;
zo?<hmU|y*oNZ#v`O<;FbvrR(9Vez&+b^)M3hs_8)3FkcmXpTWwM(F|WHXnkUWqD$0
z78nz@WxBcU7(SHxFsRvpJ%AKYib5Qn<*0mTq_TpUMe*-Qtk&R8_;Sw2S8c=9l{FrH
zrxLM*dpxJ<pA6DVNm@lLV&*6o{c`=;pm5eoiMzLg4#d56$4AAk2Wj96;z$<%;xg%_
zb8!s1T6b!h1=Gs}X<T!D|A)(@{EN%ners6D<T9@?xlF2Yy5-Xt!6@BO7GL7kGq10n
z4>><n5cC%8jPd-#WfpHfE_tjt7*~@QlIE*r{D;fDet+!p^77Oy%ejb+nI4|ZYbMn_
zsOvT+6OK$S^TFa$pkzT?W?^;RxtPnUMS9kS*n#@N$+#=STa)`*mo2jVf5{7K(t6oh
z3-{vb#zD^CKsHP+lROytU1018=2o)`f?^&XeuT>=`KX@g{DU_%w1CR-`70AFgs=-t
zE)#dkLG(K|ymeaU&4*Fyl1~Owu0+?NqFav?#y|dGL0iM@<*jeG#J?P4{5a^jQ}qlJ
zm~VX%-+mWoake*5ykF}l-Ro1|vqSLtsQ;aj`72?o{^!GA4}R5sUp<U6XL6Yi-a5k%
zXTP=FIl`&*vG#vsWX3+)C{StmVUxH!^q9$I(rTt7!l#GtH1Ni8gf8Fw$H;t-{ET?S
zG%{f!+j?Nguf)Xt+4XN*tv5f?<KOHrSQ~D2-}(4E&+uSLvT^t89fQqx$ir`U$a|BF
zN85e>;xaJ|`Xy8{7n!lY=-s#%fn*>$4EOK=V~m}0FmAxhjgLWy;pgflARtU5vxC67
z4gLBRE#6PywjiPe_>W+Tf;9xbC^T0QQLKZ=>rW8NAR=WQ)0+_N?}1>8Q0SFVtsp@;
zfg6e=p$qg-Hn3t!WY|e<HztY+yBkKHA{y2Zk8W$4bP&X^pe3WiAy-15^oMC~hZ$uE
zsxO2oSwyH6g`O=UI@N?dt-S7L#J;d8zE0M4>kv8L5h1n^k%8v&r-m=sJ}{FNG-lp0
zb3~sR3BR$;chw^NK~$)VMJPc)@KHx(`{T$e4`0u1bTSR6VlKXp<#3~dv1w6_?onY;
zQTbDWeiq@kzy#kBmfWcDTaFQ-IuY4L5gLwR;R1}PQpeC@uu!HBvFvX2?Xx$XjW{>w
zC6j4_?`uS=EQr;zf={=@$O1y`+tG|o!DfNjV_LCABN3IdLcI&&Ljv*TBZO9P+;w$7
z$1{+@8RT~^<v(Pmt<8%22_~6YoN6+juQRzF<De5ak`Z@vB($R=dfPE<cO-6LJ5Dtt
ze#0?#Q$VP<BR-i(VwXz{S@S~=qkWlPX1U5iC~CzIK8!v3>mM)Ej|m$=VYgLw21q3q
zBy0zXoEIm!khrH4v(pjx1xy;RNrpP5DBn$C6vb=Rq+}SyLhdEIt@%6jgFRJG^FK$W
zp^mO5vH996Rnyp)HPtR@q()>gQgHVKl|~6FKZGwZF~H-bYj@+RIwCNi^d9#p=i`Zr
z9qA6Qq?EJ~?;?0rB{d3}9A1#vvs9GQ^Cy0zd`3Gdik}lXWz*f9GA<rZ@y<*Oi%vPQ
zlP>#%GifJ7!6K6&Cw1HoQkjCbYSFY{dYM!M9tl_;7Cb{TG`*#n5uH|kH?u7xBcLXu
zizOX$H$xMWnJ}8}B}e)t9_BEdy}X)T`#H<<A1@OSEtZGqX6K)wrn-y6a-4Fm=S9Bp
z5mdUD-NKSS9-ZwF_0-q@Y3n@_`;&C~YIc*;(~x`wqQbU~>1AS`ty@0ZV0xLTr$2YZ
zTkhqqy2pL{{4@f>Ab&reIr|}o5-l#*;kJ`U-W`=|qvtxWJ~^ZyxrNY;G<Lz_JmK2B
z&z9`Qx6q52d`vNVOErJ!)w6Xf{8AG7haj4XAFfhGPv5znw=K#zp1tgknD-%LeR3D?
ziItg);}*$pS=rQUQOP7WQ3&6`bPlgS61mEOIs-Yk%i*t%@bzO0R7b@7v3aAAZK^Na
zNDxzbbT^&jb^#hLgkHtK&{o;Utn&DrMKrUXC%H!tlM-P5@Lu|JzNDAIP{He03nPTY
z%!SZAJba*$%#$%FPdrRQUf!u3wuNQSHR33wAXmueDs2lRYf&qNCy*xODhjzgg#68f
zGZz`i9Y16j4Y5N;uFfLd(v_scQE%@f-^HL_-9M2I&X(7Pca4f@UVWaVhO8qMtahN1
z{os1FWS%4@au!Fv`ua%)q>T!uVZrJ#un-KyLcTbP08$@=Gh+*1<QL^tlqDAHtmBg#
zDV7f8QrOh1;Ve{st?j-loD6_=`yu!J;DsbeCi!JuIrMES=ePtcjSO8;MHH4pPJJ#%
zbiJCyRHUiGuT_*(bRxq7k>f)Z2KJB|to9BKu_%OGFE0rc65I(Yb?s+P5>Z{Nu!0wR
zm4YNzzM^5%WJ{2uKM@8$kxS*ThFe~N^NKA?-s<aB>GM`qSmkNQ7HnT-yc1YMF$vI+
ze+bZWh^OBv2V2O^e+W=K^w*a%u9>1kEPEy$HYiy*FInA4;=|s4bH3yaxE~%>4*4Af
z|Em^Kw+&mNf=yYWt>rLpTSzq(ysr*VqsPYY)g<X5l1a?CNQf&JpYNFUFbYXVDOXaN
z_$@521UX6P$R3C9`yp#kH7`q`*|hQ~Z2mR%4`~4CItgBght+2z7cnqT3g=*XNg>Jr
zEDl==gT<G_W`vaUoo|M#YO>ZrqNwm0+xk!0^<6(tj7!4yRS{%VefGU~KVrq03~2}f
z)?*FMg|VT9)y$z#&vIBb9wf0>o!MXQNo9ZwQ7U!iS@ZMnJ+bnTiuc=N?+?pi!FVXV
z&UiutN%pHrwEnnK4ojvR6#A*G;-P6>O<T04I-0>2{-c)>XCPK-G6j-{&o7#FRVqbd
zHaN1G{AM{UkN_LM1@|q7I1#{ps&M6>lGPrt(x0YIwvcW*+c1UGwH87~l{k$lg=0CQ
z=xk(w@%fw*%nnDOD)RCb=p>c{CEsS3gLK`u@&x300uY0KY|Q-4>Vl7VmPAFPt$Ktb
zx7Fbx^gqTaf@z%MJL(6j5BI9SZ(9|!8WdP@<h0g5>!dtiL^fi~1}U7a*<~TZ4e3ji
zLR+NNev^0{st(gxu*7&}91E7)<fTy!9{)tr2+x2IkmVu??|2iIhroo=@(>y#&<}o!
zGs#IE;Z}YsBQDQV-0bZVJNi9`!%5Djad<dNw*O>t4VI%5t(o6!*vr{7=>dyE$tKea
zJ?UOin1s9Cy={4)CSZ+XA3z5vXcP$<jt8yUp2$~65R*GHRvTA!8XwL|TR21V$duIU
zuV?EZ$S&qcT4<=`x+^eu;aB9i&gV-_cX(>lv-%6VIiCtwmo4#TUxfuSzt$;BTg$u^
zzX3U=vo(~icw5e_3HVek$4WV*+qV0OxZO21geR7-j$jtglqIj4&k)$r<{U6n@Fdx4
zLP+-1QwFMyG7xM6esP~YH*e@<Lq%{nc)Z}u6(QNAapuC7Z=a1`Rn4c!3voN=rMu@#
z#N=}}AtkMzEMJiRHBrAsW49%MT=Nl51W+-dD9w+}fyN$n9pniUV(6g;|8`4plSwvm
z?U494R<$6ru!KX@00D-`U+ii_AsbOohq0WMyRgAOv7pd!d}VRZ*dTUn)a4DnA3h2|
zybYIS>bN2F@%rWQNivjuueK2b>88TFFG5yHgL;#LPDEI}BYJ$0FOVs>Voo%odMZhy
z-fHkkLP5-H5t}1lzAho>53Jm1rIUWhQ5riwn{7*dBrLWdaRIra`hAebV4tCX@@nW6
z5;s351l`5I7zy~ygi5FXhDuLef}R^Y(?%?^tSv}Sf;9CQUekP$6Nm)==I~5HW>aY0
z)Q=%Fc8`+bkN~8rSM<K>Bv%+{RZ34b8#Q`KtlYX8dZTEa!s#~zH#V3Rw460NJ!@Gu
zYtlPmeR?+Q0UUH48oG=AtA*x7g3LU`35~<k{N|ii*wdI0B%KKm!%+w}(-uQtfK??W
z%Js~oKps*<nQsyR1-9uF68<X2&PG;(3Q5e_vRebv#x9nR>DPoI((V|b^iHvxVL5_n
zrAGqULPQrlu?t~)96;&rN<dm^SE&H85Q2U|!{iUAGDNcdi>>|Ovn42<DiMBBy@Nfz
zOuR!kJ#P{7oSAF8OZj<7hK7)kirFZm$!V@9Na0SjKvrH5TX96CLqFntZ!Ryt^z!|*
zI_FhbJdNF=8Ci@4!+4Q-bdI$0x8v(yz!l5Mbl5)SME%NF9<<W%>0iG;+ON8zpBotO
zWuxk%P|3EOD|pbo*EqjUzR}v(lZ(jjLS_7~>gVp8FBF$mt?*UnqPqPew<Vshl2lY$
zQSFbG#8raZXsGj04hsUs7S(P+Pc<v&KvaM{380iHkOO@|C6Qg(u<%&Ox-S9bM)+}V
zx4?0ASkQ_i`;blL*P2_okuT~8p#fxD&Ulwm_QK8Y%x4Ijgq;c=UA-0~6-DPbnu?n<
zK=95XyEL>ex<QgjOkk6}2GAtTvdQ#D#RJ(@6MuNpha+*L@~7v|?Jj(_9C_6E&OIm3
zL3LfJV8oihp3%FNw89>4@B(4Po_Lyr-*nWPv;q=UtMvf6Rx!7<)9_eLThcfiQqZaH
z-Nn6k?t0Z;dL36vs;^tG-f&+9H*q?tzW+5-bnK&`i`$Z-@>)yZ?dAK8J9UkjC@V8s
zu^9jnY&T7ivf#N2f~=Z@#Vvg4)?p2NLYi}6A`ImX&6zz2tK#^<978!Q6O*(vZ4^S^
z$2TE+8|e+cpgcNdRf5TcGGO}B6u?xUn4u(Xe=0e(&q6z-S{@QEaK@w6-xf3`F<VA9
zbP53p_4D_q$`LDt;=87AMpKf|Z<O3SmSQL;y7zD2lI%ZK9V>cpP$9kkt<Qry{<P=(
z;P(@fk|8_SJb!vf5*x{~2R`cy=gVA@YWBjc(-m=N4~zu8JCCN`C3h@UvIYF;EW5po
z>z0D$cPEWb^xOaFb*neDE;AA_pI`B4k3V7<DdM!|*_o!~)}G_Ee);dp>cb6Dyk&6E
z(_RkmCx#I_X66$GTTAssGfX=l*y~%e|6%2eiJW*;^2@_YRNcV%7Jd4d_@h^WyZkzd
z8VrF}{e&_(%k?<Mi0;D?F*WTgPRScDpL*fOIi!#0ZkpoNv{w~(OE##_k{(F(Cm#9q
ze3`m#end8A?GsP&{_&PV-(G6;(GYC^o8(g&qsADMsC$ZXQ5jH6%mpp<748d|tiPb3
zx6m6e4BG{};Go8gd1S+elSJ;o>G2nh!#Hl)Hw^)y;26?cCPd;r>Kv!V(P!c6R&p;3
zDy<aWw5nT|JrYUed^GU$WpenYs)wlZLDP-uG2fI^+S=EnkHTo`EvNY;{Eb2p#6_t}
zbi;1SY{N#;`X}8b<v|X}?J~9L29?}S^QYOMUDk&5eapapGhVJUw(Yx9Jz_Y|ias&F
zvJ5k_BIlw?6NBLiv3;=)syzxD-It5xe27yEHQw88vLip;?4HhbZfdeMMjTluo&NyB
zS&BWZ6fl2w{xd4klzJiDUlBLplK;#W^_fYAO^df%tNwNWtOYSc{4BXrXjdzDXZqAh
z>xWx&@7+QeY&v+N+NH%9=o{uSrU$1lHmBS7ojmt`tc<EKeJ{od2z8nrR7_Fq*v2W?
zqBjIQU)K_+Vc>Ot$yfy;@gdzg)$vxay4F493zbSzXS_;>j&V8YNeyr$>t?#ivrW`}
zP8->YnxmqUsE_u1vXvPBg?ttsl63xFQyaJ<_{%4_q|j>0fC8D?887|dD$^H5t$Js1
z9*mY7GhXlrxs;pD7RU=r_UeTBMjcWYHGDtSzSNg0IC~T(W#<kv4Ci&ddi4N%Ygp`Z
zdoCpBWu9sjLUut%a{K|u<^LF&iBZo~#A_QW@8ZTxZF(a^7laZFbE34OoY}bUO^Yv@
z??kN;MQ;L+{^Yp37x3xGc4v;8yvg%|hB!gpxH(tyy*Te1B6uf_uOH-oIk{neu~k0p
zJb6-$FL-`3`umY!pN3DzvP|^;V`MI5s!-jLpIJ`DfAo`O%b!L1`nBvUo-1an1%>&J
zOnAtzHeJ7Ms~*&h_vh0{KnnGStAx9Adg&MonaPRbSbI)f-o)J|+h~k2O59NqIwlf)
z{ZZy79$aZPCNf(6(Kg{8JTG)i<<IxWIJA23y{j=*4(g9}16>km(=k&|?~n5~xg_+3
zdC0T6KmKO;C6PHDbKS4~33pmAiT<uJH`we?3;}s!*p6G^_y$OiO*|!dKUkP)4J0Lo
zdrC<kx3oGxko=_8Q|8zQ%hN#vDbGM&vZlwa&ZZBfzBKWYxBp;uzIq_-O}Lk$*Kup-
zuLJ4tTfLNTf3SAl9C*?Qx~v*;{G`YKH8TIt7@3U!myucL@@@0$`$jfjzX-hx(|p4<
zpG<uN(&{eEYYl(si|`G6p?7id{BZ4Xn{Uv&x{E78!*$=;Zr*Lvb6raxuK&yQ=KU{q
zuA9}v4Zk98KA6*U+x<HHajWg-qu+IIhnvHV3^qRkn?4@MKSJR!^9$vz$FpmXG$AAX
z!lm`yp$;R>{Ox{`$Lie?cSc&o*!`nS^*y+rjI<s#^N+Ew_uzX!(xwvWALpfiNoaVa
zUAx^s;dcEc(XEkBhRh0SgubT)|7eG~SwM1Hy{C-!=x3YAfYcZIUh)p3oeu2*>F?^j
zl<$moxv}5MXw$!}{$#Y<+w4}>m-@?Ct@oonHzRN5%;|gU4v+TUX}^{GyWZPiYqT$f
zJ&??H;tGy`jQZFtFrT;KikbFUe_~`{f%FL<D~GXxCka=v|A$afO%+9TjbpmU)D4aw
z)6>((>FXHdaMq^SvsR|oCvDE3wp2Nr=zR9nIXioe^CZ{vwwjJ%ZO&*H7Z=Y9=k+e8
ze!>gsxd&bMxZrl_>ZMDUIxdNtdS+Q%&iQ;<!onx9(?<q(6@Tj5)7#fPyKg97zj?Fg
zrs@NKpB{gW^8tCcZrySUDk28?_66x)yz?U9F7e*Idwus#L_G-fcv#Z^(0DmS(~;mf
zNHDhxJvJC>ofvlCAzUXkB5oz(gma|6U*zkd$TPlCe`ry!=<EMY7rhd5_kRUOgZ~YT
z`uulb^z46tQU52-kx$-_Kk-@3xbQy$qfA|tNsCVA1~O^UvS+DGUGx#z`#-Me_rG1y
z|Dd8wQM9J$DH9d_hZ9{d31*6-|BVw(s|aO^qW^nNl>8x~yS8k;Hs?)U|7KlEL4C^4
zhMbQdKQ4UCd)b)zKS827Rjo~L+VWc4{=<nrA8r3o)lvAf<4w!wq3X_8lb!WToo}}~
zOKQ7cPxVkXdn&tnhgNz&H1t(8Q(K$*tK0hj>ggY!>u>qh->}pFZeVbrZK$?uXl7t&
z{O3^X#!$n~m-^MOEgi!j|C=Z}Ha^KjMb{>}hbET>zI9H1oBB5@+V^{EXl!PEY<B2>
z6h*%;jL!X7-Tm=xdU0}badB&LYJO>IXKCigueqIH3ybu>4(NX^uPyGaEv^1uS>IgS
z-(1_=`Tc)U(cXr-tzWd3ScaI*$NHW1g~1ZHzK;!iTXp@*SvHLy5B4^uetz$3l==@U
znqd+GmMOxRdh;yM!T_CbY2iHQb*Q|k%R1z6zMzG?M*_eF97-zPLV`zzoy8cXd3}2-
zR<)2nKT;?_U?yJYzP2RdXyL*olr3n~Bm6j@&+KizP4aB=2^vibu31AT$D5z`nG4X6
znUX^5)Rar39WMBrA<wz`%xAXsSV)H3<^Pz^uDMrnIZ~zy^4HV5wS}jUwwpeoU<Iro
zCRHH{k9+p8{clv1=ai;^4|k7&L_hbb=j`v^!ekdxrTSjT`3%M=ruuHk6$(G(h8ys{
z>b#m;?#ti<A?m<VFNJ|V#>ObFWmdA5<Y!jAA^#Kxrz-JI0*GdB6UU<{G2zi*2PqR9
zk&Nr%h)kCIXXMQW&v&8G5>;I2|Dd8ysCUpI1YB#y!}v{OLbwgr4`)xsN^!X^MWZ^v
zf~m;a>Az9Y<4jbv8TI&IsOVf0NFDWA0{G_eN_Rz_l+ER%W*=ivH;l-w=s&2aq_yY>
zmvE0{6Au?yw@@F5l<_~wL`4(zPio3eNpYF~K}D++oAm#nqFMP>a!gcIgNcfUotE&P
z^@kZLHJ%I-N&JI~5)~Dw%F0v%(jbwLe+qNY?!Qn``*n-@6WTFq>UjPEIrVlK;yc4J
z{XeLvzK4~9KVYIyGVvc&bcUVNd%NX$VIA#3;D9x9mbuA9)>(_jz(Adn{j+~i(MwEJ
zw4+-TT=-f)^t4{iQL+0v88t~vR5VH)2v7VMDjM(~RCHLXu&M<m6Rp2)+j$O_8craC
zdBO><+bL0mG1A^qf~}{aqCQ~k8MvGs$;|G*15!&TSpAi_b6X)8$kVj)ji0=|6Bf$i
zoQ+MD28w|G7gSXA4=QTIcZe5&vCaY?%>EZD%Jy$mG!=A`424Q`Fi}y^{|6O)O|XaN
zxFXnQfh{cZSQ+x;+RlhLmP|}IYqIJ8go-w^0Fk(|A1D4nMb8uB7^QfzFJK^=x+=y$
zg2X0Tv<mps;{|tZKnH#vBGlE71IJ_8JBp@7**p|QbS_1XS<FfZ`_y`UHs&+gp2EN&
zMGsT^!<()ov9k@30ZoKU5(Rwf-^^J<x(7&mSA^lA{)Pfo0}&Dg@fLD<w;zwZ&;rIm
z<RcLQh`#Ztdod4OkJl$|%y4?sbFkDT99oKKFM6v`i}M}wR6u3Kp{<ODDUH!B--#0r
zDNd`nLV!30YDB*WcyqE8v=b64csFX=mg;?Ug_cg9zV`<eeH{0wCh4TfNQ5vT91$F}
zmLU5S#>E;43eC8QX#kO$g}5w2CrI~;HaHBNlm35EQ3aHBOk~C3LZYE*(o2Ki0)!|`
z6=?^ZHkkDTen*Zp;dMr|>H3h;mjAilgP03^%odEJEc=e>t-NWR2%GytxsvXn7#nw!
zLF>KBunl8AZ&ey`_l&If^{PPgi$!M@WKbth!90C6zpfmv4^wuRF9F5*zfLS9-rRo`
zlGYY30JS$vbg#a!4M2653XK*p3OA~6`eO*^F?lWmU2IkxpR8Cx<q<=Hm|iX-Ed3|Y
zo6O2i$frpP>X?=GvtmsS#DWf*An1*okL;w+ReQ+8E;&)_`{I=e^I14o=_en08opB;
zYr4#9Sn%s{msO<$ZSU1T`Or(fZsh1_7(%kl8sbt$!`d9s`f(rA*iibdqo{kcQ=D&V
z#bg@B1}`1EQ8&5#i~tF(*mCc2Tn$wfGNr!-x%m;0J+86$ZRL+l6HeZ~ed9{k7q_!k
zenk_%m3<%A^Bv<I6mwF1vQXnV5-Q?=(UlQ;rFEaYfBFt)HgxJXo6FG2vOBQ{*M!lV
zN#C#ggc+=<o<E4m(zt{3Wi)gMT+oqWA^Vx^pbO4^<#ns?+L|KR?@XGiRumdv3O(Ps
zN3nfJbq~c*FFA9JeR_s^5V7C<{MDVbL9v^1;(WOkkG&Pay5&!f0S@R%dA%xzY||#=
z5T}0EYa7omUiXlS#kl79&I!J>r#Zj5Cgzzx{FhWlpTAHohn|*0UL|igzDlUuBw^F3
zS*?H<f2xF~_?ljgbm%z^DK7=W8!eBYrwzBBClLj>3|1bO9JwY~ck$6?$S!|8fc;8p
z^$I!lil6UXp<Yy>s-5U;>&<}mlCT4cdER+4<sy5~{klnW)hBEiQ^AP|;tQ5QYktl!
zInsdX?G~$<VT@3YyI4Czod{%r7eh%dQS}qASzdL$KG)^aA^2U#b&_Ky<hRnCg4>lh
z?)A!Wg*zX%q?+NAA|q0imU!zsm^Z!&&OR;|6&LQBh<`-8v%GT=O^Iq55gAAX{!n`2
za>FivXE^`jgw2_iuX6Q|?d=?5VLUpjO@iONn?N$FHkyF1V-4e*52`yr4g|rmClPX<
z*kMqwM2Q@^?#pSm6c5|GU#6q+qlTFjn8@N>6Z%4<`I2z72#2lOkBYP0w)Ww9L6bp{
z=C6R)7)0*#x8RybmUS=?cP>W*^`5WtGg$a<mIC=V_Y&T1z01GBiZj=&`9jvn-*@Qc
zx4>}TWrKWq7&~2C%h;~VR}<PGfPIU2*^PcATH2no^d^X#Ev&xIXnG)-qr+-{rj%sO
z?di)Qj$90U@cYwMP9n0P+C%qt$RRd_eJX_UiNNN5^tT-f<%nLR5a6NL5&lH3DWbq#
z)Uqmpl?5rK^GJ4q*VmSrO9)z{gDq)nQ*^kZ4#tFPpnK-#prmwgHFuK~Zw4Ow@JXnN
zfbi#I7)!cw293>@#^%A~w`lBW5C${Doq+=Rv$E;j<zAzxoE3-p&)hK8i7ZpQz!Jc=
zOmYO_KvzNLbzeL^1s(^C@LcY&StGlEJb;y0wQ7#Xx3(V>ba-3=tl<_>TDEq`WDYXG
zt!wTvk+B^`0`o*IV48TN)9*%Gs714#jm{W}&RyVMLviNo#1sf{s{D>F%7`hhi76e4
zDcg=I7l^IYiLG*st-c!@MnoLFi$1U=pwAHYP;t#y96#0=Gz-MlWW@1!K=)YLUS^<8
z{5;vwoE~>kY?2|7S{Tj+DIVet771dfK*DlA@-Yyq-5M>>BmtiCfcVF=5}ElS-k`Q)
z>`n39EQxDTkPX>{{cX`?GuFCtB(wAMA=S|Yph`sfHrc~H@IXtlwyhtAj%7tYPoM+X
zWB~VEBWxg$3pZP&;i2)YQ<o3RktK7$m-ABF6zL1YNmf-zO&Xg{5K1c3*OCTYU{Il&
zgu7h%@O4(DgBqb<eyCY85~!AH<iurmhwTZU4H3YaV0V+_67H1g3I9uY=-?^Cf&?NS
zxF7*spsDF#U}t|Qu5xQ9QY9qhP*Tw*{&a)na8^yafvR1)OsaYcR$0{;CG|tmh;%x>
z9rxl^N(w;Q(n(O)77EPcJVryo$zV_(7>Z#L#h?;Dqa<k@+(dXM0G$Jg?Im$2<*SNH
zS}O8nNzl}1G;Kn{5v2oCu7fw=b|(+0P+zJ9DH*R_kmYK7Go%%F?FZ6#UZHzh0s0*K
zqcZ!(j1pv1jMkF=V_K1NR@IgS?&5XPA%WM!<R3!>kEsHIETDMCC~DRg1xLX^XL32G
zShD2MC&{d+)!Z_jhjki;8@5@n2u?VcR_zR@1jh1}C%$dS*v08&02c>5Ir~fHvwLJc
zuT-T#zMK}zWO?sv?bDox6msp1!i(pMeR4VdazKv_F-t1>9`%$CJ|8mjG~o=C9fLxV
zGiCuGd1~e%1=I-uiK1X}POKxU%zMj#5!>7oyU&4Y&yUHYcJb`;RKT(mDu~8%%r^HC
zA@>mQ>=&6;9*eLOf?ZYxQfNqfd6Z-Eiwm7G2LM(Dg0}OlnkM0n0{+T93PhQtq)IQe
z9Y6+-V%Wy)lu__sEo$=bVWJu@Z!aQ=p^$coydMm8Lwt&fMI`G69@ufdC@|)aB`SIq
z^-vC2Dxqju4l4-r1XzMJ+w+s%0WSz}m0~0c0E(gK9|Bn56c9g+<CiT&tu})fzzmaN
znI)CfEh5XHC6)JC_{m^idI4)5IMIm}MMKKt*?}y8T~#2I4B+)+85jdd0zgpA>!C&D
z*O=F1ov%x4U_9Zhlxel5%gTFLHA}2q9adR~pjbygD&V2kpJ5!aW-uBmt|{{-RRX4j
zdy<o-Y{P*$`q;Ch9Y;pJG2w}mAisK_UJjg6e6t1)!C4-nIL`uEmqLq4YCv5w8_fv{
z#B)5N0%9O6&NO5Us_@X3C5G{;0AP#KQb5UfRVtTM0-JK#r&wmL0y<S+f4Q2vCWn$I
zvjD{b=6Ypc??0zQVmrWI{dR<gg@DuPC^lKMc~IQXx3R1h?*#orXcm>RQ>DCsOr>k=
ze&d-a{Bzcdw>l+nwfCz1OW02TM83a@;sRv8b%t1!AkWoR4P5=(62&4Sf@|!pV@0`h
zu3C%lVgTo?5$yEmzie}F#lB~CuOa_LW_5j-wS~gV3jmZ-AhGh0%&7teVaZ5Q)ptSE
z_t7OtT@1@1rmpH*U5#EWmqT2dp12U9>=4fZ#g;7Wd;pzcVYkivQv9}G0oB=6e@p=&
zgsEa%MR1V;KnC`81qQ%QX3HE0aNz+7*8uE*(nHmcbHN{fl;pO#H0}~pg^7)^btqH8
zS~Dlqf!=FINdc=q>fl-<_(Hfmxdt*pu~);iX`W@_f~Q0&NN>miB`lX`ks<}SW<iYI
zZ=qkd6vTz*(=1JMl*e;xoEzs54?&ndYLf(oV~%=yjvNe7hs@zIG7~MTK+GJf6{p{7
za-r4iL92yGYYN^#@@LEGdJHzF^{jrIok;5}SF=q{+rgQ(3lnW7-5jKXHjh%VL~P3(
z9d>0OW>g9vqqSYw=k%FqH{xu!(rOQ?7sXz<X;S{lXo=00)@~dJu@K=1t_OxHwm!g~
zzr(2Sm`VC1fo;9c*?}unKl=dmSig0d1aj=|$XPm)pxFA2_US3A^&5u0(T~lQWaUkP
zIiNU-MOq68kZ*KY{|4-fEuw(NW{%=8zW&*?G<cb5iINbl-AFE@&|PdZ#2?w3gV>^e
zrYZ_OQ*13Df$A?Hu9>h#V?q9uW<IYoedWMg57-OoDMqRgKpOZpxdpe>WjbMgG>km}
z049(S=p>{C9>wf$B8)gU^x2=FdVtG<KQADDo3;A;^;{c*&Y{4rlxEHz4og(;j7V#$
zNUMT+XTyWf#&OwTBKr&$y?vdzlysw}pe!e-@~;Jr9#D;Qs7Cc>MoUy4#?xlx4WLon
zX}*VDYCRmT)9~f){y8di8S@arG5~akw^G1gX^=7us(}I~VL5?GFaibKMd(`rKu9Fy
zL3!T*2DOiYxWFN1pOG)I;4Ummwqd~chTx!Lt7?2t;sh0`)LU5&d`g4M4?>i9T9ql(
zFDUrcCAb0>YILHtb3jGx$iN{DdYS^Z20&bBNK!d_GX<PULq1n!|60!3O6a?Shdoq<
z9^&Cq__0IGSiz04C;<2?fqhgJb>rY`^$|h;BdxvDz;CKHMmb<4Tvi$1{z!)1TlLda
z5PKs)S``ZtR%#WgdJ?aMDx-jBsBDKc&=vu-LLbRyG_ZYDMQwM(4*{_K?$P2C-{zDc
zy97`!3HIXDxZK0>jUIu7ec681wkggb<DBm%OYp;sh%w6dup@92zmEPMl*PeFnJR)n
zn*3@zdPss~FN0>4P?F2YY5)YN2L180PY3~7CxEI*un(wjLnprfZkT?|()xuabvpn1
zwBlzu&Y7r-2vNyN^W~8;Dh*jSX@Np^5kUJV`}%T_f*+@j98LlAW-n1;B{%xydZ+Dt
z1uSV3z9KYD#N-128uo1lkvo|l4+@|`k&lpfXdoBLH%!@V&g=OD>bFz9Q^P0NFJfV9
z7w7I92n3em6myIg$<1mf4Hv1W7YQv0Mj---V_l^FB|(c~C9)6rA^RSncJRz+falDQ
zee93t<mq71#b7n#%45+S5>4p*FhHn+uwu)6<-+UPCL|FYVEZ%SAy<R#PcP-g`foo!
z9{!|=E;So0wYn}b+ut3zOPwE=y1y;;9xhQumj?`%hg_GxK3X2hT^{?mJn?P$+u<@z
zbS0$7)XYJ-a0O|;y-=K+rNW01Q3NU-uCU}cg{@hz3_$<NT@l##3TOGHe)3nb_b>U>
zU)Kv3r+trLmljg!f4QVJ1JxHMr<;M5Ep%Uj<BAx~9Gs>t0@_FKnx?Y=S9!nxLPV|}
z)0Y)d!N627y-Ev59?-v_+gun4t^23fG*sG-sR*cttefSmt1?9N`qqt?)`{p1oZ)9l
zLjkjp4Iak&AdB=#n^qH~fOW{mxnKPDDjN>JHagM2O-_R1P6#-x{5Iy?JfAS<`K#Hz
z?|1i^b|10U=+#YJoIn6_>pJp?Q^>k2sylp&J!F3~_@=-kl`Ue(R&UalM&s{?#O>&3
z8@g`8K5w=o4MpN?W|ABE({Ao0xNVSZHlG;oP?B~C`#bl<cb_-z*nQt|wb><q7k*8J
zyrxjkF#b|H?C8U8R=EjaAMCk4+k4$8qO?ZE{bJKBM<xacyjGP{`@E;k;B39QuPZ9>
z8JW`Dx8Ccv|B12Jxf)u`@NU;kXd$ie>k6c3fB$Q$kAH@-<>Grd)+nHT4tI--v1WKQ
zq<h~rZejfyW4Dp9|DCaqL_O$)OF2?$O#vw;ik>6XssD$&`{0J_0oz8ur(pEaJA)xa
z@14QuA|iq$%4pF=4-(9n(Yxp^gA_#c=t+#85Yhe!B6<lC5z(R?&vVXM>-`MxTKfa+
zz1Hl#_T2lvuAgo^gOJ&Co3UlRWDYSZ^vrLfP71%C)$^tP8}d=2cWPX|j<1>I$+(U@
zzdNyhqevxqclGPU#!aGj44u%uN%t=Xg4vQOhG;^r8!tonRu*CFPW9cl_CovdhGLZz
z_rt;_owx5cd5ndeb51SJG<dG5KL5SBY1bL{cXw@W`j<l&j_m5c_8ll+oiB^jgKBmp
zZK|U-qlfL+eb?c9h5LsB(XqLG#d_uowzCHwlP}bw=-#CVdCu@YyRm%Pm>%0nY773g
z{%!8);UX#Uo)6bttM@Ab#>b{+$RGZjV=t5<t>*p&rqO8M+*tVbICySG&GU%vJpVRl
z_kXo+-xtmwA4fkO7m+FsQPDKl%K4+?92NmU)PJgv3ZFbAT0!@_RX|)pd$M3A)w&|+
ziSr%_RNNq@NvC$OrwiAeyipP(-0Roq=AC59&soCo3(fAVF4FhvD%kUu&2^GNpYyNS
zM*nt*_#2il=8V4$kxwlHJ|dqcnhp++1ir~$4<PIt18%n&p7+!pSfC^{R`5gDK6qC*
z(&k$R-cXzix-F%I&g(TD7XF>4$Fwy$(K&MO*5+Fc$lC2TEixZd{!66=%b;8OT*2}}
zoanmo(bST{rxvCuCf?(wYVW*n-|R7#d1qjv@YmAv>wOVRtNX!!@7Vmc6}fZI>+N5w
zPOFq)Yx~E4|4vUl=nJ-SN>Vr!vcm;uXLAL4BvZR<@f)(aw-JREObD&R4DLs*J4_Fq
zHCEFDTI<kXtz$Go>_X-w6z&G8X~cp7ZoeEEY7rQgB3ir@0S0VHrYU~Z1^j@I_zDh8
zhG^Z1rAY43#<ajR>F{))@<9MuYrK+W@Hdt)m&^>pk+W`3J`oov<&6Cvtx3r)m(0-4
z+Q`A(OtU=m9z?`cdMcW^yD18@xti)qhIza!WZiXneuUNrE)%I6dJ{EvB?cJ8=qO(i
zb7?c%e&CAum6tsJGhcaHJH!x9bmsPdz7`Nv+ELU>LA3#w^pvr2>*VoJ+e;07phw#@
zRQiBk^0`n&j`X7POQLSIO(EhL?r`&Gz!U$@qMJqMy$=m0Tic4>{bPNc29p(b$Ag<v
z!*9MQZaxp0KZy=Ml!};YM)*hr2rvXV7Uo`JV_)Ei?oJJR5WTqAx=@%6U_cZAq7@He
z-X!9=K2fd!AV$O{9N1jIMvt(-7qLL<6uX}luop_C6BaqcaRERVfQ!%pO%#$))ouU?
zzUa=u&I?JlPUZ3j0H))Tbyx$%ZW#R&co1-@EsTv0FvUWd04%_pF741tA8F7C1!uS5
zqRn-I4=csh=yWyib@Mo#uXePxt1#e+FG3EE8iGF12#C-D5Zv*9V6x2vAR_iXfNd5B
zVfU7Pvga&<AiP}=-uYT?V`)BZ?sOb(bJ>kQ2vF#D#KGW5H?pr?;P>k^KUsFeOAGnA
ziiMznav3Xtz$q3vg2<lW6F+otu$@kWq!&JW+MPMEt88k+GvSc?rhHuAU<RE$0EBYI
zRz(~O;+yr0d+p*X<~rVExeH6ja~XoK-j=B4u?Th>)E~?tdNccV;^@A;ia81(WCbL<
z$|Hax1-$*T3}n=a$PK!rPz4C3+&a>L1ogPqz#4Vh-RH5)Z{WQ+KTt6>qKoD%woO6v
z_v7zFWplPl>0Cj62tF6*?oVMb4~wh9R`0u_4-r_Kg36E@7kAx2iXlS(V0Z!-jFmP(
zUxmCY*NJ+)UvY1Y*4+!zt{yM@5!M;vi3f~D23SOaak?kY@zX(EknVbHI4{8sqT+l$
ziGu(7TkB(ekRufj!_pBY0?8bwXp64vkE}gKFbpD@<TfnwBJt2+aUrTaj$0xUlcml=
z+k*%yE1HkP4CDzYZt5#@Gt~Uqn%^>ts0>#CFaczsRkf{nV|>vhh72AJ)V!bt>JAWr
zO`H~>Me576ou)_~lsHpmD892MIGHpV`?ngEuHNnn!ScZ9nWf<ecY+c5y46mU(b28V
z%$4N%0L>WZ6j#ojmJXlkyAQXCLY%8bpT}bqj}UqeHecS-_-)wNhsEDR4s%d;VWplp
z#(bG71DKC{W$3hJc-e`p1ILx1KI*UXr)ddmn^=%|X^KYmBXXLGm>qEdkk`)vwIBCF
zS-Uz9yGvQGDi9QCy1wa3qoPvb(VJC<=@iNPO#8Zqp#%SJ2M18&sw4(1=Kd`l=RhKK
z%zHpE%-liyVT&xI*u$%z&FzzrK2Sr+dh6B)=o8xXA3Q}65b9q3Np0sdckCsvpO%UG
zWmgm!HZ22$Xhhr4e}Xy^9X^my05<@IZauqnQB7a*v`PbD0J+He)pUReEH(53aU0?$
z>S56dY6RfS8kMH}HR|1S@-7&WJkp}8%B!>CvME`WlB$d9;Xi%otg<uDTlW5^FM|qQ
zXtqw%F|i{&h7x&kDpuxAvhBw~+Nt~<xZ`N=l+sv-7hv#tTOUW6WSpFBvHn4{>a^)v
zlYylj+%9xN@Qq@;RA(5B8ooG{7n%NC?A+TuX>)vdcSLDF!OWq)n}O>oa$Fw3QU?{z
z(guVyeU9)wGJQP%?F3yJ)`tfNVY?dxp;gmAi2>#JzyI4!Y5#Tp5KF<0x;$BbM55hg
zi=wt&qIPTbfJORUrGrE$A09tAtOLl!7jq!|Ac(9l3DE0Wp{+Y|LM_@;tTjxB_8o(#
z9&=2+Y3ebq1IQF!Q!|@(f#vr4c(c;I6hv@SYw;+sY~7DUx%DMRxA2KaI=`ROR|6F6
z3zGEaSnm=;5G5QN`YjVX!@3Fr!=16L7;L5(39xKIJy1ko_rs_$lxO}bp4!3SnK1gV
z&SjGO@4ce^enqXNw2udF2lZaNxMnVO=K5o2YTA`Y-_7Arn+_flz4}?(O-dyXG<rBh
zL<|`O_D<eiqA>`44SA*&D>d1bxRdSgOb)1Pcl$%Y%&7SkgUi8jmdnSB|M0)5U+MF(
zbOFrn_-L^}LV0m84Wlv<#4vNbLMx!{W30!8w84T|(`6*lC|ZO$3d+4fO(TK=$sg#E
zPfA59#77}S;(<PqFOxL#T_6T{ccoM<HPHF4Syn4G320}ChV8KmxnrSq*x8=fFzicO
za|l_hkS9WmY!KM60B3Bgx;c`eoq%pN$<fBwF!K)-KpPH21_6lF1+vktQtB&}jH<by
zG7T#X`_+0%!wL?-01LNizEf)oc(*UzRu11Pc`GM<`TH3F0L+G^m!iA~W*HE+6W8^=
zE*$|ezZy7EFd`Z+Kg#+j$AZ9WAdIM;A#e#80!O9T3z8fK0-MwJ0q0&S+FJ|5b^wdI
zR$bUmCTuwf*)kqGq(;sR10a~5>$cTGV!U8f$BqYSyNz{;AK2GcV`T=&20P06wWFo$
z_Whrw=*COWHw^0%DJnQ6;aD($E6mqDvnab9BO`+WN=RUw6Gk@r4ndQ|FRtUL-YUqf
zEJeW6HA02eMMN2~G_6w9#MqnC*y~N2s+sC(HduLdaUi9xco})k90U%uyy3^%x7VIk
z#c0IqmhATh)b%`~xq8CHN_R=|0=?iafMygm`L(BfES6QhjBg?aD;`G<M-yh)-Ol)^
z;MfaCzz0Tw&BtkMs$P05sWXC00}~a@J9}84Xg(K&g)quVi}6AbI4MC;wHo$W0G3r9
z``>muYk;<ge7t`V$zkVR50`!k^t}^JE6t`ZSu4m>T6&fVOJ*)Wql_Lc)t_wd-tOs7
z%`4c?2dz`~oRzT&nU}oPCAPM!TRRT~_yLcadOXyzxQc<Z_D*~rKv-1<u%-5A(BN>s
z{V?g`DuJ>4@*o6%-bXPQG57mYr)j6U*+D1cWGt5{suECptovcv@tK;sA-E2l>jJcH
z>okeULKaDQ;JMwf5gyiGBL3O^-$(52XtPe<=peuW4p5s5P}}t4MBaH4K6wpmRxX0c
zMM|K1F_+S3JQOgjh993)IF=&5d}vOg-WJ<%&>o;%6aQ8Cj1$)U{7p-BA**+vasw}u
z&Ikpf^C1{ehHDsfVZ}_vrKtgmQT@+g6KDXi2dz%M>Y2y#fl&4MJstkCB35RB8*|!_
znR?YS4NnwkA9n*klV`#Fd2HTj;wssz`}uJo`8XFsa&ve(`NoVo7D6O<V<*n_b_a~=
zq`|HVp?D}5qZhp^!P0;yf}c|$cPC%l4M4)d&o`dDN>rDys%t#k*J(PDZ+Tw#?>c`#
zJrr#CT%PLVh3FTQ&KG~^yZ^Sa0)O(P(Q3mqxqhS7r%h0|F>*0?QmLF!r)jyA7{%og
zuExVdJNJML+CXUhCpmcwpT^t)z;99r!N#-9wbmr4?3C<aSh7Lvp#WB6)O^PB6KKEt
za!W`|o_{<OK^6*d%EEkL09hCN{w=(;xEAy}Lg>G~12OC-5&-)FREAjUioubCXAR5%
z1s1ETOb+z~z<Ye75O#_g03ssAcn<&v-C~EblW$@*CT~9xxcLYDMHhuA-d44OYe39P
z?pfk%hOpGiK&GlBlTLZJXR(X!Q0nGbuZjpw9*BBV)zckI2H-eEWU2i=mK7B>-Uc)M
z0BAzTCh|YZvV7J&zm4O0jp9*qLzE07K^%#|^=|A<7?!q<FeC?DKB2{WRW`EHbkN14
zL9N&D<{Z#ZR?=sDrq!<)O>8=KdY;M)K}4`H<-r^e?A3iv<E2g3H9c{i!fI4MpF935
z8X<!R^2G`%MX=Ct?1inBNHBqTMo`3eK=)XE5WJ8spypqBx(1Nv|DPnY%m$$YVot&V
z?9`}2nzxPn{JGT9*lV3S*W|=ATpAXJO~1LsKw(&uZ?`pLMsYvq+{9*rC&;ai2~j*S
zl7#KhaqPWgLLsFtub<L8N3zGSW6TS4M&w|gFr$tM+ZJVVE9K%(n3y}xG1*M>6!I`P
zxLr$KpCS^38zVPShBouV9Q>e)v`NFRG0k5gtyOB5?=<4EfA25-$KQ4SZPNYLN?+ks
z8^welwq~euRU&SY$NtB=;^mZu@j7sSuf1oh-Ao>rqshY78~c5`g6%&0gBuRBOLO}^
z->p;~{-!vbe9QP9?C?*6_4VM>lWz_eFPH_4qW{q@-bs9FvgH8LTtro-$TMKb-}4B3
zrGutoC}SC4xyO*d$IS6FsN`elb{8r585z20X?T}j@Mp6A#xR>X?#44y3p=t2=PQ@u
zz*df&HIAPFM<CLXCxk65{^=_e4I8BsKd+O3q?4eg6Vl8{$lgiV*XdfMlSrzQXo=JH
z8Yi*$PU0g@5(`d}yH0{7(6PZK9$x1V&{CVS^QF9*vx2>|qOY@3q_cABN}Ic*Y|V;u
zMx0eB0Z9aD?mBB-IHTxXw0T{0cwN|R;#ovobTnNU{6Kn<E{3TtMkOxBH7>>vU<S>r
znh#u<MqO@RxR}$enfJSxue;pRT+<1`lQlbAN$S8QpY|Ej36?hT9wu`%({R6BV}HN)
zX>iTz!WDCv;O>|5DSgfTwd-IPjl-0y%&qkp_zEWVfk#b(BQI^g^m?F4qNM10jE$@D
z!~>g<q}9E34@tK`d&;o*Eb0s@Z~Ycea%O+~_`9jik9?CuG~J$zYy{CUuETN2Jhw-w
zSxl*J41jw$tGk(K{NoX~SVgz6x<p)L(xqE$Ys4XaWtSsfu_bZJfhuf0+1EXt?t#nu
zHCN5njNSOm^_Hjl@mX{pxvA^fyY5lGsxGl>IaXWj&07hP9wjB~Pv3jQLpGw}v;m6B
zrNXeXU5^(f4}8q%+(T61!YMI1trfiSmG++1&CWiOn~RS(43|9n{&<Fscs7tf5GZwC
zoO6r1aDRDwJ4({4HPy>~+tGqwr#;83b7Y&1$<cAu>)nM{7o9hW*SlNNyGPTz*UY=m
z-n-w|dmz$#FxC5GiT9@(@1ghJ!z13G7raMyy}w*|kJ9;!@%oHQ`b=p0Oq%)pXYVt0
zB`!qz%%u8!E%BMH@tJ$?Ge6?<ZNcYqVb|yTh0h|L?-H-?vZU{drthkm@0z{uy07m>
zr0-^`?^cQLj~d_Y_r5zLzCRaycXxe%UHI<NJ^ao4a9{G_AI*mcW)J_`KRon(c=Ue{
zDjMbCI|wx*l6h4GY91wp<xym(6C_YzoohiV>}1);e>5F}N)fR#D6l9ynHLIz^aHD4
z2)8f<1w;^Pk3v5kj7*1EV}dNcQ$Au3LZTpEp$BSpWKr>P8b=h4#2{2Ux#jn08>wKs
zSCl#;2e;B8$X0w-E94p~S^`C|eifuH6=XCM?3SBgZxAhGL+-Ib9t9lg7(|=yQFx_C
z%Pf*x8XUUu9p(6u>EuGuqajhmL+{+fEW=0lHz7LT5Ay&Dzrncdx<^l*B?JK!5rzq&
zh*;NFipSR;iKoTgctj@e2X@?}Fm!)(snZhTbai2^P!EcOJoccQ<_SUZp#`lFq<g5J
z4OpjzOy?H`{=<GK0QH)QmN87Q$A*dmLB6mM>&=7wK`3$)oXs9nT$^Cpiq}wjB#(#<
zZ^dgGo`^k)y9GRw2M)qee|6YGq5z6(n-H(`gM4-h9g4UtVi5W$&OV)RYcD*imBJcM
z?vxJof|FbOQFs9-3VvjfelfS=!WxtwH(5V!wmua&f*Kn{yP_bX(vSV5f>iwCvIfbJ
zn-Cl61Cw-0*CUEYh@d_Sg7+7)sLfCZiZI7?g7=5Gr$-dSQbC_Lp6Jj&{y?!$`Vw*z
zI2pW2`N)sV&^_cT&mHt7<Wj|kJWrX-`H13sE<QLe$P4pCbdh4@8lmOr$s-Ijk%D5(
zAUcv5A}SJTXb`Dm9ogp)ffxwsO*=75qqv76T(vZ4VhOR&;$og1gs@%Y#>d6K3bNUw
zDCUE7Ts!bzJPT((Oh2Ny3BZuKXWw+ApF0R6oo(A>l_iTw;TOUd)$YFq`ja`80(Lfk
z3l63W7-Wij>?1#AUAJ!V-r5%$&XaW;ulD#OJW{0kXr0@6?-i3*K>A?D{-4b}1w+72
z)zfddzw{B!!k=p&7jvrbw`!wx{Hvs+N}!DLGrz7gzPaDA@4bB}G2a@nG5*HuNOGYw
z{AmBD*!Zgn&6Q+T3GqwO+#(@ErP<T3ZUQo87sqY)`svG_)*5!F^4RQQTvVQlIp}A8
zmHIJRW!>oe^HgDHronB9d?)CxRCi32F+bWX>*+Idg~$bUnX4MN+hYek)%kK?znrHF
z-by931<ua41peARS3BNY9+)_k|Dhgkw6dI1-grN?PC`qrP3KFzAY$TF<lc7Xe6iNo
z6G)C$Iod5p>-?OJ=&`DDj36)=EAz*&+-tRFi)aN82|XGF!H`2(IVy22i6tZBqn)_S
zM7H*0fn=Fa%7Q5h%@0zv&7^~kBQlA%iseab%84m@oMFgJqw8(Rr;1ChbGOPv%VyGV
z+zS)Rx$D^`lsl(!N%=zC;vjSMrd?2&aDhivn{c5|2r?_c|5IfVH;|do%lN0Y?b@@5
z)01mN*$0f=0yxfak+OvA?G<*r$vq;^GmKS5Uu5447k!!U*)IC3IQ&$!qBK$UdgY7g
zX?iV|-xKr(m1aR{=o(+bb^YDJM20snf3%C$zN;~UF)o@SX&BL-z4VOf@vd;Cj{!~O
zoU972vk@FZt{G}Er|l9g-@?5dT_7h<`LJ9m4ar*W-ZExd8=71adY=!+Od>a(f_(I_
zMTZg}&QJf<dYviP$7r33^K;7BZQA@NVs}-vt?uj+@E_x_(asm;gpa=~H1iGljo9|g
zCdCnp^Ul;tD+`xPU(~5j<n-Cn4KorndqoucHJs;{(84G1<z9Bj1fjlRfGa|N+^7Re
z$@mp+Vxna>xb%tf$WDj?IT$O_$J*qsvCCSM3}TV^C@Zm#zWpMb^7ZH`)6IG*L4Ha>
z!%^APn>9~Zopj4h*XWcD5dn9kjJYC}mlOUdJ&HUsY@8IidpD-H+#!v>U}~^b=9BsE
zfqwy$yKaB{t<2+<W;Oq`jJuO*TlZP{nLaM{io_!_Oms5YE8Z->`*#(fzOP*0>--Ke
zW+43WrhWEW-Zg3^&W~=4Uq+Z>>=`87)vHdn%u~wSnWt*c!nK#Li@#F{*3Imc=<2xC
zJS)lMu+kVXxonL2&u~>PzcKeut@v<`f1JW*xp$@^Y!(q6dwXVA6KeyO`Js<|#y#r0
zqN5{4m6?zLr*m0}Hx>5gk2&nCB?zmRmc8E~u(Sy%yBiLy9!_*#3K?qJ!G<(`C@PMT
zoJ0m*8>i<mD#<6)QYKdze@!Qn5_+9Q)C-e;rals5wy00EnxD8Zw8&1ZzN$Z470_?r
zOq05YPQDoYk7c5wU!kEs#rKII_ln4X%6NThNT(q0pNavE{ra@XGeHC-EHiQk!grh=
zr#@Sn8j#h)wa`i~Ps~Vm*jr}%7{97evt+2>T+XvEy{c&=G<YksAxq|Kocbq_k#Us{
zbD>Qy;__lIR`v;q`bMiOLqM2`IA)33K}45hfk>fownUG&fy#>FOl?>L^B(32Nq8j;
z*|Iw3eqdgg5#^`4GrY_;+N!TIi=)4t*;o|PYoOMdk$kr`;Ht1phpFl$Mu|O;p>XDb
z&<Bo@o6F98>ikH}ov~DX<4m?UPhP0GaeNUT{zIQM`ar3+G}XVLv5ZxtNPSWz$@-#{
z#-`!{#{uT%ojn1L#jH539=!1#ogO0hUlBvScFH?v%bY*qYkGlIw{N;0uvHNW;wvX)
z`B%XgBb`_JdP^g+^9?jnMCgro{u9L(Z>yrZ4OB8q6ZJNisP))?2%t$x9$EM@@7b%R
z4$>v{iyyd38@Pw%XV3rI##xNcMFynMGO(A5OSFz_F-og4qEA8vYm-9p62<Ka4q1XP
zf+NIT_|P`?-a7Qn2d}RaOX-TjtN4Cm`>no@5?U;rSf|syTyDRf{jW)oqwE+j@z;FT
zYo_P^(-#ESLSozvWI504a|yqVGCF&6ohAnx!gVt*<tMhzuT3K$LZP=(7cE-ar5$TT
z4n_&G=oapxzu)W<hAcJW!JHLuCBr8Q8J?UuG3=e`2Jo2lMTY9KL}4}sLiug}?oYS>
z!;%ZB7dU+Hzs39Wr;rel|NDh(XwANPjQgcDb+9`{<+l2!a2Dl|v*tm`ToIZ4^Kg5K
z%eT&~M-g}t*!&{P{U)BOy-ndxhQbh2XI7M}Cqo_F;&Egs>q#<FUPLA7E_c>z<*DC%
zilij39cz<?nO-S9ZAaGIchiqUf3rF5a6U$@ytTixlQ~z9$s#uPx1R4KmJ445#CPYG
zvHNFp2qmd^=`)VUH)?&Vj~5nqYOk)8@~#IQgj?1czxMqi)LW+B*t^>w8fz)<jv}C1
z`$Gxv*~Hr4u~NfM!%s*QQsiUP``srJKaa_TJo6WS30LxU0uN+)KZ|fy<S9s$H>j&p
zrTn+(%xY?fmNoWa3(ISzjEaAo-TB*8YiQPdA4@_v{f3#FuX3eb)$Rx=GkCRjUvjdL
zg3iYIec4k9|D8&g>o3dr23ez-Z{(5bAItPHzd?VwK_rxGFdAodl?$C?`y;+r^H_O3
z|A;&xV-;E2D%f#e;`9jhL@ewi?Fdl1EA(mBz*7^DAU^bB(luMh*N3#PP(pDI+Cb@k
z24X`XQ@YqdzcfH}hFWl!+h6j@zDQ0oj@>2XmpH5@L$0d}dJPu`E8wQ{F-Ov;i6m&S
zOC&~iJr<guaWd=H#-}xbDMYpm{Etc#QwO7kW{EgT>H3TY>t0&_)+9Dle+KhW6x8%t
zsNQ==un2~W*F4Wqt#dJrcTb4zJ{GODi-S48_)IvOVH<j9(I2+*YMu2`M%bWfnz1@}
zmD7e@&1lu};3>O0Lr_Wlgwd}BDVQ2EqP5YiiH;GUi~jn4CmwcBDpR?_POz;uzIU7P
zD0y*lH}nHcv$O7dq%Dc>^UWKY{n&}@?7iP-2}A`Q%?x{KFr(&?fh0hRcSQ{Fq+`*V
zBTgF$d%BG4alMht8I=04Bmr!lx}NDg!)H1Fi@zV@#Ars!le?8e!3e(|<<V$)I5^{Z
z&rr4rSdv)33K6F<JHJa%!hjls35w8Y_FkM;g1sI=7ZIw>oy;VRB5`22G*?MVMI@F*
zym&8Z4rI?;jc8ue7Ql3~WZCf!c5_(vuwb|hW_l2-<K$MCXsIh9l+Y*C+k+N|$ZX=p
z;=h--;<;y{)ix8f4#50f(VD$I4_l+9ElrFOy4*<8)Coky79@N;p{X8CC2J?pOF~*g
zIZHq<gmfsvalc)A1(>xtyn8hX_-~~>%5Qa~O~K55-Dqq#M-fhZN0*zRi%exwh3YUC
zEu#1A^-yI<)@A->U9HhYNpq-b5s0~hN9f)%$ELjjrd#s3l~IuyqS?Lja0AVWd4
zgFLG97zK0mZyrAVqN_QxwmcN94(&#ob9v6=#Ck^}dMP9<zrSyS3yOn~a2jN_Hiz%1
zNHR{ruylP!hYy~hAim&lOQD(y)=DOcz%TJkgP+bFd)biu`g;!QBhDK8J)HC3If>Mq
zh9pryM@k$&*&C-Yk5?dSE25Wld~q!wwfV&H+{`0-ounF&gMmF-xfOM_@$oBR5lzHX
z_mU*@0M$V-?Qs6|6%x7#h_nK#1iW}WpjQN<9YrxBaayZ5%23e%BB22DfeRzb*}$}i
z%@(5XhiCS~D}-_(ySO=RdPGJ+%Hq1JtGaxKAkKLb`5Kth5VJUWgD+XTEvPrjwO6tg
zCE(XRg#**=bh99%wUA&2%N_}DTlqa9z1}rjUpxA06k?S$;NL6WNzzB?GR6Z8NNurW
zUGC~Gj(MV1t2TYprOt!p9@79F#w#QgrOoZGD`uW`%?#=m{(u+t(#7JX)^M4<8I<m9
z(Ii@!E?(H<$DF}E0;m2uhls<hWAy(Zp{DB+a8Umk3Nd)aqgu*vmg}3(-tdF4H9)nb
zOIBP31(Wgl%G%mMyqGs!&jK3ooJPEBKCG!c+&Ef694E1=!xlP+o?p>JaOriv(A&F0
z#@r$#A*ACTy_ZR1$33#ic&rr};>j~^G&0&3glEJn6p;(KBlkW>U*l(tlholj6aGP2
zqLsC}d4d-<>!rH-MqE~*IOrmO#T6z`+_EBUDe#z|;wce4s`AT%>fa0wbbagyYJMvt
zZFr{PONbKM#5Y+d<UOz6Ac%jpTWAoZjEZ4;uKUpzdfi_nH(VtC6vCihyhBD}!A3is
z;zjdN0u?sW;=*}}m5x8wzJ@`6I`;kwUj81@BQdzzuc5<>6_)MVocoOwQJ(VLuhcr;
zLeFoZp*lXEJyfPpdT<rdQ#3bZE6%>x;?PN<dihVAqjVndx|hc&0Q_yMOw06IaI+qJ
z!@z*c2H)N9Xz5;MAX*FBhrOQ0^xRa<j36Omf-@zqo>xf+X-jg8wWUyB_-wuSgwM5t
zUb1Z0uj{BL>%66LY2V?F*1TdlN_SA3vVLAnR*th6_lpz8_OfjQ1(1{tl);?KJ@xXb
zQO-KgF2sZ!H1}<-)2uhy0-aJ;l2(IKWB<nD-h(_AF>b{pl|gl~(MUwM!l|wzyqnS8
z1!vaF&aE$b09Ky4PI9T#8`f!mx!vCEr8iToh3J_YLvdrlB7=6H>~S!ZbD;(FQ`OGm
zyG^BPM`P(9o~OFft-z1-O0(`w4pV|C6h}S(&6E7+sAQF`$`ABT^z;c{`~Yw_{xKH2
zGg#%NkT0%>#F3n$6;axVNeuTYNYD%#SOBJN6&LZgt-9d1+uAUIIv7oQ=)sB&@`N~v
z+J1wejTg}B{<P{-$eY=!Pyuaq@t*l)YJ{bpW>b;Y*$;Hn20N`7viIu#2MpB>dn1;g
z4TktgL`dlE@oj|rYQQ0!n>{uJvP++Bbm(g>b$8~(*U|?REKYDknr`7DYwlK%Ci=mL
z&t8<v_~Ei1!BA~2cYMX}YpsKA!HZ(87bRLSaT2F^cL70d=gZM^V^why)rszTTeSNz
zM38&);%bvFS$E*HXTTm~aJ(Bv1`;Of-aOSsmM~1vmTQ@IJ5BANXQVDTUykgH8+Ua{
zr%rtN<YJPD-D8yy=Kh(K^D>yX3Z`DiWl8}5gXkIk<jBV=9^l#3b*4CdeqGeOyc%@r
z7x0gv<afZdi@E~wSWzOL(wkd#C%0<kKdE_M!%?131-&K~mrzaO5ATIdqvv?;#b^4q
z6$Zn2#^TW>;oUc<kO|Y2Hw!%@-Z<nYe%*ez>j1+3ud0E4ft?7dy}oTQD%F&@h9=f?
zZugi=>zqCi(=&wZeo9R}#`Auukv`}#hl3GVF8=Pj3SC$j22Ar0Z~F4N)=o7HsgwFi
zmp-pcKrJ9)|23=?oAwDpH`;aOg#JwpI5g|#DMQznX|oXr(FdSmJDtH~+&jayx2t&W
zAkanUuK`an17-{TrfACQE<x|&fiWyKw-4_qN~F<FI;cVJ7%yFm5@4^>8Z0qZ@22Vk
ziqESr5>fQ(Is-;~<P;#eBkX)Xj&f#IDeg~-=cSyIlIOKXD&cr6<w4iAj6dJHIhfrc
z!s$Q17vnUNNE{3}m@SEA(C&t8p!};UO3OEQ&ZBvmNr+@LeHwwJ2U)uDhB5G=A*$X0
zTeBiT(#UFJvqNi|^BP_af3ptyE@Z_s88}J_CC?q$s(&L?xSJEoMEGAB9v|HBv)Awj
zF<bO5Hkj%SH<=`Jcy9ePI%N`R-7+C&>NnYI!REql1?wN+Zx0ao@AQU|%FKTD_~YzJ
z6180O#Z~)dY^@~etC_YLnm-7^jP6kyCC-oQPM1Pd4|MyMUf6#UkSGx_F-HglX)g`(
zo%`@H#rDZ|+Um9H{xsClG#8PO7g=7sY~c1jG&AgeFocU>U0?@v`e%DN7Q0wlf!i<p
z)zd?IM`E7~foMj5RtYDFjj{0`cCqZ}(64TP6LMn|e<d2fpvC7_Wf91j2i7q6A$D&H
zU9KusySR0uq@k~1G;Ss~Nc}?{t#LsuL!mq2g=)%@dcAly>xwfYkiaUKu_DN4<&$z<
zq4k8K=K(~iwZ&_G^>IsrIP8rU68G>Xx+1kobZ-$|EkdXMO>&-xLB2)H{Q%RB#n@?!
zc~`LoT{p4Z+&S!y8h@ogBZ_nvYcMAa-+=bIfLnOCB5ReCY6*f7XoR=V!@2cuZzS>x
zy1#}96x#*iZ$k-z2k7478M8|;su9{oXDDST)^LjNmKFbJw9v|3p{a~J<EhXx)Lv?C
z&3UL|un1vAy)YOA(=F;=A)&4#KPN~0XbYpMS9AscwBpNqsOmmxTH2-;cBiwQ7;pOO
z9_ajde?ucks=rC;(wuM&5&cD4G9oWDC$Oztt6giD*>F*p-u8&&`0B!fwE3F6shTL^
z@&(pVh8-R~TM$h(R(z&SD^y$T;Ez_Wgb7TR5gxEKD5F#zAf^>I12tq5Cy8=zl{ti!
z>#EkX{nO97_aQ@oR{qF34&Asxuy{IlEB6tJM)W(UTJv<Xa2xcS9cV}gCP)M!ym4)u
zv}#5F&_x~X|M2bQmuej?|2k?Pca}fyXw+>Vdi?H7$GhzgEoq3{&g1tRY9FYdboKn}
z{Qj?<Nxk!*T31g;_q9$EoBI2k>Q{1TyPSIW#N%GIvwrK&jz^vS_dDM?pY<qR_1ire
zj8Y%C|D=CTP3>4su1Wm^z4~B>`ry!$k7;KgzC8K-=j_w#vny$IWT=DpD};6Rezh0g
z=AnV+vFx}XFi9P))dWliqNtDY2ulqLLbR6qIs6#H?ye!1ho8dZv}kZsg}Nf{?<Q|+
zOgcnNS!+x`j+iz$pS0GP_d1`qKA(<@_%AKu>$8a2+KB&JG!~rSElg`nMnx=rKc5qP
zKQE?9aqw>DX~chpmm0Iy?`9j{t=!jG)jeO3dcVwdu`-~sX`;Dy`EE^DW1U`eqvPF1
z;l)&W<hMeNoj|M>{9?;1V&S#sw|^Rwg%CMt<hpLeZlLC`D9x>b$mPq(HKq^SN}4-I
z7rTEVem>IN-M-kl_F)I|{x3v}0;Y9feg0cX^XTa%Z?;u)Aat@3#Z!c*ufv}G>rz2S
zpAAJJi+au*Q7lEeJOGp$CvK&{HCQ&%cAcV7Pc?6J0L8b#O_v;G=2RFc>vAj|w3|Sm
zadX6jQPg6h?Wv|b=e>m2Uq7Y!SSiYd?K=-<2wA_ht;{GlNWW&ZfUewk8OoLMFDVZj
ze>q&LmU6n6A9U$FP=pRE>AY^SWt3;}EHQc3@>N=yMn?4K_P;LE<zmx`u0N)PENxw^
zKd~6MxR|$ko=3WdN!AY5-xxYo77OtE)@GwZSK>Y{pr61@&#G>-X3G=%n)kZ;U>K$w
z&%_h3c;#XI4?#NJ9KrR-_ghEU(cw8)sNYgg0-I7KcUZvMP`=Wmg}J{fTN9PmEs;Er
zLw?S+JvzGJc@p}2<zuc=6mLZM-|eq0kN6h;2A=%cnr^A(Droul@8sy{k`J|<cX#a_
zm{uMBf1sj)%hc)JR1#0jc*Q@prT5TjoWapi<jLv1j5laLzoj<@@Z7%z0uu2Lss-a9
zm!mIV_bAXAyO--7C|e}NFvW0Z8tx0zFnmO+*b>-;{udPuPO7;=Mb+sIq<^I2@JZc6
z{DX>4MfLhWdMC#z=(-Gl8R$aWu29jq>S&rPRFvt9`rrAdUuG(@m_|{RJq)>lR<|b1
z`HV43WfF0iQV!h!5$#wV65*Eq7+fGupX&uvqj`YKF;VZvwmU;^OsvQOx3&wWl*)T#
zOJ82vCSALf|6aDXJO}J~b_{>X=$%og6qedAE*ZLl&#0e{-TdnQqIjxBEA3s5A@^K`
zAO)S~zBaioRF#5;E})_;pRok~eAuMVo1BfVL_{gm?DH!2zw64<!V6&?^DzEP<Bu`~
z2w&AP$~yY>D4X>o>IX_ooE-f*%Zac4IKn&?rf3<jv2(oA39fT@TgkkUGj%WNjxXF`
z+PI>u&sU(bj6grwXRYcC<p3`Qa{KBJ`*<}yQZ;`u!Inq#uNGKPO34_bu(-2KEaW#{
zJiy2H^ybHKk1XZiHn!%yKPq@r^Deugq%E|d@mu7anXI}{p)bVW_QgQppoilCx3^?V
zVIcP7y>!N)^Sj@#cL6={GOfNaK?^2_`E=dyP;&MFVIO}OUEM9qhxJhlgWDB7{cm?C
zljOO4J%zT&n!~CS-tgVa@!&a{|NbEEXd%Ly=lBrzqK1Rc$`uC*0HhM|m#R7^n6hUI
zOGMhZ9}<o33fr5u<y)`avWo5thGiGYk)3pTMaN8W-X6bIy-Z1GPG1rUyF0CMSEY-?
zjoU~)!H0P<9jg4JCy9269!F_OCkGvi=GK5mGgW?v4#=thz%D^Xd#3m02XOc8e(L=a
z7+{iBCip7T>DM@d*uhHOjO3Ec-!iqYAB0E;a;$LAAeP?vv2@FP?DD#!JM%`w22J+u
zCN9hg%4xfl=6^=7h#fSL#3(%rz-aRtO)j%O?vaG?LX$=1mf1;x-8&e;hco;Ji@lBg
zKkEEdeV@~Dw+O;szDTlhnOq4kkfD&gzMW8?(W{Qp?mD4a=8Upjy%cclN#?G{&{e<(
zkfL{u{Nw%8@{xj)n(1Zc?u=P$Dw8xE39lX->O}R{=_|@+Bt&L0=G2>-Z7A14jP5b!
zKJ9f83FA=relEZw`(sVI<4>3B$8oco*0_iV{wNpCKR!*~XvxYjBRcjfo1*SmnPiga
z!$_v0CFTv~k9W-iGo1^+sc)!${c0BYa-#TmmYdp=%FV|Maz*pK8>*F!Umi{c7WsMV
z4{<IP@Yg{KqB^0hdl}|&In{yUt*#3GZ4iIvCMswq(<Dvet(5+R^8P;}L>*N^hHsE(
zjf?^E$=<DWv!AXC0bAKRpK#gD^5*<+-DT2q>*Mxc^5y5*Jv_Z6rLAr1@(ullGVbo(
zex;w3!<_A@eP{E<^*d<pzIYuO$y3AEtdy_stzEyPaePN0Ciu18n;+SupYHhYpke|c
zuTc%{cN%09-vqI2BbR<?x0T$f^(aQ(RPh^rHA~Lzj*8|FlOw+xB&cMj_Xh0NlOb1^
z>l$zd^jC7HO4oP>cV2~M<=tfcuD>1}JQhe^mD%c&5Qop^Z_;gE>r5B0zHKNLP4L_%
z&2=lj?MN|yDCB80-~N*0^HtyU{rewR$REA^94zVW{CvLAcsjGfk5*3Br0^C3)QR{*
zD}yNHj$jW~8AnAk&5zlI!g1toGjS#B{&6zW0+mTYi}FS$vzJbW77lgyYND+`jnTW<
z4{c|)%3$^TFqS-S3NvX*w)sWSHCQ)e&4ZZpa7U<XYYtPttKfRqVszMX&mHNwSQeT^
zx~H&S*h`Uw8_BoXU+48rin~*{ixt|pc2h3;{0beSF0_Y(Sx?@^BH8_^qF_CoH2^{4
zn4j_y3e0%A8Rzl>RCwJ%Wk~-46j?P>Xo7I0)d<0ho<b=dvt(I#cYYO7%vsYBXEfe0
z_{hxva8O%m(+Jlmd$wVltfgf*O4zL}4TQQMBHO<_FYXbH`HC=<Ivu5JKPbBPrrTJ~
zeS+Dw2@%d+XpaEVT2u@?9ONprC2DgL*!!NgEK*q$FG+lv>0m)wP{I@9ENevGTLrj`
zSJW9NEvY0}cyyH7sN%EIxw*G+dlDq*7{Z&E*ZbsrjNWt*Z0ye7p!LbNV~&3mSM#FL
z(qD{jj7Y65TP1;<zVR{S!@r4N87)*Mw!fzDF@OL4687Qz{NbaX>)&_3wov@DdpO^K
zc|oT*+P(F2Z-SS5fubz5XZn0EUaei7%i$>1<R^WkjTPss!G{m;(Q>K41=w<ry&KLm
zW^8psxQC7vl+Hj&A5Wc``xnB#2$9nIPJ38K4{xYOt6RR>)rDRhlgoB9!2JFR!pGuu
z6^eT4uPKl5HL*hgvO$~q`W^+c+DFXG1$zg~d63IW>8AMqMnXQc^Jw_xb|n92Z`2`p
zrV;+^@%QtE!>(<wUqMGo))|kM!IUMx2$zrh=OAHyYPQ@dE%lGZKOFzeIqis$R`I*H
zn<ir@z-B2Q{x}!sWz;30_#yVj_!Z|gGswG@&OR`Ws|or(1E#!hvwqtHPQV;Pn6wua
znfE|cifWbA0d@V#wqtQ;#u<sn&TIpeQg<v5vbkRaCn1JU%ZHB6|J6`l9>2XEIbG!N
zbL(cw@$^b0UDt=jeTS%XuBgl1+pQBd3Fou5mwUAf2Wc0RJr^{iOJI26@s~3geGSca
z-4Fi3-lT&>njs9tWfa9e??~Oh``3w{@&WzqrT4EHW9g#<N6K*$XL{Gs69_z=IM^;m
zj{+$!Bj(DqjrB<^{ltWTl=R`6;K8oTi`voF>o+iDCL<(vTS2Pyx~8nr+JZew6$I6b
z^zMpu%FlxQHPX~?N84KWYP(mcOU-FgUNgKD6+oJ)lYgS*kfi;YLh}YryWv+iWzIe8
z2fTvNJ*!)W)e=SaDiI*^I6QlF8hh#ux^@gTJBcrVMA=Ma%Rx-L^D7=`lX=i@3fJ?=
zk3rA*natlz69oChsSjnn7{N<aP1;xH8^=C^-rmS~*OBIjcDBvO?7ab;04;rBLOWuO
z_WnyM$scS6)wKkft20qZ%m8IbvtRx;Q_HK@PyWp=CdwIC&++Crr|8EKq=@<=9d)1f
zw>@dD+zj@%dam!+4Z0ZAdu6DG>K7AnkWlf)e#duK5-J5kOh+<&1ute|SIBY!NQW0A
zXO-5mBSVI6er5&R^sRvq1l6#kBk<GQwkHQMo@wSKAU3Wh*^smPn^PrI;G47>N>)%I
zGt+Qfumd8bx6hvBIBr=@_X(~RZc=BNDRhHT&E7)jr;qUGQsEDfYZ3MTHph7BU(=^|
z%|t>vOBk=0TU>vYdHuEQ^#te2QQ)2NuJS&K=RKo%kA?ULS*HHQ&&HBJBQpzlMfrU*
z$t-XjHi&EgHDu1ns&RuQ*TzLIx5g#E$x3ZxN(LLn%<il1$x4E5OHfMG<Roz%rTzmq
zN>TrjpbwO~V<F?Pqslok%6pqCL!@-li@JGSsX9~MWJ3N~gYqgs87cYb5X4!4R&w`O
zYN$}Qr=|5}QVP7SG=`y>qGoz1$P+EcgI(bz1Rk3SOF#nK7Zb@2f9VJGmSx>0VP2~+
znXBG=ne#kQHGe{-mPz&P)9#8!wOdd@5);RrO>WH_%>e|t>_4ql6EEuIR6hq^0jC-X
z1`f968gEDCN{#A2(L9>x9~`0eU3FwgB*GqOD|O?@L(5tGh*}7Krqo8oT^u<G)PMx(
zf^ZxC+H}p>*`j!cW(@7+GOiPFq>&`~WKO8xFv*0LQT;%)N$+zoH8R*UTe&oa>LhFS
zFc~-p>4!BLyxKMh&eD&YY+c6`V4CQxKr~{v)$HW|1jri-(i=4z8@-a(FJ`7H&C+sM
zsl?Jx!#5|NV|WAN7z<E}5AoWM@ru9jd?J%qXLE#s(7N+0r&Lh~Eb*$3^6g^&M+<Ep
zXR$o+wrMhWd)*+>pRQB>*3TMFuD`}CG!`8H-P*c+tL2u(we0R4aVjrMRXGI<DVEzB
zcX&GLwOoz(#D})_C>Zjpf)5~kiu_9H{B)T_?Q;-w4ZyVS#m5Vx8bNWL@iQ!A7+rd-
zz98W7ceubL>dV+*txZeC(XOp^$DKi+hGwAgLAkkg7DV~)cNEL*n<lpRvusJhJtHi3
zf(@-xcWB>C+HE)5-I2ZH>{00nk2)w-!tc49F412AiVIDOAtW+J91|xqvmb`72Eh=Y
z4XavW?I!V+@iW9D6k$^st|kgA1bn~Csr;?kIfz!WlnwK0tsgXPCc$Ji!q@)S{KM5Y
zqSXVpoCjW04<0J!{&<_U&OaC{m(T_3j5l|-#4(2AVZ0>1S$S9uz^p#SXG(%H;#@F-
z?3z=2sfr#7&5m#Rt$*p>bB55elMVxLaAiMg44y0WkEvsiYX;K;e^%cWE8mSA-|gmw
zpqz|Lc1MM_&5nMo>#LZ#a9wCD3kPQw`7*#<M6Z~>M1=+@&P%U)3jNMYuMUdPJ+AgC
z&G%Dg#gaUlLwq?P1}8k<E>>Y~$_4(PuXS$l{pnx_Yqj528GB=ttCqN{kTl|!GZ91$
zexwu)Fpc8KIS*(?h;y;o+h>l9nu-CAkkA-wXBq3jZG50!^PLxf3jktT0V$qcQ#5aJ
zv1AJw$bB+2{p3qafy+^vU#>%oJMVLVa>U|Z%@XzGlF~gA)M}A|lbLUEh%8x&-W{ND
zU;GiR4Ylp!I0HplBN)n*yiUr)S*SZP1FX+6w4;l>osy@!7@zx7=HFN&bZrQi26==v
ztB4kNj&vgRR8SJ*7-j3Dd+>dwCv1u?%9w``o^@*G>O-wvN6KALyibpq$2Fc<DYIXW
z%$mx<-<t`AGYQYw6Zx4;v-=v?%azuwGiVrs{<-j7bmbr8$>R}}7~mcV$+rrmw6rRP
z^QX)yJ;_&2T(L>r$V>edlBhQHes4&{9Yi^4lX0wFUtn=_Z;2Ysj~dl>Y8%(=ZAs<&
zn!$IHaC63Jen({=6d6XB)9*-`4m?f4v+Fcz&FW`-kImr!nst*S`@VH%HhLbT%igS@
zqR-&K@sY(ck1qkw)qWMD8q|yg-P6y{T2juAyFx|V9$0f2b&e$D;8-sMNUWKHyozD-
zP9CB|Q+yYPO8rFqwl4E~6b8pZNV!5q^NVVk^D~gA)sD<BZzd$I+?nIZxxU>H;H!K+
z31WA(>#nS#h>InKB@F#9Dypzwl#OJ|!Er@SC}XXtd^z$bhbRG3N<<GQpv|{j%65Q*
z$9gl@u&C@UC7pl0Pf_sPWcE2_E%7Om_lzPor3ZdZHRo9SA^k1oJUV#mBVNzC%5+_x
z_b6>WPG94b=U1rcP1P4qT?*46^zT)2*0mW+#?x*vFo*=bN?V~vb5!8lDq0F&r<|t#
zK{CyU@}_r%Bseofs+P_#-O&wEW?!P)#d7I8@)8`WnZuPYy_H|TZGU}KP&;r^A%U#+
z(B*r&!g<hD*$;wewkwCWDeLpYY1C@(8&v!&Xb@9Ny)00X#j&$rIia}6&tMFRBYakz
za9Msn*(GLo5S-PY11Y9xY4nyYlPmN_y+1xi@V@5zB&t2mmdmdVQCzK3|6WTF$U87J
z06*KjHkITO*`Lw|a6IcSKhtx7Apk@PRfutRZh!r+eL$Ov;K*Fn-lBqb@CfhhQE6RK
zrbPhYacluI?p;12R}ugtF<j!6U<467e!o@Ag>v5UllM<X{b{~*OyZ<66Z#8Z(V}UJ
zSqDoINdrV1fJ>`CQJgKM8Mz;SKUg`7i*n~)&t;`+!wFYJ{#9sZk)lGB)=Zr&zz6_P
zz<gn*{8AqowzrhMF?VGfz@6IS=%lx&_d%?^YIWx%(;H@FdNQ!j%#5dqzX7Du;POb_
zCyK57RWU1M8Q7jm+q?Q_{X^5ew`}_yI{W;$`aqZuq8}k<^Zg$>69R2jLOKVYN$}+a
z@b3K%Nv;}9n<qIsf7!SvR=nBlugg+bAl9g@>-L!?_7l$o+A)yh)UGyr?`Ix+QC?YG
zV~<(T0EnTvNYV2y)xCnD4%@tM>VzKkzCcmh!TG+gMI6E&TqB*IZ$uE5)KymJr@9=e
zi?FQiSnTysYMt{h8J$yE+={8TjLjJ8%T>fDh579O5ch)jc!!dCF);f*nRTj*azT~n
z*pWsb$6kcx14^k+yPRR_O7;q)2E~&e?+CXdhC#$(38Sgcn9MWO)VFt2afLc&6W?$C
zQMwXB^}}d(i9;A?ns{x#)Xqiv1-@!^#cD@NZ+^CRVp-Ic5bBuYh3B(m`u4T>W~c4<
zyKD=0ivRn}-46o5!dqZ7?tTMJg3r0~Me+KZeWm!2tUn}{b_{LukN@0B1;Hg7DT!R;
z!`Vmjf5&kHjv!Weq0&030m`xZ2fga}-q(aT*UE0;e(`629LLDn+M9(Zt{2|2=!{>b
z?@qO;VymcgFd?Jw=cXc?UMyx`N*27+@8HdOzooRG*b3@|1^xK_{70X?Z~a1MQ{;je
z<<6}q|50E+Q+{~z@xuFo<LI;NJpEXuq@5|u%D$YIBEUcM@EV&AoVL|*%Y(G_7;?O;
zxkvV4lK<K2P4)j8FIKmBK0EyXNN6|jp@a4Q{YxXy_v=wBmFHH+KV9~szCWP-kO}|r
zp8^VuIqUNx9=R2t+*LZhsn61ydF;Wf?3erNsTMj%>z~`yi74giEqh24Z@=}@=@*CW
z6Q2B<*=MBE>UYi5=|I*;2O}UFLg5dk=2VaWA5@fvOZ5p%=Kn)Q2h%A5K#Tb$1Ax%e
zN#|_FK}S(VmtX)a-Ts79?&Wa4yq5s;rqrvEV)e(TXO!|4qowF1@^gj3it!i!FDmN!
z#osI)_VfxBoqA*2p~K=XS3OhjGE^W@@joM00ftQGS0E%)w)mGTR8;AgU6K92Q`gy>
z3*SiuY9`^>-jB*X$y{oY+|1PrAG5^nr{-DdBz`WOfS<tt@W$r{z3;xo7A$_s$-UnZ
znUX8D`nAbx?)~{BQ>NsR-@gmm`ByG8y-8eg`61;20E^}`Ti#iDfEH%W_aRk7P4_FQ
z<H)jQu;ci*4v0TPSM%NJ`<}NQQ4ej)u_p&0+vDL(%?Qe68ek7=4*5eez~FNITX_9$
zEM7jv;7MC@<c#UchK@1lw{DnNPTxVtINosrF{ViZoDwgrxo&o+sc6tChCLGIoGd$H
zC>X-u9PgZ}VvL6}&d=zZ3aiq6ok&vPO>oIHmJAz9LDNlrd1|4*M#X3`tjncjH@fsO
zOPBMbOP*7zk#MqE_{aZ*tB4<8TErvj$+enNaIS?C(RUwQp`sr*aNILnxk|2p@#f95
zY8+JHV*Y8G^O5(h&4kcHBaat3_K9Qp8JcemvkHAx)0hog$CDIN??U1=f7`4iR;p00
zd~$jgt|a=hc_C5kWx>cNuUftThrK(GhpKHHKRyPtm@zZ9><mWsj3wD(>|@E+rcgvh
zQiB$in6dB1QmLe|w5x_Bdxjxp8%q+>SR+eBC5hjmy6^7$xu56xZGV3Mn*Zi?=FD|o
zXXZNB^?3($4vXaJUQ8AsGrbawy+)W0>R<W?RY;G=Z2TX0E3cOM6`RZF`Ct9c<g`v9
zvreI9>)xB&7QGqJnSMM|jd)0T{Q$8;bd+Uq!|1_@_B_GIqgv6onzDwJsvkWTKVHkD
z-rrjZna_W*5$&La%$;aH6{8ZlSl77K8QbxUNtJ0PJ>Pg;;$ofbw}_N2$@PUzFCzEI
zsrWBvsmy!f@|uI%jI8nlTN5d=wL&*x+dPk(D18^~ByM>;-v*$fCt0%h9^LeuWzA}z
z`3n5@7h!VAmpJX8-*M`doyE43eaF;~eqt_aGcr{VkDn;EpT_2$^6#fTN$)g*Z|Zt$
z$T#rC@#xc*;Nh-@t%XwZ8#Xk`jZdY+Q2M^Zme{y22YF><Ggo=+)tfLKO}VwS!DNH)
z`Eqf%nGy3Q&DcaO{i&jN+V)e0ZJ{YDu|&<*t@oa+EPc?AGAcJ_x|kubUSTtBL&^J7
z&R?e*H)FMtC`dfwu(>tUzBkzZ`>rp#o(XF9{hbMdfvh2O{o;Z_rsV1Tpp?x%-su8_
z6FF#mKsH+X@-%Bf{lsp4LF~oC=!5<0Vc*QKAmMtWFK^@oq?@?;M;7!Z4<3)id3SuC
z9p&8@%!x=*dOOCtR9#@MPA(p|5EkQxxh&R^3{va3Ioc6}6fd`x*+Kh)!ANN}PUn^J
zI?Yos-D@K4(pn2ptWRnj^=lpcq)isg7S@1o7>``+T{Y)}yv*EH3KCe+jW8S{MEWrC
zD%n(Xdt7SVK1G{7Uc(Jy!I~C?M9vL#5h&lS@stxp&$D?R=Jv9sb;h4(!-2H<M$N(a
zEVsC``vvn9jQ3zQFV3MKeYI2>YZM~Qj!C&IUduf@XB5UX<8kV+vIpxmno4~PFKG6*
zkEKA)kB=!oDi~E$zy0DIonIoe%Uk$cx3!~9(3J*0`RbXd7ZMt^aQomJ7g!)2!ch|*
z2i4rd0$t)>k&hSO6<eg7#Ual(0&cuVq<THj=jRW&`ewmO>wDpI3@Y*pm)h;<g3B$p
zrt&;2C|0{PogT$a)LmR*$-y|SoC>txlSHSVo39F7N%s*uk&jbDm{x2+`TL9_@puzQ
z=W>DISOVUeLTem|>&$w8;+Em`9fz>q?e?hRd~>xUbt_yQIXGFgYif)wrD#VsOHd_t
z_6CC-|FYo7$$MM*?>YgfXl0h5?{s6GD4@b#932!tTndh8RfyJ|GTTs5!xZvP6>tn@
zAZ{(hY;O^cEuG0LIK1ti>JTR8ng^KY@F%GIbo{Fv!y~7x?;rIt7wc|5vP;HGs8`g7
z5P`!n9?I63EVB4e!Xuu-vNcvxc5Lq4={nJk1c+vMYWmYL+~a%x(}&FrdP$9@T>7cp
zyxytMmMWbR*&e9VSq`-(n@e~#HbFxtVfD?_fqW4OAI6C={+Ipngyc-pec`~4Uc<z0
z>5XJ7U2`_%!r13KD~)w$zPIlUi`=5{4SUS~L5*ct0YUtIi}ksL4(Q4Arx~uIV5nox
z8<_2)%x!iJMx;6Y`+FS)a}ak^$G6z50-EFs!Aio8wB>2XlRD``tkCc6`>%1y6zTR@
zNSUg7@C(RGx!#6Ghe-%Q+dON{Hx-$T)o_@A^d35r3*%4oL$|Qy;IiarNf!Odq{_!-
z4z1Q1x7-efk#nE7MiqvApM$9{n2B#3e|910sGtib;Q0w18)aP}xHx&H)__e=9#=(6
zuspbDd+5e@IXL+|!XfR!S~=THI89db9HeAPCI|TL`&fS4$%@o@gfLZ2k;){rf2t3-
zl_VQ8@$$?|6Hh4Ah5pXv@RLXG=}@!N9Vwce2k#m^Kk0C^YSMMfK?&C$#d|4l1fcKs
zbT_Xkr#&Z6DI^^*ZGTW=oH_S?Qs-PBP6(z|uoXuNH|X`Q(R$Lhjb&tZu3vAcL1fd5
zWBL_WIL$1dRMq#uD0I02y;`}ayOaDkXb%l=Nqa`=%}$3sAxgW)-mcY9g;BaH*n+3U
z)4ng0BwlL|6OwhIr$B@836+QI$F&;t26FG_E<fuDJt=5v^f6PRK*R|HtKB`2`+O*i
zF*RG-Bu<H^A<mDRtCzQ@BroKvoL`-=J6_&-9rfw9?fLgR9+tm+nEa{0@BF0OhozU|
z?Xi0Fnz6|Ny#$)ysqAzHL+5x!-&@p|(x&q>CmvS3`3)6aMJ?7KLT4k@D+kdj!IWY$
z@|*p+1pcYu>{|z>&2CqYs;7Ky_8a&Jo};`oMlZ1v2B6^Am20SI%jwXC0`&Qb?dWek
zUZJ1vKm0y<Fy&ikXZ7d%PtVVUwVgrDW`C)MR?o%Ea-c%6&^qBNB$speu(<KprsJXG
z*V`!L!`Vo0jCrlxTUn`ZBFm}5M6FiJ%EG;{@00tv?_ZL|d~OO``LM-i`CZED!mIrO
z5{*w++X}-7o}sH-R>NjucBC*+qYdD9R^;)+WZ^Lp_~H>{4;f7it(HA3JRbb=F`4&v
z=mw(rmv@x+!sO*G;gh?=!Hpb(!Qqf`5sAidA(ykoG89Q785>LH5s6rgi4fCOxpPy<
z$K$B1CfaEv;*C>;L1x%iT}=r`s6uRL{%Nv)XP9GbsM4YU9u{Rs6tUI~cN3xLFNS$E
zitHN?^A3(An;tb=6r?&5Q17twB&b&nO!7i>wP&=KZbV6Ypo4C>^Wym(<1q?~QPk9!
zEu}G@x)e<x&(eU{shH@4iqVFdv8NZ6I-`YZ3H}OT_-@ZQqHdh6OWfo37%5n6z9J@~
zhkVN?HYa#BI<H40MKLV(cB~F8j;<?SG)^vEjEj^#<|G5ZGmNIosw`0v4`%I#8TtSc
zS`0#9naUoW36F0_PFN)*JH@X)i@!Y{d2`(VaZbYYvxKzL*o>ao8kvMwA_)&l6W-}2
zT^~9&+btLfIH4@nwlskm58iGpZi0cfXQPKbcxTw~(G1n5kI8y2$xp_UpQa`)K1mA6
zjOP+bEo)33>Y-`}r%uBtjDXnp#3X6mWccfiD-fYXGNd|VlYtD}I9JLY3%zNI2qZX-
zhHK%hlS_P(<en$pEe#b?N_~?VM(|BV#HC7}5ua#GXY0mc?@)EdGjy$S$StT0AtBD~
ztN1)Rvi7FbnS23I-38|fVQIa1Pd#z;oltYp45P~z-!6*VTu!x~h<AD&FF?H16@2Ny
zWjPEE9-Aj9#i=P#$LoqWL=Ev|15W6yq39!xvr0nUR0OjodaGx&oi4hTed(}Xs{fgw
z0m{XRTNk5bQuLi78n9^rzKWAB$!CD0iOCp}p*)z#yc&ourgIZPF%GGyyOtuu>@>GQ
zp38byZB39=0&Evt(7G{dhJbh;ERME5D^2G)^fl`${K_$3k>OhcRn)61RI<h__~sdu
z&+Th^jB9tx$OU^Y-JXyv{CcI%S7Cw#B|6&I0J<po`qw+xm*ODjXRpqRO7zoL4fHh7
z-5}IvI119s>wy8wkiZIft{FTUEQ(%Xqxx%j1?6)D?-Jlwa*~|lonsMY<g7Ow*LwDd
z%&~c9$9UM(tUV;~gkG}pi`-3juM|yS;p6VSxp|-^C8pzb7ru+jglmTFh(L0__1%1%
zvsZmc8s@1er=|Qbr5m*qd3rLmj2pRmj?^VQI_5H*%0|7wb8BEYE!n7;Jyr}~-aHaq
z=so&~GMsS+O=rWiYhd#6LQ5c2M-A@_oXW!pg!C*;0RwKvqav}qOCVFQp21f<>XXQw
zV!m9(@>~5_-h=@33|(2c6Wxu4&Ux5=t>JB=X;0FXKY8%Z5mxUOJ92{uX~tCE*DUd6
zEVUbeK0$YL-=p)7+||#yd$0H21YKF@uF#CHOwy&i-TGF}pj!qUaCZ>(eGs%#Nf77=
zl4<u>u<%|Un6V}*kk0*G7nMlo_QRl=wEJEpc(a(`9vg%6AcW_OtXNQfIFt7%o?C$g
zpTWXUvk<jd;ujAChoy%cD#Wv0hz=I?%~!!?I#4U%DW;;Tw&%=H;WH$jLt>l{9nrV2
z&@&5i{UmrEo~Ix9Ka7RPQsHSHG1&K~D49ZKSoldCH4V?>sgGu};a(s_86G_caOCVX
zJzLmi4~J%JSRn`^fdOx3^H5oIp$qUl!YZu0hIi|?M<xcvo6cxmIsyLzLQzS#VrjRW
z+Vf`amP`&7L}=aL>y&L?Xk<Wv2wp`6c5s)G&^{!g(|Dd`HcEJuXS%#(E62kX5S+~B
ziI_yi5)jlYnf(M<9Sc27LkFEj&tZui&tVYptShb$7!#<g6+&O}Jg4c%VJdna1b;w7
z18vDqc%Gvq@I#v2158oX?5((~h(tD=Nr!wJf*)#1y0)j>4~rZI!SjGq_HhfdhBuG>
zh=3?Pjpfyo(WllxY9HO{_CtBkf|r7!iFg1^G>*n0+YPGb9jjgeSSBWYR)x0%tIBq~
z@19c-b?<3(DjX<VvVqSpbOb>L!Ab8?d1RQaV@^Mio^(_Qauvs92|R5~guO<bD&{U@
z2}D#pH3%prRv_VL(PU6D9Sg12qxFk9(3;916}91!FghMxMyhq2yF;bIi!tbB+JkN&
zXE{-)=aw@^hHdh#PV+!)tUz8nS4*X%_>~^*;Xs+{CgMV%RRI<pXP}bYuo=IHE=-_t
zY3n|9ZH0!0g=ny%%yw&_Tq^~<?JN?p3c3}@K(ag)n<!cE43&1@9S_0TA-(9x%VbDV
zF?Sl-d=8It#v*UsBOEsn=br+;BzP57|NRStsD1>I3YV;BoNMMK<9UWjbq}bBvy(iD
z_*H)&5Gv+g?cJiXXl)*0Ik>tZs+jgdae}@rs7ViJo68AH3cTK)XI3y-J;#D(vtD%L
z8)sNh_DAOSAyg9#k;tl8!neEv#syoO<i>1;p$;6im}x?{d*zjZU<VQ)cOJF8nW_e#
zLw{$NHc^#huRc4M*fvqfmFI^@u!X6B9f$Ee<|75!WJnnSLG-XqLyD#)Lhc%>ma#IK
z(Kmbu3i@-;&q|=_c%E*oLX$^P6&3B<+fK)z=VtHerIuIqB8<8d^Vqp6*U)NPQ4jDu
z5Acs&=gO<7i2IZ1mJaUA#hqKPS%1O%-^@doHh0#tn%kzBJ{>jfW=K}ls)c0dz0(9l
z8CHc%f;%j<&@ruE{VzX!dq$_(`%m3G3POCRqFwI4<k0S($G&(#H@<zqHaM&8%r+^I
z5-|Z0`9hXA-mk$PwCOzQMH#l4+RvieG5QKR&MkDF_OQ}RZC|QDPDi}XoaQ<7#whFB
z>+8I|IoDn%*do%f&^(VDHmPW=3b$*`gJJ?Ao77lb)BE5&yqNmJp3Xf#40mVsrcFQb
z!Sl>($ybq^`n$M08@9QE;PkEO&W;3n62zXG7D$4}l8XCm5uMl4`WEbWMnOojP`!oz
z_Nq5s(>%o_s6CyFp#oRZOJBY7YJOTg#JzJxf@;q~*Ih+Nl2^Ir==y=CFGRe>QEExf
zbdf#CTbmQwBP*WHKi|oR+R>maG=Uv-I~Ylwb8-*3Dm*hNUA;ZsT5t(_qwR>`9QKB~
zpSaoHe76Af&T_$J?2W^=Z&eSxO*n@R#B$rxWhYqNwj>^Z6}T(CuQrh@#%@#Mcl$eD
z2xmIPhkDN*lzy6JaiOY&N*_Lbcht3Y)O}|3WF*(-Z$N-x$SDBrz6tJaFjl8EwhzT}
z^F&-#6f7JTI#ND*scV#6GwMf&__x0EZykNrGU`lwN1lP_Sqs|c-_NF@2llqL7(i-E
zk>}~$GFmJ$)uE=n#E|cP{8o`mWJs?K(k%b}DeYQU>S}A%6}T6+F%JQROdB^3Y@DkU
zIMs-bwclh*vkTSh(4W({sYAaQxp}sk<;?e_BnMsl8am@D9<Wa^@r6k3P1fV&Nj;9~
zr)h(Cc!d@U1bTQ-PRh3NCPKOIxuhhW(1H?ILv^!PgfDsQY+~m#<4dVDG!-v%3)4Jb
zqdkn7ENVUWm6mT8kWW0ab4lena;m0Mt1_(yy##WKJBMzQd$~eKo>;ME$!*p1<V~Z!
z*q5UY^mli@P6;?t_5k!T!Lzyqn=@t&qtld&Nu9N9;y#XwK)lQ{i6_$0evS<%W8q&}
z=)$@wp?X+wGrGv@gR+qz8w`7%hQ{1@k@$WURXTwps4s|pc)FJP#Vn+;tE+|$YUB)=
zUWNt3`sH31n!S{tsPaaV(rp;iJlfL_P5prm@b-td#_dJEe|yR?h30gt`5IfpQ)$M#
zTr)KzJo7-{WTk)?p4oJOu)Y1miv8DA1x7-DBWnodOoDflxxSL`PgZiz)tJPxO~@5U
zB2C~%*isXg`+*0-oh_6{fU@aGVJ*mR4YWO};c?ivuPmrD8FCtnD<ebv(VYvCT<7r+
zZIn=C2tyzoMrIp>M&^ex4l5XaUC!^m*=QmeQo@2B-!GU^i98^HW<PyXQo}oc$9Q+)
z_Y8Le5E-WOuO<|w#Igu}v#SI?Z4*$yJNxo;-7N3<cOS9^TuZY0UB}FUE$ZF;`<R&;
z!<q!)4>CC~ZLb(xKj1G<8%asca1-TF>lE2O)|^QMofPF%6fV?g(#)9?KAwQ{vmZ)I
zmp$5bEfV2t6eTvF_B^tweBu4(R^M9rFAaJe0N1Tcb85-9xVme4Z;Ah#>L~HuGj8Q4
zrw8h<?*6c^!u9(Z)AWQ5{O2!W<jvDQ$mxa^e?0g;o%P%>Y?<m7sd^?`B7LH~e_H;a
z;K8sea<Yx+*@b!|Ie`~48Ix%eB(G&XYiO*7dsCvnNk<HG`varAWfQS<+qd;j4JvYT
zyh_si$5uRU*d=JosF}{uR=)+kY?t;-Y;n*O`|{e_bY3`N*ZvZDPwCA55$}u$dSNi3
zc<Ajs6my_^s8J4gWzs@^Z;2N!hsCrVm#<#lQ!7b08c;7}x?ur$U~S3g5FZQ@NHl!9
zG3$Nq;+3X`YoBmI3W|g*x}r?cMy7_9<mr(@E9o#UO`=RpWRp5^sZsuU$heQMe*Hc>
zMS;8dv}Vobn_17|0+yeTJ*p^@@s8vAJ`tX)R)!3+TiPUMmWDgWaZB#&iF=bOpRt#r
z`8Yp8OBDKbP^*2IW$KJ(Sm<_JvA$&)%jDpEB9VWJU!|=K`D|jm{`0c6RXhjOpLKon
zdsj~5?}iNfG`ov&&C;vpkusRtl#8~F7wvM3M|01VENT-n7x$v60h$@Zof`QZOx*cI
zea+`?ADv(}f_FY1zWi-d+JUl=kqQ_+;TTTSE#R5_6Str?i!E>9-}xcDq06GTq^<KO
zIpfaQXK2bOU$1a}+u{><3!y&Q+j7Cre^0nl7*F*@zI0j?7r*%M!r|68V;zU%P867!
z4r%Z=D@cajMX<^~YYvnSPaL_Rdq1>zAqKNs$~_qIs@wzFYod0NyR#4Ee;08i&csaG
zflB_=9=e>f`DtX$#8CD*(xJ^cyS+A3cLi6ltgdfrXtz47ePrQetw&4?6%%}I{F#9H
zM;WfT;NJ6F27FH172aL-6OiTFFxj;sp}mT+^9iXAZDklxFMQZAFC{wuM1tB#BQ#4b
zi^hF8q%h<dBK_kuN$Nlrwf2I=WO+V9`>f6QsKfUC-*+F&7s=}i85uu-uvE;Rw=35)
z0Vmnv?2jjI+K}Oe)b5TAa8xL95epuqXbCz!##}T_K3AEZwRd;^_|UF*IZw5>f6o5!
zYy+;_YOk~&)q^<*dqN%Btyg0c%cqc~Yj<VW!(Fx%eoe{G^|5?lKSv!ZJ$kdmm@Ged
z*V>G=v6`nz_MTcLb94UZPWCcHa)0p-rqNfj+&O2DX32a~%w}p5DJkLyD%#D8));(N
zu_?E%l<B2cw(8j94jRes+-xD2FG@>30X$7EITk1S+)B`WRHAgjD>h|l5Oo!HNkPZL
zPi&&s?P37*&Pk`;#O9bc%Q>0n3Z7eiap|?FcDbxNGtQq!-7D$(E?IY}PLi^nX!0V^
z>=!D^yCvFS!4py4geYnt6^h@4Vgjjk66at_=6gBQ18Y!wadXy1N}6hrx{=IQpqZf0
z%J_wfHsGXMh7)!RUPj?Q-?;ccsOYEi-PNC8J`DRGRP_G`D*EpK1r=>LadUH(ul?!X
z&g+nqw=K3FalX{sb<6VP-JMlOc0K8R`7ruq!NIM5dtdc-KWRAm;AEBGzAwG6o<dI1
zqqZJBAl%pU%<@#xg{q^6w)DMji#}C+W2^s>-F>~U8cvlwuJS*2y07mo<aBBM)?<N}
z`ug8lo-Th`b?nrWzBeDDPgjm^J%098-@uoK)777<j)#8fd%Fq=uHiN!g#&ALp;p1Q
zLe-?`E&YS&m|*4;Q4C1tD;Jy#$Xx=BSrCYuiv^AWUSTjO5`jRWF&H$8AA=SW;1}H>
zBrGf{E+Q-`E+!)-fs>Jzmy=bJms3;PsG_V4*r$4%H4XLk{!u-3-M*%tYP&>gyQKa>
zo^EkJ`$Ihi$WueFW1e1ze<x3^eUsP7Q@@|&sg3_xKt1(8_ILHv_T;YL;ZwU{tDs==
z5Bt>Z9QAkp^oM=w8t(q@_)}7B@xC?w^w^2GhZp0>-Eq4<#F?+brwJB*iKnh4Mv#&c
z4<_66B)fh{-gYu2FN9j$L*4&7f0~mX_d4C%Kf^gG<2vbr8|l*SAN=X*Oz;2i0_r+{
zdiHKX!9NP9*Nbui1eN*dR%UV3XmNU0Nqj-c^P-ZXPbCSXPckQ-T)1AEL@P@H9MpHe
zIjFx7)XX0U>Z6+4&ox)?F|x`TtS(0JB;&?IX3qQidtd7F3meu1ROYkV;>KG5f(i(z
z^)I^q6+x|PEd&r$M*CxcKW+YvKYh{J@CSd|+12?s0d>0P#r*4M&AoL?z4d^7+TTC$
z2Y>p9eL6V!=0EeN|6`v{zM^|IWpAq}neHnMnjC1Uc=F+G4KOQcUs*ag+z8~WS}V)u
z-?8#+uiICZf12!h<oEX9+NYgg|6-rsK?B`qHkpg(w)qeH)c4=pr={!m=>fn#Z8ybe
z9{sz0n#a3tpE~_%pMC`FQ^Ov1K2o#b5BpSk(3?-EfPN6LPg5cPVxOJ|>{Hwi`?Q1?
zuurXPp^9tvsbUBLuuoeVRNbKr?G|kjf2}q9RBO#X9Y!cktlOvlatO7b_Nmry_Gu(<
zH4OJo9PBT*ZlAJ$+NZB)IW%OSe>CBPw5;2w`Ol$%ecC2*<!A<ApN9UhPo4Or8~OQ^
zpi5>C$_h))t=p%`NS!6qb^A2sH~X|2v{*0U+`Dd{?g8x65`0XSv_vjnoy2sGxhAIl
zBQSaRr+pd<*r)l;8f*5cSrcHN8f?QcB{Yfpcg(>l8-sQL_Gv0$pDGQhYOdR-+G<Sm
zHT(2t?g?eUK7F*2xs={2>pPXRZl8XZNL{l}BUDwW>MD(ZeVR%wYQdg!`O`k#BVfH|
zp9W}pNO$;ZHYfx3X`lI;eQKT-uNnmEcfh6ouutbL5x#5oY4vaR>0}dNpPJj?I;Ym`
zQ$N5yeco&YyIEwOwr-!6>t3lW1nkqqISMlMr+xbI5Bqet{GH-D>c#}~b^A0wlAOP0
zpYC6L6ie<~vrnCV*r#uy|6rdk*Zjpk{lp=T1ng4`lrj{>Kr_+OW?*WW>>LNAHRXqW
zS_}@E`qMt;{bir#b8Vw3^GNpq_Nn<_?9-f|_G$6DeTrMNPcI~LqyqM7Zqz^7r$s;P
zQ;Q$=sUtOUmF6Mc4KwBIn7b|n*r%y3OcDPz`}70nchZnV$C`a=3wi#-J{2c;Mfd%(
zPa`&1{Ar&uf7+*y*X+|>nga@)KkU=1$k>3V8vy%M8n91u>2?8vN5m$uuOzBdf7+*m
z(CRh&RF2mduunTuYtf2p_UYK~_NnojecEwg-9GiE!S@38Y56bv)M>*4Yu!E-1?<yv
zJ<nurURt+LEoSS*K^gzWKJ_mAxAv(Y#`elz?9=%FYM<)<i+%d7=7)V6vBCF;ed_bS
zWuLxe{yY2B5i8>^;`bN(bg72tVg=YIKaczG_UT+4`j>rb^Ka}^V&z}#Q`X<@(^u%<
z?9(Y3-hXeO8vkjZ1_SnK@Bf2+>bh>9`v28FeJ+xvtIUB7FxTV%WuLwV?9)$wu}?cp
z!vB+fO8gJ@Y1lv8r&oU3r*;Q^+NVqnoZv6}^b=*xK2;=t_+_6){LMby@`ruu{lh-J
zgYWv?K6U(8`}6`}pIZH}PtUL0r=t05_NnaufqkmFW}mvq|J6R7h-Ln=PcLNt%|4ag
z|GRyfAgF^i5&LPMYW}iMV}IJGcf1Lg0Q=NW`KNvA1lXqufPI?E{$-yM|Flo}f3r_>
zJOKN29=dLyn*Wo1`W&!NZJzyUpEmy8J{6s%!H)m1Pi+AE)b~&O^g8kXmwkF1uupTj
zK4RcDv)n`L_Nm2R?b9p2*{3$MW>;ppoo2bc*ocYQpZ4h$z&;iDWuKb-i+$?+Pxh%P
zxcE2wbUzCW*r(cneOd&~|L^uGVck9@{zv;X_21j4X*}Nq*6dRYz&<tk_x7pjU+vRW
z)Ro`u)7!u7(~X?fbaei@eQE*1M*#NeL0&Hc*oL;n39wJG>-H&z8~2a)>EplHr<$`r
z?Nb{%cw!Zc&;;z$qCf4^(ZAZK5iIb(+NTi&@c2iL3ATm~;ir9?`pZ5I0_;<7PR(ET
z=>@{y?b8eE_NgwJ2Rw(=0_;;ZjB9YsK9yLvPq84FKn`!)x_!!`|7o8}|FBOpezQ-p
zh~vNP)BXP&_Nfzn%|6wk|FloFK)>wMQNTVWuiK}LHT!fM`LFirg?0OslUMq8`&9F%
zeR}S1_9>Y6FZStI4!}OOVbRX9w(0z^Pboj`(@_wY0$`uAxY|Hm5@bZ89%nBe(+dLi
z{%)U=APVdDX>bjPmSZ;ghkZ)sRB%M?0G3&Tz`(NdKkZW%SaIDx)g+%*^zb=13s<44
zsr_c3s^Hh{(|5n@)7;<f(?gsKgmwG$?l1fFD+geo+OXH{(>*`!)7!M4_G$7D`;^5c
z1cH5Ft=Xpn0IG!N82!UO-OC}wh6w=n=^!jcZ_PecAg$Y{pf&qcz;Vq!#s1Ac9Y+Xy
z|7oAv5R|G3n{>#k)&FXrn*QBB&0n`qrT?%``QdB!DFNx+0ba9DIl#J9Zgw0Gm<%Pa
z+oyZj=w!e?#s8yy%2=~c+kV-n3grJY`&0n1PtW~}eR}mb`?U9$eHy=RpE~}Fed_uT
z_US13H~Vz<r+q4ce;mASpX&aLeJTRjr{rJusm9;!Q<2~8(^9}brT$;qrwYH@r<(u8
zJ{<$>Q-0nBuQmI$oyCx5L&sS5V}O0?3?KVtpN{?2KE3dt?bE5B_Gv1iZVZd`QAL_m
z^7aAtsRZxe>{AQCK3(SC57?&#aH1jfT;iI28v2KQD*ZS6l=c_<lm^(Rct|aYdq362
zcNVc5ziyw>-~(7>I}X|Hfy$rdw!;5rpVIznpBDUSpN`iyjnOSN=`agCRQ0IS1|eQW
z{4-xFkFhA%1(0I`7NM`otaf9bKcRVq01d~&-edT_lDQxz@C-Jl9^d9og||zvvU6I;
z9FLnDLc1$1i#$*fv)rnctWX*kTea21?zu^&Y+irUB|~Ou9OeiCB^b~K$w4<D`5uB;
z;A<UM_?VEbOqe9oPmsyGwOwg-iiN{4$9J?pL3W0+<p*k7#r;u5EL6uOjI<i&6|ixc
z#G5nA1Li;`Vd3>yOa&H}RD=97g#s{E;Gyc09WR)H&Y-<a^T=4H@kG}kxdJ+r-*jKp
zXfa*xc(vS!oMsK$ArwJ812jz<%haS2jPU2}q%{nX!TF#rvjWxcL+#jU^ut-Mq#CX?
z8aJ?r$RCePqQh56Jl-VUW=G_g0!Y~`^cEZaiUzwejn3KHd*ePVoWy&C%FD^<KIYz+
z%JIr%N>zo;J1@vgV6(_Y;6qb~y{Hf%MdFJ^I(C39XzixWCg+~_faiFU2&jE*v;zrE
zWTTSrzuvn_;^hozd&5RQqPJbW);qLqAcKY`VtFbEy^oSQO18dD9BfR{<lT;JHQvfx
z+{PSWy&a?TepBn|bmWRbzCi|bC4c7`!NPjZ^JYw=uhL#S;0M4m9V=8|Z3E^Od0;VX
zFbxmjwTKEjg1z<4$8B$wLq!NjdF_XAUnN`9vTD^sd&bxr?fzX!-+7QT?AJ+Lb2UgJ
zy={KE`73!)taVUo6UN#eQbX(glsKefG#Z`5)iT`xG8%51hGKHqh6C&#_t!)M^dX!5
zg$i|`aZi39w61>bJAj^Q84*AB#+%Juf_b|m`(1>|Gi7G2XfaAzqHf_4YPuMuJLNIC
zip6TuQ6VcF$-2O3;r%k(3{6EtQql6;_%d42>7hJI58lzLg|%?5>A_fj2^oDDwzP<$
zd300!fQ{5LCY}H-9_UfvKo;AN<y24pU)rZDF?+pFj5@zxAw?!<zrXYK00*#Lwq|HX
z3M*!)m?DTR@|YP<X6&~V`LL;O{=wN#4@?(ZE$>LpbaOD1_Q6A|cPgo3!w1whsbUS5
zXQET<z@~LdIL<NZEaIsuaNkBd%q`D&2=A|pD4GN3&VoDoDFY11eo3c-QQ~Ul2RZe5
zXS?}uzImPFOx@LwZ8`G>#>}nKA_VD$bk&a$P79XCb4JFJjztURh707J1xxi$p(dY9
zj(^(rP{PrHX+iIa@EmnFX71lVy4&dUCgf+=Hi?6YpG~qvj;S+a`Mw-~`k6)fq_fJ+
zuoF2x`|Q}mFVXE^0?>=6K1c+s&+mOJ9Fww0ygq*->2uuv#k#^pEvc{POuk-tyJ)_;
z=ym*S8d@R~-I#q{I7fZyit(qcx1aJ>zgEd0XjlY-_fu%=P>KYvm+`kK4ra;QPo-^3
zP3^KM$%Xw`&Tq4dF*1mB{`89D^X>TM`s>3K$}(Pb+2HLm;GkANlu*BY_Ry-~u<r7B
zXikKN?|cYqB}8T=^x^2}_3sG*TJqWov(l?UAD=aSsE^sSy7<FBeY*MvjTz%Y;asR5
zH_&jQO@FaZ>*GR^$3}cmGL}>sg%`o|hprfB{5ShF<1jAO`ht<_$3ffTWbvnD=c2Cn
zfPH#@L);GYT{|L*s?CRTUQX>PK3sN|+tpF^b#Z{`i&*cjncwZx)Ask47;Udg;)K-g
zmz|;;N~9C;H-FftDq&x-!wCmkr8oL*bO-Fyj;yT__PS!9CX?Hhzgn*<nq_<R|6!l%
z-Ybf7H$2sejx~@~2fthl8gCc1%6s$rj8)Y28^_-bTsu2GDe>rZnAH6{iR_6V_UX48
z;z4SPQD4^eTM(7Y-(=170Q*$CrLs-=s{?kA_EPSeeag}VZ`Ei0v`??zMf|c)o3~|0
zZe%(>@;MUGEH_zeFlQmcYtyduF4w80UL+_apkcYWuw7r$I{n6@baU;GYxXI>b^b0S
zzt;TT^e8=v>&5(p*E^OQ=_(b1_@>t7o(^ku(cz<Y@}2AUY4c<f`m;)Bk<GGM<5RtP
z+y|>Yn80lggr?yFhj#EmWX|fA{vY<KpuDKj?GDG}taQLW^)y?vPagyJDZ_^Er+xa$
z_LqG+Z}-DK?XLJ`pYHx;pLVa=r<*T|o%IClQ!CNifPH!!ve_=0j^y|GMn5We+-n<-
zFQ~NUulA|Mp*8#Tlm^d6m`4l+e;Ke(50n9S9(cG6*<ZQO6R=O|1<}y>dnW7>m`-ar
zZ!_gD_G!wReOjLi*r#e<<o)56@I}qUE#;pzMI;^|53Jdz?Au2++57nXW}l(}`}C9Q
zntckdWyTxLY=-iy@bkscE+Nv&j!<Z8_Gvr8E8}4c-(IXYmXd!k=xk13Rw*~X0^g=%
zYxb#(uK_7JIGLNbxaH1Gz&@26-=IB0h^CnrxSRv*)0uJqpzwhHET=5V`r|}a>FYK7
zv;weCr4-lf)4f0K(=Xv?PXYGnMVh}VXx%=wT(eK5u22B`bc`~xW}jaAVV?#A_Gynt
zgjlo5ntdvw$Ojs4_4w01opk}ty3lxWfPE^qZl5Lr_Gtv=mwgJnCuic}WHE0Lh##;|
zAss*M)0$NR&Ji3$#B%Y2*6dTd$C`aw2iT{VIKp@QuuqMC*rz6deR`h@4hpfy;(yww
zNq~JS7&{O7VV^Pp`xL)spYn=k_5k)NJwmd-O~MxcmLNgmpe(G}r-aQ+6ABE8JIwVQ
zuumbpf7qv+xj=-W4Imgphi3Apefs3D_9+YehkaTDh7V`yDSG^2pLzlI>3hIF6(E95
z9WgxG9@q`P+o#!jHUx6gFZ+}muutc}Kkd_ULlgs4j3cf}Tv9hYR4C?LY>MHo<qq0J
z2H|JL$GR7pAI_^M91FTeIKncagiw><;)iAPt+#<-j}G1_pnwkSx!GIhoP%hQR7La1
zP0HJ2T~r%IM@2yU<JB_7n+R4~wEM{M4(tn@+-!FlFIbf!u{(=wwPiL*W?!d267vi^
z=8MUOk0gFFt0PptdRpS%?#jT*f^^6w&3uu2HhbI^(L3EnF~_FcHA~pKFC}5{k22&v
z#>}o~I7UbBERYMjy;}pPMHIw=18}k2NVZAHmAW`EC6~Ygk)QK%QK$3elo8I(5kej?
zaA~&=h~^y8+<wH8n}F9(>s(#pWzg;N5Ae=h>DGV*iFZG$C4B6;h+N!>HE<*oSX*{d
zyj$t9l0^7GxpUqIb1+_ea`$oFUHxMv?g#JRkGSYU4b-_OymdN4Fv4?dw<h`8nfgPr
z$5Qb=xEe467A>TIE&*)kA=pUdsz2pHcE#r1f^a?b>Kr%Tc*TnoQp40)qV5yHvo{pw
zfk3Q97s$c^L4Fs|e78!BD{*$iOFa3M00Z>h<Nz%9-Vi|w|H7&9xZGRb;|}f5)wpuI
zC9K_#pL^?vTHy5z;i65S+0)l2LfQF5<xt_B;DjO29*3abh5f)tBQBs?DIm=K=H)E|
zPTDnL=u+v8Qfy<6$W??WsA7On@M?sDr#^h^fd!!)+g84!Z-SLJ9r^?#gIvf5SQse~
z4`!1ck`&xp%ayK>S!xce3FDq>O#A+-=?Ewh<imQ$b-UbB`P+vVx6^5$g4vSe=CmYy
zYihjfvJdgmM1A5-2iT!TH%fo_naqSJbEVFNZ30}PMFK>8V?*YV+0DvdZIRlB{=mis
z{iLx`?fVzvCjdDSTg5(P<?K%NAZhUlV#x(c-?3I!dtWzgXwOe+xput2GpjnD8>h3;
zI^Pon5~}(9NIc`{p%~Zx>41_aWm@r$^GBfEJ><y4P`LBeJ`=Xo>8k0LtAR~`eLA*<
zJboUqPb<||zs>;mY3OXnvMU>LSl0=bOln#1<UqRAsB!ayA&&jw9Pxw(am?}h6Fnwn
z%*XBu)#Qb}(I=JO%<?M|OqxIEa`DqZ$nf?Ud6pQjZSZ3~St=QkB{r1c6kL}Sdg7X4
z$T+7;4M+5oCQd>2BeXLC%mo@K!Lc86ogssmA~bFh(1<Ob+^IyqjD*ob2EZ=hGe?tM
zb+3T}XUsll_9T?`oyGQldmDVoexXm+eKz7tT*vCM%es#~o!tJ+u_wu&%6arW_Dqmt
zk4fu6P}UnwdHTn8Z2N)>fs=ormoS#fhty`uo;%o|$+2LB3Fsn&xW_*aZgD<Q`)=Qt
z75r)?<DQchH=f4TM`ORh=J*_zk>f)75V%yc7sH9H4-&5}VH;><Ztp|{AE6E+h~ap~
zT?giI1o1`$aC{7s=Is|I!et2>&s08vc}WDWX#D%eFQ%)7`&Aazr8vq(0rK?X8hJ`1
zzXC*4@=YWGAWv@`nKj}r1&!?uPp;5E9JfZEK2_P&l6Mb=eG2W-rNnY`0_16U5#_eJ
ze&;%Q8d&ABPM$vOTO&{VY?1waTcr)l2UOO`(;~Sa<SChdojjG~(%^73q)?51lBb$6
z7|^5D!Xke{G)IR%hvS`nM9`XedYQbEqqVw5p2isi<mtxZhcL$q5WUWYPA*#~PfL2E
z8_lBm0rC`Ir(maw1ISZM#gyJJ@|4d&03c5@EAr-QC|H0zl}_l3RVz@aG@-4Nr=U|6
zmvxHO<(IDSb0mWZW?+mO#SzroXF?xmNcUS%5VfIorg}YiJA7?;nk+{tc`28CM1-3&
z*mOKkuAwiMTg0qO?~)ob_Xu4d*;}&ao!));tvt%e#q3(SMG(0z2ubE&jIJmrOS0;~
zbP$3@=(<yv_c~g@P*!R(DnvU5!mdl|$@E&j4luhbo@9RvluV%*mFoKzu5qV<9nwK8
z=BlnCV?>~w;;5iLTr{LX#`F|nsO6mFN>E*fii*tV_s<Th#&-CbxK&ow3|n03+PZ(_
z38K`D`!?kW7XND9J4L|ES-zH?@wMX#mJxt=O5qrLUHdKf65yQ{nbDra8}5{|3L=4m
zBFzpNf+~vCDY1qTR1mom@J?l1CAd!j-l;D>>#l68!Mb-^w(gx4R$3<-+A=HA{m~*4
zHMd#i!2*DHDor6rhT%Xey4DcK3Kc;E87+{wHjI#4pQ#FSFR*U&F1b4LM81?cIcNoi
zK{#k2`CPK8TQitsnIG9OF$~+}K_0Rud-T-44IqQYIls*1u0n&!y77jtoiDh@Z3^xY
zL9rr1p!{#Lwy*V@%JmrA6Xhl~a@Zl{*To7TDraj17b3Q{Zm0-EBKtB`3(T?5M*F8l
z#L~fR167TPnl<lKKv359o(X47p?+Z15k-!V)-B;ZnGXGSty$08>>Q&J+s;Hl+5qpA
zZr8P=r3>&*Z$o@Uuss>3LA2UrOpFKMor;0qxB=cN`KNd4YvQx!o#IB0-ilVe??Qd_
zt=6>owf3V7`V!!sGS<D*j>eU_Rsv63M`vY6A4q0CQ%$g<5h)x{qxyx(b@(+zMVFDS
zC0}Znr=|t{67axRkCBdqaMebx(kC}{nQ$hKl!JQgIXB0&?r=1CsRr5nWFO$2mXbfo
zl8vaWF2NTZwQJs~qP9%?5ARet_NRAh5}~$i1bC-1*Xrj~$nk65DH%>A^Y{>(7Op>7
z_fE|TKfTiyz&mXOaf+;Yr>j~{LV$PLL)Opel>6Q~YsbZvTXrvjyHyJ`8epMaT8_94
zOhn%q(v;B_E9jQdp^wChZOaNT0*TPb_wGeQ8jVCSnmoGCv$L}3u3&*)5JI=T(^rOb
zyrZR{)1c)Q{l)g<5s;zOW(+k4Mw3N|M1dMXcCm(>q*tKQi@FAk`+Z~!LC~rb4tBu=
z>+`a9HI;crOq%>yMT5(FyCxYNOAb4F8KP^#L8lAs0G(D-3yO{Mtt`LjxsB_iCd{L(
zD3uH*0++hOjJY$h@wpS3>&qU4pdQGO1_(hfH?HmBB#UmZGQ}9!KQ;jI3&O}bpyD`3
zJr(J|J0MPCt)iP|ZEqv)(YEIc6)r?FD7Z^c5*G4uce%fO=;kN>u~AO+-IPYx>idbu
zOQW1hFRS%aPIO*%iGAWaUhG>|8Gaj*6j{;ekMNF->dZ-W(S7WqSXQ~MCY&7I?4PjP
zunvRC^sk9D_qa-dL5SGxbaKCo&s8JRy(bB-5t)7EEpH^sUHdGOR{5vhD|6gSH}gVE
z%ddj>>03CyaUbX(avzcBRlzpDyAOGFKB;VCGrQh>?9IT9fPr`4_s!mr939>F@o^s-
zwjZ!hPqYsJ_Nmt$9s#HQU$5=A6XlmD?O%46*DVuVn%=+qQlOWRzAVY^6Xl;?+|Omt
zR`BK7gY|%xNb<)CaA$k)gi>X`lKX-^c=uhAN#(G=<AFhWcEx5u20R2dit46vtO$8-
zIOf@0%Ko<1Qxxz{$pW`@6MY&zB?mmEW;~@=Jh7<%W}ki@w1FjwWP5HpbO~`0fk%01
zNO@^)^3pQ;VV_=1;Ga3L#c0DBY825CEPC6^pxSGVK^gD@>{FwClt==H@r)N?g)AiE
zZEo*vvCrG`n77q2?<n07tCC^UjTGx@Z@X6SZQUcp))AWlZ^zHWTQKY`n?|K8Jv5z=
zBZ~aQdxNbmo-fFQyX-w(4k7pG9CT|P&CZPOrX}t?q_aCTv8i-)4=UZ$K31*!;K6-|
zuCPZ<okk-)4jwY&*)%sAi9JZn8{2UVF;a8r(8?jwu66P>E`I-mEr(YGjwO!;*dA`s
zeMd?@eCBgZ03>a65hPC?JC!VmwnqkUc;d@`hn9*B%RU@&=+K$l@u4V$_rB7z4e7~b
z&(-rAp2Q^Y=Q0_KGxAAl9rf7fd0<0n@>pz2^%LqqZ0dkd#+c7usn~Q>sfYdO#gZqN
z4*7)G`(E8QMospmbRG(a@g7I%W=p}YSNrDfI&{P`+1s)lA(a$<tn|i)*qfV<+?hFW
zWQCk)RDL2^@Lp?G!J&6|R^B^HrRj86oo#q`Pp7=7^)P*(UrF{s=Q)O0=wwN@U-^c6
z$btHb2Yyupe$_L6Pyfe071|%L;dp>>Sb#`MfavuAv4;WTPXi>{0wmuCNPP&9UJbya
z17)NGWz_@aj015Ff%5wUHy#gE2n$q92~@fssQfTc<!PX5TcFz8z)c?l)mH=Y=pYU0
zAWik4RW0KnZHJ)E`-60j2W@%#@mLR+4L!;)ILP1wK%N3fCl^4T8h;7W*Nw_(oHtNk
zpeaH$3E@h*QGSk`xL~lpPvmx=NS)arli3){OfZfXu^WHF;T8P!co5Dp!jHIM*tkZX
z>VJvxB%Ls!L7ZNN?_52x_d48caeh0E6W7R@(HNmX0INAh?l^ryZ#Br~_DS!QI9DsM
zrU&HE2S^y}ld)C!w%HiJOt9uS#7X$G_lHv#gSm}waaqt#g^@n{9zK;J^2KeD)A-@3
zb@CK?fqeSRCHP5zJSD^hD?$#HLW94YQc8)j3FF=z91f7D*1D&SV?G}sfXy1YRu8=j
z${e3}B*IU+EM9Kp#OVf;Jix|n+{PcE<dl!Wm`FbsSd#$va9mVk%^&Oew7c}g<sL5F
zY<Pxl)RkLt+ZrSEp{F-1MxSkrFc$f$csgb~>(pk}{29zA<98>+Krsr75q=&gE@Pp_
zP-q5l3cf%+Xp!4%0P-|uw@CB>TBM&y^lnm&A8S!3m^(B$%6|8mhtP9{3g;dvEJ+J<
zTUmh*IYuaf&iStf>64%tJ>0m(h&`YMyIA-EfIOWIsuhm(eajtI8tnFJ(UTVG`!oii
zMxU<+y?7F0{Pt|+tGVjypB-6?^;YoH!Q9rmpEJn80oPCIdqiJy<o5UiUG2XW5x9H7
z55EkMr%hWTi=Ty@_Th?wLR$gyl=N9?@w|m_sIfw5t@?S%OQ#t7zuKliT^%D0X%WWM
z$cXDP;l~$(-kk@?)2P!6duE|m6gW%21O?KU&yIge`T}(#gxBw12@PIdgu-wmT{0%l
zZPK-oJi?ks$7f}jvHS}E%|5le<jvC&5}1VI*Wd2*5!VTcquCiE(kQW74vcdvib7pO
zJ8ZXv6ZvH&#~cLH>{e!krk)8t-+tTKD^1Psvubbgkyl0jzwFa0-Jo&lK!cc%H;NNb
z>Dic|_T`9Gx{H0-@;;4Wt6BI?+^)hSqw)FD2lV4b4J^TBo5oqWR_UAkm$cXH(|gqh
z8KU&65MO%@@5wHKD;7XjJrTd3VMu(ra1N;Wci(rX$nhmdmIicp+}i%|*mwQUQ@u|f
zp-#Rx2(}p+N`0htwH2?Xy`>8LRxuabw#2`0p1=Rv)A5zNO9mJE1C3X@PVW!R4mgbs
zhbxz2BY5=}X>R+L=U%8@9x;i*rr|kTl^(H}=895pwDw!cnFh<oE8Q)XO;9U$>D|n|
zl`lhi+9}sEsB2{7u#)=Hq8!zPM-P{3@j!6+sNpq!8xKRVueb~+8$J08JMCk<)3~>B
zG;cIKv+60I=^3xL@$$hdO6}Wf@08snonXH@XkynKwDH=>-ZKi>XC9PVAB!Ic>{AMl
zzG9AlnVEeKV4o`HCFw8ygMAwBZoI6>bRc8m;#pgv*La+6^Oik2Vs<}NU*-PeUYnc1
z)|?0yp181xF(wj+92B`v${jWLzg<Xm%&vMzbwHF2zq|i(?>V&+wCv3b#&d(vcBSUU
zyyy)h3j)WAnl_%8lCEJY95ZWI#x)*(-Fr^G`s<a3Hi5m1d1!$vLc{fmHrIwMq_#87
z8aCQ#m`K#EP&q{;W8Xh|E|?LVv&r-s54d$}*@;ensg-8429*`+>R=RZ`_Wtn4N7VN
zTJ(%zp|w%8p-J>kru|@1wFzRYcDtN)xVcVMZ%3QJiOO2$IlFclYr2?yPL$ft)A#CC
zyaf*?(5-?JG0q<T{IsGK=J352M8^&oe+gBqQ{|%XV*Ep587GQA9?xypPC*#y4la~Q
zzTMgdIvKy+7M?Fs<n6O-GwDcHc)CGY$Y*9x%;q8i`IY=>RG&AYq1bal`7q4%gkeCu
zEODwsUVg>NRd=Rra^L+84tP%yJaM@YK9{U=<M9a9wx~pmd7M9`1s3pts&)jsw`|-Z
zb^DTF$E5=O-TnMi%bQ8IrXiau?mad7cB$5P=hoWoc@|y7k=4A)7wJ|r+*)UfbI?7C
z?KcYf%z5v|zB$Lmh&)hp-%5+mqrW_g%Y$@K0QU82Ln9?~+sFZ)2|sC=nPRPp{|7kk
zti`b|8tPdK^vsfY_vWr)?tA^5$M#M3tCD05Z;Znfk8Y26MP<Qmka^)k=0rnMpjJK8
zKA0{hBbcXXq5no*&c+EAC*f?Ns)I{d=@~Mu97pfjR+xCmP)_VW+NTl|&x~d%=rfIZ
zl9Tuty~;t}qeL^Y7nlb1$ecvW1DxXV=H3RqGH8>Tyd9y-I7PEPY3Cd3BoZU@RqO`g
zmV&aF06eG2DxDp<M=a;!BPMu54G5x@DT4|Dd>gP6%n~!t&-6Zs4-<{qU8{MqxZnog
zu`=8JsCoXIBn!1j8Q!Crd6J75dEGiCtB~S4@fWwFltl+^@VYWrJYpm8qJwdMmVsB_
z^y7>^^9c}!>ZGQL`Ep^YFLvIYzc78G)_{`%^E)IUKDl^PS5Dc9@w_hUvCBbhGdarV
z3I+Y~M7??jW80Z=ErWdR8`@kz**~x=FPjvFr?;aV?2B*eJl<guH5hMOT6E2W1Oz*k
zae;fg1mA1dskUHZZEL#3wW^eM<i#t5WSWUS@ZgfJ@rb;xSu6N7Gg=S3_vZOxPVuLB
zWoc^sDtC&`&I0H2DsB;7=pa~~U=-o5z!2-@{$Mky#M+oG?_b2~Hag$Q#zgDch`p-U
z++aff9;L8|wXG^Q6`Q2pxv|ua@^#ycvUi!3KSJSsqEk|QQ*xU@hG#sXF%6wlAH9|S
zsmGSs4G)=()a(uDee-db+T>!rydeT&S$d$DQU}#}0CYOthJ?q))lTHO@{e2zN897g
zf?6nh`dfrbiK7up`6hcO(w<bJ7%_MeMk_&ZccJ4{%oaC3Sfu8VaOh_B&>IzKUpLdd
zPcQw&M^gvf_L+*!w5W%_RYva)*1<e>i8&E_wv}?WHnTut%=F!vmc7KfJHywU4UTBM
z)m_a5*T9Vm&HDy<lFrtO-|>B>eT1<+UyK7GdEs5OpHrKq4QJZp+x3J(8!vHat-#Zo
zhV!>ZcpauX1TmHx8Q)`5gd%e4Zx+UA@4C0MPO3~2Is?=5vg=b5&aHCRj8Qt_8;`as
zb1d%RJfdilr1K3JfF!V7w(XV0q78^C3(Y+`uI@`lx;A68T-ok+@65NEK`cZfeZvpO
zW?vH#4*;2|RT~P2Eazg*@Ty;J=|Fk9$zJ3hc;FVsusx_+?x=~^@U@2=JmbAXERSKO
zMtuQ07+J3N5mP7tX1rH8<8}G$u}{}W+QE@W<@oc7jay_>lgscJnODK}n*~iLKHte(
z?Nebkp86!y5W}qN8{QSGl;xNZJv$sH3y!;XjRd!F$WND~#1NNclD<CJqksDpF-=Pr
zsp@9hsr)*IAss%;Qk8g(oQvXbyb^!j%|rs`1U8Dt3p-T~?VRY_7Di|_dH~BE5#d0Y
zDe{%aW#x`+C+{}v`a0;|%;h8_W2RA4FtB&IPsSIh|LTHM(6~JkeZ)p7*&M!e*j~Z!
zE?bD@0T!2H%^-rQQM~#cDeRd#A^sc-Vu=hVzYkc}V|SzY82h4nez;6Nl>tqjAw`8m
za5-h_80M0xr$QLghM7&9im`E_{bqbmWnEz(oF1k-$S2N3qnm|gn`2!ZaNAd3!F1^C
zPl-SlPy)Uv%TA=`hwZEK7=LWBf`4~uN0ltcD`MeErBpO+MK(zBo0-o;YV@P1X;dMl
z|6MC4BxJDqdug~aRr*Q@m60ybnKLv|SK}8cdvFD0DThl93Y#*;BzZtc{W5Utkvf$?
zOPH~uOsI9Ug49(X<^z7&*hU3&CjT8n{<qSr=PGND$Le$IMTTQfaO(AdH;b62+>Us0
z-j+j({cxmCb#dFW8lavs3ayzs$XbzRiqXkz)7Uy}2ty(yeWSUFn4P%M6k|(1pq_H7
zHB)-0-$-S#i>Dc~KD9#RH&QH9z|$16b2aZVlj-W<R_4MhhReFFT5M!;n&Qng#_Lpq
zrE^O;B}c*ynxB6XtyLX2Gwg3rLDoGAHrH&X@Vi_yrq&Aigd0tp;WF9nYPAwO!c7xB
z#R$E!-fUs6>t^_HzDy4DsR&)ByM9QzD#lFSoS}f_0xn-MR;^JpMHfG`<whM=kpYus
zPAf5Gb!4$TvPKJ>$R$(Ld^0g~lh<1h;BJ~sTSsnOG?faaDDu|{hj3_Mxr}zy3O5q^
zZqy<7nwf&G&u%ss6ExwotHajRVRzI%qF72*f+s7j&h~&8ULtrlg9V7;Pl=}D<Q(p6
zU{SXSfnD~SmQ7OJA_l)V1SJkD&2oxnnQ9m^?l$i?Bd?n9>2R$S<{8w=85c8_A5%(i
zGX!skV?mr++S|^$)opc)5c4(@5X;}-EiSptp~d20<IN>{dS^UwX0dfVQxx^_Y^bcc
zenE}IA{d^}sn%F?^&l|mPv!;urThq8RxK1~F4jm!DpL3t>wplmFtrvsRR=Zauvcbi
z+Ay`r96H+OTkK4>xS5q$*S@&J*qjwEN#@kLZDzC#9EpjP3v1JD3g<`O{$&o)kOcFo
zOJ<9;JgT({E|N+;WOX-&>|&j)AZ7D-c>T6I_l;bx<u_i=fq0O$Qa*0xU8WKQb4^7C
zRFJ~o7;fCm!IRHGF4c+8l2siy8kLSHD6TSO7R>~k89I$%^MkUcZif!dFb?R9c`Ze#
zbjzFe)S&K;9O@+;4n0)mJ7St4<8{+yF7?_*D%o)1f3bJpUrqIUpYQ_-kc5zg-XRo`
zE=7uT5_)ech$0ArG(|u}qy-S^gd#;yLJ<&=j?xJo5j6C!p$Le8G?kvob)9pcInRC1
z%$oJA`EBM;*lU0H+IxS>`xWWDj%GB;g~6z$a9V~`&N3RHqG}x_M<;{ru7z`a3X0U1
zf<G|((1f-`(5Snh0e$_0odY3sDjDa`T?aBRcS;9pzY~a3lk2WJ7j;dVat}%#cb=C&
zh}Se&ZYYAu<1k_3Pf%X`yfQ_aEO*|sbSVT!3)(DijYo(uraqC2;9Of-`}IOIylC|h
zb50NhrJSI+HO0E+iwBV+!D$xaI%@*+W=B8>?1l>Jmar(V?mos#HcIt+;ZS22^B_h^
z(%37P`av1l0ZqgTY@kIb&@4+2b7@zf3`oqb^x3V_=pziH=#3u~@)U=5I>LzK2!dH0
zvK+-3zV40_ucl19e<(z4ITd^fiIlD@>e21w^Kz9dEuEPc78A{IpLwlG5<_>3p<&cs
zcY#n82)-_sXZ8A-gL|}Gl;vW9LRP`<D*;)YR(RFCerV_Hc!8$!s$VJ%d#Zk~#VVgJ
zKf0w;0vCxoh%`NL+fnQ2#|xpCJFE8lfQm0G;F0Vb5mlk~?};~`>6NKDzDAQMVPHR`
zOS{C>;x&`vhonlK4lqpbk|N}~>P4JbQWK*l@}v`gG~7*RKIufWbkusUC_NFrGq9kM
zOLjr#zPR2bfv&ql`SMy@5QWxZh&MVEZK#t1qEsz9nKwLyEFuIA3N>9K1!S~!sYTH^
z?9B~IaT-&8^f6spM+zs=_*|k%TxaeOBWL>pHb^CgL(iscum%(4Ub>?bygnS=hzpJ6
z42sHsUaX1if+je;oG6Mbra~8?k>%lY*&?5hyz-k^3k0JsxV+FLQX{-X3ZYVcL0*k|
z*8L(;OrUZRFANI|4g1u=$0La5aTD*?8c2=kNi5^*yc}W$`sv=CBd+t=P{+0m%e73)
zd;O(;smF0unP!7{`GEM<ZlHXF>3eX5)iQA4FtS1r6cn0LDgBw5q_4&k6+A+|*>}rZ
z(%l<Px~X=(VrC2@TZ+|id~%tTS1+jZ?g$g1==2_r3DH^rUDgo@><k?0;3ff`7jv4U
zQ5tn#DmtC)`(27YWvxfRHt~Wl-<iK3V*ajIZRj<0oq8pgmI9fxaGKp;CGJodTJ*r&
z=K}%ICC75jI~yP)ovoy+$UA5iQjw<2A_wn_3rCo993q2)Iwzm*IZkX01?bQpEGm8X
zGA>xA+m|MKL=cNb@94SVL&K@tsn9G{np!raNsJILjApR5u!T2qv0}@rY%;>T5RwWr
ziM-Gc(2(q;D?+Q_!h2qIg`}+8Ln1dWch4qn=#{#lNs*;Zt_i;6C>0{rsk%;-S+^QT
z3K$~2&@1l3lQ`PFu0EB(W)Y!bQ?dNpSkvo%1>BgFg5{d?sJ7}pmiD|V*v*kytwGWe
z!d<8r0VxdL{V^D$Iad7xj?pAV34lA_oeJdGVd#UyMaru*>x2!DB8Nf=f`g@M+W-iM
zuVC0(YbXIqDpi{bhv5NgI+f?G@15&+(g(cZ3dD*Eck`ED7x98|5{#|&j5UZ@c4G38
zhgZFx4(d{rBn|-8i5S0~OCchOTUeOS?ldD%1QV&bF9(%G1CB92LUe@jTJ(hMPZK}s
zwzY&EuLJFUkUa8;x=kLOmWhYFQr{hgn|t}Ue8caMJLzx$gx84DN2wg$4#hj2lj}FQ
zy7xE|EE$6dtk<<?JC<eT_exU%V@A(pwy}&X)OsWtJ<#06lNY0GJHM`VGnq%Ni10Db
z0S!DEG0R;`mvvab0S%1Hr7HzFu$KCRhKG-^oMg*RQ~UE713nHqX0_el#v|EeoX`hv
zKZr&dCwFJ2T$zt6(nz6xo(d9E2d)3YR3=VZtLkV9*BgRU(Fv2{Gh-UC$rbe|HIAR$
z{k*TgEV8#?FHmSx!EON;M;4PVC4%GZ2yo&RMr9w^J#_oVyG4n(TLxNq!9Xff1OJIY
zH>0bBd}%Ja0k~m-)=(~$;#ngN%JE)TG_fFe-X7Hsrsm@WQ}<Npa7__d%L$bEF|}~T
zu8QbFF>U%5@7K^+@s3IUT>|R?HG=qNj<JM^!%f`(r3U?KsYWeR5w*J7=F75D;UCLN
zS;DUG0J7UFbO*%-I?FoLK#evb&5PfxU2{~0@1nagY?`IVrdYuZYNm95uRiFdT>C3s
zig)%gN~Q1J`<H`qAX59~nxfddLfypy9^xbvI=z%Z^u>k#8;rv5HErr{R)pWYft9pb
zXTR=YpjP^WIx@6vRbjtW*v7L;Sm&caRHs*GJ?;09Jmt8^C_&3^l&$yOzT&y;w;9C|
zQ?~?j4gDj|gCcKUL|5IIywa)hwEO)QnT|5hQFVmr;FCO3aCl#oprM96w)@HgxEpu1
z@tHnI!?DB43?wxL(13N)X%)|^yru8*5igR_K*=RZ1ghY*!Z(23zXHWi0&$T#n~MxG
z3DPSQz~4qDK^QZ1OoZSvj7g_4#`^Ht`KE&7F5}A}jctN|302ZeI2u@|_1;x8ji8y_
zh-SggpX+9=13-!B+~Y3xerk;$@>9_|{6Zc4Kr`-#kz$3rseY!RfmF<;Xk1NS{)MJW
z@{w*7S6fH{O!)m3`|j#y9m`0H3iqdde{G(+xh}KpTw?d^jgAi@212D+)E(^xS_ai9
zRdkeU<1w%?zPT~)aZ~1TQ#|>&v9_zB_PF`IYRhP|=0%MB*l`PmKixZSd-J%t?{VXC
zbJJ3D+Z)vmgc^a|+@jRdsoK)O-9l(S?i32{(Nt@?sn&y0YcUS)<X7vBJn407>A{?I
zcd4q99?R#pwEk)CEo|wnJ?VQG-1h$D<81JUwBUa8mciO)UJ7|i<bHDxbJbj5V|kZ&
zCwzoCLbEh{#4{Xv02EMbrA?2}v`}X}h~%&ck<SH=$73~-RO5LVF$?uk)z%S;bgJ1p
z?tD6aA!Jmub;demRx@Pc-s$K=3VeDxm3cav*E(mcKHuIt;&%GAFNBg1H_O~cJ4aDc
zPe&tLr!>{4bJQ0x<km%rka>2E1z_l6W$TK3+tRA~vPA3hpVn`M>MN0<<MC&+k*({V
z;hF~_Yu2Z8X>GGhts{9D`Hj<MiPH`HwoSLT)ygx{>e<q<#yWr7`q$9SSxV+?+s0_<
z4}|8AAL{!*+Gw}ib~Qt``P+UyCi6a-sMC)cDIxIUF_e9#<39iu6YAqyvM?TVQliC*
z@8TWPlvKu?mV~habf8$VTvM*BMR*e*@G)Lq*@sCb`Yy3Ga2Uv_BC4*8*6xcH(l>)*
ztaMmv=q|X4$~S3$hq?6sm9S4)XFR7H&!G^#&tXl8L=~|tbBX<Q+aOEd{rABm>pO@S
z>~2SOoJ?dlL;v#_u4l3Ply<#o-mOHHdXN4$+LjsL)*h@)WVR%Ud~3*Xn@v_7Rq4r5
zke+-m(LS?Ty)QA{?k3T;Hj5P2iG}g<MSa_FWc7atSBZQe<Mb@@8J&pQ6cJC$aAx~H
z;FRlsZJ#z?F7!L&3G)A6*{AcDFFYjkg$5tKd-W(Mj6W>&^!N~XkJhslK*NJ0{L4Po
z_MiEI=mej;PGL_6vyoje1qzWFcIJufM(WO)C@|<D3weIBp^boUMH2eJp_k2t-DJi&
zgOnC-2Mf_Bj3FnC2HSiaxPC!dmt}ULXV+6dh<JNS_lv&bN!F9y3e=8_X=={bSGpD~
ztGCutS3}3pE&93OEjT-MNHMIu0CxUcZrUf6zwFZqynotfjr_tCc7I1%Ya*YXfk1&o
zEDD^$trsX@A#LZMA|Ew?wbWZ}fz{=*s~J>}s9G)S#<9eJS$NS72Ki8L;&8OQtkqOC
zRM08}TgwiJ8n+Sk`o%ou*!nTec5$rV4Sjn<B4gV1#kjY*(<_=(J*BM%?Z|{69}|>+
zH<1)Ap36xEMR%r;8M_4z1LE$T@31jpuy~7(be`~5`WS}{s^ihQxTXyyGkE=a4-I;#
z^XH}?UD7bgoj3HLkuN4N<JPS3qXI@>!RvJK0pe#I%dUk_vX(*aHr`R<R%5QI;(FTz
z`$sQSqmhCjJvt}1mO4efz`WV9OF@sOvwOuSZtQWeKR&P#V5k$g6=kfh++dt--9W`F
zs3EmFoZ9-^uOElu(@TYLrs!?djc3#*n6!u5YjHVsFuw4$sbZYXy7BF{2U@R6!7b<w
z5(Co-p0HVoyC|yf)5*x`Z|V>z);G-JJ<&^SYW~zHSf1Hd=h>i(klU!wdj;Z{SZOS-
z5A|~D-JiOBm9o>|-5#<(Hwt7?aRaTKd(zYX;2AT+mgu*exo@Hkfn+6EkkVk@P)nC<
zT--yxVPDr5F5|wv!rj2~({I`9hN|bQp`sV3EdTuGmJA8F^&Rk($5#~cs@|HA56V3V
zZIlV6V!_{kt_@~Q2V)^#F~=MSykE5SVSL+K*@3bxO-`OyEbT3u2J$tq?n^$BR;JKy
zQW?A~8eAbx^Ui?~*L1l9NK)y2Gp6*0*L&Oe0%2xUtxEK_0x|{^@fGl646M-7$-hkC
z_XMRR-zeHrUm--O#n|dftn^-osP(hyv*}#$rHdMe6h0VO5dWDjtKu3A=gKea{ekSf
zvvf4h{ymV-ZEPW~$Lf}+sBE&`{!jHM1U){8ox#M#LLITvF0y#<uz|jYFVBtgCE@md
zrSU*KOZu2gAniCBGxD7;J?o}yMM|QnR{?*X%{TFQXL*LT@DyD7ZJ~3GhW6`b+~tl>
z;_ps>+(5~gm8XwNYzgFD16X8zu*s3&mo;|NvjRp?PrRzTpWu8QnlnANqS!cX`j>rr
zyUz7*`!u@t`Q%^rsof|4cg!z$mRFR&ahk1-$>;ps7s<)JU!#x5@eT|YidKaquzdT@
zipJWKd1A)A2}^mG0l1v>=*}3kI#X8GDc!>&OF^IX0#oauOCrO-1lKxuA#j$Cs<;&c
zZmcL|WDS$Z*b*ziqI5b1`r$i@2<6e|KT<Xm#gTDzxqQ#;D!kUL$d}Mky59wsWTIIT
zsD^bk6bvk1cwEjYqtY=od}C8zX5Ar<d>!|IM};GQw#H-PZNRTLR#4B&qfJ*7hsIMB
z#<gTp#JPP+sUYFq44lO%@RCIYQ(xm#He6MFTN5pxTK}lp8s139BRt>uL9r}f{zOsr
zn0}gpi|ebI>7Yx%Iw7V_u;E9$&jr7W1g^ckYVSGoxtC3+_J*kNjW=9wfwTrqLtgjp
z9Sbe&PEb&iiu?MiA1{{{b0$9-62n>CNc>*R5iOOZ5gNqffm(oU;iT2#P>~lmy3F?a
zft*|dV`#pr?C0a<vK*W;R~Fc`t1PB9A0WSy?M5E*{5IW;*tdtD9bL@;u*rlXY)C*&
z>kbFrstBGFBhbfP#s}c-c8)occ<xdM`E4cTFB%X1^FE*Ri;szR(M_biau1gU*8c`D
z;i_7G(_&9WfE^Hq8SHGG#OnyzEF?Q!Ut*2ur_mH$fEya1`A@YZ6>Pg)&SM(;5^*3F
zzch$&9k%zLf$mFT*#z^N&NsW4{e%+puZ*WFYrXC$mt9l2spJXx^dn_Ye64&%F;n#O
z`m|r(x8qf%3wMYQCcJo=K70h7Ya%{``v;-ky6Pnphrwn37_teN>pd-pfkhX~dUejm
zJ6CoOe6)a>lZ#Z#BCE$X-MM07jHv-xkiXzl5C63g2Hm<D{>Cd^751$V1wbUz?NL)r
zKr`g~42t(G{HcgI)*);k!(8W>%H_X-kZy(tP^qEZCtGYLlOp981#$6L-t_yf*4M7N
zUM`;O+G6xLn12;=r|J7!zQ>PQzy8!vYM<Q1Jzll{Du((V^~2jIeDyJDPdcy}=x}#Z
zyybQp+voQA)|IeN2csvBk_t8pU*>Y3EBMQFOUqeKI~^}o)+$O~%1Zfh_rRGg_E(=+
zxVK-fbp${5m%eoRTkZ#>tP=hCKDv{gM3)$6<jn6rRIx0br)Vs{xj})Zmv;2Yrg>Gh
z^HUGx*;cq=!`E-am9)0QEA*MC8)T-dpJ!&17Hc%+w$@*&wyvKAM6IfCF6TGT{(L!k
zAC%lh#nm!Tk2v@x`Q<0IW{Zby%folf4kY5~#Rp_k^43;^f(yP|`Xz_|jvQtpJxkZq
zcZjQ?HhQ(({gil48~*lZ%UaV18m2l6lcE6>xO@AlNQC32C@GS~`ARDLnh%3-%OYaS
zdy#p`ts;&+^z|Dbze|q!_cwxzbyC`!e_!qj`FWG>q>M3a`a^reR^ItjE?dpc*?XY}
zLJntB=G(6dABFBOg`ItQd-mnC+TsNOO%l22`&nn@_E=oyQ5m1lMpGd0+sVQQTa5FV
zBgY)&f5z;WEdp}geEQafDKzdkc^?ZITj0W>{`g~%xbVIrPlN$hVa0K#xWmwFfwdnH
z>pGO&`N@9(Mc)7Xxvb2@_K6X3fx`v^jq#~Xu;@(nfhgc1FJwCKNJx*6KyelH?RLu1
z26%cv^&Jk<ifnxDF2IqbdSnRU{{)+c(f3rT_T!*mkza`0ZHh@S)r#%2?^G#9Ot#xf
zao9g`0#j=Q`Z_%0i4*%vE&6aQ#C3@68iwCw`&Ymx#^Zb@T_V4t_SoGarCn_Gm7mq(
zPRI&J?mHdqsZNOBsAsv$eEoPngAeHzVxe$@;SHaR)Ob`&Vcx(tAQs0C{HzjM4Ue=W
zM-Q``7ei7QkJGDF$qCh*5AJ7dd10HJH`j4<8%VB69H&4W7jKzPMT%-oHRL_xLV|X0
zQ9KXf%~%}JPLz>vkIF7|Q|Ss0B4W`b-htnZ<cFmw$Hd0?$nsd5&=rw*inJI?oGomC
z8Bkw#gq#4ol?vDHGombyD!l-!?}+5CfB;kKMPEVH8XXNL;k~$F<Su*}r{YTg){Ln@
zI8~^=OGq}AD^cLwXQy-TyUzJB9*;3DAFU&BfT@7OrX(h@G%K;pRIwa6F)W5fXLC=(
z`!Dabf=Qy*N}|%2xt}mtn!4e*o6RI9a7~WJHlNdqbgqXfwZBG%QmY&vIX}(xyroRC
z1Smb~D@FdEnxVHQ{YvP<x6})JWn~j_9ii1*70DOoM<kbgFHF~bhNY<>Ylm1yAx{nP
zZN~J)a!R=)@|w&SljW4x01$t(fZy6&sojbWJBp>E%2uWfx2zT2(iF$TVFXVmHw<rp
zHE-Y&U*PB;w1^}f^OrGknvHvUMybl=k9A3DfEP<H4(^wj%P*xct32~lX|GbrOVi<z
zQ^kx71qqK@ywQ>LlX?8{lDW7F|GFw~Ec>vN+IL-r!BMEJbv7XW<E=hkAIZ51JwA>O
zZ~~sq3&Z0AP;%*@-Ni5|3Me}-@i|%`Vew3YHpsh4JZoC?xl*xQ+VnFhz8Yg>KZ<$8
zRhe9yR?A_CDkH%|KMK5H6fxi5w!N(zLf1QEt!inbXIH1^oj$}zrGME*pEFtiRT=!b
znC?#iTZ4~u3A0}EMS~mry73qFE?+dv_AzWFYCLiO<02J~_J*!#2S|57Z2c6W7nQF2
zX&mHh-(KRoo2)QKU<=qQX>nxV(gvOiAk47*a|?S8PC7lsI<tOdMn#YxBqMKsi;qN$
zr~B=nD&XwTEFXQer2l2X`0G=#tW~>@RUeg=yh5ckE04LH@l`{94vFuJ`iyY{{u@Ak
zwS2`?CwMwR>lDjUp~Xz}<QEixjyQ6kI5Do^nXUt`j5;ENA8^wy&<Fj}m>E+TLwzT&
zbo^+Ms;(ncJ9L>F+5qLo>+$J^s`2)je)j4QYFjQ}fAP9D;LY`VYlG4HluzR#n?5#|
z#l)RuLiZOGAIrEL2_UJl3dD<w!A>-63(T-|7B2#Og(G8dJ-A$(y}N_I_%DoB0dU2U
zA)U^`5&2u|R_3_rsWyWg6^9kww|?yjv^TTKC;kdni`r*5>?dyDWOJq1r?(Xy7~J`M
z%9UclJZ1D?v0hebDy29S(@BR(BnfJu?R+Z0YT(GI7OfED<b0}qCwAf%a{#yN0}Tq^
zJ%(qzb&nlJ1*{KOXzEbxNLR4AqHGu7I+@`;JK_D6?e5pNuJo@NjrQV7<6&fr3A=JB
zB@O)5v<|J?j&K8kLt7!v3KH-Rkstp~;bejzFv%YXplhe{{D$%Tdhz>Me$5G%lO<o_
zKmcLF?5!<gu{7at&i=sq>Vr(byL+X)d5)%Zq6nNLqnI97RrtMoLg0%6ye<T-Q4~YP
z+pCqI_{E)^IWrXk-anKI@Rd-~ke+lle*nFxhZK?JvyEiZ$yd<(<81WsK|6bJ*VW*@
zhmu!;`L66Y-`?RX20+?s?5e0>6HZDlSdayZ3C6-d;7Jql5aB|gb<tXnSpZ%EaGhX7
zEgc!NGCg*HK~!&=tj@C+;~B<Cd^Jgjy96)m-{zwk!Kzb~X|1T)cMr&KV>odH`u?#v
z@D8M6((dTKl5eKM^@f{nLcGLymVyAyEi7aU`}B5~xV=7au(|2a1s26D|8d2rG~3wB
ztXTHZ;P@vsUzQZ-GjY`S{q|h=sj0HJF|=`7kZW3YheG^o;R%(>O5ynlqwgQ5G{nwM
zC4S{d`u02ayl3l-@g*-R$Y2)kfT}8P#B7@iW|FTt(&6;lSEEHKiP<iN{ZXvGt>J*z
zrCn^uJ+o*1SO_jW^+_Se#fzH6Ufd*Y3a4GVes;R$WJ+SxtgSOgS-rAaiUY%URug4D
zY$2sc1J5wfh;p*i;7p%xNDt%8isW=P&o-!$j?L;|3lLzB6XGLFH_l#h7wwqf-w#mg
zM@24mu@DG1A3eJLWICsvGneyOR&3N^#R5z2=a@*L%cFMB*xpp%*-~Po2i_FWeBGd|
zMit$d9odzgcRZb^?VFqE!k(4S?Q5+Z5CC<x%WC@p0cj^bSmFXv)Ke;s{SKu621~&+
z<!z_<Uv}Q;!#qlCy#BQ|>L!E5g-}~tW$K;$tFip+SCAn~YoLXoRRP+>IOPc{80}c0
zDP55vS7~HWk!h1b#Utf?$DFI~e4-1Yzm!>6^R@2>DN}c(QA%1*xZc!0FN(c}R@6>h
zrGngISLVQ$&<yZe)jNk3GE!vlrUjN2CyqJ-J`5B6_Na_p&sDj1l+&n!ZsAh=QmtHt
zMI^=XfI3PeF^``vvCukIZK?!>UaJ(cugS@(Om=3D%V#8XAS*I?bhH`6Kk-{!Ln;bT
z-pQ<9+DKRmC-RMg0i>R)hTChi${qNG_gKBun0|fc-JeG_k7wVDJx)3gqHPU_ft=Xq
zoS<?}G<#0f`+aO%PRzwxi~&@T-*r*;LQN&jO&^?~(F-g^LGR_e9h_BKnh)R42QpCL
z(+NU0k9KR0V}>{dJ`Lwaxl^MYsXsL*O3W%}5qQ&K6LKAXr&N&K{sg7`y^{q9;o@4A
zY6rU-%a|kkcGh#ZLf%1qi<=O?*)Js=H)KVni!4T4^XqYN4kZYcM3?K%V0Hp>{o6jB
znoUvu+dj?CYLCbK04*FkbijEeCU>3K2(y)^3&!f7L8{es?KVtj;rjvF`QAdI7#_u@
zj@Kd1f7_?If7z!U|6!lrrr4*bcHY>(?NhZ_zg%UCeVQi4AMMLG!x#`su}@n%?3_O@
zTw@50<MGH*yq;giaEV)_ZrlM|GM7KjbOU*9lP?-OJ16jL(TQ0u=Z8ur4~x@BC!vfI
ztyhgLA48^xRFwy<gEJ<=2XEvK<>aR{EDX+`jA?RwdW!kv#K2QWf_Qb%ADxe=*BT@9
ze7I@)!EULaQr;%lg~JQfx@+&U6FLS(c_07UhZM{YdgU{`41YV0<?ko4#4SJ$w2_pk
z85viCr_g2Ki!t5aG0z*p)_?P-0`3!^@hJeOiG}%zNL4hNnS}BCi$4v_hV6zA*ha$Q
zDE#ROiJ8KmwkT9!A-+!REvN!-6Gp<qGv`Qt1Nr$`b@P_ouclYOTy6a)f6DdxFaFfH
zE%KhaGWD007rsiN8JT+vtSxwkQ1Nju?dOlatcI0w6HK0cPv0NI_PIH+LAjMyu+=BF
z%bQWlx6i!I9WrcRe7W&r=utlBC$*JohhTR;7xCq^pV}=)PSC&s`mFE=V`non8g=9n
z)H4y47IZV;^Rw@&4vJ0rO-HrsKbF@&y!5W;OKoWT!f&`?nfn)i%AgrM#OLCHC8ikh
z_7fBzNlw@b?J2b@fV8Ka+}Kqt7@G3GdsD6ZIse%W-G-3o&wX7szdrt6<J;!H@u$5G
zzb|L*-n?me_iW{1<m<hRgVmz#NPbsFath1WaoNB5Q#aBd_xVHfhX<Oytgz_=@0Uuh
zlRq=_44#J_+p`_<8XjHd12*vWItd()eoa4B&n}%Q?9eW+ouJ2sr%`q05wQQ&K4n(8
z!|_zMus4xMHRuE^SJa;(Z2Vj;R_+yf;2DZ?__w>3xTpYT{zb7^Zc_k5uNVLo{^~FL
zluJGCqL_X>OO8qiv>soDwtRD~HBLbS<7<wCjY1XwvQJsB*~BTnovHVlb@hi>i<su{
z+)wJ#s*N?r-#tD$rJuSmS`$V8C+(_o^<ob)Uf>Zrse1WCddEwKgiEz6L+2KZl&QG(
zxf0~5w7?8UgUZcw*PKr{(`z@T>&Wnm1l9Lj^NkpR9pB{l+Y3z>CN+}OE?G8Q$N^?)
z1(o=XzM*m?f$bZAZ_a6d5urqTsOT+x%();6hP>F@n7yj-MZN80S(;|59f7BI$N%|h
z%;5&0teTI7hwSmjpxnMTl1p-!4`jejcaLz`C}Bp2m<8=^N+0eiUnuxijDb{^fOCR@
z^{u$5#?fa|;%!r3q6I%0I43H8Y2b~O+3FXH9z$Vul%BEH8Yb&Og@uxgq(8W%nN<`m
zr8xZ(y8Vo~HKLnk&txKzJs|4VxdcNEL)UEAmzSK=ovwY0mGEr)fD<&R>-g;A;stSw
zbuReemKS>V8c+Mk<69zUB%cvd(;Jl^qxomKa7z6eDsJIrxI>(K@$;G@kyp&J=vO6?
zpX6znDgl0pw<f^_=4z8IsbyMSElk;^opw#`6-`@B?j`TeC_TY>fMKs#-0Qt4)XwrE
zf|Gg&IH>*zWIw0d;y{k~eiwRVw22<@_q?sSV?bSmN}Df?sRmAWN;ae~lzF%8e)=fz
zev8i~`qCe+*PkUE0GDWPAL1Cr<;$X)e%{(1`RLOH|Ll6N6WF*I+pPz$EmcYVwi73C
zcG34UOWcW5^(}hM1m6Mi64vUTgTTTmp0;$g359yI-sGl>IbNFs8f4hMrPNOo4l(}g
zDbQgUZ3%MJ^wQfpo%3|255}(`q;^#9GSMc(ET3kYmjhEQ6VNW2ECJeXVZ6g*SK1kr
z25iqKBr`u5PVLn)M2wlqdHFT+X<P7LJV4KbG%OavE-VMkC279goP+FPZ`noaq<+$f
zpOPUe-h<UNT$vOl7Z{Y009^?J1Z9;3uC0dAWR-M_#U!nFGKJtvuRfYJYb_6IJl_1%
zQUE@;JU4puqnb{Wxc2JUdQjmV*eYNx5t9`1JIko;XXJ>QGMku0k@jsykT)=B?dtrV
zj&!5ieT0lP(di@e`qW4-^P}bbPwJDUDGXR}Cw*8TT8L#q69DZFD;!NN0CglN$^gTT
zmTpo5*Ghl4{^ZL+PD|q~N_uXXKNgmB%5GSdzIW2eZEKrwsFJDi>+<a&>N*;k7J!)c
zU?=}m2{5mWDA*B+;91%2LqL2J&x2z*({}s#vpO){kmZ;&e7+{gDc%$}$Zt*<{i=7T
zQzmX$Pt>2Bc|O6hw7dTn&GT)2u4UP$f+m>g%MhA#AatxLpwMzi++JyhG7y^T%vOui
zXMDYecwmwrRB|UuOSm7S#S|46(7hz0xC6!B`4FVeO|ehE7s)-BMW!A`ORmMR`T$n>
z9F%VqhEr*Vbvr|CM*3K23=J?}e6bGwMOtzBv>`E_5;aAyG`-w)U}d{}<sdo{h3~rW
zu#D+r<*rGfCq~#ciJS`_-OMky2P9u>dqogCS@3tdU2fdRy(8XM8G1&KqH^ar!ULJO
zhQT*8_HwOlR{PqfOWlr~(*!q)6cBM1pxD$L(`mX+9_r*WuSHkLD4pCN4s?fryf{w0
zU!APzfsB_M;~zCCH8h{ed=hHPGh1cEbxn)<NmV*(`v7nY&!ipu!S5gTDRc}EWi8Fs
zd2N|&#QjXqoAGf&oZ7AD$YQqTVoS@Y3qKXc{<2T6(^y%iKqsnZXmf;24OD;QqWz1y
z_z$MKltz4>(B<EQ`AyMD1?R^~5YecjgHCp{@5v=E?;-u?`|K#y)N6xIaL}+0%gB0i
z^U8xtSc=W&K%8A?x=nfRrk6pwQQgIUEm|WBw4<gYaOV|<M`9}Sf(G#lQ*g(f<8WF?
zY6|QYSf`5G>8+=e#I=#<S9t0U2wHapfY&y#evffd-rUp)?zaP)Zdqb!6BfwR8y=bG
zdWqrC(#OcxTfc#RV><TjDCE>uN8K5UO09bbt5oOz-r`puAMpob>Il<9J^l1Pjqel1
zBOuMJZKc-S51eKleG9At%6PFVZqq2RQ^@WKZ4A*dVmtFawHUS7RM{5;Fo<SzTVG{G
zE24$wT^k?mPUOK41Q{+2POrya_>Eem%4`tWA)?jgV9Uj74R99eniK^qItHX*{~1b`
z<yOnBh`|Mh1B*^N5_XC4J%-2kl%P={i4(heIA9vOo9TRVGfZcZ{&b2Ka+GqLSJQ<}
z*QMqKcPEs=V4**_xC(xe02TSzMOoaTQd8bQc-E1C&v6|W7roYO$o=8O?`eH>R|vMc
z@-xHOb9MQ{E!2!3Bk6=4>q7iazCR`A2R*#2fS$_7vg|*an4#I6T;8#W*k2li<gaT7
zcq6a>QJG{Gc*>@-zV5=j-0`@$zP97}vYcqMen}Ovu4F#J*7?u$oW^V2=l8w&66NOx
zq$6K8CvHWa+086RTPpSAh6Cg|C%90)O+VFp^=+egccU%&jzd<xN=S?c(#jC2aw;F-
zb={+FYF+j(j%eHNFSM1)bE&X9G3}xyTy!<v3iwE{eeklTd~crom;0=C3g0+C1(d%+
z`KEr%b?U`M=rVosWwldWg}L_i-8_rA4F2D<Pn#yI&tmk)1Zb4pls;Rt%-8;Dfg#!&
z|99-ugKm2rn%kuJGnb1<eSdOUz0ODc!#)k&%Y1Ku(D=(f4c%9-0<Ti+(=op<dqwwJ
z*Gwyqrao%yl~Ym*oHUQ;3fq3ad#Jwk0CDn(!ojzaL$;I6L5Mp9pc3kA?WSW2BZ_=5
z;MTUMiwI#b(EM{-6ez$V{fPC~LEl1Vi*7D9=`Z_q!%b7tOG<&EF6?aosiux3ntW3E
z^^BpT{fzuM%r&2C?GHI@|4*pPD~=7vyJA}5G+Ci^F;0+%a7vd4X&c&(c4I#XoahOM
zuZ0%>k=|X!ZnB4;o{tb}2m{-4tUitS@i08D1Ix08WfSFua(K#Rg<WjmP@KZDf+M)@
zNW5`n^$7RkkV9C3qB=Vwl}p1^L^;{+(@AB8zAA}`T?n&^fuAcy%8EWQvt=`miEwC$
zWTwPTWN|nigt=x#J)$6TQ!J^DT8KW>9*)k12u9UMH({f1A4H}v_*%w9*nmT!g;e2F
z5jOoCkJlpEGh$pCVi;{X<EBDA0;7}egojWT*sQ!QWnmLn1XH(Jvz2*LmBTJ_+)LPb
zDkK^c3V!nRfb6YsC)PbCmMJhYxIZR{BVJlLK219g(GXvtEV}fYCB2G5o=VggAey(K
z!z_FiONc#3`dTEqQc#gl$~q`R-$jZ(BgU`mNA6V7$E9(+whez{%elN3zGBO<6CJ%^
z0nZGK2j7poHk{bTk=$S#&mWlFpdFWfC((2F?j8rDKLEZAkQxz0Zuu}wS_rRnAk0aK
zWgmtu6m+dy^3!heqyZ!viJ%)!R9S;B#Bi@Ehb`cfR;S{=9mF|zBs6PTI+j8kwv&#)
zvDCw<zFDmNhw&#I@n_)p!#l|e*(pzV@0ksQJxIosLF9Cl@ah7MKTiCe7F~aow2FNC
z)%#?IRALJCf;h?1c*BB55D9#NgwIsLKFYudM5rK<3Qd6VzJ}Asnk>s8NZT3oV+><H
z4AhTUg+GL%9jSR`VuZ3&4<DvFG9t<VR*e8SO?8y)rL-@~@v)6riH2;a4QY+oXpIl?
zN&VSZ#m+J4!!v)e&_>FX5MbQ_d_fnHz{2PFX%@T2XB6PF1PL7^isxw2NaKJF;q;Wi
zy>tRCFNxaFQNM(wS)v6A^o3^o<o=OClp&!7c(6U?xKkqX0PsH~_*+Lt&nno=Hmu8$
zz5&mm?no^yL*Ji{nD=4WAs`-1Gc3#GE!k#mKFngtNBkA*_Xtt=0hTgMMoi-9wg6&I
z*04ai=VM4j7m}723C!4r{VZj0cZXmNK_^=9K`n+o0s`cLKMTh@Ttti!VD)JTz)ZS%
zeoUSrr}0{W=7(@uXpTCQb~-8v!6+xRCp(X)>FGjMqM*@Q@Zm05KI_8E0y&fbzA#7n
zY$A9^OYI$zMuR|IOQcPAgh&&q47cfeEMO5N_#d1~<~aB!SMe5(KF+a-%kM>FxM3Fw
z-h+q!bfdPff>9jS0!Ml@iuw|PHXi_6#v!_@ASE*N^8naE5%{n>({Ulwx*^qKr)ZoO
zZuiJAjs%}aLVIq}Zvm2`krD&$;B+E52T3b}1J-VnljiZzL>y291v&-5o_c@>eHdN@
zLG!rEsyh({RgeIi%#t8zBQtAGc6N(Xq|*8H?&|Un&x@>l5%2Ic2H|Ne`S5Z*w*A+v
zmAJxT6-MKAM4ThIavPe1L`2}|kE&pXs0<$xm<vU%gEK!Q!6WdpB>Zb?%gR4x@GG|~
z!$`$f1XL5X7`E_;c`Zl}fL@wJeM_r?fCBB#fFrh{=Vust_MnG0<>@%O$3~$~7BUYF
z84tDSx=^Ym0GPov!y^EUgok=KQl7;8oo$_y8F0E5UH1~qi3F7Ofvq9op5K9nGKh68
zx@J6F8&oT2TzleJyEay%m`2A_My4%sH0auX&PY{AEGu7mm%LD2J_N1sEPy`>2d#B;
zlMUhCKi=K@@s83ll(_b;OQ6Cch#~ViLYw7<7m_w?hALqS+ykgTSVtUr6i4M$tUH3=
z$sj6;v_N~-Lkrj=5bPHYQHg`Z4`kc`yunVxVBd=eadi2VKtzuU0uIvS10A$wTQjI(
z(T00(J3FbU+us6@7{J2-3hxIhdmQQWan*+exS=Dpyiu+plCz7@yaa`vRyDWAo4rFp
zaK5EQvnlCS^vMJDjz8*+Y-zuK<AaK}J$NkIgMVka^ZcZ$o|X#c4`|<!Xy3Je>w#*7
z=EDykw=>*F938)1nI)@*`9MiB_|$FaJ4gCI+hzGEh)Wgh1`f!J#75dT96qPBJ(i7&
zudKy`bMWBb@vJ+L+Bkr2p%9@3PsNL(ZgGd45pWrX42i~hlQ{Zj8CZ!A!`t|{w;atZ
z3vhoVXDtfSY|*+!ptacV8eVSZ$8^P(fpNQZH+=kh+_MQN@ULzCW+KAS1Zm7u%r^sm
z?+ot9Z=IWM{i+(rxEKg1*RXbc0Th5Z08)OW(akg=DcWuXzVA#65+n&mqv8H|8U{mn
zBA&(@iEt7JQzAmWT96-iq4Qej1|2JU@DvA@J|&lOX|NjvYG4P9s}RwH<oSi8uUkaq
z2a`>T)C^XR=!)!EJ%XB20lI&Dp#A{ex1=g*Qu8_znvJ8M$7Q956M8JVlybW&j5(wq
z`bBcG*6u;a<YDZ&kkqPkM<{T~HZ;Q>jPFOJ61%&8Afkz2D@ke-pN_hk=JuA_lklOL
z!J#j~h-f6VWSfrZQg3ie>s9Txq>ay;3%ybDeODN3;2jzuf!ag+^A5-)k8M`=LBtl$
z^7-*+T3LyexZ#zuA&%BzjzmLFh7keYk^07Jk17b6p0T}<*4n2(+p!`VPb+N-aUcP$
ziL}yE&_~;#Yq+5}JdHVtCddmMhoei~ewEfS`00eDq#XRUh$fpjruss9#fVI2y$y=S
z4|!~ZdeC&K_`Y-^tsTRdJq~!oQn~<7Yk;TqMiDA4#;;0E^z1?dwm~L7^{GDfcTL}4
zuI^>soQ$f5^bo-$LJB4FGXnn%VpncLOqus73-l$XGfq<rBz%rZA^7NDtD>jX9uAX2
z-kH6euWmD`!bm{P+!)8Drg$5jvatBhR5HwJTqeFWo!w07bI_uVsG{%Dq8+S)c%Y20
zX+aEG5X&+&N|HCyq&Nq7M+sFbPV1@!@0lEc)r-w(0v<a3c7AqfetvWQE5nzW#1Vux
z92El1EP@KY{qiGmc)UTV#Oq55?#qVh*I(XW|C~YtZD)^p`AmGsmD}?T&voD>7CLu%
zpdMB9@4`XvislkJ<`OM(&Z_7QJiMrf89aQ>1D)niLWB?TUwPn*0(V)FV&HF^6XO`#
zF~{n@ebCY_T{B<_H$sZ<n7b8OM~$Vd_aXS-EF?-UYQmSb;nKo)7kQae%!!DxY(#W8
zh@p)30UB;2x0E7BJhPYvvU1uA8wUzQ)y-x%;#mg<O$F<@U6PQl8jMTxEJyhEdmG3d
zd^^7x=a1PoyW#f3H!CU??NyS?=g`Y5L5RykAn5|Q0|8WqB&OqOu4&Q9C4o9aq%Xgm
z(5g{sbR6~YK_Cv(ACYvq&pzM3{>?%bVSrn07-o0{C$lw@V(Dcm3wwQUUm~l%Al)%Y
zPrpPpDR4pfP^gzNL5tSKB4Kcw?wXbyNE&?7%}sR!iGRtFji(Ko%L@(G|6^emf#f-?
zg0zPg1ewqg=2u6KECTxxt~_EU1e3)(l|V*SlP<*ISZ<yAH#6DUl^wdVaPG1#<dN3a
zt!fe||0i_kCwv$aA;dOl;T8ykA4(YGI#_q`2=l5;78>o&{0%<Vb?1c<yjS}=F@+Ml
zdqmnf!$Tt|ZZzrQGHLUxhPMcJJJU|v_T$T;Z|9O)AyA_i>7-B0-^TwS)km!r2T?!N
z&DE*zGZcF~yE1$sf(S0mo~cXSH~xvx%q7!rg`X$jn&0|1Rm#AUidf@k#?J_dva0SK
z6f{EXuZ-VX=byl8$^<y<L`#+L!fNuy_+Z55lVIr47JR}3?`{t9{G6AFds9jJ<4OJ}
zn%cjlQq`qe^j+;W8vYL1rB6oE<|&^_OH7DBdaC{ehw6UkX2YsaJqekL<^2^uKb737
z#eRW}GkM8MhnANU@yS<<7P~86d3;G}x;JsoQj;dzhrs}c2rQ@M;L_|6wd1z68HZp7
zGRTi#PX=XZDsl7<c-9g}x`5ZRF59eo+n^)->0BNnOoqk-N2gmu?_qIB@-a8qrgH%t
zS?tVac?-m$z+`4ES93Caf4LKozm~2UkuwG;6sFLi3XNwlVGhehomdY!Ss`mlK8!s>
z^Ed6(^PgqHCP7TWzls={4X+u!+<*A<`3JGRgL=m9at3*O@0T$)=dDc@BmTTx9{9D)
zS9{(++PzWFQe4+HLhuXb7CnbTSh_=g(Q@T*`VD43Gu<3TDJE@)e(=oY1eko}*`j;C
z|E8guuXXf`0qgzPYn@NdxgHteve_L8{hW#Y%Y2RJBNh#XOM16mKfO>7qvgG}e`n;C
zX`bGTYriPdSU1|E)mh~_EIb0H(FGUM1S1S~ooH4+UuiQ918ZcjCiADp^dx^S+`IfD
zbDU6|YqW*PTCsL|OLk5^cq*Z-5*={60GO1}etsQ9qu;6)C~bIzi<$XF%oCPt-q%&5
z5j;G}zn6daB>P<Xrz63BHjE;4i}lUP2h#$8rAHLcI_=(SXUx6|jx+P*Fp@K@Dc@O8
zC5GuPTHA|phc65ywo+SGffm$q?5=s$p$D$Hi;nmdkqCJR`ta@9RoM68JhA>uw>!la
zUvIvHy2TIicMCGf61?UXaOw{?n3iKp!2^=U3X?9irb=I<<jpRv7S)>7SEVl}-}pV)
zmsG=cBxMq&Xjm@tElZ-5_~<37FVCygUWyx&H8sqC;ibpeu%U#Mte~9eG&6@!x$pPZ
zF;Ss47Q>Yf9-qnbPxF^P*a)EOF;9@MKFfPd?3Hk+EM`Zbj9B)E&@t)4ed2KSef<|=
z9vj>GVF4=D46JrAU2P*pr(WeS7J(17-0@{N{B=b!(ae~YVd@!9(<pBl?S9Kt_?-`U
zJzVAfw8Urihab+1XgkeXRkH{^Uu+N7D>9Y8$oo$IR_yuWhFkF$dX=3=t9bM%ZmK{@
zUexX(#Z9f^u^GnXSf|77DM^(hW2DF5NY}H#gZ$4CcbDIUpGyG^S)PiqwvFyPp<j67
zz|RwS_bgYt1q61H?ys^P`seVfKb~5K!5-1rzNqK;98aR&+Mc?adi&l)L5o58RfT;<
z8c1sRW?vqed}5b^@@Z*U<*RKz2fohzq}$^ju9c|If1!Vv&RgMAu#)1V@0UlAxV$xe
z7TsN03Y@BPrtE^9l$_#sg^Tp#?2uz8H4b*>*3Pr{`qUrJKU}@>uzZ{83cb`?KOK+M
z%c>r)bjZ1W;<vhkxJTz##a3d)92OMnO<F9Rr6Zc61CF;AHeI1|<wH;57wYb~tXawH
zdNW5WLat%tTGmqFa$|R#2jO`{^q1ul+M{WG&%DNImNlQ`MDT^Xm01z&#9!?IL1Vku
z)Q+0ISP*>1l;2+qEfl0EEM-FF;9m;U=Guumza7o>MJ~4?styNFdd(<%Y^jJNMk{WM
z2<ni7hQ6iyC)>*A>yJ7`h!>BsE-+pYF#tGtS@k8rn?O9!T(r-w%oDXbtZ)5~8yr2#
zdU6@V32wPiO%1jbg$xls^0e-!D?){c+m)g$AK===j92Oox`L-`g*v;k{r9w^E}r6r
zs%HB2R5C<xvX(r$To1Wimj!&1h5OZZvk;?)OG<y%#&Wh&-pA-zU5a<H7BOQ~wh8^r
zTeSaF)rFloA3vP&zWcWHgGS@I6ahpSk^1CX+66fdhD0tV5bv6!krJ(O=A?xPFH1M4
zkxrU#%ZABNy4~v`oX~TPZdc`=OJ=?qqq$bGPsxt*oDO9|$z|@#m%d#x51JT#`KQ~B
ztnsVSJoNWy9vO5;i$=vFf^7^>r+Wv@+GG)}IF^ria!2Q!ie=oDu>$s<J9-LDmPr9)
zh5R(`2D&O%sTpHM=XKqUE;m_ayc>IU;fcG+Z58Y16Jy0nJ?>@?nyg>`9xKtL@vwNJ
zVpG62UaGI_VfC!ZrdV<OwfPedn^!8A%dU)<UG4F>Qr~pBB4GT@O&U+z9+fLK8RO+{
zx}Mj@o36ZjH~#kC6VL14RIWBnj8{DD@pSlq_UYtQuTt;*qzC^e>{Igp4fg3djr(y|
z=N8%f0(%wO?k7E*TjHmC)UT`Io0=&-w|rjz(ZJ<4-;DQj-!43TG<aLX@A>51ic;UB
zPY>GsUjCU|)uam|KGE<mxNs5m|C3NXCy1i>sgmNN{}oR)HZiv`HMn4v{0})*{t8as
zHi{yrD%uCz+uOTbzw!?`Rn_S}g-!K#zVYvJ>c7}jZ*T91-mVlj)#&cSp?fkz_vNqn
z=KK2jh5C7!J-B5OU`CNsKL@DXc=+mHX6m(|B#N1OEyT|;B==Uxo8b`5X4pmh@Vo!O
zQ?Er_{h#5fcVp`R##23fV{0gWYHDocKm1e*p6VX&@0}1!@l&yhY5%}eU6YOemQ&4w
zQ{Hc<TK@-|YE5BN)6>(#GIIYVr~W54H9of~H#hh3OXtv+Uh^;gcV6DE$V(^X`Gw-$
z3JMB$3p}3|hDQ{6eJu)(F24V)xO=bImsAq|yp+&T`XcW2gN3rFv^U9RZ{GZkr#|{0
z%Bd7KwYIkQZ#gv@U-#l)cq&Cs&3~U#{J!#^erjXVfA&*b(_gne{|BM^x1Tyf!BhVw
zr@raTt?b5k_H_TdpGv_~DROG}!1%x9)c%hjn+D%@54A1~5q=NVw0^4j+fRM>?|$mw
zXwT^A=)e5bA7kD7W37i{O~Vr(cP6^}C)@trPo0__{htu3pB5Ir{3k;7%gWT^%I4b2
z%I}q#lhvvJF`>Hk?eOQ?`u6JS_Uh*D`tk0@&abV#-@7NjcYh!LIzIeOCX@g2gUNtX
z2#-M(z9SOMEPlPeD!=O~QphORpt_(Zo<rVauD`mlFByf2<1wr$`j94SU3UFL&8v@@
zGR_0JhPA~*Im&+Pb02C;KIdsgLV1nqN{0&#(!_5J)V&@pu_!cpVN_o>{>HY}V}79i
z&19uxR~)bLyYlJUJELVcKE8W9``%}1;Dzz~iuvZiz4iHz?<>EyhXd*POd6^dx?-3m
z90nVzm-=u*#xG48YrcKVlK1>F*jT&z8IOtQGi|E-K3Z!1#$l+b{{JMQI==bugzB;=
z{GWts%s&a$+y73e;#iTc%J?X@fVKQk4(b?cgm8wzBD2UYjv68TUkFua7==(3LYV(|
zLUoZss491pis+^B{~}Zc7mARw_^MaPE4G%jaBBzmmF%7&1EDCJg6}Ii4G$=Us=$8`
zs&I?noYZvZ{vuS*`5-BTYTMt0s&FEOP!;-%P!;-%P_6way8aJBb#FlOpM<K=e<xIX
zF|cN^@OcWMx<rj&+64Xwq1r>}kP&R{#3E^11yBe=Toi=v3WZSR&hjdv5UK(HAXHP3
zJS|MaqW?jtaw6)XV@dRiThxCOs)&ChRGR@)J=|8ke-o-=6hgIlJ35yK_7|Z#jRnae
zhdTd1gsLxvP%UiPp(~<ZkdNn`Vv<M{>VoY)Re7yUjS#tKKp|9<)J*n87kPH|TFwZC
z`;uMC|3;|FQwY_<PXf26I_fl~+D$AzCjCXIhDk~gr9~SkglbYk%@BWpjo-VEGRNdv
z1ksA#CQ)eT_nc^Nf4I6qNk2zCXyVLk3H+{dWXV9hvW3b=Gf8>mmzI>q27+5GeZhP+
zYb#=J*zkfn@#{U%mU%<-RCR+^p|W5i@3fxAC6P*_B$LfB$D=r*^}5l+-GcZ?2=}dH
zAp{3c1F2u5@1c0e$EP|Un?{^7CEFZQi$>s>ES}v#jF`C;l8HJ=5Q(4;SokbJeHXKp
z2hb2Wt=a}4$;#mhfd+<JtwJ%?AQzP|Vx|2EH;OKZt{w2<Ge0YgI0Gt>gm;q=LVHh@
z!7P<9U#-vs4yN$IZ(#UETxe|;Z@t-h6bq>f&LwQm!2OGX>QulL5H$XT42S}m;MXBM
zRTM(?VjO@=T+7xtKYUO@it1VTW%}}$a9~tK7nQh{z+Z&wlLV?KT2a8~x_=X@vD@K*
zfedCkaO2MOu=HG<HZ=lWv3{vjU{fNd&nP^BobJd!PQoI`cKBK55L!vf-5k!_iEO^4
zFrKxi%wO^FgX~Xs(pq|~e?*baJp|5-IXyx4X#*~(HeW5W6G3NZptV_;aGpmmUQrZB
zOCw6d!!1ycqtawQh|Gwd)1SRA13P&Y9(`e13&!~y<Qi9KF=9d2_+^{n0l>g(-}wsS
z5|L&ZQpA5-v}+Yq0B7|DK+1Qg<lj4$hIrMaN$>Z`<$NGx-LBkcn?108oA8a=WUw>G
za86hGw&;)t*gv5X-xutY)jiti=;m9~r9o?{?y}#N=)%+~Jq18Lm>W%dX!89!jsq`<
zTn+~AoC{}}z-cjoo=zCQ(%jyGs!DFBcnVE+<u)LkZjZ#S=46oj&l!f*iQ0$Rrd~|=
zr5|=87N>stx(^@>%6~GL{5qG-^nSlFc0)RT7wKB)(}>6o*t)u0lLe+3LCXx9KbK><
zx+u<pdHQ`j`%ILB?zilxG~OcqTG1{l#8@)=Qe<H<rVN&OO&06uaSi2HSRM3-p8)-R
zkDnRbShb=T7QAGBRx2q&un;|dBw72dlP=sb;PMBu_~lm(As>NMHq?;KPFqon0!>>k
zRJc@kG4MVcodw}Ki!z2+3}8dUKTVLmmB<GW7YEe-pcqVqu>CjU*)``z?Kpl!tUjsm
zr_#B~x@*)p^g#NIb^`6762Sl{EV=kZOdx6i*f#W_*Oh(*eS8>cGMX!3oMKVh=1X$=
zRWBJ%lKm9j-vz%N$a*GscsY;njr-iM3Noz;GNA+E*&BB?YPcVpH-wA?MV0Pfi;A>5
z?Td7&`QfQ+FHO$yjnLWLdgy1oTwnSj>#YA)quy0a7aORNdRlhapl2BPJ+lcYa1~aq
zYFp@$+N!dDb2h39aq8;Hy`S>5dc$ojw^g3(yP-?F&@BJ~#9{`LP|s>Az|Ibx7ih~z
zeo9Bh)^qdA*I9p|i!OVWgxn728&x4{oTWQTtg-W%^}NYFi!p}OZzrg$IctyQx0X|_
zJxyk*4?Pw`o?pD%AOHJ#p}^@P^Z9Jx&iX}$&&pE3*`OQ8DCSlzCGC*ZJ)$zHx)J(J
z$_d^z?j&7P_gOGW;2FTvo&k4bwnOT_v3KXuQ2+nm_+PUyV{BvJ8T-!IcQcG-WQjIY
zB0Gf=k|bu#WZ#pJWUCNmiOAA0LXssV$ugECNrXt4Yu@kg=lA`cb6w|Le_ZGK^ZN63
zUVps)c%A2Yz0Tu#f8K9gC56(;sunTNr9WRiY?Vsir)8~^FlRTS-hA5De#Th9oQI>a
z741#12aDhcP1k7)hnuCVs7JAP?w*reg_$Ex#<To7R`+4yhdHHH4NzX8e-*4@FAI9%
zB^*q;t*;_RP<hGPTEg*{fj$Kn-0gD~s+h7|mA}MIaKBg@J%bxJ?AzSy6lU0?lnwab
z_$_}Iei}r3<ELSM6FUlF6J%Qtm9>`YS1o!JIY|&oH5S)Ox`ZcS*YXnO&VJ2`<;P!o
zv3Q}JfBL214{%&c^p4YlnOb@0nX~0d7VrV!CA$hbIW7!TH*x6x{ClIdbRBr`U8kCZ
zwCoG%&{L<6^SD2WJd)3Uz5B7SCgshcGSr=(rO8w5`PV3Z7QbppOta(8ODL(9<=_6^
zVxQH_S_!?hd-k3Y{ffhkJ1T!SW;uB#JpAA+s#eJJ<n`(Bny#M$A!1p^6<xKg_q3K(
zu6JS&L$Rv({xxHMSH^hXtU!7z0JHSO)oKeLiNlu_9#O$@Xjx`ndZo4`wqYewUFdz&
zvk(;?j{H^U)E^L6+l$<FzM$58eD^E&b^wwABXSauk={pHct`@$+?*4r*Goty@gkK^
zf{k)P4Uy~4@r!rjJ-S$LTB7hM?hGQ-9mO>}5)YAqu9frsK4o^SJHSNR;TVYxws=*A
zK&dZ13yFtfC~WTQP<Mcpx$zf_vH-x^<|H;#q`}cFvVk=BzKlR4(qPt~;=3%`BY-+J
z!j)o;vMjL)?QwHDl@Ml_=y*BdK#sf38YPWp=MTSr8J|cLPQs0{C_5+JghOn$QITlG
z#;db&45g$j;bd%f5|_-`oT%jdB>r3iDlb2|csJQxnwy4BsUW1#fa4|kDb+10H4`aM
zc2nwvQyUCZpAk}<qf%Q8g;$92LZjTQ!aS@k+}(z0iQB2GI%(bcsRMZFDk|nEF-1fg
ziuXs-&<QXX^ybw-$UCBwCC?{86kki){DkB|s8Tr*cQ1)YEgq?vhnz4(t`OO-oN_+v
zgPb<x*)Yt^cg|dx$o#2wUZalvFB+j$VV@!o1vX*x3THn6tkOhi^d=O>{NGwfe}{7)
zMS`<;PX1vQs%`6^eTVvFh`h99P;(Ppxg@tsmG}6XedHOp#t4g1BvQWWBAy6dVXPxG
zvi>1dw;<|=Euud|k^fDo;saRn6^_PbfirwB!NM(_{LC(gdm<JbG0!sMkl^KR&<b5k
z3;hqF`isvXV?;()87ZG^bqT=a@Iy2JjMj-f#a!(iti}yo&bN6r(-NnQam$C{w{rd^
zRCSnyYAJ^r9m$aehi1bO07&FtLRGR3#w1h+n1rfG>X7Gu2vv3dLUFqGqSev3ihl{!
zg%B=Zhl6!QFq2T##u-)=x_e%Vdv6)^jr-D)>fpR8q7nP8;cm!+y3Ur=oNUpJDs9rX
zdm{C0g8(EEi>VCD&*}n8qL3yd`J4<FE|xB!0gGIGjT9*<;H`)106c4dQr>?w*}`!@
zP{#F-puA`%LsU>s#SxglgW0p&y>g0|Mo_J%)%VWB+K=0OIu_7nR3zUT_S|1>h|bME
zVAAPrJn*YX{+k-pPsLM9BI%A=*fK=_y^MeTRIZZzFLe-Erk`2|9jJqdpxD!1ga6~F
zVv9{C%fUS5Ix5ILBC9MFSUrsl&jP7oi?4?kAFdbwL_=hqxsIu@2hu?ubnfFS$Wti~
z&P=8pWP#=X^;0#nuF8i7M$*}ovecDF9y-6{j`)OvuAERpajw&}RG+g;@;wS);U>ki
z_41Z}v&48Zj=MNna!Y3glT{w&(^XsEm9lP>ic?j(<DqTN#&&{Pmd-vZDk7{z#N<fX
z9vv{rf~&7^b5Q|%H0b&|SMGXQst5=`f_R*{no}Mh)>Si)WiTz(WF*MZ7@54DuSN$B
z(cnN75-8!8EMZDCAinh)4m!xB1Q-^rJ!C?q(Y2o@Q`(#@v;Z|p+2ExHZhkT}w}E|;
z7t-Ir9v3eyD4XtkTxtE5y6`cdpGTN2x-t<3Ro{580P$gVdBN(sh_xeD-Tk0DDM75N
z$e~{<8S9F<i`+DnyfRhe0YXF)4LP}fuM!1>*TFbS^0}N@4zu9rR=9ae^6?0Og`w35
zzTBYP)}W}0{C*xO0z6?Y;TTb=wGp`w)&dKlkYMaHx^b=EUU7YXnu~%X>vF2*jxU=R
z(L2JatKYoc5J|Ypvn!M#-6s4-6qHrf5IE9&?;D_Nj5Ks>G_Y?B{@#4D?%5&sF)Ij^
z#r8PY`Pm-Og#TL;PUrp!0AElo6xF7tWv#Aj&HQEDV4&%XCt$Y6waE7TiV2eZx%Du#
zwZM(5k_y-%fY&NW`S08VBV{Iaki9IBvk5FZsAUiRk5BtltgX?l?U~`_UZqyPW1uf9
z+~FlaeROe=J(9;0xUF1k@Vy;;x&5_jBiI>)aYOzDKnN5ts=^LtcmgLqTR8v_Yh4Sg
zC(yCNO;_z)4C?%*-2Usa6uy;bJGF(~CAT;zm!<UO$iPcHf(j{px#>o=F$5<DQ4wba
zAl?pg0;qS`<Q8ws`!cAUMW@3N3st!y(6N(GH@Lv<RGC$N&S0(^1dU;5%+iQ0@QXuq
z5OmFxiI{P<!B9D#T&&vN#vHPMH<$T74J+PbY1(6Tw#QtJ?JK0gq`imz9nEIH$65T9
zxr2t}V9%*3sbfX2&WQJ11MFP)U+vAowSu|2oO`?Iw9j>%Zbh$#J$o;#(%jp9Jx%+*
zkJ5fCK%<zKBP>B2J^9W(mxz7x>wTCan4fiDlBr}QV-RFf)O%x}rn1>%jqS%yap9d`
zB^SM(sqe?Ea$etOGhgNOL~@)OVW~dB+V076DRjWx6p>Ho>_RzqIdd+d5$?{=OF+*p
zwVt-G7g^`Hz9I+rQ9SaM+|otJ9pvEGQ0~I1!LqK`m^6*nV6LD=a3TtNDXUxPip#Jw
zIP@%Q)%q<{6dULY{Anl+)BeVC%2v^bHIxpE4dvp==C<)fW+U0SEI8K1S@Y<FhpQrA
zgSmbS_Atj}L0gEWb(nirH~bz9Kk{~Vm6p9qQw0yaaCnVPy9@VXUBvQi1ta&+gGdnj
z!Tzv9t%$kl2=?rVdAp5y%?L82n_U8I&M0!?b$p|K59Tq?`7Ld9X&vzceS@uQ6zs*>
zQwJXh5OpYIXB|8f%K;{_$1)Xa?C{z;JTr^?Aar;Ph1^H7xgNl6UUNSJn75E}H{M+c
z5gFO1sX4w)D;i<{@wU+!e4oy#vdN~gNK+z?d_Zvqta8eu5oVk{1Mf7&rbiC}cE>vS
zk##tM&YfAp+Fb`PpmRS&vX0kr^k9emL)oJ}5r>|f38=|K`lk~0$pkuV+>`Ya8hO5B
zyg@=F<Ogji9z26RY90e;=TuTc_r|fZ`T>3Or&zlHd1Vw-=zu2i><-N0eQF1Mah-*U
zR_}O1*Xkzjq_d2pkz0%@&O;>oZrZ1Z2h(#BY<r&2QX+dP=Vy7d&+Bi6Q}>nL0k5V9
z$FOH-Emk@ALbyH?XXDg4EwTM?-y%mi+3T=evCh-u$WMn^Y<H%ibakZE5ANsdaIhER
zi~F$PA$-#l+C*e;8JPz2eBQV*pEOGQK$mm!o}Jn6R~Ve9gm6hNOeMR|vvtzPL!cXV
z95%$^^})eE&T~S=b7C4u>qC~#(8*tC=YOWpJDUsROQwRRX3;}a*8m<^@xll7Pc{Io
zu8zKgg*g&gmfy}<XMFOT;r^DsC~Q9Mwa(H+pK<Z{O6KWP&FvO_#-+I0z1_&Q_KZt!
z-}5_)sn~EuF@`{yhDd)j=MMEhc&dyePu383=0(KOi(iX6h4OUWa-&e(;?gEeJT<;c
zGgu?R2`9FXOkh6v$%Nt@dmY!(z1Z(9#ou529}ucsNoOb#UwBsziIfzNl`1wLP)^q!
zU*S7j-9rE3sZUXBiymE`Ho`wHb`>;7Z**F24cR=H`7u69OV(hE9y+O@hKik0S5-q9
zwy)jvqJep7DvRJH=XKaiH8v>}JNE`zdIMy+K@Qshd#{7brfxjx0-uv`iuqz4^K)17
zqXvWVOHxx<9kYq!*i_|~Fv#4*)@<r)ZkkK=V7Z0OFk8Itn<hWSnVD&;r(2}UTljNZ
zanjqkqucf`#hs*jEQu4xoW8hWUU^6fAD8@%nc6-rCE*?X+q_6Pm_bY0_#JZpx2fiq
z(=1D;gK#jlFF122p?>Gm&z*>$;-@k<2|tByUfOj&w;lPD8S&li$=+pBr7_ZfZoS-1
zn%zB~`6o;2PvOta+?PUmabHUB3zc&(Jed8{xq-O9j)4EzijEaF+vo6-`pYxi|Lo;<
z^V5I)RQ4a6?sV{9rk}cjVEU=8n9X72KJC&1(Q6<5=da<*{qCdt?N7zgEzv$43wn(9
z<=A?%meFR^+CdEHFedKHLfk)os)DZK8sjj$yYKbOS7a{6@3?;n)%%Rkvwhp#Nb!FN
z)e*V{<-ZA4*k*n?VRYU)ZAs30aiYGIT|c<ukL>Api+2B8LiMuoFT#5zOKI^Jrf(+R
zpS^PwpW*c2%!ic|(ixQYu)>X#LbiraGUVOzf|(%!tys>W@em8449d_0w~zlnq3U@4
zn9<@~_4vA1PqOmGMY?yHSFa`i(f=Y;bK7*+;-hq6uM4a*72MBk`3v3Sj^hfMY#Iy5
z`2~+)NdNp9^52AN;jyt!1uhfi#BQfdcCRy2f5Mkj?!Ub_HT4bqVYKPetogm>?S~Vs
zCUJT1Swgq|i%{)2SEkX6yAz@@d@L=e_yyj4mJ#=E;JZW4p;EM8nMOV&)Phx&&$%4@
z)@WUsMT`Tj+&VKBisLfbTE|T-@+eud>s(K0?$fR2YUg!};3?<3ePK=HJt1bJSJ0<t
zSX}fm&E=V^s2H1-OzJ;`YPy`tD=AIYqb0R@jrDda2dSLay{wPJ?187jYMD%J;8^`z
zZHHeDy8jTWZ4-3tOD)w~l$YtdshdL^(J_AI<Lg_u+TZ?${y6$d-<#~nu;M!z;bLPK
zMj|V-g;X0E$~SE_b<1=_j16diIZ?|u929Zln7!UfGm`nqD<@C6UD<XbIo-Z;>P*lB
z)eo-WAFjB1T$fir<wh2WBzT|f{@{Abz0^YJRdeX6+?0sRk?a>79`_^;h+Y=V9I%@E
z{lOBU6_9!)D@0(zd+g-ZX_rjBt7ASgKncj7?-nW^2&}BkflC5Zfj9lT<7I;2i3Dv?
z8D}bK;Ed<4o+zO2K%ZBlQi}uuXV28D80$OkSvbK~{8bZ$6XI}TrRUnLTTS@fIQ2%u
z@(b$WEpv&Ee_4s7w!(sz`}bZG&fZc#i1MwtbxO1)C$;w$6eQPNnZr<7ul!hKQ>|nr
zo_eMe?q8)GW<w{J%ab`=TJ*mLq-310$iDq{RQ_W4)I)rcWpmw4deQW$wl$l=7oP;Q
z2lNv~O`D0$GH(5$3&N?0D)5h#$hA+(&2K^em&2{RPUUupNtgSFuaEx?GL>v;kzq%)
zOrAH*^oWj}4C;G)exh|s#4WYC6d=Ml0J_-a*mFQsfXc5uW)vh0w{R`U2~1=W1+bnR
zT+RT5;|w}64FbiNlvx5vpX1@Wu2>=jj1pZaat9H8QqV+fC@he<rvU*3twGDzhQ-Hp
zhyWa`%MN6MXgV-XUN~sY{fSIe|IF_fAE~S-pkO&Pi~%(VKmeQyf<b!sCT*V`;a`su
ztb^-8sclnTDUjxJFV2t&zNuGPN74b{s}i{BHYhlHp7$nTh|m6V5*nNa0boqeHuxkM
z&@k!MQn7%rE@rZBiP3je-T{IG=>ZbKfL@O@33g)9zs3#tSajK}%VjuRQ%<%q1|Zr@
zfB~tA1Rc2&;w97Ut9qZ~57AhN=t#%~!h4y%z$}ZD;5sr;LKJvwYok+Ee-Tzf?a~h5
zVspkOYPWkSJ6;>eTMW%Le6cXAltbh`YX#=0gtG{inBGyYzqSxx*4P}t#fwDA-d`=V
ze%MzdIQ1)CF!U7oLw@5>*C>oNRK6>kfzQ6)G3xgoz_M3|I(k?JfuMn1Gb#o)@?n|R
zTL-6P_4+N~x^&MewI1!eY=Fm;)m!RFs!E@n$qCjICC$elVBB@hXfD1fLZEU{2=UF+
zAKE^GC6z37exNhnlzh8&8S7??p-hD?@ndONYpr$8l$!dyf85ltWS-mcF0sCq{lB*!
z=_`k^3p+yq)&YN`R3-Lox0)|2O7l)Bra-anGjTh|y>#w~ty^--l@@oQBP9QmkEK;B
zPpU&3sizk~=byn@I7%$=g|f-~r)8}B0igf%V#d<5Bo?b{JQ*GpEG+9Jpt^|@NaBAu
zB7XiT2;g{B;}UBQtn%E)lNrwwu0$XE+`Con%ws6p`$Vvm1XeoM`QTVj7*QbD8Xr2|
zEvlE}wY8F2_u}M4uRg&&M4g-#m3>LWUP$*9&VZ!V@lKnWx=aevW%o)Y8_9zB0akQ%
z=xH~86u8XLMq17W0zuw+$ZuyE$z#vszWOt1iAn^i)N`7qJ!j#ld-Yuo0LJ}&J6<4J
zpn_TLzg~0+vOQzb<3LYaqUo{e>s?<<2t2TeWBfngz$2U9*oO$9pDh6wt_|Py2+tjc
z(PgnQG`Gpg&gG^C`OC?lUy+cE!00=7mkxQUO(rQjm)I*RG<Kf5yNpbLwjNU;zZHp>
zBxvW}Kkna38Z-t*7~5iOP%0>`u>PPlSEhqANF0O&5colnmk=zd^CTMp&OCivSQ|ij
zwphYF<G{fwSvyzlFYKlQzFEG|eB)mEpTn;o*p~p+)aFa3C27i?qe+f2fmV-_n<>AC
zVIG9DDHAf+Ziic2Dwe0(xh)DmEr+AK9|~U>X;S@dlBS~;!WEDt+CKY0_c0l9{!!GV
z%!|s0$1QL0c%EoP@}h{<BGV|G;+YBB;Ye8=(@izyEouw1mc@s@7Cr?4e9nvYBK*PL
z0dAkaYc)5u%BDDcPhn-D0%Wg`aHs2kCv~PG+oq?BFFtmg*?hPYS9fqR=Bu0L#*?cr
z4-S5wt9P4aKokwn?Q({W(*JQ&v1-b{K&<Gq@r-NO9+9kzJ%oIVMoN>LP$zNYl)@D#
z@|!^p3ItC$DI`ZELh%5HsT}EpFTT6#?FJD_ppU_i4tB5~hL_AP(oJ7-h#*1%`iEZt
zOMft#KMMf)enhijYpummfW~0}h?N?3HCu!9hJXd;7xG?m5PaNF_kat%<n4^g)TXu<
zGM^S^Bbk#-63qSQ_2JheKQ9*O-V%5n`Fv#jMtU}c+3p|dGcvAa?gtP%w1>@sQPIm0
zu7>42Q{C9bOb~~5OLw%#U_NNkgXi)H(@m}XJxjZFwX@ITx8}y*msMUQ7A0)UXClLM
zKvX)=Ut$5m=}Co%OYWx1Wvz>R>V<{9B&LSUfqbb%uw<Q~r!y9WAWEav>JGl$^4i11
z5PLYJPNeD6LFN+?^H(+w-)C;`amQh&V%C9+@+1&j7WLco9?`b}&~_#g$`V$N1MEsq
z<SJV#eFR;1Wm)UmW^zoMqlrJliOJ<~S2XdkphWg@(vG)Ic%39jNeIw3b9EMG2_)8(
zlYoAukH^{X-!&6`-!{2vaBWl)VhAuM?;o%c6;z}Td5Y64J6~LQ@eq%KI1|CziQFyP
zhvyqY3|WCPV-Ql=9nS<)iQCD*0Z$1lig?=ylY%dmraXlSw*k&LhHDA2i4Q1im2H?z
z=rLja2TUEY6n_6$icb<uH~v0{U8%~Om1e@&FF2WCD#4_zfSR(dxp7)5@lBHAiCP~e
z6fCPy9SMXzE<jVB%FIi-Gr?54CAj5rp?8OHuEoS-3)hM+u~h?w2ngaaMX~~<x1h)#
zrOC$R#Lz?;exR!y{^fWoOH21V<vWT+G8c%(h(i4uX`);7Q*;B1>8@o;AaGI_roGq;
zph%aZRM|^F25JDJga}o;rz=+&LdQy%$+?HxHpS!qAf)Bf08l?urewXmen*f>uH;jE
z0+Ht0d-zuiW~+wd;^@5hIO%eAgEF5aWEW8W3oss<0EHI-u80Ptw&u01SE<XUJZG)b
z^1ED3?P5}2MK==lP5`1MtPE{45P>LDMl@a(_uN<Waxj-0gje!N@#2dWIb^Td#V>s7
z0vkW>;nNEi?+THloihcV$7`nGP1A@#bc|v32_hJIQypFkf!~Lam6f8KF?;|rtl)VV
zaBWVa&!ng4xK)2SHN?<j|2v}E{`o3j@s=`<6<wk-(*H8eSmFIm7HvSVC&|RpI!EpG
zDJ#4FeWTko&*cbKE6IJV04peqD3e1ptw?&q-s`2C=zStp-4mFz13aTFXU-D=DtY_0
z3@ntWd&JZ=Xn-Z^NEHqbMCF?xWEqd!;WaV$qjZUm4&~o?N<T#qznG{1q2z!dC<56_
zEo=Y+i9Q^UAE=eE5{BB2^f$jQ)=PVu>S-yJBF?oXZR=(MNz$6qF}r{wt$!L!jcT?F
z9!y2Q?w>m9b=ToqIO`ioi8|Kd?c(5D4*LtCtN^cLaj;V=5_V>_h~*b(T%1Xz0v7;j
zVP2u{UOE9SvRp4@r*##HTWYS(jcD)ghJt5v&ysc!(wD2CU_fsD0{(#HWLh{hbgO-c
zMr4`KS6qDYa$oQ=Ty?z$>i;Q0g^s-oc~B44RMtt{HhK~`hfRkjfU7CBjZfZ5lW#tI
z0faj5zdw4YHpaVo^vW1>|ChjAnVMiK1Ux-h2t_F@-gg_QtG7qXxd{uu_}59T%U_o!
zD?aN4|B@6jv;Lt9P?%0?AQ6ryvH|#>sr!%kiEC;Ud**i!MLfthjRVO-CNz*|h<_SK
zxVMB@sYKm~5wY~4Z)z0qh1SaOn*ln+1s-edBx7cg2c*AphF4l}MfJm+UR7`kub%kX
z3Zh^Zv9g>s;d?Pl4v<c<>;LpZ4k^u1LS&b}$FEIP2yxKXJ03QzqPwjh057h;ix-L}
zDl(JIaDcs%(xXER<|JOQ)8VQy=Geu7oNHk>iQxH@ii=XXLHYI5u8Fb`)grtz(@6EC
z-nMwl0GCyP+`EIf)xtw>`lP+My)g)`)`p>4Q$ktcN&qB`xEbLj9s<qdXF-d#LFsuR
za7joBP}x{cG6U|EzLy`Yn-Xt>^iwNR+8aci_4uSN7cl=oExq`)UxwjPxVKlDOk9~l
z>hkgZXGxdUU7vDRhM#;M63XHNcg?KUy;slTQdyu_K?-dXbHy9DVcpiF+fz#t5_A(=
zo6>wjS>6?JxbEt@F1OTgzf28Hpz5W$Om%Yu`5~1QOZ?pwAi<{OSQFLF)mh9G{aEz#
zWZE+GFv_$T!fp6QIzoNAdG2hjd^&5=i#wL?DS-Rvz3EA5_X+uQm6kW3&BWha;bgQ_
z=}p{rpOl!XsGpuT^H|*Go0IogVi8$z^jJ>!_!vF7R68S@gW%2f_%ZEa&&DfP=drFX
zZ&1a*rhabo)vZtHTkG!UCfRaUnV-@0St+{|SI={Q?@91n<NGsx?l2?^H3xidIR~;S
zL|q0seq$1<o?}tDdlH^7K@kHc!hO;c@r3?nclPHEPfmZKYoUA(P-y{hFCIxRUJWlk
zb1!};F9DB#2vwn2FX0R?kzy~=CthNmUgAUlAEB!6Ww)EgG2<z7>JH-uJ9D-q@8PX*
z(OWUrTPed^IX0D5!&_BD@LCj$Efy@a?5%m|{ojPDwhf3uQUd8{_~<SH`~)Av3?HLn
zALA!JCQlYfQ41!&=k>WrW`{mlE?*15MN_Utb4gz-eII@2S=Eb+qWkBxEYcQ)d9A+F
zd-Lh9sq`Zmo(`ut93y?5xxN%-u__g$*(vDTM{>N`U35ImIVqSVE$DZ;*e@UT#Uk66
zRO0I`i%{3{BYFB-EquZ2r!4^fXUzS5_1UgP<s!bN9KUGbw#Mf@^d%(K|5enI?~s4U
z??k`fJYVR5+{l*;vHTEoj^J_q^Qf<oCrRNm{#PIRUCT-d^I#`Pwp?uHdqnlTJl=eL
z$OA(9aw9f?#P#JwvFEAr=kXU)$g$5Uzf+<m1CtU07*0=;ZrUuvGZs_)ms1}Ggk}V0
z7Js1(EtB~CQ+GLhh759^z;7J}=H>Z$m}d~UUNAV*BQ;tI9wrrDJbzEa+hd7HWPK4B
z%YQ$kqvYYzJ@XYCt{j!Tj*F~c?;o~4<O--LzEC~m>r&dq)wxnVbK%K&H4ypg>Dq;Q
z$)E;}phokcXHG#)OhWZy(DT@!mW-fQCZYNysI4=oedzxYs+yPiFqip{UjDy8s7n31
z*iXS%vIMn+X@2}iN6krss-eLQ9fNQ~^vxXjrsk#1VpIYe9j}CD31aTE1%eF;(BlNC
z9y%Peo@ku}mL)<6q2ajaY*&@SWzmqJq;TVwe|S`l9hg^LI3}Ofx-Z@i6X6uchBXX7
zPK3yoKypgR3TUtznu32G&YUsgmm>(5l8+k1qY12Mm^><STgM>YVI3Bf6tB6=YVEpB
z(2UF_vgl+&ar7&3b=&TbuH+DYyNy6}eqPA~V4?l6Thz#qtI6R^9u<`wg-Y;ifdv~x
zN@OOQC$i`Sg1y!gZKEP}`mT7R!Pq+J8KLkzrEq7Z<na8RJ0%d=sH>sQV4asNIzM3%
z!y8fSkRWP21C3%km&FVqZC(^+BC6qc`k}JB@j2+58HvdbC1efTNF7u{bP2?auq%EQ
zb{rY0gWSC4yrrXfg~_8Tj6i})!tbD9IxtvHUAW#3>|7G`IKbplVFV<rcM>!R$w~-?
z1tFvKh%B+ho0fN?%59?`1Vldy_`}D|Vqy^QhbAjwqrEWUhM}+=DvRt0nSc$q4`e&V
z<WbS#%{yfGK9;!MtIk4EUP%=9mx+`eSO+G&bLYB_RCJxtM#JnCXXI|HBHLBsP1~sL
z9O_lS*(-*GgxiKJCw5>XiDdsf;X$E)mFTdSFiIsX<|+Yt9R}+*h>xw?Rx-R{<a&dl
z6L6#XQVh?>D^2%zF`0>H&`@I{#4L((^?qXH)6D?I8@H1ZuRY%+tiv+6AvFf!Ve5aR
zm9|MciO%Tw*82ysEr+WH@jnbU*LDtgGB@2XfrF4&43QDn81d#ikeImNN$1#Hgra1D
zr0a(=B3kiZP<a=>BKCsteM#szCjI^E>QhflJS&fi@5H)nf0m4Gj@tQOas#<4t_{K8
ze#sB!YX`imIlrkeRAhYh*Xp-T#gP)rL|*j^&jRz~kEAb43;8LZc#s|1<<g*=_S)^p
zwyvB%Gy@Y`m$%_IvAFPWh*bC8uqvV6_pM}Y(2mATd-Tq)AK!O0>C|`_pT-nJ`}}*q
z&SD#PQ5I+Q<BqxB>YoI?X)!F{Om)XHpWp_A)V<#aQyO`OOE?=Z{@Bx7ooEOcdlK?D
zGQ{~|<YtDIhGc7^%N(3mrpu=`lj^jm_0DS6Ht3vw+vaoQTFh~NyS8n`doQkhZRxwE
zdFjw}Z)@daV*taNyM~arOx@TF6frzrpQ{40-js~c0ZmAfSVW`#L#WoCKJLsHO9(p>
zmYsijQumfc;1RM!^saQ0bc&%&vV8THr;mLBIOU{R;jT=Y)_|dGy53|IUy8CI|4q#T
zwe45w|3#>ZUaJTmr*?_latvd&y<#p{(PN4~b4@<)^o3UWJ7_<Kc7e3}e-WzJ{K;!s
zWQDsSFa9VLT^=w}{12hJ(yDm>#@@e#>Jb8FpV)I0qbM>tVzy1Wd8|~nwNc3~n=4xR
zVZnt$MU)M3EDLQDO5nxVn9g%EeN>+ny9@a|Ir2yi+hf8PD2q<{cUNAhKJ5_vcGCJ#
z*Y%#=L$!rW5kl5jW_@kv-e`67?z^da*$<*QQUQNns6U^MeuKg|dd_8<A0b)~3h^L(
z2ZSQ5c#aAeAS);V8+$mXlc6<LM-^PGe!XhstX+W_?o7Q)uZ!5#85XMB<?9v7w8~C4
z?;!~En*GqvwlgQ{ZdhAY+GuS&m%kgMJrHNc@V3$~9e;O}FO*u=69(<tz*p^9ldRQ^
z*i%{5&Uv0ptx|=F7g`j^tyE(+lJ@F&vemq;)EDJg?A>;{WL9u%L?4PY^iPiVC%?Nl
z^qshE-c6Z}3C|@e!#I6=3e6LF?o<^Pcp=1XTFMif9mS_V$Q-qv=N?-#mFPW<4!^B_
zo~R48<$EaX4b?EWDRX}kc>U05xzvDS&37d93;XecO7rK~$c2NXG5^Y9JJSegY=pXh
zO_jksA-ge(pHr_Cy(q+TcWrgt;UH<{dD5Zj*63ALKdWuD9;cw5SoTpu&CK*c6;czI
zD7uG~NY1p?^zBu?qxm(Fx5weF*Rkc}4D}kG&a=68IB$l1hO74FR3*cs(X6H@Fk`Fj
zt1eXVmKM!uiB;kwY1pI}RABv3Fagb>A$Y?l1*^T){HVZ-Y(t=6ll&<MdUBFCJ`)HU
zef&q{>k{<az3#Q_@REpfSh-OzZrgcW9H1qK+e&;8TG=D7U7zd}Bf}(AUnw7}PdU{t
zBiLB^N<FMT)ni{qn5NXLw(TReOHDLg9L>0rPZOV6@6{`j?(<xi5e}pD>OI-$)o(7B
z_+_|Y&a2mJ!P}5^?Ng%ZAdjtaLmB^FX9{X}Bta``4&l(Uh}6FJTJ>xfyN57McrrB6
zWSztv?+jH@Bpt!$h2@6i%gHlTlV3Y<dEL6t|3z8R1#xPmJL4nT)@0qQ--~xFYd0{_
zpu~dRR>d;M!_!i|V}$j%iZ@?djjSZ;k8RBAf|6fPqS@q}jnS{N?9AXLxzg9r^S>;3
zUaWr68<!sRe%Dy6mustiegkiwHiu{ur%6=5MtJxhmz+MqEhE5|9=6tapTV)LK;TIW
zdWOsT-L7PF{pPS|oi}d|<)IJ?arD~2a{eDRYn{H(*IMgdyu8~s);cO<1@G9TmWZsX
z{Fh;x9MTmjN-UZcUK!UeoR|91!m8;U4ZH0jU7{(k;#jV7Qg)jr-lcRCbz*>`zn?2K
zlVy8veJ=g6N*QOK?>B{bFGdF0sj2oNOE%$JeX<E5=Wz|O*H{fv8T$<K$j{I6xS~aB
z5O%vZ!7TXN-Wh~B;TKnYM}k?qz(>20+iX`Spt_T!iML^Sdf(}<<R<H!tn1?IifMg%
zVb$;S9pafRs#>tmb^iBx^IQ(XxS+SCuFEF{o~d-;luKL)pLn0Qpu23*{2LDDxp}om
zm@F!xD{=G}xTd#5Bht2kJJ6x*ehU4jf2~sHVq_TaNa)4Lu{Wo$)mc7^DS2hw>vPPn
zFr2TNvZy?L{;m5vuqawWBYV;!^;>f(|J+H<_(zjmr?$fRW-1*`DlFJDt0Um9K%m|q
zd-mX&?2Kn6H;t~GnPX>cdhxZlBwR^eOm~cF;NNgWr~OFgX1(6k)ld)96?}92S#gWR
z^1atu@(!OQ*vndR+P2E3rx8G3zEfizBt%9lU4h&qp5hrV<H3G+S^GC)(E74Fe~_D|
z61dY+yHBBR-&5tIou~$~TgsPgjHRgcehefF1#b9s)5${d6Bj}YV(vsjeRyx{{=De-
zp4)@SD;oUp7CRS*Sc1!G$^D3DLF*Rmw^b}#YO?!?1yq>B=YFxL?|+p~%VqNG`if-;
zzq0L|gI__~#B$cNs?~sUj1||#J2Oh`d22Ie^W-F7D(K^nbV1LgQKWQh*tpMo`zbhh
zzg1>ibfA-N#bSLJFYG0cmf7db-+?Y5ZcXSo|0b>FRJQ5;aJpg_NrIL?^p-k>w8do+
zxuuZ`{B`-cn<`9GRd!t_mZ_rX%I4t3HRK-}M)6nc<@kezg~m>gId)??P^xzX=QQj@
zjv>JXR5C<auutFI8)i%Gkvy+qjmZzWb<yg&(tIfChzAe3U`zJdUr&}J{+Dlsw4k8*
z=;RTL?gWGV2kceI*Ggxpq+Hr{xmkD@Um$0uqHcwR`#OvZPG(m#EtA?o_f(2|)2;`8
zmq!@PH@eKjk`sG!6-OnUE*$0rodqpxX7}~`X|Lh1t<tJO?O`3L<-BFD0qfR3M|wH=
zj$h}M7iSRK?Po%_a?VQ1{ai~Ov*U$SyLQO!F2`T_>%|gR)2a6dPPP^}g=@C8jU5MW
z()Q<4txdfb4yiY#1nW88wk+^u_S@Q2Od(^f%62n}PNv%RNk?z^uE~m^kF3vFeml;P
ztb>0pbg<xZ-YpedtbC;lbd`pqiwIwjGAe)Zq}I7$<YrpH)h-R`7~&k~G}IKIM3ai>
z5`*(8m|BR8h?-Ay8RU`#=rpx<(AbrG5^|{8PhHZU@dEIB5`&f^C&&ULlXeqil<%=a
z5=B!uUfPNx--E-cL9~`3YS7uj7Kr#%yvd2=HIU^$D5@2!8k|-$0@ZE@@zRShX^eOQ
zPfLRzWLcEwfJC<#9*pPr66yIQy?Rb4OVUoM8<|G3W2&eQ_l)6VsvKlFQ<9=?k5aCM
z$Y8g5JIS!66kSD=LRo<HDN7_PvCdNA9BK0{GIXumwh|{|+BN!WPCO5^^Z=@`+ASCf
zlIFq*MRcKcq2_o?p%&^`6^`W;%{I;BTY;4boP@;Fq^LA0Jh-NwRe~D7sAhZlefMh9
zJ&1ZduW5ISX}l<0nvriQOn`8#yj5QYB@!T$el{2Q%azx0!uen=UC;x<eSB0GTL$H~
zk*w|!SxjZuR8?1fz6F0#ywq;Dc8|kl0?mv-7V)LAm&pn)i;6EZy0ocX6G>KLS!Zy;
zLUu_I#6*`yge0I(F)pEsty;n>X=*LhTR)0SL$MrbU_>R^a1acOu@Yf+JfT3myJQIp
zRwxY&TZO<(Nj5STs$~@2s4l%UD+4PF0|NPpnI)}&q?ZqtAkwspaOTSv{P`e>b#9G(
z(Eg3L@0Trvk?cp-7x1fKgm}CneM+f^szG3?rZj1|h2AQ-(++nkmU7%uerOKMwoj5+
z|7<s6DV7h_MuA{(5N~@trrm-q*MemaB1WgGPRN^MD-=;(s9hRgdzXHDx9JZr+~OCH
zNej15zq5M~IS)Tv53^pw_gpXa9P3ikH(9(mqtq=Av?3y*Kw+w=kh5#?$oF^I_q)_6
zREy+!r827`Hfw`ry5l--vi6?32G|I&<2!40g$ic$EZ7FJcK2A)ek5p12FNkX&!^&F
zeLI75_Q8iL9FJ$d0mX<|5;`LlGa}nyIH;XP)Al4`cS%3HNG5x@YsHFM1ah-*w^_8L
z`mT%U^dp%xP(bwJ$3J8&YcXcZ3zthYR+}SUq~VT`F`n`0Y&kr#c;HF}hJt-vMHV#%
zzp1jqSmohca2no4Cc0gw5wyo@3Ca`x3pb$R09b<n7AHbZ>2?_*)9|QwH)aB3*B&A3
z#1}V+0%_f+nIbBMDlI;NE@3>ttX5*Ml3ZuyM;}lY)2+UKlm2*vreP}AX%sK9C9kcf
zH0HOcR43r=U4;oek8?PW+b8*6#Ifm8Si`FBj4!9pSH`A5k6iH9LwSE!pF>lyWrpt9
zXv_ERWf-b|@cd0~aN^5}CDf<~qzi1cOTy@q^rF75=z_YHd~j3URlc_SB3%#7<Iyo7
zja-#FHumX1<n*B`(?z97@2Sc>6^$aY@*u)chP}65(RG)Ga2kr%pgnm)=P>SxiG`{&
zqsuanF<Kx^3I$0$a}F_vMJNcY;Vge)-?@Bwwzgm$3#Ev9B;;XD(wJ3#WI5kuhZdZi
zuEiq_OF3b%`W^$P55)6M$wuk-2syB5?1ByPD=i~|c=4bHl^}IJRlLJJ3<@&TN)=1%
zRx)+(J_CY1o6nAgcB`mOC@&kJq#a9?z4vJ765?FQ`RCr2BDz*8>j1)8!aHHLzgYQ1
z)p^`%_s}1j8XbG?#kbe2t5jaK#snyDzN$hnjc>mT+DVeA@WNI2tF#bl8Q@L<6`{@#
zvBf=KyR35Kd-@*qI2V#c99YGdrybB2z(&;=D!Agv$|X??Q#IUsc&ZfK%Di3Tkv=7i
zm#1<M@~9Wbcf!`xa3JDgHTCyugQ(h*X6IRbM>8Z@WSM4VMfv^h0&c4sQ~8yh^)VWs
z$g#v2J_7Gn;P@z32QqJY(Cqjfm?!sClVu|;Fu~;e7avzgs)~iV8%PvmlK!P)dnqQN
z!#{-wjFdnS7b!L3O^jMREi`jO4{Ega7_%RAP)hmACB*F+ZyZ>GX_4lAAg;7WmMigl
zrEj(E@sn^tt#8N*K`cYxSjDNx!ICb%F0P43ECpvM!&)@ObglOGXr`~#cyChmw{Sv+
zmO~oLLl1klCaXqxYwzC6X2;VsS^#r#Fsvfpm;!WGk*|nUyRqQD)LOll4t78<+R`DV
zmJcZdJw{ZE>O4x!!yeO`5zYejNt>05J=#EjTEz_cho^<yGHzx(Br?e!128UE9!d%V
z4iC$!kI1dtCM`6k-Q)d^n^j{@`!C`gAWKe8lwGpm(I@CF+$<0;wSGoe`?OvK0Q2mI
z{H5VUD=@)oFmdqB0SFg`D%z$+3{yq;R+{z@*>eHYi6^M9Pvo5E9MY;qVl0$mD3ZEG
z@_>Wzi8uBh_U6<sA>Yi+!=NW;)NgfI!gGnT^r_BP08vyU(E^|pr_rGR!jOz1hOvoT
z{?YjMXMiG`i$!2R_4#YU=tS9Nx7SOW+?Co~RzJijRI5F0w0)q)&#=N5VP&3R7zN<k
zA4NZ=h-CNh1w#}#)IZ*~&?AF**+4J?Nx<};RkgO7&;|H=Mz9+TO@f1jYJtMqdRpvo
z6K{hNn;Q1*p+|tVN#!mx{w?lgEAt)+`(<Zy{;iJaup|5~Jn8B@+cY7ydWT#WyOBvL
z#If_uJ+|!DZ$Cf;Tj;h)>g7%mPWuEeKXr@9F(p)$6DsH1Ju8gbOz3FDgBIPRMLc*8
zS6Q16=2-=^$)8smKp#XdC`5w9h%)kLym1`ehh`*QrUh@KZnj)xT#3W<yPfp-B5NZf
zJww?S=@v?J+;TjJtMGiP0ils7CIlzBMcVaoaCH2TJdNZbW-Yg@CyswKaf2j9v7jAT
ziS!T!O0Y+odrdha+h=<3N?RZtew2<U$y&Gy&ohVut6(l))ei*<ye0lBz>L8y|I#7t
ze_+&+;5!=265$oM&upqzP|;BeFrtFfppV&JyuOVrrrp<JrO>41hiwm;n-;KTO_HX^
z^C(65ebzNXxg9;OAH;-F4R?Z_7sFFut0mQ7P^16@tNVxNRRTS6!hsxhQyR|qkk6Vi
z%Q}QIfN;7?b?Us(qH;#hBhA2oi0Eb6#S2w2Jv6<ZHs9_iDa(<HE%A&Vv8o=a)!=}m
z3Llh1avsKyu1M!jhhL9_#%zY;4BbbLfDLDR>h>TKyOuSD%tfx+rg3ftkxE;}@mZZ)
zvj%<AFwFS6d)eK>{$Y<=4`99zg7q^VydSE89uHN~MVmjXPiT8?oQo}6CAZ&*Qlac7
zeWom3OxIkmogK&hoUsqTI&4dcmyY20ECVCWwq!gtx_j5ksupTar-t0INa&@S+}Sk3
zJTy!MjD(EvaM1V-ia-UHZLmA{FHWf4(jZP}bcP}<1`^3k=f7)VprkF^W;jCV6H@9@
zPEsoTOHO~@TABI65nkBLQpWzQ`DkNLHQ&u6LfI372CY%c<2f&CpSDVVv3h?RL=)|o
z$tOv9TGZ!on($x8@tZXKg*1q@HE3RMRQ%g0_P3#tR*(Dp%+{pIrwxOK==lC^I@i`r
z{`=hI`ZL$-4XJI7;Y>8u<i&l4No!_XQ(s%#o3{GLZLRiy+ZwNT4x2RoH0c~OY5IJ<
z?WxI2zWtXwZJlF(JC2)}gqrB6wKpfWz0_%ciQA{bVxHUX_XNc-In}P&wpX~nLZ4^?
zguCUJaL#vZ%_AB<oh813#bb(yZ_ZKKc5$e|eU_|v3_S+Pgi-0HIwg=HCX5ON4V6Qb
z>868k+TVQKe>>bhw7Ea@GG=hNeQY7-{cy}MV}B5KFd}p?s(3J{+414C>G;u(H#_?i
zt~bW+n!PVSU<o!GVLuq;>lht2eWz;nd93|&Tg><)v&mabSG8l7)-iR}Y`U#|I<aF$
z$844_c1Y~-JzvMdIU**Babs>_|ATDj`|yr8<q(~igXy;YFW)<sb~@;o!%tTar&7%q
zo^~u;id_miSp3=X#V2<0zWL&Hvme(FS%{tAhhx4y?O0>S2(yjXKBm06OBAobapePB
zU$Mqm@D>guSApBU3kXz@#eL&cb#cE9Fao}DI?i$128>Nx##R7h+cl1>#=^LUidY1s
zE699{z@dqSaUl3`;iUp#^+FsHUSnsQ<e72yEidnp=L%jrj+|pg(#vwwR`G>UUfmXN
zYpz5=nD=|bEFViUQ^2l(XO~!|$c5)S<iGPV&XQrCp^s`@px$P4=Z%1empGK0*&j{`
zKPwp$kmWPBX8XYKw@)xSt?+icVa2YP&2g<_@`RdGDJ=P-M3ipXM5A8qlCzk=;*>bX
zaqDL8lS{K5S>U^YA8OFIBf<~{K_>}L#ws_*c(}w{*FE`!G<G-lMIr)6%kA#y-w?fW
z;ltz8|0|*Tbg76dDs+yPEMyQXel6_Fn*xKY|1+VA`8p*Q6ScAMx;$a2HYR%e`={qu
zHSeB&yteu6<MaOzsyjRP*V=ZVOhR>Lv9-GhEO0ifi&bJvv6CTJl-2#pa14NI4UjZo
ze3CCpMCJ!tvGw#t`YISXJ~3h}athf`L--YC_cE5jF~~k~ffE!V2_~W1k8=52+bfe^
zvu35WNSKR%S$wODribOvwwkLrp`FOy)529j1{?7Xq5~={Ii%m3^1aplaQ4>Q;Us>(
zA;X&{T6ZGOjJ_KZ$D-$+%9GKhB9^{@*G=QneY91tLsoeak3H0B!1&E+3o@sGpYFZ0
z57E*|#$#;0EPRzC3KAj0d^Czs6?}e7K-kT~{J7DT_>)E<9Re@(uQa_)i$R!P`sjI6
zqPfZ7vRPg)-^VOm0=xKtS9Rw*o&~T-Wgsh55nT1lS^4hkFJQ&Wn>{Y7n(MhK>}ep^
zDTOO%a!118t*At0UC%2XD(`O8yG1{Lb*G1MBU>V$P7i~}Pf%R0S0r2ai-g`&opi~c
zPr0erOi$Y}$<{$uPB@F<D*+4g`C*o!d~AG+!M)hK*<q)7-*9RiqrZF0vcy*f?AZI@
z-<BRDX^beqk)j`nvr0$xEfOM5UCeb(e~`Cnld3MblnoXj^{zbW&_AAL`$+O`C!d>_
z*1a$%XP1PWDtSGj3J8dF^3It2aSluWge~8DDjjZV?LYUm@0=YFiJ+kp#&v#Fx{p_#
zFDZ@9UL6Rk*$eWP-FVe_t>#b7{WE#5i?-f%_`|l}pL|}l{bQN`Nddd@bWPE7oflZH
zW4aS>{2Vn1WOUf$iqrN+{09A3>3`G|Pcrb9>R$)2x`EL%`L}HN!`Q1r=fMMRj2X<J
z<3|Cm(0*w}UT1S1mLfb=B=Zim@BaPRseHCYDF60soaXvL=Gv8R9x`j>RgKRQYv3yF
zGl|HPT#86Ed~)J*qM;91D{Fv+loL=cY>Gcwk&Y0p%+oruO+C?(M4B0p99_Fz&FDa4
z<{zIc6!c;x?2^S-Hq)ejk=TcB_KCY@^>HK<dOidP#ocs~>Ghnj`ifsSbhdIb!m~)I
za6L-tYAp+G$S=aKa=0~x%?me<r5Oreb~V~}kXzzO-MMLt{D@r;|F$gRU(ye~?EK1b
zcfuBvK~DDNui#sVls?A6n?2Tgivjzd^zgb>SxirzjlOnva;z@zt%COSd5uuA*&$DE
z42Q3b-6!La8gBu2wJ$2!<uA3*zjLT-fn5uf#t>%S1r_;PDP3dhXP<a|D*au8R@$hN
zk0f8g>k~`b1)m%Oj%DW$=Pv11{TcKUY%F9Fs=7~GnS|=`f>G#KotrvCK9RQyJTI{J
z33nBs>L7OlIbI2@^Blc?%;B=auCJ!WHS*<Ww-CR0jwdz9nGg}W4$v!KE#@km$vN=S
z6@Jlx5m2(Y)rqpx;4XgD<VdndNtsakE!@HBw700$;_7d<3g*uXW7lO3_C{<kV!fco
z75tC7=H)QgCWjElRrov+Tdfj?b6VUyPo*BOic9*+7*yf5jlKGcOI);EmFN|5gUXVL
z+{rtof*-148me6j25f5;vL3t0e?Rdj@R<6S_qud6nP;Z55N*}P-I8o27Z%Q~CJYh^
zW#Kdp9eH?-3c7W*ooaq<;Egxh@^NpV4K@JEW~v=onRW7`ua=7Rn^VZf%yhK?)$5-y
zDUpr2w?_l`gwMQ<@7HqC3z2eBJ^kTSQq!L4kD$9epWnsn=T_4>bfBuD$Av+y+&-LI
zzoNx%P<0K)(3X5tE@z|QT`YbRiG@oRiD)(NhY^Fb8e*R(yjQc!%T{V)&ur93&Jf#6
zO@A7`yZ-s`*>mxq>6%JR(UY;g1beyn!!K@h@7zAL<<?&odD(gFxoDAH>IrNj@k{Cq
z*dE@s{zZ{2p>~YJKEJy?_$ylqyXZM;8C!qtTG-w1BIf`Z!MP?IIl;?_I5<tTZk?vS
z%foinbe?B#xzFR#T!AFRuwTQYM>e)a)Lz(vQ{Eq^GPwo!(hU<}Q~R0sIeMHO8)Z(J
zOH)Z9o!pET8Jy<X^nTO+#k-^x6Qs~saBa_@|3QIC*u~Af1!5m^!*)1A5?uu95YcBZ
zyno{f{r(Q$vd%daQvNVaGtDzW>3zB0-~ormAes}KKi^9rvZxKxGx1hlJOxo!<|;SX
z&4`nt2|yEu5W?z8W*GDNuUpGC^cKbr>hZlwCmHX9xE=7`ZHLP+1%Hs7PR)drBiHou
z(jClTSnE)h1kC4&-+kl_{mhAnwau+>m;c1H#d8W?^*=a$@sg{;^mqTAW^2E-wGtE3
zis17=M`xG6#bPsmJe~)BoBpv!H<^MY2EVjU__~5RJNreVzT%)O^QF@Q|D1dJLo)~r
zOYi1QYHGqPURY_*@e!$6OTc({xyI#tkE;Y+liRg$jhia_SYu?H;+8UYBa|vNi%l>*
z90`uww-CKlnUJ|V3Kicg7xW^W`@3?)I5N~`W<H_&)Q|Lgzdbw!E}aS;f1WY^<lNWq
zULQlp4+y`buPXjvcn4hn+{(2RQFVi95GIzI4c=>cdSmUP!EWSX@y?B(_jGP3?oWT|
z{5f}IuO+&&CCG3sQ_~78WL|Ua${m*#e9yd2&2Nq&Gf4Pw(&17jDsk*warpRDH=K~~
z=j2W$d+kE_O!2?@*0m5Sf0x-q>sXmWYU28@k;H}1r+U5)9Y0yrBwic38zxDXp*0@-
zDM~)vx_$h{&{@p)PcNyz8y61PiRWhK6<>bjym7d+={ovyF?Q#3X6)t1=k~rlW&AxV
z7U#J#ySL=@*u$=FMfz24>aQ~#{iX|EgIM7y5PQYirsXi)=IKX=%yAX;_Lc?PP?u;L
zb(=urPAhqp@`j6H)1@;*ov5(DJAeec=?M<C>D3zHm9GwWpVp?S*jusKz3UP-gdjql
zJ0p;_(d#fx6#VA;v!pCom8^CKn(cO0b3VGZc!7=Nj5t`XkF3HS{xBMU4P((@PfS6i
zBiZ}VjV;a{l@N|N^xV>udvN3vNf6YBEbN^r9LUMl39t)xNrjfO)lr3VsqZh$>1<g*
z?0$X$*GnNs!3WZODvlpKWu*=gTTpx6Ln@-#i#bIVS*3Dm*x}da*jFralwRlbD#jr>
zIS-bb02br%WSxif`)4*XJvLTzaDtjd!An_;P%S~Dhe9Ev0>cQwm(IdL*}{MO-|T%g
z>f~Z$^vzB7B89Ur3*Npg(ulAw8Z|1>f<JPZNtpxV9qRhMUZ8*I$9zGKX-UOck9#jb
zZUdlHd)}4vW=ujc1efO@DA1^ti(*HNcp=(H4A&?+rmv+^wNS8ka~ut~sH1|QV<@%;
zLvdbdzMM?C9O(j@jC6xQYU%JpKw^<u-cD|sP?6Tlkx4F>)oQ4<43o2OFm%ch_~a!1
zn&-(D74BcFm-R+5j#r6%Oerx(iF8cgvh-a^>ih*+si`jI`@AaU@04|<Ii94=*A2<z
z*fM2ka*mz?`CU+FZPmYls+nYTr?y(q|6uRFqMB;^cG0I$(nvy)UIHl6J4h!K0cip@
zP#z6MKtT<H2nZNDNDGL72pT}ef*LvqLI}M`?^1$v6bMB?X*>En@B6*`TkBh6pX{@B
zo`X3?=Dg>e_q_hsk3+n@NT$b5wz)T*BSyx(SEg=V?ysWHWlOb(uC~h=w`50B<j3vg
zij@=;3N&`sKksp{UX^_M91c%SQF~ygeEgwu@NIP(1>*SLcMHfL$fRbhq!#6&uJIXR
z-luw+Q|&Vi{<0lyF)es`L(q`{m-=kUvdB!`9xG{M8boPmynKj1Q={s6Vx!C0rr{aE
zr`-493Aq_evWh0Bhi34GMs{)1WhJ4G8$~w8N>d!AQ7XC5A8N%FhP~(X>y1<?I|Je4
zOrLwxYSt`d7e88KBFyCki6U^@7zsLJ)h>&&3{JBv=ct=b3!8PL)}=XM{iySaf;0d;
zj4hfQ2=B)TXSAcJ6poK`>e(BGTdx#eVUdB~Fv08!e4$2%CufaZj@MCr%FX+Y3{+2^
z^BuF_G&bTgDOE%=PUczC5fWap@}co|r}1B0^y^$lz59*tazXB;9`<vl;Xd@wMfc|7
zgw5SKG61R;;`$eiRNKQvK&h%Lp+9u$5!a{GoR;ADDPh5Gkp&9ZPMuIH2e*9xb!AnZ
zSlCGqC1mPZqxM9eX3^80XKQx2PXFN2T;AkA<g)qM-X3OS?A>Rx%Vo=X4$gB#AU*k%
z$|;e9H}g%+XfJ7>Zm@{@lqzwGjfmCXcj77laF%(B2u?xU7+~rYdIHOV4L{pXL%H4&
zI3U5D)pRLbsvV^Hxhc3~{0B0IY$$H6v<W(TuH=yak=C<wcC3gZ(mA8IcP`$$Hl@R1
z^Fr;?;Tnstr<^u8pIF4yY$|eIg+=bA$PNLe<6>dz!ec{2>lo;pin93C!H@>$BT4*z
z27-)L7-;~}bGiKOoW3`S>41WSZC$AE7wMpI1cmx&Bnp}*^eP)n?>RZlmpIfOaWy*c
zYMSP1G3Z+P-A>?|u$?R;&nifaW8sWCB4MBwL1Et$wFscVOmdtUV5%VvEzzVBRp+!{
z=jN^M^z)8@b*T>Fhe`*I-4ewE2n7~WR6f=rs5o=oJeM0AE~mM@>d$*Mr+Kw+?c0?l
za*L`YEL2c&F44zE&WD4YkMM2wF;C#Q4uiT>h;=Xx0P}vRhrY|r{hXWoj4d*{Kt`HQ
z)_Kc&D}v~Dk+eFrUbx5tR;8-Ud7<CyM7odmkdHo(NsnJ*M<KMjBxHdC*;8~PO~JmZ
ztN8;s`|FrDixF+u5$8LLdj=eW>UdqS-_;XN>=(S7!@b4*&g9XY_9*D-Iu$WdE<Lc1
zl!=c)df?lkzz;n4Y||W<p?8K#W9CF*@f7LES^jFA(8cK^h9o9I1N}8%l?}yjnZoQ$
zVUEAa%Q)<;I+5OTCZwo;@_F3{ci$7^d~S-u7{<j)&SF>+vMkMIw%@b(LfG+)FqsUW
zlS46Sb&wjGdE5f>2_Yc5QTXsu{T*GGh^bQ5ey1vv9FH&4!l^W2=M2?M4&P3vt&f|+
zmcTHTZBM!3==;1e;lr9rJElk(9V#|RAQmZFZnYJP@;asKh=mX_%s~UX>p)~tM(l-p
zo|55vFUq4M?c<v>;@kaKV(d*neyf_;QomjYDf3U<aeD7>XGO1rn@{QXi{jE#bY2d{
zAMz5xkK=pnO$!Q6tcwO+Kt60SfW~8!uZ8mp`s!9hC4Fj2V&;3O;_&coI?-olM8}9X
z<%hc1n&USJx4OO1)jWY30@61|Ck&`7{nJxE;GyS8+O0}g?Vkpj$mp~jZu}JYO>tp<
zzER~<$6pVM3}>j7sOuh@*TKJ@OB3f!&wrfxHsIo&p9W!F{FY8Te*WrO15cD%KLFsf
z&h;O7(cGgxLEbK$<{Fs+!<o|#Pv<pd3N=mfPJAD8)UHim&BHu$I`uJ=f~v_-E2u+l
ziV6oAhya`#Ee)1#f<;I>*^eJRl^M-d2vjP+VE<J#*f2wVfk;w`73nWSI=Rg65d!9O
zm~OSH57xm~d~)42<CQXBdXBz4Y<cR_5PBmILDGCUC(04Tkto%J2Bp663`a?7zLX1i
zd296bv%sf5nONnixcNGW<pp&v;LGV&A+00ME-vf~1mwp$t~mo<GVYnnbVPdQ>zvVd
zlcSk00<o_ys&=obAHJVL;vWd^;qtFB<_+t)4lo}^w0u1H-lGHxo9*BGh;zm`u~UHP
zjC4W6I<!Zph{h-b1s74C;<{dkTF3KkEvX!BE#4>;uzUC6bRMJVO(zi!AIvPB(kyg;
zQg-B09z24nmImJg@QjJVWT(IzbsvWFxmQFvb17(i9c1imxc+p-!+VvjqOgcMu0*Y}
zBgP^`4W<v5oDfxIQacDi3b2!q&S6lUj!BiE05JrC14)n|22}H<Ou!gA=G1KRnL}bo
zB%Tyqronl%OC%F#?%7!hbfg&6A@Fqxj~=UzIw30VMV(Mn5BdV><)_9rR?TYPOJ~eU
zVp;tc5r<kqOoo5V)Rw9w)tm-qY<;AEp?Ce_9$^O;iUh?Ctc!9NJbAxwU@l_~7FA+-
zvB|!P*}zXdv#k$O&{6&9^vY=(oPec13c8?N-S{rOURSWeBB;UObpsGnvnvVK%4&SO
z7ky<<-8rZ!Ku*N>ws42HFYbEty)25Zc<1L)1nz<0`7f&W2CvhV1&|EtHRr_`u>XM3
z7q=`NF*PzamGV`TQ&?c>Xu2RmwC&_{Y91x;MNr$5%#LF_ZTdQ?o!ItMjvbFflPYrB
zo2&a|hC6P6Kbx`%l1b3(Q}BsqLLs2<+gS5SwieyIW^o{#3_vCdQlB7sC{t}*p8^iQ
zlt2^r+pZh1Wnv4uLPe+)u9zI?P93TSi{dw_J)L)E)v+%;vhBjSkG^g@5Z8VvIZ#PR
z+QJNc&K|gR4=dd_AycfzFjJ);KZ@&6p%QpEbDDSeRWkNe3Jjn(fjl)7(&-K~B`4K1
zTtso>OLMkW+g}qWc*c!_`zyy9fE3`42S{tIK_w*YQnvcaU$b#VYHnpI8$j+FEF11Y
z-*w<)r^|CrZv=7?sa>iYod!)VqTE{-)#j!?EDV3`W141+lbjGvHU4Y-)L$Jwp?n{!
zXC4dRvz>58MkK8=I8;&C#U*$u&8PbE2=$;SkCuYY{3u@~92T-5{#5lNu=4P$%3_b}
zVxgW__CXRUWPHD6N!PKT72EOSAh2}8*~6gAXGxHXRl5}5uambXa;UNg7&2w$A=BU;
zB!RFR?wAlY+=t~=;Z@CXx@P+7e#`19U68pWP!Iq>V}b7vHVt^zPEDGg51G9r{%V|i
z`}5IN&u6Y@YLm`SPRjs5memdJxUF-4?Pzar$wVDVv)ev5p=NVo<^G{T*x^s3w4I+V
zJ0n5>X~2?I^^wflUELGEq$FNX@(GeZUb}E6rSytvh5ml=kKJa`J>dO4+fVhtusRK9
z08_knjA9No5+R@!1X0Ruh~<*GSRJF3XA;fWqul*(gzE8ds54aMWyfPx&(Uhl6h}^R
zD*o3VRP|MNj=J_uod>F~dtX>S(Yji}1ON!JbwL1%VN(OJX=%s5l*zQdLf7_8-MB5B
zX|C6o&hN*&-i=lI&U2{rMmUat3fldpdrkEntu6wNN`wKZF^zFuf+a8taJtd4>4s3V
z+=f9I3){T|gw|$5>3xeQdI?&kRyHOzV`td3%e+!TPkyOMc%tb1x*BNgA5>a?mNgBC
zKi8sJzCPRWDCH?z_Keoap0}4w7n>nj-^Qwn-;L{3@2s)q!8DSDDG|-gJ$ccJod5y?
z&X;vON&o)N{Diwo-Ov?6@gipwdlDoD7bYEgn13Z4sRwb2;FxH77M3psN{HnDHQQ-j
z>IHEQLs*+R$4Wenaei<ls>L}@-r6OCeVk-sDIq_h(HkSR(&Cb&cOW_ZK%;Y@i)b>z
z6vuAc;d1fBm2O~L@`)vg>!b6RW3Q%N4>&sO_=MbhHA9ilIf8#LgPY}{bClVOw3{_h
z_pGnb%DK}M@wV<ykFDiJu}AIroYo5-5088*P$uP``#`>J!QPku`a`jkhOk8)TV7zC
z!r<oB1d(42E^M+-LXIM218w<*aueRSU4Q#tepB*IQD>Xo38g3}^DFbJQ>HrQj1Z{l
z-p*~5P)Xa%rMGSJ?Othx!c}%r-BBZ_b&?tm7ox9i^QOp{mF{WXxZbL6akFyHddI8c
zc!E>nN7E&6JCBly_eDJ?%a0vW4?kWSt(ZT6<0)+~+E>jAyzJ=7)Xf0vYrYgvjDFl0
zXQXK0(Y^Fq(5(*dW_R}ZHPapcz9E6C2%U7b{LH4)<&wKE3Y(R?ELBV}wH-r}g7(R<
zPDqU(N4FYudBaj^DBic%{FcM!sc!@a9vykr8-MBLg>kVc9l!cHWkAf^>W-zUf|cJ0
zXi`vF&+@yP1s~=I!cMy-VtmF=l--JBLh_Ew3A4bygx+B{l=V)LM|4nhiO>F2jMlCo
z2iWWjd5x83?BEh3`Xp?+U74^0dZp-AaX4+QKX1$tt1U866fZjC5fZp0k{qtJ^kxzq
zCz?$3Nm_XR<fgV+hUW@OX|Vrm^k5qNvj0Y>OrS;+zz|Gw%p=*DBpXJQSk0!f-Z{-#
zKGxfyTVo6~m9xq^6UT4WZP2W_ZSP{DF7k6NQrJq?xn=LieO3Jqx!BVo_EG$4JvG~n
zUH7-ZsXHxqlPu37cuX`nX&DTx@H*YRM<(Nh|5Sp^&eeM<8xz|hVb!|>RGus7R1xPX
zR81@sl5I0w;Wlfc*U#`M(LxhWw~~0npGK(m7^g`+s?q)D-6A2cPD;qnB}u%By~#U9
zI`SbV7s>6#X++_?ayb-axs!)j_dg6rKli3SBZzT`#2QNktsTc*dna%`!-=hxJ<gtJ
z6n$#5Su>ZUb4K>7IBUF<kWos5TA32(V?v{8T1hn==be)3%bni4kYq*AQJwT>mIwzS
zhsLJiS-TGv+UAq|jdRR?VZRD(RG3}>(cy`E5Ty=Mk`4Xnqqm!;GIxh5HWMzXG>;ka
zeBLtY^S2*&cqMXk4!%EK<iT#`5hnG>HR|n8Alz2+D>9(bSZ7cyZL(uf&Y4TxX#tEh
zv2PH&UitZ^7<(4S+qq})izu_pHYuOK=j)4aT3(xQ71_NA)d@+7eRRxHq&6atd3DR;
z8N~ePcFckque8m5$&F`%%aRulLFOmCy}*)J%?u#cV!cF0TF<*K7N``}nZXEAsJ?q`
zb?d>ICnmjlI?GZwvHWF5!=jSw8m~`9NT;OzYCxCHT(Euy8+c`|W}^M$^|=q`yd?E^
zLVl9rTK!X~py4Tjt7H)2BWu)&?=IX`l!zm4Yst30Iq;{OrnZ&a(IqS4Z!a@{lbxVP
z5piFkmw&Kc8ix&~qRsE{-H^Sa{$QZRJWV{^_q$me4a9>1Lj7j3i1+zOZxRJrMI+c7
zbu(u#*Yk;DS(KyJlB+_DOP;IAxv8}~cz1+>F^?nRZcfoHBf!!(=VBG&ua3-ooMqyX
zY;t`DA5Y+#1|7GNKSks}yo4mNb2=|mO)WiHJAa8Y(b24|!-~Db`~xC>^!NIf-%#H}
zTt%w)V~#W|Byo6&SBr?Qnr{N+zrl8n8&nXabK_`C7RE<-AXI{p*p-nGV@MuE#$RYH
znWLm$WXazMGUhh)!)}-gNco_@0Ot@ss?JhH21jjFIX!9s!+-db6Flu`8j}9aI@XLV
zB|1i6*M;k}hIfq7I*U3D3>73q$El1Vy|W&HcQw{cQ>teqP?as`^t^)^7q<MSi-71t
z^FybO6#E667O(TI((-^v;dY0*6BQKc2-zgw3KA2YNY;Oo3_{|l%)J^a&(2JNbnl%O
z7Q`ChfN~y&hhNTh1#KzA6lGC@5!mkU!QL+%K&-Q+0sY6Enwc#X=g%5lc<cMn)WE1W
zN&boP>!Yzh%p7&UUFeDsw9k-yeP1XA)a)?OP_~rR2=Eeo{1w}3t*&CdJmzdsl_%t6
zQhY1*vnTix0{^tEeAmI<)wAm4IHcaFS<dy$6>Rh5%@f>wJ?ws@s*^Xf?ml^T17uQh
zZ<5cI&RlR~6}>nOhq3Jtz>FVk+?%?(TbRw(nVW7n)&!}gupv9>@qGoncS3d=j2ilr
z^mj(`qd-k+iHz0;FihxYd5clWa5_9g=!k-*_}S2ntZzZ{I;)jk_mP_<`2S3(-qjN4
zWoP9qaU4@-?eVVC^HJiem~~aC8tF>hDtQ~c>~*W^e<D;Tk~w1xCU7Wr0$hLNT#POx
z{#Nz02<m6ci5hXuSJi(A)p?S5%4+qzzCu8oXUJy8yv_oHP;HKTx>;}{c<IXO&w=8n
zoA0APEg!!hI?`3MRlXXGR>cF^TCm%XuNatOX}c5PD?1I%)oTiby`eY*L?}SxtC8w7
z|CK8<<MvKEdcDbR&t3Lr6l#Bdo_qlJBJi@c4>Nb74tI)2Jyw%y_gnSvKe8u_(^00H
zD@pesF>}mI9CA&u61LJqKovaSDK{iAA*^O0&;?v@9U*^<fX+a2R0Nmgx(V!f4-%mb
z)2NPF0<V1t6v9Nc!QZR9FX4|Irr%#A-giE8U&1~_MUtas22}$<^4|gSn1$ri;Yu+C
z&zx|b7Ve{v2;NtrFKk1PK|-w-curSDoE*jpo5|#`aJkVuxs_3-5s|MAkdGCmzhjxj
z=%7#Z`@?iN6@wVYBU_1xn=x!XXtq`&M2G~$;@AcOs%tdl432Hy=IBpMOo#@TkSMFf
z4!o4Wwnz?uwS=j8gil9@W7tvT?#PPnaC46kL$e6_@zBQ=vASklXFbC079!Z}Bj@uE
zADn4<z`FCm$wRVwFj8#|vRfPmR7UxtS>kZECHDL-8qz=TFgpf7AH$YU(2Bw!S{WW9
z8XAH@<dY%6B#?ABn6cHChI>$hgXW;2FERQRL}(5jaskZs4g(S+vJ4XuJ>;lX5~COv
zQ9*}~qLKM@NG%aeNr#W)e#@L203;2Iq*3f|<itGE2uZf*{MF6Y-W|S;N3M{R54us~
zB-R;><WI$9OXny7I;e;qzZC-?Cr8~hi=IUzv%3?q6qMj%@&O>FUGd}(99ug{D=H>=
zoa8AT`oOj&;Ehu1+KD)_N9cBXDmCMH`y3~g;w7*S(Va?tWpEf@HpBXu$gEBWr2`=O
zG&q3(Z?|EM!X;9PP&X1t4A0b#Q(N3&Cu3O)v4}W^u1bcK5;SwSI5%wI!;&C(JS+<k
zUW$XY;$Sz=!pG@wMl+fk1|&p;*ASsEZQwKld}YSE6iYBPxE<#ap6n5<3``_3D&iJR
zdi;?z9L$aIcm<8Zt4cq{Fss{u?+~G_cv%0={c)R&C@gC&8W}@OxHZD|f$vGNRG3`7
zSuz?`;`2BP_dwY@^}I%?313{Ued=gs>R3SJ1u2;kKh9);)`5+5elDs40N1h?%9}<J
z_~6`J(o2$0y^<dt;9wy*7zx8HWCIQc945utq<QcmdkAd96+kQ+dU6Kos*z4YqkeRg
z_W4kQU(@vrkV$k%HYwVXkk*5PzNBYF(cqgIh&UYhh7>%*1xhAE3IVV<IwVjr@jfS4
z&b6@T4x9|-vj&S4e*nLZg9$D&d{ej^QHr6tt`T+IIiLjmlS)3eaV%>o8o7u@j$;tM
zI7m-7RAv+`@qiI<gj+5>Z@^2?u*Ua{5q%_<9HLPT{jrR9_WR-NLhpROjQj~`<niJB
z?Q4>==kpaAX<$v+#&vdHXxMli%8G^xTR`T}tZF%A!$!G(^1(YH$XYD3v<<ij&-jv&
zmW)A655YztOk7KcB=i!B41jM_-n>M^R<H<PVvdHB-c4U9BN6F<hIZ`0+s*Rw=`s2w
zkPz+$mBgBZhUehnWV#&5MtVh)ODm9|bCD5SVSO{L*^;Ma`2uw>!ZMEZ@&NaySrVj9
zhc9*;J7gk9iBJL^{@nwN#VGljzZZ3S?;ZwEqVtn*um%$An}^VHbi86={ww}hWbbUN
z0DjaLaz^IyA8wp+q~~uraSK}F<7>=#vQ#O6wYEe~-l)*f02zma4l2G+|0&l*Vy=Kf
z+$dTv+w!I9;QD^j0S%dihSDe~@|)szeEMTL1W&WV+7er@L9+2cF$@C|hE9=R)Zz}I
z>ZxEc66o$6>ZuQW21AsIfajAD%cppTuiqcN$hn4P)wPEw;o(U(s1@|}eHzl2Oyux+
zpNwO35h&K}My$Shu`7kRHJ7#qKrYs!?mj8sA1#fdA@}Hz!fq`!KQi<!`3v;b6rYe0
zwD8qbCFi{&Pi6cJv0N=#Vb>Yfj!qq0Gr>41ywm<@bVhm*BWac?wLxOLNQ_S>BDQ$h
zpcM&wBvc<>`$Y<y3bdrrLaPD?t9)3Z?~SaWRVOR5b&!G5c%~X6vN`}JIt=FN1_l$M
zSqsRQL})2R%NY*8>iNz%v}``VOx+2Z41o6!zgXCXOy;BZ9zPZ_ILxC`P(g9<LOR@(
z43xm9<>Qg<I2Jr1L8u!X0)R2bZpjpz1J4J*4%8PhatHvK;Zg~?$H~!NIbaa^><Pb=
z?8jmm2^KD>MjHp0ixNj4n>|Sz1cK)PATu}}6sMB>cg{hg=}E^1G7KKj@TfHgl0|_I
z#}u2$HlA^8cuB8L2Cyb|hw$@5-O$YT0M>*Eh&m2zM`6g(EVgK7Q({6emi5Ya*2-{Z
zD>`!sjWr4YVH9yPm+-7vglt%Fo^XZOb~D-IpmEq1jrayUw#5kw$9FSTq%;PMH9C+$
z>e%KBRh&w<nLfN`LKU!fwYON&T8Qy7z9US}st+@a&C|C|apv5k4%&vwrDqp)+$fQ4
zAl^om5|~ZMajM?P%FNe7GF*k3?O1l`nHL?W?>yDBg}3XRlhEb~LA0p$9Pf_*JYsn!
z{}QLHVEd3#dnux`T(+~hT4El{YJ&bm_D0RnI#&^0bT5`bY{#6AKp(F0XF=C)d`((b
zf;5(CPqrKUsjF6p^L=Gk8vbz{F~NZdZFvKV!*(+*x7`jc8?fXo$8_f?_6Xf*v~UC`
z0~&$LJ;y$Em3wd&k5MIMSq6?^5DUFqUXl&u&J#T!_b^rBQ;fINKHcR$z43N8a-*a-
z@}zFRj8pPSxq9XOwwW=JpLC0(L$_Z9913YY=qb+WogAyQ&c;L>$6Ws0pT@~Nd7LAO
z&P;^qRcO_l;F?F26Z~|<#~v`NbG(itFkeTb8gR`{IH;2lm*NdkJF9^)(Sd<Mk*U32
zx#gj_aS@m76CP|_qbKT#%P7@L{qF0`6?l|eH>WQS7Po6N-ZHEY9E7fWg^vq`?GHTI
zAIMuC4NivMg(3;`;Bp%4Zq=)oI7TOG@HnFll_W70&QE3InBjYNh0b0>F|jAW#YIOy
zB>3l#4|H3NTSw~OiHA3!S=z~IuOpa)zA*LhF;j7{mXl+nh9hn`XbnIsP*>ZH9Bx8{
za{m|`U=XSalfBQGR%om}utO!0l+!chXGvTr5{{*U-to?N;zc3N4bxK@1~=&N6zO4e
zBT8UwCx5=166l-~1-}l#BFS$eDavf#-z}#8%IlAVhZWK8_s}l*ApQEZz-Fvos_DVw
zQ=0FmwG*X9gujycm9%<LIXK8q0K^21%Jq?$u{kQY!lNL}VN2q%N;SX11>;Se{*cgT
zxK{Hl!nSa2_89w|N@2f74$8!8P>~&Fl2DoN-KVL`bxKZOsSaiG`LoVbjGlZ+d;ycl
zZR8aaQ$B4tnZS(e_-aBQUl8JOBUqDs;I<?dH#{ooSD~-sNxsfuH>(j1C6tNHTu~3(
zGd&*fDvnn^{Cw9Bmn4#xq^HzGf$GNW#(sjZ{V#*>X5da}mibCVAc2{u_*n?%bkWrC
z)!@M(C#V~)xq)cp*I}|vwhE#1|0F`MkjM9yS@D2Lf4!sIHa2xFsK_>&xuT^;CJKH{
z3)@$>je|L?j9Q0qrYs8uDzd#cSdz{`(X4q)aJJha9D6k!%DyLV79u?TP$mH6$!zn0
z9L_Zo$_mG}N3sc${eCUv#1nZQ1sDg?v465T=NBdCp!>;BMU<fta^(GTZ5m4NMyBrg
z*=6gI8n&@wqnTuEHS`Ch`=(Ayo?1J3N%NVGh!a~frpFkl5a{*McmK_d&1M{l$M+t5
zg(Ts^cL;wLmO;iK!i~9V$PkC`s69N4K(ksy!$Q!%{nS?~tC*Z0N!a|?eQPRCa{D(P
zLXY)quOMr_Bi)j=u=mpk85P0!twC+=QgQ8yJniaf?H8Qda7~>jhR9MyHUj3etP(vW
zZxti@NMsGtfZraIUAxWxB~I~6Y48`<;F_xOFSSBr+^gKYhwSZmV<&p>8d`SmA*aOs
z^~zhf=B<#^e@*BJFw1x{{j{OG(ct!I6h}nbkr~D!&4kI><7z;)qnXKgc#AIAEE}@D
zThXbTbEEqoLNyT0?1m{lAi&+wKVJfn%dSj;XqLMnoSv`8Se+puSp6-d!>t*THDIbM
zQ}oOM!cBQvrZ+Fhq+_i2OgGK=0VB6oSR#uk^hbK?em7}`2x(CnnN!HyR<UDA<g8Tx
zu2G8Q#?I@tV$07(7q4d$b&mI0s)ui9j(r@MnJALLM>rL_*}iGK8X_^FV%I*TdOsQW
zB7WwUEtlhwKZNQ#cKs_gJ9Q^zJCq|1zB<LazGD!owh@nW&y@ToRHZKdx{e>=xl+@@
zm;H)Cs7i!<wLR+oe<D<i3~b!+1IoEwDWc&fzX{b3=W8qj5$X&=^;vQ(gHR3M_%W6~
zP?MWszS5QM_J>e?_A2_Vfd&EZ5C)cyua%hJV`31hJMT<?#Ya$&^i1X{R%}|Sp8QRy
zeqa!)vA+pb<yYKTEf|uUL8vC=0?u6ghfs~()WSbb-|KN<5UQbhVj8~*RsHL~3DrH!
zZ$edB411;F&5OE|2nL}V-Wg^Ey}MVz%xw=~5UP?bN>{0p|3#=u{1>6Ro)`NH@xLQf
zgN#v*TOHAfMf|@BRpmc~sy2gA&HNXkicKBvdG;?t)jL-~Y^09|Ul914P*rJ3HT|1V
zjSOWFs>c|FY7~P|ExtCm5zVXdHI_;;`%S3E{zItFXG#7;sM<0JRi=}5X37o>LKUI(
zhfwV%T~gLuNQ<4T`-f1~Z?WY-demn$CH+mPdbc)<$h!O{RF6OSp9od1Cd3~?HFCYD
zJ|=)gq90?F?rCkSaXq&A-2g3omUb!i521RQL8yuZ{F_j<{VM1g56M)zzplw3RFC~3
zRB!%^Pz8iC2-QN~)jx!)z5O3TwT3~cs%%0VArJpWsP<s+HGc?IwSN(+wcV!A{t&7v
z{}8GiXyTKF<6K7Tz=oK=303CEcewj$n!^~Zvw_V<d*BUStAu|D)lb{wg;WcBSu#Of
z1W)$J<u0~8ziA^|V?NRv5OYloX76wHIYpr(qn-3VXW;2Q|EgFqgy%-+G+dUO?_<BE
zZF@tGW!Ru%yh5PmBtos}I~gjwp7@M!&RyhP@SK}1p<Y)@xw@iG40Z*3;qV|@_Uena
z`}-A<?5Z9of+=;7xP=iS8O`ipm!r($V9c3Gd2-Fa9siZX&PZM3<;jX!(-Flm{(j1n
zSoES=`r(;gUFR1O!d9lx{0zGbQ5SSV`9%Gh;=U-W?{MHTim<vIBd!G!OWR22-78Ek
zynhH)Z|S|AVdGx=O#eMr9?eS$@p=)Ta_x_5vlv`TTlYWmVACautJM@!dyKtz(<qU0
zF^_-NK2slN>CJs@>{^;ZG)1i!vr*xqXSrQMxwB-o-SWj)_;r?XQ7gwwh@;e}`9zyv
z^+Ls*88#gn78eJ5e-o-JRK|liZYua)Yx>Cb*P{9qATrO@g?#fGn+w&zAS>2bMJm0$
zv%e$b(I`SQv(@OjU*D5SCU=cSsYm{Fl={QgS<RJKnI{wbvR5PAb^b4*S~ghvA@YXT
z)kEz|ql1HG<&8IP-l@7Yu{Bs;%X||bsqOfcd#IxM<jvcUsvPIkhbp@wZ~DH_{%h&{
z(8r<1n|`HLf35fpRZTMA@^93>yq-2xJ%936;6T;ot+Js{tC6>YX0@;U8XRKm?%xXe
zQFY~DYpC{+8Bbu=!GU;&DXb>=up`wtmJ`Eus3?5IF&!t^g<&dB6Fy3<+6j4gxL$<C
zJBBf4&5=IbaNNZE!MSQ@?(*SAg(&a%t2!?H|CdmWx?4S~dn<70%fxom-I^btZZR^E
zlZPz+6lOhq7|$4u)zqJQqy`^#Vr&W(?ceZ!AXKIPKM|_G48WlO-}O|ba|vn}2@E||
z)A6B;<Ar7%zqXU_f4ZsqZtiAoS*>nj3_8`)Gt20P<G<-thMQ{QefDoU)zZh^=Z~Ih
z;b-w*bn0Eg#ejrM0qFq&0bK#Q3_bNyaEMcI-rsua`H=JWAs!b)d~NS*GbB|90*)c6
zUI?{08>aRjl4{&ar0&Hi9emWg{wUk9=;S|`D%Lla{BK4z;z8=)k}88yy_$IHZ$|Zx
zp=$O2HdO6yrMe~lVN|^zUHr|cW|V))@MJKmcOUz{dYt5&c_}ip&Ohr)P*(82G1dQ#
zq?&j0-;C;mm(dJKwc-z;`s59TVW|GCr#>urRZvjypN8rqazZA#IG5b`s4#4{Fo7Yd
zW)w$d6=(nLss1gg=9Z-}B-MiQw#D*C&ngobhU&}8wvLbQ=RQ7pQI)q<^)Rpc;k)X-
z|CCgVYX@Fa-ZL=O{<@NHbuSo_>PKq#hsK=$E~&Os8e8icTl*QL>i4$d?Y6g*?KKQc
z^}jKyvpw~zJ)hco8yfohI{L=`#i)+;_4oc;QvF{U)%CHC-tpG4@rhp(?E{m`o0C0*
zQ=JSw_3PKk(dmuRnf|%ix!u`82B7-4o;o}K{XYTK?WL)??^8d&PcN?iUp-aCy1HU*
zy5*tFmCowQjrs08i)YrKKK}SNT<kg7`KfAql~x~jC~~@{`sc<%-`gu)HJ^63s|J8i
zPS@7#?`}?go9wE6F7+=xwdEf@)%`#9R2%O9)KmQp|LCb)5?cgAl-&QKr;7j9Q(aJJ
z{!34tVCbnQC^T2NT-Lw!RAq*qs+h&lQypBro7n!lo*K%~Q$_yKQ$MrWZ2bhXivQMA
z#qo55f9a`bt<-pLocXP%o?+;zmEd@(fAmz9cDcXx)X+2krKb*p5fsSL{M-YtKEwai
zQ|l<9N@Ab?)>Cl|J+%SK>hN1n&HAIKhW%Sl?chk3`j?*Sz|d1?tl{dQX~Pe-i4iEy
z#fz@8MWRyevIZ0Yq)EVz`bST_#?Vu9f9t77f9t7>brH(w@&8p%eOWCEVd$woal*qK
zm)MRr9TkhwdWQv}j^DCp=&3{<%Mz)tNB_}N<(ja+_0+OlUm0+#rOI)Jo@y=TzVI(S
zmH1mv4U?5YD;_Ul=&8hvq6ADJ?mzU@2)3ht^wc&&wpo4~Z#&aqrD53e+f8h5o9r#X
z80sj|SJx&EwY$LrbKj}gd`Y1N`Sx0%Hn#;rcRA%117+ojQpB@)re(>e<-661l15dS
zj80Ij)(ZZ8(85=MT$%oQOq~Io_}wKazq>rktmLhXu3szd+tpJtD~b)L#QJnn*ZV<A
zq9iHM4-AI);HVf)edYj4<LXAiQG{R9fI*t*G2mJvrisI5aZj}Nrhx)Mke0m*V$#2F
zsfhLDj49FpfDPh1M80Bds^wdNJ5w%Z0A-$|8f5IxaYMg;<!pjA0i}y0dZ~DEX)qm)
z$p9{#;{l;L4>dyHNa3+4(6wZ#1NT<|r{xHc@=ytrD(L(%e4qxR8;WFo1qdbxFG;5}
za0Vb6xxhV)Ch80_Q$ZlfOO^=C4As=M3J+&t)qzyLWQ9f-e830`geo7XgazaBSPgBO
z?_1mG0}QCnGhslD^DUtV-Xsyrpm43R3tH}_SiUnIdDwVn@HLy;0@0Q;Vpk=Z0>%s>
zx`-JJurx_2t(#Y_jfCar!f@ebBl_*4b}!OU4ji{dZg?7WY7jttWkj%o>o8ZURHETI
zBcYi<utq-+Q`nm1pgjZNO*~Ev$(lku<&4p?X#q-*+gv`6MdfTIw^|i-i?lkrspR_~
z#@*O^eZJ{B@c7NT&*GrzCyEgg>IZyH4&5$#>N>fL7s)D`i%ue2yRQ1fW)h-+dIv!p
zQ(aAm=9JFH7@#@GpzQ?uGRVw{?Weebm)WN?zrZ5J-9{jRO7+{i@v*z;!DEl@Yp$&&
zIdX59#uXilId-nzK6tbF+0%@^>_7z85Ph*_$G`1bU4PU^u9%hgk|>;dTiPy3YCa_L
zEQ3LfbdC{Gb&`DFU`3Ba);p=}+bSZzi)S6zHq*c99R(78B@&quwQp{EmRGpc`R0+9
z5^R%+%i4<mz2$F{dJ^c{P6-JIfaYgA^XIK&a%?s?c(1lcq5ySXZxYnroO0hyV>twQ
zFmZsQ3atso_erW)z@->VR!}b|?=}-dqJ;s}>P+Mn<L&cU31LgMi(iTN*W(yu>TK^N
z-nU_s=j45WN6}^^;)O=t_s-)@ZDD3e+<JtB;<2+f0ndjjddUU%8l}+6Csm>(uNvmi
z+d`w?;c=7*Qw;$zly274xvi?1^LGLZUOH^+@AWAdD9-5>@X1_e^^+lla2vs4<eYBL
z9yaqIBFGe}_ivWHDwnj|AfO)~OFpk%>^HW&?^x)V`@{(cS9T0-$nbbxG#UE!+gK>^
zTV(H#w>C<rE(?}hL3U$qm6aKY1n|a%82&Yv()t!bjjiVZa5N{28c1I~*K^qL(N_dv
zf8+`d!09O`FX5hCjY6EW5E5Ac>b|@~3f^0+b%;^WN!7Zb`J*R|<DwJaUHhi6SKxaN
zU>lTx!{Uze8H{DM5bMso`v>O0?qe(DBu%t}SvxttFZWrj{-yW9#MsNv;xKwYzZD9!
z3_C`)aVsXUUl;tgGwjCROf(^szGaboze3|?RsT#(O`ugAA2#v)!ub1T?a)Tl=zaVV
z6Uoze+Zvk~5eOg!5PN$-Fx3uT{W+AAup9kOF;#d*b@j$ZT=+i4G{=O9{cGz^VEH(!
zVmdSC<j<-v!8ht|Teu^_kD+@EgTdxgLnQ7jCy}OKSkSK7VwjgeOx0oa4dAo(cUJlL
z`h%E>4XdqFoD4D*bE3b+Nz(J&2N~)Q_4m4w=pOKoM^HM>#aN)_ZTds*5gP`XDhx%k
z!yy;e$;RIVdy_zmZ0Ytl&OX~762rxRY4sUbzoQ^^);6x4OL2$7H+I2*NqFtF9AI$R
z^e?}lvIVdMfp0iHQtGPgHn<b!DU%jAU=4iee8zu(7D<q@-dhCYXlRAQ{VTr=3@1#U
zS9I(fpi)CHZ$t}9z7<#yOISRZZqWrZHEr%#eEh2@y-TO-3+v1i`14Ib{Plu>B(?3&
zxi`RerfL-fB;`5Bt4%yH7+3}~v{Wei>w}M5Rk?-SV_3+$D%#=keW%!K(u)X%28eFW
z5tY<i4P5RqOVLM)Ji<DbG3#dYt0SoEQ8aL$+u2jw7tr6_(LdbpuehWA3{NwA6Bt}7
zbQn`Jhek@WAK4+WP9cAtK-0;gU$#Rpul?pyEiot}g$aj2(iFoOT<Z5c&hP5FcI$51
zKufziDD&C7n2PX1pdFaXq}u?+DKg_QEEE#*7T^z;S_jodpEyGg`<qKGN1y0#3ct9(
zUwZ`OKto0{xKx74P2WpKWsx2kQC2;X9Y;}RCov*;IM+s?`>QBF|7as1izGSv-U7(*
z2jhkZ8+LQN6B8ZfAA?<sM)qEc8IDOjjNy7<kBQ%jNwxpYr8W^`Gb>`7D0XQ(u_WFH
zxf;Lq)R+DbUj187WpJsqPzIN}$HTr?j;hFr3p*FL^f0bs=K;k`^c_k63@w(yrRut&
zn~0GNE_E^A9h~x;OYP*wKzZYb7k+c8FL6c>|8S|t($Jj@E|miHkoe7|_Gz%sXC!8k
z6Gt?XR-HWL0Ek^2Od-M|@)#3995OU`X&A#ILSYJ2VP<fta&*Nh2<i+S7*l?3n~7Nc
zhfD3!Krcu5<X^p&r|Rx#cZVz1c()sbqdT(}CWkaL9Va1+yFrBGqF*rj-G)hT3z4jc
zPRL&vw8piE$AG>LWDojLh$O}AyPx8*=V$vlPaJd~y{vKrVQd*j2QF~f34_7q_|#62
zzPHO|pL1yGYsR-|dfZ^J98FK*`J-d0%4rNMH7}WArRox_L(2?b)Tg8Yj_En@sZd}b
zb~YJ?mD&wq>iNe?4R1vY(^)xt*m?l$#DE9ABv!dxMPU~unX``>R_fQIr-K<*>etk<
zexs>jR7Rf|k;6!R<}r?PGq}W%PYNxt_y<aTh+XW>WI(A(n<A6bDCtF6ik;#aBBW{H
zq9PHp9xi<k$|pkug6hDbBj`CB#sR>Yyt5I>z(gtb(+qj?kp1b4ilAz7{Y~Oy#peh%
z4)rQ=He#f?)hSDD*UScA8MdO#f!?QqWNnvJIS=(GR0j`fsoQVeWP53-y-MvGJFPa3
ztol|UZd1gv`&l5xN)eX>*vU$)gRx-HNLu<F1uTkwd_ZUFp@8|i;e<-ixFUKS02s$-
z%l*m)DdiqxK&fOFQ3_zv0qsu&%HXr_ld=ymProUGMR7>uQMe}!SVKddlt!Dqd2Xro
zV4uLKaXw)`qa+8oD^79`^#_fFfv&)g?Gw`2oS&KB0S(af1jTPtXi6@ba-mdclNd=_
zN*^cw8%Y(RdHPDnWYJ_Etdm&Sa|*;{Ee`>R=hH6Rl1ws9IVny6M%R$Y8wQRFPN3%;
z&;STJ6DOVZ8wo1<E1ewxU`GSzY~JKAp)%WEKh*+qc0<_ddEg#McqIr)Ly3}EKtRAR
z8W2VTuqy&<+5o~7FpTz=vV@|V7c@O6$b%p_nZT4@&psFVU96HNR*Hf?)dE5=h*YAn
z<x3mM6$X)7<UC<6Ro*S;@%YtZiZ5W@TW`)&#uYX$ZCo+@_<-;V$CoZhmnPDWr_7+5
zFvlb*@~MA_RC`Qz0S4etXGPG`kpza42(e`lskC%029e5M1hOsUc~W>p20g(LQt1UO
zXtrAZ0_{^zL5J*rh*V5*mvq5#>8JTSaV9KQd!}&`rmoPs`?#~#<*)RLG|(nb*jMf*
zpxSvq@&hAc3q8rD$%_C9EwqGo(J`5#i|wWM#Nq?RHw+>*;^*s3#o}MIV)but{b{Ig
z0Kgoe{5HJg?Sc~MV(D)pl~z2511Nk%4lS0tXrsNWDh_NaqCJrX6o57iP$7-x{D$hG
z=jc#=6RCP}tR5ESzZfSf4VArHnWO#j%`1F0q=G@D_AjCQNdVHD><52{)L6cPW9?NS
z+p2PS5rasTyM+Gshe)N2!a+EIJ+=bD5K@Wd3?a2(3DpVz)NAo+49Zyl--_r~vQK-K
z!*d?SS3P77t*L!eqqS564y~EeuGQfM-La_MxpV|<XsOo%93aI!F#JuVa@Sh}1x`}=
zFt$JVzX580?ozA^Yv&cCXO-DDe318;FnweLKrib&#d==x9>5tokHesYsEQ!WJeevx
zMwQ>ADhk#sS5wn$^pJ5>jcSavPQA`py<RnSrih}c)3Co*ZxYlXKgOD9++bNCLZsEr
zV-a?i2$^cOFN6jY9kw$;jWPud*ue%|wXk%@O+%X|83YTC&?wgdRo-K{ssr-spa!GQ
zJ2^H_D>VtysOJlsWDAsavY5Qbs4EmEL$Btj??V0^)QLkvQx2IrfnjMNGUEv5?r4Mq
zoh7xJ`jP^jz#_Vhf2Y@80$5JbS>zBc3Oe^@&ZAce$oCy6j>6DiGz!!k^*$cCjc@rV
z%OBf8U2txjCz{9+AvE_ou9LQXilD!OSl(eD>f)dWsgPnURW`m&q1yC#IExP&5=!{(
zqgvq5k8GewZ^W1mO9r`p={sLv5c2yR^%kJxnksxA1Hs|yHpf^kiHvR?YDhIzrne<u
zutlyQ6B5cYi)E)Vd{jU?+5o;--O2HePiC)EPOwWR%S6VjYfq<cdk-iRWPKpm#y9?(
zM;);2o>ydiH4TD>c7u}Hn#qunLkz40gRUn-lJN-88a$K?=>&AHqM^wQA62n)kl~}+
zK#hc;+O4R!ijYn$8m-%N{s!Nt4l1uuM}TA3c0otEA}EL9qjJJzOQ^@OUBfnPXTP(F
z<6u(bRECern%#YXh1-%L)@Z0B4VB!@(nyA6(@?J!Sw?7xW<aM086HA}9T3@~X~PGk
z;rQj@Xf$Mmz%r(YJ{LUjREW>v6Sea;XaaLuCJVBSkUS1(ye+}v-rYFl$I<{eCW&DJ
zf2Im-rm+J1?tX&IGJI4t^ER1j6+aaInVEsC(yB+wu$>WdBkjwm&+kwcim=-5;Vhw^
zXP?I7Lz|Nh?bvj)IwZ%bv}Njq&BQ#JZTi#T0EWps>kFdpO9>V}i-y!?vjs1svK5DI
z$s?e`?gKJB8H0We7@rcPB`cyVi11oEyj2dJ{dt@tkykpN&HC%nsdpVgI(0nAp?R9p
z$G?Wq){|RuV-{#sCz*-i$W&&b0P-}Zn=}w`+C>rZaQQR({WxdMba)+8SwiE&r>Tl@
zR<!8kQQ@(WPfR{o_*O6~0L|=Z1MSzH23rr?OrXvr(hlffT<FY|#Bm+rx$vn*Dc3sQ
z1|(N?-9|m~djrFQ$9>0O<S0njPGF=4+5^Y7O>AdPMzJKLkXGzLov3?HVOsKYF^4rg
zsWTTJ_+$39DZpGwmX12C#JqB<A=(?_LtgX?=BOtxT0C9I)mwUgdFf@y(yOOSZ)%nb
zCYIhGERlu373qB|x%{o{f7Vm|VoqW&$R`N90vQj;?#{s5lxW*ish26?y=FjV_~(NK
zCHqs6PRmRk9(m>8$8J(5^p;yL3rRc9r{U)8)#^aGbK_xkAUi5ec!gO4BOGri$H-J7
zSKGx_frhI;^?1cQRz-9q0ScH^c}!XMoM83J_lW^R`TBD&S9!YX`I6||wQGuFYg{NH
zZN$2Q?0T5(y2L6~62&WByB-`w7e71{v;l3%Dr`s{uBj)jMy;)@Pp+$U32IML4Y5PI
z2h&DLbtWRbdQUg8)td&jf~UW4&J%gh)>31<f1DHfarDE6;(f(vC8e{dtw_-=>(g6~
zlY)A+>)1mc&#o<v)%DA$4F;gvxVDA4vK<_{9U!uOQ-2$OYx_ECC-};8#FZWX)y+VK
zojN6Wjv{>1Ys2m4&b%U<k^WEqTR*jve#X}d%H8ggK(WY?QAxLXixnBOQ$Gdt*>X?+
z5=HXnUr8aM)(iB1F-X-mr!ZyKMge*1-4z}sj}(E^bG2POb<di3PVZIJ@}4j<^jY8Q
z)<1r&;FsCnT+jXe;b;4!wfm!oUAx!4_QymHzUm*$oED!*YNTB`SW@s=+xyjy;)<&|
zSf330YP_$DV9BBFZPXs_O&&T!(8P!itqZ^P)OokiP~Y%+qZsyM*3bXwseEcTXNHyX
z(4kD6iLw>s9Me=O?J~kl*Q`Z`($&uA4t;Z0S(<lNW=8tvPm>HHk;g9fFW5dm^+<l-
zA)&QiPwdnmJ@s68nsC{I&p8=ZQTs-Qo;vv5q2yd0-UG<;?IQWw>~B5weO>8|Nj=29
zA%%f!X}`Q4HTVD4Q;#UPjSa84v?Slx6WSS4#)+a{q;w$sMz40~oP3zAp0Vuy20fnW
zHa>c1@!hNZH-3j~ffwhvQ|_$Jjeps`MXQV4j%X+=^QfEuMM%#6A(+AaB<Xa%^>*1M
zi{2xC%;L`j?$D<iFYBl4PRXuJG=BN?IcFBXvo_n6e`T`9B_MNXH@mFV)8O63jJc|P
zm?}EwKm+%lbZuRXj)iPn;Ol(&b>yg(ZccAAceNOLD%yz4yZq}xz2dtqO6CidAJ)FM
z)s(&62Vl-CC2JMDBTFt#{I>)>-)%E`jm#K&>g|>j8svuNV%b=E>~cn`vMSuY=gkMH
z;^(*JWTt!VWZz9_+_qG1SKa7nyhx+fDV#FA(W*XOVtG`3wxmy1Yqj7_?O6Bb#%V10
zNdL3wP1Q}C-+JoVwrG|+o3>`+*&n)3%9L)}S*pByYkNxj$L1Luw!E`vjIZVxWE580
zlyZef*bc;bu8cOY77N=xLKU0W-LW-7Xg0@LnOUXw*~F=B*}J;)pR?C~7z-e<*c`D4
zgMdhNBr7q00KlPB*<~o)9)f#P<Pn1fvUWI&j@NoD48FOgkOv6&u?Jv*3K;_rhh2An
zY)=}b4{Td_V{jPzV%~}^l3j(a=R~rzuIFEOMn1s>0hAXo=XQ;>rps4Y6CYk7Sg8MW
z6=miQFlT4--zHg+X-1<y!gW-%H`0zbC+dp4S>~<Q8v_Ux^VXk&iE#6|WK*=BDQ|w4
z!$-`aH)72&9WQtJm&a=n(O74P4)m`q&mDT$xo}@4qeNGvGE-bG8`XaLbxH{TvX8kz
zDOZ7rlF?V6H#M2=dcve3MsWryU{>ms$xrVVaUScdO}82{2E+dWQ2~P9>Q@Lp*ASzR
zoub)NrZ0OOyZHx1rCs_PM77sw{tcp1Fh&6UXc*+_`QIQar1EmyRUl?EOp!qI{2N65
zD0dP#ct?N!4wwmpafNHR(>8oOBt<}Di|R2+qqn+r_gN5O*a#mC9RLC_;R%jTf(ikm
zUyOH5+(W}1jQ|;M1@km8nh+D4Fk+4)_^(X}fc6d}XJmg^etG__9RzTnSu@)pFijmm
zJIxCq4M+gUWY?oEoT@nN4-den)%{Kk8<y6moL0-?Xe7wtPcV>-s$ib6<S*Xk|Grs<
z#pJfJ0{kQ70kqH?W=0@JyE;tixRQcB3am;p=*O8D3CzW@{E%tcUuOltT5SBWTw?4m
z`~Waw`^|YGfLV5d0%fryhU=I!AM)l%-F}CG(gB7?849Eg4*2p?2K3Cf4ELKQzj-te
zXj0THC_HoLm2=(EbPwRUM_n=8?E;*^IKas$nQ-QuK@J{2HUJ|JUEJVG=EefJaaK3=
zRYh0u7fw~Z>j~Kj$AViTEsV019|0Dw8f+c5fPjL%ritRNCqDiBoWX1Nge7o%7`AR0
zLGO+Ml8$!CUsHfL^npr>07p4NZ4wJ)%ol)!{u4Zs#{~P77hr0T$a{(<#s&Duvc(`^
zK}Usm#&1wN6YhO1J`D%}8$S7BV0p4hz+|1_g}E6BQ##l?<w#)WXx7b2Q}zX)tm9uL
zG;Rc*fj;ng`R!W95OSR$CL94`A&Urf*;2!@$QU;O_6t(^q?2$1D8$%IkDVF@+Q9+}
zM_B*|BR1zjXY&B|W9LR@bwqscM94e`o(cZ-G5yB$9eYIx=R4(r@NO)S87gcJS1x}a
zGJp}oys<YOZ4zGLGE!^2<|1@S`7m2rT}RBgMgH`$_?UIkbgF+gjt>L+OQZBrR5x?w
z^JD-FV#I4tdMgh@huR&jN3Z6F0u2Rv!c^<ZR4+Nf*usEdFK2-uUZ+pIq_{@L9D1w}
z6wZr@x5MIqFTn2weQovra;yiC)tJC9w;>|m6Czo>vBDOG)ye%^Wf>*scJ=}j6G0a$
z8gxzRK@@F};@!xwN8dwvcNsxqjkC$i3U@A>mS4E60MvZ)^@lN~bfc~(WvKp!l-PH`
z!VM~Lh?DX@rBH5|Z|07ui69^smbeb20mMs(e!woGKmRI;1wa7I6UP!h14)3YQKoH;
z=r>jbUI3c+i6|3ZcQyHNrhe$jj9S@AfJ%iDNNQj7!H4p%lt-rl_GbJV!srH&(Lyaq
z!sju#DOAz41q|o9Vc=`4RoP0-a%E@9LZ!qP>3w#0sWdtJTI|zXGndYJV$?Hu?!^d#
z5qE%IwCt$P5vLtX-oh;NXY9(?B6tl!Op3mljVf*`(HHw&#mM=8ffLo%*X@e@BOr6b
z6c_*pa#OwIkJY{IIIm^=;(e*7xs$s^4++4FRhSm8Tey5-e(<B4U-4}HH&@e3qkS(s
zi?V}ncx|wZ_Rsm1fBN*A)$P*QG)re$tuBwAECC4ja5d1O5bjhZX`u+)K3!sybe;7c
zi*wtc2cBtEcG|N;nnxJZ@cfy0Lo7%P%_5SCRZ&rO>Yn$<f@I0_K5>nsGjsmU51m)y
z^BNJ%8i0AR00L<EoDPg3;(2*KV&dAuAkhHi>tX;{@nZS0bihSf3}ABV`lYWA$@1pb
z1n~_6KhKj|d7ja_V^NONQ(OK6@8qRbEk3E4Ag{;f)d*+Z)e>bTRvNtI7S0mi70g_&
zbZ`tN5Ou?5iil0(_(&kY4AA99jQsBF@geJ>v7jmj3-ow*C&g=TDbBsx3VX2ZX^#WK
zcD}0*yOT|W_|CP`v0z?0!OurXbawZbS=m%*s{-NjWq$%6qvD#CWW~$HFh+SL5%B(+
zA8sCp`z#{#_vCvePuctlD7vNJfORGdHsMp12u)Q)2XMg(hXoxacul1Dg4}Gd;vd!m
zneDM9R;2QF+hcKZ%9tgu=n?SsRX_lbF*i%g#IBhadRF46U=b&lT#@eMpuxlJ0eHd?
zP|3#|-ohF^by&P8%^PLzg+gEr!1BkZ-=G9880Pz$;5`oA*LIpIk|O^Pdw>27^&da}
z|6^vD8SB`0W6i!x_L)K1%T`f#60(e?NN5&&vTtc<ER_&KLSn{PTM#M<ja`y#A!I)D
ze7)b_@A<wzKYY*m{Qmh5=G^C;`?){vkK5yVVF;+3`VcOX=DNd+5KESgG<~K6d2h@A
z1k{Bzz|XBR7D+%NtP8I|;&7{n06GA0Q&$q8iWi&xpn^2T(qzNJ4F!O*(cn%c&K)t}
zp#Il#<YZdG2Py0<6M54CP{k&^rwskIUAhqXDo2k(r&=d(hGUDifJ{QVX+xAHR;hIu
z<5~d?Bq^n7b%LEyH8)VED&{3I<WL#3KDNQG8YQBq72E_^%EjJLU<R$Cm{vRRl5c8U
zu!8JFFMWz&M{*$n;aV#UES6nblX9mKL{(B*0KJhkiYq&S8vuFI1Q5~a0g?c$@NP1!
zC;KbQ;f|ypPqL4Zl5BAO2{#1_2i)<-hQL!oyqQce`j@N>PbiPvOUhopGYl^8{y^0u
z9LNb1G)FW6TrrwlmhGU_Y8FyA|IbG>>war<Xy<r0$~Ki*$NaAB8S_P5HX&1H67I%m
zJ&_m743%OH=;>@X?|R$&5k$!e5T<|U#*OJyBw`Cs36;Xw5f##g$UA-i^3F=M^nzS!
zmXx4PHc+U`x#+7_%nDe?P5g;Ic2>9{*+=T~f)*3)QIfY3Bu3!9)oXQGL#D~vu;AB`
zlgacvlbY0aqld;Lie>m1Fbf=^k~&ZqrO(5cyraoTCZsBEQ{xv0(8m@p89MJ`>nXU|
zB)UI<8vuh!!BTr_RRFdVjP>fR*#xp|62b6f-d-XL6kwuPCK3UFC`d29t94UKW!4xf
zIy!gjL4`z+RbtH068an{n<^bEPWQHjC>ZAg0s5Gi79_0gu96TNmSxlY5zo+OAYiPj
zM$5TmO4xMS6v{IpNq<$2<hatzq=RM2>m<Hr;a(N*Fo#}tqBfhSCb-$GO}uQ)*9}ZH
z+}HxX;A81%u_1P{1k%dh5G}`zpy4jPo%#rbf-P1F0BU17@s{+=DV5DjR_uACSYhkk
z(f=klN#>^%51)wM!h3>!{mE8=og_fbKqsQ5Y@$l~bMNa`sv*1Hqd0vE@!eZ@Zpfpz
zAM8*CA!Oj;Lp_tRA+tL#BK0K3g7^>bS@^9Zi4UKXH9_ITc7Wc<Dsgyi{iFTs;Q-!b
zfD3>Ppa!H7Hjd9Tk>1>~8nCKSCn-1Zm<h6&{ttj!Tr{gm;7xq9`LUGwm)Vpu_NC1K
z22km+wsS8!CGz+H-*mud{zpLl8TdMc@tFWw^~4psd}rk7n*a+LD`|8AdeQE)PU5D6
zUQr(NWo_)oAv0}^{(k~$qx^?$1b9q|`n4rr7Dg9)Xi)_a$OaU>PQLlBbSDQJV>H-G
zX+O1zU?%|%z(k-HfY;bY;*Wy|hlZq`Zs4jI$;pB_7Rz6OWgNuVCc#bGSQiegi>B6L
zo<4h<DU+VcZX$NG+?lsmLcLCQR`~NRZIGa|g$YAIRX`@f-fyNUY=}`@E?T>8nirWB
zzh*}WM*?u#&_FB}2uDBw!{ZsF7D9uLF^LPXjwkD4AQHAPuOh@4o8&!C=dNoQ0(XE?
zk$G<o%jbq=cEmjy{3)4id))Y3X@HaMz4v_sSH@;vJ+^9;>i+9uN#8Ti`>i3_Nsfb`
z;&YqteN1x9F6OOb@~SL3YXf!P{A%X(8Z12!X*tzw$>ItSYsyYCj%-OBbbazqxb`J0
zhhJ6b*JL}5L_3;@cTA$d^Yj~yQ<Zas^4!K^@w5leT|53fd3gWoJIsa7izTm;zIFrv
zihQfzsHV0*ze?q(dM)nunhdOVc5AY_+8rQbEjry}?DnpJ*n89M!;G8iv*~yLrt^l}
zhQ-~-9zSaVyH7AbeVUp(7UKTpJ}-wiexlU<p*4@*ZTIO9Gb+LvlI8C7@BFeHt{gMs
z9`nXI?~9YZ+s&fha>*%rti*e4jWS+qu`fOMfR4eLaR2G4pY3@UUwUlbC&~umzAbs|
z7=Lfc_V~)-xp!9hwj~d9S~}AM&%@`QM{hijKY0FQ=&8Rv8L#jFoL)>4UO+W3kck&V
zPi6M-VhQzvBzPUa1h=_--+S(rm*Y_|=*2PX#kt|db>ao*{QuEYPtE;)=_SA-bi0_@
z(hDz8{D0`F;wHEhAts4gZ-yqt3-ysP@%i6+s)tXi!u+Wxb5bW*g?b<5E+3WtdHJq+
z#bF=y<+(GfGXfF|FY{+5DCzWJTDHR-&sK%+P4=D+zP{Ub-&06lT3x<ICh0*mwkAto
z_q+w|epWq?g)NT7TA@Xw^L}SJ(~b9XYd07Cl{rNe?+wF!9rFClo}^oQ_?_SIE6awQ
z4&=5=fS$h9dagg$;?y;#W#1QAzY7W1T*_efUD?kD*-t4f-Kb?bJ>*e~S@IvhcBP)x
zGxM5H=C#`~tRCl}<^r!=GdXMQJ>71#`uor1Rxbpo`3LX$>EBwoCh;odR9a|%YnVhD
zX4pS+c`^J_szIv($|URNM%%4R%h4v+V?Qr%x#vbK>)Dz>+Zz2MzFqH(f!<|&tvKv!
zwZU%KW$@$IJ@37?B(>CJwE%irzpvFY_C{BS(<R<}{^X2HOKB$oXFq52hmu{Fu~$#^
z=9&a%djuBxx9<PSGmZOESQc24>HD&3wq!W4bT+VTBao5ACvgUqO9WM@1yz~^Rh<ud
z>=E=NH0WtUP<3X|Glrg8A5_~FR5u*-oS~;~1T~xlHFDngfAv%h<Squ9g@HZ7ur^@W
zx-sk{7>@54&fgd=ItI=a&W#A?`M>F@i15(WMC-w%;FxgHyBQ1twWu1*aAFYqTl$ts
zMT1+S>f2R%$(k-eWy_>s6hST(ukVuR?2@RvxrJf?sEv5JV$c<h2z9~q=+!Mb6d~Ah
zn{G7upMWZ|pW=hrMm4f%uHaA8BMiQ$p%1p4iwSarprS#7f(uYhFHt8tLYTf~T^(sY
zl4j_M*Tk@#TVc67x`Xh<pWjRgZp3TSSTqH9&3{LgkeCq-iDsmzyO>?8>rq8Qf7~}g
zh=!<#&=iJ%T8zEvIsl7;LgF!LF?uZ58Pw>06l+$B(o<%gRJ_k-ilyF7M9QwO3m#1d
zpZgO2a5dZ^1{USAM;s)`>Fr@KK*V=u#BYe#qs<s-Vla*IOVYgUZz+$4hfYRbX^SAP
zCdwV)i!763zoeZXB#1z6>gXlM4uX(E`>?wy&ZAL`YT9l14q_$pE;NO%ut^B^iXbXL
z5L}QVOoY^aig$IQGdYGKpk7f(_N`6~R$#djlM+0-r%Pf^ASJ0?j?RMI&XK>JCw~Ay
zFw1)aucJW9fZKNTE&Uis(Ls{jCg>_4!nO@&x}Org8D7DaXhmnf+jh(7%brhlqE&Ya
zW*_p59$xb*7V$lXxbnN~QIx~z-s9-BXi}1;-fj{0mcyf6eN1wR3o~jT()ozsczHWm
zBUYIPsYN8_4;(TC)azW3dQW@;CQA9>j+|f|LO!lS{mw~YRJrHAa#o6)UZPPk2$`Db
z`zXaHY};w&PDyIYwdjben~+!psCa)XqVX_xbthy$#lZznf9!dj5c6-+6aRI8YwFeU
z$@y)oEPU|jj{a!GH3UJ43mky_6V(7S{<0_62Dv*Li&_D0tgzJHh1Ctj&v5<4d`Z~&
zeezrWWd8Ckqyl95@}5;gqGvHEjK1~bDGal}#c)>rSB{Dx(Cf#es%i7Ty~^bJj_+T=
z4}E_lXLHDS0v|viuK-~pMyp%@5A;;)sEpn!o>GqHirr`C%7lo=>A6w1L#aH1hwtPy
zFPQ55(~GrjYn(HC{;yMw>9x6vYh}dB*#BKmy_{}+jedZ69I^HG6E5h5P*GKBfVhXB
zmOVONqB;KW;jpLMUH^ZNBcKjG$h$;if|}mJ|5s1d-I(r(&N`k?DO9z+y$nuYRB=<f
zYE_zAa{EH_`<2e8P7R^|4EENiUPU&P+4<z7iZ40TCq8+8x|Zg2Gwk<?@$td-%6LQA
z-NonuYp1k`TpiXs`!GGp|E;I87C%aG;22MH^i<H3O5(o~Bb6*1H0h`tiTxv$>h)nu
zIFUzRb0k@@rcL^uYRAERRH@5NXa+-1mC4j!YxA}Kollj?{{QHyvbk1D?Xr1x27hJq
z9jx``3NBu`{n-8A<_<UVSpmIe3B5l-_-J({eV4OX=0Td=|I$;HIGW7$ApFhdSedP6
zbJ>$rY3?&|B@-+nlHS0wYclsgvRM8e6_T&Yu{QXT!*9IE<^QN4KVAETL^-Sf4`UEe
zF2TGupiz8NX{<t$d5rt<i?;^K&xN;nnFUW)7kbYQ#Bt9WSH<U~@NZ>&w34&YlluJP
zBwriSfLt3-<1dJFSVQAjc!rH%V+er~C+`{Q(vys>v$B_>Dn>L<?uU;E-8TPdWkN95
zWVu}7QXcyJ-{Fxu`SsZ*@R{i4u?u{Wqw|T^hK9L^%KBX?XVtiU-!iNEdKIue0{Py{
zHg}846)8XIB|L4nai%v7^0em@_*Ab5Td<YE-tZ3dq{tfDl8uj!wMTEoUxxYbyEL0i
zKEvePXhL2w>OaeUC+VD0q{>z%Lj3I37J5Ks-dXM>|CsZwuTWwmqF99Qqa@@56HUtI
z80anc*jPko_V&*=(Y9{pbLLZ2l{pLfq@%px#tRl7R)zxjX0432C0hPiw3D_LCVYG^
zp8tBuR$`;}sr%v2g|CfbR&%d6-x&OS{>o$C^bdO|haiV~4%a!nY3ZFuD+YNMqK6na
zSR#Tqv0o|tsz55QN6~Yw#CETaUJdS>5u?MO3!NO~U%Qld{G7XoOz0+BFo~;PD#s1a
z*#tb%`(1N(ug`S9kzS|yrPakartyc=eJv54*2J^md%iY}v*>y6m$$uTLkTv#f29>D
zFjLlOHP~khk~R;UzrC!;`ddqr)vVJFjftm>q*$G*d-$6glhop**nJhK!ejsGsZyMg
z)l~8A#uO8<6_U{yjT<zR*zg+AAD-g~3m}M`mp!MEI%ggfU?yr~TVXgYl_j-7wL$);
zrwSFv4=#w=CHkn?Z^6z2fN+e0nNSNLNnfHoGjaki&;w7_%4g!dGifHuRGy0V@W~Di
zUO>!kp402k$-HUQBfh_Cf%X9MzaS^^y$t7!rkQ1w9m^_M;klw?2qJCvGNN;E76p_R
zJ0_q~nr`Afq~I8yceQuGB!kC1Zjvf)9p$4j*4FP_h%2zi$jLe2tU?+q^UC8+>0DOG
za-8?Mk5wQDNV+B)_i71HsvjFgJP_9^$q}KnoYH+c^x;A;{y(Tyuu^g4_Q{Qs-qb$1
z>A|-eb&(G~)Qu`UOJmg);AOoA=#`uL!4WgoT+aEJ$7C3N-$lWP%UchK<j19ZIWLF}
z_kJ{)F2C=^9>vu+0X)Nh_%Wra<?)%d0sT~5`i)_3P7#jeGmBfYaWRZ@Czc?_bqMnz
zni18El^l6{$GzfwxFT8tRjMhOF-^}98^x;^%CTcMG*eM!J0%xtO=<10bLJgdjqdsu
zz2UJ(&olc;s(kev=ZmqI^)J0GG}M?<e3hgHJeEXFTF@VTdggd2dMWO_wUe*G0{nM0
zs=Y_hpEfBv4SmxfrRuFueG#qArzsFkz8BW0gHP3p3<lMQ3EIVC_OvWsHQ1qvE65G_
zFdf?Oc0(a+ba{(sLL(%Y@XhshuTKM(%xoCLYwyIm!<%FzD|Ic<%FW)l{Goe}A?C#u
zJ(BdRo`3Z&Gu&*!2|c21;TEScIU_z2Xtr+|OHtwIcZ#Omf^BgBvtNIDpyH$%%l<39
zb1TibLb{!1ylJ+jIjfQXN_UUcZ>z54Oz!}-X$fD8{iftS7DVk4G=M1Wrl$X-OAA@Q
z8l{FPdEe(rSrkjh;-%q+4<~@YEHM@hhrz>14FzDkqQQW?SFneG#WN9AI9@VHrVWir
z>YK8cQ!`>0iUa$;ejummK8?<>>HYXB@3B1+Pq7Gs3tOvhZUpyV^uO(v_x=S1qL%&)
z`hk(Yo=O5rP7|fV6de1nUCK4G$7F|~diW%mAhHwOLJi`wqAi2{77T7P%DyCC^+BD9
zxn*vQ^ObP~nwbwH#gl-_J|#p<yH}1$lX|!JP8l~~cZk0KDYN)Yy#Orpswumwo9SDV
zuPF@{z~D*tqmffgEWD;u>G6JOF^D(NBoSWhFbcG*p}s{s;zC%@$<pDop=p;*9n%`i
zW%*}Yduq&k`hT7P6_HItLYd*-ALr*kOY4JJP2jvS7yx;GGTCAmkXAG)Gg!TvQhlT6
zz7yM7F;&YU6)(xWgw>mf7kWdg!A<uC;;_7OLkAYKn=D<}a(*ezvut_*jBg%T3{i})
znA1!mw1L=9+R$DJlqAdD1&Nfwya3x6E*IP#nAAs$XBT)<qX<>^Pqk0m32pF%1kBB=
z<)n1^;up+G2a>=q9RXDAwZa4MKJ)N4>xf@GCO@}i#f0wI%+kVhJO9b_eYP3001^tC
zr)3WSgd0aW%y-!(bpHww1gRH$%ES6^e1)HFKi14RYi>GwLO(bwDKN+0&?&={GiZVA
z54n}#T(OfgYHMWhBGurw-w)}J8&;$;)TibXiI&l?S&j~z4q&|K(qPhQ7K%hv##N_o
zt_1A1H(Tio3EA0E{G$s^9O%?Jj`rR|i(V<HMrU~*vA9Q=?>?6?c7ffMJfLd6!5zIS
zb)5d$Oj<7|DdXpyz;*ID0lpBPJAjJJkMuzeu^uTE@Tp!ZT93*QP*weAvpT6_>pg~~
z)I|=wDnmfEXIAAit9YNt5KwuIh{$470gS2IFOV!2L6++gb?LE)q6y2oO4}lYHfJmq
zdbsn^{{g7gM1!a?6(NG0Ev`I?CQPKLu2V%*>1N!wat)wB-l*^B!5NEUQ*Mbl&QLS1
zJ;ERp!J?WfY>OL^D(5L<nl1;+1E}nHCP5L95EiE?1~zd43bkN|o|zqa6D-!<znAv@
zC!jhLB*_FxmmWChIf+rzZ!Ro;mRzqW)`u#1UUSoWb5qd(+Mj@{x{|bsbv&ZcLiczY
z9qc2&O%<x@(KJVww0T%2Qs`-k>p2yQ71GES%GgWvQxcB9&XiF&(3WNQ^P?L3fkfi&
zA$RA+jw_JwaR@!C*ru%|8CNFW8+<=ekBF53n9X>9M^{r}olF{WSc7R(Hezw_5C}rX
zDiW~<sZ>=A)`Ey;YXR_T&~eCB3IvN&#E?xeWWHV*UcL$|XNK=au*4AfF=o1`E3(<5
zB7SB{6KFj>kijAW;ld=cNcnRN6p=&>H)bF*a8HQ6I_Y2yB1)R%2JHc8_@Si_%%q`A
zx&T7+MXF7#xmDRBb%qRu;w3B}TG4=F`H5Qp1&^3`-!u4A3Y3UGl3U_<4|JNR>X!g{
zTNW8pEV}RU+E(6tCUQ=k*Bm4sBT3#i5@7a;?|Rm92A8f`XZTshNjj7<(Qb;#$1&Vf
zf&-8MSGmdt?NN=x>iw9Lcw(N*%zVa@WVZ<#RV|ZIGu5}W<TLNRKHBpK!&H?dO*tT_
zW;2H8>C3Nz{dM&yjFB`!w^L6vN-fMQk!_DH20a2Y{R0im>JO+|vDWQ+X8MEvjbQxJ
z2PVz6Q%}UqbfbEu^eSiO@B;if5lW`Q)&9m)M5LeZ=f4DAiC%^|3%#<UTkL!K03;tZ
zW|9E@!YpQdNQG=ZG=NIUvb$OD60Rim8k*0)eq+Y>9(0D!+NlcYQ&?*8o+5b+JoO%}
z=XI8kL~Tt33oAawYdwu*rI5?rx%_a7yH&`R9*8VHT9|O*kU%&DP0gTeLdC4B-7P2F
z`G&>x00eylQQ1|Tvl1aXQ_QFY?-0I}erR@2A~8)OQ8Ir?H-n5G{C=-r0k5=**QKvq
zEy0WVfP@5Qp(0dB)wv<>N=4GN=pn(2bJ^X6=Htxflg_;$4ptpC)d%B|=4jpbPv*>-
zG;bw+{7Y5ag$2rff7l<W8AnlHeD=8Xl%;HS&RY;6A#r^su<QhAP-R*%S@E><s^*jX
zNOsb<<0qAzG@x{1cq~|LHRnlCkS-dnflY)9l{nwZ)jg#0HPTG5zFb(MbzzN8N2Nu^
z(=RVpplyV%YZP4<;GMU<hR&vZgFmF5d!#g^&#>cp^?XAldWD=#%Q(&SiUaG#6fFJL
zo<u0g#;;ja6Ojs3>Pxby^RuCl8v+<IJgC|tK>5|ITQnX79q!GHc#IUHQ(-Zs_j;7%
zi4=5;DHoCaHvDntSZ!v#bCv{H!;*-c?%}Y!mOcNo<x=g-SS3phbbUmRt}RY7!_9FG
z4VUQkXf<VXex|4=S~%wAqW{!tdd4QZ+G6sdRe-Dr33u^5ZepmnNVmcwBk)04pm{Gr
zyPEw8*tBuctc~)Fc<aeS33Fn<8DHEvql_VRwe%B%I*FS~t!hC))#pPKR811jM5otu
z(4$fUTy?6lDm_FKlMHmsvfljSpC)Dkm#ZsS+nb}d)i5?c26t+f-?0|dvxYA2dA~IF
z<*(WQ+&3xNc7irA!-XUQFEI<*D52_>h*U9cr)92)o9i3VYmw$Rc1pqDlFhj=c!S<b
zB;OpANlfC9Aa_vJF44PM7<#_`#_P9WR+_gwrB**#1`_q?&HRn%k|6IX1<0ma|7<-{
zZ=9St3JEqtVwq$W>Y}w&tP?|f&j<I3e1*S6od%e((afYVDCKG@MDL+N+oeK0zh+CR
zHHp~T)2kN?HgWsmQh42#L=_{Qvf`7seotj8wJ$yd4VOGavuE@a|1ch86LiL#Oay+M
zw?^t{jP0cj-=}D_mYrlK{*eHy6<RZMRhqbbkans6B$0U9R_Su*{Rd@@U-t-~*i9uZ
zuW;rH>5>2t3~>LDpnt0p*{BSW?YaGy$`MEA_(|W4>RN*}J~bkv*fIb{?Df2&^>U3Q
z+i69SIEq3{A|hM#l-oO@x^#4_waI&m-~{K&IpxYSm9!5%kPLvVkz314GK^L$!PrX)
zL`@7CW=TLcZb4;x)?)*H^@C+I0IVdT&N4N~G(Z;h@J*&0*W?yQ>bfXnTUOGNDZ0)G
z(PyoN2Voc@HJKy$qs%M0G&_ne2G}<|Eu7dSl#va`palGILys%PcQgwVu#{8$n(Gv9
zfT>MYm<`S4G);^$6*gZFrdK46vzGEsgLJ~|Ef>wko+mOdfpp|+MJmA%oV^_hx*Csu
z*l!NcNv!xG35gkUZ|XIGFjGI#L4ragi}&kAw<6EGOkRFghpaYJd(e|S+iXI0M`q0U
z=Wtu?5=?&f!sC1W3(9SNfwEl1tp=$xK960u-Nhmh5>4fz66WlzJ$%j}y;S1hm|5>L
zg267R>A9axnYTzpxt+pysW_&Qs@XMhbAV}$cE&f0PBW!d#^vmFwarsMGq%LUZaO&k
zIE>%|f#+T`_cQ_fgvlrYA^_FZZ-hE6v(}%Z$;6snR~VEkQhteZ79{|nax|{Jos;8T
zy{7C{s`O2+@I;fh1!&Btk`cQCAMs63-&P@EHOX?2!6iEd8EsCGN|`iLNY>PJ%5b;N
zqL&Kfy1wR0kvi_-ai&MQRGK662~U54O|XA%?1Ih&w1(6z_(O(N-`65Fa90rEeCt5v
z!S854d3JU&jXENH@g<V4*{%$G{u)K)cp-P#&5r%)Bq#MouD@>Yby<zIvY5nnaq|~Z
z_{z`MgRZ~2#oNcjeTw?z&sjuoe?)+?TQFZmvBvLKi-SE)g!zzFom^d$opVh9JE(l^
z8FF{6LBc!=8PdLL##iOB=!*Uj`U;0QxE{!auIN=I15BVmh~&~B&-#9Hm~w!+$s#6p
zr_~?>6|@d&YL8YXzluZb3s(KoP*5HJOqe&Y@n6Zb$mo%pc*g_PyD6xLUtyr9V8dr%
zlWDToBc?k&bgUY+N#))(<-26%3kMcZ%Dda<0wgkY+BEeDB=jDrR2$JZmB^;f#J=+$
zBKZELm*!n{rhaU{pdLkOV#ROzAhTPaNYJ$+i<s=1u`T{FZ7?t6N;19^SsYwa-z)#F
zU%#B%&OZl!dky!hV?dgOmc&pVv)CEh9-?hK9v=}NI~hE=e)z;Q_Ni0slUHVs@5EN$
z?Wlg(fi$9O6Jwth8PvRvt&Kc<nsxY?YVfqypf<AO`InBm0fT3Bg9eb{;{}7~gxH3k
zhc6(npUA&{!S=eE_o#lQqsit@v$|mu+npEpVhyVgwfzihx(%9d7&hOz(}FyzxqGLr
z^62H&qZUDio_eQ)>nlN^QKTr0VCH0DQWZYy2Iv;VBZ~puo>&HXDg{1fuEryU800BP
zScstl5GZ*J@)SpDASelSc7u$%x#B1gqaNkBp8cb4h|z%P@c`tw=S&<K8P|IuuFo@$
zeBEe>w{s}Ps9Qbmeb#aRc;~>kW9F((s#zS_#;6a{+2`9i%w{yQb2Rk5^TWI2;b^1r
zBcsuV&e0vikKIONH#)~`{!yIb2W^ZP@pmNoctSL8=&JExtx<OaRl6nb<IbJ0GR9Nt
z#uL%;9~$CEsc$~77=3yA?`vh;q`dLhhyT8OdGn>Ylh*u?xy|@H<am0;Xx{9EEBs=4
z10CF*M;5OFab{yz7ElKE_?0^*a#hsTJTiY3Rh*chilY7qJK-mq=%k*kh9#`rO;~-D
z@FUBFvkh%fg<_=vq^k&gH0+iQ+5n5+5=AOtPPUIsq*aid2S6Q5`sQogt{GuloxUkZ
z-;(d%J=48=WU|SI+)_twhaq<iySL1`cb&TbJO%Bkckc~!?=PSZQ;<jdC%++g_d#Gz
zoZ}ddM*;5KLC~A7GHV$XY)MKTYj=fyprO+pIeFfv+Rssv6&-`!Trl1}NfJ`ld_OiT
z8q)YLB=n-guc33#jE9S*Zj;^?adDj^25w3AKQIYzWEXLy4dxo(n3oJMpgVTdUJkFS
zY$-5T4e)BHdJPh|qS_ce=Far<=JU_b-Mc;7Xk1|)Z|?lv`*S3S@uCo5g1T`+;XZx$
zgwNbM7K-p2%2T}D>NXi_@Zq6;^xpp;J+*Xd<J!#Y+xvT}#U-!4|1UjNf8qMe(En3U
z?U){FkKRvkEh~)tK2&t(uEd+}rLPP<HSBYJGN<4BXRTMZfI1_~YWXv91NCeMm`an$
zTb5`kp4qDmJ=OJ_+8d~x?1db!Q=M=s`)NKEZHV#l=4rrCn@kd0leH=f^UPpa_le%s
zaC0#=Nf}*wu9y<ISL~+WCaae2e|l<?Sni<o&KhPwwqTJR<vI53TEBewDmJmsk{u5Y
zfTxuc_=vXL$bZAqbDWU}I~SVyOLgR#Io3p*-$%uTD?{bS6=j)u>Q_&dh7L;;z~BbJ
z{4n3JHBKLC1u#vQER5qD`;<ZC)6&`gtEOjtdM1CInw`Nn!NL@^kSU}_epXdGCbfVU
zsu!|JH+2I?o(+g=N3mW~)Zgi2Tko95`-gt`)El*JG$CfLMxJBkfL`2V_2RC&>FO$;
zbZN@|<;*Q@G5ji@8$~+JCnuuA*Mcp&$GvFA4!I;Sy9Q{fB`B}`OwLs{81=g7dHTka
zY`P@TF6BzVCE1rqk26kA+FtScLS*I8z8Av(p446F55=yM->bncee~q<vAn*J$(<p1
zO-?HK)r^ny-}Br-E@cmv5kn~LC1NS4u@E?}IgrTYODno)691zqn-i)kG$}EJGN04=
zclz^(CqpqJ)?)EnePU`q+2-+~PmaGX;O~q7^@%k4{2&B!xxRheI+=2#EO>iOUhq0?
z_F-7bx4)vB<Zlw4t*7(}%XkB;HZrk-t%JsCud`a?Wv_-=sC9RDi|IEchYm)(uho&a
zx8Bx)^jBG25||4_e^yV*ktv+V=fS$gU%xski^{~jReZ|hux%|zwC?$#TD*13v+Oo~
zs7$dp5%Bm?m-6&;&kva4!R!m?JjH$=;!*lt4VNOTM#*18EBZ&&cm`?Xal1GgFQ1cB
z%+iYg)sQD6JD{`KaVqKVkMN`xlsgx0?4$cmVhdDfv<I;Sm+%1QWO=?1IkPf~Hxime
za|xWgG!A+P{a%3LtvDB7ZdD%eo+AILrBPdLnw?!=hWe4u)MwOw3U=E?G+=a&ke}=2
zp`^)mRV?fbcJv(l!K8Vokqk<fL{J`dIIHZDBPO>#CvahvjiXmy%8gIv1}O?D&+<c}
zV0A{biE{sZR0ZOC{(_hcsFiIJo9;5<%l}gE9FnJAv>_%b;lyQd%yPsc>X@6Zx-lo}
zrf?xAr|N;Y_zMdg|1IE!*!%|_A2a-mVfp2JOA1!5)=p(S1**G#O0Hk6FF$F@dla{%
z68QD4%V(aVcG)GRn-8pqceV0g>0HYsX{uXH%0Yi+`@t>Bnd4M=OMU`HVcRiQ##30a
zflgrLEk8}apuC3$+y3+92UX!L<-{3hOYCPfOf1of__OZvT^g(++=Ep5+j&gyMOsE*
zymCq64-5JAOT`JBzFLQ)1AgW&5{<xo6(voTrxj!0@0AXkc}g+qXFD+a`Dv#M-ON6x
zzvhtb!DlY}Yt=$k#3V=8^6@FT6ppEs<{Xd5Rf7S61&-<C1($N3%rz_8#?zIYGS$>_
zxc}JbjW&X1dHmTgK@<Iy9MXoS32Zh8NsfPjS)xLL5|P<5eCqag=~o<|>O7y+6*f;(
zC@HASv{%-d?2vrb%2gl8A>jUVsO)vJdPBs_4fpRmmxFv98va_b*?x~b`=<V7!&l8<
zF9PfRzSfs7VxyAW%P1GSs(fJOr;EHZH9rlmg39w=^z&3~a*p(vK~?prCdoQkMj77R
zY#~0oO1D2ZOB2$`V@`fgo!IV(kF&g)k--c}x%GGqv@N6RBmNA!t?*nn_*l9j_gvX|
z{hY<?=&E`NadgVE+RxXtH$4Weucv9TjG=wI`qS_3c*OTdzxnlYQPYm*N`J#n5O9D#
zzhQObN+-K7ymd50SLsFS#e+(rucWh*w<uZG|6PrZS|DqJI67T~s3Int($Y9ekCzWD
zWb?P^74IrbzJ-hi=%cVex3hlWKfoVv?A+BhS^eTBUY+60&J3aYB0zs%>79xQ$vE~E
zVf(6P^TaMMC+?Dgc~17H@`&t$xKh>egSWrlY2EA!wv!U<>Ao%8&ok<k6f5?m<@R4@
zkvh#(XH+p;3yE3e*a4=jQo)-u2zeMimtuH*0Uo_KK>BFEY8VaVpjP+3V;|3Ya;v9V
z!#)K`qrhxNKO_FpdR4U&S%62>-k9-k+ZB*6B2GHb7xmuNk}4m)wx(}=x|H#!ZXizd
z>Z_5?_Dp5n+wM0S09Pleg)hruLmqmjs86<^SB6dfon~}zzl;_BYzq7*7Ho0!X}rEQ
z|LV@K%R6U2oX{*TJ%7PEBXDXs<^feQ0S9}bJB6_Qwd4G5E(0A&MYJ~7ARWtB??O6x
zjxjaJTj)S4$&AdLv}&S9<6^wt5W`EpM1mdepYd8SJx(<R|I4|j$=(oiVdkpgdhWX0
z<?<&VGVh1qiCfs}5L-4a&<_sSSoqs<oUVU;FC;cJk_0hcHis0BgsH7(sd2vfpm;cv
zrM4UT#edDNNLQbf;Q7sO<_FPEJK!HFw72&g!ne9tU9B4P#egtEFK9gL!E(PSdEqfF
z=9wW?#vwC@cX}@QYadVB=wNCq3DUm_k&gweDblEXs$HXk%h~rMMtitAp3|74<&`mr
z(u#U$jeZb%<72fP>I$S|^_OYvIAhlRmcyHOt|M(@Bd7KRi{qPa{EnSAbKfU5gcfW6
zjhzJD-EZIc_v>2T(W1@6gOcO;wXE~wRZ1@<fD*sHauB^ci`h8(VjzO&)uKDpDI592
zM-?AOqT}_L#J{?j(l~fi<%A}iV>OsPW=DSn1uO6ec(Y4Zk7QUb(ULEgT{s9{uk<s&
zU@9wKLQ$*nV)|Ial*9^@+XN~!0&9N)5u>LkO+osNAn~6ddWzC%a}3Z1{z9xgx2|W(
zv9eeiKILNn<-7*y@+eEld*&e~miuAa{`SD;U#pov4yBcNmcukNahsXmAD3xtZC>2R
zbAlCEwqy$IP(^Ut6fyOC13JulRL(X&f-t~+0NQD8OVuuC)~cZ4O<tm*OhWl+u3gDY
z-9?FhlEmcTeOf?t#nZR9Fj-*bxLfCS(udUQB_D!wI`K+2&LHk1UvA;8bm$iMHH-(J
z15?rn4~M3Xv;(gq_dP}j(~+>On=R%R0x{&~(GKT1%Uunu;&WKwQ?%#L;}BLOb+^@s
zx%~Vfz2Mje7uuO~<O$JS9D%itG^@-#NGBkOa4ot}8V<lMu>X#w#!I~7+7PK%ZL?bB
zg=KxCgQy)r^!KWOqNZ50CJVY!?9G<wa|Q8%7dlg0V#3_Q^}%m80L<uxhKx1Qg>Z2s
zLE^i^m(6hT-7TF%O*mRzFxuhSu@{W*mxk#*Y2`6#bsiaQM;X;z&2zX9j><C<GKg86
ztj(D0g<M%fZ+0)0nJbx+s*358cm#D`*piI!9834n(&?%Y2--ds&Xd<;aSBP0kB^WF
zca*>0Bp<S^@crXZP<k8u<BAEFLSC*yV6Gx=n?*CQ4P~YjmZ7AK!4(F+Yy-%0_{xks
zs(#6p7WL&U^r9X3BdRH;-~~<yfgs{LOdrLnAC0Ngc{uv9FIzX&M=2T~nKU=%G&maE
z-5ix~+BI5|_fKR{jXyMNm9^xZw3nAM)p)f7t+gJ6X)BLwUxn+O<~8Yfp+ot|J?{N}
zRSDJOsQgDsXD&@!HS%=rAdmYF2HU6R*9;nP%q@A_ySFS34*nFx5K!l!nE*ksnb;Mq
zhCdTax(ts2PV;D9VnZGNq=u(M8xE)!TgI|!sNw~1Y*UgF*2?gH0Iz?)rj66n>Q$wB
z8mCIF=$RbJmAs$3izeI_oe|B<KgN+;+9+l|E!cz!NB$Z-zjBq7ySBp_<PCnft@YQ*
zRM;80&ue-#ZlV|kRMpY@EnPup$r>rV{-MrG;$WGFL{p<n8?ec!-z6ZL#??3Ges2Of
zA}AW%YitQ~5<Me`ZAt!vIdN33z-->NdF?ZXN+`Y@PV*M4$n!jv6X>FQ*5%IDm&dJm
zbHwU)t!vo^6fkDECY#zQoAxMMPi}#vyv$vxTG`NOPD(lLoZjXfFVIYQ77MEyN7zcS
z>ET-Un0TJh*jp(Go;eN`wEEsIJ6Ou$6&g+kIHZ6q{s1{-LnY30eyU4nYYkG*<ug&2
zv`u+#YpnhJ{2$XL>x&5Oi#7#a!L&xNKiXISXf6d^`u@>wWl&}-EP5BM0c&(WWP$^j
z)csr3v2$P^3SZSYAKeQe)FjExa}nCeB-Bem)JSnBN~-4<xIW%tIfsJpVy~*6w)n@y
zq2VpGd}{VBZsc<v@9YPJ`AsXUf=j>oJ$Ej8?iY9-@$cUHld+5@!}D-GQZ1ZtH=j8k
zs2Nm}g79g9G?DoRKOwHnfq2mFn>|8rKOsc+yeT)YyrNvVyWqG3<Pebho!|}c%3|BZ
zivlChZs9#d$36ai@(&ZZ9(n0{^eqU}=QIH(H6*m9ALXIXJi$r;!7mC|H8anW`J}nj
z^BHUBML+iT-H{Ib=N<TOj^%_)?A+%w)|V{gIK_M4B8YSFZ9L=8Q@dX1UYvh@;Zo>I
zVd&4oOYwzi^jJ;S;FjCl3>5<IR*h!MyrmI~<((*JuG(QAmYjg|FCJ5P-u?;N>cMae
zy1fwyzGD{r@#6XCWH+EU+X9oik~iOWPskVM&|jBsUM{+M^~+5hXBc5HEa?+rnZjC#
zl{<4*v<EBB=_|mP{ggx-Y)Q4A$A<qQF?*4ib%%xYXy7UeA|V>gGZ%p@)YE<S%=AVm
zL!_MoaBQF#71X(WZg~{s`+Ew;k6(`e5`B~L1s%~F)<rvOoC>Q%Md?2l<|1IWr0-_^
zQJ=uI+Twh(79@x?3C>CNbK9Y#l+B=B2}erY_g4R}MR?^&y!s@1X5X|Y=nPmp`hf!M
z!)HtS9ur(LP45Z{S`1)T;@98y=Jaq$Wb+mBD!%0qjn@=PiF8Scjxj&o*NUkPkdYBA
zluUk*iYT#`P5~o&0Q|XT;*F<e<7IB%E>5qVOn>e|kYDUmlR<<E(iW@5h>Ujoq-G|?
z=$@H>MX~>rgY<8c_rD9pH@leHa;T>>Im=Ml<3FVZNF@+*G}{;&wiiB*Ae3l!|3>ot
zIhP#42RY%FGRMspr3Zy0<^*p^Y0aZEE`(%CMqK+RmCE7EKKSa4y%c-)pX`xWIZmzx
zm-Rgn`o;?CqK=ep={C*P{K6$@ZA;B}0Z?sMmO%OrL1uw>Z$DqIxFAdTLEc|2cUMz-
z0!6qDry)-DdQQ&b4}4i62@jgoXp(|6_|s%Gf(1u*#5qZU5Vmc_78f6Uc~JW8E6W3Y
z(|M_wjW3$H_77K55!g#Ge$YG+9ks$lmtfVJlwvQ_F6I84JmXp}SW>PIE0ZzLM=Y@0
z-p*Vu=TT@%9p8jEIgt<`_}BsIi(a{CNtI1UDWb#BpgeiS8+K5r$wwg-{SaT>brbaE
z-j?KQlj2`47iyC%5v;sxcBRU$r25{K2M#5M&L!#znp!R1T#_|nK&cAR$|!^kKX~q0
zl1M1e*Xq|(wa<i}$yM@ZdUN-9!_8lbotuO63?mlx;RaF&18@EaDL8Rdm|ml#KABoy
zo+AnfsbTU>czNXviqXTr(s=)GE$`JAloIoI3nyJ(?7%s}SqiHL`ed7_HdS75qnx*n
z22b#YW$-2JR5T+ETi#Jv)1~+g4jYF+F8l2-9d5sfcHv;yrxWDdQ<T<cURnRyr!>*V
z|FKW~@1#%-w1_lu1=|q~sgQr(FcpPl!}9fGDb`EQbC$0=8m{t<(gc$a^8WRRzm;s|
zbvZ9cXey#TefQd_ZL00lK8&HCMv!wSP+ewTSq#+?40!b%%C~zJFl(5SBdT>y4X&0Y
zu;x|EqKXK{y)2kQI6KcwHL%0%&&p7^CN~6YTs2~f-t6N==~`Db7sFt~M^weWH_XR3
z7w&ZZyxP5WHEUNCkp3-Q3)Ka3>r*c#BdBEVxUp>}>6LQ9KP=^vZavMS>KVkR9|7fW
zr5c%J7&&p-_Bq4f83L?p;u{%nL36_!<wCZ<#OD<x49e?lI78me!EK4^2a~L;e|sI`
zsv^a@mL7KPTXJ|9b%z}b*Q|>Ai480f@zK+ov2G(hIJOE&!7f@%TM^ro+mO7`h?1DP
zY$s0}mTehJeRp*+K}yVP{hh@t%S!CHw~FADBr8Tl{J@*taZacLivZ5C9b?_f3^i8s
zhrYWxIf{*5Eb9B|mbD=U@DjUs9LH9(%5@y~1@z_xy_=x=uvC?cDzT2fKOo6v#ID{?
z6WT@hJe!&NC)K+nElTtfOqgS96DD&?iS4$jAIzx+ihsFh{w1$8^v+Bl!Fc4)H>R2Z
z;NqR`rTBQ}Qca>e?aa0Y-=+IIIDsw_2RvvvqCAh=V~#sr)VVJ6ZvL;)IdTX^prS-$
zS*kYoU?xd+_MdU+kD1{uqyE3{fVeqfzs~PgCYeRXxji!JzbP*dDXgq(Y(#Qsu*pP3
z*YoF+nVsz~r#d9G5*9wqsJBVA<Z3Sx{1&}EuG^h_aY&f_8{hRi4iM_L<|#<~$}CuB
zR59w!4jd=%v8xZxuJ1_0Mcl&@aL1!qQ7scex?YzCOT+3TiM55!pDU%qKiwxAEW2e;
z-TY)G0Dy^)wsh1Lf6e3f4SyQsL_@740718?DBJp1u=WBv3HqMC`x+?e)&0j1!bcy`
z?hfrPbN7*wmGPu;Q^N{ox5q&{4tG7z(9;c&Bg%lu{nrAv-}io9`txO}@}9n!TZvz{
z7i>6YPrho8fbb0eo*so<QYMWoJ!E1O49o9^rXbx?DJ~D`n#Y{cec%87EjtRkbXc2u
z*w6(WEC=pBeDw<X@Al^-%43AW)G=>mLP0p4spk<H2WAs7O4XR7un7+8{~vm4|9vsT
z*kgvC+9%J@gP}N{$8?dDATR)v&9fvBp{AUDlssMz1OUzdx1MT#&)TnA<A3R?@vNt7
zCZ0LhUU{?TJdvxu-x&LkRkv>P1&gqV@jcz=Q!j%Nxhk+%e&9m2g~BKlFZM&K;holh
zY<i8fZp$GNlg|87>D~-cLl)71A>u&3^3~ShTaC*fh=yUZijpk>0A81EK2;H*J_w*?
z=?9-`UjN#{EZCJHs>~PHe&@))F6@1-W%oT%q(`gwuch}74exRqckJGKm2(wYojUdB
z*K}Ujy(Zbq`&)}t|FTSzH-~@Lzcn{_m~<WgZF{cj+Vgz>#rfSMU*q2%SRkjR7mg(Y
z{OInRKlDm3LgB}zME)IG{|CXFsq<dRc1$r|DG~`#pVU&h>N(#>y^cQV$>L4sqQ^Ad
z{zRo=7kG;FY^raj!A1agnvTe_oiLI!kRKVM5}u0OUo`t_><0f^dEe-~)wP04^(!*@
z-ike>LJ!^3S^PGmTDH3R*LYJ+w*1WQJpl5X+30(|m0v2jHJf(5EYV%#`lAHLnD0W*
z?32&);d-0zA$_5}BO3dQTPra)*Q^2`7kZR96y`WSo_X?ckN1M?J~RHCaSFSEy;@pq
z>`Ya07we6>TS0G?oUaj`Y9AerZuiAsS}Yt9ayMwUE@~H9sj2%<Pfcl&c;~G02=(*2
zrbPuk(p92`eSSoG-z7X1F(FVC+`L?NFEnZ-vlebLYrn^$v3{lSKCyj^u-4gK@G!Ld
z<m86vqr=?mtPs~0t;S?`#g<KH4*BCp5r7M};e9urvuUE&Ns~fGs(wbECZU`<{hF)=
z)A@tU<?KxtkFT&tzSp{(82;`6H8-hxojq|AwV^P+9X@S)Zj=fUE}a-<mJ-)-Rv%%%
zIl=#BdRwAY`V>@lZ9Nal4hq>xmb5!l_(3YASa?`tm|ZI)w~w?nZ1|7lWF_|-ntx9_
zB|lPk<`$dt`I(#F<GEB*oE?Xa8A1Pj8mJ(?6*=ISXCrwk>rHmAW7x3%duPIX(bJvc
zbpN-o>lzAR^taUe?cV$5FW#v+OlxQGM=tU(8??7@pOv^xioBp3u()zT(({13k8$il
zcA_Xns^vL2z42u2*ZU`iJH6c!N9(27qjx;&t>;I_OCM#KJb7fcZl^ID;NZIE*?hjs
zrGSmkQjHo%@sn&lsMNu~$Hm};lIMERN_W|_CBLScCJ?t|?;cQu0kTslfz_-des#f8
zcoDKfvhwgRHSULUIjo_@BsG2>Y8v}q<vba7mxz`KgPWc<7ZPxAHkB+`?bXPwQpgLh
z<Y1<FNxt=FyP7Y96WWCs)M474RZJy6fh4(^EsYohsl276B$R9-l{;u7(NBdgQ|4H0
zigIHSYlbek^iT@!#7Tu%iS(}@b8{(cSR#O$(mVx&y}#lq_kj8=BD<RDa(tky*j)&M
z-_l5L)+}>wbzacS1<6wqo<~%Hi%2CapBW3_c1Sf9mq|>{VaBsvB9VX`7mZ|>ebV9+
zm((^QANj2Ma@sKLQ)v6!OP{rHRXUH6DnGb1=I!%JgP&-R?^rp+UPJWzuo^Xv!R}nM
zMPwb%9i;CK)@lR>&gnqUJa(<rG>I%-55AytRv|MaW{F+l0BbsL1&_g?BrcbG^kZP7
zSk@>KShX6>b!AjTtGSdtq}qShwcC7kPI<fWx~c3Hc!JLoJW))@l#XN_%TC`lVZHd&
z>_WQZ2&(1g#wb;IqMY+C&5VntXC@HSY@pfcjd%rMk#EAV;fjImUICRzr5XeDY7{~>
zKF~I7EBOpOk=H5a88Y^8oTSue6>awPa(we>e)`Qil&j+M@F-qD0|&EM0<c>%>{B9&
zi%cWiA_2+xUuGf*`(&*QDR>pDd41GN<tv}wUJ9SagFx+P*+R=94L_I~V%^_rNdEcs
z-lHEZh+=U?vQ4!}E&xxB);Vg3xNuHq^J+5_Q0q02*24wRfAs0B<Ouo71R@sm9J#*6
zHNonK$l$jW@LA2`4wh*Jma94)H!6)=3u-dxQ)Sb8^qF;F-+%ULl)8b#439bVNw#9J
zlvFl%+kf^c6>{s=#7yp&&Q9)nWU67dL;ybvc@z|z_j>kmFM;jPK|QX|(cK^*n!>&e
z6<4!Q1&Q|ZIkknw!FVplY2ZMcn_;mtQk=vHFNC0gW%8LgJJzcQU44HbvgFaMkT?=T
zf(7FgoP&b>Y*T7zL-C6+vbPs{Sp;MHG9l7jLM>hl%(V{Hhy!wBDwsc2Yvx`32$X9+
zFCnIfb1ql8ri8dSWb3~L8&%E{jYGZd{1^7%p;pQ}@!P}a0|%HbB^Qm@zSjN8vp5YK
z<Kj^^uY|%{(8ol$`Q^uAZbI^<i0Aoh^b?nn{NWA45Fk+DF<$S%#xA-n{QAhH*a^RD
zgW5*MRn8T$pMX+?EGv#1`8>kob!FUV`ZqsZF`F6|w8zxleRJMIqe{G^%z^9POrU)p
znft~N%%O{EJ%G^`71TT3<W!ZV9<VbNsRlNSix&tW&hvG`-=2wKVskNkDE;%q^7Z5U
zg%H69-;}oH-~3qr#WqRnICnc)mIV!s+?nTF{oAii60Z%@0nKsZnAL^UxKqrgrCC$j
zdgty7_`z?_?w{wjFf_St|Gk~{_*8luXd^pp0x$R;yLYCT!d9qE6xL`+di#(&GJyC{
z@TKK#Rm?D3z%+Qd(<S+OaX730U=3aPK>&;Spz+pIq??Rw^r0CkbBnR*u(ChX9dzpb
z)bP7a{I5j2j2rHM>#2qcP;W>}EuQ;U^^vTzW?ILW_>J&JGqHJ8TGvr2ci1bC)TqQk
z#{iBy=F6SwZ=8Pz8%p^yyn1CV(J*t8IA1D&c}bNkz5OX}vj)RFD~yI+wD;kuyZ&a;
zlj~^mUBccC<i8m!9MsyygFog1Ro0X%-HOz;n?L$ygB#5{_jHz@(r~<a5tsV*X#!6d
zq-)#eclwBoDL?VcznMU;lg)c~|3^<9K_pn{;W=ej4W9RTRJ`lCyY5#V`sH^P{rD$>
zE~0>A6>4Hqw+G2>(t%2FtU3TFXAk;!27B^~=`<D#u4WQNVF6Ga>;NcA0&=^6j#h98
zDE8zsP_B_l(hDo%h3BgV%Cs?wxPX+~m=vmk8kSgfFM<+@NwS(?I7l!aB%Hj$NqXV6
zi*bAhc-eqN$!x;OK3*M#XRS^YMB%_LAZuvi`C_caB;LN5@b3(Pr5a~0L@=>Tz7~*t
zJvBM7I{8Lw@+lNcukKw%pnJI9tp@wMXl%;u>XbW!DREFR5(WPBlF3>Fd=>>ZZv>f<
zK!%$jvqsQa4X|D#=$;-Ji3K4?ad(AM(EzaZCg^T8*pQY+noM~dkbb8cSJ1|2LZ@b>
z(o@Yz>4uG<MoTbq6mN+IpT&aB?ZMV4a91iAg-NGcX0YQx1F0E9)fw*w;k_>Dr7qxR
zmwVP&umK5tmIQj^a?cO|Mq$B^VwjXPzzfiO`3E3FOh$%YX1*o3&IKq*y1&AB=vT<7
zH~@V<03lKL4YKd`tY+K}$atra4f>iv56GrZCTVJ9v!#I;MM!Z>Hn(d!Y$zM_BU=!V
z1F>T9vxj~@m!hcU#k`jjRn65+MmP?#6pXU<*|WdHvb<?zXB6XR8d-C)InNAn+-_uF
z&W4E(a`lk|e`Cx~yf|>1oS<FKf^1(G96kjOt0i;j=tH|3p?#wq-86c>{R7T7jnFsQ
zoPq%0%~4o;Hfzf!TZO&u*HM_eoB(@xUKp$>T(QVgQN!MW^R}dXtQnh`E36j7wWI+J
z{=rp1vYBgRtwj~5kU4%}pii-!XTEZj!J&O#oZY0n<wmF+i3zJ%oH%4bg~PTO;k#_s
z0ge1;*=(8peC$jdkv~epUD@LH_<qrXWJgOH6pLPbbuU0ajK1}-4OZ0g!(9fZs&|eU
zUd`1`gA9;BB9frnnBs0Y2cZ#KOf%F8%+q_8*8l*XhJ)|tLIyBgTN?RiZ*vvEVb5p~
zo7?=nlWe7MXss9LFdTZj5jx|=`Ej#s>jCGmeZjH@4u_(%&5=320_4BKVM~pLeshK7
zza;^DTnS#MNDtTw;9T4W?8lP%-<BWD#jw`WV11<Gj3326G&pPRQ486e1<ma5$Sfu8
z<>0voC!{k=qg?KbkD>`BHSK)FYY#a~9)3s_ee<^xr9>=3S9QaP7O}+9|BJo*ifXD2
z7k!^zAS9uKv`|HAKtMX7cLZ#RfK;VQXbNHp9Rws45fP;;NJm6Ep?3%(N+&cyMWt9k
zft>h#d#}CrUN`%kG0xq(op%{CbIkHS@Bhbk)hPm|IU}^|tZR9b|B%8`GJtZg1}YK|
zPpnZZ)~E;Af>J!X6_4^aP0zze=-{wRr0gGL%>8A|H*)?co~a0F;G`RIora97X8MSI
z<c2L7CuZF}Rx)ReOtgmJs)2RZ$o6XHK4KoSDbH;@k0A9hSBxpkS+&a=6+vbyz#^v#
zFwbilKODDlk&Zf%2f|U2!s-QAf|%xM1wm9~DV2GY41a)y%OfDqvzbbpUZm!k|H2{*
zsvkm|5bD|4FE2he`;=#)UNo*=p=V#w7FN;hRovI<X?u(_m8>~yB(zJ0yHz9B-c~fE
zGR|A&w<ab>Ymg$jtmq@MD4}XUn<*L}X}DEMXR7{cpBcViWXFn$wgwwvp`PTYcYi|@
z$xIJOu=CDP)MKV6WVn?xL>Y&CKrwT`A`~wo8?xbkQKj5Oc=oY}s${)BGIJ^gYD0l$
z0bVK&*?j#3SCGzY#53B%u(Uh~$TQcMge;}NY__0TM1*UgP#6j6NrNa`gUv|UYCd$y
zI?7A!#Ow%Xs1*rTN<s!%zZxa`SfmzZn^iOh)K@*KH}S6UO|1BwE&cd9C!tihSL$_p
z1X{G`wa~fZbEz!1HEhF=afv*vm3oYp`5a=M3XlBUkYaAVI>X_U_}H(k-k+~%?h{`I
z^W%WWuU{2-pR++qFdzSEn^s3Modcda!ebhpnOC|bM0Xo2PcpsoX?`V*bj$-ORwE);
znj_udC*vWn&0BgdwJb+)ej{W@<D(pD=2?K&ap~490_3C#;`hDQq7zqLT^gjy8U*(_
z+DWYi)>YF!ZH>*%(fHQSiO7yJkco5KwojV~FK5o<#x5`ZpO4X*;f*shjoBLX=JG%v
z4`$9FEP9P9nIeMyMrQFg6+FN~kF3$tTj)ZXSwgKOaI^j>y#1YU;5AZi)qZQwcq>}H
z^YZpp^ZfRXkB!szMFPG8IYaHO!d<fE9ghQj&(<J32_`Q@3cF7VUdF?(biPb+m)Z~P
z%E)g&xydK4`S7?!Cn}&p#Mis0rt^<amz+$69g5OlQ*U9><<Hz}dLTZ19v!L1+3hM*
zN<*En5Y$$}b}aY0-{Mi8>*-(WCL()!Q~RVZ_3S4$`m6P}@b*XX_qKWU+voHLTZp|q
zgS1%TSY(r%?__Zxs_yDC7vd3Xc(s{M*`)Gr*PNbEnVvf>4T27XfsORO^A7!mxB3m6
z`VVJA_J#yn)rRthrGAl_9jYN|8k`%|t#LMJ!U1O;V}vM)$Mo1x<5G8-#h|3mAT6B#
z^5)=UzKS84p}IMN`tp(f&Ep%?hRR_6yBE=GzN72Dqn<Q)_vQ%Nb!akakh(d%t=Y4S
z>W@c_y}Nan(XFhzXuq>G_QgTE4>x*2q3;0S2UkD^QK&3msOXU)Pm-*81e#N8Jk@u+
zPlkH7W8_dc(DC@l+<5Cx&5_FML#yNChrqbqnm2s1X6JF)P*&t+Y{%to$&O*XIToRz
zm8Bto*tbCkQJ@FH9f=gE9~SeB7vV-i$_a1*zX%BlyqVvokKavtBQY{I3!JnXncM|V
z7@wJN(rvfcR)<8u8m-6WccAS=jAyk;7@6tVZ_7IBTgNY)vR}rZ%Lv(yym8+e1Ngm<
zNalM&L?vR;QMl}8EF!;=Qc6Tv;j-r#rBj@!#}mFxS#17L6R##pqZ``pj188ZvSji;
zGe1_CJcBEoxQvHIY%%xYVWU)}C&`$R`DEe1tT{t_$V^!=(+{_2JxRzes>(B@YMmC!
zoQhl%n<@P=H^ws0_5q^T$Xr(~+wTKiBQqf(69pt#JDJ&>V%+Y>+rd&3wZoh{><Q{%
z@x+RP$LGdn7k4ceML0T)-RGeiFvE|Azp->^{xZBBN3+mdc)&U*8ih6}JO%E+v@$J*
zI4-ivEwPWv{c=RVYn5f=haTdY;>eh&YRLAMio9!~8QVL`?d9wz7J+Fxq22n0TeQ(+
zs&i^nc8FDPzzQOD#U_9Jd_IOtV8V(O!&On)7C=SHa{VHYpYFhLCHHbH;JB{M|H8u^
zr3E*(pjOpPm%r3F;Ng%qNWG)fiTmb$FPYC%VV*<`R;D`)tG6vXb@KM|c?FC)bww{|
zJ-&uH=NU&xI$y`;I+At6JYNygq38<K)zD)4O`Gsq#&qFfZqBu%<d@5}^A4A&?c0-z
zmJ=!4bsD!(h`I@lU`!bY!ZDSOd4l~oipz+=!|Pbq3<5EeMU@8x%EK>^bjZLyB{S$H
z{s3?4{CN)Q#OY=!c*mKgt!CXKAM^Sv&$1<Uq!RmPlmn=Q4SU+Fb{%7mMRO(_+gOj%
zzbsBuFtaLJ{WTxWPp-!;m4cU0Y{}>XUSw(>X7?*bG8?l?#jgQA*R*->)2P-pRMfmp
z;o)qW<uqwx=>Y}vn{1g%{FHu1O=1NVCAXa^ik+@5G1=s7W<w+rdkwx|0+zRNm!Ah!
zGk?R0cHt5Ac@plX%sqHRR|Qle9^T#Yx7S<Afhoiy9xzhA)~5!vvC2Y7Uhh-8POBi;
zc0$^xH9*bC5gpxnfY#Od&U<-kI<H*sGSWauHBw(SHcIs#_*CG^DPN@86<c(pGfNa@
z+fq08J^G7(rx&9Ye1^WdexE1WZz}!^=HAFu$fqeX3nATc`tvoOFLKyX>tZ)t_I9=8
zpd0q!>$eA(yIB>pEi5O#IYYCs4g1w!Jn<+8EM_qXu~eAPXySrhewTbhohL9iZ$VvC
znL@DWQIf1%waG3P`rG=?>lE}p4bJ%(ez48#N&Q)hMYq;L?%-jkuW`PdpY9e;?@Slc
zxr}aF#dxI4ze#zzUk&+N72f)3E<87Ct+<UnYQ!C>HA326n#{>#>&Ti`fS0p(rA8+x
z<{EU&8+|RnlFWt2l3_b}%@0{vPTf8FYB>E$dQj`C%?FN^w2CF8`vMy3%yrufX%1cG
z`(*}Y!WCvmTo?Bz704%3l>HXU8^x#(6(a5k@U4`yAG^EVaCVSO+(}Kk$9BzY54(Q$
zg|b4a@5bg(waZ$ON^oG6Lk3}6HB;37+!y<LzxlQpz6)O+nnJ!T^gO=s&8hA7;nC!u
z$y`aL_CVS3xR2Id;`>IiyAP!=AJ<_i9Nz8oA21rsTpzJX_&T)Ua^BYE=cy#m7n#MU
z{l5p*F6HR9<42IEdM|SXN8nZ_QDGOvZkrn&?xYW1E>dX!?q^Y~xy!bcx+Cl2S>|!+
z8A}kI<(~1pPzCu28<f-*Xwx`ubL`n-R!06wIhI4}s><^f{@BzZ_+U(1_yKY?>otMR
zD`6ux-~{(KF0YchonzTZ{N0?;<77wAd=D)Au%;mA?BGig!A_LMX*_e)Onlo$Ls*~I
z(838RvZRtXLYDc)YK^hbU5KKIaGY4JiRec*88)3eE{eJ8u1%u~ynLS^($e^eq?6L?
z2?hLj8+iTXufYN$b?>%O`iJBPly=*adrP7RTso1Z+KW5KKDU~D5Kb`VPkbcW{i|qb
zBKK_h>~QYVT&>ZmyZ0Z73Q8Y);ojU!O~2n2sF%j7eV1C(NzfPm{+#7tW~xfZroOC*
zoqknncb)8t&LI}9ADby=m%1_SDJW+kPL`m|F&FWp*RdfeACQfyP;rL)&cj>$*@1@T
z2LVRy$>pJPxxZCJd_@IP#9liDjTxSD40-SIUa#YxZj{j7!H>_`J|Eb*3UZeDZVY~`
z+x+#?VR>I<xaCfv;jCj0X;3Kom7_timuP~RvHD@n?(6370iY+onI)kp*skunIa6^|
zid%|q8~Xjd*-y{S@51s8ZQ~lrUzq!!DJz|^SDE*tmb5ke<Wc(0>ydC#{7YZ%rF|dC
z9Qm(}#_JdO(jL5n_&@o@eEa);0srk#BXFOytk^p{H2l%2dv}b~#By~r<Ka$WAB*da
z>0B@0)aUE^ZufE3kKC;L7BFk58PLOhwI!fW=$mIzq2yX*qS_8JE>SXYJZw?+`HG(S
z9o?MuEXne`p79p^J}5cw*u9Hq-#Kz;@=5m+lylYEXs)S=U(T{uS!EIm)9+35tuVva
zdBDjko=Qqga@m4yq04NJZ!2OdvR0mMNwsHkNw-mze}7b7`>yrz&$I{f*MoOg?~8LK
zWa-J3W3QuYkJ*deljM2{E3f^)1yNpA|5i9I!UPk(CX>(NXE$slr6dC?{UR6<7#U@-
z5`8WMA^xB_M?Vv<=JRUf_75cdS2^I3rkyax4?nwvJEec@9X0k;w+q^*6BFiF6c<8I
z=nJ|tUfqh4)P9k8&)C|HBDkF-Y83s1T_X)6)oZ36{4tJI{D;1fUaFjJ64QIlomb7O
zqL{N_x2nu6Ov`?k!Y|?(^4IaY<amXX4&PZNY;~12JHHA9fA7;ktdpaQ4CCSq+(kGW
zO^hV2p~AMn+>!4edL-+*sk@)XeZa#tKmoRi!@Uyg)dKZr^)jybxL;zcH$7QV%wLe?
zEajp0ubx_Ns+kApsZnARFh`-}V$>{LxhAsu46Z0XXtcPZGVy3E`ifGqnx*&oiR|~?
zS5#g#T3-8~da9aLVCF>5y1`ZT$wsT|_5ZD>`gxygwtx5Eda6-S_GHVI&nmB{NBm=h
za@I7js=sFt!M#CGf3#fH{xv;z7Z#ic)$-Kio}tDW1s8C(dK#UY8Bd7~E)v)BGP^MI
z=3#H}Gv!t<s~a;Dxv-EDLoILHhcj=V8-=_$*Xn)#^~_{dY)H9>mXH1WnRl;yLn=dB
zeVl&Hyl;nHua433b>*I&>NC1t`=HhL%Bk7uvDoW%#ae#e7iMSP_g=4m)#`Wc#_a4O
z>_$V6*0sQgvvcc4H<~6}uU&sVJOAzfgPt0G68HbRf2w4c%D_)AUApAqa9+bP;~)Pt
z$jQ~q)$NL}n?t{wprL#Azy4{!Rc8i)8shC{>GMS2*NLH^4*SV42-I+**S`cRgFOwo
zetqn^y5o)Fpioj&D3M{F{!5+SyK|i(oHBUR|J^oC`p>p012%mSf7dBNmtmW}OE~{6
z!65BkGy^vMM>RE@x_{~0eaow4oBx1KlhdATrJYGj&&W?tm`->1%Q)kodFiie`tbGa
zLobGE${<Z=ANev=(~xX;25kB-X&U>)<>phjxu+ig!lt)!eeUK)SLSBWa)a*VUAdDN
z@F4GbK|$e8fzQ9lX>@VmtK#gKXW<OzboW^x?KvsCgmSMmxT*AM(u?T-08bg(DY+t%
z0iG6A_Ow+NELYx3t-76Alg6M<AJj%xzHIJ(`8=yG=22ZHgF5|D7nf6iFQ@)-<?F$<
z*I9qH(}vuC!PB9}iu|U+^`@L3O=(3f={2nrW34sM+sZcD@_)8HdfuK@)jq=jPbm~i
zQwQ~5^YmxOld{ey6<u}zny1yh1+~3R)4h$a21@D~?CId-!eHya=4sPV55qkDI@;Je
zR@*){{A=vxDz&p``~$;0?RZn)J@IyEVs>I;;(xNIv)|vgexB^zpKSTpJRO*7ADUYD
zIz6;I-8Veb^?Rm!Y<6{SZt-9L^dJ0mlYyU3{)3;sU#2qf)A^NeGpiH-;h!#l`0@{d
zI(x7&yY_K=`P2NTPoMtVKMnf4Fw*?`+ae{3`TvuD`hGk6Kl!KbB`g4#B#i`NLi`W^
z)Zst-r&#v?-9JT(WtuFrN_-&eq2>OIf9m#+e~LE#U;gPkhJUKuO)FxS`(OSkXlWI#
zkW;;ew!n87{ulq$^gsEhmVf=z4wx8$;h&26{`F7OI;>TfGB_-ic>LJ^`lsv+|8#(R
zP+fc=$jfZDMUlCfFYMk&qeX+L(}ty$+3RJG*XUTVJZOM7mN45ujxzWIXc#fs0Zfe<
zD)<7DOsagVqjcR7SzT2k=W2oM$Z>rmalQ)uD<oU;z0|t5fpuN5Dg%zeh@+%Sa^;&&
zncxag1!GTBOADo}N^}VfX=2oJd`$-A%(3zSGu_w>g(S!|y+G|+o2V0HVMaU8vkq_U
z2XH|dy!5Ru)8X}>``VvAonTYNN4R7y>AngqCF~8q>3!8@)P=y`U9A~CkwiIz<V~?|
z!ib_V0%oewWMGxfmY5bZKB+|0y5_mq?LmUVn8QHzQMo>X+fU{TW=M{`TT%24lcu%c
zAXE1cQjQjd5zY5yw4>f-&F>5yZPIsx-hwW6AzCy~-K<f#Oz$XF=m7=1(wW5vR+N3m
z2M$WRAIxGzlZXue6#a+Yh{@rvf7&wVtMtYUvwDh`^am^_?<Xl|EtzC60jnpQJ0+B*
z^67^QX0>(ptAGCMpDvwcGnzW;Khpz~!`G&4=NOGC3R5ee)=i1URlOH|?p|dr9<92I
z9kgYJM3eFn8BrwLJ^gsnY|@|OBx3`48BM^<BCHaIIf0D70XdOLGFwmC50JhInge`W
z;Lh9IkBS7^J|?8Sir`t*bw5JDBWN)lEZrC(eUNn{PYn<@>d#gCIP)VU7<8*nILfWi
zrLavnPm_WoR5oErbdq(#837ltAJ!yM4@l65Zg@*_ST`1l<Jij0BHj+UkgS|l3D6Dj
zcN6Z$B!xUoG?DPKI+nDWUx_`2B}{o20ECXWsn2*^QXtTDdkwXWRHJW0Kk^`xwuRU>
zyN;<%b*LW&f&KvFS);LTsJ4zymOX#)p{EG%yY03&%0tlJyaGX}Z8?u-VcIOANQ76d
zOQ7G4OJge^heVd#CXYu`JX2xNH+g_!XE%|YOofGY(B0u$@*n5N%%p&Jj$vvHA8D!c
ze)TYsL+aRP9&X;Y8Z;or@6OQj60C@*8Sy=e*<s6}#kK*6D}UiO`qw|rH?^v#3Jtn{
zfaRFddoKE}oUW6~WR_A$ye5*$O-pi7ssLImv_%T;HVU&@u7jQol(PKU1OG@GPf<zp
zg0~>Rq<1!BRx{g0L29m~TLkRxe&IuanVmksl+1S?^WccmCq0u#Fn;0Zfc9C|j*J<Q
z2sE=l<hvktI4<J5=3+W7nJIL*eO&Tu-E#pj6&(qy)h@8LS8QF9gBEDW42otYH?3*=
z4ys*FE^`&;Krol#+C6*m4)KLJ6kn$PRYsbFZz@jJ@;dp>a3nKK(^`k=2P!#pv_!!|
zss|Ez!s~W<a?kSo-2*1O_Am?FN|Qa`;dZjlkCfU6C3^Xv-q#GJF$)21UOXq9cs7GR
z^HUZL!6L=F6J4L+5{|6BNJp=*+32E+e5w(Fr?-+qiU8Ie!D8T^Q01Ed&k}lbrH)cf
z#L<ZV3-?Ygi>o#=%$e^SsZg@RnFi@qxrdFv*m;<548-FP%%6^<o<*aiFu&w}@jjA8
zFn?ahD4L#$m4fQ!|7-%rjXbOcM8+{F)D#tB$GKl!?ia$mWuAFGY(8Yh>&pFXE8}E#
z!f3C+Zb@`8qpA7hJ~k{SKXTD&36&L4*~UF{GbB?;^L%Rs`F+7N*Wcj8RW<<@<R$D1
zlUScV-vc8|^yQCecL#jkHRptE(;pwI@A}SmXm2G}_)(1odtM0H1iZ8AFMUtviDK>(
z1#qAxPr9BRs4YmmvERm1&eYz5_%P}1J3M9-Cd5<lPF<S}zG?EA@Mmu#;t}a`D1Nds
zaA!qUyj$<&4mAm?>!j=43=~pld%HLPoRA&bj62@slXN{e(frmb3&m&Rq*7rW!onxy
zOO(a#?;Oas+Nj=pLf@JcM|~s`b^dNxKULdYHP#@q%tM(FJb9jEF@nuVrM1rDezd7i
zVT?YwnCvwyRs`p)eGZ(SrhmMw1melFdDj$W8>riu9)1n?wA0#;oZi+mzkY{SXf0+<
zlLMM-&3_fm8U&FG5LVYHO|-^huu%txs#ig*Zt=DcnYp1l#q~BJ;tu`bdr5>H+35}+
zVPZbBbV<NH(e0q}Yj{mN#5PbrUo*DlPEC_yj>Fna5S&d5>l^_{Q89ZP(Oj_aRcIMf
zBlZomNUA2ilT9(M8x=m3v|b1-oiq~8zAL-jbI8&2HK*y4oq=CSgC1)XhPZT_%L2zn
zUyZ!{q_x?r?`onpCHi5i<Han+-XI-ndCk-1M*Fq1_~X|h7X<FW9~@4=izxX{_y16S
zxEZviWCZ{?(*>mtDQ684-tWC0;(S=J$bMR*nm_LI!;EHvRDRefSZjT4rjcMRL@E8M
zzJ4KmQF=-xFT}v@5{shS*qLXyB33&{7G&$WAfCz>;qB7ALArF7>sXk*3pV2@6r%i~
z8_MGvEw~VQ5vx{!l(YEJ%~YeLyLufPRuZ(g{n{H9fsy01P*c7O@WlRpeHY>RkAhnB
zS3zZ&!u5T?vPrV?sz$(T&~%1^x)rf_D$<GduYyXzVUhq4TP%8!7zwTge<@_&HPW&z
zxT@hovavzJGH!_NMb$(&fI$%Lvq)Pa#MT<xQjK=O>H>BYv~7@TfK$f!D29UiM}+ew
z;M5!}+G*ohCnwIL8Xa$l(;yr97hSUW8RI(@Ysnh>M-0=*P*CyA?4sd58?iSV;`D`~
zC${45?tu(`;QX*m--;c=`s403#1j<a(R7eQ5>G-}JjZ=I99cCXE9<X<N}(n^-Aka*
zY_tEXf4X<CnkTWAhevRO^$<&9WhMQoPHeHWYiQ7JX-Isjn#2*v^d|^X5X!3I><$B>
z97C~?l{+yiIF=1DjsQR48&Y>e^4D=p92?WA-~^ry5yZGFk~JAzgMNU&3Vx*wb4g~;
zzrSgR{Mw)Vb5Ah!1E{4MlMm2ujJDI*k`LSRqj<2K+X52Er;LfXEgA@|e}9Vz5u$`T
zhMWfPU%J*M&LWZw9=~$C(Ehlyw^by@AuWXak-;At$d>2^UrJqvL5^3Wt7xEThJuRM
z8KVcLlx?Ho|0t-MrRn0j!4}S5TN&^ZRFmB+c!}<_li*X(O#J++{%RInh$zQbjTT@B
zzpTy}VbdXYA!IvKK})H|2C#4JrV2FBH?Y2wm!9M<Vx{wxK!V&z8u(+kr_5P({64~3
zB;$cDxEzNaq=L{LfH(p+E)Reu13?j4s1D$DJnKvz3TyMIY!Br}6+uoYq;~6NHv(l(
zTJ5YFf3B9Ye4||aj?nWKQ-y`ef=(y~>ldDY?tU<qF~~fkUTLkBX-&g3Ma$I<sLYG#
z(}CK}UJp;~UYIvT3_=-qX2fog6bZ>IO96s(!Lk2BsQ4`K_!AU86_|d4Ri6OH20Sg@
zyVY`1=R56@f;)-@q|&^L;=`Jjo^|f&)<1jEB2W*;BJ%jHVy<7chI_PZ(6h%aA5)KC
z@afq>$xrG*?UAjv>I0EEg3~fC--QU)d45z&1zP@q-IJt$EmVBg2Lf2c`Oy&`GDraP
zQkY_<K{I&l3;-}geWHA`5L8nj%dk-Mpdu8&+C{7v87NDAavkt=V;?Q!jkXwMvZnw$
zX&B4wCr5x{5nS=}Da;81=tjDszzQhX7!>mkmQ4grrGc(6EL3VH%bQ$_5YYIRHeXO+
z3su2;@YxYo@`1Gs(>=M}U1jz)vF}^JzTW3PbhCUuqBJ)nSJ(tBW0N6Jn2Unke>Z?n
z8WsHIQ1e)hGdNTNIF4BGmqW!v*qz}F9r1)&*8kv8w_enI!W4PGC}D7@L<B3b2poWj
zpZ?3CisV86a;OyGzZ`1+Ab_6$W+Igje!>iYDyK?SJnv`b-~hM3QJ|cc`-4{?5Kgq<
z<rIiAEnCNVY!!x7RbqCury_+<##Ux1GRwZnOuHv%2@lF(1NZgn<r6FQ>k?BwVN&g}
z>7S&MwvMN-VkkKA6V-B0nRq8ZL8b<nKxEkUttX|QAV);R1%`zRc-q9UP*ZC`OEtJZ
zPXwj0s|*X3POgCEp$3}DbxNOtgh8A*EGX~g^kBLCy{Bc8NvF9O!_bL^@7$5BBo}w9
zrUq>h6Rg!^RzyiM?+{P-F<=63tv$Xz^CJUwz{*J%$(Uokr0d;3Lv%l5D!j2+a#rav
zq(&LW==00|Y}h3xzz6c{@Wi^RDTSu#e=JnzI);UM>Nk4ct6sLO_NGRo&ZmY;-hVAr
zeI`Js6qf%pW{_B*MEGl=8a;*u%)b83_^Z+|#o<k*%}tei#P;~V7V5$$j8`7ug?d)n
zP(6&6H8fM(C5>(U(<~_s;Iw`T-9}^c0HC~bK_7q><sS$Y+rWTO>px*8>EW$9Ug+uO
z)`sx51J(?_{I*L?SZy`z@2zy`cH4kdyPkLZQbPMibGxV{=+00(z=0ENYazmk8>hv;
zw$*zof=lhTLP;Ao^Wx6@IQA{C9eAt5Qh~Bgj9XnseGfw4g5X9ex&V=XEL7)kzz%|8
zq4F^NQ-+0#?^1H;Qn}Ton$xAO*_A>;qnNu04#J8pT?P&e<g{x=u|v0|`!Jx}>Y!Ui
z2A<O0eYRXE$+>eKkFwW9on%<3fF7$&)TM)-lQKP~=X*R`1Qj*?HK@HOWuUfzUS$WQ
zx&_S70u*e~6^K9YHP^RN)63`F<s{Rml%r^{2@Z4U+N3jv!#4ZwZwinsy5<3WkMUje
z*3d2r#FlL4KxMWdz;ZOZ@~x5cc+|KO>KzfCkArFxV9H7Tr+mXdU%`GQq3anI>UPBT
zXY4QMp$#G?g@3q!bwKHsT;(ma_bMp58thK%;5=tDN&tBbL!Xn<)wU3H14I?2QwcS6
zYS>s}0_s76hyG)s>NsP`fWH>%sxLGhH@vgSJ9`Vgd!@^rIPCqMX`KwWrF9(0zzNuq
z3C*rp%`R!%fvTK-W&X#AaVWz=-C$U#q#-OT^S0*Lu?pUkx5kun#!i+So!lIQw06)B
zfG3lzU{3~xW#LY5SmuYR>sw5lblNQ>a2yoC(&vnLPes<?u<g!>WQK(r!5r$07$S{+
zr6Q6U3#iqjZx|LT0BJst&>6s#=D~*uSf18#CqLe9i!NO9aKzjgU1sDZ0rZ&4a^fXY
zR;lYaW$Yc6#bJ&`49le8*fr28j}aI@!ZI5=BlM_<(=<%-7GqQ!@sNfobcVjKM)i?K
z9ZAeVc%~yFON8_E5pFueZ#seme@}%nEL6wC$!7w*E?Qk9fuMQZ>5~=+I>SOGF$Vk@
zE@<y!FSHB5xcI@$mR<Y?58)9Lcl{7+e`i=AzqY_%x85fnLf+%C8=5n(D5FUg(-U7X
zlNA^p8nS`D1<O8s&wG1jb%cj>AUST`J&u}C&RI~IWBGa;Jxf^#5@69F_jQb5y9JnQ
ztkI$5x%bvnM?_?zBcxCk%l-w^Kt+HQn5LeLGA$r>x4^GR%njIikj>0m>r%XM*E^b+
zRl&j=i+(=Ta_DWefau)qCrgKii-U*Y?P`<`WpouayicYvFVHYfZ&BBv?bXvCa+X#`
zmJGCc2((#e{zWnLTp)n;&;0U$-;|CutY&NRS2fIV3qq#MYc9|(E?^u4myU>Y=dsXN
zgc*IORqrG2E9H8EIl7ya4p9r8O^VfKUMEX08ng`Bq<-Kd$AibAZ-^MmE$qHCcAxG%
z&SA50K-efGfAA6fc+<wTW-T6WOJTK*0t8B<Ejmr>*H0GdVObF#)}QX&W^1?pbXM-;
z|Gj_O|8#S(ZF6{GbM$DFD){AQmZ5>MT;^Ad-rjn)T(%q+4s(kqbM+&OrsRDNTov)l
zbQ{IVh-Yb(^6<*dwMxB>Hlu90FYkoA?i?ZfE6?%C;DSbFaWXhrU(?u{PLONoiB-@#
z`P-jLnL|Mw-D+!d!5MzHGpcqARPYV7JR4}$`O`^2zhzau<tw}Vj)BEaB<qeuN|z*k
zdn|uP`f`^nU5E!Sv>PL{9c8ntqO&EZBVb*-tD?C}%HLIy|9(gJyMq6Bttx(kf0qX3
zz0v(u%am?wAs%DxA4&(`&4mOmB>gy<!{c<iE1vb|<@O)ci0=~e(3ciGF4#V&s-Lmr
zKV2}tu6*P7l;1I1<i3&eOEq`LBl$<z<zHPjzr+Oh!gcpz7Jn(xf1UB)i^TB9%lF;S
z<xZ8~zo+v(Y4LkHeXn(!>G2lR0qVOy`fJ1{>Wt3s7~!sGi{DGe_J_tr=={63G|-<d
z$+&H%^n$c9|D93%pI24Oq=-K!c>hQ*{;Bi-Q(46?<$2T2Vp$5camOY~%4^3DeRxaw
z@LK!oWbQ#C-Q}dX(s7#5Q4m{SGo~k0?r0<T=u`XAX8X~IeBb)w(T)!N`(?V)&XF@e
z{bxJ<88^%YfE_<z5wrX2pCUQs+^48Z|EGUCzG6(~=Jmr}e6wnrapGL1`}EH0eHPoC
zCxs0EbR@`D1sL!j{^{?u@%tB4AH2II9%GYSU{lQSPnFm17n(kl^85Yv)B9XGo*1!z
z{8O*VN{`uhUoIt%hh8HWhJ1Ex3Hz~p+u%(Mf9vg2n^Tvj{`F6Lr9GmUPlO9#t~gBZ
zcnm-CQIC~*B<3=b|4ltytglM5q4Zo8!$1AuGgWhZ$AB(1^V2hnZ&Plh)$M~H!$0M_
ze&zS}w+eAl%+-atuz>ddhf+7tbG#PZwXgiw7v}%m*zz}SDv@jXuBN6Kpgs7}^+wp<
zw*2LkgN?(+3#8(`%*DmKuD?fXFwYMHm%r%@SI#<@ZygKX(nW}7SSyE_G+{ahbGDiB
z*}nrjct7Gf0t|ALl0Kfgs>+;dz-6dp(;8%}S!p=r6lRf!40;=2EEql)AcppGx9I3_
z`simUoF1K0#{w-hH<es-+fh)<K`9P)@w-ut<(j|mnB&Ko+`vDpEjC$yX|_-;R4Rft
zAG8sCf<|fX(dmln%%7!`@PGdCPX+p8SjfXcrS!!?&0w4HI>ihd6ZRk_+ZLr^D{G6B
zlfh@cniMenQ+>{mvnr;`-_M>sbMBSQY15D&=j_}baGpGK;nk1x4ndYBlNa?vps|jq
zDA%de-ZLI{k}t+B*!bBlxlgIG{SmXbg|e>lONxCw_trk-$InYdg|(1NCJBFa)JRzi
zhK}l)DPj6oN4>x?8)^UeEW(+uoA_5pWs4Ga9(OJ|RTb|4S4VYb=%|wY#dWhp>H0la
zfxZW-V?>-YVYZtm^!2mT8|Qpoil1Keb&f#3+vEdmwK99mdfqXD0xIW2ZSE=j+`pRV
zF%i11VvMCZKNbrRL5GZ8>_+N#)|jr+ADbCvKfC&M?fsN&y`<r%AkSwBS%zG|{T#<p
z?Kt1;PFBdhOTMmQn}!sp@YG_v>mG>}V__0#Nwb=dnX<jO-e+2AQw4U}&Y5A-HRD$f
za%>|H#l9NWTQ`1ry;AQr1Lvt6hy-OzG>trsI)6Ll-Ndoq-z8l>EIsp+1kiwBz@7yE
zEO*20-Jp`Axz+66P##B*G338Qs?)zjs<Z0VL<W(X_e=|*Iva_2_YaXuZFG6)2*kN&
z<4HJwI6njEx@m4h3+42*UjP6R)al4s1;Py$Fb-1kt0B8v_~t~JQ`a$Tc0>}5AG^WW
zEsO)ew-R|)q;u(`VjVh*7by~xSW3V1)n{*CS;a`Z=NmfR=oFI$0n!VROb|frO<8};
z`d&0Z%!GX@H7Rtx0Sd4tsQ`wp*Z|cFGw~fVFja<D>72V$e<2+fk4+elB!FMAqLG?;
z5<!ItP%hl7tD5ru!+*Nv%v3vqpMc>2I|EjY>g1~?1mGghh|McaQ&JTLK6Ccc8zQ#n
zgb@mcDKdo|M*x^K$HR#St~~D<R_c~?;9o1%+3p2PopnZ`n7F>v-T>Fg_%$U{0{of?
z5cW12#9U&E^>TfcO#lMUMt6Q6RRDn`J<`wD4eUe~gY2J;gStR89>-pN<sAy3EMpes
zMenRsQmHuxu#R8{;8cAt1_2?~5$ngeUyj+N+_XeJ-teq7L6}u19+<5NW(-&WqS@Ua
zM@Imx6N))9ZS%k$^C#$P1#3T&B`jJ@xqJ$$?6a}iCS8x9GTsqaF5)s(d9PqAP160y
zCyR7d``AQ@HmF-GPsUJu;LaMr_2uZKi)R<PycM<LBK#7@MPkPRq=*W&QHl0QU7Io<
zwa_=Kz@3Bq6^nas{DWzQkNG={F;Yb&wzFlIDzbE|?&YN|jYwdyg_e@e0ED7qC|i%X
zWj%n@H60BH;MX@a!`M?644_a-1R&!T3xIs~nT(?d4B*`Kc-Zo`CSVhDqobSt`d&zw
z$!zaVnl-!fhaS+4VkDY_kp5NSM@|5s+}TGFRG0bv`KbsJSG!qZdEmMFmyQoET>dO1
zw9x&SG81FDLNRca8LLAPI%JobEOqB1pCaQ|<<e*n5iT4k7uPF@js=5x-aq?2bZtVA
znI!ZS42F@rRhF?%Ja`({vvdH!p)BM3*JXCB9ci#vBlZ$ti)#{3fS3s*U@iWvs?|9{
zUdtqlqhE4Ulh;&pdvwO1>X)p@ehV8Dju&%H0erh%?&WV@F!knqw<uSJpALWSnwC{I
zV{<R4NX3{dg>nrPU4*^ZGJl#n1>8)J2HVL1yjk6xhRX(a;x*Nq-qBb201ygr?nFEA
z&FX7cM}~_>h=|hax(<*8yb=p&pM{#U>B9h!-}P`{wd&nVtcr<V7n8$Sotf_^5zdS^
zx^rpl^DhDN06DmNe@#l_@hdj*rnfu|ZVYrs%bkWpC{ZhKR=FtY)zTa{vmC8&`o<g1
zPNL2vH(l$weKV}L_>jxH&ammti)RVab`=?p4u0Hk=a@?T^-$hS3@eqOTzKfVVF150
z#cE$y^>{bg@Xnd@m39y&iLlPUR%(pW&nkU2U*D_YdOelbgUs^1Y?l~Ts;bZ?SI5U|
zzu;3dS8g<4?D`VicWGfacC2asw*Rd%=)(68H`)(x^M<cqqS3*>`rGJ^k5vC+sYG#0
zbqXm)6t9gTse-8$+)RJqnN<sso!r=k?(QWZ1o!b&Bn}9^7s4&d*d}C6NK%F5dtE|A
zmX2+cAa;}qxV!}gc@&g)rkkeu`T`J5)VL^^2Y7Ut0%F6FHb001OJ5~`A=W*6G8DiD
zIudwaE~3Yd0GLU9*Yf+q$|e3M0I&N|yZp`9gN^;~%!=O}s}cxqS=SQPuL^gC2$O0>
z9(_f;xmo2O2zc>6+V5!mchA`NrRw8XAeQf@MUuYWyDB4MANv5HaPu?Mx+Ck=OP9@5
zoe3n6b@R80#^wb_`tP`{*2OV=A&3Vb>BmELOT^NHtK-KbV0apkg&s~D>i=HsTL@;h
zrhs^0F>qfXm?;#XdP5fom2|$YG#vx26*`nP$dwQcrF1aqoK04t0m%!{<r~{~CenWZ
zlRi_xqrFjZ18D@xgs}dQ?T&jbN!A*0;b!c|GXQ4QN?e|52{YFPswgZ^qyJA1yk8qm
zZa9Au@Y^&`v@GGL{mE?NQ$F>$Khx?L_Wr`D<y{egsglVq=G-VPUWoei%Ilz1!K(1s
zITr<Ka1~2-?%Z_Aax)TeOtTn(16u=*)Z)+^9dl|VzrBu9c0k%p48*f$I{^@P@g+k|
zC9CO#4hXOWSHXFj0eJljd8AkD0Q!?hWwkS~?$4zFJV`pZqx*NwoG_^(=&6DOz@tV0
z)Gx@sDg?D_7PzSih}Udi%7yUc#-6z+5&Znsk`SD5OcF~9Fn=l+TqT&D>u5~^cp89c
zGTGLox8b@xzOB3tJ-p?*H_vn`knyHeT?w<7cWOyL(@5TX5HMDcBC5A~<{mV!Q)?nq
z!oA>Xs5&%F<+(7x-dkR_DModw6RX)11nBZXky!U)Uw29>%P?ZnB*@%L#kY_As1*Ll
zB1b|W%|(B&3CHM61BpDasaRqbH%~mcL^`wgB@Ss8shD1CP@aGh(Q=(?%;q^Rm9D6;
z33%YzS*!tg><wTEuB9`J$X~w&JH{q|O|PdpUiUm|;CfI`*h|vMvjCnF*wKtS(2gWn
zKvG@JcPdH{u1gT<W-c5T<gk7u@wOlc30mA%Khl-%E|d1wjDuAh;a7XWMCo4z$nGvA
zf@mBUZgxfn>L`-CsZg!a9Wn6dB(OT~Mwm2Q_2CyEO<e;`;GT@Z*=|3{j)UgJ(iJ6F
zRcQc1DBBJK+YmaQ*WVhgE<OhZDgrpW6VyZuQ(BN@4%1$Km9(7KI7x#K7yDp17?4a7
zOarJ74}rD}S2W@tcQZ>mljclGizlmL2$CvKt|Ws@#TI7q7v66%Do#>25X)+OQ&8eA
z`@(>arNw}*U@wRYw1ne3Z-7V&SuKWn01C6r2?m(TV^kw$cH{+EZYe{aZP`%k`qhLK
zpELP7P9O$0yejH%46N!6k7ezDI@E%^8qWAOV{y*c;x|V_pT+B|s@;YSLXtR(q3+=!
zO%k{y_G*LB7{q9$E`b<tD9DE6_tX<-kg1`tn(_pn072}nShc|7#ut`j<9%a+F-j96
z;&a&}j|KyMs+eblO>rcxW$ozTtkojX534Od_fG)tWl796wH9R(v1OYwrOwl^<5a@q
zl_JO51jkSlHh29Xd*e<efGbVNl&b!D=A|r^FcClkm{9i|hJT~Z%ruQ%n~nLart-+s
zLGfUE%kaY%A@Lj``=;s|eY_Yr>q}RHAH&VI%i5fdlqk|Z8p!1mFx-?TF;>bzo+N|`
z2}w2XbXO?m0DR_%KEVlKTwPp=Enx#9;3+v~d(x+<hsBR49)kgl=Q2eLYu<BKALhVE
zUTP&lF#{(7i`(6@B=x^=>Qu>MCyw<~8Fl*AGY2N@m&bPs06b(sNm*=67l0FsL*|))
zwD>ESL8wju6Pdbt;)H1O>0-bc1%V3{A`{->usL20@CJbGCP}-1bedtOk|EtE0lq8%
zk9`f6B6Sp1A4oQU#sH4S&q?Iu65Nk(+PsgQjXdFS!HQw0Iuppkmh_{V(jyB!Uk~#O
zJVqs8-jP)ysUSdF8InnsbQD0^E`P@B2uVMPKICtP#Ao_Z1Q>Ygb7rp1W6j`DZWGJS
zps6S*{^Cvtq1ddu;^Uao#8V#zpNb$c2fkO_eCLt`eslIhQ&0?q$W3H<zb|&7%2Fxl
zOT8a4##Z%BHqWJ(mP!5%F{e$QN^}E>%<v1ex=YncZULH)Lt)Wk1+62AQJe3&h|tqP
z%34omTd1>b%9($>if>NCOsAqwSM$|QgBdZH4(MamYV+<n#<SP^szV1Zrc0xfD1^X#
zP0f(zWD<<jl%+TywB<leo}XlOeE$k{Jbq~AcI;{`%gcOa`b3Q5G>cPi{``!r(~9Af
zN=~OW0r6!mhJU)i1zcEr;^erLpd8_}IkKQ%!-~su`o>wTV8ii6;PQ?i`@~e*H_OGz
zn$$JP%fD`47LG``V14=bxhG7*?0XFV^bo^04R~8}8Ss;rZ=ZZ9>kPhv)_b%FaH1vh
zvU6h>!S|h!PDw{!oM3G<Vrra1LP8UO_5buwtz0;rT)3{eaNlv^x$nZuNXl2b@U^+{
zkGcp5E*WQ`n0uXZN0~=ZW)Zpn<ey%1J$}bk@){C~c9nX^85RmP0)V)uT;;yH${)Gn
z(QXQYZVKAKG#rqwDCl-_fy8d&cIu9s>U}r0r*7&`SJFIJ)ITgMACWY_y6GIb5n!tt
zM=M%rcYTQ!JYiAFX_a?#QTjyE9EH_jg4Rc(b(PReuREKope(MqpFVO=ijN&rO)?Qw
zF*{=J*;uuBmUdPmK?vqycYiGo>!CTGXggY;8p>uXfiyI#bGYMv>4V2b!7Hv#h%j6R
zxH0k4I~DuPbms+tsbKvTl_U?jD?V)>+@7XZkdV0eD_0~qK%<G?z4e}eb>o_ZfVL|k
zf>*+53B)$!xwhB7*HfBHoc%}Z!`hq<h-=|aSMSEIor$G|_P!=L-HW*PI`RY4g`=yn
zav!1>)>%S5=n)zo&f1<g3Ozv=H)0n&FUol)ay4A8PZ-!(yT$x*1bgMa)knM0wK=k9
z-sj6yll6!wuWYi{gElXzQN~W?)+-VjPu?{@l}NbL>s0`A<$JXJe&|EI;HTU(pRURM
z^-o<UXy&Q9FESba=_l4di|1CoEB@O*g<dAY{Quwkr*{K*QUZ8$1CCV%@U;i<j|B)U
z1_*u&5TXa*FoD8Cfg<vOqB?<Mrvt?=2TJ${9={tXnG$#+H&Dvo^I8MMq$I|tBv9^h
zVptYDk`#S>52$#2m#)YIjojOjyBu_16(+q06z7TY*@zU9j8w!&+u)<+aY33}aD8jW
zktjRoAiXNY4W3=0jYyx+U1iE&I92vnoO51~CK+aMH_}8t*zyKKOLEsnlA#1eMc74&
z>_r?$L>oU3l93NGnF_veHQtI2l(vIiWDI`+ekjr-%(vovtU=N=n1S(+3qn7m;-QLh
z(FAJ9-Mk+T4}V0MTz3csD=z+sVelROago*6ef<%^0Qha5_)tWwM+4mF_;vo2IIWZz
zImt-ptvDmk>x!>`xa|S8vLF}XyD>bwRyag({EaxfC?U@qL@Y?L532YL9@M@aN{R9b
z1xfS7(=U^5hy#MIA%56x?8Y`k3&n#Xd18|9#+%zk$)5Tt$B<L)qSQ?G_-@460Dj5=
zcEbqY6}dz10^&rnqI}4^v665_cw9tYkkYTX%cN+Vt+2ZdadwDUXHv8eBG!%==L6W2
zkB8ogkI{__EjV?v=)%os7xvkHLDcCH9vdKW{7q;1T}5JC1b**S3G`$xB-T3QE)lMH
zAzZUR#Q58d)9}6Gu^-{843G7X;@BSt%*`tJcFouiD?n(25aLFBjFD$ZWc3aAu^)<d
zuox5QnP2b``6!RLT_1d?I1S$VKI-{;_zgVdCU;yrJ>pJYh&bZ5>har(r*6N}xrOZu
zq1UDCX{W^5Bchchqtra3ujj^v<nCVibr2mN7y5kHehZ%b8dP?CH<0@0CeIJjFZk&_
zV1xhRo%o}V^oUQ#cR%+XV(;!c$Vd7x&L<!^^mU|GA2{6qXWRvZHGEHqL8g)*ig!VD
zc>M7>>fzqfH(It($3fU{1%`hbd5Gh@<!Xb|je?&F-2A`yPowNlcz*B82{gN}sLX`C
zz$<KA5#Q|*Jlf%=Gq|_H?Zc}RX{aLM@b`PD&|zKR52o{*)Q11+pPoomar{a5@tP<!
z`~LRWxo*ixvKOb|@CBk}r`#b;r05n`fx(ato=zRUi2wBV#f6vGzWn~jKkfUf^hxEK
z$=dP*^Qk(E>f=W8J)M4@Vo!w(zx%att<`GWeLnP?Zw*^#e|I$B{DRdVjlHeqzI1v2
zBh8!NZ9a6rQ1-Iq)lANe;5#=|Lbk$xQ@A^zqeTKT{ZIe2)bWfpYp6w<SpYd$VMZxM
zLDejh*SkSDPT=OAaJ+DKowKWP@|%RS-1q+VPeqax236S;#JP&P<sb5M_9SWj-uuTt
zE%JGv5y6{g>U!QNSe;9(Thriw_^0BTGLAcTxQjRG`{G$H_tdULe$CLA$o6{CDDkg<
z8ZfAK{7J}6*zu=fpBj(n-u{iW(>Wk^pVkpY-lS^%2sX6M6KV{SG)X>EJ5l_=-u}6u
z4k^eQuj9<arlX^@eEK*vK=hNz<>2vgF_a)Yjq`Hws@21XGdHCx8)2oB`bT2iPfQAB
zR!(!D&X`E4F0E`DFAX|Ko2wS;nPC-l`*>5fe%d<`r(>wOl%lOi<h0;mSvcd!;UmeK
z!uilzEc(iq-)F2CnXA$<aWev2Pc8h(J-F&GT4!>V&)&%t&YC?pLylz0fCTLh6OSIP
z^W`?(;`<vm(VWbwFS@&C?`bLyh<}^x$IJ!O?ag%zGguR`eKu!}MDs_VceB5m+WgF3
zW2ZZLJ2`L8|Ei8=fNB1V-|Q*RndyK8VV$?ORyH+7%9mxHO01$)bs&1<@)C(!D$^bl
zbvUtsdC?I}Xp(EH4#$(mmz;hH-WRzGGq$5Ng6u9q#xL^La)=#CezBT3pERj>elqe|
zpRNaof*DSSRv;?&Zqi$2{Ym)IzV2xb;cmX8gPktEhb4l)FzavpZZO&``M<@t9d2Q1
z{F85b9)<E*ol{GYj%e<<Z~WG$vF<W^i0F$Ikoxy=^W2Jb=E<lGrPKWf`r3~9_OE{x
zDz*$CySx!3B&N=0Y0X`F_71<G9zVNstYI--{#BLE0o%AZJfhWKtu7GhAh{Gap@9Rj
zH$11wuH$M#Ex4&2>K|I<Zq2Y-ac~8ulpM+sUrq7Zj*2JuiNW<9_ogwZfXY90U*U(B
zW)|@89t`HAZJGZ1r##QUR;)Vkf5e!C?scUA#)b4YO;`_wPY5X1Bv{=N;V6{sIbmCK
z?|h30*UOR~*}$4ar@#KGWUoS6joIN8Tzg9x6ILB1u&!!+swslSli<eFwGkumF`mV@
zdpp@L!}!=Qn-WE~T5@dpkoIc8eYFKvu7YX<;R7OE!QF+)5(kn9&oi}9$w!`H7=g7o
z*r|pk^o=cjVO!+DS+gB<5eHbDF6}j7;av;Qfvic|cp+^lkz8FQn967e`WAm}R<EX*
z_SAT?3w1d)CTo==-g)Rm{8C2Dl(@_m!omf_CiI7Akayb!bLx8G{Z`_t)bU49FSdy6
z8x7ASZzUwV2)=y!vpZiib9(sdm3(CVa3o)40+S}}jNqcuX%TK@a**B*`taZ?K^B<k
zG8{zy)goyW^kB?|(#e*d@qq($?DV}iFAWFYK9}4}7?7FkU@PG<IyL1op7f^fnO|q0
znyNkGltn&VST<VnCaZ<3lb6sY#Yo=vQ*4NeaGv}Zn2n#*WGT8-NR2Z_=$$D<0q}}@
zo@|`6RWqD%Zz)ZNvj;yKK(~HT`>KMU%|~8lDb_rYlZ#6JnESf}?MW%Xy5jWC$m%lt
z8cbHiYL$mhDWGiTmeQ_aWmGovWg7-3YchFY8rZVwk%Cx(fWyxmOhD$&K(x@*#%J{&
z=LDymsF#(uzgSyHGo8W;GnZ-gSrlHKY^a=IDIgiSxJb_})kB23Bn_0lk(hkTA0!-Z
zz+}EsNA<pg%DY?TuItodJnaf{-;T&|tpzxowg(*>8IikrN*ZH#@B>{3_~vUhXkn}!
z_}~s<P5H)vxjjMjSqBT7hNrNjLOiJLqt@2h>4<xG><jp6)TCrJn??ndfO%V+;<9z7
z#zAi)xk`v1Y>O{0Wzv}@n+Ts`B?%XuAusm|_DF`}e4EF@2~jm#9v{8e!xkQjvGcKh
z@WRy6;>N%77_FOZa~Nzda`ky}`H@(}iaOly=M-WMBn^BnPOzL+sz(m?#3n@5zMr=G
z)vB!?CtkTpJJEOInB0`EphJ+lR%m(86t;`Q(`L1uR>*y4>XZLN3+^8K&a}0Wip1aJ
ziPq?-5n^D6x>Hp3iJ`81svV2AXU(V{N}n2@8b?YX#u<&3@Kq1j7EX$#aPYhHB_Vo@
z+B)J*=pJ|AjYcw+9jWTlSb?_8JTq)Xidd|eV7r8hv4Jkc{#LY*N>T#G#nwZle@ZO!
z7E;sm4aU>t0)1dnH`t`JJk3R^gDrevKzo!WE%<rtd?^|!PpVD{$#E63K=kR7NGSq<
zUiO;Mx4R-|1R{>(MM6~@%w$$rO*ksW3RN4}3Vx(smE+|$RGY9UC!z#JA9B&qNN(FL
z;6sWVSOVRrqVfi2RNXD;#bv0ICCh%z;Lq_TVuYy^Yt+N<U2LvXa2XTD#7DkeP@$4&
zli1NzJlRFwRyD?0Zz+<c=wM!GzZZTV>lMnsg!@d6)bR%JIB4dx9yS=`v}3UR3tjfo
zHmYp7mTa0PEuzo)k>5ORcON(xB1@bTG>yKd;n|l5;1~C4sT$DJ&)w0s=)sZGB3~b5
z{Z1F7PXkuY>A{NPAiMklH=Ld_u(-4HpM*Q&ILc=+5_?fUN(bUNWxT8T>RZ)zn~jch
zTv69oa$Py1Km}1XsG$aZ&;2Zu3`{4+grl8xIH6A*C5*mLJro5=m@Z&Iw?B$Xab4D!
zkQ^LGY7z_iUy)-4@zIPWfuVy9`dMx7?N^pzMSPY7Wz+i9I4Sbd<A`+=)zt_NGEm`M
zCo566Xi1;%7ML3k)E)-$Dm{7s3J5Z?=fmoW<2$IYI%J3u%6MQ!LbTRigv64N@qr!=
z(y3>mr^(-~$RDNMt+(|gK_dew*Px$~g?3}WsY*sNkghUHv;rB3rRC^EgV@i~J5PN9
zi}E`UvVwRuLB=Ry?rvV;ja-flK@$!=azeLuG<dQCtk4R=Yj(1FcIrlhxQQJyn_%AP
zu48Ny>Z?F3mZs|~Xj~%9$9O?s*4Ht>$@_Mz6FXROPxv~8x!s*i&w}LL^En_Qc#{YY
zK$kA9OVlKSnJ}+zou}*z`S|Fm39$pcNl;n^YOZ#OQjU3->&g&D10cq-)TgsrWMPD^
z=q+>6TR`m3F-f})<rdrmt&`umU%AN9BO?}nAEaZ~A<3`LN-+Bo*3FScGj?B8R9QK>
z)5T4l=SG=xOX^C|I^<=dh9G^)b6v{8z>Ynz8mNzb<NsmrKEImUAHL5A5(p%e&^rlD
z>4YksgeFY^3j)%MAVsN4ClqN?1t|(hlMd3QN<wG?A|(`QhN5%@L_wrX&N=t*+}F%C
zYi6yPwdTp(e?eBVAMCyM_mlU_l4ArXlW~Eb4Txs9np<Bkz8a0EZX%NkSh@&Yq)sK1
z3c)Iq_VtRNM&IKpdr`u<SmkKExCd6(D+1aIfB_;%I4f8WE$o3+_rNk(3Bt<x_3iM?
zcKEAaQH)-A`3*|}IV(0Ryl{1dqBsdo#d8az*{abOL`}9%+ZpW-+~#C;slAUPKvKB?
zK3DS5Cz>>S<V>(g4OkDIIZ%ptSI+#4uDJ8f6)W0Q6mJt*cM?b<E<%qT2=l<w0dQg@
zj4TzvW>TOLji&AFv0Bm6awCVGMrd%8ad?o{Z!EmL(bg-@T;)P{+h1$Q@!uvPeO`8&
zTh26luWd86Z-i+x)C#ecTr7>>?g0;KX*3B*?V!5aP`o2OU~a<YNPhj^9Ahsnx>1lu
zInVruBEAe@3Nu<;`>OciN0kTB&M+ehxdl&d0dLJ7c`7nVq9*gk99rA)YU-S>(<RbH
z@KIRzmBhb2#&ZP}_lRpLd9Ak*BL*^X%FoK)fbjC>h6uvyde;o+hcZ=WP1cR#p@=*U
zKnd|TkcSsUU9H7PzM+70k~`KCg5A{f(O#~|)g|$%84Jp}d;)d3B$Ci6Fj{4nzrRh3
zfyAd)57{U7cqlLFW<>B3djvDc6isv(3V^&uwpRriLr2R(SJu%xfMFdQIwV>+^|eNB
z4;ZFNMXqIWauJn$qO~>!xXo&<Z<K#EV2S6^;*~vetraeTrU)BOV5CBxPE3y_%h%^8
zTA94j8NAxOsw8s)i*_PrKB~An=9)CU9!e5!ZHnZXi?)UMkRhl-)kO`rNP=mRMpLQ#
z1O@#;%)60Gd{g<rK20TJga$KC-fw-28K=ydrc3N8zXd+^bQ4H5^j#sZ`)#oJJ1Td2
zBgy7+f4rM-5ni~{;0hzOzh1!XI0~YBJ!q*CGKA2?uIrBVT&CTwJ7Hot)V#U_sNNKk
zrdYEzSXO6uq7$~hrM!(6-_VuYShjG*By%%);04S#3|oPM%;+*sazT)$_zCdJMg)vd
ztoq<0nnjgD@|0XrZ|iMu`Bf^hde$llKC!DNc^d4%(KY}_w5Bj>5i5hEEH6rX5RGN@
znC02H!p>)ud*A*9h|I+<-xty07iQz`6<Nbl-?FxU;4$#xzWwV>^j^>CZ@f4GW7Bef
z@DZr{SC!D2`&9s0t67f%H=0)u!O;}K@pVHaHxi2Q5GLL&bSu1TTGm`KpPtY=@Em0F
z2+gLd%dxX)h^!=6s?_KuFEJ2(c#cvP$4?$ZcykTau{>qGz20tHXfHQaX0%^#RFU?2
z#ga!irx<pk^4F)`2@;>`_cx#F^s0teyY>Va)Q))5;KJNnaGo0tH}45gL$ebv@Rs*p
zHbM~U$Q@;5B=aF&;kcr?XltO<ekPP@<+s+`7T(qbcf(e#BTz~~K@?0bHL;)k&T$l<
zu+b6K2XqF$>qP6_kgLAcx9~40p=!L&37%8bbjZI*Lsip4eFv>5br>nsXSriog1XFj
zvtMQn{Q&zl%tI)8C*oYlBVm&=_aQrX^zjMMw7!}#6svF;#f<D3iLCzOP@DH_=VQAC
zXB$dxFA_=w@_ArIs_|grys~*#VapWKd`Vv~58I-x`2eI2b8}QLH!RTN$aT}}bkQHt
z+FparCU}-yuhb|Q8P?lUvl?MSMXF;&7lI5m*7g>XA)hQFlpjR<C0~Gk*jzRq-DRSZ
zzOsQ|V%OXw|AyAn+9YlTD#U4+NUu_AY3wBNW|uWnzmPA%Qr;pb{{z&bE77>MLkZK2
z9@3%>L2(p&hudsZ=3<@<Y0<O-sImC%U-fSztC-(`+WgSW0X@1SX#6$uZgX@~-CEO{
z7Ke7kuQ=el6N8#$5NAZMSO|a`Nj|#!5}Jz|Y>9yG)K8G%NuG*^pA0oD@<>$VxE&;r
zih`(G^c#GqBme|9UY?9TBt=DOkrEss0PQUqDGgVN&oVETybEvjP==sr0TWWO(t6xD
zg<FvyAMvnh`?3g+(|M4zYchh`nn<HhVHkF}VG7xbra!)jFt}A`5N#nBXFZ(YwOa&&
zWN9xo<iQqzC~(@<wI~w%P5%Xm8W6i7TEyVp%iv$b@KcM~snRglR8N}|PWQ~Uv{(0!
z_J=7vQxj3wOQKla@7j*J7rJ65^rkR(#Wlf+%_MCN<We}!ucTb=dI`hTQ#P%6f_k*s
zSbVf<>I3#$d4-lm%+ct}x+{Xbz3`3C4BGfB+K9=CsL>j{@}X9zzR+!%A_2-3qh4Et
zHhR|MRbr7{tt1fd9j#(QC%A@}w$hRyMtt{97R(~Efl>$({W(zUvle8$BksmtXc{Dr
zI@`%@M9c2YwnrxitOPU3>z1fG;TvdAizJgGTmYKQ7G25F_wzN0_kCSix5R)rk+G;@
zACbs@Z(Xwrxo%Ae0DtcR%4I@Zb#ztAs#x{_XxLs-+XkF_psl*#6|DJ+5fpiwxyfnR
zPYH4N`c(xt5~3=6<gUHu6Z~G>t6Bqqy9d{Pb-pR$L`2iL($sNF-CCq8Z_yz5-pL1;
zOXI{ADwx+ql3LfLoXUJ{@G%OSH8DfFstf4qVWEYsSew86)9bxy`fKP9ZVFCj*5mw}
zBA{I!^&Hi*Bi*_qHF)pj{*Hjh52NEsjcS}!t7yduu<b?F!Tsnr!inn4WQUvii~$mn
zGp$LDAa%J2gUnv>UV!=<j<VBvvgKlj{K}pPJ5oJ&|4G%6aw@8DN2}BOSR_C(ZaCW4
z<eL;>cX2vucXXJZDj^&meHj$lpDp1HQcU{X`r=KSUMoSLs6{)bz-I1BQ!cCcRMzp)
z4{*qjRNr1Yr$t>P8j^|?*KX6$!-?57DqQRs`R&t(c+Z0Bm01t?-UNKqyUI+377f|R
z`GZevR4R{cHwv(9`CSMtZ@FHqT?u@m4`-NxTxs=iok~!ysZxSZMH8eWaF94YKQdlb
zvbuz8Dl~u4G#&MSqUxDc8ZQ57fCo1+1vk9as#hU7ryWgqJ2a3$S*zgYJ1Q-~!Ea^%
zG#dY@k5VB)sBdLE+Oj%YV=q*iyHz^yD)q%GZCb${Re!n$IvUnHx`sQNCjYdTb-aUy
zbbnWQHyqq$7_8!|A}grc60XuMrrNC%g1z|DLK03LPjOtQ*cp{Rm0<QyT1?eBEuLD&
zQCHQSWIkB|hL0jhj_UB=jw-zOl!El^KHEumjAxlul`V<-U`x{HF(1l+BD0;tc-7&L
zAs+@*N4G;p-<}Q+s7}tGP7a)o9)*ltgpARLj>AJoE~`yVc1~SY8~z?LYkW45-ZlC1
zjKZnwBQSIXsy05*IWEvOH>^6}csli}>(kS-xhra)JJc2)b}cljE{3ZuiFGYO&p$AQ
z5uj?TBu5o<Mx4J0nc`9>xT_790cHI{7aK#qtg3zeu135P_UU2RLe#sJGPPBg^DmB}
zYwK!X?w+q^y<7F|+VMT72vFZ1INc~y`v&Z0r#7p32^!7<aF$2WW?+8IW0Zv>Nwz6}
zIsPyU%UBNNv<erK!~Y~HOIG2sdKZUM;XgFO4{gJL8h6uTB9yDKkXZmJ9Lq3^Ipc~@
zc8WZk55I)GI0u5*{V^WQP2-h0Xf6yP!gN+VT{A|PhSQX7-0qS;gre5G-h`(wl2w|O
zFz8*N8O_M0E>3-;g!UQ4m~-d&FQZiM%AC=Cuh-}pI$BL94&QtI`4kVo%C+9C=qaIy
zk~y=eyRZ<;)P`zG44Q1|q#*s@Ro{P(7>m}t%Nn|QtMm?+i>DlIg_jF;R{~*k%3Uju
zzgq}KXH!J?fmj_iUVc|b5xM#<j12nD3uk-p|IR-Roj-K;|I0r;;|lOv{>MKJ^!YNJ
z^I!c_>)*}`^CbWDJXEgf0r7ADH1uS8#M1up1#ei$?;o2pZ^Pl?Vg7SdM@JX%D}gT*
z!B}!yRTvI*W^de0$rA!272NlT5Z}zk!sr-D*RNN6B^48|$O#?-XrRUE_D_;zqEq`=
zt(}rJD4cWau@{;_g$x7S{tMo6i#DeWdK=oE<Vh@&L_;MG8IU8Mj&$?W=l5(SLN--7
z%To}|3k`ijwM2#yWFL3>h|CAV$W_THtHvt~^X^X!{F@F6K<^R=h0*r_X}BmBKhvxF
zv`R+RAi0r!Snp!?>0~a8TwSV(*3|eHX`b_2WhpEM=9*moP5L_tj5n+_!A5uVJf8eg
zmq3FB44j#!&9hX}r)S#-!C3qLs^>E{p=uJ>ES~tAY9q%|m&xnQ0NPUiwXLWap%?qu
zIQ4v*jQ98a+OTmhENJE-sHF8uq*Kf8FFk)bonm8OKpU3Q$1wCUwa?97RvY*Av#}-n
zv$L!#7hHbF&xzxlB0Z@-r;cURk04>}D>hLS*$#iSJ4d2~#0k1-LaJj}3-8B<rSv?K
z!YrTfWy}52@(R4`cf}{&!lGBG<%0|doo9ewF|=tM7o{cN`dB~BFcr<i!z*9*F(L1s
zY=4{pT`2<q8lk&Y-Awr-fpjxCQM+>O)&Mt?p0>i;b$^a_dU_Mdb`GDePI6cl3yZ}f
zbR_K$q<y*9g3b51Y0SyfV-K@adee+;GmqYrb7#;tF=*SC@3&B6VC{JIE6dCZ?!&R>
z2eF3}*Rr_%w-<J5a?<@p(BEBDKCF?;xq`*N=t%;!>K?ud$uW>KV%2-Rv@Lh_mX4hK
z<)I68In;@DW;|=gK2;WSC6f8(XB&+now8;cl9md7c3qB(f?Kb5zm|=>I~;!gDSHzS
zqTcO>BftH0x!!9S*r5sJ%zh^6bXCDAUeuMHF+-{Dv5e>JHLWZW9E)-vc6h_?(V%67
z?ypiZS0Vh(S*F_w%-J<tXGXw)iKTOMcKG+chek0Qn&PLXbU&Oa>3?G>zP9=%Um66)
zpqY#ASNnJ4xV;@DZaMhy3g?nuqj2Y0US|#!&{;C6zhWkM9iEASy_H}{oW9@B5o0dK
z<wnW)qntvqeHHAH!I11dLL)19D^j-Hfjf|}$~%zOi#+#^uh}C~$Q3Z4cpH?wEXgiJ
z)`UxgQT!nTt&~?Jz2n2=7}IkylHN-qfvN`#8G(la{Q5b{o=*Hs+@fDZlN`IH?lT(I
zw+=jZT~;?=y5XK{q%9oyX#hG%Z5BJBEAz}-*pZhh=l!j(GC7}&Ty)d2KW2QDtN1-)
z&)WFn6XC1eo3?8Y!*1q`gVtq(Wk($!rRP|>_4hG);~o(k67yZj)rl4#V{@uOuXcol
zU69F-9+_TK?jUN+<Aoyf6AQ?8IW#qHjY;qvl5d*yqNfGN66J3d-fU0Q7I`r~eAvid
z$Ca&SIGJMTF)DXP1bZG9($D#=fZY(AMuC0rLzkNJ7_}!-KsU*Kn1R%NdoDbWFHVZ`
z&*jRsrtYUELv9s*JtX&csI*BHC3ugZB5h<vNn?iF7338a`lO;!GqYJ$vH+<Ff8P~5
z{sdk(E@x&!&U+6?tvB|Smvk;BIo-|?Kp-0Z5C&e_3?K_#%E;=|1DW|!ny`u#CCBP)
zI}Ed2iB+d+V9cm?;Bf!M>a0-t^0kMf)HY)5YkEp<myvA4O3@^*S#!ymhto~NPqfXC
zT3*n;7L~*&zI$|!Sp!zvbKRGweMlEB_Bu%}%mnoKl$BS-i;V3Tx-_sF2Z`~z&%OQD
zu$RAuJwR}#)WH3fnQL{P?A`-myh`%EvVz9C{MDct=+LisZ##dcNreUne!eL0Vbl1t
z>lBL4iIZ(*v-v&sopAzZ`zzt78<L-bnd&eG3bYoVC_Rh<dn`k<iEm&2))7xYEUdF0
zwdVYO!s}MQ=#J`vRqS0w)-pg<iIMPBud4!_g(+dPw>fj(?<WUWJ7~#8#+K&v(!YbP
zAahrYlBjeA^ckkU+bE^<VYi$GPkD#gTi9K?Dl&x#&PO2@EcWkYa@rE%a#g=OJl<h)
z>VMpm{(MN|f9rMV4)?mm$4?*XfIsq%a$KmtwW){l%9{OwIea)>0b84Bs+l-ieIOP=
zC&uu?_fDhDdyAmwm}o{C?|9ucfr-{^VA&f6s_TD%Q`RQ(Wm4l$Y*80QZe^RXccu2{
z*{kvJz4Bgx%I%b}TMn$sTRrh-X=|gQ-$H+;i)RjWn)?XqTJA5K+}qXjRP*^Y_fk{t
zQHul)7#!RnOZB*A`R2Fs{P}re|F70JtKS|Jzibpr6~-(&J`8ZQSX!BWWH*xZ&2PKI
z(Jwi<yJGP=OyvbU=((<Fi#w;GODRndwoi~!%sss6Ho;F~K*r<)Z8%}2_ME-1$}r4F
zZ*R5c9II1n9F@#i>{t3{7NhabKGAE9@6-99mfWBnE%$ygmAq;j%V^fSpYgRkS<<a<
z(^78-8LoG-A)aJXtNyIKINBP2e=;qm`co~;nmEIuGV>wqQI(_1?uGNi4ikzz`|aMY
z?G0U(j_=nc8`jm9R?9nja-trG98Hho@}e{{o;rLmCu3}#<r{g`k!Ye-#QFm5fA3y?
z&U2T0KV%+iD?O|AdGU&pO(UR3{Qg!XHvkWRK8UVQ!K9d=IIfxs<K>4Ko+^1<iB&nx
zZ$4lA^|I1o_^T_$a?&IOZ421DclF#k<KyXyqOIomtCPc@Eg@TW7cz5K6pyMd&eos8
zKgXQE{`n?6Z1qRl>C!8@<HCz`LM1%=>&LM9`jeq|)5X1UV)Bxs@BndH=2B=Rjwc_p
zi8THZhWX*M`@@cwT*nw54dAI=24DX!w?_ou*m*mLV3vuZiI(8J2ykL{z(HK~2n4EH
z&2@{hkLL|W<)uzHqqTXSEz6|ZQGTkTynurJ_s9e4z&E$S5BHQfwW#9jsJeHln%$H#
zyudHLQkdPdkkOwr9P@nk7Rys92XK^yCQ2n<R9(nn#%0L+ZKW0y@b{YCx%U^-l?)20
z^2z9*rQ+}*1SB5|bE>7vC$dGO2r^Q#hlS)S#$V3s;55?YXUmNI9|&dw@WTYy%of7|
zhPuU`H2}vxS3oNnfAt#<vW0#o{QlXyvM{O-G)IFi2Tn@Un=+Z$S7vD`meM;hKvoSW
z*88R@9{Vg(x~$G)=OL!h2yeDP>6CNv@C<?NA+Nd4RQ8K>0k$Xxj-PrQ&=jj&Z_203
z_^>MO7f&agfOq7IS8N2}qvLR^BzZX#D$w3r-iZ8>D0nhj!HGKNMm?w2{rXe{&(@PY
z;#zTj8rxAlyb-AgXh;V=W2K&ervUlXMBo<Ql*jdaFO4-3GW?C=AK7VWdy$GL!)pF#
ze6);;yf^sn)Uzwd@F+7Xp>D8zNalh+sQF3++tA8KLofT@xcvCp<=~0S{tfb~d=s1>
z$L$2*3uGecH$<`+MWk?$(rV$?k^+Gh$(*YK)KMG;2*EO+l*${5pkkH=AF;L@8G?hN
z5kT?210mT7u{Sc}%{~%UrXLy%aCT`s2`S?9j1m|1jFRsss6+K>Bk+>VG*T{mPl)kt
z`557AtCzVZrQuAMt&3^G5MMN1;04RNx<F=qV4M|jvK=6&byMzYBec4pO>|s#3@ty-
zC;!b}-a^WuWJ0PtsllM&RCA5rCB4h-hr;7k2W9;$yHBrt`FO=wR<X)UQEL0jpG`%f
z8<7OE@fBT7$fVTmVTE{EP4!BpJlV>EbpM8Z^72M7JyX_#=zG)vj{(hGi!Lvu5FCVI
z)fM2jDv-0`qZ}z_kR(%3Tjf=U(QiN)&zb0rYPpAq)Il{dG|SZQ5WI;{`f5AI23>`e
zoArBoQkei+^X=kjZ&9&ZdkR8YcgyfCOiC9L%-ZsP+WLny*O;|TZ+*MPTr-Mb7+lsI
zFJQ?;N><4-n9FHjVb<-wrhA`R`=KA$mvBDFlzBsnumqmSu;bMnV2rbqMLVirE0)DY
z!GHab{Z@D=Qw()O%ij@&crEiXj=`txn2&KhoKmd(x7;rIsYDoPI_=XWW@vU_XWKr!
zx(hYlBwUZWdEL>Q`_Rw$=Jv;cR4o@-lOKo1WIs((7&y}8(ht#ZyuJmKFN3EGeENZK
zakN}w1PunGe#Xa~UBFoB4rgDcYPI7!jerdj85DrG+7R?s{#*wrh~;zDRzKNx!1~vS
z%@@11`It9~#n*%m$sx}h8Jm@|noTbLxYuVt*DU^N5q!Viq{`BLTc@#^%>{5*;KmJU
zePQ%o@F7ml0_kwFO!o~TTT74)SO!s{nKopZ9WZR!7?_nmxH^KZ2L~^TfIULV5^vjV
zHd5*#=;u&&kDCq83Za*l*^uiiLwp3pF5}R?`DZzcw&#v2(~cUfPFiM8S|V0oTzL%=
z<?X4sqqiyGlq{;x<sM-eP74iuG1Qu9`?F<cbqow6A&arMKSSTUKW+EJpG%iTHQ=^v
zI~Jx+&vr-zyh6yf7RtSnla*0Wxbn#9ZKiw2w0k$JM^}y0>L5(mH!gA*GBkcC;e(t)
z!R@37b!!Zb=JGEYJbShs@IrTt1X#*0Ov8!Oa5o~To9uqK*8MK#^)dUpQ+p0_wCu4x
zttgW_ALVuYw2u^<uk0OPe_xN`4X&ps!&MjBumXB&O3oJ;PkjNfs6CGrM!gLKO{}?{
zGz#anxBsmmYxdTk_K_EKMul$1Ug9=2GbO!@6t4`BQ57wF>BwI6vF|IkpyE40WpA^T
zAIIskSwC^*%^-pc8t&BDL%6@n*(?L~Fbo?^@RDti!&_P_1f>;X17i=oPUJX^2+_yD
z0<v6(fdPvKtw=Ci1`*m$<W0SPG>vsTiwK1F2Ug5Pz}X`OjvZ^R#APmni|h=Z4AMO%
z280UnnhN;Ku0~zVv&c;swrldaj<51Y6L~F<Ws{%zjz#=zIONsEU28Op{L4Shj#Xll
z4bZ7;#mjZEC4cqu{^$h%hRqzpQ#=At-9X)$6rdl*B-~tOD{rM~cpKQ<65BERw3|I~
zJSoy;t-Zm})47;6j2O2X2VWSv^d1B+MKKc`c}|;!am5jM^OU3P6#sxk7wsW00eI`o
z8nS{rnh1vcmQN-_e*n6F3vfSZO}U)&OzgMMg}H8~gluG?x$`Q+``gJ5%aH^1@~wQ3
zX=2Pftvd(~KfzDWY&kL=bM8tjp;K#PG7DJ+jTKhN(sCrymq<VBG<@_}t{M^1rNvx|
zwYIQuym0=M^NQm|ct$3Z_ED`pbHMi)Tj0$`rSt>0H@eC42U`HgWz~3d1#!OU9FExH
zzx>m@D(@H0AU4u`$)r)<%#2!(BQv{-Y7h0)c$ISx1z%ZaJ4Dl8_h62cSJ<<UpR#bb
z`kg0WS#<fNbj1R_QW&CqEdO=ym25nGD3k6E{_7qwV4VykFRw6b4_TQk6ayEDaF#kM
z7fD#6lQ|S-?Q&%A^CHMD&t%IV@WFmDy|!Pa<86B_kn_~pvLfpw?|!?6B>L(4GFbDi
zJS5`v@_Qa+v%Li#Hf=}SYR~+Yk3Aoof7>xSg|i~ZvSx<!MV_TvLAz{^sX`r&_Fg6T
z#U8fQS}V}rk@=vYcD((0`imOy%etSlHEO@vX~?(_i2=hnCi3Mkr)0(ZM8<<<#v6sK
zdl=p<T&<keGntpXXAxWm5^uBwqR3vVL~c`$ayHMj)!A~j1RvKqt^$j(kOw0?8Fq|v
zNcaIH)NPqp5=~9c_me<~l-FvF{{ucQ<jz2_>)My!okxwxm%Q%Cah!j;jV0p-Km+s{
zT7s!G?~`)_$U7ra__1XCfR2uU7JDtKh2?&APe$$;co-^n`k0aRBRqkqZ%^0u^JTXR
zdU_%|TO*360o#rifQvtu_xS@JQpSaTc|CJCC>8(!5Gezwp^{c0O??0W1-RI<OW|L}
zQ($@mTf1xpHunmS9PDY2AyWs1tVLY4XE=S1H{?8N6nRYyUr`5M=vP+-LIgTxTXAJG
zrmgI`gMrRH#;1W2+<5s@yb5=QIyZoDH${fnb8X?huVSCIW8YownS+Q+>&sjkF0b8A
z`_EKl30Bn|cCUw)o3wzei6_Zzd?+OeR+AwfMOxCos3yPhv1fkZkrd&T#KEQqe8~&B
z$<gmsv@)KfinDUxQ*;dTun)<qX4KgYsf7&Z@TGL(hT2Xi_>PC~3XEu6<IXRja^r){
z3S(ZOCKkB|)UFN4uJ-dSQ|A}ZM5^|r(XnCehbVahC!44uLx<d!p%)3*s__VTwH<SE
zA=NP%eUTj<EasgK@aA&vgi!y4VONio)g(H8k_<ES+m+CaNZGL?;1&ttttiCJB|awk
z9UQOuC&)BnPzDc4M#CSdem=4$O)5E~Q3pkcf~(@NUa}0eDEKAW`HnNA7YmDcg~`_o
z3u<S09z@C|Vh_4=h3A-X$8pK<{IV&K)$UjF4?fl+BGe2r>4wg>So(4&f$N1w`oOJ&
zv4}qRLe_8Xa$nJJmdsb)N3Uotxl4sjs&ox$*Z>mvxT?9=(rkjR=G%cl&%Q6WouH{r
zL?O|3zD-NB?KTb1iO(qK+5|gzgU;8v&ShKCt<#Mg18W->6=Ckr^A~b>7d3eCN}+(3
zg>S_(ThuYEUvo>xa1aC8K9qzk%ywTMNbhv!>lH!Pf#I6v-MA+3b0X~9=J`DEv(J8h
z%Fx-u(FR_Ci2omIs@)da))(CU!?}0u8n1kSvZsrN(H8G74YR|exI?uras;4PBbU<Z
z6(RWI*>YFD$#SxL_u5TIzeSrP=jfy7uN=c|QzE-J#R}+jyI4};f28mH3V&VBW652v
ze7~3o=4?ChUOO4+wrti&X$}7_h9XGilJ%oczi4=nt@KcY|Kpz)_B^5CQVyX?TSjUy
zh*@^VNf-AgaWiC!9SE2YqzM|nP>uH~zQB5m-)#?}mMtC0k#nExjF&AN%~K6NIo0>2
z0syW!IWPcF+D0WT{kKudPPrr+6=T_zAYV0IW7W~aoGnvro_MyFMDkB1=Ik^QGHybz
z)GoBq+zIM>dgaYhSBM3K0>Bq-hch?lr6AhX*-5NsC;y<#`9i1+6}$T`u}#LjJy#|8
zoF>Sz3~u`EiF%T<zh+0y-HtF?uJzA_O=Q~0#HL>+;3P7+P$i|7z2#o%hh|Btd>xwa
zU#dKeTfdsKPN<4?wpQ)<wR`6Y<d}{Z3&P*RMa3dV0T>!2N60#z#=DRg12t8bB0s(h
zn>wjJb#1c6kgG>8hEVdx*+oJmF9r(?f6{JP@QtDLmaV>FZW%t|gqYh!{q3LfC&x`j
zaplK3But#{0k6E`@zqa|;V1CLEBx)Bw%=Pxbp5&Nn9ALE5XJbzum2jeyB~i^qWm{1
z=ZqWI^<NvQDa1b$s<V6VtP^p%N1>5t;q8>grEcN;!malGrN}!klx|$H!0MN2o`&pe
zA<h@lQ>>0uO<kV2w&=SS#_$f!yo_+WMV0zgQaOcDqxWD~-p4vBR(;=!>FH|_1=H}|
zluK8Hi%Rno+$!Zol-;UoHG65FnkDkHDeDj!=q1n1(J+nfg~tA>iszMX_5HlVm#TWy
z<whE;Np`A$_{#VvwTQ6`OB0E9WhiI;U>Nj4tAOb6uBJuq&DzwHUPg+i1_7BVEXk7T
z3B{W}Uu#-Vz70!-tStq@#4`cnPRM{F{3p)(jpY=+BVmR?ZqVfOhuy5UiS^DG*LUdE
z7YB7HrMQdzlgjh<qjm><Z|8asOLluq^^4+JhA544WqdKE(oK!JYU_y%!$|sTe&e>Z
zphL|aj|x^*Nx@w!^?X*RK53fUJZS{5J#Dj&CKv6aS&m^<X?1O^Jd}-M*=kI=-!Ey+
zkMb-Rwn*zO@EH9Fzc@DIa6zls>SVmrAASD|ZczCTj8O|cADssNEMm>1hscclF)R~w
z+Ten;Ze6{uv4OfEk5>UrH5ehjn5zeEf}U$BZ<c;$GDM_i_@=BEJe3SaXWaevQF?|D
z89Vjt4^P0s&`V`S+;4RHXN$sIEJdmcd(*YGXD|JX8Cr=qdeypxO?4%73T_Uw=~UNK
zDj!)*K6!dhWa#78VP_otv(I#>{zZ2wKGr$Jo@4W_?VrQT-QPl`Lb5RIl3|ET@Aw`D
zGFRKZc=7nngTo@OYuUp;xy!nC)1m`FI4y}Vh9~MdWAFeKJ&v{5SX;t%Zo<I;l-4JS
zztxokb1=Y_iR<ZPSc^GFET6i0Q^)@<rgDy)2T4%%39nE^9W`jve`U_PlUu-ePK;C?
ztc!AuOBKw+T!7FB?|9pd`*--4``N6h@IHhh)-UCJ3}+E^LhKKjV-SM?i(}m=Sbd^P
zXRnY08YaN=o&1JJiNK6@UvT^iUGDFGvHk!?uZ*v}rr6y4FcLG-t3{2P7=W!R4k+h8
z3pYgxqLardLId~(iv(Y57~R+UegA+r7c{`f^r^R2Z9lD7yflPAP|DAqQ71-NlR@30
zMAC?s-q?g3<{41+`+ZvSqmi#b3uea9jAd{PGFq(S{s+E$jrOC2NvX3!J!+YW?8EBI
zaj9)1NjrEOSOi#K(q1NV6PV?eNL=tzdZx~^#!IC$i29+QYCq>&#5~15ftXA6@+cOx
z(!+r-*o#b~NE5w#n{j~4l%pAyey_znD-3NRH?t%gisWi49_>-fYc}Bo4~{o9{en`T
zB@4o8JMS2!BoInOpX<mrSKNFx$C*p+$>T}vQJx;JR|tuM8Vwr%szk+vjzqFOx9bt7
zVuXn3Ek8To5czcgm<~0Wsx;4|;25+^HQ>fop0m4KeB4Ua$e}BaPI{_cm@wNrr(LPE
z8VR)mfDldoK<Vry<sR=yg*^x0u`3>2V$v9@x(e(^QX;8V%p&c~8gu={orJiOEj$Vk
zjihbb+?e9W$Vb3G0fSPJw`Yk(eIPdB7>AUnR@KZTHWgN@iAk8FjjLzOdrpp4oWG!a
z|CgIeH9*-@XG%CBz&-0~H59k$HyEAZjY3pRtsC@=9s(VpWl8O?brS1aGlI&k7|~}?
zB4Asag|v(gqc2(_Fgk$?H`pI>pka)5{ya{{n7KJ+8%h;Ljjf;HVCXX-wjaahiSY`l
zKS>QxE#w71kiL2nOgR!zESAPlmvqxV26~9=b5)CsmG*$iM3cc$vj9~C?&aa2=WkJ$
z;!@*1oWi4f2D*NF1)t%lL=GLf;2Yp)#@q}72LU4te0>zDUL5wA9_GO@0|h6(L@s<u
zzf7U8@s9ZV@(7W<guPMKfk@7X)xw?E=|U7tsM)kvha=UWKmj#sffpV`P=LH#5z8V;
z-<cb_jHy#~+auFXpXq&>tjCdf_3JI!5*{{ToO6hD+?7F1vG>R)Qgj)K99+X(gfV$T
zr!=T79yHriO8w@^wH;Nq*m{$6um<f!il~%!Id!~(X0F<<i(?75u}OJlcT(zk(I=T6
zRByG#Gg{lVNX`vbUCEGfcP9j%twoPgek~7bzh}Al-tK)@TH1FG7yROOGVP@mk7_4O
z(FY0XClU#}jIml)mmn^RhJv*_%WKCF;;(UG0AWA%PZURu!UN}_&~F|X2Ur|HN2b9(
z0ZkK0--4nPGOq<&3`TwtXNy5Tc<|Kr2RB0xMrruB*Mph>tqb;sItuxQw5OTOp_|uS
z9xII4C3tLba(Mmf$A<FJIL$_KD;~s1IW0rqtls^6uPjQUDgS{5!m<B2|1GlI`&V0v
zz+%fraBUaguNQC6c5Oa()D}uUZU(BdeHuKr0rk+N4ePyl_WhV;)aZe4V=wDN_Gp2_
zvBzq5nyev!C&<G+%A1OstOa|K0!Fyl>UjrPsh$3|Ej;+{9*&_MOmWAjKKLs08Ljs(
zN*(}jNN7|fB!vA;F?#todRCL&FHW9+1pAF^H{@%}AO*kED7a3g2O5P8l{PAjy)75^
z#SaOB!<M0kRpH#t{k@10#M3JR<P1Sb9m#&%upY0l&6$gUCA)B$bzhl*aQgLtfO;41
zJAuMIv}SfD42t)vACXB<vk4C{=Gsxl*@d@w`5v%hzJLQDSEwG(_^e`R;!J{9>wHA1
zAlX>(U@Fa*0ha7BikAKdAxNqvJE%=6t@2>hk{!g_j;a9W7e%DlC<DJM0F|16R%5*c
zpV0=PsNdCv7uZowTm@&Rl1>*WB<}dVHwj9LrSijq*Vw}DQ9&rOY1#_FenjXX3cNQH
zVy_rennn9yHh=(zyhDKvTq)%)2PMs5tkbB-$LUz(_+8iHDs+8>QmMGg1Chs+5$3+h
zNGhwWcy8C=<UK#J*+?lWNKrPegiE+lR=gG81x?6anD-@`TY$Ka;HTOHj1AL_)&<})
zSE_eJilqY3`#s9H_XGy_C{10UK}0G)MLO{;n!&wjNz*XbLFxj#2O`Ib591zW1A<WI
zi67&rKOvI(2N|an>8h|`Z(VB1?8H?fRd#A<d^ro~5m_2rJXaCDDa_<|fL$m8##zqx
zW)Pfs=YfPvP(uM&W}PAzkbvBvlDe88oAsznIIRE`B)d-W?k&sFJ&5%nV^9Iudh8)D
z^|MuET#7W^lMU$MSLj0`ttpXq*;Sxd7^*uPBBGa=i%R}p?!K`RDXSRl9h0o92fm_2
z2cdrSkVvJ*;ji&NX*l~)TwTyMRmy?hMT%vbW60N(%RV=(Hyr?hWU_m<foR%N4Aqv)
zqht(Ku3gluE9Cqt?c@yOVX1$MmpjtsLCE7Q|G1=A18J7_5cif;r*)_fl8WtWb`<JS
zc53`P7f4PVbp%zqjDEVp3RMV-ItWXh))v0}_VM=tYTU0x7xs*7WX9{?F@tuLj#M#a
z1F3O)K1KR3WRGG#A$&6s?pQXLeZ>@u-%NdVE>_f;T$;D~J~;@^xapZ>S}j9!0eR!p
zdD$51as9lB_`FXQd9(V|`-9PDIV{;GlsW|<14K|Zidx4jf7K#?U5RS#Hz=D(WlA)%
zMp9X0sC5dW;`R9(P*KJRkOAQ0DWDQ$q@Q<>gxT6r?z>Xzz$lI`KYLgg6NRCsJt+v;
z0}&4+Y={Lmdl4)z3ZRySbOwbF3qYDMiqBWWlJ7&9z`2U1G<pcwQCuz;zqx$7?Jgp7
zIESi|SgZjlL5r4XLBNL2C0CzNX;qdOo)l|(l^E(kj6`4GG<bd6?e)FA5{t^$61Tx-
zTd!>)rS_twjs~U9ZlxM8sN%gSg^<OtxMI$OyANL!-x;%&bt`+EP!<?ehQN}CZk2^Y
z$|FR}qYTQ!Aml*_<?)u~Plw9GUzDdnD$+zN(u2rC=E}1YDsqO(GlnYiwklphDhov`
zi$yChc~K+@mvKefR=l_<E<u$k1FGsps~QcenmMb;?SXBTRUJcBU2Z^f`zoAhHQueN
zb*pM%s0wRPJv>z1=vF-lsTrE9o)oSA2&owqtszv_ybU6o399+jUb9>Y<n$sVDYZ*;
zRbmJjFQRtYp!RD*ZD(aI8@6^bh~mx|_;|3AtH?pT<xRCH>_Y(^(6Eley^eAoGV+Ll
z+`EpnYlYlppxLftGOU9cBG^#%9949zciGqwb)55c)WN1c<8)bf$l=h2EkpyQZo{Rg
z4Tz40ixW|YOO1*KR+nEkP;fQo@zpEct>X@^S9h;N&DTq9H}Z?IU2$(hLaXyk8){mb
z=sFsG_nQ=lFPbRK8sGT135`=MQS$vjXj@cq-sWm%QfWT+A#+7E0smA9h_R`4v}kw0
z3_4m|Ua~p`H(lH22zXilXuiRusy<At#lOeXrivlSOXI8+{-ciMwo=i`x0d1FMpV7c
zFU)n@ZuG2rBbMIcUPb3=$d(@5EdJ-MnPHnbl(Q(fF7j@>vr1hxSDV*?w*UhT;tpRD
zg0cQ7cO_TD^FJI}FB@ODw~<G*;h=%JxQ-j!9W}x2B`@10t2)d7bYkW^CaOA8Gy}QG
zsB>583;0D(FwlCK(dfPsiB<JwM(4`N&kT3o>*(w@>_mul?#;J}sB{lPyF&lG+vVyS
z<>KswUUU?`>{jmR-hp0bGLK+4r6iiry(1R~Ez`|-(MoIboSJ}05b6w(F5l}~dyg2U
zQ8O^HjzYEbr%L^iVRxTly>MbTVZQr9tOw-LRnFH=w$M{r)gVaIV@)2<Wlv>IG?;UM
zr6M#43>40GBF!e0txggmjd(9Itg=;)s7IZ6ZV!ih-xaGC1#UJ|ReS~RtyOj38?ip)
z1;Ib&bWwc_hYnK3bu@EkJoj(G_Q?nCiL=UE_1|2mvk2*<8y;{}?Xf-O2oN8%+i7sv
zAyF^`kGKWNLDa!F8R(g$Y4Nnib}D}up!o&hF9=l#9+^l(B2x#0tm?uS25yIRI*MKN
z6fg7@bq+>_1j=r8zu#|apc#7VL*JZQm{7&Ak=k+JlupNku^#aLttzY2@KDKVTg3u5
z_U_O~^$_9ZNDWQ%WbWV_n&DZG5#dNW_dVcD2Ir9p-Kx>(7pqZgB)F&Z1MJ4|Tu5JO
z2<K?$h};(U;Ld2c`|uyrh7Ygde>z7~d}xTOjQ%6^{<*Mj6H4luF=*Eq#~cOK57-7`
z9LDpW$$I1>m!Vm8c&ad0w!Q5mS?3-N{!#mQ2iLIBHJ<XykL+r?1~7W6ajL^WMr@>8
z#7|%VX7U_Bt(XLsyg}!@2V%COi`fI&!srJulV(V2aZko`RRqu3IAMHz?DT@0bMfOH
z>_?-Tsj1}&e_!0C<u?rDYLw#?&4_UaMv7K1dTRuuI}&nAq@!ek8g@+y6iygl`}l`!
z>LhWB%xA`*cJ{tEHL0FTEC5R-K?BC9q;~1QAt4b6kkkj-7%ysPndyA*PoT7}uYYje
zcDlx?wiMDc5nXQt*`}uUXG&`3hJ7YY?I;2;&;dJ&VJ~WHgn==DT8TuU7JzU_2=@7>
zT!sZ}By~4dN$*U#<qWFfMNKO|S4F!xF0lv`0(}F_*ViFA$c?`sA@XYzd1Dl<CQuDK
z1Kc$>yeCyLO00G7{emuRVT{6wf6h;B@u%nKBQ+VeMDQ2P;@yr5u?Y+~u7q9(CUN{z
zE!1JjS9;-Q6rE4HG6jy_-A)&@zi{li%$B^IQuO&WX_4j!!x@n}B9%U954cZMa=1Z<
zdPWR8n0nFm&R~yKtamn*Nd2Q`jv|zC^{FZS6He7yn0hh;+akjWay-$RVIMi33grZO
zj){2FvwAX|BFEiwmzf)uXG7_oy^1&@=}Zxzim|EGJ&>^pCDl2w)mlR08@)B)dTtcd
zV2{Gui=H*4*L_Tz#b!pj<|~ghy#`{f0!JI3%-U+#L5o(-H=R^gTZVXVzzXFlaq=QK
zEyZ2x6YONp3VpX7g&DSMc#qN;A-$Lc-pt^%4uu8rUa+N)Q7H1z5V4c@{OAeM;L<eu
zth&u%yTt$#$`<P{>OS<RptjRg>??12O{`&RF1?$$vI?HQQx0-SJ1h2%!QPX{7eQNq
zCVeD5o|kRS6E;5zBhrc4i*0b$)5ten)&S5kN*FxYCw+P143?gZ1yyOk1#Mn;k*3yZ
zrlC)wlUk%oDxfF(PG5lm|3=cQ-K6VW+9qbwLqi#;^2T&ncHPuJJwH?CqoY18pa)D*
zHA<@XI?4}^ZQx{8`?O#)0P4*=#_dROOlm*#4t?Ru0rK;#GY0z2<WhG5xVb>2840O}
z(S&9&lFGi$0K{o3B*^R9K9M>AK>d5{g1*Fem%{!qX%Bj8qD=N?P2|^p`;BcaHOTxo
zI*ru+8^%9HjA#EU10#Q?n*6L|Qfa)Y@-|)N6_avJaeud?h>sv`5V4oV`&-cJ?kjSi
z*1NxM*=UkWutr(W#_rO`cg@01XVX4tl3KpM)mi`8z=jdpW_uI+Sh3?(2Aa=%W$^f%
z5A*MM#J?4Q(!FRkQt3&-Uh6%mF^ry;nTj4XGrR|+DE!meO=AEfg>@-J_UBjXXs8@1
z_@(J}3h3W=pZ-RI4aO+kVFImV6yX{WBI>#Z5^Pp*EMPjHPm3T0g!fkYO>F6Kb_N;g
zGGFMaNj2l<6sRxk7=~ULHo1`BH~9lFt%6EEa1X1tU>f<{j4D3;{q%NkYO1a=t3pV?
zcTO##AIG7%#+~5?OWOp5c3D02ZK96XvZ&8Pi!>QrzEyDc&Gpf|;k~uaqvC0)`{#(h
zAa>|84J`w&U7Ghdw{BJ52q(rnP|(*pnq^vVtw=2~>CGhcij@h@mdi_2y?Y|&&o~h~
zTy%PJ`<qQ#uI9JrVv(2gM}6#9d3AHm_Z|9^cr;?TEe@Q9o=e#F=UV)@H=1?ybw{pl
znm#n0T<tVXN?0+x`M~<ckGetC@YArhXo+AOj*^WcyYtsh%%0)hJ;|1wApxUGI`GW#
zDEAv2US_8(=-8{d&hypY7xEKFc&6GbbX*p=*HY`kvCZKD4>P`lhb;|R%0kTzjXUA<
zj%SCla(T0cL#aMttHW?|Uzw+`oy8B<lblbNOB3^k>?-5|`{iG7!KXN_!oCplE%2`}
z`^wBynm}Pi06d{mmT%#cXr}q0$v9kSh=T$pv_egrHBR_b-I)7zXcPUb)%!ATdw~I(
z!tWJSjud#)D`P0}cCEossv9J0BrPB|@k;k=0CiT#bbx{SRPNzAW4p2s{adAVks@wL
zI6jd}EgCicO4wr}y+;F>=hzcljahqbi~aqce^(s1Q)tSWbG1CHoTfC9N5b>X4T{x{
z53jznruQp{CyNO1UI_6<_P!%fdVK8n2{Z6QhmV=Aup3$&x(GtLTaozdJ5g)ToE?5#
zhB2@RNDGj`d%ir2l?>b}49wqS(bZ8}g{Js;h!@`#E5QLpLPwQlKZKl$OzH`4Hy|$y
z5r)A%v6{p0homnk6zw9wms;(j=oK19?AnO~uY67-1m7uzWnZ>Yf)`CHs7No>WCj!w
zCmVJVm27N$a|bSK=3DZhipN~{OAPeR()^r;4jIVv+{5BNL70D_V>Q|5@4{U20y9(Q
zvRSq-8;2jp_1zA~2KKZGw*=q8Svt1;R5p=Kh^)QcF*cA6XZC4^hZBB)@v+$WmHgl$
zfXk=YTxW61i-0nJMM&r&iJJ{=_!emZ>s}OJ@b)C&m-$cj1ye%~kNNVSaD}nkD5|`i
zdF8wnN;NRe3HP`?cBZ4~KXu2Y%YVi;Hngl@F!E>o<)Oi=xt9~lpFDW_-S0bfiR83*
zzFmR|KkIFYmx2kBok8WB4_=1bm_Ep;i<}J^id&)9>Wyda)fDSki<Oj&|BVtWGO4E#
zYd<D8pm-XfxqI*t{DyFoP1Yh_=G$`0ZZ9iTNE>JQqv}<Sm$S&pPavBHhWP2wG=?P9
zI3t518JTa#U{!lzI>J5oOZH<r)WoEN(v3ldPE@J&aa<b5J#5$0)7c{oLloL$%c2YT
zKU49sXk5r7?0UVuGWXulV>qrrr*~OH$is!!z#Pv;6Wcy}dpzMzuLEmyt4_sUvAxpo
zBBzx?UaJBcS-8X4flLq6imIUdoge`dzljvZEkXEW53^wYNqV_<(L_7#Vy7)CsTTb&
z4>K(KIoA~QJe#HAIX`0EzNHCEEoylxiL7aLZoJk{)O-*=qOY;wtsmZ6?6-G=n(cO*
zfmzGM^EXa;EYo{2mlKU;HyX&@%>ogs8HF@Cxrqd;Kw8^OoO*nOwlpo+u&;U~D?-yq
zDM3l=-hcd4k>>$}Z)C$Ggp}ttay<W+e@fx$s-t2#kvZK|rt`o2(|a;mq$0yV{^`a4
zU;NWM3oC2`0sZptypta<tir*8gF5Oy&$4(H)-GQS9J>9^C-d#X7pd655odMZ7c&cA
zuh6@q0RIogR6#ztkO04kkbt<Tu$+{*lDv$nvXZ8%qL!wnp$_VXfsUb(vDtNfsT(PG
zZ(h53>-N8Hs?&emRC`C4{|hno|1&Q2Wm2?r^1ocF$-i9cKUV6ezoFFRj910apL%6l
z{Z}s4kF?|Xn@c5GsR6mR|8S{6`R>8_jy3t||B9)9L#Zxdh2H-tsg1?i|AA6{|4)_F
zr++J{RaMnLs)CcMgGfYbYVFg1iPWMued%>6mGzPTK&hDx>G+1y!-nX8t<?VJihr!s
znwIxJTb_RThf8fsE^03sX|E+gsc$+aes!ditkm+ZYLb#lB2vr$R#F?grz){;uvqLb
z?8|?x)W4wAp8q41x;^;jA1ifnsPkVawSRbuWTh^D!2bHs&^0>rH=0_H9UH}sxAcv#
ze;LP<(9~WMmijlBIz*TsCag{n=C=vGBsBFmq5U5*mBgj)&JO*DOYI|ZsdMv-|8S{`
zi_8CtsndUpsU$9yWTk#y`~Kg!)Vb63SrV6evbprX#MEmYExYrr|8K?AsW1OkOf4y+
z`yXQJu~s<MrE-Lh#eWr3#~A;2Vk-GxVrmh?rIl22I*I=#rV9KerV7yM{!cM=f+VKO
zVTn#qiT^34o)b&xkhyiQ=?ulwDE^z6szVY}`I@NL^8(sSX-Q%#hbH(RG1U*I`6@K|
zUorLmzhY{0`qRr>8G;{Qi`<`th-W-F6e;BjWujGQsTgw0uX}J21EguA61>b#et(jj
zj&T=Qpdj!bXs5x38$%=cn<paZD3kaQbl3zreXyaR_DA+~j}p2ZGF?+q-AS|IG&-Ip
z#<a`e6Rp~|`j%i0x@HLBI#l87isqZ{<miv|o0d-E4SXWQ;^;O2dmsCa9^{Qy>i6#l
zb!khHF}XZDg$#J^=6$?03^zgc=G=9pzC+OX-eui)k6@nY{6u?j3HdV6kZYEa>jNKd
z$39lMn4A2gpd(UqQ$1GIsOj=DKt{Lo99t|Wj^l1PK=mgV9SQ^A8~qUMJt?L`STvbJ
z(GuN8zu04qRQ6Dh#KlY`FE?T6)k*2PBp%OOzAc}~cQ1fV1oGRydYx)l685F-zK?H8
z_n%{$HRiY@cdHJ$Wemg|0Sh1bV*N;BD*YdzF2v$5F|~~t;x}PP5>w~KV_q6^B|z8S
z^Nly9Nvu6HK5$zb7<m9Lt>G@Zu9ABh9;BF#8P}~jFd0WfV|Q+bl${Sw${@yTYvm?|
zV!PP{ikt9bf*92wCPO!&hf$b(s^}<;=`k=4GnYydQ+1s*{t{Dd!F7L$sjiPf(*KC5
z{$j!8JJ@gk5mPN+qB5q)*k|qk7E@QA;OPDqQ&ZdM#z|r-J?pt0I~4ejn0kIpPs{a_
zmh2PXJwVXZlMBFMlzzbw6_0Ba%5seqpB6=#YZYQf<R!?`Ft;JOHgptz<ajbs6kkDX
z`;dPk*%L%GFj7YzB$(p=WDEls%4DKAR^0zIF1Zj%MozC;yUEkTw<8uepy!o%k!lB@
z!bZ>$_Fpm0(xYMlz3ldTNgO9{fM;GS>;#gSs#HZWP`<)T;ULbg=omAnx5m$Pzuoyg
zkX8A38384UsTt$Zxc`W$7)Sn+Y3ZdIl9)P?`p5MyG?FByHcdR?!SLY|{}EHS5HsxW
z3h4mxo?#<f_N0L<NlX=hTI}Vb2x&cZr<mKkzNHE@&GgrN8lIe+T#{8GUW|zLXmW*D
zKCib#Qk(n9#y108Xvj+XG0F8Thvj`co%h>WcZ{xk&JOUFK28j4O*2v+q+kb>&;>s_
zNEXh6G6D&}$n1xRE>LO@C!=2ELTXU?Az0mVoRUJ_$8#+xo9T#8+(>ymWO57MCb*fx
z>O4$mm=IHczLBD#lUAnwlO5xSXiELf@O<*cChcR9)CFf#UYrL(;>i2v=vjglE3^=0
zu1E1($G31rlbgbRqfSD35>By=RqqXKh&lwaS|EuLC#J$K9!-8%t;=tSU4j{1gE~Es
zoBnqGV+MP&>qySWHodTs^6<1G{COUT1#(*>#lFSr7yuio=KNH0QF_?&&>Ml#Llj!F
zZ-WdD2MmCqx+erb#OM~5Iy0EurCfjlQ$!TtP}Hp+2copk;E&GI;^___hTRgn+2R0!
zI$Df%eoT_Ye0`y5Bb3$lq3bi&ymeR$LuU6Q@g7ph&m^!jt8H}518r`u5uU35g1{)r
z0PUNhQ%!vLoC2oW`w14<#0P!T4!_hjH|Z$v*|E6$3PT-Pe`No`d_NM&sj}Ayvh~8y
zf3SJ#Y9h+hgE8{=_jDbevb|y8Rle|3@<D7Tt31mj+(JBSqt%>r!hHv!e2KF{A*kT=
z`eVde<g!1-U4l{V<ELltFX?`zefGE?rG9`kJ4<*W`&jeAMb`kkl_EP?ftU7gSjmlP
z7TeC@BOK=T?+-f2`cf^&NVB0oSd(S~13CAYqa}E5;1#Sh`n0FG;_>rI_(Kss*8KWd
z7x6gdx-5CX*<M=VsFVi9iuOFU#kh_8VX?J`gWzL?P40s)9A&qOmT%nQPDL~8g4rLv
zIsZ4_?mQaG|NkHVHH)#0nX!{?EJ@a}l`La6YiM{8WewT4kQ8Z#v6VF{NwQUnBuU6J
z45f&%hAd-ELPC<nZ(i^B=bYd7`#ZmLzW;syz5ckab8Y8b*W>Yg+;90XgJX`xHNrg}
zwTF608QW*tH5CLrtSdlI0}bkjssCszoL8VcKj!((#`srhc9fU^b}hL=Dp355Yuxs=
zUD0#^=9gQyR+M`-EM(!4K}spcUShr@G<>rn;V<2+*u04D3X8h(X3`9EhXZXQJ~2TJ
z21T9}g|n^d0TT{}<=m$t5$|&{Zx48=-~+DZ_$=p?rio{uC*9Bf>2~fCpVo7m<ea<q
zQ*A-T-S7FiCUriQOAWt<+W00VM`h@Y^pls+&qFfK`a8R-F6(tjvkRx7SI*LDVvJGA
zflTmMwL8wi_9eeRmAFitvRxZF+LY{I?|7qI5W|HRneuIeD*ia728@h1f8LI*Q-YqP
zh>zb%eBy;W4(*lurd0H1*oGs=(=>W`_M*p_aUz;Wa(SVR-=&qfB9SV|N!I-OVgN;U
zpcO|=Msc@~0NEb!!qN!N`Z$X>yxszZoXyP3A?go!X+J?_%Fi!ny!!R3Bp706rc*y$
zq+PP-*ejYM1+Ry44`018+t_%p^QPp52ouNYQ7#O_e?^*-|FJkjku_cV@hq<`R{m}m
z*ul0k>!hG}2&XJ^IWqR=yMNu(vN})wi`VvX*I+Z(4&G5X&K>z_k3u=|Z_p`x@j-|S
zRDl_)STt%CLxF&h3VLx$OTr#xCFllZBaF)!#WAzar>ck6XJYkjLkHy#$J7b7DG29y
z;I7_@Cy7bC*F_tz6LU};rYH{kEZ$`R#t%iK=LB;okPBW=y=cJ=x`rKy_rhGTiC$8b
zrVFSBx|-z#ErA3;&E5=qdy6H9j|%y8o!TgJh6;eIahi3U$q_rr6g?r^EHKSHMV)Mq
z9Do%9?%fN?)PtRrEH0sxC3Kr`>h0)MbInu^yVShV)WRjf4HUeDEvAaWHGZa+=UsnV
zf4y?_dewi$RJ|LuPB-eJZzL2WjzshSB~$oqDSuFD?S4)z_1Jc?wEDa>AuXOiUeL#R
z{Q6<uFn+jaG>Sw1TGBBzoK2^)A4WOq2eFJ*Hk~@leZ1p8bn1*J_l0ywF(L=&3+-eV
z{L=+NnHzfCTS^&wJJL5tzzx;NLN=Y6>!c50qEI1i4t(|~uyN6GQ#PH-1S3l`);*xI
zz-70@Q{3Dxp=>%eJ{>aSvtNy@xCnl{sIWsn?D8qwvKFa^;?RpiDclV)4g)VAFxk=Q
z(E=rWn-I0X^@qNPp%#jeV9i|o83EJR&^schqO!ml_Mx0!1Zxwc3tk>PgVx4n8Br+k
z(g0|grHKJ}?Y^r15ImmDl#@G(Qb;9vtz&OOA!_SbjQwrJT&*;mI);c+_^PUxWt0Av
z@Gv4L4LEFZMqE3K2b>L8Wuf>`Tu^>49u!Cdjmmt_ZZUHTX7jxV_zSpi^fF;;B^YUW
z3ss?fDVElp&Z%o<h{^#4x4~dOd#k@p9uKBm)=iJ&W%;(`&}$upz^}-VMU|de6`oSu
z*P465b86h%GAzdJud}LjJB%s7)h+Cd0k}33l#{u|RaqdgCM5k}47ET;@fGDkYzyHp
zK>0`c2^a|KM`4xT)i-QCm7LFe5zZ%YtZ@!5g|>L&?a?_zbY|<RS}?ww_l9d81Q!{c
z&sB>QDPUOKRQ3&gI}6{Z7d6hQJS<i1J6g~`2J+mJF=qa&r(!%xxJU12Wb?q#C}dII
z0tO<-yt|KvzQ;f$vUt+ogU2waF#s4N7aHxBf;CHZ*?KC4Lyifoo<aFlgH*|d;grJl
z-w2(v2>W~<Cl;uQg>*PnxKDW~SM;#*KYD6(sfqL;INA)HGy=OD1|GW!4q@x5xI27y
zMb`h(Qzc8o8(5m*mXFzbYL17hK)(9s0pyqk%^QP5%2I-8`j2y1D)qC)u>LzzbmjI9
zNCQsa9G0bz^HNn7hh_1Mt(WYs1KKDqjb$W~2@r6g@O4B9s`SQD5P${=kP-DyEB2XB
zpC76a!hxu0&?$Wsbv;jY9oR>MozN(t2+8(Sc+emr)H6O7NV^E=*MGK8e)cK<+2;?}
z8*q3GpeijGv{-`_+JxlZ<edjYx^D7bi<cD<Og~|-^gTySjNtXd@@O?vF0$dt*NsRZ
zJls4fNOhij-ICNc3c7nGkV^&CyP=%Cek6Au*~SJ`>FSSp#HYrgth+p53M@RVux1>(
zkK%G)MhZ|08EioHK=UP-TB96OsHB2g@kdFZt6*910n2BmM<1{ORZ%veimRPH`|LQ+
zgX)wtvWPXu=neHR-rTknPj5CpihZMpa=OR=i!($1jo3$JP*y{Y6SMCAZ{V0dO0S~q
z*hy4GcU{P5=*e%$x&RbEaJNR8$D{&DzERtM9p=RYEMV#rRbJIDX|`Ri6DmQ1fmaJ2
zfblM3f&2CGlP_tX8_cdZc%4N&VFD+4fNo`!;y2{`^%89iWVaebz5$Dgso%vw_*uy3
z5^r8Qzj>*2p;M_rFdXz{8R=I9ynLEh5cnEKzB_c~<wq6NyL(MqDuC$vzkn(~8&JhO
zQwjvE4?G(9P#{?Kzk+J(GICm?#q<nf&bg&sqIHj&D}itIYDAf^0acG&j_lTf53QCw
z^sh(h8_skkC2&e0o##J*syrJ|#iZ8T5gy2)Zw}e))A7m*1t5aM^B)Lk6J2gXh%X2c
z>!jX?GhSqx0UPi`6QEEJ#Hu%<krSQffq-eX>%-*%PXu<4fs^bY7<RD5RBR8|qI``(
zQwQ$=!*s8MEZK>*QkU-OI6Wa_SI~J@vLh6*aNO(My}+dzglHwdZDldov$W0yoqZl}
z16CNWmEInP@4odjem;UkuP|&;9D(qT9CC*j<(<O%JL5f=x5>K{L+Pl42@t;E?bSVo
z@@9t-t_wGTFeZ1V7QCN&(Pccr7gNcNo#3-y=RJwyc#_M}SPk_G`+!~H&SCPkqO4oV
ze2Xk@TPDN{=*Us+X#5lcn?Za*_3WYf73y0N7m#hSh+jqTdsGh<>@k*Zb}v?&ssUX3
z7}(JuTalk|1>oHo43BXtB#q6FF?o*fG2W<lT#eK^i-TPxbACbb|7Jm8{aooRRL6R+
z1B(0OL|@^#-bHdK-Vip>Wcthl5ykEx#xg_KArmVfv6AnxO>#w*-MR3N`c%|e3_?h=
z5614|!uhM{efus0`7;bKUk7xR5jfA_{>xOXWXiG_O9w*zwLJr&tizL(UeRF0GbUo-
z4oX4|HG+dDc<|k0@qqhz6DV9AXcT+sIiU!?xq?WcaQ$W?w^jMTZOC+w;S`VDJsi)a
zA~;lYK=J;_?H@hHO#_2HU0lzYlW<;zBJRl|t$Zc{8w=)i<?9c7JBb4q(g$&ss((xR
zC0CJEIA{V2n!<waQ@GsF@B}jVK8nY|gYN?lzFEmp2XGd%kRwda;#K7RzhlLdoEJU#
z&Q|k5s3QSVpR?OWuq&!Zn0%Y_3`!A`5)SrS@wLz52$Kvsv(8Jt3D)=MH}1j5q>h4T
zcoHxOG7CuxLt<Ho>%n6-9()kZzN!N?-e0j}4_7DmfvH^<<Q`@Gx%EKJ<W$;=u1o<w
za?eKtzK#v4j>)j;#Uj3+tDpLdAhezdxaQFHRh~IA=TI<T)++Lr#~6t<4xZ`X_ux%I
zqlz(8TZS_!7$g?WTj#+$@pocnbxI*l%*ch$W>#Ty@?&OD`%&!ZB1`k5+ED5$4=jT<
zybAeI1jmN;eQ)adjh+z-nGr(_3%hYNdyM~3ojp7?pY#LrzWMF$<ZSm}7z)oi7RMTr
z8e`kNRTS2*A{dDUO%Izg4Vm$pLi$wA?4u_g0FIjKDI4sU1par*x$WY$h$AcQTQ3o-
zwFuo6k8fzSS~VhS3Y2l6hdPVq`&He;nT>>HBW11mGkTHf(me7uU-DZ-wH2ImqR~i6
zS$!^aeSDinkUDM3QeqEvm3`pC(Ifr5Rcj0P+`iSteXB40*4Xlm-Rf`I|3;TyX~(W~
zxUIa6TlxQpsRP*6A-C0$xYg0Z)$#r0v)+*l8(;UsXerp`C%-*GH`}B<W|ySVqJ~PD
zLg;6}+N@ifyQ$dM{r1(WE8nXK8@;BbEvqB_jO1Rf=oSY>Rdno>nu;n~uV5|d90M%C
zI64Gg#H@3)s&dMpxxcS(uX*rmFcR#3fZ0iSHz#7M+5mSc8><Bqm+w-28>dz_;tyVI
zV2nGo9&GgCH+7L6$7RIyTQ{?MekA<Z#7(d3u>n=PE&RkL1;2&s+lrgnGC=+`doF1y
z!wy9qO#m%8B0J6;%-c@=RH^*w&?o7sx{WOm^E+Uqyx8`4-)74G#K>^8Sc!Si-}#;T
zm2}}(;PYQ$-zCHQHteTGsTw;3<IOO&?SzA04BH*GmYtZHoy==H*athV$lqy5$(z&f
z@*arZ>-(KMy><KA&-)L4H}~`8GkG|lZAFL7rtQI9r*{+k8P(T*)`ae|0ac#nO<U%F
z0M&k;9D$ry$jv_HpH|~Js_Y)7;g9aMy%ywN{c}l;@+)2wv$_RKam5Lm2i%)cRexjK
z{zji#m^S`<<HEmyDqBpAXn)t)+DYyGA2D^?{ovE|yC2sM_NEW^ktiuB;=f`l$8?_8
zf5g;9vBPCf{j(-F)aaDd#Xh!}Dr=IV@c)Xb0}ChfG|%^zvBgyDf)f|laxZhuohrf$
zE-#@L&XCF$OZ;|ahra$(&K6UJ%jdE(PFu*=T@O!zIaHtP%xLx#t~j0I(tPv$z3NWc
z!V3$%51l`){VS%fEl6me9YloIlpOw72uKn%sC6=TdV%Q3K78tt%UI34(v4EF-U-mg
zd1kRmChUGg=VJSP;~by+TjHh1!OmUZ4xB%42TwFy{JuE(`TXF^XNhkV$Ipcg%<5+#
z*kbC5S>G3;8tl)QpAjo#FU{^)OFg-`+Vg-vc;@ro<*l#7&wcwo`QBLXJ$En0OGr-s
zp;`tTnRVaV`6xD)S$taLI^o2DfPI)2aQG0j0DOxO)^?B*Utt8-9%4ta8q``#Q>Dw+
zYka)}txCQ&Nn9`ykyU<CzEG%X-6<02^26j$Pxb|U34GxB7a4{^;pTETbZ(kIuvvLg
z^W$m2;S-1M<lb!kWM!{fee~tl^ADX<^>!9&{M{?<^4&U{Ryu=aylIGa-Uuzzt$XIJ
z$G^ct-<?)G`_Ts5*{yo2Z<iD#hZ)k@A|H?h9fnFp^i%A}Ww#>)?JS)oR{AZq@2}Wd
z_bb0>GWl0bwd)rw|A#H6UUWG9O{m<SEv8;P-Cz^^ub4V~(Xrp{;ZH}81mW8X&X*l-
z-4YGMuW<Vq_;ZQ+JSa-4H4Dk>LHT^js}u}&{>eZ_6h?Q9I$V|7c8MJ1d*u|at!oMf
zB+1*=+zMRuvq{p~02pv8PP-8zWhV;+E4;yjIi&MeI1-&>+T7a#=_)W^&t(w6QRw&j
zpNQd~J6>7I-j}@ajMO6Pg(F_TbdvtpJ6hM}^KWY<iH79Wh5}qp6?uu@#>9mI;EuPY
z0phn`S<ZH_cgd<G9!Qb8QpSCtzo`2zOL33uUGXiM@Dl+^1)zGCZv(3&=h?@vcV)fc
znzWm~|M+}HCAI&U<320-^zvHmM}LVY`DbS0gCfe$%yIillq_(or(H-vDD;LXeYu}=
z_OqnB!12d|=MCO}MydN8dl%Bw>;{RyF40~DRNSi@^n2)a=W5iOyeQZ1f=kin_jmvb
z9ROOmAOGTrz4WNKN@{mpRvnXZ$p;NM(Lq3c5itQG#Ka|twj1Fn&_g8<pg}VWh~R+g
zp(({`Eq8?h9Ut=qF5nu=6M(P37UU>!q!urU;{d2wK1VFuGdcr@04enCB}(qM^Pw@5
zF;vJQ0V;o<JXj_LV2knVl=$CrSHDS&%R`+E;d-<~V2`oYDX77CCpk$wEp^pJ=`az%
zMZob?faQa@X7ZhSABBU7-)y?woF-cf06Z8@VA2Q-Om5!OeA-FjoM6E=v^i1jpHQ4m
z6xn*_U6>RuJ<JLK^NmRmG1Zi3CrYnSa-_dF`I(-d1b`%uS<c#-G;Sr9L<>cZ=(A0`
z;g7o!9@8cKvfkvznJihcAvB=uVX|?TKRsaUGf0_S-F?>!EL>k)p^qclKeD@Z<i)w8
z!Da7SG!;NH(Ou9(%q$*N;Ii68fdG3FS`CYjSrh|-<ODvb$MI7D@@<~Tqh`FAZc0$o
z84cZoItZl0E>z#!ym{W-Bmls1ShE&2X6gWNIXW~)#jCsSINs$^hOBUt2TYztiBHTy
zFmn}wp7&Yg793Co7lb=rCewPWZb8r6ZgIWKI*L_D;}aiMZ(i&!I)^J2s}_NUaPxa#
z>6aZhKVm`kKv=RdPl;jr@x?RNuQbt;yhWa*aWT`K3&pbIZ=A;Mc5&{8e83^J#DZje
zrKrNK8+S^N5YZl|<n7cSsto&`WGBFqGjMm|t~c?5yAIV?f{I-pW_2$uqPQyiWrZ<x
zj>G;41ugH(aR0(N$r=byIVdZJULcZ`tHBdEU~m8i*zjZ@TMR4*)=liTVXX&JLL(`(
zSo~)1q2_Xb`77prU6R}k$K(kd2re#TFHUG^m#&kQ_p3NjrqpNgD67)d=)6;K%;(7T
zi*-E8v&62us(yF9`2N{4*|P5jgqZDB&07#Pp2ak%JzcZ~M-c46-vFBz3BE0YbcA>S
z3(G<jR`7}#2ms{si4a&c?bt}xlqiNG^6VY}bSyc+SS5n|PV^rm-5h6CvqXk4l&HUS
z%C7h<?7oTuQF{HoO|6F9G~aiP7l(0!`Hb>!!QW#(&TuM)&j8S@XO|t`d=|MZ{9485
zN25MvR+{^V?5JTVxbD%r&5WW@u3B$_K9wmO9aa-EOXje2m>bCOfEl`X(~Vg2X+BAe
z{CpaN1`y~|dxx`R8Ad8nAQXiM*CXBx!GRiortJT=Ig{z31>rX11Qq<cW}ykoxoE-1
zex`VHb8+^db)52pUmr@Hi-7#<x=<V|4O5kU-FeT?{DH;mw8cJ7Xm!GZ`j6-wuTFNp
zzzu7I4zXumDH`-7v4AB9l`WMtZNp%MZ~2w9g$12wnfYJK^2XWkj*p$)UzEGwAW{%b
zsXW?@HZwar*1g6o%Y1e})V{i)!81{ooMj>E1^_}H^Dnbqoqdv>CqBl#c<nrtN}gMW
zaWE+~S6?o>d(Qax(wCZ7?@Rc0J5T>ve0^={YAA(MQsdzF+NCzWxb^-$XBMw-y$x5!
zI+J-01a|_|#5X`Nvdeqkc-&hFR460N318Qt>w2VxvSqUv3Dx_0oPwdk3WY`GQ|M4K
z>xM2s9dQBLD?Wm#P$$+9$~diEA}+FwF+W3k4HxAJ1Eyy-0FIRD6rn5tM7e|E_IpN@
zMg!{Gz91NI0tE+ta@)foVBkUBjxL>D$5@7@XiJs*l3bXRBYbUc`yJg|B?$&!6OQaz
z-A3$u*uet<4z9zFI#FK4dB8QaYg$MrDl1eR@PE+5RcWY0G`ug|i=ox&RA2VmiDxJK
zOo=A=P@0b`NNS+jw=;cbnX6^}&6k6#mWa%-fF@fIT#S0`P_!0N>Fk-eI~2$v0CYp8
z@JC2wtX=I7DqBni3CDn;^+g~K9Qr~_IRz|K^v2GazBlzH{+GBGm<tErFnfiANCF_M
zInRxH*1^i4^8Sqkpka(HSc{<jD9}90XsHTUm?E47<|sNG02p&rQx?GS8QuEl&n4nK
zDXkLfy<S|F6ks!k^5KLsg!v#zOx-m+Wj9|tsYn_mc4wbzbQ&kd5k{$gLj^p52^Dzh
zHzQfA#%Tk+==X&$<*PUKp944z{tq&&A8knIrevq0>Kkl>3*bPZBX%en-7+eJFs~(<
zDnUw4dm<E|K+R<ixa;#yL;&EO;@{n(EDQXfc%Y7#V(6X7Q)B=VJJe*S5}aq~B}Qd?
zsyexZ4uTd-7N{weHgKW%f0Y97NY{9Afb4+Af3#3RTwut9trztv>x5A)80ZS6{4yBi
z@%k>6_(!f}uZ@F)i=wMQX&FEI`47I9i`^vaOjIExd?wuAO)?`BsQGfBYRYat5U>P=
zWD&krv@a8{b6^<#;-VS_asl*4T|Fb7`a@vm!`()Wvqg~OX>H&vBKr+u@0RVU9;tpV
zvBUtEQ+TTB{cVim{v;u|+{yODIGtqJ4)NXw8lsE=)r-NHNnxxzqD~2w5h6X`ir@tB
z0sB`PRYntXX(<lmid@zjc*;PAJy9=fgfNeCvV(p%(GaG&aM0UiJtMK9&J>o3dy_>B
z<Zb**z{s8=S_A_p7=fGsxu*bOqQKWX#c!g*KP}}kNJdCcTBAuL8WcZ!!T=Od@&2Dz
z5jvcl=4MeYX1<0%Qp&qO`GzSeKzx%PU@ps{M6pRR`}w;N7L#(L0n}%p16o4I`WJFi
zM7J1*CkqTgVrnzvO-an8L#nuEtj1`0W7Y{7_Vh4Sfud+`0rN0WQ!tR#2Bc_QMvW%<
zG_HFc7K7f$?z4;ROww17Ip;bDC=Za!2S^1yV2Y`-_Xm}<lp`Jh%K|uXUnguuPynZd
zt+o=*Xo_yWq4T#79KgwlJjP6bSd;$A5BJJm>2OkX00)=SrQb#Kv6R-&it6iz#Bxff
zcBL9Gz*+wG<+vp%oU*=BVN+?i($5e`NKu<8erM4pRZ}ae12hG6zu4pm5Tkxi{g_;T
z%vSPaveL)FG^W|fk5?mLhqY<@m%)8B>#?+t5IrCuENQ>(<5z7?m7(ilfEKh7G(&m<
z#sC4V?j%5TnTq#imcrXrmU4UBp(T26o~tR`v;OBKcZCM>N|6~Fz#n4Euz4F3@>_;R
zy#_{nD6RA#gqrT25borcPfvZa6AAWX=fa<`1wV3?w}>!*aIkpgwvd&DJF3V`?9JLC
zDfLnF=e(33k<26tnR|8ca|!t><3G5nlLojbfiL}I$;tz@o(CfKO~}Sh4ok7E1g?K=
z)uO!bGhhw4F=+RJ!mG{=6<|gV0EYqG<^T^xyU*~slrZpn3-XT;1%{?<&KkyD0N@zl
z$8r$|fD=uudBC<+nSf!>;N_>%o1{~u$!_j0{nP7)5T!z=`S{A00FNFe^H3F1K)#J2
z<tcx%jAG7#mZUzVh(@0l3#P381CqT*$%R_J6E{Hbp!v!vqQX*wT7Z_6HTLH}6l*2i
zt>eBsQXlsy!tns%DaD2hfJf8bYg4Z9Q4aiVn}k;M`NBvbidr&89Mm|X-t)k+@+iN7
zQ=>8wQgnD+72p!<k_n&)2?6&9$ZD024DZB%p2pl_YtV8Hr$<9lSQ3{K1#|`2w;DO3
z3oTrM!q2~fGDU)Sq#)%$Wp`<&5fDr55|UI)l|TD)tUiTxhZ`-ym#)1I66L{A6kVG1
zB~&x5w5Erw)IAfS^`b`4EGBuKnjPw>!^eX?5^a_olXjfjZl#45CEDbPYcx?KD<n>*
z96!5M>-)YbxhN^4sjB-h+{=TbKNWsjPxrJ^L#r!2IV`E~F#L=?1Gz3591YbkqP6_s
zAQmNbRZR3*-_!M|kbdJl(DV7A`LC<UH|MF~bP*}H*8WM$!+e}wjrm$`Njr|Lbhj~n
zw=cr!iXJ`750i9*(_eqpolA84$~RqFJhiOmzPT#6F6{o(L3G3DUomz3tov`H@<%BC
zoo4sFhq*GpslQj<?LBiW-n)aOJq%L$w0^ilZ{L?`K!8I$IM?_~{1TystWi+*vCAIt
zUKYpiY(x<s&pxa4ceV&!h)?~Tpklgdwg<}XT-Lc95iXV>TTHEjBNp97TFza}<~(+k
zr!5*Lvwsea@RXJI{QnVCGdzzLdMa0Ws<e2j_Ij#K&C2@FdaKV#BD^AJSanKX+E}jx
z9UCuQH?LzM{}EH)atVug=}U`T_Ddx0P(?<)u>TcP5#D%dZ#?$jnm$3=o4CdnR=v&Q
zyv;MbEegFY3+JhR^OlQqCJ3t4+P`8d8Mbh8f8H8#{vSnej2=thZ9#V41EZNX%Ozkw
zIMYd)=_;Q&6Lrqn6z<}4-hF@JZc5VAlr$%wV`qKfAC?we)^2)>aA9CRei=TuP>VR~
zd1}^qpG|I6SsyC-y!qgwqhi|Zx{trQZv>3{vR^KD|8>u*;{j8G7g`oC#Q1jjeTiuC
zjonU;T;!i$qR7w}FNfsvtHWbNUi+c^1VU2cdwr8``&{<BPPO4Z@O7)d`Y5NY{2WE(
z_4PV;@P);+5Wg&TMtIV>^CI=xrq^$_yv~`ro{I3l6XoX`l9GGOUo>vv?&+`jxBafg
z`4?s^=CpiGg!m>e!NU=H#UWfJYyJ<De1g?8d~Ng*`)P?G_2oV(Puv13MZAL7D4C{>
zmqLW9rkbDM{!*#_&0#<L#A5T+?Jrf>##j5kFEaugde4*j2~t(x8hQhpVJgVA&X%b_
zIwGh|I;dSeh=C32unFpP3wq0zIpTu4GJ@V027Ras>TU_@=?(fg71X;H)VCkRL<ILs
z2M?$R4`PFdY=Vc~f=5DvKg9))W(1EF29H+-e{Kn$=nbBn3O<-x3!dH&W+6gmq(f%a
zL*}p{^EM$1ZXt^yAz$J`mNG)V7KSWWg?wuXS?LW~oeEi73;DhuvW^J-AsxD*9=eGQ
z-LeV&=@z;j68bAHbSES9cVXymRp_6V(7oQ!zf+<6YoQ1Gp#U-rBohYK2!j}hK~IJK
z-xgD!hpV)PtM-MfO^2(057#&dXAe|r%0y^sL>y=vN9eFYX7`9=p%KTgMd)QloOlqS
zkK7C{r<rDP1eQl&-?53+<V-*4k#!K^NTe25V&={!)_v<9I!Sq*s=&n&$OOxv!CGQ8
zvKUkYy`{gNj5lX*fjD|Z+9h*e5{r~!f&-%?b*ujsR*imfo-5kY&w|-sig(hu=z1#E
zKxvDNhRBd1nPiCEI_St!g5%>zLyaxd(Tl#uscyfh%4C@TH0&C%P54E%T;~ilk5?Xr
z*_&<q%3R70;~<36u*|4yMcYAlqB6}dIa45n>8PB4g;mb1>PxX^sS#{pbv-2-4Py(d
zF-I<`W+q!-;!s0_&#iNk{4O03UPpPZQw>s}{+y9HVq4ZbDG@0<xnzipUvwB3nDCl|
z@SQWEbtAeQ5*QY*yq@Al*--$tg1Mp`mm+h^p)!>COs>THj;WU91f%1Z)X+&+$PhjA
z-zt}q$-pHwVCypOCqXpo8o((>fdpnn=8AC=I5{(mB1ylJ-TY|e^()uvIUP|jPd{iN
z3g#Hb83<g~2;+zgOSDbCTys38)-k5eaaV2{YWWLvo*A!zi3!t))C%Lw#9Y?P;vi<y
za>!9^VU^&xr{5Lj_&wU4^YS@AT2O0p&adQdjjf)(?do4KXqmmBX=qk*Y-SjzBaY^C
zz;(mySI`m2d8O0?J51CybRyaPlKE>`&M9ylbI%|;ruR}Zz9>2jxXO;^2sj0vN#2@0
zvNh)zJH#0tWVV<0eJeUE5le<>Q6MD0oy$%;7NM84lv1NpqAl-mTx0%Lu8twdaDIHA
zd=7c}+9>-P#eU&TiMthRe_`Q6a^{6EsFBSt>#`jw0!QpB{eH;3O*`~|5L0t}glYPz
zPV#dJRs#14712LzkK82F98`Dh6V?k`O}XxqFV+MXXC~Vu{{B2Kf3r1)>yO1x+hOIA
zdjX$ng1>F6P5duns==ZakFN`}EM8(vPVm6H+{9UbMo(dTP{!Et!;YFl$uOtmbC1s5
zr7wAK@AtV^ou&eJb^aGIwfc{u!-z_?$9;>nE*=xomx1dAng%_|<n({k{wllo?&+>L
z&0(|tkb7N@ZLf^Kj`+Uzmo28&98XjZZRxL%p6i)cl<!IHwXEtvHaaEOwj_@fNnZN$
zz0uhDx8R3}f}eAJaex1s<wx`B@1SY?mU^;@!m}J4l2u&-sfWCWs3}@3n%oT=d=O#4
z=y!T<NupZg&VR&I`Sgl22`GNETUze&XRVHW4Ao1rlg~CebXno1g>r+p)$v6|d!>7l
ziV8UnXD=VVeI}sce3T9LAeAi83@;NDa>>8^KVqubPnu-G1v#^%YhJsk4#VL8imAVS
z({AmJa26#Vx}sE)s;qy<U`};csVv)4|6ein%F#!60~(J$zJF!+XnFB<edQ-p>}n@z
zPtuS7DPnSvTp@B_KilAijZWZ`hUG?;=K)hQ5IqF<93xBk#~eh?RkoI|M)Y#A3CTSB
zw2TSKWFAr69Pmc%_2lU#F{k~BFAq$LmF6-<Y|;iZ8+r+UP%p!_!lxSq&+ytxJ-qxz
zqxJ7@_aS4F9-CLiQ%vDPCkVnkLIDc=r-W~r3)8~+|7d5N^VWNM>ac|lxbqD{)0xey
zj@G2t2kabZpTh6kgE-_Y>`RcE$qpAz2?wBTEwGnRwj7SGhh;ZgO(d@B3>=l6WgKIC
z7(nuS*9(xY+GSI_UZ53cXsTy!e50v2sG7*holIWI`p3s1ob__QgUBX4b+l5DHEB6H
zDh1SNvXV^$Bm;TXeE8%5d;UsqcK7|&X`=x#_G&!a!_YG?9VoY7T{ugd%`pheHSHKn
z=M%7(->+RoOgK2fbiIBPE+rGaQT&!N*ikLAJk;l&-uLD|RnG)T&^9LxEZvrS<0f(8
z)k3cPMx98Pqd;aaf{MsiJ*$`B@bzSR&J}@?ij_vE8Aa7*-AMWPCbiZ#2iU#)8Sfp8
z-kv;|BMoEc=bF0jI3g0YhFBa|v&#7)Cq5Huao5L(A0zN+*kn?!AY{ba1-q2!q&$<=
zb~Q*c;|WdeCbMNHyPBqGHS{Z`NX~K3l=n-POI+TUR_`+qESdGeXi2e-`M&+g+XSAh
zH1Kh?l#iSV6rR-BEPQeY<A_0m)oPk=h2Xzp>d@dm7A%}no+5W<ewNg@l&N7#O53Lo
z3lEmR)vbAv9ug}rIj8jQ#K4P;s3v*o&GL6f8!s~B_T<r!qc`JLATm2y$%f-E5D|H$
z5|i~X9l77Uu6uGfne}gVCEs^N)e@zXCf+@T9{pf@GyL$MtmG5u6BZ5>uwXosA$iaq
z#&HyLj;n4Sq#pbps%VbqajYkZO|X(q^x%>4dWs4ezb!p^wBa=cht)z;Pf9Nh+-cKM
zRKOKqce39&wCKl)wLIE;VVqxPbqS{9*>8#Ou;U>XJrZgsTj4zj_i~%&j~k_CUY($2
z?Npl?91^#1tsc0wlDlA#jOshVC3kP4>8*adMQ^IzP}l~}SJmZ2vI>Tp?-&L#awz7F
z{gCir`owwVVmvuLe5e%NNmGuykRC;=DLK}B^s)LbuLDl*_V?WOlQM^F748a_7I}OT
z4!WFp0w?!qvgoKysj`Fd3`3GhPDD?jIivvxR1woer$@G5cePaN6SLEHGV8!zkuvne
z>%Owf+?BGpygAV#Cebb#1$(|+BC(Mrgl#<Mh^H0bKH1r!(R0qOL96Zsf~Qg)Gm~_7
z%|V#yWM+M0I5W!SRyEN>MZxnz`fL5V+DF!WzIe^#vyHN~pQ_DXqj^)`Bii`#D5eHB
z6`v>D&r3B@NMb_DTn=e<VLSD((>aG==1c98O;^<;9m8G7_2;-8J*rM<bsIG9AA1r4
zaOjvzO#ZleM{Z|_eHte?XVq_C|GSi=yoh#j-FwxvoxX-G0&!>X5JVf&OAVRbC(UuC
z&A*H=E(^uiS-r9%-{>~BgJ;NA3Y)jy2KgDi66f_ZbZ9ygV5T}R0V5ymiMA;|@-wh+
zv$cwx(_Kw5RlSmLFO8Wg-5Ls0UGsl$@m5ZR<KuE#pdqK#((Iw1AMK7~W=@g~cRFlD
z6tMQH93n5@N;Ao;r;*O{QEaGSk@h3#WhLjf=X=SbrNc^wd-Eo3C45!>G@X$ZWCWKd
zSA1Ai0PD?J#mY}z0T#g*AELQ9-QP>*RY%-d*emy|#c@V?SpQf<=?J>Z!|hT`?rg>*
zU6=6BSq|FH<3D)KnK$X<_bb%nxcN*po^l*M&DUL^nweg8NOvd2#EygCZLmwegP2Er
zc6W%+clPdZ;!QIi$&z$p^sMZ(9!-A(j8ArA2#-*@%H}R*1h+B|<j04T#Z?55A;}VQ
zMPdY1#rDjjC0z=U(qILF`~2h#sI<~oPM!ICJ}U+Ja%THo8hJpf6~kKw`aGrWR8E-J
zNd-}3rEf~xFKA(U^PD?OyxXyv>t|nS=s`C0_B!m6vtv5+1pG-~wFItbA1QVdJoh*`
zI9t%{ei={4diWKu{?O~*vK+D~ZbSXB`7pmZ*<d}W`N{=9@|OIh;@Ddee}N1UzcOKr
zn1wOr4bs5_DsrUXl$U_vz7Z`Y=OG4hEy3`lMwf6%Dd{t0H_}mJvg7NRc;Yxe`#S`!
zQ5Oc5+r5y972*v(+?3p6S$IpU<}+43(_B-d#3+{}rSR#%1N_NYF7v^S`DsenOJc^<
z?=4HvkQ9|z5UBMteNRGxv3A&0-{VSV+PM|sY$KA0y6CHaps=vaH>7p`#NBN#?tRR@
z|AuWM`Dq$0<r5P6toTCm7CW@7zQH)iHW{zP&|6b-#&&^ylh;f6r_D%lv$m;t=r`Gm
z(R)NfTK0SG3x8KzlU1N!%E@V7f)_{M>UG8IOtfVcKt5!j1P~rC<`Y!e$b$*#I0paX
z9PQXBNH`5-94t+uB}kFl#At&GVt5gf1h%&AxObZX3!<6^8eedgNb{(D1wvc33q-q0
z&<P^;3<1(-lhFie)&P`1(%8bwgqbLGBoLJjAeu`FDnSoQ>mlN!@dop$##`V}Hm<sr
zq{0PxmDQn{)`n#3iP7x>R$${*hHQ#QKd4;{1180u6EQr5w)YU)lQ!W3BVDK_D@47f
z`}(whRG<)fF}$K4?T9yCgx-!#!|S0v^`0b1?a?{)Nvrq{Sw%USU0LiFgm<x>SWXlX
zYa3Pbl=o>{Ip3i$PmnUD9)S^sNO+7M6pJAU)zZhGFnCWhh&$5j)+CW73WAg%MNg2z
z5MJI*I#dr{8G0Af6~FnFmzR%#Lbub=@uFeHutb8eQ-Xj`h8n#s%Ly_gY<4l$OKF`b
zOap78@Rd!|By&8<2Ku-7pj5v`-Z;AL&*ioTKfFK|L24^ri}W$ZiDBfFAX1cO3@wY%
zYkQRql2n3-qcTV|eDw)ZoGnSO04FgIUh^*^mNU51@ai;*KApf@J2w2D$VsOhDWK@n
zAgYmcqBowmmX6$`7}w&tNYo>dbZjJre`p>lDQ`+j5OQIVf`|e^3A!#4a%BY~PDG_V
zke(9b#5_b&fhtl?g^k6FD4|(QK1q8}gGYyn4N1KKKzoCSFN5Lp?E*l&F%XZiC#sQM
zbeIdovW2sDQhZqysanumSCT4?Y9h%%Mp6)aIF%iSSQbvCsmPcD;;SWi&oV51+L0?%
zW3huaF+ZY;x&2{%==rlg66i;sT91s&OI-A!@ClZMry|@>(YM#xgg_Eg^bvtS7_}yF
zv3XThAGIZ1$192yoxqhRq_OR3Vwi6g1Q9NT8VgO$;OEe3#Jeb}(@wIAABu>jT_{RZ
zEpxe?RT_OPUKdJL8wCrw+#}YPk|q|<5TJh_ez{WjSPPzJY^cy!PatFv;|L~F9x~!+
zZ_0IEO(&xN7L~N<rWz?AXHt%KX$xMQpZZNS3okS#l@PNi`nl(l0}?Dv6O640dVdv2
zv4#CJWyUld^9e*&8a&`nGN#`qv7^oh3Jg$fhCz_p2~#D~k!2&O_ykprbO08oFzirm
zC$iE=1$H#kue8(U2=wIg3|$~P-eZ@cL<7*dP8j$jWBVt@mC}4&heywozF9-pY~`k|
z64lBTI;98_9*df}O5^=yM^s1rK0GmIJ|WgVA&%k$10dXbP`>e_g;@Vw%cF^w9pnK|
z-4wZvTjww|I<;KN%!lx~v&2~SNW@bPk*CS;NMB@(9uUPk^oFR$>$EsUBtLpyOs!B&
zp_`(LekK=>!L?l(C%jJO-NXBreqiJd9Qn8!@Vt<yM81J7;r)16!E1-e|2Bha8pwZ4
zc3j7A@29})@IW&@syc~=(2?*-$}x+2B(Vmun8l4XFEpGjv%((Gt|v{U-NYH}O$hiw
z<a?IP>xuFx>N5mEev7KT%Q!ZHN0}>J(<cd|lGL`qdezHxJ%3UM`>*-i>m(IY(|uz}
z$nYz=Sakf6O4oPlcuq;LJS_Cx71inNrQ<2G7F^4IyF^R@ZfV%R$%Y`J*P+CsbJHjN
zMpiz;mYw;Z66f28e?wH6fREgA@9CA!D=NDFE5toYi%tA7F{)H8ORTmHtq;ABLEufP
zJVKs$Jbuo_Vaa4k+Pv~8X+_dB`k{zlTWA)3A)EH(E%NDZ!qb|kQM))prG$x;lTtVn
zY@W;ZSit4pr^KNELll*rW=d>2vUetEXkcIn3;k<!5Hddk(e$HYquE(rGPU|0wYx;B
zV(}{;MjU2_BbX-b5g(ln5@QiP$3Hhjp|N?D`jP~pt%PG9%Wrle*RixCEGgsELSuG#
z%(6;r63t+x?^n@>6HqG8Z{nW@u-^^?z4K*1H=US9?AT>=V9}->Rnaqag>s_xE<~=-
zw*PC1F{a()Q6;fl<InEH?)DY)GKzZAV9!%;izwXc;!5vLKVN;{2T^n&flAzYZfu_0
zUueta$EK;<WOag5vB9QA8fEPImR7#(D>ge#VB4zbNV-xvk&9fQKO|b-KCD5XGOd+*
zm(*c_g<_+Z18U063n1cjcN2`CY0p7|z+L9lc5uZmW5ArRVk)6m4==w&tkS22>fw#a
z7v>bZrybhxjSo=&&^QCDP9LihjQ(+KDd7~H@Js(2(VVgT)+S>IB6+V0vz2ga0x#wL
zS^DW2-7*}f6`1=^f@M;faZ?Z{5P#zXgpY<p3)UpHf8*{cH>Bfuvj9US4aMUc^7S+3
zD^EpmZK--t$ubuOik0xt4ZE`^u~{G?R^N`z%FC)}`L76ES#(+QWale7_ezjNE#>eX
zS4<?GTQ9+QREryk-@kqI;ChEF8&<6!>uC(-WYT4wTzd5}2tb=JZ&i#&IcfJ&_vMnd
z*=CWzCe@0-Ndx$z?T!T=kYsIX{C*4t54EZDZTkPTiGRg$s<sJKx}F5T)VvnJrLb!M
zH(r7rk{?Zi$8@xs5T~V{A&DAhs0*f6Ycm{eMnScr79_0Bl&QBZHfXDTAlx*IUp$>u
zNRtujT1HE`)SjPx3iz5aYpv|vjPyVP*pA66IH@esGE&^XVbyFS=Sa#E%K|%-9yjB>
z!sw&ACR-5Omo!;CE&9Hk&1yo?c{h`;gzxd73F@+{DM)OoM5VoixPs?6gx86M@aC%-
zIo;PUCmQQXx_mgVTvc+U5DM95uQ1QpeIfIcU)E6x@&QjXVA{yf6XQR$Q>1NFa;V;)
zN%H2$#OohVI~?Gpbb_qBL2%VJZq$N*55q?^C`e}<Sq6+JDc`Ieh*_28Q^l(@ac|mP
z!}jT68SRV1o1t+5S_gC`CS+jBKlRv#bsWR|v=0xI7!pMfDWMSw-Wtp~{fz`Wt%X+&
z2`nth(ELUGQ+I(aswYJ!aQcH@u7tz$I)AoKoOL{~$@}t4Zq?CB<2_ukLB~U%WhG`2
zk)i}gyQ<UgBT%o6aa(SMbayqp3MoLyYS}`m{Ofl7)tbk;EG0R^Z!ZixKAh-a*b{0u
z{9=>qQ|{5^{b^E$YQb+5C$6sMWwejjmE6<aq8QVtCu@o2_lLFOjUGVjVCEX=Z&zBf
zTEPdZztsxscOGL=)ZO2YjTP`y8G5;9zfD*WLG*c3IvCDMkcz~46|VLdhVf*^bImc(
z-Fnmt2)ASxR&OFblaTSf-lBF5zXkr%Xl+FL-nj!j^{yud5oEUDtPh;Y#tpfmjm3W;
zR>4p#lM><Eme!8Le~&P(P{bxvurVh{OYF5n9Rg(lHywQM4^gPL-SAVyNFh}E4@Fwg
zMpQ;Y=|*^V!pCbkJSq#E$#W$~aJTro{&Qz&`PgU0I^cq%t{KX}8qgL0sdGsXp3xrs
z+&HG($Ih~LQh>6O0FM_Lq6+#2_E#soHlV#ueq&7g^E%U@;oh72(m(9nCj-hsOykQp
zjjv;x{y?-b2~7-xroNb#xjzjRZ{FPa)AAsudHPQSry>29L2K)qcA35QYk$~KYNLE?
z+et&l9fMA@SjOu=3<<+F$JlpXO`WG=8N}E(FNw|CkoSFWTHIsbyT^WrXnOnk&4-tJ
zJvU;zVhlT4V;jF^8)2wT#f`^2UPa9_RAsDTl2@g761XL=!tyA_^PoXr`jH*t&=-oa
z6Mje=qEBiT-XS7LM*6XYp(B3>WSR$wMuVrW4*z2`pkg%m;ObC?(V(-@h<5WxMDwSF
z=22~<vDUwX?~FdnG!Jh!f4=v3`tenkFEHu*cSQT@r)x%o$$v*h;|68+`@0XCS)6gx
z64-I~xLJ*s$>aO|#w}B);>H}~zMTB~<>l2+58_}ujH#HoA;#6E=T|3XjPx;(DdK)V
zV}HJ{Wg!&13~5=_-e0?eoq2#=?cSewiCt)oTdBaVKi;1_ez59`Taz&!{DYl2b+G;2
z)(`*3MDi+k0bYLy$6a=fuZ$>Hc5U|vLBIYQw-R2zfV%gbpxxE_TZOuJocISq;->lz
z45OS%OdCn;>1)eN)o<@as+=BT<y4vTrJD@64wV0}Ys(b)9b5V0>D~7?+^vpn?))cW
z$~sBsXm*K7n#_q7=uta)iyS3~M_#}C&)eSBy)ptl#Ku(f4E^J3PiP&uzRx6`I~4r&
zpDzQCPCuA+(fsK({6O(t!2BVdz-|YV%mDj}oZxo_es`yuc^oS~=em9yF&}rRoUXC`
zt+*A<lx5I(ktN>c3X|eVA5Uv4l+%g{eMs5sy;*JU0mBt%UPt{s6cse~(*IN4Rf$U>
zlmEMzI<fsV@_!dorDCF1|0AYK#YX>_`&UeL`{O_VZS3`>gScb0A?yDYQ}?HOP8YMq
zR64*Rne{(n>Y(j^#ncm*^Vms+JZeoS2K?{LsWybs9_Hns7SMJ*yiU8T9G-u<ssN7h
zT7&cBciKA+)|HgYp{R=!+3(iGhEQE-6(N$SY`USqdj;Qrs@^HyhiaIr^g78xl520s
zzSFSx?(bZz&8<m-SE9a~VmG1%KI&YuZ|6BY87tVUw@{E{Gn{8H*k^d}#*0>m4l7@E
z)S(YSiISFnNtt3eC+eNZYO4z-A1(Dt3q;&qY`RUm&rl(Phac)lx#7Bt`y)4;ilK*V
zERrQYRw|uKjLhw78xq!WE^a-2va6Wu?9V;n(bZ+iV|r>ER5I4{mh0^^6Kimhv(jFB
zvuR>l_2o$~**);<a8GiHIO=*=X}8&{prkwS>r2P@Pd4`y*&o(&Qk=Y4QQ$XV(mf-e
zaA^MFE%$@N^XbDAaql@sJE^6vdFK`bx{AkAe2KIa{M!p*Qi|i*d2<<euGY<D@umIH
zLFHny?~!r=DkNmaHRP^gco$_P{$Bshv!avd)dv^m7dXC%-7^2xbN=+R;=y<=mLexg
zd4a-Gbyt^7iVR<>Eif^eI@>2>wCyBDLJL9jpMS)DwpLMJ$X`9!snon5Zk5-6_D%!0
z@UkJU{LHe?{P{s1Y}DJWg;Xu2FQF>nUz=8L(MQc}1$}!T!BDd!<BO?JO&jf=eco>}
zd)^;Xm+fYE@7<x{-E5P){jS&k21R*4xF5v~KAzdPm|uMNjsW8O_S#7;J>m{6NM!#;
z;`r)K-viCQyfbq1w=_6MNMyAy-G+MQ`O^iZN%otlTS{^XPNBx``2KS;x8Y%L#UE!|
z+w*c1n9?tt66N_c{or6G?>z%5C%^&(<FSzNBc=~MGlcc%RLl=>^o5rql?6#95w{Xz
zb>`l(>>~38oMuAA46PCIzR!dU<U%Z2l-IYjGlH^^r(e{tZl5OWKDt0BFB-5Akg}Hj
zPJh(dutejxvaLfyvNClTshFNN=;b}sb=z9L23QwLB|a_rOiwTDVGdut$z#b&pKZkM
z%bPA{y*S}hW+R<Tx!LT`pRwp~Dqdz@Dfjdd|7KR_-_g?Kz#;xDsuiC$$v$2yk06<9
zKYt+CN$u3b+TEydItSB337EUp7{uupqh}&BO=~m7Mn+8!EB7O93I%Sp-#r8KrkI<y
zXk}+~%&UgpN&lz7)1h|g;YH}^Bm2hp!oQ+Vsc!u`=~Wnfi$+<{lDG@P{e5aT=JZxe
z*}*!{P4FIDOg+{x_A%T%Cx1%li{AS&>#*B`_rEH9IWatDbICIz|GSWH#Js<CRDhuM
zN3^)CX;+5V$OV2Y`a5Ip4=?WCqTlL?eF*Pp>pM2<Z*s2WF7Z$4qm+!S5|qO@$<@AJ
z$8}3*$-Kj2BhohKqJ62rM~b;c{=gunR;(q#2_HC^X<62L>@SP+0^3oY4Ql5MDEdmi
zb@0kEQTo;c=~}xSC1QrBWU&~Z+Pq!N(9mO3-6!H=xjB_=F;)4eg=_j#J#SXqD+dR(
zO=7_5*B^#z-E_0h4=<m&tZ>@ot-Tc~olmcp1;LIy;;|@agdOVVnw?;9W2+P093jX<
zL;lj<dWU7TvzVpoFU4p|-?a7?`;muBvTh5T`5gZ|CPf`dC^@{^WK|(Q6yWeG|NJV^
zRpP8^)oGK0Cl$fpm7RMBL`cs~mV(dUbMA|~{W?vj(?73mbcEK<+21@GoTBM8v*h)-
zBRdJ1!a{s$CvvKFwPWXXkh=EgP*^^1;MV1_ZV^cKhUM@DzS`?KKmLKOCLWIMlyyH~
z$#u0X(4WV-zjr?vc#Q)|W3>4U9if8eZIue^D%`e7``h2zP^ZEAB2Cjf`t?Nq-sc3B
z*qPhPT`iKgF{#=f;4f8=M61w*$mWx--yS^@y_A)B<yn6UKC4}(y*f!{*@HJur(G%q
zN5k&gI{B9^c3HS-WpGkc4v#AeVAtDkv|+C6%M!#23=>aJIxmt$h*jcU>(@lW^Zya@
zs{C%fng4fi5#Ds7*UaQ)%2JxN!CXU64A%NV-=?qLy#{!qOFtEU-xt;=j!!qOEs<Y+
zV<2<3@BBx`4TnKq89!O>pLFYs4qm)!=5vT*t{Op?86LHrQhp0D(qU9~=BdvIV8qip
zQyKeJq;nwX)6*)N$d!Js7n6@<u0EqhoGU_Hqk9RYp`RP?YH~ZFEqHae-`#Tj)cBW!
zT<bIP(&v4#co>JDNx5!WeT+&%_~U^71B=(3YCUWHH$PAO*zRk3bv86AXM6Gs4AuH6
zICS7PuIym)HDM_@ES4cL3IG1O`MVl~R*}YJ$=0_{cApZB$d^gIWqNcdP{QtU68uuN
ziGl)e(6x2pkp!t^t)OPUYhCTt`&=f^1LHPL*BQ_Et2<wWMr4T3MV9|rVmqoA(!xe(
z#`mj<I&aB*@;?%|NKKc87adz$8#AOH7wf&r^f-Mr=UvMk=^vw_XSN#(uNofsU)vlX
zD>Q#i+%pU}+oZjVyF|Tb_C3-!#$N5JC%rpxE%x>6=^6Dxy2}3atWxaT*PGD^+II$-
zi3!FvfnLM*#r$<-Ic9T3n&WYT$kP`W1Ck2!??3kWNigfstEq}8nSLvR4U5O5j)Ntk
z44E8yTWvZ8c`AC$oQzJ;eLKUWS1y`r=_1ph=k}{KpHQ{n#IaB@D9(>BTpcw|-)=Z1
z_5A^C&r9@RrY<w;q%Zofkh}5k$%CukMD_YV9ButQEpsiZul4V2)xp~Lx{bcO+oAfs
z$o=K2%GlHw%je!cQaNtZE0e3Lt8U6mYm+LVd?TOw8B6(@vHCNX4|@KT%t1U$va*dc
z<omH@I%h~v!#G{g&I?|ob|_at$fcMkiECtQ>6__e=e<mzPxWcLf<uvl)a@Ca3=ghf
z6<l9<xNl(~dDYyZ-?%f^4Y&wAPpWyoFY|o0G^h>ZeiN3hb@DD7C#)qtxEVIv6;|7V
z;d#g8`@RbQ^37m`%*~!2+j$TA$-{p->v#(OS4!KbE`X=N14YZ=Dku_-2S)5PbhnD3
z&ZoYJypU1QWLGN%u<0XF@-hOv0za?wuXu3Rf<(e+{xwvsEG*WFd6s2!O`qhB9HB@C
zBgCK7BhDLaebvb=Dh}ZnU9c1#&hn16<>JPON@VK)KkVJ-S5s~K@cC4d5K`!&hoaI2
zl-@!I=_m+@7@A5`5J6O=2uklo1f(NM?@iFqJJLj&8j8{p1QZd-M6c^^&$I5CHM3^c
znis$SV6VOQn|++e`Th8gX!+CQn1$FVcPequw%HcWY0~N{j^3c{<ei<BU=OckeObvq
zM#oXD!SS?$L#PaAJ<!+{^h(oEE=EiG+@|ceR;m^E-d6(}OaMKLq^Idq*$=`7^QZd1
zU@7)|dUg#ytVWa?GPV`w3NqzolS1V!@LCD+-Sp(+_@*FUm5i0bu_o}Bw)3C4g^uJM
zky)oBNhsL%7Zar7Wvcjc@&xR@m6<VcSuiNtjIylV;8HazCzD|JP_nuGg0T#L#MA_#
z_$t}Jb4Z2Qu|O)L+A3VmAW}UlERsXp<|f=Zbn?l|IC$;}eIj#e4#ZYUl+9VRz=3y2
zO6<Or=uDO9oSE2rv-o8O1<FSTv9GtpFoPxBQLIa42U}*Rvw}}AFr03wc)E^NpkW-O
z^@2ZG&Z_H2<d4dvnVpeMJQF=C+e3og+VuVoWRGx^v5c3=?2)BbSFFdRuQ1BgX45u^
zFkN2Yys^W1Yk}J%@rM$PC~NhHnuuefrY4S74rx$#jwtse*wJ!DF21@X=?vg$wOm$W
zL#~&+#$rLq8Jw~p*Y4m=O-(6QuiE^v>a;Pr#xo}$Z7X`~*cv$~rN>FdzAP^r@Se5n
zYDT#)s$qQtVfJ=1Z8=bvJZ2(E1)IZgZ%mpxn^+@Ou(ztMk-l^V(Pa>)!meX8NXYq|
zrqyg(zE(H?F@-b8cnU-vF_g{bbFFi{nhuepc^;}|eqqZpN%I6o`}}S}jHIaRxTeEd
z9jh7uB8c<eZRR=?@z_M2n-{dbZ|n3Ebi>DWi#=5Wgnrn%2PlalzRY>!?cgSiGLUhZ
z3ydoJYHC*&xLr<5*AQ54cok-oST=dVM`|ebAfDNr9UGwL8*R;ZJ1;dmSo_Jk&f^<t
z^d><})iis?;ACTZb57cKCO<?5Q{(h{6HU4HOmB*qb#Aj2G9~ZwR>s|UaDacIeNANx
z$mqC$>mtKw#(9+N5GRA0zt3T#@W`509)KMk&Q97)8o5rksBJ~(k}Osh3@&OQ<8E*_
z+?b*3N3cXnQ?|}(o*|ow+%VI*P+hbquZO%8ziVBX+#xz7fHJ?-l1z2f8r%}j8zWv2
zJs#}Z$=n@wIIu&1!Ap0HOW&G<0C*W`#u<rt))WBthB>S#hvm1P3dG(fNN<^6fhE!C
zlF-uxyKrX1BQ+#n4y(b^V%OX|rBa4vdh5Ll*1gG&`V)@EEKcVwoJvn$hB|X!6_pKu
zbLOtW__dkwIWo7&*h8R!ClR5fW`AVIqz=H!oRofOXMd!2?e2sf*n-27StY_;x`w(X
z`Icpq40?u_u2Yk#Ju9s~A*<u#)ScqiKjHS4#r;Et6WAH6em)|*n07hd>iM9I0?8uQ
zjzGCYq*I#PH(S7^WP`5`^Tb(5uTSu7P4HYN)4Tz?e9~|kV_F$ft2$I;J0M8!tD!U*
z-4w4Hk4<=~vfkF9`X=7)Ydu`y*#^IKP=0uNej4`Fz#GnB*hw`mYa*c<k9;v`Q98tf
zv$IFYN?)z_;qvk1c(2U;-d;@_A^sd~cADFa-~WPxm;7@to%i?3S?^b0ygyZTyWqO_
zoOHw&UW6Y><jH6Dd?J@e9<zEN1Z_vy=502@-<ipV60@PX;y48|B%_sQ;t2#0<omQv
zC9b|axBs>qFQS=%+yt&A8Kasfc%EOhFS>L8x0ZqnR<6IFqs!(8plv=I0f~oGGM`uh
z7-a2br41Tv?KHT0`WX{gR5y9yn?aASP|weoIDKOczVb4CJL`4^7Zz+87V2v)Ye~I}
zsC>2B54eIkRd4j&4ju7Q#hL)~$3q`Wt9}cjtD6jW&tq-C`Mtd87M>c_KN<D5fi@ba
zJAiCiw2*Ubg*D;g_H)X^%#60wXbEbn<E_L(1{FbEG}tN*W)=4ir%R%f|7PdszM0g;
z3-=3*4+zGIkE`@`#g5R#A*>Q*pC;D7kCPUdG1I_hn9Iq;UxxNFD_L^ici_k-(M2sQ
z``f9A-@Pr>n0S-ziPuv%RW^-^n6M=3Iia!K{9Jr3DmjF~^{6%aW*#jCKdDSmqg_u<
z(Xx0_Je5}d)A25wM$%h$^`M`A`?8wM8K#IzCf6^%;7ajf=5?>|M_@)1-?RW+`qI<P
zH8#0gD-Aa_wz?dd`wmwViOB)Zufnp?ZTm7MIp|$p?t5xHo7r9JYF5Euo_x8?w_Pb4
zY<Xv_^Mue@X9T$CLqh@<Fevuq{Tz3or)*RiI`a-U(d5NL2d;boL8K|A+c)nfd!d(g
zj)H<l2AkX@A<fj8o4r-=^CaUhg4z{!xi6#yXZA#Q>%u(iBH6UUy*!3CUv59V_k9iQ
z)q|{AwF@FCvNUR_aUzGh9d}48;=oGw!sN@WdqoS@WgCq}I}1gWOJMFt3+%JR7hO4M
zziC<Gl&pFydjFvG@>1@SbtUVss5J#S;UF9hkaLrKH}VC>e~3q=2`$XaBb>wJn1hC!
zveD{Gt0QV)w>Yk%DjdKem~`dre#Go_?dPYJt}}Hbla)aW(41`AhyktyJi`SE9&Dt)
z;~cjzFX90IW3?vO9Nd^Z1KYRbOd#OY)m~nkQJ-Zls7z10$q`*ortVE6Q-rW>m*B*3
z5I3Gmr^XAAfdZsg930Z(0`S?K9&0fM(f2%l`0%C%2AQ`!VFdl4p+=w$NftOs_I-LK
zkE<;3l^s71bp_sk1~z%n`t(HQ!mEdm0001qCdC;^QLup!|JbQrm*T~9I-rF1e!2Pp
z{<YQYpEj*@Ed3MT)L6=Xl^yZw%a=o><6+fI^kl-W8*lbC@PpIM(sivb?r1<C5ZaP$
ztfZPdtDm$hb9U(abzFJb0R+5eb_OeCbQb%CU73}&_v?xl;|aONJzMGR<I;UUgLIyM
zXiPyk{6(#U26NhUY(2G@G05!E$8}-w?Hb|TrW&qlkjp@bTUf2?X4$Ro987Mrw3$3Y
z-MX)kv#6Idxcso)&KX&g(b1W~#?Z^r<ToJC6*kx`JKX$^)QSiruw;|{v6Be#mZ1k3
z?*f&i?={nBkPtoOp3|IbZa~g9(UF`dMwD>UWV-=Nb0EC$fO9{GRy_z87Ra*-pe1M9
z?_QG8+#5P`dCdHBn6h#|kl4?Lcvp#!Uj)4CeeiDSmAXRWM@2?iDw=w|k#?NiYnDeF
zrp9y6@6)djJgGL)CA@G=3@uin>j1!MG$p+cJlk@4b}giDj_dXy*SOZRenU<GH$Gl4
zyWNm;K{EB-oxG3dUkiCITy>V`u>sOH6AKLtSrUGJcJME(v+LKKGSvFY>1e~^*jn!D
zz|GJfBVubL{(5oDV&RI=_{f9t&J5OyoPIt36_Nc#er<K}pWMyGJPClpY&_hoaP1{(
z{fr{QKriQ&Nc9?U`4RX06$g%7eN{@lic!+>>R{ap+sew=gZQG4?HUgN9ZFx7tv*tO
zSiWVv7|Nk_-089rlg548HqS%fXz_Ln0@o5bKKd`a^Z%IqxcSw840+}D5C8ZB|M3&q
z9n56v<whVAX;qJMuUcg{So5<vw``cg4OfccmhE@*iCt#Ip5ifxk3{`UXo#xs0<PS4
z{&e+d|ND6rSqs_CyF9vnSwD?s_8Fb`-*ExN$t#9_%t@-hbl(3=fAms>owH8CC5HqP
zoH~ex{OZqgtiQt9MEUxLGOpMR><Bsps%Mab{!>hq%%yh8Mfe8dTC=EPs^YyvxKw^m
zJXK6(`l<hx(wqFZm}(Ha5Vnt%`CCkl3LnWG&e4oySB^NlqQ(mVOcENj004Sefi3oq
zS`pTh763P)l_{C5bnK_?*gsQh{p4t|^Z`;<+{RudEGqGjn93KNc7&9xAd(D#n%E%R
zHcOBxP)Rom7b#af-)zM)xwl3hq>8CNVJYRyBl-I2F^#>jr2B<bG4*KV>(W$>D@=U$
ztSkT#Rj_*FfG8DM3_UZW5~Fl?WVj+dz~)p><L(Oo+CE-G`PKKDs^t3=G&k>g;9@^G
zn>6YA^Ba8!8=#_<2>v#=HuGc1PjQ`hfA?2tsWGz({@axxnw0Sm4}OcO#9*|F?j?U%
z!b$j9M%#ubiZZ<q?Luiz!tKKNVs!1pPo7)0ix4gojK-+AooAO!F44`?!KZ~e#3*d`
zEL;(sfL~N4poJ1eR0Jg7UY{Y@b)D24^>v7)im6V?7MaN-i5_;j5h=E1<DnSatuxll
z)GyR7>0(*$)$|+wKlsxWyuBV}_&n^0WmVaod#n6&**li;j{S=->5sW1uICav<*yq&
zgil@1+Yy)x7HP4}dm`<<%or<OMl6b#D4S(|>GepMDy9~dxnT1OUem7W%`{kQ3Eq3A
zp~<y9Id9C&zCG5j?9y>C{j!8R(yhv(>0F5(i_Dsn>NbAfo-6MIWh}Imqqj|@<~duj
zTf=+|lDGO}#O+7&OAIe#MNAq}A<jQ90AETK5Sq%alN0)HzB%T;cH=eo%ZK44P1?LA
z`P`RteO$+Mw~QGcknAL`{5p>G>|#%3_UL4v8;iDeSe%!%nTS(hSDj92e&5OQhR$n%
z(R<*QZRYKY4nb+wo-|$M_T8N!@kUXv5pAC6f?>YWu>zZ|n(W=%KLeXgnLEN9_w>%+
zN%9^SrH{TnX;0Cw?%t;hVimP=%iq!7;9RIpnDk`Y)$xw48Jy+#!1Y6y7>n{H_oQr8
za=dMG>gHWt2gB(&oWYN|9#9+&c^(jHjZXK?j_7B#U7w3lJj$Sq>GE%07l@R45alJm
z^4#^T(Mmy<f2_!Zvr<FKS)nQi>m26(jjA1%{Q6uMjgRZeeWwEi=a_%M3<GZ7y`|2g
zzDkOhNiZH7Q`VfcN7Db;O@OdfVLf9+ZLv9z*_UP=qFE#k&cm2Iu#&nwTm9wqhspd;
z3l#+0k$omSzh>*-{Je|tn=cOOaGL{5?TOtTD9(nyTvQ73)?ocWY_qNS(XioZe5!Ly
zm&<VkDR{UNa@=!Cr$^$A!fu-nxgtfC*hBA%1#0(UlT^vsQ7o&5{BpZGh?P^3=S&88
zH093E3i`GRo~zVkW5S*EH7RVanTI59>98zH(r{@ygeXi=H2KethMn7eXx!2?Ez`W!
zhKtc)sltV#B9~*m1m=8ma3R|8Np-nf`C(Tz9Zm?((MIDDciB>N`FR>kMB_(zQd5Jk
zzaELu`v&1GZiF#Obr;%(z2(`~eHgc^rYS!<67zDMhl$}Oz5R7Ho|mn9LdH|)0zAHP
zXF_0n%qyDZYNmo8b^Dy~;RcQtBgEBF#|RoV2w%uIUF&RXu8g=4{6~q4yXg*GUwaJU
zP0J?_@WB`wNw}r$nRLy?FYUR#g;x$7;u+l*i8t&JM)-EYer%^oqE(UupJp~AuOLCM
z#^73?BhS7RLg}^{B8km_=f!R}`w89ph%bxAT#cdH6lHbOM+Xk6%#EEqqaH~A2z%V#
zcGua6M&T!I7x3k&P#FfZv2+>D=aAkNHDdw2_{RdA)028EW>`=>Hkp5GIq=d|DN;nV
zSJ8#iBJ=WycO@>&#ZilN63207L81;U^{I~u6_v;;doV{2p-aqGGP(}5z}&t?BXw00
zSskHKc3bSE^>)$4@(6pjk~ErAmI~M`KFvxxNl|-em$57}$rtKJa6EM?b5}rG;K@eM
zd9P8J<rmlDe6dnz<F(wf8()g;E<Zj&YYI0qa9~f_*WlgqKsqwnV*|q4Mdj>f)R^pX
zuRJ<<e0Z_sO`nEIlTEI+zPDD*_N;D4*K8^!DHAL9?Hsu{i1*RGNGp7M*{cSqgwM7m
z!(9i~@`g_98HLENpapdKq`393ri=CH_U3-#&C8wJ7n@_=myK%C$b7kU<>u^<HvoST
z2`0KvJ?CVU5PQ~&({WJm7wtS$;#Ib)BINjbEUm*NO!Ssy_z99ae`c6Elhg`k@akK%
zz{l=KXPWISqwMH7pN7y&t;aGJ`gRH+##e+R9UJ0m_)3_=1V;fgitFl3cgP(g%gCs+
z<T>V;hDZDzM8t(*R*q^?yC~$_XNj>NeHp3H2eI?hs=94ixgH(*SL_hPai5_c01bD~
z7R(3$=E$umJ>k<Dt~kq!z7yABptBpHN;$OauNMr-AEcwxyA8yI+IER-k;2ni6wtmT
z4c?EmtLa8y=33@p!5+FxCZE*DGCn>kJb#&ud~AoU$91_Q)jsJM%gHmxShH9UKjb;Y
zcX0&*_r~dC7;AW0xt2ZPxgOOI<oF@oa@rDS`5dA(?@zx|@u_;kg|@s+<gd666rCnF
z$k-^(oLK3sNQnAclZpp-T8deYh|=hc`>@tUucaIv(!R29r+-A~lB#QdubN@SNq1*I
zMeKt`7>5(iH~Xva%^=tXyaw6-yWAxTo<^^^t<)12BEWtbZWh@(9&&<SW{VtVKxt)g
z!D&8yHGq(0vM-oS?Hao2f_Q4&L@CiJA2{n16e_nkF%E$>4Ts;jtv}1emhrt>;A+li
ztHV}$X&#?j5%ECA#Tou*&^xd$xp1_O8vnZ+?NvwgAm5NYFi}vrL3S-xX5a(QyYD(P
z(p9nEu8xSyyD&tJ-JR&g4+0*`6Vs<v6FD78Ovh-~QLXq1r%4tzwE(Tek&-=U0w)`T
z&V!NDA3aRNsEdlcXSqSj(T`vU4Rzfua(qX|7vM*=DS|2<Yc@Xgy!_}ISR>!2$Cn7N
z2lHjDq1(vqi1X)d)~<c-NNJh-vYhzf07AcScxCRgC#ULU3jWnpvO@&jB4CF@-mgJA
z7i{d&uo*fGM@-LQRwZb7D=0FOG`>IU1CBg>kK=qfg20+I;KpH^qa|N}CBrruvPTHu
zSY}AONK@<$W4J?nd=-(;`p`EU`oiPhOz7p}J22l0<VT`E<_GNs8E0$4eeF5a(P#M0
zFIVle;VG@bD!w);+qBMc*XELqb4}pYWPbrEl=&A_)=5NnEnW1)!y4H6FV`Mq;AvAN
zkkj3dX1!tMC((1Vbe<;genN1v=>xnhQY!2LWx~Jrhkvap4O<+Ha~Yvc3Z&_wcL31r
zZ-Kc07{=v*4J?{(0{9CM#?BiSay{&LI5eOqFk%T4iiI9!qj-lgVU|IsJT*CWBTjhI
zvUxz#B~iIs-ZPIV#xW#>TMr_}B)DAyH7|{=#|EEoFb+A1s3)VEu7|iwN2UN^@|H|J
zCVur=_a{x@mkIa#_N}q9bO~1xji2GcCVnMf9vSY32-qW@`@rm2U{7eGJ`$aYzUO1G
zuoSYjE&Q?lWK4e`opUzSK^E!nbKiaowvZeX-x;&H9Q8bf<^{n+$O(}^480@AAr%KK
zBn5o~fW-))Esua>6O_;}FmV_(0*GLirxlZkpW(-Fd4QBs;yI?`C1v87?}ncm4){g@
z^H#(M=>&=2WpMORD(FeXx1!lhKo2F634|mqy`&g2Tq`_DyEn;jCCLDBDJBq>o?^=~
zcg-Y@0@3q`)qP5HUIK0wo@_1e^Hvw42MBSFgHW4l_Hi`sLNs^q)JNpAc?>hbLi7kO
zKF%qRNXgDqP(L9WmvERH8_d}Q<{0P|v;rykE-pSwUA%^B0-)AgsWE{mnp;n<oJ>u5
z3Q+?<>+79U*j(rk5=mMC--b;%M=&vh3|V{h#VhnL*chsW7#GM8&UcB8z4U2MA_67h
zFQ6IuCup@=5v}3Y0R%o@Vn%;&#>Ep)^20;fh|nf0{u}~+T<_TcAnE8ktIgx2Pl(Jp
zq09xn%+EicnfE#xINSLBOxjq<9A@VG$d*aX3G6v%{Rq#}{b@Wb&w*>Do7Cff2ccv)
zIYVFI&d@$TKhNiO$R>`Ke+Dk%n=ygnpgElTiELXzbVWHF*7PBP^y?-$!U@{E))CWI
zpb%1yP*E<DK7eg2OJJ4v003ox<~?}=!^P)_6y=Geg<`Dogc!_K&jrY)0i{TH6(jNw
zt?1AzdFrdYIiK@W3!f40LUhvdFA7_AdO&b<xu&bU+FuG>yV08G3POmq*CL)f7d?0F
zd+xsa{3dOor*NUyxkB&1#MGj~`+bG~5>uxOLkMsu6Ohe8w%s)E_pTTAF3_~@g2Zz#
zlU-i^7E_B}rvJN`dakIzrKm8X=w(q+aUZ3qbhQX)2eJU<#;)=v>lEAHqm54k{}xkM
zi{H?eG)K@&6G}Q=O1dLTqyy<&`$`5^OIj65dWB27n@Zlgl)hgrrdCX6tV<_XO9zWe
zXB0|59F%?*E@8u$%~P$^zA||dkc|YCj4SJD0^xw5jlQz4?BzT6O7_x#KUPaEh|s%R
zx%I2OIO?|Z{bJk*-3qw^gRG?Is4O;dBg6w4A}iT0Rh|x_XIrbpzN)<9Rmr1Y#p}vI
zr(eabU-?{!b=@TU#BhbsuL=>xfO~UQ1h#6aboANcib|;nWsc{+XsQ*El}d{2T>3Ti
zu2p>LHRt-P&ZPk5XKF->S=B`-wF<5^exB7DBGp!|)u->*3co5LaEK^0GFk_wGfH7J
zH0vrVYwdnj+PX@zdC(ZHRrDRycm~z@q@(p+87y4uZy{N4rq?|DRV$ZX^*E9>M87Ix
zrtX$~x-*h7EKv3A0nbi0jkyGzXRo2OwIN)wu0XQDJH5vDQiYgCy<cR#HL~szM^k8j
zZMH~2;dUc#ts!!z$zJi*vtPm!PZ`@hp5Y$C<yv12n!aMY|LU$}lcsA^er0pPT2`)S
zbJL~jlE{YWUro;?ThQsv4fk6ZW?DLnPk@9Oqle{>@xuAJm^w0T>shYs1<VdXhhb6Z
z0{`m@Wc``+mgn2e0yE9IkreuTk!p%aOCv}9uUD)y#cy7%v5#@Q{>bqPY18s!Mv&oL
zj<^~PSprSs6J?)6PY_XO61WZtkYfq-1R0&4ZP+|7!jwUxQL2OwyaBGi8M)7X^s5r0
z#7;ZVB6ZmIiKCtFkiGU7>8@Ib%6i*%sa#1(xHUk3wv9eoLUjrVbqo}$BG52D5)(=6
zz;f1Um9WZjRw_{G)bw_lk`@V@8r{Qo`q_5%^}0r6m$qoP+ia&bU*3X;qm<q0eFoaT
zxU`uZZ4SxPL4Mt?o*f=^9QJ<o*Voyj4l5jO*wJp??xM9`ZoR1n-Ezgfp>+AS!*IW9
z2KqCSm}-=fhazQ;LYwXZTaZwqTad_H@4TthI?CIXFv}hn)t^Y${_Kz?YOOzgprCf0
zQ&w@HYF6+E9%)1dryv=ZDiS>;(dP#k%kX_YQ9VSCfj<5A=-GlX&;A&t4)2m4RLNkn
z+t9MXE2#C*<ob!FY#Nnp!*Wl|0`cvSsJHtiP!Gc3rV?*g$xx#~`>R9tBmLpEfnMNc
zQsTLRskthbB_7Pi+jw=loeaju>(mPbBRnHWNAd^{Y7{>>V4W>-!V`V!@@QVv=zFD+
z({=->XI$s|3JUeP`tJ{C_7Bmvw6D{Rq22M-)1$MAkZm%37yx==R@ntR$nS|!F@YIx
zV4}Ciy#W;d1p<u`zHLDQZbXJ|6X=XDL*udIO1vX5zOl1hV@VMcquZnO?oh1qgl8$2
zhP$k83nSt_!^d`dYdrFl;YkxB@<%pQE{7(EgxL%<EyGXTdd5g_pZIjhbM1)7iEAXv
zed?YmqC)~s_JC=+BfSIRnp9F1OZxx|(QH9cd#BfO-{+4^v#Y({o@s0G&^998<;a<Q
z;$AV`IH6KH^QJ}I2n97afz=V{%(Ll|v!VHmkmziUZ3(m<o-W7ZX1N&qL@6|W82N1H
zT}Ab53mKfeW!i|E{p|j6snkS`jPBf^MYZ$poJHplH8fff)<k3#8T`WWgI~~xU@V2U
z&K_Cmmd;*@vL>EvXqj9tB_oH(C(gHdOQ1L0>st6w-f_AI1jv}#UGmPUUoEVYhSEzC
zvPISOhuJjO^63{pkVS^(#khqq+;bZn64E1>^kLXf510xTlcjNT0WZLf7WCP`RH8oV
zYM#5kC?J$cPAMHxo_o#5Y*t49887)+ymj<U4n|OHT7(`WIN10+Xv8pv^+(01Xe&mr
zrCZ#eSK{Nx9|W3by}V1rC;5c;(PW4bfre`nJorFNy$rfAE?*Z1vCW45Ahem6&=}><
zN4bxyt1#}6!55F&XYeZ?cF0ymh5`+C{n8cQk(Cpb(wrmGsv{c4Er<gN%DZ%XQ*#sO
zQZbze8N$T>$(v+UuJ)d5Wce;V!g_1G!$iaQf%Xp%LvIrMPZLB*8Qt1tm}AAP3tHgE
zut`QghSi4s2Nu#S(D$>VJ8$gFAxS@{VlfJ}C>ivA1_&D^vOl@Oa6s6&8~=&3b(4?&
z>&ZFw+tn<6M2!dYV6w+(z9XwNJqC9Jb%-|wK{)C^n#LTn#N(~|2%}4cacXM!0Ka`q
zp!JT!>};J`7+xRBO#cZO6&o4h7PC%q|M0S9y24>0nuIyPnuZb9+s`Xq%%jT^-|5Pu
zpBRQ8A2Dv2QLDY(eCwFJ`5l7lv?CF@>2b2f16D;6s>0Hi;VE?fyNoRoa7P0EPsP`8
zy8_`o{5$Yl5WLA@w-+{yJR~YGP(HK5cbe_jt+{B|H_?OZXnW)D^5s(#6^Js4@6jgT
zEBO^`926V!6tnpi%Bs6b!9rdFs5_)ik)W^lcQ$iwJqshyd1rk&={VvNKb8Jr>Ue7^
zXQQ>?!L(TZbV=!!YwH$A4xPpYs3sTYb%N^Ik!|kSUjhfyBg!Az=h1pt!~_}qb9mf(
z7-@vXpvPg@+mn4{Fh|beKslWrnYIo9Ri&rB3PAT|OPB{T?hqgcaYr)&=$`<X^-G#F
z_DJik{Tu*#X%XyU0!`0i>@%E!jKaLJsuCc|_XRv1Am?pXtxC=zS4n=sMSjhne%C9Z
z-DI^0W-*I#20bfg`)%&NhYg0&7-^Rfl&J48bG(`wR$fhhJ5&0h-k0qiGo7cbPF2lV
zp}RMpr?|tu(pNe~_9#1P_Q1XDH|ED9`&LbwmozM>m@0dt*;LP`Y=Jt_)%-MzQfnUX
z><cd)A}yJn5J#O}qdn~Lz6%L(WI>l;eC;FD#VE-4Y$?H(d(n#LBzsysHCH=|<&666
zhMp-0&~RDrULP$m%+h{lz2`Dfdil*`u5_2h;B<W7x17^vSybf13A$u#@%o$xn&IhE
zY!)V>GxjY%_&X=lL`y=*xy|zTUrg*vDGr73!ZkIiJ8oKh;Iar+zNJ-&af?!enC5|>
zTf}v&Df1-|=5d;?O2D$$3qh-nZv*AQj*abkWShpmtXW}@Nr75dPK-o=aQ^l3+@zph
z9=W9LYaCLde0hR%d?gwz*st4#XnR66tq2cb-AUAng>w<V#-{`?oqXtVO8lZtqk~RB
z0`622JTa_W=8^|vn9S6nUKAe|INQaAn(|sIQwWP&#SfNgo-veu?^tap`zhp%k^GWP
z|2a*vZeNPufJA@Jr`NlM44rOfG4dfa&qBjI&*jI|x^KeybON#iT}BvqlW%KA6kQj1
zX-jIPeg5M@@w%$!ml5HYQjd6pdnuHY!rtwV=?cD{ah})-#YxTU&1Y+4cca_FV>p+D
zQS!S>83I>lD|7;Ug-4J~=ChDiZDG?cxqt(?m1_3rv@QH4VYQx;;4hvJr*L{v(G?0^
z@(FZTi{qZ7D|YABhLm=;yU$Hk*{o|uBwz)zu&y%$10gGp4R)bCkLB#cPd(p1EAnXM
zAx}WpN@$KBdCQJF0ID1|{5ee{iOy<1DA)8I*-MLf=^=K2Cl$&K5%s56>o71mqGwha
z-$l%Gy810QMsV)P7k1!J&BtA*LMghlnaXQArU9ECk1nP^!(k%G`yV_kFGe_hHP6d7
z5xpq3JJk`I=)2L)Lori=b5aC18+F#*F!L$e`08&r9RznrU=g0Xyq6-S-X{-U_Kj_J
zaNs+b%8&Ki+~VbqlK#?gh2Q|5<Z*(i2<puVcZ*&ee_JBwGj*-7#b@SbxpHx{pLZKV
z>Km{d!RJVS-%%6k4H8Xwk`apIOYneRe8(50j%-5rrCF_(Ub~YnP!uP_BbDu8AD5+7
zd$#r*cTxT|y5c~49jT(>wnzzCfwu6b_wREb{3@Xt97rHMzVDlV$K6YdA)6q6xDspG
zbzppaV29+nU~=QnU@*QKFVBlu=L>d1OTqcDL9(O67UX8AK&YjJLGX2}*t$9JY2P4O
zCVB=pfjjy4YlPv7lr$r(F7QP8?&h7NZ>^ih?_``Tu_wtmBE!SH#{w@}k+H#Cn>7tu
z;yxphS0Mc6`#F*kaU*B9v0-8^UF<k--Fw=Nx;|+2I*}225$2UpE|CO`$_-b(f)yQ(
zyH3=R&B)n%>lf$5AIgmjYM}fy78@5+V~2k($o?3<kiKau8zE>WA9CTmfO@N}iTzuy
zjNMR0>-Xh3AtTA<Ax@%B^8HihYA6p6^#hyp<-%~WC|nVkt%uxu=KHyn3G7KW?D$h{
zfgR79U4wxTA)%ot{-?4bS7mA&4R832rJoP)KC;(fv(D6rDVAK6eb;E@Q#bbPYsfXF
z&+^9iCdM*<bX=pT>@^zue;>=DK&}&@3MSMG6WK7W>*~x+CXZ#tb1;vtYo1Urr8Ww3
zSv#+5OE;Ou_>AZAK%I596wDG*#`8~UIiE9cGE1o&FF5_k*}zHReA>kLbJ<R3Bk!j3
zncv3?RiQ2>j}$KCvb=ktqvc|j+;ri&%)6Jyk6bPkD3}*nyeqoc>0(jaWM1a;uJ{Vn
z)v{B;qAKNG$u%uk>vv5Sb#?DbZ$5Ih`K)lUY2sbkolaNVy{3z=zrQOFfVvT(ik59G
z6BVIaZuZQtEW2bTDq|nHIi66o>a&=rdeZ53Rr;0Hkk3SQ*8hm9%}(NXruwhYc%^nK
z{g0UXFEN$>zly2dcZa-Rdu3wI;{QK!Q>kd`1w-Bc|DdUtLJ2p*YLmkPY{S)VhgVF5
zTYL@IOo#}vi_}Vs3jRNFQ*#o-|4FCbNVfiWH}%ES*uUJ=+i4C|I`uC%_3<;idzlXZ
zL{t5;T*|VN{?Msc{j>k3Q~%+n-uhqM)P@(&B3|B(Dhin^3i-=TjVZYsR~kX3Q~%vf
zO|DG%3r*dv3aPHH?x-&OCz?tXQ=ipk{D+v@ke$^So!uDwzq_f0uZwD5550c<`Y%1T
z{LOULn~DDgO)Y7wuIQ-m=;$c#%vtR${?VCV*_Aid)mYvAs-~x~qxW51-^+jMsSW+@
z|D;o2|5rM7{QoAMy6}HVr~Z$dI?!0X^fp@~lH0JUW@YTf`C{9_rrNdl6%PHG|1Y_z
z8~@>^p8AKIy8O4BYW?5c)az|1s+($0fAV8s8%p$lb5j?PR5x`2rS&g2b%^Swo@piv
zAVpKRvZHk@oIl?>b3k@PpH8iCqPnR$opk4IoxeQo9Mt6xxsbc^CB5Odn~ML-O|2WG
zGx?4H!T1Sm_#}Q0fckGYHBN3mNg(<x&Ygcyg>Qu4Fps9T`X6qpdway+ZfX$!zuZ)x
zcI2x+ZmN5G8;a_tlK*y7Td4Pc_$u4fe!Hn;6e&Ug@t2#L@b7M_DVnq5-`vzG6xB^d
zBV{&6|G25K|K_H?`s1d){^O=LQr*;Cs+-FB$4#xI9++c$+y28%z4b3Ql^;oUQ$+@O
z+kU&L1)QK*0SD24xT*7hyQwvzZGYU<l-%1wR5!KyFE`b?qP0d<?2Um*|3BQ+Veyj{
zf85lnXf8KPueyGTUzBRhuo=>Ekazq0tYBA9V2e&+4{i-SaqQ*=uPYz*(iJL+0(z*1
za*pm1#8lQXIKk_4#!IQ24|hiNPAd<8a)4|aH@vE-Y#?NE@}W4Uv{f1f%Fo3ZZ1@oS
z`gm7s#(sXwjpRq*?0@lNm^mvvdQ`ga2tVi#)a-8>b$BBB+BPz26s?f}01avg8H>eX
zK==5DQ6TL(3?6htV>1iD!h2M)1;A3|0;PR*^$0EeVU-X^g@EDmOQRfk*ge=AK<`@~
zX1d{NNUkWlnS|!w36+C0mDAlK`0wKw0tdX|=(BPDRjFLHMyK$M<X{xLz$Fw16#XwZ
zbrGzWT?FSO{&rKt|G268f4QmAf#%4POf=Z>;cqt;|JzM{6a@?-gn$zs{c%&nxBj@P
zFnHr1H}#&{Z#Q+7>ZWc`-Bj(sC`uHOXQDxk>ZbBA&i>`5UIE0g+#&~XE{8I9XQTI@
z4q1s3w3&YhVjWt@Y$>zae5_Nt>|Y4nRXwd3n3XPJBQNR{lXj$xU>pq;4&~(Ft&Ib!
zvg`+^Jf78=vBc9I<^(=Iy-1*Avw&QU$TJx=fi-pk(B1%Dw_OJdj64>)h{)%$9&THL
z<f55xkzgg?CePH{y?EeOl_<X3EtTF&3A$!s$}+QmzBH;6q}S7yt~aYC=Ok!IjYvn8
zWOw^{q;`x|60hB|Z&&$lqU^Za9_`rIDoz66y=TV~?-;Du#NqJV*hN3^_K85Ii8ulS
zBy>W*Ky|B?Rz`Fy-j)A-dqxAs&S^A!DLsYKb3!kmM(~o4Wy0C0J)M9<p$O%pm)(FQ
zaL%KF*q0eBhMqn8LF?j?->_HnJQ^_>KARU8t5V_6QFY+~<1{Izi}S)bjnI{?r^kXg
z*mudHM6P_Es^K;uW;|A1IXLgRMiJc;Ysny@i#6UWukzjx9un>Mn>>v0#)>c60f7s~
z$JHeQFH8h~-4(6=+y)CI`k41pgv|>Y9`u8OXF-UKHp`PHxvG}z_&~9a=U`73m;uR#
zQAvYK5O4v?GewfLkLCsl3j?axV)Z>p0lUS*PpeLxx5BMGTzXV?8>o4a`P;e1L2vP6
znhAAVZV(+Hukh?6A>NQa@aw?`U00E#>c4&l8;oV}>OU}f@%k3oZm(7}kSsa$xF;B8
z?aO>D_0v3yyV!YluZ%)tfTad|T)QGJhK%$CWesA3At5hzt<MIV9d!pgR;{^eT@t6H
z+<K_Fv3bW!f3fyOZ|ZT6eWUh8jdm7DBWOx;M7MJUyz-<8%zKfpQqeNcC80%O_sYzz
z3e3?}SB~BI(8~2|;~6byD7V(NXy!U9;ec?BzEFH}RT<pDw(TplWb~_eNO&y=&zYL@
zA7PJ+3eecuK<+WBb$OgbKC#ToZPZzuaU7<PsNITER&r1q&uJ+EE{Dc4)%yPu!k(JH
z(G&SSEsytTp7GRE@b>Ci)LS_*@XWo-zwnGL1X;BQ2|L4Q$d!$>$zpc2?eFZwt7_iz
z#qdT0TrZ*GF3+@zp|jI?g*epw>Un4G95?br*R;oN1*zI>`}R-mN!3smRGr}xg#6}O
zSV0Hq_UVfs)I=ZUOyUdupQK;mUWcjBN<V~tGpl&Fu%QytC<+i-B`>jvB6D38>~L;D
z$uhz?OW`*(l?3E3iUbRsWxv~mHGfup{lra-<>ebW_daS&$aU`=yv9-V@j|jp{Z7kk
zxN_I_ekXAiFTw~IF#+51;Md~m5y>d@nYLt&R6tk4JajDyn<?FVHcN5-Ou9Fl7G3g~
zKD=Ss00l(c`(d=8ESmS)+9uN%2(JOWK?+NR2iOBECXX-IuT^W|EkOgLuSE@b`J3<_
z7FPQ7m&<(4r80@M72~pk`;QS2Q*zvC`b^?4u7{s=*X07E^e`z8vy1qd_SPEo<LYRx
zLmc*Pp2?HF4L)ARC+zzzhkx|)I<mo+vJ%bjfAA`4jb(P{h*QXKEv0!Txh#DDHDTR@
zbV9dhQ-SFsWup5Nb95z<MjoJ1Dup{2Aex(YZd9F4Qa$!&r|1`s#t@dGH2X)yG`yD=
z_FIKf&$WQkF6_REi)h{X{UyxaH7o@dh_b}`*c(IXgP3_Ss7ZY97c5SYo+mX3HiCx8
zVYf^kE<Sl^3#7K3@G5vrC>d;uN0Wyif)l`-d5qsJl+D_%De@Ya@giW0cZ4lNDsybW
z^I%m0gsBO{lmLB|jV9vN03az9UW6=GRx2)8mKSr#$6SS#{d6_Nahbh?8LvN#j?lu(
zXKQ<OTr#qFd`m9W(DU(;0Opkz9*;*ddENKa4GqMFY0yIjO~M{cg0%PWZe+xEr%eDw
zFf0xiPKXaf^VuZ$hNp%xC0XKAQo}R%!&P`OZ4wdrmJw}$^V$E!O>L0Ftp+}19l_Ax
z=xG`-ZE{hedy(sBqS{g;`*e8=NUB<a5p3~b-K*F(iN`QgiJd#w!J~mj>hx1Ac*cgP
z`AP0055depjb~x>q7SjBQ?QeA*i}5j+rq@g0sBFYep@a!!6bHJGWM&avuFkK7a1X$
zuOE>N1~|axPuffnpm;L)-gyWNgc046Sc7A<0HF9E=0Ee}TK8mZM)6Z}*qdKuOPoM2
z{<x{OOTXPzQ7ly62Yce>4HY8QO(oHa#`!W-p{Ux)@qfChy7iFMlg2)Qpcu!SFfVl@
zCuL7BBJF~qYE6s}0JPlp+f6-<|LvxJ`{Sna3t>-C-Bf^T!Y)V@pelJG<y4YXBtiUv
zMgmnXmCZJanNWZ3l^FTQO_d_hf^z6Y{>@Eg|Kp}|Nx&F$P<>Q4l`Zlu>2Ehxj46$i
zEVZcl4>xte9qnjvMEc{VN@>VZ-BjYufbrjM>dn90)at+8)HAz0bNm?(UP=Y+T@EDK
zRPBKR392t{rN&i)xbRr1;ZzjG6b&5#R1mO>y;%0_rwsHEDFFTE&xrB&in|(^0wIl_
zVZ2?t;#(3hA^#lgs)2G%a+km<hhco9mDoWqP4ju}DYI*>@);)@Z`EHFeM`n5`xIZ>
zEA)NKII$v1MN?Hs*=}UR(}Y~wo@X&?|3FjmU|uSkiiPyysXhlXsu46Tft>~brU{vf
z(|I8Jyfc5$RNi60Iu%XL28s|ey*x6Hw=%!t^FHGXDgvQgSh{100`dyxB0I=xI^rl0
z#2+YYy(lRfcZc8Ox|;{$WSp4b@N<(<%<U;WWc9*HJZh_5QluWq%~<HQiV5OFbTQ<t
zsH+kw=S_{&G59#QVBx|9Dw;Z)L$jU3NkvoV!LLjd^jPBLO&o-&XexnrdN`Mgrb=Pq
zVt>$7H3HCU3mvnS`%g5rE~5CjqNwzs=r1(Y@DG|QLPb-tf1{~ff1#;cC8%MbR5su(
zd+D)6>AQQSQ_~TzOw>+O(Nz9FXzBtusS3IH4b)Th2TkRVc04b*MMYE19KN0ts-mK)
zPhYMucmp2Z(o1m@TSRQ0(`@SjK8bLp`8PDR4SzzABwj$vHaiXZr1u+5^%@35`~(=1
zF+t>lV>~b-JRe|!m7<7XPexV=yH<fJGih>wWEVgmpmfwFX<G=(O9X;=0UF4%G3&gq
zY>~Y<r%}hi*Za4OQ?N9G+DlAP>+O+X&sw&ifH_=MWMv5h;Hgj~)NSS|hL8vLtUl{n
zedbl2`wZmV8m8tCnp&|6*DS^u->-QaL1RxvQ?U)f9JRGnG}ZYJnz~g(MN^dz(2GCo
zZYyFRzG^%+X?$`Coj(lFqXqN|V+GbQeZ#p@c<@0s&^VIj?xltUJec03pbYs+Tj*82
zoM#ujk<lLb`45^}c`q|fAIm@lBny?w^f!Y{o4YxxK}4X+CG1x$kQNUZp+$m-R5z9I
z$4!m<?WVS@Vm=~Y&+ETlK{Rg_^XN9x?}$7{nkHqqCP9PV3>Ur8U3~)%db6!a(#C-v
z>yzMAG}YcffEhnZ2yd|egQhMT9S^ICP|;Mg-)JfzgM?paLb{<JSc(su{6SMeDBJ+h
zgNWXAM8AUJBdKUALz~<mG*xM~{hw~CQZsxBTqU2;fvjrRob50=>`*cg=Pc>CFw0}&
z*J*j!?g7v<pZ$%do_0f%B)UkX_L&Nlm0#yDq3ilU`=w?_Th8va%J%OmV4s2CXsYvi
zdxAuV1F@TbxLcVH=5(U_u@d*~0iY_yuj~G7yYN_t623=e7Of)D8S2;jF}_E69d$Pf
zp|p;=0HC9ysYUtFW-6L$(x<eJNTB`>;tff}KWHim>_Bdhr|WpN^aoAd>ZhWqCthH9
zGO$0k`j<Q~sm%kqIlanJ;`MH5*A7r%9N595jn&(9SORpT1X{3_C|dysLg6JQ?aCSb
zgjt<a)lf$hn70R-J|3e?#72?eXj8gP8)zJ9;BcMovm5&R_jU*Dplb*17b48mqm2dy
zQ>hsIFwh=5&@M9H+aTJj5|s|Ggf0^3zqw%#umji;+F!G81xneJIEPh~hLxJNm7<2x
zhHVHGNGZbzOA+fALBVY2QA=(kUr4kY5)TkLBOp&yrv&_cHlh@deJueGGob^;BfTZy
z{rI<=f$*?6%#q34F+BE=1UHX{YxiQFd%*e$SiZ}n*WKBMsBcqjFv4#bF*sNy0ZJvK
zgo6>{9qlKH!xMOv(>jWuj8NR5CYVpNwTv7O(`rb-34zp|1#0jB+AaZ4Bx7<+pzkZ_
zI`MBWc_2Npw8tJOf57xHX(|&n?Qa5mUjdz!z+QVcQNhLLI@msB5Bf+jR-%I=P=Y71
zT>;uqYjW58b0`ULLNE@@{Gpwz<_U~<JX{&R2!I|-Kz<B^H{&LgHz4mNu-|5<D=Eac
zDTdP@HZY$`G0GK)MlwzQvq^rgnax35_@Uq^xnrheOhxIF>N;xQ9X&(*^gs+HkMHRp
z#14I+EhV76B|g00nmm?3Br8Ko#jso(nEF6Ch@N&{`7Kind}kP36NhZ9_yF3T{(5;n
ztg?NAEMTPmX?C_ppk)4`JDR(FHdJ{YmPsD}0N$>kQzpLMEE)JIF~{sb$0m-|u!X)h
znch;G-*BHdQo*SN&N?@L5-*$e0MJAI7sgOi$^@FyxZiH71{o4X{OzWuD1SL3e&N`}
zj9iAA5Rhdb7L9F}0=BzEZnv@5pid06?Ny^UYtUy7iBvjOv;yr*83M-2VJ}Ibeq{em
zr{WFi<AyM?+_blEEM=6jrkuT$<cmjf@+wm4RQpyjH}S_t8f=GHe*#TK%;c##WX0y^
zXaCRK)Yluc=rHS$+n*U$j{`#@Y*$|*9Dui4pE%;4jJGlWp;Jrnn~N%~L~Y!LQR~yX
zd)u$ocZakKK5k4@wuirl-y1R)5XJj{6cZA~%QSC3Qfmi&YZLAOeKFaBy%9z5;E|Z^
zVBT$@`gZWGZIJyI=;17NMg+RTWnlAJ!|&_<@q{>q@{Rj6PE2)2jc!K-!zCNLqf)XX
zb9zUG(oVqOlvQ`Jmv<Dua+*Bc)hyo)^4!(EvKzp=r(wLO|Ay0u(k@S&G!g%NiKo++
z2WQItU3qrTiieBn_FX9h=k}>RZ2P-=)_1CbV8jD$rs}EL-EOfz9#{Uj`Sr)`ubdXK
zJC<KrAKlzHxw7Z;bvIOXzaxHMoU-r7`!n&)e%Pn|^RYkUcz&jR-AQ`GnsViHP8Mt4
z*ZG1^KVP@frjlrBHg@m%;}q#oc09l6%X@0x?A4Y3)>9E1JEo*RdTQ%$J+)DFXBd0f
zZoCj^cPR1mm)x7fHsizQa!!ecdv@#dXDH3f{*}R!@;knpM}EL#zbl^?0)FeMC(oYR
zq#S$YcK2p=2BRt811S4hl!GkF%$x2#43_gBZYqLV-0_c_3Y$yK`|YMiePPjBoUG(U
zN)YpZ^8a@?b#ZEJiRz|$a(}ZN7i{C?%q8?sj@vL9sKgi*Sif5x=M247aVss}JW1nB
zS<Hz`DQ?uw07-w8>x8=+OK8Zyxv4YnzZyE5$&==aCbsN4!i8=ulI(Nsy5yODyQ$xt
z29om5#ys>r1M7XN6?^is_3l-cXP5xA`*iL3>yc!*BZc?t*MGRFKW?U(jlDjJRul?t
zGm2dzTF?IUT8_vWyfHhwLU=b)d-IdZv%0<KlZ}d@DM?U|KW^%$k1bbnMY}YfxTA;6
zq9QY^bX7i40!I7R+~SV~?VWN3Q^6i;G$M>9d7wf0Eg>ieorF;1$FbjT>h6}t>>|CO
zI`T~L<GSv%Md)UROSkFs7?WMl?BkYx+g&UU9d9|=i`z}lTCj5<G^uXtH(h~f0pU)b
z(;~*%r76{wdcsGMD6KA<;#>NFayPmd(Wi@Mm4i|S->7ct1uw%_Br@TRq{yX^H_`i%
zJ44&|9G&tewssSn2fsr$j5}pO!G^!x)Z3=odiFuVLJ0RFdASp{yR~h6Ew{(|q&{CL
zWqj*;`+}Liw7GJS%5OLIlJ}lbkP+2QwRWX4ju(HsskZk|h*?|;X7;hPH*b4)(c+?~
z8f#~!M_ppXZO`xFE(Z5I9{16Cevj@`nEU=t<v?O7Tqn+*dD4E&{LTl{Sm`@s4gvrY
z@G4_E;US=+V3{6)2N0S2tM(^ynLv||r8opk$U%KJ#C>U2fQ$ioUbu(E$qFzbhu=}v
zdU82VgQZdTj^fD+8E|&NdMTRS(ie#VV%2haE@EB{bD@S{SYXhrw5JVOS$aT#r(xah
zLVTjdJ!kSc8FpiONZe#Dg(@`U*?Q4A=VClXU4HVV7Cv8Q3&O<6M2ae`OlM>XDRf~q
zEM#<88wc;E^LZZl=CVZI@R^CL-H^$DnSQai&CRRm?gHYvNYM$TWK87?jKFBw^`*>b
zE;AWd*r|BxRmHiPI8hgwQ(s$J{lO0-MVhh!C0SjJ&d*)zk9?XlQl9lc^KQ8QH=atO
zKeZ1H33#4cE=D`UCwVrr{tFM_H=YU^A_JgOJtU}Cl^hjM6<(#{si)%t|H4yqC5P@Z
z1LU3y2E*Y2cn1I-pn(ypdm760G7|_P1m<2Q_|ge-cQN6BU!BVMZcf_%cpWMUyC4AK
zlhC0+l(0YmoD78h()#uBVvP<?;x222t~7*P^`SG|ry<V{<?hS)p)>B>V?f}N;4Kia
zgpT-*@!}~6NiE{+S0~9lT`_<MXb4EU6AJ+Bulq!~N|J#x6+uT-d-|Js2T(MF<E_GS
zpi7to2>T-Jli;l&=<N-*DgKN-!jHByQvEali4aERis)+w1R#0;5tEQv^(jYDuuTca
zJGX2t@mm8>w)`F%MR*`Bk^aFog9Y{tpFmnpH?J?L1n6zJ2zu5ex!BQ3|CaAL&J9Tq
zCcQwIxKt3$g?tc_$W5o(-Qfw$jx=7*l-DE#Mn!##v=hJsQj<ZpL))MsGa`o<<$J$q
zss@ZE)#=kc-T3>1BN6Wa1lqK%L87`V5TXnGBz~>y$=$d2EgUbc2}<dqZb^X9aya>4
zctaNuK2?OH00{x~OAb~fBb}BvY{N}h%`u)#FXy$oEaM;UF}RU9r=d#sfNq!ZPjIFu
zabi^{pWI#8m+V}KN*d5(b|=lvAyAHmU>w!p8MWJgQmg4nWvyxar8i;h04bu(fR(0|
zII)OTHq<zRK*-YVu+hIli^fQJCGinYYNqE8KYnapg1`Ubq8OyQ)d~V~tI>thWviV_
z(+Fp}%dJ%f0Q6dE!T=tHTH?gM$kZevv?2&lREq+XoGm<4U{3?sLQ)F%qx}^Kq72BD
zhp(R3-a9{|y%%RfufYDLoTV}dBzWufOEZX9n7Nyl=9WbY`yL-XKF=xuGEw=(qP|YJ
z*q!ZmM`VVVRa4Iwj-vg@)!G!`sTW$d0aKyYoa=0e7o^kvK_Mqo^H`v9gi|piu<$7o
zU~prFwHs*_u?zwL2)Xi7#6TUl1=NN&5bQ$#3IWKjV|!UHu0S6I75&;`|KbtI)f5H3
zU5}yb$>MdxDrlH30&~_i52g5QztNn(L}O4YpK$PTf9O5u(pb<wyyD7U-9-KAwv8K?
z59hV_d^#yFZNJnteuUh1k6mL{Bjdt)Pn6XcKD$o3$3uLhqeLOLfc7UO51m>fE@1k~
z7S=v9!2`jQiPWZJnCF<a4giu3Vz{rp1uzM`smvGH<}ksZNf!vmmtjDbUjfhN7x%tZ
zu^;mhSVV<@MQQY$7l*#BFbM{ptU+;N2@6p-$L(=C)}z-GD)W{WfWT!^qoK{m&lZv+
zz00{{Eb`jxg5QvpLeJSBY|tK~cj!#g7uZUSPTx~@cP+RvE%c%;OuT6&$^6P9>xcDr
z2%O-mFAE<{yy{b}d|`z;l;KR&Tq?7$3uAPXddva<K-t;cX~brx7Ea0*$pJPwyzR%E
zs?>l|M7t@rw(({39pU~5H~s2i)4N~pyg54J@m#t@rhwn}zotC!2sw3l@%u^NcCI1T
zU=f?MH!T5R7NUNHZy=E62{`~?u}w3;A&I|=758?3A8|UnCE1D#Xh9ppV*q&Q{O%E)
zPa=r%a2};v;mzWYb@d|Pfvmc<9gK`yp{Fjd$b>hHoKAcM;w1PsDG`9`GkB-~0k9x#
z03y1^!{DSyid7&`^B4@)eE@pW7zpU;77O6Q_SD8H0GAJG)_F}?eY(B1>fXQkrobhs
zd*$97>TSYv<VPv5t0KwZPuW%c9Q?5Tds>@a*;SFv{Q%4RPMU$AbJ_S-i+vySHhi8$
za4xV~Swg?J$(;r7w(!k+0D-hy?wz5bbD>l>^{ZXNe#k{|3@tGbUiW{nci&A-MgQ9H
z69Odk5PD7MAieiM3QdZDfS`ypk*3n5sgRHWp(s^~fPx?b0)iqPOb8-K7erK0nn)J~
zrJFnc&N(yZnYr(G@ch4L&8)R&_RL;$eXkFYk}H%jK4g#t799gXJd1w{ILs}oKj+|5
zG6k}=PV*o#6WQef40n#qn0QM8UrP=dzSH9PyU%cQo0@uOovX1F0|0H;6MnVNnQVSA
z_?u35Q^$djxjgtkHx=;lg(3u3$=1)n)bKbEV#3r4_<o4b_-x?k#)R_5{nDr(p~I?r
zufQvMsjf_*?T0M)pQrY#8kR#gSR}(CrPCLf5*+|wK|>J;fVsbmiZJ@hhJFk}5_1H$
ztPB}1Jp0WG_;af4ufzj!QFWkyr*3<DC7tB52Y@udT#y%kDbKI!B>{dJ09_R>S^@x;
zxIbAqT6&`<7=gQ2_Ug981KvqhNJs~OOm(gTbnxIFeN=4z#QfHfnHvHCnNsD4s%50a
z8Pp6ns;Nv>d2<rDpX!EmOp&Rf;}MXOYO3}t0G>WbQfZRwP%i}++?Rs_qMjD&PO3_+
z!7tj=#cB)#pf=SW_jw2P5`dQ2FiVi?Axxmvw;L=h(S#aFU@PwUKJK5JO6pnNQB)iv
zG09UW6!KMS9|evXu&y=NN&r0Gs%q3E>iS~@hs?q=sS)e|Za{Jeg91_s$65toGb%Au
zx_{M@BGDs#am*szA7HZd4BCTcf#TA=a95$=_)xs=w80GxL+AoR8uwzDjY8wqFzirh
zPj!8wx~^fciz`?_KQ+V!hv9gKo<kE<<AeLsLTUvjU#HW>)ZziUm>S=KGjak5R53HA
z{S#BAYH+CI;wwgV3KiV}y`(CMhdiziRHUV14)9A>hM-u*w?5kc#8guY{fItLgW|~}
z$XhB20_jg@vv%Jg%0bFNf)61br1VDosI?XlAaT3xDL6BKcd+wxg^^8df9f=|uoAg`
zyFEtHWWf!ds>X<;Td8VR%po00S{;&_IMH5`@pH3+UPxhu)o8Fz(QymBAG^M40p9;-
zrApn$Vch9fYF~M-`8xHVmAYVsyR_2tk4lXu{26~l14jdN9vQh0zGa#_U9SmVj4kMr
zEN?7Ueo<V+Yh$KUBhJk_0xlR%=O&D55?Kp+de@!<LU4gLPoHWbz+^k}0(S881EZN|
zX=7;k{bJr-2^%U3G_81Ys^d}>Gq>Qw$xc!*+w0*@(#Ww5V`AgjQp*)c7a*2l5NrG1
zX1KXF=?VlfU4ag->aK?-dmW21KL^hG(xFsbV1xC}_}j1=(v@i`&QFR<5l@n|>YPh8
zHQu3LtTsJwYB*+<2#sN65UkjJ*T1<j@&ns-q+TPrSfHZS(SOVzYN`0gSHbUN5}g7n
zm6GvVdzo2`GTC?<*EBS(S!y9~xNT6PWJ#e-$KU`3!wkk_jCUqx&fCXM(3MmiTeK=e
zGy!5eT*{76-hg{#qq(1(F`X~i?dS&B1JZ;ZDy^V@YL)^S-ksNa#b9s8fB=9qag3$7
zq^6<Y3#WmWqewkwP#}Q8_1VZyzPbkP0Ye#`NQGTS#e3n{TQQrAfUTwS9~&T0dt2Rw
z#8FM$68^Q)bURxq4kW0s2$SGHr8K49{46+C$V`+_0}v>{)jdsOp6lk7f6k(2^&q$S
z`4N!&Esj;*VWO>HY1T&X-r4BO@&;xtR|Lfeb^!tjxc~U5^o=mS)dYld-~tO@@E*6b
z`(uF!voup75ZXm$1Ae+fj`p+dT!$nE)F3lO_fY};_X6lXDlRx-OiAn9ghsM+RbSl&
zp((9W)ti8PpK-d63W~)Ybjn@av@70V#P~mK(M-N7C{FiL>n6&RjRCh0CY3}R7b7}A
zYLu!4qZfF411WfD835$jqY$A%{bVWo!gfIEnX@JCmV*6k+PNm>mYByaS6vhB{LiKO
zUub>I9#WNPS5>Iegug*8axQ2&zu)9P-kDa#d}p%0M?2lem1&|d-P!V`vtC>CMRHnn
zQlECZs||(=P;fPxh_o+C-Dkq!RHz8LxK*SZqKMG^TrktsbamG9!iD#@?{MF_*n*nH
zYIA_64T>LKOpQKA`*1S*34ig6%pF<8(7dha`0YEb2ijkLU!1%BC5!vZVu{DvZ=Uao
z9vc@0R_i>rHotuKp55U1Dw53#`{}V`e94*x28Uky<1C|F&AWT&(!uMTk7_x8x-NZY
z$=)cq^mp?s+=|tOd<j@D#vQ{$GxlV>mWh}Ld=~Ts+ucWa0d1{3S?fI~qH_Upo*eu_
zx?aHjm!440`9asY-?N@PegZKeJdY9V{{CJ9abALSH}!#+aJ`pEx0mRMm)I9C@hz|a
zi<_D^Z?>NfLwd=(<TJ&w{VzAwTV=~zH7<?)uD7}he~f1$W*bQ3xBOpj>Rlf_9Uxv1
zsDIbTU>U&E`oG*%&L#ZxBFbgah#8OZ@HM~YYZ1AGzP5yo^F5vCqt@_MeZ*J7-BTTv
zz9<N@vYzkTpBq5T+i!U~y0D*}@^!iPtvHiezA*hvq>e)*`=IN$vwyQM@RQ^s>2B)f
z0^B#$PhULX@)apo<*dtivac0p*-j^Y(bLcKfnT5wOH6bw>uRc7x31R~kH5-t*t*~A
z>E%F`E8%~VgZ^-Tn*+ermP6urS&-~uvbq7d?=1DC803}P%ziPMsnH&69@knUnt7fe
zyrN`V@G6%;^WO+xt|VXkcK)v?&0V&YbS*Vyq$TxFDlX3d?(!9<dQw{D3g^~RX5UH{
zvw!54|GmH8QdL%y!u`_r*#pG&3hE(+9s$LFF8d<ydU&)mao)KV*ZQ!MR5}t+e%IS~
z8JFbJel3po@p4xs^Y`)xYc`zOYFk|qe%~M4wbx#|Qu8;k0eRVhrH5C1y#X22#Q&6e
z>-9^!pq99xR=S(|AgH}QsG~cmlkTQ|3F_VodiD4JcT+Eg@?Q@Xhz}La2o-u5D*P-|
z<W;EXXsFoNQ1Kt3a9SvWD@+0&CaD@GWfCTRCQRm1nC$g1x%e>oj4*|VVW<ADZfbnk
zwE{+(d1+#hV7T^&e>iHkC!^d7P(MGMj-zJ#?`V(iJdjU1wL-^H6N9D`#0CEcN6p;%
z50083jv%;<g<G|-M3HvHrxSu!!nIrf;iy`B$zIT1g92vjsDv{QBb?$>3=4MXJ*ndM
zplo}B#0pSun_wppq4_Y}-13IU^%UnH_*1UTp5K|{Lw@W3z*}u6|HDz|n5|oWdt^lB
z`ZMWYVKgy~jEDa50Y_%H{<#nW(mxZK2T7*ms5ywJ@Tin<2>3Q4C0ag-j-!U<M@nTR
zW3MMF3nu)-QKuvI<^FiD;0<w%o>Ad>q;OmLl<@t%e0zfU^d2n)z@Yz%N&g2pR+WyU
z68_<+2$oCRd(t7{*P?&BxJKj`5XEr`*^tEC<P<A=g4UBi%JOs^m7v$UFG<HyL;fg-
z?8G$e>L=fbha^jo2tj~|d<0mZ3!Dv&Fx&%Q@+8`O(s9&e7r`WNPhyZ@l1oT(P)M|@
zKU184qUBz6^^@4AZ({4-90+}7ME$^Do=%W1jlJ?PoQ|Vr_a};n5L`>cE&W;C_rOt^
z;hoP2KBG+WuF)=0`(B<zpI6DLdtmCr@ZNK`^y6cjqkguUMB0Yzzmj8#@@K+M|IS84
z2bn}_xF+3GV>-VFo{}R3@9hMQ9ZAoDU%w*MU%5q#5@f`4f%|{p<Dh?}3vQdV+}3|{
zyL0rGfNo?5ZQm>de103GjUecm5^q0DzQwhBHTm{EQgXb&uIn~9_Zh?U{O~aQ<5<$~
z<h^9u75ppONt__<*AM(o{?6{XzXCsYeBcQ|AvZJtBxz%2*oMPv>kNZTR?gamA9Od>
zH?~SBdK6xcx6?70kGzKHO{E@RT>}n$?ZTgE{F$5n>61ayxbm(xU`KYO*dXfH#_EpT
zSSdOgrX08{|E}V6zQ)zHU4_Xi$0v?;fxk~pk(>qpkT7<Lb4lr8SwP3Jvf&Gii$+RQ
zgmja*y1bu9deXibSu$rTH^xVm-P<BI{gi`g`)UilsREkUHulw*`m^QER(9T7*SO?K
z<+KS)cBztJ9G}`K+Vkqh2cEjNYO!BtnJw#3V`H23a$P)1ac67uNOya#Cz(g}+Hq^B
zZCRe?6|9PQTdMm2dpJ78QE{0NGBsYuwV*9uGkb7zQ#G>c<L#pZHk0noYfHbrPdvL$
zL;gKJ-20IXd*ZB=S%oqeBPsFN$u~k7iLz$1J7Nx8zjWzt>iKAiB%#1ouj?P!wTS3S
z-#7jIytY!GlFLF`CDZ=LO<lAT4>Pxyzh7`q@{aN0zEmcPRbM*G@?*3Qm({+870RCX
zKswjqw7$$eXVxeVp{D_D-vWIzX>XQHO^1AB3NQbcn<_LZ{pg@kwm9^yzFf(TuoX`I
z$p3az<x26a2J&V9?WVTNm)|j<yQw+9sb{dq4N*Lgxn|Fvao4v!onu%ywHr|J_<roE
zn&dCz7(FhI2|}vQ&k2y^Uw;j#ZqvfjYkm#oiqDbSV$wN=*DGU{o)4Tde0)LfU_vZL
zH}QG8$pt->oyo-3Cq-;q-@J9y<U6fk?2V0PrS{dDj{2ly_IaYoApm$z-5wY1Aa7rl
zg*9@v$>xUE9jtTdU(U*Ug3OVoKzL`6xj|y{GvREyqc!uRM$S$28ZCQ7cCYjyua67g
zo>N&LG-rtx{s!ut?i&O{yfD-p*8aR9C}|wBb4vMy9c8X)8l2B9L>db8gxQUS?Y^*U
za!kZDjop7iZ3xg}x!HNh!&NJ~NA5=$kD*6g>UJ-CDmJ(*+36YYXJx7C4jSvu-jMqy
zAvHUzX^SokCOUA%Xk0Y&Y^rQFljmvUd2<cpG&_Z0P+!QH+KRaN`XchhWtFQ@M%X@R
z+5R|2#YQ9hL1X08ZiDqYlcip$Y3qE3s&T72%NFjER`fh6q>E`Qr<d>xbJqep$R8ta
z*M?bge}Mfd5dI+h#UJK)+iB8VT-y5VO<GsG=Ut~W=O*;jBe)KFA1ltUfB5uMBQUxw
zV=`Th=Jwm-LV?C%<PCs>&9qY!-%-k@oAI{UY1yC9R`qnzYlXea*<|BwhlT|H;M|=g
zK$#24kL^2PCMx=S_a9d<t5loCbm^Z~SDOk&0euH_doxqjZ%?Q|)_E@2erB|d^yN^Y
zl1=OliUh2YL~w-LtH8J+?-^69D_D3==COs?ad?G>B>#)5*UDjyX&%Rtf>ilF_3XxU
zKO-sO|K+BRPG;Pm1Hpe~S{P1wafU}zMW#v22t0+&6QChHO*V(`P2Y{|FTZ=#>Le<q
zFkmI_2mht^2F_H-YVV4M#+G6P>k&+{kg{Auy~_%PWJU$cdDe3fj0o+MDcE2I1#J!{
zDjVw$x+Y2FJ`#PbaHfsm)C|je8O$i}sLqD=riyNo!7}9vwx<`$#lDdGl=KuJ_NP%0
zYA#yPUjbq*9iEvK;V1R8k*juy8~(>13<nOR*+zyHmF-qS$yQ(#BD`?g6|D6{VGPgd
zApW7)Ol~!VNtS(w^{U{NQ_-PzF}0c|dA+_`%Y|c!I=f|gmP~35<D8bTrV3fxJQO}F
z)g1S($Z@;M1jt$uD9+3Kxf8AM%rw~?Hz^`ztYA+#C4Z|xO1K(|6{%<-<g+sHc4j8&
zGo)7DZUTvPHUx--yd@_8ajHR|oN}$6<O&CXcw@=c(4H}xlSed0oY0f3`}Pz`Ez|Ky
z9w15ol<-v7ulHsl-x6g$nVx=GDJi^;2q-@s=PVy_hFrMXtJE<6zT2_+`L3Ii{EF#Y
z9aDahKdv7xiAcCgG*MvV{>himK0W`XmLPBkf<ZE6u@2O5!l(64*-^(J9tA!xyHAu|
zg4t4aAoHvp+F<VvU6&6FO&q19K3}}z>?$)8oD9Y4uBu(=@@|BGv1AhS9%O5AZ0THn
zJb-*OPD*4=5U7$VH>&S=OQ#1rzIQzf{FcQ!{mzSjJ(J6}(dvx#+`F8YOLF=-`f2|A
zTJ4U3Z<KoILTabLD}K%(L&rvY>*#X5&CEU}*VG9yni{2S(P>+0$juTp;?2K{T_aiB
zfUUO~M3(Ml>ne?(wm;tMLCVS_wUn4R+1`kc_t!dZo?ncd&X<4B*yx{Ao4jdG7g9ZC
z<VBBtPy-1Zy<WXq&7$1l5HuuVMLDGVshh0-hdwuoQYc+WrJ)Dt*g$ylYa{u91_U?~
zYPY$y{T%K?7g7t%a^whH9xD=cqwk-4eFCPNr)PH$oH&?7&%gCwakE#dQVY?L^^1|u
zo#>{#Q3^Q)S@~ry&dtvtW@9UTeHS)dvYcaNznytiw1)=@d?PWbE(Aa>3D>onW0`ML
z!qtulCRX*x8vmSVtqY&Hfr(H*6i*yvoF;!-iM23sjAXRFl!e7xI39A}+4gfo=GPD0
z!85SSYDtbed`#}Tn(*Vx#?h3{$3(8G^QpI$P@-HvfygkmLfa-urx__*c}pKk?qu15
ziPf-;pt^nu@zH`6RKT`*b<RCl=8R=ETD>@Z)~&Nc_Pi+&lElEpIpZq&83z&J<mSCO
zBgA_$_Q#?1=hYe#fyvP8H5=(&#)mB_KK(2v$7Tux)N(=AJ_ADU#x9W0^_G3$2?Sr;
zx_%!AVl;#57^QA!Mq(*&%>o;hVjL-MhRW5Lz`^|^v_9<(F?DvtO3YM+=lp_njFpgq
zeFKH@3CK)b9e%nKIR7nqN%Yq=?H)tLZCJ9}g~uyKDN*+R!*7d25Igju;rCY^4@tX4
z>h8}5*m{wXMRQWDOPg<C$5}^TmdaT(JEx()ImH1U7#@-GSp+mIEPm+`C&AS`a0U;-
zF8RoK#z9O3C2nJH$%*F(VxJ;l(f6@>a!Ft3_o(q1E}hC}$`Hx2Yh;eFF>m20`*D3O
zapl9$CN2l0*Pn?GZK6Ru)93Ai31apX!P=ZfGos!!iZ>moWrgPU$2ZJ_L~sOtB_OiD
zN6>%vQzM><RYU}kAgu(PY{V=1<F%FO&k&7QC<;QJ*!=|fKE=`$ZDiD|!An3kCG31l
zG0dbWw^9qnM#Oq)3CLcMe^ZYdqqPHqD!7juKOo2{;ic)R4^cGJ7g0nyMG{No4Wv8-
zGBB9qH{KHw8)UwjUL*-KT@BJ|Oi)uobG!Foq7(T2@k$$1K@wFQontVK=dzr`lzL!S
zB;fR)^#zQ{tvMA_qJck(+o=T3@QA<Qft_WKN~sqw_K_ME#S5Wg=BScbAX`L<0jX5m
z6uU9}#nvCixrEc21{zIMB=?1{SD_T6M<SiT%8XyzLdFmPpd^`1GMd73%D(p^hD&@z
zxfh@6PM9q-=L$w?B{7&dq2zg~P}1A|VIuDs!nXLUPUNEQFM<H$0|EO%erdeIBwkgC
zMjdr}qdh~_4o1D+2N^pi^B_codMO&2sF@+GVE-pf#W`CNfu(_>QtLs#X*MVz3vMt#
zst8IArui}@Mj>Rj=meH3f?huZ*p$fM0ASn4aqZLJk120719$@j<^`TU#HlP3wJd=;
zV~o1eKwWpxbBUh5s}yZwf-sS)QH(+MqF}*zVR?I%U=;18?Q}1S4{L2FFKxS#zyj!z
z5iF7GB&#R^5&Iy-5>9&~fnr6aYoq64ACC`{A=5w+c~QF|wBQV*#y$YNgyU*RFiEFC
z{PB=Okl+x29`8d&FUjna#p$GGIz^`eZ7Q*V5%u$aPVxBj?b0C)BbWCL(}`mZT=MQV
z^+EczN%&&zB`yWxHyui(aX6!0!lf-VC%Y)yG+qg3YStyGwA}m9mPuDs!f~5A`)yW@
zlR;l^09wHq)0Dt)B89Cmf8E>Dr<|<qA}8ezg3h2-Oo7jhv3hTbfq|E?#qg+Dxo8zo
z=RQHCb+Jzgq~Gw}Y?AUTi-LUj{RJ;odm{<XE4@C<AT`U4XYJvulC^FwF)>|QJOD``
zdm&XIe)Nh?M1|HqLE1FO#+<k`KXdvJ1Q{wen3<PYnX%iYUKu7D3YHJFQK3U1-Q83_
zB17mkacm|<Y>7cS6Q!ru3oXX<4$<rM<g<k36P9VXk(e(WN_e@+$0oT95CA%ng>dl@
zlzm9}K5XiCy2K7AZd?0BqDD+_18pHZBhf(dmINgQ&RWGLc)0l$9#RXDj0H%d7;af7
zos22=ykB3P2@A*)U$L29QaF#1*%Iex1wk6XAB>k|Ziy)z60ZMU_EM6FP+|`?&)zo1
zDmF3b)0I?qigweLEp`g>w8Pg~blpBE^3fWmYE8`)r7~3W!Z>a2fSSorV<fm5bKkvo
zBv7RoBhP4U=#n<@Q|iJ#h%?SEPF9hVK_VC+j~!xAbPjr{kqg~Uuvx-AQ<l{-llD!T
zN4hU@xR<yl1flb!u@Um$3RfUam?32vMMo(i1(s;2)&s3wL#QRd8Ou#VsA2#Vid7ox
zL~&h8P$hz@daN_wGQK>&{*p7N*&I840MZZ?V@t=&MWa8sZNNfsDvk<Rr;XR`vxx~9
zK7O;3^OYtL0*k%){hFuJ{uE4Z58X|lcB>rhQ7VajUxMsakuEXm?_pP3e(<iAiVp7e
zdup>!?mXS2!;2Tg%?UQ(#gM&M^BCBIYvlxsD=NJ%NyytZdDuq>V4K|Su;2KD@&1{>
z1#YuSkFm-_%#*mls!FVp67_?TwU|2==~--2wT5XrHCGd8#14$<1wA2suS3?p^Iq>2
zUgwn9nwrF@2jh{sy_Ur^_;Y0M^FvVFuhJKsnCRm<;7_8sD>~wzl?uA_NTijX*}wH)
zRw`9T=~VkdP5W}$r@FJ>4yYY{>zz|i?OO?ldR&i-K~Vop6XGRBa-s=)PhZvOt}&y&
ze65LEEnpeDX8wW0GQps<!epb2Z`NJ$kSaO-xF3n#zkA*NLGW7`6Kj*CR%5V*w=}q^
ze(2psBHAycM*+N|Drkf~ImDQr)bioUI=dKN(S&ht`FCr*dz@<%=E@J>bF*1eRT=<D
z00THT!2pM&RD)t{PhA31SAO<>aIUrYm&VRvDq@$DIbZ8%QtCeS#;^4nE!lGqU!6@@
zyST(YhNG<+m!|WmB_J!-YLb$8cB!yefpxtX`BuvJzlGR3sbM>%TI?H<Yg8;d!|&5u
z7#r$_{Q4k{v+921cTS9nO|RG_{&`zjo*RfY1ScKbU=ks1b_jYK20#$2jE3mJil5@T
z{_Xd1DQ~H44P*!zvyIgFse%@Snblqc@&+?tdntV=G}Q^;y1Ue{1QIf(9QdnJ#n-0;
zg%ojQ2z|pcqHG0#;pad$tzYk1K;Qzh<~~L-1AypN%^Ue)FWLhs#pO2!AB2(FMHzYq
zf`MPj%A>dscYzS%l7{Y1vaqJc=T(&#$<iSJ$dIWNYR7KO!IqbzW63aCQ^HT8Y4W)`
zaE6d!N~jO`CFQ;66$!YpEk3m-3g-&tOzHNS-Xg6|v9YP`pMQEe*LxS1#h^0;tnRqY
z67}nEM%Xt3-H~t!e8g+k%S)-_{SD$RUb7#{vW199dAtoi#9E(uJ@%f!vw^^NUad@O
za@6|hTUdv!&yjOlb##So&SOn{JtA0sS8Yd}opiur^DWrkBm0FGKN5|mRRl@175BY)
zaVW*41$ktzIKq?L5~O#l^us&QyJ~{LE{J^RvRl|AIde(J<A-ol)J!yd-<ZguvaaFp
zj%_8ZsG*VDa>~<k>zNut(tn)Q(B3(y=$?ywlX%MMME*`PtblC$ht_9g+5Ae};^6^+
z6{q}|lSM8jUu1*~+vs60cse~^$u;e#peJrPSXsgFf-9GSp7Ol!EidtOso<`rVku6o
zK^ENV=g7EZdf1~MD`m2~bVjnsa77v0i-GMu*^|M;m(X19yZ$`d`mUcH({!%yf^<Xn
zLP)+*)D)%8T9bW1kO}dTMxa9R9L8paZDmG<bdhtT*+jJI!hPHYWuPK7kXNuKYyXLA
z#rG%=YN}*U;|MD@Vg|E4C@sC7R;inGMbBw>+-@59u0GN~b@u)F00o;(iC7`j4_)kj
z6xxLGgZ`#ulcuBTddz;$vv)NnGeO<nm%bVg_N`E%(O-Yc&`>jhty%Dx8|oChHKI}{
z067f=1C~E9)PV^h3chN{mC)3k7K3!a%?%K_En0!xnhrNxt-PZudTn6}^b0l=`HTx2
zoB*%2;es3x1@yDOw>|jUYw?p2Ib<3dgiq-Pm<(zfM=cu?OpVUOV3%+oQN6HIGNd0}
zKvz;55)591PfETP*)tV=b4TEZ4b@j8!_YRy6bLQoN%MYF@}uqPt3wA<;dXsVwhf)L
zd%bn%nC#Asf3}P2td;-N)7~JZFRAeQgEFemr5_QD64S#sz2z{(9$~PCFONVktvg;`
zy4ig0sM-4H<qK+4_)$xgVQWr@i55mP_oy|aqwNJ9K@Gaul6>=JM@MscM|+TA*QjCV
ztB%&aj_#w5rq3OnH;=j(Z&GN6&2S?M$f%X=R`*xK9?Wr%Tqgx|OePo_mfqBK?`&)7
z=<(_72|uRl-fE9Jep7Vo_1Rm!T%G;lH$^^zcrrzvT&JELwLn&B%zENRzT-`DaU(va
zEc+PoV<YBU2_{fu&V2$O^tNUxX#4`+WDYQ1PL+cij~;c7fKSF~o#RsUCiz>Vw9YA>
z+aGAR-l?99>YhwkoJ^iO8NJjs&1U>DzH3D8<a6@vsX^lp6UNNN#uJ7oqnNHqn$i0U
z#$P~PU)FDZ{6Mdvy8Y#P*TPQM*C)nv>z#8gw61v{;{{CIxb@!;n670XoJs5LC7zS%
zv)v!cyGF_}nzbi$>&Gi1-K%oli`W0oJo)>z1G)UQYx!Z^YSGDec=t+9-1kxB_ov3&
zPm#<G-CML<8(+JA8om-iO*Q-=j^vPqDnJ~WfV~M*18Ii6@Oa4z%zh3IRzVfYeRWC?
zb8zJqEccZrE`I+C?N1bKFQ2xbY{GF1Wl)7<1u$|TS4m@PmeLnx2+WF)FIX;G8z8wt
z^>6BJ4`Qyc3UDe#tIboBxTI?AB{JvGL{T9Fcfrtwo>YN}%kHgN%ND|lX6;(8zbY*5
zNeJA%MVC}x-__QBj;+qQ;_whUQOMh#N%J2}cHkH>5}qj4bl18nJd_$1gw8pWY@mI}
zQ*HB@SzTxNW3${q&8hnP&Xx=zk0Nlu3Cnzv8jJG?OwlSzwo%hLWwhdK_P*LT3Xwyq
z4@bG=KVEK?uX9`Y#{bhz{rvlT1T{rKH%>Gr?A!mtO}%({W$r(2YTOO2>ns1<RPngu
zPs2|5mUwu4+{w|w-hbTG3GOr93>-#Ky?<INg<0$tv<Grhc7{xMQ@0yO)%MA$VU^{0
z;(fJ{<<>B@kn~nft>Za1t{0jEWl;6vtUj7>wUm92=#5}|s7K^6cRwQ0-BwS8?xq^@
z)#+iF*co#;lc28z8+&=uio&df)f&)-f(QMe0kzi^4lIgEMm)n>@7;5Tb<7mQhV;HE
z*_pY&bGSTc7_g6Hq!jex8L#Z)=0SWL>5f>Kgw%X`m<=|xRbf-fB9X($y=gomq>UYH
zI5B`>g5{3MmRv);NMPhsqRyY?L!2!`p0y(5AuiuL`97@9%xJeL|3cXtdnAhGxlYdw
z@qH9_K3-rKR1+jIcLS{7u(EsF_Y`uG`l+X}Pk7ltk~OwV<BICrPAu#N6q%XOr`}Ct
zVf$oUQiNN{xs(X!-+3O_ei%D^rTH?67w8Fx$n(#?hYEQ^!`R)EQzBsx3KqOFWCVR^
zPRAP{8KVtZZW-h>?o)WOk1Us{n&-VsS1Nt~^oFJ6M6^bP#<-cuOf%&OIR-RLO0c(6
z=0O&^)8|g-Sm7kZM3t1EjHN$*!1E?mQJk5ZktwBbt-cF6!D{(L{0PbC97@+xPkWAk
z%<dT9T`@v>>IYnTr%cyUeeX^#)u_pTzoz)BkH^M6L?PLp%X!Lgw5j}B+o{U<NUgx<
z$}Np+&(bdU=8rA6nK#AxyP5C2v)#L2GU<Hj<kwW!(-(SIT>27;ub$rSfU%GC&o<<R
z(-_pl>WX6qHJ$FR?9B~YX=l;w2PqmE90d;q{3>|v7-3{cWK-u4T>@%56Hzi!qGA1B
zSe|h-OLA7o&|)I$=eLLPEq=e`QPkt#x*JD-s|j6tF4JV@CSuy>$HQ*br-Vr`=ewJA
zwIVlp#;;g<CbsBrYwD3pUO1_xHYs?4ro7D!ni{*Ds#Eb_d%le60IIeQxRMT7;3tz>
zB;}?a_>$!%|Fz5v_lUbj%bp2F{;pW5_M{7k)<ZB=evF*CT*BLN=1<vY@3z>!N$qQs
z41MletgIo&WiXgm_rTSBOOMKKv2>5qj7o~>?YX@)4$_%)wJ=Po6cU!i3)!i2n*8O?
zT=ah=#BzXjCqh9Y{+2WeAvZCjY5-r9&4jTas@vP0Ad*vnHIe>kb!N@{vLGFT0lA$v
z;e4J|9Z{lVuFmRM4a*xDcvy&xsdSlHG<re0q#U#Q(w@I3m%=N}ycMBn5kL?c3YpX>
z{AhCp$#Z`^cUfx?Z*$r4KW?g4U7PLoxU)sGjC413b;vi5r|30GPV+U(u$sP)Phvm9
zFt)nSRt*UMJ^8)Y$(+HF^+m3_V6xFY`-kdTmez_=RjAj*F?JO#J5J}76v4xh(%Z~*
zwF_mYT=V#@gBHEq%G6x<lw1nyq~J@#Y2<~83@hA-HXTd7PRCNe_&)*%c&^$d@}0*0
zb$Y;iD?1BH!z6?XE<*YQtHhH7%O8nrS6lO)%6^dQ^q83sbo<dM&(fO7&|X}EclfDu
zb*avE;?*?{CxNciT$g9!FC&|lRs(t(6UBQQwVf@|Vv$sc`S!B7-3m%&*+4jYh-|xq
zz{u^8@bQ1O3i{+3T?@T*@4Coy$KKj-kb9~!_)h)>?@X<)!qG>eM4hMQo57daSkDhL
zXE!|zP4W#So{wkHXs+$5#RWe-Pj|1H>-p*w&ipL&<89U|TcL!B{kiYG?W}uPpm4o%
zoFLH(YTNDyvNbhiXb)pJoCS%tn<NuYH2?Fy6`ywO%L{+2dVGGRQ(|nZzl1ilyktnY
zuD@jcmFD<K;MLabXxx#a4d9CQE1+b9{K<v4=z{s~UD!769_}u~ho~;dgOE6Wqf0oX
zUXM&2^p^6_9G6ciW53uP)${7aZ{8o;#yIY%Zb8|8c@Ve>YKbOEp?6#+=lPF4iH1--
z<n}K0*#zWHW=imq5ElctX#|IK>>Lvxp^Wz$x>rp)CAIdEz)+l4-*xo{ukC1NP?cKW
zg?Ix$j=}>&e;3Un;M(#i`J-W&hi1X1yB}b+a0H-D5VzWeo0hkXMsJOjQH=aq`9GPY
z*K4}&lzNZvKLTH{L>qhVxQ{P+vrV*O<fAu;E=}HSbhi-3tj>a6lA35CfvTU)gB_1(
zps5R)+SPK6OqbLogPyG>UzEeo2++xc?aW@u&h?BqOEf>~6GQrm#O3iUySV+&!3Cd<
zK8BhyUpSC(@Zam-G|B$+`B6gC?LJ!+q^Rfx1JhnRWn!zg`}54ogO*mV#cR=TiWr4#
zw{LG;+`4u1=GT1%z3w*KPq<{8@hLaGmT!gL);pMn2{opei;Jscne&`&xL)rYn;Gpj
z_n$4fGS{}vXSg1}hnKZ#4_+LB#Lc{iw?O^`jm&!&Y(>CDx50Xu5}bzE&+y31KEc|b
zQgQ4O$$v}D_$J>VJM->}Jv?Y>%YeGXUI%vvh=&tezT9Apzi8-n?nQD7r{#;MB1W`8
z_|4C=TfbYM1a0~zw>SpLc^&naY(~W2Y<&fa?)rXH^tM3g{7>ZGEs+oJ-rgaYREqeF
zJK?$8_UDHiJJOvrCHWuWZ}>-u3l}E)?dn@F>X(Y|l)PHzHx6M?iFunK0-?gQTTw64
z=vb=nfrUMSs@*@Hs+ZZ4Y{Cm~5wzQT_+X*so4r|Yp{5XrSoh`_Eq%B8mFRjr^U;M5
zf4^3ami+KR9Mi;2_J+Sk?HbZv-Iev*>-zC`x9H}{H*m+vJlBN-ffpzB8Czs}OLvX9
zdu^LHb@8~YA5HaY_7t3<uvBr<N0-2ss?&B{A5`pr?*bts^TM%nzdg!1V@>;LnQ0tG
z5?XzxA1k~p(Pex!fMlo5JN0(qHQ)Xoo*BwLZH<+&dWRQ6E<z$2x}%|#I5mj6CnN>h
zoIVDAR<4m9!cw?BQ*2*bDaD$Y$r}0;ietetUo)6vf&94278N2IyUqGoitQeKps$u~
zw4tjW!%i5RTd{k<n)w8ZVhku3^nE56a)-T?%)(58hj~GY$pSdj_x>oYT|CHIb(ymf
zF3Jr$@q%d#zxR`ZGb-+~2K^ILn^F9cK%r?IhhBi?KQVPaTO%N+7aY$}#{sN<@tk$D
z0Q3NfVPOvB2UYWfWY~561i~9=aX<O<r3B6p1#bS#NLLrU5h_G09M9-akFSv0m=5{;
zc1-B8lu)vRFpVT!y(pZlCPEt)v}bSYr?l(Y>c&0h{;Up<dp+eZ#fV1$vx2yP4H)mw
zbA>PF`OEXa8qbxbbEy)Sw%N}heR3JI`F%<eT)*^Tj=66e1z6r8DE9i&VG=^`GL&GF
zB^W7%F#bDUW2ZLQ->K=_Th|G`lTz2vM`ugDu9Y62moCG|TyESP8DCgF#Th#{<>}Lw
z;3%J*EuZ#|o@kK|^5M~_`=!J|=Uc@dInoEWPnCzkYH)+aj_cm<a(AmV939o~;~8DD
z6>0tSh_t#BN@?J^QnJF+ZkYbNFy+u}sZp5H`!J=|Um~<UrP>)qfe-ZuZ{MjbYAEeI
zR~~Lq%~@1^qoj5tBx$X>y|`52B1l1TLPJ$k{wjez7O-q{1^$R);R51wBanhYlg$9_
zvuCx>g|pR=+XcC`M^HMW5;|L6IswnTn}4azLTfE?CyrPQW1z0r(-*hS(vp09umO50
zFLdL1^a<hmZ4LSvniyUU1Ci{6cV4p_<{04@%07d7il_7wcMQO5EofiEiEo;nIS}}Z
z{EgFZPrng!XaC%7F3#u$j`ZYr!HBw+YP-%e&49RNfx5Pf;x-MO`>EWpCeHJBMf=Gt
zsmjUB6qZhe_=BgMH2_$<xo-a1=Z6rr+&OkXYYAG4x~z%TPwZvv<u|==cV<|DSm#{q
zg-J7gMRT(VbI>z$D_8+~m)!})`umrmmzG&*uGx)AvzR8!crDAv<HkV>e;jS&)aYU=
zB|;blG3U`foX|eaW4vExdS+4lysB0+j^8)DvJ@e(1!VXiG4<DZFHBt}<{3}5mao9D
zsb#t5nX;@iK~3F5c0wR$d#^P6y{0oKxkE`~SgxHjY&RT?n;go=tx!Hsc2Ny+cDIg8
z!IP%pQy{n!N;}hw{TA8egu;_&3hNAl({b!3PmyCFw9k{<oa*$F%;|qaWCOwKch9&l
zLaTZ1`!as5X7gDwuECOEr_T$bacX}Ne}6{K`n+-O`Lg%qdcF&UfalkOE)>2vpa0^5
z*>m=XlR0_67++h!-NTs`E8#0RPBhip)<?hw09B!w7|%0Bda(fTF5zV1NR;R?N*Evk
z#+G~hcyDsWlW_yb!KvdqFbQu4z;2a=8{HLk<d~4f)4xw{o4anWoP90w{@YEZ4!O$&
zh`Xoj1jvi#4Kj1f@(Gt|htbhgy!CZY7NdEulQLdY090C5iwN{S0baQg>2-2L#F5XK
z=&aT33AIxd*dhZ<5L&He+I3o5NF7~_&Sk1g@PE0f^Vcu`@Q3Q{kaC~08sxd&AJ*3M
zbjhNaxOuYEjOO>yAfY@Q$Y~6o?xM9a1*f~Ieq<&JC14a3IJo<L#H;bxOX%2Ci;kum
zOav(`+l}Uh8-Dobre4&#x^5|!jIdd?;E2URxn+e5Os}~uGE1YxT*)RcP1%aCx)hDT
z`GMX{x?0{*kpeoQ0w0WoqrCOCSwt&21=YpT1a2LamPVAfj&8)$|8`R^t2;k*Y`J*H
zUp%`M{5;IH0mV86)Nuten$wSi2i`o$crBm9b&kmuuu8;(Z03ZHQMWAsP~y3O&(!G6
zz&3;L{Mlr-<~i{PcKegKAme7cS1vc@3KHmUs$o<_hQClOfVF9obQl7;pYKZB<<{}g
z)v|Q;aKMOl4)WaPM{WTjTd1Tnpi`LdqW)a}&{Rp+aLS*A`2V=6`I-bgwy~e8J<xJ@
zS1oMT7rx?||B1jvFPE|hxGqY;`%Tk|rnPT*rM-%Zy&X+@^B*^LwVo8k*xAc=?FNBA
z7MHe8f^V$JePD!F0C<-$V$4$t<Am5z!A!cFI;eLi%6E`XLHD+NGe{A|m4f*XbW&01
zSwhg^e$e0OOij9*`Z1Qx&7x9SE6L04#v*Lu_ucb&!fc~XE0A^4GkF9gI7Q9Y2IuI1
z%%i)hXQpywmR7_3h5RK1uAy`nC|T9RIWwi;+9~*_eQjFJ9DW$YTjA+(MaVat?xqSA
zwcN;;!S2^f@RBl;uTsxa+j1C!8l3LxFbo1ONFeXI>MBu))ouwd=x*xA2R>m%H>3sf
z@FJc&I^H@gPHlNLL69{-`lUtTHB<NkMPPTH(^HA}uD0&BMC!MXL4gMk=x(a+{m;Mj
zEf#>cvHLo^+oi@S@To|yE9KwUN@KpyGorM0r%<eaCLRU2rR)E5Q=fna%EOlmLwz_Z
zKjtjsxf3+*();OIc`HK+oTu6<RSzno&euHo^x)<vQ(0j8_cE|uiw+~ca(zI|$k{u<
z2RdoW(JH~a>?K%Cei#5sd?;K~eZKy?K~Y`1DXpPhYuZ7#p^PIkRdj9c$yHEns1)x;
z>9hIv2(|n50!58)rt718V5wfvo_Wsu`Jy@$uHX^4X*;K^1YDNF>tDwCH$>?8w3doh
z(@~bldF6()R04OAQSKni7vbjbZH?DOTEvQOiu5v;m9nlO1ZE^y5E6_#5)D(y{99hI
zY%*6^8F(RrVCK_SbksH=!IC7wo7dhf=6msMY{ygmmcarx@i|~CqJRP4Ng(IS&jBUp
zL>R0X#7!A`iqhd1ba7-c+{PpVA9hj(zC}ut^ZIq{1*zR#uDD5NbLVMB2z)6hJVV!0
z=Q<pu;ClCTh#lZhu|3@8jjI=K5&!@ipp-cwg$-@QX!9REb?7MLl*DT$GBtU+I~=sO
zR=R&4#Q|ZP`X#~NB=YQ}?6g7#NI8`GDKGbe=}s7`^xWbt-A=96`Kl{Yj5o<WCGM^U
zMt#o&dd-S^&mQ+$E4&7JcGE0DXwkkGqNFRLx`D@icx8BOnD}H?gx}g5!Z8_BKJq@6
z%`a8d!%*9iQhih)!k;^N9#}bppJeXhwA>U=^7=G`&sp$-$zE8K%@;i`eQOQ6mt$H{
zcl@?ocvvoa&|)UHl|1M$GgL&$=$057HJVg*9llN&KBFvJ><RG)vd(<RmEb0J-1}|s
z^kby@g(xh=IQG0-)Q2hpv>yDR=xoe<1cW|`>Q7-yBG-=M;WY@}R4>SW8D}YiQ?T-t
zGxhA=%!D%Y<R!727F~nDxj|6%`$lrca_Rf`VpCB^rfO%us`Kd30aZUbplUjRE@w?e
z!4r(;z+d2{?ppOg$TbOpQbd{C5LXW+*Oma+37;9AwQZRBVwgW`eKJXLe+`@i9+Mc*
z?ypTAB=~gc{1IEug6RZC=Ixa6m6F-~SSS5ag;&MDUr80IRmy$uv@=5K^O4~H+pfKg
zYFH~+{Ls7T_9Yn8ooh2Y>o7YMDk0Ky>)T`G&5Lo~yuH~!fE|YtES{{aI6y@ImyaWH
zFLH1>{D<v29pbdR$W_(9TCHAfYdfp&rPsRRf~%34wSQ-UDeGo4lVI`?5Pp*q=j}%s
zjad_|Db>Er{vPe~OYxG{8t#LYoPcZyTkHHv0BZH3)Su<<A1BCJp@-p2@JtB&y$s^@
ze;cZ$>ux3yVkW<%q?difby5$n-h|u!_1HTz^_vFyWA%kW()9INcjl0<?=!xJ$C!9I
zmSx1lmwlve{Cuz<-n(D@&^PC6MjreNkjzl)@!A=6_?i}82lu-F=@AwG^dUcMtY`Ks
znnlmolUMhSf!?A5Kma=3kQ5?{V*3hV@K>_~0)Q-v=Q~O2<^LZyHLe#&c}RQvKW^#}
zT}c0w%VIM+Tw-+d@R&ub%07Q7X;)B3tNPtzn<4{_)OQt=)lN^(ccp5tzeWH6lVrVy
zxz~w{N>FxK=%cBZ!Jpf2v+W_?K8aXA+>jfs|I&49kAGdA=>C;LWE05~(ym{4oi3uf
z%!)vh26Ea&*^h9)e3e*%u7Z2YyQmaiu_ELhgO_jGlId<Lhhe0>t#Rp0&K<*+t^5?{
zqrV)*>Pz*#K+D#R20a|O#N?c`m{I%gs<YdV?!RFrh>e+!(b@?@`rgl_)jySYkzKLr
z?o6%mT)3WZDL=ki2wnl;nA13Bp3%4vu~YY2ilF;Y(%iK}C)zkjk_8Fzvi;6v>6OUu
zLGns^#UVH!lz^S^A|<u?@G46_fXowx>-)XaRJtKj$?_wXK6fT|$3VIbe418wknI(c
z>1a+X-z@V}vWpovf0z5_pkKbjz;;^uICum77b-GP;sclSJ>pm@-4!mk<;zrOrYzgV
z?anco)H|zRzAt}G$gd>wOUjj4tGCs;y63i8<ZX_l#|iMiGdX9x_Vl=`ND<2{0TtPH
z?Nbl#Fv~!4@;waBz>J#~2DK9}o=rynbe~AAI>j-O>RIHyC;#~Q$myUuez(KG`t~oq
z9Cw|Gj??;>N$yeQzfNT^lkS=FzWVmpfk930?AT=MM?TRQ7hd}R;o*|ho0|V*90%xt
zDfb16h%`;s4_@mKKA%=^bFP5rS<Yb-1Jhlr&b%{x_f>pSD}Ogv)^{+&(?cS*IX4_n
z<*98fsSzJc+!wB!nIA>$NzYq|Lg6lI7am>I4(pM9c>Jvg{*;)Zn|P;j@a@fui#0*V
znTjvGB!b?jNoMVOJL^1}PIw+6b19<9(n{ds)3^FO%k;L@++VwdmVpRud$)6&6C-Xi
zJOg5n7_YL8tvlol>o&zvZFE@LBvU^NQj~Qqf<G8@&e~Y7@4j6x{wQFi6tZ~{SyS(1
zrmi6qmou-dZWn#VBfhSG8tmYcrZ`YlVyjy3|JPQ7GEI|YRUcyHNmuOhr4D@`5RHgk
zdzvxPwqBjG!1^V}k(%-m{M$Qiiv_4^WZrp%<otQl;`82{eTaI2()n8K@6($Io`awn
z(wlcvsxc-Lf0XeLjcs#$?%90H5B~+0$d%6FI3mtToIZ>?4h73So1wjdH%ntuOj;KZ
zN9zx13m=e1Aql<|D3e?QUf)lYD7YOo2YQut$3#9sFhImY1DV`Bes7o$7BQ|HOJO-j
zRJ-x4v`;sojNEj?j<?IcXyvV68tr#NQt{_9c`SGO7!-7k($CDUFF_TX+D3eAps#zS
zcRVX3CNl8Ln@^c_UDNZ>wP`TIqaph$j>7q^oHnR^JO_42qzVkS5>z?0)9Jw|u@gP8
zl;Aw)y)kd0IE01pCduMn=HlI`p+)2K^I-GLMe)#LA2GJJY|YAX`0G|?<+ajQjl;!T
z=d2!n3!Z1@NFC;nF2$<;-9{SqQ}`5k&4eVq*qk10bFqmgD|)58^~n8|o7H++4N?X<
zJ)Iy#G+oezlo@!kp7p;h4^l47Vn;(0@}6{Jgtq3G&sEi#)mzT-u!Nd4GGVwcW)dWm
ztWKY99p;M;A&6|{QytrtMV`$uO1#ZviIs)sEosRad}9$lm`8=r6~kfGg0hO}4bySG
zOb;V324yt`u+m3nA?<<Oo9y%aErLD9v|Cw>8e`s&@1=<XNu|u%#f#z}rW5WSJAmbT
zy&!~bkoCnHSl$DN(}WtTMrQ+i&LgMCy0@#%_1DI&LX-rIL(U562k@N{@4dH$@sr)o
zWcThKz5SKG5Ec*SJPZ~cvd1b@PEA>cNY+jwu&Q<5X&O-Pg0HSYY7rmP&h_7`r?i4j
zTr5&F<P)G_&_of*d7DPQQS`@5S@mfP7X3L2|GV8{k<7NXV0kn*Y^nDItzbGF#;;{A
zN)(OFO8;{w2b%X<iCI^XGI@=!Fm6*w!XtSs_YO<>-)&~qP6{K{UMpST+f_%E>TH9t
z9szqxCo%7NuAhxWcGWt9DpZKZ8FD~qS8D5nMl`XTA5b~y1H5}KJs0B<0+me##5c$4
zM7?`lHO^UqUuMWG-lbFZ_43rCN!|A*<m<JUji2JQpSl=DZ{0gLKMP-Z({AXyz?HRq
z>Ih+U*VAzk5g&q4%c`C;Y<(1#R%frltH&t_^M-=hJvAH+O^Np2O~q<K-+0Ft#@}75
z`!snu?K;~camY2HQTo2T{{h(H7KS&KeDzvKg?*BnH#lCBUC{=?67P=^_vy!Lr5Ewq
zs-b1l3y7-hH<Vt7QrVQPu8Z|^r@3ZgI#z$b(a+8tuxCfhnBGw-dUE8bo)ZJh@lQNm
zQDJrHDD(0flu7$ta`G^Z;Rk0NU+wLyR-|U`R%#oMStWO^^?-(+|IiAP9zmVcuC<Kq
zlW$4&58Rr>Q(JCHJ9AaLYU>M`t!6?_S9HOKHbziMk;&3;{Yk}vr(4k<^~Ax?^V7ZH
zdwfq{FZVWDh@?x$6JY(krOHLezN%(!ZzKFU^jv{{l|-t}9<E22;~QJXp_I6lXExGl
z!B20naKt<@q0HGaU3tZa$D%N*>m>BYW_QHwo_~}c>uvu7zcb@!0~UB@^Vq?G^(j3{
zMcgI9>tm&yTJr23{g)u9bG{2Txvi=7e0VT0=Xc4on=wN{aj#^rblgsjehm-nTIWyc
zc@{<@DmJ7f4<yObf{CP}7pg_<cJf6Zm6KvMwg8Doz%1xB|L<_pPmW5%5}5thW>Mzx
zl}ntN19qG(S$)H5v5#+>69jvpb7GH`Me8~3EYUG7hDrrJh5X@tQFGVvQlcCfxbF%D
z!Tj@j_tEV3r@Eur6JTgO;;>p!Z&-l?ayXV2w_Blld+0|)q6YNNsbYByEM1ML(t8VP
zKaC!`$aVAMA{Q&h68)jYGfF<!i!E%rr)Chh#&_c^r#+wt`gSg9`3-V8KI8-%eCgy%
zM_J+J?VcKp8}p{7$<MQ`RI42Oqa!!?(fr=+-^SmL3?qQYYY~R|bI85Y4UDG_KG{*$
zK@(ce#S%sHvwLsMlFyr>frPBUKn3wdlQESjmJ|y-pFduJgctJ16YcrJO7U<=LdqVi
z5*i}mpCCs{kSJjJ6BXa_8>cS8`MH7jJdOc@;8E{~ZIgj9>bxeu)fFH_6oi<<kH7oV
zwHQaVsv=tV6Kz+BXGp|;ADCSQQPZ4--bHHbiWW{l+e9b2L6W@WlkBD=mGq?d^Nn$2
zW*Z4E9YLPJX_!#~Z`}5EkQ6bBlq_UPoKHf1#wy48C*iBO{Vnx2$;{_VIoIa6_Q}k1
zrA*c#2!1mrp9Zey4Q$yBjL%D951>pAxNCpMlK3uzb6UBQNTgJGHXk)+B?%TY9F6qX
zGo_#^MXOOhW;dZ_T7XxM)X|^jyp+(|4?9n0P?`fF0jZ+f4A94%3!V(Y4Q!%h5`w<s
z3$9TBLqCqarxaFJ1shsPACph-^-o_wu+b~gpOYD$lbJnxncrF7(Vk};W=P+$6p+CI
z`^M4^sxq3r*#+$xc2{5_t#?GXFK3fU4yCZMe&)UvE(CyUfeiFS5I(OY{UtL)R=LJj
zxEQKoN1k_2H8Q#_b4fLDuvNo219(D1Q~(3n7(7TYg!M>1N0UY22@a??maRz1nyG^6
z&#|OcWhR%xq{cY^mU8+47$!iee5*O8F$mFBF7Y;)u3DOE16weHmMi6!OP9;+?78$=
z@{m8X{Y-N%2jqEpGYe*dy;fPwp!ci?VE=^LIgluT%T+&j6Tz9)PZw(QPf6rQ1myo6
zqhB)IgRlNasBPdtjB!O*-_zx0`^1-b&yA-F2eb&uD;g+NgMkEbtX>LSs$>Q!0GH7!
z*A$LH6v3i|;K&TP|Cr2B5##WS43uq1tr@sq&yrdZa6dVK0j<EL31FxV$Z|U<(nT>B
z`W6ne@ND3K(qn}aRwV*x(l;rt<2SIAxqJ<YWK~LuN>+)w`U5nI)2<XZQvE>bXZC%!
zk{>J&C$jQf8XlOySUDXZ{{F~5o|5r%^&u@rSbm(wey}PPYf-u$z*NXm%J#PO`p?4M
zm{P4C4rfmsw{YHA3efjssmR;1vknk>3Mc<*smrpD^4k6ndv_iV)&D<m|IC;%m@zZP
zo^6y;wuWq3$C9Pc*h*O%OA^tLN>UBVUXd0_8j=(;_9bb?ShIvw_H4=0VoNG<4_ZIf
z=hJuj{qFm^?%#Etf6sNDKi}t^*X#MXCP82mxt%OM%B36*V%eFzHW@`gljR?rJ3_{+
zc#y3A;QB!HMatgm8~THF;$u}KK=SBV&D$xQ?ucvbDf$sBec5iv7GG;V0x>R0*|GC#
z6$!F-BH1!xWj<RfP>VEhzj2Dh@uzO;=Co5EZk{5rx#GbN97)dpD<_82T->4SM{fM7
zo0`RuzSbPP4V@elu~KSpx=RE{Yy``)n@X3;D2u=-5*OXn+S?h5WDH|8;~_^TV`oO)
z=FHlTjOK{Uc8-ikJ2SieGdno$JbaMZy)*OKiaRehX9(c$47%SL9=)SV1qo0=IO?4T
zx4~;CKyOCxOsHkOjn8-&0ea7IXOT_?t`|qFw10nr?MnLEKEw!+%_W`9t)6|GbX7YL
z!;_vZbTs>1Fh~fVgXzpxiOClC$XVr~B`{81b2ppsV`MNL$-WsZU6+F%%Te7SATM-P
z(Kc75j(S(&vbIP1jB2iuZFa+l6{|h+xFd5UK4x#J%UfT^kA&xA#ujo;>Evm6<Y{%T
zP_xa`jLZw|%ijslv6Id#&Pmvk4IOD0pCUQzIV$1|&v)H|6Ckl#!?Ww9@{4El{H`EP
zw{Y)>EcC78_qm(5xY{X{6ShSl!nVK>UYO;RxDU<~hPPCT$1c;U2!Z0FzM@EY@g4IU
zhvE7DN2zMgg~!tiouqSJq)SvrO4RS>UmshMbTlsqE>z@^U+}T`w9hqTdBp6xm0@I_
z`$C0TbvaQ-1#aBUOZ&K@@n{LSBmV)sfO*?4p}VTmLZw%b^;e3XY{~A8EcJ1s=+fEt
z527;qr9MQ%GqK*?;)e4$R2~{`c1kMLvTUPt*@`V?A>s@7*1+#kxo9%#w8vZSuK9TX
zXx}~MvAcIW?<1q`bqmp-eWZP?ljPo+q@}~!hetjrmyzm2J|%H#Du~YEAoF<SQ>LCe
zez+<~MnJfXU89U&_}*H_66{eLB#NPQm%)~CZ{CA(+Ln%~zgN;%1lM5bWK<};l#p1#
z6HJ9JxXQ`U+14wG67a0ax^S0hQh(3}Gej<PzX0fB2z_K|l$MBJslp@f@@de~CJZjy
zsx75C2Tdy2qpF?kR&CgfELh6}timNx5gj{3T?;UuoN5C0@f&MYWSi5tI;-3h7(D8=
zUUm#`VWBe_wRhzUjwV!ZfIo<mNpYaD4d!wSJz9_#WN?~A8?m==Fagy;f-zsPe2PYu
z|6ENDSM4Q}+7)AUOmy{b!o9;L^;Z%o4*nHgNx2WA>Mr@9@_Hef<YK%xvc8yqkX&if
z%#k)%e|oOu`o1cU1SEZ~4&%{SF4Kq*Zmc$;zm}=KI@jRlgLH3VIdPLY?}z+Y|L{}S
zLt8YgQ{$mXOZ_;aRx_dTg<WH7r^vN^O&ea;vtx1>!m!+$O;;=svk5$rOg)v>yuJ_a
zf^Au4+9ILZV2hVm@<vKuZMjw7(i70E-CSR1Cu%)<<JOo+<CUf?^QOs{wY4UXo|~s*
zL>^ULVCt!uFxpX5x=fn}H?sqJ5c_zZw!mg#4^z`cy7WTUm>`3DAr5F%CHAp3z`m)0
zhfhRY`Sha!$43ZL(GB*^+wje<rcVdGTc5?2n`Bc}lFVhYp?TC6FEF&2gt8^`xT87d
zdXcPc9J}qG8q2rt{d5DB`~)NW6oqL&o7o;9&(5r>_K{#l#}@Teqa{7{H~=wf;0(sG
zd$&Bz;_8(0E}Ir&l;K>>qTzDQZC6fHKNdgP|EiPW87glLJs1tIBtYwM?6$c5W;C`Q
zUesVTgn{OmRPD@+>9z&f%f=0yWQ`hM!8LL0h_=p((>)`ZJ?~+V*92H$69>QZ%6LO$
z62;yylifBNp4Y_k?&3msXf~5i<)EE|7X~Cs(K&4aNont%u~)q)WS>H8`F_4<dymRI
zBEUjYQF=|X-qCQe#I*~a0-eWHU(hrI@-R$2)j1WzDcZLlIUs+09k&^B;+VXY2ILc!
z{dhF$a1+Y}+R#fEX|l3E;@s1`%=^Yzfd@+aT?*I{uiLJ?YBuG%j~XTydq2m;Jl6s}
z(n~_gcy_3Bp=4eaXVaT4wFKUcw`kB&GMqIEqAL|epD_VdV*s+o2idTP<8TAB8w+tk
z_iF;(eLjQpRA~4+gF>dEN`*2{);lv;C!hBp%xpcS#lsA-+TRiCqKq8%hF7R_AD&)e
zCOax`KC0BWpeh5}xRuMnf{CaSAK&Oll@XxUl(M>BR<mCD8GBglO`*fxm<whC(Nw5~
zJ)(W}W9LJtfbFot7*s4_tgg4`AfC06^TlQ#)ZB~WIVzp%jlwsP(h^W)JHzb^6emB2
z`JMJnqC7|KMZIyH*%KqmNvLi!flm#Xw{qMcytrHPF;|g1b@<B!5u~){{y=k{32NU{
z8VWRQc^C9@z<I<U#D1^{vGy3!=rmgx1ts(bl}doU$DwxUA)g$7HF_B((akL`+j6kz
z^{JkYELkJ<Mz%Q$3J7Csa4^1<qFP59RX=Mi<;@v|?cM6Vo*D5yv9El-Ny_lr^i5ON
z!rld>cR&0v8lI{PPio>|Q1@)@g9qbTk>!g~-xK_(D+E{+v-e9foG8QWI?Gl@L;2-R
z>~6fUalg#Np2taqH?NueF?Ggs{dD3n&iE#deGl2Zw2e->7=@)6MM)U?LX5~V#>u+K
zJRIj?bd|dJ_`;bt=|R_+N#WxQL$x=W4>q@76X}@8b=;6GXCko8&pW7^6Nk(vq_YwG
zZJ|aYs2U4PeaA`3^>eG$I$J%v8<>nL!2Yy}<vsA&ws(<H-TWM8a-*%TiA7rH)06uM
z<0g(m0J_z?yN`<Cv4k4Qqx2}KfnD?O(J*5w)V*m{F%^1QjH9pDPZJHZCM<j~Ztep5
zBDq$cI6i9ES>CWq#9%OFWa@Ck*0m>iB|W*q*6unhTi8#?5U?0Dim}DYrd!B}8txP+
zzBQ6$&_E62mM&PKz{a*xQc0)h?i%@8jpGiZ%)jVS7cYq`JOr8AO!P$C7KU`$Dxa*!
zNj^0?zPdQWtmdeu+xz&Tv*zhnqUJa^pYs?rryhLO@yZ;w`GQ(;g!PU?&AT)tqwa8q
z8_LyE3GOM#Vxb*5Mn?Oj<%0X`_=|6e2X?JeNioxi87wgQ&P}zQ+1HWp`K;=y?K`iY
zd-Owh()MnV+o?INGijM^SeDZ_*Ze?bomr*$)ZD}vmxbEfBQ9+ViNQgg+s_f6e0r}Y
z^5E6%r1(HerqPg@oRLep^@Pfxoyd#)Z1ww4u4Ddf68tJ_byFhju(#LpM9)u2(oXY4
zRLVZ)Ne{cIzRl;(h3q+bGYQ!K6(<wMu~U00qLG$vmlNl_odr)6i91Uu@c6%GsJVGh
zB%X?JG?mHmCpBFvbgLyrM^t^Jt}O9qDZi@bwfDva_2_9yb|2mMxNyIdtK{^11Ey}~
zMBDjB3mqoZKfFpG6(~=SFj<vrrv9d4!&c3AgSlI^7a-Gj<hjCE@#{^Q>)kmW=ltlJ
zv5e4Y$xE3a-$e16%kmmsMa3*^t3Cw=Nt^6>IsHi0B_oZ)0P%Kp!a}xx|HFc&75Xls
zxrhq~1Qhc2p;LBPwz{<d+pn-{pNJ4&l_(+QR8jt1A98E6PnE9urW1|E;2NF_(~`FY
znI{KBQyCYRbGuWe!%`ogJTFxd!Q2>6w$+WVX7}XRy`WMvioLm6AurP@UahSKCa=rc
zu$pP4PB+xoxg*xGhfN-lFM2dos!BMmGF0SzR-1LBOUxdj197sm6QK#mSszHA5gl@z
zZH`!3X?AyWEoHUnTE+a#``fT(P`2v13Bi7yHVXl+Ad5qf#cV!aHx<J+7N^33ZsQcL
z9dPx<NbufB?HE1XW3QHfT<-0QGuzIu?qHv#kj(mcu6yq8nDf8D!Ld+xrd#)#sXxWI
z{rH^YcvVDsV1MG#Uai8F+O5{7yH9nS3UVBq4h#}LHrS(U7I3Vy@R`&bqa$I*l_yqR
zQ}++6b~$hDP}JNbJhMkIOuA$h-w7x2t9j1*Zys>z3zaPM8#rs&Gn>QV{DfVyrbbd&
zGK2zs9VdOEmA$~F(I?R<#3-59*)tdtAq%7r@AItF7PIy`mj><%s3Dh!>%@l~Z0%Un
z=Y|O~$pG_2>xW3~qr<&6H=`49s`H-o6D%u*Jc2Gl6uO*OH+I@ep94<$ttJJwByS7m
zX*+8>O*=_`1QYbfg<aoR%WjP471Xzk(Lp$})m{z}5{4DG8hNdfT=0E_J(McpHBEy%
z7?~L*revK8do6kw3_eF=fmr$(%Qgo048}dB-jf|TsmTt5#`X#;N$7AojN6T$D>P6p
zXg<CFq_Z%+9CiLw%9)&Sn7)s^V%MzOrh!-v<9bW3;+R{}E?mai$aUue6mziHa8vEM
zv<&r*=Ce6F2FnGeFVr==3c3^Q)<`Ry)fr+rG*4{QG|Rtv6d@;ZC4)`m9VDEv_Rcx+
zkx+HJ5!B&XFGoU*Gw#$z6DPh$aTV!7E4q3ipGFLb*5r6$Q!AK4H0WZkqpf_Fxv7H9
zTBWGo)E8%N#b2|YvP=_)sl=*&byM$SP>>l`#cGY}1?>I<#z+3oO|A6wI(XN%XXZ)a
zeW(}dl)7C%-_xS%O<q11?%EA0KP`TE%FFkLy8Y<3rzKA-y$<EywSRr+>D_10{eG3|
z4wDz3mcH1u-~aJlhna$>_uib^AMjj#*M}!h%idM)KmPXauKAg#_ZOffGE{>I=5M3H
z3`jw|r9@VhHaaSVbaJ(ZBggi(a{ek(h*GH|@^BkNjMY1AlZF%KQd@<jfp>&;sS{se
zTjlx?@2K4x&MTg_RjE{YpE+3SEc&jkTAS4;`jmzXQx2;!H1Iihq10uKN_*|r5TElm
zG<HjEZ-218%I9MK|GBAM{ruH_RZ3;vXAXCLb5phc$xVIN^+Frw-*igLH<`bC*wE0w
z<wBWns!I3B)<QQt@c#=^)ozJYUG`MZg$FN_s{e+k>V3%}<WgbhrM(kzc3(-=gYhoE
zCsjSZlBy??e3Fx|PbPaTld7jue@&`J-VXkeRE_)_QuT7~#jmRB^SoFlshUu5<p)xA
z$x}@#xn5s#=S4}v%-z_OQs#9f``)9QW$9l@)wKI@Oj7kPp6VS&9#c}StgQSIQ!V{_
zO!eMBVXAelopr4PEv=nntrgR)_ujXbR6lN?c*3Z8T2|NA^Q!H^RC{%O2cxm0|3gP*
zbJz2(u4j{7^)21CAA0H@KYKa-tocb_<J-R0j)AF;!AH*q-~1n``ae&qKL4Inb@_=@
z-SNLis>b|Gs_Og$sY+1oJI`avBvrW=NmcGeQZ;sq<mh>chd0)F=5l-{RgZE1K&lr1
znp6ehR%ZT=RMj<?GI+GDj!CL!V9X_9AN1}NXBQm(LaGk^OsW<GY?T5Qza~|K<<az?
zN!6=Sj<6JPAIl=CD%2oO`-xQbmF)XWsw&FRenG14_=!{{d?r<W7fDsC??_dv&!lSA
zBB@&SBdMDH7gE(_kyIV}fmAJCBvr2pW4@BAUW=q^$rn;JbeU9r$n!U(YJdG_QuWXx
zsjB-QkgA5iAXTY<AywaU{*qK}{U=g&_cEy(wCN8>Rbtd4srvXYr0V$TzmlrB&!j5l
zds3D99jOZWfmDt9j#LGHAXP)I6Pg!E)p5?Rq$;pPs_v-yds3C_E2&CjlB)HKq-ujZ
zlT=No{FPL7ULsX>{(w}?{##Pj;$I|H%h&yuRHfD|ld4MpM5+cXld7q|Csm*Sl2ldv
z2U6AMk4RO|e;`$N{J%%4DzWyJGfCA`e<4-(|8J41;LoHg=3gOI@4K=6Tcj%Sdr}qq
z-y>B+_y3wyef|TfdX-74=KPja75p8kO85^+)%{DPYVseGst>*+RrUV|NL2zF`Ror!
zRRRG*z(I?DL#k5$kW>Y}BUM4rZ=`C|ACRiFB~q34-yl_Kzb93%{voLv4gc8m1F8BL
z_ivG^!1tso^*<w3f&YM14g4*sTC+r|HvB!QO8rKv68=L{HS71JYSj{{+VE$jYQw)s
zs@5<`)p3qrld2@>??}}w5>$kgXvvW{Pr4x<eIv6CwH62VyS_=30Y0Jv4y|InL<F}7
zf%kE&{)E58sY@~24Q>Xsg>!w1d*w+|H|No7&k<#~;^n4UlzA7POH2dc+BIq3QtV|x
z(jx9?u?L`xl`>k<@Efr%pvx>usmbRYffNd->}?bZ%M#d>JU<R_q9Hsu*qd>-^(Ao_
z0Ki~D&k5;;qo~^tZr|Aq;z6@vno?M}*v=M%QN1W}5)=#qJ~V+iC;$czYU}_+uq+(C
z8BL?8md%+@A~G}M;JnjdTEBd`tK3JtycT|4F<x#xS*CbgQou>R#Yp)SSi3z)Txsae
zc`#g7_flNEoH-1;_L58O6Wyy#cl0Hqgo(F`wo$=-GFd)sCv=VH0fa>m_@(ac=<LkR
z<5yF#fEy0RNr^*IAoFN8E2+<(Doz@`df{l!I@`~l>N9tsW;~<$J5N>TV`j_Wc&g@0
zo+?{TWYVIiy7nm4ec4kr&sErxD}SZHBOPKihRR*?RI@&?>87JhZSxu<SRI+3>Ud$`
z$Gk;P)p*HMZTjM=wio!Qqsdo_=W)dszIduNQs`A<sG2XHs%a!EvkbHBsb-9o7_cvS
zs>4N0Pjzs~Q>FSR#w~lQf|-ixrC|Be$}toM3-Hl$p%X|h3IGN&v#<aw1#)ho6W}5O
zp&kG$Eq%V}-ZP=Hfh&n+AIm-jo);3o?^uG~bgS542m0N|jQ5c#pVZOs;P=7%PKx7;
zSORF)^4KbU3lN6$e3<l_>2=_h#;*raB6+&yf>`UfE8dLXXPcv&CDDeOLZ9~|-Z~?X
zL9mS^x-bA6>NOjp9tCpPhKN{f00Rfc4pAB3NYzqCBuPswl3`SeRnw?2VUnt)jKLhb
zu}0;miHdCjm0Ac`w0@;shFEBC`A{$1=_Opfl(Umux$PywIiN~CqjJlWN>Zt)+P?i8
z3DxQdD1lt1DZ{R-!Fo^w98k|75w>~T)eOj23->Zy7c#0fG89beSpvHluX<T5_SIZ`
zDH2xC=q6XkQ5oGhXc-kkplsejfp5XFrj#<SV%fWU;Vpyk$3)~+0IGpw)kM^4mmYoX
zihfN(mer#$=0P8N>FnO9vH;{eQtbno6_@K7!%lTWR0F12u@T3*CcvEkIbu~))eZuO
z_7RpyG=WUzP^@PZ%`uMoD(u9w9wfkCpt;^Rv9QwFqI%Jcrba6?dtK?nM4iSV;(jd+
z)}~T}bRzN)09|9(MCxVfsBchzS)*RM@@ha`Oc$dl9K92V<l%bAnuMYuxH2dY=QLX4
zvl&1)1ALF+k;i~_H?4|l!crL{(@oh687-vV)!oEKUQc9t6Y|j|w4f~d2@VlV<h)Gd
z0Mp^YWHtsCT}XfhM<XU)BE!gR@0(E5GMr#KDhmHNjCg(y;5ZzOfN-@)9D8!Hxn3io
zr8%L7^>kAw0=|mO-c3=6>(y1?2Zq{nHsh<hap0?zN17QjpMsiKyh3H*Ai)46tO+tt
zX0t~ln3Dzb<Lp*M&RQH|A_JO_hF$ALJ?VvAdxg5v-G1#A>>!bICykTE@rm1~j+mq;
z>Mv#1G;vPnG05a5vJ;p%x5qLX>M7&3qZdvH0&m1OYjo)xJ%ZLb-4={PZtX?skx-hw
z$S~7(Qz9n|*Talg9B&uw+OIcs&-ZqJXkv*c!M$)DVX`gM?w+W?nzI;A(~O3V-Hgds
zjBe7iAu8wFhNsQZEP)wah~};g8pi+u*5b)|<`pUy->ygN0Mnc232^4T;Wc#6q()yD
z4yB2O7n0x|vgkXndL+&WsM&Fv^-E0MYlzY)Unkl&)GJ@-*|yTFmrbi%6OF2EVtL!u
zSet;tnDz0U=>v-oTG8MspBh&-_N?w14DMs8K3(;pyT6tbhSup-mg_#-&Ei7iU^|X-
z$3aYKY|rfnc^%rFdQiLX^vwg^R^yPIrVf+WgTC|pUZuKgGIYl9<<fTAW4&f$SO%&9
z2`&eZkzNQdjEAu#L0d?u+5q%>BKrM!Gtb2ET<`ET+>3){BmR!Yxtqda<utCGU?51E
zx4wMHVp#Dc9n}YO86OQjhAAB%wQn3L_;*QFa@r=N?Q)dYD5JRHl*D)(AC@n`IK<mn
z#)KX`X#~pQ=+k<QLAaizzvfQZn+|&;t@vi2{%Dt%h+5QeWb_L=rE+k~i|(Luumxk(
zL12RnRxU$VhKPjhAFm4<2PKcAv<0}tu-w{f`PO5h>#@}hFZhMWA7@us$yLl8f8*6X
zDYx)!B8WbzfT~!ZHQD4irSgoiao3dmvnj2)DKdRZccDo!YpM~n+E9DiSWLj+#I*hb
zzxn!U%dF|T=4q`2mQ$Yw&F{P=biEA(Jtsb7*qwdbJW;v(J|jGPMk7kV>*0*s{VAPi
z(*$bWNf7Ii(wW2i1^nO49MgW+X#Q5^#M|RKv!@oOt#-XL-9H<&RXFU~<e7*3G3(z)
zoS2PT|CX7TioW(<Q~Ui<^Y>QB4@bm5$eMjfcq5cfW=|(HnO=Jln#5=XW~iu%aE*^U
zcYS207-WN*G*M6)D(b9{Kss)neE3I&HwfDLxeZ8xN>pswiKz!-bBy~RAAo|>VO6qn
zjEIHT{OSU+3MXE4KjeRQ|DBcG{FD0vD$cqGTIOGCOCE`uvymBov+FadI-B*$-(=y#
zPo!#+p6ZZ<S&B__a`7gVlGk8OAXEU?Ja<~+pGZ{|)Io`zzK%#FA;I3o9m%mq%;3f%
zsd}5nBvmuq{k?g=Csk#?kg7pHkg8b?ZsuP})zz-k0?oJq;RvQ2z$8_l*Ag^zbuupN
zxzr~yNmY@Z8{mzhn!$42CAV@nksvwI3-6xJd?i)u)Arh<PMkik*Oyv#KxTChlT@v2
zbUEtM<4bfOZqN6)q;*&A(OBmdb-f4u?~Z&XRo@W!`ma?h!whd#ZZg|}z4Ywag4?93
z?MdzMZQ*PY&*v>kIuF1VVfX_GUnw0{kp5=5cM7e`q^j}}NDx)GKH+kMd{o-UGx~hC
zc{LR&aR-L-c<u9IHVM4hu*YE33*pIoR{sOZXpvN{SsAL^Y*<&raOY)$06q`qiRv-g
z^t9GVZD}EfPpvHPBZQtro#GUeRLz4UkdyG(oJ})zZueEjc+OT^D>yZnX;nXxdHC>y
zmCPz!tKu|aiBy%~Q;oJDq{bcKw%BYh{jz!Uh8r&}Odl&Wmu}MIJ!oa|h&#>F%5srZ
z9pg!}vT<gTswHNgZ@1YoN!6##4maLzCkFE>ueLp6ZOzM1GOuTM-FTUe-}NdbRncf4
zr5^42jG3+Uw0(6Qbs&LU(Pn*2WX8_-5of-Q&jwioFd$4&&SsZjqwNgG#xRd2R<{t5
zUh6iClReku>VTo5lzQkX`vde{3}DTjAVj@42!JNI6<Qv6{C3tkI^5;3vkoJi66n3o
z8F&`1I#Q?*u|B>)A%x$nC~rT&R+JtWI#zs{2LLX)Y*t6UcT0(#_jE~q#iIj+tqal*
zUr-rRsz$H=z!sW(LE2}ddw4vksCQ2`Ehsj#VPr?L6GC2M_W@F1XF|bhj+-b+*Q7Mp
z0#4&AUV3r2cks&8D2K+YB#;gz@1UZu3q*V%^uG-E=_$UI-!QV<`+%zXMeci?bSKvX
zuNynZRIq7&$#4#8$zJu-+x!o8cvMI3Z7Zzb5gJi&3jo*<K<^dO@m;{I>zdK{<g9fV
zmI1##^B^)*7yx<^NG8aFu*1P3Ss+HlWG#UF5zMZ*9ZzNf3v~2fu?FFt!xh5t<1jf^
z8gOExIq-qU$i<%(4S+%pfqLbMetddFNYUZq@KW)konwiW!nhc=Fq$yeIDP>FV979^
z4E`~XXH8fg+JHTIWh)w}^Le+Xz1=KiLrRh<>0S9cK`@XITf+{CRybjbvP(ddSy$(j
zUc6_rG8dq+E5d*t9Wc;y-B$i~B^ky{Y)x;dMpdbB!P0PEYMm68G_Eu3c;d={*cvDw
zHQ&{4E2(wL4qlfgBLvXUCet+KczF;s;5t9yd`*1<DI4MD?PZY*;>%By=eHxQ6zswR
zQp8PD7bc?irgVa&2-Nz^&R||zQo1TZ&nng8f=sdFy8Y*??;A^iMAK>@D{wI!GWa8M
zFB32fC|Op`@#qj51d_u%kUMV9g#EU0_zG6TaqvKo(jDuWq&iYW0DJLhXOjLXuc4F$
z3$Tu$t8!xF9Vi+L^-mWTw5`&7ZEo(F9&02apGId>r4ajHvMAnQCm+}>ab6BhmS*rU
ztk+m2<$K)Fu~pP$7`sI9vJdF97Hr9Sui(btI}FV@7-+i_a@irJM!9uwi&&gq1ZLQc
zwaomX`|Z=9J{z)zY<U&#!JBwYdrxJ{noXW>`}YDhK)Z|~mrF7JmR)^<=4vn~U`4Z!
zwC9M52Bn@5fxnF0jnU=*U`_SUNV3a}t^*r#v8BbV<i!E3tM?)$Hm4lH(7^!KkV^z0
zU*#zV)=BGH1oF~Y!EsNNf#{YiRaOy#0DgUZxyr)(5gOG%I0ZiH|72v7r_dwIa{WQK
zxH5|hR*q<+_sLRRb%K1^+*~@g)|*=+^zl(HZ)3JI{B65h+%xj*30%?^jV^ut@%!VP
z)~6QkWKAIQ9e%Z2%+;LgDnS9?8$N|mQ;!52k+~~}St|As$<JTsMfM)d&?kWaK%iMz
z5C=#UOt8K!A%k-Lx*-6rGqQ%CKOu|;K3DA^Uk?t<rG$X;I$^9`57ElA!s4qZ$y<H;
zkMY0v@;ebO3r>6@Y`8n?XrITK$q^s`LVI&$dz~$RyK<ql>qPRQNT&spH$Lt9`@sbl
z4W}b|_jBaAV4Ck*nkfSJP!ur<QL+QbcOhM1F1bfP^{LB~k$fLE2n{rR>ppbz$)Y`1
zR{>xGC`@VKFt8S1h@H^xT?faQu;L+zr!Wvjg>1S*!T+E!=W#9oe*Qe!s&<xB%C^{-
zjfaeRGQ-Ih$5o|l;T<XR$!)_uzvjsa<}x>}YxSBeCJ~tCLQ2{j!833WGXibn(K~(b
zQ04K^y#_ZMnxm|)6qa5|RI-roK5t<O;qTnXaa+12(sRZU3<-OiBG~F?Bx&0&axO1B
zf9kYR{D$qfaTV+e?{(n-864?56BK=KA1SocN_e>7v?|EmuAKr1#^GKf<VSsuemviw
zdiY-ZqnCa!Y@dCcd06=B(|+;`=(B~nHGXu?p7bLyyFU1fIvPqeUPXosf>UnjYtYEy
zdQIABnjcH=={V&2nu~?0=@tAGhX*NVfOVg$P-}W=x&68jt~eUI|3rvb{R+4?DSsn2
znhcNo&=)?T!Z>|=I$kwk_##~wgakC~L@B_v-O*s?i|F`@HK02;YFHq&O$#zKKx`op
zl&A%&v%>@ZkNEC$v<>XgxC(e54}KdJ7Fqn%e`R~;HNQ(|;*wX{j|cAxZ&`2<R83cU
zaC}d6Tcl?U3+dR(gSOFa+IMyXl&cCW(<Yk`eZJO;40MOnOGrdBTqdpDe-|PiG_4gw
zDk1~W-kCmnEUEm3!@KqJ3#Ig1eFjh*9@0tbtwqGR?dD~$Al(3nRN`y|HhO}uJp{%_
zAw#X|+0iszRvsX*@@+Dhg8;lSItH3NAO`Qc6vl=H<f~WlrXb0*8{S+;>;|=G_CoJh
ziUTSlWWe)%Agd9X-A}V52-s5s$Pj>?$*gZI$#CKwv0l{-OFnBrf)%~Kzoj%F5STm)
zoQ`F)#sTx;*tJ*KKE`hdrzVOigf4h%TH^(vB!HS52oQlz^(b1WrkF-akF=^^vuLg~
zZdx}BFv{ZU5bJB!L30C@9;<FUb3haTC>DEQ99Z9ZO{z1*Y4%zsH~D<|DF{G@*od(g
z#cezQEP#zJ&(`tx$<sduk@MkXHLFt`aq1v}_)?2>&#+P_bRd8uEBKaQ(N*XZCuir1
zZnPuseJ=uLyOu4j10s-%h2oJ3VPNiSZ*LVbRZah7A+SF=%^M7|DZK2+__#9p6CDa=
zBX5uZ?#Hu1DfdLIB1PwP>=8v+i6Uv9V9sF3Dv7jp7&4ri#ZF;0!vT^fwaVhlBW(bA
znXBH-<?E6|(qplncUOR$R)54?-{Hr?jQ`szhN>u51L(m0Y0_sOFu=_GY8<U4iILRK
z%8gjLrTo-U#ZcBZ#@q*r)Oi3@B*5AhLh9w`_hZR8z*jeg<&?VlQ9jh<BqRH}&_dFc
zFyDR!*+@O+DwIq@2}{u$7*0p}BW0$;aCZh<l@r~zG|aARQ(Q`+!(bttss|;3+}Gls
za+9IhWDcOB(Xpx}sC+osAkuHe#KyqEW?lK9OJb^`xvMAz5v5i_h6hMwp8&>g4WOiC
zeR!BgWEgNFPc<uJlNl)prA8k2rbZMA2=!{{aRaFGOC|n*pS*TmY(-7Fe*F~9GfW5c
zG9oirWr90#I)+Ve*bqzzig6+5=ay%4E3i;?B5SVi*k>H+R~y%5vipkh@sFS_DWb=G
z$qvl088(?6t6w2Qc9nRrCqXNc1ZG7iLWZHTirO$XvWktEj6WGhxV})6u9R*^&Zt)l
zhmb>RrRBkOZ7b@E<aI2qu8)Akp9KJIr2_KI=Su_DYRJgKnRIAXZt`ZZ4|#MtJ>2EW
z%WS>5+hNj!Nj361qPO!_D3VJ{)@P4F-O+*L@(mGG<*gO<5ltqIGEIC_^#LBN4?l`Y
z#?`lIm_D-F;_eo*u(x5YB5Y(Vf&^4Gnq!5EOfN_QER>L9iEHV?H^bdRG+HR7Qf7xN
zj9M&Csd8VJmJl-Ku4B*5LV@{>uw=YKR%C_QtHH*Wbg^WN!s+Jn>;v^)?4h}vw;B;H
zdJ@3gFE^Tl*Vs=P33M^;wN%&oYJ!6x*<*KF=wR-Et1vcTp^b+CRwAg}lZBjCv121M
znd6z2WEB$O(RA%Xarvj_8<LQu9r~1$^4g<t07{7)r-NnZw7?t`(F>Im(m=Qb044$K
zMgRw)rdB^Ig9n&;8SI3muwsGf7LDWVt619Bp>~qz;mtgQ{H!&ATB#XOW2V{PsD;JG
zGt{hmHCR*=w^e{M?gAXD<mi=hXp1De#Z||F&8cK_hIkqWDUh9}=I%y*xdkMCg&b3F
zT*Gx&3`jzx0bHxEaw`DRmG#QUEDu|!smd0*vL#ke1AIYbo!fvJ8yQYMS+jxc%}L%H
zxPg1H1VPXTv2BXL34*1b$aGyZIxjhXYx_b8haL;%Ml18%)Nu9ry#O~4*~6V6Exf%&
z0cIU-kg?@*s{~f=DEY#cMNbv%56ouVw0+zdKM2vY5i4MNs%%V8m7LDF9-;{Z^jS$m
z<ooUJvIx*`KG4Y7+oZ}ZMq+xZM!IY56w1qMB(5}6^Q>ojsz<q+I*)G8<t_9(UFb=G
zn%Qg*x3Mj}8nr(TY8EFbn+NjE6|yE5?&!_iQ(PKB35iq;Ez68@B0yVW5Y{*)Yix1;
zCR&7BNTm{DyP_Uy{E{d6q!#(){Sl}hNsfWGvo^Y-LQEH3WqYaOUaq~p;TGH0gPiDN
z_673xda|4_n%b3f_Tg^ZpS<c`X!o}77U5jYR^O{B+;s4CVV_d>bNgqWJ<*_^{?iU4
z&$)*VI*gg}4_|e7)!ox!(LMI5XGKH=SD(YA?5@oqj2N)%?WWbrmwBd+?V8Q!ZpX&H
z&D_-i!n_RI^{IQ8m`;Q>br+C$6}^{xUY5w>ipKVlJJ^V<S}T~Is>wzodtz^k+xZ1g
zB7#*=*%9>a1`#z+tTXDJZXjZ|@gE_^reG0!Y#jN#{+Lt^>Dx3O#U<w`X>bX09KJ5m
z=?7BvcqII|6Hb)xh|Qv>%BSkQplJ4uR8?8>R8@~VZ)AF^Y0jEGUr5#YfxwypyupAv
zYoM-~%O)nN>N=?7FsSF{VjSX(qddcv4T_l%aXN?r^f^Oy$Fsx4T6Evm9-{d+ghiE$
zwZra&FxHIdC^H9Tf@`3uL6nu;^QyEcTi4wVub*EcJ;(RC1db2x7K)Gw+#N_AG~6(>
za~phs;JWLK>s~qbBW^rQPt_(>h1kQ*sBtBAx>k-4?G@eQb7x4@7>OJQG3QO)+<4fu
z5Z?2yhtKqehwbqxd*OC5G|lftK00j8yvl*p*i>}iL1ZCW^ci^KMNrkAkfG;0UiaFw
z7A=IjMugod44>gR;pKKZaVYXkbd++*j-J7Yg2L$6FMNC4&NuF{oEeVg({N2?dq{RA
z9~}t~8#!OLcbBs3!0eusEyO13i&Im3!vXgMId`10E7E58dgqXV@o1OxsH3v`Er;FM
z_fFj#UifZvkM?punCPB0@4j2zkuaf?&FYb><-uo5w72re^ZGwh^&yG#843A@gjyh>
zQQll)-k9~?+}hqeTfKSzCrH(2ZcC(UH1rFp3Oh$Uxn`MEorNrsss|DUSfz$R60;DG
zrq876R)Ldp%cLrvNvg6elB!utq-qm*kyK6lOsW!@q-r$lmi<el>fuFFb?YLj8XU7o
zss^t4o>bk#BvnCDM&FaFFb_QV3#mF2OZ=Wxorx)$*||un&RhUsq?*ukOj31!_yGWR
zOd#A(AjIV>sk#TsBvpxDNL5EBsT#&4Ri`e5O_^Ysr0U@%QuXi>shahbRAupS14{|8
zJB%M*B2^D=vzflgBvt*u=VniyKe0@z9+DOKMyhTl9r{M90!&hs#RHhWC;;0C3yoPK
zRUL>Yw=R;Zux-p{01@KB#=4CJ^B~R25uwM4Ka#3X7fDr@Ch!+hH8iG(Nvg7Jr%V|U
zzav%ee<oFlza~{@Oqisq82e!&lT<zUnN&4mT_#lte$)Hj9q?#6`Xi|dTP9Tx{gPDO
z@fT86l4Xfh_1(@SRc|s$)hX}Kq$=z;q$+rcRApNtRdsGKN!1t*WXg}Es;RQ_GO0?R
z+dInj?~|%lOj32j5~=F7Osei=lB&W>q-w^wKPFW@6dahOs=klmlbhd@s_y?ls!o_(
zW0I<hay>;%QWfH%OTv61Rg?22mr2!`o4+PiPhdhXNXIOZsuC=Xl6TM${a=!*Pd<~X
zVSGHsOj7mQPo!#-<mF$Gsz&2XQg!Qhr0SkOCRH0%|3gxhMHL18N~*dnk*cky{)SXN
zb}mYLr=t8<QkDJ-Qnh)BRDFuuO7?4(+?p1suVM9>RDGzrOsZn(HQY<2YHye2XHwOQ
z+K=MhiVb3tst9L3-gktrq^ebvi}a7A>TMY&sml75RK;RUYnY^}DOLBBUe2#b)f$Dy
zZ5h+Mv5TZCa*<T!`hiqkWvY8^nN&4hBvn%@C4VASO}{5qugx|yWWOg>TbD>x)DNU;
z=2ucxB668j9k4s|l~mooNUAz~PpY;ken+Z$E4cf9B~^Elmq=ClZ=`DPXHs<^lT_80
zjsBig72g(S@QqY`!M;qYs&4;6s;2(0kgC4dh1&dBvB#3&yMRf-zadq_IktW#RWs1v
zk*X)x>eD&4{Q;?ZQj);+S5mdx&tQpEHDHpeQNJZsZ~Yyq8pR}4iA+-U5tCGvl=A&T
zst#`WLaO3Vt^bZxJr=k`s+xZxRa?0`^K{o`E|RKw-$>N~!89hRn!HG=mUEYceI->(
zekN6C%elXhs`kE%q^jXpQg!^)S5o!yGO3!}FZctgs{f5t&5-<=RDJk`RMlH1RRg~#
zRqel!s$=2GZ1nF*)kMFqq-xnWQnee;BvsSDlB$V|q^j;$QdQ$KsT#;6RmFcIRRtsW
zERm{)i=^t-&!j4WNvirXN!2ie??_eB5~*6X@++x2yhy5AERw2QzmTfJOQh<<Uy`bc
z#2b=}q$+)pR6Y3{QuX@xq-vVmkEE)3*b=E~|AkcTi~K^W`u088^H);U@JCWL#p`=g
zHJKazzG|6Ntyqyk{Uxb7aT4wH8&Y*5>MN<*5C1EvTKkz)75_}C3Yt<EN!13)zmTc{
z$^Aylq^j*AshU)dW0I;iOj32n7gAOA8>!mP{e@IL$s|>Gd?r;{csB<Ag;W(-Bvr3|
zCRGEzk*fGbQng+-{@)>0PyZ>Y%JPj=4gN~1?p*biRPADtsz!fAs-hN2)oTKVOj7l<
zca823q$+8NRQ3Hrs+ug5s`{#JpwFbL%Mz&?ptne>(tajYK{75nKai^9OQfnklT_7L
zKm==1mq}F}W;t+?R4rO2RjIm*q^iI&sjBx2Qq^^dRMlN3RmqE_>d7TiH52@qRQ1*6
za{(=qswaO(suCATRhMN_)oF=T)s>@&^XRX{;XypW5~+$`CRK@_NmUmnsfz!OR0S=O
zs-ZI9ld8T;r0NbPscN=Js@g1(s!WjJI9QuNmqaX+s`}rNs(Sno2Yx~%9~QK>6|`Pr
zkyH&;>IznJTP9Tvmq=BeA4t`cOj1?n8>u?TBvn~tzLKiGOj1=(mBu7h^}i!k0UqD)
zNmYGC{UuTr3sSLJB31VWDg^|sAnPrWsvwLTlT>Yzbz3G?L7z$0!DUj_Ua}Pbg;d2W
z4F=IS{Y0u(FiF*u^2?-Z#uBOOvP`Pdr2ayxX8a+k>iQk2I<!oxf__7)ma8t4s?;x}
zYS9-`)rJM#S}v>c6REo93#lr>Q2m}%MFf8)RV$ZC)u7*ysxJQmsT%NwRPEB0hz9+R
zRMq)Ls)Bw=s&=akej!y?ERm{*{(w~7wnVCe|AthBNK?yI7fIE?Z=~wuucWFwPJ=G{
z3sQAdHi04eJ5sgc3#mH%pOdNtx=j~&J^5!+HCTR;RMnC6{fSgP{)JQpzL2UeKa;BZ
zi=-;;Pe|2$zamv{F!|<Rkg5`YPO36+Za<T%tbaqQf_bL@gj5y#j#RBs{V$WMEWaRC
z_4R&1s=hD(mq=BUFQlr$7gAN^x1_4kccd!occiNIzfP*U)4AQ2NYzcc48j*uRpTqE
z+Aj4osS09}s`&pNscO$8Ri}7<L8@L@|BY0&{Z~j;2KO&WRlT1`Rm(pnRagE%s_HYv
z%HNQx8ed6OkMBs;n=*eTRYjIa)lL6Ist*1msX8S^0ltx{lfNQW#RJ8<mPysOs(&R_
z*?&c<+WknX(xuQ+OQfpgBB{FbKO<Gge?_W_|3Ioj{+Lwd{DD+;`wgkO=l7&4jY+Dq
z@MQdkRMh~X$^Sa3>ZT*2_-CZ53`60+N2-2Q_zy|dlgp&49xwWn0+UqTzD%m>t^NN1
zsmf6JA0buoOQh-vDIAkjJ%Kr|{V$QKp7Kkis_TE5RK;$v{TE2paI1QZB$HH?&$VKb
zs$2diN!7QxUSCPoI*WgiRHb|&Rf+#ds@ngBR89XCshakURFw~x`UR<K+hY7Zsp|Uo
zr0Tw}r0Th*H6ota^xu=JDt||+-ei)hMnS(IRTbG0=d=Gps;c~+RE_rjnN$sy&}dx~
zBe6`XT7D)~UB8j4o=0|6O0+>OFYgo1VUntOza>?Xi=^t2B~mr_GpTC%l~gs(f4)qr
zy0*yXej`<1OD&SBw)=i0RrmU-eI->-GD+2JCaLOT{1d6_x~*W5R9&6_$D}Gl;(Jn+
zCBeJOQG&Z!3lz#ls(<vERNeg}scOAQs=EA0s+ug5ssyOTcckiSCaG#+aI4^wl(qc0
zZJSUBEAUuz;T}%A@A|cP)+Fe*S!dx9xT(mbcVuHswXjKaH6q+b|0!w9iE#7&N@82Z
zus&fU!Om=>k&=kiiklG?#ZKNiH3=HSGPVUi{Q|`d#0G(w?HhSGR}J-Xyo)hJwc!VZ
zM+D+`yM;kqRZpqTwi#+i1c$ruq;U7mT;^1Ci4M;|E+kr^Bh*qyM5D0Ja2fQ|#wN*P
zXIlr?9K5c8s34v_!LwS7<(83UiJ8!Kfm097+Bd%#d}xxO!7csTJJF_M>&4>fcuBbY
z=3QV6%i)p>*YlDPyHz<Z*IEsIAyusuT@`QbF!eCVjjJvlQZC-nu<sCeLZ8c!Vx?e1
z|M?A<pZU7R#bsyfx<reV=wDwGM@Aj#Ip8F<N@wkfbq@r>2Cf>XJ&ZF-xp4vNOL3BN
zW93?L^OWecKKt%HO<KWc^qcU>+>b4)SB?@QoM_1c7ar*?7)N!8Ag*POR7>Dr#2+6I
zR{78b+po|ZteC=cvwYG;`^X0~4y{_FFmcevumx|36Tov8pC3aAcehHJ=P@>s9W_4|
z5va9^7iX$@Th$4#lP#;1Zkai1eOAKyrqAPaM}@I%m5wd4&lQz=n{-h<Z7Za(Nyxj7
zkX3#M&aRp6<s*r3YPj~M9*Ne8JzN239~s@^#FL!<fNE<XeV$E2p&&Eb`l-uammM5V
zGubiEUq)$oSU0(E%K^W7xqCsN;~`E@K}qVB)~Df)R*P-;TusmIhCH2*j~_aJbGBXq
zVjI788Yo5{ZNN?57CJ^duhKG1M|YXq`3;hxJKCz_hmu&O5KgJS6}#38b=o++l($bV
zmpx(8mwmX3TzXw2OSL6^Cn&#A_|568waih-g}1L^_dk5veInES833J){m8ppydJ;H
z{}VsW7#~W09@zudQ`Ke**{?15k{Gis?H;!oE>xZn)PE*~KSKcQlYX~rC?tgcFlm!t
zCOu4tTrNhZvPzE<;Ky<0B4PNGS|75v?>#wGts|-s1q%!lD_Mil94-&16F5}FR|=d(
zoU*R#+^vNPE)<~Q{4{cHoTwLW5}!21-M1XFOen5%pGRD|H{hyzX?vp+YxLFTddm&H
zG5QOA8xk2NFJ2=`>Q1B*DW8IekKf*ilH}uD?@xhBw6ZAI^ESxlVNa_EtgJRALZ$P1
zQ3hB?bSz$9OUgb{mE5u7IFPSxlL_4(yx@=7*$Z8jGZTNj{vf9ESfJV*2xTneba#F@
zRD#GQA)D7Gwv|t0WH3~_-hX35^lF$3^@14Yi1OLC*UoN*vQh?}FFJYlQHwSR1^XNp
z(jF-oEvYp1^13FZF^N>UtG5Llxnfr9Lu%orSDs$`#SFS%dKKQ+b9EbI6YhMYn4R)|
zV*B2>m8Ex@ecftEp|<+q?1Gt4JJYLAy(NMlca4Wi&yJqmTCet8dJjZ<c=YVf=?_XT
zY`nL4m!Ocd14317p(63GQ0n^5h{v;B+971U6E#5`qt3hRw^W~bxYn-Aa9paa@R0-J
zB)FcVs^kg0{@^P=k(WYMC1SN+<8LUMFBd%ae0)M@Ih<ejDJ}mf_1H_fLx&1QdU{6g
zcHNgj-a9e-YGm`>XOA@OjKx%t^W-~`oAjUtUFD&QSzZd88`!pog*;9wKH}ye8sF3@
z%r)RvQs+G%zjK<xo?pKX?gb!D81=K(%7L}i9G{D61|psaz@+=p4x%3j0bMIp`#v7w
z=()Ix7rCd=MX_QwUwvUi)1`Tzv<1O2XOWL5BDD^eoDF;<tufajdB3OO;oK7`wYbg~
zS|1;-e?5Kn{@C>46P|tR>)&qQ^}0mrA|zdOn@O>g^T3?WqNkdN73fN0Pi~yTXTkKd
zo^C$-L<+s+snS>YQ<gl{-pYtb&IL85r%G!}b~Mro<W1`hG08lg#`IKg%+F+Ho>}%(
zbrwBUQuKXaD$Rc!CXZ!1MJ))6Ui4JY;MgyW*Ts#erw*_O5;&?e(f;iEfR|cFE$oFX
z`~X4t5S8P`07nc7u^|%vcub8p4tr<%x@RxY$H9e<Rt^EpgakgR>1B^6qUZYfLMZIa
zJc5ZSpT3@$B5B(04Em!Zmu!>RnxqyhPvyzJEUm3nK05LuQHUtc9~H>ihK&sw6iuUu
zuB|<XGY%NP`S3~8S;e~B^=CGAjBGduP>Aw;N2Cd5BxlkDYxh>ZqvmS+CiH#G`QN(<
z?DgIl#U&7%eRiRo>8UctTE{zbNP@>E_+q$L+=x-TEzg!^-WQfs5#b@63V-A~u${+T
zWU6nw%V}jTG#ipy#79r;3KpBiskrS8vEy1{$ewcs5ScvHI6k-mKO%P69Lqkr5iuEC
z!NteogS|)CD2x&3wh(kCimy}H$Rt&tMhncFlsEPwVz1{lN{O#NCw`T&N`A6VA0uLf
zQ8Sz5owy?ml}7p#pAcD!{aYkYVAcjRN!3Y74?S)v&q;|TOf|k`-8GEV6(39*w(k7o
zsGZOG@iYY!3;BzI5CTT}qtPO!YC)H#E64=a-Y&pwd@w2F(XzVwoOHvabl;>{Uw!(M
zI=+QRUhm5-<T`Vt#}s65qT{;I8)q=}AAA;En0d)`_H!*tVHOIKu?k09lxrxkosGUT
zeS!flN}FSpLTZ#%P2rm#DQ@Lf$|rNAN^_YH2s=y(I}L~uEoY>Lq+nBZijk1k^_vt2
zuaR=|ePdNZot?GVRfBWW4{<MqJyJQFTX6Eg#tnnms|Wbktrcl(@KV&5f7FtH-ZD92
zO63+e#cx8*S<+t1S=~EY{@~s_i5b3Kj+JSzJO*{phlnsIN2T&W=uT%|2bw0@5##<y
z@pT|%44WlD$B*HkR|O*Cv27$bbUX##A6Ps}=2)5J;Wecy=5ZES#oh=MAQc4c&*?32
zZneT&9WpS{$fxRURn)ik-LxTnllJtcH*yAgIp`X?-a{-erAZE!tA9Ap!0^0&1J>|x
zo?+m)AwRdG&*<CDrpMQEe)d%H+)C4rl=PXNs?MUPx^2B;9-hyEJ2kPF?=>C7^i;K&
z-vb;cZ9saN270%0(-a~64MgLsQ)Y$cTb-@SYF-O0@DOab5T<;$zE`XdiZ&{qB2)$v
z;Q0l77ldNHH8&cI%}2bbs7CqYITiP4j?*z#41p>dZ03=enj^b}<K3A)bOaV&Ko<iX
z5qyq{o0Z@%iQ5Y4ND6*i`zjMdJ-DBjXtG?#>}_^%q~f5Wo;==SK`-50g(oMOSCz@Q
z!1nFTdV2{QS&+xO@fNRY@!M6o;}$9-Yqt;rrX7`>sZJjPk;6>3v{liE4gvZwGr8Oj
zSpJIu+Eod5Tb#d~E|v^J``{IaA3MA|z-mB4w$X@z)+V2H;41_9)%FZjCAF^g#3(e1
z#a%GF`q)-)+ZR&xN!^3DF++}(P6tA0pkg<)BO!@v=PDSIE|xdVdXd5{{6uUs2m<Ih
z>9PojJ`wX$-osn4s}N+}yvk;i9-K94+N%#KKxNkr7P5-ntjBQn<aROV+xMANz4+d$
z;0&wyhSS4EX=LZ{)$Mk{EG~})W@4dL6z&E8^@>rB?5Y6tQ<B>zXRl95UY{IUZN`P-
zXEYKInH+g7jII+qM@Q)gi?!l6+`Z^D+PY8W(h{k9cvJJCGmYMCW#^B#Qea>%$HYMP
z{)<XpcuZ>`bY=rQ2jA{uJu>IWC8|u)V>z^YyCc_j?}lLS)rTx&XpW;;t^sjH0Ud6A
zmIIOo2Xrp^FO#a41;%gK54Pur4T0GGDN><Op=6>6(U})dgdiQYCqQ>iXouR#PzN$J
z0x6(MgT&LtS`I@1alhCC&4|NyqSFt!gV;;(@YjJO<gJ_q1<o&8J#x1PEt0Bn2R1zo
zJC_7Y1hzyPp+d<=!k>#SI5H0EIiDQhRcdv-t44S08xSS;iaO0I#wqwV>dcf*i)w*_
zHoWtYZ3|r_RcBS@1&ol98ru#8yckA`KQ)~RM3Qc4+F)S;0Q9($)?^?eCobGRm_M)W
z=#9eAQ#MhHq^iy9Fh9eRvAaFnR9uo^1%78{9q%0SF&!7@(9qFp)gfNMXr?}mT40i@
zm!q2f45<j!N$~({v)C#Sn?F8gzq5d7t7cKi+51&zp@OkYQZ@Zj^ufV)-BkkTtyR`?
z*^h<sD*K6e1PdkNIemvU0vt7^b{vp966?VvRoh+Ecj(3;L(l2(c_s1rt`c1#*r8m@
z=}&S06nJ`9Fvo&$n}&us$Ds8^ZN5wCOj31+?ZF+o<cBM?bY>5=DXZ}&DAi^GV}ovt
zEP-g=t_|S_8JNv}@v8)`ykL^58|4ZQ+jxl!G9lmnEUq!w3%iX=LMX_xS*465<g~b`
zpN`mTN~IRv<^YQrMK$qW$i-KJ*O{bhwkZ>06>X9{xqkr3=^s0*<2gZ6_Pv9QJ1n|+
z-1304NHU-;?SGNscYQyTRQ+&PZKq*^pvn_`yvkltfh5VkS<ELqe%A_>Ve+}X9p^lE
z-n_o^_Sof{C>KnbpQu00*Fz8Ox-+pW$#T_2WmX-|R<e+mqi9eP`-jWQW^K2w`QIMc
zc_+L0Hs|2&g)OT@4zdV!05_|WkO3XaiTo;BbmZ)Z%q=gHU+m20w~ZQ$S6SmIzzPz6
zO+Hes!#zhFn(MnhM#M}yVoY@SM#-pH$1MHebGo)-#o~_vbtSb~YVAN#JS}sVZK7aj
z!T!716M{NM<Lqe^q!(Qz8jI1wiOsnmbLkUZ17e@+<@4_~RkBe$f2H{9QQ>H;fR@g!
zy`4I(yf^Z%#Cu<fD(nS`65#>sm^pSfgK)4Y7F^nQR-zXq0hCs^Wgli?>q@FNkj1Qd
zD&|iKE%3vvd?*$|-n>_?1e!qGpab`!pT6{7v4hT0Dx@^&Xt{S)(NS{dYGFsr(Xw0>
zHh@X0y3;Nd02O+~^AG@lP)a|hVF-4BnqAnKtxEhIWXM_GRxH&<R?JTP?wby=RI5ov
z62_UdnM)jrd&39zSE}F6*b*!h<*%$og-Mmxo;t;F?DE&vs4x_+G_^ZV5C#VCo>c@Y
zb_v&=u&Fu_T;-YYbW&XMMW3)SEHyy5hEqdvSR*qZNUfshTe9%R$Db_*>FAv1-T6QS
zZ`w2lw7wP>NNf;MSSPwhC+C`(Pc<EtR;p+w$gW%RAXE7EL%X1Sy9&d-@RGTTx&Xo1
z8X;O&z0SR$N5U#k0$OQF>>+r*MA|V#5xcU;!(hAC5Di6g0#`hRy#`;alrZ825?;v3
zXuk5)G!);SYr<DTWP9*Ics7tj%TXYNEH>K9-cNR%wN+BHeyHB<q}Ba6YkO<4Fi<*o
z*5(t(tQ*osvwN3)A!mxh)I9}9hUiP3i?{HcXJi!9hyv4~8jwTpr@q=vj1^=GpI09{
zTCH*p5Z>IbI1AcP+1=GW_+aenfu~nnO+VFH3In3#vulA0%dP=QfhV4N&vqrQbqsdh
zy;01jkG%v)RW;>1S3I;|G_}a_0bbBl{*ADE7q1;X%hp+RKH`kZaZ|P9&+GUGH{ELO
z{M1_4#dil(Z>=?&UHE*RfsWLB(c9@_(UcpB02_YK%L@%Jm4w(8jFWC{$sMB)FU0ip
zZw(fT-lBEY!IV-qR(WW2A#Jp~`)q+$#g=2hgSj_Z@5a`x;rpO*voVmvYO2ymR#D>G
z<fiM$Lsxyh#KHMwp(qEwb3IB9TVKB~d((VuLPcf#liT=KdoaNcBnkj%JgDgSTb;rQ
z^94g9vyUE})_w6^bH$qj&s=QppLIAfD2oMK2v_dzow4nnRX_Yrl9hM1?cFXdWx~7H
zq1uKKCq5YRy?<}?{+S3MLm9Qy;7!(^(=7bJ9db*0g>XT~-fI+?MEl1Rkh#uhw$;0Y
z0jEf2=eI&oW33kjx}OE4h`tGsfs;Hxld76dwBGeMek4_^rf*cIHhv~m-Rivc{2|;C
z%cLq;bBDt1&!p;OCo}-K+wmARCF^?gv9boPl~3<jB2_)cQyvxj9-WEZu9DSr&p-67
zfWn!qUM8tpeUd{Zn@Otj?uVkqPrB6FB7%<Lc1&J43CM&^v33wE!cT8ulBy-w?HC!0
zq^gixs_53&m1Rs)bxXyqqaWw*&B{OR10-y`jD%?{jfv~dup%`}d~c^8v^`vG*7WvO
z*X}1HI;nSOCk`Ch`v0(ZpFvHvf4}G#NeBrg2~9!|y+c4iq=w!F6_su%Doq4LML`KY
zQ~^OzdPizNIw+x6Ayh$711cQ^L_t8<-2Zz&&)zfp%sDe>=Da)a*Q^(7=9*d8b$x%|
zkJeMozugs}k1ce#_8PstO(Ei00H@mx-IzQ)33j~qZABEK3Fa$F*R<L_A;3Zrnnuqa
z7KJRvU-|3`#z%5__c=wy!eP0dq3W#8(Gg9TQ=~;J_jAJIAO57{OR?4;<mdaGcEt_7
zqQdf2<rr3=kEt;_B~?wvb&+$e%0t2inls6<@uNCKo~yj$F~JnG%T9@x9_9}z!bWxA
zis&SFQA2#pL)0tBcbwl6EmtQ;GVVjWO^`-I<6P$~N|O3BElg(8#IM#H!(|+fYvAHG
ze7b|ODMY~wQoTf-XoXbo<U;M|&ZVza;#6a}L@MwwG2;(DF%<ch9FL?jl1HsaF|_}c
zM<wrogxlrkIb)tA)jy-U97nYVwAmdsM&d4!^(#=3085it?ikd`f<d7xRojU3bK^Wz
zAYghrrV;v>d$Vz2ouyLnhP6?VP>c9DeR|7LvUzJuz+EQ37}#C&h&Hp*A*B|gAiYd_
zcufAeWN*K?_Lf?~0r}6cpHYGXu6LPU*5YCAQWca-)xGG&7UKc_z)rWkaeTRauPC>_
zxl{sC!CbkGGBzOEu}r^vr&TuA>fBXS{I2Pd|G%0n(rHgIsW$q(?C<qkeks*(KEI$t
zy65&pp#j#~qn)U8wp8Dh=?}!6&0C%g8%%s&<ASvD3f?t?O2J;q=E?zEtq;DWxLt(u
zC7At;Z40)n8RYfznK$5!IW}Tw;Jm!j!~dYK490Qe=tO{CvE@jcSXA40v59*;E2~*$
zX1yl5CC0z}yg)^`=A#vo=c@UK7%I(x{HLB0Sh}{{^^cS*C&EUVBU)NW77bEItWvnm
zKeVlNXUuO2+D;Sv`1J>M&NgN7y`l+o30<<O2~6kQC;^@N&s*H)-RJh#s%Y<|nezm^
zF_CJ;5#J@5BRcvru!uA=f%hvSJSU=i?mJPdk;Xf3D^ze36C?XjoI3_)C#7(+A%w}9
z<E2oSob(xW9iIG4bIrOvI*oA7tTl9SVyA2zN4@z`NW|PD0XIJt-LE(3*@E5l=_6Eh
z7mc@d#m{H6SE1Rwg`?@SF+=AgEu#V^I{2-OPT*PrzDOm!{J9m=p#yt5rfYCY=nd-i
zDa}sWKYv4mQ+KZO>9gZxh&r6!RG}-Mi?qoOx`^~fuy|#N(K+A(Pxy3~5@TqT+eIDb
zmxmGDC2Tr85?_56r~<3X+RExjI-D`M@7j8~ou8t0nA7sur1R6_4eCR06bRW(Td$ae
z&G|W)3sb*H+DLF*@O|my`<csAC+`-tjDH)am%K`O6}X=pE1A@dE`+BmcNBW*3gbDU
zxhm*~+KAwQ&~uwaEsdROc5|4WI?W1`PB|+wG9yMI#WxN)?8ACv|Em`GQ52`7;6wHU
zs;t=qRj2(#RBmh1Ig{z?xQlFD!TVt06ZkxgK1t?zj9bKOQKd1?cdX&;9cb|<zENrb
zV}T%V5zE~fJzLSA97F38b{X*DH0yRA?YGY~t+&I41=^MV<b>`fJJGMOrz$N3F}!sX
z5RHnDD}IqjtLP?xxUsd1sY>Rx?v{^Fa;Pc)WBZ~{ocUZSvBP_QY(mkX_;u4wh5M7u
z;Ms(ECGM$ZG;76jyqhnbk1q>yjR#^KwiKzB67A(k?(8yobjj}O@2CK`P>ymX(!FNy
z>*>UGS2eep2cf3P9TfMbp4IVbTiTM#x8ah~7iZOI!`zqf@m$uvbis@Zd`4TkJbs>O
zrIp>>er}a_GuI-Q4ECBPDk|^2W;l^O??wX;$e|ag#fER0<T6rqI#~M{9JiAj7>!_6
z91~mN0;eLky-L-s>>S!@zY_LT&yMS;r7r>*9QO8D5DGdJvE>)SV2dY(eM+PX5Qp1L
zDqI4xx57ux?32I6W53fMaf}*kGoVDnVK-tIN+@TVB-#zn!Olk7ldR>Yu-85J+uw6?
z7&Lio8zetr{Dxt8*rz9}kQjwaRX{)NH#@FAQrC+XHGMc><y|9qDeeaQwTrz?D-gQp
zmh`e}eai9zKP`r&7qhmkWduFnq<>*tQW<<W?5$aLx~Y#<{~34r(dL`%6Gk_U5f9z#
zzwV}k<CpcM9*xE(I6voSN@hP93E(9!FsNH6E^dC)4U#-fYC12tr+d8;$sJa-m||Q>
zASzCtIWJ#!JzmK84VqsE#VB2qlZ-7Z;O)WIc{Va<rRL0tbUufZY%Y0SAAwAgyzAd&
zzgM?;)5tVB5zC9nO?V6}&`Qog(d#+uP1c>rClo%FfTTFJtp)dXN~qf0=+nE{Q07ge
zXzAqnDBl#j&$}1;RTedVJo*yG{siBpvN^i>pjVA5$@!q^uRNn?UmhYG(V&&av=QeS
z^pz)B*^g<L5&XT7RkTkh)9)WCd3M3HsTbvOF;-wM>~u&rOghpBVdL)v^RVnZzv;vz
zBi+w`FF=PU5)0D;98Q)cXbu|pYHL-6^BMXn=SLpD+s$p^Syaf@^Sv_~<`TjEl}D~+
zW@MB5>4$pm=4B`=eb|n7RmOMYmjNcL7zRgm0grn=5n2gvSri!GB3dyjDx?);dsP>g
zuJt8_l11b>;jcg1uSPHYb$XCD=*-gls~440=v9;d_>@%rYdhg+XSz;x3$uxU3(r55
z?sH*0PlSGYmJBy22xopqjTrCSclY)W5qVM7sbW7L<BK`oIaZ-#kvxvpE(l)@=6^zs
z$~ydH;mlHQ)So3S`)E8i_~_dSZ1u7Q-BgeZd&4by6_2}5#WH5yTN9hK7DB>RSA;~m
zwVv#}sJdrCc`PA+!f2a=e1&J*dl7t03XVSK|KkC2n+`Fz^f+h9bN<>B&XN$WfG2hO
zRvXuZ!%&X9#bUN(_j?qG5%ys;oq^tipqiYZqYt5VfNOgW(v<=Z!@|JCP)YGHqFAUd
zRgrBO`Q_YwG%4gCQZ<d47Z$2rjl6V)bt{qW8Q!I-5XrP0=q%>NL}a@d=H)oeVzVDE
z5fWlXjC6;2URd^=Co!2M(TW2g`T0mG8YB;aLr4Bz-<2DWm!lrTo*0!xhMm$?y^%#w
zm=}p{2OEV=B1$Jk8O_syRjvfPMZd6i4Y4Ms_eFC(Ai7T>yb@_wb50MjkzQL&HY5l%
z&+jt!1bPTCG-2ST0E5IR+!CN&UqZ&E`Q4|+9HL_Ktz$@7s0)cD*%Fe!jI36Pty5vW
zeEH4|@pv^+Vy0XChkdtf@tZdP%B!T<Q+ZXm7%_h;uO>3^_{3lUTE}|idjQmfXCx=G
zw5G8v5))SY;y=R@<^cwt92OE8L?T1ydZ6pe35x9u9*Xfy{r||TU4(d6<D?<If8<rf
z3Ngm|DGxp{*(b&_k!7_HO8t+#I!~s-Z$<u^CZ5Wxf-A_?W#rQmmO~&>q8dV4`bS<B
zdC4Mf!|J<b&gGtB{vUajy+6hLrPM$2s!xiH)3cWS<m1E>a3(%R_#sR}9(1b6tzw}V
zg6GxOEH+K4&`YVuglCez;Ng8x6B+6-^9*myx=n%n!lnjBvl+WXFTm469tzzg&^#o+
zkQ{~Ulb_#w{lD<lyDO<1C`9=wzDiCzrluuIygW`!i|v1Y{uEz5J!~TVgRiF8yilH}
zCq784Zeq<n#aA(D4bkbx%wRN%zUII1)!%6>lmFtYD5i3Wj8lA-+~oHUzKW0QiOv{k
ziX}^A<hz3${)4af!JqjzWh!e!*~QXV&i@BrO-w%}Rmr*WMWV<{jVyn2UY^=hvLV?r
z7qhY3+1m0a2y-BE)jdZpDW#q>`;=6T(N4SKlXHIu&cu?-Udl2^$zu5rscP-ZGKkN$
zbPg5p$h~5j&Kr{_VZzb^&lUC%p2N}FFXyfFXQ8)VNXF!!k717RVOhuK8*~I}dE}r?
zKoL3lhK~v?qiHab1$uc%3!ez{ffo;bSkA>1TpP#@?@zyED;(HYSZ!R0MuAPE3vV1`
zb&=BT4hr=YqCFp_p+9CB;)-sX6q^|{8v3x9t`_Nm;scvstfPv2ZDGZ@k_eBIsF;%I
z(vsMLlK9n<r}VFrBws%>dHsKqs;_Ke5qPL@VzJC>v2;!1>w}ZxD~Tx&>C37m%ifrj
z)p?XP#FRCambDC&{Wq!FX;R+p@jpq`!AC42mb97!rFuFkqX)&g)KV2f#Y}0%?5U*s
zszOW~JTF=K)ui&f30Q2tVx_clZMA~xQTfB9a(STgr%Bc9YUNf;)sAh|VQJ-FOx0Ft
z)sZCWOAO7)K^2V}2_6gPCeUyLV5nWCqz?;!4hcR;LNHW+ldMMLst;{xuO!l$nN;Y7
zzIb%LMl6tJC=qeWsLHI>$fnc(eCUDRs!{TMqfo{w=JZBwwnl|pKymPm_S&1M5E@DD
zT4nAxb_VEme4a4A*080<SSr<Yw$_5-r0!B+jpyzw8?_qLO06Zso8?t5Rfc*wwOTE^
z`kQ67p-DCFvo*%1Xh+XFd~98Ld+o;g1~t2e2;YY5fpyM<b=Lk_Cb_h<T!KF>ABF_-
zK2C2?Z)vcKpt(h@mkO-(R71O}HLdv6%L_C-J8TSWZ*)Iw3bLy+RBH}nZq^QLj!9Pp
zdo*f=z>GKwVG2kO9BmjTvOJdiwP!P7jmt-}$=$9=&@{e%tv=Ng-Fnz?@nvgaOY7xB
zu7Sgvve@R~*xGkxElX!}jhGqPJOqh8Y%?v5Q)La)hb>}Gt%ho?OWaMphq?Dn-z9jy
zn~ZIEJJ{MF@K)ONt(9GyQcK%H%ZaoQ7h4?3`xvLWn2&5A)1T?%-CRWe#4uE1?o&J6
z0kh`6fp7N$xycN5YlmDsjP-nsZD{*<T<RT9(%UJqZQJRHlfgFe^0uFz?Z)7Ig^#SR
z0OG5UfqM$eCZ1`ED!kB+)TJW7;+Zyc;8H3EHxxVHn|9oh>g11mr!CcSY3|+X;k(hn
z4ok0&ilnxS+}*Zj9kM~~ShF5;X>o0Owy+#p@Upp7J4{!M&jJViD8%4OA$&}6aWiYf
zGWIycabxV?Tw&x6^?DP&-fcJ6;bh<QFtF#sdc)JB4g;zFAVv`jRm3Qo%~Iq_b|T|%
zW4^b=EatQW&oej%?E1r<PWq%{`y$l4qcXasj=EwQ`<%Uc;&`~@(gz+7F}8ROIDDjy
zOY~CJw(k+KpQAu%qcG(;@CR4~^PXM%uff)%UddM8vbllk>VXvQ!4}hZ?}7$~8HRV$
zi>K7zkvxXSTc!6f497|>TE2+o*BoCly{7H-o#n&xaSdP9(V-ddxsL|Q=iWCZH6Ph?
zG{+4>Zs*kn4KrqrwEqWRl}h8@!y-81M>#V`ZBcZ;jwm924d3H1JVzrTJQNWoZrBE;
zMtTg^QOo%dBlmZ7=`15#JX_%@zDgLEZD(+$j%zVZ;5M$?QtT9c5rz&EU2zlp>f>6>
zV=K~pKCg<qW>0v9H7HD(l%`gSr3@csb<F(J6C)H-CIq(K&E_sVqTq|vu%x@afsCU}
z-6IKq#X-$cU0<;<a|-P?mhrYZZ4xkLCNPc?oV4PdtoE3m-JXzlpvCe|Kh?lEn|tZC
zvWa@K$~LgrVi*h`OI!Fb?B&oJ=0dZ{$W3xYIWV1=$>wN2{b&^vu`w3Efhn)}SSN#i
zcG|xRARb_+>MZGq*r{VGBAZHw!%od%Vb5};(>Az<GFd=JWV0cL<`0kt3QNiDS)170
z=ueX~8=soGrz~)^_k0*SakTwdxUEm{X*p;d2l6Wc(!K>}T$wAs_{A0lZzXv@-ng^+
z{^TEh)tUI|i#e6nn~H${qp#MH>B)tH`YMQQLV$DT=_?p&DB#0uUm|_Kgl)kc{29j7
zb0pfCY!js=<*9U)3sS=i?gm{wAE;rb24j|VpNf&Xmgc@b3~GEz+>YqI_wGw5ul=Hb
z@YUuQEE1m=OozXjKhc-dL@*)j^-uBDod3dCDc-#bh<giPFX_&VIJ6s~&;h4veKA}-
z>*GwtxLG@S%qX%^eo5})l1BT4PA<}jcTSZVX_VPQ3K_p6i{2wmsI?=FD*7*Y3tE1r
zp5m)Ur!`J~2#eEmUCc}z1!9haYJ3K-XPUcgB5k)^)~+%bQBG)WeUQ3ly&k|Llgf`b
zWL9<Lks66hP3=q#l^k`{w+ixiDwC$#5Ud>+So7;y3K!X)ewccdgY^BRaZF~g!qL)Z
zFnUuUy(07Xs9{Y4GtvTUVa#w_%2cOM!0n2_JwoU`Jog_gd@PHR-jU8V=X0F5*d8XL
zX%MM=#I*-Nm{o@U<n(VF+&n^sWK$OFc^7d`GvAo$#sKbCN7jR!A7M%JQUcrZzS~MP
z0g}0ET1kwgrYWk=#2y`5j~RK+o9W0W;!-j9rv$GzSsY2Y=ziS95_ameruTsG^BADN
zmx%m{zxfsWW7jeF4=|xVI<9FR4U=2#tC%~!|2>X;f;_-S5OX$}&-rFQXY5M&#rA?_
ziVWl1WHY>STKU_ry^j2@`}?NcoU0|nW{z~L4_zfyqh<?Uj$#~JVr#|1Tq&4;8h}Zm
z+d1%i<bTS6e=crGw(k+i3`e*-D*Ve2+<&=rZ3g^>v;074B=!@l_OEBpP9?(26Zhjt
z`zKHzkf9GW%4ZXL=cuS3QLOP5!!YJU7g)~9KeElPrO6fp>m>b&eeyuroTIT~wsiyf
zj%iNAY_8|;gZ{U3*y|h$RV@99jaJyHZA$~=b8Na6yI)2Mhnc?YR2Xa$AW3*8jYOnp
z1#K(klvKX=1h`+A$*7UTvaNN}Pk@wLo-kNY*??_hrbgGLql@sxJD*XHLGY|W4!Y<w
zO3#iyjR|fHi}`3ke-U-NGqsXM%(L`fCVvx_X+;a{EEOjx$;=&1Iw{JgX$DUn1xfag
ziR1-o)K0{Jt-fChwiOh~SCG!SXk+*vfAw?-+Qf#569T#TEKAGy^P5H1Q-9TARd_Ag
z?CJ{v+mYOghxd&tY;`w9xOGIWSv}2Oh?ZU6aYWj*7W{GPiV>DFIED%|-P@^f8qWOt
ztK?_6Nv2(AiLlFxoFl8jRAd)-lyDmEZPsn>1mTyiHDav+@h#^HgcAe5MovWE^2>NW
z`#w`EiqGM|e|56rdT*A);r-1|Z%=~h_%#Fi&1}8<S99f(`I9wvWS~nHSKk@?8X;aT
zJ-z-k=l9=vG2NQGS<?v|!kYaf{Elgd1qxthX^DhhBf+l;c7g(69?4_1;)H$DtlT?W
z)MzoCxwkJ^T(6`tLM&PHqNHB1f%JgrHAzod<z&|;m(qP}<Mp!~*LOV<ePL|F{AhE(
z_eHLKJH7F)NAr<!&-zHl?=WkL-}?i-xfaiNv8~Y<I7&ae(W`BwfHg{11|wk)R!bt-
zuWlNR^9%R<5jGNDkoeKMd&DWHp6n;JVvKI`73)7Sh$&7GpcisKuPfKBc-j2i_u9)A
zTC_@57n!6c`1KYVMJ9tL`pQdA_IQ5XV)-;R_Ovbarh^-gBz!I*U5%hJo-GC)PaU`(
z7Vlz`T!I(A;z%}*lSaNdyQ#0Y=p=o`Buv1?LQu+lhc(ZOcl5lw^6o9P!h&|Fuz`>N
zNP)=T>bn_T9ajdj?<T@7_bdI4jvbJ#98zHA;e08~d2(db*Cao}l~Q0U9aHx_dC@)Z
zOM1%R3yrEh)z9LdyiP1a^zT00n6SFjA7yFXuIqnJ%2X$`I4DQ>b!)OTZ{4lzV5q8F
zZj@;A@|p>g0mG9c&f@GBf~!thmt4B*rgD5lbe{)gQI%SdHZPmbU?wmtYcJ`N%5Ui5
zow;m-3;u4YJ|?L2zT(5@EexFmF%Hxq3Kuh5Hd|to(>7)gICVa#Sv!5;_j#4J6}@kJ
zbxi8&`rjXRI@uH%2btZ`f~fH6jb46^YU#u1z|ACkr)2b*@%P=4>X-N*XQ2)G2kLVC
zziz2RXNJ|%`11J8kNTDp_!f*GtrR)*DBcWCe)+OM&3?N#b^e)Y!=tQts8-N+uUK2q
z&)(~CN)OWALgRw?_;t?o7e7xGw%zm8sX6$SaVt$A5l`D(!x}B-Hm@kGZQllS!`<)&
z!>!QPntfa0qKqB4$0X0(7j;T8CVw-s3eb7ghohD8cM>+?(qT1e(3bHh=|u!4Oef+Z
z1I;2HXS&d`WZ|kU3P}9FPMSZ&23g1Qv0d~(z=Ro6eiw;iv~65f5XMmXZ~>Abmv?|e
z=c}LCV76|e5GUlrR98Hoe=fti1Uy6a{xj;Qd^?=cIDr7fXlX}2-W0MzPH^z8h;$NN
zX?huxQ2a_5Z6=51PkX}+Mh41bNl(LFg)etJEle#)o{Xlm@YYt|40<g*g`(P6CS#H<
zhb@b&;*1YMOrCw~OqK8d;D0c0eBWU#IjbBY1y>SInch_Gx9nW?H%@+-sK7t6wy>H!
z`8qJAQn+>EsmxjSXp8a-uVDUBXaCM4Hks+=k|DQLy3b$mdww~{$})`mRbu;QN*ulK
zvu{bOIH&@S_1T7C@rly1F_h<1B=g~V=J|B6@+0V=^4DoGF4|_xNacxKWQ3c^g0IdN
zTW`h^rtrQG=f#Bk6Z!nK?ne5mmy(}P6o~1&n_OwW^t^teP%gsV?1t*)S5p&3=epf5
z+-ts^^?RaNi`K(3Le(no%w&n7zQ?81W~(CQ$=4PU9#(~_S4yu=mR{@jxLVhIrSkq{
z*>ze^>u%MnHP0u@Z|Qs5PBveyub-^A6X9w9UG-Y?)MVv@ZcoQw&DY-jo~#O{^}^Gt
zS$CY7B1P$YIkUG|_b5+QKaKEm6;ZPpxH?tyqTB1HQj5*-{i!$Ew71>#)ojO}Pt_Ld
z-}boDVmnnoRaX^p+v~=On%&2#srrWhpHx-9rTSrJ_(9LztY59SH1}pkf}#F7v>I+Y
z93LrB2L5^MZ`};eom#+={skf$?k3khj=kvdFH(Bze&NB#@oeb55`7JiOD{f76dT+t
zz4F%MYQx9Ls>plgH#9tLKYW~O=($&U@2#if-p3DZ(EFqa4KHVo+38+``!%U=y>6bH
zof(O|Ut6eg+vD2o#}7UC>+9a$_I@xs`vv--v0KC2@5SuglEH)K$+zD38)iTKh<woc
zUE|K953`^5dLF#{_4dw_z1c4(&;T;6rcWrx9F@*6po9ILPvp6|d1O>Tmx!is%(ee(
zQq}GMJ*gV?XrfT_Ug@<@tJiuTP1U`-SNY)6+I70X>2A&YH7`D`-!csRIQi~=eZ!{>
zB_`Pa1HQ_PLLgWf*;!dQI5;^u&hT<`vGXts@bL%>VkAU_#Kfg!B*l58SQO=?h2*);
zD=Da}s_3YzNNDkB>*yKlXqp*ls~Rg_G|^Wu6}WQ2MDEg4yUXSmtu85AC#l(rb=xw#
z*k4m~Na@9MdAZp4x$x<`zQVhDI^A$Kx|z{`Q*gjt)ZfF!+%xm`?b}1QrQhGd2Ku<a
z_dR>nFW2O*obNq9oBJgp_q|8%t2#U=v=6Yn8$fvY@Zrcqjfh8n&X3DRAM3^jKiCLX
z948oBg({7QnqCW235|%}jL@)+RQHLjcozA1BJ!d)u`ZPu{4dS=ugjVg6aFvFI-Owm
zBf<Q}Q<Le$>+VSxf|43;C);i%Urv6OlKU)r=9%m5l*><3b9|m({huytn&+v@dheyn
zDb4Et%I?2W)<>D1k(o}9vRoc#`F+ar-_E-6UnuLXyu5;)eDD7$vKIQ)6~2lr3Q8^N
zd{sh@dF|i)IxDs`{FGz;Sr(X3{;<5f{M2Gis*HVCnYU0GlT`IMuc|xsG_778pIQ_8
zx~8kMrYP+{B5PW0#3{%6t2U~q?sa;7`l-wMy&-L-A+@sceNNNUy#L}@e>ErPx2B(p
ztfv<1n|I^O?{a^?d-<=$N+y$=+bI+6wQKE#zuPm*Ix;IdYyX8<Nj-TrJ<T&cO?CYx
zjRPH@2i~p^yxAKl>lvJA9;)~+f3;?B<PDiJ@{Q8bJ-YN`^lkfCedpL%&-nEC_;~k3
z^M5O>rv&TTWY3?;*8e70hh{oAX9iCd)`O2-BeP%sPk(jtKmO{61<Jn!>wo*J%ZrP@
z7e9VqT0dHv{=Tw(u=06f_0!(!{NnojpY^XRKfeF@vAnvq^ml7%V`uenXMOwE=Fi_d
zN56M||M_+J=l99U$!Ycmb^`o`^B9qG+QVS1lJ<S1+|DSJkV%G7bzXNY`mD!XUv+-(
zQ;cp5k8w>w|1<H+rS|<bg@Z4!E(00HZ;IZhtK40k>wi-`l8p<a=QXJ<8O=9(Ch0Ix
z`+B_CGT$WAq^@+b%=(STr-8b%4^{Zi7+%x*@|ibo<E0LR^%b)XK3@kiO&cmdwFLZJ
z{WRE6^`(sfX5cexB+YjcS*09@8mqtdCJLEmnKjjXA51&z`T75Qe0BSO$5+3VFauC=
zDgi=I)C-1*mSFT<{&##8#g4kEk`sRB{&MaUG-w)x5`J#9z$yxw2cZ<a_UB`<MI3pN
zTz=@U@hXqbxiE<pEeoM6AT!S4=g+u*yQj99^DS9zf?B|+P`i~AZ+O-HyWd&C`EMwt
zTGDrvm8E<S;<BUr;>+&$Mnd6Mc`J+QjW<s5Rnc1bQf5GN&wGUBZ}$$EIF1vOA|8j=
z$$nhao~W{rqWE4B?R)kgeD&-pzS`6|DE=?L>I-I&N%7v5DB=z|`@is2s2)=*Ot?7j
z*hdJAV%Y#=&I$E{@md^{SRJfjyFv#FS}1@)kz>O9VOGL=7F=mw1&Eh4H~+;~M^Qp#
zmQnHl!dE#_b@bm77?pPvbgSAD!jUX1wyx4O0uqDL+O0sEKG&rw?4?F{KWD!IQ*&Zu
zh7dZBxszuyq)Q$(ssO4wb{nd05w^G~X7DZnbz3{XVDuk+Ro9evnnlfAs2x2PrTSVC
zgcNnx(^=7sS2x=gUqB}tv>uc56=m8LYj$uwMS1>`;C{2SqFo312?8#s>sd>t&CGHz
z-b`%^_gGpAB`4EIKx)Rvb(r(t!~bviYPh-3_U}3Io?gOjqvBq4EM%%lIdr3JS23Ah
z+8vm)5Q_KLu#80>K8s{<+3!4G)JhHVA2UVnKHv&DWR;b>CoM}6k2kw)Sf6Aei#iw2
zqZ`Pd)-gs@-SnvpT3!HT>a})!<U<+b*Ij~&DGgpmwPjKo_xq`9?8cIt*zjlpih9b<
z1V})DDh{F%z@Irr3u4ZFJBCwPDM$t+;eeZFiYg#Nvz>tHVX<5}5@_?*mLmvJGY>%!
ztza`O&Xbi`V_+Gk88^hgfU#_qRRQhKyBGlq*Mtm6xId#h_a_uG3ATi%s`x~&vtDc}
zkcp@?n&m4TAQa09Hl$Q6E(ZZ}9~D2oRRTC|go6}5)I!2RS4DgtsW4hHAm~bfmju35
z$q({SR}cz8JTr|-RG*^l0D;8q%os7>It&e4e9EA7>aeDw53s26Dh!`)yZmuj=wmz>
zrfb<7Y-_0nD0Mi0E2UAnsuFq}pTlov7N$CPP4!kk6@7Uq9~XBe%*`^HJId^v;0+bX
zLy9v@<MbAqrtYcyb1YhBAP2|AhT-s$4xdnsJanZZZCL#HZ$Hx>HlTty>wO?{uG6e3
z5(zryy1d^^z$z0onCkwgHflWDXA;B`pTs#aX0Z}gEmc6mqyd-r-y(B=C-s}xQ26`p
zZ=NkSI$`iWdVRGgnMTyD{k_o6LOM2FRQZ_Gz?$NssjQy2;z~Mue$t8m_o1uSv{8}3
zR)>v{rJ=@oo8IK%ZX%5WNPFNM$`NGb#Pml<+so+f<pVH3sYDmV-K6ZN5f^=kni6?w
z{my;+sr{LshOsr1Q6lD@){l34v$N91GaoVHbWyf_`vC*)?GusBY{bn<aU@=O;Q3*W
z#L|-ps}Q_Lggud8(Mi0r%X}*W(dl&d??n>xx=@Cgnvs^9d?bjkgg+uC@~?@Z6`HTk
z*_*wu7T06ovc0JlxUu#{QxxUr6d!*K^k(lbT{ZK`wcP!QzA+eq1lqky<CRK{Zyi2|
zo`7JqEDI6UwgkQ497P;pM>L}Yjh#U^(2iP0F#t;K2C~>V>wG#w=xW=_K|ZSxHTx*f
zq{yo&<xEd0J|K0_9)K4xi+{V~`?Soup}Gc>3{F$eg`2_It@zfIycMMxuKUu5n~lZ^
zm?T+>w<b`Xq<GNSdFJ8BzI=pBK<Z!FrYo6zW$shmvM2kdsJJGiXHU$v&`<O^+1->=
zKu>(vwl?h2->5Lxm@*GFyUN1^g;3n-FR1(A*SeDEwBttSCcSf=<TI{~pqKKaMmO5P
z?>{tw1wJqou3gJ@9&1(kc6~OI^z_foSnl1VsOn|0i5sdjt-Y8G6+s$|uXxi5bHSyn
z>=(;T_a+HfetxILR{vgb_PgJINVcq-Z~|c{F1B<Zd$U1i5q~;#U*Ao=%zs-Vm;JeK
z)D3B(D(Qt1@Qal6GE43(ZAaJahBd`eYB$&7Xdd$v<CyZ?iL+Q=i!Hd`{t(0ZR+B?J
z=-`8kT26HneX0x|nm=K)SzR+Cm>`e~cwS?&wExsz!5s8TKti|O*Nz-NRX;xb*V>go
zG8}n0FBx|^t1>m|FaNPQm_Wl)Sax1qgfl!4B7@#TUUn)`?d$*id69$eFyyIDE+(XT
zeQnpf1&Nnsz{Sw3G#*NZeSa>ChMHpXBVIvMI;yl4(4CrbH$ox5na62Qwv|y29?pU^
zU)W{e+)I$~_HC}0>po%W>tnj%hn{MlTziFm7w<VDptp;AtPfJ3Mvp>wOco0q>L<GM
z5)4Dbx<DPN>Vl)HQM>uLN1Y;9x!ITh))6@t6L#$1ntw8-pPX3W(q}TmLietqLJW_d
zF%qu)UeDsqmQkQ#$BX{H;k1e#R0?_1@haxKbKPZf!8EJmm3;v`J!`On_8FBf(-69}
zC-Ef>%yI~f^BA~Ll;{CFyP>+qB3wbEqs^t>yU1++DcR?R*W$S!Khx8tmO$q<fP9m+
zbeH#!Np7=*33(=OrII+cYn(f@V^N?>+B$c7a~q3>|5m!0LDkSYCu_3%#=&~duS~c)
z8RT`I-s$%G&b`uw&f{{9P=AHFt435G;|$t+_DW!%?0(bA_|G-e#x2xdRPfd<)O{Tb
z+9U$I0Fq%E)4qs8i8FJcL+IuaN9Ryml#ovxp^iz=2px<O1{qI)*kBM;%TTZaWIdnt
zhqA^cg<EPgW|u<XwEhnSr^BjgE`dWK8sTu8Er<=7wlxRg4rl`)1<epR4t34~6?RSl
zc_heQi#qpVG0c9MtBoCFMMXsDV{{1y-u`w5QxP7Gk>=YGL&C^<eT*oMfsHlLy)QB#
zElM|uR+bX=SOu)}3v&-kKYP>uK}i%bjfi6=BF5}uPWFk3M7B6<OaeOkc|f$L0J5DF
zoiQEVPQH|ej>%JrDX@+y3WzC5iz#i4DW8t1+>artpjUxVj#1<>2lH_Qvbixf^j_@h
zo7iS_Y=@D+>l`f$Acj*Og1d=oCq>X*#I7yf0@n~O=rE6-!7!-AeO%`I>m#0z*G(ld
zONXMwo}(x#s8s^oOVrZd1vRO{ywaGEMoE~pe)=QVO@YjCh^3bcH;qt&0ONEYr|hQ5
zw4wyaqn{8u5K>_a`xS<?z=L8MuIvdXw*FGKAH$5Qpf(Eb7N_3H_rGQDckfKJ-XR8T
zgL0u8O(H}=WO5KB3^-IwU=E{2aei8MQjMT<LL6XFs?pCx1pKYG+_om@WXVQ9?qfv?
ztR`5`9aDrIU2Ze#nLWmXmRT<GT?W@CrVN9$e8U{?UO`E_>$y`k&s+v8P&MVcQbke}
zl5nz*JCjxxq;Z4`5%oHSUz3vn5u6RD3WXk2%_vVrF($$wNiaB;27^IG^rM7x=vb?n
z1_9>emocYyxJ(|F&qZF!|D_OBVL{m9aRH(nlsY$|`*j+bHZGXRqN@yfWwYh|xK@W-
z0>!%`HMAf_{|vXX^Xm3j8TnoQFJF<;E7IgkSPML?XVO*)58DZod<^H5$ALiG;IJ9g
zq9uwENCPKjGSYw&C74Z42w;?aR`GODtB}?%=_S^mk%>jQg_S8W!o<SZOfCFXm%kL#
z*sIB%ta~IimlPSVtLa@Y-K1^&DsM`UQjy0^YVR(o4k%=Fp9kT0`Hi-+?~%=w2)Q71
zX2K{v6oWznX^UH6DeTMR9LV4n7(<~C<pj@SQL_Lro0uubl@Gd@CnkwHKtZL*z`PC0
z=QL=OnE8mD`K<||LIN$~3o1}hVJgG1PXQ>Y!1QB5;WSc~0161x=Mw_^MS-4NrOTv%
zW)?vBQ))HmIa6r1$s}l;s>yTNuazqA>QQt`t)}6nAp^-fU}ct5X%!D@zgc`E2L3Kj
zoY@1#dNLr{5ejL=scJues!MU^ljMX_=x0%R2U~zvB1~Wvi6jFiJ~WR=i09b65MvtP
zv?&gcC@C#Hro7JPD&_E@iN?`rtD>SU)8w~+V-m;-g937p!ifMJN5g?CXT*WD5`lKr
z@?*>L-dE*=wlS?(Z6!dOtgNwEgJcVXq;xPOg-f@dI;$Y#E=Br?1<g}uRpv}(iVlNJ
z-t)LuvZizxK@QjUdYycrQl}s`dj%OQ`TXvAP}LYLSkU+w#dv7}wC?vhQ5&R!r=6Ig
z2LW`CNSS#aw8x3CORGpWa^@R)fL6W+6jIIAl8Kf=QQc7(Oa+w0*kMwxapIl@ss{05
zP$1l!G23zpldRY1IAf^!@vT^i2d?n>V7%3ZrV`Cs6_imr^VW-amO=De6Pn1TY9~tF
zvp;~iDoT7XU(^)kGFa#6NvpPoEIR$D__RC^xKbGs7yG82p6-~00Pu*rb`3hSF?_l?
z*GvTtFaXXI0Y&AnC1&CSYlKZ364LXd(;F5k^o*2zfK&!@sy-$$3LJp7a*!CH)`wL8
zpbV*kr8x$g^GutI24k3(V#Cw~czr640XjIglrYnH(-Vj_E*D#C0fn?QOVxlVG;(&R
zH7pGr19ZkzL-Djxg8(ZY2s&j}w@QzJw_~%<7IAN<PSjc!2Klv`n7^ktFtk4d=OQ(1
zP^(hq8-w}Vvzb5D-u>ndl_E6kwX|K4$8<r$g|JL<CE~)T)T*=mx*qAGUIq=zm8xpQ
zufaB!Ikw|K#64?S3RY{0WC(zmxFMJTAH=#pqK*!e<b!}Jv`aDy0e%SCqYf-jr-FK?
zqJ5_<5Bxi8wNz^-!&ry%Q74Y4OV&&lG1O@=$FGyoWx~@LKs7Qv>N*&O2?QZJExS9Z
z9dl$R(~K?(zT0-a!(83fQoUzwwBv^|#BII9CXv>Tu`|uG)1A;GzSScaN9Uy96QIs_
zQynCq(S7@<L-J>*0j?Ljjxe(9dYIAo`J}p6Zk@?<9WJ}hWRGREN~A4Ogucbmy8HCY
zs?(=YnK}XUP6E>smfi*raR)lXq&w>#c%Krs%c#L43^Q-vJA^N?Iu5ay)7L7^6?fFJ
zoIJ3UXrO?HExc%F)4xa|fbi<j*Z5~R6#Uo~M)K*9YaLK%H5Ai@-X_xp5fIEtNJBg-
z83RXzFn*q+eL)#qU+0_*Li{+>>5dt4hcGNr=xh?(f5*`ok%r!{cZ95WNP+rG&HAuI
zuVC8H?>OcKFVq2c5GBB{HaE;x!70l#f>j@p%`lLS8#(rB|KkOc4Y~lB4{*oRIW91L
z@S-dM44dR2crFFx#ME~>d@x0Z*I-a>1Xu!r5tPIbM1T!phJR3D35m$RmctVm)DZ@*
zzX8+eM;21)hHxkrhf(X>oNY%PTpB|`K_h>LhH43*EGm=aSGe@I4jKH&G?wYwI+Hk-
zUW%!6U`!7FmU4_?FeAW>sjzEQWC9-AL4ajYkwp~RDKcXpX4o~6;US*>7|#?2%p8-a
z6PRYg$aGUU=qD`dTIOU9FQ?r`$M6{FGsZ&J3-*UmTn5{HzlYWZ==rD&?F2+*u@Kt7
z9o%d$=mf?e#>2joXphN|Js-%A#19dVX{WHLg}Iq}{BWfC%=-=GNCnampntJ3!^-<{
z?mas2<VbuR=o%~^!}5HVUuRl;jF`iHzOBKei|cK9k9sG=P-BS*!p==?eK;n=Bi=(Y
zWl&5T$R;Wb<U~KFF$~&-{q%v<Co(jV=0MvspETx)qaD*!;R}MFhmLyB#LfFXM(}mc
zKH#1I_4rHIW5_m{(GWlUxpnXliVAk5(jAXO-qE&M&QN*gXU*r;HPJ?dS-XtSJe9Kn
z0P|0Wg-)hvLkhIU=gS_J&di548UIPqk$Ukn(khF3jGA*G(bngD(%@SRWA2eiX-9V<
zIM&;Lb|Tih5F$bNbqq#<jBwQiMX8`%aZG!pLAoR)Gzp0^XAT-h271%0$u1I4-f^US
zvyBVD0A6I8JaPC@yRPVxLW&Mb9(J3w67ZO%jkIExwVbE9THv@^^klUpYqj*<YWe5Y
z%HvfM-&&34TCL;S{|&wxK-AZ{CL4djl?JqeigKpOBS&2{PDvn#jTzB^7~UT*pS3oQ
zaN3|_bT2I4keJx;*xl&!=9RHuO2RK%-)INrEq<zL2ZeS}`8Mf9F#>Tq3O<NU#E(J2
zA2d2Y{%E2_hkgjEivx0)AF`On%tijz&B^&rUB^!Aq8}V5ot#g%uD{(@oZDtY@}5EN
z$V=~pUfdByc8Vj>l5IP{<1L|+6CO*@PcgZl5~n)>{-2TCJJ>HfXGeI{ke#~t51NQ?
zx^3+S{AjJLUES7Q?KYlE>$^*dXsaI`MBiUm_<spk{ZtM<ZR3!)LjH~r_<h0RxBV9$
z%{x1|6AsUj-zq<L9Pj+Ro&CFe`#1OXy~iPY5Bc}Jwf3}r?A;IEBOv!C9rq)vwl7re
zh4J%{sBjW~METBQR4{^q-A$?5e$n>x<(K`zQNcf6J2n{b;g)z54a2k0<n*>}3ihB-
zZh;VTAjWxs`EpQj=OC+!N8I|+<)L|zprt4BVd72Ou85-`fg`V=?e6TuSl_e4ieeQ0
zzjr%&%G$c_$o`$q{`;}*@7zh--?v|SK79GRpmqH1`my59Upt=T#kS+Zb0egYBV6_J
zy4H!D_=QPimkkv@VsUcx<>VNN5`rLj#@t}#cj4@^t^tUv&kfX||KO_&`f;46`0DiN
zSHq{YNM+&ITTXh35?7w2jP`voO_RSdTwpW4Xr6KY-sZQN@g<8K?FfX3?ZooM0^?NK
z8}$BMEFl4?=LNQtt5?bygy1P5bZb-0x-|(Rc2ny%weA%+IR%7Fuhu(F{)?|hczx<%
z7eDjkODRQgeqOR_#i=WrUGC=G^tMZ1k_b3Lm1XNjDJ2q?VRG-TwOiULzUpv>Yra0W
z3=w4a@t5axaZ_p0$pBZq+xy#MKNdgD?%kobM<DlRN;Ynfg^kSj>)1IJ+_iD_H*oya
z?C}1M&_xT_pyzXe;i{)%TFQq_8%%Evk=KvCy<c>FA1S{6<@oW@)9=3bPdK=)Rk3_D
zfx30A{lGyu5AK97vV<DQfmu^XZM59#OYIY)1q{#Yi~4`)qIB7O^;jOBmBlel4#-Gb
zYkJD*qX$_TaU=trya7*AdbNzYN2|PH&2&ta-aq)Nk#MY;3uKv~E|t6j{WfeYY21l=
zUU5|FH#k~3lx$j4Zz5!@@E?4Y^O;jPtX<l;PV`d>E9v#ejGx1AR=dVaPg@m!THwI!
z{*)Jxk3av#S1(G^3hrJs5=yPr)a9((y<~QFazfTn?APvPOI?lfF>}_(5s?mk9nM!S
zvVFX9MY^&*HW@SQ>^iA7%p!8l050&2M_OFs%IF1srQg=B&kCa_oPJ10f&ea~d*$@v
zFdSWkcrFG6IBJ_RI&wS`0KA9BLP8;YDzVUeH2LkbW#n$@FywG94FN)OyFcQb`fKkx
z0e<8Db!_)b0*%v%GcX&Ww{k}2k#UTu%>56yIpll*SVJjMZcXJC2e6-tKYz%y@0xO1
z)DNFrrmhVHaO8Exs1<2MF-yUiZ{<dC`l&32=g~CSU+YHcreuz+sN_1Mo%C3*vEF=@
zbQ0br0Aa8{QyQ>ZFyh`^5ObY5Z24|p6FBxNdxt)wa*WOLQ}KkW;$P!m+a6>%jA<IC
zSn2n_VwM-JJXkH~ekT<Ah<%j+q}x@Fxuy!e2-=yqzOUXJ7mX)!GXg|10FarBf6}UR
z9A#v2Kd}~2-ip6Eb(aX>L!bb#2ZpfhQ^8!r%wQTCl;tuKDA*)`s#sx~grtqP`|QB3
z`EnSX{DkTVFm7E<f!GHN2#D2i5C}=<wlYE}8yf%te!t2tSIy@`=7T_POSe$g;g^JP
zIDn#t__6Cggy9`^#GL?|lu9r|QzYPVuc<el;Ky2krxkKJ59=T@0~EUx9Y+jMlG$lj
zbJ+PAlGqkra6v%pGB@z9fdOz!U;&mhKg4Lmd9hR)RZ7UNvzU5>A|4D6ajF!h5Il+b
zAZE+HDVDJi+I4BJdhqP}{vz(L@fwdd00^D>nk+s-T<k`GN(^&nI2pmPcK{#@dr&;9
ziBSi6A%9sywf@pzz~`hL&pd0?s}jI~zc<gGmn4KRDw~9!adj2qeaOZr>ZfDBZmWaB
zfg-I4H1zFc5L;eHI0-9Y4d75$3tLV#UqD#m8<K<Noz+|Nv&(bj(xDGsu^aI*dRUxD
zT~B+sm1m4nYa~MjV1}mwJQy%!2KpDMW+kr&EoHf5EGI7#RX@uG8%lp*JHeUSfiN!x
zq=lIv7-Nj~X40DLEwvjg#{PohL9V7SCQd=Uh`6<9jCS*@!^|}ZNG-T-l`P6VW+Dj4
z3(UER>M9k(0ZUvCKR~B^_q8IF=t48;MP!YDX~>J~J=inh(z|;l?gb4MtQT9Pb3q@R
zcCh6=V`c=YkJf3{w#uU^6o<3Lgm{X6gV4v{ikVosP#{_tx+Ps2$YW3!p+|^j=qJ!@
z-ZGrnKAUpP1_tKpQ8OBseL3BXbU1fFAc!_lvj7D$a4ce6mW6;Dk8V9wL$H=T0$ZSc
zEmyK7%~$vSMN1fa)fi2Uq#hmI2)6A_Z+;SA_p5^8e8`m%`OcixJ0a#utAeQqHk1nq
zuQNnO;GBMDRvUr^4|1I3U5lI8RDYH=3qxd^qX9-X7mkahj`Kd+06j4e9ZYzEU?jvk
zhbs!Sc166$!vMCduV82n<lH98feV|{#PAvbB8^hl7jJ_Y(x&}q2(iEB7r3A>Spl@A
zh5;n^j+<E@7%CC7nAFwS$0Q+fCxYCYCG={%V)NdJHW7WC0HllL*%_DR=0{%bU{#)S
z<M+zknv8#OdWQ$P-=mMn&hcCxchNduZhtXxpJr^l3#=jyII@S?y}3+WcPmHz)L`XV
zT-#Ere(^4xbf)wQ1P5S&DmVWV1OTD3i!?7aSzUDQSr?k+hmhxgT-5L3`Tb3)Q6G?}
zCV^BY(+Cga2#=y&9)n07V`OF;VMl8n<|3cWjU#b}LC*8SD1iB9I?6ud0=X*Zmd$+u
zx1ve*J2;_1r7jcpRVNXy2-(^E?cYn<E~)}m6h-6vG_?-<$&v{-jpT!jiS#J)*dtM7
z=8q!}>vV~c@+V9xt3)%ix1r1efi8nXQ6Y}w&68R2_p0N~i)<JUmGW?k`TjTp^4kaB
zILq3a-mj}Jx9nzr8=nRi{@(VvMmIYv`k*Oze8Z>M?$cW3VB`D0-T`XRPwQEOyl2P+
zTD*dQFdlgK<yIzaH=X8WvWGsTKfnJ%?EGg2;-(G45O^OF24i>Qw|d|k3b&%tb~lEx
zdWk~CEDv~?abzgk{6}@8+GnX-e=aS?@7!SqXtKTvgJAgS9bq7#_bok0x+RegMvj`Y
zA<&d=K)^$-Aompl5c)#OJ01xTySj(qKHt?QysNHNDR0&k+ou(0Ov{J`&b-{&A!SFP
zKxw55KATy2Rj&jz@AQ4>yX+sD9ad+mH3(N#S1{;1VjsopRi5J0^vhQnt4erLx;J-|
ziD6I(21goqWJyhT_?g}d|2WCZBrZyz5u+L$B6?sd#ieLrHvlY{^P{feZ}c58_&FmI
z0V18_XiYpJpfwW-u!7qhoJKehKDL30t!>YF`K_f8P}L~+jh!2h0}E1@9QK1aW?!^g
zg|+>F8O6hx`%+oa1VYz~@IN){1T+hw-|a|~hC8i-6(kGvwS~qp0*9YD@}gnl@96d$
z%+CTFA=%uQiJJp8;U&B@sOOvV&DU@*AZ~=*@l)KiWbjSQ&{uWj5iWSE)j#a{oN==o
zz>APlSZ2vtr{N8Y(TKF>CrL&Bk|#iLId?HM>=0fE6?$g(JWW8^`Wp6oE+MeL=5%Zb
z6{86T@q%|NVLr`3V#hTyp^TM~l$7~;0h+D*8Zc4?D7cnK@)Q9ezbsSC9<W*AIeFRH
zW}%w{X>4X0Q|r1+WM$<0K6);h(w-v;g*+mpwTEv10j7<0ey~JHoo$A|2y+5}o-I+O
zww1}Ah=6FDN~<w5HgLOwY4XEa3v#8-7BekZ(l<gcVhJ3sE$D)`k=6uFH9B9^8Qy|i
zHy~^OWpla!V6j^Hqa#91r2}f!5svS;YfS)DXndASnP8!eIjxL+z(H8II1i^cmdres
z??5t`XxC}n;s5C*N7Kjwr9yqFXSf={N1p7hYuQK9px^KsRWq157B{JOJ_27Pz@Q)|
z91=6oo~}zs^Z>wmXHVn_57o(T%a|3vTx0wA>J~j>ZI>COfhn!y1d<ctX)Tv;dJ2^i
zWaqf8%wTAH7-wzF3wRbs8k+Y=*3CC`%vcptBbm)Ag;$Rfw%5r58)GgRm>x78&i6b9
zpSIxWUc?lhmV_K|bz-(!lvxSKPHB~o0JjjC*4gtIS83I6EqAGrFyXdR%Dd*WQsTfF
zD4Jgi)mPKi#yv;7D-SSu!DLO!BZZ?);*46P8=@iS1c{w9{XI}|C`}2VS57D}C6Z0`
zXVjvSYw4x&0H3|afd>I-1b-jRr3(N=5Bfx%`<&T&oQI63JUC|l$TqtW;ebi2JWktH
zaOO|;U=V?G&P;hr&7cpczl(j#K!Ez_m%K8Dco0rLm`R^pCOVTdC0t37joJ}BeBgDA
zW*H7lk{4HKc0)@RkDDMt`AuD|QLUywgj-r`>)q0H4VL+&eN4%0Lu5Sw(irKs%-3b#
zJ?#qfrFOm5&c;yMqZB&bmb2+pvFYE2YUTyal6gm5b^Kk+uQk^EXx7eS&KMu6+T6)z
z$%BBzg#>GQ17E(Et$E-1wWaeA*d68IRcx;L#_mffoo_9-nukhZaY<(jF4+<tmV577
zW_|Qy2eTPz1(EZFWUbl2k08xJ+Q^1_RP)gVk%+o2t9pl1MRl66;;gXCXr?Eu8RV;D
zp^7aIJdFmK1wABuoy`D@fJZcZ@)Ye8s&3AYYD+`mcUPLh1D*gqS;pVr6rpBG16<Hq
zz6fn>3i$RMx(t9VE01jmKh)^V8=GW!o3KX&am6vFLi5=pFl0dGD3G@8EMcslZ?dC}
zY0D_gx#EOVuudn#N=P!&$g)OWj4>yKp4{e1Za@am?7jv<{4E+JRK@nQk!}WHLgrxT
zsL*Yqu)`(SLXs$Zz1u!d@mYYyEeEC|#E6OjmI0Hkre!t)keFI`mYjVEoMj^nU4n&a
zV=UjduO~Hm9Aw^_Z1@swY$j+1YHUOKnL$?Nz>1nQ<bi8G`bVbd4!s<KKme3hUh|Sr
zCPbjKz7R+QAZ~=mu+g4~-BpG3v3u|HfcpTdaViFP4T4Wot82fz558Gr4Jw!D5_<Ks
zwTAkKoe@g_wzA#hb)4>XtN9GwqHVc`$vKg}8lf`f%KLG|_UetVk=IZW=qs=ShmUUn
zI(roD^r$wko3d{Jt$ru1&fU~jJE9xO@C#_RO#Jl8shR*<gRixbxQ~@gT(xgw9G0_8
zcg}d{glkd4E8SmdC8|~F&lWU+tB)?_Fn!z<w(Yzz#*DT{k6Lv9dX;8w(&`2reJ$x>
z|JeD~-caFVPX&Y2*1-GtNFLg_VrHf8I{P6F2l}zO_YMwIpIFBA9j4=XCT}}@tZ;xy
z%}u}mbT2eUqT1o)%imAu=TX8GhXwsok!V(`x#RZ=mJW3C!sE{d3yD+Kj;j@)*=886
z362{#3jX3**8Vzf$siG&G@a9qKQl21f&anYeML3VM*RXOB(zWxdMANE=n#69G<p*i
zMFlhz=^#z%NC+K-P*f09nlup+ktRw)=pao+Kt+luAW9W!l9TuQZqL=ZKDSx3)~w8A
zR-R|i-v1wY)Aj1!joUhdb33=c4qoCD#mw!!zItqzxg~k!;MdhVxv6q)&{_p3vl;<t
zLIBwlSgsIQg9vQ#1omtOzDfW$5IEluxJC)wa|E8>|KY1p`+3VW&XYe^`OS;ATsZ`<
z{9p0a1+kQ`{J$3xa@j8WfEccZjG8;b#9h|jUG9oI^2(wRlwH8b9T~sK>jO}H<E}F5
zt~%$g_S;=eid}hcQKrhBAL^lH@*lpsq|NG~jr7ooUqadgfBbPXd^5cDFSmZ53zDwG
z6vTO?n)xsJrAfopm+apRO*~C6WcaRRHjOWNh<h53g7HG0hqpcJ3%{9;dfM@1nBC1Z
z7D_ucs=L(4`(i)KAm!zmmTz^aWxJqjPQN*#F6Ikgy5^wPYCpwSAM6?U>RQwIveU^m
zLRI?3QRtWmK$iVlXmN_pnXgYamtC)T8C_!c=JE35@rp_SdwH?j>bAN)%&wch>N(dE
z^xHKbnq72fb2+wwIqzV(J$`b}hO1TsC+-aBUQThvYVFf}8~3psIK?eSCJZ@uwO
zj9-pu_z`KdoSc?<&VHrlB15oPp(j3EF_l^#Q*e7LezmLc``vddN%KA#Jid$%dD*?+
zzFO8%^o5wNUKaAbH|5E*umF+p^3e5tQL!2p@B3hGHGt78)NcCdyKkA4AGT$9Th6c2
z-tX}hzp5a=>Uh7JY`@xvesv9gPu}>|kNQ2G^K1D1AHLei<NsXBze(*se6`u$pYiIT
z<^SWWT>r25s^|u*JsITO$O=;r9VkqVO5m_+OGNl=Bd-I`C2+{<g(^9LJy#MDWae{?
zteX1FNFSgnip3N~LjC~KZ(%@+`iZ*aWTopnWsz)1G_z(StI8vi%VugMJoFYcMePUB
zFKtJ8JWLN3{%{j0ua~T=pJ))7Za_#xv?XFGJ8F<n`FkK-SNH?eE@Fk*YkD_mGu1R=
z8!->M)yS$iofwq1W7!{m;TgvzpHM52q%(h0?S=o?-Qu`3mTc@3dbTS)m_0Q%E&VEF
zuLP4CJf3<ljm?da60`s30&FW19>ysBA)&0df<eyLw@+K7AT~)h)4Q@=9LS9uw=ish
zAJYx=nf)QDvOe1`KHKq;H+gf|Od3;^R}$~-CkNb1l-*!8yT_t6#$m6YsG7iW4!-|j
zKFI*S?IaKMtVyLC3;?5qw<1u<j`AegN2&S|+h%`Lg9(YojVY>Q>7hQ`!I9}|Iia`q
zS*%dW`F~Sm$SiJ9R;xx<H*#`BV@kLl@X|cnCBjbZ^@Dpk2Sv{g(o=&SR<;oYR!wr^
zz0)`3uahDo(<8=!&XL<Tlys}VsS!TgwLgGoy28THyW!PQXS&!T|FShkggzI(aR+_K
z;vId)X&*6gcrTLeQZUFSHT`<djWdjByT<hMk>R%#SahoYsI;a;++&Uxi9u5inr^X~
zuIz<iju0!U_V<{3$F}>fZ}&fnZo9hakP{uJw-eczj4dST4gf70_o7N~s<r;nZA_0G
z-&1R4xh1ksSKB{8s;54G#%Asmaf>OrBQ+}WW855?`Rn!2c}N^<f9M%+W`E0FUCW(-
zugsc1NY`6$#I~lJp8ktyW4lF8LUu9lbR`Cf#1twVEvUy2Z?J9O+TA%#M@F2mrpBKc
zBZW4e1PI@-VoGxf%#%=ztjz360t<iFER>gSLIfUf<@aX6IuN!3qXse~uo}d@<1fn7
z>We)Y!dgKtE8B7-g__=z^}ajE(GtUm?e*0i`SDU*Dxa#~uEJ!c^*znNwOz&cHD{~O
zo}cc8U-0UxB>cMUkO6b9DikqQc;QLSIoTF0d6#R8zAJGmQNU_a_7fr~hjPdHkNP|%
zk&Rz1fWD9V-?Oc^X~>_;lebY4e&%BFEHKGcW58<4(^UJw=Y93~?A?})<AXmRw<;80
z`5YbKpWc7j*WVGb^ZVD4-sXIFD!+P=@%OvNO#!a=-=*XrycTR{Gz*i?jmK0G{m{Sv
z8SQT__UEf#KQWH<XDQljZw5EZYDPcJb-fNgb#i?8cV}aRj!ppdRX%ibE$ZgL?s2ri
zN!*6}@FZUA0XUIGOtx3Ogz&OANiuq0I!!u5Unbq?(z_IA#k!RX;!k`pI`Hij=p%0H
z%tj)z4Wj!wE|FID5o9dbKsMKmk!50FuGB7@Z)bQQTX4qOK<>`@%TaQ7FZs30-E)nm
zAIKHDfu|s7&Mo{W+iS@1)29SJm?CXAYDD=<+-IZYA4aXE=ff<L^2sQR&+`0e3;o5h
z%r7F=`J$d};e*lTz3-Dn)m|?xJuLF;P^>;<uAPUje5#wTII@rL6I|Xsr&N)xROutt
zMfOs%E$Ha6uz9f7q5SN1_5g(6X}{t$A3w(nmYBc$9z#N5mb|BhODsc8`GU=Uo;Co!
z%&jyjv6LPZYCu*hz!pB|+vt^zE{qvF4=kP*cGj0+kw0X#7YhH?9tO!D>{EM${Gx20
zJ!27%MRoTXgqrFRXD1>2fdhF-KJQu<EXyXWLXuTQQ=^kroZ*fS5S*FC4qi^dbewa=
zNe@Dy)50=wfVZU}?2d|$nS5rc<ZJ#>UXtyRO}CkNoc3g5tvrYCUxzRdtja}tz1b@I
zvzc{DlUa&lpv0EFl&VIErfFKRTsouO6c{Efjy;ApL>%Ngh}#xw4)C`7C|Cs)BLC^l
z6FE=b3EIkTjjLOHqjD^r*gjeRaLH&}Q#31#Z%o4dQ2?i?RnP-n+;XF;8P2v|Ji@9}
z#=l)h+o(HIjWldx^sBjR|IDe3b75w^7T@p_<rjgsd^$%)+)_+FSd}jfisqgH&y{cG
zf;6?iMts=TNsaDNmvj4}|9Ac_Kd*edC2!2H)hAu?)N-xo4^%vJi9GvNW^|L-zy~b0
zd~aRDu`Q~dRr=S?kW?z$A)?0-AX9}Wh8CMwaEl8%@n=BSGm80-G;65bUTYD?XQps1
z{EVn4C{o77#@2o%$1tQZSuIwY%R_-CI@y?_+bPWxRzs8AZcH^fmWGlPdZhWDr<sRa
zq4$W8*a5uMZ$iJp=mPh3PrTTqNFOSiXr}Ci5I>hyZuD6?NA5S!&cYZW_HMc`ZeU5`
z{D`}XWo|lt-3{W$L=viNOgbf0mJ?Ht6KpPJK_y_hZ#Lp3{|2X-jfUi=8&`_`PU|<`
zex75tzXa#59k3<K2)z_Z(QXRiiI~UVt}>QWx|Rrui1ZM7Nk&N0Ka?iRxt!(nt67rP
z7v)q<2`%vG={Kp#GmV|5NuKR=S6`gAG)g4iwP{>NT5SymG*%SUb|Q7X6>=`T$;&3x
zbjwi*sV;T6%<=*Y)F91V&l*t__L-(fGZ?k)aTl2hP8EGoI~FGuP)tiRL#|uesAiqJ
zzgPb~^}?XtSw>nvVH%Hg)Zn^4pZ`ecb<MraknCGh-8`2Sn6VIS#+9_m`?%RuqoxVY
zl-aVP^CH!zuiegOO*U6y*ZR$^0Ar`>u$8YjQ;eIEaxQ2(a!1E1D5ivDhtD?G+TR&>
zh{@$JT6tdmoXl#p?OPq+h8KITpCop7bJF&`jJQ^u(&cxT=~59~`0D6p;H4LCIV7_i
zb=TkapgxyPz1|koUnl!rd>Nc}vG7Ll{y?8oaczq2?xI9ooQfw~*u}HcZX5){x<T`O
zlM?HfMK|He+M{AK6L~ik_C@-nz1rE%dy;B3)>HM|pQn0Dl?!84RfEF(^W!WL{9o&z
zUWrkFyl2(qpA3E)ly7r6sz;_iriR5RyTZY#?@acvqo<m|%;059QhE8)Tq8dXXC1Ok
z+t8_Jm%o%{T=(i0r&;-`GS804IATlMKL@Es`kHx8l?&A+T(j}LbTut+w?${0Rgu*y
zW2L;6D$;AAvN?Taei|=k_-_R-8gu#^^R+uOY0oS&Hyyg^q57sjEE|O^w_Mr$(}iw8
zvt?_ji}y;Fpf>tR9&t<D=hp$`CvQ`Tk0;L$O$v2r8CoEN*5^d8`-*9b;9v>)`skW#
zeKX{1s@5YSvAgb_rLG!;>HF!%Voool)-2T74Y-j0R;=Iu*u9!ofkawY=<U~-X+bo&
zP%v|;Mb~brDO;KArkec$Re8oPWN47Ky8swqfp|YrxF**l*3{UCs~f?F2j7o3ny5E%
zRLGAEzx<w4x|h!nz#mU=P=Iq;-@b=hC@$bt*i^7aS86y5!um%vIJWIm&LrFV6e%7l
z+_cSpEq)DlAK8gvwm$b9qLhY^wxsk!#em>T1B&#UUYDj?^)B+6kYnTnqS9r@z4*_O
zox#nC9FkqdneS!O6<jgqspp(Iul9R#siCN+=QWstnIv&=Egli=o+F!I4y%*0*1N(j
z7&0)AY^(t|9OiQ9tRsYU%2>{{Ndx%_?nwAmOR>p>LY2xzxe79soog<jD1in#P1ZJk
zNQOpuQej3uwrUOYY4M*upd?%o=SHq_7;HiA(C3ET{$|j<_qoUi${9UTdAF5n%H_A2
z_D?4UqzTJ|7Tiuh71}S!Hy*gCB+$>%7=`n}PI-d-K3a)ctMR{5Pnt<_i?a2D?-acQ
z!7jB0qHE?My&FiFD{86Za?S2L$1$--bgKb%=mLA}5kfc?1Jat_&dyt|fUO1@p=C9q
zEeerRC72$4A(<P6X{|`7ocW&~r}-|it6Ehlu*vU_-wvHl6pL?z7*3v2S`@$KaL|}M
zezMDV-H|%3vtSNuBc~AJ<D?f?@IsRg*0#oOTzP#Kk`xVArFoK&qEnjD8X?~5BNbX$
z$~^EBlc_-<f%B@;PpxBNm%ieTyWw2j7A`nrS&$Z-WHQkGLvGNh8LQSw%G#%?CncNo
zkS-1+qAaZ)B=BNzZ0`Y0!2y5-y))6q9f+1lS7K#VlGwAc1)|J**QoQoJ<@5@w(BJQ
zo)W_XJ{1sN))*@<+oO<0r;3bsn^Y3@72FhS@h~`XU(R$+)s#=I48kmJvWp+uO2pOB
zM2xY6It%>S)Gr@E$W3M*FMtRuW9N%S$%0HwaY6%_;abwM8wtlQweX=wgo_Hb#lt9g
zm}z3gYM;bF_vbWL@9D&E%htzm9G`w-qkf`jEc|96PWU1o7-XmRjT(26G$994$dEyY
z6BXe={*l4;*GWQ9xb5dFN)7JH+ayuT2cm^wQA@1iCRH7U?+H%%4@@OvJN8Mapguvu
zW$|wSt!BVPXOh_aOJ6T7*`(n)8Mf-C>tDGf!)A=wCPPRCGKN1g-AatJFx*)<&Ki>b
zIAeH*-Xk)Qzy$~J?c*g2F+y40?CUgkW8x_ptjv_Dt`An1Vyb6}Wr(R&28kWHM4iHJ
zi7cR2Dc<B8QGiU9AXuo8u{!|nx8JbBS=M%&7i>3ioFX`R$IlAynbaMK()%Q7E`aVP
z?xh{xPASQ{$+Pzt6L=RZ=_zjaK2dC>M+44y9sqolM06zpoJBl7wai0FbX)`)-DKt)
z`Nm%f(4!>kxRwcCc<hK=KCAl}-MC<jH054_8M<HN_F2CCP*%4C#G$k-A|W;CmdG)H
zN2BD_xroh!7}$6sM`b?jWWmmK=3F?9g^vX-;W}w0BU1oOMPaS#Q&b2RT1s?~b7iJ#
zO|fU83~e9pa~aR~t-I6hGOn}ShW$RSw9@9YlwaL<p~&*aeW3Qkp;sup0g5K5zzM4{
z6PHB<gR4>F7C5eM?LAl3v@`r>Kco||u6JF>4oG^5574%5xY7i}QbI&1&Cs5NCg2nS
z-*8!9sLK`T!URe!iB}ib{lyeL^1-GPFE{nc2t_pxCshO_D;gs|DVmD!W7S-6;z>Xp
z3ShWN{Qbu@+`Puv*89dG4J!Nj696EX)$MSIS1L@9E_6acA1Ax7oF1(lm@)nQ8uay2
z*(edHUhnZz2Pa8b)+neR`mm&cx^r=;20iYBYxcqIQZI)B!Lsz8e=`c%Z$RQ!KKy4^
zY@n5r?m$sZDKIOEW1MyPhKGFTXNg0+yV7?;!2Gq?VUN0rZ*oa012}_CA{s^1`Nqig
zz-l&_y}L12rjohy#aB(g`+1F*TIA&#+Xrav+I(Cs?(^KEI;3G?V&(c`?fYU)lO!}8
z{zXLou?!qkZX2d#s>;q+lc=PxidApxf$EE0xI3wLNaOFBHz`0sOC)R?{BWh!xEk-7
zxANdNAmt1|&$K(1x!1^&ng5%jjAb_*Q;rTN!DOl0zrAn)MA@3}>Pe(xa3<+ZPjyON
z&6TsYYNjIxG!4fRu1cyx7H&9QSuhJDlU;*L`q_3!mxxNlbFe0pGajQsc+LXX+oK*)
z*;rg9GqgEjB>nN5ZGZBpKrRxbPAEZ-ck>YB@|f#w0+d_7=eEu+KXYf+GsePdKA)Sy
z@*<N6Rf$|BKNTFs3%?UCQ;|=li!(++T_1WZ@&KY_GjUHzhZ04$$F=Bs-{LpERy{zi
z0o$5QV$(NT`+_entLg#L^idy>zuw%q*~*`<t~c~&O}u}l`S|+|+f#6$=nCF4w&$1K
zS}31<Rh6orG5qg5$Ta=J&;se~+-zMU%%uK_p*Buv7pUi{_*AH_OQvj;C4c6C*08ts
zjP=RsPTEGAeNic%uQLa|@=(Q=aT~f{9n<XxWlaq(K0y<HlBP^QzX3rBiH6e^XoUr^
zs08c~FAIJA3fZ$-_51Xw|7+%C&P_MPg`bA^m)O%Db-6QB^5mardgWv@Z6>b&J|yX=
zu7iu1^mg$=+KD|U%AdUweWa;<H|z6NbGdAR>H|zBBHiqjiH3!km$kIOWW~$ez%L6u
z!^uxhmsa5BY4@t+VopGY&498YP}ppbvGF+Pfy#Kts<}#5PuuD#&rw0kM3YV5huOV?
zyLb@(R~g8)?R~BPr0FVh%^dejFrd*Sl3T_n=pz!O<Ea$Vl!~qop4}sT+@}Ul&Stog
zIJ20LNzc&r75az3*VzfuZPmu>^aPHTV2Ho>(`*dqNVW0%1g=shV~GX<<sjJ}xPt_z
zXaGP#!Bnc|lU$OG@c0mJ*4m_*DzrJO@8Vx$sbr^c#+H)EQHnu0O0*1OIGF+@2bcsN
zxu8%X3?EsdB0>6d1G@8pgElj`jgq<Wb1j>~quu?I``Hix0NY3ysv>f9E+H&5W0W)z
z5JmoXtjMecj&+L2nI`W39{yk;GPr*9Hc>H*3g)J=I{*ZmON_Qd;G|j({q=L)BuN3P
z)Oym<Z&R`zZA@eRL^sGD)M$4xa8izX%5jJNwW$fl)jra}#8IpHO^8??6wIBRRWK*?
ze)Y6$uC3*)P<i^*HF}Q`I=SZqO;Dv2x3XT8v2!MP`qEPceb#ph<Q0>n7dw-t=*=RZ
z=ef4KKrEt{Pc_Nsv76m55+Uj{<Awd#XgOz|E0QTNSa+EOGKqVS%5MwQuPhmwr1jR4
z40mZSdcWB=xQQo9pE3Rl4**QGNv*rh0pdYgm7j2(v@e!86F5m{ni&>6H(wGWuKmZ+
z5_hf@;LrR;XcH@3!`KgDxgD^a0^fp0NavOPLySfF+L(qj6w?QI1OCkOH~`ew6Y7UP
zUzNcUs=7bE4!xSFD2>1>jpJ!^K2c&CCfzHFv_wu2%{3cyMW|QHd`bPijPf=Orz>0a
z8b6_AYHUnL#kD;Y;KJd3v@U-#MHi52<ycHgUIy*r^%8CdQ#^dsIaJr5py5~-dC*-y
zU!~7iaS7hsvJ&b8pP@`GXa%j)Ef|M002NDLAqT}X3f_-TaDffTc*Dd>p$uH3GtQV(
z-a+Zso0f=Mt&X-6?q^k8u7~5Y>XWOw`!6qKN`?h1gF>{zaE%gw&6!pBd#gJ7)K&aS
z4{41;{<w<~{%<l(P{g0FGtriSu|z$RUYqZEEN&L0`ku*Tm&&fcJfx{|aR0heth&i&
zV+?1jVJTDKI_<^V2&MOb;~-|Awnx-0RX<FTmfVMV3(^xvJ@EZuUWv$?>TM*tKKX~K
z=>i>OvYz0cLyeuHsDIp6t$3_b%%tkQkK-b~RRjsPF@eXs(~s~%6r6HbXg^;v7YxA7
zf14FiAruyp00Rs(_6f-{)+9fc<=S%C+8=yvcSx9ddZUbsX%GLS=aEISNzTswtl7r-
zA0vzH<xB0tqP@dsu<hU3WXJ%R3$_|*XXF`;^E9kJ0#^HXRNsoOi8!qBKdf%0RplSn
z-ZQLw(Sg<{X*D0#J?nV#?yx>Hy0$vH`cp>@t)o8E@Y#l8!`F^F;a82~ud0qZ8j24a
zfiW*&Mm1=o7YL&|<(NjgVY9~(BWv&l;;5-2+KAGj75nPR$Bt&wtLFTpmrgPD_vlCM
zuVPxmVp`N+b>w&O&fo=AL>od#rZE;KZ5s2D2^6+ObYlV~hKX|@50~g<i%mqMI-&a{
zVN|D9J&+bdM6&~E&uH=tCS1IeB7fWs>!jh2X^>bdtaCssb`TcZbNZO-blmHG+!t|7
zz12CSY&`s^lVWlFwmNp;r}5xUCtIg+uk$h0qq7fY+#h2+j_4fcj2-@KJhl`&p40iB
z|Mf(_@g!&G<j2l;B;)rUaWwybgC3pJF$w7D*eR{!p|ID3v`)%1lGe!aB<Jz0(d$nZ
zuRrAc8}0u$@#)kwy>q%N?$fK|8T9Mf7jZKir)GwY7l&W7jlZ6U#m>>`olDLqytyCB
ze<V?=DdLqtNF~$i4#v=!c{Tq8QHfuxrU+Eh#GBtJ8{>bbo(MFbXqCpVrJk(ZJ6UZ#
zS*tdIlwu7jjQ+F)cqN{HlW9i}YZ%MCqeYibi{It%f}5ftBPM(DXfXm^3v+8%p1!R|
z-|?XDdZ4$&(c8+mc8$>cHt0WEU4J~f_EK*dhTqz~Mc;dYKIlS2n0l(ijoG&``8=##
zQi+o~iqo=RsuPVt_Qnc6<xjl%Mazr!ZQZdcJRCSKt44P!iNnG^OJC#K;5`<d%eJY{
z=e3+9-bJbC=fi2~NJg!5AF9wxRJ!i<S)u7if4;fZHi{#Ru1LLux_nYl$h=+=PM~gE
z{!I%2-}bGpjLE;?J*&4`Re4G|Lgms6pHq>We}#hyjFSlK#)^cv_hyRf-8>cv^&HGs
zbZUte4fA?iY!Kn~S<lsHqQdH)Zk*T+zYk9?wch+Eb~9k+h406fIPr*}FR!BhrhNGr
z7Q8@97e1}>wm4*YxJWPJB(_P*=}oOuYrJI4&0n9|BmSP8k_=v18oc*c<=K$I&d-_F
z2>RTk@Xejoj}f0f;yKj6yYE;|yd!yAYxR>_Ok;pueB<*QElI40V{h2yN*r{z=3hZ+
ze|Q)<Ks=|8p*=mA3UUu$AbvbkkFbeRnGV>8+-71^32vr~ocl%vst1QTkTJH$yp|l*
zn=(Bzw~hG*W$(D~HS&^T`GzK-C8KvF-p$k|3G|#jlP2(xw<m><uqpRI7$C6uRA3I3
ziUHy?b8W*2?8GkZkGB2yI+Ea84=@Bvw~WBaneVFVXA_8O(uYY4sv=bgZ5HYK4%$Q3
zs<&?s+NvWEjHYWV`*#jzk}oyn)lc2PfhHnptdOKdaD8~^CM8Ajp<-D&#z$ML&pURj
zH2o6H_k}rRzoeVw70-RwEa@z}scjf&D}l{Z@WD;6C-3r|%dXE<9h@C|C7raTlHh`0
zdL-PKb3+F_s=*PH5AIz#V<#tk^*40=Ns{9Jr|-FRMQe8K1rNMG5-M%%Q1Hpy-Q^|5
z-HfEA?O7ZpLRF0a^IQ}V#b~;LwD6XLbn(+d=A?6t(vs3E+7=_R*Rm(Oqkjta@$T^C
z_I-aCr#8u{=PlLIp(twGFCiol@RERyGZ4L;axR{AM*20>bWxAnd;l0$x3{>aWU$v;
zf;u=CDK2G=G5nsw>we&&>w&x<1ol5Ea<qy+@R#yu`q?k!wJB8+{OFT`#8%JGD<!Rp
z7BOCKSI@3QU%;Zb;N;=Aevy2Tag6^(G5OIg?qtZ?ahU2`gWX*8+vgf&=*5RZ?geA9
zM{gAGZ!(?fi(}jP-K`afC<z_PP2#86a#-ZiL(+blomzPO$VAJV*$vRO{!;Jf-{05p
z<kJ(K?9w2KxLS$T3lP<rF0HpSaSMS>tc}kEI-$G&7+rLo=S3W_(O~J)^IEJgU*V<e
z;$C-u8NiJ{o{NGce&mq)Lr!AX9O#BETh3kGC+E1V+v)$PNi<fth~w8Zcbc^s25$&r
zh2NOR*QC4ojY!u_zb9+!3UKpSRNy~=+`(dsfX7!Zntm~+am&9iU<Dx3qo!pfXft?S
zhJT@a(kr@eMHIh?<x!94&HCn3#yhx=b7CI{N<%G0XY`Ae4mL6@I#OlRQn~!YN&F=%
z77_>379$EHK!X)`5suYfjTYYAtWT_TB?swJQ<FTM8AKi|Q#Lb3pjv36;u|uK)zVCW
zufTnma!0ARDp0#ZG~n#A(xn+|r#F0epBG%?K4W0xJjZwMh4D3|uo;`HbD{UT1iqtO
zFWI<{hHCe_Ttm4XRCur3@E-cJ$=_kmV3a)W&y?KjK8qS~;L~LLmgWV0^iAX6?Jz^E
z=8x|2OQYoHFEFd1NyAf(*%q6ahdW%Cx)xXMCI0k2+)tV`r1@qIKCmgyTxF9#?kkMn
z#A_Xnr+Vp!fDB{>D$1C@=^2Q<J$#vF>SF~k$O5o<q@BxzKPFpR`JH9RV5Tant5&Dh
z0IIzLDypXx4MH8zWly!MwVtlp+0bRr-P>kFWNEJ1TN$=nc{QUJ;56RyfkHJ)BBUrc
zNme^7M_EEz*nykN_$H+?s+pK`X*WU70Br4{P+l#G@J^B{Gi%8cXc#QNY_fXp<KdS-
zPeZ;uNjmmBNBMrfA@;#(w^yQll)Yt9!y>51%;9to-&8~PTmJ;v%$Y8sJi)k-l#6U0
z8Hkc8*V|b03mO%WG`|!v3qrS%C1;NG0D<esa?<$wIE$(6`;6%$Pv=j5S!yzz4jEsv
zm5&AAN^rH3`{dX{e;i7FzfWr)m#Yk~ed6-VMekMFw+6c>KP5L=&%R1>OcJlMQQe4-
z0RLpa9-d<}_t*VL=h(mR(VvvZ=?5sMH!EMBv0cQ>QjT##w)(1p=Z9w*(@l^TrUo5Z
zV%ph#yvP)p1r|z$Sas5Pv&SvaE!MZYB1L*+;!!dZ09>ETBD)tVSnMoS)`A_8UDK!-
z618sTvD>Wv_c71aDL<~N(B1xh-lpqmBVfdi{vdYGKL3&JXN4HT;OnyOT!S@MRl__Z
z=N3)!bK~Vf!J^@>yP^Lmost@e_G%&uMTidpX<C*^WnWSygko9!_Nf9QZxU5Jv8=Z&
zap1K1B*eDc50`J!<5ME0rT->;7`aU2C2*R$Z0?J`U5`5PBtP!=3y?^H3}43|3p5Iw
z3CSf=Pl7e(LGq{8ztCUyTc#)*%(*}L$v*JRdE}2UaM&O7az>BR0E<bz{V{k?Z07Zu
z7Q3QT>+blYkBsKl7Y`mV$K1VV_)e(hWyI~kpJ}gV+j;6+fp@QcDmD5zp|V+Wuyx+A
zp1Cb+X6Nece5#8J^V55Ksg95bA3{+T6JIt{Rom7e=Nt?dIPZbbHETI8ksTT<4#9Yh
zjvU^7phQ2^0_O57$HW%FJ-q@&7m}&T5!k4auqz9*6T(3daj?m4-Jrss0LNqf*Lq_H
zQ4#UQ59uyldTdMMIlqc4fUc`HAKTyMChwN&9aVboUBCYD;ckuAmya&b4BuDSpAGf-
z^5yyJ;fGw6S%YF-2>m27kOX+aV)bp2Bv7rY#ih#O%v3dTt9}2f)X6=H^Jm^=pLUwY
zT%n7^0{GrY4Oaq`>lT5Ty)K^F#Qe+>Phc7MltQY?Hq&RGc!$Ui>xh}IK`^|SCg^+h
zw({sYphfx1pE%;{_4D|c<IgAG+cz$+-&i_&!}RD=_t&^B|D4$RXHf;68*w|AAm+>b
zXuZDHxIa`Mu9f_}gRY$D(~rO(q80RC=FGIBamT_Dxmb~nHs+CkJo^atxp&FWcK`7{
z%aJXmiDj2=iIE`L6sqMD9`gnD$@%wH(xwa>t%Hfg^DDhBBiO6=pe?7;9&Ew1Y&uyc
zddLjc4t}Li?xdTbK&J>GtHvYSaiG74+Sy>1OXK}6o7L_JRx>hdx*e~{AezFh`;Y@v
z8_1?dmN498bwjY7Z)D#ZV#|M`n}h=OtFD#T9%~Nqf*dr-fbC!v*erpwfr(coo1<Y~
zIB$OZ<hS}Rk<L1{Fw_W}hSHDA$_EG&G6>ikYwj{7zQY7?8&N27L4*MV>?xT3cH>;5
zW^Y>NB(cRz)^l|Eyy%qGeORkrg(;EY%|bq3IZNZ?l;zi%$kcz%_m_oVtMSlMgWXO;
zz>K%{FfoQu@uLv>@uq{|)g}JZ6N0bPM%=e_yh1?!xu3F#6w4<Pp2}mWigQeeuSy8m
z!wDE2X{X7|$i~fSmH`wOl3-+jmP&e}REY2gWwug+WK-{#x=MABqJ&(C#4s=WX`m#~
zN(8~%FfbwEjF9>eBH3Fjxsj{09U@gcegyWEoP%?mu4v3wlK43xImV0L4UuHie8V-V
z!^g*WCtKtPcir|pyTV%ydrn#WSy_ubS(`~&vrtV8b@Y4Cs0so$2S9q9MSAlg4azu!
z>*WH2V4PN&-<hR9bc>$FNJngEM)T>6cMB$lDx{w+2pE#L11jFxmiaiLa7$A$IaJAY
zYcO``l?w0bg&c(^d`d(<<)S85GY+sFP5Bm=O8fQ18pW1|1Ub<q*`JeY8+@{g72Ndf
z(gk*JSS1n9M}rEIk`yY&2ADMX&uIwfbG2Yv_Q<Gltmedm#&0)Gxo20xCspE9o}DEe
z@O+cj3wvd_qlNdl%50^r^Q79C|HxKL`&>So(+lklgrr*-KXDyBo8`Azp<1;4{G!$)
zd##dyFo6&)$#DKlhvj-Yo2mxBbuIzHb6Be1FYj**H?)-9Pg<h~%PIsE@=Gv~Ao8Q~
zQNO872k<AdfKvyUg`qO;1_Egaz}rCKT6BB4U&^Ug=B=%z^R+IM;trmJH%;;i{+&RN
z@i>44LP1&jQJZM~aExd(c54j_)W*FI!oA+eXWHd<!Lq)X)DtYj2^L`J@&(hM33&eZ
zcr&Q!lV=8st6N-l(QCHg@5EqDHxAZ!sJ46!@H_o|qA}-^l+cFy07Xcazq|!5{2Op`
z?8akDgw47A_QawCQ_z7gDmQ`rUrNo6!d5W3Hg@5!-h|t{a@2mY%Qq-(+x!0cKmdsI
zy~>1u?b}`3FU^8xTV_X=us0b?N#4+G0?#JWU{jhOx+F5m#L@8%W=;g7u&sM#yblRn
zZB!VSG`Ea2isuH`Vd>fSGDuUx**hMVKoXaJkW|Y&wQUXDZH=l4N1sZt19IBCox3pO
z*g5Za;fUWUP^VzN?s?>SoiH7pI30Kd>hyu79K<1Vm#QJ(c!hrG2HBfek1aq&ma%Y^
z@pps?_$3I}P@qaT*c*w$Jyci~6`I0?suy&A6~^XJ3Rz=vHM?W^kI1FAAiU@Gb%;8?
zmc@U6;`~#A3&isTwz~w*DFQ^uEoS}VGao5|EKNlP3HxE@A7+B!^BO6oyvIZfVglG4
zaOI!0pe+UZZCO20`pQ3mht6Hst~=raAN0)yQ3Fhj<WS*b%D;wr^$sFe2gRJecvVY_
zz<<Ff^{!9mluypxKSEO(P@?+jf#!}<Q46yVA|4=xKO!CHSSJYrh8ybHM6fvq@Q>;V
zsPOx@;P=msO#&+6(xOjju{7Y393O%ex<Q#pu<xbn^jmkYGzj<}O<ku81p`~LcP^x7
z=W-+#M1P-W?}NHlmVv7-Xe2Q4zsIt6gmLu|J}8`DK9=TNyb(ahg(}{2{ctxhoff$I
z^7Lbh>;C-4;)1#?K!6E<{YUb3mX9~D3rB=GMF>u*H(P}~_>lA+3(jVeH<J@@PLPxU
z3fVHTh?N;_Ewo%_3j2v+^~11QtBIJGvXoO{cZFHF+``Y_G_a4Tv-iIqiUp4(aQ!AO
zW3KZ=Pr<zOT>T;<etwMK5WbaqH`p#sG@HN~{ywRV%;6H@*fgO5|Etawd6^q88SXD&
zKV|S+n&USyk#k9o&MGMjvD}~v)Cu_P2q)n$CebYl_5ZfwN3Hcc5+aurIG68Q?YTj;
zeGNPb>|_cH?vKHnM(&&Y8u4zapO_+j^?a-f(=w;ia@y8yMevcst>r>m0SoLd(;542
zb;g=jn^;aufZ=<hi}R%Zif}rOfv>iu-4VeDjc9GVMG9u;3`uijC)`#Bikb!*MD}Ig
zV$B-7nDe(VC-7sII%w(yCvs6xOUe4uGfSc42vPY8@fHHlN~FHYayFZM&e3$9x@bQ4
zUd~t2vSu2iGP{97NX_X_9i|}yr(h**8j%+aEU}z5H}U|w`QAl${fnIR4o+dl#B8y<
z#%-D>@9!NAJfW=3%hH~FJ}p%GB2o*%PlxK?MNi+YxOBfd3KnvJ3nhwn05s(h?vDw%
zii$0T36R7#jd~)4A*se=VaEwnTflb|5azjG6jzm3JM(Zu^ih<s>mneEy-l-;Tym5K
zE4;voz%T7nZv0qa0{+pQ#&R}?J>05#xKmWFe82qZ0dD@UW*^htBOfVQfb8Ron%i#B
zf&4O656HTH`Br3_>g?mIhL1Gv8|zD_{a9d!MriT?%4=68Pr|Rr0eQa@csi&8-?1VM
zgkott(dqtUw^;_JdjDFqu}?HAk5{XS%7dzt*vC{TBW|kF1P<X(itgt*i`9*ZJ^gdB
zPK(4(2Jm)MAug>F7&j<#6h_}Kg6K=b^xXslh>*5i(H1ajec)O91grx)(IKY6R9K%(
zYaSugii_WWcfU#bDD9(|7FRH5O9E{U3s#e6+MzzV+b{H+$e1dGN~v2P38U<dUgjjg
zhOpoys(}6FrWriUF_P)JbDFAn`Y;6`QObp}f=E#S1*K#)1|c&q-fh{gPHDX@@<JWK
zF-N4a|KeMlf-wffD+~D-8B8<9T(RLL)wxqgRk-xx9Zs4gC83oY0XuZmG(KX_JA7?%
zt-K;8;tpdDjKYSg<vMg`0b4OKVVF{mGLdBz7ED)qWQS_S@;+hL(~YOQZep7%6i{6E
zugrWoo4yjvO!t4!yUnx_x=_pyjM|7nbzm#2x0=5>_u}Qc#3dpQK6L>)DQqQVumn@-
zQ6{FeOSGiVY@e!(=$7w%w@pO+SP)@hE7$F$4IZhNey$m0Djy;~haiL;XER@6PXX<O
z#MUI4-wq$Z$A4o*2)`uv6r}V4ye0C%tYs3cfIc=v?qkX$50}2T(E}SF`{=L8L-2kM
z<ADd%%s0gT<j%33)&a$(0ggb421Y`V8)rFt+%u-J+RrpL?jCwMO>P0)P|9t8{N|FH
za5tcT^7uws0f)V0e*l%M5K}Wjgmq8^$V85PBBTWlnKpaHyL9@g%h<2vG2ytbBk^$#
zt8qF2(@#^Fpiwe+;S;wXOvFT-+T{DRHL0;ql|s(s+O4a1Fp2J#(Yhp27bQ^j(j1#X
zoFk%CRyPTrBGkT{`mMO>BF{e8E%E!spuZ1hIabF)N@h4-Q(%-#wbCx`<F6a76LO5H
zx)WJRgpkTq<_=b<g~A1|8w&v3QI%Sft`qmPCEpR)7{_)8QiWQgHNG!Aso$T=m;I`<
zCA3I^cwvFXZu~g61**b4$EtWYVVt9uiSG(i0aiTHWx-%gyxHwXPRqhOmQ%m?rF@>i
zDoe{+;2g(ZYff+1HZFtr*dKWRZ1}nG?c9|)&I)n+Ov9^ER_-QzFBgQs*dOg1;`BUe
zQBaF$9`WnW-?1*~4XUN^8zyGfhh&iiAUo3xOB_?8an|w4?=DMWFj3_G8=preu71+P
zT42eJQVq%a@e}tQBN%F*=^cx_Fr$%wpj3S5%ChLvR?ov<pWaLtX^O(#eh-$3;@tSd
z%i3SM3Bld|zQhU#EeOCDgz^@I!pr#VvEq5yzc;9v<f{iok0fHd_>=&LZ#4yQWn#Gf
zv6tAtR7>%C_zKMu08U^A8~+Eo^1uOkCz+I6{5@AU6d(DhqW3gFi_&u%7%@LU_ah1s
z#3^Q+hAQh$<`OrIW!EV0Nf%&?-o&U?^xc*)iauta^k8f#HFZfK_DQ;otNd!|=l1~<
zqL>7wFPHJv(9&~naR4Q&-(I5+KIpdBi)#AzU+;hm-oFzd)R@%~?(2W(SlnW!TpWjB
ztDmg$biya!f9YE{`5(S|t%IGf@yUzei|_=*OgZjt^IW27HB*A%3;PGEEbBsS?2<?(
zGKGqRFs3e<J~gLRUwIQR{b2I$nNPK5j|bM2xUBAd`tU#as!_}OjFkF?P6oajbiRXu
zuS#yEZ7%d=ileh#7E2JZ2}ZXV`0DOwVc&OB9J^j+*73M6+hKmPm7a#gw}xFv0S!y?
zo7<lYLM|NsA-_p=@^y83%UBfsRsHrQUL_gFDjK4KV+^ze(_ap#Ce&~Bih3t)-?<^w
z^q5o91)w=Bb9EQa%%+byTMF|4ER`{ndY|`+`X7V1*d!7h%mE+_fhsJ+(BSPegDqu5
zkw}t^%piH^tzw8{)4b(Xrt){W!uD3z?p(NXa6j-};NW9yjODv)h3;zFqo+KC!pDRx
zf<wKEgWk+syK%82+10$d9y^O{O<J_j(zwmW5&Jb(ixch{$jo8zHcjwR*(^Ld12*VL
zf(3T;EcC0E#zhRPCOanAR(%b4c~<9ZK;jRXkb>=ZiA;&Q-gjmjFW**6US~<;gQk%`
zUK#SyT2Z-L(}uH77HAqoe#NkM>oGGy6WBwHp-gNEj&!Zz>f(Q5^=02ySkiTqvyrPR
zX*GiW9cvB4YR;FtIn>Q)>%7-r?-@Gr@LRBlUGF+M`I%GlE8fxD;mi4aTg}`x9J~~h
zoByjUT@4KDNwze$sj4RDDg*{Uc%J6eI^|iXrkQLzioBzppIb*RXtGLu_^`=Jp^-;L
z{Bb6^Vnik$RHytb=Vr--DvhUQK;=#$3+%<WaEAoX7bpx9+oplOaJhI?v@D7#&qKL9
zeYQ?))a%jhmgEiQkrwp7fp<4Qhw{sg@Y)t=Ma)GXA%kbX3gP->Jd>MPtIi&5CBs5o
zZ1c={Ax~FioH3IlOKE(-G-3$!LD<#YIp!@f&k;J#Ugx2=wY@?jWT?8Tr_ea;t=`e=
zS-n_Y4}UpXMJkb9pne<=QL2ZUJ6QOS12?H%nCy2}eIY}790C-o47kDV12UQGQ1Ij9
zC$eJjR+P2wukVj?Of392-o_vOw&@?_buK)J|F_5gK4SK(Hqch{sxOes6$-pKIBuqS
zynEa4v#t0Q=~Uf1qU?#Hha-0^oax3wZN^)qhe}5w&^J_;r-4eMY|=y*OEdjc+`0Xk
zPLnjxfr}rHsmjUHL`}}8sV1;9GyeS;;aJ4db*P1D5(X+4Op-0Zi6#@eg~F2%n)9Zy
zShq5^+bt>Q9Je_AMQoZVd$pn&Az46Y#{5%XPd2_J<hJu7jdzyPr@y9p%d0p!iP1#L
z{^d+g<az~+-qx=kOXPBzPGofhrmLc)IjqRtLSR`Ii#%*@R)MTs{-&iOYBD`L{F`6{
z#!xe{$H$Z0%`4W<a!zW2wcb-M<V|C;Y<<(6r^emFLGTh=zSKK+!ev#2S4|nqpY#ml
zWdxeT2IFX1FcR=Rc|@UKRTTi6sILmzok&LLci;cqDJ&Tx1pby5R`N~4TiT117Fw5I
zaycAnVgGzIawzQKA}GmdBmMM8%!}et15n{U$9QTd{%Q+*4YqgpEfD|};R>w5!@v`1
z*5Tz`*NOs~a~ren_a}({s<EJ>!IMdEe?JuY<HK|$JXuf|{#eCT5wyect}w;(5!=&R
zy9zw_LOAfs0O6h8&wCC<qrpWu)w(k|8IEz$^VOrPZ0CxUG7*+;QrFk|guc(etNyK8
zWA&@fsS7;S*pgXw`L-p}{mfJ`52Hpn-(TE;`OrMdi*SGX#C0R%V`qndZRqRUdX({x
zq-`3Pg-8<mcW#cxmnAUqt+>-4@XUbq&8D}q{vN`i?A2H9KH5P&R*84Jt#OG2IZR8{
z@#MWsWXB6deo`rsvYDA4y4lj)n|IAM^V6f7czst?Z{au<WYU8WK3Pe`>~Cepj7YZz
zB?bmQ;{38=EiBu5O%0pkM*rfohmgvK+J}7(&%y5Bgtx$hZt_}xT&;_Ey?#6B#u#Tx
zSjoNHhvek@mEh{waO{hbi^*O;hUI>=L{LC#n`gcjf4S(%ObHQSb(>hIG8pKFoM3uR
zRie_2QTmisoyJr&mwTbibjSW?U*RMrlN;SH_B4(k-S@<uCpEH9yCLMzTw-Y@%N^us
zX_o!NyekP*B!fQ*!Gi*pWR;@^o2VLLGsG!1DxTGR&&lMh5m^n6m%bc7aEEhpSqauo
zvsHUhG&Uk8|3e67!_KeThl0W&J(B&<ox%=)MWVnAJmv!X!wJtH8WmCFNowI1?@OGG
zj>Bx?e3A_J+|tD8TuI`-EBMklkK0%-ndXIk7OmsWOd6QPwGnB79%ua2JMr)qLLYqS
zxv%4s%kX7OM%;cJ<PsN-Z@I0%#wKpf86x|xc#lo9-i^~Fpnb?vxB0~*JA&!b-TRZJ
z-^0x(5;gR1u!9y-9;-hnjzLKaw-dTg#Y-paPA77#G$xA{qEZb?m!ziPH2Z(lRMl@p
zjx-U_>tCwSXz%Dc(lStMgu)d;bDpEWX>A(}46-Na3tI#~$u0g5Up;Q0oU7N1UbwAP
zlKv_GM7QmFegJWkD%3TNb9efkgXXW~{`;M#9)2o&W3mK3Md-FKqF%i9jVP)ywu8C(
zJEvgj6J4leyb;YPnZZ0_mmHrNdK$f%u@wL`x+j`(q84&A1`yo%!oI=lG!83vQ@)b@
zWVg)WXF-K!aLXTfg8;Y8(3Ru46HKbW-9WG@<6CMxIvUw{u=g@7k-rH#;8<km^~5HA
zJHPkP%L@BUmk1Q{{%EKF{a%&5_@40hJqzQ?dB-^R%HI)VM{~e8$$gw4QO|KUg}rOh
z?~m|*PB4c*Hh81^j7-)H9vUv^<ir+Tj(@TJ>-Zm(3PNUGsq>_0!W!T#<$q1u_Jdx}
zIgQ0-KrBQKeQ3N;BKyo$^wB(BZTIm8WZ`IOOE@QXdn4yoh1%Bx=uH1DNoL4vDu-$x
z-Q|!H6XYEd-51l5d(o#Ufz>VHfp_eI1yRt_=&03gk;45(gH?^d3@#&r01yO|UVBLJ
zl-X&;n#3(ol+a3|`hcy-03pSJtxFmLD}-uagv!;3li)FJFB7o}NqrNED4!&YNMda7
zEk-ix4HWDD@~1bLcswvH@4p4QkXer~oSg|Aju=j64KO3WuH*+qZ#popH2G*e>9k04
zGnv&F11;PHonC>sGA{oBH1nmO%}VN|2GLR>jl?dlsejc24%AElSq7&d9DvhRJd5MZ
zHz=G4R5FsxV$=eeATaj_b5Y??9|dThW%}K;w2XnYMGWHrXfvD+Y<6JFyTDdhlg_=x
zIs7NJeMLfL9?*wL>tfGxbmx+yFn3&p8j55f2saB+$(P{JyBFEARv<_w$Rdi_w~<(u
zMmlj|8(o3iU4aZJK#wRH%vct}4~PPVdqM&FegzsuxYDPP(<%*;qJXJsIS1_G_45E6
zDu-D*yIcW^M}g0>-@XlpD$MhoFj8L$%)vKPK3S4kt?U+8Am8+%n9@`o3g?Xk@@gBI
zn-}8b0HOQj@t(;ED$P+I%=2Ghm4dP(4Zx>^b9t?xA!!gx6!YeMF2^d*VnQ;a5u&RI
z)vwJ5=;!N1<u0#4Zj)L5QMi%gkW(Cakg{<3bow1mB3O!vMRoPg)plNkc|Z*zZ`*-!
zIhi-%<dXz$H579p9QY1%$F~Tq8GQFE5`q|K4xPSxUG$!J<XzwP0@Vcab|VnEdH3^v
zZsGwnurc5gM-l4;j})1i;9I2Xn<kEg&@G_<Pz7KriEW{X^?4D;nfq;Lc$~%)atH4-
zpUH8JDtgY5rM}AYRMf7j(XM6i{wSvCjY4r(dXn%0SBIj-2aA&2RTdYHlHr3y_e;h7
zgXUkxSvc4q(DjR?O7li)AN;Lm7oOnxFlZjY_E3JXSh1A-Q~JaF{v0V($x@X0VIvD@
z<za^iyKwG<)$~W>dwCuPkNm?E|0(ADS)~IEf^!ahOMSe!+y@^qMVp%pl=cl27jUq!
zM3)L)_UL0`5vD$bM4QJBl(kRuFe{a1P{4A2<?;-CwXR%wsGL#!R|i*UC{<`#SLpav
z=rQosx(cJAic@P9XmBOAqk>V^4I(p(9hShN(XBO=@HLh{HDza%9-p&*eBSS|Q^w;<
zb&s8g9=onRz6!2#Q>yZ?uDa$|<(*OGTUX^jR3%JhzOwniF4}xkp&Fh6KCJ|bs;iC}
zs*YQ$j*jLvhS!j+|HD^}gL!ZL559U!tR@v)n|#0KHUnQBs?HIsEi$aVJ5-yQQClQd
zTRdA^0j`l^sw-8htE{WTLFvp=P-flWx)d-__zd%ty1J)_b<Z!?yjTOg9ICxC&q5r3
zcq7^zaVf87wo-VDYn4*}cCCKwu)cv@1P$RG_j~%$@F~xkryqx&zP<mH^ZC;+vroTf
zK!=nXJ}W)7)<^y#mnb&Y|Cp^`UCa47+pqzCwhDhXaQ}i+?K8+w=I`idqxYX(=W77`
ze7a_cWbtoY#WZlZHE<5suNorhe*cNAf!z%Sm!5x#e!g4x{O|1Ze?yMhtKy!G_y1@?
z%;lR-@}4vKKTl_rOSf2|#XM;ljVop^MrIq?vCpC6P0o`|;>r!^pU>5XpQDbD*q8>>
zS4}#1?#ny#W>c<j51Q<t=xnYD?2zf^KjqDvL(T4dWm^7?x<>WhGB33KUx+wAV?BB~
zIq}javw3s7Woov?RkL;ca;r0^LtCwQH@W!l68mv^tIDeuym;#-UkkvdB{;9mL%Ad<
zv~?xA%}lvD(x^R{ubnrho$TCp_frnZ`9fd1cplX6r1A38$B=e7XU|97N``fs5Fr$C
z`66qFdtUoiNBi~3w#AONw3wE^v#&~yo~InO7k+9FFMeee(|O;ybC0h*%K6n7*$3|p
zcmtt4%Ly(+a?lM1bV@!SNQ2nULzW5L8%*F?3zt5@*99?8$BmG$VxCfezLJ8sbRM;Z
zzUrK~-`P^!HDdHE$%x*0a-<&i^UY6xyTvH+Gz@E#(-n|3N35`(^EhkSHO@dv%mRxC
zYe4IPGiBrG)s#}#7IPOowreZ&m87xc*sHF6qfP}0r0dUaG25$KGpTJ8SLxTlBb1`3
zcQ=7$SB+F?6IhC}ao3-p_0lfth}a&vk(Uy-J?ojT-VW<x#cAp;&(2Hqc!vk)jeA2w
z+(a+9eF<iH)o0Sg1dey$=|{Q=-0c<r+<n@mXDp*<ue?WRxMwt`^Wu6-@{|4x5|8Ph
zbVZ+(C4BB<y8&qlX0gD$6eRK_4$CbwQQt^&y1ESDVta#Cx*3gSe>J;{1G;0g2EB2;
zWh32ZCG-+)2kr#W9ab78W<RR`b>MlfGW^1L*ptj~+J=531}Y``AC3&(kL_n#Z;0b+
z9yA#EMQiA7(;F-qwoT@0s29gDj8phqwk^)Ugts&GZ)ZyeJel0Mi98F(Z?C9~7JMGz
zCl3AQFB7}m5|ZEcCaeEeiQa1c@SoUGcO=Ue0h(QENhx#5X-^%Yvb~k&0KR22I?odr
z%wlq$CoP!83kn%Pjk^YO{9P9xIW}QLn})s^r5gA4l?)NrS%v~8<RtYDVxfzy68(oz
zrBhH(0_Vc|1!poR!`wX9WUHb;HpmH04im@+;vtvOo$V806%*^EiD9nyHj>Da1g<nF
zPkiZEJB7}cT{?EM$y0@5w<;a`!U!gXI;s6by8nWdA9Xl0Vo^(PIze-Q3-4@It4#yP
zg6%%u?v-$EWQiqn4ve#mP&hmZ(N1uVQ^JsCI7>GH+-5lyh@0{Z=IDa@@!9z&{NwcB
zPPp#+vFPbcv80dHCQq~~C;tV99VecuP1l3tkL~}5z5D!XBJB4@KWQYiBp|(p-g}iA
zdJzFpI?|g;Z=!-Gp;u`lC_+F~M5GA_h;$GTAs`?iVvs7LR0R>q6L0r@@B7(jpYxn`
zUY!^FADCGyvodqdHQ(R&<4$ivyqXp(nvsEcNOo@N?0+nQ{(z+kS)S5;GxPH6`;L3g
zpDtZ4Jzd{t#27=0KJ0|f!EP?)J5)b)`1EVsArX0H<szgD6;6x-<7Ya*e)z~ZuPQRP
zjGjHA+HOHY5#<p-sTLI)b$`WfnS72UBbssgg$+(k{_<oFK=*=?@@|5Gr|SI`rf4~6
zCYnZvX{Ct!5Hn)W$h3_aapIO6XCQlop_X}=jxZxCJoDd`=1XHyfkZP{0<!KLowy8b
z$pp=4ER>)<H7<kpmggzWr?+vZ@eV;PNOgsyBR>R=A2BSpDxge=<lp0rM(rXkThHmU
zFNT0g$D}1%re(%$A1IUWC@2ELNO$N?Dqlu*kYMMnTZgmY_C$||Z{Qp6<iyXTv9hAK
zu{01Fh6Q)h#mlI7ui(BpsG?d}?C+Tv5)JOd!ej)B@~H6$`*JG`Wd_8YFG8urT-@tH
zb^6h@F;48AXOh0Bb_L70UABZQMWx7!R-HzdR-+$&qo5Vl(59|T!&~Q*BB2ZDk%yPn
zelnwm0vV66IGR<tfJ{-nc9Gj#al_;{YsAq^GU5=oacoT&Lq$!|-piP^IAq~Z;v44B
zH`7OPxA~S_8K)W^&gXQZ4&`x~S*x$|1DyLA&Sria5=Bp8XzPAc13mC$Yvg8@ZI#jH
zkIc!yEc#8feFqudWbM@CPFIg%Anfx{yLba@Paj#+T_?tF19UMMTB>RKc<M8xYb$e$
z{)l*SKz2d!!nfYWRmMQN(qm-m5t5^3d-Hf=UW%Smj+Wc)Qd8ok*8WTF#up!oUQ)3L
zD2=>4L56cOFjcp&msdNra5hVgE=a=Pj4e<mtYs#Tv6FT$Upl>+RM?;NVBB~sumR~}
zkbDn2<U#dM2Ga<9of!GCC^40oG5z{G(k6s<Dg^p71Z9Gy=?H;sV?yJwp_*?POytow
z_z#9Lu=*@||F1kL+Q?zR<9w&wZYT7Re2`Uwx`Kgu<81A$Xbgkt7DBF@WWmpG?X_;d
zyZG`nweR<P(^)n*<kBjtkjCq=94)nc_-YBY7I+W2Fg;B4*(UBcVQE@OjIWu3kMw`d
zy$Pn438yz6B~8AJ!-n{}haet>Y^w%W^M@?j1?_h-SdeJCLtqWR(5Cz$CY@pTWNGWg
z=r1NAY)DfFY~M+t@2<Rj7yJ7iUYj!gnsFcSxR|MXW4{1xSYW-NpUBASnv;+<lke6s
z#A#Tt<a$yx=97rDN&kZBUwqYO**st7e0x0S*%gaBDuMI8g=bes3OH!P1an_cF~#1d
zVbaRkoX-w94p?5yOTy${IX>Xk<A_{uQ)L<p?D}~s^>O9#^%P~1!Hwzq;~i^*>3*x~
zQ-R%)+pnO!C84S{s&AG}KQdXj>=f**R-BTJMVuCB8k%q;$C$L9w0%-v#6oB~>eU>#
zXX7u=;5EoksNk87JLVH>=wDKNCI#J<-+lKqqg(a%y__GfUa@_>)|F7_P18ose${a#
zP(R7Zq*pf-x480IZctOF#hWs?bK*luUf4t2sTBA*@iD^FXD8ytw}%#kHs_SCtjh86
zi%y{vW8|<PxNt2Nf-;oXgRy(pitY0Z3bE7f77DT7kUTr2eM3FPzpb)*sM0`U#iOif
zuCx0ww{A|zNQq2*OLy;_UBI?#d{dTTw_CTsQ`Po>Psy0GJcX+WXW_k3eves<mFWN>
z;!XAtf-XSh;?@qlQ1#QoFu$4NDaq1zM?b51#+|s|@<)_ojR!s-DL|eFQU8o;mWsLY
zCw$9y{IVA9%#o!JEbgY~mPiZx7fa0wC!;o^HIi?JwO@)GldV_~5{xZKhU?RY4?cPc
zS`<ny{D96WtBbk#+FY1I00QLg9Q__N+BpaJsl3~dvB_b$ekAdT->jUvU3ew>gLN;e
z?$B&TH6X>0o+WTSZTM`snJ4B(<*ns&hJtjHOeU_&WBmM29+;H~lj>HILnT_#_vW|~
z0xTkDA}<dO_S-%#Vg9{sz$W{fc9pK#Wkc%RJL}xO;kF{-wPG2K;T(oo?8#5+vcI-p
zHOwRE{L-!oBmJxhM~0RydX)G2{IN~qCj1G5raP_sg7>ItX`D|PzctO^tD8cfnELJA
zPa3Og+Wb~fDcvfX{dr&73N~eXzNTN}($nWFt(R(8o!05JYMRS3V)|PMw9ZWkxFeF5
zOQBv$@alU5kAf_HHi~p$t2e!3Yv+iY@vmd<7eVD~gprup=}&Zq{ht-oIWK)$LMW<p
zUT&0aO3n;b93B`|5v?XS@4SY2H4WXWy;YWR4J&ll)3JQI+j`7QZr4J<WK-<6(DhM=
z64gxX(tG2YEbt3e4M7BxXn}evm(CfQb1g%-Q54gKM_*PDO2g`O0w%%vM=!1wSO~V(
z<cPzx<px!+oveen+~Fi&;(in<ad^id_2h5`XH~l@7R*M%!42KP+}$_b1j_M>DJEWF
zr7}e<aDl05=U%q)e0oMx58676-r=@h!ctFsEWyI!&_hpFn}iogr==A#u1IK37acC>
z8SqZdy3!!R-$fBjw)y69AMzp23sG8X>taegRp9A;ie*7FbM5A3)2EpI+QdngW+U0C
zu{1a6;$*9Ql2)&{W`U<OyM0fRYJ)%udLxJZ=~%z2x2Q-C(d$ijMNUv-osqZ%oVVw>
zi9XwSR+6E&ASd%pl8>K|hansu2sSXX8_&7j>n*C%VrCgNo?8O-5jQ$%Zj(Qr_sGyk
z(zeCiu4(*MO}vk^&&g9xQ{(y1dwpahTTZ$D7{A>C^_5RJY2nHCw&0baui~v13t!c@
zg`@Gl$`4MSzG(OM&bwY;)y9_7K~Zn-e*7oC`nG7*&`)Es#WJet?Y+%-Kdt4HR#&Iq
z7Vr1^QFOkySY7||wuA!p$HFwM32YNYxRJj;>%Z_-LlKQLsdf`(?0x>mDy{#6ueQGH
z3yNxdasFG>yB8l}!O?x1t~>ef+E$H%uTH*j{n7O9<z_-~%(AB2;nchK{l4Jq-(R>L
z|9ICyfra2;TJB)>=}x$D2!XZDoknfC3zZlWFQVl^XFuJ|-cOzCZSz20p6=nN2~9TA
z@?^d}-797snrhqT$@YA@PcAVu-ABud>)mv}T7PI}WSbY?{`4zdny{<{EpI{gnE?~y
zu$)_M-lA$VgI3fchX>Sbvi;1EeScVfW1Elc<(b!RG~oq(TE2?6XNLWZ!|zPC`Btkw
zpLr8Z-Q!*U|2@7M<bwtNd%~2K7S2FVk3^xVgelc8MY7OwvawPXQ!cJQiYYH2Mv$LZ
zL`aaTm{JK-s$cpqyi`h`$J9XQl##x<h2^=^rc|@k=ImK2TS_%csbHzIv$Lj)sE>=?
zU$)f4%lBV$>0h%n;(`~IEv1^JW`Xj5+0rXPepI>iFIyTG9)3MMfXbHsHA|^rDOD@I
zeD&)89aw4?r|y<uMo38gKboaUsj0V9@qgJ;pG@<=a_PU=QmR?{7c33PI~$bel$lqO
zo0k`I+dlF3^Y^zeP|Z>*So*#&fNGXT-tqd&mi`4x|7xW%C71pQmik^Nh7yUyf0?E6
z55lQtX~M&6{|{zq*3&d9Tl&A7r8$4iQYu*b_}Qyx&z@1i(!z%Pf0?CJu(YV@?$f5B
zzieqqO9quK9d4~&Z7rgjrDZS5YhH{~+0yd1yZ_FXR&-R=bj<!Ya%uOof0IjJ{8KLN
z=^L8-7hX!0O9$Ree;a9eIa=Q_I!wh&|6MNaeLL|_wsdiP;yu+YeKk2fH2MDD<<i0F
zj@Q%kf92BQ*`9ykrAz-uymWqP^Iv}Hr<JdN3DbY~OV`)e_y315{WAaN#q-UNopJR1
zmTk@3ivzh*ZX<0iyQ`%8r%EhewtoLI{p`}mk(V#_H_1I|6n?Arwx7FeZ=bl0w!i$f
z|6=m<zZ0hAkC6XCn2P@gVS4`G2~*OEe<w_n^^sJ<w2WDFg{Y6DPK^Cm!jyqZn0g`2
z|C2DCr4pv9z2tIwS>nG4Q@RCjlmfBV2W6!-mcaO52~$TZVJi5SFnyT8X#GP%A1?BT
zFcpcwPzlrGF0?v156Y;_aRKs&FojSF)5iO0Vt)zK3vbP({}QHGApc32<{L1yB80^_
z!50?wkyOHzsQQ;M?IYpk1RKZoP&D@h+>xEB%4TpYVZ%|*+<y?JPJap0Gbr8$=4`Ql
z5~hyGM!JbidewFCKM2#C=>H^4TLJ$*PMiLJ5T=6z#*CFAiAB87KZI$E08|0pHxBxD
z!ZeCXm=+h|;Z(x(L>l)rGd-hVJCu;5@c;uJ750;-5~j&o77b!#XxKjp(+KHy%pbxu
zzbrz6N|^2nQwdW`%=zYj5~j(22-9e3sVrIXW-4Kt99_o97j*952-9<ng8v{)dvUy`
zk9s+zs9{3?I7Cy;c$}%k(;`raZZc;4J61+#1H~yBv0$}Yuuj;eE?BimAN`=;teRV!
z>zc8}7;pynjIqv7;Tm&Gi?7k{vvh*%4R3$$l*K90a(ey}Lb35S;|6qIU6zb}jW>MV
zI_`B_y4^KBZyafm3#}hEkg$@;LW8dgS|h<u3sxBLMT2i8fTY0h+ARQ0(ZH!ho0?%?
z3MJP;y)|x-YMjTp-Qic^9l+oyKPv-i7Ft$?>;+IlyKr>`OASL5_WA*}T6#Dk8L6Cg
zy{>?_(NYY<LhfPY5_V?fUS<R>2>1e5Cle@uaJ(7OoR&8v4(qg(0&q!U9Zr?vhE-%h
zw{W)fRmDh1JfR09i4`O!wGJ7jgHo{ZkW?cTsPN6mlr0=Elz#$_XxW|_lbuV|1Ech-
z*9E!-zDgy(GRLM<^4$3+2lP-A+x#qZC~R^qM~f#pgDr}DgLf_I#3&JYP&nc!i!o;1
z7e{;bb#mrU7*iJ_rd&U;e06JGD7d33_Urw0u|1<SRq-qum??~hTc9x+q|1H~m!CLi
z^4=xu8L|SGD7S%S;Cu-6CET|rS;JdK$c&MIX~3SB9ZJ(3wnSUbe}1id6<UU5jlv?T
zcBYjYJt|@Y>T_lHUMb%FNg0;x*XO3bkkz@!r#M6_rL-a*F+6b0z-894?iHYrxzQTz
z8y1#9)9_>c8I)SiV|XhDf}04nvYOv657+a=;jme|jJ>x38wUfh8JfpQ?$&XqiPT(e
zr%82&3o87RPW&x1vEpE-W1-u9M`L9H3m#@9`6>S2+mFP*H9X>jSfk?E6m=hlIVtuD
z$ieDgNDmnlWOOg<1kAR$N!VfvE()-%h@Iw4l?r7|FYSpqu(-ie1^LCXI*1&<=@7Ai
zgRh&E7U6Z@a@r=EJ>_tLDavHEj5)mgW#vXWe14NQ-o+vOzHZyL7^N$c*+D$-x0dfr
z*a8GA|76`OJ9T`P(!PubB=PYP9?~r0WBihg=uS5Mw|Mm@5OGskx}s7fD^N+e89?T!
zGe!Z7thlM~CZZZ--NVzjEM^E7q|+nyc2xIU0A_^Xxq&B(l9yW!xE<)Pq#zW5^x|=r
zhw(^B)V}09&H@=z`md`f#na)5lC1ird$ahYH|*5_;gveKAWAJ_!S>*_xBZo?RS$hG
zzc{9s*ORBwt>Tn&MHzd+ud5m`FmIKPU&>}Q|IUxfxlmp8JD}yjd5D(I_QhP|)2w%8
zqF#qWY0F&a8R5=ZpXh{N849r;BjZ1=A>&;Xs$|_$DhK!0NjCz&bm?r}l?f!7@b%a8
zpSf$cyvH0z2_d^fah)I^!z^=0`v?WO1$Kztf<1e8uT#d&&okni5Q9mZBt#hY<^^7V
z{u>%wC${KO52tJ`Z}dKhcZ%-kE3U(=lU%2Oy&jY6Tpc4U$tObDy$!Dgj%5Uerreyv
zM_;&;=vTys_j_3#o0Z~9yi3#>H1p?Pn|4VU%9oF=TbD!qobdy_$}-0_R?+xZe<j<&
z&EI6@-6Fr7jsB|nbMB_`ClAwuPX6kMBA+i|Ei;sDeq|^J#%6pr&L&K+CHvYpOn$d@
zP*!ex-y1p94+wvPWEc3#&v)y~QT*L5Y&aI9kTA+5Y((Xr9Cawe?8Gew$y;u5E~JE5
zj#E&2%F+Et^nyVGKNO$C^JJf!Gj3wsv=*acKc-Pc(7D`_%ZhW~)85_kSQ2F~(JolS
zA4@``n?uV`OSW%L(|@f@GvdwOqlt$#1YMEujzoSo!S6jh^;C78^!rk_?A9aksMU!N
zJ%W-?`j%5Tl8N+NFNomW12J}h{_C9W3ms=+f>>wO#_Mhtg(4}iUq&O#$mGRG@n#Al
zZFJk(ofE>x!eFV8f!i?M+TZBxVBw2A*#7b)b0hglrt621Ga>^{kaGm37|Rh}l7{H2
zrQ^sooiz<L_EA{bRgk6aJB?RdM^0l+pvMrdxr-#u*y{RadMJuIg&)6EZ4m1C``7ug
z0t$Tq38FY58CSXo7pi<*F58P1+B>itc4^PHi14Tsvon1_tN1)_!0TSG*p145^a19g
zWd7N`Rn)d0`q!%)v<~PfPb=8iAIOw;8q>dmW)WxNcEH2OkbpXR3r!%~6I}KFK&JW_
zR5Au?2O#IO2#|5exBDk{?X+!j{4@nDY!qnW<(EY{;_E_PAc9a`Wm-ET)D8!0B_h2s
z|A0&tXiuWm%&q?eGOa_a%~AVe*0{P@F;*mGk`YFmXdIH~Y{8ZobdY#jA#p?))og?j
zMANevTnnVu!%im|c)%pl$#?|B@H-}mOuKo@<=R?O`gAguawZwM<D99Ul9$Yq<$%d?
zNV(Je2QqEnN+EKjwv%m&{;z~7M_RplS_2g_#r}az!5mEBW>ot@T6|;L#%@}>Lt4M7
zz=KX*b8IT-7{u5Y-M;k)GTk)shvfW$OsCi|sOa?h=|7NZG0vdyACRd`K6-)*nab0K
z8UKMyXVjU#9%SaCZ+<Mexe2-;OQiorrd23El{5(f;@}^DI8WkW)CQod_y0hqvRm@2
z2$VVX@%zs9r*~HSKOoadb@b*$_~QidgB9U}P7$X^+2#!>S$CLP6k6b9v_1~JPNI{w
zj%KEmG44TR4x70)L(t1a6nHyV+mYF5A9_pFDw+t+R1SuR>s$C}hn{t(TRg2Bkr|Bv
zuZ@G&$qEW+ddtt!J15k>*xJLGa!n&>w!9P+$l$FL1|C=RC3+A`<7${f*^wN`dV{}=
zw}#Rn!rCV9mI9;_gMLK<BgX)0)GnR~FcCrE(gKDBP^3K5Ob7!ywD9Q~Ll8-jZc%~l
zt$xuANY=n|Z_i}CQ}XmDmG>*y{t47mER76ULMh(h!3Egv4-=WaY%o(!d$)9ZnLK@-
zY}1VDyrKbxN#_`yI|7!5-G}0{TxwV$c&u)PU_sUxn2+kU;tCkgAYo%b0_7x{Jc#D9
zE@VCfRRWmSTT)5yH1`ZpL<xgl62_xPa|Gj9dCt9m!odE5MOYXOqyF7V&yt`{O`klO
zu>QNRfBGw=gf;j|kC0I`Lz?ZL8bf78!!sbyJ%0TVVi5VX0#HVid@r+<4o2lntqYck
z5FuRQu{HD+5yC~JOPT@C$fIWfU<N2wyK^5rRwnlk&Qyp5tU011i69xEI8wg&%TJ_|
zJb0O0UWumR0~n6C%E3$z&N@AKJdKjH21nmF;#&kq+Joa)XbN%QnKH0Hl{4MSXWS{V
zNC1-nU7onGR<c6C`a>#bn(Hpjz?HiPQDvcWrWkNPW#v(z25mb*it{3xo64CALR+mh
zOr~yX%X^7Ra>9soGg*H)Qw=Oag36ha03&x$<Q6ikwk%Ns1W=pLtdX^nPmZlCAKj^B
za|gv^KxP`$t6CsK<xJ(le>qb=B0z@$v1L^;QXM2BFxXmkOsb-eRJ^^D+G?$*07&!g
zUi!nC3PJPA=yT(xTdAC>pjrPCZ30-A%9$$VSLZR)%k1Rm-I29~V?-`{_fP2;<Ejmp
z(s(hC8-LV*7o=+lh#UH5$7Fh&GVsRE<E#ac5*qgYF&)?%9*HTg<boYz5l-tUX8Gb5
zRL-=n9t^4%lq$wZp;svv&|Ji)un>l!p(_2EVz2_3oywVZKAWAbQfMuH>X2?FdKz4j
zCjHKvRsiQ2Vfk`Er&%3seV1wPT?W?+jy_3H+R1tk>!yOAfV>7;{#3c_DfFdNO}^YP
zgD<G+i)g0Wf=W7C?I$Qx`i4QL!c72Ju6-W+q@iw2f#I-`r3?keH7r{LCl8V2lqR{?
z^)b#ZdUP$vn3hWFZ%qgENTT_^pk8H_X%HcYM3AX7Jp9-5LwN`j8TIIH>y!7bwTRH}
zislnxppUH&=xQqy%vyq+fvmwQxl?W6Gw_a6^~@N6J>(hH++-pG;MyvTGjN97%!mfT
z<eOpEz;ntv>fPO!`i{u=?_ajwZ9me><L+v|`vR?Z5`BotgE4gsnRghbb}T*aSbyIk
zq7E+o(gEgSg?L&BvSLU;O0%bai6Dk;(ejw2C)H2{QnanvMjmN)a?P>80+3f6WM5nB
zu8>TCdIsh>P#CqM-y7Ks$E3R>Y3jQashp`NQZ=SWy{Jc{tw(FFM|Bvnnp>x&)k|;F
zqZ89>TGXp*A<JgbYdObn&eLa8)Ds4nS;h1n;t>)7$SzV}mwV4Fk?|}~-)nN8XF!i_
zk+(xz|Ccj8yHk*mfF3({m{)pFE~&>4cqJ0@N=+K>)z^>H;tQGso#g3{jOmdK@5NF&
zU#ZU_^+~;Wp22yA0kvVq@G4r>VMYfugOxk1asu{Z3+lHusJcO$+sW94Io)N=xI(72
z1E7Amp0ui-=I22)3&_>1Kb)z6dIyy=ZHYndV+MPrx$<Iq)|g+f)Edj85!xX%0s&{(
z8W}`z{pYReGz%f=fHj^(Cl}N6tg0tALeUjRb2$XQie~zWhSH27GRWw@kP$~TZJ*0%
z@xq%G`QVc=G(&C1Pu-Ex?l6I)(J%~jBH)c`(ST~3V1e}O^z@!*DQH)DBum{0O)2UH
z15*ul^vB%T9gm*F^q!-Do=e_6pjZ;0G)d6C=W`yZ%3?f>EHVd-peTXJrzGU)ZS)Bl
z^prJ2oIB&)Ejn-)eOwlz4})$Bfydz(zHA^<vJlj-sNZ-P!Cj~f@<a+I??|5R3XTC<
zH^#?1l^;5+rZxWBVgQgKP4du-5NYR#ig(ERs_9^g3nOW(Z_XNAjD4$KCH-4)jO8n;
zCIlKM4^5H(qYQg)(Z{*d9%JYn-5Ce0spo<<$-~RYs3|hM@GI(8>`dWT_+@uS*IGsh
zXv*{6Y_{H%>V`BmAh+k;gU66?1hDh4p92Zze-wBg&0t*y)+UqG=JcYjpfzQt<K&UH
zWRyt=N{@^re4Re)&IqX+d8kdlc{F`5@WV0g!yyF?Epn$1A<Yopj8(?Yrz;HH1T&gi
zyiv;N*|^s;hyJ)iWZVpVM<PLDEan(O=W4d-7DM2}fsDytQTgO)6ZcuL$JntueF_F$
zR{LRNj+`Qo(vzoea;Kk=L04qV^JQ|VxG-9N68?JrP0~h}Q2V<TvO*u@G!K#to}bgB
z1~t&o&6ts%A{4_nGFo=Q^f%eIlfL-g2v5*F|MjIf0ce+Y|6c5;9vL`#;iLS>TnaDL
zpL&I^qXI*qXGw^UzZcOX%fGjlS-zo$?!j#3=^q6yna;1=$nKY7>E>!c@&|N(e}??l
zfRveY|AN8D)*?gZL22q}S2W|k{4kvI57m_OG*j{jDoK_u;M+=GHG4kPIV&0i=Mhjt
zV4A^QVga((Ee%c_p|9g;D)^?wy67veFW>rqN0<&2Zw$3>49{<j9B+{LzK-iqKZhqd
zor_q``FxCxC(M5?|Lh53?z-*GaXX?Lr6qoo1@n~nb#A`X)tF=XTW5aa)z9tv8zaW|
zT)$48>A{a6!m4fgq%l$RGD6ZAd97~=3*F$HZpkI^3TczlE)C+xKyGfum2QE$x8ioT
zz@Ik3%yW^lU5Bo`#v4o8N8h$Gr$le;u*q?VbnIxR?+8&)ymF{rb?IH%njO`W9(5Fl
zO2;nkhaII&Ds8%_MV-Ch-o<|0y-~WSIl5=i!DC#~qrLUctbOThN3R_}hk5aLHJ9&a
z_<5Z+zN;2-c;Dzr4*lW7|3kTE*Ekr~WWnK$edUeXPgL0V3*Had<grBUT5qz)Ztk0Y
z+zSfcyV0@V%XA=m;~=K=AWioG=XP)k^)tETASZY?y@Ne-bE&X|{qBuV_uPKAkI~&B
z(NO~S!me|uv@tlA9MW11ROx=NmOG>xr{KU{J2Lo>aXLnqJDyY5vGY3X*Ncyza0|br
zul$nNJ!&2O)lkDDoqW|f=97%p+V#*lnU<Z9px-eR{O^d(rT3I0Dsn2SEVgpvI9&f#
zmu}y+%;RsA<1K#54nO6s+pDj-l!Fq=VFyLohT_G5PS;=%b|8`U;{On)(_Ju5Mbgpf
z|D7<+5-`dXb{t<a%agFJ_MRDEK2;#br1FO_eS_52aB%b;`9qk#aU2tduKp!VD{J9p
zd{5&of6olj338uq3|gN3zV^1_++(M{^+{<1_GHg$pZ8N=ots0K{}86tX8y*S1KE;O
zn{J(W5PgKWnEV1C;h%)*ji>4jg3)0k1BEKVD|0_rz1eR;+$=X{8b11@FEK<2Y<{~m
zUFS3UkaGV0kFVLrJ;f_BQH3MO*go*)*t7l6r9pN%=dYw@2SV8`t4EgiPJUTEci&$3
z_`N{T)<WM+F}L})4~4SLV)lWSNUPHH#8!0s{Bi6^hm=y~=CfNKQmH+`STOI~QJ&-Y
z!(ed`{jil-<4A6ZKAlv<mj3h-XN4|Y#W_)>Cx&?-!KePqmLW^RVTjmbKIly^i<efY
z(ZO)&*hx;6OML<<@_XARm^c>ZfkORZ1;x#<iwWu+HzUT|C$Pc+HDXVC<%YT+Dvz7@
zi&Cel<a=1cEfhZp-iQ2bj!0)ZG+wekt)Bg&jumg7wrhD(?EVQQE!Gps>55ds)LNhZ
z-arBcd1oV6a&g>cZ|v=%4U3IAZ*IeQhfYM7wWa3wy|>#m-4W+(PN{r9rw#{4+S)ls
z-jX?U=2oPg)1}5+O15s3k@l|F-iS{*pYlmabYZ*yY1;Do(6WPM#rAMEFOTNZv^vk1
za;I~YgB~799@?o1msr-zE@3BOKb*}IvH<{|Y8wEi1rry<OoVX&U`JiYIumUW*t`Ay
zSy()r=UOTGt^WXfZS1vY?vQX-01J{N^(oJVDNRK$@{cw)TZIVvcRIh~C}6L!+=|^;
zcwB_vaF1j9G0Y7dd{6V44~Y_m0ZqRT&ZM7YyXs#Sx_hvyZiaUEAo64jA}_x=X_!jU
z?F0=i5p8^D#r%H292{kv*Lp98hx{-rFhD*wbj%sm=@kn(CYG@g-J|XXgp(f9`Pwxf
z%<}ksA_~rwTwLg8@W747(bnB4oAIq1RuyCKe)G9}+Hy@Np8obi{@tLwMI7*{L>_~=
zSiZ>6>ObXtnYa4>+2=XF{Dkp`U;rZy0KuJI_waL?YVb>Ww#S3%DKn8%Jp6!rCkXiQ
zfegS@r^&GJW_2tMdVL&%Yf{L<1jC@}7@$NbzmOG>{Ba=;@q>C}1^{u)M@tq{9au?D
zts4M7V1Tqhiq(eo;y}ioSF?VZ@jSGD`GuDR(oF$qhnYZVLjV9r1C-AAGwr)ShnZk#
zU`rlgxro3x)t@~Nciq?L=+6?V^D50nf^b7Wg<)WayC-)hwX_{90k%Eb?dxTY-5}hJ
z76AK|2ZYO|HQ>l3f*>m<kbQ-kYr3JGv|{$p=rwR$<N^SC-BYc^9S5=tH{ScP()RkX
ze0tw3)zCUa58$xeBLz5cn?Sngq4$+@#E&%o*tjNGLaLpXcb~t!Udg#F0#Mt@(#77d
zkgpI7uLU}V{W59K5fdMWl`@>ZVty_tKJk9u8Q$%cTqq7Be!{=gO0pAI!Z9Xhx<|_j
z)W&()j`9d&I?w4mHX<I>I7oE*a4UpVfr`)g=7--$(NVUBS{F!STNf7xD@qL|{BxZF
z2W|)=3rzaC6e|9#_`9W@>iEy4Y?cOhC=XDpy53btf_AE3I~Zg~;BL7%otI?1N_zJ+
zj3~bI@gucaml&}vc09DKdHI4?_!a|%yARtSZ+)ti=PlfMFGY3a!uYH$7+@x^(J)lB
z6CK<$S{dlLUJU5S9+h9+6S`~uL?oRT><)2rUbRY$G?hL!4BOqKg|3_RzIvSZfICtG
zVd{jBK8%M7pI^(SOSP^|wDqF<S{Y~aLzRf_Ovlz?LE?zP1;@NQ7K_x=!1GofJd0pM
z51Gd0fWaGBU}T&I$dPANK3q!S27vX8sq&N`KZ&)}j0NL*>ePzDY3?^(-Bxo54u-Ao
zV#?MytM>hKkyBN*NiaIvxr>>7G$LSE=}VdIl6G?|cJ|&+W$=j{c_GYF>?boIfGZ|_
zWwJVXtxZaWVoe_-N(6Tgz^J3`nNC!I_8vNskJ|nQp3vtw`8`GD5|fH37?-><jRo<P
zW~f)~!x+@%tVID}Rxlrwmj*ywrd*XKJaLUgV^GsCI8E;+TC>vy6T5@6j1r7J3#y3@
zUw?fe8{N3#;CJmKw_Es8Y09h+_IlyK?0o-PQ>#yC+M7u{%j&?5tY^NzncW*Trfx!`
zA$%e?9Xdv%%0S<*;eJVO;|^&lfOB{A?cM9+T4J}6z~{Yw02G3YHm|xar(zO1c4!Ph
ziD3G0ns3yh_<)o8H(I3fh3+um5J#s`;0k_9Z}-ySLJrryAiypx0jeO>4SnyaKiR2(
z1(|jQ%;RtzUR9rLS{=r7Wm$sx1NqU2PWYSeW-{@wJnYo-6j~1UW_UDPp2{S0U1g;|
z0xvS0fn-kRE-F`C`g+1{?y6+Vw3BSDM7}NDh-3Pw2a1sYa_WSCU!HH&GX?L@-uAD!
zZ?cFzbqGZii!fhc2e7aP-asFd*_lPr=Ltl{Z|f0d6BT73kgEK`1n;MbH9k`P>)7C!
zw<~jdE0;Td$MRoWbtY3FC9m5lu_5tdJocYNqkDK|+2f>KltSIHeLkO0pwAV77}`)!
z$$8urcz+MH>_K%4ar?W5aRjvDo?47N2v(-TE}Yy6wZWvT3kzIyG1aen1HwbyF_X;p
z7M=XpBg#vJKN%)5up>fnb2B>t^dNv*eGY))+2v`YWvuxyIO+K$5Uk)bGac}qmKst8
zlU*CX!8(Jy*w>-Na2}$GW9#U(t3QO~-lmOgmBU@PL>*f{^6$byRklO1mr2vvym^p_
z-(pvVNYe)MK0x^g1>xrUQRH@no%$kr(sKh^@fv1_4NlV%(zNXy3j)Wy-<ky-kppjB
z%Vg167_p|@2XkP-f#TNQN&XRa@gOi<8341Jw0(N(5LxLjwAh}+!HVfjU=#<y@vjqL
zEJR@05()X(p~GHXV~da;-o|?LneYPm)2o6zEkw$f$=29(17e^K4%?VR!a?P=E9G^4
zy8&5iz%eXw<1E17UoE`VTqVV3w<bih_TtmHR!IdEanKGYtGh_yeqA7n|4R8)uT+BL
z18uSW7SOcg;GjldYVYHL&IdCPhWkC*JS<ut44NZLi=TxjegM@2)-|a5k`JX_EA*)#
z&$h=LM6fkLEy+V8lzz1+28!!fpTPADB|rfjRGgod$gdd=fY(aDpRM`;(mNsmlqPzd
zs&@h%Q4_RPxZ)@kn5^Z2!2{wr*>b&7Qhk-CQhgksiZ|fbb?;Fc)(#^8Bfh|NYcW9e
zze$v&-A$Dkmh`}s!ri$f0V1OVpJH!~B~hvVEDku(2ct!Z{)RJ8^oY$}Jn4N&@4MpS
z^p(i+CV;+p*)v=>?$;gQ;#xcy+ueIsf9)<E4N2KxH(w%N(63Vip88_6=fSU?GN)vS
zf>xKJwBS>zGU|R)aK)3%dH{?8=xcE_%F3#HoPj_We_6Rph)K9V?xbNAW0*cI8c6W~
z0)eD!SMcfst=@H7jP)2%oKi`1C-t{RE4P=v76BjB$6FYnqa`S4Vk=}o0uJa&zbAs-
z2hb6TJf3nQVMZM|BS#A}{QbTgJ%HLdfQy(27J9+V)koK9@S4-O#8jW?(A{Cp_00@)
zyHH=w>9#OX{7gvTd8*dSA>(k2fzpPthZazRHYrKgDow^+?NvWgOfuepx+#`?4XwR%
zC^B+Z8AKxHK7ImsU|+6p`)Xzm5|=SOq78KDI^LzP)>QHEe{!pg{i-k^F+JcttRX&}
zARq;Bu%v1*%j6c(<()Gd6jsYWQsehGTum{7qiH||xHCo6X5*9#bAz56gI+~+k{p_H
zS~~D>9FQEhQ&&dCPL;X`$0P?AX8IRC_kYqaSlJe&ROLN=TEv6iFjTt8hrII!?yi3Y
z3@DM?3~F(`N>%X;0Nm8L!PA^M3|MB7NhoUj9NKe4M<>o>wh8Lu8ERmc2E@+_)rZqC
zPZy6IJ<+;qF?-kI$f9*<NzE_1*MP(?X>BpGH$0++gAi%_Nc^4=I^kPpbwHAH0}puy
zFJU1876<%DL{_@GN4=*z9}78N<fFD$;-qElh)QyV?wZd$Pm5}Q%@Q$TQ1F&e30Z|M
z+;S~%Wc(U`DOY`Jp?>`-;{Xu6;m~qgk}WU`jNUtGeJDa4fXPagtlF@l=LRe+y6Sdi
z4HgNBd#!-G<uB!=fnh7fz`Eb%&s_@iC=C8`$|p!8JVu*$3zUV8kv4ra_X^+$-S@Nr
zEV|(90zqOzhxrpf=V_x&sfX&~Ch#oaGo5K)RS6R-@a-s0DiElA-S*Ivok1Mf8OP9c
z>V{W9D|dUYdEgk`4dfq`tTqUJo`5h{wp4k+M!5SA1vF&`G#HxAvLt1Z8UkHhyk7Us
zE5*k;N<p9s9D4z->V6`P{3HuUJ?*q9^mI|(DKK&t2$RMw<DZH!o-O5gtH@|yr*SqS
zoaTea3ow9ZApqD)oFxKa2#Fu?vH~FhKRqq<Mk`~pHE2MRh~Q-Iwv}iod2~(etKPe`
zMS`@2y|p9&#sOD1N@)N+3aD8g4ee;@ZS0Py2`rnIqf)2XI)(?D)V1NR7KW!$==KIw
z#p?yMf-R7A4_pgW-M^31#^r`ih$+Lh<;9vb0o3pW?ZF-3fzr2`d^&NQfQ6PQca@7x
zeVxI(cCQ4gdd&EJssykP{ooWQXn*xBjolhlwDGm|-9o3e_~k-<E(f&`_k^=g66&9h
zy@t^FMVoHaJ9naK?56Gd-4o8eRw)JEw=8pYz|vhvB@RRE)O`=_3TT@iw|2Bv>v!k+
z6i7$IS?UDM?4r|%k3!8Gm(dDq(wn>GBBw?}a8<cdq{-Qlzz^|+y0KeK5(BTNBNHXG
z85@5#PJVEC_w@s%I^n}KqwB&g-l^~B7e5q?^14#-OfiZ1#n|~!g;X_<KZL2t43hwr
zFjaY=6w304FwMxFJjnSf^Koj1=`+IZ`}vPNV<~p>ZU;WRjCv=2Jazjelg0ZPc$e&U
z%zB4cAo~}iJE$0Gc;(}<HaX+u3HGgd5S1`ZOs9_eK#R#?*-1(>wC&<d|4Eo4J(&1B
zm}Naq=y<SLdi*zp>9M<UGXw2IcRs$`N80olq^AI%=f4xC)$(M%>z;1eNp@JMKnO_c
z-w0E=Z=Nh1$;=0ya>zv_7DQ3B^ipy4QVsG_yY8hXicn5mlv4F#B6?|!cxlfsYUg`t
zH+ktGm*hktI|-f!BV9)ynEQZCzCvaCC<KjfIwHy&mbuhduw+0bOpR&%IS^FR+BmAo
zBno6?$6)brsXIFT?7X*K(DKbSZynlnYtiS0MCN`VQ@^;uN!F*c)8`LiI*+)5&7;{)
zbCgwcI9_t)OQs&d+cn(_>3gAg#iKuaVGR)Q_w_br0bEy*BwxRk6*Ew(f3a^kjqert
z)F5Q4?a1?s4^bV-?jd~7FBiK~IFbW&{9^N0&iIm}*qX2N(Z>We<BC&n%=^X9FA-Fe
z;%NL~vdf9>&nagT*YKA9X;I6#%r*RbA7XR5i>P|$aXS8BElu`<LA4KgdZF|6$8qu1
zB(Do4As2FsFNjw!2lv19HqN`t*H+}~d*}GV>3Jrx_Lmp?SFRYhmW}uksf4MoD*b#O
zPt5v5Dq$K__dBESN%j8_rg9+=-4Li%2+S>nCO8CsBLs0XgtjDvt|o-OBjo=xVaiVl
z#h}6j_`?L{!i03ggss9v+`>eI!^Cdv#Lv^5@{f0{r4jE4YoY3<#AM?F0_I>x&IEFX
zh>&>|Mp5!h@f;vv{K02xY2*+DA#9u;IzbN|C)WYF!4WTt04ql)C{cEELf~>Juv{&T
zN-)HED=E5`ih3rfb;S8|>`AysU~3|74nXADVaf=CYC$s9IK>ozb*=Z*O2XuWp{J}O
zGduS%17L6e?}1xMr{TMpTB>fEC|W@X<k&l7AL-VSY=5w0ycOrPpJe~&yIl#w^EpiY
zAk6t=a_~W7OhvMP$&XC+q+n7~N^+7LHt|~W54V!-=-OTTErQSi?1m}So3i5|mxvjN
zGxh&2^AREU5t^zFkJ?XGMSvqHi2~F^9qe33T;{x)q*<FNF+fNmCqxDlWIobREN{TH
zHW8-~1nRTmOzpwV+IZF49rt~LXGM}~0fcZn^fEf({60aZBuNjxYq_5kO!Zr-MBip|
z=)q2KL9!Zu_ziM`F*>1$s+&e9xE&-I*Cx6}!>GDxEPI?iImv!&H-Yk#$bVR-dzb?c
zwT#}yU}@z13B-?)@+OeW1<AOiI7h^;DLL6@AAb2@r@jN?WEBxJx)-Z<)u{uH--oxr
z!&@Ik7LOh>?q7BK7$58QD<ve!-V}Q7QF1hYl#>a>o0NPO5qX0Hrla;l<#{457<|3r
zmzMS6i_1xR(fc8!UzoKd`(W^h+wLf3ha`8c>*JOq|Fy(dyU_(OimpFIxggFEyMIOg
zvYJVhGATLQeP68vcBA4zI{8qJKdH3_Znb*(200$%aBX4}zH<2(gFBYHeLS-oLe*4-
zY7<YJ#A&<jOV;jcCSUfpkItChi$xKxZ6z5W>_`kyB&HKvA0@wlBW@HC40kTenPy$j
zKwDl=_j!LZ{#ewe%70t1Kb=c0Y-4R(Xdp|_BuDzfj_^>Pq<wwB=l?>Ot`8Ho{IX6i
z-T`C|pJmG^8{m9r{J*RgrSuVq+pjiR6|Xbhv<^72bQ?>cVft~`>HEd0r&{mo1Hb%`
znQIPP9e;XhUv|Fj>VE3p1r|=ZGGn~zpc3WOM0Uw(6+T16l$%a`VB6KtkD|)#Ya#Ti
z-`GzMEMacR?aBlmDz8se+CK~WdZ-fc?ylij^#^~KwouoMvY#r;j~>`J!b96mEG6rt
zPF0#lt=^3Ay;0U1_2W4;R=QaCJbd$?gsGUD&&U(U>{((<E@DRQ%(LsrnY<m>u)KrU
z|3R42sblaD9pgw$mkq;GLo%X4ca&2E#Le-nPSFC1oEMt~l6bF2klnE<^@BDiu0{){
zN>nxrrpdGpFeeKLPC(`I0o%T`lk3ewH?<EB7B5Z_6*#kvEE5yMRRxuMwXpvpOhp`X
z3ixgRNtpWJzokP&3w`cf5xsMvvPJZ6VCzrOqR^p}V)r8d5~h#sb&t;VTIurqJUOQQ
z-C^=f2}g^Pzj4a9pW@}&=3IV!dNE34a(dPkOuBl)pGHLyfr}C*p3xp>gb~cQ&#-wq
zELrB~4rxd|ZTz8bt9Q(?I%iylS-i=9HvR3*ng_+^V-?|Bo^v%EjTgswU1l_78Yi7j
zVRTI_7H;Yoocn%?m3Cg}JZqpblNDROw6dYk=R>7T8~^mjH$_e>+w|3)$hi7SZGXBx
zqdM?F$%?h+AlHaBMcE@or$hQypY}4Jhndb5o-=)3ca`h58hNiBDGWr4F!!n!j*O2o
z`L|INp`rAp*`|*+RTTQ96~1WnN!co^xCsiarg0kNLoZh9Zu?&iL1!>9_ew7w?3sIQ
zzASre|1IW3JU{(5v*Nq+*M3Kyf~$JYX^%lelf)T+J|h*V`i15{%Dy5%$EDY-l+<8y
zBt3~SRQZG&`^Iw*W-o5S`qklzMSMR~*#T3$jH;^Q`6_qk>nB$Vt(5zi3_2H3a(bN}
zw4X1*6{_Edh<P@!mpe0CabKZmrLlVrF-D(VWSH+YG(n^v=(Qw%X;nETrr#=aN2)_>
zcT$qpPFv4N$>_D-k{9daU@wY9_dtU{qRy_0=i(^S6@{V2-VX|f3a8Gly*;q_!UdIs
zJ5m(0r}i_IZizH0XUFV<#XCXsW|s#F2c(!66T%B*Pd<KM9C<xXAx>I`-f{Z9^g3H!
zsF9FDe`yxGG)KH%`X!x5^xeNx?VhJNE{B$Rv4H*%rcIx(3Uk^U?c_3Xub_oA;w_A?
zuc1uFYLkt%1etRydPNlLQY>QxS?-JXN!Zk-+O-L?J*()G39Cyxv;InF3y-=oaG&=J
zwc4h+E8~*ZB4-z(Uv_@F|B{PAhJS#G=8`~vEOaRC`jHUkV?F9hL0m>iM4y<r077%R
zl)<?f%#w~7<hQoTvBq_?R@WxT<WZ$m_i|pSfVojBb6&A@oDe_lpqb4MJb%JljACGx
zV%4nA))n2aGCYQif!5z{XAstz?aFW;5X?@K?qN+Q4@u?Wvk3(cq&_8|I={}uPt786
zY<t{{Dj&;uffbhEZh`r5;S1}J;$>>;kgmt|_r9f<Y9%@j8wG*rs^_}7i!Y?Auh{Ut
zV;RNJ|4a{-97ld{^V5-7NOgC)&l?*fW+>$JB$}p&HP63Xu_ntZLNVf=B;7+TT|Fza
zpe|&dypeqKf^|xL!-IhCq?3}8$!abOa4yzfv8e1*QRWx;zc%;F8XhKw>I;;JFVk3^
zubg;rSi!IGJ6=!3k*4SyfqTdQgifNwxT0Zwc?lx%<niD{T@I^(;|G|?Jeo52xb+j~
zmuT_g!?8@iW_`4ey#5&pfwW7)jaAowU%EWY#86?p!+7;&qIOl}R0CT+bC*BdT}WzX
zybAL4@=F57rOW>H!Xj5BuOFv)9eub(Q^Uh$Ge6yJ8leEah85hGoubsK(DsEBqibI-
zgg<$oLl)v7m_FpS2xY8etK**wN#GrlNIvfp`Ftc+*7(OZgZV^wOIAjiR!o|ixmH{=
z>36mF@<Qs1Sv|Hd(@4{llmWv;rM%H15gDIthFhQVO}=Isg}vTN`9gT!VG)=lv2I2i
z)V%VjzIjdk1^|oEQEIQx^5uRhLGM`5U0`6lLO5Odc4a4-yM(kPHuB{o6Q$z>e|7W{
z&fe>$AGYzK2y39h%d{MK*Tqid-+E>$QeJF@i#_%ShOuVD4;`9IRWgzjv!pzcdK`M_
z^3#lJ79L5bX!f~yrUqSXpSbL<5AfvqE8=tKME#qI@MwqAYdc#U%x;jv`sq;Dt-7?M
zS=E6+CTS7O;Q8sw3jP<<-txV}qU>90D$rB)S`3E_6J!InMHWN(4GZ=w<adZD#9mr6
zen^ad)?&xH%di2Du(IyuPPR^RomFGH)Yi?#>Zk-76}Uu`89#c6E;Ih5aLL7f>4b3>
z%=iFgaEmN2a!OS{RkzzDuk*gh?`Y#Nd>gOMrKKSuS{fE{kl&pRFUot)&rKIPKU~OI
z(?{sY^yw4>nJEYmzcz_p%(bp!Nyb>?J0Dr^8*ww+a78fV;I4^b>87YMy--?JjZA@(
zXufwThtly=>58Y>vK3gU7~TY~&VUTG?qy6CPtk5aO1TbP6L~MLYT3C!pw^_*h<}EQ
z4Ar9SBZS$c#}erc<x?`I+XTJU4bE3tr=~@B!+6OD%?h6wnZ!YpRAJU|)&q898Y|aS
zpf7kBiqZ|BQ&Mb8YA_uSPFwSu=4~<PlIb?hoTwHN7aLR|x~Jw0^n4O)3B#mnG2Q(5
z`?-Bqgy{;-`(6c)@RVrEL#3H)B;YFSH{D{);l>m?YP7~lNdb-LRx`yol(zhiCg@^=
z@5Fd7l!DU)rf<E~xfIatPUJQe<oSkjo})JHCZ}s&%||8hToF9-H~e-YyC~Yh6TMJ@
zm{lNr%xs7i>{Zh#b<J*6Nb%&k+uWntuaM@ygx6m^P^)Pe{e61bi_P)Hgi$jHW_j6=
zJG!%*v)XY#6$e4tsYB$%O5<gTT>L>>#_U=ko!)Lv;QT}jh*Elo8`>?bg@4ncCmo@u
zq6Ml9jn|$AiPX6nZ4vknKn{lbS{6`6mN=a@{jV7*nnb)zvq3H{(__s*i>F`esJpTp
zs!)VSR~6|-cb~B6R{07M+~9u&>*kc#H=1*2FQPbNnoC%{U5ydo%)nk9T+i5Jh+HE<
zPM*N*-EA1H&mN&Cz0t#o>tWx?(IDf|<d240u13)U9Mt#nPX@XyL|N;2jR-vRMiEDj
z2fMPXi3LGcxs-LHRL%j<deCi1h6p*}=^5^6VBA%#p(_{WjU)6>dw?<-q(ue^WjS4F
z=#mmgh92}w6J4i8NEik^!GKeO$sor0o8sPhm2~3VbT^N6vP#GY!--EaI|gjY`U*Ut
z`@$cMT<|oWhPyun<>`cUlR>j7T{Y2qC(^rlx4??!>A?;?+75B-K)SArSFi>CNof}k
z2ErBa#wf3=?DV{bD^#6`<6a{yy`g+GtbouJ;boI?8odO1bm8kk19&e^j7o3f45T9f
zqX;~GGY*Zw>o(&N4tTMMPMruGvvfH++SA0Pht&mQ9AI!FAWo&(Nf0PvcZd^j&{N0s
zoLuVRQO2`3bp4(tu%~~VlzzkG4XTNVkMN;hWh}<Kd+3Tj!&>(VC_xvhk2)78Tg9y`
zE@E`#ZCzc&m<RARcfAOWm(J@lM#rHeuqcF{)Ikqt9+n+L)Xl;(Hgr3FGQj#0(3l6z
zMR?T)ux8zYVTFiuE8d>)z~RsUBe-nX3qXI|ckTyV=tQlW?i($U?W6QoKhFs#<Fxh+
z9M<(w#JlulJ?Ughr|xM%k*MCn551}lm{VH@?_xhlAiLGc157;e;ceZ&lZA{7X*!3&
zon!s7IqACOhbjzs8R4QQr=bc?(1&LXt(**ZfBS~mbx8-M>2~TVb1^8ULliB#n&-N_
zh<G(uzo=t^ifI}@adBx-pD&x~DqT05{L1|4d%DB-Km3GnSsKz-7@)=<sRF{v2R*`D
zHb!=a^N~dchj9q^B8>n6!I(LdJp<44@tPH%x?6gfhI>?t%-xd-7wGtmh<bd}`ohF6
zHR{5tsE3!Q#E60U>cfhw^^bJ-I$yE6BDL^h?hkbH2nZ<n#!r2_rnNL15t~m%COq>-
zrt@6-_te%XU~DzFU^CvC8FB-BPyZ^xVZkTouqVe7nr#W?Lp)T?>oin$&(-;CMD$P1
z8B29FG?w*LSt?!oPLxZ=5)t>beD%i!%5-tQ{;e>EmBg0?5BVSPfnRp3&*61>@G4lp
z&pdcFePgsmyi81LM3&qA5m!OnsgPOl)6eF!KOu$rp9^gacO5T=6vv5I(J6ypcgK32
zJBWkJT3)WMgx|sVW{DXM=!<?>e>$7Xv_UZ110J`C$c<5vO+3@LIGq*jDC>h-%ibF{
zhPZF{2>Dn|hq)8}5Fv4K^JW7f9#A<_U+6$j;;=_`sS8c?I%#9bib;^!>Q+OqH|4Dv
zO;aSRS1P5pFB<XO(?$0TwRCbu6T}$Kx9jM^qsuaFpzZ5YlV2aHt+|_fOSm4!$q_r}
z6(sa`{MaoFC6=hUR$f=*jb6_SHi4fF*9fnF8c0v$oUecGbBb>pkrJM~<mL25*guY$
zj0Y9tx&0Rmy?rH`aUEB?TR%KLkv|zKdG|T&v$1KB38|btTF;Z%^}aN|gc(gG45bi~
zrR~1xUWlS_M)h1*^HR^W_PXJk=zWd#bsl_pZ(J#Q^<mRS+j`~8vdZ1ZfnyT}3ek8S
z2B?E_Nu{OXlS9bmR7@4Yk2MeT8y9c3FvXb#(uwhTM*HOVLR@DhM9@Kx`sQ0COObkH
z7r?InL1p`%uBlX`lT_24cukj^-wp;(GIW6o*QCxR=rRzxT&zYddes}A=(ascx!U{5
z)evbx(2y?Ijafj4x(FXaguH#aEDg7ia<-DvJ!SE9hJte1(%5faaP^=*%kI8!tF@V;
zx1w-Aa=Hx9)#%pd4j{7;{sy`ZAi?sgK1o>-az1)M`b|zDM+>05MxZAfU?Q**6>*5F
zyBf;u#W}X};(VqoyzO@kb#0(J(-PEPd$S_y{jAbB{gKIV&*x$5N!PDLwo2Xf^da=R
zcJBy_GC{{ea>hKVY0rTE{@0Dupmyntp<%t71W5~xO2*6gbtc|mNU|R+DTc~1$R|O5
zgo7R?2$fnf_^^bJl620pjiZa`6yB=Q1(viAd%B~r7?ujHX&l0Ro9&g@vnYU0yh5uN
zN1q31CCl>MmKEX<Fvq2_p96_m_woQP|BJo*jB2Xw+XkNkAq3LsJ)sHGs~{jGbOi)O
zk!}za1f(M<0-;EkrXo!YMWlD>z4tC6MMJfKNKrtfO!T_$>%O1oeP-reYd+1a`MN*s
z54)Ueo&SC8<0nAYW09lNRn=1^;hBvL6>AGiazu1OFKJf=L!SWniqaeE05HoU&RQbp
zUb<vnx$Hhz;2939S*pgAaRIANn}<s{=e%{72*;{7c$fZMC7znajb;QvQFfv&+r+F2
z5vP0(ntlN<B6OO_(<j4hAIjj+AuuR5=?#>&ZA1OQ(WtaB($C`@w}n3BL!YdhQg?73
z61ihEL2;c=@fvR)6;Wrq=(?5ZRGoZ%3vW9&xP!3LR86+hoi<V(+^O5n!EB>Y#hQ=T
zt(nEXoF^t|lQ_6`FWrpN)c8Qv|E7Z}6sx6K`~vh{uh;ZC?d@~ckA>D9v^~8JJT%pG
zIb7h0+TTNTJ3`s6Qn~!h)cXp)H8!W++p&@e9AC)iGY7J3Qs&i*nqs^>!azA+4Io7P
zTvfVKo`%|!v`c(~SlA8j3eBHC@yyOcJ1N36)gm&77Fx9-OLFR}Od;}v?cBW?D@-yR
zML#aewVP+RxtUur&*51BTn1ivdKDndA?NlW*eYDq`AG^YuXS|wcC<jE`}s_`N|3}f
zu7dCRO&IW266JxHz4<<0nC=9BdKBEJbUHB6U4!SgbWJd9KiKvzz^<C=Y%0H`u&vZK
zST`!CuukLcWlfbLH(!S9jQefI<Vu^z-xW8_^~oAG&$QK?LtHDh@yFFkoxz<4At;qy
z&Boj5N$TK>o&MdeJ)c42KZy3fz)CuTFv~ZLRqCncZK>@MzS|&A*vF7l>IHXUTF^Po
z^k~7NFQGCu0pAo1^2T(?ZT(8S1it6P)efhp*Ev|s&iW~6h1Mt;hK|ll@+->f^%kgA
z0VN|uat}hPJqo`W6qK;VsB!_f>Z}>{#RFf}M(waL`R3?!s?(FfJYKD)u&=$xu7GF3
z$BQ8>lKVb|8njgXs!vWhL!SkQ8t-2aqgmWmSD6-{&E06A3VPAIr|A}qxiUBf(ecmT
zkMgN|=Gu8ai1O|M9DRa<yKxGJp7JMxa?wP&SzpSUJaMU$F%L)E2}<}C!d%rZqaZs}
zLB&K9#N;~kW?qVCZ7Y0f(DO<gDyBWuu}&?0|CyoE%hJ&2@@ZW4MEe>qUAOxeDN|I&
z3nlIYAtHBPzPSJFZGs-tJmY3zAbl|FTpQD<$lJ1zV#CnlkM(NH2gTo%N-1V3_*e0c
zk}~;z8Dm2kt6#-04H<!u3V!7ZNxv$MU!`;n<!c93C-*DWewErQS6@?pjcKS2{8jtm
zp!)i+vJk(TLgl)>6Qzb%es!$B>im>zYW$iy8X8Ld>azXHD>W*Gz%7yuRV{ukEq<*N
z4UNhTt&E55YktkM%JrBBWljm_aQI}3g4HVLvkd0<Gk`o$!R&X?K6n60C#r1%`|NST
z`x^Z_L^TI|zYtg{r;%l!;)ALvg{t?5ANB?|_GPQ|l|G=f#`Q+4^qoBDr#sizpfdQl
zad4t>XsL1dvC0VMs88tJSYYFTansnZ!#6bkQ}%#~p2NY%4~9Od^nE-W_VMovJn9i`
znzHwQ<9BYf#eX`kY2w*Y&x@wXQvZ<}|M|khc}D-C6Mx8l$K<SkKfnKbr2j;qijn|$
zGW)29|9D37q<MDa9ND&M>G9F>-nq9Y=axi|#~D>;F#(Hos;e}|6VHy9>~YJ1s(lu!
zZ%dEYT@$P`4|E<h(iY*B=7_XZC-9sQKB~Y?QFSG@7FtETQc=)$X|RlN%QxkqZBdOa
z&X#ZBmQBW%ZT^<653OuD9k3!wbQ`aPZG-2iG30<x<pdtswts5~+}{iO^#SnxZOhL%
z{E?`}uZEVNV5&q;a6(RpoEtXR3+ftkzUD^PBh}AT4063jyc*&DY$cbw-4@xx`VoBT
zrd!%=iL|VIUeHT?TA?D+)m*jZOFEA~Yw`)uUe4`$svuMUpmtH9BN`eF8_JjF)_GA#
z+~unEIw5O@iP)U-?w`EXk!R>*-n8W@bRm_Hss8=`4-#!%)Og=hKmO-@4X0E#yc1o9
ztZx?XmYn}+=lZ_g`|IMHG~N)k|3aAV9<qD=FNEo?eeY+7e-oy=N1VQY2vdasu6rJT
z5vE)RZoTDy2vg;c_Hz{!!j$`g?^f>P;-~-~|NB4w5T-l<4}N~mjjIX71Ula{8eG{s
z!L$OXzrSkyNw0#!w_*pdRO0=-8xTg{ejNK;e;>JYX3A75RGQ}sBI}`mK7}wf5G!d0
zUbP%k!{4<*ceCA0PpCY3cd-%OvwUXq#v^7Kl9M9409S}QopjYBT^`q7T=a_idPp4C
z%k&COp(+x3K<xEg;($a``k=N*7uQ5Je8}QqpI08NjjI0savRmngLvLhX1DV?y|kkA
zgQ4>Mby6BL5sj7U%!<D8hH4XS)Y3c~`r&cR`fhw_UKO<ZlrlfX7#iJcP-p5L3Hcxz
z0VP4kH&-HmC0>2g*eldRsC9ZeWqyZRT>q-KynBcAR6H-ZI6hI7TU;i-jrOKGE;x>V
zN8mEMr3|j!R12Ub6Qc9Hm&ATM|7eSsaX+szT~(&mX7=Kc_l;SD7w2lsyrrFe-roOO
z{1w9EGXJbnGnUOR{p8nFP!@LpT(x$}@|)Fu6P%Z>Et014QfDMeQTU9-OzJ{NIK7hp
zHFiG#uFaVl$jdvk)|&4}X>Vsc=eBbqtb{|HeW446h&gT<TShzG@NkWR{KpGfefnsd
z(7^KoYWR%v9AEOvC;5!Bi?v4vkrSssh9ZKxYA;)Q@$A`VJbgEHLHt12Y%~VbPvWY2
zZNxbw?AP{^O9`{Cn8v9-o$3&eIWSvQi)`lDVoXRnn9}x5aOQD3wPw#^$JWBNllSgj
z`pz)p$>CYqJI39%miolm=?l_*#JD$Gpq~l!-J=6D{06r?9>sD;`R|??7`uW#KX5(~
zi3m93v;6!AmnHs0D883qJo@s5>(-!|)>4{#_iek!eVRXW6WmH>U#hJQsl9k@x36f^
zwmaYBbg&;iyE!&fMJ9#_x}W!VBFJ~0RlhINv!jv(uQq_noElYs34yZn<RMH&v0YQ?
ztwFZ(9hXNYCUZeh@zr-RV7I7@L*2ZLFPW}-A)D=@htjbd=T{Lw%es~dY!Sk};D=`?
z7wl74nwt)dYy_FI+~{l5__lMop7LE}aLw+Vks3R5aUG6HCnuoN9V5(~V`V1GI!x-^
zWF95=h&9`AD_eF%-@cM<mspNv%;RNVj9=pVEF6n<M8|1ZKBSgy1wLFx$9Ll&Q@zc5
z=_d#B>niI$IU{Bh8NkGlm|$tpBV!bzIE8-f(P)c3OIz<8AI!x3Wm!0IqFMAjgI;MZ
z&0V`os#lt29G}Q(p1OUzhdz(?YGA*%Z0eTK^<#!)3N0iRX{K*`D&bkrl~tLPdxKWH
z6)9s+R%KqCHE^;vPVVbmmA+Fsblv1}^5x569rO#hyRGBV=|qs~=(~#{-h))niUdzN
zVPic^F6m2qlFtok2>RcTdGRxc9Vb0Ga{5RX{E0GGqQ7sHiZ3F8tQhQ=`bVXYDl<A1
zpEu8aP6;qo_jvJ{M$J4M>0fn=5l_(2F}omoVVE&@MIRgQlEcavZ_B2~7Ito4cY^U9
z(<`Nw&-$JxRFml&S8~}Mj4!P)Og@jwhR_zx7^dBy%#mQ$(PkF8@=`>wSoJCw$4yEK
zd<QN`l^OG*Pn~h2HC0<KOMWj|9p#KS>2K|TTu-Ipz`pCI?`6!b;tJ!<g2_He)J3~c
zIh)cB6j#cB$3+^DZ_rpw_ay07TzKhh3#T&!-#nAyT_k4rM4F8;h@~w1tJp1O(V6bc
zy;VieolhA9Q|zYS$Yep=UBHmk8&%%&2iV(AS?EyyT5!$gry#oeGNi;%Hr$M@^Zc9M
zW;4i{vW|$Q>QgIbdqsRVR*KrZW%I4v-S*11fv#se^{n+%S)1P98M!}ep|>w0-?WwK
zDmWi~{zM~hq48tlw+GLOu?I;$4g1`i_ji@w-#b=lWsyhu!UsRl*psPhU(!ojyNAy6
zy{&0|N-w!BMfb%#8y&*-P>muAT$^iSIdlkBW=Mege_tvdi;s!9?Yx9W@}cDp^#y{l
z5cuOvrt23vC1K}bFK@8+dvIxA;jJX^sH~QD07Ug)HDX0|Xa@2}Wu7!xuIz{28=MyR
zgf!E0%ek`WI=W>Gf7rPtZ=5n@uWFUFpkjDdD1LaOT=rRZKMmY4j1|AB&iDnL`r%?X
zi*<xHk7nEA>BdE7>rEa0R4J&Q03Rl*x{FKX4qWZZ3?_58Jx}xwt>k7FS|4nnHta|{
z*L{NHJ|^}Euq{{yez#>Pk56EwG}H1L4|}ZIez=i6c(Xl`U#jo2;X{F6-M2={D@HS}
zkg_$tQi1koVv2*RUq0t?6=j}#JAAjQ4*uNJLV50~e31H%Uxv>s<^HwzyHz{eU)`ep
z-ZMFQdTh+Ed)(R|Jxq3zyNI73Q8AZs=nWC)YkPb3S4UBr%bH?5`pcbtTNbw;;lf5=
z-QyL4F%Cb%#qHp!p1z7XV)HsQhYRo<lyPDEE)5UKJ<PE+0;A)=+gnLKw;3tvxlSBx
zDQ%+4ul74j9s-=sox7f^%-v#iEp{@0gOEFcUi%e>cw2bvU8Z(U$!@Ryolm_zZJfWw
ziB--0+79cDk9qzZUs%FtX)ba#_RLm?PkrS&l%7Kw=E5G8bx}G<E$tlY(Ur;id4e4t
zeesquPp;qN>*oEQP{Sox4Q*#Kd3Tw0xs~-eSrhS~nCgKqU!PO~h@(h4_S#@jy>xo!
zkJN{*l^t@-S0s8w4mLR3#e~0IN2=O|T|a!!g^}sAKiFQ-K3v7AfyYl2exwB+owGmL
z`*yS={`}<do72h6T#c${SzLg39Ol`3o#uDh_b)U|b#yc_!#j^I+4fNl(gn0}=aN40
zxo!uOw(a0Mm*GGKLrfT%tB4nhL&|Mnp_=qHbFGX5OZ0c)91faH*1UA44inwN#V1ld
zrgM^qInJ+=>@Ir=aHj%gk_gn)h16SgkegCqhcd{AHOO_;S$Ykcdu24A9R@Ak3L-S1
z_GM5jrzF0d_hGi_H&FAbsM!E1+HhN1pHW!(5GtdrA>I~t6ZL+uBz--uh`|P=m(8Xf
z*S8IX7Z6|&o0V7s%-05b#$a1O1H&=8tv!tRm5F2=#fag@R3FK0+m!6a7qJ16892@x
zc-DwE_#8RGVVS3Z#KRPsz}0tu`qfB%S**3_#Ryvp)=Rs7p6MvM|H360_bKM9Qir;i
z)_j+kq&1nZCB!<6G1*A7db`JN(g%cTe5s9pS0B%M9nBnwW~+nAgk4fRiAsRPZG8v>
zcDOll#T1U2fK5(yEEw@)+Q%>#i{%8|px==-Y(dYPLoiV`@>ggd;>y`?N0uc4xTkND
zN2z4QZu97rL)OulAPtOYB!_o7&o^n9w=MQ(Ip*UhEO=Xir2>1+oo%_ObqY)8&0kqv
zz>AUL_0-_wWSA9W;Fgk6JR`%@GR%RFEn3Awjl|{d>YcJrJmoZg%9TOr_PCrPevJOx
z=w*J)99}p)Q8@atusAPW^19HoivqX%9?@&?|KwxWC-SEy#%6dZe80h*TOm?>`7r}j
z#8X4GPDW6RK{VS#G`~XZqx)dah31RpYY#?5M=p!Kye!_d4ZCxi{=^e3@k(F9X)|;*
zzc#m3NR3|z$w(ngPZ@&Y!MJ59drZcHmf{kFGC2Gq|9B%#R^hR%@&sK$Yc1QB%y5w0
z2wrX@Q%(<QlguF5BvqhK`Xy(F|B^5Np|G6bdF0SxBa(mS&W^mTv4VZ2g4LRWr!jul
zUGYddXq<O+_!j<{K~jfKfzwgpw(QxJ2&NQIuWD);QY8(TF=_ZhuS5^GirBjxZ62xx
zngAS&BACmvRo0vr(#($*!^=x9@kneUW(v@|I|x-5u2BNax%eT(2G)t?30Ol^U>QhZ
z^5LFki@Fl&1o#Cf%*{&z{9fNqy;MKn(_S(Gh2z!FPO6`%F=@Wk*Hn0-uIKgjqFm8r
zE2`H<{Vjnx%uPI7R?Gg0mb9FP%@yslRoeEO+SgDjm(G8e8+yP{OuGv76mElx$jZLo
zk(H2D-d|9aUgA+PlxZZe=swOVXl2>p1sr9<HG?p7ZJXAa_{XdGQrTB50?cm+y1Yzl
zZkH}vRW*K*yZEt6;e!|ZHzvambR!P&I!)t-U!NHM@-j+6vqj4#ezz&PF?|0J3!Ndl
z*Mc#^HnI^5^q~ONqc+A20z<kJ28E}s$8jF=qK1iR;Sl2n0P@OJ&dpZX<=4s;Ph=Xg
ztE-tXZTga2Qi+I$0k<3&baf8)+K`sc%&D>>>9zbx+8a|$5ky_o+<(H%;&EBtYhG^V
zL|+DQu?`0Jm<pYXS#L!Mgj|r+U^T*`WPqyYcp+X3v>^OdKN5!*kn0f00m`H~WotFd
zta^t;wb=?k_+j#T64Quf@Lh1nx^T&fkBKdChCelker+zvVk>K6tB_=?yt`NH{b;qV
zL!a?svrWy#QG!0+SUH;p)rQHDqseGxgiT>C;Hf~F1c44#`YDY0?oDu#_3H)WO7JzI
z4mt>M$C(#-><SaG<!r>#C0~&dzAG<2Wn0SPRB7T=ljPKZvU}rz;_?jl5~XV%GkNe;
zRtbAG5~ylLrc8)-1wz;|NZ>Q0n7emnP9~=?(^D8{GPudcp*-86Ms9UDsPquXen^nn
z&xG?lc0}eHG?;h@J@XKK>rwc_sY#eKj(lP46+D=T*jr&I0q!XC)11O{TLM%YNOS?>
zR|AJJY;A-s6Pb$&-r!wV@SYMx!A9^kEoc=XAju<;jaIag;dx8o+w*w#>|Wa2doT9Z
zWPHL^eJs5lcv7*@Clw|o3$Q6(IdeSK1pu1Nh)JTOHh&AZ#6m1_A0K3bjau0cfe-Ys
zD7QWPrVyVI#~Pj<mQ);lBbg`IWp@VWcm%xnQ|n&lwIJ5yAWl<{mkQzWywC!`1@Am~
z9KrX_O>T{BFG1UoF?rd^wz?CQAp4Fbo-i`cWj5Jh50Bx@??vBvG;ItDr-GcO!(7?I
zA2A1;*_9UX(^b^OPj0%k*ioK{r;Q!d_i@lGttMSyN|Q&FRtPJJ4PKydulP)OrD=3c
za&)v?_*JU<oB`)+wk*Mfh&K_KVc4lUDohEPv0H<C`-e~^e^A48>^HW!Z~M_#?fP!;
zW6JiHu(!Fwuuu@Yd{hvwW$E^+spA*LI1GCtKl}YXUtENNOaQOxwGLE^_akeY;D#}|
z>P*-S`C*xc3ENK(F0;gIDNilfolc*{1(!UGw_#y%m0t{sj}}iPW1&e?m~J+?tZHS|
z1=u+AQ_-oXkIhn^nc1G$oW<Q5;n2+7y~QRk{4|ySe95P%r3)G*$KRN{js46*7?k#t
zZ&UO~;PW)8=P4=AXHz_$-@`cr*{kt#1|4>3fG3yoYh%fXA~w0A1q4Mp^~Gbh0iBwe
zpG?4**xK}L?Wau)Oyfj^3&jx2L=oDaTU2tE*<_rVSyxfY#;|8l3-Htmg<R5rADvCy
z=XHJ?FK4}h2=n2Q8ohkgmb-*>jx*JrXGWwP$N~UnJC$+91Z5X8a}qQ2Tx&T~foz|k
zY?O)c?a%qyN@Yp)`5zq$G?e0W%yBSN`TEvm{@Xkp_){aba@%dljmli(4g`zYD^B)k
zJQJJ5{n(fVh7$=OTRomD8OQ{~GZ1Y!T!1XvnJAY976%{;49Hxzz_M{rfK)DLwcttx
zGQ(`pB{QNF6ijM1tUR;gvqRpG)FgGzew79kZkA2cqVQ{SVNVA`kuOg$$<sgs<-zfM
zF6c74S`Ly4pCNE++VBL}z`op*Q{69KP%`?clqb)Lf@PwJZEOG=BnvOnsEutGM-K=>
z7y+4@u}A<flF-J6vq1*eH?$}>W-B8FGV4X}qj$*+F$*k4_*mgtwwQ&cr3Owy5Q31&
zu6Up0AeAMSgGmC&givv6SfE@olmouaCbPoTCNDpY{rDFPY=I#c&y@>gHnKrG*q~47
zIXmPVIUU;S=xmsBZSo|6s720}9a1~HU*}5iE8s!}b7M!){nwneue+9Bi`#NuTjF?6
zeA&H#XylNOQIOXJA|noKjn9^p8rQ7|XNhwn2tkdm_{vKQ`K)bhgv@fvh_3-(8FIkT
z$%RsSfOO!k$7e!PGEq~Ojjlk102j+Pp=8Cfd4dERCm@Y%I9P%Z5;jQ09Ni3QWDnO-
z%ECr&t@!1KZX_ZAnZx`|uumk^#xI6Xr2I#`@Md!0PV0a|Q+_zdzytsR;zR)O4A>)C
zX{(8|R$LcU;HK$_^?KMg2}N#YyZa!>&r)72lMS-KxlQox31U11tWZGtoNuiR+ieUN
zZCEy1xf2$OPiZ9N&T}8xaH_!j6taU~G%EE@)ppINTY2?&EijA|(Ao<O5{;-b-ugPr
zp0S?{uuS$`AZl(dYl!Q^4{jzFASyM89o7U%1EQJ%qe2ZRKwFk1aDh3a^ENLMl0JBJ
z$goX7;dmP-08CuRjtxL&GVVQRz}u7smV*X%C^u&r@VP5+q-!DnoBszoe4A~+)T;%C
zPBKf`!eHEeq>IhU9%<#e>MD4C)rN;zAQQf<{K?-cDCnHLL>a6A&^?z)%ZCT;;7gkA
zSvJ}jQd^Ol-}D82W!eMQLx`B}OxgfE)6~q|i3TPh8FaFA9Q8P@qzlO0Zt*@1&j46p
z;d?%?V?EDm!vV17I<ShBXxjv4bh+Xg8e4~u0rP8(oeQ{8KmV0W&$EISK6fp!G?P#`
z8zv={&P<Nwb5kF8a9m}01~QI;1xPPIq|O3x_Ri+F;6OY$nyI-~H4CsQ3H1Gb%LIT$
zj0`j-pzWH6T?3KnN~_tw7#IRkGu$YKz@f~5M1C+Xtd*NUKf#B0KjMYjeToqe+B{r<
zCd;i1s~)`#WHc#`31XL>v7uX6mEFc))&sAF5Nm<|Cxj{OtzPUugsF^xl#(@zbVs$Y
z!AYu0jZ52Bh0u^N;UVF6W0k{<9FEk<K484Ua3)>p-h00DLIxx8`U*E>!{BTrb=AEq
zK!J_hllhB8c<`HI&N7u}_3{l59mk4QE<cj@r&HLNb*UO>16SLlhxwRPKYa>=U7U8Y
ziWC4yfl$SIB%@0Po4k}I=K?b=6lW7xe$JY*;&4@q&K8lj3E9-)EW!n8xBL9zzX{VS
zr`hKDts7nQbaDF)vKwy-&r~0-&?UN>a0Vw?(>lwHU|O)?G_@Dc9Ab;V{={0F^(Z&)
zZ!HVCXvn@dkH=2+Hv}Tpnh$@1Bo~`sl+ViLg}wmUvP@Y`$b}dvP&<ag&n(-WJba{h
zu=R`_OnVVbFIBc41anD?On`9JC_)EVOYTfBgiq^U*5Ziv0!Oo5&r7C^BNue|jfVi2
zsrBXL@tSr@UQfGOy#U5+bW8%(rnYhAt?JYhOdgty8k*fiR_o>RaD!H=vv$|6KX9jw
zKf79$Y8X;$Vw>t%(swJ({j>H9&1RsGC4c0ytPW}?hLK8U{HN`6wbAoB&v8NOd(o_i
z`?43+P<7k->4_H)M$bH&<Bd`)t@;?JoMIl8ueK-fC004M+qMt8urEs|6A-gR^9t6)
zpvkyp6y;P>zcCZ<@6zub`LrFO=Um>+6J5l5Rqm2j*z0+jE;ODVeUo_ranj~oHDS`Q
zUj5c(R`bc?#+K-#8dK3bD4i<_E-100fs%S-(}wre#&SWDm12{eu1)%gOo^It9%)x*
zfGnqE^#FrSF=0iO-o2ASmRhJ3I>bIFx}d47$NXX6R*!Kn>q|Om%s}CxXSnv;UM6GG
z*z+!#5q*@J&h++><gtK=5r5WnOyzK8gu5o^o%9YvmMkVuDm9-g(mm*q{jqoqUigCN
zl)3A<gi^-9E4ocL;tcM-yY<50Zu0A~;JdRfZ|Qp8R?TnUoxl6x=q`uHw;`VowO5Pe
z-v_60C!E`Ld!(p!wF*6iGh@mgAw?@ljNSvA$#&koYU)WNS-OuN=7w*bglMC#2*uw2
zV&V7I$E3Rv;kRBfa?$T=b;o<corBLg6J|AX9e$hbNW;d9bv1}*W<z2lhih7FC?aCe
z@Pj@ZEtM4L$G~+%8~`a6hzBeRk^FzIIt8k1e<^KIC7U4;Ez{^a^~f)~qEALduSS&T
ziCYgQ(gZEL21d_>u|c+@MVxzBJ_3ftZb>7?<n4Hjq3XFC;cfKe;oj?OBpNlgXM6wv
zKye?+Mnz<cBe{iwK2e`BfdYU;w=lUP8|}GQ_>?{{?Cc=<+}uK3fLxF<#AyT>qNo|z
znN1rzuA>qQ==7cJ2tqv}XjGT;sQqw@wp{1Xc7}FK@fn5+$er-QbV%*!SQL#A7l5t{
z+M{@ZKHO^XsTkMQp3dj|bo~{JqK(-2bGz<XpW0_HoTVitokOC~p%LPf)SW69JQBeR
zBreIw^Bf7~p*&}8V9LSjv?L=Sl2R_fg6hyO@OWCC$uD@Fb|9>C#07m@6IDTqGyQTo
zB+2fjWFUK@LF(3HF8l&DA4-F181PhvDp&SJANtzH_PN~T+^$<@3XxU3P?M@$g=>3S
z4p9>+?d!|z6TU#hZa3yZu2;(br-xjldJqYTue#dZkty@pFnn3)xs%)F*3F)z8)Ei4
zDv{boATns))CSx+b}{$@Q|uO%uvV}QO|;_^>{5Kv@W~n2<)2WmEP)>+{Mle5uc#%E
zuoy_w*lavGxGam;TUTxQlJTQsb*rV`e8Vo;%PFv@u68l4(AfJ|r0hB$BXM6YWn&Sx
zN|a{wJF7;eUldZ0y$UVnHBkleh9yxyc=25YW&>K<@&%VbdJi+rF{n2W?+Rqu7dv%U
zDNO|zX`t@?Smh2TW;DZgu{U2A+Q_Hq1BF>0vY0yFU=<}oBeDU2QJfA3X}ZI)+Q65)
zNG*nl9O=G{F@vh}X^PIYQ`+>4?tE2LRyM^?GQNJ|6<&1<Z_!pT^}6wEv1=D}b`Dk(
zJ7zj^=9US4Aj0QX!%?v(g)nWV{GZ`#>B4<m{zTaNj;(uInG3FieSR~_r;#zu<@)Ib
z*tgX&$HPifmaOdeR`SmpzZaMKe|QqK&k)LKF)GRWlNT}(DRS#ceGk)NVd2mBK5g{Y
zW%quGM10{>4B2r|M_ISgnHfZRUaacQMeRprT&z`rxs*j3($CYx`F71%#f^J-$MVnd
z@^tl4bk(+KKe6yG9JORrApP=IfnsSJdF$u^9j96JDy^<Q93vqdZ^qQq+j!bNzBJ}$
z5#nBvg%r(G<5$R|;#agX13E055i!QP`vVN+9!VeQ?Soy+ioV-cehEO6JvR&BrBE_<
zV~k2|ux*&h-7_8e=+pJ#l)`<ocF8b_PW?o=lY_6CO^qaWTk_QXiS(pTS+f2pLoYJz
zOTdqk_EgjrW6d|AXS`lrhp!<6?ia4<e#;>*fQ<D-FdVx*OHA8N;hXi?wxp^;+ehnm
zJ9nnky28=I%+V6`Ig{YqG}2z@cm~j+Zy*cR>Q(1Zu7N+N`z31X0=w2<G}}~vZv*p9
zmdD{b3D_Adn5S$W<+RUha=Z_bj8CAkj)=OFtE9uvf$lSD5;1}3)Z)6`H$%W%JTII&
z6}49$UjC82knlac`KJ}V)8HbaD_N>;<k9w%4?^>*@UOD!dKg0zi7xgF5MSl)`apD<
zN1?I{z0nqZie$s0qu4VVb+^jTRO2K8bkBS;H`gmSx}W193_<)xq?g7nebQFenT!)H
z$T*o}2ntxvI`s2+TIm0^)aIT+T{)f0rqs1FuY88RW8)JP{8<|F)O|LH7H)J@aKg8_
zkLn7(Wpte!I*Jl9h;^jm{`t*g?1LwQP+vXz8H^6GG+<(QcQpDvzf0+9!GO{0majq7
zk2iH#m)*m7aNuvycbfe7Z_!$(OVBCF67XUtY3?dz2~V#bo=r9K2#mOa0*%$HJupO(
zXL<HSHKac2#QBdsYtDVq`>CXH3^pUV%t@Gk)so*G{X#S$^0@crR+_}2$SG^=FR>K0
zs0C_&H$JG6#SO-fA6!>HO1}v|xvQGwPZL3OE%%pSxw-gEDa4IRhZyjBk-Fltt^rBQ
z0c+c)@PHvFC~HUe$2Q%8ky3~hRM0bsy*B6=5X1l#7JO{=!k$R08zP^Frpt5sRd$OW
zh+MLveR|6LfE-Zob9Z(%U=dGPxEl)L4P81Dat8X4CL$z+8Zm?8u_A%^NT{p2sLfHJ
zA~TO!xcRhZ*i8q2id=e|?Y^<FX%HE*!izLdM!A@x2*Nx8guvjdVSa3C_IY7}$^OpC
z*S?Y=RwTq1GIE~`c|S^Rh%#3Ur?xLcmXqinZ&H<GQ5ghk6I8%4DqJC)CZQG?>JSmZ
zMrZE^p^~PhqzI33Clt~&lHP{E{gL=O0`-<AqK?fjSkc6a43fZ7sgonQQDB)@2r?1m
zLZag)Meq@*v#OE9SWqX9z8Q;pA&lzHiy8bB-6|YIM$vIgp~}giax!FR6*3Hc1aG5L
zz7_q=6eSc7>>x$|i16r$2MQ5=ynG*VOZhz}MVMewgP$PnpOAb2BzY8QM|k*FIQ*Cl
z0ewaeenK8nKvZljXp5@&BT|qAr#_8>en!mz;{;EmRN{g8ggDWB=lpn}N?Dxir+BI{
za7KItRU{O23G|hW{Ne`T!`{i*kC(sqIP+%0F);z004`?(*OMV<-zBKLLv2Y>{~#o8
zMw}!%wkBH8IyuGz9}s;qNL0F~pHR6&?1)J9QQ+q06Qy?u@@52g8S>_7lzmE)(`V$3
z^GUiXlrut2Mv*gE(9vkprJtz#K2NK4VeDm8mY<W;Ou+0on6D6$(uOJsKu!yz-jG1t
zQnV5P_`}GQmt;^<is$wyP&hs+{c{TGb7WFv%7aMI+0)1~SWpISf)RTfG6>T5EP1g9
z!A=0holke~jt&+?DhpE_)Mqf8aGJJsNJ2WT^z%k(gmHXmOTMS@yX3CV&vC0y%}LJ_
z1z@k_Gkl-Xx1W#u(3b(fi|%vFxOXLJE8o++HTi4gi(TfF#q%$$s^Dfup+_kvx7$*H
z<|!{|IIP0l(Cb)|)g-k44Jjol;}ii3b<AvDNn{7SK-X&>7*XSTGo8C>SZzqGj#;TI
zPZQa*ECs?uFF5e00_91GLKm`4<>?dhvn1-ZeDkvJCS|nOQOTNTYlvLxD5GM{%sf}G
zRhgG_y&E9~%L$8z{cjSccfRDhrsjqbppFEPZvP8|8I7+IuPzo)3rFSz!t#Pd{w7Sr
zqw*sE5T=j5<i)}A6GZYKQwUSX{AU!ov>>0=9c120@~hVppe?x4jmQ~&r9v#oFDNMN
zKPf0qEnsyAmx~luUMPHhAI!Q?P*+gc@TH*4v9RSrVQqh5$AzN8FNLj9MeXKA0|kXW
zQAMo<MS~*6rKv!QWjdx*{H`C&6%V8Ytf$NiMcvT6B+8NE_pp*GkrH-X$v^?Mc`FU4
zQh|l$Q<Jl$p!?|lc*L*%(xWe>$MvwD+bGtpQVL!Qaze8c%IIcGp=(I0fikpc*-wsg
zI?l46uSM4hFHVt4nFmT)=^oc*mAAhu=Sf3g{Yp6>CZFbfvE5sKYPMAPmzC77QiKHt
zrdJ7%F0WHBKig2snkFh?Q6VK-$=*<|F;J!@TA|}qabck1WHN1ef%;va)(+~#)KE{B
z|5t@(bm8DrpcA?Bvs<BZ8bOh>8X;Pxx>n_$^;(y++^L~Tz@pqu@AMtz8ms8nEZ)zr
zD5E2>^4J-Tol%Gx<x697jkahFk6umfb~Zt;(pI$e=34Dp<?4ur*9Orw?tXQyX>~HT
zH7v7rjoWpQhT3ptgO$@fErg83Cs54I`iz09^k0eQ6SY!wbuz{calbOMI2(MF8yeGU
z&vVw7aW(>!8(SOdr2QI8*9><0I3Ho%lo@Y;GLhArunc=O_K(P&O`QElo2Kr@E$Mn{
zi~9P+2DD#;tY<TGT66DO^@(}2^K8R%LnDi9vzkRq(pvQvXLH&27eJ*Gw8JKRiD;{I
z3bldrMinTX=@6bGBhpD)@>4C_7LEPC8Z0ZDsb`zN_@N&UlyR;%xBInqrZr;HT6UFN
z4k^LFLdt&y=aK!KA!KSn{+m=|&?tMgt3=3GX*vgTz{RlJ67-lozX~B|Y4*8N>|opV
z=;nqrdCiy>eid2Gx%T?)x~nmw*PJ`m4=?a2A*xK#w@s|Fi1hvU)an#aw{CS?it#K(
zchv=V-dO8on`@&h>=bBhu}JSaUDPA2U*X!=6FAr7EOy@PEp%}gMLgvoRtq;K)6_iE
zC~c*^Cxzhcu?K4QE^;;y>3h7>J3V6*-5>NA5B6Lxk~eqm&yzi=(B-Jut?Um;@3Znk
zRvO`n7U+-UdUqLwqCQV4vA0}>=gvUi>RO*idQQRPw(RuRY4ig@gXJC0UArm$1!6<R
z^n>rc5VJX2mY&EZ^3VtRVe&e)XY0V*7<{S9P`+_Pf1~`zf#CtM-p>#E$L9ufisH`Z
zl<zqYZ(pIG72~-zh;(vBH4-7zcSdRaN12zY?@ysVl1J&`=)KL+mc|kK^8TqJyjoOF
zf|J@BeSdz)FdKaQ&79VY8I4m`V*@uuAqmj+MINQqw2EE>AFR?d^@$#Ngo6}yzdRyD
ziuwi$*@c^+G^w7pLjSbX;TRg*%O1lNE3rNrF(-{^8=SmhsT`kQ<y^5TjZA+7+EPO_
z3B$aQ)+E_Go3a~5p`}KXSH;o7Lt3BfCfRZ(g~Z=jEKfN<dfQ+_+a(445KmKcgU%-&
zS~Gq+i%g^8CORtxO#)n3QIL&2hZ=5Zx{5_Ly7?JP-K5H#x;Ia98`AO_dY36~IA<sB
zL!j%5r|u=t5;dPbYW3ZcLKtk)WtG{+-;u8VinK=2He%h>kKBlzbVpU8Y2q_ocjkJA
zu4<4Gx#C>+h!(*zh%79=x`Ni4Kv#*PstcWcHT9<M95gHbbTzT>t=U=YO=~cIuDAI8
z+R*!{Q0aE`>t+_X51EoQqdK3<J%_#<H$R`~e}V{F5up&McL05<6;odyk!efFXTQH6
z8WPqSMW&N!e#X;KN=hRugdbIWIGFsvF-3Kb+V{ewY&!8hP4fuwE6?=6ErVKlu~?LZ
zDw=7C^I&r{l)|5Gj)v*UQrcj@@s1(Hm#Ev2NO(70EFK<!bifMMdLtmRFwuD#$qDW~
z6qT_NxjuN-+DH<_DszKOy+@E$nuBCKd%rq2KF`gwgQCKh$j`Q}?%2>3Hc+;yveI9X
zUKuFg_oxnSRM##~oX$i#2`OhVQP)XF5#Yz7>D{ELLr%^65Q8E--%z=))-upq<0e`*
z;h_P3dq%oG@rFMMv{&P22K;Fp04KWIs^|BxHemxuz~Qup8?rJM^>fsnlhx!<YAuVf
zxY{_sQ2vHpj^+u!tosJ)0I*h@I8PO{4jWrX;P1JrqI(HiSB~L`Voe?L(B7R7Q>_%}
zgOU_nnhjh1j;7rWr>FBr)FeV9Nyx7o$ZR*7pHj%YGl=|>FZ)SI8gVq0)#$xXYxBj^
zF-L9;@1chzq*^kR#N)w#&7+s}5pL)a{TBKGj<LB*6SCQb;<!PfN}mTqs>z7WF1q2b
znw3~s=_cJE4W>~F>fmPnyOfutwbe@b4*$Eamqus(n7kd?N_R+f`&zPOT({Z9`{kTC
ztak%}-|SKv*@^Bsc{^1`TUxgB2zM66>dtu0omIz;Q^@^UrR!JT2V<0*e~6moaT$<6
z6^NpWXTNLlY`9na#y_$A)1hBahd-Z=o}XS(#e7sn^}4-ozAL&#ur;<t?PYv>^o>}}
zJzLqtwJ}PSK;rp{Td{7XGbW1MWTiSJBYKU5iHkoEiS!1Wuxi}9Z}`~-BK`etzga)3
zgVBT1I3WWv^&PU|vF&cwCLAvX#Y@qc87(iA&m{Sq2e{Gb`B*BdA^1PJ8=7#Zx(fB!
z%zF}d;hD3&n~Ga*@|A@7*)jv|Y}tdm_)@IAMm&_}*70{8?*M}L4WhSskN5eW!|y_O
z_lWd5#1lx16g9wR=mRd88qT75H=Nvrt@PE}dHd;2>$OLRaK{@1WNtf}a{*MJrF)-?
zT-}%!Nuo{>lssNExNY}Ux6$1oAktBG^L;}6IZ9Sb&K+AJ(&+nW_Pkqfle^AFr>J7d
ziebUkV(YHdt7|4DR!sraoF?n06*q@6w9=BC$Ai)ur&F0VuM4PwLzZp#hdvZNNLr;=
z`7_$2Is#>c-&(8_xp_|>EjW!SP0A8ejn#KUbOt$WPe+BWTCfD_4A0XlB$ZiPM1H4U
zu%n9=4vegr9@jBq`r3v!73ycTo3)O<=7dOpDr6l$S;}<q*uqVr3%|s%^IhRNX>g%8
z_k=!l!kv>N#3AgPe}H|`p5O7tVSlQdP5gYL#IU-m19|Bq_-w%sd#KOF`zudXHg{e{
zx@+DmiS(Td7FDVSd>0Z9Zk)Zt=~E^;#QkhTQJoZ&lU1h4Xs9Wz#eB`KT#NO3X!$Ez
z#*_{g&YjyD+2qZ|QH)-wqq<Z(J=i0IzkAC*t-F8bR2=X6&a0^Fxj32gLYe8=*+B&k
zo!ZvTmp&;^b~`#^FEOON;^ovjq=r)uEf){26GaDKOqE52$puE?`7=&I9CK<La+Zo)
z-I>}iDhCeV&SI1Ov7<x3)hYa~(ICpHlfmwIy9c>nmT36u6QrUmF-UC8fpjm|ZBp$-
zd}8r)tUF9I`;Ayuoh_gLt*kL^i|s9Yb$~cmluB@FulS2^P>*OVgKg*;^V_dpR+~GO
zcAY7r4crRG1a^OZg(j~;Z}8XzatZgokI+{rH(NZNUo?4muglaTthevQy)|x!_(-CG
zKmxk$yUyUfj&b`4O2fE1IqR_RW4gf6l0ic#tBa!IW$NaF7yL(kOU!CVKX1W?3v}Vr
z>oEV7(Q)!*J}h(hyE^7#FmYrg;IMB9vjaKEjq=;bUraNg*_LZQX8ZDUR^<EGt0?#H
zm)_B#=lz(AP3^^{;#}h>&XC%6AAf{z?GKhYg5Q;B)4+J?yCm@5Hb=p^rGPUQCrx{+
z4X!OGkVe-q0>~@s^k}b8`svu@m!CYN*Y89{jvBaST#t2FWIopul>?K!!qK~AqI_aG
za3{4lc>KX=-i;`HJMBc1NLPgbR8kB*T`yM98s{z9xhd7apF3T*J8M<AbFpaS4(O3z
zlI(-kYpHqdR~8}_m@dhNf9pxYHusoe<bv5cub<>PsO!n4f7y%R{}Kg3<ft`?T#0By
zws+t!jJu{`J5d@|&~40X=VIKR+XQN}Bbhg*9gmjgS`22UYKJ@B>IHo8X&-Amm6HoM
za0p>5NumVxMni=(ZD3bx)#ElhEU4}+Tw6@wv{)__`}%Hp)yo6bN3VI4>EvKR9X1|^
zWf8#WtTVYbjw87aPKQZ#E?kRZE6U}ja<su~bB3MKy81&3;}|kMT2Yndw;qGN$~DMn
z$V7XI-r!NDXE^)O0-}L>jb|zuM)#vuM|F2BE^yL<Wd=Yal23h2Ybo1%gVI(<x)c_;
zoh{E68MbKp68*T516z7oQd>P=WGOiZApbAI^rg-sTIIDAb^OOq3+9*qf5P-lvFk%8
z%N3<-^;2(3e7c;hf7D-V-hERVNbO9ZRyJ*CnJNp{a=yXbVA_3VsyyzYvz?%_S-;6t
z#j`HwTk;KN!*{1DUr^t1&{8%ZPnxQFrFF;gYJ>Sy_0;Rqhj*NBo+w+)OifkSblq|B
zZm@X2J5|#{?c(-O*>aKPZEcU1i^tOj%hfY)>qZ{Bc)e7%`eO3-|67FV+yD0vrrJLB
zZ<<{0*38a-3-f7QIp=!+?d<!#ZlC5KO|AiZvmZ_%zOB@%Zo#aFDL~-=Y@I@(e_N+0
zB!U5jq;RKyS*M(AtQ6~%mxoJ`4@-eg#r_SQo>f;-)KFK~)57WL8~&x7QixOID_8$f
zPVN3poZA04;?&)qKp{@O9c?Mf>0iVt#W(eHyZsk&O2JLN@812#Hx2Q1qY$Sz{0qnY
zHLeC+iwd~=HBfGXsB<M)ej->eF692TP{rVfG5`3clVO)!B3@fZ;=L$w#7N>)q{+8P
z&4{R&|0bK-#~b~@O${C-)chxI`shi<lP6DHpIZDUZt9tG;~(GjFWfXeJ^e4=)Gxzv
zF5~83%IUv}(@c-7teovEr{Emt4>=DWzV!GPaoV|)>p^}+OwDVJ%J-_z&sZo3eN-5>
zQ|K34bg!tWh@zY(mOT1T=rpPPZ|F3?qLX5sCRZl?Wu5+CL#LVb+5cgkrvGJ~zG^P~
zPwVu5A3FVqIISD#>>ik;K&MSZeSblx10&NE=(Kfo<Ug&`j`8uotka&!>4C|=xzqm*
z>vZY=);j(0|68X{?+5EDKaP+zqInGJt3FTU85dd))xTbQTV^|uVbD<hb+*>?|EYC4
z|6i?B_}|v)CyhYpsXVNf>3>?M@eKcIotg&2Dc0!?^r;!QV7Tc2Vx4BwQLNK!xYoa|
z(|(F|DpN~dhKWA;$2vVA3m_z(lnEj(2nRi+|L@i*o?@M1{$-ug8}0sVgYf;fPWhZS
z@h|*i|0nCz^B?Q91NJ{yr?*1rYM=riSwXiegW>;Soz|7%CHcxLfC$JVUJ|@DN}vyN
zfnuGqCH}Ea)&H_i(Fo46|FBL|;1uh07<T4;yLxF$Y-k+v-_~gj0NTZNx&DuJT1T-?
zGo-@OIoC5O)@k_ySQ^z<@n5V{m*3WD%%$JfDVXlJbvne`w0?<VopOQV1Z>49)@k@3
z>-13ik98_1*2MK6)@kK$>vR}nTJ|sNG+duzoqCIjj*1HwQLNK&-z)=e=l^1z4)OkN
zoi^!EtkX3x#X9x;ZJm1Ro-T@^Sf}A!e_5v^tU`p}*6I6yS*NzYt<##a-_|J?2>#nT
zt^3P5^(OT9^Zsp}^7pY)tkV%D&LX$Jt<%7NtkdY<)@kBl+h5ixl4704!$Il`BN)&h
z>y+hh>-5b3V4ad7|J6E$*OCzbvQAz8wobhx;1uh$?2mOyVjze7W1YU?{o6WS2A?Mt
zKsgEji**|Lw{?2uk9CUq+dB29Sf|1Nqjl=>mvzehmvyR1u}&i>)@d0KF}d}EfnuG8
z?{~0SQLIxJav&#V57I;WW1WirZJknD7XD?OF5-B~TK{dGuK#VFexmxzI&ES8+d4HF
zr8|61u}<eG)~U%q)@k>@ty2ZSAM4b#^)KtxrIqHtTc>p=LG~tSmYIFy;+WT<^R4Y^
z=Nq*YZwe1NLcL;&NIehSk~=4g3HBa0I#hR!&fWOl@yM>dO}rU^^`4t}?4$qLGM){~
zgIaz7-V!7-O~vCFsKTf8UaD=j!On<nCOGlG?MSah+T0wE{Fs(>(kpmAuu9m%+mt~r
z=7&z;;pwPzNBKQ~P;lnM!MOZ%76bQQy`Xi8=xx-kY_~dO`rVCd%N5B`>hbo|gNCUx
zOxG4g*fhdFZ>AgzPeXR4haYq2V9HwCfyl`?^|K+_xf%uZ&&;KR2#)4h&+PL1dze<(
zt}BKST35EJ9q7AccwAW|kZUCT>z-KUN;?gaaQAB8iOAKLwf+NOpa6(=zTH&NC`-+h
z14|U|%muqoK`yk;F(_(q3jwZBW8Sq&-+06W5D@`Xt|9fETLZrrilkHs8k@4M1%G^4
z;sw;a#=L!@Zpd5W7&4`9&9g`c$bKdF@HB5|Ke&0wyZaX1xcaZ3A^H>Pyn6mddCe|l
zn;);mh-B&Eu-*{3sW0=f%+ISYcnWXN{U|ws=%ZrVkWSrE*Fwi?gI)}wLa0LXzMBh#
zTt4avv8z~f(z1{^N%9ER{JP=eski((uP^zy_eP!eHH{7ysyfg+=`r1|G4SVS^<ds>
z^ySK?*^Y@#O5d-~x|Jc1Zs~D;PY5qxx1UUJl0ETQ7lbUdmO}wS8vWterxhhoTkG}_
z>Z0*);-QhRIWe+T#_wsu3SPz{DYXg{N~5aBPY8maSa~jX6{a6Y=+VC3j5()bi=WJF
zDgu5Ak7Ifr@ar^6XwjuNdN(zj_h^w(=pK0MiyVAJQ5-yb-|82Zu?eSu_fOmzl_8hc
z!JdlS?6$wLk*KH|0mbr00-P-1@m8~K#c)z8?`cN-gV(&XKF4*KM@1d+n?Y)pTfPJD
ze#lgvEU7s_rEocouW4RZfxINI&Ev%$W=>;Y1w2c;&a+OV3KI;b-o9M+X6dVHXq_0~
z^cV6+mUUQ`Q@u5tbI{W>Usz2=S|G&$x?d+!Q#365Jw~iKbL#7Yu1HfWm(2U`HKr7M
zb`F}^PV}&+6_^HYep+KIb?O+nDWU3)8w1l$(QLZ$Yhijt(_h`4F=dTbLX^|E>YCy<
zl6v?oKgI_z>AKc0J7zP@x3J8E0;BHlU0gaRmfdV_nc>z(;W}FAM5H1E&4Fdp$5u6K
zm0B1h(BOEpm_C}n9^+<WriZpFxqBg*NwmF?EiPo>_%qmu950E^ApGJE{-C?ANQ^m;
zObQ?s@H72btJRCIhUik+?pr=rAbab-x56gwKll{+-qZ8Q5?jnlxav3WS=1KCe1|h$
ziPTmMc`p4)#IG6m#SJH@+q<E}bnRrS=L7R2iXN%BuU;&}b|FwKEA>LVI=!@doNJfZ
zDrXxNOF`<5hlEtDrzdK=>|(EdU@=8JHF6ZIHs1e;{9%tep&?RaxZmO_I*6GU37^LH
zt)ke3(U|1l;wcqHJT(eleim%KMNJV;Rk6r$GT4YBo{k2CgMW*syA<)X{f~IcOG~rt
zBVrm_o@ohQ1gi<q8W~X;Nm1935ZC__PkCw2pcJ&?{}xZnPzoPzh1z}M=w!xT7)3;B
zVHGLjX{W_SlQ0j(a0B<SBLQTC78V1bWAgNK*9|AKMQ8x2g^VH|_JXv3V4cadTV0lc
zC&Cf&Y>~Kx2n3&HqHkn!1k)2!Y*KP$#{O^dv`H!|$26)5U`$GmDyWSrnvN>jk1G4i
zIyH^1_KmKkh^NHg;wgj;4XH)8E5?NXh+dbCX-|&s|0AAi5u@0Hz`D0kO;TYL@pQ+>
z0X+U&JblN4Wvq=^{Fiw8{Ev7lnS`3Ah^JUuZ<F8R>AWI(OEE6dC~j#w?wj;&QMbRv
z)2N4FfHBSDDa$uf)EF}OzVUDIRCH5n4T{v-1SafV{h1Tr_D4K@r-*W0RVca&%KIap
zT7Ud4o{9pf&)!7|=DVmGfxeuy!bIbJ8UBc;$Nz|@(ogVa47#tVl1~|WyMbcuev79U
zDdMT;AMvy*)_W89sp7YIDgmIo{6{<uALZjejS`I1v<0XoE`vk?YSLGdgr3Mm<0Skw
z5<f4BogrO}ol?*Bd>joBJa5J>9S;M!(~FQ%^iohNX($W;WXGc7`cPb08pZ^84*;Fc
z9zEO&5zmt1;Xg0Vl*&n#S=KZR%s~{53s^7RLD=aZwZg8C^2N(&DCVRZ5nKZ&)hR&)
z*HzKMMNwEK?sG-joh5PE@0bPtbpL#rpdVI&t(Fxlpg@Xv>X96u3F5+{q(_tCClvCu
z4G?t}wcLkdC#5i;siXnujh|7If5g+5|A?n$z{H#jG`IB6RXyz%5V9S`)|rVP^g$Yp
zwclN~Z#$bVSm#mmM?9tbOFZ397yK+n5l>ZHNzP;g30xMe_jzmr41z@=NXaWGFm^QM
z7)8~C0<*`%V)Fkbp5ii;XR<-)Y*~tUT1Jg+1+1H)?BglYdWMHv#<!mc8FR$tRG398
zu%3)GhGiTRUSf$ai>Hx7*gxWFCFq_ID7+hzYy^7e0dl5@r?_Wub<)MFf5g*Dj~cSH
zo5(AQc$!EML#Ikm#8c)I3VBK?<~Wt-F7jJE<#t42>VZXkVybR*FCW_hBf;{yS&24)
z{CK!{0TO`%hm2+&lL7Q7Dn=~LHvp|<eKHyVK%;;wMujzBkOln(B}za>DJXh02P_SZ
z%LgIINNgE32naZ61;R)Gv=nf-AHanI!^lOWUy$P$il?HAi+$;smqD$I((Sh-e&M85
zai?o=5)wqQ8VY)PLwa2I%wOoK{A$S)5S_UCv*c8XOEg&FXLfxQ^mMdDQy_+ukY8(3
z2BM&+9)Hl&QM$_>pmp_v`0`@?&FA@8fIXIG^=E-T85uJA@)!mDNLvIjLP?3D1W)`b
zR?R9v<r$C!;0H%Q&t}n><CCq^D6A0>#0$XxDjqk_{>C2N$98kvj@Z2KVVH!12y1_2
zidpZ7248y39u&9$t%%MnLIYBS8>k&;QxLdp@TE#!rAjJb&FzM2ePY$IR3QWijQ?2>
zkF7cwt<qX6vPb0tj1WZ8T0@Iy9>#P#J>CN>z`z0l8O{EN%ebRgDa~1%YLWAlGj}B(
zMjxL8AQpk7D~{dh#W}#zBqaN2l|8X0v=Au`03Ns2m(Vp-=tVQy$HXb~GUG~)-5@YP
zVN^<;rxV~Qd$C+$BM9Hv{i_0G1XQs=eFFetSiq=x1*Dbg@c;mILI6ZK0U)h~$E{88
zot~@!niqdHYz+J#yxr$hlL5Cj`a1;@AVBD$hYnJtiAV_vp$iCtfJzBPKzbKxCe)xP
zRj?q^L{vnYiZoL|QRxB#B1NPqRVjj$ym|KC@29iR`FQ?;%-l1{<es&zb^RnQ-thbu
zt>UmRfRu5Yok#BM*X-S>JiJlD*zW)rC!_6}AqkXo8t8W>XF*`j0<yCFmJ(Rna_tAV
zc#|<r7=3PAWF1L?A5d+|C<_A_^EAY^H&-GQ-4jL?-C$jqv0bQ(2O8iD1T;E<t`0^o
z)cwag#T?MFVx7iq^c!Iq$s2TwHZ=2sz<RRNwvGOyfof^cb@;o}DWMB<z?x&y<ys?|
zF+*Db5MBs`ehudYvCF9k;hpeKzozT-XjfR9gkDgnuHAcm1dAQ<ouLYwu>ote3OJ#M
z9%|<l?%F-4@m_R>?#rloZ&0IY-2)*_(pP67XM?&6SH#IZ^hx6TyLI$Qbrwn~)UMRZ
zg~(y0&RW?<FF~_S0*E0fVuZj|0<ajUvl=2k7`4T(`6AcCxH@{cdF_*Tmyv&GJ}riE
z7ZvxE=YBBAQhOD|71#v6Mud11XhPBUJ!o)n7R#fJe4RQtXd708r5j{@GMY43$Y=4v
z!lJ^scyhT72}ow7mdhToV$G6U+VgKkcrJ)*XMyg$(G%FozF-HlBha9SteBkMuWj^O
zZFJ?K53j{O7-rpv=d#RUc{YNWd)Xf3Ec;$tzw~oq{eyl(u>t)yGyR|egdq)f2+}XM
z<r4p-#5iPir*Y0(4=zyHSJe~QNP}Qc&Mq{3w3MwDjci53$#w{^Jx3H8-VOAxF~hex
z+=uG@gJ|Rd1@3SYZuWt@lmP3-BGHCJzQMvhJ#<CR-b~j4*z?{xH25xs^H@HcS`%Fk
zJ1_!p`t)#0&#;~PM*lc;T<F2z(F{8t4aXAUHZ$Dh0hSIl{PqlYIhJLVi0A_P&)ac?
zq1lfJoQX5zN2TM%tK*5xW04$|uj<H4iKDgR!k63WeP_Xw*faVEFc_zz9PsX%4vWjc
zyYJ~N6hKaa2;u9ci#HX)K*JfT@VO1>kvjD60Awv}EdLvHR2{j|Hqn6XFJP!nd|l=K
z_MF?Wj_qYBYkA_B)ZxTRFN%DiI55yTp7q&KY#P(Uxf9IHCQiq5a_S<xKlCDdR@rOS
zxuTHYMhC`@?AY=Rq0dy2qO065iEywK`;2%$?=AS|0Hnc=<7Lh_@ZiL%;dgQwePl+~
zR(g7(r&}iLJ299`qGB>l{5wn1%+NQ;Zz94F+rN_4vxl7JbDtHO8s@iUX;q(C6Z^hw
z^W7SQ!Vo6?i>Fm?O@;zI5cj#k)iFaXYi-!f-yBx_05l6bW#T^TImPW$GJCW!>9_%H
zpiG>e`Vny?6w+oaUxQo5(v)3|mS=32(RA)tT;K-qvfZNS1{uQ0Wf=_P?oL4N5s-T`
zgZzU_2b869<YHvW&p1!ZM$=3fjl$EA0wgO7^w1VGm$Xx<+=DQmfnVu~ysZPjTx)+e
zxi7y;T5c{`Zs}NVn_BKTTBb;>&@d~V?kn$-R{j_3l&O{`t&Wwf601!uoYhL!xGiFr
z%1iF43!()REYrg+RjjEge=I;W_GyVVUW9LI*&1K*<!6g)%KYm=vcD!m#Px!fZiFqm
zo}hsn7QZFaz-Q@8?kFu4v|5d^GJy+xX5*9B1}J%h(+I^aiRLj<<Ufvv97n%<z9@9C
zK2qQ5pw_wNz8>8EN9FDBWJcK^b?#2p>^}pz%@fn~lSZ4z-)>?iH;HAN*!2O;?9D!q
zoT=oNxg^TOW6PK!bcTD&K6~p^{T3z*lDhiC?$)+l+cxR<5BGlhh0yK6-(B8s>6y7Z
z23e?}7dyTWH;vwI+0}hY{mpW<cqcj(72CfPFZs7mWBY{1c9PU?%JkM*qra!m>=Mt2
zrN8}?)i0FIv`#&CuXAtTp5DE6ZBJivFJ5EMVQud!=%0$(zkBPVH92fG*n!j67BkA|
zJu}<2>l>M3`z}WNkKc-^Mhxh4vnbbbXGfrF)Ri<Y@2mGCI=BxsxlnZO{5FrxZpJ?K
z;r>TZ$}`wI6*W3}O-P@C%2)ST{Ms+{?crYsuA||%sFU8tkqt*HMhaJh4qOmROyzXT
zgRygsv6Fomr^48sW*l)NMWI}>|JOR@-+ecUC-cbJYQHAWnq~<fuigE_a?j|0u}(EE
z_5H^>wJAOoz4l`~e?jUdE{*FO(Hp|=%YXY`O5O*UeYO1~+eg=V-b;zq6rS~Ana|03
z>e+Qm?#2eQwx6#xN%iZ_%ym5GzpT?Wx3;U>Yx7^P$TvL}o$|N2IJV*0$*mgVGF!Ld
zC6+07rpk5v&-@2F6#i7r8%5uNGSh6X=T}+$=p{1wzU{Zi%TI!xyEhpZzwQK2zKLF6
z_$IpG(DXd*_$A*c$n2wc;j-dWlY5(;JziSA9Z~3jrSX@6MQW`rL(5<93;C^lJ-E8{
zbL55Jw9pd!?|#qw@hMT?rK^;4-Y-sjM1}VWj;~8Oi6wiTV(>cVXadS21I6IG#$i-O
z*7awG2(95TJePixjRZ-e5~=0u6Imnut3x#0R8ZmAZ^eZ>8a7>mfv&$z_j_`4^+a*r
zY4zC#{1Fz?%+q&^Qrne5%|F+@Oizgv7397BV(n^Or_{Lh!s^{r^I1z(zRxQ(nNQlA
z*4m$ImTz!waO5|bZZ%rGJ-N&uYVM?Rq1P7kfbP(b;cHytIKgpZ%Z_2f$8tH1vmD{5
zv@n?vH8cv3EI4be)TsTr$;uUHZ-*C%9^Qg}-*R+xI2S#l$0EIb&c*w7w3@^Dm)lOR
zkt64{o&C1Aoe3!?o{YLVxIJRI$Q$W3Zi{ZXbY7uasyA0eQOoE2NyTN^i%y3dbTI`n
zC8rVhv=e__qi}LDuGVRp0FgD%)H)dsuHKO{myQL9=Z>`|e<j;7!P5@`WGo1#7$`M6
zdSU5x-L;Gg01|nD37#s9%{NU(>F?~$Nqrg7wF^TNu&y6b%|hk2yU&BXt{2w_d8P@=
z_lg3*6ua+iYz!+4&>?>H>@A$mKmW=^zN`NFc;w71S<I5g$++69A<Je&$+WnXc_ICu
zl;4ru*tl}-l1X4>Y?1{Ek0|RrU+_iehg8@>SaKoRzfd$da?I)a!ns=1S24fIu=4X{
z|2M`6Pw5sJwni!1`Nc=WI`0KLdw<G~+ivLmV88qGmFPP8RU*-gtfE*NP_?R}cX`aa
z=&+Wl_44|O%MPW30SWd0fTy#Gq$&K#jO8J>bc?JTv$sc!B>|UG5OCDR1W(l|r7V%P
z{{c_YEf8X}D!KH(!P7G3S62l9%_KMkeiTFT0uW2D`B?6m&z3C-V*x1g9!uPNVCGy8
z5jh|+kN%#%d?_?uAP_J?Bf*i_QV0?tG5|5Gx@To*qH$y@km*Mv+u;G_#&7rCPwJ!I
z*`+h<f;b-ezyY5%DS0I2YtP_|rEj=MFl7dx^ImiQZi*nFPMrsG^vwZcd?Fv~OVkWe
zWEh(?z#(ZOLNr$J<p6V*vg*oi0OX}rDM1(FXt90!Tg%W$<sL#?k39rHd1Z<Zq-)8R
z0-^A^Ozx{Cd@AWAm3KDMPMzg~O8z)RL=O0ztcUog*moV`L@>0m_>?RbB>E}<q9uDt
z$>wgJNcxaj?2oT_-T_di1rdZSqkz#7of)y5(zXCm@Ij7YWGWHh|0ydZ!`tptMkx$!
zqBJ1xnBBk3bxThjtGvl5q-P8)-*l*C1?+O5LCG9I=tTfzhi%EQu8o@bJjMSxy(Ocm
zG@1JiL7Z*poxb|#y8!YrxBfU7RIO=!+~5+9^H{4Rdx7bo=p?>UG55H!3E{O*nRXeg
zHiyqJc%*@%qHwlHGU~U~gt~&|H3F9vfCh_n5l?;>?rqWl#5lqhO@?<(cilkJ<Bh0^
zv-eazbvXeP>b{;-M2(<q^o_!N1rrJ62WeZiN6Nkar}fc8w&~bPb~j!e_rG&>F)C%Q
zkL*4z2<E~{HKh5~i7bm(+phomBjpTW=cLOaK&e)AX@P}>Tyipa7z+$Bty9|ohdX9G
z5P<N&WQ)~^A<qAb{3=J<tzX2j`m#)%B@r&h;SK7*RI;+icJG$n>nj%6sY9~iF7}qW
zWMY9VpVeGvdfdgyzJQvhb4VUJu&vLy@#B!3a`p1p7g+BQ1!HbkN&1KPL#>AdEoW3z
z*^wk$_#7AaGZLuqnFA2_I-r0B%hO8&L3E8pL)1e#P*{#pO8{tmM2^>hkyyGB?Ovs6
zpvyQ;2;mDiqWYm!0Obu1(+Rr2VzRF|^lkn6<^{09^Hal_?%NGt#FApm|H82zADQ76
z)rQ~@n*=Y@)tJu1Oo{nwHUN;t2F9j_!*|oMK<cYY>a3v(VJpC%Jq@HT2)s_MKmHTP
zkd3pnb#s^V!vbPJ$?oYHJUM<;mx(Fz$KKJ3g%QDFpLh<J-5SJ5J^+>wb_EG!F<uwQ
z(8mgg$Amz&cKvXZ6Mll}4F$a*E(klCEnxE<q`UdM$Zb^D4d14_j#*2)QCL8au!i^d
zG~jqqUY1wSQuSqY>{Ftu#_+)M*(E=eU(mg<M;)$@v{rv*)PP6%>$|=LdG<caxgbre
ztCEz(0#5h~xa%QN^*4LV%sDRVPv!XOhQDOT-zm*gtpNb}Qj1H+$z$&qVqOpCuLK1?
z<}2|%$H`6v!Cv<vOS!Hjzgi8BeZQ|W6LO_}H8J$4?c&t_!pT(~Vki;jI>XqLxb&7Y
zDXe24ex@{>4o1}hE|^LPBDNW_zX@E|B7RG!)+PI#T2|Ig04+Sq5|zLb^W)}Vyo8za
z!8~BN1qDhAqjNuvNt3Le5aYHWvY51obuNj{;uYeo`MIJ#xt0O2C2>`5JD^|90>p+S
zUg5|GzL<4_z++z51PMS4g92C=5ihBrfsIRn9*~}T-n+I$omNs@ewu#kiz1^9X~QL!
z<8jl6A^8={?V3qQ;)VOgSJ)E`$9PX+N2R`>WJye%TR?}5EAb^Oa`Ylkd!%V0a-Vlu
zVNo<UmhBd}cAYYdm?|0zs#A?!-Z)%ud~A3cd_2sr&K`t-Ge|lpe@#3}?>ub@3qfrV
z$$V2AfmtnQn+8cNiUbgUBn?ta1hE(Z;jc=GVE&xej4>K`>h+O84I>9>FynbWyZe~l
z1QBL8A$aq(>7nyOr`6L3pzzOBNW(US)dCoFVBd6*=V%7A5as+R7?wI<;U6gLS&Ps4
zG$Su!+p{)uX)0_31FLIx(E<*yqUBTIdvT2!r4k@y(GjTioGyyRpIG~h1Z*gdo#rTe
zW+*1x@|C0c3bmv@GJTq)p{o1>`SIcOZ^ik1IK<fCx;mOUUIl4paG_|^rvRpPTEj=o
zZ%BiZ>$ft28&?}y(SW3vQNo@$viJoI+sXh4^mC;^Gapb!Rem{?{*L1*piX2$r|+d3
zrlo+oiV|&C;PR|EcvnJ@AI(D4mnt^^>I`T+%&VY><O;G<>f;U`G>j;sfFwr7muM8f
zu=Urfb07kDOu+Ex8Fs*zXE@P<cBXYIHi;vq7;Du1$2wIC&>}VfdwD>>5)^`^(Hv+C
z6=aqHnh{@-Qh~HzsUEyR=b036G4Hr~Im<~nolk|R+0>HZLImKT(9&l&lj-16fIW=a
z9DpwyWJN;D#TwJD7)YF|dBGJygCl_(|7D#fUIv}4Zt=}E;G&_!o=TdhnpgqU+5J;w
zMFo{cP3;w+D9@Nttq(j10FVU@T$;o*1kP`uZ1a!2^W=5W0@H%5lNUNqa`@v}{6PVL
zdL18;1!c<KjPDhGmtjF8yU?1#L^d=)ckddj#}!GUOX~SbUj-Pn51B>!10e@yq5SV4
zcb@IVk>A~i!>i3RTdkZ{pzdcMu3Oe&YCt`r+Mt=z_%dZ!tk6cjfk}`72>m=Y6&~z@
zV|-<=ft>IpDBn(on=_4YEAUPJo~J3s7qMsvk(x=7Ij3Tosr#XzxX1gVWx_tmv_Rr&
z5a5Xf*ifcy1N4kB120#mDEgr(49vRw0E+H_1`>g=l&v??urNTI_CZ_PGSY=uJ!umv
ztHwyDDyx6|IQISHClIr(ykhBh=|mJDpQQjGAw619c0~hvLj&MX^f6Gb;xA?Ox9y-&
z-nW+MR36VH8t3v$B8R0c<8ctmv%Ne6KR9Xqw{>RDE34F=?o`u{D`!#~d*UL~&9qaG
z!jrpJdiu9|Ai6+6So)EYjdwyHnJJzQi$R}~lzPOi6ah#W>&sMfXqg0G6srLZ-S*2y
z3t=&IAx($bTrYNiVB89p|ALEG+8hmF*^M%qP(OPrej(cTgpWZ#-cf?;Q-27C=_>zD
zc<wWpE(_ouY*xBohhMC=h_sMgj1WW)TX-VT=DRJc{~DDE7SA~VwvjU*w$3n4^r`~E
zCojT@%wOh~G;mVauD|KS5s7wC|A-Uc$`YuV3VNG4kPg@pGxtiA@6cBGN*Qkk9alQQ
zr3PR$k(Eq@-XRiQtx<S;(5|h~(peCJDT!))`dV~c6WI7(%F@lW2J|rBP5}e};euzI
zAN*O<r;jYX^Q`3@#Q=gXIpC>%+DK&61+t~pxQ(T#dJjCFSv|5Fq=FRL{XuNidI7Pz
z2rLMi2iy!Ac(>Ogxq(KM0$hnDUy{!rR+6>d9AXZi>TsU)+YoQkB68W4!H}}-OQ}E|
zVD4`KfqwyV1Zfaz4IRMp1J=cMaAc|HZQ8*plPiBpuHI~BD0dsjZOcLwiSVtm5q|Uo
z%>f03bBk-5PmNvyn+=Gj3B#TuZw!D@XqZL+^~}DXK_6^UT1}^kL4&N*8UTA~i_cHB
zCVgW32c~|Sp+D1GwoS<x6JkS&LV~q6_6ph5iNI26yc<5!#_Xg^@73Pca~43nrE~Or
ze~jT*v-mGDpVQARr7FHWZPO}zVJUU-E=>e|GR%d=t|G0O^X-QlaKA7MIo?ScGX0#o
z^9L6e`}~)<k*_qkD=oV4=<1`SLFN@O#A-(L)ti(qh-;Ur=*f*w?`6McxHvZ%x(T1X
zICSYI!tLA3-=}eMH(9G&?nSsos=E#MejBrQ`^tHfA=~|FDmq;ynDaID#Fs9&Z#M1~
zv)`tI-52Niew=gvX(P0d=)T-OHKF<S=eH?T96JxyeS>q_a*s!H#(h&xPA8ZDx0}b#
z%lt8P{^rf;u|1v@e~<n4X$cK>ryP%?G;!o*z5`AI$UR4L9GF=0fa=_nJWo0;On@a3
zh6n|RHU#z~l+Jn3b{c_coqkfB`SYBBv=zEa$ge;le0Bd{tkVupu|7}nDNl(tPst<C
z|FKSeXH7S<xVb##Fh$@P4uvEy#amuVC0@sBz5dHO{XXa7rG{aCavFYvB!KePRP)xt
zcr&#B%Q`)w1|lIrI_};lr--~{Z~cz{wobh<Q*)&1IgI?=sUsp*%?FS1F){mLg!zH9
z^)dIIJ5HQdEBPU&LQp@2n1l10iF&^4CVbeKvFRY3u|?Qb`8Z(a?-5x^V|><vaGMZq
z+mNh}it~1BdFKVmvSydurY;rQ&G-AybH-lshOn#TBIa^@%w!f$t7UmFT=GluEy#hH
z-OYL4{Udhsl9R8m^NvoCEg~@8H;l_KC&yR9@)qX?$a77{pTN(mlNGw)8xukx$NGiW
z`uP=RJofi{Nx76F<EM9?o!izgWOH#{4(TfBA8+gLaBCh>HJ{|||0v9#aW%!icE&HQ
z!{5EiA71aDdSm`{;Zow}QX<ALOYNsyx_=Hv_tGtRKXxJM;$^b`f2>nCdEdG2`Euo%
zk<!Jo&p$I}F5lw{P?KLE)EWl)7L*^gR!sSph5WKS%4MrHjKKJ%O0+yN^LyME@SJP@
z%m*sZ+OOwaf%RO^Ah)_2Bm$dk17Eraz6uF^ofO!7EAUN8U`uUaYe!&PUm$ZL-?0|>
z_9&3T6-1Q?qNxSZF+rWSL0#@a??Qs!Ck1ui3i?nI^szSRQ%6uwUr_H<P~Tcm|54BY
zSMZ=j@Q_;YXH4+0ZSaVD@MuWzm!#maTfyTc!4tK?Ups;)nF8=sFk@;hc={-KhAU)N
zBILVT$Q&l*hi%Bbd&oja$YN5+(yfr6B_Y3RLzX*2R{BC#r$W}&Le`H$Hn>86ON9PW
z3*E$oZrO%zyNB+Cg#Jwm-MtmMR}%WKHgvxu^q?>Fa4Pg@EtJ9R*yj!dNro}sy8i#Q
zP9qevBa|LS9D5O={5C?RKSFgnLha0-;A$vS!wOuA(Coj#xOyiehmb121k&+~)I_G`
z=x%C0+$>gPJ+?%WL9zsPCrhBfnn<WUGF6QbskZ^c=_X5{A<m_dW<_jQTs9@T!GX=2
z+SM%A$Qc@cVIDJ)dSq6M&}8e-D0>e!eg8;%bc%!pB*!8}YKbJjlyZ78Qav=%3>AIx
zOy=2j=4Ox8ZJPBOc3WqiWVHbc)CC_KW3|ZGzUUE?7sjIFmx@8gT$|Y@e2LB>?_98h
z=t#yC?52ly!*Vxb!kjZBcUcpG%-9VUpJrI7Uko}s19v4&1qJrlfSFXs==|OGS_0{l
zp>F1p1ul^`@XW~Wzqc(?B&z?00$`mNEIR8j#udiz*iuNKKlm7s=|=f0gWU|ah;~+t
zx?P<r5u2QYOw0Alw6aLixU!?7m>y>V(IxLnUV+(TcT}*OSBYCX&e7L))1`=zz=6oy
zD3}g|HD@ML_iu(90cx)vcdZ%byuso@fCg@`IETRkvAb$vEJ<N$rtf2`uEbRr#XT+B
z6P$)()<Hhq$uePaKB1ACVX&OA*b_M{C$m!va-y$=!E}n^_24n5kH<Qg?>^z)iI0uF
zw!5#xeLy%9*J%FxC3lPsHnt7Mb|s9(q<TAN<BC6bj3zccUzf%CFU-zj>+<`^z_4AJ
z85s3-$}@$8D@bS(cLsf(lr*y~W0A-(@JrOWlKAFY0zWLKxqsI<8+LvvMH>y##iqtR
z%(yze8K97oPtHhKj6A;q%Y6)f;kOx%Jcx7IPW_u<vjl2;ahTM7w7O1O^V?j99r3^2
zBuIh-vC*2?sD#JKxW|xdFLrJiu{pxX+J<qHoA3Pz`KdOq9*8cjmtj4QbhgPq)~6^*
zuy{q+vAXy4|8MK`&&tnDg@IDz3|`fMEyc5yj;xxiAiv4ns<U@BpPI5-I2=<9)JWT`
zbK%xJ+I?gE?!|0Q4v&IU+Z~=7mj>TK`TuL3{#jlAdwhnH4C7NfU_|_M^l2@(4UX%)
zrDBi26JVGbUTSh}kF|>D&Lc@TvZ3tRrr0;r3lb0F6S#tRPpphJ_<gPo-q%^1YzYtK
zo!>uM5&rufTd~zUXTGZ2u7`pJdA8Y7|BNrh)5aedeF-#uX}J30-}cJjmHgwOM+X14
zetl^Sojzg{b8e7+B!!3ZG=!G>Xt0!jSTOuN!e1KCA`**EW;@o5PT{2a_G0k^JRg*L
zH1g5{hO7n46uIJdrN~m(b)_@q?sfB~-aH|9UEU=;Rys@Lqpr-&6BDuCwn|TR2Y6Z?
zhlcrd*-y#lnu=VN&3kzsZ{}yCH!dtZcBqR)ZpvPjD?I;S*6Bxv;|HI_*i-*wopQBk
z+1~qqSf_6k9wz?VQz#{|>nVC3ZpiQ&9acsy;r|Y66<Vbi{@|*Rx3p5Mx*NcZbjNIM
z^x`|V24*b}wuoe-dx)mqCrZ(|T^6|}OU0IsQ5t#rUJ)(IFWUbF$hrvbLBwMeGn2E7
z&TDJf8oh5}545PE)pJC37y2w)L{)Apzy21tADnW47)&+#2S^njKV#vNqj;t=+{D1q
zF#?Hv_+hzU*EyG3g}E(8?dBW6bRH9*o^<%6L$8|cH*jqJ&Mj~T9bqE(Z#P*$;ICco
zJLK&j-tUo)K2;xh_*3FFKPo+A90*Ap2FW~CIYi*nm9e^4kiz6U*Qa@Gx*Im@Y?_VJ
zoDQUh8Yt!Aj+x~z{_*u!BmYv!Xv1#JzO%Ki=?|4F*njk$G~5awP*c92s55bS87d_+
z@Qu%gJBpl_gJUk$v<1Q+w44_#&lyb74-3*a8S-G`6_7d7U9}x{tdwhXo@lxB9`A#Y
zvXV3${v#tZ`SYpHQrQj6KfDbBlqzzxGL#~6yV?B;E_V4QeE58`yQP7ckx8>fgAY}H
z`g-6A+d1=<j=CQxwr6XrqmDPp%P(^<hT9|Y`j1Subp>qrPX5j5cX_@bj(N%>lW!*U
zZ{vM;w&lqJ7R9^z<}hTJBjelb*_DfiLENnb#}D{!*1B-wBi@&~$y+s#DJ+^uyUzSR
zysO4tmEww!&$;4z9r?uy7C$7;$y}KA`F-*+zpO|;$u^?_+av)mM;}O8a09zdZ=-`$
z?s~gD5~-$({~55IxnYSjkw)hq*pcOg%YChrO|H2<&G_G~Q}+XD6kYM1MqYiE@9<fp
z9TIm!H(p}ZCF4{Nl{3V3PPiXnRSzSX>$}g1L}q#GPe^5-Si{@<8OTcW-7QM&ri(@Q
zcq?NxGO<gZT!cDf{z7!B&01;xeODT9Ig&-$1%wFpr;9C=W?<_g@@i^+h%s#0(ocJ7
z<`=L0;KH1;a;S~qeduqhLj0W-c&9>q*G^V5|A|FHQ;H~soF)tL{GbSzDzXPsjzMNW
zIW2|X=@OI0?Bo_`f2T{V=FEwQ^H@4x7-Apcr=3_V?L7nC6j|1-(%gJ<M*JiF?m$76
zKw-{l<tE(yssR~|d8xi_^`YE;yG7YW<N!%9iuXD2?!<&=cVa|SMaM4%^$Qwor=7Ie
zSsp2vt)G(d{kO>ne5({#P-k-hQba|z6>TFgC?wpGsU-R1`C|w}*aWapXXj$!&fu-U
z8QP=Zuti>WD~AyDxyMfJzjFT#em=8AeP9eg?8B*?SI5{S`=XRk+QN*_X8^hwN7pge
zIT7i`?_RvY1F|j`e`iGpY1<w8zt_6J16PMjJ<TU~op^feOPA)T!7A`hVWIScj@XXK
z&aR-_s@}LIP$7QvP{rS)@m3434m-);)C-r99S9$NK)3@{>*1LgAJS2Jc4#7+N?;kg
zSMg%_bAa2o@$@qW`1+TIY7v)`xe3tZdy(p0C#HUNCWTc9L=yebVYtyB5wBb2#@}nn
z^9-!SIo<d}2vJn{jrbY&y1n$axiVZo!=)z0Kqb*vR_>>jVa?h59S4_GN<1Cr1fPi4
zH>;sA_U?Z*QO{P@O|c5hx^R^ff-=#IT!q+yt6(j`Z%y8M-aH%*43o_#Bg1vpH(S0*
zhtKg<9GE1Es>~&RuMoIX5Ei`hJFA=ZL{%LV;0UDk1iGNA_3M%)>_mTv+@*Kf??Op_
zt_m)7vpQMi^a4|_TUfXhvf%+!K$RMoGx#f_jA18)-*EfK^+7Cu=}&57kb-{=0E@2f
z{k4*FSJ(rBuqSur!BV(gmu8=J-u&Yxp`U5}^vi3lUobTbHpHnfmsvPUZ0HRt+?g1>
z&MrAk9|A&{?3+r!1ZiUOH)TS4{(LG($~UmxKn9D^_@sWnlN!dM_6<8lYU|Q1b|xv2
z$kt@_@Fq-QY+fw?#c}DqRHT<ZZ_<wqd0f+n!Zf0HA%6oyeq+GWs3hD?G5`Ib!YM6l
zVtuM5R8Mi=|Fz{5r|8wU|72fpkj|d2=awVRNnt23E_frGvz=Ak?cW)STz%NAfwEck
zafBr*xA``?eAc|q$+FUN=7LI^&8aeDjnv6Wmpl8iF1l2hKRBDS1|>EDXA|X;;)`$F
z<2%gJv3(W3T2Az4QSnUU2pGz?Bzj6dw_{U@D8DI?faO)RY_aH2Pk)Oo<Cp#2$*!~U
zC$6YdR8ldycGf;MqY1)(lmqe%7=)T^%}FGp1x#XMvxB>!-(?2PU!F6DWo4V(R@!@D
z8zYe)s6yq}%r*abIby-caZgIaIU%wF8&E_6eKKeKyn1>-oX?4gAd22OIQ?#BD?h<q
zc5ChQh|Txp=aGl9yF^;dei`&ykA%)%Da}l%ivGsoebVSaC*4s2Zjw4F`LZ+xol`G-
zMNCyv<jo)aE)~8Y<E8hzIu%Wm%4;wBK{*CGz}G%JG<)L}6vW%5tBuPD&cX{0*5Nby
zq<(w7WE@t0%usp9dMq!@o2}L<Q)igUpGDG@DzPBq#j#YBSiUSjNN`C6Q%5>UAo0#X
zRI;eUx#FS*rM2}`NsDA&S#ePcSkN(rcj<!FSc*i{5F@iwZ3`!9VItc}$D{EYODW1|
z$@|R^;o)R`m&{+-bWA7Sr#bofz;zoWgO1uI_V1-AD3WB!pD|*|kd8^oEUGj)mDh{<
z;1CBGgO=}_pv8o(Rv^0m5A?+Nl(%To{2+OQR0RS^kV3;`fpoiPHJ;$bcPU^@>QbhO
zSYMfNxfEs#!a8MaQ4JB~Cw(57754%yJxP_F1fz^W(mP;&Ebh1g6r%#>uOW^+p|d*S
zEo$7C%b<cY02dZ7PQi<-BtLIA6KMv|>%t<sX={TIplo0y8vF)rEF>lc$Q7R$Lr)Kb
z#iGb3+P>k%yfyzo1egpe0{19P($WOSQ3&0|RcN1;F^Zy2MT40CmOMnT_zGCF2NCff
z1{E(Tn`Klv7p~0!)#d)DrboDd(~^jLeAnG552{-Lh)x>+6rRCX<Jq#PstH6r3XR?F
z{J;k~Yco-yfXSdjRD!S;1S&i8oMe}1R7ZtjNeV#}Oc0hQs*=02+{zWt?~1n!qVq5r
zR6tbP+EtLrpjQ4jg9;H7!wFV`fDvQCF^@4vPBA-NeKj=pZl`JiMUs%*e>It7GMV>)
zWOM-Ha-^$niE4*kvM`x<{8x-1W5w%mlt(5i%%LbUg*yn~+69;lDvAsU29+8mkPvmo
z?%(MqUdh}mBqM$*${(UU^H~xD_4p?zN_pfu^vKAr+zFG)ku`${S8>4QJ!=`A4uw#@
zcXEOh_s^CzSU29NXI^!N*zp`IPNBh63Y1F9ttN%-gCNKSs1fDC<j-<+7Cr|7G9zRt
z14zU4PG8w973<<q?TSyk^oR=(<gl@-0jSO}^~9~zr)iyj*P*+X3egu7G;?kkRa12_
zObL}9D+m?$VHKv##c|y@?m~aHMZ(;3SAm}uUG+n|P>pEC<9m3Ve2LM@ES@RQVrNMK
zDJI4#Miw-U2bC7;5<MiQF-c*zzKBXB_tcvhxe8h~<B!J`>m#TJL691ibj2UO^J!4w
zF`TLiSU4fY2|+zIK-#$pm04BD-dVhcfpT?=EsPU+W0NoZW8jq%D3U5J$7>!LL7x~A
zN)Z0@L(fwea!r2j&5m8At6KQH6$gs~@)`z9!{L<*Z6jWBPmG8^@jgHC!?;TUDR2WQ
z{JPTJyv|#H{6+T^Eo&+joFFoz68t+fn4;APkE}f5oBTg|(2%@4Vm9pHbch7+x@nGb
z7DRlPj&y-s?dU^NDtw8lzsuNZ-yT+vf~6}tqDPbKIXR~H@Fl;L9;QQgpB#&3N~i<Z
zb>(lo@2YU##Uq@!5{?283uu!`Ka0*}Mb+g7_5$P#&0>c59JHVz?BnS>i&3xS#C|(>
zVHt1XZ(&zG7hMf+!hcjE>8KcIjHc?V(~vn&(drCi$(eE{RwxdTFjL+ZcDQrHG_?eL
zRUXH!ywnEGz{UmMrt7Jrdk~G?N%ky~LTvJgMh$NeRz>Hsg-Q^;<UvXto^K-czFL*h
zmNA>I`<;LvDPB~3K{96nWmHxE!@Z#UP6EZ4PF3gwBT6y?kbm%W#e%<v>dQ;JmC9ZD
zOx7RIGmK-s1rlwN$|*Efs=;=~8NbyCKz$sEi4bi&uVhs)X@$BZ=tK3%A<c|*R_fS2
z`j?{Y8c@aV$IX;bt$XVRaJU~S-^zaBwf(9w(5LU{NP@Y60eeixu>p~qMtPMN>C@8~
z8$*7);1a~t0=m2R3lC+YrGA{e%Ly0;h->G}=_RTx>I*7?iA>MGJ|77Fj_-O(m%=hN
zRD4;Sa!t94*sTY;h9yP?%WtZdTl!M<iQK=%KAr+V(D`a*a+(pGMkn?U8g%LcHAe8D
zTeZ+7ks?luWWA_Lqi!j_b}=S3D_tY^4%4~q`{I1e%KOnyww&)8nKdRlKUj0rK3XMz
z)bsb8@VyrT93)ZkH7|^29C|eeVN47aOO@IP`pBF^?K~NjR(<e%kR3~BE<G^^R95Cx
zJpudn2|eaSfGY^U_!2s*x?*kMV=+T7x2;MW>O7T0eO8j1SlelUgmOPxo$z{E^$-7P
zz`AM*@?IMxvqXQA_tZz5fir?@OqXAuu&3&$o5WO^Y{xye`xDHk{#$2>J`GR)Bfo|>
z!T$oD#aoe$V#DYE85<qk6mL>^ZF>GhF@@E_7`mTgB423~yTW<^O8=OGNT7&*(jX-*
zvld`8KBjQg5aATan#7+qHDke1lNKK;Uy!i{h1zLqOtB-q?3R7?10rmI`<sfVaGicp
zl`3)<s+_=F!6)~FCfN&!9~-Fb{F=kt#%TQ%qv8f;o_5dd^1q=@DKdr4@osm>I%_vY
z>fr0apBJ2+4G70oR07eIw^8Hb(s9`4eb$C@3mR(z5rH_X`J&#EpQK|!8@weh7_`Z+
z&chW%<W(e%oMZT?eATQ-0{UnI>P=LxC6INjx^=OzcIkuO+Pd`?6U2+unUCVg$rNKg
z9?Kv2sW+Y6^C`y5&m7FWc;t9&T{1TfLDfShA`en)Im@NW7Eb4A+poA9YJ)h_O~!41
znQofoD2?8hsMNihoKM@bW`tU8L7oT;$viMI`Vn=eCf5SxEc<I1b7yq0EY+ZCO(@8%
zB1W1&0i@(rE|2MyfD(AHDJKbpks-*ylN7xzdb{T%CtEK$X)oIu4@m>uIN9S?2cb?n
zr86^CpTH&a1FzwdqB4N{P2y6>ClO>=WZ*i&u6`5tAn}c5I|7MA5yw_18`MMh`ur?p
z_%3%bgEFG`^ri)G^zAZ)B2~2;cpc&v@Q)Hu2>zbCd08`n8Aw+ep!eSTnX>lVJVNPY
zBaLm#*gu5g|0~t-`<z<Xoc5m->mk{?H~7hP69Yga(S4d{3*>B|?YF+At9$<pGh+Of
ziJ?NGzrHhd`g@0B{NY~;cfk%G`LwJM49BD<w-9^2(MD&1;C;GL_9eEQ+q`wj4~;>k
z3l@oM;8>@}C&-G@TTh>)nsgaL+Z<^x?p4Q{H>bk7#Oh7NcU3N5To^sInqQba^w0D5
zZ>_|P&P3Q2-qCGP&G^(}YW+XF$V&3_2BwO-+-ml)n(GsNiH>yj*bt|V+v?`P-bAP}
zK-RTTm1Y1lOl2K@G%}&WaxqNFKpoRrPyX^+k4!9Ip|?MXRjS;*K4%ggwWhYKIx|XN
z|9+ZV%qrQaQ+|v3zHK!^eK(uq)Ppalta=<z&!ixBbp)fTIR+Z_8XJ8|Her>_n-3^g
zf}4dRm5mIj1idlBf|SWxr(}X{i^I7q!^c&A>tiBhzcvr}yypWzig)~r_fxXJzIpmW
z&lWxLTHrhTfR24@XN_prY44~Cm5Xo4)n6J~UVMHdxe6UsqS7VEXdjTcHmKnqr@r<+
zUR%FuAJU}X+H@xVrTP9#{r#p!dZYLLD?k0$DXm6|DVnMKudlT>SM0yJ82{=DBfjZb
z>&yJsHy8EW-ZJwBt*;kb+m~A#Kee_7?zexAr>yJ0<Tjve>c8HPZ|~QqY8_C8+9;d*
zZzJ{fb6Pd6+nOJ@QXSf;-Ul>=gg1T%?`|Y?;uGkM*7x4~sBt=Pr*QLSx_yy3CQEa|
zmDsyTGRh(LdH`&@c!`w*megb;;E;0{F95V_mO=)cNk)^vKm}eAFzj1y>-~Gszuq>$
zcQ`Pe(6`<;0!bWQPZ*Ru>{B=#I(hin{IKs#`<H!#vC#Hjp~HzQi6gCsqx3_TEW;t?
z!#=I{&+7)mrwzYtwtf4WF!tVXvN7?SNBitt`&5zP^w+lO$L%u?hO=6Xqyhb-QLXlQ
z528_Z;vD4g3%+ACzrD92MYH&D`s=|WN5_&-$9IpTuSG{w&oJ}-?ep15OE(S|xH}e8
zk`~@#7VaCa-#=n0?O0t;SnhA%P&N`4AAQl7+M7)juB0QffSrD<o-BCB`<iqm{%<zG
zTbUx9`u3O#e%INEH<h6ocI~e-W806hlfn3Vg@K60=~ZIcdjQEw2oKPSAejug@hWbd
zZAsB;tDI}J8)-;O7`l4Cxn~A<-Gqy`hio@XO;<YGGd5N~Lrdil#TcN%y}E8l+EmTy
zs?SqzOMlL-xf+>nep`y=RjQ(WMNbOK8!YfNUy)v-WGm6b7QvWxAgNz%;cvD+XMMxz
z^4XpX1AZf=&VDN@zc#AJ?%LQ7MJeB|oDfzr-?AyF4V`Y!1ZR_7P?maHX;eX-d@jq`
zs8ooNnn7%58po0DmH*W`jR_iWy!=1b>5~(WH~%;5G%o7r=l`-!<6~BPPpt3!w{`k3
zT=d$1Tc>oVs(|=}z0IFr{$rgc9q#WvUY?R*TBnmXC2~E&NGepoH3xTXYMGk`mvgjk
z<S?i%7hCj2m6dZ8^3)b{@b33!u^Vnk<A1qZ;H0<|5}4NM!~GXjhDfl9I?^>{GWWei
zqW1HX!f9d=ExgavWtfi>u*SmGzJWC1A;tgc7FMe+*UJ<8n9{A*p30MXEJ-ZCN3+*}
zuUA{2<Ig9ZZ_rwkUB@??59$n1v&UsaQJ%sW_YE|Q+tB3(I=7H0H7mkcZ1A-Li>d+(
zr>24SU{qA*3M=mO2bnaUoNoCCL4wb`pn|#0o}c*zPlGV_=FKFy<8<+Dr^Vs6+pkpq
z2qRIOVTS@^gmd1Fqh8)BgB)7!%@mcV|EwNg=Wxe*33HRX@m9tUUCoL($Yh;d)5mRC
z2U#`$s;{B9SJ>>apJwNhg?mf|++}+%*?*0#f8^X5fAdgihB58ij2la~!TZ2*@7Tf~
z$W3UVzLQCEIy2WdmF=~-bGp^<o8)X@A^sn>pWihIX$D3Timqy&=jl4^wV&=eOq=J;
zT`K(Kiz&vPO;hV$VCCi?0X!7UC1%s2LUNkKu&PP_Y((S=$AnB+5kKxec{vr=a}1Rx
z614Z-TH`^4g>LxyT--?7l7WH6_|l~w&PH~Odq~ue5;aA?wPU|Z@;`Y*DJ}LR&h+`R
za(|4uFkh0laNhngy~Ne*$s57KTsPhO@9*{f%VoLy$y72iFvi+QJo@9gel^>fLfrYH
zo{yP=!>85M={xO?AwR&!;T+CZcV1}E{Ya1fE8ZVrWmEZ?5mDWPPpO;@ezRmO{us$7
ztwspnUfXXh-n#f<*S9zvHCU---{C1+yb*Rv{a|<gwar}vi)tj};P0Oj#-i2m*2!}N
zMAn*0j)~jB=O6J-q_dynS}ju%y|SF+Yi7q{cgjxdWc9a(v)JnmQaH#^fLV2u^D#k<
zu!~<H_gHs2+mG6FFf;cb-i79}IPZFkEzKds|JZZ%CcYOto%0@%>C!n&P`;LCFWp5L
zGg&aH)3wvKJ%ybYJI4C>`r9|sVGXgx252ei(8%wo#>Om76p!<%6@<)!)QwQ0IrkSV
z(>m=IzU1f+y@XBE-5oPGx}K8h!(YjFj)%tKkCsYtlx0LM3{&+Ae@bMbJTz+RZ(2E)
zOJ)!MkPnP(;Ght)ukp)CLf%+7)T)VAqPsF|$3Om<Ib&Tcman`fRpLT9Q}|}`o&uYO
zl?V6_IQri0@`k}IUq$x2AO2&Vj$8X-`0hDs`)WTqZxd+Nc;|iFg3g=sy+JX2#j`#O
z+FimnGX+|Ar=xs}3P~EqJ~`qoCUf$IMDD9od|nEoIK^v9Rw(k^147W}K24O}ZbD|M
zqSg{NvC57|eE2k5JD|s_0U?_W`-#LW;-6OvU%xPH!*;l+u8CJqD6f*dz2qA3kDC2;
z2`~A2(1d#+?CkxckNJngKlPQGWu@%X#pvoZb%1f*{NYD<wXxi>GslSv(sI$&rmH_4
z_IZb^uR~b*4@AyBd&+EFkG8OrJLdFqLau%%x6-*q>2gPInnat%2}fP9cn}?KHn|{S
zvxHL}{UsdRjkVcCr^v6zf|7m>7tzrsPSNrMLUQ2j41o+UVdd91%-{|D1uB>NFP%qS
zdiCVKTacf)zSO|lW_Iy5(#0!kf*$dzz9=mx&_RD<<YUaMTyeQ$+7($H$!7e9$Tgay
z1EOWrOj51gMmtU&dgVY+Le~W(xD#G=wUWf1OjZ(K|8lxhItCT5UGz9CUh-Vf$^-R{
zHATAet>1+)MvJQEabJ`_?sU9v+sQqic<t&mql)Hiw14Q6XlhB;Y(D9}H*%bJfa<Yx
z{qI}$s%+xO*E0|qR3%a`GzAtk%aJqlx@0^}IUPN@DEPOzcsxzqr`|14-56QAk#W3c
zmR)Z+Su!gOCXFo1P8vHQQvBift@s)*9Qu34lS~ut7UcKi1;#eyjV>9>!QplHyV>;a
zr@pdn;xvC&0Xj-K_H_bDEpYKuy1?e`m#$@6ehR&w5{<TBd*%;2ul72tK_t%Kl{Dyo
z^Y&7bR?Jb>yrDx~|E`kugT{Lq$Sb}=hTSxtU-cq$F;#-+$?4)I8guf^Gy&$;Qsx$#
zY=xGV%&TP)(+j?diJFjn(nou$@0O{u!bs+Ea<DO)ypTEF@*nmzLsrn<?b;Tew{FQ^
z&~_zT_L^GM@79Mt_124BdEOes<^36&_umIpY)_2aZpAd)P$Adi8)kQgn_oJtRh8_2
zE$G^5d2J{hS)u<;9R)H4S%<{G75(-{@Jf3t=X!uc%(R4PRMg~Zu*zG$&g_K@_lofA
zt5pj_#ZoEa0X&)1z6r@-@e^+ENm-7ebjgP1XGSKV<^0FRJO{DQi~`C6M~W*tm0$kE
z=*)13A|YbYcCU<n0XH=qz0D6$U@iySwEv(CmEIY?8;8L%{<pu4oLXnGD7yr9KK#Y#
z)r)>LwaxDQE!*?)>zI#g(M^xVml<C#?~hO04)@6FVj>xOEhDwTukL?ZiO+tmyH+y$
zHuBr*@3qy66b{%mMWL<-Wnh_rS^QliA?6|{RYfm9pl`TXOLZ}8@$xNlxXOch9cLTW
zxPjCQQ&B8BOKC>3o)B*#kYow*&#e+HYhV^#AZ$#HI}wEm5<XbfGwmw;RCYa0(p=!m
zTjI=MM?$YQWA9yNQd+e~^zwS|-k0$X-<It4b#IS@q2t#m+~PeefgXn+7;}5{&<DTI
zcpN<meyjeu|M0cniNb$RC9JZVU1a7CNbhyMJsT)OO!28WWK-`240Gm-$?;M7x~(k`
zypJjphuwBe;fh0dCEegOAZan)5ynbq%}uBR)idd4&u`8IM3rAU{B!&h`J<J=Ba5Lj
zVQo4*D5pJa<84eG?D!0fr2aD14)$nH<N5|X7x}y(>{)RITOyME(4s!>GXCGqQxlmm
z&>FkKY4*$kcDnkvrku7)I!FA#?9|!=aM*Js72;8Wx)A#D4+&9H$_6DZq?fYAfZ%2~
zH+Aun>c}mZKJNW8q|$)oG2D=C?}<OS7p&pW1<SY!u%d)nK{AQiFOZ+~L!!D=Lh(bM
zx>CX#Y@lZ&JLtxl;)(~_5H`R{z&ZTWh5A$O_9i~zg8O8F_kFry8iIl9jJQDo4SCd+
z!R(Jg*Y0^QXW5BWt0EYgzXfmF3+3k4XnPCatq{J36!{&D!mPZ0SN7)EbDfw+T57gB
ze{kZ5vm@>m5K<{{Es$qL$#Ay}6_8Ts3m14EULg1hK0tM!3bNIP6zmRWAMl{xgz2*W
z$!`f4<k3XmPLbjmLhr$)1<vZq4@sR1N9|-$dkE||AWgL&(Z|oCl~bja8)QtO;@F5&
zW|{)aTw?p|Tyemt6TUg(tiqK%h4>+bYY_^b-h8s0e<Xr+{!qp9&MFn<DdjitRuevE
z<^4J~RJ5_AK~7P3#0i@bWuFXX*PNB*^j2;iQnt)Yu8q)bh*0s)J4WSI?#fdh&y)OO
z{p{niKrh$c$01e5XI`}rdB=Wg(#UgaFIA2Q+ok`=d~>f<(E*|;`dLF#OTjw@5l5Ie
zW1^=xbL%<2Gu~t`na>S?Hr_$oT#KW+^o^p1b|3CUKk3Ap=LwH9UR4b$^<hnBz@Y_H
z&QGg8U{fa%;*GI9Iez2ha{tLlE!{xnXF>V8N~!4VMoNH&IIm5}u}XEn{KkUK@}$j&
z#hd6d2fbcXt*3l&Zik}DV;@Z3i(9EoG@D6)Jz+6uL2HPZ6L7+X$}$AuIR?_f&q<i%
za4lWuIm+j<3lZxsWlP}9fR?efpe3?ya8;vuo6K|`IMnY{AJ3s63TLDBvh)K#85_#s
zPZq4{X@6qCXYm@2c($`B#*hgcw~0dm-je_MM<TL&*0>idP;93b-DvE_Z)zH4%E&Vd
z<~NBPhFuv}KRH+Ba%T9u!q6>(gqa_2DnZNK8{<%+^*%*%$3c4yw5=<{;e$Kj_KPiG
zRsuC3IfUikrHZ5b1*D?_<eTtmPmR6m5jp&yTFOLwa%?^A#nv3n_>@;7c<dk}9jqg^
zzYFx2dxTSl^?0_=2;4UQv;q^~UhU4$-@?6!QcL((3LBb<=z&PemuZtd5edZq(5D4h
z-lu_*TxIY&CVe`~{f@w6KzFP!<?=r#`U_z9-8N_&)@r~mE>M3Kuh!lpzQD}c$Zdfc
zh!dZh&@dW7kf<&!;mPlt+n}<o`&!^aec4;MCu{S|Y|4nT5XZ~X=#%D-ZV$EGIC&jT
zURE?$PuQYrd)RsX^W<6}YBgwUhm=8&0KTQqe6BNs1vA|K0<fpEf)uJ`=`43xsTSZw
z`02oEQpz=k^-9@3eJI5t?J1<KF!v5OEd88!p#J>a*7*?uQFjosVT84nipnc<+v`T%
zEA!3e5sjs0S4nY2%oZgG`o9SBi{J5!6ug}8baHMxccHA)B{IDO*X)DzvL-p6fxx(^
zlC{IE1r$DQrj|MjIhyg*tq{@~m28L!RMqi(DRu5W-bG)A1B%-UpmOoou`zVLMXj`~
zPRU&Ij=VH7f?@~xc2QBfRNh$6GmmElB&5RYrG$Jv`T3=UvOEQSK^N<1!*C=&&c6{_
z&SI!9;rg#t*sh$pEy&*LDY!w&ZXpTvL>IUU#Y9_0pMRb0BNQF!eC1s3<z)+`;%9R5
z4fX*Imn_v2Is~Uo62_T;V2=KDQ&0s2i1mPE-z%-0FOmgcBz>?f?X$sMG9gsQ#XiqE
zCcOHuRBKm?^VnvnjF~MYI?OXB420uhCkf@1Ay=5U-bB7E5RwKUR{(x9DZ~nZ+?Wx_
zBk^qjzHDPeo@QZw+_k-vzHWlZV?}&bq-^)uXjNUI7Eh6t86HNmr^t@B5W7^0a1o#G
ztN=eQCED4S1BCRYMtjT(u$Nu9PvWCd?zlShsDS)hnO_i6gi?`Ek}f$C$5S}QtL>7(
zLFEmJ$%x-2lkQ|Y79|N33AuX;!mnI;i^__AdS%f<EQ5G@QGqj#$jz}JTu6yMLuZx6
zi8~Q7^#I4MV5i(ZNkLEV=S5oIV{fUxihq03fcC}v)HYl&olEz)gl-CtPMOw(kk^#6
z+1!<s5n|FDf#03VrHeu`cY_-M@|8=(2!THqgj6XLO$Mdy`SV)~-&UO!K*ffsQd!M$
z`Q}nWby8fqWukRB&InMEIj*R_3|T_t_+E;v^AuzZQ+T1XJP}fe?=x&PB8R`rmB*lb
zRUD@;h`#}QmySlMkT^;x#GA8WbfO>WE=SEc7rWGht4_Y=B)(x{Mm~;ngLvPARNO0!
z9JrdHUnJB#!^4i_yywYJInOhEDob>tjP$c|2<36ZU*c9Nten@SR*HSp^MuPR#AF7!
z#3xz#47zrQ(}}|3L|BURgjg{tTWW>r3^(*@@E|?sn^m*+W5HXc91SxP1+{;NN<$BE
zd7SBamcw~no*5h<eibPp6%hA5>NVV(+uKq6N8@*bg|D5W-mVw9jstOr=-dw85NIG2
z{N1{J)04lvrKVpmY88E*dJajW@B%nahC7KPLW)DTEdPx2<yI-7W`f8)T>6JosAOtE
zv@RmAOn7S;H3ay-JkJA;eSS%>;RQ;R_n&~~eU8eO`vUjt#rGRpsk|%LNSnKS4Md@=
zvip(~FRxt5x(OGKn_+v}ME>=E*t^SzDBu21_)|<U3^Rmu42_h4MKgqm<d~#72w0#F
zrIb2!w+c!PAsquqheJ0GjdZAlpoBrs&UJnFckSN0Pwstk-%s{mIO90Z^Z0x|?-voy
zr)s(4a(0$6PgQ^WqMl$uF9+?Z<_{qJhfeJU@JY>Ofm=_Ef9i0~a}u4-<*Rye=7{jH
za-&@rlCvfv>g#wZ3nA@xh3&}=@^*f1B9)I+>2-E*YDpXvAb$%X<f4xGl222+4(5-I
zzzCLAE+hY5Gi$s~Dg)O%RC^Gl!qVpVVfCFyvLBND@Wco;=AB5=oHv(TGy4q-0Y%^Y
zbf8Vs%UTR%p*8<RlYB!A&Q^c|WcaJ?TR1j@X4cvL6Sw#~U!SY;(x)`Fo>B6S{zCB`
zbrAjrNTk^_5vedUfaPZ}x*O1AWzS7cVUhHX2XkBNsUjK0M~Ywaju)3}Giwb1Jwobj
zwGm(_vK{pe35-RK95$NL&+)8piTd^tr8n0v+2svK4Hg;MOf1v+gtiu7)?uUAnIlDt
zo}J^)RAV_j-|UgdeeBD(Ny-Oi@Ly5qy_Sgl<!)}J5t#mtLnEcVU4*9v$M)yd2lRdt
zhcB1fO>=FH)*wq1Wnn}j(L?sA!!2ce%A@nim%8!@PbWPtZ$j5<sPOcfB>fXaICGw3
zQcqA|OuBO^PyO0m3m<b{O&-h)kIdh@^>z)tm1R1X0reuhKmI0mKIh8;y1FqgzZxB<
zgBl?rSsUAH32)nVW*Ob_?^Rh?>v-3(EG+=^jcQ&Y!R8Yh4{mB8Yj7yf1-9t<IlD0`
zUGTm{!>r!T#!IQlwbTzGfVcVAOKYjD-k%#_TCGaA*jN&0YjGImWREhSpHJ#H)bH^p
z`aMs@gys0Yo_QcZBE!6IoeKx*42wDCq&gKGsUSS(lV8lMr?I3prKYB>70#}uHZ2`B
zAkqM{a|*1{0C-CiLe~u*4LH+$Yh7mt5sY0=$08@1YSZT7*?=$fn0W-?<^u^0<gbF-
zKTR+a;EVe422l7dY;Jwy7{N}5AEs>dr~RbQZWyn_*VDETAGf*b8}!-rud|=j8^39P
z)O#{(kQ8;=*UrkRm2I^$+SaeCpY2@L0%8ak(w1crd&~WmmWn)3`C0m3H};N%7^L^@
zT^}qDew-&*crW3jQU%~wGF|1uN1a!!A+b7KGNtDhfh)<65=O|dA7jG7H_zq~@>-WT
zGO4#8-F6)H;Pdo5nwmSB6Fy$LeZ2hf$mQH#Hec%C=NSui`oSC>*pfu`gCL)BgeYdT
z1hMd|`N9Y7s{K3sw|XupWpzXesC!4km9x9z#Esu+gekwL8^v)e?D`;1=k&cj<22b2
zw)2fcc}(AmpZjDkE%CWGL@@kJ{?L1qC$mmNSz{^=rbn93RR=~(l9~!;Q$BnuoG5eX
zeWw}m=Wg$7=c&5q$ZhO&t^4=M#)$K!vyHx1btXv52l5V64zG{KmJFMyk^IY%WA<=C
zi|fUMgWOLNwbXyy3eR-qN>}a7Hcr+O^n5foT4YoI;vehudzJokH6bz6tsc=e9p38A
zibKfn6~DYS)$YdS!LYX->vhs)!8RYGk3OtTPS^X;S+y9}De=iYv<7;E&ue)Ko!YtL
ziB@*l`CSW}Sx>q5<KTdvKK%3x%8=j(6$&Nzi@c@72v=T1V8a@k^Y?CGN6&_4X#e0m
z3$gOgj_Wv=*|%iO5gZm|9xPLmluBZ5g4;(b4;W?{v6SB*4mdp;Fn0FQJbYfoJ^S96
zq+{5X&KR6Rw>Uvz4DR^qirFQ{XXooIE-Cr@+FyLK<U9luJKW9U7kvHYYWK-<+T}>?
zF2xqONxNmm-Q;6uF+&M`)=~3>7mJccXw&T7dl|u!za3tOEA-sYijH=7^wFekK~A`j
zEDo^6Sq|%InTKsh$^E_NsxMsmiyEWe^$Wm}pOdLJz}6JXK9f;(Hy3@PYo^Dk^pwQ@
zeG25^0tsxbB7U(<=gb*DFsAD@9>S`Rb*_XO(7lB)KWx{+W#fKrUCFJajmrp}Ld6Mb
z7d2fAt34(cUgE0k8Vb-dth5g*4f$q|vU>Z6nArq6k0`2yKI4V}0JQm7F6IDQEC2u}
zI_pLm%2Av70zw`=6&#9tE&E_((OfIF=Zb87vtZnhy5p4<bZ;p2vT=We$cc6}@IfuA
z*4|}O@1r`p@lG?p@P>5@^1Pf<8_OjYKqbPFOzbecEojp@@mxSzEc6TbB6=rs7<}En
zrLSCjt*TBr%qmjVEZwlOMR;)RQ7c?9b9X76_G3M&diKU%e31H&U%ciL{((y|a$Uca
z%!GC4z8KwU{2W#L(!jo7^_J1;=~yn)i*(ycWw-~pax}HHDRFGvW#*BJDT_!i$K3AK
zUN%#KIM1nvNF(0KRiz<)4u|O!ui!(L%f07svK_OFWy;O@T9mshK|+@|^@60^S(?%B
zi7X=U8r2iOpKh<&SF3*iQT<zW7@*RKUo*jqUtIh7^T`zB4<1Hk%r253a^&9NJ7}Mx
zPiL+f>YX9z2HjZ^dxY|xH}-~dH~}*5np64|YzIS#8d6e+SUq%KHI?&S&htYjkxPr*
zb%UCZ?f{4YT}d(}td<xe>oP-Rfwy7#@F$Ct0+|I9&=wjQNc(~dTn=_2iQ+C{_LBzO
zgvAJ{ks^ky`c}?CB>OMU@ySIwy8S~1YU`OyNH7cA%%P!0r2_%{Q0-cl;L)9qoGyEW
zmr1Xt+Hi~*d;@`785cfc>w3|?1b^Prhf(8*@%Chk6yxkU7p?bN>){nSxrQad&o!9y
zL*^pxwn-~c{8{sYZ4s^MFD7?H&Rc|k6}Z;r|DLcIF4qwFrm9F>@ae_Z)@L%_OeHz+
z#JLt+>~Vc-xcWuL3vLt?8t={)n*<U703g!j=uhi8D%Rb7#OMp5U*yPF7WJ5X!rW4o
zU2@LvarXzBxCNgeQQO410v;9oNG*WeQ!#BGc>l_c474@klRQBStV>A$5h11f%}N_^
zjT*&qHAsuM&giAGn>M1@NQEx#km{q60eii&qQ)IQIG}n>03-2U|8lM(G;}HRWMdX%
z%!5TU=>vX=M;BdJKJ1wJA;-ezfiZ_@8FOeBh~0+EH0)hRa!<MNI-(%mm+h^K<>+g@
zptX)yP#`AsdeI5DEO3X+*nz}#ftmZVx@l|Ixs5yu-G9eOdT&Bv$9{+2j4Et?^`=$8
zC@RyhI74Nu4pX!5@zTxXs~V_mTw>5pD^A}2Hn(h1Ac9bl!bF7#d7BSB<^nA;G9#3!
z7^pK>g}if-Y!EK5r$E}GK7Ipqs&{gFt;)J&#sRx_cZ#L9H5Z6f_(rUs`XZBP)OfbU
zjTih@$XQIiU3%5+Qw@E3{h@_@|BQoN>G$-W_ZyGR4Fe>p$y{F;)8gxb_-6+yVK>O!
zxC?fR9(k19y*C#cH#SONI_=DAxQgB0-#}~E5p@f(pUzmEq*(19%)yO4&jJVRu}$9z
z>wQab>gV<^Cic92mRV0M-GgqN*5HJjd$!Bv7zbTuSxUAoht0J1yRKl+@qPx6>T53c
z+;QeOQSI5KZ_pjl4`;#N&K2I;Md|8I!jzlzxx}x!#tvG3k#l-`>Y_r{2?Kk_=@q@O
zPF2v;Z5^gsktI$Z*3%||4PRAy_mYnzoY`hH1a4z@1;#D~$Yx51`n>A7=^2ekS&qCf
z`fM+hVM9LdAV%oY>Eh~#v91~STp5uc-YpRW6sdFMz$><Vir()p<tMs6+`Q{OT=e5f
z?)4hhy?0O{Ssst)TI(_JS^aUng+vq2;<@Y9-V>A0J(#yd0*9#}q$1l{lSv&G8#GgZ
z(j|||1l>nTmIt*hl2z5uoYpz3fHl$its)HIRJ#TsIk~GVn7x5^`laJ~yxXA=YZp>H
z9Y75J-l;l2^0tG~8a%dpUJRtgssfyr!8)|5{JB}v%BwNImG<o8w`;jQPY<R9Zadd-
zCuQDid!v*l4dmJn3`n}aG*i_C+j*!I=(D~EcZhAr47fC|zh4meOEKWe`HtR-`>CY`
z^ZxX;zZ^Uar1Rdy84Og8@1%ch`+7E_w$SWsPUGW-C0nVr&e2YkEioXb=8|f?mDbwX
z#z5BciFOXI)<5cd>k<wCH9;+&7Pc`>$uXW5_qf5pM20;0IY*r~D&%hU;k)hL%-UEz
ztJjMcH=id=0R7Bc!`Tg6ge_w`d58d%jgzR^F+pGAshyULdwaO@XCGQ8BRi>XR(M&(
zKUH5OH1W)lnMGvS_lv@fM(|VRF)<BWr>*aOesPC&Yzrzoe-!`Z%k}I(&~b%3W|9W`
zdZ{Jnb7rHCA@CDo$o+{n^NKmc){8IqtN5G7%6t!Z>Cd*mgHQh|6AKk#Y2FX(Zu#=U
z3-VSU8ox#NF3Wue@s!zKK<*QC{ju<7APHnhI*xsL@K?EM=f!reU&$NazfznBw7V)m
zwBu!jREOC<*(@*7V>HL?w-U!+n*V7(|MBa-{PzQX>b)$7uuc-VEQugtB8NH;$0h}M
zU4qM`(+u)H&^Rx!4fgUpJgDw<K*=wdGm&c>5P0r#kg{E%{U8j}Vqzj4Y=7U3mnZ06
zm-W@WOB+<E<v)%o6*@~|GKv+IJ<nuMK~spxcrt{t$<D~1!*BW?lY(R{U|uz7=apb0
z9BHozRT4p5m=8XthP;4>s%~*|F8kTt2)GXqhh_yo4`k#+fwbnq!8Jeyyz3f(&MHBL
zR#SkkyFmQrgM)b%VH`^v4SC8X^wd^(nM%Za&+vRWD}@471R`YtNN37pXM9ApG-v&$
zeQKVAI1$*237<;3(n<u1lO1eUBKR@h@z@ajCVNE}G=Bvx3_#CQfVZguO-Vt=R48Nr
zuUJ7Z?y?`mMxM%mBrl^y$*AwU>_1dE&)7%VJq2@<n5W@!KLeS$iQt9%LBDu7ROS&b
zdC?)8?4mT*V=}A#Ca~{r=<mEZfw!WEE9hf5$GO-r1tQXUJ`T(qugiuurHUaD4k#-q
z8{$>rH7Iv1%;+290xe#Om&1OOX?GsX4?v&Ui`xLOKC1!RZP6o+sjtisuaAkZE`5%t
zub@K!Oh;stFb#d>L4u*5rv}14n+P<(ymEVRQIQDDCOd4;gJiLw&Dht+c$5?)7L)>_
zk>5PGVwR;O%1NR5@t`=KqyVd=;F`qeyl*7t<F>J2Va23BmI-gdI2{O5kKfv@6M<s5
z#Qa*ltQDhejDIL6*ZIMq(}U<TUXGFn95pAomS_;9!Mpv@Sl9e_t=(#RR!kpj#WQ0C
zx~vF2#CMa1DT7{T<uh3N5aP%8QunVjxtvU$$ya*nmGZe;bPC5LE1fpr_>Pe(Fx#CL
zqYIaBW?k+U&5=qU|C%C(gKy-ghbzZ%<5PdD+L#mQ{(y%zUNrXawdn{WF+HzDNS&zR
z3c1;l%nbme^U2)ru&snd6kmqSc97shn*pzP1_Z|0cjlrJivf-O7?CMc9wu*XwXT>U
zW(3b8WStMsQZ2|*@5$0!%hG1f){)89Gs?d3F#BS7_N9Vs<DP8OwQO_d_m^efn;5|Z
z@lY{J<^m#%S2xOrFY7ujR#qm*-YCcMVa~nqoCgItPCYsQvQC+EU1W0IjB-65<~|G0
z^(x5q>B)UQ$u5p(+FE@tlNlSpXSI%FCU}D*dh-6UP9rDTPvic(b$Xh{9@mqfx|ScO
zmj70!Ah9k#{b51wT3&`)L7_FhAaAW8m7$)h6%_9mRLbOYV++fT3afew&y#`NWZ<dT
z!lZW~`2}EOPvJ+tqE_$xc5h(kTETTZlh<Z?aDk|5ZNeDybNMos)%oH%=8^@zk^<_x
zCr^Qk;U%lqCC4=O)wPoOo_8DjB|8Pd(`uzZj7kLW^Q}`-#c0KU_lx(e<7%2qbN5OC
z$*iElV*TMaNGGR>l~OpegxN=MTc&KYpj6hqggc_F)vi?Fd+}a4KgNf`Zd}%SnZkyo
zNEuU(tjmA)l(WhzW<KDuV*Cp$qurz`a^uQRsh29r3dq|*vB|9O-j%(#E5r7_6GxWg
zzVm4Ml$k~F;SVa3!|8(8kQF!TE7V()&-ZeM;<Uh%;yba>Ygo8aO=Y%U<#pq@Wsyuh
zpE3iRVjUkKvA4`1qFjN$(t4^K8bP@-RV|ZTLh7yXjwtm_t^#GHI4mH0y`)0{*TQUS
zUi4OhzgOwXmbpd<KJlp@c_8SNT>0prHkiNejgJtSpAza*nXO(@AY0qypL(YmZnJ=H
zBHTHZfv%iqjtUV8T4D&M7p%_Tsrggq;8(}-y)HST_HRM$=jK}YR6~|=?fYcG&g8nx
zDd9ZhnwE^lZkvW`-L!AroDK}Vl#158A^U@X8YA44Dc3kwWMu%R$+4Hz{xsgVYn)OS
z`1HMG@OwkAI=%E*w$VSLWZ#Bw?|b8DZyi*iMxvMccS`)%>Iwf?re+;SrDiy;T2y`T
zR5=d1=8nD$ZN4|yIB_6+C|d$L{OG|?O`8&eJGU@vG>$vf(RC`((^QdUs+hC%K9-zf
zdBTaym|>Te=8NXSIPTwV(<tI}ifC=|Yndx(N$hP|Rcjx=+;Y~p4%yIpYQ5Zino8(v
zlWTF0q&(6Sx&NG?;7>uBVkAu#nUe{yB}J(hTo>$}8-is!YS`K>Oxm9!OI}2_+X}S)
zaB02i+%;93Y0ZLVs_*hFI`tQe#EVqja$$`#=362+-&<h5$I@*)SmDD+*OcpeDNyoW
zqwAF{z31UUduU2ycwZN4v8(K`JIIw4_WIJX3wnv#+qmA_l)^-$bXQJyg|GJ<HP_}j
z_skab<*%0(`cgY=yJTBR=WE1AP5MArS!zwVO1sg<avb$I=#t66SK9%69Fwmk=Q4F*
zErs(hZ6GbBUrDL=g=nU%TD44kpF)vnv~QoXM!%eBo{2JTN6xI_G)L$rM9`H>>)g9{
zDkt4H1-!%thtIM)&>&-HS^a5{n+&)VJ9v%A2~FjgIF$OE@=4b9(;=e;+PD8Yp<i5n
z*w2r4s*83vuK2$1@bRYpx`w2+JKBnN;(?;(4~qY+^035n>4CRHa{faQ)UfFl+9if{
zs+uWbJH%g!gM|`RUk<}?G=9%asjJn)tqZP7Z1o@O?dvg8rg%pszme<DUz%)4U6mhy
z_DDK`QG&a|a*f3Dnry7v4S&v!E>o7RbRC<Bn>ZE66h}eY0Ea9yjO%e%lz7HHqdvba
z{`@jietP?!lq+Nj%PiKWzNLKX_ni}t@&Xb4!~R%ipR34ceaYMo#y+l}lcT0;i>H17
z)k|;{wOpu#vgdj<hcou4^HT+jQpc8Y3Nc`g!&qo`=XtTlsnJI><1;*sNB1_>Ax8ko
zJpxP<gAN3rf8H{Aw{iG^;A!g<&k`9u8r$sE{jGD6Tnz`drzeDWZ*uJSb8fHGPwdkM
z5)(MLXao0sgl1U=?gKxqug@tpqc>RECXR#~pQ9a!5FCML8D~f)(c0`aB3#h^qBDi5
zv)g4SYKNJui0Ix5jt7LP5zQ9n;>lYgBB)uRDZ*0ZWn^>&2hm>;ebZY^i$iPHsRru&
z0O-lyh}g#tvOhXik7K%qtM4L1O$iEFrZC{H@L53)<!HXRSSI!j<Q(mbi!1u0K5W-d
z@^UoGlrGGHY|K6&{&(}{{a*B9@-&W!_PNEehjTeL5ILkQX9AYQd}r<BhUGvou0TO`
zEzW(?a-QF$B5?Km<<;Sw3e_ggF8n2tW7N8dq#m`mtr)FGKpiU5$;Q=RLAM^A9^i=s
zh;+pcEYtWyN$`Eb_hSIFdn|efaAgUz?5cHp4?kcmGO)xFtkE}l$5i|_yClOUl?a7D
zh<0&al+^!$9(^n|MunH4c<c>e{)((WXibvPAB!a-4y2R%<;bU4WReInbDp^=)`wJv
z^v6NFoBtJ^`<4@(jDtloQgs1Rkw4IXqv7>bH0<7YXmrA`nezSe!A!vF4;pw$Ym<r2
zK1P=KS1vDZGm@Z#$R(z_pizH`hmtPH>MbtV$8rqnDdEAT=GDn_tCjUBu})iTC2QGn
z5;j8;H5H>b<(Y2_j(O>dhs^R&SUI{BpIxKzZvp6hUr%#T71k}#w;~=*e8?1e*K#s#
z2y8_`n#QWU_xC7RRJI6_=^{c(@JMq2&j)taF6zC4zx8@#w5$1Ff*Zst7Ao;oUkNRv
zNf037nAo(qNd05ogD`izyUsEZY3Xt$XZIFkJP8Clt<4z~#lpskwmXH~E=R$bL~n{b
zarnag1q=zrc;;$*e4m0{8fP*dcQ>zgyL`|66t`QKBE$hN+9u0+R@(zmfkd~#n-`c}
zMBx`V$DBI*BQwU|TtPD6RlgZXfa$bN%tVP0j|rW<YZDT4L_A--tQlmlWcS;$^ticl
zBFFU9{-*o_=ufp6^8TX2%C`E~7EcEpotN+NPk@X5h{ns~r;b}v;c+^Q<I|R~8#G~F
z^-9sWJ%jeSSU2~UOAy{GUkqapy?u8qka0~y$q)0{zM|P)Tkng9hp&DTH+sG2?Ytw!
zIGo8`ispRfD0M3)reuY4-EQZunT3Cc=4VTcl%bOzNz~~I9;N(psw+?&d}ih9OLqsq
z#_=)k%XM87`}O1CWrdgi4k9P65y#`|A9W91NU;>fJad0o>*}~%`cZ62zf6<e{OTL)
z^2|lSOv?|8h9%<u?X~?kSN!#+_aZLd3q2dQgo*A*wfXyaw(&U~DrCD$Tx^dLzL;ja
z=lZSjXW1J>?$|Hi2M_ml-u_hWGRiqg=Qwk+%%@pwCpc0z;`i=3b=>a0&tf5BzkFk^
zRdqdvIcv4PNfXtZwb)^2%BlZtRp-s>{hdy3Wtm|aDNv<uTdx1LA$h*2!;`_0p3&PO
zaT(rSu<YVPKj)NO=DzN9w`ggDLh9kFf6=2loUy!V@SSXShk5C|m|FJ=<IIL^qx^V(
znc5Pv*SpX%tlIWfg)?d$evy&V`JutA!@qb%h4iztSU-Fdm)ZDGA+FYv<J%H{zhd&S
zdWD(#&$iR%nt#7km}}D^uktpSw<VA-4taBh4P*kdLcE|ihw8W8*K{;4EsN;A@l3;)
z*2Lg#E4Z*j(koXj#yHzPu(Ro8lj$zUJ5p5hkYN~uAYIM4F0<RSoKl|Mx7ud?q<^&K
zm34n{`p#il>udDUUQSr({6St@V4mxR_M#H`l{Be_B}L@(bE|eG=!30`1s|CAzlHfU
z9DVD=hV&J8J=S*njd=dc>yE(lqJDp!)^`=`#$D?;_s|#TR>g$Xy+d<pdK_mf2F@UL
z@AmtPBbgUGnb(K|xQmjt4hiN4s*bNMBo#^}J)JWV%G-$CFcAl@MSjC0-k<75$%@6x
z+rGSuaEo(t3h`3q<V8ittZVO9TdP$4nFV%4mck?<2pF|$MXV%Vs5~!wv@p+e@sx62
zS7yXGJ6|Tky<O7hy;01J=?Gn{tL9#QQnSa`P^njeHa|EmMr3}xc(|Ie<@#GB3#N1B
zb$OT=tC&5!3c`CQRO>LzAj<1m1-E*qkEbcd3_O(+qENSMn|Ts(%vbIs1X(O~O9Oyj
z_31`>-EHvp-0O=t(&^Zuw0u4YjTurAjZ%PAMLB*i?bPzws9tV5h}~7ambn=a(V1gy
zctJrStVpNMCQd-6Yx4Bh^X%C#R$wQEkB(Ne+UNE!&xLeIY5it`z4X+HH~e!}z#)6#
zCd{4va9c-dy#cB1QwOUPkH@95Y?{Sk+UqqeV_($h1soGQJL^2qPPA^HQ-O9Yjw*V5
zV~VQR3<LPSwWcUs21=Zx>yL1(;GoLHSYIsYj!uz|zA_8b`A9-0HGU%bD%+N37B7s$
z{`>`nr-Ko<A@)3p95K~O%R+?YMb-IxDWLGds3(E;0$)`ws*MdsKWnoW`Y-Dg;(%pR
zHPq!AiVe|s5Is?AXmD;QE+)`HTtfAd(T$<_#5M=Xv$dDZo(?6XLmZ_q{Fim=D098m
z=tkAh>(W3+ImiENo&I0z)Fu3S!yT^biS|>$E|HEJ_I%?L9p^h-qCFbyh5k--YC~OP
zgESmOxj%PZG;oc7-QXa3{&Tl^u<NV$8jdm+pL;AiT;EhSI4V5*+<P19mej6sS2^)>
z-#r7jccTq=egA*6PS>E2|1*$Oke~PeNFzOcBf8z1&ED4H{7rB5o3A<ve9m`l?d<Pe
zaCq14C}MawMf=`821UwnNIje!`X0$Wdi=!bi3dX?^>z7|MtaHh+6~u?D{j$lZf*>g
z)bHuz|FEQ9US15A)Z9n+h7U2+*Zm)#^naI0Zw21E6GZ%vPkJvnoETjEZ=&?WzlqY)
z|2IUbYn-=l+y~$I+Nk(chE?jEV4aZ=_Bp}f(W|QrtJL+)f455AlN_g#oVJo|pTCV{
zaHa0=Y#3JQ^AxX$lsbl0>XT+ao94ci=J-6_DJngWVU@lh-zAgDFEU)WvmXBkDh+z?
z^E#)M;gi<nrH1EwL=^-xh|<EsqJN0eS4GJTqBO1~@_!~uUzhoREsJ_n9-mb4nt_wH
zRpcgp2>Q2A8k$lSo>>)NT-Ci={W`5CExk61TpRPgu8@I~eydB)s?TP~q<`uYvKtce
z8sAnljW#tktu$pYWYRy><dNnN-<#hTwxkxfRMfT5O4~Em+6(`-XP0$keeS6J(3M-+
z)l}78u-;Sgx2LeJx2e5%Y_7M7fs=mh@A=bT-Z)UsAWEsUf#$)g_QB<^gRMUY8(W8l
zdxzV4ho}DWNry(JzK^v18fn~Ppr)fsgJZp0W364|O&b$EJD)rICR_I>+lQvVe4ZZJ
zp6(l(>6xCH*`Mtlom>AkH#oL1u&^-udtqd9X=n1w@VBpD55A7gew$eN_U+HN$*;@n
zhszURSGV?8XBXFI{;n;2TVL2)Ut0b7b?@iO(dP2T_S(Vr`qu9sJAbwh|7`!+`+czY
zhfb#h7)4Y%;0PgLNFg@|z&T`WyC@m0As8{E6vML2_6VNS52w4zvN~h1df@_>%Cox@
zq^}m(c9*~JO;oh+Nx4*!)1R#3wl>{ek^3nf7r-oN^dWCB%P>LaX3vNG;aq%{QL0g8
z!Dyjn#lxAN%EIwdLTk97aaGahiu=O_H+!p!r>codJ*mdkB{TJ&J8Lt&)unSENnoUq
zNeyM8HIzg4R$oooQfI7~ahgeO`Pbg0)BhiUq~ojq50F&)zd%wR{eM8xJO2hr2P)<R
zId7<7IR9smR2sy}07)0wB^U7^R_Xr@B(?t+NGir^{69d_AqGf#=EJ-=vvlZxKvL*}
z16n?m;)urMM4+hu6(qG{fTTkIfTSHL6#mbu-#;Mf6>r+T^aqOitf~^1^-u=W_=*_A
z-}u%%ou4bBJ!%sD_79AvYm|Gl`MtbX4HobL<`?oy-Ypj<FVJcJ3ZU+{dD_!tQh@#e
zpsU|-2QcyJg8Y5ONW+r*v;dt4@X*#$(VLk-PQ++JhXjAI-d)m-*zmXyBd#L>PzHz8
z<98fsqfoSdD;Qi1Y7Fp?sw<)vmWnNKK<c<o_&6JOD;UQr0IcJJU&%*89_zXqlwS^z
z$QH?k2HpRlc+m~w$D&_xpHisJ`(*k@SHkD8%cXocn^@@wzqaylyM4-?m91BXyA*?d
zl|{=$wYgp5i!-S+7h^@sGphz=1535H#5H>rqw+NHWd-8JJvgOLzTK4LqN|}iZgLyw
zUImUeSFs^x4ZLs<bG9*gcYZijdis}A=h?f}hvnJ_hjf8T-1r&LsZWu&BKyXJh~Xw>
zI<`>^NV3k_T&$obzT@N3nIZT%xN?P}{ooZgSo_`Wg5G`uvEpC2=eb+e+VgA57Z*Wc
zL-4b1gagknAeUjda`|7EeA%d?o#<~}FU<x%*&UoV=i(#Ny0qHd)--y9aLL|7cM{ec
zZ^h+pv+5;sg8KEOjpgweP`D_D6=c0&E&_5r{UaTqu+Tu+0)&2qT114rf@G`va~k8a
zc3_7!UmNHTaL?9}u?L52&47GUZ1)fjxsO$T85@AxEFeRtLt;dLdA3nB9BAP@a>6vi
z9mEdQ`bKCjYmdFWfWZqBpjeBWaGXv}TR!~_*-sUoeIaut9eVt%lASrvb|`$IfR#s+
zp8@>^fv=G?@G<UjNM7(Z2?je8;RL@gw6;AD00zoSC~x@?+j^_4@zj7wS??&K;Xd<_
z5*v0&TXdrHERh!A0dRc*c&OjrG3rmu#)A)raoVqvf;}it-1~Kb%9)lI{WuGmK6#3t
zhgx;%<xpTdNf*#h8DAKnhr$Gb1x0Ij9ltZuIEje~SZ)x@pA4#SG31NZL@+4j0U4rb
zn*p`1p-6Bh2wchRQ0sUdOe_N9>;mS>UGsploaWdgOaPCHRIEo59;{<|y)(8uO5#UA
z{F`eT+My3j91L8zrgu4t!-MGl#(j(LE{p`7yIIrcv@#q~lGo{b-%@`l19#8$U8~kg
zZug7qI1^3Ug^Dv2R?l0?(b!ZZ8~7L4Kk^B-8iH@(E5GPZ!+U4`f@#?*g@8q`JX&&1
zV*kq~cS**@cW7v?M&?@#mt7&+IMbkPdnHEuY+TN{4IYv==1lCu<yS-2Cs9r(G1He_
zgz6ox$^G5B(!cjG4^(@Nxni@)u};x8B!YnCzpLl4A3)%nfSose8vCM8mj$eW*UtXM
zvLE#$SAkQeeMkoL;JI8>`_RnG_3-f~FB9xioi*PPTeSA-sp7;g|5sne%R1wc!T|5L
zSK0VSV(b3MBRS&&-7m|r(Rl`i#Za`5Tth>C&etH+6V0c`E`x9vFmZ@qi=%5mY}$5d
z?YR-*!z3d~=lAYh?e7Rr!<=jZh-@~=>Cq<vHWO9NlsB;l7V3$$#t5Lh&=S*+)1o%9
zoIRg}9qxQXUgU$E?7t3XRd=)oax(fu9faI40fj44mkP&5EKLG_y!>_Xw!dxUa|>Cn
z28f0MYIi+|6N1%E9T(+`UDM_h=ddx3uySo2Pe4yUaKCN5RGGJ$cuW?p#c}I3ab;J7
z?6znI7e0cExog3^7Ra~B<7s9?^{4OJp#PNJa&`&O+L3;9=>5<{%!ixTU+khdK%Z6Q
z{GDsv@phq3-A!CY59y6{6JJO1EPcJKUcx+?V`>_t0B^(ZxP#q<7a5dUPtMU|*B*O0
ziC4Nx-|&%4Rw2JBP_m#X`_OmI9Na5Qb=1nKPdAq;(sd#i1e^f3B7!q`-h0elDRdHc
zcxSOJr1I(U*juQ)LgFh*Wv?C4yW=ctl~tFLIGe3$0r1Xu^{V$k<I@nwW+sL6_=tgX
zf5EZOdDyj9p2?n4sI4_S{vCM4=$U28OUM}`zrqtA;T-Ej3M>}|zO+4l_|rJxh#K;$
z;moN2{8?|&$xemWOl1AfQ<I(-bX+c;kMtKL(lkw54QIx&oS}BY?b}q~&hCmoek!Dj
za}bbFFK-+%HT;au6x;IE%Z}~97|U~evE$~%L$<<*W)kSJh7XknUN{TiG8EI}t|?4-
zd1JzmyH|~qHyVgsxv>-4wk9wX16p|W=BguS+RnJ>O`>}D<M&l=5}$|7LX0`(H%UAb
z=XJnbTjtWcqhp#gzrCuuz<5vIvDY3a9XQ9q{fh-M;p*4THeBx*6Gvx#i225c-QXMZ
zH2I&!xA)H8nbCKs={dR_6X#9J7Y;o0ootLLzompq;je(c6S`D!{?Ari?%w{>Lsvid
z*_S4czt>AUv@9r(aNo%tRea(dNx4OTL94BR3~WaEl%nmWm=_kx!63e01dkIV+1jED
zCK6#8K|J{(^lAchJ1SI{#blJC%VHW^Bj_OX<-^hL`F@PANnNY5y!P_)r!xUHw?&?A
zn=v)N;8H^Gk7H}TVIV4ONJ|oIi*@TfW((stWZ`$qMUjaevO|OG5SYGTSe?YNnq)1t
z%Z~>up6uV_s24wxsEB)X&rgwupZ_dYhoYBAU@|5!S&@<7W1*}Ntnd;?A_?qQ4iWd{
z*rA-dqJ;EYbXM98EQzxLf|z~+EFnW+M^1mzqCI{h=+*@16;G2Lj16QFSfQw7(H3;O
zCfHep^9CM7gont|uA-G;nV3h^_rZ^9LVV$z?km{p(GY)?P{XYdCic+4q|opcjvYmo
zX!>qwtO|=%W#}u*ur~~lG%4&|O<2mrzd%wlPk5$Ect9B|rzhJH^(98><pC|cWWu5#
z?_$XW11gQ+%w*oJfFvZbX_D-rN-Soc7zp@<$2si&vN)%oGcex2Y9exD5FISad?qlI
zr&$yZyn|4R1edWUD&9T%a2Dzp$<Z7&>xr0OVXzfKe!-wR3ObXfTLH1u+&tBD&xVx1
zB!q!@RzP6vXz6*yF&?z>Jdkwn`u4S$>i0<7A#9rpW(DGwDFJ%(Z*SBzB-S?obc1{c
zwiWwy{Py>GW@*wh_7>FUj@)Vu-#QVqOh$vs;!j$!tH79otIVF`L85fr<Czh;A7F{Z
zzs9CRXZv$-A4gz9L<NCSC3!{U*Sm^hU(kM_TaT|}gf8hnplY2M21!%3<VRjHx>@5C
z6?~RrSBB(N6wQ3!=w=Pyjsr+2{ez7*vz(mAAPI1Y9UQR<;K5>^bz}HrVH^vnJ^))_
zci1OIn0&mV;8mrQuafv^$}=NoULRNs*<X!+&>NdTzZn*d+15QH{`Lm`vDYhI)JY8b
zvuy8>EW!=9!v4;ASpL*6;h810&}X@ix{AhlI5o&x9uMDilX-&RJxKwAT)-ZmG0S)i
zl8S_srLgz`{ZFzPV8EEmsqdtH>%iK-X-Nu!EGW>qTKW!4#95==-^QxhZ$CQ7qPE|T
zu&24jsuKd`?VrA@LfjY1cgeXS_h}xz`BuGAS*`m@a&<oN<}YC#Ou8G<RGv)!dp_kK
zX%vM`Tqc6C_@rY3q>l*Zp(5Sif@T#lvkVuBk|Ls(33AEcWk{nqD3$^kw!(OkfF~&_
zUh^r(gw%BgQA%W0=|MVBfYf=kstiVBEejVOc0@{edi8=}0O)>Vf}nkfC`n!d`yM}p
zw*8D<v$`gVL#<aR@#P|~dxuQ0ODE#x{;bAr?wmz^75_aCta+MaF)16SOom=27qZLg
zkdc`Q_UjX1NodBuh|zfzM*$i|CxU|&GmdEhBmu%63tPt_PN*ef000aCxJ=A{yM~Tj
z%Zrr(vJ>DK#VoKL{MlO&Y95WnLH}ipQh<n900s-B)B*U3jA6jS@-_5_hlMo-g-Llx
zwh_?BA*He#3I~cxI*KQm^L08ikuUv4B7PY^3pM)?EFuXlPEbb5x4iZVSI~iBxfAVc
z-som-7U4$1<5tn$Mz0<7fh9xmmqUifiY!;IfWF_!i!B2xVVOGKGJ|4aUKD`qXTX(t
zbTB^q7yxu#&14v(?6Md}ot)W;0uo7u`T?6CGEm0CinaI&1~H2J7cnZvU-Y3aW2`&u
z1CK-RnV0$W6&LL{n4R$p^KIcPZsA~;3f{{v`rwp^<^l{U5n&89u}MOaGr%rooK9sN
z^&d=SnPk4BUq8g4Nr`br2=PMnDW7tROwu|4u#Bm)=dU17DE)cxfin{g+ALot0K|G&
zd-pzEQ^(w?uRg|CKl5SDrvOed0}5m?kniX|#f<Yr@IDE6Dj8;FQ?-u)qvz342Q_i(
zwdvBtGI%vo7ufMI8-dLq$ghR~flyjv#lx~fS&SFHuAjFIgaZoMVAeMQ2rQty2MHno
zuHdSXn*b<7sU`r@*3eDJh8E)n8lsL?D6Ck^HvAnu+8eL1n)&%4MS-_)O15B*UZ1(Z
z-}puLIhI)SHM!}s687Vn06rY*Ws<b$my@6?O3UJ<<_^igmTRTWtV@MWfIiOk2-f?C
z3N(!N3h^QUgyIb}T_KvSki7xyh!p}B=-bQyMpr1!0@KYxhs{`l7SV?0I7Kabc(Zf^
zmQSNaZn{OGp?Rt0<4KLyqpg;6zO6!icx4j?NGcSi2;&!E(G_6f??X+KTF<ed^nBa+
z`|wiJt@ubGKHJBd_;!A0rW>R-L0^Pu3iP_~dqEAD?TK~=4WX+=Kq2Qg>%Qibtu5Nr
zcA-O79ZIXCZRd<jhrl7qvJb(3h_b@4;0a7w;?Q~k(*wmWemUku`X;KGV$w`RtzemN
zY=R%qnx7mt7mPn*0-{%G-G^8<wmdZ52lJQKy-GwsP3g(>>lE-+cpb@lHxLv=d=5Lr
zqnS{mw6;5BW~nf6T&#J}JTqrsbK+t1GY4gR8q}8xTg9;L0U%JuyE2byr}SA95Ctjy
zX(D|q_{Tyi&{AiE5)$ik0uxMQfH$DGuA%u+L$hp4=Npzzq4l?LCFnOC+b4!Dy4j7{
zVxB1K2Nd)2ulEbG4DdS}@Y@conNYv21Nr65)>*n?ny_2js5ZGz{Oim=F}?`9Par>3
zI|)89k0`}rK9b<k3|ur0$q2ma-|X9*hetEYpmc2iC_@(oAe1)X3f<`3d00OVb1Xp9
zf5cnV*9=AV-ZvTemeOm|g_w&~P9f{^%Yl}BQ6spvIV>oXI4GDRcX;K~-*t2;2@<LZ
ziB@Dfo`>JXvV_JWjtR`xBve11<&y@qngq+4M^7lieKyd~QpbHX;l3o4Jq-m`8oAIo
z5$7_(KP@M^iQ4$k97GsUg|)5F?pk4?rYyF17<cRnNE7o(AVtUC3nOGY7D`~fK94pe
zqHzGU18V##2?gHj3zbI>3yi;vnmQ&=?E@g`u}F{2afhQ%k*U*>E*;UjDEY`<u9@b6
zjpjMUnH4H(Fluy!1|~XBve4ruOE;OnQDG%fsD~Tqw}5d&(gY~((=ibljm6~9rf7$=
z(Ks{?kF1SFR>@<+i>Cq6Jbb<=vqkYwsl84nRHoU{6`E46{MfPl?3bfS92VUVfDAYE
z<)xs1pysws=RgY!)|*JuOy6<TG%#&3fDMur)i#zo|K2nT37lpBG3kVYJlbUb@*M3-
zf?Ne4ngtiP1jn^z(K?Ukj;WK@c&5tO3F(qW{4qC+hc3)nX9G`V5zyWsnr&d40b{Hn
zf6#{FS3YtGSP42xMCbj3i&8&vmVG-Uf6LkYa{0xw_m*M)?-1Bx(=UE(nCnMWgS{QA
zo)m;FfKG#kYmG^5A;Z&_JcU-{wN_u<T7C0kH7RZNUDImH>}uNaDp_bPQ)?~z)>_Vs
zwY;>of~K{i*|n16HHy&pa;@+G0!f>KuLrt)X<63b!oIvk6yd_|`tZb_S^1+b9m<I<
zp?-hy*gy6fPy4NpAyr;=P3v6K>n$(7k7hJG2qCU(U5ChFtp?-~a@Z4x>oisZ2-GGS
z2wI_S%$3M32w|6^e*`Ese?O)MZ2tf)ZiuS<L{3vDn>LJ5OQI}}tB*J3A~*lu+GIwz
zuxM}6%39F$X0}s2oVT}xe78t(TYR57{wQpH0!j#f+!Be|V!ge+{Fq1R_O`&O?Y@j{
zLHab<u5nRbVFzKm<JY{Xf^Jnq@APi9YR0gJDgEM)<S{V+h11?TN#BCH@vxu%WqzCI
z^4!kVkH7i{xB2MXFEf7IyxbO?`z8G8x8-etTl7tbIqrKge+YBG@6dlcrvHBO=}(*1
zU-$G)&GbJm!U82!M2X^n#O<#hF|0J~j(_@QQ0aEa$G^RUqTg({Zje9+^U@&;%<-9V
zVWpci%w7V0o@BRoK-xR;aWCF{FS1mCpW&&e&a*pzdtv9#m%n-S$G$J{z{+{E;^lsX
z-D%M?Qcd&&xA=BO*u^c@!;Y7SUFnBC>4$}-?d=~AX~IWC+Kls@L&L+vk@O=O*gzV+
z^Z=K!JSlt(R#u34(t3l6Xgqbi_VIZAWl$6iOrp1x%$xR&9Wy}E$vN;(VY-3_Jqmz1
zbB5(VAgO~T=7QKu21uH1Ik?CGNzXq1GBLPx@qYzL-y1&EfeyF?4g42KI=pP290$!z
z0&}L~QJRqoj*}y+SMx4sSPzm~dae{)djI(A<mmVDv}?t81oJr8t;jUdeqOboUu|k!
z{s%}J{_1m<q%~DL<2TQ4wbVj34Rq@6w580Ms_Q2X#63s19Q)q7=nART-gE4agjvkk
zO#XT>!kB=&JHzLYRgfWAdVzkvGkiHYj%KA}XZh#J{B79ns4r7Fg_$?J=UHc`RfiWY
zMrG+W`Rut-vP9~>&CVP=+gxa$OSRxpx4y3z0e#(fc<8gMI_y;Qh~u5*->u*2>9>Vv
zo_GKG-t)R3kM}1I!f}nL12qkJqzSC%lRs&JsaMctNxy2WnSF+&sE2W!q7<mA9V)iv
z<V}|7aM`$TUEr}X(F4!m17+f81K0Wug!I6)6B&JLE?pfjSmL{K0*%BBB$M5@FG;WJ
z>I59detA&NS3JT_`B*T$ZJbvJxvDsn`EQW)+HksGhx?AH%F?TZPQS4aJ7yX?hb8^0
z2fudAap0o@GtGZM(z(T}coiGF=ER)5*fXz^edAs+I}H>#!18$FezE510zJ%hAUYx8
zMm$joG<_Qn21qJzeQoqqj2{31#X8D>;Gm?193w0dK)R91Y=14q3{FbUy-ULSLCJSS
ztf`jLTzU4~$@3t0GXNGSb6+rF)Ux;N-|4gWPH<mx6|%%$&*R!Xk&6$FdN`G;9JK~{
znEH;3LImK(q<q1$ySz_KZ(10;4tng`g<4&EwjiX9nYT`n@mgfPIcWC<q0`lTX*Ol8
zeIn;xv}4r}W5Vl#gFAE8Dvtq=AGhG`#|9yHle^dgnQh`X67MEGyBnDM(gtDg=w4JC
zz-;uST!MvuF1q<rtdwoj$$3AYc;4l_K?Ktf-v6#R%k#l4-j(>DMAB5Uj5OIk+{anv
zPQ%VveP!5pRwaU&%i>)SKtK^dB6f+``n9CjhB<g|G=@bzaT&FM12_o)lKm+atRGT=
z08CY6#bEuCA;9@>%vh=_5XcJ0Ej&JW#6%)Ks+$L9^Amso0E_gwR}dNPX30Jjh6D(b
zmG%X;4cayD!E}G_=csGIZo04X)~x!WX<mc?7yv^C-hJ+O^J$Rm<+LqkVz~i{dX#fD
zpmAsXCB0$4N?6YTfOS5n>c`MX<@(;raDw3Jrr2j3371fS&K)Lz%5?-F^6|aSyf!)u
z7mdW*hkdq!0j)i5A?+@h5Eku8XS>*du<5|tD)}Uk{vVbB5qUTJEMcTbB^aRC!UdQB
zoKIu(g9K*z`werSc=5~+vnFRR1j&Hc|83lS{RAXnD~P-aZ%q{>fcp0N)I=5i=rb`d
zogD1>uP=T)^8*%oq2dzgTx<edZeEfDPhI-Pq|=?+;~x(aRMWzdQeVXdO6m&%upa(e
zixg12YZ}XeM3uk~D!{$1`)6i{tiVGWABV3$;E^uVRT&aM3O+e@1KvyvG7C@&NH(>c
z*GwkG1oiQ~$BJLN1c0;Oa&+(mEQV&**Is_x>mYey-qU245dGj>H^B@~mu>~@mO1$S
zy1~?71vI;ki&4AmfMBXNdW^xrSEyJ>lb0V6vl*{s15o8uG)_J2m6UF{$@3UgH`mM(
zK;FIp1QPvTyP%|^@95}V+^w{kZ39|4W5*}=28hn2ILAYPSO#x~!?~;3Vl#86wZl`r
z1yNG0p(19I1k%q1c0u%qOOQwGP=F;$3g;|=8cgDFlPm<NV{kb&K$6FrLoly;o|sSO
zr>TwkJX8@DNi4Y1XBWwz<kMp63V+3XI3jskF=I{oAxDYe+5Gc+0F%#NG)6{Okkkph
z;U#a22DQFycMn#u+m)V+doAhDlE|kNtH+oqS8|g$1Lc!`N75lCRPH8EU5iJT0r0>@
z9{-v#78XK;{Vs=B`i3PFkcM-&r2<~hcL?Hr{Fx^FAF~0dw$EDpnRZ1v(Rk9*wO*)=
z$|tTdMciGcGQh0T9hgJKyeXez2cGs=DvhaF`||3^uc;>lnXk(`-Hc!z-5|R|D36%N
zd&YMs&XzKO+{{1Wx8?~YPVXSMK>ASq`RC;OjD5%QJCnv>u>VI?*G&mNfCeyfji<F|
z+Ej6Tz6MCnT_6epSn<7cz*A}GM2d_&;3R;_y!9un0DxJsz=*Sy7+U}d0B!<u5V`=W
z`Ym%VmIf_rdrJsBKtTjQc;X6=C-;ry9mpo+Z4kW`C?8n*Vr1%;^hMR1eD}9soWp%=
zpKRlbp0bwBS>?P<<dy0qC!6}Zl;>Dx<!XISWxQ~X?i%*}cNN@JtS{e9{vg_`se0PX
zx4AnlPgUyWKp0jOM^d%eQ#F6%nk6`s{a42N^g_-1lfY4C15e{{WER6or98NFK4dUP
z(j%Xna~1C-$$96`FbgvgxH=Za=4n=$w{`EK?Q)$?UWrHP^CPGENbB)d$#V}qQO*uh
zHlG9PJjzm!oJR$GKHsbj0CAB?>XQy&WX+%7q$R-P<#RGK9%e#+eXlyn0xIz?$!gWI
zf$(eQ@0)h1U{NCI_OuRM5E+1(k7R|3lR@<RY3Hs6q8<fGHAoC8)Ld)9lfayhV_?!$
zi}VD*#B(lb1X0$E4@+VLT?9hOl^7Px7ToYX2&5vI7hKtJoY~67CPj_>Nl`5rOBqW;
zrrqa%ym?pFc17<cqV=WF3Et{6En1xeT^z*;VE02w4Yz@=2mN+{YylZz3Z;byxOGD#
zfQ?*-8|xMbzTrF&I4i1Z-qj2OaRNpz&UH73y?EB()V9)7Wq{(KkkG^|?;m&C;zc|n
zQHlg0YuD2uw?&PdpMm`RcpQk6DlemgW#Kj?fiu5FAP5aFn(`RLg)p>#>I;~)=FKp-
zj2Tpg0CR}mccAxy-gw`dVy&TnW)%R)h{$1qY&B|YB36Ei6J-xlxOeXa0UiTCG@dZD
zC4E8^{(c7)u$~>L00xF=!si03&d%oUUAe9iU%hCBAmF<0VMs1RM^aBe`5bM0l9cJC
zOI7brcZVT0<`JafE9vv9DK4%WeB~->L?Q6Jiv1)2gA_t81=~vt!EB{KZ7M(#X)a%h
zL4|s{XeJZWK}GT~LM;H-d?ShUjsp+`%zU#LoTna)hLfNW(rz!}iBfv22q1n+;Ad}&
ziHHD5G4<EgG)SImP;FB(wq)2Z)p-g5FM7{-RH0NJ84Sr{I1yb`%)~78o3ZSR0m=%*
zYKOIZ;B^N!dh~NCp^e7pqU{4V3Ige}IS6(VGr1T}3C1fj9t6Pq3Pjfdf(b+N5DmHJ
zM`bC8PIL>I@9=<D#3qeIY-$2nr*lv1!`MdJ0J|h2HJ>>N$R$TYB$1dYe6A`wK?~5I
zdgSBnpc^SCxu+3Nnp@}n0KnZ;rupD&DP;9fEu*r!ZAAK&ML~B$3)`=zR<W97yaalQ
z(yBy4O;AvIHQ-Gt=w=ggN$2mLmR4U_xtR8u5yZZeo||vgdHpJ8!)6Ep=!8{>=KwHS
zk`YNdWm|g5IO_WYM1*Q82T=fSl3~LJ>QGhv>X)BqQ(>$RgLdh&t+#?}@+Zr~@`l6c
zu%ru*lDi<%Bs}i@gi`9a9x3Fanm7k(`z?3MLy`?bpzw4{p1NRBtJY)O$GIIubn9uF
zy1;lD!oZUB)yv=cSNBT&r4=R8pJ4=6rq!h_%vIxJ?ntG(eigeYsn4(7mW>3rB*X9H
z(&R|mEc)&|ZRuoxCY2P(CKH@R0179mlTy(S8L(x><o9euIf9937^Q9iAah}jGQuNe
zBind?_O|e}r0n?hLPIrdK!9`eY6eLFoW2Yz5&)Ife{E#=)eg{hc+w$-_tPbvsUAc$
zKe=$L30SB6=QQB3KqS5*7_BH+G@>JF-BWk9HMhYuD8lHr542QPNJi0!ew%7ktU&@(
zpj|D^zL2)gtGHAwOqG*=<+I-hhg^^%z)3oNU+Hzf$j5tt%uS$ZgY)~_`l&aP$~YHm
zUN4kKyi%A{7QUJf0U3&(w(ppG(1-Q!D<7^auLrCkxZ&ce=>jKQ@%aNq5W|IFsm-RB
zr?X<uRG{==6Ay}vwwjy+FM#<}2d*S5;tgVufcEVEoHkRo*UB^NXK%v+OnHD&QIa~q
zY=M(RJ9u+{U2OAC?Q*!{{rvQld8pDf*DwMMU)T7mDzq!!N|PnoivvIe(!Ds+?K4L6
zE`~swiH-{Ns}-Q2Pc4~;i&GgeC?m{7(_CZuXlF%2sx+gE&FP(iCOUW_pNOU#^J-v%
zfFeu4N+AHDLUIu;+6fcR^iI}`Fihhy&pDZcQ1OF@YB|+ZAxXtWy&ca!yo=-T->D@b
z@&-Pvb}$KcVgxUn-z@!a?A>=)Q&ImW{4^j5Aql;cgeFKAq)ABtkzNF)h?oE(O{J+I
zh$-|AA{`7!@4c%DT}1?JsE7ekDHfWFfbitL=eM3U^WVIHc?ajLb&|8swfFb>@HKW`
zQkTfRGx|4#3@;=*K*{i$*cwfM6%W}aOXKHS5BE9&NH;0=6aL)m6u$FZy0~&i@l}xZ
zL)yUoMrFV<Ew9a4YHjl&gzn5A5NDEV6!F&T^F|A2uue`S8RS~ZiG4QGVQ=m_=0JqZ
z`s;<WIN3jzDSk3$^%Xcj@5pB>LXUOs3BZr{GY#hoJ{GsW&=7>Fv%BMmIh5*rZCcut
z&)f@)gFpe2mCuTnUmn^w&St@1d47sN3yrhwgr$9-t%h=)gL2%WFhq%+rM;RZEgWj~
zIrUFrfkg9yJ8pE{__G$`)qWgWFEmT0X7e5-U7B*Ek281_gs#*;2oVKVBna$ZQvPL*
z{9amKvR;zhsrMbO4VSf28{HZCc1<4&YSU($iR9&>>gJPN$<N$7&);t}eBT^FEet;w
z=;z+iB8uO8*Kz*bgAYYr*UmlqcTW28`v;O9i7V$Ah91Klwe@lyqt|2#^3#XYJRX1G
z1Hq`H4?KJevy=-wCcn=~kx~Si9@C#OpjO0l!}BlG(1XEo)0aQ|Q$&ebo_|~N;VTx+
z6U_bQ+4%=Jw7@#w;k$q5S%xW!r1KwCJO>JR1!m`1=RLpNg}?9g_>?xEP>>*6hGL_d
z-=2AX|KR!KyXVh;Y>@QAhUA4!l?z*j7q)FL{9=QomoNOebzvv%!rzh$yNw@zq{TLn
zJy$+l2ygumzjFbABm$*~AXOsRhzPMGa(EIsuMpWFDKwo3D`g$Zc^*6<h81wR_{Fj_
zYSaM{jU@3(k@!?e{Hi2g5h$-NiQkUI<4O`rCyADl#F|Lr4;RGbp(3Ls)O8Yy^}j&U
zMciu=?l(!=Zjs-PHZ?*#qJ8SUVOAv`0glvKZG?Zmmi+ZvhmzfV<Lu%Qq_>70EI@&~
zn(lSzwC1Jg30ME(wRGP5zTYQ}Qg40Eq+_p>6{Ql7jvk*~&#cC$%3tp=iub+;Skh;M
zq+b#v^Ru}XeGKKhP6+Yc$A9ujS*oHhnN9lGmL{G=W)4k}v9q5@_u~~;K3K*qIjUa#
z_yA@z@8dGL6qyNgdJWT4?XsKCDvj`TeBF62ey(WhvkTJK_J`N!#*3F^d`s28kW9an
zIQWuczG(RRu8Kha+3Fr=&nTYl37mvoiub)5<K^??%O!E2;_+mBymshASlEH@b)zLC
z^V9%&{rAUH&I<KKb|u}sa_LsgqS0&e`G@@$rF^%W9+AyI-!fWOmq&AVJ+kBcd|SRR
z9(nOFw$v|K_4w*ZiuS;A^1NSq`mwoZ%jrn}EGhqNRsTCi{yBF3cRl@culVQ1_~)nl
z7nJ%JHu)Dl^e>+DFPZl*{o#M_z@Lr`D3b~(R}Hvt6i{IoQ0W;^btRxWCZHxgptdxi
zt|_4YVL$^LB%Kdv`Vr845YWN~Nu>hYR0G?M{vSwsFBsk&%zf$Wm2rqg4M$K<FshsT
zCY>vZ9IFTb@#}18t8*klH&9nY?kaGq0I2fn96=&rES{>3hdALOn(84&Y<|-Zg!QAj
z1c%6AU=a!-SP^hgVu)T3$L-7n<R30lONdbor`$cNqH(C|SE#XWh?5@}n@LN|1Ru%*
zsEQ)73f&<*#vvBVp}KDp)wn<^ew_M0Id7x4__?Sy>s&#8AeCiKIhQS6we92x4*rB#
z0xRrx%a&pFR-)_nxf(G4&#hE6SIBrm5+mI9V`4a(>sBH(QX$^Ahs#DM{9kT@)a^J8
zJczW;bt)p9e{9PO05WcY=nHS8Dumc)CWhx<OV0#jBd&#rfcPJA@c-m;ettEQ1rEvw
zsU#*|$owUb-nb&N<+8JpHV(nofRfbXuKY~2$)q7qZEGmRM`eNyTz~J!b2*{6HP9h9
z9X9!ogxyAS$uht}^bPi=3cqkdVoQkNpM(ql378{p_awNW<Gsj`Aawkp3z;hjeO)tx
zBPJqFI`2B|R7BjRh=fajwhkcTTvT5Xnmj&&V7#GCPDmW*z}A4>@FCVyQ0+fl5$Yki
zUulNVId1P<Qy0EYBF7p&O7Qu^Rbm`c`X`bf6Ok$WGy7whJ^FV+1~ejq<5Wag664y*
zk6YS)oT<7TT7S4&uF}l&LV|+-%Corc{h=jt-HgCP&Ixmsb5Ubjw&ZoAL|vlzFGb~E
zy}9u^?C!nan7jmc5s022*dRF8r8?nk^Tw$odnuU-Zrvg5+TAN}K&d(*Ve5aR6t+lz
z66^ugf_r;0J^K?})Mq*ylYjO$(l-oGfr8Lm+UQWXH&m&wV2|6|hkj#F4dLt9<><0g
zTZ$rVYBw?oaC1udU#$Ia7A9s<C+79lTW(|EF#0XGk6{+$aoXy?`9J<k!C&XUaN~B(
zwYEn)zEe@Mx(Clu|EBG)Z~o!hI(4|57vpv{{zA*aT3(284TqC%7(W+O<$#k<IRXVW
zA%VAWIWk=1`7tYGEN;hP;RrT&UlKBtfkP*t<xVU6ZOT5$IqK3Dw6ZBTk$>#cOoRWH
z{A98IjsFuQovE<OJEpSySm0$%=EP&oKWN-p?B!TnX5q>iXEWu$4lhrk&)tn*-?weh
zT`xCw64R6Z_7&CW-X&M`zk#Gdhdb(v!^y&$=58F%mE3ZdIu<_F6zDp&wIDZgwo2WK
z>Ed@(FYjutzN~X;zw&+eS6~n{YrQobu3VvktH&{uhXuZ|1{3(zuI%e>E<MT9yvv?*
zH*qSB-{G9x*Z=+PU3b{eAOH5Qf1PUA{(Dz3P;mV}AnDHo!~LDL*3J;W!-qrKfzM?m
zOze%wKsY-uV}qnDhk|WwD3wQl2OG<4rMnQko^Oha7Y*paB}o2nAZdhjvSMA2bc#yf
zj&$m`UqkkU{n<{wH1LP83}d|}Eg7rzokYG&jsJk8mPeEFG5AEyOm)0#9-lE@cQNA#
z^qRMvwQuSnDO;{R>29`=Z$1P?v##rvFJgnFr!~U<n!a{dDws(%_O>C}8Q-}6SB`LQ
zaf90}qTIR4GP>uN{QWfj-R0zctVW#iE@C>~c*L0?o>AqDJH@~0mj#o>BY3B44)R}&
zRtm4)vE<Km1}@{zZQ>>kyTdiBB@U+Uk0>4ZImXG@`jp#iyz~#r5DLX+SsKM)%i>I2
zwMohqZv*;Oy4UqUW;%|qXHa~X2ad(MR(35|+|4_#aZ=^`q~3^<JJdPl?#G#3ArmJb
zue`j2ahb{%Je~?gcjn*cKsSenzg0SI1j*3FBTlcXeFzxP7?VUD5tsG(;KYND&OgRc
zS?PJG&@7bS^>j+4ssjiyi0FwMeh3z%S@3i2@v9p^0v&mKBPQIY2{DM5qgQEwtf!Hg
z<9DmZ&YZh-{58#%GK{{qv&D_R=5wsexN>v6?de&h!RTzk_@{4pU18^^BEp0F?f5Uy
z4`y=@j#|AjKL~oKtqnbK?6-=W(nH-(X?w%>Ot=;tp9!phvg|WFx{Cka9nzLb5Zz^Q
zKaSk9(;8K@OBoqMpWwc{9@#ko8&>1Gcnm$-R>*%zzFRA+=M$6L*kA*)l4j=Dysd4n
ze-TU)dRP4M)fvGonV_qaZ4(HHl)>iNV@&T^ZiuwOB6sX}@MF!bc0+y1-<cy%jg9}E
z^**%Y&)|s5o%y$WzvGed?j=6J?tP12C$J#?8a7DULP17jAu?=9<#Y>GXaLKpS;OQB
zZJ|l+W1&1RGj6fKn63P=6YnU<@aRwCZxcBYwAK_NLtX6cxH-4WPWp|B`>}gHj!>Gy
zFmBKnvxOhyzBrzInz)FLnx%<7431NfC`&f#@e;g`j#Khj;J)AhmRw#RHk2q&wN?Hk
zGE@_<U=@;lcAy;9HhWS%o0q?m$f4qw&l5fX#+dEPV8ONg(F32vr|BI0B{lI%61a31
zhar9x>D1YYsrcw`IHTXp99}jS`jd!5+-M!vG}+)zGZ>Uvb4@nzy)PLfAj>YKddrLy
z$riGm8xk%@kEu-&vU56?474I8WTZ93%KtmZVr|nRE%G*k3w=@XnLlSnE|bV1PoEuE
zQoeJyNdS!tbb}u$+=O131#8kac>GScm;4A9Fq-1!IV(X$x~v0rP>#vx**DfaH)S-R
zm3BV$4zeoMM6Kv=+U<w!Wys@>##6khr&(>u0aIU9A8KR>FMJZ`H;fgliLkSQfF%c`
z6|9_A>FGZ}{NeP)lWx3e*UiFg|3!=$5N<+Zy{JNOi8WTVqs~8BIpxk3ruOZmjP%x*
zm8V9`wB|Kl)}HRv{q9#Q<`4-zyRQ|oGtOyfTgz$l4J3KSP|00%>+sd-DQ2<H$y2tU
zg{N~1vyqjFoDMJQ-aL@vz%X?oGJhDa?ijUTJ`zWyI{H%5HalC>Up+P|rzCkuc?qBX
zz%n@KJ6Xf`yS4P+H_I=~<c1#<q3>i{U6h`cO=fm#cE=}4f8MlfUw#pO(ocH5a!7tk
z?dndu#ibOQlytS_i{#6eizjcPIXtb7b#>JE@LaUuc28|9t#bZhaU+Xo)M!~ef7wgX
zZteYsogjw!U@+LpJHyXmyY%fX-%BAT<DdFoKA=7`kA}sjpAK#n=#=}J<*SkK3STY;
zI1AH9hQylY|I$kMKok1;^n9g2XQPX5tiO0H(ndMIhs&JrxWg39=&*t_D5mCh0#|n0
z$r<TKNz5_T(5N?uzduVdcdiJ~#ohpZc?)}{nkT2lg62!VxDceq4T51yGc1}=l>x+4
zToc9q<U(0%PwBj#Wyv)ANy&*ob;NLRYV3X9HHV2wPHLJ9@jh1JEKz@PZlGZJ3<lzy
zWUv(dm722%?ZCr~7ylHL$nHQ_ZaqeY@MV;4%ZMfYQVY6XoDF*}E24K@!|^v|CC9H&
ztK>_lbvSP<xy}pYfE~kA$r(}#U-+BRrxzi|&`#s-6s`qu)1|@8J9rSEng&Nx5m6yW
zx3#O6I2#vH9_KYK+|rR5ZZ+%xLe0raiLq4mdI*_%TIGlGzgfYGyBl9i!ewq-;<(_R
zi^)Q)3QWGkkdf<jw%dBFxWYO^?ySjAY6Xrbu9bS!P8u%YhksA^wA3|diPaqQhJhm!
z1osKxktHv9`tq0|r-t0^?EuOj*PJFwFyAfcP30l&$NX-myG!%?<=-Y!2mFtr0zUc-
z#)+)sd(MY3JSn5c3g%8v@$g%{kbUYAl*AcrbVqCHoSdcFcr_PzJ*R`g;<^emYGBO9
z;F*~7M{JEc0K@6;Z#vG-ifSA1HZ<b~c_)6KQr#gZ`l>^u(u2*6cBccuf1rHVZ^XJS
zWx>o0lCaUbdW7Kj*>~%&uE#wZQ&PQ-bIKp$k3L+E*9&muF$Nrwe9+|dMdxZs^!TDz
zoX%sN@|MrJ!S_*a?1HjOp6JkRCftAhlUyz~Uh|VTasdq%Sl392;a`#roBdbt)gjRu
zPni$Pj}vJE#%Z<>OGWi8u5xdt5D+G~+{`h2p(EnffXNSG>M8Lnz>LG_XQ;NR1cLxl
zvJ2GPMvq`FM$No(I}rrWn_4o`qW<tdhpQmS3P28$fJuTTYi^WRmBY9lhH%5MQKl)g
zk%s9VR5u&sOBFp#qKHfk8dU)G$aGAjDF(v)&I5TN7^^_0L*21#$;^1WNEJP-pUC7}
zdJoN|izt*>dr(z%>4I}CbytcY;&2GhGL>}&!Xb0|5+9GF&0d`^u}&nQwgJbt2?pB)
z*$AxnI8#X>%{4ggTaF|_0VR!~$T%d+<P-jVKsJ(SJIo0c7BHAd8&!dr&6O#x(}eO(
zG_aHm2`MWN!tXN3Ctx|2Pue)2xljNsO(pObgE0FhnmODq#34iCkjS@WW1q#dHiV*1
zpp=%WxX*-T4f8IKnNKA|FOea!Jow`AJidVjt)QqzF!U!taHvTCGa6?HSs{_3pE;!L
z2OuN@;dDG2LNT78aJf<x{1`@l3_dMyG#O{@FeK;$whA}p4+m>^6v*tjmlA1;;}l&j
zQ~f2dlonHD{E+#5X;385a|DZ!@*|XV3@eq#swU!b2#Lc^vMQc{+cCv$GmbBV>Kunm
z_{{J~pT21_bek#BB4#~B6>ESTgHSlP@#r3^aRoabV{Y7)<>>)gEe@$Co1kTv_$q)p
zJ%dV}SneiSs~8`P^a^7H$pmS}ZSYa8PgY}8w!G7eu#B-tro3KwFBicu*rr*mnxJyT
z;M+{)2(tQ_GQmMelH^I97L5J+&}igb`2a{d-}EMyNoW{RnnNn`K}^3TE7N71*UQeE
zfV2@zl_e9wj<<M`MN5Ux#zK%!zdm2!^wo4oHh#&J<+Rq!H}&3xVg}BOlf5oZT51pv
zY3C5sqb8Cn>r=41UvSZs)8^j8e@#_pij6B+c#->uBl0>>nd3V{ay!$<g@&J97T4OP
zak;+N4=2imzqj5VI$Z)WXd$&R!F*GuI?<2Sv?z+1a#Jd4m?f%Q2SpbO;j0*GERN;9
zD<4_v8}J+74U<ITDGELn#x+zf0nk+*n)xpH<}Ph&8gKHh$Qu2@(m;}1-$Qqqs$T9c
zGeNPI24C3~*GwL?T=1dn4pER0GSUnKk<&?J;MFfsRcj)$FGZGru?+I&_Z&jTlpONV
zxMn#R)8z_?V!mCPOUy+g<HDI?xEp+Cta3pqAB@=n^ATy@**tt?FF?{^vGLsC-QkgC
zTx~YoRB(x!Gx@d{J0C$^HpoBXB`=<1<*!;nQ%p^g{bJb`S3bRC`bQ<rx77d7-H+#D
zeHTNril5Y~N-|aR%}}WY*1K6MyF+{uETeU4<hLTi?^>m!GK6j4NzrQP0JxI?)G?!m
zEJ6&}f6>Z{()dAaF-d2KiLO~x<ck%;Q*#cey88;1vDKDSga0dCAqW&3V@><Y@L~gg
zjAus${K#B0M+oCb8?ELp#}6HRHj7(iKTx!Ia~Z1is$3!yUjsrWl9>w?ZC@lN&nyRW
zR;soX8Bc(CdY0l%*6O;BmW=W?@R^~_R^@_+__isJ?j9~l1heoSl}G7}lw?rd<7M#K
zGXZU8FJHyp=7V%}#u}zGMYhewJ3Q=`6vU9jO54jBeRAk=Q_USj(}so7H+ObO<SDg+
zSEx0>GTp~%y}Z7~g=+$3N(A-!@!W5Q0z)FprsfKePX#OZidthI-<{T4bvno2X`~I^
z$@7=E5qYWnm;d*Lp{6EN8CQaF@KCZ?o$)t$LLzm@KYQ}8>3<WYI$H+#%Q8<|#Sj{s
zVJtAOL`*iunzRrnKk&rr71tS8tgduIrb{76k3oH{`^ID<(Eq)_uBohFMKf}E{`cjR
z?7V5w3}#b?!PTq(F6W#pZ8urFyzB33a#+LZaAm-#$#`HU4ryi_0npi|32IS$7Ug^U
z%;pP+`^-)HRSAiA(QpTvDji@XK;^6%)Q<qvHG;jLDV*ULnr03&9@p9KOA}b8sRv6}
z=gssxfQz*dzdnc|-5&g1Vc1GJb9bma|7pfNt=$GFyG*-t^IOF>csKsrUFTw<=<<a#
zSFHwq;2ostjGsqVhu9kk@3R#N&a^jl|4#L18SvmqIGYJh#jG=n99g%|o5K7Ua&t|_
zP;b>;aBBb_2l;9+Mdor?=ji`ZmP`(rH07p~p~FM3n_AwO4+0k<Iq3w!Xb^z~)OR0j
z@S~I^%9JmeiaQfNPhGCdJyc{I<S9jvVb$;JYSlX?f$)m;hdeaSM26;$DIfRJ;^L)G
z^JX%Mco;&Y?Vyo!3NKSr*uE={G}GYu7AU5$QIJFsy|;mn4iP!$C-{Cuj{S&E;Zc<u
z<^SIB1rNzhsES76g#;W>egHN?%@Fh!xX_w<liY20MtzEc`o^?D|Fp3YIc_tDPjt82
zzHjZ(Y^@#y`Y?q420f}a%qBn|Gl%~z4Y74&V-N`-7z<b!zP)r_P-Mk6HPfotjU#}O
zW>aZ{-E!=hGqeHj@IsD$T~^&Qiw3@8><;PsWh=b=YA=#yrEuPO$HOx+%xZh+IQS$?
z(9Cn8&FcG5+{j_E)x^+?nF<GYN&a{90_@ls2?75GevdbO^gYn9;k|x?sd3^vf_w#<
zZ-HkMvch8`=#$FgoyP}VDAYD>7K9k&4~{IEUV1%v5s5-~11;4!WHZCXq4FdCKul_#
zV<LeYPk{z|drz5K-zy7DbVcXjAI&IG)w4*BSROn@bqY`>CUJ(7a;9!@La@#GNe!Np
za`dHX_fdr_)OAgyAEw^~h5$PSkez<VDwZ#*sV`zTX}a0oMa-cQzF33&=1Xu-euRlC
zfS|nBVZBY$`{w4rGPTz+Hx3^<Up=a^*qJyn*v83pM8zhz)f`p-h@bG~4lhy_@j$tD
z8b=?tnI$vK2^6Kw8o_)8`v~931F9EDUR$|ZCddCS8q&gJR^u~RU{p<d({)+rB=-X|
zOlG~~n=SlQ{jECCKpTr3vU!m|);D4ED#+uT*rr{N;@CfvJiA(B=haH2Ss=={Wf{x|
zoqu<nGBn>6k<o3>G8G`-x1KQJW|?CA0G6A93TvuA>rB2c(m2F*d_R?+|3*{T1BbQO
z_orVMgnU;UXkg6IX6usAUqTY12eD?>BQYF72|AH3J#jA}noNk%6u>ow64C{bQ#vNI
zS0N$Oc2(F6r657T6JUu9<?U|4o<Xc|DEa3w2uuK9N<D~w+VE2SIvDt%<s^Ik!&Ee=
zj@<)CT<FPG({r4fEnhG-rjyT9huJtpp0;TRbhhm}KM565zH?hIe-DiOJIo+Z8a=tB
zQ-K&8VDZuP69a$o1HEiQw0MYZlKw4u9$7jRS<-J>ycT)yXYW1kK4S}-7J{AU>X#|q
zEdTVk^zd)7rhcioe)*@~ic@{}b@b_1^{c}4i=Ff<wj!&}?bh7rE6MAtiR!yY+pToz
ztL?v8cTc}I>SoPe?+KAUt(W>`YWj8W_3PGd);I5#{k+-Czt`||w?09?W$iEet*JnS
z$o&xT39eH{A{w7u0bO9KaVnte90R%o#)kKEWKxY2PoQ?d!ioJ_EwrAnLyGY_xu+eh
znAqPHcB1QcRL_kQy+u*Im-f1DoOqbB_wdGEZ*^36b5#GMsDbBE-EU4XX#I>oC%W!M
z4IS=1FdcYkJ-{I_(AOT--G5@>M*qNz{*kB?quzTA`+?yT`y*dZJP9-y!wighpBPs&
zc>KQqasPhLQ1qkz6O-r2#_Ib|Q=%A84IYUbbhXp8WTVHuqo(c{Oy4tj`ZanOb8AfV
z!7~?wN#TD}{L#<z45qmMO`du%DKqd!<^hL-;p-cFFI)`Xwj1*Pa?T%vbR_^JYD{@z
z$@6c>`UcebwSO`-Lmv~!{54<+M2xcT5bNUue#Aq~oqr!c-kSe;>mw?Lb$ED-r<kIj
zPlmn3V{2%9FUiYF6#XFTa>{``>)%RX47NCiNA}^`?E}%Chno2ZE4O2oGh$ZyV^;eg
zehFinqz5Z^9)7?7a5cqft>5U|$A|h82P<!4zHvYLA$*%>`(X8I%-2r`>pu@x&KYmk
zo37nE*i3o&?S;{=z{BmWgN;i@zwbX<4tuoGZ?vKGNOQ+%=S7UN*`uvThkx0F&EQxV
z|8Y>Q(`j%S-?bvN^jt*~DNS<~bTaj`vKLd6w?rezb)7gE$BQv9RzUj<XW?9pPLE|@
z<hhnXjPG%Mk)*GCykw*fcB<q~q2}#}v5I%9IJgh;wXf|81UT0^)t>FVDR>xow((r=
z^<TS!L9VUdk8_Vl30-#Ybh}#@wkLGOqc?2jb!U|DRnG@ee}Dhl6AmUaX)s~!=>Mpv
zx9&Dw+ZPG-d3^T%t)ghrFyCiIdbGPjfgyg=_bv0ZZ;4$CcvbIKA2=t<21x_Io+Rjq
z-?;LjKXPwxPAnpLLI1ArGUIdcM={*Xl2(?@4?S+ZkAsc@WkUr^u@~~m<Ixcj8=npz
z{<tM&_`|e+ru)XB)WcU@ODk_MK_%Q0{6ZeTZ!zcemKU?r^}CCoHgj_KDA-_=0j+G1
zbR?`iWk-1cJ%l(umpN4R<qmonz0ij2a20Sqk}IYUWy<}FfHDj4p398bL(i9gn|r^8
zd%@Dfps`Q&#Gh;6XiL}OWv8y)<W1%he+3+lMHjD|OJ2RcC=K~p%v!MIzkUp;rDVz?
zz*J8f@Y_Dp_qfxbv02b~O#5^3oykTc8~*1T4JW|q!paIYocth?rKGBI1QT{i-vN}l
zas{&9>#6K8ICUx}TFIijxP>TcsrcExL}7uxQH)ovVJ0DZv|c6IJ{X$r6%#vuP2Xi}
zK=4g>0IO`$voRC`Gn+_iEK!)>5Pa+NbwKltuT#5SEwb2RvglOtGL~kd5*#Xuk8t=k
zEm0DZ{(MFCc<?#fZn-!5M`UjWi(bYa<&)+fSSSNyG$RC0i<?FeN)E5ys+fLDJ*j2y
zb}=r*r^~e5k`0ood@IM(RD{xozrWPG6#LC{{I$c;sJFtI$e!3=y|yJRY6^bx*|eqf
zbH{?uc$?^!JkQAj4LzxEXF|NGj`5Qaa-hPd1Xazm&>&W>i9h>7emPfB)oyKNL3QW6
zzSoU`1F@j05xZ2gp5j*eW3;mFk)=3gviBW?kJwFq?n(ON)2B4fppo~E)a_jndj5Db
zOX0a5IuilV?(~Qm;SpqAzuUs-Z&kVa%)jYPkf}u21ZDV6l?^W!Ux@Vk&)Uz<T=<~u
z4-j4Go4uH~via_?ZSrw<&p7_a<@fV%smfdD?dHOASS4InJ+Ir<9-@2bGZ9O*bHn!h
z4sUf|nda4Q?kGQyF~X16@Bbcoa@qJ^$AsH+be4wa##r%G!J^DPkBS&XiNY7Rdxr<@
z0nXQt^J3elT<{MSnpL44PxWe+ggHkmDOV%09?}uQc-;kQc}*54|0jgbPKND9AY67C
z$Nj?47xfmf0CyV~@b@?Zx#D_K&(GCVJeNk6cv%MY&Y~<D_#_Y@sYwlQOb{Qye8ozf
z+I?9`HrqpqjyYa#(Y`>@iS>B53KBAIcBC~DELfA7C;T`+Z}yB|ve3;DLs`?5mzBKf
zy!GYM9j>P&+yN&qZD#4@wj$Vt`k54gB`nO%!c;1oa?5P#P+Ih@h1uqGMtaVYtSHRV
z%9HO7&Dlqu7ba{6n#qof&D5k<LMzu9k|B_VBjse&nTLFCM%+N5@A)T1bB1z65YI3$
za0#SLC6At!sb()~gXZPWf5Gb;o9Pd{Zcxto)W`QhMdgI|Yiq^lslJJsk=EWdX)Z0p
zR>sF1I~%rXm`l?MMw5#$>@cBtBgaWF(9PaSyV*G5ZM?h|yFGhK7V=r0lV1v$9L1@2
zZwXj~FCZd32Gz?xxh>-*Z#oElmy;ALvNq=!ax91BlxyV>wvJXg<f^|E5lX9xkbmcp
zl`UYRa!rBfkv~xDiPO<V5ir^=QBXyTg7T$6WG4?pGZX<hVclz127Xhxn;p1hwGM#F
zn%h`TdbsH1)J4+o6)p?F7hd&ZoNh1>PB{vycfTtiJek$=#qn2z|A*D!!QI#5o_C!B
z(w^#8Ej+eSxUc$kXU%hG)#c*L;}O9lYhgE~9b4a_o83z4gV86R_LrYgob*$+#uSa5
zQ8+1P6_>0?c6dkfuM{Duq!`Ua<^}+OuyyohgPUZK#y3;b?M#{wnrSCAn4W&7u};Ic
zM^Uj+P<>u^#O1>=r00@}=wrQvV=)^k%hyds=@uY05ECde3lyHgDk+l*rolmryge2s
zoE4DdRc-I%t-*uZ^9-OU#3f}|B_ZTUz1ZR3(xIF`o%dt@Dov~$d!zDIorAbiPUQUb
znGu|Hk~fE!xF6uidu8@#ZDx_!-?pK_vnp5Cch?sD<7U%E=hw9<TO@%u(>XHeMyHq!
zxNOeZu9`C{PB9ByZaYHanfPJFeH<cafQss7amlh4pr@AaV@w-4opR@vj%<nWruSSp
zs|<u_PU!N~EoaKalFXbT_C5YpD;9TW79J|(^?pKgN*9lF>&bxl(p${*U$a2Qk8na)
zu@D>@2=`B=qO<7>$M)5ijhC@tiD0I<1ck^{Ul*<(AJOi^r7r2-5TD-}5p!mlI?$O@
zECnt%0);zR87$m7%AuUf^yTh3jMTDh1sqM)c%g3v7P`-f(+FSyk(mI2Rf|)qqb+Hd
zi@n8rMMku>N4YP)EEn%|Fz=}Tp3Bya=Zc!L)dN~rF6u;yYvF(}f$6nSS+D@z!d#EY
zbJb&Zibq|*At3x&;DtABuir2`{dT|q(E7@L{h8Y`4==yU0(p(v{^dZAPC>L+dlV;{
z;xRUkONs-Fg5K*~vW56dr<Q1o-3-&QR*l5;J@995hsZHajra>okxKt&{pHQxQ?KpF
zNaZC$uKb(MU{_cedXKjncSUzL)FQ73p9wQ;c26&nJ=**9R~Kd{7;fxSE=~)Es0l43
z;4`sYM_q@cvw`u(EHA#p7{IAx@*7-YUH`s^WQ+)flT%cB0BcmyF$Iqp_(g>w)byEA
zY_JAgt3jO813N5opbm2-gN1HqLU3Lx3C3)1FDBF6qfu2ZPK{IlT3T7Ka9N}=04(Ik
zijw?B2T5z;_zP!8wQO))o<Rs+TILY;;bhdu{*$6r>T#GS>S-Z9)X7kEygDakPiNhZ
zgQ##-uVNwLBzh3_j&V{F+M1|8(I4-^!_>5H$bYG0Kjd`e-z)o{2L+4^2U;iBb{mfe
z4-FWz+XkO`DKG9*FzIz-cFgWJ>CVD(o_#FaDy#FE#DoVdQJ+W@0zdaLF+P-<eZt>-
zFYpO8-wvhvaDPEa#8+u%VRS;V^fv*#kCVuxNbCYu_RCN;IG(05!yO=uHHHZwaGNEB
z-?R#xBPedF9p;lOR#9p!#NP?xc&NST6M#T588Sr|4hQfs2;$i|(J96&Vj1!YLEN1A
zW8M~_(Tq$iLwKmbJjlbv4r&89{wMhN10?bF32`U|dW^-xz;m(i;>bpXEKoR+GQCO^
z*az?ufe7<5xI6(h)f}H6jAU0{TyK1>+K`)D1`o!G9uRrWNpL(+WE2ZaSK-PgzS{{v
z?5{`|pm?9K1a<&I|12d(%U+BE_y#D#bu8hkGB!vjkc{Qx0}A+5e*e)Zfz1**Bm)t?
zjWF}F??l|ACxpwo%39i4Zy+|X%TRt>dw!kI;)aee$pCRT8;yZh{;lUCc%?-PZWJO@
zNi0*b1Hi}lE^On_RY+LE5`+ptpYx?T3Zx+<Bor~jJF&n;aNy`(6e1Jhs;Z?90Iql@
zMit1Fcm=jj5EyPStfTX=$7DT$sOXfKZ>Pe<P6CEBo}HyUo5Tt2qo^Hrl2rtxGC?$g
zB8+Epq(0-AVj*B<@!4fOZ>JE`>p!xy5lIBZ9VTjuC?B|~Hc1i2lF(ROUn~&ej8)KN
zAfXE=C`Dx17FDbvs&G|6mcU13qTZ#89I%wHTFBp}%3lsuJB(h`pK2`)E`$4xZ%Cjd
z7&tx`AZIA?a=@m<6THx8marC(FM@#79@Y5hB`&e?R;!FBx&rRZ0O?}6*109-Gvj4(
zJpWiKO#G`=MneO9VckOQPpG&GLyfelDjcT0MOC}Is7;y?@zTsd-q*RzFaMNOaRpxe
zV`0>8P3p$P<9shyFJ7rCB9tQ=E6m4nMjgi;dg2!eIs+6ZW2L*PC^B)(ED&i%QJldp
z*Wiq776dz3x6GSjQ`i0b7`hqk0xlIoMFmoCOQ4F-yN~DZ!U_j7pC{9iQ>>}fHpL`@
z;&XMrJfNan4kB*>wM|A((Gmad4DT*VuuaCp01E0D5V`#Hc@FCp%N8Y&Hr=xEYL)z*
zOnME)A&z&bwnNQ;&gx_@(Htr)M_sgzD9WHHi?>Pyli*LdMe69nPZo@mSQ?Q8ejCa$
z6(`{bOx_)Ovw#hfg%vI&L*y&r&OElZ?Gkp+xE)n~`&pno!x#dT^xXUZep7Q^;w)S;
zj2oYn9kf^MgDm1Y?7w!{Wmv0khTC5_CShx-_xUmJ_?A*KMLGre<sBVf1>oJs31<@F
zF(jyYlTe`vreh0Bm~z@Ha~7S!9HT5AD>LYn#-s;e?;hpb1;BeqLg7HsFGM6=!RQBp
z`v)nha5+hf>$+HzLp{8mnt(i980^&|;hzIVx`-dL0TSQve6c(N45oP?baq%t)JH%>
z9w?BD^Z5E>GnBxmU-m7i#*O5oHoz1(MnN;^HU$8oOgewh^Yd~9)b1H^`7&gepah;`
zZp|wcEWi`~vUJwQbB~&nGYAWY$upTK3rEB$62d(L?QAQ?V5od&cY$KLJm~zs(^jn=
z$Hc?X<_i+BK-fECO(=!iE*Hum^7PpI$dwHswonrRqEo~vv0TK0vt9j@*M8M%+S8zT
z=hfU_@r%FQ*1Wu`hrBAgN^^g!6$=IA9hbUjQ#%3dQVvy~k9B@3jd}eV<MBgjGz?no
z)FI8hdyIxrzN>ur+V58OnZRmfV?J5Zy>h6FnFN31`Q{l%ICff=#5*?=f)NgtaS7G=
zxi^L7t3JyKa0&kDCC*9UX1_=5&T`E&*r!AH4*=YmbXXO6Uta*0Nry9<VV*Y-t3<>;
z9ezMWV7E!f|JZ#VG|O2`PHzvT5TS*1Q&K%_o5=gH8Sa^9-c5wY)8WYg*c6>-32-AJ
z0A3@^w?yx-dip#R0Iee;rWlcBfA;#i;SW*VsW)z{(Qh4j&KIYoTTPQ>VI9^$tsZq(
zqjZ9A>!?!SB$xlb{qyL@V(jfdd8)fEZW)?EC%I8%*5@wiXf+X<rYlV+pLSeC*@&{}
zUJp2YE+l0&8*48TXRXWML7#xD!%(gVM5qGGL{xt^{;EiVbv@#nMf}<zGE^k-cm%?$
zC(<`U)lXWe0teau<3*cIx+jvHrXwktTrn5q^(f1c)Khx1hjQ5@slYV_n4WAok=zJQ
zA-UdiUg@mD$9765e~h3FmGh8U;BH?`ImNI6<l5|Ydyx8e6p#saWA{2BIsjef*N)B*
zvR+V>evq=B3AuUdrhXT0H^HiXpawTy`w&j#(|>!%STx7fE$5V8&Yj<F=1;O4+w_&O
zU<*8#IWYGWiO)(SH}GxlRna_>sQ6xcwp!%fIG4Z^g!}}z{3C2RRkVPg#1l@296B=u
zIBoyt*xxxXT2TMCusKp7UDNXwVWDGHzbzsg*pzqXtqOf4dC={ktG7t!q$0yD@P%&r
z^?;`xoKjc5t;qUHA(>p!WT6JCgabgyqm1L&5brTy_Ps@^sXHhtoKL6_r8_0@jtGxH
z#-K^?3B1(l6jTR;4{M%1U9c)Zigz7^vGDD&e{=}%>df55D~Btdk0u-NN|@VMy4<Wd
zzgyw0U(D@vaC)`MTECjvTJ=I%cO|i60V_n^_QyojMCMdx=+`*))#9G=q`s@X<8D!~
zTasr|Dt~&(`O;z`S*nYZKb@FSy?C#^JmUxrgA_ZO|3Yz;E+n8=Qil~j{DBktM?l(8
zFf2msg|hqnU+!1yKT_un{D7~A^|v(N_u@U*`YMPn(k~&g*ZTcUi};CFCGobP%NCXH
z?V?s~ihJ$A^!9e4l7-0R?S&c-hcHecbcyA!%vM;+j%MO`r~vvuf&iVx7aWKYBf*Br
z;`?Rj87yD%VAlv8l~^Rc%Yeu49b@$=jxsn_NYH}xnksB<DX7Kp9mxEBZJgMEsr$fK
zl-<+!16$mU1}7f;c}{+D?r=){p~joG0I|+WXzUB8ux)1Mnv>fu3H6(-_*(yHH~|7D
z2mss#-0{M6Iy$kRtBD{y&cxJ|p>NU^5fV&bA*UG~^#w3=cz+L9;Dt~w>)Quno)MPh
zRr!UcFn#A*9z{L8R6H6uH+ofKEX<?w=ljIvg;9~nTf=1?>+LSCl&<D-E-@x%MvRM&
z7r@V9oS9(wf@{8)h{+r#JNmKSKC>6seZ;iSQi9h+U3ed_Urko*E6W@!R3v)1ah@Cd
z<T3fRcyeuSvZ!$E9F%u?_O^vJw@0yEqN<V>u_p^iXUF4aIN1V_C>;-;eSv8jP=tQK
zAU?1&W22#kr*bkA|0sP$(vtKim_ib|kcwHNr++YTW9?6#`|yfgJ@5Tsaw|G+TnIMj
zevNU%DN0VP96!|z;!-6^IsoV+ctrA*p2#W8p)_t-u0)Y~YgW(Tg^uAd{eLft%3<+w
zDDyK?`5-={GDT;@?28_+pMIEoF8SfbzmDGByNoxF_7bED0Z{h{yS4@RJCc$I6KqE3
z1&Cn+tRd;QkPdVX2Nq`nflcm;?h`(uJl=InXf_x|SAG#HWFSUaQqh^RpUKZI7_@vW
zo_lqE=~U^G_570mhuei^(a-yCD+t2+O6*pzE5(#3`ou7*y(ELJ1zMste~_R*fXkKA
znA|4J%);WkT`8M|PcDW_w(~3Zq*m`sjXBO6mab|b3g%rDPM>^W`kREBhiW>|xu|pq
zy-0JjjAy2Ft$k7W<-v!s^Q)gce|#<dahOoJ`ogq3f_v&|IeVe@-6auoy^eYuf@z`)
z=zB{lM90d}Uaie<U@)69_Y&UTvK<dn*(A*CsV7g6pk(~kNV$lDzNVD#hD_Cl9OjqP
zg<tm$e!MVU$u|+{>R0wS^XS~N;1l7?%yRKMJaXyOF)H(z)derR+rLsi?qqy?b?(q0
z8XZ$uHg}~=d8uqG&n|ft0G*h_{PtAppnsCNFVIA0#9@}Q?(IMQxc}MX?{k`LD^tKG
zbY*C;^P_QcD!lgCx>Bl@{smHL`$J`Q$`|0^JqEi`U(6u!{|8Am%7>HqRa_Mk{s$!8
z|35&|CwG<4^+o>=NLtrnp;2v@*jsq5zB7!ji?!Y4Fih6+9}K`}u1DVG7suS%j9J+N
z+tU?QtTxJ=;MxuU0ZH9ElC&G&b^aG5)oGgRRSwC0P~;#bYrmPP4+04`vzYs6AaGIP
zl798Al?|N25&wRr4$gBAQ}x1z+rv*p9U$~OmZvMMKX%aF)D2s_zEs9E-jS*p!oQPv
zrn4-yR1sCqJm4|tIXzjGB5s^+(7XA$<U71NUvV9O6CZxW(D`rg@7Q(D<A%u=>BU#7
zmSIJp@FNeue|z7Lu_*4{|GT~R{*l_dzftkiJnr^|Jd%44E+H}Xa=&1wtF{kuEHct4
z!Yz8o)`Ao#<e5m)+lA#>Y9uCpI(6Yo^f9O`TM-q;6fE6&tk}8ERz#oSL67kx#4WGX
zgK(OKJeU4URIJH?FC6XEpyQKmB_&6Sw=;sVLDH&DQZRnqF-|CY31rWoO9Y!4{jnh>
z>vqnukAu>dKoH|~E$}ejzv*q2o-Ned%E$UgZ;6pRcJvaRs`_#%C;r`~Q((5_n}tgj
zo6dsp7yu^C(OLjzS>e2kT(Bu)XiTMf!0Ry<6jzXPIdl<+=BwY}uf`X&tY*}gre;~I
z;Fq_iPFz61gN$Y+Udf?XfGG|1xGPVTL(KsIGLKXwPz5RpI|Psc*Zn$RT_7#)rqGgu
z_*moUe9bzE-km%4`EARJfkfK@v3lcwe>IzBB9;c59Z~0}?b@QR-w$vgf;1W!@FTrJ
zJ;;RLK^-r=0##1Uf-?QhMeuvyhomyJRf9g4o;WI-zC`0fZ|8%}G!Kd+eh#R;5pR$5
zF7~s_M71uyAAEET48v6IY*`JiBX~Nd4(4PgMAjMn6$S;-%l0bI5MGm5n9?@f@z!6&
z?--ujHrgJ%*6*`~1ui^o)e@nEg^XQ%uHrJ@oR<1SY0-vargA3n({mMDo9Wn>n=>ak
zoR9B;9}75jEL@#MZqm$D7onf*Uw{Z+@Xxv4o++XhiHCVeWB2^i2)=z{5*J@${*%lb
zI@Wgm*S%k)_1j*uN8m@qM^re>BZo_(HiF(Zie7%A_B?uP()dEN>F-&m6Ta@_j?eJ!
z0{1f}-ds{cGr=UyVU=EI+$*(ag!H60V&erTy2Zu*c0jjy#%=5V>IYpTZ$VRlR11Ln
z+b8#cm#701_^T8|tf!ePC25yO9@AVy6}8Jr(RewC0+rD@>|gR|BFse2uv}DULR8(x
z%kjvvF#)o=7VJr|`kxbY9?Lf4^qR&SL7!aJDneR8^TCPL1q*gxcsXRUKTEl-oZ{y@
z8;3)rBpn1Vwk%D@VjVePZdqf7r+ZBP9Ip^h2std^dk)PN;|oa>f4pFRefdNhM8iEm
z956PUIF==gPJ@=kP3|P-g!{1<?PB9fqgXV7?{sQ3w)knNMjYX~Ok5{%!Su>>P6HtH
zj)0@L)SG4VG)C5CG~+BtjLnJ4;uG%$eK!9+{@9gTN$H68H1oaB;rTc;FSajH>2^Vu
zgRf7{!F>j}Ev`|Z;q(<okeu?3$8gUt6}c}xO3jvn<@^I)U`vC14`P#ey$+B7ffmy_
zuU4C@eVYYs-=1mTkWN4J`yzFQ4YSVwoxD=l9>G#h(EV&-*Fy*dezy2(v^75I%IS^T
zLFDLV0w5E|bMkf#6h7?!eV$580ez+ex(=}y9a5S!%8I`w1j_eSdufeGDBQhx@}yN)
zq9FjHRjGJ?KdF)PWlk0Iy`LTf=$slWP^Ba5Z=LZ@${tV#-!!Y^yI}P);bbZqGBJy+
zg*O6r!(~j<>VRo|kFQG%)><x_ULH?2uemAc@tlu*?jsxki{&r4dTkB-gaiN($uiu*
zYwnk!uWhA(mVVbV?*Y!tiq`#VPQCnX2*f>Zx~<#_rgE8OoP4{g^18M7`?nly(c7uT
zI7R&O=+)#9`{}}wywb~!frgy!_yfnzZ!3ipr(dKU9cS`)NIvzwz&*!$a-_>|*i0+x
zz0^;S_2ce4yrBt0?h95o`h=x_h(6jltp9o?0ppwbaYkAvU&CKV`B7z4<a2A`wbBiA
zyQEt1@-&38?-fYPf}d$|?BIP!t^5&Z5joAx0@R;;@K0r31Qn(~p&XCe?1?k(*=)No
z2lnLrQAt)yUD&6`x7}$B4%o$IJo3>z{zt?N!Eu_KD{6L7^h#^Wf(cPBW<g2mb*j<P
zh<tg5JjQ*>P1A0AUQBrDk(z2-)(Jju854)`W?u6fFS5k+2B@^eo`gcb5uYpOf5tt2
zgz_q;WLzc6^Yo3k;aiv=->iQc_BDcLJwRMS9O-40PXPp+r@ypny)r)WRx|XY#8>?N
z8<UzrV<8;;D1jwW#lfTFzXdk^5)QQru~|}TbdEIt6+ZX)9bM{0UtBze6^Z?cA1%j7
z8&P-MUZE|2;m_K>x4v}qb<>9q#LCn{+jbf6+UzNuyE^(xMH#BvXbao%1r@SiE*i5l
zGE?}wBc_68Uf3b_x<mW2h2M;XR{8Il*IckL^=JMLPrKy*QPR9oYvy`Z4GsQ0SI6GD
zQ`eF>Nsp!ByoopqLo8G$@z!b-c0s5cKWG>;9jpBk1Y3cASYFCZk0N>_s*bw|y8qEn
za`M3P+5Z{nd79vxUnYt?QZlNf8cY?BwhPkdb^j>&Ge7Fu{Py0c>ccFviR}}!fD79x
zkii7^{c^bZ0!{h4vpS`t>~JyK0kb#P9Zn^JVO5t$1t6!n@_OA@1P^<A12pQ->Iv7X
z=k>l-u?pKI4RXEhOjR-qhTZOv=P{&@)*3p>j9y$6Zixzqa`RmaD=>}AMGP3vOhY6K
zK)fK)zv*TcnT$`j!U|mHo_0t7p17y;J>XJ}@8CkR7k6CkwsTi)3@KRP;xwiYVIabt
zv3b;@TEu&5?1*&TO_k8|*hTEWkIMG1+X7>DCg)oG{FQgvrDHG)T|>vwmQHhRX6ohO
zWY$GT%bIhTI~~07MvDnhGl==_%kGE9xgVpWB%4|Wk38Hv6|lc#>VqM8S{P(zCus#b
zVfvQ(pPp&7?q0wE{SMLlZ_a)H69bFD7Ykc2F?cL-oN_E6e1Qz%MTrHUK7k8;?`$i%
zOpzRq$*(5M?6@GtE#uU=tTa&k`Dg`Kw5W&x4J+BdO*!sI>k5yQt)Zn|q>{IhVOY+!
z7UTgL6^2H70XWt+uCnQ-J$3HBV3>nCHwXtmOXMi~ic(s>dW#Xew@xGI#<pj2`s2}g
zEfB&oiv2<EG>-NTy|S5i5!yowgPz-PA$pNP3TOx+Gfr#@^tTJSgaw7sxy2k}rHCBY
zx=_zqz;QBS2#a=CKvOLe;}a8ZjwdXsbBn2?+sUAIbuNZBS7J>f&jz;uXM%|~NQj6C
zUp`Fcx`+@`2Oa-H&8h)jzX3bx#{nWGhA|QjSilWDQY@1bC6c7Pj0$T>IUpt;IHZ7D
zQS9Az2lR~tENG6E0^&_YQn-%hCYy|cg<9av7U|DA;6e;=M?Q7T0&R$eo6V-AVbRj-
z$b%N7KMPov8#lh3zTPACd>J*Zi`HettI)Z_uo<siGk9<)CqUpwUC)JO&d(NEjZ2(D
z0O)afxHUR+&jRh8h$7H|8|2Kb9pn-{R;&dj#V&PJ%>L7zB`KOYvy4h3a{OcPNKK*S
zYBNzdZZAldU_ARuAcFomL9$>WGW@tUN`(xPX8Xqq=r;}^v0#`2{*cE2cDIfUvV#S0
z(Sg$VcxV5+t_5*yqEu56w5f~IVgb(<q{0evQPZ6Id^wz7kV0tCsmFOIFD6K7qkg%Z
zRH{X*`=S5g^C7(Xu-5z&B%~9-^Tvwjf@{t#|ALXQtn=6cQ!jW@Yr#J`o||uz^DGN5
zdh^b#7np!<)vkD+$LCbSicoiQ3Lh7uW_aA!Z+BXri}VNbixxeqRZJ%G{-773K(N{~
z#T|l$I69QEQtTL-E<`STtcTro;MhG?QosQfS}1zHQX&|dWmQmuY@>Wqbbs#;Jf@!h
z@p0)k31O*N`b7_WOyORcVByWjkhQm^d;Sum42TepJ*#zyy`n(R`HWmnx|iGn=YB%x
zS*4@kWxPkr_^rwW1ImPx%S7wS#GjN&u9jio<+!8eGFIhs0p&-;%9H8PD`*hFs)(Zx
zQw_b(`Ho`&O8>tHNrf~(=ke^LK-dq7m7K}&<4?dB;8mpmf~3R%-s9x|0ZES&c`yDK
zB)xdE>T*DJ;BHkI8zenib?s*L?ZWElqctI`)wgd}Q}k<+0;+_FHSx(c$?#f(OrTIE
zP;IIvC;%ih4a|bq-f^$Z>#HgV02UpsIX}fgRxdfHkLCG$m{}L#E3|-E#n!i5)pxqr
zw@%SaeSvI{^g&_$dTafIqYdr5^+FmAV|7SFX#M!R`kvi9+5)mk6x8~pp>4HcB~f&`
zF7Ks#<D1pG?5#T=kKV4=ZG2@_KffzB8qn0aTMsI0TC-|+o-F(n-u(I<ZRttlm*l3x
zvc}I(8ukhsX9}B#;4O=N>emVcywL?#CMe5GEqT+;;HU<UB2ghA*RML{m7~qnjiz6_
z^*ip(0#U-e{Y}!`t)P?!dG1Dq6RlTwTS!~^+$VU`S^BejvfEfLcQO>R(?%t<9j>-L
z3b`lT-y~L4Cm0Ac<8Bsv+N}J(ks#jkez#*;M8f#}VS~e-*x9G`N8h*8W(rQ>5T&9D
z=~&0}QEjK+w>gVTm<BePbBhO^>!>aebGL4B74JN7?+!TEX%|(0y{I!fswpP0>v3D*
z2_S4TS8q=ay_?D1tbYB+g4O{Z#Xj||ns8zJc#kEa`&NB-U|{RSYM04g?<=vsFz%jn
zN<EiSx@+F|Mx}I7-uFFf?e!??rGyss>hWI2BEK+Dd{sx**)1UC;-3V)10r%3fVxLC
zM{<%n>jjDen_Iahf|VL7mHI5X`$CoatGWAU`yMnu?VYcebhqxe<$m~iZ6GSN_yh&&
zjTTWfM`t>OfKPK=R#)zv;_P$w3d((WN~6E_#NmVcPwQWcGiFaTK=!*??;kwhcr>FV
zVVv^t%UUz<+#^e`k}vD=dK=!iec;cq`FpK5z)Ww92a}KR5b&*+)1w~h!LSOfS1xAM
zi$7Rg>#MhBR`oaP6pQlK56K~L(p<2{ckwRQV?L;J$Q_eyUWdgHkvh^BC6<OPfJ_Bt
ziI+<C>T`qOh6kUXb{l?cS6&-A@vRVGHT1o#(MMtg9){{%H_@&axt=8aMg7tL$KIVs
zL;d)T-+#|OwwWP2F&O(cmSi_$7cwY&jC~0WT2y3=eMyKyXi$<Qlr=K;eN9rSkfc%}
zOIh#vUZ3mwUe|r!=iKM~&hOm+{r-LbF@L=OnRDK+*X#K>vBqjx*vr|`b!ty|Dy>I$
zrBmQ}&pVYKlv~#*rgzD*pQhXE8`Ve4M$Pz`z70b!5e9OD2X5)YBk_ILgL}QJ`rdXl
zM7#BX6$U@*JWgt@J3e^WzsvdfsSNJ%@Bo`VdsY-TZ2*mP!?cgXpAQeU%?>H6!%5Sa
zuY}=FcFt|m@I~PvNLcTqR?%%1y4mjVUDrWISnu87k+fEvqc(1~b@=TmP53<WG)d`%
ziYKKNvrUnVTIDBpjh6eOLh!JMzNln8%nyt1VT>|6s2}$*HLbXDg%JpNBzAc4ExQ=-
zV~p(#@BE7B=R)qmy&%jFw4m{@w4LEL9-b$GD1x95&E(kMV?I>jO0>pN;^XgUVbyzs
z;y)(Q6JnxV;;~(bjMZaiYDlATKHUWgVY7+f#uEwh&6q8=W2&(4b{Mh!NlL)v3ByTC
zj#spBN$0vl$sRgvB$Fk1Dl-#*VVx|^)JVbGLSA|pZ!$~!T=0$pW{GOvPPTzoOxY^F
zj<9}BTbC_SmAjTHVogSs&*>*b$T!!?TmF8TPn-s;z>~?WMmO0=dwKIl<_27^FId0H
z4SBN?d%TQRgLdGs>9}H!@!FkKj@O$ewjKLQmvdCZ>|qg?&D8g!-qb3-dm1f}U-Y^+
z4Z2Sd|2v0Z#zd{-)QI6TIKQ{hj@KSZ;&*Oh!76VgqlU<9P0xI(V=C{Fw(pOKO&lpf
z_v{_Rh@pFipE5j$n%H^!t%l$1tM(LjJiGpec3f_I9Bz$=60%UX=UL}xHE(!xf769k
zhaAojt%XLVH2v`KZGzUOJR+Opoxbj9!cn1DVz~Fz4_;wxUe7V=V4>yod6wFF4wb;S
zaib?ZFRbjb>@Y@GhUMGoFc)gm2nk`&kh?a5c-eRqWsTvuCU6T6UvXpq(KUK(-Nc@O
zXz37_|G-Y~M1)YySBh}kcvsyabd%1s5e0oZ1M`;>I_Y<GkMy~`W=>ys)=Xu-CKkc8
z!+CyUcCepstIR-3mRQ%8P_-8<?RiJArr#7$-Ra`ygaP_vv^kYyj~*lD`04%QAk<0T
zTiBx`nBlMEd>L~{<{0~c!Wxx{-dGh49$DPaMYkz%wzLkZIdyi8yhNyqOLiWjcQRu#
z@QW*O3DwE@>S~D@fF)It_joUYc}LLS?9o)slu6Mc6t-0gwtWs!N8qU^vp&JHr%UrP
zgSsJ^{CgDEYh=^)RhB4#<?lFJ-D~Lp_>r;7wnq=iWCE`P-%!2co58F>C^UiEG5hm}
z|B~3hdc5O5G6DVB=@92I^qf@axI^d%zu<m9R6U8~8lxTU`Q^#<QvRoWX0Z3yix2S`
zd@3B`(P3=IqF<J0zSMayf#6!YRI&`2V7GVxixxw>t!cwczTQFo9=kB(Q6$ayDM=QW
zBH-cec$i(8l;XCO`tRQ%lkC>3tc@g?SC;g`I6J8vmS==Eryrs%KW@mpgnDBU+c`uQ
z4=JWS8%c+KKg#WVW-3Jm8HEokzyD)tE_&I|E4=Qv)Jr9A3R`5&Du?IvNR8e){dYZK
z`#sfqAy(@vuhEk^ZKFA)quC!}zSg+aFh9({CTEyS;rfrmx5wGd$KhXMn^6<1!u|^F
znR=NR{wE}f<Z-CE9)>rD&;GGwGx?R%<5&CdU#W{uC+qV{Dq}`SumHtSjP+-94;i|)
zu5xa#^ukQ+WBDDD+=J}jRC_iBL-}e|wMXI?Lja!5{S|AH2zZSx*@yKQjq+X@<ExJe
znL{*_Sz3m8*!vLFGVU6%CQmh*u*%X*LKuBQx?~=*ftqH3`7u!g?84sr@Eo-H@t8U+
zOFX}=7xT&#I=wFOgx>BL1qDy=P2|YNKEdQaT0o~TvN&tSJZFMa8QLRz7tTu5au~(b
z>+XEAw_MVr_ehBp&8$3Vze+GYSWl{$HZcar9CK!!lCrBl(~OGk`!fB=@ml%LS+CKl
zF{yRk>jS6Ra4&P+e|$&?_{w9PFY&zN(Ic*6gUeBw<hX!PcK6=vM-38%o!5N^a}_;$
z3!Q)ajTY&}z>f-kZDVAtE*ciuoK%Wo{hgJO7pUxV1rkfhQLJIn!!3oDFV2pPVJZ$P
zk#`n$msS@d8+KlTSvHl!MEuuP^4_?evCmjO1TjY}wFaIclXbYS=X8eR8`0WV+^o|W
zULlLl8;GwZ2H3yG<<djKH<~QR?w&8e4~p7XuJ^IuX;CqfF4ld6&bBJ(FrpLVW36P9
z3s^1auBx0eH(jx%{;AM<t`JH6VX;Toq4gDsH`+Fch9WOXLp=sF#z)MRUxd>tQZm=`
zSxOtZT-nW~@5Za1kbQ8k?u7i4Zq=dcYq)dl*QUNBvg20)nuyZ=z;%sxlsh4f8bMhP
zSm)G-e)5Q)6EH-@e#3EPwe3Yf^*1Yje`#64zw}Q&&jbMU73qW0MR%YJ5^cBkEY44u
z@^IOX_wIZh5jAjc9uo~KuP~*{v9H?@4*?HOlH>-o<w5G3Jy}2YXnhc^Yj>yP6uoGx
zYN6Prr-NjK68)Vy-3&Ff5RI<Ho85Kj<G;}}?iQb=U@&D=de;U%(1*q@a`sx{zh1F3
zk1Y_h!y5PmF1ub{PIFXI-2U9?5pxLBB*!8~s~*bA6?&y=tZVV4xH#ykjl2)O<E5PP
zRTiEi<(_{|&9ai;DD5%9di7Ig<F|4aMe*SW*X5W))A8>)LkdT*z5P)AoM#nYl^W0Z
zyV5(jjlEdOA-!)nqi2nfs=9XqK8alCda;=+Rf)|CD1!)R-Y?y4h9PUOzIwoc#jM?&
zlr5O4<iK4sgtFk^YYz&vbAC`{4-<Mt*g3TxeS;&_hUr4$`o+8Hu5~|E&LuybeCU;I
z|8`J$J|Q2xK*qk`e2`!3&xQCV#hzWpqBY#_;6ZcrZ@a+!SJJ!qMq=TMWpZ$%RdHtc
z#8b6WY-jl=v~(p$sY9&pwaDZh3;oil;%)y-u<Z9Q+q;zZ{Yygy{&L-A_j;-Xw9-Gj
zW3Qy18xbbEs!eOj{c`re{(@B&ov^f0;obc_pCVd(HLwk#QJ}5^X2wbp#$+(h9|6Vw
z64U^T_4Q{I8CYpNIwYWLPszR#)&h+SnX&Q4u5|=opr~H#B!}^PXP|jU<NpgJHMI~i
zVjIy5*y=n_Kd1Kg@R27bLDN{AcOu!$*o!N-$yiEbBE=@&i~GK&iJZeks$;hoZ++9h
zLDC*gQ`K7&>Hfyvg0GrPH5&d8NE&$Jbc@}shN=6?34vC=+V%z0Q{~5d0#9COu`k}5
zdSCzxA|+^_D&>7uVP+C!m)mlxT;tV4n}ncK_q9(~I=rfM><MzHZ#i9k@zo;_*jc9@
zZHKyBud4h_&bqv6acF3G_4r)ES+~#HjxE!#sxS4Nb>D1pe6jWFNenEQ4AXJy<ejcb
zG70wLdG6G!F<pBjA=pP!$9d3Uy6$#Qu-~!g&Z8HnpWcOq1eoZ!Ox~J)_P``0==5`!
z>4xe0CkY|JzK1%lZ>Ogl8hb)QFFbesur=M-4hy9u=(sKLzHaI>2@TJE?zW`yx_K-i
z^!$CDGv6Fux4iBNy;%SJ%+HIjpMQj%i|o;HU%&Ob^^3{5E3clrZ#BGb`;~Am>a&i=
z&h+aS+db#5Z9exn*m~W52%}J8x@0il3<F_Gq4Bhm;m2n>(210INnKA?$C*yPUP|Jz
zR!`KWnJ!UySh9((7uW5XZfVp1UqMpB{|-o+5kvs~*HBR*e!inZg8xgdsH#%}(-n1f
zb@g>~&~?wz^ti~RMGd@Dn6zlHw_Crrh>1^uo?pO#pSVRpArly7>Y|n*i6J2&Ok;H9
z9Nv<0=^tS9ba*k77Cmv^;q-+Rn~Q$`HbyNkS)I9bKO&O)pUh~K;hCt&e>0;_F%JJo
zqu#OUr)bAs(kva~w9dr2--x^77H{L4VCbE2;osya6B`Xns-h(S%NzAcIdeYcNp?!y
zbc(~T6l2dc6KeX+g7mnc>;7TalV&npe`Q$v-Z&AI=`xe)5twx{D!Ym4jYi!p`!8?Q
zE<LA+Nsflyc1*n8_zyOEKHv3HKAGu_GO^K^J8@}u9x}br!ootPH+ro&@cn;~qfBgc
z?ry|2x_@bD*}t*T#PYD*^6u1%3;$rFOlCCW(dEiVkD1bFZdKNQFr(3>)jj`6qs29M
z|6xWq>f--xjNW~g&16RZ!x+7}*^pM<IPkeKk137*!;CVG(Jw89|LCF*+Y0L1Uj9Ri
zG8l|4#+{aq@qYuOPr6EKd&>UNMgO5inXYKpz|{M})_-(SCMw!CQa3-sV7j6`qpeI=
z^dD4oc;ekZuITW~?uq|GMTe$7{TmhSpMLQVD*8V~(Kqj=#%KHfLlhmFdcQLJewK-f
z{%?w+-&Vi;A5`?FyvJy3^Y1U?WtMkOwzX`2pLu%r<7nIS?O$_UX@{aVFIxZpUViz=
zW9&uS?)LLnoBtCPU3~aosA%4QqM~R20~H<o2Nlia{hz34Bn|y9RFqq4CzFO&{C}gO
z>`YX&3~m44sOS<C71ipV^I=mg{5L8pHNS{aDXjU7aS5n3Mg2cf(F7(civ0%_ZLmg>
zwpcphID!B+2Nw(&-i_|<7-uH*jX93-hZv3Mi%%F?m%*D~4#|GY!HwOQ4UtGw%n99)
zEf<P4;?U=LI2cr16MDF0#NLL)Jt#d0en~@f{eaAANDM&827Em=AQka}x(*DyM~seU
zq)rXMU2w)W!bQRNQ2C%lTRGF04nq?dp?<CjS;US}b#raQ)qHe4>*7f^jjaX4C+!*W
zHe6p_d=%=$WQP=pZ2-Tiuw5_Su8C#f@_;EvIVP!4NTHOoOL#NOSQYc84)o+8V7T@<
z&c;vL^hGEpg!rJ_7I_am?`<hM!)3`K*{xugtX)L{+enAG8GhBz(Y4x;{iMKU)_TAw
zd#2b;s#_=Y)|INuLk6rOq`P;@M#ax=bUZUqY_}o}<yh&g5)u^TNy^gCsA&D1!a8fQ
zXs3vVA^h&)Q}nnUn-7QN+SaU0?*O&U{J{YK9q4qk9qq@X4N_;SLKrZMmdrV?M@mEQ
z9x-D*`=?8*ylpP({G=s%<C1Xf?vYUCXa%Kl*&NbKvxY1irE!fMoY7UWyg|bh?VptD
zsO3+9VuQhYPA!owXT>|}!FXe<`LjpzdKU-gzF%OG|B0U(5FgjgS)T$+ip|M_|6<Af
z2MXeI8jA-kbKK)-=04=kJ79WFOcJz~f$ilYeccml4<#y7h31NOnVT6gR(QhMBgu6d
zm^j1qVbM=mQmaxE=+C^jIiSiXsZm4t`^NC%lxh+6B=v?qIWt%-m|GKiDmf3de3}nT
z;yToht&|OBVrzjDvIqVZfai~Ru<Gk)P-C!zB;|@G`#1{<Q31qKMZU>7s=}dQ462`Z
z8k4Cz4eJDhWn8V;v5TE%X3r_|aD*<hx!jB;sp<(<M1rV#U_^^{>OvTi`eII!3;^3s
zuf<f5rbAQgK?q&cDm_kn)=}HP9xGr!Tt-OeiSs9g3nf`Ciu-CpFVA=(_1G7&p!yps
zw=($^2k8VsZaOzbA%5ya;;zda+L<d{G~_ICR3j5C&_IDG`^<3XXk{4M8Xa9sg=kKJ
zu(bm>oONai{29`j*Qz`@ijO2~lbT|2HG|$Gvxy~JSp(K}<Dvs@ergW_4%0&R9y;^}
z5v7AWMkKZt?%?Cgj~xh@I*)tnYv`7Kb*WL)+Vm9N+VwG*F)tU}=yVn$ndxac_hpav
zB!g7J#KGejcd)r9$6pCzuz8#P4n(wW*$6DutP!r4p0bOXmdtm05x924jrX@%THWbn
zN!u=`=#9R+#d$A_uCNn~FfRRnA_oIIrV?AYlYdsrpvfA8w|42WU#=ybiX{gn_$G_0
zd&*RITdyXdx;)kPZEHAIBnqW<%ngET6Tu=Cq6t?L_fMFe;uop+3gzj4M(8#5Ui)cq
z^~d**`cjy1&+FF@fWEtbzD%FYDIsnA=Jy>+Km#4YmDi6|TKMnYf**pDp<Le*YEM#)
zW9aGxz%|(l0iHa<zYQHDnXv-LI!u-D=}u(`D(zeQ*Bv8np}D(zr6<aRo2PhtE6I_$
zLvGA10WO)v(_uFrIW^YSVY4B5x+N@DEIiCI@Ufq23Tz%>tnpS8>0&2tl4M##=RD<w
z`SJ6dqlx`x=(CZz`%2BHi$op;PWLDs{;|ZQH>1z?raIEzv(oSOjMKouG8-;Aad!Jj
zaXzV!f^=M~cQaIJgtpL&fkRARG$rq#$*bA;co&1$rwN>|GGXr94jFmf3=w<HcK^F$
ziPvPS=Ay^D#F`s_{mu$)WF^%uOHcV~ziA!7&T1-w=wUMXhg|pU9C&Q2EVp~8r+@!|
z;cK@RyuvRI>@rC8Qy{SDxVH=9Z6C99p76KR=wU>zy=aJR3D2#tBwvMO?V8)ifX$k$
z{9<J_SZDXUA5P=$@*5>Kd-K?HSofS;o&pa{47g(&+;*`?+VuH|Q9G}_wdl3YthtJ0
zuCgiTpS5*ksu^Ngz*$EQlH2=^#~e`wVzLq)VKz0_ryE|5?mPL2CB~z7=jGDvi>q_9
z_C*hDAyg38{YP3d_j%*5LZtb((axR~`uzhRJ}mJec4KcCW?^GnR=#h9K1Y+4*a)et
znoYZJX`gRp@WU;!WeI|aoX#giMW-(PbQle~#rYC;xTb-*bom`v|F-L0zwHd!(6E*U
z<(@;X{(cVMaQ^9*SKkZpFRq^*6EkKi%GO}r8U6|Q`iZ4`XBwt@N;Ax8aoym~TwSFJ
z?WBz|!j&#b2O*y2{rU>NrHpmAHtYA6tgogPv`yFvHSq1zm{_wtdp7Fnt(D@VcNM|0
zykw~@Ur#xKAz19w&cW2rUiJ2jdo$ebr~inNE04s0iTs+~ma&MuYdIB-oXRMy*CgaV
zHaQ5X_CxzS7w$1goG7f@x5VN0KAUnoc<K1B-*@iFe*tUh0c9t?-|-%at_yfaog#9C
z9;-;#aTHjG*(HO6h=%9-N}9??_p1Y{U|Rf!hu@X{Sj4z_6`XMCVpB1^ajqx$vk+&G
zV5y*2f^GpeLMK^wQXp#kW&yM56zF%#;;$p-hd*XJDQ49lbJ5TSmPO?eL$l3bJC-mQ
z8BRWaX4?z3cO0`i9{Zk;=FW*oFvMD5(K(q=PdsXlM1!b8SIUn3($KS0_16Je*)a*1
z^OwYD;%Y&5kZh>l6pJSw=1GFL(NSRl5df>|Pq64?j@x76j*Fr9#CaMp$6qhSxh)H}
z^I%=(PzfejBdTfWc~{fvgrKHG>$QYo9J;{-izTyhAGsRXpBR~!WW))V9Z!m01{-c-
zqbaQK{M;^8Bqir16F8Gmldh@%LPe9g)19yx{Qp8l^~KQLHUC0IyBT(Q|AC6$b4o3b
zOs&XEt!zrInn|txlUk$6{|%t=O`s3>I1d`pElp{(3u)h;rnT^=b()J+(GBc@Q~?zz
z!4K12lYp?rfB)hSsiU4W<ecEevT3HjT^8A=$UGn$<tB3~&@j@sFyoq-Z{sY%QY1HT
z%qvaKuT2?6;~DRqZu}|<P#kC5rLZc;TP7TX0`^Qi#dVql$7VvWsKF3mwBjoM6OuWI
z2d6fk-o|CNZfY>4QRbxn$GwOLx#!Bx`@4l-;7u{!9S3`2yb%*w)Z0*LI;w6QOp_LS
zhcy`Yy7B0+7KQLc?O-w5DK{m>&bzDzte!&3GR%Kn#7o{gHFf0p!8p#{JA~cXDggj5
zbJ>X;fiz_1jDiiq;@l%nV-y07!{+pPk3baX^p(4FC39476O^L6vc4`T=u=N7G#K9h
zlzkhJBsdGG&9Q<z*cIk5?Bhu21d<g131Be^0~lc}@*in5J3n=79HCf>7x7k+Kc6o&
zr@DZ%iN1%b0_V<78GV{T=e-oq<TBEL7I?0PMn5wYlEobTDnGm+&w7*ab-f_ulcLIo
z=*LfJg|7+>JG^}jviFsXN)2*7PA-~7K!E`QPe9_{V3tT2b|4RuRm7eJ%9Q0K9pWJv
zmEs38QLPdN8#Vd(9Ci*ajpx7FGZRkOSXk-A7j&PO=a?*bwO$-uqvM^U80>JTJ3m0d
zIlS6Wfhmn1H0!*u(;ieU>}dv(H$*K~??yAMRj4Ik{-TU|RyY=e0`iu|A>#P_0{}KW
z4iT7Rr49U-G@4nYELaA%EtO_UqjPX^1~Bi8xsnM|$Sk5UiWZwuYFO|R`Cj!LoSC{m
zpxgsz-Lrgq@BR#0mH>{7GZA?S4mSf|n?{sUz;Cj_WLC+2`YjIH-4hqUQ*-*l_Tg=F
zDn3Ew2N;<mvI2B4dmW;|^%=JTfIIvi_`YR%Q7Xe3ggJ6JDA$<{Z6jzCZ{08&_Y#p4
zfX}ghz?AOH0ea&|v2SP;10dl+v>H@CzBE<<1Ykg%WK>0E<-z#FyMmQR@Sy7$5K$X*
zos_3A2Qc?cLa`Wtjuxf^tQgP{Ocgr=q(=ujw5twCRec3jLoTUpc%llRz|hcJszY<%
zgyu}LWyLGBtxEHQExOOMCM@W`p@}K-R_A!JDVE+!FHo{XV8!`-IvNZg0M&-~((Zmm
zr^(%lXa+qoWQh^CIA8`-v%xFj4>LPJYMHR9udHC^5_wHgX#wnD9BKCr&B-Ww$_l_#
z>cFwJg3pWi<uP-C7y;~KID@_OM3vrQU@=$>%!9>%2~Q_os$@?TKjcrhfLkB<r^#OO
zVVRF1pE}uGq5n)1V}6Ho_4akHA^tW&P-1g!=y?6juYim;MrNo?$`a!}RPTNVrt=+L
z9)!V=^GXX?jy*yX(w=ryBAClG02vkG+GzMLRm6zyXeqXX1qf$Ra7@|v%p&sDI-F%=
z#+|a1JB>?otnA}uK+PktXYB!lUF<DHkB$}qo?WSFxbz6E27nHLmQu@>@}X3YFKKZ)
zVmy?`2Xq7z(xJX-@;eKpSyV}Xe-4g)-XdQICV`Y)G2a0YD;DTVt%Ya8l7;{b8HhRy
zz*j2|fVRnZH<t))(}z0G7luR)nmIq;X=LlT2`NGAIb*)bSN#|&TYFdZTj#}=5KWxg
zxc$8Sv<kKx8ZSiPNUxB=ZODSXR91{@Y>f*+T&JJZqBe)xxn{W!uA(kDDUIU|zSR87
z8x?|LsT9=8c~m_Ddz*rSt9Hn-O90_0rM*tPaF?oXm%3Y*QWVSQBen9aU2Kz`8hc#?
z;cg`>CDd@2>8z+>VfP8)F6x}Q*<SY!kwq*D)k*5<oa=m7!(mz2Jx=a%S?RRa^&#o@
zexK<4r2!3C>GZ_FUD>;eNL^vnUfgQ0GCR`Kq&HGm#IF^kQrHu+*D3eA%aqWEUqM-r
zx-S>@e>kk|Q{Lk^tIMji$Ki`*cfr6bp21(xVPTX3r6|^-RgO-;x|7WDg~IAdhK2!M
zaSC1amqKA{sAbF$lN>$T{{j_;u1!a6)B9T$1k?9Am$L`IWST10AQx_TaGThU6TswF
zcoq4kK85Ar8M2PjsoXlK+G-}<1&<&g<EbdlEVMZpbBoM^vSt4e48Jozw6Y@bDhl<B
zw<`=g9EfB4LPC0Gc5JaDEoz2GRyt!>I_1Fwl~(=u;R0j_{4;@bfk}?yhcGH^%nKFn
z#{x>iV|d*$r9xAs^s$5Bj=$_+rKppD^`H<3l1Yxf4j%u4W&6p9VksF1hjH{AGLWwc
ztWTNdC<B?rG)GI=;u**h?C38HOBT}{C5=up$x$+k$x#-)0dyr9$s|X)&P+Ik2(<5Y
z3hE6<MUDL(9&R9j%T_t$)L0c3JEh5E(*zF3Jq{d&Ri2}3a8jA2ZTtYwX2(FDz_7T@
zp|e)u3<k1z4*ie}e?89LgB=adWQ)yYJ)m$T18)u(GZ`Fjk_pJy4ES3-#<A!X{iuNJ
zkIvC>@JFnTQY-Q=yNoox=b{7rEYSP50p1Bn%HpB0{Z1k7+X%6jmq(Dy2EzdswoQfp
z%6y$L0(*_eEDUoT5ZIQ2XL6XAF(E8FROo#=+l?P@jvRga;c$fi>YmIL&^=T&iP!z0
zvd6I;je1A^5Ms??MCf}yf_b6G_LPK*$IrfAeSI*;lAs71Rm5=oKsRGpz*(#>^+us0
zEWfGHdOBN6%`ABB&BrtI$rGK^bGVa+ABOk(c&p~aqfsJV?=I=hZx?;+z7Abuj#tT}
zA6ke0;^$!3=2(<4YWnbY(wjNm`S&67`uhA9)OW6}A4IC(Q31})=!Gth8FM`1Y39f6
z8iXAKHvM=`Ep*2I1NwEyC%DKga~YtX@!mjxDUP#OHm8HX8^yQM@w*GP(v6agBClYv
ziVT$B3s90KCK$`HT{DEpLc_Dr7;DaJqv+^jR=vZMOQ|pTau!|EBe6g*15_%*ve#i`
z`b9Oz5EF}x82=g>&DB2s_2i4?|1VVZ+V`g7?=3IBw|@Bk;@~?&WTjJorQ3a__u5K-
z@k(T}iJ_y?jgvkg@voR9FHk8X$=2dl1|x3L93;**Ch}Fy$s!^42ZBBDe%}w-jUPeW
zKL<mPDn@;|O<i*G?ErT!y|3#4(>fRQe<Gx?V(H9s3~E*B*O1{akk_wWeSWExU*ftl
zU}fx@61J&rNp$w-tNAVy_b#X2Ujm0+LQhsb-mj_et?{Cd@++^aSgq5-)@9ILa%g^q
zkL$o;(W>O3FiHHktj%wE(REFO--(>RRS(yXjS1_ayNt-M2}+A5?H%T#{KOX<Mzb46
z?ZS5Kn_n{d9e#BtXKgwfY)Xy&){Ma?si-(8ZzT}7NawcPKME6=Ci)>?$geFXQA)n?
z`&|2059jvLnC<A2?W+dc6pw8p`cLHDZJP4->uZ0K$JR(=+X<q=b$He~@|fn0rIZ-d
zIBDb7*joO_-**oGFv-!s>Fb{3;N4Z3Br&#|wCtjfYvZJy2Q~}Tk{xNS9r44R@*6w!
zC&DsLSL|2jB@4e?Q;Cy#v*xF?7e(9)E?nzt-%Sfs!>LO%QPGIb-pB3TVJG+Bw(rj#
ze%$}?alidz@0-K@MUR7}m;-gL16SRH<&OvVkB`;;+9OOX|MWOimO1$v-R+5Ioj7-R
zfW`<xQU69o-8ADTG0tCbOjLBOunM0Oj{k2|bQx1>l5<2Q2=``EvV%8gZ{(iy%m0Cj
z(uoNuNtdZ*+j|zd|A~qkKa}J|%6Ofqa;^{kd}1w|!AosoZe-p2?))t9RkiOshqHMc
zik;^ZT&I7WX}!Gpvk2*^bSBpCFKU$a2N$+xy;R9>c4p1HKTFc4-0h93ZKX8Jxn9<g
zWX2;WgWCzcZ<wfPV2N0UtM+$B^F!aU^20X4s<Tx!fp@lqx7W|jbtIsr-Dm%VmE<h^
zG>!fvOvg7#yKD26n*=PqssFyIyUlemrLH?sKs<W)@`nHOySt&bQJd>ux3_Mk%pOGV
z{oVZa#lTr4;4eH5u275Hse}a#voTRoc|l6tGLF`(3=?{WXCNeW{X3_Xx-D-tReU{X
z%w?&*X3QOHUrj*2|MpnH*);8miQr4MbV8j5xz<!9|GA11A$+#h?ActUvI*|ysc;La
zo9W(=Z^>@ov%jODHYXHpKap-dfex(?y=++FvU>I+wah~O<*5j34Y9MHajXMY1NAb@
zi9pSxh1Q6%`t?QoM<CaL2$CTa6&*j!hwen!nhIUmuvLH=p0_(8U$1UpBKGRM{Yjn8
zQ_2>~JQq&cS)NgNX(MzU26rD{UpQ?qweb10a^<|`P3&~R;wyt`)%%X-JhqF%%IX%c
zCP>z&FFO0(>0x>0y=^Q71_T2(6<EZPKvIf&${Yyr^0ee2%i4)iL#8^#z%XGaHuxo$
zIO6Q%{?F-P_EB390BcR&8uKaQi6qlF6Sh25`(mje@7G>b*HkN(+lo=Pb-9W>3)XDz
zoeU6two2}U)uR8_QC?3Sh*G5QEmzZZa?Vp>B5*}^5|?IBt>>Suz%7tenk1jy<d;$`
zcKnR<D^gd^-7!vQaUZGtd-I18ktI8Y6_SExoXQjx$4?b^daq>XXl9sj+#7qigjV({
zLh>E^Mo1JlsdKs_euLQi?P~-rY**Oc<yg;mi>anRg^!=}?%Y7E7xmM?=QFe{bI&yF
zg%96|ySy%<H=0`-A_L5UAOPSmJi*7mpPxd@h+IhdHrMzzEgvAq!T~H_9E6(zK=?;(
zKLH@FJabN<q5(^L!GoEj0w<>(nO(e9M{#zn%sUW205E_sYg_U~9$ejf0EE<hLz@u5
z?+f$KB+XrFlirED^f5N6JvIf)KQD|t4}bv-6*9@g{)PC<r+{$xn*t##2ssx~m^KAh
zy+ma9t5LmEhCRG41){cF7{kB;c}>B`73`67F<fEqjT5&tfE;Chpg&g%!01+q86D9i
zQy~;;-1nk5mfkz&5D};P8=xA{EB+*?2tF&_wj0d$=Z)HV$A)*Xle81Tr!fGY#SNfC
z-bE%txq%FUYd^i*mqp;$B9Gl!8&4w4dK?}cC$KK#FQ4!!JyLrSV7-@i?n@>B({>_q
zNZDnj`LH6;m&KG*t;JcE2_`rOHHAb5J&wy`^E6Wsd@*?G3qJ@%QZ*Ojnur1da#=M3
zP1ssfqe)ZzbJhG%h<Ud7`v}*Ds^qSqZaf<{Cz)@n2>@3x&PH06vc+uc2y2goam9iT
zafb^AlI8Mwsnq)lAYd?&g9{Fh#AV6#nV&DWFVYC}(Gu`^{>)-Akw-<G8^W+Ci4OPR
zoqGTa_XSzGKy!_tXH*-BfK*{uBImL+oFUffqJ16o$%&w@*r}4jUwb7eFZox?YjvS5
zIerN!0MER2Jhh4yF3%zUu~I7wF&ma}*)_nZV*+#<6%MUD@1Hi>e3A}77WZT2VHD0(
zBUN`Ug}a0b+VLNWct#Re&Pf&o@W)dl!}9IaeN2!+)nF(QXm|?;xPr1|-d5cMkZ=dQ
zOB*)lLV{X+?CGqa=LI2M7oGF^c^bW9t4}}?teMDlAGxg7+|8;Z0<rcyE|Z6;gt=ss
z&2gKAE6&5!=@mI9H(2FWtsK^9WiiQ~_~1q-xXh794X2<=lbh*K5|+QCAM6okOGV~^
z1ybpJD0V8F4`nK<J>-#b<a`@XF$4l1@76fTbmPGTeAzbvKq`%kA5Y~gr!v4!jkDTw
zwCJXaL{Ru6Bs}087ZD@OA-zB)6c}ESSyQBF1r47m`Bn3U@HPC-?ra2B8QCSlxNzgS
z)2K#&UA`|R&bs~$^lab7D_!@uxmMMb#T|oxLI`BZCB69qS{JIRSW0+K4+O9Y%(c8X
z4t~AR2O>Y3BZ~qk{K(JCze>2o6zyu604a&;K8868umTF!>4)deKc0l9fq>X&vWCD1
zc~J+4l{RY!h#Qmy(U8Eu#7)jzJ#H$z3(ZV;5c>&anO>8?yF%9NdqWlq_?@7Q?Ra$p
z%2(Cps<4pH>%N*V-k(`$Oe3m4JLUbzc|gRmc<oDsuJ=T*V(4A@qDfuv&*R+l2}-r4
z%c)SK+o_oVNb1a&jaKK;M}8Lyu<1c>sbvM-E2k8sYLzuhtH3}Wq1rQA<aDFUOqc$|
zqZn%;d*l^+O&I{bq|<D{y)(1SqEY)eI%JRk>f3iq7aQyCLxPiBXPHyj#*ygI^KpZ;
zPkxu4r`i8J|LHTDjm!Yc$!4MO^beaaM<E-J&ounu(>uI9eE#&;HtJ$^LKyP1@(~=~
z;NH3y6q8A1rL7^PPPuScQ8%<iG66QM_6L7Z<8$k4;SU&B7ej1~Kq!2Rl?WZUW_<(9
zg{6KBl>}wnPliA-#y=Doz$9-e$XzM6!HEF$eCKJJd_5mAx9}O7w=NpqXy{JbpFA@E
zemnkoc=i*a&)(9z50}}u-k4v0sB+K}6@M)#O_=)S$bjIL_><>FAi&qN0<qU^G+1u;
zEePCP=7Dcyq?0Sec$*~_Ua;3}rldpQOce6TL`HV@?K8jcd`ua9dFHyT92F!n)4Rv3
zk#ek&Rp4j<01=^_t9Oi#4lx_h(5?Ys3Rn;K$U~|io=!zHDe`lZs9-66b~f(z?V#m0
zW7AdON}Jw&AcO&-5dxZj8}4R12Cc5`1C_9OP@5MR!i5F(J8puipHT(5NdrN9?jT+#
z#Up#ye>?ParnCRi4%}ACl9Ja)%pFfjhCu+)-PqccifXwb8L;ZDwacweWIk8`K<|nL
zkQGBOQ-?q4qW1`6M#qD`9xans{<T)jy!_=P(0|DmQB(C~OPh1Zq7V|Wp_POJ>VDPM
zh7c0h-e`f$W!%jHz#RCJLjC!$4vwWJX6XY8MUZFJ2&Wc+-swaKDvwZau9e<@3vV_`
z<U|4xtRY8La<mwIQjA(MRCFlg2Dow_1!Id#)CeFFP^lwucqe&XPUK7T@tppSz)r!9
zFlxaX7!=Tu=4|-=M9Hst7z_zW;HZpjB&?#9W06q1OR%2pE<|=jJnhh)Q?|x;gr$ms
zYN+3`sX=%cB$5bn(n-nFd+bET8Vh?5bO==@-gz$S{!RcqbMKqBxZ9sN+^~$LE<)P4
z7vKj`YUJ1$AO!`0l@9C}70T-7hiDRxe8ans_f||A=FHr--z!F9s6RcaA^Zr6ZL9&K
z*{S(CXy>lyWN}1)m$a~U6=!n_K}z(Kip&c2=yz(q4v-N<g|w=u`(UANJ*oIsc&qX7
zknzbv^OGCKhY?Sya;E_Pip2FRx*#VicPUjFTIirq<(Q)<V4RXKE5buA64n(D@&vz9
z(cTD?Yj%C+rJDrTG?n)0fmFzS&qg*sMIr&SD7L{9>M-vsA`4+p(n?ES7^#8yvB|Y^
z2>PwDW*x1Z=gc_R;k!hnaC_B^R-n*}Nl%fKJSg1!t^&TlzFSLZ5w@)YusuU67Z@j3
zC8O?{zu-QerhZ(irt96;UN{mC%A|5<Q&p^nz!VcFU4-)#t1_87X+b6TcZ>y6fj^Kh
zU&Rm<s&w{q%b@|-+(6+YGa#8yS-Z3(U7@V10HWS4T~`F&u|m-Gg1}U5ri4nTI;zVb
zim*}Pbd!5678`-UyA`>s@q!;7c7Cr!3bBi|XfZG?Pg&Ke>~~809wl;Oi@Vf~R0fA~
zW`<rU*m&()hF(o<7ZO#bTXq=_cQIwsibQ{Y(LQ5~*?Y-hNE1fbT`a>YK@MO(2Nlpg
z2a4cPaOFyzvg(L$kXdJHf~=0Xkg=e?{NUe8C9oi`HI}NTsuaCa{C-dTqk3zbnl3v<
zG-jZq#MP24fVk&!(mEhFq@M;^(KHM{@#$@C1f_U7I~StfPbP?3W3)dQ3Ln!X41`gE
zew#I%&F}Qd(?(+<pArBkfXzt>{0FkFJDe#jDzsN@&02Fm?g{_d+bosIhapV6l)<-P
z8z&6a-;lkF$~9h)r(R*|qybc<Ih7^AtYt%_m>XC;1@$3_GTq-_Z*(Xs;t)(V$OZVt
zMuI{4;0&tlunp&D>yM|P8zq{BX$ddXfLDRW#~4~{c~l5eW>Suh;Cj?6TYuMz1!;XJ
ztQ6qM1PUJ|Ug@GPPwK=i_BV5COUYo_=>SMiIH7x@HQr7(dKz9f8F&>w>8uS|rXsIU
z1xlIU{{gmfXtNsCivw`Ys)H<Qv6GBINaOu@V1syCc&}J9y?nlQ`l>wy+v;GbN(DEy
zCze=kG(UlyqIyYIMI^&qx|<Vitv1$F5ag!PSSr|D^bnCbIx9S3!7#VagMRUBiI{;;
zsxV_z%}Q5ZL#X_O#~pzD$bB6EoP(rf0rvvOWaW!J^8tu?hof6<?b|-?GOM%uEl%cC
zz}$ZA9@0O-;XaRC;QNM<WSBkKAtln~;b}Gs17_cpC)^G4eOcg?so}P&=G^f-wE`ZU
z-tzQ4t50%5mqnTr;hB?6(*x`F)X2of_pD|LohZ!hka4KVIJA}}(c+KoWBfa(fC7U6
zxeA@P$!;!vJq_i)vm*d$AVIL_m`hs#Q24ZBFgN*LwA=XUd;LFV+xo$^xHI))vmJSY
zHs5E*IL^$p(I-sKynTEIfBF5)$eG*uXWsodbNF#nHf8F}{2A%WrtFV;?u%_lFc!4=
z5O?~OY;6nouSFjei0Kkx?klHpm=un0OjI-^Yb-Ni<>*J_9kk3}_YLch8$cEZiG4l#
zBO90#YRg1LJ>EnfSxfNP?<tfHj9sp0qM~yRWRIoy9*~Oymm|55wW-j+f1{#g)@m}_
z3o`pCnd1W)^^^R6Lq+vHxleksyohg+nS)&Oyyf}vcHTdzsHgC#=g|+IB0oJv4?M9b
zFIv9`ztRFN3*k(U#|40-LcOG~dC6pW$rgLb6)zmYAh{~M<X$XrXo3_Eyzop^RK#0V
z$y-$fd8n-MNovUpL-Ia;&090$lcuS+rk}Ugi%)VHao>-5>HoCcI+|V0&%qg356wtB
zv}ObQ)f;YkG@38!GmVgotU<{1XBZzZS0BPpRx^jigAt$VnMHGyudPz5MMD~aH<{R=
z@p+uHp8vX@U;XK=#VX2Y+iG7|6zk>4n*#a1r+6Ffwz#Tm7SHbbKEo`z>ihZhrnvpY
zOw3Sm=AS8LiO2IlK4vnb#eRAv$g?N?LQnc#rn3fBBS|8SzArMWu;hT=hHwq{Tuie6
zPrt~YOC|>&!~7aApG>)eYP@Qi5|!Z}Bl0==1@e-Vj@88*vHHz4US<i~Kk>!qt3UlO
zrTHGFR-`#*ELY|Q#8xaPepohl|2#qQ9P#$(nDNUw5}1Mw%s3gye8^$$KeGGzcwitp
z{;Rt~;2mCHjMxI&&Cmbh*Sb$%FTDt4qM~Ol$;5f%GO2%|q9#k0+rIw?75#AT;3xBo
z(K!H30f|z;$`ptJ1!_Zqc~IczD2Nye@&<+FA5^rR!ahdf_((zhqM#2c7<3q?Xc(7r
z*b##;ZksS3k1*bIVSF)R{5Qe`?uH3I2@`4$6CMjY`Y}x8SD5Hw7#1BaCK@iT9Dei*
z+@>bpr3o%^E_^UA=`x+gat@5ESeLsScZ$v;b17WuQmPjof~%pOYJzJJz=yJV5L0uQ
zX=I$7G&F_`l_$`&@)DGu{4R?`$eDpPn&9}4ac-+gk>v0gAW>Bs8rUD9ggLL{ah{Hc
z%G)Gp5omgODSDY;+#J{#*if|zmv4lc9-hBTIgi7~`SD)}T}?7?49BfPW18Ud{E*Q8
z-&TkVE@LUq72%eI_|w}-c8;62cUjJiB@imY9X_T|kV#P$Dc&|)#e^ivcv60Hl2<_D
zRn09IkF`khZ)Y+@7J$bjLp`3X+bhFy_;_pnO_`4@a?-E@0wQcXMUMbJhek+Nth-gL
zUu(L^a|2=61Xsex<^M^bG}2_gz%A~=j{jn@A<$IlDW}MP4)3nU>yg)8{o}kUlJt<!
zXvein<_S*zaWZ$4bQ{+#wv#BCG(uCN%CD60igij}it1Q+%paJgdBW}Oq^o(%2rAsN
z2~N&SxYU#w858F`m*h<UO?~qB&e-3gUw^Ont=h>%-~!+pHMBc7F38`FyOhUrhCn0G
z6XZWai)YTqL?+37ykbbYaAp;8DP|)Q0k<S=US(X0F~2JBvD@$@JU?cK<-wKH(g~4#
zyZMnx&dE@l2PqL_7f#=e^BZS5-NgKbJ*~M-e0ySbBludtRU=@hF$Q5OvrWmnid#;y
zYXlFWe-A%dANhFY#og6YV^?A?{f?}F8PCLNA>++gw+=7QT~yuP92iT9#B8fRfW<gP
zs%h@XDJL~NL7cdKDMki{!(5&Ch4^H44M#eV^FNq=K*2j+kZnpdzZ<8C-c}(;7;0Yf
zKtvWLZ$z5WuC69EwVzkYiwO<5S`fMW<;JzbzU@DEV|Eb8^X8d<<O5c*o$;)Es=>>v
zV%^DH(soq=YvR4>g2%&Gme(ZuGsVra6$1YY6&;uyX5^WJbDxU;_Or5VS(3>LEcdL=
zi)H0CQtcCMcOLn}lH)}|bCC~Dh`m|-^?`BC<c8Flw^NccHC}z$if6YJ-aZR@T^I6w
zOVKSAAEvSEd*p$Yd}7f3Y_8wZMpcmeJ4440Dd<xg`!9Io<#H=eckHuE5YvrSJ~b5_
zkNCOrS8aK`)a<5`Ucsr#sY=D%G)I)&s1~ECdqdswm_$;1rul^b>f5}oUwgh6SCmgP
z6Z-ogzLSNGUzaBz*gpx~{}(D+e}hFmZMs}90%;P&tHkp-?}T|s>lfFu-5={;UOqW@
zsDH4xbKFBnCShEva@LPUDA(fC?U;uvjo7&VLPb4|_va<;<?e0dU=#iu6%}!goF_Q!
zEu>g^=P*%Gl|fC3>&IvpM}(8VHc5Czu=gzxP7HfXWSRVfieAo=z9v?O%dtJ7C7FBr
z=k`f0hoEN3+h?vE{*}!0Ox2Rg_bs?ARS@`}sHjxoxy`OI;@-w5OcCt8J=zXE@^D<|
zveJfsVS?ZlnNoj2nz1Gf6c<lpUyC!w9b~Fvj^}7^z=e<@3m&0t`D<{)U%L4+l@BXh
zzNMQue;y0%I+k-n?VzT^L~DP%CGY{<SFm6C`K!wD3MA(O_oD&1=L%1E)+Atj2g_yM
zwms=<ANBgK*Cz3-<;|x^n#+{TG#=!1y%cu-_9=zuR{F$QVm=qws9rM#@?GR$Sglv#
zAWy{<=Mc&CN%iu>#v1G*vu}vmr4#vO9gwpMJv^>awJurMl996d4T&D%r!rZtO%cYb
zftMX9hqi2kHQ_2l{06TKANH<lXkhq?X9pe{tP#E`bKSzzj1@mK)YHhHN5HbDe#OT@
z#pe%bDzBKR=%(4ebKN_=Ni5M^&dpdT^p@hC4xamowOND0=B-DNb#^mW+!7kj3+S<5
zd%=nJqUZ}%;fdVpN!$;yw0I>27uxJYC!GV$#Vo$=1nv{;n?qK`0Y7b;-V|KFh|_;s
z(k#8U!r3@dUz2tJZRFvp(GL#XIFlDt@6B)Z_dL|j;|jirYpr&$wJT)Wy;8fW?v|Nu
ztZyE8rQvt(!MkCRbIWQ^B^BN(V1z1#i-p8aaH~C|;eBn?tIYRkxzaF;AE8<%m$TD&
z+R=wG1_yr|S+1UgjV$m9jdy6_{wzgIc%wo@F6Nfxcd$p4nY{DMehi8J;U64;<>JqJ
zoG%s|4NEb5$DNqdHDXNK(Gg>{*DPOh#<?Ocj~P1sF-&08;MpFQ7$EO=9$l|V(%%!q
z{0kN3s!cZ473aEH(JiT3n{qNroV!e>M^@ya=q>}HzbJ;jRP#yr%b(ukHJsN~SiAT-
z`MuR^Vma_vCXW8hMDT8hNy|;vW?aM#=`V(%RBo;DQ~(JQa22E$oyhK*3>HtLn;VCE
zvUy=3g5y|(!5?BKv!X4f5<5U(&CU+T`iODlo15^)W@Q#GN~*-BI?gVn&uAv;9Il4-
zIZv)<{Gs$6FAYmGfZL(Gk_}~hun3|ynER2sH!}oj7PZ1$Z0k<an_cTs+3CDNU6B-|
z3cx(exp*FT!*zU|hr+Ud$FKK)Rs^(=>cJ&B0jowT9`k8FgJt<M1D{07Y^^WUy)0UV
z_Q=P_a$Fj&ErjbWSB}c2Gczff4DK$2c7c<a_gqC4NFR+dY9f&=PXCCNF*K61Q<?uH
zJQ0~7v4>3*Croixtiq0sik-y$=sG&H+GDbxIikpTS*CVWmK1lQ>{_7_e}$8@_~$u0
zk0>J%@6NvC>EDoA!r^6fOt038?9}7%S47e#OlFT_e*cBI;EGJeot^o^jGHHqvFi48
zE7q*Nte&i|e(C((7X1~`<kclIydx*oEeJE9iVOa%k@q_CNZ{fh@R9JDatU`a$G&-p
zkjzNAFn&HQLZ;zq@dXQC+j+$Gpe^A54iQ_SJJtqtalwdvg<$WioKeUw&UWE=pZb=r
zYf+zg;;2>1g>vuaxg5oIli^Y`Uy&ZdTgmGck0n$%Io|U&wxs0t$&2VDyVgi(^Sru$
zj96lE(r+^FQLBl%{*H@4^C#Z+T!>u3+4p~0UmblymX>*;B6x}PiI-!<kF#NQ)T?-#
zx8K-X;9MBn*>Y|MSOh8)70WR{xGY4c;^bN^KXTkYBD&3EbdAUqN)LrE+;_;W(W!Wp
z<+^peMygj)<CH>a1brc^!bv%)$0tocxtD9Qe~magpDd$Eds_VU2Ud{9oAoL5Nf}R^
zL=#(C1eMmm16$9ln4pPqgVpoYpq`rP93CGGdqX>tls~+45l-tl+R2C)yMNUMv)RR$
zl@7nvGX?&8#m|Fqt517vSRiUv{7wetvESnS2N`z5aokR?^z}l2r2z>T><wJ<q$h?#
zGCX=tz=K$=l6F=YH@stnsDwFXX?=$zv8R|-o{7esGM?vUolj!XTIjrv)MCwRQZ-(z
z;EasACpz)x$MrHb|3rMVc;^gQYB)GM+We~6)Q91E>5)u#T*+a1)l3p^uWcr7&Kr47
zwnqWHslyOXdjGeJRczr5XBV!U>r$M#+(Jl#rz|e>`zsSl-6E$Nw|7rNTTh)pT_QIX
zE3rBQB=psC#BIcK@zt8;+D@QdFU1QzcNoxg!Eicv6D0O2EBfwh7}rQ2Aw_^FE!epp
z*DZz$Vu8qWg{SfclNa7PAT<eim`#^AD=f^6e=jSpahb-J#S}_0oDX~Ht0Mh%$TrT>
z8*T>im_5^E?9sZG8_c&hGea9x6u*(^A3u;b7e<u(aPeJg><BkY_YLNXc#8Tv@yu(B
zMjGVp)NZjQcFsLw-F4nVWgJ}pP|IkQ6F$FX#CC94v*)+&nMhmu9`A5C@~4`ZdhPEg
zzVu|{j{OogLwu<~;$<_Oc-D<;GdjQaYM?6;^LHX6X`I(plV9^Jd`L>)k83;J*Yo47
zSGZp)d=CpfK4{Ap$Ztqou4$~gXR~kqIgZzMSI_W8EzH8eM<_wYNVuSRD=xhZ<Cz?%
zprev-EK*Q38t4;b-X*wB&0>EpL-sGbh$<LL2Y`k)V->5It)|!qTJd`9H1VvD#67S$
zmUb%GP?y_SjXO?%82sILKxde!)Y_GqQ!F-4)9;3O41@9UgQhqmVO(tg-!9nzqO|%;
zeNyM1^{jYzhomr+y_$Gik@h#C<C9{%1ot6GP`z6}-DvD#oWcND#jTS&*^pS+DOeS&
zxMC!nZp1s7t<7!7#qc0<e;|@ecs1saEEpL~xheC<Ygct}cMJ1fnHOXiF+Ojo%<swH
zDy9-o<i{8h=ei{0iEN97+5r6+fBYw+yHQmKh8=W_8?4LSDH%}Ux6+}2JQ+G{su=m<
z)jnE6hKMt^#I+LH8f@h9I*tX?-!2+rW%`eqpCPt-DXhl{+%r@$kEKIB43lG_a>i@(
zrAq7K2CcEL+lY^AVtFdSVoa!%IvniQrRN3_3W$TBkl@RFD-1PM8}69G#S3e?5QSeG
zrgyPy5S6hXc6j2o3kkv-U}VK%oZ>S^MsA^QFoC_Wlcl0dbEXr{-!1rzz{ZTw|1lD!
z68H-{;VWHmD-cl%B&82MmJHI6fgX1P9e0B~H0f-s?KpO?QzYI<jc%k5rSa5sh&;QY
zRMWAgH!=>T3G@#d<&_z3bh0SWWRhoPy9vqx9pZnwm@@0J4O)|J7fBF$^4q=s&j1Uz
zp=jP6qgk4;y0I#*1I|w5>ZciWgIKCSz(rqFKiFv@PCwO<3;LP6yF;U&rkU?4kRj>h
z?&}bG-(ba)#B0osrRx>=veSLtr*T>$@$6oo1+7GeFMyH#Mg{@C%IqDD^#rjQFmlFT
zLVLmJyz>c)5zCcBsDag)R|(=0IdN&`AP4q7g=b?Lg7KcSY>Kn4K~v&fP34kqaa@aF
zMwSclkGLUwxwVM#+8e3R45GYgnn7gQ;|)u-93wRfu>oWFZ3LvTV-%t9ui^%&!y0Nz
zeNb%8;*EYFLGK`o`%M0Y=+qS%BzqDwsoFDhS3-^S?cxm1(-gE8iLFO_j@~n%GP)ib
z@z~LNOpFcwoHlHQ$g<Arn0M$>j2_IG$eow^AkZz$Pg4r+6prt*F$ZZ6TN*A-T)Gwz
zneheVH2dK%mABCF)DA?R$`J48Q!&49kX~W1as~yxKSVVCC<$H2Et!ZlQeG@;vSq$&
zU)A9UBOHf|vH?79;D-jtK;lXOk=xKc6vD!74B~p2b#Xa~#&l`ojd@Ft4T~+k!KzRh
zMRT*-shy)Nr3P+Nei<gLEvC=UOC60aJ{&gG!q5!NJC5;xSu*cv>-Qrr8r~O1Y;(pN
zVC3-Wu}bQdmH!ue_u18ix3-Hup{4*y=)Hq9>Afa|t_Xq!0hJC?q}xD9=)DV4rAn9H
zYv{cTh=4={LFuAY$<BYRwV(a$bH;hG&$~0m`3f1yoFn(Vuj_{!SvU(0e_E;<BIE&C
z&X+F}&qa%bL`g42b>IGOd>TwnGvOoOTVkF|DL?RxwePwrZAFi>iZ)h)yASS^@nFP6
z<-C{va!q}#05+CowCAiuQHWY|TqYL+H=}!>;N&eeG0uG|W<m7yB79~fy#DzbPQg4v
zC`DdJR1EgkR*ytTaE=Z%oVTxhpsXU*q>@u>@{E9%j<AIG;e@j^Cx*)zT>*lfC8)li
z?IPL!LA_K@$x?cXG~m79zLf-4munR$RCN$63p0r;>XF__zDh}9)RIWa(pc1_d0X^G
zv!b=urENw;lOI?2tVjMPif7UC{vRL%Bbi;TCUp6yaD+uBr}h2VVzkhz_O}ugKf6{v
zKU+2S@fhmU6SC|d@!99SVr!*28G^KZXc;o<3b<zDH}pKh8P(@t%`K8Q5KK>{t9mf}
zROd%)#!f}2Xi0$ar$0B<=t<eONbl-tA4WQ(Qpz;+iYeZUNCI>z%i^_=i!LA8)vW|-
zcFQjCy`5#G#8XMbH8`ENypZ)L1M5SXVM4Zsm`k0yOTA5>iY#nr3al)IB3!PDv4?6%
zYIeyQ?J#I5y)D<s6+Kl8!3&1Ke1eqWg&KC&G{ocdyjMW4sEe_0@6S_H8dsdN7DOyx
zjK@`dW}Tw@U9V<^|52HP_%?;H#F%=OM#SvECLH97)(8O#MC|w{iD`X%I`YAF)R~2`
zfe1Jgjm2JGSAb{<DJUXS8I+dk^+pnqqqSq%ZWE%$N~T`D{qTpQPHr!|mI&JEn${Sa
zvS?~n$1P{CRKw}!(AKtE77deGka~n$-XC(NV>B4%TqL{FMkZ3I6LP^wCi5o>S_f3v
zLVuPF`q}A*(j#4?nFu^3h3^xtOCF;?Gn4SVWu^Q2R<5v{!iVJVIa<A^Km)!*Ax087
zf~LVB=}o0xG5!RTm8kY1p$Pz04{_GOJ%P(y9WfEM7?d!x7WeXJ!S-ktsvA0tH`K>)
z%tEl;e3z0dvAAIpPy#?8!m_2I8;o@2s>iTQvP-#kgH?kyn5DsDJx3ExzZ}Q}5|EGs
z=ANrPif;gcgv{QhEEv*@X3LcwgVac>B^EJU3-?MfIm-6wp}-(%x^Ii<_Ay-VqjyDL
ztFD-?#EGY&XsB@%PFTio>>8T20!_l87d!XB!Cdq>?mJq5`((+tduKc=NTc_(j3u>l
z-98HA)GEBG1hmvW2rF9E#_AO^&9u^5LkZNreF<Z$%-tS3W(f3)4Au#Rt%(*fi8%O?
zl*uj^C3ZdgtG8asq9wReqXaFJO%kIcs||akvAE*0fj}RVYDbeXa`d_2d5m{SQ;In1
zw8brcY^)=`UR?jmMPY-2Tl3rm%3;vs+hS@7S;{474Uf-86h)jzc(zwsCp<mOH>vl}
z9-)k_O67w)IQmqW;{?9-`p%R1Xx`$Q1e!I42w;A*Zwb!E0(suzI@0@C`-lf#x7O1E
z)xw6x)PYn16y#thGj53MkdbZ^!+5Mo11g`CbD&if6s>qDCE<|i;6+<aqUPh8IN`{|
zRv3R&D^^GVNYQUnuy5-6tSelRNbT`z*nQJUT2isBMD_K8Y_IJ<0P=2;(02cNq@tyf
z5?m2WroPqSa7?N&^~~wi)(stbU93WbA85^_m7XIkN^gZ~cBC@1lsH|6-)z*t)S2X9
zOrK!I{GTv~lt$WpmjF3FWp&~Y`BBKM)ybgM^rELkWXof)$v=~fSzC)IVaKZ12Q}sz
zQ`<9|$`kMF?aM~?EZQ5jmNoJyNXoCT?7WxrQuDoXnZ`|*21cz{`wm@O!Sn~5+YeB)
z6ABUGr><@|ZOxGDeMJ1Xhr(lH!fWU6riAE_g!;`Ij75`jLU;BKX%mN{DF12D^N=<1
zaft*%<)``Ht&CAum3UMN39sbMk4qGOfz1&{N^ca%kosim-;j<~D9iv-PQqK}vw(Ck
zM!M+~MTMPW31KV*fERn>F3`+FJ(5h`qp!$l`LMJ`<J8`y?4vcIe7I5gAhQrwL`W#*
zA~^hhOTNS_-D;Ma8f)myXZl8cg;iu)-|KSPGwPXzrlnhpjm}uHeG^Ym9W#`C)j%E(
zRJn<vO8qNTy>i6`X+>LW#pJ8X!Sl+t^NOb4^7Zo%-<7LK+cXq|Wymh72(8t87d4+>
zeK>hlA=*|+*H-gcxn4u1PNJ>Kv8}<St^7t?-Ouv|Q@>_+mCAUPW^a`$KfeYem6kff
zMN3*+v-d^QuU9JYHkq-u>T7K+vu!Qw7p=v9HQz5fq5kc?er<tmUF*v9pL!Vqnc427
z21dH-RJ9*1G5uUYM1i&cF#vMf%j0@UUJ;~$X@{TovS8X}DoBUkVKqR&p{iaHjOu_(
zd;jyxLHG8d<jbMQ{sZpq<H7zD?*7B?E(eM)N18522QLREiEOFr)P8$^+U3lN|G0|U
z1o|&ImD))8<v?BgsJrUesOm@W_Kz0+Q@Uz%GOs^=Y5!!~G0&v7V9~yCtz&VP2#mfS
zYWq7;*S_)?qapPAbMWP4Z^r~(M}JkY4Ex^&i_0(39cyVFOJDxZGF{D!s;?LkI#yr-
zYtX-|@f}}C16DQESJ~9Qvt5yMcW$`*uN!r2l?Tw{J{IeS^rs<-J?}IrfW3XBvL4Ca
zdMAG&dOr=oScv8%(-0FwA1tUdk`bg20`?cKcE4ZkQ4;n~u4uYZ%ETzh4wAQ!lwk*O
zYKl@0Avp~W6j}^8vkl};A<*pfNLL4*^a3v=NYBy&PXYr^<25ecX<XQL{UPm()7mcC
zk<=4-C=^VAF0yDQz16A(dw$(d5kApt4`HGadm)MM4TJIJBY6_mG(*@~lr5P(zxG5i
z&DvWwCvFaMh-$aWn$d<1hVwAR-O-<08%v{=+sl74%WaYZyPu&|noMxK{SKZ!QomU9
zUMKZ_e4O05OtyX=6rJiJDx7W6q%xzQWI-}t+h#Vi(b7gWzoNQby<91(_`$OEnS|xR
z$v>!Qvhe-J|DdAJ|6H>8{BNje)8?|`L)TArPZk<qTQn+pZjRyqy#8$2xY`xTq!7UV
z(raThUE%o^`zxRA+0y&PtBbzRc0ac~pJd<7e15n-oTd;MP%mRP@5#qn=eXo!<(E?P
zPJKDx>POG(U+#O4y8z_u3CO?IXc&%+!N)M?`osfx4@e*@K{IepbSmpHJkqFj?LhRP
z*|qSHLhH+s(+&x2;&iH+!=Pk4$lh5-my{rRFp8$6GYJXq_t`YoW?ydy>QK<Li{J;j
zZ&)S`3udZT_Yj@;Da7OV?X;s}4P#V|B-l^J@>a};b{VT-hjwGGDW%$Jdd&DRMk{p`
z8MCKzO-Qn<O|<uf^6YI2!yCsTaZQ>pqsNWWvu6Ud_F<;7)0~wmhcT*l&43Tz?1XUa
ziZ)}^)36L?VpFlm3O<No_9Z=1+nep_TcxO!EjZx5{h{$S-<3D_zf~*Rj#`Csq%PXT
zsxj7zgD;bMAOFz{MWC?hy-7w}q?@q{sxQ$jC-BG+b$fMuL8nhU`TcY=KK)P&&G5*O
z1f!JcqSV!tJo}92>)C>Acd4eeSqON5{kJq%%wb=$k?L)2lOMO11vt!1VqZ|g3^1c6
zJO*Zh2o_>RsSV4$h;I<OI2MW+CgLhlw(CtN8)o~y+nZ2UAN+18j0(6J&2;aS1o7lq
zDQ}3t9+E6k-WY@jYi{+ehYH>^L$QlskYq6WqXR2)bx@u_JRGBF6KSZo!?0WbQ73hG
zc5%oNb+D9^x!0;@`V8q{Yik#8B$fwDG@RpSvaqVn6JXO?y%VPH9mZ2=+23MqneNn*
z9;Uw4+CawK>%wEl?5Q4U$E>AD8OHW-k$F8fP*m6M)?ImPTbg-3o{yb$`0C>z>@(0v
zrO!k&l0q!?5EF$KU%Np;;9v%>Q{Lh{%L8wHHr}8VSk1M4>)Lvnm$aICil-KKG9!tG
z4NQ@T(&h%>;Mdd_^S~UKx9f3fZ>CV;)^;!O)K<;iGzSO4*Ge=4tc-hLkF3I8l~M;G
zEN5s!tQ4RQg0v=9T1vEiao3yIi31{@l><TUj-p`rp-HGntyH*qge~&|37tC}1@*D|
zpdKHcMeW&4$t`S4v*9%%%Pd9Nmu}0NdeA2+b{openy3*Yk|w?h2OGgPBcU=OBC5Dp
zKz4}~XSb$%I}cdw#TrRZ8=!B-GX@R9lW6McQU@eZE560Rrf#4)oes#{BckqjOrcI^
zYRKqRze2d0dkB#k#*t9={Mc5awke(qm0`z|gaCplZ5T-S+?-(~%b_ApM67nHJ1Iwt
zEP;Q~;Ql710UtY$BySD3t`<7AWzN2OqMJzqE6kCzI5pOXkQj(Xv0Rf~fO@{A;TWJm
zjFDwsOTkgv=@dV9U+k3}J5<t<)HM3E?4a!Q;Dh;?wRPE4KV;uWQsT#Vt?KT0CF3=q
zqNPDB|587>u?Gk?lo<EyvYRaj8T?odPZP-g#+6K8kJW#T&gc|yKH)*Gt0_%yYaBYL
zXbn=Fu};puv;%9h@EN5@bI9kSuAi>y>r@}Tk$SW3ZPRk2?ZH>3`1C<J?%8;A+1~dk
zhBEQbgxhxtI2*LOtw@>F@v(iCaqv=$vTI|KRQ5Wi?BnbMCQo>1D!v{t-LThc%PDxD
zF7=fzP?L<wB$1}>o_OW{d8k7BZDnpxTjrf_mP}pE1E0kB;@X68<YQ8*w4q-~ULwUF
z+8qQxUc*wPHj`2xbVqQlVRde;g(*!<3v*z2V47wRMD}v^+Wb*WoJbU(j}@u=3ka1h
z2uoe)5e_ZP1G6H5%1GgEd!cnoxgi}ob)@`C=N)~SyL(>Irn7mqZZvoyT_rITWT=pr
zJrzXx-2X85djL~=spkNXF^2b7PMSC~?ch`R8*29*LB-Xn*z%{o<*Qp^9pNJM3d`kC
zf|uGL`!AMY7GyEoU00cIKV}bXi#1sMEskzAx8LN`TI8L=AV$R%vhbr{l1o(X7#G={
zGVvmF*jrmliRvDbhp1@sD*))IqnmcXikusKM5!#qDrtg?<eNg0YAy!T4RMpw2?4?S
z0YMZ#m=HDQ9@;z20P5Oe2-B{0U|c?ywy>I##~%aYNdS7KTR6xp47A_{82J_@p@AvA
zt?@is>OP64yIHo-BjaB=XJafI*(c&yaqECT+~jC3*6GN5$N4NPPQu(Mh^A$nNRs7~
z8;@CM)8}Prd8hf$zHZKLGxxsNf9P!bj`gGdz)Jdqj%EAByh*oU89Om4n7J$AzDjVn
zPQ}ZWpM#2|+5**R(V^R}wp^L)!HtvbCM&Lv3cX789>?{iubpo6`OHns|7pzZ_;D}r
z;teetC*rSG;b+F%+TR=|51)_s>S9|h!LE}(MY`I3X<Hm|fCVgkb`K=5tpS-%yB9u7
zZrb_Qtp&s>YI305LwM;OO;7tCKY3);uVPl$to!^a{$Wg@W!kSWvQGV+9oY|#@7oUt
zq~Z|5X<h7_QfX&n(1xSbS@!Qr3oWB=o!;*V{+nu)=Tni7gi@JaZ`Pq+jmOjcx+hK=
zli(BsUjiPPrP)AFtIy}rph4Qjwr?k$K&8Ss@{~3cosuZqPm@<Z;Wx8)2~vhC%V`VG
zz!M!(KNI?Bb^=bC{Bj|_X&0Y=b)IzU!uM?z2CPJfevcpb(y4CT)Huy!eZ7U2EA*&c
zSJG&D8P0KR;y%{T@03QH(93*RlHyZvwlFAz^LLr!->rvL@{7d*zw^5Q+k7wlJ|(YH
z6r9-auh9D0ZsnX*NvQ8db6l>#9-kFE2GlUUE1P&M$nJ_H`JiA+AqwY}ORWxZ-ouge
zZ+$&a#Ol%{$i*wQvn?_KRJQa3F4wqhSsZjT`GeE~=g?oTj`k1Uh7fcn2|N2F2S$Wf
zMS$n~0H7q0+=Flq`vjNN0r0u89{h}>1~Pa6(zHmqrp{7<q}QeZgu_Y()?StwcWINn
z8O0KrDBz_rnoGn;t`Io0iY3QegUqd{|Kyo%TEoUL2+6925tnaU@mDd}MUpBq#sqyU
z>zKkliX`}#w+ZZ7a7daKWE=~rJXozZhH4liTMwW&Zc)99ry}j6+NP%3r>5QEhEh6F
ze}Y5j@l;jS;Ez-KOVyBGahmT5`##!`!zpTD;yW`*=>Tg+PHM1^B!%OF6!G41!hx!A
zw2wx(FnCr6EZhsrC5GqV<)J;!<LWbF<>aH+t)ah`h~ULdDB98`tWncT(U<`r@B*1f
z+!&r2fddoIv-U}TOer&?uVSo!r%W-2Br=!xGFt#y2!Wm~w+mTH*I5c~v!o-)D1S01
z-v;k;FWMDqeVAtJeagyKz*-#4jzzHR8nL77h~HdR7z)9&&Xj<muE^z7MN{ygeG74L
z6KlE_D@F$_^(BtB!s;e357&Vd6A6mD3Wy+^;bKjq<}~3}!%_#}Xq`)C&QTYtSaMq=
z$0d+c8BdFu;yTZxbLF|Q2%!DT!}uCf(plbq31i+s0ETfAG1riGg@DlO*J8)7UL1kH
zOsiwOj=y;b5!`oP(F%V;3qOw+4zCr;JG%DMMmTdu_y%&nQBt@eNhI?~BwkuHxK_k_
z=Bj-rW+qYTy@?R^_7CG+&c9f$F(cMHI1oXpfQ!qP=E|OKb)WYy&jp<JawLz1HHqz#
zr<ZfRhZ8NuGD~}EeL<uwRcmFY@YDS9zy4U0UIN*Ztl1$%o<0v=LcAgH2B#><>KK<Z
zj_QMGTeC#TQl3<^mk{axS-y#K;Q`4#YnCr?1>ae*%3cNRFPP`A#faH!v2@S?8O1l=
zN}=%z1?!3hrpmYD*_%D#pVpO=O_kH@l=IeALX*Xs>ZDp{mGbCRvD3_VsyQD@!gr2j
z&S$s=x@mp#CWK5WGx6Nlv5edWJY4J29Lc<tbJBcy?B=svCO{b#;ustQmH+U|yqhut
z$EA#;yyFEqz|(si8Vp#`e8^)bIPkz@JSKkZw4_|SUMI6-jyoFzGA_?3kdSJRnJQb?
zOWCF9c=qbBk?OuN)djog6tC+_aO-(`>%E-QYeDEgtS9+=_^o7JFS%YgtzOS>R=+Yu
ztVq_T#OFql%&EBe-yisCt7>(DM0&2^;6(uQDjo-yM)J^sL34aub-X`iQNK~(DLkv<
zby*M)%%4bpu}06yM{_HQwUM8}0Y|k=#p4z$@8<lXnckq({kQQ3_?@j}T%J_fnn{(U
z>AQH-&s(NwIVxRW)9eCMBZj+5#&`4FmCS#WAb;PDq@~rF(C(I2%AL5gesr(kwyFJH
zC8v+~+<y~%euMq)$oqdZC1CF=6~*1GlAs01$wr|xqw{!O!lBGKE*})6d5tLrz~cgx
zK1LZq>ruT8TvH!!{l(E8Ow)1J%N*e@H;>Q7^WgPXY_54sNqMmI?v=)GoCCR>bFnL`
z)>ffq?IVZ>htwp`-Bn+c{<!tgBu~~xK}SiX@!s&BHGb+$w(&j=bVp)dTjrUKXRz&!
zKeqie+B2d`{&lvVv=44Sv(=xswfM6bf^bMgJD}b;v>d5zOaC1K&ip~ht!-K+%X6(c
z@M^Ccy#W|LIH0YMQ$0ml7@^naDy)4QzX7Tt^LdaLzvcPgOZ^ykLCL!gHnNPTt_C&Q
z<L<c*&&w|}y3PJsBz#MCi|u`i|6>~qWbc)SMKCC^9-JJc?mV?}+isLUXY`De_E@m?
zi0}2_kXH#$B_{=fg=S=$$Gzp;WDS5^Zq?$3d|azQU(@@(_nCZ4otb_f$#bQB3v!cu
z+ADq!$6~PNVSlpd)Z}pk@Z5L7>*d08H>MZf&!4|k_@Yzw%x(Qy;`0{>1=dh^fGDGq
z#hsVY3oqmEzj%`-bU*%;d+)0>gr9`mcm)k*3&uxf-TU*xj9&1k0r!$WJggP`GK}&v
z$1$>Z!l};}0trl*`;;?dAEl>om}$Js9v&m?6JoRA=P7rpC~(7;G-hj;*ojOc(7Y@1
zVn@80MCPr&eQ+>A?KGHAF+`YITlsBB>~-5&pztr4_Q--C!Z_H`Hst=>Q1pB#;fE3%
zIt=~WA9d@(Myg~LKke+5_6>*lhn3)w8OS4-M>E=BR4XE|!t0zAa-mc*p^SCxn;59p
z(Ks^}y2{OImjEBLqVpQY>YtuQj9;(jhUp!+8vgP8@<QdEM;!1c-199d4>0cc+qjFx
z_)=KHFS9tx7Bwh~hpu?sF94%z!@Yu&pu^KdhEH+(i!|&H;`z=@g;^pv3V!h(b9epZ
zthC|`fzagx0!2xql+b}4!CW7jrT4HXu3&0s97fdr^&ZafFaE(Po<r|B<Gfkw5_7mI
zOdI);hJaK`_pP(dY)SYD%Siu}e%~zJ=x#>w86-5(zNLkvJe|FfB}-{4(_7vxSaJ0j
zcd7WR1#bQ8nXu{skY19H<tsNhf064J3aShQonUF-TTwUSxEOh8#CfFmUQ$Eya+~tt
zJ(%47-c-I|YDI6(0V~?Uc<7XobX0n*L~houMDhwVKzAuvyESXNy3q98#odbZL2HQN
zQZVqK2ys6fZ|DR5-EwR_$L$+(PHZ>8OWCALzrvF-qUiHa>1}eE>a7rvSD=bKrU9av
zX^jX2NXM|27AR8c<-*Sa<pSraf3ei^cqXqhiBUZF{xsd687|fHw<y;4-!ne^T>3!R
zXRZ3h%Iw~{yosNNn~nGI3=4h?dIY4Cw*?8|xE_6?tY4$=Ug9zXk}(29ID?scmbhsB
zYFf@qn^5mMZ1Z`7shROozBu?|3Y0ULZLyom<V<R<6}w?x<(S#%^10ESt?6M()$3S9
z0y5xajC{Pi@~4h~k}WAnnI*rO{OcOM`mt0J3M#*5{1;!#v)=rdr{ymXB_jj7dYg(S
zTbdFb$Lb_k1`xp=%=Krj$=V_$L8<8rTj#n(=l8aR=a~yJ_aIJ6?SBB^_K!jN*3c*m
z8UI|mxjgdx7u54s0$_8wzj)f7)>f|IZtAS^md|Z1r0v5?*_D`J5YBQPFGUc`qvsCp
zKo50nv-O)=_TSIyKQT{fitBovF}aC@B&_*vQ?T`6I8@P$NDP?}Pt;)^r4bT$kxOoq
zOKy<NEWbvUgX4OYMaG!dqu{41ZF!L-R_uj?tYWD5uyWcyFw2X|Sfxgb<*`Zj@mcoH
z-L}aLAb246%?Xu75uoqqfU_F9n`?a{d`Wr^2r>fJjjwa2tZ_m*q;EA9PhmA3&p1u6
zW1lS=KU&UQ%bpR<4*A4>W7$Y$tb1Uz(tMch!5?e5>Qhy7D^L<QIq$jZku{Au$DGnS
zljXw!L)Dq<EA#Fg3*HZvrCu9^B!I%%<eY)vN7)Ofs0+m=vjY?r!5FAEhb_C&q;ku0
zp*VY~oMYkTYXhHYxud)Rre7-~z~S}|;=K?vOq!PaFs*Q9X(4;%vs!=6Lj$WLDGavY
zHs2%Pr3DB4_?u_4&3Lu16)GV-s#CAi=2li<oOn9UDtw2g*{|^otf3cB?kjNEhIUo<
zr2a2(QKg`vpOm2wQv&WBWB3;;YMOx;)zYfsVbD9C)+fz*e6=#Ne+f609f>z|#74NQ
z${~3swK->u9&Lr^Y(<{*Z|g8+VA(*;vSgnjryT1Z#t@M8yvjN&2*vdk&vcA~b4xMU
z(8(QO=df1=(W^U?oV(*ETi*pa%gQHi6quKDuAb&K5h@vEWs~7Ze@>7u%s7~%uRC(M
zbInC<7y9J@#`VdhbK$NnwI=84CXQAlb`j0T1;<BST**@4m&r9&z+8tKT*r}*4w?Gs
z9A0xKAiH#X5hP!JtO9ce&1Fv=V9h)Xn?UAf%(k}eq*B)}^p}%B!Z+Q=D1$)h1V*`P
z989r_9fTS)wCywGV}S6Sz5Mc?iu1IJ>%#rv>HS{1C@i7}2S>KE8{m9Is&>IRx+80A
zbzO^0)Fn51W$|&tVBy(*+Ia_G^K-&gu=>Tt7XmOS>wiN<IomyO@A@L?Ma|nIq-=Hg
zLk41a3V&w5F<eOa);1_`m(Xl}qWS<;2nBaNA5XaH12%O~674qGod(I4Oyy}svl3C!
z(wWHfG49BE*|NFPJLTpb&h+`cm6mO<{{9CQ<?LJUMzMv&&S)wr;(#Gf$@vr`tmLa!
zJNz%s|K5P}-YYd&MU2R~%nNGK8ve*YPn&W_nrxn}JDTR(jr`K9nZ65+RL|d=qEe4l
zmYeopcps%@a-(7AQ@u<1JVdc+Z>8NYJd^|gfQ7gPMHADH7=S7nT7YRyrS*7w?hMj+
z{Z5pI<_7Kl^oGPceRB=>i6p0fX@_51-?bryq5+-xHjCC>@dP1-A=4YYPqH6lNN9xE
zo_^$rup*kz1hOoTK7r?1s9_*x0m(u}xe~<sbO`@=0il=pY+1lTpZ|<3s84l+dwR_N
z>V;R1#`eS1Ptj8EDXG{lPfc%WXm`+3M`+$FiWLYc{5mNH=nS??)IIk$ira5rw^hxN
zq>a;PkPX&TiU5>Mi|LsmCKDWTA_a9Qo((x<KK1&z=0Vv2<ndxw<}+5Hb2xQ)7jSik
zPvCu~a6{2j@AfG3gH0Q9CcB<R&REMV%F>wB2R-CW-eYMF#leSsq2hSJx=|eMgCs~v
zev<hpo5@ZMrSj$5L<1?4gW22MCXzj7#u40k1;sry(O)tGIioAWJk>$S5c1tmp~#?}
zbk~OYdjuw-2tC(Px2Dwq=+ovkR{MChzMLD=%zk<@i7fqFG6k(W2K8UG7K9R`#ceIo
zLlSk|v@|@LhccA39r@87J$G3A+<Iv)8g{aL4NBMnG$2`&$B5dP=ip2G8@bKA@i)C<
z(H%jNJ$;)pqs;C*B~Z2oW?sao`2Ns18y!$a$G<hVm*aYU3SYJHFApqPl8D6ku`!h&
zmG2z2wkte)d?^wyK5?_TX6{j7EPTjtR&bKhw&3NY%GI$gImT9K+I-2SY1c^g-f4-E
zs!0ilks1p2u-<st_4C(HVekIRE=K7Z`l9Zs+<-6iOe+Dxq95-yEQS|9i;mBvi-==!
z^(V+qi@EC2pKoF5zB)y>dPq^QEt5TjPHS%j^{u|!kMsEYmhjYVolNbiBiXR<8UO$i
znvy%1cwDZuKePYH>-SeydoZm-jQr~p$MY-y)29#(_#yp$0M=_5h*N#{wTs|zylV7&
z<Z|&rd{>k1E-vx!6%?d?3YJ8Dql-ApA;&=0tc|Ljz5uv}c+UPx2nT~^$ZF`~{6Jfr
zw#cAs;-H>SWbh#V9Yf%-XZMhRu@TN1pu}$0!)&4(#KRvYNpZUunu><#ao?p0G<$;>
z@rdwOvW8G5WkC`ONQPfRsUkuB%Tw?O*6ncBlC3VAZy(src6d!fnENHK1Qp?M0+waG
znUP*_5a=jtTc4yC_jKqsw-J2-$GEh%#1BMBA+m>Aws{cgKo;{{j33QfC>48m$T^Z~
zqJPaSL7CMn>EUnz_g@^1u4U5m5F|;UJlH_f#4Cjq7zel&X#lv{jroDz5avPBkOH_#
zDXhDN^&>~a%#M<7cT)-}ETj})dL`$N6-mWM-t68nNr<anlbrlR!#S{-?kDCTT@^X*
zdQX~nZs+|;Va@fYR3*$@$ASQf+;N{W@9akpHU-oiCyFAU=$zrhTJ;c<muAHI=gu|p
z6&5|?If-{SE<TQu*inqakJT@Zi;2TB9n9V#+xrJ4J*S5h!Kg^n22`XrfhFozM3hfq
zVagUK2XHbz$A$AAvPUccD7bVW>b_t+GvR>Keq&yg$G=-@gmpB@hA?OZ&*scH2h#|{
zc{y7S!ddux;vX*;sG{FMi~^%RR_I(WdFA79SLI{;3oRQ9Y}=$7-1E+Lx!>itTgvWz
zfh;(CevEcfq_j{eicfVLg^-Mdv#2gm-7P%+pzG;k35zz9A8&}R0+3s)k;la3^Jx%6
z7URsG@o6_VYaUZQvC)8<Z+V&)ot{!W`#J@kpxIzmqK0eClr8nVlCQ6?tjuI&`y8ER
zLuziN{q&G@D27ZyxObz%+AVtdTYzi5i2Weaku;w1@|k=^X+)c>7hxsuP8#p0yStum
zpsNQ@y-Q9bG~I~Rs*$J9c=z-Md`e9uqUaZRe|^;Rzh?5KE#Q9p<?cTEZMliY3pu&a
z+z{nIH4)4=?btkp`usw@sI~lux$vjjGE|39A^k{$t?Cegx%UF%FSl7auBx?0@Yb;M
zT~0!+mQsFSnDFm{KJGudA=fNpT;_t{{l?n?f1%&5zBWd8#)L`S^^T&e!0DoMhveBW
ztzwtakd~oP`n^M_=vW@32~xNG5ktA3Wia(pg5HN`p&+T`2fQ|M9<L+~A{^TDSRRKl
zD9>3s2;KfPa{Z<L&1ZJgT$C@TMmVGyy71BNZ>d!bA4#SZ#3XVMGFuqCn0x&}C}`mF
zeO~V&@2)Eb$y?ta@Gc|-DQ4oxBgyi$Gymuo3-E65&e_OZm5k|<8*W+7&QIMT(?*Dx
zvpvYlrMof<R{bhT=8R<JE3ED-RXvP;^iaW(;pOjVBRsO7TVBm=RcproO@!#^*-d23
zvuIbW>^R<!%7OMbeE1S;_UME){1g~2mP(!CL0tW0a2S*LVA<4m7VI~FmDyN1j$=M6
zV0N9-6@JC+(H?2ed)`UewNN?rY?5)6eW9Vf)akze^C*N#LQvOWABAMi1SB*w*rduZ
zdWm6tgQS<E36mEeBo%~^GJiSxcn_A8xvY~2IUZ1n^WhFuC5&7!yBe>d7>w!}Q_j~O
z)dR0T-ZKm>IQ`hFUH0Ki!L`>r_=o2bgEg^b6+GnJQ=lbbl6Y#%+ag|9_E&pxCv9KM
zckK4t+{S4}w2yHjM^1h^WRDYDjK~oXCc9NG*x65(mHiY6S&aA3IQ0q?$BzR_^>aX+
zoD(k1NF2@n$2$6vk0!J+VMw?K9_DvZaBxdJWcwuXZ2b8uqh|!Ewz5>{_yynZa`)H9
z#wNCjqK^&ztJ;69Lr!me$Roe5r%CJ3g=OY{z_G4~;(AqsoebutYFinUK_<l5!O^_+
zX?iDJTvyxo3Fqt8{S<;W(Tt1vFvwo->8J#K7xM0?E&)T2C1J9nnk>dd*i$iKND{(c
z>@)#K=E3inC}<G@uRUI00Z0xcY1rVDPX+_RzQbO7V6Wf-S8yzC4eaC^!W`*(g(Uf$
zi=`#*)*(PHcQGnLWK2^KC@94JBZP^Y46gWsPY;3ifaIiMQ@9cQYcyB?w40J_%lYw_
zgxuV^A-V;-u82^#@|T)|zFrHFW)9Uvz$}enDnr3cR+K1ExQ0C?lLsi_8N_rd^u8XV
zBOIn*4Lm@G8Ew(5BVVyq!(Is?{I|l5pNGF(3>DvkrNAlvR#S6N!LUwYS}3S}e;98Q
zgvprPQz(khmz1d*k{}3^nj+x`z;>?@5c3HnY*XOtNb0vkQ591pWgz>bYT&gsziOfA
zdPTpop{V#5B)5cMN&u2tvmkpjVmyfQ%X}p70u7TfNkK#`4a4g$e%P&Rh`$~Yta&e(
zfN_k|u`Hf(w{O!}cKgnPo~SWLeG-b_mJN4Yi*rnd7<<N#Zc@#^#ry&#43i-ys^e{w
zy~x2&905_l;e?huQGX&5ZuU|;V0;nj79Y35s7n*W$iVPv8pdJSRO4IR=@x&@ND`_O
zg;})GFMwqFNg@R>TS;GuGqZ32!o4I(Nng|3DN43Q*7tjInSC-7F>zRutjnT4U>v2!
zk|NUk!f^P(U#Hl+Rw;T<-dNcZsO|y~*THW@g8d)ro9#-bn1aETR;iAWsZUB%U4~QL
zwo~1~X`aGq-uh|2Ptu-8roAjp^BYcky`2^aev1`;>kkGeSWya8zk!2OA$*u<mQ=^7
zU<={&Wc~CvPtwyO)6+}SGl$c&x6|K&GxCHp3iLCIo@5k9W|Wp@ln-ZAf)PR<6kOYH
zMUsQ-SW?RY>6*EjZNr%z+nHT0neZCYUj3~8Cs~6nq;O!?=y29JIIAZzYx+sn$adDp
zC)pj~?3vQ+xtG~1!&#q7vuB30SM_snFM)WLob?AeKUvb5xJkEOW=R7OoZUG;Ti)!0
z-}MW>V?w@Lc}d~u0TO>g$P`Hqb5YFY2O~xkX#S0g(m<e}OAzqGTp}t;JL1n+mPZ|x
z$AHRXgXD9FAi$7(R@S^UUAEoa1cBUKfsx#6<{^uD`SXkU;u$oOuX1_nBb6XYltcOQ
zOSy`y++2`C_Ne@NRH1fjF0V3zzpN1YDt{4QAO|VbjN+0xFA#Swl5Wkv)0$^7Qb3@K
zy^EvREs_3ppl@x!ZT6#x8}gp}4W&^A&G5@YULT-WYoTujtLb^6dl{>%d0~Jv8|KIR
z5n=9-^P;e__sV^7rU-DGbTU{5=4V9_v*sI}!4+X%qNT@eLM)>;C?<gvdl?kpUn;_u
zl~@`S$cqq4$})-=m&zLQN@1+!Z$;G36dAg6<8A4{>UQO%(&Y^1<qh~!Bx@OoNky)5
zLi(#R^Ng|+L`D61MfXz0%t$FWZKZ;8WtX!CB@07pf^|`lDQzCCRT9c_O-yPN_RAPr
z4{(xWFkQ}I{RAoc99027EaiSxL7G${-dZ)*T9(OL0Mx8ndR2+0t>{%Q`FNiHN2F>+
zCXpeMo~RLT!0(z0Aoe||7bKH%NJLb<sP~N_p|f|4eplBfRzjjV{yOIoMygJKRE-)`
z0-@zJKg-<At0-LrGs<eAH|i)<s;~Xj;ALTm>86k}fhupoQn_#SNmF=Fu{KCjE_>gr
z79i9ICsxZ})G{Sh!G6?cL+aSh8^}hhQDqGZE|n-h!H}goCuseB6_nHin&D!4EV)tX
z6xFJt*pxgXpolosWKi{MwD{aWrQB#W+Q9m%+3uoFsl3r;q}t7;Oje{t!J-8-D(mF{
zKGUX84+SOTK+E0a5o@j>8EBCeXd}V)jke6&XjWI1<_L@CXwfzXgSME9GWTe~>hiiA
z=>m(h=C<;L?w_q!L|qdjn^;D_#T{FFo5s+Op{~27--5yQRm<sgRg*;<by-LA=llf~
zwt2QT&7(G4rr^enj;mmrOH)M$FW3g4>rk}oXp{mA=-7^y>{98}G^to=>+lvK)MfK_
zc8InoJ?ZT9qkz5b0>^X_OsRHN7+#IS0$mVYl9Ws_IF>A&UN1$m0R0xAhtrb&1l}|I
zxmy$43E_KVAzaoo(*-1c!v5mI6_T~-lJfpNn_7a52(WD~$33aL<52pOZbS&Tq>fGB
z*E=-c-Q*j0Xkxm_-Qh$jug{?xtkg~~Qr0a}*K=J}Oq8m(N3*vtzu(MtK(n^@_;>GJ
z>)h<Nfh%qq?sh&kZ<s4m#4kZ)ALAS4IiQd2wH$jRGS;Io)~&ES81B!IV@zdc1F}zo
zhQPu0Utu?cKnBKw%fz<LTw_yt?krWrYU>AEZUhm_v;=T6;07aZ5|aLI_1jg9R9T|g
z@d)nQR1Q;AIUdSSoWMnlFqLV#4g4^WcFdz4+?8N`$KR&-7nJjxZz<L2B-QwIyKbl_
zbEGwB){cB50iul-%mK3I=Q(Cy4!CxMN-_McQ>{PsBwQ1Wi@f`1s3s4^Ca+|KBBkEn
z5}*$8;5_Fhw;|^`LQJs9PFMxeT;c@ia4<jPR{f)iUprGU>ggM%lk;PICR4B?4Cu@X
zqz8v7)$*y)PW7lx(I<}A-cu+xf$X^s(D^fL8JJlq@Jq%bq+{s?*%{8^JxP}Ihwz>>
z18&-zI5Siax9cne4#sn{3GrH-?lsKYirfIswsjz1R!!)An=kwe)n{2f<sdh)oMaty
zMB(ZI%RQ?1OYodn?pC`TFp+{0|4(T4P`hWdwp5oR@zx}~eb2KIuddU7{wS{L%249a
zSCk9WaqTNOggRJJ;FqYd-Q>wN<00K%j!6UbdGn1mU{|ZYe&RFij_XOca!4-fYz=H{
zH5!Hjd3z`uxGA0_n52!sXg?1dSb3hkfyv3+V)|f=X%OnyJ-w<7ZvNs}NeL3o1#}*)
z){Sj#jDBQgS&KM>kEI`nD{8URa9b*v0J{E;O)hl9Oqm>0Drb)x=F4ipkOeA^7#e$8
zaAGcOcNbQM1f5C3aCd3S$CqxW!dU$28T|>k*oE%inBfe68)i4~WiHHw37ns8t1@pp
z-n~FQVO!_`-cV(JsSS#eY~qVFW&VIqR;6q?pn?2`h9RLZO`)Zd&~EOh!H3WoNlIhf
zKNYc|bg&{MD3#bAyJp?L3zOgkcXh+K=2z8Y!=S5o3jg+%CM@q`$h_Ou)owXQ`%@Q6
zLRFuFe+AhHH`-kPW5XtIE8-wQJI}gd44tt8-BY2Ti+w!yP~@B$+`slspJTN)ZzyJG
zC_!vE#dSC%bvV;<wbXN!Zkp<eGle}Z%&1?K(eumM?$#*NSmzF1vMQ~BCvEo;)Y3{I
zK#)%MHlO05<G2-hT>>;ehCv-cpc$8Z;D8kQ#Z7*W`B4_Yd#{_q?*JtgyeWbui@}g#
zttj-bGc?~EF~)*IBpvKi*EcZU@?rNBa1_1boc}b}=5C^J#M)k}Jz7||33O(H`jS+%
zkk;Bj2HKWSmYCqYKH<O?4RZfO;VJLv%jhsT;o$eoew>@!8$e|VuX1^`Qhf;Bu>ng-
zLnj76_dG`EZhtT18Rg1@Hu#UWRD5g~+wNxHDv{cvou;z28k1-osP91E&_={wZ3)1h
z;C9CI@?g=^%xO6S4alWTdzYViEYk7szw>+)e@b48{92q0nMk!))j;&AA-t_Xt<_-q
zi#rc>Ko4vf-qr~1#S;GM!kycLC0bFm=K5|@-PMEt{>pQ!zWO7&hOT;k=+QfV?e)zy
zojq3Z5sk6me{7tuFwSKI&QDt1s_)5$R0~+<qUZwXT_+s$lOZevpxHan>pAxJ4F{#D
z@d)b&ixuO`>@Z>2M7P`ORyJ*EF7>o5qLmI7!cA_ac_iq5-o-GskC!<+;J{nc_QrV1
z_Hd@=uUzF)zmH>BvLZGHf3U6IS1P(_cR!(%qDX~vb-|rW=a28#plK81-5x>@f!y6|
zb4m;+<FKcKNi2hI^fOkq{gRZ=yhVy!Xz39rk=806fp=E^xZ&lWRyaJ>e&@K|Sf4Ys
zNQ(t^n$rit2m()YpaA^vI}M{2iu26DqD7SEIE^|H75&;5ZgPnbQE-{h3cVWB<C7hI
zr!IWROFr{P`dybFqi|=4zGw0fc6?K{K7aDDx;RX~M#+rE>1MumET?wHoo$o%hS}<&
ztapFhDZ5+ws6XSb%S<XIwg&&b%2MM-;t{!~bk$Fkk!<DIuR$2tqUqP>T$F-C%tsGW
z1)8xUyUFg(tE+QcelPn%J<`!ozHe36@_I~u3!|P>>#s|7J<I<!=*FFQht%{9XXJyr
zPc2toaym;!21<cp4*hjsCD@sskPaR{+}^MM@?e9vjeWw4$}q5haZ5Cm?5)P~UmcpP
zg4lz%ekTD01*j~1`nYhM7uFuGRlF{BejF=YETNd`LdEg4A>#JB7}}=jSd=``p9;mB
zQ`N&7Es)m8>hwO?_0<sE{4%eo>jj0#rr=<h4RHxogG@>bq03*RMQ5Z{Q+nK7ZO471
zdCexy|5<W=>X&)el1l7q6cjA3H8cILDJroi>cLpGbF$Q;<huGNWs{`gi{_f17=>pU
zwp8NG*qgP{P6Z=${EG*LHC_XfwlU_H!%49Ut5Sv#@d~=+F}>p_yK+S&bvAK+Uk?ul
zgB@yYsIVc)bzHGAzbIR@yivR++sEmoU>#bvSg7b;COYaDbD}0h>oQSLHE_Umq&@g3
zkseG?WSNde1lFUz#wzGE#N#fdGd6ORDvWImeFls*8AQeXr3T*Ib4^51x+K*Xdz{zj
zSE*GjuE(Cs->k84?;=;Q^c)muvZOr&|IGEti_*RJkfQBJPWT7Z5zkAWAeWD@;JTB%
zfYVSRF07IEZfU??zuQCK{ZNS2@qF@-T4~0o0+n!B#<efmw9BP!$UVA4&Yv_vFSvd5
zm-*l9(W{rdd#>~6dp2~s?K>;Yc)yZk_Vdja$9I8((=lo!c#^RS<T<s|+X;TVI3<HP
zh(b|h>%g{BhS~^ic~kaMS!~vyof5B#fd-elNgWlph6M+U(idxX2b=|;|4?$omfO62
zO6WM*Y;*4-P^fy~D6h49^ulyiJ^Ps)+dT)l!d1P7uNAj@jY<rvdXFo7C$`6GP^$S%
z>t5^dnKjZ?^Zoe0P*KO?j%T0U2i2ahJpbPD{7WFE`U`ycwaypo@w)0SH_{wCUw(fV
zuKsGfxVZDx&#FOnzul(qoqqdWlp6krgV(zJe@*IYy#Br5*!BA4OSneB+4thEfQ$V>
zjljPr-@5_{1WGFaxgzqvP*LIztNaue7GgyvpooIpn+js;v!ak|M$tT*3g#lS25Bp5
z(xy&@T+_0K+-=rmY@7=HpQz~kRG31aHH~jGn)A<8xCVjD=Kn`U1OCjuBak^E$(4<R
z80T^+wVgB>T8+cx=kj2oPFe!Wx1;XO<umm=>BzO-j(av&z(xK<Pn-CIO`R*erv3kI
zR8;o=6ctq{1p@zHLYn+MTmpQ&!UBBPg#|@LM5M2a$V-V!%g8CqNvkW#si>%Gsw$#2
zHE(DmO$@Ye+%&p(OJBky-rU5{^v<0}_l#xD5{bIzLkkN#i@PchQ;4+YV_RoiTU$5V
zhySKE^&GN@v?kHjG<3-(qMFa$9RBTUj(f`7^CC9aI(vEh{M*tbDw>neRi3?k9s0^^
z>Xo|9>+<Q>=;*-b|MoNgjc48uQFIF_4-F073so}@Q^khGCx^WzvYAgK8i;15S7fbs
zB$CKx{@cuqii#<ULR-gZr^f`_$Lase%)I$3zBVTz{9k6K;lIpGli1{(Psw&}DJDcM
zvmhnf<6mHAO4|L;X-^K{T7FJ<^~taxf|)O}9uu|9%&eTSZ0pMGWTKh5oMXS7<9(Q8
z|1U7pVI}ujO<rn#e*RIuOG-g|P@(H;p?})@-p2QtVa1+n#hCTt*T0H=qDp<!OZ!_(
zbN*2@D_&MqR2*0M|6d5r<mx~op;=ZFv{4gFR5WYq8vE*s-`0ozo6scsnUzf=|I^Qm
zBjTBxtyzWb$$#2YYC2{+J3EPZW^vcslCHN^T}%IkXa2!um-l4#_4QTt=l$EytQjcy
zH=+5H7zY}jYaA*4?~3NX3C+=oIU=FiF<FC~Zs?!>{$Gmb*>uC~>}>yBE0NHgnfv@7
zMe}3(;e7AVLg(2+_wZuZe}^=Qist9#FGNU_sA$ftj{KLR`5QmCwEk=9+uWCLdz%}Z
z7aQ|mH+Q!-H~(xdt$ts;{JyxceR#gT`t`@kj~_oye&9EE@Mk;g+j|>l`&<7{kmmW>
z9|C~@AU=x`0Dr;kdeynOU=W>%<xq8AZ#bOKAWN?%zdxE;#(8<DreH9h8y&^2Ut2hw
zEM!_{Ib2&bnkH#GlBHkwemqmr`^WNdUGd~QWH5xopuS|fKrdP3;YfYyY_V~HLAF6d
z*~fCTI_H&<hVq3ftKKM%8;up8>YQfF9*#Cves1zuAIZMa^kJp##jhVLqfJ#`x-g_r
z&YR8E_}&OQ(MMy=HS2>3d^d7#w$yHnzLjxV9c!ukKADS-<}_@r-<~ZoEq^rL+VFFs
z+IBR@u&r_TbF=r))$z8b{V(0YP_A3;&4=ql|7Vcq?BV|gX$m0#6hdnlGKkrKAWd8P
zt+imle;~~%`u`4TF80t6Ax#@P!M(K}8tMNVq{&B3gf!P_4F4CTd8OBzBt10M6D-du
zypb|GZq}ECoSGs@Mc$O^XI4S#Z@jf*RN#w+>pa-ZaQ*t8JcA`8*CEqqetSt?O#V|L
zn73rg4r5rx9Rz;$W0(Ss4>2{7owlksl)Z@1GLnsAouiQ`C^St{O?h7*D_W=3iYR{b
z^w?1L^p1~n*|WyhbeQY`fp;p?8B`xjrLI>G!+eh6hhhF&Y6XLOBECg|kj#By7?op@
z8A0BgiEuSn*V^04))Xb7CCn(%>$=E@H3O{z_AR64_13aId-Wj^V-@Mep;4;VBV}53
z?YAz|)%{^UuC-)`B)N>Ps`|ZptAfYx1=!@aNZ8z?kP$jyZ#!MY5K=Z8)N=0aIq)+~
z^-~t}u1HWFd29~_cPu1iQta6sHdoms5E{h2oy!YW&8)W8FTBv}@t7(IDFCtUos&*Z
z*Ma!JBc#;PBhw{R$6jNZWIv6RqhhQn#mP#?ycS*cNUnF20)r}$?e*NG>Zf|rBl4In
zYwAz7(0ZduBPhWxmVfU@g;W2Kk7307Au0>4k5{gI`VAE`d|;6e)zj`8NqYIek=Lbn
z;#tLG@J5?&j!a~xb@<e#R_#@OUYB^rE<Pocq-7i45UbG%E|23QRpEZq%B!!uYxlJM
zJKi-vjH7mBJrpFZR~vtjan2V%5~Ub@KCK_U^Y>9|?hFk&Q|M?6Er`Buj39~QHEtxm
zD2Tv(4jH|MF*JjTsRC9dG(R4^NWysNCRl^@e6BF>K=oE?gh;^i9caSEB?1S?Gvpqm
z1yTcm(t#nt$i1>$&~kV@575an2@WKA%^mdMl+Rk2${2c(M+rS&*O0z5r$9yqN&`mx
z18E`%^0&(bBf4pbkfzY7LJ8n*We5o?Q$1N>&>a@|D+PLED8)iCARWW`ot8<O!j1$+
z<Mb~`b7}(xBpEWldCaxmNrW`*qAAE!^_p|9fx`={xY<mB(pLpUNYj=QsW%vC&aDB^
z*F;zs;uLI3G!VzZk*<1_7g|kXEZnwHFX@M>oz`NQpROlFT7KI~5Qu*O$P34^+r9fE
zHGqH=Xfx641(SRWig_(*K4kTd>Jo87a}Vt%4Ij9)tR7)#JP4gW(xppcp+RZ$ao}xw
z6=s0BRiVNUR4msH$Y$cDVywMM^uxj0#vymyV$we|&#6n6>NA{^rjO7AWr`JvkmiB@
zz1}38paT)o{Q5O>$~EsFNb~*_@x|rm=9V3%PT`X^R|tkv`W!dlexykaFrZXZ_z$GX
zN`e|tNO(xHW%UoF>CCM552X2_IvB_n+2|ofgfvgz2&5~jJ8ei<CLHTVSCB{0YTFVa
zP0D{knop^a$kTKUrwpY>DCqlVW|^q`yl~Nx^|Yw64fST{5f8($U=sa2CbAw)CfZvF
zgb%)_cIajx=qA|(=-M#NO#Fiw6o&Fgcy3nW?P&x<hVGlUND=Z%4p2yJZ_i5L`T0VJ
z=T0rbr3BfDE50;*M)wF#PpU94<%1_hUeEkt8|yr?MCc3+1)5+(JftcZw@}<d)W%(m
zyt7!b8)Vn@o<g${X_$_MgJQL;n9Frw0CL~J`QL-rv=X``wdHQkdu@w_$)S$qPg(#`
z<zR1L%MJ180e~CU;sSYL0sVEMT`9(>jp;`l%6xU?`aGm`r(+>`^`M}cauBoN7h=Mm
z6Ym<KdMrtCZ+tR|Q-!xHC3R(Y6V^>u%6w5KFZNt+F@|^TfvhmIx%^0hwhEkq<|Thn
zOD$vlhs7!(F3_D_uZ2eBqtW!R?Re3spWf!|uBa%{gxCl2PI)6+*gdutY{+QnNAe0|
ziS$*mO(Qqt;^6Db2I})6TQe&9vhl@F&Bwf?1P^>Q8Kwts7l?fM>a_vGh1ak;YvGU1
z_EY<h9(p$sst;)MdJ^hqtb;hFNQtH<<+~l$$_t{YIq7f8<szI%|1VQhPr1zTU#4bW
zXO%k9)co|<Y}&%*xZu9(SKjFEhgpy8S@Pu8%nMw&tfQE|bH11)XI!eyXGm!X5RSR$
zr!+LBenT;=FsSUI9Map3^77U=Jh`;H<MWH_Di_P~+9Wo5r*9uuBBSkpKK=BGF#K5d
zoGI6M$voI73DuJ5x5t%lWBlwza%X?G1oa<Mt{@XE(EIHE7O*6tON$XhqwV2ExJxm?
zkS$5!fHW{dl{h0yFIf45rFLx11PPK>T&Ra|Ptx0IFs59eI$!4(gwwAq;hRm)9o8xZ
zmK#$$zR~@@*53r1a*!a=OoBPti|X6kpGMw{8?x<|MGJ5warY^(i{<)`_R_inGSTO^
zbK6#E%cGWbBi_IKdBzd7qTs7g9rELcdu$MeAT#NOpjkKHkv>I-iOQ8Ze|bQr738{#
zO07sJ)%Ogm2Q9~xB3aRQ4gX5p{14vlJ)Y@5{vZBM*lcEVKASn8=PbwBC<&pH5OY4{
zu#i;BnDcSypp=}7kVYyZnJppb6bX$a3K3}}u6@40>-t^S?YiBrf3JUb+n?|E`}RKU
z{o3>KxI2-q&n4kcTiwFLWhMg|>I3-0^Pe)L_=a&yNp8Znzp3TkXX0Q@g7^Pq3X~K*
zfj;x@eE|;;F6Fy2Jbq!m^e^@Izif@inLb8at%L}$!y&___htH}cTNq8LopD}`b_Y;
z=SjiD{ZpGR5J`-iKvQj*>ObGi(83Ue4hw48^0nz^)V#2NMp&k3bZBzt3g#EZ8KjrU
zJCewsBv_T^XA+qB=1^jN5Nf{~6{CNY$M-)`6ET75`G68rL(9e|@r@usrl>Vs^4x`F
z?{eN`0>%y_Sm*-rKp{WVlffX!_e$XnUdy9yb{6YL+!|pZ)&(`wl*V&jU^j?mGt6Tc
z;=$%=ry;}Gc)+NhRU^!tZR|w;Pt@GTiauc*PaRD0Ta;pmVvY?X)9o;LuBf?5b}&vO
zOQbuwrtK&Rww%DI;Na*Y&nUI@tDJOVIgbu5gK7%qikfja{?+SVSD+brTu2jtE(4it
zOLNb>Q7lsEj=2{9AEarmAlQY<sxZy!>U1mpe?giO*-fU|&F<OHOeK~`|B0GN2{f`r
zuu~!@<$d;|a874@c8|S64cXd>lqCs-*ao4vLjrsXxb;&Z;4aD$0(x8wgDB2nb45+O
zS|#daNio_AmCMuU2lLGZ7a&V8!Jz9#yp6fS!2Dk=uuX})U5;F#3b>svSji?lk9Efn
z>r&PtUVRn(z~)hLfn0b8;i8)Qow%hMLnjg_|EBNOHCo4O<I|&<aju^g6#Vc#sQQ@_
zho<cLt>D#DLH#lwU;R_Ou7%%DLbUg3$Oa5JT~#68FT`UaziJ)H=lY+kX{&xs*){eU
zIrJw4s?%w|aS*3ib$sNDF*n@AWi7>FP!$&)EDb451V6!De>-OtsR+~7F9f+39%S(@
zgAW^Gz{_6<K?evb{;=6meTZw}+d1&Ju@H47Gt*F*Q^mFG=fKq%R38A090BCuQ8{G*
z;WZ!#cnhHiO2DBf%MhrMTaOnJal=@?CwjDNgh3ag<`ew-*r6qwhI!d_Z0B|6m|#O0
zulA_gNY(AIN}i1mhtyd&_Bw;w3bopzal8RK?XCDWtoHthWkjgX+fhx>J4hDI>#-d;
ztCMg)xtIn7D`HR<`|M%?S0v8}pb?K+=tarXZwVzqOaSP$k6G{1&9!U=AHbY?hB4kT
z=7SgzE!F{M=xA<RvbUxZK8$&xuDu(|_uSy%2W)WH;XBH=qMsRS4YCCVE}6Gs&EA0S
zGS%;50SEV8A;>VkDO<4WZOY7&L^TNj0s^y7BP}SP(j`IrG6Z)fzj3%2S0(^17XXwA
zEG$*xHBg3Om7sFLKnh5JUCM*zlLvqodij=?1lPBbCKS+Dm-~$_yoxBq9_c=);J)YN
z{kjQ3oiY#wb&}bvr%%41;Sv(J2Gb^K>!7NgMg`A*#PEJs8tJr>EQ)TY>z%(;y~kE9
z!D$Kahv{gI8DZBvj}QcN4_3#$fVH`4%6k-HZ)?1AgS4Z}?09K-l)p9?*d+5$0xEX^
zK#NW&?z<pr7+_BUCafWgF_k%?KmZ9S=7Magt=k)}eJoWcK>_BFfG%dJ9KbCc0Juj1
z1^y4PsmN_rAOR&%j|6Zai!#87*`qy|N8`62eR`4Aj<PWv)^z5z{L&<dJ_af1g3l7b
zue;z0$qK^YToWa=Wq)l6A^&wL^(VvF^Sux2pB+*;6>#G^p%U<z0Lj6YJ$#-<-=k~Q
zV_^wgU=xElItN;cuBGXLOk8+oFY<#>d<nyVY#8taTQCRnV2=dMZmk0ByPym;QEGKf
zTG>sYky74u;9MA>5A$g3(zOkBlo}lfQUKU#HoVWOT;I-mGZCOYPidcsK5_$vgdUvV
z%wDX_1{XY)^iBM%)|4|+FNV6M>B$@U;}(is2`+eIoc+Xz8zu1Mar`0pjH{NSZZ&1W
z4%P{}mNbt@@$Ic40WL_YXUj43Y-z<iA^!txx_Tmc0aZUqrRUB*2itIYI>F+))~{rK
zfzB!by&mM-v{#0}^?@zQ1m#gr&(WW!*9n^7xWHyx(~-7kn%RF*NS0}<a1-#`cfoUI
zfG4+0?;b&kkpMRiKQe{C1QoQuHGcx41M!}ypSb^w&3F4!a1aS_g4`;A1M+rqE0F=O
zz6;JB=~&3__;I*>vrhhSEBa4K3*7hGz022l7_UaZzdEAP31+<F)*ahsfHJZ>5niHT
zeMgKaW(1S@6ic{+#n76a_h{Vyy8kgY*O8E^PNiiL!EoedHJu?0#)E{s48aU_GO!fB
z1-kP>*=2wqY=MMPo?_xam<1GzV8OEWVjWCi*~_qQ;H(sWFrC{m_&Y2&i`U0xShJw6
zqjz5abA9bK_1ZRvFR$vgU%h-Gp1A-(gdh+$?E;_Juf28=p;O&9i0(t&My_@_yhRkA
z{>G-BM|-)O&<?Zj=e=AHO4ee<qb^?9Z}0h1@CJ)#g(G?h3HojpkaP>yiVMWOzvs@f
zY@QZthW(}t#r@>z#PN8L9sGyk$2xgyWmq+I*bD%n4MBY1y0T?F#7<sfc&}ak<sU()
z)iNZjUr<Odc?Z`8J15AhNB$Y^9oCY%r^TvqfwYGsLzTc;07y8!OWy_hc^9F9d*e^x
zB9ve&5^S#u+EB(MEWfpDKcqzDjacJLEc*}Jv?Zag;bBM{#MUm)ZPWl{MRFw^xp9yc
zP96xI=U;GvdeFO&xqNn*!Fd_hHLga=23JnKy=lQ}%|r#@kRs(nyyb%32s9lx%riZD
z8_j}Qvf#3;(0vgWDq=)UW<&+WT1Xjr?)WaAt~|3gC?A1r7)FlXL@8>c#_@=3vOqZi
z4w{8$uR&QD)QdH~Y&v3R8JWKZ-5wVFrzHSl2wr2q&nI8orSVhg2uS0oj_mjiy#a#7
zyNTT%LD`Wn7H|y!{|s5btc+kY1wuv$jFffHxJ1}mvffnaVx30!0B{F7^xzuw6kD)}
z%*&)h@2~}{)_BJ02v*rp02zJ}{~xxQPMO@pPd><<Okd+0$Mb%~p~%|fEwYlavaGkG
zpc&Lrn|dgET2-6WePw~iANS_7F>mLvk`4eOr_GXN-OSfU(dp1HG@iXO$R9jpbszQd
z?v?+v&7CQMJq&zr`D6W=nQu<89XzDG3|<}aN$c*XtpSO=ezg(Y>p6=tV*6*?WdT4W
z@)P@Wnydhx-1BY#bwu_f9fwS$Pmhzi5-9BMBgld_N@Ydx`5F{t!~f&ukjx%*0}uHR
z+r-U$IP>|>^jtcS^?|N*r0eq+tzI>)FEuEZG;!KN;3IvFjUJq~MG3yeL-xXlhVBST
z&&<lp&4C#6K5Y1-+#$`?xs#C+c7W+f3%0S&bUXkpu=fSkF}=42wH@ZAqh|l$`5eeR
ztJ-tVaWMIrg@0=^M|Hk^{Ks?J1-^OZ>s2d>*aU)RxXlk*mtKF@kA1rH4+<0h3<<)5
zf1nnz!x>;3-chpPPy%Y3gxaQ!iWDsEQkJSZ=MufYUq%z@%9(sZ40ItC;HD|1#r*PX
zv2KhZcn%st`$4-R)Is|Z68ZiA1!?wmEceeW5AH1w%dL!Bt&DlEe7L$YQMxkOu`)HY
zGPAeBmRsc_ne*POS2OJFRCQ{vHipfA$CA~s%?#|?+%GwdBtk7$1k*rYJ!rbr5Gk>t
z!~D~5Y5OW+cV-pnxB3CdDvX3t^G>K~VbUA4b+j<%7C!;6NFV}JMG3qxye62hg_g$%
z=dY&}Fr|H%lwa$hxit`II&F}_zwaaKI`!3lDlpY`!#I&;YAs>*YQt`7!$45hT5z){
z{FiF}_(AzidtC{;SDWJ2o9{-HT#m8`KQ|qGeoIVmCarHCN&M~hS;oVfg=bGt3%>g6
zvI6tJdX#RRmERh6?GBY^W$OJQ<VeIF{X;&wdD`c<2a5X|$eVa)D=|tUIqFa9t3QLY
zzwv@w6b2`E=y(3-KPP^2vZ7>YQ5!dYir;#?UAQlP_w(11#BC;er_f?2!FQ*6fBVkS
zZI}F=DnXeB0Dl8}_=NSM?q1IjZmZ?q#*3l9bZ$BG2o@c&>45?N?Nm#j<);Z1wFzzx
zk#~ECz9cbrai@2Ob^rD0?)L4^Cf5dc8|N{vt%@IzC^DB{{4yl|)tY0Rw>R}l!cdVw
z*5BV0RMp<yjqG3i{c3;r^M8;g_J2c~>&5;P!?VPU1uf+&_mMff97&_d`S^3bwltJ#
zoYLvhGK5iB#kT*)(XU5}^#TX~KOxN|2mOy@5Ahgmvjtqz6<&iq%7rv1MHNwp@m?oV
z7ag*d<h{9&=2@Y7_a?!CiU`kBDTu=kzgNG08vp6jnZzTg;>8JWuE(zB<bIl1|I)1(
zn4n}X1P$oFWfZkAb>PX3HV+x9*tw4zp<@qE+~d_I#`=#wI5mXa-|iQZOVXd0T$uj!
z=YK((g9e&jlf7pTi84%;Vlc<AAFcM5{bew9;eNUdXL9Gl8oTk^46^AmXKARSPi<!A
z-(}AF*CE~h<GefHpAXF5(ipuXCV7V$g$ErwcGU0)B%tSdYI8;d9;!IDjL+m&i8J=)
zt_^qA{Hpj#L=i>K*$Q1QI)s6nY%brLQY*1f3+_91?x2){pR2}FX{b}T)a5(t-Fy8b
zuIBPbW4<<AclZy|EQu{V{6I~!(BOAjG>@5F^;k5XTUdO!QJbknf7`akadXg901q%#
zKgDi1nSNP5B7oL99Aj_<l%V(8{I8>+;VG5Efun@|aOdHDf<lSCz=8iDO?$<_!@TGw
zM-io^<@VTj^Ab<49dj|-Fg)Jm9&ps{_^}h`-~WMNf1hyozkdFM6_4NVlU_0J&+DEF
z{r&qCi7IMr<axnp%RQjz`onQw|A^OVXE01Z4_B$lKo70j)7nLHhS>p=2MmRky*z{u
zvt+dNLr;G2yMF%9nRwU0xHB&K4*>waiYv>>{Ggulaz~8}0Oh2y0o5zr4@xTOkFLQ3
zp@!MBN%P@qrVZ5VZ#%&;egHgBYf<^>bo>$H?Rn*Iq6bFEY9aVD0}`BZ1y|@y_?L|4
zX|1#jgOcKBQ2>04#+@R~Ny+@7GZ&8)y2kB<)?^>M7`ktL48`_K*Jt<%UK!XvNh8Y?
zZkOL~4C=W>m3;OAVPFgUbf-enOr_ACWE?EsHgKz?oGirXx{-4EgL&a|KE9=IC;MGK
z-3eRhte8v-U+T*7mk~<Id?w9*X^}Q({7t-P0Ilrd3dm<6?hY*djcWQvqkKs-RVzDN
z`!C!qY$|5_-{Xg8#SIoQa+4}x02T+JM0F`#1p<`F56T-upS6}Bu<Abb4FhoR1Ooae
zm|S&pt&=Lzzcj~HH$&`EfaQg<<e~pjH?OU_ubl)yZz%|>neGCmxqoi(suin=kY4_}
zMTLPy0KjVxk{0v;7Z>P2J^(&xeFdoW8UA^n(-#cpGfV-g<M?>&@jw8S4MhA+-CeA1
zc9g&a`oB<!wF;ET?ZG(g#2LXW9A?F)bGk<s1VDI$s$<lXJ_@HSLhyt%ZU8bcTLxgy
zfde4A!T@^GR9-=*42}&v(8Jj4M?-!av4B#f9-Wkv1is^nGU7BmF@6Ds)WU=hF3!w0
zo0!RT>3LWJ@Jiu83ObxADelr~LYJ`U)`P%-n*hm;8&7e0jX5F+1>!+>0w92$y+W;&
zS*m#s4xsp!8oc4r$FV%tQ5jFF0<}Z2w(dI_v{Zk4ko_7BZdj%u=?>ToGJd^O4hL8k
z-{ABYfIzk>*Ml7uiDLT_k0eBj@}-K!AS-I7Bfv6vupvNKILJ0_Ej#~AfDFKo!V{};
z><k=(M*yl@O`OjqeDPPEBE3POvS=wHWB{`k2(Sr%QUai<65S=iz<GVA=T8Fdv|pHe
zIb1sk_mUyDaA-!8dVp>vPkqa7;I-&7PZ^Yo?SssN>EV^7`tPv-4Vs%^0#)HctUa#;
zDvxJV7;Ej{BefBnmX@JQiTYH*o9Jr<h{s2i#PmD~C!a95q*I0{=){+|v}(_Y+&>^|
zV|4mfa#&cbgUHJe&*`wHoZ9n5qihyY36+!{&<VgUR~@M8L22l-5P+IH#HI^JEjoTF
z;GEonmoR|+hzKyiF@qc76*~dg#VXkj_@I>Fc3P7p`gu!#{pSUieV0TYo|~okNfv^6
za4A>31A7*fN+#2)NRJmL=BzDG6I&Zj+=x<+Joj02oPBUHQ!q)jIZkiz`)juNM{1SN
zF;aF{ngRM5sn|e>mgKXW3{!Yw2h_l1`9tUY4&VTBr;a##hCIs!rBocSAW<B{{gJ<O
zf#7hPHaLKiTN2o*V{4PdWAU>ih@Q$5;VJ;Wa|(r6^HI8lf1zbO53Cij6DD?f|Iyg+
z)USGUpytx&-PLiK%$^EKBp$#X6o20P2<@4B*<YrbztvD>7-SSO@dbzh`YI}2fvYlH
zu=~d-b)t4)2#4}7a1IC(>CDg9!>t%8T|ONNg`ocmKtXH(hF%F!?V)`y_>d2P;(2uz
z5OcsXz<eJISR($&k+hwhEt~>?6ys@Lrzx-NyE~zzw4*24b%0?^F^_4``_nD}_l!>_
zSkxi8KRw+C7GkSso4+`INr!--gg8mR>~EnBqO!01b=+2H{=<0+uW-@<wMi4Tl+MI+
z=XmP|W)WV`T{~*!;!Zfp3VE0Zh%X>|AIblM$EeJKAkerP<>t_%!JeO#K~JADHUv=J
z!tReUZ29dUG6ett@XgJ*6#C1E_&4TO(~&0ew(H-0zLo*x==XkN6@FZ5yWFz>OC_E$
zOZ-Vu^_qpt54Q>Iku%`Dvxw^W*V=hf>4&_&NFVKE>8{?g)S>|49A%<?C#7KDogjq2
z2nMW5px7n^hQ%`y*SOdT3qqnX__Ypn3Y<i1ZnFpS=+KgV`jcQxW3X^S1QMo%2S458
z`0Edzs}KICD);yWgP%-U5ZD0lpsKS(xT<Kgi4JVy5m64e1l8^Y=msYPJFfx<$#}pL
ze7sYtIKY!~7jSh3{HLrXn<3t&z?NoTZd)y`JA39=(PP-S{Nr1;(6YREt-m?*-Vqrx
zWh(+7J*U3O6@H&RW3XUF8O5&uK542bH2Vtx&>`pe6qk!m9oesZgDB&qr7*b`C!kF?
zsx;}C_x9UYnO`-%b1k?Qr}_jh?-{YoBZq!SD3S4Ctjn+dD66=;g1yG}|5=<AfA<WE
zB)*IS#jlD>aw*Q*zi@#uA5i#NYawNF<4~Q3KnQ>@gW~pyXXFzPk4OhJ0|2AQ2xS1;
zV98LZxJn2G(gI)$*F$?$kT@_8=YCkcHP0|**)JJNqBLjUI7w3Cjek7$Rti@0ijRG#
zRv!SWkkdJv0RS7uu;qX*H^DnEPsU5|kO2nz=`v6NuW3hjhQ&fQ;ZclLR@=?BMsuiv
zf$@_HF{!dIp<SZy+SBP}=W6-k`T!o9LJTHpU)!P-Jdx&aig_js=$lN1p!ByNQUDGZ
zJ`A83hEK~-&=tYKCfWcv*2x|ULl_|VwshbV?}&Mt2p8pSA>w2-G|c5d#pbIFo0So<
zIR(Jxt+tai1s(|t!EBo}3VpNSUST%WSjk|tsGP4;N()5+0f2Xxh(KW;>k@MwC<S6_
zH|_`JQL|E2f~#F41dW+$1hg31)<*TDXf*?^scHgHI=qJ06$ii}Ug;@W)7$}W$7Ij@
z5_M{Mn@hkb7n8>d6hD4C@JXuW1hay0Fb2R%Ku|<DX*wvnj0+3YLqXtd-mBXRe&Ut!
zs&JW1O*KsCMNzJ58UQI}`%qy(J{RSLrYB`49k6c;D`-1|R}k_jJ9Er#rpsof@<m#i
zs*!(&rKubk1H9`&Y%&K_MFV6kD3eFpB>HS36Efm9838F7f#C<Mv|56_Oa)ABdFV-D
z6#C~91)qM3y@+g70F*r6u8)A#9lj?LFJ~-6zw8TIXf&6c)Er?NUEZ}xfUqJh0BM{z
zKw-;_GQh!bsBwL{zX(tKZTZb!oZ~VurqU3IFTW+J1#J<x7wUBtu>@vl$KZP-B)a(P
z`JaJXw$0@@Fjj^VKx_E0sAHSq6pyL_Kq&=E(CDs6$f$I5n3#HY->U^<YPWLEo{z%=
zYytSRQyc;^_Q(Go)SK^X=>+kbmO?l@#wkjCP|5+Cyxt`WUyb63=CfyBl;_9WdLe);
z^+zvcERXiRHSS_~vg(#y6_yeJZ@8!8<YPh~04PyBcAE+y1EQ54J-w#DXMglH;qXf!
za0gA1pk^3aVBazric(J%4Jq1hD?itziEzU_3DB6!uRp{N%x60ZoIi+e8O|W{3TCH(
zyFg=OPBT*jU{gvMISnl2yzURxug@Z5#9e7+a_-JE|KXgxB7Nnee{C*=L4z?$LVcyn
z?bZ1?k4~;V0UjYfJ#5szNsp~)Qt5+$LaL1YdbbRp+f#<(j=!AT0I0$xjqjL?D%~Vw
zwD+&|r-Xdu6*8h!pS>UG_UyJH-}XnHvkaTNyF8M8kk(_m@AbgfW7`1kM+J@2$ERHE
zj2b>7TFyWz+^h62mQvh5FkRmVc3=WE9^j5Ej5lF;;wj&SN&zmETpM`<5|M`nkkpXZ
zR0bqlboX+7PBMkx9)OsjHh+;j@RtZA1EBUP{<Lx~(Ft^WnRJeeK2zQk%6T$g;g!st
zjnb2R0fHIaO0?trLQ*=ZM{Q^dl}Fl6;!MD#Qs5+yfxWpvCj}hx@Vl#m@uhm`8YQ&o
ztw2`)>&9+GMiQKRI)_kr07(+$Cirk~O}$L3KS=Z!1u;A_w%uzQF<^V<_<mMI-N8pD
z!MM_w1{8ElIkd9^fl39iDUK*hUQr5Q_(ngI@oa<QBm(#xopGZ;;rtmUQ0Vp5=*C>_
z0|v#+Tj9!JH2^HbzBm*h(|<CSVe>cJF)f5Adb2my%)^KZ0Cj2ymr+0=Wqddn%G?J+
zn1gH0lb1&T0+YO7^e6~?n@z<>aPh7D;~p_6$nsPh*rhc?q8RQXE%f`z<^gd8j!Sfw
zLtFHF!g@8#2Xj~YPIA%CwGm=OM&={;-beSd1zI9Pcw95w(^|X+26Ce4Jg&o%#{IyA
zFC`}drk?IbXD=SesNua~m_9b0;~$bb#>hEY^Ymm*>)YwhbaLAMr`+r_G@_7NaYPTq
zrYEIqJJlWq8NLi1k4Sxf3;fcd>CNlm-k07HbyMHZ2*^y&_!rN(o)F-(H!q*`wjFR;
zcJi4U_1>@(*m}YsKH{~wpZmi1*-Eb0?}5+NzMr>NeD;+^cHjE|btL!x`GBq1SQs1V
zO$zMgx3VEY^VmlY6k<svc&W14hzN`eX{v}!k&58R*{K6UKNm^DR<qbl{!=JlvF^LV
z4~0eYd?jzt6wyi3A-*zkw-u8LB>#gnkq)P4W#s0H%7rC|+49bQ%Bwk24J7Q<x%dJ;
zvx2PG8EDN8KdnJO?HNCvRX^ST2c&6W<-c#}>~G}lZyfo*AWi=RGk!-f0;*|#7FTad
zJ%d}V`djb$<B<V2asdRL0OA9v!l1w1NwJG$p2KP&$&7%*r2!5N0Y^Fl90vm&BY{aS
zK&Qa~XR#zPPJo+E;4!Pf<IaI6oWCYXd_8ev-o-fSRB50G7t(z8^<=|W_YSUk5nu$E
zwL=D}*ZUftLoC=AIv35g;ph58<^qiUg1QmGVnJaI3uPI+HJv&BGsc0XIRnKD!8%1z
zVj1Sog1BbIoz8{P_?(D5lLr9d2r(#WwfTb1LJKMH;=$l6Gr>1$d=4YD+K}Lj$G+LL
z1}EVcA{0Y<P$5?%L(;c`u@{m1Xf;rZT!_Q0FI6ll%Xu+-Pb8fbl8#)uawEOIGo%$0
zoJ(B<Jj_y=35h?p#Mgm}jtebl2tB(R6vX>2gBeO24yArs%2*36kqe9A4ZBskSpQ?e
zPwe|W<GK3>Lo4#aVi!Umd}z582OaGR&S?9d))V${FD&+I@Pb<KqdMPrfY3aHvuXIV
z^vEA}SA%ndtdbvGYkAP#Y8CQ)@JE<cp{=)7Mrp|H?ia5fguK)VXMQkNx4N$8xXg?U
zf79J49n{@(HT*x1pd-A0FnnMpd~h{<XfJ#i88IRkF{%^s&MIQeIpV!{#D~a;@v9LN
zc@ZB=BPJUnK6OM)4Mt4QMC{M3Mtt6jU?U@E<s#>FBEMKg&O1kb^^RPKjQn;raxpJ*
zsWkF?L*$Q+$mPMvm6^!Z)ySWFk!#4Pb-ActI#C-|QJc<DzrCZjBBTCXjpF1*ZI?#v
zG(`RFh}s>D`uG1kq^W2ft#mY6*(X{hDq1x$S}i|X{a&=j<7mxS(ON^%+MlC!en#u=
zN8<!z^yFjobz}AotYZw1#u)j;7)QmJB*vKL#~ip9WA-@4{8fy_P>kj07^|N#*84Gd
z!B`u4u9g!^w2rks8e6f->s<Dq*J+o(*~#@fLtqXqAZ*X3V-(np`~7CDi!Q$(2ZW6W
zxwY`>V?fFwR69(nohj9EADrl(qKZj2rlh(Ioxexsb5sTCxA3}EQ$4v{CnYvfBJKD-
zICSy1CNAzw;#P?S#7Q;P7y~jR!OUDh*p_4>X6txVtWz~4ME=ihS{#;>9BBH7%XNm0
z$70!Bt}{)QlN`DDJ5u#RLORU7C)U9<<-(uz*b9GRf?<iTQZ0I7<Evq0Kzaf>Gc_uH
zzr=-)Jj{0^gU`=B?Xo*3A!;L@a^4*SR+ivRjE5u*ZJt-<#d0^o^p8U|%uz7)h6`WO
zE0`GuRKUll*t6-`vw3wQ-Z($qx+P7M1G=%6T9}yZ@RRp!I?w6nFlS7%RtU_Ea_J5m
zVn*4#q6+q_;WO(2-wTepfJwciN_DuG?mfPF_75M~CE21S?b!3ob3L(SQs(iWv59Lu
z4w%$dF4sv(^~LZyw50h`c(`2WZELVQo6o)Tcg4`(mp}i$65M?}{>#PwJl368KR)^8
z;|oqv;0q+!8BDSTE!Al}<u)fSk(}<hziUmtz~wq`-P^h?&+9<`bD4cHG33g=Q{umg
zq1d*2yBcp2E(oUHHo0<x%;z2tITw|A{pW=XQPjX<*old_M0*}jK91X~wBbb1)r@~O
znB9*T((UXol3T7|7t>=CK`XkySBEx#?kBJx|BCyWP<iurd`&8`jB4CNJ%rl62!QH4
zG!!WK4U?o3`Nef|g6W<%r}s?J+aUN2#<}l^56A4&dvJ;686m$e43Vs}#PozldI}W!
zi}iy?>q9qG2Je_%__e&Wp*mbfNEgx$+f*B^a=57<@qJT$tj4X{?NQkI*_%{ezGn)f
z3z;9NK7*+3O7-y9x6fD$wSLPlWN1b|j{RgGF#A8#q)MZLIt8t<E8g1S`yAXHD@)uU
za+#wy-&3f1?7<zQ@X~Xnk+l0&b-CzAK4CLv#fKF19`A7&9^FxuLhTs4Lc>h`^Mnr#
zzNc1K{+g_@yV8YqBX>=s=WjA~HlE&k!ce7#6}Vxa1%3Xw_e-*BqrlO6MlSg0)0La%
z=%2Qo*+*CREO$BoC#3nyrD|)V+E8c4G>ZJ88+S^E1=HHq_IoF9t5!Zl7!Me^YrfZf
z^QLvx*oRZrd-nF_smM7KY^L(<cx;w>ZA(SK>3Lwb*6rbuZuxvIFjBoqCcsvWI1Mg$
zv2HR|`oADe^(iCITlXE3uZh_58GVSb>nl9{e?yusMzCp{suZEg>%RXR()^iwSOtBQ
zLm06+&1zM>cV%Z=wJd2S)=7Fs@>0!(h~pWm=!5-=YE=aeX6pB^%k^fSPj`QzUVZn{
zj(SaQtATUP{o9u`{)03%>K?t=(Wr0iGt+$Zbn=pBL+f`3AM0Hl>u9>scI~jGtbpgS
z$NH@?^^U!(J6g>n4u8L4Y$=t)I9t+TVQX6pf;4(M{_H!+fX>((RQRBwnB!`QnRfen
zpZU+Mhu7ziQbj-5_UZ4@&b>DMw|1nV6`om=&K-l&6mCQOLrcFzAF<GT&04QyiS8}>
z+Y(p-<t+Kgf<hkIqpS@cRkGwhP_Az;2kaqT^_|%(d@aD0PMF&R4q85srRvJ=_4^lC
z`vmCq3g1~II)?a6ZScrCkPC+}4hiT&`=d%{^v2Iz{%7Qtk1B9__H?t-R+=u+i1CWB
z7=4s`)XNn<#qkEd6|a0h_h`a2UtB^}_QsEVqI-~CFV=QU-}xkcGf?qhRl+=y8wLg4
z)FqwmIPmT6A$y3jz>K2P>8hUJCy&(S{<Vvoi9W=uex|jEkLAG0oy3w{=Z4s;A)c|}
z!S}Z45mdFYG@&XPLW+)vYsG9^=@Dzo-)r9GDd_5Lg00-0`1}{1=btp}C?X4HEmhZT
zAJJA2?+LsQA8%MqnsOsL>yW=T!il3V<tr1N=HzBydLDmF;k97buZa|1A|I7HMUqDU
zvgxRJy6Sn*lUH`IEdQlzGWO~xsH9tCJI_A`lx2Ts7JsO~gPjfSFomg#Bp)crRW!QO
z@>&?0(fJ>wd9U^}RRje8L9>yqq0%@SiwfXC1*JdsUNe!Z*$w0&?NPcjm2R8Xj`l@I
ze)ROrKoPsn+lAGgmitrum1)$}m`f`xJ37^c!VEz2Vy?ktpBofe>@ZJ9?kZxy>OD3>
zO|&!%C9Lqn9y|S}g1iJJB}Mh#!){H5H`)VSb{Yi}*hINsA#cq3eUVY|VCiAXL4C>y
zoTT*S+C(R>`o7)Aytp1}(O;;TO3cHzXEXxkf8o;APi$wo#a5ux7MW6AbRG?*@>_)X
zAcKeaRPB`V+h<#tvOB|kM2QM?ZcB<u>qDpT28COFUJnfJsi%avZQP!2w^iqkbdvC3
z>4gw(r0U_&6@4N3m9>NVAvXO7F){GN?%%{d&<762VoU4lzgeEm%)jDpSHz(oGC!Ev
z=Z$z${Kj#?rieBi(G^oV;eN<!`{C&INM|{~eLKCsC|-?v1H=VVi29`h#N|F}#qV`x
zTsdQ;c(D0_$qGx8l9U_AF1+u2rMBLSKj)Me=oa5}m#b6OsLuAr{ri{@iQAHCR-M8U
zGbD}U?`ro?I?OU<dgJXBSLr+oq^IZuche5I@z-2w21~!>e3$KVNG-Y1Re$LW7t(xt
z|7tN<;y%vSy@<}+w$&y53omNbK09%+KIxYK3Ix|bd+c@Lvu35fa9y)=d_m4zqQmZo
zjs?EYkHdo-&f0g8bZy|_G9Q{d{%MmZ3v%2xlWtuY);3<&(;f5ndwRHqs9HFJWV=0o
zk#+izuFknnIEgvYb}ocP2aeMlW`$nj($BxE^S+<*T;zg1L8AX`-h@Mb<41uXvJSx9
znTF@D_U^*0C?innR=LQ8#ER74+1yi`HdVQcuLJirXMeAPrEV5KRJf!!P3$9fzH5gV
zqAX_7`-&&!9=AluhcqJp#2S^!u0Tv%dk3P74NIFT-KV#IJct{vV4PKZopxAj{`#{@
z5rdT!lbm;Xp~DrmzM>$}@T_AON9W3`Q_?g-6<qwJuynrMXnC^{c)0C^)662o=t$$7
z!V}3NPJF6<frZRvJhdg}-*WLM1;27mQSZRZm<xhaDlymm;GSx!d7orzPcN36UZbT|
z{PWE_s8o(#6v#8l&>R32ZEG~2e@s2muM!iBg{9d?R~-=*kOTlx%#Sk|x=KKJy)V3Z
zVk2N}1WvR+`6|=c(VTM5SA$aAk-cJPR8;WYr5Dq~kd!L<s&I_E9w*-nJ*!x_{-e96
za{tZYMQYRg`P^vlOCL)L)8Qgb0*7<_6h6~z%~WCtsa{~QaZ*M-x+d?6bffC#dp`M4
zA;GJBcNFe(2kQg61dVoT)E3ykm0fa+Jo$O#4lVH+O67$7k+`f9xCO)23`4!F1Lc*f
zGkdQTMaR5J5w~M&YHaDHlGUo996(n90hk?#CL8iAqz<9u3$0NvRi`px%5mw!Zm54S
zcu}w3`TFd7TA!K^hWDO;?~lBp0E7<C#)Ykrte@^L4R53>UG>X%yICO*({(VJH@!~o
z!KgNrCAsXBPhV-DQ+a~xGY%jnJB`i%M7V;bWh!}&vjRl)QAr<957MHF%V6vKX@`VG
zMv>Yaf4-uT*P?PG`Ilw<JmqF*Eins4l}uZCMDXxC-zKM$&Yx=0`!M4gm#lj|;ANZb
z7Od1GRP(-Eljp>i^DjVX?eG~@`TgFOhZlv>n0u<>7z?MGA=-6=pml?Cn|Wn<;e-%{
zu7AbJ*26zb5)yznZ9e&aSB&jCyXd9R;m%T|uL_>o^+msB=b2k{Db6!}EN&Clz{(J|
zBHrGD+=caeOW3tp*0#-`wp~%T1zTYnJG;2;4eB{WwOt#N9HO>86GO^0Q@YzhD}zNI
zvFhpiipMy{gGH}>ata4y;(^jG$A9YCngWu==r&dn1mPT;_F1ZI!ah^N5y%xerIkt-
zJ|>~NOJvo$R2&(fKQgp(l8hW}+CTn>9~gYZ5IJ26G6ee&f`uAOA4Rq5B<vStnKv`E
zTbPv`sxBf~YmsQ-!l#9xzCiHk({0dWcdc`}M8ZLKD^w+s@{j5uX?GA2F(=V-8_O;e
zOZn_*n2buXaatyt;=Rr0i!`BBWkZIl8cQvQA<^GuMYl1f`&r!wV?>fr8m!-XERAPa
zwJfX^x6l7q7omzNVF;Xk>8F)v^Lv`5vPMt|OTzI}#X^#BY7i^;WU(H=m-|!^4<><f
zkJHPN;9e@WU`!_%<4$P%%`4lPysl-RM5hfu+@C>dC!;M0-Hu(706zq9+NgQ<#}q-1
z)N6FDlmMB>|6+>MKzeG7M*A|y6rf}ui~BSnnkiY|NrIHxyrMCLtGeVlUHWBCNnFGe
zWot}VIPA@M`P4>Eizpr7>{t(c8sX#AZEM<0kzGsP`dvn-BEsoF-D131e=?#!S(bg*
zA_E|hLx5KiP5YCfS}Y0fdaZ~JnnRT>rikSvLzk&g!=w{p46_-QVK~sZ$JWHc#>9*H
z(kXegfMG=IlBO{AYlv3!3}G5jmPON{*}zXa&&@N$7vDM^pKx3wz}31`$EMYW0lJP!
zSPm5nNHSuB2JDD|Iw^ko`$5wy6n+4AJMK6QcS(&w^hJ`O02_2mvNb)4KPO3Khbpy9
z(d<#N!hKa00V;5a!gPjl3&G)Q1z~I<V$vq8A?WN5)xh}yVVEK&7Z^F(8M(E<npScY
zsR+xn*%p{lDW+I#g3r!@P^>!$K$liA<!F+>>1axwot?>4x$7Ersa(!dr^|FPQ|OLu
zY9|5FI8PwI8R|(MU3p_8#CVBbG?HLwFA~J2N(lG>$COWm<L=fI1+R`zCmSzPb%@;@
z=8+w^7Kf>yLrs72T7J<-x=Jb28<-`;G{W~Q^vrLKfV3|P<rxzsNZ;1Zm0E9B{oE#M
zYozd35wSx1OU7D(h8(8Kys*2z?b_WlCwHi@j5B6s6-rfSoHwb_uT#t=7)r<QnyWD^
z@DMpGpn6aBFKt_CM6yl@fqU#j)RN4W9UVDBc?%Eoe$`k5Y$lEF2|6;=avoThCBxJR
zG#EH^Yw6zAg#cbTXN!A|A@VvwGbZdVx6wOF6E=}paFL4liM*~5bnt^6<^v7LeGLf4
z^qX-Fh2Z5|ef9g@g@>i9A&xX<V-Koctq+!;3XAQTTc1}o^)}i8Uw-!O#F_$SEGOZl
z+b#^PmBW<hF!2eCf7BR5GBt#$uIB+g&yG8bO${p|h+>P$ty|I^j+oNXS_^iPXcds?
zwU24NU8hq6R<D5{3R)y+F+(|EDLKLHUv-2s1({2bT(`1v<?yc2<3gJtM}SS+*C4Cy
zswjs!E7Vt{gj|4IJ;7p$pq4Cq=kASKyg6lBB%G=o66!L>G<8W9iv59g=~AG(SZWbr
zy#W~-Eb;g>9S+FU@oe|9qvbqWTdlrJzn-ZNncoKMkKIMkxknB3MQ=qUqti^|J3%Yr
zUEECJRjLBgu2!hp8cKvC<g1;Pi}I2PWnIW-{5)Fq<8AF)xev7(5MB0N>;5j}{6bx=
zwxh_S5h<zBAl1IeE@ML=2CpE!$WYg?y;zZquw79bzS9`y=jR&YOqTztun%|HRhERN
zoSK?(G5len!?Ls2d|GO2p#@%KAL$9_`*H5aP%CC5<E(|6O)86c$aWC|iew`j2wv=!
zg-A;jSaOkRpTgoP40*LzXI-x*ZTu5w-y{8k)|3O5mn5jJiA&c2t!f^;cGW`75#K+c
zDur+<Pv+z3dh7UljUYKY^gU}@eQ!m5-$II2EI17b(wZm!<7Amh*r5K|>~|3eTy;06
z1_CQ1<bccPiNncY<uOp&V9M67n}Xp4Gxz(}bU*o9cTIMv$~2V^8n(PqYr%0V<NT@c
zcz>(R6*sZ_(0JX+$mB_#hfy7>53?wUx+Fp~-MWg~u2BFB-{&H`NlI%Gliyi9pTlP5
zR%_1{B5c9BJpe1UWM~<|tQatGpO_-6=?A3hucUm@)^?HkN?;Qk^}k)?O*Ly~Kt@?P
zb1aKyJ3-4j>pQE>-Dwk51I;tUF)yI<BJ&J~sqNS`<m+gSir$cEvhGP1BK5!2&duh4
zthsMk#pPedx{N}SRa%&qRW?#R^Oj=-F$sq7aeHmsrm;ohDJ=r%M;*bQx+y2v!vSk=
zP_0<EHH8@%Oh52Dk<J0BODx2>PXR&MkKL*8j7}BDMr*A=mmTVO76p6!p~W%<W*TG2
zZ2-)|!$Tfg3{wy_0E<ONPZ#l@N3v3Piq!1>sHqI$y?Tmzk&W1<efoUT=<F9U-!s-;
zOkw(4%jP66EkaTbakzWhoM~%K9(8O<hSgA%#-;~)@$i~QvORzU(xo`c69W#|wvK|W
zqFWovyV@u7x8QrSBKWd9k@m?0@9Ba+DF=T7zBVPnECP?b+PqfL>`<p+dZ9-pg92N|
zYxl-3sCWp6GgTxa7jl8Fmu=*MNl-_I2(I*4*ybVWIv9J!1IUzxCMj$}B>u48*ipZI
zjF1MW>V0O(d||Ctl%l7=XU1I}=b1ldT{mQu)aPxqWs-GRVD<13j7*obH$xtG*E}Io
zP3epkirA;d@+-3O7yR{i`Azfp{gI<<RKt)i>{y+a7SnQ#DM}+)#BK$TGc9Pzx$OJa
z6rvir%c!5Jzs#qVLU<J-<izsS<vkMrixstzLb^F)k;8rXgOxi8mQ&zYLQK<nqD3c2
z*^4P91de_j-Rxj;{x8+MCRxRWu(wXM<Rtg&FuyM(#Sovz@f|TCgGk?~=8Ijp5W-H`
z6o-*gg;cc5?W#~o)g6KSGKzIt8&4dvwVpRQW*RH?`A^geQ_PU?`F)DToyStPGmYMr
zVl_!74vIz^5Ct|#*p_Kxq40H-IenjKwn=?!w-8|b#el!kwVkaHV6zZ_f!v;br9&Lm
zOEFgyRJPbM8Y5&y?>k#HCl$!!+!mSMF@K~j2-;A#g1eKnT0ZwDlsw)<uLUg2Ay{is
z*B8MTk8Itzu#IUU+Q(fC;<Gc+0;zj}xjTIAosHO?q?e7YCF4w7Gf=YF&V<6ml0oV&
zpy(l}&jSL_8<xayr${sYv;)tc02uf;xj=dihhSp7fU>(uhxh7r@%C!*^Os~mrew2}
zd9bM$^_myaN{e9cd`Qmk#e>h_hb1h$!;U`6L3#`%J4Ij!@YIPW!QFM5;$V8}6RNA7
zB5Q<htKj*}U^GotW7GQ>wYo7Y7F`CioO)EP|Ipa~s|n(M#0v^8q#8>8=Gvm<=<$nS
zJg@v@|GsCm$q(Zc%$pFf6_6xs<1JrUm|tLi2dG;7Blix&Vv(sWu~iuJM;?+h5aw8{
z*xseuUa>~(LZq5Gc41J&L&p=;P((E^;%lGXRU}bQGeu`UX;8K+;zzPZ3PIa+(1}f@
z6JIZTz13I3$?oP{ouZoc7!X|u)!7iOkmOt?w&!lbVE6&+0I;kVT-9Z5a42Sk*rRVj
zNL}XB8)m#LAZTYaxZ=Ok;eA@y9$AYdbssE!4ARu_DksRO3slMK+RCBA+pNosf}eE;
zIwfhcYsD68U0I8rJ6&mJi$)2d#X8)mDde4cN-vr4s&GkhrH#<fR3v3uwNP*9?o-o|
zp!p+lU6luzns;wmx8FJ%C02FOWz$!BZMW!VDWu$LD7(D_x-IV<b+(hBjiSCKrZpG#
z8LjD#sFJNLt_<y4ME*_ID!Y`*v7q%k@6Rc`|4S|6vmVk-`SnF%<nK3}#j6i7|Hd!#
ztAB-HI4e!38VH7w_bLc;bAFZA&rj(>rt6*(w7k(4=N3fm7(2`xLqA%hpTCX!F$+$y
zPD~_izpGY~t4`i4?HA^t{A@FY)lW9Zqx}!&N*{>Z<e=vdUZG!WZe57-D$(?@|EhSR
z@OVkW3xZ|rpJ1<7fz;jgw!o@^mXZS(@{SYIgokLLFAv);tf2L-QG4tob`1AxtwZlL
zynlBgSE%vw_ZJKg-a0Wo_dhqD4Vc=Gx4Tp&xJo_muX=SkvEl1mRobZbv+^6;g*+eb
zzUmDB;}%^#<YUtD)P3gDr$3MV7<-XA*(M<pW2~yM#`Bk@&WF9PJN-QFpHv(d(o~$Q
zOm_OBCB*?`l9g%Q#!2k~>|;ux6U}p+0NV|53oI%?@ZH13Z&C7(v7o1A8chSE4<el0
zeBSC8W;~8}5PDPhZS|)qcK4FdMTze&9X7T?I^p)xom@zB*r-QNANBMir<G64VR9~A
z!mNWchbC(=hq|Du^=qZ)#9EVcJQk8tb2KL@sXA_?*3@h9(EbehD;Wx3)b>Mzj?ckQ
zFN_?LckYO<u)CtBcTUDRt@U;Np>FOPpI-+C)aPPx9Gg!hT<kxD`QoducE!Fox$j)V
zX^4#O+1};XhVQ+K28^c@HU^v>K0@!w+DiB%4pR)0coTPkgcS8GP6Pt&xCSzv#eljX
zzaY1}ctnFn^2|@&o(K|Nm$7_w&p1P3UeITEBv4uZg`^5xzp3V7hbF(9DqPXc)lV)J
zvLiU?b$<FhcDrm>bmD(Onu!tq>TWsQN_!viQKS5z`*&|l1~FzuKZQS?zVRs%%&Nx5
z?=q_8B_BwOd*!ViHo+UpM~^pWdX2r2RczQ0`<&pv@pSU)O*><y{nJen@oY_mio|S+
zsCO~jGydO~%naqy;<+sC4v8;0Mi1g;u2}9#%+u_UFzKk1(spU;0VMx`JTZkY`I@#7
zw}K`oT2GgioZmVWeCOio_P4v#?$+SAXt5WI<+&#(<%5b(n=Mt{x?vVpmTq-h#=qJ3
zc4&1u@9i-9qXwy^rVGf+!H@GhZpmC3l=KXLl9~1?xakM4M?~{0tCH2$uf`rfpJvA0
zmSg~b{#|?3dNAQ!`@P8B$PUqQ^YxxTTbGw^8&!Xl({S{DbT49Jda5G9Ohxwm2Qzm|
zRHD24OR(5346=oET(91e-vw621r0uwMI>IW`6qKMEb8Cy_kq>2Tl=44-rPMu?(5SL
z_sw_w?uCgfeBSYMx#_aoOTmxjcHW=o^SSi(O;pD&lK%7Gg$b&>+}2$FQR}VWr=HL3
z{$ifGck%Dp&wrc6U%ej~y8P#e_Z}#u4M@<9hc8pCJ5)O-T_011-p+g<WFS^YqRxx7
zf9Co9$C|hBD0S^G2{iH?kMLN#gkpV$XfEP~jLDbvrbv8dErf|o)D@Fm-|rd4kB<yj
zWE?*3*KzVW$h3^er%9_o4g+E84rrmpmO1_^3eq&ZKy+YYPWV3kb&&gd*3q0fk-C=G
zTHdaFA^10N?=mXBjL2^`>@RLve#r6?DC_Dqf6Q(T)yuGwcEOgouTU~_$a+RE|FUhm
z;=Y8vWgl0rWL3&<yW8W%qG_oX0oaj7du!vuYXxIAs{c5LZ3Y|jX!G+*mZ80-6;#?)
znXigRdhH#;+^*NxE2;UaAF&>7y8cY$fdYEF&+B`mWGm*r`tJ-!%b7-6LVuOssZb}`
zmS2S}B7p{vKfXP-S6K2E@=bfG$4O&rJu523U;42`w|3lm_Nj1Q&F+jh+M~y^j!t1k
zA4zm6%ZZf3PAn44o6KS@L@LnN7j4x&T(iAJDka}99y~DVntxTKN<nnV{;-EzQK`s%
z^%F}DmSHYw9ftT}j*Mfd$FXr7RaEQ!lJmvMWB2w%YHUQmyJYTr9FJ`odvN$fu0;(A
zdEZL3R-W<D^`Xa!x=ZLdWdQMjmDFpuxH3s$?L&MopsuC?q5@vp>ayi6$#or~4d(>Z
z-6}oC^9(D*<KF-9R-AKb-4mrNS!znK*OHL|Bb7#EO{q?elT8P&HKx3`;p-&1J;Qbh
zCcR${n$<{UuZuR9i>`$5%$*u66?=-dJgYOz$U>6KpPH#L_?z4(<m<~MGiq#L-klz=
zuNu{Frw|WxdwfXOzwz{IybZKP!>eHd#IMN#o*kJ@7bm+)FAjH$Gw8|U>~+5PR~X_x
zw0A2Gf1tBYE0;e0bsde&My$FW(+}G5{;NOMyz)NEYbc9%-*l`DoI#m`qZI67$>m@p
z8o|JU46(M@dY+RT#Fs}Q*^7ub$(A*Un2~b4Tqe3=yprVOJ&}`30RB}XAGW7&_UFMC
zuvt7g{<Id4_)qaS2hwVgu@`*KSQ22_rgv|Dut|;MNc6%69_QWC8hg^v0C8j28e<ev
zg;Lm^QdevAc5&@%T`iJ1zjaURAzbIJt}z*?jnntnX8XgqlRT+@e9h}rA(RP3*Sr44
zDHm|;E~WJ=JE917*W-oCMJHx_N{JLuz}DI<lZ1;bSAY5LNfY7Gq8cCEfx-(2KG4SK
zG01$?{w;_+@q~o8y_H}0^*~&iObsu!_Dsn~5@f$prtRzZwPpoRCqb$Hn9V0hkmaI-
zyk|ptnqiWf-jj=WY%%|8UhCgD!=3JX6w>qInZqgRk)Re`aZQR*@{=E#NDgD_IOIv|
z2<bK4`a}P<ROZ@zPvnK0%r;s}<N@rDbQI@Soc{*{a%%1gb(wPT=jpAk+}iN7;2Ht8
z#2ZsJhDIU{By+9hM);-KvGha>&whLg<m@SP4Skufn3Xu&R#Y;|(O7)`gCXT5_g?AH
zA_Ki}&)EIndzEN~wgV<Ut-xInzS|4}Gfs;`uTKA*X>ZhBi@8fAd!|;){IEQ4+T*{`
zl$^tyODyi~C;1~adZ<4_6NR&nbl5%DJ@8}y+)uS3ZHGVEHx%3CU$@zAAV*#vYW^wl
zn^+=Q@7*ddcYlCPo%DfhrMvjaHBFd?Ba)=MeM<3i;T6&+6_7)Ta+`A$^SQ&if4r1l
zf)xM(OQ+@C#yi+?#rFm*)zIhsycDJHuvsqyKL5QjBFJ}F@ZXxH_09+R#7~oJDXO6S
zgl|6AE_d7;@CYHo^N+~?tuMc)nDP0_$c3_}Ka?Acb9@nVrSkv&Yl8py`6{;*{^!^9
z{oN&>L{8D?-L3Kcy`}uby?uGW_|ZKOY7d(Q7#Z51Jo@DJY_AL>L0|PR{((>pDHb~n
zBKpOj#B<uCIApwxj0=Bs)|0NVrYSziz8(3A{cwWwTJ!N?NH0H+IC;<%Din+14J0=?
zU|tjGJi)Z|ur*%rTOLcg1nbcoe1m*Tvf@sX)p6>flZql4c%%-EUypp=6a|;1XQF;Q
z9?p=-V!*Oy!M^FwKyTp;7sOLKxDQ1i#3A00;R7yN9cu!wfqb_^M(6tkvTeALH~2S{
zfaOo*I8N|On4tAzs5*SUGYOGF`lUa2Xb*3s#;`g5MXrGYjrIM=_T@VmBnRkjFpL5>
z(*JVSkh!yC$-_06B*Y<C8OKJZ8@j>0G1Chz=32n_IZJGOSWI?SB+ymdQ*V=muHWiK
zrJ~VS^u%J;YvWwO>8_Id*{-6e(2~R`(UaBWdZ*K60X>Gv5=weTo7|f%Q7VICDJLLD
z!Si;L<ncjrN&#pTq}DtAuYG|?cKL=|PWFTKYImDH85H050?wMN%w~aPW}p09AciNJ
z10BU|k5mgqE4&<1fT6LM9kAvY%z<I_R2jy98LQ{UKj@3))0fvStksWJeEC?>dX%@W
zPyVo*qGU8j#wD(HK-?bWAVgK{Kw}epQ2`A6|H0mUe>K^*4Zcq&5J*CiUPA8}5RoQ?
zjz|{^Jrt!_01-q52^|5Y3L*%h2}o~J#n3wfq7*?x6%eFKhfMDKe&1(5@9ddbYi8}=
z_WTK1>&#l$b)CoY{g50P&0F|1!K|lb*8LV)-Wf(JBr0ac2?-XTZV_i_XJegV>^2sZ
z4}uQ@Mn(Z=bZ;?*Ym~*fKv&JAFP5>xD!`ie^XT4zuVt~f5Al9u@+F(+QRWk5*0y-3
z&CgzmI{V99dh@;yh&d1T`Rt`(hHh+exPk0C6ZV;e+?Pt(v?bZFcXCSTvy3g1{z33=
zGVMy1puaihK@fee16qGZ%r;D$Wsa6Lh?$q4Pjj1fi*UYd27Ti*pL-(xy~OiMLG&w*
z!^!20N;AW*n7;^7g%+mCVG{)h)`l>8zY)G}<H-Vsw{~4;#+VRB@!ZX>EsrINUA>^H
zBPtUkY;B3ra#!+uy|+iMT=XJb>`Kfhdov85yV!C?bviL`V_S7$`%HirbTF$IeJ&SZ
zp+1(N{w-0pNK9?vGYet|7hs_A;j>85b3UvYr-cUZxmNj;EC#YBGbL`}!buS087-#u
zY=y=aKIbf^OF<W`cXY&q__&Ap?qw+|Y4Riy;KYHhT@A?b3|AaKH^4#p1c=TKVkma7
z-q)ZtZRHc2<Hs7$*+ub`n&Liurrj7)H|gcOn=kEl|8ipz`r~MB>nKa-gUec<40#^p
zjV2j=+u8m;s&>`D_<DkIhv^i~Jbx?6aN)D@aCI)=rSXJ0_u-DPWv}TTGgpd{<rYy?
zRY3bAf$4z;oBxb1vlB-*PS$zGc2!U>`id?zTLG%6*Trve_MV>7ENdj0Zg!#B8BY`1
z!l&RsL#(3RaA4`YZ(T_e>IAZGk#OxYSL~xYSa(d7JkP)?xG6V)8fT+2@uH^7)t1+P
zTIPJoe(U4&uEwbB%va)>yt*22lh5Ur^VVH8CVf7Z5u0)?Cf2n+wgXqyhOgSRJh1zA
zW+!UKw#~%0@TKwkMish**T0(U2^058i#RmfsT<Ee<shtf-oosqg^PuSj|E>0j;AyT
zZuL^|lmKVi9p1sSK!O=we^zSJ(P_r>V@$T}q8=_?wVyDj7mbdFAb4UNeA4l^xGHba
zGP?M@2m8Hu+56+-;hUSG@A~Y$tJ^j1JMYmK4cs2ScT0>v%3i{#M*+PR)Qfh{#45O}
zxVuMuy-l;@zUP(u{+bJT$CSqtpSa4XtRNH#yp|`xH;F+|O7V=kI<(H6aF!fa<h-M(
z2F7ld?ofjdHpZvOFRv8jsV=~WWwc-%U;;SMy>~E=(?G2f_8Jy=n~A*l&hGiH=h?Z)
z_9^USGuBq`_7KTnGqxRz6w|X&!0TN;H?P^>O!2w9=i@N8{a`G|y%v0L?4kN6X_LX6
z)}%X)RqjExIiV?j(PKylnnx-Ij~*pIf>yI{(G1UP(dwT&KeeEh(n=lJyr32A^qh=O
z>}QgQQ@{wFFDQF!c>VEhCYp3IHxYBY_Ka_E*;DmTY@62u|BTdJ>k6dof!8kt?$u_~
z-4Lu|^8xz>(bfg>*WEer@%scswkBu$Rv>>}52o?Up>XdLC~P5FxDX}3Y}Ne-D4!=D
zay{8$7gSp9-N$bv3()o8xr;Vzr&=Nc*&{>7BLdo`ii|EZ`t5gbJd@~+x)H>2jT{oc
zznwIm{d)gd&W)&#9t<gUA=gRIvg*R(Uqz*kN0%wa{7S)YdUD==Xyk>n%=3$B+>fqc
z5Bkh5EFSgz+t%|xKEJe!xXbVn7h1z<EN@J<UXk$1+68iM(FrQ=2@I7=n<mnWq$WsC
zB=nFkC1E@zHF=aRc~l*xlr674TZ*jmQyatD4!jFAdW3oD1vNj&$}kkPtmn7oNUrE5
zxN&f<Z@gSTpM2di#pxk>y7!_9gYT|lv_nOTlW8*LBK8%~@6~YDE2TR=agS~tDOPjF
zOEUNJ_*<wj8t`&zz(WDgWCXaKae_8kCJ<*PMTaE8SzgUulu$g=;sMG=UbqyXWHzfc
zh~aJCL^b1>lM9mEQc)@<QMmx*>zQx2wo<bgv+7;5xU5Y09^(Y9vN$FQUTn`$%4Wh=
zIXsiujKd7vLEKE7$QurBpI*JZ$eE|rkS+b%-iR~r>SGtn!`Gtl9=k7B9O&e|gtKJ$
zX}KQ>3_cRXaNt-Wg1;TELIt#yQ`IVQY`<F^PJ)p7L3~pV+zt-Jmj%QS4tj?!pJ_mT
zrc&{vlw!Tdn1Kg=9sDI<9<xt8F7BHwo=$L~C^h6QOqMKj7OyotjAl#QGoYS!eft%3
zBmv3P>%5W0ECb>gC&Gs&_;elU6tZ~sG?-rF=|i;`$4N|>*@`Xz`dEYUJrG@uGXsPc
z@(0rs9`H8fFe|Nmr8s86;3C=vF!?dg$*Okm3)|*oabRQZWwW}7w0-z!@Rv!Jprh1y
zt{|{=S+=ROy#Zgwyk%4Y-ysnN0Tqe{vsvL7)qrpGf?$3QbSy#DK_pI3e(qy_P8J}X
zceb&O>&-(P6wrd4Rl!|5;_t>W`)gPjdULCukyp~-_4rog{jH8Iy@hM4g^#;c&|f;M
zv2?LTPkrJo324A8>tis(BoBg9cG?R9@N~NTA5Va13~`Jv3^Ab^A5Zw(Pg)8d0zTAg
zR9<Z?JPD#_&9d;(5bvC!gJg4IC-@<tmc*qZVVj<m^q#b-o=pGC;;QdhgW%|iw@C|#
z&e~f<Z$WLGVjS?z^;;~DuVUgH=(LH>CoLU(t$ioJ{u2k9^f|73=?eSb3WF?o0Jk`h
zGyMBONc2H>v{+A8`VeAzh}ulZwCv67eexsq?GgdL%j!c6qN`IC^v5%gXuyUzOpdh`
z(?|KFG(L{mV6e8Ie_0PM`|sXws^OodRbE7a#&lTPW<hU~&ZrK1+m1baGxo$5$7WlI
zIcZ3A=glC%qi%SYJ0K`uvjlBgAQm{LAr8LL3TP*ZZxsh~#laFR*tLn!^cKE!TPO?g
z%T1dvH`@k%j<0Jkux60yyUDynmK)2&?vs|US6qeys7-@6KaOmBf~Mal2f-@|1$U$F
zF$O=Fx*#ZJi;*aA6cpf@^kT6)*7@B6muee+@>%()MZ91{PCu(Co_p-%&HUx>^CosF
zKs9SMS%nP9M2^Hg4KwH6EL5op&KUrYB0<fMbbh~Qc=}z?f99tNq}J^FQY`OsVn(b_
z!_DuTh}q%u?m=*8wRihjj4tfX8~pT(LPjH5A0E|Z>Dn!KWvuo+UA@X{-Me*ut7Y8w
zL0M-DbvkQpI+&fZ`v}L)u$rpBI*_q`^nLva&)TCrWvC;&yUKa?hYf3VtT4M~wQR0R
zGK17T1wvNy)_3czll61<+ZXs+!S>gQEW*iItPffoOa*yozbhX|SS4xpU6@6z1SlBr
z)AN4cs)ueX@$Grr?_J4Qwuap(3t}mC;MV*ujZE7=SYbN1DWf^d#KFp1x3zF3hnc;3
z_io_&L%yRb`=fxd?Ft>X<SZ_Q32FIbTF$_-UNc%aD1d_Fn{8p+aX|Yeu;5kBZ?r5H
z@!8)CJle~o90j%lvqL@xK@gm(k=U%(FnX@TXgzTY)d-|0V~~z)PUmxO73KNbNO-&+
z?@8g6EtgqJlR9)cNww}Cq9jHB_GHtubNR**Jj#(rwEqri<{73b2hg4W4@fiWe9_ku
zo1EP#+V^v+Z+zy%E=IqfQ8f^FR$Y<0KJ+13@d$T0`T`Zwba~=?f>10cw}c|N)M6AX
zW((~Pf)_$7$f^R~UJ9?56|0ONMnsBL)JG!U+{;~LXf!VpQ5z_>Zv49Xu;MRB^IP+C
zmD+n{Ap5aU|MCpuI}iQ2ek%U{bR#|MUV?<haUB)X6z}~0{9@zo+En9{lxaU@QO9T!
z!)ryEQGSDCUh~5?aX!(jHK*w9+88F`;P%olAJ<JTM0-|p>zr6b;Dh1u6iscGB5}Aw
zXsPX<Z5XRvq(eC8ch-yt)ZTgrTj0{{AoFV*Ep4?u8x1<enknjtWW<stME$pv7DPjK
z@Wz~?3B6X-WhUgMT#ZA2S@U=UnL_3;E;ZVlSE*ZzLF_sjRNzzF0nh@Og5RW4#M+l`
zrJDHor8E9M_CiRNyWa1{iLY!Wzj#ES+kWGCUJ)(&@G#Lu%z4Qi!FcFAYRqmZGij<e
zHf|xnSSV}YmdBvvcI)kHx*7-ouwk0So{@n|0s!D>J=0gOBuH;do1@-(WuC~sNb^{l
zHBl4q6>!dsznCSOc?$T6DvzDdx?FkSTHT?Xtj2|Zb3RMIJ!i;{a$Edu**(O~{LFB7
zi9)SZI?^lLbFy2}R4L+Sar1zcq*Rh&f(fs7|2ZUM-~MOb3euKj@yECE!`~HYZte8i
zj`OArJjvY$N7wvTo!a0-{WwR@@w?6&ubQ6p(?q(DTW*m5s|*CeXku9H*=OM1cd!4)
zBZP#RW2m)zL;rC*L;XrG{m#SR&9JgGvQ3t@v?XDV`gmkhQAq;W2gQ#j*?8%2^)(a=
zsT(YT2C=8ks%YU{KZf_?HR)NQt}7ecQ1N!L7F6UTu?qck>JAxp?5P&qdnovq?zuWZ
zq-4@3tEjn%Pa*0V(?caSI*%5T?O!}vY&Ca|y%<=v3*{L>Q+A-ThsRupOJE<twez}D
z*_T<zj%N^35rj5#t>bEq(C?X)r#9p`)W;h$3UjKz3jw$dW>`jsf&Wg;rNP&WU+v2d
zbjxf&O-=`-gbt3iWlde_5c-{f{WTwNm`0m(e6h^RkVLdpkD2_ZGuo<C0hD6evmXF-
zoqk&N6EpXdOKq?rHbcxrFoV`bikmjCMI6TN_Y5*{XO8x3Z!jZom<GfB4So~FIJMcV
zQ2Nds-kmD@-`pb%@vD8o@`eZiU!+zs+EfgtZDYy~CvaJ40Kod!k+J(J@UP|k)r#Xx
zKG`qM#%X9nf}k8QrVjDu4V3A(6q!;?$GxF4*1bMTx3p?vi|D&ekqg?{T$z<^#2u^)
zEA}M_0{}q8h(R8!f>)F3I&rhmC!zgQy5n16TD14$x!iL2_}r2dK{sFYd?P`OZ@%MN
z-E@gtoi_*c=m#eWB*}~Cic5AeD*Hz!728A#UZlNz=`=Lq8JGl{C7-)?hbg&9n@;SK
zTgtUb2=_~efs2(mh%wwd74qojSw8X0UPD_E?^jdvIWaG6)x6U*4sMDCIlymOxpNy}
zg2&q@3|#Jiem<NoVrp0e^twZ`uo_uZu3a|L-EEUv%4LyNJ@?{ig87@h{;XON&)`sz
zQG*frGZ2>7rqV4}xTgx1Oja#T?G~>Pxx-AwDAZ7Zqp!tt$Up)3!=I*~seJ_TKP=lK
z5-c&Vs}s3w=ao5S%|%XHq?K%)F1bj2Fs8*9XhQ+8ThA_KBYi-#SO7o`n*^gjQ&3*K
zEReWC%s?*dYrhJ;ma>24U6fC;{F;#oS5|qMK{wArdXm)%+qKGGpHju@73=k0Hn+%J
zt}^~`xlMPi%psrh&_B7hY|Gjt0kNADN23ds8{vy$3Q}Iu#W&CPm9)Vsnaf@k2P+FU
zfA!D8W!z1`%SKO*B2B7p?}TR?So1th&w6-T*Y$O`QeZqdukzhmiHBtS<aq^wiiY!p
zsu`Y)_UVRat5jyr3oNSLfK=B#S6%Zci>6G=K~oy0ruFHcp)Yi$3klb5bg{u&QB)fA
z`t*k+pDM(UeJj^ScSGGL0iR?2R5gXp_V-^zwtNg4&2HNBDf36g;C~NMy%MZmkaZ4f
z<JmlIX-^j$@;&`k^j-_i%-vvhddFfZzh`AjkO<pzF%$1X&Oab@9I$$!I8K(^;hUb3
z9x+b&F?Hel8{tmlBm^h(Jm=@T4C>T5kkE0(F2j3rX1-I?W|4Th0{tyZ?I^UAw{~Bi
zZDr!eDQB_Io;+{9AXJ_4H`5h+F?rVdY2uZO!A<pbcCe~9T2i+Vvx2lwQajk;<~M_@
z!5nU1;lJox7lMV9`6I49c=*fzr#^*G@e^y4mepqv{8FwHUlb9j@jeTNV|m;iflXB>
z%|zd%Z)K|)81FpHLZ0NBISZY$EEbRN^jgyUT2sR#+!-YM+-vo#+fLVcgOh^OW4)5N
z<m#%5%Wkx#Fiy*hePUMFa4;|n^9}u{U_C3;dP<XaZ=-{G(i9<F;B@zHPKfevF9tbh
zCyZ}fn$7IR^+~(AaZ<t>U$R&D&GK(|H<I^oB<Xwi*CTb;hTW?&8N9yeHU@rQ3cDb&
z^y+Tl<hQU=)Q8(M(Na>sP?eF%8k2DzlM~2?V2wu_rCE?>nK?RePg^sm5jrJ8>S16(
zSmuWIWW1W{taj~c`_ULJf0HleY^iID$gwQ!Q8^Gk%<dz$JBKpxY-M|V``nRn#+KJ;
zS&Z_99%g`cln%WR8R%}W@!;v7N-s@!WT40Jdd6Ii;0ILkLAa!@E!s15=T*Ur#IxN-
zn#}K2SDik+8I0xN2t<d_AMO{7&zfllikbfm{zx;k{QYy*T)>XwmnRf%dcQd-O<DtN
zQ*XDYoQ#@7_+8vH^-g`?Z<*AX%@EBxYei&tcgF7fy{;8&^<sPIhn#HD58LP5A5Z^w
zYNHS8GEy{ic39DhxACaUK0})lG6g=SnP_%Nqa5$deJ<W(=u+^MgR#BB^Zz~zSJft&
zyaxEE=C6LF98s<=<v#_xQf{n{*+mg)l=xBG`DnN+`rtZq1o~0#PT(2Wpm2+akb<C(
zX99vok-k{iavbuMfb!j7aKb{1hVR;uU`JR)Q#tJwECMV`XGMet{zM_V?-EGCM;k%>
ziosPR*d0@J+7N_)33Zk|<lHz~()>=L%S}*S&=o&zo;qD83|P(-q7xS)fCG;uBWH#{
zz9fWzX|M<pYW^NIi2rMKy%mdARzy4Mhu?|}v+53;!6F23=qe1j3Qv=9i^jDe965tn
zg@$Q%f_O~nEtVofuhR37K-`N2FEP;7T3X=(DA*y~mlSr22W_B{0z}w4TLk?Q%D4R4
zDL(wvl=2KrT@g@3U)gwYN(6l)KLayHvBc9rk|Q;D!93-3vHCIhYv_13z)7w&5dH`-
z5R!unej`Q;&H}BGQOhKl$cBqjWYj12=S5lYK7DkBK3atoDo;ZAVxPZveU4;AUB_^L
z)OTuGf_1pYS}eeL2yku%IwLabi1ZxV0&^#zbTFU|;)~I7<P0%b01!8z7zce6cRCbH
zfk#&^p%REtstPJHgre<v!NHF>5sro4qT?Y$_6ia>!oWOuI&KjZwKggNKn*NWgQy^Z
za#}ew!{hQ7^3UkxFp1wqP}HyA+L4LMJ&8(UiSh@rx=PQt%E2PU#8YzOs4FFaV;BZ7
zPk?qJdCEbO;>lCaVbMaU(R>X+JsRzYJ|QMUy^`q|Q{-il*FCLmC+u2YB{=n@yh)11
z6H*K{>4X?xt##1jCn5t1UwMo&_nW@D40;kfVT&guM7yObjV2JpQ*}ld?8yOXmR9x?
zz(0Pec^nsC3^A_)Uh8E06ct)W)Pr8&Usow9c8vpHEWfsX37tquBZR>(YP_x%PoGMN
zm6=G>t_<u_vivv!RK&)#(Z0E5PA^ThG?j#yT;D|byuvR-K5@MH@r=KN47uo)HlZYB
z?3&@%f$Z;j^P-%Nif3+$XKr80{Nt9n_bl_EF!QJ<^JF=bLQ4cnP>5gyBGjEo6Gfzb
zM?_c=Uy$MV%0csmsmtR05&Bsxw6GTa46fcRo|P;<x@>-lY(ax;VfSp&sBH0f*^<54
z(kt0#>2hQxa?Tm#oOjQ;*aE^6U$ZF-edx|vaiiln1Zx@O>bU3XMdfNwGAomEjaG6^
z=<<|@m@gURU3Jg9)R1fTF3&_c@A^ufy?d@@L!Q%Q9^U=!Rf)Gw4S6>ozrFh|mxuV)
zz4z@sgM4)~hzAWikIpwe1YI-(`55Fse4YQ~FgIWl80h{M4}e7y($tlO*4blUNW@+o
zreDGrrbHE{zAh{_O&%BpzNUMZHCcE%#GK{+?v+(?-s5*gla!#OhIem!3t@F^tGHB2
z)55aHg%z)3UT75I9~IR_AsZwLN#_#UBx0joi%3z0t&^PZ-W3-}6g`<K{^VX*I0^h{
zP*SnN-W^p!>MedfT+|a)^rN?^X0oJQIj@sW)%qE;vu8@Q9BL%Hl<Z#m$$*;F2YTX4
zk|pwn-?4o*D7o2Fa`d>&kFoUU<9AT&(&oc=bSg!E8r~sQ%Erx8)>jx~2^X3Qg|=}t
z_T}*T3l*ro^10WgWfgA@4~tJG3sQ%f#V(he7?cVADiLlhpPek1|HVm@R<78`sT^I}
z&0hKO+$#lH`cO;pL{DRlG!C`KD%@>u(V}9BU!10CmCq+ARp=*G##~hjM^%mP+=h*X
zs^2*Ajm3^d)zZwV@*1?o3JN3V(T7AtdAUD4TlN%-s=*)__H6om-YaXocPOec`Bqsc
zQ6r*KN3yEBE?H%J#2IM)KIo|CMq1G=mG=p^3z@#v4vnN{PB7jDAm`%jew|1EF82t8
z^4ra!<~$jGqv_6B*!_H2kDsY)F{r=tr0(tOy708J(Azc7Z`Tuk)hHb`rdT(&HrBl=
zs<Vl1s<<s)a=;XggT>3@p&GRQ!u*y)uvl}%U7|iE%(*|BIk2&*Sfhscy0O`;IqPxr
z%f`A`uBPU1&DDtd&ofnXjWxCIAIXhkhvjJ|H<&mUDcZT^^sco0)_Q1GUDDw%Mts`G
z*YV9M4b4kW8eem^toGHkt9;xjYU<#sZ=NJwzFo>!Ofmp@CY8IgFgiteibfAHTrcM}
z03oul@VOyAX<s$Lbml*OEy0bAudG^_rrJ^u+gM{t1k%}*(_6j_7tJ3u!z<fWV%nnb
zqiTrioYqV$q?dlO$gf4r<({o(HcT|P+mZf_TJ-HQePtht+R-YVdfct1{@j<R+Gz#4
z@crjkhz956dG@f#fYq+R<1Xho8k;*^=&klk=@`@7ovN#q(RZ5OPj)``>h`|VjmJLI
z(JV@_>6X!=e|(48wFgCe2i-gb%e&K?@85f<MS)2!qF2bh#l?(!8@={TJ#e$G%aw2D
z>nqXO-R{MhL{*{MCLxt~LhUwv{nc_bn{dkw4y6h^%YO9U27e%lX<cK$|2*=pCp7Rp
zGTIaBf=0FD2JDHnT}_Os{bKb^eT)fx%{D!r-1V>T3~r~h^+-J(h+&S8YTaK&EzI?<
z0oC_#Fh?yKmpSD3J&~Ps#?F4Bi26aM?7@yZJ#EE9XQmnF%y@qe%Li`2rOwGl;33TX
z7|4Ck<6;i-HMHC9+VWqBBQI#3BbxT^u<-JbVe8Pj=by*7`1$1o+BcwmB--mcFOmS>
zo77Db0U@z9PJ@eRXCiGg$$eH8J?BZ$X^u0T7yYbM^2K`Ki%pKmomr6(thfmlnH#4f
zDJT}|C{}ZG<h0|Hb2&VB1KZ%)=2NeH#R6kF{pHEPSb&j`4j8fOZa1<)!=8mQAli3l
zOWir)G@Sk<nuGL_lY_LN9uR!cR|cP!Or#A=tlxjKIqO(h1UVt{9$?|r%qPbcEY0k=
z=*ibUov*bioKnn;SCc02+`Y=OwNW>pjtqaJ-TcO*(RVfrRn{-Z$%rbWuiSr$u77S_
z)x>zb(R=!Bf)+HsHv}`mLkhEyyh(ID{^u>Lq(=OqDQjQFr&)^^<y~;FJ@WbS%QTMy
zz9}~K-#uYUl%47tW;l4xT8pPt(`WIO0tbMlXvlB0m#*?qI`cWbfh;0w)NmkT7Gb{u
zz0*if%{@GH{2GXTGV1UNYWBlFi`E%8&`wYpZQ|P_=>%fgwlrq?%0&W)VAn0C&C_pS
z`cUcL#&yY$o+YC?V7FhkpfdF6wx73^*fJkV@joIem(KiP$wDa)vfVa9n>C}a88a$A
z^mMJDKPxmqCikMUAOSJds|JSSxB$xHOjn8PZUF0R^rOD=-W4n(wK;o;|9Kim7Z^u{
ziVZDn=hj}L^7|QcZF-sg=8siJ`r>(iwV)0O0kNdn-dlY84&)>xW(-H`#lXtAOB0Pn
z{>C?qEG!d$qka!jV6|jq-wYxIgAlbq<N^?FL|;5Lb2|hRYC#oZ;pbRTSsOG-R27uS
zXY?CYdkSwRq3Uk^>|1-0U}v{AJdlfC_)Tras;zdYQA4@BV`#c^+-ee0x#9h7jt8h_
z*qu@Z>fdp#JGr3-!w|CZfn#_9!aqR1UJc%ax8v7FOBVfth8JZSYe~brMsyhI5pX59
z{tH%5V{{*;%pS|Q>1p@K8%^L{;`n517%-}Fe?=r%KtdDZOh#NM%gVKSUSPtC*$eh<
zK*~K4mH^h=4H&tcUUC=ec#e7=QSu(!E2d{naIgnN!+GX)X-x=!JdHhW`lH5H5{@Zi
zgF>_K`{d)-C!H|7^43l)QSz_QE_NL`GumgWyoueaA^({s8f5b;bakqi6E0Bmyz)PH
zX=*(phCEz0Jb)KGe_!)F2=|=xMfDLOcRe}%FEjpm>X|T$$kC#W=Re!I2f-SlDH*IP
z(gF?S&p7GP1=~@c%+Y(itVnfqUmVnw;m&^l+<X!fG-#6(b(GgJ>Sil;2oSw5uw{4!
zv9&4s2!!<oJ-AC?oWA?Z#FP^}gSf6ucjR!d%ii1QJ1m5VculVVnRhRcB(GE<YB=}f
zpKvdJ9TmF)Z2&yI|J+WSbYf!y@fSuc8ZoK~;D2VFq7zjt)X+;PS)vSOd!U#CnECYM
zyzum~bfW<FlU(5RBs_FnB#mSh2steb+sOE+-i~<+;n*VT1not}2`u#e$hKl(quu!v
zI<FHhaQAz=_)uh{dM&<%b9CfKqF1iI+B3GOm{Ke4orA`Fp`RA-_|CTkN1|^kJT!+&
zc>O&4olkfS^Fr{-)ita4cc+`fxUT=UY4BP5-jQ~F-L5&{<g|w4%xsQo1O3k@IeqqO
z0tXPS`B0xF)xhIOT=KDVMuOLA<;{t-yK#&!Pb=vgM<%wHMiBf@vz*7-6r*V=gf^8y
z$wIyD$WggFUw@P<XhXAE3Xb*#J3$^7-6hweagKLqFEZ*sOCWXf#Z!)slm=(-nWMj4
z++2zsy&UMm?yCYe&nB6EJ29KBmWm~5wN1&S_2lNK&uL?f?*+MLNRG@Eh<waFbV|>h
z)L%!qostarglGBtv9?=5y^^HkdWoV4%;VWYf2Lsl!m1HYSzQj7+zMSTk9Ju-o`>^{
z`CZ|HA$)<I%Ml5ewt7M$A3fa>l?#$DT9pHzOUr+5HQNKKZt?`Lw_C>$wJ<UcN?we`
zIDbe3zuR_~g3Q`T7u=_mAJlNxqF3)txQv9!2erBMs=>wMN2MiC6}Mf`H%hl@(j{{l
z#Sl}toh!tRPL<M6Pb%a3`5e24L|Fum8%y~DVd-VVQokoyxG5+5+hx)Kex{9Lshwfb
zXs?~DB>EXn2)!n4Ag8mw@FDF&oIi|TAj2V;d&EM7B4I|nY0Tn^wmgo{8}}<{V=dwR
z3)1xdq;tX6XY4~?uH<UYe3ay5cbA#4dwkL*QPJovy5ik0G3>$_gqsab@;$*ZXWf<M
zFNU5eEld+_jy#*GP+8~5sBrhnnv8KICWLvZvu8G1%F2BXAvXxWd{MX*`)4jrbXc#~
zTEy#DpXg+rD6hc$8cVWhrP$ETS7-mY)TSKOhr#ppzT`6qu*z;{OJ)=lG6?HiY10ZL
zH}zhh951hbOl5zfT&z>+FU}<}s0h9jdFoky)*-Ng>i-B@{XJ=`v7+{9Ic&w{s9^0u
zYCbc_<)^4;&K#}s;Qmz`-+zNNXZ7?Wweux2@*mK8mp#WcbmFbFvgrj3^wLj!A`c5s
za{PTo8$Z<_TAnD6=-Iz1oyy`g6|z~g3P)axWpm9KXA?BXbp7@k=zL-rCiW;u^P?HF
z`3;^^--mU3U2i-tH~i#eSN|8Jd2|^3Le>1}SL@mD)qFjtL*WX3Wil}hKlDm9NDAD>
z(n)x7852939Amk>I|mJTLE&GJrW;Fa^2q`(&m2+tZA!}Qv;PZex+s6CH}-x1`OSK$
zi|T@s$>Xn|GxpkDC~AM|P5yrjX;S`oA<eOdv5tGbHI25vea9MqKt23ARP45r$C`fX
zcs%~nXt(=*?8ADPhyQ|#{o&WK=DiM&r+*slPj|;YQlOp$s45=BHcq0^^$b4Kgoj-i
zZ$X87h6<}X&|M#IW$W||Ki}kld^q052lI;5QFUZW8E+TW^@_UM<j7h(-f=eEE9R!E
z6X)1?=Y>wM7d}l+ynEwa>ac&tl-VY_^>ptiyliq7xiHaV5`I4^PxYq6^@-l=o%fS#
znr_NGoanQMdB5sVy(O12(eI+`{rXGOEn$V)i2;vr@AL&#7v-^u!H1pR8Go8w)b=Jm
z1yY|Gpch>=kK{4`-^iizXQh<R%c&|W{SU!V>nl_+^y)uas5Mm!wYm0>7V6;Sa>vQ$
z->Fb97d%x9^>KIl2Mqm33w`40_750Jr9ypteLwjsQ?*cUKSGF~=g^~z|4^Y(PksNL
z3cVk4AvWYO6%2I@Qwk1?DGF2h+YD9l3@`alFqBG#mM1?WP_@wC&$OeWqNr5p>zI&+
z=a(M7(5Gslw_**lV-441jsDg`js4?mW8;kz5|gqLpHackjl?TdGxSALrq|zK=s#L$
zL2B&3z|e*?d{jD~YKEq#r$7E%3;q7L7FwE_^pxoGo#^{E%Pl)QhpL5Asn8#}{x9FQ
z|3ig-$iGk3La9{f>jLUW37>{{e^H@DMa5Jt^dBm;qQt+sG<&u*D!wcryR3tXgubi{
zepeYnr9!K!s{Wk{Eq>qg=Y7;d?W^V5mznj?iS@B9^>I`%bi5&+YKHDMB$PD{uQa}<
z;-SS&iT}u<|FEIeA3yJs(*A{qQsvP1Z5i$D?d2WRSGOFhA4-)&_d0W{yYs1dXh%;$
z$A9%h8wX0Me(0Zp%KyYe-~Ww=PAv?#{T}{6l|v6cH~e>a=s$93&lu_7+0e;v(^NV1
zA2xJ)dgfnp=$Dy6svJ5tJM=dm`uTq*haN0X|Mzm}`u|)G-QW4Ya_HcP#=UiNTQr5w
zq`B!}d+BqL{io&+M|+K*5B^;abrwTW1LS0?918yrITZh2<WS~+mqQ~p|B^$qnM4+e
znn;=dmmKOuPnAQRkOu#c9Qu_wpK!jNoQselZV;dAU2|Kwe-1P=kCY{rFCa}+fw~M=
z?A#VpI|lRxLoKqG7t`u2D{h4gRMY-^<Ja)kh{1GMJeWop$AL)__QPmq2E1)CRh&s;
zF_LF@V;)cw7-lxgfz`}i7F$jd`jjW`wrwDtbZ<xeEmr_DgW8$GUiXahdz54?`ewLL
zJ_pEcP7}$r1|}*9_JHx~Y#rnltiXra79=c>ACDwOIX|N@5z;o{OumzZOa)q*N$7sQ
z);EmgZDKMLqdC+nt*?0h#1dIUH~IphaJZ#e_VGn13cYOQELF)b-Y2Ee3~<%qH1EWk
z*U|PIbn7y_iwjTZ1!OZ)t2IDvIrNuVVA-i_e?_B^$t_Xc=Evx}8d<p&G`XOeE79EJ
zOk50tZGcKW<pL}yR@hBdb6G7$)$oDX3`>G;(<v$Efpi<Tatqg)oh>f`?lG(qZa+*k
z=Erx(BQ&Hx8v1g^7^-aGo=8c?ofWGipwwbQvj=#6Exg}PfYvDB>QT_uHvOiH7oxo6
z@Zb?QxlT|}jrt@uc&%s$8{8}D2ADz##yq%a8jU(~3a7*Gw<*1CCi_1axr~~>FgYCl
zE1EkB!9piU4V_8PCs=Q}&-e5<)4VOiCK#)vi}F2IOn$|$SF+_g6NHFaz2cvL+Wq-H
z|8Qxk{Ab~ak7I%b)opRYVYqG6-YW=5C?N};6hgSRe<hMI8FwT~ZQH6-`OwKsnsOLQ
zoYwUrL^hdV@H6(nNAd}1hxGe98*%?2Bp7IwhD)N>DOVkwPvJB{vtb&jb`+l$D6XD;
z1_&E0V?D*QBfy~`|8f41(|r^J*B=Jp8viZ8<1b+p00eTGXh6#w7lN~5p#yMA;BIJT
z5&F+d178xZ(xuxWp`jpZ78WN!jA-b683TNV2?f8?IS&zv^$8my0D6;|q5F!P6T>o7
zQ9uw%vvgUum48(-vdbVYhLVKm`_kQl9NFY!8Ast_#M;@NHlA}FegdC(I&zL|HjgOv
zL3;{jd7+NQ?5a-Tllt=lTy70FdvaJ+_Gd5%+Jb<j;m|hMco=kq2q+{t3FKar`~DLY
z*gq0?<eG*E_fkJoJrc%C;BQMR@AqVp;9SOB=WLEg0-oJ{+P{)TQ;b&)+5yw!H_~w<
z@tP<=&{baVw+i$%D5Lw8VW*}d=Pr^d{Ssd_xdPw4tgyj9vwCpuSv|mo9+=xnc(HkA
zr@Ldd$xWGU)zJ9<I1T1)O3c%`c<NCK;{YTfpZIRQ5PO4Q0?&hkUwL3YK;l|Cne>CF
z;vN_5(5Tt*(?Hek-<^N_ig}M;%20XO|MLo8z0h(j>&@G!%TeJKr%SQwI`R2xf7l7W
z82P}dB=3)}zZx!(6+*Pzkd{e$ST3Kw0RJ;D=PPf(p{<(I-Dh7T&almj!L=gp4yT@q
zy`tIWA57%Q<*NaN08yi{nirjN@>EtdUs}lq;oYq;-Z>S%dwe9iuO58N@cQya-9Z02
zlas1q;cC-@!$(q83#~K+{H?1!6p{0Jbpg>}paqC_q4kDXc?j+rCx#%M`xfk#Ok+y2
zVNn(2kpQqj`FcpQj?Z}k0xOitUnnC#V&Ha;L~7-k&sOYx!9T-F9{{z-Shfu62Yh~?
zz&cxP<yz?hX)f|1;#ncR;O2pV&RdAq*29Ak!;#!%^=ovYnt#54QAK6cc_NgTf;O)&
zpsnb4L{FUXroGWz>BFN7_+b2Mz>Ra)nuKC>QOAZYY}{n6s<CX&B!dW9Orov5<mCN>
zlq4o@_lF<Tz6q4+7<KIEvGxfo%W%HObf1C8KGS{ooLB$jC=a|IA35E^dOmS=+L1E(
zJ|tl2g7qXZRyF48$Lz&^%9}VR59;0O3q61s_mx|a!X%##_Vuj*S^UeV0gQ&l%R{fS
z^0w5l79|fNF*G}`z6R}X=0nsqK5n>5*e&dISsO%#xvb7`AQF(PHyLp1{__QY`b>fp
zhkdngRgdxVxUuKl=;4h_$+v#g>Bh1D_17d#>e3%2+C}g5$Wo2ifvW{~px*3dtX1*(
z)MO)lA>_tqcf#r<^4=rN7y3(<w6jGF6AjEmC$96n;i0idGw-@=27jmIoMfKr2oivt
z!lf!=!fd%u>VF{xB<O`{ln%a49k1ZkH_Qr{#5_}i-|%|uG4|gC>YKs!YVo${=@EuD
zJYDqzvw`xF{qx;WJY_thLYqiZk7~dyvI?AibepttU-HY2$X2IH#`V1(_V!cL`YfyF
zA^Sc*TW&iU@AZ0cWvgX5ju651<~Po6LA7Rdu;Io?3moU~)CziBtI8W6UZIrB2OY7N
zshup)*)G#*uFK3Omt1*-Dk>;vy)Nd60b!dy1=AYNX4(LxY6IDRAKZzDX8@{d&LXb#
zM3%zSYc2;81sbf^EU@BlL$516rAawSgcp;t>_k*s{y1rWj9>BsoJr)BJOjL{qv$^7
zm4Z3)R3?s)l~kUPf2H&{;-vT=kFZVuTm&_!Qx{&|9Zvqd@#Kf(qyq7Qc8E2Da?a3I
zk$|Ap7J^9}n)1C?Or|95qogk&7~x(HJ~v7iLfq*REGQJhlF))X``7xNn;DG=LGL8q
zqEmIz-rndfqA@5w5GG5Y5~6RvIx2Sr_T>kb-a<nQ(7xs-(3ZalQKoTB?;@I8j8Sm>
zFG3VfB}C(be~ty)Il#g+F*pn=1^~H6B}CC7;7agX4)dPEMe`9C6-GmI2U-}!Pv%u<
zMV1X!7gcwry+(vwBSM?wkhjnp0Fa!T1FaJJg2B*Vgy^xrnHuy3^4n0?CC>IU7?UAn
zlnzFPsO#BoZIT@B>la~E5q>O$YSh69m?Bu1F(1MrLT^MGIY1@iBA@MpbpBxOQ_ysq
z9X39$kx4h6X$(gqv$d1!o~6HHd36Kxdi)tx4y6*JZJtpDucF#E%yY-1O82A6|0Rd|
zMc2KGZm5fHq7tH{zX(wlc1D&uRHt7|#QB(C-Z7oy(SuY%v|QbQ6va^izH|%S<{3_7
zhTV&B1q%cjYcfu<Vwm=07O8}&r&t#5TGlH@sbDlV89k+lUdGe<>YCa(p=T5s|M<lw
z$Ho3+k6YJplOZFH&~(_O%TYC8Ko!lLh|Q@fgB1pZBVI7@#B7j3sO=XUM2G<P5pTE&
zlEcQMO_*WiIT+}o(PbqT=WZN~vf1(x6t_7dgRT*sXee0;zo=+J9I}iIiWcRc#HtSo
z#1;LgAFA(`Bpm<1B+hNKnnr@Gzvqh;8MPQ?zCiO9JH4Z|UPmK9kl~F(@-l;KJYNnn
zse84-rGpbdSqb_{uyw&pvSiRYSj*i_Q+yjf4>||QN*GK4FYmZYStzR>z)fe9UTXa9
zhYo?LerPxj9Zm!=k$@nLRQgSzAC_^P>W4DEuGy!*KO{gmC!5f&`N>mD=A7~Nj@~j!
z!f5vVkFU6nQB)ZoCJhp&TYP=j3A(qdCk0741-LY~N;PL=>5^nfO2*CR(iEVYSE|e)
zND7(*2_xB5o&kqp)eBl*#ZiVqd>FJmCiNdbv=WD2=|OXEq%xU7<N=I3O3`DrD%)D9
zclD+{Ll}n~l}}_~LXrW^HN%UL<PITGw;@ckr8Gc-rs0b2griI6vvi4``*pXZK9Nz3
z?^K%2m3uYcbh*9Z#pqIi5GDzlX%?{LAz}7E{m@uTq&yasy^PW!(#w;8mFQGy0s}aR
z0YG3_5zp0@Kr6oc%MZ1~f*3HF&`lWk5NPEY&Dt{R&jC`&3TY{Uu-gDOl2KOf8K>kt
zLBQLJag>B9=n3vx$Goge`9ooX>wO}vSe&$kX};+Q>d^#-Zqh;w&9L4kEA<n>o0$KE
zvVsb7r0u+)wJfKOp98io2<=c?0q+YQyVEuYOA5N9gO`ED0#Z0KA~(kwS`SuW%}H<o
z<P#X=-=WYra5ygK6aZu}g`6SKtYc{v=u(*h0A?(3VWX&J1y$`{RA&V|gNHNY^1u%8
zqzMq3j1nY6K|sLa29S=b#hL=gCjopoFdd;}as@TDQbLv}tyn^^uz*RkvTe6yj&QO#
zoOm-%MwTGeydlc&DEsx5R@j!>L@>WXcv+G;LOLNO`?ZWY4MsfQxwlg@%d<?|IffVT
zu70;1G$U2k3J=u0bc&@n&jzi|zKb&}H8ah~#{fJCGz=TB&}ir>1rNWuf@0oyWkLsl
zR#bsDD`i!x&Pt*;-O$`|r7$A>L_^8tN0}g55IY79B2_Q<mZ(}~){MuPvl_98#b9Y}
z(rN@bIvaP?sgV@X_%z1j>n|kw*hiItFU70uOlz}gfhx*q+_x(AzN!beYt67Vr$a?B
ze&Ea0qQs%<Lqd&dbcsjYTPh(M)mLYg7R~FF?(sJvdV@-c;&RuC8Ghet!4-A6zfc*7
zhQA0=Kpp^70vi5{5S2Fo%M(%Dgc=V_-HRgX01eRQabtaBQe$H@OMXnM3O_r!^mGG8
zM=V-XYJkWBVZ_vLhgDxB(SwK&%8~$f&uS=T6UjsbfQTiP7yt|nee(^#ga;(t2Eg#e
zr=HErjm>LE89iwq4~LVuT0Xippbab=E?c63=_TOfTpCq0u=pc=aj4)%9RqjERas1j
zyg87G;Z>xh@Qyf0;L_SWiaS@civwfvhjTrS#FXA@tkJTFj$8mS>^LC<AebR^>m_I8
znlrMQ1`~@%!m?X&^nw6K<bTMa>Fowh?b^ri#l%Vt?hb@pyP-|THUAE6Lm6QysvOF9
z<G2Iw-)>ynVQbU5)&jqeYi}*@Y{j)t5*ZwhJBCP|o`&tlG#$6nyOw0z_uhk_8n$1<
zL%r^_CzrRok-LOVyLBj1G%xeJUa0c=uLAXsJ40;RC9ZU+5xaG#kT_gt>~YUDV~@@%
zLy#dI6^yi^a<q78Aq4hu1L8K+t8GY^OlD|B8?~A;EaK>{k-={G_SBg6=DmBc8RUv*
z|1pM9yZ|MZj^6X^U-3i{RR^;9dvy%ya2tJ#<+?JaaFsY1_Kq1VltCEZg(uKyr-EYv
zrePa&7j4>GV%h^9$T<>WkBKxZXvTvLFbqf=M@DyeezG>D9km(Cm>FF3^w3L(O*ZM4
zQ8iXP6ni|htT(u5*q&n8E?G&d$NfofDh<vLo5wL8-9aD5^`n6Z$lW2S5)SR+A>IBV
z?IvAq3imMUbSslINIS-uy`=A)G>zRX!$xtB_A%WWK7f{g1mwWb;R*jrqAkauNuKcM
zru3i|#A8o*fBC21L-6O+D^>ER5e)hmKx;b<zubc=B-8Zc&=S)lo_9IE+O*4k7)YQW
zX0jcuF$JZO86>J`rM26|Hio{S8Sbu9e|E3->hK~_>V#=Ta1B*XfJ9&+&oR)`A-FS+
zKEjjs)RfK|&(Lp5e<TH~Go{HRqrPI{g=?t1fXTv(@W*%t$2bP?=2x#b-{NJ*v{$9X
z$PC-s?O~W<0+Wq4y{i=frhSKI4hCxl2uqZMNyR<fkXLb3Jk%3D?+HC6K=vpb;NO^u
z3~A_BEc%Fwhhh<w<B5`h@5>Cdha2EGBt${LH_4K3`vdIp$70m&_<5;O-KigXs|=uf
z$VmV>jE6ym*!^VyZ6G~Sjzc~kn*K_dIQ68>cn(>TMhmZ@>W1JTGrF~bPrTpZ+Z*62
z5~9iU`*^^QgOk|^+4e7FA>-K}3pPE{hI3JCvR~hf#xo!o)n>k*fHz6>>KmW-qy`R#
z{*prlWza@Xp(OI;!PG4F=|VUVGQ!gZeKDtVOov`Zqmc7V-=|Yg!0rG9^HY>30b&mL
zA@qGdb8Ybi{lgSF`|ShtIu^0}{4Y850t==L(8f`Xl(A{sp;RH)s*x)64!<xMnQ~;1
zv5=z-!yaaUCLRTgM~N9Rz8XZO*wM+H{>*J=J11}b$`8ZJ&94r})NQpW+>wd<ZXj@s
z4k5zocqc@G^mQ4Fd8fbr59LtfNUNj=3kfTyq)=W`3ou(u7}Cm%o}<d4ysBccLQ5-y
zzkjQ(hsmxh_^+3ytV>j{-x*z5xW}Va`~<DLWc{TT6udMo&<2`qJ3U=Ti(uT+HD&Nf
zdI}u*Q3}n6VG7&~X=&q(Z3~&*1cA0d0@D$^t+Z4*)M9nvGWRWZkL{~5+oFME%4O}U
z>f1wR+v<Vs8fV$H?RRwjcL?!22C>5;XLmjUg-twm%wl)c?Ejd0up3i$4A1`Q&-$a=
z1dhGPZY8s;W4LSCyx>~4i%0Re#_VdRv){LGk2Kr!rtE5E{<-P_Z8v1Uh3US(z8B88
z?_;w6c%9qUe#f4|7X4}e`i~ud`#;Y!_d7QCmF*7#f(}yo4qm7q*sUKV2Obbn2eNjD
zZ!@>=mmTErahH|TmTe4OHCf8{Kn`Jct24K2%l_2=IP4o1V6xr0Mg|>ih(&DDB|0WH
zmTeDVk2`+M1qB_S=QvjXaop~4++4;jzx3FRvbvz6`i!s{qENWqKy&((|1@}gVIlJ*
z+UuOKyyylW#ap1ekFWE&3}ru)a!8d!KT@Vq=*7R}&~maMiuR0*^WSnPqp<N`a%ji1
z`}FtbU6K5{ar~kUSSOL!>Pg~POP&8$a%hsMVEm<*YEv^Ubk#4oO5#A3qbpa7ElYmm
ztLLs-gp?Iy-(`JSwXAlje+;!Ym71vb;%LA-kN&o8dh{<j^r3FiipJpB`)6m)8Xpgb
zb-w3&h<$4_v30YbN_lURTcaEYc|~rE*iP=ajig@;F;?XK^XtVBZ_g#ll4b^es@`Y)
zA30R9s4~n})%OZ2Qbphg@XNmU(lCcs&h*41y|BzYkDuS)JYM_7UG*>!SyC8HUj9<%
z^5gr-5lP=RE>`VZ`kQ<hUuxB?rcwaa^%`jU#Cu>uye?mvtpwzHFeC@MNS(@o95`*X
z0Mp(f)Q~DW8&o;8-zXzgq}}wKt9wYl;ICGdO&xXygJJQXM6-boc5i>L&g1@yVP&36
zPx7h~wdJ?;g%T~8F6CaMXF9iS^(0J*JF}VzH(_zyT`t+kg6$ieA0N4NmSgTtoA74~
zZzF|o{eASPUCGatddFJbAC<O+*1N8w?;Dxm`sRvFhCw&!`6=h7EFPHYa`~_bv#A!0
zn7&9)Of)xi(7H2Xs8Vz1ib;zB;|IOV=l@t(j9nJ9xMuA`l|#1;#jaZ2uKDw|@!E5r
z>vm75a_Hw<9X>Z4qtAa8whi+6a)$k}!yP(Tb&diy*L))Eyn$!=9Y)vX@>OOJC*e@E
z_gkX&#PzU?zP7&Kq|aMEP|>*s0&si!%F>Czan?a%sTdHzrhYZrlh%qKa95(u0R+XA
z(}&YUg=mo9!xaXD8Tx~O0O;Gu3l=`pXC65x#D?xUX|=@@gS@4k2tR_<X!qq}E;Q`Q
zv2&NwJB~L4iR1!z8RI3FYXE{xk}N~L^V>9E<+{YguZa)}P)sC}Npz`hEL|skNsv3(
zPDcM$5%h65IW+%dHrj-wpywJCXXzZDJg}U1&wHL#j9c?<c^EOBCgIy!6WdIr%k^gc
zZ`|%nuQVrv?i_#^oZ%~NwC`!QIF??J6-3#)2M*dNOiu0QqtgavzO7d*M`GrJ<izl|
z3;)<0x>4oOfU<(ydm}EqbR(Uhf61XivzZ+FcY?b`;0!N*eXxWBSUmxN;0ublAO;0O
zOZr(P8WR+B2q6BZ7umM~0+Dcl+jAd<t}_5tR#z}BG7#?sV8`JzO>uv&VbH4_H~<7U
z361Ik%)3c}0dcr}#S3U<Ka~IM=T{UkOaRFAN(+REqpk{V5JI8gr(0T_!YtiQ^ypAd
z5FvGa@j>JCf@y@x)TQ-1u6a5D%mdJ+Ab^z!cJ+_O0}wn5M`Wu?rEO;g=(qd?pj8b3
zc>hOQy6@RH0Ni9;;367y2%9A!;JIw-%vs<9MkJj!9upKj4I=H*|K^c-l9S`W^(G7q
zkaCQ|40WCpBN99yb5WrB2^NL-LD<<fcg1~2_KPquiVhMg03kpd>Y5drWnVl}AwZcH
zmAp+!AoZk|G=BRAH#+4+)SUBP04^y82>~F`EF2i-NJS^h!n30t>j9Wfal$8VAq+{^
z^pfs50W@IHN&~w|@dLUldA`^cTx9ES0fWg*o|-KB%^P((?f^X07?UrXR|5bQlRaKL
zIrX=)HA^=$_)-yX8Z9v(jgZuvfVx`>Kzx647849qa5L3Y>~f^8#lz}5Vlm~lib1Xw
z7+3D@mQbblj-1k9!2!a1Ir8NY)v6fCu&%1L1jO6f3nVm6y0G6fP%De!Ms(+E_=%w9
zXFsKZfIm8?l65?wA?|>2+@yjY`c@0>ozsquI+Q6WP{GSvE^qk)4sB$SfO&l;U_?v!
z@wMuxm~7{cxPE%QICytFh80VqIp_95lur9G=l}$e&_nYA@EMREk_4jCJmd_322_`<
z003N}WX{S*a{+Kz<*h5no1_XO3nBW$!)vRSMqK0Gt+=i6<W?pK4IMi2uu>v!K#8>y
z%&%eV)H@oij|smcT_pMW(3<@Ic1e>Dni<hLc<WDV+JhlSZ21LiST2b*P*{ZjPJFqG
z5DC-*4`(*G9St%hGj}h6J3R4(W#r44rJ7<+Ab=q9+6fFJhAJ$f?b)#;*6JJpV8qW7
zwlmAjbc3+H7!9*F9AX{C68w%xgi~n{O|Eq=ju+o+B32>z)2K|gK94l^daiK0WIbR&
zBT_Os7SQOke&-pNU={3o=eegTG<MuVt6s?TbtAwy;J}UvjSPMhI{PHz@ENR$vIjiO
zX$OCoBzW?J@e^F|-2zoK4RV(Y2_XS@X-ROp(0Y$Af&dU67<Dnk4<LrC6Eh>tDn&D0
zc}t!>#1Qs)%LUD!dSDBISdhO%BJ+?0SM9Og*`j;FAWzU#Gb8ZAcSSwfw_bVDAKuOw
zaN;m%0IEPz=cn7?8TLHGvzkU|=OJTEix`(vf$Vs}##z}<m>Q)F;O+D8ua7o_ujH$=
zx(DxQrt>`V(Fo=@)-)vm>b~xThy}R0>Zxd_-t&Ff9Mt2x+j}NjA1HP=5(u!sC4BK6
zs>%zv_n<0ba{l+AsPTX#HwzxTvpp?fG4T8Tk;3%R;=?CjpHp9gZO9a$+{2FyPdA#6
zpO6tQer+Ln9-(?Rvro<H+Ae8DK(TmWBMThPPTWMm#6Wx=qz`Ab9BKZHjQJ1jgJy4Y
zj4=Y<{y_gX_U`l_>i7@%{cOh07~5E92HBUf@5~s>pzNV+W2Yor_B0#D8rg|#g_JA_
zC5<gYLMoMNNKvV*CCMDW-*sJ&>w27XZl0UxFPIzin3?Z<-k<mD31U;;d+A$%1ql&w
zm^Bo{=Ms*iTh9gpk0QH!rE0QWOMG7a9xtI%ZS1GW0A~N51Pd|m^1EO`5Yqd5a*TVB
zBog2;qLvN8Sg|;Q^OQ&xJRHo__n-w(Rs?seAmCZtg0EmoU4k$FND9#H&b;vOPLqP~
zW>@b0r5-#7a9lUuYs~3Q#km4-u1{2uh|`-B>LGyscUp35T5}@K7d%V?1>V=IvK0vA
zYV-!Agy>WPLFNTf3=)71!Rq-q3f>%L_uJEM=^bq;B(o`!fO0d|Y##SG2*%uEsQ+-G
zjOcNDUzDKgf%RP=WkmxO=t^gZ>ivfcRY!<8kwBE5uiSSZ9r!6e!V+M>>{HS=MZ-v7
z8Ri$?@qS+fV=<?7=UXpFvxGDqa9)4{B>=d3O$V|`XC_D*P9&fDjBQsEcda@a(RU|S
z#KS-i>ZI`*Zu&5r^ecr_Ajsi?0RV?;RV3(#bK139b+JmQx3O#)&H#1;<Nr{h8xKdY
z{Y%C}O)6%Y4P`&WjiD)bescl#T<QQuHE5HLaTSgq;2h2)D%1%T3jk^#z0z}NkRqx>
z5K#U#odp4qAf#)Y3kcI#04PlC-?y@lWE?9S(8o<Oi(})SF$T`GGp?wd8#f6;kpUQz
zUcbe)<j#+1K=)f|Q*Y8)v@{5V>`uV}od6G?w+l*gK#h@mOTBrp;foUzY{`Ju3J|cM
zr>YLm+J~69{)Y<HmjeuobFeW@Wgy(LmKOfG2FD_LH7vmb4KxLBMKw5ydrgC@Hp3A^
zQkgPSYwXYS1n9a|#|q%p>Y;ZgYok7jgE(#+?rV6}f(;?cema@Pabo}!`TSZdH-n5-
z1#q{M_}rw-<}v3;IJvKlz5qgO7yww?W2l8@KZ5}-AfPiDQ2+#@mU<^efz_>22McIA
z)Xa1m!FNwqHA-+KE}P^};bHA9nECtQ4S9AFPD2~LFGC1d<(TLk^joA8C9SJhdIExa
zxi|1^B;Xk$=B*%!t=5VgYdKqIO>Vay8nUL=R&Lt@R|SSy^`dBE%{|xJ`x7RfUN*5&
zr1<{fa1+45mIis;gjzttNpfiB*7+XLlrVK*%r!0*dfp&#?yL?_5uNr$g`>9Y_qNH2
zseT8Dsn9%BDu~exdywMw=wtM?G))31ic%T`=-amFw$}ph;i!N{pMG2F_>*eY6XD-%
zGXz17Q#Ir`5)lUAs<q-GT9OSOo|zhIS|7+O|F0Cv0cB~XnzM5Nj7Zlsj;PRrhN+Lb
z?cSsgh;crIME@gySBJfO>h?W1Swx(b;ZTjB#WefOi98@c2lddZoiv`Js>uytpLyJ~
zWycl+*wDF^pDXcm6EC7o*N~K%BoCsOb&xtF1_-dyWqJk$+$KMztm(N5J*A*dJkOo6
z!=E6hKzY4rpi0Vg>eB_<)BBAXp^CL{=gndlhVnVsgM_3whRDp^77zw-W@D0!D*N6s
z7z${Faot+Is*oL|=E3M<?GN4M)V(*~9+RwftR4cw%IR`F$y0iUwRraOE%Jt))@1>F
z_wZB{XJ*e$N4qGIb5S6K+<iBr8$`TqED6c_Rw;srctUhS*%2OWxm0VAaBq&jjbM)K
z=}w&AU77VWq;Kf}PZD>z2B?<Gn|`8EwN`_tmN+yd_-6FTL}O1hr_N*moB+9+*EC@G
zqnoN=7Z;zPM<6EQX!)AGoCIkGWUo*C7PkjR0XR^QAg5aB(T@h)loWjg+LG#&>(~si
zqSZK(KZ%!#-%NGcwtQyhR9pSm$OC11#DfA{+U`6caTx%L1KI@b8b*_)g0=1Q*Jejg
zDRPs5Tzf`m!T_6IWVr@XspQ0jtufl5j<=m8dO}K63!o)@!fe--RHBGw>ph}Dryyjp
zY=BiK$&rJ^Q%jrDCMENdSZB#52+0S$1(ra96~#%6?fy#)PwnxkrY%Fy0XsZ+;reS;
z5(j3yG#r2s0-T?7(zxaE@;>t1!Tr*T6Kpct90h&kL@1{s>FA?=xT3J7^X%FIO~2>?
zWJBZ}MjG4>xbwH+vMC@f{G^6XrdgCjpD{_K|K^On1n+3qHoA-p15nB}Q3_Noq;<ZZ
zI=&l|4p|Uo|M!se^lhBP0_i!_V~>_5%<+hKabgeZwMVNGz)L3fJd93H=}LF5Dt)HH
zafajQZCsqhLOlpl6H)2zvFRn-UYx4*(2d1=Yiv3YAbA#Qw?@4uMkjjG%z8~GcD;M*
z!1rZ3AB@^EpL?-BT-O|U=kqblc`2`IvD<Avigf2&%d#;2(m$WIr`61JzVlI_$Bn*^
zPq{ACR{5WOznbT}5nTCY)OSnG5C7-=#tFX!F~99|e!sinJ171A=$78Z6#jnbcQ9Iv
z22%cf|KLF>vVY<SlqQ<i@#<{)L8hzGvwWaPB754E8;R+Vqd%YMLW3kC&oq-=49?%n
z%XLV+AqE#^3h}D@3tHz93W+dZ|0`rcQ4XfyksSJ%hwrnW$bf%BA-h3z_Am*GJoHEL
z1)!w^WYhy>%>v|(<WS!L`N#l;v;f8Y0HvA$<+gzTC5JAf(`Ym8{*ruw@k_)$#lZi&
z9NOpPuUYdkurSku2th>wP2UIpZ#k4NNQgj(BZ6@1LHt;tWn_>|S`Z=sKXRz8JBRg+
z6;t;h0Y;F+k08gx6~}u)jxU3p)IZ_$sNfrcC#@~`<ON5u`7#|kQa^YQH*&>GgGJkd
zANPJb`6JlxM^;!E?*u70yz0|fFOTozPZ->18sMW}T1eQ9ETVd`hXdWSRIibF#ovMM
zcJFRP{HJ@^{K))}81>MSf=ohRK{M*}#j4NdoS|nO^b<mO;`KsP20|}kLs6&r_yLr&
zrK<$7rIF^)xSR}<{1O=zmg>6}R+@Pew$>i@nMHpdYVw6Hei$0p5cb!qAmnja#$lMB
zUI@Y=geDlCkNT3P{Ur|@UJ&`EVEPl8_=Tz+;!zr&*6@Y?Bed*&c$i*zm38lVdHM`u
zmCF5<j5t%{@HKQgWF_iz(?{m4(^?kw47uRU^?@^*(;@sDVNJ2Cgx6o0+g}qOpXqe}
zgf0wRdcK<W`RfhWvzOG*_U51UmM@W=_rG6ywtxEU-7TX3%Grm9XBm7EgVGU0M{=lH
z#E3)0sBgsMBRMoJVmv?MNzMN+hq9tk{4r=`jEqLi|2J|d=4XaIiFT?TYV=`y;0OjK
za1shANW>1#gX%)yG+&Li;?E9Ppdg79mv*S;9#GDSidRg>qo}x7;7bM&`8}X6DcuTr
zp*o5k#{z1$Lv1p_-bXO#Ozb68hV3hGxWNS_(gl}iyA>N?3k^2iJ)i-W(*R3B7Eo|e
zyS9&FEixfK=YN$mcaaOA5c;np7}QT;2iXg`)DD&Jr9>L+1}4NuhjMx%;s^*@#P7`T
zv0q^}oN;66Mu@m`ng4}BowAZ2B~&>5#|15>X9f^6Qks89KiW#1iSvYk<xtQ|VUT#_
z4(p6Y26BUHNB?D>$%$K~6+5xhuW=ge0W;V$(TF&2#7>%GqRM4<({`xR0;m{}kr_%c
z{|O~#vN@Dx+3%562w5&ONtL}2gPH9ZQR)#4YS0WW?ukiIOg}G5HNTeWs<1;mf<dtq
zqxK9!8D|V4E()7vYaVwA03|4<xBUkOWeZS*6562wM=)r6#$|>7!l1C-GUVS*^S^if
z{x&LXIh5}piBL@<rIQtJ;Q>y-a{BI(jmpz4?$F8!|A9eqj;W@Mc;5~7{GYp*6`%yh
zuM|wurQTGFX9rJ_aqU0<B1KapR%w?rQ;UyW&@f1dV^+3#LWBpH6_S|crWk)|?V_&J
zZ=0Ts(NIv@LaKSx-|2)*e0gFt$3Ns+W_T!Q`KaZB+*xr<eZks1Yo1!Zx|3L*jw69}
zo2k~sy(FhZ+tA<4gseo;p6xZZOXGjkn*ZVyGN0aIKS}~#TB9KWbi2bJ|Mq5o&Rte(
zCko3owGmA(!4+I?g>A|_&K1{>Szp_f9WRivxuP1rB{xy5?9mzVW$W1gDThW!Dy<1-
z>FS!#V>ZKgxGIpz%3^B0Rt-)DY(M`{-JH1GmEK7omMfN&KXNdKz;(iQZQO5rCv=|s
z_DgNCH)eJ2_SxU+@B5Q~Z}GnF3YUtps)A>Xu<W108XUEkw@%pvbkrU3paGA6qTzSU
z8QI6Y+Wmrbi&Xp$3;Q&_&foOtiu}H>yS~sFI(hiESgd`Jc2R3nyHyB&El0ETovNlE
z&cJ1KXZTjd_5%4@A<OBI+86ugO;7C4AODQ^HkQYpe|Gz7l1x}xE-bS1<keI%(-^e4
z6xJa9d|&?bgDZ>G=CA*3mzZC-^l&#n-1+TCx>5KWMH8?yK&K0zPOS6wm<LX(mN4ov
zr1LOf2c@n(9f*SByRHwmDgk>kxtbFOvU$317Akew&>e2dyEqx^3v-aBKqY<gB)KcL
z%6)Q0CtenRjI=HpvJJ2_N;+2hKjhFz7JG0pn<kLQ!pvvsSY`PCkVBt1J54+>Y>GJp
z@chh=pW2rHpK|DQqHPqFBU!ONOZmQH!-YP)Lqp+z<<Qf~N;fLb{4Y7QF55`C<$5KT
zula$~h$BV3MS0d#;NeZ@o1%T%->kZ8?yKB+xIb|NX-<+A&@>mS5HL5_S>{(@yU?(1
z9Yl8)aJ}&^b5<nCZ6&|%QSx84-X&i|1@>@-z1I3V=Hq3AOTqKY_h%i9XS*%{iay*I
z4fZOOZp!+r!2oivi<=V&OP9^?boVJ?W0#W?!ciE3XCh^ux{z4mzj(fYGuWHYjvdFw
zjP}D#TiFeMGg)(aeNlVb&xG6ex<-ZbFwt3NqjL8~O$B75ZOzh9(QKYmTG87KTa|}8
z&((Cd@Oq=ubNui#46Tui?k%%~P8luqsH#tu3Y)5jNpOIyW0`7Uii`J^+PjA%f$LM|
z*qCwtu7c-+s=-;~PD(C);AwuUC)@GoSt<ht9}iwve=wa>JjvyL@*kjO!HfP<HzwdH
zJ7j#}YR1T$0x1_Exx<m~eDA!1tak(d*{x<;o<TWJpv*TYFga-aTZ4^3?w_}X2t1nz
zjQM;t=XR-U$)C>?(`wM|vJvpu+Sz9^(8lW4Lm|W4+Gqi|`lN$XAFs!G-uHQ!%aa?M
zljf|ZU<&Kx<*hkF;V%E5<Ivlm4|`NAHNkvAGnrW^azVGLB~Q!vyNf#*S^)Dl!PJ@f
zergv?gss5ghKu9l0u}a53g<=xlFPMu$SR$mQ<Y*BHB!qr`JFu(<W`VM*Ms$+^XI-^
zmF`q*BaBu`j|^B_;^)H&3;wI6!m~1+()218mH0hW`ej7A#uZq3G-V-w0qfqq(Hzn&
zGT;_L>|dRV+L0U@nJO#!QE|+0t|LFbUsig%dCYXH<8s>nl0)a@{w=VZZJ_y+?gmPI
z#$@XEN9P4QxgZ|FpvTIh^Uhjs6@CxPG=cYBb{Fm}zG3po{ui1*_W0bDTQDnm7EFL{
zauv;UiZmn;^P1}O8P4T2ZXq%R%g{ceMw7<zC=i*$k`Pew#3V%XnUlTOdzZ2Y>o^Un
z?eSnc3!z)RZ1Q*f^W&M|lFufg(wnn<=T$$7v|B>dx}qQvAxk{tmX`AUNwz2QwTt%_
z#vJ&v_*3qJuM{7QsstKNo}S+3*tHDNA56--P%Kz2^04_xd~-+`(&lkugdjeX9NiBn
z*R}v*iEd9Of>Ao9NgIj;t4dCHj*sHsQOB%fZ@M~$yCH5BK-5+%*b1{P>V-~TG16Dg
z&i|~%lT-jX@i6*%wM+L+(om*h=^&To6q?%<p)6y$nG;stP=D@?jd9y1E9d$&n#YDj
zAvBzEZ=LIIv;CTBNJD31dv`fPIlgK1qxp|$QHf-$5wWN*Zq6LTl8W6bL9*O+Lx(bg
zv5ZfCr#f;kFy~$Wg=M-6{C#OiSQdFz-WufE`sM}6T_}lhEd0dT%Tdnm@G{dONv)3D
z_*?gSTG`k$QP;1e2vLL4r^YnoqM?~kig43+mrynMyMp7t<@S0XyT40@+8zu^4*Y97
z`Gou+_4<nR6zqp}n@YB!B${VY*XDxjmCJN`sC2NZ^-;o3;NYu=?62z_mjWrTR_<Tm
ztM`PS8Ej>`-k0@l@66C$j+TtV42%D|=%!b`l%Lp4m6Tl`Gr5K4<zyW-sgS>HjIo1I
z<rNhF^u_h#w+06{76V0w>pk>u5eg$$7G!k?I-VqZ7o{aqg_EKbWzsYk*t9DOc&E!I
z)Sc@S7pbBpYY@3|fy-_>6v0eIsP>{qmVLx^{PO}rxrTF=@d29KdTmHb+?l7i8I0%}
ze{6D}+-CEsVLIU@J4mCjQ(^g))IKUxM>*BEf1^R7pZM7H2ab>5o~pbO2GRU6csVr)
zd~_#utid`cFLI>e`L*dx-3_nYgk3ys1Z88UUj5}n)%}y7KUwJmOv6Kjr~|5nnHbon
zy{#(v@d>kd>1(P2;d{7=Ok#$PIGOvb8wl|uY@{o6kjIw+WQoj?AQ*9<ta^c?%x>Z~
zGH#ZBDh>?qGRQKT9_9|83KVH?wlNPG<c607yx%U!kY)lnJ)32v+cEsAx5&n(7)ep1
z8w8iPf9yQ<v@4zjg_u1|$_Xau4oWFmAF~5Sp7maal_4xO35^-J;-R70$LTD3G>7?~
zKdcPaard8S-@Df;$SICL_k{<xN?FFMXV#sR#Qk|=uJ#LM0<6VP&E<PZ{^6--s&#hx
z+64avi(XK4p7aN1C5})9Uk*T)KRbW2YyK#Go#ba?C&2AaTYCDieC%x~kTYTaBmAcx
zrvbEX$Mh85^0;FkQ*DYrA+Z9Xq>>>$rA_CH2E8p|tyNjR5y<lbytr*jvLI}>Y<jJ0
z7nSyps=>wS_ofARlEz0g+B$-A*8-V880jB&QDI6{@Rr)6lV(QbKc~vQ`Kz00x|GX*
z$lm)fW^cUGa&`9mZ%e<cL<X+&4)3{PhWSgFziYyld7UAyLf>YL_CJhY2;dodo}9t<
zHpiLWH|ia-U(w2RF`qk?1mboZr|B>H9e%1##^9x{I@#`dKY40lx&lrvrWh+S(U@9u
z0A8tJK{fT=c^F<v2(MgjA-9P0*d@6R)|?Qlx)3hCnny(FywYWq8=F)ev0t+EtGau`
zgXa)(1hAFr2>dC9O$$G{#N0v`%<bZr-m!=mr|>50ME-#HJ-pl%0DS2MALWAb6XoDP
z!DPim@BI^YY74*!gSwM_U^yO8qwd0|K~TMvg)EjLK4sBgSO$1cm027VSis5hP;}Pt
zQUg9q*LfvTDBG1`lV<SdJCrsLMSO!ICKVvFkJl`wM0NOS_Tu$thNRlb0tle+B2H_{
z*Ws>6N-$7namZ*9EXTB%_Li;~9Y!;TQgK69Ptf@HsRP2ps)S+K`v7wQmELTpuS3x(
zz;}(}O=p$`L#_qSvuiJ2{pYjfP>z?E#Gw+0MNix5^fLI?$!Fy*BZYWRexmA3S!|u-
z(U`K(bQ04p57hiTynTXZL}Gz;t^$QkhRoKex(BaKw(t#w!zOFXsyd)$!29C<rS?Vq
zvDzsfX*oF_Zo@@hg@V%xcX6VL%TkFHr45kg6h(B<%9w*Hw+NTGi<8}ZEW`EwcT3@O
zAB(gl;%*;a{YQYt<3^)BG6FGu(}#k@QhxM-`^y*Yhb)eN1*;<Rk+~c?TOd_pox{$s
z2FG))Ald7^fS29SDbJJoCQNWVC8^d%A?g#@8YDs-l%gLy?eOGSoP{ij9-T)6+6~Uq
z$;d`tu?U>cOR~2X(C0@T0tFOw!-+zGa73<nGfqnKb7n!Aw-8=74k%C#6<Z?<@c;!Q
zc;&E^5fo5Nk_D0!Kh7A$NioRMr14NY;P4Y0+)Cqj0vU1ZYKRsvG&$t#S6oEB)zcF<
zLbis6Khg9FMG4Nw8pf$y1ezYkLh<;BKE}dmosG?wrYk3DMVI~8OuaB&K(G|8Jqf|n
zvJ%o167|xj_B^c+gv6TA;)5emcFvXow!6xf{J1G~y2;T=!Fr_3ie69P01FX7TrWq=
z4w|eXVP{~?QD<lx0O0AmAu|)40RaMI4)d+2Z@l9=;IUES89RVMhQE*rs7$M%5G&HK
zYH@Q`X_yp!(9eOHRT-vQd|l~oSQej!^ImoCJ;mhc5s~?N%Vz4$B@dgeq04;XnrlPZ
zN-U5jtmR5QH=>!uQ4TRlWUQxC^^VgdF%~u?FeXB&?D3EkVh{<S%0wwul(tmVd?}3w
z!RnQ&?tLjW`ea3;awm?cj4*7EjM494l_*QKTQt315{D<ndPm8s94EezE?i5oqEWaL
zu_e-q)~QquMO^F<6&_S0yocvqXVW0yWOs&5+a;}fdAQzDAEkzQ)H<IJp-E%ptx(Uc
zqxkJpgRIx^sXkz#^)H0+;i5{Kq6h_HH&U{H1_dY*&9;=<AUceHu~}Os9LQs$Y3!2U
z2#w_0kdeDCH1eEPeSjs8iE`taBTjel%I>h>-f-UyYqJQTQlav{a^*`-tODJrp+pc>
z;-!qn+F%!YtXtQ@YzH5rtYW_I^Jd+~r1+|VlVz(f<V7^?mYKlN(1i0%8*%|yVGXBW
zFs#0hD{RJx)aN|bdfTxwtcu_(aHi>FaZ&L!y>+rkBM`f(Y(*QE_QZ)77adasB6JkY
z#s~FDgMv)FTH|0{NR8xrMC=3(?Kvd4(;_(!LbweJ>a1EX;8E*y6YdZU&k%}ab*un!
zN9_85MYeG>P`www2c(`qQi>0ts^eGf<nZEv!K?dtMHBKdz`PlTGVLCYZXA?#qAgO$
z`XUySr-8iz5SaodDTCT@18?|n2xCHlhfyqPAOs1gw$8$f)9{~5U5(a(u*F-Jo+?(v
zw$DGPAJ2eSet~EAhb$Yx2t{&jOxr32*qux}b~N=n4P57=3VRM>2oN(9if}Kf{>JdE
z`><u|+1^M9Vx7TfIV{Z>mNv17skiQ#oxV7dnLNSYZwKL#8iMHz4eEfz#;>vmH|uVk
zUQP5V^rSXd&R$?>m`C8)Wd?7l-m(h9y$l!`et-UO|6`CASnO5~0)tat17a}v7bBUv
zi&R}YPOtVg*nW^#MqaxahjSkhJAVBhrQM1K<{Bq!1hr1tSsK-1#rG&2jd-<QtlBua
zdV<P6f>o@=8qx4-i402;nY$MN1CY(fS!51RoMIxwERh6<Xu^UtY%K92-osXLV8J*r
z?a#1;9Sxx<DM<%wAL+#NK))d}`z8fJS6yPBkct4_j~X$fM_KKGxP&P3Q{jpuBn=bX
zkuHp0$Lg*OQLTrOju5H0n^#|AIoHXO$JeYEhs44xwE$%HbpWiNV%~`3Bn{5)Q^n>P
zDp6Wyi|z6NAZm{aZzLa$*{mwsEK_3?CkN#`wvPP;|NPZqIl_28v7tDIRk{{qGoood
zqjro6?1SDsMnA%dsmE4__%O}f>o_$!z|QdJc05i0jio;AgWbk(N3+x3G80`eT!8}O
z0351`FsLIWrakw)Eo&r6a*V%MTh4PB#sq125AxbUSnf2*JFDhhIZ>~*&Aw@COXix-
z13{BhNm4o|*Kle#acqC7_$qr%&*AX9*R0lu)kt$P7j<N4IP4_u#y*(q_f2zpn`JT9
zi22>_ES1-WYVK)asHSNJXf1(vnA5SvH}IddK&8o+=2N9sz4$*|WyUC6%?bO+VvxSV
zH_K)+(z8OGH0+8Z8?E7n+-b@e?|Nj$VSfTjwa)UH;1qQ_k4$0?p`nv}RN22&&%fZV
zmslh#+{U2QD(LJN->>>B6kc;h+3`U|h2i5!Wmx7=VBePCUp&#C=4(G9&Fs`GCRt*>
z6GeYnr?7TCa_(B0bZokVzu!=K&qw8uBh=Tl%VWN7>{E69w7uKaQs_MT+%5(h5W_@8
zCsf=vYS4=k_Dap3oEvd-8Fa%3s3EBzUzyVy-yJdu_H-Q?hEt<ud!E~l0J(Q85w(_a
z=e{4m8~+#o3V!Tu+=k^M2vhw#>C(KwfrZsNHYPvD@H$4B{fAk96d&xS^kk3a!j7d7
zMbb0esSImu@<lLgSQfHtTaJbUdO{s)EQ6>>9vn`2$I_eZzX8IKsF~8a?q0N{hJ@rm
z!4y|o!#-YXs)f4|r%0n5Sq_4U*kAW|EsOWE&fYwJ3IDEsB=A9}IS-hNqm}q~<2aQ?
zwme$atz|Ua@4O7|3w(Am$eyOL&|*Gs!J8WsESO}KYC!*Rh3)}?A$pI6QQ_;j*&Adj
zr#4FyZRK7@cIFVZGk*EyN$mNNdsiU7j*zrSh<IyQR5S2){Yb>4)<+9^k%E>c80x$7
z9BC&jvpv1&;jSoqNc0#O4&cyour#-)l~Q|?FB`;9p13}F!c>TgSfhH9Mu%N?0!az8
z1f9y;$*+E8I!DgfKrH0tJjKg_W=@?c6A4e3hjW_1vYt5eFnsv8-^pBmKKUwRd0Wjn
z49F4&lrl?5<P?8%wh<4R`_HiZFePjcuUc6s0@gPS>ot$sb5Ee%R`BHWWLX$NI?RLG
z#7`=1?+?owbmrPyK6sQO^C2<+8jTBc-f***cetH>?S6q5sBlt8IkYPvg)~@2wuJPX
zyUiE17IK8)%{_s#o_`8n?cYw&E6@3(Cx3<8lB&@QFcYG%AKAln2KC19m2N#BPW;_8
zNJD9&?f8ZzbNI~LPKPR*Q8T$Ugk~K(Vxl8pz;7h6d{2ZwJ@Eth7Xc`@HXH@kk0RjA
zJs&n|*f(97@(Q_ceakp*`?_W7L&Qp@lcYs&(|sLAa_djJdH=t7LA*IfI&zJCF$5yx
zZ>if%V)q<+@|Vin)o#x0WfuZDPU3m#Sf-$v-OnEOTCCF~o~M_E<z!H$AO<Fue`O&*
zYzaLGZ=Aw$OR2_ub2reF2;6|@=D-S7+<WklKAcfypU>AUIzZtl2FOme(C!1cV11Ik
zj8B4JF~<+J_ozS0u;`r!-mC|<7z@s3#-;7V{uC@P#)2l_Ke7tge8s40B6F;5?1nya
zus7eu|5{O?A4?>0%wrX!AKC2uvr;7Md0LeFDI<Cxi8Rmh0ce>Dj!u8L(}%2bLk|x|
zVFFbD|A!nJL@1QC;i`Hr3mZqgAxsn@Zd+UWVF_AstI;q_{_dGyJAVYjoa$tM^7bXn
z2bg95*(-GWs_|jgXiD$LaL*=7Y511uD(-v2^{QuSf7Nen_h?+rOyl`<dv_szZ8Qb`
z%{EIR`o~C{Ko8$B<IS6vWg^cDdAnuRhc8l9paTofq64#YklGGB1~EYyl^O}Z4#eWZ
zW<$GB0VU4TvMM2-dJ*6GKQz2}alqRZ5RAZM-~3X{`lWWFGK%NR!|XzJpGOq~H9}jV
zPs)VPxu>!{)jvBUT)n9-1s{Vg)Z#`CG^r5V`Ufsl)F+jYbEP!_4PRdM_-S7g|99pq
z{>}OC1D6x~EH10f{N>3-)L_xY0GrAt#wkgmiF7HF(^5C5?qb0(pXouAg|pU|F^Sw?
zElZq!XPVRNN)TVihP>mkR?;j1)ecKYS%6|44CPceR))CZKYm5r5&)u~PZg-k@Nh#w
zIYdbt03H>JOQ5nYX(=?vB^yV%7FoXbSRC-q|8pjNxex?DTfofE!X^HxQ-Xc(7kp-7
z^EFfQqUEpx-c;dhQ<V|hcg5-@KA+-QYpIKOyG}b1IXFao0>cmjFFQfP_BF&cPJ8iy
z5v1SgxBi3-;uTJ|vYJFTx>HcAHD~QnAX?#U1|t}Ic2TTeAVy|c;Y5brEEO%^+e$^t
z{h|oH3Hy&6dgk^+ks~?u`;#iT{u?k)hI>Rux6PT|(8s28L`7a>^%9O3bobye`3wU#
ziz*w{+0WkBh`5(XmH`R<nah{QeGHj^!qp38(DMlVo(Hq5PwnM?WoCu;yet2h|3BnV
zX)(vt+TM(Y(*cZ7etutcnXl-E(g@hCzEBJ)TA!p}pD1S6MC<<5^6Fa3_Pd@BHMjaK
zke+D(d1<-G>?Y}iVwp^bOVT0DMYyfakL*9xr^{D5pPEU0zx%?s>br@yVV-R2nOZoH
zi$wA`62S&q4#t?kaNOlf!gU`M+!X6X>Tf4nah{7@5p7PJ-y7sNja#<LRvB5#AZoU)
zjVvJ>3p}e;G6<uma*AH`et+q6N$S@^@U@5Mre!GX_tLxx!pOIpUmp$()DC^Cf3WlC
zh1#1EznVX+&()Wt_Y2!LMVg(w6Nl0-SeaS!m^RKR?T5b>yH>aP^!Hfm)~w^Df7@>r
z%rC}IB$yxm{?zl~T1aKzqr?5p-;XY>r+he=X2<?IGVIp1i9j|4cHgvs43k5GI5{3c
zl{Y8?ZhlZTMcg0fC^F}KEr)S0j>oQ@vK5$lSXpRs@bB``F;6WwesA#KLrjK&Ngb!n
z(bMvMjnt=I>_W|=hUfO$0{_6=VNKV83R{Cng{XR{1C!tExHGt6gI(kTlV6?KA-2kp
z5k05_tJVYxdD7~Isy#<l9Gr8!7ncPa46O76H1l28mqnWpk2Om-bHlGLi+>NZGMS#u
z@{tT;Nxcmt7|6JQQy>k9CW5uLgFxPyAUR>FFC!-M@IqR|ii9brt?jSED-L&qP`Xd7
z9j<8Q+_)+$=F<Ya#L-#o*)Oa7Y1~Gkra|mdf1}{}7F(Zqm*P7nK^h85$KBQEN*+vI
zmk#Z-^;*^{9iv@GwtTVY1w5~CRsAf}t>hrD<p}RFST*YUWGUDSl+wctnw%r?*-XXO
z<YU>*PRu~!ddb&rM?uY(UPIE1KGy8fnoPcgJEnaVyr!oJHu7YEBsf4)w(Wz~MI^rC
z5pfOWbOnNfGDpE1qUf}NlJ#ViOK7T4BjSbP5t`~!SQA$-{4mTK_r|$ABd$?G?Tf7|
z>%L3eU7<z|-LJ>bF<q;mC+mf}n~$fQb}e{c+_;8OBIJlaZ@9nHWE_0c^$ypItDU5q
zsBUE^N4uAK@h6*4U-+V)n?0Y`cA@FqZnMMlH*Wm_x@}$;TkRg6@sLn_(Hi)#_0;t@
zuaeV*uEFw}@taCcY5Rh;dvVq(9NB!-<)Y4Qnu7VaB*%bG!S0rm->a|E`Cbi(-0LX$
z9ue;4_4d6;Pv490kx6g8J{*el4hsK>%JTC5C@tFe<YeS|#|Lj-sx{E3OMcW<&Srn|
z6@Bpf#gF*Dw?049MEjS7HH<2a-`#xz=K75JnY`=vZgW6%VDsOq5T219v*%u8^Ma%u
z<i*G0-P`VttUWLG!+tUQ@pH)5$)mFxp2e-so(TFL8%>F){-qvbSnLQc>|;Vj!m!sK
zmf$Fp?H>*gMeiN^(ax*GNMDxrgr&}G<c9Y%<qJB73}0^MAB$NMXCcPhg*Vh^X0t^^
zUqjItvYF{Eu%H1Rro{o|rke!(+tTlfRLr~tTz>->?2}YoV_fV?{osReW4E+sM|#dU
zM$}Rz0G}wFp3GBHw<_2G!Q=}cBS2DeOVc=!o!X0&AE)WK#NXt$Ix!z4Qc!%3M<hyY
z5e4QY&O^hh6^sTHsqzN05Zm5*^V{A5q3af4+r4_(-m3w;&3&BW2GE-)c>}TsSg{kI
zU^Hk1?3?k=`<xwZu`Nj#NBvkH3x)2#I{nU4)%A=N^RPqc(zV(P*gC11m%l=#pGKU&
z<iT*@!3qAD<h9X3L!_8Htv)F{X62jHBk|T*O8-8%Kl(M<mba_ErpA=7J^gr$d58D0
zq$6(>o*lgq!=7;>AifF<U7Hy!pVa(x-p^#5|NSoleYTw!9Uvwln&jO(6P$ZZ@&PE)
ziahI_FG#E9DfQLYpXuPv*hWJ(<9oFOE(WS|EWh^+(YMld%CCuCTD30SRF8M&Q~K~K
zcYzQysiuBD+xjZg>z=_x-+N--<pbFQzy}k+PW>q-w)OBa*MsF(7kU&D##!wbtmP8?
zDfO2MKbOytB<4IFlfFIV`5mO2z4<OczdX90B${ftwocb8!;hw}VMh{terEXn`MQ11
z0<Pn<+H)zb-_PT(^*n$trT`4TN+&2WfLT9NKZ|~q`nRq$$741R&+)vau$IJn+dEv!
zEwu*7Ng)3&^{SladUmH}a_|o!Ms{ugf`Vw+`vc3lRH4$4LFLo$X?#a^(-@Xr&%klj
zNaMqZD&1hnm>Kl!xAfr~Vbkv#L#A1U_+6e^yjdb}V7eU4rAj@V=PO;zy0+KycG(e_
z#JzupTf#H{-URt`sy!(1EXc1F<o^wHK8OF1cOG;Oh~MbF>dy<s$gwswWKjOnAwWqp
zS(wvf$P4xI#c*CXf5}J~du)^>+zFBr1w1#MWkeK8E#RO|j^ERO8ZJv8fF<9{N~kZv
zuPAUfwJWHHA2ssXyEcye0geY7-`o9#-N}#o3wUC`U2cw&C89OVK8ghK^Y(nd0>^Q$
zMzQPGjzi8(wl5*_{U`Tl_*pO**crxN2;=UM+$rGabrujU6yO#RkPv{&778Gp;VQFm
zU^Ksmvw*+7;J*SmTlC|r=tVfX@W(2zg51&mYL-LC(9}4jy@0PP3i_BVRK>V|CV~lX
z5jkJ@I7ahI{N`AyGdoE@l=nxO<RCP$LzFji@z7pOcS@A?h*RvEfOuZCNZ#O&niKc;
zm*5lmvipNhX%@%>IYomd_BSNqy6;y43Z-mkt1Wnj;b$as{W){VB28gWbdF1ZnU#L$
z4BpZl{?#G<b5m+Jy5@5<YRn(H_+&-=I4W-t3DlD2zk)m;g=Tf2#n#c$FbS{Y_Zc{z
zv|2Xf0Pb=CF>Tp|wk+MqWKRTkGtu%lf~EKH@gXpg*U^0F7&P0oi0G8S#-{wLra=6a
z)#m8_w7F`Ei$d^i#fxyo3sFi*bBd$fN-Srk%(<+q{#`m-N``Qi>vKv)aOIAeNB6W;
zZ@X}x9LzdR=(by8f8Y7WpdR5cr?7*TyksGshCRc2$tfMrI9e>!Km|)PiQIf-Nk5zH
z6_`Tw93leqaz9+TuT^+FPbd_t+1;)=wxpR7(=Xp8sl2V#h0)g6*6Nwm#uf3|2+G>K
zK5%dat7?k~`t#}(z4GkRtzt?#32IBl>VBBi^)KQJF48L!7?9W2_tVztDiCT_>?Q$4
z3Yco=hh#sy$dCs4L&%c1fp9*w@WIj9>ylp-8HpN{60iFYk2;MPm&`DES|mwcf{72Z
z4C>)&B%XyQJX`^%#mOcCp~8pJn&2I1-ja+iL$74=t`1f>cTifi2-~!VEmFaW-o=S^
zVP%E-<co3O9b7dB{<1w@MM&Wl0LdELcwjM))6nU6(!tu!S0A5$;He{m6w0pLW*;GO
zCI%QeUJ)I^iXYSp^~c5$aXbe{+cHd;dY!=5l67<)A7x$~iYC<6+g_VTs^fS_K)6Yp
z>^@pf!@oLz7|9%jOD}2c55iTgoJO!l{{~t6OY3vi*%TM-YiETqV6EAS2YcK~Cy09A
z;;@-;$G@D`WjT)FFemT@k?p%qCEuJ_n~uO;2eAu|-#MKHPb!>XN=|>rlfOCt6LMuM
zaq0TzD%<U#eZkeR$W2Yy<y)MgYYx)WMcicx^Jz=&1%p4a4!(!yi5f&=kA~dolI3LE
z;Q$f7Mxh&bJ^w9vW?g4vMU(A~Eu?CnOEiQcO&G`lwAhe8ziKdlJ(@QR@3;r#JivK|
z_;b78+4a2>u`rkg*L5x<p(VO|<z2z<WNeY3?-<Tk^NMfQr0=G%!Ea&qza>s(D#Yy)
zV(biY*R2m8Pvm?l{k=`^4tKz=uJ5X_f8YtCrn}1+IUp-G@aIYYV;9t%C)FxGsq0gW
z#Fn{GgT#9)?2#0)Y$3RurAjv2={&1b7xX+QULftzr;S0PmZ7{2V{9=feN{C3p#|p#
zT4=}Bu?@?6i!4d3;~S4=?f;Bu8+Q{el{&d3Gg&8W^x~eu*=&<i;^@n)@s|;2xzAM-
z&iyVqm(vz;StXLCON?CVj(jI_UdjFZpu3LGJl_YANMOQwVE6f-FMGH2qK}nC{oFYJ
zJl<avJ~rJVU8}90pd&L?gr-^X&<CX&Q9kEOHBw7MV@uJsCy^Ogsas3z8TVv&nCxp?
zSJ!KC2WZ~$xKPA(A)-IGx;5LWjfjD@Xto6G_rlTr@Zp&y#MLm)0)2%NQQ4~BNxG=y
z>mE8SWl8DWHEsGS-TLhMaY@>pJp-c2qY0{?oNC;5dn{*@yiQ&$N|2m*mHa#*4P0^&
z?b^%yorDvPu-%NQXch=akjuu!eU>$E!*cNrA`^j}1ECzbLZJ%K3sgPIUmViuH$2kK
z)=CEH*-2qh*93ksIq#yQuMG07V7d4|Nw?KXUxjgbc?LBSEVn(lpKLuzwHK;x<_r_a
zEZLSx=<P|~dqgsz$2w)QUfj#w%e?FnRaTxk{5`A4lbt*6ck-lfM}p*<&ZX<U^cF<c
z?FE@8#hj$GISsFJmR=wXzFcjGa>nf_+^curltmU>*x7*MGl{VkYXa_@T6_LxX%@V%
z9%npB<jaiVoJKFm%#UAP;}ST<E?iOg?sr6!;+11!>`Hxw7rqtx#pV^27paLwY8n<(
z7Z3y?{dbJi@K$9(mm-_jg(prG8M>4_BbOw6D>;vdcw25*(ae`dv@>5;%XwXXS*)Vy
zR7KgJa+YnqU}Riyj~a53T-o}%@=isihClbdVE6m((p4C8=}E~6qHyIPg!rc_7IXFN
zx0;DRSCb5@UnO0ACszGDiTj=H)zH@Jr+qb#lJH_N$|;`2M=xtWox1j<;@Z-wB37S%
zsC_MGaqabl!*T_U>!?ayN`?062L1cxX9HsR8Y6!Bi^(6C4cn7}VC0hBc-$+md%d}C
zYNKIOE;CQQA@EuDN8OFfrGfpgYsN%XPB6}cd5Thu6fPMx`=~7X7By==Zx$16$xLn;
zi$Rm$w5)PpX*f-P$0<cDUcI4MpOUQ9a$2k?S)}81R%T-BC-s+C*IK(1>dO@5R%3$}
zfkv|qL97*^z)@jfUP*Rnkj-Go;A?|`I<84!S^A6ze*qgD?!`Yuk(|eJG3LGbaa`jl
z>Cc^5WnfUEcq@7iy4u3Ih*d$0WuJZBg}ZmnGUZ3X^IKNh0%peDHdWnTZ=3v$?*<zO
zgr`Wq!t&wX@}35!3MaQXzU_&AaQ8%2kF)VzvP5$F+uP@q=-KxOvrt4DDS}`P&u26$
z4BasXT{op7xvFG-0K>#ActXfGs_Kb9&~e}!LVJT!JZvI5e*+C3bbpD?PD|vy`gh>(
zF8#MxPwd>I-Ks}V#UEWvlmwVCG`p}3zk9#`VXz)Bc>4#(%5y&?$M2AjwZ4deF0nI-
zK`c86QVT761<hMeLtCKT#siQD94CWxj0?>xjgvVp$@7bW<Ra@gQq9J_WJVYgt4mxA
zuxTUXm_opSz86@;+Zkzc^TOPd%oN3jtIc&+pS+ER`fg6-81?iV-0JQx)%1?9c^&`M
z8rjBVSAQJ1kLKSZsbPjhooZn^OLy>SX!)=qmp}VWv}lH`_|DanpAYVwt%dx;^1%Xi
zQcYw=YT+cD!s$}U?7R0h>fDR^2g(*FwSAuJS3fs?_uO16VpKBzGtlVV>2r)FHJi>r
zPaNDJfSqvtK`fKgVrk}xL$$1hb@IBxq<n}MXR7fMheorLZ;>NR*p*%KKV~fJIthIr
z$8(Q)O7&gfy2O0zyEk{F-gf!C9rc*^TZN?o8ectD>#5D}IEFDC0(;7c9U7%rpwEcO
zh}AH_F$su7(|7;;-~FqD#($Qe`RE9}>woAh6?R1o>hH+}G+uugc+^jjc>mvmLE7Yl
zhZmTh{j*TMGzPgRSge-0s4K&+ik9+b-Wf!B?~{*>><YjhzL%9*u}Pcx^X>y4%*=Us
zx&rIDgSGfEM8IXDh0>ZdeU>w8)^h$MhbAcvoYV4s`Zh$moXOt%=X4vI`{k0XFAicy
z5;zn`9>Cd#toYzVY^uQs69AhC=v$K9=YMq%GXIU`oKiSCjTp!BuzrxeTSWNks|T8V
z)(YSMWJzy;&6i8k&dscF-7`K1+dFZWtw3%0qko{xz~4|F>Z_j(iuudSO@=c2IH@g}
z{-1S1ztWce`fk{N*l|SeUZ~pG4w5$w<gWLP=PH+P2}W))c)v7QsLMG~Ld`=S$&&od
zE6vtiukGc0*t=|g$%Ewp?ZQm{QwUjNPi0-$L(63vp58!nTMpvjpM=Du|2#q-44WU6
zupIWbwYGp?hXdlr{W;RG|5EA^au3Wb)TN|G{*EG9+kUKnH3#2mCxAoO%mex%|CK{6
z$Yp73r#Lk0N3w)ePWN+s8!Jf_6^(xY%5)to<Va7F&C<HgnkZ5Ax}RF%M9ql)pK|DQ
zwMokU!T+lq>Rf?o&0onJK^lg1B`zh4oge2<aG$Jv=((DSB=5ULRwTIBHLGqdzj>IW
z|MOIZ%isO~Lk>kKoqU*Zr@6y@LcGsTgZ*Fal!5kCic8wYo60L)*qC;bl$^WX^Z&}B
zAyfMQTMqrvBJO+b)99_Ys%6YH%+i{1pH;Yd!5X<_u2TBqCh5yI{-s}w8fLS?mCvj{
zF{dM;%KWm~!~Na$U=8VKTGDb3o8Ef+K&gQ=@&Vt`4P1iVR|Ag^Cj4TMG5c>ptmw%!
zKC`{kN#9Qp{Qo0|E}i>{Gk|+zMx8}7nNPt_E}1vax|mTHW1T4KpE`2sTGL^rG_m*e
zz<i@0;~xzq<`QR){Sni7#;-a+BT%vXpYwxHb;NN<M#Z^Kn2ZoK7wz^`p9GgFzFr6{
z56C}~L(~3^UoYT%;rc>1Ht~<RVRGV{i-LMd=U7$Lk0(tQ#7fSvS_+@IV&xMbmnk%J
z&lzc0%>&{zKOAowJNC!>%7kjN&_{ml0&IYj=F6~&7V~$KF`U&xyU#;g)k?PT!e007
zTFWlMv(L8O|4~^}H((eyDxAEr%qLjlxs5lwS^}C@{p~$8g6cnDTsEFMU=d+==UnXh
z1V@UO18y%@UVkP6$j@oZ?b(`WiwML51`$SLpz{KTCjn&0+eIB9MDQ+m)VYBHJ(_Vc
z6U41r!Xx9<*<V|JP6~tuikdHI$#s|u#mYc6x(;UCt-jL=)${&%K6g19v7CyT{CHa;
zYKklj1OW8cbgZAsuE+rZpm8rjc~fpw>})#k`f2y%0w}j6+oz&+)usK08|KH|QZ--v
z@p(s(>QBw{wmNm|qgLiS>=gWH0_Yw8c3?0fZqZ>jLVMcuXRhlrz=4+_yRM*G0@DTk
zu5#`;evV)k{uDpWKeZ<t{=x%a)4k%JjaD+eb$Y}uH*&RvS1!4jwal*?@c^H^*6=r$
zUo)WhBVX&LcMRR&aB64@wZbzLZz-nf{9$!ySg(lr*xc&(Q^UMy{b!f-@z3>=!D*?x
zwgS_YOPo2fZ165`V7_@T2F<on>Z;Bbw~CiZ7dk^THA(c`1o53|<A&HOZNIu?EJh%-
z@TEo635{Yw<~vd8MyMqiPZd2FBl?KrF<a!zR-)sTP<;UNyZrNQ(1{I<DR*|1;=*KZ
zmIHlA=w?*9>eOkgb$@=&N;bJU%(zH)-Q_2<GpJB)x^4!E+t(Xs#2}5LMxs$!8+cyx
zuv(sLYjCdosBE1<=2m5y{xu)~q|<_Znrc0Y`O!$r4QJJfJv-X9Yqx+q-Lf+yMzd)V
zvPA>RM^7JYJ~ptsDG`L>&}`e#^=%Fe?<!Bfs;qT+x}YsD_rPUygu}MVQ$S(rdF}S$
zy_}FW-rT}<IWY+({-gQqvEL|r^K!;L6&_&l^_?*#XAyq+_G}{p%HHHFj)0esmU*}L
z?4vd3@oYjz(Tl2;6Uu$Ks))IeDGA00y4Vv(y)BU{Zh6}y$y$?R64ef)V%uAu%6+X%
zz5Fp<s1217xw2ItGH4as8Td3&Ca8Qy=&I&9%JJ0`wV_-j0034CaCljiJy+a>Q=mMi
zb+*eMdt))qC+?WcrxW@6maSPA9mu(ND^!O=ahD~pJVepDA`I)MTR3J96*30V$MV)>
zamqv4b1U_d5CBy9OP711&<$Cka0&nUxkCC!!tK5>;k2l%T99kK32*uFF`R4g8@FWL
zvkZgyH}hQkLfJzcG#9cZpWFdJ*YBLHYu7|ulXbVe=`h0pGozj2FMNCK?N`CS0`;8}
z&4{PyOy6sX?)SfDN5T<ge_rmpb{5R`j9sGFSV!LYTu>W@_o@#o`_$7Y3t7vj>#HEI
zQx>z|bNp5$9BdzqMw|SSFXp{HtFAJ90X5VmIX9dYreZR4U(ZQLkaYeMH;HR1uHn({
zZOCJP03ZsWz`OB1@)OicOxoYQ_l0BM^hwsc&M&|E7QaW9*Q?+x6V)GVL}z-Qvi6NT
z_v*p=xu5Bbs`q<sG(+>XjPu!rZhzc^AO84$=h7_LkJH`t(ZrwXn_An21+cwi2mkI+
zk;kh5V;X{TKA1#RS({h=qeITAN;GqxW#3(B*L##$X3;RemQLY?jp3Xyhp8*j%*4k!
zY1y=onRMWAx$ZU*lt!9;&`-!TdWoq<`Y*kbvbTJ!8`)Wu6BBsM{<RxRj2HrK%uGy8
zH!c7_Hoc+uDJgmHNsxN1TfIsDX2vOvfAq17o~P$=sxGLmy@|>|tq|>RNzZI>T^mCi
z)yAt<$fyH;LEoawY7zNjEi)ap6;nrYsPXG(*8;8NA=P35&7M-X$zau&G4vEmmB4Zl
zj>cnoUtz9q&g~g+2F@|LarTe(56WX(_+!4heS0(5`trP@$p*x2@xF5PNkWHB%=+Hv
z<X2OX=kL6|m(TT)O<EoC%g!OAK*HMct?=M4T<-~Huzt$ovy1VsH=-dA=RrJBfqS?&
zg*<1s;pafMzi{i{1(Lh+hnMAh9<iPM(fJhjH2O7IcCO>H#RvoS1~V*u>s%ggV;ac>
zK(!Bul`kKv$A8^(i;rqDet$s{{u({jWHN0eYeA6|&-5|3=6gnW^mc2Uh<L=xi>-k!
z278@`UU&xQ5+adL8XM5{q|?5opnxpVUhI%5X%M121>*c#e$+!w<UdPCOMq~-AhGh@
z+ppe=3p_fVz02Uyiu&|5%E@M-Z~Fdq{eP!sD@z*>lee#adst(vQK6r<#OoY#V~xiq
zxkdNI?kPZ^?BUFCRB|Frm*K;2WwK0`y97In8XTA^pkTjl7>r9mwtI{VK57(dX8Y^?
zOgV2V_t&@c_zq(vIf;!+b%`G{F3W37e|*~zsC)^#3}=MZ-upv`&E47Fiu#>tRPJ=s
zMbZLwM*k#ImOp{{@h5zBIHksiKke7hKv4ZS{_MaeSCZ=i*Kf?3Q86e_lcQbfAxFj5
z6K6vFmG{kf<qX8mEN7tZr7k%ZtdX5>eKqY}lgBO5G~O`Nj~-g&8)<FP90U?%BUCbA
z#`xn1<WVDZdNy&d$)1ga@+0Wzp`8DC97kpWQgV%qTH_Z^B%hXr6@9$ON2k7LBd>Jx
z=gSLhFyUndL0gUdXxG$)g!BBPaJ9!qc669kxi3#S)zwqSSP{2W%c}u|Dx*LG<aBl*
zzjT3za$)=y%_Wqc5!##l!6yBjfwMaTmri8Ip!t0`1Y+p0z+N~NBgZJtxWqx{zCev6
z(2ev1FfaLH0RIy<joIKOZa}<Z;!YPp|2lCG5IG&4xIqG3N8!6KtNa(j;!=oNe+%e2
z3-s;+Xm}J0R$2?mS>vzh&8jvKxC(R>M1;6_(jOWqMj4n8nIQF}bPOh28V1Id@hy=+
zF-&gh4Y~}G?a@8{XDHB<0-j+MtWgm*wU#@hm^%`dyX3?zO@wtbLER{JZUy!^LY@$i
zhj=5$E*>OK<Qbq}E)3!kj{>=5WWHSk4uo=E4m+wr=EV?m50Cs%7@sr|da5@sevLoI
zso)ThcersG)WQE*5#~rrIdlTOAr*i+3WS~6<Ml4P+yIN$a{XDm;?~F|UJE`{WQPvs
zfjYo-Ogj6MqvqOwVbcPr3?s5ZvCy!u$jgO8HykDr4l^X?XfnBDW{Oap#X<rseiw$k
zQcI9ZA5`Q2V(-4cn%ee<->>ulfrKiZ(0dh?UJ`l}5flYARB0+rL_rC?R}}#f0tg~S
zA|iq!CJ>OOAfkdIL_kFZ=~9IobnkukKKp#nIrn+)xMSRLpTA(`hm~Z`H9zb9V#?;J
zgY#1mc09}$baZ9F<*f|3ClPHx2hAB=)f-~_V2~(G%H|l#KEroy%Rk%ucBbGL2AmB0
zL1Go_LkD?Z<%tY+Zgi_8fh;lEm(T0$CV?uk9t#+Vk}Y_Soc)Rf7A7z$VOT?Kuii*x
zRwCz`Nuz~{;5*2?V)ML`hTI#u*>{F6FW5rFuz6dAJUyluo+5bZSdL&j8$SVj<#vAG
z*@WCL(Rb?j*^A<lFVHW}V;1J}OLA`T7_!+>V%lU+$jjz-n->7Pvz>v0-FD2NtOAzT
zsE+gLA7u+4ig7;cD^M$rTrnp&V{#Y26h^z|PTt-w^t=Z%(;y9<&F7!Hy4^`~%R;JA
z*$`c#t<ptbmJ6gZkgOF&+8mep35DG2*mZvx9$8%1hETgp5~wKVQOmw|q!?otr<~*@
zT>;wNmnEN6GUbBG{!*;Ajt!qIsar1SXoT*|D>1zw&`yS`eJC<q$2Lsf%xz;+x44-|
zVm_QydZeP%sjKuDLk?vwb76p?7G)kjWhax$yerClyUI>Ym7QU}6(Dyj=xteI2GW-R
zwvr<qn8MC?+_LL}$#>q2wkVJFDUVMoPpl|U?kZ26Do<y=ohf(wvc>JIK0oEqird$_
zZr_-?trh@w#uP=YW2Mb2>>e^lRzNDdwkxWqDr%S+lqTn1gUb6pl@F3C_hLEkc2z!}
zs=TXJ*(g`_;9=zxpQ@)*6;!RN?xR&5Q&o>Es=BqRo~>8ClB?v$R`**}zwWBm>I3oj
zfz&dp8@j-1?BMrZ)ua4(#xGQUtN?wUs&b~l!sm)^tz(ZgUi~h2M(qP?l3ugTOa=*%
ztAThmQ8FT#e8`K8>?UtBN3y&lv$BM3^4~>SlAm=lMk))X`f9j0YIbQ~&MmszF?3fr
znGIW6^QAvWR@-m6<E|77S>`K0hUFex@?F}&d!P+6ziq8%*xlR@wYt8wYTf+e8@0lg
zbz+b1;(YHu>Z<*smai-dA2k<WByFGBe|?upcOC2Xx++o5(;4@+Dk}F??oz*g55rsM
z^6vh*qWgOu)mvEBa&OdMcu~);{lKwX`n~ymp%+LNqhbR!v_BaZPmc-p-E~&}fz4L|
zJahdX?fT^kz7qoVlPdMbkLpfWHu#6tCCXp!ifllHJqQkKw0_qZr>*pLh=WEc@b5>u
zdps-_co1^EF<HJ*YNMfs+MpTsC|lrBzCdl$qsE&Xk2>cYRka`09B2{=YpVGwx7Ns!
zLEwi(y8BUC$o_<lc`b%#8XJ7hn8&^6D@UhqQz?sZqto3-$&c=TWwd0QoV3Z^m5txN
z))c*K23tOv_kA+Q(j4B;3VX=m18lQRP|(LeiG4E&SzE?B7ID9(v)!1pbgF;iAlfWl
z`Q%F_D7BkB?MvkyCi6Q#Y5Ce%a{bAKyl`RIlRTFeZb7O)u1GEb>6#&OHUyJFI3YO3
zE3=!$2cx!vJt>dk><nwEa%o0<r3wh%HQuC(>ohfkXmUNY5&@bFs?BD))mf}~A|qLr
z>h;Q=xrcmX!!R74>2<=njVH530wsb+k<I*Q$nJLYswOY1CNV2&ppNiSfwr0JPdyaG
zy%9{ShuDkvA~}MP@3F89oH)6U>5>6k@tF5H+EaxC55g2^Q}Xr8jUqmqHD`wTPd3r$
zs-5<NEz#?pbE>sgN4qkow<T9pSZ>TekSk)No!>QK+v)&fAy##XM?NjC62$j()`d|)
z8{Ic_+CorWmX@7&0=jPdb!~e0G!9Enk?o#H2(K8hy-9gCl>f}t7I7c-Y(1c>$+<a8
zyN8lO{b<!AalMD{YtLAC&kqf8ewN<RX}LCoXNvRrn+EN05Xy(%yN&7t-t)Oqyt#_l
z5Xbs<1)!0s-Amz^?j{L**UgL#Y-95CuHoms&MnV-deCYW>I*N}PFYhfV^aNL`xiJ)
zNOf}rpxKHLXi+WYQzs@!aJ!5X6aGj$1NgixO8GG?N3@?)wD*|U3ocesj?_*u@C!Ay
z0mGSrlZO3FMZpf4+cl9X{ad!C2t`?9Fxr*K?@!YIMvP%zWDGz`&w39C+6`cz!4`W4
zJXqgwMam?#$c&XBQZYK^yODTXky}}E%OS6-RA0eAG`$UD{F9+bVlY@F#$D*mRQzj8
zj{bD(A%Cz!OAAXI8OCUkj9j^zK{`L*r#Lz$7CpmXmip={fGT_OvgCs`g=lXvIe69j
z-ThPVob6N)msKuhFy7Q;EA_`xT2+N1Y5|`G$`#@9w#+wMS<VgI0KZ^$CA)xC-#s|>
z{!Qw8dXX*}bAO8r>z@-`j)$K9w1?m}ToXC`xP*=2B*Lj^e@u8OWMIg8botb1z}@$S
zW!z?c==7{@^rbn-JY6fdRjyod@bIz0L*s|j_Q|fgNe}3bI#l&K1U#OA#eN9*z>@hv
z;zgfa5gI9^vx^;#Jl4>h*}IY7k9yC(N$fikK01E){R#<gr2=g&Vyn2qEb&b5TPwSw
zB5b~zuj7<hnW~;U7QRB{P6Hu=?cVG8^+!JDFz)|Af5CcCcvl1YA;-LI&E0+{HumE-
z>?59dc~;IFEB!Y}XyqUMr$8ttGVDb+>MRz<0U5r~7dg)U3Nb&Ca)8NouD=an^I?-)
zQL(u|5xW)$yM9XL0tr5{G^QSihJ1?IB#=4-(D=Sf-?PzkOM#{>=$XUJ?B819&p8~P
ziJrCH#y3ZP<Ss&AJ&m&%oMLDH$}M_fnQ`QrVWh~)hR~HY^M5v8jW#2&ZW<JO#eWvP
zbjDVA*HsmX9)rFqTana0<T`eSftX%kAf^WP6ZFaSJ15qFKJgd5Tf^}VDQ_>$h^B#M
zH%VyRATrJ-=z6~_L3p;*l{JGj>|yA|$mlwzP|WIQe=rbJ61;)VCJaV3Sqt5>W$>e@
zmxp;6!CfB=b~A(d(wyadAJYYZX{`@km^GDf5t$00HVp#%kB@PF@I*wL;>w4szp?2P
z+l0{zjAU=3D{DT$B7$bReL7IulxKw$sPI`!2@#|x5g-#C(N9Ozhp;!C#wh;SwyluI
zFrvPyvt#X-b_G3_S&n2mcjHYd`OU>tIbqyX_sH~8J#3jBJxn!VqRxyct;~D8En!uH
zoKavPx%yZ*1q-`(kTF@Qc$IT?lY+7WSQ`8X4}p}%D5(5;Sh*_NjD$|zUQKF+x&jDu
zV^gbM1%0~6Su#xNIme9~gCI5J1=3mPr}GoUs4YxDkmq^=WREM6<t%-PTNHkkg4)N0
z4%cU?A7z!7lq_f87<g=e??V=x+pNNeL=!^Xi6K5G&u+gAIfEFq`W)Otg!=ePjykd1
zo;V{9LG6Jut$|obfk-RLAiQWfBw(nucqo5nNMHDE$ceXImw0+kZ)1A=VE_ol+ZblH
zDI^$}F36!f&n7G({po{I61U=UTF!xSlQbb+h8$`)VU{InU0{@J_t7F-@mO<AVl5qS
z;~M&Gy{M+26s^DTegpJ;v?~1Cl%SDXugDV-bgCF537V~c_OLV9&CcSsK7qs1a4hd^
z<rA%b;fndz$}E0=r%llVw@d{s%WwgE`d3OgYqUx?_q=Vf9Bs9`bPc|IZr^D7X*@Mb
z;^_okL4W>IPi*O}&xDpZ7a_5euSic?IIBgyd#t*sT0NU*58@A4*LUXq_>x<?J~HDf
zmOJzvQKzC35$|cO7mSggdw0i8Ecg~;mxAM^v<)}hohzrL=6$wDdicVZ7UQp$3ELmj
zxc+F~Y<MmC79#O}JbUNp)4~(mm$rWV*hZ)rfM&0MA(>3kC8^<bdRt-JCH~$*%ja%5
z*|Pj%e_@G^d1--4=dSj2(S*g%%&s@-WIVgM-%OD_)*Qp@ukK{6l+B}6e#PX|noBnH
z%VIq5p4#pgDuU*|?sucVF`M&0*pxL%4V73#WIYYfD_4&w7dO54qV8r=;)t2$a}hP?
zuW_g$uf_PwPqB?Lxh0!?F}$NhNYXu;lIA3bvv8hilIrzGy;$9jBAZmz2N@>mx0ejX
z3Lu;lk|Og<yJtl`UBeO*sS8I^r4q6HXAKVSH{RpmaM<I%!}ej2f{K~y>U@0uC9HXE
zn#iX_hZYpNb&kaRDo3(FUeDe8j-qCp2U3I0j)%tvo!ixK!XN2n65(TiNb+Kw?bAFF
z^5dw6@PYF)SY6c1g?Ii>9n@6)45v=wBQ}X177>)pmMV_VwO7=8311ef#n2BwCoPh=
z@P#&)$U$9~Hb3~)M^hTd3Sy|4izKbtaGBoqJAI~w@*OXv393YiD>``g(&y<%GbeBT
z92<=fO~}3fIx$RA`QVa<ZpXtS_YkB-@l4o#?^}g&T0XaLmAw@w-3&d*EIZI)Dkz(g
z^O4#A!VOzTmWT}3irTx^Z}Cdx5I>q{%QfOs6!R<3S#3X@3ArO6Rd2gnWY3+9F-(A0
zlVaOdr8UD8OET-JWcf4!XO!BAI4hH^l;?0jQ(o5Lo1VG0<HFr_$9Z|A?$CEHK5JZ3
zGkvx}{fKxc`r0&Agste%G1(k{8`d~BEhv*jXqM;mbo}~EQQPT=*$lVK-JcL@9rQ1v
zy7^(>Jf^<!1tyGF@QYpjRxyzGmELzrVKO$i@#3BUvy-k$8ac#hRCey2hY{P`2m%1p
zprp@5A3|$lEyh%NkL!Gud~`lx&qN$KDW%PDooUbr8=7&+Jwt2_5WRs4%DQCWZ^2|l
zhwmRVjQMg~O!6SpZaPVo2kfJ;Mt)^@DKMR9?XxiFc31+-wWyXK_QhQM;$n#RAft!|
zac^p4{2mKq1Gz&lk`B{cc`EB+8UrBX3GXX|cX;`A%MDp^_SmarFV@`^MHhu5jRcOA
zwPl!fr${UyHQ(mwYJGo^9sza7!iF+K328daMI~Aa9UR<j{h8@8?h=xk<`#$gv#!zH
zrS>$M+l2IAE`)l>7;9SCWiy^w8hOY$G+G?0@4s3T<DuZ8X?gT@fA#~Khtk<b%j4hs
zuRVc!s>Etqx$?Zsd1~aTcD2#UbMMRC-WX5yQcY{0Lof5*&^-6vZ?rxg^78s9^rS|c
zrcGe>%lywq|3?lz+MoTp?w0W>ABRUrU)R6BUlV)E&*T5^a%ky)mP2>F?Ta`0H95@i
z-qIP9!;-q*7Kh*VUuzF8+w<7l=G@zth48cG#=1Us*WM1?GC5n}@Yv_jgSW40;?7oi
z==vUg^Y-<F_Oo}+KK4Dn^7hRWcnCRG*Uxp=yTPX>A+=W@`+4qrH`E&!Qdg>b%IEOA
zw{O}*>hC{3b^6@9ccbug4F@?e|KFBNd;ct#UfTVVXlfs|=XliKmr<4sxwJf5lYy5e
z#%TG*YBBuMpLnUxpYT${KjWp*Nk9G4WaHxG9m4b%UfP&$`DeV8m}zq>>%d&r!9NJo
zUw*0o|KOL#<sCbJ{dnc|<G%>guzy9E{`5=z?v(t4FpawvK>r;tZ79EybUV1F;@m&^
zrKEr5moo6u%6qZD`=xOo>n<<fPs*=PVi2ak`=x0NzqGb7jp3L6GhX`m>SS}#ttUA(
zPu?=*(ppL$g+lqWUs~02qp7v9hE~LoOYgRq{EnBF{lrTL>bq{g?`oRvy0_9*`LL(@
z&vGf{#r;3z(%GMK=|8chYXc8|$)*2^E$vwveewDyTl&*19r%}K>FDIp$1n41Uq*hh
zr883_D^njnO@COM9{=)h<kGd}|09?Fk8)}6U*yu8f5@f0zsaR;f0j!zTz{8K$Nqy{
zYWeTwQuyz3sjY$P-{sO{|By?w|1Ou_p<*=XKjl)7KjhN8<H<6gf6ApEoR+`IrRV=9
zmrC=4J$}ihgg?urZ98&l^-sApCJ|vPVbsf?;}^`3OOO8{m(n;g|00*t{vns{|BGB2
z+V;C#%Gb$|OUVqm6uKjqzGDB^a%nMR1ae0%wG?8=rK#er(6OhQ<r-kLl&=v(E=|+1
zs*|A$*8VP+YWztq-7Q614|*=@Hc<3aF8$7*#^5FmF8v{wrX^&hik!Fohg^DK{CBw&
zu_Kql8FJ~6#*SR75oMv^3k;`=r~Q&kqvM#}{w9}N3MH{fB#FNm*pW-!e#)ia5M_5Y
z0@-%tQZ0=f(gB8C>c@~v(|(gn7ygh-4@;DjTQO4cIzQ!7t{7tRj$C?pH7J2Nv?G^V
z{@;>IR~d3C@E5sM@UL>|#BXxxM^@0<?{X;@)QaT8BwWsrOC|nWxfJ$q<WkMQ$fW}e
zx%Bxjxin3KA(zsBlS{|=pZ`@Z)o_a&`d^nzv&mLFa_ML68~&z%KjhLoJ94QT%8enH
zK4-|K&>gwd^Y3!0*e|)1_){)@_`6)H%Cpqh_PbnqcF^=6aw&`-2>uUpsq2CNQ7-NN
zH*)FM9l2B-{WrO^<=@Dqyuaj9&Hp5qhVICv3XDD4|0tJ!VaTN&f0Ii!#s&W_m)iVC
zxl{|x`e(WH>|f<l{(qKB&-1qazbKau{j*$(NHYVFf(JwXja(Y^C%F{=ceyn1e_t-;
z`9m)4`iES4{WrPvrbyg>luI4{d%5(*FS*q1e^D+q{Ht90{6m64=r6fc?C!snORq8H
z(kRux%cZ1$Etl5+A(!6yO)d@kpXAcl|By>n{)Jq6LV+Qd2K`AcU8NFj|0I{5NB)#c
z)ql#RrV{11Z>s)7F11Pd-;qnHf09chcjQt-EIJJXJq)mo{9P`M{F7YD0o9LTI!uNh
zCc~Qj*}Q(qrI9;wspY?tOKmCtom?9554rU0HunD+x%BhDl}j!E3%RuTuX5>U;$P&_
zoIlH@*x%*S@t<<30jm?1F=?{T@(;O`{9nnXhkuhxd7v`>Y<GXkr9;2u(hqD1Rkn33
z=9gS*%aBVa{*_!hiP(`#{r@DFj{h!~*8Np3<z)J2xs;FTmt0zn#dQ6YOA`z*34fAH
zFQ~A;`6ZW5qR##<mp=bpF8%x`x%4jaceym^zmQAsLF0eQrSbnPm#VVCUI6Kuzssco
z|5`46PXCKs>ibJBJ^Igb>GQwKrR-3SqyLags|f%Y1WMQZO)fQMFq9NfHA61-XN3f?
z0{(xIOI?1+rJ{%(x%4(-=1AeUjFRz;(rOG`gv_!<D*f~YeM}2{f<O5O2`ouRxI0)0
zkAuSwgA)!R@`>P~VsJ3C<d2MNti>ejSn!KEJ;Bz%X1Z!<#jUMvj7$zeVOO5gB4n>H
z*4YM!79;s3<=x7m%QvVM!$ot1DRK<ErrAKt;!uV*!A(_;58lW8#-L;!0I3s^>QiV;
zA7E+=x<F^UN+`+D1OX}_P8GIh=Bh1~%KH~8xotrSDj<6;OoBnKA^_S_0lQ!^00}KZ
z0+>}m-2T<9b0BpR@FuT%i(LJFz4`-xa<hS<Dxe^|+wW5?nu`;9WsGHl1JW_Z5)mcJ
z<CdyvFEe{tk=NC2#X|OepV)c6iZ5bkfviA_GCu_g=I<6p?USIwJYO~j&$%F%HYa^$
z0^N$0l%ptBGxJSo!9ET#gRzJUl!68=hFpkrXUMIbeFdEiwlwn|_(QEqcY)F`wv@QT
zmJU|@i7h47O+Ng0Z0YfzY^iKF?@I<-%6HF2<u|reZ{wzpCFZ>RgJ5mgfv@N$9}I_W
zZo^R~%S!a2uXS(a5MIo{ct%5V^8Ln1)%Kx!u3|KpaDSWt7)`NFc|XvtyqBc?&}ypD
zON*_#53pqhUdUk-zM{JfO4JP?>lDx-c|_#9hIIo72OWJsj3JjkYA_4vN@(Pa0?kaJ
z14%&RdQNfo0|s0A_U*lw@|b5EO&Scg)V2=xfsJFE!IoxJEBOKkDUGaH5FFD8Cjf0z
z=#OE|mYQq~xwIqf$tHs>Eqda`U`sVI>*Oo2`6q*Nl>I)GZ;6!EM-)X3a9TG7<ID}Q
zvl8cKn30JMcDO<@Y}SCy7R695I3I*_sQJLgEJ&3Z=Hj$si*!`#HPD~vGX)k<*nFdj
zKAQ=87{I|aLBPsxwyJ=!6DqWS$fY{8OoE;a3(d9(i)*6UGvrbo+61oUKvUa~fVShC
zZ6?#fM|;}bhlSH@5qJfZj{*vx&pHIOAKygzZnop6gZDc#AZcM-_!;fKr}%K#Vc@B8
z3X??>{Gu~B#)@`!+xGnV;g0dUPlXAz(+V9%RciLrkVI$NGzRK6-BB<slwn1C4|J5O
z(B6|_EdcCrhK1W4i!B*mr9&$vGQG#5UPzz@b`F?fdStk9N~h^`*sLdJhRD|5gXYML
z0!?F92tAYj=t99~#q3>1&di4N?g<84>W|bW!<89q=`u>v_Nm)Xwlov4jmNO)SkWlq
zJ8Y>t1%9y)G5L!v6=lj|u%))W&i+jOI(-Gy=M(;COq$?>O(u5@*e?0Ql!yDiNI##@
zp=ImP<olUSHlLd?*iu9Im;w75gDoZYU_@EK)_ro-eE5_;<ElP<lL>yak8Ar`3q}!)
zPqE>-(XDz6alD`PTYe{AkY$>|mV)}h2Uy!Okgw=WwG6g21DXDlExnk5?9S+&nM0;C
z*iy<*wiL_c^y4R63Lv`;Ffxz(PoLr&u%fBlc$PWchtb_(OK<eC%DrS#RHw=G^$lQH
z{f1d3ZM*P2FD4jl>B0-q8FXz1G|>Q>ZUEbwLwXvZ5=l&31ZHPj)^1xAqbl4;M3m9d
zuWXUGX3!<a-rhQfylBhn&S0KjygqaBT_*b*JcBLmV_j6I#REHRDIVqJqyoq1BgXgs
z#+E+G-(gGB6fw0K$T1>pD+9VR2btLhhVrdpuT(H=J*-;>EI)>aDvynPR@`Ar3n?sR
z$KJ`NzWe@+H-o{J+P00M28^3VO@>(k8@3_(Xf%T@&FFaf3}ePRREuT1NPho{FtkNt
z%D(~qq=;citc`O>unY6o>R!RE9k#Td!Ir9wygoL%@_sB{ls3R%OIt?AtvVGH#uH{#
z2QChzE3%-4KMXV2QZh=vuXh>sY>oUuXzPQh62>wOMxnf2X&O^H{xOan+Q<47a(diI
zkcGjPvVI%KG{3+01LB8eVZVe9%7EI_N5q;ZZan++V{XLe+lQfNFh>H*(y5Q(KiSf|
zb1i&V*c7c=moBr-Y+qs1Lb-flu%#Jn5jGM823rdJ#+FK1vu8hN9O*MFjC?Nsoh{}5
z#g>jy_xLHLjaZ0oVqz)q`mI3*TUvkVQ_0BJ=KnRh^cPzi_>(Oq|71&-sKRq&bHZ35
z23rc9oV@dGT6i{=eRhxY?45J7a#v>k>ZZm|3*i`Ssnn!XTMO8A@;yf@xW9FCWQQ&F
zVz8wKY|J7|s3!_+44eGKeDvK`-iX%dmU-}wT>3titp#yH=-_tGM+-qup8bpVev6VP
z-e?rkv_uyBR2Oy6(Dapgar#Tf&P&9AC9^XxB+xr-srCLPhFq$nzie}c*J^ah0=?W5
zxoq47N!8_bWczNU@cnSXN6+-{$I(J3{l4S#dHwg(5>!_LM!y?IEFX-3wOa9dVLJSK
zSK{VZf|OT7X9b<~myT`kN~~FRc(Qase>pi~we7{KhW^?`m$hr#t0^LD&b@0_POKHo
zt}5%T-;7xFPhTq%5xm>SbhoeXpz>ttezsoVdu_zx{q*GrPj=W+jPBCmUu-Em3xh3f
zOkeE9Y_>ibk967Gv$mo8WV2=eX46l$)T`&C*7h&9G;#6a=O33qTg2Xv;}O5HrQf!<
zf;c)l(e24>+utL8%B6+d@Ah{tqcOrea%mskFy;@r6!A5qgdvw2r%Z?$PYm8IVo~=h
zUK2mkKVklF<<bDH1;+uI79rs~I^Ba;hOgQgrrDGpeKj>8lomn@%u{{MZMx@9nxs><
z-|OmQs+U-OU!OAEl@{~7)alJX<kDwecDe%}DqhdI&=O@&FVS6#UD~y|_WzPguhghF
zM}^))bmkhTOC3A9<hknxI)d%g+xst1W=<i4w?$`XPyHd6=Gnb$mSWSs9p7S;K1(<{
zycRT>RQT-l@bDLdS1<0L8P&T{zg#xhs2!0#0P|n^C6_)vQLNOCzh<q}YnPH)@X$<e
zbUUKI>#IW6mQ0dIv3w51-w-a(X<GvB)SQ!r37}MD8%JLH<A2Jf!xQW>IF{XEarIBt
zE7+PioPya)IIsGA;~Q`cpKs@JqooV-SGFFgbL1CbG7?MPkxNr0<l01(<@b}Sv+vzC
zm-~^-YTOR5473Dl{HoFvawqKWK2x(=uu|WVOCR;k89Y&yPmXz#x|+QBeEvd;N6G8C
zrOQpvzC&mBx9!D6TW=e2Ixyr?^FV5}EYqn9O%2KWOZQvE9tXedQu}CM&DrZ4Y;R||
z$3Ztz&*7}Yj$CRJX>;}Lp`*T~@~;jDz1opWB^3`jMRSKZx;nJHI(*0_vS?RZmH*x=
zNf!cMCwW^j7TjI@0pHWQa38)q;E<wEnJqI;aSyt_bU63^K>D6@2i>Ir3dobQgb)Rg
zOFOcd!~lS&o3{G8m>b*?rzR+63q*AhLWvr@z+Nl*n8F}YkQcC}B%RYYzIH4F&(mmj
zPFspgkcnUBff{_NTINcG;ysNLAI0cMmoC9e&jbMYHy_V2Vu&XUpzRszPd7bu!MiL{
ze$7kA9An_Rovd(vEbT(4_XHD;a<}|rGNCL_>?BlA<ESbP+2$KaEJNlp`q8=h$3ICS
zPA5@BX-Q5B4;#fAhMFH`mIcQdr`+qz{lq3us-EOg9WZDY!xh**5-VUdo=ycu1?1=3
z=CGE|n$XH~1s|`mZKNTU?#M)gYvcHPZ(gte5i&e~;X;Vg`A;8;{S*K!7y`_}1wZWK
z9m!3i)SLMw5A=nO<i!F65CXu2Mnkv;2@u{6_Hh8jQJ#PSK0PNyJ?F;Ii9kv_@5w*{
zi0GEIH-j{XP=iwdVk{2y(g|c-brJw!C|<jGg&`^NcTs==c=V;S@i&U@Y$V!^tvq2H
zYG%O3L^J>c7z%`q2em@&^~yFNEvOMPy^$1;rsRV&f#>jopXQ_<m55&D2N8P@NWj33
ze3UBbJGMxAG*`e#x2s8}6M%)?fKX-?K*YKCtbA`=DG+}mWHS?w{8X6$Q8LIpzJ!Wl
z%YkdiU?P(?XU?+B<?XIJ-0(HlCeGKLhYjdUkcq+yJSP#sP3$Rhb~il_bqvCry&hD2
zATeIj;YDefv7@6f0MDT7`s=~=eIqjfj|T7O4nsy95_3qn&qe;&T37a*?NyD161q$l
zfN_oivz8~oc>0?7qP``Lg8|-Zx^7?w5#UoT<?Zw`091ToPwK{D`P*$2jsE>Pu2=*b
zMX-DV$`o6vb>q1OB68~(=F?(cgOTK@W*3`O<&BY*+QGeV4$!iMHc3!He{v8<ao!s!
zpnBNTf)`21cB>Ut5L&k#?hGtasy#j?6V;ZSb5{%o@f?gZuS3PCLk7D5W!3&3)uR#u
zv(C3M9RY1j3Biz&zFT|WwFCYN^a9=&e8xRq`lsz^VSH}yxEr}qw?PER$?kmPD=<iT
zTxQV5O*80vBdv#OUp4|zcUzlBowTVlXN~nb@{Cz6G3gafMLgeF3@}Z0qyR!q5}J8t
z?2`wKP(V(;aVS6xJt_gY-DGCLbO;bcl8z1mM9cF&FSq4S0|3?EV*kujNV^hyrplnN
zQ?==RKgU@n?#2=qxG%e)3{h<Ik({yGQ^%)=VxU16Z`&!0MeeFNTUDjwd*<S!J9Sgp
zh89f;TGw8&oE`xsQ_08u_%foLmK<_o8rrD&nE(q^oOeI(j3Tp2q%AfY!_gWEDi*L;
z&AV3X1qFa?vouy-3dc}GYnTg#=+u!01~l9}`1+D<%?O~L<Qo3d>{KVKR)8)Eg?xX5
z6iiUc<T?+?;zggNTv=(N4e)@SEYr%`&owVgBGyAy^uQC@kMDASOYT^A;(gk1OxSBa
zz3P_cnfiU8<BM)#=2#8H>HfqSRv#Juz7Yg{yO#s)RRc7~q9Tsfh`qiXXw1v&ct!;S
zAUbYs3!AZjtmjS#kVKfoC)5WJ2^g)V0r5{2ERBvtC5p!YZ=DQo88kkAk{|a3iH)<e
z0V;iZ0>c_p9wM3POs5x3po5O%0*@WrFP8=9MX`8q6Ab{J3?;7IcuhygV714qb;cQ@
z+DTA1zoc9f!lU9Rts3}&3IDjt7Y)a4$KT$*5t3A)*w5mxRr+cd6I_GI5Ck6Nf61B^
zTzccjH2T<uq2c*B$v2Jij_P8tf}5gnz!qd?bKUS+Tu9@y$HLyp*R_je?%(mZC9)Di
zLsAXyKYaS^UC?Kz(P{GskAM6)L)?xZ-rkT3r7ri+5~ZC#uxxWTvu^n(%)&mPc0Ci~
zp%7scSz=fM&@R7PhzxE5Et{ky@YPu!|GGTJ5_-nN(G<9L0gvR$AvlE@f|+cwFls|I
z#$ORG+LI^9ZbpF}vYw}*bjB=CuCsZkEX^bo0SMmX%4l0+|6Vf?6NY%6^)m4G=mZFi
z9FO2309h<l!2TA+Lk&w@2<Se+#I>MUZUbnKiiTNE!$!^?WB>L8{n*wtrT_Y+P}<Xl
zFEMXyZhTmOSmiW1-PPU!YGKn*g-lLMAa(<9kMnW(4SA*JXes2sK%O?w26rIicnO)h
zY8=mih#I5@!GH*kxjz3PU^{f|;`YWhtNgK-9TYGZ1>kUZi<0$?DanmRVKhh}_P&O3
zWezI!q=W!gWecq28H-GCfiNc!$D>?8Fd6!}+sy{+t;%t82V<b@8G{oyE=0mLu;Bb}
zu^+?cBi@BoF1%|%=IofIr+=BHq#csfy9-dYB|7KD%`?o>3?)%y;~h61M;QsYf%3<7
zou(w>QW!D41nH;(0JS8!%7h;+y9>pN0{KWo(Xd#CSt|3>EFFB@s-i;|Xer~=i@SX7
z+YxP;Z_RgRU<FsSEn6U>pb84rNuuc8PryQK0jL-PgT1#sRO@FD2Lfw@{BIvO0{}B%
zdnK2cLfwtP60hEUa#2>8XQBp4d<6929mzlwCs48`-_Ql`#=|*~0K~RccH*{_yfE0{
z(R5=gteoeAD6nAoh?@(5QM60=s7bcug#eM%?gZtYTaOG$2ok?M1_-Up)tIP}ST8)z
zKz9iYA-gKcmN*Q--N)d>HrwKNx5SR)_5iAujx8}QVxR`%k7A-X5(de^edVm`=uUt!
zz7ew5lxfA@^oK0#d#go>C*Ia<J&e^3#TULc4kWdnMFAXhagQGYf^)54GQiSdFwluF
z>4fvB7h6xoUXqB11GJQm9FNUH#toO^Li7U=5s{JFlMh31kJ#6-+h^a31kTa4j2=DG
ze3;~atEbyc8w$!>z*T7jrvm|=2{n$a8e({Ra)tumL|e+7F`>!)BBx30BciT7z?%by
zUDpLU5+!PhIOq*8=W4m8W*-{zwrn96p+I?B`8+%L;}LCWo_u%Eo?r<C!q!wPrXA8J
zzg3LvZbdR-J5nLUUHxsgWH5&ou#ihm?%)+fJ~rkgviDzm90i;|^5oegqwbfq=i*d9
zvLSSunOyl`QC|4_(6vYjqO`3!ocKu5=#lttq7V(K-(s9cLtdwuzlhm;!(KylkoFa1
zhCsqWB%(wy(dZ_!|8jfj&GzYTq&$H*W=<rmwk!t`w}A%8%9mn9D4<cRbL?vu46v-}
zHUmO)PRm&aYIMJ|vwY}6b%+uFDqA!bPJBmWEWM)pe4#AmE$!fYfIrdKud><*i<q=&
z>F;>(p+MJOHHF@SEf(ZKiCMoigsjTf>pUXlz&WsmubUE13AFV#CG-heBW~37Lp4tF
zJ_gl-pSfGV@w0Bsho9udzOBOrQgF9`cvq+pq6IV>&M-@f-h<tX^A^Ds$dhv==ymx|
zDYp{r6&=a<w#HiSt<}}h$UnqH1MWh>DiZ1o9VzU+`f~eUb&Hg0sim#q>MDEAfa2@3
z_FEFN{X)S!Tn`V*m7S0`5A+wAO5)+M@7yLBU@bKs&Eter35G)qvvl=2>{K7(*}>7I
zzKCCDX@WAiA)4jXvtmK4(q`d_;uemUHYCF=b<|Jk*fC3!MMYFsaSM17Sgqg5=n1&v
z53`h*FwpZI{JU9duw#~fU)PEFX_k`six`nl?u&*I470SOb=J9mUSU7ZfRz7L%Mqyy
zu@yeT6@BNYS$f&-4u@6=%}2;xpu4Q&1<m}YSvvX9+Y6X=iWDyau0k2kmbR$Oj#<jB
zE5xG)sQj?fd3Eqotc>3BzLQwtZfGQL5@1wIv}Ks3WN7zpVkj%o=k{(M)T3?IP$Q6v
zak2p)H1Ck|rif+Jt$9Aj$7*;;hvXo`EamOE>J9L40jF#G6jKhrswniGet0#~8p^R7
zNz~-KN(7sc5FPt3GWX6;blQ6DZm<MScf!Y10T%j0y|;sqzH9dHTR5C-8nlUARdT)B
z0xb9MEwJx^rP5V6nS)j7!D{d8td^o;p&i#?A0J=3@h)iNO++``5g8j^ifnrC)HN69
zgpAEw!wGslXo`%z@F><cndkYV1n)VsKwD=9Sn8;8qmvlx5FLA^)d|srJV|kG&1u^M
z1ra;pme`p4w-X3nF}od-pT@%K8zGGxwGGvsBPCA5S5+TXzaKL@usw3|`p{MTm;S^%
z?{1HlCR}`W?BnAb?{$yA42_}%A8+$M_9o*xL3?E4*zp;MyiZq;&;B@$>l~R8IuY{a
z_?+&ErBaT0$rIltd2VAfmr_rx-M@lmiu(R|^ibesi`)}iGbeO%S$9)UfSPY$JK45%
z3DB*~n+dU?(}Z{InfuHMOa*i}69<~iig->aW#ZV?$Hlxw!0b&mbs;e1(#!zPU4x?x
zxs<0F#ZrHQA(w_^BK93%ZV818K6eosaS{IJ@?XfMW5Q`My+jwj5!bVK=?_+2RoL8A
zh27MYev?bbA7EXSPLI20#yk4QFu+o+J8s&|ZaUB1cI46#H!e&9$E2IymKy^sHPmxA
zvT-*)?rw70-9#9P51G)Ca%azQw`_K|dOl$l=WbQzZoM_3XA%vBxY<eJSa>*T8fl_M
z>inls+yyDSJUzHBd9)>bv}^WoexB$>%<8oD@bdL|N=7+le^h4ojO-h8w(<0cOFSlg
z#hxd@A#QJRU)FJ+gac)D-X<Qc8fm`AJ<n`;Ue1U&y`6Dq?qj&`C%qw0FTH)ihfqQA
zlc8xRBQPgL4zQt-QC^;(O~24vLr(@J$6fqRPntV<UTM-J8*!Wd`M$=d_>z;_0ZF@_
zpWF@#@><=K;g;<c{oKnL?#V6e89hE(HaB?@;$1`VO4a)kUGOmp^CjKH#oqHvX2_S=
z=95?MczeLTb1pUb)hF~$eu{ecC27+8y6}{H!KZP9Pi6P$eb~u_gFZ<FpW-whr2<bh
z#j6be+4Q#0XzSG3Y@Zsbk64%S(UQ+$^;4zdzTsOw_mBG?;khb$)8&DuZ)1V)y%ze3
zI^T!SeIJkbHh=Sd@_*z~?h^q#X99Lb1n{N@@D&E|*8~VW2@vcJ5E=~-o(&NBe@ZS@
z{0z6wfI5}K_tgYFW`LzKOy;C0k;z59laPZlOgayOaI=Z7^e7Q8@WFDp+G?Z(A=*eK
z)<`8<Zx#|^7Q+Bb_h!W6W`nPLA@sIEYUOaF!ss2al(Ykun#@AHk!R&>&+ac=z6L<`
z_rdnAMrvXcHO-<#NKrV0Ws~$E{cF&p`rot3%OdnB562J&Sn9m8DAEUwD36n(fKMZr
z38o>ZO_`2N2ARvmc(25JUi<DL%@oiJ)0qtNIhlB7H7;Bw@m%`3YX<RW`Vd(Ru+%Xw
zEOg~``a&ov_y{&yf&rF>LW5=(PcpnxAjZ=1`?k(WCcTxIECWPrM4~1GMcIanO)ff5
zE?!zaCzBqpR}Pn>gR_9Rm@`p2pW(-@!7R@)S+9Z=WS9<;&gb;SXp$DsNHf6Fcufi<
zGkzgNCDu<mTBk7Hc4hI{O8gl!uugfL@j0e|$;C6+L=*H5SZb~kTgd=RGj_mI^K!Ur
zMr=rVT*^Mk5jx@sed)^VdJTHxuJT6F%KUz>B@susnpad!Z;1ZM=nyOeECuP1V)dWI
zWb=kZc*X09Z0cp~fThV#mQ$qR<{96^fb$Uv;rfM}U9&;ePc{TUhk38Wq#O><@<JR5
zg}Nyx#-q=9pN#f!OtfD;8_{radoOmys3xxE4ER!cxPie&_nCMjuhlbyn+&kj^9*=&
z{}O$6@q<WsfA72(I{fN`rBHG#E(fxg5^buodLA2UvTx=6;lxneRg+t=h@A6Ep&NR;
z;=5`P$KQlTtj37ghJTzzti*4N0LXyJOPl4NXR$3Y%)8Y5Cg((H3I9<p^{`Zeo|L-X
z{t0niYWF!;)y0zD(i_l5ohHqAx^6@k($3o=_8mn8na;7e^5v;y#0v7e(|YTdm*px?
zvlM;5E4;1qdGm){di07cSGvXx+=|6mTU>`tF<a0xTF^F`*Ct}qU2%M$O6P!xLyhPA
z^%4=+y-9r9TcBK}$-ZLK%Sxx#)pz95%6j==K9$E|C-;KfyX~`bqXdp-hpUKCHBCF0
z!UWH&F__fIZOm45L%{3)TL)`S|IqqA{r17V@9tCDq2^;_iDA31v#QGN-qQ&#M7oOf
zu44|hax~p|GPza0zWeHMp#Ijtxf7QP0?uKhnB*F;(X3jl1ZPLOD2w8?9;%5*y24_r
zY+a90jI_}E-6E#qxKObq*@_0SWW|S$NB2M_LH2Sp<~Wm}{t2lPS>^Rr@eD&|O^Hn7
z3a)WK?c6aYf)4+h#FYaUnvz!?Y~tOspnE_mQaVSr*CcaXk~F1qJxts$`+HZ&3JR>A
zHOH_o=4eXaIQ#azbb-82mXqlD^)+cyB(s)`(@X;XH@P%bYhC8%Kg*@AZ_xTo^9-1%
zNH{p%uuKmsho33$!c-P?X~|dLPh;vpj|v*~pmnuqz3BASaVEoIC`%@vyA0Qrle2qh
zv3$(;U*4*Ibu>(|9xaxARe%1&N``FrDjv=~w#2Da+a>0%AWWf2E8+X(2A-ZAdK;$P
zyq4F#pTmB&1kIku9o?2<o*UIBXiaO4m9k_v6l~o}SllHLKUHGRnMEl2X4w9H{+Vv0
z|H~P{t)A#ug)RT>$To3nuj2ix#DD;Fi@8@88f#8C@QQ5RP^H{w$f8?kmcB`3t*KwS
z3>B!w%#Yal>42-^tZiLbUcI*yW#KUz;;4EdC=xtyI1idrr9Zz^v4GB!Scp~}>ySwH
z;P2}HdSE7e5ie>9!mHCGS@bk6o_cyNU0px7|B9WyVBVfxc?Vbp`O1a|*n|ruMZdcw
zPD&)|dp)?fcUOkuDc;9jpg@d(d5&ENx+z#TF=Bw@lJ>X8!<NPzM!fJIbf}kF__(>D
z(s{DaWz{CB`JST2!TO8<nU6)Bl5AhB1+N%&-agZ&NbNbi_+7m9bFub1Dl1QKqxkU=
z2VJTq9yXvqv0XBFH*;Khx~sd#B~GtdDp4u%6xQ7gHa+qZA;vX+N;j($`0%<~1aOnj
zV;C;#QfxFYv0c_0CpK_7**<f{yek_WI!P`V_S!kcK}&F=d!~RIsU%=gb7Tv8v*3pJ
z$5YO9@Mo`p%XCR&Q~e_Xe3w?EjU+z$>XYe)V*#AkW#J*zFb9@<9a*ksV9cIPGi^V1
z^n*!p**A?(na~TVt~r^azJ6{-eK{HXeCD;h>yU!m%Ng3jF-FYuCHkug7=v~3LuYj+
zEE+@;mGe>rMzJq+n-8R#PL&AF&`tKpX`%z{-BPYiz!Trz?X)RKx=adY+Lv$_H#Jeh
z`^qdqV>>(3)Uhj2tU6p0=c;LGv`~9(&2D1XxM=eJP*=Y79E74yQKBiYMQ(vijE4J%
z#QkPs+>7OLvP$!c-gYnZR>-l^I+;ilPYK~}EPUTL(X=zqAVO;@(pt+@^w7oen3eK&
zwJ~bCrA;k={83AN*CVMH>^X#TtSq#3M3ckkqDAg*nv@TGF$?f_yDY$b6<=C(ARtCg
zc$LdkkK<uqoZf)_x}*3$ULTp$W^O6X;j&iyU_H?j#pqf`PwmhHNLPgtG}n!2iR>b#
zU^7>?CT!gP*}Et&*S>NyZiFf`2<08_C*HCIRa{^~JzRtE23+<$^qHE9>nVz!MCM9q
z(Y9HgxQeS|DQ}N97xh>sSn+%egQ^T<vgiO&Jg*u)NxHja_%u{wK02A~0sCfz+qd!*
zlD#FY4XqE_yVYF$;p++u%kXe+;k+heqCGvuWIl+?P}NoR;oEbtbkLsXtpW|#2C_a4
zL<xXiA!fd@qYWl41k+bfo<6scYI<`_c&5C<gqE3LYTxP*bIe5B3Y2n2;X&ioftXV&
zEJ*8{V(fKZgW~HMPWKf|I7R^zg2;gcj~pDwD;YRe_&|#3h<L7>bA^Q3L?ZLs2Up4_
zTh%_fB$-w@aL%UAhIbE+hK5V$!M}~EonEgVuxn_EIa;l;&ptJ*>8x;lPV2rym0X1F
zNqhsxh9cZtVc4j{Rru12t0qU!CpHg{3tL)9nI)^b9hWHOEnDSLnIj~<1H`$Tu(h5q
z?a;BGOgXRhL6tWRQS$?>Tv(kR>2JQwu4dPG9Ar(h(Jkp7bO({K$z=VcqQnsUwJvYA
z#eM3ccW4VOob_{0)%51~vn)3Do-3}F#acKXnTvW_Yepk>Qdrqf;M$t5I*M2Yl$%`3
zc~EZ<EY<;xrwH!OOU#HPcF3_@3SRFc9gmaVI+B8$iz*(@Fjn=W=17Fy6xpC4^d>~n
zAvdE1CninyRe@4nSjKm?@a|Qwa!GYpiDDlD;NmidOoXO!PDW`r^<W%EW%Sy%>XGGz
z>&Gk{og|C}Q%}cBwdc;n_-pGI&|&%sMNA^wsgJ|H?`~ccDhnMh<1ccp2~K@i(B9sf
zf66(oalsI!`D%Rc=p>?LqiD{$-jql0y_x!%spHjNu52|up{;r&Do6aqAJ#?hQFPV)
z>agx6vVe^zC(k4uaL2Jn4dVGJq*xhj(P!P&^Svb)n4%Y>@?#b)G)<1zMdC0?wls-?
zk)_giqAYghEwAp`#)zRJzv|DfW8wgqisKKK^K^(H$^~h`3+9^0F&42AO*`)#g-Ta3
zR;6Vo&3JY=Hxg6@UJl3G`(N3WQx>anGx?<X*GKbd=~?Q5qHCR&1-Sa{3>`(K{cF#H
znisEJi&gLwW!f7W^^u!To+sQh&J+{G7P4(5YBw75>fpVz)|6=Jb&9rJ(+AembKtpB
zAYR=I#H4Ew#nVp-Hg<RAx}y?O+eu|RPro37{m_@1;J;y-VYuPfKs(1wee~*J3+s=-
z*4fBen5^?-qyf<KI+Y}_w33Xn3lpOD09!amR!o^0lp6!$=E6N)J0Y6WqNG~@R-z}-
zOtW>cP!p1E3d&?S6?&YIr2^LMh+e)L8&AL@<48z3CP+4ksRF4IbD8-LmZhG=(u_sj
zAz2=a(HM+keT!8Lk5|kGzbksb%ieI%fx3$V5-AswB!cCKw@Dmt>1Dab?UBM<d0;LZ
zQSL)U+{cT!7YOJUkl-c(!{)*+EXr+1XUZ<(b7j`cfT%Y_i47WZEfIMJBgIl$l#L*o
z^yu7ah_+*^atcl$3dCU)Dflo-B^V-HASxy$R<s1sM7GKx!B{av{+<uY!O=Pj%zDAm
z;&M3tIYHiOstgjM8B7w(E|xuHF13Y|YABMBi;_3MYgMI}E<v=bM5W=yLRMfU$5zpT
zV&$!|q=7M+X;AOSF{QVV`kP}C<YFOrusRu{Vp5{+W2&{;B5@P6z!W7vCq}17?;(p~
z%cv5YU`?wM&4LoI&~ceT5C@T}krk~l#wLDrTO9kADr10GE-umgCT>NKR*}KY&rtVf
zx$-RI_cgQ#V++MLTO=1s@OtiM(-3tlFt1T0b`z{#oUOAt-e(O~$4D5(-89pR(P;qh
z{RUFH868ZAXa_^o=`B4koCo$Cdue!VQBy?80Kbon*E__dO~>KNs50&oW;`BdwbAnS
z?oz>cA2MTg&>}Gn!hSbkl+^_H7RocCSq37t+}961ca}m%30ZkKd^42VjM}3<aV5A_
zhU>jd`OO3ErJ7@SJ0GfDUYxE$tBQ{yI(+QNQHVBC!jwF5P)YnmROH^H(F6`A&AL*a
z6x{x<(whS~VN#p~G0$BKswo5JklDs*X0;n~xN#xfkEX?{)Ryqb;4Dm-G~K}*Nbo^V
z&znZkEYn1h9QYgn?(LAmIYQ<?w79mz^fsfgW@EZ0pN^2DRjgW`pLf?`HrL;bdSM7T
zqnE^jk@U{DIx7~VV<vgFOk4>l7Nd)MbwF&zsKVj5GK2B_H>oF2OBXZvQ$eG>8c{OX
zn0*>8njOXvA)`GVV5J#mmLf=G7N@b!Ej>&Yo`#Q<^TMToIp|=#`V}(?x^V_Rzy{}M
zLDSQ@WlX`FEkV>JB-}0H<M+lKb&XLmqDnxeEvBQB_d-+R+EZF?8Li?llcI9d5H4b?
zArz!HO>_>AQfTN}o8FF-orZ7t8H=cYF$SLE%)paow1{OxP6`WtSTJxQ>f*4IslTBr
zstoG|Qp)$jr$jO*P)sP%h;m5{cL;7EQrta8x8ak_QgqBEBdy0!jRuMl4TthK(sv%$
zYrq)|fX&>aSrPy#9cZx>l)uW*$r&W45F^t-L{M(0;$rqCP&lTgbrh(E<klU_v;(GW
zOBG*&#IJP?CiLkJbYHe;6LC3U1UTYVgc$s?nd799Bc6*_&ZHwc@3c{pFwR3bCZGRn
zjt?l%6)H^dv}A~>H@!^A(l3l-5IVjlRfZ*6w0bF{)H|@!y+$ansWJ<wp0gqTJA`Ys
z^-<imiJm`o{fZT`P41$)?H-jQhZPU!tV5I;;R6MTe_gA%4o)w)%_AvSf_GZH$5iL0
z6X)0z4)8FV^Wid|zTJTv6->JMQFz|~NqzOiC9^LN5)?Y&9EwZUoMJ}%jHqEIMtfJO
zJXMj)?7lc+w1_j6pP^GIP<f}N^#&sMrGU5?glSde%`_h&=**?pR8az$3+p2^(86oW
zpjxGk2BWc?&OK64l{yCp=O{}>yy|3hn`BE-9YkOvN=68(vgDBXK28A>eJ|KZt;!Iy
zdRspM%teS=o{1I*6!V2!_>FM5i5cGEPoh23+$3MT4DN&;O^=8#D}V^Mx2PCxw{ZBk
z7$&svrZ5=OR(>LWa_ocVsv%}++Ax&yiSJAv`u1@QuP;-rjHPL&P&w4)zT|!5^=AO5
zQOY{sxQD-~I8(V%t%h{GgmWZ|{gkG<;vOumvFxi+3YBfzK%KE)Up15%miFq2RH%9$
zcJt|t`{-uj7?dQKT_@^^P88qZ3`|m1FSjpf+9BP(6|~j<gPBj?A2cEvSz%j+^P;{{
zgSKy-0rp+t19JEhSoqW#Y9mNR0rK+Z(>MnRAEDLrm<o3jhX9?bMy8G`81a{XHZ*g`
z6Cun4k;*ah&xL84B+8Crn*UQV9WW&AD5gXi5=E29P)xT0Tnd9RHNZe4^#>x6&J3-Z
zp_o!QBmywRGe$<yJdO~&Kc17&FR$BjB@49oF?F9pwDt!>&J4pNAO*e@Ka%2sIe%)5
zVGQ%`7-bSg)IX{)35Qw*a|uT23%0P?Mk}p)sbkb|6Z66w-mF)MA_I{bIH=N1DqaGQ
z38k<>4HZ^f`L9rT)vNVMhO9K4%y=t02#0}2=_^qA-SG;7#b1S?veyHJ2(?l{40N&v
zD`JGQuVyO=M3t+_2gxu?(?&cOc**i5u2IMiyuM$p(ljOQA>%?($Y8?q(KE)wo?@Nm
zW^>V%Ek2J0^E3#N`V!Pb^rzNqtqAdLsDBDd(dx^&xf-2EyVxhd*WfZBX`1S20FL0d
zXJS!LIr_<JG&0??3!85!Z7i}WFW|3Ia3B)@sQ;wdE8H|h$*S<q**b<iqPj2O_BsT$
zt5U!Go8c9T=H@AjlhJ4fTS@>6+XUdSzWHhlwiLKtfd8!3lFu+JvE#Tp{KnQnZHY)n
zSxdhhu!eYDT`dSZ*CI)#?!y>!kRXAHzNTmH>x2iJ%~JC1eAx^lWz2rErGnrCY^@R-
z5C&U%|1}XSU%@bU@iD$%lPdO2Mxi&##Roug(s(ONIgVto?DN1A8?7fqpvOgGM3w^g
zUZEJ8og$z^OoHy4MsF|SoC6l^TEDe_9c8ekP-JPdinMdZ!g}l8pnFHJ@Sb<KIw((A
zUx!R4;ze!-?GaR;mjLnMZtG7(k(c6YR`>dILU_3Nl~wHY9|(GW%{z=((&yV3Skk&J
zM1!Pv7br%%thU<RO*8UcF`T~AmTJu;4OPMjT_{-*5Th!~(Ab8h<;Go557frKwX%Mu
zlx)q1-y*Y%(?kah^S6ST$kBN?!@Wi=`-6<M&2Svhb7E#KPD0SV0GR!XKTZV7vjkJN
zdUI;S@{l;~{H+HUL{5ZB8<jEe($(86Rgp3YxYA+`u25jLb`LH;H0ipWRTyM6#K^7p
zCtfNePgvRBCzV1q+`&tUWzW?zSTx-}kGqM)C_^iD@KVx(yFeo@rXgWgFj3wJBd8(e
z-pa8`?Z0Cv?ElTsmVuWVBqv9uSL~h0b2EDvkn(!D!V9XL0V@0q7g(J#rtMwNzNau4
zqID)#^S<?iB}2OjNC4uTE`p;Pd`?FKbcxm~r?~H0^6G_a8X=~crMDPzDTHsb)xjRt
zJ~k9`?t#A1l4rG+>Hy-c9mW`mlQR0mPXg(=t0g>Nc|L|uDU23(Hq>`-^_o4`y}a@{
zsbX2NQXdr>DH0mxYotAl{vN}ug#n?~ASs<uo~w{#SeCxvv|&Q)zTnUYb<_C43+|t`
z0jYdE#|D0qha=ynM&GDK;^nGggLad4VA`yPX*p$StSEg$g)NMDhqE!WHCR4uw`&-M
zT0%8MHt7qxUfGp}bjRyEM~V~9TlqE`kvBY(HFIA|-Dza}@<p-GTSY?wx%~f&y*q!0
zy8j>k|C-e>V`l7YjIo5!SX+p(QxvU2B8n_!X(MXvd)cxj#u7@)kVKXSV<%flwrojR
zvLzy}7oEM&I?wm=xjvukI=<f@uK!@>IOaLW>v%mMkNeFZwKTp<Y1HvRCdqD_uH~mt
zrvR)dTs>=1Ze&4^3KOuF(y_jv(_GDw-{$;g(M3C`U8%+8UG=<)FNl|BX?wj`fOU1o
z(Xu|(Mh&^E2Gon{!1K`E+mhA$bcg|0@9%>>c=9r03Dy_9Lw=#!7|;@)%-*80Z9^`#
zhBmJF<2q>?<HbyZe*6EBODhcLcd)D$sxc_&xOG5n)R$7NU8oNob`Nlig>ZXAwFWEW
ztg32VA!S$c%SOS^2l<{-s(Lv*VK?KUvW`p$nR%yQ8uA{RN{N2si#A)!#QHN)DT+(l
z(+PBuB~?q<s@_geE(Itn#T#<zPG}T+3F8BO<_$UJu`dcW`^8>kLoQWaoMl2uY{;d+
z7q@ktK6PywO%>~^#PCnN#p~Rh9iUvwBxz!@%mK=!nExP`KIzm3<<hr5<x))p1?La>
zzssd;zsaShYE8e%rNM!la%t-PGu-cTsp((k($;9M|0tI}m2|&lnwq)IVN)(Wnf3bB
zDr>3xY2Iq`+f|v+F_#v8P%f<rbDOpV<x;BPTyVpiTh7Noxl}(7&wXcBN&H(a-Yi{<
zu__xYW_U{VP@vfRZAV*<ru`w83JZL9{<N>><c3^YnSqmQTXBxyrIIx_<x;Z6rd;ax
zt6W+I%B49Qaw&x6A9AVIi63$)sd7^;9g6xXm!e|%bx=gqrd(=vm{$VD<2Pd+vCZ$4
zt+WbdC>VVx%+OExT=HNxKhS%8LoQ9%igAn?d=#qnt6Zx854kjWLoOXp`AsgB{3(|{
zhjJNFtx+sS{O-TWrPL5{l&M|jnN7Jg$1$Y-G~KaBWSGruQ!X|7=$|f8T<xF!ce(T)
zD3{LJ{*X%zK)F;;qYJ#oQ~O0OWhLG=AT@w;DM+NJt?#0UAkkJBy}GnZVur&Ta%nE^
zI4GAI8;dRG{7o*+pl!;fbvWFqO}TW}?{ewx-{jK!m0H5bLAf+_LoQ9d6vw_PmyXA3
z%|S;0m0arnQ!Zs0elM?vx7n0SPfBjerH?~ShdOV{rQJ)ADD?}&fh;ohgF)5`v?Wk3
z&5h#SA`|l8luIAXa!Z<8Qa0q${Q(i`xf^ono4?7W-!J}@ONGxQ{!isni{Q1ye=nEn
zgK}w!^DlDg+E2OkrUodNW^Kx)H|4CO`QFn{ZOWzb{{LUerSbm%J-PHed+{G~DWg(w
zQ!cf}8h~<X6bY0|2jLzJ-?YaLpj`S9eof_fxpb%ht_`^qQzf_;luK_}-!KN{(%Tzy
z>F!Orv;~w)TU|TO{71ReqwrtJrDOlM<WlF_Z79coDwjI^@5!Z_KjhNH*}u!Bk9Td#
zrJ^jOf00Yu0^K&{QnI3*>JPcpjr#eY$faSw%cZ4wrk`?Y>o0O?8z`4v!C&8$ORcy5
zT`p~&{Y@@avi(&qb>sa*F7^CPE>)=m<<eHCL|Xx1>ThzX<ezeB)L-P%8NT74a%s-4
z3Q5>jB~kd^O}TXV3@DfGT_TEY%B63AlS@Z<|By?2{)Jq6(?E*|%B2@{e1DfqeL1E}
zSq*mnluIKtHssQCf00YAxBeoRI{zk@j)8J%-S2X#6qJ8ME`9!oTzXB{w?!V5O9w%@
z^s7oUD3`8p$fZ|6xpYJh^M_nYx{-SM54lu+Q!ah;Pvz2>O}Uh4@mIOj<sWkC?KZOD
zrd;~{54m)BXX1ujy1H{56RL7kyXN{Ya_L3CU**#78CJItZT8fV5UC20KjqS@2#sIm
z(xSi0rFEcOdTv85wf`ZPru>jgr+>($q&nq)EtiIZa_Pq(a%q(4Ka)!*_(8d}_Ahej
z#Gi6$a{5oXRLn-mVd%?l?Vob#J=Vh_n{p}X7rB)3yIeXVFaQ%!(&YH3a_OVr<x)G5
z?dmX|A95-8FLLRlzssd=|5dp(S)`Bqhg=%Kp7Fa}TII`m=U>aEg#RFyYI6K4m#Pgh
z_5DRIl@^Tf{SR_!^?#B}D||QP(j9*2<ezeB?!S>sG3*<1soQ^+OOyYtTx#@h<kH$r
zxpa(zX8*ffI`OAmTKz*V_4s#kDNp(za_JrFf09czxnuqzmqPFkzJht0?ChIz>HVRT
z?!Lle>05+`ewRx{*n~j2beR1b9n;Os3d*HI{{y+S_utE<_0&J)(t0vKP`M$O+WBHu
zHQAF1Y)V5La;XOd=U2$j@>4EV^2Jaz|By?Sf5@c}4k9R*LO4LVwEk~$Y4v|YE~Wl&
z$fa+=t)U_IC4Y?j54luVFdmdk{kXA=pK|GY)pd7JE`|OnmzIg}(JOH>HMk6$O}SKL
zLoRjp-H=Q5-0iwH<<g|z<<jc^mRwr>Pvuf5TI`2hdWtXXFuQ~A_Fv^vBTz0S{wbG|
zK)Li3^9*<ubLaq#!g^m*&<=w8i(Fba^nXt-4a9_`Z^;GaQWbl?Q}+Hv_NHIeLV+#!
zH|5fAn{w$KRddy5Q!cIHwDbKZa%nRtmxlbe<kB7gLM|QuQ!b@ZSlB_iRD`)A7!`3?
zi&sn7yUUDNEG(CJ@$rJ*t;1q-zT)d{iz&oP9F-uzzLjr|ip`oanTDW0RWhfy1?uXB
z=_p-)8YPp~40@@dDHLuGvt8R`g0D6OuWt(p+{tu#>7>g<i0{%BL_+A*oqbfZ(2F$k
z<;Tw^xvp0G?w`LL7Fiq?yA&qt9#)w6tazu_3tp>8-`JPTPBCQt>!-Fka%s$IN@ZOT
zvra&%B!m)exVHNXkBw}7<?3>-IO2n=WD-@-PgX0kIrI@J`l4&Jz+0czOJQQ3F>bV&
zEyte`mX+U{g{m&c45`HG9uJB1)p1kAHYXI_R}k5e6eqkKw<AgPSc#yy=QC@*;L5JZ
zq}b4zL8j~l(SeSia%oc1dUTSQ`jFnSOTBaHTkeB$Dc|k9;~d3Q4bzDeE}qy~wp6RP
z@T0zbMuhmvT}(A4Mbix_?Ij7XlkPMu-|0Ml=ULmGTF;`s<&-JDlpS#*IUT`>MW@f6
zsb5P{R(7TC;G<skC_*Na(dJ$sZhFqeuw)$<O+KCpQXY{d5)vQCjc0_ZHdRU)LEE(e
z?F{_}%7$Eevd3egz)u#s#gX4eeOSo(o5QZL+n+tX^E=?HDs+XnIUek}fjv*Frj*0^
z6>lcH#U|$_dCBl7<feI55Rcyv?!MCu(epePCf1XaP;md2={<Y-yoAJ%67%U(EunPt
zt5RN`TJGxl*;}X_Q|mf<LY(PLUgSFpP(e$IXhf#EkS50^FXD9ir4`_~m}dS8L5AVW
znhO}UD6{3#F~c@;V2^{Go%4jB=;E51LckU(#AJ5IYY5n_oGtu--PLNY!~-cja=Xx?
z_v!WBMY>muM2m_(<g<>F3P%RH=$F%z_@7=^eP+B;cvbbOu4-}m<>Gfe@qW1u;hZj%
zA*T8uI|&H$elOzMbJ2r6ic6I=sbL{XyhuHr+wr*+%b1YX4r?P{;hstpJDVpO*-uW~
z7Ro_|^bVHHmY$4Gd~sQI>-yCfD=QD?SAwfW=m<eYw31i!N-CQmopqJIB_*PX_mRCm
zX!e@7WaF<{W7qYvb!J336o`CXguT34oLYf0i<NBg))=#4d>4UTY?x6;$E^<GuW0Wc
z&ny%7!<4xR(EznJe-=x3;`r?+%9KhjuByA{ThmgCgAamWY2)p(E%t+4`F*(;Z#T7j
zHM#7nKFyTu^2T`qg1$C*N-bM>(Hhqc74?Q7u)Z9C1?MTsu9Ok{B?|uqo1Gapt;Yjj
zLQ0W)>9|jTyxvHis2@fS!h0d(bWOU!LkkYaBMnox8(vucLoR()d8ygPUWhuM{d!Db
zAm+rg8ZHT6(My!WWvWb6GAF)Y*hCYK73n33x3`OTG57B(fY7-5%f9<!*hP*D^WxXl
z6Igit1nMd1)b|~G#wxUb%B9avc<X<^$UelR<>k^BgP!EIfX0fdQN&{)v?uzU8Sx@9
z5EeDU<>2%;ult3&`-L5??aOSsb#2>Qdj;BkB@)u{L8q}=UOlSWJth5{a;epDNnfwU
z)*E#KE@OjCf>$i4A}nnuMBM?7mz4<MDyHhLu$h*ns7U+N9->a_D0BI{^*u_^f$qGg
z%mH_CVxw{qoELac4SDYF-1>)H`Z4<1aIfCTn=+TNbmnW++mCDb3kh4)iQGEih9-nI
zTe;noVEKt4Vo5(3R0%V&7AZ*8w;K>HyWQ>Emw1uLlT62~*AEKS-*Wsw?wPpV6RiGm
zLoPizBYy4U8>BIfQre01eWzmqeM=+@sYpP}uGf;hzN?1~OOjHPMKgrkM7A?lgp7PY
z^9_7v+LTKVU4MqwIB=#zv6%enbPnZgjQOGst}jYmdQ=N4er3^rQ5DL&Sp6~3>dS^)
zD!e?O@a3}|3EkOuy^8zV;MbGE!dfwjnF!%RYfeEi)BX8Fv7lUfa<%6A^5+1J?V`dN
z>N02a1w#gzx?XGzvniMm9qnk>thl}k%B5e|KR3PG5BM3WUSA8DC5DjFs{%31j^EmI
z(tpUMA@Z3Igw5toJJ+)|2^<jKC(YT_lJ$pN%B(o1#mZmxwk%XJ=ikVsukIO~Z7eg7
zImv!~IR5SMt!-!2h#JUKd&0RzQ-vw0Pqq!Gt;~Zm3+r!(?|3{=e)jCaU*yuA`KRt4
zT^_5c%1*xLI4oBqvrt_y(xUL$bh$EbVs9(FrU4os)&16JWoPL%*53SgHHA*S6_KjX
zru)nC97FEJzfm|>WPNR=ogq5&p7-u|gAV<!Mn|888dx?i>i8i`yJ68fwX&sIUi+`=
zKjhNh&T~csr_~Hohbz4ow7pip!<WUs%~p$UONZU@nb!$u6O_NZo{5lK-Gj1m9xKt`
zluK=bN-BA54BZ=a>P~D4+Hq41SfkhOTjq2>pv6*E$fP9t(m>Rl!|{h)YI}3Y)y!5a
zc|5pHO{0)EmWV|%TdF3yygx|vXs(Qun#XJFy2%bz+a*}tzmR!zQ!YINMcO53%N=e#
z($zhC+Ie_kR>UZcZWku(TH9csh6(gM1Ind)bE#+Lat!4|y<s6f!`=r&#8#ISPYNfG
zW*SNtEtp1VG#L<?wQ3GOIh(WQ8XF>U(frlTv_}<ojW|o!Wygmnq2>;tT-uoD6%1u!
z<2GBU+^1@6d9VeyeC15zj-ozr95ird4yG|Bvpx^gYTs}1aHlcewlTcuMtHosCEVcL
zbH(8vr_#b(5D5JAOn^a|{^Vf@oZTU|6OK0;JV$@_onL@$Y9TsYroi$bO0#h;CZp&I
zJ}$s=)o!AVv37WpnXjySuG)ep9~SgndF)WjzFM$S)gTvJ_lT~5y993i_R$aVsobQ+
z0sxBi+4%O7482)TSdZjv@x>-t=Dc9s&4R*^iPq#bB^&wLBNM@2M6b+1i`;q6M!#&@
z;?9x3uVF2!;O#jW&wRVP_L2FPT`SE`_N#;Y^TvYRmJ5A;hi)x6?b{*SAiDfO`Q}ay
znUU74qqbX0x?)cn)@BVChDC2vs3_-AiCI{;3DYPj?BD+}BX+uV4+HgTf8MM^L9RxT
z%%PB-frWe8^^Cijyk-hsD_xm2eH}T!|MXzL;$U-kR?C2|z=7`v14}OzSG_Zd4v;nT
z9yuUqY%;s@{?;LpJIgU9nh1eYXyMeOW!{-R6L7;*VXF(h=k(YQWmMzj5;J%W2la(%
zlwdKj3>&UWBk&)wvV`%_i*uEEZW>7`d#~eVLkktkI#!A2e(!aAS2Xj1A9AUAX~>>Q
zHqAn78*B#|#S@l}Yiywf!8HZ6?rR2E&Op(xAVD%Lv#fB_0Ac4P2+S6xn`mSbaJaAm
zajQ<P{5uA~(+m;Li%+D(^0$gzSjV7SL-e?>F}PwwhL6mNpk)$m4we!8WqXEkI~&~&
z_K{#(A-)LOEOd)eCPH@XLbRuM_JwoKVu>L;Y7K@*!*(CHLf&R7K0&fQZxffbwQ1bI
zQ>QX|dr2MnTYEr}jW0?{@veqRQo$9a^dnt{RpepQn_5B#L%D{K6oP)EwYgnbYL<|=
z$0<YB;egm376Slq%*fEMBf5Ang=Fl9m5Z`5Lq#L_P%$ko()qYif5Gj!6oi6nW>gVb
zOwWB*@QI~IDvQV&C8o<pDPm7NIcAce1OR|bQe(e97*_fi+7_1OmcDH@B(#`N5b&}y
z6>-Z#{d~az*;61KJI}|uj@(@y7BoYRyb!1(U)2_uN)z*-)EjPPF^mqH$xvw+M?xr&
zeQT3kgj@GehM#JA%L~Qckvp8GeFKFZPUTi+<sLxjb-H$6NZJ{h+QN^&k*a>nj~tmn
zf>*vGgo-k2m>8S&kH30YwC(<(^3YZi9*bF;v@$=EH~XBW=32=314Zdt4@TuN$?VsU
zO7Gu>>ru=Y$d(wqfy^n@r7l+o+X9t)+iVcQZ|IKkim8JkraREjE3Jx5F2Y24SF#Uv
zy2}ejw}hV7zgpN_OWG0!xCDQr5POja3Ta%2Ti`(7Ae0JKo^o*Y-RA4c3jl&`hA>KR
zZ%KnnkOB49xv#eCau-g#aW0E|bos@$?2mdTY-zpcyn8ge;*)lq=tn%h`Yv2#_R-}E
zS+|$CVo1s<nOhad&TjW!M-ML4@9^sy-R|N2?0yUAF(7Y*UWZ|ZP`zj9Gfe@80)j%#
z&1@=el{8LU=^=c0_pul4&O7#w4ZWYK#_V_QUs=#f<}4kp6n&H*nW<&7B$Yu|xYVMS
z93^Z$b8h>q{Qb)Nzv>?cit0GiXCu=v?=wde8xE^;QQ*aV&@UoFHXrwoQrvL&kCdbm
zZWJW7s@;-8KQ6N!+ov(?E1V$o6dxfLB3solmK4X=;yvwg@Rgt%iL$lzYP-H5<W)fT
zs6RTzLQndNk;B&Y70(V6q|&%$G_%(EAYK{0I;Sy0c#+t!P)A2%HZ$?;-aIcx{51jf
zgTsl+OMY!}5Uj>0?@s|)Ua!l7T=SN<v4CrFTqPBa_I&P>F=AIMN~fPbdAH*9?CwaF
zmv1mSte-tjYBY#rXi>ND4*tAA@!M9p%NH_TRJ;kk+n@4+hbt0)NetFoZX}=?e+TdF
z&lq?(Pbz6)b*;+ib-rXhZ@D@c;xRdbmnR#jv<)&jAIrp-&e!dr<YUOx+KaRarrqSz
z@xAZQT^3FVIL?4bM?ISkiNQ0~^|F=5G<ghj2_LzqvhtZS(U$|e&X+*7=`Rd{B5WOA
zW7%UOLq2?47c#8Zm5Xu3Su6Rn78yWyJGZ}B@6Y51+hdy8L^|SJ`NY>pwT%3tVRe~m
zj8(%o!8Z9zkDopIcpx~wFjx5=ea!oV_Y3=0<F3e)7i{Bh?|NQ+>)Iz{pMGxoc!<U~
za`>Uy+pO-N{n?^J2#s5__zmfw6>`aVHS)_~=Jv8F{3|942Q6E!&dGrl?25r!zg^Ne
zBy5=-&1qdFY#UX_e+eIHd6js0Eh<2QQb|7d)l?+=&0SUF&$tUpU<ShguGxJ}S|i?S
zy81<$M03v9J$2Vsr|*<E=;a5$xgyHFP_&bK+V@rX4h*kJ&MTSkA_ZgN)lsbpss}?4
zW9+E7G?VqCi~9TEHeT;$uFW!m61CSTlkaQWYZ8hMQ%nM(QE)@j^?FTYnf88Tz{nZc
za`V~ssW?wj)Pb#9m~U-5Af@<i)>mYw-x|f2zgQWrxoe2WR~2Q&;b64_oaKbzNa@V`
z^bUL@DAXrhUgkEHn?3cgGl0c6VB!l!%^^^4#Geh0eT(O?r9z1$Hj703%pl}y4ZD;6
z0qMIzPPsvkwq84i3g)^Mh`)gHByh|DLF}f%EH**1rYIeDBWKAF|8A4ryurcs9^w+V
zlO{~IuGkNQxFr*&0TR-LE^hb?;Y7nd9YiMrh^J(HhAZM2{n{EO*x&<GQZX)KJS56&
z9qmLzGW#;`8w^>aho+*!xQ6)V?0jvH28N&_0u+L)6p?a+P)$5MdmJK9y6^$ON}4cL
zfDued=rO$W${>aqg=rvR;BH~?*@*U?ku_H$8c^7$gAkM{TFwN0vCZ|ON#q*`Hag)<
zdA;3MDx?-4u_9?$ONDGDpT0UCDTMb<B!nI#<2%im8pd%%05>=Yai9kdBnGdUFrhx;
zI>&KPL;OnA4LAf*`T-{%#fmn>V?EifQ0x~CPVc5d?$d9|AJ@H4h3v*hU8LaO8Q@h3
zEYZ19H^_K#I(E$!>qLM~p9$k?h*fV852nPThN4l?uo7Nag$WaR*LsZhS+-d+!lf$4
zXe`Es5Nmr}(}fDTPClJMgRiym@BWB$q9B*>a3KJ9j4y5yz$T1CT#iS(N+n$Qh;wX+
z-?ALNHi$abhI>nZez#6I9?Dio-*@t(4d|B|k>eB2Zu+I<pML3J{43BerEK`6o|IeZ
zpkF$Zw0F}l%{NHS4o%KpN=k2tFJO+_@Jp?e*Qm*wy8?JCk=eu~p`s1HH1T6f$K8-S
zd;yPN@pH5Xv$W%0C*kKvce1<h@QPp$&jd6Wo|HSA)Eb%!v5h}LPE|U^0_{j;t;ICo
zyZP~KTB#OCGd@kR!*}JZ^$C-tuTtyOfQ+Qck7@SRh<#V6y-!p43GpzNbh`qSQa%>l
zBT{RhKB1f@K|`^9N>|g0<)^0cv50)5AoL6}ioP%@%~FLwW$>Jeznzr9<`<-R-(nl+
zmjbcd8#5<tFv(JxDl8(`C9{f@)0!LLsy&(ek_Bq%a3zrpT^5m2$-B3oVt0mRg;QDn
zOLFPnoQsY*m-%zTX($(KsEH%>$Tz|QD)(p)LXP=v@P9!rO=G#AE`49g4SK>P-JeB7
zI`sb0=j$wi_hF!1nlGLAWN#jAFNX>xujGDSX=9!Wnd2$TgG%WKV8yiD@j>agylN0E
zmCmd2deEBupjrB1<);U&UJu%LKYZ($$8Y_xE9_wp%cI>t{L;3EWsOiJHs}z`qY?8*
zAD-uZybqa>et4n{ah;Tr$0B0+@z%G!=at$qV+0y(9}QtadrS&evZ0}yXvcGD7<4{N
z)fXp_&!&16u*k=U)7n4sP5@L1JdID4Cg2o%dnmt|uYl-;6`Oec37RCk@B9*~Kzbid
z1}(t3?+JTTes$~<glay2RKcFo{M#Z=H1i5nCiu6iJ|Tt|O04AT<>kL%dGg6UMP73q
zIdWWdo__vNDbHT?Q?}m1N17aNZBL*Rd8$o3JA0pSm=&HDDDoV7x@)Cqe|Q0(>N9V)
zXIxjGS@v!n3VkX(i((1L&{V*A&=H~dK<{uKPp4-G(SrJWi*{WtT5jaCwI~{MEizmw
zbe|}`P+Ayi5!+l@j4pk4rL@FU;Ca|SxzEe&3?R*I4t3`4^K6S}UcDtZol2xtOY$Kl
zdrC`_ElQ~t1@x7YT-CBB`RB@4OY@`4L`%z_tVn-<%N|4FN2J@Gt3($>S+9!VLBF(!
zjP|^2r;RKpwU;&Cem>M*%C}NlcDt0=Tfta)%Cu6Js`>(I@qEsSw(Rs`#p1>L-u110
zQB>JV<U0a(6*#lK1AFG#Nqh#Er77#w3^V=JX~3K7LutYKL<K*-1TXMHps$i`rSh9o
zS;p1pYqu*#<e#rL@ojrh$t}2*w~;-RjQr+i&n&{c^jah;TA_%JBzoX3AgdMH%VZ|`
zCrW9em@2M3hFC;Z9a>O#6@=ZN>-AL~QLEAJ6PJ+2mKC$#IAfem!@O${t_#M8>(!b^
zu*s!V&H6Iny^MX$G`C5{%ih}ht5tm7b)!R1kIKBb_Mld=;8G0rJddVhAW1%y&UzRx
zrA$Pp0jOb;G&M-ycaq%`U9Z1daprc~>TE4+U)|%%S`$H`#FQEd@7yfGb>Xe(yZ4<N
zPP*fYX88P@*vBa;o+8-Y-dqJH^^YyteY_i+eHrNyrGl0;hD@VbS>4^$!X%8qgUQA`
z47F*p$;uBai!d5-!wu70`X^fkjF4BTO|Q#@9|$&oaw@5}Y~J$VWkW>4%f9?h@0ZP(
zD5c^2FGepPAH=*}W$$djosGcL=}4Gy8{$M;nkF*!4BI%pjpYv8*S5CulvZX)i;;Vl
z$=(utN9ojR^PEwOv|39$MkL2vRBTWCn*~+$EXoWJmuEZk%!utPz~+Nz%hc{%6304|
z5i8=@P%`2S9#=!|w50NFJ;C;MQk>^bJDYp^9W^4?9#I3ASBLJbb4!)ujV^P2cdVD4
z!d+st#j+cGB_r?4Gc9*w_Z5>4`@C{fNZZ#hviC&C2{3;4u<N1=TWEn~B)huL42mAR
zJCF=t^p(Eve%^A5-z*Z}F;Q+t#?$fAhh6b3(OsANuer2{Nf^IP+OoA$L8i<EV@bm#
z&lp=uF{kk02B31={km!SJtusa=@fpg6a4Ssn7yw9VjsROdDvUpFOKvlvA|H~9q?gm
z7Sx>TmU(#*#mn^e9=j-1w#n`?ivG}BZM!xbxNmRS!~Wiu{-NkS1tw3|=!g#dmZb!^
z>!PyFlfL}+zA}F-o4+cm66Zno&OY?2Kl0u3!*?FD{pq#qT!wA9s2Cgt^h;-UCwEFe
z^y#*I*nJFUc28gGtH;)EpLgb~t;h1q$CLwy^M_d5ha^PWWzuo1tZIC0IMzGG^r2Q@
zs)Ox2+iF{zRoT1I+5WF|q%j#@<BQFUW05LXpBiCPFh+c7;cM|B=8CAFAtS$1xuWEm
zF2?k0mvsd7v+J=B4^^@rQ|Bp}dCm!u&WCiKlw&(}j&1OaHc6HvO}{gZic>P~JP*Nu
z{PXKl%oQ?%<4~Uu;5TaXnpyt+4L4>xa%WAHj?xzCujKtcZNx-B1l5P+Lr1<-8c}w~
zA-DrqsnjMnoDOh(DIPaB>Sj=do3Ur%QfIJCud|!?i(H{==U2YxNyjBwX&LiQaF|Z;
zXnLX2-%I3U_KJ1BqqoJy!27%hzD2=b({YmbFL_%HFYCScaAVdfz%WN*7iUp7skk@O
zxO;6(%OsqhI5tN8<LWIO;siT%Pa7q-=HZ@h;W^3ZD%>}dfSc5Dl{%?Zt+B;((ys~3
ztv=jAT}+{EHLMTpfbBDDZCK|h^wf+99Y7UYZz-~7DIjCIE^~wNU1!1uVM+mvW@ngv
z2pfbcwd2zoW%edWm|DBPNgd{b*rQ_gb(i|`2e2A#HDc%I;HIo$2U$}IXz}gLY60$2
zJMdrW?s8vulRmgf*UfV#C=6S#qdNdpaXef3qlrdi{G)w%u<^TN`$$tN&y^O*#b~tm
z)SGOe+wYFFu-~UPxv9lk#3CE6Kc9?dn;v=eb^d8j?iM-Jb(w|&84WU$PDVWOxcu5(
zHa>P~m4-1UpiAi8W;QJ6XIPsC&stLX=cC}?OqLUFV#7P(b|j{KNAwTBlhK$FzCuSR
zOtWW9bwdxLeCQXgw$2UH{MJZr7m+KW9Ljc4=quJ=cr=j-v<=8K;5?e%$||cYem{Su
z`yp9p21Vuh{?PVPAlP`MUUCk;xHf;u?O6AIri)EcaA%76=v6ke>*r-a$W)B^n+Q5R
z24#$YixOG9Qu&rKxBfPLPY<A}d+@2)EJIo3jN=WB>tAC?0lcQepj;|$6@zf&<F=+V
zb_E!WrWT9&4C`|0*AD-XOZg6s86_*b3^0-oeb}G6$7c=Be|Wqtg}~=UtZwSU`6RH&
zuSS0!xOslf`F&?VuuY8T+R}GQ;>8Iy6~1;G2+M=edym#A_mspNrh1CjW(@r6k@&~^
zoGaXB6W}M(?(cbVwB?JzyPF5fW)kPVhM>3m;EgpG_r5+k?5$C}oGE^6Of#qmsOgl+
z!@X*Zmv7oDhMm&Bo*>G;S{A{gt=6>aW-A)aTGWyE{Y(Dcm4Vq)N(p@Dmqrvw*F&9e
z?Pr+CE{s%!u74BlcyvJScmZ(Y>l>XEsS)F0kt2<TB2%9+@{U>Vd={$T40}M!^rqN-
zU&*`QusS471dkm}lSw#$q{SSb@tIBSN+l_6$CcR}#e3uP`mqrm6QA;Edd{a(#Tc_p
z0)><+B%YW%&xAgeYn`vlcXpDMC?i&hPdtCLH<FZQaH>8|e{8vu8^gR1%&YQhAG@NM
z)731+Aokma{Pb0+pvWu9)&}hD8DaG**Bd$Pm3v+-Fx`<z&XZNW-aHd2pco+fQuu&Q
ztWNCd!nqv$sTBWn_q$X&14NA7eI10P$0r|E1b@TlsHu#PY9*^HbmS1w@}uHu%j{)0
z(@*>P=Z3B~&b?(NX0aSTt7UP%M)}x@%kQ5aJ2{~!y;osrRzKyMSOfb_;W1_v9nO95
zrgr<cG;tvrtA%@{<7O>^A%Uyy@vn6h6uw03^Rn9;To03p*y<BP&Pf)2`94?s!Zq7m
zT=OgM9Rr?E`z9@uz8!BDCfo6GSW3^_&zC;rbk#Us1(p|+ewD_{W~8vNJQ}QBH(8g~
z6=XXuATwREbX${8fzvdEQx=c*S*X+!^bwMPHST>;s?<3LNU4NgQ<oAGCSMB)PP7SU
zEqVL-;1~PXAwW7piFyDU`}&mA_oq&eUm#VT^XnumGVZ~pV_BrT>puuc$IuYr=aadj
z(>WD0iJ9xq4P_)kCG3_va`w>({^-xBY>%0$@{w$2xy9ySR+(G_oqnRnq+zUZecPzz
z+hY3g?uG`^$cvsBD$%ZG*D)D$Ir~pV%qr8G##0fe&qBlX4ji~+ydzepJk9bNVZhd>
zdr2hPZT@Zs^XG2K&~%*`gJG$&C>PJ{4}?z-me$!zR8*a>k*Xtd2%oA|GrZ(Jr%Htu
zPs<Pwy0r=$zB;42yKutaD{1)hO3-Ao$*o;VHrO+5NxqFmWTZ-)FD}3uE?b2=rJ3co
zJ5>Mlm04M;3={D+3VgOXn1B@@w_%$lXn%9l3LUKu46HKR|81yJ{zRLfR5LSLwkS8W
zIbv(mdLpdx0`I-&qt#}Z=*B%>uc%i8FhsS5FjlS$VB*9mOxih^<9j>yf%2%(>%nAr
z%}zaq`1T0<Nq(L&3X`Bu-640;Oy_TOqzakM-%i0+dAuIk&d_1M`ihVLbb;*d4wS@j
z_sBB5#6VAFLoOB59kzM?IRYLzPDnrC%KQK1()-719FIPIe&o@m*Lf!qPG&W`j~2wg
zeqgWbWd8d3(W0W)56=fWS-#(W?0MJgN0)1ytiC)yR<Zc{@pXi=HA2;_io1&ztm}M=
ztJJJkr7QntptGI0>hZ>-T?Gj>&S#WMkH5Us^&}19;-IVg|K!r9lSq%m8nrVD32&S2
z^*oYamz{a`|9`o(X3shIgx<andY7NSE<bnaS#N(K2K9f&GF6b3R*{!eP*mQntf0P2
zSyfd{OKqpNmexL9^1;2j`-~18-EX-4;7#*`VD90F)lm~Av*;RgHVX?2JIkZ0C*ta?
z`A^z9+S=MW+gjG!3hCM<8=OgLI74)^w{AQuanaG%*y)aoi%YYMjORJ~mh+?*H^rmw
z=|1j`?j9b;FXgsg+I`~kU5_gi|0}MZo}Rw}r`MH0;55?r3TT{yz$r+Z{)(E$2Kl@S
zGCdda)GCzh5la3CZTdNM(>0CQKuu5IFa%xG&o_*{qY6`_g1e(mo{cv4jw$&en!b&-
z`@xxJ#D)DU(ez5n$sd+!&>b6)GkusE+n0K}FV$l<_4Htx$2F>bKlM_6di*A8x*?hl
zWO?7pW)x-Lp3ipw;hK)*_$24j!|q*telK<Y-le~|rWKDeh98ARKlaIZT=PCZ@>YQ#
zh?@Q?n*QKSzZ8Z46ip*R(ewvr`na@xu{1WTEOw$irJ|w&<V<saa;CpRrg>E<3<l$I
z%?4!pwI=I_Wm;ID145?N4ZlIAC7Y1xVoO2O%U9DcOUhgGD}T34m)oCqc6R=iGksn5
zgEL)zL;qDYZR@M+>w7oX*Zit~vSXm}+d$J_IMa8dpZ}?73Ua33esZRNTBg(Qmp_kx
zn)&d3=EKz7r<J+M*)P-ci*u`sbBq7aGIe_QFD=u~FUbd9RD54q7@Bz3`eIa)4M0i`
zQs68he^{n=zgngyT)$eT-B7$(yumPs1auaPS9D$)3MXarWCZcM^NvLB^xBchx;1-T
z6o24P%XFGL8l&1hIEqm$1aA}dkDh(+u1Flp!mAY0?&6Oe)~v-IvN}7KRMTQ08gMw{
z<Jj$D7tk`5C}jR{=gRY<7OctQSwECCnU4@B9b&DO=2KK@vU4a-EK-TrMYKho*e+_E
ziG14GB>8dEGIfEW|FBGbL|N6j?ln55($1|T16a#ZVmbU!7eyGJeF`@Chh_SfP(>nE
z68-SVry?Na5|$N;IwGcXKp@#U4zx_q{jf}<@kBa%`#&sGKKxUbS1&OtiwCtIzqk>A
zWB+JwCsQCI)g+@?4ixJO9PA+-EM{&n1TE8wwxARu=Z0n4?+aR{?L_F~HHYT>Qn3SP
zw(3=c;axN{3n3`bGSzMZEz@nrV%3~bgWdOZpf@F4OhC&tTFq!da!96Q(=t_(t=8GF
zOtUjCNW&V8o`9BV>`S6uU-YJBdPyL9!!o7FY%|#|+f2c!M@JN}60Vy4X_+49Ff7}%
zBg{>~nrFi@C4!b|ug->LsuRN^;{x;@5R3j{nP%3a?KUja@<Hzl9s6*jpvoQ8+XPys
zN_)jR`Zg?6r%lTgi^`_y#O&X&Oucp{=emKGskcZKCi<skN^F1hNU2ji_yv#ny~64!
ziE#3!Wf~Ab$wa{eC>BdkLMXi(mg#{%EK?K>iIZY>xD1z%r|kW3bNS-7t5D9$=>Z<<
z(z3rF#QZinP8=!#oU&U(ZCa*m44kkwG^&Is0!6;O$-QRHi-x^|dQbjgnSNn~K!|4m
zuh)U=KmgpB`iYrX3|gj2zgedDC`VXQtgwhz&}xV@S%Mn;yzy29B#96J%Lx2umT3V5
ziqm@ZQTK;sdN?X#J=a>e3-H5t%%*X7<H*rw3|^NR&@w#$|L%H9pku=_bwW1e4htbp
z$q1;~2KD~5O#QjFmWBvu=3Jk+_JC@KXe6S83Y1f9iCIS#26n)%H+Mv>IP_wI++Oe$
zb_5bBBGsw1W>?O={2vL&1S+C`TBfL?4a?LYV+UHM9no5BgbmAd>{rWFcW}K~y5rQQ
zWqO9nY<@v8wB)B{%ErA=zhRj^=bJRzf4N&<Bs(GET5+_I)_5R45cj8LdKm7Pc%D!W
zkE-HlH}LC=^2%LcQnz;dmzF6Szb_^ze{KAxhHi9@`WIeG072<`U!2E_<SwJnpk-=c
z`%f&>?e*J}(Of*kk|^z9m-eJJ$wbtm$jjI*S;B>cAC~E!|74khqbA><JdmjP7nW%j
zl=*#?nQZs3mMO}d-p8#bx@9}Si4bm}%b$uA0*Ig13np*}La5j0Go_OXxDJ`~Hu-%B
zd~^Y#^M-S7Z%NC=>F>zesuOxzzgea}wP(;(Ro|BVjXJX8HI9aXmgx~VF7NSa2ps38
zq9b&b@NX<rwpF7_9>GEFCvP&g#O)1MA;g|Ixvj^2IU$Z+(DCw%+r7lcy2dpN`rJ+8
zyXE+c2=!d3o1uF5BZUlJyxM{)u@334<W`QI>_4^MBN5;;zQdyTua+qfb}t|)c<9DI
zEK?QhTi33#89n&emY9BbPMvi4;e|v1wUF55yEvNzKlXRaH0Iw}ro@nh91G9dvwTZk
z6Fp2x<6m|$k9nko3~1hLIg;y)@Zf#S{UkcaC*Bofh%oDPq)hf;&xI0RV+@m6hD-mj
zOvMO)u}lp`DG+|~N2-!{`LeE-Okht*V=n$;nM!g=x+eJD5jy{st@$*>z!atb%-SB`
z-@#gK%~E&)to3y)DLWwT*1LoAji_{uu;+v^ZsK-NC;BJ%ZLb$3=4w?_k9}?6WvrQ$
zq?=c?oou>tLeNUi<FgdJpz1iy;CIWkgDq6c`-f#J+5T6{w7fViWANc2Ph4Iujr)zH
zvo%!V56konAoJ`x&-Ai$H1qv`Sf<P=PxoEVB0jg6I!uyU1T9l5RKoXI=Au6=)9^nn
zQ)S2z-JOna+!6>YuDhu{pk*39IFZm?N>=(OmZ|WDWqQHD--2~_X4?@7A77w~a^x4w
z^eVXubBO>~-n2}a#B=Y7Dg0@f9*Fv%Sf=g2Sf=S4mZ<>&7fpd%;IZ#O%ajP8%H;T}
zvgcrjy(*j0!Sr7&Q$M&y7PG|+++qe%9))%MVVR~glkqza{IpC9@jC{y102Tr8C--T
zZ5x)U7FExcVR0Zn=+c#7<NTmiF<hxGL4u6t<RFv>1_zjh80RClM}>r%!F0b6F0YgR
z&se4(|Fva$kEU?|v`j_dhG+2Au0c$uq_4paFrx2%Ew&zR0{c?L*tpPlSINxZEz^(G
z-z?MQpO&d&8+wJbX_<<{0T^mT!g9@;^`te}6yI?Gv`k4b-29E18Mp+=Qz+;Fme2Bh
zwK!`>Bn)D&S!XUA<+$GuXE}FKRLXLN1he?VG7W;uMqz0rSol_O=2@eS7?n4RWitKK
zGCcxXrf}5uL4&WCND{9Ozv9@zluhbi(Ef}<Nl@g7QCJ~cSfT5!m+TsD9L%zQG0^lF
zgI61tsR{}98K&)cR!d6zr)3I-e_U{oIlNoVaMLo4hUF6QO#~RW9f%;~Bd7q!3<Ro~
zgpr5(kl1=?7(83@(<RL1pO$IsPs{Y<FP15d`qMIf@?Wq_=i%X?WqKMG{)c5M0uv?R
zH3&(prW=-N0eQnR6`o0APlxXU*cNt$zj>xQuZ_E3V$#q?u*p<yB|u~1_A(tc+5?ZT
z5!>qW!!q^yt7Y2yyJbow=&k$0*}a(h?O@x!QHDSA=2~xBrpK`w6llgr++Gl`n}HPI
zlN6||uyj^{`kQ5HOM$Wy(hwp{!UWi-w@gzXabK3PyC~52QFjYSNKpa?92AAN-#y8n
zo!^byPK8p)M{7pq6=|2HDGrwhnPsD7x0~dcbl^PS5?Fc;%Mw^WSIf)1K?}v^Tm>yp
z-wftj_w<hn8rGuFs`p|GU;v{i*XurWh2J(&N4%dD^Z`-EpbedsX@`)4t8iz=*Z{dy
zR;Bwm{0uCDoVf--SgCN{Hm1+6%qlEN+@M5d4S7G4SNRE7=$Ka=2H~ZnxXE{6m8du=
z7=92ZNkT#)z&8?<g$i&}Al*HH=nRa7^04O<uJ6;sLFq^N-Dplb7=2j2`i$HPS>Avw
zRZf;up~#faY~?*A-<7BxIH&&BPedi?ahw)fHYOn>S?(YcK`O_tu~sY7^|6j!1QEDj
zvPgpt$vkFfzOH4sM#3DNgH8_LkCKP(az(rk-QY}p+JKwPkYnqExCra)HEYPt<t)Gi
zueJ?O+V(^V{RGOEhMa|bbOf5B9`-(u`znQ(q(Pt}fbs1|eT|u4j)%8Mo^IFitwMR2
z#N#<7^~MfIOu!;wY(;#P*Wc$BL})(bHc3)cMPAyLjHhM7*b3Frg?lWXUA~GqJb^2B
z#B-P=m3T4l&%+%Tc-k$^v^IkUOt9g-#TK{2g=|w?_lbNX0LLw`NOIO^YO3eNGgxJD
z_5_Z)?fH8O3oCFJAUp)+)ioMM=^IP~lwqTux|51;=HYgcK##8Uc~faccsOTH#BEg(
zfx$;>1SS@0-qi8ua2p6Hn)b33zS)Lv+g7f+4G>tT6e4D^98>^GeON#MkgkZdUVy_I
zh;ssv)(_UADkgd>KCh%UmA?1}il##^qD%36J)iG8j)$c@M66~ptKnhIFR%{+B!Lo~
zTICUWLXFZv2$3~0WSjVc6qIN<HHs6=(yHSl9R9-pnMUU<tJ-f<Iff5;4`p4j#rnVr
zZKNt<6w_GS{xMKA)nXpACdjBUK+$x}m0^&=*jvUh>SOHpX2e;mOYLJEE+gozGR#tH
z%)J?-?o~%tYrf~#oKmaZo5B<YuXT7J98Ikr!(+|~V)V;cd&#w@Fs$d*>hzs!jpA#)
z%Y^j2&uii9^~(?z<T}F#%=`P0zUvR5ArTBu6Hgz(hLPDiB9-CpTyO9|!ORjKnZlT&
zz^!B&GA6ggMKA`)^=Yn*ff+=l3Bn?3uiYT}NE?#o&B&oL58yHFoR}_aYz_^f+lDl3
zZrHaenod)(jhmwBH)<8L8?NyI_A9BeONRe$1S5w6uX4sZDZ#=Ca2G<gqBZJ0hE+PM
z&Mt~YhZ!CRn1lmpas-1>wt<?S9z<TBVfqB3rmk?LDf2B5HKny$M=`%iX-gGp9dkXu
zw-4E0rbn~J2GI}-YVDpB`1pgD`VSiP%ZT^Xn(w4A%0uy|Nm$O=R%AM^8N-%OX=B;a
zne4{EuHRwceHcy`7+mG;+nw7bTp8o9+RGz4JqN`H$gQF-SXvvlD*?Y%7XQWs6Y0uI
z#iOCK=tu%{4FO*|!xRZ_gG^#$Hm_Epdsv~BxLbs-7+Tyal_h|VfzNg*oOlx--D2R~
zIbhkq>C*nu2rWIsJU~@QYtz#2gL1gAb^vt)RA>(6mEi-K@25H>r*Qdncw`hj2INKw
z%noEsBy9sVwRUA~Ho>f0B8#a^AZq%Cf_gZGyI0=xFcNj$mGyKKD@^mvrT*S%-#7Y`
zGO~lL^A{N5*6oxIs58dlBpK<ccFqouF`0vE5jqT-H7SN~p={_#64o3%|3<Dj{XuNJ
zY>ye}NYA$R58|GX+A_EFerg%GMaAjkSxV_WrL3J5<?kXi8*UO=k4L=Jzrz3?F$PQq
z$7rmuN8KF+cw|IBSaprxf*zS+8uVdJnZn&B^cc|wpy?fJ6m$#$pAEbNwhYIRaQfEh
zQW|=^y#HIvJB4e!dd{r-hs7YNFB4a*cC2-e4a&crdUb0Hn)BSykPm#8j?pKztys1!
z1H;7q!xD0MQ!MfYq4zsxM6u$1kT3kTaUH5+<jox>yvUG_)zD!7Tm3;~zV*;oGLsPn
zG4C^Ms@~%^fLkzrFFM_CO+^$%y|WY=_fM~r7OUnf#FEy%s~4VNrwXy^7@G+KL6L?H
zkb}k=fWH>juO@$>rn1ItDKBxi&#}nMjpzPEO?iKyrtDQao#kQ%_KL0ILk5v$R&Te?
zqRU>6-BX`rSWVVm13BQy#)`@2fytL^lWjs%9qLoBtfsoIO?9VE^;Ast4NMKJO$`c7
z535g)T1}5#n;!pxnu53V^niGw2_jWeT&#*n9$6G35J1$FlRz7so|&$+(c}Gkqk3i9
z>-!@upj9tFb-K%jace(wP{on$GK8=JStS{QruXNd*=lG;wUiQU3_r{9LWWD2z|%Sl
z$Jq$KsP<QwgA!+<>j(Qo)vK^4w;Yoh+pjjW?eV->^Sod5ym~8xe0{!EWI;QPp)1U5
zkhYNYV9vjNVgHL+J&i3U3Sah?El@<h?0@{_TICnR&tHx_7BqXz&?3F{A9{Z}jbZ=p
z{mF_&rHDn_RzWAsSN#;;OE(!I(O)lXd~Jg)s=q+g8Sy%r)L+`Z6lA*Od2{L7XF<y2
z`BU$BZsL|rgcrP7zec}Xs+M0?O<lfPxqRp3veETrr_amDI6><9`s_5Gdyl_my!euJ
zaxw4vw{i$Lx`gJ4{1UW(<Q9e%9MTH3VN{%4q#sxTX;bby3l=2U%8X<%WP>)X{yg7C
zTWt{@^@V&_PFmGoKl#1+^J?v;ZR%V$qVE0i`mDdo$N7L8Yd+~~LEFcsgxA8|6vdUc
zE~Tw|9IWp=P<s=LC;rVcWu8y`VVRCef|hCfh<=m^+x})V_7S~kDbbfEnR>|@iSnmk
zW*zSwGfvrcaeDM^=Z6DS%|NWU`Kxi$EW=xJr+eZY#BQ1HVqwciBsWA@sEb7Ryq<XT
zSc}N)8^|U4KsNdk<#cb?L+yOK7Au{+MVDT_=#=UAy>C9Br28Up5|-UFCTA^mN2OHX
z%-Yu9Fnvil%Y8ShK1uofSl`<xW3t3E&Ypti@Uhl=V6p$s?uBtsYJQfz?!wN0R}E@k
zuiDr9_55IEAa1LbpyaWVr?+~ur8Dvy#<U*E<yiH5**TQx9@w!fYT@F{P>ubYmh!C2
zv#-)k@7VNxzq&O0zBT7O@27}`F1OoFwqLSJWY1iY(}1EaUG{WH@<kENBzm-V!$jj;
z72(R}Z7E1dfNK@(UPqofUYpZRhkf6Iv5>Fa=!~Mng*@j>KC1kAU4AD<Zq5B{|FNfh
zE(_6mg5MSG>!z+5v2wRtDYzL*+`cf^Ad!B*x&CEWENlF@SC;!e=y?yeyEVm}o#gGh
zO|WLEx(Jy<T>6E1<DDaMo!gals5-_kCE4(LT(b*@%G<2pIuvQ35wA+tHCZE_MU}@c
zESMUI-r~&W(`h@{9+O?lacKW7r^$}}+WnJ<Oj{iD%MA~0Sf)c9xrfbcH!RcdoViCV
zH!RZ%tA}5XS%a2o_v>@-znIy@9_f-e8G7prm*AC98MLGBy$~M9C%M_mM&8{RcE^cs
zBThFbV=*?50y^XE@yHX4C$5YbKRtd)TQ?gD2u5)ipruiCi!jnX0u-<snv8Il^%J4E
zD9xus5rpoDAf~wL%E1!6l^hJ$oDKmH1-Z`-Uw*H=Y!{c5b=gk0I-Tl!afdB17^WkY
zsCYxMCti_XtSe%;rvgH-dEkEZ<+!~y0Gx>5CA;f%Zf1N>@%pXXYl;X6sR+d(z100i
z&>$BtCK!IEqW;W7DKF$u(BnNL7}I){I)|_*UwBMn%aHhakI8Jw6rF<NnvB$K1s2m4
zB2vub$6h-0rZ|48uj&aqH|xi0C&M1VQoM~l*&%jZg^9PZg-zGo6d61kai;}hIrC&9
ziaHXuQ*zKLZ{6F=ap3CLEwuX{!iUC1<a#7v0FeYx&R1z(g8*VzvWZV*wR(vv<d>K2
zMFBH91b8`E4XUOybQpj0?C^$aYJdmk#;AVno2qHzVz<4A6@+XTc7*~BzY1Uh0D$ot
zak8`tVI+s)@QqohPVxdTUCm>V0t2Y@_2ng#nAuyOy+2m_!lbo)ITQV%VpMP$XoeC5
zslK*k%P)Z;0OM|S;%hw65)hoz|9yXmw%D+V-`8qcO(<|TGXxFCEBaqNfY0V2vq&8*
zPwtN(J_9IdJtoSq4d_zl3Mf3Up)f7cnE<6=w!UL*Ob!%c8E-Pn7L!O<OEQ#8%5sXE
zTx1_`-fckj1a3-FRu}--EyXHTQr#d3Zy2w2R{hHYYcei3`n<(Fg#Wc<0edPb5PXx(
zH)5}^_9_27Q$4v_$NmP|4hSt`*JN|?+-Es98uDb-l*pzZ4UZZm@;H!n6==Yx<+cmv
zMm#`QB4R#C6alZV-`2anRLcY<o0G_A2+HJ#EOXJ<n-=_b1zA&0vY!j({CJGefZ7Gn
zDJ&Dt*-yF2059gH$HfP4m%)}|N&5|AdKQXhs+;BrknscXtw1v0lVcrZpzQD=yoaZ0
z#J6(^oDbRH!urwjR$@1}j+-g8)*9V)Bi|LA;bsa8WpjGoPVA*`HIB5#${)49E3|~v
z{pMhV46ua&HK;a8cK!7`>BKQbY9C`s)7qL95OV1KAOn>Zw7V6VA)32OjI?*#HMtzs
z??`6aawDg8Z06wt2fhApM`K+sJQOTQ8kQk~aaJ)Ha%Vd8<J{&6(@_jipQ0NC06yjc
zu!6D>Bd(*sx-iPxq8FfWD9m+IjJW_hDb)1)4tS%vTg*=02PaB%p1NGP$->1pYRT=y
zCJeHsGq7#C>iWl<%*7DiH6IUe*Me+$dF$cR04KLdf$b$M$Fz==)vIOJgu8b^03|^0
z>p3r7p1urPlMzFfe=!1X2k_FVRgULPDJ&sSK0kUQ4nsY0_aFoH`Te9I&Oz7X3LQx7
z*4r|(4~Fc6UgiNPf~rk`Rfr!HotS#<t!p^zKn6e3;4y)hL^fCgF2-fm!_1|^q>>rs
zGcFRv=gcfT%#OTR{qlGhJET@okOEXbJ%8@jL}roDu{zb%1QfW1hq~5AYl4xX_3`y9
z#Pw-Ez<N>v$9vLLX^?^g2ogfBWC)6n4?b_D`~1!Ou*0PMcew=cAVJlI@cx|9k4`W#
zQvf@_wv{Xdu$aghkw{)0Rq%veOFK1DgA}Y%Lp&~|*%2QB*pnO(RV)--%reFPQa=(w
zMm+Zsg<f8jzY*GGYZ7dJuwhEc*ML9~alRbhIp4QUJ(<sn)<dkPZ_%Yh7u6pY%{PNo
z0w3lgj@=&ND^0cav2dBpyWb=BtO&Ke<1G7$lW^XTMhpasJbCbdWL?JCrDw)EpPa)#
z2#9Cd)2txOJSlU*0sw$i;XB9d(%U<q{mh%rdVV%UtBXFT36ek>Lz)>~>q|Gj=1lmw
z2Go5RfZJcG-eN`Y+-f<@A>3Rge9bMwzRV1nbER&N9B;UjnzFYU0OKYYg+);y5<GJO
zVzfCVW>uch{Wu`xo^xfqH)N^bXbX`{xqYn~#WPMl;Ta8O0q0NYx&9mxKFF=`-aO_u
z;E^siDdf84gvHjq^^XUV6gdZhcEvFW3qWyqHvolG`qd9Hz<@a@oLbxZg2HK%Y9(O%
zf^5GNgaAXst=a7gcAb;I1Vts|2A>eOv)`Nyi^BQNe&5}->*d8}`+*SkN8VT1MJRiu
zxu=w$s}{+-Q;G#%wjiIEHowJCD$YwF&Ya;FW2}YQleH{`DC>I^C~iT=D4!$uDgvY1
z*s+3mD)4!F)l=@V=eYjKgp~6Y$M0AAA|xpgsct={lgLoxeP}*0S2B!9nQINMxRhDf
zsA3TH9dSVh&9)PU;>1H5A)+uA6Y{L{L&#bz<ypE$82Gj5i5;cVtPTKE2<7ky;?)R(
zS*HRO0x(kr*+VEGxQxQ{Y;^!v^?(tM2dF^_>`oX0pY2G~K(tY&-2G72l%m-9V-ztY
zRqbQgo-jOudGG}ja3@cJ0>6*?s3j3jAZe*e^O*A>r7Mn6coD9Y=kvaRHRaRo@CUK#
zvdwCbJ9m0ZrIp_%Df=q|24Ibs`aWNa2Uflw-c2o33}saS5XB-M1c-uVDy$o6XH6*P
z0Gfsa;gSj~_W&4C3B*nl4e6BQLLxFGW}pn9Fpkwz7#tM5>Vvjk<SXqUP7pgq=_t!c
z%UB3O>8dkl8HjG~Q4wIVvh-N72*RKY-&7fvNL$Poj%z}x>L^y1q%*Z8%it+c!1vBB
z29yJ#S*?mdQQ#pp5}7E3S;aO+m`tCR(`vC?bMY=af6i*SJOiQ`E6GZrp>vU@BtY5d
zg^Ha<tQi0)zUOMjqbiu`XkEG+@Vx~4U%cJ-Kihx!Kl&`hPVAl7)LucXEVJ5L@7Aiu
zs6Ap7RV5K4_9kdm&{9RMD!Qzqt=4LbR;?~nl^Rt=j?edeZ|B_359j=N{(-#m8n@TD
zp4aubi-Rx<Ae|PsMJmqtRDdp<x!efAiW0V&1lk7LsFJxx0K!o>ExB4lVEs%bFKv$&
zt4MzU5YVN|Pv)rB1n!Hl&ZLr%B4YK_&UVGeK@5R%#Y;8M%?BSnZSBeEs(Yt%vcN^)
zTe*uiegw8V#RlsKFFxsPXGrS~XZ8-u-LS~29}3E{Nq=RLHAS{^0!Y-Sva6U%;D)$n
z2vb<g3_Ht-YXb$n<$K|j)mA)sKv<Dn`Q(xGQ{0n_oK}$}GR0{y(io6oX9dQaoRmaQ
zH$sixGW-QnR7ngl5yA6_mb*on9nb~(OOr)ap}oS)peN@ECcr$k$UN)FnN)>!Oe6Ub
zW$M{i#x3%a6{sqSQPkI2f%nMM2It|jtZMzDY%<9<ch}Fv)z~nzbdsERDzl;hL>QS9
zGsL-1$Y^;I<ulNBBU6<~{%Q>%w&0nOWI#RmAGU@qmTZDE@o9g>GIILiKU+Y(NaQKa
z48Z7u*r*|2KXLTl##P3zc)-hcDA<cSOHJm20g_%cp`idalI5f7SK<-me?F??>*BCp
z1h7ggi;h>Al#uqRcFe?q4O9WWPnYkd3J?)r9@C;;nSYvl{eAn4;7x<Ys4hRKmKCu|
zwf^;I+p}NXM+0M7S>w*`)<E?KGf0aTQ{6~J@7Wut0N{GomyOUU;4QiMRDum-K>OTv
z2kY557OYN-VX*l5lQAxDMb!!!TO`@4T()9v?D+5;Gd{~?ejA|7FKRSsB&u3UYEc;<
zgapj8o`T`-Qsw;uQMYv2{;f6#!TTAIRPp}gN8TFKhG6Nzn`}_>p|O3&;%mVtZzY2!
zQa`5voB`b98lV~L&xEu0eX0xzNZG^3!hvnvC-CW}S=LPI34EI4c}u4S&yq(LkEqg;
zC#Pi%jmZH(Br=B;fNPQ32}T&5CICqQs1?Mgi*aI~f-_8#!T~&*<o!SfOYbwXp^>aE
zTaqV$mj(dR-%>z;W2aiCK(e?^Pv^CiSslO%7U^L??VJK|8IVg0nuQB$Mlt}rEvTmu
z#+!Hv(kMWzi`;oHmDL#lJGrAhA~P9pUygPgDaK0kjsWCBBx~0l>pGllC0)8Eol>u{
zegztXkwB>ovh_=VJruyx3wf&pkcE)}GbLmE{axE+2LS-32U^<Ah;PC}yv)fNTE*tw
zIx7RkDe_<?0Q=$yJpdqWJRJqcv2?kN#k0g1+eG)c>Qe!rmR7$iGAOT#t$sY};svV~
z8~YKR-qU2>53FCc$XrAtg3JdnK&1GsYa}fBH{>zczdH*_=k%`-73|o<3Ug_a0VD==
zM*Bt23)Pyl#n%TeSdkMMZ|iLB3%D=Z>CC2nOuYbO$-51mI&<;$eySTR<z_1$G4t@*
z)fCDjmJ5%BrXSG)TdbJ_+n>5IsTcfjj>fXMUt_tU^9lZ#=BGK|y~tuJ2c*uj+QO2%
z?w;I$Ay`e5c|DKryVNJAjK`ip^93(%Kaii4TsUd!*fmexOnLX7MDCP5wX2u*+vL*W
z(aoKvOYf^dlV27Bk#9frR`@wC{Cj-~Qc`~O^%83+(cEwmlCxOoLS$<ua?bNXONiVF
z!p$p%oF|s)kboRE>BKU1YbZR!?kVW8gnN;V(()A9kd*t&Bh>6EeuuAtoFX#sIgf=K
zb$cRtmf5j<@I`JZQ?Gh#fe747A=GQLUO>{qOWC3fT}Baz_ELT0HHP%!tMt++5x!bq
z*g)hGRsP?WskfeoH!9RyKf&7|$J?;d`~P8?Zg`s=dt-Qf^zJ~WR+cqPePX4TA36Vz
zWont=W0m7$UFl;}`9;aX$JRsWDmldplO($DW5;vZUh1-g`ejGc%Z{NyiXG6&^zwf~
z6e0i1E|r&En=iYaSf)?EQfOb@S-)ODQ9O8jJ*9lT6uw=Q`gTd(_p-%hz1St&gl}qc
z%eq&yzS$Mnae7a5dA(j-4r=xadBYW&>KiWgy*iI|b|fos4;6fe>kagKD5@}82#Qzm
zi);3))cih0&WgIDUk~Mv5`y~iJV>bg*6p7|KKaZz>tB|aW-|+GocSI%;K#%%`%_wc
z!wOeM$o?tw{yDxYG87&-29%kzV&meKAw<c4x>CR@m^tpBldzgx!q%)A(3AH)XWJjx
z$Dw|9_3A(X?-1<jw*b0SV1$QXNVH#u&RPLxE!lA`>wj6ManXTQJgZG^-vd(D?ldnq
zb_U!%4!m|guxX=<(g~e1SV>p;kzo+j5*l=E<NG(dU$d;&TheN7O;AQl(8Kv3wi|v$
zC8p`kMbF+p?rrveYPue7QE)oPG?yoU@xEtBC}6NM_~k~YriGx|<Mo&G!EffZWIKn(
zHi9RlLMGKirc6WLo(*~D5%NAXWI7>aCMRUJGUP*Z$j7H4b8kXE&4)1OH$oPULl${L
zm!v|MPe@zS&@X30zj}mz3l06A5W12Rx>^~!)*SldY3TZ!(4X_68ylg&jzc$j!nUNs
zeyfLVn}+S24cqky+Y1f*lMuF_6ZW?<?4UX9-_x+eH(^KfVaFR`%oB@(mjpzRKpG^l
z83}TZ#Bzzm8b)GEBtdgY?6*i9_eq@3NL*ti?gbLhFA^`41mg{dBf|MK!uid@1<r;4
z|74l!Cq^3NMjGCVMBk4zdKPIs7HP5&Y5FVDj2VgHjlv?La2io~vnay3DDz8E7GY7A
ziBVR$QP#JjZ0<*$ein6iBlS!@#I1|fmKoJ|LZQ;qZF-Yr4R#%4z>YL_d$ubV&SiK3
zsIoMWV^^xS0Z4&Fwa`qlz)&5T;6(pqB?FK?E#-n)G=s$EXqKei#p+TA{vQf;GwOsw
zbz@QkoTF8%qJ4ht-9$p1^jY)`Kxi^MnwTWp3nJw0xh+IF-G_wb{<#78BMSig*8e%7
zP{S>EWoICXU8za{YN+$xmC_h$UAnWut_>zR;lvaD{)ZWt#-2LNVq$P5ahRP1NQ=))
z&svDRX~#wyXQQ83sKnH3Bm2~a?byv-XC<)0iG`X6p_%Q*Yoy8|lWpt&*blQivZc`N
z*vc2!(FPzoTbi7~6?cQ(1gonixoKuytf~MoeLtlvH_84NYeX&!aXS5s0Z5I;?zkCO
zIRim&?j&naz3SP}<KR2fkujPn6b-8Vt+dOQyAglbNJNlHSE}oDdbq(A5;@)N(v`&h
z6dTQy-jlyhJE2fhZMs;!Xe=>ZsSHc1^J1E_=H6Yi!@*03Ly3o-mfLn+yRyVoZCcVG
zBGxGe979gOXaF*yr#Ouz-|&w~B&9iq9Wl)o|6JT;tK$8`P)xO1{BzANE^+3%)32ii
zvn&0)M_T&V6WCH1b=T>nH0L}>Y;O9EOR)(tVBaqG|EyvXp^5sWeV1pc)48C8{p+~A
z!^N01i>|9ArDNHZv}?Jbom;!RX1jY~*T1tt6G3czs{Wh*@0RH|s8wEQg5=-N8kK5<
zsJWGV!sx<dZQJHzc4ci(<GfFSZ+<^qh0>i{F*%NGZIu|brAI2d;KhPT-cbUpWL)ja
zM2_pjh@We_Dl;u!|4+;Gr@1C7cl2;Y;iY>XalB}>NI0uM*Cuyv`vQ|)u4K@;N7O{y
zPT8@}?zWU^b!@nISGj)V#`<5K|I0G<?~dHf8mNc~y?rsXU<PsncEQR7lqnhhIroyP
z?_rkq)yHoyP1V`w?tK0!-bGrj|GzEM$X}HgcinxTxj$nSP03Spw8ed}=sN6r7LQz2
zQkyy#H~IO6qE2aI@-cjG>ANI_MJyKizb#W6NQN@p#`%T8Ru*_TC=^CDx2hPF@s#B}
z!j_tXFV;Md-`Lkd`W(|`W+RUFBfT<ICch$c4A;73b4~uoGKB^(ELGcm+9nYNn&2Ge
z_T(anlE^2=W%FITZnzmXuv@<LV%+~&rdSU!AAh1x^~<#4w}fHcANc_sZtY~R(<Nfr
z-ZnQqLyHx0@n^r(RsN4<%18;+_q{4z2I2?_YkoeeknEmrZ~P4Kvcz=D-Sv~nHca=d
z>M0pWLp}GEgMj+fhMrURntI}ds?(+5&o#_aYFXT-kP%-E2Ho+ujYb6`v(0wNQ$bos
zQT$_i&jvrA(|@k1Gv4;v^ctVepzUcPgS&xsygFSlr!l=0X+m>17e!?Qv-0#n{qfdI
zqhHwRE-d2d-^uT(8J$x3$#sFNHeU^j2MesVjs+x^nm-{O(v{=BIHt>0Iq`9rP0?l8
ziv`@WT8)Y^`<A9c-P@;0TV&=`HfB32a_mLlr-5@?1w|EKO`fl7=a}{h>2T`|_UPrP
z8ExyF)qmX}a!$2)t}xg1^LoGSi$8J~xeT6n$?Cm(M%m_^nJN-Fr`4qy$vbrx|N6>{
z<CVy4wdbQc?vqAS*G?w6esF(N_#s{JqZt%ZJ*-~5-jgo3sEM~UohqVm8kDVU4<lw(
zE6=@=<0N!{&8kSUn)I(#flpN&_S+hd`c!*q-602}*FM3LEM)IIHa;!iK-bPzi#x;)
zBkpuOIp0@BZnH+U9@?jm5PmGNDm`-cf4Rn?k292R{p4a|c1h(|R9^+%fqibw((L-K
z&il%AWu>z27Ye{%CT2&wADQPC--mGD5RmB{1lgFr)NBgX3>AyRWMmv~W+rqEaHp)M
zemi7fSkWXo4*rYgxIMPF%8h)Tq%>ty=XCC&8pIzfcC8`L2Vb98N4MrB{}z&e*0D(y
zp^+?6Gi(`V1Wx$$%8-IspGd+cRkXk^&8(LKwX*`Hwkj>dS^9Zn264Q8r(YOk?GGS%
z;29^OVX7!BO1>;9%>pufG+95S*QRCrZ`)E<PAezeor(xmvM_lYm8)-)=gb{XgfJH^
z*(R5S|I9!{EQH|+QJ*8LNNi@&6SO<o)chQ$2|aBs9*QcDKo{+~#^Hr5TmN;}K;UP`
z6Y%mw-wV%ABWY?(95yf136#D#1JUuKa28?jm4H^$npMB@*wuqvBa&~c-u?Q@Gvgky
zotC0HoX=kJptbz{V+9nqF1LPg(&cFkA-U4o;#<Iy)F^cB8|&X*?O?CMq@7{JvuT>P
z5}!<&*k|>|@2m!&+I|1759zWjYr2nu10K;nDl|`+cJ2(M{>i(e?B&U+DdQz|pfsm?
z{pzcr(Ik<_weoxny%z<~WpP`86sg|u2^*iCOy)H=S^Ac33X5(9>WT8%$hESoFsev(
z&yae;(r{G+RpgMKHV%p4K1Vri@n>bVy<`pLyMqs8__&+Dg=g64R>KD;hgDZFs!b8^
z?kS4;X>CxLoH(m$zGnvhT6{fromn;TWDG%}8OWhOsO72ST6xNefRU$w1tfO;RjbU|
z<Ub7vI9K6+_F}n4Wct$*U*9AO8#M(T0^!M;DMp8NEum{p=Z+Tn&3tO}j6Z>uD`Z9j
zPNG;+20J@CpZvtz0-t@_=;SL~`5AUqWp0VD^kK;BK}4@zy0u9%*_jC9@4&F(4*R%s
z<sp)l;-6NJu?n_I_$xKN$x1~)ZhsP3WW_FZu;F&|i`$&BLH!WTL&m+hSaqSbdu&_P
zj7KWrRB``@mlSq{jqS(5l2x3k+L*nkwj*J(thSHLNHq3PB!PTiF@0$%`gF1ZNbCrk
zCCltpmOeB{k~;))+^mX~_E*AV4{@b1X&()i@Zkk?<L8gnR_9HRwer|?^5JaVBUe4|
zy3#$r$m?{!upHUSc`#T}XSE5vjiV{w`HxjKs|Mi`t(A563dH2li||pKmd*Y<ZJE&h
zT3?NIW?A*S;Z*mV=%?*BF5Sz!=3X;)y^?k2P;~{%-!q=@^ta3Ci!5`U9+62e-C9|-
zRcptd$&%(Bg-={^3C1%a)|+RvI_&QB({VlaG&T`bI9+Z=@f}A+wm9l;?im7u&lTE^
zISt}@(6%0<$(~`>Tg75c@Z>*GVh!Od^H2zuK_t_EopzE)@e1ns@LuS&nbWnOA(56$
zKFg6ITF3-1=dcXBG&)OMF5FAr9LO0JsFmUkWbK^+J)a-ClAzkoF8X9&PL5{}-W3ON
z%fhR-I_DImdU4$D0!y4T9o6Vk+e&wQyo?r`g0kym7Z?a}rgpy!bLC3?Ugd0hS@XH&
z9D@y&IE{Sn5AksR5EgSN&h=dMVd#5fQ5<xT+jf5r9=*j+GnrksFhfrkp1t{90jn=J
zF%W9zLBGOQ@ugsd-DpWT7s6Tl6?`%gj0%WItO9C&uD>eKbC!)=Nb!`D&~E7c38=t8
z?nRqtM)TXvG3_&J^1CA2x-Fy)*`lm9S>CG|DNhV^S8C>q_t~FjJFxzTT!u<B5Ab{*
z9@}K*pwNG)FL0DJjP@~3;_)m*y_)#vN&C~?=0p?1n>UbC&%I18W0pN_d}8m7(eSRZ
zFHF9fhQ<H$7D9+ddVX*!NG$c7FVV1l!p<K@8T>3edVJ>VaHHQ$<g<VCekN(s)mGnx
z<PJlPMrubjVBg;F{o6=1JN&G{{5$pRc<-6n@%DY@(e^XuG1CmdS_R-i0)?u8Qj7m~
z2TT{irXy72jsY~CY8Xq^C*pMpRBZ@V147kyN1}*e78{~b2h~_}(bQiYbf=1=xhiR$
zYD}lH1QJz>aEb=~$o)Ps8c^7|k8cMFKP2+HQUpmrVH!oG@nj233Sz$xsdVz1o+NL~
zkeRDO$SsL|sp8qF;yp&fA)auVB_zgExdW#L!Rr#Kh8<wj7NmG5Lp+tmw1cXzgjXA{
zl3hd!t73&C`ouIDvQhmap^Kt-JlU5AOmC!smZ>Hk0}!t&jZq@^DG*NvMM@orIH1Tl
z<CKe}QH=v)Po<Som&IQWNW8~!A5cV`vBDWZsY6ed{Uq%whOtC7r3=YrF(6y%b*kA*
zB^sv!0i!y=92qiNLb8YXUYZ?A@{3hc5m=3gYQ;5ci4rg6Ica%yipV}i{;*mfTBDU9
zYv3wjN~dafB*`uUg<%vOG){RRq(>i6oP1^4!33lBaeB)@c~`7Tgtu{O&B^CJYL{vV
z!7Fq1>oo(74wCdo@TeuKKCD)@5y<Q7tq7qSj>}+tYc1Yn;tz0&i$Go(9~Hs?noBlx
z7jHzM8aDUwt<=cB1)+96TfC7w6K!pzgje1N@-FwC_M)0dT(oorS*Zi1qLQ>b@Mjcm
zJD^6;`$_UGa>7bDmBBARmcS^wtb8*?em}`j_4b8?%U7H)D=z|3p|=g`wSU-a9UWw(
zig3Cka?V4y-J4lVAynBf41}$`#kWglv3Qk}Jx3>LXr3%s-SLcjZc3oa*H+8ygB*ma
zjAy>WTyeVVUp+k(d`**$J3yxom{_$&YP7AaB+g5buq1$z762`ayvONA$-1}M7`+7%
zo3YBqzP|Gcp&SIG4&15eBz<Q~BRjmBs;oR8MX+TV(d?@RU1qVMvcAWuVNT4_8Y!td
zL{yRn5$xHPp&x~Vmw^1g-HClEZ@Q@<y#Fm~2Cw_Y2kqb!-ATRdL6G36v+MkhT>08S
z$1B4;l^=hLEfG>%$6j&j*FF4>qf=#7DY8*t1NLv9b;WuFD!SHwac2GI*N|Zt)z7EY
zA0}2GVm-hG1tM+PtYNs0t4dhnfEWp@HmK;oNY&u#=Ntd#7HVMxp~|l#FIUUccc>a7
z4DG7=v#-e^l|#lI%(T1%s&SQ<E}hl%E$HOPY43mc9iaxRQxK2<M(lu~wts;~q48rf
zCK!K`!Gnp%%hiJYAK!3zj&n$#Il4=|k?KUC*P7-baDxLkmRB)F{d{lxu`qkfxBTXG
zs*EZ{KFS||W6``9Y`KHi1^6ZgvgJw*MxP~UI#cAkl$_VWbqdLK1s3%Qckw$QzEST}
z>v+LrDh3HOg#!JParK+ju8uTi<lRGamalXIVI&Q!nTs!)KoI)MM3d#7ep4SYzY_ov
z+5gXckt);Te_IM7`k2h_3^AtlMyC#-xCSK&AoCe&Y6;E^&|vX6%O!b$%K)M}(`&vn
z;JCrWt7t;hf(KEfWOn}~+*=iFJytw;NT@amo7K-n!#pfFg^#DQ8&k^r2l!XM3GEN?
zkcZTX6gfJ~06zHP-GWKWEMY$oyE3pRI>;&w;a4ZjghLoO2+Fzd@!4c!_j@OJoeZ=d
z6aQn>LPgjvfUtt4l%(_oDp-(|;o8a2%|=28<*CBp1m9qNzj?1rGPi_kKN?~h4D{T?
z3+@lRFR(BrQ#wObkFGSPKfdA7I<2u&j9JHBx6dxtvp3xVZy&0fIVBnCPRu~;X(4A@
zd6I**2`?RP&2vD^?P-}=13Xv26Sf0>P0(%H%Vkt({AmBcx*9f?Dj2Jb4`zaq@mO&Q
zuTegN0ia)~qfacbpFfXMzC0iq4;FO-nvUbd5ATJ}Q`Q<*B~_CYoUl*kfogdaJts=J
zda?;uKX0J=$s5DvCj<re%$61EZ{2<cJ(zkIzV{F$J&L<iYpDtYXL}N~JAizR_sp_z
zg8u!|8z&c0=tFg!xE%<atRb4UB175`vQxtufZ#L=ZXItR5{zz?R^<ZA8&edagGzZo
z(eZxM4y=LFrq~@Y5=mL*NS@>)fHYc|AWhSqf%Uz9Of6W{nDP|02`&UqqLLMM`j0|^
zP~HKd;66<##MG`|Xq4Q0hx*fX0Am~S&J-dFrNFGf$ljCvw@WI^VU-*NjirpF#?H^g
z1^?8;olG(fTZ6=6@2`AX(}QNdSW1%WeW71GBb=sXMy4nWfcd{zzYv26BY$Bb8=`ev
zV%zvcEwGrsi$Hx6NQ;^hV%0rPK#?X9-oVxth>mj}wh>#14v`fn7<BYX?%<|Un=!R`
z&JL^w9fKb4=Nj*q?7C-6BXeirIBW3+<4I61i0Ei97ZS*~KOjl(70OD2u2Z4L6ct%4
z-$@q{35b$7v2wAKu+whr1W_dc38ftLmw^N=`pQq7sAjXW!Q9*`Py{JfZyJH!!Evf4
zDK`F4n!#u|^~vlH$UrH2UqJV4@MvCUvOaaYXM@ZE=$GtW!@cbnQzB?1PsBkWUvH9G
z2ZbY#^7DWywhmAg(KXF$Q$%8=_Xqep`cS?7iXJT(xgFdB_J7J_|G=EL+A%ZaUkMTT
zkG*)yo$3f3Y}S3VLg4#v_Y~-4;~g;OdlIa6jSB!$qXX0qHhC=vX&L7FqjnaX`1DVR
zSq=hcHn>?6>r`(g@|P;jn;hT5wE-n0LkIs8M*Nins;?&r$^9oToLs^~@Dd{|dVrlX
zuLxheVdk7~)>vw$i5K$3dLB|Pb@w5s^*m0Gx3q}L5Ztlrc(uGLutKLS4S4!h#NYv5
z{#B!yZ40IzgT4`VIgB}=bed}B-!HbTjeXnraH!3Uj_JHZ1zLi-&;+x?T5K0y(68J`
zlk%!}CYGLbxWA5ZpHcTo5+{R+niTXQ<ts-rrvfTMBifr2*u|;_bLvx?Yd5P+VpmNH
z;Q^ce14sVDk8kuEE(GD-PvLZ%Sj^V-zw|4$2g=Q1@rrmqW{^rQ$igcs?%zNhC*&$8
z1WDUL)sr#nq1T>0#7gK#7*$1xLo`0N=;e{7D}QOy$ypFp`D>uQH!Ws>D|Q3VO&(at
zi|8q-KQMznH=qyN_Uaw(gZb?o;|)^H7I7KfP|^0TOn$1+dQ$dOfQxtxMFr)}PgtDn
z%KnvvZe$i<zHGT`sOYSunjvu=TY8GhhJ`BU9AGHyTM*piZ}GilzI_}PN-0C_h`F{A
z27Z~6v|*bnhMC>r_kUwl`z2$41m43Kxd#abgXJ6d%#*qJAIHjy@Cf*UrR9L0uO48O
zO0$_D1A6i>{2|uau*C1GaD*XNq|r=npyv%nJgZ*`8hrZ#1uCZ%%?r8h)-xEfr=O=`
z@kQU_-+*RE@9Q@GiXf0ElyC}w<&;phczAH{bBx)>L(ERnqXV$oItI`D(<q!=V|Kt}
z5r;)mZU*(EjDg7UQ1Nvvkdtt>uAj^QK&fRd<+Fx!<paF2nmH{7Yx@Id6)8GG2y0}j
zn#aaA+k~rT8Dv<RuR(4=j<B9zz#~0f=ZCv6U9rZReUnI*1(`=}{EU**2l<YOzFPzn
z0ler6-tjSE@x5M={?$v0-5AZk>6l+|J3~AdPO<m0cs<Z`zr7~IaCMnlSBIAi#+n6#
zlkat#k@qlJ{R2`mZw{z8rn+x_zRFrWI(s=CE!Vd$4|n{>Dj|RVg>F733t#Q{03!Gh
zmuKt_qA1i-RsK;y{{}|?fqDOd<rgFCIg{T<9vN4l8!ioUZf=S-A1KANL95~$$IyPK
zckHGfLdTzoK?gtn8&Etz&s6lHb_Rq9xYn4xR(;5O+5L7)BbxRimla-PlnF3ZO@h|q
z&~(7PJ77<*{R^!42~$X)L!5d1Z_FY!g{m9imW=MgE+`BV^#_fiWk-}QT49%2Y=yYh
zUlTbIA=T2XXI*hbtl0{F>mUBPIz8k2{=3r0xrNgoyeQj01}vlg^SbyLcqP8DG~FzU
zS-_7si-%mfxq?$g;+zLKX=DYbrv(`pg?|HgGkay|oyO~A_O53IHhbk@LZ;R6;fr=H
zJj-Jf@R7Xk(*2hxn<D7>j#zk&xtHrpfA;_E&&em186<gHw73aq`X7FctYJAVOG-TS
z-1_6^K9u!ub2a%g&b(Iic$2+sA}Q;ckq*zKjDam7)9*N;!C5zonWme#l)ARlpi__`
z9CP?!!Y4nACYhhN$d9!v6idX=H=vd++37;7hqo_gCKG2`Awct=-_I37`HjAGr>Oi1
zGOtA63ZAMB_*nQf<JtZXMFOGt)ZN4Ez`m#kGjWArLiCYXbnt9@z;x$z@tDw0BGe^m
zZCYn`NY_`FqRtvGjo$80FD!OAqn~`5x_jYag5<TKYt|cArptJ}O%uBM9<Dckul@0&
z`4xZg{c9et5?p(JZaf@QS-8GLkWgPSLtO=ozNx;Z+Q60>%Q2|*G-Lh|&$G<9wt9n`
zlYL<V($KlO{w#%^hFiQQgETzMNN!vvo*<Bq6ta(p4~bm90e{ZC-bJb{9{G~)!>O0*
z_|vjlX>~#@F?H4}(-V5iM;ud`_pJi;q3abQj@T-FGwQ&;x%89}wy{*LbGEv4?ROaq
zT&*h8kG~9hzyc@Gw$jRM2n{2Wj<CCOx4fELzvg=ROB9XcA|qd96WE*N?Dd<qqB<}3
z?t`<8F3Am~o^lmonf&;T@wVh_Qw0_(=K*zi>-68n;&<mS3O*=0d$9HG-u3AE>Qc!Y
zpn|Hgyb*Jn(-*BJZT^h*zEg4zj5=ZQ0!k1Ye;#JJ!b6DqHN`WJ4rGUq%v7WG$0I)r
zC-iFG7E#!@zFQF_btSD#_EZL2rcJYF(rYEy>{r^B$C2<Nlg#q8=~nno864rn_O$+1
z=;1|!&Zzoi`f`TaQxR`aKmY|P7cID<%+K>tM(|7nvOc3dSfsubkrG={^|>I3(RGT5
z^(vBXnh5T>#vZp(E=QU*&kUNg#ueOvE?ase*)m?-Qkr>7MJkAmiu`DNFkk+o`N^@^
zddu_ouf<(2f#sAFqvWAJiAqa`&X^CqLA)MnaosXy><&4|g8V$FPGw9cOCUO7*1vS{
z-PZ6;8+xA4>YcER=ZNc@pOSyq-<PV`eq+Lv*cmrR+}t5=wSvTF{9A#y`iY+ZhCO_H
z{ortieBbDJ-|>c@8Jh}9l7c)R)4~!DS&enpnkR6#n9e!-@=^-rnRQYzz2bG366wuK
z0)*evU!W+RT(9lP*Jg;Lop+aR9qnEEDQ7veIos!^E#lhrU<`*}-tDkm84Z1^Ls@Lt
z1PP8;$GVZtFRK?mUfmhswnPphs@geK$qcSfGgg+S)lX!Jl!&!)9G{b?-Y7gde#3Ez
z!(|31{1ld|7G-a~h%HJO1^AvS&*ov<ttwHqQskH%o?sQg%Syr1t(}(n%ACc6>DlNS
zI#$qE^WlVEHCJLUD5|_mFFHOSc}bwgY!G^qGPRZEZ7VDCY9vRqp*1@wsz%~yBFlI5
zq;^_cBehK%(t8@76;G&<+@e`vStoO^Cx2$jz+YHt^6}*b+tx}e&RXf5cPPk-l9l6i
zu{s^6U07OMD=WKd5k1o?db{?slvaR^Z9`jO#pBPX+^k>OXZ$YAPrfboh)%fX49s}D
zI*jt&?~Ye$Ds}zQs|{Y_6;f>nt8Q8%t7d@?`!(g*O-td1*{n#XcFtocPHzmG5s2C@
zdsU>M$GH0Xq-<LDCixrs-s)NZz`~009R-8u)@LJe{5Q96_?j$r+lGLgD%T|ZjW|C5
z<D<7L#<{*5FkIe5D(IGTUc6(%?K)0ARdiE4WCgz~I&t~z+grkC{4DT+uk-tLZm9eu
zn;k1p22Qru{u=$RJvPCW;1E@&`()*e9`nGygwLrCb`)R(?{T>CVW(2_`HF4OnnQJG
z)Ghl@0c>$SPW~K%j0;DB+WG$Ju6cq@o^IbbmdQL)jeurj%&^=d$Fy}-O|uFegkH|O
zaKS+Ke#lLn$4%^XPv>q^_{|`XU#=IVYJrkkG$1bzB}ZWs(0&HPrl^_ea<=P1d!7lw
z?`jpNUtVWh0J2HP;N$E|4^(@F{7*k?PL~%B@7r#^3l1{jbREqo>9}LAhIabs@}5Vy
z(|G1*@b!N)BWL#>^c08q1&F&wWp%dqUr`Ic@XBpYA*TCnNOOoc?9-dG4<FWYYxq9+
z_wh&bdEo&yb>E3hx82aa&Ts#PUcdLlgSp=Jr{m*I4c?qb7dL;$JRW;@-`&t{dI%le
zdgUm{<Ijib9`t}9#eA6fL(H?QQ}2Gn?I61;S1<lsBE(mO;S85KFX3k*Ls}<SUVyu|
z_=3o=;rp$et8?B6rpO3Z=yzVayN@iwWmwLlm7@keDsLw0^_s*|aM%5^$|ccPF7JPr
zbkAMZNEDT{No_m$;>i-3CHfj%s7;@p^VQ!LESF!w8AczTUykk-)lj!&+k3feFlfjf
z#na~VsV7MvAvTe|(Mq2RHnrTZp2$xq&Jes9a2ot~>>>@%g(h8)Jc;29=xwk3JLhE|
zRL&;3l9b1OlC|e9_P*6(N1z`W;I_aNn-*qtG+zDmLx|}jyh2K8NO?`=Yg}xu;OXbM
z5l#~?LbCR;?%v!EUNR{19=q<*T2H;0Ba%#h^Zrh|I;(gxu|^iAHGU5@&d7cm?a87w
zLxPP<QlAbHUv79{Vda>xOHA=aqc?gPFBkE6<$)LA3$a<zlB6`ngRubG05{ssMXKne
z?`82D_npNoK3z)rwVR#wHyN2cx|E8-k<PnDqz&b$MG*zdt97!k&ij{shDk2=y;{Aw
zt^C-1UUu40@7f!`Dl>^yYd<aCj_%Dht0eYpj6&^u&y;8b$sd}5U6b8!zM5&YLmaEx
zQ3_fqe94&4YL~XOKw4+xI6sLpt4j=SU3lXadVl|Gf8M`ab;REn5Y$h`fQN2IRoTcQ
zz(;9lT>ZPJN#a$q&_#8&jz=C>FX^CvJd|er;`Ei~?<2J{!%po~yL51hIV+fCVQJ`W
zm!xZF{BvC>bs21*^iXGBRO1#-xQ9gR33L0I{}W>vHTDnB_3vFj%)+qp%=hrXfth=C
z#&fd&V*9)+e&3mXTCIgRm~~3Z+>Uj+ADl1s>lT6-68w2@Hq3|ka7L8p-E)rAu`|(;
z)!=Z=I`^d<rtbKEUu|A*IH~arv9}%a0$xeaD_}ppTzU(VhDd3A{}#Gc-*m7T%u!wi
z{?c@WhK=^{9(fFK_j*bUG5DAmhKwyx;uKKAYf$)&D#RNmTP_XrX((^7ZZ@`KySjel
z+Q^ARLLANruZQg_sn5g4-dHtD=#Dcwmi}x6H}#M|m5f)-WD6*%vpRe3-a$gpi>x_}
zPr91(U)0zw)mWv*HgUvR0}|WE&6gNE)+eA$B|izfJmfJF5lzXo8<c2VBrL;@Tmzea
zpSs`qhMQMw_=eq(K={y0%BSd2_{DX&iz=U6FkgTw?BLDkLvFZH{>Y6bZa^z)twrY4
zN!t*E<&qD~!BSvitnU39_j#;@Z@y5Fy#&_;e<U1!g~4frgjivPsT0GgYMgFx)CR@A
zx9?n=CqIfo%YutB!>QF#7@?2}F+aF)ioN*9bK=evLG^I)f$*V*yYH*F^t}2oUbRBR
zaf$YvYN;i$&s#!9n3-elj~yoxEAZo9KH}d5f(b{09gu93@a=pgFP}7j0dmV8Avh_G
z;FA{RlTj>?VNM`b3XpDGvVZMmz<lp-Ed7w`tNK<iX)Z6&SVgy)d_NSx(qJ#uWY0E;
zm8&DZ^idmgc+K!_Q}F(&z-^;=wMj9uU@ZE#EPHO90)>s%rsSx$p30|`U2reYL0Lmh
z$$L^{<^F1ABLd}lNUT9f`J#80hz($Y93qd?<f_t|{IrAI^vkJJuUkg?M5=m4eE7=q
zeoih&s55`GsTlz@)Xr$EPO5*>)>yJpXK|E>A~so_n*dFT9Q@W;n$-LgAtX4ZA*wSW
zQ7Cl34g3=RyqCe1gB0`xb5#QZ?+l!6{4CY72#sb8E&>fZeWm6AsU8#Z)7nx9N3C4x
zKX>>>6_(V)PJWjETO9ucIkG9a(BNvJLavTMNVsA4_ITcuM)5XWbxKrIRp(Zu&i!_S
zib!;KyHTs7(M=u0`{9Bm%Ef0#1#)^#>NfN;mULtAh~5bFoh4{3Thn5n(g+f#?JKnc
z;1csxby+D}gzJY-iTG@N-Fd11U{rAMtlSj<_I^0_IRo3b{Ys`oLZJiKw1v~z!M11N
znI=wB_#JIafmb#iV5J>-#1glr(|4yR^SVU|+qXDTUGv#2^NUVWo=z5pZLei^EZlbR
zP4;rPUkoNl3(<Q`D)6W;Q!)t@n6IbmeFmQxR`8G_(o7+dD2P*il5$wS9R_0EN36uc
z_C=IxA_Fex$?GZ0pF@@(x8b((4wCac>rN9q)W$NSgtGgzjmQ@H!Gma`U=~B2-^q?~
z*DiP6j{l0iV3Zx=-H6P8_RJ3Z(iaYyT#kx@`U{Kd+l{YGi|tk3y|UdsXMUy0s`!=D
zuDtkzvXUL>OC(3Ftj)Pd;g>`)XrDlrK(ZHu>yW`$T?I#B`F=CbhhupYcEy;mr3-Fe
zE*0+(C<a#ogU>(%bs(*)4{T}~L@Z+Ym85Y8C$!;Z&zAt3BTwFcjKjCz%aZx+rXBQO
zFz%x_UjF7XynwX$u4i|D%47HCe|K#!c}`qn{>KIqy42K2JZigi^uXiS6=Hs)=igmo
z+BW*aqQuK)$Loz=2q8P!^Th2d&0KrLD~{fVLa$7tJqq6r?o;&Yu!0-{sM;dr92piZ
z&F|mNMLNM)3!MYJB<NU|AKpS6g96nL{EwFW%kHp*W8J**k~cb3D*O@i%i;yn5&+K&
z0Ib-DDl67h1icp#(J$1CWVt}nJ)I_5vg&mt$RQNzm8Oa_A`3!xt(Xg_P>smYl*Z6s
z?=2Tfg#JYP<gSNpohJq5lZ4-o@aU6R9;&Z~S==2B-`*n%KMbQbM)2#~J;z3*2)sZE
zd%bHP{7@LUu48(x-GQ&pJ*Uc$?&+-JDI`%FQ1w2bs581SHTbAcpc;iDEm0?1GkpQj
zA_6}diK_%4EP&_OEI1`DOL$><hxmARVb|-~eGLD|U+B|*)hCE98Pet|SJe;ijwyRA
z9PeivUz#4zG991x>sos7b)%~53wzfmE+oj8COi;EyA(@JUAVscFoAb3;d5yy3q3Jt
zLgetF)OJif{{<}*owBt)>m?mj@O#8a5i+8hi`FNpPILB~Hep8miMFI8tIi_|Fp|wn
z(0F~+3C;1XuyK#<_!8&-pxVn;`sDaU+QJ1V6uI{FDS{p9j%V&`a!clTmQ@jH*bbTo
ze|m8jnBJ8xxSyW8Km5Ta<8D_5csE1KakwKk{ZW_E(pHmh(J)3kU9u!AZ9B6jHtXZQ
z*6SH;qHT8ZjF;gBIr*+qIYvrYjfkn0ojd5HTjJ!=z}~6EPSbOO;t*E!82)aA)Zb)j
zKmI^Lmk?Qmvtx2$Iv+q<2Bsvsx5!f&PTT-;t$B)8Ocde2mth`c=fBl13mL{ll-<E7
zc+UzwnbOdS844~Ni*P9o$S)0W877OCvc=LeXG@uvxyn+m(pC7&BkYFPqBEXjJzmhu
zg8u#}Ff0!Ux4UaN+*p?0{?{v8x@Lsq8Xa(<?z4&ip55=0`I%jmvjMwmSE-V;{D~U|
zxr`pqzwYt3;{Fzzu_%%7#vv`FtUkOdsI`h$Ec=~sxkwMgZ;Jsx7!v3)f9+DLfv&!6
zTcg}lEleMKBhAxmFjUX4CH|p?Kd#ykU1I&g;+)v9lURwN@Xcb~vYka}^%c|{e?8T;
zKCQey^Fw`#m_Cki-d_L5?>@;&v4$GghFfv`y~J~;M?+N5Qoq`o9O77<8KNg+We<9U
zx?P7>I2xZH+<Eb#@d>(VxV*77ys1ZQX#Ax9x8!<H=ZY5MZ3$5S+UK689|!k-#Wjh$
z-j5L&I&igPqA5$T^i6(F`Ukz7@-~%^Z4|V=%!q@HAEFvK>0VQ;v&<Xhec@Ga$2su_
zj*qx{k!Ip9if@6P!hWa?>CTkt$ToDd;Ed4)K;ltwb)=Dg%%g`F)_=GPbg4OYanrjJ
z|8+5Ry3^abyxY2Cu9i%A5+ixbMT{P%7d|W&e<KvvbN5<Pqxi8$Xj#WKn&dwkPUo!k
zu;h)mhXhM02?~_9*eF9)A%3=jn)9LhI<=Oiy!LthtNB<DdDpxp<^Y_J9|Vg7ImeMw
zUkV+xrK3pKdJv96OMx8ANF!m_vd>}zOp^=u4UCVobRT1P;M(znMstJb+#miIKj3m0
zelgx)VG%xp9r)ZU*xA*RYcv??K4c~_7$Pxj89!XwH9U3gP8@q|n%?z<C8$Gvl&U8?
z?vc!Iag@bB^Zlh~54>a8tGR-Kox^y}=p`xi3}U5MV82gNN<m0TB1-je@H<~Q=`VLd
z{F^^0`mY;9k&a_OCB_CS-h{bG>^~k;i?S<o9=U!v#%VInVlu%nEPp4Sx<k>sw-*mv
zg07IG{8<oaY3%|AcV`OHLi+NiH$rBKeS~Nr#Nbw{mLc5a0`wt-7}kS6b{k8tju>1$
z5mMtN7tK$`lDB2%ANLzAj>DrTnBNc4r5DF5OlG|WKhzvqUa6A5E7|QQ@iBe&gJ*e`
z@=;2WYwFku{%RCyT8B97<%Qy2`T4?)J(Vo_SbM&l7Q#XsrG+<eV(XtiEnN(80>Cyf
zcz?pQS~ZvUl5o|4@35ycBc9*?{mf^H*@rimRpys9q(19-d<F{6x%o@oaO#|9lbDMP
zF{~3*1)`FP$lv172BH9D9^udj5n5WS^jbW^etig1dFmtH<7L6|ROV$BykIYn-IE&9
zkLdAya9?5B%<_%C)LM<lT3zMZJr9ymWs2Am6m{+T2Y#+a(coi#6oF_^;HlK$FF-Fv
z7BDynRjFx9-(JikMm<899n0eJ9u{P&(MJxF{)J~@44HijkLvB!uxrarQd|6&wuEnO
z6-xg2&;RBl_v<T*P_C=N)qNa;^Lk_q|D-2tY7$q07yVE=SlM%N>8Xst!gg!_#+IqY
zPUZAH6i37|FU}lGdq6#8Y#M!E6<_$1h}frI+BZyiQA+zg_UZaJX^x!5hG(qeT|`OW
znp4S1N?9P~q9kQs;)N>Qsd|u7bM?j*)9Dx!-B0{z(uw_A#kJuXe5;g)F7@W-@n+hs
z;~xvhzn-ljo}HxZb2ds`2UO3%6}ApVjsH)}R2&@-g(C)2{t4I+l<s@>WYi?v9zwO3
zp2+>N(H{N2L1da;`NQ>FCE%3fNSSU>()u{|#{Z{f>U7Wb$xDH{*G=w<Zz87zW$3bl
z{pBW^@2hHMiBmn?-DA1k4-tM)>~AmePkDdm_Cv&fPcJxM<NP?7uGhN!JWJdtfy=P%
z%Zs9$fqGenOU7uT*y_ii%#d#r*Zvk8dS!HY#=G0x^`NWI{h00ePqsPhe_5v2{vC50
z2c>;TkuUyKq46?5bg*JfqSWW_tXBoiGBU^H(O%O->NO^h>4|0fCH&I7RHv;?;$U?5
zr>HNy2Y=bUB_|3rg7wu%m?u2nxUYkFXdW?NC27PY4t3@TG3+~BgwM=&Ux!Dhb3KXE
zb&K#&D*5ATI7FKDdZ(bs_T%#$!lGA4yfW#cGsG<IH&))+sEqBZOx}Q{A-y~9Iyts}
z(h<pdXmkv(kmb6=(s^sKlP1t-$fz4`H=Uw<N?apKr?Nc~*nR0<=#tMRTtEA5^*e8{
zyn)+)@$(It;@V;JL|xoYGu=9@=9T_Y2C{J79~Jatq@p07=^5%T{cEyHuGV9>oIo~M
z-=@ocwY6JQBXCQrwqmsHq5Zh=Z%G21>kpEB=ACA-^7@*#H#R{{%h-n1^nlsclX<Gw
zj_GyPDaE`pYK)8$#Pr{n!6mI9I6^um&)yShb_rz`+{JE7gs;2gbbM&^+<+N+I%kh#
zE%on=;<<!^qOaI@{qEdXeXuv58TJ(8a!sz2<K1T=RP1Qbj6vc`+<7IxGOv+dh?z0*
z$-!CM@aJv6PtPel*9GxNvt;vg$P{m$Afk!E1!D>gGrujhjx`;v<=F%yxnHUOn>r&~
zfi$)^gE8atlr62`8sirFimlIWG+uXPiA)RK5+WY9W*XW1M7)Ool?&i7=$vb}7ND(1
zK+HBYBL}gbxfk~g>|x$E4VGg^d8XbJo0$2|E3;7xR%IvtsxRQV)uPQ|G7!Q~nkr<0
zIWNY1F*iBm#<y`uIj!32lSIS1{sPg>Dpr`DFn-0~g`L=%Qd3@~%j<k%>HH65Q|EWS
zMrOO5M{G6!d^%O!@uffo2mqJ>E?aCV9?Ag#Ag-tUimy45@w;aBrXQ0N38I`58((X7
zRU__&`U%w4smJ}@wmRu`-5B@_7yfbBd{LhfS-cDHo*H}R(&x6IyDZ9k^|f2&xpFqZ
z$j>j}=QUCQ1ntSRf9|#7Jc21kH#b~@B6^H0dv@sgl&AU^^_#4Ps1=Im7Nu73)!Kqf
zn|-=jt%A_MNXtN?5<YQmAbEq7Hn!Z#p7VD=XcRMO0Bbc%n^EK_iD2;i{eH%F>I`}K
zU%DvA$YWL%UU3dn1-|Y41lr)6R1Rjc3DJq1YUBY#7Y!stx9Z>aq-cikSjxAMS@e5<
zr8ne{tM}Rq@r%{+-Px2yrqNgxs!mHD0;tLveUOAhEN2`MCyQo-%iPS%y^(As&}XG}
ziVp^0T~8Mtt|~N*g%^2Byopa{dFA{vqNJly{=n3W_gYjNA&NeP?X}~&o($u9VoW>Y
ziO7~)^b&UMozn24KuI^&qz_30aLw*l!7^V88%Il(nrP3#XkGwpoSik}`{PiXvspE*
zw~ZD8UX^w9^L?nbHuXAD9P)yNFSn%74#UUd3mV1!4WL>bi%&1sdtYm(r}UX>^UB}8
zQ~BY`9rVxLGq>FHi(G=M)S2a!-YAcbu=Uzo#*G;Jyg6C<BU=A)M_%$=(_4hv>x;(K
zi#jG+((+sNY<NlZ8CukUql9gMq8i#E;BtqexSISqT;O9Bo+^rUh^zJL1x`V+chYMB
zyy%_iJm;c5<i(>kUFN0*&jyIo<0mUVWXmpZ(F-a0p@B2s^*=YYV#PDBt69qH08jt`
z$N>xRP>cTWQ6PV1R?}D8Bo@|L<&uP0ll8{Eo|Dz3NH9OiV>`lbM#DAQEB)xAio&bB
zp$1fmE(0HL_v+cpoKAcCyL8_(>}2lXw^y5?KZBLeyDlhmcJcx(9|lJ9s!1@=gAZ;7
zC*G_7kny?m-0KkG%xNYdd|#;NFGuswBrV#vIDZLSWM=I4p8H0sb<f*R*4rp#4!7<v
z(#QYqKY4ubVZzSZV-O#df2ePv=Jxbc557gnSuzoV537M$X(rkK^#~_<_oMG>P;RFz
z0D@*ztGdR*^;Pc!FLhaf2#RRIE;s%{M+x{wdWvQ6J+AK|k~sja>&Kd^;%W3S%~YW+
z2;d763;=iT2Io<Xf#E0kDq`~lU!D8x|H2^bv{HG_P49>2E*iSa<g}GO8?8{DdJR{b
zYm1z-pPw&talFXdUa`O>s&)VB8;-KVs2eBeE9UlV(nkBOCK<n;fd9riTx7<4+ixAi
z4m6FA+iMVK$}mhs6Mx;ss1RE1*f;vfq~4NFtr_<k!|H?oe7$6y-vF<!yJOlliPwc^
zxu094#l7#yd0C(RjfNdS>ulTQ6ct#B8LzI2>FWBc0v`VedD-)RG<45C^k%R)?=Cdw
zMs~ebF#~gDQ}~a_r4Eyy>!bnE4;V*_4$G<B*v7992D{m06aryxJ}Yy_fQMbbeqN4X
z+HxgV|MA$NoI7XUXZROD<tSrtT>SN6em`_SWtY44d{qBJnRIHyJFEnH5J$-FN;_Fy
z2}?DK|1zGkKd=d}n(kl-KVs#J-Uo(dWZw9qYu5Ne&zJ-5BrPal_9{*A_jVcN`hd>;
z?g@>!$fTwk=41_Jm@6)ne@-4k=V2UJ*5<(OUFu%3{Dl@NG}VY##p-n+2e7dTc_-rP
z8n>YWE;Rwxr7`$3{F2V}lbk>2e+%<oMsXo!TJz0k7LgzAz{tbv+yvwVVsW2E2dZ^j
zvSB!FjW!!c^C!rif6Dhm)N)kyKHmSlmqfv@B^yjw-k?UMFX|+mYMbX;L65^@zVy`M
zRqYI+ygolE>BFV5>%0n!AYt3CVU6lVRyR$oWamjr@~`l0ZJz;TVdEEhhQ@U&#%$}`
z>0Jb!!pdoQi$^v6c;|{z{4(`Su#c>0;3dSrec9-}!QE7i$CSz0oq6QP{p%er7S}sB
zIro>Cyos8e29ai=q=dvx+li=C95mQ;FJ!cj%b5s^>%~U-!C(f2y5DS_E$Cw+x`ie2
zw_nmH^Tfe->;z(91CUd#iv1YF`g@!ehvfdw%AxITS+U7UCtQIP!zA_{!=F=*t9a~5
zI(NpQtndT_M>}XA#n8a2!p`#7!(c^P%6}};kSX>AjKl(f(}a!3)s8RlE%kVl^Z5mB
zgRi`DGRdFE?Fg|6FN&3)+p!+NIKEwRG<-n$uAh1t%JZLri#$CgMZ{Zq#{Fn0x?=)r
z+Y7n5%^B*zYMp%E-p(mh^Arm-jkHTHGq})yg0B+KWRF9m9nwqb>Br-=T)HVMoQXT{
zPiv(+xpjH|t0M6NdHq`1M><a*U}Q{I62cT+E=~lZb+e#LnS_{>wvntjOaG-RVLvRZ
z1`)&q%!Z!yezsh4113D`a9x1rELbJIn#uaAbS<+JdM!`rw_P@OehzzUwmStnyG&T}
z&;7IF+~S|}PszB$-{>ca%_om%^@Ls}u`OUux{={We^^3Vcss^9%k5Y?h_IRy;t`g5
z+?xaK%j03s16k*FjI)N2Vda|;&?+xXIbVPsZtZX()5<@2Bv)rum)3RJM-!|=hFDeQ
z%Miic!s2QqwkJpsYXHbCFY@0em%{&IS6N&0S>Zf5>!N*fA^HWga0$aHLxOc^o<x|k
zQDfLF%Zm87IOkal<Ay+zL@wRc5+QFc$zIS(eU6<nNWY$)wVQ?2z9^=*@R$hNgz?B!
zu};+I|6JjXX(>InD>~lHVQb}e4}kp#qaIg*J}#EB!s!SG+jdDwoDf8^g(J+m{Gg3P
z5(Zg`Wn+UEpR^3t*yUXpWoKo8elGH^j<YHdqtmX!?u%CNwL<T)mldq?VtNZu<D4;?
z6(s=`{BT}pfaWc0KgM6y+W|NCezQu#pqVI+bBnx!6XnO_tbt@+D<o*M>PE*b&r(aC
z44{%`So!s8<?;B<g#cLoRakxt%TWur!Z`2hiyKHSCMQ<@rrQvQB!Ff5Zq-CJShANR
zQ-Sv+x%Cu)cPW5d0|_eE1W&fGy|QN9)dce$T>Fg#sbLC)%NgPg`Fu8v1()h}WnLp9
zNOX-?(x##t$`?w~Vd=TNJ`PlAslwW*9Q!*wv~qNwgl*AaN95YZfLgJ?wMZ=<XS*!p
z|AW2zjB09M*M^^j&|B!C2SV>nKstmDVh~hBkkC6)6%ZvM5ITk;ML~*46IgVRPAGyR
zO;k|O0D`EfpeP-lfUb4c+I#K2*FI-I?>n9`&iDCc-eb%$=a~QNzJ9Hag*gR!6?YTT
z@*GijWt?b2zur}TMyLHE^L#>yLlnznxe{rGcwaAPM|6RwY3Z?vf(taId=vC2NK#n%
z1+5prr{_wst+4B8mK9<t-zn<h8)a`#mq@NsMN5<~2HfQBE=e|pZ5NQY$CdZ7QK<@)
zrAt)wq~<ZaD2GfWm%gyee{ld*le>9`=3c8K9lcjYg(>W-$GyJOCE7IPzi{2_+J+7Q
z$W<N7@0-G8JS)rk87d#%yIw;xN>ep1QT4>M>Zw=N^MtDDimI0nt7hL<y{4(2lc-)W
ztzPu1ew$GJuA=&bZT0n4s*5$CzJ$^tHJH1}FAupW3Qa0^9{#fT{+9!q8q$ysEmQ9r
z%ETJ#dxw@O{f8Px+FB;bS{AcfHt$;19*`rtY{L|mH&pxZA<Y&S7;aW4>|H0CSSOUo
zqS0L^{h>~lwq66xB5qcH%)4H^txo=4y{vk@%7=Pw@4Dk{^@x}CI^GS(BpVQI^#)fO
zPTZ^GEod-()L>!Os0%p&@j^f<kVZLfGF3~^X|u+&w;Ipy)Y-oTI(RoYLMSl)<@{!_
zQO-O+?m%85-7>2Aa$<AXt!7eu@!K<CIBg5YtXP$)B_^@C!MFu?uLTv$5^}Ev^Qc+*
zIM)iSRFc?o-McyU*3Ej|``Y36v+vyx<dz|mXkBm0%uKw0MZJC`wWa)4Gj^xBdZ#sQ
zM=)5jEtLCyeL!pet=2*_p1j1?g0|L1V0-)dmd^97!$o&IEGbUk6n02$&pm&Cz`JG8
zj7OD;ve~;?!K^K3y!C}yV%xorXX^K#NVdH(<L=*SS>EA#f3IbQyCYWN?ua@|8p<TM
zLipA==L2ZhmATFj>Idy3wfCka+h$%iHDEekBr?pHwJ&{WT}|XX*y#kW@Gw_4Ln^u0
zD_hH^yB;%_xarb4*@_K}_i(OsKQ-$C<#v~QcT3Cw!7HuOGu^jewu#Slibk|6&+u^N
z-dEG;?YYvUWk<k$DY3Vtwj%I7P!?>1(8e0V-p?_9MbXw1uk}&*Ab8j{BATJ*++<1j
z6;=pxyDg~Q-pRI}TW!6nJbgSG{9MER6K1{cN&UlhrB`iP`~VCK-HbCLDxdu6pLdr*
z1O-?F=|4ee3~u-aC9&J?4%oL7V$22{cl*6>^4iYy`XuotN%gTM^(NCj&`DyrT{&n}
zS7tv><%$yhf;)iR=;o0o!0$WL`soOMVh_4A%;wiVl*ZGNn#6m-r=@+j&8xltenf9T
zQd?i{K!DW4{FRnRK98h}$`@AClrjFct~A4tyI=yA($ar=cbG+>XGDX$Gq<^W=F#=a
z<|Urt0gd78cHX(9;oOz`^LE3TW}~l@Dm;+XfhtUVu~fxRsAkdRg6YDw5SnN?2BkXz
z2hpR=E8QErTyNStGBjY!SDWAG4j0gk<K{ZKeF-}W1CWXPeOwdtzG53FTGOa5yFv!_
zo16<{5B->EcYP*cmhF61TyK)brya-D^Tr?ZjJhU0;r}?or!XOG|0Je}q58D-*8s)^
zz*9@<r>E=>D8eC6Oiu8_c_&}Y^=mzTa((5gw&o;{bg594aE5x8QPeY=J&FFYNjJyh
zUE*U(0cfP-^UEJ8OixijRhZrrpGWXAZ>&C7di-qPfAW0Yy}s~nzKN%-zLTyUPlxO#
z)#_@`otlo>(>E`Mq!o}aMzPN>O)v&9uB}miVM5$}%(H-hK75QJ8BOj%LRXP5P$;47
zS%|l<NPNeXRN7R^W5L)H(~kIOO($kN3#WD7PP;QT^D{+Iji0=BLV+rT(G|%aj5PiP
zNxEe<!w@hXXJ2Vs^fFU=#=T>9aTdbWE6>+!7zv}!bV9`8!Q`om>UXXVCEE?z_gPl@
zcEJ>FhzES%EMG41`ntBhl%ALcr4VhIk6G2z_5&z}Yp9*S<=%i{)`-gfaFxf&LYsNi
zU2?*8^uo?;@wZ^-UgQx)Q|85A31(uC-$YP-W+q=i(UcPOtI5=jRyny|@u+=bbRDBA
z!E?2(p0x6U%&wlMa-Nr{eq%QBrcu|hwx)d_K=A}A>T3*HNk?w=ENpz7F)3#7wbZBV
zVGJ(7?&IH_NLli%UUFZ1!)+vBKE^1J&KT_vUPI}Ly-_@G!L4!oH4Kd6w^6_r%TWX@
z-I03kH`m9NnY3KHOgFxKOn2&hA!FpMK8%Sm@^RM))AOLcX{;v8?&|X=?MpA$-fR#l
zEb#|m?;-}dyEHei8if@v8llNuJKt_fOIb}AdLSt_U;-L?l*W9-pyBE7vurP!-+c>O
ziNVkcu0Z6m?$mQD^h_UFFd<#6FFY+VcX?^HkuUD<adwfKlhJ*{1(Y^AYKr@mna2DN
zk|DkOTscUJyY_Sw)-M!-7(KpGN~bE!jnHL%rSy|KbEg`<A?MLM$apD<7jDUnh-H@O
zVU_{1^k_W@f5rA_Rxq4sHdVXAU&u&xz@?g!#1{$SWn|_mL*RPoo+!N_5}ylyb$G+Z
zxZMqY-p!c1ef7hIcL7E#xK!#K0^OA=266%Fv;s!NXU2+EN|LrZtH1!1U4=d4h}1n`
z3HeB|UN)$q^|}?LAlS>eU6YuG|6KW8L00jjQ>5Z^B(=5$2VjFT8TL3S+{fqh_kB`V
z1e*3!fn=8sRegadiCeAJp))h)=o+K)14tYe|01o|AT*K4LvB?*eT_nQGi{Z2w>u1x
z|BkWHFPjY6wz<IjnZXG57%#h3-YowdKvN6Zx`AK2y%8oJz*uAyuAv`R_Li|COML-F
z`$UJTk&aoM|1#_%M4*zrUvB$J#Md0mD^kX=rJGb<L9;6TTJ4S`s{>Rs5;6=?Lm?q+
z5V5Rc$ccmX#Zd>fYjXjJjkD>;&If^AS7~hk`YUIZ-4*rLM;V79<hAGnT3a0sfFliq
zs@wZrjKI=GK9;K>>WW9DqNbc`w{|~DC??~@{f)SI$H@lrw9|x7+}6)YdsCv&C1LU<
zc6qc>VS0D3Tqz}6EAlxcM`CE=ZgGUsL*fLP_2Q{WR|R=8E2-O-=Z)INkL$%+=;fO_
z%X?<%GiTn`HhI;yr1((dn#aBzqIZ~`OT_kRVO3ZrwTzwlCwb?295mD0JWFB6>dPyp
z^Iaud_gE8MDoyvf45mZAR5_01?eT8iAs^1S@9&m#ekaS9Y5F|7kDDVVTU;$%^R;rW
ziGqon?X^9w%hyeYgf<4`w^&Bsv?#RXX~*)}ZwJ4BTIKNIw*AhfPqQ5dk(B%w+E>#G
z9<J1d=sSq$3tfM6o^B++D&p2U-bG=QzYDJWdFRn6{m|riRGUMQoPl=aHP4ZZhYaR5
zLYjQ=A$q+_Lw)rA-2h~s_M1m3+FSmq`uT9ZX<_k5A)qtIZDR!kai%?i+A_c0oVyBd
zo!~?4dL?PHnSEMUm<)g6;w<f++l?O=dhX|flZsqN4dnaHs1DKJTH^k~c)qCpZHZF>
z!n_vlwA-(6KHMj|m@HPvvwk(r|1G1PQ+y2m*j~I7j}<OSknii5)hPd$KDbG9T2Ycb
z_vK8me{twOsz@#^8=+)%LS?bR>ZCULF>6aB;iol-vy;vor@vz0^#?^n>}39lOXt12
z_RkcB6b9@LmFRq`6A+45+8cMOu@9raWFuh)y2E@r5-2KPr#1OW6)Kz)D}P#AcpzCT
zxjop#Dz5cL-`kS8v3#eQI8mB3iSaef^qcFHqXEn;XT>8Y<DJY!UapJENRAH%njwQL
zU0B@q5kiG;A8On~ruo+zpRqH&Nl6=du|lDJZXZf{Qe~Ii`KGqelefoAPT4;lv+1?U
zP?0iAh$@XJ78+_#lap?A&yS=~^C*lJY4upK5H6v+w#!+XpCzc~blb}H@zZAofg!z_
zp$)62)gjI~oLNF%U*CSn;ZBvxXLEE?vyChvXHvhKhJ1Syjsn3SA4Jf#u8G`T&TISB
zmUuJUcV^qs>8zfUXS0u#*rc9TW6run<`p3LIa2zPRWsdHz2ky~mv+|P8c3Ufj1sSW
zijQzi;}T&R=}#~}#ecN{YLq|ps3yaCO^bo^q+YgLQ9cqf6pM$?n}okBv45uI7MY!s
zBc$in6A-#MS#{g}P8X$i#M%SVu81`b=a2SMHU4mZ{~8n_bFlRGjbhuaUcI{Qt=v+m
zNKu?YYePD<bjF;LkZx`ll}C3<2%H85v(cI<AeT}i_&!lPb4l4T<3zWR32KaRlaxSF
zC~y=qcLK2+H}@z6kLkx?Q>KcDxGUzaS922$SR0V?R>d{^-wy~JNfB|0a8~)?ZGWuM
z7`v#Hexb9U4uc6-4_KtZor^9gI|#OPy$Bj0luWd}RTltODk#(xPGt#2$Ch3Rm8A9-
zL^4}5i49i%auuhhx7`QVbc3c!5wjgx-ymYe#(?x4UvF=*{%V=Jm~PfKq#-BN)`&wg
zg9CYTH{Ni8G-yp(_0xs~Dl!t}O|&gM(;^xaM7E18wAH3%%+A!MKRb7~Fd>@xrDH5-
zu#LTpiNbZurG+p%yV*L85XOlcE?GO}izNz<2~Q1JFrPe1v}bBH5p%+6ufguB{l_f=
zag21qV`S_K%e?6r0l!r93H})(&i%rK{X+Y|fyQhBe8yTYzeBP#s9Sl|an_AzTf<q0
ztrdw=o-AZMVWMFH<y*+G;=MC7A}!ErnR03J4nMi4v4PsDw9Lt3Q3FrY)2*j6n<nqd
z#(0{$s#)E9Hd&(5?`aXzYIXbjWT`f}7cxf8x`_R0nUR6lsT-}<CCX3BPsVsz-&H$Z
zapvj&TBgy$8jdt)rwAMa{<vf9jtrNldif~=;tVvLn6sw(L=6KHPPaR;H&6A;;sTOf
zHJrJgPYtLH1f+ztJM(Q!J<z5I#K&m32y#ph8W{$r-Dr0aQJEe(i3`lQtKlkfcKYGj
zfxyhhc2}9p(|=-_9{j&(nSRDyZeP^A82<d_tBrxno!>exUfX#2`hbE&qHFm_am)}Y
zjY0`*o&GqLnK{PT&^}?UfP}L%^BfOC4-?=imuD9EDZ>U0v;xzz+-Kg18ihSP-5HqK
zJhLbp8#e5!6?F6Y%#zB3u#u3?pxYZWZ?!4I$6~aCi#TSNjf}!4Zgi50#b)1~j18Z>
zs})jlcJ}?*2jR~eJ4323&wg;AyfW3Vb*V0EcE#Q3%8RF+mztXMN`S!s$Lv)Syn4mo
z^M}3qKY&-&{c%<Qad<T#%LbR#{4&dPE!(av=laVWpWvJ4V{Z2RD|^+AWUodRdi*th
zHTd7>S7R0%(*G@fwe%nJt3T}3nt`I}f%|`IueSbwYOg-|_w3cr|7)-ETeP>VEexhh
zI*hd6|N3_9j#<7%N9(r_Q}ut@UKJAm)m{z#X|Fo}-d=_L(OxAmlI+zY7Lol`0^>ih
zR~Hy9{>xr{PqJ6l{>EPAn{zp|S6w02NO|1f*{hzvvsaV<qP<Eh{?lG%`7?X<JN7qw
zwU_a4?bUuky+eDI$k?6G5Km=&Xs_NnvRA!+*sGQh!9HdtamsB(_5IqWE7OcW?Nz-a
zdv%oQ_x5VpZ}#fBU+q=sk-Zx5=k{uG1Ji%mtI0yWP-bJb3S-cyh_5xtUQN?5R}!C-
z`^{c8KD1XWiW&~>)vt&4Dg)g4H+wbh&|by-X0N8<>rTM_V6Vb|wO6?h?Nz=*d)4^R
zUNtT<J+xP^3#I*LuR8y!y{ez^(_X!JWUum3mDC#lYOmfpvR6Y%_G;QsdsPActG#+w
zxT2wVOeE=ty&4>iE~Z+?qHQ;Of7+`S|CYT9{yTeB=pWjv<iFah!O<rQ9{#Xb_5Tz0
zs>vVi)lJ=B?bS5YU$<9v|4n-}_fPHBhC_SRna=sAy~^{??bVt;+N<(^v{z$)wO4ij
z#$MG2|B1co^pEXT$-lK%qyDwMs`pRqRp`HCudax+|0nF#>;KwbHT|ddYWUyTtI)q>
zuL}N8?N#=FV6Ube*{hlV)Ltc0{%WsU{YUK8XaA19>hiDb)uR87z3TjL+pC;M_Nvj}
z*sB86h@bYV#6P!JImCTXQSyIpua^DMUM>4+uP%}7Rjng?wc)3|n*JB;RpmdiR~`P=
zUIi1-*1xw`RS9&#ke~Ld5y@UHmjBIOO+A_PAGKGFV2o-0VA~(|D)S%h)!N_LtE8Y^
z1GOy?Y)kx|y;@7H4N<Z9Gkewg$X?a`m-cGmk-cjC!(P?-zizKq)M#6f>{X_JVXqed
zjlEj)2YdC_@9kBcBYTw%3}E?buU<fbj0#jNezRAJf5~38{b{dWI<!}7|FOMlO|n;6
z|IA*6{++!F{|EM})vxyI7qXxB>bWC(6+>43tG$}614;g!y?X60+pD#|*{gT{g1x!`
zPCBwzlYVcnYW-@j*8gU&rh--fv-WDhAMDlgU+q<`BYV}PhE8i0SpN^~Rj1$EtM7i=
ztExx#YCY^v>{ZO~?bX$PX|LA(nZ4Tj2Yc1%hrP=A(_SqvII>rXWXV75RXi9<r2LHj
z2lndNk-a+ptGx>QJA0M*&+JvBf5%=e{u_H$@Nex^RTTMR&Y`_}?Z{p|L$Vi>|L@tW
zl7DBfdjHN|P55uwtN1_KtMAFQerK<${!i@HdKl@{@c&nP_0&JKS8x0^do}G}*{ixF
zd$p3>mSnHC|8slQ{K#JQ|AW0+K(bef<UKm%ws=!#BCYk2y;@fDU-oKQ0lEHPvscUf
zf7+`_5b&YB>i^STbuOUM-y*vKKqf){%U*RMQlJ4;hxRH8OyNkKd1S9T6#T8dT8m<c
zEjY4Q{r|*Xb@`pWTKCuO)!N_Lt115Ug|I_=HARm4&|U>lr5xF->2inXtUv74OxUw@
zlD%3(6Z4PkRR9giUM={ey;}A=d$q0xoPq|Y`;+g>QM>EVrF2v8`_nl5uvg6w?bT9}
zy^8<UUd^LI`_sGpnZ26ytG#+b?$BO!KC)MJf3sHwNO!?-j`aMS`7;_G*{f%NwO5;d
zwO2C>7!6@0dzG@*cUtb_%iYJ&j9sw_eE)L9qzMnvbcLS6kKv^bF+rMMcWiL#G32E0
zbe$Xn8u03Q_w;@@bx{ZSgEU0qBV&skH7I~)m3~Z6i~1`H+*Cu`hJN+3<Mp2ALabxo
zGop}%An{$&kZjVzbzcU)^jQo0={n>b2j4402;(pcOx7{_G?!68YhL);JV;>CVU@OS
zc2wSC!OjnAgq#h|C2Cxo4FfQ-TzJFI@G8$2><6RexW*V<13oMFT1;l~j`Z6-o!6%=
z=3niRpCiey(hK%l%aK3$)dP~h`gi;)?ucJ?`6Iu2dxSCX8cmeNaz!<VqSE>7P}uMJ
z)r=#4HJ(V(dBm@FzFNBX-?LY5e|rCeU;T2(uV!og%C909Hh<+;YXP6X9Pz7LDZP82
z!VjwTK%<8BornBt)&=UgBYrjM2fv#8JAPGejjc<HgCEBEd5wb6QGmp+l0@zUy*1FO
z*+eY@gv76EELqsCN{@cES@{}O`&DPOPcQ%LsP4K!exDIP)U<0oXZQ<tZ5{b~&6vcm
zp894wvyRsNh8+ENZSI>H<M*?_@Yw#+r%U2j*B0IL`#e7{qF#Mhs{HOs;#Z{(`PEPo
zzgoKy=CCm)@LlJZpZsd*$xU3q=9OPI(VuyuM!&ke=17&@I;FiHA-$1)u-R+5rO~-{
zWo|1!a?2ur%a?IGmyxIF;$T@m$Gy?*;@96wBEMJVZ+9@!l2Bxps&8=@4*6Bz*N6OS
zcjR}%#Up;TW8L-#zshvTul6&pkB#k)%D%w}>>WF}ziSY=H^R6#_=8^^UeL-t;#aBH
zan<`*d-mhBmp*I%<X5-54*AumjF6>6dliWiW};@3ahV#ML&Px&TNK-j&l@C!(fPgc
zU=T3G3mBvbotr2eND*he=|UZd<2p96`}m*QtCR1n%8Y~?i)j?%sHDfN*(X8ojZfD&
z_9xH_iW^r}ft@{5i=9`_w**LLYTmj;e9;s*H-cw<`d{{{V_$r->5haTqitKN@JX4?
z01DF^{8%K(Uj6DmR!Hr|B#%h6pAb||benzg&3p3h$<h-C9bDf(MvX}<ny4a3dwxgu
z>da=q8${Q${#lKU(@c1EJ;tJ^TOljc$MqKMUxXXQ)Hhxiy?*P;=g&O7SzYuW-zU8}
zv{xNo@9*_lxz}9md}(*PlCGkUN7@aaq77zQ8SZ!@aU5A-qcl;ZMlRVPCrzOlK9);G
zUA#&dn_(%G-8EHO(`U7^mRAj9egV-REqF(-8104@(S!y~S{hbXVsT2`A*_K9qCrY;
zjXvYR(wP%3wreJ0cQOJWij|U@@X5;)W7K$R*XuN9-F63SWgof74o`f6el=Bu!;|$T
z7BYe?)IQLe(=$={q}Q3!Rj&1GlKEb5uz}Q_KpyB*CXbBi!x6^x>hK%Er%WaDJSmu3
zeS+Jt%HLR(2bK1Mtsm+M9~0)Bs}DYX=6py<XSBtkz3Sb__9*%S$zHv1Wl!?id6K<q
z<COSO>a0Wh=}YI_f<Vt~&N-H2IEHF!E@fasYuOXM>>d?UjtJH^F^m`rJU?T=Do>ec
zUXaH&?Y3~^@~hMNA<wN`Bmmt&FL+x)6rh_;ES*LW0LUB}R?UJzK~uOoJ_#fMG~yLX
zY~q5vGIg9$SnbZ`B5_uUSBzq^E@W7p;WWKsW~jtN!{w2sNCD>a$iS+94ZY*1eh=gH
zPzv{v8^CVi`SvCL8U+PlGUWbv`q|8IuY-zo@2z*5RuCQMD21G&>(?H~yCmom1j?48
z{FiJC+*z-wo>v@(_WK0k*{O1j1#_l(E__#}yoe!Kf)meEZHK|y-|ee2r$poWlbRow
zmoP}x@GfV{OzGeXbW8A8U`5HF2K|E2wKKVvWxRJ+jfa<~d3vZ%wlPp^@x@_5gn{tU
zvU}h6E)yx+!Z&2&*^3H%6#y_08DLX{XORP-6Xi~!cMH}??Sy!9^@<D#P0j=8PSVm)
z)d4bUl=bAwFhF1!3<VH%kwHSt9tdQh>h{EAlquN(cykzEfzARSL;(N=INm`5Hc&9U
zh!7G0_P<F{@&ND_lSHytbq=<-yHmg9$zJ_%4?{-r2YWRZNEW#rWP50@z6(IZo<h)%
z<J?PLk)I^lt3{T$4TP`(2vEvGvRCC4qpx0sl#%RJ^1zN;i{`LHd)1T@z2FK0eAwYu
z=p@;z>jjh`B_k%H3WU-_2i7k3o4rbQeC8uNs>wa+mjI#}$zC<C;se0`V6U<okJdmG
z7|X^l+J7L~tH!_Ct8WkO)isj6+TCmX!(R2JaXPYBpONg<NlQUCQ9Kx50ORoJ)*;!e
zAGRPNwss_YHI97!&|aN7vR4hMK<FR#DoUF6%Xs9Ym8j#<Bzu+1FCMf-vR7^B0o^E)
zy(-dlXs@y|1c$Vr+cxwte@QKr0n#nx<);|c4Q0s%cq|QHI7bFttut>Nb~TXRZnGx^
zDwvXTbp~wkstm=BL+0FyIRn6qK!6>OScz`sJHsd+vU~;UsN;P$n2c~DH;C7L779rr
z#|OamSd4jq9ym;atV=M<0wt#K7$B7BTL_P9@bW*coaR@sgzpxsg0|jTTIUw(UXrvz
zpGaniFXC|ZKL75<c*7Yg_at~6SP+S)gA$`f+KUwGMInj+R1la61XwqLFbvkg<Xmll
z;V|@ppD!8U1k~$f|1xR2@D5y`yZ|EP-EZ;?RujC(_q=JXL!3?@f8In&H@pCV863R_
zqRw*>H^Z|oKP|D8rXml9o^4F%uId&3blw19Cw#gV_BEGX_Tjl$dC<a@V;x1be)3bU
z67%egR}4W406LVpKx4C*4!I#FN!O#2lA=ZC6!|Iecdtt+005fp@f?uM#fdwl<{~}R
zpLW(B00^9sA`6wLp^+*G-*oMjRt`<{f_ArKQ93~QIN4LnQ!qx4MX{2p)Nf7AIrFV^
zK96-z@4nCKT0(-MkNp9l-AkR#27W2eZ0&g7PMz|vl8+SJ)Fmi00;uKA3%<Jr>UTVV
z021s)uFk3_P>gK=LBoAy%aQ;Xycb2}9^7crfY9=N=Vk|Y19iHMw%w4hvAZ8&KnR-7
zV}<h}nGSH|Mm&YZb=#aN1xmOI6>w|=!#l2UHT4`lmZ_VLysG;waJ5JN$@Afwmj!?l
zRP#lBVv1%{t$)a_C-U=VOYR60H5dk7@v99lz#15d_9mWY0duypP{}<L$?@V*7KVut
z&)lB#3erG456Y0emuUag`f}eh@SK5~dfJC506Z_D1pvgI@FJg8oqV~}ln|QqaV_Fb
z^g1iMl;B*H74t<hKzFxDPae$o^7&U^OGcYtYu>i(Q?t<&LsM=xw;7LZzdBg`uGB$)
zZFPI<3Xzs%uMV+Xj5e~HkFjj&l_uG%Sc-X;x1kU6Ppu`zmN3$yx<S$65N5f8H#*gL
zu=Ohd<|R3J>oi0@o!%x*w!1U8908_6KDo#`2jVT3ls%<`p=|*`Lp=0qACG}iLC1hx
zEg^#+>jJL3+kY?s-hZm;j05qY!Ur^TfB>WgtvHMXu6{nlTyQ>0LkHmVW)wsR`6>d{
zS>afvqXe&N1#<dCnJGVz?z2GaZ0JUuc|$&bT@&(Ec&y_>S9nkJwXk9M-47X`lLWyv
zMt!$=4KH;y=`sK=_ce0rUb?<@6WD!uq_|+%B2j<JaV^OhPg~ESb3h?C44_@>NcE%$
z-PIvjl7U#eXLDauJySf0Sl)5|3jKwGlDz;xQH<i|O*$u}bVAw%-wmXX>mJf%+<qCa
zCHxZB^NnLwUP_--l#J8?OHn4#iRl0z+-sy*m&LTCYGX+7>KJt5-Vb;cV7(CYWPzMY
z;|N}@IfPd`n4+j)St5t<Dteym2ws&tf>#Sj@G4-%iv+I%n(naMkl@v9jpZm!43wOD
ztcwzoS3&Ypxu}-)M4})yx{?wcURe}^S~hqRyb5UjK!R5ROD}2OCTdAdw!Ujqy?UI#
zBe6#5O8s_PA=ryg!liapGLBxa?I2|eMutRlD^M~+dY6u)eRXgY;p)HwsSCzvf!=%?
zsvO-Q04O_$j3;{uNC2jzyJ*pd(J^#78o<pO0;t1RRnx^71CRq~YamF4=}lw+P>cGS
zWgq!6`=S6~<G#8L30~D{XKd@i#MNx{<fp%kJFcPFM}k+0TtDE|+X8(+?iii6BX~8`
zK!k;g9N8&h9xpkp=at(c-Jq)Kf@OIGmWwWvX9mziNboAoQVy-Cp?%D{D}@BFmX-T^
zWF05Lt2QKf6?lo|5MBksYtAo|=}Jj>D8(XJkKoniDBuT-@e#br9?fgGTjL8Lh}kL}
zTqrn#S2tCZ$R2<z03>$#5MGtb<|-p=sxNIjgjY*1q#NkBw{?}bVp>F>D#mIV>oZS@
zA6IH4(~+PA5XicvNbo95=s{G?19*}lHhaJ;!W7$P82bcZWR2!3!%@MtcoYWcy7edJ
zjW9Y7#+(r;V>dSfFz<5^peI=(cs>%m+M%Xtzhgv#SJ4`Mff@jejxk7G6I*~b;fXsw
zS?JC~eh9Dn^V3Vl;okwL+YaGX47C*17{|VI$7u~sAX+*IeF(1#&va*ms$+V)mTL1c
z<Hn%usDfzSCM@DYoB|nI4{KcP=3*M<Z(25U!Y|!4Rx;|~EI2>$2fQjbKugrelywA|
z_twtPkl@uN61<v?*gt|-cYnaEY8}pZ9+9^^YWiRfXn_WC$zfI>y`mXD4k9?T-}@X^
z_$dNCWF@MM?=T(&0Ohh@R$u}CfJ?=a_uB<1%TD%x8SVlC_m}{jid3pDf+IjZ5rsxk
zB{YHbnE>zfG6rtQk3{J-pYMA-)1dK6V?5>S<CrTr#>8j}Le#X>$b!;HUnS1nqhLv2
z8)MU(K}G4S&rA0n_@SX3B!~9G4`YxVYsU%h#>K1>QeP%TGoqz!sFXn1-sW@1x_9L+
zwbqG01cTy=j~5N$hfW&IpS%*Sc`*D1Ee6jy-mVVS$nr0c932LGP2<D?gfbGm>ZE*I
ziE?+m+6PD|Ai=8-!EI);Q}Sf6$wPQ`N5~R0c7nCadj8Zn<_EmmEejennOCx?_JOII
z!vxpcIh>B*RiZZb2wuG&z^|Bn1h0m}<b=_<h=CCyz)yH}nXHK=Urq4{UPb<ZR{`5m
zn%F~l6|g~qS8KX3^6Df68T$iXjk6}ftBSLuChY>n&gwRJO)~s#@I1L9N}awNP39rK
z94>G?ypn1a?e)YA@?v-pQ$|;Yp+&WMd7#MwKxkYYEtP5I49`KEcNE7LG@aPQbNPpw
zuBN7q*7y!F^NwbB)a@=s05h?WD!Z5t8UrAr%~dtY#6UnQwBMQrELxorY5=4vi$dpc
z*PT6X4m-_S!J$5#u1Kb-PeSHNs45^iH-`d12(;&bSp#k^n%kfr6uF32_$pGt09;on
zXvEOe;Q(sQ=fQU$T6WiW9jU8JBz4tBU7zL!83dZqZW{!RUfXRWL)}l7%cc$GhSE1|
zSpKT6jwuXQm`J6Mq`M+)jM3=S$r7b;{Kpwz?rF?R3L9ul3LDk9wEaVpx(bcCozu%V
z*4&LD$F#+qd6fA~GR~`Di11{#N{8aWCNysd9djNVbBkpbA{FNjc~wP>(GUVgPvgv?
z(f2v2P;t?^Vwy8-7h21)?SdMQrQ@!Dvs>d89NT;K9D3@j0q#@C>F54{CKidWdDbJm
z4%@udUy>c3WrN21UVA~Tr^dM56<@DbIe;>6?({o=El~QLM35h9;S`E01?Az0BH62M
zTQoYUDEe1KL&r3D4GPjEtTE2QAmhlw&iV?S4!JP*+L3up)e)L9CvZQ(2Ia{8J&%2e
zh4YmoUo}L83G=$eQ6Q5`ggT96uL=z?n3vB9_&MF^N#}&k36ac}{UrW<l<0_4cq*kv
zPr`#1COHOYc|K<anZIJM$}E@~(@Q;b(#_1`e@2VYa?!VNF}U#4UNv%?*S-D5EtSL)
zM#Hm#CtkT&d~!Lte`K#REV3I@u|ZueWn7s&fYyGlBt*p~<<MR|cZTXr$>NDKt}NZI
z7e2W<>@PYrxjH;^Mae8#o*`o^ad90X@Vl|Jp&3Mh$7E#a#bs_pQ@!E2wItRw?|s4T
z;{H-G9v7{e(STm^d*bHalqmU1Irvjj2!(rS%G&~n`_nkOpxe#mu=F8xiVH<!goXPJ
zqI(#hN7O6ou<i^-llUtoD&Zn;(H3zYpPCMEnMpA+9*LdHSc|lG5DYxd12@15zvjWT
z>Jd-jX(=9;(CKkQ#3O7o0e>dZ?{-U)GCrflDJ`=(X9UG?f9ci*&wL7Z-|D5yODzRU
zafK-@MX%!S?0c4^ye)p^newdll1$uPLocyQOBH@zRo|D2M!ZsX-i{l`UAwJX!xuLR
z{ZM7$?K<MV+`Uw_GxyZk^E%cWgZFOi^fn!No0`&z8_4JwY45~&wDYZ8bYnKbbtWw>
z-yUi0`{Y5m<}<jYEOUlUDtBeD(`R^Osg!Ph_><4*zRwtg@BiAXfufOtV%G!3^8+P*
z36$&#lo}0`ejO<DIZ*Z>P>wN3o<B%IHt0Z6J4oqd&@qP~<%>c8O?&nEdp{!BtR}`g
zJNSfbQdl<S&6;RQIglksh>9xt&E<8|q1Y3nUz|2UaCDSa3x$GQl(0XUkt(^7Dw!oE
zIMN?1CI?c%$1DIyy`|A5D2fXY<WIkjcU4JnbNDuKDHf>$A~~#Qe>kjzhYssG%4pB*
z?~=qz^Zu0QjiXBjV*_*;u0mto9a68@T)r7csWV8CS8(~tL44>h)Df|lp2$R7YLlzT
zfz-08)oeiU7Eti@*mKS6md()z3t|+(rPOZ3XeVN9&N9wQHO66;GDHmLO$0l>CJ({K
zAW25<6nRQ1b(%_82FXLk$5;(sB0wq4@EfA<DBZHbx8h>2O;P6`Q0Ki3yLJ#3De8+>
zA<;t=cRy1^LN_f{K+athVw+KZ+27-38RARhoeIdD{G)x`aVTwa&DB^Z7?}>9TxFF~
zO)SLB|ImrG5(D4#*s%)TX^{<S)TX(t8l$fo6R?c4&yEk<B)`18({-8h8VaW;h6_c0
zyHZ1LhN1{*jyZj}s{fq`r96=xacvprBt~&!a6Pn!TqiCzY%JC^i~Qthtb-VZWeX0u
zjC;DVeyuFn0upv`@-pSQ8t^&)*a_{u$zS$zY<5kkVnX<1pErY@RJR{wl9Ps{j}MPT
zZI_+h&dI)JM<laU`JPA8<U=p5MsDODDz&jWKa^U)LGILc4v|b}liZ9LqK1!&Xu&m#
z;$)$*p@2B6{Tct(%O8`puMMwndK-_y^mItQT00Y~f&)ohdyf~C#9uas5&<D!A5`Mi
zuES<Sf`a-_6gg~I0AC!VeqJq$t{yW{x(FXD(2LzpG!o5_)*5zs$7<l7E0u+ox}Vrg
zJEod~9vc%_FwQt#Nk1#ULmp?Lc{$t<WGivQYpQa;wXilMA?2wQ+C@|N{e~>DJBpG;
z#^+#DZoV&pL(y+#Q~u3hny6K^&z6E)_u2?F)xeEfJ~BNCFXLP6A`g#I;@tXTwaf-D
zl&OH*r-|{x3ws0vk`sfwlKYwMcbz=5q|a{`xVSD2@XPDaf2D6<y2z7*djeH!NSS?o
zBkj2q`|U8plCGT0`Mf$;zP)cI%@4+NTpo=VJET;PI~pFVHyj@8xgK7(oO(u}|IJr3
z!R=MWGXm!xr^nf6%H4_A{-ht8s?}96o~+d}R(M@K-mV^nWprzC)T*;db2JwmSQxnm
zco7Q!oxQ3{bG#V21_*r2_GZtC%M-afnamVCD9CG>3r+1eD7D+-5Dm6D5KUxqVYOo9
zo$*wfF^IP*Vl>!~=t)xdbBSFt@IwdLU)uLM`!?_O{WUWUKm6ILsNfbydzJ7?P@MWc
zYq&?m<!!PQ?!uKiGx`2pkcHra$AnnQZua7JttNmItte;s5Mv&FfBl?Bx*eQW<_T)E
z!fxMgfkN?JyuvMYv`eo<0LR?T3u5<*-G{`x+Myqm^i9>J8=u-<A=w6AZPJaOawi_M
zx$G*P^eGu1hp3t@2Rs&kMt_XKGcC<AT4!Ii%@eUPsAn#pX@^LX`n2la$62=uPn6=A
zz2Yv9jOZEicV7<3(7qQTAk4bopoYv3v#1C2pPP;^)ozN=Mc$5HJ9y%uky~ubD0;TI
zHPBMV-9w=KlX=>zCeh<zxmx~v)fDd2AAQWkq+0{7SHBgpX07}(U6)ved_>N`+oELc
zCAjACB_?F|*gCPc5|lQo`a$i{xX^guj`B>vBTbdrke63gEQ^M{!HO<A0^%)q*=EON
z3|Ad#J^fH(lkMfL2-`d8?50HR#v7Ni{4%pIG5YTtUw9$2E$4hwc%h|N>BT3!v6m*a
zpT*A7`7GNEsXkpRMXgEo1T@*DMfVh<%`LqU-bv=*#qM6*`hmkE_e+qVE;eC7voM;w
zLkfuxD83ht*EKT1qy?B(&YIgdZk8?w(J&+1gXvXWBIe@YU91O-nwthg;`r2a_|)|m
zPKz?_Of_f<4H$@}Oo#0IW2M5u$MXt8i6-sKf|a%Ug66&V3MvUyXUnpgZY!#Z+1>F+
z5@Q!>m}+JqSi=e+<=dpO>r5BO0>CeC?F{PR6blMt)mH={Sg}3<=73oDK?3t_#cV&R
z9woC-CzitHKGE+3RK}rBp4FiSa48_QbzQ1@wSSCAU_eswxu~7KsaxO6Ym+?m;jEcs
zhR4%tO^~W^u9t%YlIw;kZc@%X{bhaR%yoF2hL9jjxp7Ym#w1c9DtO*8Q6K6hU6}L0
zy}DMVhg_JiDJM&M*YU0_EJ>*ae&WM!k6vUPfeM=7sC{5~&QxT)F0-j!SZ351Dz;dc
z)v+sx=6n0dk-0v*gXfK4dik)cLVeB%c!DFlA=*A>HKkz}<PPZJ5~25kCl4nxWtSXh
zOpw>eY#Wp~zhz2HvPwdtLGp&~;LBt6x4*ZGYJDvqjgWA2T|lPJd=VJKymIDSgNo^~
zRE)(aG!!y~lxf`-ACEuPP{iI*W>_>Nq?y!vvqd9?yTbUUpVu3e;yDYi+d*<}1^C3}
zNqR~996n;Pl0Y5G(>D`6p7*7pRBKNhiM5qZRw$R^YZPXsam-RnQ-aG!m)|i)#LnOg
z`Hx@q^q4$u#kqv2ux_j{i;;L%o7PzAruo4J5pa;uSl1Z52BqZjdPm`u@rWuHPkx?P
zo^?oCps43jlr?wAQ(WaKvkw`C)c|hc9voX$%2g>Bxa9QED{0zre2lb`qnM6)6erQ+
zB)dB{`^x4wx#GK0URL*BJgsYLOus+C*?6C(-PY+s@TQGtCQ|nKm!{^<J!yaJ&Wj7T
z1z823R{5vjn^{z7zF!sND^s{iD|v&$Y@|cxQvJQzkIF%3t@dO>OVw20+pZm((Uc8;
za_`l*`DB(8QtVe2Bwue$G<T{58da~{d%gFixodw<7ELBa1hTYrQ)tOWu~ZVt6``qn
z01rJB2P^v3oe&7cL#)bt3az_PFa5q;974*e_kfi^l_p5h5lvu(n-lm8Yv>bW192J0
zTyB|-Ng``<Qkj!m9+2!+tW~}0&<RGd(q%TzYPpnaJm&_KaA|zQgk~N%7>*tj$JbXb
zN`KDc4-{f!zHLP(1d8%39R%?fK(5DnGEkqsIu)Y#9#^@HWkJ?NAIO1(b-E!O!pCWi
zjNg?=nS*F@$Bg8|zs6j#^P$ciG!n>MjTvj%%qyQ)C{e8Pe3c@?E!Je9ohC*rw0t_q
zFS{>6{e#x|;uk?@Q3(bRmH6>7n;XTc=ltF5GFXkCFsH~xNe?icIM-KGk0Ru%cRPZQ
zarRuhbxpb9j_;W%TfM-IYzm>10)~+uG6#}XTIcj^W}dDcJ0)#%L9goAQk;6H@$>5}
zgB-zJUO2n3k{JIuKgAYWNqO(-iG7uBvTNh=f*8i{3b~I?-927%_559_??Rl+ei=be
zrr2EuAGYiTP$YKKzT*7)fO+Kf#Sv+Sc<Qc!Uqt5=s;Ju+Wg@o(%DHcbLv<OSwCI&5
z>*V2L+xi^_qtGKr3AhcxRH>St^GvF42M9#nzj>@Z-tR8b)I#KvZ`@MujhKL997_ut
z^vF@>du{qvzt#8N2$ykvg);0*!#J_g^U1}MF-v@1`veXz-$cV_xt=XIa&_KtoG_Am
zjLU5cE@)A$r{hZLb&b?`19y;q55ajt55zwjibZZEqb_{q>}l85klGqg?_4j@)_iaE
z%l6YB_UekW?9TL)&hJfKnxBHMH(y&J<KM)`YP_gr2+Ho|e${QLR8*LR+7yI7G}cnC
zag3O6zQg-vbx%vEa_3{v!P*W!_Beht;%qj7<vK}Zc}BuktaYhB@q>0}9bzPW9BCb?
zdbw87vD&*BNMdLo+zteg0d4PL_Ny@4Rs1_0{JZp+-D!t?COyE-D9K4ZIeik&iBKmZ
zHbM$0*`YrP)Qs2g;@9kA7&5;euJzaOP!PE?KZO_Z+gz{K4Atj35`l_X6VI2$=Wj{t
zZO33}B!IO0J%V-zQQ|f*<w`QjYcN*Bxxk@bs%KGKd%93-3>gl{*IsaFpt=-j%)mfb
z9X1Vm880}p`#ExiM;#fc*zYC+yw4nwmX2~Q1mWU*8b4ibg+i7u)>LN-#dBdy61vdc
z9^v*vmBB(@EkPj(=0gLug#ah^u+w4qwW59)s4S+>v>FZxRDpRQ(-~b31t&4XBFWDA
zrgaj5iWP?t1ge3ehXg8F5Q#t?n}=8G?g$qh5~z3qDUmx0OL4N>QKCfMow=ez0(E#U
z?1(@m>7~qN^M?d#!@NQY{J5Z@x)@e`mvmW=3W-1k+bCWDDM=gv`9cp3)Z<Hcv_So8
zn*?G11$L<@$!KRR$w0LcWUB5tG*DOWAP7aeH$i-`dA*z1V+q+(+i<3NjJQ5lRZGbD
zJ)ai17hX){rxQ}}v(*m8O73Eqw4!8Jos36{S3V+??DW`WqGXBi;UO}UiPysV2-686
z%e31XEg+TsL;Q4>PLLW@C`ttbZaV-7Fme)psx)tuc3OQh%B&hAzUpF`vN+X<m2@c-
z4aLqhkR6*O@G;LptbrVz#M95B=tLZp<Q$|YK@b^`L`8w!K1OsCq&z5eE(|L=l`k$Q
zd`@|(Yp(a4pRR3ZvZg*l%}r3A*-f2J*eUt|b^amTjTvN`a^rZm-d+yjjGCL*IDxM(
zS-9n~*3DkHSPxw3O;b&=+L;~`c99g9JNlh(P9@wp9va0g6=hqo<VB)S!Md>a$7!sf
zyEov<l|7`~g8M02txb@C7|<rX7~g=9vjgprFB&*mYi|<v#K{6Hp3%iEHVq@J#P4XJ
z9F;t1N$e?UUJAt}_(AMhi5~tkcVrkD=*3dFVWvjA4#Ed3geMq8U`gz0qlW$JAOWCj
zR8o$`HO-=I?r5Pei291fIYo<$=}P;6wN-C>O5=`8MKRkE0=5ml3s7h%8EWfe&5BB9
zGu|3PMI6BhHakMdnE@?2PbBMscoWRi`8$CrsYqglj4c|0-~noZfsJu`-K*GVbPvV*
zO0Nenz@p!wf^Qhw=#ev#p8$YZ*J+Scb7z*KnckdriqMr0UJ|qxz3$fsC84K06eL2@
zk%XSw_3;|(IZlxU+|<*~U3Ln_F1i}34tG2BMbX0yN$#>%3&?T|<m}T+m)$KwMPBL@
z&DDUxdtf9yz~aMbDmsaC*Ra&8m}ml)MM+=X1EakRXj~z%nd@oKAOu%3B^+O9qBtG#
z@7|VsAREY$>#vb^cFr1Jjwl41hlJxGBA*X;T|v)VS-;ThL!KWnk_Pv9+PD~myUtF5
zdB$%U*WJQk$Q^y)g=~>D6cfi6NFb-s_bNoRJTT_p$=Eg#-A-m&5t!(YDVb~^4D5QJ
z*dxS*k~)Y+dE33GRY8iuH%83$wAQgXt@PT+{z?PuN2*c9O5l30=(Eh^4Xreyc%RO}
zsGBbR;z<ZGe4pwRL5Vd=rwp4D_3-hMPsf{Hp>ujePSGmX7z}g2GB}E(p@-f{(l8nU
z^U&q?CyJ={K#j$;W_nbTfNVrE=>|;si}$=PRnf12a32tx|9jps0@Q|#&3G9(MJCYg
zFyREo3h8-x=xHc{6<M)b=J9YBgIr>idi#K^*bOb?3Go%$6k$V!h8`y43T-@y&4)n$
z2`hv;_*kHz$88NV)c*uk5`{}uv9CxXH3*Ps43cD^Hh8J|qon8%!m2%@N?`G%9_SAP
zby<e81OemGeX6YA?xg?eQ}qXe3~3fq-w6iAy--!%vhSZhr}VUK_md3NcV57C1}wWr
zkDL-%%Q}kG4O>xyn6~XTSpE>6q6-0Il)xYju%58$a-;E3$2&Irn2AhrpBJ-GW^)4N
z2?8es3oka!y3qSNg<EDBqhp7tu`tTkSQTIG<<J;q222jQ^|8-<G^~`O@b*u*t$RKf
zn5NrPv<p%cVzRf#>f(D=v!iJpFd;1%KGoQI*FLUE_m1rv(x7Q)bY;g5Bqx>i)f#lT
z*Q2P5$)tw?(lfeuA7ZJd0OAcgYSCoUaoq+<J#@p}OgtFv84R@tP&}?%D-O*PvBpG{
zwM6!^qk0X4$ykGXkJ(U?9|LpN(DI<k6w44=%b4$Dx)m!RPC!-N-c7y;-PA@Ih`YXQ
z0{|WoRh$+@zYb!Pi_(_UgV-QsjLVh$zZmF$5i+Y_DAR$>U~VuNNLONzLcL6JIuIUR
zsZ9iTSvNGJO1lih(5EM}fMAOxFhQfVRY_7XLP}$9O&Kh^^M$v&PU=aWw*N08D$(=}
z(yV0l^i+!SkCx%ieQyT7KsP1J{GzA_5!%CnGT@%{5gpjrK@>H<aEH$Wq4d@@7#k){
zp-m;31+38?BoLj3nEfs84C+-(tr`TMHkr~RuVN#YZRmmlEnIp4A##RP%LY@$hLtPF
zjMrt5N{SJ9ZLt__ye>hmS2bGc34qYo+Cz7*;Vo<LG1NJ8k3Ox*sBgf03vE4U#8>D-
zg*G&xX}fn-Ihv-pcaiIxGO|`_vsc6)#pMicX0CwlV5xUK)uyV2pzj^ld)2+7)#+;N
zT6&p>5h^YZWOaaBcKY|#^aWO;M5f{mq%dl$IVV0SU3f%xawix9eSd!+z=n^K*uhF<
z1K@Fsa+P)3>y6sE_ZU3tO1BMK{lFbu7ptxzWRM578KwkYK#+oJV|lo|IBY?|yGh&s
z62khD=Gm{xWjctmDtGL6`?tqdKQ<aR)Na|5ePdWzWWZ8`DJ$65L@VEKZue?Dsdtt7
zbbj`nR{m{m_^_(+1Eu(e$5K7M`lk^@y~Hgn!ns-7Lq*=D=k5w9Hk{#>o09MIODCQC
z9^y7a@AZlkp)^^+)l&M1<tjwG(&gok8IWfT4*JrQ`Doe}b_tBEi#|kEOfHDX#G$zS
z3BhvEU3MW5tD<l10EW*13j-Tz8W8!XdX%j}XW=+?8v?UWGaQ9Ka6<^dF!hW60Xz?6
zb_vGl*te{{2=FGFrG<=7)v%#LTL@b`a-hSF2Z<MZ;jJ)K#EVW2U_5PDwemL=q@PpS
zcZEa!6y1DDnM3^>R4H0wSBJLcy@LBzX6YqK3cX_+dUr|s=`ujB>wA`abjoMdoo}Ir
zJi2ig3CgOvuq0oSe)>@vtbUI`2R$xsTpn=8Z^LojVanUlT-or=J0!G@;n?_ul3|c&
zWvyOwaFB&Y(nw;o_<PvBODg)8Z*2?p^)lC(OXR5Jy$su9Yq|cU`Cdb~<s?ELkI`y4
z<xyE_vZ8YLe#2{;ontP#L}hLiBuX^G<&Zt?3rtqtoSes|m12cFNbG6v#j`EicB-F9
zHq*6x+QFN#v72$+ICUgtyT(DBnw_P-iK(?xG+c--WY`vwgh-CW+aHkEN4{b7(Nl}4
z)n4{nrkB_uslAnf=_>l&jP2rP$8W#~XlrCCFC1r6ucgwtl68@gr4l0lGRQL#J#bGK
zVNLp!F1)FtuboYDPqFOAdbwA&>Qr`oKZoT@mVSPWR$3>}5y{|jXo+GhwXvt#;G2LT
z2e}$aRHX!-n}XE=ti`&aboQHLSue$w!3marjcBV9&1NZmmBDyJs&5;bV;G*QcqW&P
zOZibe->_PhdzYJ`zbws$oNqwxs$cPDoD-tvL>t4$PZ9t-O3++w;)aeCCYW{qDoH+7
zIwb(m3uZ9*42(I}et@R(0gdjEu}Riyo8PCBBb<JOWysc93ff1WZ=q@coPC6)A4b!3
z_wxCxYUExKM$3@iS)48yv6>Ka&!~fT6U10;$|9EA1vv7t?d{;Z)DkzTY&4B=RPmX2
zbPe5EuY2g)_sbZ1-)m#FHM(fz^!il3_wnO|%DQPiHg9mWlMo3Zr00WMyNoVf3}WHj
z*#P$XuAQ^rwn`&4$)e-f_jY}m9ra>0A_RBYte-%f^y7C{O`?}wUY4AAnY+myG?v(P
zO;;aTSoDy;oL$jJ!`q`bnm$p{^I1a}i@Qahdf4~%Efx=C;c@I7r`}*`vajBvK}HFg
z(=Twu-u;D~<%6t|aO?Y*zHPJl*yL^CXB5p8^ZO%qqf5SJjaKrx9T#5;ez_|1H0<Jz
z>$`!**PS=t?S7;cjVjO%i@z+xZua#;U-;R1gCwZ{*}is1a<fWkt@z{MC=>E9JJt2!
z(PKMRXM6)3yb||Z@^NvajURBWz8l~7xI_J4?lfrxhFIMelJ?5nwhC{X2=v~^d5$Yo
z78d$qa*cPMm7Hk7tvgK{XI1A<Ua*F;t=x6Jm3hJ8>$GWxu(yUq3W-?0A;#pi>o~w{
zCK&iOLtkpBG~3$;SPY#L%Ec23zXXsWR74ttdc7r9JhNm0TLhig12vcgcH=F%vM|Gj
z7=s!&s`<DBj+=>04|qamQXlXIDD|gbYp?a>=Pg?{ptQZ<<yQ<3q}F2#Ganm_F7ZKP
zQsLG|-l?Yt3$MBAeB8xwU9n6K+;JxyTpx-^{AC9JDA{3iYd*s%lUT|v)_Q*caXDKa
zR1{iW^X8`TI#w{%J_+^cfw6F2#zet3r%^s}^?vQdbStLeN!|pL?BuBvnru(4eec|j
z!KEN4?l0lwF)(TC>F5Mp*;L<glihcB@54HMmdnd*JrWXZQeeVr-fHhj3zs#m6x4Q?
zhUU30<Fj3O;x+{u3atR1R5W|*9v<<-*7jMmmu9bWyb4{+%X$@F{>5!D7sPp|P$<i%
zEbYL(kghlx_hJfuCO$f*YzkNGHTVqPRPJ)e{eGIOUF7m+Ot#deEt|XwsdG+gxXu_V
z$hqBdBTEbG@02tlAM<jSZu)j|zReAJ6?Q73qT5i^)~8z(!sN8I@tkwjQ6GG|*pe%s
zv)DwnD2ChAh&<|h*i?R;X!X=R@47J~cKEe;cj|ld<qz^22Er!u)47?2QzK~P^}4d0
zmvTOL?(K80c9Zkxo;sQGgqolC6;JQkw@%FQLJ}#e+i(`WBCaBsc};c#hjl@Wx3p7_
zF+8RH{R4V94N&Nwef4HklAoFgoYvA@d7kFR(;-m&>4}gWyBuo%+ne*r+I(AYsNd2H
z9)#}pl;(5d`m03W3(u@bKk}+D=lA8b;@e&A=g;5$@|cq5Rz!!OD}{ucn2o#9AmB|x
z<;dl%yj|{x`H_*E&tFF#(4r0~%DN6}og={-C?M0IPNdQuPI@~ch}XD>nx+O#y^>E(
zPNhptgU53B5y{zX^q6iUBl#u^fJRgV_S+D&tcw5*QyBqr4T4k6b)>V8Bd`hLc_BUn
zjJ!6woFGe_e!C+*+@=q%RvW7^JV$fGxO*pgl<ze1^}D7Xja!R%&YulFOF1Y;6<LE$
z;zeP!!Knib83cYmaFlinalkFNH`#8L5;7B-a;jxK$wO#?>t(i~>O=VyQjyUC7xlXV
zL<y<M$b5nK>(Q^SWQ>atH*b!y!iao&B9D+L{ktIs{fU%N^E-T7*@oJnQyE@D!kqkD
zCMUfDGh&MGid!BxIh~ezBP;qY%(eWH$`^&ya3MF!UCfYuYi(+$KB+P-G{w!j?*FiN
z7fw;Xec$kRmtEL^-DT<CrCUlsK)ORhQc!78=~ht}q)QqEk);IbPU$XLLTM?35ClX)
zM7Y=A8P|Em9rHZTJT>=U@SQnkzB5O>Kkrwnqbsj)?j=1N`r70veIDsBCS7~YZ_g6+
zorRxmjym{HWu%z$U6i*q@P6r)l^e>Z*vH?lH=UOQEM#D^KvVdBv4y~vfO7na#849u
z8}fQEEs>fcs=b>DbFr9~dn-0vZkhl!<5%N>8%OM7sWu{2DE;wJUokrhaVL<R9Q9O&
z{~AHsK!DS=h3vX)evznwnql_2@ztyr+LscAw++4Kr&22F3NO@e>c`!mdfx9_bouvf
zqX}`-Ec(<^oh6{zv-@T#B`Jm4*;^)V^QPH(Pl}|Mwv1bKr%N==${gKFt#X*j>gQ9+
z&39hiaFDYo>rO3hSt+q_V4f{TroA-!y=}?1{jR6KzDl`J$RPk=-twuwCP-u3k>T3a
zh|I$RZa;oa9$n)YxoM_KB0uTQ)95YlGy!wnMXg@IX!(r3DT$LyF4Ed&ot>e1$ZXg9
z*@DeyMTVA%)Lq|K*4MXhFtpCS-Sux?xc>DK!|SOXH_r%$IFTfVw%j}YLfs2Dj@lX8
z_fx+HZCc;_^`4<)gVEzYknicaV8)XUV8!(PZ`QVC98Gz*g@FviD%V5(>&f0IyI+!1
zo>=Qw>ALMw<!^DHNQY(Y#nD&$9SPaCU+!k$HLrdeE>E&oWm_3Psj}J=fst2^$T_a4
zh4R_ht?vf*%WnV}8W!x-p`d;pbMMGPKscQe)39-xc1$|SUS(nEX;B^!3V;2PEyWgs
zE)++buTZKl62Rg_?|7W>>P&wwD{X_AS3ucE?_MmJ>XFYAzb<2}3lm#NWS4q<Fw)I3
z1tAm(bPGmrFj`8Hf4O`J$9INm-ej73_Oc?yO^y7EnKskskB7yN)tn4+uJtlrQDb!{
z0@HUpD`6U1Y#vz1t(0>-%&mYwE8q*|bzeNpuORgK<3*sdUM|_dv0s&2*<{GeX4c4!
zPGrK8%WXa2T+FBMbqg*#@LMczSLp-10>rdP6_Xe}PjyDCx_H65^~L=kajyohe?76!
zh~-I8eNwLi6G*{=Yo(>Vp5ma2()SnM%<h*6>3>;!_pE7<zQ0>sIP50ZPsXtKDlbs;
zKsP`x*b5ol;HR)hw+LWU9`w01>FSYwv$^*G2^ZH*%hys@`*eu`!T9OaJExVQr*c+I
zZn!H1Q;_=>bfHd6Q#2BTef{B$aszEsCq!NL`5Q8e+Z4m%-%GecMzra}#fF1Fk$*F0
zxygHfgr>qI#Y5rExybp?MJ-mJ?4w@HkF1CY=1G+G=*QjQoM|9RJD}&W%t*gqzkpvg
zsA8s?n7yIQde%e?)l;ORVrzKHq4+^|PrNW=Cg>8aL6k~5*<c71I84$Wk{aiBU}+#4
zxvGtxWyKDEhM+5pfOxOi9!xHNP@vN;>g>3m0r39!fygAKittpNyAA*DtD8%`Ea?aw
zG&sQzcrUN<+63;gXXS{>ud8>+w$Z%&4Djn`hV(78<?$*)k)mN}-xcx!F{vH8wvGL7
zvgAg)>#F!s*UA$ly50Bb&pWD*Or2RnD{%lEhkw^2*B;gqf;7F@UThSBTQ_fm3aDn(
zLiA|XPG~+K&LtKjAWwxLF?S(xrI0K=wD9gbQ3J3?RV#@&mD=NDM{^3>vAeDwyFNkV
z!zmzNGof2lmMW~7L|Bdyt1_CR$O!DWdM1Yj>juLc_gb1<&*D9WWx=e>+$^%eH0>0W
zQ=a_S1Sm4l@Z~C4VFKdw-d<fU-8CHfrV;AdNZfOMDj(AIV2{ilm7ixu@2|lyD@N4$
zRb&m6Q)~Jx@vDq$u^6EV%mr#1Nn;wBL>glwj65~1nlY`sIEK%Q){vS`t(x{~BAqog
zjnV|2{6v#|HO9i2CV7-;j|!vsDwtASQ#}{{dXOO}_NjR%6~jK2k20&jF?{y!5V!u|
z`IRW9Y~vxqe)7xe;WA@pp;%_G>h+Q+j6Z>;&3N!Ij-_^=Wm|xCfV#iVm?^Gnf0U~2
zB$(#-3f~FPv_+Le;-ipi7xa@Y<9K;$LLxRGk>Ebsrx?u|y9$f7W18Y0B_-aOCUI0X
zWSj?myfrwE11yh3F1<HbAC3ZA@>x@#E3S)ETmq+*#F^#EeW8Y1;|q5-nq9sV^#s8>
z*a;06<7)@NC0+`_!NR+%@K{@hAOt(1`}!vpwFExc(?l#CHILQ-V?jLIw-^i-BiLsr
zm^>z^CM*QIBh*?Wm_;pIkAV*z2&o7QU+@;jt@32!8XPeqw=tq^lfrW~qUSpjqMr|h
z`!GnW;Mj0z)0HkLGI_~2j}f0Fbco|<wP%jSx`E*AA-3fG1W8jT_Kg(;YcNL)MI1(4
zFn^LU13kyPCHQ%p?uQ$LkFwNil~muV)Hh6rc`fU;Zx@%vNIka~KaNOy`A`SY@IH`i
ze^g6mL&JnyrE>I{kF1p~Tw%r2NE`UbB1UBseW+8DFZE4ynoG((m6TcbWSH4#e5693
zwjx#@!bdO3`6w6d8q87Ig<-Y(OE?8Okc3m=E;e4fKf)>8ky$@n>31^6<1T96T#%nC
zP3#IKSeMGE`#P_Ra(oe;sJE149V~8@N51n?PfVj6o-VcvcdnJJHnpMFC8VxZr>;}0
zcJ;8;JVjmdP<;rh*`}vyEhV@N;N%%?_nub2dDxDZQoENz2&!w3q-8RkjvbzY4g%l}
z_Lqab83t{c;j6S?Bm*3SDNnmFgidN%JIukV4v9FeIb_D*^p^AV$EP`DgDD?%VeYu|
zov83#!VyM$I9BXv1al=%>}YHYuMR3-{+$c@jodpWk83bdgLw-Mb>+EIwQ~y#Ti9M=
z@l#vHnDD`M7Gg|N(N`reQb?PbEN@@Ea9|?--I%NXYR|T*$VJm;j3`MsJ>Ai)+%~&v
zre=|Pm5&6#Tr@38GIzV!?p<#@@U8JUm%qr4PVuVvdGI6^+>Sv?MQsqkaEjw=^R?*@
zW*R)a;F_y`#m=DZEl1~f>k~4D4PTO|c$qX_@FN)4j$`V^p>2841-Vo&^G%NJV5hm(
zuB(Xf%Hu%qTeHEj_H<Ws@Z8p^t>(34*Mil0Xzb|dd71oMS?TSoY3#BS>>tp*7L&G@
z`2mw}FzrA%Ui5cho7~T=ZM$M_ua@d4V%}<F?kHo*YMv(F6XR^=C-!heZ2Y6RPsnAK
z5Ou}=E3ut|8M%5QK+Qdn&E!R!{_nS&3vd2jrJeTU^8^Nf_k)~QD5@N29uXv;130u*
zRE2mDi!03iD)fhV4xR+i@0W4D_0EZjbT?{P&u^@nXX!OeZa8WDa3A9LI7(|iNsB%6
zcOXmOK5S^EY$QW7*wF=evIIDBG`desYO^GIA{xDMGNwG~UMvkh7mi?YI3Kn|@89N*
zS_iy+#q2~$@giEz(^_0h*dOBb#(-W{ngI*wPPzG=het|@B;m9RTIJ6N=z=oV=KQeL
zIL)Ox_PwM3k=Ah)af2KhM)c_H^wvq2Vlx@!73?RjG7fIQUR%g?G4KvF2Fb4kO*Hzx
zwFs&nA<Q2=Tn$kBD8pM+`e=;d@s0#Fb+mM;5W^6I*?GFq_w<Lq8G?-^@WwQ)@TMTU
zdgp*@ze*QOybOOdFo5%eYRw9qwTt82-ww7#0rO|zJhZ#hQyBV7B`oa7Ajeccn3E$q
zDWI|#0}6&W0DY6}P`dys`H$@F1olB9<rCRkL~Si<ONE;?qs638YQxhKqjL8|FPJz#
z6N(m!jV_&qRUStb-Hj=l^=V^>tqpAMZ;EM~<(YChc{yUYWWmb#{qZ<s^nP6I+$>D~
zFs@K2emp(i;Vq-%tDN`Fu!1_FgKjGkZjMP+gD2gAiCF)>Vod0S^f6Agg%b_Yiu%ro
zTs?rj0WR34j0_f2UH%DEu}Yz6@|@a8F>Z#L-Al<WO?fJrP->ZGb+7r(&s4iPU!gCo
zYqpP5OGVT$sXotAuK!GXcAS2mdo?4!G$Xyqnc|s3pEfGi*5JXKSmU#-*14<>rsqA)
zSz)TQFQi;Pif}BdWY0XyUa-o(w2Ba%ZbZ_j(NS|!MQ2zL=rZjfvCS`X_Fkly=Kg5T
zDg2p3CYJ-7&pE$@gu!!??-G9A%iX@GsUvYQU)EtWEti@(@4HnV6?3Xki(E1y|B`9G
zjs>ufPoi?=xtHqmo6IjA?q@}C`ss#x{J=4rQ1T^Y@JbN*N>V68{<2qxRuJ6Z!bMcs
z(&QZPud!!j-n||Ef~m##t2c!AsN3dQN#SHkb!OAvj%*{dbgP_i$F<TvIgz0jmac0|
z6Z6s8jBIjdTaz0FuUdr8D_hEFMpKqf%3*>Pbf~$(;)*tz!X7O?2H#tYz{@ljZ+%#$
z4!4B@ws^bk$bIt^cpWjaxDuW<_A~}`e;-DX1$}1Ey0`-0o4(1m3V(xTr}t5p0^WK#
zUv8WPqtS)0DT^93$1-I$c=+deKG^R}uJoh9-1*h$W8D<dS`zoGA(6!?HA`q2fEny+
zSYM(0!cfrH(pb9C9FWymnAP(5SId}8D=h0-h4$UnLyt#Y&>!KqL{(sca-96F;@qJe
z(hHosxp!DXC|&Jd&2>BMuKHj6^hY>V)}Xij<?Q&NiAf^v<uTQ8YnMP;3>RxlVNy5F
zru*l7SD_`V@M-tCU9H;qOl!S-k5W+2rJ&xKj5vh+y~AAorFsuc7j(n+RydeLVU?Fe
zoX!^DwCyaw4jkNFuzp(s##|~v9A{t<C8&#o(T?;St$HZWIoQem8D~rNR=Hw@pNF%{
zp_NS4##HZh*J{$}rNz;{Ae||jv06!r*y^!?ljil)nB|~n=QDkYMbDo#dK|76-|Tlj
zSw)=@a6$8yjH@()S+uUUm*<~QhjcP~t0)w#PM|JN{8phb#iDmRr9z(!<3cE<RvBvS
zT?TUX=CWv>e;;8`7~Ncadz0;*!}WK!vfo{l8jrihPON=JM!||qw%zHY6IJ00>9pAR
zMNy2Wm0jXEH|+v50^c*+Gs-P-L@se`SX0b9um~<p9W8JSc2f8Hg(7nOD+#!kuHv^&
zZ{5PX?q)A7EG;dwy<dOm;L#Sy+68sJ=1KVtL4WUt#8p0ZTY;q9n&k-E(FR;nFkF4*
zUOpQq;5`SJeX8gaOWkEz#q5q9W46pBCQO(0M(4|^Hs^QO-)p`2p!fcR;f?0ahk=w#
z9p~Z5Smn?i9_EtHWv?{~X&jp~p=JPo^TbZzupT3qy~?uo$)~->PkBv%T~@e#VTlgj
z0zumrNW7l*X9j&JY<X*ZW4rOicI*3X2eXf`&mV!=o}Ym5SmhTVAuJ8HZ1*|o^_3yq
zxi$M;66e<Vo4a@(XMlOQ3f5+Ar~1Q2QFwb}+i>G0Ax|Lu4W4p0_~uj^l6bxA?d9!`
z7Y9Pi2N#sy_uTL#=Rth<<soZnyw#U<H}6x97ANHrhb9+KL7VDex9~N^Y+N44^s2<}
zFZL_A1GPs7;yFhT{@APK7jsN9YGmT&cB1&6WF1`pv5JBlt2!5G%7&?ma;pWcF-U}d
zsb)WJ%=y*2{LA>{^{SJkeDZQ@H+`(~&$tK<Ux}<a2uDLFt)-)Bknx8OlD*1t-g@(x
zFHF^tivs|PPINzmGyjXdDxTNjrA@BuYZ*J$7l+LEBH612gNfXFnW3|}PtKcCg{@nH
zV3IFKN%rde>nO>h|7fq)-5O5TS4;A;NSLj7`8*bIC;Fn0mX&7B2d+60#B-x-4CLR;
zrOW5*T^C;J!(}QKn|-(E+hSxY-?u5HH(Vd_7*cm`@L!c<s^pyRh|M|>Hz_74Cf@uc
zE?uv2V}0zoyw9T%nYxXM0=+E7IJx>s<cnHoFQ1+1daukYyb>m@^}8`g6^wHi<E;kY
zLk5OU{1Pn94S)H|KSuuMba^{nYTfb2UL`)tPhadS%MwXmAuZF^<+iTdnrVO}x&vnH
z!~I8_LUqT}3@?vIU!9`}K2vU5w!!4=BzyIx-#G(TYu^&1tH5hu4-TTz9C*s5$tbR)
zz176Gs$jvSKA^MhYCIAqSdsA#4{wJ${IOT_WhrZ*iB9@+xlHlpV-7>%noY(gicyO`
zMp3-KR}-IJQT&-0bMcCfQ>yt5rkOZHZ~I)8Z;Zhobe<MKoo?+e@-phg|M5+WM%6~?
z*5g7ApZUMvOh~cZ9lDkC=-^dhvJJ1P;nmrdV7^=HfV_O2ybRxATqLjV?Y#SEQMX@a
zy5GM}Xz?<M<yxWTT$Rn^wudR5DL|ooKRs)rMewxiD9JQSdn56gLETcNCE0GBeDwFL
zx2tj4_Ug2L%p+w_)4l()R}tw&<yPmZeGK?7Ye?Em8wYj8wro(m$dM;VgR_;f>#6)G
zqaC_st41D4+xtAvvGzowaGZg47vYH?H_@xIaZ(1TFo|Cb@x+MP0lL78O^!e?J#B3D
z^>_EfL*?-+oH4?g+$Kg%t!So7c8G`_lhPi2Z`ANv6)T*nb=JPuk-DBnvs37kkAcn-
zvv|?CCZgD+Uw0%G3;^t*uQFZ90VD$eP=c6Vwxvkt<PENRuUjEN`{%-*`l*IZ4Ij40
z31`X^2P1CQ&?D~qUqWQ=Q@d5anE?7fk<eLTrmkBKf1GwW6ODR%IAv^Y@LkWG%u`&C
zLw4!=TINw-W`IMw+Yt9plD*oiu+E5kUgF-f^K@i?l8TS1Bwnpdy+Z0<)3rHE(4fHC
zph=T_``7oaN=N8#De}GjJyFGHv)%ff>)a-RYBnl3yWRQ9i+i8mk59`^i=_hZz0HuR
z#mFSzI(zs_I&5t2Gwz8`AEv<(7_Zc%>;?HzI`9y3d^*mN*3?b6NNC*I;T3BIM0h7y
zp!J@I1S5mqGo^L%`t7YFiun66$G}M84Levoc23QmOCC~!7FzPjLG)3#4*;>=qE<PK
z=4%n(+dL!0f^Ry6f_t%WuSj*_yhTnDa9V~Ix=HAfqC5z*-+1C@5M-|cxRr1h3uI^=
z3<-LKi&4irs3TX;BUoZ>yLn2CxkWzY9@)#bAL#7f0pL4z#a8M{o4uY&Z?XEuLI;(Z
zy|^lxdYKKAP*#qslqK^JCRb{v$K2kDC0qSWl&Z19D{c&1*ens(>f*@J9+`Ie0)fJ0
zS;bv+`~}=H<ygd}>rxKh_f0<{AG+w?GhI#LYNjwf0fu!u0bwfN3YG9ob%DykmWNg#
z(=}t1VMtOeYO_B)v}eRsq9Cr}kXh*Znl5ugXqq9{GC*u*jA3murM@^@S|%_4LV}7l
zc_M@fjv2p~M2-GU^G37+JMOM6nS$xkctHQ{P3Xy!tj*C`8EedyZ&sam;CKK4O~7B1
zK76okTC8=>#5tHi@5QBZ67oiISTEc?#TMnHqyD)m7-lneM|P0^mw8EZJo_Xae^{jU
zV`lYuVwd1$gWG~$Elp_^9||vmJIQVC)mzNczRH@~WPWBk9fRl6&u-SDk0m6QRTvkV
zhNYSGbxnK8nLWI67ccwrnt7j<SzH%3)Y3{So`+H8Qowbb)q2UR+Lx(3<_maPY1@kt
zU367?S=*Rj6Z!2oiWzs9A{^<CE&9)1dC|xQ-@2T2(L!~l_C=eWU0+w+bcJJeW?zQG
z1;j!}Xr7Qw+|Go=!ZpQ<qEGLYv6|kq*7AD(j;Cx)r2a;0x1U0H0}#}kkg+YZ$b6)0
zK!f+IM4SUCh5cU6)bE0O?ErwF6&|XpU0+1_BAuX}74iF(j<dJ#@j6GZ56eA5CQG}u
zRz%y0UJ*B9`foaq&9s9>J&R5mSHLpim+5aCXwr_R09gXNX?dw0S!`T^ZhyMpeMjH2
zKW{ZjyQ!O7w7MTHY;L$G)!W)k#dY~A6MeE{FK<P4T%5NZ<bM7w33n=`H+ao;o&=HJ
zO>vf|_t&|Feu`c)U*VE){m?(Eh8=iy!}^0-&Rqa1xu(iBr7`LQPt3hht=k9b9j*pk
zo>k%;Aaw;~ZO*&jYwWJ_-&9=mKPhZCKdm+k&t@T6r$&***A3JK5cV-Wr%brO_qF+{
zuAg?!!@87WoMRMen{oVgyc{=+*(A+@A2no7CJLmz3hF<@4NWt}djU0aa%vP->iyJ5
z+UcX_ZA7v3`!lVIe!F|Y^!+64H0DK|`>~gc4U6OSYxjnS56kULBJuDNBk8MmO3|)9
z>I<h%4YeI^HZC0QY(mZm1!r5gL;w}e*j2lgt7iAfYwND}<c)1WA@`nDHQ3|aK1NCt
zw<mR6Oq>2tdQ`Vt=*<r+<T`;5wjX|tT$fr7@9B9og@Ni6IB>*P1*<gVhAUhCVvZub
zQ0m-AIMaeI4d~ran)WK~Q#QOm{iK<PUNYXgZ!yrWu2=TjF7o3XYc97;b48$^Ris|f
z`Q}nV)AANA)sM6=S`kLF>JZNaw@B8RBTJB|XLaa<QxM#}st+@57lUx#W1qpQNy9PS
z)M*Jj?iZj7I><&2vJj?Q*x30^0<xuJDewlxuja{mQM2!6oBAHFS+d=wJdV3rT3spM
zDYbt$8-edO9EVw)0weduUSr)E6|kNB{nV*v*cnTZN`_Zh$exO9{?Wizj!YhLz}1OO
zRB)XQ6?CNX-sJ@&=;=8ohTgTC!y!S7B?L=l69KXSf9SoSKkKf?`QZnd+3%I#xk&!Q
zE!uc~?d6AlLr)eTolt-11u#@@uZ(om_wb!@$bE~mq-ABbYKpKhz9P|q_AjkD*FPgj
zF3KQt)QuWHn_V}dbR?kisw}{R`UNt9r=K4me|r@0{lT}-!8fix)>OL<`OFkw1=d63
zKdF$v?J+dM8@R8q6VmZh>i5N6j8sX!si$WA3Y2~_<O1W9Guse;Ss6%|+}=^Jj`m}I
z%@9;ID)$q5&ldB1#p!DSO3vqDbc83L21d<U!6p)I!FZFcIMj(>1XrxNT1CYtPEHa|
zsdB?9fGAG16=zq#SFq{5;)r|vR*o*=kBbFdn$%;fDD-hCk3n>3B-&3F6Gh}Hs*6bE
zkKzgo#k)iq41|)BBmrXNn+eD>JSt$1%0U_8m*;nbNd8M1(N+aBRX#^RRN&VLkdx1-
zhz!4AeDtrXsO;mYKgy{mI%@@-y@4v7jjlXKw*?y+96LP<j2aK*2`N@}AStJwU@fB<
zl5%RAj$9>z0*DAsbTlskGTDF{w*?I)Q1%$18!XZ9q48_laqlAI{vfBee@9N)11LVY
z#H05Se*LkR|3XfQ#R;O0e~?q-mytXCpovCUZZQOcix0rZ{S!I8I~yNKLQXvs&#>`l
z=tM|0>ev!(S{3vMIVB`QCK9Q0DWc62G|9mvK@<T?dEY}aMZxHM6y&S%5NdD%Aeu=4
z2Kgs)y5~`^eV(K@m*UqA)w+!qxs6uB$No`H_fjMTQqj~X3nPB{Ifu(X$yEf>qrZ`}
zVWGyF@GC2*vBZ?WDW_T_<<vIKh@_m_Mss$ibN@^azLas6kp5sONpurM!uI~AoQ6fE
zVXE)B3pkV$fret~g|DP85rO4srvqCuNdjn(nEq}L#90NC#8N%*Osjkamn3Fd^PxD2
zpicg*y4zXxvze96>774Q4hUqt%2{XlEF*z1%qn>sD3iG#$yNn=Ig}0Nio3&&G78im
zn?T2skW=Ls6x1&$t6y-5BP~|KW`=HF*2!GDos(sfZi~$k@`kh3<iOui&ObX(IMN|J
zO2Ulo<p|b<z%p%Z#WErAT+5KmlOY1tB-Kqq7~QbV+#Jx0DVIZ+D<J{%g^){S53@7N
z8>J%%0btmzybBU3Y<PkI9D9-gG1Jbk;(-dR=3dy!UocL8^(-Ig9ihf-Ek6&uw3n<j
zTrh1%Su9YX3CG6s7go^`=6{0q<_oL^nfv#^0=RrLIChx-Wl|qfJGwBT6MlF2rQ6m^
z4|tK6V3Ch*k>8!7fas!oB}EU0iym$jJ%$$t3l=}oEe^X=9Kl?i0DzH@Q(N6!rxOk`
z*eho^`DNJ4^ypX5N?v6RzslZvl>;xy6)efuEh)THQWRbCs-&cJ_`IZitE3WMS}j;A
z&;_zp&P#@4FGZC)&%;yU;0}0Mmta|sZdqq0Mjl@_R8lrFTqd7@>HEuG?Ymz#cBg#g
zq-=_0uL_pEy<fhZS-vP(F+oCD@0YL2RcziVW3#RJ6kV|euT)0=g`5&AMw!V3j6wVG
z%5T>yk6Oxp&I5l5R@ef_L&Wl1;n=%#Y4E#l0;`l8*uU&m>*~tAY)B%8ex#Z$tD0q@
z8Yf>p39aE2s&Ro<^Rm=1W<|MnA(1U0>e3pTks6IT#tWs{67sbhMzzS&3pty$P5ueu
zt+liZwJ(foG~{bUM(A})>o$~0{A#V?NKKshdEM34TCEW#S-m>R(s~(0tz~P?ICI^J
zNj9Gf`F<4FH?*wNF9sW-2F_pgku(&BLe+1E>lUYg{;hS-z3Tnt8}9-eby=EhvuXvc
zn><(=BJ~>FM})t=YG4tEafjxUz<b|4NIW1sK8yazc75Cev&FSW-IzvLE0chDi(yQo
zb!(GGR@0r;=2*RyH`J}HzgnUnG&#t(J|7YOZH4Jw$?=zf1@*PM8Mm@MXpP0SXjr%8
z#<Y|?AY^;JZn;}qmeuNwXlWI1!(_c~TBxUAXzTmMjgZ5n;aSg=DX;S~wPF!%MeK$o
z>U2*hy2#0#x1FcDO)9IcwfeQ-!t0ia^A5>h9g_<!v#qT!5<3=KJLauBPabsEEp)<9
zJCF1PNX9V7D*1{S@>J}W?izB&lZqdX4Hl=KSwZIE4Lmiw^b<Q)7Z`zy)nt^N<J%n*
zr7W<~T7+xc@`Gx*(axEy9vaFn<uBbrv0Qv|n0RG!`Xm<$I~dptS4l0^utF~9g9>-<
z<r8nyIPI1it(F+=xWU>ZecGeoTBrEB$9|+Qe4+mCmo|y*eyc^Sv>bAT5tH-jN>L}}
z8WZ;2E%fvL0q-E{dX|C5z#bYz{~NDC+N{Cy>OL3!PIby5HP+fN*VlG;heA#{f^NZ(
z4Ak{$P{DQRk|(4%gsTP%4--2_wqWii77TH%Ha}aWk60Xx7VeMK?<cAZCbJH?jgF{M
zzI=<o%Cd}B+6a)W({|%#&RpcXX8LtNp8*c>!gZ7d*jVE_c*AC7TxF!0m96@8r0omk
zY;3FQDMzpH=-VK^EiuzsTDBuG<i7CuH-&LW0>wnxn@yF`)zPu>)-fV==ebS)`sjF~
z&8X}_4QhxJmOb8QLb+>$SsOwH$D%t{$Qj}$n6f9@RmdyJskZ==>|-oAgE1;M^u`x%
z3;4^IEZ7ktVy6ue`i1Z*2-g@*<o$hRHW{6q0J-gr@%=Q4^g@{fp%z{88V2a~6><x-
z`T7df!jpX8h*IPCIixvw3fV<8%$pQm!V2z;k<y%-tXQjuZ=K@k<g(G%XK1N@4Jq!R
zo`NS!@^p@r$%j=aXg(mX@k=<zz4gZsY#!pQ<A}BdB4TVNVh2s&6fDS7!i&M?xD=xB
zV9bF~mwkZy7}Fg$^aqv>uOEmeZ^+eP^n<wB%^x#Y?57IL=bb`C=4%jrdyvsi*il_t
z8u9+V(S@Tt?#vyg*T3Io?jZ)n-}ZSKb^y$6wC7997e~exg(t;1Xe7eK_>9DmMPi(@
zS0!bVB}0o?+6~C#J>l)Oh{VGe7E*?BNsD9U@3+U^m*bRbJR8pTAX9tn<W1lZf0=td
zOXaIeZ}ZQQ{4|%zN!F?I!w!eHJ8>(piWSTK_chYgdPG!F5-Q9VypLC?RTFN{o^v0Y
z^Kh`rZ4{(F<cB1_w^EoeSZycrgcGaR5EE-0#*>`6C|ves25J<pt+@p^LAykIq&&&e
zg~GWFAlTWyK18_#AlhQ=TVnd9gei!x@=ft+3!{~+)g{#s)?Ys4j-IICeP&<$dkXhn
zg}6DceID^M)+PL>+rfygZFJ+BEfn~fQv5TT+QW!;S|9j8LxiNAPHS9d>ez$a^lTsP
zq_7}JyrY7OZm_vLL_5A=%v2`VxK8O{I^E=rIt4?u4+NjQp=2k6x_cU`zu`Peu(KUJ
zM=>leX|FtnrK6zVz3sYDX8~|~_g>~J7}tlm`?eb86Q8JaQ6+B}7u?WY@6rA2)b)*@
zIJzhurKVQ^lchDJ$EM|zsz2hXY)e4gjdiHSr`x%(>)n)W<w%SKESZ4%yo)LYKuO}M
z%|&GXl`UWzifN3R{^7*ajK22kb8_~A#oeeA<*?+cO)VLrdXvxO%R)1@u$64ObaH6C
z(E$Iv6Z*pbKfqJ24(!sQ9ij+}=rwv|MJnQ5A!qAGl^Q{3X;FCqXj%g5x2I6sE{abH
z*3pTQ3D~`Kh7S25o}?bO!uDm?7VM|+?cz=J3|epo4X;uDmS%gdajD41$P0D($Y+qo
z_d=tO-c4_nWc-v7bjY82?7e4ieEZoYSfA~oTKmr3+}V6iT+_;I!b5nH!CYq^R}*q~
z?R~>dEN;JwgC_;OulO}$`Nr$)h2xO@_aM<Vd$8jk!lF|lazJ#KQ|2Hka1;Qk!6U2^
z=!yUoE1i^;KOn>6C_U1S+wf#dOwLG|+?PNd&;8?rJ(xL<;-=UKZt;bjC0rB$>UQKW
zu7td_f#MEuY2%Q)t@ft}*pY+UkpLS-YwV+cHV{vj#7tfDSO*Q)xI@9o=m+mT6tK^s
z_X5Zt%mmzyP{H#BrvLV{8=%x%A@{QHptk$ruO-#7cdnjhOG-(MBq?bb`TtalM5Aj%
zsn`@l8LM-tm95$V^JZTVl2;s0`&#Wc=aT~0321o@iq$qA%=LEPS32gZ&Q>JibU*@^
z^k6*=5Iy7hTq{E(j$I?ubkpReLAGKTv)PtuiCOuLzD%=i^Flf5aL(G1H0p<$7@Snn
z*B8{DXRaUD3n*5T?wuVo=`aTDD#%E_b!t9A48LkQdvs6XqLJ8Y=>3;GzE@q+d1Y4G
zkFE2NM%E<(3u~DL<D>&^(3PKAhfeA3p+#2~oVHQEid;*JNc}sQ+;Y`@`w>uRn&0+J
z4Qm|P;$+TtIG3AbYe)jB$K9Q^WvD^ENlCeZaK5~L!&RVm=j>g}nFjHlyA~9Z{`pOU
z5GDZcIh17P(x$|}e#I?<lf9~!b41}|ld3jvW`(B+O90ZQJNqfXYArJ~TvbesO6EhA
z8cGQ)u1>ARO)XeyH08iR_bqrGJ3lQ)<hbIzR$0+{kVhSTFO6{^#}&{jn5CMaJ)R>R
z*_@}v5g}}X`g!`Z8$(C(O`A5PONaSFuRL>P=W;ckAPp*e<#&kOobqngaZ!Ux6~1g9
z{ezrRz(a+*M9RZ6zEN~|g<Op{d^{bj`ugMix6hPYZ<<8qAFFnaVXkB(j^wCEGF85=
z4^NJx36<^Q$-P%0CZ!0r205~xE{Yw-oZkjK)8R<s)$!6GlQBi(oXhl}@OKAMqPQwi
z?h<u}ry9~$PU%h!R=1kv5*a0q_isIaBy4pR#r5fuaX+hD@Aj0(QWeh&VSHJ%q*Y)a
z1eSVgoNl4zJWNrqgJv$$eO&RuRq$bg(Pw6^-QS#TLDTyK(z`d-zb)e_oUb-KNZyLj
zdJIo2yb@R$I6By{b-hB?>a6$6Xlf0CbV5C(?t|)Ye;LSGtx|(N7v62=LwNFQY)tCY
z%pZ0OA5QSacpU<tQHmRUgqxY|3l+@soKXK2AmwDg{i^<lIhD`%TQlK@K0+jD>qGs#
zeU4MBTjO%LynFL!cbD>n-PddIbD0C+=V%_+iRJ|+>PhMbA!p{-{q|{i)il}CNp6IM
zv}&=v8dr`@yF1}HWFlyBa1E|?*k+<rA}bz3d1Y5)H%9oK&pJZlO@e1LPemk?-&-}r
zj6vaiSa;lmpb>c|E5cy+)djC38ls5DR|*EMmjPBBGO?bHH^M6Ls){m?R0k7z(q!*4
zE8g!n6*$1;#odRoU21G|jg?)Gt;Jm1Fx`F8UZl_c?iT`MPK|wR$?5Sx@+tLhIJQds
z$^8kS)*gXKFQ*)gyk*H8zCmjH^Cv#x0NX)%x>0v{3PO#eDDL|2SCr!Ua5I66y6h&5
zp?G06Y4A0*li;544?PiS=l7{hPgc9-vWcOhv2fH_&#MTuo8Tyc>`h8!!abrG$MtU!
z*LGLA(Mw#;FuT0#v4c2+=b&2-WzXf?Nk`G=V+u!2{qyRwT5|6u;sbiuYulA66uF~>
zDo<29)FWAyo4Tm%)N`|U1F6(nfHK<E>Rjn*0|jLx2^w<4vds6Cbp0ojbHGmg8nDE`
zY2>w+wfS-`E_B@Slc|-VPQp%?^sc>|Ol$0Q67_4=yYXW(y#wql7IsPBo_;E0K;2m)
zwOQX;dg|GDsIyezC4)QWQ<*cp&eHYG2JZe-S^uzC)25z(R=*|pw)u*G!&LUy&|3;0
zFB#r{H}&GE_tv@M_h!RKKc;fd!7j=WIinEzX#$0Yi|Rk@)i4)z9y#M^^XWW>J{Qf4
z|Jz=jX_@JB_pfigzUx2Jx(x9M?32H7kT&!Bvxdk0x2-pRG|aSp4f6>4D1Y<h-AwyY
zpU0!`tvAnp%ygVXJn;|(TM)x+CxxbG2;FO2a+%pKRJiB=qxLHC|4;Vnu{as%|6|DM
zJ@;EA=k#yL=|k^3|0kSNg@5mys`x}H`$kozMd9B?nSYH^kB*MEi_yr8ec}|aGZSw;
z7k}+*yg^Vx-HU{X*@T<76Aglrn)i~fCMBoLB|EyMn8c^#<fTM=rd#|^ozwd-9LirL
zFTQYEeBrbI!f7SPhlHFy%Dwf!hMfBS-+-JJ|JTTAc5iR*|I3im>Hm$KO5S}x+Fbj2
zoS+uNZqQP<IaPeM^u}0A{q{_i!^jJR)`p#hCZFy1W37!}mph*z{x3yNBma(^I{hnh
zYV_}sQxKYjoUYOEg7!h^{|<7>g*N;*<aC#WoXY<P<dk!@;16<Ih&D4d?*C87soTFG
zr(^#KIc@1Ol3h*Vj+0_^;~G=soZvFZC$FFSA0wyap(NzAHw=0gS~o_itX+q~FT`@A
z@V{*wpFn#eX=9+Oj32`B%3z^MUQW|Q^ksL~8e=&}@+OT}jK+6Gv{WO}dg=wN8-~rF
z`?q$Tl&1xa<Rxck^{CoG@)$+!;=2>oL*aF<wczid6?%8=+dbNAyxg~VSS}uiuy{w?
zMru;|gi>IJl+|OPZ6~!}17Fh=o@F!s77VF_B(7;<6X2mJkw8c5GN~j=2W{+TF(*tR
ztH~Hv_)8n)HBk`S6UlOLLN-2GN67^nA!92Yo-Co1@)^sb-8PhqO$pW#1vgXr%(-i;
zigb}dy33T?>cq$tkF`~YrGvlNQO(~%oYxr=uOb}dxDQSiUHXSY-L#8_SYy=Row;)9
zG*nJ<MG00nQF|&SX|H`(7E%2&&U_(d)$nu1k0i-SUCGPD<=c8f?iT`uMbQFD+D{@H
z5)IpjN|X519$+*2Id$ZAd@EjWth&~av)2!kg+nE^Yo6|BpKv`LiPauCnKZ}}KD&`x
zJc(4x5(AB?30@UJV?arqXf()u6~zT|zq*?PP|Uqty$3*_t0!Cx)Yegc%{5pJc9eTe
z9JiilAwUBuIsilC9CVcE1#pcp^(+?6{Y^_2%3Vnrt^DYi5rcoj1EZEocvQEi)pL!J
zK)>REVm=&rd}p@U1Imw<AS0HZi-NJ-t{^i*G>{!U$!P*68Ucr|!6Ck)cVOC(vTNAy
zzWfAwR-_S70(kkIQ-vetAefUCEmDTV-mB6Jr2r>1ypUBMjQbkzznMmb2~6-dHpC!r
z-&9e28RB@V1^HD)jt)(TKd)PP1V{pN4Z1w>AnrZp+!&x)N<bbz+qII^4yXIcpWraJ
z!X&jA&dIbnI3=#fUWW#uVYjuFcY0#^ST$p$`4h+?8xS@YyZR(x2h;JBw1~xs1!pnJ
z)3(mk3$!YfEI+``;rT|B+FH$vdvU%17uUnPX()}Vuyt4ghZBF#XK)gdE*bzUJDHVi
zv@3q-T9Yh#I3STFa2|5&S|a_z@zwJ9i%$%Q-C4S$8nRAM!bNyWY&Ahk)a7VwY7BqN
zySqn`Ql-uDa6Qfuqk7>TfZ)40l^m$QX_LfA;6#52BHQP|)4xNjV89V?^$L~ts1XXn
z=p<JmhTa!VPwkuzqCV%Roey8sd0eM$9c-B-6%WyVe5w<D`S<1kfIBqzCs|Q88GXG=
zbVMVQI`ac!o<isxzs)XL*(>3hK6U;C`VhNEla3or7>h1O#n_nf!-y{Rs;6FgU$DOk
z8cfJQ!Xw%(Cf18=CQL1+F);AeY4{w=)4tYouz%HKvS-S}sr51^>nx8CmYrmP;i_|A
z9WpO6C<16}OV6*EzY-kVv1W&2>9qM72JUpRgS#gI5LcWu+hDCaG2~Oj3e#pFkRS*h
zB2N;(dk8Qx1{Pm`9Ha_9%fD$hR3P$fa?O%K-NUyCL1-zdvKaB(_1V{|qCYUf+=Vh;
zE)>v*;Y`{0{dOf~trO_y$2lA`o$F7#Ot@)>D>?BQ4=*6Ffw8r?gIP7E8(|&#(fUyU
zpKAdf+e#oBZil^*`RWfBSEZr>E{J|C5LePhze6yUuLC~Yg)dBGZg&(u#~QaGZY(k1
z6S*VtQmM|RV#05~3Zhe?eBVaO#OqM`SNX2;FkR0V%)8=D*9#24KTG4jICRX<lRy06
zCH#xY?EKc(SepmQDoviIAmvp;4Yzi^u<&q3`d%%t^v43i&e<(ufYvSbC>VFQum`M6
zpr}XIJyjBDg8vGOxcW_yPkGHmRYW}>HDQ_H>u7iv0OI7<X<L2-{}9zE<elF^ep_ci
zwoi{f__gAWu9V4kXOr`c;-KjTqJdG)2mM22P*8>HZM}>h{P&Ef`a89u4%&i)^X6o}
zGycAM;1cJ^VN>j~+vtz%;N1u=GI8#pl?xV%yEXn@!aL{3hRh&Jw1Cf!iolri(x_7-
z+RTn$VQ_Q#^KLrDui&SuuWW-~vkHH|--@!6KqyD+2DVVhlWk_YGg4Tu6vnlXrwv!C
zNS^ceD8@U5KtSHpkV{AC2XhN#*BY%$DgqKO?RvGfd-UUe3=C6!^bQ9-=>M`M=93j;
zh)cQn=7|PK;r;O;#Sh)jCFKq8`jU`3jB6~k^yt?gjbSngW4Pb^#P_~KZ#BhR9*b;2
z&S>erX1~d@)QtPyq-{q=lLCB1noPx<OFgk|V|(p2b1O#QC@iBo+bTmh+}B`F_{NDE
z-Q>qRMWI&Je6P3mRXe}r=vP6IKTTHQ4LRJW*}YH61~U$AU%^V`R82Z6TETMzQ^1em
z<4aax+kt}jkeaB8^!FP|N*2W5)DM8>-)EG@nNRIk8-Rss%u9FB%n|K1n+R?+MOnys
z=)s#lFSp;P*XPJE&Q)Z%vRrc}%0eYUV*{R4TsUJcMU$iSx457@O0#-<c<ybmiVOt~
zwatw_xrGK7qmMoBh&EjPJrMNk=nlCZ9&X3?!xT+rNqry|OjYBGoCwCKgs=yqcM|Yq
zK$KwQBhd}IyGH!r5byyOrd<VD-J_C_#j36-$_0B&bMZWCpy}qO%koqXJ_^xgWEr`L
z)dr|%bwUiQAhtxrW)(RGjK!_fWC6h5-@uB2GzY{BCMpPT8h5>n@Csuapb2EB$`Z^8
zzDujs264I*7!f#2>pE+A&}j{}2i18BSvW@Avy2RvrM1}uMHfe2v^7PYhfow?Z;ok1
zMp#CrL22VRuzJ2x&u61_5~E0~_(C?i;F#t>jIuZ*x<r;z%q+U%IJ$~4rbafV&N8MU
zFs3OZrll$7^=!<OM5IU{^>3qKYUAKvp0R_Gmc4_DgMqQ_$Fa0|@Y8SL@(gNKf+M*&
zrAr{1{K?}eX)MhKH*K{WP$HNZ7{5D#icp0+@kBFqaYCsbU=wj<iO4L^TadRG$#L;C
zc2AF+U?-9Bpr7oi(qwH_r~<TFOP!@ES}a)Ez2_t99e|t{4}S0sOaVek0>t;AC_`IN
z%8}jA!-Q^#jLjtWy)4>`*SGvFsN@s(aVL+hR#HzrO0o(ff9{VK8gkbrf;Q0z$<9Db
z4b>ry2w5}pS5Ndu0t%FvqGg5AwSZ*u8V2uyo`!lreN?ZQUG{!ri&!^M20sn91#NPI
zHuuD(l@XRdg%7x7l8BrF0%)OU>h1ugWJfYdfRcD!8ef4#s*$L;8d~V5urlFF!aLQM
zQ^~0S9z!dpO9^mLHKoJ~nu-VoPe9>fKn^TAbqLM1LP3*DH3Fc{yB#x*rx2+T<B-%5
zIi!?5l=z@-h)+S5O>*BPb4NPr|3)M35;+rUY%4dVt??fCX;rUHl-CcTu>&DQt@0M;
z`G-THcLyA+T<Kc}!d>=ahMmx{i`LSeBu-s0?i|J>AqE2NlO@lgKN_K_#1P=>7nJ)z
zf&jH{0vXykr!Mm0Yc-|As!U3f9>yu%`i+uPOs6E&w*P~g-EDpEHFBzhtalhfV3oXc
zfk=S=^P%P>k@UL*2b5>n+}3YGFKdP0Mm?Vq0683TXp7|rt{6yn=AmU@#3#bZv1l~l
z*~dLHezD9m0(fMPj6)2OBtSMVhMori=Br+)T`K@3=F1DBPn5~|iGXibXrDcxMAeH&
zD=*G$bG{~!@f#tp$sruYK;0`SYeDo4_)B}inBRLKK{V9KNuNWKET{++6;6>u1kE3S
z{NX&m3F%Zdgez}BlK>^QDetyD@%!h)MQ3RKEKgy^6465%X-+YlE2=2oD%aSSqO3ik
zX4O1$@eIyR!JZIsn~|KJbAqa;gM=Uxc>;XiDE|ZiR3btzZlTabfG!^RXb+j;nV)zY
z2(Sgx8zDOd%g&5S8#7B8@xVA+pqU&x&ghv00C<K6IbzWO0*Z?OfZGBY6UwQ?KuQF_
zTub>Gv3!}iVqGw%%}7NWEzF_j`nd*0_XM0WiTG$wHZ+NN9D-x;iIX$s-^&+a^mh2E
zD^N$|ynm@=OTrJ3=dIV^DxwZQzNS79DRhP{fvA*Jl8{pqoii~?5@)w_P?8`Hy5tG@
zL_$u*{vf9bFrdXB<ka)!nJq8@RtPXcD+r;*gleS_wIEy$`95q${(zBrt6EP&>(
z0)lV=gVKtn`TQTZW8TO*O_~PxF!~s$q3L8bKRd>Lp@}7<ZeW^t{HeGm*0`MB_L-y}
zxxaiSx-*}Qx=s;MciFlz;K3i{wEYg6#`amuKakToIf}DAB)|w6v(RK+8pGl9+*1#C
zf(2MvBgu^lzE-`sx7|qA)%0>3MG$KFNJ380g#fW~&}z+D73IYfGNr$eQy;OWr=_S%
z|3pr+V(1!Uv*d9sdlhG56!5CjU8@$b9gw{0*&@7dMhHz5YLgcNu$<%TAp1xf0svH1
z{s%er{1@cZv+OLPeS4w(D<Ws4wc}(pg=MuPu@$X%uSMSqO;%P8p)7<cpvgu%kgr4e
z0nI3dE;Dg#zq$#Klj>Q95bvP?NJ3|Ky4p1KInczcavzD%?-Kk%OYe#dX;LL(u{O5I
zM_??Gr~=5N__T86)7}HXU&yJDLa!JI`^mFc`+2YK>t6lE-YY@9sh)}gdcCHvv6`p7
zme2dH1@(Tk?>0N_`(52<uh6esMv(~acPZoe?;)oKY5hU3*)?N5R7uF`C`3|!K%0b|
zejyJ&C)E|l_TIO>_mFjHeSd(H(Ch6wsQp^P(&jJZ6#t))Qvi9F5yXa|>$HL}TOqFs
z>irvXI!R0U&K6nR3DF?M5l4sgP9N+!qjw3&;ZYPOH{>Lt8|H-?E<+xP4Zjm+E{yFh
z#)G?Ek*-o?u~@J>`rnXKCjwjp22Mr)8*=(6RKj_W9RD}u)brnvQ@ej6r+5$DFXT(3
zntzbfPKda|#C`mKL{8hI(9Zt@<kZ!-m#%F>)OCW_vv+fPqAhmn{tC}~<#8@IBndg4
zNk{XEpl6II|5uUI&i@&5S|vePQPo-m(YR4f0tVg_K!1?a*TQG^ll(iVnoe+h0yr7}
z2RXg{59HMDZ^)@Dc~d9Fe@0H7{}nks6&6{cI`r-RJ95hEVrxWxPv70?FXU8}gq$v_
z1nbO!{z6W#k^X;uPn6bQ$f@Ojg`8^rK~CpesixZ7mSa_ho^n!I#lF$X?gdozzBgL=
zR7FKrF*}I`$HgvD?oX$QAl3oUm4{T%cTmr<^ZHfqLAjG>ctkQ5T?AMLu&pJFp|nWM
zXcc0kZRuoeS>h3+rYqHzHE!UGHyK~LWzJ?l?TOFrOs9$<Xx&#=AA<KgDYe9izih^S
z0@gUMtnrGXjoHaNunWH_*CpFOh6jV+8Vo?&*JsKp(709g8>=fzb6R`kHMXlqMilyZ
z$hU`U#)|V^?@@;aAGvmy><EyCgk>A{jVHMSV!~L}D&&Q8VUUb)&-Tid?Uf$t1|&#=
zY+HGQQ#p#vj(o}!^)?9o(-!@cI7vIPdD^*IgkBGMvGqVjtu8f+BBYBN6beWZ!o~I&
zNN-lusiG619>nd`hnNoHwrj;!@BdNcG^|NO_m*hIF3KQqvqlsYZLi9yzs|{u#VYV8
z&|<6icK3I?>@^uV6TSj!zE;kB6$0<Mac^(AvuV0+rlNb8KXij?Hh>a67j1^f4ELyc
zv2taqlD0^U;l7R2J}_h-a+6Vs@<3jJpZfxq=G<e0-=jzNbnmTKpZ#txn-Zg3$2Wt;
zZ^8TDlskG=pMHDu2RR)Q8b1hXJJei0R6IX4BAKU84@ZGKW|h4b=M1_xzh7TwxQY61
z_w@Tv^><xiaPnow8}UDM%6?ow`{-`ibJyd?Xm!8O<KC#mBkfqmpvohE6r01%LmSW0
z&}#B9g`+SJ#>nxb7>;8d!|&ENe*}piYZ(5#Z}(IA>CXfX*31i^p64*+piWFKFy?ox
z=Pv(j_c{rGeiG1iQhxJ9?ZVIG3%^P{SgQf>YOx7x!+oh6L&TLI?OzW+p-)|uP8&N|
zMeHZ^#vzhbsHfhH)nWpYou?WoDw1oe!p=B#?veZsbvS!|I+1faZ2Y8hpkIEsCu5gE
z+48rt;l}nj!%ohzJo5ZQ2cxWms!z@NsS=+gC7L)&#cfF>bm?-^{s-hVmhL<2huI06
z?%2N}ryqLa*v*jOdy_o<On2XDf3ukSWbpiw-|mOGsn3Q4l`tgFwdoDx0-aP*r};m~
zsc|81>fz)aZ5(G4)W#|S!Ov~c7tf<-9?6ZXZlRCu)0m8}@%s3tK2Un+T8P{7WU9Q{
zq$!E7LGjwm?vapFx(k|uB4yCaclNKmv|-BaW)iRnp|$@DIn{XjL(ra_;k6B|Kkpyp
zboP}&{*Cj}YvAqKW-8Uv0*YFN{(mB;LowlPr3*iI%Q(3o#EOP)`+S+J_X+*9aQHnQ
zaodCM=8b@W(UnWlGC3^Q-Z2gT4LN;y8dLhl<?HLlOP3quiZMP-8Fnpa7}LGlBcoDq
zSFrtDBx0MsZm+wZ`4p<^!!2B;N~!h0Ftp=9@-O7nOJnteabyo#<q5gu7$y_Q{M~-q
zcz~&X4bJ@5ebH->?Ex*372CmOQfH~3AEogJIn@;`EYq#!VJZ_%+wvYg7&!>cujV0D
zsQbu^8%#YJmArhly!Y?ODXS|LHPm&gMi*H}-G7<P&#>MS)BP86no2@W`Se`=ft;3;
zkki+$De`I3-=(C7NXY3l2{|<@WLp0la+<0b_IKp;qF&hFkW&(Z^LOO*_dk%+fWMH_
zu3(1Ynks+Vkicr`m^(K{dMU;^tKT8V|BjsU{nyAT-(Scn+uxDXaiVM^mV})4OK|)_
zPRCsWu`;aaU0u5+5^~B)LQb*&L{2aL6FHqBA*Z|~<W%WfM!vgJez5(BaQq+S)cp46
z#s7$$rv4o{T@R7S{R=q_B_XE*#m-MWKi&Tuaw<jq3pr)~7v%IS2|4ACv4)>K`wKZu
zA|a=cI1+N&A1_?RvypaTUil?Kr8psrgq;5PcgQL6Z^-Ea2|4BccgQKC^?ra@6npo7
zLQbKot=M|Roj=H_^k2v+AnxzTDWU861rl-!4EZmSQ`f&Cr+6{|pc4RP2?I4zJPDRn
z2?k;DQ&M7=$z{h`Wmf>_0RDt_Mc;y;&w9%zo-2S5BP`?-0RZC%0DuZBcAcF$XV24M
zWKiY%to+&+!M2iX*{=e+xa_IpB2!i&UOI_@&Q0<)5O9>zZkYwV1+MB2w)yIOiDgg(
zuo5x}TnT&z03dh6V?D%IfQoy;fH6DpF?BDHnGt#+x?h#Tl#7)i0ic2mXoY0#Fs<KZ
zJvKQ~Q!p8!07Ql|=v2ksvQY*u1Hu_8CToSUL^9Vy>zN>ergYMmPyw4&ge1QI=c@73
zpwk7Q#GcsXvvm-Yk$qNppt{W`lXMv!dy#-T?LI1QAh*~cgjqR(Qn>TJvN{{X3<NLj
z41D-W8wiv=$BfAIi-!OR^pq+8jkG(DhWh>g$3Gj!zVF+Nec!WhvtVS&7E;#i`x+w6
zjKO5z5<<2jBqWh_46-FkC8@?5C0R=n-|6*wf8U?)_xH!|{LcCP{oKxZF4wuP=XE{q
zHysSK^H+S*zPozAM>d=fR-78NWPEZ4qkfhJpi+s{yL00K4I6+q1^huctf+5)_)%zw
z;HV5;HB#TONdUkH(H^G9`b{YmX|Q3HpGQx)`a0C~f4yshk|2#T*Jjd|h$93#Cfjui
z0)#wd=>~>zmqj4df!C<!et^AradIZN|9!eX)m$U70^p)E)|geS9XH92^@l-^*f3gZ
zscd{MU@YB7o~L*WBi+Rq@eQUx7WzVtjH>qm=lT(#kP$VS`F)u@m8Z6yBRAcILmE@U
zM>_Es7>ITZ3$!B+DyXR^fDvGTrc*8)fW1Sr2vB53+MlL!572?u-)I6TkZeed$9Won
ziay=}z(Q(sZjxYO$awobB1G_04F~~!cXNbih>n4ecs!(=JAHxY5sf*{J;vpHvJEyZ
zCZ-X(a`n>6)OpB|>q~BCyB7gFOJ!F80A}n?Z<+55%@gflb?%6aGy`!UKY&)HetP~Q
zS0$*%cm$@g1_p=Ux(`-GCK_CP2JxB^5>YXh>hPrd^AZbuGW~%DVEpWb8kV=Fasbru
z?33m~b@G$?RNxyuC@q%?hoMcmB;797DZ4sd1otrUj%>5g$2UUGs}HXOgIP?7?96nq
zf$*K~i)&xjAB?R=<S3fF75Zt0hogh{0J(riil=J*=@T%3(ECZqR4f-Wh608Z-=L#f
zz-ZG{(tug+_iH6E-b<TWN>D5qJCH*^OEIp`c#8zV0Q}Q)>V<SzP?<a@OPR=HwM8FR
z(@-`L1_m*BxeAecBtR<;5MXn`wSr&-Uu%z2&$kGm4Jq^!(O4w8>GJZC^K8w@PNdNT
zaSo^l^usr=17o_3T*p-2W+kXvv=*C3Q<mCm=ccp9HUrK2;&0aCsF@{kpPa<?8k>G#
zni&T(Vy+V2(gH_xxg&rezTdNq^Q!lI|9s;H#=l?rHA4SQR>2uPNOND}BP{@nv(CPV
z_&^)m`^{A}V&b-bO=V0=q78s`J1q7zuk&%=XW=gi(w7#0j6ER<pM(={rF~?qiyLNr
zwN3Q9v@FQ`d`R&mBG-&&SxD4MlxF}-!xjaT@Bob82!_+Q_W)_0F+z{JVVBizw@ABV
zlMF7WLD^t+pHv2E42e!|wO9~uI8bGi0`aaP(UWO|KpK@n`OCx0@XuG@=BVv9CDSs~
zXb<e?#$!PMN*S-6F$lu;saay+2~9i}urPOrh7Y@Dtz!I686dzy?OLy>@zInAXJ0HV
z2N1TB4_ihvhUIU=*6b;X<mMPcg6rOGCx$uYQ+^X@WlrY#gv{OMZ^=R)Tg2oj{H}GB
z7MSwA!W>vy&O_fuUgFP#o!+AJ&SCPX1oA9ph`(Zj#p4NJI*5#Mk5PZcWR%;{E4uX0
zT5ilN3dTSt3`x_F?-3@t)MXTg0}HSLZ>A;fKauY}+kpUmQ>I+LKm-UFS7M>gEPVV_
z=Oa5Uh<V+Jo_PC6kjO<f|8#nrUSes(soT%E*%-JL8?R<yp}BwwI1V~@8%_j7M&M~N
zSVm*R!E`{_5<tTS;MI`&+aAEYt|Uza(8lQn;%Lmh024LM?*xgqx!98gz|5E&*cpbe
zRPvF7g4Nq=@l{tMDwmUKZrB3oI`u@M)T8>E=XAfkM?QRHnDy$`-bOdWWpy1ema7s@
z6IdZnP(7VdC$hNc<*fguPKBt{sm#CBDJ@;T9&q3<bt+D!PK{xxztkx|4V60O9|RWw
zNQ_tvl{$6S2lBNJ3G{~8{D(S4Tq4)JY+Hi^dO1bSE@4A$ML^-Ay~!y;cGzJ-RbdGt
zLxSkBtxk3)>I|w(=qjLj3<Q(`u&wi>^;>LV8ol;d00wX&u?=T~T_YoJP9v3iMsoHB
zGi%72&aIYwC?S|e`bz+~8ym<+19nCoM3H~&5oy@4WejOoy2xq`v`-#^+2XWX;Q${s
z6-alAp~_HgscDq+5S|Ikb(pHGts+`K1RBLM#UbW!L+tNUPvK=^(#t6s8fmm_0Nh1&
zU?+@`6PxRa4S~`nR{{0n^b%io^SV@B1$DT1qkDe~Hi;7x0}Z0qlT9UXciPD9dVqV8
zShzmmQ-Yq5*kF_fG0_1Ts1FSqGQIDh9g?ZdoQtLzzy;Q~EWfJqo&;E<%cF&eF%kya
zo6raGqP+DLdT5nv5ulBYZlPWI*I&=zH0bDHqbBHQU_N3BTIIDKl%W%i??j2@kJyfa
z_;dk3cT|$0{G#;+)GAe8j^aT);M%YLw^1gqIRW!(X(bwIA>l|?2l_7g&ObpSzxj)^
zB>-};asEU--4z-+b*!vD(F8wIr$DSPJNpUp<g_7ETRhifdj>-Xpaphfy?X#QLeK^K
zXPO!l&7&Y%{|X2oRqxn{4hqm45Iu7hOSdlm+P<Uv5}=o$Hx0pNAnL$^!~rIy!KNBG
z*GTUXwH)yUT}uz%xKgwJKh)`mHY#<BjU8%yItiy6IQNX<`M=bupdM5=T5O6RDSh^g
ztOj-ngx%EphdMR4PIlIEU9kF?+4t$vOt8ioE=8grUn?fOQlZ6a#bIj2donPNmJUC4
zAV}15xDmc?Iy(jv9kni(1AyyO$0eXK?4pv1sU|K}L%QdZT+HY3G)R<+Zla)*;3RvL
zv|?kmB@AocP;-0b-03M~I<d^)(;h%hyhLxdo1aRZ4m3{xrA}$(_>c_+lKxja?og@I
zU(Lb%$ZANc&^VzdN_h^E4F5}=0{$f0My*@%JfB@*uul7zI;ALsC}Yc(QxBtIx(=1%
zOuc+p+gR+VtaSf>sZ)(k6iqHx2w$lt2_P1lPX7;en*4-QRNwx8Q>UX<v@k5B^k3=}
z`|D~I&1gT)yj%Rg)M@=J9)vydmH-G7gj}9JNluwp2W;5F+>Dc-yaF(3V~eYs`KoKi
z(gCak9erHz7nx<@lK_EE?32b+T4w+o7I-Sx4X9oie?F!sO@y<K0wk}M*B-yB8*;Ex
zywJJikeoof#;y;B0Y%fXXUDO&Pyov)<h43LoDB<DFPat{?Aim^a{=&b(BiSGYmZSh
zfhM?8)uQt{8r$Teo04D|0R8%CNdOjZ`8I|hNi+KH1tBFCeKvO7MLQV)8ff*a#DXd-
z=~|{^Lf&FJ$8G1-NfubPdD_3)X}F$=8dW<jzPUoxP9b|-J>WQ<?7!OSZ2`&ut({`4
zpzCVmgJX(~)<r3(zuIZ5Lo)0_fv~G9@<Q5Q?UW`@7&`0fI`OY|+JzEbr)sAu_--2K
z37$E1;%Q)~`4ISHvoS4II~~W;xF*w-qg**Oh<?T&n<*)V|J6?6|7fSi2A@pap0+0U
z>FQ5g*}gRR6sG=RH-%Y3(cPQR{lYb7x;VWW7xx(x_v2L=URQVFD*VfpPk}14bJMr|
z<v;y??hYvuI9PS34fUwEoq=RiUVd<=BBzWZMc^V2=Fp-RKq2Fa2U}>N6avqz<aue3
z(}3QS+szZP!>q09$#+sN#m~yq>?tUf-$YE|`{?;8B2T}|6UO4j7{I{}V4)(X_X9ZK
z>|Ro#OPd2+!lqubj{N#1IIb&R3R6qdFfWb@FXel@@dKO>h)hDV|6h>Pt;<FymyKDx
z&oo2cuP-SZddI`P`keoRoMN)Q%`3dmR;<XFdRvC_#1m=Ejq&`4{~)I#K6Xkz_J%(8
zp}-Uypo5{$c^({(|6k<PrP=3VpU<Vf)fD3DCE8UdO`IExucwHwm(-f8$eO#7uaD{K
znYcyEBwr<oB{fpUdR)FO<K<VKUK5n1pk}WSCGHdzZ+{WL$k5E!^_hXRTESD9FDSlt
z7e5D#FvcqRU2XQO%1w>B=bO^v8{Wt;+LE~*zGl1kInM0{w!@ELy<U+^X9;A#iTO+*
ze?EO*$wX|{x?xz@T<@Rq(LdYQU$TmY-58YArxh?zD5<%A&9O88#J`XSm$&9$Z0a8m
z%_#8A2tU!zF=V?*S-REyr0fTUh5mCzc0je#=a@HZ@g1EtTf|zo&bw>GdrE=#?|rUg
z`I5V(8)rzYzw$+{V(mdiU`y)S-IKr!@%5K5_J`_0_!edyOVE>4-|N{d5kGXre3`S>
zo<0>Jb|(e(CHY>z67Z$l-x3%+#kpCy6*MIBS*mMgV{biIB(OOuIL|tGym>Q>@$&h1
z$jOf2sjW>B^`#(4$P1B>mr5b83`1tELteXuya^3?n-nsa9rCUsWWG7%eP77JRLF;q
zA*Ua=LOz{@P*_42MM9U9LYECgSFA%<-9pzwLq8{lu4jjCRD^zM4*l8}x;Yj4?PKWH
zR_OPW&~28m9g(nIrLaB2uzl;W1Glgrp<zFh!Va^;epQ4WHHZD~3p<_)`|~mEWGn3S
zBn-eB4ipUsDTjlN!Xf9vsWnNoVN^Ub9GVkOe<z&bVK`%dIMa)8=1<`)-@{o?!`WCP
z*hM2alp{Ees5zDq-0l%PVG+F7BlvP6`0qprJdB_gj0wGn5dIV)@;yTIGy=vN2^WnN
zQ;rljij+7PDd`?5754uZIo%U~o0dpPtD~eP3`7~<DvVP}R-r)ZrvJL4E0jH%4Z1Qu
zx@+t77*PhZ{u}13`>b!%Tvhf_r+dp3D*j0)b3e^%fZnh(wL&|l3KnB;7GwD{-0E}m
z^-j8r;RJVL^fef*MGL`oJuP$~#T`Si@1(oXNo(B#i5X3^pC-81(|c)M@%~A7O@`K@
z7;+Jlo=}{Yu%4E*9esV2&hPCNvz#<!_(ADtT0G!qSbti=C|#Hn)0Ld)>l8X8zx|-N
z<lCKevGvi{w)ZZ4j=J`6KkNk^{t5jx|DUCuKNCO2-rn8|d3fVAsh=+X`T<?eL6i}V
zAuJU=KyxiOMXM#n9s@x?!y|KPjQOI~wNnDWrv<U4nAg)6I{h*?-q*-YIS+u;@}*J9
zGJ8I{@|^tyZJOBW_zI`AfQR4<>$I`kX>rapRQWZIFU=mBVv|c_!4@~Po@yQrxiFm;
zoSWiKxq6*Sw5lYB0_d*U&{-D~?*62^FqeY%pf!`BeeCzUl#kBZIidU3QJ^SYn^r>m
z!`~f0(^~Ej?C7W`OtAHcP7e#u@H^59hg_`x5myiPrKEYW#b2a=qm@&~Pg9aSXv;p+
zdBw%wdkCK9{SyZu_}-x{(_*-$O=H}d8eE(f?{SR^s-Ef=)4i+v6Gx;ogMy8xAzs8k
znY>qgr$JUkJerbBGGa<nNj_hks&$y+K7dDeCWRkThczHGkKYNMsT%94r2v8!0HQDr
zF@v7&#Qq2k|D!c}MZJZP;77alGijUm`tDD<m;t;OfavbBpqgPvEGY>(;ZX}---Ztn
zIi&5H{CEB$r&^Jl>pSA3xngGd3IV$k<ArigZNVG6l9L5TS0Y^2m6+??`-`*GInUjB
zfL0Gu%B1rz>kq&l?}%&Or^Z8JL$hD~43afV>i<&q<=#1Y(b%%!fYmRrKlP$N@JuDB
zj}_fBpS)KJ{0t44Orf+Zw4Yyh61aA9NZEaR`YnsB8}tV#CKbe?-IUJ%<F^m({nZp~
zF~8|Tc$?9M8$42NDJpmRk;A)fq2G?qY|gd$y=o5mt+}=E)M=`{eY@hW{qa^-hEpA%
zx*|4JO(Wew*4`_-(vZ%3|LtQHXPqzIz8lY#ukRcZ8q{C7|NOrAN^bvc5$B`Bk6E9(
z-yfBhq;wx1msY%B@=KHK;Db@-yezyKacite-^$fK7z9Ap`B9bSyM;#CWoo<ujo*I2
ziSTr7u^W=5aboGRc&Gzcn2d(CuxD*Vx?!8gPO3tTGxyo38}($0zl({jS%e{oo{J}d
z&{l4Ge5qziyUc&EP|?<ML!!{`sDM?vvGcUX+OXPxX-fO;q?6gTxYfI?*e_i83FVYd
zaSMT;hs#sOJ98T^BChbndEgUyE=yNb5AAWPhoNuKsK%~!`Q16$*I?1U6|sI!Or)Vx
zwyyl@k!*ccx^7_IpW>?x_m5|5&NckpPL^wG9ZzpC+*(k7kt`eohVpn8w=x!vEmlu8
z_nt7^Rj?(Ho@qlpt4zc?B_gvju$E*O{jIWmbOvQK63yj%99gdy<AEDidUub6c1~1@
z8kZg3u2Slr7l{btfR;u;U@3eqTU{F;heA8B5+p)d_pI&q<67Ngl_7Quebr&^wDqZ8
z{-7S!XTk}`ts`7sT&$y#x62}u;>%Ba)Fu?~OcI7wC-l{ypLw77sD4YORsDs*?_>38
z1mp84VZqmXv@gx;JWXF(>HX1|HP0!!#ee?dwKH!n1ofVI>za`DcvL&XK=Yl??Q5Fz
z9G{k_>W{Yz{tx8zWBk`%txwl}|Iwo07!9=-Qv^k#w91^lEE3Z6PPA9@EDV3m?Ug;r
zm2?h19+73bV6C%Wm0_s6arcp<B_E{%|B2nQr>aUkV4=HE+*Sxzv(fdnPw#tg##Z*4
znMC1L;gsQ5BC5Y#1oe5cexK;?&sZ4!nM?6b92Yd>dM?dr=Ar7M|68u2HEj0wb;F~L
zM)&FiGXg2|caYD+2&=a;r|+${?H~3Vo&NcKYGmFQ1F?`;f}X*B8W}V$6{p}?e~P7}
z2Y@WIDrh`cEm3y>&bI^mEJ9s}1VzaVvL7jmv=yZA7f;ulM+YkoYa`(ri+vO3=qP;`
zqVCpXzVz8eXcowfV=E;i;UJk{sxQV-;ICeDsm6)%7tOQk@QP5XjcJ(=mChcxl~RVx
z;9W!ubL}dsbJd8%P?9-b)sLKMi?E*`yu&}Go<s2oPM~<aJ>%$<7qP%7#Q4tX^YKmw
z<&a&m4Q8sU5W)Pcb6LQ^GFjme&Uit^JGV||#ek&*^Z9XWLB+9z3`#8hnlKP<D<g5D
z_Jg+L*JWNaO0weV)<LSQ6*@8YDerqgRjccvc-q^qa8-q>)&#aZ)$Yx^BOw0qzsTux
zG;w4+3gYr{Lv{5ck%^v9Z3^wp{c$f%iyhoAbBTP@mXfB-2+xT8H7%Ttg=-Vz2}zlc
z$|%Usy|ZIy{dOPSIniG_cAy`=J0va>69*QRnyHVk&5eN<K*zGDv#z}x6urPimiT^#
z#r+KmVYr_rbMFR^n43n8+1z@s?$L{zZS8lzT9l6z8$WpeF8i|D(k&)V?Yzx{ZRiz_
zdq1aAQbG^gkfO{Rg)8q^D;Z+yO=4snYUEyjAURx~Y>*vQXwA@qs9t6$9A*2SVtT!Y
zO*P+}*3fh9bjB1OQ@f`iZ|{wJBh(PnaHUt?jn(OVmg+LE^Fc8pI3j)P!`DXkyw7G&
zq95w+Pc!|gY_xqRXLon)a%<ML;IF$4@193$hE-vC{m*&cSjrS<5l#TBu8-1Rz+Tbi
zoRQ?z9EB+=6ourvHX1!Gp7nA|?wEfR;;SdWu*jhm>Ox6YphVgjkJ1R$5heRV5AzbJ
z#>TATU*y!a%yrq#5<rl0B)M2@HnO~e1%EB<`f$+pq&Mwr=$JKodh@-vy+3-DllExc
zb4?a`FHFwy?8#G+)8g(h4+T8u<lK1|jmzeho;Y!ZMfy*foF86^rl>b9G8<)D3jKqe
zF0r2$bPh=ws;1jFEpeMY77e>R+9<Q@)gB!^!V#g0UhrH_qZAJtp0xTtaKd;AA$nOC
zpRrePFbGSPh*?BotV<{^#L-ds)_@8XIrZ`F%Po4k;D^>+VO96=6#B!qhpw1pliM}B
zwUCIpDF`Ay4egq`;wx@cjHTI^0ICj855|6rW>B1kGweXghxrs|v_*PjI+9ho+Jj!P
zHW==pFl`Xt%45tGBEolI#@DWLLna(4It=yV+hR}ERl#xol7VmzPRm>;h%wamsW(TJ
z8}j%jk9Mr5ef7>GY(QTrVu~!dT8xXN_RjKn+IT2PlLpTw%qEn{EESl)>6*Q;bXwlQ
zXZFP#ey%I=E0;kuopyFE)HBuW?N(Ck_oqSht{*Q89P18u9m6eag#>4Pts;G%V|&Fr
zlUW0OK#zItGUu76MbC}Qb$HSSYfQ!0rZ|rZ7Kf*UUV39)htzsdN|EE9IC^tqajstj
zH*S7?UuPK*$#-HvpI_p+TBb5Zx*w7;A){#&U;`6<BAk+<QsvJrEu{zy*$e84;*eLK
z9Ia70c=qRs?LpkCMvL*Lc;&rMs@H$nBcEsLLZpg{M#UaS`KO-e3fHB*7?+1I7*KF@
zxYZAnvYj*7i0H}X>?DF_>y!>jr&&3zu0(~WeyO7L_9||-bdojdQcPbzyViFaNmN{W
zMyFSP%RNGi{3wS4)kE-pHyLwlEU_DK+A7{|zW(Q<QhlC*YVA|jyg$g`JHJyYeLq+>
zR5z2Aj~6-n4@Zm)cMBdKud4U|n!0YdU!#0Y@#kgH!+|vYm6`0AVzSW3ZCcH0c4i+4
znU`dfdf1A~`X1Xa{4Mv{!B5+vjaU6A74uZPg#Bc<dyuOl4gx<03T7gBovB&oFm?$F
z&;`dGjo_vFdMyZ%6_V&N5UwyNu0JU0O%a1oL@i;0OfVo13?v0(SD=8;!r=auvYkjp
z2ui~vS*IOrICqEnW2HF-r5Bg1Hj6(szyq$3ILbVDTW~anc<J`j%3s42ra@7|O;nJB
zsNo!SzfXt1kf(n>i9soROp6>`i=qmHlEs6JUS!=_7|XpX=5a9Vo59mRBtB;neKtY_
zR`nM`9j(+ihEp?HPE5c&eV#&7p2GiuP|3&l;o?t41Zk7yFW~_!p1fRM{1xyI>mGuo
zAhs)u9GN81OM~#M$zqz-vZ4I{QBYS9yle=`|0t+n0fDK16jYG(8iLmaA)LLWSRtkw
z>TFbuQYi+(<HQ6<tCi!D_4io}<4|gbAVEHu%vGdHF<6wRMyunk29-cv!2vaE{t~DP
zUPt>VJv3Opjl=<1mYh8WX)-NqeOz{ZoUB$nD9Yy{GAXV(hvG<~hRrQ=tl*?&sGO`g
z>g3g5|8(FoFV#PtT~?#|r!8K*ZU6YE8WNZ`cGFU%NTQcnX|nFoD^;X7@7iDg)F8Fi
za+me5e+pd`b@0~uc>W*%l*CK*PtnVkJdy{SfBjP-s(-5BePt}!N|PdqCR+>KJ)fUV
z^-uNx`lsM}e=k<wD(PSkI=4z%DNjbKf12xM`NK+Y7G%?glhs~5|HfyfJz0K;>Ysw^
z{`#kQi7Rk+XP~f{r^}l`j&yg8LaKlIkFv@F_x#sCW%KzImn^McDI0fs*EQ)Lg@SUs
zLUOxDG(dxm`n)t<eDxe8G3yj}p4vbTy!CFDPB9)_ioA%wM{Ti0g3~26CMhLkaRrii
z;>wLfZzC6kwcEX*c5!oBAE&J>owz{`1(5shy-5t235tN#Lb<pHo6LnZTM)dn_#iy=
zuYan5yEG^f`qw{20<C?{zO*tr1VQAIuZ&DGO|RaFE2WHqg-nxgP*94|i{dim(4|!U
zfmM!U;PtgEEdng^hu_dBnNeX#69bY}8PdWab+My^ibH2c@q3xl4)?(sC!?kdb%yJ1
z=pj_bxD2XzkYg5v?#wcu7Qqyg#S}=A-gPFUqL_hGl=(hN18_GKKYr~j#5WSH;!KjP
z^|RPazIhf>ls{S|;;sxsC^ZZkIv}(aARH8`bU~D9;xyt)^(@DGc5$f!LFJ)n9|MBq
zB~FtvP`N4Tw!sij$Es3ob}13f=YQ6WLKZ9gTyPf6PbE+jA^JpsFO@)5frwy`W^>6g
zR04H<9TT0L(}$)Ks3ueb6^k}PuNZbBO{PKS{}QN{kS5I`flgp(FiuYY9|HAK!_Kv2
zdVLackj$xo)(gfNZ32j!ARa1#TAOk;gw^2#xIAE}TzAOHf5;b2ps|Cz$Q!B;g=jkC
z8Y2n%=r3kyS@GjFr1xoHw^AUlM!o4aE_@Ju-wR!M1)ZYnVM4_Ah7ts48_>{TRP_Cj
z?LhP#wna+RFc@h214SiJhx0Lp1d^CbW7(V6XA~CB5I~aj`Qn!Nv`r9<N}xIv>0vG!
zDx42jf*3g?C#>-vLttrY_b_1OjvC~W<4|Y1*_2nlf2Lz-7CAqf{11VO{9KQ!XnXlm
zGX%DZvT+`q(j;g(lTsXqG$A0qP9Rrv5Q>0;1>*!~DN_0f{!AG|3Q4OF@s~jD#5K#w
zi?n|uE>Q_oB=>-v$TX7Q8O5C`V?rfRB|P404k=3@#Wd2ThRD=N3e{Q6xLAr_4^XM|
zl)O50LvbC2C?AAd@na;C1!1`RM_^e8l9chHAqMo`O-{TMA*n&wC?dtG4ZaN}kxhrh
z*+_hrLxu!Y%RLnH$e@bDAZOwrG8f5T2vpom79^1O-gxLjKpeH-kX*qiZRLIH-=Zay
z(OihK3R<_2#5vorZx_bT)MOHjRNmg=Dg3SyOl6<RND4|an8dUnsJrsuj0%CQ<jxPp
zv0+fK0Tj$(FfAJ+JUTdRWfpjT_VJtZOFBrZf?8pP6u_8S4Q!mT2^~0N^Z61=%;CXy
zu8I)>(W64jy!I6pO<F<@bvB1Hc3TMqrxG$Ra5aHon}n~mZ_X@$le|yKE3^@NhhU`S
z*=`+(AfNvra))}G87T;5n8G_Hs(*_8AODnsX!yVUQvj-v>YoBQU^pWRjz0Kb|8#(J
zNR>k)+{6aO>j6ebqqw4zOAg5rh3AlE$iMz6mR^)#Av`;zR1AE5@4em*f)87=eYO>~
zk7QIClrEN&oikQ;0E!=i#i6(}E69?wD0y{)OhMcIEi3~BBvLDDG7A#4M61DYP$-aN
zi0XLZ7zz;|kH`X>#tJg(hGjd_FdY1l%-KoO90CbMen)ETsV^f`Sff;bqmG+*k#okB
z^azdj0~$_IdHB;vRAsZuE!@z{FH*%={e7_NXFMBmg9!psECz_OwCr8`Y!MA6+<+MI
zU7%4XC@j#ps{mD7vlM309Li{)2Puk$tUVs>=wD=0cN7O@P{|*$JkWx&ltEEn;><=&
zLA$v+xq_M2uNWw~L$LgPBdrI={u^bjZmN1I*+mk``7m0s$Nh)ofp{iR|E=nyBQVdS
zMk9~!$a-VlmeBKI$@~_{M!`tttq4?){Jod0R5h~p9(ngH{+=7!2)csmMA0s%Oihx}
z^mbfjAm&ARR1e~>eA)xlmSN+pN8$7#Cz5Bplw<4}ard_5sV=tcW}8txo?Zpy$^usY
zeG0z(o7}fGAUDxqvM-N@ZT^t@s<ndWzja@Ng3ypgIenEADnM#QMg{&R2P#7Xl+mza
zDt<bEJPZly@9-4A;-!9oI^H><#%8!Fe5K;2T<j0scBGHxPL9Bc>r(3@WNnNKl9jJR
zw_PEVY&SY<`ACR!bGl;*lp5XcrAWBSnas0^PwbYtyuazm`9xpl3Mx}RaYCzQC7t}b
zy;OzlY@jr9pn)q$y^JxnRYogn!w9HOAtju$Hi0eCU*oL@&&8;3TV!4^=|S~wsxs9s
zhlo>v_nQC8r?rk$`E<}FnV{zk;`AVjv$4_mq2LmT?k+|Y0q6K_P+8)1w1T?>r5{JI
zIHY%sLqQs;^y&R6>|gnG|4V@r4yvKzt4=6D#XpKX(5el^tY~Wel~0X(+ByVdWB3&a
zasUJ)R9@>&eChHJm8~DhePjbwKHW6dIK6UPG(KNmCq)m!(Q_yjOy-0Pet1d}k@=3?
ze<U{vxLJTKaf$ujTzuA@FnERFuZ6C08Ip9e`q_i%N<zmznT-{9i_6hc9R?pC(w5Jg
z8`l23TGNv7LWr})O26LW8skwVFC|}nsB?teoMC3bmCV16!kjrfEv0>LQsCUVP#h;J
z?DZ(S#vz)DpAOXuHUSNx>iMCE@0P$tRQxpfFMb-8bJ}TC7`G=S&o$m?)D)M|AD5Xx
z(5s{s?ak5^%JksMSBOg$x8VrHyhqxM+i}Iev4cE$Cc#F<PlsBK^dA~EbsIrij2uA9
zVZV^*<DpM##Th!79%H~;kCNM}d>MewhrguSb(}6fLcHpLHXREn5XOFk1(tpd-yYE1
zC-Yzi?>y2m)jy69e_9>&`QZP7pB4t_vaQB6I;#K_OphB15(s?iR3=(Wr{KV>o-DZE
zgl2neGMPMK{<<N}wDC81vV|>MVc4KWfX5kcD1>N^%Bwg)eL6L0KN@GLYA473PD;y2
z;>&RI&JpK2F1|me;h;Bi?bON6A;HM|99)C8?)$wnJ%7#9SHF|_qgss!RPz*nVS>z3
zJg|Pd&!K>7o({PD*F3G))?Y}FoK?aMJmL4p$*4d?3v;Aw=6^evw$+k~dZ=?f!g=bZ
zRSe%lNAUFZSczh}(kWxcb{&yP<E>9$RAx`q50ig1QUzjtzk*{k44$C}kbWzEIAeeX
zGg$KU_&FH(3p|t^esbKUIwMxzuO@Z{gGAcor}M@^X*p)9@AO-VS#IX0or939f}lkj
z@sXl^1(J7y-?s<6=S&eI9e$NYqi@PJ9Onh9l1J3>nwE3U@mv9RcP&aZV~)529q!xT
zcYHjraq280MyQ>i^F3c-9-w#j$JMyk!n5f9vNzpFJfWAmqBb0RZ>_kw)&6o^TlTy8
zus<>Wmr77+TYv{X{nHfZ!Z{1A&ObjStvZ#<h?yrVAxZOHp)V7pzIxv9i`+MVCdvQy
zL89H=u@=m$^HP!$8l-EFaz?D@U&MaD*?oO)idio%96z3;6?-CdHG1RZM@;-m;C+4b
zi*FJSK0lV|JG=1Umtcp_gbF^jgXXH(x7&hR;6F1NKH{!VlYA4-d)BtzQtWtFeXDD?
zRgztCE<KIYYyiG~3(Wx^5%pDQ9g>K(HXq7QOz#@uF-|YZ9^$a-k-MYikXVDZaO_zd
zs=q=H&OKF8No-~kZ1Bew@->#$nO;n+4WfnT#*w<=H!tOnNtGwsncM4cJQKY8<6Tv{
z+m%WmneU-UF<!Vs-ZR22OXvhGHy;AYef4T9oImf13Xoo+Z{u!_vl}1n4gOrVs!YW-
z>PM@Uv?!fvpYDmj6I#8#CcyW>bB&n4L>kNwD)vxGM_<udQkF3hzBy~x_{C4?S}j@H
z+}`O+-EAA!YjVOzzP;RUFU5Q~&~|ZwLFtwH_d@wN)#i~mtr}qU=~jIOLwDSIIK`~-
zBXW%?Ee%8(db^QFruRBEB>f)*<q!DqDmF(*-!LDMy>aI(y)F$KzS<*~6<_R}^)~6x
zA708SmPVwQf@d~7R19kfmdjOx&bL|M<>;LzjTc~}Sq7;FH|F!3B}WzTxh7t>&w4QM
zDqZ+;P?zmaobkF<{Cek^utjk(p)$?_gyy-v|E{p0;?E7dJ0Z(ZV59b?Tj|EVaw%?6
z`Id-u9>MKanId9MIZ)ITZDS(Pyi<ZG&9eGZTp8^!>VGHq4}aH6!Rk{}#%ta>OSj^R
zG4d5x7Z!trZ2ruYz-&3j>T<>TxJuXSgs%(jj!NDs+a0$!fauk2zXMLIRsLzFmT)zI
zZZz?#RY^Uv;24AyHpU@nToyix6&1Oqn>QzY)UIYTo|~u1P?=m`^HFbSll&~+vVKAM
zR59P#=Tqf3#rfSY5Bf!ZZ$AF?F>>uJ{+VdvQAw3cVvp1KF~>ztrpL9`uhLv!bl$mh
za`dfV^z``tps!~arlg8Nz0>)XkSDFN2Tt(_%%{hPVWTyi7G(|gfJkBxP?r`Qhj$uS
zxgNn3x}ALDZ>ny*j$lpQCP+2GXmy|@E=Ov}PZNdFwG+vGg)QyOq$l|D+#u6@c&hR2
zA|&OIEF9XBrct=acFP|vMjMf4xB$~Lonw+sWlJ$B^J0HkkCw=1%Wz>5=ejeB7QM2A
zXK24;&@|n@5VD+znRwPc3vFRpuw^^(APMUYfUZOFIl@$l9mEg09tY2Tu5ES->!swt
zAiF|$q23}t<IIde`8ml767ZdRGebAE+|rdAIQy8HiQ3D&+(HRa*<WKusrd!58WQpb
z0b@?SYDK~@A2HssXQqbvIeBH?iofF~^wRB$T7&N@s>V-V+Im^o+q0~EUT5+w&!ZB2
zqLj2?{BxGW%QvT(BxGv3#_T@s2t7BJRQV2_^2~l!JTWAt@O*3{#<8I2twf!+*_f4A
zl6u)Z!B6wtyBAScVC6qoYV-nhrc>UuCf%y1LCXfV=rtR&tW!t~+T-A88+?t>U5GC7
zDPFb`#UgnvMg45)jBMd7Ka4rRRBL`FrzpA>zKRo=W>4nZ2C%RDgII~D^N{Fhd_DRb
z!L(r99xZW`?rAu!LvjOcy)O8^IrA5rjH?dyO56?l2eLLPr4BW|=kHreHrQ9moo}cn
zH<%B9x!5(H{3z-C1HEq>=bi*QK9u5avNCyQU+~58!QerIzhsc>cZRv1^fR>AtiHIv
zVt75m@wz2Qc=LSB&YMn-n{D2YH*KHEUFc5LY$=sg@U6Q#_hQ$hIn75QP_*0W)m5(h
z@aOlf!vtR5EZVP?WxlWOHe(mvqfy(t>ThcC#WuI&QT1Qs)GWp<`qKY}oGx;Ij~lz_
zwpYR1yK(;e)p!4coIYoC{o<%B5Zd!S$?tXMsnay?0FY-JOMi)qobr+A9k=l_p6(}S
ztwkJFo+Zl$%blw6k@?@Koc-ktQZ8KX5lji9D{K7_8BM93yNODB4Osed<WM6&x1AYq
zX?b6_b1*xBpd7hyS?0o9s;Z`z;Iv7jGgJu{Kl7d0yNQ<LHsA2On6|w5X`pf^?+B4?
zD7S0DN8lWS$&hEScr1|vmcai!U}`Hp2AA#R{O-BF42i+?>I$rBfS=fjp!b^gmCETH
z8oY_pu`XNss@wH^m56{EEBLd0UAl|#SJ#EGg9`$|!t<E>ypC+i%e1(cs+a(#lg15h
zNELmh<6gssYai9Lo-uvZ%TwF`9e5FS`g!ufo0u%8CR&|^N-$y-;jNR-g8t~iFeQWF
z1jN5I(tF4MblsSf&HM(^q6=J5fuzfZhXhJ@)$y%H>9EZJMS=xqS1SfP4E_X1fz>|9
z`2K9(a1Gns9msuBF(FY*f$ARl3p@I!_0gY{U3xFL2zA>LwosvA3rgm&mq9=?%fEdU
zL9yjP9(R{7db`&g&d-_b$2?JF%6S;a@bcrXs>*Y)X;3?O9*U%g3RBZr-z~{^0(J2N
z>yg_!iwGz6Y(_V3FG{d^4$*X`L_|Q9&t=_~bvxaC(JQ(znMTqE+#;VH;5m1RO>$0q
zs=W1^Y#fP^2>n&1`0*7>A$jxE-)!ji69p#E!pkpUNwu0Qi7}N?J#~7qI#oEO81nn#
zb*r3oNe*pRKK5GC4wcL$*>iHtf!o_9x0G)``pV?`#fv7)OyZv23{VI2vPMX`SHL*%
zn@q;Scx0T!Ij2uYk<q0bMM}>KY1r}Qw|*~c(M3~q^i!mw2VRvr876bO|GL)$6k6s>
zlSJC)+hfTbtXH#@r8X14Kdj})Z~MZ)8#AkSM0?9#H1i_a@N!?h_MPai)CDMc`QKVT
zd^$TaZ<c7Q>>+UKP5<gFaL%ieyE&8rSqToM@Tq+})P4SH^ZS^W$7gRP$d<yd>2qMZ
zreA%^vJCZpBUMLG5ZkUN?<q&U&LoK;lMI$uzOB?yd-e-OGnaNE=(Oi6ZGWSX%D0{?
zHr;V--H9sQShgMre6`T(b)XIX;sigXlBNy`u^8l7Bk{C9)PZ^iR<!KSZd6mS+(STW
zz&+EjC+)3irXU+$t`;z|l51+3`SsW5Og4<=OCpybLWchks4IRfzqjSE=5&4GOmyr_
z6Wh$JwtIgGR2-CjhP_`tcW{#RHj>9~StqdSw^S<yOV0tF;T&rLF9g4aTKy$Zq0HR&
zw%krs<aCDHot-Ckn(J~NPtXj{<yNk9J3O&@yg{nG3G95ydE9=se3w<b(^a{z&v185
z^7F88c+(S3H6k!*62lTk;M!)MqcNLN1Y3-;P(=j8$;8CjrtxTcq2bnvQQM*^_UE%R
zLbgo8CG2a{H#p*8BCD<A0xTl$BShF6sB2J07iI*r;QPBF{Zs-~<b~`J!f^>H>fob<
zT!gMu1P+*sJK4qW>{J&jjCxZER4Tc(DENywl{zVou#-5`20m*yYON+=7AbC(Ut_o{
zIgFrFV)zm~DVc?kywE1@$014DmU2>)4hohg=fd=iIqowGO;VsuEwY0!21h9+C4$lx
zkTKhXx0+F86y&jnGigs_e8MhnkS86s%Qwyf<Im*4<SPs>Ds)*X1~e%ue^FdkQzYjp
zoqmX9+KE*1Yf^IBRf2oUl;b)x^Of`RRaWhkf$FN<kEs6*l)vS(U0BR+@_%Z*2-V#C
zR94Mb&!Mzm1z+|O$o2@6VGtpB(2i5i#QBJPfiVdI#UA?Q=(Z|MyyWW(e{UJ6$h^rd
zw8bAYph>T)HSDP+7)45YB!rLBrfb#Cd8EZ?sZ+AYd8a_8reNUSBQT*r5DsL?e6`S`
zu2)A9sxQ!v+0#|E)a%;g?B&$|rb<qFr2piR4&4s_AIwuKfm-aL{t6^#_(~#)N}y6N
z{a*qV;q!kIs7l@fk+eujF0sD^Dv+ie$(apfmJ4J)jRSc|;gD^0+>X1N7rB_SJZ1EZ
z^*6qD{WVY#5@DRCzx+)<H=2fNm_?|YCOGsZahY9=Hv3M*EKgvP+Z7hE5*7-iQU|j%
z2U2~zN!5OJEf=Y!P%u^_XLk=e31e7TGP)nhJNXZR$`u{&P5MiqR{u+&dRj){Sm&t(
zYLyj@__?1{0+sZaK+WBfJtE2K;HtO(B~Ta7PzhAR@cGFBqd!0z@vvQ(U(UyuCaSv%
zWAMBAAp>Wr509dUIxwLxaIi|Z05YBL&OLweJe}KX2by3<r^xdcVjL{aIBo<voqz1O
zn6KhQ5fTeEe;wqU@Y>|`I=ADwgBt(GjxRVa+`KtZddA_q{nJCZJk>z;eWiYX_a6ck
zXEI48P^)BD+uf)H>b8Sg@S>^p;<?q=qU&eeL?FCu2ePv`BW}CvKj0Go5~u_!fl6W?
zCp#SC=#Lj&gW*g~tiLN?2FxvHr{6qZ1&~fY=%s?UE<n?-1(ywqWDsw9(M8_x3NDk`
zd}?C)oIAYT9hoj`I<02-y8iGnQQIHn9JunvJBZuwd`B<gjjy|dP!f;f24ldr1GO3p
z^*tYr+aP25K~t|an{1e3G2B`af#E^99mTk9#RPwl^r8}|#|N_Eh<F9t>%IW!>}5_Y
z<xB-Y^b|uvTbVF^{Kr5&1c+H|L*R6|WoH7q^0-smgxowYkQzG={ry9(M0~H05dGOL
z_A^`Rr;q&4Z$i9%8c)F5w=Ns}j70tPGt-LrZD)aEk5bo)F@NG{#T$*%yyE1<lvNdD
z!X6{});BCt_G`V!;Uo1I?Gh4&u#dxk2~@n9HJQhT9v}SrP4L}VWC4{xU4+j4kOeG4
zjXA4-RGKk>>?UZPtPwne#{TzO7~p114!p4u_7aVgwL~W2?8WR#SW<aZ(v6o%J5Rv-
zvDc%XT>l!|tHyw(iNm_LV>4d%uxVfCbyn4jsLAE*E!|0qKaXE*!<}m3wTh)>i?vSQ
zGA8fbaxVD6pX`(+<(be}%~$A$wnH<v46q-2@)iSd`ILAIr0CQYxA0EUt8-WBVl2NE
z%I(7CtDLgr;A{;Zg5J{nKLD(U)91I~OkaSk2f67bzBy&l$={-6b~bxTce3wM1pDKd
zc%vk<esquW4Nvi9k!`Yu=Xw_AGJUj?J{M>8PGm1?XQ$-nOupzrYhs6i4wB9}&*B!h
z4s*yVrZinW&<odDyPUJCieYl$#RHbhc-0|plU<zhal2f*7Jd4YY&nuZPO_+}gpyod
z<kQYP`aG2?iqM-Z%%{z4kZRFzcu~+hy!x%2==fWtmRlk5J>l_sviw;YziyrOGM1#o
z7sv1pPa#-@I=exSq+&}-!gPvn{>r#pqTg83)ABB(;7$I{qwGTp^h85W^HupL{)*)b
z6`xBg7T?LCJuMqMD7z%#qjz^s`73{ya1O#uYJx7Oz2h`jt7(p>ajD{WgxzL$Vd9?e
zHXg5nKP{6it>!<f7I&#;+^Oa%?N&IdG7zZB;gU`$$h^oCVRW^|>}i#SZcQxz-B$(O
zjsm6^1!DDDlFo86?w81Zxlo^0TL0mf+?CI!LVlvvxM#&)8F_e`Ix(x~*oMaWhKKV^
zg992j<0NNEjeb&cTZ@g0Km1vaYNBFQohZ@g6^dWXE4;e;;9<~W$Eyc7IGay{oSNT1
zZT`L6yd2To8}aa!cIFJ+aUwe>`lxBy?!iteIZ~&E=65x;d#~eLHk)2jd}&hIE~<P)
z`0$Z^iK&PP4odW>E)o;+9gy9sK}+E{M~@`7788I~ZVHGFAVO_qk+}tHEBS`K1;)Iz
zs2+soEE;J7-<Iyrt+{8+!lZs{=ddOxA;2oI%OJ;4^t}!o*md`ISL6GqGrHY36T0I&
zx)(WEU^t=ti!5$%oZr*tD#2dz`>s3PJufakeXV!>-S4)3^Q;9;Yw^##*_9C$YaB(C
z`&LWsM#<<y(qpG3k(WiV$pN08BV~^@k)m5Z);OwG>*(#-dGlW913`(?U!$3efPRFK
z&!^&{XYUoxB@S5}x1xG7hvCEL%d{^$Twm_)y>My7^>{dBA?K9u(GxS#HaibdY4+?&
zma=<iw@I8uV*Cr0=b(75(z|Lu5F8biOnrFvg-Q;~rLhSZ+cA!P9%YQFC0PwJaYc&A
zIohj27&~?)w97j6up=Sd&k$uQ-;am)dZzjdU;OSdh%puferO)PJ-zBY-FpF_d?{g@
zKT*_7wB5x&|DNaxg%v8+U{%fQf@L=ZJ~k)O9xWU3A)rlgURvr*i10;S;m5JYG$0^r
z_+{Ox9*Id~&Lo^-^A(|`{eB(9rPT%U#_@Do`CP__xg6nl1s_aK`GphKa7Lu7kprIU
zsyv>T7CFk0(8|>TTqOer{^k#Y+Y-x8n+;1vy!iuv|7UR^mSWTaeC+pu^oPVGL~;x1
zWXtDegjNf-mAYdM0t_#`1G`b^Dk#(z)xGH5!)NT-u=}!R>g0g}#(QVVk&r$yew&L}
z3?htPjK9GcGV*r8qI&7i;?f^ay74u^kFL7@e@NVR!h=)=73lT_cK?rX0N{iY<@PzY
z;&Vb@H)r2fwRn<v9ZPm)D!Y_GlgCmC2>Mq+1w5V@@H|?S7wX{fHdvvr-ni38rA}9C
zl2=z<J!&Yf00hPwWu2D>3+`)5`SAIZ$kwvk*5^LwQ{2bM^rV-Hej?QrC_|}7OBLfA
zxSSUW;$X~SBPi<dh(?H(73)Py@ZnQJ%0S(%p1OVL7ttO3D63VV7!GH6Il#09^!nYw
za@0#c{qSwW?ZD~I!NpIMZxxX;CX5XFk#2GJEK)b~yf(<6CDaT;f|nQ0ttjn!t^ewh
zI6?^9p-A5sxvWpu>^~jUxF6NsIr=H^!-7Vk9M$;e<5g#E1+cH^35?Uc7L#3j-crKE
z5iOVGX|mh*tx@!3+5P16^}2(L9&YNI;)Y7Wi_kvN1OWa{iFn;H|NkJT^=$6E_H6Pl
zmx`4ZhO>n9uKq<%hgpP&O7w52-8~)ue?v~S&C~VMxfUh7%z4)`B5N<cy6=F>w%|Au
zplW?y(ex{WX471&w{X5h`oGBO(`$@>kyG8QqTZm9a)eiReWWgEy_wS7mhC?l+kU%9
zyNZ@>PgA>XWvr03;%<h{qctjWnsCDO)IV+f{4doVt?ZHquAQYL<c3@An;D7OTx#{o
z-o^3BRxx>6dY#*gyvk{Y+4^0(tCP1ccUb7x7HPe;b``9<A5bm+t|mb%j&&l>^*$n1
zOWXR5GQqO(>ikcGzQmU!<?s7*jQUUhlvlm@-pQ!`VJ@Fb+YF7HyH2(`je>AuM?o*o
zVAnZcC?9cgyqEQ~Ov%w<NP<>7AMBWU-H@svdZjNN@`|DV!BEYuA|V9D@sS*HGa*%a
z%olB$Wqq8mgPHx;XxoXbvq~E?L^(rxpF%t95}pi8rJ?r@v4B_~?>*<XW%e-G&2wTu
zVGiDQ*Arj++zu66k+>N-W$srV<#Jy_T2n;h1-qZ-0VY3;VQuP4o$x9~I3_x3Tz|*|
zQHeQZI(z?i#QZ<VX@gLO)|dM>1`eJDW_R&fU`&zujr>{Jw8Fr^CM~z|fCn8P)8$<%
z@<+^7v$6KX%w=LeQS$h3PYhPJLLQUr0N7<3O*(sxA%-uV?gh7>L@z_78yshInwA`+
z$Jy;Hbwi)-&XfjqZ}l;LKilm{Tg>ALXv@&E^^bhc{)-UHpxv=RHs`vr83{4kQi&Qu
z(1@08YumC#oh|+1cARJExlN3CHrOf{HmY9^1Va2;W-()Dn+QM%XLvzA4VyD8@;TzU
z#RZNn06s&Z%|D-rIN4IWM^5A$f`lDw1hYw-{Vs@>@!j;AVDGvxJH;pR;?|2Zn2iK<
z?Zq5n{!z_41_c}dz%<yxuj$(0Sr7m=FeV+N_5|Sny_|EZpqv(SwQXp|$?#;}tJSFT
zh%@D-rF`h+<$~>2i&c7;*<oGpgtt~RW(Ns`x3_an4U66--f7OC5AHUIU66au40tYm
zt)=5*{U?@!Px;gda>;@f`}g|GLZnQiXG$MCcXGtP*YiKi=G-!AZZW^=M0HRxh&JMu
zHR7$`_ZJ33E34L>JK?*HMja{zquMu!TQ;7yqt4g<*q3DMeQ9{o`;z~`glo5NF+s59
zk?RRdF~<j!)L26>9d#VTsE8$tQdey8tUc3T^#mgM+aWwH+o==pa@6j<qtPx_GfZ|~
z;*!*_I(j((F}a^C>Zxs_T0FpN?2n^n*r2CjZNi_k!ijK_C}^g`=nZfnMphQaZ@H8P
z5{XEc7hsMUBn&GAMr2&tTv}G3DyVF#vYz#)WDORMRIhdMcpv>5gl=qZkOY-MoyHUX
zWl%BH^?ric+hkRSND0ZRCH8{3{?p#<PyiNduF|6Ul%E5~z?I3Xe8XHha)|pDUoB=A
z&Zt<s=-jQ6tQfk?YLmX}`~gEo5UWzgzafQjk5UwEeDdOnb+C#}NmQoxSRC9=^5miz
zAgC_GcfdNIG~_CoCc`R!_)`4mw1rVMOjl8Y6!d!k*_mFR92r6e(sJ5D|BLO!#a(u>
z4|BFV_vp`E2Rtg-67W5nK87w-C<r+bH2$_8-|ffJ$}^MUXEMu9tG@6R)~1q-U~8~3
z1TEo*-_!7L%x6U}?TU5!+XSC7eHn`faXI}!(;EW)ab2<i5WpA<D%N?~OV3rSabPAD
zHgA%Rm1S~jlw~&&c;#|)Uqae-g;vV=N!KdnE-h2Tb6;Jg)8Q;!`#~U&o*mtQ<w0Fa
z^p|(3f%(;%>;OR-sSj=>hldr+4L>fva+C*U8`-XjxM+i%KDroHHgMZ}aHlyRm^*@+
z9{`syU)@Yb-W<^+v&EgC)-Dbw{Lr`(b=5$j{OIUy!DI+{X>MS_(bsumP`>r`SGrqL
z@^`#6{DtZzFZ!5RNWQkBK-%v<_>fMIn}7M^#%*pot)!s*>A?=y+K>kk-5d<$(Syz}
zSHFeV)IP<S+FkLz87e+JbNapz`m^haoYKad9q3vT9h(=&_u;Y$SMK{(fXxtPfC}52
z+KyYjoNQ@8z&7xv2DW$O`OR4KCy?k8CvAb{IqY!C#}m0Y(!{Ut>mrC=@QV@QT<+Th
z*_$4;L2=}=i0u?3CU#n%6pf2ORXerGMXts}MG+BKgq0=#uWRyZ>7GoP8FR0>zs5bQ
z3{ZWi4}UG_<f~WHG#N@@;^5kg8?)TH&Hd>M^8<Li+A#(UBTEmqmHCZZjYkypGx<I~
zEDp|zQ@!<FjkUg>E-5yTEv31&*J&L8*w2xePtN?Tf7^R9hBiVk$A&z53}xH#f1aB8
zGb2Hw`Ni&jTZJfdK<VjreDJu(zUvV?t3W_Z^9{;fMDUD&h2Y9mp3*_Obnj!;ILxfq
zjG0U<7tPBRai*EeBXW}qes;I7z7;Ti{Or;qz2mJEK1WA7pD(bC_u5M$v<ap4G0(sH
z*S&o!Os4auT~2k||D~(F+ukCm_$~Z)={#5}1=>)V9wzP6#poGpwh-dxpONq}P*Q8;
z4f{&lz-8JmCz!V!`KD=*1+i1p(E&+?u&eTkwLkj!42xiVE`^J*4MU7x{>=B(0e1NI
z+M%gtQf{`o)*_?wFA2e<R(-Uy0xlP=`-21(6!I1ff)ZLD<`IAX0t@wfn8M$P8}1&U
zglE&AAI<+XtiC9As<~Y0I77Z=W|1krz9n<#rBQlRxx4(uEXl61e(N#mb64zU*utGL
zGk7(E1r+)&^|{G4Rw)XI*Ru1Oa`iUtMHPf_2eyjodjzw(HyNh8QpE~Xj@$lU?A`TO
z)bGDH`uFrO#0(u0LrOc8A|TxYf{BPQq=ZO`Qp(UNB`GLF2uPO*(w!nDtqvd|B9a19
zXY~8|*1q@NYp=7;y4O1QIlsLBg6sXmb-kXi=ff1T^rTP{n-T~Au-8DdqI^hdJN@u2
zeLo&4KX$8u=I3BG&B9l5T%n%(U3b}|Mdvr$l}P7EbM{Uy0v6Lvy&2L60mpc=UtXhi
zqZZH(W;Mnkxgs9=_#K)(QY&Z}i9I|2EWm7g)Vy%w)Hezq?VGrAyB2{%Be++M3UV0Z
zAy}}0zUVT?tVHE0LSNzg<k#`$v7r`2l?O_Tg>Q4(jbAm%@3C+@1?%>SSM>Eq2v6gj
zJn<Lnh=dL5a^gMm%jT}~4FzWDCc}r_JO;-uG8^Y;s;i9pv~KuZrm`iXvoJT=WDRN_
zdeLe7)2S0~$vi@82ex}WdivUd^&D$-GgQyTA7Ke!mohS1H*h9lt9JcYf_$_lj4a3s
z>bh1m33*mBNW(MexH(V}c^)3805c9WH+DXkA4pw}uK9^sk7Y<#zSEe4zR~vhMVIRZ
z4~Cmeif$<wCqXkQWQb3S5Xw%8tf1-}{Z>$EKw(I-g6d+z4f1NVz7~TFj|scs-5r|f
zdD_y`f~=rk;YJ5fV4kI5A_eKf%T5O{gy)4toL>k|>W;Yb<s|gO2#u%VUks|}I<<`<
z?CIPCJPCgAhe5rjObJ&(-714&meJ2A9{7_Y4=|CH#*tMd_&ow9Z5>*<jBb&Q>Oj)Y
zZWvh!S|?0IETr(1YRlP>6;uLLyDW;VpxPzViV+YESnwM=@GbnkgLNu_SgIZz6}%-1
zPD`_G7qdr<UR{p<t)RO6QBVm8$xy_8O$_4(Wu!o~z#j#55gG4m^;<#JhDU&fzzc6E
z-qgV0t}&jZ=)V-yGPu8B?2Bcz=V1J?OU$uLJiHuDV~@GE{^+-Y3Ot2NJY{M@WLC%F
zn0_m$-1doQ+fGm%7^pxv0wEC#=Z5CsBhLs?!2iaelHdY3*S`Fx7Uz?mwjytPVbr`Z
z%A_Y`1=Z6qNjp4=krr)?6*jWByh4Gv5uUOEMvxU$ZB5iA5_)|j@t6d6B%sOlE9=e4
zwqymhIg$sPDt9wAIW_foJta;kL7l9imi?umrhQFj-tZ2hup}#}hOsGilj3rNpkjjc
zUkWNN^`8prU~&gpLB*vz|4~rK!qR(t()(o7J6Kc4ZYFJ(K?I2D$E0-I@DSz=_>^TD
z-5&+DUMQnFAo?dS+ICrgeHN3If;l2)AYC)4X-|ke5;Vrjq2GH<ue?gz>LEU;NU<ak
zQEsRUbeWJbs`dRi>VnLxs&wxRGf!xPxE#zZW7AGKWEsw-VT7|bho~)pP>~3eACsU^
zuPhl8o>*nNRUmsa^Rc{xDf3%!EIwQ98Q0B85a&wv=S;LoS%^-=jR0jjY2BPF1?-Xg
zX$EXuPr_b4fxYA)Layn&v{+&7B&FSW`|`6&#GQy6%%}`QAlDL==Vn1=s7$9-koy@F
z{qXIz)xnoeD2gKBUy##?{P2SO$lm-XEBP^~S8>9xp6b3zba?d-<TMFI5epzh4D*Bw
z@;=4Iy?mQziA(hOSLC!(xA3(?;hTuU+JeHm-ol2J!hayA9S%iZx^$vgxLicR=Z%DS
zZ}W<Y1uDwL9~_FuBZ?<Yiuqa~AIY{Us${ko!k1aR;7~&Dg(ici-%urAB1(RsO2-RI
zR&`6)*h+UDO15-MR~<_CR!XPI!s*-6qhF=4Q&8?f5Vs2ie5yo3nT{V{28%31^_7uU
z$~b`XU17K-`DCGrKhvfJ?w7wG0}T*pPDfS<6;=ozpmrwh$UV0bw=(!>D`nCuO0_G`
z7FMFP=>!TZC8jG<w3$|wvqVUhN<I}Tb%}8*RqI|=+J#lTr$k;0y^b0?iPMa%61`Zm
zJp{T*St&LB+N`ib_Ev>uT7}9f)*A;^H&4Az7^*U+e0@uv)w!-(X1e;?Eun9d47M&r
zF-i1`z&AE3Z!CS@B&g82;j2%}m#AK3I-gdvydL3@Rue2zqjBra*^9OD5;byZwSnce
zDI#zDFABk?-jJ_O7e;f=NuoV4@MwH!79~?gUv1_s*1HikmUT6pBCMeYHIedfk}lR%
ziLg{qzBOTGZ!dh^DRQdYr@EE0?w(|(wh9%)6#vDI`iCv`J#|%;7IkK6bvZ)~HPe~*
zDC=Dd>zlq+DNWaYNo&N_H9ou5D00v^-p9u+OqW!~N%l|OLr#(X)1loH4lgo*iof^*
zap$gP6Hi=&&bN9}U!BrHLj`T4_NkUt$~PT#4NShZg7QtvJ}vAs&58c?9O=#HhO^GB
z&^iM&^Udh+B!RUu&xbNxx&Caw@zZsKkn62FaSeQ;tn}=ajG`^*qDs}G78c+7jlzb{
z+;ximRl2L~@>Dz**yy71@UvhCqy@$0Ozg<4O!YeahCBMXK!>(OD|df`dVPhaLOX{`
zolIY+)@q|2RnzzB`lW9iX{S0a%{2O$cAk{y%wwXl7LG6vR6ikOtNbxS!ZG}?i)pC+
zetPFUs!G?HPUrg0d3p9bQC&KByOv2^9(SuUS8J0l_Qs^Yw8x)N@Z6#8PeN*u=~Du%
zW0>a;eM&PPa5q1w7n|7?&(5wKMU$k^lM+?YF4}5H)z7(Fnb+Ut@vLQIsA_Pg&)E%K
zjpclGif*O(g|!5YsUBlRbMFUV+WX)7<0M+TP5Xrl2YP0@`ifeX4*Q2hxkmKff2rqN
ziM{qiot-S7o=^>fI0kK-5u~X1?Go?SMcF@24}2@Cc_#WUw`g$n;yW?bDt=ZT=0}5p
zm#Ge;81{P5(dn3`bvVD%@aadxa~AN<2Zk%8;U9~`iEoB57VmXib3F>`wps=;x8L)b
z44oK_=(ZLyT^M;Gt%Q=GFmVyo&$Rn^h}i{L2pE<L-jffPC1{)pu!k}<(FB-12Hk=E
zU@^#{@e#w;z<2KX$cgKS!UZmsBW_#$G1un|TE!SwEk>T{-izPSxnG96=q~Q!;d(|0
z(JwSEds1$<$8Ni2+81N(oQ5n3L#$6Go;F|_$j+&%3Yk6K9=Q-63zcjY`vm6nzQFq6
z5$30SbLdaX4*{@8ahOp3$)f5BRgUS`@A!7y&eR!FSu|6nlMMasDO#A(bZQdzmQ#tY
zGd{%>O=X<;C!91pln?kr%bcb^IDH&H;*e{TQoMqUql3-6pwuLlF00905A>>to3SM!
z^9(U{1YOuKP1H-_(I+2woIdY9Vy5Dw^!|pnz@1Q|TmAK7?GvodFX^*=rB+%olwNhm
z92z2)m(bf!KGPe_GSblfdVV**1$v|`x^IZo!l3836lUXRUKWq%zmqMx=F^>}T4af#
zGb1O+83A8YPg(Y}0~lEY{bHt(?Mm7W%t)!oDXiG=Radmcg#lCx`P<DT&i?BW+8IMG
zjKHoC^$T4_Iiadypby5tY<%1&iwaK01h}mWI#+_j1NYggp-o4Bif8Dwjw1U<?2?r~
z<>&!sRMnCqbBTIriP6Z#?#t*E72nHb^A!8x^7B(o7`R1j6WKg9c9EW?Myj)L+%IO(
zy}<Ge55Ihy%7^d62RAf540)$j^vS>pl{^ILOfob$=H6Yme9(;+jQXUb?9Y*m=90PZ
z*NSHFMBQy{<A2QHS&a21Y38^tF=e8w6j>G@VfxlEgZF5AZY+__Q(x!@()#d5GxS81
z^sD)|d8+@*GkI;EeRt6^lftK!N~D-Z@{f7C@ptpoO@^j;ZDlSIeflFU-|gX-EUVre
zQ#U0=JILlKG32S?$}NQ0@a7VxRE%t%e*4H+LN-sa-I5A-*xvs(Pn`*rYq9)IgC7|z
z|CpylzuRQ<bRB--k9qpzALgmDSl1d_;*WWHk@<(}8V}89w*HC_d1b3>F3^CPlPx7@
z%s5HpH+o9iN+M~J3ktkl(MIPy=C63D?cTqZ;cm9&Pc~0KRnv}hx($>xG00JL06Y3-
zYt|N%%{;s{#L4tWs29{zALIF3OV(CtYAmq48)e*zIhcb_KjLCcy7Xrlc{dM+&z!hH
zZPzJ{T@=%kag>z`#P{fa%y0A5WRNir^V>Y_WP<BSp!JC8q94Cj00kpF+@qQCW&2N%
zJ5;U}VKMkcYj(QuBX2l>^grh*uS9cc87;eH-}OU2#Oik~@I7Z*Te5i?tGQ9OU+r@A
zG4@(SE5q=~+=T?_Q$ycnF2%@X<dbB0471lGX0?PnUfCBOdUTyo>8-;76{<cNKNvNq
zx@RmaHgGq3;+M?34E~!io12?Ug1zEFgcN=#>t()fUP4t6sH)JI#WuZvFEX@aSVmx@
zQ-k|KfkBIpp5`$Wb@@t1K!4TYFPW0O7QWq12@t~%QcbeTU&v|6?S{v&Q`c9GD{S7q
z&`7)f-K6p&Wr$>D-`H>Vlu;r6J-4i1^``6GmDnByzr$!2sHo?sw1}0e^drUv1`EF?
zvlp!_UKJ{ebd-%kRToE2xmX-Z7$L&W+-&o8)gOMSJ}R!5cc_o5yqM8)rJ9n<^@7mn
zxO<NzY#VM4UeEMwKI*Ytj#+E@#KiH$XLZEfBTzc>M5^s_?E9{J&X~rYTm?DoEz*yD
z$kn^wT0^wR-SBo7YqJC5vYEHT#Qfr25ExVIxR;ot!*I*=D_M~|oHbvb4Tyn`SbMSS
z-hG`M-woUm0?H}ad~AWZx`YPf4eN3ZX7eBkP1ZYyJ*_%>6Z~Dib0j<22J&_<eO4B>
zAJ-m|9vbd?*t1w(Ss}znad<eSO5{(Ca_iloLbb)S`+-6;*RP6vdlf)7PhW((iN>Xz
zV^bJ8C-sJY4d-Vz;=nd?D75&*GfS{Lett7+;2gBeLR)_A(C9R3zk2?ChIIGE`TFfc
ziUrw=vK9h3KRRyP#uN6bVyvmGP#C=_)iXroiPr2vm{<nDifB2<No~cZEIgc-d&+%=
zpUY2_0oRt*FC`f9ag*XbwuVYBPSZZ`WwnW8X~)@HPF)qTEK+|nPidoLco(^^cL#(W
ze(&~RuH@$wOBZ#Nxf$ERAO8HXocX4fFx`WA9X+a%42c`3E@tqJ)-Hzmw>6*P@;DTt
zQT$wUCB-5%RLX-?^vh^CL)Ci!skx}aNWdA3H&R!b)GtLoJuMbCH$wGD{XEa8(!oaF
z)om15E7E68r*<Sjnelbw<+cy1T#u?)v@#Ok3DRB%-6>{lQEj!!;`&=`bZ&#m)HM_q
zFJ^UQ0iO(DSao!KwRc~B%IQa^yz@!J?qZ#D14q1&p=g;WFPBRhzBMUfL}T-usPN_F
z7Ow~k9@NdBq8I7K`th%@v0NY0w~Xt;d7^Z;ywoT~*@Zm&MSAAGAf;qkS?X|AgFl|&
z`n7r6zo#?@EKS@AeP^KXy7yefxi$NHF3)VjRVlCfp^pdE-$NU@OruGPcOHF`ZH@B-
zwev(6e<l=QwNmhNCH4v$CL+I3Y$XR6j@0C)yV2UbPwJ>pu|=e(uYKx;D1N!>k-gK*
zaH<lQHaS&Ngoc#u{WA(ALo<fG%b|j!+|<`9(>|-qs?sG52Ax*t*4_h&2bSSPHzwYR
z|MW=Oy^nBL&_UWPCub#c<b=F9`NplfDbapuA1->7Kbv7X(aIITAEt2AL^b^^lkKR5
z-6iWpnl0C}e#;A-w;YBpc-qDaGTDX;54Q`2JkWe!YZZ0u(lry}5#xB3Klow073WTk
zmf|NdDi0Eb$t;=ab}-07sGSD;X+1=;5o736-^ugYg}umFHU8Q+tLtm8yM=Dsu*V;o
z3uv6zy___hkO$RK@a<yC+cx5myGtqj|0Ac>ABvrW9ZeVHZoD1)Q1Y<D(QN1KjmDoJ
zO8sDW@i2MgR;IDCP>s8mjCIDHXUEE8g6~@M%irw1K30+3ao1L+?&iRQvC0gXlbwdV
z$#BwGRi1{E!?ik-vFfqcrNK^jZBFEGO^uCJzv*zg=TUd-)6cOtO|W||!SbeaOyf0O
z8u#21>r5BVj@P~qzIXqnJUKb~e;9K5;r}G$)Uz3;=n^0=h5dh-bV_DUeO&DSCY}C2
z$DAtvH_Yio^sWD)aq60E{2!Q8k7uUA&ssdw%_Gy_rl+TeJh$-q-_4wcEL1&BuZ}3H
z?%Ao1TzHf6^-bc7nkU5CnEtmVi*M6Q>xO>TJ<X|q`mG_ov9WQvG4sD*PSeTEX=z91
zN=M;tM^1TX_GD*mRd?RE?$WlN(dyn;AA9Rpdn<Q)$;Fk$v+tUJzN_dP7+o8vZFpba
zGW5D*XsLf_W?`u9$56xm(Cd+rk&e-~eWUZkqto9;+qXv>_CM5bjJ0)-H|~!&f1l{x
zn(XSIYWp?SF*wsTGxK?KrhoL~>hP!DU!VH6KM#$~zTcT0otod8`tncd^wZ+R+~W7;
z#l@eCQ-@0v3tu;Wef>1I@^NKlWp`zEadmcob^hy*1@i1=Wqs*red+t=%E9L9#?IQ-
z&&|W1n?Lt=e(nD}IXM9U0C@r&QLt;55nBS0^ungyWtnZE7+&3U?eeUSNERuFneOuJ
zt{ALZ1iMZ}PR~=pD+Q)K6)*deaaO(QI+eNa(q!FNW_l{~-e)KWqBwM`@`tjup9<gZ
zt$H<*XPB+~T=#XsheG2@hmXCl3&%_GZ4n$7tBWQp?M4c2_f;29zj2xGeSYyx$;Ud+
zt(A{`Z%RKm5g?SDdNpOUZDI5xX8kqg^IfsL7hmYrRxI?T{O^!XKkPia)YN!%us!?j
z^ZTYRg0ui!kVJr@JpYnTt^QRy#r(T;+KMJir&;s@$Lp==|3W&QM;rW8IwdRf@pAt`
zI^~?T{w<x_V6GZUg#0hksr|o5r%(PD>9qPkl}`HvR}%Q%zZ7zUP>Lno+ZM__^@x{R
zk?~b8IhuX%<YypRI_1k_13O8zq3OOuNN0I_Ab2I_No*^Qr-erq1Aom;LN`a`gd?x=
zsb4zv>~0QCD#*b|SaalhpAm+qnQllB@k_0ww!GSB68#!AIzV;yr>a_MQ*_XK+OH<o
zq7~dieWEH2K)%MQ%Tu_^H55HMJ(|>wgCXfW3|X{o>>pj#B{4%h;L>Be{_;A$OSY#q
z8zV4ID%n*aWDa;%t&d}ZPDG!tjR71c_evccBj9AH`c*MbL2p}dR&-di{<t|?TC7dI
zVpF*@H|xGIq(`q(p#4|&0FTv79Hoj_liq_<aeDIW$^=mn!!u(21hisYR0TEG+t|H&
z68!xHQZ)*`Nv~6X;ar5PB%XQLUb2(Z|FzPzdcgO>ZS{DRs1q=Ai7)Q{1;a@6L3Ssl
z)n42A+y;{G{o#w~FXZ)^km){-2uf*PzTufTu`ltCn+{)k`e~54W$IZ5^696!yk(!|
zyJ{70dUCf?#jRfP%{%TM+2k22DUlxG4{c)Re^u2MD-fx?W!QU#@_rB@o9vGfO!g|n
z2-C3#rwInuN}>wDR0gsPjuxV@dkB?CBIqu~?0bm#fEilWJ~0#b_5%YzCTYqE{NPi7
zrS&lq;XfCwLfek!QUk}<@^FLU12Ig;cos^?DA;$IJMef9O?_&I8U*681-w55p8)rv
z`ovxeo|-^q6KNE{Cai3%mPzQB5d*y<TtlUs(ZEK*Z6IM~0b=Oe-oz+SDmDm`6)Xeg
zi}45^Bmlih^sqhIjmaVLnF<gXty=O`qm_GAB&_RdY}83Uo@;DR1v9#l!8CzZjx%m&
zaaw=E`s)(($i?#1=tkr4c}I9p{v0RFQuLI9RmimV7oJo0Z*6)4nN;>>v6K|~j}nH0
z+U(-suwf$5K(OM;xi0zX9K^4GIQGD9nkvM#iMeVxn1{gKmR{EH!l28xg1vF7F_Q)e
zcY55vl8LOsEBJ3)QCY30E04yh(z5$s<8)s<OZ6J9?^Y3fY$zb5K|1Ld9=1H?SCCjv
zekCxuFBM)3+@S*HbP}RznYOz-R_pEGvaaeGJe<(t&P|SbTob3KvK-6?<k0v$*o+o@
zPDuw*hX$lLV;i8ct!#AK0W-1Q`P&FZyek5x=;rjrJB5CiTU1YO$aiFgtCsI;43iBd
z=3;zE`SEg$l15yf;tmTT04wb`li=R;Y)tP5>1?338v15}7VeZs-y>hf#4i=bNLZ`t
zneH>sC>fdO1d(c?PD823f+@(K+yhTJa=5Bk0zv4}7}X0_*)Qc+R1-}k{P7MZSoiGm
z2fJL&s4-_QdSq?cqNbnk{H3GHB7u6t{9j(8l?$y10^aso&xwG{%bG`#5Ks=7VxiSo
zY%oyyIvbWCmXix{O+uP9&oC*dahw4dU|c=T5|&Rm0iKnUif`ykVMM>JY~j=j#w#W)
zeF00sCHFz<;|!a+weLLEj^LfGw>4F%fwVi)fkK&qy^zLtk2-BBTU&qa2kH&yBq?3@
z4pQB@21OT^+JK;F*R$%J-Yji}YoR@{{2S)_^Cb@t&fx>_tB;JOuGjNLY0@6*wJ@`j
z)GEh$I1+S2&tjk6HW!(4+fPoQV|RGils3&%s-fSpt;N*GFDK4cjqPSc#)NAYJmJ)C
z8s$LN;=?|+Fv&b!{b+eI#T4{t`P{8(VvIu6wWh4a{*&jiR?d=eW*S{Uko`(D^i_gK
z2g{GmM`!Vgk9}zMioOn}WWL-~#9bBhNFgD%Q^x#%Zsb9)s5GtH37ai!ciqwr3%;{D
z%SxF=vuZ=FtmOM8f2Z$~zwFQhb=#_OP7ZsPY~voDu;jd3UY+)=dt=|G5UI;M=P4H5
z)5FG8V%}ZLzYB9`DP^jR%X^gMLZt&U9&sS7PSM;8$9|yFNkz@oQBS_5A3U<-!-fRK
z9LyGUnGUQaXCGx8>+ljlZ2Tqif-hNfd}_bZSPD~lAkObk&m6AcmDY^}83kRE1D<m_
z@6z_$fV7Q}T5s@oFdv7h+wiEW`$iwihWBLb;8rISq2+qSW~GR?*hMCuGhU9(D{dkm
zwgomj<zL*`?O|y@HmuDwX&f}~^SsS&Chq=&6<X1HvrLN+dg}R_ve|;d>(PO?#-p_1
zs=ijOU~h6&!B9x~`5Z3T@GbE-Q~4TOr5X)28Cj&_D_-cr{4%C-!MpeXiTd{e6nb+R
zwt(mxKjyXlyKxlxK;`Q*lvjGfN+{A_U-Zl2d3)>oRh-ab(2eto$mFA^6jjZcW&#Q=
zJCW*5am%g%<5Nx%8PGKiS%-1gWbA>99C3<tUOtlaExEr=S(@8>nEB(<BKWNmo=dsl
z*VK}+50~iFS*(Y4;4Nyo?7?dSkNkmF!qr&J$)`7h;>BrABHpsCRQEAZnNd_AaT~#(
z|0+kK8N<81cfH@bk@ixQe}Ql=CRG#T?vB|c8i3>c;1UFsKRS2JQm(_VFVC;U76Z%2
zJh*%b)<R(9M$=7Tdlxb6g0#F7{)izOq%3)QAFwnYV3r9FR>f*z(Qz(N6AaB~Odx~~
z`aPR|_w0qs!*}Fq^)6>pz@eVvDM96#rVw(HE{DQ|1T`VS8i+Iw7!?34shCNjggIw0
z7<i5weaORDg*ivc4YFHiYiGn>9i)lSz^V{6UD|J5N(y=48LD3%a>$3S)4&QSQ!>zF
z8-hcFjKlOZVP|5)!nGk9JJ^ROIMhamsfS%yf^oRYP#8^?dQwezdJ02|G4|O+c$RF0
z5;wZdC4wxSwyj^znfNcHQ(2ak<^bj)Gy@AQLk+sqGb&Uj>YIC1=S1XyHutMCC4=S&
zR$8czEvC&S1Yv~R4Yh;t_#3FwPBCHW_M#S-IgeZfvz4!BrqGH8U~oy88ClE<k>Y`-
zp{W&SR+e_hGv--r%o0oN4;6c<LCOOh3YTy(f)NTpkn;kj$9QTpJXni(&cFq`j)S1L
zqSr}K0h||S$R!$9Q|C5*>ft94&>fX76R}tag8;PYrU$Q(=>ZO6LbO7hWX6Ac02L$B
zl;I$er@5zbN@O&&aDxV6MDq)a(Y8<EkGp?0)_wzuJVVmneSi}fy*f&N4v~xdxUKdB
zi4-7+^AKq`tsqq{i34;>uJjaQ0rB9>c<oX64_=+KILHr(nuEQnkQ&7ouoN^ieqa;w
zb=yw#s+@ujh2dO6qCX@bi|NBcXoi3&WlR(ipkD`pRZ^)Wz>jdWQ)N^b+Gnr#s2&dT
zpynmw+g0DYsEJD%Y;9|;Gz;s`$$TDD?ifXv5#eHBA=KhCr)=2nPc2bs@-c9yu~oD&
z3x`S&Z$59(cv<WOr0AL|J^&Vl%|j!bO)G35kvOIN)|A*2ZU`?HqlitVHll$I0Ts%a
zl^zV&dMaHUR2HD!J|8*$Mt(~TT~KS-Gl;dwmVb{0$0z6_uIpWZCUx+gb{fPs-V_78
z5pS<(PFmjS3{MyCajUTveNRHu7RWbVmg`l0-ev!s2djDF3Z?T#e6)s${36VKWy!|_
zU=S$gCXFHiob?s0Q%0q@4ywSUN)o9dnbZK0dPOKlT^J)<kPXg6TN1$3*bEpqf(r{-
znM8d5ir(3$ktKi^VqaEZ;k;O?W8zEj&`Wc+-0}(Z86udVe7)m~gjCr>VS?R55`|c-
z*crn-!(p`7Bo;MwRSZl0qfJ6|oRaftp3lh&+CPh;(=GF>q!OMN+`7QGjR*Hu=X)1W
zGzN(9I$#2Xz(qWwT7#51+14;t=vk)hcnct(NG)A}#*iRU%Gt*Nh&mR^GKl!$LU9(A
z$^-yRc+kRnVap1-%Av3(0>sjcWKw<!X+b6kK`<n=AQlb=0l#oy6cJz|fF`B@UJ?XF
zD4tqD&#V-agiFdNC>g9F&2tiMw&DlM5?aba4a(wY38D?_r&%l|#!}RRHx(xXxX*@^
zCa6-1#V2Py6TghW3gub%cB*E(l&V`t@c;$2Kg+<gqNQ{ceyV>-r>k?nrBhivY#|&4
z#v&dK0x=Yz>tyLL3jbR=joHunH|do2w{-fIES<&{Prpsr{fBg#Rx;C@y>m12ouJK-
zx_>Lu-7pEmAgH-`HR>DWk96ANw?LLoRf?GmQ>8@U4@90}%Kk+<b^I-zHjt%L!_-=D
z3WGv4IZ7}g{4dgJS|q2{zeuObIX{U1E}ark)WAys`<HYoy#i7EBb~bakxpg*A)Q7>
zGUWY{PDv%lSOkh#`2BCvDKT~WKbKC4#T8`f6#p;MDgN)$>A{QN(&^A&(y6Z3+lyrB
zG`$#hnDdu(S`_pT>9j-ow{)5kCc;maPI+{`e?hb7sCKbpukNt@C~Ib@Z#A%JS;T}b
zfT_2wXdaQJQ(P-gEMjrcV3Fhls8THAv7-N(bee$wkJ9NEw||jN(-E=I-_mIuv277U
zb&s7&tDbsVxzm!0+F7AX>u#ss-=tGtXBDz^S_Csu?$RluFqrwfbn0dJ@6u_Jq_N%~
z>D1-lq|*$S_D>{Oi!#h4R@aI|d3Er&becz`_=KSv`Xim@5n<|sf27k@pC4rD)a8$K
z8W-@3_(wYR{ik%A=ki-Rb(DrgVxUggHYq%Efr?r<w#zCOrM?eI01P7mO692b_WJfm
z_a&`KaKClL5{7mk4}}|1B$6;4W$(>nDaO+WUvR%)baB?5fq$&mEW^`;5Mh!ELtZZb
zQ95l1$5`WN7&hL+GtvE2wB>|B6vxOj*LIqd=k1tB?T&w>(=&gh)8#+Xsn_47)3QOD
zvA;{FPh6;p7)tO4<r6GL2NqMej(E~cb+SqmkEPfjM1wC-gImyv*s=JsghL`KsF@17
zF)Vp|JSpy-w(rO%(;fz=p|5(B!s`^Dh>{tD|0bR0k)_ij(W5`oX?Yp+2>}}K0z1Z1
z+)<`_Qbuu%N16XkI@N>Mlp%6S=y3wF_&fSl!&LDTq@N45^}kA|tG}hwt^4hf_#whD
z_%4;584m8HaL?+GbgDv@PWx2|Wa*Ta@(GUSCi(xr=z`Y#Bc0y(yL4KK8_edIUU~N^
zk%-pB{12p4%-^L`4$Ap;#NVXTH0;#HvcII$cq}IOk8~Q3Lu>w5(&^zJ>6G+GI_3By
zojO6u(y8WukWP<b|CCN$|1O<A|EF}SNrIP?rBh|ZMVJ35otnq~Q#uvqYh$gV!JYWF
zZCBEKucA?;viOF@N|n(BiG!bNlTQovuHidG92y>n7SpFqA3&$wLrI7)=QlD-N#9EG
z#Imq+D<QEpbgi;?#p6He@*QHrNbq{I$<rH@^#hBq6j%RmN~Z>4CJFZ!hF6Z8gOWJE
z@el?1`C56D=YMkkmQG_Buw|sR^|clYO_ts0wu3eAqY_o%y=M7~wK0qKL<5SD#%pIp
zu@Rrdq(!kRzCS`X+Q3<DLeh{$%m#gvC?gk^`TYhIZNb&l7AUz1=Gg$BT>coY*h*v0
zaYJ;`Kw({^bj!GZD<E!5@qN3p-`0EXZMBSc4K5b#jP2B-&A_2;gQg8lB@RQ$9o_nE
z0{4zV>CWSp9i1OL*Gk!qOWRd&lYz4fHW}@AJ};Oz{*;dTY4x7nk!n{fo#jDHdsy7=
zL#5q8&`-ruSeG7)gJJiBGkYOMdtNbnkAJWeO1CUOGsmF!4Y{^`sdwW(@3l$n%fHz7
zY1w~nzOU!E@AzZ?8JeBw+?|`j{HpX<R?|+7`OiYXUkxD241kjU$xevDJXvFRY&r<G
zXm2$C*?j4sZ-|HK`L+oTa<DEK3Zi^!`LylF)?nG;J1%nd>5)w8q1uW0QU8y_&Qf;i
zW$(N7^NPM-{Wb#6e%%U+K7N#W9CBvyJJ)ffs}#TV>Aj2-_siWQmpWr;Fg#EivUEyP
z38G;9OFE?>o07&ua~e^Lf*NG$bY3f#o7SM;m~LJ(PKbBFFkADPQi_DlK+etoMmkNf
z<4ZI;52ww9J?n`wQRIl5`tWVMRD}oTAI!)rDi(L2U^6{dtX6LQ&P=`Vr_(fRT>9F=
z^!N|+ze}fv_NE$NgyhFJth%F(2C()_HnH8QGR})Lla;n&JhpaT>?Y8~_ph#%+CG=t
zULFP;y~#asqGNlh0KU^LKQq1SO!_08vJ2j*eVsU+E1Xr{v#3%co@e&a+uE*H<I=hF
zvD+T&vmJNF-!<es+!)O?dTudu<g>RymQI~nR-(4YT+{ljc5=>(*?NjAfhkR$E({B@
z#_|{o46DjPcoSTtpfV<d>2OexODp8naG@ebjlor&?&7vSr@#1@bt$|1g?F=Ai4x8l
zY>w^u9R<08i?3Oow&OI}kEHH&eSfS+%`{{t>8c};c7L-+AhV#qdtmG-b<(nTj@w1B
zvpem}jv9s$<ue+6kba@ADA6i(=KU>w+4+Q#GcxK#b^QTBT8t*+#`cwlLHwj$wGt(4
zwDv@W`pI2hnZ^6tM%uiI47sf8gO`WmbL;4@7$iEb4jZU_T)krS&Y`?P=gKvYYu9J#
z^RF6PC3;*pIbz7aX6pXI<3^)d@y-o=Amf9H5BC;!jIEzu8xt@OPuxjl^9-k=bkKMe
z#_Uj@pDUy1JwZk1@NGhm!PQZpkJi1cxqb5HliNRUd(P{>zWG2+BNq&?$1+t=3L~3u
zMc`gx!GPIpf0Ub805`!&`dcO#hMg!1K_nEmkZLhz;t+KID-ZxH%YSqA;eyP*bwX;+
zLu-w;OrpQXIV*q^p)Qmn6)iQDRLRCS7Bx532*O$vxm_PvzJmvV+ezoe&fDZ?Cr#Cy
zB&Hop!9cib<Wr%&iE(!ATnrz3q-|rjZLyFyd^V(1rj5#|`)rq8M65qFKIPpkzq9*l
zu3)-)SxraQ3z3RjYmMAO6w5dI?WWTmR+?L<BJO<+ptcsJvqsg3&^@zzx_lPF()*59
z!^8+4+8*`%9msUO@>?u%K0;QI<XCv(>+SH#XP2X_z@6)g9k=+D00iK{0R-n(mB%1}
z&oh^&QcQK4=dAL;!zCWTxETcWliC6y4C~E-Z2e#701#ciHU`*SBnAvIVn_ra<>$m5
zcQcT(b%ZAY9O={C1>k|ea8=M$AV}kxi!um9uxAV7grqD<&;SJR(!AP<PUnrrt(T>6
zntUYeGM)w%O9lrq%@8&?)xm6xeF}~M5W7H;SJeP%dd?RQcIB~fqcAlJGxQrM1&|QU
zBaTt-ry9GUl41ay&e7g+cpw!q0|vxdIDm*y3LvM{xqF!j!Z{eo2@JApxR`6O6G0K{
zmUe>om1SC8K@?YWTwdP-CSTAtc6j}`FQ1cL<qZJZc5%>Y&rTS_IyK%ijz_+&wM&7Z
z+2~Y^uvO3Q)--OVFTp{qqqsP}hjle_U?J4>&(Dj;f_SHNp=vocVos?~c{(?>Le<$d
z=#&E@O^G1Jo@Q`<m)eMh#BD&Em#P0wGy?|9TWo4|isJ+c*tayN_>BUu1@pCz`70?G
zF##ZNof^K&Ip%&0Rx$t(D3s%#I%WcZ@HpA`@5*hLD7hu<wc;*aZV$SDH$@)SqVEjG
zr%E{5P(z6qWscU9=wIglaHAMvyRh!cKryfJ$v7^UW9x43RW^iPFUZ*ypTd$Ua7wI#
z+NZS&xd>Rn3|9P|0qJyiD`i<GY-bekgvWV1gH_nFF{Xz)iUSHC14#bWj|O-K3skOs
z5PVB`rUuT;nOk!39&wIsepamKFC(GLAAbF6v7^kS#`|9GG@$_=y0B&qNj!lrzAU1<
zo|9ZuLFm7!js%+XG-QFk$eODbuw{Rs`Ze_lAkCdG56eaX0M%3E2R~JUC?oI9z^2~U
zJ|@$eySaw6$^#2!Oke%Mf?%bR%U|4M6N@x16K*_H+~Hwpp1n0Bcd;6Nqh`ac(3xMl
zBeGq}q@LvtM=LUF?Oj!bc#Q`BX=>Ol=~Y&WZU9G+2p;*A1u$Y@l2HG0P8Q-@&6nD=
zqmh%cU;wx(9g3hLggcG;H_G6f#ateOfM$tGDpIhZU>V`-WHR-eZjxAm1+a+<06~J(
z(T1nVTe$edtgtMd;kr*Y0fiyuGND($N17i!<E1r|ZUZ3)r}xIjY7}+9xj6aGdxhgW
zHNEi&Se*jEN4OiB;EclDQ30?gXHz$AN(I@lpAi6t9vxc>_(o9$c$M;e9C6bSG@fua
z!~h7upL4-SB|`Q_i9b{skR+7f!J+|}AhQ4y%LRK2o<26;bSxD68U75~w<%*QgVY41
zsH(uXVakX$QFF;U@j!42_+uljzua0%XLE;Z-UYE&a}Ljx`7i`bQCi1WuQkR~@2JjP
zcA~W=Me{Uk-?A<+GA<(E3GQC-!gm`~rd_m+1)M*xUUH%{xfR5`B;8Yd1{~!sFb9Sr
ztMgA^oxgPF*0ccX_3MtUC$zm%#-)THO5MpeY5;(wZdV7DH8^>8-BSE`?~SMWh68?w
z2yhN&tYf*qdDo?loNNksw#=*jAdsa~$}@v?)MV)t4WFeVOQ&LHMgCg9rPKcQGcVW_
zMF}8EKtMygnGkp2sY<8p1p$s(Ff%t)TNSF!H5!3m_i|}yvCVo-MnRN!4NK~^K`?O=
z7(bdx(RNmi-naMz)Q&jD6&lrc{;@|9eaHOOA5p9*7s4{_761d9WzXjjph)EgcOBrK
z*d_qVFIT3-HTR|AfiiQV6gx)wpk1R3DKN?Y29O6G_aoMg;+R9uJkaQVsQlBdVTJX*
z_k!3Zb&iXQ3gH-KPU>4f*@haXSk4osso&T_hK?5O;e=1;o(4!rQPY|Gbx2{k#rw<v
z)@IyEn@IDx=1W%M1|x+QHPR4x;CQT%(B!-IJf^Q-<g@4pQZtyLnZR(@D)3AoH1}mN
z6`d>*L@RiH>4LfZpq0%jzOrMmTu3l71q4Nf0SkmU5KNHhSvjVB%)ef}m;Ku~jiPOM
z^*7@bCu1gf!OXLH?vHWW%k7WsK1DW8UG4uEr!0z15rESiAY};P3qtnE#%WoJ0NFS-
zl(+YSX;~7w-NnbVk!0ia&<7Yy6^1AiBV5F-Dv$tWRi<U8$4%_44=jvqoW|C1l8w{Y
z#@e#COLeM!({Cf&k~drG5b~90)6THS5f@Tb8Nby>c4I50!cV9q0a!k_JJug(`T{Zm
zw>BnL(*r$o!BC{+!7D-xg){<7NRenJ+<d`Bg`-%m1MuxPx`8%&0?jGW_tPQ6Y9S0r
z0J5wm)sBQ*mIttew~!2VQ-YHUCm5gc)+d<lGSK!7cd951;mCC$R2voBCMlK9<_#3L
z{4q`^QdOvMMthZS{}`t?u1ZE20$;LKi^^0*(>0?<R3m-V&I(HC?Wu;MctL{zKsHV>
zFbGa<>tfrsR5;l<O+|%z#I@lHLaGWO7{haA+<+Ar2daZ9BHJ^)HQjOTgg?fqII@hB
zY-y5>Q)89!o9#5yAzZ#$eDlF4;lGVj!egmQX9Xe(Lx}lfoCdt|mot?2E~sOa%k-Rj
zZLHA#_FLMk!Z2^u3+^O{I-h@fgj$6>knKj`QULlc%d>%7UF*ZVrB&_Pk@h*7dA_oa
zMY7a(>acu&2T$B=Wu|36;iB|&x12Ed!+IG}iXwY1<`mBJ3^-qV@N!EXTWjHPn~WdX
zI0dxT__`p(ut0{g;Wi{Hwml+NjonSts2R*82mEX)i`+}$BsA#K6BxlMO#y)Kq|%2g
z9mDj%xMXND**G;+rEZU?hSVI~;`~LC62(Ul0(zOR)}8wjd|HZdx;;$Ivh!tCSgx<`
z$EY{?MKwGw8Ye%>|1wT3>k0ZfVUto?(hPmI&0x4O**GQF-;s?|f?OGw6xlfK&K?%2
zt~CYfOyvilgb40DAUmvaMyxq1n`^t{?aB+LxdB9&!hK7~L|_mV1_*dnEQbUT##*%z
zeQa*PFZH5<)l-;eE)YQ?%2SPhIGyV%&t-R22#Y9?uQ*#6!hp}1t4F$5c1*YHFHY;z
z2iJTut+}&|(>BJ6#_G>W56r2PfzuF}<-k@pQl>q^rCW2PoXDAP@J#qOaN1pjybt2y
z^$k&z%WPr0<SVB$?j5W|Uv}<p+SP+Tnk#w2kvwGJR4XDo^^oOIJ?E%MYrInQ1nnsq
z7uWXIr^Sr|QM;n27n|gi62Rpvcf(S^W?IL+jBE965*Jh#pU<sFtlM(qklIt3Ars7H
z?`dC#%_tb@Hk315lQlyUV1vK`50K72FgMc+^KOH%sSY@D^Y>xNjYCImVNOT@Mq>FX
z0XcsapvcdJ|GEsuYv1{zM;5aY`2=V)plB$+o?5BO03Zkib>$E?2LK#<W}KG=K>{H7
zQbrTPFG`k*Q>yM*7Wg^=i2<}>f`H(aql9)gNx9cPun8$(`8?JP2YLMmI8AgbVG79Z
zBm<`@)%DxhcfRbQy#%%z;Pqd?ssHIZfLPz#pILVzVD}q1<#BqRH9GP#eN^|zxccpA
zkPm#}t2`Mv<%l3?_X59x)8?RIDFP1}IGtb`I8b@B1sE|9{N5syUuAkfX@lr$5FI3*
zik+A0ZhPwS2RQBSPO&F&@r~c#SAnHWzVi+C;M4VZHYGy_PGkQ7r(r}yn4!DI_$vmO
z{I@#jGSSJ96VgqnlHwy?00`%G3S|%~nD>qHKw=*<pq5bWHKgRob-#r?^8lD408w|*
zXH^x;(vvd2!O*>AZJS;?*v*0O(s9>noIGJhB;yF=?conm&NVQj3D)zgAm4+u8$iu1
z<JXQi8zS>VQrYWgo>N+T2A_=eMBT`LeIvhi5Y`gu8A5taY1XVphf8s4hN^_6MF4PZ
zOwdr>M^a*%T#ZOe-%RBC!~nIq$uH9%#njwn;FR>~x)U|RP@X7kuJh4!<GJ~39`ik$
zCql?~2gM=E#nkl{)tfN$UmT=Y<)05O;Gx$UKmvHUCM(1MkBlaX-6X+F@Sd{~ig9@A
zPk23*c-}HRCikV>Bm<4O1-*E}jNMa=+3Y8k_#d(sEYTLinJ8nt#i>OOhH`q=PZpdn
zFnqM2Pc;_YA#8l%ab)R~4<4iYYL@$+Wx}hctk_w;7nZ_5qqvUorw1&(;zH$Kp*mw}
zaWqyEoK}+J{}bs{+)5WmEjnhY5|Yf-NU5f1t!`kgVfL4Fs%1N;^5Tn49Ktv(h&KhK
z|H;~5&HB>uAL*24feC|TWU(<4x1qHIUA<>><FSo#^l$0(CMWWG?t=bx8~SD&vo#y@
z;|23-8}l(6y!fKgbqHgwwM}O$m%-C6I~x8CX>lfMp|L2DBwN9f#r~Q_n>AZ!ag=@R
zlYYXYQ<`lriRxabt(3|gf8-bE$9Fsz!(9}qyRl22fe|>?JO0|Xm)h>!c@eotTJq$y
z3rM2y%1@wfLHQ)T@e*JlFooHDsy+#cjtUmHi)>sD6sKFp`16L@g_JPxKDMJ>w+n~c
z8<vMfG}<K!*m;p6Vsj%OjMYRjVTx)j<3rx04&bTmm(tAaGmdTDOBU}(*AT_SGtbs!
z4TNPM+vh%B%K2m;-6`k(VDY7<gJAAT$~}kT=%uU@hbLQiB5~CIA+lv9$nsAPRnd2R
z@6kLQc*~{vBw?}UO>S6?fn!~+wJ+z_CC6pmp>KWjj$w_CEkAAf;;fhY?4sAc7OJgA
zbKdQGeAj8-@@lPWPsrWA#?@1lbM~Wm``7NiKfXIi<23aDb?NjW{o|BS??J@Nnow^$
zH<6~djxG?g;F*(xxE2PRi`}G~4NV0?Pkfpwq;@GJlf$K(+_*DBjY*s2oP$JY_~XG)
zncdLG#I47J?tabgDT8E6G&E(|UHOgsqx`KV!4OYuoR46L!Y)FGY-*-#zwq4FesljE
z+D$gu-A@*Ar5kD+>-MlLSQoS7i-+F|3)b8Vb}fTh=0mTzARgj^^;6&}o;$`F9)4j6
z)BGS^!H~=pgvk=(vEBWYe1zob2M@7ZK6?<`W%m>^SSq{qxCSAZ_p>!W)Kk{|aW~>o
z3PN=^^d2!#_|i{TjJr!l=;`s$$N8c6-)woOAiT}DeDfc=o!d<z?8^CVdK&J!C~fIy
zY#4-6JnRnAEQ9F?h6J8KOuL~cS5iXtv4Oe(>`Dz>asqNK7J98a)V>>v+eJi;dq&3~
z3|;p0C!m=u2*d6mLl&}~8YDFys_%kGdbsaOLfE<lMskIkp?8eS_7h5jjFp45Pa^Mi
zLv_OT?u7-LpMyDc1xw*W9ElIE*g;(g6y%+G^*xx5%TD2YZ@>H<!+favx|d5BET{?o
zFxI=^jdxK@xN$P{)?lbBF4+8ikUN(r%NftOJV<PEkZ}rJb(y^A9~_1b)*B3UUk-7^
z204=DSpeo&6Kagy?}|C>X@aW{`X-`L*IWV}yF<JNLzPlsZVv-}kw-%rp*|BqXRuJi
zJ(wR3CMyV62ZB!=Yrt2G19S<Hhb&ZbHG3l`!Dp7eB~#!tO<<k;AlL3tS0Y4rH&l}d
zQSAm-#)K|sJYM$mJ(vGLE<ea|0%B==yy$oQ{oJ0^9*kT}+ZA*4ocTfHj|17zaC?@=
zme`PcSh#vhs3#C+n7i0fvG9ZRT6b-G61?!ktjHM2C<*O|immg?J<IW1I@PwluPRZu
z6qB0fnP~f*{pK)NlhQcNru&E;bH3*I@|V83=t0?7)lfPyx#%bz%OIDRWDt<4$<=4m
z>#%JVpKV?(Y@??Bp+L*>o^6(Nc$l%$tE=(>J8uf(6#Wt{Gw&~58ZLdTvAg;G+wK`s
za{z)~{O-vfZmvCoS?b>Ep2U~#_|sQP?(R$4_Cc?8aNOt_yYO(Wgj<;D8>L_X{IvMp
zJzUbO8j4$iZ<9VSIkf(2PL*rB{F&3xZf<}2V;aAb>J5vxJ<?BDEANGE$IXTcF59^1
zhaa_k5X?|K*M9gU+baIM+w*E$os+jSpJmSVIe9f`op#>eLQGFNSW7+?Vm7+gBkpbU
z02@FdT!RgymfOPy(dx=_2Qyy29wTHfO*bmzlU}YRu|ZJP<juT$87<y)e^g&^V|go5
zxb%^cj)Lf0WVWXDA-9fTkUoS)Hci_NBXRMn+hB|e%_LedEo$V6Qh_$u;M|b@jgKCw
zL*<mRPbN+_DY-vRfJ1NZM#&5)986j!8`P97B`Wz9eT|X7qj!Gbg1o+!E>rco)uN1D
zfqk<4eRVCZbK@9Eyg!rNFTtERT{)qbi6-7cx$&PWh4Rt{=4tYF+DC+5y?mzYpfEp*
z#GCrx-s)mB_ocmf?wYE~x5DxP6Gu@)Ygf%gYg5<YbRW~F9R|WCivzN`%H{3M{o5!f
z(RpJ^5r$mC6;6hG_qV#l1&%kh&dqoiq8K#uZ>62mUfs~*pSCP4u3g~S6wRu`%F*!r
zu=#bS8APdoYk{5eU2pElufw%b%m0>6r4;z^zqEZNIw{RvCz)A&4kfx-zlGv@_|tqP
zdxZ*5>ML^ktv4k5|B_Crq_hYdm5BEjMrJkNt59B$9=gEm#>#z9ut9p{k92Bu@q)*Q
zW4Z4?q|@6LiVtY}-;e*1PVEaD&Q3ek9sRe`>0{ZsaFIsY`6qu#r{@<EZ#_Q0nCjSg
ze(AZ-@!zG>w8wHQuL>LGz7^LU%dM98DawC;J^fgI?QhcQ!Lj^$3#F36M#m{Xh0Pw3
zCWWnc@+W_!(+fKvZuwpKIqBGRVfSO#$9Do5@4j5vUr5W?Q?Tc}+QUd)XQ8Y0HA6}1
zXs7GswqDnynOX?##R+R&-T`8X(q1<0SGPd*)x2hyB*t;gE`zq)<w^7qi1|3IYcH&&
zNl6b9aD&Ah@>@EEM`0+Xf=@*$hXxK>P-xb)4$ZYRt&6Q{^VM_HxZ82lvvHeT2)c}7
z?Tm9&o~8UqAPwEmZ|9ekkSaI4!H=<kM&sHn%w@wET+0z23sHi~70;9!Cz9O>+1EA%
zHFXH1?J^ZZk2f%Q(eARK4edD#!^<q(l0#}cv@ajgobNtA3gd4aY(dV05Okx#lpd`4
zPojOl{G8){YRvJ4nI=&6+1t!kV@&LsG@L4voF&Temks^>lpgvX!zk}T3v{e6zvxNf
z63rF%I4b*R2q<%PD^9${I2YhH>dX{(VGr_K-|9LeoLL;G9K_O*-!2nI8#%<VNo5$W
ztrcI}KQ2rEto%?w_8~LsnAM-vngEtKa%~T;Rk>S-Yvr`fELmK&3Aukc`Sx*h8Cg(`
zJuS*7A>2~tgOfBkSUueq%{mY)IqI=!%_4|O4UewjWr{DGRoQ0I2<ZtGEbz2Qh$4kN
zWdWhaJx??2&0bQ~qbIJ}1<@iwGy!axT-T(9bgvbNCq)!zDjwN?4d^zwNQdLx-k;>;
zlX&6P?drG2tE&L*QA+Z4yM9T!Rrc^Enu%?gD-+kMZa)=Mps9ZQ=C$$b{skvvuOF9K
zQQcDYRevTff?7v=-<@C#k8f3FYvBVwnk_3Cr1pCNC7Qv$sj-k37EnoLcOQvbpIN#d
z^4)^nJ(0zKs-vu)#wKpX?WGdK*~^ayHS#VB-o4Spc3m@qN#G^*7kgfj=}EbJ6;xK8
zXT&Kb1Tn2lxh|P+WkndCJ@~-2Z^+Dn(g}Io%=CKR$jQ>t+mul_x%Mbq>_MfYtYJ!4
z-KXN9f=*CqX!z;mG=l!aQ{~K$#51q0_ki8L51W=m-$^Je{^~OyIXL0)rs<g9l<6lX
z@}~9N9eGQ*^OslRe1}80T^DBy&cn|XSBzc84aezL3s4hR1N`o%z+DdV22sDI(^qxt
z9eSV$bxY57fyWY27eXz=Rc4tpOpOJtism`2#1(svBx0XV8~DvkAhk)nF;9!W3^=t0
z>zGO=Wc!}C)v4{h-YA(=S+pSLUfXAO>}K^#r8;^&J5G&tORYM>HY@C=;F__N_7v6P
z`H`C{0(z$<qDXTw>upFia4`0$K3OVumiOW90PoPvU@6~rj!Pv{IlK)l!TO`b3mm$H
zL+&EiZQc<L?kX+m+ECZTD??EwC_nz<m1~qCTo)%&6k~D2me$;D0<-iSL`=+?K@3IT
zf{fSHLI`o$irz3^oe9;z!+U6vTSFM;x-J`YbAO)lW-OH9Y-Wrl-{uMB?w%^;xj3|{
zvZKN=0Ar|lx8hOwHhQwVQta1klQCAM0qhaT_e+$*R(Tfnm`=LLz+L0kUTt)*=6A|-
znaqY-jE^}Ap?Xdd(a{|Nxd)H4giv2;Tv$M~;A>2EYBY<KH&iorQ{a{Q5~8(uMuC9i
zR=Xo#Q%T|=a&1EGZnDdIG(#IfQ<g6OW9E`W#`RAnhi&#0x?zDe78JR$bK;7x`lBQ3
zSIiq*>1KlUJnv<F6FnE+Sjge7qn=20`?I=&i6`c{Pdk$}vbX=pHADn8GHYmjfQoxD
zp*#L-wR*#ST+D8##c{uL{uM$&-p-lVkbf2Ta6h(4EM5xtWhvui#tYj+L<tq_qP3Uz
z2f2=Q0++X#q3<TU;x5nxJAs)EF$%L*<~A19yV!CUZq|X8%^KOqtLygWOr7rNlwOCW
z;}i|dE}jk}<+E%Zn@D>&j}F-Nh(LsEp^}?vzxgr^RGc&>wjfjD81n?@&M0YPeUAf`
zC%D|;N{91jPWH*t>CYym<E_$@qphZs<C7-q?KVXcM6o+ip{h+TCGfmw;5odSw0fW<
zH1G^GP*MSV77u|4<K?RY6)+^l6jmSv8~i;`Atex^ix){yJuTac-D_bBYGJzSPuEYv
zjFPCXt1yx!y&x5qA`mCZpKGrLD;U5l`+u=_=l@Xff57htV;^S5zR%eAeP0J7R4POi
z*-4Sez9eHyw(Nw2C|fbe7BXWjWyu~{8e}WU7DC*kuCA+V{a)X5?)%*5oX7nq%n$RJ
zdAvXG_v;zT&ydGMkWOLyc(z73s2xr-f`?4tX?O8(7F*%!pRm-ZToxIqMs=8?5K_D-
zm$wejB!ppb!?020@p@@9owi{Pwk4lw)qqC<X2R5~TZy%EB@6IWBB9igD0UGdj$IUw
zxwfz?w?Y|`C7zq#>5f{qt$0~3ESyl0wPnF$IBG&Ag~FI$wsK{HC^K#3K=}gK^94ig
z1go{BY>=uUHvCg|pDgX9szdqfa@pO8#I*DIu%}q<?1am>c|^2Wc2NAC`HDk461w&u
z@L|eANKqwXE>{c$@PIcZRMId^*&rXkj8wG=ljPv#g4;2M<jY1skZb0h-waa*9wLQ7
z+A>eH6n8@vJHzJiVTyeZc*{^A341|cm~u9cngHL-&I3s=Vy;fOMvb;yS(tdhX+$+a
zD4k^!!l+!(7Pkpg6)Di4I;ARv6y8CBW>9)|Vd|Z<$O~Ac2oaZ8s7!UM{*=RbS(v0b
zR@V*1Q%$VDORHhiD$g^+W*#b;L2_E6a0KKij7Q1v6e^oItai?x=HcN=(UuG6JL@yo
zf=5azX|wMV8S=c_*bGyw4uuKj^X?EM0{AU2ywuPM<9E;J*$F-6c1JDTk@kYNT!y11
znNxTtQq;8oHiT7y7)a-HbNgVS0@DySLK4?jT&Gp`y5m$eQoL-AE#*+#ib}v)Kwq_*
zSkNa_5n!Ndh!o%C;i1)H44UCEb`l?*CeaN8j%bTR@_7m#us1)1d4)>av|13vQ7<fQ
znzmi!!|SKXG!o{SG6WuuBIU9R6zCk>Ye;OkbXiLT49+dUQ~0Mckiv^L!Z!2Q1t`Q9
zG0#n~at0a7N}+U0p~e?ZT*!A|Oel1Zp7+w8V^Sivn~GER3Z)amUd~wvC0MCIBDhU7
zKQy%7ky)V(!!)Grqd}#ygM|xeU2>ZXCs?WGgnSymY0Z(93Kj`NiFAU39u^u{+<eh0
zpo=UdSgG)QUZF7m(@|=!59xM@qDSHs<)(ukE;<sdRE|TOf(};53#X_Ps-kw{6}OHU
zU@%PNm9k~=3T34Dd*q%LW13H~UP>t4P^jT**fuBG7sg0sp-?(=ZPZp9ITx9llrBQ2
z^+K8;CRRuvv|s~7GMZ~g7`JNxMT|i23s_3xKVzW@_9Dw9jNz?X97GyG%!6>O+*%l^
z$GJ!;u+~@9BdT@}ln%emkX1(LBW=|4pm1)xc?mC&k5D@^Lzs^UHvGM?ek_JMBgD2P
zi~@8?$rY(Lp~VM@RHtwj-XyszqN`XS>=@n(+94GiZL!@XIkSQkT_qJ4YggzFp>)<Z
zawyd+(qcD=Vk#ikkHvzb02S?{iWwpFYQkzthZwEuFs7X_TD6xFmMFf>R&_Ww>SNOS
z1hRxww<tJVBm1&ZHK{&@t$NcHJ1J2c8ziIU2b<2YCv0T*B|-zZ!Yk~=9=mD9leKeI
zUvg6VV7)4A3oNExkDv%Iv#Cba(jDsx0OsrJ*V9JOl!@M%4r6L`L>QtFfR6?5TAAhO
zS_JO2_~7I>C*(u4iN9*|>W7v!w87+vWjWGS^+WmIArY}6FV@4fov&KrS_R~^RX*yK
zaN(TR+s3_tW0~TzZJ`~c5yG(~LJ3_*Tq=ZkKf9FxfK9D@l%8u9^P3n82v;=0B&@e7
z0799oF<ckQ^ukHt&RXo@c>+op7PUiRjR}lmEYXpdT8*je{lMwEl01dsaVBPT_`unR
zWicmVR9mtdZG{ivX994NaP0XVqyVJjI766*`#@yhZFao2t_dA?cc=zSsxXdNnvczn
z56RAfsoHH7GDHb1PiyFe&J%y&sV3t01AdOjgi2`7UP1NJM(~2PSQy$g!owO$kStiN
zlwl~nA66?C%MwfAQjzT8$iv7y6#y1$xuVrlrng#t*#2psz@;X*NqU8=#G>f^L;=*R
zEOoBd&f1bi<xB>vQqCv>m#T#);djP>GD=mlpU8XZ^ooqJ0JR{5NM;KO+z^{|f{GJ|
z9Vlj&-Wgx#d;F36kZ`nwZP&-L>PYH2bjlMH*zRm54EQq04R}f#5rh(EXr;@&iw(dr
zy?bI<EpFf}&78HwYTm|b*`{2Kh3yl|?wo;GBXbh86gYG^(q9_@XikJ=>y@Em2VCJ{
zI!e_ooSWG06DwLpNa|`W$&3({J}jsY%c)<g78ODht4&>mRO$<*@WQclw-CzVPy+3h
z5yBK3O0gV9p@b5GVQ4o<<z0ysD2^#=YUOw1jxi3(XAmEWso6-4Wg><IB2IUlL;?zb
zox|WGhS`#BpLSi3fToIt3aWh&BA}^;7@nP09v}ftB`!G8s^|-px7et9A3_DdavHw3
z8al+XF&vZOKv4iO(3Vg{HHs=0v$Pw=wg?bgmDRAR6y(t2-U*|x#wfI4`9xN=_B}P<
zV$@!5sPDCs`)+8BwtP6ft~su$1(VA@QKe@tseVW6l~3t6G&M|pK^r3X9t0qusV&0o
z?kVC$j$R~5{A7q_)`4|1F;{&daU!j;V`A<&a&Mf6)(f#wLtjpuF$^ZhO(d~QT$y{z
zaNk+4n_oX+P2TXSDPpaCr<JP$ts~W{B-P58frA-5W}jF)Ugn+6&?=8(;@Mf#T1JYy
z=Mrr_<qb#aXI*dFMe<meAy`(mib7PJuh|i9AqZ}&vo=d*rJl2EMOq~y;}B3@f;`a0
zR_q=_RP*WAwL<N0sfuCLypVZwBbr{gPM>gg2v))&ls%-CQ5>Tz$F84XW4*m)P3{8$
zmA*ItFve=D?jc1oT6luyrRu5>z*<B`8Lihw%@*lPs<v){ipF51gr!V@E|wGIC8M)d
z7r8D3FF*#?B0{#c9JUE3ExOmjs5pQhq80r=`CQvmun7Z-J*tqmtmwP)Nh%}6Dn*nh
zkhmeU0x{~fFMq9sWBjxzgkZ($#F7wUhRp*f=|D*ytQajkahsa=t($emju?q-zqIz_
zCF?%HU9Hywfvoglw;w10IB{$)Z%SoIoIgK7G|F>*s+02`xDj%wBfglM$nGyFf|3l<
zfru?>-pb=4oc*kj@Ero`u6U*_d=~V@@l0q{1lLeihdnXIC>UZd!6H>nuylq7ygL0?
z97wp~sLB*?z3$H2hr~*dzV^i}J%%rdyk8h3>h+2UbZTo=uO@peRw%<I?<|U9+1=9@
zn8)7Gq`jqRDQQ<%i#(!J0UeRsX)ah64jqwwP3p2zr0?#d+FDiYw$^57HGxiDY|$Lt
zF53QbpQIt_CJvfXFW?$R571t!L2=<fX*GI@bcf{MAuf>E*~KQE+dI}n*X|t{{+Q{Q
zOfrh&HUo}MH=OrXxY<qwy@{Ghf1+Q>@pni}=#Ey@;Z8&HB;DvSwSv^>*?=b<Ho3k)
z)(&K&wV^r#3F~63SsXd*ePDttr{xDFCTJ@fR1U>^8-cV1-5uGBh&1{(vUUCEX2Kqn
zBKe#Nb}9+#Qa!@ZM=v(CamBV{7nyO#|L%Q%+d2|c3i`2Z61pKPl{TzCV}g!h#0VEo
z>0Lcy`OEZ51kQ5~>>R2RRf*Uv-y`}!y+^`d=UD*L8IZi8VxjU7)=u5%&f>PquUAQ7
z9#nKk#erAu^rKpes3tZJo!5J<d<_kIcL{WA7?Y0nW4*1%+im?DwdEwLp>%kVK2ow9
zpdl7YQ4p$<0VpVGwUF5nC2f6qK-xeTU~6!AT@N1?Y9Z&u-mdIrVm;w)-Ho)CKT~Jc
z74bGg-(vt--N$GW+Lqw=?D+)*t{G7g*c?p6>b}FQw~uS}lZNT6d<yo{vF0UkQD<5)
z+kTN>!qz2&5CstKeXUe%x&MV$>ZlL_P&2~vI`3X<VN45;bB)>};b-~gHhWE4ZOf%!
z=+rQ-5M{MGHU8L7ww+3>4qA6Oa9jW#{+kCfj@%m&V=Zom&Dm?|uTG_j#<hH1^KE;3
z--ATiXR{7`UoXDGpeRbN71j)wy%4+Rdnq!GwVI5UzJKN}B1wcPZ-~3cS}BF+Hq%Fz
z<83jj2XCC;E9r*E>+7xFW+^&;8220|?H$fO+O9+GeUN)XT?SG-fC_Qj+IVz4oRV|B
z#H!~?HE(DB>6*&})jgDBbyoYIsd+-FQcVtYpGMssyiY@~uzId0h}F}nCrjCPYoFE2
z`4wgr#EKhhSLj<;IWdSqzaHybk>lNssLyepeCEHs^_6`?oo_pexkpe2hUn{n(Y;OX
ztF-FsCO2kQ|781IY|?9c{F2vlvpdhkZnBxihClw;C+{*}eyffxF0^O$!QQiu1kUr!
zrrS4C;3FHC?jJ<Gc~uk)Q8O$crk8VXiC;bMjzNjULRvxc6A7&p+hf?ob0W!tbmBvX
z;xY_p^Km*Z`>eXu;*qRH35Qn!9@?4L-Z;04-dserk$Dd-3D#H@nZJ8%RXwU3V-?VK
ziAkrjPCVz75ZfZN4&(??6@f<a`Wk2zd_z>z5YbBsJqnW`8Xm=Wu2po(lXdewJw9J%
z?nt)a+(GO`&bBFPh^$9vEI^;HM#AI$wAzmG-%A-dA>QQGZ>&NvR2#SYQPEajxx#HI
zkSb3)+&HlV_}svzhb$*vKO)D<RexTD(?Dq^>RLb|bsBS|vRx#v4hu47YQnEK&U)ty
zHpMOte<{!H31*PfDHbo3BPvo)ND<{}IxzF5v@%S34PV@@3U2Seg$&|xeElG}K{<V@
zduU1e?Jv?Pc|l<WDjqKXG}FNSWQ>Vio*i5yyONvkW`LG7g(dlQni?ka2gGT-y0-n9
zEj}c^@bM>F#OW6+>)JW__{N;!!8M$n3^Dtt{Fmxv7xFbw5nP#z`9Gx7%l(Z@n=+b~
z>z9U5bX&LRl1)hq;>tILo<4|Gp7F~aCA+c{byes~m&2r8|6Kx~`ob=~;niBly%T8(
z1@l?5(QU9B*h%2(y)ZYnH5{XL_F6kZI=$|_R!q#^?TjXZ)!3lf+N_*fE<vHjiSwR8
zPJs7U;&EL1oQxB1I$Uq|oy)p9_2h;2ee>8I{v3Yim`7Z`@$4OzH(lq27<AUTaZ!gN
z)VF3<I}7jU?0%O{r9bNEbg%YLk4lTgyH;XpAIwDc<jJ6<Dohpgu8LS0qS8j6hD1m{
z2h2W(DaOLzfosRw7@IXC-MZsI=P8c8eFCWSbReQE0kBPz5vzZ^2nk~y!jmbFYSCCl
z@viD0M>yr8DX-3lyEeQ+zOzr+S>$zET*HGdn<Lq$Ah(n^K?=F;Sw`I<RI-b2X4$kN
z5th>mDq?J^8A=cVjegh}S38D6{bNEG(6@~pZqb()9TRg~i#ZZhTNaN=My|y=mGLmu
zQ?$vQ^N4jUn_-`<)0Ovu-tq3Xr=J~d7klFoA2Kw{K>DRa-3@)mD`oZ&&U{&4o9z0X
z;0Yep_EFIBNN8L{wgb0hvA#|cG&vK*&j)*<kMLQKK2e>gUebp=xJnWp(?#B6a=e;$
zLgt826+a?WfuZS~@CZaGCGe&@cSet<o>V;^3<uJ47Em}z`1+r;CQeRo6%&y5C_ZUr
zC7bc)U7>X1i<6ErgLnH<1SE^U^jJqGXVuCHs5V{h@pY2T;e=n3Nq^Dhq>-H7pY5a`
z=>N(h`fSdc>mzlve_znbVD{I>ImEDX-xa3nJZzAVVwQhDK~TL%OCzAf+t71;ijK2K
zQ&967<p3&vD3`iTNbS_iSE=VxatOf%{f-w#p}}$mY!R1rUmcDOCi}n(73T_1E-4Qc
zj#Ngb6_J`0H&k0ZfzvLHVyNmG!n_PZOD*r|s9+n2g$sCT9laxDUuK#Lrwp^&(72qd
zeKTC1=3Qnxsl_%xAXJy}kR=-|Ek#$jmwRYM_+0oo`mWbVKA$5&)qy07tW$*qeVb<4
zhC0x^Q-Y~7=(DH|X_k4b(>Zi3f0;eE==qlqTPtt3ExRZ`3mXhR_cZY12Wv%_3$Fy2
zs^d;|*wcTw(1YEoEaJa<^&0iWM6?1~)2ZcaXQ{{L=|<{GIaeIL*WQfMr8N{hU9r^@
zy*M7JSoels!bdQ0;?s&vO^2gI!2M?y8v%@H+n!RZPi!NHPt!h^U8X6Owd^19YLqYg
zI(Ow<*L%~7n(7j0+G_ZqcbAvtk#xEmsXSo|zR7~)W?G9nZfQq<pQTOs+*<Vc2|MQJ
zEbY>1Yq6(5wp7+qY)=~3;x~ptW_>K3T1@K+w=ErbVXQBXpIc8Fw6*85IKyQs)sbA>
zEdi5d?K(dqbHV>Su|&!&&LZL}K~SA02&!c)@yPT+z&z8QX{qSwdiIj#0)uM(%K^`D
z$@Pg#2Ioh6QA~0%ue&3Z2!g7;{2I->Y%-ZF)*e=$>O9{*0?xtGdy4{>t2}vGg`nOA
zGkq>P{t>Df$TnQuyPD~pNNZ;PW>}RVsI~_<!^;j^SZ{qJRIljXsqZF^M=JMb&r_>5
z3?C7yEn==xA7&nFI(w@SLrJQx@Dd1B(IY~Ygaq|QTHgf}T=tO>fTF~o``j>gW5!r7
z3M3koEaSEB7U;4#^l`-Z-s|j0C4!)en$+^D&!lyj(j*9~MD!v4Bi5>K2!bkrK0*1m
z-N^=$!L%bm)gxN4q1=4VTbZ^W#p%j1!Jm$8Z~E$<Od>ny?DVDivXv+3Q%lD7N*rHW
zAH{|F%bcdpw|Z~q<OPj$Ea_Wqh@XU$O1aq6850CmP|g}Pj2H3>Sle}P+WF>#FEcE<
zTM>#9pz`wbRCI4Qr7N09oLrug9KInO9Y%46rYXL8FIuOi64J7KeN|-%WhS2!bHHl1
zdet~SN_UzS%pt{Mv6={8&%8K2|BX=9Cuu2-ziK<GP9RiOrtYCVgxyipw<z||kEdP}
z2-VFZ1g=z3{76uJZ4>-Z!QqB~i)T}Lpsy;LNYa0H{O)SpTLb<iC9vAvmrQ*|2b+V1
z$Hci{dooVmk@xb>Tr9(X?!+kwszAsu2c&*@cZS4Voa-{$LWTC#yVBh;>v*>_*f(<-
zUU2P-?WCJuS3<;h>I|qda!DG+_vjK{B;DDSXr*bf<!H~N(?sza5OEOZka9TYhh;>n
zhJ2aa5H*pE&=;i)eZWH_*FBk7YHc`B<P<aR(>mbE_~Pkq_!AD0;r(jc&+W@4b%1d<
z!<>pZ27m;a`Sf}L9H@dPi{~B(Rg5=2CWDESZJl1x#*aV<(R=q!mOhfW{3yUB4k35=
z0UYMTeVYfzQ3B9zNZ6HmU-Gh~EdDh0LIuvNuXTB~^(E2xX#=plD_FV=EV~TW5`zq!
zo*s&$rH8g>Pt%N6$YK+CMQpj8xJjfPAR-;m;xmO$-qW1Z;?RIHAdNWQ8A4Ac(t2}K
zs=|T#7zPWYHmk=JveHWLfgHVj><YH@4*E>K(sBS1ay27{ur>PQ{fsfvd(|jLb6ZGU
zA}c~HLpzT7P?DEvo)>uqMe+c>2zU<-Ph{6alUQDzjQZxNM)h#Kf^rTTalTIE9Pj7+
zoWSwch-)E{>#YYz7n*Cs2)3}swcQUpG~%3v!rw}_lC5*>C2}hFu%@j*-%-X^co=Et
zQQ1-Q9Q%0p9DwDSG>fMu2b(cfaQEQLvVqMPyjqomI>tFC=!OlG`1-r~80l6Fuh9A6
z`E4r)GJE;WWCRkg2)JDDGf(1;Big_2)<GaIbHK8@MAkk?7`{+Z6GJhd%i~R(D>op*
zzFxv0-uI5cs7_PH=JER99wCbpZK4xHSCX_F_q|*fZIuyykyP4HDc;6S{)B3MIaWN5
zNc?d4y6EhH7y>OZxGwQQOj658NEN^)4C3f)p%8(}HUp@<oD`dJiYwDpu{O*+ATFy1
z&hr==6=!<c0g-wm$q(x+CteBOb)~}@%eCdnDbva?xyqN9$Xjp7A&eEypJliztFYjz
zFj%Po<CeOIYN0r*NOM-nmR|A3hEk%ZQjDzP<+Chi(`jOtu?855%8dny2P}MN6*p~#
zeeKy|TYQVCxX#&u){z9fm9{w-nk^INbD3SwQ!Wleuh?5=JlJW8Sz?nRpFhj;@hr!x
zr*e8Mq6>o{l4BuF(fnN1Nh_!IEK!SeQ0q2GTNRIxUx!ZFXr6kaEp9^9$E{7Wsc|UG
z&?O;<eCB~vO%bSyMI2*5GRm>A52W)gGuzoxRwgURJy2DhVWzNU%3fy^$%C3;U{TX-
zQ)J9Ld2|z6bbMN{-RYAL^PDm_kKbEoX49hUg~-ZaC^$k(hHRvxb?NFH!pynFm(HF-
z^s^9Gk!Yl}bCr>t!?3g@X^f|&<GtG7rJVj)tubkG#xeHH2a{84n`y-I?PSAe^fqX4
zmEB1OMxPiAQ^kyjtBuOv8zq(*%hR3le4!f`0?LIe`kBc1qCgK(5QAxbb|I$D7MKVT
z6`L(RA2&>sk$Fqgw44ZP@|oL}(d?@&eJ7q-glJ9X0gT0yzDPuWpNLBiMR&OV049er
zS&RVr48eLUVEL~Ce2V2?4~d*i<`@u}jx6hT@+4InvKTW_Y8@_<VeEXFN<V0N(KF;?
zhiNBXUc6uaBF5BmGPQm6v*p~de1s=yANPBRX&d02_3ISt@l?y_giOp+IqEH&+Xl8x
zsk;2JFbPjK6Cw@i2YTdK8VXxxnQ7S<1V+_X+IpCWz^GnHRdpgVFhH5vj=&s7oMa%(
z(ekpr+<J+|x3(}MM~o^FM4uE=kVj(~esRZ^a^IHMb((NgOw1{JeRMhvsBrOqi^SK@
zZ97#Y=6R<aO<d~FNi~hMwVZQ3YvQ8S@5<@ZKIG#%uE6ki#LCgY?QpE-Du!-fjiGZr
z&2?_rt-q!XknT2S!m(R(>~gpJ_EQyJkm?NqwfeI%Uklu_+bEpFSS_E@Ibk&1oGy7h
zbkg#5${B$fpf1UhFvsGlii~bK5tgEK=!4;iYyeEx)?kdEdc}dm&K8`V1nNl$2)S$v
zHsdwpmg>SVLYQz=vFXI=Zi(AzDe3-*ZvShP0psTatgrdoE(fT>1E2Z?7QYVMV+xA%
zRh0b9UivzqM=@y5JLuWA%Ovv+WIxLgGe_69|5A+veO20fZoOJrS?v*6ju%`Z^oUWV
zSTt3yRna%|g89LH&cPD!98WM5#)`5BEfkIPC7Zc~_vQ14D6F*sH&b)2J6|GQF*&HW
zHuwX*m}pNKg*d@cP0PVYFv~@fCP!YaBXL){_0jj%CBL@Hm$y(#QDa_F<b$}_9l|5M
za;*npIi-!MGIE14`l9FUz@6Jw=8}a<2(#|!t4cQDTJEoAseIgFhzBg@zNg^YJZu=4
zk1b^a1*Mg#5t%j&zT@?w4z}eN`o)P})BBt{FHB+(<#L-2fTF6&3r^AkuV^wa&2cs7
za=Aj81;;#mE*n+(>5|aDKJChV?KqXnK=LtZ<-sI(glkHFcgh)7hO^2kr^-@Kez{?7
zo@O@IdgV*1EvuA&G4K?~^`<#T17o!3`IPkDv>U7phm&#{CtWi<Ml(o9Sg5E<qApSD
zdMlRA+E4Sr;_b~4Bw>k~A*Q$Kgk-dLY)|>vv!QP#-#yO~u|e5qJ4gI^*lme<TA5+)
zZcg!NfWPql&tK@j)aU3e=SX{Hp1GU*b*z<EC6{zJxF5th6LMR1S#iPmKJ%L#B9%OK
z<$PpH{_*8})i3U)^|~&X!LcD`ioAsI>QTqT{=&mcyM<c344U58V<cb`s7HZs9^K4*
zL;#Jt<*=3Ka_f!6s$S-sg)nB?l1l9sA*GAeL1me{#m7}j9t9LXW-ECRz*2sqSh=j^
zUPI}fOv8`H2tEI+F|SLXUMRbpS%$uF|J55EWrN2A>FV)^bZQr8wQ~3)@vw&^78T^r
z3X!ch5BRQcakK4o%gEIWja0}Qq=E#pDn-XD!J%p!bwa(Us!vX`D|uBH6+L3#lzvoH
zHVX+F2IZd2k~^dNRMK@xD&;B3(9=2Q8neI}->MpGnHpu8S|iq!LCnRIchc7zs;%jt
zUd`%S{ZfnCD+$lqQ&>rh-HX`HjAThZ$=$(u-DH<TkBh^WBGRTr1Sup%qW?yRPC=_$
zeTGYA2P~FPH?;?@v*(z=QzbE8VV|bzg>yAjosr4&(BG^5JV0N6f@&s2Y3)l|Q)UbO
z>oQ2=o?Uf4^CpyPA46}66`ZIR-*1t&ye2;(fA|&;?ZmXqwlKz<Ke_Y_b8@1UIU92<
z8wcCRT~lf+-Fski+56(tfM5)Tn9y}GElQ4Oyf4{h;q1sA+ooePTn4`I&K4#m3+2Um
zF1k_JVhh6#hI5sl36Sjp48k@grJwjhb7jA)XC$?Q19yC|yDhsri@p2!d5%7{9+II`
z9;0ohK|QmLJ(G>Sfn({9pM`Bs%b<J$AQ*~8z;zW;m`a{ZQXWl|BV1R@uGt>OgQ0BK
zlxNDL5z6D`xB&uSU`!a@wD41Djl7)z;RV|(<)-i_a9MS`E|Nx)`5>!L`&|)(Ba<Aj
zFW);$_&07UM=rJg`tn}uE%mgprU!W}eTT}657qqwHm9j$bKRL9!S-9gWY|tsC#V_`
zzb=L>7I>VA`^Zsk)Mmq79IwB3#RLFZ(bQDI4Jn6$WTu(jcpW-0rv5?n8VV!Nf=1#v
z@xMx^uf4|Pow=?LRh5%-R1RK&K4KIjk`2wZd$~tmWWz8q2{Xn3nQRxY%uIg8%!FYD
z6CBthLy<F0FW6B|3mFhv7T*0lc3K|i-5VZ_`}ia2bZX%y*W$Rsv}_SH7Jx1%SACwF
zm8z>QjRczTvKnef=@R*p^RO0a0=4~EbPtxka=$Mo6Kd9)Qw*Q`N;IrI!=X`ilCa{v
zgQ7hEE->mXgypOpewbSM#Pvx&Xi<_PE4eXXv4!GY-R1l|s>~^wU`_fVTQWmCkYzs1
zB<!;A^ki)gFT{H72G4Sb74qf5vNAE1!VH*!U&G29MaHwDxA%7A7wPmfsn4gU<g1S^
z2F?>u`;ek!GWHr9P6d0x(>(m=^7*ZJ1f22(+;{|i@&#L_-krSnqNlm=8VPeQ9@L5F
z%J%VH!q3;MEu204{2aF5YQ2xr*h1@BRBCpXK8kCNxZF1;1VZqu@et%$1dIJULf1R0
z^^<QV@9s1QU?vA~bAM%0HuZ8YHUh-15=0@LkGl<4^@7}ze$f6yI_*s4JDK@s>9nL;
zU;0t+J+-ero`cB?%)GczHuY$RVm@BYWR)B5uib}v8V2@KTz}VAQ=+?3|K*L>f@B4{
zE_3cm|HC&=UB`csPQ5-<;`|jP+x)$n<pv(TW;)vxPObP(uRTh*HTLWDxN(WJj`uX5
zMRTmb?S*IGq*ImZ#r}e8KAo24#zswFa#@xlRebt9^sSKMHNrk}V~v4(!437*tJAm`
zc0_!(?9|&cFY4I!UDL--=^jWuUy({n6#J6x(?v`^G-oqak%hRa;kW*IdHmT;Fk<ui
zrrH<rUkuff_R_B$H%33&0=Y?ue1@1eEDz7UWLl@7unkWuX10!CvWl{eWQ&%)A5QN$
z-7f#oQuegAA-7%lZLTe!SB$#LNpFqBY2{9fJr}FaJb!Pw%I=N^v2TB*HtlhTMBV1$
z={t~*SOdixP11O%q1Ph^*FhFE4(7<}-2>ajZNzAV1D#(oTTUZQQ?EQxhDPW$Q(nrx
z-hP)ai>mD`rO=w@)1fq<3+-okby>Jy7%e!|FQ|<O>*$$&a5d_>pLDP^pPgnEefeSg
zu<%l-<=7g&Ahzf1i`+2fR4@;*^o3N|v)fdqNvT&(xDce%2Bt?EZZiv-8!TuMlXxAr
zQrneWzx!w7`n2>EA9f?V8P5nroI#K59x91GdE?e~wU%q?4R1NkusxH4pQX#F(oH`q
zQz65<cAfQ$y`nZXQ&Tb5n$tqr#|7Hth-tY4<LRk*QdeieIX7LCUI~<puIou3NS!^-
zPsQj-gQMFUJjI(;ancB}8Q+~CtgB-r{zBx?sk~X@IjAaPKmXiCChL84jH;o-^*HF4
zYUd+4wThA<YT52cPPGr$J_ftDsbmPTKk-1+`c$F@k}=x*b;eT;&r!})f}HB;htnTB
z?)6Phtx7zSQ++0Rd$L*SR`yXR#n29+othe-=+Y2b%hG*x)a!$rnzsZsz(NkoJS?FM
zPw69HFU)!NoK<0$emtK~e@Ip{=`BbE0I2zy=)M>9;sXGPv+qF#(bP5pE1c7DV>fON
zu~2gi%*}3yol|Y*XNXaB^IPB0uk4T*ID2=H=|gO<rD6o{a252PJvi93@B^*v`;scI
zy$>91w17$08wn~a?_Ryyb8IHDzRmXqqV!5hR|=UhPov`xw9Tp8&r`EYAhMl>+&z6^
ztz^}dpFMS_)y{5B-B&C!lxed=onevIH%g2v3y^_u#efKJe$cluQ9ij9f|M`&gl4nu
zH+R=IpbNo1Yc6EEbr_8=V^Y4KtGd7Llf{dQVVKSXZXw)>B1BtOLx2twj4!p@NKI#`
z%-l&nJNdEhEfaGbGdjd;ir7*~C#{8FGAFL;#oUq1$Y(i;?|@ZS+~Swxai`bnC&o~8
zW)HbXZDYB20lCd_KqC;#5)wjr95-mwVUki-z%P0Gg@KHu;8ukmJaL^=#Q@1|EflFi
z!Sd3GRwt0Eo{Y{N9V6zo#EjMiDlzdxgX=I9LHh-g>@xcL*Siu_bojvb<V3MHaPLa`
zhm+BxET>L*W@f%SE-JRxmHUpD>AVsN)<=uXf~6BSzAS)k@F0tT@KO(qw<!lJ#+)w_
z72I&|x2wGU%0`9W4EIi-)u&FwiAs~X$HrQAn^nO%lrVB@SvbA2mL04)9e7?-djb9)
zeA`EY%Mdb_ewenJ?Keb{vyPk7X^<8Is0^j=>Nr2%txvqkCY#&+4uc?vAky0n^6;e*
zBxWLso<S&(;#qyMPANzp9b@{<1Rj8|M?{_vNls11qtouFLI4qCtoZQdhc+e9y8_0%
z=qk-+1^^KNu1Q4xxun^z!8FL&^U2+J$BUb7>gyuQOWmF_n9K5<<8rehu8iTN9TmYf
zPf<S^b&0Uz)_&c2u2RsesMnsq)2yw1show<RZ|gucC4Nlo!Q20ueVUrbsETl(e6>N
zv<aUm^6|PW{xMNWl=hVf9e@zSea{A`9e7h?@rd!F6q)omMVvjQ&haPnS5z%|rq9(n
z%sp08fE+%1N~zfJM&!x-E>vV;;1P>C+busd*~JyN&LDavRN&-E)w|mGrWHqrWd%5`
z+afdXxM}(0#=t3n87af~<;NlYsaA(}ok86W5BIdkZ2){5%^XYRq4K0Q<&RsT<QlJF
zr-yBU<V#pd@iM?^4porX2u_Hp1&Ff+0D?kzX_TaIyQJEd3v)YiAH<DN49~jo@3iYk
ztY5l5A+M(+)!F1h?uqPpcbsOd)8vVaWdg^X7~<WDnrRxh>g5z+3;%A19Llt3TW6&n
z%tydmyM3__<{w1WcY8hYJkcBU^t6&fFIp>6(eVLXW6&MvBT=0<9=ed~&+8f53qtg^
zoCF^Rqorl9c%7LKS~PG`=@<3X$rPW=@ULsv6;ClpZ}y@AmB=#9lgcBd9xs`X-yM9i
zB7GtbuGh`+9=x`A=Pt#1Odv=3$U(@{vODTd7fKCSac%~P88kyz`#e`v-GZiT|9vOs
ztiH~bn%d|5FUBIdPrVt5(Wp}v5?U32S-Zn!P1Y`(vG0v<Zk1OaABjGlk|m7`*;KYe
z-ZEz?f^JK(%~Y#@3J{&B+2&%^c<FgpVG}#d_nrn(*7PY{GHBNA>JCben^>g4?yaG;
zJJO(+J_Tkz%W>_ChWhDp@8x>w)eNE+&y26!Op)PHeMPyzGOz)!nwZmp@pLalfcecM
z51H%@J3AQ%;vFV9c*-oJUNT<yzGcGs;XGGB|8uSv8#A^qB8YVOhR}D8jcRg_8<N0Z
z-k{N`=!4;RNM$KJ9)MN!!WW9nLkx?wnYNnfh}iVn_E#_$&e?GUfNc?E<->KaIPKZ8
z9>2!Ke+iFNtsjmiyF)1(%@nKUpk>~vFg3LtC`QCwXO2}5CL&cFwWD09IL7|g?~Y3X
zH#<qaJ=b=|-XxfB+rw<?!C_0R?Bc?fmy+J9|0m3FZH}`pk_{^n_@&$B@Nt&eW5uB9
zxJbK)o3485Xzr0fi~Ug5gPm3}r5bfb%|mc?^<4hD=Ls%iL<-$?Sj{bfriCJ8$M;Y>
zW}UodRp}sCsU-Er_(BM7_(sVvC9=gijfh%2m-0Z0Y`u?63r^ERM#VG>POYGP-lC^^
z>oiC!gwN3wxCmYVkh0rT#YsV4c1SN(Lx3!ym#Qhx<3c93LbQs^_4Fj~;mOf!G!>fH
z@d>14{W=1R;OF=N%0Z)p5V)uk?b=Xi-}Z%IV~|5GIIqu=W6p?#;)cOuI36E1N*+!)
zcak_3zNzhYHk~!D0(cUl^c>Fb(5HQhlvHGn?EFCRd2`ck!6<V_5nL|#*$_os1%EI_
zROlkuC+Ze)xaQRwQ<|N~tU5`k{w)X^ye0r$1u$myT_G5%6n3GnFM0c?9x@~o5=V8A
z;=1csJ8#$OBXT+&rYjf?rH>F*C?<xQfT%*O^b>=c`ObHB#&+$5)ltNSGu#@jq6lbV
zT!+L$jN(8ZvByyqO)|(Hq4-&IGgp?l1$~V{A(fBr<o3C=@9`|Yt2FkSq{G((toptI
zs=1UVn$#rHR2OndPb`8*odZHb?(DV1uTb2n?jyTe0m;MzR~Es0qjwIKpyK(a_gOAw
zM#aN~WgABA?FoRYJ5bLsfdHuH>9LBtlQ+SMcihPZa!KK};8!-pFA_klQV=p_$TU7l
z>Nc3~a*_}$Z8e;jN{d=nliIh!NA`R&PYW;o8g*-XqD}iDF{cd({vuWK8=@Li6Q?dr
z3@f6PDJCU>Ci{jY{er0Gk~Ntpj4gtF6VeVK$p=ztBxvw)Wr#@v>IhM7Nh4WHQ$~}I
z`4E6-AZG>DMd7<Ul~kMnpq)QC)pRlm6!-wo;=)Qv^370v-$y3U=jB}tx%cJna3#gv
zV#v*62qGkrV5s^+GQ*E&GC;v*ni6rvj(5J0B_Ge8SSRCzPy{JZorW-$6hp4&lI^$y
zc>v%#;mnT^+AX2f-X(CK@V%iWaMxJ25mCkggz`ckc-)5gtIfTJV)`l@;}%wjvOc0S
zhS}TxqRM?lWi6L}F;puK?-KH{l5pZoDUyL)@_N?XVkwft+X3rvVsStsX#k-Ko^Z&T
z`)-UlPZ+FXLrnf2Of8aGP(<%mA-&G(u-r!^8ggHfz#*|ZuEV2Q<x?U3aiD&%V#!_k
z3kez}^t0}SLQ_8RR>l_PgX3(19h79pM7STe$e(^=+tZhCQCwhlfsd&lWX#4L)LF<$
zM)vu3p?w4Q?pT4f2z+vtv@GgjZ(Ba6RJMc2qqQ{(CJgOW5jbDeqlIIIqN^01R7J~1
zcR4Ex1EaZi6G$I97nLwlFhL)osES)XviItXHWOo0RV?D(5Gh0MCcZDuwFT`SFV2YO
zdaGYja;#8%7kF>?u=ueEbNecgNvr5lG#A_P(mQRmnI$E6DyaS_oko|vC@JfDS=RHu
z>=o7Hev!w6Cw@q$Dv$51Qe3Mbt_*ls8^C2M{G^VG?2d5hQpuAKFQ0sTe<Yo*iIfw7
z)6ZARx1-Cyl$7tiEdTnx{E(`GNVJ0FWCat3*v9?QTr^iqaYfxrss$<_R1{5r63ys>
zrgMR+=AzlV(3~I8sy0w&(MsNvmCRXaSWG1+dnJEYrT9s-U{<B{vr37RRlEf9G^<k9
zqDnOe%^6aqR9dAbTCE8o=7bO{u2ylelQ0<(BSou^1y&y)N1q%gI(71}$_7A&GAyEr
z;cEJlWjXH3G!0tPtZ{UyxfEFQBsZSK7V7+=hG3jt-K+7ms2LQh^*ULrBUIz3T6;zG
zK?H`@wt?8btJd*DZTf9i)OdclMctBnosEUqDrJ37T58yMozq@jrAKYLMeR)smaMM&
zC7W8#mb$zTwHZeBh2wR1W7wiy>La=uZj08HjMs9j*0+V`n`)8iyyr!DJWHQ$s6JVX
zj$vbhlINYQfq$qk7$oW(uP;h$=sejN3vJ9+ZK`}$7Zli(X4K^Otm*kP0qvL1)VL`F
z3W^X|=3wp^d=~R$X;aNOdvQQxc4?zU7Hj*5#+Ty_RW41dF-_%rhs|kU*jGN(yzOe*
zw|GX}-CRLjct#6k)F4oTZb{N=x#rT6&iy>y;(22tX0x;qZG@qWt=r3Ln)>j(8H#lX
z#E@HJou6Up_j#={8B*PO35aT$5BwQ~IwOj!cbdLNiu!f>6=m{P{X}eJAhx+5<M#}+
z7V|uA90!kWY0bjj^}vZ(wlzVqlHFK9ERM<&mz@95m5sseo1uzvl3#JBc@4LK*ui!@
zXjULpB6BXbAV$6JHkN&yCwtrJ38IZI9IUMEtYyo2*S5&m`Y6jz@#VT$F?L{Mhu<=H
zKr};~CYeR(Rca&33T|%rfN~9<j6(Y=i{1-8bX!9AA?8MG&CN1g*>cSjju+AUZM?DA
zYPA=KC+q4b+MboYe6-9Pr9#W@&+uvM?86q2<_Q>o5oGyccZ(V{X}_zKqZ4h=If}+T
z4(cI^?HU9%Ms{~KaP&5*_4dVby)dIZuLmW)MG-YfG3ic9Hp`2KP=!m;ve3KFI`kIB
zw#>P*j%CwUc5?vkHI8?441n54`<o8Bv6WZ4HuLIen_eXm7*#yaLJY$~LVm0?ZH_Aw
zI=7ep9zCY3?{K1n_y#8+ZlKl@%YTZ6?_<vd$6#D`A5W9Og5i0Q2+nOOTJ?{Eh_8bV
z735r32dOw8(oOQRHVz2i7$CdKC3SId0opIybJ$}$#*1<pKK50xEqCyY(S!ZfZYpUe
z8?6z?k7N?sWQV%Yg_e;kUk$Hv4qV{u2Y=))7Af7L=05Rp$oR&PiFjMEddrEViVHOQ
zQbUlW1kxAAjM$ofIuG#h8u^HkRw51itoul%JZ+pi=_LZA3K_G`<q4;Onm-osiF*yT
zdmR|Z<#}V+CSf?AX57?vRPfQL;o4K>yZ~zGY1cTZWiPOUA%j<f?n+DaP5N=D^r)$J
z;UjVGhaY(hzD{(APeP_80lZRYHp!D9NVaea{R%<O4e3_1@h7I^GRySOx2TysNe3{H
zcJ;}*nu*Y_QyV=3@}9B;M%B6nloevqbpDWXml=HIq9%_w8sSN_$nLIEE6$9`g_;D^
zQToqKZJwHDbeo3eD+bLfhD(VXO3^;75R&3kPO%4uc;E-mO~u(z#h|HY`3g#POqK})
z!PB$yZnJkibkGUUR1|40*hQQKT<w=t@9*H5o77(DV-PNY>}!(qEP`c&XN@H0&K@u*
zOStc#fnN=!zGzbDLcmlwO&-sgcaO&l=chkz^GTafuE;<Px!P^6GO2OcRQqvy9YB1z
z7(8w;?DmaFSJSWcjeO{0x8@v)p?Uqee*|YR_d0QQ8&75!0z7k_ma&j3vgz2xA<jED
zNKfam3g)ncUFS9QB6DyDZxQi$!4GHiINPJtr;e|Q1{|<Y0zQPJs39Cs##u)Y>H`G*
zfnm*)8tQea|7Id5)h=W#k%r~@Dyg+$Yj*{?S%?z+fc&O2S5*_FESUAKCRyS|P%Xn4
zlPCDpXL90xsjgm7;0C!{h)GN{&vt^-lTNThH;=vzL?j)2;j>?<F@!wty{+2(X^(Nb
zO7apM`_mlyUHGSTqnWCVRVvh~3U>&X2@4?{bccr4^`6wpzCq0=gjg-jer{2x*~efv
z@5fdwckzPV2_p*?f`kO`E`I$Wm+EE$cmpCfTd}e{Wot#mq%J+;28chf8pnSW2HH#Q
z=Yk&!QO=(BhssJfO>MG!9@3=d&iH${-Rz@i-ES}R`F#Epcm+>Zho{Y1rw*5*wzi{w
z2%*MlhWQh!zj(3;EVx9ILWB{Vw@RLx0RCzy4TMDyYQWE1z~Kw)p%T!(cExuN(IWAy
zD>lH^#_byj$m><f*8nPX%XVt+iAZ0+S03Q#4nH`~H%jr#_1DU?Hq?Wf6c5Yj8SZ#f
zgE=jEDckTn(Gu&iMw3KUf^`X#<5#IBzfN+^3Lgfq3tKB$R|u}z2m}s6l*%_=-LxW?
zz?*J-RvnZ@*aIC_sm(OChtuUw+G|b`7*zl%I)rfP$NUg*#Hb!_ksgx<pUefne|4}>
zfiTo0^GaaH7aZ<t*#iOnot-(7EBl-}8HUr^k>rYrUrdiDA#`p&NqjN?=}e&qZu85t
z$W8|AEhzt-tTx%}oJ5+7yS&M_$I|WAjNcfK#l=HayrNJH{!$}Jy83(<iQcSFJxws2
zUsK(<HOA^x(<`>*?<U+Hww;E@K7Gek#qSn%v3_fSzY0O|i530XCG+_SbojaT*Ay=$
zB8-O*NS9xA-WRhzSQgoe7(?D%dt%a1!#AZQgfr-0YT#RSdU|)6%OP#<b-9NXl&4<N
z?ZtgR%8tZo4vQ_<H&3s=ZNF!+?KahP<B*KYa>sq9?Gy}n%qd-*cUOj6#hLG|h5Lc)
z+<5f@KFR-J=a7}VcoOET=<~|)%U9~?;+2D7j6#H&dSH0qJeL>J*-StY-yDlrxbxm`
z?}>^fUw=oGp^xng*zxAkxd&kemy0!T(&`km-*m!=D!invjDTd7#1x8S__8Ys&DmJV
z)qD2yr1CoD9LR)kZrQZocbhQmjEgOkT?1QOY1DgQ=Vad{&MUOfFKMCa`VRitK&?}9
zCc%9HY-x8pB0=yg%8ui#K{!v&yEK>H`?Jv-9kSt93Z&S5tvFug`W=|_JPxz6uR4P`
z1j-p|k@Hs@BEiQ@9?SEO*)!{Hpu!|m9zGbne@esirRpjN)+>j<eNB*kGq@`f!k4)z
z7*nN5Gi-8b;-Rw`bAsb5X?9HlU4`PXK#Bub9mjAoiz3#*;}!EM<;#O4j#=}Fo6#P;
zTtc)Z1;{13=zf?)$K?;BY5U6L(Y&^?1F#Y=wFezAt)+^jQyEZj;(dpcm8EiEtRwv`
zcP-}}(e_~>y&1VZdk%?7mhG6!2Nfq_FIc?2(u0P|Qj`?6W})0d8ZSF^-`R}QzthnZ
zsCP&{qpR$gYBqB9lwBvj<G#mkqR@Ty*o;f3PO1*46r7%{;Lj1${dl#-T&A6rvU^`z
zWmb1N(>&?6L(MSEl6>M6jIX!8J?eI|v&?-@ud>QQ*QfJuTvAr=WmW}ie7==nUf{SJ
zy;oV}W_QS98XGab7HujU^D2iQdEYR0=lGl8{lvbGu$C7yIf1K@+i?HHf^~5Qiy^)H
zV(tBU*JL(9bxNT$^GT4q>5GEj*GT=W;{BbXzc!A-oMbej63#1_G(ElKzmV)Wdq+>h
ze=hx!)t6eX2V2pi6P@JQqG=VR*X~KG3k`mHQV|m<wIJ+7DP-qSQ)^HON20@~xO~5E
zk*<(MOAhpO#ECs|F1TWOey&HrxbpVx>P71Feo5?veN$N$pzg^!><mz!j94J*YSnQz
zh6#6Ymi{$&bci<7=I0g)w^9rGP#c81Es%-lG|Wv(n>XiNp{S;ojhlIo78^R8U-J^%
z+F_=d>-#xyN_8JRj^#p1rER!uHjxSidcgg3M`0j{n(~Yan9jsVph5pmz!e$d&FExR
zr)r2Wz7Nh&f+QE}n+6q#T5Y^j(o-4fk0(f{$Q`I`_^Pzx+D@lL+Ex}1_dB+w4==Uf
zctV=c#ffgm^$}cm6M{^Vc-}UgLQn~dBeu{9^>+(04XYD+KSr{8C0Gi9W$qlCZ}rhh
z;V1)o-)ZA^NSRuCcVEVq>c!mpjg_K8#00mR{8j!t9Xd`jsr3d<JfEn&Mq3#HEZGq^
zh+O<#`(YFKNQ(oH3tf%v3X^@@y(Ze(1ujmm@inJRt~znd1lg&~DW3@#8O+&s&_7h;
z(9a%{+u(@V>=9g3HVkDN$|XPMtj*Y97^yIn2aa&o;a4$=J~x!l+~%w+-(VE)GxPvP
zdRhONig8lfP=VmF%O^}5jMHj{3MC^h8#t<*%^VqesMvP-w0FbVoUNfp2+}Kt5h^D6
zOv6Qb$F3NsHkdqA7%n~&amA!i#kAzyaEV#lm2*!UOrQ7+ms*p$n765%t4td%yL8Ou
z!f?a6n*Sr6>Uu<*Hrg@Oj<!ig5_X!^?AczAwkx)K#Ctaq#$%%$2(s%55o!)R%wwH;
zy4RCZ8yy4`$6lO?yq;31<|tw|_R_5VdfL-QM+x7tE^9K+j5akVne?&lOS+z!!;Mad
z|NoOtnJ4h%dVW~OX7@<NiD~dHKODb?N3_|*40DHHyL_`pyzj&;jNHHTn8x*_blr(}
zf_nZhO`ET$)lSSw-tzBu)bPxFJu$D?;os}s?3uGYv49{C=!?+s%4eQj)YA(XNNx6d
zs5rTF=2pN^p@w&f*}VruME@V7RsG#A5p>n>wCauPSN<>Ss^=qB-6J0-N8T8UG;)i2
zYIR%de~PYp{ZG28SEj{()K!CXFHPq9p!3r5^B=6|yMz|FP89^DKE%~L%-VQ(J@SzU
z{!z&6qZ^q;Ez!l^4aGSd#Xi#|;iaWz@n!y-WkH#bdzzo*&pe4vEWeRo-ZqDhORWsu
ztPHQJs=`%0%BYU`v#xsoA9dA7&oj!Ozo~vcxYd%?fax2;RDZw}mST@|)$g=wMSK4L
z+i2BaUDc_D(Ld9w1Xp$b<MjWbRl}%ZryJ|mW;>Hbt$Q2mHx~LHoV<U!sp0d7(JGg>
zy-m-yKjB+r4q<1S8^3HU4whQKYHr%wem3|!T9r@u2dx_Q3$5z#jaF^1!iO`QQ!@NL
ztx60b(5f@^0>o>?kiVf-c_C+hqg7W3w5sYKXjPu+f+JeB5MpYg)&3`1_3BTwYR{i&
z)rP;MRjGxSQW%bCRr<f8RmsASXw`)yT9pLyomOr8l~!%z35Af=bHgDm(bcypO!;)~
zuxGiZ5NK7m@3d+nga=0l75+i1vO<2LRgJ&Vs$jaGY1O)jAGGTEBU%+tpjBCpXw_-d
zU(>1ub<l6LDm52@R*mCpWuenoA(X*h3AmXMXw@V&13BSoshJ<Ns{RqJT9RLVM5}HP
zXw_s|UI+YlTD68f>4;WE{YtAQB~+e*2mMT|^8TPz*^g*do+DaS|A<!A&p#pN2AH_R
zm-L-ht!k%s_!F&4%@s|p6U{e(KcZEyeWO*mC?2BqlYXI9vj~Om$7?|ZS~ck#t%@6z
z;r&6Yn(>!ZxAqCdey3H#!$S%vfZ-t)JFUOas%QQyS{3*wT9xnjwCd__v?}QjS~WcU
zRPK99o)!YFs`Fpas)SL%U(>3`e^09dLLmd+Y1Jf~pJ>&5_JO~pRolXtwEs(5HRn66
zx&%*WZ%+J`R;@XrRl`6I1X^_<Q5y>XXIi!5_q3|?&$O!F=q>JFXjSdSHa0-YZ?vij
z@GodpJJjFOs-l0SRl|RyRo9Ma)iCh+*gw#!*ngl^;r|V-x-8KA&$KH3&$KG<pJ~-Q
z|Cv@jVfQPo+Wu!+HTw6oDj!!6{9n<k`TuumRe@h<)iZyfRpY<Ws%d{ut3LM108sp(
zRn7iPt0w*TwCdD<L#sOcCt5XM1QhY_Y1P-?X;p{+npPG5Myu-oo>m>;rbK?DRejY6
z=Lr8qt1=6_+7Qe9nN}_NJ*`^w3$40EpjEBD(W*7S(5lIQN2^Z!Myo3P1+8jLpjC6d
zexg-@*bvj7Xw@K1EXW5Q{+(9UBhadRGQZNQiDwdiqE*-aBdrSkds-EJM62pUz)2xM
zi|@25&+lnf^iQ;EC=gLiX|W2lSS4*rpmq69tD-42A&O@Rv?}zEw5sVhT2=cGv?{}&
zXjSw#TGjlBR`om7{7<wh^k31cOD%s(tCmzC&Jbu-Zs0%Dss+ENRhKG$N2_N2Osi^s
zqgDBV0Qz5ORcjk!{anQ}ztXC!|B6<%_=Q%D1d1onqW_*&H6_rh41YzdvV5ae6Mmvq
zd4JHV?|x6Kp8Y|q5(9ssRnLE;RTD{yf6%INnvl4kXw~4KXjQ*I(W*;7(W>Z*AGB)K
zzo1n&fU)0b)!3hDRm2Zkwdz+|H4mu#FKAV_@3d<4zo1o7K)UGPXw~8$v?}5ot$LyY
zgjgl2`Wsr+{yVKI{f$;#`h`|i{zj`-N&N+_iu#FG^;`Xqv})yF(W(u<qgD04)2hP1
z(5l7XY1LJdxbL)TE|3LJ{wd^dXw|-Nv}*qkT2<;#wCd_V(W?6Y4Xs-62U?ZqkF=_?
zJL%kADq<<};BU058G%-e`(H<^s{V;q4g85#js8Kas*oS7(gF-=W5(+&{v)lL@OxTy
zmjv;RR`vWwt1AB`tt$2JXw@nLt?K^2gI3M`L8}`7Ev=gR&$Mb8`FC11=|9n`+5}p)
zk<@}ft2R=eUj9L=2K<>;wfsh_hWw6J%_Y#PtE3o1Qj3HW4tQ!){1L5MRPh_FT2w)L
z4F40Yn)`cNwd^-qmEdW7r&VL&KsN%d>i!F@>X1vNLkUa;7!snrztXCXt7IVniuVLs
z)g4G?OPThKR<+6fiB?@cqE*p0w6`jbXw`s_zo1nef1*_@|0As$@Pk%G|3s_CyVK;s
zk7(6+sc*C@fFk}It(q+L8?BlKA4w+Asuffbe@CkVs0g%b?(b>UqLANc)yfuNd;%~z
zg!Dj)(peJ}-$HrdPG$3*R<%5$RUZ*()r23k>OG1OcN)jPqE%ym(5lv&N3^QLH(FKu
zS6Y>u@F{375WfEg?qI!dw5s_JTD9f}t(uk#)`R~GS{43-Ru!k71yFpaRkPu541Un6
z$#BS{Z?tN%6j<-y(5m9!Xw@6Q^%jucA81utvfpS`)DK$q@o%)M-YQuofmSsnHwgJ7
zt!k6|uW41sKhvtg|AAJ$z54$It&08!TGi@*H?6AuFKN~1N3^QT|14S+N=*Qd|AAJu
z_)e=r|CiFLpMTJ*B7Z@vnpgcRTD9niR;7ZXk7!j3P44fssx}|x?FdGDLJQdEkF;vi
zU(l+HKhvs(ztXDn1X|VguW8i_{OZJ)aDPXuYX6tC>L7tut^bKu6=6-tHy3#G&$O!e
zzob>g|AJN(|1+&R_(xi`TwbS$K&y)UN~_xaj#ho}zkpU{Wa99<Ek=Ds?}%2dDth?T
zAZS#K?#jneR|2hSssr`>AKcydS5xiZFZgsq521yg(0d2zB%v1(1f)agRRrmXm_|ps
zQbn48fKo&RMGc{dfQW*Kib@kf5J6BuP$u{NedammteG=wew;P`!M@hI_TFn>`~7*p
zx<>z>XjS!pXjQ`E=Ko2n?*2=w<}zs2!T+XJYZ<g^*Z+=IHUBSKRpb99tt!hc|9kFr
zm1Q&Pf2CComvjG%R?U+9AGE5lS=WElsuFU{A+D4E(5joG|In&Cbqrcnkov#Sssd(j
z9bow@|3#~Q{lBMG*Zz03YMnNNRt=W;msXuz`wy)O7M$4mmsSn=ztF0L|E5&|8~}!|
zh>GB0nG$7_U4lSZhydGZ>>i3{5VJr818Qi;2fyu$cCLI&Ssx^U<?$q*G73nt1^|F;
z6Vri%sr&x!(rjqJS~N}k6$0>#n$h(Bk6osT<dQx4*PxOa2yml5lNEx{pv0X+G;(8E
z<W4`Vc%LhN4?tu!XCf{If&e<rLhAR2iA?)6CV*xJ*SrfCQwUMKA63C3Vt+Zx6AR*%
z^Zd$(?Fpuyi~gYR#raiMNeqBSdP)vxS4RV(DPR<#VRW*KfaPp1Jm;|s6nrJyg{)Rh
zQ<@+OEC*W{eCa&LG>RQG4bEc?0A%$baa?DUY&=(2GVdHYh;vyKLJAhd`9rW~>K%YD
z2UD@`w)}wEGU#r(1Qaqls_^c3e}oBybyvj(p|!BLSiTot8s8)9rW1%h$jB_7br<wg
zxGsQ3WZ8&lyvv6Lpx7p3;@aLEO#Yhedyywz+W=?zI@b{fARs<KWB?TccU)d#0sT&n
zh?pdY+~1L<Jh!+YVitvJ-jaE|Zm#OjM{I9IV{Zs=^D$*-afRQ1A^wggbMi8QL+uRV
zhUh-b?01MQjOq^r48x~nkrv0-YQ<MIYUYRbaRdT8Ks4mtXGM^baKM$zbrQ|GlB(7U
zsme|Ie_+fV2V*>h;(Dj95cBuH&lI1Hy(QdLzN9Elf_qAWVLG+U?adP#4l8Vc(JHfa
z0N|oK72MUIY0G;Ca4ZHVc)SA;xz)c<6HoF2XsTHbe@;Ng+@p(hP;Fihn(m&B&1d1|
zTJhuy=Ms}8if@Az%#1AD#@!{MDZ}edDtMsC<ds`@so~L=g;e@jT=35QqXzZEIp^O3
z0h$2wUy;dX{PT4k<4!|Lf<JR10RR-Oh8}j#fyj~z5}?q^IN55vZk!&1fBUp4%o$=9
zlSl)U&!vlO+kj#7pagyZQCNQ*;GIhbv6fY*zKhCX|4=6gv;2lesnRU>0dXY_qhNR4
zY`Kb|hudeRdm~*vVqBdcAN^?8<pGXp2onJVch5y$*{JUkb$Oy+T?&tkkc6jBb&P|t
zpwX+NhvLUuWB_4PofGxZL34q~2_Q&|G6Z6{fB<CI+wA`9PuWhYogbUgj2j7LB#NN$
z6yEk?VkQCt0RGRhq5u~A+qSBz$uGwsrMmmQIQRmQL-XlX&diB0L@pp$H3Uj$A#xTS
z5QF32!=PB`{fiQygd?@QtZ{$)4ENJdziN^!(L_u{LeBKAu%c0gfOp4R@ll$H8L_Zu
z)JdY#6*vI+{5{vDa#`R(wf{wrvzx6gZzb>bz*Sy`BE5VdsCB0yC>*<a`jqUGy4Co5
zCr!UZ<a`#AY6$Kia53{&ea{dA0AShzk<4e`z1wZPmqKGdx08#XrG3W%4Qh-R&FW^4
z_w#-=ZCs3^KKc9s5}Y_F;*Cy{@m%5-o1lxOM&}0iyTY0hpBO5ma>5O?F1iB1d}!P3
z0wPeF|2tK(<2#J)NDV#LPR+a-F>o~nxc@#^L>x=3OdW*tuhn=Z6@pkiX;4}Rg**2m
zOa}6<m3azq+l-?;^OEO=hm7@T`-gH3o&~@Q4aNXEfO!7AC6F0GyYRUP@WFir2qO5C
z_y~Y<{Q-dgV{EVvn)ov-hky*|(v4J$2f^=iF5D4ULFR8}7jTkx{^-r>PR30Hf5<et
zos!6dAsWi_ebu_J-=lV(*ef*o40iv)#2Yr^qjS>Gpdfe2A&#72Q@p1r@z_wE7!7kJ
ze!Fa~0a#H$atI@80N=Kbl9bz%)+~HVtIj=gYZ)LxWr;w!Iddi-zO0irtOAlzSg<(p
z`}2%P@%2x}v@Hw%Kw}kIxpcsA9t3a<C;?`%$L>Vj0{$%~-m5jvW-N<V_VR%|dkBCj
zljyVzomqx5n?8bP0+?%rk(tDP0WuuHFB3w9^a7T-+u#e*96DeqqA{$)7&=A#dY%j?
z5PORGT#1sf8iVz0!)z3kdEqe=;99FX5z+!*$4lp+Rq^`r{O<fPc_UXM3K~Vcze@rT
zh+ism+KP>oCJfrAbyDQ6Kde;MqG$jtfdcrNPn~#v@WbPrxteZ`EOrL4+RFe|f$IMO
zRte}{ZooJLSe0b}s{pY0zrd;$16UQsD5^38`T;~!*HPjSHxZ%VHuVlR^B-UpZmOjy
zujnBPqUmpk4ngPmRxk_?RNu811GVf&j1Od&b^PoUD;bCDn`#X9)iO<0C?bd;0O^|U
z5J(7$8`OuwiIB`;>3TTS^^w9*w&FZK{HRxXqE|P9!ZQw08v^2rW!cdktj*~TssJt9
z$JznL#jXHg@69MzetqHkFoM25fD{iF0%4^=8XX>M6ug0as3wz{<S4+BbZ(mr+67uG
z64^!p{IS<8*gDT5=*O~t>fRleF(Hic*IrF-B1@era32MmOOHaM1Uo1_cVzm*Yk4YU
zeCmhIh8{fXyr13M^hzVch+v9byQydJ0BkSMgrI{L9`@X+#b`dsp*@kTGS6)u3D338
z8aL0KCR#cHgqzcu6^w-OBW!b~(>RN4dy5wr28(DFKch+OohINxei>r*!v~m0_=jGs
zmN8L8lG9L(0U+Dn5^Q3aTLZ9ZgX_=Kh6txAM%97|VjK@L^LI#Z1~q{p7@~k8oW_3~
z{_u>cA+SIxrobv@E?s&P+eUmqntuGL_BwIV5>!L3Eg9&kH1RG_2N&RTEgOPkt#gRh
zH#biv*IOUwYLH#`s&iu*uP`Djc7%1`G`r(rY`|bwRgNNo_{j=D=rB2sVOXNzLtH&m
zBGC|U7;tACI%;$8&=$~)ijh~%226YuoX|zm2@|bbNwwcn0AqLH;4sRYoPUAUr%L(^
zU^U9(LEX5}dE#M!;?#eD)f%<jG85^S!kB<M#~eIZM-f1KwDb?KDz?&}89Q$Fe*W3#
z-IKi6bQWTJgW;W)gc`->XUn#BE1nEs6$VST`%w=+!2nhl%%}U%Vl=y|e}Glk*gwGP
zb;*=;Q|sD6^-~v5TfHGeaT*=E5khCUClLNJij{Q?VAZlhqH_NE-=kB<DY=Fpb^&tS
z0{TPx0*a+k9STzukkB_Uc?A9@MJhN<`?@C6;ri`xE_y8_U1*H@z+dIHE*LX(jX};H
z88~DwJmY;hBNF~1eK`%_3Sgg70nJ%0o7%Mp)aaU`C64;}!@Af{6PdP+bLY|l_JBO!
z>lz&<&;p{+`5HATVn*)Bb4dUwipXLKU|XZ~fW`D}Oo34VxIHAGw-$ybg0l_D(Etur
z;(k~yl=hgYt1qF+MD_)6W&(g^Gb9k;uT#UZFjdI<eh($>4Fg!kp}ln|J^uo$rA4>-
zi|R)iz-ou~BS`IJig45fK(LqC^IyO!Q0@WoxOQf2qEBBY@gHDS@~lY1rejmLldXtb
z?@On22Cxb=U;wM4*+i=`;y=LZC}c(hAn^~ddi6Osy?2**ng>8)0IPkqDYr}@erCjM
zwJT<Q8f$}B(*6Zj7Z|`Q0AuhvmJ1K<b$d>QCKy=9-*-R309HHx1y&1cn3|_zy<S^(
zj5&;I&}@jDZ(*O*h-?IXQ}MT80P4z&dkl*D9nudD>B~izv4&I%@OJ;i@w2HC0a3N^
zIrXRapDNbdUAbuDYDv6QJJV$AP{i(Kukj}R9n2L4Ew}-nKI!#rKivbBcCFJyZ0_D;
zQX1(2)a3!+>j#-(9ahJKyYKt3FxQZ46GW&d1zM%?o~u7ISoK5S0@O$nNO_ZPi=y`4
zgcCBUI90<BTHbw~l!x*L&mY1IdA)Y;O1%{M_*V7w53}^`v{$oH#2yLxA6gmT4SkOO
zT-&?lGg||Cx$-d#J@b}U8SMD+@R<+fYQ>*VKCnoFneGB4Z=u+Yz;v6y`T+^QN?=dr
zzr9w>`j>zh;gQ6V*_C}gT8d9H`|^4(;-6mDR`W$|iAWxB@ZI(mYDBhVrlCIge!y|*
z_xYkZmY8u!t_5}mt=fz$LUH*?NBV6y^N5)H$(fhym6Lel{S+tto}>Mc)qW~hOB0)m
zTL^3da{q5=)h&PHzy4T`0Il1Q>9r*lqku%r(gWB3qE#*P0<5Y7tgBaK%>!(`uO?<f
zt*~T){eNjy(ZJKnfsRIjj*&o;J<!Q0(3y|K7xE9S>V7-W<58gJqfeyFPoA((F4`n-
zjvz*ZqM!7tm*}dGa!{c8C#}Rq+tgJh$tBIC+*SJ`dshD!y?)OYmcnoQot<QhOb?0{
z{ajZ7do!9F_ES5ek!=$GIa0ego)2y!9h`hSxLWn|G%=TvfNX|y$MV60Iqs%bul9xH
z5gDHub|K}N8P;zQZF8TK2ZN9Cav`LSpmW7*qr{N34<UI$YvLphE-WY~Z_V1xFPo24
z_-L&N#+x%0l9#$p&11T)8hXFrbKY(UaDYYGZarx*lyd};v>I9_8g|}0_-uS|w#Jtt
z>=&xzms~<vU0zsnd{_;~`Yn&oq3K^5Z!fj=gx>rccHvCet*u^C4}4l@ElXh|TPM6D
zGW^2U=hd>{+Y){=QS15j;n^MG_daacZUvWIHOjhO@_4qNc01&e(Pp%HkxiaaK1XQn
z?EMkG(4p#xv8^6eb6%zX&9M&=lONP1dPbgaMg0GVR{b{1#N)H`q9;wy5)x&Z9X&-2
zr`<?dV5;hkuA7SH`?e$fG$XWw8ez$j8kLcP%8TsHK)hgzvfn8ygShFOuOyzAd(AAJ
zaK5bOyx7O{+yYE?sPkngCbt4;9Fh4rVJ^+F0GiO85ncv!L!?DByiQq|0|9n%4d&JX
zO&~JsHpS@wVoKUib97BJ{FRdmpb9c^#YIu03$iZIb}AG1s$KWY^O>zapSR`bQeoPS
zE~7dk(j22Q?CwF_EUDqB4AW+?9e^RNrk#j_*hNtzqnJFSsHO>VuBCAa9S~U+NDw^x
zLO~k7j2a!4VV}wDhRPs_{WKTL(3^uMlrfdfrI~g>FGewWSnm3iQEBj>rUhviqB8sl
zFuRVl3sV{4gt&w$rlbPs$+h&<ZKfb}LXZyB53!q&pO6rhaB}ol3L0k9K@BIw#04iL
zWc*U)gj%3s@nQ*fI?&_L=doGGmrrIedjP18I%)V`#<C$%C?=b-^k`X#M?r=kD#Ou|
z8fl+lwI5e-YOloS;Oaf7P1%pDoY{`e;HWZK!UB_~EbLMglhSBL)yJfS-VDP`@(Ehv
zr4FbjAsw%i#%K+(up}E|DfnNkHc?bB0K^TQu9HY{w50f<VOSdZ#2h%NIU^E4^|Ie_
zl%?oRfv{1KsF1^ZzcNw^Von0U`u8CBWDagyT(}#2;hxJ*3V?e45+!skT~8M5)(rNf
zea~t?8fZ?uqyue#0`&kK$bO40Y>K`_+tGZSk=#M`Nnm>MJSEEb;(6n=s06AHQ??I{
z>|DT9wx4!<Vj;tE0dlGN&%1nPQ--LUNHLv*+B8!lWx*FS8LwWd^*7d}IZEVqh9B{}
zUh|GUG0`bM_0km8$3EI&bk|B2W+NN3{p5V`z4#~Xf9+L&ZIx#2l_pro?&hkb>k-mZ
zb)Yf#QjVG6mq1KN#gJ_@p1iCR$h|-Q;%>^9t!v1;9gMmmc4&21Tzj=t(BJvc`y($H
z#%hxeNk2^uV|(c}iy3D1lux-AVTQTN%@JJ_3OXcp?rrdQMrQpE-Ej%=oM=A%hXjVi
zH7eR{9i1$SJLM(b4A%Pd^7ARDPM@CJZcA3PZI6?PcJFt8g}*#w(<7NKwLkk&+2;Gv
zn<dlZ2;}p;xF+@gg;rgis5lX`wRxbiHdSX)tbF!&Hy#@p@T%Um$!;#ZMeCJZPscl&
zv#d#;q7%%;=)IUpyyMr9{Lv>1`#*~BTGS{>6Cujy{#LarUW!w4yU%PV=g{P50{(sF
z+ssYc*6oK}Zs#~7Q$fdd&f~LZ-7Xy<Ln~xdh0yQUOkZEvc~*K|kLVe5O8l`WrOY_H
zR+~Yqx+h}N1;TnU86wI1m`n^kHs9a?-jJ`qHM4xm_<L{6bHneSrk`Vf)2`&FynX6_
z^)hI2|BC(u<DAR*YKX&#&08}EMro>O`HH3kamU>A9Dy_}`JSha6LkbQ22F-c)Nq*z
zyjFFD@da)UI|#Us`qfFhZ!YG^PRuo3F^-<pJt<(NIxr-+Ws8KO^QyY)Y$EA$pU<>1
zx-;|_u(Gw8|I(`EVfW>lt|k8t4OPbI$}?!yWcijxGSIxzA*68L=}1^j;nv-^$qKjo
z%yA#CcmLFDy?#j=*w%4Jy%5rsD(bM=WjoWNcx!;;0=0WYbffhSeF-Li?|t&2Qtx86
zzH;9c_acS+>n)YHPv-9I%JkDm^i>}Ic$s4sa-r>k%Hu!3FF?vZvHXWtRi!frm*pG$
zhgP*QP#fm>Ec?cAIjQATF3Uf(DkjH3{eRG^>f=fej{cigP0^Ut-RReNZg_a4G4(I4
zY9@41^QD!-|3s^5y>j-r_}{eZAFVmx97F9l|KFrl&m|0Ic}vF`8y$o_U%rmLO7Ptf
zYGR8`J=ht)9;ZeSKIR&hdtK7GDU_~99%*Y_&Xg5iWPejG2I3yoOlbQC5A5<0iCW}L
z%FIU{vRZ>X(MHho9Tc1b<d)q|y2K0)9T&yNhg2K*L&`t%eh1CwU#5W&1+q;vV<OF6
z73@Y$t>1^#ums8uVd%Dece+f)^Js%YZ&}ztR^rNgH-^fHU}0%NOWt-AcN`I{{9P8N
zvE^VUUeuW@R>TAdbbv|E1t5FrC)M)o;U{Mh7n$9BWMOrAZf6yw<8;U;X=+NI6WQiL
z29n|mlAKWAfvosGXP%>JcI23!p2Ol0R|UP$)-H`ZPBn{boZ+d?Eb3($NXeTm=Q$pA
zu>CE!03U}s<6BgHIbV<ZIE|>a62Csb7~eT02a4x(L)4?L_QKQxI;)NAaC}Dv!@x@d
zwj{PYWlwCSwC~9AI&6M}2WR7Hsg|uLBA}`ka}=eZAFz`{)HI3mS7!hYtzP^7`IsXK
zwMnzq3p_8yzBlk1e$`d*3A<ARGjzO#-?4~i84~F#8)E$&1Cg9<F=Tcd=Gsnkkbker
z@_KIg&%W<-ye#+itthJSz`%2fz504F_I1lEp;P5yjv32G!(5FLoF0;O9Ovc+B_q`H
zwZ7zEWG-Y9`xVT3iGXCAs(Pif*(ZK!VOP<D@Y(wC#Y~eZrsYnB{K>&=>%&*s%$ss(
z;5q0q3;-hMouod6A16}3PJFR;`I2tPblTa$(^)@lrpc?5_}VS&Zby@3_^qF+dEJfU
z$Onmo-9eu$sfhDuUS~;MseZ~<sBF_t?3O>nn)OEdso$Lo0c2mtaPy(rF}vJX&X|a3
zmSC%R)9x@Aqo5yxOh1>qtM4-Vn2f)iFWSxzTss@=-0F!*2N_Nprb&%p@}q}<F6YqZ
zin<uq&wAq0-vdCN0d>&#k;C_-k2d9gS2*t!-K&1;rJOP@E8{jt);<Rqk}P{s6bn+w
zFX^*LRO4INN0#NjRz2h4(&=Th+0HRt^R)}^zQF8=QfE5zS`N?UhIQ^86wMn;o90dP
zIVKdHsW?*2c2q1r(cd_%oXW0SE~up6(mSGU1edAe9TM8@eIoIqET5vdg5mBPH8)Z(
zDmJ*A>e*(MZaX?`^s=E@^#HvU(uHejTTv3?qyi;IxFjPGZYSwtwF}E!V{F`-CAH|t
zKzssM*DSf$|B2_Ln60Hz`=qNHm?i{s#mI|%<0sT-kn$DLRLm(?-hfF65E8bdxc=@T
ztIuys(3R|3==#hj9`|Mwo)us^pY&pH{m&;l=tEfZ8im_I^>ihZ`cswnVE$g9Df8z=
zr%OZ}D`kmll&z+yIuB-(Sur(Y8GxvEEATjEf;eTAzP{*F6C(7O8J7`glCi&zJ<pXv
z%FDSJDj#{`?+{t>j9HoH1GU-eXR<OO0U-_dpQm2M-c%a#HEy4fe{60rEG7|0HLcp<
zpElb6%n`wy^ub?H*KqjCQM7V%*#&DxDO}_@nl91n&si8me!z4(7ic#lmL6|WmUQ`T
zgfY|0R3$3*1E5)Q3sg)K)}hBt>M9Cv=<2)&%aE0K`n>xm_+&Irk0WC3Mwh7|pe`=L
z0oEKazhXBN_%PuUr*z5Gr=x(i#?n;w5<BrV<c#iH6&JtCndPc!8vb5Bp)NaE`&oag
zv&d9UeylsF81vCz;7sAr7D${~;#A*5wLYh$zvSyLlzR(DxGd}z#94xmPwB5pHQ8*l
znDR}^gHKHc^4;h6lHQmmpWGt7bWW>M)tfi*60MppDfM->h%)us-$*2l`crKeFvdlR
zc8bA|_KT<M{P`Ru%FxHAOw3WcrKb=|LXUsXJ~sM!r~S{@n8$}7j*a#QRZ_Wr_>1k+
zEDV-j<i(W@3V+y!Y1eVF2SNt<2kg_2I!Tv*-FqzZHS@{A*TLe;VnD%3qalj!kk6k!
zvRoov0znt+Afcj2yow|!5(smz;dKS_N0CsOK%o_!=+S@}f-Y`Am+%C!D1#t>N$@Tb
z#10MhM#GRKSTX^Q#Isb86=v|NreN(d6a57fAfNBtf{A|OF-3g_4>rO>&JQ5x(EJ@Z
zW+Sr9cFiAPEdqo#+60G{h#Ae9==Xj+Isk$77Q{_!P^ODW+eI-&x>OmN({E4@QOotg
z_r(weIZForC81nN?AbU`*II>rvO2`qAhDJvOaPfv1b!}x!Isd;WCaLVyL%9@R4d(*
zD+;41c;X@E7=GI&;aSWCdQr53%zb+inK>ZliI++SGul^`1lf$rDC)g*i4`C}VnEi2
zEVmERDx-+7JTvMBYwwfgR|f>$2hbyaYO{5kVb;cFCaPs1OozA-pk5`>#K4u^C~;8B
z2qffGqmYbOEu)CrN$C4o>ij0ltl*%L$Mp)PgL(l=ulG#!O)1J<14x}^sTq*AslPs7
zKyWujy^JpAL=c5YYR^&T`<JCgmys(Z8Ces3RD-$Qh~7S3YF~n1k*vVh@NogGy|yIS
zH6XQ5){SVe5odHn;YGWbtSi7qEOuJSD}t*eIa4t1QG@1^iK+pJ=kI{!?d4^LmfA}f
z>t2-Dr=I{xiEc5_R=SunStVd)b!gE3{DPDz__XznU&9oI{pEkC)D%{E<wb#HGD}wt
zbK?T<cY=~BMe%RIB!f!TloBc<pUDpVd6%MaR4bDRZteza&46TYW4K&NXm^a)ES_)7
zM{~wUX@)MK4AL;K_5XWJlG$ghHgGbLB9mAn*C0jU6Ek9y=I04&VmPU?0V>rJAw4Fp
zr(sCxRntjnjIh*X8AXoaKrIA@i9(dN2bx^T_MZ8=26UtW-X?PFv~mM4Dlo)u)M%{1
zvF_8eGK!4ifH*2BTAHdkK}10CO$$z#?(sbWSSSjoG~bxHKv6-^k$X2z#arq_2Bqv5
zTs}06?@?4zYSeRO@Dntj$n4wBrwsOeHA7g8X6S-OWOYPv#?YX*@_-mm$g@N+n>nLP
z%G98rh>f5~7SORN6v+lkX0GR{Q9A4Zd_g`>Z$|c%0nF%Urqd|pGKVX!jE<b4<F>&&
ze_jWc9S@2t4oGD-Il<9^G?Sn`6HU!eQK_s%QECX@T-9|zYBV@xlTs=TDf1gE8#$$d
z9#Ctc8#&>0;1J{j1(BI4E6Z(cITdh?9w5bG3<O;_GLIC1B-jqiZHMxxy5kx!-d{{z
z0%0iCrvVFt;<V3KL?HtGL}ptUgO&_QAJk@ph+5(U<^~fg@W$}<z*x%nLUWx7n$r-O
z-QL_dWyPo$?=%GpiWp=oqe;`Kw~#}Ey||1Bk~|6`H$jBQh8?6(m<@nA^g(X8seS~>
zc$1j93A(xmrdZA?%1s)Y3I-g7;?_(G=@2yP3$}!y4=gXVgK4`0Z{f`iJdeKw1jtFC
zo3JTg`pxC}U7P(k2hLv|X;C-7YM!1EPjJcvJT^)f+6=>^6>%l&>2L-79H48G(<lPx
z^wWfQe{jUl+K4z%e73bZc|$9AUW-Zx8V*V7d{O3M(O9`!V@uDCdUBr6YN8^|Ac`yj
zVY4r5HQo$#vVD(T*_=FGtcVbHs-o*q@x)w;5~Gu}H(xKxLRVL5=J#o%?GmYNMO-3<
zml)y{VS-K}2_^dWBTaQ6biQ67S0tUg0GP7`7EJ*QFsOnlvJgO_dkHw-B`c~*mv$oE
zS^_E+khGkDIU`g<1PDe}!X4qoCCMj4=!AW+27^X*Dw4n+r|I`IG#>EpBYedApxrf)
z+OS)oBt-}fZ2b+Ea~hCNTr{$zzl)cb=*3APs9%bJ$?D{}NZhdakOYE+q74~Q2Rj?V
zTqAT<Cpvcu8Cw7nC}7yA6d~&19@1A20z!7&!YV4_ELDDpp8L+QQCH5Yu$k%=3~+C@
z{P0r|kZf~`z^eeh@ilx?jTqo#qhJ?Iq!=}_Y~gy_x3t(G!_o)=I0<2Cf~J|Eoj}>%
z)*_>zi8%gvCEk0<t)F%ANL$b&TaX}vBC(CAuCP)I@Z{-xt|bYY)w5^W1*59)YN`Xn
zB^$UX(y}OZO52L<xoTk@uCESQV>TdPa?GR=A{4Kb`8Q&S%cm4}FnCIBPzY6p>lmOI
zZSo2+Y*c{g9(l0(7Pi5JwU=R|V*j;KL8AR(|JbMnc-Dr0ZB#ah0K-N_1Cje+(J~re
z!M`@D0Z>!|2eE)^MFAP`>IqZa2~Ua@wgg-9RBi~Uqe{_R85AwB64{<oE*W@59{hTZ
z8@1<VYcGXo*r=*>nGSh5hK=e3l-LJLz!^3wzS7!6iIXaSN4<56$N~Y04u#szfP`qK
z>Sz)i4nz)-jeAKf1;CHL2L(5=ik2Eiy*n~!5@vspyLUi)h%7>G$2#q5E#uTxVl)m-
z{!DgZ=Z*o3jnUfgXxa%e#X-@yj@#<Rz>zOsq|2}ddti;vWJL2i8-!t_62(QMm})<V
z#DXuo!HhHAV4PINh)73Opz+x>#qBBX!%?n<bftboGO^oI%n`XjR}L9~z3IS3tzm1<
z<2JXo8uqL!nIG+g&+iY0xo+vGg862kXq_)Ys?qj`j%uDJ4O*H1z^F$)zs-I~WCD#o
zws!v><R5P}j%vp?WA$i}F6T^y7%*xCh>JxXH`Cg*)oEOYZEPIewFWiYnHggnaJ?o>
zIcfT;|G21?e?Wid3LkR}3Gpzlgf2v+aI4|SQMa(d1SgB1PA+$i;lO5?BEsnyD93ik
zxS7nXO84OatGWCPJpQh@+~UNxiPPEqWwdc(1ut~(rsM)nTgJo<ydhFd*DH#NI2?>%
zg@m)3qI-9>n~7LR<k^q$jut%uj(2gW@5k;Yhw+M=92DlM%#P$886Jh>-(ZtdsCB#7
zt!8`cv8`s~bRF9aw@=+uYB({Hf^xH))y5MpxM>PEg>RFb`mxzqKt4bt!N67<x2c-C
z@k_aRP;RIkvAdV3Iv8geIia>gktvpX1?1&6Rf?@i57$8}lT>)9h?)>>ZVc)|%+?k~
z0E}y=pU*Om7vY3RERdQe@3M3c-Z(R$?L_x<OxJe>aW|Jspt)ed$0is_An&(sEKgeM
zG2VF}{3s<07qFim)61T!gA-=JsNmK~qEG=yjxGGE3kh!85yA<%8h+4S^y5T#WFX{(
z?msXp?cvLxIp;tEaH>22$BI_aeR5C*PSE7Ihuxzyo+C<|SZ%Ri*Z8R=r*xrbl8ip@
zOGgZHL&zWQ1I2XOu{_-j7`3z*Uzwb+{hPz~6m-ZuJ?zx=fE4v2opGUtu)u;7OJxb4
zYwsoR78}glCv1m$t$<U;6IkE<k{ktdN2D1Luh?*!)}Kns@X)2~dUu{;xTq!qYha%@
zLmVDkREu7$&OSHSpjHTORdgWD0*XnbpSnLFxIj@iIS$QgRWiy<(zB%V?G0*sCgdD~
z-8mt02Ce){t;RF^mp||4*`({2Why_-(A&>)gXAjOXBq3@<I6@Ro8RbY9u(_q+g2T(
z0u4wvfJF}n_qr^b_&SW8Kx(CZ*hGWT<F1N3x`F*zAopVBy&ZuZ+WprD*NX3+(APYd
zLwnXv!jASE&(+r4$z+Z&F^(WfN+!Fh+;@sPim}nVQTqAd8BueO&b9!S$Rx@)P?)<z
z^-Mn{{IXL;Df;s$T(vP5<b)W-p3uMZBcPdLW(9S$7&btNEKl7x#yTdS6LI0OmkNEt
z>`RhbGr4$Zk`e>qCg6<Gk2=8S5?63yQWtD3kN;pxfaP%N-7f1BYlCoI@{sWZtnFZr
zNoVXnW&P3x<6L_TfSxO;68#U7N|Po$H16I(9S&CH03>?j3^s|(bE#Y5cXRI1JfBe5
z86qMLEH<TMz?LGlq8zx8P?<@`ZVs>xTYZ(Xka+H9)KB80iHsZ;-xsGIFc|kT#(z&x
zD}9}<n|5t^fKBmII|l{cP1D#P{M`zW01UBR(r-9mm6`Ivr?CoXd&*i3vl{%Jk8rm%
zAL6jG+|IJ>4ZUoP)`-}Imrh;I;#)uRoynBMm}W79vqD}x|0vBR9Y3_OuhuY_ez?ti
zvFq$~<JnX0TSrUn*AZOKEzRF8T8^PlgPG5kbzpcRTs!@rUe&t5ch>!G_?w=%R#jI~
zaq7#rbF<nX@S*xVKgsK}@86g{9-F;z0Tt~xoFh>Buyn;cp!Ps;b@}zxuE!~bzf>h`
zN+MRNbss0E=TF((8~pQ=6xgRy1+V(M^i131LFd#3)(zjndr>D$rdg~sBA<1v(fje!
zccrBy?>)XaE+WnJ?s@W$+8Lpr%c5SGN1JcBi<mBnUQGV6G4O5q`{<Rq#G;<IzK!RR
z`_?~h9SHRV=J+Dj11hoA1*<|Q=5?NmCHr+^uEqY|X)TpUJ-u0~)bobXi1WQuic1Mz
zoWX5Dvsx=PMgF6sG8*VH33gUPMaL=GeItC>Y~TDRq8DQouAiW$)LYo3_pe%X#{<C#
zRf1_gn@~##sYLQkMU$0Bn`Z<JQ;@j$NNHHOctZV|fupUX!TOWRj-PL8v%TYM(pnGe
z@Z$U!r>rN`2HVkb7%vKk=S@!T#FXd9s{)xNAFZb~xq72uSpo$JQmzuuh59=uQWu$W
z9kYGO*CXrJRs|*B`>w*%RtD%r;bmyGY}0t%C3VfX_g7wfzxfg@d~tSA#@6S-hO~?S
zGwTdo;I)f<Z$oZe&b!Ko#FOogwuD9?RXz5B#q!7&y10<!PE+Y2)l#$e;qNd^ySyKc
zT=J)l(IoH2Ex1`B8TH02=Qw=c%C9JzXQ}BG)eb0GD{DC~fsszHyt<UF^a!<_tM#F5
zInOY4yi)rq3pJOz+NM!!z5Pl9al(Gd#3OyydGtN?$a>8~vgf9$TncA#n(w7A`)Mep
zcwKjqOY@!7EGs156@v}fvAFK0TmJUCtn}ZqjoT0Z3T}1`i&jQ>?{tDHyBJ35^$I_n
zz<YshUsH&4L!r=h0hY0IwdLH_7SO7neQ&N;C2Z+-hIda{T$M;I%*djx+<YQ3HZt%^
zteG1rRhYt}OEzu0t6aJF@}#lIj~Qp5hc2g<6j-l|s7ft+9`%#0TjUE8g(SGEv-{3*
zr`%qG@`hkia$NJQ!)_iA{Z3lW!~-x9{E9T$`pUZTDSSy&KFu#IuG`X&H>*7|F?{xw
z&-Fh)-(M0-oqgsA7rnH-9t?{gHVMBZnlsI&LpZo>1PiL%7eSDiofbd>bF{kzlYlJD
zFk6c%xb*Tfu0Q~U557#x=>$`mfs61zYIMZaDXOewEsIGAK0Y%lO*vqZHFzyQNRyJT
zUgFE1&^*Y~g-Dm&^kq3$Hps)_kZHW<%T``CB%R)oiHoR3=3AP{R8M6)rYy16XPQcQ
z@8q}-`SD(t9p>*^PJgEA&z@8^tPvD_*?UEt<IUQLUQu)|p~O$vWeo>?JIKNn`$2p4
z*WDD<L_Yrp?N}VT$jPVJ1y<b7K%?J~PVd(j;kGUK<=^DSICZi9h2y23J7imHe=p1_
zk(9zDJ+<{KD$Jv<$SbT{TZR=C7wk#Onps&p;*nSGR0Syc_F0|;IbLlM4pPW@1N4ml
zUR=QTNfzTa<|wUEH164;blGi!AYXjtUBs$JoWL_PyXn%`wt?D%p--df>LnYSMB`Ms
zN$ZzgRqYd>#Gk)l^FAF@xYxgGc=zCBJks&{)KRcrVV_;f+uf_%L#qZG>vrUxm{P9y
z!A!sV>@8V%%K86<h;t`qxfk%<5b;=HSs`+WwgDOquuM_}7Dwxv`bLE^klsqcw2O{J
zlhQT3-L+%fbVbkJ4Yg~bcIVt3MVo;lYMDSz1SwB?8_;?ZYa!E-{mQPlyVc&z)Fr8g
zHMrnzOBlLUqxbEr7H_Rq52+28r!3AlPrqvMdKKpJkmXEU_La6EGX=ewx6VC`sDi=V
zhUcH(GtG8CZY5s{cUc!a6PtUtl^mzw`+Cf!Upl_C<ZPRlKjO`8yPoy{cBL~~hp)$P
zJM&YN6wf&1xV(z|al6qu;;h1k`$X5zw#sWtoE#6_roP8_=fApT+vh&rs26ur>rbd%
z!rSQzy=7jU*%SM4L9enN%_j95p;$+E@7?MImmJe4$#33y|9Zs#=-;5ThtJ^${>KNe
zzNH?#^Ep2L%TELHZ4;S231BhT$17&-zw0ogP-9oOXNgd<oTo3V&;LxTim;@sep&K`
z#^j=g9~G%){zI$o@)Sv};dOr=o~Fms1imR*FvX8~>khfHYjSirdEF=T|3j;8wP!lo
z-nZDVd+K0boP5PIPyxLE#H+xBO)tvv&j;FQ7_BoeY2I5cyqrm7jZDnSh2uO0CZo;2
z^U%?O`X2?Jv(<K09n63J`PY?yEitVE`iz2XTWIv)ptDqwGKEUeFcNI{a!iC5qxJNO
zp?7;3*eef3C5~Ke>{Lz{q+;t$5NcC5wWn$?SI7H8)#f4*_9B$(kz)e=wl@w@fekl4
z7MweLrja<d{a8$HaA5FEeDY7>h+vt6Ct(GH?0WXjq9uHdYYQvvjSIO*O;VBmweGTO
zwK*J`q~em%?sEO8FLJR9s8#cX()zK}mZe}Wk%fT=q1V32^?S@N&z_JveCAIy7FuKu
zR^im_ix{>gGv{F&uFU$T#p?(!uZ8x|btf0aRJtIJHJ#eBYH3I+_T5+SZ)y-VYj@Up
z0l%x-`LCaO+qM6CPcJygZz61+5Tm>@0Nl0Fueppa0Ze1yiDk}@$U-#|@ET>N27T{1
zV-4Nq2u%9)$X;ehfXL=$W=i8N@1HEk`@DE_3td-xke0pvr{gxh^p{Wva;e69fp67#
z{`<ttigWIt9KK?8_a+le*?vExBg}P0PcA!z4NiqO=}pxCj;-~t_!9KGzo=6*zT35q
zvWq>9|Lx2AJW=#V|M^<h6Cabo;QJ3JqZ*aZs3zKV-RBl5pvVQX?9R868owytdG<;%
z!vX)}*MN#en_TUe^HpvLOk(n*;7766E}|ojA$X>MugTviy}LJM#)W8VdC{)oJS@6U
z9mQzzz5S)3rP50#6&QHZnXV%BKY#xoupa)5$3XDtXR(VvXY=0rv9Cwu&X4&XR#^%C
z-5NR5!s>b%csc8pHR-Ki4ex9u3%&*%xqxy%d+2v^mM3cB*l%GyR~f>0>u~=$R7LS<
zl~YkYBy0rp2MI!a_vP1v8%zwaJTiefv|l?T-*i4~*&D&Uy8-+Z&iuJm*!Aq=>Zyk{
z1rHlK9yS*+B4(fapS>=cVr8BXSU|&H(P6xF<mv$5Jf{I1b9O}a$5H5w1tRYdiDP4m
zV|Wq%*q*c4p5LGYjIZJOX^;35KBYOuE;49ITQu(?aqA2aIk=GT$rZ5#j&D=QbyZF#
z2X3!ZLhiM^9Z}pS(U0VBPKp;Q24Hli>iL$Q^JwH%pcj$;T%7vYsZ{pq?nP7{a5}z_
z|H2FYOI#?511e*OIi?Vm&m~Y?h>CXLzw$!hI+wt4IhSBlq2Q$#sMbQ%J65422SEzg
zWYyv_dY~+%nfIP4Pg_mF*o#T?P^i2EpOOR95Kg#>KwnXO@^YelwNrF?Q}nWx*g>1v
zZsC)kJ3?7`*JVje@GkVU;tC9jW-qEooW`^(qL*Kw!rB)_+r)Hy_r~hPilAzHI9DDC
zo;)JQ%!|e5brF}-!Y*UuEfdY71E?ArYK5x^@pa7aymWY%ls-V_maR<aOKC548DDGZ
zw9~?|gd3xFPsuM)$=_vsU&<yFaa?&RQ?CBBs*6LV3vA8xkXFl<hh={XVyi=kAePPe
zmPI=j;PJKn3nUfgAkoZ~iwjdCF6w;OPs<(WW4=ivhh!I}znvD|Lw@*;d<uxU0V!5J
zC=%t=Q2iFA#=bj>n3mz?Mz*~a=ul7)i&0Ryqbd}mu6svA%~3-{LrtZSm(S|*<OWY3
zO-tssV)mjUr->LAsn)m%7iYS$fP)7S+4B6|S8F+FG%oX^i=xbYJ4ltwz8oJ<HXWTF
z^v10WIWQINBFi0xtGG3dZS}@Udbg&LosRmo8iV(D^#dIY+KUX-CJgjz^gePS7ts1Y
z&KkanVVPVsXuqTTs(ASAu3?~>(Ps^ehppbuwBf)sa@e70VuL?`#O$e|I*HfjU*cyO
z;4}X&s5roN=3g3>$e>XNkn_ICW9ffvRI|p#Q1fn6i|_oxzR1K5Ma@O{6#B+2O<p+&
z={j`LeL&_4x8?d2s;vwBg?nJ673?~I3OlWv!BdpGM=Nl$Dv#C8;<0A8wJzncycSz{
zyPMWkV!eaph*W=~$7WkOV{N!;ONzC1X|dIfIQj8~l~5KgzlN=jrYgCom{7~sSc|Z$
zH5str8>5LSVpxPp+|n4aO&<QA0Q+_f7r<Eq^~&K7iF<5;Uy-yiQ71+(;<jhOGi+4t
zT4Y|mm^Q{E_XeBzj96mFp560UQ7ctStkjPp;pCQg%8E}AG0>IbGiiJ3=bW29l+fd~
zI4<$J#$jD!UeR-3$sAw&;c}MOC5v~U>aI&+oT^F;bh37(f97!;uRF!bJ;T{0_={_y
zv&y}@9%^i!q0YExIbw6?1<wrV`0pxytU<)%xHB8rq6WlhUG@S&!ezb=&Vzi_D?E~S
z34ay|T&t#0zK+lEBBI?AA|YZ1OF~5$VGzaxgcF>vF-}PnE2D|AjquU1f9B39K1~<l
zWA?bj%W}2Ioyk^DzlJxR2j`<5)P6n)+7@)~r?F2DN5WN4&duQHGa+9KLdsv!^0Y(J
zdZfeijpQamWBA-kdxF7jVZ~=GhjC#{JOe%2?#_4m-MRfDiWQ|bF;y!eMxWpyiU9l-
zvO7Q%3G?GM_dWjFL$I6`v%~m31MxqS;S~vi5wTcpAUtoGd7H#@e#WJHf&I3xaDXqT
zxjIwARIIF=XWvf|w*mR_Mc)1^kGfck+O$Ir6AG~|v7d8d`Jcw7@x?Kz#4@+V=`Y0j
zXvaI3#^0EY*X37#SHkB~8kh7dzECS6xHKs1b;8#v6!9Kk!oAqyGjb2r3%@Mld>v2m
z)|qnC31dXm{6I3xl}H&a%vR62-JX<_n#?ncf_V$)o`Dc~1Z}Hq&K9b;`CWANC!PQx
zTgNKf^i(XpCZRMzH(dQ$EX(-RB8rch1+HVjzAw+6NYbw%iIgQ_P^9D58`8aGC09!|
zl){g2%CW#4MW36`Crtl<RhW0*%_dP5=SsGkOS}G^dVTltnM6|imGI%h<Ub+E`BJ6q
z#S8J0mfZkWVTO%LV%Cvm9&*9#;m+{}WgP;ur(d7`s_F1roUuVt{xl;&wJbf0iA5yN
z?FFvOpG0XjqI{iP&s`%#<!rrlaJPzH{A3m84`o?#$on>>aZx?|^G05hZT_!bj>F!(
z9|{G#y@||o1;?(BkVys1eexKq<Gt1(IalGJyHue!dB%2yQhgj*-9@__MMAE{ov%<`
zSq;h=%-?y`EbF~Vl47zFr{C0FECyWQzKMLv#rS_>fdKP5Gv(n9kSg4aXUE6eu~U3m
z$m6Ux9G3;k9n0b{H_NY;bJXgVe+w^vzgzMPRe8hhQBPmRt-hqBP2m+ZbvZ}9@MZa9
zxAL2Pm7jX6zHwjM3BR^n7VemY;|}G_!=8RY*8;oOFjdsBzOCU*u6c*&*<{Gl3>Xzy
zC*fWvBUq;kWJ~Ps_nfWp-;wsPzUET%4~#mORR6W3{!>mPKDlA1ui@11dgqD;8$oWD
zvHC@Y8)kZqC){mHk$T@yAtziKz1}wB1e@I6mM2sgFOD~5@HCg6fN{f5bk@{90oAs?
zZE4r5c@Ijirp7W{)S3vzc~@DYs?vTp+oa&FY4=;>0JigYa)j_AOM0PGOQI{uQO6I=
z>jNv23}c|Nub(u#weJ?S|4DvmG-(Jv)MFA#VioG(5>n@_M6>IQid5#WqeL>bzM*g4
z{86ELnB3``TQ2vY%jHX#|F`#ip?8?~Z*s{h29`w3Gj_6b#L^;HCJ}CDt;kWQDB55l
zP2%3Fz--}Cfh1o=QZEpvHL}RwvEXPk%hds3U%_ctGB&<+yWFANXGCKomP5U`oZqeS
z&b#oqmIr~~ux9!O7~F%W?;boCdiX2(Vc&y?*MB}_;^sh;gnK+Vyh)VHf}O)2k3S3b
z4<0_+t?WOjB>nNY`}t`;sMP+{XZ}1w?AR*uDz=Rue{Y=Jc0r(5Xi0Qm8*@BH<6HWz
zp1UgA?-F815}U`k1=QXjSiS$^f;2`he-S$nm=X+qGqRzt64O6&&a*pMIDgppNz##C
zRyT?1=<&s>QIf%Ep+S*U(%nT1vAHfk8yT*=8jjJ%liLH_L*fGSHK&nep3xgxKXJ%v
zBHI?3YrY1_CqD5MjW{B4v6z}9t_<?mvFV)`weNBEg|N;SVLa#W>(fSyou39CsdF2S
z^8cCoH1k4C1RGZ)B4yaQ{_Z7f`OD=#YSYn0zT{LJ3$eF?;g1@{{w{DL{RYoALQ#v1
zqg9@W8oV-<i%JtbzbM&IJNt3?71WQ(360nW=*>wy=dEMYT;zwFoIQR*vX`jh{&Ho?
zcYaFa+S}ImZ`(!Q-SK)ynVEhUEGim%+mT7wGbYe@gjcy%k-Fd+D+F&L@=)K4ISoKi
zi%Up9RQh|dnfK_FKlmOXX10FLWS$GDoyAJJ(22&}C*6{fe*0K@<etcqg!ht6^^$^j
z$b)Mag%{zy?s4wiY<}hb#5;<n3(7?}v|=WY;0a7oEsH5F^_v&Q@`IRdDw<_U=&zR{
z=!4i#Ps|KSxg5jA(a6zzfAQh!qLS!(vG;mu_4-Gl<yRS3^p9e{EWiu){p$u;Oj8w!
z1n!r<FbJ8=x>0OPJV3#B&esUj`(fka`_*V8!`SN2yy7fuFvM~9$_bXc7m#&pJIQY=
zKYTkD-3I$?cm7y+%lKk*Ep8RVk_V_i0Tb#ah)jv|*<zuRIP`Yy36Gk9ZK7ll+9Q2H
zy2tN3H0|pzk>|LS&)^ExC=AO~4cnG)0OlSC>hG|~qi>8%QjE{9gvU#)K5?#Qtjb5R
z)WkCe>7@hsjjtJ)GY@rdgFaqbQ4=@$BIb_yjT0eL#Kf0*!alB@yZ-Axw5rIvUl#(E
zpV!|Kx^ywMOj#{R>@Sfwslnz^gKLVUWxAwNs;?#D`nM+^kAe6q8VSNGXppH|`#;gD
zJPPjpnLB<N9DntakKpPJ|I(_Gy6qgtD2v~A_jy7$Mk`A-!{7F2X-Ga+x3K$k#9Sh2
zq})h`o#dZvetE;TQtwBvTK&vTr&jle*;=i$w>%#t{~3#0p6=9?;gZ-;@hOpbKXw1&
zVYDZ*$0jG5tgkNk;bF?*?^^=AZ3_cbRw1KYozA6Up5eb{9wS~Beh;e7>w(rfSFd;F
zg**-JuDq&K`x~~~qkH$uD_gKeD!YEq=9}*DchzfUcO6n~k1qQMh4U*neqXhoz3jPC
zEs>_zbHp6v?c?aVB=tB?<iW<f`3Dz{IgI-E$$fV|&U{~edoz4lQ|)Bz(8Gg`Ume14
zejEn>$y*Ni^E+|Yv3gU(hXnh1_kALZ^6@Bv!eO*;pTzXCn^oieTo;dyg(>hYwe2M1
zu$(yheOimSCh=V5H_!QbIf7<dzOLw`rN1LHKGQ!>Z)<ef7ddNLWN?)#{`_>YFiyOn
zlF_%yWnufhSWlc!_f(MRtAQCk&zZV_Qt$h*{`r1+Rzc-K(tFFLVpgwbL}qV3eQj`6
zN3Qtvf#mt;7Ou)aGQ6YyGP0Y&9M&PV>8Yhbm#ZY#Ul>@dJe^@ATke<YZ~q7?k%*gl
z@l0+PL4l^@7EMBL`miL2w6xqFYjMeX*&AZ{LnrN|XycX^2RcGoYV35Au;0cl`ebHU
z>xgJhL>Jq``vNk<Iv_iYS)PQo_|@&><@^F-R1v34>m10E!K3<TNr^Ie)ZV4v)0ZWx
zHou%U9-It+DQ97clYjU-$fd38?_bvK+KI6Aa>i(8SB}0z$oXen2Qvx(@Th}UJXxFP
z|KU+%s203FRXaKkh?ueJ!|Ie`BZ5KJ`SI2tLQxZ3<qRG*2t8x@%v$(g9+eTlXYi;o
zF9f4wy^vb~a*kqGNRg!l$2axjCl_LesIf<}^IS46hsANSft$$b80EVX>EpYfVlJO%
z5yP~+J--XR^CDiN0RjN*5eo#8uSXRC0Pv_?>@~PD?R~aIX6*Tgz?at*qn)ni5B8L8
zo@)DRTC4TCT;}P4<b};+d~$|Lbm!#!>o~`|4(wttdcJhkJO5hB`TQ{9BN-f7umC_9
zPBA6RL|)i|vmebZ7ka2$8I3>FnB<z+r`%eta{Si!<N8(7SDo)KSF*3)F}`wHinuRn
zv$?hJ^!MQJyoqhV)~Euf%+zmxR*kIOV#`gbIKDLT%jbwTH?QsFrt3cv8De|DI=@|k
zK}7E7B{H?u=oI|o|D?+<>`EXjbptpqF=AS-@S2|;8BpZ4DWofnE@W##d$JwGzo27t
zr019AIMI>5Zvy7lzQK`7T;v%hfQ$jPX@;r;Tn_roDZTuIva3TxJ~mfS924LJZvfdJ
zktrtaI?UqNp%N>9TrcoEb40V{MT|;khG9c9kLrxCpeWEpZ7<qT_hqL<+wQ1V5i!Rr
zWWe-sftfhXSE_h>ncX5pTv#j#DWCqr$AxijcHx8$0E<PVrrs?`hxV&|54_x<_(|~W
zQnn2iDSJ?m#y3U0<yA7k_sl9s!S|`MW+D~kj()E^1Jw1H6L(Q5&$yV<H5QO=T2y0t
zMv9$IQ`Cz}ydRSO&FIa<aF%-dP6t{2+<DHYdlD?2(|F`tKD$e~cg}v#B=_47L7tA*
ziw+0}iJyAOE_3o*<;Q>^ZI2%lWK+i+NZ;xQln!z6k7M+^TwkR}PfnFKgV_Rg$}9pL
z((`P)>#`uG%*RdlSQYKNg?>m%pN!(FTQ=n>`s>-;0<tb3F~$(cjsOUN2!Il%Z<vLz
zSzr3X>B!=IS-YGYH36GJ^^`QFlh?5U*-zPR2~p&6lAYY>4Dq0Zc-u0}DxKww#)k%u
zvYjxV(u!9&U1zlYdvSm^;@QB%rIygkZ_Y5y$=taQ5iWQ+Vb~o-eXtgn5^^iNd{#cM
zhi~r|a>fHZgmW4EyK#G&6^4ObsEJlxgahfD^DGK(YM3*fV6J)CP$zKUt72E}Nxs0~
z*ZC)s;*EykFLZ(wPE7U0Tl7}am{Skm(apF)v_EJ0PbzRk%DSN2-rwr<&Uv?%C&g2}
z-WvPk#<9oeC3r&hp5*q@Td$MZ;67;R?RXcc*PC0*T(6&Tpufy`Z^ke5KN+h8Y~}bc
zCW>!44S%~RgXRDO7QnDj+Qs#EEqh~;%m>-+kxnD(Oq>c2;I}){0_zE{4Dl&Q@5}ny
zLiacvv+4ZGomuR~zFe*QlIS{{u+1*N8wLAAnzwh(oNm+09C6hEP)mJGO)5mdfg{?=
zU4<HC|GuQUR{RIHl&G8KYnlf#rbb;?+9z}-k|oYMUd0Fs9vGpP0*$>!tgdwCu4)!H
zMJHdR=KUY+-Dgl!>)-JEkc1uxO?nBvNC#;mgd)9*f&$W!CQTF&q$PBuNe87$SLq@k
zB~)pKB3+~?BGN%XKyrd^_jdRFFZcb-dCr+xll3y0tW0Lsb^X@&)7zNhQ`RAWJQWq8
z=XrN$)qwhG$hPSF(nUD&6+ZRd8`0Z7NY;b%8i8?LZda9`n`5RyH$r#2((vy(Fwk6a
z=_%T|dcYdXp7iQT1l&&5S%gv7>+MjQ%gqSMM-n34YOh=d!%p9)3K@9|g1oWr<ePD}
zztnJhd?%!)*L05X%0dXO`K2(sWmwdr)I2lwVR}i3_KNe<(Q$z`e8+?N(5tlR=St?n
zij%H8z@2<wr!CeZ)mel2ih!>*D;}$@kPMu%&Uk%vtGGeGmXvD&msu>^OJ^L9;%u_=
zoRGr4D(%eNoju?A?4!LG8x`OtbTEWD?WyWyJOptsKbECcQcX*4YxE}g-B^-Thq<7N
zgtY{e@s=ixBR=MiFba=(qLUt&v*N^&8*mKh5=zw%$F%5T{J-d_K8v~6{N>Zj56Myk
zQazt`_UMKv7L4o9E~?&4BD%k{WI$tQM!H??bYT&}c~P7`n%bZ`5VA#qQmw`Dy!Zw|
zSl5C}xwaX_)7VO_r57gPN6_wTng^L!BA`g>R_+k<e>X-Z^L{@F4=xNMX;JWF8e#q1
z*&Ms>Uzpk<94hcU*KD<Hop-8#nZ(??EyKUU_vQAQgPZgWb@P6-JRpcQ!S^jmF1|7=
z)PZw8;4QtDJ+W9hI{uuN?mm;g+;JJ$?}=r97u@X5$7cD7v5Z%g%Cn;8R)fLX`v}OU
z8-gr9XIU?`mnC_&T`0Y1!)0lUeN@O{>-;)&nGE-%2ZksHO`e&e3A4Pj6{eKwrdU$w
zGRqw_#pS=Sho8PlQUQ0J&Boo^FjAp8)4bs|F|TvH!T3dz6lG&Dx@Qz^0I|)6=C)ks
z*w=Z*eVcJ92(}Yw_wEkm5@P9Mklh(4wmsUI7O)msFoOZ!@q)g7xvndWtvMxl*YJ*h
zxPhl4<e)_@W|lyG2&qdOa%_QA+m~i?KS#EYa7evG&24oEaOT2+YPJ&IN!B{pVBAZ&
z%^7B>z-qT%6~<y2w)zU;s1|OA3e~3~oob=7*#L6sQAF&MZ@_?+xKtS_T9zRZY2guw
zGvOgi5$8O@McN7c&{UhV;T$57Fog((c!FpkMm3!vszS}sem|ndULi*cz8Z*c6G!@C
z7P=pZ{|1hC5zgnmhwD-ftws}P=;2nQ$@9x`O|pZIEh4>W2)gQ^_1#fTYQ!$Hcq|o!
zx-C)1+0lJV(cJnheCLrDMk8vMVn~9c7L@SBgh6V7;1M361k6iq5a^92W&=cXmE&&I
ze)mw(<gdob=g_g3aOk#i>>lljhsylbL-lUC;SGxef1qfFJAACO=11dnZp839NOq!e
z_=RnY>#)3aKn5V%1WgWzz~5Vfasi-oFrZU*II&OUaUj0L2PohJRCt2?&@G-xA9wjZ
zl&_pbdV*Z`Glg#)#*u^9MggmhW+#}_iDCUwg^dL7S#rn(xgwmXIs9G%nw$?!dK^cJ
zeTa=w^{!HJva>p0v_&#=Ya%la_`N;oc_6+EU6T6;imgE0s@$Zrok?zh<oFLlZfKlf
zVcYx-@G%@_{{iY!j<+9p;-Q9oPR4qu9X!Ac>BI+w>A4@Esl{oU6N$$#LX&SEDm*<*
zow9x`Rb&*4v*ISGXLjX+n9xKQsG$<VAU*&z)8WKI&A?iyE%>1yGO@d?eQ92sSPOOI
z?x6JjSL%2BK4hkUzVAW@J!=6R{s0~Oob0Yf=~^z>%xiUGq3UHG5+dEGp{_+bU;_+A
zDFMY7ST@UM7Ds%xf(WTGI&631s;PA5k$Mh7G0hT?L+L@Jmykm-3i%w7aEdS2x{|yf
zor7PA<X*P0gk`cX=brV*q%FzC9U`%a3lobp*`L6P`<#1j5*AlZz7m*+YY?EsXU0+w
zjGN8V<YTs)z~OStU(A7CfrsfwUJfoNm+i?nab!r0$h;)Ol1xzWAmkxaHt6b$hYkny
zoo<=tG6jo+k*<-KS<<ug0t*}?3z3!(y>fD0zQV=$n1B+a6}^I+M1*C5MG+-MQ9VU>
zmy2SFisSi;?`ae#IToix7N?aIXY>@`UoOrfD#_t1$<ru#Ktvb^z(0*H6y?JdO|T|B
zk}0xmNxGv^TH{#yG_v$rNohk*>0i;R_2m3yc#1@&i$O`RWQrcaN)=ijy<UFwhUoF!
z<RgYw&^yP+?;{_7=m9aXex+6U9=|PlydC*?h3JG<eZ%);r{~FT`V-9ZW2~{dv-||$
zRK75Y13Fud>swC30A@wwu)2YWG9HVRlXK3NlMq)>XjUvaVztx?3_YGDj6g5)(PB<&
zv`=MqE%`tosSs9FJzXVwNVK_6&LC1HU0Nm4;K-C+CC^YLffd9wtLw%ql@F`VFd$u8
zN%`x6f>G7NrPVecXtXmhS$YgLOTsm$PxCjusCi(Qpqo)6(omBjQf<vpt@)AqT2!sj
z>1w9Hn(L+2{^Ygp88x<tw3klT>PJ1j__6v{M)k@;4N5UfOCJxa!M>gCfrz5HO<V_`
zdKz0n?t!iqYIy9Zc~;KknM>3&UHzv?4A0!=>g*Zn{e5fHOzQna>XkF<qYpVrBI_hX
z2sI5Ko=KoMy&3jcle#pjKDd<LQ{$Pv?=!ALntKh;QZk+fXx2A5)%#90Sihie%&2-)
zTHnJ^hc0a>sLat&fG{3#+QmPA<y&9Y+t}>Xc=>E&F;3(4jHVZ7n_g<xtbJ@8V`wgA
zeQsmYRP5etkkLGM$jwWSp-SFh!Fs5Ei;N90;^`Eo_&Mk{OshEM+Repgm5S#5sOR++
zO=?q3%f3ze4Xs;;b>dUa{R}7}&F3)LDsC+luPoM8<vepcPihlyR+#h%=HNR|n#664
zi(+WPVyG~p!yS9UKB`k?H3EIDOk|Dnhpp<3?eM8~9<Am<r|0~BtuI)g^BvJ#j&4_;
z<~&bC6{Clz9_+|sNqF5IwlpYFyMc$*2p=wXXjU{|IijV@tkPd;SB~m3aPIh2N`GUz
zBf$B&XJZF~vD@90{eleX@;+q~o_=8q1aJkm`<}dk>qWR0rKw-XxMi0}LzhokRaRfu
zQNxQ}lMYqWp0PPh9TI{ni++J$>66^zA*66U!tG29n#9;bK%9*@SC3#JP!N4d^9h8i
z^kdJ>>DFYE+{M8c!l!%Eb6)tDF?9NM8)}sfMKfKRDje79)4)oo7A!TyRLgo<ZX%@i
zD^!)jy{}CvOHKRBEW2JhH)-%!Z9)1&Gkb=Qo_00TP4@Lq^yPl;8-VAM+SKU2aEC5r
zqlx>`5HmdAzyZ*s9-J=&w9bvYvM)8G2lxDHj;3iQO$QHF62yk8*#!mz3?TTAr~p0C
z6bME02A+t(u-LibU46U(F8$@~;o1D*Y_B1~xtDOo!aEv`xRp%|uU}FLpp6;P7*p7Y
z2D{#uVK*uaoK=MIN+7S6h{HQ)ioHNO>@DOXX!N=WscRr^@EOvWKwNtmv;#0|0b{vf
zM#1@-Q^{-uPjsXgyBfL5>M1Z5uu652iNg0i6`yAB<yB}^{_yya=AItjHGO=Ux1>J%
z;(_PJ%(rs9?!ay_y|T0zx^sOZN1I{*C@{pP7${5#td@(21D_ufT(9&9|3ZsgB?nBm
z#O)F<2ID5-P$UUV_9Rch*<LkkPs0s_@vDeC0C;^Zgme#6lUw|@V4@sV+||$NM(>ZO
zZxCbVMvvn4o5_sT-c5CA&%C=ngO@9=wICh><I@)=Ewtdo;gGPo0Tu{)U3GWdc9x)U
zma;()qe;@EdaCC1!krmhms$J=3I<E!As?X@!X)fg!CGXFc^72z3hBqMPc7@6IanY+
z(!<|=55<Nn*mdSPA5+m+&os4SRaAk`dIYL4D0cI0%i~Qz(A>?%ndUH7pbg>kA#ygI
zc7atYB7U==a7Gn53bh!@kBnFqbr@(!xrH8nmO;<II;7(cJ=gyh){1@Y=89qD@rSyS
z;i?C+E?el7>b>HBtC&6a$`~*&@!*Z;77IHP&(;mv7{q*2c-DQj!$@FCVUEY-F~e*4
zl1mWrj1$GXEh|{-636C};GEmd_E*}Qeii~m2iQyanxYwiXCd5zby1Do&TNnn=y+q8
zg1?Xl&d{Xm;aQkL!oj199#Cdn0-qs)tO1B7h`=>Y-(rn*FWcI;8!F;Ar#>6RlLF;?
z<r#;9GJ6yGuXUVZrV70S^DS2`j$abWfp+SssJ&X{BwrI!xU;@M-4~~Jm4x)H08}d*
zP4O6;nk6~XdzhZGtasHTXpK6(g{RMLcv+7F8_+#~Z5)>q1!7@Tw9&%G#};Pu&%(o!
zIKv{Vk;5_LPx`q=tOT$y>J2Hvr&n*yi3-LuZ+-M2NiKh5ZRr#^OAyuA=2yEVfOSzf
zPFz&yE#j5CY_)Dgm2e226m|0~fh&OXB+6T^y9FZ(v^eSYzDrm=hGBN@Z4e*n-302s
z<05y|x<`GZ?#=5pQq}Tq9q1<}caoPLC&^!3S3+OUo5tL9d*wIHXynbuJTG6{RT`7v
zl_Cjob2$^V#yt1RZumKq2w?}=uDQ#)o5JLv0Y_cnWXT<(ven5o6xT=$_0bx6U$%#Z
z9>>-On-&!XWPRfyi`nS8*PLS8#KXeS8(`ZFVq-n|!W0pPd*`aLHYyozWgzhtVd_G%
z6B~5^5AT`?_Irf32puiY%IfRk-E^a=9N8nk0oJa>x7c{6GC2K=gfjv_5H;qlB~N;J
z395L_aq6XP(uI>~Z~%tFHk+`|LUn87ptk(@HT+VB2lXNbv!Iy>28a+wH9JM<eBSn2
zztYOHy`O{A4j~aUu}>W-&eO3>b0%09X$^^ban4R_hOEtlWKJVlz(f>Oy){E_(p>Pl
zii0?ZU-Ovp{KPBKT+Q6`cPY*R)re`~4Us{XoyF1eKF0iJ)@-h(R91z{-ZmbFE5^C$
zo@_P+CpIdJ5!W-x7($p2f0s6AhSB=fraNDbaT$#_EKngNEGn7Cn^v87nYeF72^*%F
z)y6ChClbuX`-!!Fu1bm>W=3i)eqQjhdABsQJ+ow3cz*K<Pod7?;h9f{x|6j=YtJG!
zv~$eTX97VBu@N%xENJ0zv{OP8d+x1OX(_@!!8@mQF-*#LI1cjtRO^G*UU;2WGzobd
zvB!P7pt+a7dEHZ7=azB6o{`nL*tDRd2?Sk0y-(glNg3dEIk+?V26F&_w^Jz9MrOXj
z+^;g^oGMxFbvb0{ZGJ*8K<jzx%S0d0Sv;N6woN>5)5<Cj*nA<ZRhK9>8nF9Ay3$@n
zKqO%jS^a5M&J>$Ub?z*rs0MFgeq~RqTc%B{S#2M8Om@#lezgE8>C&8yOQ&xzbDhYj
z6I8tgaU2pms>F%o&KGoKh)oG0nzcu`nW=b=q$1DAWNZ_B>?gO>tY*B)^*2aYV`X0*
z#Xo-Hkg#2tD)}}7$f`NC&?mQH$jHrge6+24AH&19vaS@sB|}DnO9$aRrzvF_DjtBH
zkyRwWwoJ-uDy0xkX?iIgpV*jNe50ZqK&RRvX@P4^5BD76F6DnZ&6$O4_j6XQrZDA=
zT-&146Ky<FAJXu7|M2Nm-}Mej^E)@%<5NZVgPyWzc26yY`?xWR^^4up-X<}5J2<c1
zo_P<~%rs%Yhb40GrZTrXcN$n-;S1}CblZ-);(ezW0=j6DZT<Hx<gMFK+oa2aFUR9P
zFJIFRAd1H|yjww_6ZNuvb=~l?!9^W|*lMZLVbLA(ci|Qat6f=EG|B{w0&CB@madWm
zFBwCkLX3#-><n5l-iZ@jP_w_0S$pLaaZpMG#$Q>TBTF$RuFE{I>jnLsN1h#?8PXU`
zvR*H9QFi7IcVVMPuTYoljee8#7kv5^E%SH%T3Uk%O`=s&wUB*UB*ga(z1$yIrG_g~
z>yQsCM~P-D7F{#G@#fs5OD>>o)Nck2Bvw`7qI%gTC7lb=Q5=Or1Z4a`(V}SDN_npG
zZu;9F3LC_Sn*?L#@A}Sw&N*JrMFTIdx2j&esNB4cpTfTT^h%awjGJ<o3NnO8`6I~<
zg>d%N7I42-o009u-Viba=3|l<<m88X5;1{z;`Vl&93EP)4LzZ1oH<Gr>L@-tBqcgR
zkX3cVG^Xzz)NaESHmhb%C3hi=X9S1D19NYB5h<n2Mm-p=s?4Upk5ir`951}JG$1Hi
zKuh@L{Vitq7uUJEIr1y=BcFe?(%cg1G!MEa{H2JkD094Bh?FauSs_Dn)Q;9}1jpIc
zCYgF$p^h;4uC89a>gXj3)seCa^>iuRamd73FM=VKHE&Zzi3DYhOG61M?KWHj_@Oc@
zIK%_i(X}lWl^o0XWUk&I)+|~+t*f9USGAW{`8PG5IV1?3QsTV7BN}6L8=c$?wi6DK
z*0Q2F&-~g~%T&CWR6wyH^(E3y{GqhA<E7#Bv35I&nrGTBw}vy`fUik)Nb7hc4`;qt
zz9#ePna-`+;rr{zYqH;I)%I%`xlhk@{db46FkpK)uFU^Wt3GYUb#V(hYdTLoR@Zgj
z#UrV~bWvjL*~<_Y&xdEtmM@Lfk9D}*s%bD=yEWGE2G`ZQ<LuR~<gv#0=Us2VYPh;v
zJNA4%#MSTJS@VO@v8KHaSN~59=Eu8Z%@}Ny5m(j%NHgAoui_Sbs?h>Za=aB9>W1W$
zwInhcN6~b;g`R1&B=s6^W5II|KQC)Vkuu)St@1xgtA6?aF0DF7M+RX13?>8vFaUmR
zCmDbXMgzmJX95Cz2r)4!l#C2YN<jw2j=s@RpQ53mW1yvBVxVVbX5?UH;bdpy<zyG&
z<vPvBCn~@vAtER$c1GrmsGRhfvu9-$Wu=r96*bSp4K&VcYUy6mQ5Q0Zy<(t!!SLeM
zOM2qQ@f}ylO-xK|OfQ`^OYE|sH@9}QwzhV*Htn`%K5vt*W|#TGj?Mj=MUMm5O-E~O
zr~B8hU+=rl|KAc(ul${e8Xg&K8FfBA8etowJ|1JT9;59SSN$L^Y&_1~Azs@r;n_yQ
zg^7DM*Aoq560;H$6LS+I-BOG~Q=U$xIBcex7Nx~br8)n1In;<^&%fnRlPZF-BI*wu
zYUuAd)CVUVYD{1K<Hh>SCk=zU4fpaJ?|pop+0@ju)Ra^7f0RRgG2Xm7-m^W?)i>F8
zFxi2g?wX!{vo+l}@_J=xrsrU$cjwLE=-j}kxsl0*?a8+zZ{DsizFRzeH~QBi>f*{A
z7DfHA_U`lg((=apFB|Vyx0VmLRyIGaZSQU!?QZRU{&etp7lXl^{P;0|FNBP0<=L$W
z0!lv9?(&?rFfw+HOtp&Kjwo6&$La2hyslW7QY52#W&VqMJQqq#UsOKqO%b;4$yBc@
z=+BV4u{`~vs_<nN96`jSQC&2cr*@Cetf#toxKJ-o<Gw~s$*WT1D#zD7HKk)uEZQQO
zG;7Nys_chL%zA4dO+9s6=((@?^zrKk@9pK+y-%OKX$}MtGi%kA&$We9p1#^wSFz9)
z$FBK6>sjTy-c&KCnZ9RL?_XvsMKNpFSAQ5Tx=?zxzrN<<Sh;oY1MP;|)v3B0A7}a-
zp02-X`FBOs&2-)7rZ0y(b06QlY<|o0TM^aztBBh3zagTE{Hr2r?N<?%N?V-vI%U5c
z+aRTO9$rmbFVBZWjuR0T)XSgfvcp@zaEFpa?o@G)<AZV+3|2&KB;Y9gQAB<5O+*bA
zW@|kWQER@6sQF(-R9%Mj--xI!6oWj!6;Zc-FQPUA>dya4L`7poRH_pZ^>q+fl&qf(
z_~h8WucCoN*N$7IDU$5ELS8k_iHIuJ%QQ~Gpv{4z0;<UrD+6P>uAhjg@v>SwJaha*
zUq#d%ew6Zwh+2^Ac_N}#ortIdY}V63#0mn<TDKVDPejx}{?lYa*p56@E<U=F1m^pr
zh)VfYL=_RWpc&%*NkmmX5mA*Bi1@Dqrgb^uzlo@Moy68BB5LETpXZP!^sVINU}$eI
zQzWst2FKv^iHPci6;ZqUNC^tcmA{Lq=|%3UkG4)k)cCI=YWMIK+b<$&adlf9SCs6w
zUe5($Br-7Xn}}NVZ;7aY--)PfCnBmV^|1vlF=zznxAKdKiu1FG3jQjh)?r0d@xK#M
zL!xogU`SAU$QdxlpNXjFe-cpxqcKGmETg}OsPV=>h^SWIMbz%1d1hQIeg-M)&?&XI
zYzz+dwlA!I6j4$3@p!mH*?{MP)@=FIqBD}9fWD!)L;EQR(!H6cdMJb~khSfrh{{L*
z0cP|&5!D)E{nsMufE7bPNm7MfcEn{*v4}drH3&|AXJ8CD^-fF2N~1$P-HMiu*SIQc
zL0GhZUA&g!Y{=h>s21*jDxwmTX-0-t952PnpN}t;`$QY~gNVA06;YL~p_dc?xrkat
z`%OfZw$6Kac3Cm$ib#-!;}zJAyoy_UEG<N%t}K)U&&n570{j+qzf_g|m54frG8P#B
zoro&+2O=u;7ZG*%GHq}0`;f<;ILc#GTN=;$Z?1j8>qMEUDE=&>_FzTSo1J#VDAd7c
zgw{}gvizmrh^WfUzO?_lB5LdpBC3!m9?drqHRe|$st>tV*#~rL&ciJ^VZ;AH5%mJ?
z6Y8q?!aK=s5OrMRVaLFgNm7>x*ei&78qs_M$wWOR`inisZ$;Ge?14D+oR81)JfzF_
zefE*miVt%0ABd=gZ5Bk;p8Bu8iKy29B@vZ8Lh-AJ`c#&0@V6prV_jD6?4t`l(9)uE
z>M<T?i(rvI6;Zpx9}{NQXa?l}sfZf&XCmt4FCwb=ABd<dUqw`9gb9gE9{M8Jogl!k
zMO5FfA}aV75j9`rXAzZLH~I$=b?a|MRMtNiQFFeEs4!^!pNXhBzZOyRe-cp}<47I9
ziKsc>MO4-k5w(g;a<%|zzeL}D3iih$D#uq5RhXEH681bK3~3y${ey_=g%SQc5tS8+
za*HfVjYMr2<c~)_-j6J&jjEK2sy2?Q^^U4bjjFGUYLue=3lX*W2N4zJ7K*PgyccE<
zVhhqyB%h>)QS3)AE-`;`<H`Gth?@N?5jFj15w(T*Q24uu3i|JfsO5hxqJsZOL?!q|
zM6Gg58laGOr~EFWj{H**wFpMm0|Su`0;1t$*!(}`1`bdm4I%=(gB4M;A!Ov~HA@h$
z?;`4eo06cI&i0P#haW`L^6Y<2M2-3?qDK9ph+6sQB5F4pW|?<(00vA*)WE-_bq<`|
z!NGm~n}~Y*w<7AmER?+DY?FaZkK+9<hx=?W6%1BHz5R=bTJ#$cHTy(Ft^5-a)$W^!
z%KBAAo%ofAT4{mDP6j#7eh3_VXii^HF%A{V1_u5hqI%8#PDCXmS#J~J?;>WtSLlmb
zh6d&Sk%(IIYZ0}DI6uz@_q&K%^j$=a{#ist<FC8@iHO?rRYYz5E}~leoru~^Ol1RV
znHOoZ6Fh{AU`5nMxS&KJf8z!>EjIg>suZ#%HxbM#5&9%ilvp4kB{yBr03XI%Xw%cF
znD-kImEx<23WFGI0axZr;zWQaB5DK?5Qcx}XAw2}FGbXzxJOg<iF>?cJmok*R)BWK
z<LREfPnV<md29!jgHQxF^peS_cvKb*qd$V8LFBb`tpV?fDx(!1QR}6NIsK)Gdi%SG
z%J;8`sDVF-sM!$l?;@(lUx=u%e<q?<!v0GlDg{Yu_-W1^ULc$L>RTvdzG4?0%<vQa
zdU*>~BTC1zb&)Lm-4<lWn)D7B_EH$d7WW^EsF^>BsPR}46##L8KvWw^rr@1cM-W%p
zE>-7Ft>jL>MrIX1*Iz``GD4l{?;@(tKNC^2zKW<VUqw`FH1S3BiHKU5O*jL941yt}
z7Nmt(5f%N9MAX9XB5D*2d>t#IS`fTDg7C$4S;ze(qDBFJ5m9Ys@d7sRe-cp@2oq<?
z+RI;B#Qh+mPM?UV<rbu&Uqw`(KN3-Geh^VB{#Hcw`7WZC|16@yA$Q$Ku=XNwj`%K&
zupLHLzkz?Z9D-RPO@MtBQ3XhVt<Xf+XaZJ5%_c&YL%^FuqGn^s@%?Ik!!xEYsICuw
zkR|5ZAjFEOS>Hv}K|t3`Hn8vq5w)TPd^Zl9fE7_;g!aOayXAz(7AGQVFC2o=!h4#H
zUw{=+1HX%?cL@UANNoN{M2-4cL=`>}QLO<Gy)ED`A}TrY-9HmiYrc!9iP=z9GNSsH
z$p(_)rsr>>6<)+rkX())P`%#{c-%gtH@jF)0(v|?__K)0M7*$p|4l^A_*q1CBTj&k
z6?_#@6R;wx9&vp(@zV3x2mNnE{b^O4Np$8pa2^b#9-$<U#}{WsCRRt1n0^vbH_QJ(
zL~VjieSs{9HN6Y{Swy}6gNQndSAi8#;eRZm*2KLrWnMz$bn$Vt(N&WQWBl57sz_I>
zN#!7xA7L=Da#Exq@SYl(4UA+@uOB}iiWd(R&?e6ufM&S-jffgP`&C4pBW@g6ES6ho
zzq-=tzta6+rKf47Z)RoScm>V8IwZF`a&>joe|7x9>SWXE^vvqa@#-w|+PvJ_+pBAf
z{%cD*;a3tp-wiDvw;+?5KeA=>aB`s7;0wFVFqkY)EETN${~8h1@xLXa;t*#6zKf_w
z5U1wD5X<%^^W7HR!`?wQ>iauCiKsX~iKs8jkNR2O2H|`;lXj$pG5^xHe$@GdQGDsP
zbK`=X--m!rgv5t!WX$oMoa0cT#Z{K$D0eYVaqj&r%ngI?VcpJHQZhC$DTgt7Rsl(P
zO3-E;J*N~-xcyfms$L#fx_qjL?LhwJ;YICC>6>eBCx+kaW-Ek{a$Xr(($7~<611I6
zwEsy&eV2w6QRTjisBDBmA*a~O1mb@uqQ?J5L`B=1o`3tVil|$cAIbu+b^ncs`u5th
z^SYAKaXU9R<~pv8^*_(|+8oK!zi&DH#dm-6-OEB(+U4k-QTL4A-;1bhe=DMDe-%-y
zu6dR^=g~b7aXnA()Lzt4QsBE-Lw9{AUWM_C*tM=ze=U+f5K&2fFQWGTRzwy0t%z#z
zD-o6be?Ub2bc*rTiHLf>*#4`CdIl?^LMR+Rj%#5>RBaBdh}!aN5%pXF5WpBmT}jMG
z&|(rPd?KP={SQP`<v$it?XOt?0A|V30@AicdC8M?n52wjF<czsTI}-w{`eT9S`pdL
zBB}@8T<DW?3y^OjYD^FqE22(ty53kR;K@|3EbqvDaJtfDt%;SFaLMSah`M|tqB?H|
z-?iqa_(ep0Pt(&+e*TI+Uf6dL_2WMkQQZpIsst3L*nSjIXMZE2s{Kwxy^4c<O2<18
z80Gtuh^qBhBI^F1il|>uSP_-}FGN&@A4F8$A4SyKpF~v46A^Vv<o6<K!*4}YiC>AR
zfUhEI=81^9K=c0w5f%PFETXoW|1XKC&Ho({wI<4A6f2_cpZ_YNj$=hsEu;YbB34A5
zrD?{BsMoO~YWO^D@E?k(spBeNMbz={B5I&n_%{)C!Xk=f@<c>^f)!EWKZ~fme<Y$(
z{A(hr`8N?2_Dw|nO#8PY>cCeKRq(5biaHTdrT!xkb^5eidYTzlMD4<gsQy2QsPkA6
zwe8m;YPaB55%n$22dzI7QLp0snTQ(xi-@Z5FN&yse=nkH{V1Y(eG^fei~h?Zs`H76
znvNAw=LP>*M5Xv^5tW{!{g~(){HuuiMa17d)aW0JsCZZr^&{<Hi>P1NKz}KsPT`JB
z{Tm``veC~XD%oF%s7*%yv4|RK{Y^xj{0kAa-RMUV^=v2=0RZ&JB5H%tKM_$W|58M?
zK~S~*D5B#1iHO=D^NWZoY%=?gMAS;NKNC@l{!B#0|34t2QvHV_YMa?#il~9+e=MQ~
zntu~fi~dCs)e13z_$H!0lKD?XRH<tOBEJ$*-TqEQ_549Zz5N>zmF@3D)b>9SQIA3x
zP=79>PW{Is>g*39sv6SzpNpteUqw{kZz5{8*?&z$z44=n3OEr_TmCZ<)$d0URpeTB
zAn+#<)kv*e<4;9YGUPuHQQM4uE24%Pk^L;9;+c?r7g2pef~tNaqDqAtVMSDLTvOj~
zA}Ya&h&ujFM8(r0!-}Zk=7Hd!MAYIx5>e0nuZyUG|F(!q<MTfwqEh<=hN%5_L{!^<
zB%+4@yCQ1bzb&FB|NkQDn#=mJ%Lb|ICKk95blsM7-O+LVbk%j&#dXi$bw9@S^8?p|
z$F7G>u15o|UuIm7A3$%?;(O^u`YnYX3vL{#fF<`q59{!7X<~er!Vb`3X|!SPvtb$8
zZp7~i2~!9ml5WtjCR-Rd4ISoF7nV93cALjNU@6QGwt0Ia48J+dC(w-!>XsV5Nf$=w
zALmZFN9>QrWk`wjGY*CAg;{QdFh7Z4*WJpb-C{G}g2sA0Cf-c#4l~XMUm$S1vk{`5
zjnv-2cN4}nivuff;A8Y)p?Ywn?M9eMH~2z$gqZI3nKxU4g~;qB{F_Um?)IDR;e=Rk
zRCeqJVOE&DF&;dO&}#`#zzZJ`8z#3$tm=jDKfdYfhOfSde={3wRleaLj_($ZkA2JA
zZec!dVcuwbUHng{V)1X<e`0P9!}xD#z1g{l*`d7Vska{HTeKse;$i+?f-fw>*bQL|
zM+!Z`mE6EJgM$K$@%Zh*R&JmGH;`x%?!~xUH;Zs(!U-Lp-g4N(6-S3y0ub3tc#=lA
zfE1)ppu2|J&J82{JI1&4Xz_q7_<8``3)yb!-AEN-T;=hN=L9!|nnT@-a4!Htw3b4>
zH*n7ZLTvTIFg~<+>Kh?`_O~u%gZ0M27nblM3cYDr@Gf+Nm0@^yc)a!Ez-F}gp<dqM
z>-&*=_znPEetb6s6j!4z)cmCnGx4s2D%cEwi_48INrkz@?b^Z+zO(pNsk_D-VeT+c
zYF+5{FhWWDgTk!cD{i+vFogbfyS9KZ-)?+m`vY4v!f)etc{Bb67)ZSc*I_nH3yrX}
zM{3vM35196jDyedcoZz*Bb)IqjDyYg5%L=${`h{9aPWn?P~Y${t#Dk*Cn56i4V5^g
zlbc`n9=^Yu*E!=*pK-9dG2UHsybEea9j-@RlAAs)TTb>!<2pRWeS~Gp7R{K?RM_bU
zULcHyaj5P14i6yAzYf>#{bvVmx0~a)i{IZ`;P&Eg`RopjbP~R0X1r(XhHy{y4hZ*e
zHQ)2w2W4WdRyUA(T}afm4POAr3yxIv!Y;Yo%I)&liw)5h{-hO$mlht<_awx4-zN?m
zP{R-RJ;oDsdaG$JsoZ<iVQ@z1DwhKYzcZ3^gZ`n*v1btdXn1O~Ny)r6zrz+sPa>aD
zrSpd^&c0O9YeQuY+gt;gGG1FNAGW#C*@|Hl0**U8L;0L3AM~-4r^PDEoo3sGs!8IK
zSB?bO4TtWk+_b>EdLu6;OTPTL{ea!3WMwpMud^eUve&#xK4FO<(`4_lTnK1;aAE|r
zI$7y-cP)od*2P{{z3s?S+*Zn*>%!im{uQZ;+?Ff#;ja>QlXE(PUemv-=lO8uoJP)~
z`>vMAna+}@GA<=0PWeN#s4z+)mm{gIw>>Fhu4_lqn@*lPY9p%ZvCJ1t3x)EO=nU1>
zV;6ir;kz7IZyt9a-c#ukOiTL`E?}ZU*eGwM-}3TFz#A6%0?%44`5N&`h)6q6XR5Vw
zM*^WpMyhBuN5u$RsvN~tG14m)p2@NH`DvGu!g}9|#d6#pshpEaOf@j#TC>@w4ujnB
zhVm4Uu}28L-l^5+=TMO3h(Ay7!;zrQ_l)D7wnQ;$qQ1&Rzm$IPg@=ik9iKf+95cl@
zL^8y-j>HOiD(B$RW^)*8Qe}``SWI)E5bNX8vQWTtuuvvHf6H?zH$=!~ge_5KtX(nm
zenwF+5A|Kh4U#j7OX}f5V`{;;w9IzE$f)olE8c=r@$TT_08?6AI!~B^X8yfPw;c*b
zY;w<2*ck736{b}$ay)r{aB#Z3mFO&gMMru&xcCKM1AkS&%wbuj$ZL>5%_}Yj8ofm0
z27#xqubfS*_$s2lOZOG5R~wqcYgny66l~n=IqTXWa#@wIDN${RfHmRmp->ABakP*>
z{6jDSijZ9~9Q9p9bw|-Z^cCr(b7~anV)C8Nl-u5j9PQ%F@DuIfEyXnc-z}oP_Qjmr
zpNqnZsP8fY<PJWRHp?BZHelqAHhbmezkHg)1jrwM#<o;2Uk)+y01!_L4n=t&o-7PY
z#<bvymIsmg!N5WD>>6b}!PJe}8unu38Wxt9UC;w?@$go1(KuQQDMhLoQ9iD^9CCdH
zrQ)MOtf|^c;>F5JO1u<9${Yk4lVW9Zsd!MbZ%vzbfDp&B@obCb5g2ym$`()X`aXiR
z8wF$=6)VxUk1|YjW1~I9?_dwKq_Y_bXGpFg>`}&nyq>kBZsSos>Oe(>OQGod>&hzj
z7h;~GLB*qW6mEg+ES#+QtR}gnZnC!LcAnw0zUNVY+W`s<vqIT$4D#P4TOdGogXzxK
zCXiBVG38g%YA(4UUj(uf=GWsEV-7@KT&56W4yeN`z?&zwJFj5#I@OB*cs4<s5yzx}
zXHio^0iWVi9POu6Qh_`=S+CUjyEbGKvfioue8C99+jX4|#-gMKLDsN5V2+Tfp-#Xw
zJ9QfjkMprev~iu1j4E7-e_ua7B7d0bqx1W-3%vb7m4Z}xGAPk*vXGliB9~p<y5OGf
z;8XEEBxx2esK3mS8Yt{Qdxko$B-#>PB+ZM;Pah?>`7me`G?J*#!K0;}qGubVm_)-A
ze%5O4NkU)(g_md1b)DQuc8gXPrJEolJ#Uf-l^_;DPVhPP<ro!j3PzsQFuJ^QLn@gh
zL%k4ttv334alT%X1}ZyQ!D@`)IkirfZTQF;(q+A*_JzbedMXjIi(Tx75r&^=3Dm!k
zN3xsll=wU%C_cE2Y>up{$U2)-nW~peKNNS_B5;lc{;Vr0Uq4BeOpT@jc7@-w?I9)M
ziUl!4FFK~SI^Toe`7Hir+YgqENg>pno^yCcTv4&SL7c@q!f`rm7qfbo_$YN6G+HT=
z?^kdL23onBUf`0f9qpKQPO5>JPmf;Khbaqa1@Rkvrsm`^6TGVS=>hXDqQ2+8mgD`5
zA-^J{Bpds6@)F<IUvvaj3-;Foctv8oqd}zo9$2U7S%fj5j+}p!hmu~MPN0Y;cMW&N
zBer-lQKt^Y`bsE3$xm7Uv(&1XW}I?08He=32-{_Ko>c8M);Zdj#_bYK(`VE=kbNb=
zt%<a!n2JPZj)FHjRaCCV6x$N%Z6tTA`g?39Kpyez2d9n&izXwClK0%6^{)FA$(Q*d
zIl@JI?XF(EA4Aq9RweDTMs^`%f&abq@UwwiO=1s9N1+KMNR~=d!mRa8Be_zWmptzH
zIl5L$vSKo>dZzD%WAtniHx>vIHt>0L92}CfS><G3RUj^ST)tOl-G5i^%#@7Jh1lSW
zoCU@NbmhV^{*CFw4=(j9-<ccCPPQ50{0s`$7g(v<Y|}YLt5U>iKm=BdVFl>mw0Rsn
z!I;lY!&p=G7DIuxD;tI=5siBE1^aJc{E3?WGs0^zp7#V*O|ZWw7e1$Pf~sDcR+b~c
zqN;(!RK65%%RyJqXxp(5)hyu?TgQX(oq9<UimEx1v8L(>aQ=87L~Vr=T2XCGkq+@X
zr5+NZ-Ca5SF<!hO7EV|)YQ@N1O;F5swJV;vm1$P5s@9Kn<G!XqSK`LfxqNq|e5zvg
zF?!URpEPv-N_vw`T<+N&Ju|LAS$Q$TXYyK2`m2Gg&j@G)%kP^oOA5DAd5z$TnC06&
zsQThyY@tYjY|uRCoV%uq;SZE}zSF3g``D)FkZazuBS`N#M-8maI`hG&is*YE^<j-(
zD7i-&q6{06m<rF=A>+IKr~7;E6?ZA$>)v3eHTa;_?Ag#ToJxHmICV~flg`jx6(7S&
z*q+Tdc2TEK!DobKn8IeD`CN>S%RIF{TK4@t^J;gMRJLw5gv{D8)$sOxQKk`;&6>ii
zyNE_=n^y>Ueh`1GV;F=%9%XejIRA3q9k!{)PC42go3+e3*wfrRNWn{UZ)BX~AWIFy
zWTJj#u0ArJJI4a#$_5I;KoZ#?IT%<a8;hKRKefrtg5<gpvej)esR(Irgro&X9Ihk^
zP!a+tiAKXDEI<UeEzVXWWG!apj_7blvtO<tWK$6Y=@zFG6}hEQu>Ds0a2y)rRtiQ|
zat_QK`IVqkZa6gIL9}H!%(Fo(`>imZV0NisPMaJya1M*s96f}UoSKz_i<O*zj#6U|
zW^c(`4HN)?#4Qlg)gZa?Y^HQ#xoU(Y2S{Ka>oKs>@VC-=w9*^ruzM;pJg{IKu!PLF
z$q|I%&LhrMx8WyP2<^;5`GUzJgJ6O<tOr4C#)`a+tP*8POf#%}q!F?!tl0DcOL)+!
z%pBU;R@PcYAr1s%PaAtAG3hc)+%)$zDwluAin|&pY@u`(ZNVpKtyjh-Tpi3wkOT9;
z5lP79ZPH?{wBkKt<rWO0-4EiV&6DI{7fW8yoJB};D4mu9GP~iB>*cX0Dhg>~5Ym}e
z=oO{27D__S?96Vtr_i}llX=oJmh!0};Y1Y7bAi6yTF4tAYj{GdD#)PdY3C$w0fkfB
z1WDflRcwSjfy}gXinT!TGK8qVwtO{6ylerRo|nG@6tF<RJ@Q*>ltdGQS!h|ATd=IE
z(zJIzC-N=DtO7R&_S19ZJyH@fR@C$eVyh0;+9i>*Xp`}nr#Ds<N(C8IP8cQwnZ4OB
zrMIaQ=_m+ta?dO9!rQc5-rbx72}>!$4sZ-z@=r|F>R=Y{T=pH5Ql+i+DoETI$j_%J
z#Q1QryUj!*hZ7DmJ9x+OLg{pMJ_{Np1J;z-V&%GpqP{hE$`QlLR?8{?Z<Bh=IZzD}
zc>9h%G1yXui?&ATbc+?Yx6+g9HgU9~xCa}#aVtMFoBdEQTMSG*6()cNa`7q36Xm)b
zC~)rpC3ZLmyp_0REqM*OoMOo28o6lN?e2|(#AmTK2gi+CCF^-*=21I6|M##yER(9l
zD`m+W#|0ihF>erYsv$q6BG~zZ*zMmXOxx;Q2{M&<?^cv=w9IKc87=LJqTmU3*0DGN
zRRN0kR<L^;Q9BlG^lmr;(cJN~N<t76MSj5*3DvUz1Si#;Rm{WQ9VH>SrKr{{q--&v
zh~ZOr+i68a!YoL@Etj1G<R=j(o4H7_-x@U(Es4ai2FPT~HnzZ>l{lhN%6>{5`Jnh|
z=F9Cs%2VVEYJ}R+59PoxjdrEPzz^_56a^aiaDqjL0I7qeb@_uh#fvoiU^*>Ix;r58
zx9@!Mq9O~BH-^B%#zCBJ_WCQJoDyUXn|f|AR0xJ6SMZfmg?yz{$<%q!l=1}eu4#%s
zOas+NK}7@LJNLm&jY!^bN2-l0>h^37%P7LuG@U>kwP~;%PjKk2gGO{KacYZp3xYuE
znv`>!^0WfS2=W|{J?{=EeN9=i+`$0Z25AKIj{|geKo{1q7rdQ+qg|pekkB5b;pwDa
zq`)BFMV*gQk48bl0Tuo)B~vjilzP0fvaRsyHtPL0QnCm^iy)4jwsSC4zP|qav{HG8
za`9GH`r~$%@@2R&tI7*U9k`RW1>%(RY3**rlbQA`L6jdUvciM^u}5oc5BMfHtQysx
zHQF98W2qSqe=(rU5MHX$;;hcU?2+%JG2YS;d7`PBf7MjcZ0d4>I3yJO^Rz3<rfsWc
zAfD+sA@N|2krKh9)*y7sS#MLh9Z=Iax4a%|R0DOPy^Tv8B}1azmfP-73!c|TPUNn_
zt0~zCXbq!5JV!W5iJ>NCxJ`ktq&5Tyg4A9YTvx|}svHiQ&LEhd0)uRBXR@*s07YG`
zz~qRcjK)ct$Fwo|wb5cl)jmar%#Y7!f)))vF!2X-87e%TY2}YT5ml2ak>?<a6nrk~
z`#_YI3Ks!k@RE}78I*M$f?+!NY<PlDV2WJ+t0?bw9hedWtQ9L+@)!nj$<E6uD=t!e
zWUE%-Oa$-51Yrlu7F-lw79dY3)iNxlifAZMVnPL<P^#W2cr=POx|M%Li2<o}JZdQe
z08$vQ!TX%mXP+F`t{-A4)o4K>EoGVLR?2WJF}Y6LUZ!ae6iQvEmMuS_R0-OCqEw5V
zWKtiW(E`6rcu9+;RFy%n77&(FO=ONR^A169j%QPq`F8**#T6+`BjwdFKzi?XdLKS3
zGQ{wg_*<rk7E%?cw1|9QP>e86)}vK*H=MQH_9<ZaDM}FaHi%xFpT6Y^RS}A1A0=9@
z7i`vcuKl6}8InOr|H@LUXzD4AGMtzhXO=81rP{)@5!|n`c0#FE<D5{ceJDsDipjY2
zgi?+EN~!h*6KJ*5{zR#^F<~jy=wN~s1c7W2H+w6|({^zzrJ9YUR9h_#J9IuHplLwH
zz&6n$CAlS>5~@y>xFGSmj(+_l=0Jtg3a~{1Sg5*%%^Ou66HKz9c#1z*o<Eq(7$m6W
zC~m*4EPF#-_akW$05;wFuo5g#)~W#mQG{ax$zVAA`$`N&EwrhR<%?QLTTtf~K%Bln
z3aVgvSp^1X5PxPa4iqW3z0Fi7Cfi#j?<_0<MUvF5u^(2E0IK0HKd@vVcbc|o0oUss
zg9*Ep<lDsr32^cU0I<Gb!WApxtXL%TdC9~H9dP)9u)ukO^-IF7)o?@pvUn!V3Y8HQ
zjY7vPvx0ut1&V1@mT)|EhH|`)vRFntjk(eV`A?!$Nf%ot&G_4-oNM4m3Xker8E@cH
zN7n=!(y%RMs;__qTC(v5YS_aSR1wZi2TH82W%2|Ya4e!~yl(E=#-WOkw^wA!^-%YA
zt_ZD^PX&}0D1A{uRWvEf@4r>A!?ck_MSN3K{oGP`6DMAfA{oen1#N;E0^5v*gJj~S
z)MsZ+U*0l%gH=>pD+;iRYAX*mHkThv$d7U)Qj&Rd%jKS!L_n!#8NbH3GtSgU$ypSK
zt|P~EkUV>vWtJ0nEJ}rI$MaC>CKP!C3WjOzNEEfe%hqmQ^KyPEaeeBOdbtOoNgJ5v
z(I+AVVYfj&MJ0E6DZ!zVmJoW2BK7IS&W9y&$7qDGI<?Uh6J@pmY6kU?wT23cL_!hN
zOTnS4S(97o&J9mxM{cS6iG(`U2^J|CLfYvTL^DM?;4ola>KO$BBbNSq!WZLBQosUI
ztg+kP{DN5B7fA-k6w8n0utInC)<EnaoM)G|<Dp0^-FCKVg^EkHMAe8VCyJ_~?E><w
z9*|PYn|<F9dJV+N5oEHksT`=_@*!9#5Fvc(lygRV%wAn=mStQDvf%(Es`U|4-O3Xk
zT)*XWD!he+a!+~1C+lOWWkB1`V!JnYwLF0mabVd^*DcG~R(L*;th%LvOZ=fpy*IIq
z4-_n9Tq@s(BHh1n+ezmB)aU!4XR5BxP7qZ9@I!4YGkP6f<jL0u&yGdq1NT4g4j49r
z2S&j+Qjm{pk%DnJ)$CCWdd@nu`$NZW{5*B?`#a?A2)aA*MMTPS%KJ!+QAn8b8xb7k
z4v@7OhVjWO=`xJ>gQ~j2;=|h`Ad$ErImoDupNJ7!Dmr8La)b9>a|AVDo&2r0CPb0D
z%$A`DN3OBzKC|?@d8M2}B@Sl=d1obm`DgOVpTA6gWDhNqH}y$&^+}mRo~0d<$_bI-
zP}qKSfghFxc^$&)GYyXhWga3j83Z+jkFEfNxbhL)hf2o>ZJmd0M2AY8`C_?HB%1P^
zwB$kFLOXGp8<WNXhh!xIT(-a|xPW07{<7LD3NTjM3O9W&pJ`Rh{`@PYs=!fxyPyq>
z?vi{ob%3y%g(!oB`T%nL!36n=GN~>31xn_4QtJRjFAChS_DoxLOL?{}K(*TX4F)Mw
z7u1%kY|_v!JNtSb=6&AY*TW%!gmCzrF*&tfupDDhNJ_)~9i@-W$0`;?blC=m*pcB_
zsS@SHRWF2GzCOD+%51+u9N-tdZtM#Skk2P)JqijD74th0R0Fwop37@_upJ`uqFUJC
zwI_nAalr2OnZzhKv0<(3cnhQmAiENj)YkUG2(>p44!svdjYKIgwd%i&{EX8s8gN{H
z9tY8BE+=`VTpYO9#X=nr&`DD5O^%&Zr4>Ml=CBPx0``%8_9C5c?$b%w_0jWaDHC5i
zmMt;n@K6;Gm{a!H`Mhn#aY|@y-zo3IJT3WIHr7^dt8A__$AM+j<SrNs21<dU&lh^A
zUchsd@qv*OFSAY{)ox$<n|$af`T)6!0`=iq?yF<|n`64+;d~bjJ~O<sdZ!g2p*0?N
zNb6zq;vTP2tsmVDyZ#IjP@9rXoGrtYcy9yk^|13-EhQWBqPtVx-p+IwtG&bE<?>=L
zVS4+E7)zJmkvP8Yl1VJQ+mn@nWhryJ5&5OsGw-!43;OXPDgypdcV_R!+)YfQR|Rvj
zH_c1yL>KbgYb&&pSH-`GneFN;_8d-my(v5hTvlxXNFTVu0f!9)SwLdOrB+<d%s3R0
zfT<gcAfv-O5g)b*MUo+EO80yXcy%X>W$n0PY7o%`UL1Gs=YqQ!iSn&5W@BeH?)(0i
z79K{PADXv~x?Vf`uGY^{K{;xCexf}m$WH+rZ+Ub%ltM$$ql-$J=S5hmljCPZDsjIo
zWq&`F2cln$*K+u-(@>cfjqou*sh6;;JSUP`B~7f#XRQoZZ`zIw7(t`PpE#((bcbq4
zjacB}J^#jdr!1zDSzG)R6-EMK4mWbPQ$AWPz2ITza>5A1rMV6~o7~A(Fh|^eC{3+}
zj{+@+9b6G9Qd`%5_wDpX2#c^5Ybc>V(efg_^y|xu1X1&?!B|7pTa-xIQ#x2my@M%b
z+C%Ik)==edzovgfWVtZI?e%^B`wZ`&)4cKf^!jP@<twxVgcw~_-xuKOTD9}{`0z@A
zybNrcVKn3+aW`QjhEA>3d=?5;RFsb<N+qu22d}1cxD1|;!WycI36Xg7g_A*ALETwA
z4@RtETr&$P?;qSbrd!GmVNPGly}Q_#p~(&ca|XyT*;@qg;iMVDC%YYEb%oN$*`n~T
zT+c?tj~65~!V3hb(?4w3(h7L`m|zXn93-Lo)fk^#<D<cAQ`$R^ectEcvSe<cNaPte
z+fQ-Ru$(TBccy085Fw^6I{(%d&ySj%HOXGI>l)tu+}iMuK|}gDkM6YWsybKp*RIkF
z>_ogHFrT+X)p#$vbJw}Ie8RVjQdHnzQH=54TIT_pXMV;k-Vb0tSbCUsbx21l5t79e
z%(O7qL4SC<oG-4(l$Y{oDBY8C-~>^%yL^Y(cm<^?G<D#<K%jUWu8lQRVR;PK*%8!=
z?vngV+Duo}g84ibp9b;7-X>3+1@js!5MPZ8Ca)xrRT+w<(<@U*BFssfzelzUuswHR
zoaQY&u1M2F7AlfB2N6M#Je;tj5-UPM9w*nS#LYpC!%0X2I!W0{+r!m&R4HQXl(}T|
zBlKk1C?|s2c?|R;FZSiir?x@_tjMEGAndeRJm*jIxku}+%+qA0s)#4YM;j$BFueC}
zKl8vn(#<)K`NO!f++sz{#l}2_iSaH);83h@89Ro#v^z#n6cKMiwZOvgxl4`0Anq#G
zK9wx)R;H(jO^IeBx3q_zo<{pmp)KaN=0pt+%0Lwmq`Wa%FKKxTOHjEjzS>-@8D1-k
z**K@zKt-?MK085!EI#io>E0`y6e;!9wn70PG%pVgB@a$>p1Dq_WjUFU+NoS1n&zN+
z%}y+3s@je}$U(<hQSAP(={5XD={~E;t<)FQ??f{`514d{B~RPDmw8F3>wxF^;1l@$
zIqNiCkKOGwj4Y23rDMOfN;T-1hg;FBxIg65c1DFPzF2$lOJm3CEGArg1<n$kxXG$~
z=*?@&=XwTRu8d^Sz2-T8QD)F>Mm(R1)<Nq!Cc?mLx4P(wUk;~zj$t9SK=SEukc@XZ
zuyhN+bg#VRB6m>CqsJCROW|!sW`ogBbZ!!vUk|<XROYLQYQDOB$tMoavmJ&fD+QKG
zZviz+;4o!wl$uK`ylS2NM22{$Aef#r{=7h;qMvNVVsCP+8Shd>$i*_V%@U&~QtI-1
zoMo0@B8@vlM=O>BS1dR)uJmrfs?#{Ho2{ph^#oH_AzrOm4#tnS<|bE`+%2;|cQ`q|
ze5*F|ZtHdYjHyAs-8z3<7YAR43Df*rHU2jrU&~<_9}uOfoq8>B^Umqlop_QBvi8^A
z?w+1`J4)SXd}`&=dyTO=mzpwjl8?quCm|T4%u`Gbub1yUl6m#S>S8JPo#kM<=~?#<
z3MTU84dm}c)OJ?t&2V*7E6Oa|4&F<fkysIx?DTjmITDZ0+H}E3r0ta8=q8pnwPwN4
zb}LYC#YLFfc(#mpqVI*B>WjDG&LHkmN#05<=D%c;oK5_W!2ROIsUSPUIz}dfQsjc$
zJ8}EZ?cNWUiAtvJB%6KO)%-=b83&`J-&{5z3*CP3*?C^ni<MMl32vm|2a+gk?X{rZ
zMv{}*Gkaze^IY0y1rA=*G@rz}#h?e$uN`!)m0zY(e=6cOT{O*ZI~AvL2C7jW{1{J$
z;Iw@wtBYPRZ6;<CZFVdgu%H(s94n0qm%Ax#MFteuzS8?l&52CsZVbE~P&Nq<ljxib
zIn@qpQE<Bj>7++6Uhu_Lun(?PH*>iWwm(eFrbIZL2%#@zn4u#2^z6fzMbSc5Qpu&3
zt3KtXrMXI}lBtSf8fdUt=$Wx_7ZpJnG}uySek^(oUR8+3u@;`5Lo}5dUN?(T@(jd3
zHMZMTsORp?&G@#S@mZ?&Ro9eeQ<N;guF;j95PSQZbmL0csY!(!S-SQ!!Zh`9y^OsS
zS_-|BsqIu6WWYdOSyU&1vS`iSEjt+f8>^T)WC+t-BtGb)?E_%j>FW@O?Ur%F)j)}0
zJ)n8m>|0D&=mC*SU<{15fw7kPU`AcwebzNQ+FMSE?Ae=MZ6CQHEsKZqUZ!?N*>p_r
zEEEWbveyeW&(gX<l?h7(_v{S)h|HEythLO}MQ>_A?*Px2pz+HZ`0TXrifWSY6_Z?2
zy}Ev>+3EG*n$vSJ=6$!_!@1K+5v&7BI@u*59^r3}-1XxlTT|qsw9n1ip~YxUt34Nf
z*dIaK9+YNWQ@=NyeKA}p{bO8=lIW_2|8~m4<h{UK()3K>WFub|F2^=J_Hup4E1m-?
zzkYy+?hbwVnXQea#gefzhyvcqriH`EgFW(T(pLaNaqOwAWWtUqw+KrK$iU~z4!FvQ
z6=7fuvj9z<(ALiC<aA6g)ni6L+=J?zoqGO~diejt-hD<zwQc*NpOvTr3aW~nDWZVn
zEFd|9NKz3|ilm5uMUbo%IcFqDDuM_Cl7pZ~2FW0j(Lxjf5lJE{!o#)K+Iy`X*SYVU
z``T;wew&}?9HWiddhg@^o3%~MDT<@p6(O_W+AhXI6-Z>UHnYIyY}H2?tq9p#{6}@{
zBvc&wpsE*%h6KHd*uBcehQ}UaIX!J68M@fYRn;Die&rW>*t%9098WQ~+3ASxB#C$S
ztIev%QVW(-^Q}{#5Jt%eqkG~>eM3}mlkR(qRD+w64WrxwHXKeiU_N^^2ON`=P*ku+
zbzY54(u7vdgl#$ztujXCVS`Y_LUloOXOp^2Kf+JA$-RQIb?~yv+R$1=(%*2C+SP-L
zC((LK(4NN72fBT$3!=BkM+J>BNjay>4l(fXFwEMiJGO(5(zo94u3~(~SQM)v#uf7c
zXINv~nF6TTI!)Mmlh_8v*hVnytD~$hlGx|Q*k4q$KHFk{pTsdI!SMlete~<@nQ*>v
z>-Z+Y_Gyewq=Gqm12e4`Q&erN-cE5|kL#33=6O}dN;k$^s%+Hm6z<3ut?Oee<UBIl
z<MPQl%BB;V<2>C+UUJiqnocx6SiW=HWAW5{2JU=e5BaQXMhwTfW7NK1ebn>KhBo=E
z<Tte|P8ysO?_^aM5z8d5>qdD3G(srJhX|LE>1eiS5JmJNx6AXF-v))MO;6shfix$N
zv`U_AbQgL${_xSZaJL$~K!1xgC>*0E{JchJibhy!OXR3mQuMX6s7%rcMO9{YBwHT|
z!C@lVhNW;UmaT!xZGb4_RT&wO9HvXxmfNXBOK48e2vsDBz8+^%MxBUrrfEu+>Ryx*
zF_K;=mo8kBHj|Q;N|rg3LTlq8GgmItyDh_MBbL?v>>ybdlp=S|Ox8_GKCD(Q&_nie
z3gZQ?G;C?R;Uc0~>OFS|6H|)pZoa?`4VHMoJDY+--xj$XV!a$h-A2SDx(7RzvMAO{
z#eir}QkQGf_E~{esZHUtDU6F|Y;SAjV+NH6Kq{X-7{9(yS>5Rcd#YBBseYwVyKShZ
zh*c5X#=Ih`sBNfmc~T79sC|)AW;gHW_EfK|RzDJ(;CnEre9By%+>;SSlg>2AXd6Uc
z{6a=xNkOcG5s}Z3xXmJvk1=oO3}0j!UuM`3qM28t;XQU#xeSUH9pa_+lExWX)Mz@4
zB_$UT=#J6}qWB$cn)0Gx3mf5u6ho<Mro9@7<U}`3IplmkQ{DLKk%_d4y6)+TGmE>Y
z$5M?h4jR2qHGC(Xw&&UXjqa@C4pr0kKzOY2lKI&vXOri<#)U#AVe2M>rbgGuwG#-)
z0-UUKs>H1zWKj^>kV_XOz|hymDZoX+VnchJ)F=I!VV7WD3Bu^gaN*9K|6xPh*TyKI
zw#i?}iS(e&cG5X^RHgH2mJ2zh+s)>~kVj4voE=r1X(&IZRp|jbA(a%i9w(CD`hcYe
zOqlM{P^w%beL4TR-qx2iy?3o{wOO^??VY$K+<nWc{_dr*m)&n=tY+wCe2*Pfn^oxD
zuHCy=1}3hIyu4KFbb02p)R7GCb}X*?r51B6C$|}kx!P&IC2e>I6+(?sl1u72iQyn$
z+>D;P$A<aJO9dycvxe>G&rNb#FkI!|WVmxna>7PCEIE7+B-9FG?f{{cVCaH;D&sDz
z{UGv#d~PQYl0zJf@o<~wO549>l@Ew+$#k#RLM#>yFQz(Gq={8Cbl0Wb&`EWY!8l_Y
zy89Y#jCj$$V7PKI)@5kVx!&}<xOwl<^5l&fde`o~uH8wOA#=8kJ<ZEV{D;q{7!4KN
zt}0ffNNl}zNqmQ}vST*BOM`fK%C`8b!?J@+qeJo}r(yfm6H5&70A+Sk_*DR5sYy$~
zDdz&5+W7`UT9j|>*=*HNiQ|;*qrRS{I7mA81skz}c6#Xf&clJUy-AlaxwObBA1S1-
zou2PVny*=<&pBZ~MVw!0gI^A#|EKf*L5;FJGOT%we(m1=Gxh$JayP~<1jto0^<7|n
zCg;1bCj#HOyJn+Z<{>FN$(ihl6$(a%x3eFdI4AMtJlxhpqtS!jLN7&?{m~*q+gtLG
zgs3tr-6NfiePeM8Y;DNJ&_=p>#59J<If3l>a{IN}NlvQr10;JaR~iu;M(G*$bv(?b
z31aUPzStOksi~`&BI1@$#86$tcbYDOe0YR~d|CCwL$fZ5?XdUfqD*QdZ^}nK$Pmr+
zQ8qwE+xS>RzF@b~Q+aKIr9zkt8x84#xmemcJ%h+Y1<0wVxp&(=9G2t02gS2nT#%_h
zC&9zXO&g?FN(20KRBtERpf(5$3%@w3I1>g&W;dr&;|EPzUrZ;}%dvLXDMZJUPr1qW
zj^C7WPU#*@QMpK~aVkZvJXP`3Z8M9zI?SDxUsFvkin**p)C_NUSg<`h7iD)bC1&`p
z%SGBT>2ww6bcgBmuk}nvhkB&}5#$Q>vP2%cm%N<8h3BO-f>Q{Auo*7KP|p4$*?T5_
z0+|`UNpkrlHhtH#W+G|sTiJ3FIa4!H`BQ16Q@K)ZxigPD=P#<Ke@*%FI9FmYZ|hXv
z(uKicF6!9*4)<D-rHjP5ueqSvWQ?B%<7_8eb26kc(|Y&rE(zgWFIk*YWH4KFmgT;g
z<^403QtE1EtY6-5x3gcpSA1i(_?jPW8(_%j?6fn(^4R?$iyzD)i1|Dz|F$1(5KCuW
zbV;0FVUlHOSaWFtOR2xa!{FJDjOLQk*#|%9L{~jh2KKzm6du<4l{9`UU79IVn>fy(
zGVJ|!yJ9n}nU)gAB6)P4rE<rzQqNCn^TgSVYn;UPVXQ`SU;$DLV*XsUnlY=IH4E9+
zrU=R8nFy*`Dwf>HuQBn)`!zpY^p?NS=Kp*>S8+~CMX`>je1$i)?#qk18OC}Y|N0xX
z^=6XwB9aYi%qe4_%PJ#jq~=;P+Pceg{ja_@xG6sLocksuniilK_HH%|`9hz*m;Gw$
zSF{cXTM#0WSjrJ{+#b{!)})bDtCe`eA-a#k2Gb0GN0r;L%>$I-=dQDYC`Yjzk9LeC
z7xD7n8&+v(E1W3aw8_2xdbjM}GdN>8aPaMXT@&Rl=G*r+h*dk|d@cLIGp=k`J~o-x
zBuroXv!yorVEKxp3oUJm^BwT)Hks^B)Iq16d{>rYp>C<C$!FhyMFiH-P1uH<;`?zN
zlO**e^?jQsr`~X=dSm;D3<6p5^UEA$)0``9bo=e>Z}}KD=kUA!?bYLH3SX%#5Bl3D
zQybYjPrn$b&mM?j9XNH7txak03+)+)=`O8+!52>khn@`Gm`Tg|9=yvXd8@$}y@*&*
zbrXegDlAGQ=2HbYV6}s6YV0_<7s-1F(hT`jLW|tU+eo0DlL4e1-DMblz}=@R@IL=~
z;W>jUoTP+p|4s{J^2z1b2mQV;UJkKMUR*G}mNThm4(HvTy!gGt`}AFpoPxVdBO-nG
zC7OJ9K{ZFk_@i&_r~@1};J}ulomSJ9&Kb}Rwf_mJ;z1`1xaJCP&*o^ufJN&4C3U3*
z?mjGS0GF(+7n||j9yu;Mv#0$R7N$P2zuvk0`b*C1?@tXQa)Os_v_%yC+H4f^&*LrI
zX?Qgd9K|g`L<;Tv`5#>LhPdN07T@3kC(E4^cy--|{1d{^g_tK8tA;poE&^XLmc#$r
z%2Ry#{A;@_%hz(3Z@gL_VIZ9-!Nij)@9QYE6YoWZEAeSSbs@}}!4cYOUT`q;Lsh7(
z1(S5^%8$jB9PJaWTyIa>zx@H45K(8B+|ft3bMFUHAI`obhcDl}@^LEn<J_x{d`j<m
z5cfh3e2-R0i0OStVmn1Rha^Gur=qH9i!?6a)a`UU**;(Riu-_L)9uY#ZLWGl>jx2T
z3ZXYBgu`jmdIH&-b-B4$uQ_%#tao+tcE8GOl=g1i&GGw*sNx<({DP<o74oaw^6J0g
zHMQlle8XpJ%kT7tzr1xxF{kfwZjs#*Ljge5N8(6q@LDClD?NCp@@%*4^|wmS?=FYC
z_aiLpRD1K@$2N95wlWLs-{BPp&;H<2L24|$2$c&6*>ITUKIT(rA$_0P>54c%ma2UJ
z{%=H7hV{|*yq-8V#a~5K?)Q(mqD*;@GI%;on*+$DiU;G9<Fm7)q#pF$zB9PmbxH$~
z%s6*vZSXz+>QH)XYL6s^%$iOt!|z2@3fc1MYI`c%)M(jdB?TPIszF(G+L<QL58-ch
zmLmmQ0_5H-nLe!S^IU`;i>OSzFKc3174INV)x3S4deZxJ*7T#IG|wHaQ{y7Fj@e7e
zgm8W57mkjFms;+`c~!srDWbN<DK@%RWY}o%Eg3C|Uv`vZ|GK2;+h?Iu_xAhD8A>+e
z$RJ;{_|q+WaW&q55mC3^vhKa2PT`~tTuOU6e(R)@(u?*nyD5**#GXd^_CXCR3dZee
z9b8bvtqWIze-%+JJ#&M2uP^q<6kACd@tbhDhlbO1c%c|{R>nDuxSXVogj?}l%$7Op
zJ2tVBEMcS&*;hYB)NzKzSgzF?L%DiY*f7RK>HU)9I9q!c=h-38A<l1IOEJo!6W1u1
zOc$5TlCRv+GmTUHMMTa0YMg*`r9<%%yCCPzoPFfWq!P#G7RoDM`hqum2iu5YH>v1^
ziFk78Kge(t?RPAU7b;oKKhksPB}DGYp!j@-Kbt8>&UYpejlZ_f-Y@=EvQl^~qB@l&
zXbCOxdpJptV2Il9BJ&??zoU-$@M8kO?&)dQuhfZ?C^Fh#?=O!nZKiOk8#iLbluPs<
zt(ly5v<cCv4T#(6Eiw)R-xUn^{NU2OciO<EWux`O!}>xObweH!8vI^9AFEETa#;7Z
zm;bACfxbu}dTB&5)wl*DF~t;HrLrJh6V)W}xzM$TJ<~muZommybMv@d=>DAlgFvNY
z?{!cQXLA#+7XK7m(%Hyjg4w|7EX|-uQJu}DVM!h5I*$>R1ln%#;z$<v7rd*r$+<>n
zbEf-FSXUS`qg9Q`)MK41y409d#X)kgi$D;}qVlqf_6*<RFlS>IjRAk8qh_tB!PnX-
z4i<?mP8E$C6JK8M5Y)p(-M1o46>W_xE-Ozl!FDju)#H6HpRXNyEUym$swl+WBhWW;
zIQg-9c^TD3z6SQB_E#6Y*6@l`um=ox`#Nex`657tS&I~M^vGm0c_rUqTerBYTOsqr
z)X=L_LjhfHN31ztE>~Os@Lee^bZu5Efe`mpISGf~_SPt+{cY=C8%6PcCCQD*>j*C;
zJe&ST8*te9iSvm~V!QQHTZVz9iO{+hA8YD<=M`I<)86Z0LDajwr=cs<-Z){7tg3Vs
zr)s3;ajMiLExAVla02!a&p&&K^Lg`$=8#lSzyl3VDQHLB*8P#N>KmN4uXN<_xFGWS
zQLy}hTZ{k>6b8_7FyxMF1{#AYE%2S&=OdXuuYlP^j+cjk4TXsNR){0+D7b2(9VMO-
z%w$OF<*XyZ`K8~u@-B`7)selab%_xh!HZu2bZhX+CIxskg!=2WMx)?0vsmXM9!~P-
zy3}HPdsR9d9$+#BT{|8eHeC5z`tvhRynd{YwP{@QDMd7&GghlY<pCL*J57rS&nHD9
zr)zXHjRq1Vi}LqP;m6_QPzcc=M^y2>MyIZO=3pwXp`}gKrG8${>QOMu!F@`}33Zi2
zVzJDRmsHZu_Dq(#xuO#`EtV5tE5Xc&$UW{MpXKe0(Kq+it|Iza3d9%(nerr7A2-<B
zp5-_n`QBgylYK|C-Op0D<1Km(6=o#LVbV68nt{&tnc&I!5Xz@_)Eso;fO#Tq2P#mu
zei0o&mW(|_E+F9q<rLd9#OcB?kd6Y)EkY1dWKLJOkBG_Hrb`R7;65JM56kfiDO~q_
zE|Ou+nQdELBzc=opS)n4#S*whK>z?Wkq~&k-d_6dL$$1^N!<=jGaN4aVzti8YRR>S
zkmqY+a^gV~`J!-}g?y{m=O#bYzp3ETE3;u`rd42zsG^AdU_GLFA!zzsA}|doo4t>2
zRc5#nbep4;$$$nw?<D<Yv;$)fnH@akRcjwzF3&$O-oK3Yq(Vnry*T%1_$oD1h^|Xe
zPdhYipTWJXyCU9-axRGI3VAaPtaW%@TGBUY%=i#-KRo7$!&dw{+w?6<xBLEu8)rz+
zw|t-0HpzpwlhYFi=;3m&PA0Ad%Uy|He{|ah61^O|*Sh*`;~2GkYRga?kWP;m?;d*<
z-1p^KS%K*C<RaqG={+htxvKGCfCRg31h8$01LD|=PrWiaY0(iNU=tJ~P3UBHy&EFY
z7@BZ#TF!XjMQm2sBEtut-V|Snw`@smtj~Jb+n;79V(!{;ob-Kex3!g&C!EZe(<4(F
zw0$;t@U8HTQzwnW=g(9K-=nn@mKe*V&TtEUCsO7+<YM4*g3Nz;48L-(V(V=7#c7c2
z2j3Bg)$NHVTTP1B!Z{s@_hFR+8MNdI{MVOj3%{<vFFiW-W*~-PP)WJ4fQE%%->jJo
z+RIG2alV-+?oM6lOSV-LPUa#VV>{dZ-3Xs99fPks-KPT{teNKdO&J)~zevt^>fGhw
zkhv&)9RnI^>N+vaGA2`*w_s~6cLsUc*6Z@F$r&ZBcA2k02q-<DLO)@4W>i$p=RSMQ
zdC!j7U}o+7ml7-rUFs@vP4JO}t1j+Y{;#vN<oY(<*t_b27z=wwZ|o;Idwth<ec<YI
z?uW~wNhFb?)L7np?>i>8S96KxYE!4m9mB{Q&g^&wq|#N~R;KPFo*Z+%F5?>a_&TdT
z4*27t%L3c6i+1D@ncYmXrdx4!5N1IXx!|b|x1wink5*XqzTLiYXQ!l7^gVN@M&d_s
zq;8QNXG~SQc0)dyYSnj^NNm1J+hU9Z+E$AZ8c+7Jy6PLjIFvV3k#9{ZKCF8oxT2^_
zem1xL&h+Vr_Hr$q*fh%$gWFqD6*ryIVN}dh4s;?+ke<-CB$vpXnJ>5w5!d!m|9x%>
z*Af`*gh`BK?iR-sRzp^LyGMRF>GPv0#E0h`O6o^8%#QekwN)bZ?6X(Fx$vjMKFd;p
z66d#KZz?}8$rZi1+rbJugIs>r`W45D+^gRV^ElXw;F7q^<H~f%X|bxWdN+?}3a9Rv
z76gl10R=97>HVgHDA{Bj<|IHwc5+aJ3GnUJ@gs6gv||K_QiMo;C{DILN~Vsc8YH7Y
z@@Qp|C_N|K7bh@Zdd=750uG7PCTNM`Q3T7FKMju&n_D35zE&1mYasm^NFZcfh5%iG
z7j98i;oN=-s>YU%-g2#IzavwV!!}MfdFr(Z^Dh@HJ=Br*L{vW3iq660tz3Z8N{IGu
zaOmeisg<yYrXj1QE?Vi#aX$ssP;GTGK67&utf}iLFDX6rI1<8b-#kka`Ays)ZWM8L
zJp3k8#33%+QCI0e>Z<9>Fzb@Y7@F`e^{6+pG@Af@7S^eu2zB5V)F0vLdW(+34VB%8
zN$<0cYKpwC%O4kcYSEa^Sb|IpcLe6nk7fg*xbc@ywfi@CT0Aa^dAt%R;TZj_Pp1TN
zDy9l<%7v<AqUoB()R)jkil01L7c(Xh=L8FBbBvRJ@1rwG?JZ8Wnn-;}KzVOc*%`wI
z3Vf|c$-awIJ|U8y6Q^X6ptw{8Q&>UuX7~~a@!zZB7WU(6N6B2;F!wg03oED()A65l
zX}D<4*)v@$@`*cMnll3ScH$5z0#w&Hfg1-&)nO9B!=GTmi;mz+Shw#aBtHS!hefj3
zB(PwpImnauRg)N^k`~1&xvMa>;*eTA{E9c6=VG$JB4txg;`tshyD<`7nrdN&WN!nz
z6~_t-f-xoJi%l>V%u%v8A?XkY-b7P#6UoXf68ct9-uSzR=;TB6U6yK;d@1H!72%Kw
zo+I968M`Z(4<9(6ierGXS5X*{XYkchu%n^IzHrvDWEL)HArOC&nVcmb{E>uO9VO%6
z^ssx3iJ8e5s6j+L#<)Djs1g!o+bF#^Gu#C;1u!TJqKN->hudGtf&{ZRw#nGh2sc@Z
zvm}&wa>n5(nG*q}iv@4u?j_DpFXH04+p_GxX0@NnK1|GNd7kFFib|@2{iveiA4PRX
z-4m_8{fOM5d=z9Xp7l;pMB&(YMPJ*-L8OS_&C#sMO)xi+TnbI)kH7aRlR|1VH|qq7
zdlU=^9_8&`&-*-``{{8O@GWDz3c|0NcSy)f6pRvGBol+@%JopQSAmzG=Zo?u8S|qO
znM}mFX$Ge;KU53YFa=!I1q#QAD#4La$mX_QF1u4<tZ9}Fwvfh_!nC%Kp$ExwFI7&z
z$RQXrxLHV66RziEV<VocMR8vtI9H*+2zrdD5~I#VUuK>KRWskWp2a2*FzdwoP<8T>
zbH&s2MJG2AxV7SU5*h4-qU+Hd--xigx(`a}5loBsZ>~LPG09rZe6Z&h6S8*6e-@;$
znI70*QfGo(5iALh<`@<zEu}AFp@7BAmSlZn>IPs;To3L>b5ICAjP0h5j4n;6qA2S>
zdRVdcu#%#zTBxk{-;1a$<q4aJn^j<<{{8#S>>A`1#VlmE$sbNdSIj)DnCt&dL=}3p
zr2ptw5%uAt5B<N0s1%i3LX}MIU>nuq7ttKPQI*C06faqzM-)|{lT{FdDj)`<M5rP!
ztD+pJQX*hrl+~D%)jxIA8`YHGt7yxrSx;8c`&V;jRkNL}!F;IZ^snYptP#9X#g41t
zkEs!&tW`sU+0kIR(HbNxgvkUfL0KzxsaCF~>eL)a@nnq+nk-2C!S`s6vYC7OSvT27
zkt^7GGlTkbmyYTmVPlzW>Msq{mz307Q8t*dhFh~X*eDX1F!c@t^%mdrZ?{t$HG{90
zHJA=Ggk>__EX#LSY`pcMZg4y2HmkD^bEAiUJ?aCCy+M=thkEwJrt^vo#&b>P0}WAJ
zO@0PV0g5a>icS7EnhNqCr%^U!P&Pd<%{NgalThH{muU8;Y$UQa6ezMVVc<z8>#64&
zZU;3bv4-C@XsJ5MlsDJZn#J69si7l=sq1@lPD^v~c0ma%Z8BEJ=U%h(BE!H9roKy0
z`sY~E6<XqMwCH6q*BG>{;97F$n%m2sMg%>5ZjjMh-5NI6TDjGloYgw%FL2t4u9H+~
zUBkRr*7`o{=;;<E>wH$z>kll@^`|=b9s}hKJ^oLTY|WqNSaxElsg<6f4WEJ6pQYCn
zDX5X3e1qylJAKcmtj0&qf!GekQENp3xy9F64`}HO8)=?AeN)yzcEEyAYLtJ{<~!FW
zeeg_~t(|4PmC34I)wxwYyWNYjGu{3EMIl;OfO@G7)xa;bfv1`x6z}D8tRD-iXbNtb
z8)w+)>73hT=0OXT4NBRavQ`bw^PO2O4Z3Vy?#O3`vFy|SJ#OWV{)Rou?!^jY2>VUm
zdSbdM9SfN{SBe>>Ya8bmf^#5}{?muv!u-zjl)Wz5JvYnSw931@%h^&5dmpJixtraU
zb)!G|;E2mhftoUkmgHqtT!rM;$1*fw7PJQ*uG9D_^~2YD%(I?D4hGJ#4$?Yzl^(R^
z#ST80M-B`&`+gW~HpD*BAva2=*$YS9d4X6Uzz(>1s?ijo;?&eUH|KeWPMP#SEr0H0
z)sj=ro~~5iZP<@y8*-&=`+P7+jP6|tYWx;39O;g#$8wKn(XQe0UnloDVkjpMM#Q!r
z?`Jb92#>UaMrcous3XS$wno?1pKCgE{&+G%^@DGXXu%!E{zaTxuwwk=({XzuoLppl
zW^9D*%-EY7V=_;le`I^exzNn)GBU+74%==x%gm#}{vur+$?rnP-H&=ak2#Z1XCm^_
z6??>O58M>Ur@namCH($N<n0L-(73XDDUqTTs@^6?#VYl2Yz{N2>|QCkJ!u`MCGZxL
zOoTn7p>OmW<#t2$Zo&J;R0G*rmQ-Js$WX@}^QmZ5*X9(C#N{qRqn*QRcX<*fIk_P`
zVbnZ%z(%G?HIpYo@A)yxhl>7;|4>oInTsFA-g%<zM`=9K+8e~ETaei#Dt<M~88Y=5
z{KAYB%~U<rJiD6MUa*+%E<8C=ohB5a2b`calW5SHEg17<8*3LbywTbwZlTJ?t~S>`
z<l6Lc@|DOdT#ckiA!QdpHc&;bT7NHf^v)JRTAxSg#YdLi3XFXsd21DSY#g`hyCcd6
z@6Ioreg!ci!LDHOJaV2Ii03r0B^(7ISUs{(UT2eG?~G;1!ZGN<*xYtTOhI3XPZaF>
zi->BZ=&mbw|Cmq3QW@EX8mc<?6)JUoVPUwku!g7Qs>2+p!s%8}+^%obMBi$-(y11a
z){ptrDzUGs2pu#Etf|Umw>Ta*dvB6NlH(QBB!63gQ8ns06UT7E*}9;F&7PX(swnN1
z9NKThmx8-ATf~>deHO!y6OL}E%Q+mDANw^Qv1#8yxgOi8;=F64#t&7e%*?e$#-=Pt
zOPMxHSvA~xp=9=W)Y@^|5B(<LN3R$Af`Z9OC+gEgSH{MwXWZ4|=95R52OKmHsXfG$
zJn*2vKz536n^S>57+R0zRG?#k2)7`~p$_4$8SDi^nCy6_OjWYLGsw!_DWnHV>oc4v
zDgL+>>9zxR1<V5uxxQ>VWcQ(rt(NpiA$sX36F#5D4wSMZ#l6E`vqRcq7pxyv|B>37
zU_Ocz&qT)&z2A!YvO)9t#F}I^vT9<Al=$+f11d<h^sNm#)rRtE_V3(S)}31QN+S2D
zL7uOm#&eS=6H)A+P!BiZU&T>{GSoAVKGKBK>0@Y(Ka!2;_AqSBrxb`CbfCVeMkS*^
zMtF;pcdjXMN=&JeGgC88@4@3n`yE-Fv=ep@Nz|@*$_?=&!PY90nJHy4nzGY47=Ik?
zOCs~@Ks{7NaMPpmH{q#?s2^40I~%CWV&tuDDDSB)cO#lEez^tBDCRq#Ht^7j?7bV6
zm?>kiDS)DyxR;96_kG~q?uNSk#hYo@%b#)ILGF~E099xrUQA;1%!5xITr$bW0QIx?
znAeP*x5e=8l)X9g#Z~h|XCzYIY%nBj`9sL?G$>0+9S*l`!IAF^4zIVKN*i%XNtsFM
zsFJl3U~HiQDzwr^wFd`PNE7t&`2oY*P~ZXT0pKQXlxC+5`VIeMrjmMx7G|#sf0%S8
zJy1#qf5HzS^FO5h5VznLj0ha{tMuMmN{l#EJ@R_ae*~!MnYQxSyRJ&SJG-bJPQ{%3
zybg)1_JQ4CUe|t)U{~loxU7*nYAwtkm#o{dEm73rKc%Xj*^3&=b8t+1sooh{*qmlx
zQ*H15fg#0zAft&n{M|i`V(RoC7kxhIidc^ym_*+fXW$ErD_C*TtzEUKu}?S{11~3t
z+Tzk&xR=B@81$zyx>y+<G6WS=2M%F_;%4W=2I}^=Wi~ic!t^%c?6yyEbh^1gtb4LA
z?pz(tIUPvGZn^6?e*a9Kc8=v|r%6LbF{qaIg$kZ;l3b=fym{vML#KChMLJw5zK8ql
z7nuU~mE<nIyngEA$>`EIhXLI(-RBfOhxwHs33+PhUf`D_we8y#Y@EG0-s}H5x#*Lw
zz-7b_J#eAHYjrd3h3_E=MAv{Nq1q>O55p3p{bFE3flhWMDitiuaD|?OBs^COnH4`@
z;I2hap6k40UtC^*$7X`1!js-SmB^X((vtX<k@QDSYE_u9A`fG(Y72vo92M6nJ_dFC
z?ulqOLpSkgAKNUdjwwqs$Eq-ebum_NQOyzd$A>su!7!o18bhfOO{p_7Q}(rI<X(r?
zmJ5D*p~0xQ69f?s_F5XxJA(*$F8`M9n;BO|22*dIGf`25RXw?Cj8i08-+WAm2j<2l
zE>Qh~5l_^={&XB`)<>teoY`+A5#grs{K!;`o4zxMEbOe*_2HceCb>6J>RkF1$GwB3
zXg2smN~v9)906RHu}+{f4JMA}EcCvrzU)P9`9SoRt`zgdVB`EtvRu1qVax5o7a29|
z<EmA91jnhawkIwpl<z(^NLKi?du@2KTsXEXtYBJ<6Gb2G!X>$6-((ZP87^-db)wj(
z?o<R<2xnl=stz$=SKgK*kn&7T(^4`d^|9rfvEZ@s=@>22rR0?X&J36<Z&|=biv8f(
zALMtRj{OBqU13JD?wIIka%%M_Iu<7J>(1v&eSn(;BBH`BWL57Q#k}(B!B1O6YkfMG
zR)-b7Ah}Ea4w2w<jHdoLkTBso!q+vu=cukd7dgk|pSrdYS3j!5Dbh0*;Vju@)hOe=
zD3Y8Qm$`C+PIH^<ZKRL*WX95+@Ag!<z%<P91;^X90X0@;)=joE*B(6en!DNi)T?x5
zo1Rj5z7NhOoKd2+o@B;A7gMeq9>v685DA+ammCX5Hq!OqySP?ytuafWEm4+JuCA>h
zDNmy!weAeXY|(p)_EE5oTpJcbB_?4Hj%l7cQF!}n`K!Uf0#dlYd6&0Kj22y;s_4OL
zf<=$exx;U6F+AqRuHW#T7?va{P8%+Yb$1PWx^V>majAHGG>!D+B~P%$s6m`#W_*ns
zRGJ8qqx?GN#DAg4zfOo;{>aaW#(c4;Y@gcahXVN1;mZaG3voUY6OPVLBSK&lM3oqG
zd84jLOVn#D#v00Fwx3@emM9^;HJu>p<aLkXx~`wFo9-<-by=Y?2_fWa1UqvwO4-$b
zm$<6K>g&)W*&re9x1PSpmfSQZ9726tqey+3t2ZEWn6u@vPVt0iLbHfwQV-YLOi7#Q
z)-W3Xjg=ym`NiftpLt^|Lmh-2P8nE^QzJb`Aq?Z`_xys?9Bs-+Ip;~?XLGAB)IRAE
zUogfF8mng}mN{Itl^xW*e3h;LiH-DcBC5T<(njyS-U(B7cj-8;_WvuQPS!opa&bD>
zVma9`Szj6E;_PswcxiTWvZ1lt#r0OprB{2C|A&dFNB`%Fs9MVI$?1IaZ%^p>_MdBY
zPivfiCl=v5=%DOzZ)$#7uGe??R;x$umuw;k^#3zCb?BzJKmPiVo78#te0L9zi(Vxo
zUJ94J?|b+VLVWPPzP=;Ar)_VSjosFWzT@>VQ2GTyCoagxJXq#Mu)&2;`QWhFjj+>}
z;Y#@Mij?r%6X7PVk@Z)i)I6e8J)^49q6m{w=RZYhMn^~6#Qt+O)$unrH8~~quX1X^
zFKnt?y2W4RRL{&yf5B73?zQ`5TgPNKXJ==J=h*n?+EwJH%;!4H=Xz}AI*{@_?hvmn
z5WTAN(+Ua-w+n6r7dgKw3b<R`wNvaK{=kj&fUxx7_Pvs}rjnfK(px*FUW*Sy%gV~*
z%YApt1MXD}wLU6%^C&v0@^(RG_dl?yVgJac=KW+-6aI^AYED;IS7mqpT6fu(?xO0R
z!kM1Ob$t&$^i_5~pJ?bWUFd(Z-e3ErzpQz%VsWT#Z>VNqcw%Gt@zas&wz2x|vG;>x
z^Y6wwKaD;8I#&PU#f$EV=7EW&@rk()6J5I#Prtr=vNhS+H`V%es_oCosU!baPW}H-
zPA&SYoa&<)h~O{5YW+b@Mbo3N$`eBwyjJq>FoCB#P`qin1+@H!n;j@A=i|U4@nXh;
za29u_r8s#%xk9QF#VboFBj}86=qZNlZ*M8C5#J^&Oq1RsrRp|`aXRO(zjK%3ShPpW
z)>S#6&5b3(sm-ojU(W0v(&Y&?FIZj9YPw#1HJrbW{C$p3b3+`p@!s`dgpevTHdQDR
zr=EAa`Jc+EF~7;FJN^GePTdRntDM@2qWK6R$@2V7PJPO)jwXA|MMAYjr$!;nc{LMQ
zGk=j&olJzZUz{H>L32N$N&2gtI)kdGm>5RNZmVllK8p_>!K_-^3)gT74hX9~0ZPJt
zlT-DcYg4t7j^$MJFLJ8eKbKPrntmszQt@`6kLA=7Rq$DUSL0(jHBrg1PGC{s&2Mt5
z>Q6bfpg{Vkoa*sYPL2PooZ7&e_(wT4G4k)_RLE~~D(z1>l_RKLWlr^{oT?h!f6^70
zNAV{92RW6O;#WEK+HZ1drRr~TYUVF;s?V{Un)s`nTJu*qm65NcuG5%5`Y&>-XDFcn
zu^U3L+%No9PBpSu5mo|b^AJ^JC_!>ZZ>U5XLH~Wi*IOt3!F25#uNaB@UqgaHmRYK)
zd|=jplvA<)Sx)r~H6-?vbN`f6dH*})RJA|Ksrzc^@vS_DX_RWB@$cl+f`2cks_idg
zDalK2r;dgGDLFN}Y7kHNQ%+6)y_{NyQwrMso1DrPbdJMgSr%E3I^$jwc4*8mrA0a#
z6#7k0P5h&rx<&s7ITik!oT~PBa;hdYIO8VvDKxQzg+@1cKGCma7p{EezaXauW2FP<
zQ$3#Dn>74aa;mympV&Q0dd4>b2#pArvCKn(48$JSa0+`7=YLI3b>@F!T=LCVxb|HK
zoPfJ}?)eeF%>Aa@F%VD@nEcPnsR>4r#K4_Gq0Acke<i1?|64iLFI4^WIVh^E(g6fT
zxyk-%IhC6|RX;)&n{wIu<gEMG^i&!)C+}xjbKI3$XS#QF7zX$hL|GcJee{TgDD8)F
z9J<dY*b$F$kqhk%GAZi|wnwuJp|@A$F3l1DUQVUf2L#y6!vC$DN`miZOa|?3J%F02
zJ==5?y7F$f_mX~O*tPXVX3Avhbq6X{m4LS;p9jtc$&YzyUagzrV86~(Xz`poGX23N
z-=6Et`;#AL;h8I+PmwQsWJgY_B@CS_afbc($f?}_d*oDRXidk(Djh-uYtDx1m3K<@
z6T{6G;~?_i<Wzyhe=Db^{|h;_1gNbSqcr<XP9^>-r!I$HIHin8|B*so*Oq^UU#b0b
z$iI?P=l>?BO8yf$_4UbFS)%73<y7-T^wFzE0nv)AXD9vTJCL5}U*%LdUrFij<kTdi
z|6Vy&2a8I?LoLzNuhAh88tBJD+Ap%FO~<b(Vhl}_ekZ58Lse4AElE&I66|ksY7)5$
zTFz)RM2_q4<y7-g>S!&j8c`eHb?IzcxR+1Fnd<O^f0R@6VPc7qQMwSV&sgsx?Eko&
zT2iHA)E3Q*f$CjF{~I~A;P2$r#6QTXnZK7)vA@Wv^ibe8IrRz-tV5JD!eckZA*h}B
zO%jw}+?ON#EH$&$%}ze5@i++Rnp&@=NTQQbFv@EC7LTCScX5a%(GGr;pZviKDw0TD
z`LE?v^Tg|0e^O3`{3fTq{iB?!LH-sj1<g+$-iEC1ItrUBDCv<Kze&9t1bOhAoEoEw
zj`?4bQ!D=}rxwD#?CA(Y(+`1btsTOx1>zK`qHU*)T1`ccK+0~JqQhWe*b+4Q7dbWh
z_j0N-Hj~PP8a4)0|5Z*+I-d8#?4F95YE<0OKs|hH{7>an*FP_(y8S^;eej!{s!RYE
ztfKUYNaamX^}mo)ZU32^Do+5vOT1r={ZDf0=zo+`lmD5VdhZW%s?J~JRA#6wLt(NF
z@Zc|UDhU$v7dbT%%5*HJ;{Ju4TJ?*ZTK$`xiv0&Ul?0(6RLriS=GQ7nLXWEdD5vWD
zSLD=!zmrqJe=n!X<6!T6|0buNKO&)G{^#V>lm8&6-hi2ZKs|Lr(;8<!cKTnEQ}KV4
zQ`aEML=<OY{a@r%d2!Gop{04Cr8Opo?m=vpA{Q&^(czzzQ>%~VR2(dC4xq&WsW*<F
z%MTM<Kg_j$`kp(`^6cAKD(m92q!zTkZ?nNgG$gwMc2GpFgoX@0qb?5>03M^1+RsT~
zyQNJ*|I2c!I{7jVE3DKd4#qCyyL7X=^q+JY&UYCFbfw~y1r55)pJ25Qx-7E0Esuwm
z-8;@5bpNRCwpHrU|4mL!{7-VK8oE!X9A>H7tCvk~wEl18R6}T7cGpKd^osEFf_3)P
z*sfQqeYyCqS0q@QD$Fub|5#2nC;gODixdAQrxp`onxsD^rxxR(9nRD@q#@C0sOzzu
zYW$m=N}$mE3P}Zwqc<s3W4pSZblvupv~T-OPQ^jVB*;^KkyEV+zmrqff6A$qIO;GW
zOj2pg7Y|)2AJ!><uJeSuRB13LyX$Eb`uB2b6=9Tu{lz`EF6yJ4F7)lL8=hVCPshZZ
z$N2GGD-&Z+V_*DLPObc%oEnR#IyM@Q<<wa8uX1YaFLG)U`fqY-3U)H-SWZo(2>DlX
zD(R=3n)^pNwfJ{(YE>09mH<t{!w%8p*Tj*r$1{z_6xP3!Q}6#dIW_t>IrYl#<Wx26
zxbC1DL2m|poHH#>eernz8{kpeB<eJg*$a3o$kxaL303o(oSH&JX#;;kPDMlGVi%BG
z6KPa`lT+_uXAP=ef%A{!n<$g8==;COsY&7}?LQ-@QvD*Qx<HTRRBiFm?^Z)!fj8Vn
zZ}>&gCWo-U$*FG8muGqrtxHqClT)?Z$f|ykQw{L2o!f6rlxN*up?1%_<JnlSPK5ox
zkW;VxCpoq4e}|k}`ETS@Bl7Upb7I2S=vN}r!dSI{PvKjg;DSy;X~;5qi}sl?JtvlN
zWDAP2;e6H^BDoFb-U1()E<`DJP+PNK5MDM?+B{jgV==fBoV24n(xn=>Gs3m2k=Lcg
z$)uaNn_0dcGPY~<Y)e~(-B|Lo{*zq-*Jq>3&v)8C>wWrsu9D57vP(^TCS>uQLtfXl
z*YB)b_oQR@>_*sbAiwBjGkGO+MJ9dmR{1gt+EcEC^%^q$x5=qn6uFxev~i!qjh62I
zGda~#9P)irAYzLm#Wtn$)6V~}oGPI8c6w|{Cy@(dG-yGyq@5(lGyEszRDqvzDj6pK
zr<`i3#GW+!^21c68W!doM!$4YB+--LFgIDDQEfkTMYC+rWsW)VKgp>MiG7(eH<#yU
zYOjiLUv>0lvxF{>l%A`+nxnA0G7dIrEIxACX8yNws@fyb2UiyS{!4P|DUqu_qAFlY
zE0@#b0?dg87x>536(BsRcqyoi<!Ck;C=}lTDIG6UMr+WyY0?<%{#iNoBmLMFNjE+I
zEYI!d{P_<D`-Ue|KHgpND{?mg-}J!T?{1=dp(>{J&*W61=9ysu3|gChYuD`Q=#~F*
zIrZgT7OyBIrIW@_Ikmc^xZc2TdL45trwSj-si)tfJ*t}iot!HAQ%<#79E^1r3FacW
zNPox&!?4rk;qcV5cG6??6;TLkuoMKqs!AHoz2C`vwNK3~^0wFN%qIrjlCuLy(dxg-
zskJP;ld*4RTR~Wxa`*GY|58p}NftboQ?qr7<^L$B%5=sW_sRA;M#uZUP5PUhs!{b<
zIhFIcFnM9naW30wt?j3rx>|57rz+S}G@Ycm=a{l0`%_LO*P1mZ3+#%`83I{t*8U4Q
z)sahdmLCFeivxt49cp(#0PnAIYQaxA^*uLW(FOtrf0a{1SO!<$03e!@m4A>^t^O*f
zw)FxyAS6s3G#diax`$T<p$XSnA~_%#?<J@K0{H!s#*tpnh1Q+>m1NW<2$(63nj(<^
z2GDH~mOaYviwW1$#R&kh7ZhWz0Z7ww<a&Kk#FCjrYLH(+HSQvS)Oc=DwCW&o^0a4|
zI&h*$_p_6iRP;0$5M^QqqP@w1qRN}SD+~~h(GU(`luZk7t;I$JMX%dB3V5o@bhv@Y
z&5Q8$mw=gUOl!CACr`zq!a6^IpyQYXox}IQ=r-f5eUi8pJ3D%n2->YK74WN?g?-u<
z9kh?cA@;GH>>ne0TiK6CENF919S0`z%<4lmiX22-GE=yFwsj&j*|ca>gJZ0SAo}NR
z;F4aA7d8@?0bL%3!E5n!Xe>{Kl^rYl5dyg0-j)$K0n`hW=p6FZQZA!|L4JBoyrxCg
zfpm5<01zTr<dHdP34n0o@*_jlSKm`|NnF=SI&0b$>gk-Jh-yD`6O7B0xZywrB^t>5
z*i56nU-HSFe2nGvrW+mklGZDWq%ig!=YDe*xM4r&rW-DUDW9KJq=w4BqYkkQ*ujj}
zf^GuR*&cSP@(kFXSRju3=58LdkZo(ibE;VO1K1=$3Tn7L%su*0?c7U&X2LxUaDLI7
z_fCE<ZYH+ft1t|bk<jOhI&WTaLuN*6q@OEGaG0AWvQ0}8N1#critc;Dp*08)1}|zN
zfVKx(^1wh$lerCSB?xG!r#b?pxk?mag>Yb#G6nH6P@N!5&vP;4S%1C1<(&4HVq=Wz
z@VhF8)gZ6{SmlxFTaU!M<yxkM3-^>ibJMjgUK&#{Xdt`LwB=rQlTW%krc27Qh3Oi5
z$9~MlP+hcWl@>0=7ja2?keR%%P3(?D*o)Z$fF98;K^;`h!9;A<zORd!h?$WG1Aw`7
z1RRNva+wHfmBA52@ZKPxO`;Y#ttB8(MOd9_q-y9RiafLdwmE`9kN{1T@d>?XCEVTo
zQETn-mRAnJW#QE_5#}Fbtbg2t+))?r1R+M}_9rKsl=VO0T>_STqi{XiemFR+MG4>~
zI7g)3q(EO&1F%Q3ncEIG1z51JkKX_dDzOp>2tWq=R&p=AaMu#Bn7(O@2H-#t$2)(u
zX!#3|f}pB^BthaD76rfrruZ0`PG7&wJ-`w$&jrQ4Cc6h6*p|5}gU|+~kagh8FjaV`
zu(f21Xb3n1ywHjXQrO7oY3p`-a9X7Fjnh3<UNiw+p4GkTJ50|yG$?B7l4M7U=YFPp
z$^M~<ML7XS@Ngq58(KtK^<r8da_pI(b)m7mWY73s`gw)ec8mwd8!!~nP;$b2>Fl*j
zbNm$b_1!yhn0_gXM?RsH`ZJwW007C{Z3wM;>f+OTNqNDw(MNsD3HO-@aID}rIJiFe
zwPd|G+UECZU()zQIAOI&DK^?db%>8dku4%0_;ib0DG$=IT4H4!>=MgmQ5GhEC;@&g
z-8MqfcOP{cRbL2j$b_E1px&X>V6D{(d~+?P#$ekFpP7VGIvYP~(FMUoNx{|=`Q)9l
z8ngiwFQJaaNzRDa&Qo`8mD6@FnSY99roa<cFgpMYXp=uxM1UexpL*y4t|Hq2sH9qz
zQoL;-3kOtL6Q$VDs^7b`su27$Yz=@S=x`9eY2wBhF6O1x=dHTu{&bCb#P6NRSxt5W
zWu-gAg*F3Mc$zP;^1$&ei<8dS=4VPn!07j@rs7wNPrv!_2;alg<uF6Zw#0Z9e+1i~
zEs=&uw{kC*fIt*&u0wed+v(Tt?6_rqeVcWkh0THhW=afpao%)DXsfG>R|CVPv0%RU
z2U?PjUMbEY(3jS#y;W$C6hRe)A<m0Q5&;<9%}JKFXV6z<fzi4k^0ti8EFmgK03HdL
z&B4a!U~t}6L?l2?WTS~BJi!Db(CPe+1ZWemxKoB0<);>hz<^?>L>1U5@WCk<fdlGO
z7%t#>$s(2BJDrY3z{uO4!GWAoNdWo~@m`WY2B=bH6=JYVhfyg1Vx|I*KLi0d!b%op
znTPVpx+fJa@&SUJPyDN-Zq$Aa&WBiX2%1ZPR-Vj$RVwep9zl!=ERt{<p!3}+f{T1O
z%t;ZHSbkZTfUV7=*w0Y)0Kk!%U}VO-t#%-V&`L?r@(e?YD}iwL+Si`AV4vFQ1_9#7
z5v>}r;@El!04`D7RO^CGGrZ*j_DU5mlyJesm5NK-qkXFOs`HWuBISjpI!p86qb$Pc
z<AWwB2h#<l6hLNSFa!bWsKr-^fXTNCc0~(4QNRASNw`j4&N+mp1uEuQB2EKP0acVG
z;l|<wNnw={jc3Ug04SprZ;>vKEOgR6Hd8^jAgo|<et`DaOogbj30;$pP>1#bx<NNr
zf`Jb~I>N{ItpIvYb}jpRE}QKq^lL6B>K=JG5_FM53<X#OEg`{%;DUe$mj)>qEBZZb
zp;yTFnU%4S?rQ#!RazG5r*PVX6r#Z!lpU;5qX-nb1Ds00fT<$OH#N5>2tVPDYh96!
z+1kYcO-|+VR5(poNsyCI6{(g>upcmxW_J&$kdjuBktQ#{&dHdOD^DjLa2>qT-onyx
za=f$tjx-#;->c5n3n3yx=)}i65fpv8DG-3osmHht%%A}5wO7ULXK?sD)u$!UgEO85
z0|8^tCJeO3X@M!ph&1U47u^nIS9AkJ{`)14Z{$p|yad5bJw|gyx%sdYQoxC>NDa%L
zqPocY&ieDQjStG3xE-}VmFgbB_hFzWK(HA&Q-qi~*;}d9`?w8EW|0fs50jrzfg=bC
zRh&|O1b83M_{oMQE1=m*aR^F?=6V1WMn0Vvc{ahyx!&Epmdh|c43AXubPAdB{{>7f
z{RK=l)_LqVz~T;k)hr)cXGOPhf(R0^cn!XBHcoSH(;Mm#CgHZC7VDC5I$Yl36NE=u
z_iWwJyMZ$_VNDBG^4B7t!aBgybVhI3j5^E7u32E;X=+5vtCS<)&eH6ZYeB0;rC@P_
zlh5Fnqyg`Th->miv@GSDT@R8yMK0`1fjl}J^y*vJ#Q{4m&&N=(Pmz4|^MvZNn*C?}
zoKFvI6Hd@(9?6$0G76{T6U&C49D}Lhf}8CRJov7fHe^e~zqdcSv89%G5XRCBZB`VU
zl7Mh_<-ifZH>62)(-2ME1goM+*k8cZDlu@?a}wKdxfNDU3Cp!x%V1iAG$p`CRbr>Z
z0b?NEhEpn11C~f&al(r75yG6chj;-no<N}sAW4vVNZu(PO%NVH$cNgM<db26uTH0f
z-2iHFV9zoiMtnx#Qsk0`2ipLsNC4z$e!O!ex<_=&xeCn`FZi5>5OQs$A@wf+q&(rS
z`y+<n!k%aVmC?|$iyaJLi|8k?Gy(Nx;bay7nh<oN1;{J!AIxvzcjQ9#5st7fIr&ds
z6os1WEm$-ZOoSe5sjG?*EQmdtpxaL{KGss3pyN^mZZrXyW>DEtYuq6i(-8uj5$UD*
zK4F~@buFTkM3TrUskY9fTYL}!fV{0Q<2t~JobudKgZa!1dctne>EH63l?egBiN9#6
zkwm!9sGG=C2@<CGp#{1^bTQ_D^bzW$cymt!1VO#ha}t~DEfC|!vDgesM^=U(wR>ue
z$m2gzTt1>rvNu`pq`y&;mdZ~m)y@1qn@RlBd7~YRusN~|2w3cW#PAQRp?$JTh_IZf
zPL8(5XKpY;ZP>XMhL<goPLa>s3l|>Cll_!Z@nM!8VMq6t=21@&*GLPG#e1+kppcnx
z1NmR5R3E6yUFBDIvlN<6winLFj9LsXT(KOtTCa%X{PD`J>dHA6D!8#C@!Kn%daDf=
z>-z00pB>@^_XqbY!dLE7J+W!{^zzD=kFQIEUhh-kK<DWWKU+hznE?(Q><URlkOaAd
z^I42mw!u+6!WpV1^AK=U#rG9v=qL|yXwlSp#}q2j#aC*{pAa_mS8Rmxqc4ctFfFsw
zRnsy&vSH0d^I|}+B5gRrS$Lz8SgCEf$P)B@7dez|Q%h5rH%VNswkP&t*@khvxwgJZ
z5elUgJ&72RSGJ-Xwql32;?#B$9CnhTc2dfAN76=iGFR+mUG3!V*vZG+oyxUScx0z|
zXsa(yC0J~$9G=eBN~ub1uf}1oE^4o#Y_Dl#uPOUR+4ZeMQp5#9C{G4R|B<~xtG(f{
z{h3$xMz7v7pb_*d_C|;H7)OwavV*yi!?`OC=UpAnb0EyT-s$r@&?Y)uYIU$0erFZ#
zU{&mJ`S6|5c?gY{y=`j;n^8)yBQ@Wa^hpLP{>fN@t5^B%EDuI5+qPbH7L9gHj2kpw
zcDZr2pM<=Tc2x><Eogel+34D><tP_rs=m!-pO9$r)vG~FSI?$gv(JrLu6loK<62-E
zxo=4-RXc@GTB8>~-ED?QhgS_D@v*^&*COLrjtHVOE9f8|3&)U0bXX%tOq*l)q@!_l
zWJJ7U^4>LHQgmE#jK^eC6a%_E(l#NyF)bH|JoP?9^m_L2Rs5Z0xA>+U(WqS6ro7=u
z;_&rCqxbobuE+E!;I)?v7@YXL*6u1hJ-qTh?~YSk=d~DdsypHG6^{^)9ywKCx#sIi
z?K#}crX82G+*DT_S<i8!$;;k%!|}c1ihllwf!Z5k@i$s~uJYQvUCwfhX<aR&U60wg
z(PiZ9Qfq5ot=@Cqxi5a5b<XB`k@NFb=fPp;p;yks8_pw#&ZE>WV;nByqAo9#T_%iN
zUS4sTbak1!<1!uZGL!2v`^aUk)n$IzW#N^}(W?!Y*M}c7S0e6MP~0Acla9aau&nhy
zSe7Zg2oE<*ge@|;Vjf5Mwvm6}k6t%&-SBep7J$7sihe^K@BfppMBQP6-%2F6-G_QN
zMeW`Bl%xCUb9~hPhU>xkkDsV-2JX8aGng5X5tbRyGb`c##Bdt|OxuDCk0rCsfL?5h
za09|jSI9CPH{l8Rzzq2145%T1Csu9jEJp-Hk}vJSF%eO2I4EU8R6rAaX(NJh1kUoF
zl163g4k=>m)uw4v*iT(m{$>UV&V9l?5OC*G*?uz#za#F(|K5$0a~qpZPIJ>eu+NQs
z<fh2f`j2q(TN$BxgfP7(GVhGgBb8(Bw<JvRC|EBNYJm+G8x1+D3ccI}w~d5eCXmag
zdnhEp4dp%Lj-u`W5oZxQZYyLKj_%%xFmLRxxOasAW|&Gzm}_Ljp(xC7Gt6ft+;l(G
zbbt406Z|qR^e7%~+Z1Lhuo=)4uDcJ#M@IPhY$|+#<4eNMMubtMf8J@0uo;CKw(T%l
zlbzA^@W$P`5OM4Bmu+)gs3{X%vGKFSYxnC3>!M%awxf_U1ej)1m<<k!FNrWU-q8~X
zJJx7jnaDK7KbaC>fsqlWeI9|T-nRlh7)By)9Yy($hI)Pq_hX7svmpC_sJqXvrlR(5
z@Pq_NXeqSNLk~@Qm6AY2s&uJJKu`pfs&pX<(m|>qD1<5k(v*%!C{jeF2_lGqs5B9<
zPy{mJzJJg2%$j*KZ|5I4>#TkDIcuMN?d$uwg9!~C+w)zG58vKX*auoT#zzUqStl@1
zFQI@&LqseFWaiI&DPZ4VkHJWjWQmW1&VZEhK<#2CYD<U*8K{i`YA1r+G!MiSZac;T
z9orI|$AC`8w>)6sSu+gTmbc7i5^OMWH$(rJpn&GZaVf>OEAMUi>@nzug}Tu(DZNYx
z+XtyJ{me(kTP7w%88h52P6$na)a^wy)YBe7Lij%D_8#pChdUyf5DwdcV<5M%NZrJL
zlEMkbbWB_cBopMe`MtQCV<g`m(81;8NPJ{W)jxx4drZ{7jh_!~FyR(s47CXi--Y5w
z?j<SA#6_Tk*CZLO0+<34LYsabbx1MBz;3(s#Mvz-c+uSr^p2Pl-tf8hhwAlVJAC`D
zaa+925WQp7-!N)i`2Jx-aa5iDoragcd}A4wpn=!%Angy)0sBC6WLyMhXRZEDj1^O_
zL!dVLt`{nPSAih_1G<GdsvHVktBW*8GfWEy82=1>uo#t-aMvs2?(yfNw@l!eU#b>C
z-=PAM9>+dhT@LH_UnZW!=O%xzFRb)BDR-Z+_sM_hRq@K?|GS)u{&dc{*V|R!&9kXN
zg!c2riAyzY|A)@}@HqUyhJw(%K3pD#AIS1z{t7K^Qu=i(c!teZI)=S|rNWn|{$*H!
zPkXQwHGiYcx8IatSk9h}C9_i2Cdyf+p8BTR>`XdTPjy8eN&4^&-b2=UHQA8_E_MVz
z(SN=EHTdxpP9@#MSK*BE1<$W1h?x=AzuAkMRQ!*eO50j}Y+HZxSo`+IBZ<HKFKpd(
z?|hLPTnYX0E>|HWzTH;peO~9UwV6(!1M>*apv|NuQ7tLoFE!*BhyI_3tvK!qxnF|_
z2i$~(?w{2lql>WVT?XFfuoW|Dq4zfL?(!C010^+4f*5#7IOVxGE@I+RLifW)5N`*b
zQ_Nv@txfEn?%}>z29{ZiCa0R(u_XOhPSrjr&kBDr#g=35{9r{`pAsaIcPWAzUXf#z
ztR?xts~}vm;CgkqWR_dUb+3H+v_8g1A*EPG-dpSKQpM5JTEmtdQA+5NyL=Jo(j=J<
zbXoj#lVo|OskU@Qu5*NR<;15enHdXShtgFg$=WhcDheWGs-IMM$kaUTIFzYv9MP72
z+Wav>wyu4>L-zkJr}9P0HT^F+Rqpw?=~<eb>KrNGGV60Hr$+pfZ~H%T>RNT@ng1=P
zD!lmfF;b!XV7*h}<?-Qv<WwC+3Il(XVlPCtOR?{N$*D>MTrN@nTTVSv8WKs-Q6B#P
zwVc}7j<m3Ot=7fz?zhe_W7T0UvnKe}oxZbF6(u($;GFbKhI>E4&u?IeSK_b_%xTmh
zGV|-}+~$Q{qm00`-ys-I%WaNJ)CAQvH!A$)!NH)8aaKixJ4jH}AVC7T#GD8o{R7St
z$E?*8&U`6`cQ>Sh*;ivsC*t($2*o$cf5x&Okw;oQ<4jP!VC2KatZrB)V!;3^-n(ep
z14xg`!NsfkC29AR+)J$T;@!&-0h6lg!$P3ko{sd!qT}TNcpsS5g9D|tX01dUh_0i?
zW1S6{#9~1L#;9?5<0+^}*7)U}{XVq`4!D~lg!xq&LJ*%>ao@Wa?37_Fy}6ID7!wI|
z5d|u(W0`bw8Z&;aGcyh2yTZ#AOaMAVh~EKe>%&R7#l)dM<tr&Bijtyxu>*>UN=d$~
zK<=H{WnMf5>X_l5{b-5>O+A;SZ#WU;LT)R9-^VhdU3W#(JPkcV+(EiSM4Vp_$P7V?
z63G}s#aLyXISL#&xe<uWwwloGU%hutQo3ML-1?!9^aY<a8<XM>qRL{+?2b4h0ZtHw
z<n}YBm5XyR{7%rFg=MW>GR(JH98_g;AMxoR!7qT$tEY|KgBX+)PXf_NAif8IHg?Y3
z<_P`|`4wSP^zaZoNk|lsMe7WY7_l|cX$aGG+Am9Y!%HN+QhE~s&PX|-y9>{FFm|Vn
zv(ktb^Wp70USebxVd~tgb}|^ht+dAS=^v2Owk?Z#V;sD<J*dVKcK7M+D+P!r-z<Ww
zd6cf+s&V}zV?DV}l`E4mfqucu<VcpVs7EQ8$k>@6O>o9Bs@BCdu8g?6ZTrGyyT=}z
zHToxfj?K!qo&4-4l%oI+QdoCbGnxTl5;Bt`K2>=##FVt!a8CL6mt^8oX=CQI7w;0e
zW6R{_|MJPsU5Q>+X^|fge+9o6*i&NShcpsX1F*~~6D8ic_OgowrOCxjqbddEjCZ{q
z?_SMlrwh61cdh1=mlqb=kij6ScbLF6`#4|Rz<?_-=-$eL=Zm>$|7UgBQVC41T-ysF
z!KzHB&AS}kCol4%YV49Nr*dCXbroZuf*9PUluSZ#ig90a?Z$1|dP^Cunq|j<q>bA8
zjwe6>-PI*H_2+BBVG*Td+uCKWXKe##wj4uEd+#aL_1o@|pFFlhe93MT8<d*eNg<8O
zocsww8m-o+rokXFQS>RMSBH6r@L5&b=OiwuC7s2|t;mzAlh&fX;cQD$F&RtDR=mGV
zOI;B%YZRV$<=;)}ToH_c?Qe^h&y$WypyI39NGI}7d$UXiZH$PJn-vOS9O)f1n)FV5
zJVBDIm?UTHBx-jEH1Jm<>w^M>6#fkIG{GQfZv)}}{bio5k|GIjQDKr}FAt{I6P@w#
zZ3}lc;+gx3^KY@p28=;q{cybTw&C#W*j_Fl>rII=CT`L$Q<i8+zbUjOwg6dHU|Ybm
zX3<L}HzN~%<1@#&Zam?1sl5k>1zNbxcYHF)`YB!%4!w?Cf>wNxxfoOMK`Mq)Z^|go
zdvpyHy1MjSRU4wzqhSzJ_29uAw_iQP<hvicsHh)J!8CPz0RLwFdh29Ay{-Wy4$Df5
z7z2&`ihl1!`uI81Sen<WE-8#vQIts^!D~z(5ML7@aGp_((@&@;DdoLz%>DMOIjKRk
zt-&>IA4TJJrO`u%Ik2i{_{+T)D^?05_G@EIS(4W0eavj5pP=0Xsj+c!)Q5AoqNY@$
zGcAyHkrQ9MOC@gt7%I=c`1yWED@cr<g+2=_c(5QceW{4D;sp@jQ(PqvZ9$zJt)LFn
zTt-0g10H485pZgoPvN(>ebh$nMhSt+d&hMV8}k8@4)Tyl>xqb@{-VDU4|F#z=vUtV
z>fY<7>TZ)1j+QuH?!V%3(f><;MhzJX{cuds8eL-Z#{>Dsj2RUp0I8mi!n9ZV&hNQ#
z_HelvVO2f7!;)vv@cgpF*=r2an&V*XzB`-y2LrAgGF4>TjcQ-j%k76n#!>hd0Ydu(
zVX%Rys)3jtJy4SV_<#VYBOHGcKKUU`Wg}1_cmT5jFpFMxj9w7~RL?g&yJ&b=v1qzz
zcs9&XdCcHQ&EWV30pY#KU5lkxr<aN)|IH*rvV`?E`+~%U^*$J$HU9kP50(CC*iCfG
z4LL<d%#(%14J0y%V2?g+GMTx$NT&@YKU6Fnhvo9dBNqwmO*F*R5Hdo78I2q^3#+0<
zkjWyv1tL-n|3OS2e&()p<e>-3+8G?bU*!I<#C6rZwt>u(MP$`0LBtV+?dXLf`h@<L
z++Lyyra)O$dLcgwjMGCbgC>}gw7i!Z{tK8YiVEqtbLB6I7nDk5S)T%?8AO!kGGCm>
zDPZc#LIX_Y)qD9?gvEnsfT<z>+vRQ06@>tLp_R{PnrMJ2P&nS~6fpH$=0j6tFP;LX
za>`<x&kdC`h{7wvLa}1%ANsm9uSnp^5Q|j6sbHFMWxdu=!OlSACRVh8sCmLd6HF!b
zmiX*W1yj9<x0oz?AstbJf<85bx%}1_j%5H%Fx5P>@?{aIs7lXv2*8{X>!%5(4Mbs_
zJ54ZE2r6IR1ghE*k&*@q^J0TTedp=%G{MxQW99P@P&TCOR4~m?6760@1QCG-WP0^Q
zb|Ok11C+Q~UPl8=%UAd^h!%(C3(tYFi6T;Ar2JFBl!($>g4tnt*HLy822f{VRZn60
zv0j9vf$TKd`4Dglm_9GB3j<1lQPP|e4ijv8QD3>^Br<7$DY;BaNX)Ip&~h2Xa^Fiw
zuM(B&S(gu#22oMcR$g&$dWDd~;>L#4`G#U>tQfjH<DsYaMS}5PiD2(C!)kHs<z%e@
zB0`+#nC_@Lih<G5XEuzZhWOso1XDkNy!p3unqUehB0MXMoN0oop~T|n3m3#|X@V&$
zUODvxt6xP%Si$=tL!^OW22C*4ai<BU-p&a+t`#)FH1uP#h84<JG+(C+gYyH5ClYZ{
zK=Javbn%BllwLXB@4Zz(65oQkdAZ({kf~Z#+<lNV8X!*w>6aHp{D{*MCnD?&{5#?f
zmOwhcarziT(>s+9ysw$=OIXkua@o-ba}VfERhiDO-dnBuu-ywMi^^;Qx#A3Q0suV_
zm69Gyl->d2{4PrS-S73B6gFQokDWF#C!TG@`5gf`duB~kMeLcAyLb9|U_dWPVo-<o
z{}D|0y)^wuxOu>-V7e+P{o62}CYW|zwmB6{`(^(lnCfo<|Bqnm*=wrmV^T%ncTC_W
z_nIW03Z{?Z-)Q8=a=_3!npoU(5;qN#-%LECX{<jF6zv}tlONT6$Zg^H#AFqiP#5P{
zj-!{HOj-kxr$Op=l+uYfowhZLo+{DQtGEwqO{HtxU60LI3D;%rl6yg^)BVwmc(X*h
z=C^VD#?_{=z9!q~Tb@2N!1Qqzo1Qn;>@O9_wcpouVyqWMIe6of^Re1Pu~#jM=(<lY
zh9f>WB%L_|h{*xHmClK;80zEKns*Jc#&hftMzP;ExZmq0u3ly<4{?ru3ei~|nf=C5
zy}}`Vno~qoR)fn`!23o<BXzYoD<rup{#W<oH0-c<TKd)Lh&*isn53^s91!JA;3wlH
zH7Q6KT5q1BkqY2i?2~JwR1~cX%E=QJ2%?_!T&nAWqrFH+AQud6_JM@j{`~fSoC1no
zG!`ToFro}2=?#tB%5j_;rpB2HtVFq0;Q3s7G*{jQ6p3GeLOvv+t+0~dB|QvrV&aKt
z8-T``E~OI!WDMT<U^^?RI5Af2e;w1ul|bfhqM{X%Bg6og_+Q7AL~~3xO7Yrsy>NjW
zxKv-0hPsXTtyP+1Y9+5=Omj>L9L6%6BU{M08Z%FN1@Ag;)_O&60yo$Yw+NK*rm%YZ
zXuCdDGX`}Qyg`Dn|Kpfi(Z?Pd3)s5`0%pp_s-Ln8iJ`FKt^|EtFE1-l3_q5A*>IlT
zmF4SzTE7nt+#r-guO9`tDMxthU2Ecp{a6||D9H`vAOU~%@eaM>_3l4Y@gK?56B<C1
zOdT!Nas6QG^zlB>Sl-a6q@R!cy?tWaB+ig!9-xq4GiHR-ejdxeO@x&9$&FHb<mL$_
zBP8&LSoCv@c3huaVk|C|!aCXm7a-`*6CmCMbYhQQVl0Q<4!qXi%)E~q4>Sz{a)$J&
zfh^CuPl!_hnsOxV6_OAJz&i$DT%+e5lG6-ZP>jar6YAIsX_{%QXh<(PnWmZ2bD@d)
zXoFMD6n0(JxCti^Bnqu&Kh;bDS^uM%_Q4Y|Fae6}KIs%Qb$zN|MPTphmHpC(2<?T#
zi29lYe!o6h?~*N}IJwDP!F*+znkIc61@ZH7Y*A0)b4_fEO=q&bMe^d7iguAbzU5bm
zr<iHE@)-~|<G+~cbNBtqv;Z1r8t~!5HWip9VgA$<B&RbVD34X=1<B#9ScDtktch}p
zW7qaoF!vCMc^V`NIKc#%Og+Z+teDtss|kb{02NOTNkU-(PBhb0u8+(0y)dU7e|dm$
z)NgfopV~ui(T2iP)-=`a*FcC^99HdGVD%voDqExf;U<p8nxb!7`jZee*3^@p`A(pT
zs_!F@MjC7Su+nhdp!X4tHKqN<&-w?o^&v(LHH;s465?@=HMj-}YL#BH0ianmhNuEo
zKI%UlP<4G5V!=dtbaex2ML@?k>63{NbniuGL-ar3rGJJk>vZD!)n<OOrun{G1?w7%
zL<EO4O*NGlGqiS-;Yy+QDl-Oq{_FER54v(5gp&KEUWLI0-0*U1ap}9|I{DiqHSn)<
z-_CT+GL1D&wXWO>kP4{&b7-iok^Xt>etCQF$mp|0O0T9T#O6}Sh&+}%`aT@jFE95%
zpH(%)tku|yaK^8dbTd2eu+QaLi_Xw3+VClQYlP+z7jG**c=SPe(|*obz~to~bMAz|
zIKYf1n}Sd=zxI$aScQBXjIK()3=jReyRy{>qtaEV?-I^~Y|P?lu<4@<&CJh9g*Fs*
zt6n=AZ2FMlmI^&&z+at}9?=kDWY*6!lzV2Mo_1p=EzKsIp)vnj85zS&!m9OAedM>X
z{E0-g_j<Z5l>n|)z?;RT|7xp7{Lv7&c_Hq$;y;q&^PXomEu1`mkT{Uc5r!qoN6|7o
zm((JcejB$<EII6xTaA@3zJ32)SlXOsY+*m#FHF*p#6f59zJnq}zKKgzkr}1SNTJU>
z{QK=B)$k>#V>-?wFRq{kB>V*eXrwfJ0|ow+)fH<Ex@N0m4kMed*?$GrT?oZFhE~0t
zM<8)J;M~y8gTgPL)68%TgMCk!jC5f@-c{fQ0*)a86!rR}aZNzI!puA$_D*XYDxlY>
zgTS}gCtbWs;E~sZg==Go+`s$O=l_yOd%5*>Pnbn$p7Y&n`|+V|7HvSbgL&^NTI11W
z1qzj@7j5Y@mht>tzh+mPe*gZPrv66%6{x3ywq2wC^E!RUPW`BQeJcaBa5(Pwzn8(v
z*=MybboK0&;&Wt`;3+*#ZsC%iTGl^zwS!y0u3db%xc+}6?yQ5J!XEYCByLP^!4)m@
z&40d=?T@J6cHdxBw|iL^Nur5#GUX%)?7H^z75{&%iea+m0oCbqad0z`-tXJWDt|1h
z`gC6Oo6<Z}$J{<-tA2w`&_5DhdVJq=SeJE-%bci(Yt>JTxTRsNU#@$b-!CGA60Gvu
zbV#T6OCavKOneAQ?+7ZUXyCNjq58XHV0^~tcZB}YJJb<@NIc_xs+wXX7rXS)R3+Fy
z!|aq;QO#zZ)mVtt$=40lI2vne-u%B=)4P47Hrw8n<^FI>26UVn(4D@*#0ponllv9O
z?@8ful}q)vZ7{fF+C_v^(TTIJXTHU-cpeCj#;)5|E9Q5r?2~qDXxG<qH$1Yy5ShE^
z?w$|tNr`305Ho#_hNyIZHhRdN1c>I&!DD^f6#avgmbH7<l8Lbpx;Xamecb-9Jd-r+
zT^8Q0zCo*!>>Cf1Zv-#<r-C^yAN^qwB{Fl_o#2}D-TNM3`6c}@AqR-7<_}b^Pd^Xm
zxOU;u+3>&R5Y~4vtkw;`4QYRORYB%(!JV~tpDb|QKGTsATvXqSPhHxlyAoC|(<Bwt
zw=Xl<wJ)RG|HzfCWn6V81r@)wol`JttvUWnG5_xGrU^f09TAI~44BE=<DTwB_={YL
zzs)uA^<&;r-(6$3$_-hWM30__mwe)9--TRH{AX;qIph4?AnJ)Nf2|-*PW{vwKDf|Y
z0hfKSi@I)oWy;NZHYe5Pmy~%5w>u-`25?3EqlU)KUf%M(5u=Wf<AUAN(p8j#{M_^H
zi2_URQaQUX*F8XQ$qKl{_yZU9>sfc_r5Q3!c16AwIG>;@TNwqT#vVs~$j@M7k}BEe
z0|!ogP0{ZLE4C{6kxLn@RadSHL4CCXYj}y8%M2@y4>Mm;`EGQ<2YF4F%7y(sKAvZi
z2^)9k&dvC>3U(!8&Ixg#l>yTHc2+Ck|5~Q3BRD3Gbj@Y{%jRQCxjb=N9`Ry0q#?`G
z58f$kZu<wNoF4ZVAM>L-+9eG`?<*OUgw^G*6iBR-=;4=AHDw1+<y4!ZL*Dbk3)`7W
zHZvXWs<wp_Yju-W=LB=7Y_1emFp$#G%33RNN(4oDtKm3iQq_>SmhsUNLp$oZs<CvX
zGbTCNAsu#C%lAxgwH2wdgE7e^WO$h`G$YYd;O;(PifnVD2u?oyt>_IIG1uk!6!QL3
z-lyB2qInj=ig#a~FQDV?Ly4xTCT4l%f%@5~r1=kJ_VH2nXh%|kvhlQ7OG$aDS3U8o
zOU&xFSH4`xtfOF+q?0Iu)MCF1rGch{Ru<-enV5sWM)Q8l_bPhut>8xYfpt`MPi3W(
zUk?)uet9-@hIiW<2eK<w;w$DYl@2Q*v6-G{=>6;Tp*UVRU9-lwX^e?mEGp?*Qq}U4
zLBXb1PE*C1Z1fD7QH)BZ-MKEWcz<^NSt$J3eSE@ib0Mw<A}ly9U^uhlxV|bTlaACb
zOG~_n26Kp4o_eMf=M)F=(xKAYL-)Q!><QU4PqrIXR+u_GM9-O-*4FEJs|h2T8)VNo
z<JA*Q72IFED_j)T<8KQVirHSf7Eg7%*0*-RC~qsPoR69u{MeWLx#-{43#!o3c6e{)
zLM`qAA(@xH<pEszq>U)E^WH1r4r%q}=i+}G@7!WecJ^N0IlPi^d?JORW8aQF!85AB
zyfHw@Z36qIFdZcECHSvDfo=0MgS;jd!VQZPWOYAQcBIfn1d!02ODA?=y>Rx1IDx4}
z=4-14+?4@wk^-o++(WE_k}#tDygN$_+7PJ>OEfSSW%oBW<lx?k+5J_dTWzH`e&b7+
z^6T?0<yCd;QA)5AJcZ|M4}A=Xm@0_8t3Lq-#RQ0?jcT6fYhQ$-%6A0HjISUE_s^-6
zW~Tc3iSbj=M#?8jX+-fdD*uwPk=Dd`IxR|{_aJOYMKUYHEksO$ZEetuQ8`->?<w%z
z_?7lTW-3j?lzP2CtRQ2P{h+p73UDxDl|GSKakMNg(LSQr(sbXaOG0F0|26ymm8=$X
zG0|YHA)`Ax0;93wGA|QH?axf+J_AWgJ~A1({x>W8rDvrwkBRw3A(aQc{Z|!*o!(x%
zjVkyoUZ$qi{x<w}V`MIwLGJ)kuTY0#U;RK~26q5MjEQ7WE=U{EK`%`fV`sZ@PKA%p
zN?P?fFWABx!{j_hQV%JCe8TdL!AZ!?9@r|rm)&s$6yis$koy#exngQ#*dM~w?#+0?
zwt(@WI<Qj7V$IZrdT8_TE$3r#HEC0OKHEG-`$|=>Cl-O#wne3VkChnK?UOo4kA>{3
z#pKsa64vd?UU5EAJ2z-?#mBzH<IiI&FCT}O$<qxoYK&fKYffd!lO0V{Pi-%4SOy2a
zuWibyH~+I?mRIdiFRA{N=p~B}J)G{_!q@m$$a?<NzBtIoSqWi#Vys^<mPAAI;1=F0
z&eql;uBs&!65beoAFH^F&x+gM|F|jm=Um7UcN>LkD<H|m^@|Ws`>_31(1SVG?|M8P
z<GEWQPh2i-T;}PVeZO`4QHsmLAv@p2qph&B1F07ScwVg8|BRTOyS&%U)4h}XGirS4
z((bN>kiFty^Z~y#_16SX4}e<{H|$7%Cg)2#aKMMDKxsZGWU-_t&5$q|ySQFpN0voy
z$7{_mt$u8M8Rm;qFmPQKIGFB}zNmCdYV@vVKN-k!Yl}_wAtU2iWG|(;F(q^iaK@3R
zFCN^VOp{aD%>b;D7k9HBjKVnic}J|-x8i~c=@<7ujGRSNn7I!<P_<;<_%<xW!^(?K
zp^Z|VW~e13u=M$3+sM~MEEraM74&_%6jP<FO%Deq_y7ezCZc&R!bmgpgm+4b-mGtB
zSGnj2ki`4D<<iIVl7sQAlO!wU{>bZ=8{dX=xo;&%J&f0!Cj+HFVJ}0H*)<n1%x};D
zj<NkQl{sn~Z~H18$09mOeWMK+dEbC3wZ!-GU|TtzM6ed?I6;t=fBen;-Uha4-)m(`
zA7Pb$tJ*)^SlsGKE1otLzuyBsQ{*jZ@14*#`>4<=l7C_Q(Ke46iUH(nh_FFp!LEXv
zpZUaKp}6PGh3;2u4fkhy?*8&m5M(7;Ix=?%H7U`(0BW;52Y#e8fP4@j`pkUzEZYXq
zj>UWr%FtSn&QngDdz0-Rmui$2YxMg10+(W&(^oCapK&hk?jboO1_@(e^*^>%e3%YQ
z0;xGvsN^RdKwzPj+6#{_O|a+mtyyXG=OzfG;&ZNyg1gJqpC1M1aCDW6wQ3ex*9Esm
z=6|KC4GxPhYusbyEf;PMNSQx4K?9h#e-LKQ<dWuCt-pCNI3$RXHO2{=tK(#le-s~V
zeM3NYelW02%tXrVAc)f$ap%lnIuK6G)cCh3d_MRiM2<l+q-TtnryKocA+(?YAn*k_
zD6UtMVH0}=u|I5~@Ygr;i(wouLGdczr1#jYzHmnz^bC&yj41ToV@Ln|trD#|yldW<
zKc!Qzrg)Al&(QH56@Y%DtprK-N3P5wt37O~@YNZfk7Elj16hsgc3@Fjf610~Gc|wH
zp^_g5JztgVu`WY*u{_IC>Z2vh_&&OWGx;Y^O8C}4F=hY@eUDN%fcI(y=zg>tS+!A(
zVQuD$ZC0>$dXZ&MiwSKj#>N`n1v33D0|1u?;v1GbPC*?+xOTJQXZc$30*0#}0Liw3
z47dZYjX};T@~qSY4e*>rW6TvBBlDKv7t01c0BjSMLlqm@lEGR`pBuCY&a-06Y=G2{
zu`yWkUv%ek+-BR@Zks?4k7P*VvC2Ut?qo~o99yn{I~z+T<ZRD~WZIkO6l5yljSw6m
zW{r@_M97XK6aqo~a1M=3j<awM-f_6DHRt(E4s0f;C7esjn!^^(K}z8g8RwME94c^M
z5Wr@`&@d+uXEiD%$a;9on_*%M_Fj>xpTb?S*p*sKi7?MeSK>|a<E5$%^Onf*6~cRq
z0=bpg3&h=-8kG1WYZvM=`I_NHZR7k7wR|a!NQA=ts~Ta|r7fRQVNC|v-z7HBmpM}L
z>`~V9R@af#ac){8g^hXHPzkb#j7-f;ZSxyo-bHaJqt3>P*pG_9ZA2KFL?9z5c^iSC
z#o~aseKJi*(I8QXjhHY3qH80HZR*1*LuML*yBV!L1lH6Zrt8ZrWU@yCJ*H(@sICVb
zBGS6(E<NQXB;y&DXoaLU!p={KrIoC`&FmI;7s;~`c$oE}G^?*_x40G|TY}(iZIa2`
zmTeB|YqJr3F#)%0;&rT%7~GYZQI_r7m0MCiGdm$a&?HNpvEu3;O1NFanTk<-_f#^`
zU8>$dcoi;NP63a^7cYu{ui{x1`|N0fX?HAq3m*0=5%wTUI%Nr*@TR1E;)OG1!B2@v
zJD3e?D}c*B^Zm8zYk-=)Et}J%n#r>l9>MBt<LV9wjaf5|vnaKMahhPN_UMNO!ImbN
zYB;E<MsxHKgEiS2HSay+2ac*fu+_Y7%XVWtHRLr9-W>u`k-6Ec$kWTih~?he;gcl5
zZT<t8qG^DsJ7Qi0AxZ;G0hn^E=a!28&v7242m;k0sYn68B^OWO#it|?hlXJnv7)-!
z2AK^=yCz^(cIV9+pj`<PF`=T6ld2lhN!6S(#Qs)M%E2|i#_8u6oco<}QMJ>V^W1}7
zHtr_Ma*C0m-MO#6=cRueQKio>ZJbZA#`S@9(qdW3Ju;)gQm2BcJIqu>?>f_|U@8e<
zMq)WcMTB#H(*#pfnqXRGC*NadevCa8OeF!|{7Qv=Y&iC%b!dXAG6A7jCag@bSH8<S
zGAWEw{Q38S|EnPx+26vCvIInBrl)HtZ9xpF9M<w7@;vWL;yGUkHG`#cZGwAj`0Zb)
z+KWouvf;|LR?6+fso7}#k(mi%cq{VR)2_oV*G_iIPT{>Z)W=rqy|kO!#o3gL@b_nL
zr3lB`@Y!HhSc0Wy@vsm82URAH^(IBwTiNWTm%#lcvp)vhm~zfhRhMITmsSS-n@biq
z3<O`P2n}2lW?tsc5D}mw*wcyd&G%@D-W9&zBivNM-QBYn`%}_CUa&jSUg{4-4`E;b
zTJ<cR>rBpBrWU-zF8-;kJI`%xCUuA~w?nJ12k*2;F6;`{zEi!$Ltb5k1FAJ{=E;BG
zR$twtM%L@>w7~$yvp&1?a*N%uaw~nXD`&Rk+ewt3=arRyaH$7xLkPmNM7iy*Yv+JV
zF1O3}dtuWO*Bi^+S06(Mt}))hYb!4?DfU6Ov7CIWHchc?b?yRqEOe_8AZ+D7R&~++
zHqss|@w$Y|ldIi1C6#K|a^>sal-22*_gMU28vD!N_ph(J*(e)u79YUW5^&5NXmK%c
z>AoC^6Het05D5*`Y7T_*xGOmX<u)ME8gO9^|FhF#UQH?M?mCc36E0DGHc^)$JaQg;
ztBLda_ulIdxI@{9u73cKsU^Ntyw8ngXzHTk&UL7HKP>_ELa~vZDS*2h?{&L@=?^2T
z=w7hCib&*Wi6ad#T}mlJMfwIuI!r`TT7mtcQP|d~&d?5e=IHmK(elruohI5BHKM+2
zoPh+AFLQKw??j%rkEw6E^G+j%DNOtzRP`}SEG5+5eVW_aAz2g~7EVN7O~8tav(&}H
zkFY%V>F#8p%%~3isNW)?W!!Q9C~@H$o~l@r&Jd|x0NTGb1r2~z;rZ2>c>gZ4ziP1E
zT4GsWV(A-8xN$YrCnUDhR)VtG?!A*z-h<2zgM76Sb@|)&5ZPPmn4F!F{NO`-12S1f
zBeL^DavDo&b6ARPR_eod?FjYgfhDUyd8vhA3%#0Y*)YS|w)T0)s4w~UDJ8kv*Kgb>
zn=}&7WT_eK668j5q=-Ba$JY2rCG~v*wt)ye{+9SNjBREY^49(1#or^{U^X=;h}LZO
zF;Bp-ca8}!#Nr@3Pd4Z7<h_ayxz@979^tu8S|K8v0?R#jQds1*vT}TRbL_+KXNTqG
zP3Aq2&8KD}uL2Ivb{a!dd&~n36zh2lpE(t_J}B(eDx^h><>XwOlNX++JbcIdXma+U
z+7b&&wH0(fmnBdH$eizh=gN0yh|?;{4Jb-uDcRC0eiUB(ue}K1T)g*yjha-Hv{Afs
zK>jj&PCrZaQNG7#?h;5r$&c9*hJqY1KJBEGQiZ8f{Z_ip1f_cX!)v{T4h0o1hXv8Z
z5DduwFM!Y3Pcj)PiB^;%=deb6d>q49HN42emmTM3Aei29C16=7<Iu;Qu?Wr=@->J-
zz@gWUx4O`#`pIGIHw(@B2(@Pg!L1*wUlhnu`1sp9ki!wlc}PLU=CvX3@)ADT$J(_J
z^Bn5?h^N#iPg(pwbffE@wU)O(mSp>Vb)Ghvo3E~vz~k}Yzb2Bs?u<V4Is)Pd)siQ?
z%R;Gp&~7h;`akGz4}lMh%->Yqc$b*pqJ&r{4HXGji=3aH-vvWVnU~4(=bTdEd@Wwn
zCEjz}Egbc}lW>p7R^PeSn6uS)BU_RpJ=6ZleC~k{VOzeCxt8<FUTC+LxwQN9w?5+U
z2#xIMYwZC1%P+6;X$<j?qJXy;ugPE`0R<wcImwWSECqhiEr1Ujk=19Z>Yc%rE$nUi
z%2UHslY!eY@~Z2<R%li#d7rKKEJav7h5uoDA)=Rep0eXiDRvYPkLq>cFdT5`q(1HJ
z)i~-^I_ewOOam5%{RW^X)%;-;@ap2#D3GuwRx*RaHr9{AEnPhH5JpiTuX@m&6gITG
zNI=vnV#-O;o-V^~Mv4rfguWBpfNGdJ44SvJ$E6df-DPX2LzzL0D!Gonm^XesKl((4
ziKz7EWkmbj!<3n${67u@w59ny4gcTnRSrg1PYqMDq6d-383WfAX*x$?90lrfihyeY
zJRM?u$V-mQx=pt*r;MpVnFiTaWQdL<iXanpTcCmSg_?*{>rqdqz*~n$?_EB<cN3hx
z^1@(4C+wTMPIiZX4_1+Cf7!7F;UfwTVd##bWlV@n9s{_{F>vbi8&n*2@>t}<F`)Yv
zoo<Urlg4rPF@Y6X;-VV{!|yS(mh#7abhWy473MlUdFj*4qfc|6KFQyoCM3X9F_p)X
ziZAIhKi^gMH2|g3^NPAe<3#+}=y|I!pq!amuF}uPOP`OiOhw=L>mF%n3cmbeEtnC+
z3&XmsVk+P0UL8CBWO#Yye9?;8Lfe;5p^Oi@_u|=8$)v9geAW2R*Or--MFg*+ng;3I
z4k_sMT!gCb5?kpv|LzHq%gdpp<!0SWB`B8@{5h1E*_A<*&cYM>Pb>988_zCpv=-T0
z3k5hAy#rhmBKLsjXD>ClvrGe|E>l2ubO=#?VbNy{+h5tK7d#jp&mnPS1{>m!$K|UP
z$E&x*)_iRgpDc5e7g=en=~k}a8hM`WX#Q!@hE(yc?C0H2pEi!aSvK{&IQT|nlejF-
zD|z*DIMSf|n4)65JWF$1dp*9sb`qhnrs5>w-cn8!^@{{`H?(*!^7G!X_AimI=)fyg
zZ%#tdNa-0b;UhX2fB!i=$W{nvfEJgEA{g{`ugAFkYc2lQSzJC?cu9^!<(HtW4+Wg1
zAGTj2S;Kp2+nvRD38yE)gI)Ny@%iLu@jnvPTF6dym#_&aEqqA;vGD06Dwg!#W#!k7
zTJ;w|h|!Cj5w9FBHHsfo{~tM3+)R6O4EvBek}K!(Upe)Gs_(}xnw<Lfkxt~{5k$3W
ztOS?Br#r$?F<gNfZsXT9=dragI#GO)d`nDD%xO1m^FG7d$F&ebxLAt%(~r%5)}qlY
z8g=vSAsZiGq-fM%E;gO5{@N<O+~nMG^FgY{&Xdmr=6{g9s#b183ct9sKZ@RK{PyOd
zM&~CM?dPlG<z|I?Y1-El-a0;OXur7rQPW%!&Rg<EyLBMaA$66nl~w#F;S2siMw3<c
zadb!F*_fL<!Ru>NH7+mHb<eJLkD07HPd~kA5@19Q`;lHmRuwZl>7ft*aj!e9`!}17
z>-uY(sBaVhsGlE(d}K4m6BvaO@z>`8)HZ9K>?nk#NhWefh%~m-mk2k)(PwG@IH!5f
z9yIPgq3tr};hrp0DuE}S=>}g(Rep<pOO(~No3**^d0Wi)mw9Ok+%F>sD!Rvs^Dwy+
zGIb^ULd2A4n#~0huiT5hUS-(@cE)2mMgrGu#L#-f56-qQs3XKe#>OqAf3XJN4HI25
zy!z<2GUwOah^^sk#gSKMSMD>t@8eVtn{S`hj9GC+pe1r`hDs7IBzqU#xtx5xvcQ?i
z`(^>G53EVTX|kge&3o_Zv!9fh=oOUPyrvzFdNwMa4a1G9HNIW9)JXO2tuj2eGL<u~
zK*AXw4V;-Pt0>fCp~<P;@1=e1y{J0_G|&{tAUT7~g!)&Uf~Ex+8fa>C3Yr?hLT+|!
zqyq;OE5wKWy3N*p4a6Uwu#lfkvI{u;2Q)QL5qQ{d_8-tx{uDF?xw$$tKN2|wO?&8B
zBokRdb!QBFYX&i9cCX%b0<UK^>C48@K+|TV$gJUyI6y=4fvX{+)o5rocpOj}7dR0p
z0idJP>9I4Kl<E?vqoWt^nvk?-A&1PIzdq`OkKtru5wM|EisbeW#j5nJ8a9>ZxVi<C
zggWM<7Yto$uc*d;dZ;teYDD)bbg4+>$E{@pr5~zO_Le_v-qSgDO)yymKMng9^>q5t
z2Tx0ciC+2}s!BSXQt|Qc+{ts+pY#4%nd_Q;2K~(0@sD%gh{xnCL*?Q+`y#hG{{_EO
zywI-Vr&AEOZYlp7rOYlGr|_JM6TXoC!kOOp?F;i%{bL*6d$!S9Dl&m$THij^yK#Id
z3};u?bda+)<6hhkX5n;jEY_ZP=$g@wF<)kOz#A?!J?8JBS*F8E3m8djW(MVk@N15}
z1yhuJ3OPii8I3Y+A}2^FdU&!mvTec=du#meMayvx?g=o_4K<5LdsvwWPt5cRboWQ6
zLb9MS;C>WyU}9ioqV8s9Z%q_|eF8PalUM?MFW;C1JmAOH5#n4{MOk)s80268cDPcU
zu%9B89+I8-Dx=maVLsBGc9u)420%wIL%~eezIvrIof!O1q*Rz{j7w`MMO;@k(Zgrn
zRVg>+@vLI-JPI7bRaWy~Lk%f51!!EVy5iTAako@R`QE~IT}F8-`||I6LyZnxl#=-8
zuR#>n;U##k){2PqSL?er$tyyZYfPNrJO**Pw7ipTiLqtCUH3QFAeKqzbv4&al+?@l
z`Iyts)IZ5kn`rW__JhcJ4I!MgEuw&J^Xe|%W;PQZw?9lJYIkGe{oo*OPvp?qFVe5{
zHx)EH+URvUDZ|cD2+>yjJ&%t`Rx#ec9wIj+&ALtWSnMnSFxsTzR5Xjft?&r)qso9v
z2bmD@0U5guJve`>-71ZJv_zKREuf(YsIg~bLfRLbstk@BG%c62L!Ma1w86FQ?mkBA
zezo8lw8?D?iKnrqvQMXz3xw>0wJg45CHlYvVv|(%hKO)w;(OJ~km`4))tdMD-d2{@
zU#GFAcEbg2)unJG5xkN7su3h6K3FF$AnU5)b@6#!xeq^Vkg<BYq4mW6dXR;OeptT)
z3!J3;B~gz4xWiFj=_b9@s^7K7SEk^wmS<|>wVG`N=UlY<GalbsFSm_6%K)#M1~tB`
zPMuP(KJBFEM6Tcbj%J^1@oa8;bl=yuE!}8}8xsSY2>N$>ZrM5MI(=2$EkG<4P%$#q
z@%~Y)CM#Vmw5=TQKKBeIz0g1cz0v+@DevV6mWI`W(C**oU=h|Iz;l#6t*s&1@xPsN
z2h*WFpl_VQfK>de+62*diZL-ybdlaHthcP)pLzCRao$eBF%^*FsBE4EwhikSfBS*Z
zH<I*-=%~?R?RgFTY&kQrtzWe+&{{4P<G(HUs&;9RchtBGSm&jwbFs|&M(T?A9K#^k
z4-}s=njelK7<A_gxh$&``|iKZYN(RSc^2*|krF;?<i4Bt(%eGKJ3~q6&`^i9toZ%G
zvXJlDVC+@%Z#o;{_ZlqXAMsA!3p4kway{3NX0l=FJDNp>Ej%mB_WQO;y<4K6aydm0
z_Cy5TASvvY|4G?qXXTv6;duF(!1BgH<_mTaN`3o{+M0$;j+l7(9>!tx;?pt3yoi}j
zy+1#;1Md&C5qMJWTio0a^mgU&oa(xHJ39K2yLDnLbCuO!8}AgDpFeKypI6JXmzP|<
z`ELr!TxQX^ivN*uG>WoxHSQE{+9GzHr7SSEzM#r%^)4Ag?$Cr&u+0r3O*mb<n#je{
zdn3+eWf5ee8MzVtGx4+PXIeq_&Nw~z6gW+80ANpnQ%4$bno;y0;FNV)bKvY{{V8|Z
z0ZnMc1nEGWQ-$4S;9;2C!+uTYE%ue!BeJ+gc-?I;r$n<T>e^g+*ymMH+Mld*G~u+b
zfoPR+BT-;x&ygmaHqwMsdS<_>0R&ArWxl-qAK{d7mjX-A_;FJhJZEyEE=&_nuOU-E
z(uC8Fmyg0OGj+C)Rn*z-*sq!U>+nCita>V(wtKQp>v#XLA7tKY-ahAWw8P}|n>hgJ
z-nU3yJg1mE^qZmm6#~?hD$9z4QryGVm|ljD&Cp+!`J!me`*VNs8FcsDmwwpo%{+(a
zD2@{(NoO7w=e>By(TX5TMqztz+fJZrnT|EJwZ^vo846l0+DjvqGP?Jwvl!O&{s>nk
z(Ve+G(_63ao8%UyAMlO89<8a_6ac++H%ROYmBszB%<u|SYchI_^A2go-t|AYDVglR
zRAt_(0i*K7{uPV4%@FmMiFk<=bI$NO!whd~1IP>$`xVPLS!QX4x9}SiT99I)Z;nuL
zw8AR09$Fct_JFx|iAtKJlUSk*S_4?3{fmca78WCQmB`izEqMjown7vvdi^MeYLTLo
z69OdF5C%p%m%U+5U^n5RxNAsxu|%UKnu>Xfo6@sT;u&bRDV>uDCG^K{+sL7WNTk!%
z#CSr!v`;=Rxq-<{1R7Wci}!|wqG`Dw5*1Sk*~Uqt6>-GGB#ZBH(Eo>RieU&Ty>)r<
zKelNG6=J8z0u*6(CNms=hbHCUiX|ui8%ruiCO=zbylDk{um~z%g+AR+Zu|i23beA^
z_lnI=8uylnOEfseO#?vZ15#+Xsa+oX(inYc4~wW`vLu;dq6PXEPd^mP+N%g_(}XRe
z(^tIHK2)Wh;-(nbe{oZxP^NE*>Fi4^x4xz7{0BFk7|M{dJH<_{UM2oS(@*3<%BmQE
z*z{0x+W)pqZ|tWhpEe|9o?y~X6f=R1&_hj_T@MYmrJw7`1ny))OPG>xXPjdM36h!F
zq;uxWm<8!Th;Swl;2sbTDn%vpLm<Ha+NO&%+m!0x>YZhAkP}i0HZg%In85VOsi(Lp
zELYVemmLmuz@T-9ujn5z8k*!K{W`@>tt6Q*EJ8;cb50gdantiO+%)#S4GlMqO%`3u
zljO}OIpv=;<VCM#DXu{?Xv6v++%)0IeV7Q#1SpTUg;{VLbStUABpXQMS7{olx*|}9
z4jOZvjdrT<fg*6cf$6$*VU;4Vq5ak_ie4U-+8kck9-h)5T^OzP&{`U*ji+y2gLX>i
z+JWJIJ+fsF+&9MnvKa-RwG^ikjdoFY2l@qAmJ%7qq2HZgD^Fls(ugks4EU-?|Ndk@
zh7=t<kq(70{&^x=(Iay5fQla-d&KgjnCYVwn!-w7ASypZ1~W2NCXqQJBx+`hp(ChI
z+YGLWC9ek_2`c7s%9N@sgV7Xr!4Xt8-9>bVE2x7$U9nVYUG&^6fMukVS^{+nxT|sK
zOo&B@$dqBL1w)4mbeK`$-sKHn%LFrkSm|<0ZNY(tf^!AsR6vsbp)=^?Bg@5dtM!T!
zYgWrxgj#Y1m6Gbk=d{^S?y?T9Uaa(IejF(CIN0>@EuY7s$&bUUA4iTnj$VHp!(2s>
zsUn$H-Sw$TNUln%u8La+r*AXL(%6CI$`k91?1D=CcJ`I(Cxs(V9<4tqX09%gsV+0E
zuJEaToJ?!Zs{Vh;smTaAIz}m<C)CF5&VtIC*e4iNZJ%lFfKTn9b}hOQ_<E%F&3f&-
z4j`IPJ8Am#eRAyx^V8Y&+6kXiIdvfU=|`Em`NOAQO`k5w)O|Fq`!-TH{1LELP`B~1
z?iVviWDFn@0Ng&TRf<JOVCsMQ)bCf<za6O;T&(}f%!r49)z@pN<M;h%8>ZtCZ(`ZG
zd>eUa#fLfOWi1#wvr(9(NnoQ9W!A)PmL}%XBvBL3QP?Ej*;v@dy$LIk#Wc$MHY!Bs
zq>4QI<n&BEg<X@s@c>bP^}PWxd8QZHh?(O>r#zQrdFD%bZjr(+H3!g@r8X<PMjH7x
z>(x9jY<za!_t~YIXDXe|XJnt^3Kc$FM|fh2HI$*{2`zp*&0a1|9+8@XsAewyr<OIk
zf*GwBI(eN7TW{BJ2hTl^JKLf&*Oa)y6JOYr%HMihwD?91JQHPb_M_M@43k?A*aO+_
zz0{Tx+0tH85jOWc@^wQ20Z}R29J$f#8QE4=*oK$wFq#!8`PY~+*Vf?M((<qUH9c8e
zi51{1mD%9%Qnt0rrM1bdqbB8f)oZ?rxen$L-nP!J?tdN0|Jp_i`KKeF&Cl^JxHNX8
zba^h5MU^0fOVGYCugnsbhQ-LWB~F@i+KggJe(ZJeVz;<R_ve%sZ$zjs<XK+4nFG|y
z_Du12kId1w{dzvKG_BBTU@Vjr5z1oc%h1vifpxgwf1uOg`{Jk2X+tR$fP~YaQ#$5p
z&^4Ye&f~L`RCtg0*`5xiJ_(mTHuKJQUkbdo$7HVWQ%#SOImJ+*|BSh$j0_?b!^oB8
z&7cI~qM+&ks?9x&TEWox_<l)i3YA4rBehY>ukUS2AGnrZF{=NWOABtZ@8j!N=Qdwm
z?;5bkD*G~)irTrpX~+E9s)#Nq8brAstux3?==7KC^Avb>^+*68)#xGD&%XJRbyMK3
z+~7U)XYs6qd9K5xD6uFF2>TwaIUX$C2mTbm@Hj}UfsV>dQe<yO_}=Ru7F}w~j~Zfl
zIOJI%l$y$(9`(v-b0B-P^ZCQJD>B0;jnDc8UgyxD(=q;he#CmlBOfJpn=Z}<x{={p
zc(Ckf^Jqs`*HB_@Yci|gv##OUn&Fp6!h^1(YXT*!sc$Sx*$uob#sX=rR`2#w-|d?-
zMqu9joEIE)eM`65wQw|$Xg=0z)-osX?1#V@STIvo^cnQWyKDp2U*?Ff!%(6hth<L%
z@W;6D@%RfYWBoVSI(|a@1;14E8x9ND`n<TacI6Wm)I{W1PwkV9heBsQiFZVZ>Aacf
z@YH33L!4qIC9&7WM`3$bTrqgAj=m{+C3ZjBM^TN+o*KY#jmDk!Ou5DK>%W1)kHr<`
zCt2wymq*{Sz2U?Ec<-CWg^h+?8svoWkDU7fP4k?1LNwXKFb-px;4AE|NM*m{_qPnl
zS8j-Se450g#$}c#i9bGocce>{W%hqDWd`W>kif<;k#2gq+vjHr0W+Y$?%({^x&ve#
zP+W}g5BDD3y!&FZmTfLHNPf1IrGJ~@H5u|}>VEcO#12N`Z<ct;C*IymGx>`wgC+0#
ztu4E^?Ju`|Y-Ia1F8@ikS4jw{OhQRnDY93fM5hf^)JZCFdHnqrjHy=4U1coy#Eb1Y
zEmL>rC)qyl$bYT{=r@pCPPQ2)7KI>fAmUZ3Mwr+_Ep}nDj9u!N4u}E`v5I~%`TiHp
z{$^itu>Rb{4L2KuR%Ss-c+d`Br%^?&pY3Ca?#G+9PBAE<85KynGVJGz0p2&9JO5lg
z_XU)TV5(biSwX~Mz{JcI_)fq?Q6WF_>9~0yROTuCC}1K~U}?<y^Ii|5RV-+^gq@PZ
zjMc?3tZ<n|GqBY0t_X?`X6j$VFz(SI>#$5)pB9aEri$eemx*8Aj<flvbGKr;Slwl7
z2~(kUu!t?#&NrO#3(m&DDKZ&q{$?s`iN$T3VZD<zB7i}<?^6sN>C@6QL*us;0>rat
zsvl-#9xb~^wu}i7uPa@BJ*E`XLuLH)d_^`0ij<5$B2&JkfdKgd2LV<JOp-^i*ousA
z#;nU?A~W2jOm_WzAt$gy*hUI`0Yunj8Q+AuNA{DrU!#mn+1MqY%9!Eb9Y3Xo$+8_a
zltrFj(@78TOXtq-k$9~*u?`cVMdThXZk=Q>$7Dc%HQ0Y4uh+2S54OkoDdU2INiOE|
z4<CtD1j!tcp%;;m(mNqd2C`8L+g(9y+4u#=!0RzR;M-lLmu~Oy{)BGzFt#qTYb~>o
zP%OW!St{sQ`eN@m(n5KA7zKKvPZYt^oKW&MQ#Q>!#mn|@K^25g%~Or<TbKnH@tabH
z=iP5<n_GC$?XF+C`c&8qoy^QOq@m|mHs+kx<6z4`sP10yD~=F_)?iz=AdCuoGm4Fr
z;m3{r!PdID!B5V_uwJNNS+3*Gl$U`AvE)Y2R%FZ;9?NR&ZhSA=D&J#(BcO*$226yX
zhwKNN67w&k6@)*_e@2`!qPeF53?rnljfpdX912OTtX6a^tr-lC*8g!&w|(3)1b#Ju
z4jT@i*0Yxa8EEb)FU8nb|BO+FNW?aSsUD*J#z%ou_w=@Z-mfnWq!Ua~!qp=(N!>Gm
zC1UI^6w8?3z-q|}EpTI*{>*03EIAB6mOW!&41+X<p7g8qCT4_QYY2_byUh&>BYvNC
z<GKC1feP}YlcEcJ^BF^AVB>cEo3N-W)*NN>O9L{Eam+qaB9^{hEcRm3y#rbsA1an}
zJ6RR|>-9iV`DFRhgOD30v?XzTZmG)lLRN-ubVR>u;9`?pcU0P(32gX9pxH^ktY+O;
z%WC_lmj?>$H!jv)dU1z=|Kg@&lh>P~bA|W)CJ4nttJPjOVM!b?ZRHC1t=rS6g5RvJ
z%I}2r#X!gOMT1vMJLJ5gvC<MBitF!J$myk<TS5B?evE6q{fzTGF=kW8<FfY~7F;ra
z^8zZ&ETv;IyH_X9H*o%-7&)FFxmI4N@5Eg{E#T;DrStg&Fa2Apb@66$>MONxYxlIV
z5Bl<`mw2llU(rx!ob@zgKel}ObMNR_<i6UHfmmnsrP|zw<2{38OhI<9g~jI&zHmF@
zdByc($jHZ>tK`H%`L^;avX~g6=xXPura-CAiTS{_dlDc%V;L4poYFZi2hYZHJZ^DH
zM!b>LiU{2hijuIVDl@wR^mrVHMuWsg6-B-~c?iTbU9YY6W5h1&#WW$mF-zpd*_iHt
z4?Pe9(SY+J+gAKFPY9+-o<;Ei;(<tYq)xVmN;9xdF~+&ilyBllBt9*SjPyo)*(ykH
z1rA!HJAWKmGbQgopL<uV^6G4#&hMjx{x%a;r*8@|FkT})Dstoo*+rGtINJqW@I9G&
z{_}>he9;N=J4RjT*q}gPa^jjKf8dmaaEuHqtgmE544gc_3%G}B1uF*{U4LBB;_O>L
zpzd;`uQ~v!yuWkp;T=i91*q6J5%nQL{N|gXTO2hKMRElKvTBYQFBp;@9yRhf8A&44
zvyA^Q_U^l@32oaSen<kLcj=H2dapw0B!mu9MFdMgKomq!K$<{E=tX)Hl@2N*O^PCf
zCRL;<7Ep>HAR<k=<O#a>K6{^CPrK(nzj0r}nq#a#)?9ObKSs2}x8$s7jG=-f4Ns!5
z&Gj-+pFPecjkmQ{nGTUS1)qt#JBCBIkeKb1cM^zRl#Igz1y(k+ajaE|Bz`J|_NulV
zd_-$^rDSA{0w@w2xMbKcjMYAr)@0fC6a~Fn#i4&ItsBPl0&w=;7Xq^NWIoiKvHL8e
zz|;!c39rbn7E))v9;bMPrAP{|zn3>P{K>VhL+v8*@#gHKi_M!Zl*QWj>%-!M2n~+W
zc9usryWW;(8jO>F;CG=C#k{&KX;KB#DZ*+8d$0AM`9u*TBmOipUa}lhI3ahR)tE(~
zYrtvZV^bGgOQ{JqP0RSeev100bIJH&wUu`9)1oiyBUM_@MUclxnv<W}(qYk1*b4TL
z%iqoU;?PE^xBvAswWy<W+ifhzamVO~g)6M*%4WGm5ucGxPH(?f$xX#6EWjy4oxa>G
z8=p2c=wdjNm`F{ji}#G+PG<rilgyTC3!EV9T+Pj8SJlSSpDleozORI0P9MOFpdF|+
zS{Xc<3d2uF>w9=t-mj{URLdIfMhaSKvED0#DG~Q_80eB2;K4D<r{*K+i0deJ;GhI*
zq<e^ds-}X3o$BD=cYQOjRd0i2HeWKwF109x8F<N>m@o+&$tfxZ_wzcfN2<*!l?9$S
zBQD;4hVM(gzUBtg#nZVszOq8LlUK<c#2fpeF9{S1t&HYDjZfgOFg$lnP{~KvrjIT?
zFc3TH%##ep2<xgCS*8!AmaH472bZuFZ&~oFouCmvkW*g_rPsAPOZzk!pV}D8Xa>8;
zhO3x3vJGc;qFv<E8cbZ2hO?gGT@;H{OwZd4XOFhKDE%m>g3ls4RE}IqAI|xJKCAlt
z|K!yFlT$BecBs3^XT0h=t9Lp3d85no|M%onH3iuJ&!p3~i_-sf?DX94W2Zk!r{9@V
z?`->jt90u9$I|IcWqevy*m@Pdy1Kf(x+Jsax1`gCgx_aQGfJB??>E1$X&&AnTz}Xy
zFw#=<v8AZ2^`DncTYi*IzcZ&ZLv4Q`opz5BNZ9G8mpyB*I{RL??Y!<780#Dxd$&5)
zH!{9B^tNZ`ZSVTK!55SLKT4;=@7{l&otfR8c`-HnX>N9QWA^pi4=?vVyquX|*_nSk
zwJ^T0u&}u>IlDNyy*NF;G_(DAZejVu*X0kNRu^_x7gxS4t!=FCZLDr=f7#jIAQFiH
z0DzJR_)5iNP?6h$qht|3(N&Sx7Re}Jlw(kt-x159aDJ?-vY_)COecoNu&S^-Mbzrf
ziSDYR-VE6@JvoNe#ZRvzE-#FASC>4yrH!NJHL58cEHFqBKiN}rd$`2B!03k2gFDaf
z+E$+*?|E={^ggC7hS#{Z>{Yev@ST&rwfElCc~1A-Fs>^ff8@8eFy32t|6Ow^h=$Lk
zzGAX1ibdj7Uw!3tXX1ZRI(7O<I*s~4I(1^5o4^5jsweQQHVE@yN~b_Zl5{%7A`Dys
zGX7dRoj#CG1sKi#CY>&kq*JxAUrML&$wEfunu;REqt?hLzmiTb{7gE1`YY+Q_BW+d
z<3E&6DcXOMPC<-6lTOEBVY2YY@GwS-2mCO`Z_?>eLA2Qq(y7OH=``s;I<@#oI^|^i
zK{~bkCY>@c|6Dq)*X6c+D{EO#)va<MoeumYonqVN7@xv{_xD}<Djx}&xrpdB#V}q#
z=GFXKIxRVnPA`~zmrlJ&(&^AIq|=-E>tcVCPMyZEG)Spt6W?D+r}*ENPFLhGEJO2h
zPvC!(PA~OHT==DQ>a^9SQrtKZ<UM4}@Lu`#U_@^(Zww9V&!yAOK6=XHzn4yfep5Of
z6)gFgbc)A^=23$2q4qyXr)K|vbQ<>0NvC*{bh_|eI%WMc>C`8VEDMGQWrrUI3tsaH
z9|#5Xq_dE3Ay!@uN{>Ax12Uk>=YNz=J>!U_80ZT?*w3ZYi_7txJ7(aoo{m3Cr=6u!
zeB_R0+=w#~Zw%hUxz9ax?mokY`W@-?h1^?ZP)OfU;;!o(TD(^?d(BWdJe0rf=8w|p
zv7bw)wFlBEj@D^8M|&s<#RU5orPC{M!SzWdsK1j=t^ZZ&6#wVaY3m<Ir!X8D!^kz1
z%9(;9wFOj~og5Z(-VS!Tpwf2}N}zsm5z0c@P%*0)5;Sf0wc1^{>3@ZE8uKgZ6xMck
zDY83JXyvr&borHCWlR`m@v5zYO`~9(9@Cyl3p>w*PW5R1fpn_;FG#1tzagD|mZM-#
zF#M%-s*Fhs_GdCFn;*!`D_Yf*wZ7+_384H@Iz9Gpkxt+KTcy(}F<Kvp%J!SFy#<Wc
zvW4g&QO}I98+;cxnfjc`3@j-1>o8{-$A_reFw`~P7SAh&whp^eI1yh)R+{7zv|=8@
zX4&8}{%(YYOA^o5g;$@b-8{D0&C$MZ-jHY4G;q4t?<CJD>C2zRzDcJBzbl;z5B{Na
zdQ8*<1C(!k7Di<<b;|`HSr@{-wC$cmb?3Wu+8I?&mGi(jB<Ba|bb}<Fp86)8*8Z7v
z`uZQ2PLKXvI@NBa^@aT)opuVA-WHT6Fbb@1+4MOzB^^n`-VrZm%+h1Le3@}I_Xsd4
zghDQq8p}}p!cny&q_-rb+=Y?6l+oAHjJzfE5I+O+OIXh=BabMPz)LJ-ke(93xSSaF
zVKnSi9z{3`W<ZioL&5gnrBnFtOQ&H6(y9G2*nasJ(y2D1ve|D*r$@g@r>H-bPAk7j
zr?%gvQ^x<ebXroOWk!-t`Ts;Z&HL-pDdRWkROoNg>1hnmAXnM!C+T$gFG;8NKS-w$
ze<Gb8{Zr}mGN{@!t)E%T>nG`S<Ul%AmIZwV>6|}@5>xn5It7A%kWN*;NvBDm;(w!b
zTKyNK(>3scbm{~8g><U*Yw0u(tny3gv~vLFP@vWi116^$L2OJk!08==A{YL;bc+2Z
zoqB^Lc0#A-If{RjPPM*Cr$)K7TE8!yp7|~5ROP#LD*Hboof>?XPQ`wZPK&=wr^`P|
zr@8-#bSnER>2&#5(y2FyFeTUKBE73EXYfrrRSuPGTo&PQlp}?ag|BM93gcIbxSuLd
zBbA(ypDk?(fr*tk^*ll4{h4&C;z>Sp?r+lRvHz@es`e}CH1J=RPBFifPIo|BKa);X
z{#EJJ^S>&c%2WNGbei&Sl1@=1>9mpD{=0NK_6O4GiEq+r=&z*HWpaW!xqYIM(*VuU
zfdlEZ=x5StQ3bi~z+aM1i$Z^tPGR5+Ka)<KJgL!C;FMoVr_K{UN~fM+3M5tPH|Z4f
zbLn*KN9nZUn{*lq{<U=KEKAS2@{A&np^uj7KPa81{!`Lv(a)t*0yr)aoD_N>ow|OP
zPPM5q-=)(N6m_|f!e2?J&WUs&<f!lXn<VV0{-UJR1l^i<`%lv8X>AIBbq^;1t@$bt
z^-Jm0j&%P`JQ?)ANvF2Il1@`|8T6N_9ui(Zq8n~{{4NgJeT|v!cwE2!jdnnJ`&;vg
z*$O&P`O87rZ%d~pKa)-if0R!3|GIQ~^*}n+|2yfFp5kxPDfTy{Q+<-Z`%OAE3H^KN
z6qEaxrBi1Z-KP0dND>1@5`&Z}Q%*m_^&@{Kolg9>rBluSwsea6i_&TH|EP3o|3507
z3jd4JDK%5&fpluG&i`FHMZu^Jq|>`niN61^bXxS2bUI6tPThZ7I(=2B4m{hXHuh%o
z;zUb0gUBf!(PIq{(%uw{=T~;mqW%f#wBcvcsqi=H^!0yTI?W_Wr^5e}(&-^?-)Kpi
z^T-3~wE93g4f-yf(*7WwR{foHYFZ2g@FcQT(TGzL>|=hAP8WZaPS?Ikr+p;pwE8FM
zw2~y9R{frIs{Mm>s=)mhrBi0{Z_;V$-$|z$)3o2E)8t=Dr&Yg{PW!(}r(Flq=}K6<
zlcXyC7t$%2t{q7_egDVO>D=#0r|<*m^sK-)>9qd`=@i7>xAGUIQ|x!?H0KYb(`Wyx
zbc+2w>9qSmI-LMPNz$p_Uy)9Oel4B${ve$`{kKS`XZ}z+9j2M(_&ezoB>vZ=)1rS|
zIvx34>Ga)iNvBo+v~=2kAe}n>LONakK{`eJLORtskWSD2B%PN2Af2xKTclIucj*+M
zD^HJ=gMO1vqkcm=Rr<MfO8#9s&G@BsivLkM&HYX3R0r`7NvATukWO>{b?G$p@1@h+
z-<D1Ze<z(f{fDJfZIX1l{hyXj9eydDwotWc;(k*)?fY}-^u~WsIu)E|Kl^j(wBj#F
zr^&x5omMeo|5@pjlO&z8i~L+VMf^-Uz4R;T6z~_M)3twEIyLx*rBkPWQaa84tJ0~{
z-$|zw|BQ6H90pkX>(XiEzezf+_%rF$>#s<sdgfg}Nv9mpe?U3~i2spviV*l+>9p%#
zkWL-{-O_2#?@Onv|9<I|Li`V;Q<Z;3I=%H5rBkPWPC8Zp1L+jN{TtG$n#f;}P60nk
zrvQOJkxm=_8R-=K@0LyhKa)-YB<WNK`kT_J!M`k>I{mhEN+<qLN~g?%|I4J)DZ{@c
zoq`4bpO8+;1pgOFr*pTWAXn-kMO_e|3Es1b@dxUu+FWzfe7&^0xE{0KEY;OqoO~3x
z2u6XXqz@i|Y|TM}6QcuR6kHYaS@jUlT=$z5?tS}<6WOk@!tQNHE+lV|cP3B;*GKk7
zPz85I1_3Sv`(5ZMc7Gi~MZ8)c=^sTk-XEDc2YF3#p$QP_#^^CU0ePQJ<p~RSG6z{_
zMSt*x+{7%od3sn@EDfc5Jl|is<MJu99%37Xw<CNES|&Hi1=}u1dW4dn#DGmEAeOci
zrcrp035YELd_3{fPSa<PWyn?Yi$*Z=ToP@{5$QKTqEp>MNGscO5b!b2%u;eo^T?Mk
zAU@`h$tK7ZPsk(R<)W@g26hk1TaYWcivgkGW>KF4%^_FjApVKV0a1~Gw#)3-yfT-U
z8Hg9i>OT5UL>{`h!W+2~%yH2tigeE908hvaeLgS6MX}CvD;tnt19Ih1ck4NbttaSY
zD7nTmY4;L{9v~;Gc0m+HL2N`&h~E-2luGf~ni*!zUK?j$O0K*W9WX#{x&?Ohgq-A{
z=n;-^Fo$Svt_5&Fj5zRinGyb75EAgJrM&*7>7pYhCZLquhyXtA8R-Bcx6H*m)JM8S
zfzb!3tB)xx{GAPigrEXP@y_)TM~N4%)>Bvxfc0SEf%TCNp+1%zk(OFttV?`sBB_p*
zfK3x4`h>%+bHOL0K8fA(J+GfG{tTjw!P^tSXzexQ<_OtMa^<-Tj)V<+&(G?ck<NZ=
zkSn;$pDC2PAgasc-o$7RZM<1Mg%5|P5r9-~@acMrpwUedxT=*4GOZ`S!nkDy3pZFM
zCmLzvwFYp=&~Op`80RgJV?FtWQLwTBIf*TGD<xO;#F;IJ2b4zIM}a>sQD|iPsS?1p
z=KkrC(f$BP@`o=DTcDG++s-im6n+2fI*+TR;Z`E#dVU^?q2#t0yjQ7j>9rl3246)2
z*bx@toC%RM@JeQ1dlBrZ>KEV_8SN9fR-wNc2mpCbK)mj|MMj2u3`F`(Ts*l2CJ))I
zXTNM26-hk`B0;XML_7(HwL^Sve0!0Ex|(OK2hUOH8F<iSM7!nU(@Vgow*pVQe(wI@
z5yAm69l-lXK@6{4G~ys}xqF!}gF-wb%}T?SB7H40FM1Ndo{0f(n!oC=kQ33N7lH@C
zMy{*%B{)0V2>GrxaY$gL*=C&n=jzBSSGP#0Ys3_Zxs8f+#^4LtFY9fAjt@jGH197q
z2Q4*)BkRN65+mF~!<`MtPcD<UnZ*PplAFvyUYz}GHy7!k4IaK9Zk8C-Ly}I%HBY7-
z?qin>85M0<`yj(77O_8eF1hF#d%oB9`Ky=aJRNkd+&WKHSV&`o^2~nd?>@gO)R!rL
zcBt&!ns9%P>Xp^S`8AP&TvQ~p)cJMMp+ch!`3no{Vk4!B(P@L1pT28EddwxRez<!_
zM)hmDk9X;{B-M~<#;awjOYW~9kW|%4YW<Rj&ZFmbA1=@*UBBzUxpB0Vc>BczKXC`c
zVH&sN;wPKVk1GVw4OZBv1|<!l<Cw*QzedO{D3z}|JFZc%sb|W5QNQ|Nj3EDso=xC1
zZr_{x<W3C=eMd$<EbbhSQHc0)qYF!WDnCi58;h^&tZsey`e@T{dMf;wKA-x|`a*N(
z$KoTrx3#`_#z^AGdvDqIrt=RK5L2#h&6mXTS-4If7qmlLPzc2(wo(dZqUGr=HoX=4
zpoVBt{t~BNUZl*px0NxcMSY&Ja)m3FT<8G|NaK3TJb5Z672^j^a3-L7t_JK`a7PR0
zm%?KO@{`)Jx1QS42-A6O3Z_~ZsR*SVweuHBKYo6GNCOc-+!o4oIFL?HpU1L@Ip1k0
z&Jd(~KzrS*M@8g%lDogiP5*Dw>CU!D?*4l#il3xY*F5hDG_63AUQ8DhXF!rpv(Agp
zAJy?$gOuj&PZpH^B%PL0k^f9Ob-TPdXC<Unzq2Dz(L${zS=sS_(y7W!ntia!Y?fP-
z%7+_)`zmvJv6`y$Mc0E>7jEBeQvG=E(Z1?pWv`~%rw4C>)s`AQHmQAnyt}Wq+(M(J
zzS6-RqQ2TK(X77qRE?;<K4`3^@#VRFh{nb%w`Psa@j#-+)?}=f=Jw3>5Y3(WyUm)r
zpB@o4_f~qfw7!0MLk!W{-~QOFMf|!;Jg=-cn1AH!{ZPKO1btB~xokt81U)jBOh8o5
zF?5pB0@iW3#}h1E--3+O1|{rIFzBHtDQl8o)SR;k<a~LwqopujkCntDgEN#Ni4-)I
z+630sL=0}3S!|4y2(pc%H$ec|UNSS#Q4biW&hfKCHrfP2$&O$!(TvT7RN?5!7)d8%
z*0wnr+leUVC`2pUBx#HX@jk9@0F+RRVDStUfJ)^R@Ve#GdoC{Ux7$9^m=k@1RF&X^
z;dMDPWobjuC=*HkCrlJrD)D}tFpXra)(BQ$b^uSWZ!3sM4lS^sD23wHi>jtpBHb|9
z_)}C?tVHow@%*hQ{NcfNrvCSdiu0@K-u2X+z1ndB14xEa_1VfXWQ+$Uk2Wm_Lh~4n
z_LOZA=P2t&c!KF8T?epDfTv1dy%=n1rxivyC?v<c=*;rT*!Bz(bearfJQJ#OQeX1R
zuXT$6CS5s&s6`YWzo!tHpP~#%Bu^L%rOKA|f+Nm%L7NI=O@gCYZ}LzGHH{PrWXk8C
z$}SbgmOe{b=)QG&2QR|DkoX2Y70s7b$l3fp!nsTEkimMS>G%W#LU)pjJRYcpQjPLH
zHNqPgC5TW`Wuw^{2}5=an%_VV-F6X+1%3&qgHFL!>yZpew(r%Mvyc=$f_&FUawYe$
zL}S@pu>LgVd{E4mVMx#vCC$+VyEg&&x+&3e>#rZv#J7ZmPv}H>h&p5v0Igakm*N$e
z@<pzhXT`x+G;KW@64WnQJbZmLr>L;ZS%%w^ko>|Z>}xXL6YNX*taiHm^<;@NC?g)u
zVQAvWyjsSJwXmyixzA%av5OzCjV;yIJV_fm*IYw;y3E(af&(pO;DzStU=!xPaW~f!
z4KYj4gJ!?Kr=zrM|Ll??^z}^n6=lD%FPA>B6#B^oiOJpcA|OpXIP??`R~Br_hY2$|
zqo9ZK$v-K*fAsjIQ+8;t1sO|b{)Dp(zMzm?gMebooLGRuD``Cwfq4icpzziFySc<T
zM62-4p~If-;3vh7`l$mj-a@%?I@RTNC10DE=ja%-#`Gu3`zuwKP85r70W(f52qmVN
zl(l-)bsu@Vr2TxMNYL7{+a^6-IDzts#O3YdOS$G5ZIZKcDGhxtN~g5~W|#&C&`+mw
zu3dLdcFC+4=$FY_%UUZ-g+^TF&@YuU+42IbJ^w;kT{CPlU`~;tm`?RIKHBl*D!Yai
zmuRB(Idl;hi{-$G=JXt-<Xrw-dLJ{IsYuKOKAx<lUO!acPo<SfQr_nTs8od_*lbR4
zTDoHCEutVC*_rqy3VW$?A5i#uUbLt=iY9iWOOlv4Vqfu|At4)L|CNkF3JoVxXAeN+
z&{PqDp)FC_U7fH@K!onlVd}TRU+!{e(P@q5LwWGJ%sbaDl+maGt^^?4`N@kRdt@{f
z01&sE+?<}~qdJ2TyqNxl7v<I!Nd3|dgg9kv{Q1l{HjOYff)^O=G{U}I?j0k>G#F^m
z7NMT)qbH{5DLdgiFe|0Qh%ARJ%jZq<VXdidA<kdfJN~BeL7m+3Pp^=Ob~+PS2d59#
zcpz@?ecBTsOESi!Yyrt~YExfNLSZdizqQPH`JwQX13GfOQAjX<;OSQ^g_29klm+Hd
zLF!wfv{|lCqloi@jnX=IKfdaUEsI2Ym3|g@>9yF#TT}a>f>t#bsiaTL1xsHo@0Kr|
ziu?MMu`uS8*NJ4o{HD2N9^<!*UfPx{by2MoR3WqOz?b|L2uIGL<iV3F!4qYDGw{z|
z*7)5qXjNA}pSZvoZnnp?lv+Rm@dD58{6YQ|MmS4t*EI#Mk^ZXt-h5Xqv(mvF!jqc@
z+k@|t*HYdI`R!}&P0J9shnx2|nzi=Vpe@0RAm~<Nq<T%8Y9>y_52uU)DQbh{0Xi}O
zkh~yF34<eJ#;Dcc)VJPgW+v}<ztil(slZ^Ms#Z}?lmKNIv<%DPi9IAqM#GGysmeWM
zOUCYr<%s$_G&PJtIE-qCjJ}+Vx;U4*mY7S!Oh!92K}X%nknnRgwT+^RU9$$K3?pf6
z7=auZyCfOQr53J5jDTktt5WVE$4T<3HcbSCIEmA!(IFGZ$V9=Ygj=a%u$<ClTsug(
zb*rd3zfu{F&4ZtzyN!JaNVS9Iuq9)OA>%9KmskhNpU6}1o4o5i0YSC#=}igRObJ~A
zN&rAgH8=`+_#Of-TY(bF$>qG%A_mWgYZ|j_PKn0x!=$ksTS%e8eC3LKi7*DuOpts9
zN??MFoe@joPes>(hcnyY5xtr<Af<Jb%oG{Su0@D>`Y>O?+B!}J&?ZXRDpQVC+z3<d
z(s?|AQ_dxx5h!b+rVtPTkV+0$p}3~L0Th{Np{^2;&~8($ffLqs)U-hg<t@yiXM_fT
zN^xhj`j4o=+C;ZnsHc!<N1O(_Ps=7uTbhi|6DVJ!qg&Olx{eY;2(k+TB}|+;CqPQF
z0<dzV(0Z6kq0`*Jd(jCp+1WxB*!!+b0b?MXFAk_^E@);%uL;l*NX>(`3u-+y(eeXH
zY++$aC>g>TE2Vx-Z5<&KNBBC>XdzBryNK2XsAxTNj5<NRB1~t8OscHy<|3S9m0tvq
z$GAGdP?g6z1XN@duyQn38wj&0ZxPLzvEMLNt7sLx6sA08sAdk5>Vw0Wv4?D@xG0Fi
zQuPi%6bLi~lv;Lx`xS6{6hl2xG8o)3$5>@gAYDS(Nu}BG36RqztdmQ$hPIBLrhsOx
zi(0*qxp$s(jG!kq@aU;nmAF>g1e8PmfaGFJx_Ox5SiFj2E3;zjkyBJQ=L-*+6uD`3
zqW0h0yeN8*2@;V+!cANlblYet$zV=YHgv#8-E>N%K;r?R7m7-AJq#v^b(D7YtpUke
zhf!AvS!fz-t)uARIt)(%XHHSo4#uk+z!hz&GzWk%C7?X|tZx^{Q5p-?7JcA{WAZ%<
z?rx(&v@2<&ME%;8wNa|tRE0rc$;E-I#eIQ|5HrbA&BD{izmz7{wu?#<$)v#9n`9kZ
z<l!oUt<2V8fv?dNKyr0fT`g^#4eG;9$x@R>VKV^kkTohqsY5gMwn>gyTB+E?GLYG6
zT5M705FV!kBh#cLOASJ)uHa}p*u<<yyS)ud7xDg&!9w-crtO_jG})aNJd~|i+L|$w
zj+}#0$4j_1IN-KPVhc?s!Hg6H)96AHQ}sz=>N;Md?1SjKPI7=z3Q8BzM=)({r32_{
z)x6iNK$-RdE!^8^Gqr{L!1rtMTs25v_ZG26v}j)_W#YoSARLuCGQPEq1%Xy`$7(GC
zQs;ndXw-q23gBWY>eHynKEis(c&;tEza6T0$9NH@V@kYZ-Y9N{!5x|tH|xTc?1MAK
zfj+AE+p7}Am&l?P@O&pqtlPzpgq}0Youhq$r(|6`QiH7MLATd}ub+ZcJ!z*y+?|+c
zWAk&?vc_s9N~XOBanwxJ=bJPHv>(>)IXrhxT@EE^dq>OLz$-ID4UIYwQ+dQ&S3x?<
zi{<S&VObPH1^uWM?DzuBX>w-}eorTkrQ3p1EUryt`N?-Q^;l_Jo@)0C-+Q1LoMhsO
zp<2AMEjH!_2~BNfuW8{~a5E;MsqRQ_R|jErGR~22Xlf$z08OpIR@!~!UB3{2fTp4j
zEtAkxAg8U)p%GD25}I0%c~eUS>tQ0aFer6I`+=G|!Yp7OrB>e}Rj-paAEDc><DE2I
zK;9u&L&n^7M+=WS<kZTu1QJ}9x-E|4HbEJWNOSg;z#BiY`MH}Y0-2&(Ocr$zif*c|
zlM<9|g6c>S1X?tajI*y*vj&OqyU$h(g29k)Rlyy#=*{5!>y|Q_>$u6)F#SRhr#iAC
z;`3HAw*56)c)4}egX}AH8=E^;76H~YX=Urvt}51<vcu_nOHL+Y87Yy90H8XcRj_?7
zb%0D#_GHLp#`TIt+&G_rAX2c;PB543ocrLdQ*Co^$GCkuoKr8*JeAc7B@<%=vDCjB
zY67#nOPi?Q(|J!^rr(s+%0)iPN0#U!#rLo>k|4<B=;1LP3TNEhkxKe)onuls?#wac
zGGv6~B1bbCQA6NeZtWPlr&FjyQ$w;-wN?9CY5Q7vNA9Rc5$NzJnnE2!Ul^qyn6r;S
z3nOFRYU9l$u;Iff7jcy8Wc&hTkWuhqPckI}S{aR0KGAlxhE@3_NR04ZOx3}Tbg<2%
zI1}%6@uu;GVvBVzaz6UbrG}M7w9+l3zHzBx2VCmFIYmIV{>Z9S@4|O3_2v**s;tF?
z2gDo|$_OKIsXE-H08YVjt<o0yMwIe2j_(SPnZ%{4BM-P#$*CPxA{Y_7#%o@E_)N7H
zph8Bioeu56o3ciisi0~#FIm_A$wq+_FIn;3OFf|=O^M9;?xp(WgQ5LFn!3u?oEFQV
z+}kF-uiwt!q+;<l)FHI8U8vN_WH;^#Gk!d3#GSn|Zgs$=x{{H7tuW3k)yK~mGghKT
z)=k@%%eHZR-gc-1E)~RP{RH~5j2p9Z<nZAZ5|<jv4iA-kG89G*%sr+Y#zCtHKXX^B
zY^7<ZZJRV+Q`ok2=Zn&NFU2h#Vb?r?I(&2b0{<?KD)hXntBhdIg6VpjeiL3TS2nW&
z#8UPoUyfbObG;=1&rKU9jS1rp1#!z^RSk%5jJ<P@T~V@)eZZJ=rxl1igb!2LZ4=83
zh07Mps#j~_Yqdld>9?xxzXrFpws+jQ_#hZ0{a)?{s+Bi!O|I)fCH*DQ<!QCuS}j1G
z&ih&&07~;Bjv9fVrdIa4=zBKM*R~liC{b~E;(qs1xol>r82??aE3H+06<R0O7v^--
zqaf8@ibMDst=x7*6r;nTFQal~B6%OBU|c3=Gj#SgNp7$-kDs0By+=EsvuEqngM5tv
zK3HhIG@-LVu2Ku|<;e5&50@&fWk8VyDN=)2n?SHsA1tN-Ata5IsmC+6i>kQsbC)Qr
zEa7-SEfq_vacbz3fd^LVZD1{R4G~vj)1qVo#DK!p%z-R0E<7ykx>FlWkc<QRKtB{~
zXh4C88YnwgYn<a3a~Hu<>u0QZSBnQ%*00TtCnd9g%sPgp^z?KK#Ag-w*FO28JmF!E
z*i<{PQUL^tE3n?foQQTY0FnmrQH|)ItGtOo)#)sw?vbq2MSzOcmAnxD%vhD!M_^_i
ze^RfS1<*QK+rsB`Uq^dgtPgNK5_qFrdCiy3>>c{aM*D?2eDQ0%I7<&x1KDF>cu<NP
zRa@)TT^&OxQk~Gvf;Dn}j|&0S(=qtHl0)jW<4(`l=!9+;-$!JfMPzn>9%!L8%)>QD
zp2N=}qUx9)={}f?Ad<Ggkn?=V=wXtV3bd*vd8s;wPtV7_lhP!RywuhMFEw#9L18QR
z^2G=J4uqYyME30@kp{DR9Ivz0{Zbv~kyD74up{y2sFzI7RNE2m4O-s*uZJEzZU!@w
zxKzd}Ex-F(jE!2_6<Q{(3eOsJ%7S_&6mEW0F>eHb-5hRxSmBA)Zej=!W(_z|a#>HL
zj*|5;7Xm!6+XhDk^c`@iZ6q$Wh(-0th?-UKjv#)Ag-}BLo0v)vBZ;X4=T!ZK0x#3a
zs!JY`yqmR)<_!dEmTqc%_+nPtW-^YpdDE_Lz}7oZcXe7>Aj@1TI)$k+N|Og$^O=}j
z_C;srv}RoxlGBs9_8Iu4{#F<Q{UM}DlhUG45FcTz6Qw*JvyJ<BH&Bam&|}ecU9aSD
zV<@E)@b#_^Uvs6_`vywU)>FN0^qJb9LB!*0^^`RLOm7=qUnn)9jgL}AU3*WEQO2Cr
zkJFV*cphu)5LSIONyq6@;S7$ujB@CbN=vufQfIqFW+=6GSlQco+8XV=cP+Fg#0nr@
zmPsmSJJ1;wp3k}Oi(X^*$kU2u5woc=U`mc*zq0qB8=Vvv#haKo!NM<>!WE+JGWL?`
zh$A<P)X+AK3UhRO9JdgV>*cf4!c4-xT?)~bGrF<6%VJlnq^ycBn7Pw`ow`rF#mIE@
zPR=U(9o^oreUHrgJk|?#58PhW`s}iKoM^Z_|Kfof69*qWZ0hYxn`3+(u4=-oJ?BQp
z?a@uIUp(67xa8EGB3Ab}<NYa@qHW39>0=qy%|TgTB+vAwUT}@R^SPg8+|0PH^Xo?5
zy#|>aN>UH;lkb~HRYQTSA049gz5H}XS&mzkpR5$?AQ%llrxy~eZ@xM#qo@DoS>R^T
znAC>At*h{+<w>C`eIj3Q(DvHk=joxSG&}#q+R|;~4Xu#ntU@ifJtmh}DST2?;st;|
zJp1BnSCDYXoc~OO_t1Q&?5R8Ef}*EtU%Jqo671DyL)Ty=`Aj*;^x>x&kxm@Mkn}t}
zbIce&Ig`;3U}{7YJYIdMJZQ{zh)zJvVU<g8a)>-mi_pcSDeqC5A8uY)=*B1EwtcCJ
z6R$lL4(L9S@>FR&h~<d9{(+Y|^!jY1xZf)Ww&=ZNQ3*j$rYTl`lc*j%!NY(u+G=ic
zCgP0w>lUzJ;#LHE{waSXhoFl#3M^ln*cU%Ewj2(XHQ*=xQay~$zwVareKt!#I0iyv
zRPK=9A<8&76ZLG0C;g>ke9_%oUh7#5(8Jg6mEQ8eUwv`UTfC6%jr)V~^f!wx=a6v0
z9k4mv!31zV)=K_1DqmdlAsKUs-?ka0p%7PD1sm}0)FD9>{{R>94(!d*{El+NDYla}
z^-pdH!a2{vgWc1jQndtQ@^v)?9UU7yH1;{(C+hNLy-zmP<eYibSeYWF-IW++rbWDt
z#-PZ~2^4E|6_vh?UQX+hjULi<ylz;?yd`HVxe-Z!I${u&QTlwPlh-IS3Js4I*#WVI
ztWO?IDgPRsKb`tillxQ6^HbM9)s9QEK_x2AxutV2ugo9H!rml<>Y@=sTum!kEqPl0
zwWGJZtpVq6<$mRSI9DL>NRQ?!Mx`~wFVjHsX295_dk*I7pk2NhDcUMgz>f9$V%^CQ
z-i?>ew{C2_j-L^1u3dh`Z!JG1)GJw5a|amRs3Sjl=Y|M#E0|b#*AE$foafzCT1kGk
zcvbKi!ZA^cW0;&qwr6g3UcP2a@S{M*oE@)JvO)NCg^cu@jh#=;P~zT~ckg^Rg~Rl<
zzh+_|kAO0OY`0bNk@R*61=k|BBSM%`C%|I1NSafg(l0T`oltT(5`BI4!WlH@ekl19
zjI7h5c^=yOB`T!GGh7CrM|;ws?NDnXuVfiN{e{dnz8xHA-!eag|5h8E*(*Y6B#-7A
zq76px6=CY+$edKKBXMLUMj~j6`JzFGXaG~J9QX`-b!MBC5mStVi2!HER)^#zxyVII
zxWdGijzEH3!kIDwuBW1CwW*bB9_|HP4fUN|`H5j06|F>y>N+}Nkrb3s$Ei!zyjyz<
zN1nC_pxI-hH1*YH-QRLz+#3uxlb`0fwHT%qw%mO=YAPk8&q+vS-q1ASQfhvUpzz`2
zy=GIEDTRtf!WOrUY#uVFXQw*LsBIgcv`J3wc`qb&-M{y&uXbjMNs;ieS4O5y^6A54
zPKPC^Ok6cDXN}Z2tK82rb@ZrC9!I+%&Z_kLgjL;mc*0pjZQ`0!)mlnZ&{^ro<K35K
z+cMvl6>7C{nqMj&zS%EWs>GsdcJ75$E`Y9Bv*XpXkg4IkP03k3n%7vIjdcobnu~#z
zYB!Zl7@Kt3e7AT*7$O%3kr)tT7~rS6v0%+Sw>3{)Obksx&^|cylw-lPM0UhwYrRDI
z>HLvE)sfu&RLD7PeOgBXNGG>|N}bV-WuTI(GRB7mp>fxS&dY}HeLknh*YjLsuW74q
ze!1(w>vnuR+otY(+TBy+ACGqj9ILr=w9MT{;>1i0{llBj%j2I*Fi^ia*6!kS_vBLv
zhwT8H=JG?l7c?Z!tSr2I$YoQJa<A;H49!ap_l>d}8fEs!By5I+m1=yR>Yjm0*u0`n
zuXU!AbQjxw^K8ndrZ(Q~TwpJ*E8XV7lM5GIqI<2X_t)>(-diwBQ60(W`%?1MwZn37
zaO9T9u@YroakHxr2eJ;NQz09nL5tJ7Z`qr-pMMVCesh{g+&_>`mqV#eU_elg7Al+N
zFwQXyM2n-9Nw^|##$L-+wyKr0m`%Zs-+>{7qn)2^CCc!GBg-w04lzAQ_+d#kf7=!w
zsq~dfM42P^JC07h=T1})%@cqhMk;w-^@4i`vH7o+>D7+luCezW%_)a<TBNV0GW1Px
zJ}PH=T)&z=jXo_N!r4cC<P!T7BaR-NMnHsK;=-Fa3B1dA>NJalJS1R5xZ#WrFV=1r
zsfWvYat>hGymcG<&gwvSnhg8NRqc>x_11F15|rn&a1~)L96*RrR7?JIp7;DXW%?P>
z)ufNTv$`1q6#UC_rB`!eizyri=P1#%QFrLPU5V4BCvB0mJ>1~qofD;UbF$^f81cee
zT!Y;<zF0{7O?g2^!!Ckn^=;l;C>icIR!1&zO@-p<gVG@PpNpxQMB~I13&5t!P8MoU
zXI<XsgG@;%iXPnu`t|^7URjF9nX9w+URw{($f6;Bi5E{Z1W|9#`aGgq>c(*&pL~_R
z)&8j$WNBkBpM(Jl2yPeo*yizau&V@>n|h^OM|7u2wy*}3(HWZLf%##Zk3YJ_Y1a&m
z(q5#v-f-c4z?;#LFHf(?`rUjlMo@e9q~b7xb^I{Bs{o}CqYouplS}q}0A!9b>`rgq
zd`bxKpbekO$q4LWrNcn3Gsgm*TeZ(uG=FU)8hVhY3|i2$rNZdm-fXysLw?atg?+HO
zsMl075H8Iz^`WSE+eXctzLoneV|@Q**)WR)lim8X*P-6ykIUEYx!jn~-%uShG;^-J
z&numZm{iXPm)d1ge5sUSqxZ56c%x%GxOss>>2hV*lj}n-uFq-nV7jet&}h+V7HwX~
z9{GT%vAo-LELg=?ipnlSpdU+#d;xj8b|-LWP4y;<MV0XJ&8^cNB^es_V}Jy&I2`j_
z0S7{qOkisr{^a9mvu-96WpMCniXZh?iUGo<&rJ_uU=*hR64};5{~KS^h0wn79_(I)
zAvd#3*ZDg%?(x99?ic8mH;$M?3m(*{ToBQdz~K?U=NmsNSn<>m_Ayr)EdF$la)3g|
z<m(25lwPUZ6XgEh<N=&|gi@ogg}Pq{a^~~R^XE$=?!5P4q=qa4x810B@AA0cBa|~X
zR}3`OEH~8;Gy^B+2IyYp576?KalVC7&9p*9!VcWjMFtJ9gU1W=4aPgg2W~2sVRwL`
zW0LBbIb(q=yGaEIrOirV!NgQHh#sJqnl>bm863E&WMO<vET3Ahdt(@g11#IJjO-Sy
z7r(iw1W#70%4W^^XYxr>7=D!r9NX%%L;C&Kc_vvdGcl@#4knw99Jr~-k%%OY*g=kK
zOq?keoEa<BxFpV7OkBi*Bu=aaN6{eHeI~BkOx$%z+}8#<A0=^qrs0XU;7+l4md!uI
zLzW#>%GM2LDVs=o%`{+lj$GA(UBd#>j^r)LZQFA1nx(zIQ3>5#gytE-=<dNlLtPZB
zJU9At1+fs0D*g}dGi=QKyhDXBOL&_k|5_zS(B~=nGN@wSm)H5wVsiO)hvS0NED0F;
z_e|4`^L%G5dEKa=HqqW8xv9Ci9P1V-f>M2#E{OzI39A7_TTDd#heR&Oi~1Om&`Tcg
z+~To>p5!Wym{n1)A+gA0hN2<S+n0LEsu;AYKz0^Qggn{=ZTeS0+I-A87)W1uny+Gl
z(tGmp1XdR1!bi+Thb#~9ot0<5Zz&${u&iX+Avh^QwB!L>y`#43VXQ7@O_8HYfkGAJ
zh@SGi3O%r4QK4a`#wyNs2}zmDl3LYr5|<SWs}+$}ic$*lS{8@IqZ6iLSrZ6KYUNT<
zlTuI}s5!HI;UuM!e(?m7(j}DkW`RA)O(ldf*{lZ3Q?Zk=$i_M_ti_kornK8(XGSa_
z`D-k<t$4~<4qKV1^<vc?53{sbsaIZZ?^#p#vCwEv*3j+KP|H>OOmb6U>Qo+@^Ovdn
zCpDU@RcD5uEUanz$Z2gVz%QDpk&S2$4zoN@N|_+JsaPs^1-Z8<WwCE=s?92w=r=c&
z7%|C}N`h0dKf$T`h5T+dHM+-!4&c<N3Mtu1$^lIA2tfiR%zR!j#HK~Gh{bTbf}^nt
zv}4u!`Wu`YV5yp6osy&2nrm%z+gmk@)tKMJxP;a4UQKe-dP{4nG1(ej@TIOJw5E4Q
zj4c*Tle|sc?wFdoANf3JBomFgmP?yYkW*Zj^2s}JQw{RaqY$<p0#ua$2RC((<fZ~F
zNNy_QQAN?`mLxZ|hrlk{vN)Cx9kOI`64yC!QyrLZlH62>6E}-!<wu}V70^>=zVe20
zDc-{5DLe@aV<`77*k$tdlw)b@3L$BwOCxO&hZ%_14juQ=K8`!op7UHZ{)_F^L$+B*
zTgx8U=8?*HnY@2;rjNCy@sNFrwSC4>+rWk6c_bqI!3ka3lm16hld;e_5}ewia(PW^
z{2QE_U3lQ84pdo4x$vYrSUT&lRp40_A2@uSbP%G@^Kh^pNAXJ62+Fxak4$kVkla*<
z699g$*97f^aA+n03M*zKVBiMW{TD+QUgjkezS!nr#2X&8)Kr6P91Qtc&-!dg_@}o7
zvAHs^p50A!eRa4sQOPyq1;h1pJAT^pX};$Ihc>r{+sbWR^U}`8`?fUNoKLgnsr5w)
z#kp4>ReE<<>F^WfSB^SDQ%3m|M-yOj#B{8M7?LgXjH7J2qu|CxXoT}uEUWwrDG%gT
zM<$#LfRas+C3HgNCIE`!H@K!tGd98Xgp6$+BZTv$bm&YOdf@)q;!tB1k6p`&uWpTs
z^KL~O-V$Oy$LgBx>XJ`gId`UR#d@^Gy$<Bbe%9xTZ{QWTkUDR<>LdP1zHW7XSa!Sc
zj4Oe){?|qsV)^|8ll)E|J6|*;DRP@nnpK(H2X1E#hZWOCwD7i;SnT>9rcm~La||wP
z15MWEEuW-h9F^Lip!6Ls+8`LKIv(YP+Z&Lv5wzXk%F;WC(8gs1lvIm+h%0R;xv6={
zxw+WkHEgqGm{>hXax3hvGEM-|LiC8iX>8%r6!9&|1cUl8vwB4@xsoTtgaNOx`_IGK
z6~dM4!!K@$J8Y@4#6^g0+4tJ;K4MRTPX^D2ag0P7q@rmmzQL)P1blL?MJF1*-g1>L
zBW4#FJI(H<*kUH&BfW~1esv{Tn2hlbhP&_s2gyy9UOB!*M!Vp^EMbxGN;qX`Jwjka
zLh2r2pfb5w8@jv2U^*<?QQHiD)kXa(ahEZPEQ`RAm3X5LD{wq%J2shjJL!>S3OJDv
zREz6yIChdF1*9?~-jK4JXo&PDpkIX<bDoHG$T=bIoe4AN#~t1|Y`BV5kWZ6dRHkZG
zj-O`I*uomXKy2sEULzjcX3=7y?&qIusu>iIX1Vc-A@6v$bG`53`RvLph6n!Hpt9^w
zR_S!da~iUmd$zB)yb6dX!KvEeo3RRc%-4srvLA2f>~7s4THPcsySZKOe$F2yV#tu7
zZ8h1d#GakU{W=fIl`rrx?_<7DFU&(<8ajq7P|hw;vnx1EMjN&M*n=(S@`}jCn490-
z)WwFvugitoy(Kmei^zA1&ZrihdtG#zi`9*~=!;wN@qiLzJChP-HFA}6h8ZPZT%||t
zN-uC-kImNpLUTLA`u1&QhzKR3aw2~emEX)&))tWW$uY2^-G}6+*0@Wp+KMI0N>e_d
zow6(ckX_yjpe2T}#HOKmHv-O2Oz~}Hdp(ON^nVy&dYL?ey}L210yJE~^r*?QUz2@T
zjaw}MYF{bDtsr)tpI;3sx0^`h;LY?|R-C^>bzP3(QI$_$w#II?n|O_n%scVhHQb21
zLZVVWBNxUdQ4aSnklfU$P)bK5DOkRgY`Xy*$pU-?UvdZ`5*$Ta8i?9TPg>|ICamq#
znJNHuQ%L1|V3rpy6&kzZo8~3OFnZK*wp3P0=dOG7LgSUs$m41nyx7KZ?#I*iO*D_1
zp6)hPDmAmO(eYq;derFc^6+_fRj;lScI_XJsu3V#kLeo2m~v`&sghVTEY5VYC*=CP
zEoM#+y+;%atAEpa@7nPOsVP3{WAL6_wv8Qy+*!W<jB^H9=$L~YX7bT<;l`Ojk;Bo6
z??PMsb6mMOyNGJCk$auEoCkqHi5+=e@q21nBVpX?ElFeDX+hmZIVoxlwVV3TxvDd#
zAxsIO^kYwsEMr+lrZ`>`tOVh#V?|0EWXv~1Y4=e~uQAM`j!(M*jC)8X9w&5+V24;f
zt<fbuOs&mjFwJ5W+>@tK4bW4N*5kjYAab=^LSyI)>#zbZ(kGWs<!aSe?h*c1!<(<d
zADsxXOAa}$4_&fzA1a3K5f}vX+p)#uta&VKa8?h3jy9SJPvG(-6V9I;T_Yc5cZ662
z7>P>&wYf6`BKfqkE$kd;JUX!!$|qQMo)7x)4C#-*Y33bkJ2}>QV=RUB`N~;7>6-gz
zAw2FWE>;nT#Pg)^uv1aoly_jPnd8tSEnrsu_dP|gzGB}(fv=EG+;B(Dn^!wH`5lY=
z7<<@h1oOEUAD*ezxZvA3rf_On`R26R+v$vrvColA352q9B}y%!8Kx8}Z&2X<DGoLu
z9@TP5Xo};GHhBLS2e4`8>*Ne)D}NK&<c!Yb*SrA{6z>*EOyzf+Ba}(;U69?ME;zMN
za&zIXX0uLHu*Y`$nMnEsSd0|~R~cqz6i9g>regTJCY*OBWh{M}vo$`5<S#zsdqoV<
zoSQx~7aI)E2RQCyOcDw#LI&o^AHBKvc9{XX!g6}0<<Q3qB_B_Z`_A%HCukQMQ*hT~
zcqgV{BrlZ>2#u*GKQ&8l=ScBH7e?6%V?^->-JBpl*%2L_$2rZG51{Lr;ImP>JfAyt
zd2fm)WF-W;g*&~a(X?`|#HI$;e&%enKe=-pr__^E+T!^y?oLYp`3$866lygKMDn2{
z{3=`g3I^ECTW>cb-|anvejSEZ$G)@OSk+j1xcUhay>02V(Zb+bY0w8Y&FL^m#Tx=z
zZxKk+DgFA4Fux@3Ksu$A%ST7@szyDEk}G%;&!hH}begRmEnoBt>D0<5CrY8@Nc7rV
zs6*k!5AAmPW0V>(inlF;of8r*sSk^5N*CnAP1*bJytsGbk?=iRg|e5GPQBS0-=))I
zZ`Y}n9Sa@2)^t^dq{`nu26qazxTR$ZH__!WX~rQcr*bfFRD)?%s@`{}O4!%Fa;SVO
zzXYZq?l?M}q?K(f5blFE)+`;bA#A5|WGWBWxV?GtdaG(_yfJWhpKfgB%^UM=xfNxP
z<5DN<YM$)A$s$pM0SUCs9IRrQ{-kDVlCnml-%11Sy4E$#$2(tABCox>-SPCW<>(WK
zp_sX@ubY#f9aQp-FBxo$3?M4DP>d%}dJ(G_Lg+O!ZT%Nb4IIMRPDSM*mXJ{?(!JhR
zu}3F(m^#k$ycK@RWU^N|U@^LvXQtjXr(ob+7+QHqb2g{z%r$$%Oov1iy`fW*<Au2b
zofY#{Lv<V7OXyg`^d}4g`aDcjmJ4Nb@6`+G(2+JDJ(0bsE;q%P67|ZvU9NjnMGIzw
zz3S3<C%U6ws;8bfZf(5{yTpKWu$zf=@Z*aq$-XGv<64lg!B%oD+dynUT_1essDLv(
zAX9Cd7jo#pOQj=usW{yzqsg{&cU{GIT+6EZjofULHW0UwUp&L<_{#Z|`k~%-<o4Eu
ztWzKF_pDO7-RnP)PI<=9XA8HJq|1KTk%ToWc<S=>v*Zxh<ZHsWM^+(n`;t0TLLjEg
zbPpGHhUo;dX(cSQdY5RJ#PkhX#G8TFM$2j_pmEFBN79wD*)V%~v1%5WOHY}$xAdtI
z55@`%S)=AIfwh(-FSl#+hVZN+ENFFlazV|FDVi7z)#azPhjKjo1+&P=z%Jf32G5K<
z@nm2Y&w?a!M%&!W!{Sn9$C;P*yl5mVFkw;JY#$v{y8|fO!B_TDB@=~D@3L%&IM1Q1
zeVHE!L_FP_xom3949&YU79bE&Jsf<o5DWmU4<vDh-6ABB5`LEz^sb9a6W%4qg1<O+
zeszFJdWNQ7>!_+<G%Mdn6Zw^1<<%Jk2nNixK8$AZs_cI|=`(!T`ViEjZt-E~^Ue1m
z5KX_y7=fmwDS&MJAS6tGDR7PZX!*;TEGv?g`uwRvKU41(sC=&Q^2LXnCFx{Kh@GkS
zn7l_<(&&Uj)X9yPmeil`@9vK&(4JkI<Gv>Ra>pvx8Rp0n)ithT&O$D7?;_S_{>GX&
zg?g)3J8hfs*lMO1lLyB&e}*8~I<tVrT`Y*kq%@q3FnP@$O-4h-3f-!xU}U!h(%5?9
zK5~?DPLr%u@9taLqDX4qRmM<POl#>#3xjN87>5bTO0CI-2+P9Vn7SFZJ)=4b5EVGe
z*xY4+wtBp~CoTItv5lf(uBFc;(#+kxfcqU~CnDPezEPpiRsf_>H8=yqz#=r8GCDP=
z@xGu2J!X$Q8mY!E_6lt<q6y3tTt7)^-B=(bP^GJA)EmoEhFM{Q04Ps@L1Fee!q+!j
z+Pb{b%2ErC*jhvz3kyLj27p|IqFDKnDb@YlBB_?=bc(c29Cnx+(j!=v<6UrDmaNW@
zoA6#&F2R(NAT|+Y6jIjC)4u@|v0`%Ew7V!7yIK*Zc;(Wy{&fNBhG7)*Li&-AvTBc&
zsIVr-c6@((0blnCVL^eRc!>+2b3PQhAkO)i#ycs*ac<8}h$2E~c-JpZJHe#-_06M8
zLA1_(FSUsn3ks}zO+n%wh^DTDM$)r}ySt2B!Rr#uAzhJz48=M0nY4j8$&oNN^Bf=y
z004^ua+IGR*F6_AVk3SyLG=|2$5@25<m;N!_#QDm-<@tc6O30(Z;QE#!BIS~54J2y
z9GxEXLTL$4Um)kkR>Ji{`S=&O?I8hxQsUE&2UB;wOkdiL9uuuQ0_MpSf2vXAiEp9w
z#d>~{xIQbM@K9;JoQw4YsJ-P_C)eWrN1zB8TW_8h=}Afrytl}8_Z1vzQ^jF1M$ukL
z)<Gv#eLI}(tk38*wX7G&cJo1m?<3`r7d8fj>jbKVz_BOJEWj=eY0i@p^d1JA@ETr^
zdmc2zvBlOImfK=wz7XLP9~~+EiX??rSMA=K$ABJk-7fcY4nO(oUIEj)tIwc2)~A>4
z-amdoodejX!2mF!<tNCOLquToAixBO`y3%;+xYHQj|UZ5?|pA4Jq4Q25{-;Y6_GLm
zlaCLhu5vZStLa^@W3G#7gL+iPzF~Ge)N2bD1JYgqD@;=?ZFZ<Htz2|$RF0c{sYuzL
z;b^y(%`Xw&q3KbTavJE=;FVuyRBRgTaW4Cl^|pjsa8*WgS-R+(K5nl!@@WIw-Miz7
zvS9gYwnwzHh~5Ta$J*lp_{CZE@fmFj^}bj~@Axe`7PjW63ObqUAJESl`Xg?7X<y4l
zcM#p@8CG2B6Y4+228Nao0+BWOTA!TtMrk>7^h~s-$ck#Y*q8=b4WzQI7O;L?BQ;Bv
zr4GUoyd42DJEb#e`P$cmLMMZI4aje*XneGj*lnu|=9EBGer%%!JzWr`<HdOK>W#IX
zIs3+^DuZrmQz;O$m1*kunm}`8v_xso)u%>{?t^D9_sDerMNzbQxK*RQ#9L>B=E1D#
zi_ZclyzbQzULc)Y31=vF^{B_GhdLwCL2w3<uJ)sno?&i5`4k`6HPb^gk0(07cK8g`
z5(bwe8Ixf|X@g$gs#R=bV-x4Q`lp9qc?C~m+XKkJf<u)Ix?>pF8*>os?NvH7>i`it
zvD_g~frahO--j-^9`gnw2tb<~%!8czkII6Z^(-BEEU$F#*J=(I%J80AmA~-xBK?&Q
zGeM`z!t}zYnPb=zk*86xE~SK~kAbq2Y;~AcjUXm+<&iL|g;HInYkt?<Qu(=o{*J6A
z9NXPAf~$riyjlaxk<PhDm1`w9Re7`RUAm@ao;8jx!h@G}omV$lk4}3$9;CULX(e}6
zM0Mg!e0k4kEBl?5PN);|{%fjsy4ysM0PnWYEX#W?ldfL*3K*k?yUc8_+12Iv(=^rC
zr(G6l8lRrss&0^pWkHK7IG!2|Gugt?uDaqF^D94^)%QYE2k<hb99}Kfj6-LMLDRV=
zGP<Grx%3vYGKB<6pj^N@+ysma-PzR1o<LQyU!3d2-YyFM_yJP1LU(__b0U{~)6>>8
z<8TwkZ_?3hKam&w(u^`QAW}%E-JD{FaMIhtY;)u)&>>9J55*~JJ3ETipOb{vOFm4$
zRMbLgLI6t`z@0JL!iUH~GZYe*p;Z%>gC*f|9U^VH3@PoDaRYFhsBpVE1~ZQE5&_0{
z1y}>o$b=&N>jw;-6imyQL)qr8gM|#QRzfN|FPRsyy7_A14H!c*PwOEf<GVzC>Xk`E
zsvYuxNM+!U29t=?Tzf<QfWcIoJkgjuO1rqZs1iz%|Bt=<ifXEB`$oUg1B4_r3Dr=P
zA|)UQ(hOC)0a1|}nsf{Zii!|=$52E>z<`J-Rf+;4(mO~K0TBbDq9TT(A|lzj@B4Ya
z@7a65WAE{O2m4@;_k13#vDTbptZU5c`u`r^_hb{PjuI@)%@u5=J+`o%KZz)JRxPEu
zJk?Slv3w=f2bvr*iM~XHf1;uHsF+JkZch@da^sTg*gr-p$0-6An1|D`7AC!dsad&1
z1=4>L(t5(v>c`-LMC>glv}Xk~X`lWI$Frw$(rV>g*>>vBB#926!=7v+l?pW-OP8cT
zE++~oQV^|p@PH54k#hbw19gys>cgYJi|Jq<G(4HM-F|%!N&AaPCH#v>HN1r2nx*kB
za@{t$e(G-`bz3$&>f~QU>bZld{Bq#!n;Zj8FmNXA5<vSOL~6EaW-XgYWoGZuXnVA5
z@FNUf4tomEiu%h)#pi%+a`=i7wbNOS`~EUg4=3kpv5izLRP!<dVv`A$fEH8J^f@@d
z{}`!b@PmYqH~l#m&fcsnL7qQ~J#`dI1g>kaiB!r>hX*%#c`)|1hdj=DdHsU>KDdSW
zn@BykkMjfr!_9khZ|pB3)s#)7GV;RNL@Faql9+FKIsZX({vI~}uGx*#Y$CPxUqosZ
z$1P0>E|%x5!)ziIfZhI7Fjn#xk$UbRh8?fUCQ|SH2a$R`x$r&#GR+bG7m-TMcs*PA
zb~b%Fx$y3-qDyiZZ8G@HC(L5<%_~WKK?LQ2qaLecEYKll0ZiEKVUyPeHF0AKkI_$s
zjbpgYv7Dc={15rxQDF&4`o7b-Bfj+ggR+G}aFHvLrL+Um58a0ebQO*g#r%|EYKf>p
zyo!UnTYG_0%3UMgLMijRm<et&K1uhXGk6Yk>(<@lei9iZo>hD)W+KYU!Bw8^qf$#x
zwTS!Af(V@Vc8f6%V~LI}j?p9@6Tf?2J0gX0h2+opJLP5V2g=0g5O3eI3w}a9*h1gA
zvR${-%Po%bT67ZreyDtTpbd&d;yF8be^=sqGN;2Tvn-13qv9WAn?JbW_uyvAgIoWv
z(rNiWKq{qNXR!R+qpT-$<!+?h#LpGaIV(Hl|1F)SR1Q3>{FijfSv4+S^_O(&SM@5T
zYSw{A0SmW$Sh35K`*yCpqP;?&T>UYn`qRVeFITDsIw0RTYu4p!HU}XB9o0WmYJLq?
zubJ2Uk+1pjum*If_S0a^o?k7XUCWVL1M{!lOR44Ldh~S;#QnM!Bl1X4<ZmC93gOqT
zQ6cdhpgt0;c*OQjH#qCW@O2y_a5pT{LB4ud<<<?M`fsOs*gopfihAv#dY#vtVfH+_
zhZ+nk;`Fr}j#t!w_HHmuZ8&<V-tub0u~d3e2l_}03#`f2sCB3@@B!|WHr@Vq<4SF#
z`cs8Iv&Y|lWStRttgZdH>`{aN?S_*>8e+f`or(rA;BnZY#+1y*mqi{2RtULNJU+|S
z<m}%VDbo1k%HyG>I}SE*VYY5ck4U|Wi%D%Vb!^JF;Rz-^IqFywaus*p@yX{`PYQ20
zN4PapuC^rnZX`WzvAfz-UD1^D`w)(^S&LmVZQawG;5!zb)F2}Gz@n+%LL_pqnew}t
z@Dz9Zb@K|dIa=hY|L>No60LPZxle4K8E8MNech6L^;!GxLkEQgx+o<+s)CH$xLNIn
z*SB%KPah9BwhpJZ3KX|~5_vW~)HwF~S)N7f<Ki}l*R1Ca>(7r4wXOIcJp7P9hl<}L
zpyCq5S^%zP4e^3S%qEGe4!9aU?F|<dfS}snT8OT3H8LGVBnuj)orJ}QAA?$P@(Pa?
zoJ3fT?LVGA-(T=tbXe|~aH+u}oIybE(tKl=(61=mDev*U(W0*y=sN^bZbFyiV#nc1
z+(DfNS*Om8p@!21oj)s{5#~FcT08MNVzY;O)O4Dlt34;u4xY&8Pb0w<H~gUb9G5{7
z>oyvV4ESs?rn0QpL88kyqDPF<YEaP=t<!(X@_9E;4|TZ3JD_V<qSb4@-~Q0RwP6Wo
zE%as*e@}u<X)TKDGk#A4+X)}cE#UJU?oY5}^(Tvp+YQ&pE3}h$JKfWsIXMlu?lwLN
z=pCUCm9>`n5IGKO@Vrhyy0UdtDr{jws+P&Y#!;Cefvw9!<~#!r0z|4&Lr)e5i-rb0
z0*0p3hGJh2RbDOE*cEqi9Gx7N`$^(rJ$h<ZjAji8z9aTIfw(#=N44CV-|6(&7mP@x
z^~|T0zq1)>SRH9bjW!mHsRZ1G7ryW=K?kUlCjXLA#|6{JanA57q!$=P@s-xGSHrC=
z1+jyc6MI*ib}e!EuVZN2MvVa}<*(ya1}Hu;0j@#JJtr(O6RZ1mQt!`xFH)fJJ+yJU
zwehtphjn>Y0!Brb?k74t-(75zsbY<NLP=Qa9$1)@a;Tch%^|{hI2-`^T@%CxisvVR
z-BTvKc6a)+3YtCKo}!LUV-F&;SycKoxpu!ZH;=0BffHgc(Hm25cJcPtBqK*&CBG4H
z4aCOu38-lgdwj*T*iA8PEq{{Wq525@WpqrqddizuJ|!j5fAG|2FWrDi74EqTZl38F
z#knklC@cr3+OZ@W)Y?}0XWiwjDxnNrEYhjt<_E5|7#Q6KduL?s_mMfX&X)sU=g&<L
zFn77S0XUmQl~BKxL%g<5S5-JH+ZHIy(4A$osK}UCFkag>nms9g{>9gYZ`^NnB-QOa
z)MM%LHUxAj^8iQbk$?*<sJ_I)GsRi2c4R4&zop#*r)4UpuJBdtEn7O}u@;ela;1O4
zkn!9K;8;tlU&W->!!sgF-1DEu)WK@lT_WQ5M+{nNQE_cac~pQuBe1^%`e#h>7Xf)3
zi}`g@Z-<wWDzS7e;VnZ@>6o3up|)4K1(Qw^9dGX?3I2ErSzkUL{ldH$V_HQ#%7ZZ#
zdtVkksWl?-lR9<E1-na~%16DM)L;C`fZNcZ5+&%h98OnVL-ht>pLCc!dKoe*gDf%d
zA;Eu=Mc4Ha+(pZNqSLKa{J91ny2rWGs|BBs+OXqF8mF;0*06a>JOX{k&pi`(b$|K}
z9phIut-r{wVpwplR@4<L%=PZuC`$Zd#|$)cB{`bIi$2}WH1+$c^pk8Gg_V6D^LdD%
z9>su5-1wjqf-x{j+O6%9D1ypvhx{U(v`duRrN)#}R{VC~nS*ArC5RX!kt{u)9p-BC
z`rG92HQTl|RL8ZScLj$4GaqiWi5SL`JT6+zPM+o7W!@{6`EqtNB&Av~56`|KnEK3+
z{)<IzXa0*tCE35Dt`1bY{bEdNcT5IRQs<Rso2_K#mlWA7Y6Om>ee~j|I;H%!jm;45
z91_E2+@H;&-U{fBJH4sFW>Fb`v8bVcv#2VzT%~Lll}UABv#1RC*}qs+77`+Wxx+-{
zuwB$KrKL5D)!#0vQy<fL4_j`c{;WF@7PPiTf!-?k?x>7?MN#~VMWuhw!JE4L3@Z%A
zxF5gx%j2RQ;$m=3XxKk2DkJEq#5dKOYem5&Y!)@(`Ul{JV0EFQbqH6T)$3C7>!v{E
z(21|XZcNA{)F1+G&5O}gHHN#b<1oL!!xrAWQPn-BB5*<FI0@cHh5dPVMdGmP;^yz&
zT9gf2My11C^#7JoNr7ad;AT5pM%^8$K~M9+yoiX{OpD|@D#ytOt^jZ!w7@If`Lk>p
z6@NMB()V}xggshl)w#W?$)jFu8MSts&xS3dvQXFfF+gysWtHlamhqzoiKB$5SJ=#r
zkC=UYCT5auzT1SQXa4BB!|xJ5yiipe@+)>LA&K>=&K^;14oe+)=4CmL>IzX@vM$oS
zs`R^lb0O2At@PJj=pji3^F5sL_{$5We@Umdx*Ny2@{YA6MV~EukoG*>Ue?)z_q<b%
zTj@$`tMD16Q<mmZN|Q@NubQq}UOd>Wkuh*5T&FL+@V5QBdvChfu>{ex8=iwV6kU4@
z&TgI?E!6d1d%Ag2$hk3Nr7KQ$DKo;b<5$Iv6WK*cmLGn-yX5(Cb#8NB_SAjj`Wo5N
zpx>M7xppU)dM|xGDm*@dcg~xqLf&0ZZaG$?%=#F4?NC;m)Sb{z(KwDYrEA(|`rX&0
zBT6HVxBSX}nX^8Z)Clj%K2bv7J(_<1XRf=a=;H3i$M(Xpmh(bsyW<{0Q7yrDWi*^(
z0^5)IWirL1_VB$b^f;|0UDtw#_l}uJN(QwjmF*~ST-s}b?X!pbj^B~(mGEkpT@tEl
z02}@exZiRyi}@^I-i@SvsedPyqfk;y!A$YVa-D_pbLe49l|JeE;Q`u~44X=IJG@`B
z<Y7&t?4R-O>g!9dM@BE_;ri|b#7!#P*3YsZ->*pdJo!SOtBN8+kae3Bq{MWVYY#(H
zlX6TyNTiG$N(_G2XSvwbpuZEkdAzl^bYOHp%Y8mcCM8LB{JJ`1aWc4ojtd>zA66p!
zs6+6N+$RGywPhyXAK7tFp}AfCxZ+;x`SSLppmAwQtDsq5afKMM@y-{!J07B9Z;<;?
zzI!C|I}KBwCvQgV>K`6B@NJNCUv_TDyEDn;wVcIa#K9(VEXG9BEnd)?cf@Uw(RU|!
zr#MbeHzV)<f|gXv;U_vre^lj$Hvs&HzmW%i=1MPYd|ZwYvhiCmmFx(yjgtR9s(LMp
z^f6z`2ky}mG1W{l*%qB|{&?rh)7*2tJByQSB{jLxOQB?PsqwN%x4=H<Mv*Wn#nq5T
z)HS`MF~#=3*YE2_9Z5rqDy}ul_<KvGOdGL;5<?u_6}QHZrv`7$wxk{EvdVJ05GHEm
zesJd(G&2HzRI(^hswi*a=&`4-?s#pa`(V#9{aXoV^ab<WUY_xO7WT?DQTIntf~x;%
zg<6W#eo8I5B)3w1`mmlt&fHAj<s>&rPJ4$Q6rbWCa7eN|Hcb3V@Y7^)n#X3aA(sN~
zQS*e6@}v>o%I7o|rRWd}NmCumtJ6PNOMbemIx17++h>>2nSK>$6`LjVz!W_#BDaQK
zR;#K%kDOmZVk~d#u}AAo+5=4NlVY0Y33*8bHmpKQS1Y>l#CM=v4_m-1W%{EeKorF7
zLmIL6Sr+Q~v?5+?Zjc(29cPE)kbA-!5_^_G(!QD*D1_}sYVHWezZ#R^3?+6g+RA9l
zpB_&+)9t>m(NrMPC_u)g)KX{eE?2Ivi4n$q!6YK2ASuAgB8Z>!#180q(Q;SDSj-F0
zo#0;k==D_ZQk2-Iml}6~QPm+j<PB6P^Kz}q{#%>J{ny5232$NpwI!s3c4rP)(qe*c
z=M-rxeZpMI%WzScb(cTYY<~Lj#EmKlL~M&1zaD(fncP3SPhbn7(Ik=WmUHS*&A5fe
zinmG*{==fn050cy9VtZ!q2keG`ETj;0q^zgYX=E6b_fyuyH@`#o!)^3`WS0FOyvHz
zbozglPFer|lTHQa8HnTIodRu?1daJcOk#NV0lnaqGxJM=ec`?8ZNV9r=HKl{T<$m4
z3(2}EGQTWy{PN(bwvgN>^Y4`tFAsa^UC4hm{{i4e{%?Az2PE-w2c#6_W!01wj;gEb
zXdPuwR~i}^SQry6EKk^3nJU{}cRXoz((aU+eP)jXkE5fbr_*U|=bR_50)1p*HxKUs
z52t<)abwT?a!+B?a|HwEB!j)l`M%<Vz6ZnnJgoc+0|Ntx0~OlOD_*7ejszb*9a5Yc
zB3m7zd?i%2G?Z}mVtLrbi!Ux}IbXVWA)Fc;PI+-zHy}dA{aVHNHN%w1i(jMEYN>{k
z)Z>xST6Qt&lQ9<8W3RNvnx2W%jEPTMi`R8X(556*O(oa_B{jMv6GM}0bCapl$)~?1
z8zrS=xTP7#rCH{u#m;0ne#@{rcinu3=IWbi9g+DYJ=3;2)1H}ivN$_=Hrq2W=VV6C
zot&JU;G1VcZrcBsWa{PHE~y1A1qB7Mh3;32JnD-A=8L@E6kS*^@~Xa*6G=a}K))DO
z%&wX4Zj|_^-t~(q4R~7`aigqzvn(XxesI?P5XOCKetCOSd11<f(8Y&wr4^SeDk?WC
zu4YtT&aWD2t1elpPRXpfR#MY*<53J7PW?|cwW=ZMeM5G^<CMzB1LKcr-yf&Gf0Fm<
z$&EYB>GbC7Y(Dj4OTmw)*`=-7Pg`^9o=vQ@72p3GPHk^*{|8QO>nQlgPOa!HtnQ}w
zc9(qasrcDb`l$ErY;W_I{+h;t@}7aIk->^LgRQHB^*;wIT866@N7{dk)UAy+KYQ`$
zf5540<Ii4CJoz`A`gCaO-Ne-EFH_xHQ_p@)wX9Ef4ZLdmPcrpCywrhzywpv`==9=?
zf0L<G{|jE~xBn+E_4j{!sn4GN{Kn`?W$i!F*7|F6WwOHcMccFAKc7y5Zl8GG_UHH3
z;+MBCo|iu02H>&`DwH$)zw%PC|0gds+yL{Bm->TlfKduy#}pCD1WOWxLvZiXHLqxR
zpx9oj2j)M#)DLVg^=LPvluN0ANl!n1+V_3PVev(2tV%)c0jwQK-{k-1rTVhHRD1)+
z$HMTI$5w1Fm7^0bMHIs4NCf}}cdoT`&@`8FjJVZtfrcY`lH-O}cj1kYG`UYX(l74G
z1s)z!%n90(D-*e9$gL;vV9>9qHi$KCh-yble-s7>zB9o5hnLz@tFIzCQU}7qn<dDY
z_LS}cxSh1ob&-OA9P}-a-#=a|4_0KDH&YI=V_4n%=<(IF7`B(1!F2@8_qUh&g6DsF
zsqH{{Jljh>q}a$Y;LG+>A2JdOL_|w$n#2}^<5aP4>OlYLr3SIR)UqZCWGQ&@0+;v<
zuSL3akEo=nR)r}TBNJrL_ENKSEF0vO6qf$+QWbkl>o$nJ)g@c<kO9lXGTl4bqmrJC
zM}K>%k43U9wVA{ig+o|^OcNEOmz7tSj*oD<@OT#dl?7>-0y|5Ywd!i5JUTW=y=HoU
z5O)<iy%!+G@wjF}YCyie2}C)TWjgVlsHnI4LRg-*c;aIoICgW~Oj(!q*5|m05+Phc
zi6)mtiaq`~^Tg;tMb;t1r}(^4Ni(glq1CM`OO!gec;nz?4_wK#?)rM+j?{^vRHLDm
z3Co)bdoH<^6KKN%1<4UZxf6<GJm7pu5(ezI_(BpKWVm(*&@28^%Vf889igg+o0<_@
zrIH>&J+-37Y8>Z881Qh!b70`begV|j9JHj8yPJrW+Dz0$^4Fk(h>_bkUh43HWNtND
z<P#>M*8xZ8W5i;FxB8;|X3EbaO|dGFu?m(FlrBX9pE@xEh(jkNPeR8?piT!)m}j*w
zhYz&U0slQzmd=MmlR#jQ?$jwIFBB3gDLSTDErGvWX%UBjk{%an68qD?Wn5f5jp7Z*
zhS;3oMf<wy>l^`l?RrChH<@6lv<y}OBNE8!mh8vHo*!dIiLCVTy`iDEZ;hT+A|(j?
zlEr%T;Dy!Z6C{N`^-n5Vh(7_qSPoxP;@7S;83mKnBeFC&%oHXnBGH%wIwrUso0~X)
z{IwGawfms`hVncSrSb!MF6Az1$`sK&&rA;mOarz&axoh8_;(zo`#tepAE8-jfglF5
za%1N36Swkf0d?6*TYajxn_1D`4(t0~Z=bA6dk?mr@4Rh3Z>;Hsq^oo0q}9{=lze`U
zOg59fLpr<k(E7SwTkq06!C=BPKo6at%nrBw<dlWOOJbKJAnOOH{JmIxUTES=i+jhI
zDqK1W*erjkS6xL-7&ott<d3&=S^er}Q4O+=G4{ObX)x2MU9%M3KM(o<D75$&<bL7r
zmks<0h$ljE!VzO7I&rhIPHT|L2hult*pUnSF1kfdc$PQup6S48rKP^uI^J=l_Ihy9
zD*jIsOb8uLkK~sZ7F8Fs6>6DE;eei;1kZ}3_dI1mFV;r>&Lj56H)`y>6N%b*>veQI
z-eC5HN4}z<9ssScU|FAjAV2ceQ5;F<G4&Db)dKB@c1{4G0Er`FN%co4F&~QX!k<VW
zx;%0Kp2g$81(0k&<<3!Y?vTB^uBQfa6mKnb+6x+;553PtZ+S>NGZeOVVO^tk--a!(
zKY-I^M>}yy*om))1*vH|()P{0*zcKtu*?2RoWZX!2&Vp<7YKSi_=u5s1lvnx-W;IG
zvAxtUYnT2UC&!4QBmeeN3wpVC)7)^<c%#NwC89Zgi7NO>XE*J+kUvjy_@p0R>Zo`v
zSz~O~yOp?aNWDc#{4st&0C_#xL_R~@=lM%9WV3sobEojB?62=jSaa~WYpWWLuj$uy
z(!7q{{jka^%=E8Oh0CBV08`PExzGnW@jbXr-bfYl%gAU6%gV3Jypn%;sZ=`RA1_q~
zcGB%Rlj7&{9%|}jULNnWB_Yg}m9gr@O(e!Gm;ZcyB3fttqS3jASK?y6xV!cPB1t#z
zJ16)0ifvDSnM2%Kfwgda&MrtA{l`n?sK?dptIxcDZC^0T7i$07kGeL84hqD-RR3BP
z@kHhIC2-6B4E}B!Gy0g*_q?IGKOqgQcgOsY1Y&7-BjVmNIP~zDHwI4e#Z3JD$eXua
z#a9t}oa!;KjgZ=@FJJZIniT-K&y0`am0YF%E$+C0=-eZph3(~^!<(t7-z>sD<UXXS
zjbQ1#;p)96kf(Fdy(<ew)0%zXcl3l}XZFi!@DB;?_zTsfb`1wA=|z)HYhr#Nnc*Ij
z`}+?SROHUt3tDJN2Pd7kv?s3RCLWk497)`|OT039;EYJ)%3dQ9w|#Qz=_TQBZbAan
zORB~wA`!mrOo}$&&E}%MyvS^GzM}{R36RTvc)6JiO~9h-!#`a=WqPxskoRCu5%Xa$
z1XLddj^3xaY!P>8CNhh0iB}tq_n3&ihi6~&9skp^#_PG?3XvnC=lzj8Tr4|W5GiAD
z>`KYcd8cDP`@X>JPr3dS^=IBTehtq-`%x<NeNZifCCXTRQ5q+2i#AKJ=f?MqOYxZF
z6n!+cHo?J*kh527q<+IF0p}hk{x;?8um&%us@<s`&P-pZiUvXg^F<oF?TrPOW4FnE
zijPnJz8~@HqaR$K%IPNa!w$=3&$EGz<}L|9KZ@p+h!G9Pex*<$AdIX}q{51TKS>rE
z0^PuK9H+yUnA`+SJdvTN<#v8b>cF+fe4WzlHacR|s~A(9$dEezIAByjhn=9qoB`CQ
zS~xEhkAKHkFa`<UgzALzZL}-f26F{Ng3Q7bs%@M=2C%QS_E0d?pa1x?@18#Pi5F-1
z{bo*Vv^zq<;3q^C(30aN&7`;)eg`@@DJe;XY=?<Kl(F!xBgTpGn#nmh{<Iamg<W!f
zQ?glbGAt{(0GCp-&9^~9m4&C2+oK5TDU~xR)!QkxxYRn$)CT+1$Kk0>d8sW;sj->p
zL*YDs2+=$$(Z5M)y-D_+{d&FjX{|G9{B@kWo6w3p9wN;XZi6}(j)i$dB^|-@tVr`0
z2ZDH`N9{A##xaTRoL;aLp$<tT$b;iiIwTWaK=y|9sKY@SeEQda^mA<cWB|X!b3TCE
zYcXY5!<GhnB0z{CfI9^=odNLif3Q>r81pWJ$z;E$%i_5wxPQ@NdJb@Rrb9s9#8(b7
zG(YPYjMGw>#8Ic;46p+mOO4L@%(@7bp`q&;;1n5&*TiFEytImSG{OeGgU6bf<s66(
zwWIlNNF(K$ravwcWR~q-@@XJ1Dlb5d)?|@*s*(r|EzSpdLb@?3c`R6pL(x489Gzvh
z3}+rTQ(=Iae1<-k4dguj#!{oRMkgSjw|o>mwX}RWNS!%1q9N6I?8q1x-2tQ%vFUUG
zO9O!=ZlO9rkp!N(F%)+FRs)VZd`$A^l1lcJ!8p}W$<TTWYWk^N-fBtx?FVA-6sEow
zt_YSxb>#=%h5dk=DlX^l0p4w$3T+|ETscZ@X4Y-CiYy+z^S6{n!3wZVXzG|#y#Sl}
zJXT(kM;ix=vhY|<;1;(H8peKzqu7-JtkBpk-bYYPfM-K4b-GV`%MepOKpJFYsrB09
zwV>=$bL2ToJ$8Vdv`o+#zV)o)UNYjThsmtFceihWY;#D{IfZcs2GgS5=B_m;S=eJ%
zC_*q{1w*kZhy{L#+-EA|6Rw(#r7i;LXVIEiF#Qw8Vhp88164Eg6zSZMVs3!Wy~0sy
zAdfwgau-~TVIMUVa0jM>5E=uod_sIVdgmME?t99;Y6@I*jBAg2Z}}6(Q5fvZnfiwg
zmck>wye!4vfv;$QlM)cc6!2^bIE3@SAIeSc7`k;BcnUZsS|8HRP`Q|Le-A5Lz#=OM
z<ST7Kj))MPtPL=DdO*^Z`vr_cO}r&=P@YJ;d}j!>oup-MLL-trl;wrs49+?H-5my?
zIfhjIj6t^p76ecvlO2|EH$w;nU_m@2bnEAeJ#0n2Lj@lJl#T`2YGKpyw-gz`9v1A4
z#{zVWC>`L$g7`>PD0WB?9e8=AYL8a+damj%XKFi1Uj<MQKOFF(4#R%|ngd2H^FsQ;
zsHhl;eJ9hk>|~kQia2+V@8)t(#w0KOdhm%iOzpVb(GTWj#2RC}G?B3f&AqkYMTHtk
zjwoBRJrc^c1iV`JkS0-mnov}Y2QDxWpM5J%Gcf7+vOO&53+r+vK*An5ggx}S?sIb;
zc)bXo3Hsm%jF78l@^ik+VI|mqeiFcO|LWO?cQ?&ahh@Dc)S^4KLrA$;K24L4Mro^?
zsgOsFLXV=Bed^M9s(1*ul&-=lT={6)UC5()tNePX+mrJmPfjx$_UILG5GdQXB9Gdz
zLuj;cthzuh14!tE)TUFZsp5tOeijltc;KWX8jdghMlHHfQLk~eiC$59+rR8RgA>Il
z1(=oK%(}fXlxhk@la3K0G+tmlNvXhS0-!zo(+2;iO;=O-Zl>MPmJq0|-XkD5DHZ9z
znlJkUdC65;T+hJ8t;3G>U=ql{5&I1QapHkjtd=@B8Fp(3z><Lse*jLX+{3pm-_ChY
zZd-9|-5T0&(aiJHzl<w72U3hNJB!`*uVTF}g$x(LoSq|xV<c*uIOf|=so;B!Y(WOx
zH<Jz>+>!&UnyoEk#2O5Ggz%@n3xA`uqn$dfKph`|r1z5C-#yTgQ2fMLhq)(u%@h3$
zfzKtQ;qIL}C@H`lO%&}m(CIdE>Nbh!CI)bPJXxnZ-_5nrWh&ZZtJ6cYRFYWjwx8c`
z*V^Nx(`|LB=d5V&R|$@Apu3yW+YNNTuH|-a?U|tV2B5mF`nuhn`c~Gve!!tuP~8r6
zSfE080i`>L-Y13a*H1&_c=x5Sbi~73L58ipQKH@Qd_6|weuH`RaiBM~b>Pi-zy2!s
zH3d%MDz`HcWk-iSG=g^!VL`M(VgP3WgS#7V)lK34K<0EHLWA(#H!QoKeGGyxqCXRc
zckw*3E6>rvn666n&-Q^)1>qvm?v=Ws5A7yOwMZfZt`K1(cz|09-{)D&X)p`P#gbA9
zTt`K_pILTChN^lo;p|MX&sd&cWGLK*;|2rUhkfBf=XkOEq9}Uw1Npq+Dtv0#q@Ik9
zp~Dmk##TO#Fi_pusP03OgRKDr2CcV|Ht=O4&-VcA4rv&x&$WjdJ6I(|v>Y=C7$Xjw
z5L?Hvg`FsFFp*VY%^NtRn2vB+;{KdA{(->tm2{1xV;mgK-N!`E5I7s~*iI%gn}Py&
za78nbqofyW1deR>?JD)fOFVX$#BoNK!)yRkNkWbivC`Kj`~ro>MY|Q8M=~nMP=7|A
z5Wpo2Zh0wAC1|${ZR{11+jo^)ip;62*gZI*Eb?Z2kH}@kM4A&g&M+|9RCq5FS;)YY
zGhj0eR3GVuS3B2LD(4=RI|V<t$C#xn&ZS_HGbH#M0@nB0be)(`Ab0m@2zY^bg4l{g
zam#kXx~bDJPoO)3LGvV{NF`t*Wn6z=Kl0WLSfA@U5$(jlSWz%040P(X*)vpb2+QV0
zjWgG;wAnK5g+2Vj4jEe7&W<9POLd;87kisF-hbVI+jezCN3r{dZudg%TQ-pT>(8qx
z0GhBmkJ6t?wc=XFBB#^2GrwXADYI70Iq>@UUOQJd9$QXY_z|&~O~9DYxLVt}7R25#
z72nE6;*LddTQ5of{4<hS(5YxW^MRrALU$^~ii>lU@hT9y&On*aUaZd#{~|BqsuxAY
zUkZ)FIw^CT0ZVe??-PQdLvMQb#NLhQI$@$2T5XJJ#aR<3yrG@(lZ3FMz;4hM%&Ql@
z7chQni+jX3F72>p;I)j>`|v$MO@4fRd#7*%T3)p4dp&xs0j+^@`@+KGm1@yft)<a6
z@Rt<KNCfs58T$)A!LRaZ7yqf8^6~QCrz`q~4PnU$$qt^SSRm$*h(gzgl9lS^4oorf
zJmE{qHQr9b7kBjMmbNdg3t!syzO;+4cIvHmyR7y`uJ#wL4z{fhFRYI4t&WL*ozVL_
z<??kp^6N~|*SWT@^9x@W_P)k88JnI_DqX`^G=XrU_!M^o(N>WB!WyWgBNl8H;j;Fz
zXl=~}x2Dv!v2bOp&EUs^NjZ9LdcCU|;TAc1N=^YEv!JM?fY&Pcwu5#9+xE&YgFjH1
zxiscb9TPOc<UNMdbXr%_krh(LizwrV#8$*CnJ+;-_L1FgtRw3x`+E*6Zv;DUnnY|W
zVZ;bEn})-iG3%Q|<!%EE&d7C(S8PL<B}yvU(tojKcxRLJd@CVy%RFk!>V@bj<!&N%
zCRYEw^ZstvWA9Jt{qTDJeN4aC1Jj*6{zE?vNBQ={@7tyw=DPzh9QOzwIsfDGd0YhM
zXO!#D(dh5Qn(t9=+lk8GO{0F2u5ZV=il(@3(%uSYpZJw_XFKE0_gnjaWj+6uTC+so
zzoYi{$Bl2lI#jqy2wWW8-y@ZFKH#~XSvzXVzfYa`UH)8Dv2%=A15>KSTo1w36Xeu<
zf2%8Vw_$cQ#Bp86vRi95`&qv`?))B9iLE-*YaiK_g~aKxOtaPRTz&mb@Xgzw_UOH-
z=Qs@yg9~+gtH)#_19qJwR=yr%ZMm|3M6rHc|C6b}+J4L0!(c_AXleT~hJGA}fD(UF
z-@IWG&jD*S@8m_}G$G{{`}&0ZV>Ail4C%8I%Vs%pr>Z??C*E7+sd$Z+o}K()Rd6(H
zZFx4kOgddZ9{mRJjNRwUe<OcV@-xz=+~%J3y%e4#X?%UIZNWWb+l+^9JsAg5nSRq%
zd`}}4U;m(Und!YBz32F9&AIjR_qF%0FCA>WFT(V(a-3nhbz>BRD2ugBcYN}J6J<`b
z8}A1kaQ;Utn`O_96&qhiSIxq_yNaZ;&pkVpe?SN9+`q|keElPEzB%mMhc_Z0PBv7<
zE8jR53R%3@8!auiF#l__d&2$jxwcTe-^y&G|4pT*EfZf}-xl;<eZ6~m>(k2`@3(^G
zT<b5~Zoi8SEjdu8MC<$b)-^PERAKg8@mbLc_oFOcJDMtRNO-IOe9M5+!AeW1&_x}d
zq8OsJ8?3~m#Y?e=eLXK!N`7t=2{zs*Bfl>Dp;X1HXP>{*y7BMf%uFp2{oC=6uIuoJ
zm`bLqWtq~gSI1R1Qu2+D3g67hdj87N$+A|ieyhg3m)T@%rpPzB+9@@pwrQz0S?Qn7
z&E(2fwb-gReXj9^|9szB1&0x9y~3`OFZB58eYn-R)VD}1BR<$bJa-AoPVU2eMCimc
z@<NWSrChz*WP^FAz75GxAZ%(2y0m3yck)!&OD&k>_fz&BH^P)oo^AYo+Udf}Q)*|t
zzkfeNj#Ym!?R@eEEWwp`$bHrpzvDH_&OTD)6PHc(JgX~v=z!yCKC|uu1y#AzFJ0o*
ze>#QgAGqjbc`F&9!n2GmW02tTAH|lE;Q(+}UL^K)(rG05_CR<N5rmM9l~|l6uRN)Z
zO1uj|E|39Yw8G5$hWSwKAKULFUcJ;L1>?y?r$JnkV2SN^Re*a+X;pw*ywJg~A^@<!
zd2TU0;~WfV6T57ip?_q@r}P@%Wgl&0EMqZA^_BsKb$KM&GsUPo+0-l9Az`Q3XYatw
ztV*w}vHyke$fR5BvEJDN*M%dAUlY5{q`90WOD=yk9V^o2z2}qbmG)@lk;!$1{CLxw
zDs$w6B}Qcgb{}P!i+SLM1e^H++bqQc-%NXHv!YMe*Bq`RWE1*hzz@&Ojh1BRUb{H=
z&0!}@F&J%75-1BWKoDTtMD(rTwytneQ%3)nq`4-X%dJd+91RDy1!E!n?EnNfEc6Zl
z@ls`ZfQ85Sm|+1dg9^k|&zw68^lwX`@W^>kDu_UTYs()V8J}qS0s!NwV+u@dII_ka
z5!e1h0l}k7K5=!v!XAPLgLv{FU@<Dd0-y{ahTHJkDxbqaxQ`B(QMWMIUTAHB|LI&0
zDdBLzz*i^Pd!_*S0!BX?AWbWOx>mst?q?Y0^r_y|H4+4f`X7MWr<MTy>IDyYBaQ)x
zGs%%3h%wvv2`Yc5qPK7WRlQpx8bS0tk9pJ%ZrI2D1r~Ir&_hBfy9WXoxhIRwn5aq9
zspnDek};WQ_bDVqD-0_7=`^|TI}C?#=|N+Kp#bcmy`E}5Px=LI0ESFBdcl+m)(ChB
z_X#(*D^opiMEYJjbLB~*G#$d52|(}$(J<+n_yP;bCV<|f;PXOM5)T*?2aJ{BSYW_G
zUun@N+DnX-e&pSI+%Ss=3Td}J&mJp%#?UnO2gtCKj56ihjR3e3e?CV<YUuHkXL4m$
zVVLM;*kNQe9IH@}9DYs>#IVST=7ocOyz<E9=5YseE><eYrk0**N;I{RB*!JSht4*-
zfJeY0jl@O;@=&s9eJanaiIznQ^n#HJShS~IW5sNwL4_#FmGseQ8ri#jc2i=m9yeE#
zSLLS34d8H&?<GSNaMEF^c@-ZG#VIc&Pg~zp_+x^|;xOltt}nLGDmQqx^D;vvw1VGH
zh#|Q_RWpeL!<)#`Bf;H?gl`faK>IsMUMNs`SaKiko{@=gEtp9JCg$J($?s&I2@eFo
z_1gZ}_nd|2f1DH(2XY>f*DVh;ymFFiD$3RMDv3!1VI=n3?YC|26yGN)N%l8Sl;=Ul
z1y|~RmbVYQ`uc2g*kew~5~Kd)N>}@n7+cYVExRFrf2Fg!)iO>Axi1|`BICO9z}{gt
zRAf$!P;xj9gQ7bXhO9qLzt*n|0946*2n62WePoN~f+G+GtFr;X(;{<wuY@0K4{S`o
zhC7Rr1g8nai+mlxZ{rw5k;t;4C}Y63>AK_stVX#;oj94_RsJRL+tm^MHhjc&;HP?x
z-=)_jb4#at4xP>kIx)Zh(^>TGk5<%aX1EK_wqo=RqovDX4k=>V<j7l;_RFw##dE7H
z|0~$cg{(6-&kTxT0Yskn9{)CNG5=HsfCOOT`?%kN=)nA794qo>rKPM8fR%NUgi>4p
zr2_*WNA9WrFs7<ls)B9A-f5ItdQFItfRm)x8sem0!B?_93g<%ajw~-3_1%Ynk)0to
zl5_?Kz$IC~U}aLBs8_n4I9H1_^{tj0J3<GAZy!0XX6@{<aZYRcc;l9>iCCtq&jq=%
z+<rpCEhGn)@iNn8tVHZufae9|MECTl2L7zI(|{zeY<nr!A%Myun>EX+da>@=pTI4J
ztFPze;_sjDi3O91oi(XO<$WW8Cu1BJHeIeay}fom;^XaOZ^|w`|C26w^@}5e1(6B&
z+5U4rP9{PIq^x;vs}_JOkaIDg0EpyX`<_nw5{mNEO|z2jFny&O>q@*L7pn!PZ;6=F
zh>(#TE*>HgEQ?DJr(wUS;G<uD2q%ISh@TUrJ}@|Cu8ezhGU>l70L1niMGOgep=1i;
zz_wrF%BD`6bc4V%?os>5)C{Q(!15;5O94-1dilFTmmewRSyMH>6kjpkh0S|&^Q?YS
zZZ$hLJeIz9sr?T0Q^ftW+mk!X&y-ibbQSf3>d-tbaw}ih9gM)BwGfZxS)WY%7KIX?
z<N(Ff;9*=Z&eKL$89V}9N=(uu6RBXI+e}9CB}QP>?_5+QW7>yx7mUNl1gedBW@?7k
z<&8(f2@DXQMynAzZ#y~QE`*EJ4wlW0N2GxuoZ-}^1bq-pmVBw?F>$;8Si<TtBPb?(
zX6gFQI9!K5@tm@&y!!1*!^JyGm~cm|I89NSOoh^b>Dv_upMzXD2rTb_|BN22mipcR
zoL<r5nHhh~oyruh9!jl1Adey1n-Xa-$jp9Zh-y-Kjpo&)&+8Hwn0H=g$H&@G;VW9=
zNPw3Atbxg<-StZ*b)&D|Touv=Yu9XY0$aQie>lWxer?ZEwC-u*AtWkDH4)8F{d21>
zkPK&aXn}|iTulMM6!@MDq$bzH@jy=Su?UVL7EePBg7_4m8lI&CO?*IcM@7RNyw3y9
zg9IQzmq<?1?gK3V57br^9dQDD*TulV{#rhL5Q)85m^%&$=Gy=LmS#$M=jHs{pb(&Z
z01PtKxOLR<x3J`&UoaRFP?4s##UNoxx}w7!bMN#W8;ti)X~+dYxQF5-L}lf80j_do
zj@krU0`&ktwaY_FrZfq*VlcsTQ$9!1pWcG(JW?S+b$VDsn1JcZ8VckXUm$e_qX3?5
zc*|#5Ed_v+4j`oqHTd%bar*d&rLOe8Cv}Fq8+h3?091>E&%lFc1aV`r54B}#ztB;V
zGQU+4&7BNuZ;Q}lk)ac+ECr7)G(}E6t_4zC2FK~kZ{mM+9{0#e>M`#)TZ$BGHO|d>
z;xw$mm1GE`g8cEdFZrl2oFwOr;i$gJgssU(|K4OuK2smG{GgL?MNpbh^hgB%IHdI?
z<oE?2AlR<ULx<X2SCdF-O{N0ZN;Rv}dTjf_7%hP5OVHoFH!P(FTA^PpK7<Irxqe&c
zcxbC>Wh?hQTyXb!RlC-u-)#*2{Sj^eI6vmP^zg&%PFHr!OI}BE``t5^1IhLSxs{fl
zR|g^t!Da<TR|BYSSbzg3$+6v)$Y}L+GPw}m*2%U{kws8kg1qQ+I1<n$-8mEjAWWtD
zZmU0VqCRZUVkJU>gpLZrlKISzd6SU7jiuD5U-<b@V5I^F_{0vULODq$U7dA+57k@k
zP`M}_9zNQ3rN6PGNV8Qrnbs*5Q@}G{Y?iGLX+QLPr^T%n&I9Zp%R%~08V%$i2OBH_
zFO}hlCq6Setbv%`-Qh8)ReeK(5A)6>YH%e$*JZf?x)eQQ`2b7+{3%20x6FfMl6>0l
zqB<+yI?2R}DxM9mCuDU#>QJl6somM2pC5pNfzpk9)70WoofhlyyLXDs>1huPYNafL
zco6lHFDy-S1M^~d=9@`72b?DR_ca(kYw7ECdIlPdt9hq1Ar#9KDuzH(Ic^NIP$ad+
zDi%oWi7S%IK9k=i0bNtl*pwM7)8Nm*J&fT~#8uTeq30`H04xv36pEE!ZUcewB4NhN
zLqMW50QR9GO{pA&{$8D$hx}BgCG;E)564qCTUxJyq#$Dt&<?<#NfO_@AiSNbkv1w;
zHTuOe4wTjWFgt$uF!0W-N2OegD~}2R9xU$A`FSg+IF3}>rSK~jM3(?K8uej)LQ)r1
zz!cB1-Jc&(P-7T_=>#}u#>Q17AXMAKRXu9DXDE)7fvIqYzBXiqDsTnRFQM8Z0j_>%
z-(et#8}JRT=NZ;Q5sW}9-AS^yKpUszr|y`f-TxN+Dp>@g6!D6rN@aobh&jF^pt^(5
zbb}x<#S64}?@Fy4p%Ku8D#G+APdpWj$0O`dT*)8(oHk%9d$_@Z8ZZlIsIU)Si?-Gb
zq)E^sy%V!()u0VvL*<7=M4;E|nZI&52!NDbue69licZ~h=qqMcJhb-aUa4;ApSjRC
z)ap|yfwXvA{HsJ+$A-eR^JDS0v|IAapbHfuXDJ%aV`|>TI?1&O$!dvDt5D}?@#C4O
zvv~Eh*ycJ#VscVKry}YUstdhxGq69-NK+&Umtg8s-N|q~OBB(yKO`>ldO+<=t)eqX
zz;XOW7Ru^PGsu~EARS)blJD+(LG$F~vp2IgXXXUb<rqV(H;wR-K<+2w>eG$R^SUl~
z$KSkhcKPs?@13#Bik0B|K$p)|F4dB6Rz?<tu5j`^a{2aW!R%M2)R@bL?tvqj{7fs?
z?~U0r`0R~qZ)bn;tlGQoRJ|2fNjXb({c}SM>&y51k1OCp+dm7;&A392<nIrTw%{Pc
zgUA!)oLyZq#~$uTFlg(I{8CR^V;C8|kO2~Z%Yj}D%|skIn$kgo^IN+KxVY^LaubYn
z!)3S$6}jOSpe8d=FZ!ZTF3hCgO>EB%k9L<3U)l#xz#Vay%!Nx^yB`d4mx*+j&2X2?
zb+cfiu>0H;^lpMKaw)AXahpa9mq%leshB*Fa&Hm~gL`)vouYOyNmVI2F8p1Z&%0>a
zJM}gXoly^6@f75!`>}odF6Y6_G{J(ho`!m!M%JFjE}kYqo+f&rXm;#!kf-Sam5=Nx
z!i*Lqcna5ogl9Yj!$Bg<Wl~wR^<$9W_OkWD^2ra&g7)tX_IcSBc{&6w3(=z;M!lT%
zmZO`N&lE))?(-s@_H?@#Z4L*S?7b&Hj&@t{@{T;`lX1@X96x)FuigjW(GSipke`1%
z&VT3t!Lz#v?65NqZxZwxz!6doJ-q_;W+KAIptd-eF(WaE6laZ#*BeVTFORb+huSd^
z-o$uw27<QoF$(Q-so&cU85bJF5p4ovIZzTWGva9!_@$(k<R6Jw${}ufiB|!R05Z&*
zk$ANn?xqP3pvM<d5H1W@$O<Bi8Bb{PvLGi|0dYP_aEg6`T@q~h5!{s-Z?_$9XAi#v
z|GZx=S^^7qqa;Ky6E9N|oHP@z<Rv<h;;!~1B1s4r%>>#H#MM!lTM{CQf(TfFyR0N+
zNVxSjkq5RJ=ZpMX9&`9%lXQi=qh-A>n0V7xpx3M8uB^o!Ux9mvL#|Qa%H{DvdC<t2
zSYmsE2XXZ(0iFow=+6!4Hh~$hzyoAs%Y!&PWaB)jzLDjS0A^xDc<g1|*NKCOYb#JC
zWSn_FEUG<$$cQ(?!dW52STot!<Kd9{-sJG|IBWb$P=7p;097al2_s`QnP98-MX&x(
zUIc^}0M(iaGMtI~439g3O)9I7Hz37bp(L7*LG8k!0gQN}Y^+Urd^ic=5DpCkk|`vp
z-AbHw9>Q%V)*K&ih6@S}{?c2HYOeN&xl(R6eR(nVg`4rEEpkPR6z4>bw;oGW4gVNK
z4Dc?Gr5!{>%|P6!-rYYEgPK-(l!L><V_zx-hX8>$88D@OSQud?;RnKv1dXBxi)i?S
zgvUDI5%s6z^sou$$T$iE9O4t>F%wJaPxhOEgy9k2O<+^Ka0S_DUI3!C9q%;*r!eDn
zo7PxfY(JC$CC)&taGR3UckIm*&WP6{BwWQN=;0Hu_QFGaR)X+|$Xah>?0Q6hJg5(D
zOi6GEhXfEqAOFD7+j$2F8A0bL7SFdbX$X^Bv?~0^8=4;zPsf=d5h3mH$QkC<u{c%J
zfakrdQx_3xrXTsER&>L|)a(Pb_rsKtfw@hIPT_G5A6Hb{6Ew=<QOq#%iNGji+$DIj
zY97?39Oi&b)MX|f8bciD<G99vi9bg;kf5l<k3`dWjA^uFQWE>a9M*t3&cs<I!K?_0
z66Mjn$Sn5$VpF((5<ZT8KzQUqGf9d1AAM}epO(sCF6D9c)ljdWIK+!DtWIXA<(=>p
z1c%kf%;g!X6pfj!8DNJEHo6aU=#P(FfkqU?9qLDrFv;XgiE6a(szlf&-1?cQ%XYHR
z?4L1-=Qu7kC5C?pjv~fuXs#ErF4MxHudTgp?j(k<Bv6o0f7c(feaU_+kg{)3+kTkc
z%n#ipgja2}Fo|4c_A~5fyw$d^6%fN)4ss-YJWh<KwINQI$6cYrOuiw!W#g#(w+(8b
z*N}+@6!tNRi$5Qp=*<s1f=aFl?|mM6IXtEN3|Dm1(hZ7l9-PDY1<d18qC-C{q#qVZ
zL3m)2JqTYS2yj}vp9|s3#F@Y;Oya2PR-tS1PIa6X*_Z9EvSi!;%sszG%Ud-A!b6a8
z$H%_i|A|nd?Gz*>njxXavH^C?ug7JBqsrm?%cF%%VHfNZG=VsKd$=Ltx7`f%ur=Fz
zit`vlI3&ergvVJU6aB(tKVl-H@Ce{|{O{9=oX6l%;a7|Sq;dYz`sd{r&Ibba_NfM}
zFeSQ^cx7xWeb(KLE-M{r%JW*2>ZjEo3D7j)mKw~FKU4Q#dZ}ft>Y|GAY8rLYCJyDf
zs?J&u<sOvT-nT7$_{kTqe0SR!)qRh{UM;#;p681|0AKz29JOR#pA$I;&8u6RdCSf4
zEh_JH<?VV+`IMsfjx<lOK91jQwTjpV3=x%rS}sfU_0A?!dXv|#@F&rG)_0nmT3gK`
z?tLxl&bNXn-CeP|)g8U|r}Ek1m9Y~1b@4}Ee`_!qor!$PLA#n8%Y$M|7xlNK&gY!b
zI$0C+M~m&HR(yOq<Eg#Pobt%xJHMxMWj!pn-dkx3CjMsp^<>R?mfqg(&d*Knw*@N^
zxOH2uXqa#~K88cSi5&gMX^K0JN2`nL2#-U!M1qhBE?aLje7pE?pD08!`C<;q0Qb1u
z#{wrar!SeNGN>t)_Gar+fwXiFB5R+tS%?%(pYy16rm^tlWy_;M0MzW6gjuGZu{f;z
zxMdJ!BKzzSHLn}eZmb9Y@>0F>IWn`(6#bG`mj*q`%=h0n`yq=GDfe$LwO4IIA(Hcf
zP4*?uhx>~U2wjoAo36DZTbgOEb&{lHnc{lyreBNP{lY6dpRzZopWpsZFSVko<v+aC
zL)FcnTMpGc`)@B*^If|3p5}6<h2H;nUTV*qP+K!4&SKVH)#h*)>A>VE)=#)RY5;SL
zRU!T^o~MM$8GtQQD-VYXYw;nYbR;=V!Xb(~G95O}U6EexaNtWjS5$Y`wcc$D{6n|r
zhnmjE9GtR~D349iz`5z}m3LjLrX$gNUe~4`baPzLe84Z<!8N*4oNjL~7E6}mbXrOH
zbFRGWfL6-B!Uu7ZX=K`dhdwT@WJ%?nF`-yXY0<?Mv|%gKB&A$R)Mkm1w6<t`u+HY_
zx+z|9a183P?ZG?qXj~<YgtXeCMDpDlmBp20jLwuxh7rJGUBz*u%#y=sKPl-{zUxHt
zJI>QviG*st_+Mdn;~VVB##(MrB?467ZmX%xXF66UcM<o!yi1%VDL1s(1Q9S*=-U0@
zcI<N#LDXsnas+Olxq*`q<@#l@M>xx2hnw90lOC^<k%{#f>lB;Olos~sz&IFDBs%TS
z9lj$p5;t5|peoVhn#M>|H7dSkS~@B+|A=Ptqj+E8<=BI=wq3EICPmTZqj1E7PDA0l
zyf2#*rT(m+_zZ2(8c>rlI#tImE|zG&oRYMCR5(Oc<F1oh?;Muy<dkyi*e`W0_E;ni
z7NDlexr_CYcxXntq+@V>kyy^NQ*4_HXWlDJexM^IZ<mJTDZ1rE)(I(2(rR_XWYgd2
zESnO)(A6Z@@yo7$ix`_L(YFgF5{X|PVPke;`Azy|tbcc~PSps5DhqkOkly+60H^PB
z%#asFM8n0DqzTxF$|WQFa8s$VUb^%%u=`U9QUdK|rB7I?8_(^Tp25aCzGDBdA4K%C
zp!>Y7_7-7ELYXEP59aRmOPN3Ugt~Ji`caa?m$QYROs94X8!H<Xf+S*QKWiG|3P!B?
zIWxKJBJLk9iAP$yez_hIT82(kFgymIoqN<a{itq4?t<g?{0jKslLfE-lclyCA>FZ}
z!R@0WX^)1iWxeFC)BBIzrkF&LW4T6d+z)lOIDS&^$o;Lx^IYq%-+bf6Njl9y6#a@h
z%HZz2qez7O>a5TK=*EGcdFL&ZoEY2|P?5rp)PwfLIp(b0d+3+4N@VfDMFE+<E{1-O
z?7m-a0`*P3UBT-YOYkTg+r*qBdygn<pXVj`W}DaN<->9q$MJ`obqlvMcyBAbf8P`<
zdXh~*)K|V&yddQIhrwyMy>6OJoxSC*SZ~yZ;<-fsCE>TG8hvuc(gPRWi(X9RIk<S;
z2CMplU*AwjbmP^*Rt-rPVyxjjkC!Hw`gOrS-lPLDDYV>0&gGT9QkJMsLTCu4bKBcA
zEOjMeK7Ks-{c$&T!pZ^q7S8on`Y}>Ryq1xKxJzv@Fa4^26wO2Nd~Kbc7Eio6#ch)7
zlP5lCkV^#SuDi)FfIe%FH!~{c+tKWmd`7u`R->53_e<7@ywdbh*6#I`OoNBUN<nHQ
zJD%M<yhi^mfkQ`Ilk-eJ?3ut7m_u6c{^tJr|AW2zjA#4*7ymC2B!VRNPV7yL+9kuL
zN^7)M?JC+D9VnF;t-V)UC1w>xQAJS+YL*ynsg4+>M%8MoDF5{PIp^HIzu)<v3;)ai
zb1heLC3(Md%j@-iJs)?G)KjimHz-)blKaCyfNqN^4ZcMN6n#+FU8ZzCV*`8_!R=w=
zQE)3pw653iyDhr}2*{K0<1Y3|;nj&L&9M=s9@bP^+DWVD5a5LYRY5<Hu;>R7$S+*L
zjL7gAiDo!79M5G#G`3Y%Ul1v#UCN=dSP7QE9=7TZL1sfvHWhwyRO)%7hk)@b_b#yy
z8Vl4OhD6)ld1si8n|X)do!(zi@aQ)=B@_IE-JmmCztZbuN&^dmG7J8AKHUG0;^m7|
z0QUX8n^Hz{o7g-ekL_{fRa8#KPVsk_oHm;(L>$pZ`AXsR;((V-7=o$mm&olencs1K
zTMyN$B-U(khi_N(M3kvpq9=aD@Lh3(ifs@zWu(I?!wiuU`Z1cv(zV=toG{)SFIsGC
zBOW*#l2t3?G}+0U_|}*3&GeUI^B2K;pKJg8XnOf)BiisEFBN(I&oqm{UmT^`O9Z)f
zN6WiMgAJt$VpL_LX?Wu`8EB@>c)bDq(YKz0H%Q5EvHAtE47@ajLZGZRQ0x#OltAXS
z190V#;DzoG2P{t@nKyyR-+&ceBqI+2V%jn6ZZYf;G`3eLp*RvajRYwo!OPvD6nAzv
zid@GrP+8brvjDG0V`OrG{RL937?p!a5(FAAnhd`J5Tepw<2VJ~fx2QKI*@w!>d#*w
zHCD%NP6O1#e8Zjh4vJ5W$ah4PK+SRb_UK|fxVO{v?ZlL?(U1vP9<~zxMJ#_84xLk?
zU+z(G4#oUxPJv%sTwYuvhN1w+Yc}_Qn8jDv#8o>eQUny=6|(ftIi&v(H|M;ZcL{$E
ziT{u+b*)s3P%7(0?|SxVbi_z3l6k>Id0mPei19=LBdTl2pc$_T!YeM36&(N)^YdyO
z;&XHz72YEUrzolcg!sMCVX;+Us6iN`mM%~z!(Ax`s9F#!>ACQ+@YoAYz=>wKYj;sJ
zYVopamWIteD%BEPHVaZToTf{eekD7mh=R;;7v=WWobGu}U6A@9!L<mGwZiL3mQUB>
z(JnwCT8Tsl1zQI-@Mc7hiVL~m&;^X9Zm-RYaH44XS5dCByYRwq!F1G9w2-2KTC@~r
zH-N`V1kNEdy!E#&4a0gA4vA*Wcpc^n>Uxic3s77ahYpma3^3Z((WI>KXDp;f2YM9Z
z7LhcHF8`o{)0}V&kR!sKeWQe5T1?pruMDhs+{~z~EhSVK<B;@aq`5}{B`zBlo6*d8
zf<}=WErr{W#qWr@&I1L+-2wAJ<q;3GTBX+!Ko)e2*EI5Z9L6ZyOp_~@a&KWXU|Ztl
zUP_(r(LgVvTgooB;LmmSa!dOfzmgV1`8+P@k!zsI(JFR70FfYbDLedlL97ItDA6hz
zjrPGikZo^E2PrOET_H-4zEl-3%Ay~6IKWP{GQh!<RPQrl2|`qFMxj7}@|15B4UdKc
zwfD<|SWWfdJyIz&$N9zbT|By#reT*3J*3ArA5aH+#F(pY(-@UUN+k{@E7zsC4v8@l
zNm{$4P+YoxRW~j$R<ZzykBpTp$44!Gz_~Lj<zyI=mOHCrliwCu?3Nj16x(;ormFSI
zp#jPmkfC>R{9s&&8d)mxk+B)gviq2k?h0yX`veI>qH!R<YLKcOS*lg$^m=Tr1t@Q+
zKTnq(EsRyKqZrr_wH132G)DLoi<}*oVPJ+|2_^Uq6qm{*TLKC_X(Sb7XH24;Gs0G3
zjd<s!RHpNDU&rwY$6n@@Qr4F<${?~52$tPF%tjU3fsA+>IlVUS<h5nF-JY}|BdxFt
zmlI+u&h;wxc3bW;nr-wb*!3!n^lG*;fP*MT9sc-QqLA!e-dYO2fMRmae=?GhPERJ%
zX;eicJwKx1A|`5+!ed3JQDeoc3ZNf{Pg=dR`0yD2H8$Pa2zB@vPbC@fR9hv;TYBSp
znpZ6b7|Yv1e#*FD<zrA~dw?xHj$heJ`_25=(<rB|H@?x`IIz33I!=gMZ3GU)Uy}=2
z_c!WgXuz=>_+fQ^GV<)<`<6@%!pH^oHJvUBcz67$N002aY_vW_5>;)ui9_kfsH5}s
ztSEnV)J3_Fw+>Pr>yk$1`qwBD8k4w41*3Hz<8l%Fdf=FHull9J+!CNp3J!IRQD+f%
zf*W^Kg)d^ZpR&HJ_64uxS2(5_r)7t|<It-K#__dc1senK39%?Yq7X(*h7P1=$Qsbd
zS{VR3kgC**trJ%e9Z^c0CyNIGc{=1pKL7<>7<n>eji(vK3Te}tacJ2Xaq2im(J0|-
zkIc#AnB2A=q0Jb*y-YMWPU$QDObJkfN6<<(R!A88_&$&)2q(A^D>?9_LODk091h>0
zEReA*p7VrPKhQ`!2A)7RT94HZ?A9!2<Q~PTo}+NZQE&x7fef<JdaO_a{s+!O7feBP
ze8X`E;%(}Gh}UncT{YZPLZgjzGss+2`JetO0&KO$K|nO9p11a@svnV;y9Y;$mGUD(
zH~n=FznwtG^;obAFaY2-v8e7?)Hz_nyr~E^X1p^$BC6<_XU+P_7)~pk`6-|ve~$z|
zsL&Ii&>^g{jy-bkX;zM7Z9*G{0px}8TsZ<%gI-=EWh40I%i|5~zpBn@GYZ-qJ8?JQ
zP~ceg<_8fTJtyHdVoJdgnHh!}x#}H&{*xdfyRSGKAESgG2n~Qn)xK9Y(k&ziF))J5
z=^u8t5)Dv2)Wh6MkSoOKCiEx;GT<|a(AI9mF0&|sz*|6JUhiSn$0CtrkR#|sAXXFe
zFC*1G78f|B%5+vZE>^t?Z_sTlFh#^};spGZUcH$T4a1h(#_{1n=)!LCxR{Cp92)~8
zk7A6WA`tG<qnsmmf~JOV-d1q7px2vFH0=E|Ams+Kk!%k_aS#DY5=vnZIDBGQi{%)h
zXe{&y-=!dg=|C!x4x}nFl<q0Vo$yi@MK`Il4E=e(jq5$`o@;-q+0USLD>O4C7~gtD
zJ)77&DlbDI=<hPZg~`ec#DaDL>H`pL<_UCU58pS^QoLui8T;_MB1@>U+z9|~kV}al
z#M9G&m^M=inmR*hHj|0t+@z55Y&i5l2K6EMJ+x-|u7w`n{5PFWaRTWu>P%}~1_6h<
zu-q5Or;&`BR{7%I!IXIl<3{mWy%>I4lOc`RxX&o?yv8u>J1zyI+q>a#HCDJ7B!ejt
z(*kw4Rc8|j<(2qd3tXj>k)hclzO{#iuUb!otbYwp`pqk^c)m;2Rctdxx&y0y&X%hR
z-*_^PN%w>o{+S&kIek3<W<!+YZ!)X}f)$S`7kGPA4;Z}<db*YfO8wQwyK8t<;GXE3
z)_RO^{$oiRQBxt-FbG$-{Zy{kOXqouVaHD#=_d{xqj$9jtO%NW^)v9-Ws2GjFVi1*
z*${>cJqK=q>%5F$?SZ<qVA;Lu<9$4SIdvuPU4!|xzOcacaiET3hU-U-w<oY-O8JP9
z?4rK+Z@X>|8SwB`X{dBp;fOVciY+0-v0nYxN(6hNYMOP0sW|SZhI>I4_Z+^6x^nAj
zpCFzQkv)N@0inKOcVxu5K(TlRK!U$IcixuP+J-@GFl>5Nkv<Bvrixbtin{n$reX9j
z@;rgDQXS7MQAS+7za%i3%s263vd387@8seT;>E2P`i%z6we!>i-3i#c11q_!6}P<~
zt9C94+Deow0M>iz@C0^)LN)O&;dv@+=8^cvl(?(;O@`b(kO76j7uqrzWLzx{R>;th
zr(QT5e)WPxkO~M*sy6(9<M2}tp4G{*{GD^N6)y}(3#Dl46H&WQgf;=Y%5m8G80fV&
zxg5Eh(C<TL&*U$z7#C>b(elO#Ap!&AjQ13*5}q5YgR~w#H}q>p^!C8!sOP9A27U@E
zy*JHYXhrtpxdzVacfYx<qFa`Z%2khp3F$Sy>ru@i8Wiw|sJ5z`X~%ih#l6d4x+7`=
z2g)*32-N}%G}N=Q!e-}>@db}!CH=65f%xl9VbL%4c0~gOM{5kJt*HyGX-#o@*G$8M
z;&mI0b2PY=?A}Ni+1%`2$7L{PAH-%yD;a0#+5BXXDaRuZ@IUr@Iu3dO2eDGZ>i1OQ
zUWIm`AN{`nGLBUk&E4K6+_c3^(t9|olV=mLC%8Vcyd|jEJAA;1V%8mqrK6~^yk@}C
zv6fP2&?~K*<)<UUmWrV^jObPd14RmREl!t!xmStTx$%4m&e-i4SML^X*{X`C_1rk<
z$*08Wb^xL+jm|jt>ifBNWjr^W(v5gG&KQ-YPNwqM#TZa;HmHDtU9pDT29b}}dAOZ#
zJ>Tuizhz}guGBeJSX^U-ikW~^!%kQ|G}I5{S%^1`JmL|+8#dU8fq==P^+9g2tbq(N
zcAbXw^~yo){j1&LRnPPn8NdU#zj<9xF2+<2;n`Zd!QG6=5pDg$7gAq0Ea71SK>#^)
zuV_$?H1`9Th%>kF`;blmp9^+OvkjM7BM)6xBy@w#Vk$_Fp@oEp3q+{!%O|`&%!L@b
zf4raGEnchd#~25VW`yu+gi%T52>H#u(4NPrd+a)rBIM^Ds7EJ`B3ctN@gFc+DC_ba
znauf2BC7xgck`T)VRWG;VL<FVy)*@eZS?f-3~E{zww%;C-<16FHb&E?q;aVDF_&l=
zdkR4OnECV*=e8R^_IU!&J@p#QJ8_Fw3F{di2Nx9bnmr%R^!N)3Y$fG%(}M?c;G}Zd
zog53{(>(l9lyxgPd`Yh${qy<$qiv;63nMkB>$6!xto71E43$3uf6YF6vuF@3<h`H$
zPH=s#NB=ud?M*2+@_S}1*KXimGr5>)dE4sdd+v;xqn|vc+AaZxU&n6g8cvVxhs5kv
zo<@Fky%n~#Fqr?Y>uPeDqstfbiAL!<!`4})&X-H|1-wdq%%bn5ze4=Gf_qXk4ofcP
z@lTjPLUs^JJTvbR#yy3U2x5xGPTX^p`Y_#a$wFeBtr5cOFt{?yf;EJN$5?)FnLjWD
zvdDkD6WD<;ZQc%#?bo_eTW%T{!kx^g4BWyQZw(|6lenw|CThdeMwo^uE)4Tvp81-r
zVdc(4&JlE*K2y%^jv4=A;VK5{yUw*qS078<0C@6*WB6I)+C2F^G9?^JSPJ-a24z{`
zY1;Eb?t%A><2}=Y<`UQks4)#%%D3?Rw>vOj3Z(Z|q?4{RASOgErl4et6y(X35LlT_
z9G`?ZSN2<{%bjm(Zx4(=(vNKE{n38Kmx;Ib8k;2VjCZbU-prRPIvym64>>Abo|p{t
zWP9xrPn0|=3CkHxNQ5O|S*q9SxRy#i^CYYue-|tRd0i)UHQ2`Fi$4uEO*9`6ODH}*
z%Yu{2AeL?hr4#ReeKK=L<Tn3&f>cq#e3DX^w$jznT?@Dxv;WR(qGD#gHTDBM5$4Y>
zpO3o6LJ1%Rrcb}(EL~(z$&2~(7|-w3I*`wI{V@1ZmbA2hta}Wwqz@V8^eygEbg4W4
zLiLj_!L{0FpYE^KUG9676xh`+#T@B&U&=e!wfkZwyF-cZ<wzHj$(NXOqOuPW-tSp_
zqrEF<mdFirIHXewT)Ig5XVN3lo5B*N4$)bn3Ealpa=l<!S<(BoQTplhU8*ti;jT0G
z{C9=Okc^y^pf5cZa+Ouuz{`mkv+64`1co_Zc{~2Oysl>jQdK2Mg0;n3DYBCA<CkG=
zG0AG}TWxI0X4v-$3Iz^#p;G70^ZUm>R(^Q6{n`-uXZMYYh<*%hi>3Is3;kd1)79r&
zT0_?+<+Y;r;x9)5xM>WKa~MX^2F01_X?LqRpnNOM+vS##05F*8B?|7jPNiWqrm@l2
zf?|=N67Weg3VTe3h_Ip<>!|_?@BV_oSdbX>{2oPcA}CJUu7u^PHidsQDDLE<2S;!#
zPJ&}ALFjOf<Fr{XN*9qR7U#*8T|kjyMI_jci1SqJ^-8L##;+&Lsdw+;gsfFl&MHdq
zK9R+%mu{uHt(WrNYkkG(nL+qjMFG-lE<Zh#kjE5>US*pB>|PHjzJqWKIaCE3yJ2{a
z!WLnNTk)m_3&QD#F^0D{2STgnGw)h?iwUfl8JmP;Wobx?^PC?tEj^Q&(_AjD`q<n$
zf-@(H+ebm@w}m}#R#v;Wl-#ZGp$l%9y!?@JajhA1<J)REJucp=P>7}bQAmEThR=!g
zdsa@$O&PCyeKbsUUSGyFKB)fSt)oIqcL~|atUL6Tzj%HiRKF*0RIyyIOyIP??_^<D
z`6IO*9cz!gvqhUJ6}lBOqc=+@i<fJ^;MT&4w|MO`54nAf)O7~{Za_X!p2vNx=0F`1
zo<-8;F$Wb3$*s=e{2C?)DW`XIN4R;Z1uNzi=(B#UyA?90RxF&4btenD>{$FUEYNc#
zMk7)WL^q?Fi#i8+Z1ILmwzK*SBG_JJ7bxf!RV~=T%3kC4<FV~SfBVk+_Vx0)kFDcZ
z?H@-t)cV_3yZn$p*O$c6==P>I%D#qU^}R!f^!3N5PARy~MA$#S!Xx6^DSu&n^<Cq8
z`?^@AS}z#Xkyr6&b!umgqn3jG(9(%UpKrz&j^*vghjN?kQx*Im2k-k!9U3dy1ALro
zV!It2np(aEdR`hnQ`5CuWu~-h8LB&Z|I=;-mC$EBK0cYR>{uc5P|nh|eJt}fU&q`N
zd$Dm_x1A!s&K3Lb5i_%Hzy5lux!)sKod3I*T3LUy&$8>%=F@J7^jmdzv46bOyv;Z{
z7Z2zK{vH7n79x+ZZnzy;ScF%#j=$F9ua~N6U(V8HleS+uRnJE-i5Lzh-oNk2q2Lgk
z{A<`QCkxew<=xKsK0JrGIf@`_Z)f!xxrrMJ4DG+(;#=&Ff%fKfsWCJPdRuu373UAz
zy(KesbzeYAc*1QRcJ9Y3#-CCX7!A$~#TJhE>V5v*p|ioH>yGs`SnFn#Ot_RAjRE?h
zaLl6a<f3Q73j%mYjxSYPsl&rxPUgol2?nW_yM9P6I&vTT$`6A2{gqJ{Dleb_(CPz5
z+a_A2q93~2e3Mb8^;mGM?d|ob<=Tg8iz=op8$TMZ+AX^xZw=@;#0q-{5g)D6n&ge|
zO8KCe{KDw$LhYrpHnvnZmu^U2d2cy6l4xT&2OQkH(OTbOmo48eoX|?(pnmfYw*-8w
zUHaJ}a_Oqjvd|2GuQmKS#@v(3m-AFu9IB)_O}=@7hTuzo%HkFbU2e?~&4@{UhK0z5
zVHhVhZ-!^9CRn#ee5TU28!ua3*>P&`_`1<I6sj11^^uN1<y&H<Z3N)*VK-yeTSC`!
z{SeLp1`$K*H68BD!H*VZ1~|2nRny)|nOfmj&l`^L$^N-kZ>ZhhKvUHn@&LlBN@m2h
zuB+TJ0K-TfUyrGn=MP>I!1<05i<X@jou#Ar_Fp=$JHHz1aDJP&_GhGeUyT^bPuhKG
z*}ifiUq7>~?)p=^`IsH}1ZF=II&w~Qw*@E0Dsv%%VeNMZ72~U7)^OAE{(COI3`W`W
z_qV5O$Q27m+rxv3cdg}r{A^R{ua?8EhQx)#1u^X%=dG`qYPt2D38FBayBx6=(7Ijn
zYe<NK<p{C!<OX4lwdE1wTOf(v_m0QdB31AWgY8Vk&ZEO`$@@FEv5bQJp(<{tfBM$z
zes!;%9rD=EFc;cTer2%=wMu0m4o=yX%$&pU3|O;j(16}30qe{A4ykWI4a4UcR&HA}
zvOd}WItDtHP&{~hT0uJD(ty|@vp9U4$fs<kH&Vjdh-bonFSPKl^i7(#hJ%;a7-j;%
zvo*q2PrB0Jof*`QoXw5`Y9}*!sgC_!43+f{RFH;Z8Kf{lN;#KGct=j_fw6%t=-ti7
z<unq{D<b<WmA!wCrQU`kHsc$sIiqwC$IfQgz7_B_T$Lax>{%|PTf)UK0D~cv3Rjrl
zZn6tyvM<=cB*u4}u{?GFRw)G6>~J1@T*1#ntCx{)BArWW^d5?gIE~;?A&iBbnrIdi
z$ihx|+VWn^<P8|-y^7!q-2z{*<-0Y`7j4Vuir^*w^-}rb$NA}AYCtAmzAfL_u)who
zLg1?HYZ71q1t@Uw<F4`Ms-~s4AVzf)LHr0Fp)KZD0HF#Jc{=dbE4F(R!6NT!MTij5
zZ-Jtp$6w7q6}&ZCB#UL)4Mz4`Eo_gA{vIzqM4-ynMaK{VPGdCATBNSWPFE@Njxl<d
z=m_@WP9bn~Z_x@L3*$M3ELn$(*s5Lu1V{`5RNG9D(vY>9lw*jbO1D%Ao3wqFl=-%l
zJ*!l3i0~Csd3)Nx6;1))M(I;oGG1Bi#4PFfkb#6ocA=~hPDSCNZg4MEp##Nw%>;d>
z9KA8ennK{~f{LyKJ(tL)6D;h5s*<Ol$`aKC7L~<Lq;NWADcN#z(#|L!$JZ)bt}1_4
z`}k9BU_VRxSWSiTtjO;P<<D@mk5zk7h-%q3dO=N<MO{rQTdrhIm1j~#<S7qpVhRPy
zlS0rC*ic9#Dlp=aif7Q(WH7gBISl}IA+W`ionI>9=%69gCL%cpxn~=dGCkPGQ!AIU
zDDEB$4O`5&ClT?X!U;`k>TEj0Se<)Kh=*LdsiBn0CS6;E-h(rGQYm^W?mEK=P8v;T
zSxLX|EbC~A-h)tW@?`I;CVks2{mC8VX*QjY+4@hK5Kl8R>8WSG5{Ox-3I%uqisNT3
z;Z@@llAlAIBO_A)LLqnf_DVQEcyLN%k^5rC)qqQC*YN6R_>V<BIQ=#iG{|%mwfrrE
zJj$2T3KWG&1Q8}pX5az^+rYPHyW7`*P5=Q1PVG>;%rK4aNN%%u4ejewW&k$x*eR35
z=8XHhFN^HVXE`~XLS8A4SlrDqSFN?YtYK;CZ>gkcHJoV%GsmRTQB(#rJVznCgsr*+
zZsUP_cK0ueDlf(=TEZnQhMdmf``K;%6pL8TQ3K`L{3+oY!tl$Ntag_oYa6+YEU<JG
zRh!HiQ-;*`a3WN&aZDlo8g>l6hjOkcU)7NOOutNq-irsm+Rp+}&)NrTs5s|V4o#6g
zPp}8PaTpu7zi!_hmMeYfnZx-L=RBTOM7(kQoCP`_B`;KQzf8F9@Zg6-HV>uh%{luw
z=SxoLBCVY5c`)Q;B&AXC98v3Zw!&u;JPgYfS<d#VQT|u6`v6%0n5*G0W^Mzp-Fk!E
zJ>iav;}hpmoGQV{a1wt4B)YHyy;yjqF}#Y*zQO3YR{}YlyAVQ#_NE^;GzLtUWJJDk
zEJ4Y}KYN+Ml@&5&XnaH1tVQlr-b)(?9=klB&s3jK`)=<%-+&hOt3T}-tuC%*UvzBz
zF*Qk!x#45l;vLHS(bvH*AkPmfXLwK3r&!YhyYs?C-Q(P(0_QbUD~WSk>THU;N+I^N
zLJ4mq-ktuiX8-!-KVLlm0C>Q>ik@Fs4G_d*7ZS@}ELQ|dn=YbS%^3&BLq9PH4G?*M
zq9nY6m<{_gTXHYr8+i&Eh261E9|PLC<t~Na2!TEhQF-2}_B=!Lxv$>M?~3nU8vO#A
z<@=oa6?*o$pQBbteW;Z^;u>D-#`$-Su6)-|Yu>z=uNrWZ$HOr+oLBbqNZD!$<`kDT
z#1qdle_^Pb|HB-sChz4pH&D|KS3YXq(y@a~0fbTrSIFY<6x4~6NwA_`F}2()Sxh{B
zWN7IUy?Pz0XnvEZCGQwA;%6~L6%$~Eux>ur`SD!t;8(N?iojH$3Mq)*Su5wzCh}-U
z_j^P?%<2;5CrC}RCr@ynU3Fd?7X0)4-0=y1Q-SH2WoRs-Anx+B*ktvWxV`9_6CqC#
z;VhRpd*3OhiQV$|Hf^P`ijt9GB@jh3$j=-LW*qX<4fi{($gI{|0=cJ-n-#ak6er)7
zDPrMO?m{u90(%TFHpICNB6JlChagg(OJ~+yi$BhmV`q<3wPvLTr+(f<U*h!rI4lU2
zOZ(0jy*8b?qL6;sDs8!y{m)+7tU|`Gf{c$greD&#Y#idx=EkxAPW=&<!S`E+XE1Xa
zn#Fi7%a~W7a<B~b2=d7etuNtvT@oq0VDnl$GM5m}GRWCwtG8ET0_x#1l}S~dLF{m{
zjsia4Zysa4gb1Huj}j;_Ea<#*Pyg63JS|hFU?KTl@=U=D{C;kDXXVVjcl-j4%_qOm
z;@%{qqb3UK&lm6{-mhtUaCu$0`+V1{^QjVAIgHmbes+W5_KId_i+|lKKA0&!79jop
zt!PF()#fn2O%~yFDxrI+T<u&P7?YO@-Zj6uowv*14p-RC378QI<=(R^-S1S3DARji
zhJ0GC>{MuuDbvv{Iw@GL>QrIcUXdzb5j&y1Gkr<ydHDt13dj59a_yC0&UOarnqC)-
zJ{v@E*<odCR{*|$Tr61qLqI7<#$5LzvJyMkKA#c}Wa-CQ4>Q#EIMw#IN4V`IgyTde
zocwy{MW+O>KJhKJjEIG0gWUM~kE!SDK4#T@Ywtj(>F>1b{A#~>AXpE0pvvTo{If62
z{vd6ZU*wwo2KQjq7eVw|M1y@wfxwHWma9+C!alNIYGmSn%rqcx+Z^zLem!3gSR^Cj
zFkoDgLN6B8A&$M`&8a*0gneFgL<`PZ$r+&sH;WbiL}Qib@j}kAQc<EdJ7yZ#fcg7R
zlSA0;Em#*Z>WTN#Pdc^t6WgCS|JXm<RL{j(`Jl2x=ta*#!{CeddZCW-Td{N9+%JT9
zQDK#UTQ6Qb=zPN4`9h~__*NI7wafU$!%bO-UG8gic1*iJK$!?>X-9eMX$Hn2Lk>_I
zVpmv7*+RsgNGx33z((9;<~iOYi`<FlEz}Dj>2;hvlR3}N0o3nvb;xl3(D{+`)%g#7
zC!G6~&cC|Yp>th>&@|f>5Gj14uwP)ZUnM-#)H!NbOcC)ml$#7*B?XLvkQkyu4w+rl
z2W3Tew)R3w&OruH%DiND#S&CQAsdK{<ef8=?KM&CKn=NzFB73gM#gpSitMGm#RtG7
zVU-`VW2%2QGgVkb`k^PO-*%W^sgCyvQH4&b2z1`h)sF)2N1ilA(l^^mnFIFcU`Ot#
zc3oFqF>Vlr+mnVB_eKzCf;Yq@t32MAc24~fV==+NH!(URjH8fJHVrKQAthiCdm7Qf
zHF16HbjO&G>&$Wf!<h#kXNpDMU(J~qyC}+f?TN9Bu-T-S>JpFgoB{#mg6d$Y>gEpm
zh;#secmeawrTifuk=-AWD18=jZz10o`Zq*+ki-kIt#HyWR_0Qnp>8Pu()3g2zA}+H
zF1I<pqB)^1-$x%KMakgmh-)U3&@*kGfjbJCDCHb13N^qDx{1mmvT9<YW*?%oKOyyt
z-mWYOtv}S?{D@pEL`{h)J;WjyDmkj#Y4uAq5z())ZeQ;feH|B?AH16*Cwy(S8%*H$
zsw`pE=u(Iva7~bzKrw9kmB{%RPbIN;wzpALpH`W~SzJVy`teJbicqDr3qYbph}Y@*
zi>L_Ey5sE5uir(#@3?*c<>sB<b*-Ri((<BcX*XE>zGtHc^etA=7XUKBaDsqHUwU?m
z8KzHRs;uC5FO}ynK0Q!$1?BQiC35M<O!z-Es$xsf8i97|1MOSUcdrXSFBbn4`t;qj
z->$Wrj5WRM{KeDnyh6F?Z8qH0pE>PP%EwSiRbKoG;y!90D{{k&@*TkA@_E_g<<F)I
z2hWQS*bjbQWm4+tfwCG#UC~yO@I@YBxGyhSG%h*@d7DOfE5?<W0$*;tKpyX0IR159
z#p2@0;OQo!lD_*}F9BUbiD%<lQroU9=}qKTaOy}H7k{Z{V&iiNR$IhII$I~|KSn=1
z*3MCMZjXd;EyP0?{NHyZsy`ZisDEq!5Ta2<Eip<K{OhGoR9HRGjbc4fJyoXe<;1Qt
zIBg&IyOe*W<wWgt;$lu@RCw*=bmHXO_9&><#_+wfYwtUgwdy~0Mjq_{fofl}ZwnZ1
z)$>cqe`9R|MBHA_%0npscDk{^c`?Vu^AqaU5nF`P$L?~=2L`FS&sN{mK6V3(WMANl
zUM&1FU$N(--*ngGpmMt3tR$BCbi_TGUsJr{FCXYdj|N>^TbZhHewlVsZ-q=X4hfHC
z=g|zg?=G))rb}=4mSf6hbyU_LY)EsQ)Kmn|l);a~1AJbcD*?!1MxU#$eDyFIxph2m
zrPbEKorbWrtE63h!#{3>YA%dBh1&0xNHK`ty_3YJI_G5_FJITnLtyCwd!?w2nk{HU
z8qI9=b5l6SEVKEailvdZb`lUKRv}rs0zb9Wy})k(le*3{aqnCQ-$l<<rz?X#`EKv8
zFXTeS_$Eb066N0M=kh}`Eq}{~oW|L7?V39KeM)>}c>ea_#p2sXGZzbRH#jA6JNyV4
zt2CQ?GA<j1TF#c~Q?{mBRU=*_Jg~;N(`7|TZ8D_NGz<U7Zy`w%CD1os_L||5tb97e
zjNhDcDkb6rH4Pi>o>i4ctbq-bxAF3R4~2KkwBvWpIOLM-DCvf}%oFAY4;zlNEK&V?
z3szFOsB3JRGgsD5Yo%Yq)foTT98xx>qjJWNzKza4tnc}he6?$T)o%S_YB1Rt)zQio
zFFnnl3A<Glmpy#)p-~A~#bk3KP2B{w8`R5{%@wa&HDZ2s0JXBvmnmM%_Mr2it|Lc)
zL)-n8b!taPoHZA{Sfr(GOv8W_kJ;>B7Rk+}bvIK>6UAA?Ml6l^zX#iJ4Qz#OVIN|?
zrB9XRkcaVo=cm&6Wq0ynn#zd4-b$}}k^CXdOQk7J28M<nYu^!(7;7K{3NxY^-uRp$
z2$q&Z&3MfVj%w~LIcETV2W&K~-skF@vbPlV{*t{;6jI@KYwptxG(3KnI;kWQ7&lW^
zubej<_p&Ja!?oGYo1b*Pu@lBLebCQo4aY~>bLnDrVN%(PO?MGH8D4SfM@D+#U&bzo
zo~-mSvK(#a@AQ;ebG&}m93?tl+O8)`ROvGO#qU+1xAtn%yzyvpK1F;{wshYp%Xqx(
z*U^|U7Y&jj(^&Jsdc;Pr^T&q3i8<ztNUd)0d!w*8u}|Za;CSi980g$4i%Mw_(~<qv
z2*+tESRpuGp<^!eI5s6P48ifF;X5i9(+Bm^Hq_7{o>`^c<+BM+k=~SmyG-M`L`#~J
z3YR040!z(YWU#F~88;XjM65;q;_vUx5p7e%nHDIO=%nBjZ^h#>0hODGThl#>%5yl8
zY9d@k7>}F?l@NxV(T#J*Lt5u>cjK^7<G3Dk?zw)Ulnf(H`9^V@_4%>Nux`+&w5tq3
zm{Zbdtu7t4m<w^k0)~(w_1lX)`R61pwy{uUl9*G6EMED}0?e*j&FLeC5tl-aAAKwl
z{H%(;@Kj6x8P=QA>tZIM)uv*$1R~noxqpw?V*7B3^IrGb;_;$wyl2d!=-m}lZo7Ua
zse;r8N1K&1^N9HCQB{z;iKZvRRxEK2<w7PQMVimTt^DUL?`eBf@>~@^)qWn!!1(o{
zLG;Df$8)$_znbZ1LT&C4#Nv2;v<L7K76X_#YIsL0knebi%I>x_pU<DkuP0<N5-DnT
z?yw`#kcXexDc22Ppic}}woQ<wxGVJ8D^9=O%RCW27odN+)FO1Bo_<`c$gX7o?X_qL
zf8dTWV|s7>=T}ncnZ-vgJQ8NBRQ@NrTUGW_xn}|>Qwl&5aAZ+PvC`@7bJsVwu5+##
zQ!-`8KEy&zY?597n7(ZVuGTJ?DPZ2McDJdz3kUHi4lfPqdcx=HdBjb*QV7VQH06f0
zZ(JVi0ok4Q?!r9N&aVY$&qrZzT>qn;?RyZ)#+JG8EN~&vzf)2V9OwT0#SbBMk?z@#
zzP9w8wmZQAG4E$T1w3oMeC3>p>b(x#e76?+jXdxC<3X#{x+gPF7PS+SvlpGT&W(tC
z)D>2B{Q)XHwNi0~p<hq24dULl%hU~`vfA&D@&Omn3=C=+T+AbUT|M&OzZRhCe`?<K
zmOhJqQEf>BTkh#H`#z9pUv~f8y3pu9-0%pcKL=0dKf&{}AyFx$q=_J{B*RQgxWKjm
z$St_cc6saK&wOQyi?q6?FC@W>Z4qVZ^U90S*x?r2{hiuv^?t0H#cjn!S<AMd`jT3$
z-X-s`O-A+vJ0$e8c(J14R_9serh8ks#iu%@uRPO+^*hcKACfEZNDA}sE9S{FEjqg1
z22I7sA96IlxApC6P+*X<a!fB?RXU;wy@6=M9wR|Rgt}|@m{Qf)EF+ZuB=o0KsvV8l
zc2Lh}uHj@auh_8&Ov-TKldL*<qsk}DY#B}&bdXM7Y>0WCW%8^#`lP2r@;VQRaKa^p
z>~lS=lB1b_RAK|5T1$TauDk9=T)c={<TVrJD-3ta`?&;fr@Wue-e`I@cKK4E!Zf!K
zi6TG1&b6Xu^l3Iw_1Spp)&A-SZfn}x&a^pTSaEqEYvzIx+igUQ3}{ZY>t+`+Z7OOE
zinK}?RvI8=+>|I68G`Q_Z5O~J6pR)*0XjIdBDcHv$S+eldmY=POHaW#&XwtYaZf_V
z<ytI!@zovi&E@nUaF0NI!`S}&cd+YWHOE@JO~|7hx5Q5wJ<gVn7f=e=w6YgHQ8wRG
z4I?>rgHkP<<S(|(be{8hf5Tr8!ka8-jk$9jASO0T)2aPF4*H-mCrU}62!)J;t}o*5
z>UXecVj|$;f{4UBrXBkYb2~$qb>O3z*vsGxEY~$e6<3G#RDKqzCK|8R`xw4hskwLK
zb%X@}rvYh?rJ~Rm4|JUq$Kuhl3+b4tQkP1-0U>Q97{fYY{_-?f^F9ObMVC2LR8Y}i
z)L8iYWdlCPWT&)br~S!*3y&VZQ=|_IeQ6z;2NiCz2rSMqqih)8mhI&k%8x@lB*$sb
z?98@8Pp7$M?H(Q3m~s!qv!(~Z^Bj+rTXNvP-rd%if=C!eEVV?z3Y?U+R7jgFMO*Am
zsGzxSre6(?xJMe4hMN;v)<-tNzgSKm^oQTFm+hzPs2J7)shCwz6iW$FcmT`h=QzVc
z)GJWo)K;lq3NG3LpQ3`0vSL0NhJrjyKX;i0Vxpg+&-5<GarQ{RBEjzNg45xW76WnC
zUt#!jaRs69iAjRK-<|!pQCKs?L3aQ*0H!hyi7>I+w-MgfiV!okQ{3`d&Ato4-u+e)
zdr>x_Vm|hh1jj4`mp2KBLL=@Lz&9HJb@80JrdF;#iTQqsIXnrm1BuaR5^9^kk#Kr6
zHGvb6#447kSOSixm=t_HPO1mn`AjD^eKjlA*8N6c@y_5_p~3bDET1vVc2v3R@0hMM
zz@9U(6=Im42f-^zOil#i5hm%H47jfq)>@U^5eB_NV}_6+r%B02gp{Fy6dtmu+oL<@
zTN0ZG(wsb#1M$qtG@xk^XrdLMx_LuB7#PODCPYg{k(kz7VB-wHArf0(5PUKWKHrf3
zCjqvlo&H0X<9P!B91K+sf`$=7!x%Dvmk<>ArIl$f=^(%WHBAPhHxLAn&hU9ukRjA?
zyO5Ub6a+s?VEOSChGKxtHvj?%36S$iM+6p)71+^Nm~uG$z$TLg%k*U#CegsI6%N-8
zM-)nAo&R~v$VX+B9n1}yWaZmrR7zw4mt?R2K$X;FO*sgQD)1W(wnC#%bq7!I=Ulv(
z_plM{l?b;;grBrYQ)OTaYsfpjlE;gHId;oC&Ul@Nu(+-iC^E9}p~2^U|LUj*ws}W1
z<^TfBv;nY*DhQn6m`A4w5$<8z?mhf{@5ts}{=FQ_6<8MOua1hM!b;2w_-&!v<pt7}
ztb7bi>2ig?Lm2r;tmma+^q#5&1MFTnyL<znkOrLUW{Djvtf2viF5TR20LV~N#{?cu
z%B2ns7Us`943LBAFaXC_U~dNVt|lO^Vw5{Cd9DWmB+-Sx<rKdU=x$T*d}&5<WgaK7
zj>7==;YV@^@DS%>5YsKQ;%~XR<j2Kay7HO7nP5(0RRl@?`yOLK#nR>_VuG@Kn{2|>
zC^NrOj-O23a-~Y|rTW54<lZAc(wJ__mc8~V=A#xU50$9_A?joft@p@HnexdmC6Ww~
zlhx(S+qsfX<@B@rE~vYwtIx-xx%Ar0&nJmwUMjR3Lgsv}sQ0Ph3u1JBTyb$oaKNU}
zRj_jPY0~BD^P&;OHtv;v{*Q=6HXAgTHS42~!D&(Zj_c^kP*%tj_o}-|Rf*MA$wO7C
zt5xZ&k2B@}M=!OI6_UZgBH8drm9^?4;5e&Bu<Ala?k)M6CX1S9{x$TRW?Oa5i=mp%
z|H(_$<&xfH!md`YdgM;}JFb&h8}=Dzhn{>~rT0tgKIn4kV(Py5|MgOJ(Oh#wb>CL&
z=5*^;<m;E)>%RNf|5|;rrCWdCRKK@c|E;?IK)3$Sem#>y9UrOzXxYF#++auo@R0y&
z84X{Dfa-Gq_Tj&3D%Y(#o?8IEwfYO2OtChlZ-<a~?-fV~1gZnrztS32piQbmO%0oA
z>S9e=$xSVOP1?gvD$WUdvrQ)zh>AkZ`j$<Xz<lcsrIOS}<AX+1p}e?~=3g_-*2%{l
zHZ_ee8Xuew2$URbc7QgWI}pG?TMUw$gRm_=$sC5a0QNO4rk4C}Yb_26Eg7oMF03`v
zy;MuR=O!=eTwW+_L%4isBt<n?Crj(q;O9}ZO%Vr3J`{`pTH|U&%hk*lALoP+g|@Uc
z-el*N!WYl&oSR8Pd__Xd<qujtDWv!VM0SwT*(3=d79Lg5?%~m1cJRDJ>`|t3OOA76
z`tS>X%eEWC&x;?tC`o?a3eD>Zexa4zUg6wv`$fmI13AG}&Q}d3o>@Fo(9Y6Z?fo?`
z)Da!VYcEJoUr_Y8UM6>>taZ>{bPWkT8xiVMJLm`*@9<db`j9LmJH(mmjy!TdW(zkF
z?!Z9by%V`Z*HJT|&(IM!q%ZEza{kh5`W?_Uzt;Rks4D~7!oM!SY4wsj@a4{I*W|1)
zr_0OldSpp9ayYI`Q;_p2oMW*YmaZwY!4Q7?4YCm{G)?0ucR!udLP5`w9ibGSTJp(Z
zvVeY<{)1i-MGCT(Qmoo5V?_@pHrl0799?>`fl@|Eoar{q*faiMTS(zD^0S9#+a_~g
zFs$@dpNa>?Ik4A~t?5*4FE*gxI<QYp_+<m4-*#QNGPy5ZY#`+Dl{RO^A|XwtB!DfR
zb#$}%4<g!y7;smZEUrJ05!|Krp#Nq{)5F^S!Gq>Ig?&bB17lBH@6o-~$eN+Nb!4t1
zMD`|vS_!t<0e=i)8l#9eV_4%c9CMVwhQ%RS+kr=i!VeA`N$Z2EH6tbKEl+A&$Dyxl
z6l<btMbEx?^j3ewF$C5|6>Ui7TtydO!E*Qtb2X!eXA2RJt%kaYBd<F~vLAH4Q+)l+
zrO!(5wSC|SmH7I7?WjX3hr7?|(O}r3JC!As3U+0_<vw~WJfLv@wPHxuCY#WA{jo#x
z=)s}Tbl{lKA11{%aSP}KN2*LenyS22d<Y+eim_d#O{lO>qCblIkODa>IJ7!XX*~&-
zyo~sxC>hfJXmu9J6*c~cJTB-;fqxrg6@Q{QF{S_7<gf{z-F?iI$$9lUdXzgDmWlwU
zAq-sEc^5aC9chk>n_x!*^Hva>>o=wqz#A^H2?yX5?i&*0I(0NRDbM-t>g#t7VsD_t
zn+}<cO@VKYXck%`N^RF*J|v#&?)Z(MyJnMgUQ$}r;vK8nJL^B=+S^mv-)2~Y6$cv?
zMY+M*RKuk*umx3ODMpzEF-_Wf&q96)8DU}(WBVM!)Rqa)`ZKfWJA<2;=~Vily{!W1
zf%emwMyU{<>jk+%kz3uWqUthFpE$<5GT%qB{e1d%$JUlYbu{Xm?V+DXJN4-Zt6?%3
z_<)mXk-%zAF?60hVd4&-Vi%ZlWlks1H}jzly`(U^W9Cyg;B&5@7_Dhc2Ksw9HDcCa
zZZ_<KxR_J4ONFsQx!BL?9-n`gaaf-<1e0OcX}6D1G-l;_3F~=f53H%WaNZl(XcjEq
z9kkVLFx{lgW6jT31YbKDHG#voaMG^)c_n|Dhgsh>y4Afo8E&M^xiZ4JPn!Ibjo2bh
znj8tpbxt@2!*ri4vXWuCodZ&zgk^5SuELotHc_i^>sr(s*>W5=hYIq_+}qdEKew=d
zbySqlXIqwL&Upo^H}M}i?`C~@InGWr;O)rh<epPfsDvjfBT}v)SouuPi*OCSds9w=
zxqf`ZEXGC;I2^CBMFlb0OnxFZ#EosegNz?9hm=5ksBikwX0Csfevxd6aGAFhra@N?
z;wCfCmoM@muoHQA4{4N=V3<WWQ8FLqmVYgg0uxSPH5l#FNaKusg1QxCO7i&1R|4x%
z=G*>u_rvW)+9-VNk%8A7TU_&-Il|-?6~xRww@(F4cf-zFgja4XiY+e(ltAL=*)*PT
zoK%BklVE`Fuv$3yHyRdh%t8NEV9kS}**TTIP1N##i+}yzdqQ!H0^5h*&Bm;GK2rKH
z{}pvwdD;fD*U8h!3#N|)Y8PIVAKN~naa={Cy~Ww$ZJ@|3XcY$f3Po@hV@uy;HlzG)
z^#0_AmBYcg^n5Q(>D>klYj_Nybi-`<HqRI!ilos`x$o|Ee%o*dC4JaE9Sxr*DE=(~
z({^)%OwXELzZ(p5%)h?gblu$Xy3cW_FP@{#hCLpAMId-XX8Bvf(-L|m*!}aD9~-<S
zPZUp5pcPT?t1{l#L@9fVfAe_y9X!X@xy*Eu6DA#F1bw>6etLhDXLkILs@erKOE%iX
zhM5w?w8^Mi>Zm%Ue!#WBW{ZJ#*vvW-S%cvmqohDL63-45w7+>kuICt_>!>y?{^J%=
zFX?ZTyhUSj{lqyOHEUK1CI*GMKiyq)kH4_|%3){!)q=K56H9b7;@vm45N=pqG1O&}
z-Q8HuX)d(K2x?k>49aeZWFVeG$VVS-cyRIih#G1T3rm9Ypr^8RuTP06PClV^N_T{v
zXj`rw6!LOx;4!*)ro!SP(dLtSmgTt<(Yby+<@ST0%Vaz3bX^4OzEVjhz~DK~gm<bc
zqq@0UeBUjk0#D6nCVR5kKTJK9aGOcUZt``^Xe*e@Bu&CX>es*t2)BxqPL;>EPkj#@
zzq@rs{W)S1KDX&kiDyTe6w<xao&ac?e2+ptBI-Ujk46^ES3A0G`}+H{4TJj8hbbhG
zQpBeR4^~@+d3l+5E=5yFr4s_TG>1-VK)d96EhirYxgDOc<x5cam@EuGHE}VHyWRjK
z6Fye~lai0ANIljr&KXO1<)pjgsZ>y7)A9YtuWi><N9tx_`atK;)pUcQYQcxDa#gU4
zhbv3$xu2+2>U+S!FE4K$LKX`;ogxOo8*wvo`MaWWvYLCWz$8_v54K6XPORh9V%Y&K
zQ<v;K(Ms*NuvabVsm*@+iz^=nziZztWi3z4W-YBTkw`aEGndNuZZwxEj#IPf_AB&;
zrH2j5a1{4W)|y7^idl+%w}FNhNe_r^KI>_hGlH=FnJbmlfCTQmKFO?@kZhsPDJ`7O
zU{}}hoE7Jj74Et1XXf?kTqbpc`Hf1)<YBmVy?@Hia)H)-VkyaDWH_*E!%DKh;_&B=
z=|fq`sdW5tG@Y+WW#kg>>#)!bmez>oR`sR8JSOT;Zn|<+T*a*SmsuUedP7y~fnxo=
zTIYV0-p5>-=&zQqAL&P_(4T}UGTJ8LUPLk&LDX`RavEK4eva323tz5y{z>qXMkU+r
zL$OE27L?hZgmAyZ#u3$IrJYoldF*P#7e9e~KB?C2<+)&F+v8btX|ajZ(G0Fv&`~)y
zEJ7062E)aXQ)2Mmjh{koi`ji#c?%u;I+MjXzq#glg~)}NrYk>$a`VolhhCFV9vEt7
zi!!6%Io1bTGUq^0*1O5KHXyq1V#0nrqqzV6f<s2NqD+fRhWWE*1dCJO_Tu&~mm<$_
z4?cn)OUw`6{CvC9Sj{E6P~bTU=fCwRukFiFbI^@%@%kZyGLJe!hE*IPm5=p1=aaOy
zA<Ie9A&~p-Xej4ov%(c!*S_$yOX93fXeBEy<srXnRN?t&A~*G4BvPQ~cfw<n6-2lA
zsXCCg-UKz>xjh4wR%*kZ8g<Y1rF0#s{r7UogXS}xl4<j)x2D$$FFBRcV$OYQlX+u@
zd;a|{pTtJG6aAEG7|07=p8zcS#E>7OUkW+ZYIS0N^O@U9JdOzgJG#9KE)S{_GQltk
zD#vEQb)dN57c6BtB(Zn0L>`rD^JRmJaEZV=lbBHEBL?oYZDXSP^#q&<mD<wpF?!eV
z7~~0$*ESMojz=EgAe@X`uy30&o_E9H(SFY}bE(WRW`a%@rByE!t0j>aKG@%6m`s-q
zu}C!kAnxAYn)&oeZ(wY&iAYO}NzO=5((k<oLoGKRNq>y>m%Ze5X|zD{6v;CncIu%X
zeGPgOJ&NL&^OTg*F}HA-$jaWqiR=f(f026Sgnh6W1*8wYf<h7>R!eG{{bt^wRdCh>
z&Pwe7RnK&-C@-G-!tB##>GpFX|0T%RW<K-etJW`Bs|}uBF>O}9nv?g&;(RqKbWZ)J
zm-?*j)Rh~P4?cq~YWL|_|F4(&zh3II4j<*4Gs72{|8FmK@Bfcp>R}-O@c$7*72p*S
z5)=~^mJ}0}k`VvLLzPhB|367otdg-XT}8FEFgCNawLfj~pD?Q3KQOARGaW{?r^BfK
zsHm5{T>nu~jeV8>QBnUd5B2p`^nZD%|E~t>zXPar{q(=+Q@VS4Io|d^=~MlGr%yxw
zrJw#6eVUg<@Ju%Pcly--U;3&4zx2~Png0JqpPu;-`ZUk}zueP^d(Kt&(r51lUc2uc
zf1gY!yzmcwN_S7`=;^0_p{Mc1-v8Y_O(_fb$34xe45rhkEtL=G^eNpv-Fb8^x9S>Q
zKmCV3rMste^t7Xvv|AfVr%xX~xs_QLMb}UNMV}JO|C@gLpY-Wp{q#pm(tpyYX$@^@
z|InvD+Oz2NY0LjfpT2lm@NfF*ga6V`dwWaj`%3;@KW!d(G(7N#uAjCHJ^pw7bn11(
zzXPc6sLkZ@mcH@jk?{}T$2)(IKbxIsot&KPn`-~ZK>ae+^B)ZAn~wRnU33X`;9b|w
zO#jIHp4Hh`-)0A?ANv2nQ1?F!OnqFR_%yWpd7O@+9{lxCM}N#szF*jRzc~4ihx%!0
zdVcBK*QKSOOS6YxXTPj$&98o3U0waPI=8ew_j`R|<$p0$DAKy4b!%ZDTj9cJN88Ra
zwal{Ey0iVq+H_OE=h6QOLw)z{{=Z?Ul2x$(z)<=B14DJ={z{8w7;2)$aXV;daKU}G
zNpZY4zLwnP2Uf*!&@og`PU+Q#7!H;HhM|`I#Zb#Q%t14raXP%07O(5Qr(>v^1GGh`
zO4Wa1sLXScFtw@%DVVkPTs-?(w@XX+`d*t!#MzauEInworDLcP|AC>VvfKRBp|D8*
z#ZaXq(R2*8luXrL$kBMM!GBr(FNUg4$501ZhIFL{LoZp(wu(b5gu;_nOg>x1o;H45
zcYnF&!OAhJM;SP1eg`w#L5ejxU}$}9w#_g-W~>$oPcf^D?2g6yfvbAz#m{dOxgg`Q
zccg@#;C%^p8A+MVQz5-QEOkbpA>vVrvvTdaTP5QY;FF!0)EC{|HT4p6T%dMdo?C%t
zgUXgvWrj1vJ2`48pewi#lSbQE1(Mh@3&F1$O@Bxb%x2UW*-&FBaP`B+K=w?cZ9Nj>
z443s=2Rz2?4FLO}^;l1up$Y3xt>sd?y&!^_HtnY+IAH8U+VLbnz2T;$k|jE|O5f&b
zg{12cMs+N3u;HloYyw}9;y2i^GFNYi#00B8Rdk58Ihj?37JFKP6xd`c@}}V9_VCgA
z@lNOz(0&r!p|2IOrFwypvZC6@9Q@31RwLv|&926oBn7|2+0zoKK__jJIS%lzSl#w|
zbShtb2-KLcfGuhX5)K$Ql!IiI;j*b#j4Uk~mRAyMGLiTL(Sr7g0o}Ery2!5!=Wr&|
zM+32aEGimw47Jc?EJTc2SJXT$dAHtCvckJQLn<D#10OmA<&Gnez~!+7yS=jsgxQn>
z8G^ZyilRQl`_C+O%rH4f!cCA|9>HQc{dcfJ1n`jI`zJoq-tX8Lz?lb_tRDb@b*%Rh
zKMRo-Plolvka(a?o8T6JdGs`I<Ab~vP&tskx`_2E^C;^QBc1GK!_>9I3CA(+iD#we
z7=z$u$ru0z&-B$_mfNPSTnfciYeAeE_8{1~Yh#%FK)YsqZE30`L|hQ2vFZ+Cv7`<z
z2**tOmogw_x^&<BIICf3*jL7#CfadPOe+PDv@ImpdYPaujjVfA20Q>%A^sok?))9f
z@c$eCHLJ0YeP`@r-*+)%$dW9jsKi(jSt7g0Y<7i`RF<JlmZDUWG-DJ>qQz2VETNFG
zglzMj-k;CszQ5n^Z}+eFA8;MlaUI8boac3%ujlLa$UxrWYo~VzZZ1J~LzSclm)k#@
z%)`2<)$*`I+EUiHE`P(^R+6&7$#>(#tyxtlZtj}2!T}0Bv<MFSNCg`3K}uzV2H!Wp
z>AjB%xAEV2Nina)diygJ2ooKb8+&6!&q&WpN=Uai2>=<97v4=yaMeUx6W18Lek|X%
zLz_fYeQi+RXlB)Vm9yK^eucNeGhAiPY=>hJQ|`^0gS^^`c~MF+63qMn<2sOsK`Tjq
zl}I)_xB)Kj;TG5ipnon66qsJ-$ZseJVbJq~+t=mWu@-@Z3mD|;-&@xJ7attpTqtu?
z@ai5dON&XxIMzn`3WQJEkTQDI&bb`lmGM^D9Z-r`3~>I0E>YNBR!9GCz9$Dk3X*07
zZ=UP({&@MmeWFHT*k@4Q3L@lI)N{dy)#rT0c&jiz*|5J3Mwt_Kvao>RMp?^G3eatu
zO=s96@)}OuPoGKL@~k->+8nq4V!$B{HKeQad{Cse_|o3$5N+#y5LjyH%h$Prvpe_G
zuRei_^Bj3~DWJr66X<_eD}C%XyL#>E*%%bT6;*Xo^Z+a#ne75udzjH5hkCz7;3=si
zovsgp5vr-mQs_5z0}u>uS0Q1yDMxVa?1jUsB2V#}d4b3J+df>>CCuFDIH`K=`TLiZ
zG@q7t`wJ)hSMo#jRf9c}+pazT&>w;I@v%)WbiQHe6^7(_JtSzJ-+mQ_wC)^1CV!^$
zK4?`?!)Ds28$`YsTdX8-pKIDU+2F$>v7~I7MpAy!1c8fwc@daec3h!re0*eR&lmqg
zE*>?be{`d=+Qd!7J}LO9T$>B^879ekqb%jW))=Qycia+DQ>2M_*n!Wk56rT5gJcBP
zi~J)Z$u=wKqr2I;j}z>o*e|;zN6nQ$)EN8cLbqH>#QfXdZS>%e{2g=9e;5)JL^}F*
zn}&QcXaJV$#~tVT+Es~MpzL&z?<ZcpqHtD2QT#?xR){uYg-7_C;AVeORo{{g>|^IQ
z?qdTd!`E(|j0jXo2mHz^s-*55VIHpw=TNXivntsiVx+&qt#rMs8pV3?&C<R0m)4KH
zF;Efl)u{v3);$Hsoyny3LRn+`?{9peU(i1%i0kOujd~KK6ZGuehdp=pT_GB9@#COe
z@kid?2H!YHlV~Q1T(-V1%60>ykYPv!CrbJJT1-%&dx;Z7kFd^ht;70tPU`dA#kh!E
z<<q?APxfPGq=|+@dDv^pHO~B<q&4ADp!)YyH@UNl{?=1T@e29-MxR}|XPx;nv#Hg%
ze)PxJD_p|yv3N32V5&Aod{Jw0=FY+RCKW;Ccy=RUSf{|LxleHy?eYEG{V)4fZ=~yd
zeZ4FC<#$>82_O6T_!f*JStw~DP23eF%w8k;myf*&>pGpcpGmn^bn;lKB|OftU;9xB
zxb^rCFMahAsJC1NSIO=tL=COV@3IX2PdKH$pe6<oyCSbCNB44&JTnw|4YloLN$qD^
zSf-=quNA+*XjdioK~B#8n0#*Qp+LL8a(veNe5KZ~DK*|T=mfvvt)8?ysl)|3!L86^
zG*<FK?fF+)@rVvKZv+iu*v~_zt~sjI+~+jnAeGlx;=QEqqJv2RwdkYWces_Fk-Kr_
zV4-w)Q#ub(P*=>=!XX`mPOlF^?%qQt*tx^71TjTHp3OrFga`pFQJ78?OG3^A{|r>6
z%`~++v0x80R2aI_kHBJJQ!IW>bCh+zjV1P<fqMR_2trb<1dmBhB-u&I^q8QqOk4>D
z=8S>)H1f`4;6hN8!jwn}6%u^~YRWNC8}$w;@<xA(#7Sm8Fz^LULgx#8pdFB~wf!%?
z1P5+rMh}Yyx45rRPe2X9kMs>d9VcRjvn~vadNqPc=xlwAmmrvn3i!YKk(oZ6eTgk8
znmLDZUdt}_$#E9Sff?qMwB(d=3{)f^m4l&5^67rb`G=vF=GM0S|1nge5J`SOkWW&G
zuSKwZGcWT=-u!A_duZMpC&fFBw$2{85_E`T2$BwDa$)tCPKQFy5#8*BhQ(15N%`OB
z<aeXdRFvn9QXy>;Qnv*8*&I2K=Z-V=I1z*#F&A3gyi|fL7%weYQVi2;<lP2%^otMV
zyoRtJaWTbx_dNK0^ugFdGv{a&iv<>ly~HYnD$|l=6Wrn4zEKQS{zDfb6Cr7jk84K%
z$3VRtFC*o<%>sK7g18hf&xu1d8wDP)z!WyeK-IVXP+joPKn?h3pkjVrQN_l&MTfDP
zxwQJ7)<X2vI=#L?%-|*ZW7D|V7B1yzU4=#gIc3NrR`Gjb+vraS9q?ta;$=q)d`ZOF
zkOf|X-~z+!&?4MZ9cGF-y6>wYKR<_Rds!MwaeD+7U-g9CM<L%b!2$z7CI*>F1%&%S
zV0tMZ2%N|<P^o;#qU#Sf`J(%kxIY;bb=rN1#_1TjtxP-4H)<aIXmWQD^ZK*k1I#}I
z)iC%*1P-<~<ETyHWDY`JKGJ@9S)YfZ+hXDN(oTmBvUzp?ng+z@`w_%Du@i<Kh}Bq4
z3b&Ll00w(Paz~Ie9!P$6bSXrrf^PtHO+(1R1A=U-sNYO&GqPPn-7tvbXo03LR{0c=
z&i8}yuRC!*$6U{m;QWC%KcB0NZnO%f=)}$3q-k76pALV$!Y7$sS<<g{=Zbc(#^v|I
z`#H=GHxJjC3Pka3{z#AHeGY)S3}l4~m|(y+ehNBJ`Aqsj_X|sP{|7*w$hl>yiPYu!
z2cQOE!2E?3umQLn6Fia3HQiIO#HyZQ-M)|H<T7~ofIDM9IaL+#k=oqdMzC5Vm+%o+
zxm9r7X>cZ->n0UE{0Mx81E3<W@e5O3?|?tCY-GsiUi2G8@%#f&OFXm%a&=c%O%#y6
zZfrY2WkLjD>#oEW=vj3YoL;5Ss7V)wzQ9;I4Hj5qg48(xY9Y^8YV{TiFu@}<e+dfq
z0}dXbM3%r6T6MMs2+#+K;02n`)a@14)_tuN^8jV)gIp|;nY2<}7O;l_2cZ4|s3<CD
z1%t%;>-hn&2^Dz1RlkR9_;kEss5bWn25ZRDk`sye@kmfa1X}!vcS;G;^@x`Ppo&f9
z2OUN)k#!{Pf)-sg9`!55B;TL=7-!(9VMvJ3hVm>}+P6F1-^1UB5$`|vh)6ed-b3;o
zdIX*~tSzi+@Sv67M*)%1TvI=5J(z--)H{3npy|JL9RE~T3#okK(G=U_5tvv39{_zn
z1H5I{_gfbK)<CLI{{g7B^9=)<w-$cpzDArH=p?i{opCEc@=5NW`J6X@m;^O=B2`5g
zn`_E1su$@mRg-~-)?F7w-hvoBc94Dyop^fs=2H)R^B$@Wt_ZsLv-S$myw%u@`&J*x
zyaV6`F7UP-)XI~ax*7N%0QEq)0GxVj30V=Y^;mEFS*h0TEAw||3VHbPw}I$-u+XDD
zDxc<YhzV6tuCX~1|BO^8Xo3RmQCsWhTN`Eakm~sttrVs8AMEwRd04es$<JfLfy>+t
zhIwsZ#kS6GkHA!rB?mx7fj9u_2g^rr09N!35XJ+UYz~0hShq)gIcilr!+gp7_G00k
zg2Qv6rTII&ivIvq+%e?ZeEr6W+uJ89cE7a)5hNA;7Le~h0QI%XA&?<|QIeMGv<6t%
zc|o-4(ArIq;gN^S0_<=aCm@PQ6-aT??Z?>8(i{OWzwGqES(@7{{yZSeJ&Q-lSu^y(
zsM%<Sc^Sj9jbS~?ut{YU(FBAJFzkI5O?MbhWt}dmj42Y`VW)Gqsgr}DT9(DR@xAsL
zmA?pZnep-Y@$s3p@qfd-KE%iGZ~exsEKcs`>xeRWQ`fWB$SyNim>1@aMFh7^K0GD@
zoRrUq#vF~5?VehGqd;W@Ms%5%89K3dAZcZc1tip4yZiE}93`JIf$5?~Ge!w88WZYO
z=;BA?btAy3sSGNfdlcXsfbxBb7NBBawgk9EZ?{#%`GpYVZ-PK;uONs1UY|#9P~Xi(
z3tsW<t@i9OPt|>tDsW~EoI!(x>UW48@$AQg!xmt7Xjd$e+-xtz1At-f`p&A?QEe3#
zM&(K&2nZDkV(`cU7D52aH&+I`itk-tkQ(R267MoX8+*@8^UOAKdFgimau>d&zBjAy
zHfvKVqcSGz8BcPM{vHCN^gei%U>l#%Lyr#|qXRc$7~5rx-BiYzI0iVapL6OeM>FP%
z`x{(8Ml)4Mk$o50sf-6Sfxc@<5gp_phA#`xU(VtI5AbGjx@%F$=Txq&M!tmwfqWX`
zZ@=J@D?gYnSit<8uV1`_=SgqmgEkGw%MF$gIa6>x_WE{%_Vo{H^QzIfM+*(h`t8i>
z!N5uWPr#c|JotJlLoiLCr$bNp;J_Y>$1xg#qahA41q)D|A}Hb-Q?R-aHrUA5N$c~+
z^Twfg_VD}^>c}2`q_km#LggA{!AA6vc%8voIjP_@#`|jU1j^ma7Xjf%)8ZKyGGTtv
zjCdf*58(571h&?Hcd-|nl#I06H=N}mz@d*FqXjWc0rKwfAv`~X-uIm;*aUniTpSr@
zH;fff1u^~H&+%Lp`-Wv-e*N`clCp#TRM`2&`jf@ZcgtS>wKRcmsPTk-{MP+lZ{8z&
zc6m50-6_n`!NTFaXzqeE=!gzdd{OWz4FOi<`99W%>_e;q(B?wk=lC&j(bsvo$?O2e
z7p96EcziIw8x=8me$1dtZdk#F3ELaRAO+t6P*#3lXPKa&{J-`g@Wj;7e%{K4K81?!
zN)^*&At>YEn~jD^^93HnPb5fps&7#+AAp9jcwiR<qoSdQkl)3lct>@3@ZSX|<)&G^
zqsQ>DX2Mse2h->FB+Nun5A-{vIt3K-JJuKi3!MVG3-|>TN{=QG@229#cH`f`^l}vm
z!ixl@4hrS>3FhhY#MsQ1K9IPoa-t{+#Ura|jzB##q-)d%Q*3aWP$5boyk2)$eSo*V
z{l|5i`DRW`>cV_W#r*#nhWb70n0?&z$Dey16a|0|sz$5Y)3XAc@95IWlTHc07n!=h
zOS~lK<msg$DGLwmez)(hs#qKhU_6?|Cp|cV(nh8B>8NU>3}ly9e&fL%uQk@dv#g~e
zB<rmq3v`IZV=JjQ%F?n%3+bUm^iYhKvl_iiUt&5velz@^vNQ@hwH_{qj&YFFofS1f
zIkeuYrRypwX4SlsVJRqSJ-*6azHGt)P?gp!+}ErWR-J6uGKJRc*sBg7WDiy{tbySJ
z-=~lGclansy0-su9sP6omFx+=_1QwnkaR|N(fVoIb<+=PPVTU0u9CqXU3k5XOwWyw
zf{mypS&xF%Lu`q3!A%#zwdjI1;`qjEgH4^v%{2PvMgL7w`lhGe-`rQ5#qOK46@PDh
zSivuCUQ>{LK;wP@^g9*I-b@$h_xMxuVWn<-twCYy-GCD0;;I)5yv;&qP4HZqy!>!{
zr9XQ6IeU^o-_|*{ZK$x*@^JgnLs^~B6kom{y1m&1B3XB2<&op=g@D}zw&0JE@twQ?
zBUNMdY5%?0LtU@jUlXJD7RL8}v-eo+y@7)6d4+!%>SiU|*pQvz%ia=1D*QKwO492t
zygu_`;y)PbZJ&Wj4u)zHH9b5q<@o=>P(?=&6aT?b?YpNSVxhBf91L|;R?Gt%DxiA&
z^PJ~xXaAMZPR3RD8mp6@VZpecN9vC~iQ1)o4*OhlxbB>))vAMXN!XVMr@jp?o@j~T
zV5l<ZZuARASCD>u8(Q*zRRnD(ta?X#({jZ0LPm#|r`o+Zk#(?-VPN-lle06U$L<Bc
zErG4Dd|UOJouc9I>b`yb6F%H@>cd_3$#1v%AKr~8XN0UW{2JSnr$<kYZpOUs_i|Sg
zNWh<(9=PM~ZPSwcdG=G@Mn%N8?L^kZ>jHK6p&z`9U56{{$e&K%uGAykyXRjSyY#kb
zW<Ksn>D%aSuxO*fPT#<XdwUna(X{OdyE<!xa&fdBk5(LqKwS^=FbaihxvJCs2s5qx
z2aE^q37l0DknVS~UVbfnIBrQ+{5sjw$XhME+fM%c+Oi`mE$$~nMsezamNzA~$w}=e
z?mdICa^{@Nc10QAC3Md1a|S)~d@Bd^8KSYSPrEmPb{&~K`*x&>>*~R&GjR_3ADPXo
z<`zHO4ja(BQLFA4h*+FQmft46hrREXlE8a=8Iwpod%3I422Sex8m#P$zQi4Nql<JO
z`iG%<9U2#{Is6YpJ@Ujx=f5!2qkV3t{)3@jRq_rKdvaAW&NG51(00UGBJdvVjgiZ_
zP(Go++0X@%umcXzqS(9C&LPjpu|FrG8Sk6Dqg3NVz<?~$)PP3~K|5BCzK#L|$7AaA
z&Ljsa5+Wtv1%P4lq1tfb!92R(E7sT|SfDQl1i<d1hYp>6{bVyR|GY}#<i4&VDlt+f
z2>4!ZbAQMnv+DSu0f|d@`0-hw``W|e_`1JR;sC8=YQI+B=4mSVX=G5vgf<qSBv-5C
zS`6;vDnjo_X5C{Koj0@yE3cqG8xMLhH+kj$hx^CWPe0)QD|@of=3Yek8{$*(isNcB
zMU6w>NA8uJ_(__NZM+`D6O>qcC(o#CqNf1e{#|3{I$e6Z%pYt!D-vK!lqu3ZYSXo-
z!JNtYije;9Oa_<fO1o8N98HTK98=ng(+v7ubuUsEK!G^~YKZJNiI&~#<+Xb|)8%~x
z^RcTL03O5z(5`U^R3?Ee+4pmjL!b`#2m*bBcyPDaKLYi4$#&UMpwLHMKqWhunFZ3P
zeRmf%uYi>on_&QO!W(7+e6BA*8X!RL4z-l`f>J)-s$j@Aif|V*WrYz$D1ahxt<6hJ
zDvz`K&`q}EVFdMI4it*NcK7oWw+yY|04KjhJ2gcxaQRcufL(~*kG}!uz=c#dinrlp
z`7Lpvkf{ggTe$$#l<?U7k0n_I*=c;*ERwXIFbVL@*-IGSq(T}E1bFQ6>a$i^aB=-7
zr_Gnr-re%$eu1u+or}mu4Zkr$a|Be$n1r-XJ)-h&i0ImbVHQb&qN?I#u3su75hx9I
zWB8@+1%v!>D;jL;PfM%^6RdCih3ojHvq$ENlHRmR{-lptxe5xpuL=W6I7fs*KTxjl
zPKpAk*BVYsvZ^S+OW)Z+Yeo?02*hfC$_54Qp3T?0bxNXd00N;JMj3r}e({mrVjlqz
zV4l>Fr!~(3a3d|&GGKJ}uGve~+=FqJSQV%$8pO4xb@PIGh#`pizA(TL4o3edIfQm0
zz>DK=FWk#1?lLP!H>vxK_Ou6wJweU5LPWk09vd@VDt8{`T952Ex6-7<s>Farf6&Z^
zdt941txmj7>fik`U$0plR{wb3XZSL@!C#gikYygXNCekQLgRA_!tc2$vHIi<-EOPw
z!V#pL9%1NXs>9YjOhd|%JfXN+KEsi*e9iq8zBB;oI&E>G=1Se-ZC*fM);$Fv#9WHH
zvTvlOou?22(hld4!1oWFzicl6FeUIsC$>@=hvcOV;NfG}S1v#0Xa8^rP(QPl2cN0E
zB8$eTkK!~fPCXrJ|9u-8#Q)Rnyb?$#>S}F8=b7-6GP(`5M={n5+-BrEyr=uHIj=nY
zLZv)N$D6N~WY;*nswg7x?o3K}7Dnjs=o8(|8G?v+L=Z{qu;%f^#^X>xD6s<s@d%WO
zovUI<dhmYo<iN)&+K{+qZf<QLiMbD_gYe;vkOW#U;0fEvBJx|g7<IwMY4tcn$uGa5
zoBdz?Pk-=qW943JbGMrOgD5=yJM-vM_1a(I`*tQ`((nwkLw-}#kuj*N&ZRLO>==01
z36<b|w=xuysL*KRVoiMkt|>8^d(u{p7VNhAJ8u4J*%pvx<I9&tsBUrdN7~}e013>n
zQ3MwO?3E|H{-V4Qy*ve8c`pc_)7_&@PW^r(EVHJBkr1~a-afb7J$7Ve27xA^^A}}=
zSd-cQp97Fw$NK|v8!CT_fI(}R7R&oEmiQ3oI%2=XrI{Qf*Lzp|@dpitv$cG_Zd^NU
zza{%&&iL!o?YYCNx5e_{2ks_U^M;W!KJELPVJw6Nfs4QPgTZUmwB30gv6P`tf8k0m
zr0R~Ms-cC}6KqXXcfjh6C$zf>Psloxp_OwY#hFJ0cxWKB1i#R=zNgI%X;E=k9EX2|
zB)%Antn|Cb!B8)~YyA&~`od`WABOr;`275NBX+D001<C=DW?!Xa7TQaQX>mqD5EbV
z?xA(8;fk(kD(FXKudEUVD7=6}i0U)@;yl6J9#rV7QZmwQ45pa9B`f3vz>RfSoviI~
ztJ&wgO&3?^;;I0ymN6}kfcjS8pMXk;-@OccT$u)eO9Ruy@jwnQ9k9Pg3o=F#7M%0^
zcE~Y0*=~U0hpOa#pJ87Q@1Crd0bXFZ^83zTNNg)unT>N4P=W%31FGd%@1b~i0py?Z
z#)BB|Yb{qm{eRwQZv$4i&i)h2eD+RSjiS+S^jiCKXO0=1h9_;iy%B<dMS-uWU46}~
zdnv==DopdPOerzew@67=P&SkOxUozK%w>!MBQ~s<@piQ5xKlEUJ_N9Mf1`#yl~>jS
z0|js7@uD%H^AuTlv)-<*)2mD&jO4_Ti$u6N3Y<ImdLn*#?~@~DkI0LK_6?E|P6rVD
zP5{iMU>Si{<DUb=d{iT-HZU46Axz2&w+sl&unGhgKI(Mi>Ja_yT%qRWp)g2kB~<!R
zxrd(7r<@rfLS&P|$8Z?I6X2?8l|=w>{L5F3FF1p>DsJv0;;zk&wC?=U)ljbHzg#(*
zL%;X;MFpn49fjf;sJj+fNPqwoR;ql1pKesB5djK6W<WUy0kV=iNzy1503)PU^RA8l
zr2WYS8hHt9lZXsnj1|bd@fo--(%kwqnh59<bW}RfFQ}u6Kz+Epu`l6NlN^{PUq6N6
z7^uxw`aGjKJ8$KevF0^N9r4F+?j{p%Uk8IWpI#MW{MmvUGAv;Tg02eT-3^T|SLp3j
ztW4_b3k+;pP=`^HzRMgv?T`|P2K=c8A~vBARL7*19i5yDqjkI=DN*-QiojdKzyzKo
zX>hjcpTLL5OCkCy^dr_;hSP5VH1VvD7GF2fOq;;l0>DOPO{^Ou=P<HoR8B^BaqLkL
z!Yu1Kl|7&bO5!l6nK9IBlBMLkM&fTCqqry4HY~CnjdArSZr=RH9Zh;<Va`D6Yp~Vr
zTOrYETyq%JRfgaS&3_?>CXGEx;qj(86x*8}>ow!U<6zmKh;F@)90nEnnzxbB!@a*;
za(@NJuHF2`f(D40Y`1PFp~xz4_*U6u+1B#*O>8tFQX7Z22J%nnm77~v781-ybJRr@
zVQ7MT<DF%?JSgvxtj|+x5rCI;?MVs{H=_Io*U30x-&IG8#L#!9cx#l+7T(FRawJkz
z2<TxaIPgNXvsK!NAikDk?(+KbLe3Re=N{<OtG#B5_|6|Wj$E5Cj@s;b8`wA614iyw
zUg!y=<Z9pvqs|2Xq>g>(2tX-hIk}oE2{5p1^NM{7%XYbU*a<+FvY!R&)mt|-e6ALl
zwl_E=&sY1N%gH7IOfd2>wQnK3n$l9|1-Q)Lln1=sjR9uL>M~Sh<^phhtK4e0s~A5q
z(sst;#)M~Jz({Fd1RAvPv$w*>)FsumJMLxAf_r*hZ{qn(2oAb^9sGLQ^}|9h#2ko7
zf^RDxoYK1WX*wsS=5-G@RW|y4p(X&KWj-0@jtHv|O3gICOno+a@Pm-k`!g`ZAU(Bd
zX~$1*A$51<J}J7O0PBy{S*fLSpQV0{TCb1Xm%dV}-r3qwFaGTQyK*WtU?dYghq?al
z_K6geJZr9H#Row@X%}}gcB?3LHy^zJNfIzF=RyFppFhNAyRzB7pN7Ew=bpn)w`9KW
z&j5S?zJ3m<PRJSU?Q3@44zT;1b4RI@`c8>Tn6UZE4Z!e{3qMKf_3gX#N*RaO3tB)1
z2S$x1a61urkWQ}`9@K~eOZL#y!<C$?+TSGWlo-JJss`_IVE(}V+ajN@LjX7vFtI)?
zf7R{R8hO|G`Q7l0Q%1mek;3R1OTHQcgoYmLplWy2_0vsi^LfO6+)QgFNKy%R8JX}T
z8}S+gp5g9N<FYytFyADBm+A5TZ#O#4)#TLSq$iqYKg5k%z!m`4`y}`%5fF6(kf<tz
zel_nV1?UG{%&j5%Lx7L?t9e?@6o3&W9JuYl<{nlEj<@@3(HYk&&#-UNZLx#+sP=0U
z5Y(>1FoJ+6aN4k6)!6&JU1d;2Yot^bkJGW%=dcJ)gW|WG(}e^u5<p~sLC<^I(*TiC
z!^Q&yG%YidCI@K&?vj=B_5n%DpH;27Y=;jvS^@mVwOv!v5Y@*E^pYDFJ6^3ewUM0U
z4<BT7J~-+`NW>n#GW{W`;e`K9?<iu%d6Sosw4tY<toF#8F$mvOm~Z)}gT0Sbv?Lde
zU*^rrO!v^CH=CKqHz`*=TO^rJpN7HC)xn&sO5V(KM<h8Zx=4rNGlbqk{Ihe_4vlp>
z!9P1x9&LdSIaKC-%RIXIsv;@#C~A!D{kQ|!crB6&wFPdLZ^G<Z<PMpt@BB9{kXn*g
zPE;m&zi99i?>ON<aN?C*mS;D_Nxv+Hkm0~2J4kZ*)1Y46WNVHt+>+tYO+I1H<&K0p
zA#Sdxjc@XgFQ0_Ig5`%hWd=vXHGQQbS~6oc#{v1Q7zBv78}w=n4(wHj7sA7$;bDcJ
z-UD1bgLUCFc$klPG$F&pgBd#v4|9UQTEvIxPekemhz@d#+{K?Ry%E!hKMiCd<tOgP
zOziz(irH{Qdj#;!@SP_3*)Q^Og|?Pl{$5V?n@^kkLiam9;8!jQGr(t9qsKkF!LBr@
z!7$vX5Ny;q8L1D^AW+y2`s7GSxT`+ol}V8C(I6k@q-P7bXE7&SGQ+_KdbBXp6Aw#0
z1v}~l-#0VGRt1X=lTOUxj}8a<pr##=l;w;JpP+o!4~Pwo5>9|Q(I~Fp;r;}uK?|(x
zPsZ}WOyS?t){-zAJnZlc#LIMiUmwJ#FcWzx*oKwiA^+o$%@4+(V5}r8I@;gek75<V
z7ePDp2?KSh306zsXs$DrMU%&>CS&y>7A%VKcenuyy1F}QA<p!a<T9!m58j-NZGo8$
z=A4tyiq#Erjh@vupDAz2&~DEN9?tYcLj4Of9VB7r{h+CD;4e)eSQ;g`1!my`bz+i#
zzlRvnLfEeTWnG1tQJEPAZ=f288SRz~&q9a>evbF(?3dS>*(GGH?CEe+Sa}QFpB8Gd
z>2E-Q=4WOU2!uIFh8g*c#c*EM7-oQ)z8I3>84{RVbt25|mq&HTv8E7%=s8bJMr0w_
zUy`dDKK1g{?B>DDWVhM)_L+u?(;6)q6;G!+S+mwOs6UVujD))PPX%MbpS&6J><%jr
zopMVEweh3qu2U2f@>yaK)Ei1f!c=%6IcD%gMN6g$I?MtCb4AWsn{&PK8!L$l5?zNH
zQ6nr+;jh2vymdQ;ox9ombh5M;;-mk|nHX{>YVo8Hk6Dq<%kqiXq;d0;CyhMjwF|-Q
z`rrOWi1`bir@!tk#xj3J7DAj@Fazddr)1WrtB|2ZKO+`2J@xn8)A?9bgnJ9jrv-K+
zlj11}d)1dugZp-TpPiKdQSm*ZKPuv*&G=%)Lci{W=kQOj8S+`R@OZz7jqh+LBn9FY
zuC2EC`RL;Qo+4CqB#f<M6d;Owk)hQM_L3a6Mv}FW&}e*yb~njVE!1Xiyw8R!%wsB+
zm4PT2M=HeV_mQ*+ln3zq;JGMwCb^-6TzzTzMCtNoygwlUzA^Uu_ug-o{8Dc;+yDd1
z5MS!^gIf5M1Rx<NOFo55P6-}8=?aAYy}R<r59%+O8IFe;5nwjm;Lm9*Z1lYd9q-u_
zK<sdNL<A-ha#r*U>oV-&>X#m&Io9LS(O8>T%zYcNHiB_jg*Y39Oy0qTyu93CAIew>
zxN|1T!UsYKiPMOVBRp7AMT8k#BdK<iHZmyMmx8@6@U6atVF8jd60+<NFEI4u1d{CP
z9bRce>XV<^w+^*nWgJ^tILrn1%7PwkAt}>BbkqO%4E@oj#-B7JD^lZ^q9QUbjhl~)
z+>C}<y-N5(FElbR)?me-WhX=nCdMcvo?|EE!t)%^iSho4XBA-G(eQ+V#N^7vgjb}n
z@hh@_fk9fr1@?7WAtBrFH5Y{>l3o(oHi_cC>2hzjpahbYn8c2_kd(v0P#<n)T}$XH
zUCI8QbZIH6fSpt*m|Udr_fqA;`DY@yru7T{$@vCXB%)bYHu9xy5+&&qrT1Q>x<{9c
zC&v_V89nEIDJfK?kW#Iea?3V_GtB>vf6CpnDfiM-Y6?>BSEkfHOsRX7QvV^PVLau*
zQp!WyEvFW~^4a7^T-Q?dc$?kNKk+~R^z8X(>E~Mt&Ofi*Zt?#6=+*YgA};Sx3MvWo
zihZ6Ym`Ybj?a)hQ=%tDw5hCWP4EG&D573)})Sk-Jw+~a_y-Izjfavbpd6l>$#7ylM
zOdC+x9T-X-*hu~8zROUDSazKsdPYwjy4=aSC?{lGS;<%GpU*CPmUit!+Uw!nA;Ak1
z3OQkt7hhA;@GsIjqWPG!yIKJkh?3hAl^1>uWlwhHzryUDiRIR?xIhd|!%kfo`LMV2
z@WQHXdR`$Hr%u-1e<A$Eo+XHHgUfW&JO8g^`c7B+pJzqPO#%wY4%>qZYlpH>9TXmk
z|He>-?!DY(fxkY_mo_^yy*xq2<S02_)(%^_ZI>%<a4sUbPuZ#1@bt&}uvN9bGRwr3
zg`cbH{ZzZGy<&;rI|sZK$jHcFYq#5S^?aXyu35ts7P>z>cSQ1w(wExV2O*1R*0sMj
zpBZ`-Ilr#so3+yIliyhsG1_J|JJ^uxt%tvn>OXw2m2Ip)*_kV06t%D!GepnmlFy77
z(HfJ8KEC&IA(_d1pQx3t8@Xlt>vOGlUa_l`*8IDRHo1LHKZ0%z7o1M7N&CH?HQM@L
z80xvowgAI}4>mOm^7Wrs4)LDca{Tq>S?tp9-4_c52K3qT^&-dD%hO{w*aVyHt<9C$
zPY+)mzOS_%`6}?s1KV>cr*_Ry|AnDq-v6;96&2C(WFZ%G#SF1M^@5Cp0i}vraw(gN
z*^0U5N;#@Gl9X~aYFm`@bXqt63q!qV@-<2MlEtqU<$`@%oBta_Rk`e}`CR47LCe1?
z#hxw}s#lL3PgX5CcILV2wUa6AzyAwEO;)=RR{LD-W@PJMwX&GE7V72kUz7g_L*4qT
zP9^eKqN_5bQ_$5pnyvpEL)Ex*^>~WL-Ru92p=xkO&0A{TzjGr+v-W;%tLFce7^=j=
zd)0#ez>8l_CYpb+hVD~>Ax~W^&qPCsizeUT!dGC(1KEM^B`~r@ZxpL#mG+OMY{qsA
zV{R|Ie9IV`6&S&!2JnwY4NtmT`)(_{j-_~9X%W3F({7QJUaI3FjcG9`lyL+UVTy%A
z<xfTmqW4-8D<DO$4IiJMa-R!<#N^lxY6oPP<=hjnTJC#!XkD4I@Y{W{^@B~}%F|&_
z(<R;<Wj7nx$;vd`T=uOGm}TVS-hD$7={DZWtlhT~j)*Bi<-TiaRtA_Iwr9^mfS!GV
zI<(5@6>b!uY~%zXPCa%Q*&?>XOjYGm8Z$*7=@<HSpXCl%&7AX_c$Vo4MjS<Dqpdd!
z53~@&ySBjwzb4?8`i&WOF<EHN-rx9MIVMD=+_p0YYUvXc#joKw(rHlGdgr~u%Onb#
zGFNcE%}%m2iDE)o=1KIy5dxE7wtm<aZY9qg*El87lj!}I<Eo=DK5rySsGZE~I{d#S
zopcHKET6IlVZLMKwxga;&3<7MpR>ByHtLuFYrDh^C#vmM=u=zxqX-9CWfd9H{;_yF
zLV|3zl^-23Bm_<G`E*jcqzZYstWV*#D`a&t<f6GQQGvL_5M^`yyo4Kem(7CO*`9eu
zIr8TH)l=jjGRhjR8Pg9gimsio4#gtOZW9Ialg6#TI-1Q^87eN9`i})p6bOW1^G<0w
zqUN!!psiaXn8qocZTi8pU{Kj9ky-tz9AwMS--toPNolaUtrqK`;AU(EG)JTL(HKJ^
z!@68l_}4{@aB$%d>seuuq<)HKan(v&D0c3?m1Qxma^=&Q^0^{7<c1EF8;c+DnJd_;
zGR%9&`XMCk;uc$NMAZJ1bs!*jpnMB=tM$ZwJ?pK3mR+KFwf@Nw*WAJrmp>`|Mc<Tx
zZf0EA(Yrg9s&G&__uai*w_2|!GVTUnxjhS?)EA%~t=|T)GYjrwB~9Bpwce&6GS`+7
zOqpzxdf<!M(Ia=4cmoc`j99(Qz4Q>zuNBB02(xTc62FSSD=*o^7n4o8bV|mK?RKu<
z#f{*{IlJ}Pde5iIo1a8u((K1ZG5oi`E*4SKBE9XcK7WWO-EPRxiF&5=ZRAaZgq-m=
zu2`+ns!^lbH~XTz###<O=EtTp(xQ&*2DDCKpS7NjakQwf8(Td0?8W!psH<D_0ul>H
z<ds^&{8n^Z)3t9y#BiM#n)G7@evWk!g(H2>BQF3%Awd`zzWV}ckV;3ftvh^0F2f8Y
zJLNv#dB{7T*kc1ftXPfwA#vN|(gojAMW`+U{<A;NhMjw^f=@SFzMdyQVr2?(h?QlN
zNpK1DAvVLrGQ>t3DM`V^cwFh3f?dx`MRyfnY_)U>%LinDIsQ^g;~kx-dszeT89bDC
zBr*9W%7HnuB)pe%-H=K-Fg?W?0MoJk_Blo8VQJ*@JNSjLfr1w=0}-)0!P1g+{~lc|
zPxElB(j69$mQ$hl?nQ+wr&3xEpjnI|SD8_H?1AIOkf?_(cY+Jlc|ff=Sq#cv@%+Hd
zgPe7tv^Fji0+q{C<ui4$Gc5i5*N=NPe|V`7lGPmki?YfMR41pn<hv2D&(890Y)C+^
z@>Uk{_5`BZ!%x>TyVJd(HT;ly2XX;#Z{b(X{`No@O?|8%zTbD1cdXss+Qkg%CqWVS
z?~ZENRfKbcg+3ne*_gYW)_q`bb99iZs@%HUa>je{*-{-BaxVJ06-4p;gnXiVLnEJA
zHdZ0?f<4#y-B)_0cFD0{7|09d;}!51<Yp%oWJ*l;uZ-h8KWfHRBbq2gk<>Go=6Q@?
zK&u{=lMOg;UcbwW6>MLUZ|=1dPgyMRnZ6_dJK0d{xCgrpnLxr!jFCs>+xss{-Ftf_
zC^h`I$?u%oRM>>JUAG&u`Qb~{8QT}w8Ljo_pI-h>cxCl{^})u=)t9*cVMZIta#9oU
z$y-AF!2nr;hRK{1`fxEi_%>^Wjo7j2{gybnh?AdX?l+cxnClU$Bt)d)q*^>O)FrF_
z*d(RRSF$LYUPNABG){Jsz-0|pLgqM8R4$BfkIlC8-S^)8b&{Q;(AmD;vhh;It}6E!
zpe#LV&Sk}FO0JwB%Z*~*XggIRK6}#<y$|iAk}44goyM03yY_x8Hwjkn$SJJrThA5I
z^9HW%t=%_!B}7$Na!~jagIkZR?CEA~WQ=dd&_(nWBs%F^_raV}{+}MkPSyU|G(Y17
z|DO{?h#eJrhNKCQL1*N_mib^XS<?yp>$<;~6CN$f1ob&?=-|=D`1u%+yptVw1)gV*
z*QN|&SYxNui51&qWBAnU&@4OSGV=PVZkr?py=lB`G*QT!2ra>z+Xo<957?GL^eJ{I
ze3ei!NMr?U7J<lP;>_~{l!`&~%Xl=vun1;Kka%sPA$p;9vW@c6wRXmh5S~dV+eVzR
zWPns~fUHx8b~IUHW}>+fVn_kYH~J~tRPRIg$ghx8cB+IriE1c_mDA*-MzXqYpcs^-
ziK)K2P$d)?Ams$sD<f-w-^pj%$x4DG`X?<!Cpm*`)B^)#DR##8lR9sCYyg~6v4VWF
zl6-};Z8TYvi3QZadW`{wwQp_g$tvb}6w6MdFUMMcYQdTF$dqYju60d^(j;9we=2B{
zjoQ2@{}blF^hci6RJrz^^ydqn(#X*E36i3atRGC>Z6s@&Q`MqzL8wXX7L@oFO~jtL
z^=C@ErE)SuUaz-9o8^!4t@?XJMLv`yeI|%V!J$7_V3nrtFd247iE0#b;4seECs25W
z>MTvQtgzp3z}YKR2}Xmo&f(m@c3IR1i&4Oad->X*K|$7F6WUt~6_St&Nk<88;x{Q`
zJtb`lQ~EV&@+OE_Mpl!=qRdtLJ)nXM#6XXJh1(;w(KsnDy0+|{6HJI6v_ncd=<qq1
z6+l+0m$w8@rLIBrhUE=`_q_FtK(AwU-4Min9G=P0#s?^&82%43tohitg_!g}0mR7?
z?9t!(*7Y<@1WuU%#-`$w&F`Mrk@kB@nsIfzPK89RmpK8qY#Ph$I&o23Ay^7Ys26O<
z!VOnZMyfh3Sa($Vr*XmGooTp(Yn%^OK72egKn?2R0@b%BsxVbKx@eLbH2K%-<e9g+
zP`XV$PGf;AlFz_EK{hPfiMS5YWyVx#F&ZsaDtlQTTH|E>1#1mfH=&@RbHc@vc4goF
zXGnghBn}3H3^s#N!#@(#C=&HFL@Crd6_B~aFhxRT5m`>djANO0wvw~1NsM#g*X9@}
zTnmY>i~|PRNiC2yjVapwou+LxginXvS}3*<BwfRXi4}KX33d+o=m)6`gbFdJ11HSa
zY3V_<9j2X_CW-2Egi(lMi?~2e&%T;r0+^1S!=3vmMwW&yjTKS)I`b|;&8+E{E>W!G
zYMeuZ6fr+A#d8&Yp<)qtozSBmooM^GdrtkTizc01$X`xWVxeZ|EphvlYKO~e6h8Bx
z510_K2q#-}qHT7q-!x7<^m}Qh^L1g0$<7TE<}6eWtn5`|J57?8?J%^yYNZcW=IEl5
zb6%65l@~OX37p@@4n_0;W)6E(xD#XA`9i3(Ni96(CAj9)HFPmfeU8W(TCU^4P`J%+
zDH*Dttkoj!Y10X=(Fn(W4hu8wG+khW#HsY1A7R*hhP($zI<!(%g(zXJW<#T!B@soK
zWNj+F=(vXLPF+w3R?&wfvWAxJCP{daMQAg2!#Gsi_ZQ;!dPq*l(p|NafzgH-%#q=8
zb_vgM(!-qN$X#y-t38J^%&`+um2{DXNJBvs0!hTDV`mYkyg8pO4wkmJ!_L)9w474x
z)Dnw6W2e&Lq1$Pb&)|w+ScX<=L2)W7bTvLGI*BOJ-C;wen`bwyH!$R(^mYNtZE^eI
zOOapvA_vzY9lycYda{HHv9M%uBn5QahN8OA@#zrgI~>A^+352@ZR|NVD&g`2M#oVI
zHsZ{~B#<DBX3Y71>jkVzV~Af1T}%6$@AEG`MfY=mjw<qjl-q`tvx)k$;H9;DCZ!P#
zBVf7P7fmQXF{4qxS8(FlU;|muc>^swFKm~Ree<LjOF-{jF6ePCC{u^1F^ARDW{kC5
zH5rAB1><@`&dx9e<g{_p*<Z26pi{@sY{_?;*8s8$c6YwkU9APA7djC2WbHPBHVu36
zErY8YK-bVL^U2z&05*xv+lE2v!({UTF+vB|0)tBh3+4jNnc5qB5syn#%(RJSK9C{F
zIpm*0sceQJ6=%~=7fvP0u-tT0>CaQ7bq28FUXr-DAiD(;k7$RQJ_6lM(>2E`ZsHVK
zY>deQDb)=pBtj8b)h7=VxEDaO!|J$RJ1Ol>16i0L6nlY6<W8b@aCFXLf)>HRW@kwa
z3PNq-gsF7X7CX`QMNEE-6ay>%f=gl>G9j>x>85r5T9SH)k$%{OW9r+n7Ce*a_u%(c
z^EtpMLwpG=*fz_%K-A91z>n)Tw)}8UBFDam+RjP*67JNhS>TeRE501iV!3Uu>k@S2
z)Qhfajk{@M29U#G%9%^c^7f&^6h(>7mE#PZ*%iaKQrlrrrcj?@G0s4uSib*^bduhx
z6VXV7Y~mxPSo-kJn<-}eV`~+#M7>^4;C<W9hZS3luL2bAdd7#^RntxOLyQk;-8mY&
zrjcXXg-D&VOo~)44aKc7)Z{5veDq@hABB3!W}-eGIiy%A&Bwb~T`xQ7Y%)|1WNAHu
zjjJ$AG&0Xy#jr3@s9FJY4wBtuTik&V1;61eylsfnHl+G14au(YHLsPZ#$LU^(A|8P
zY6_MuTQ=C_u#p;IGFbktf%`VuUC{oHaHl+L*|d~~!DxH%#&;b5wLdn_T!8|!iZWs8
z+~14P&nJLYHFl!FS9BlPh8jNak2tP6q7HdmJ2R?POdcP;VsQSO(C8&CL5dEdRNG4I
z#ume$mn=374xA5BGO62tI^GfTm?CW&I19F%dyjE?XsgZETdncxHoR%92RVIU0REh4
zYNfSUz8+>v6=IRFEFiq1X}w2JMtRX@^q~M!1Nm+p({F?o1<MxJMAye=S<+4INw(K0
zR@NOth+##Q4?jZ~3Vg)BmmUUYc<HW@%s1cX1vF!O!DntgJ@YsL>)T)}3n8}w(gZLX
z9hPiG=OXAH5P>G&Of2E)H0z#oHhyB;-DC?T^X&X|mud7kPsbFK1ZoIZ-ZrH}%nv(G
z9v1A>{aj<)P2w+G_7X`-Oiw&xRGB1Vj}(2T8i5mDz;;w)<>D3{ui0s|5mLyc)CVS?
zkGtqOo=zTYwhIo$wXr0c3z)q>ojae@-i<mr&i<qL8n@WuMiBS1L81d7rmX_&{#^{A
zHcxBXr$A0k?4f*?Nau=+#nmB*K`MtA{j?ow8j5qj;Sk%Cnc!Cy@fK^33bi|24U%Fq
zJU#A3%xc-RY*-qD#nu?6g-@ckA!o^vSNjyGTjc11GcgJqPA#}~U?8cAfn=5mzqB)v
z15X4CJ`}LG2!3W8VfMn%zRc{7fKP{|N~3LdgDuc%>+!&rvvqZCV9HWzZJW}jo;lY8
zKh7wmZ|m({z?Ad0s3Mb`@>{;SX*NpeOYuP;ZsSC4lIjXLz$iq_n3N%CUiQwyo7|Fp
z*q-^4v*C5{GI5Hj7>#-cqI=ddf{i%g&7*IuX|J!5e2uav47I6wB5#)EOvR!1*_&E*
zS_hxJ-uuKhwCLnE&h_;N=H~l-#g{~_Nj8{d?H4|_u5JD=1g_~y`TIY|6<g{*)R%Pz
zb<N}EWJz~VCzKr`KmCh4JtYwK7xL~_vMr@gVUFngofUGF!IMf*&3<9KskghuNK3~k
zPCvFDrXe;{`zu$Y(g{3>EbDF>Zz*8?85_-DL`#@`te^y>6UBl{Z2Lj#M>;MK^kL#y
zB#R>)r$$tzE<ycJ*{@W)mJUQIMp@q}t({YfG?#4yzKDeBV|I-;$zwM$icCw_`4nek
z5_diA?CM5sI)UF9oF>dZ|9Bo?exv2xq9YKjY3~cM<~GxUo${EM;A0(J`2>EBBH%b1
zqDD9MvCH<pFHvtJ-rVYFP830h0gww55C0&X%<lj=*-Z>8yYt1f{a9CWiJkc?<wSdE
z8_wr%=_ms^N?up*{ATgxh8=Wcn!J8E5eHP@YEEukvmf5nWOa9rYfysv8j|-tvhQcR
zw}tL=0`&+}3ewMQK`6Gwe;8_LbR{+w_CrpzMOP6mFQ9SMez<?4BX`$0q|K>GVSk>o
zGf(HxfP%{v)niZN{tAb<UN;IGY(5t2f7QNL`)#;=Mz1N+ka8m*+I-^`-m3;Gf(ZRq
zq4KG{3Tx!XM(y)99Bi0>rq!*hp0RW6tHUXot0&E1GkFf(E_&(9x^lwmjS`A>9XmSb
z*RrWro)q~X${`m^<O3t5%o27aSGrTf(D!m&mpxB~UmKZuRISd7@7rtZj;;oO4((dS
zd^)td1uH;l<+eXflSzykdy%|xNy_E0ZIsx?Nc5w3ne|l;+dbc3-zshsD$%|eie}hX
zq3+BrUXF34s>&#npnso+Q~15LNU&s~X|jZ7{-^$9C3huWX;){<P0U7epRFJ1Ek8w&
zM9XW)H_aegOHe8jsLkbz9XvX1NCs(3!%^WI>%I=7Xlps719|#5mzKy8-=f#zCsT`*
zj(H)`2=<R1MHec5|6G@Xrb|;NH?gd7`py2GkvnL4nn<X$4E(D@MrK*GD#GJZts3`J
zNzv>=zj~<-@elPer?Va3N@Z6<V8RZ9#1d+r0P#{O*Bi^lHjxk3e@3r-u-V-a=`ZS#
zx^#PA8xsBe2Q*jZKsxmsgrC@7GqoQnck*MUS|y(yN`XAACVb#&*yp?6U)Q=W`cayc
zt{oj%?kab@gtw;}bA6l=OJ56PUH08QM(V?4$dwESUflN|4E3o>Y6U7z<ybK7bb+9+
z=UTS}OJkaR=<a}crNrI)%_vo_<6Ths4N%>uLpJ>JUOEl^vtp=}oLNNTOl?<r>W+q^
z9XmZjtVYCc<u3%$nhGoVe_^PnOeXFhlbKxY=$3ITq*u<^L@Q;7zud$_wHxKKvxJ=D
z17RY;0nZ%0FArz7CY}AI&X3yb$35`9-8jj6_ULX$uG<-yU9RsyQy}8-%)*!Vc&-11
zp}s6}RwXf=?^jBcSof$l$E-d>J%zPqRVT%%Ug>(c*e<iw_UHS}rJ)w$x|)Yy^kjyU
zjLkIfzT1U$OSa#VeW_il8;<9?H6HG)^cZEett2Q7wQ+`nNsK9kluGSe>v#6v7vF2f
zPCYkhU?vyed#YgU&meYOF7dnKJ-LLw*k@^*-*xo-lE(LO?X9!FUQD$4JC(DsFX_WK
zgYxUYoc-mJ=Zl8g|Nd|vZ$H0s@7ms9CVi-FxqUHNNw#ZiL@nafs>S17TeIO;g6W5b
z(;*rxM+Kk-bZGMy!HSh7&eNSAC+fkwH;e^+!sde4m(sUIP#_Rza=ubw`W}P{=bgg>
znuSCl4h2<p!t#QVWMx@AH@3wV*5N^sE(_oaZvly#vWP%F6AJR7^UmlKtVS!jBYhZ>
zzY56*7A6FbNOtb>4`ev@;)QR8(lki=q!XhATR-$`@a4u_j%c;_k<KSB9FrbwJt=i{
z(_Z(Z$3;wPka$dsgYk`J3f_KF^4*++WkO5_(RYds|JvdRycNpIN)6uIRLeQ$A$+Cl
z>p1r?^^!~(P;BOrrHtWrajdyjtR70T94>r&#8~-id4!$jP3+r42`g8sWKU_jAA2j4
zkCoF2rSrq91XM<W>rNhyYK1wyu1Sxs(`4<9&JyxMJRX+@QA3PMM|uP0jX2?y8Ke8$
zt^vZIO5b~hn3Z!M40gG4W3cnCW%Gz@RG&zhna`~G*xz?}fz_M8L{A&_NF9uKeSCdo
zO>N(^9=Eue*h=W)J&O~_{t$uY^3VBbL$R$sa+HX~YQ4IlL9W|H-PJPjFQ=V(e|b{Q
zt=-_2`^o?NxkvV+xN5f7ef0HXZ~eB;UAvQdO4FM?^7fEvkXVyfm-YcEFOLMntJNx}
zWQ~p;sq_2dwtcwk=<}~f9$pZu4-lL8={bJ%afMhz*pd0;BVUg`YZrSEb9LVL=W*{B
z-;XqSz1AG62DQB0`{UN@1M}lP;lq#@Z^}8c5GeJ{r_1K3TncRA%k(lO)>Zs*ys&n#
z#kXT09tjha`bidpTh1v_R4IRxF8I-&Bc_xDzS|e;^!Fu`K71E{_B^sK*hs6%o>l#f
zeyZqb{0ZNwjz3S1<8i#E(JoK=XitMM4QGyhJMvR=11{4~@(r`fwvpvvsIMbMl+eEa
zFjQp@WHIvX`-66IiC;b$2|vz5gvyx3@5bodHw?1bQrT44a>nnl!{J`0r9n>`#%klH
z!Y_#@5t`v@I=Ugx$(yye1a&;_n0~Ihc=XH!RLAF+fc_}y=u>>7ybWET5EHo3F8L<>
z;8JKi({voAe8FhY;OwAGkizWxlOQ~U&(xz=#!IyL7oN#?qn}R*MI_Y8Hpbl~=JBJ5
z#7j<%@n+EzY7sQaqi@c|l6#zin?XpK7Wy^kvKh71W1WYO8iBs`9ye!8en_7A#V^_t
z)TKX($fEh59bSeeY)TD0``J_>^?rEhw>$J8s=-ut04kJ(={fnm)?iB?EBx-c)JHMH
z@Mpb8;Aj85YeD`Azlr~`B(40!jL@iVM!hJP%?9Z5*|BjZX(XwdATFdS7eVG^#Kwy0
zfUyv~L9;kJR7K|N|HIyWKQ-01`vOlw5|U7o(4;3+sZvDg5UNNspeRisG)0P3MMMcr
zdM|=>1VN-rM<Ag|m4FB+h=7U+h;)#8@;uMG-?Pu2Ip@rrne*HJ3)ak9_gZW2`?{|0
zCwnv`B<|*~&h~q(wPq2Drq~b}l;V5t-tfvpY{-?Z77knCDmJLeGQ?FWgG)N1rJl6*
z=kb{{P10|JE-P!ePu-vHhWbedNxFiWr$50bC2OBEq+F8r;LSqoso$=NePYY4o3oPL
zspxTI|6V<ZT6Yip+c1vtmOYJIb-sv3+@?&T>EMS8_4htXYuL4LFD}Ar1mxV}S9ZxX
z9mZRw_l@jALL1<EQ^ZK+S>HZc?ynM;Llp*0;xCD~8!h;E-_-4j8Pw%jWhLlhy3I+T
z=&_$Jw^rV^mO+sI*w)h~=|2ro-1gR4=>v=S7G(YW+ItUEI_`;921P>ze<P7)+9QPa
zqBM<zulY|tHksLy=@8rLPc(;4EuR#F%u6Fa^G6PvDORr`Rlf<GiESNH%*8TMI@)8h
z44uTze10%pQvch2_}F}yJYT;%`>Oqi*m|p2VC`<f2jhDizcQ~(I+xDx$nqWIcx4jI
zJ&$FB*Il<|)_RS~=2^a>PWSt-#D9{<95-V2PE->2w>vs2wschXth^J3BEL$1Z0Z(T
z)(tw9e-e2cdo+*$==ps#hXg7cbLj=Mn2G~2lydW>Q}YGZIo%7+^DDyD^O1UJ1che!
zF3q=<9+V+hESdcjMGv`(hulbnSWzIhDColxutOr$l>&9B247i+-cO`;m8N}&f`ukR
zZsB1L)vuzZAwd)f`4tDR5!&sxuUxgJ^gMj|62i|d#Mlm?o(OOua_3gVp$2d4ho6w}
z^j$IZkNW68iZk4|V|bf5G1Z6mn4=#}oZyeEUtVt-OH5kCBln~k+p5|1Do2E0Va{nR
z=oe!2!z8y0wAi0B6LE}{s85lRbW$5|`TpkU!SucY_SAg#b`)`arAcXnSxbglp2!k6
z$f9Awa-oJrqo4U^68CMplv1Nc%Nll5FIGhpwksw_ZYHc=GL61oM^KYiVFT`V0IWJe
zu+|QKYW!XJq)=u}13|=|sYLK*7hPE-%eMC(HmozLdY*AdPjsRhxd|*iqs**i?)Sft
zd<H!7Q9Og_p*b0z$(p0p4eqZSHH#*!E2BJnB^-%m>^mFmw6&P6B;GwQtjQpjLl#T7
z&a!*<;jTUl5hp-fAsDH_>8^=kPm(MJ!ZwS`=7MRdGp0<M)ax?T&Y^gdTu(}9-g<Gz
z@Ex@qrX9)DT-O-OO@!X51$ZTM`!ezH4W1naii9TvqQ*oXFx4b`i>gyZBhX?<12K85
zNHZQio-guYRjj5KK1L9WkUd+G{JPd#T)kSnBbiZo@NB=ScxEyn4^ONvJ7Y5sJC!rF
zwd@pt7oIu6vhj{`^3J0S$(S%Qr(qA<{ycgn7|l-AL+7PR3$F8?m&MeaVGKrJs}d9g
z!n#Riefca$-_ZM=t`bXNx8w^wRqSD2G@YB3FYeG77qDxN3fnRh9p6{pet*$xOPG)%
zzcL_yH|2t#PtcQ;%4lYVw<Zj_qd<-rMW3q*Jg!O>TZ;0cN@rG-n(^|7v{J!ybm{rL
z)(cV){xj`FPAUV&^xDN{p6+NKoj!*;7mVK2P;n1t{Pdm^R-k$eRPVs4Pj4}`=bzyX
z{%Br^$=F~jix#K)p%Q#d=Cv3Jvaa<vx`Q#ywS)x;5Brk{9;+>;!6fce%a{F(;`NIg
z;5Vk)H{bIZTuW<Ut}@*|v>exIqi8#ASKhwHYEh?iS?-dFZ|a?K-N6m;SixB8>k5Bg
zotSN%(DCYw@k=`6dP&<N&wceCUeo@?^lE>e^Cg+Zu~wj1hT#NzMvN>A9>=7cs7)7f
zrvug7$QXMKIqiA%ufE0@KBKixHl|b|3PFmw=F#pv&CxtpJb`<cq`Pa!Nx_O*hGF98
zY>$H3YVEMv8Y|hOginMZw{hLHIX1s*m4RbKo0M~^Y1}wJcAX2AdTA_%tY(8(%p6#%
ztXZ!+_#HX#X#XC#KFM@LE9o04xjJCyn)-!nt~-M^A8t6Xn(zIPJWZ;<_H;)<a<fcU
z)>zxykhYUbvzl$vz_y(@7PhD*2<-Y*?18V*+BKttI&Q%a7;W+ui%zzTUeMMLh%ZT0
zLW9;^7QPN-(SNT~j%6q>;I;{7<lWddy<!i$t?#wNbVY-Gn82FqTb_&{Mzh}FyB8#w
zZr?LtzenrfVCL}M-TvpYgFM#J#LrQ2!ZDQ9iKjvI^?9)Jgu~5?PVT-=2KOqBcb#Ld
zIqOtANwM8<uX!W;l6N;*;MkN?;41drH@Yw~PZ7!VZN2qm+Q-#8$@1%%Cjg#uAZ#H`
zXd3`ilTBI1UN{0W@cUXXYqQw!(FGPCR9>-XFTF+BW!I8vJ-r5R9w)Q!UV^Wtb8p;Z
z-)p!lKX(_{C<?i8_e)s{V$T!(^eFcH-6)d^&dIxclYGkSDV3=e&l2y}v-sS+>Ln^)
zAu;KxCC_)^{@E`BK8FpLd3ND3Y$@#Xu1+EB8O}1oU5KJN)DhpAcss8rIJKKv*lohi
z6&C+Pvi}IH^f?U`DGfOreoSSO^?6aIT@t*3;2dATIG2BF_l>tapLg@_Y5OGMq(srA
z5r9eVm?(qqmB8Eak5)|Cr*BluKCS<D|8al9BMZOsb@|6D6CQ_?k1&$Ny~ZOu=3nE{
z*RIHGn>;1{o+R#^2@XXQ*%T@`_wQn+uEy|1$-?d8^HokicJ_9s3U30#kICvzovsmB
z7a38e^2GD|1R0M)P!;r%_!P}&6ZqKtu)k0H?j?X<(~<vFgkqyT@OEUB|55CI#E4jA
zeRAmDWK`0WLz;i|k4E-fABm4dUorygk`(odJ+dYvDj_N6J+;C|-M>x}RQJ!xL@^TQ
z)Ng7E{AN$sGEdmcNH|nTxW&)Z0kC>5iJ2iMA~}+nKPF1?(c!nsly+iOJz11R%k`pI
zGUmbE3d#L<lY0h|Wh_$UKLX^VlF9qvbBZaS{Zo{ildo{3nq@}CZLuA1JW8u4=wzlD
zainP}COdIRlFQO<x6*-oTiZ_ri|rCGcP2c|%skEd6Yo-Zt8kC7%g0GH&^GVfvFBIq
zAZE3G%<AB9(NFg00r3p{F|($Ep3OE%kYpW2Z`w_;`9yu{R8BuS_xpoayhh?H4@7=j
z+}g^_{qvE}T_*RGqb|%m|L6Ubaf0%D2I7;CIlpT1SMYgl(glASA9HYiYj+F6a(cxm
z-pv?2&(q7ZJEp~@%gaQj4V+7su;;eP7i{2{=bdMo_=sI2xb5T{@oJRp;EV_P7>e>W
zPQRmyaP$jg0gdNO>BTwB0cX09sn3WE2-8SN(^FPpnVCzOmd81%7SWn#+=T(JUVVDS
zBm1iOSy^jKxxftuC4Bh}vKJvUFHfnwUa8`=xW2q`s-m8=^7wkCdO)m*i_KRb`v4$}
zeUTtYE!gg1Z8)>MLNRU!*fsJ^$O7H%g6y+lW^3~<CORxsNR)kpHQmzU*{4_PXyU>R
zhLeLjvkO5t9#-^^)|+M3OL5lEKjpSlZiryIcsfzG@~6SJwZXl$QM4&U<CDksJSXIW
zJq!q&ArTg6F>+-7cp$@!78Xa)W3tC^^1<KWL=e<hmzrEQO}9(JAo#>6AbF82Y&#bH
zgN#@QNf%+c=<Mq<18D9Y>IO|Wd>-w{;UxW;R;JA+eN2Ydt&<Kps?Jy+&6to!*qb|q
znffo<Z<7&3(v9R|%sK!G=Fd8%1L-3O%yyhCjyQ?FLX>|#=RKhK3qntxHbjs6g*yqn
z3t$vpxH$6=+n&!9pmFZqYwm^j)lwRUTdj3_)8wbw{aG{pdE5if-&{ER#&wY(HPUR~
zts!us-u#*dlYR(oY<G<x36A4?dtAVxn~$0xU_&(C^5_h?W=k{xU)+CFdpu9a2z2$C
zM?Slb0C#e=W9iDF{V6?l#oVLJH%HIpjB=@7f0^yd2!s_i+sn$*8Je4$Ckv_JMB;%j
z=xA9^%&_rfxZ0fC=RmB&XN<~cjGLWxd%-*R(6^Gx=+Swur@<&nH$!0~<)cME56@KS
z&8di-sXts}^}=C7S@x$h09ZhydEq=<E=SOp#56GvvHL{F==At#-b6s-t;tPn>E}<b
zM;{!HFF5mzK>XnEw2{_Y9^YPX2i#0~+%~oHdG<HYm#xpb397CckGftv^QHq}+=}?7
z0t91)kTn5pn2)yO#F&~w7$J-{IH(OtH)NjX+8oD`#{BEhnPYOzucNl#=I7i9@a{Rf
zH9k|w1OqImjv;4u=jP(A+(p;i(Lcv`=(`c@hj%<0H6nGML}~G{hwx)NF@l})YXsO@
z@K2t?MA||Og$xon<kg=4{^;}KYnzqET&ni`!=jr@QGgD5;(B|J>(~*qj-~Muxaizv
z>g^ya_EjjLK=$<H(QNBK7;0_?&EXYmCSjRl;oCsiyLQ+8V2&04E9(Ua%>sFR7!xw*
z_u0Hn@u1%wk9CaC%Wi7SeINH2Ai#*EE!PnCCra|UaZIAxo054uR$q30^K6+3YC$yF
z*RmwDCp%kT*p!oc?K`>3N%Z<xE)WTara|)8Pj^ym|2$P6a8TFg-?2>(X7eVqP4V+;
z+G_poWej}bf6Jb7SAeAq+Z|^spP2V&1atiUv@l0q8$7|O9c)*XE1Ye0@~fA#X2Zy-
zlQV0VRV8H(*qKKP2GeoMmAZT(htqQ@1;S(s|AnC@%{^iGrW8QMP>cGK1Pz|4M9CJP
z4y65!p`L#+lqu)>4~F`b>-@pdN9jq~yLH3^W?IL~YR?U`ly)vL^r2O&q%Ge+m$H$1
z6f^^8Nh=m@_qj6oOf}}BdvBcb^j{ci<xI2h-x#X%mHI%s-iPC&xuchGWxJ}e>0kJ;
zICg@zyxF>nD)_Us(+wxKh2d=FhiZKntCmLpg`wWb<x(rj`LP|RGFd17PGCrZff5+D
zX677y*7DbUcZ@B4n^N=U_aQ2VdM==9Bl;;lGMlzr{=N3Il7~`D@rl>+BW9X5gzw}^
zi|RaDIAl~m@%=_wneIqX?>Kos_FcK$1FvfA#T*f|p7xy9&Cu`EK2_u)%Wb<brcIqM
zkJ)S@2~RjZ^o)bLZ)y(lEgbQgE9Rg!Vd^JG#czfFSlc5c15jT_WD`_mQ8E*Kde7Bo
zxxJ%8&^zY|NqJEqF!OJYe#aD7uWmxBsqtl}H17ur+^7I^LO5@8(`#*^2|&__s%a!Y
zqvW1-EtszvKu%B|1jwMWJUT7jF?B}TXQn)6E4jiJcYOJF0iD@xr^18a4HAuAtfSs@
zoycos8YW+wF)-3F|8~g%!D1S<wnP{duezogiE~^mw94^?`GVb!D54ahssm=%v$o$f
z=}-rH-Hd0Rusut-fD49eKkPcUa<(v6ZQ2?Q01&(M><mv0LiDJJDCs$`Q*8x+62HP-
zTE{b=!23Ppj_$dWZ(7b0k0$O+G1ZPOBZ((dgD{@vqt;Yyv+Az$l-at2_Zc{L>P$bg
zl7UBe$z_9z`e|pbu?B$WG8*<iTHLFzG;@WsW%*fvgPJcu=87Ut;%h?m!6&Zs?dM<Z
zg-3r!i6)74Dy~{yOjzQJR<Dv?H6GPu{xzc788{!WtljGq6?sCbrRV#O>h#pA5)@*m
z*mu#^^f^!Kc-8X<d(|{x&c8R2=L`+J_xXO(QD*;2JAXXOC5nBx!pT%^7>fb^=I=Js
zYksfQ6ZH6WIDrYjFzT1S@yAP_s7O)-3eDr27waNVy}}+Wt*3;GbaRtO(tWwT^vaM?
zPtSjEV7}4txur3!p$A|`KQ@E+^?f_jiou+j&5`L1+<K>ue6&4!)iFV}QNTHzYn(n6
zB6C2=KHdfKs3cy{no5pgy|J^2;9J1&qSRdge1|)`KIzJv2P5N$pWJT^Ndi>z1z0oK
z8h0ab*&+$&$6WJiFp*V}rJ788Uk%i32oRZ4ku$dWJs7YznZB%#%bq<_x_rILI$!H%
zO(Z0QUlu6}D7ej9USPTTl*C<D6vRiE{ynoRV=b-aKs#Q5ws7c*?fVM9EH|k7W-LKS
zdI+H<J;8j8)^X@@fNKv7px-bh1XNSP*F#Su<=JUo3zsE{DyS54X?1EP?xXxMeEjwK
zSRycRH7-!QA2jKoXt7S8h|{>l)=nu7ezQOak`d$|ET!!tOPn#S?mY8`tZDfM&)<+3
zeFFv`h_0(ixEuTR(&ADB+|2-p1OPxRcx}@GCcz;3V#!Pp*;+q=KdisA$^&lrB-T4!
zNv`-39!{dyBU(+D0VRIw4p~fWrkBAMb$p|YewcMLSk}IfzW^$}O+75-(QsY|Bmyzs
zuB;<0XJtxU2Im6L3oKCLZ><p^SZn*-S?(9gJC}^TGhW9prB2sz;^Oa}q@=FX3rT~>
zSJczK!f+I8?Ylom!q?8_)9my$oXX<j>D^pS5g(SgxDW%6hZYNs_@7)GAdlgl$BX=)
zXMpvHSF-~KBanTf#u0la-o6f{JffmTagk#gVtz_FfDqQz=5fJy+ok-^Gk^?zGJZB@
z#BVS$y;%JZVBxgHRXy!%F-5dk>}vUi>^tTH!jix~ze+$UPBByQMzcPV8w$YDYK{S#
z+sz^zgo@DV-PcdS2$+Jt8|1UnRG<E?TR6m#|M8;vpQg~lfr0X0SmlqD=!vUoJLN8;
zOsrV{(2LzuKU_vYpGF7nHE@ebVrl<;`WYDKoV)Rab%>NdqbAf)Ct2yW;b3*)PT{l8
zop^t_{Y(ki%VszFA6`{4r=LZH8l&b>Y<_WFNEu3%OUg=2X8Q`ug7f{hRiWW~SsAdI
z!lxIv%ryxCqxJ39LgEt&&)~Me_kZ-Y+kQz_2Um@A0>v|=Zh<wIFVb+Rc6YIzzzl{0
zyb>NrHt~Vgsw30`Q}!;RIk@f_sV|UWy{Sp(_po3Fh$bE4X-3xsq$cjJ^%?ZpBs#}T
znOobz8od(a3xE1RBk2Uhp9A)61&`X4`9cS-GEHWK-B{`F7{-yNc~*={x9TU~S7K+1
zx~@<$)aTY(fu0WMZ%>71924RIK~FGJk6&x_xh<-EWgp&x^w4JG5z0>?Wwd<0I`op(
zDk~30c^7>kAIaA3r=+itkXfV0;xo^~eXsEMi1ob~eRW$m=2=^OJ4P+mlik9ffDPvD
zQ;IkF8JU=XjeN1A?W~$;*>Q3F`Pz<`!J`fZyNi+!Z+9#0n!q^d9l0E*w94lVVU;|^
zX9oARq@L~8mG02+$R7w!)b(EQP+v&--el64HPL=4waW#c@~lZ6?(VV@c`539ebsMC
zE4%66s-w773tRz63Kc~Q{`lmz_@e}YsZO>_O_!w76QP#eK%VE~Ib0Mkq-!7_7s!ie
zHQ>2dy!<fd1U9U#^HqdXB!Pof{${WIxx_H3H}m%bQlj78xf{4*U3<{ZBkxaU5cYU7
zH>lQ>?=<dZx!rk+Fc{U62&}svRHX4Oz%K7_PTnuX{44C$%_l5id)kb7ORPl)=g~Hf
z&We1eMSu9uyD!Eca=#cetF5mQtP4N}`(1RKI2z;&lb^<NyXdD&;j0&oIzv()#b!yg
zs#9vhc%v3jAdBV%eZ9n5x^|zZx4GZB((h5^mB_ga5MGrnh8rqY*ad$vwH|_h(01Xx
z_(Gxj<K}(uy6O%7w<Ug&8<0nGW<FM{{2z5@4<5dm-7@iOUCP54HQQFbeRY4BFWxik
z+77>{?UJS7)5KmmL!p~3lY$d(zg%8~YhkvOyZPw1j@J{uU?xW%w==!H{zEJ1^iiss
z-(G<uBM_<Ubqe=(Hab{0cyiyTZr7ldfZC%Fp~1xF;-I5j!FoCYbQc+?Nh~(iAOQ-B
zOAoca4ix{+EcV0bV^N5BX~-YifHSbr!tX(0*I<4WmQ6qiy-6s95TdRDoA5HA@~m1-
z26<;fFJ;{25V2bU(Arcpu27{>0PUAKi19ivGy-zF8d+OSmp%us#iFRGa@X<$PKcq9
zMp}y|q~TH+UWD#85eg>2FVBUYkiu<XPml!R_3Mw!t_SPEB2$aQw!TB8)<GI5u=74p
z7T~!e%_s(-ZKVcaDS)oc-8x*S7x1Kii=qd4JppY*CMiUP`$tA8FxIXEY53@*uymgJ
zr*5A3sHZS=TR!2@l7nb9um=^{s%O?y4HT7jP+p3{0Q}Rj;n%RJ6c}yP5|YYseq9GT
zl7e$HLQep+eM`ucC1j@v>M$`HG!G8=ffTN07!*OhV@La99U7J#l&gUyq?nCTlagwn
zGAh<n8kHx4QUM@LN@L@&C}BYO3K1$$eaG26?r16Dw+U=t0X3_DQc8@Ft)}w?Bz}d3
zqtHlG>eo}jVXYLpDU!TUM6L4Bo`)hX&mj>72`5CTBN3^w4qUfO0{)D=u@986h?C+-
zIsX$W+MN7(KkkGAyGB7yOM{N_DeR)?nreIAmv%+fKz-?CGf@M%>Qi8mw8JKrM#>Jf
zPD%by4Z_&LrKB1BJd<oK5K@#h+OtSZKFCWX-O(l8c`D7eIoT7QxM@ctfJ;9irUMm;
zOi9p8Xc}mOk;@Zwy+7mZg-AMKBrsA3F^W>XjXK6<g3+1uHJNHAjHY;-h$x#iy|g%&
zXRvF@me^-H{D}CPXInk=(Jy04E@!pAMh~q&V;+0d9A#rEomLOez7?8Q)}Mu5V6dnr
z_WZGoY6kLgWREDGi>^lh%Fjk?`hO6$u6Y282IPExDYD%JY>LW>c7i|^ax*{Ba?NMY
z_UCe&CR;qng@%M|xLE#d2Fd{ve!a{)G@&<#=WYMQsKZY4b6K;ZUxNQM=fRh`d-B0t
z=v<m*%tKf~{0GKem;7i?1V>o`*FXW!asdWW$R}1PpkF9-r|@iap=ep5_&}lLa-kIB
zxs2HJ^ZL&(927?9!|r&381=K6#V~bC&soYKYfJe$cZx1W7hNtZG8iZ_S}wYRC^iu*
zzN%krcBlA8bg@NQvDHBF&E;ZS#0#z@kR>ihV;Qr2`vr?WLaT+wefh;*M2VMJiAM`s
z-mc_+bjgFV68UPh&vHo+qSVK-<e`4)gHI*FR16hS5^7l*7f>3Fco{@hQ7uaoIA1>1
zFX6(yOuh3mWBH}>9FS`cc)t2&z$XwFA1H76Wr5OZS@E-yk`~}g#7oP3$Rlj7%QA-R
zV^WjlBd$^UWk5Muth`I9{FQX5Lj$n8tb8z_oTdgnh^XlNR6fF4@j)rH-Lismr#zwm
z%&)nuv+J)ua+XiuNywV7h~}tVC}aFK@XFz9>MzSjO|Z&kvGUaej&c2}v4IMf<nljd
zRXM>GCy4Ut7LLtlmD_i!a=a?H#46#gm0tp?N0+PDKS_u8v)H1Z8OkC}F4aWTRHLmb
zm}AtrNKnu##=w>;`SB{@>2j!eHGdWxCaX$1hFzAc_R%uuMe!Pi=^ETtCWk9J7NERn
zA-FXMweW<Yr(S<X)GX`2jx@;^%Bm81_)0+hwEiTz7BO818+?t7sWhIhS8S~xJgDPU
zZWyp^Ffb6QfU|VYJqy}|u@yI5c-Y{`)liA9-`219Z$;mDRr&B$z3p`MeS^l3*4I1c
z+)7sEVJjTbR#maeja{`_Y8$Z021S4{>L8J>iga%sc;Q4ES%;#NpR|3-)~q|<6cf|b
zlhpVT(G+M<8}Km8-nHoyqS@K1wfk8^c2Y~LRTKST)2oLq3_jWYE@&4l<98C0ed6pI
z&bv|wll~R?-Hu_60(a3Suw8s(l+;4=ur+VAg>ukRhi)HLYLByOEVHVt8*N)TXv-^T
zYG0`*t+aQxwn2PyIJ{uCcI+~`sD$cMOQ=1>#ZICw5!x|s?{}{QH`@A}uKkgC`|H6L
zlv_KKHP<ik4#TY0o!0hQ!fOtdj(J2UoeJLpJ~uEDt#?tcu$n$u6ca9w(pl^jv_@~N
zkg8W2$pP(MChc7<U3CT>v#uRogf6XBGD^9VFS}cgn@?;H*20Fi)rD1g!)CD%5mUh`
z3OoqUs8s8O>FzFVtv7hXp?cJ%Vn|kVBS%qhI`?abz^*f^S&W~^>t2<<+`SMVWF1yZ
z`;h%fCfj!u$#?^S&wk6cQR89V>k`=8P3U!X<Hm5m4W_G%Uai-4d+THUHo{tDiDcyB
z$i0VWd~P^UY&~F$qYWK8?a#C>%96l5nC@fdZY6OJddF6#m$Thh>F=JeASv**y%}K8
zqR*#iN$y9Uw??%kLI;P2hG&Lkw;>i#^b&4(Oa;A%AAZ6;1o3)Xxr%`-=bIf4psWYA
zRo=GJcRZUBbg~p&eKS1as{kd#t`pB0B@u`-)Ra`A033%_*T^d~Mi(rk(u^?z3$aHb
zyGbJ!c=&G#G-*a~PU77cw<6}@fsE|__Eid39NWebac797m9q!?3(2EBEEb}<w+?ys
z6`J>zk<MR?n*qHxBv|7z%EHip0vzp-c&{pn#`5zE$|?kqV1yL8FllhehJXf>kKktx
z_$5>dUCVXsDXNVqU^;gWf_|^|IpX55pxp2Wf{}=2r;v>%y+t+sQ<5InADGn{<b&F?
zk3b(PWhOxzkTeS2<O>SOgfX`6(Nk2gmE=UI(NwsRNTH_Ki%r^JHQ?`9#JZ0{OQ(4I
zn4Iyjz2Gq<0*lZ|p|d;6{JI4hE7oIhpDK3$RKkD>a1dj&B8=l$8}EZf7Nr1JKh~K{
z3Vpt?L=m$%k2;!z#yQCq#eM2Bn(2AOURE*n{vr6-lmE{;Ej2gv%JcKu-qTm&KK}VI
z_0yDvK*Rq0QQzBDmYhRNW|)Y+73$j~^rvj}0e+Zp9=(AdUNqwBjU6%$9v&~B1(T5<
zVmo_(o$~ZOLb_CgweT!UIGq=$kpyN%gMtxLz|2#g4?{lgVFFNFPh|Rek_T2W#Hee_
z?ITAp&mUFpS?t0s0^Qvel>7oGv3!AkbOAN$0^V?On)f@Jfgg}Yj*i6J5+N3L&4YHd
zrt4w}6|{5mJiJCI-gx%3b;yw+{qL?31#e_h5pDYh|8?TT^Fmq|lHQ5C;2zORe-PR0
zI<1u-Sf7quZ*c!aMh=`sbPjiaIA-Q|$NFN`D!mra1xUwu_Ec5W!&wyZoU6%=1=bpR
zr=pPs+_1Pe_&N9VfhTx^goI{zUs{{3+nv8<0-va%AB|-UA;V(xkp*kW7x}b*q)(B%
z<C8XOwtpx?tOY}Z^kH&=(*_k-;Sm0#d?cg~W~O%cys3cH$%?8yLqh&XC!k}1C+zzi
zBZbb6x+tmmsEZxlT0XXIowg>CwGNA@!qTVSU~BV)xy-Tu6_J~$yFq~mtpAmsEARcI
z_C73@LU$zXQE=`HGT6Ro^Bkn~<HI#Z9BFlp@i&OTz-Rwg{_gJ+*uqth#YNV=M30qp
z_qBT-P>g%8DPtXuAt;~3<h9hi_#^A<vsfHG@XMF9N;aG-e+Yq2+kL!{IIhnih~WQm
zyXGfN4ZUj`Bm|8lpp~ID%jL$~!)BA7!)M2Mg&j<VaqEyaEackzQ{jte&t5#g<5^2@
zu#RZJeYnDhaK<tYCOTQ<D{gsG@zEVZ0;AY#u<ac5uv>#CK^Rxf?wbfXK4!k-{vloi
z7J%~pS?IAs>n`<TFM$MG--I;aXfa6i{Wki~%t+%abWy(<W*m8+UG<jRMpT~%$FBQj
zVtfQ|d2bQD#ol@sef18q{doR9a?lg(QqB8<4$X)0=^vw;-hw^ZKqz>_3=%)k6l}U^
zOx#SSyOlHH`fJW3ZreNOr*qO4sD}P};^Yc+%vsHZNf)JMyFGo^(ogbZTOqQvP|Qe5
zp>CbOkxBf*S25S8P&2~Zd^`B3$%j}$gu<rhrWER)8p>t;l(rcU2PElQvjttE{6zn_
zGOziBfk$ooEmBX@Ds~(AGj%XtBq+A_+gKx><!vPMvDpx9cUFga0=9kohDVg9Wza%q
zVDTls#6<qf?Mm0)>1%`wa9AqWdS|kP-%J0qmHvY8%uUYk;JudXPu22nyLRh)AHJw!
z1s?uU){a@^3vWx0>^az8v2M|t`B}5G`~g#clAg-!=Xd#yv90&$g5oahX0NY!n`M))
z<Hh?ith`=7q;hiwCfL#s$IQ2Hj};r`>E>AO+?lAj+3|$OYS-;kz5Da_Tg?JF)@@sv
z{okdW+GpscG<KD%zIA>@JRMRteP`QHQ1kkj!+Ro+m0((QdgX0pPW;TTgn&J!k`&R-
z$?p;|_HsyA#cb{|++eFw<no>lNAa~%{;^WNK8*cX<SpSKUax)(c9YO260|LLsbo)Y
zlQu`_&E_SRh9mS>(YxIlWnw`}F6&7K=>=MRnqi`n<>7tHKZ^`lTDsH27n4G|nmnuw
z6TG+eL%SqOM`>gq#Z%iUX9KUUHiYxW7?y>n!$dJJ*u+*}Q;NXn4Q1X6zBW8RqJ7@z
z!erP>h48RHA$b`G1Zj*CG2^WfchW<TX4RamvkaCCHH9scOwTC#R!=;&__S?nHc@?8
z$1rsGz~zy=9hAFK9v`I!3Nxrs5XboDo9ZEx1-DtQotgku`o~5OqTc1H+gzq#yo&O5
z`NWw*s=M-RUM7kVSX<sAzR@3P<{1--GUUfcKcmDhRWzNo@G|#B>y9~UU#u~xpj^U;
z4~(9jl3G0+ZNNs1uOwu|FO~e=R2u0&m-;%}W#>(tet3F~X@R;u;qt6MixS1)BIb#L
zebm_(P4+QT_u?c(O;a_a<u*U=z$_m_nwr1qCxc{D@&pzmg=|FE>-Ed``RST(fA?H`
z_I=YiN<wewEQ5HFg5dj|cAsBN*!HGw(}LP+P04}|l)!7oghYGG;>^e23ISZ)?xR9u
zO+Q}5KYio`7x#Fh<cg4#K&(7=0~UJR-nmQ@d8#F7WEL&-P5*1;D@MfynC4MIZ#*?j
zMqH@%ymAq~p%$n~FT-f7hupmV@J7|cO)gDI-*WcOR5IJ@{?{7fl(~NJu|==Pi*AmG
zQDHOYoeVNl5C(@YL9}ZA^ATs;_n+)1`4oJ+5p%Z4nlml#Rd{(6hebrHm58}$eO^+*
z<EC38n2lpTaM$=jk{bDY+SA7u*58(m7I<4(^~Sk<xpA9!HGJy^-@+P4Lgt!GMR>Oq
z{|fU}A?+kduvigh4V$k%QzPy8xr@_Q)&_c^NrUkoB@|O+#5Q9``+Ev{xdSxcw4L}w
zjy>@KLcc(>oZKl#tdL2_=WDh1=hUmgE61IR(lW?2YVos;MqbjkXL4mmzWTVxt2fQ3
zv`d?{D>@o|quZXXzDeiYz0nw3umgLKg05`(XzVR*2hI;ox)&Qp<L-tzaDP|0q%<)a
zf4|#-cc<x++U{sV5ZDn5QPk698%vDPcI0Pm*3-Q>mXr|Y_#YVR({4xM3(c2}?~SG8
zft^Hj6!lHh$5KnQoy5$V^{+RKrB#JFNjNDQSWb+kH+DOn^ZPf3Djlw9XwUXO<E^%{
zY}$Wgs1wx@I&Su?t>(QKCu$PH-5iCKEe5Vn)IRNTbH31O@$TNl>;J}3|F;;b)&DOH
zbruT#zj&i)6eA-uf|Z$xlbw}~3(dmKz{AbSkL3{(6rf_G+`=qpMZ_h<L<G-q%1KLz
zU%)C{IIp6lAg0W%siKI})Rxr}xU8jSsH>r@C$4!}?q33_@m~Vz)vKmfSB<Cwsj7uY
zk0ttsm9D+@4Jtx<#ZLL(4ymT2xQ^qqekVSvLrO(R33m*2T_ufNb9~+GhukHo4yl=^
zil>*?L$BMzUgwRxWv_b|P(jk*dmbbAly2TH_VFh^c<^B4fogbwx9KA}%SUSe$fPkr
z_kRV+QDsu6VEun^(i@=)exX+XA(JXoWzv)<kH(*vctqCQMB&_{@V-&i{|P4zvX9Ym
zj=vlge>W>WY%1RBcf8S5qOD7kQD9OdRVMwI;^?0GFP8LqTC{ii^}l4&4A+ee>xY@v
z|Cprz21!G6?JILrKj->x<T}me`8>{d4l1}^Sol2dx%=jGkAE~$Dn&|lNU8j2Q)v!W
zAWeViJ6{$?MM$?^J)}CMe+#66RDrauvgjX#^mTPwT21ixnz-%Su$QkRx?Y!L)P?^C
zLP`}#V}3TK<^64sF1BRVwI=Phrcn9O);F28ZDULA1tlFBRUMz&NLl~pNB__EC>0(Z
z>VHYKM^^`4?+v_~9c*hEsu&xt+8wT4d)M4HQuCkH(f>k@{>vL3Z(01%^>1=?=wsKf
zj{{VA^yjCZgHJvGkfURt`>EvU!R+8a<mlht==gu}M*qe}KYjnPdh}z8>Wv=!oTZYZ
z|Lu+XtjrF#HvaxX3jKfcMnC-dU%XLK=6`vkFr6Tna4A;D^*?)~_%r|68-;11sop3*
zn=l)n7FynIe?CU~#hJn<oZjqT;}inq1&~y4)B$b&KfO_C!M9|M^|@~h@}z%zqnh(Y
zOe&=6Vy2tEHM*$(>W!w=I6o2p#~bZ6Lg9CtL*UYXd84M4lv{b;(sJ(<giN#;bZ79d
z6ZE$6U8Ndp`<l^IZ`8p>f2PlVu!!qHz)#&d{J*_X)>Cq*6sSM5RDEU!A4c^?`~KyP
zs$}3|^=dQn!!*2M=G|5Ne)gJY;G+VU&T_rfawa<c<Bb-D!E3d(|Lu)l2UmcaeL~~f
z=l=FaX(0dhMiZp~>3k8XDt~*U_O&LVvVD9d@Yuh+(Lh`hy>>&!|Kg1b<E&7k-YlD?
zxc#Y4syAw?1(%6sDU26OCB2X0&M<623Na#$1{7lZ{`N-Q>10y>@<z)9EB^9EXQ<w2
zX;&X-;J>_4Ss|)7isu_Zd^5=3pVNYi&aiaSUUY6es#QNcI_0j%P2oXOBe6EwLzA(d
z&kSqu)^XxOlP&s4p|U>yw;jiLP52~D{Zh5McVG1r^=G!rgTuN472CK+gBy+Na|fN5
z7C=dw@C$)<hyLF{URsxBYtMMUlt?Z88o$^Vr1oxva40asAv}ZYSL^m!RvC=NWd)4c
zr>wTwWRxy2YUN0ShP6ZtBvCA&WPUsvls=CX0C}HZ%LCZYzo}jaM0UV$ghr%-i<CoH
z3~<l4Xpfq{zd6ms-Cw0kJUl{^0WXcP{jxwLf=@OmHWasBmJgqaNZ<pOTBk~DfaY(}
zO&P`bf<l05`*!4-o<x&56rRrxioJ0YhQlv)zdWtB1F6A^bc&Yp;3xO%nGmJcW6|?v
zjO?mhP#83v<{I%jF2OfRoP)+Pn3mR&&JCu=ySzCE0ES5l$!<LK>>h0J$CE;1#RF13
z^$rkYGVFq1)upFsFGlBs{Q%yN0fpK<y*)IZMHKMic@6bc5n8|MyS~FM8nT7vmx5Vh
zXh-}7<)IdRS}*YM&FXNbdsA=KL3c2A+<Y>Yz8b-DA~@NpDcX`W`rXeYOa=Ix+SEOo
z>`WX~+PVO4*(5E&;=^rP_(Z8!h}N@|21f|}QtN#?M3&_W_Sn3OQ{gPiFM|Tco148&
z?2i*#3r$YHR-hi~V(6$l$~LplToLVe8frYX@Jwer{Nl|fL${^(F}3+`18<vakA247
z@?PjtTPo>)T$E&}zpnGzFrU%iMm8RsLx-jr2ZzMo#WsTRot(9oLMZrv!fjeLM{)!W
zzp49I?+m6rw8UjGufVafFHK^L32cN{D1$=Xn$4vI^$STaF8*RCrlRB$=S@<_EJYby
zMNu;*CcLeV*Ch5fOo#v6DFroOLyWAqJGDq#N5t6CaXD)_9)#KnPtnR7-AjBtWzRsP
zf>$rvray>VD>=s^)-xuCa(N^X*E9AxXf=AW{edC&Yl|i4F)&{Jr&L9bLTKu@$(pyx
zbQnND=2bM;cw)=0BppjqSfGgn`ziY<Mu36R!8SG)?8X8mg_F;Z^U>gRP)YFZg%3+W
zZ0=@N^Tlz@QHH*-Tk$ws&ojGwQLfeico>uL%!j+7R#Oe+>h#3J8_G|c4dB3Qyk8+}
z=lQJ?Sq4Thj`oXmmk<!q;SXR&WhYA@80m3Qn>Wxr^wrYY%daNJ%?(4>g0?T&hFHfw
zx*^W?2CSmXyuTXG0>*0QOcr7jm(@81nXL?BEWFz$Q;;(*zP1Km>q~z=J;~>9#+}h>
zXDez15jH5gIvq3>XPRj^ZqQ|BP39VpwVrp*V%n{-ar6317EM12xML{rP@W@%i&hvQ
z$H;fp{#t)BA=0&9jko;HX<Pf$_YZjbp+Uw681}++rR#WbfZhu3a6jd7YqgC(%ZCc@
z0S5`8R85&hd@RHyVy7CK&%@6&wxaq1mujxeyd*Vp^Xuz8jo5kaEPzeSlLGc)zb~eL
z%c3`a@G6XWOen%6&pl18t~apv4CuYU*zlJu%5H5`2DE>r+~5Q<I1hFrL(a+LW8Pid
zqe%>BXHr|bFD`Yix!L$+C+t{*;S^Gu@?s)C)x*;r=hPZeX3mfK*6nfUw?XJJDI)ca
z+=r043jzF}-kwW?<ZFMN{^Z}L;dSX!YzU7hMK!HU@AG6nS2+RGV@U>X?JtGkrz09z
zMgb|Uk_Iu;@9&>N5<9;?AfOKou<W)Ay*H=spkKw1i69S^G!lhoo)xjKC!lqv=~YV5
z^(nnGF-k1(cp%-<^-XG|1ov11Xx=^jsuN4@)+E2Jr*gkXaf6T0$M?n&F)S+PWX>sh
z4H~wMEAsmvCR9J~JZQKLx#`a_k>>Z(k>x&Qc%e)zTG`C_m$$vS=ZD!e&zHtWE)b_V
zisbJK+dn4upS2yE297lnk}8QWF=28m`39(38xzKCuGjEqyq90g?`|ZO{5iOH<Q?og
z8)WFTvs%@wW>M{qTh8xo;1ul5C@J3qiFN~8u?4l$($<#~9^a6?7m5`j__2-`sY}lr
z3RM(@vlm31Hrhcq;}Y!|3_nzB(i<f<@o4jYt2^G8A4UZlwsgr#s{i;gA{W|Z%Xe?n
z7(#x`#)mwZ#5OIWzzS$Ob0RG@Uqc?XjtU;T5p3fn4FN$mad12y`W3+FDu~t3S5q?a
z7=3;B;1+YMAZv~^&iz)fG&>j91uVW=D+doX$3t(;(Jf<X8UIE_bMWBc5QyMEs3?Ih
zc)?9(Kddsz3OEK?1DJyg!A>k8#03ZZRJhF)i>bfiCdvw23u=&-xzQbN+w{aufyD_+
z;|YsUpj<_E(iWlINySgxn<4^XEWS(F#t#u83Xysn5fG-xu#Cv)CFV^Wef;TuWTGDZ
z+4{e{(RBZ)jEtyfRBv=DDtABXFK<*KI<$b1#UFi43PQ;Q9a5qzr*4#$UaFjmE;5f{
zDMajtLQ*o&`a}n)2EDOA3QY6Z?;`f#hagL^8!$PfVJi05DDsIWLM|+loy-pd+Ef4I
zGzE+~($2?q7ofqh%;dP)Dfrw{?9x7O@I9LLYGe^b^EKF9e_d+emKD(lDh`17heBvU
zNclPG2^iA68brKhws|d~@jIRM7`9shwFLGlgwUif3htAHj3N>PeQ2EW?P)g>?@ih+
zW9j6H_nA5w*0&^nHgT?aq89U!pqgY+3nqn0$dd-+a4e1VDbC~bxWpQb(9=Bws^&TT
z0@ra3ChmET`-6;%9o=_lX@PIZV33W68H)F^wl_(QwTnicq$W9@N^MrnkUsbDYvR(F
zgpRavV7lh>_qG`TAsGt}r8xxkC|GF@MNff&M_~vYkROY>-;WZZ#>Cbz3<A(${ZS(%
zTFGQ-o~tsVsTsl)+0Wy~4~iIHF{Mt{X-!Na)8F$aY--90W;)?L9;9kAh@y}m#Rtd4
z;Xb$}re|*NC8f48pT8n`KT33HN}H2lq;N|W>RGps*j+e>5)lN_0Q>#TiPB@A($r+r
z^MOJ{(N`0*8BKDYi3GOLsBcp;&ZYjPi8h~Z(Z^iS-`_D%EXwR~6ld7X9B0Z6OjNcD
zlXSTEtO0(T_odg1>k=b#$n{L+Hd&>9)2v1p(9LZO9+em9X{3^$zbBs^KaYT7Q7G)w
zMI2ZHpK&4$8N`A4=McUxX{M!7(*VG9bvB<;A;_zMLkx8=2bCZJ-dmvju^^@D?BKa<
zzh*`y5@?b5ymAgIQcZV~_#9O8T=n32#uQS)Mc!;&MxJ<2@uSQ=7|j$vjR_SJC8aSG
z=ITIb#z|^i&%N4l#rGp6gU8@K_IbQ;b=&uNV@;$u(bf4*aa*zo%^eh^MT`uBv}2VN
zd*k)(>`_!fbPh2sU2p&ZYM)YI%*#j=32>DN46bHO!58>g00DR)s~ux{^vjd#(zt_C
zb|Nqi4?M4git~J`1OT3pKpuY+q9Rm66c1!yFQX@dwDSQ~oUcx#U)2Y^YL1R-M`@`1
zMToloMTpWsQVJ6}eI?r0&$8F*b@)asX}hx9+m9%THc<GjUzRK}`2xJX6rZ??Y9rnu
zv@6&%PZCS6S)>ckiKVWejibh2V1;C>&xIp6MDl5D?XoMe0Dly082-|B4jG3lI>7_q
zag<RBQIt3e^00c?q8h}P1LXse?f?b>uWFZ*r$kW_RAZJ8z(-g9x}{*^WmFxz<Dgv7
z%Ox-M({$9<q|RJ-^pa0Bjmc{clgC5*RWUVXti-3V6{x;d1}eXR#-!$)QVkebf4Q~J
zmRNg&dkNJ5`omwQU~3O3wL*tw{&UC`0ALZ&V1HPfJ0-JwxsIg}38K_4+5rSw7zaPr
zv2fK8S{udhG&;L7R+0cx2*67*6wL~9P`W@H2R^`pBx7jJ4H^#esl*gA?yxCIxj9e7
zvj)~k2LkmhBmMIMNn%d}l<T3Cr?vVuuf$Qs4_lDp)HdN7NDU)PJ^+Mz1#tz~;u`63
zKxkqE)DDodjBGn>J?FwmR(_Lz_~r<h!o}C-+=`M^q%Oc@h*w*6S=+hgwvkhKJ4Lyj
zwGZTE(7t5FO0#Kj{x)cQJtB%<GnXIB>SMfdpxwZMHQeD`!M6WA>@ccn|3Q564aBhF
z!+0Nzr6g(q7HEHX8vn=-0EGOdhynu1e<`BXWbPR<?-3cx-O2xkoFT1t5=|C)gXL7|
zl$hx}_lEqnwnJ2<>v*H{Vqh2VDs7Z@mr6M%b&m8ynqE_do@<C<hS+tHo<S?Ho2$G_
zd7=ydhL_XYLm%J6Wes&AcJs`@`6X!0+=_WtX{}j%994L)x`BAzx-EyuqFtRvq#oW?
zMm)C5$@=ZAS1<PwgE=>X>xki&H2qCH^m!e$g97oE?&C5<<eaWEbX6O65gC5q5Ka`Z
zH-&unh+H=54%uK_qVykO(ddjeMlWPeEaRTt+foTm{~_`Z)BYcJy7DC0<Si0%2TuXe
z7`=g(c_!-+;eWbewKy_&U_U1Cl5iK)4+jhTn-INXhkEJ>XC%-M#6q(Z2c}jz$bpRC
z7s=jp1I~hUKkzUoJJP}`E#7mm`3>3q4OzVNZ94s1-qlPP8TuWEe&>cdSno&4&`o9!
z11dPUW`=o=hPm8yxeVVetB}6G0dYwfuhRF^{-U+nWayF@;gX<RLj}SKBh(6J?>cM(
zi+GJik=J3#cJx$AG;AF<G&l4c3r|i&9-pFyKVVTuo^TmS__==MD^J)E4t2s!(RSx}
zHAIFU58PIH_dRydkR9<QQMMpolZ&2aA(mkr*Zl=RQ{*|ylPz&%I<mKle2s@BpdiU8
zC{^I}#M39t!B0F9x9u2)?C9SOL0i^oOXiRh`LKt-koR*YA6CG^>=@iA3^X#-sm`e+
zuW_y!3F&o)Uv=bI{5wV3ZufiCk>_qwJ+uoTB%2T37$S4XrPI!jIv&HmW1%N_$lf~m
zH*Ug{2Rb2*dKWuYj~(_po^1SuY_33F!6MoKuppy})1j%pVfI_ABIA_KMz>L(nHk<A
zhOtMCGl0+LMhyCZx5dM#(o<Es*LcP-%BP9^iIX|F=S@hYB<jy9vIPqVc_H2$53NbU
zx7NW;6uLJ2G^k*z|M*K}0eOmwhc3)Cz3HVfoV)pmk;mba{pT<9s<V~H;0+S}73}ap
z;J_cs-;+3!D4uvI889_8^W`nWoQN7b9{Wkp`ZLV<(_;Yo3(tJTFJ$sM*iV}7>m%d?
zJcQs0CowFvJVL0=A~n`#$KHIpjfFNPPMytNz@MBk4%CFYX{_Q%blmEzp2n+KGN6|c
z<V~|G{arXef`$zJ;E5~=ME$Wt{UMF8)GQw5FP5x-GkN?YU_<ZaP6X{(`xX~A%D#jC
zjRS#E>ns=@eTt`zR+~7BrjO43>d*T#S?y=4&Cm45KQnTFK5PG(J^M5F<Yzwba-rIC
zk<Idp$IGR;%Vq7$<+IC`C(G5mE4BZ4qwP=3!hF7U{!n4V2HAM>v0?WfvM0(d?I?>x
zvS4dTD~~-w60foM7<WW8JZNcOWt&;;e7y3Zfb19#H&ZjCk-%EKlY~iNS&vpJjCP;}
zlCUq$56Z7El@jy3*st+xp)%x^6H@5r8ff7czrt_C5b0C<FN5O+etM^$9_tdZ>w7lq
z2xKR{`Z}ei6M0HTOR=-qZtw<f5R*1IM|yY9ZHxegFdZ9w2^);In?F3*d2Khjr8b8O
zHhE6V!GwwhiE~>p>#g9L1qCG48{Hb*=u!=0jFQ>rie=ZmvW-*U5Ix<1`mi&d-@anY
zZt`X8YRC5Q=qBgsW>CS7RnR8Smu<|*j=3$j&FQ-1mov8#cJ03G*q`n=<?Y-Z+3i-_
z^UYgV&D-_DaMz*`wb*w;w%`4zY$$dsByT;uYBQo^kIIIAx888_q&b`uiQuD4E=-E5
zTBo4?r2L*E68;<#|FCxaNxt$Ywu+mp)EgH&$K<y7m=MDGa{cPsK_KwZ!fpL^&;eBq
z<(E6#etPJW+>@EmWy5&X8+6o{cQlZ9^s1_-r{jo%IUZ9#mK!_LJ31QAI~Lm;&ONO<
z#1;JbggK#+J(qB|%L#>OlR8=MI9Uw}Pt6AtPdjVpjD{vosNU$OD)4X2={c3tQ~*lD
zkY3Q7GN%y+XFca=z77=%LJJxHAG}e=kJKKUJ9y|plHa>UqijV#syF)n$Ca!M=<GVp
zb~c__KlYr{r}3XxOHB&WWxSpbnU-BH_W1tk!^&jtwF-NlQkGSVe2VlR4zb_g|M5nx
zCf9Dhd9V|m`m#valB8ZB%CX;gcD{%LqI#p|VsZ^;tcQaBA2ytZGQBi;m6~rk4ad^n
z_-yrQ+hzQvS(Wo=PQl``0-h?>(;p?VKe963r8N`Gckj;G(%SZXn|@JV=#)CgI6I^G
ze*RKio>u$AKR(sZ`C1ldKmYBGeo4E*u55W*D+Zc2baeD^U-5lblRNV>^SzCoygb{}
znMeJ*EBfhWrPP3EF!MD}4X9D5yDG4eQ&Q9d)p|~oKJTi5YLOvPS_|bgT`i`rbR^yV
zqV!Xx2Ah@dh7P+`Y8Uu3J`9mE8@4>G%d16$XDb+5_Uh|>OrPBMA}m=zS2)Xe^Rmd#
z7IN58;y0IC&WdrS>W;FRO@q=F@Kx!tLb)wNx%b!J=LPrrZW$?jO-*?lJW;o0tg>}f
zIjnfN{g*d-TxP6FcVQcUs{Li*Dqg|iBQWDdU!ren7BML`*7e<|Zdj>sk}tAU7wGp+
zn@KSu)`&eWg`#ccNA*S}Ew6o$Dt-wdLa|QEAqWs);f0Y{B7kUK7~pU%+YLs{Dj}BQ
zfUx{ee3qnpB5b7&XQu7KeC`2oK-t?oDId%SFYL`+xW#&=-%G>}YgWp(&st&<8Fyzo
zM>g(`rOQiII&MJX4*UxV_P7@cFuZxgz<bnhpAczr?fyKk6>82h`y$W*d2=Ka9IM?+
zzC4?~+%xs!R=iWgnEWie&Nm-e!{uj}g@gCF?L5>XoU?i_hs9cZF5F+dY&ZLWDR)2a
zdtBN`volgwq)qh9sqAbbv_zZa`A3)tS-b3<U95JCMeh<kAX$D}_3f>EgIO(*$6Zh`
zF<x}7W<GLj;^FTJ;Ra=G;?uq;E(Sm%2>>8*l&nMOgBFF8f7b84P;Kuq`yvD|&j$kH
zdFBBSU3NmmRU{P&&0+%1Iiti#7Qydn@J&`h4nVARmTo@Q1@;C)BHCXvA$fDTwJh8R
z!thfxU0k#!RwzI|&bLbRRAqa#)qPGFVW|)SVi5u00I&=QbeG1l(S?}?e487bU5O^X
z@A!Q&`0mlxq`Fkc%3Dt+K;*D6Tj-4%*;{2MFw(<|Q8Pw{7cT((k?a7}j4%M#l5^RC
z8D|bS1rq__nH&drY3pSg6}uF8NHmC{saN3~HaLrZSQu+g?8_Z(E^>)?+d8zVd`AES
z4EfJcAEbP)7Z5^p2nq3dX4E%Vfeysq;`sVM7`xA?Cc<c6_>)2jHT0ekLa(8Rnubyp
z1XQF6C`wTXO#u<os3J`Slp-JsD$-R%6hdzb3IZx3O$9}I7s=(E^S*bTTRz<H^I>Mz
zta+Z9z4!lD%t5FyTZ*!eks6x%6+PZ2wzLRHd5Mm{3jy)&q#xh@a#rf=PFMDZ{ms9i
z()X7_0pYnhFi&GLyD0E7%7`3V4yFjmi!_BbPyiF{`<&K(rU1T=J+8TgL%y?Fd@u0Q
z3!xIwqH+W9nQ_{%V@e<JI!uDj%E)#FK$qZpRcxuAr9v|7=R^(j7rm|-EO_$Y@$Iv4
zUdsYx<(mf@A)o<)Ba!rTx`n%TDLp6dtQdI?Ut)za3-VSJ`@rXW*^@DFh7hy>3_?bH
z=n<G<NL9ICWCJ;XLei$98v1+L0~!IhUls|94PT{#1dW541GHjrLMMQs-HzZ@O8ZP8
zkvI)JCN03O?p|Z+oP*>(A-41pK$Byq$Ny;3ogsOD>rJJ%89wEnR_)19ucTYN;*@Kz
zOf4ao*YNqxAmDVn^$)LPA^0V{(t@2RC{>nX7XkrJk0<ktT^+L8I`8+~jpitZWy;KF
zKe*E_Zm7eNkUs@iCUnB!!d^ljPmCyfIH@{?d;s4mYNsLoA@&_r9S!a}S6}-oWwZQC
zn(c@D?ew}4Bh~GS0qxp{8a-_GhIf)!?wH>a97Bi3Ac(!@2MrJrkJl3n(U27{u03ez
z6}0$L3p=`^h{m)kHr6JxT?quetoXtPkcp2p0rC6Atzbm=XTv$U=$DNNAZ&gT+hUO5
zQDrH%Lv%nV&F6{<?2jL8;nCKkO=&LQr-9zr_&#b(^K!^iJWe!@v~c;A#rOtabNfDa
zNQFmw>S_Q08OQ{^f1`nModsk^@;{%hyzfQ1j-tFehHrfX7Qd~R@Ze?sdA>G7?@4<m
zv-$7LhpWl=-Qm|~UIBhnu7k?b04L`0F`hwk#^(<DgRuq+&ek`bzmw^I{&olQ+yH{-
zec4o1`?<et0~3;#8&H7#4wXd$tEX1Sj{f#kw)}K_<#OF62U&^&c2x0Yr1Y4N_px%|
zem^$z=vRlxx`*zw<>v1TPZWWEgqfautE{Js_3^%t-$Cp*19kOMR(p#ojFjTuS<7kS
zDMqJvjqGzm@5}s=S5-6Cof>+e$`Za|-Ozet^IQ@8LuLP;n7#M+74_+IPX|JPyK1wP
zb^D{*7jPgdfX=J>sz|-)kZ4@};73HYSa^W`1rnU5%;wTYxMAgNB!xS(b?R<mp!JQ<
zW5W-x1W^98gsjL3-oW<jF{p)s%B0JKFS}lZ5D#Hq=vO<HtH(!qFCVde^?Ci_3y-Ql
zxS(v>7Xzc`ijk<gOSwcLR)ct=&S9kQu?Ct{gTql38x(I)ajEcvd3T%C!OAljX=-7z
z9c)@;nP1#`$RJKSG6Z10F-O3Ni$E1sE>*f=OR>*yb0F}IkoOQuNpB1d*(w;$>=soG
zMpLF*YZ=^j=?~Z*w6eJZsb=ma=YkuFPZY=if3d`*d*;>Ghv{TF6R%=-C$C~%OE`|H
z(?l;=UXzCkq&c<{;F&{oz4_wA%YifFnO0lxmWsARhD!g?u-#IeWT1UBv$^0<p`56K
z(eJk@4*PZLNo#Q)v!hErg+nzSW~%s?6^ecrja;CX0>jByl!nQ#=Fnas&x(K2pZt#S
z!+`|a`gKVI71ohOnL+MuOP}qVKVL0ftPai|M(_^j9bJl#yEUFG3vTs`T)c5TO-&qF
z70ck_gp!RNc-5i+t8<!gdq85D8g}{!t_rtp@*(K8n#UnE@CPSY%euK}(3^nRaNr`i
zFb?{g9f#;KbciRM{a6M&7XK1#YTowc4*Mmn8QfqxkgbrU28vX9IW0fx#-QI~_Z)(F
zi*o>`M)0|K|0y;sC*)-yn}4LK&oET4n2sri5F!okxd0!BVa6_u#{2O+^C06P2F4F-
zd{{PdO1M<ahQ%0~Q6R=}x_4lkQh|gkyct8mN?&5b7RNhU5zXLG#c*O+KfCr2ly4ry
z@+^**QfJe~7`B6fB|6tJ6CnN$qy0ww#XP8k1jtyu-Y|*n9SX(J26CkmWn=;Hj^6Gy
zuDw?{>w=Ed9^9)>I2e?8OqtCW5Amg#K%lM8{p_!1+5E8}Ne6&E4@Af-;wz>aW>9!2
zbbmNqf<i$-Uy9GRO3ajrGw6;k2BV~xR*jv4^Hhl*c1#9EyN3$Ppq!XulXeD)DT7p8
z81=&p=_G(HgOan_1<IlXPBZmyu<_?n&>0kk;#a5%h6~Uo<3fUsLo*3fgzQsOGEHzC
z>`4Z*J5UfA%|+Ak7^@fBSekVoRojIkfrofusca4aKOUc-L1Q6YC}1*``h>>k0*Hyz
z`JS}rX8~-KoUDFb2vEfL7hO=JAz2T5CqQwQKv<;4Upzr!=PU^WXn<F*Wp;{HnMH}T
zjcu8@-C~PX277QmJ9OZs!-QdrQvw(H&@X<?1BZ5?05K~7L<Z!i*d)mmPBKW$tJh;7
zd7fE#iIZf!W5B$@kX8mDE)*Uz$T$yl_!?YzrKO~P$PxnFHGm4d8P)>?2~)UML?r_$
zN6!}{vei27P!NqzPd88mcg!V+pu9<dBpir81D2cu@{8%5JrtjC(4YHMo;)LMWwy-s
zmO|XN;3PnMsvsK*NLm^4_D}>dg@Uc7EHOC1wqhIqNIFx!YM3gM@dYM~Rn`eaa<+==
zSQQBjiFGwUh3*xu!+;?aMXwFU<~MLJHKkbEX1%$k)IBdoh<-$w;Mz*?d6i&Afta~K
zv8^42?;*Ypht~-%7hqtNso)yw(+MhP4~Vyhf*67rE8FtUb%t5lmiwD`4>Q8@*n!sr
z3dKgY%0~e!Knc&rrVQxxfVhVM|40b;6yWMWh4xUh`{T_V?DB-|Lm35tAIQIg23-M^
z96<dOfCv`s*?I@PGH|w(%Bd`>WCe&MF=|ueL*}WRnA?~9TFEuZ62%~}xFdI7pE4Qg
zFU|og21$)WKzS4vrZItS9%MTYh^-)$k|<yAkTTCBEhZ$M(xt&(Dt!cL2%Z{61c4j1
z;sPky(sir;PqWo?0^!ABKu4~$eYx`Bdb4x2?O?nB!Mi7$3{QYgycQ8=_uqMbN&L;T
z5+i<PfWv`eSrX5Q1-!@<Ht~2(GYTi3%@fWL#Psu8*dBLeC*UD_dWJj&)T(fhJRV}!
zYAb+gL)1{zdH~6aQ>_DlXNEZee^Sznql=L%B_s7m>X;-J>^cC1#Y3nCj*^^oIkQCN
zVyZNjLyQa%#;MTxw~&fcEcJM$A+R<a;#zYk3(zELx_IFfL@~8m-BfZOBvLGE2B)(S
zWU6}&Fk%WUn5db&h6NQ{!?3+3eZzzskFJ76*{u*5{0Q5QIm7|5P{%-etP24-;Qols
zSADy$XVyoYPiC^SxLr#g&|j^$l!~~PZQ_(<Z4Vbwxo|3i0;z}qNy>i4%u@v;9lR7E
zt`#(;ozF@Y;M&d4s!237@TJ;}ro8f52}@JOy49GuRiFIAxtQbRBP;cX*+->Ne7~r2
zLK<(<Fq|&hlrKyXy0YJw7iM6M3K{}SL(EgFZ-TXlzzw|g7stN5xIR%W<F15t>xlqA
zHv_lEPjts?=3|cQ{4D_B!1@PRUi`?2wKb?or$7&Y-A7q8Cx~KXSRi;WNKURG-lFjP
znc3SG_k6Sc@oqmZdmefw^YN32A=lz28P_Dw#kZa{H(M_PrKWua&G8C)CxJg2XV=ZX
zt;ulYIDXxv3I_r7>`J3ArAXns<zW<=p2ykQ7S3LN_l`|52VL_Gt$LfNl*49*X%8-2
zGf(!|hB=XJG8X$E{z=so*K;UG4Mhk`<xB!}l#e+lQTT?S91c|2A!C~a)D{4|^7ocg
zhk_3`2b>&|e2L`yM!RPK{vByhB>l%?*H$f+-0H-;0_5=~nps(MRsem(;XBW?q(ms}
z6pBR#`@HF4yg7yM&^Dc-Kr;XVETA(r!zFw89bw7RJPuV)12nH3R+cD282}id8&sW>
zl6@~B3)l_;&~XUIA*4HXj$@o*as}Y*@!^<a!&m_va1bvR2zxBOW>j*YmQR8_DiHtn
zkf6vrPUVIJkVbZP7m7d)75oaYc%2Z~D2ZqWuSrmOWhoBqIXlOu9=c4izw=eT=H+lL
zp*`e`a0U{VC(A1y4*=9-SW31#7{p1jORmjMePVUn7gYQt-!FFy^j#?6I0S3zCaLB1
zPQ{n~yJ-_8D2I|AFUD@wi!i^P?F?M_G4A4b#vws0EC`8<2f*Yf*!#eS?zvCT+{U@&
z_&F&jtZJ7{0Eg*>c5MnTM#f5;#=2xqi3*v?Wvf1A<Ckfc=>3v%8%5ueK$@Cz@M0){
zI1)z2l+mQwX9>ByB`#LTy=T7nTYWv=EWDoi?mnB~A|9V#4?FxxRt_Y(i?dz#KQ2po
zR`gQ0uqR&YiEwUza^U!I82ML4#^I4K9wxEr4eJ(8EmXWozBm<7jJ@}lNcEXcIA+Dj
zeUxq8^X*<<fXXqCTi3nsRxQkQ`oC7xFMJa?;CH-pEwCsfA?u1}s~_O-PKo(2wRtkI
zJE!iA=cO)}uA4cFft0|88i|v)E)~`+bRR7KOTP3DarwhTkwNy$BTH&R%9lrjE<2d~
z8A<z-n3=plzWn9QpB5BcIpZ>G(%_Lquiyk<(DXx*=PsF(=0R9Fc)xhikDw)U6weua
z&_e9}wPJyvZ-N#N1i{*%7kNR;qe$>ekXCQdn&$FOUe^3U&}P>?iI<=$gW#RC<saiq
zUp<5Wj!H%43G5Za{N{sM2f@H0FoPt6wa5@08EQ{vJ4<E{CUeA*In&9odt|O^GItC4
zaNo`=Mz-ro*?SWVPtW@k#3`s1B7_SOwhs|G8zLGUA{G}So*p7`FGR9BM5-l3T4{BI
zF9Z=M9+kmnL!n8DhstS%qH&?}_Mr-ALlqLKR0>G(Y^ahUNI5-JttC`_FjV7PsODHG
ztzu0Rxu$ZKiqQ&V>EgolEZ4Pg>)Q5Vh8IJPFiVJgVeFGjLT9)-Fd3Hp%a0?2%Zr08
zXT!E9x$xy-B-}=BaY7wA#Z*h5(6atOc>^CDY-Px0Z5eJi7=Ftk{Auetbtue}&dVRg
z)sYcqDYR*`o$NRkekwR3Gb2&uCHy2SJYY5)rJZtgS>G)<#r+TqWo@QXHUT3ZAqv>x
zo<TsK;A&TdtK}76<Z}Legx9?*0qLAk8Ogq5$+p!7-rq8dikHuAKMSh<lMieM;I;$A
zHnu0XqMWW4d2RcLZ5L9mhF4!bm3#G<coILW$#U$<b&glDgRtlqS83hhSCNs?q=<qZ
zE~je4_!bx|K`Szu6>-8c^?FOo9|Lax>Xy_O$v5vsW^{+2Fr<=mE!^%2W{LIP3f{^H
z-nCQ8kU`pbYi(t<wA?Ygk~<hxxcqGY4an}#ZXthk34eIepQV!j7jKjmUBiE^7J02s
z>smeT+W+B=UTdnp_NwJt^We4D->$t`zV^R(qqvw3`<TwNF<rqi-ElEJ|IHg67>s%Q
zE#}>F%pmK(ywU3)w5|{1u8-JX|9JNLXz=y1xa;HT*FW96{<-@4mzL`jgV$MKzg?eP
zzW$AMed<5F(byTS*jZfcoPF%~v#~#dV}HiQ&ZoyN9D1YGvA<hl7YAeie2ZOLj$LNO
zuJFgLBIDMy;tsvh4g0vwvvFI&aocfmJLz$|_u}@d<Nmh9?GMKN`xbYw9LM6|j01E0
z@7}1Ol4GUcs$AEhHyXM)zl!e3_%Cl%zAsz#bls(eHHCq^|C=`|s1dNC{GrSySLe_h
zRT-&pEO&ewu&Fv)>G~q{&#z6j@fx4*ERDeb=8aA?hW`BUG;mvUvN?Kt?a%LRt*KTT
zhmhta*3SR*Mz!a9vXq>vF74|47`ST~wzRmbJ3mxvdF%i8M(czA?CCF#*IgX0y8PE*
zX`<=s`qH1jhAUHT|K*LY&GqH#1~2U!ZOnftcd8EhXS}ue`9Hl;lbw~B?ps>H2c~-)
zzsBl=mk-Q(gNih#>)2W52m87|-%3TQ3<!bPUAk2utK~=<Otm6Y+t0M5Q)RSf)j}k~
zG_(&*hFT@z(*0H~Wa`!b!y83x@KNk*yl>K@<`31%tzD-92E+N5kGRg=LvM6fMs7+a
z!Zb4xALYDiA)eBTosI!}en4lRsN0?u^20d!8Xj<}ObHe3u+H5S^$WjMn&o&m>S1I(
zG%{JvV=qi0_axWILrn^F{sD0&=@vgBdaW03JTs4WFzv#Gr5E|BHu(jv`eC`HP72Sa
z%ZIS%J<zt7ZnM7qPX$`63@HioCq<cRKf<1XR@hShVfIuj%Q{I(`rgGT2TV@D`?H3m
zcWo$AktwPRU(WM8Ln&&!Tv4iP<W@Jb*2YBR;&OqGqSU{)w@N7%d+6gLaV|nA(s!tG
z8eT|r-X4=%Ks)^69B@q4&UJAbP+xXArz%~)qI)B$v5C97dE>LKMjMP<v5#SoX-^Pc
zNmKEXS>_z+7ov>l$SQGbFASQ1T<th>U+?IuW;_&Sg~4*S8-DTkg72n=Qhuw(=)Q|E
z8+f4n@QV77NxjwD9KN8g*H>mhzJV+20OQe}&+kgF72Pk6v3jH0vYzyCrg7f_cRE0O
zlYWXL=~<`Ilh;?=+#Czk5?7~6tq>9WsNS-53svs|2ek0u1EJBG^cp`v+RI3J%xUh?
zLDHH<_t|ZyooRb{#MI2Cz&9_?@P(d<*C&pymOSwDv*IidnY^2k@z6XZ9jA_#VE^;A
z*fgUrjf4n(Qa9}R_fG*guK9FP*si5fnOom?h1Vk`k10>k9RZa0d$&|ZSUTsfh%_1=
zM9w|+Sx(=Y5Q;P3J0&rwpvzQl*{3H?h4y8FY*=waV>kcavZqAl^&Q0>{b<&8j4P%Y
zBE?GBXaO9Ruk*!tIa!3Hz#LZuzb9E5&DS&=3)9_-^4QprweYNy-VWf}1o6F#+MwuQ
z$1X19_?zrD)YBR&ycxxJM=k+3P%2tbA%&7>@`M!loCBp0D>Os-g<Q`k8^y>8-}1Q$
zoCHNY0j3oc%PRLy^jtWxFDE{&b7Ti(Ej;wwM|`-Vt06Trm7go225M2M|DiVREUb{V
zR$<9HnMwwy(8?E;dk8t5LYAsRD4|DI)y?;%Z^XzSj%)N<JJx08G|MXr4D-jr8OSO}
zP9?U`^v-xkRKDp675>mZySln89PP9=t7z&7ePtGwHS|>|I>I)-mCDOz?IB{31RoZe
zlS#Uypz|m1(Y;Ld%P^z(599EJ&<)64?ga%x^k$-0hMhkLN|C^+-FiMN?B;$2QGCB7
zT^avY+^0fr@i;2M)DMO5^K%piBJJa{XQLv>W#*<O@wQ3KT*!h5s`=p!bpe{yI;H?O
zB%5IC#}wMbBs?A>^XrNC3hiPoM20Xb-Toz|-%V9kRX^TznJGnz+&v;}(Nkw^RhmN_
zA&Qf|o$}(nMg1B@G%uY|p-1yu7m-B_K&NFnJZOQ9%8B#~tNN(N3&Ibh6R}0boH=Ze
z2c91%gtZ8D*PLfz3@qCppNlM`wNE;wpXwD@<M1-2=2?D7CHMq~4-dcDwDma8C&yPm
zKlmlzx|#^Ll6g!{G1w%!EPeQO8vW!s#u>#$@jBgQT5{%DTTr=Q<P&+IoBeIH9O9@T
zrzecYZGhFOI-s;a9eC!fQJiBHAMt5$(%LnUd`$4}_0041{2J`>#|ZnK_M7MTpypAc
z4FVz%-8F#YI&@R8t?zfmcuk5yat8dw_!D*X=hNQP;0yMg3H>V_Cuuoor=p>FQHt8c
zZdaeXf^d&|S_gZ0MTEm!-`^U6`jysS>4CVnPjCUX4{)tjl9qC3sN*ZcN~Yi|gzJU*
zUh-wCk;%x*eJ-jCYBT<<f7Ws}Xig!1#~Er_UMKX7b_#c0pTKZqm%$tDw6Mxqnf1nQ
z^8@V+y87I}#yR9pYoh7gG~bniS?O;(2?nL8@80`9;*Mzv1`Vroim%#b*05{l=0<bc
z>wd^JtY!A2eJ&?Tn*d$BLwdxEUCW{5on2#C;p-_j-8=$sKpqLXxAKF4Egia}+>rlG
zdfuqx%)7AX>xFkRewst>4&A|Yss(xbUM^^t*^$+)sHO8?jX_Jk@T$-M>BX*U^_eFu
zvL216E~uV+IefP3P&IHoA2Z%Ab3A8FYjom=^AqYvXY#WL$4dM!*US!=#2N(8o%rR}
z5Csodp_P3cN_1(NVTnD<v8;OFb3xA%J^t~{mFF*bQ%>`cq?X{i4YL}O{`|8dcPP3~
z-WD(U8otuFU-VpM!u^tJg*W_;*S6uL#&SG~9r-h<OHKMchc1TjEe+GDRT08>k>!hA
z8tT#lPbT_Y^Zvs56Wi|eCO5X=ocP0<D}_JFt7l_Kh+E8VL-(a5qoJ2m#o}E?ZBN%q
zs@Z<F07sDX>g%U1=rSuycDM=9YN1of+?~dF1Bc@qPXmwq(kc%_R#ov{YwnuAV`VI|
z2c-Bl(tigfa+$<tCL2kA5vcCj3tB0;nIv|N@6JxA(WGW%$^2L0>#{rF23NzUYTTDP
zm*^^`C7VnqgyIfMJOO>mEa??@q0zscE;aTO+h@m{*B)B-nje;+15IYcE_bJyVp@LM
zS=?VQZ+U%mZk4Nve@1lCrLX0f#w7=7<M#<U`VWHzZZhmAHJ2LW=YM*ojLp8;6AbBA
ztKv-wmhO}pY3zJ`<1JLn&t$Z>h3#pz-FLSM;<%s~ZkGd;a@Ozu#+6-m<-JQO-`rYQ
zFs9|!9p;umyqQIN|A~UZ_xDW3Cy%6l-Y%2@2NfA$rrZws&6PVUdiPk@85%3p6YfO)
zinm5sun3ko1!J4%r4?Bh|9ij~lPQwG(w5(M8c~R_&~NMsQ2hytpfLEvTpudcxy_IM
z_$!$07u0;8Mcg=2#NKpBtC183B>re1+&0>^cFyR{$y!YSo3KvO*Hlv%H&HN~`2?}n
zh&H#&FvTN9c-q9fIt?+OVFBJty%andqL9&sr$7`c+K(@OguSJu4J3sY(@|@=7V1Uj
z4KBovc9f1BArCAv(MDJyC3$xwdv|a;5)`MrNQ_TMS|OH)L}ijEyC$26oCUW{2PTrB
zC_Qbp2vL_~s2^Bp6s2q7sojs-%)^;jPN?t{U2u`1Ja@SGC2bV6{S!{?htqUzpe*qY
z1voFMfTkNjHI!lG>z~!aCZR7wCB;dQ3zHgUa>Pn1PbK9@D;+le4NGpvuYeRBSPZlA
zVwDYuLV$(g`5Eifc3vz)eWmrtM*GB{b~Ow`;}X<xqLnM0MwFK)^iZY8EhH*vgp4-c
zLkvrhA6p5C?x0M)sQ5;b#109*XraZR%5SurDbvKF`a>q#v4mM6afZ4345#loLi3&O
znEOXpW-a{aV$yRKJ#=GN3vL}62N%Os&iBV1g3wWD=pzQsyhHW4h4h*PDG%>#!;r?F
zCz2Hi6LQC#<%uh;M<4Q=XA>4SNn$(gZU+|T#ne1zSxC<u-lg613`u*Y4{b%m?vb?M
zZD<UH)l8SSBARcs>m|tUx`Tae+KM~qhcCirPAF=A4v$BYYFMLqhljo?AJi}1Mi&x|
zlEA2NlF<}VUz$iQZr6MGHsJY>ra6+vrH{UX9fxUc(mGH>;WmjLLY0I9A(e#6rb@@S
zDtR#_cTnalAZ#T;Y>KX7HHUA6Aoa?TYanzuQA}PQIo>Aeb$G_p#PN37i8H~178qrk
zoE?`^2OW>0YtOe=o6^v)Niy?oCXqH6X`;qFeWIYPnN#SfJY5>k#O*;;!U;-qpUoY>
zVQpx14@eOXrBzY+b=rb+2(EGrG=?gve5h2?k3McM?*(gnfko$0^s2)S^fvPzCbo6H
z{1FL-Cxmi!oEC(tv{t0vRW>a4!&#MS@vs=il^{{<T<Yk&WVkOWoTe4&Cn2q(olTH{
z)A3Uf#cU?8OPTR`B?BI)tND<mGF8xlglZ+Byl6MJED!^2-pLLew@=%pImMb0g{_Fj
z9$;zVc64O2jw|GP*KN&x0@a0X%f%>>Q^gfCRm4dm*^U<w42jC0gh<6*{NplLIqCC?
z(iXQwE5RrzMAzAh<4n7ml~qnN?D3DJoPCh)2;sCuhjeoZz6?Q3h48FUwUQJ<xERK*
z6zQEdt_r%w1fGMd%rp<+&j9mOv}4C<FrE&{iB?`bNO%W=ti(%X&|r&nm>1|dk(sXv
z)z70ENLv{C5e!}E*X>y6no_xCk|4T=Oyyy!e+>Z<X{}WQx_m)oY#$_v9VX8IBJ6;9
zFyNy)%KSS-F$@idp$U4?wf5!o9TxG*>g@;T;H`Mn3KOH*p)o)u%0q<nD1vyZ`VL*X
zwN>(bc|SW<y+hp`tEPgdcKA@G$#iwBTl$*v+b;FK$Ljri?b$Y!hg@T%>hHJaPu>|r
z+awvZhl`RmzN9N{Ts<UQWu=xfNNW<08gJubxZRn_;J<5O2+caW(ysn>0Y3na6|@y;
zOzj+?<+iHc|KUgzcnke=IcJ3S+Jbrr9*WOfJ&=S}?X{2aF&?@?rX@8?9^S$MM7?BA
z-E4?1g9TcI6TL<WPlAGeO49XtGUP^nxlGb>6(oKe(<Ie3U*weGfZr$fNNHRa4aUk#
zp`?08Ixf7eJXwvP>}wkI1Xl@|JSN?6Y%?{sz-1H?nn}Vg@F8cWX*gZ$<)8}mgR|Ty
zY6Gk^Ld8zlh!m5E5{x^wReMdEi>gf1Q@#S>AeE#_Ttyof2D~ZI-m^#lyGJ_7PVLY<
zPjY`iNK!~ok;m>3>ks4<R+w)U+n0~eJ<FmEvHb!6B|*3uAZ`nkvW8(R1t0knVu{&%
zyu9~D^J5k<*QY(J>j7P`ovYF2$bqVgS6R+p`=^{+6rUk{?d7N`h1j=5BQoc_18eER
zNy3vQ`(t}_&BYJjRBQ2iA=*g<EoW`Hw$uv`t6}|+zk-a1$3sN6!Ny)mc*bL#->-a^
z!E17-<{xXn0c;V)OBdE8WQMh$pI~YUGX&?S-^RMu>_J4`=gp-91@Lq22O(9be&gX<
zP6k>$jdbHHAVV+Wx@U)pJ5glu1G*-;@Jc(%g7CEO7rvOVzCpw!K@!V`cSSoiMnYu1
zg&>3&NB2lN`?I_~1YS3JjjL2xW5oeqhx%BZ^`0hHUHRxG^3Wbcn}T^^TqAe2O_GzL
zDh%Sebbd%v*Gcm``<JQ@do=tWT?5K|n?Tm9uT%R{Th_UT$1~-xf(^Y`1e9G_{~G89
z7j*n_8}A54WnYdj&M&!jiTQ2@$ag%luO?-|l>~f0va{kb^9U|f+uzZC+ca6X?YOxG
zTF4~ivSx@-H%Y|B&h$K=X#Tp<;2C3+CBtYvt1-HE4b|NAU0JcVZlku;V7b)&jO#^X
zq@Hhc*7D|MmC6UJAu|xIClG~f0**}LLF>$_*5NZ~RzF;w_S(^wYx1W<k2FK><#8*O
zkc211ng?j#Ole6g);?SoM#XiwiqIfUsJ)bhKse3V>j|#40w@0rm--0j)z))Rhws>Q
zzoxD&wSJ_hH80jx$55^AE<V&eOz*FzZ242R{8pd-dhfsV`UqAHexsd>Ou}V@6jIlh
zbHYf?5ri6D#YSDx#i`7%fc{P!?-T@`M^UY4=h`nd&i3TH)r0Z-PV$;lKh3D)gPKoZ
zK1fy{DJFfub}Sflm^P<{0<}0`0RES>?QD}o?lBX$7I&walN-L3I^klj3gfJ8N<mWc
zAu~D*|MLDfo~cjEUYK+CqBAxn{+`!&&%ssJ<~V2K=C%ujNjT146r2V}RI>ZfdGhc|
zjn8p<YPEYL?R)?&TWtzua$$DpV?lE5`1L*r{{+C(+U}g*c=B9Zyl01SJyl#j6Sog~
zPbL!1B;y;@w7-*Nk_h517gXC*?d7n<o;I#X)((#Aev+jwasr=3lGn}ycueUy&fPYy
z=PbeJM;yRBJroYbFpqpZ+<}NOU$+pYW^sUU{mhKN(~^-!dEC&PKqC&5mrueE9ZNhs
z=1!jNQ+6MaVK^<|>MmCS(?g943nz%V$Tz4OWzVi~#jGdskdPRrtW`&ltp&GZyET`E
zrVoRuV-aS^utIm6SuoAAjft(}2UByTeQWdVCS_elrhZ3CN%WD8Zl4r_pqoXe0t1;-
z0gDkFJ8Dsr55<j=#Cv|?mG!=S*gJ|T9u=sm`5~#YSZ$g2iKStIv-m!D#)P;5X`pvx
z3Utg7{Ar6M9zkDXPy31O#Safz3b}GW^E~}?xS)xmZ2@$;#hR`ew9L4IgqxG=u&K;;
zT*wS!Tvnxthl}{N*<P#C*6sO?cj-U%9kMV(`?<xQHb(7w(xKoNBg5l!JRFV62(_*R
z@rQ$W3ZB>xwD)}RcU+Mb?xEm@z2#|bKQsN{;Z!Xs6%~AbjK~~&Ogpi+J36z{Mx?3^
z(G5u}%RY_I6>AFnX*_V!$Gfc`Lm6KO0x+flWyb?vy?JuIx&3y`g{!%mz5!G@uhhps
z9dOwYdD`EBzZSUg_Rm7`4IfO8j)Qecgh6g7Pk)VSWI29blYij8)}=B*%xj$2URN9C
zZ3I<4?>E<tvZL8c1yB}bPIPJ7Mr)JHLPLbRX5^NVOZw)_>xCDcw~Q=M*}8)-Ug1Y{
zS&xaP>lGZQqG$M_vw=;kr{n`zFOTlqWI`e0ZrVLwYns>1FQg=yJA-`L2dWCpH}12U
zM>3lX4!7ulxiAgZa0wR}eQEHyYK?(8w(*bJK}}Pi`K2b@N~}rC`q8O|yHL7KyOo)r
zKF$oJgld^pZnHEatRH%#ajrjLdXaE%Vm!BmLHG{b$0Aus<y1qYz`3J0rHrm@><FB<
z%0ye|=tT+o+T2z<a~Ha4BlkvDakR2TKBJopaj>VN{hlpFJuc9$5=*}&MO09$5nq&p
zBxsy<faYYz$FtnZk5AmavUvJuFN(<A-{hhv9DCv8GoB=%kn!ynrhdOfNXYl(?Wm%8
zKJ{@yvKNyM6Elbr5Ao@|@n7C3A%<sqw|#8+s19{U(SB}1=WN>$`?7ZGPy27Ll>f=S
zxbjc(%B4^B{$q#UsG;rUZ}_aH_umr=CIpeSDB*-f@^_^#`eNhKO}P1Y5A3TE|C-hp
z{uG`2R#a#b8Ta;XJnO*2bZ>pM{%U&Fq;b^x=yc1)mdR_efA<ReuU7vv-vdviH-SKN
z=_agS`RRCeesu@@!NF{m%-Y>M4$T`pWkYx#F}s>(9z$VmBB#{;AZanjO~CM4^AvAc
zY~w;|Co5r1rMyd;z(utr?I%;a;XW(f8L}j+P9*x)iV`n6|4es}-oABPPlTiP2TR!~
z>AD`-OlO^5L>y0+ExLs#v{#WHqtmDIq*<p&y;uIj04B;^=biS8vSC{jlGU)aGCe!1
zPxfhtqdjVOZgs%qPj=X#ro^VukUrb@%ppU8kB%p-)64YiRE&6;NUV~6ot-Vy`Brzt
zUH^IqgzXXGk4I2{8s43R#Gf2CH9EHGtVcSQ?d*hm`q9ZC-d7)bI*K=R)HE~xRCmDH
z{yEXWXJ1G45oa6GGAK{+(@Ei~5?3c|J`lFqG(Wtgd$<&Mi@9r#NBnRPXNu&yhkZIJ
z=D|YESd}M8GVt;;Y7Ce0lyLJik<<2V@sVB@vZ6j>7d4M!({2<-iTf}_E{sp#P<RtL
zMdLp%K9fL5i=2s9dxM?5IlLe~lYSX-hBNnA+8HkzujtF~St#>6GvVq9jXyGiw|2hY
zj@sJwD|V`)`X${=*!6iV7UX*2f!So|g#xk3=<iiBr;L6Vy+3Na_@HHU+`m44=+nZZ
zZ_i!lpZ8xE_n<(w#5|%tMTmKZ7gFOV!xxX_u7ogsUrdDgeivOI(EnBtmKbTru`zT6
zS-A1x7*1w$<mB1H%~6jynXPf(dxcw{FSp2SPegnx+#b_fmfp!OrE2fY+~jy9;Szne
zXqWY)Fb=Ud|KMKH-mj<jKeuO}En6Y9-hD#suPE6Z?5(}UvA)VWS+z@#cfK})UbHe)
zf?g%Hkp5vmzj!@GK8r_EK*Gg~bxP(Cn+|~%>=al+Ib)C)P7|n<Iru<MJiM_U)$2^w
z47_FcqkXtcWigzXk?>`cUmzi4itCIxUeoFkRXcl{=iE-K=p;O`wEdgr2ha_{EeB4O
zNNSUM9zzTZ5iqwR@J2Qgc6zl!u3|X;EpjyRtqn=*%M$*Uj=%93SA&__C87d`sxFtE
zlUlK9=MI=^luxZ?UwKSj`>;ckcbUFvG%}0uwruaI@z#r%C_=&{Or_QYGQk~ZS<*{W
zbhxY?r;F5S<GXVZO)Q%2lycUqf^ovdMLFmxKSzZM@iur;CN~Ptu6!h!K)W88`~z>n
z$;jw4e3!-j=+ZeQ|1)K7qxQMU!ap!1C5D1XsCHIG8=7n(ekGDA)02JS2cNZF;Bo#q
zQyY-j=NC6^$S5}X;yD#UA`i)7;bwFAQ4WbSEshCGDaE$mHOG^2niR+Q9_)SibMY$p
zB{WPWPY!mamk|1<m1DuGP4sPTN1(Z0B3pr?cM2-G9V;g(^s(aE2Ztj`vDr~O^v;71
z-f7}xvV3XMKP9db97tudh3pYWRnO+JTQm=+%*nfO4iJX*#zzuWCpt9;SS1}>C;X)d
z>W@ett!o%-VJUoU3(g$M?{9*C2=?Ad)aUuY?~a*$>|Hp0<vHnO{Zde3X;|02E34ol
zgN4+4oJ^T2XU&K{eZHS^3Y^nt+Dsh$y&^w8F&cMC*11b!B*+qo7eBqDnZJLuFiR65
z4t3RgZbhFGd1CWRHZ3%JRxntgN2MbK7E(MX_U+4J0CJdzl-g%?R8{PPztpRS6ir@v
zSrF_hXe`S(>n8a6J*BsVPq@pF@|E>dlJ8t5ObWF{(kcn6HhpY@j8={wJlgluc-M4v
z4LgiY`7mGO)90eGsJp&Tty4(3p-H1iMvtXdmQz+(BmwdJqn3~9cMaB++9!ACMQVO$
zTx$Z~e<yvB;X$)3pBmD33FkXrh+0bSHRTg;e;Jk_vn7?cEjcH+UeW1)Oo#JwxOgWu
z>h_DpR<6)y@h)veONy@hEa*kHrF?PK%_wyf<Z;7Jm6zQL#(_M6;q5|2UdJ--m=+NK
zwRY;{tljXRIHz_mLh6xKJfnKTcjVclUgbMS{2fBMKPE`LMX3nOKb-g>kyxA<T`*&i
zK}}Velo*T}T`$_5xQJsJF(cSFieVmp_~B3Q5>9QD!fyH<#Yuj+CK_G_(lEA}{q+92
zXNhhdEZHPp>Fx9P3^7090H=!#8?B_e{0IAx(8#;oeSszWRy#^A{j9t34R3~@23G{S
zjq#7=Z(V$%ieh+i=QF-QuT&>~t@J^<(cWCy)Sig88{KLba=&eb+W`q)pNGhoM$!<+
zJ%Un&Q$8+iHN4Q_WX5F9il4!DJ)!Gaz}}clu6thPT$CZi^yg15zS(Y^;w6Xfx4I!@
zrdrZ#mt$Y$PwmEPx9vV9gLI_3Ml?}@oy-KK46K~r5Ex}1nrus%LwH9LwW_$%Wv4D6
zB3!0YP8Tj27)np~<f$}NpH7Y*lb+1z*?k9@4+{p#{Cq5L4BUJdT*mFOP^-B&=v%O{
zqp>vOJcu2M(2RH(c>TBVRrb;H*bS9>nx&ZFZ<V5<tqV3C;w<^?B=aWTtN_yzuH_+R
z(`+(bfAPM-dJjYr0Sa0LCBHRzv8(M~(066kG`eQ$VR>A}j*4!PblP^)rhG78pPOf2
z-k9lJ$=L4Tt1}xSO8?gFkhH#fNx>^UrW&UQqctmMH*$lUfAx>;jlDA3syBSTE1!OC
zjPBW2gm84BYu`|9@K_c~{!5^RB)N)DO6Ep(sP3QO2^^roo2I%ICQ&f!`TI!4YIgUY
z;MjJKS%IvIU<>Rj6nn{;?{Vu}g_Mw1wb%Gn@JeSIb%t2H72O?5q==+>PYS04^f@3(
z2_#kn5~~K#<g1DqAjk?R3JQs^gs2VuSS+5LON?d_hd^32(GD2EddSU=9PN_v5iw+$
zw+tJ{bN`~sJ+zmNrt&_Xh958a`@=_cy!Frn<wh`t<Wa~V2eAV@=Tm|JV+eUSgSW_m
z(~QbXn-)|LklSO<niB3u;$;rGM`Mr>kgjCR6m_TbmJT9+^*?Fliaac=LNQ;-Y0^{Q
zvkEL@Q<vDz^Ye2!%x~3rc#)$HGCJ8a;T|{n1!}JfXMTf*z&BR}{tdZ{W(tHXv5ijW
zo0G4|Yr_p|;aas(7MX&p8A4_u>v<d^s}8$uDM;rk$y3agspCugC477(VpzhDsv)HD
z5~p>QbY2PU6%!dSJ-0tCT(Kg4YgLdnGt&^x<W>U96xn~t@JHIUB3n@sT_y0(Lr5;F
z<QyO+M@K$xMUtUnL#?t_{SC(DGLZ}c32kmcKEV*nwKN8hS&itOMyP2bgD)bTN|3A*
zUEnqNwQ^a0L6o;0>TkwX$+c}n=;TDoR!*YazxRmMOq5fvtePN7E6Xxr8NGW#-U#!j
zD&@~XEArRzy-)#O%@VPBHO-AQiPROr0H*9+2ib~{hJsaCtfOEbLFP`aq!LkVjy907
zz@9=mEV&7#;CX8Sq!ocBN8<U_D%s~PdeFKucjJw5xs~H8YWSvz@;hlSkg!u?2#tY8
z>S#or*Z3kBF_~pKBZy-C%qkz(xw@hQ-B?5J)@iZ?(U5g@(jeRPfadZVhV7OBY*=e^
zRa>b3m#FSL9wAMn;Ix-t>96VC$smrf_xn(=<#@69<g|KPh7wzw(m#;$ofFE*j>ytO
z^l=)N6)ML$4GTSSe}^IrCGx$?ko1}rz5wFglj}HI8Fm+{qoF(d<0j*?FYN<JB2u2a
zczvy`e&+GIF-g|sS^clZTgLtz?r(HWJ9UkFy^S@NBHjs^eAMldOnck$K*T$7xH3%e
zdl=9=Z05mX&b)<#)tV#IudJ;bTdt~`z11zZ77P_arxG+%OSpdHdD^A~`bxPn&|GP7
zF&-i^LC_#~RhVVafFy1x*}oGC8WPH>m0KfxcMZFXDS<apq{`$Zb}0Ngi~36--e1g~
z47*-q4l4^X{#N=-8YiwkncMS^l`qe)oy)RLiNld)*7t;r?>k$cEw}mIZGBI;t0COx
zM7eFXu-&;z;NtIytrPg=3|wcp_0tX8!Hp@J#W9b>WA($wey@rP`<C{Bmcxh8V3<C;
zK9YEjOB-x>AFrpxC1i6<VTVdI@fk=hw^|7AV`y@ZqH-}qiILDgjDDBiZKvh+aPyCw
zTN~Ea&z#P1oFtueKAU>-*vD|slPA+R#I07gmZosF<qJH=oiBcLqC-!e(?9+DqD<to
zh}e%-gLU?-+~B*1bFUQ{a-ZM1R*SgRpLBb1+pSg~-EouG>%&C!noQqE_dyYl{*OXK
z#jLgz#JOj0fAPB8{d9LMk?;guruDn#Hp72ydaj>5`)I)J$H&uWTRm5wo!Pv7cHyHJ
zOW*rQ1Vo5$?XjNxTOBX4=U)7xUeo$MQPttfIe><!@kiT)B~6}=lX6WbeNX53K0S$U
zZ9AfW5m|cJ$xX9F%C+dVaeSg&yf%6<E{AsrST@f_4Ke-Rm&h$m`{mcUPU?I86#C^^
zj9E@}xwrMB^hy9hDc^lCK#M<6$tm#3^S~!df%MCP9+xkb=vfbg1TLytS#0^=Iv&6@
zxQ^Gq{BhKcHGb-;W3uJcDHCgh1k<1cou4vA>3rIj2x;nJOQM^!k93f%+<9*$ml;7*
zs=v?-BKj8GYU%LNfoIf8|B~hDAj=?8JX5lWnKbwiMd*2_|M2r^_e<`LQ+!=~&b7{G
z&*e&AcyVRy*Upl`hAiRAmj_pa#UgvJMEZ|iiQA6+Im|bndes|bhI}3vk$W}QP$Av$
zbV+XH12L0F+ridH?&f^pq$-IQQDhC2ges;kh|Pp3$X!HlhKkG}(i~;S0kPEQUpk7#
zmO%RdQ2fWK$Vrgm#gd3;-y^7ole9AHKR}EKR`&G>HGlhuTq6~^6C~zxTq%#HRSnb&
zU41e}WA#$$CXK($BaaUXlf|r%&YDstmI6hx{5pw-hl;GUoWvZ!B|C<+D&aN;t!z;R
zYrJ@~XaaM95T9J)STTH`D$rO0?~_$IRT|4r<E;xpOlb4jYx218p?Jn4NUaRI=Cy9@
zBGH8!&v#ST<>p)Qoml+G32bD)OIo~U+PR2$eyfR?`mhax-`_UZJ#RQWL3ZXeDh9+Z
z&NPh9<A^EY7H1~k2Bc!VrT3|l;sh8EI8#I-ln$_S9Tq_Dr2H8}j#GqaRQ1Rj>C}}N
zvuV+Ppi}{u)bDvYfuC}MC33^g<g#JXJ1-)N`2BBMN`K~?3!f9wLCIxLDNerNWHnKQ
ziJy?p-fZHiyHJ|A#V2I;C*-6dr|cc6NEe02<FeyZ0(WcG`Ivg`c-bbD9}AqrKkh0R
znfvoj(eF=1%M$kl>T=tE9^SGGHxmC0P2E0i!K=^)&61OlHN;wh)Y#-Cnp&Z>VPw@O
zS-#Im!OuuqF_sA`h)>O~9+w>={Me^T2s34OQ2g$CIkQnY>z^K+m3(;4_2IF|doMT~
zo_NL5mH3NfNrCc`&Bev2Qch!nOb`$nNK?w1k^Tn~vba;q=2LN_>6T&B{S(B3<?Z-q
zfF<WN$$pk|I`BdM^9L92R`&lVjv-O|@Y%(3(3xvL2;4=*9=Rl`0g4PunJ9YdFyaps
zx>~aA<;A;C<qx881mUHVnNY7o6%th~6!rMU%g6RJk8MA>_7cS!0KV}l#D@^I_1406
zSIar0r<VB*wqF{4M?JlnC{cvx`Me!@*eui>Z6vENM~l{lw`B+rWq@?yn#0yg6xR}=
zQA`dwRf8O&4(t#b?LkGIdky!bn(n(br5ip&qJP*C{eBw9Ai~Q+&LP>S2V7>@vjML2
zUMXy7<S+c|S8j*N>aV{VH*`lg{mg&!`^y_-U6T}Pg)_L=3@lbedEK6fG);32gdhi6
zh1p3ms!{GL#D-<5Hne-&Z<7`&I?GB9IU^|{Rv}$F1v7|2vr?(yZgTe}O$`t+ZBFi;
zr<*I)3bZF3WK)<o%zTdQj#DmBpTRceng~4ez#E4{_^rFc8`61Zq9<LtH|$fV2wG+=
zQ-WL~7S2S^Fx#gyr~pbGTH2xn=ADpGuw(LsUh8qY-*anXU{Lz)@ReSXb81hgg`4VL
z>dPg}#!wxDzNZMF9pC9)^gd|#g2pqScNYwNH+jqbb%?+4_*j8<G*zOB>SySa_YB`H
zF~9Vf0-w4jS4o9$pb#_yk`J|aoN&VgjBIloN-h`@@c4MT@FVNQdoeVEX!~4$Mz9DN
zmPkVGNf5PWBw^EfKbVFW8`0xT9?9(yd()3@9-mmbg`d0^KZ>>Y8~N~d#87{fjDFE<
z)sjOBQ~l!$(d;E1=`x@43n%(LKHc-c?0``}4%c%@v@~=4;=GJcUbgm(z?v+7)3or9
z67jaF_u91Qo&WUvCMLKir<|m}LP%c)hz@2%sXgFM9~EBefsQprA1{H+dQM%WPw`J4
zwpum`6`@U;;s}B?-?ZMOtw8B}q)#E-6ooYP79msN%GnZj?_^U`e<(eZ%FdXPYI|mQ
zfEw520ejA)?#~iD7jn&?9*IRqJMj!r;L+1E4HO}=F48frfjo^cC2$Luh!uHJPJfYY
zMl5!|k!~m!KhFG;ZZ5wcIrjC9TUOx$>)tC~#1!ar@mom{7~#eBkOzXGfSU<jU?k*M
z(VId~bm^2#Td*k4c-g;c*pC~p&6o=R2wI+w7XO%QY(y;!DsS|3%ZnJ)1c6u56zM6B
zetZBs@K{2k7X(<9<p2P9ael7k4Y<el&<;2p-Q7TRnU`#{;kQVhF+wC67*p*cmCvOL
zwq7FoId*#3P_yri7AH~gpjh#m_XnxAs_th}b^qkZ>o8~5rUZKH#=T1aZ(AWP+gH!_
zMI!+|WS2$pR`S_@C2p&_a=W?T<^Z{G_mtNA%)Ec3-^1D0@9z%lXiW<xa!Z*PoKC&j
z7Wz*)dVhZPq+Z5<_eNtEuOttt#MM_C#TW`bw2Rx;d2?+{yQti9W`Ek}VMT#lzVb!0
z_kx2DMjkmoaebYl|KwB(ikR`2%b;?+_WXZ(qfb9SyY&BgqxDVzAny45CIG1SEV0QJ
ze>xo;$2MS=imjdLOqDW0e2Mrys(QeAJ73?{Jx{f<L-^wZ1s>-FK9mj5aK^@wxZF0z
zqg(cMi=P_m*PeW^b=QuQknuE*Fxd`rCqJI+rKch9I(0o>LCgQJzipY~tQuWf`+V!q
z#H(w#Pn)$nt8@MNIR58LUz@M}P1D%_9$4Hq{~zAyx7fL5wR<}(elH4`&uWUI`RN>g
z9G50*M?f;lnIs_DHGl3d9d0~wOh)*OP`u{rq(l6HIZ&E}WmI(7%h)@2d)?4{)8iGn
z`_}5*O@q1z2+#8iow;WzAb@#Ve4K6k=21kleC%K5&I#&qbJ%wajn`SQTc_UT466II
zmN;l#nhH%Koe6s6U`TdwP8EM$nVjbPY{c<hvg%u*E+Jiy<cmeokLAy0#U8-?e2nVG
zX0KUr)!6FBiAea}Pcsh~&AN8nCezf@A?1<HcJr(~&K09@RM_D1=Y{fvj{8R}_d1-|
z%2!8b6$?TikKByo^i2t@;@X1wSHA%p&!_#_wVH#U<-|}t68`mFsyDECtXA|QT=;Us
zd@+m3E?NJsErB$4!9)#JiW;#MAHOoIs2TFStY7HqDemCrGpoNYz23Sjw&-Hoq%`U&
zviJai0^-HM{cS`l=G;(UKe_$u5m*RS(_;-Pxra>+>5_e)Pwqy%x?Sz^cW>u#O8n0Q
z60<*cAhiFYM&;_&>W+eo9R?iAClU4oHerJ+p^KqInu*e*JqfX`Xs?<I_3&Xr`(phS
zda7_l(aZ#7*38Fr+WMpCMXrWnpKrE$E=RYyTR9k?IsqfQblz>IL!8DZ41MV4Rom~*
zs~tg6tbab^A^d#)pUxJ_jCvw7)|sA8jh8XgStMh_sZ*Qi^zV0XolkxB{Su$?Rhm8P
zxN+966RpHwk6wiAc)}}+qGM8S%^v%6_O(a!QtT;2^zxe*@_j-+UjMGGp1xUiZEfd~
zrF^DH!=z~@;hm=FQr}q|db#U<M;iJI<am#eWURfpZO^&%gUAS2YwX{{iLagBKlSz?
zBX&Tx&4s7tUMy?V|EzhI0|*J)ziU3U!mt%4Q{|2Bu@Ib0&f|O(p711e#VKadYkF{F
zj~APaG83LcX2{$x=CB{H57;S}veP*_<`Ag>&mt%2ReBfO<q-mym~+RqZ{BD^u^T7(
zB-&+_@TMnq$RB7yE!1Jk7e*~oJrZrTh$M^Bc{#Ld$PM?!8Fz9|Yj6eV2Hz};L;6(5
zt#RdfgtzQD(bqGb*uIdoP!Jj-Q$jLq3q-g^wyD#Y!Uqh$lcN=|yBAiC%-$Wn5q_x*
zecR9Sh>f8Av&Z9wJM=VFxE$gz<wsJwE!}GZ&3`MK2aQbbb56lzad&vBgnUeov}(hd
zx(%5LhgjbaU%S0dyRRAt8$j39Q39|WS|JbkHFhnzF?}486`iRk=T`HajeIfH$;Wzm
zbt%;Vn||2IRNd0{BT;!r@(>~X8p<>L-x^Z%>tTbD<~NgXb#xnw%5$7;s8<-Zn!B-+
z*?;}iaPFFV1%czmG3rBxu;M&TRd`Qs=8i?Fb4dmMThvf$Kz8UxfxHQ;cwQ!Q0w~?@
zwUm{SE4ft`uAq21L)$9l{ms7chn6;eyDJ2?gTu&C;V9)J6PY|&Hi{%<t+G{Wv|wp8
z^wGCem1Fm~PW}rI&$>?jeuawwi&&%!m=<#y&N*<F)OARvxTN4Z1b8k;%ZZz=!W@P|
zl5NR-%2p>*^ruu$CuXCoLcWifS%oKuZZLRp3ml$5fAQDd{U|=#%7*fMY*l_VqAoik
z^;qz)bU%28Ng0JHX<Q0TC!;HUj`jWz_U<#N$#)O<{7pzg3M8RQCm_8BL<FRS-Z3CZ
zkrJ>00){FGNa$4vh%^C1Q$&=i0-}W8B_JXSDu^H`C}2Zco_PM}IeX^Wo!Ob)H#<Ae
zyG-6BlSy*r&UO91AKh9i(%oS}w2N*iLb8K|Vg@t^+ft6s(7K0>FKDMXC<TgmpKdbj
z%}gXhg$q?@7pXmu+jIl`oW8)retm!=CMwS=Ful>W{-vh(yZtK9g6=|+rteiLty>6x
z!5Gd<@O!6ni2E&|tL>{$ZM>Xm)*mrDS9%2<iQ-4ztf28&<7a=yl&&ZwAWt;B5OZv;
z5URiT7G|}5?&J+g*+QHtWC#Q;-53!3D9$ED=;@H*Oai$qrV$%ttIzMGUR5}mb?p9#
zn946U?H1tmNu6%-fotE2bhf;?cl)_(Hy0A%+6$5je{geBVzOVSB}jwuz4Dv`8!gGx
zpTTDy-m$!)uWY)w)9-u=0)4=*_yK*U!9c8QmZR3eak<&!^%0YBoPc=8N1Y3ghdv&W
zz7g~@Ro=m1<b;<Iwy!$r^h<;5xCcq?A6r(q84thc_t8_*MK@s?Sl5ZnUuIM`_ngTY
zfsBah=DU@{pY(Unh`q3e>$H4;$DSvM5l;n$6(E-DYB*m>mxrCqiT=#|vsCzQ@`7e-
z<Bg-tPppjABeQw0_))LER?&{4hxGyLgP^FHIgj8*yFr+qxvA)=hDEEs#Cn}9Xbjo=
z=*fE})h~fhW`AUDJl0)7>D3vCeBNNw+Xk|ZhQ^UAbrXbtc_BSRE0B*!Fu7quvfOUM
zT!m6%*YBKfF~4W|f+-1R+HpxSyN4H$ms)*$$j*-Ugmu0@cswE(^^N_(0`wRe#3LOD
z5)C~ivPfnTi}s3-t*5fHza2PoijsL2)58$wxokcjEBd48)!y=ALlRupJ40wD9__x=
zL(h1SOQZxZomH`5HzZ{i+!J{+05f2(i4MGdlh|9jeOW-5D^zc8PE3J3plOX|JA35m
z+`)X$+kMW^*xt9|yRGd;?R2kL8d>PdW%Kt=TPg1OG2c-ZhA`*GUv#q@yyE7dxjx;9
zY}q)TgXhPkgh8yAw~a)Como!E*lxdkTt?3De7Lx82fqHDb|^aH>Bn>Rxe<xwq9va?
zKCNSSR>r4L;yCaPi?}4m#dn8A2H1G4f$R@G??e`{t?*xsF)5*p-TMA#zhX{sTIQ9D
z%{d$B_r^x&PgUfPIfcm^QXrEuWPzUyR&ff#K^m<?V#NVyn@^Y-EUPpfehkmCJwUD{
zu_DY}w}>Fzd=Q5DG&O?|gXCvyto1Tzg9Z?nb40&WyrLZ&<z=k=E0p*Kh&44~izh@@
z5`BLevroP%lM^V(l8Bv1kPb?8vO{?_Ts*RUq3jS@OE!sS9OFBmC>VmsB_-8PvuhNF
zpM)i6Pw|d5Bnh1HIcI*(7a)5LCWkQd)2Yd*7aTsMi$Ui0NBKeYSIJQ|#uPg5Ixz(m
z0$1Tlm3*0`0>GndQjZ#65yvMd4dQmN&?acw?pc_7c}hl28mDm#)H#jADBxBNp@1Kx
z4_vvKnm!Z44p~X77-ZnSET@BBCTSEx?i8j!mem@dK-?En8wYXzdBM*Ht=94BEiiZ;
zIdiBcb7U}cY$bCXc5OoT+6(h*FMY1PO1<{F=GyGwwYMwR-ovsMWV05{v);kr6e61n
zErTSRxg`<4K4ZI1ftC$q{PfBGotpipCVO`<dw(UH0i&?UQCKY~5MK&g8U=orf*hi7
ztWwbM9CuDuUm$g35La{|XR{FTy$~$2nj;3!6_?8uea&k~%#}&YmAjj3NasDgnyUi8
ze%K{f!Q#5y>s-~e>ss*KBQDo<Bd=@2^Hhee>$+Um7sxZS$Q8%u8T;m$ujX0cLE?Cj
zUPGR|3#)q$19W0F&ra)xV^OY?0LTTN=SzVmZ=?zg;f9$VY?oB`1@={-AV{ttM5~~o
zAwh0}H}q~nRAhnT<APYZf|%EMaiB1%2o=A|8R%OW<y*kpFSg~AaH*}3^t$l&V=Uzl
zC|9fK#!!BFb8M+V>V<-$>v9Dp0-A{y#UW{h2}Q-VtA+2%3-4PL-CM;}+%2l|Emn#z
zdJHdYi!AcfEY4WHN%hrIZRPc+CvqG?FB+9NHQl_cRierTx{STKO3SVPBNFLSnvzyJ
z=XJA5pmc7tr1f>KwOZLzmok;$vRHw#v9x1Wg(VK+@D~PYn`-DtGBlfV@$20(+R)9l
zqB5KsBV($l_*G>7qy_bUWNG{AExG^|(NwnLa^?AJDxh7y>{6cjhq?#XbSdQRqb3Q4
zz_0d{^9vRwzb<1}qgMG+L2r2B+C@skR2lgaAw;==UwOVoxw>V6+|ErM*8&aKipY>;
zry#h0pHM1u{h%Y8aejq{&P;f+m4JNdXfAWKYL>Iy;7WN!Q$?~|rLuOZqINQ_sajXQ
z>KLNR=S_7)Q?=eO_EPa}mz|>_&M7DD*gg<Y%m+B;#W9UfEeaMoAfTo<P!%MF(jOL~
zZ$vH>qeyQgJa-Dbh9z?mg?XPPvb1joyt#Ezuz;dn+0}MeyIAH6yf*XAk%S1|Y#IZ~
z7l$k!5Nx}l;7wrDh(m?}=O6PBYAl6<hwnyu-wjE-dt;{}Nvp0Xy|P-133JqCx7SGv
zmfRVxQ<uNrQLCEkjOsGyov1RpLu1z~RFE^}d=7pvUCVoWr><A~c4%bXXGCSU>+R|{
zbuT}QtnA#2YP$Jjr?Tj7{qkpAe;C}lk88EXwrrZiiwcuDrPPc?q!3V<j<#MO>fflA
z?YCpQ-aI(PRYxjnES0Z)ex?4DedB6-WrulfA*e|Dcq2K4`8vw{bm3jWCcL#nHOUJ!
zV;dBn@cyxEa+0_!a<8#Zz5xHFG1r%AncXrweqa2!oLp3s_U_RY>XFA4GQSB7lvBn-
zmzxj$H`p|g4`1ds>3*s1vurVV@?ct^UiM~-cShaM?Upu)>`TlaX}b^e&#*h(<eeWz
zFCn<P2yC&));OWoux{vL71s*6HF=inH>FkU^keyj7WN|<9TC*lriybHE9CDf<c#2W
z1yss*TW!F+SaG;FULaT1@<;~P?}j6ZBnj1pc0~tN7zV21fXc=|Nf>nhe7g?~UVf1`
zbQX90bX%KRn=kUQ-(ZW)O=vK(WBj62Wt796C%hN68m7LWJ>y#u<<h@t&?h-;v`y4w
z4P+<s=}DIM+}VsR!;V|C9b382J}GoMFTnfpJSiC7c04Q>!+SvHPRB4Hb`u=TTBTE{
zt93Aq$F9o0y{3zb_o5@QcF(>e)7+gqZd!E-%pE^|82V-s*-wU!&cokUL>JIJHwh?L
z0{b0YI9%9nW&~P-VfXKQa^<B`7wzb-R+r#tkM3Fzga`5s4{Ik2q|gn}cBng88G<;%
zpN?$Z03TZHR#xlt-+<l0aX-a2TBVA={y;pw*W;zwe`fDko|izOS4o)zM<N}wLx42>
zV7oYpY*g)2vhRyaL@g%p@N}UgsSQNy{y4?Kgi+l2XaN)J8b><1f(rXXf}Oyi1sXX;
z>;~9_2Sm#uw<<mEd=N7Fh#|W@j#3ahVQKR$U*@(OSB(yXH!F&Fhtj$~%iKn5-HnvG
zGV-{&t2K3GSgZ@3cJF>-okDV^z;6PZD+VHxh$?SFRL%<48w{MlKoJ**aC>6@%%lko
z`kN%wQq1P*|1A4-`%DHevzYnB+G4pwq#aWs$LWNtXkYi|+Nk4FTH;hN5n?R0S5VOp
zzO*0WW@mER=ELk{40NrkH<98KCGk|0^Esj$?myq&Pn39Y5C0phoJc<UXC4lWu^U=5
zRc|Gl@R8pXvzAfx<#d`I39aDH^@r@7Y@)N*FnMQVEc^73lh@OUEw)3T!=F32cF2<m
zu0BzgDH*#d1p}f^qsS;up-usn8YS;YdU$D#(LYT?H=S}raEw?<J)i4>`}DIXWuWZD
z;ki`wxpnkCJnRn+&E<#^SDKW}N5?7fUfq4XcIxp-9U7$0DKi?*WGNe^;rwIHSwHPZ
zvExbm&L}UA0#aW~jx{s1`r0xzmFM;K_0BLV@*Bydiv)YvAm2(tG!xj5n+h?LtYOro
zy#_=INnsO<NF>3TEM-vNiv#kTTnzgj*6Ezhh=RD4(HdGX=E)sk>e~kRwdL%iv6){N
zIVy0-hcWO&O-|8EPGl+Pz;n(q55>=&<6a^oUy@)?+PSQ4IO}d+#D2ywtFMFi@4LJe
z`5D#u=Sk=OZYPVdC)l6n{#3-%hQT>XD=FjQ-Q2L4V&S?Z@(OMnu3XZsU~T!03MnCS
zoS>lVMxb37sG+#~)KAnXRtnj;ut#He#Ub0V(3T)XC>Aw}v-N2Z`c8oCP(CPRp+Myj
ze+rxXqSS{N#D@)V_69hX4DF2OJ-kM9t$`(yPAf{zE)jgwlB{^VJ{Dl%f5;-tE60ze
zT&kn&TwG{oLBgMkd`mqt&?s~^Or{wpVuytXBrel_-bu%~kqB-BH{2dR{K!mx*M^}-
z36L-XyBE27>Fv~s1`kXyoKF>r_yKdpbcwROpX=%pW$%`-?w*M5=6K$H<tv@21U;hY
zJaum}s@Xy`ZXS`v`0TLUZL`;FHwsrYT(Aw`5qwJIkmj`a_%iYuGZg*Cm4qmLt8|Bo
zzyI?KPveX4VX&t(c;t>nqY2DJTwrele9LS4pW^Hhakvj1*_PZ#RbM}#K0o!`kXfZw
z$mvEgBLp5i%~%;D8_xH(+}C41+)?<J`PTDb!xJS=+~l42y8Sh{!h?}?G((AZnZqqS
z7~%gDW|oP({nk~7dv%tx*T}8ctYpa2O|W6Tm!R0UcVFaS9m7cKd)r{Zv#Gp^hdE-*
z@05L3QE^aKga>sn$12!3{g-&No`!{gLD^lf7x9#_6?#j8*^#TfF)L}tKTN-2V(|}s
zNbrkX4EF7prsK*&QHvNC^XIJ%($;qDeI@2wSw9abNvFPI^wzmvHq`VJ*lIoq$(SyP
zihnC?RQ`3<;#mHf+i%Y(LC>~Hot5opN8W}>zTtw6b8jerRrv@nHj`1)+<YTG+Dz&9
zY3L8w>p!A05X!#wP<(4gbl#Pu`UfDQCVF`mws6@yyC1uAt!pNgFksa_9hG(aKu*l2
z>n0Xzs3JsH{&PVLa%Nz6@w#u%I@-sk#=%p7{)~4A16jc>xbo9`bZviz$!tB}d(Hqm
zDogpi=h_E;q~MT&^#X@J2=t!#<(p+L<Nf=5@_E1h^D!^Zk)RvFk0#4Fw^6FwC%v{;
z0vJ2q_=|w}?UHBF2YZc;=jmeN=Mf@$iTrjIJ@UwrvF?aL&o=peW4YnWD;6Ez{@Vd-
zpT2qYr75}FepI&-Z`MYkUv4>BozY3?_Y+hcSY9Gjm|PPzDRx-3zim^hmn7);*`e0)
zzDHm2(bcCiUdjR;Jkr*s(I2`Ux};3!EK|zP?z~VN7wdeW_Es?SVqJQ^i%)GZR}a+2
zD0aV={|L+(w-D$`r)?J0XBFbIdpWlb^-DOOI588E+hWHqsM@;s(x3<W{CL8h+C+=j
zf4)n_oM8XFlkVWeqZIbF?~CB_{Z1Fx-Uz?_cCr58LYMaB`(K8B$n^bq8M(DGaoW(U
zg@Ji+64Kmh=2$Dc<-|cTFzL%x6A~-h;hxU!O^y6mKg+F2qAQ#=SBRCD_*mic^{!Ed
zthJF@rtGPS_&W{#@~H~-;2$!#i)vn2m%MAi4BXOb8Dz~$By%B*c%9BRnjG>>R5ca2
zP}SI9xvgbUE_^H9Of2@w&|+<ra8tiZN^-P0v+Hi3Gjv$w^T1HbR{5luiEUi1nB?Mw
zx0y&zw54Uj*G)T#nBnO3BAu^oX4Xl|c4|$*_UV~p`mm5qQEd*x7g%Ahj~{t7o;uXr
zy8J6T<&NsNMrjivu_SeS3z_N`dn=Vb9trg=Kr%D9r8XI(ZaDg*Cb$<{m8HFtm_EX=
zztLp+Qakv_XD*i$(Y!q_XF2*ETo@xqoxM_|9yy=MHkqbIICF25ow!~KE7iOU;Q
z-=}dp;PKL<)0a9S$J~Mjq#nD4jGG*D4|{d)vHRusNyj`QKUF{Wi2Bxd%roZq(qqq9
z21Jt>$0prMOhB7zdL<n?-|Cg}U*2fH=9z29mRrwc>qE89=9o#hoxOg-RO{Rgr}J&+
z3Otjw&KF&{-FE)wrGBjorI(l6F5HTRYWtL@NVoe`W}9mJRu`Oa_q}r~S=;aKo!jkx
z_v-t#FW!H=+<vjX6MEdgaX|WsfAhHM@qmY~&OZrw{66`3VB4qLPXeEO>py;p@$~od
zlS`cps1B)%O{Rm?gErF%>N|9yBWOS@MJISj=1xcOh{}LY$k?$@9U<fTY`UQnW-?Dh
zUz{-04SVTy;c3__&lKJ8*B9<Q4WGR<pnLi4<xfv9|Hm7RSj;xli(D$W@GSDvtrWd0
zt9R}^yYi)eKrd?j@uz1|-#Xd!qc;a+I-|djo9V~=e08BS=J)#){i}aI-RZo#`)xo!
zcK`RM&R7P6jR-(A@gP1rna!98;%&u4HRy5ZL?T#9(*SXb9)GBp_#bZ+>;*H?G~~*s
zC(0OmAskx``5w`eR1&?|&uJP7PScZ*^?ISgT8%`1(NpvpU~f#4rt$yuMsKtlOKVJ|
zok;ZNsn#@+KlT56Z`4)qXWNOZzh2y8fPL@~Z9+WX6qU`y$B?(3kgPFPj!yD1meRIM
zKQ&cxsL#jrXuDlj_*A7B#Mj(J+demcs!GPh*V3`wKL62FwMvq&^*Qa6#nV%_kG(vF
z2mbH5Nv1U^z{iU^1V400KtxD@R}>{8ij@!(k&!yAAg`dLAf=`xFRILaR1K$nR82=)
z%TP!2sGghxUf9?OZ)J)<YJJ$!n&4n<#v~@0zNCZ0NhUFQ+*z7QOuC*vea`I^lbCey
zFkljs9^Ss*XU_YdaT`1%%2XyT&Z#k#$)WQSMi&&A)?}#P874HzR3-xgFP*xi$FwH@
zQ6`zhq)(U~Q<)485C4xcnGit=iF9W|lWx)Ye~8KStKt6;lmGaV*$G#i5;c7itzwhT
z|F<&vA7b)9zGO_gcWQcOQpQE^Op~I__)FL9|M4ZyXIoy*cJcccF?lVwv@|#AKhR`e
zUS8#mjG+HgCYi)!RIyu9aaTgg874GYTv8TQcIJNB_5V^PFQib<S5#DNRb0GQ>7Q5G
z(NLNHk2RTlJLvoEU?w+Nc&FzdZnB^@{J*)$lDa6SIQi^B#fJy!IrT9W^?g;1@l0#-
zMpHbKn`~}w?)?`x+1!%*A93>jqf90`No~y@ZGZ4DaWa?5P5$c0`^!x}rM5lGXNr?G
z|3W99(Mo7ET6-7$A93<mSLwa((*C~6&wclP_f<9YSG?|TdpK0X6eq`qYu^rc{3A{>
zxyct}4GUwm|4VUlZnE{oix+)U?ITl*lT)+HQ$0VXp8lC?Uwhg2-{K^bn`By(YqNv@
zo10`sidwfeEcB#uD|n2yHZBfO4qKI3w>2$|6dt+wZnUlW(>T>AL)50dW%WhP$$K7S
z?GL}aYB)1eX7l9H`fTg}Yi@G?zq!e?a-9F>CR>gF;U<0mo14V&{Wmwc-HrLnP4Y^k
zID0Va|0izp42sE3E@B-14{maY`Y~7U<Gdt?ddGjbN#%tqPOXlHYEEZjPBQv`<tF2p
z+@#FExyfs2!mr49n8IIfQX!ROcq`^v7o8bbcd$9iA9Qj|Ph#SvO(nGLyOrGMJjwBD
zxu7E>N_l}l<ZcVao#fEty*unz))2_hFh+I4B=1xlkc@gTT<fgZV~2-WiTa0@u!gD<
zV-oS4(5K?_7+U(rG?=rb@wiZ#e-)~TCEiZn^u?)>98QT*E;~849is<rjgO*UV;&+t
zqBt}Tf{p4svl7R-R$b33Hi^rPC>nGEuzn%?Wt@F0d?<3rl%szmxkLg}!Pz6c)R?G-
zc`E^`KkylCd?I<`yo~9ybWDIjb%z103bYVnB|5`(dQ7qpW0<O4YYoblx#VWJs&`$-
zI#g~Ew`JOKK&$+r)Mwqah3~JeXpv_fvTl~?-Kj(!_Wjt^qOa6xO&GaueS8C-sHi|!
zQK6I3de`&1Im9E0A&*9IyNqTu-5!}ZCb{`*PPTuT{IpqrnEwfQy3ICz{oW7jiebe|
zz}&dx^-x_x2733qDZB4>kJjzZ`RLF|EA)@wLUFs?UsWO%ZGTC={FoE)@j9}1OmdiR
z3%lKHU6FOXL`G~!6Q8l3trI+n8`A5$yc0c=Y5b&p@=O7fn=JUtO_t%f#*E}nDABn<
z`4V&tDE?pEq!E*wwBOwO7dHuW{>x3a9FOO>!dEl7$@ZTej5OkZxXJrA*kLXM6ioGB
z+~j6074|P~a?tHMhRID{M!vQi2?bqY(c2;#H1#zwxk*YN^Gp@+^s^!08ZW~jm_Rr`
z8eo;=O&ILF*t#18{Bm(V`4p{|HJuFAV5cKdY&AeBS@g4fff_Uvghs9K&0r`x(@R|}
zAlcJadtx7-nVCHyDX>9wU~LaH;VD)1SkcpQY6s2nF~l=4Q^G*32TmWbiRbhhWzn>k
zjo(kBidjV`XwNulUzorP*pF7?GjAmL5^{x7tUpS4`G6zmx?z0Ck64z6*{WF${7UUq
zydV#ipR|@RWe?qLkhL=WS{a}&3*GkydU(^RN$iz|Y6EsPel-bhmw*&)KvH8{RUt(J
zNZ15VW~*0qg@Ei*;3f^=Q<0fPbGRuzwKfah9oC{@9+o535e#JD-rZCE6>&0wjW&l5
zx^F5+OKThm^t;f{=&7q$tok$@(OOz4baF7&pD~v{yw~j_L15F>av8{dUY*Kf2{PzE
zhVcNIdvW|ZY~UmN^yC(aFH)0u_?78{6r~`s?)Hyd1ILv1bC9_QK6Z~_ja7d9_p%SR
zuX6|0p3G($gc%|Q#7<}_6;2WgKtrXxODv<NuY<+Zm*(mR9~xO#6RsknZzKC|w89?I
zy)@3=)<;Ok$B@6DWm_Fkn#9pqe^wG+_?%u%{%lxz${Jf(%r`jWQ}=e?tUh{wb^vUs
zT-P`uHotxS0Q&`w<FULddegt{iY%zm;zpy%(YyZdoA3bRKHjhsH;v3%LFYkXL}bn?
z9={X+;Tcizb1Dl}VrCGW%z5z#fFb;maTofGzDkff`N-`G@{A4r$&fp<N2Uhn-b!!n
zFNN+y^9|iCQN+z?X`GY;A(HyI^+k=p!8>`3n!)!ZS$D(ouk!IJ4-Yi~@obtx64^Rc
z3ywdYRGkXBQg_?&xBkux6$4zqUY&q~2b)GE?CLK=1gN2W{9+E;@~0R_F8txm0G}AM
zKeSt}mmg_*WE3~7pcV41LRG>328jxksht3>D!<vd53_S|lzT}N>lX>CTJMA&kHL0R
zFFk5C5R2rux@s^ca6IIw$2m-(Z~;Kq%(Pawm&;(JOHWJf2GeS{4?u;^7aR3wGC#%;
zYg|8Tc41aj@3XEio?!GDMla+zv<=_Qew0T*j1=~$@fnLuj|h^(&GoGYoNj?!D)6|q
zZ2c%3dZKbrN|a)Jgo$ACxe`7%r>75MC}|$IqULpb+AeTzlbiLG9UhTg*zMkH4h(9H
zXePIS>RfKbeVv~^bH?xV;xn>P-BJN`x6#~?9WM5x$C1BW@vWTD&8e3go@C=8KMu<@
z=p0`cvSZ!IkzXD?@x|=Xr@C*3_vgv&AHVPhJV6tck@)mCzaRavWL?UCzz;o6tVq~_
z=C#)wsGIlbWroGG{%V|rcrno<mjFPk;Pi2Z&STh*0aD6%Sd7d;0bV0eHv0)_TE@dE
zamjt|ilBG}+lMb)^IiR^$`mJgv4ExmWxg=$c+5P$flQLhwrY7UzAsC8M~ZxD`bR5P
zX~(3sRMBbL_IIv<NLZRxP6BsTTnx85m6Ku2N{oqF^6I>hVM~S-2F17(+9wB}m{)A5
zHEeTQ=fTODCOPfDh2`wOfYWH=9)7!>TQ_^3WNecFuN+ZXT^0v@AKzDw1y~;rI^x}Y
zn|cQJbH2lqRvq!k;rGJJ%eifM{5SoYVZmkRGw&7OXkfz}5>9i-A0Bg*j*i24lbtDq
zHvzKBw@-H}2v)|SGwJP!tCL~{l-rElNxESseetxa&>vIF9B9o|XYoww!8w!!I`pgP
ze))Nro|=-kXzhEkPZuzoGO-LNOt{(!h$@*^9L;!z?OetnWH~uo|GJaEnC>Jg?$zTs
zk4<QjA=V0uzTN;P;!yJ&ajf3p&z0P(;U@N=3&&Zk?HAyzJeP$d5*k_TS)0IoCtV!?
zC~*V%c>~IHC$Wp%WjJt<5k!IMPSRBDgOEYZMw-q^^$Vw2;vrx0&R}n_&qvcoQfE(T
zCZC<*ajrSBMK}!(20g~B*2*NG<4+0J<RM~M!+lbYVI0u8Y}LeoK1fOke`-98=gJDU
z<7jGXVXC=ZDkL~H{VzAkgeM8?f4NC#c17O*m7A<`PQM+IUQ_tjofKrcljK;=xY%7>
zMhm}lL#kejW=3u6zuZY9NKqlDDeVk2=LpgcxAf{F>sG9-A?G+B7BZMIIU~AHlC8!Y
zWu<Z|#$%-NF@u_z&+~9!X@c7s%$O$Uf@W43A?w9V*0&%Z^$p}M0il#=m3R&e7{L@8
zPRFxCWg5U&jQ+Zl>KnLO7}|jZO1$Ivt15f1)rsj&4ryY}EFZgl^irkq1vjoRRHX4P
zv#P$~&1RSL?h#mpifYEQM$3rL0s8b0S@#-IY+k4xEJh7}U5e2d;!N}TX3T8HnXiW9
z4(B;cavwXOOL}~Fo;8Qbkd?)kRJBM*gH^?^+{c!roFH~NCO@EStQJ~$*0mRgC$$Xa
zLf{`KkMR^KKUV{PlJt>t(3Xyb6XLJmm|$(dVnzw9s0rX29&?QXaBZ-Fx(e7;L055{
zvov;0PGN;6M<iVWv8YPPGt80$DRbLyPMLkC$(y&?@HJoCCu=Ez<W!7}3gFPyX)`(X
z9FXeyXWfd=DsXIh%C}!@yxTHlOz0jEa-M?}Ax4l)f}3t0YbKyyV^~13V?B(;=u!(f
zyikw{;IbBmK7<h?6>_mabOFvc@brPl$2W}7xr|lAVLH~U^7soZh>~b&mS&>$qsTc_
zfy1!)rFU5*_4t`QCExzyC%!(suY>B&E54XV|GInpnZ5RK#mx>m5b=kY73o%FgN+tY
zzL!$Mq-Y^n42o2+OlOs&79IeQQ97#_fQ)qcpY9}3DpOnmnkW}zx|0o1IXW=of(hSX
zISQ0s#g)#sp+x;qdI;o29H?U+tv_6HfUT0lSC!46RU1GNAtp~vS^Xb_p7y7xP?S{3
z)r3j3*K6!Xk%J0>W35M3<Tp~Zr}{OQY#C8;&n0JrRfB6u@&^gjIej~31^%o;7Vd{Z
z4$F5pfjjZqx_sHD4c>eVc>xH3oTZfS%mcb~n80T=iVhISELR&)#SP^V7A#C!hKGnM
zL)0GN?%ud^_b)w(XVGHPleB`P^S}WGbP>yBanOe;036T4PrAo}1L;zL$Hn&!8ty&a
zx!3hMtrKIQ1t^M!TwHEK^E89=wvZolSqHa}vGL-3M>5ZzlwG^7#NXuo%2MtzUBXMQ
zX4NoM+DuMs<D#4cVp`C+*{A3LQ{!?sUt&X^IRT&h5#5KCQl%+hLkRS?Lq_085RvUF
zwzRMvazKY!d`9!&O79{7NKPYYp#h^%ic-M5^2Lae>mW4t*4leVUzdV%Ktfmyh}tyR
zeovgyURqI;Ve-p*`**tdv9s{FSfa6QQ>xy5O^n`6&d-Og!JqIqTe8FmG+x9#OkV}C
z+89x*N?|LEi^4;PClJ*y=n_8+7rmgc7Orp)t?{Mlu^*ca0$8Rzx|q>?dqs7RX-zWe
zNn-Od0g!7)(S08>_kjJ5x2k@AY~zP&paVw{K%+c{{R?`OQm#v9-PvH#xX9);`)G&G
z$~BL^5!F`oq^;VS^f>h~cN5FlXLL9PD7sP*Kk^WQEo^_&*sOrLzuV5Q00<G9nDitU
z1pra*p-uy*X^%OuED+3NCah5X8QmAvanu(z^rWLE>git4b)oX7HtiU7COyd@T!(Bv
zZIyqf?)Pje?b*zeXF`Rbz>#MgOnNfjM0>_HsYX`fha3oG@uj7n&~lRn<XGQ``YhB5
zo#Xi)g$i_5p1|mTYA^%1I0V4hC=%*RDCz+lwt$3!2Gc~@4+Fs{37u|9w{Gd^ZrPG<
ziD>v@LW9^|H<GJcUZ+Rhtw+LI8N}YBJtw9y*Q4jw9W`%$T&H(O70w%t>ZSDdV!N5)
zDE+yf32LvcVz<HG8RO`_FPz=0=fQ4@-T3WZ$u+p#9@MP^<gL>k1)Os3=wB@FlOS~4
zu=gLXQ#(=uzF^(`wE?U(+8@0p5~$Pt9!RXkcE?$>I|I;~JSdGphFqcyO4K3BHaL1W
ztb3X6Bo#rVfG^>@!~MG-$OQg%Cvn3}ck&SbGp0LP$#f^_0}m7hV|BV~8^AZCQNG5k
znY0)VYdaoZ4h4LlFBPGz1umFBk%>bJ>2#O+cSnV)`C-@+aIh5&=N~E<%A8}G#|&V`
z&eGuZdt+sBqn{{&QhU&cC8o_JR3ZT7D0v>$0Di_kDq%e!(IJsAI&|5(yD|;qM?mq|
zjX}%N)$E)P=f~!w>BZvRAFaEW6}x>UyT1sJBSxRgV7r&q$Me_dQS(yosiS|QQO(S`
zrvl8rBIXr|J)6XFi+}`ivS;Jr16a%x94wnbXMeee%ESNN=$!HA0Ch1Pj~97_>w7dr
z3Y{HnM~6L~%I6$8JV$@D*Z+C+d1o|o>=%dpnM=OdZWYS&83KpZ9>>`7gk+uKe)ssn
z8u}p?l1&Ha(IE$TcmR<-d*iP=d6vX6Mq+<i2Yo_gW4e>CsIa(obj<#%xcjgK5{Dnt
zoh+ZS7I~esFeS03sItMaDcPM#drsa0ndw|0HoW}Qz_wcm?PXfVMDVsww?JY(o86?}
zKlCIP@|z0&Mx73S3wedZyj+`Uql{g4pXppjcil%@;t;9(Gf<`1&&T)!_het<d!Efr
zNb0<m+T)mEx|77Wo(y*mQ&Ru^F-(Iy@*x40K$v|6ygJx`hbuv{lrX?L`U(E8JJ}mB
z_QMALoeFMiKt7?*f>>UUyU(X`cK>xJ4c~Su4j}60f3K-NxHipt_1$W~tR)6LMg_kX
z9=l(H{_g(%cj<ezfcM@Q_GH~L)^~HzcOMcO!L|Fnv+MJ9PuVbb@Ay1sgYJWa2*}kK
z^kpo>oeUpz|L|Ms<38cz?mD{J2I@^gj;?>O*W-7LHsoN6lMOU3ra0MPyGH4PFvUqj
z)-}SC1dz&F4xJ{U@BbrC;^;gR%X_rtJG2ic%RWUJSOE4MNfFqe_c~cBWcQDE>1!<G
z7@>xka##?3#W#kli@u`!;M4yTZu07v*0L`_KGnyalw(n6StM3q7ra?Mbf(x@BtP#=
zm^5cmLw1U;C^=gs#jWkm`jic<$^2OJ<5_PH6cP7dE+8#ARntICOK-Pmpzf|oy>*B*
zme=1<9rp&r^%Yd{##OH?xxDLZU{`{~Hx|Qhe8yi{yuW^Vw>~M}qh8kS*#8x---FcW
zhrQpB+1r4kML1P9C9OB(gEsl~2OyoB_HQ?(>Na`b3lk)^4l_2f*;{hAzKM@-efHRT
z!C?7**dKgh|AVUSca2N@INR^XqQ9$+3!AQe|3u+8R_RU+`e7pWgO9N#8;eU(RW(Nc
zOcMX8cjBk@dtu@Co04e$)8jwozx}k$-g3Y7vw!m^m*=mmald@Ue#LhE;;8?1USF7W
zVljC9P}rs4ft|n3sBB%<|4max7F>TW8@n`c&_4luPafY$8{f)6Z!^)!waiT-o^^La
zHboVA9h7_R{l*00Pl5gdx%`iq)*mj$pZx4UlzL%_l}NL-d4bI3s}u3q*Bg$?yU_-_
zMB;AOvz?5fzvyJQ{$5DaZYiUOXuCJuxi|WL@A><^dUXE~V{giHe>!$woooMu&i)MJ
z{eIbn=M~>}@m-(Zc^=5|+YX%QA>u}s-yeKs90+)WuM@$EmwKA9wv$lCPAB7?3gZVF
z^9hWSblzYRvDc$hi8J&CBW9iFFE=TE&Eh~k@Z-$Hq8UZpBumm|@}otboZ|x~H@Re0
zsCw>smCK9eu^TV*adSsT=1))!l2B5v8(c<$QR$+*UR5hhZnE08+VzG!Kc_lPr|-?w
zXQu|QzATP(M+K*3+o1<ig6or_Ra>Oz)&J%uzb?(b`Zio@8r>wNqh8FJoRA<9D0qM4
z%wW!a(}bHZ8|lfXr7kVc6=Ba+6(pSh#r}sh-T5zW^3BhSGmR&0hZ(M}TeBfiv{ccE
zRbhU?^Z>Ms-mi^mt8U11dqh9%+lPs2Bi*aYZ3fGow@%1JX;=DhEc9i|c)r{7h)ip1
zzLxB8msY7>Vc_Zc{%Y4RiEw1*`TT<z;MK^b&XApEMOwr8q1xi_f}tA*u)}$Tqi^0B
zZQOfNT%6RnuKa_f{dn$-B^ar%KJf_C{N_wA*NIHTy>HTaL8gKiTY~zJ8E=f4)GEW3
z^_C)d?A2H=Xj$GDzn)n)c=$%<=bB@IdBK+Q_gc7A1dX@HEvU+~IaWBhkpBp7q{`3w
z2#3+SrN-=EZgSsC)<*lwUv4t#tgNjblbamhTpkS}7&5s@I-~IyIMmKmC@fUjfb-!=
zKH=!JVWhQ%z~CY4r}XppZQ`kxT-KY^be@ynttE3pI%bR~kMqWao^rkT@MopDmlC%i
z0`Q^P*T_?`fF0ybA_xXhs^vB8rOcCo)*^Wrf{R3!7Z#OePdS(7_p6azN0W_>c_Co<
zO8wl^F!%7;Ye$?yIfXCO1WEhMJJ#~chGXsX?#s{Jy4{FKxp-$dA4dX6r)0^<ixGkX
z0P&~??q%3-@603loF3`-xX#~j(i5=~I$gtQ31MlM^5Iqiv-}da=PtU8jX{2PIv01_
z_tYDk*TjUpA|XDQpoL`DZ(+|Yy%e9gev4kDJ4_-1%c!`pe4gKetnJLF5utZMP^W_)
zigkZZWEG4DZ+`d`$K|0ZTRtvuel5hjF)y!1%FAf}_N}a9tb-KhG8P4kXj>FlnvMwS
z7s|eNrnkDO8l!zhJVWqgK3sm`FyezWD}a?{Dti4ar7TQrYPY1A<+l@+^j!9pQ%(^;
zj)MY3BMh3|oW_bKX?|j71)CG8#(-uqE8?Rq9$*C(M$BF8DL3T<p6d>9p{42CU~vGT
zlFwOK5W@w)O-}&`tgtWvsfZUT3DN?Hpm_*O`sMd=heT7L>}Nspngd{S918%OXPFf2
z|6Xyd(S`>P)GPu9E#l-DlPt6J5H|*!?snG`yln!36Dp}Fg9(5c@k_kuSG&?^7)VGE
z>|ROIpt5irvOgnCCzKBc7WPC+8M2f+FW}EIVR5CA@H&Yk047VB-ux2wX{Hwvjy(p1
z266+Kcav03d8iH+W<Y<ZRY>ZHQ>Vt8pLAvsqFxJfz=K$e-l$<YQ79bIqnrQ;weZEU
z&2S_Hwm4t_EZiL+gP+M7L%4t}F8~iK<}NxkxD=-<A8^h9w#YvY!Lx8-;smxUw&q}F
zTFPU90Oi!&bGtb9Ou`8Xz)LA0a-=AgkZ&xv0DtI(Fvm-r?PNbMp4iB41?I*)b%sbP
zHo~kFjrhlTlJUiiKchZ=MleA#7+Whx0aK`0UKkaxMvNnLfCSMP5W-0|4F==Ras$L}
zU%ikaVvJ3G)L^2ry=r-+!Y&4A$YbZ<I0_Wvk#4ecs-BIku*4p|0BS$qQzBAaXG<7W
z-LH^eel7Z$A(o#;mXl~mIALJKay-Hi&``Bgkv$>A*GgtTn6^7944~!Q`V~xBbQm0x
zfmEJB;H~U^UvtH~!nC}7*K@-mtz2xNnd%J9RI9r4%#nhLbB+m<R&gEisG%Rr3P6r6
ze#VeL6zEm3_DR!l_U84KdaVWlIknw>$!FV2b_r0$DDxR#lbthwSufZj*N6g(D}56A
z25<%k=>zYSGnA7^WECo$XEl^fgc}kwoCaB#!=YgOxH%>egNNQd2jW$sgGP&K;816<
zWGXSPKfH@8e~`v%&5{saR(aDOVyu3d9?z{u15;pe-1(eYghU$DIF+o#Hv!RhBXdkO
zfWuhkS$udT3dM;DxE;Vo3&z6sMQM>R;)1u+n+P~v1+cAsVIfiQ)CUf6_@`IO?*%&2
zSbq_n7#A@OftTv0LZwm2^65v(i<LuFrV)(xOp_8yH{T<$2nd_nf-(kSWX+)nTnk?d
zt#ToPhEgoQMsSW73?&=L=67)f&|h$MQ~kvN@k9*0izgIj;&xnUB))|4%LNRJ2lPxh
z_;un0A0CAW7zVLR_{{T{V|x_*b9B%&D))Dgu{hsEG668WsnpP?*>DJa+U-%&*;F#7
z1QTaR`UB^jG1jDtr#Q`gg$HX&v$rxQ6KDA8N0>GgMUjG~szz?|rp~sqkf*tfAu_i=
zTt=$J9Tnv_V38)>wOLnY&A5VvKLTS<EsV>JXtwwrUBD}HB82p|h54s(50utM!E1O_
zEU&q>!cxYO5>~XEFqE5T9*oC(3vgh<i<4O1A~U;gerhm*so^rcbh_YOQ+VcK+0-ML
zE1a6LWM%4t+0Tbj{5QGYb0--jg8eIoyAK@l&vCkzIRXGf!{@u!8$pD5VS$h)=7^j$
z4e(U#hQf&nQvO)LeQ*K9ivbIW&g)u$y=G3&v0%G{vM`17yl3fRSnIBpIB@yfZ&&5-
zN}8{Rw5~J1=b0>N92-db8_XXEuo#Z@Ti+AJSLublDE(UFpy1Bm#|u4{$TH?s2MXy^
zGA`im(DnRsMPTCU*ZUy>8Ex9-ZM}ShoTg3>A_bb>>FO%5qOfmG5)TX4YvRF%)Fk&8
zU7!!mWbU(yFr@K3h|`BPIUuKQmZLX3M@AS3w1jd4^Poux_?Y}X01zg#-x3^X>LhHO
zOO8*CagKmVV9D&1ikFW7cQBEb>_J&z4^LslL84W&Z14b-v(?k*A!n9~q8@lPL~Aq!
z`X|BfunU-&U?+$51Xj?(zgWpEy+={Ia2nE(l@0u^<_Dm<zxw5Zeo4gxKOd~l*~JDE
zH6wAOKir&x*G0_rdzfQ?+HBrUkiZRnz%BV4UQ-ChB8(S`rzgD}(sIE|n>!~y(oP}O
zsO7{bpKZeDOeUigz-~v9^kC8_VM&H75IhYxCIBsoL?CsJv|LOGbWJ=l0o5W&d##8*
zy3#gvTGzLnRpLyYGS$EwxUb=ycmxSKR@o)O4b!5qTJf_5Q16>i62N(^zH*5LtcXLB
zsqdo@0oym@_@SSy5}DkXnz24(m(cku%1ARW_xG-f7Y=f~!{|6WL}$)OZ_P-*!{{Ze
zv;>R=LKUJqC+n?%<S3vuP~wDNud!RNDL7HX*;ow#Yd6H3__J#HuxeuyPPBk)&84*{
z@zN`xVHaZsY63AHtcL4TtYlRs_L{Wz%7VdaHTPZC;!UUt(gYAOFX4+lNDZ4H9NK4c
z*2H|K?@g_-w_Bp#po!Do?FB%Doi3^2hCY^Q6u4#zD>AB=2NQ+Of)&j|beO!8S#V1t
zY%k4&U>1=%5LCrly8?>rFpC~Fi{vR<pd|JT^=ni~T@p5rFTs%NYMls%Np9xJ{^lvs
z=BaMxe(VS!8p6nEF@O2Q{Mwv(*4ki(j`&??h@OM4?w-+g9g93`3%yW1@)R{d(Y!Eo
z=%wah{tpUiqj;B}Ex*p9Ofjn<&w|Qs*+CsDQ)D+F0#!URaafkBv%vlW3XUK4yo)I7
z>7T^Puqnbce1>Ie5jtc5<fB9)#v^FA>I?*V3&{vdoEME%y6{*WkyV;z!D$7cBDyNT
z8Mk;WpRHLHV~0E3kQ!Kk)m)@pUK=pi_-ao6<a?~b9I!o{%7)QjWzJ4-4@4-8A{r1V
z46vwr<18mrj3YZwCUr{!EQ8PHA|*WWHm!=O?*zmmkk(Im%sV@5<`Q{0sbj0=V3xv4
zhN+eHZo}wNFoHGJx>jpsrNMesIQ87DbuA(8>rH+OthGxa)B?wg2FM6<vKNunWl%&t
zy$}>J7SGQn%+yC4EZ-%jKOME%&K#!zqrdiwbu0lWfhCY87L^13-pu2Jjf46CFoNZK
z@blr5qttom?cNhXn;;mG6>Sc{_-}d*0{v^k%=aXUXbs;eg7Lz5Dda$L+jt5D#ZQ1~
zf_yfT7JoqaO-{hb0GwZli%hQ60>N;+(mrHx4e(tOra=Z0J^&i9JM~3`C!?0qWB`gG
zkLa+ukR+jnW1qmnaN;Oi#7%A`U@ORWSO^wpbxYln>ZEmRD=&%RXF-O_R)#Rw0L_}6
zs`TG^CyqZnx#K_Xu~`bjk$oeMZ^8k95C;{!HIegzRSC9hN1!&`0+Fq2C0GE=)PyP!
zNKXD9H#NPLWE~@lz#dWyApcC17*Nlj*t7@c0r<u!Ky-8&1g3b%X<DEj9kxJCTOUFk
z5HW>Qf(2VpC&bAkqaqIH$R}7tx)bd^DG<0NFjZ2hFjjOvMznelZXr@qo<n6L2&iCe
z&=>(bo0rmpVzwMWza-g=^^RTX$-6Z#j>kC7jh=j$Xsr)QvDrSUY&mxK0}yu)2*4(R
z@Kf&{92R)eWdfAukF!}URrp4T>de@(lLbJUvW&RXhutw?0x!(2?+|xV1wddf!6GOa
z$l2r-`#jKc_mB%OEO5hKO2WpI^g6_ceB&rAm=iFo23W9%p!3N==6u35R@s+4%f?tx
zy4*KAjjzI~uylJLnpLqlu*3s1&~)UYiY1BIux?aBH|)Q$PTzLV_r>*=vI1)7oPM|1
zM7W=R^b!_XZG-Z838t|G(4i_K$#B04cG}B!xO1HO)co10TX=!R9G1A8siU8HrSYYD
zH>ljlpC28aDRO_61#xD@z;bv~7u8eYH7-duFGEPD>{I1d<jNFx;K6Xvs<1u_p6czz
z3XsSi6NF{Ovi_r@ajB<Ho4gR=MKA_?N0B0>%c^|EQh>_J8=0iZ_fpduM`1>mPAyW1
z%K@i9D-Axb9y=mvld3?5(q<7p6^ICjxEk9y6GEJ`L&XMYM6tk&;=mC=251SN;FW9<
zWG!vm?|E)e>YTm1Mt~NZt9#|xzWVsJ*PxYCT+Jeo+V^aQHg_jPR`U|sG32vD>N+qo
zG-9$j(GBhgKuy)&x);CmeOajh8<af#ans&Nl4Wt#)z!vvL^#=(5ch!-SW%ZSNq^UJ
z-$S(j#oMWcibCjT9Wj-8k8co9=Fnt-kMl6=9GEvfh<wZ*Uy3Dp%5zQolH5NQxipKU
z`r;&mDjW~?h01kBUChTAN8_!_7H&Q-Epy_!b>l4<M3=3Ka}D-NfR)X!Cq7^QL7vk(
zWbt%V#^y$lrq$cGV5@~>31y(2=Oi$Q^`yO_-*8k@pMM|%g}(uhSSOxK^H$L<VS@o|
z&<_)YSy8>EXC3b<ek5rw0cD5Dwd)>2)3esPj&Y7uv*ugi2!P`#ED-mKBqyptnF2Gn
z5G=*CG+Zt?YW(yk`*i^Z<jFY}V3?_9lE}v7WR&PwwQkB;yGjuG7}%SPILfy!l6uw)
zK$8I${&R7yi#qv^aC<A+8<16Y=gl^24YECo2C&NBId_tZ@Kb|rkkvcp_Ekmei)z_v
zaR{<~z#x%<ro_#O-vK#$w=`Ny6R>FV%Z&4`DgkHhHBwhi&Rq}JcKkZzixC-D1h`tU
zu+*v<B(t}ZxTr|J#^la6ZB(vVqcNvgXw%<I0QiSb<4QpHT15!9J^$43;V`!#geQms
z6!#T8xPjGo{Rp1%QO`~KxULlk^Mu>mvcarW%77_JGTzV~rdQP}m1Gkkx;P;gh$#ip
z2rRNy6&hr3PFEG(GUFM~adq+?aQfN1K$+Z!DRt3PU1Si(0g((1UmlRr9j;IYAUBf0
z*!-M)kCS@7bm_r7Wy?Sc#2({2l?$1AfFRMCw*@RX;=^^=j`di(6V`2fZ4(Nij2hjP
z*$3%&mdx%_k`Co1)d{Cgq9)1Wffe&p!Qye}{#uw|s+^I9dEy7RK$k)R9h~aqn*TT|
zVDr&CG3cd3jo#liU_KjPJv@-bN<g*kw_CESn-9L777X}vl^wP;xyScmjSpG*dT5Ui
zw)5x`t4hO`=wEKKT494VcB8NB5|qhJqPf{pNbHvjN@2N(ZzQw|55y&&T`Y)YBuC{B
ziOEeKkIUc}4?6T%3NpdY%j70MarG7^9U9+swM2{D4H9Dnaob@yDM%5OEtEax55VLm
zw|)+C2_FlVy;LGx9>;y*FE=@e3FgdZa+Ca#gPi*-X@B@b)c(y)o(MVW8KQA1<XCKo
zW_F0ytq|?{kmH>pI^!X_??d#yh3GRv)H@R&%xo#Egl2LEXPAeYc!ru@3N?!jHO~&U
zxD{$yA8OV4mz%VCA8PyUhjDDM5jyO0PKrxmq7;?I;Y66DXBd;4bczjgj{SLvn97?P
z=6oxRGlJ#x`!J7hOl~rahz=)Sg1I01<uLG*8y9}gGyMFeU*~1Q&zpr`xb@39Hi7R@
zn18*8_@$gXM0RLekIHzud;vl!rH6E9t6uiEzvt!f`ZPat<lT+%OFEYWV-aD;e#_PW
zu4w%o{_S$?g|y4R(*rN0UJ^5ZgUz{1%)FS=lkn<tIboX-n;ns629F%fMMXx$XAhCh
zaw{m8<L9<(Hn!8mB6At3>H3sDOq`T#L}6XBqD628=1+EPq?$OaNF}mFB{FgbUZ?`Q
zS}=4SjVh-H=c^1-KW)TecS<~WO7wrrGa{*>SE%GGg?T%-s8?=}@5DadNg%=uzgb-w
zK-K>qY54u8@zs?UvB<jvSIYe(;#bm>E=83^L?x&0wsh`>>qqo&@67Q8KWvTc{1Fug
zM0cn}Gw<Y-y|O*Gt!NQ_{M=sVvFM@Smmw@akLyO>aN3*e-Mew?FE<&#7c59TJ;C;u
zn+&<*Az}8vxyk=8ag%%7Tc2LkU;4{U?)?7#?Hfa%%!1Iw#z6!luuN{U6`R1Jy^T%e
zwA2(&;&qJ>PZscN6;BblvMrt}p8l7cERK*!m#b}+$WUtEmdI2c);xUe=$nYcSz4c&
z+@$W#_F;+vLQ68oL@-h^*FwHc^16-oAIUsBOD(Azj;@hX`7VBKQU&f;7=NS+z0$R$
zi_R5CN*DXqwn^XA3HuJ0ZgYDfT`Kzg$T+?*v>bdZx<6<be|cKVCvkvMp2&O0tumR*
zzISs_F1w}c6ZSyIJBcf3%24(W;#u<@E<d-B6_F>~+~Xw&{5>n!Y4RJB+R|a|dGVMs
zt`x4zu+S79%h2+{yP4guWu%)0g^2epDHEAZZ?_XJ-m;ATFn;t@>I6p(P4tOU?8A+;
zG>OTb9{-kM1kYFH=nbv=hX3*}zjlxO+rJ!856ONqw=?3VbA7rZnWul-$f7M;J1Uba
zg;b$fhFBkZpuZwJM;Ec=SG47h{@Tq97N=*r=_I(lfCzvfjOz`&5#iS_D&0`~k;diC
z9%?y;iU}Slc~=``t$TSxRc)g0X$azx-@F#OCg$_!Y)$)(plcQEH+t@9f>aST`d!3e
z%jtu;lNqW5#NcbH4?99^`U9rAPbl52-3yyJQxFqA5!s`GsI*kCOy>1EGkZb!8|;Uw
zSljl{kYV@Echs$9G}ryRe6z)ks)fc;=)nW)cNdl>g6|(&t=Sh@e{P9WrXPPuuwTQY
z6NCbU$0VoH>kk@oS6fp(zBlsjIbThEQ`q_4yypYyfwBIm>*n!_?(Y^I3)QDR1zQs9
z-F$W0WP{CwqY2&{I$#yoKw)@aC9bk<+vtcu(07-trJrkz+D84#8fA^ajgflr{`T3<
zFPtRxl=OU_2XXf_iSl0Fg;QA3QxEc_z)k`uyLI=<wLHVh6W%t=;c*3>`%3j<LTgku
z17{j<{4#msgOQeCVS|sC_o1K_=UcL=l<ZAkp97-v&ipj{s)cys_6xB^OBnMYbxx{c
zwD$!!{`=>_M#)Evr^JJU(mggUQrKKX5B74<dT+(g_^qV$rAO!|i08zP3Y~c{n%Zw_
z(3n;9r&o^2O<Lz27G0wBurCrbZ^u;dU5V~Bl$J?~f`1hB##Sy&`WPoHD5jN$NJ=W0
znjH^rI^sQVq!io*-{6Sn8p908@eJINCe%s%CRUj+JYEmETwNB7&NT#|_A<A|rC)IK
zpIY&e8(o^&N`JHiM#X83o|C>)*l+BB^O=^psoGrJYey7lzB{JI_cbQQ&#<>n?)j(a
z3a2-MGTJx4X9ZU^mwt_w(OHxmk9__=*t^fCCf~jd@YK+g&;tYrAiei0q|ik~nt&ih
znqZ*`q9`Pxcch5)-g{9%R05HX(vd2?i5QBAfMoN#f6qR9&(7@2oqe-^L9UrhGS~S%
zzsK>Z;J<*;>LAOKpV6=Lovf83_kxpy$c|wYrJ_ipd36I9iVmklt3$eeek8Ht#%g8A
zGie5<GbT@=6+rROA13;Xw3PTcf87<i^*%hOJJ4$zseU##9^sk>lU+l}iFmxjhPA-3
zX2nL>GmaOeM$F4m1J>~%M)_q0Y&p1xw+0MSV63L|D5=sJ^zBh=u;9;cpb)_qjG;U4
zg9qm$ngNBx>fmT+3s*3ua1DX(Ikfn$Ya5MaDIq2Villdu`+8mjyH&{YMw0fsKFWU#
zWH41k7d>eY6=S|>VOPk|o>{ZiVa6a|V&a<y|7w%4U40|GrtCZAWT70o(>`s@tkot@
z{QcwD`1dHNv03;g=H}N$mrog)nG08I3d0dOMObbs7_0CuNP+5R(Ot`)+B5=CyW%E&
zA#cCDOli2w6q{d#^r}nLiNz%^66TxSEk3H(T)&v{cE8q`vt%^9ur?l)-}cj2G1_)h
z<Q2<zi=O8?%%D4T_ztRp2=1?c>_b}w+-{+2+39Pl5BwfJHen(tCmY0^XYIb{i;Pub
zvIYqg2{@}HD~isO`GuGdtz1E#SZ%f_x-5qo7cVEhHn4iMi0e$@(4x%9f@-^yPohIR
zleaqLgp|TB?BRcLXkPcm5ItFR%M0G;`?GZQ(%kz-C_B$#KRojLnGombDhg0LRy{y&
z%;aL-Eu>H}D7eOO>#3Vdo1wj#*ipOq(Mv-B9mNp#A{d5MQ9{s5Z)2b>UlLy^l?X}i
z7+G|TXM9j9+nG&zzD&t~m>i|~)i=>UWQ}Jw8Bi5N&gfEL$35GxUup0I7}Q@paX#u%
z=Kmn=dH));+*(<h6zeyDtb%;tC`c1H!cC}fcIY#bqZ<rRDj)|w9qr-2bfPuz(Im1i
zhy=c=XNtNjq&YkMP=zJ$>I3gbnyeKC)G{`?3H~HEuH%EMAz>x)ks&2#cVKv94>%$q
ziX1o>7%sN--s{%HyXn)fea0#Ypl5B^$qImeLlhI?E=Y@>nurxz;Qe{Op=aq-TOF~E
zdt}de4)W|rc8nF!gcnml7+=xgOS`=tuTic^hXxOO$k5w?g?RS6ln3)`{9Hx_S$p}O
zkf^@Hmv8mHNg7ahjWyg?y1*^sPkYBwO>czcptxIn!uh(x!Yee3HmB6028d0dAXiF=
z%?x(BS<c@w<m$dlxtq>s1fwMc`Tb@XY94*S6l?<E{|4z4S}wR>7l(mt5&QpqtKE9y
z6paK8>T5}t;D9ATW&Hbc&(@0zew!={^1S%c*=U*+t0Q(BRP!bB>Ye64CQr2KpMoQl
z7Rb*v8Yv;K!?1n42!@%T0RCCEchf7$bWS;UPhI`AC62+=N+v{T361G;LjB{b1xW7t
zw=dEO2u1_i3s6NrVDt4v(xcH;&;Si!Z46ZU+)#*BHi$}&mOrq+=S=Umh#~4?$1$a!
zQX2M+f0;s4Dq`x_?cNy7Tju#U5%%5hd1MSJzvkvUv{A}@<%bqv$RuFNZIlw7IbtC_
zH``Fk%b1CKyezKh;W23EN_Tf_R@DmT<6oX7rW~eAv=|vmWj)^^goqV0;gQgV(eKh~
zk5V+X!ft-WDh=n&-OOX|KvCQY|L_U+)2&cI%8~QKC-nkMOCbgA=LzX`^i3y>vSq)z
z8j?*7Nm40QhxuCCzcDw3@7;5Rs8LXje^QS|@^&~Ottgow<O1MNgHQ@5grQ0o0<w(c
zA~~02SOMsrKedI|+9>5+kxjhIzZ>;*$S7NlP{^?^I(q8cM$uYrIT9r1av3wNj`>4k
zF5{ipE^tyL<}!Ysw>MP_Phu{6uB4He%bqJF=F;_+&=j(!B9_ElD!aVa4awJrW}Vp!
zsj^T>=#tAosdV<Z^r^V@hn?A6DFjvUwGLETKDs)FMC{+n74tMfBy2?&jN(x17EZ)#
zUkD+o)^C7IqAt2whI1wMC^_P>a4B+a2+lMfGe^KyZjXvTx#{ck85U5Y8=r!3qS%we
ziwBgj?@c1eptSqlLX8vp$vF8Z0_Q6f+Jd^=_%1pdDy?WTmPATbMqNG=3casbfg+?%
ze6fB2rA8iJZ8Quuj0D>2>OjAdz6R7nx4sW0Q%;zu7?m{(o~ILiJq#@Y(G?#JqrGsA
z3hSXWLo0SuveSlZhM{#%yG-|xoMuR!1*{;|#00eOD%q5Q1RAl8RTp6~<_LeIoOsO(
zZ*Hoq;z}-I7Ou5kqPHz1)K&<m+Hh+kIzpbf=%!^FD{Y{*h4iS3TjaxO!^(6!5w}F}
zUM%5=aVlFuU0{W9^fD!6-BHJh^m&^%)+xD`=N!2WoPc;`*BNEDmxEdq!uS%My>6Hm
zQZar^GsIdu6AY!NBH?F`&AZ>@dqlO6Uup5ME1U3m80yMbc(iEniG}nshbGCm4C#iE
zjLUV5GL)jA0BdM{<Hf${%sTeB6Ec`&T)N`qNX8|Y0@6v2w-Q0bW3eC5?}I7WOVEm|
zD84Whw-Y&uLbU;gYp$asHSY4sVMLwCtv7MfCFCkjXhoUus}N+fv>1X4D=3D+`5?7u
zbrqplZTzrM!-OWDh?D6=;i*s@JE-3|6thp*^u>C3q|g>;C~+sWD11TN1Q~gGMW_=e
z45msiLkKA#u^94)B;gW9{vY8IWmkoLKZ2CEr(hQo$|yr{FLY~n;?xM0?<*+<q|g!c
z;odB|;)KflL2=d5dphA8vW(#xCFJY@8~Fe)?gn?%lWy4xafpeRd>A=|jRaiw2#1j~
zrIl)Aim5Q-AH*7RL(t5YlmcCp0`{1^6Fl!EGFV_7)(&!_uu8v*WHrOwyouz2^az<;
z)4zjC*1pw2HmH1D3OAJG&!Nys#)(6*Y-E$ce7cb3ZA618t8ew&jJrHJ9z1Pn><!&8
zDk4fzZ4l<rb5$y~IiBHt_h2&tp@>I6<f4LJ6u}An$oL+Hb(}1|ESw}<c6RYxbkkMz
zNRPsK^h>p(;lQ+R29j{OfT3m7<sKztlESf^qWE&iAZZxdJuIym`G5?rPDWQb9Py8E
zX@gL;@5$**oHk2<Mx*`#E(vJ%3LLM=kW2+SY>wlQK+aV|Vzl=Vr2R;_Zd;dozzYhF
z{{WZFPCc?}uF7FQ;5O3J8l|8bGJ$opt_+n-7aA$n!xA0FEQOOg?cu3`b7xj8opnha
zOKW@H7nec^nd5kTdZaS#iv%T>Pox*;q?gWm%AeN4*TdrM_Ld(KYgRO<rntk?ryp?d
ziQIbHO-B+g7k<b>aL92ofrW0mb^DqOLm`rI8J<cKE>TS1;giUexp+38#FfeJ7Q**d
zYs=R-Q$F7M=JoDbC7euyYfX4H0$igLvJcPvt_-g~R>9u<gZ+4h<-TvMn1=oBJ_>_-
zK-a(jdHPx29?LC`>>3o28J#O%tQRUk|0<GlIHT;bE7M`Cg4cv;c<zw-qk65eI!`d~
z+oce$B4&9tIyqgYRj52uj2Q{IT+c&v_B3{^Ya0FoT<TkmiHE0pX3YrfQHbKvY9;Y(
z1z1}ys`|xxrmdfs+-S3xn_wq|cv~$AxTKTorsE*?%%5R_=al!(!e+eOP??(uyhu^6
zu-XN(S7ZIkI&N8_hazsHKZ9aZd7u3p#laBH#y}-tBcoaq2Cv!X2$E--Cop}N-OfN(
zx%8A$lxJ}C(1kPF%G?*vDXl!~*%OILJ!7_6c^C{8O`k%lTN+b5mwjP`_z=tNtiPov
zT`$c4`7|1FyicL>6!>(y0XjqpWDRfU#)=xqYUswoTdGf0+!as3Nm-od<9>7f!@R?f
zo*HM%o+}LNk;}1#GmEV)&)x1hqhycY(KguwhipuX_~Rn?;BbPwJAu9pWlFOD?2!OR
zyrvU|&3;lSEUtm1TPh*CBJ1JN2&NxI5^sqrg-kJWQpsE#%F-OkvFh5LVHMPbnK}`$
zSEV|4(X`u@%plTDp}&KKoSMD3eva=N2|VoVa`%!~eun&qw`9aIRJg5KAM0f|ek*N+
zUmz{ddZbUgmfsxc&ns$E`gi;|f=eM(pHZlqkqbnZE^U(M(Nle|qF|!(6IZ(;P`~qH
z@8=}_IxCH(o>VP2*rZHrQ%|hPm!(<=rLcvkY-YP=;BKZJc146CTqN$7%;_sOh^ZE1
zvRF@miRiqENBy;4lwH2@RVbEw8+!?fZ%<^9nO8_&Z4zRtWFZ_PAsDe7N1IjDV((oA
zO)+gqi-rjW<d{<RxKYWGD67n%D~=b&`<Cgr9;pN!souhCb`4D}uxcpb(ju-)mn4<m
zr|%5OfTv-#&MB|*Z##>=K`^34D<}ufDD%&-Zs$GKXFbB550DJuk0{^HX(;JB>N0j#
zy}usNYhFWZ<Ej6sg+kK*M{Fallj@BdZ*?+rj97ouk$}rE+?AGNijM&(*vX&SW8q~b
zb}^UoF}U&t#XrDh^gqBQomz>;x}(5%8u^k<RF0d@t?*AI;F3{c!?=M2T>elCzaRmZ
zq)JG+CLR2U&^d}(Aim6U@G8NW(+Q((e`uTf_~x&kSbx8OK(vjO!Y_sJkmAEJK43yM
zLUo(6PODq!KGE3mc8{YDgUlanN`9RDF=ZXJ8>YKDStp=^52Jm8d2x>FMb_wOwb05@
zP!C~2IbG@A>SQ;L7+f2)*2$P^$h5-VWG9^n$M5J>G;v4c#2BggyMUt6Q%$tGpHD2c
z@n}c@dGP1vEv3ygA-q&h7rhC_LjMX=XP5pKIa9-*TO3&0&Mu`>R56Lf(R#~b@K(>H
zn;sv=W7^^q7X~t+&~<Mi6}pw4hu!>$qYK!pdfP#jtx;8cP!<(08r?;A3a`a=Y}E;{
z`(Q=C{;sN)^5sF(I+1gv3HRN3TF!b%R}%07jOBx&1q|`%YvJ0~Scg2Nh-?*I*C(h3
zWxoX?igkgqQz*PBX3SX|-?>iN*?d%_s9QMlOmEpJ@Xj^;`*ujRyE(C8+Jz5w#X60o
z+^z=Tl7LiJYjqzV>2iMHW3!OJr*|_yqpBCC@;;&T%=^|Sq^si^Vi>@U$l))a>(izx
zvXThbG7DV2BlECm7yDtiB13{(b^AFMWy7s}6<+!eZ3(+F^R%`cvs?0z3QeLdw=<qa
zCL~V#DMnvGK$#wH^qg-Z&rW&^`p{pisYIfmLrw0QHmt*vafY$F-0Nf<on6Ccc&(cE
z4I-ZeWe|)oWj4C`3tT102`76>rc~{=D}&puLb}PE@31IT$dYJFN@M>6ilp`dYvMt}
z7bGJaYCE=T+fVoO!dvdX_uCiVpZE82Iw_l5JYsw5pV*-VLrmUh8|tL>sBZFn`;Tq8
z#~RVsJ0We;q9cV^VW8qaZ<MI1fJ1zMv>UP&rOaj@bdt|!Kaj0C<D~lcc>7BAyMDG)
z^_=L}L+r6M7RbB$lOz4{md`Pu7y|2|b)`C$K&R5md?)-uiKV*RRH%w4^4T$on?z5A
z&>sKxj)BWnW%#^XkKtj*{=-d*HB7_MK^QL9W`-*op+Dt}NVsG^3l{73XF^nXsXXJd
zX87F`Ru9u$&ES*cKdhc+g{T+~<)>`-%uBDmR(X8J=4DxFQEA=!l$}^@7Gm3U(3wuj
zFTmVPwYe-p;A9Gk*R7~3<KR#5x*RrFDjF{6VE=pZ167e+h>B)Oxx-pqpYhV^prrGN
zvwrDa$mO8;%9d;??q=*EuQ`jq`$$c((JPhb+>gDcs%`&=n>5xd+>QAX6|HnnB>id%
z=?5ny*dQg4t&gXZbNgbd<cDd{k&?GwI3vYCq$C!!m`vwn6JMgRm_PGVdhuBg`KF?|
zBFv3mWo+Y>oQ2);OwdIhzkd_?yU3`a$z2poT42Nsp`DH|l&}*8=!DvjiiU`_cqzmx
zux;mMulnxfikuoJ<5{k2F@IvSvQPQMQ9HPqU20rN&Oqc|^6@P)n1qzX9r|3Plm~{h
z8TJeQ75D2GO0gU_6p7Mp;uXveA0H5_KJMf4s400lDEV&Pk5uHNbT}m3yx=#WFu=$<
zEWT)eG$QZ?dSs+B(Zc%q%0Z3dXR$3y))6hr4T~?DYbA<<flUE`G0FD}iep!Ks3&ho
z^F|z-qZruJJ{x6Iu}n_x4G8v@o~>*mVMpSklh%)R$*grRe95PQ_5_*~J57>*=@3UK
zXLQK5HJDMj5J%2DHXpOHwsU^3JYyI9t98c4qn6#yp}h9jjFUI-o3D3M9o|g4H-563
z_j3N*y5OC!cgyav=C-wsi?=eztX;a>w8QO{h{yB9$5YC`7d^={UM)TP5yAe=_s`>L
zM{JN@o84W3{Vsk#(6sXHh{|6a(~ooLR2^*;H(#xV(j}@bCVdy4T?rJ}e{%Ps<UZ%!
z1W{947oP`!cFGjzx?k&o!6I{0CC!6WoTa%h=EQAmD}-|SZQ9PF0wmhcc8$kZvLYnM
zD=GJE^2oDyCA(g@d)HOI;r6b@on(FIUoiBD<az<Wk}Lk=^jT~G{LlF#vnr8`hq|;x
z^eYdJt@(sc`CK_ZAN~UD37?o8FZMfs?`IRb#APoCA6Xqc5BerzatH%fA1`Relw}tm
zcK&*!bv#V>4SEp3CaU#o@Ybu4<1fyyo(Iio=932zyB~`__gyCfmjb>CZ|OarCcd~l
z+NS>9`R8l<*88(><w5pOeuVlsoUZlVS~?*#^W}JVe9y@CZpLwB->=J$p?<Jq#xp|*
zQm#Tvd*4>%nuL6X(`frBHyHO(iQ6C;?trmelgj}0uL#f!aJT^53ayb1k~I$;A#S-s
zZ~GO=`N1rlA$*xJLNLL63>>A-7Om()j^e)rM<du)!7(<vLVV0IMkY~=kH6yM`h^&_
zd{)_b`%%JonB#1rw`+~f0RHi#Ue({b6lFXUfzb(=$IC@LA2Pc;trDp1($=6mHb@ck
zl-NWv0N<Z&CAw+mWVCJ}_mEi>S3sAy;3R?wU6kup$ZNzTNUei3%mC~kn3>VwbrE&-
zK1otky^w7~%;C7tG>;{n-BL()oH@?;%^{7j6MBZxmWo4*l37Cx$7s`TDF3oC^s!tN
z*O(ekziAw*NQUFY{?WTrQA=B6VgPdozxhYPbd{uJaEEmXn)m};vk{=?0gRx@N_M5?
zmWF}h;B<vEs;se4b7w%%qKP#>z_OTUw*U(y{Gb_rXQzQF#Y$=wQ(4ebU3os+??EV{
zw4k*XCbi-M4Ugz~4FS5sv4)+Eq)3mFLEVewu}7P`^jtsOQJMs7MBZ_{#K@M(J!2gI
zMO9vTVK^HfPGX`#h+)5f$Lu;W;7b<i-^DB3ims0E>4D`cy)YR$LRJIkN=0G&&2>kS
zd*F+rbsDBG$4NhU%u4wVc~O>0uX1R^aMfcc9z8Lf9HPNo-#VRI!_a^^<6feJAbUe)
zr_jxMm-y6zUgmMwo(sq_(gncLq+@wkYAzG#-&R2NkRWPRKM>auX;~fgTwh<u7N8q8
zm1*_qHq9_%P9bwTJ!_p>cDQgzR?wTLv1QNkZLI41H;*$z6ZU+*tJ(CLQnPAj^^qXV
zBzvW`wy_7Wv;tlG?;Sqr>><6KPjD2|fbUra+i+M$dTVX$4Abpmu`4}x0~)aJ54WxA
z)!S@iys}U)(PZd5{u@@rcbDUDZ+CXHX^f71=d+3FP2aazg^?soO4fWil7xw-^EIJ{
znA;N~udOla+MC?!805wnnRM@2H!#A;$c2N+?+l%#X8SW0qec+R!4D`~UDE8h>TK5@
zJ1DYW<{%`bo>7AX;4}kWBIx#6QUc!(@H9b^_Wr$P7Dx4H`b~m)z~oCmLmL>jzfUHF
zD&5}|!FSu*-|C8paszs#!Y0F?*0%<y@n{q}19i@muJE8gY{$IVbb^h>js|?@8j}j?
zg-)BK%kogM9`%2UD0YdiQ{tYu&h>h7bD7>RgnP13#2|;&VORYbhcyh=RB7vgyaiOB
zFm0z1;SP!S4j`_v=0k4Q1TW@?9CS?-ah#MJEqdK`4EjgHEJ#}1V~VVvxn8LkRfb_;
zGT@nq58S#Ex%lH|P(k`GbW`PJO1yI(&*F~t?~d8Uhe01TzidSQ?%Z*B^dxnD;bi*v
zhn<8+FNi$L-!p=`RvZwR;`whsmev*1xMLpMiqDfZ>2jE}`^J5vvX!EJ^EP6H(ogMz
z{_5TpE^&3)<hY#FD~>Y*H!A&7^O-joLcRMX4zQU+IWJ8jf`>f#TC%>`C(Ha+Q|OGd
z=sj6u9sXgYBU8-weEY6=z8M9t%$>*aJ+W)HL2Z*Pbp3BqD7mcQy?x%w*AOqR?%n<N
zlxCREuq7^ck7%!RKGg*b@*}{#l4{rHQyNd+Jj>m`M^svxtqamP<ek*5zjF6eAwbwH
zOVqUiqyG{^XCk%1=U~<?<42!_fqL@!_OFzw=KXs3oA>7cM0zycCZ_2X-(HI0-`%b4
zr<FLqU)-hdp%1<UE)3oIEl~gWyI$_O{N+yq{)QI8N;YIkGW1V)DBv(E^xXL!g>}5(
zu6Ww$^Zb)_NSZ;cc2*smw^*V4ad;H7XL96oHc!4FSdUPFHp<R-{<zE_vRsi{Wtx?=
zyfnD-gp3&ZfY@J1%#n?u7=;2F$Rd7_u@Z=p(d4|N^MVZo5wmEC21?rGH9=<}xS>?Z
zhqB&@mnbz#_D7boKAQ6C=setv>H#p0f<UE7AdeVXdFWPwDdZ?AIEVI#c0UrttbqLr
zFYCxz`OxeaI7pp<P#~ILZiQD2&2n7GFZG4n3`t+vaEV!A7AqWnf?-W7VA|bbvLr`{
z;UGSqwl*;05@8}4P0$FVayCS3bg?Hp?;YL%dY1wnw}D4KpkI%G#L)<fo1kwEAm>lu
z+qBFyW5=5Xd;Qzdd?_FX<`}61CgGc2Vq?)tDQjnD)`4bplU?+?E280Mus{S;4avkr
z(`^)UOm>kxdwRYVRxts7V_(iwGLCu#v(p%V;7z8d%p5uhCJZ?%(0d088a5QCAx`4>
zmvO8zD}OOPtPgQIlVr4i3x{(UI?^Jooj|~5;IDr4eV{~ifB%UMjA}?8=mz5L>1BN$
z&8yBt+SOSbZ{#Cw<Ie8$t{g!B`0};__>Y)>**NhQR54%Q=3itM*hqn)w*@GhpsaoZ
z?1U(ZCaAwp#VO*brjUIXbb*%z0-Z@B=5g#8KX*NcauGDknUf@9`mG$2M9gqs5pNb&
z^VRM^G}ki<-Vn1L-Fy7HBoGt9)r$tVjPcVJaxanbxMTTC!W6t-GK$o6!(=Vz$iE*l
z^Hsxsp7};l_}p420B|p%_$ETXdBm^+`>46JUV`)vbL6tQ%ofWeahKFaN-OJNCfoP<
zo&IRlrGoTPitM671fzxQS~3)10r;s<yvicC0_JLxEpJN#$x(_~j`8EkSmA;Y^KSVp
zG>5zZC!-7Jt%C+XbC~snmRKRQhD8+HBpN87U2#3l(}^|~N3x@6>r&_mg>0ifDtH*M
zt`O>l2JPM$?w7jf_eqc^b<G}47#85*eu*Wkum)Pl*0NeRSZJz7YdU|@++xwPmDIGY
z(9&Gino_v>DfKGN#MR2?Q#IxV(inW_=<1QY_Dr+Xp9yUg6Bj{oVY6BD7t2rhK<+M%
z=A$h8rzCo6jMZcpWT}v$iACAULfFLuX73NtWE1;UNJku9;ZEyPdFBF6gI{cmgNzZd
zr7-TTRUOkpj(#T*!3X0nMQqOe;cGs7V&eA!;=C`(t*e#|1mp}Ek_;1CD3g_p=mLzQ
zj>9W@|7lrAr$NIf3A+8pNlMpVCC%693mHVO#InJ9*!Id=uA#QC<y&6A`^e<)&+yNa
zh5}9Uyom^-7#6btu|xswL}$nvoUvn>c^F0iw1kc{U7<$u>$WJfw(|3(EB{68PQo}N
z1o@TfZyN2e(2_H>;WW|&K!;8<7i)a@0>1l9GXc`~JgHgMEGNT~ez5stAwcW8<uzC3
zNzY#y!<Ll+QwB7Xw;otweSXCUrr*-3wLvT2BBnpK{aI(NZxTMtVmcsil5G{9Y-LmY
zm{67;Uc+wG$Sx&oL1R>@P(sF@Dwt<DE_O(M=dS=HYE?Iz47s?&B9SO@iZDxYnJWNT
zzh|cjE})+lC}kW=ccT7E#WCqx?*ux*vb>=ju(IZzb{ew8UI}#OI$5JVabbRAt&-u)
za2!8f2%KZXKK-&!HSHoWjaABUSxa-hPH;sSy4`J+A4$(Uh0}!}h<1QHvDThZ8J=;|
zo)H;h`h{#mUsexSc=I^Cimko!Pgwh%n4)$i)vdn{CVDA&dYj|8Y@FO$IVRhzu^&|K
z_hsDwnDC=R#m$!N{wEHP*6I82IUY^~J|t4BFdyv`ebN=mQ}2I2d9Y^vKt1r$Eim@N
z8b}@lZ@nM;xt<~Ojc8(qpX7`m`i)rkn#gT8{u1Y;fK^L>!I4-D`&3uJ4bI0FZ?BHl
zTS!yz-nn(<#VViEE!7{Dl+$lc!;+}i6%&vgK}=>r!9kd`D#}n!3M?l)Y9=V*6+A_C
zGkRt%^X)A<*~DGn7Ox238I|9Gs=;p!olAqBmWuG!s1`d3KMS4o&Fw$v23s!SXnL3p
z*Ky3GUCAsF(Oxv*i3>;AnuOR2tJhn>eY748LP!oBMuQd^5&(9P4G*p`cN8$K3S0ot
zjB4ZtO&P)GpC{@z>35yZ*aB@@t+7OY#rs-M-rWa>_y=LHonmjQMZ9_xq1hH8c@)8r
zHm}wObXhSzItem>M0u!%>pcNJYzu#UY8VW8F7KY^lgg1U0!a(gfeW)1!2+ZyLZ7(=
zRAczbzLFkAg&N7^xAItaO=us7ByGh1V__Cvc;PVDb^;yS_Pz9OZIQ*`RQI+sp?fxo
zOv%!z=}G5pr<ZMsKOsq5U?VIf=;+jz(l(inEv4|W?SyL7G2$pz;T{`;ZlBE3g^FKS
zKs0TIDFYVzw~(!&i*@M{zX+Osd|3*z!X)D?sH@IIi{po&Ntp}AtYV4ICxVj&Vp|AC
zDkRt6LI$-Y!G%-IT3ZtF=8crnnb-V(DBOO&R?N&Q{X-oLUu*dD<X&d>Ypd+LDkkDw
zQE6}VQuX=qa60!Qy|We2B^=iDRq(|MHN;upM4jdZIRj)RBY}+P1xds#<c8pA88LZ3
z)I*;;QPT>5=;tItW?_>g5wlRsvJvWe5Tk>0NasrYI9sg4U4pVJF~}-;myqM($rmCQ
zn6D4*NRqUoVpl+m#uup8J)vzVVB?<Sw_KruAS$SeAkaB}&pH0OuQaExd5qg%ef-Kl
zxy)?u&j~~$-;p#-1XF*Ph}>$zZ7S@wx$2MHH9dAUecZqs+!#ItoeHN{TN2~KFWtIE
zQQc*!G=b0uC2Yi43s@RCgD#o=Ux5lHWZhqM-CrEdCIvJtO9I9nAIHM0`-MLX!OV!^
z-*@s?&#Hd?x<>JKvubv;W_Iw%9C|!GE_V}{wrpmh%iTm)7vw^#h2Zssg$4<!eRh%f
zyTSrJtEVn%b<`|m;%O{LHfD3D)`nRD1eA43IKH8(U(GgW&$s`>O}?v1&rCAT&gJps
ztAW$iP3tz1ywVj>_Z2E@CzeA_{;xl&$Gi9s!vKC^fSe|X?lN^5jvxPw8dCT+?(A);
zU>k4!`QTm7ngXWDWxgsF^`EfnzqqCcw>o$haQx729Cr&>1y>rJu?pfv#x7!}>lozH
zN?o){Tz@S%x$@T-QDLygm$l4ieIc0hrhODW_vVz()VZ2VtNRhO&)>e!H>lf9=(q^O
z_=YFyY_gHrmH%>it_}l;ccOC%du1TRzX~6W>lDQ}57s}^>v-DtHfQMF!q8A-pR>^A
z=9k)3LC&<WL4jy~=ob&tw5+>J#Sq0yF}E9l9Qp|Ta%BJIvDUCNiYZ@^za?A5zXF;C
zrvogCC9ZJQBO7-^RQ5x@2sw<4<~E;SD7W2&#go5IMecrn9m#@XTs0CSQJCvaW2G3#
z!~QWh%5m|<DM#LEow@Pb#S-GhTz=$NUJCLtzUO%y?NK@>98FPOOTpd^$KU#^Y<G3~
zA8s-`x35wYk$l8$ict6N6jPd=^A|f(krjy&JQ8c+=uUojZ>=Zg>a6_y?1aPOjDxiY
zuS#GcS4ZLFn4;2J_~hg5i;^(m?Z^Kofk{q#LqIZ>g8${hf-UdjZ0-ur(#p!%qN5O>
zAY*$%(T&E=m{aoFzm{T=eqe1^KD)Hk6bx^7*9+FmG0w}CTX`F|wO1X5a4CXJiC3dG
z$yvixMwG3Xy@J-0Rzcjn8x|inqVl%+FE_5EbVOYE(wthNx|vP$VwVu9ub+zXtpN86
zcubx7;tLrzuZn4CZ9Ai8<MQ@~w8xV^D7}0kIIS$+gaGMQLIDDs3CMP0!YUhN<wwtw
zPVds*`O?oI=nwV3|KgXZL1)FMhw_Z4tcNSCb^@FLgjqK3kg<DO@T229a?UMnQ91jc
zl9*cD<&iD+CvoZchGPdMzqpMhBi;!dxWZc##%ij>uaMO3x5B55qh}*mooVZ4LjDf^
zrZ9-3k6&SX`r<eV$&b;}OU*yF;`{Yz0SN6PA1;{ZMxPZreO2iqztY8{n?L~#qbLd;
zvLcFQE%V;_$g!Z-^cO+b8$YPytoWB)N3Iwp{rK{Lk}GIsc<4feteclRl!}2{D_X9w
zJA#o%BZOAI2p{pM?z-ja=h&C_oSIKBXcbEOQ?4Kax8X9S#KCl_+Z`cvie<yEmAvOV
zV-(9j=W5+Wl9Q43UsHrzw6T%F!*bILlIgeUl&k*bCg%=a2VR<AFiG61&d71NJQN>z
z^*s@Hqm|a~^;S~;OU(Vn&&7C;S4$x*Jq`2pY7I^=7gv)z%XDKt;Yi%%3&!>pqnb3y
z+aKc9n+Nj|QG&{IEaGJJk_KeYtJGU}r)n&`6QGTxPSZ@WjkRLeJL<wCt7p~Ue?C}f
zr$T>JE{n|n==b-^_)CChM?m<Z9FxXI{q$<k*J{V#L7+eHf=1S!KfUtVvCchqP~2{~
zA%jKopp3*#5--=MFV4@2k61mB?XJBZ2DzIi#!Jz}NbWG8Hf^C-{YF&seWxiwQ%>`B
zLH(!iY{sac_u_<aaXv`c28lQXFw;1)eJ~WzG2atRl)r=-fJMst4T}@nTLeDw1{L&x
zxXPhI)H>K`TohZ9*kQ7u@fDi8>DG5h*+%Av18%R(>9)DZ3L5dt9OBg71+Tp72HZ_p
ztzX;Z_<c6=$PJuRPq}*HG_a-Tvfz9j;R-EI@(BePn>kZEOoZQYu~#&dYZVjx3<Djo
zMzNTk4BRW1^_q3BC<>$#K?5Q)*vNn-;pApU3H07IWFP3(a^Eb)O8PR7y^JaUAdz-M
z+NGs%LB?y{j~0OgR@<vSU~`R!JpF<Be5-w(Xr5RK8kvY-`TCdsVH*}L;oZLJV(oQ}
zIyQLuUZ<MST=mxHYxPzwv2poYw#(<=ul_upNMetR84K6Dq>yURIj|Ya(LOLdc%=2q
zCa(4k=y9seql<^bjk@d841WD;r9<N#ck9?5nNb6MvifB{YE8W7HHf<AuXr~G$mJF7
z>?`dBPCNR{0b+4^^e#Xkl6%oCr&jl!82Q17`Hdf6`s5s$6bB?<hrp-}g_p_5Xr*AX
z)9xRo6sNrEN6hLTep6=_F-|T7%?A>_e$773uWmKAFYZ8783|ZX&NA&Mw6)*+#sraw
z|Moj@-TzKN6bpw=qI!I==;z?<=jF$$ugUHcooKL)kfq?=Vwt>l!%+Cl+4I$f)NfZ^
z#14%1I_BTD?|wj?s;d_kYn@@>%5dQBN7*mJ-`@r4#tVG8al=gAT+CVM*BryN=Fw6!
z#|1$`pp{&m2S%-T=ob1#JM{A-qM6QN*T-{tvsb9lOM%DVUJ%oLMabD`&BENtc+H`5
zaPq8}kaa>NrA3hz(MV45=R`jB&Tl&5XmlXw-ZJV`6$jRjP^|M~zZd>W;Z|)dS}LZ1
z*3l-N{^=-e&j-)QrAjLd*^JcEqNR1F#gj3alIiNw1K_H7L3%jFx>(n?-8h*bz&F+`
z#Tir_mc&<go!`}rLb#>k6Ti7{ysH$k_*G3m%AgAvZ}F_}ms)o(SL|4PKus~P!vtDw
zS3Yps&_q=%Ab#OT3evx`SO65$pI6WrrNZOdw=R@(9)M!>1D6N|N4?bb@=MKG9}s*b
zMsH{D=WZ^@@uHvX)lHYC)SCOHlFcs-tT@(rC{u(#o{j;oqx<w4+6_4GtLGv=_+{e5
zS41CeN9$9t+8>P?N@K|L`{9GmGo!#3FZ4&ZhkBWx_R3U02AMpFWz~UX&%brT0>v2x
z`CJ7k5vR=Y&nnz<gjP0Hf5v>lNBBp2mxz|1F@ub+Z2FD2M+tte<ZC+h4}Cpcj^ZEe
zeEt;7v}Ge!ek@Rfw-M0!1H+CGv&QJ%?2ZLb!Yhn!*vZ5MCUX=)?v=-<Tnkv(0=61X
z3++2o>k)9JeB$E9q4bu@mB*OV)5w4&0z)2hoqHA!(g9alzEn}Fu&k}BiR8A5NJCQD
znCV&n=)pyVPYK=KsJu}dJKf?1sOE5u5)+~Xafh%gu&ehMK>Th+Pfo#tt#)mv=)ZRL
z%4N*q4cMIg<CNI&)zrRG3Y*56yc{Jpw1rYAHaGB)-ElqUM~#Pnw>86VVSa)D{>o${
zNPoQmw(x{f0Ct}2Ew*~~5^Nxs<s0o3W}vl>pb?Qfkp0!rcXfs!?Nj}G{@dkuzSM4A
z_3q-xgX5ky+^?wn_nr~sz1Lm9eKsN<It)vM4_8{whKiJ$wlmE;VN4_P7)0BF-B*Qm
zKE=5RwtZ$sNxT53IlM0kqg3+D9(9k();u-uiW3EPi@WJLgAC1Byo%D=M<mh!L!`|+
zTl&qa{yfX?{vU^fSewrE(r>C^2MN!O`rg+h)Q7M)EmCZeM9bwNm>OmlgD3Av$+9e^
zZMuuKN70Ag@0I<Fi&|QT^g|LGZ}}a><es7EE7RPf4dORGXJo!8f+MA!72`Ocbo1X!
z?&FC!OW>4TXU*&%6U8)EzSH;)L!20^*G(yfPR{agHz0%l`o<c7b-OP!n-ROi?yAMK
zc#DyyV*aalx=HW9Y@ux+HTS~J$mqM+H_g&%7+=Q-`C<OY6N*Vc?d3&S@qrHn`sF7J
zl5RTPm}Ihe{6KxNQ15p8Sn|Gd$=jTdvF=$GNy!*C?W_FCT~VIaqc+gVdmdWe-)A$P
z+U3L-CYfAaWv+F9(_Hu?$%X%1wKj3R?s>xg9m?Au&cT(aWyH%HN>*`aV#+x>IkV<T
z;jdDsRFS*yZSRynTV8fhh4kSPUX};|M4f26nJ7Ta!#A!l1B%yW5)a}ij|QoJwy84J
z>FKXKOCEZjB6VLR$0X@8*KRuZI+7;s@^foSzoq(vw-dEW{$(r=$r6>E1mXzPJv=AA
zagI+YhzxIGhT>gh0F(3L^`FAwW4}|5a(`cNJbHpfXdxnU&xLlbJ?cP(*e*I(I|xAQ
z+vhcdk9f+^041AlmNFR(wBi=;+7krd3js`iJ{jZf#Xcp|0!BABEX-2W@Eeiuw0-99
z{#siEExjKD_ktj(dZcHWftc(x?Ej-gCz?ScEdFhEURD2g7{i@-zuq|5NZzSBgqG!0
zYhjUJl*Cx-5+cJDm)0-)dw%?7eiDk$gPpf&AsXb|Lu<l#Iz$bB3cP$Z?wt?Q+YXbo
z2E9n@D5BI0``aJ&2rQJ=z15yig|J=*hE}XGiJI+A#?-$!@$mg~>G=W?=@h6=U<h6&
zz8L2W1u=sh%s}(Eo-V4=tk9rA$~3%Tw6fOpmZPD+J-`l8pldJ+0zB;J7H|z7AlLxn
zHUvYr(FD>|?rZ4hEl?^M;BOa`=qO0QGmLq~m9ZkQa+KT(j7B`Up*2cgNpLw#rc`R6
zAdEhtLNm$3DDvQxQ(@R^74%BU;RnJXK?22{-{GW#x5caQYo{35<rjy`l%n8>Pq)Hc
zA<Vu653S65KSs%=VBtYFCcfo*hszJC#z3O|V2M}Y&}eW-8#ofevN1}1Arf^s^&B1@
zmGaey)drC8M6sNpmvQRy*(|D3G$udVP;`YcOHFZ5KlacHphFv5?P;KELyRf!mtTYf
zP62T@^`dwQVKo(TmTYvQW5Cva`AjFHt_sVXeu|WaxPepT+6;NIVf;lA$VKka7d7)}
zAC~rt_}PAKR-5q2HhK1~1TD7&-Y&{-<q2CA8vXF_MM&aBx8IL#^BkKfE2qS5&m?y&
zqm>WK2yM~@Ch)K4%^z}!M-aL?r~f-Q$t<42YLvo$FNHHEg{v}!XCUQ&xk)G&U5Xry
zR6|ldZStw$Q%SC5x6$Y4VyTKosmk|KRY}}rWvV7gncPX$p-V%Er=g6}^zNk@#H1Nj
zrd=CIyB^FUV+Q!R{qo}FbBlJfAIU^|Ia{jR1L+Ps>5g<6_Q5PV@C>(m86GhiIzBAU
z0~rr?GMv>j?uozhXwP_b?^V!Fy07}HXST1N?7VtFawpYaJ^%A6LOg>PmWeUSj2y_+
zBctFYqtHms^i-!5y-ATUkeS5wIyE>WeU|*y&MP-FK=g9F^?)p0TUeQGoah1L&T>{g
zU3Mc^c4I*lgD*={Om@3%Hl1&F`%ZR!dp2M!`{SQ%oUJnNXcqo;c8mDEu`ys}KgB?0
zPTfGxhA8hB+o*B%+^Nc}iDv9#WlT9|?u2@__iO$hqr8TDIo-45JL1{jgLCF~@`lBE
zSH<(^@8$hQ=dQ)%ub1bK2ImjGCgv}<Yx>x*cy&edD1u(<6|gnslka9P1n2RZ(d_@p
z@|w*VL+5eO=bzjw+<_G~926X>7Z6|P4ssQpkPa5Fi<ss#VlxYP5p<>s38xC6AUGgt
z`H@Uj5t(tGv={%OP2qk_VJVjh+gagGSmD*DMLTpQ$&E!~c15SmrEPyoW_F61HA=Oz
z)HBssdXr;RQFOCCrGIXgQtal-36|{Gmi%cf)0K!78O%4&Dl^e2x3epk^((6nE}dvB
zpKLF6i&Za!uw)k8R>fSWDg?bVW3bv3AKL&O`AG9yUmv?t5r0q~!d-ECP==o^V;ip=
z{8Q;iU)V5Po{~}-mQ^m-L@Y1gEw}Zm%6?iIBox>3mDv{t+#tJgs0;qt<<!$JuFwRX
zApnaD<bNntC#6)@ahHh7mwZsKD%h==;HoV-%O0jLZLrI$wiC9Bt+kmesq)Gl;MVMh
zup|`#YBLz<(}f_Lk}hBxjuZx8GcN$O)jBt%R-$@5wxr#*_TsGOlDoX7s<v^k*3zy4
z)=>}4D*bj=b$z$t^r_;Q4e;J?X4sTr`6%P_ZOKR0VBSxSESfA!9Svl0*~Bx!Lhfv_
zxQ3OgN*eF7Iqt^5Ge$**y0LrBf<yAmk#t$?%xa|;E7MF41+))DWLo9^fh=eBEC!02
zv5iIQlDrZ_P2!rw+9ump>1XBU-yt_|H&IEZuFZ*mZBKGJZ;AH@wU0_GpD}NPqmpg{
z_dD2ImzzDVv493!EuOU+Yc%8_Tc5`X-(hHWifeY9udP&TL&vqbd%q3B0@I7-Z~1{X
z;O*(&?HSd85ZK!U1{qiHHmjyGTZWEjk{yiMxxv}B&O@?a{ybgn?#SWM>;tz8;TkW%
zO|;C6z6I~z4ZZ7}m-d2LfY87mo=z5D5dQYthVNk4p|+2LN#~v=c`O}aL*jYaZPwkL
zP@(kGruT!IhR0}d8Vumj$bNYIhRGL{p-7wI!u$Q)U;|9!05jYm&^n9)4tyBDUjyVU
zzvn;bfF2P$$G%H`x%U3<ySBR9fZF+w3_1MEw{6#NvsC_R2JeCT6gme5q<<FxRQzZ(
z4}quF3>QOPoMZ2KdSWQ{I!A}z({*+T?R5(u(DjA!MVaxFIyKYG_%FM7V@IiekswO~
zU8Sxgn*yF1QIR46pkiixFipK@2Nt;K?t0SAW6^!{{-@fz>MmW1?|c|tM;Y@8igeL*
zC=Squ6Lqf-{gEa9w6T|cm=0HP`_JvGI;@OsYmdxAJ_XnGJ-d&%P5@%NDwL@Wtj&Ps
z1=4~=fOp9Z#%8Jy7_HfA07*XdUmF=rtD|Fz02Rl0!QsB#y@C8;H4YXIz%Izui3vN(
zaRwt&lc#e&OL5j^93Y^9ns`2H94N@CWfnJ3Fg)~rZ)inu&^bkFdID7ZAI6f@YuR52
z9X=RrWgP+_`frrUsVmTDFMNE%07=v^C-V?qssS%AFc0vsoWVQQrI-)kotkHYt<T<}
zeLH)ueWt;I@ZOCdFC=jxAYUiy>s`#-a5>VERf1FuoASXSd1zv+*9$D#@k`)A0pK@G
zi13ugDzdLZ@&lU`3#okb$X<AHc`Tuk!Fdk+F`a*lBygsTgBovP{65@vcKxnNf7bBf
z`)ySm9N_9xG15ij&|nd%MLQBH47?BK;^oaL0DOPOnBMf^K_Ez1k+vljln)~U?p*X?
z!8AJ9FXsNB!It6+r)u2=s^9SGE^~*8PlyZnba}&2&i8&n0o-yoP4r8CAtvTC@bnn2
zA3$0H8Jht&x-O4FMx5k#B!NBEa^~>%>YBlsF3=Ic8I|z)b?I0lj!t@pu`3Sv3qhAw
z0LuLVs*(GLuynQp+P$A@NC$O3V{Wg0Cr$J2!9@?k{%UXhKZNC>KHbe+hxsXok%sa2
zBMwx)Oqs9&4EiRPK+EoJ^fhf^sJ6$qf#GMeF^RBjUzTh4p>K6!#E3vhgrzS*@1OeC
z0{H_udTiJ~&8{EyW-iH=(ny3QnSJiaXWF)TSNW;qXY^105`o5Mje9?q@X|dqT^v6W
z=%USm1CQ;8ty;c(x;;^9AE$7e!`EZlhxRu;bNE%;XV<|_#^5v`M&k1?DSsjIT0P1k
zJ?fo3SM5FFQuy>m$SVi%NLPWY8UMku=?x6HJa<k<`@Z-6Ue6j1E*xES3TUSqfE%UW
z9CJ4A0{t9i?C5rmU3MOEqHb+qFoHtLVKl3wj0$=H6$Oxa0q72JbK8f<x&RQAtl5iM
zDTe`#3ADytG_F2h1j&1^UFgNi(Ndlm>^cCyx;xP5abCN_<DSwVQm_In1muh|Vp%{I
zFBxJMn9_x=s0iNvX3k(bPL)Qumi@ttv5Xct4FHP}o!K~?!ajI$2ZBam)V@xP4o;Ok
zcfRs4Gomqcwbl#|PH3%{@pt6k#ix9_z3|Bq+Dm)A7nRpr`(iRv8sKwb57wHVZZ-w1
ztikJkG_>|Q)%3>?(`EZ{MAq_INV{38Km&aD8Rj_1{w`Yk&`<qUEFX3M!~T<6enumZ
z_FWfU+pg(fW!jxacE1&YyjrT_28Q^3P#PTYuHaGXg{iR_!TrFXJ$V%D+)IU)O3mYI
zEs*9j1%vZ>hjQ`jl85-~u9r@(R4J|zy#-}u2XlUR_4PG-o-;!~crE$Scl@IDNn=>b
zb$oSqHF2dcOllZw-ye0KFQ&6UL24}?u}0-gbWL4gdT0s0$qK^4s0k@Q=J$WyZ0&s_
zFa1Z3!%cplEnd(M!MS0*d8%lH9b<|brHYaOH0NFS)%h*O-|iAd_mr7Y=j0kW2r|uj
znASD+y@Mgnneig$y5Nn|Fn1oj^9-vq)BZZB4@|?5Dy09610ZndJf<WPYWn=d1Fhm|
zd?FPU=^T?GnBO%)RY>b9!K?=2gMDPc9MkO$O8crECom6}+#jqk@v4?Osk@j~Oq^x(
zqJEqTGO&hLEdFwo{maqXJKPEV@qnl8=A7r3lbt)z`yU+-3O->32(1mMccWBCmY16N
z2X2jo*EYbgpX?NlEN7!s+hGt#wjXW+L<_AGX)@p4G@a11tb%uC;pW=HR6#cdAvafb
zWB!(;9R*cbYe`<>A2;fo#jAz>p{2iKQ*GUjxGc$mZvV{7v|~=H98)!pkq?EQvtNOf
z^B{a(_D9%e;z0;KEphGKuQkHBXU4~RQlk3#+VUI6uaC<&?eK_^f;_#rlZ^sD32)xR
zTc*Yz|6LyalF9wTH+1RQYiq)CbdDFxeGY@wLi<ZUT!H~1(*?6J3GU6YJ#zn?do>im
zYj^B9UV1%WKiBS;*K}>6^$$!8tW3sXb^TmSc*d}cMThqd39{4?cJR6sfm~#=Nw)SE
zY+li4;%dH>;uC^AfBNg8bw9C1oXf!EmBFfA;6dNXv8b?@He%RV-{kIr*IcKjc<IoM
zlYQ|W@BaKKwfRyy$<;Q|yw&))3Jyv9>6MRvEnNnL>CR{M=$L}WMS;S6!Rrl(j)tNR
zwUW$TX7Lg;Jim9wVY&F{lGx}%rh{j?jPiU3<vhZ3p2d1iRd*lMzVT`o1xjXlGV;o2
zIem)l_iP@y^3~OUq#-(M7JStg*n%n1tZ6GwXq0$2tgJla+I(I0TezaB`c_Hv=ZVuD
z$s#SixUDLOeX}2YF?GSFf(TKTI(-$KLW`ij=%DC0<Su<}K1zMg;tNXeSz1+f!CY*M
z`@UM$MD(T+DOmhMVn>Xq9UXAQXH9oz`Nd>@eLb!Cp)g6Ubbl_YP_^GKa$Pe?PsP^l
zmD?LzkNgO0MTPz4VupB|X7}Wjq7A8P#A<Z0^|;#VbhCF?0_D)K9OCz|-%JhlqLY#&
zjf23q|BIWvF3ERc|8C1J><dzKYC`4e|IbbS|J<ajh;qA;Y2bKjK9!r8p1QGl#&}w}
zuA78ayRr3~@$~v|Hz_yuYj)G)8E^4!GLPG@-8mV5^^wY5E<)YJg<~SKPuE=`z1_rJ
zW#aXhaCfCr_3K{N6InBOca_%m>kk7bvcFMzsC`m5^~;#Z+0ymUm})l-d^3^zGu%UK
zL;c3n>507Gc#rb`ceu$<_e>vmSmd2dmg`V^nMG(=7I92f80dMKr*~MEsZ3Sgi14y3
z)v&6vo~pX_$;-O6!>TTDs@jp-+vbyobyLPvjfbAM-BgG5n>SOnk4g>U|4()$4Gkj$
z0}uoTgMiFn(7${o$*$yqaPsnS3-CdO1!3YMLQ)c9B)IZFYNh<YYNaeGm5M@K(}R<|
zN}cPnme&pcLsptvT3V9GN|IOUaQn9FZ7VH%5fWM1>A*%JE1mCpJh<yX@+wiTQY5m{
z!cFHNveH9{Bvl&UmkYY@_Ta$-5?P7$6&dkWBuSNi{{Aogy$k%MtpYVjWTit;>6akQ
zz~JYjPqibS`Ti?al9<Z4u%L-BgU4tG5>|N^qwj&aHi5ZD@+u=DBK9M$+C^&p!&F8!
zKZ>%zMkS_2y|9ngxf6r%kAeHg)KAA)|BTUfj??XoGtWxEx+fa{$E!4Xn$(n+9Q8HX
z@m|XHs1)yzmu-ZX<_W2Jv#G8R(#-!ME7M~Co2-2H`Zh_eB$1V2IgTW<GCL=)HaC@|
zR{l#?M&!FL=lj1Xa1Sl?Y$(k57p{yi_9nrV|EiTKWj?RUdPr*JQF*|>YGp>{<JXm+
zNN{ChO>k{Z(s4})Nv+JOeO6mrTU7VyfBDM)wk!XID@kf)b!&9an^+QAS^IV{zdf;`
zJ&~kVj=ZZUsg-a32d<nT!Il53R{l#?e!yja$Cds|R!(-e{x4bC+gto!YGvhrtCcGw
zA4z28<mZO{&+YHOG~&kId>Y#t9$WZ1_I`f6ZDYLWzv0U7llXt(%7N(*|H74<v)v@M
za(J$1cmC7pLLUjP++P?xTo^uE=$~BN8($hc{x){B{P}$O^YqH+U#k;yYe#eI6Pp{G
z=Nr>Yn_ss#H%~U_H@5aJw&yo?4pw&;fA6kr?ydaUTif}$@#p9EE@A60Ve7}??)l-~
z!LR+Jlf#RX!;?S1&i|Yci9|BeWf+m{FCEmdp#X=aWtFh+Zz$}E0t*@E7&aDtii0S6
zE%Y}Q_a(tlu~4I?l7Un)iz@qprqZETa(4%FjGD_vveo=|7Y3TkzvRQQ^t{F`6=TJQ
zsS*x@EtM1HX2r(2#;sLT)i%vui-WDzGxbhAvAoyb)XX+}PE<Jzy{Vml>$5hPd+lxA
z;=3nDyNg3_>%V;r`~TRkocZ<NcICPl=zr|W=>M@R-T&LJOlJRYyRyF<NU|$kSVi{b
zTo`#?Y_G=cL{t<;Lc2ZJ5|#$kdSb*++EA?UCWt_yE=O=~qW0$kS4Q~;f>VONzW9cp
zf?(kluwsLcFxcA0xfgiDRD3h@(}0>#xY^6f&8#+GU-!r>B?Fr|0Uf;~K$A@)42`H9
z7c5ou2^^Uh+=K(GuczrUk=RPqKWruHdJ$kibx=ciK=GdOLKl*ugy){|j{dS4_J&?*
zp50be_Afb<EJZu<UWLvAeiW;FPS!tScu4m3i=N^Wx&MQ?JAa4j4g3avW}mT+osc22
zGj=hVF*9V%XhB&TOGwtTrwqoHZ3wAUNQG3RWS5z-ga{?6$dV#ah!Qf-e7?^w-(R2K
zo<HDR*SXHQulrp0`@YZnm2Ja}1?ZN+$fnLmN)fY35~z_*xT@?!h(FDPb~*p)@Hr?Q
z!6X~@C+#N4>O5HR8iUk=ABvH3+6QP49_^b+fi_FR%!6&Z_u5l*fphG%D{IEv!NgFn
zC(bEa%$a+LtiZ02L(!Nd0djq8_yfGesnQ=WuJmO(KiZ3RA65%Sa;gZM!#*$SJC2b0
zuvy3_hcyaWohaF>gce~HJ}!>$Ko*nz2)`ok_!3)Kf}=32#c%c#v^xg+9`DvZ&5((f
zTNduu5Tom>yxKBnV0!pQ`T6yxQ-oFSgzw9cAIrG8*1x;-^!yv}2`&lMYN~2hhwlw;
zN8am&W_69$AJKnUvrZ}C(+XbtD6CRQJ&4ZY+csdz>{1V((KX<AtRI1V8-!2ohJVbG
zPv<w}QyCq%4EdbL-zBKh+oprO%cMMcWmY0Jb>M(`43Dj(#`2nBwxN07*3@)4wco5R
z2(JB(_bljN=ZkoPG!)KXswdbWO)nGP!Iy@Vz~_D~-vW&5+8(a}HXVqgou4adjr(kv
zP^ejA{Sd^%?b9wUymcKGcyTwJN*mbE@QI_slUGXcy_T40+hNG}&U6MKu45NlMmx9y
zXrGM1ior8ro6JsV$9{~YGM^k+6#5dVtl<YCQKizy#ke>sB8eF&{#Wc6?cRPODD~wD
zuo=4=zJS~FoD!bEhej<p>x3)%5|qcMX@TB?puSEI*&PL1RZ-VJz1$1o^)H|Kqgg2l
zFXIZsGyd`w)QMp}<5kDgjiLd1)J{6=Cj_mc^!uR<tuyt{F9N=xH!Z4CII{0DNWaYO
zP!jYkd?;Me1b(8Il=jMPt&I1Z!}tsQ+8KpY&>5^7*)qv+Ayw-0^ixLubLq`HMYIXT
z2OolgFy=K~?U*8e`CF(@!9L2U+l$6=AU6uAI!iT^6cSOxC9QV~_z!!uS}%Z<OEr8m
z=F-Z3TiV*+8dm7k+OJe@!ymeYa$#QvsRnv;9hH77-OxH#ZuH~5l^YMN)K~Ud@Sz%*
zy!TdEdE<v4E*bPvehK*=IIr@#ccfWBk3hm8H+LfJ0f}tI3(6S+w^i*Dry-Kj(p06v
z-`c4v5en@EexiC`w6-s5`s`9go<W_Jf}omtyW?VF-WqSRK}h7m&(eFXzSSo8F^j>~
z@)BRlUy{4eDQI?=KDwlVw!4NF0Nc*+AzV!nkFef`<Vrm7HR)pTQ65-{&>mRnfNboe
z4AB%8qWg)riM6%hh%q5(au0R#RpEIU<C9^J+pfeh%=Gw`fBpR^EL0;&=3`0o3aG3|
zy@+{mxhiO?fCJnl5Lfm6MgFah0NmxXit6&cRwr2Qk~m-a!)8eku@fwv!#R5k2EQq*
z*ps%CP}S557uz!;T1XeEri48|h>*w!lfR9bXUtD)%Qxyq)ljaAF5btrz5Ezp+JM>b
zPzEYGP?x8qND14ZaU2$OJvqKN1oPA72g)=yZI9IGNl3mf*;d$Yzluq*pBhc>*4ZtV
zAefoELAA52<CuYnvaKN)n?5$|A}P7Jp$rN8F!8n}R@;B=F1`w>GxQey7}ocYpx-cl
z`y$^ZguZSBV(p=XQsbk3$BHE!6<-hXR`_~X(qv&@9#sW<zgs|`hWul4&I3%Cn~wOT
zwp#6D8`1g9VM^fe=}%q@=eR*iyLS=s4qq=)kte@n*g^|4wUA|Br?VG}<7PyToo-Rj
zt1D!nIx{-4l76u;#fON<5}QLe-j#rz&t?5AH9Gj~M5pMjI>dO<!qK#m6KjIcnty}t
z#f0Q0t&qz~r7pZDINM+C9F9ymHSql@gJh#xa{VZT?s68E@mdWwjEa8=4z=0xl3IG9
z2vbx}V1>DO8lF41+W1BCC@B%NSXrgJP$_Nmv1IhCw+8ey!sOca`=B2P3vg62XsqDT
ztE0ayBF|_6GJKy#?w!5z=|DD35IgMBt1fHN@*LjH64*vcqTnSjtPfpJhc$nB0y;Kv
z*7@W+huqp<rO+0nyUQssH?yfs?G@+Pd1(*0@&2$$6rH{|<B<&wu}3Wap?gxo({`a2
zw~R()xQ83zX~7E>$~@zecva}rgrJHg54_~Y><6;Ty~>Ei2c<gA?srN+r~!rrl8=#b
z;WGPC)hoXTomZ@snVkNLP%S&fPFrOgNtdJLJ;ci*NgGEcCX)#2hnF&;9@E3x<?;*A
zBNY=Qs3-e@O<rCBP%Rf3xmaS4X0{XyUf+I#$llxcSoQZxX4rwPpzL!=$Gj44tTq<!
z7hAZMg%G}%^*q}nZe4V>_BU9hi!16CzbD#$q4%d<w-3Q))RuB(w~1_E>z5|sL*M(s
z=Y%jXa5lgcarhJsxt0^r=(vnG8}Ek<Nh^9sJX<2S7fdoXUkE3r^k&|KT}!l@bLPTF
zS`@cbML<o7h&rM9|BOmnUn9+n4NoFsY%s!wG^huGXH?Q4VCeiEu_@zo2}cr*XD&Ij
zQC#0>f!O4_2xmw#)T|5TF%0zp;O$JIU?u^0qG!QIX^27`nMo#!!he(`>RHCUY01_L
zd!9*PT$n-$Ru}@oI;b+(G@5?QE!8of-lHu1@Hj@9z%Tsy<k7%XAJa4v8#ZuH<-i6e
z8p{{Z3--223ztqO<fjSgyPu0qkIfK|bi+iKq+i-hw@?)B#AeXlcq91;tt8`eQ%3f9
zM(%%hrF3S2Y36@+Wo%}Nv^0D{<R9abNdBd5^yP{Y*IRBD71Eclm0T7t;9GwK&4?8t
zV0__v0#>nT!1v-gW6Z{VWpTY=5IDI;I(vCUI7OdNe>7cs1oFfUy{8!6Xo~*MLY=zj
z<m!uVGZh&z%_*hiaK>|ft_J80^KWDMG!5+&V9;$P<V$1sF#xVigGRl9@{CHoGHic_
zp(6ntr+WNnWv&+1y`82an4AT1KCC`}LW^+5E?L;kCvw+~yp4u<5PT5cjIea57E_3c
zhD4|;#^?uFEadR2s1OnVF_p^d1u7!vT?l~-$_W|kAz%p6aswCaOIYLjIGRP~B@@7(
zlbvM@AoZ9leNQZcNhmEM1MHno>Vkh0(=$LrzC9(9QAFkQsHtQVn5|CVYsgGxK(Dx^
zRyfL`qM*nb@(_c52|$F{Kt2JTUk0FAAn;7Fz$)k>R^$Uy09|)Ae^VfurL<O{C*n(_
zeFLed5Ecs$eGk_#XI#1RRrt@iaABuX_BpJ6VTs2|NSq(h?wc_Dn&yiF%{6_(T*0-#
zE82)(3LhZXJx=K7zlCP8+$)VBSq$PGpJE0GqJTl;SjB=7LNGRP<^Y=0hn8bp6)lGv
z0U`r`Gg@NI)ycy2K4R}M#>3ZqDBSIiAK^KjWd6<m3HLSTDoT6&45Hze)#%#k+cMWB
z4@6W*Y7G&NsM2qhGBnGMYCSxY-^a1yCP5d@AjS+KpsmX-ebNu90C)yC6DNeDfD^t6
z+c5=jEYL${F}92cu?YfYf}G6qJsM~szH)H6a3BRNP*w`lL&yOT&U-}n`_d%}L?v8E
z_XA(x3aDjT7|SD$?d}+V$oR(st71)#7wYMuqg62hXM4e;9OFAI<$u^BLD5^5-QZD%
zg_J==J44UWPWvJU#eRKju7K!%hhj$*j_;`qj=i1nO?c}JdgmMH{%cJerg52A5eVgj
z(2#)-^L;2Q;}MlOG>VT$RI&g&3g{x2C6v!93sMIG7?5bVP%dBfF19K)zDj}u%Ey2-
z%+UGM#aNzENdX7`k5Q>m2Jm4(65%xhD<E7MaQ}MEF0<z0R!!Z9jP_}Q0aFwA6*u!l
zSU3gB5M@XiYPB;}r8zdw4f&D^EJl+RG10XQBEOb?(K$OEvlkJJC;RRj^7U+y$~W&t
z^k+Y=)+l7E=FSOsPAhAL>s;iMQJ_F5!#5scfb+wMuFNXRv~WK2&MpSjeXSaxpy8V6
z?GKN;njeGnOW|x#QxNcyR#OvSFr<!F2?v1{0jaD94>ZaLWiqRpd^HL$-IP9apcwt_
zh1DnM<u7+=(7GowTu>s*?Qxb~jp$18?qxXP<y9ecIi!xMa-9kFuE)#PQ>N>7SygZl
zC@ixopH{bpeIk3I=KQqq5&+CopSig|DJs#sUH$Ywpc4CJo(k;g7vdbK=exjkm2Fh&
zZ}7Mv^pFMY=L5<$(0><&UzU~OSdc9iXrDRa@PlVt6bO1+IK{mw{YFz^Q`p_W2C;LX
z_C?|IWkBZj;_w^waKhD^8fLjBns>q<rU^)4>R@akbQuq*tl16%C}j--00_SF3{C}#
z7KNX>x2nboHQs0~c5mCsFOcQ+C$^&Z^MK0m0@z4f6<@oGU3<@&_MRK<{BB_P2koDD
zJ|%b7USk0?N=Q#zv%Ic^5g{E8UnG~wU~D$_EYaGh+&dgao-eGVPJ;!(9N0qmApk5W
z3B|<Ggy!f%6+EMoCIt8C5ZX}!l7&QZY;g~^WCB~dlr5ToS_bY5@319A*?a!St`yzT
zUghU#OepN1;OKa;<H~F_ah+S1C|I@-o6*U}uz5zM?gVGJtkXh^t>@uun9%iIggpg^
zI%u&yraSOBb}54$%<59bc8irF+)}$daC_~RKoS$3&N#M;0f$8E7M~EZVQ@SrdOodo
zi)jftmGX&B2vX4kE-cs`KlpPhESUL1w3M%OSdd*tWK#tf7<?XFEHs$F4hUvfq=)dB
z%5RiD9#e_fY~wMNMWsT2rhCe?_Jrfu)ih{Mw$N#DNEQGMW_1X3Q-;IA<Y0I;gUAC%
zuTq_|0DgWPJ1>|WqpTmW0#8CCzwx9>3iSU<mEDv9Zzif7H+YNva$zMzVgP>M!<tDG
zN@l@!J`Tq5Mk4N|s7H_J0Qex`MQ(PFc<?o31pF&Oq%WBF_WIC@{I4AbcWPxsvj@d%
z2Sq)sMRx|jly*!zfJFrk&u8~SZX!;;7JR<+Y60M1W?Voi4uK;CyIIJ0Xuc;HbO#Gr
zL=gbz^Cz*81B`*66jTvI_#bQFH3q%IrJ=MvQL25yH5B9k0lhUbL<o_&gJXkp`l(BU
z(^@a<(ZQ1x{qO$pZxe%K1VQr&LALRTxQEuJ=+Lhv;U_F;HUnBjgY8mKK?H&9Y1A%-
z&pTXjfFjVB0B<fs+~rA?G-TAWaKyoPQ8~z@aKQkEAY}E8rRR9Q-l%A)mKH{6QJI|u
zyh`AJO=|tAz}p1|;-x>F%~I9^pvyS6WMvVee8g)I`IQOVWkLT?pg*VI2Ic%GRrc)&
z?o#;&+s5J!etedL+M+<q8T=O*@4VWF(mW@!SG%)_g359)MIG7wp6tn$i3OJ6;K8?}
z0Mt$HgMj6SCm8;(Tr{%!qM+Zh@U5~j2f|0N^UyAXzX*fA%lO#e_NfRfY(?d7X7JZ(
zqv;_NJ2}!K!Gd-b$}hEF`j&QpUcHjp_rc@g)F;7DHJ;E_mVnjpK=)4H-?C4<-Qbmr
zub1WF9cAxc)J}CxPAOYR+f2X5YfZw0KEwec6O+@`o?})k@F&2hKNN%m4b~<<CG&jj
zz$fAM!I|Cg58g~z19p6$*R0*Hl$8T<$J}zctOGpJu}nC;%wTQ36#|PwmWSu|@{T=6
zz+Z<8-~PW|C2dID`Rfkh>s`j2{oeWb8RA{5bcFu%Z?c#)&U1)|ulprCWvEET3Y`Aw
zt?DX2oqPE6x#tVnpB8d=7Z`iL6<B=xf3Pcc(vFLtpZ1wImc+#U2$Pk>EMJh`JNz8<
z<auI&4G7HNkUKBG`8{>@`$e54VAj4qbV)FKscrA~w<2t>ODLz^V}CU<M{~8gnizrF
zrI(LRfse5Ei9@bxV?O9$ZfSpk1WWTJ{DAMMe&35(wy>Psi<vt7V@yY0sclwfBIJwC
z%07pc6p<BpA{)v5Ib6QN@5C0=l}0P9`YrtwPaKsz#TNUyGRRhz9a@#Xy{f3Yw)SXM
z1^;6&US1u~CNSUb&z;rga@W!#X0;PJ*p9UU?@p6Eq0EtAqS?}fpTEqwD{2aB;PcW#
zZ+_XHlD1F$<#=j+(0NsIYL#ZWaU8$qnz*hQws9m(&aGp`>!*~r?(dUasncOAzTAz@
z{NI|-e<#fR4om#)H?$!u{3lpgj)^@mDYxeI<2zMAP@Ve+rn{-)v>DeSrv-i`G6d6O
z3TK^@X0E7-p4o&83+4*{<r9*=qL826u~Nd_%)h<aub4D+sS|dKMg1Wqua*y=ntL!L
z^-#E5Q)s)gLt6irW!RJLHtzo2vwwB7zqI3bx=!u%B<}R&Z8>Z0^z!UV?#?iNUq82V
zK;hpQcj-gh-$r5aNbaS7pKd21p*zY0u)90|z9#N2+*TwIP=w(>`vv$t2q^cG-St!4
zcOARSKRGM9+}~mUh9KzO|Ln@)X-hgvLdWla*_E?a*)m4|V^_Y&9A(6=Fc6Yv|I4m)
z_EM7Bm*)^^co1N}e>49-cBMprH%UO}V9pQa52N3BcIBx(RyBpnPSqz)6I%=K-@`F@
zcBP8@*wTsmGjAWAHjhwdTsirrhYqLvO<awRA>QEGm8U9(+xC9pzfzfANt4j^uRRhz
z$k7#64aGJ77-_g>#Iq~k{|Xo`-*?39q)fPLWLy*Za2!hhs&s5-K_@p&+hZ(b+~Mbs
z6DHqO-m7^}&VlJhVRL;cTd!o~CRg6|6a}<9*sez{y?+)q|H<=VTkD%I#0PQb_s@JL
z$E2d(*lHNtGwxmay#Kj{+1lPGD@0UIke_$W-*3+g!Qwwz9c%6nJGkfpzT!JotD!_b
z&H5FhfYH7|9O6z(u&Ud7!Qq-9vj|<4a~wrPcla@KW~sO<eZ(q~^WI-p+}AI^r@5fn
zs&S4P2Rrl#$C!beM{3xr*myMyswze}RQIWx*T1e-%IhcD3O$bOSNpCne%?X<rQsC^
zV_f*4eU(mT&b{$Dja72wy*lN5*To0ch2)iquaeGYe>)5P$Z;wnTpM0wRp3t1SRW>j
zRQD8;;c?yfLkjZ!_k;$Ks*lPV-L&o|rAFwLo+)^rRvL2en)S6aQ1Q#9LH9-mdt8#l
z_viZgLHB2gP@Dbe^7r0bUkl+>TOThhj4C=>$c!kGJr}(!A%F7PztQ7zXU;ymF7aMG
zMum$*7gtBztjNqU_!#xaGxoEQCS3Tny;K!vtndxF@LtlKu=8%Lm5j{<8YXH}ljN6W
ziS`;2w1?Nt4Ux4hzs+Q5JC9RsM8BQ6;fmhBF5w(LaoR7x$QCY&GiyFQ>P|lVl|mL1
zQSm5?PO6;oqkp3h(eLY72_C&vYCU||#ZYA0l5A@|?CFAwpXcJ~)eTq3yG<(B%Cm|k
zgJgu|E5(8f>gYq{d(AP+O-r61Ro8qNF`+Hr8@5A}Y~tM~4(LYj6S35O56kmxIM8%G
z!(j6CihD!3xO}i#owR(9yc0blbngrGYnGz#w}vb))pv<{n@#PJ_1>jG!o80m<ffC4
zb0MObL?u-r`_MD*3$gIypNm}K?AbgrUHzk=>WFQZAg-a;?3y2=!*LZqfkX=rtzuO+
zXR`1Xf6oY9vdVD}MM3ghC$M+>+dsxAs1~dgCtlk6{_gP4Kjup}&KY6!x(hwqz`}0{
z9-PgnI!on!=l5n!%thz3V2e63E349n?bZ?OkUKQRkKJ6DK}K$g3Pj~w3Uth26lHgf
z=xb@4#^X@=Xw8;%(U;<TM~g+1Cijcnn|`Cciz$<Pu6D5z^Fn)~tiiG*S+<W^ZkHT*
zS)l?VT5NM0TX?@~=d^Q{M&|8*ZJSouG(D}&kF$|>ewiPYA>j}0dZumCQprns=g<ir
zbC`%52o1)OY6F;Z$x8aI;eLdZDRCdctzDI@$k*1?jaeD4DzWvYYilZ$?Ott_s3D74
zWZ15IjX$w8RN^~?CYe^mkP4wA=kG0a>0Gk8tg4)M?llP^{vb&(MSC^lu){6wK0PaG
zKBQ;`X4pq40vQ=-DR$cLE2TxvI?(#)^*1=A%nfdz>?Rc??D8>HmQ!Ytdggq<1yQS{
z*To0^l0#$PpnDE%yX9C;W1wn)^5J_CS$tFgLS`IOV$zZj;$<SLPsPpX&Kyrd*yUEW
z+iE)MP^DfC6<s7j?*uWoxLK4ZMT7Y~2%ug?C+RnCBMN3C4~{pirRx&dwtaenMmye8
zJ>S1-YSpD4p0lo0wo13XU?jLa>BE<^QjX2+D=-``*OeRx%)9^q7C3YLXi=X*b=>h<
ze~GZM%0(ZysC~>&NZGf*cel=Xm->4fwQpE7$R-W@ySb7a!~#ottkBm~h=LU>P*?-S
zHD!`WJHjF^@O%h$Y^@Xb2uO(MPjc0pD+7vIV6g^Pf4|QRQaW%_L4!Z@T1ygY?(DVR
zy(b`2*}o+VwTWjBs-84y@<tnMXo(Rt1x5;VqmI~s`3e@&+$#?kYj`gnxp6r+04H(H
z^R$lC!Ls8E)~+r7vq9(ooy!{YcWwRnB{Zge+jDvBsF?FKB$1+@sU}AhpFSOS;i;xV
zp_;Gg6}SC%vCdPQq3rhUFJXz3n#5vp6BQQ5%Fc$ZaAX=Rf5nF6*B61*R&!ISEQ3IE
zvkC;nS#4v>HOKF7d!y6c4BviXdW1T=ir;tZ*7T3aa>b>N-it*~FacmM6#!@{az?!8
zh@~MgpFuF|aFSf|QW_e|)$MgEna8Ch(BmpF&_l6cAqovF5j+iB*yMnq3|gTa7}y-7
z@lTY&rDDZl?i5n6x7<eqVVPH^ScB4KfzRq5?_nXAh`iC1I=;tpP-mPN{BSARu=Ve-
zDa*2a660LB;tfGiSn&F6Az4F=iU<~D##=2R0RkXYC5#ov&>&E1^K~o@h%W^d1(SeM
zExqFhwR}A0Prmb4jClCW6a|R8sq9A+E(RnC@#xxXm1x3!XAU46%coKau<D$X`GLqi
z(f}H4W(WdgyIf_iGeHnJ9z|*+p+W@C+wB3)My`MXyBq?<#R!DNeS-;6Y~hm3iU0s3
z$kmBk1PkHLI+@V$7640``41F|^9Az(FB)2Ngw)Tl;lMc1vf3(o?uP8-k-_zQ=JG-O
z*%t;-9VXD>@@$A(nFaW8A5?4ld-bRIcjohPLz=J8mUiULn38P41ZDvWi&2quBiNO-
ziw3!yUjtT>B<m?>B1>q1c6prL_`?D<fQHu%jAt28Hv|A`#f~u+cuot3pgmQbBz{Ac
zc~PUU9H5JAWj<rB!O+t%QEQax*Mr{n?q)w17UKJyIp65-0%ZG*%|E=|{j(K4Sq(<U
z8$|s$Kb-Eh4h6-}|B;N&O1_}-^Hv~G`h4?@>xBxSm#}QW>Jv~q$ddZajc>)P#D=2F
zK28<WmQ4Vm!ler;l2qV;B(Pnirog){m38#Ux199v9}@@&Y{uZ~wzOBZ`ZZX~q34mG
z%s;(RjcM4-3`+=4VEwsnlJwK@cK1-87k7Io>f6sm-Jl!vA{q_hW&s&Dbi81^kkwLX
z0|6*$MK;D9`%HnRW@J77z6PLx2IOYoKt^&g<9Xp`gCGD<V^QB8SSYR#0zMkch7&+!
z<M-Qzeh|w-rp2`?LJ<=LBcSwrJ2*E?gzMRb*d)lhajttNlGez5d3)zGUM-vWaIIs%
z+*N<~Oy*ON*K}&*os@P+nqRAFBoz>2!H_&oft9)yo5qDQ0V)8uA|gE002Bsx+7#;j
z6a>L`Cb>5r#93~GX~FiHf>^+D8g3SDeBTG~7{^AI03T8^rKo@xCKc&M3m~Ku9UvYy
z<{sm4NL43^N<+F~6$sc+dlZ6k;E0>f)nSrFX^ZV}vI~S5iN-q`lF3VkdSc0jrU01A
ziQQ&tL~`Z}h<*+|wG|wn^#bN+iy|~w4nl*viKK~<#aJ?MG?|}_2omeEP)-ej0tkwU
zV>n<b4g?-cL!i6vxtqi+nE)7ExQ#hrO5?wvVM(?qT;WJ7n_3D0{OE>&Dm_4rw)zGN
zLz9uy!j6H5EVBXd0VoLF#nrxmiq3u!5_kw~1L?g&`wanpJUC?8btu@@9FzgR4oOEa
z8~r11s~)qyR@(P)jdnFb0gVO}O*;!&sSXaP@Df<o7RqbWwuk~hL`G2=W@Y1PsDw;G
zHLGi}Y2^uN_p?n1P`e|&c10zyTlCDk$5393)~n(DMF70noQ}fK9<=pEWZGWOwr`G<
z@{hDffYKfKjZfW3wZ$eCUFh5MfR^|4Wn|LJW}HJ;8>2<p0ig)HGl!K`qX~w0`<K!y
z{RSFwJzWzHueuoBT@J$njw8Xu&LxL8ILB9;10x=eW5I)GH5^B?9pB^l-$puiPp81B
zG?=MbAul-^cH{<@3L!Tg?c^>K<s9DFv^)-GO?UuS;(TVYz)Y)^VhIg7PLrO4iDl4G
zSP-==MXk5rFeAB~j6mAZ1gLf&2l&QI9seW@<yH-DtY;aj(I5bDm4xCqrGdj+A<i@?
zns%@-6KYB<3I{+GlQ}m4(&P}C0fsaUp)i+ucAxIinrLx=2X5ZzOx;$dU7kyUOLxUW
zoF6H7Z5z@oN}Z|$oi-DkrEent`i(p<>)oj&aLH(R$jc&A0OE-HdtC?~HGBz5LrL&;
z;Amg2L$@ObY$-LOrNC(*%@C6+64H2IpC)D{B8#Dc35WMY?H|l`*4KWMRWgG0%;biw
zn7}Zk(56>ND$O>~c9#N22LkX|;8Xobkxgr33Mv#xf>CI&Kn?9!n&CJAiv_$PaDEB^
zLzAezfK4jR&;~-bLW$9UvmZwu4Yb2!X*cI!3X`0=`XodwfJ7UkV}TvfWCW!~jY@--
z(6p^k4l1nzHV~L;O9<r{tQWYIos6IYpf7nRN=)Hy&bqiGg~L!J?HEG3qqqdd;|QyN
zabjwl+mB|7Xd6em*=XN{p=hIU3dMmRn6!U$FWlMSqHC<x(P%3as_76cgF+GSq74`y
zh0xBzfXUBC<96O$wK0b@xxRw%By%9K{ZJ?+Emdo{FuRcpE$caYg_hIW3&+s5)<y%m
z>k<b6By$+Ryg$JN&=RySb`3joaE0S=F(d$~8js3(9@(V_4jdNw_YTI&-?I<UJxe(&
z0l<KfFF|94K)0^B(WhWk>X(D31C0>q20u}tudpEJ?m_=wu3i)xU_+}|wl1X5bZ@#=
zguBK%ev~eH7uWtS34(C!b(O8^l|s`5XkDmr_z^6PCP9<!X3Aa6gbmvUpV*%YYYahB
zcx{n<Zdh=jnGM~<V>%`K=JO|3h`jCz01FD=1b=u6D%1w}nSgh9F_QA$sd>!T-k5(H
z_Ew%WdOGv|6Zga-02HeMFDs5t0GXkOxnSAXl<)P-D|VIt#^DzaY#hsEZNIRAoIp<>
zLN5$Kq?_PPE(zjBqy*1)&rH!ao2P<&^~c>;qnsK}zY|b90b?e~HoH*6jr>14L1?V@
z<&Pa!2z(C8XIo#amz<i~7@w28H*46%oS<-%)o+y!Z}P~S{0JeShEh!wPG`P}>fRN6
z2gam!kc@Qgt=``?>o{f$Lh=YG0;1|&mh9`Y4d)8&BLQFF5jn?8)P`S19+SI56ESoF
zXCyBgxq#YTy~eE}rmn?Q)4G3Nw~<q;j<avHPDM*3SHNhn@JV>!6pGq_DtZ4)1K3)A
z!@7vlrUG*I0F^SHb(RK{rErfLm>|M|tG}Ed;ih4fX^<5{*RRztWm@54+jvgn*|%Vj
z8p}`inNc)NVv-&A>!mG|hTm^(CPafvPe^M`yPTz2Hn3)M9@}c3@b<{OaQ8!zDgErm
zT<I~|qNDK#UkY^`F1Df%3U_gY(e4?|?%R7*<<S@Y(>{AHrm1+^oGhJnX_$qW(n4a>
zQYU7UQc>rm@e!3~`o9~%SXv0u=p+f@x5xSCMR?lxdcP~asPB_|OH(h?8!xoy-7cjT
z(a6rE{f-#m^3%t2-SwnUQ>)w~g=%cUaqH?M<8Y&~)qUyGZGMi^!l5(@L~ZC$rCHtF
zi}2$oIOiuZW3OG_K)LXPbl-jHhD|PqB58n{--$GZlMSaCX-*#g&R$3wtd~Yq1}u<1
z8keS0+guYb9=a^|EY!gq77plnphA%VjH;n)4@o@^AOoLiy9a=!J)hk51!HJ%#(%J`
z1$tQIU~jGjU}r(Ek^tc2lzmp2(FrCJ7jbI-qXEl9At8t0<1_>s$hFSQu_wp5ym$G0
z7<3cXVMyEi`GX;PSfGjq89t~hXXN&gg&3zj3#MMp2!df4&Ch63B>-p=J~{d%q?ESU
zE`szMR+D}v$fO12YPo3g@;sEX(3v;IefhVB0-E&rjcCG*XNd8JBmtVhFjT<^P(<^v
zRT1vxHW$bwtyBW|bQE<igXZ%2Y~*l2nP=On;E+!akW3@moz_{f^x<&%&a<b#`?ZYO
zczQ>cq_QQ3w_0XhwhtkCX9{D}kZOS7%@4(~XUP_)j!<m)9f2R8(_{?*e&lef`432M
z>!&ZFLAk#C2Wiv6nbD=R?XvF6JNkY#0E9Y@_dg`$kjef6!G?w;-%RDrduR5B<XMD>
z+#VeDcMdIq9l<UXPN#_v@rAQsM;M~1&yrpw<ezAA@Idz$juT7A(_)G{6|SOAXRMZ&
zz&6(Him9vao|yrdRLs<B1}w?<Gu+V>>d2Czme36gQSCQV!^<K3tU4w5YKhu1R|J3l
zpJs%9K(@cv`4UPRcAok$5CElGm|V@yvp#<?&)%rxR|m!=XyaG$c$)TA{w*bY%K((Y
z)OqWvXBJL8yK=qEeck%;I{HGSEzhoOe1>a`bW&)~56^W}h&mERL|P_0IYsT-i(ORz
z&#o-}bs6g%brNw9SuWr<6y<qeqm`C=lDlyWB5d?N%18INRx(-`;HRF7_Do?&hs*lr
zMV~o@j$e)P?}+xWzakyDapq@q*p#5(p{QVm81$8NLrZ}xG<X!xt_+KbNsNiji;24(
z6aP5oLPt!(P|U@tm`gmnk{d%4j!jaCP1cP~!EeTN(C?yS&V_A$BmU-gX2fRRj=lUi
zHmf5xdnh(%DmM3LY#uk3Asm;_vnzGuuHfSeo#Kj4#TC!To{fnu$<v9W!R!dh(oJ!t
zLvc5!;%@znyUmTe9RMmY1(k8*%Kre8YVmhZ#or5yzn>UimAKVuvsLxt?;X{onxXiI
zQ}K`Hx2mVM9{h~2L&O`GY?R=)8P>mbR#EK?Mzi6cJJZo+$e3pOc1Rds%b^SHQx_Oz
zX%B$Q4NeZNr!L&?-EMgo&H0JyoWIZ$wv)ATA(EZRns<2ZCdyJpJ-z+1-)X00IBOs#
zVOaQLIs*|eBT`bb^NOBOyMP*Xa(K(l9Fw~E{`N&W<|4=RqA&r>ZNxhUm0b<Enoux)
z@zv75k5@Ct?_ZpAx)dj!ITeuEeaP`+-j%D!n3<mg3sM_}WxI1zmwx;~w9fyY&l~(1
zleuCtxEhwZ_VdyP;@_`Cp#tjWAGw72#Kg@)ZjlXlV<@plA#vyG;2;7S2_A`9olYv~
zpz}%T2QREBc4dgF9;ppnRkBVm6!<D*GmPP6D;+A(I<uzSU#Q{wB>3B!%0P*J!0XyG
zzwTM55CoLi-+l!+x|zX#tP=#)URP?Q#skFBY3I8~?jLy=w4pIpd$RGIV~a@8JEmRr
zw``D$)`uH@H?A99|E)dIbZ-7N&#wGIEN8B)si;5JE~vVQIJ)zadlWm<by><FbZJv>
zu2=6%U8Z8Q-szWDP0s&V`fIQ-TyeBtcCfMj+h~pJ)6nHDqowgD0dF3KY#aZWXo>mt
zV|m+TWtx*NrW?9rx;EE;)gbK0&VluX*Y}S;4*h5Ld+9^t`JX@jnQyMlzPO?rwu{?Z
zUwrp8?C0*m|Bvm;ke0vuOC$OZsNRhF5T|-8Zn0VQ_QkEgs%1%hW@_cBd*an9GBsM%
z?&O$lsa59NnW^6`IvKBi?^;lc`u&^nTk2Kim(4V)?_Q7BsHv`L(RlE%WlN*BuHQ`a
z;j<6%nva?nTQncHZ*6HZ*?i_&b=`X|Xg%rEXw`Z;Xtu3YKVoOD{p{_@3)&6ugIcv4
zC*!xZn`SPX>okA4enF?@TTQD@>vGGsPTOj~xo-Q$hYPyT|E6u^sFsYM%XtoRHyOh5
zc_&+mpj3CP)%irUuw8u;V%8!@3(pP8SYcP;`|e^ZtT{=WoxS2#ZHo3?>ipb4LL947
z-ezIc+^iE0*d{sjB-y;tmo$E`^D8t}&7)t|YBZlB?;xH8Q!)&gc+4pQ4n~C%r9|Kc
zu8E(WM);&=GV$*mM0!lLO&pCr)b|x&_h%$5JB@jry2<$1yp)d}7s)X=Y{9=g`G@>1
z`;HTFRlIZH;D!6`rYBcvS}$cB(4U=D&Z)LV=~;<C>3a)1L=RWvyL<kCRg}2iUsGG<
zQhUxn?5>&XD)gM7q_^^V)|aE=J2@jyGI05-R>9>Ib&l(ttvvAfqP5<}XgOkOBw*vP
z`sv%wD>!Y<gnImEZ21c#DJQ?foX^UI5uLj`$+qfWx6kKkb&03+8Flq?*IpUjd!WdV
ze^QoUzCD4!{~d9PhiBWW>AOJvOTGDiXx`v_TFIp|LxmgM#`i0)878*v^A;1Jzw<Y4
zDZiF0U9$4w;K_Mmw1xxS%YF*vTOtaN*A~C`l1lufm}O_<s91XT#=B1}fs9(8GrN@3
zzG;`bv&>Mw9cgdHAFiAjEb;tj8*h=V{AcReIv*zoH*r<9PQB}uXGOYh_Rf0qlSgL+
z<Ey&nzKR^k?pqc_XTJEN@6VqI)fL#aFF9cCCR};*l|s215neZ*XR%v{OmY~<^r_hv
zPzKIAG+B>)qUgU&1^FdSmrevD@++=ALjGBKfx4QOdi;_volm`7kt_1|`PkiaMYWM%
zl+Rzww~Kca{yJXyr7bPfqs=mkPwWfH?J9QR@4oZVO9}?hd+Dx{YmCg`o4nRE$1{sh
zZb;7DeOI!|PlZ4ANo8887Zzjv%%EAR>xV2vT@Y_>mMh%3v0qU&VDN;$-Yx4p_YWF<
z9Za%Q7Qbt%M%44pjV<XEWG6uM>gQ1>FohzbAVo3cRmRz1%Ufb?sz$1=ZD;-Ug5`}q
z9D>;m7oGIuk7uN68;|r5jwQ={R_lg|71M{W&F$Tzo#}K!<5;%GK5vK3ISsYTnb~hG
z_biS|3#4ltuM>Y(O5#t|D>r-lF#2wd%foTq<onE-h-bBK>^a<<8tzz}9V3s=K6!pX
z!?h`vcqZV6rq`P_q4RUk9$)&WNrh;-No=Gj@Xw@wSMnLBPxvyja%{Zi*K%K&DL+Zk
zelR?7C|imAOmRnzsN!=1`YF{|DaaH;BJ@GCEGn-E#J%v;H6I?BLDPNcHtK1yaIKO%
z3e82mXQVjh2Y0}9Qe?(iDN$rXe{|Un6)d?^o~JxsC+%*!sBT}EYUZH0*PC`ybn&le
zV#%G7u;~XDI6as{Fz6ZIj3?$%N!CNyY~ZhzJ9rK=)y{z}wxyP~$O+HGDi4bNRfCFg
zum?zo%R2^BJ-<AuJK?_W>-)qe*~)1%%`Tzg-ceSvwpkldi`%Ot(9lX%(U|uN(is$c
z#ILhg)>_Zu*ofrUvJx$(+nZ-aoXDTjheXg3oKv`x2&--=@~2{s60}160r~E}XQ&T5
z7Gm|QILOH56`_OES5TTRHhMNL&}vv?ivBJC)bhrO6Ou}bVN{~}q9pD&thqP46D(H1
zL~KZS3*Xu_D0EVv#U5)Gjm34|J}8n`snYe5zph(mGyZg96+3$FN}c$gi}gnL(dq9T
z*Ntl2GVwzLug-{lpIdZ>9$eDuv|9LB#(#548+%76X!r$8PozyZ?}tE5_zf#aJ{^1B
zxWiZI(_YKXEb*@)y-P-izT)z;)C)h19@}@yT1<)m?oCCmJY~N}?OnN(A5dZE{!~?D
zb}R|IM>-1MkJPx5brCKml_YY1K>aDdtKoiHjzZ{ngVPWHnXyjK74rYBCLtf8>ADGu
ze0WommgY+4(Y9I14$~fkN2@vKJuLr?BP>=Fh2!e)$b-MZ`|p&mQ8$&OHS*y7t%^cP
zg&unqrw;j;AMUx>3z479fWP#Oxa?%gL0<}l$h3r~s$dTy4+m^XJQ{}SQ`!Y%no<;Y
zs7R72N95YV*4Wca8^)M}-|WI#-lPB<)$TXHUo*AR3Yu99ExRMXIsCVEWhD3ZJD-JI
z(|D=kvfn!Omfv$Xp%d;xzgj-ZDQs`{y;$`YzQX05ap$7VMsji^*}6$9ClgyITD@c1
zPTB8GP;F7@4Tn9uG9#3ZPt}#w&3j>zHgD0GphbBcKi0Y{R)<VmIDdHS)HMs~y56o4
z*i`DL^h@hcM$D(2R%7(BHw7-mny-9R+?jdGr@*Tv(~^rw*MWNf&81y59FB<jyyW}y
zIb&D8DiQYXwvzO$8~zXet#Bmtvv^wBu4p~`?_Z)xSx?k-is}08ef8|uC#F=P5VK*g
zT`N9|$Q0cKj=a`QpoeG}I2E@}GN(;}b=W(niQ18nT}MngeOi5!{dzJ96`gW$^bl-|
zxZiJDbb_rKS;n_!Yd%hu)dI;#6Sc~yv}4pwXYMIkzhvDql5meL>=s8JsVG*_`CF!U
z_dRA~lC4fA@mb82Op~yt#Oc3m^~e;coee&cq_t@|e;`>`8Y3OrXF(?IueznUNi<K$
zz-5<@o+cVr&dAwi;<||FElces#Z!b+hNIxG7dh`jCdcCBXW5?GtkPegL*}E&vJGr?
zwONd@t$Atk;zgp#xD|2?yykog?P2-7-D~1)@@%`@%eTZS!JCR*ypEX)g#<9DzdSUf
zQ`KQoHBG5tnxv&XshZL0F-|h9$NW8j0X3vxuG2pm%?euY6RDU9E$dW|w3I64NY(Ib
zk6U_DlMRDWW~Llb(`2z8E0cQa=ryi42n^#t%<E4lDlNjz5;&sL9Q8;1MqL0J$?=#z
ztf*B|6iJeewA4Q4>pGpHD@_EVXH4y^%%Pp~ULcHDdGLCQF2&QZ)?T0%;yEEz+)G-_
znRDk^$&}msViiyJLR58<6qs`%SU=geJI%cier2c$g`=hhHKiomp0g?mDb(5=7$n%3
z;qEq`?vhx9bWVyKbNNCn<%o_ZlU7Kqn{@U~s2Rm?Ki1c3y404{X}3-?Y$`YXoqEUu
ziuEC5J(Bhj<{XwFUPQXrJ*!g%wz?R$MJ-8VDMf-oB4R)mfTb&)^KYed0CQBG`6juN
zg7NUT?m9}M5``VPWOa|P;&N9>(vwzS!QCrGc63WUw>yfaejXNd876=#gyLdppaO`A
z8eN`FwjNKx-y-6}PunGs+&(}L1on_w9Dx!ZRz;LuB5655wX2{eT>vVaNOqVfGC{Ib
zm{cW^l%0HH?rRARf-+39<&eabyUfCq@Jj^OIk4n0p1BE8B1`-+>^+Ee^_R3HEp)ni
z6$a|l$IhUG?vW!dlTAF>>e+PMfWK|;j8cg&amk;)drHcq(uR56N$$SYz-epj+^8cR
z5x8K(1Vt0cnL1skPIkvwbO|u-Uz>(Vm09E6lJL`kC+A4ga~_xUdoO8p8PVSxnSNcy
za)~On_waK>3>IwA^~Su?&0-xAaPN+>H?hzKJkyn;icQ{DCSwGuh~cwj@^xZ(^;P|1
zEu_q;qT~Z~A|@f_z<9EuII*)55^#B>bnML5T<0Ed&Q+bR<h40+cnXFFlEr;W(SaU7
zf~A=3$q1rYNs{esiaaev#tp<{N@Fy-%*H`?uUE=zfmPkuksm<XB}qnZY-ekpxtaV%
zWRbW7R>E-Rf{8d~sDXHj#ir1{mAB??mO5=I^E;da-%|Dz5qFqlwit*kCdofLSt6YC
zc^RVO5EQBdmi6EeO&`ce&++D6son*WDG|-EBrib@!~!O@os(=1)`LqF6S#}dPL?SF
zX)i%!8J+E)Ce4swQ9=;0Y=Jng`MgH6wdE{6JU}<LM#c~ny{Or7Jt^}fRCS%xbk4F<
z2qG2E#wtTCJit<2K<uTO8Vz!GMWze@LQ_&OtQ3p~xc#z~d@u3FiDTsD{7d@p8uW;w
z$B2=~llPz@`)GrHUY(D;PUtLHc6xMP+)sb4uZ^c$s*6L!a4scgP?_EuQc1P3^TW6C
zclXe%_biNwR}nEgV1r->GSAzjIv6i#eEco&ZUJP_2Ff=g%TD_dM`uV32>-aHZtX(F
z6IFhur7nYIHcS*K{CuuI1u?)<W3tQ`5MG!~EU^^m;sT=Uba@6K#fzYqQV@phuS)Cz
zJF;P<B|*Q-#D;C+0b#8S|E1^2W<v}rNfrx9;-!}IG)J9M&~5MuiEozD6UF4shop5d
zzgBYW*mr^TWC^WgycQVkM$*OXH*$MS#6JFYvPY<th8YL>+L5*EEy);&s3A;r2_{=g
zlcCk%nQS2zac7n^mkSo9go!ahCM?dD$P#NTY^O$d`v<It7o!XSHO4x-c0YD+sZ8lW
z>mNOq8C{4v2mVjm1VEzeV6?cu01~Xt0G97AU6=NAOdxsOh2kT}UTM&^b{1E#mVAy3
zEt=pYaXIjzyRf{ta9ED^u#@N<m#7n*G~^dTa$v6M(BFBHL=^O1TVKU5C54s?7?eN^
zsBCpua=~-U367xDV~U;!#6pqy=}DkcuAJ=4lzj{~bUQ`9={_E<L*Ih1_IIIbJL?zq
zOb9=m!#R`rKZp)hp}*;P1|j58XWJ2Q*kLk$fJ$oX9IE(gj%DK#AVL3<#S4iZ5mh%N
zcz42)%}!ayTAFpal2$xqpRUTj&_iSB>Az_b+2FrhBn<{jseTb#_!!^y1RuK~L<x(M
zglEnw$kwWwu7l^4_N$D8c9l}_;l!ArA8IybfXP!l?mSO4CL)u;=Q~l#<ZA0*hB2xn
z<~hw)JvkHT;$?2F5urBs@OLbO_B~;KIyX7?QZ2r0<qk%Z^w5?6u?-{WhE_>RuZO4v
zWRF;|pzu-38IT_C?|cDgL{d6Jhx~;vv)Zh2P19U2NVL;RHo`2{fmrwuAFDlqz4EZ-
zgtP&~{^QWkQOiAf>ZYI89Up%Z-2{^WHf8qbq{Jh<A*k_3%IptXwDn`kAMLLibVb)d
zo2Av@lRR*fv+oKI+ysjiO75%AdF4-1RJQ!|;USUE#(v@GW~cO$uWA^OwWkdae>Zf}
zg|==%^xdolm`N5X_dVT{5W{D6HOZb+8yEJ%OfmOuV}I@3tHKL(I`!)rni#2;SQ0Ba
zLQEizkIVFRRZG<{-m4j|t92hg%n_Q_J#e(ay))|YgGmofsOT{x)o_v+5^VM~Nxt_i
zkshwmMYG5Q`}{U&hTF=i{`7KzW@vPsJxpG?WjR;kkbJ$108t;>8%exR!TIHkdVE#?
zlH%_YNwkTKnNKd)V?(=1${~?K4;o(AH4tM%a14{dQIcM1l7-ysxhg}4H-pJZb&q-s
z4{ZdAjMkH-IjY(FVrDzHYVK0ZH7qta%qU<f9=kdI>&P}lQL{^}cK-8;D!ffpuFJ;p
ztS<9)!N1ZjX3CZg&3RhmBfVt~Q<ZMSl9ZF%5O>5PO)8eO4ye|4e%<P9-%6oxrx+=7
zyHpCpsH*hbU#6RTjD4;``33$?qL_HXkJ)&j($4twq3&Se;LAt;eyR9%WxI1L={#{A
z@}ImJ4pJ%kZFtAn3cYFi{I^P1w3vWjZ#Q7HP868#REi~N)Iw00uV!Uwc!(`ldD1E)
z!1D_Evj)^+<tZNe)wVJPeH^;yXcw+TlrCP6-xMZpcN!jl)t51FP+3rtCvQ^fV-rmx
zH%K+4^@6ciGNy*{9S3q7V}2fC)F!4_hzst+g8QrL4VSLr>kZ$@72yS1Fa05nh!Zht
zerrKhMobza9DK{E86o!wFV}$3N>+N=Da0T=bNVZ9V8l=7eN71hr2sCRYuf4*b^QDT
z+l+OYV35<_l)dZ2`|G8~l)Fr_bM~;_$OeNXW51nzJe*{`O=5vjrGScCk53Q4Pic_v
zqP3iz$NFs>Y(hG3vy`;ruqFp=DI65^hmS5@CYB{cN%paej`>0B{>ch^3PMpH<vqZ?
zRE754!0ioa{T`l-V6cS7OJCl;n`R6$2?yVt!l7s&#!tG08z}bhqwcT-{1sXt*9JRb
ziIyf>i^p5{DjKl@h&C;@n4e@1Gpo|ZlnIjP1Y`o=)yY0eI|-ehgG^l6Ak*Zm)Fvjb
zkl7C3B!}Z|6XeJx%AEa@2;Z*RcjSmMh~!)i5f{VHZMQqd{VcV&5ntQ+IVV}S5jtc^
z?gqzo=lU+-$@swM_Vfv2_UDB^y%ux6k=Aq^p^2-*%uZXnBXr<Jd@zyz05f{PG<-hn
zP0G1Poo4GKs-5nJS8$JUt=*=&QZOjLyn1^$$ld@Fpab1Np0Fsa(~e!G&2`Ea;(1=x
z{u2Dr(9|>V<P&e`G6OUTCSkFn8`sqFY8Gax1oC%(ISe9qgzh3G4V%K!i@eMOMM~K@
zR6NEe9%QSM2UR_+JoooTgpWwUvGw>tf;Hofkf;rB60`C_Xi0W5x(Ksu0jU(8T{-vH
zTKK6+$7ZVf@oZE_*pcU+tzUo2KUIS9T+PTFt}V{#2>Oc#XDGm}&bP1F=z?U($!BNZ
zH$-hqhECl4H}LI>yQD%_>xI7G+wkJB>H6=zDB}d_2%qjO8I$Op5^ZfsXujckRg84z
zrQN2=S-;dWiNkx<|9-zK)oYtP8ZExmU2#Xk&Boeu*5_fLXDw9ZUrVvF>m%)VpH!;-
z9$`AFq4qE(Q>zDilO4WVHe8aw5WW1dIp)u<d_wH%=f0~$I-%4Pmi|cn$f`d_LK7un
zb&9<`ufE)@=6@2MLoa*9nEonyxG7&(=S1nR`?;qw-YYeEyiVd1+pnQ$)0_;>?^d|@
zWQ|TryjS(A?SI*oo(Uq>KUSKR4sxFaUIQsu@;1&7CdX%jZd>7OQukn1Gn4lG6PV2_
zi#j|WeA^3{(<%b-<0y^V>-l#xPR)AH$|ufN&)-bg(VN#y)K^v$C$FhjA|Ddv^m@#e
z+r)-&8xvQCEdEXWxN`IrCje18pf<Qq)PLoWl5i~{`H%q)1IpfeRT*Td>1LWFsScsv
zMTHu2jy$^bNv(oGxU{M&rNuG*d;>8wt|Tsy#Y*msY_K6pED{oOyYQ*<#p6CX2PNP8
z6?qEWW=^jnZeQ}D2;TM|sgcw-h<ROHc7b#Ge&?*Qd-24%!Glthk#9Xs9)$)Ko-LHF
z&0s(GkvXsrt>tq1k5kN!O79ex_7Al=m4q^Oqtdx5<MK2yf47;meZTKt^H)xjp3OAq
z*`%h*OU8aq(R{u+&9MAY@;UvuMckLfL%Xrwh4#hQz9gT?ZT^yW%J|yc^$R`kzg}}s
zYxa)O2u)kaG<x2=aO29?69HL8{_#QODZgdD-WU6N_3X2yW@0I8Yo_O<?=Q<oXYodE
zH_(YLZtf`(JBrXyLCWg=9|}7%cYgSfS6>iFyi|2V{@7yZ_VTkY_hf&x{_43A(m3PQ
z7W!gl>_%7<53mg92&T)f_RT+%TYI(v_dM5qD6B0~5c_jGtO=qZ_k$zsbnwU9cMTKk
zuSu>qS0~*QJ%5eAyEXaiqu9{FSZ-^2I&S5Q(aQY!neX@7HeVQ=x^dIr^!~+=#jp;q
zKU3FKJui%RIPKl|QrEb9ZXx3K^Z5C`uuH!-8{d^}Z_G$4ME%)5^#SQt>@ZqEL*d?i
zID$b$Enr|Gqe*7UB5b4`QC`x)QespQA=tu^*%L{XFkHyyJ30Jc$t27u!;*iID!3SE
z$sb8TMjf+69GJtXohu<xaLjZ)WwLNo8GitJB<(Dw!XS2>Bs)t<Ukt1ePAch?e#J~P
zS(*{b+$1US<!4xvE6fVVN&9m}E}KpJ2)9d<WnQmjx)=ILJwTG81nSa#B9&yWns#g5
zi^w_lf7rXvcevhvZ}>B#jhQh;?}kWp88wJ7Y7kLVh>}4<^cHDE7d5&>3!@Wll!$Kh
z&Jcn~7(^F6LL%Jr{r&d7_TKk>+|RG;IIi_%{R8Vb*IMWKdB0z$i(E_7or={}u|eXC
z=csQHz1&I~Y<A*ya73C07o%smnRq^@SV@Tdy}ekQ2l*FI9%-w(nIvS_F2SxSs`1_<
zg<XD-L+PSagTEjJk9dTE-HY4JwMjvonK+uxBCH)RQ`*YC45ic=eFqh$^s(d>*%I@c
z&elvBGZQQF4Kp|0{h2Zsm{%40%?-S>nBL8b+e<UCzkXW9l=af-mDsqsq3;}1_Q}Mm
z%E^pjz!?*M!^}as;ZmF!J_Jwy?UORq7o%{M+7J(>cJ`6>o8Uxas*%7IMOk9I{eW7o
zb8)eP!!eN=%UmFGyW|Spdm|sk4mQb@l6P+!Ofu$VGtoRD-1qQ6m|GI9kd=n^mGdvg
z4sf3$B@&Un$J~U{yjx_P;-puKtWUFMDK&2~xLNe&cBK+iexp&im@GN0Y6D9xLPQ$|
z#Dg4!gJ}gG1(}6J8NXgMfv=K_ucs;As>;fv;VBlj7JCn6Jj0f405qZU#SA`=Iz#Mq
z)Szz1RNZyN5DC1{1Jhk9A+w{>92SWyA6~qZ@wjny3~b?O?krFd%UUN&v(EV)OT{3(
z7$jk&Nj<qh!$87AMvy^F0Go+MI7=d@N3i?Fs;N9Dbk%JVQR;Dy<;nntCNO?eajj5$
zszd|DlOp*rt`x|_JXO6=-to+C*7}#cDcuWa2|LktYHhs4)gSfhS661|&-a>-T7cU^
zI#ZW|MQ`2WN-PcrE0HYLqz~8w*)tywZpP${*X5147T!-2v9hvc&%a$Pc`Gi*m<N0m
z#7XKwXyT{f@pp?620(_1J*xIBjSA4`y}K40_uG+6>R&xIW&JE4?8F3BUcFO&O>HA8
z;r$Y~7_yzyWfRxCvDp2kz$4}z|F`$CYADX_&5(!1LEg`v!*G|xZu#Uydv|@v4f#ZS
zFDG*eG8o?@^w~M~?bp?mqv^h<?Om-ad&v>g!5l$%YO~mTFsiD*Gi`hdWh{%LnNw#z
z#?pk*0;<;O?>zhDT#WO6-MCONVB;YL`&m3HWv+`k;?|+jq<f@)1=e{!UGXgT5lbc>
zIH1ls4Wv2Dou>q1Qaia*i&?yTf+9V|d)UAik7}34VOlzsZax_}Lc_P4x>r9zdDa3=
zd=eamXP;C{v<iETjyX>`Y7DVI#IteFx_xr|QYUe|kVe@Av{SB|N-EfDjQj%PtgNSU
z{p<6QBX-or)K}uyV!Yy;A92|47uf!&!;~sWsE7bdiG|@hT3tB#RkmfuZdTzy$#ZzG
z*Qe!CzvnV`+e2x0nUDgkl8=n%4!o48;OKd1H#9i%`SjvUq*T|{u(`vmXK_IuI4#9u
zYoF4$o!?calm@Dr>)@vzn>N2LnOk^VDf+m~n~HfNRgu78_{`Sw+~MsXyGL(BO78RQ
z+!}41K7l*B27;J5fBYd=_BS+q)MA~xr!SHJ^0?vCHtP9X<<D}M&!mmpT)hgftQF^<
zj|T7_=CJ);)7|kJe#`r_<nGILnYNS3Hr}HW_m^9a_kBs(b4LYF?YFP0`i@<n<e>Hs
zT^C$=w)c1u@=(VA6W!b3CPUsGMd9AvQtW6+`t;+8kFB?=c9ecR{qRTi`0S_Y&^6sP
z+@G(8RY6zN{WG6r2dq9l|1)^`rJd!yR`Va>LNM1i{(u$9!*<Cd0p=(G;?2(1Bf8(L
z9>?r!MJ^km1C%f(k-ZS%HUTLT@BoPsfN}sTcReZ*5{L&wbwLMou0`PX3JgkgDNrY|
zEA3M8lc=x6Z`>kLnHv>Y5;nHoORAl?NATdp5%CTjgjG`#17td0<R#$2UhM_s968(r
z-Z{K8e*1*gXy4k1=0@3X6Fo-BUC6~<R2^Y(<ublCKB&V8T2u;aLBcBC7#c`0AcWzX
z5ks$sYo^*;uU&?xNW?OU;S&<Rhsis_Ab((X%xqla?F;pCz`Urop<MPDjN~B@u%pfy
z1<+@N@CKr3hj4tB4|q4wFm@Zj)UvAp0$N34FEnVBe+2*8&jNQj_QJ9pRIm&#ury)t
z_Iun;d#rnsY)_?F5Bk}HJojJi(MF@PV~wd?P`}T4f$+y;&8bx!rGY&0C^jok4z2-?
z9MApy1kSP19D6CQY$^6Vx8v{Hh5l-+sbo|qwZx?{w0{oL#RgCbWMWriISpd3P*d~z
zm*Xj#^N-^hZ^VfSMKgE-0)kMYYD+`5Oi@?{<|qaeer?ep_WB+V6C8_1;zmq6tsIea
zEHYJ=@_(NLx|<-lup&4ra`A5UMe`~_yYWo>#ETmH7pG{226cs;8KDbg5KU!v@c2dd
z{p@&Y!N|m*n8fT<#^2T^DEkezC^9S`&pRH>OE17Sg5`wdFrT9CK3IUA0+|W}QOY@t
z`#>>oHAK%oC(=gzZ@a`OK(cq7>3oFDhT-oU$>j?qF)=#Pex^{KK}?eT%p74%;(3}Q
zSl+*COTU3*eao&LMuKcc(82bQU}&~1guxWYDdR2J8!vMOEc%IFHZNB8hUsr58M!e>
zxoaM>y52H22QnfNau%jg(?A~PEuj`id99=?H<_;NI4U^H$oL*yd5%)_Ns^cG=6M*!
zmukd$XMy?R7<e9!^s-?pMqd8AKsPq7I26S3b)W0Boi&lfr<Wr+W_nFZO)*P??QCCs
z9LW3Ua@tWl)hUoWK8TyTU79+GbDGGh7s{7P)}N4pL2{YXZ-V2xc|I4)S$z6tB=gRG
z%uPp{N351xazbWISHn0+<NVs;23A(S*HQDvgk~vROXgOi4l}n!E$DJN=cc2U!-VGj
zTbg#1{`*>Pmt=06#~MD#LTqCN+{Q|h##f;NFbuy!L@u}^lw*XE$t4H<bzCfD=o-EH
z4fACM=GtpN4#b;5Q0BOIwm7<1lo*4pR0e=gTkXP)2hce(=a3rfAr5d^aw+*@b8?Lq
zTRe-)F1IDWLW$#Ba-jy5kI_`25yB^((Z`kbgBI815bQ&y;B6}5Nll5L#xj%ISLBSs
z#ze#rCKu#xDSlAD#$wv9YkK>G`s<uq5{O$YAGB_h-h<!slBF0|$G{AU==ddA!~%~c
zjYQSNjkkF!X-n5qexlEl&^#46;J!m~P!3o)0l$S~-lmdDqSn$=W9>j|#=zH;!`yK`
zx60jwQk+7(^mt-zTr<&DH3ZNM3*E>5AoA^o6&AM5pS0g@-(OC-zd*V_%aXY-XHEA6
zc>xieS(6dGW0hxWbG;h3b2|h1<i1dyEC(xVJH72fiUO6-v6ozysLj3ETz0nt_N{$}
zIslYC=yodhej?cns?L|0qWGYW&+W;LzwJzfM2Q&zzEq_7(mEq`JET6xG`=0ah2A#!
z&f9_KogVo?HZY&l7M7FW0gsi}iyVJ0gcKS&Pma+xJ;`XT%j<gLQXcDUTANOicNz1s
zp8f1hFYY#Vv~jNIHCv~v@ry-9?v2~%XSYdKcW0#A(VdLncdXCl?|6sfNul(0`;tat
zSLX%zB&Yb+swMK}=wD1eN~x4Owt2WLus1~G486PGL!zIyX|YW#``oi_^lRhRTOS@)
z<AqC49)8?-^wFnk-6uQ2bL!1g*DEHTSDy9WxpOs&=R46huLN#v^fa6jjlTQzX}oY%
z!t<K-=QZ+1uiHJBbP-W_$xn-@!70B{wwIsozMT5y_bnGN8c0E!`R0QBH>dn}-uhqT
zhbfs93fI24xC7$RNf!mPr1R6@e+86F1{OsIGO!0RneDLa1irgM133<CxDv$nEKqDZ
zNXqQ#Q!kp;UFY+M%triXAtKYke8&N5^;~(5p}N(ft3MYQg_)|*{)53Uz0Ja(*84@5
zgQuCykN7!l-(Mc-So*psHj0gWn;MyM4C}x$Mb`<92T=l865BaZW4Byo0l{G?gelon
z74o!60otYzlNL$LN{I0si?LvN-TUk{oiR=O^y>?dCrha=96CJs>Ou0QS540t))oGa
zoBiHRbsc;XCv>y%^Ge)_&nqYxEHrL52jpcMHlwJW!Duk@k$4|J?GT8Sby-TZovAie
zXnWxvRl6caErp8z+VBDc0f!k4MG>$Ji#Ci@{4jYNv(u^g`yLwt#gOk<gw0(yCic{j
z#~~4E<L9KY_!foKw+*T9PSPfSqH>?77R~6Cn%}u#n7T}40eudcQb=nv&!7kt3&f1K
zikVA3nLN*5ko(0(yv!>S4Pq}cy&*fk>_~cjEOp$T?7PU@m5d%CvKF(8qrdaMN>S6J
zkexul!=Sfe-ESLazKyfO=T6dukZzP#k5WaB%U|;3e!taf<W}L#uOSF7v%Kq1&1*l(
z*ZuwWZn_8bS3;9EWocARqCrLB;V~Cob{Cj>KpfNfOJG}O%?r%Gf*8|@Ftjadn#>5x
zEgr@qPi;{3YRG!*WllRh!y@drJ1^%g=_DjH(?dwG@oj@bfmKaGz;oC<XWR#)ilx+w
z^I1-4FX?1giDN0fGEa)`sPTn+x-$f6k)*|kSI|7m=Q|}Lz>5*Si*l^|)~7bi_IS23
z9E!jRF3VwqgmAI~!ImL3!he#UlBucN;o7rOt&Qjr9FxDz?Z$ELk$ur?{8uN_b7y{6
z`p$j~;Hv+p>%!NTKErAS$Xi}-*|UJUkZfqc&ol%A>*Zzp5+T|)AO7;Q=-^PWB=oDG
z533=KhQ2io3rQ9k_`eG<_M98uImloZD0q=8OTp~%A4Adf`U8u$Um0zGX4_nqvJxUu
z{t8yyQZP|AL)HUvWq?5ZLely}=I_bq_;!dg&f+hy85-RFx4r$Z4P7EN_xZ?d>8Gn@
zPywD|5??A1m6!()oNoPi+-7Il<B-`yi88&mutHzK_ZPsU0QSEGIV-U3gSm7HHaxcE
zq~XA8Jw1Hz2|mf74>FnPsM9_}t}d-iDa$7OPj5*41tfvll2pBD-E6o!+cU~N{K;~7
z$`9wMZ1uvgYV09zAs&3pX4semJ%&o)f~XAw8C5v=loM#CJK?rCT3e#@t9B|gGRJAq
zs9MLs-<<3*uCl?Wx4mp26J*#nzuIOke8V?)C*$Kx=ERL}6NWE`znxm<+d_{{EKTIa
z4yhjx+xF3e9$)Yk`pnOKoxizqi8qnV8~jaZ<s<qxKjjDnzmvm!uFlhA{B0(i=S$w-
zkGH=m7h<IF(<4*e4~&(ykJ=HOJ5shd0W*AQ<psVuz_*6K;{N>KmYRpITYXuwnp=H0
z_u<W#emmwHsP^R!)+p?^sW84k4?invzCNrGAq0br7aD4wqu7;vyo;6FbNwL~5EuB?
zl&>}Qa3|uy(!7#UHgEVt`j~l@*;N(|d6!M+CWQQz(MjkCVEN9X10ut!{sGh|TB6m4
z62Mzzy}+It`@Ny_`|Yf?=()8&8Oxm))J8)&T=*5X1$Y%yq(9jsjKa`If5kh{W~@uh
zeSoPD>$QcyYrPb^@~kpRMS0_pQ*Xf_?XSd(FF%^>=`%>m=VOwsqnfOjq-S>)nVfjG
zI_I{i?(fnCydLvc_6p)?Rg3x-+)w~m{d9>b4W}W0<sYEaUyTo<#(N{EY#GEy{JYa;
zw??0Rcw_$X=EQFI1>R(dp@ohI-`)it+Yk-kNbJfWi4S>&_llNtc^U(gG}^v*pB;v0
zA4l^AQYjnOsYniyH=FEvF*$zcR*z6>(N9$+PjTOaRF7Y0|7ptpV|xFpe>Zw12mGX2
zf_vc?%NoxMrIy)X)CL~jn!~&j#7@BNP1%0_Fn?8h{?DKJb6{>JG3dYBmEy%}A#IV&
zV)vROr1E-Rb6<Xu=u>6go50fajXzSl;2*ovG#x5i`LM@GTH+1k<LW|+UFrM#lwS5>
zSGZ<0=d~!=lJNrl45gQl|FA24IHlGM47=H1i!qO8HyA}=_72z(rf9<x<??El;#5`p
zRE)9s6NU=QfO+=kQIXZzpW8#BTs>y*!7P5^|Jar0o21hJuq#)FGq3u_rptNt3Ix@K
z(kE|zOTIZ3^}Q*)U_!y-m$I%}aw)j&=}?qW?Q4sViXvTllc?9q4PME=JD5vql^YM&
z6XpC`W3T;jP=s?Qs|lA}O%7q>#_rxR3Z|m}GTRhzSx)w6r0!hKn~Tm&xses#EhTG_
zyi8IkCe_xP%;dm>&~q<s$vWm7gx-&MsrzBM%iauzJ37Xp60H7U+X$wcwD%(~WlbZQ
z0RSSE`ol7_4mA(}P2{EylFkDNZ}%<5?hp5dss^QoWOFqfC&f9}asT4dIny^LQ;I=l
zQOPN52{+!H<WFc_74WB@xN^QXaSz229BH2(n=oyc;bvPT5G^^vo~I@QBF<s?%8HjV
z{Lj*6;wESm1^rWRCC2e;4cQr>hK{{iQw+5!JDvwf?;i6N@GBGXv10o7sx!s6qg1Oi
zPYg=(XiYY*rM4c#;`W{`rl{6oLLw9+G8+=awe(SUiaX#IOc{Z^(Pg(h>z)~LJRazC
zkO4jScF69xK94Rp2{yPcoKPJTLc>(&A{DFJpdUm-NK~hHM41KFy6LClg1WgZ7^5$1
zpJEaQ6}pZ?)-_X;tKHkqzvR*~`Aj6hRc(?@U`(gUg>+0YTT>_jO0%<jFR$GLmpXyC
zW>U2`$jCu$GWISUJ(&pe9-?*SvO>wv$9Rt@?F=1^h|buJ_OiY*4wq#PGmcR)>C&tn
zV~W%rlhb|B&@C5qDgYH&qLyY<b!QH$BH1o+RS(%aID6HMe$l-EfP-(fN6BX0{MaXZ
zdCGh4#g4>9-Kq!D@;)bh)nS|t%U-V}!t`aIEjYZ)qt)tiNq8u^4s(o_xSSx1VAV?I
ze75HF=G^M(x_hB(e2uWiV3FkTSH+L()qkFUTvO@y4*N0i?I2e5ufFFBtL}rorX6CQ
zTo~?mSEuIA-b6^lie=K_>*2VK*p{&T(UF&t#ccU61}LvUEQ1jk1IYeX8E5-rX7d)b
zXy@u119pc@?F4ZL{afdMKS9$ft}lb2M}M>r<--%d%DVf*ZjBsG)3uNK#i18M-cZ};
z1Lyz%ASA+yS~Y^_mz+l^|6&HcZy}>TGd~O^kOO5nz#<1o(oB?XoS7#;FzJ!D+#3Fa
zJy>%nVmC}skp@NQ-66Q*a?uApjLJSvVyD=Z#w9sew_<64B@RC66^1AQ_msj=QJj0{
zoke{Lsh(f$6n{;tqm+Ys6sk3&Y|1W}l$pWBV-2Gz4=mNdp4L?eqZng?onEjFSR-nL
zTVJ@NjhSBeHOVtRS$rlcHKp;x!#&V)Ju#+-sZTGeTG%e;f$DcuKanL5tdF@adS5p|
zH`eP7D3Xa<FYtz?zfhcv7go|!F^j`<oU4mjN7yk^KQx)~&CsEla1<d-PM#^TTHpTS
zlHiqwWnG^c%dy!|$9TJY-kHm0mjq`QA{<|cBemF*l$OnIdVMk00u>is0~!U1ZIiNo
zhGG?Ac&!i&K5IX@NRhvRx~DnGZ20+z`V#wSu-@Zb=9_(LEb9?6D!0sb9_5Fh%m40*
zxbrw)Q0@`GT9k>OZm0cxgn<+})ub<?Hea^f@#1BO?nyWE%~spHUaeI$S4a<vUZ<7Z
zjEkB;FHXc~N6;8g=1X;o2*CoMi^9s2Cd!<C77A&VC<s5ejoH&+z#a5n+y2Qu9r_ca
z{q4QQyi;8P=Qv8qYBPLADomhnk*(P)X7bI`*QUA#tQED+RRqXXm*|t1UUFr2A52<U
zg14pCaq8$r&wPx2C|_GWT@r6oVx8oZ+Wa5JcFV=aB$Fb(z2eZ}Gof@}v~6{rQliss
zfiL45Pd@%obmi_3jGZ;P&KFvf#{4EJ4&xEUQCeK;p_phfr}wlmeNTeZZtpyDbtIfJ
zFLB*#10CHhwa9CV4GpZlnz&~2v}LOx%BMdf&Q0?bLkrejyTaIPc{il)=tsnhStuFc
zTw40KykA%u7j}!eUTS<oC&XeOM>@MpWUjzy%-!gDqA)478_^#8A(%fJ?Rw$DCEW-y
z6Wd9H=?-zXDl7)3<tM%%Rg0n0V%AUaK`(Vm1l`jT@I#^9yLy>X)i!sx76qZ~Jx0wM
zPS6Wry)rw#=v1IqeLJn%F8hTkY*)ppRP23B9<mLyS!$aS+jux~r+$1=ZagMZE+bFU
zN#6N0#s+@(9q`WIz=QO^W6PJ9v@T!Os!l|-SYJ|2kQy_3WTV{<k~s&{f>{<`z4>@*
z=f50G|LeG$c@77?luu;?v75eD;rYr%Kh&00qpQU9T7v0Q4m~>tYMBWl%;d5-PvxBt
z=5oW1<nJruB6701aV-{FOjTU1Yueia8tY>BIX^K44Ze5Xi<WQ^LGlXhYtE53OCP#A
z&mU3r`1a5@(o|5Una;fC9|(`TzAwHS#H)gtP3<oD&PU&tN2#Ky2`aR#;^a`(Av8iB
z5X3o=r6atxh|qtw$i~hk^<7-Roj>h@H+ZOCb(}w}B{>+y)Gl{l;BG>UswFNf;%+Ny
za3}S`m-+J}4KE@v`jy24?lBj;)L#csgA0bwm#u&H6x@AW<JNwzdnVk&akw`W(0$?g
z*&~~t=l+Q7rsiqP+lDC%eQyEUyQ>p6)J&;>!~5@o?goL$A0<jXV-0s0JVu9yBXZ&@
zrGilgPJfsyuK!w3<N0Cgm1t=Eey38bwa{j2TP1T4_3W^V>EvaB$~_%V+w=M`Wi{sn
z#ejrCzJ|@{%h!Cl_;kHII)&_UKzjMy-%-R)s^YKx<u)Z<UpG~LUB1$?GaLOvN3sL1
zn$Wu`C+!zKktGy?QxbfN_`8-Dzu8uK_Bh17&u6+FwrLiwx@$w{kxEg)t7O@y35a`#
z!Ay7X-J06%G?L%H^7T~KqDR^gKfLGv)Ka<;L_6qj5?`L-&;7Sn{ds^~0oqR{-aPxf
z8dwwh((3`O6p~6Okos^HC<AcZ#KOgKbS-2c`8vqb1NUbaCKw3o!@!t~1DM8w_}GJ)
z%!1f-;I(8Rvl>(i3w?rn_yiMtQGu~-*Blz*D2502>;~$ln)Tp;Vn(?B-e6v$M<&4E
z5`*G@M8~#<5CkB;lYuUT7vj(S&Tw>h))4$_2qOj5ACC|w8yebGgb<OzTmfaN!)T@+
zI&nnBNrdRFg<Et(ICrTGb^L72P*@CPK0GWLgAyXY+$7Qp;_MEuyoxA}h{<_%MtsFw
zMMbAT)q<moVGp0X!nhYmBajfTTo>-K8(to9e#-+7j55OIk*L#kB3Tv!jsvNA0f?OG
z2yQcfUIOBy0;-`tI`MjRU2&xA8X}oULt#1vNr+a3C}A7dl4F}<JkWp~^-afA5f3aj
z!tG<Iq&z50XE22<5+?&QkyI1d*Q==zDWll8mk_)}O5iH?$8qf8-PqOo7;$36K7mS*
z6#GCp3J}TYPGFm!zQ2tJijZG3nH!_Py8D3VtuirORetPa2rhFJdkIRQglQ#^CTlhR
z%ZKo<Itdbr1_T9K5nb^D0FQK}^)NC)XD#t6J>_TyCa);&Oqcvcj&`;$>AJ2inLSB^
zLv$WVo8FroN0Y!wjM8yTxpjCBMlHaNIYb$IQ{IOqiR^;!>b{X?j!-#C!RI0@jGj9-
z+=)V>ZkxaH?!QK0k9DIL{TTlC70p}Dc&e8=Z-bu8_W)v_HoP@j_6t9`rNEJ307wm{
zPn))d86Z)QN>UvY1K)Do*(SYxeF826r00mF=jo;wIHngxrk9kYm-eTZum8)g6v?R3
z&G_J$@sVOzmSi;bXVjg5;{bFbMrk)n(i{asyBpH%2;nLHnZxUuqxA2_MBaVUeK+a&
zZYuKKOv$_1{&(Nj-_6r!Er?_->1HiEX039d#4xlLk(o}x;XfR2ZwEpKPN;r5X8(%J
zJ}JpQ;y@{pv(M@AK+$u&5)$>t5l<I||1*<KHGl`+!_z}@P*K^?FL;*Uc*dw4I=vj0
zFL<`}9KL~UPGS!CMh@C3SCs_hBmreHxu7o~6hBDFDOaR1SAr9N`8`l7D#s2(8?~FX
zOD|d&5ry4|M=iiM0`qm>=ig||ufQd+p-}pw1*X6ASx^P0Q3bm93eG$V%+m`Do${@t
z3JmmcaSL#*G|+X?LS4PW5Oxj+&IG5%!VOZP<^Xo;QBldGP)DUAy?aIQeBjH0d<!Lk
zAkkvI#sZrc#X5S02~|a2Uy1^vxIG4noJC9AqYC5G3*M#|O?Sqtc+v_hiXV^--lcOV
zzb~;KD9J^gqr3>k8(93q-|SY6#TLJdqZ{A93VI)$UK(Fj`u-k%aIZ9jv#jv9$|aHa
z;>Pr>pWft1BYcpwF@P668>MMVMJ*7HnDzI;oTaK!-2e2TDwTZZEa{Fa@qAIfB3kxc
zsbJcva7(mcTd&+!BS~2eCO0FMva55TRIvsr3)bQJ@}=loBR6QU9JNrsdauM*v@%Sp
z%<g@~*dD>3vuZ%9%H>|wsi=~A2~(<(JwU^ZDF@MjhTi^p(RT%L5U<$9YWA|AO3ky1
z8A>>?Az14X#*AxhU(^&qDu1L`O>R`GT&+3qtYU!HLZhoR{!}+EB^&iKx?|ugMDr{;
z)Q-nF!xX^ue)VNrPlg>NWGc!0#tn9<8%3%X1af-8)##c>&NW~$o(F@)_P(_xoFDaW
z)b2XfLZBtj#p+HLQ{>vg4rIYPoCWBU$)jo-_jvxgU0Ml2i_^)ED#o>5zIB|0a+CLU
z;|VpXn{}Vm>im4!lbk=Y?3d!Ne)QQaOenqT><EVlGYwr-Eg-@;PA)QCNA+tpy%%Fb
zI5#F#HRz-_eA;W$<!s*MtkunEoM>-K{!^FsrOEqGb7RI^r$Bn`SB&2uTAvZY^MN!E
zQKHpINEi<O3}_vFp#^K)I8@r;0&RZxhriRJnKAm~h8XAi)kZX^C?&0#Ke6r5x3$yj
z98pJB92R9-C&h=`z{8=;)wq`PQl?_gmRw`X{3T%vTDtAbf7H~Lzu9~?+sy0I{A-h_
zo&>-7_!^5BVg=tJHq;^RNBaU#ya2oOSFD3yfWWL@;}YG;msyC~VwY`hmr<rQ0E;^4
zbxFHi?e^$UPDnV7Z(`kpx}&>I^}BCvDLRm?E+oJ$GP^}Q5td(xI%TL6t}a|hYDya6
zzE>yvP@7gso1=P9S4UQkbg%7KeWDjCg+QaW&y?ju<n~15qrjGVtRY`bR(5I40H!NM
zuo<3q&j=R6O`C!16|?C&_UdtT=@~BRcZGFqzUWF3ABYR;RqN?hk;)hJJVz95AtGzK
z9n=(mdC;Dl&`}@2)8F#tWit9Gi!03ZXAJeIa}Riw4R(t&SuU{PY$St>=-U%TBjTxT
z#@GT-&Sf#&rIsk}jOz4dL>rFH%&7iEqrWFJu~k{TS$|}mTPfd$v)CABLxg1!R0|{M
z*H{sq#@zbB!!BI|4g~r(Bl`qp)CxhhZC4xrc5tJN1RW+FnDYHXS@X%!tQbK)QHjGA
z(a3%0v8qufPudtGNI@cW#W~T?TlIDdiJ^R4Y<RqDT;h1I<P1qWjs&A~5c;HhX1N!+
zhDT?H#MUvF>eW%FMs!FA(WS5By5$o$7z8=P`4%p+>XQ%;63!7}M$~(OBIyF`Jny(I
z%ZCjY^}fDh1<BmH{<_Nm#(ZhhEcXhZ%R7|YFr!Tw({EyTdm`f=vHO!K&&|^=>|VEp
z_!Mh9!g8xoUqayWFwq@Nqf6#rM=QS%>^(5KY{A%PhMTCG9KB*{znV+y;DPv)Snm@!
zuJgC;h0Cy#6haF*J+a47YQ^3VSjlb7Hn`VYQ;w>;#wheeHsF+LQ@$?;j|frjL+wLt
zkhFY*FyBBLkjYrk?o(Ei0T!Dt@m2H=n7(d;T!;(XFVd4Bg0`#8SIY5d&@SyCyXj*u
zgpyqODY=&W9ksc`gOgo{mzQpy#`_dtznl+FDkls)$~~tusNp8uq;P(7@i}A6YGkei
z@`UMo``he8yQ)FTaEln$@-Ce{k53eiGsVG~<T{n6{Y}3YW|j%JF{V$!BZRgQ?~!1N
z#mS&eT77MOg6$SVb(>_St`1Iqg0b5fvr-_=<h%59*B*IFvDI6B_oXPDfbn~3mXtEu
z@{A9mKffDqBX)LaOMvWcM&LSva-9*R8VeIFVxiR5x&wGl@sKc&YkNpY(7zN;A0YYL
z5IAKQdWv)qs+cNJ_<ntyHO3M`eFoPeHF_DWu6}0ur}Y-Ino5@S)^=#|Mm&Av;PBbO
z=ZTy38-6Y!hA=>bAaFtJ2^nCTlwx!a3$vc)@n`QlWwA+s4s8t;0EWl6*aEBOUscfy
zSiiSHvhLx{*}PFwl1tqcRy?mqdpws*$2cpiq}l>$YP`5Qd$>#lTpHV9rf6sbf##ku
z#0>)<B3s$)UOpgF|K9zvkOhwvpm8vw^9WVQmgLeRg0=8;Hb&DHp0sl?o(LqkxX{VN
z4gQSoQO!@TKmNkH<LDR24W5P3p+MO^f>a#|Jx|hv9$dDfRjS5G=^D{*74B6%`4EA1
zcEUN=7djWx?oMW2%<O^b@6vV!(nyMJpyv47aI&dn!D<{^44P&^T=0fI`<5SP!|uqQ
z^5`4a(f*3jA}jVL%FYtuoCfgDq3Coj=CL`8+E&lVPyFN<`(N~LJm2ZU*0L?s)zkXe
z9^IC3ln-HywOTPTf>^Yw7U0<0(7$f~oM+yn4U30n06wH&bP6((RJB1bgJ%DuhSx|m
z1xedLe9qrut`&G3VL~nO5c>8e;|hjml9u(2yXYs=jWg^?A>;D5k=~*Jw{>~8trf&}
z4;w?4=Tx8TW}UWnD`Ot7bG9kuVGo$^A@sqvBcXfa)gDQZYwWiA80(J}2F4@hAM8e|
zs7==K8Imz`6?P8^)+dTt%>P_yyTkMHVoDN1J6N!yeNyt{5!m+G%C_DN>BqeUhOl^Q
zz9t&!`({4_&d-^0=m70Q^F&Ol*Ya;U$#_-qGtg_Uf9%RA7P@phX~M07=UOg2&GPZn
z86qpPZyHm_=6n3KXjk4pFfLSew4r77WpW?D>Zj7O_6t=p>jhLlNV6#RdersUB+BuD
ztkG+tyVIrCetAr?VL+;~)F&Avswz!7O@jMbWkhR4gEGTmve=@sxFH=aquHIExtO3K
zj+b^<VrsF~r|Wi%m5Es)4Z(A!4R^g}ZoZ<E_PyW<ne}71@Jfkk%yO;&zwAn@wpTnB
zM=oDJxX$;yvyl59(KWJr;84L=sCRP6oYs3aS7^|5<z#7<(e2>5yG!?Mb(nltZrb1T
zWjzxI^i%UW4i5M|5qpm?7>`$Y`DNWkXD!=TC(D=bD+SDNGg@sBPBz30lu`{g!|9VC
z30gt{J?-l0L3M$`#VHZe5RrgnfsHH)@q?mNnM3*laP{MjRYDMf(>>Z(nVU|$s!!=h
zS;U0xX0F8Hm;==Nuxd9ZetQ7=vGq*)eLOjJP3T_(q!G{js0<VWl0OY+4+wPV=c>Ex
z^|D@EYUpnw>kLZY{2z9u>7@?@GK5K-@azH~IE@gdF8<fX4ZVsN13^0>KYJT&Q&ZJh
zGwf#{M9XyaiK#V-w#Zhx7lJ$A`^`;*pxR%Y`zmLYMHXS_hPKiU(U>~G!E4Nj(Gt(=
zRHA^^9jkIpKB_4h24#^s3f8H~@>=JONZm8%i`IYoF(p>M!v$d1n-i<A1=tmLB*hE+
zHW@CFY(wcUA#)t#IE-sN@o(xTQxdjv2MWP*6Syk^&5y5+7yHh|3(#Xe%?QxnE<~Fe
zs_@-NF8x~9>@xeRCoNboVk0#dF84~g#vtMPrG^JdhT4h`Q#_aG>LV<lNbuHqp(^Wq
z1sm<hxkO$_3P5X4pRY#zroWf#7kfm9%DuO_Y9H`8_~c=cmDukAZm~s_y#2<rs*RwP
zb#qm*pT5R%0yE7*-4PYM#miT&h%9#(hx=c54VdGXDL?nEQ1gD+c22A8(M~7Sy!*AI
z*bX7C-|?D&A<H!9no&JpVyL_CjoGiRC^=<_6za_Pj+c8|-aK$1Hk>)~=VFV`)cx>l
zPi7o0i}70dG=+P9`Kv3mHB&fu?b$-OQ0ud$xa*W@*|!d@&sVd<RbH$Y6}7(Dtn5|s
z{l9kQ{}y)T`TqfSWtg+&veMng&yy8TyPd6nHr{PLnyd_<alz4CHS1vgObFL<v1Ms8
z>yiIl6&L36;Nn&Dfjgh8-*&s$%QcygJo#LcP2>7V>*~GnH=k>Zv|OETH{JVO_xVF*
zn5)af<f|56K7X$J*zM}((_}Gs^!Z~Ojhjc<Rm(-zsrp_mH?Nc?%N6;lhS4y$#|2ld
zHttL{PIbFI`Osvw{bZ_Xp2q!I_f_ltH&e~4TJA3<o2-xOrdoEw-2IlX-v9l1s`Xd5
zyZ_Io`)5Z}ZRa!|fi%iE5Zg47PTM1xr5Q(iWx5^l$|LlmvJK?!bO&3H$1AyJn_XIJ
z0RIU!JvHDQAP%5hG}I(eIOPro{}<HB`2PoWUi=5@l)WsjC?~C~q@b>>fK}JjRaep1
zR=c5Z_@6}QP19Sq|4nq-S>C1KoDJ6hg>#nLaZr3t$`KAl=FGL{qTrlwocJg{Cq?Fb
z>S`b3DnRi$hutwj|4DSd^m6ijEK0#SeV#lSeWFAmIz66>c|QvbdFC<t{F?1c%)gb+
z1b?Lpe-)xXHag%bMeL+-ofNCnGFYAhb-ITrQLN73u$X^YomV|xl}EnPOnUW_f_A<N
z*KmvYU>%8l97%W+8TfCjGa@S1CR!`wb?CpK&YSjedcASxh4Hs2R;N?KO}~VXyNRa%
zRyt#ov;ToQQ=+}z+<Eo(<7}$)UaBQU>GVyvqClM#r86@#^It@#_g>b+SJ@9MvXlMs
z4!L;eIsB8{+`Ro<X9~_4o9{ZG@0U{8MZr1AMS&EbGo|=(dNGlrbdDDLMV0uF--ni#
zmQj?>%rf79E1iqwQ52suq4H&JWp_$d&~nx5g6fdN>d=~+n*T*~Qhd&`y8fSaQRN?_
zmp`Vie@vl3ol_0TLyZ-yjhR0i6Dd~bhvvlUmhrXL917G~+4iNWEsX+o9uYGd+es9w
zbE3VL!gZE*yzA`3S9a(8o9nFlm(|(dSNNg7xVwMizgwLX!<7reL<-mWZ>w{PRMS58
z;Xk>~W(w5#^;7-wr_Sz)#=(iD@rl`gTb-MeJ$s)!`=(mIPqqEq>iqqs`^RiQ#p<L$
zo&Qog`+v_3QlQTLe=D5}6aP{=C;q3>`Q;y_b9I`cbpBqSTl~LJ=WM<A=G<`8$DMg%
z2$avDxqfe{FG=kFNOQx%Dk<+qwn0nd&&}x?=lPMAre8bc&ggSK!`9}LgSAhk_eWb>
z{`_j1Jo)cXr=SS@{{?kE{O?dF>3=|-5g^1rP$%=HeM~O&{{wZh{{waQX)ym6)Okg)
z<U50u?0PU%SlKKu;ntmo%orWn6AhT~qmxdSyUCs*$#>p3+IvcmfESV->ees0Sr(`9
zgI!u3SKn25dUq!I1rvevhP20m^xT0&p==k7?1;ieV+{uFuSPX-I)_G`#cJEf>QNM}
z(~hEb_Sp{Rb3K3YA6jQgMbv6(#@;zH<T9u`jiPnd6aTx`DdmBU(W&;>4WVeAeVvs8
zjvej)Xq~Svah1qWw9fdbgxU$OLn^vzO-+i{8Dk+?wq@NzRSs%cQh(jrOr#99P_)iQ
zRu*3uoqow1@&9O@+R0Ke)NbmYCKRnxn1B+Z3w~6Kx&9cP1JkVYAe5?dxPRU5OPY){
zuH?pAAVpkG_b6KDw0iG{PLl($RPbqzfoL2tkDe=8zj5>e9C33%A(8;BRNWPHg-XR0
zD;rgn2vW38snN22!dY>W4##8hABaIormp=9;}B&M-vH!06e39u8NHD2aS+ZsmHKUe
z@NDb+z<UB@bpUQwmU&SneIMFUBHb<EDOV9^xhZ-rE?)r3b$)cvcfk_TmD_p7ZTU(y
z<Nn6ru=a)WL#%%duwIq?TRnUcl&}w$drT2czJojuBBZO&Jxj#nikC)K`a)DjMs5CF
zFl6Vh-|bWB^4?G$jKpTV7`IK@YOzkvUxaI<3o;IC2;Y!EGJ+BXkO+|1f+0ogl&Q!D
zXfHGqb^#Hpbaz9pCsXHN4Q9T9%{!nwtzT|F_ryNkg2w+jMYRJ;Zle1av9L3=bU;i9
zcK1D+?rS)LA6RS|N5+B{9H7%TqaTCRfhvc%_Nwl9V=|J&hoeQ`wE|;xNL?l8xkR86
zI8-Zt?S2mE@drjovE?`;lKzelacu^J6~=tc22q1v<VRZ$up`0B3TO*U4eY+rTRJ*0
z+C^k9Ans2V_mApwcII95Qq<f9?!?yM$1&6c#|Zi(PX^voEYG=G`zhcsLeo!*maM~1
zchno?FPy-zftz1TUj{wY+=~T?+<_JH>$)*h3Xnn<5Z`U0`L=fBf=)lFbSS9X64ru2
zj!4!kN9~RxAulC&>BMOo5OocK?1!cgAb0zMSS7_Fz1(y;#W}H_RY2|yfYCJhV;N=i
z9@@>MqdH*pYJ^^s=hAlo<DE$<Ew4PIKlKkT-Cjf32_#WP#pF^tz|Mv4u?*6r6SU-`
z*Pw2VgtV!(Rknv}aVI3TjC}8)kwwk$mtcVx18d=&y@yoyWuvJ!;)^b=>WnuarLbD)
zzGK?l8-R;t{4WK;3<Y;7W~T=0V+FFnq`YLfh$mnB`+UY;A&I}Q2NNh}XWbcI(23bO
z?rhhT$@BfESl}9++Ci`Wl~pmvmcyKSX0Y6$k=FCWMC018y?1UXRzy8FLW{sU|D>;X
zc<@UGOSq&mu&g73J#l<<vNLMGZK9=NyV$?z30X;{#+*h{F*8$NLH<uEIo2CbOSZ%U
zPgkUZVm6(e4(Sw5^Huwu1Yn_w_j^TeNcsWR9-8>L7~jyF{dg{p#0tj8Uycd`T?2p5
z2mYQ?w^fRd%O%$fr@m6k)eHtpN(bF<=Da4)b?b)PXTEH5;2D{2Qp%>ZpicNRb$8QO
zRmCg0z%MDD30E0@(~F1I$9!#@n;Ej!dxYON+wm;&oS`&>_@A*S$=rWtB8U{N<o00q
zy9h-;dsf50PtxG9)N0cUE{iy`{o+$o+IGhH-FB<#UKRNRPTGs;a5*0hVB1h;{T6uZ
ze2kp>z46{?BD5{Xk8D^~`t8f_XA+K(Le=*=6{Kz>0u6r!)=9b6*y<2__;MTDGug3z
z_MuU)%qni?DC8xH&EhLQPC4pg8-7v$T|FpXHCd|O(+G5qUBc~O&`v26dC&fKE4uyt
z+Ge!1wM0+HmP^vFAbzJ3Dr#kXcrCmZp~`R!ISjjQvd&p_ZQMj%gxe0@YlieOLpTGz
zEC?vxyzd7Q9F(89pVRc}kyepHm&OX9S(2esN)JjT+?i78k-a>6jgU1DJ7jRNlvKAV
zecOfo8KC!P$^Pv_Zgqk7$udrKL!+GqH&RZ+NE`G$H;}91wnNsRgg#X;J>Ox|BwMMz
z)me$+<Qe|eIf#0|%o(F6iN2yT{H^mAa}?Zj;A#D@f_8s$h>@TITJkUFwXfTGZwEj|
zxwI;7ZR(L(UBc5qKAv0hnG-J=ywo_3jKz`M9&s7xk~;M-Q*V5QBO7NKKUDj=><Pby
zcZrR7%<K7ku`Ryn-gu8uiMu+=r_4O;uLV+`cy>s$?X)uVq;8@!H}*Oh#0_I5m48=@
zoK(!`qZ!DMs2mVhUyajh)%lgY&gq7Sh!x+1vx(ROf~5)W!L;JJ*_OLvHO_25em+2f
zD|V}^#5PR^A{fExET3-?_Tn#PnK4^FJm%B?Y=|a<!XNAI0ta_c$Cnn@q}{Y$WHM75
z{Y4j<KeY<pT3QRR)mWVy0+yLdZ-d6DSLAjMezKUao?%+f@h_a`@4tRojhhXeP<!nv
z_b5j27t21)emKxtP2J<8O?~0W--<OLy<~m+IpWUUc7xv`j3j*%j(ZWP7tf&f;`4n%
z1As}CnC3Wj!mQeN8-t+wdGv7+@_5(rlD+93o8Qh;C)%6<h_TS#EhNwkweJzgAngK2
z1u+H%F+M|XlLDxK2;S+J0&6TTSYhg5>iu1?4v}UF0KcSwR>i9*@w<<8TGBmYY7t~f
z$6%jb307g};*&$`5H!+>G{!_48!~i*NDHS%^DQx@;{_y<G}6zQ_6e6wY@i-_uBy{v
z6+la%7tJ=#jC!BSzDv74?16RtE0<|zT!i7ihXpkVRELoQCR(_rhQF9*wj{d>?}F5R
zq90=+{t+Oj`tXR<2sKm$+*UK{AE+~xImQef%l;44smhP&B1C3RM|KfRQrV+&6{7OZ
zq6(iy6{kkMua7F5j;c70A}FwLAcNV)5cKRQ`g%lTeRPOV^jb}HBYSj*4u46Ysxcsn
zV~<MR9@#|<qf^6du|1;l3cRU~nqWm=QHc36&HEQ8oWE<7l8RC$#Ly(z(gR;p<-pT-
z?ExR;XpLVp<-~3k({I<mK04-oy#i__Ao5A-bq~x`cP|H!Tw9kBQ%FjwHuZBR8j9yB
zNyaSo$r=Md(NAp-W#e0x<t@h1V+zPepRW{$fpR|!9uqE_g(tLrKu8j4WS$`T9NlyR
zK^thOB<2}o2gC09f%va_&P@;G3LXI(OS)>#sQ#2D@w35Xk<Pw7=0ftVajGl8H<+1P
z4b%x8+CvgODJ6x2-k1^Jrn(YG6yOm-^66^25LIHCsU(Ri5)&yGLZy>2l734GYvba|
zMg|de`pluA<Xu4xa}IeD1XKkRBO_sWFm(<X0swNNk>UMF9s(Ux6~iC^m7Es!2}>uQ
zh~Zh%5s_t(osgbCH1N%bmv#tRCAmVF_5XS(ic`36=5&`%n*F-#BC>DJ0_|I>#aj|F
zbfJ>fCpTNvCC<mLHJHB@$ul>O2lp=DlZprLdW#0obBK|EARDT%8RUu)5{6Ets(J^@
z0VbY{pl;x(kj7a>(|(Oqs)wXB$$S_CNWMXaft##T$c$@G*0{x?UpI~>=t}JA(lsz?
zPw(5;mt^ocdR5&K|3pRr)33HjEA`uE^38}_AM)v-@sHzgO5t;;72d^;L1@uPI68F&
zN5yZHc1EBc#8GjQAfXMQSqyR(0GK7blTyk9dFG0UB7X<c@)H3|=14EfKnLNSFZta{
z16<e%u0z2*Nx)_@LifeHGh#kJIlo{UA&dnD>>9OCNJ(Oz3L+mp-lZ1~l<?4i7>*-c
zX3&4qZV6)<wrZp<twMRc3mrEQfw}bEUidYT>ite&>!jcz0Mz-W=+S%nmh(hmCMP7z
z0I-x%TxVB4FYit3F4bk)+(a8dIf3EAdjuRu6@|$?BLiRrY9<2RrU(5+rBoCEfI<RS
zNbf5*5V?Bq3zdLOcrXf+Pn81>Zver`2>w7?5D@U21ccxL6q=-G0KkKzg5b*fHV^{?
zWh0RCf;A|LnW}AEs`-xOAB>a^MkMXMTJIv%KbW5-FUC$ocq>GLecyIPNu-V_;6h)r
zR{a<t?WG~_BBBXdhG;hS0b@m-PeqZ#i=uI4q4@8JF62dFf@CIy<5N1#=NSkHP3KE`
zSCme3h6kH&AW-CY^$-A!XEmt3ig)%MB`mw>h~)Grr#&aYdeh6Wky#)Vh!u?l1=dWx
zFB5ahDq)Yg@mZh#QMBmW2lNSn)`A8N5h}F`Nc{}d-rLt~P3#?<z=)HoN65OAbpXXP
z72nJgy@7Oq*4bvzsBR)kosh`D)S?&kilqq6!I~aXy1Nj-ipR(2&b8&!QuPfV{((KQ
zwJSJ)Oe1_&w@xg&`WaWl)q(oEPH+nBsR{uQMUkAFh(S!QJdWx&9;his=ic=3H|0?!
zBl0X7i!vI^jy+l*)ic=wziuGB@PJ~`)cDdmT2g9%V|BY2vT3&Ik{Ey$Q$te){|ELA
zEaP?tnB(jJ1$%y^#Q|zJ5T7hsu;-5Osf?C7i`G;AWUipryNyUyitGtUrWtGPg|w;Y
zwaq)Wtz@(bu!H<4UndmVlTlx-4>&=Lh!jxI5<tf$8=S?f2_<I$LANWb;KzU3Sidp@
z{oqe@B*&1dtMS(Xj0|u~&DD5=Rje;SoqiREX8YQ48H8R%c1kOE%35~H`*kXCcP3+0
zST{RVn$eidPIcujP43Pmfp*o*uD`}z`d_<b{T}O-b(wtSjl<GODZ|W^VNyd3U&&qi
z+zjSlyQTadUsLY3kKx6LyQ>m<q=slL$=xz#^a?|?&iWuP@y^G{I}XjgO9?&P*iK7W
zuXLugx+V2f<<9LuYUA^v-k7gE{^FhU<eq$FCuNYQ(}Ttmr}uCddY4F>&fS@hr=Q2b
zhGk(>9`Jl3jTVts#-&eA-*@8<awia8JA`0d2-?|1{=yEfc_3b&4(9IlN&88b`N18&
zgCa5hJmSWTEDVB}o`>-e#eS+}qG2Q&Dk|PtVcGfofwVoD_9cmKjY4|jsA;9>lgP+k
z<cMuNJ@IrTD`<EX?Jhe++wG@a?Ew!U((q)C&aV!UxI06+J1>ABvdzP?r|DoD+GQ+i
znc{ik29Z+GZP+MlIfs<~sEo^~l%KX#^C+Oa{S*e0(l-FT9N@W0XSL7p#jj6F9J)>P
zqi-jH&Vv|w3E*iYqy~*762J)_Fi;irB>_BQG_r%FPoRLFfg_U?&=W&{orfMv@jQ{>
z5iFAV<=8z}jt=ooZr7oJveDDip*k!Gzsn#(1rgOGo%k_K;JfFspd{{2@Jo1q$7Sd@
z(isMNlK|F3(%&N^lJK<M1aJl!QHZ9UCc}D-M(hdDXE?}NAVUOt=8QZYFEJBAqMOFi
z&S8+|Et9!C99BG?!@;2WT?461@ad^g3rpv7R@#Ti&KD%thZvY)Fi4d&5T2>#{TwOV
zG8JtEx2AY39tiDSxbMs9dw~p8#v|EQ(Dj(<Hw@p-(BFRJD5U2M-fArG{O`Azh2B_o
z292#D@oSymZ+6bd&#e*}R)2h+*rj^9H48(1t-(N-NpwB08G?QwGCZbl?#_VrNM{6S
z0vcIp^linGoPa@S2SS?&&=Cn_4#OO4EIY=J;pVvD^53E0vUV<&DV~Gb=QkIQ%jbJt
zsrSe*?f8*}t-%v4nKqUT;hmt{rXhOFEa@-Iy<AYCc%Fn=>!CS5$<At{c(~2HklWWY
zB)vA7wgx}{3qyAkPm>h?P3_vZLZjusfy*>mBV7`-)`8G(f0yi4*kzf~)ueXTE;yHX
z$6hCVy$dd!iQ7V>C5doH6+vBVhF|1Cx&#Dm0)p`-DsTi5aP9`V=D!lt%9eO|FXkDV
zDw7CI6ox5xEC;V*4vB~$u-oqXi<gYV-F2h6wL<@m;;fDLts7-?8x?081m4YRmCah~
z%{u?h`mD{y*3IU*&DOI`BJWm*%2t>4R*(NyU)I(@>(=u}TI$y&6WksE)z=w|Y=Ps%
zqzCLtvK>%y;pqI8F_m@M)E}W$KOoAE07m^$N$5hX_R`4KXJ9AcEzZUNHm5k+V?=^a
z94)55y_|&u*>+$04qC<RBpdAvc<lfacg`f)MYwk_iVM?RM$=tJH~n3K!*(W7U0Si7
zJ9pT*=l8Ch?uDTC1@3nWR_>8(_JvgY7<P7TzU>QBpw7Vded+lfQB@v8uLIf4eaz^=
zHN%4dn*-^c1I2l6tZJuf;1pK!yY6|rJ|DZ<*`YS~&+Bd6xAlLn#<Sn!>x>xtX%X;K
zjPC&JjtS?Ny61ir7Ibv0^2m0cTQgu^`~JZL#G&^No9E?U>gPv23BPy(ehC||nJoMY
zX#4e2?N|$b?5D~dak($*^57b5f-?uvi(R=jcKihcSIj(-*+H^!v%TIqe${r|!4Jiw
zp(jHJlrQbyWLO4nhBFAhxXZYPL<j;q#{hjpXv*RTF2XY?Z2ci#?ksgjo*KcAn&_L*
zYmbBe=-xlgr=Xx6qY|Suk_1F7BkETmlyIJn7$HDw;!5X`3v(W)(}4^h0vUb<GAt9I
z-Mg#302rwC?8o`p84<D61_hm=asaSw#Q%ai%_oi;$c#U}YS{ayUh{i&lS?axSwbbI
zr@LFlX#(Dw5gJQw@};|7@nB|r`9`YLL%4oD!A3h%(dWr2yVuIUpw5f;Cf1Debt%0X
z|AsmX3<~s&<}SdwElFcDEJ6ik+~0vM;e*LUKcc`eB<v<1Mzc^pZ6F*vny;TR@KcT1
zX}rR>TYi|a{^QR5m%WQ_U#OGjt8^0xEuAcecp3L!=o_D}Tuv<UI-s^4lohkS=1}9r
z0{yw|Fw^!c_?^PJ8dZ$ETjLg~x~F`mM6bQ)-6yTm#0tII|A)G}{%SJ*{|3GS2BW*j
z=w|fj7%>S6L6DM?5RejSTo9ua1QZ06P(&I;L_!#&BqT+oOGH5hMJ3(6&o|C}?myxF
z{W?24=eo}IeqXQm>-BsT0(mZeMrUvrSf&4ZHc=#Vsi^t)bMD3$SH6O#o{wzRy-*FV
z@_Smh@J9M&9b@;qXBeqH=fB6le|%nDrQ8O9Il~MKt79SQP3#U~MzjJq_l=+&TN{FD
zJEQb<P((sQN}bs-E|oJNzzf1^jsd2!xD4akICTY^X?Rf>Wiw_sLEs>ZXTZ7^zsi<K
zil9BpE1AXQY>mK$<GhFAjoU%caoRxb&1E8ETGBWYtXOGT2@v)X!QQd~7KN34^aH<}
zIw{4GveaW%<-L6|UUiP#gJh28F=dQWV9dQ#4*eXJ6c*nnMne=Xy)h$G<CixN?J!~m
z4n_^~v-IQ(s^haX8uP5_hPG&~C<l8>bw`IfHAlx8II8{abY!~-jghtH9;?Mp^4R(?
zhkyP7m?d4;ZqO@e%*dG+|7prxCU4xrf}=7yBDu*kARo-jJ<g3`vFVyK7YF~=7#75#
z#HsbdDan$^L4@ykB=7Sl>;@NeG2Ajg*AVhNICo`p<EM<R3uZw+Eh$Do#hZ?)0=H0g
zaN%PkZs&>IluYv*F)=<+_n0k*95i>V?>$S!0)Ce-W$oVgT^o4G_457ubPvL(2lFgM
zS}O1P6?&OH(7Xv;xLX{VB+Z-N=QVIQvQ;Z3w=&N|o0p=Ktidto31zEf4;gGG=V>~7
zY3|l5d2i)szB?eZ*j&^y<w@Uzrn0%r51eFs5*M$CzLYx#LHOVF?zn64;b>6q&|}b|
z$h__|J{{h`?UJWb-mU_Edxb>Nz6q@q)}VI>$+;tohvMHJUUEwO{r>gjbz_+OXRO~`
zP^cEa#oi2qL0<gd^XN4K&p#1}RNMK{qU$HmPYwB$^1k;kpPOV`6s~V`YSDWQ@EeRB
zlJ8W=7(e8DTJ$D%*Kbg1mEUYEf5zT#ZXik2x!=~O;)q<-W8Lua$%6zxUxmoQvf^d=
z0VbU$<2Zk@{)t&b*tLXpXGPmVw6^)HOEJbg(i^=Lj<u&u25S3=4tiR-kvYb$Z1Rm#
zRkQboF&WC%PuQQKJ(xm<I|6pz(M--<aQ2Kwi)@SY*GG`{vtmrdCGFC`kuqTTqkhY9
zQ<la)sD$??(020;!MRCOq+&((#!esqrYEfeo~>6Q^*f@_hi7|XV8AnskZt|K14)f%
zGBX^f1{xChM{eB->%s*++TDZ`fX_~Gwv6Ewrr>Xey&cV2cmH%&!k<UyhHoM0FQ80C
zeaqDinkG=5lLH)hRwmmBJ4OfRCsLy9&q~#O1ixJZFTBeg3AeIg426oU`VqCIX)hHD
z9+Q%#a|hCf@p5i4D@cNt33Ebl`pgqQ^?FLIHEvi;Zuq7jYbD!bi&C(>&er-@6@R*$
zRhLS4ef@Qozg$FxWb5Awz_aargvf5qK#!gn>-{LQx&8gc<3A46oL3iH!uGg*5-WlG
z>vM=gfDyeJc1P4n%T59H1$ugjH;NB~q{Vp^2o_Z9W%rK6@#h!tsN=c0FVNi4IDF(0
zR&DvbEc3?pVbPUXNAp(ui=`{J+%CtQ8rg9UPb9e<1)=`7-CuOCpjfJFW>PNH$5Ek9
z$6D8c8ljzEv<<0_b&`(NDZScMsME3DTcP&SvWw0Vj^mPbVl9)ql=ahX$Hw?iL6_!x
zfpT-|#Qfe3)a$p}NCxZX%xl3uLZ{A@VcE8NZF)LQ`Jj)7>YFXapMw4M;y-2tlKCqo
z>L)Pq3p2EvFgUBJsJ;kfcJOlBi>DzWX=2VxRqvj)P*wPdAaqkxc_UfkMtF87J5QKr
zP0zqO8Z_!gg*v6=TpMoIXS#m%_;71gej}U;b?ytR%PmNR#*W8(99B7X*Ns}lET4KD
zF@$#QJ`GL$7Jv0@n}_%<JM{MX>8jnhQxCY!LEdjNGb6-^R9S{m;_RaFY+>fm3F8yz
zOrU#^4I)DZi3rB<I|`n7ve+Mn+rR{G&S&j<Aj$AdI1dn@1|T)vGlYN)*V8;jK`a16
z`Rn&nnS7FIfMIR}w^)HRC`#`&dD|8y|23Zz03VTSxL3=WdNdwP8gSKU&gee7hU7^Z
zaFyIgiSz>4I<tVNs$uCkH&xlszWmR9e%>q2(hUQM411*iVmj5$mb+azCiXp|kSQ_1
z1nxUVc-IJp0Ip?u_Ax{k9%zYp(V&<9AcEczixKBJfq>V;pLb08r;!<pe~uC3Scv$v
z)mJA2W_A|7G(=kt46$1D{-NK?i(dsZ)i`7Mqvt^cnR}TEPrM>Hm6N$HTIcHicr90>
zpN7mzykjR4!`Yr{!oO`5<hsc(#-C(ZAQOQDIXs*?R=8QQe11boDQ@}q_%BwKJ|+gh
z8juzMKn>>ppxHTHq<mgGY+tp?RrAyu3={wXxF@MC0a{d9)R0!C7sLuT1kihG06Y?L
zPzP5a2xSO>gnZH&0s&l-Ftj3TL3Cr(%aPc-=H-ACpEE(*vey8p$PR3$7<jHf#E54G
zW?B}DMi<5mD0v*x+Co60C_0EXfU3py0)yEHhb<KYtauFpz#f2ED*~V~ar)+4YV_hV
z^VQf|_wF1(?@Rc`j@oHEb<R5lQ2pjhtIz4$=V2N^wIU;6UVsBoNUAAT_M%03(&=~}
zYo+#vXQ-9!J(-JqFEFW2uZtCp(*FxeRm~=zF06kv>-@~t1qK*a><g_8s)?5Y!bDb9
ztm7%e+`f-+Z-=y}b%<wMFLepk2EJb%=?rOve}qpEJPyZEhBWgg-y*3+vxp(3#npd_
z`y86zmkgBl)X#GuH$}wQJprcDO@Iu}u5rRD2q4{)lJOV~feh3CQMh}Ywx$K~0Un{d
zVYW?W0^K?sx(WgyFv<W?+nH9aJR8(i1q5(6f#@O1^lntN5*Qv&3=q)Fe1U@L(p^XE
zKd;n=1^_gS^w3B{2n4`vrMl+>1d14({(Q5)YXs+1VxA<OY`nJ9p&J~9jtg`Hh&{c(
zTBpER7_kpl)&vVMDB15BB|~o<^(r{%0*C;aF+f-hbh?tr;E4@)#&YzhQ&eVk3oOAI
z)u^J*`T;W1D@+YA3>e}w%0M>p9g#;YNn1K;be^Q1%(ekAS(=l~3@~IsYG$wk0i1n@
z8zgv_iIr8wL1q7L#EUCrA|0z<Ry6>e(_xg~lNQ#OhH1Z6Nlb;2B5MI9!^Q|XtPm?U
zbBz{&#g|Bv1xL{U*3<?Oy#fJ{`<YIEF)sPEKb4?%BLF2=Mx3p@3(GOhpoWLVK+(vq
z8XXh88B>pbD4X;^q_Zx@;m!D_$ze;sRj_&VUa7T%`In!aS(Cls$fn44Fe7Jb>Y^T=
z1LqcCs;Qdn7DIxR0jQnMa>PM5X)KgC#SaOQUIc=n7z!!@N;gL1l|b|;eBGmy#)t%1
zt)=Q5VYof9Znm2ASmQ?2TMu3uDoCmYd#g5_QZ`Bxg2bk&L1<&NF!R6=OWlkxz^*__
z-Y9)WD|K88*{o{9w%3&-`1YP|T8Q9(X`~qQcQEr<HKkh#=1q*F_US_nzKW0XH0VlR
zLwK3ze_^ZzI;b_4qRwGEtR<bNmQ@(Ghy%+ML@OMLaw^d}($NG!jl!VX02Bbz)lwut
zPMaLEanPfZiwxM7z+p`Q740NLN@g@6<m4U*04lA5X2llGXqE0;l7jh##jtA5Z=m~T
zj5=dQm&R_<YXh4=j#Pm3sH^4Bg2K#dxi0wb5@K|9te%+_iwK}DlPNeIx-epjXkDR4
z%sa<RuhLjkZD0z{dkha=<OCMJ3*5PAzlaIQr1{lPboPALFnKX+hX%UG5VCX83u}nZ
z0f0m%HnSQU#V=CMCb(dI=i*9XhHsd}UpQkSY*_uMRsf(3ur6TxkMSa)-WE2_LY*EV
z@zd-EHw#H)8BrD%$&kI-N&0SEPHVgBVOx$6JDx;4=3N`EQak=cdhQfE!Erkw2_?RI
zJNWq&u6;^~sY1sYK%G+f9ZzKT#ELm~l*IuguVL9==2s`k{qdP_RGX$b!aR6Qpc4Va
zgVPW>fG4N@9;`rU4uHbOnyP~Z{jvf}7hW{B!oud?A>2!aY3%h%?GW9U1S|+36d*CO
z2P};(AS=*d0KjU@2?h|+52a(pj=*YYkXV@%5SZ109#aZq#b%R{!oObAN$46$0A{+t
z#M4d><om-X#PrJ7nTMBjpHAx4JGy?mbfvz0n$xteWVWNm;e3n;j&aD?dHJelRwmI3
zFz@i-$|RUo4FjEZE~LfuHZeNS`LU*|5ow6zE;&`~<)_5(LLi9x7>~ctczem!-HFog
zc$4NO%o#xA31C~JeWIg^*|CNMr856V9L0(+zt4hdUmc*ou>**8$I33^=`aLFTPz(?
z!>bxVp|J(r=1hfE&!<`wQoB3puqvL86SBcnUHF{`@0<tbBNcHXI!@EYyhOwR7zrR+
z41gZ`!7%{<>cXno0)7{#ra59^0jAQ}X;afC=XO0>qGO`(oI?UOBMKmuNOVSGAG&Jy
z_7e+C#v`#PAggi-_=B^d3QYj^!ZHrf)E6DX7j@0)6_aIjq7!dryHzP|Qt|7zYF!PL
zT1hXAaRX3%>D@9_s*Bngxr6Qc^a{MsR1)a`TpRGf000<lZYH2;<~8*|L=E;)a8t83
zrH^iZ7QnjfTn4zr1uzOi*=?nIh0wA=sc$8>m*dbuHwS<Sz%r$M!X2AAtVsb)qAcrO
zfVR}DTdSTzJD1yYEvHKimm-5{n<D|3MQRy)s`ag#^q$VcT^brFU_=7@jSQthet3D!
z)g{sOuzRxI^g~|?I;<Dcc};hwp9FKhKtGvkhXnL+QP)jk@9zv6+jqCvl>4uB1=>1P
z2{>Xz07tHG$466i+LzJ-06+EU-o0D{umZ!Xdt~ac5%pLG-i2HA?naxmweLH(cT+ed
zQM2C$>I9actXMf8zztqHVIQ21vjZ*qa$Ti1Q^M;6x62t&9m_;Pou^Qitg)fPCFZa(
zX5=gwOQvmd85q;fbz2W?(#h%X{dujZ&H5_x59#;#dl;`fO(BpHGJGLSsPj!Fc5Xo9
z{Jq&fp?UOg2J=M}TcK+IvMw(Hj~#VrmK*R&F{S^$z_7h^riWeec^k=lxde;lzHEPA
zaMiBb;NA?X+!uZ7YP-w{s3SKgM*?^k^?Yeoyo5ZiMY-I7x)xD?Q(-Fo)2p0OW!il$
zxxx(>kJ-L&Ddnnw7X$S3F9sFc@|Bo<e3Ckq-@QkOc%)rgr)8xD=3w9CVdoQx0n4lZ
z^wKE5GpNjHk|n^)aA}#!jJ6YUGj*xT=#;?Rq5KvN%GZo(Lo%p+JaQ`wyOnpz3tZ+g
z6@;p{^rs^_W>FD9XIo4);NSAV5F?frx@IHj+Z+U-VA}>a73R_f-0R1Peeb>fUbu8x
zzH3p(rV{!rxKaaIf!UecS<bfGLVhRG+dg*!qb;{}N@)WIUMuWh3%I`>pihM~Qv-Xo
zf~z+11H|yM(eg!LxZ)6%84W!0_1kq(q*b54)RRi^4<B6*&Z3!F>gtOs2_^g2FORa2
zA)sEpJG$O@jez7gm;Jiu7<si7&~BFXpO^&FZ0dF*OprI4K(z%kdoOza-W-eM)xrlO
zYfHVoSaqzb9nymzs5QAnMPdQ00S^?Le-#9dzcG0zJpCVEv>lrxj@6m`67XFoV?bp>
zXl#16WB<LMd?es@*DHW6Kz62G&Crd=r9;V54cdP?4;nWAk1k5Y62`o)K6;Jj2Bd31
zcBr(d2)4-QvM@CswjERFioJjBYn_A%z!S>|bstS4zPzKCtO04ZoH5N#p;5<T7gyAr
zXJKJJa<k_3a-FX7nr9BarITMpi-Ev00Cx`7^nI#WcYAprR)+TL+vg6_lO0rtw8~6K
zly-0Q9kg&In8~U6-O5zpyrzvhmKoJaXQ<1-n*wMDSn*!Y<)+?n;&khR`8Z&S3md6+
z9m=Y6tnc>lbeW@Tgw<wREzFH=LLV#*sI*oM<<>!s1@;Mn9Q4zip=+krs@J(Yhi?Kv
zYa`DT0godAcN9B_syiyeG?aITvyfiojd@LQHNZ4cPsjiuh`!PHbR_!EEVytXZB3az
ztfWL^Jo^;MfW!iZJLvW;-AugS9B#8Vb~$6P0-a&7xBE<uhm^1Th)=1`yfm=eQ0pIu
z_kn3{yeX|lOF}!7;lvd7ahfl|O}^vAK$Lf1UerlIsxuMkoSyQ{&4yrVb3%-A32hqu
z27qtUS|K40l~6BiGWijUXHUJ3$benJ;e&U<mOXz=$TzRER6Sk!QxcGBG_l2h9c${2
z4xOO47`hcjQ4BGN7HPp>z7<{4^u^O%$SKn%_8IZ!)#xN11K>Cn>OA6J{+px}(|tV}
zXA_gMY80dyla{7LfoRpGP@&G%mU3f!+QiYnliJTU|A9K0U$Asd$K0bdl%F7Ss8Hv#
z#>=@W_io4jn3n8yiGA1@`;%X`85>)w)KI>FD5k`g4b^W&9G5Dcyg8BM**PksLY*w4
zB||ZlcjLP6rS(K`6{OSF{WsM4Bd(DW*TfRv43BS7ihp4c-)a;8@@jlrX#A_&@$Glx
zUq6oTXgqCr2Kk7Kd%ha~v@iC~aeOaJ0tuebr<6c8Na(jo7zpL9_#8iEE*qPZ0uBd`
zG$xGpB#ccYjISoVTTS2`W?<h*ct=TKHUv%?BvM1H-d|0e3r(D3fz3ppk4Po5<|Hom
zBrZ*yQ<l;am!2gqQ_kP{6LN1SY`n59c_wFR_o$-7q~-&|Q~#o8L;c$}aqrXrZS*AV
zDM614h3?z^i!Mppdd0c>An6IqZ5SVA&xW$QnzUNM@`Gj6LHTy0?W6Uf{-aR76Q|qf
zLrJli20sun5=6(Y`<DQwyZ(>+|AjgSvv{5(&g}MmNCbNI|A9K$v?BJQKc8Y!Wd955
zlzdmB9sP6f%P*<PGUGJ%Z!!}!bUafY47x-Uzo}~b3-;)md>K;VrB@LJ&gx(6>#W&~
zzg_<$ztDR9Lrcgm73w7Z%)!#gz!3M^<D!JEWnsJS%r<}7AAO{J7`R%6qvQE+sPmrG
zrTemXt?eync$~h=^SpqK-#Um>?B0*qeo$ilzfh-o1+!k*@8GvDza;dRE*^Yed2;)I
zpibSOpg;8qKg5!|=pu}ccC^-a1gl_m@7A^d{1?=D)unT|YkQsc*7K;u#XmmgeT|_M
z{eNd#FK0eHzW<2@^ZWBvCjf&pH;!JmU4*c?EMZCT`z^tXXJc1K_;6ouN2CeGRj*xB
zOmKD}iam@G&5)@Hc&IA}dS8*LJc1I-R$qt_yQB5BUF@#j$&px&5rdX^t|@=4_`M6V
zuf_AMwU5Q~?JTq;3LITxCGKCj{#xRJdmQChqR=ZtOS0(N!&u3Ofi<rsi~oOvI=^-*
z^_-uaD)myc^pPYQfdph9y<8WP%%pRM>}RvoRUY7SO;8@>3+hrH5{f@l9!6y9s=Spb
zPEZ+<sikzOj4E`Vsf;O)>Z*>bFD9tI)7tG)ozOcyQ=K$|>8VYb3M8scUy$ooo3Yk8
zSDUr7)Kh=&=$fcLcO|G>{eye_x%#|Urk=*fYsKR=n#ERln1+An`MT~eq*^++*?h<=
zfhr{D-^E0Zm@Hm1TQ3F;Ki;Wify}}dBLA(w>l305yz7JVNv<BNI#B{%v>LdH=1hZw
z)^9e-sekRVw_UQ5w01XWB3{Yd;8h+nj#TqX<|ZcJXkUo7nbzK)@4k`D`;PTTwn58k
zNWbJiPjm{;N<c&W{(HD)=5n4$Uzfq4lFga%;tzb<^0<xo9n`T}@|zQ`a<M!5uz|=d
z)xTwwP`!V412aeRerk4E2BHUgoroX2W>6DJqSUMOSp`l;BRZgh3Y{3hR?wnpQE_kX
z?pe64^uZ2Tqg5m|1>l2q$SKzJ)65)l^yM(y2cfMF`Z9yPnM25r`0m)<)mkej=%2mS
zu|nvn4u=Ro>=gKRhPWfS1{6rH#c1tG-bvxT82S$|C~l=}dV9%-djK^k-ei|`r3);;
z;Xsx@QqCO7MP|D0ZSatf$Xb5loT;jK)iJ{q1&bdyZo~{3s}R#%))Y86*Gmmnyfh8}
zc*T|xMD`?|vo6U05avHL7yI#N_|ui#JCCw3!Vh>d==mcMKMGC7lZJ92*F$4(gr%BL
z9B?|fho_mAIRrISFf>VqDy+WwTRPm~hT+cB&~v0PSA-18V`2OO_Doz&s6yA^{(ksD
zFOBH-8m+Dg2>WaQ>iQf1QDQ#<n_8P<;3l1_zECfiQ)m87dgrb!FDYkWFHQSnAS8N$
z>Cx1g6dLrZOVSg4>qgEJfVy$k7vGN;%O~zh1|-KH5$?6mfXupq7g8}1kA81e&?;n1
zW!>N`ljPd@xo^vy%p4Y*H=iP)81pL4Oq_6Qx7>g+z*1eCP-MMUt@|a=hUx1pT=)0$
z3pNY({s6*L1ui#{Ft3cokJ(kMGF7_gxh$RIUU<J9I>>E)8vp~>lfk90dtD5aIkE&-
zSviu%ZBsivqQ6owG~l^FMtHyVm}o<08Ahy_wI{`s40EILb;dCm@-e?Je5bm%$2vOK
zW`7^y(My)Uo=YF{2f_Z1HBAN@s40O$O8n)Ox47u~@x3-g;8qX_?Kt(}0`I$22R%2b
zE47Oa?SGy(!BVWkI~Uh)Jbm?sOAzT6qshzu>a~eXfK#R1a>GC6(&$Tlpwimq*5Hj>
zvx|x`6F=`nB){s~)>Dd`sr68yx}i+#L$p#GD=AChN54uj@ra*yPL0KTc4>BY+ngE2
zw*DZ_kjCP=*ONIVV??hb326R><Q_8<#_M6jI&V%_nfaUYvlFUJtbmrPlz?)<b5><j
z;iVkT4IpoJvV@8JUXDI7iY&Bc&e6KYk|<5OKeP`DmbuQLG=^h1U`7AP-**&0trS#_
z0>}PtrkAzqgR%Ny7)}kx+(jB$T8q<oWTj}8tnduQlS9gi(y8&Rujz}2%|#xr(E#4%
zG5EDLFG6;*ftwX@VsQ%lKZ^^RCL6tvp5nQ~yaKGQdvSa4A{1HWd*#4f(Z%y+8Kci%
z^;#Pjwo99@`Po@bcu#P0B&4CTuuuySc)~C8n>c^$-Rr#NELFV$rhfw+Ag5?X9n<~G
z<E%PjU0@dP5YSV;h^%40^=R44TUEEeeiokQeS&i)3Ow{=ICzbuWY*kz`LT5pB5~N1
z95WB;h_s$EJ&pU2EB%abvO7Iy{sv<B22^p(aK-Z!%_Nq!QT5z2bir})-cv|RS2JP^
zQzme8O|m!w=*%Lv28_aM;7{hycOiE_@<rMb^hNdPc_an!ezpUD{w>f+$QSo^-)Mt{
z<ESBX<a^sbQ3a!3z1Dkp2IkxC^A*zbDPtSA{0z+-HlKw@>oneo+^#?lh@|?SR&tM!
z!KSt0on~Lh8SORuM5Xz^q(>;-Y>9kf_sTr{ALu;zn;5;R0N#bzRf>pw6_5U^7@c<X
z>RS>;XAP`$MB;d}pK73+anj6^u!a`?8AhiA`I#N+i{`&ife$LBdc_9%iV5WL5OtOi
zEQ3G9-Vo_l^tZzAjQFf@J>4-8qa~$j<dnmlJwe~o%i@=OfH3zR5Z~}*s`f07C4skJ
zgntTZDGfg!lu8l^xEjCs+2gOtn%;ie;{?n6KCV}j2^#O#nG;Ih1RjMAX+8<h{GjRm
z$KA8<cjsj4re+1l@`Uc^0fV@Ny-Mkfp)|dAveuKwYG?Re(xbg8;WK62nGpPM;#G|%
z@Nofrd>DOFfAusM$n6H_n>9Lr-KVtmSod%>=*h}gt}?k^VR(QDU7V*>dmqx5pi?MJ
zb1RF6nIPxfw@13l6XPjkSO(b`I(GMz@fG==3xqpUK#WOb#<?=`8d(cNkW(`jx(Q@E
z^c2hQQ?ey%S*;QG2s*xGB~CA)93Y1$j!v<hM;p;|NY-LR%P`{kREz|C*Od~$S$k0Z
z1hAlnvA~ir`~5y-37EcRy>o9}>87#Jl7~<SUabktBz(c3oxpjr&NqjXSTfeAD@UZl
zB<_RYOTv=ZEA)KnMP2$tRg8pg;?>&GQrBTRXLyNLAeb317wlcMhSsnu=WD}BP;tVp
zjTbxKGP6LA9Fo!_w0KRrz(@t(oRJI$EX5$!v_?j%^_?D&6u2u&56PPCAUM)f?95o$
z-lt)YpyrIHW$sgIuP7TPtDiiQz)--N55?++338L7@FkGW%|X_h$GhFazYy@B3XjjD
zRuwQ{j*C8ocCtdUk3c?NXJNCZogf$BDV0F*Z3n9_;h7&I*gTEs=HSLFpnoC4+sl0l
zf@>oAh_iHY_{}~gU$mCuux37JzrfhQ-uL+$+4Po?nSQDs1}yD@U>|wHIOk(ga@D+|
z!fwG^L;7h_3HahIBN?Rl%sgJ$WKi6J+*pDZLmG)ee0&moq`h$()4mP~70S1a#P&Dw
zC1@!mNhDxv#$kZvjO3GVD>7Ns;7esiNeY;!u4`l^Mv#!1*yW2UI*bH~`4wHo&BQ~p
z66CR(ZZ^!y*9XhjI7}fkcu0D!krfKP#4wc}!(_Ay5RR3^C7`J$(eyBwK^~&13z9)X
zP`Y^Su7MV|Ir%!~FO&4zj8fCN{VHF{%NI;^S^Xn4Ok|KG1w)8IQ>jINsYMCc+Xe6L
zV)ErFM0eiA0E0$(T=U0Nxs~-JJ#iAOel~mHc(dgA@1_Z&nMxu+-l{%*Hxf!7!oEgk
z=`xkhVKcxoTNmLSyVE6p<M8+TFYEP-SKFHw;_>#tETiN-<t;^C?%4Oqyn<wVX1wP^
zf0KM50~TP>3#QvzM}>jWlfamqWWBL#GKc7!)5)67{<c{JqI0r*zoEq;S^hgg&LLT0
z7NXfs0YC%#OgID4R8+K@ii-B3b3pb@JIz=y)P!`S56vl`tV2abmwH|I@Z2W<g^F%n
zW*>N~H_J=lC!u%1QJ~8y+WiMY)2Y*tJNHdAJV`nClXVNFE%JRtgFhL!@08&Kc;u_h
z90culq|Ii1FSKv}aD>nyWiK@0?pgFd)#y*CFwLhfPR`F;sHkW!#=s3{Q2o_oi@;mB
z^04nhu?j>(UO)pPO|M`q9#d_wXAGCes|LT<F)<e3LL2B-JMq64XABbWx6uvm6Ahj+
zJ~S#-=|^8qexuy~!b~o4ysswrflNMH`Vgm?4_0(Qi|jCI>+Yx)$#uBc>CaO7YAyt!
z6TsZPex_k$crsAn@M@VxKk5v~(*!&YH0I1F-PiyNVX1=}K>c}qo=URLB(U$hq>wmX
z(#<G$8mEv?Qg<WWuus-w#D8B8LIc2}A|SvuV_o@VRY8J&-K1#F2c343Viy?%M2pPg
z_1*GhV%SoiC#y68+4rPn+;EbItNOZqBr5*c1e8$gpS+Lrki@@<06sS}5n~1NS@r8@
zf$72s+BuKqS-}z}Bq@1_OuiA{e4l<33Du-<{G1FI0g@Dxt2Fu-+P-~A{WkxHkaq$?
zSEKn%aQEJXEZqlIxg<*-f#xD`YwT266sRl@(Wioc?b!Sp3V6T+jLwpMkxybd1E`+?
zb<cnjOI03YBzd>Rt6vJnngg@BmPMtF#CPV!tBsW9jeqe<Yjg!SW#3)#L_btC+26p)
z>{IVmpRyV$(N50fCho1VNgMzBpBg`I)&O7Dkcf6T*+U=_1>V@<(pW;Ti`e|lYWynB
zB8(ykv@W1qfkBE8ZL@w<89?aB_}RZ*<7zNN6HW<>)t<-0=0QS7)w*GZj5#2NYBFjb
zM29rtYsbPwj65cR&@iA(Sg(GVA*U^pz50f!Et<y{Y!U<JilOe##|iei9Njn+3aq^a
z7PiIljT!yg!}E0o)zEVY6M;lKlXK%_r80`4Xab&?W6XHe$0d$85btAgBPi`jsT(Sz
zIS<$}hnaGE;gh7>_WcU2Bok?{`x$`U5Gs&k$Y)z;&_rSyrZzYbK(|5cP`rT&P#}yT
zZ{@kN@lBvnneSCU-zi~J`@py#FvQ&?I0O({RE~ZZisn>s&nG>Xd@hN_>K+pKPWxEa
zp25y=3RnO={`-p^3ELR-ttp5BXW^bozx<dyqdHCkI4!R>al-!t?^r5J;!+f|QAo~Z
z-!o2aU_R7`h_i&F9h5X6zmPhFJICnL69S*Z9o2k->LmyGevLrc4|ShuWlw@L0(2Jl
zRe|_uvoumH2Pl3@eW;%s>`@xaPSDGW5c+EH^t7s`c$0Ae=r}42&3Qeuh7MX*tzGs_
ztSi9u5G|wMuOm%zE3)SpBWM~rUn(-br6t=&)2HZ*7a)?M>Ok#)kLV{WS`Th&H~wOA
zqkHnRmn#R)bBdP58j4zpD<?D?JZUvB{K|wn$aP76qHpqSBjf>|pd`MZqz@7rZdN%W
zNa}up<QXIWG~1nm?UhVymHOelDw;XH#=dp-s=xEJAr~IBZk8URlabpVg!LBLX?8F)
z*f#&`4=LNgPbX9!({f^ttKjL+$}!ogabqoAW+T1G4t3zkb*_>>*9iwI-gNewu{h)p
z<8W{Lmv_{!6sw~hD51)RZOBUUhCJl2MdTxG@WtoyZQ+rDciCX$B$Vs!kM2J~p&}e-
zc=TCs$cXas!4DzxZ~9Oq3-Sy5uEx0;5-koAYL$-3!Ri$5aD{;-L=G=>k;T=F2nzT=
z{SBHBJbQ1bni8alUKL3sZ|)Rgbov!~HG)SqLNrb0PY5bRBCH80lY`Ii_{$ZB{W_<H
zZv7jd_S_gtzEjih__x`Bl^om>Y0vRWGM{Ap1jJH?E%?)ngMSV0`Ni+|+xQ57_k^IZ
zgcXcdClqVO4gL9DuZb4HMFxR1O-S%$b%7nyM@18<XL#6{rp(?mcmI&*buU<Zp4n`E
zxUfS#;iXJ$?FCxwzpQ(w=m~3+7$6*+-ND;C=&MzGD?xlN9V>RZascdgk2tPn9uXHk
z(*6IW4wCPuUDOjK@a=%9@wmTl*<63zHd=MdYe0V7t6$`1pPIIe{^UUP*S6jba$+r6
zEX>FtjO+?~WpJd5&M|)Q2VQYPh){hMiH^R|ML03ZjV~v#GcI$F_n{PwKUK3dE1GB#
zUm4_RcH5ggvJqnmz-!w!88p=!2zD66G#J?S@$CLJ?ux4mI=D?2V^N0vd=HM3+6P1e
zNU|uxC?s?9Ta~B|Bu%~flnn8XsV4w555YXTeQByuL|2pA$59!LF^<SbFk6CBJ3wEY
z0-}3@*T(iH)qt~>)Sok=pL#<I+WubPM55Qw?i?*~Wf1MIX;b10(=oEiRQlCZGCxh5
z!C5}Q?%n1R;adPnd<X6Qqfha(vq3<D$T@S7%SSJsNYku%zr`?-K;YY5!k#?7I#UDf
zfG&|@2|fmor`aeU680d*@S~@!KA+Uf0CWMy9j9mzrO^O@q7&~k93?Yh4X4Bsby+kS
zuxYyeSXd4~cgHA#41Rjac($tFuNcRZ&#hK#FX?>cKpw&{>a5?6;|VZoy`w4lDR9y}
zS)TeT(Zv&wp25lhgc%$xKrfFSOjp*cc0^vuGZY2HUxevc=z{3iLIpx8UybvDbW6Qr
zhtKc^GAx|`nAT7NSVQo{$#(QVW7{{MMk6;ub0ot6(52p;#DAvp9wsJ0%>aBx^z&_k
zA@A&oksFB%BLn97x3Q=W4L+)7L<_N!L~@e5^Gvkt359+~z2?zoB3-62uS=E)>`R0r
z^W>Gl_a)vYr(1-h=;#$EljQ=+h2iXGvk5EdM<#oItAkFGGpWQ4$Q_W0p2EQy*J1QT
z87Y?jm&DB@R`34gQ{jzBX`2e|j3-H$!=tG+{VX<xxIL$PTj*T&(`?A`PYM0}e}3F`
z^c?;dOQ}%j;W0;mZMp8>sKBkSm0jj;^I>wl<mc8FR*lDEgDDhPGalc5o^H$}D4?;)
zFrCMRF6~HqlXKK@Z}_p~Rk!x=1NBzVH`EU+z%QQA8PRYW9KzUP?D2~WdF*dgQv&SY
z_{@j>)=K4x^cyeMB8+{eZ7qJsE|oH<!T&>1DX|}E_N~z>OHLZoJ*RtDU2(C~{mc+A
z`t`;-Ih{u{Nig>3qo>-xPq)KYv*q60n2+Os`8f2df&E)>`2`MWmNG`%_+G}NM&1#I
z>m5K4J$u+2!=;=QJTE&B29>{#|H!0U5)S4~>PLPmlsq~}We9E3`X=O`g_IUnkR(;n
z_f{MF@`xSTG552Y3g()moyeHO*Z1igOma>Rw#nSL?bGBbd?8(ILxNFDcA~Df(op){
zGhB^`x8cqZT+x1ND+Av!={szGb|6s$pO+&(6kz;GLzC5zLql(0)gj5yg_MV~c{bU3
z^Sp10HBY}VqD*{D4^w%17hervyo-P6OdK+#5z3!5X42!FGU0O1pSt@d_WM(V5$WoV
zU51J$R=3+v3EBAhNgoWidiV5W`Bx?tA`-c4sqEJ6Zyl<y{5<q$_RKh_7<ZpM_*{D7
zA@NC>Hq%!h?%RiN!}7e(%R!T7rHR}N0Z&WsFI=zh){vBM!M(lDyMIgoUy(1Jrb%F5
z7vZ`-GB8AQ-8gF4f-s8!zD=CBP%og?FW*}!9Tp8hDV`gF8>Ky8W1p2r=pLHS<Bg5P
z9~))?tgiSqck^y$sjn1n-qCy0#_`0n?{n(Ek(>w&tM|T?4s(N{@sbJ(fXE7GIsrnQ
z{l!T4<MZ+*7;f}#Mpq{-Aw_fa&lXH!N@M%mmsPu<63$|+(%eEy`L>@Xe18Z3*=!mR
zF5YVy*BAKq=!ObZ_~A+Tx<%2=d&TXkf-RjQ$)chdI4ajlV853JUb5fEw5lM0IS?I4
zk#pNQ+%O&6LBo2OueO$s!A43VZ=*ge{hC1kNVqv}5b7T}ZKEU<HFqAnT{P!(bvbIm
zpQrn9R_B%b&G~CQrGJ;hd)$9-q-c6Xu10Al#!%LZ4TKLr7nuu3eIihV;`W~1U5VX#
zVBRe>|M+<2_rg=Ut8qUY8}<MEoQUp;|Ni2tN8+@S!IH2%=TI&D#$1C2JhEf80%>b#
zctnQK^keDIfKVE50N1~mGL|#tR62bhAr?V`LBf7-RM`fO&dL+Ww_`{{4XR;R69I8K
z_t90@;y7E&K+6AdFIkfrIK5y3N5)*-Ie2Yf1buu=AKcq8m1nFBq&aUylY~r0yLqy~
zplFeQVQD66UR-wzP52d?vDW=woaU$j1>>en*(Fat<+Zzl5eGQMGj9fe=iVq?a_U9-
zGJ#57b6LNsEd3{y?7vWEi2HVT!m`RK{7>fxH7lm>`q!<C?h<i2-1fKxPH%BlEkp8^
z4em#rpIRB5@u(+YItg0|=4k}IV~sugmzZnxH92=sV?Vhj3qQ%!A}s^je-=Em`XuYB
zHR}9^oh}HI#^8V@7(XG?qjIV^rb+aH7I_@iT~#WuaBIPR5dTWTHh&jAQ;^56qNx%;
z_3k3;P}#hqcgfr8&toqJU%&Kl=};0iP{bVJF;jBxAjSOk<HZEY$f9v8DZP)e*3maq
zg_gS{4W_<KL@Zo-1Xid<voP3j$says>VBrFDQlgvty=ME%hZ4(W1Tya_vC$+6o&p}
zI<3N?LXyef)HQ>Ez3fn_@h!kOkTPNs^yX*bu>7`Mq}Hg*%Flwym;uF^sZl3I$AV`i
z5_0aZhwPHL>b$rdfHQWNUp(Tf4|Lph`M7YITDxorFW7ba;^Ne~!qpi2e%Ir8!KvpT
zR}=1Ot<%7DjljLergWiMRS$&okUn=yZo!_fjO&$A5AGL5)^uK60vfTN>w=|RA!WR^
zS7sh@zie|TqZ{<R(@{13m=|m2GLFN!JXB|{bteS<9kFt_FY=Pa^*!vz$j7OOI<_9v
z_lR(l%NzPU9dYB|csI&GjQ#f-Q~=-keJx!V9~E@Y4ghHfd!1IfL9A1bKjKncQ<zkE
z-W(JtVM<0lPFMccz5ZmX?P26W`M1#vmLOh>O0)$9a2nGJ+me!A3M_s!R%hO>{uVMi
zvV8s!O(PJdknBF1>2c!O^97L15b!$tX7J{HA88yz%~vp6?b?0W0Qn5dHLz4WZ;#eo
zxclc*e$_Q=t+a0kIeC{>h2XL6uieptzF3_9##&{KRT|ATTbh8FUV7%bYlPP@CJ)bE
zdhY!GWKt%M)d>iGdlXUF*lBf1c3v>07r;EZ=dI-g9GBnzSt1nRzqrl!7RTLsCEU<R
zG)R)&+Bq4JM`o69-<-@9zLQJm9yq$)h83>H2fae1%f@(uFKI+x$paFZJ7Oj#*S_Bi
zv7~l5wATe}57b1urYJq5X!1!8;!^F>aUn;&VD=U4qgOg#*@s1h^e3CNID-TIH$SxB
zqqR`Ra#fgN&<h{U#(AaBf<p~7UNx?TXpeb;SnA5(R%j?Ir7}TT$~xvJ4PV3$*+QM1
zVrEDCv0B@Dsd0ZbySvs>wAl9+m~Vi4w{G03d62&6ZrT2E^*$=RvOeUIRbRv}l(o?b
z4(9JHxTUMT{6*3uqWA0Hx=BM(C5xs|*uz2&ULqKJrRZy6BdNgW-}l<L0%^>$zqYkB
zhcYCLyd#r&SOpB*O0HN3(`mZBbPNO0ItNG82DNP<hSCN4?e0Wa;jc%t4~f(MdU!SY
z@^0YYVO0QWkWN3Rfa3I^)7>s<PC3{Uy!mNh^zHH%7o9+xyT;ILZhLn8P+Pta@?Z@Y
z;O(Gxg{E30no9!<<P+cQzjReO6TIrqC35;fKsxOGXOEL%Klg9&T({;Cwp+Ik5%A8Y
zrGR%hng>sW|N6^+lJ~z5I73NlNcFGXU%bxD@!|bZfZm%cdAH|2b#k$`y-~S?yPDWz
z3}$ZsdtsMJB|UbwVy}{~zpeFgobG*g=30@VlaH%O5l1U02Xy+Kuy)|vQ8*>~Tj<v4
z<GlEMGeJqRfQA>xzbXndQnjR-c6Q>NKkR%>i6T0=)du9UT|X9Q1uu@Iva(9~8HIXm
za!=j?E4)h=BmpTl`{zh(PlQ!p8-nkiQJ=Rht$z+}&?IdrD_!K|k%ujHjF#@UEuA|n
zEiMO|IZ2l?3C**m56Yo?U`sbKLVt~wKGe3m3^*eQB)a%R&`;Q#)^4{o4QW?Hcv)!#
znrMfCu-dZb`JlEzSo(Ar(}!9n9F+N65cBF}+eQ;Z{P-PlAl+dY%aG;F&q?Ov$$Mw4
ztd+aW6RdnL?<Tct;Tm3>o)vI!h|(d#6e-4;)yv$ATr8pPGTC63^qr4jg~LF;DgfW4
zEe;~zaZ#DeDV$Tem#ZAc?U>7T;egALo+~_8@OoK(M|S%SHa@>*ZtGkgpYU^RE_X_J
zJ2Cg1!k^ovZ7Dd`3+?+M(T`>DyC%&oruy9omgULQ#~|D)ZntfuHobi|jO4Uw;>9WR
zZ7Hy+Te7?43fWDut=S2u)CyaE5nfdu|D)V~lFLm|hJ)>yj;Dl|SwyZ`);tPFR33<I
zDkJDrL?!O=m9HbXrr|<iTnqsT45OS`SaCik$vZfK6lzV2O{s<ig>Kibt<$-cF-rH@
zZhJBJd$Ora1+x!B7Mq1~jm{^t?r-O|czDe;HPI$b15@q^5?e%7VKU=JGDR)GQg+$w
zh?c4rSvyv_VmmpBOgUvwnbAqMwKbW~^6~>M40Gjj#Szk^>DIv(dAoi2nV&2+Fd547
zJ^A_;U~>+xpMlq}oF3ES83B^u0P%v#xmDN%B)!-iNbn4xfbTV)BQN$91iPpa{KQMS
z2H~s{sjAAx%Z*_7W06!LL1zJV^CDcF*VtLXA%@iu?6k%Q7QR9@@SJ^92Lt#rknb{^
zbmS#mjA~N?2P#EXI%)<5glQ3GG}2#SAO325bV+NGjoBr<O>tB^El*3iRwqPN$1+ey
zK~8rx2gQOxX7@5ymkHk#Rfc&}w*&kj5~t*^>wYB0GcWdPPc{t%`%j!+G?3*xhXCuk
z{<)FiIM(n-B*z$lSF(H|tO8ya&hdsp;S4COhGP$IfvXu|ZuT=W&%h~ujhp%nKI}Wf
zp{ks#xq>&|j)(@eoisxx@0o_H!msAvADL<P<2=8?X+FVf7VFTIkk1`*Xy$$sbFH-?
zi4(Kh44EU%RC6?DwVFLvGk?I@Qpb7W3a7<WHCcG3<rPlkKnA?8nco2?WphtpS%mc#
zg2RMhbY9MXtZFkt;)BczoRxFCkvZ8NY>scTfAvM)@-hww2{A;n|L}*Sdf~lBe1q#O
z$y+SdIHnp=^P_V5Gp~zbMvRPooP*2)%2h%PPz>%S13njX${>S~);#~|@D|}%9PW5r
z<7l_;==1*EFUp)|_j078)5p6`K59)#FBJ(<T&@=tghrjcxEv{t@13R?o$fk1<-NrI
zRB>@HaH-@FCtnvoO_umLE7Il3zVO5_tIV^+%Rs7}o6*?t(~E_FYD#<kwxeE`&Pkli
zTvFO5F#Y``H!NMNF-J_VWF-KOSyzwhhb;jFM!dN9ML4`{{-6eN9cs?#aIV5BK@Xh8
z^7R_d;VT4nA6S5oPFuZx8`k);lliSx)Lf%2H`qbr@|8B<tCz3%{PAv#&~=>jwfW<B
zjT;j<ckRk=|H%7@=vy=)+`a@Z-qoP|ujNQ<cIDUMsxa@1V`aQ6Mlk&X_vHeQO)lG>
z%kX@FP!kDy$R%~s3$>5PKP=NY!!c>hx`PHd{frp%2Tm!ycYWlc0ofY-PT^ev7doa9
zd<+2$XKgaTSA2A@!j#v-*d8FboWg#6&FB9cj`$n;77<pO+aUWPO!?J$#uVg|jMeT4
z1N~o&5s#+CgUHV#kwQ*U;Wuw)sx)4F71ns@-8>m+D#QM6PU;Tny5gp4mm!Rs1iw{I
zFKbSJbV-xJ7{2q~Chryek&`~35665YhntVoPlVuNRKD~&O9NIQ&W!I6%gmT#{+$H-
zY6PHXO;nb|HK^XA+~Z>!yQy5yFd3G#{6i$L`SS7z15En%>0IdPhompE*bvLxe;=GP
z9^GD)#nBbw7Hu>)?=-k@-Ewk>5;{tviNQ%7@o){}DW4e#EKUR)F21UOe9kKR6%HkA
zur*E;?l%u-os}B9O#kFE^{>Fp32;RpX<cOS22ZjO68_9nXunSDv=+<VL|ptq%xk~-
zF(du$&*Z<F83m|@n)&p{G3PBY86Pq-8)K4k5ju-1%q~v#&}p8>yjc&NaUJuS<MVBE
zi0n@p*`NM;UqT^G=~=QwjH2-3bVWI^k2x%Sxg4)^ZhLc#i@3d1fUg+clPbC=cjca@
z5u>kaoz?qHn<g%sz<M`&u1DpNh4#F~A9)`w@-KYMw>bt{(&v9@hnT(2|9zByNh{yK
zs37Dxy<C+yTLt^<y|+8xgKI_iU0>%VUQv86TS$qFEIjA_4IPqrxt4p?IJc3n_(g0E
zZX=*o)8~&7fBvXx*v6kYZ~bvV>CBbV4_B^xw8V;mgf?QGZf*!~eY|>s9_)53%hCe5
z&i!h``SEh@<MY>b$ZUCVhYVd@0F1wk?ID88g@x&aQRw0AT}`1FhZWA9qThTXr?KUZ
zwdqvd!tzVSCFXI4fJ!#ahjc^yb{sw{<w(0j@2zq+A{J`=MQo5n<GCT9;lr-6{zzy;
zc&?4*r!RX(2g{#U!6ieOV*Vu_BiO8nu<bo{m30@?l_!~Y=MK*qHVnmz3$Zp=YTx2&
zyInq=*gyFjTO0Vcj-*`=kE`!Ishv8hNAoaKteWbsk|JXH%7;4YKF7JPE@T}%tpB|b
zcI@($Dx7Hh8tBmSX7zfj46+xlB_fQUy)8l=A*$gU!rxzti~)Eyj?rPCgq!YPwxWWh
zBzAvNO+8I5P5fmpUS?LE`b&1WpV4i*3qn2uuL5;yV~YhNTwfL2YqDt8o$|M*#JBUc
zv>U|Wo%q8J5rRBXKCC3@Ho)f*7_Pl8mXBjPtQ5hlUy$~O3nLgtdS%#gOwtHMS104Y
zUO0QX+zuY4t%DfzWdBTpK?%yOo`OR7myOzwADjx^?QHus)%${<^guw5r-byag?4bC
z#G&0Jb(SeslI6(LG2_Sa@s`ga2}a2>yi)TNeuQOVs3;M_Te7cn+<M6A-K(%B%9gao
zpMaCE_8NQzp>a-l7K(-Z!!m1oqxKd>#zZ)<B&CfPf`5KBYkFCOmtN8>^*t*Ysa+ar
z6dZlAq@j5hyj_m`eC*SY6E|0PaU-#NZqPm1YKdKAz#xXH6se&In@Bw-+3nJ7*U&m%
z;8xtQ-XeU=lWi-C2SmF5vP`6l#MobUrL4=v!*vucG%e;nEmb;AC>S00W6SC-Ht-Xt
zwg!|ANQUFVCB}TWPQo!jFPJf30~Wk;pPI@(dtN?!zD~PDBY5P7BA&gFViTI4;$y{K
z+%}BoD|Hd<p1v#eG0*)Y<w19YQfaVr%nKbq=B(bBN>lzOk=d(wIyEC9H_vCIp7tk0
zaAW~{^4WVP@5RpUp%9@D(dZA91iR;+7f%c|splT<cjpg^KK?CTJzZX<xI2|523IBa
z5BUjK_d?ZP+qIO#=8dF$fe_3Z+bw>$A3Kd?3bUICt(zf+hy&Yt@}B`WMtzpg*IQ1{
z-q6JcRvR*ntqH3|d42Yra_yv&*lVG}pCdg!%eb$R&5XOsTFA69st}hrXVI2rNkvgH
zjlOqxH-+=pge&w#ML&w10EG_CUi=_&2E3UMN&4I)yhrxf6YBUJ4iU0LGqUT4#Aym~
zU4tJPLeeWWlc@Foj7?QzA1N$CjlpAeXype*cptnPFuGzEW-n!sC>=(EF8m8VBJqQd
zZTHJz76`3?evWMSebuYKG!6FYSIxX%sQv`5|K$uDF{01H9uhWqOFB?Z;~YkiUs_lH
z_&@%0y8P>!uL-Pz_n&}L!w2#Nt!EctIId5iYmLcmLL(K}>;c#E?)mc=eo|>L8rox`
zR&c2l$g==Z+E_olpceM8a5DRo6lWsJq8w&la-2;*e){-)arNBv;fbZMS2Kx||Nbtn
zuj2<itk+KPU{(sS@re8Ozmai}S&nCOGNXWY!cNnSKJouTojP%6&}mUx#x0A7y8i=p
zx^^Vct5%H_sRb=`rK>*sU#PQsvRDkwujdl}KsB^I=Y+#Q*+T!BL#@kir*TZ4{tH9z
z-AW~4WFl^bO--Uo_D!VIVn-rO^Tu#4dUv5aQ?qfUJK^-?9ES3@dz~yWSj;K=Xy$@h
z2X_+VgH=&6Gf|w$E60N_ea6qW*FJpW-kN%1S)7E?Z2J1X&b2d%NvAEig7@N3ssGC?
z-Ni1QcRp4hnWhtn-=nHV%w2wb8Y{kSrKdxMI%jKLdm7@Je%&b+lq&J>N4+<zcvT#F
z#GHHiN#^$0f!}oxWd-Z(4V}9Nlv_LVr>7JaPb}z7RcR7;)Ms10%hxEE(r`xwGjul`
zQa18sZmaEhrt-57u40A%19ght!Cb_Rg+z>rZa^xWwaP_Q=neh}&J9T(2UjpCCJJue
zRn4=yH>o_oGhAt~BHxmp%=i0+SKhNC?_}=3S{JSrMCO`!-*>t3_S%EEqV^KD#F%wc
zcxM;dRC1m-_pV_Tkua)PY>OLKG~54mN7YPR&A&AIKH5~dD#q_x`S=$xvumk}Bhn^9
zarDoz{;0KHJ~<g`euk{|8UV6f*8c^Pdq-BJuv_NfPSK08d-S4^=GU2F2^&VX9PI}$
zq>PFuzuv7cFKmV>n(b8P>iDXS1nAF;q*Sr}M!-VK@7}WriL#`IL1UTaN^v1jS$Y5#
zaQ|UHeLKh@vmvVL=UlQuBCp!0K<7~&OYuwAnpz)+rH8c!(32OT;xT*1`wsk3q>HVW
z<HUCDg7};3`q)EJAsyU3w?f($@w*`wYao%D3;dq(-v=bgZ4Dvc-gJJwd%Wh=ultF2
zJ<CAlUuWa^`G)*sK9&3ACuR-On$00AR?}%R|Hjx4bS&Vdtp<NNeFk-YAo(UFWlsp1
zs>FN(rk`t^y};Y_arV^#sm5<kg9|k`X@^$tompL2PH<CMjH49%43s0w-Ql)g+ektE
z+cQq#cJQrN>T$U_@WLQ3pgcu@wlYM-!218NcVAIWz5C<mcM3@$kc28yLlqD(2m(?=
z?--;=Q|Z#BsVE?!cj*cUO0R-+X+nU|i!_z0fYL!hP!tjV@qE`gbAB`He>1aYt+|++
zTxVtPwfD}mpU?ZX%{!`U!YCCZoaKAkjuCg2TH=yBj<y|?FxZt8<T4Ol-qhIq6@UNB
zaM|m7U+*-(mH;>l!tb#N?1a4fI=J@so=ch{I_O~H$`!@$95eQbUy|-iXkDU?@s3xz
z?E6(wh4x%{0s}N)j~Q2o<we~(v-c^IzQHX~*`@8mn^Qwlx0p;~1QI|A4M3}zt4@S5
zLL+<z-?<Q-h#%+qs;bpb5UGh4{wj1AXCuyf(IY|~yuvPiqnwpjX)j>h&#e1j6LSUS
z#Sg0?H3_p+w}qbk5%Y?=`0J+bvS3?ta{QS$Kh44Sqt#~@as1y%T?`98=(>Y28v6ZE
zhR4hr!TR17d%57$t_f%zxqwSN{50<vw@f!UwH@PL7>i0p^rij82;ezB=)`AKiXv<P
z{<s2e+X<4i(q|SGM*gc~JTS>LVV*i1L<LjUFZn~o`_fzl3#B=Jy9skfVk$bP%ekNM
z;B!K7{3nhpSNobZ0BagA0KnuD`5yZ`7NRZ`x~;=Zy;=K!!#18ZI)ZY02~Vs4yd-Rp
zq6@MFz)RpKbat7q>?S52H~B^2lxv6FHDB`iVkR$j3}EbZjYIlGbuPxh0VE({{gSvU
z8>cg3B?!;vp^x&{_eEb|wPidwE|&e++~$+=Df^!O+Cp^?;M2sITNGa+6eSV;kfof%
z0N16;A3GF$vHl)dpj3x4{|)jn2duL!*EK(_j}d;@%dl2XNYr0_^f>lv!8u2(UMwaw
zd)3bx??*KBbyY}8DPUI@i_vk5C8rJgmCaE{(6@PADHcyI*1lxXi-{&7G8hvPqPYYk
zpQ&<jLRqAP7GL3Pp%QDJt@CRh)1Is<H)@+IKdQ{jPj%ims}eaVv#_wMUBu?D^eBf*
z{EWp@W)Pl11YUQW>Z9CrzwTX+2xbSq=vDJSZ3X#n2Hn44<!8oX@0z54f8nx}!p!F%
zCeydL=JF9dJ3e@~kx!(OQiz$|NfNtNycc=q13qv5hCpMzSe5swy_NLcuB@(0i4SD`
z*(8L@nmx%A-Y?@$uZsyB#(b1zxs%h4zBGNs^~w2oe7hU-vJ(aBygqXG`7~la|B1|g
zuBtter?D$gKy=!Mjpi2p<S$qC*E?d>A(_|MLFY4YE>hqv&9F=*vi%L0nzOhsAup+}
zg_Gc4s-uFweK==l)?KurrNFC_DVeg$6<y7v;w5o`;r4V3cU4WoABJUtln}9tf(c4e
z+Gj<k1-b1IS&}9^AGxAZdu2RpQ=?MsIa=}=b)^j?$Z@F2VOtg+YqH`xxk5xHy!(o{
zZ)QQDT412Pl>2T(#-ES`;CUps_`^E2e)m;{Io6SV0V;S^5{>*TfpRpDpBAl{wZhi@
zaro*!)l8>#*D0x+DwNCc;U7?Ytb-iiplg3|M}@Oy+=JJTM!A(Tc3G{`cz8k#qvg|#
zHsZ4rd7_KIYdYm5S$0TI6?|#%*30RTi)R%N_79i)ksQs+AI|RnQ|-l4d~~%U73(Mh
zs#<K;P?7gZ%V{a=Jt;E5<4XSA%1`=NML*hg(jaqYTTxA|bRI6q810yqhL>LzEp0x1
zRhqzWTWN=cUc_y{X_q4F&Icuq?Br7)0x;%zVw_-Zw_oW~h}@Tu1bqhnyLIOcd#|0p
zL|MF~|4nn7J39|{i=c3a^?lP6)99|!jE<&rgG~EvE{mY8FYFyZBN?^Sb{)B`$K+;Z
z#feK1We0huESh!|%JaZCr6%;lZ((w3)#KrB<?OL1B()JQ15Aal!NVX@PnGMXg`!!G
zHFvG@(L3*{dHoM1YVje0$9e41$3(Vtl!pDe8fu#<@kv4V=;@(pof^vS5)+{mVHTC7
zH1>^fTKd+HDz9St-)0YZd<~5HSk-!Uw^M2{si%&b7gf4y%n^DB$FVB$T{wbdL|y1Z
zGNQi)K3HRQ8jCVMGtqM)lJj#}N8je93vU|&9{$?ZuXec~_+U;npW48S8JBMdt1(ES
zar5gon|BN_H2d@W?t>c=2SyzlqFoYmUr!GINc`FSUE%Fvs<i+0tJawDJ#L*wghF;L
zwa;CHBj8j&RLi#>rr*7UIZPs=REW)v!9UN1gs%i5rBU;EW=A3zOQ1i~kJ%-GL>-xg
z4h?1<LeDvee($@_*dLl-6daj`ctBwOMhan~52ND=)e1p;2+<Q-4^!^fd-^_9O~~rP
zwB{E)+%XrmxrqLWhc6Of*Sxr4XJGEt6eA9q<wezq$56s@);14L@L^PkaMLEVc4@f2
zGt!*|qs^l>$_+muMp*VooZ-RjvILp3gsAsNrJ06+&0yk-V2UPc*AJ2ayf$$tAw0aD
z1TsW`tru_o#?fJOX$SGNP>D!rO?1M~=n&cH2w7AkC75oDq-^!@%XRm|#H2=_(vy;G
z?@!wc5<&fAQLoHR`-vbyti4QW3<v36)?&Cd9+RjIk61@z0rV$Iw1F6sWgd2dhm+UQ
ziR<WgZOm^%EYzFo-Wr;pMAxT{8Kf-v@x__0LRhP5n))BHH_)&yLSAdbscT}OdyvAh
z@ZO&Ys0#SYBAOC-#a6r8u_hd5BpxOs_A@ZE85jjZl*A&^uR8JLdLk=5+A<frCS<>X
zfbXm)e}ckU0mMa38ly!tqfsJ7Af=e18~~bOAn^+hW!w)EI-78QCgt=RWvL)xj`H>X
zWr||Q&^VoBHY21+aWYLL4J(d{n>xMD1j0(BxhRO1SUd$&oK)fabV4Lh)*^T+7tUCg
zUbYA}zwh;p1QHsHy#6cQRyfkUEd5;b<KIGP8325918qN$cv?d5N#NHjv)Lhn1Tg7Q
zF;|02ZNH5LTT0P0Cx@ZN(TM|?cpdu3E=()AR4W1*>*<fK#AM`^;dw5@a%T98ZO#^7
zzWIib(I}MlazmbPkG8y-XGZJk`X!hlH3jOFHnzxmmC5q~3xgxFUutBqjwQF1Wv?$I
z_{LE^nLI>zPFGKsz#?KOCMWqDB{%nUvdsJjmiQslf{0@n$jn*O;pNduU*5p-_dhGv
zc*aVAY(+o&ei_@3OW*qS3|1TVd&A;|MTRl{^!X2++;<_g#yE!gjps0*DCDO34(2&%
z6H$TBV|L9u6PtIoJdb@ak8?ARn<k$}B%e<=U%)m0Tx`B@dH(sqe6h{^3p52Hn}|mM
zTp%g8V<Yzn6nFV3*FNbHHBF(4NTHf;p@wUrR_wo^&cQ;1&B7}*MMe~;Q@6;}wdh)G
z5#|54l^la04)$iC0A}~dHp_g6NTaj~aVal$8!YzNEOwP+kj0kx>XzJbEs@1B+%7K(
z7%aKXR&tM~^iEbukZx(jU~w>8X^dQH<X~w)Y-tQzY20jSDoqJ1P?jW8Mlm^+szI#P
zpo?B*cgw+iOQ5IaWjRM>d6p#wv8SM-!BUDVN*v2^aK)a<Os;1O;seobkSbnpR&*Ry
zytE0|gT3f+ebKFp;j?`)v{}(z{$iM>@<M6FSj&s9@{EXaRI>%RRk!lBYvrCS+l*z#
z{A}gMZe>%fv`$RbxK`YpWmWrws*=4IUuR#uw`ASdec878f)!u&%eAs#yy}l-)t)8W
z@@Cb7ZuL@mCD^L+eoK`zB*VlOmaQYOzvzel%?cZ;9?q&Rl3?&odf66R@?(&P6;u0K
z?gfawmh=1>Hocdk71f_~D{)V2kn(k?xEhUuOr|aRWSsoc4F5h3ZdZ+<%cu)qszt=r
zHG*=ndN29pD~`fIhEHGeS)Eo(|E`i^Kcf>+x7);FZS}&^s_x=k^^Jgfjj$|jBib?-
zp;RxUTgbCEZZGVRXAOQ=5r*oytr}`w*nF%S7aue@4Atn(u|FKD@RM(ZBVR-#Uq#qG
z)s&z{ETMY<N@fw=ibJ|YahrZZ?-P*?c;7#FToSgJBDX5T=h*M+Rr(LHm(Nwcn0sX|
z-{cg)Rvge&YSmO5&{F@qp(UWTO|NB~H=Ddc?}<gNkkDr|g}!2as*1R?j4{)@sJv=T
zCYH8qwk`4UY*lVAs^?lBw6+8eu{XL^HL*9vvcFh;+8S!rPMT}ou6X@kPhjFKL!1rl
z5y+laf*N}Zdt(tc6ncvE1oTDCZhebmddS`}hivcJd|lQ`S~%an71zF7-o7?eP0djU
zkL!#Xs$_R3oy|ut#zbMg9U>fPM#nOa=>4fx9E6WMIYEtF$E@>n6?APJQri{M?(7Kb
z&KhKg;&J<&NcVJ0wc2slQHW1!uG`r?$7uZdxJ5ckfY0C}G7p1T!SY+NsA^fan7ff9
zRJ!E?yV2I&^z$4Nv}C0hoi4}i)HF@Mc&a>yduV*oO?WlR0#1nVnH5rpsRU9_p^q!C
z=B7e7QnYuNzSn7+Lr1UwwnV@CFo*YX?-9>H$P3*1n1S18jza<}XM5oJ@qiN%9^^i-
zM&Fkd-~WKpzZqF-sSxcP8|(M-9{l2lof(W{w;L)FmFUYI&>qh?UhJX+(R$*Cd)$Y6
z_0^n`99ct9BW=U%-sn-<{+4-6`Zhn1m1|VNeRpfnBYsdm`)U0))@GLfv;N5YdRY`b
z^^Gxc(-7MS?(~OP!64FEZM8QQrYO%`swz`dTrQO>hSEEHLrI>ly`XQl7MOl90t+39
zrR`f%7)Voqy>cI8raQCIM%>Y7el<vD+d*?r4PVSxJ+y%#CE)q{D0sgJO9K6>zQBv-
zF;xE8io&?z@`Px@By$L_NEdI^Bs|$h+As{Eo6D+|!VgXMYD=D?-fPO)qJn~G@%dB|
zy{DM-Ig|GhlO{fs*GAq(@(McG3HD)Oqt(=p{E}0NclH3GP*owlAU4lG<Cy?0f@chB
zgnHx`^mL49w(vG+=Y8;Nq0)R2Ycp;W0;(9R9JhbI^P=d5k|{0^Sey-wZXMF<MdqqK
zY@$b-if%e*XXbeVcW|8ueVof%5_8>q=s9T|)u-u3(0hXfRPFL5>Q1!pn7Ll}Om5{|
z>&RRp&uj&QD$`r^g%os%4RjBGNx7Tf>pI)ZoSTt5;s&<T(KRz6w8Lh3%`d+bqwMPG
zY8JR9MtJhjqwdn|^yty~g|@w+PIu<<`QfDz%<<wd-~8O_-rV6L%p@0T5P~u*Jf+!C
zxSTG@{OtwRtJii(e-scQvaU9;!`#a!@^Ia*_ZQkmxq_G$K_7>f=+2(7w2~TG_V^k>
zZ+Hyp`5)2e^kSahWwz3KL*YaZ^xu%dw02ln$`-AEE>(T#bPy?ME@Yh6XelX~+6n)r
z52JiQ%YTT|39{jkS*Ehj5ecFMP)$A>`k<Q}>yPnmx|Pu0Yi_@Q+g}8^j%@;qljgLB
z=e0V=QK9e^dv>m8^hebzN#oPhJZsF}YqhI>93SXMy)?gxqDB<>48{h^D$xc+x??Qy
z+}fuV12-0~GntE=qq)QDxva?;>LcRDNiI!L5_;e3%Dw9=`|0T3dHQbs(_w|5U0xnj
z49mQ@F7y$Gm`wV--^izEx7>Jxe;P-fvcRJJ4o(TmeqC$>VB1|3RCEz`i<gIlK{Q}k
znrvw52((G>St#jTPn)w8RFp!cQc%$#9QCg;wDR(5)hk3YKzoey%y{<UjJKVW>IIO{
zjL!*56Sw`@^9wYDPB@e<kCK;FqFyofTy<hOO!C~)ytMPfbDhy+=qjp-Ko>$Fu`R7N
zo2{ij&7#zK4-G%Yi=UBy%^O>TROXy2#!YD?@H3>Wdhu*fFVVUSz+&mqE-LaUp3Q=)
z{gIV-Zi+$!&jj5j1T}47q+BWswR4hB&dH}9+*_tK!693BPp7Wg(%i<PMw1-vsxkXx
z&?Cb4Yl)}}YE(`*`0-~I##2E}+*yAt>>!BAk@M~25Jb?f_m_OnHMoa3>@XEW{T(do
zPuOF%g=H?%E;6Fk6Op84x`oeNNC_WlDP&y%G#Q6UOq}A?^4YiX5i0R1>GrvE>I3ce
z8Xbdr;<yXq=+7ihje==ENK!wNK;ml=Ciu7P?}u*hy>+Zb+8Mlay1wYLv+qH-A+Ee}
z1NVNbc>KDd5koKLa>xFg+m@cMr@QjemET0vZp$`#@wM5Vmy<m2yau~I{_(vb)gI{W
zBL^D%ve)VrjK?#KCkD})MBV$8h2cFs(wMo)PL`|c6s?J&0cwzm!okVp?TNK3dBUM5
zKhM&y-M&^BsM+?b;*!pi<|EF_j|=iK*K++ae?~S7#<aT<XqiVXO-AE71d;3_<aeL*
zCB<m=WcSxb476m<{8`f7c!?H&c9_Ps&-%8YuJGi`SzE;LM_y~*Gr~~KqVlV`S4W;*
zs`z~U`Sm&{s?E(r-OI*0Wn`qI)0wJtGq-#y4uAV%3-<dL4}N^PFmmr?`MXP~hy7*A
zP_di6*%tdwqdAJfFiy(@=ZSwqon?nCT3vN|ciUxJk4=ZyvOX1e`K(=*s!e{SDzcxI
zhLoGEe}&hrKia>lkNlQ9^89pu-7&@8X8G#rk8MV8zvhl&-Vw=Ay+()Np84U1vZQ0x
z*iHe>L2HBfE_=`Ah=W@U3C9w=+>fl~Tps&e75OUYS4te@Hg5l>MVH$~;fxAY&w8a8
zWOu6Zs8gnP%M+^Xbn*?DX35eKtK+<?wdNINi9Yi_e5w-V8wI$atZ2CO%v}kB%sVFD
z;p#l;eBQjk2eU#i2Sns+b<e*fU(^$O^|@B>LI-qTly6Qlj5~O6LyHu+i?e$s@#pNQ
z%wqUfrL2rsOdoPZoALHzfqO=FsE8wLpX4sucxZ>@>wUPwp8BK~wO_RaSouQzAUr3R
zX|sR_%9m3=5zCY%RQK@F{<$QJlYK3YQ?YWR{<vt`v}&GLEQP{K6>aMy&+UiD&N1<6
zAHU=dHWzUvT=>$gWroq<myl#+R`tGk;b6Qk&gUTSE$t5{>&jmC1)9&pf=AR;$$?-A
z-e-1$3X{_^*YvLP+<I&xlw^q$k>NVoEfUoafeSX-grPNMZ6mZ=b>mPCV_gY>)*j$9
z79Zp5WEbm&L_ghs<PsWd@#DN0<Aq^N!3$$Psk1A!ZF#EkwEN!ONHG>$CWTGSIWj_0
zy7P*lMB93~ljM}MewSc9u5s=8x$(aC>o77cL1ezEgg-hUCxYgJnMu}$)mdxjjfZz7
zcz0~Sdv`}`(5{#uMFxEeVhUMY@~KbNkIMwrgEd8K%44TI-RTuOzV%Xc(dmE!rNOHP
z)~~+YzY<e5wx>#M`h^B#7gKq$Yl&~`d*9iH0ERVJ5#Fq@*vnHtr57V^mAt+?ce_vV
z-ooYOzTt#GxY)DsyYvTACDL7ypBWX8JoqdV10ViMIEr~z5Lk8kTky@%<rC$_U}diQ
z%}U*IK6edYCzMlPaLuo|F%zLz0o9Y=xa?&_KIVOWIZS49I=rT>{J~o}xUKu<R0~|X
zv|b)2Jr;rvw}A>|ut^Mq(32K)i4K=ke);F2J-yUULg84{GBn&XH_K7byX$s(lH^11
zlCP-oBSz`b2pO_1>Q0jySGgdU&Z*Ui;@wqMzowT`OIx-K=}qc_(&I5#!tI!fWHm(0
z#$&IM?N}O`G{o<Y$K8b5v-ZepUVJ<re@oq-?QN5$bmMr!?QnaJ6<IC0cjJ%lk?py@
zH)$#T7*7m_I$)_TYpb$MBt@w^@G>`RYf4WfCx$!l3tZOGHJeCzLjM1uPSbL;x8;<r
zqGk;(rd4;}R@|g=Gw+czt9|_T#Vrjt%eO6Njg4<BZ~wmub)Noz4(deRo9^a@c}Hs~
z*fBhrCZE&vjx}wwV|g`ASqSrvcT})vdr#T1-0S`5PMbZ~;dGxe%qJ;A!GZV8Ouv?<
zPfB{5gP_dJz?Dd!v?2vZk!v%9*Lr;(H?%p5-<uh_3G>b9QE<BWWM=r5rf=5UHYXkF
zS2H8GBYm@16mH4ApBcT^>-+3`+byNTnK!{Ozg#LsXVo*aV^NxZ`OL4KHDzYU6C?c!
z1r%L$ugy+8>GdnV^xDPn-t6Q{I>i4?U6h}PTY!&O_<sPSmnp!gnyRXv2L7t91_c;3
zGt{|oHPOoW{{Tj<tgIZY&0bqGQkc;`8#Y_}TkiJO{{W+fj_ed;bij$%`<6|%GuNPt
z;2l@{f27fWjL`rumxzBeqyG(z{zn&e47@NHs6qiotAmurgVbUl-u(|PIvJ{$81|qc
zOtUjghoXxHM&SPqj4DuoQ3@^kC`#jBw5ZDel@?8nGx%>^G$oNhp+#Mi4Jou}bF%gS
zNf*sei}ikT?XNES#D$`ZmS!f-Wx7+0Q3^2n;OUM37^C6O?B<_2et7m*8vPeD>O?U{
zgY%sKVMY@Q+$qxNKg?)j@zbb(OQRHKG`7s|ahc!Jzm3th7rFl!qtB`Wm#bp`F-9rC
zXnJkve*>ds^-(MJssAxX{{xKvM;EPc{R@o#w=UZDU%Kc&wCIbj95OlY<^QBbxB6fH
zLyL|MR{XavIyqAPzt=@yQ*_b)rbRzYwftKbCI6#~?#vASM;HBv79C%p@TJ@T(4y~_
zMh}+WeE*-c=<@2$`s(VB)!7eg)BjD2Zf<TKZZ55EFa6s7wDEQ2*VpyU-L*fvYdhaI
ze}CKF`~GGB$G77j-+ui1e)Q|d>FFsYjEgu0{!nvhSLb$yAs9uh`>XT1qcD8B+1fSv
zJ#nm(uJiph1$~KFwO9_F+QNZUA>(rEf!d;>Cpi1TY@NE|k*Bi0oAU#8C2yYN!)Q2l
z>r2NAv{OZ{57w7WmJkYbb95WZ-&UB{xh@PgRJ?y_(;dsH*Z5+l&Uv!@`cPx#+$*n7
zgE@Mysuo)P_cs@YUcLO-L4+W=C=LFl?r6sIH-?*PKJ_K>={?hLu3Z_*kaYVn++4Tz
zCRZ(v%b=xxW3tq^;>Jiz!`Az1`=MtBt&KbX&vnts|EY_X{aY7xRu4u9mSQ#jhc24*
zKXlQIf9ayU6kU`AM&sOnF2&)B&*Vq4`LKRUkbNM-M|ZAxoexcb&e(-tW^ws^M}9f?
zbBgTPB0nvza5pzW%gklPN0M#H0V7pd?T9fmH-e#zZ@8>x_Kaxrg`4DWtUhh>u5pUw
zt*2hg@o#CQLlJ%mtHK5FXR&DlepuD#LG7JMvdd}ebeC8?)JBwe$JGo9U=5#;!W(J)
zZ;FIH81=-`JP(A6*@M*Rl$gr~U7uBZp7uiM+7bNc*ufqU2%2FBvM9|r0I^X%Gd>2A
z;O&`E!N6YgV9}&lvJTvgU;PbxwtE^X6XatgqB&_cWQ5@)GtdjekJPG~YZ?R2q8n(Y
zP_)uV3~Dbs9)%~;Z&*5r*767siK?^%{XOhgCvaDrs0S<tH0f%0BeOYK^Xa=emTbc>
zV%|=GUY<A)*R=9qaXP2jei!4RQrO0WC<HGVBe|v-^b+{Vti0NCW!hl$x!WeH8%ik(
z`clHnqTe*zPDllQVr1>wZ}{Hgd_NJ$fWG88@=@w2uj67eQbnvo{|9@DzWgpeRP=n(
z1z{2qt(1~fn}7|p_HCR2@0>#FDY_`1PMe}kY|TX*_KC8Ky=);3%5&PGI~51oDY~M!
zf%!!K6hB2m9Qt=R4CzS892K`O2Kr6tp+8gZHj!IMu2`gcEdSJEve@So-*2v;2ZzNG
z#WmU~hVt3xxLahit3$LZzY)hlv?<%hfh8yXlizs9tE!|X1)@5x36#}$W6s5??-K@%
zkq+U+LIfpLWc{-)nmCvA`y7$rpe(8Y%-)1o!_dOi&i9}akBPc#iNEfg4*+kIzI-^7
z`}0>=D9G|DKJ6`t4PobSf`NxDM|7gdXl^xdQZxTJ2sZkX<-~>+2}uJ7?(&44{6y2S
zf2RXc^Ev?!-bS1P4p75f8X8Vg7~WEy24EAxo2%s!hcAhN(ut-t**8#BY2a><2%a}L
zs%5Y!9u$KOhm`kRg7PQci5MdSgO3@he#-96jEm3bgTQFjstuhkp6&C|eY&~vr)f6a
z?-x}t6MN5@rqTEmb26*TZo=84mykbR%j^?-?Gu-gu))%0E-E`wHhufZIqlE9>@F>i
z0|hK9KbNpb>e8UJ@o=(pGK^{>7pNiH^A<k7_yG<H9-c`0?aWRa?XApGKM}!6<mt|>
z*7s(LW!u2MXKznN0WlsAhc|8EO*RT42L-f_yV>}O<SrCzh$)xvsx)l_+Q6qa;)Eb5
zDZh9+Eb`8dJ-9r*#)cGQ=_eV}4BVmx74{MzNw6IB_iVSh$gytg8~RU2@f4TDKWs|Y
zSJ|av2hvahcfUOn%0V(f)S;mnx3RCGNnLCV+M)AF4@wW<N_HV|DkUF}&kr&f4|zoO
z<;DXiH@TbnHxgMK^)Pz*ku@jliOL$uB}(5}iJ@4j;Q2J)j;we3dyCRxgfO&4nih`z
z&QMSwbNc66a|BhFDz5)R7LxhQvJgTo%40n9M93WegJ(3Avyi(%C=7(2N>nwlFDR1V
zR86;(2(fXs#QGN0+&$zb(Y(9O&4_5OUeyc^{B-3{o#;6dq4em!Xx&N|oM_`@I&dm@
zsi-L^4gxX(Q?GQH3onM@&DgL+vBF}Aw;B8@X`V@+k5d$2qT(JPN!TTD0lb^1wOeR{
zUvBVzfk<X8^Q0x~Q0Q7jl^;m`J<~Vc=8-#J{=j;>uIq-<0Z(s9g$d_{4MN&Sa(bPR
zU0p}N!t^H!A1j-=hO2&WfS@a0I)b2RZ)tU|K%wr6FHr+Y0(&<NK2_cOEn^dEvmInE
zY1YOc--|ld?>xh?s8;u$mm^I#N(!5L{pR^upI=YX7&u(-bv&KpeW_v4bD+gCBp@fw
z)`;zAMkK~)mM3s&cT902nr)&NI$18IZZFuK&a#9Dt;<-=QJ~Ry(~kVr;nSQX`<EAC
z=N{<-+8oA@p=D`zdRV`H3zD))e;7os|6*e-Bd_S263(R3FPaEH$aoj>W3L2irP8tM
zEOKMzpwCJ-I^x#$(ph8*YTJ<xuN?Tf^!w125ZUp&>Q43Vxj0=|3(N;Nqo0&m-S2fd
z`}5t_EIf1l`(^4?-|XmKmBbO#Qg^CU)|V`G$t6K7-n3;<^GR3Y-#Mf^*tfJg7SzkF
zbTciCV}G0rv6114zn9AUtVh2*DfsjJ#E6dwViTy67ZPAC3~1g$*@@6bz%T!rn?K&P
zQQkEwWf1au5}Lzx`;dOv5u|N|(0XNKi&>bU@3x_-_cNNQp7?nQ0dqW^j;c}5B`L?Y
zU{_gqFWh${ZTg&ldm#9&SN_?x!vR+E386X9vVH94kpFd#8{)oS&q8avEUGn$QS3Qi
z@HbWz8m2~D%qdfcYJv7$;0Lc1MD`+U{z9V@R^qQ_OEvaiYP2^!&tI%GzK^abt!6nR
z?2HY)*!CurT7UVu4Iug|_{^7I?#YN3KwZNHr14;M6(YMqFSwAm#cIa{Ck%_Yc3BDW
z<WDN1iIjIkP@(gCs(MHAx;Ma_%5|O@WU3+S`ri8q_P3W@?uW(8^7j_Eo(#9*WqBS<
zoLN{~1-B^MaO2C5X4lLEZi>!I=lT)Ctmxzl#!Lk%TtFAmED3Y^;gyhh<<pMyfjBU&
z7X~UlMH7~Lpe0aRR(O$w;XC+gHtf(&Pe=<X7b(VMYGQnSG2e0x!O6ie2_j7hy7--)
zTu<;&NpO`DhN={E_v#g@P9if8nqe9{xQgKrqUW0qfsdmQvY6eZ(6#rWH#%Vvs#r}d
zI>iQRjYWOLgh3dfI|Yn~(u!9nZpqW@U+tuZLH)%u!fW!ZA$Cw@G9|lDWevdElThv$
z6##rusgqg(BSRPqli@)h^D;MJWEP9Vo!8mO%viHARICP8C0EmnY<1;v<X!(LgPO==
zesrq_mY0BJV#L0Vhzd84Ht3`hO^S|Tg=l=o`k&%y_Ij-EI7g?M$Eb`)qw>`sH^pRU
zFlCryv!-Jxy69hT)a$P<O5VL%_>V5i8dobDS8pEI=pWaV5l7KQ+hkccNPoRiCRTc;
zCUmcVeAK1*E#LUw>9|pfH(ISsAjO`ghw4zgQLjk25$-U`8NwT4s7gP}f@Sy_zq-!#
z$4jUXZ<d!qFB*!$J;uz-Vm3(BcQpyt_LwDE`tSaU*-43OtVv&0TyTrX-;}<8nqDk3
z6yQUA60|<?qO-w*HFISMUf5j#g5H0$3sCXm?sG+6L7la}-7P>jkpKbRQt7i4PI5I2
zMO%Nn!zXP08-Q5n+QU!tQns9+!bzwa01|hOXAY-K$>CJ&q2NZSBP>SSB~2jN&n(Gh
zj~^krsC{@BCpcv?#V7+W#w{GEeHB9R62&=_P+V$|2Cwu{24!zPYO&B1a9)b`0qiTE
zjuZg-3Q==)Q580({tT9c=B12wK{gJYMNQ-sET{>~Y3bgON-Sn*7mOMQ;_;Yx3Po8B
z0;^=wE`c86=x3{GG4xptvUL7qyfmLAQpl>4UTWf!hWiIv8zd2f<x3ym;d`dgH6)lA
zSeRxt%cGm>@Q0Qt^vMZutG!FKJs(GtCQiC+*nU;)6r|*xDLx7orGik!k*sSqAaOY5
z(yol8(>*X379)erq%%TMjRT37F`EMz_T5Z|PN)n(e{ebO{VVx>HFSA1VQ>s<TOdC<
z21-fOg`4RsLLc|=pSwMVZMP5uV&N^unlpB{dSkLh27H>F{;H$&<?`)U<px!A`do52
zv6`p0P=;9ef;!~<5pj8gwbBLv?*WMxC>b0$e*>*wO)FCks>Ebo$fbki(E+)1o5F?a
zA{g270&pJM83(4rKBrQFv+sg8H{d%K&%Y)WtRxjx5@B4`$dlZn)eZD@Iq*%kxIZMY
z02bk3s?P<11Y840N5XTHz%yN7KN^8QNl)nVa}CnLQ@ctW-9GJ$68_~SC#M(+KPP%7
zOMD+9&55-(R7LaVy2oafWG|j?x|k2+$>1c3blE}M@p8ImNh&t>5+Y||V>Gk)f}>qP
zhO&Kp6OA4N^zopFyQmDCf+S%OfCVuSQ0+7?PH+_s4=R}Opm;3EL=F>=&%Ce;oZ!ID
zSPYPh=E?<VuplO{O1edmOfK*~tMa6}a^a|Qi7l=juObDAa!I<c)}op0p=ry=&#I9A
zWn^$D4~u=mWfP&VsbZ{l_J_K{4P(6b&z5iS-T_j4bc@|Z)oFg{s`pNVo@cqC&SOTu
ziKOhFOQXP}SOHOzcqPr*&#_c16nGR5e@J@P6ianNLO7gmq8Y}X4N&CK<T~(DEpF(U
z_<78p3x=Io1*@i=F0a(P{~Rm<K7+-8bL-bzDitiBH%!N0Wien9ipRknsZ~Pk91MG!
zlt{9e8&BzvuRRhTVx1HLrJt>H#=Xk_1<1=`lztZ~=wa@kf8`fPWweEEbH&gTGMi$l
z^(xS2TlMdC;m$O`N>Wo?TtoA^MDI-FUwG7}VZ{beKSFJ~yi%;Fi<NKD-)wfaL{*Lf
z1R7vmgo2r(hwue5UXY_|keMDlWUlGR3qrq$ZU|^?Zf$MS_8yFGX7mB=Y@+>gf##!(
z{GnH{+|1e8y2<mHk>72y=YcbXda6AX{V7ErO{x@k1I$UybQll}(@c>^dp6N40quGg
zsEyY4{(z3-@ig|l4(Aq(E(IQ~PNUlEm=+;jaV33;A^mJ6iOGT=4UsU`%#f@4e9YJ>
zVocLj)#tp}lqtg#l8T65Hb~X<<sOQLqf=;}iP0SuVlF<8S6&_a3y)&6)mO(1R~G|-
ztJJGDSmEPt92mQbBdc4JH3P}o*<@V>a=ML@5Ry!2!>YECO{{y&6v&@dyNud;{&@G?
zIPTHh_Ol%BahT^yA;Q%ZXk8U()!OLhfZiJ%bZ*DJYTJHStSOgcF4e%>Dr0?W6nGTq
z(-@}KJ%$BYgTwX7{-=cd_viaR)%0=NkUd5F)n8mR(TB!ZlXq;O_7oa%o-;|G`~m1M
z#8EzB-8NL#Nq^x{vt8H=1#%&Y`U8%3oC1&9{Dnu=cVQaw16tbwU!5>ta#6h$cr-Z_
zw2e8m8Q%0lKj#?9ryo?07jJh*xj`Xu80hWYE*3|laRT^`HLMJura+(u8W1(4ZgtvW
zt$D3;_AoCDA|w|@pN!V9!92F1MtRd7aKN&#BjBC0TkfbsC-QBt5jQ5}Di&eA+eMr6
za7kfQ&3!<vjW^GR{KcL8ItJr}M=^!Gf#sq5Y3XY*W00JQED19FI+<FL>?TD<DUOSt
z9*^<j$m=HK&9syLivl0UMl%)2HDjoEPcYnKm}xKC1R`BN76}H?Cg7<1u$UGMB4Ld7
z=Qb+!UoTL9ThoC%(T{WArdFp>-mONA(L%i^L>AsXRvA%0o|xtsp!+knY>gDa(0s_f
zm^Y@XmJOy2qMIW1ejtF06v*rzsKJQ~TyzsBSft??LKjDE@sB+^hR9h&mtbJiW3+w5
zH%__80I$FHXpGJ533j&7V>SkZpxC4HIE?$wyGG8lUW(+=6z~V!6}2`5nog+m5}62t
zIpWBHI8TZ_O6UTs><(oPs}N_V!92(W{9k+2&<m}xh)O(tJ!3(^M?>D!86b~`XUYve
zoY;IgB0%$VkwLk$i3t<0u78XN4J4}4nR1LOUnd`VkU#8xT&<@2BQ`ySfyRg~(0WfL
ziXlH^5VHw%={xA0>KQ}a9GGX~Bo~>A#grs{_|>+QibHF7AzN~h%hwkUJU)s(WK|8M
zGhF8XEjF4q+$HgFnoDv)b7#7CaS_wLpn*Y;5TM8UZ^p9GY@<tDsAZFdr5gZkg~uC_
z56dQ=teU&?UZRVa49PV>GOBY?@nmt<V@3mj*8)q21h`=m)#I@b29(m>2eha7@(FRl
zc9H58e(wB@mB5oTGECT--LA9sC^7x+gF4jCX+27g)^-bv#Z{w%4f$_U{83=!AAeN9
zfd26)I{hI{z=yT`sxy*ORvG?SW)2=@1h#3p^OC#xqYt_~$CwxZ-uPwu9Ei5jbG6`q
zql*rI*d9IE9^=}XP}-TgvGeZX&h)dL+4i0J4?7=Db{4t5EE`5!runV-Y@U$9Df6J9
zd?A5@PR_;UT`nxAf>0uKeZA_-HrLk(`mdL)zgFG*Dw6iqy?*nPC#UL*0F2<eRZkb#
zZhe8F8$8i{{NXD`5bK<+inBq{+@z-M5JhogF*o<ZYPwm2yTiKnz{`8!Z}SnTF8EDO
z<I}bkT@ELV1bUi8_xKt8F&_0nj9KzZPkb#|?KWBZ<~Kis{YzKANuW7ZULI(^IiL%n
zix`6&SJLl$Azc?3{&=BpJ*B^*OkT#(EfL6dB&1(FnKDzvEcP9|^c|YK|5W^pE&6-<
z_78(M90a>V?Z5-{5~{@OJB91qTSS59(ff<2$d1`V!p~p1==3kB{iGK??i)$L=#<-r
z-*bOvoX~&CMebo4?kLk019VQxNcY?1I^vO0Fy;`TRlb1fBhZ~YX1Vj`@Zs~r(au9{
z4ru(J!w~Lw`eHPFUg%>YU9KnfTO69SyOiKXJDp2YYeQX<i~5{PlasVOuKefi=|}Xu
z7fp^0wbdKS_Sz}Auc${k=+8;$m0;R=;>L9KRMxW>^JBDMNa%e4H4mVUx#<<rnCYaS
z)i65CYMVJS6+~(%tI4C+Nrmy&qZyU>N&c%+uf$j{+`y;&++Tad-speaFHm0m=DCv3
z+xg^!Cuk1oJAV$EB?m?X402T>Q2*9Nk0cq$^Twq{6kSyAQgm{WMT6(c?Axtt)wVs4
z1gzd|ThzO}t#X`uw=-9evTIUg^~Cksy^=@CpWkVxzR-C~GT1a3P7%MCy4f#BMVpb;
zo$9yJ?L^Hw(3gBCxvp>{L%>q!D`<-!nIZ3<zx?adU0qI>$uCnbp{E5KEV4m;QaLF-
zJLdU15rQ#CW%ZUNhL4^0VyD_L7o49?sb8c@IC~!dqA^pFnK~(7H96Gwy=U@UL5;gv
z8{Ky|P55l)9XdDaFMp`f>3g`T`XMH}#aNEsk-_~aWD8%jebq|^`Y&CSFU?Dp=6wCG
zD(%8%ZWxt(b}Ul5Y0&LLFmXnW$wKt9<`bQ%%rz$R$+8ybJz^#_JHW8H=ea*y_jWJG
z?V99l4mCBAXNF)GP0kEdYm~&j6zi+cxek*Y2h!P^i|9Eam#I)jq80|iL4ud5IK=XC
z8jn<+Kn{#I3JXwdZW+R4Cb!`kG7A4W`txP^J*jgXPOO%8@u&W5^bt=xsxx0I`5a{S
zrC5CvE~CFr8fSQ_gveHZ9B{EPiB4QWidh7sVS2~Z%<9f}Q*-<D?_G3PF5OY1|IS;M
zfp_REKI?NezT~BqW+64J(W-EY7Pp>$W51QCx0W$q;zS9Xo=}1o_jR^k!{^)^zQZ~6
z`j_+`8G0@moH44_fj%{Kx;mJnTD`XxepVV3e#SSe)%jy->5y-#LCaH(wue+Z{Y-en
zb<%au<E5QvWZq&OExo70@1I+#3$I=ec1SLIX7RE7tr^-|?7rh;tGmA(GwdH<u1Ga9
zBRE#h)2}eyGZES0zqeaZ#3<<?!BThY&SxVgqxlWEh2tIfRpV2m;nH`d4_A5C9;=J<
zl_cXu$Ioq5w*H8c4CvcQ&wd)a_r2HuN!Gb!`y&gUn|m4e>#)T0y8brC`ZJ#wZBC@M
zIAm^t^1@u%mU?s44V%x6*XwjmbGr*J6>}ddLC!f?tY$X9$nt1Ju8mW4(L3*~?)|xw
zuPgIfWNPKH0KJ7-g=n%NDMl+@RbAZanVo1aM@9f;h5Bspm*%1*t1q3f`zud>y-qT$
z*LQtp#rm``<B78bB=E~?ct@X(r%UgzD~`gwJHwqZ0cA{%nYNJ@Kb%oXU9XJ7<!-q5
z$rop6c0#q99)d!NW7T17(h^~eN%jm`7!A&pBD7w#>Y4e)s8h0FNLv7Q?e558q=1rE
zTyp25^R-VoO<hY=S$heQl7+T(eGG8~GB1l*p{~>o|FrvFYSC&;ywc?%3A}cY7<C6b
z#vEC)lN5x#MJU|$(K1Re!<NPZ7nW(5jJS{?{5Op+tX=~@rw>AX9SCKtB}A!i=h1s*
zKso&K(u6I$kcR7>v`pi@!qc6^yUqn1G=gv$&Cn~v=`h~o`eOBy8bs=Lr|{-tIF6Ku
zzV2%O(r-LU*k6UodMK2ki&QT+Re~W2J)*Pk%X8kXj#Bn>6!W;RXT4hMh+7BF*a_>2
zlWe%BawE+gBy=1EjWdTFoFsEHhmARk*xpcd(d5%iL=k^i*4$?&nMw<~>o5V9scATE
zps=2=I$uV&sFUo%FGK%c<7Y0(QT)=-u;$?^2KG&&LeoS%9%_;c5pY(adqAK>u>v(?
zqWU=oS(y|~@)?Ut)ia-@+2ITd@`cEMoG=lq;U<NA0%h7Ai$*k_CPn8RUG!F%uei?F
znTU}g%6~3j$zC-nkq^RL;<tr9gqfDA3Ah^l)kR?qCLQ%}l~RvPN;OT(jp;-XELx^7
z3@<&G_H{LTePmiq(M7cvL<U<Zx+pI*%-u#!{{E3!Q*VRA4}G`m&)LFnT)d-Vjin;&
z99<*9epIL=sblW0=b3w{Fvw#5>Y~%9c?|EWi*>i{c#!6-+NxE5bx~n;x{l?g>UI8|
z(CpYNlb-#;MUEbB*MD1z`;oFaV?E$zzb)ri&0f`~Q#O5?%*}my+%R6MZr~VT{6_Fv
z^Ux(E;oN!ac}>VmPF4@oVs_|j)oZPD9v)Kh$gpk0i0ADqp7%%O<-dNAY`c2)>wUfR
z*JmzXYu_(=d3Bo_a@g3|v`Q&`7hR?Hh1RwF67UMy;$66EYDZd)?y+tnUWaIzcNwWr
z%0~+6FgR-$qcmsWC99j5DF60v(_^8R-OqCm-mUlz{rcd_@$!E0bjM~|Wt?rG{m$Ue
zCsMErk33kAGcBfMHNlJ4I~Hc#Pfuyu8xwl&cw{>WwLWe-B&%IZ=5Q3%`&Dncx|UvN
z{bc%KQ@_1nox;o*2ne20ODC#`n!DRw>a%z(b+^uAC2;Mqw{f(y$Jg}7+5C%e%dw`<
zE2+P;M@tHSjm14%u%#Pu*1py=p8QOJ78c~9|0XFSZPl+t@sA7P)8ogPf_KVn8#f3g
zmTxPZ?v!hJxSIE|nU#9p$+qPQyOH6FY~`Xdc~G+@_Bp0La~d?rQRAkV>&`UrrJj$&
z_K}!F{=4{x4KFH#JS@GPXZ@Wbp}->1I>4Edy2aN#Pobv913-1P1zQGZIt$cBzGOB8
z%Crll4FDf2(?PAwpTE2}!$VG2lPFGPb%e*K=Gkc{|892mt?=LG9Q4k_dZS*zSIv=W
zt1**Q#=9N(^|#59=Z*}p`=!NyzCq-<CKA})j;^>*d7QaFG6~+x=+1zGckh{8G@?=r
zpW}E`3g$Wf!4$9O_(?H%P-<TBYsmpGoeOKkN0SpKC)v5>)%BitVqjly4)!xfJeS{b
zdLO*F7V)`S8!}ay7bSMUCekz=%AP^btZEXnNszcaxZ!ih7oqlLl~tokOX99pA?UO1
z$FAvuT6Y93hX|_>am*LBk~wF+PdTKc7nE&Nkt!l{r2v4n0f0a?j-s2yjS^6Lq4Kj&
z1n;oU4zX=Mzy^e(=whvxyZ|a^Jmezr2MC%3lw!buRUZ)wehGj$umJ8{Q@<?;2v^pC
z&=Y<`Xixy8I)I6$ItckJB>;jT0=QSijk8G)LhS*79@G9YFF)!dJoqQ{9$><Y2m3}7
z(b1IQN+Nt3WlL1r2y52Y?s(TtEUkut`kUVD*9?DBpdH2+?zYiL;j{o^X8;W|28gqN
zHO~j_VgvwnIU4@98A-S`05BsI0L*KB09dX=IANt>{zT5{kZs8*KD<(?7l4dzNk!t}
z{?XJ#pj4=}ghZq&jdodAY?yrA^%O5K+`#GI%z8}p$cUsS5N~55*#c>7=R!j#iKpBL
za?j^NxQ<oAQ$tPyVo#BHpp?jItt8-}dd?vdQcBzb6nry?H0vb(Ry>`xx+Xt0N}YVX
z*;Nn_3;hX{We{P+SQ>L++O4xFELM#2gU^R9O2QeiKsi>OhreqdLbP@R8NN_OPB;7r
zP)+t#31<XDGSq7!oh7WVM21z|03u5%_-45DO=|$`4C)JrZ4XdbVr=J-f|Cl=P9Y?O
z7jcJGQ#DD$5(+rf%Tj8nAfh^lF<DbzYcxRJSL)?_SW5{>r3|N98vV-9q~(m?W!h;i
zS|MrLesUS1hbKPP!@M_C0qonPLcOR(_cOAD*i}*rz%Wr%8NH`vL{+}Fb}3@);(6JQ
z=1vF3$Q%ejm+|UWc&t?_D4n*;^@SP*aC5irY&X`9JdQ-$XsGgo%-pq5YFc-Wb+YWW
zp3PS!6ttHRfphV(G&tbYcVK$5>5M)EXlng?GCB7S$g7vJYWx3-R#ljR0r>v7ww`c)
z9RLGs5o+CH1lL%rNTz|x!kg!}nmzhoix6qfn_y_i221|Zsx&KcI=2)q*YN9=VnM|U
zdIS5)2#&#L+dyu%{v9UW{%~>TG#Yzy!%a!JB1y%zUy<wpFq5dt{ZzC_5jz=?&{B%4
z8Y$ARXDtL!vr;)>p}`ba6*rQg(6L~mcghbXGE2efa76uSm?Ep;SsTE*x{Wev&S$L$
zTaPe`CQ|voUiO1nCn;N3!yu&wsy4tEUrJ!6O)@YRjv*W2Ra(XjKB)KF>nV3hMcon|
z{iHvdSJ5dY3xNIg`PGMqq;Ss*^}!LBhG+>3gNhxK8UR3qmPU)a6BuM$4u{lA-N!y~
zM8KTK;Qj6T{zMov;A9WGGpShGugDk?`@^mGwlgKWOYA*X`WX=WMrtt5eGDiCf}ciC
zK!{+QMt!XE<WPgY(D<(~IaLf1c1gJfI}Te>cO%GvwZr7ofK2@^77qfeBF8UAqDWKA
zZ6Z-XeGI`q239oImnWQF?5RX!03O+q5>mwbPx9u(KI4su%Lz12)oqmZhhj-)H<E74
zbURfhO#V`o3&x}hVkqZ0RZ66iEkY_M#NJrcXhE2iVPH4>!l|)<#&zTUi^fu%Z!a1f
z6T~jdDQFVHsI&+mrQv2I0MK}K8`GH%@S9rqNE=taea9A|@TZ<r2%w{kboxS-R!pr%
zOdZo3u4|ax3Nmv}7cjbR=IU7GlwjsQV&+klV^wK(o4MX?!3;efMrA{!swS8G1Yo#p
zza=jq%-_Rg-=S*W9CwkmgJPwG-czv}rj0`oSRnj3k}m@|3TwWB4MAi8%ov!WELhVZ
zj8Aszi9T?O{Auj{I@9xyS%O%t*X!xv^F#<v(LjL+CMiLTiBJr2!6XT4K3wV#fDo$t
zmK3A&Js*yklmkq50wCFT2V<G<bp&gK1(<MEaq%_tc0~RilhU7xyITf{J<|y}mb_cj
zr42|e46!g<AvFP)MJeCN0#71h>xV96rC(#C0&+CYGWZ*1_(GE+B3!(}9VUSWN0_ZP
z#C%ba*Y7gK#<COxKZ_-TbKh1tzKk!j>`A{+QEBRyq)M?=8Kz-J1+rS0No)H^v=`+{
z1o(~2Rwi^+6~%e{BvKKGRIE*6M55FfKt%+a86#;302Su7QUfsSxFBV-P=W=WB6eTB
z3^GAF18^cyW{0X~hiZk{x-fjfFM?Rf2u5f(@;MWs833v08iJ@ns|}&5R(JEdPE}2u
zR0zFiI%6FcA>ja&{uyoviZvnvvq8kWK{OOmb+@&HDI#{wVWMPFkwFUn?YEVAwG5RP
zkVz3$ZHV2KaW2=b5f4jx6-{qLl(N5%!g`FB^zplDiZCv@%5<7vsTSo)$`AtaKr#wV
z$vyxbXBJ>i*pA1{K=^h9)Qhm5N({BX3daI*$Pd11ipLR#i1ir&XJ=kY%x4CE)DITU
z!)hF13=~wgX$jpvPAN5mOD#UIFH`lWPVfPrDrSB&15`qmr$78|mhO&z3RChcie>iH
zkJIjeuQ!Wf09)opuE<d%!bFxSk%G8N{unAD5W75VJQHj*46CSNrc8GsN5fEBK`jm@
z0O>zUT}=^HiD=k$dai|XbAU~W!^O&$qdqdNN7;f?4!lTSi#N0$3*$Wbs3r}^Hm(5J
zklP3i<TOY?oJdnjF;=sAo!)qmZZZyc-@rThIs+iAS?GDvkKcwMAz2s!aVHg|NSL`H
zZv}?p?LRBMF|jIjCS^4s;v#4q>x~pK%V;lcX7L%wv^Jb{lXb+-*Gb0UF-`0Do9d5Z
z;Wr#Y?iOj@Fh<JSQ6+)gc1JsyiB#*KXrk>-yFPs`+5KF~YTG*9{K+`vz17nC0p*x0
zW*aCMGg-aJcJ%ckTEdnMl!zsZD<zn@vS>gsGL|_Kuf`QYh*$a~f2B;QiPL%R0y6-X
zk|_%WZr3f;aoX2h`cxnE(SvnyqcZNXqS=gw;+nk7EkUA4=`Gm$3}e*{-6a6}ELNQV
zbMV7hBA0XH<Gj!tlYFxF3sz2WimRGIRC-1fsaglGf5x;s6RQ5Ys#6qK)!cUO4iOlG
ztZ#L~{eg2#R$3YxROTD$oNGaKgX?K7Ww|atKFb}ywm&zl2npPV6K8Mug*Dy@rx}~A
zDI5p90HesusfNmMoJXaJeeIvur+h!&l;M{!Wcg#dPH9CONVP7I)YZ`dW5BhyKBl=A
z^r_x#i|paH6<P8MHRfV-MGM;@hIMQ0-D;({s@0J$Smh4Xbzc(Y?EqX`u<dXTL^kXP
z;{Z1y*HVA!5Bnco)>VOe-J!c}9w>ct!o<4z(*38#Zyv?2iQ<`tp<rxxsoq+s@y-)B
zkJjr}t#65R8cobqGcTPQs{=NDMjJdz!N=*-s!STX5w}1OSDmb#YER}4hM-wJBi%ZX
z<Aydk0+@RCrJ>!E=Vs1!`|w{{wVJrhPrO^T)f(yiP0e=qlR8Ek-;vf4P`6Mv9Z8{8
zLnPa!%$MF9DDQ`Poq`cgYCrVBSOA_xgys@G1h-(<T|iA9S~igfZj=X-u?ABaI0=BP
z8-T5WwW6<oOl4qWMBbCVC@6ru<soR;5pHT>?ra5dR@_aMOK$*ZWC7x_K18AGWqh0A
zosDu<uTs7~nxqhFf`ywiampivE{FKw#(HbP3?B|pS4upBUG_EGgQ33haNo@o_UX@#
zoP=zllkf;!_g`9-MAXMvLHfS~{i!c{Za#TS6k`D{KZ=df>oB-xyUX~=W&Vm|-}|%D
zfZo&=m<ZfzY=V()f~NbwDlJ)~^?iv{MrIaqlUoM`?Qp=nG$RrrL_xTTi=GEs%Iijm
ziPL8WM2ES^Nl7A&wuLy;Aq4kIR@v4U8$S4D22%R5z+~?JZ%+Zm_FDx2#M!n|z^K~f
z7QKLbHA<C2tNJ|kBn#Yq)*)cuG3-H%Famy*ApRF~_Z8Gs`2LHY6ncP!UIK&w(yR2E
zgd$D42vQ_~6anc7QX~}V8mcs<h;$H;4gv{P1f+|C7>Y_0X(A%R&hP)5J!j6DGqZ2^
zO|DihvgV!jzIoR3d_ND$+H?H+6D*)@Y%Ao%RJwqe1lOSiwO@)YIdt9z9-MOzD6wP+
zyweJopq(%$m6))bli~%9pxmP5x}XSMdSrr#uZg3>`hzhPOEjzzebaF-Tg;zPZ*K2}
z6B0{{FC%92fA)Di>iuvy6G)NMYB0cYLMT4JDHb_!Enhru`(68^xnQYlqhRBI5pOFa
zXKu2Q)lsr8N)I`o@%xvj8a4kU>LZ8w!u_Zv53Z8f*Owo^M6Eo%iWo>)V!C*$dR1>H
zYF+z6vQ|uvCHh-28$wWK<4N?Ewp>q2!neL?I{`U`!sxx9(LhjhG%@<%Asb>x?x*&{
z<1bQ9%@+rL4{cPha*AFY7e72x=G~``{{8+El970IM|c{T<Vn^=B|Y~M#CST6|F15}
ztsJ<!d9Y3}a!?DFUHd6CmMwm>*=Orecsx)3|4$d4;7S#mDK~m5@4J00Hdkd?X<2{w
zm-s^6t@gkl+rK0h8(l^+Uvk%q{y(~CN8tC9Y!2g080UlEhd*|H%aHnGL6r!*OP59x
zk=GLOzjaY#{jt15ry-<l(BAH!Bae5_72~8e^U{U7YHt2-UDTsn^Aq4n=W^HmqZQtG
zA;nL`#4*=dfd0#sv8RQveFIg3pAS6|@wlhiezf_iJ?Q7&KlRi7HCIbPu8jvjzwpLB
z@p}@e23g+B@wl(e*L(h_XJ_f>&r9tX0G$fL@oR|x^XToSYbEzH@!7@E->RN+$1SUd
z*~fQXxBZVUdMc14fDvJWQ0vD%k45TxAYy5Om1X{t?s>?x|LUSE25SK#^1lmV^xLQ0
zio!(FdWZt!$6Fbila(8p|J6kst~`O6o(vb~)Er#W=twT8inu-XkK(!#<eK|mUDVxZ
z|3)RxQ~xgE?|~tos@b0(XB;m-$I+>YmI6*bE*B@XC49+E7B66b@mKXs^kvSi2V#z4
z+sR($92gZ#YSuvU?8<JO_;yuwO_zABoMRPVN&STzPptV^7fXHT#|ILx-kgbVChYv%
zW=R#MQ?D}}>P?b-J)zdUVd0@!$nr!uL$%&yo+??Y{quvrzK@3p6w=q%G9#qBwrV22
zbjiM*mF_thQ<r)3>r;eG@1Or`bkQiKPhPcel$LzE|0yj8ywg<v9I_Opyb`|iM)^zB
z-+#&^9KDvxY64HR%388SugZG5`i06yhOw6F*Btw3)o=OUy{g}zMO>(EmZoZ{ZM`gv
zR@<(w?NuX}V=vTpo8D=u|7cx`R^RK~=~e&v=I@32K7n3a<6wyAp~m4`i9U^^3H3{j
z<7s1U&0q8O4>eCddiQDm{v2_sNp3{e*820c@S)b(R&Afw-yhwVTIUDvw6*{JTDp9w
zeeq|fPy6!U-%D)@5IJOmxiN-H0|8{I>Zg=%#4$!9z=EO#+AC>1&l(4%8qoxXTra*O
zRI+fhc|7bfl(7<(Os!f)<lz;B=;aZ`8nKU%DgefG6+OW@St9E61<XnmNOsJL0<ojK
zNXb~P##N%)CXxSOszf_QZUAMyo@5t;guON>!Ql5<{Y5dnrk2zqtOE4O{%a5!1B|g}
zQ#x?X1xB1oQwbd4zb%A?sjV{km=NffRo1vZi;iB5y2R%i=<@xOyQVRGAe1zx$FE;C
z@-zkn|6^b%EW^bT5~IT}k~|_;5b(r^u{m2iIg#-WmP&+mfIrK5gXVH4EDgzuVF@@V
z8S9GDWmgI2%2(^aZqYIdr<rpI?k0+5b!LTufjo9J1BNkxcVdxv9_MUICfAu{WEeoW
zlJw0)&4QYNeFid8b&dC=WISYTkhk*m1(%k}6TwW`v<r$vmXnxt&f$2tAb7;kJq+`Z
zVt~1lqDp&DAk_svz`Q8>NOBp+;9P@dKgTCPUwE0vi)WWI-ubSkCpUmp7=T!zHu(){
zsP7jI=0%n0(JBJ66wU^C1>L+5`-_84p|HH6Mlj#c0F#Fs+41T_>nOC^Xy%#)Yk&5Z
z;j%!gVIxeqO+$!pbqeydsx0kdQyk9v2jjyTM0ZZ|5+FBoTHRNO%_Twa!p`JI#PGio
zJb1CU>}uxFD;6(jHn1A^GLqE#u}oQ>Uo~vRbo3v!3LhkWg?Oz#@qGk%At*#`wj(g?
ze5S*yhbOmGq3zzW16~Wx?K&B6VKmeLJh$Tqn6O)vyi~;8wD=0+UYc>_@&G?d%9TC#
z9mDgo!OCa<d@xV`ERpD*c2wVxlKhQ&yhvnzk~>8SPcp<Tw+-eAT32ejb1kGQtv8s8
zN_%M1e{xOvz`vpRGpLmQojXNb*L)OK;9dZo{9}B#Bu>KPU&a&I0wB+Q^P0^2?vFM#
z%AEncvYZTQ&fLTI@ntHMkFNUA1`fu-1FNLrDd_j6m!rsm^cX|aXQa1TWJMM1?iD+|
zH0IZ!+z=5g$B8vrrHh-RkHAw(DWDfoCS_bC6-tw9Rq>988+;Ng$ywp>+dgSiw5>Pv
zlBMJZ)U4zB6ijNe2P8SfzqF^8P3=7$s&ntacaF<|hm{N$ClqJHr5dDUpC37pa!hmM
zjr#9A1HCCQ#mnJiwG<qe(TuuRyQUvUE0harzKY%#6h23NGZv4^jPSIXl_^y)US9Re
zjkz^bv4O;-T7YF=#q;as4F;q-U$^bkWpFo7_I>8RmK%>|5D!Q!z5a%1hf%D25b{>6
z?d~H<{0siKkCN-HTqZOr1S{?D7{0o}OhZW@ahY)Lk6}MAWfG46#p%=-=x4T?pk^Y#
zhc$n}%y@q9AzrZC-?l|dO^(tyY;{4j$sMs$ld49AOgq|-g$|Gs3{6T|&Qz%62K=9d
zsF$+*5shc*nHrlkEnWR=N|NX--L^k|@u=CHn2e)KH0<aawHhT#-7=k%93|3E^$gYC
z-ts%nZDJWsJ8?DJ#2B~yV&CvDl_cHTz&r=$?NMBVF$1ifBhO>3+jLETTBIYvYpjG{
zzFwdI-hCL4?Rmx5$kk&DzQ2nmm@cXsJzgC^Hp+ccVmk{rZkY5HX@`p7;#f=%Mt!*z
zwr^-Vvlo@bYe8FRqBg-BgcbYzr;fW>mtl2Wh%d=uX$L}nW^bj&8$Dadit5yH<y0l<
zkL;mimAPj7x2EX@LsV~aqKtEqz1<V!ZfS~`3{hCjFVt3|hbx4vsQTYa_9eb~>TXVn
zG=tL!k4DYARsL1-L(d^8bgHt7)cW4ay))f(p=;~=NAa(EEo(G3&E1@OQBy4P-A{{n
zZZl8&0Vow&nqj}ctm7BL^}()~Yx6ct0pqs{_Y=-!iLw~#<Up#fRF(1ry=JZ-+ZbtZ
z8QUU^Je{d4z|`&~M%mnyxh1sE5p)$LbPWjlwi5bp2HLwIEmEAusE&G_&OLGnn_Ha1
zF-i8ED0^I@;HIOr>3pw6N1d!oLiRuvZ=AtD;xzI=Ocx~**+dZyqQE(t2ao1(K(j=y
zLgQCCoCs{eXbwDps|C%sLEt|p2*8Pg8bsm2Ri3t0?luB@AeJK*%gIRKd|t{;Toula
zl~}|;-Q!eSKw2uLe@Qy(VQ~tJv20qg?4f9uQ!Gadjz^0q0!2a@u}E<Nt=%|>L4?+#
zj(Q$Q$Y?;udX>$6mEFmO#jT8ou}r{yKur=UX!Aq^RVHMK<Z{6AXQKK1%OuW$qGKR2
zc^XzD0f{am+XY&d(N!)wRsy1<)S|<(SN8LGO}2w5?71o&ik8bIN_|@^P$`qi1<FPX
zaGeu`9bPDVUJ5GrGHT_;DRdA8H_#jqfT|Wo>>Q|=7bopBrq!aObPiPi2H;X4u(7_-
zV0Y6DHPy}=kj*9vD7dk-08kgP$~~#CNpZ>!8-gu3j$T(WNSvzVx-RCi!39xd1IH0q
zE@3dB<|Ej3tfRi+YN+PM=MXF97N^@*P9kF?=QxfFH}g+AeLWk(qi!r41Q7!rb?DcX
zx&avn4A1zQKu4_k6^NEwoR*Rsj{{LAFYX5Mx@|6oPXWM{_fnNqK49%;qvXby9jgGj
zbL$a<7Gyxsc8xzw*!ZrAc37OmIYCm3C=;{cbZ<h-U_cnWE^v;yQIMu_dWXx2{1tas
z{mXQX4x-HkPO2{MVU??pO)1;tDo<}IJQOMLDOO?pg%h2T`XbP!4J~Hv?je6&y#pf~
z9jn}OP2D_>?5*lB64;=EBE1z-k!8?}5~;;l2|l2XlS|+QLF62xB<o%hrXyB_6~lkK
z$IYO1>dryo5w;ko0KcQ%>l*4V=y4b?$o$=^&EuxKPGnoMYNQ88HqnP@Cbdrpv&AT;
zrK@USSTumQq7$*muWaCNp_2&~ZFk62n&%$*Vhjr$<3DMZ0mdQX6BXEq!{OJJTF@Me
zm}o|7t#hJ)kC4+v<=vJ6SqBWq-3o_XL+x`Qx6#0Pf6Tq;5dtn<!{Eh}&`WBqMU0LX
z#_3+7#-cmRIU%DrS(&sN+x0}FvER@qP6!V)ii{H~2L+GvroIKT>%oSr;tGggu8+Rd
z3M(-l94H`q8D(Qw7J<h51K<-d)k(Z+&!%v2m5Ho?S-+0?ahw98;^En~$8F&ID}%BQ
z1mU`>Tf3l_ZSgMyuT?as%Wx9VWLni0r&1ITBk4d<iK4o!+6u7y&te~5Pcx^Cty>w4
zsgD=7zF|@nTW3mWZPI0*tdJ&S%m6)3cw8hOCPnG4aW;THso%6;hg!Bm#Rp_W0@TdK
zYkGQ$9fO`<fR&G{?UM#NMs+2pD9n!IY{<0gpsp0fkWzmPjsGRlxW(J3k-#%bMW$7a
z@R(%tollW*G$>pi5yV=g`yX1BL=n7+VK*VusyfJ+e9ar<n*KcX>;$9Df#+qmuWI6X
zCg&P2z#VJ4N)CjswRjDc9aI1BNSaMU+Z{4hz%g2N{n*JN$-DDdH>Ut=5==3%GRQMp
zYkcZs<Rk90;cYw>)7QnI<qt48iDNs}nG3w86^~{yl^n8`G;)qx#_H7QTM3%PHl4*u
zgE4{%12LTgLM9lk<AHkistCK-Po}XVLpmY~K+H2;M6jgMqPs~FpV6Y!%Dn<fgU@Bp
zfT~Ftgg;1i8KcNbq^%yP-@dV~wTJo&k}_~yskn?+b|B;o4=T|BIeP$N6+T8uaR`3`
zk0eqAh2}~U(;^X+vvF)B9jP9|8*WLyo`$?N0@6R0twn-w4#VXT$Ce~!vN#|Rzxurb
zEGvXTwq#xz957TEklO?)DH6*%LGaC3brQ2ID^O}v$N3o%^W&D8=m5{gkRd*n%^xVX
z7bnyq-6~DwvBnrx`EkW>BIBhwBz=uFh)_JicsEWZxL>J!067elvj(!pVE*Q!x#oyk
zJvbGEePl%(f|IcQTz9GhEM`E?jq?Yt>u8f2WJ+|^vH`54-juifxz6iM{9|R#WjM-Z
z<@^C0&;dhIoI!s~Z^gi#6Ua#PQffIH4Fv-fX@D9u7~!z3&^ess>F4C+yb}w__SW0v
zv%gUM(tli4g;>5$aV1-sPg_L3BB+w?u3=FC_mK`~5m8PBSNTKAI2e7@3?_Bmguick
zUPD-^!8KpUiGzW%3OWqQoJz}akogRx@FCmBX+8xI-2Agq3nBaYple&aN;w7JDR8=A
z&#+vFt_LTRgi@OWLgs*cd9@nB6byI_U3r|!9EQ3?muoWtmIvlbqTs+|sCRX!Q8;NG
zx$t1LQX^Q|1fc93M`dvX^&<-&qjR-NM{AeBnuq4y%#hB*eZ@H1|3GuXc}#rdjZZOj
zl0eZkda<b(8QV(&@^k<RCMa$Yt1JgJUVznVk2**wS{fi<k+{hshNmZ9-pvroNwDid
z(`FO)&OkgQl%$G+R=>O`Cr;oL#M(np8jO{W-Z#`e)?Fu{`I9i@1H{OY;Z*;AL!jPl
zzn;f&iF=^YhF)$qZgyBgB#Dfw>R`T;-_?jiXfRSq{qo!g%kiG}{-Bb7WSp6s{YAW_
zr=PMa&b%pGa??Vny{Yck?HgFmn;&3OD%s4Nm`0Zj-dEu3g+WHUa!T31?38sn{^;<F
z7D5$4s-q!(l*C0MPH;!jf)}JDYKycDoc@GiUMO+V269ccXp;cMGab>|I&GhQ!)%mV
z&*jfMeghKJ)FP5)vX#2;Y<7Z@C|W88K*q$@Xl|<pGOc{j*cHbz4pLse74-~Q@^SYI
zTdcGv5FP_kP{pZ%myJ-RF8s=_>Y>nbs>#C`HarGJ7FCn_k(*cKXj-%-+qFrOjDttr
z?#A!gH+Wcgl{bhIPillnXg!HIZGYmMZ}MV|LI%a{+U36up;AUPu||G6v_;_khWioU
z?@jY52P&T!aRS7W1{GWO=Xz!2k|^ZAN{Ge*`wknm5x>6T{StrJTfI+PXfBq-gP2+u
z9IicQQE86BN`9Q-wyg{^=FR2EYn5&kvpA>^VCm2hx^K_qEjQR<R|{f%7LWLQIlw2u
z9H#g4%fDY4I@U__IPC9wF8%OqdRMZjY6QkTwK+znH0zT?PfO&PrfSuLI<I_@H<ASM
zSxY2jqtsPu*?e?_>q6D-Vp*nc3BqUCf^-B#al&TuMqz}IEud@+h$(?5pf+C0pflU5
zGp7;^{2M2qMh_uBYw)qXm@c+p3f9}oMj8*wMST1t2Rcr`(SJb(e?fBP{qJhp^Mf#4
zMY`hqD7sS#gUYj-FYUV9zYR}gJI{2aNGQF(ziS1%%FH_XmDI@hs3?f2gu)><_IUPj
zpkiI~N+85qO)PCY0pvfU5~_MzJghsud01DukRT429zE1e^zda*ygW^!zo9V><9U16
z@2gII!>M7*>6;zmS5<)V5a{l_N)tx}2cNppZh*#VH_QBhTpms<%tnGO{HkPl=FOj(
z?VKlp{MX?`k<G6>jQ}mT<kG<K?KPc>$~Yl1s_FxZ&+62US0ZmKgiPf48K|&Zwdh^v
z^^O7IKUOcR<CyFCF>f)him_0~nNQEbs?aWN&a-bs@W_rZlRrjnGeO&+QM;~38``98
z9g7M&Gc<{s{~c8IM9r*`0w%Lo-4`f+pJKHAtoC){>xjmw<~LHW35F$av^UEdJl@dw
z=xF=nguoFIOx-5B|8O!9uQ}dAh!l#aKnQ678H^GykE2PuysH)?^hj_*c3<-P{?3b?
zLGc%0En5|%5hK&8IGYJw?7KmYefHtV4sGY`q`w2<Z!Dn)Q<`ZO?6$F5RVsbo)jNI-
z{OnWt=#K6y4ZAf0UgM8cYG*wx1SoF~a45!3vxJY@fY$$jGM6%P{=}WATgn{|aIj$z
z*`BJG-xV8C)c&#Se+ML<Hftw6pq7mFdIw@mLj4`kzVkGkjv`*@;l;*uj0KR7A9n#w
z+4s0(|I!E~X44YZ<RT~I-jh_;F*1X?&NHCEGwN%^sd#ZnILLen>p)#JpVI3x3Jyn|
z1`ab@V3;8fPh<NHEQa~{IH|lDgcbyb6dr0BOERa#T^48uV1hy?#Hzvc8W$`6HMSKX
zMnnDm5YEx$bZtK4fFzz%echDci>Vq#d1&1tF1F<4Xrwxh27dUdH+?5(ZL-L`EnuyM
zf$qzo^Z76O8A3{q^@YJpTk&~*2ABe(J@g-UsL#jOULV?`c<%3|4je*M6$*#jmJY=&
z2hh_WZZGe-hyYKzp5NP=t-jeF&AYBC{JZ1(_<cG4zNIgAfnQvkTQ?RqsGHwwKDnbU
zvmE?;=|jj*tpHvK%Py1s^UKEC&F3lGZ;^aJnb;@D-*w&Zk<Z1E(v`t`g2G9F-=$DN
z+V1U<0Y;fm`#Ox&bu`6L9k}NZi(@2gnDdTCK=GwCUjU_ixX@}W!>Z*`K$THg&oIAB
z2PrlW2l=QE6|MU7EnRu{F!8yqr-8_`=***`6g|eHgjC;-{e-SaPs72~?`vB^6}T8f
zp$wOEui;F*XyEs3UCFoKIeqTYZsc*1by4%>Td|;Nv=o|^(T6VQI)@C9cEFV5T?rwD
z)gXMXE&R%xgxPIp8X^sQ41{go`i5i9yp4|3*R1HCgS-6jx_!#TifH)gRlz`7BwM&{
zqX~G;vuZ5Kdh;NG>dp!g4His09p)Hv!Qwaton_17<U2|jA0Lq@9u>=)st(geo3Byv
zT>I=*L6frfmdNZ=WE+&C8!U#=xcToN2kA1#cP9}Z<u>@;8Yi`#SQyRrNa~pw|MR@H
z6sg{@{#%xuqco0jK}O(#4ub?1394qIBschQXarHjJF2o_iI_~WO+)C7ddp``uHcFW
z^l2TDL&LnnR|sB+=r!KW?ELe5a>;=zFczIw-^;yI*Sb=$)9~hkdw01fe_j!dKNR_Z
z(>kfle1>D&Nbf#fY(+j5O9?O8pyK|Rlq9`mr)*c$0OCxKU(n-yxZE_DY?$fv>5AR?
z^!F80p@&`Djf!82jwUrP;m1>Y)SSf<&EfUz-1`EO?5$D9lvI)ITV!3;WrX@s-9p9a
z9&SdA&=_@mlIYhbSIEdCbDZ(=Ke}o_Y-iYZz<2e)(_h!TQgjW4iZLm+M~7na{Lju0
zC$#zh9natXGH>P|$-ocql5!Q8w>^R=2;RD844&Nl<_L~?4Wu_RPhAZVV9#zEKPaDN
zQeiEH;=&$FH#frWdBzL!5u9Mn2-T1<G;K{u!B;Az*2yzyf|&Ixo!ugatt|<;&uOIX
zyx+|F_S>V_K&UZmb{2T+g(om@6`E|TE64{+HY~rcG^)gF+22nmn`FPqjeUf2TU9k0
z=T`4ffl5bD^WWZe;T$s1mn~>Yb#Y7NcweQj&~T7`;s59=X;WW$_~3D<q#*Z4nqiGx
zaww1FI{&|pYnpAaj06+6OAgS-5e4o*Jl=YPQ~1xQUPDtxJnM##vX`NeeqhF92SN33
zn-Gg(*pnRi9bvO-Lz5X;PEDGysP<dKYi);Vw-m}W8>R-gj$L_VcOA6w6~=XUDDva>
zsp;_f0M=7i=)^dM__@FY|EUgSCU{u2T#V}BIjZ10DnTLVt%;k~)q;ug3dP#|@jFT^
z&t@DvuD;5jaKHDu@C)R-N}-);7{==P58ZEyfB#Gd0j-|_Cs3NLZztRzuoO+Oil{Pd
zo5Ul7o`cw`w3!M_)5vwx-@&5t0$pY)1+!&*&#o9OZC%fH@8>^1uToeSvkd*jlK<Ub
zUrR7$JkK(_g5#^F5$N*4?4!fEa!Ng~>mEk$b8T2F<Q=`tZ={%2t|@@j^zL4Lc+0#d
za6V73CtiwpYvGl^EI0^tjnQOk0bUZv?CUEbJSA|G#T>vJ)VL$@9DB3XlF;xzsn%hB
z%%+_<-w>SR&A1T5$kBnIPC|{a1e$*oDH&kNsjm}RsQEaI#JpBr9J-2;_^23v!j(T?
z=O*TDH~uL1b*b;JtDw5wgp*Bc;SZlX+B~18bJ=+-=Y8(tmOjBr>}}n5>RbiheOl_Z
zdEN9&QVmu6@k@hJN7aO{Z+hzTruh9fY5xZI(%Pk|2kp%tzDk8ybkmdQ+MB=D{|J{e
zUOM2r**oLt7cy&n>vET<Og%Vs@BR_J)3=r1_4zrqE*z=0orm)cVe_>P#RqhKWuV5u
z5P$pmyC2$z=PTXW4w4MdW!%a@Lt-`uDR#>)9DSU_a=8a-UJkB2UpPlp7Y-hWFT3(z
za*m?e5An&7>(HmC@iY6vnfd3k9zA8F7P*Jn)ed(gZgah}TR6<^OnWS-%oTOm5v$to
z;EvPmeCK6zRB-fZ9GX-LS8@0Dzq$`$e<}zHyM6#)?s=s0_q54d5l~3$=&7@F`p*5z
z7s2RK&uiV=gNeDv<q_i^a^nO_u9BT}Z`n=7xj&QPHV2h5&*C6St0Or5L4@e%yEi!s
z=vE?+>%1IyQgkoR<~tW!Q~vbO2luSa^-ZE_Oi(vXF8jgnQMwEm67cr@g2~Y5`|vTG
zhvtjZ*<R^HdKKt*uaR($n18re({eN%%Qtv7rye;CIRiPIPpQ9#;+z~QzJ?T%sLhgo
zH~jhR2VXkVbzj7mW<&hrnCL!S*mRWs>3O6&hX7?x;KG(t9{ViB(7mT2u#_d=^n7^6
z)jitJ(rifU{X`A4QGub#6bQ`p{?z2<8>$M;z`^S@Run6VV_*IS6kfafJ^b4rVzSdQ
z>vvKCb>*Z`(NvO))?MD4o{2Nn7iIB0ygPQ^uFC765>&k7n5}65)RNBwSw&o-q_p<;
z#Rp!A-~Vh}icKn|-0Y=qKgy>=dW6W&Jd3;cN)hzw6irhzfqNeDY4=JMKrMReN1%fG
zPR5szvf6uvE-KPDp5XPrsy^hEbFe=weJWpk`@kbO8$>B!3mSa)e9w_H8Y*C`zE<3H
zXqyUv1&p+P<SoPnE;>OvsFiB(H>C#3s!x*Uh8xY8!rRnC529ZwZRp+pr(@N7)J(2#
zd|wrH`V7?k$Z^>>SEavG{BZP*&B0anE_#+zt-`GnU8--glkLq>7v4#=Z}p^pTfGMq
zaZ6mDyn-*MGf&pT4Sb<0&Ifn*evmi)l2;Q|BwBgW=P4#oH{|c|dqoljd=v+lM8}=4
zvi1|0FZ%)d(YSFHJf#egi)!^{xnaSIILKReWX^18Fb1U3KNl)+Val|&oWB1JvN2W)
z<S^n1elj^_1euwjp%(va4p?)bU^9I}es>GHi{P582Y&wXISD%F;Cujn0>b|Q`a&71
zeL(h&5;X>aqgXIVfInCu)pQWv(677be{M}zzdP2@Ak6@p9?sk!qJa&M34Hd4z-~&y
ztbAZM>R_%u&_mPplj~3!xzXnWjK_E-5*{gu<?{qkI&MHs6In+5DyPI5ZLsiL(`>f`
z;1n<x4-4pRrhJtWIxh>35XfTHKI`puK6Xm@Sv-$gDNFn&N7jK7a*WCr#$MdSc6ld&
zqZ0P71;A!5z+7#?gOx1Ko>p`#ML7?$+f4D)N|zx3+_Q4*S4kgE>p!)S1=i9}-!k}i
zrulxt_>V03f5Tww8T^+p@@nQ^wcw+iK`=2RXqg2#G6jB4^Ydi#-+&;uECi04=AV<N
z?64)ID!9%amIhRwTHr$eTX2yDZ}BwMFj}yhV$5k`(!{sardinWhcLC#m7w}7uJZ5Q
z50L<wN>Ksoux63#^*f==B2n_SF_xlYQX*E&Tq`nLd3F41guhNN_~H6$#{}mp9oCe7
zMqSG-<hIa=rQr14Ss~xXVE|V-1($VmeoFexOrX?Kv*c9@X_4#FA7`X4C*-A<jHG@A
z!hI;}Q9q{+nYp$PrKe|PzBjW`&PvnHPC;hbiVx@VAn@@L8vO%BqBC8QzS?%V+MWP?
z3W`G)!uMFv`x}7qmMGixK*`wyS<0(icm2e=)0kIg6z7?l-LjPEe<)3hE4yZWeULR3
zJu4j-q@0)~9L1uHwNTlqBO+g`id<Fo2vSWAQmdYoD;7}8XHh8)V8g%7HrOTq7>(jd
z#m9uJAv*kxmTEPnG$oaFq*Bo_3XH5f-!=lmjg_!U%AYz=yv@R88}N0nM(NcqTaT%r
zF9oVJ05wvIdX@E#xdqPNf-XKl3m&8D(=bxjyjPFqlv~Es6hN1p$3g-EjEK2!y1}~D
zB)G;LnpQz~Hcj`sHLr!WUYz9w^Rb@sF{ao;u-I!b2F+g7uaPgPH1`@AQwsION;DCe
zxzTLrrJRju|6m-yB!Tw|mif4pf4iJJQ{T8VSOQlHyHd({TZbjZS$HgkL0{1O3fk1h
zv&aO2`q{#kL6Ex|qn8R9ly_#smr8-G%?hi{l6TEOA?B39W=tWY%s0$`wwPzUwMc+i
za{N+UCrSM<c_*D?PL9XX_+_fdR<EM?PWP7({f+!bEi~iKbY+5unpXeeSLs$+t6JjR
z$owjSxuOK7hGjl1y%B<Cy2r-DylP|TVw*ZoUO14;7y`2_lhPUBs(NW%!yrEi$082E
zoZ(o4^|0d<hW|<#{{qgZ67vID%tqvuM$oV1ACK+sDqlzFeNZ&JKkN8&%=(3i(~W7T
zpNhg?LT;zl-Tu++^rO|0Qpss`?DnOi(sdG?*kF0T&UtGddvF6=S?9tO>d3F;B5XaT
z6zUikJa~##s714#9Vuo9BS<CCU^I)(EX3$YK0M^gXen2Gj+Q6E)KtJOWPv}-#>?EC
zqnu4?j$lx0nS4T!>P2%6qM^Zh(5h92BwgoI0vWd#xhDV-Ed!fPMJ@vJFMi#A=`2gl
zKFS<iaD062Z76*FL~i<IWR9I}alsc0yLb7kb#!y#-p>WLBX+0cG(X=tzoo-}HVR`@
z?Y{3$e13<1-Oly@x!|8+NFK`b6})LVWHmTub$9uyrsgcYB-(TIB~9K7uF!dA&r)=5
zg=hXZ54+!<&AH%ocBK<xdZI<Da}0H6JWCh_ri84n0!%4~>A4f&Zdj%^OUA9K$g*VD
zf1#2$33BgN*{&!JOV;JHfAD+Bkze)U0TvRGVHoi<HzMlQgE+~^tIm<1+alj^L^0ir
zD&^2I%;D|hh+MrNb=eyAUfK8HX7sbH=%s_G*B|^Strmzid}*wj*tk3YaK_X?5wg0v
zEI{9-6ms)E;?`5}ZRNObYuY&gPfASaB~}oc;;cE4!laZS*`g>R`i<3103uDzsy7|k
zEcWp7zWmb6++NMhlmHjrkj{S*9darcahiA)k(98gnw*yyZc_hPB{@eWaRi$va5Vg!
zGwJ0i8xsrfM>@9vh+x#BbE}G3{$h$RBsC*1?PqH$L-q*qG*OEEf#P9Ix)-zVqS9kr
z9Pp*EQyJ_W%~3>=njLc!eFt$22+h~W{{>{Ici7pp*?J4|>sy5k)G&hqNQeQ~DFqYW
z!udbmDvmRKI!ik-Up6EiHz$|Hkk<Z~&RRYPE2sLy@}4V1Fk>snk28@BjQZ{79zk+l
zKeB~)=3;lB2HEA^4lwiDAHJNkNuSS2OYY1GP|eFyl`Txp_Z`oV<1Bc~&Lt^cS2sfI
zd_!$n=MIA~e=o?+S1>-u85dH`j5*Xj6)-Oc!RNnc*K={-x1yWGeuuLy;;XrS{bBp_
zvAFMa2-v0Dt(wblR_tX`N?lN5KV1s@G=wZDwc_GZnAiJGO0yqV0c4d(aF-MsmWe!g
zakLB9=o-dw=al{~Oqk0%DWS={p)}4?8FZ`ienDl#r^=8srLGx>M*H?5f%h?Yb=Ixw
zCtWN=XHz{N9}zX)FP8NVk`3krE)!Jw%QLp>v!MpH+V+Cl7qI#o?(*vtwXJ6_J3rOd
zbJq_%sHau4q&`CVaRpu$->+LbtDC)5_wqr5N6XOeEwcme#1D;0q^sna62<6(CZ46H
z0B&WzDocG2{_@i4TQ9QZkW5~#HWU4?wRu`}3I*3@@j>La74-nObv|>R`>G-}BM(xu
zX2Hw%-<xo^VXfM{c!t^<bp4jlL4^<RFSSK2sp1Mn!qtV7?Q?H(@t(Av6eKrd?NvO~
zJC;mJaw0mXYdSypeZ`A)B`h{3(_Edk4qhf03@`<6tim2S(~Q!|x2-AGxtU)nWx4ei
zxkrcxVXsJ{`#?CYQ2=9e|E<<GSTl-Y4Xr7n$D;MUHRrFaT~mFPGh>HUNl1Pze<U0k
zN&NW!S`&|s0DyS;^X`De@<6Kkpl}gUy=Smpg>lMa;5Hy-{ZqS~!+;e$$T;$aqr)H;
zo^%J^gEe}3a_8oIYR;7Yc>V9p1&G&Tz~0-guN~w0ch%M1?jy!Y?56e_Jt&SnbS(MV
zX^P`tCScvL1kFl<W~5Z%R?d3=$Ta*OE`Q=CT<J^X#1g!Fwy0p;VUjo4EN+qLQ8YP%
ze*b$}^>0r>mTHf^0eRVby%T|@lrZXg*zB*eAauA^Q1(=@tmfaePSDIHC6IVm*ore!
zbZzDx3VM!(<q4U9zw%Wr^N*K^lhxH_A))3H1*zC^E)5Wkqq5)fht{L_(~-)F|0Yv4
z7yag_E{)_rYQq-`qm=Wb%2=KybREXOyT;#BLL*%nbhgTL;f#3h;LZ+UjgMvZj4|$U
zgT<1#0}0Yq*v}(xmZvMgU;vZ6o4(T<<T#2YW>wWT7arO=s*b*M|MPgnn~y9`s~pc)
zc~(~W`OK;v6TT4)tkk3W2^xw)K@O|TPJ%RGU~hOoox$n~*<00hhE+_8?SJOia*}8u
z8n@vj+;qQ)5h2_J4?rgr(Q)M*$1{$A)C`l<zmE&7Y(C-J%5vIzdT~!!D}lR|=8AgM
z*j32nNAJBOMKzR4Hd?eii8cN{BAY;`hDu1reQjOg@8I)oUgL4s(!bj~R%^*?6J&bH
zj6<H5GK$~XbmUph|F153d!P36mYG4(OL)|F3C)FyPx&fcW3OUZ49g6FD!vSY2j-m<
z?n(f@Ogu*l6(7Ee{qdPkpQN>r6H4cggrbDeVIkn((LpKE`{X15?=L5Q+G{v?GHdbD
zM-RS=5}M~--ehuh0j*Sp6n#`C`WPve3#1DEDpuwq9!(TqxcKVGyC65KA>v6l*ALkP
zc&D~A#`lgV_x=pv|2KR4--m}=^bey*L-e`Jk;kV_{rb<lfrp7i<ltw1$#?|{WKtgv
zOwX;6BwI?v{mx#F$dfHrkNr3InP>DTS@EO)k1i^|L4<G(=l>sd(NYz|6pa*xEkd||
z_9KW@dERWbb!}{sb$RuCy%m}58u=xfhS0b5p)XY6FKWG|2XvL7uV1bgO8$T8qK&36
zg6QuT-4rnqj7spkqX<!zM@PG-6lF?s-F|AB$5z4eLA7ObnsSFuD_yPizq+WS0?2DL
ztDJpO`6W&J$DXWAtFnllCexmmzqB4}bl#Y4EL4BUs7cmED`_R#@4A=uxpYm1iZgF^
zg~d0gguT6)Q^=uOrpt7sq}3bwXS{l;?}>Kb#lO1x_u6AmST69h<5FG0?Kd>~y)J(j
zhefekjH1$1*@iXBa%K`V819W?J%1fg|Bo)}lDvNUq4b(lKW;*75kD|(lgtWpO&R^1
zr3dSRZn8cGWeC#CQht22Ao6!H$u09;j+;xCsTS>>?1<8;a!i-Pz=V`N&T5c#^Tu0y
zMLiXmfrAm2B}wam;)R*Or)SLiw&XDt_h+FGj!Uy2?7j6Uj<gIHK_A#6jWq1Bcic-#
z4`vNudM0bxYHr+WW?|rY!n~T}Vwq=U%C{|#s<OvMcY|X>?_zE5du~>{9oepJy59Jj
zHLCYC@K<6${oXC%s+SjZK8?hckh_`Bgw&=q^cK731&a>3^VP4?+1?NgnY$!Rh#j$J
zCFEMKf_ys+&(wT6zdcWtHXcHT@1lQ|<Xq=l)7LjeRNtF_exs5G`LpLj$>3fWkjccq
zYUgm_tz3GHRZ{6jQf89y`RP?p#IudrWbt-zV4C)XtqU!B#QAl=$c6u`fynRZx%Yk2
zJi$gVyO_U$6JwMP{*!7y;cJA~xbF!ZxXram)&gfMT`iU8z)7j!!SZ^@E>^-5^$Auq
zbk5T1`XuX6QEc^u%foUeYy9K%6Hk?+@e?Btjs1QuNjac0i-g5K3jDcThyY@4VF)wP
z%BqN0*LjCby^;*cZjtu=Gy9egq>2^Lwq;`dvvHK<@<{se^-~LVxAIG=+ggjZH-cd+
znUh^uZ)!#r^4Mhw$k=0Ci)aL-K*TJIgg19nG&1$gkY3Po(%_p%ryaEnXPK40xtm)2
z`HDBwelHXOuX^_s5z=J3^C95q)Y^a}pzCxy=$G1o`a9F^AKl*@X7(t~qh_dH)BlXV
z98P_t@zu_S`Ol&b>>K(qxy6y6#rvst)d*@w75`vJc3^OHx*6Yrxw*4Wrz{CedN+!U
z+Uppn*4ca#VLipW=V_;*)+GCIxr{3raSb`sjz2UZnDg$IT7LS_7fW~*datl}@8mlq
zD|jIKoPKTpf}?-}$q2XeCrb5DFg_$VVc9LNf@_~9bVN?`=Z;=t*hwT!{*)`IE{a5J
zaTTa>QEd9X>{9L`f2ojtK}e;_BbHMbjm$2AHr=-9n!6iXQJh%_6<pT;NK~6*N=DdZ
zFxK$AU-z1ph0=O*j)*qxn0ZQI_5vtbbGK=<I;@m&9$~=wxRi;ep*e^A=O5iz8V?Ew
zT<^#0A^Wk_kM}{0da`cfPr~u~cMl!#l4U|qI=ZRz;(@Q%Kg)xt^~Ujmh08);EgS-9
z-756hoy-RYgRzh7bw~OCASzYOD#%;m0R6JnwL?#I>I0k`pK4c{%4PMqH)CzSxN011
z=jL_5E|Kfxbp`5U?)6`9*Xb@<-)df&c_LQ+p5931v)<*ujOp1SS2`)HES4+GPaZ5^
zEhZe(D8pO(Q~0iyFj2Cjtz4!&kSzsj{jn5OjeP}&l4aYk^{DQAf`!BrAQ-_U$#Gfe
zOL@gS@)`z)WKhcF;dp-cBxvc#w`L(jGRVmp)%Q{|i%gk?yR-WD$OG6E2o!)((VLK@
zw(u}C=+z4ix;i37S5L#Mx=;qTTV`bof=&ov&(ddx%};|wI>@WFpaf?&;)n5QX0Z^8
z_jl9{Y~LPkHC{24#K_>SR^9-c%Xm5O*gvg({{RdhFPPBmF$b@WwuO}X)@K{2GtOEv
zQ*hX>?Q+X9E}XGDzPj^Sma)m6F=K$%B3XLtLHFgd2;gRikMN#~bfbE=m~!{myV6@{
z1o54V@0_m4#0Mjf91ja<qG6o4s2@AsMOviZlh%zrY1zm3XcmRmbNm{||E_?8^jN=D
z*T;TmyA66m6Fpyd<-*b)OJQ)-Coa|)Z=67Csb7aN<(eVfZn)4~-5OBxt)p=2QK!pZ
z7?Nd2frqga6h0_nhA_EQ9NSupBF<gR#`GiK4YvTj(-D(<&39wd+OGM_z8wvq4!L>l
zj+xZQw+?&qw@Zq?%8KZk5L74q2OV;xBElzp80qq+L#-9w>nBR^q(4{`^r)=roQT{z
zy1pXWW@fAOz9)ZLJ={tFbLl@6eXr%k5zw>nGTb#d<qCuLocTCw1?;L;je_OL`KEcQ
z+Kf_!Zjokse)z@}1C?D!!CZVgY|M&%Pp=h?lG=9on?KhkeQ2CYKF%44Lk~7hi#Tc0
zB6MGUxae<fD1PJa^ucFrT*-vI^RvA_{Kl8O{~ZOf{()2B`LuDbx#hM#m0Ci#>=~l+
zMTLJ+WV}G!g!xdlujXFhjy>^vXugD2)4jK>pxJHGbzV1Ess6Iy-AwxXy}ua_zMlNO
zeH!z`bA?22-$$c*z8~7p&v$_52wkJQqDNhaPl@pxB2Z)hSU6lb<5MHQF$s6}Ey#I}
z_k*a!Z>DTP4#yI}yh7SCqf=RuK?M?@FEf;iIkXC(1-G(s2r&@@_3Y`OgvDlrtcbw}
zSaZm$MAa>08TEq#tydc6OR}+eUA2=Y8g8f?j}LUPt0^Oi=L`hz_tY1NFDLG{nDZiL
zCn4TpIz)Sn`UZvFs@0~kF<x+AvTk&pI`;mXCv|S!!rdRWzbLh&(mTu`nz05MvGOe@
zh@kd})}O2KAk|gA{yZT3-YPg`dF^p{54BR88Xm>ijPIq6rfb68-*!}kPMGW9!fsQi
zo<}Q-rM;1Mf7M!jefRZq>NmfGt~~GzU*}jU+4Qv4#`|_W|HwmsAr%wA_YfS*E+WAX
zui{T~x|p&2EkmPJ)W|b|rvy!3Qqz+M8K)o0yNTia>GRi_vIXrw|BhnGlU}8kDwYLj
zvvW7$fkh;yI|wE}D0t4?w+t%pHb>j<Y=9nNIIxD&c39rdiMc3Yv~rfOoT34(M((>o
zX+2{D=4f39qtf(odYks_G*U13se29>no0smBuXZnp7<tHzib4nj^%}{fUE)IsZiY9
zef#7<h<gbW<O-YM4NDq>D09&S5+eSoFiu}Iu`f1$s_dTKHSTm0*tAile@fUrM(2hi
zr5q)-8}gy!=8bcYBr6t)p%SLSIhu6mE3pPik2aYej3$1#3WX}f2W=(`ju?iW!v6aE
z@dB9ar)gV5P0nNm#5*pd95`&Po4mwWQz;24a@XREt5OTB6FmhPJ(}3=^aGKN&^}w}
z{uE$Kk!|9>Nx|2&_nT?3ywq-k^u5_s*Vi<WQ1(Mq8eK*@RcV@a2F>W2&Xnil?~6B|
z*{1JoYL|+-|A?W!gJ;|#)2cDlU(Bg&D5STksr(w5T1oUp&XldP|3j;i;xGEsDG5(5
zXr3GzJZash@-v4PQBWRkGEs=(!CNpDBBCtMBVhEgpcwLl=hZtDAX#UyehHoz1*-bZ
zB^E>7I|Voq1v)qfl3i6~$$wl`P!k>`z$kB+bsCc?{x);XoSqj2ZKVLU#!v?)QY+_Y
z@dF_5s4g=-9|5^yAVOO?8gUS=7-0NKI_e`pXq5J3loDi-71p15fdK9!7<v1t`m6At
zH<`j3b1%%ZF3fX5O-v@LP#Y5N!W_6n$_2rmBAPVq@;$WifZF|>EIZj+JU|<j8-{|S
zRiS7U-LJ*mOj)S#6ypV+(GLN%y8jfsnqNXIom!F)CbxAFKyX7)Zwz&rSKiA%ume2h
z&$T=ks{8;{{!qSj03HyB@+_yIyzmz)+G6tSr#f{8^HMN%suuh}F#cTxyia~QWB6=g
zi)nnTC`K&r0zvCA#k7O~{)>6m&Bfd@Wl6|)tHJ{;os0h1Nh{$2RVdFx6iC+m61Y$C
z>_b10x1W|gjTl){2r8hHg_bmkF!ADntX?HFH6?UhC7|shR`G(v7!We1<f6aiMR<w;
zfclC~vEeWymoxB;_66$O<M1m?FKH~VHA7cDq5ooDP+Gj8J9uG@X0(${m8fyXCl|}r
zlt;%Fxj2{e2GV&Pl?#7^NPo&PPI+mGVV;zI2?r)Q-g0sAFSawPFeMh7(p4}J8L;~)
zUUwa(3IKz46+zrcJc@ajRKegv+m%zfaO33_3ff@tsz2C#uKt%%YW!y;%9^CAW<?qy
zfyy}X>M2~&zmHXygtVt!_D>1`N{IX{x|(_%<lL*eK#hOhv!?mROKI^-%3|)CS9F}C
z2udMrRka#FpI7bEA;zMy8hj&NA6*?moa~DJM;9GQse4;f_in6iV!Q4=UH!Cp{j5>_
z{N4HwDfJ&~>X&ZS<0)tZoPjMV6`kVzHw_!Q#HsLxwL4=CKeiiw(!Dwme?@jhf8Blc
zJLT1%npc0vUj5sCbxGF<kZ1%MH&S{x3gLh*F_qud_|xAu#tt!7;TyD3O>Evx9H~uQ
z_Dw<=Al{uOe)?vCLXc2tldyNQNNp2bqFI8zStzwxhW<52ZL_5DYiXX>%HGXajbBT8
zzgF3K%~J?a?|!ZM_qE<%5F8JHn}aYs&C)1l0p}LIRPs=63u5Q8g^Qw9S%S(%mL~D6
z@o2TM|4-|@KJ)t+Mvv4suiCb|f9VVin7!%S1H5s5JnbQ=ZDrTmL%rLt-)wte-|nma
zqLjesau?{n)9y*%k*CTXw^Q~gqGJ=^;Yu%cDAqaOmXq+e!;7c$O-6fuL_2OrfQ!_5
zH?^IM)bWD8<3&Jc<=>7%b)K};&cvOrRO61izwJWyol}`*4p=I^0wI%(?lM4kn|J$b
zbsix(>K74hg7jU_raNCqJgBYh8J6H0*y)@z?oQunUzF%*?S9k2)6*?q-W$Q1g)&I1
z5lSlMY~}0?!oF#y?;UBXdArj&zSCNc>lsUB9RJ(3QrNl7bIJAd@0+L9a3G|eV)@Od
zh;Hz5Z#VNx8w-f#U6I!5{%6?!fYkmnxxRewzQe-4U)?Wz0tobV9sg?khj_?i4MdMZ
z0xi7Tdx^+aCv@A0Ef*oQg!X1Gqi;6%xXj?akY#E|(Jyg$*Iya1ZXzZX65lovqL&Dx
z(}RhB2a&sdqT~H<G6p4k2E`qQj3S39mxpeh4_&Jh_5M_02%sjR7|-!O*mcIykxB+;
z1Spna4?!n)$H%RQ%@98D0yY$&K4gAQc)&Ai9Z96_8M<;#^eG&5h#ZZQ>~Vy=eNcpq
zFk(x0rg8_~17m6DMg$}R)!HejS%|)T*WQ}S5wq$p32{Ab36i5+sJ@V$u}3|l1xuqT
zKHW9&w{&&y*mwKhM2=mSR&DHOm|FN<3!$5Ee!-I&3l{Ku2OmdZ`}>!<9;UUuJ|AmZ
z9utt{tB!ov64^Dk`z~E#a^AlCD|}*oIx=@Zgulr@8KIiq&tM0YGepvtnbT~@%2T(S
zZl#U&olktgPArZO)<sS%Yw*p&r$~~+!aV|M#<h(9_@Qs6E{c%9{pnR>d#%V-8gZ@-
z(p#(m{STk%naD}Ddbowjl$h_7L=^mI>f|H29y!fP*JT7$YFgM)WP8d^PLc07iV-a}
zr=vON-bgJ_Kl@p-0`^RZXLm-D;T^SOt#Z`mj1n(DtM5FM6qReTP~5wD!+OyX(yR^k
z#W}?U)d9Ot>4G-{wW<ph<!{(F;)B1hMbPyb=k(bd%{46#`gqpnXs*xi6wDrFe7Mov
zXc)NYT(7Sl49y}@&Jo$hzD@H6Fp*$1s{qW?H#{3t3tf7Q>G=N<RsBC=%>`5Hp-zq>
z5uZQ6n?J<V&x<k)-%kJ3I>DCqIS~Jb&4r%1@g{Uj=mU$68JSbHw4e^!V0@LQ()I?L
zT>ru9^IT;5qJ6#4<izp^M=0%US%w#SI9XZ^YfN$p_))C9_yDxa*S_oe0BV;K1b_%+
zQPNmK-=%-vv3XhlSzy8O%im{0D8WmGE`JDi3i6ENMz0s`B?pt^ks@||X=IuN!crAb
zKron3+Q1vpi?lesFXt1hynCx~OO?bp{}p-44S%}aW}TvSRlR;rre5Fe&oq_(TwRT(
zI=777@t&ZjRsP9!&As(<0lntN?h7c@y!n+|o8ZMZP3l-a>E|nb={nmbYzhioA^x!!
zjqBPCU+pKq+Q2qwlo6&=OwcT*1at6#Ihtcm-qe&^x_5<X!wF&_7mzJu8~y2l&w}Ul
z09|P6+VpqYgYSj`A52S`f+lp3F!E>bh{b|OI{R<u4;1nrhL*ps!8U$VP+OINZ<R5^
zU(%&H>U+#>$OnD(ZCGhSUJBWlQ@Q&y0h*B^{xWvagOAf!tV<>18sN(@JC91~nR}oJ
zS9dDFE}h&izeR9^!bhw?%u^}4GyjiICpi0|R9OFki79G3gsKQ1O&lkGha<E_n!CW6
z>S+|DKlr0S5Yr7d8V;PC6N2=Jg~p%aM$SFK-%yXHQ6`T_K}G<KMgYc&g>ja`?wbz#
zn6mYJ7KlI@k4*0%N}0~2xh3zVLd~E|{LIvO82mJZVEvJV_`tdjMnBs)BY_wDnbO80
zKSysm+}y#J(k9P9{OTDW$<t<)Fe(0Is)5q{k!2dkFdmuy6s}<R!LfQVP;c1ocR8+9
zAIic8n9lGiS&f%_g(Gr&R=d`I@{7*2a#|ce*lE&H<B>+*PE02kBu0OfLNySQfTF(}
zNMDJdAHv54k)wdgVF^U08gm*sHl{KtO)j44AB8;q?F4c}aDP8j>dm9n71*MZ!ftko
z+{ON$Id~9$8uuieF77``!m)m|EpuUym0`c3;aTmNxclK3`0z>{#&&at1m`h<rUNID
z0}zY=lA|3#{mFiQm|6N6;wsuj`b>(VTf4p@mL*Q*$0=h5o!D2wI*T4aMG}Ic+Wf~K
zE}fVfNY1V&`f&<IR$zAuh}}NM;zg8=Ao`n`;)E<^a|!(qDUM16HE9Y$$w6f)$7EW<
zbZB;YxowW3kQ*|2W_l5vUv0C=+JQ_@*`-~d{Gyw}Cgn7!(v-#JoO|VuF)K|W*S!m%
z9rC70v9?dLsm1bQfMqYzJ@`j>zD1?>)q;WqRrXikqzad}S*xuoIgOvP+)?!^ce7-#
zQ2mMZR=vZgt%xhA_6jvl&nn+;$SewbpDgWYx~CWfth8nKQ4dj~*FA8`u<x(=^IGU#
zweZ9Aip}QD`8}86ixlwTnlQe>6<gqY%psF1>|?r?QE0hq{j9~5ySS~^aDUL<DFz@|
znOl|_u~7t0xtUSKHTNd!l8Vpa)PHR#o&VZ%hd+VeCZ1_0@;RR9S}6IkO;?Id4<gA7
zR_xJziQAQ$EYHS|Mqbg3A6`rj!0IO71v*=qmj0$r`z=QN_0wv3{Z%qaRF~sAi9!VO
zdyW>Yu`vfSdun(rhGBI)3-ij9{a@_eXH--B`Y-yKLTG`6CP)oMq<4@`AfbqeASx&b
zp$XEP(i8%rNk<S75knCXQIVo_6B3FPDFPxzLsJB0p`aon+=*-Lwb#D;f6l8j?wfmF
z&ymc`j5%h0`906`{e+!9UuqW;KSaKfDsyFDM-<Gz)RB#gP5<<lkZK$%6zs|kd8a;b
z8zsM7U4E|e%iXMV+p`GHG=_|<z5uLgu{+vI_uZk^4Y@fSfvv@~(@eSw)pdoJWX&2b
zookwJQoG^B7GfP2oElN}a<TbZMcNCoF`2E;xPa;B!v<I8Sm{@qr6(U)<4~p=wx;}G
zAdI<KqQ>!-r6Ld1ld$LJoOJIm50Ay_o<4eiWBjGeXk-y4x#vgzd<A;<z{8F1w5H<+
zMov0>7YLD1R&Zq(2>Mc5MP2Y)54sw;>E=7+#;^%BGYQrAq+gNRcp%91O9zn|QBlxy
zm8a#tw|Q)@)InwM&@bk<WJ^bbkHk_Wj%P^b@-E_!=$@}=!{>kT@2#&Xv$!5_XzEuQ
zSxb0T?sQvS5gpQ-K$=mhV#TXm*1x|oa%sCny;<+H`qfg|Q@zX<%Mp^io`>zvHF;il
zNzyrY!%Hjkg<C(PTP$Sjv&?OS)PlS2HV3&+8WdP1&gVx+IKD7GZ8C1kI<g(CyI=;N
ziny8;wlj8{Afj(Ac3_lRk&@-Keo*W}%C_3U;7;i&zru<c!G;){uXoYAr=Q%>Wrwr@
zf$k#b^X@o(FIt>P8>`X8iP@$)_)NuYe?ULKLis#b91RSHmtMZJ5u&_5aMWB(xo6ls
zNF8xfyE#crsSbVX){=Q1{)=pRN<_emNUuzT#8vm$Le|Jq6YtN-`(B6Ao@|<&Pcn@9
zaQAL|)XKfLzI6e0J<!Zcl;<5+90C5xQQJDS-;&0Aovtgg9!*+0M_W~BwO3Zph3{;I
zE}lzOSr}jzZp}_K3sZEcH?cnGGjb(sS_bLda}^jMBd#p<u%0d`f(}ryY{Q=p+1`W-
zuZr`oDq8QeTkD`$2UBCR`<z7GN|aJna6KPjoE%M)*K1W0ov5=~JiF%;c#3Ln`D{=_
zx0f@XjhN9SEXuiZUUMHxB_lNbk|hXk1&0aYsB^O7N50s`%T2=tRwJ|AO^1rR_q{?2
z9%m93FM>uat0d}H#$6a}asFEu?PoCxG0QRDcTiM*xN|grT`H9z8FRjgB}Q7JQP=jk
zGT(>f1M*i<*75MOv=7XZPfuEysMTs0E)=9I9dDl3DB~=|-Jwd|K)t<lG_=ue)Ii#t
z>tsc8UdjkvR^xl$&nEZlJ3-9r+86g>wO-yBOgN`;N48C6v;=h;O9+)gG<v;}K?f0W
z${f!hc)P)hg0#7O6oReCkJcSJ20K`7jmr!@Gkohi-D}tIYtyk9Hz`rR1Z)3_dz^>m
zy7PYFy-oO<ZIZOWw@dWKAJDZ;JvCa&-|20p*=(D6akNZ~>AZ!h?(wVnqvZ!p&s&~s
zKA!(%^p0}kc`Hv{yTb9&ibI{}tuHj&6@MGOYsBPZlc;;5bl+H|xv9_bYt1Jrw8rio
zOY}K$NB95gqEu8;P{ILyS2p{J4*ss7B+XXW|8I5C-TyPX=xxM>N>c-$<JTug@0wkx
zI@#uP>gnXzqofPfo(8^WUQLca?Yi*rLYuGicd$x<xLA{D;OE9aHPLN$vG!V<-?>9m
zuLqMZ*55Jk_pzUveARXFNkf}|K={<uTSRzcr$Io-^{MIiX5r0aZ2=dbPR;z06yCaM
z5E%7p>dp7A@b<55fid5w-tHnIC`^Vy@nEbmvw1`ZUwcr}q3Kyvas>T=VQ{Mb^c;V8
zM3-iJaAx@Qyclz2kEvnE)$2#67Y>?7_MU7H$$vV%sGJ<x?`arX_-gvyq3*~R7urLM
zzfZq6VvZV0Gz=@{pII_Dj~cnw9#(M(ED$G0jovZ5P-Q=}Y~LL<-XJ<c1pW^StJ<Kj
ziZ#I>HZim^GydNotDa7$Kw-7XnfFg*)!+T>pUCQ+e<7=d=fyx_735X3{lxwK{lopw
zfyioOfc!w93Mp86AXxoWNXg|8pP~yYzo}LE3l}dAUerAse&=s()%}tRNUeg->Z2IL
zwAk>!snx1@9H^~=$m&0Z)!d}ZAhP;fSjGNRSWQh$%}lj)O~e0FSpAz<1#Q)<xp}X1
zJ^b^IXXf25%S#KsehRczCx6?jVK*E>TNQ*=Ba8lmRZEIIAKc1~E_MfP)tTZj&{k#K
z4visuJub-yVO45r*q2gY5LV4B_y5~gU9Sj9`pv8UwpA~Huxio$$ou!J*Y8JXR!4%o
zYT<){zhTvi$MOGdtNsnE4nN8M`Xuea)3iT%RdQ42pS<eRmfUYGx&O_pwo(cy6v{Ws
z&1UM*pTg?>j-utx``<guA9s~@b(OvDYO3$K3ks{9&qts1-W%wx`lqn^PhOQe+|W7v
zzJGZ7kKwk(5gN#=c8)gpjn0pZPQ4v%`KPV={8fAJE6S&d|2MBX@(*5hoiPXst01pB
zF*i6lzdpGz`fl;v&&BaK?<W36R{tTaPXC9ny86EsRyQ~Pudw=}t>yb43|iW**s=E3
zAL~mm@4F1PxBdLyGWH+B>VgakK*%tNaJI_7gjEmTB?bxTtz#tcp3?qLVYL#9mddwq
z<CTU|p=j0r5?0-R3#(|`e+#Q$Kw(vXl;MF?t^8Y9m785aYgX1Qg2JjX0`)%$tCD{T
zs}&q5n{PVt%+h<ps&s@3D6BrA+Gx+_No8mVoR{1aRwaK6t9>%dzlGKFJbem(3agQl
z{}xse_&s6ut|0V04-5?otK`3g)iDNDMWS<#ibgbuW6+e;yeoUc>M@}ke&zobR)^7|
zbnao9zlBvaD6Cq8!m8Sz!YcQF2&<+-$H#vQt2%qa>QGXVDDR%I`nm+Jh8~#v4`DS5
z6jsaXA$!8AdYZ@txBP%4jTf4tTd5B{Chczp3aeTARvR+2n33PY>V^VMe@|E~E!Ef)
zRzs!fTV<RQ9uqmgh1H8fS$o1NaZgy4ql3a~R(dH1=Ay&Dh1JvR7JI^~sv3cRL{_a!
z4ir`=_4kBT{dh|Se_(o0GV4!awG6@T@n6Dfnn)_UMz7?^#GbI~1q!P@{hXk%s$cqB
zSdG%YQRxZ_tCwbtky(EUt7?A>tFNRg>uEO9Df+*K)$#;l84ElC6jn(o#K}Ej)%H(e
z_4fZHtZw|Lu(}v02!O&W%bu`mjQUGh6`ciz)xbZ6)pF>iiNA!^MGgq$U&3m6f)!bg
zO|%9SRyF=ZSiSL=uv-3GSe4upRuj`98KAIQnD{>lt5tsrs|J4xt5(GH-2#HxIM9I}
z{Vc`@3aeRIx_~bO6jld8Vbx7&bWd27NA&y_R;vZ^?n#sX5?0;!;r=bG(*7x|?o)fi
z|Cg}ph)nuZSQQ0@)zX^&AYMzsWsJR0Ysp{2YRR9%DhcTU3ag_zCMcObVYT9)!m7cZ
zu=>K}x3KD#edYB3B&;^?39A<;%*88`e+#R)wM0Rn{NKWA82o<{R$c#>!YVuZ$kqQ4
zR+BLG*+00hy)68|5iXlO?P)7Y^&3_E9&GpGSE|!K_7beaCesho(2_Y5VJ6q58b#fg
zVod84LwaN_X~TV=hYBNZ%eK<nuRhHDY~^uzX|&Z*c8>s!@ztI6SCp+!?oe_5@#!U0
z;P$=PYXfwCwv$F#u1}mc0d#-0;Op|;ij60M!5E?yro>6$2$SVTw<Qc-lQ<fN0mtRp
z^6$rcSCW{Br3}ga+Gf?mFf9I;*u`I;Sy3B-F((e#J#o`zcRxMUI+&qEd{=1VeBgT1
zK-*i2Lt~$LC4{h^eoo~;m`!Bs^`_w=KVt_6quA`jg`?a`T<o3pDE;*IYfNZ;`fGIL
zL>%%_vzT<-<V$x=|CX6gw~4IrkH5PPIDC#*5j0q<gS!L~Q3K9t5jJun<3y_q7yP~Z
z#$1kD231afRSHOM-KWX-QtY(C^`%CKiFjdqjIOlcJ*_D6wskmWA%6A(ljEq>!|=3U
zzEkLLIdA>WlMKJ8ocfhos2*+-u-n!n;G``LAqU}qaFrh)=W}W8`#wfI`Qxjp%Hs;0
zd;F>1pA?&hQB^2r$o&lSWcO{fU*dL0*}d><FU107#rG9I24l5TbZf3_0>9RBO2BY?
zraAl+>*--<-;J`fer{6H80VsZ#r=0rGR{2m74s;4^<JuAFj%mVSx?Kpq?WJWwO+6v
zpZV={hpH40;plxxm9JjoVw|12l&3WDk(S$vwbA#o9HIcX;cD`I5#RkSXJfv_ZXL`3
z5Z-xDR>^s8K>>>udMTAEc_It+z>xL(q+b;C5-T$0EaGBR%Z$0obta7I{^{ws3`p3K
zLr9Wr_K4|8n&tc}vOu=0Sl6y#9CVjuIX>GlrFHrN<X+zcyFSOB{cp9MXPD<>zbY=u
zyLdlxZB^os4{!P|+`%y;>~MfW%QzB_c@&U&=Dg!sh2;pmcq^AHq`^@%*PAvWJdy?d
zpm^QU|3vAJR}wDM$81-}Wm}U^p0H2z<<%5`?0@4$g-d@vrV5NtwoQGz^u!x}inxFB
zdZMfcHXQy!LSByCGG@(`>t-7<HkV9zZInS|7hYbZaydOS|0r}tnAt}4!{ZSyo0AD8
z7iTWAc8miz$Q;FGb<B-1hg;aCc)(VJp~wKG+w2KnA?0$9A~PGlcb59Yjwfq0j*-<%
zx9wl>vtW?kOsr#<)8?9+cQ;!~9}BDzSbQq^5XK*}4%^rr_8^LzEq#7aK)ob+8v{FO
zTb+G`$0LAQ9JL&F>1($SG7eP^-uM?{cd)UD+1TA~B9rUEuP4xG2d*y^B1gO*XK)<%
zY@9#@`V$zi06|G<$H*-4`Pj(7OW|MESS%?_vkVReZ47S6P}er_rR0I=Cp=Usz8eJW
z<?Hcy0ioxb7|S)>4GNPjg~^4%zD!1N!7-S5o*Mu>n1@L_g69iG`M4^3@VvjNcG5#t
zCx{!<r)&qf8r%nN-ZJLlA&?w0!F#Uf*cY-RTn$=>Rei#o9J-lI)aG@fKocxd)NM|n
z+?dM%m%hd1I51%$n}s)J2}9+(k{@x!LiGyM@hb%rSBjT-zNjEUVYOTvsr>Z{D6CdB
zrdI!#uu3Z7JQ%_C%ZA8hOZ<sW@9=hLZ#3)>NN+4i=Z$Ck$-{KFfD0Goflx)dMWC4^
zW0SNn$R#P>IDd#lT(3apr(smG8rvcI6#=RQ%d8t~a0aY|^9I%n-l>V8X7E6=z7()-
z$YgGBieB9ZYp+3-0l20-2OOY6L<dkkIb2krmgGaWAgqdpp~^DXz%u}m&WXoZS%1T-
z@fon$b2~Mt`*)ys-$`v!4miEav8+d_Qkb+aqNQ#GSdyX3yJ&V*Vgz?7$2v^$SEJw`
zLFh#?3aXlCe45+Li|P8lV?+ux^F$!CyU9^ggJ5?8+smUy<(Whk=+YcynW3tw!hZaN
z!e^dCSwj*MvS_I*c>guSt0!QpYaq&;FP*2Bi&av=p`|`3V6&|=x=ikb=H>zi4xiqy
zH^c@lK`JxQ9Ap-F2@4w<<Sfux&(UHv%se?9y#QAcYuYe@8HA!lB@Zj`7K$>|<~5GR
zmUC8*NIAds=Qv^Y3(f8WYOq%chsq0`YyxBHCcYm~0q^Ad=j7SSupeq~`p+w}eiLKR
z@;}TeP>!qE5?T8A95sn7>m<2k*8R$B5a?rA#_ntMq7C>V3ShRyNGhaImdmOJhW=dq
zQ2TO=y3vMBA$uZ{gIlYaheH%|_?`!$a}?)z+A3rO!EyEGSnchLWIfM3#jt%vw8K~B
zynMU3Ilu;l=6U%$WeS6`MZ+H;ZX05jL*$D?M>PqhtP{5~huIJqG>TlXSOb$9y0Jrn
z_twCKhuG48Kwqn%Ujx8vn_`2lGN@{qrW|@p1tB#Ad^(K|ra+W!ild3eYd<(O&TyWX
zWOHAGG&4{q1&eoxccjR7swYqi1ZYH=sVEOD!V8*oj`=ou4^|BTVO8vPj^pH`cc3F6
ztXj4QtA<$K-9gLTASiHyuIesK>u`dHCKe@0^h?madjo`3=SmR6*F`~CwR8_wwLoO!
zu<i=KVb#}br68=TM`ls}7pxk+#+i>UOZykB+E{fTjG}lXxCg7IVj#zK!B~ufJy;bB
zb^i^kijjZAs^|wCYY;s$Fs%Dv$L0aZt4{T%g0QM42&?k^hE>ac!>Y&s1*`J>3syC8
z|7<B+HzX0(bnnBLFd!tvBFRrdgKf<cPhEoCi1KCm4XbAThE-|5Vb!~A``@H8F+f-q
z%^V$6TnoagWEL0DRV5bFKv#8FwGJ9rD;HfXBai-g9xaS{h#(_JEFYN3-i8`O1wdF8
zTR(T^!6CNWH7V&f`;IbAq$$1kV6`QJuqvg|utgi~aFgphbEagAz<?YiyQ$WF=*g`g
zfR-*=`+m9B5p-zZlYlg)BP*yUAgl`9sP$nry^pd<s~;9*b_ZcqmBvK*hWaH{YUFQN
z71)DSjkY)!S)U#{QkO8*WS-jO{u@?3!Upuop`}+)y=$d<HLxuT#72lYI=XSIW)D_<
zB-B#p*it7G+$qz<6AyX6j0z?LbyWpLzE2T0H%6oC2ISG*H(S-@0fDu;Jy;cVRaG9y
zfUfE;;Ww;W(+I+<&z4bdh1$(dbIv=qcL+V(j>{7=e&*hcHU(i-FjY0@*+}m*OE$^}
zS;`kjii`y`#h1eNFIaU%<v(FnslQ-Vcq>I>nwP_m^OA$o;GeMS7o^}vNCbiNlLu!r
zGbWe7iBRj%MM?s0oQB&ptT5d~e@|F7)MtGsSqsj*u#eEpw&^y)orYFQqW$z!(_+Vq
zI?o8xBY?y9+nrmVSycTvJ8Zf-7_><;hhtIaAfe0WBkgRp2SLAkWtjF=3m);2=0sug
zMbdBB(EW+s(revD>C7Ic-6{H_7k58GjElN1Z`0(~>E_rT>@=sPP3M)O=WibO7)^6T
zBiRh6Ib1NvQxv9qc*HXTlYdaJp+4J<A&w68(GCK~I~6vkAh<t3&sCr|zY0Lia=u6R
zZ)3Qm8lQ0nqo|iSzmuQ$D+m^C)0VFGy{j=(C9>d#5VC%@`@SNjfo=~Xn-MEK7qCe|
zvme@~wJ6XphpBl|5HSqq_h_ykL^uMBwPK(<*Ip2atOL`7#jY>j*#sI-BSu=y9uqi;
z6eihALlI>7^v3~1;pc{}66ET>JS4sG3fdFP$*a0&tI|MQl`^>FG*UQAgL2T}pJ=`d
zG}d23($zzf4BFBz?{Izp2xzO$5MS{7bAq<&$aS=kBKnmLGChc+<hQMw4zPA&&@Bw+
z^cv*)M^3Pn=*JN1oBp1ynnxJRCgg2rvnA9Z;i@Cjx5o27_Zzj2yzK8`c`!7i&n^wH
z&5+f|LnemRP-cIQk)W;_0<?_s5?ihCt8`fS6RMU0Pp^SzlbLn^R&Ojaoy@vJU?T)^
z^w}WSoe+)L%oPmOt00yV&@TP;y5urTOb~}>4M?Jn`-n{CP{$2FD##6StS`_~$V0?Z
zsQX7R7c3%3IKTt52dm-;!$$qa(O33h)pYD%u&M=vGu8j~nII0B>fpoOv+Un5y}t8l
zW(Rn)MTD2su#<mHN-0jQ4hW=e%Zvb>)2%PD`frV=IX3+{Ckbz36ghC%p8f$e?!iPY
zmNN!B^9p#qLuSqY1b?WA7X5^31X!W2Z1YD4c{y3viSULR_7=*_;LMvp&dwzd)5aN6
z)+TRfwtJ+j=ScpXqA#aSZcWq%F<6~vEYPSvBK-UIi@qY%pOZ;Y;{^~_tq>WM44AVH
z5U|Xi_HBKu)IJ>na52TqvslmMWWfC}?5r`UFb4b#mi7JRg?%xvJ>H<a+Glq#GXw@x
z1Le&z=l3M8Zn?ZYRrTP<jy+Yio>TK90Yp_*Yd9lzS0S0&XipW6?=}5@!m8p&xw2oN
zvI5wo0^S$3^Q%ia=0;#p!s5ChtQt>M_ESoFV=1(aPNpDgiuYjEnw`a4F)NM5E6wdI
zt^a#r)w=tt=%>-l{pncdJev;!!5j(XPiG+`Y>-tx@zpWsRdy~^!_X(898~QK?pG=(
zIVx%a_`om9ww8&mApF58{>Mhl>#cxQAPe0W#BwcjltOvNz_3?<$T)+uFNj0n4T_HC
zY(%pOA4T4ytU*;j^WC0UAg_h)ptsQ@2erSP{lq+KgPwe&`6h;ImB=dbuv~HX7<%Ca
zT3KwJrn?RiTZ4&>yvznc1=i3QjxYk-y=>;KAdXc9c0V#IhJq*|vcjKnRFGG9);4U7
zzM2khh+jf~C9ox9Sr-_bg;<4O820yTUtI@>8Ec3JEaztiYTJfA-G==;gOlyq+WDCN
z2JGZ2Wxf;5R)I!s*Kj1)u&-u=cIlfwLY}EV8wJDO0C1)U=A{J=<_&Fb)gTKPqw9pt
zlt-J_l+mlex5gmUR~uv}fvu3Tpr_n%#v^QzdwC})A=P>L-VZm(RjQ~Bmw__6s*SyX
z!Mu%Ssjxv!4Q=!Rh$%Gc-VkbH=f}~vsF&a&p<mA*p{^OA7ItkAX9Lj{Smr74I>{(M
zEHaQ2@g2Q0{|D!H2J;yTB7r<=Wwcfi#9<Av9$DL%_=F~)&<$Y;SIZ??I7C8H_ajST
z-TH>QPAO}cyXnRvx>r;B)P_kZ=gYm}!8wB`L{Dd1LG;R*j*1f2dsMGp0I5}r?4aS-
zOfQb@w~MiQy<tDPWLtjtnv&<_=m)z>YlF?SMQRl@e#gxzV-_`h67_f??&RDf4u{B*
zhh}@is$*mD;)^?uuU5~tMt)sgoO<<#3nh*T_QZ!1HF0>5!l~NL^s%nWzNtV6I$m_L
zsgLuse6N|;gEL#Le(T{G8SS1i8$bHqXT4C1T^*`^vs=-;v@%ggr6BCjeYGPHtZvD(
zeGHSa+lfah_YMv=yz}Gy)Un_-bzX6SB`57nmaS^64EM6bEY)<Mmzp<u4Na?I&kEsg
zA{*aMY0Bg^(4UvGO}Mz`ljA8GE_36Z%xNFF4DJyh)jI_^;;cC(0#Uc7bYB|6jtYHJ
z+uKHaXzBO3OEk@|irwx+u<1U>u+OFf?s>sxg02ev!os1W!RDgTqg-{38uR^PmY93*
zMT53oNdn<ZYey~0mWb9`lYXK8y|0%j2SklpH$UC;Jp+9wt>Gg}yH(mT>ee5#tvw_b
z(@TL15K>>CQ&-t~tyFb`z@walk5V<iiZ2RAaPK;X<<WD!`#&e-oz#D9%I%Es<n8v}
zu}CQO6xitIwPPuV>y~lX-xIL9DrLsAOs1LUv-zffHWTx0xL}U)9J^re9R2mHJ%Pmc
z&HhZF=96xxw`aQ8r>8&DP`WBNYLHr1!xCaLX}z!`lLZI-r=~X`2o5ck&m3|=UsRuG
zmHGt7XP1tgeJW$=G3+H8t5Sl$9sQ&!_qP7`^r|<}OY8@@oTDO1d4XzY4-^G<Jgy%$
zm%LR!Vk$Hyonut=*r&oR)tGcOVl^&7Ks!xs>~@58yE)J4hgAAWhvbHu3HQ(!s;6&8
zfBWG@Chd#zE`6U$HMo`Ajx=rD4DP=5)<gGh@$StYor7W;KT0MmBa_m{&WCHSG*`0C
zJdWbmZTIN)Q0$c{6S%w)?8WA`nOOem>DT9X3uGzU10q`WL-9GjEcckxqpRIl1a&J|
z+?br-1VNF9uToWcHR>(sA%~sj7Hv;S-3hZ9j5LO^j-J=<KBFtZ$~16B4aMYgx|Kkx
zKieA=pXuK-3~xT`qok``bWJP&{cNs%Oys+p;X9E}(vL-@)V}E@aeS=nE}s6_^lB%1
zjrOV?8PZnZ_M~Fd`10j%Q{lUpH**T0a+Y&XcVo8KUx{5<BWE39?Xpnz8eMmRa719?
z(l&9VNO&?lqPo%BHI}EG;9JmvqI%k}+ZDv`A`CW-(J^S`Mj3(is0DRLaZMIAdV}rk
z=5Jy3g}f+xIGst8vUpx^!4-9R6Nf=OP7Z8h4tFX?C|xQO<gRng3eu)gFpsZ1iIU)b
z5Miot&NeOn-YoC+C!K9!!)ZORc_+HIsan2mhOdXakZXjQP{nYDU!1$}4Xy5{qdAEo
zba$~|o95VWmRZmRcTBFDg~^-Y?4!oz8*EJ$7G}r6%G(hIELWOCgspk1t<-_6;{{&c
zA-P!zQZlADB(0;4U%T(&DW6r#r<4$q>Xbq?EEngn7d)_U1XT9iK6H8wjpR4>FDga<
z=#xd%<v;EBRKNAZN~?FCODu!|)7<soi^SH+_?#c~@Dq?gdGHiYZ+P-hWx;j>yIU*u
zX&Ry>@EW>Z@p`$J!KcW<NNcnFt`=#-Uq6l!5q}D+kB%Sx@bx8`-P0Q<vNgo<*ro)1
zN5;S%?9V{w-V$0|g4{iAoBgIvt*3uKKNd2WT>%QKB1>pd)dZ_$g?&yDaFj!oUD3Ny
zIi<w&Bj?W8-Ad9xWG#8yW>o2)C-b6I4Lt3l!v+K}^`~AT$#xH-PF7nEsxIp1yX)JG
zRfEE+yCRo;#^TAEtC}}*S!|I*ktZ6vPCBf8ym#j2R(fy3;;BfH4#PcRwRUa4|5y3i
z>bU`m^r^=>LLZaa`XqOsD`?%g_94|tG5Yk`qde!Y-jZ<Sz>NqWEmc(|$ax)&J|jGP
zK`mECG1HAIuC&3|P`6m^GeA8f+V(`X_RfQiwPi@D+o?vH=di=Z<P>v=T2+bvpt@+9
z)6(R%+#ck)(6Z>W6l?qZu?%YH<LLWUbZi;@Kw#ugwWIf9zB@eo<)g5<eD-UXecm8Z
zPIT*r^N)A@1z+19#T;RCT1Plg!fi>+_?5TrN8{@SB^2XD^j*5?Cb;vLgAy+b&9XX9
zoD%GvB^qqcKJjB}7tCLb)4b#c=?bIEoD0r6G3_QQTTzRt2+lx#fC#*I=+=7|ob|}k
zQi%CRW5z~sPR1n<DI+ik%j8_G=anLlrH(m7{K)Hl)e5P?UpsmoE0biDKf^v~cJzj3
z7t8b%&6{a-2s<{y^E6u*q`O~N9=oXSlPeAZ@xNZ3o1n-EoD)840!0IW0z4u~eT4-9
z8A|#bgMl#VW202E!|VbH-tOX)Rr@B0Is^b<@+*14nN(MFbii6S>rCxz3Kll0V1NL0
z%}ZtK0iBsLCHCx*+=ultZ6GH(wLESua#6$Z!MT&~pN`%=r=?+c>mxlM3lxkGAE+WH
z8yqTSizi5Ay0uB3u@kaO2?)y{3_{qd1W#yNniabEXF9h|34iLc)uvx!H~ro`GgA?s
zb&(@YJ#R{QcdUT6ucoNX(Qg)+-<N}_BCZPm(w%5H^He83I4Cs5#HN%IF8LzcH*_MJ
zeRDkLhWOA2VNWs;ouqZ~`ix&e%a_-RPgfqL)kylE04Y%w0BGgnyroQdpYi2Mbue#$
z$N*#%Y*pX_Y5-<{fsC4<KzM87I4FbxW;7Nm$Vm+M!b11i69G;%;1S*Yss<od2G_^2
zY^IDH0ssI>@V1p9d^mH6nfId-0LA=->Uj|d2ZBjR00VV+Malv_+G^il2+kf`xFsQz
zg@}OyXbMbFB)#^w$m{DWL?EFUB61Q3nBCP0a}fnEBIMlzF<(i57%Y7F=UCFk-DZrM
z60wh8WV)eiSP=;NK>!%<t^*W~iCgK)>I{g{X57?(E&S2@9tc0hR+*R)$*d3zMfVIp
zv}*^hnBta0Vw=0{Q8C8903bufkfok0gH?ti^!(WmN^m_>^Axb0`_$(r<U^UE?akKS
zmezqfU<szT#$)v5ND{1uXm($Fk1r*+twgm={G=T3P~}We`mv%V4Dy>3Ijr79;d?};
zo}55=ojFH!pt4=DQ8!cu0$t)lwzhwyaXsVV6^JnY+5*T6wSHM?NcU}7Q3rTV)KAfJ
z4DF2G3xU{IoLq{DAib6e0|;PrgmW6N(sZlun}k+sGts&FV9$2V?jrznf`q;aK&IN$
zumWfzS6G`h)YvdjhpQhq`9&{|mh)~Z=ac+1fM`69(-r<vkBp!rfjT6?SoDMO$Cq6G
zYaLcjhCnu8F%1NQ4O#j)1WPiL3QknjD0IT`i5^L~Nw?Wu;+=0RAzKTWAcpYJgmY?z
zmP}W0xLz6;3xUGO)qV&5{f3*OH>qscCSln)F*tto3&pUyOQ+D_e3;ysBYLh<Mk0>^
zSY<0gBUzxR0Zfbl2#vzQx++#W?2McvC+eY_5Xh36KLE(AJ+<{{=KzR=O1^dX7Kz4g
z#*ua*thq<1uFp%v-TU#vr;Xg76T|y+#B6|FVXlOETB{rUNp!!t2smY@!5lN4!-8$|
zE9x?+H@lWD<){DL4%#mAyhHY-TBwb#01M*oicyF{oTE**e`}&y8c3KD2`ou+K|PKj
zVTw-lK*OzmLSRdW?ddrZDZQ~D+nd=9LnlD#5bj?9dyoJ@G&1Gi1OSF1(SzuWPGoT)
zn$7mAHzv|s5`9#NcX;85loqqixD2~?;Yfg;m+9?&zREmHLEgF%$u5;`!-pG|H5$xQ
z^6}~*Vybeudc)%Sf`X6J;TNN&`TbVPUs}3e=2TU;z_SH@^z{bF>jMQn2dZ1{@g^cF
zTbP4djzkcfd5FVS2$SgM3)L;V{QWsp7%osiAJ7K8w(FbOO@(cB1FSlm*@<kFdha0}
zK!&K^0&knrF>XqDb3#9k2M(#!YhUMj1Ah@GsR7j{Y330#{95O#^%js#bWkyMI0P!D
zYp|mOR?lB-AJgBm+VPV>qlpqW-E)%7DhY|kCkmZyhJ+6z@@Y8)^waWtNf)d68ujwM
zy=_8Ml8}i{@26`!2-u3mF~LD=axBL=qT>v8NQ5=%pdW~s644?<&nB&anc+iQIN_rT
zfd%@C3#ty@3EV`A2Mqx6Rp|Dx@YiFa86%3^HU~Y$ZHYD_KjWYi#P`*8W(7lXmygSe
z*lCrHs2JF39DTW4G;FKp|MI=6oo0re&PhA13wC-ZMYV6)bvptG2O=+>3r!#ziVSqd
z1IGS<%D|1T6V-fHw!%6v!?VDHykZ?90BzI>l!<3`(DztL<W3>7%ES>0U@`*3>O?3?
zlbOYW$X;V(U?3{fW_Q|@tbch-M27^`Cf@R;!ejvHJOw5T0Fq+qewdg&n!}6+R$$dk
zDnxuD6gD)*8bL;)i4P^!O<=7DG?N{NPC^Ba8Kg8bRuTg>hlTIyw%oLIOdLDy|BAnA
z?7~=%85#(*YI0euKG!xZqC<4g7*cAuf9~k$J2>(DwPHyFz{5AeDKXL88?Ls}&1#WE
z(1z_gq%?p0sR2`YCCr*Egdsw`M<P0}Ib5*6>M0sw@Z6^dbV|Vv5Qx7+>nUIOFWx*4
z0K)7Iux!4Jd|)qpxYhF$mp>49?JUuH3d*8Q;;;c&v>ORE0Qjm~$RzfN$ua{{*?<8H
zrT&t^@Slz;>=RSWC#Kp(2Nvxq5)8r;@l=8csFC6k7DU#e3G+mvct26yhR9o;RDP1k
zZeuQ^GV035>(FC_u(7`*KT$>^-n~q`qGt<hY!S9?X7qE_DGZ)mXw`bzlAg$9VFxff
zjEk`V2$s{1_g-E-de-f;?aLW1{kmrF2Yt<HFXmweEh|kUiB?fFT({e<?b6jjXw)DS
zfB-B&i=MT=1)@#;6r`uy*#ZDz(b`;~d0vkhLj)WDuq#bH21i(G#sR<ugiHhZh}1A$
zFr+5tXwn{JN_;b&X#HYE2O2b9x$=f-N$r*-@G$h0gNy;w<~Y@ATKHbyL-`h?Ph4{s
zx+3M<n8{BR(L}|8h82S&wgShzK*u!O89IR#u_b2tpQRl?%N=7k&gUx3>TJJ}bR>I5
zNMKN}6{ssB`k<L$Ju|l!XQIF6FsTe>`>N0RxBH;Sb(Xq0{NT_C<2rnw;}B`NlZ%<f
zHFW5WEGLnBElE+kPpk&WY5>?br?P*(p^hf?EVhk*Ox#t|N=BfGvA;AR0{Shy#AEJ&
zKMS)7DNaY=lv3FEKufDadP||ygs`}Q*R4bL135~UtPL2>Xo59*Z44G<%ADe~P~>8w
zRWJA^Cx-6CyHm=&<DqZh%G*v{J4qC(Olt0Tc-g{Wb9kHH;wt>yRpi52$DAh*<>So6
zo$Kl9GU#S+#kQb@R~IkMoy>Fl)G!O%d{#&2idoEIQF$vY?mP-}we4}Mo7a7o@Ip*`
z<R>q20HzUk3D948M*QRw!v~}xJvzq_FD^Jbs-9BupDY$?!8*D_E8`EJ1ALjBy>1-^
zlZ8Zcj9z{8IEL^fi5BJ>JeOc$+{L*wgDbQG;x2nJ@q5N1lrjr`r6S*Q6bZ!QBSZq`
z%}yv0C?M75wu6xAmw9`h1Miqr&be_cScdA>`<=U*@NPA2nnl{^?n-N33~*tLs~Oh!
zqYjAb?0$y?n3r5Vc;1bK5^on<Kr@G`*j@S-au}TkB3ubQoo!I2v#=mtz~*)OgCuT7
zbIO|>$)kjLvl&v%3g2OGY<d#a4}9Fl$0m7S$y|bI6Ma$;Z8Yy<P3AM-a)PwgZDm@;
z(C2d$z~928z!zMaY0Y2K5kHO?-zA;D+UK5@koXzj$51>}8vTx%*D<}(b_4_bT4~3L
zE=&5u%aSIZwsgMc)ttL<>awAFw2;GYXB*sjI7u#L`osW5(8KnfMsjW0GljJ2!<<PY
zEeYo?^k(akdOVw$S%~CSkEcn#tD?xJ7qmUdv=MkHMKq0BN@*wDWzt;bcoF$YA0_Q)
z6Aj#=H-V6;^?b8B#`%t-!Gj~8I4@2@D-Zwan3jx^Tr-+i`kf)fWiyMU5zsNMY>7Xh
z!Q2DD3VH_|iFY_OTpl=?xDz=x-+b)idZpyEu4rH*a>_ybI1H`ZvXZDSFwXAnX?ddg
z#k^sZev{zQbKN+vxae6nVjQc$xQ{nbni%)Gh<Mn{6HKd>S!(5|0lE=7CZYi^XI58N
zL!ND}a-}1Rr@YWM2D>a4?QG~opoe&b@v3GY5m>5?%$RncA#U*jh;gn{@&-a;&MosU
z>P1#+u_xYX5_!v)phTi(Oamgt2@+)5ig+V|^%9Ot6crt}FIyTp(!z`Z`qTFyQ%W@O
zz$};$?SFh9)2I4zxVOGPLkCs^xMmm`8Ufh8`JM&~<B0RV27t*YE|Z(Y5ZcP;kGh)o
z!Rc}5sKtROyvNMO(&Z<HAZ2PKxg@s#wDRCZe#pB1D8d2Fq}a_Bhzg(ooaBg3bdr1{
zMj6Q_F{!jMAqLdqW^#PAJpvlS-4BD5sm`4^CU#R>(a#r~XL7vP!reb4E;2!IFO!a-
z6T<p(b_w2a<Dplh>*3Ocu%PKvzHj&Yy}Fonj4R;nX1S}M?=ghO;5)kzqN{0V#``Z>
zu|FDFB69|B$OU=jJVGo6RGBrx`5P`?PmUztm9#C6ELDz@{P}}?EXqtUsw^<-u9s@L
zebha3wg{gGcb`R7o7YrT7T^10t6fHgr!VTU*v~(7(-~i)>Ic)RunM(-(NE1E^rj@%
z-~QR6@~|d0x^*zRAvOJJY4o$?w6!y;ZDN-?o|Zhw{`u_KcB4#<K;zGj*h@Y3g*}X@
z&PSJ?WG6${0VM~y_sf?CcP|a0E)R=c9#Ovh(&#cMtd6-{9uK_yD)#aOD6HPTJo)JI
z)U(UegO_)QZ^IvzUh3PuT&bNy7L1uwj+r-#SvVH6=o0g;`yib;W+|C1G9@uwS8(N7
z%*Vl)Pj5kCb!XKca$g1V$8OAho4C)QuzD=^t4r*+z}Rok*w({iSD0f_0+1iiVz&ol
z!9=Xh!PqV46fRZ7-@>ZgiS-^adJ6Z!<JI1uCA!l86jmjBvL(!~DxClFx3GGr*FjXD
zq3X3R{h~-axjzrFesGAqvvBV-+WqQ_a?63|8)Ur9Xr=TOLDS}qs)34Qcm6G`D*Ar=
zXn$TknK1VJCFxjwNbK<p+dBW_4?@4!R!8#(TDM(d=27z7-Bg*Qr}95Lu@a}qcpALl
zu6@({oeSmN8^h|4r{_Ei3j;%T{I)cfM?qorjl6Q#yqEuhrw>00ge(*{@V^y38hvPu
z(UHuf+`idh`}#<v+zr2?8jT6nJojI}iUKzlA|AN>C9EFkwJSY)m+?6yr#t1s$@`&S
z-Cwu3u(=rSY;S#EKjipo8QeuVI38=ss!g_MdZ+pF6pQXACV|URJ15>sReRPxrX*ZE
z>G*j8fn<?XZHX%fo`BH?(onuL=bZXSZ=}k*CFQ1xQUoM3b(S059ZK59Fj>l)O#8!)
zA8M2zH5F`<$~~%k&(=H0;Pr@q&0!r+%ahAV2d<xu+PzX{_4v{a?hxzFL+30!wUVW8
z`Zxc0mx=EL-dlu>L>?@TT$a79A00D#_x5jLHBm51ru2$jvrJir?v_k>j-{^bZ(+6K
zhEKEX-CI#xvXv#Nx^nmK6h_Ha{T5aqG;hgOKkn6)f6y=)CI7H#xp_}m-IA}Nvgs*2
z?i7qxsC_QivL~$mRHz@e)KhF2I}@$=<h4)BZ(&ujaW+*?scEtBx3Jox)bgqM=l^en
z)qsF9)&mVrxw;>@UZ@|#=XuA$R~zeGE%9~TJ1tS2#5g){g_9kE+q#CDBAZT*YZ2Q~
zQDfrv>w)Tjn`sKw<Mwn?*B5Er<QZJqL6cg=UIslf{qed*Sy;U3W(R^h47-a@=CSY&
z?%C|AE7m*k<{*|qN3jwdk|0lKQCo|gtc7dcniY&h|Ddc`SS!QFBTmm!xFc={OMr2(
z<Z#YOpc<nwW)w)~B@29_!f1~Ur395iFB9l%OlDK9#O2fHBWq<yJSnp%iv)Byn*vDQ
z$FagjI3=I5o8n)%(ldr2tS0bo?x1A$>96j|&iKRn+d&+PM2G}MW{%hUX~x!bi73Hg
zI5_CbWk=7EEF{xbG#rxLMoFBJn-Z8KbDVZIHOTs#%-=)2jADs2*2u=B&l)D2({V6~
zp7~owL}OOF6C+~Zvzb&=jj#Bkar;&q&G?2f>@huaQRk*T4(=N5@3lqL=A&7ezGT;=
zt67!g^7e}eO+#|dV#L8}oQSmAoKb8eEWBd_2MeD?$@V@<rIYcnKd7d$SoQFca_Lo-
z^GB3dYvW2P-PFYAI8S3Gh+L;7n1y<hJe{P#<lJO~*K5XeXGsNi3}#JMS4-b!64zmP
zvR2Lz3T|C;n+}s%h0FB^N9Dv(^xZe+Y}0T<aU7Av1oV3deLm6V_P#60Tsijau@o-k
z1G<P#<>{=Sr-#K#uqJ9elUe!gysWC7Ggh)&owJ%ltgpyoLY4M-W&J_a5v1#WWs_%e
z60@Q^l!~2t@|eGky2N<BthK>&(`ug!_s{Yz+oTojGKa`Cq;Qnel_s(~r%lHs9Koc*
zUvc=$wITb_7vk-Gqh1z;1V7qYT5%aJ9G6gn3HV=-|IA{`ZnuC6zwp4q#CJLC5+jrI
zqyo;UoW-G#Ex5+*q>R_f_t!(x#~wQ)6J_1x9WApZMHeDSj<2!lcpsB}wVrr0@`r@|
zCJTbjOVui-LJs01IW=sFjNp~))8ozgrOrJh1)sPpnOhL<J|I~(^GeGB>|?3#7^TB6
z9A}oDVd2(6K600iur3U{3SK)}to`c#+eh{MwO`mfoj$j`g@oUEwsSyKg;AiV!`(<V
z(W&y1RB#<c<lbp=G~p4co_*{s5xZ|%C51M}8M2$uNS8KLO|`3@v-nC9<DNC=SDkZ9
znRc&G@3KgfpUV`om+F>Bcx>w)MoKMQm)OQar6{Qhn$r6vy=7?l;$=AF3>@iQkfLX}
z?fzX{_0~|)lBt#Ppqh7_@Go?zS+PQn<~xYMP`Q_BwLX_o`o+H0`DC7Y2I{hc@$JsF
zj_3zIY|2BfY@Y$zZa#1Z{}aStJz-bAmRymw>0r0X>=FD$v~iLF`wea;^FL%pC}Z8&
z3Wv;9Ygv+_(UYu&J<Q@o3?}i(Ft&;(p-U-^8RD->#d>o)xru2<wXkzNZ*Il!^KtbH
z@G;)!EHkevZcIPId@8nZskG3xw`JD0W0%~3>0a~5vH8Pii1%a|vvzh6iysvB>b9@)
z0di#4c?=a*F|>U0a+HJAPZ;u&shU@xijh>KB&zHJv_bNC`Ui1wqEEoPCy<pDqmk3q
z2}Bm5B0?(XDm3%viKi__cbN_<%w~D@lcbLq2i{kjdiyg8ZrPU|a+D5>MH@HbeQXij
z%+q4tGV@YT4H9ooJ(`=eI!N}4;UJkvEY7h<zUNh-NAcQS?l6P0JMR1;l@+x=3`;W1
zJj|*s?Ud?iVago0l6*j+sOMLJwy-_hQGz#5;>U*?I@y)1PFAxYY~D^wC9`v#UU-Cj
z-}4>WuoJ@aCSbf+Lq>p-9TYnn9~Ze>Q+0Xe(>FD|C~JC6Rm6%lZmVglMnpk6YnQW`
zKb~I2Z5(LoAjUN@=qyni`wM@mdTVCA{d@ba!5T?<dzMGc_}2up;hH!qvff=p>x0>$
z8c4<m_Idt}0z(aOpLc1hT;x->`Iqlp^K*9t#J;E`Z`}VQ^>~;Y7iozmNFPd+*C^RB
zYmEK%C@4`W%oyqBKoglZ7Tcg=6yhPL;vvm%0R%&ketUc1_OF@STnjF{5CY_siEJZO
z(Me3J0H?=*{n*b5N}z|ZFvXg;5)>DH4J!O1RS?aP2s1&ParqXB*_@>rhIM|PB^lI{
zbn-A7+Z|gCE^J+5>{@Z`-#}rGz(BasbiqBmCmH&A7{z)Qu@oww6&OlwjBM^u9wqB9
zFaiq1wwOxf9mMzfi1S~JmuG=#)zdajOUA59R2oeVP{i25Q)<of==QK2ca<$C3yj_t
z*f2g&?|O(*A}q>bSO5bBQ;BI~et|eqB~UPp*C>GTuJ#z#!?d<dFmI?BX9&N<oV1eL
zzy?W&1t*K_z-Ung9p;q7VB~sM!!Ve<QitG>i}=NOl>(ALsYLHIc&I~U$VH(Us!@#-
zX0tS^r%5im@npLl7=mgQm8$q4HS$fwhTe*tkkp!h-9ft_5O(L8Ha>{O>3Pi4LBaGy
zhahHFqH(uFGoH<m0F&aJ6FdPDrZ7E;euMlD5sf&3wK5$I_j{FddYp42c~A|)ywN*$
zLl&AuH9>61U8T#?D2yb(5vRXnqG(p$`Vppa0=iGBL%G`hQ4h>?)#U&dXO`;G+yio!
z?qWk7y5uggLI(OG6x!?pQ7S>6!zf~L5+(~N^)SVV1;M;{%U-FbdXhZB^<WsutDdAW
z)FHxI%H>4e*M+eifpWOHd>w`=B3-3I?%01bKDZ6lO7KVy!yVjkkzJ5F5yft3<;j2I
zfcpeYBWPagTdCs{oK-%Z<(#Ju;vI%io>G95U2~DeEY9}Fi=03lup+e=fP6Qo3+|S=
z1$i8Drkb|jvG<$DUZhGeJdz7=2ZJh3%2|gYAsCge{anxoW9(Yh#{5GjuAB%EFU3$w
zahB2!^(2)O9oubECW3F3H^nq$tdaV6+=!EHJv2VUgKi9%B63bbzudKlc3jI?jBqz0
z3<rxkH`@ba$0lg$cgWxq4(Z41BD*^Ht}E1M{b=pg`S^Y|4sNmx`*aqszve}>#LH?x
z6i>j7%8L&-79aLL$8(~?Hy~m28eG2;Z-gb8n@Rg9+%=^vnzPXOPM8EjI}P)eOpBIW
zE0-vn@!Vk&avw>22{612#1Kg(B*e>pCT)&hlXc3k^3D}Q%31{NGqu@`*E^pei~PV#
zIc-{wIlkHvoa10gG*%TjXF3v}d<MS1hQg8!*N?y|CXux82_n-e<`X#Id=n!n8B0GB
z$;4E<|G636gd-1cM42~ij5q5yvGm3v)3MTogxi)0g7uIyK@d3`x(vna23z`}bS!WG
zL47;~Uk~HogrSgKO5PBu4Vr<lNsJ=*{b}4SK3Q&?1Va_?Ae|3*G+E77){=hSf<WV2
zJ70K7_Hcrf#0hD9(T9hpJowS?%@-i&EIW%X!c*cCBEQ@=ivS+S<AspRrr7)Vn#$8M
zRi>kqvVBO<E+ub(b}6k<)Xb1b-OO38D)7NO(K^nOG7ERPB(WXWwrEP55J?4?R}-mz
z5od(?@c0Ytz?!^Nzm2{(R5FYkzZrMmjDFmQ{=$?_l~%}j-qD;>Ae)Vo*`#V^;}or6
z;%hH-Fdy)d3O#Pe4gGiz$W-IQXnf?mX5KK&C1arlvi_1BJ^_XaG8Q5dr16mb{Ra&v
z;tpklb}3Dv9#ZODB?A9+X%Zsg5zn`IPoy8Z-+{!}?`1YY!+>GgmT(o}4sjMPX*vwA
zfKy$<38_M_G=bJ-yq*S^ibcMmcb+Vf``Qh-T74Y%&<7a@W9bEkp+0mdUsj@?DrG@`
zbCv2R5#JwT{PYZ6LLg3nKsQVvF?*AAiMs>^BuxrWJ&2{tfPi#=hhe?3cD52r6$~R|
zJZM6%x1=xSuP&ZjefNztvSos=gzd*u$;AQ7SB>if@Y0*mg^;*aP8fd>RRs$-w1V=}
zDWz4omuGPJpcQI16^)G30HFFnhg9ob*P%ECC*hz^<CfQaZgGi9DnO)`_Dhi=swy3@
zUrU-~f66uVA5Nr76a3D*IN3FrK!J&>HZ?=l&oqqs>J*+XIu7u!#g{^8rPP9>#&Vkw
z6$R3lkK>xtw9hg_%>F7r6>LNmU_$jmrqz&06ZqjXc<oA}$Yy-Qn~$qiSfR}hmP(oe
z9q@c}54@c@(&O1GaoYX6@yvMmeq;i-exgV^z@Hw^{1L1;$8o1UGPA((6L6+}G+sZN
zW~;T{X>O@Dh_(VvX8|W_WxRig3i|}|kABVjPlysB1)g|z`vm1m08DQ$N;l!yjOW9|
z8(})o4mhQuN)2=fe&Ms|AS<c>z)V0g&%qU|A!Zm-Br=XW<*-lzuwUbWQ6&UL?>IOQ
zL&wH*^Tr$DjfK2%3Ru^VCJ8dRwIYNs?tZmK0*^2_JjV$|)XfkMa;==*65A2{+d}63
z#QWrP9V|UKBkvF;q;Yx|fa&jGNfG}h*YC&HspTO6&Qs*v3&i(8r+RaEymM8acfc}g
zc9r%oHtpK^HPk`JI%E_fN*3pTVpL3d*F}!tVJ;+t`E|9W8%B9GMtRh)3NRgH{mCE3
zZM6^<b&W%OG|lvJaq?QjNXK_YF>~d30p2>J3FC?_8gkxm#Uz2X62>U4*V?W*<^g4~
ze2m|yx)IRHl5kI#xGG5o*RztQjijH)@9Ak%_5EOZI{C651&__(Lg)@90#t~I+pj~_
z@fI{K5Ht5`Feh!G_3^dPIKK3Fa0w=t4oK)Ps#w(;g*6yS$)i}*$N}_P>x71mhj*fI
zO4}+KhVdc=YHFJ}X^andmWfJNt@BTq3l4u42giJ@)hYn+77tut-$tB$Px*c|x7$tN
zPKR!sA^njr&)}r7gyod>t{v3yS>M8GwOGwe?z<CNS6j2fcn;OUXW4Sq_v%1c0#8+K
z!IU&k>#u9!x3yFws7k`&u_1Oex38Xkv{OITukHID{6~k51`2PpX56=|wlFr~=7bLo
zmu=z_A=J~p+>X2%zE6v)Y(+=6-jyX`IB<Agsa3-T6*TX%Sa&$SCk#Kd@#ta_Yd!7y
znK&&g=&|GkJ)3wQjs22AHd_HOaRmsQkOn>i;`9j=OmQ1aH%=adD;9l^y!$=s2>#s`
zOs)SgvYslF-cefE$QMD}thj*B+q~jibu0pQtB~&2U2B9Sv2FXfh^Z2CcOiH(6kSOv
z>#EIyHM!k(bH^npPv0}@hoTBXJb0RtN!n4z7%Aon+`JLe-Z);MW8_Jk$R#Dbg}NM_
zl9~n0sJgfi&u%fLni@iP!qM}65`?Zp&?iw3^5K4uR<=f-`1{)FV{8D9dnXr3Ia^vm
zWqyIX7xlH{R621svf=r@KemG-@fvI3KA{0GZvPVPD61{FHjaq?{yP3?@I6KD>~J%r
z$w91#P$k5$pgVE-`-?eR+I^ZND42TFyjKpfvo|fB@!^EtH-c{x`8VTY6ZC3^q?#sl
z6yg{ct|}DpN;;v~4-4V5Nl8Cp$#s6!gSw`Gv2-O3y9xWSwTr9yN&314n$@-GIC%5@
z7Rk2}nb+a$4$3TFHc=}z%oEMoUeKKG&H|cJ1EQ7dJ_NtfVuYQ|ZTZRK4HBkQNrxZV
z;R)5ah3m&m3e1heq+E~|BxO2ah>2$=$Lpp88C5WH^|z-iq`HgvviwbpwIDnL=ks1I
zJB6;(&tvYiVb+g3*_P_}6DL3R#0c2Ob^6%GG;GHka$pHp4ht{-N*Y6jU%gOu=hG8I
zUwrq^Izd$KzDsR}LnukV=!@objq)vM+jXPXUo2cWqal>|Ce?rPvBw!0djwWGZ`&q<
z$ng`F84XBG*MoWFEWnNp!|(BZtXB_?gHB|n?2>9-V(N~W%;n>QugCG{*&Da;NIOhI
zjN$x!rwwc3_`Qug0<;f3mwW4oS4bza>UR`Pdm}4>oGD}EiI@^j*sM9pXtbRbW77Wg
zYkMwTvH)N|A)Qs%!n{V2obaaV>7%y|QLT|e=@j%4qpyLc>qbWIJTd&9@yzJ}ium?x
zDE!N5Jg+xSI-zwVi^AWicg!J<PoWCEYxo(K@JvwBXHz`_?P`+9zF#YB6YYk-!m}r=
za=DwOcdQER_jsJ7mGK2_IUhW9ojU_DW2+Cha%;P$etx_@lE<qn`pD{6kAh>ahB1P1
zTYaz82WwM)u9+(MtbOQ@H2WF(+N^H(ZF|!4_9yoDCAW<uU1c)|UayIEM4g!vx4Id$
zOs&*ukoNn3*t@T&ruubl_-TYBgcN!w^j-y|388}&0kI&(0D=gp6ln??dKCiFi-sZ~
zpwgvFuS!=s29%-{X*NXo;^SJ+UTf|B?vwA}`wrft9L+H@#vC&l|9Rin^@}A5>iAwV
zpjUDCyu1+M&-qnA{h|Y<BlLLYRL~UeL(c=T3w1&4K9kaMwx?3QMaOX@fee0jo)oK5
zyw_Rp$?j4?Qo>sl2D*<6=V;xobSpVKDf3uHBKpvIw_A^s_43KRH>w|KT+~hD+t?v~
zYZ$qEgQ6DNYeN%!r+>uSl`R)vbosJA{rpugR3rOK%F<=`%U<cMnuO*H!e=`X%=!&7
z1%Y47BJeqmY}#;^)5e$%m{1O>1HmZy_`%&qFIQfk^6iKyYb2tde3$K&GtBA(JKqBn
zecTf$BgO*6e0)3T36MQZe$fFUl(OBEjtz*8h;T@W)`Fw^C`-ah$&O&QyKS<M*+jli
zyTo39RymyOOi~u*krHj_fqyJgzQQUPSw(uSG#_-L;BMb2?TH|s@Dq7=>#P}vV<!5a
z4&$l9>WH>TwjNDb3MNS*ERvm1Qrf(~3lUb{r%N_C+;Ohq^H%5+OtHfC$6icfqfvCv
zuZS@Tvu|{P+fsKKa)oewtGK(Z3VlqP$Smzfb)+}Hw9frgEYnv~?b4=Qa)ViBG8?C5
z`SE?SqFq>n>?`N)Swafw!)7W9EW*`KiCTqO${Sh=)np1XUT=JC#B%vp9+=Isc`D+a
z&!JZo!?6fX&Tum9kkri^JTL)qxK|{qG!rfKM_6ThA3xu<itrH3dJGK$?BH0gzqt?O
z)m6vqair|TXk~e$RVQ)2CNTF$zQ3-0n-5sc{m4OeOKIR#wlx1Sl`W+e^`6)-CWL9L
z2=Z!^NY56d6#pr#R&?L3elR515k)K1KVpRoJ(L>-OQeWqBGLNaJFfT`WK1GhOfvMY
zN;}4AXR|EVKH*g&;kwWnexn_6@^zyxkTTkQY;Y-zMsJ*uC12X&Wj>zl{V`Kb?k^MP
zcx|e}C~{99v1xP{`$oB5zA0TW=T;&W>?Y*?g%ZL0@cR;V1SQ~6QhP1sn5{gT&o-W2
ztP?Fo(AKc_t2t@-bL-c~yFWj-v%b5t`-1in_tv1nyTkq2Z&B<nb5|ez`nFztFKF-0
zx1*z-_mA!c{d#}-X#0f*7`08D{rT=_$e<0NiV0Z^BY+t*T4@l}eWF)58lmrP5P8|)
zjcDEz`0pA&O=ZIwCHbIIqMD5P+Yvk)WGH)m$F4(Sz*p)AruhDhsU&ZGheMTuc^Ce>
z0FB-R9&w0;3As_2jso&AhuBCFc`)}GWSD07w(hN*r5FPfM{MSru8_W0tfc}!L+ZsI
zk$j67tD1a<$`U>4+t~QiOirBH-}Mz)l45UP5n%rr(4*;wPq^?Z|Cr&$l%CLCx%e<!
zN4_|i0shD<F<ik(2%TxDDqR(QzspImSGnI*yYhkCoTHc`B~jgbH|ECS6^_-5y0>II
z6A~ozB?Q=wPrHnz+%0^}@1t^BE6p;kBECReXnNp6{#bf(`FnZyCm}X0XJeX~t|(Ni
zbS<6>Wm#Zat&R-<DHj&dikM$Tk741yr6(9Z2CTwMNGRo3d(5vhR#l$J4!hLv<*u5n
zs?Mqm2eekxUNbbHyEFpUDSQt<MOtGVtAxj#zQwrKT%t|yHOjM=&(0I<%Ar1kjI-a*
z!{)l`oyxLEq`Ir9h&4U2+m`WeR{30CL=E+_P|5Zag{RJ4L%SW%Smp@d%A+?GGqt{L
zk$yvgo4ZByjK!z%<Qc0X9jVf@iHLC)$uIe)El&(yh+CAdD3l7l(K~Zb+@f+IrJVV`
z*u|KGx5fGAN?qu$otvErBcDH4=C|o)`EkH3u62(LlUh^TQyIR!u$TKfpj%^nbl6||
zeC}$Fh}wL^px0fNn!M|0vEvq(#viiOJ~_APW<7gpvX!N-GIi7AnvKou0?UhrH=8#C
zXKmgcvDCLeetK2USk-mAqP~BV@q|5}?WzWA<7n#EttU2i>-MZo)26gusXrA1ZQHr#
znPqY^%Ix+YvbKD+a)fo5C(IO$7jwAkyA9@r+|FV_t(%73@gFolzV#5-0%X}H-W;6Y
zxp5u)Qh7U6O7{{-ldYri^-VU)2sJbHpiT+k$??JX^3R89olILH(2h2nV-9`{mMW~$
zm_$g){}xu|w7Fh6a=!as^W%-4s=byY&o>-IB>HMZglDJ=TL+ZSwLL+R>)j7+7SwXd
z=V0T(Meg(h8g5USl=-r_y9kHgk1$=jwaojsuDpNfpsYnFE&-8yL3t?UDxGx(7cNrI
z-W&MV=lWIkO!*JbPW5i?ktff-KgD~y?T0Ct%Yz&e^_5cg$s~&TIzGZBoB}s1zxqIB
z4r%8~fuE1>O3^A0kv*#g?)`qNM5fu?N4$Y6as-by-*mA)dklQzv9e#D>+1e<g=4gx
zrS94tyq@+u2!k0R90RXOkf?b-HTo<*FUs!v`pS!FK62=tYAjqloD6=T<a;d<8!g=!
zIQg2goxf@9Hh!t0rsQpR<DPNEnd0wkE?XgKqfbISV0;kEE#kA2>RXIcIBx9`Z<Q2}
z>rwBg+Qx=pa!{5$J-p5myQVQ)$)RVW=E;}ODK}LIl0q?5&1*@iS{lj|jUhKtUgK-y
zIteiU3xRWVZ}2KEJds)7l)D>8^i+~J7NlLkeS$Xw8d+nvgN+*&dDB%x1fK20nlIhn
zt2h(mmd8|fZ{BoG=iNj<%9i_49eeadH{9=r-ie#q;A2mKfZ90yH-&ni3EsOWV-`pB
zB4)ThFJJT#?6Xb4(B^|->55J8tq(<I>4-BUfb2p0z|HgA8(0Uha-SCJv~9u#3R%}z
zd@pX>h35;xK_7SVN0&&|_-^Hk&FM3ok*HgQu0~I_e$JK^V&{wTWs*97HC16rJArgz
z(ZIb9iq(HXVG=CXrd1$>IptXIy1Sg%R+|HbA2)&Zikdh2dF@^mxAKkau&LlbqcuM`
zu})^kt2}FC+YkGdvYfN3{>1L?@o?SuixL2vGOkzUbqGu?a-;^cUBfg|3u<4GrXM~^
z1O=C|&ryz~Lw}({8CLRG3~$Oq+nwYw8=g;cj_2^qJz6vuNHo29$Kn|1apH1p2{>N{
zdULz(HuAvGoPR4sqb*OpPK!|i7!WW5yV{ZDjia$4!Ov~ecwrEO(wt_COkA>v=M}XZ
zYcK(AmW6zI*Twxh^BJywY}N?U&Kw*dIb0~onXt%Kh(x_NN3D`j>m#Vo7&IL<xJN?&
z96|3@(7)S8(<Whl%3|oSSjHsOH*@UXb`6Id3O$NCSI%DX8Vl$T?vm9KTtwV8WMnUo
zGb6x<NpK$mmvj;$E3SLRy$b_pKIhea5lgZk?YT0_yh+C*R{73DjNvwp)z_=5hMv{k
zi}mRf)_Zat9-~b6LpI~38V<A=kL%3%4?@nkY4fgq5Y`65*C>pMuagY1Tr!n8vK#FH
zH?DXsMEoLCs$n1hE3Q!s?rsb447OuIj(gIJYu+MvXoshlk9Oe6d)O<U`_zTlO0I8M
zo^#v0t8zG658MS3yOCr=TON`GfCzw)MQ!$O`D&g^JT(Bg-(odoQINW2_d&qd#FMFg
z6bawuP1IT;Sv2v7a9`Nv;$9STvTSp$%JCQzI%_Hdju%-S74c#aJ?kanUPW`yvQ==9
zFO`A+K7(+QrD&eKIBOMqj=b2ND)_m)XhYE&6Ck`Nd0H@^O(|J;Kaa!Rk%I)d)&=K@
z#6kPW(nx2XH2{(g$a!ok5;H&&vL0iz#JpKE5`MDIT(`;K(<YNGE8FWJ`$WD8Rn5iV
zBbQkr$6GC1Y%DLfhm?81cj9cL(pfOm119cvdM=;0_!A0G0NlzC<Y@Lzyf#)a+C!Q$
zDhBT~qpB4Rs^v4c88TrtzjacAq)jOQ5Cb1E1mgzed>+EU#>adZ!uBlB-ZO+(w4ECV
z{H>EVI&r|DYPF1<At6|t){!8Hkp!UcF`_ruvc_qtnbXFbQDoN7(%g68Q^YGqlvOL>
znW@3EV+PGsSIw|8&Epez;0aASrg{_;e%%Kj7p-+~P>V5znsDV_U2hb(!m~0pDc5Mo
z)#NBlG#=wqm}vK-LmA-%1jLmk<&)m50|X9OJ5%9VpDTID!w`ldB31#&u<M}b#fNs=
z=RoD@-{&`sn&4H)LlQ$6#BcB)<nb$N<=pP%rSLHd=Sd&%F|yH|8E8}frFC?Wx85oo
z<1wbuJ}T6^_)t=+aV1XV3`JplU&AZe^ka-}E}hvKlG*wM)2zao2=_CqUS=O}nF7C<
z&c>YiIU#fgz}<XZ+soa2ImKd=$s*6)l1|Z-^9vR1ZID+qy~kMd9Vl4L$NY6n@?<hS
z%z;%_OJe}QdKkj*J8_}Uft|Q7?v|%%vS{e_hWFOF3#DLI@-6<M5aq|%z_0D#!*)&*
zAJ;J;!~&qjF@sm6g!AUK@p?XHX`|pwwDzUtou=}l4{FXl2H?Q8FHnrJ+tnxgeYswx
z@{OjxnE1jp^~TNyW4~inzxKxdvoFow8`H43%h$#)ze(D(9B+Wu*$sZN{l@&}Q!3%}
z8$ulHB)6ZP0E_m^-RdsOi*M!mN#nR?BExr~(<HJ`8lQm}P>bw%Au{#C?ONxXG&aB5
znWBC9J^6f^F@cT%n7sfaku04L;MH$GwbMm6MdA3ZmjgK8$s9HI#3;PE+-||lQpIJ@
zXKCkNmE!8~tJW=U&8@nwwyrL^@vHqyztxJjFZ#}dU%j;(Rq~kpN|^O?lRB$AZtij1
z>vv<m?#$x(>*KyR*ZsskpQm3=bN}^)_wuXkPa(>KyLxDCHG0s60U~uCL|1>#d70nk
za+))}<Hauy@S#NxQk#oN2bu(sYUxKoyLe{+#!mX?CR!|QWCzu4a8pn0_w$~7mfQyM
z4+SN;6Y`=93I6QW{_G3^5f{MGF9Onc1MZ!CF=P~&`64jTpDXAE-!<dgQ7>*=lW>Ew
zx$3ob;&K7-+B={30;~P&>ih$TUzoM0%lgCxMWkC6e`R3ykH&@EI+4#NFLG+3ldgt{
zJ#=8rX}g_<H@KkWpp@=HU(dVm;G^iE7tAEE3lwB#ixLK6%JG~4TK0`LRBXkW<KIpx
zA1ul|TuwMfaw0g`hwr{eQ00AuS!IOHi0G<?y<HhYoNJ`7zyD3P$ZPIVn{kou0W=}X
zQ8w<;cc!APWi=fV>n3W0NB4u0lp_P{qqC=YQ(>`JjbmfdWBcE*3HN8`^uTRvg!4h?
z<^_0(9fl_yZ>6_+MY%GlSIT|oJLQ&7*Xa^bTMzfLM2r9@*=l-Y4dK5sXn@wF?(|wj
zph9PTBy%9iX)p=Ro^;MUnLV&poITlQicK~}aS<PU&Rz5;Ht9qrDYY+I=Es9gI&NL-
zy3?5v#eVT2KGC}XctQ<-PjdR5>GXT-8DZ8L!PWvbl}PpTGgPKDEi>~tdpa}Snz0S1
zq3LcbGmV_y$vHomYZk(8)|T=#lcqAWwyq)jC3{Y8MNU;_${AvIOJG{Nbxv(&?%<DH
z><=wqm8?IT<KwS6?*nsZr*oeEc<6MtcAs7IN1*@k&43w8Iubj7BzwNVrToA^A*N!@
zIu~BDRy&SAg0tgDnqPkqUuck3Xx!*M#}LN6#C3k=viK6u#Y<O(in4~M@7&*oEU~<_
z$}F-OEAncrskpA-pCxza;O4zc#Syo~VpLf}W|)#@A}=d*?^>;-!1Asgh}>)}c{51L
zJ$N!GRyvA$6I)UmcOfsLn1A?$(_Dyh3(Dz(12(=5*71?AgAXbgdh+-!m_dQBh;fO>
zd=ecL!EiK#eiq6#g{Lb~uwmDt8^Q4md27nHJG#s~fy>jpi9t|s67<ti?U_}*?NxGW
zn*k5Xq{gx0*$?qH)dp%$On+9Lu&FsWduN`E)cna@^x|PeW3}dNt=#!q&A_@dO?6S<
z>iQc~Jz-aUCftcYc#Xc3cph9;m2d4fzebk)cZcW9OFS-baRX$Q^S4F6F7t?fvp1nK
zr6Fgo0IMYQs|+}~Q(YtH3H8&Q_AzX&4oyO<KU>~sm(6m<t<ScypU{l)ulC}6+1vi|
z_>LG@JubVx{G0(Vp250d1yd*Iqy*trUF0L>(I<4_^cO8_9C?p<_z-<~K};UKFpy6n
z2MK8B#b{AyI;W~Q`3CSDRHU@LQ>_Ls$Ovi?umNKZg#$VJo_n`VbBe?Ty-W=1b3Z|=
z>(y^$)Axu=B=<0xQ{A^l&bL9Iw;2HEh;%%l_T=LwxjI;_09cK@X9juD@GxbJ1FW2n
z)mw*S&em$E`B`8a1kjE;<Ueuc5H|o|Bm#x;X<Xh`4T`{XcWhhk9rkn1kMeSl3D}K^
z%xgS7ytNXdY{TKv<{;Uwc*!=8LC_JVpw}4EhR}By{sm;#2VlvsExym$82%cH(c%2m
zI9xl+J3zz+q!Qs;-nDJGx;$hX`65%U<J;`92X@oP>ABO{^V6T-jG0DZNtFCfeaUvh
z{oKdWLLFdT5c?;N+xj7{^dR=~Ht<D%HbTqnuf^G4A+(M?oF3dK4uhH=?{JxWv!nPf
ztWoms2Ro8}O@r+zv=1qC_O%7Mw_bg3Y>7mX2vl%~;~8O=4+N9f;&voI>!(~g&=M^5
zW%#Z>kIr9`IT~8DTaXD`@Zq*D23$A<Xw7IF%nrYE&Kjj(Sh>lw>SMp!&%D@MwAd2l
zvEqOr5wfyrI2#Gv;`}W7Z4jQkXFFQb)PAuI9Mla5Wpidz$J6Au^QPJBpI+cC{Q353
zPPzk#wFp2zK;e1z#q}e3YW(Mv``y*mhg-+%3tPD@tDQZ@&49+2MfV0Fmo_r^gclST
zLL1#9We6>&{PIOu>@(5%yhDpp<v)2$fLq6QTc7RsPCnXG<9)JsWNMZy-$q<JYjDrP
z()w#2y2JbwOQF^l#D59=MFhmQ1YWzgu;+96oByM4jE(i_%hG%Dv+nsUB*ItIC|+^P
z^h6roMluuZ!x;rE<<6snvUdmmy!-PI4Nd{x$Rly9D6TXBy!D=NEU<DC{Jt>>Uvzvh
z`|j7f<CW@{rfn0rXoueG+M(5lx1xLK08jY=j@jua^A6en5>_LSSj75U+5D~;CW%YU
z(Q*Yn_qk5EjmSzD_9Y1#XZ>%&YR-?!f{{GL50xE*8`e+l>Z3X0UqE8iiml4dzYYs0
zX$5n)zp56mv|<e;3}&5*Q+jGZ(wuD!raSp;uHn`?Rai}TF|Q4xzwO}jdP31Vql8D>
zvi`Ya^|u<_bZUx|Q`m<qKpn$!kK*7swL3>hj>X>QLgVaz2&-S*VE6qdtFG7PgzCr(
z@ovns7xQ^78L;%a-`(#97bT8Z-79Ld>b{!rV*lfWV#1C4r<%TQ&NbbUX?dYK8jzyh
z?Sp{Fc<yXqcb&o^aKVIC;-g2aw0zv9>y0CBXaaG}?wef*^;}5^MU)=1JS1`ipF78W
zMa6JlJ*6uO!l}FL(|78?;tj0=Q-Y!6C5UviW32eIKF2sd#fy&GS>^sC>V^S^Z}^Y9
z`?A%dxD}ZMZjDsl7u&-W=v~)d>~wlyhVadgvoteuPCegBQ}Ez~xK-l0skxmGH$Hp^
z=AEU%IwNp|$bOe>tX`mVj`xt!D)rn~WF!|))aeWS5bg~VI{dElkT>f?fsuIacZ+z<
zL38bXt!~?D*McLD&S+t0%ZbG7hnCI=27>I5Yfr9sSYItIeKsKO@4pop&TAjA*ektd
z64I||_+dOlj56V!D14TyijLv1z8c9u3pXyW{9vLLFZMI@^z};z#ACk8wKF}@Ze<H;
zE<Ip$hF3EGlDq>04O+L2-sqF%_VwoC7Q`&W*7uM&$tr?(v{utr{$f=i+lQ_ThobHz
zVerqho}$hhmUIlZ=Oz-^W_L4&6?Nxh!;@L>&Dp=$O^{@zilvlJBbOYLP$Q~X3TWWJ
zzFP$ld}qtrlE=Ml;9S*Q8K?PU<I-Ra{Q1d<cG%DA$C^eu$-UB+>n;|o>qPY>B_R5-
z1OtZ?{a2#LqKT5Na6$R*pj7(4JYYMvtG!<--SpcT)v%uG;S_u_`urX#tV{j~Idf|)
zOvdhek~8wOSuslkzav$7*NNdR`Ytdyxn*nCuzWP9W5T{we>{FoJ!|9R8L2@o?IFI)
z27+`qR*lS>uJTXbS2Mj@?2*jw)+BlI1fSRV*SQAXo8$A3mY>QfUsAS+W2Jl#8)Uj<
z;-ETq+MUmK>Bu}kg2lt!?vAhiCdkYsk5e~BY_<52Du)>|5T!}Tu#9Is?8}N`jNeyF
z>XdvI1hE?2Bt^BQZb)ATT;w#0JsC;b$P0j%<4jT}*^$>g!?-rcw3_ubu~VHqH0p7z
zYqIylh<R)WvUBjWu9&CXA2^KLx}}@(T!g+Q45e>a_j@~35Ks}WTRs4kiq=h%tnh#7
z#Q6%aO(dC9uE-kaGh2kVcN0D1Y$1I5wiYq`p+dY>+s7adXl<PQgtmmX#Cvv`h{!NZ
zC!OVNx61AFahKws@b7uPTJD1NC2;M;GTS;D1x?~9{idw1Ty2=)@P5`7VG?svFSDpo
z${mx(yl1~>v8IvbOb@~yaK!a8sXB9sm<aKFX)E9fHcYzSW#E}nE~E!#?|;vpEEs)@
zV#pOE|BfDiqapkXi<}W%@3f`BDnN(b)fZ!((oTIfA}smK^Hlq$Hl4j_r;=@hK^$f2
z<e+tt3S;P?<J;@$0w0C81-IpC)BymPd7HqS%r2*gK986_=4)z3C((sCI36loRoyXC
z@{8@tHS5Ad2w$tXr^W+dPsti$A7eu=eR#w*PtZSJ!${ocxaGkt^`Sq&zfV{L17O1o
zzOt7aO}@09AA(FWJOM&+g{<({<3ojSTpA1;u(C(c!*wpi0+({jf$yU~nqv*m;t@_5
z{4!Q0hZz3KikYMxT>2tbHKE`r`SJU<w!x8QtLH1yrH&iD;dQ6;9S<Y9Jf$2jylE`0
z)+0iKmdjpYeh^!C6+>k@+m!1=rbva%&u=-o+wuO)G{?2msYXa{ZVgPS=H8FBN+DW=
z7<G%X)CtDDmK@@;>GGBAsAAgHiM(i|_A2YVnJ^>q`ptEv0`2{}y8CU)NB{tpQV6We
zy*_Pj(<Mwo)NMALugjoQn&$9toJeKxj;TM6?$b&?wbfSITh}D@@w|WY2h$PX_PB+-
z?@;*cl&Rd^Ec>$P7tQ-mpZg6N>pJ&bP^~<{<qFXz{jzj!{VG)vVjA`i<i}qCdN|~;
z0ONSBFeL`jsECk}OouR5aI$2}-uxZ{<-3~@6r33!6=mswEDPvX8<hpJ=DlOQ=fZQ=
z94%`<$-2b0%8~h?KyppoDW))^TUXlK#Fp!W;AL@*Z|f$(hnU17<*S};^--fK<s?4N
zz(HFLc=BMeouot&?~dUaL;u^+njD2JrdXdeqnTypL6yJ<;pJ@k?^jya3gUM%K_0t6
zXs?t2v)oX1+G@Nj%e@A_XKT6-)pX)9$B(FSGE&5OHm^hnsf|&n%B_6O>x+8hC|-=U
z31?8!YWqecuiHwED+T%K;^1wr{Dse=>I53A`Wf+5JHzKEcHQ@H-+tRwbmOVe3lwyZ
zhDUCy)?7Y~#H_D7!yKZdUDEQ-f%VR8<|)6a?NLbgt578E=ohV-5aiV}x{)xrUz1G7
zR#^R=rkRzxmPem9E9UuLxdOWcCMwao6BOKxIT)7{d|#)2h?fHBk%xJ)kHjS0S|v_+
zTlK0=p37kv<fAQ=JZj*!4CP|rwbN9x9}1TVvP=#2X!%U<6TZUfVG`QoJuHu4Cgq*g
z!AC2hwm#ia2C~+BcAO&0(I`!H9K%;jA`aL56Ws&Gaff@CqY4)mhV29vjlh+>X(7<Z
z>ba=Z=z|H(ll%F!?iaf`tn4oH?A051ui(~uWE#EthxT(Q_|^UV5_>vAfY!;oC8o{v
z9g*cfwW8Gb9hR`(^ddF>?3ZK>c_97)_tZ6fH6)umV0BMQJM6X!hp*;J&B6t4U6iXd
z*AhO|f(F(&z{Wg%Mfty+GNlG8#}@RtuvLMcsv7G@%DqgI&Io-r!3|H7zLlH98m0lC
zH!GxDzLXjJm;2_U$vgUz6R$l7c54=Yfg(rYzNhb*NPhp&=cIgc_$&u=0rG(4;bIbV
zy6Y-8*HZez{-WybNfBcGgX7?fVOJ@v9Pw1S)ckI}1@w8C=~=w72Y~Ac7ZiOV<b60_
z7a6V91&goX!77I^ub~lrM3aJ3iOfWBUud!KZI~hUr@1Qw5N(zR$NQNb$jUXX`fci)
z>u5Pbz0jH&7*&|P#8jven+%Pp{vw&)N((9}3&Jjj!+>a>?ep9~ztsr~yR`_rlF&EB
z;ZD(KOfKq16KK!zq0dfXTr)7%qD)bEf!h5DU)LyrUhtKYC?V%ap$U{99{P!lIwGR|
zDD+ndG$y+~mq(yKW$9W;@bj{CP&ov(^6uR#+I`K3*hU?CM};UySC2ri6ET?>nvgYg
zB3sM@W$b;6V>8*3D~9z^)d51m7x7mxU^z16G%1G19IR4|S|o$~D0DpL(E@EWFY3^v
zvY<X9vXg+xa>aBQ#`i?WHTK0V%F^+8VyZFVY630zDs5j$JQEOk0UD>32I3$fYt|Aj
zTtRY>Kt?N(qiew0ba+G`4b&mtuPyFK7PO5)@sOcs*zS9*q5Ucnj|lNc=84cs^qec^
z{Pyi50%(Sk2*pzWVrZ|YC1?plILL_4hRH022o4-%KO>Sh2BRa32%kz!Bw&Q8a48ve
zT^95qEe7^6S+-vg{Sl1~#NgXv6)ALnxCboO516p%OCv(OVorP?p+ZKfeea<hm}8ic
z62bzLq85X>PKJIbLwEpaLzM@c7*y;UFo*B{5g^UcDD9{s)s8)d;UhY+jpi4bUSI_6
z@+5_2$KO2Av6u|BG*6APKB+<m7L%^*nuFyCpzV>gBLcl71(=Bek5ST-Vi0oM8F&#i
z4;fT=F*7|gGxK{!l6AT`?!j&wSimzAo|#g54eLP=3!Nrxkbxq^jFyj~j>6~@%BOR%
zSkDa1FMJLRn?qljqpgLygbA<DwCB5)(RwX+!8_Ffmn-Oq*sIL_*^O+PPM9=$_+%IR
zYCBh8m-vzWvV(cXGW?Nue#T7yLsS(#VI=HJzis0a;92%Z$6`VW+sD`q@*|WseES^v
z74t(83JmaxEbg7mL3{}3z){UoWy8EQW*G0{BlM>{sCQ~yW*(?2LSWz$XDLucHko%I
zf5rhBE0!<Jf%6tENMnB3Bt|1KldpE0qX$RB%a^CffqN!enAnXHjV(wZBa8<MO+OW$
zK|Hn)e|+}z<8yA0FT_5!E`4k>@YwFt<I9L52k|1O(?!m1MOQhB5-6}6o*?|`M|ud{
zDy&$a1Ih<4^p7nLEG@n>P#pZJ_#UDpM7$*IbV-C;NmOh}Ole8nK*{}2C5eb9N#aj<
zlRyr5vJVH2JLZZ0ZG^8l<PoAYPrS6?bSe1&dx}U6XO)%>9G9Nj#y&=rRf?BAzFqp%
zt*q>zw7RscNxZc7cG=6UvSw;@>r>gw+hy&l<^67@9E9?o*zy6yQ|%ET#|Thqq`Z6v
z#ES)uBA$+4dOF!yI$a8!6)$(dKtp8nvN>?3KT<w@^57jse#HGHtX_KloDg@kjr~d$
zR^8%$&O8UIJ$HdsfFvqtV9%kP72gj+W7|<%fuNnzioJmfv1xX6Q#ONI<wx_%twyPk
zkCo5r60l8``!kh!78OEj74&6nVr5ky@f958N}0imT)C<fO_d@)+1ZS%7|W_z=_-|*
zDxPyx%{pdVSwKho1@<Zw_0}u2%BnPfvhxCIWh9QDKO3kDUaS&#k38vKYgxvkE>Q!b
ztHWnkB5dl;+^K_R*O|=<4?n442f~lS@{EmX32iXlwK`Y6Iu+xZCa;2XWmOlmpVbur
zLw{CXY^pZ5sk%P+B0jF}UK3}qT8(HwXUgpJgr*k`W4XFo$c27k68T*AENg~M1Ir+1
zh)q>E9cQUp{VJTJ$ha<foxN)Cc~%o!oy7Bcn?}-|=QYNSkE<SPYr)eO(Ouh4HkEW$
znA-q;RVrK>_`y#-(y85;snNKyjjrBGt+KqSC90{hf|Fy)y=un2?o@We3LR(NV3S*1
z>$H2rTVttjnU6Typ}*BqbLa6TluZ;F=y=Rz=taMULDUF3@7gd=&9=rZHUigMo(#4i
zezv_|Z~EHUme^FsQr`Mty@_?MiTzb2b(6`#o2=aqbFSd=h{UAegFw5i9B1h~WaYk*
zTm(#*HzYcqa<(6;QkP#_L9?Aq$c|;smt!HFdarm=*4wuvDvdolQI2^Zwqv>ETnDZo
z25~u{{5!NjSL?$rR)<EjayELC=UN+`(eBS(B)dL0HL2J(ac}f+<y1NzwquQZFC%dT
z1Nh!~Y^EO!+zFc{(}XYxRACU|c+>;SYaZdf+Id}Ghb^u-D7T;<b;;H@*d9_)t7&=v
z`uanBY$GtVl04V<*qcgRv-!>*V^=-1-Lz0rCd^fBy^rIuj(2*I&7CQd+*j25(<ONl
z<GWsR)x5}Qdc-vVk{{?b8T9Z*;q;8(c%eVwUXPo+p0I@m0tN@;`yb8qr<M<nkG8#&
z?Dd;_eKV+dU;~F%OBBi<n(+|t-hQRamvczzh69lv#Ni+1!v`B|&a&5-yimYj!>nFt
z(5b<#AWZ+9;7LSbgaocsVkmv^bvqJ=m={dv5MaAMQWt&-0fgHF1g#vLpGs1JMv1#5
z-qf(MO+AzcnPyuL6;Gyd#h|;1V+0Z#rxbQ`LlC(+g6bG)jephiYRI8tNcH{%VRRJ1
zckBG<vtX{VBeFj5)UoKTTWDtz`z?yb)=1dT<O#Lc!izt~nU==cuTQAwk6wQImM%%;
z&X~x=ds>pLTDA|&*pnwCUrd|r&7;u?TDj(tbs8uTnUqhX^#Ehv^7fPPTh`pE`<ud*
z@)EU{NJ0fNOV-rX2%f}>9%hglADhhEnYO$SZ}VhVGG!l!AT_>(MQ=_$-JE%D$Nx1{
z=0F>EnrfF45E|j9P+&QRFux}3jB^{T$Wx`MO@EkO#~J4UZJ(*woExT}uV`1V@~k-m
zK*up$pH?BxEQ)9MW-G9B&wWt9YE{~H^ey6@j0fYRuNO8q7YK6mX^~83BWPkWI-CgE
z!KlWMi{-sOp0xNiX{K`_!a#JxNBGlx-@XU)>n1yWLvGX%2J;L{JC8lUja2(!cW@)O
zn>hDuhnrnS*xISLtNXJZ_joYcLzc$aoO5;C=*h?^ML?s`VeArV;URX8&71vA7}VJl
zt-r&1%Ut;NsSe(jNo@xKCJpXc@(0%tI<f?o1mYBwTBf&HW^%YLt~+*4D^QdhaX=gs
zea+kkfD#DJgCyEZva$`Ev<#v=#`iJ$t!x?QP*FSNsqnERZ}ij$TAol*d;IjbC0Y+z
zQ(=4lZ{*9medsTAbH<+N#39TNb2E`Bfy3>!qKXBjjdwab6HLjpvJlQQ_Sl2AwM+Y9
zg*?aD5_@ds<OhyQWW|*+3T7mH2{P6^PxVVD+t6$WzBdyVH~pwz7p_o+JPJas0^uYw
zx_=A(ghEU8OI7ty5jWO8rlJpWu;1c`eM&xB+@HkkiiC8a4?M$2Bde0Vq6yy1Yd6Fu
z@$gPNmOCr7@wjf-fzz(pXKH7u2a#?Iz}IFz+hajjgrn;s2RQ?g@omt(cJvcGtcD4l
zN1;vm&6kRix6p9(Z@!c(eS=E_>l`Vg?Gx5%`e};@v9#S`y@{D5i%en=RfL@sfDRAU
z&hSF>8+hkAd5fOZK@`hvo}>>Sabw;2w7W73-D!XV;oZbtp@ns~(c`y4-aPe~NuTQo
z-{8qi5MQ?RM%O|O!INi)!gXAL8MoiO_R{Xr>*=xl&-M8d&7lxy0P+$+)#IvUU#N1x
zFnW-RmlEkh=vj)kp_B^b11L1}FT6DT=J(Z+lV{DLx3<q-Q`m0}g={C$63mx$9Hzrg
z@kUW-FJ281=nXj{dAfc5ap#1BGm$RPe4p6@no)t2U_$#`rhE319;YannRM`KQ_~m#
zPyP1uQm^kG#g`!Bx2NOhlJ2W*a7+IM(yR??XxYN-wXZ!T*GAG#so<%?h{em&L<VCl
z9<h*2C7NWXQ-i0Ko=so>Jl%emrSmRkkU~>v>dm*gc7f*D85Z&tuy}@o52c~!(akVl
z)Q+U*)(B^_So$NZW>~z}PvAav7s6h(bV>xQlRABlE=I#73c}y-kA^GXtKGdeATZLe
ze(#Wk?0VwE!)bjq6!-(?5i3URW>4L@8k;=+*!0(OrV@!h&n{z%2!21@ucE1-a!?pU
zm#iU}=eI1kjAqENJAh`z&iWK-*8U)Ql&L84H;94Uv9T{Mq&-Ua`@E9c9nCeCY_W%E
zUV&`OOM&(z_g>sL)lwq5%YR)hW?8-SB+k?}a^{gqbK9X@sdGjW{&CgWFcvY-7&XoM
zEB*W_v+tO^i_Fi&_{%R3Os9sSyR58mSDR<&j;;NdhAyjXnmwZzr2TSm`|IZX%P8K<
zM?nW)HZO~)U@RZn{n~4p?&f{zST)3JT9X|r@`$MI$s^JSr+<=I$9Dxjd$<$ICWS*j
z?V!`-?4vt<0ETk)s7jOxc#EH)Ne(2HJbt-%$QMb!0_iX&Gkb-1$%ITKyJl4!ibdWJ
zK<q^^v=jJ64elifM9Hzps9lYn%%6G9tAL+{(vO+Y>B*i}uof1%hvI`OO<(bjmobHm
zLDEB3MwbTOy_M)kdnY)(KP_9dQy?0g6MgmNkzaqY>bELR*UV99R>!j-)e}ai?u|9c
zoHaeUTyyq}CXJ%i&t1mo4EgU3HN2;9zXHb`2O36HYqhX3iE1gi#q`p_)#Q!S47{vE
zQ6aa3Q<Cx-A|MRhru(#d)k<SmV|<=zX<N&946f#kKz0RWL<(~2F7f`bRLZ~0vmb@A
zPS~gAlB((;73oSb!cL2My;|pysS&6`25W2azZUqp(_1+f`DKYGxLxclPT>t#wCR5H
z$X{6L)dhK%=DkMsZ|Vso<J>io6rEi@NKAl<UMg3pgI(h2CJ(b{LzZrW0hxca+REzD
zJ*cW{UX*a-TI7{6Z4;>)f&j07Zb>(tCqbj)JWbL_eo1M1b}^es5y`nPL3Sq}DN9uQ
zcDm{{^hUN=+qOKfQu9bC*2UrjN#NL&B&x&cECTL~n_H0v)9>VaYtw~(+q(1gQC}`>
zN^GiLr1J5PRA+?Dg08LCo$d~~ox7e|`TN8#4q&)`{POuYF``o^e1grZ1D;+ax91S!
z$k`_|-tDA2IbWv*qF1ox=tEONe}1pO<6+DHq9DzXrcp5c#%-l?nkF-sduehlCp?88
zg$k<{k-_u{a*B<?-`+)O-u<zf7|m-%+o)L(urZ@|k#vc(Pq9lF17PS92YC-S!z}Ul
z_H{yN`VAn%w=(1Q!9;@r-XpevBwB_FQ|OZ^{WLAw2wzXL^ZikS5QYbLh=v;9a8r1V
zsRzhbTE-&ti}W;OX#cJe-mT+4cHn2P`wvHlqYZQ&8B*)J@<T#Ufm0*C0HInzvmUeu
zp%eKfN>Ioi9Opq<&=K9yOOUhRZ|zu$;L%Qy;UA8_8SccjtZbmFD##Pnd1fIcAOY-m
zCCnFc1xKS|sLe7)iqgHp&)i_BuQZmF7=A@iNX6*%`LX2mt}DWd4Mt{uV-FrdoJI9i
zPFtppr4;Kri=S&aeZFoi^?A6nq_c|grMF{gFS?wieH)DJzmBE9gt*8?sF*mijA!)f
zy2z(Cn7I5?SXD7~J3pQ^+2x{C+hBUbZ#?@Q<f?MFikWxXc+RTsRn<2QW`1?!xu3(Y
zsxPaYx&3zh;orjQ*YQWk5LY~ns(C2O1esRv{|c+NODvQ1y?QsiQ=4p8lqMU7BW~P!
ztY-J={AA-~_YJ?=Cc7=a$)<NSH>s~P?RV2An^*O2-hR_$|Fv$i<#WW%pk=ko2X7}^
zzjfcd`=#mf(bvhB$26Wq8g&AQb*hb4-!qiCnE*XG_5ZoBn*9GSVRbVe0{MT-luC&S
zONfihONlGVNz0#5R8^GMP*GG<Q>T)pI@;RCdia0!N-tTOp0zq>f8Jc-Vp8`dtc{J$
zmA}YRs#kj1$<4{h$-~L^4_RvHlGE?P?{$?x^-6u+oTy|e)hkWB&QJA9saWY9&uf3M
zQg0t0s#N-~MrmMRU`pVL;lNXWn9|t0et(S8`yl~Vp^E=*l&X0~KK)mt)F<XYnNo*1
zJ*rXaoM4obU@?_o^EtsZh*a~JRB9TO-0&|_>DfP0sb~5Hs#H4rmsCn+N^fP^P^Hp<
zoXc@JjX60vdAV2rmP+Ry`ur`G&XfKAV5NVg(uKmH)S|AxjnenU!BnQSz9cvH$#1Fj
zZ>E%Ll(s(0|C=fOW0aOwh3{8|S65eeRTpQ}ME=c`QjO9-K<T4~`{ag1s!_VqnDe}8
z^p8=x-jdVW+Pc=7SMoCB`OBG_m*Zdm1t=}=$nEOt`eT$<^yL2yly?3Fl>T>}v}LGr
zaA;y{sG)td?hjD9JlaV$N`H*jQjOBCe;TFh6J7fgEkE8g@4W5on{55@??CCy?EJ`F
z@9x~IiTREB`Ngq?frEv?{dc2p{xV7@mqz{=rSCp`{$H8W`F~?dKmTS**SA-HZLe<b
ze)_q)vGZkX@9Xa2*WIr_zWiUN^#9D1Zf2c%+4}3}{^I((;g^M?*ncpk8UJ8Po&V2F
z>6G?wrj(ya7`mg4QTT66>HFVIsT0QhznIc3DpRU9M-ik~sQH^I6{a$!Cu{y<N-cU&
z|H+j4R=PwA|6xkgUZc#vUJHeZ|7J?XqX~a8r5I&O3WQ#P%^CcgDFy##N~`1k!IV1h
z#r~5i1^*XQ%F;#O1QT5406FXE{ANlC|6oezaiOyOE&Lt7nNq@EOeySNm{LCrasBc0
zgQFP!W`?A{nNsWDOeu<9Y0L62ru59eFr`g^DJoOC@E21mMrBG{sZ1$9<~LJ1pVTFX
z>E{PMKXQFl*(7+zMMS?fmdcdo|6xi62B}Ob-D`mk%->9@;UA{7MwBA>hbgU*?D%g?
zsTsfXoY#Lar6bZ(Bfpu_=wy1_9rOQUN-h2{r8{y2#<7obJ;GF`bow7m>43z)GNsi$
zbk4t-(k4pKtubTthm$j-kxheCrc{u6RGa%JQ`-BRDSiGArc_lqv)qfyloI(s^#5c^
zz5ixP)BiA~G0J~2r77XWd>B(W(eC?$XyWv5rqui&Oew4aiWY;r`a|T>h^JQ*fA~t=
z0Wr02EwGZm{|E~OUdqO&2!(R~W=a8nF{RjlGNpVV=+K!zOz8wDXyboiN>ivzDFVS?
zPi0C4|BWeq@(-qT;xDFD_%~DP8xPE+GNs8h{}WT%_-{<9m1q2M34wP4_M0hv#PXXd
zHSA)$`I{*{1NoaNjf3|7VM;j_oFb?H$&~8+D^uF>52mz*=)_<6R&K%IA51AHeYn?4
z)|#;hekxN+uAr{EBmRRag*6h?L-q@h&VQIvtl)2^)a759QoY|y=>Y#<OsOjg{+lU%
z0l10;7WNPmc9{3;yEmGzsd7-6QvWGhz9RoWOzBkjzcHm({wJo?-s^v3N<;sHDOI>P
zm*Vp>>#fOWic%Qf32mKXAj|1H7#zf$`l0F~jHW|dwofLDj+u2y6s8k(eKhk(Gz0dP
zZ|DJcAuqKB42Ygc)K+vVc&zqGJN1%W2*K?V&ZnT#?;CF$;_XddMp#3|ivGQT_h)`p
zdkD9gmmCC2RxfwZ5(zHn`j3SbAJ+%Rfq{h}_<YAjsi`phc@7*=s;~&`l?J=iHpil%
z!z}|~qT%gtlXJY!1K|I3T(zEP7EQjlS0J8Q#eCM9Z7_5-;@K^r?j+Oh>4w+7Tfd+^
z9d;Uy^nmQE3SnY-VFTdS*VlVo=sG$MeuSBf6{cyP&kEQ6at?wnd+rQ`puLoIdG3gI
zmTg7#lZ19Io4$YM|MMgvl&}$e@x=LN!FYY_p-DR{7e%LfGM_u;bks@Q1G~!-Gu}Va
zQy941{9k6z@;}!z?cO(F85B~L=BUH<F~bsL^h@va7`~j~hBXkP=i6BnA8gD!9?vL+
z2d|y9nI<Qy$Dezdzw+uhm*n(W4oZtM0>HS=-i16#@$F{&yc>Lykb2i2Yf}DkBqQ(f
zF4Y{A^3A}(_A}mweBCLA*l4}nb``f@-tV<J9UXCXW09RMAGP63kJk+PQ1WH)Oo;NR
zpRP;IBoFsBwt|cO{L$&fHi13Y*uTGBpP|iM`=SD0@yUr^&`NxLuEc}pEZcLI>ZIae
z7Eh!R&Bbvy;>HZ>Mhxx^(kK(LlubX~$T;%LRS*{$p7?XIwAXfME4|>?qa!T=B9KGq
znVP5&N8z1@brioi(wA1{$L!qUCxYg-g($PAXL@KZ&&_YxSI$5~3z)$R!ZpnN7`&5!
zsJUe^SuyrqF&gT8JQY<*HBB{R8*wWv{4#;=ZJ)d)-s}tS_NYC)@U5S%>&Uzz?^5f?
z<-q_uE_-R8&nl3r4(kddViafY7T$hYy>?=#@#4e|Ogq4-19ba^y5MMJrAi?$&6th!
zi<uI=z2|yO^^fu?PtOLT%StL((nW6&Lgkx>L*XV%k6ZzgFYd8!{qRVFmjkM6W$4cK
zMn8k+)EeI-^EcXTTFHt*BQB`ig{A*`0B>x|vlmux|8ht7Wzw1#fcXKB1a*;BPuXqK
zD;@XKQ<XeJQBjMdtf#+f!prmB9%G$fT>&*}5_s{Y2Q#Y|@4S<kQNsD+!))kP3r5Zf
z2ZsPUi04U|<AoQZ(oeHrO58C7(fi4UD^4K7$oo-(B~J?F+b{zA-_O6g(wbzJ5>hH&
zgvr#$`1oLU$!4IWdr&zdA_QIZ)={<l-eB>)XD%3;5{#ea8Jcz?Gas5^3OBHV;S$9P
zOoh;nqF~CHZBpp!WT<^5G(sC^ghMBiAa(%M0wxSB57{hW{HAoua_p)a*2FRi4uu3r
zXM|Vg*@BZHnkjHQ0F500+C)aVW3&Jud5t8v7Urb+NZ3g}^dUcU73L(RDBN|8ql+1L
zegqY(htnbJdv@8JNsIIgh%&8=JQPGX>EVQNbWDu6mWZhEi_xZ|G%}><n2TV&FF5~W
z9Ac;2*4H&U<zkH1Xf!HcH?2M<Cxa>DA}(txhRT#`@}WCCW2sDO$F^nRe`8APGvXTS
z<C>M(KDC9ij-r{^uuS#no`Co$#rSof_@1e_Aw#~B3QhC2Savyxkqf57Gm_Rq_FI%I
zm_Ni!8#}{-WB4Awvc~hvQ#2ocJ}(0+8H$lj!^|mTK9S&l`sTJym_=pmmw?1fQsOEb
z>9f`~g$lZ#ID~A9ajYT)0EWF6wmrhr69^z9@=0^5SBeLt_Y$@NG{UlhJdtNm?0<Qs
zWB0+pt6II6q)2XNp=jG(UjZ@OpLnnx*@^ZzFL^x;B1J|$$AjZU_@-qwsq|;r4vN+S
zb%4VdUP}>5x^<p(Z3hCAp%{MilNFw@nqWLhTO>Qbuk#rO6DCUYlTkcA;4075AqGva
zJ(yHzGAJ+Ea02>Sz=+x%_8F|>c1>GM0R91V0+N?J!~prY?<#4fsxAgMUrI?$0vF>j
z{Wvgc6cCHY#F7DwR6SHH6DbD@mc>qzkQi)M?G(~~gdg!<F1btlwWp5s3A4R@gHLVZ
zrb~+N-r~C_(9bKNQXnzJO4jvpnr~kXBq8ZXfUB(?lCAl&h!p8I6|+`LsbipqSElq3
zNRkFj6Vql}<qM9H)hy}AARY681#lQmTqeB*ie?m0iN}1RTB+Na43!WS0Cry`Zt{iN
zo({US!Mt|_=TM;b8V5>FIZb=s<P;>WTTtZs2(Hyy3UHgY@vQ!|<JF#+9PxhddKbyp
z6g0L}t<_R>Ks&ehS}s3M|2PT4aGQ3X+BkMVT>8jXOaOp@z(i}5CJ~hX5p7IDYHkB7
zF`4pIJ<p3C;7R{UtWZ}Rqg+}5%0pivg6MINX!vM(ao|tWw3{E%Uw)ueh@fTC<4QbK
z0E0XtKL(9HzRXcnIfa%XgNXR^-5=x>D*VNXuKpu%DUy_od9nEzI&d0?n6Z)q(0}ff
zlYBwP^Pu?7@h5ahGQ7t-@1wjXK>*aTEVxeq4b+v~&VsjwN(i`NLd8Jk{E|i$bcF?1
zXjC9dECtC9fMQR2g;F$T8yt%-I069aD<Etmw4VuZB}66*0Kh^3E^n8$e?r%|mDR@r
z*~l;!{9|w)EJX~Ap`b<aP!JGsAPYi}0W3t|)C@pi8;l@6o%w{G`}C9|{;aZ|j_DS-
zZAq@vMfxXR&Im8ogqJ=^lx*4-VRMvwo1qi2t1%tQrxf`-g`Z9;IXyp1+L9J0R(xfk
zM?2s1x$c#Cen4r%*9y?0<nvwFJ#C{S9MW<Zw6Ro5k^`v_X_f;KARKM*2p|y-ym(AO
z#}bN;2*AW2g#dGmx&%g6qFRBj8iaiW-2r}d1N4)g&Nile6T^sB06}~J)9hz+0|j5K
z<6et8kLreWz<kWpFifKQD^~IA;CL{$j=lZfa!FOZ)>9Vq%oD~?KZz_%MFALFqd`}5
z%I1ZC9F5gFy2TB{Xr9^N1~)51TXWV<iPIi!qX6cpxY>G}>^L5$98Y7u102BG1_i|z
zekMN*Tz>&>uP<6hlO-CLJrVQ(YIN)=XtC;ugj6^HYm(8tq*`y;`ouD{iY)Mm*wi@K
z)EXDZR2-kJ#>Yu{c7&rvkjpl$8zBxrC^>T$Q8Oul8IfpFlK^lY6Kkk!DI*yGB0sIf
z0iZ;hN3#G%0wBemIwveYBDGS}AD@3d9Bg`dFq*=-_%f*pb2_lm*ct=Qc}jCw2v^5|
zU%f<?hl>Il(CY2y<Z#^zmOv1FMzn;`z8Hw#X!8S_t5Ca_9cT50<8wtDQ*(!zL;DIQ
zdU*-C?}Q45;D%&7_(`-YBW5cUYL^Opg@BV(?~(=KRy?~5bGlA9cbUv}nFVzv6Ewt(
zyR4dVRI>CUl_?GC`rzGh?y&n;Ww)bx&*>am5~RnqoHvo&xw1`n<B-lEhkhF0<G6vm
zsorbg(PNU<6V%M3A9Pa((`PV8V~6iG%7L5BK|_wqLDBJDf#!k1T>bBNdilv+-X491
z<?<IjAop{+Hc1eB$^QHe?v(hhd3@hP&#rj@l!}$wkxo0e(VZWGRs?kwk>K;&bff!p
z69iPz2#x*-)aX^e@y4CcE|@J()W9n=LsIAgxdZNn9-ykFvIB1=IUdJTuYz=Vpxkw-
zzeAAgxK0Ig*zyKaoYd<~MCh_Zk^$y1+X#GoS6B0IxYUILy|?{OxKs}QfI`Lbh8>9T
z$()gge8VfAH&4$&=bQDP6HpN&H1g`Bfh5RU`H(?*zd<wq6ZKcQIbAI=7#CR-)6Q?W
z^c50YK^#GFk7s#xp^kIAFu`5!x4M{HMrAxkg+060CPrK0#{;QwDSlYsI_mid>TNnk
zL<;jp78!3&{|G<_8l{T|z&ml6hHct-GV=JJa4CrUH(dGv_m))g8!inaBOyCu@^+JH
zNv{oq#use+nXZq1l%x}<z^QQQ!x3$RIS`{M{Rp6Uo(w7?P8d<)QpYjTO?1TwB%TZ*
zk!YxJ={3M#aH%=M!JK|T7J2Lets~Purl8*tVNW;FPg-W4-iO^Yr*|RJgS968=4X>a
zCJi<urKtJmTU{}PQQ{cL1L;aIhX$(OaNedf-v#O5#tdI+5sjunK)QHYlnwRyH}ynQ
z<<c~%8EbQT@XqiY1zjUMQoud?>Gi?`GTIP;XlR>hq91Q<c^9wMp9rG2jvq3}?E*aO
znm4Dckm$kBrbc8T_v7c0I}>U2bnmxmDR%TZo9HaujA_LJC~xeDKu5x19s}M1xR*$>
zXhS?*1Bq^}W&YsxJNdh8`X=;dOM<|MLm7u1Cy%C9D00)A6RGrcOg9!6??ZOTNJH6?
zpSG`m0G9a8s700-3m#|-ZuS@Q{fXA)$Rx-c(_UEX`^j8d4Bw)z{UT+4+K>XRAS`|}
zr!^(f>;*4bXv}ymp!ZFe1-9lLDrjm*?`(P2!t#2>1v{y5sqAr3=O4LL1L;7OOBE`p
zOcLmUA;twm|IPgMAGlP?6q_@I&bCL$Nw1Yq;Zg;gi~t-P7oR2-E@kLY_K;3qI4yXH
ziKalC?WaXX>6(XDo@i`z*>CjR-ROI`G0?j4YGGsOXk#RS<2@PqrtKqp68a4WJ=(fi
zkw?XFXF0Lxnr(XNMbwB1!?%jIqRo%6$}M!#7G!a2PUEwX94c#jsp=H!ecRRn1$8hq
z_C*%GTJiatIeJGHHFFpJ9)rrU-==-OIq>Q8d(SQQ9r%X?hHoQutTLE6bNY?D81Ca8
zx}+V>&uG3gpG9RDz8)>HAHyF3-u{q9l8?#o2ix>p0J_K9@Mz2%Aq{v11@+Dxk@f$u
z^_O8yK7QQrzcFHTca3dy!)O?T(V;X*x0HZ{A|Nbi1t}#}T2K&_kd`q@1tgVHX%P{S
z5JX`AeSg>WzwamavmM9zVCQiz&riHxR`bM(L)}JZ!$#Wd<rVr#=2=hr9v0@4rdcZ;
z<}1v{v>s&5bnlXU-g1jes9)d0H<$>_YYGgrU-!OSG0yIiAJg^#w$H-<tf6EM6_{of
zn3nb#Z|gEdH`ae+VZ<de4XiTN===^7J~>x7N%*Gnw~vvy&-ig?FC^@jWa3|@R|jOr
zJ<)14d!O+=2HXUheXqcTR{-~f?=>w`S5MHVmHl`Rpq1}EYapG?_JNyN&g|Z@ls~0!
zQTQE;+C8(PIh^?S_9Jt36IIjQjU^2Dm)lvi0&S=QZMYRPlQm=UK5h6%#%huRt=Zm5
zlNC+-N5(@I#yk}LY&}CB27K-A-sXeL%W&rRDEi`knhwmbGAp`l@=>y2%FJ?DVOc>2
zN8h>^A}yb9zT|*gWyk)|a++K<yw9r=x;{6#W}Gczm<7K!wQia(Y5&r9erm(KP|<I^
z>e}?CWvNDVr@*ti1wE%kGeYqI<IJ-=yJC|3!vQ>RZytLFMyQ3=>E1?SZCan#b2yq1
zkyCWj!2*Vs_s<!p*B;bg%b1<Yf37+%T&dXy5jlI5T$1Y^z7sohLOY}GTpS>Rv$JHE
z2<^EH;Jfw5z0T(Nd_y1cgIUbtz1($VjQkSZV0P7O>WDFN{oTXk%unQRFZTMIPq(1n
zc8rnTj|s`l;_geQH^~R(uYX<o8@UCEyF8+yw{8rYTn&^`xjHXg<BaX^bleMa*lrpr
zaio53*By{J5E})iol>j!>ixm$Lb}w`$*&t>Fp0oY<%ezW8`Isr1b?rLfdGe|hKT|F
z*j}+kUe^LjS5R?{G3-?5du>I~58zLKP_g-)uA~^g`MNey!L0IvI`1iFvZ}yTOkncy
z7LFsr1bPo~U;@vxi!c>K^U>tm4Bcd9ch2V(d*TWad4K=?z>BQzxN-bJsr(+TZ4sw!
z(ZGEst&HnJAv{_EY&ugT!%x-LlGY&x5x-M~6E86Xk0YP|-DD;uz6KxZJ=iU`c^VM<
zuZr)`Op!g0R>we*+c~9fYJiW~#t53xer;R8NFjZA(t?>Ty0rSVoGRZ7nND49g9(ZF
zf0)u+PTm?BsS=(HHb!}-o;QaDD`K(9B{3<Jvrhw_PZ|q1pVy^6s)o!yTD-Yr-JGwt
zu%5>CB}sFuRLtyVtJ@v57a--t=YK&QmY%dU)`ldW(MnETFG?;y9&FP5(^FGJbHCjx
zKbGr}uLf-!6N=}q-R4pB$+amwqhz&2Y7Kj(iPp>s-u1+8b%uou9xr$YxBc}mjr?@y
z`jdwO#=K>CYCay%6kse*RkA~DU`_IFbphKRRaPZQr6gOQPDgCgIlcZxZ|6_l`bXYu
zCa(i3XqBnwy>rFH=Dk@S#N*)%qE)AO*3Rl$e3#9o!Xl%^*&`^u!R2XXxWP8cAiV#(
z(duu+R){yf@)BTvPYiH9{<q$1D{p!uv70`>bptw@ug};z-i`j`a$84?HDF(yl{JWa
zh4W4bw+L<G!i1YpKvWp<DLm@rJ146}@%qjGF{N9T1-*aWHH$A}cS=r7@^-pTF8}RZ
z#DA$+&v~Q6ni$aJc5C6ru-omgci#xcEDrx4rqrWmVeB3Hwy8S$Hd?`$JL)^b;p|KL
zO&;9tsI^w!)*zD1lv2sY=rQ<*<CeC-q)BZsgL8fbw=mp`*3wD;K{#4xyNJNBInmD*
zfn`HsL|7yUR6L#8Y#J>hOkO7G+->2>Xt+0PruqPOzVTKr`P@g#dlx4A5&;}#zrX>g
zMUke2e{0^{J*R^g#~%fJ;6A)#F-C|-tT^?b!#`4{b;GNyvmy~|e1sS_#VP9t5iM(i
z|1qW1ugMWKJ|getjP-Cy*(nG(lzl$OP$}X;R=lsM>>X2!g(Pa5d|y~zfoYb(>%7P+
zxCArwy>-p2{2DS->h|}&9ajXnJFeO=7uDyqee+Rk{fKO2ow@UYO(793#v{Bk;4%KH
z@Y1A4=-#}Arkri@bXCo^6={A{t{z($>;yqf7LIvEkemB6{wia4u0&mK7r%3@mi+u~
z{OZBM<F_H#HGkc?8ZUMI$*cP7VkhrD#(X+>TDNl@$rx*uH11pWSY}I<`~3uY->5t{
zBtTy_*7|<RI_Hy^LFpllAt|=z#PL%J6X~;&oJTVPB4YvOZf7>xwT<-fK{3WZK*j);
zL(Yjg8b*IQ%j;2u8g;?VD{*Jj{?yU68p(mSkLhghXhSnb?u)Vqi$4gYmcR97bc6I#
z%Cg}MQRL1Eba)!;(6Y<G_dw#w?$Vh9nJIl4S^d+6+hqERbL-2vjbM)pGE++J(9~AB
zEpe>rG(cub@A-wWN8Xtu4H>DvL^u)o3X2^^{XfBM9)?{1v4E=LdQJZ%;KhGT>C9y`
z_yG^jnDK9hoVGVjT{XEo>(Vvb_9&<6;jbGy=6K@(GE=GpMl2N5e12}%;oBm`NGEOl
zVl|>;x;ixaM*!;8F6+Ii*3jEMU9LM3$DQpLyXuccXd9>c>IeMxZ0|i=JV=<~W$YFd
z{GmnJJ>>ZIpJ27}REY;-;Y#<pXgGFb>zf3{>3s^-aHa43U4M*tYHT)q@p<X)q~u2(
zR8@Krvga$zA8%uG_xE``RtDsjxd)^}o6^SgR+XQ$W2F3VCi3&R(te+-=y(y9>2uBS
zyOP?iajT{WnXX@@pd^)AG%_OZxWu<uu87+3mXctOG5!O2Bk3f6JMu;MFwMQP)|2Xk
zg0YaVo11!#?#RdzZ1JW_*R>XC-|t7i?vJaaq1Ynis^FTV15Ah4CN@=;r3**C=!t7S
zG*@jY<kT@1dvrLSS5tHL{yd;~_wQs$R&}uaSfEwq<a9Z*65wYXXeS?8QRPo|6E1?B
z;*@5ag*Ko2+zod9?)*6dDcNxM!q{c6c<^NtR*t8R$~P5vzZ2EQRiij=e(IT@g;EtX
z;-w32K4VE$Nad0f*)cvj`@HtYyNU3{(}(PaGAXo)$Xj6nCUN%*YEhJc<qW$Dkww2G
zJ;3WpQ(-$4ki^1M%_vl6!@unE;LIVETHBL}AAkZntG_85v<$uf{o@kncX@S*2~607
zT;PG2kHqd{v((Dp^K~sif>z*uZY&7!?}^WQ`=CSrJ^)~8Gp0oT$<4C2p=&x1!ssZ=
z_LbZ#=;8z3Xb4y*qX%;C!_+F@<sgUrxBh+mU<BgR7l|%;Fv*h@ZZI-dPTySOv*SZK
zEYe~{4&p1l?^DpZAeduR*hRtUqBe}!Dx>ntd&T99!YjUyNt23sd|&BVhX65@$%FE%
zK)J##iRE1|qJBx>Mq=FT4+u6jF9$>wpgH;Y{IKlV*J7x`MS<THN@af-2#|&W0+t!W
zM-za6Y!XVj=E{MhbI<*#?9)!i1WJHR9}s{732TP~sABp+s#|}6l-U3!Au>bz9YqCc
z1ONpf0PWQF4`VBI0IT@>LS=xj!YnrdJb-WIR;b@z3Pa)p9stVa4(gbXm_@ug697P$
zjYOKjzT=T(tdu_-pj3h3P@tiM0O<e#U<@YlkczC9KIx(av0%QeVU&ugfq>pm%1Se~
zI-E;I<ywU82ueV9w_*ek2-b*4BSYz_fN6b-6`e|Ky^7DN0O7z95MZv05>SS0RZa=;
z!O-jjg{^cW)hTvhFq#RB;#6``9*U-rI=me~3xRd8_fVx(`g<a~&5`e=^+<9ERbc?Y
zm_?s$B*niSK($Zpq0q1BtRb7G&W!1AG1n9h*O#bjr;hIf*Y`1a_WxSbm#0LxYGD{o
z-wZ3K(vJYRLtb;Z>Ro9m;u;;;h$VLNS5iWN%AFW$NF{?4=G%+TJbsug03$Jj+fq*D
zfB+EB2PEtD&p`kmJkUWK&4^MZv7--5x{s7;pb8l4`&~Q&mAAFfqNUXTA*(S%p>ae1
zA*-0K!NvaEyk081!3q9Kv;Yje-k(@Ggk~}Fro@CWbeOdOfdE5}`?Xg_hd=!_h?A*1
zU+Ypd(^u})SK5B#a87VU&^%rPq^tu1*D!Y4Ft@6HrT5gN(3TOH0u8(#lX3(IQyBI^
zq%wE{!kqx32Czc@N@)XK1f+87o_Za+A9O@j2?8+BX%0!lyqkef^81Iij3cu#2J3o5
ziz8V_)NIRxW)?vA9b=Y7gS+?5JXVaK9f{?2bt&ayzzUV*Q9+uhJ|To21VMuU0Ep5s
zC;$*917qqlP_8gZkOl~|V6K0l2E<V0Gnm4U0Dyfe4Kvdt7)94QLAwR}dcbTQ-5G-F
zm4d(!GnH*JFkvh5Yuj5c02^vH@0O|L*f+~;F;%Vru-3nSHeg(*ZTYy|Y$~Ki5K$Q{
zqw23rv)T;wK=t0=(c`X7ZZ;S~*Cr<hr;sQ|03Q3vQURmR5*Ru#m5(}Q@*xm3G4@EH
z5*Bmi?WjH(3l>7qFe_lpN2oPNuJC(eoF#hb$r|&yIrT)cRT+kAzvq_$-kGP*xsV!U
zGLH7d{E4I#uGQ8NsH7<zu!86!BCc$W8U_99`+!I-T^ip#zY;ltgre{u2xhWne9U!>
z8gDkUWCgdjWEiVH*Fv?l=#Yg-^;qIh3v4F{1qe6y?H=D^NTzNdr?GlVc2<9K09aM1
z<IIst`bc3>7|F#vY+skmtg^5We=_tbLXq_rXaE?)VAbwls6%E}L%NdA)^vQjl7vK2
zy;_vO_VIstFrl6+4yDwjI2Zt7GE4_C1E}{wd#=F0bOSjsQedsHG>qK&1cQnt6QiBi
zZ!29(Q8pF;bZ!iC)H4`Kg~^AzdCn*)rA+a|JlZvlic?xkVJrc<IzcJMDyjZ+Gcxt#
zMk@A??d&u<XOyOr{qtd#Dlm_LA#^(#Tb|XQm1pF%b5CZ{AG0?-NTD7Wa*U)h4#yhp
zbTE=_X0U;0W~19L`#`rWkGl@0bX2C%D#8)~W|oPJ$Rx8?hXAUXK-tesemXZT9i!bo
zA7nU0-gR85b-4A|F_zQucCusqAnl!o&q}L!Do+fR!k{7)NDXjel~tgXn4<=N)~5jO
z!WHc7W)=1Eq(nE&j)16U8h~QNBupJgFM+C`N#-cS(1!y(%JAX}_J|l9x%NUi0kGI`
z)am>j-*7Ei-?8Yi96|yETGp}G#!#3Tfow69EST>zm6ZFVO0fW7w*G}P0OUC*u7G*c
zgK=5~0Natl&2KJ(ts`rbpNL`<H}D&4dTuN(cA}Nv@4ej`oi7q~EXj0PpL2Y3*9r(m
zw{a{`<DFe~DnV8Y9dT0^IOmibHh`uDYcnitL&JFanqvU9ag%CqH^66~3K5>X@k0Nx
zGNwfo7EZ3xN&v1mENbFhI&{9M^<SH^*I;r2kS_$sND9Tdy798Dk1{n|IEFe6faSC$
zb#v<USXPEWfS=tksna+x3dCZC0fV(YM*gE#=bG&p)7)vdI@bj&IkExCYc7vxFx24~
zu!)`9sf(NXw~v_^a5kn7h6O8VLDK-iasO$n^jk~mnE=mq0Ky7jTbi<A4`7@d6HfzB
zD>(Z^Qfc{O+C-59j7ZwFuQUPLj}d^sFxaZkppw)_C3{o)^R}}!S4S3gs&K%wV=TZE
zGrIwsHgw}2r|tY@9F0dlul^{SX|praciODO*|zviuo4*MjNn6otT4<78n!;KMJ-H-
zLdu!BGqBIx%>=_n^_DKJT`3ws0oK@ithU(fd6<u>XT&JpN@iejApw^=S_T$FPF;LV
zumA;s)b5HhPPdW@K#{hv0a~MqX`6=ue%^C-JVjBlxIBsURI2#+6QqkZtb|{g>iE}3
zgVK~`!BCK;+G+2@8N%r_6%`mmDdEd42%}>8!pYRcmEdJxlg`s-3=1_4Yp3L|8HRHJ
z7$rW^7p7P#V1)j-DbsmtIs<?sCgG=T@GJd+63&_cpntR`h3DXb_DAPskc@+=t!k>=
z&?dkH7?x(pxQ|tq!!V3sfM2y0H#<U_mia@h-K?%h24E0Iru0W|&p0q?K9~>yO<Xfj
zQ^DB}wnTToFZjsL;LmEUeOIAq<qZzk$Ys2|81{j|Dyd8d^C${Hj|B80oSC~l-Be-z
zyUVu7Dm!<-+=O%oYC}ed4^<O3u<YtMm7d@zK<$aP`^(X;i;ZPNSY;QId%p*cyc!*c
z`%<~UeDwb9mzf|{8k+V^xvv`_jNzd`<y##XUD|gn6@XP{!zyiXzq$7kQJHoK92~O+
z)}ro6n}e<1{19D2UAh3vEatUcmENbYJo=_#wh(^TeetmO4*ohtEyX>gXQhg_TcI^b
zVMRHXXwCG4hVMsiLdZk)Kr3yW{*~Taw*Ve282SkUefFAS(2{%ak8VzH#1sW}QxD~S
zGW>}<4H%#a&=rrz(13|=4QH#|0X4{lcBDGV?|x8Z;r2w!c60Nx*;ljmF4TMirY(AC
zFNw&&0*G6*&;$c$Sp4g?x5-;i>$g7OxU^VUbb+-K%1Yk6+S>Gw2xwU^kcoMHinB*y
z3P%%iOcmyP!*?h&WMn+d!NF}PlzON^S5}=|0}L5MVnBr{{<Uu>F1;cF{u&giA@o#$
zBkb&_5efxNpu*1`+wCBDrGE?&Z1G{~&rm{*g(J`OA!4<`XXZKA#6b%xw2P9WohW0m
zl@=Uo924qq<l1|L;jM0mXDxunRm1z<@Agvqd`OXMT7J}Oa4lpuO_gT<=a^r!=e<A4
z%-xi=e&b_k5WQRvSzX=m4=J7vBPkc`u+Jm|oX8*1D-_`Yqn~yPU+TiLbQ!s(>7yor
zb{Lw%ugdRJ$n0urGZJCqO_hyd?$+fM$J~_jn}-7^!ZCCv0ET5yrCYD`hBq)A09L2;
zIqjo{V1637#zm6<fn&Dn`=|oG-l2D9RHcdY0WhZlfIN|rr5b}{zY&+HToq?WD_785
z&lMw3<t%_f9g_y{r61_;Ajh~j%|0{gd$Xw(I||@$2UI>zA-kh27%XoO;9h7T5x*eb
zj$$6c(0}gE3_X~Yja2>^h6wBNukEQ<0kA;`;1MDNI2o{vF+X(ysZ#*KnCtAe^bXF<
zBR)V0W95T(W|><gc$O{-X-eC08*2!XXuEBWz))lZVwgIpo0gsTROuZ6*wkQ07XQo?
zqntz=Fa$$?gPKkPa}kF*=#3V*`on5ss@@U<8ckVH#xO`YtHqy!vfm`g{iPZFRj-4=
z8^YqcFb(wkiap3sBDq}+Ah!;Ls?C!>O-{eOEg6+enfB(N18g|qc55p9vUe{eJlV?g
zL@_q5V-Fryn{4IO0sn&y@zZhye|8R^@soB{E>20hTp)gi`GixA<-r~M>>RV_-VA#v
z2c-;uhFz7jX6t(s(w>Aq)l@p5GA@hIREl@Z*3{fGYt)I$agY0KoE~%iLgzU-agloV
z<nU$$fK;htI)D4*v*X5G!ClSg6kU%l0wEU<q`Dk+;=YmYax*2YJV^LKvi;teU>Nl8
z2bn1qZ{2)z*)IEpZ871ua3T`@#PcBG=xv(zG~ysE@r3l6RM&j;l(fc*1;+iyl+p*6
zIhG}oXux-%1|~|^_aXgBblgfITl*sa-%P1Zyo%M6xA{_zuS0$uh>jL2U7xBC{EsQs
zynV3q<3FZUKb1{3sHMh~Z`?%b#`clqOs&l`n}(p{AVWT=yWp?wW9hjj@8MiBQ!2Ai
z8f-8jk#;P*)E@DDsv-D9&L9t(TlMSbiTrXOj?9#nl5D>^v$`F0M{J%du8-u3+rA9>
ztF$><tQNVu^H+ImqQW>&?#BONO0Pbe@q>5}UtgbodE=jI=-XJDgWX^M{x4G+dai!3
z{=PstZ1-H_Xlv@3ZDZ(#=B+i?$jJZ0l%{O-#O5bapB-&~ZVubK)Hy$qrGB2qoY<Sj
z_2=YpZ;zyl0aA>VBv90(KBc9WYKPz%RZSpxu%^0Ke6TiDD1|quT_ja7cI$!r9aqEv
zY9fA4&^x3fImi9g;{cb88-X*c_f!^Q{$on#L=YfGYu0pVVf$K$Vnz&WrU92f{9cpf
zUwFQ?nTF^?)nkeN2W(Utz7MfFB&CTQ4yrp|1&Mbh^$XcEul<iH6)SCdS2@dKuG8XI
zde^O}`jP17olj4^&;E*+|BoqE8hiKXF+)xvWkGrhRi=ZPVbZfIPwV$v)p-B^F{QDU
z+NR;pt#T`4TO}A9)n~k`o-++Tf5AwQ`X5vJ(^K(ffYtNv@y<v0>8Yf5uJ$TL$-Mp_
zQ>rRSU!ONgG3cv5>U@vA4IJ3@Kc@8g>u*`X(?x;3ViZN+H}mE6f42Q3XLKz5+bq)S
zjM=k{^-Gt0Yw|aMr4Ps-uh1|5MAEn4;jEUE$oQc}eBhN?yy6h=2mh&Ce8iS5cdocn
zwvp_tc%}D}FGxGw-iZ29n-B6Iw3WwH_L6eP)EB#zKkEEDSDw(L*Fj7g^4~>FnM(H{
zrY*HD5Hr^1Ix4gFE_YQvT?_6}`Ro>Vp)%)nPe*m$ujH=kLg0%Y)x{fK7phA)Kj^4^
ziC(;`_Vv!s9<^_G|6QmpW9gCVE6Mx`>Z|F}z3OY3T9@kUIp#=>jfXA?8k<GIy&B&i
z$6ab{mES{Z{-`cV(A=(j(X08hq3cp}=hX+K*00vZ1g+hUpS@apJ^wDX_6hX5+P??+
z6SWWCNx#)T9Md9cA5EI;>KxCyB<lQ`4}Pn2@+FR>bGmX*7x{OiBoTS`<HcL#zh7M>
z<oWLpy1Ey~i=;%|%fCP0>XI)0k#qqdi9R4(6NXwFLcw0!N2Sz+Wr~MT!XyZ^HcdFL
zZV0t<ErBtj2`_XG0iz}QS#z6`#I!}|Y-{^DUpFPo#fvcbNDz6ano?A|MVKOMiGl}B
zsmOB?7QDoO2-~YPBW);KUhROW(yR0<@lcLRi9t!5R~Zi7P%iv1qooCoYjy<6^9}Lf
zPOUH7H53Kk<W`DJt?zxW_{!WAR%*COImfI5h^=^;+9)5#8i-mGJ|}=BAq2)I3=Dc>
zJxdu%V3;lR5e!**5EDNs+}F1zTtOI-u~W)<vOWQsa-vg%lru@zq1nm3RRasQ2d)-t
za1yz#&X~+b>t&T9+p)rIQ^QJ@S&dbySg1o4avwHpi^X_ihfE>;1($t(@;8cd{TK9^
z1J3;{dVgoe*Bg{9mA=#HEq{<d;KTF2olK9`jXxe(d(fnSX2+0aRs;6TP628*YAmfw
zuA<oW^CYuzudBr~K-z=z6t;-~dc+@}$4ot@+Lu<DGD#w$J+;p`Mn*Di$O8e&WSO<C
zEY~KfMXb1%$o()d#cQULDK<vJB5*a!hGm+;x0D7p9blFiUr8HVn<98!i3yPa6OHk$
z)Qwe4x8ax-J|W-uq$s8b0YF^4wMKf=0Q!W!)od=eAls*Wvvos9g=Kv(wtO!VwIt$U
zVPF(q%O;l|zJ=uq8c4Em{lR>@Oz~ynmY>|Yh?O-L2T$JCh7Qm6gSRz`P2}G+n-9e%
zt$z;KsRo11mVopo12&@neEsFg(VT@<`VTK98u*`>4hN0e)1C9|K<b^HZYw~au9(QM
zong%-n;vB~8v2B+NzEG^95iq<`f3MY(=^-ln6tCLYcJm!4ygGf`nyS7C~$>2JEi<Z
zfWWZl&zolWGZ2SKpLFOyg4-Sx*d4&J7p|i*?5<kQR}}>k`N^B2d+GIbvR=Z%<eC+H
zi71?E@5jY9nn`$G)wH40Xv-VBOetMR`28?U=U5@@{8Mv5-bgY(Td@&<^wzgLAihp_
zzsUKe)Y==%0EIha_uNyS&k4)i`kk!kde!d;M-;4Cg9KQUONTiFas=5s7dgy`PvvF)
zTd61yZTCCx)%!c#A|xL(Y-n$)=RB35DkN&B-yHA}2;XYr$K=>r_CZJQXTS3(Q5es+
z^P#uM3eNYExtcq!{-&=bQu6ochTMxt`dAE=tO8+47p2epO(NNCvX&Bawk{O8n_f*T
zI2}~>iuS_NutXd?tZ9HBxpTk1##WH)3dt$|Da-FVd)c3jO`Wq*J5(mq5>wX>J0<?y
zP-?<|@of)P%QV}%-k9gcWmz><_&(u}(~=@nfNj^pr(V^z<{OO(`#vPm^MC-0&d0fN
zX^u;ZD{baWUZDkLE{jhY{A{sUO1n2n!X}s`U8L8?xDRkff6w&9lKstsodVI_@V2hT
zw5y|+_U#Iig8^gN$v2Ncs~4AV%v7JJx}Qh4$Vr}>T|zdJJaU9BM{v4F<w-M4KJ-uI
z!X?|RXe0+<42^dEc{g?++)SEdoc@$5R;7?G>!~fue?e5+^`dvXB;+4%z0~b*qB1ej
zV?X0D(kF&LP$;uu|I1^*-Vga0Z(hC)H-_rG5(#rYLO*D->MvpbNo_LMHEA<KA-ml>
zC({RI;B1wKZ(Te3{oIC~@%RM(T`(GMQPI}IGc4eRT{Mzz=Aa@)536Nk(ujXncZ}AL
z;Fqxv0w62Q)h12Y#bBR=RIkAk_t(5e>6Ev(^xj+Y#G9oknhgB|{f_tZ;c;L3Q;?zE
zk2gu@FSg3?-=wHApY8shS(q#)u~N-Fix+$S^o-&sIY=sXAbKqOE?H)MDA{pg7T}c<
zNbEh~6qMSp4o|S<(tTAJ{rB{RwTp?bNA9G!_se&-Iuj4Y1_jx|ZBIIcdQBfI&FJxM
z;oU4LOc<Y_iu9xq(<K*Jwyh_tV>y&i?5zuXc{rEq&94)gAY>p;)&xtsc*?@~u(X;|
zrYe`W6uq5kOOYU~@OYAIWLjtD(YF;L+5KE04yU?@PgaXa*l!|07>83;4n!lzhW(sP
z7s2k<P(m*>skUK&Z5XKT7~pz7z@4#TmQ>FD+Mvs?obROwe_J_!uZX}<xxl!{?IR*`
z8H60cYqt<Jc?{H|@G9CwWe8Dzzh54LhdAR^&dc>$&{`uPp<Ph>qzK0^ymlcP!UdJi
zrVy9GK~91E_p#irK=yoZ)>3atcLHY&mis<|rwJ&uj1@k`lD$@02b^r|s>~3SKdC|@
zt3vXLH*1x*bicQ(1BGN$zsz~RvJ+mT1%xEG8&}X;QDml!LR^kQA{NNbP|4i{l$E0p
zhgXWIt|{w7kvqg|b0Ww&v{oTnjR7hjLh=?5@{za&V~?*CmZ4CRt5m5+Bg|k_@9-+)
z`r>B<9#?`w7EmY+CcRIgq+Y3ATbbzu6+;rWg?#npe9;jU(&spp79yO^m&CFz-=r^!
z@m7n~Gd_c%_~=x);F1ArJo&3Ur+T9CzG`W3(@thG*{amk4_(G`a{$fdC?xmEWGfm)
z_W{|0SK05kSk<$1*F$gn+Wvu`kjd6_3Q4fOr4o=IA}Sw+AD^Q~M&TXhDEPBiEhGLz
zRSknS4y#1v!zqNaSDjw>E7ucEf-J~nt1?)WUjb|H&@bbJc9`<pZviP~<Ak%JLXaAj
zIpW7TKhbqj_GO?rgoM^osM)Ot$=m6B#S)-RIBz*dq!Zri6P(|Ug8T#lz2iZ-6haCF
zp1vB5bJ3abjet*Zq3nKTnavO!6PYZ9hF1!gZMsHS>XJu0PxX*;6!N8hH@(M^+GtTY
zJUT&aVFVQM(pyv;9qBH<J_3^Fs1Y9R*9<qYaEIwcP{_r4%O0$$i>=9M6R)s6t8F35
zn27Ud<8Bv!Uu^+N!{OplpcJy&O4dI=`LenK(HXFWaeWQCRb`G<nNbQICeb9bTH$aC
zc_(~yf|**lzI3jB99zK3G7%fAhr^}nXoGyYHe9j-wDO-_werFH*JRRBM5bhDWK&4z
zQY5}7Wy|bfV=VL$`B@q=6znp%kXV{1qfJg3@$`yh&xOsX*W$H>AaR2_+$WZ5vf7Fn
zHe~Fd!)B?F1+!6H)+cJ@J`R#r9WE5;(ej^tE0HB0#$~3vkCTR?87KQNvBT5pS=x|w
z<tQ5DsJ^8fh0?O5*9b9D2`kJJR1<}kzaq)-j!0i+psJ0NsQn+@I+L<H$tx3;D;hYa
zG4PxmZxFUk<mori9@%bqNhzs7kZGsX^<23cwQ^Nkk_@*NP9?$5D76_3b+z$Pe3Gf>
zKg{#DEYJJNaBC@U5E&wE5fvPYdGT{cpG{lzKe!cxHiMJlR=pb-oc(VS9-iYQ$#ZQM
z{z-T}_=?Oma|`|JV+NAzFF0aK%>!VGoBaZoC00oUg`I$iaf;Sn1Kw^7?GdGR8fF}W
zR;?Wn9Q|N9hc3+3*F6ui3J1N)qEc^Xu<Y(<JT=hG-b6O_Ta4hWd_jzbD6s*`v6lmU
zEqY#2K&h4_iGabOwk)+m07sRSHcHQ|1<id*WSTLO^9B9~w?ZhM|C*UyB98o$W@|}8
zf~8AYWy~kM-6cb;O6#vU5jjWduZ*Av{|sCc!{yc(48Ok-5euyTnk0k>yjE4;a!&c|
z^{Pc$-`7<G{&g7(o?WxFpPqnU=1Zu_ekNoTaQr{G6}`DhGD0R1;6V+u;SFYX_+5LV
zc#OTg0tFmVue;tatbkLJDbk{JM;_tdp2_N3^zZ2Rs}JJE6!g`T1m>R)B#sZ9)g|pw
z?6nj6H!WQx?-Rw(fok_bvIay*)1=1fi*W14W2ik+;xin<X-<Y)W40}P$z^{%{#w}5
zOG<TsK6i^A!k>a8U+?)UQ7{J0>jXrO=<}b3On=2*)NBjF^~IckV_&f{`9KvXz31<f
zbin<R#d~H)6i^6G+e=@&DoKd}kBs7gS(IqCV`baXy2tw2KhO~mDeM@Rt_q;}OO4Ia
zaGbt4&0QjFW^YJLpWme4jGPiw8VD^5<F+8}n#<_3-q*9(0jZ~<RBO?QUYvpn1xHjr
zLxCRe2w80fs(ao<kkwW=_PoYm^<|QT=PNF?-|TB>-Sa)U+9b_<AjkR+*X^6U0=pKz
z{c;>Pxw~H}MCoyZ(Pqo|;0e^kb3DKnZ)WmxC!ZW#1^l1dii77%h0XwF1iqEj72Ue=
zYh(-plK{fY1mIOb1@i6NY_Lj{!j3&Vzdh(vje+z}J;{AEPkz4w0^4yx*sn?AwrVmL
zXw3W)Ax9I;w;#c0P|8u&FMNbk+R7=mC+aM*s)j2dBB$hjV3peSzPD2HBZAg&k>(gQ
z{SrY=A@pBOl4c8ve+NffOTx=cU}To`KF|#?rs>nylJOlJxYmHT%$RL|P_PiiorVMN
z;K3*$%H_bq1kde+HxI{igrimBS+DbQS`qZrCCG3qUdRN?J42A)!0|?fZO%RtO2QJ~
z8Qkg}kZVCfqi`S6`Wbg{oN$~jyr0F2C|fIy*lIEBj<V<)WvT^0matv#2V|P`ECld%
z40>$ghWxcCUT~9cJ%OoP-+m1bUP6h(fg-0Mjut)DZhh3Fn`WM^4&Si0KBjj6h(c>o
zW=j}~56X^lDo&pb%)18e6q@lm$&LHtXvuIZ>R6V6&@lyojNoXk;IPl*MHy6T5ErX`
zP|uy$W_=`m@I5<rxPvR9U*4-(28NZJ)W43M4=DI!CyA9^@8^nQlkZBZc|PFYn55tc
z3hw$NRavSV(5zcX5RoLROQ5+p=7gJG^4lFMbDnrJqE$?Ip;3`*<NdJh@@V;fo;2lQ
zWP@&5<kA_M=UEb2#$~*BTNRv??yHZ09+^$Z4iBZ!y4Gvj{f5QtbX@Z{Z^uhW*J~jN
z+Tp~v$4-(Emv7IL_!;!&JaPQ-XhRi(#<|}9>m*TUwPc?+x1J5KxPq6dv7BiXHe|uI
z5CvtZRe-nZ`nKx=cA1u2#-@^5UsJB-Do)1|Wx+|E$bP}_V@0yydb*=~uiv$zHS-?{
zl=aNu{xeF*NVIA#%1ods>rfq_CYS6ObL))(TN*CdiYO2k%1Do=MQ}_!i4<pOfczu+
zTz^1UP&8qE>r2{8hW>taN}IdC+y1Cv<uY%X%~ACJ1qDgZe?G%M0TH>@Dat=?do%7O
zUG30zYQG^}U&bCQSBe&{Hc%p|E=Ykgyc7;3)oQNV+TXDgG*SEg8d{e}ZrB3ln+90O
zMKEI@&3moPdqgc7!uY477tbi;UKl`^fWx`zbS>yXXFXLD+})o^S{C~3I~p(rTX7#E
zSyxv3cgrk^kh-BSACHEV3naZ6kjam&dm8(^F^T;jQL&wYu>~uUrazI}#hFIJh!(V)
z-H+=)H>Ahl-(L>oRJQ7Z(e!gSvQCsA6zG|i>9e$;CM#6l{_D!Q?w9+F{FbiQ9qDHZ
zkItjlHjnCh(+q8IHeh3j6Y~Xe04M-&2trnhDU}pb6R6I6xX$7ZR{8OepRI2`4cvQX
zFfdMOS_0JO%w0I6EJ@uJCw7#IJ7_Q4$ZP~-H$ZPG&Yqn7o%(r48=>bq2#Oax8@%2<
z#O%}VqN!ne0iPu*6k?Hu1=_TS%6?~aqG~jicOTzXU`y+?08@ywT<5PRJFaHUy_)B%
z=q|G38l|V}ODy=-sk?s0pxmJOwL$khwuw3J)moBP__S5@qK1SXgAqwx#*P~%z@|p!
zZgwBk_7C4?tZq4?bCa43xq@O(L0tdP%m47ue|R`trTZD>_6wx-=YKu_2IwUs5Zhg-
zzGm>8PTzH0AG7I5-m6t=UEM}Kv!h;JN?&4EFRd?HH;MqWitk%Y`r*<sjMuJS7GXpY
z<t6|~I1WrkTnjOs&q3p*9joUQD+>b?Sz1>|n$4EcMa1LYodFF%62IRim<tiWV%><R
zryWN}Jn;H|nbJ&tjaw}-ji!1|O+y#Ix!Ks*)S4{5zL<u8fZsI%FW?NCI7SncgTIbG
z6ur+IN=0I5kw{}l;{B@%MNX9^)b566D|l0WAU!R*NmcnnBn`}?r)Ft!>w>Occvdg5
z-+Ad-zDO%KRA~~kdG$#e*NyW#l_Jm_+L(h|g=P0X4-oFg3bW?l#;4H5#PR*hE1fe_
zHO<xLqHG%+<+7qWwt%M5M)6cGRVA6O$v-WTy~dNQTr~LYX+!9WT)dzDAdHVZIb1$j
zasRCr0`dVWVG*XB_|_iI*SjXyzVetJY4dwE>#b@L!z0#LYu0S>P_V!AnmqVWa2edD
zIH~_w_i!tZ<%sDC1a-7M{M5og!Hee3r{F!EuTUJc#6syEHQfahCGlxO3JZZw+UmD)
zK38Gh_)~t1c5D}iy=%@Oms>pRP+9_^5=_!l?Gz~)UsnVd3(_rA>+UYSlPJHpozD6W
z{?L`}U0i-U&HJ>2YZAf<nk8(i62}S|6>ntvb0G@0r8I2`Z9Gzg34d}V-rntF#iF`b
z2TY!56eQJ_#lB7(hG;WFn<0uGu7_n`1$-hcty54DPX%F0`Q-@^*{E_O(d}Vtv2^9A
zDN~gTju|UMLHmlk-A+lI8S8hd?x{q`{I*|(2R`IWO!`ql?*)d!`B7z<p%T@FvX8>C
z?j3r9(PzL2ZfQ2j@B+ElKfDXL4$G->WH~a7^A^C{RIE+s*8XhMbP>-u48-1DFANI!
z>%(KS@wmV}#XAz@VJ%MhoEfy;Dp5dExC9ejML)C?GPn%>I#%AHu1WUd4CH~Pb9-l!
znNpRng=<+F&}1_CS`_e9uzt>u=DVk;2@xL3OTl@^B6}i9FsxRN)^2NlBgJPyS|%Od
zJx@h&bY~Hx<;!I$zc1$;<zucEyCQzyCM6Ij{HeWe$m4c?d3srl_wyRs&}tN%8(x1@
z_^a(pf)?@S(O-_I_g2QUOIr78Oa#48F8TNSsDxdi*PI~|v=48_k5f`~p+woG!LM=M
z{CtZWvm)_gwZp<LbCVg4xh#GTK~k<cJB_h*Mzk&w^A&uz^D(|^iKoEDr#2P`#&n@Q
znzUB^|CcEh`n&$n<LeqJ)Tj-dy?$<5R5o~#vmR9lTruy~aZoim#A%9yO>jb2^_yw0
zI_8MtwzoE#UDtJog>Q=mu8J+*B!Q&wzW+oi-Ayla2zEk&gjle&cFPpJBhYwP0v~tI
zAmhGBnWNpFeODO}$tFT!hw{OnHhnmuV?*L<(NvTR#$=$n_sBZUaCQ!d^u#8)4^+~k
zGmLeX6svF6S|(Bfsh|gnV0gGR#)iieR5WKGj%3ZS&R^xYHjr-TMk%c2>C7wT1LX)z
zLz}jj-Lb%ku(A1q#hjjUx|dO0Yigoz#AGLVwpX-3ykzOH8CFR4;>j&}dMAxxuKer_
zu~86)(i%$Q<efJ$MzZDR<iiiN4OwDXo(Uu71dvjatXDG3teSr08Jt!z&(8<u*4b@H
zU7I&^d_KkZ(I-bDz>|tEd=GP9fhhdCEZdPTOOOCJQAq#6>`g~bkh1VsERY=adF@j;
z8t<=MZfcn*<HI{!x`}9bH+Dm+xoA?RM(ts`<qfI4(lyHOYSr^sqC0I1H#wdue@-8d
z?PV`IsS?*Nm;4y@g#9Vt%XQ>0+K+ei^91Kyhx8ieE$>3@o-$lq*KMAkNOf*0qh#FD
z7JWbJVKyb?m@RtmEGP4doV;-BKZ#|{i7C`6o=Wx?fS$~}7TxmXxNNUuIsctpA_o#w
zyTIutk-}}G?yuI!X9k)F2H6&EMm^JvmbCC&m?_b>uhBlPv%pH(Rq%1vDcJ|v2glmi
zwdFtau9mX>a5mF?3-v;m@wr8+vt5ypN?q_{vMZWl-|{57J|sHG;~Ssj%kkFgXsTfM
zg3ix`)s`k3!5|;4<p)h{e`*|bLhRlw*hI+?U);J;=XY3qt(W@KEB}ppS9F(CtExkD
z;n;KEW9Rt~`kz`J{MruDTEu>AbEv7Z4-Un5O_?}&a}C+=?mKtl)T{6`(%EwVF|R+&
z)YyKs@6y#~XQ_w0;T)aYjjU^O^LIMw{Fu2L^`h&`j(Y)3kclyacORK~CDLk7H2%lD
zk}kGylh?}|;~9T@2rc7yse2pw7)BXLmnXe{zl0?+3V4D(6!iWX+)MoX&l5oJ^p;Xp
z0moU&L{0ik5Pd`rs&w^Y8NS_noT-p1dG0~atS(4(DW5J9vPvE2M3fGFmFaPRg=h5i
zt;%H+HnrYEC{=x!amX<JYQ2YOaN)a)F@@Y~@f-Z;Yr|Krgg<yOisv|S8gZA4xZh#n
zMsh#t*}t(DP3-!zn{d)O8Za0$ZT<D<__fZDU*w`2v=%mm_$Jd|I+{;U1{mw|P31f~
zs*-dIH22_}F8Xv-qwyv1Y9ilEIoENm>Hn>IZ?=?kG7et9-!l7ZcTUN<Jjmr6iSKjA
zr{kA*z65)a_~r;#XkPezLH*~v4m$i93Xl!CuFJph^<f}wuT|C+<Ie+vo<>z4Cb7Gk
znoQFU_*P>}kFA%Gg&z(low}Age&XS*-7zQKyh8!EzVUynU^?MmWx+G~7EG(7-te`I
z-3ZeyUOwN{qv=HjMe;*g{ysV#n6;!*oZw&MefFkD^6Sk9x|&PvCdSe{$Oxf)PpbJ}
zZ&)1q7|_dQl!`1Jea$^Lw1>+DzFgj_q?J2}7=TcI>g{N~Y3(kOrY(p~1Kw`T$+{7L
zLNA@B_cS^Ch$mi+x;5d9E@?UGd7{9M*Ivs|j&F)pE*)=^*uRB`12<p2z59i<;(!(i
zpTPb*SRNruO;>NCsQmN$XjOm7jnR%XxJLESA~Tc5S-%3SY|BA|>hY^29gpur-2y3F
z0A`3sG<k^Qz*hWx^Tzg_uvDSlI>(;MJAJlo&0sc5&m=R`*8iB-<BqGji;myoJW{)=
zMayulZ^+DRK7=yvc6{YM*0c(TyGNst)1{uV7~_-f$!zAKBcf$8(YTvuaZ_)id=YyC
zTu!OMjNPK?J?C5|Gq2!S4e#B!e~C+9I`_Z|2ab(~+GrBRgyDea_uY?xFxe$%?9x=Z
zfKwUeOxbRJ82^+A&nI~nGr-xx1764jy541a2EtiP=-<s3p!Zl1NoRt^L~a!)!t)-u
zS>I6ma%G*T>9QiMcRB1l;^ie%HqE>&iBbV3Mkv@McsQkSwNrxg6nviiD2kn+wU%8M
z%H&<9<8~;cyc<NJRt{PP)YVF#wOBFM2mfZ;J>!vM$}sEgvtsz5w+;3B@m^$wLWFYp
z>S67Ji=bWV>P))QGEmJfEy-#w!HQP8pRw0VV91LNSq?E<;TIDTC`{tcy}=?r33)``
zLikw|n$Zc!Vb_tR6aGc75255@;%>?Y{=Bk1#k@$@C~(U1vQ31txuK)ilfs3yK`fkO
zTaMZR3#@}sY6567L<C=AnX5y$9bPSa11`tqDV@fdwOIK`k(MlyiqI%p=^;H<+EwNQ
z5$<?N)6o?=rDVRm{a3}oU2XSHDy#+77`Y^W@o|Muz4xNfvJ?`zAtcx!B>YQAR+goE
zZ?8905HvMYxWYJe6V~(!BIYF&u)_byfCV}N!Lqaz|0LrC0&;9HWgCGhYlv2a;LR0o
zEeNF%0cOrNV-m^@JAnP!;9sEPN9eIznTlS24cjrJk+FeA9zZpw;Bg1Ejb5A%UW@U$
z5{kcS<g&!1DY(uJO#SuP@(zx7p0h^fN~ygD88Pid?DA!l^F)kGzh#pl+Q<y&%6yoT
z`QRnpbs+OOS9WnqW_n6?%|>pKP44@Y+@6w52b(<U^TFhw1L>a;GNM_$m`2u#=f!0a
z?h-3>SLhTUHq<%*#9t_hN23Jj^5}vxR|l9IWZ0F(uPCo%C~NI1Cqod*&F9+EY%yiZ
zI?d-v9~T{zzagjJ*s!bm93mw1c<LvPIU2~ICs@8h_{iVz$Sc%&ojtpZi7)ckj+s(P
zvqA~|@-Ab~2$rV;!y{!|V<Y#irdhM`P(ur)^*d9mfnBRSQmgu&<~v(~sIm^a>@P!k
zJiW@=)$BT5htPR;?JtpEmf2yE&7f?y$zB3OcA1DGlz}WkI#jv3t_!^e&_?KWEE9~u
z*M*jrbHtRCO7f)E@^pxMO0%+Tua(h*STqS11`4*F({Jf8YBA8^FvMFL67mfB%h6Xk
z3=HjH=5~umA-XqPbOUF|lfYlRIg}zfOl}_;dd(QC*l;=rl`}PPWTVUi8=)y8diDmw
zNs)#XK-!3a>ScoZdyEy}y3jU+fu~%(PNJs92Cb6MBg1ykE^Qj!z?ssh5RI{nKCm1V
zxsr^S+inrqMO=-HxcV>ZN+hEdRjU-eiY_zfXSP<*zMT^P3gc<ip}?^<8H44pzq-<5
z{g}~4v{g!S*2eyDemlw*7Ht*zS|Ko~BNoV2j514w!|G=sv0f|z<?1iI{)fQ=d7fiM
zL$JbP|9=ejy(k~J!in@i<=We1RtSM#o~*$xt2hKPB9p=)<+411oPEuf!^hBcpsp6c
z*1BOr6UCXfqPaNZ>L=xP^@iKxvD=p;*YC44+p})ND()_39_E=Id-mvW5Utdy&(vJ*
zhn#a9w_F+9I#}913pgmP9ap<^(iX0o1gYpn5*RAHSj>P<AX=_cZ?>xcBf*OJ+|Xk-
zXyaqi^YyCq^Y|o;ATY#wv7Iri)7Y^)&|NzR3MuKafvbg;^!yfv7y@R6yI%=sHKlt8
z8N6%N(8w3){je8tW6>^(O6p<IhlfUukGkLv<V6+eTdt63R7f+|=TR>0o<G42T*2>D
zXP4T7Cm$J*0;8xV2&WXErgykP-`R%_I|RS@88Z0@ebN>d%@|(SW?yhmSOCFiBVsAv
z?=a}i5&>kFnPCVa2vg3GuO)m)kJsszL;%6n%*)^Mv#{04Exsu+)l~uCV>OpR#j{nO
zJ|K%7HA`7JV^H#qQxSL@j;r63mH#&@Z<?SpUD#Vyx`n(@(}pWro}8o6_9Z8G4wYk#
zZ^XWEv@79;H5Y{2HpDe>$1B^!&vVVbKZzrpXg2KI+{nD!$bDn_cAVjjgpY4r2Z0He
z_Ol0Sp^xo4DrTfxW}tGPg~3J%HPo~z2D}zr-u;vz-fFiUZsP*Q;Ss6V75lleA@qg0
z4+9`zQj{n=4r5gY5H`TN%=^=y`3ZRHF=s^bcfG=fNQECeD%k^dKa_KxKbrbuQL}Xt
zAKhLZGnXpPm_|<iArz#UH>Fz2rfYeom%K^O<jGiZ%($s;Eb>Q+%%HrA$(U@*c-lTw
zp?;sW;NGi)4E$;QJUc3}PRRG6nXH;#&O=CBKLds!h=E4I3jO2A{jhfNBR$&ja=vU&
zyy7Zz_Oh975HpvNcFG^Q<r)r85e5nq5#HC>0m!{p9{0w`m3H%QQ{_C)QgqtauIg#%
z8h7MtE$3Tn7~5aVNB`<@{`=6YL)Y(`u13QnOWp!yCFC=u&hw+NxWA!^MF!DD5AX68
zkq#XSHxM(_dHLVCQt1yfJtRfhcws37{F<n$Kc4kmgxj-%JHPA!Jx=@_i;INP-&)0m
zsruNr!43#|7pD*5Ko+I7%q%bFU6k1Trci&GkSm)QX&&R9;aO5-|GRlZ^M-;;2Az~`
zxypeFfAO@?!XiAjLh*IQUcr=tX2r+3JgtRttbCQ4ChTK0yT*-Jw`&45Tt%j56_(DG
z*0DN%LDgyv)mM3Iem~;*vt5}`ORIXzaG)xp116liAnf}I#&nH#bM7G=tLT#?yy|E8
z=pdbCp(Z-ls1hKEl6NzGSsfbjLisgW+$fZ`tcSHe6F;jbXik4BuK#cb{ifMKN_48(
zEPk0z@KjM@x^-vD+fL`h!b_rN<Dzr<--X4Al|~iICU)n<#0C3AQ|4?>e-(W*WtV2P
zl4h;NX5F}EEf9y&CrqTg@Di}q)}_^vzg0zqp?9{uu;68#lGan{CPz=sM_yFaac#=4
z+a$+2BjVnObiGOZ*OpxJCN56A<U^aNY<sj;$Mr6c#Y02kg}5-Mj?Bf5oBW;WUG>lY
z*@}*Jj&XMB+~E^XH*YR$k)~)_T<rO#)!c!XqBFw&S>au8fHD+|47`GAe`2`g?*qB^
zjX@YXXP$7c3b2(XAXbGq1d<*aw>{)9#70ro^DG@W_p9ai%XUv<<ZYB)uaeYC?`sJV
z^_EQLoBNGj7lsxFxH~(h^t{!qYTmo_n<EAtr-_oygJZ?zUaoW^jnx4H4?nu(Qnxs>
zj|lp5(lVL|ag~EJARQ9=T5_vS22^Z_6~e!y98w?Lpx{HQx4;sFKH-z_5SH~dgmIN%
zMnlccAkpuljg+<Ntc5TYdePZO57V}?u9tRgpN}u9eLQ^h@yF8muya+M*7)ByAL#`@
zf&>e{m9dU^jjxq)hRk>AX-|qjo&@Sl{MDQi@0qgvJC)k~+Px0{7?&Okq~$WjN?~b_
zx*#>@(9<~6Q;`qM6!1qlF197JHVF5w$b*Y=CNr}8su$*2K1RPaMmp@)^pmRi<~dWO
z6Q|6#Ab1!3>|(z1?r@1<#bEhDgWJ`Q$N9{H)33fPw%%PF?5VLX9uYPb7HGM}3uet$
z#u`xzt7D;A<&3#05Cd$)CtqP9Al-Y2F<UvKdL?;R;y?G5t=zFn)Gne2GP<nxoe)#<
z3Go`B&rC7@r5n_zbK~9P`9Qn%H;>o#dcCg-Z5Z3rWJGNomri^1zH||KmDBM>FtCNc
z2zylC2TH@75tz@Ht>E6=&Jb2jFLi?z>f()SY+m5n6|OB1U+LG#tV>Nh0L!kYHOg?6
zwx2<voSS1cVwfOl=f*DeX6@m{n%|ROi(h|z6WU#K-+gzyN#YF@@{J}u-r}!nK^3KP
zO07Us$`os~!SyJPmaoEA1WGpG$rGQS7kc{_Uhi)&UwiGPg{=PBjAONPETvh=x=9pn
z$M)gHf6)fae-}Eo^*DBXdh8+`|MN)(4;j5*Os_yNWG%!D9YGBs##vtKp{5*mg^(-)
zodF;>dFA(=Z^H43vAg~9P$a(RQtcx_f0&Au4kx@_=4tly&XsS+Z-vi^9_Pcl6J8z}
zNoSw<Ynh(w-+8h^7xfm3gRswFsZ%N$ax1IOfia?9KXcwf08kULXhgv2B5>@f8vc?`
zGajr+W=fg&RPF@SETARV&M(S0<lTv;Wdi;E28z|B_YY-UI*&e=<J*f6!3*8#%Fo6h
zYsa0P(;{jo$_?)E>0}`4rm8JUH1E>228<Tiy>RZynDr8bH@%L%pmSK&mNda6>(GBH
zE{L}CD6;xJ0_hb&IOqSqojSzG_nME6eX^oR_l*=AufZ0x0J=p=*4u!hqd?ciW~#7b
zxbYpATJ&a-!8>)tT%q;<!<4#oB{2TmvYTuPeruQFYp%Q49n6fLGVtA7Vg7yX3-{zH
z`VPme2)9a-`e2;d?zN|dA0HDFzVE86U+>`v_^~dWo0W;|IXm82>`G+z2ueNZ{@$@7
zSR-?B@&9A*zMq<E<Nm>?lMqq>=^&ws0uq%bH6Xo75k!j8K?FpKAVos&5~_fxGz-;G
zL_kXDRS1am-lQmkpduh_yzl3E_L*<l{cUGwcK?AhbIzPH=ej=c_sfiruWpdn{&3$G
z9U{q)+>V@poQxYPc__f=bsGueEaB}>*=|K~dUV@HpMDrK>&6--b(O~!pO0~`K9aGE
zXWp@gF}<kGWKp_FYR#3Kr*_*XG1|iINUCUUhh&YKGx<q>veYe=9PSkeCN7DDLegwd
z1&EMAwI0XE%fJT?nRbt~owA(bQVSo8W#v6prYyH+3TqwZt;Ud-GX}3uy8*k-EdLqS
ze;S4kV9j(s9p{oCciz<^J3=EZOL<A;ithQE92QKvyOPfH(^?F}hH>VR3t2ve{w>_E
zipz^r@)DZp@03=yZiti|yP4^q{giNN_IeC%sHCiMCKbw5rx(Xkfl36&JD@N0u+x|U
z-LkUsfs;7*nn{m7+p>|>d<Gd@=noW=@$!wYo<o3NnvrIvyU|KJd-;Pn_Y5YO#r~;G
zkLKc=eeM(xM$hy1EIrqt;B)w|^pLFsOD^RE0t{jHS#l>@YnNK|>Bgr21!OxvlHRjL
z_<4d?uPl$4Taoib@<w;whf4?tv4`mx{#jq{3|`A#2A?#c5<Q<Gjltf^+-!v}g9=(-
zxJUW<=y<Z_n{V#12>6b)=%3vMq;}Lw8SB?1UExi<Kj|8s<?~cm^BTr}bl&K`%hJ)p
zMRTE0Qyo5^F;s1&^BaBtg{ZbM>ELXJwr-j57)i89j9%+it<<ADZKdo&)jr;~{ephM
zRM`_rJ*lT5TNs%Hmy};R@1X|1XSMY5xWCkdoc*{^|83wfAoj7$XI9&z<al{w8)FpH
zZ>(jnO!ag@?5UXLFo^Qj{Ho#J$Lq?EPEpc~yS^@J7G8bGl9cq&J^a_RpBz|%r-ngX
zLo>vHoq!LOmc9W9g?_0zk^e5z!V^M<iW!8(M2SeSF@BF0-lLL){iArbx=%y?@U>jc
z<fE-^v*=D<h}x?Y;pO}tw?o27GZt@)ZXP}#%AjTP_HbvMV-^sev=AX2_fT>|4Go=F
zorN08vHhlraX>oRl`9Xb;kSOC6O2Tdk@@cKYM$cDi?(uMv=+b7N6*oo2y+s8pe1s$
zz&2=}&I&Vf#HaD0y#3prEMo!31wC|j@OG)w9x?4_7a7k0V}tx%PcIR|E*=@xozq}U
zHu1roYIch1O<eL7x9u3DuCcgTd1#PD^5mTgdzAavPE%}B<?l0N^zr=M$GMRgu@}&4
znaTWqDWEodY+u@Iqogx;mKg4N!DJV)Nqw2I(yN)8H<=zKwe2hc+ma)NsdmV@%!E^w
zHoEFM7m(INFO`LpBgJY%<LkcYJ9+J(s?xj!U&uPkS!P8EyM5(8f?qisH3WHhWQz=N
z0SPeGrrc7m%z^wd+Dg-wz174BxL1w1*n>}1!ZGLd<zSNBqJ|P&eG0h0y3n$Nc9_6Z
z)#q$!JOA8FQMPOL$wG>^ue7d_Tt!+~>&8J10YIc$M7aIAg=j7kfSSze^Y|1?rfTR}
zy~`U|05%f=vwPi^U!0iLu=CpV&4y7iIiE>2SX;@aB2x0&c{Zn9=<B1MPh_)4T(|v4
zS*tVSz1fplt7|QFSB*+JeBb7%rEk<c3P`oN=#%N+-f?l2-L(01V)0sP7t7Dylt7nP
zyv8C6tZBK7JqO{HoUzfT?hCvTb~$tUN9G;t2lY%IgjEu$!{HW7yf|f2jf^To*g3NI
z1LqlQH0;F=oK$*7b(Xnp@on3Bc2QB-v08;cU};QNyx6J7Trc02=(+(<a`X|`Bj2pJ
zmpWK7Poh79E?)yc07L*(aP<Az-LLoW#eUkqpLR|P8BRAB-?UZv*l7MmtbclaC}IsC
zecABt#b0+W{(6+evY!|e#G5lz>;`>{YI^#RG3WL1z;ZJhN`XO2+RWJ5+s>Gf_k+xA
z<08PWhjm@7B+`phmixJa!kJMWEw)nu`<WNqh_V`1_F-B3_nWa12?dgmgx5ZIhrahD
z_4zDue-w=7!gj&D%$0G<mu;@pSS#CgI-LIV62XJ;p2%r%yzurO=!}c^lLsQ^@Y=c$
z*cX+u)uErWTrPi@+^EbtaZA6t9MwT&<;ec+Rw%8?QtS)a$<I26mOq(t7>v=#R*!uD
zNc~i{Mo8_%OO*bS&LDjhNaSr1kQj=>jE}r{Mx>FiM9g#{@CB=H&5@hD@W|Fj;5lBV
zfv(MmJd>mC=kFJs7oS$Qx;TDxFFM7f+wD%|<oHPW{TLF@SGQ<KYtu?>Ms;Gkt!3c!
zGK{|bE}NC7?yHP4fx%}7g<Fya@2B_5WlRQ8@&<U>*_Gev=3upR4^7mkf1a0Z+~KM9
zh%lTVUeM$uZX^Ygyk&dsYIWfr+X>gX7D6r6>cww9sqlQkR>h5OST;>GP(rdg!Y=Er
zmhEKrO$&4T{eEs54++fpY{&8bS`&66K2UaOh5dQm&^s${3SZmFYQwsw!qKHyfEh4j
zfID3LyyI>@Z}29&LBLEWMdD?=2Cq$I!YTH&Bz%JbN6~&Q<?X<a+TGDjM|<d*_5m&%
zg(L2xBCr^tBPLMmTbNpO-8AN^dwnX3H<bS>*Zr1l>l-n=rfl-lj7bk}o}2B@$A+>P
zhWe4Qa{L9abk;uv{q8S04terwQtqcBx4)S1-c9ibIwoF+86+%!-JH+HbxhFATP2r$
zn=l`Tdyk`tvwUA=VPDUHKE_F|3Jv*nueTi?&ff`fZ^Lk&&T!`<D70RVtqr|WSpg&9
z8#!Z0FO-{xkd6$h7YikY{M5#TueTa!e5RaKs(lXmMKVdnpP+wyM!y;fNhP2C^7-Kl
zZ#h&(@YI>mM%vH1BljTrPBkC>{R*z3dk;50d$HOgYp4)fvy|~XteOh>OhE2PUj6k?
z`xvU?>Yu%<c#&`vF#HRfI{Ft~FA0{m80JgmxgZ<PI0g|g51YKAn7(_HW}O<vT%0*`
zX@-KF**0HU2t_5MaB#1uSHi2QNK4Wg-eftuWtiqZo$Lz}?$juZ5lSB*)JuY*^5~+k
z1*3MN%GxjR?hqJ9JOZJS##%ApE0Gu55b9*l;T?K$65`kp_MHm5Lc-#HAqsZ&v#Cgc
zZ=f5LG0@!F!$0EK6KzbCdqIJt7$b^4nqewVq94oB5(WBKUHl_m;?MiU#H`UBEuh{I
z{pQHfQ5F3sYnVpEFut7|$GCI3vS=Si>%cX;t&0p!xtQEs-e*vY0RISzNWvUGeo89l
zoyeogl=zFx_Xn?^PM|{cNrXn5^BfD<0U>DV3XFY;@q@obfJ@T2<0VQiM!5r?V957f
zE9vJNW~2MjqY-SpTKv))N#)uj%^HlyW2S8^Yc|!Zt`L)78Eat9_-loQne86#H<l|l
z;O#!?Y?d_R1NnI}&ejMfVFNn5kb(hX_yJDlz=#!yt>SvBV(hJj*C|)Dg~e{m$CBw>
z_%N5W8MP3Mm$O)6D3Z7KQcZ8C?|wQVsTHN0n1((dMf(~42mI<ck8-qub`C|_(BM}b
z@;wcHrLrC4=&h;HrZtT2Z|t3kj9VNT_GgjqR2U{1VTjE*-p;sp`Eg=0bTabMgm9YW
z*(_DNv``ZmG#R2zdd%+$rVYG_d(yqffgEpxtf>zUsSLuN3|%+|RNiA05S@EAd*3rl
zl9Uz8hvc8fR#MpfY##a<X20rTYQ*~_Wx0z{f$jLLzSxWHRG=8Z!(cs|pM=da%&?|n
z3m(vA)B3Fdn0XxN&UVU!o;3f^r^op0W870z1*U$2CcefT=Yl54Pf-g`#q(%9Sk90z
zgeRB2ACU_wIHBjkL53dCp?9)T7a;kBjLF|{R37N-JZ6Im6D9>A>T^-9+_9dy=%Ht5
zMu_(V@Ow`>%(>@Gy-YhK=)J1v{iDzCVskI_ir=LILjfN70O&E18?k|LC&Tth5Pkqg
zh(7Nt0PT7fByaIdiM~)(=kaAZao$O65*7M~gc7D=)B^I)1Ea(_-AbrHBV2)foVXkn
zSOW0)PG&m?z$oaTBygZC0+>ps6YhQaI+sln5cVCw9{&5~J-Js8>Rz%=JQLr}{Z0l8
zV_zK`zQVdDpI?BzUV8DQ6U{>gIm8uJ52yDFV@^$AKB_Vr{>DD%WPHk5eCjvT5(&zG
z`J~8p^toMjQAL1=<T+SbvG5CkTaBwzpG^@h9Mvo*e4&D&enV(mtJFytW=mh%=PKxA
zQPR~bG>wIwMwFd3E8+nZ^cR=$4#O|Bpg;8rrDE;pv+Ww{L5bwD^<qBoB(P1VTqhr6
zNlN~9a5EIkJW*W!yZ*Ffz{@>OA^G(;D5p0(x!{wcH*}kv?KUs}aFTWS(^2ua8eEHv
zY{>9C6)#j6jIhjK=__<p#U4#mSa+bo@)e1>^k?ELX+WuHU#0kFr3A9-f@swx-72X&
zRWk8amrJVT`>GT-tCW$|Dx%d_rm7OD@VjIX*I_B&ra*g7^;8Gij{2NS_pRxjlegF7
z-`*&BYuWeKdh_iqWR0z8jlFJ-<DDAk_?p`#HFx@I+&63PaxshHU~>o6Iw{Y6k#9?I
zZ&fMpf;ZoVAZtUX-d$(`N8YK8j<1dF17F~)P28+a60MCWsZEWqO+eN?j;{+5txM~x
z%Xm`ve6#jRUtQW}UGAOw@F`${eEo~S`Z7@n9~H<)1Q$Q4y?|vFny)WIzOU4MA9LqD
z5ApqTQJ5VTz7_XQCqG{-pdqr0VST<~5ZO4y)mVm2zQETw7T>ty(m3ANI2ag1TN|30
z3cfJZun^xk^1i5%@ok1h)9Pl!nq}@vMUyDCX$#rhCwkF3u9-DDXK%CVW8X<F1E}c)
z**G}`goriHO#y$zQ`Rg`|LLRr<f4gh&5S`!%zC^mN6o+9H)ENLoNZyHIwC)ZT9)%#
zApI>sCgyuY%HaFj^(ij!bZa!cMLY+6R*(BkLkqiJOV390LVO#?mo`=g3dEunTTsle
z$3miQf6289hw*DFaLX~YEA;a+^|iu}T03=lMcvxgw_6WYI##*bFDtamyR{2k>{RD&
zW~l6>T6P+XiPh4xQb;8wAOw}at6`_p?F+xT9>uaBM=b4VooxFO-{~&a9%I#UdzwF(
zyUQ-9bBwDeu>V|VHcRTf7=_}Mmx3f?W0YEj^{-qv$n+9&?zu5^()I052dirLf@pX7
zmyQ#zzUZU28Ot80{%*D}-RCPi>l(V>9W_vLdXxCeMqF7uwoywIjLK)VEn3GRzTArG
z?2;j^J(0e2#k+%>l{DQe@V$53vafO)c!QxY%8joisBMnBUrnz+rJ-+gy01y0r&M8Z
zT1;$lgC)TR#^U9RxqvWR6sjH8@xYxkx&B~3fu*^BU|ykbOnv}uJ@C1|BFSp-q2Az*
z+hE+Zz?q|g?V~o{GO91rn<YS{S<C&jYxKRuVypaEbn<<1#bGg(4*o{og)gmZ{Q|P6
zM#iTDY>h)a!9&uh;eNu%clmZr#gA5?h*ZyDaX$YTfJy@81a$*{IRb>t#lx2j<sSN(
z={8bROGj2hKPvs{!pwY>(-)AMp?Zjox;KvY)K_qq32w@d*;tGJA|N{!+gSyQ8ZV$h
ziLB)95&y4DEDEE0JH1Z&0*+;)3X4OYUq`<@8IKPdG_o7>aUU=CLR+?2D0pF(aFYf4
zlZEcE0NnT!p0R5s6IP(^gvO5;)D)}!M9QC!rGG?>kWa(&r;4ARZ`+=*QAs|+eZ*Yg
z!-h@we1&z`!GgM&J_BY3{xJQ*&P0BlIwnoz@K<p4by$C&OtK!M?SZ(8jg@^B^3fGp
z3!ZUy&}9T7EQwOid_EyF?B3t$e7r9ILJ2LAr!PpKpc6>Y+gMDS=bSB8Y?FtvvFzN`
z%*@Tonfb(tl@C*P<SDqvg6+_3A={j7UV~xdf+KV$eb?-l4a~`i?&~u8^aCa~1ICTA
z85VsJhG(;<o=u5)EHPEcChp3n?$D8N+|MK6Iyk1{HaWT41@WH?PLdeqF=Rn1)Dy%g
z`fy3Qs{~apd|qkghLT9jC51XXgKaKDHp%Lo9O523W@cB>V40nvausC@%cLSxROb6q
zthQbwehIBulz$E!_^fl00QDh+<Ii&&(R17Da<;2zk@(#QcoRHe35N8SQjpFsiX|Ma
z&ZmA3E?<8#upaD_M7P&+jD-zR&-b!(n?p{nKWJUkdc^4Dg9d!pp;dVL5@U}^>rWqT
z)|GFXFX)AyKdVp0q@-fPX|$`MPD(Xbi2?5;C0*_XMjRiv;10(n{pke8UQMSI$&|0m
z6<^J4XKv(ShJtm)88JipDXbT#I}%w(P&0GK*dy%BnZ`|l;mu$3FymYZ?jHJaI{jB#
z`)lEb776;c=?kyNr4$v8j8Km37LLq^^BG68np-ReOIzZtD3)7XHJ)9k_~aN==XeHp
zAa9u7|H3x1ar*er<>q331<#!wM$&BTfqaGl5)^xFEd-yWn6iLj+*uAqIC;*|ibchg
z<$lduh0OD0gLiuggpheykJL9`uM<oQH06lc&#KBZdM{w2f@fxjXJKbMqx8$op#|4`
zy7L`4&N-$7&mYTqYeEx0(JepECr2|nbM;b8ei0#afEhj&Cv8^D0TuFzg5mfbE~mVu
zv9-IE&+s7_&Hs<-n*0q@wEfp~HN1p2<o)5aio+VSbbW=HWc4N(EWcp7oZ5ytASRQD
zd+4>xx!~`|fWy}&s8qnZJsmQH0vA>+7t_4oFvqwx5389+zZgb_otLOKq$dLyibOaY
zDR2+N3xC^&DHb~b`Vc(gHx-i~{<EVSPNE`@a*4?yTcSHY&<Hbj#Jbxzw3f~AEan(x
zgi0{^TV*__e1bSHg$7*Eo)`2x-fB^mygjXG<1}5j>1SZ05^`M3r+V$foUFwVEWMcB
zcv&l@_c)><TJ4sW4e6XJ=PDYZo*a^v+@57}#z4P~J(%m%;PWzNQpADxb^2tcylM8^
z+1Gb&ram<-TWp7j7G9L$Z-XbYb@B?R33g@GWt)AqsBxcZisZV!WmWI{b++Tl^=~(u
zg8yth<@CxqW%FVKmmXHcnG$sN!(K1b)znjJb);?YR}9+Sv~p6>R8Ze2YvYUg2$TB*
zx7cltSEYuWIe*jz1r%l$74+OXf9bSt@Re40>@&RNSJwcA9-(~YPyIH#zcl&C>1--y
zYO}fzlmwmJPS)!NMj3=1ZKFCi4f^EY$!Tqj+;(r|FBMKmBlOxa4*dxHbY3Sb`njZ=
z&J_-eVVA{5?}I>tVqv$67qNk9w_8y*mDJbbsfMay88`EHoSDjwLLE~o3cDQzpB#Uu
zi&d_HFC|$;A+B&NAH|-D*Dk)z|Ez^xz8_a?UMf;jR<rivab(n<W^7>R?Zu>mb8_)o
zqHo$S>WaTxuGE!ihFt0|29>NaU-HUR7t-r>t+*iAv=f~XBso-&FPy*VeCf-^-e&`u
zYPsm@hJfV!wAV-L&@y8^!4WEH4^Y7`1M7h@%QP{T#CjjY>E0+TR7079NdO_X?W0h^
z1S_-R*J&r4N<8#TTeYzt)oNfRF&Vj}wNn|X77lMeZQ9s6a1TfMm<pc0Z7QrBvR51X
zq+HDlTrV5)Cp^RHTdW8BJLxof#PvXq_zWwKq8REeQHvc3q3PdktmZZx?N%X$?61;p
zy@=`3lQd=et|K7oI%?`RZCe=|w)ndsmO(~US1<O=%UZj5iB4Jj#IO9!rixy`%e=D2
z%jFk@{|q^(0si!)UP`~k)y3-u`G9<)l7<_5E`C1Y#_ALADCt7HFtG0NU4z~vlZIS3
zmXrr_kjqzWrYYCW&n2gu4jN9yX^4eH-4i%{_8ik|{!TTW3^nu4%ZQ2Xf#g=p5FM4V
z=b%3e!iguz#o`}FwIz+BuBusl^qffxd#f&!=8m}iOl<kl*30JC2lhD+W=Qf0F2_{b
zvNPXr*=1rG_c(94T8iC^pd9f_b}=$hiuWg+Up3yJy7R4;@1gXDv%DfH^Ob$tEvFlU
z3!)$@%3^UMZ1ugI&^-&wG&oa$`AbK&k|0Ch+XV%Gv^fLb?-?!TbXd`cPX}EqkgDGt
z7M=?dtSooAQ*&^ee^teXaq9Wq%9s&WxwnmVs5|cNRoN;v`206nD!jP_)jRE@m=JQ@
z-Q%fN#jT3SyO47J@WYG+fW`~)wJW@q?9obam#FBseG+L^(+#kSWZ^yVshI9A90`k=
z+41mEJ2^MAu4?>7_QSS_4RgY#$2&D)>7m%G5q76c@&zg#`H&vnnzEHth=r%2|Jf_2
zpV6Z8WyGDEyX+dws!LK0Hg-s-*GB5wXJlkrjl8Bws_c6i7#TM{WCEOSIR9hSdzXCq
zY|q#VT8!7bj*r1f3#_g)6d`6vB{>n6UvG>l*63ZO_o$@{DD5VgYuO^>o;V17?x<0E
z8<+Bj3}tfQPzkQ(lbx`?&RU4OETdM$pWvd(+{=V&VSFS$|DDdy=>}Fq5@S71P~{w^
z2;bM<iVV*gQ+)jr;tkb76wP0cDUDGNPZ%-_K`e^xGC#VilV{>fQso)mCZAIu`cI~G
zuzB0wkMH*x>&1!`D+mJLYgceh%j<O<mZXJNkJUN=8YM5c<sXk<wLWMO=ho)S1+0iz
zi@1_(lG`Kh8)@)J$_~f%hv)rfr-P;zwdA_5pT1b8rG4Y4k(h1%DbD30ZrWh3pPqL3
zz=E@Jdi}MR(w~a%A+GT3k)W#I9ldRd%u0zr=wxbDUV(U~luCw7WpYf!Q*oPZ&n(h6
zeWjdTIp}T_)tS|gek%9t*z8=i&1q6NTlCq+<)&)(^;XtVa<sae9m{+3PU+E#q)0ah
zA^97<W}}slJKUUTJ)HyhN2{Jg-Cfk>Erv5jt6!<RyPCeY7_Aw7`zF%e&GAIua&mOE
z=3R%ohwppK*`K5DnxP(^k@EjvVM<T_-^G-=yI!A~9P7Ma^S065!*6P84(3<eq3GfD
zcxw8yhF|@sMvwdNre?lH`8BL4-VGR=n*G&D8@_G4`|#J)+zHH|0#))1W1F6*)AVm;
zY4VJcnO?v|`?m`z-HW?Ey~x((-zn8}?~&j15-;6@ZgnNEl*ilC%V#tn^qMw#WxShS
zk%)fK@2KRRJvO~6)AeA$x5@k2uj$XqbOF>zC7*n@nKez#fZ_BepO-Q->sO-#MqViS
z7GIy)xZV{o`nJip+;3*{7G2<YhtmDZ$1`7?H3KI<HQldyH}mywbl~)gl3)GU%$8qQ
z;OvhkzouU^-$Lku=Ap{|t!%T~(V9VvEY1F%GP65L(Lu{X$`5+4&whX06|^eV{9wRu
zcK115@S3`E!0_YQy;qvS8>Y<xqwi*ayonC};;0-rIX3(AU03jyZ*$=6ui0PCbPu;9
zm4g=9=JvZZAAV174qBC&`#l)_aBt=`_WyYV_S%0Tu+}sL*3wkoI*o?Fy4hL%>%jhB
zAh0w6_JM~p4T1evfDQI?_44+iA+VwMJ*@p+4Eo96e-IoQ;6)8k`d5IB5Apj~fc-E2
z)jgslGBR>2QqdwxJ~S%nzYDNlv6cTIuy00V&A!E|#l<DqCa7m6gwq7rfB09ufTYT2
zr0D+?U~9Kij1yCzO{6-wr<tUsr4^*b|91h_C(DwC!2Xv2`y}Vt|B8QgqVcaGc`pA5
zu=z9rHm#r`tk8{yz&?K2R`c>n)T?{*uZT1RcK4MJO@PfR>ZmVzMsr{vl|CpfE!`^(
zqB*en<sJV;!4_A9{Y$~NRlcNAuoYD`|2nXpZ;Ntj;%E+R*}LBVq+lQY>%bN^r2cG3
zt7!cAF9Q3jIrCo!w!Vcr(o((I^5SR9(~^G>*f$+{|2nW0ody554(z`OY~x@>%h22Z
z*@5l&-#f59<IP{kdv_<g`X}2CCOc>j?DX{9zZC3$Ik2PuII#Z%0=u~Sb!~O^=j!C_
z=kcS@<16bs2kWzo8~+OgcH{p?V3)d6MQ;r>)a`zz7U(`VXsrLSIbL;V?thEGe%$%*
z2<-BIA+Y}cfxtTacLdgu1?wc68^L;iE$<;aXj~OTLtqz~g@10VVlMqp2yDSW2rTC6
z|B1jJyR@ZT>Zi7bOP@ZwlGgXZzdc2DoC?ZNy=DaEP$X!tWIC|Q2qa=PZmedzE!IG@
zIkIz|p7@NePfCkPPZT2fUsD~3`o*{~M8L)b?8-ufiLvC6O|`z{VT{^U$vDmtv_wIn
zNs2<+%j!hYDz$pXSLq&m`jY$Cd|Zp~*VJ=hrMFM`sZU(t)gKrLTGbfhRDvLe_{Yj2
z9NrqU90ylrABiF=?wv~!=D(JVRdjc$G?KH0)keN%R}mH0RE?R}Q7hnHyIQ+cU%cf=
z=sssCe`&m17ghgVj!8)~^Ue^tBg)6E60!rDXLVP&-KI4wyeBNgCAF{0bvKR>qk-_g
z*2UOOkc@}d9eCgC+>BC~$YK9_F02ZgI1Ixj(nk!6`Cj94lT3zRf#cS5nGg!u)hgPB
zhia{!)PjftEv~Ht@ZeAtoEgyzM#c9Iy=K_+>d%I3UX_a@8PT1G6!m+JyQ_i3DPUk&
zDWRbn4_4Y&yVxsDT((6`*dwd24qio`IOq#*ZIrrnbo=PXyzFKORQq)7#;pCebeI`&
zuDp8au5z+k{ttrq#V<*m5~PKztLfj3FAZr3C{kw~<u}D8e7Vn4MUvG_qTePemm^9Z
z34rBs>Ge$7a$g-h8a^+$<ZJL$_U=Z)FR4`~ZD$_{B=yG0#vcr6$A9^AGc9)*eI;Au
zd;b;TE8<i}&?A1s8t`F33~?%=?+o#(IYvwYFe{<@Y1==A=&4DvMQHgP6Q9FtY!pvo
z0e)YQq{Ab|7C@dpu8S!Y1pr<Qi3lfb73adIqm%f6E>_7{ASe_Uc4J?__AG-Tayyw0
zd9b8>@!E(C1Ok5yj4@>cQ5jDpjf&62<f1{hheY;eUIR?aB0!vM)sVulYaG}BnNx;H
z*w`yT7V-3FCbo+(2M`AB!a9m2DNt8bXr*-)dV9P}O`4kT9r|Dp1+Cg#Hbivc8yuGj
z@ZxbnSg?5kovKz>hy_j=psvbjTiqgK_ga~8FFe*=i|$bET`337KJLM(ZnE2a0=vf&
zDb{LvjU<$G1D+Qh%I)y{=Y>v2`T}*fQ(EDmy|9E}yhXRo9K#W#uIknm_e<E$qnqSj
zmYVIzq3>PHDI91Obpf6Q*EX49VD6j9vp3|e=C>ikn2RJ^Z;*C0LftdsntMXl6#Ix0
zzDS$p0G!o(3V7+2>`A=)wzgSYcBrsZ%LjqQ#V1s^JgH+2jq6k}8+mhe&52kg^U0Ps
zf_VDkK}+Y|@2V((4xOURjjoh|ju_xMkV>Zv$r`j~gZeF?;>xaQascKne;p3wimmay
zkPv&gpDvUotK_mGVMW^0j4y@8Fsa*{2k+56f0p_2sRsi=bw5klCHwMC7351_^Cv3#
z$<d;{OONA<SCnd9dp-60!$H~$Y>-w}HYNi`MxTY&%5J?7xE|yXex?UKoOFYvLZsV>
z&do_S8e(M0)=bYNoP(B~hDRi}wa$bb9E>&I`%-yw=QW|J<<*hC8S^ddDX`4w1)l{l
zLHx;veWL5|<VjOxB+xiC!t+8Y>#_<?1ZCLF%KtG`Ocx@q<$=see#EwSHY`!ihP^}s
z1AzL5jQ;34qeg1Rt4ryPdaa8^NvV97{#6HvD?xbsTCJS-dkE0AJui?K^{}HVvN_FA
zWo78*ikv_dRGSaXyx$*@w+9a!E`hTP&-H-drx)B}6uuK+W*-JqPRsK*r)A81UByr!
zMeK*g(qev6;|cupHzd!pTS)g7s4HSw&<_N|>MB{Q%g5h{@WQWs^%|=o-0aJWT2B&<
z+w`{Jc2kKHB_-aFcFF5q3*F+H361EB`~)pEl*pPDTfOS8I^Gpr_7-)}ZEwzSs`$hB
zMC~3w_{4J|7eZ`Za0nqh2ng0;IrQpL;ws!|YS?%DL@TOcRJhEP*Gj4$whcQ?1zXTf
z(mnseS$5cZrD!n7g!j(byi*zXq8-Jw<cgi806)mdc};JWpsno_f6Rw0@9Y&^S6Jka
zr&#CQbmYjBnztyp!)qJI_W88`Ae42oGM^>w?ZdMPW`UQxsY<%CQH5c})=~s-ce*2k
z57^WqO5>EjxcuRCk~+vvYd`Z=86n<r(_>=dr01680b8!&q(%7EY?Zp?z%AZ<J40Xp
z)TWN75~!bG-Z0}(p!e_VYrxl}W;IqKTHVv@#1}Te@)QqqBIsOKdF@IlI^>iDU;JWk
zE_{Nw;ia`v-vb*x#<1o3RQbC4pX@JkM6bScZM2myuv(#h@s02BwOtl|_e>Qo`s5@4
z;!ieOpXg2hpwIQSI9`Y+8P_huEtc!s7tZ7kcyi^yDEIvgQ%T&UX3Wb6o4<MDW@LP2
z$PpVGcN1G-!Z`4uusKEG`)ydGvHY=xV9CQLx%A@l@|EWz89ry*+^E~5JC_r0s{iMr
z-Bp|P#Yn;pr7RmH_oQRX*$))0<*67>Ix2oW)R<ZAM|j>%>-&gG%!^+|s3)ma@S2-F
z^++}5XEfe$%y0SGVfc?f@#o&e-je!Rr|J&Y(Uh$GM6=g&t`D%maghC;S?3)~Gfc?I
z_3xe$95`cCWpVDAKPs`eQ(_p-x5E`{S1KRhU1oNOagAm1x*bOOiu+D909^=y4TaF`
z*TN_}8OM+=&5%+j?8z&v_r<GF+rRcJ!#J*c6w4~Y$m1VMvtL0p`xPIy=ofY~4;H41
z)5KwtJt3A@^c*=1%n#WpVBUo(UNu%%*wHo4Lx9@-L}Vi>?pcAoAc}<u%Wa6|Hnf3+
zcAX~xhA$}PAr$AOuX_HqUw`wnRLx6IYed+sakjAFOsVK-b(|_u!(-1=M>@)rJ(?Cc
zKM=&!n&O1<NXAslyCTsK_oJ^=Kqc@o;pSk~A2?q;{Z_hFFg)hb$$kvsUJN=+jbt91
zk$Eb`9GB)Fn=>B!*M7yu(Gb{Hit#i5zX)t`ZCvU9fWXSKuiN~!U(xK0=voYgJt5*#
z{2Frt#Xr8AX1{tWU$u$j;De~q>{o0Q9Up$@x(m3KsH@62#)@OeOqi$HuLO|-tl5)H
zMglewT49H<O#~;SvvJO#bSYRxA~P`Q`)kA=`=g`%(<##61~R5#UiF=ixhhqHxb5D&
zf*IY03VTBQb|G{i%q0qb{k7y(8&J|?+n;HqrVi;F!?-b7tecZ_(I?QW8o_;%kmcv(
z=C_zjWT@@M>oB8~&-WqXCnR(^9vpp!&)?3)VmztvKlxX+vuQ#`KBk_xztQ+tiq@_M
zUZC*W(2_L52R}V>g$)50HayQyLUY-JtMKW4i%K5M2=R+4AfptG5!e^7wlp66Wl7cP
zva0YE#KQ1Jh*3%(2=aNv<*cBbtTsYF|3CQG-hcSl1OhhUU;Y*NmwyeyGfw6*V285a
ztTFgf`RS@IkkV8K46le*5q3s2*GcCTbJO`L>1`vJ@?4nsu*gthwrdr1cU1Fid&V)v
z>3xdWdoMi9;e10K;XS|j$&jM^?el%ZqM%(!9Leg9BRGzt`XVfo^pF0kbTXg$U;OJT
zjejL)G0`%Y0LJZ!xR25DVrrO|2>os<?xwf=01ia*(LqS+$*Vm%-WI0uuk~lek8aSt
zyQDG7@7$`LBb4P;BP}*Ck3j{<zvq|h0zGXz`;;G`adHoWwxFAK0H4Vw&i*I=8h-<=
zL;^iq$LQoTDAD*=YUagU6gUqB$VIKL7ZA>2C0+mWuTCToYW^9N@h|_n+C#U#j@hB{
zuO!fl;fo5JfB09M7og-9mXj|^{^eh>W^L6ME_wQ$Gj#FYMu^*pOJHB=4`X~MaIg)*
zA&L@5s#gQ~f^Wd9<M}h$croS^*Yjc{QvBPNx~iB&jaT=J5$}yfc`Z`;v(GhqK^m}f
z>M)Wj)?WM^2h5Xx5>Rje04h=7_zfCJ0MH=<gSOF`xPpY+K!6R9)ev1<Tyjh;e#2S9
zP6Q^{01f4^34pAN0N^nR<b=ZlaxntA0D2oBJGKmk2Px$OhUChQ4a>%|Y0hd~16D<v
zDrx{zT&lz{dP9<1kqdU<j#gw)7#}k@QASYYi@i8Ill>0o*(xf(Z%<Kaji&H*hm3U9
z0>B$pNCJOu(Yq+}F<GpX2@%Bq7k<6^9klNC5B%y0U7*3QSh^r8ARYm{K95Pj{dHgC
z>k0uUhFD2atVl_vSbQaD=ot-uU33NX;>tz>(ss{c&(cT%K7hJt`KP#oo!@a?;|}7>
z#D;M%-3%-mPAg4}Un__QC%@&e4Ve?EOc*L<#b$}#fq86ZVLc1L$yL(vRZ>$mcLSk%
zo0u9J{EE%0j6-OYV2qwr4{`nn{2FdqYa$=dC6MFt5BzFGgI@uK-)x@UyYmjLQu}NZ
zlUY*t7k;G_0?4Hx+sfly2K)wCi3Y!7-`*p?i~bjW1^k_ws1c1n#G>0}>zFHnpEoe~
zasgG@&z|aHS#1Cr+GVoHMo@A?pL`XFOlx$)e!~Olae$8}oJf!j;JRlW3J-))YGF2j
z<_*lEZqsUf)24RAUJ0*u9pkSjwMg5v=YeU^mgeD&X5DiXa7*)#K#E!>C?=l5V8sHy
zsE1?04dG(n@~h_X<4Dy8$0U_Ak~u&o(>FV4$TUUp%PEW-I#A^NAP#3~gARn?1}QE4
zo^-2ZgVo$Xfa+iSRcN~Hul<T`S5;_Nvuf7}YS-d!Ps1zmZMGRS;0QVG#tI$RxZ4*%
ztygn8{up&wO?RjT(LE~cuq)+FCbX>r7+e?_R2ooI^Bq=447aB{RTw%or91C8oF*vT
zRV8<+G(g3_bgGsjw5DN!rJyjec0cR`zmtaUrQ|MtLc1G7w`$NuV=G9sLi<-wh<Sf^
z&KI6XV(qi@UAfry*=;Dr5NheE<3L54Qenm1?XPnYvj7Hh2*aoi`ZXD<P8+;)>rpQa
z+@#sBx#)J9{dytn0RPv1Z7)UtqV`b5IG>BPzxISQxS?-Lg5z)ycXI0`L-^bg!#RAH
z1Cd?~0wE9($A$3n+&0xOed-OGf+jGxZMu+LG-EPG!v>pfh(N0_{A7S-VLw2=a(s0|
z?`pKWdw#gROuuRfw<NcsgXuJJ1Ix6l#@#LffD}ykJyvM1i^V$9_}9F@{A(wTf5lUw
zGsD@8?FhwoBv1S8lT+<j_aPDPAz^I$YQ)exy^nrmq1o*LUUzgk6+QeID<F;?BQV5!
zqVj0`>jE+!hiJ!P>$mCR$qWZy&?&gTyRLu4{_?Ns^Pf^Y|KVTB43LW9^E_i27e1&e
zd>lXO#_$X+DIm`Q=x04I=H{xZOoPzwsG;1>SwnX<#rCdz34Z<IV*pZ*4A;UT%;zyF
zL|7Xco->ar1i;3~4DGptj-E(=0{yWkDw;TXOqhI`I2pZ7H)aT%z+*kd$7*>ve0bXX
zhC#E~t16{%#+ftXHl4vgp$_=2ISm+vDky=2oEC5AXn&j}jwO@fOS#Zv3gnj!Wa|Vw
z@iY-ShQ}UEqmFUN<1Z7X*0Z0j5eGJqyj)}eWit80a9!|R!a{cf6Uszv;EH1Vk$(Fu
zc7BzNI&mK#!qM)R8HS3H<bU|rsbJLOub3R_gr3bT$aeVH6Pbd;7LsQVrx#N27!5;Y
zeJ*mzedcH4-1&#>1UHm!rQjdMfs};SOONPP8ZL~KjgU}C?D>UhcgPNzL1TXK=TZM}
z%ED>%BL8`;J{s0Uo!swVlz6xjbq_-Q+6j5MG#pHaU6?1FUYJUp(4fG`xP@PMIz1wE
zOL0+uYr=gN^9{Aa`)tN07y8y_O8n8v!(%p|AXQN}l}%FXh5pvf6SBc3u?<;+23-Vi
zV%PYoF<>LuuqS3P2>aUx`<pa;DtY~gxL!#89CC9bfbj}hD3*??g)t=@U@Xch*0%J0
ztz@JHa}VxD+9U-tHIX)5JT@pd`RptiMR>k+mUA}|Vg7_s&INQ1p5gq3FT$bg^eSIj
zY`=Cr`>H&InWrE;8X13)*Tse~eRzyW3ub<M2Aqe?!(tFETU)c(wel_VnXSo(-xTxE
zh1*|`bJ0Zv`gt67Cl{GRpkMOD<TVb@0MPj#5KSb^Jb}I#Fu`z@0o}a5JCDr4(gWwP
zzwnq}v^$ivUM7y^eZKw!Hw8(?{Frb4jomsRd}laO`TT4Pb3_{6!P1);7%UiIkEj@#
zZx{iIE!B`+sX@#ER_t=~uIk(_ICM|**6zO2kF$B-=9JLshTA!$t#nWLm?Fc?M40s(
zWRoE*97`WhVAz>QnkjyAO8VJ8kG94jqjQm{Jairok%y;2wg}BEOd-DiLG!O8GJ`jO
zHV8cP1At7&A!(v*A(r0A8Zmqx`@;~K^K`3y9+|9+{_Tm1x7pq$?WAvSA5&5F1bV`w
z{U*bMCl4`ABt$w6(YF1)kAg_aMQ#BO@~<AeocmTthSMn99|VS?TL?~rAH8>(%#=R`
zVCf4z;hhqQ_43^f9HP(=GX_A{pU_T#ymvg0&hz|qO#L(WX4maGO@p0d$ioy8>Bc-!
zxHohr4^ekLG2eJkcJP?^TxbXYn;x_yAmu#HXWU12i1TuJBp<>kWRM2mB$exB1@Wjd
zZy3IIOs9}9FW-44XHdBMd$+^MAnS5`Oy0Hir04Z_3dbq+bemVj4f3L51#hRU_6Fs!
zx(h-*j5v%_WXlT8KW&(n-gxV=GWluqI@z}4k&xx+mmAf$Kb1R9jefPPy|*&(!g6fO
zx_*O6qx41eNSWo5*1h`A1_kwo?SdP|4<ypghiqw`{n_RJ%-)(T`zii0qH^?M+c;_C
z<(ubkF7L>;&@0wgHwT87t2dl<ISrNRMVBvR(K$`$-Lw4WSigd?5;l%^t>~BZct(xQ
zxN*Fa_Ta`!HsdF4e&4&({M}7jb%9D^0UwseV()PZYqK`nF6|7wx;1wkeDwRrx6gBP
zCm{gvDH^g~zU$1Pow3mMG{Ci}kjt1teL?BaDx$0E7LJdpK=OWkk>YkOnIsxqSyaey
z>!`>X{d95XRXejuzoyLO_`Cy$T}+)u%A^y6LCFA)>s3l_;SODfUUztTYkE*}B>Rnw
z&=tA$qjfQ6wl_uXS|8FRle9z1dmL&Ui@`m-cFSCz`qEQAyZW+AY2F5Mo7Jh5E7kMu
zJi)YpeS&g1&>1T(_#4c6LN8OjecBiougN4PwoEdze)!Rjq^$IDgVV1Qq0aQgBQ`%J
zM)t?4Yr)1|nmoa(MTH;l-2cKTTQ14<ne|e1-7406|91MTz=I;OQ@-W_G*=*6+>F;4
z)TsHK&z4VESm_GT%-lN0bjYGdt7o-elCR#|%BxT6mzB>)Q$Oqb?-tMSJ`}8XJ{{~*
zqRIO(BGHfE);(oyCipN>=DGjY`b(zXO3qVAd@r?w$FIC)k=2jYV}IeELo6sEy8J8{
zDW=0&_~atxcUyPqex0+7aCN3}QpS__pPyOu#@I1>1`LBbEVLNEIX^X;{s7N+6o4Wn
z(M8Lg+3uZ}U2bg+y<j*Irn0}}N-Q+1vMzuB^WYA-jWy6s-WK@Vt@@)`pnJ_!CqKP#
zz6iP`Ag1QfqhWV6@U8%b8h5G*%ogO?iaZl=xsv&M(7jGBzoVTBpiI#B9^0N`Y3YlD
z4G9+|e;s*KuZ$gG%4~)feMSZ~{y|{>_>S8rS(|j<dH3i3wD(x>ud0Kd&wlgaY!Cex
z<7H0oKWscF)*Sr6@Av@?fqfXTQSy$4z*dbt4BVn2uz}lcY#~A4mrmKjLQXN-1~XbE
zM+Y-L+J1%FUx|esOCMbZJq)p8%sYxb8Vvbj5~1uwQQ9j?3f>BTezex5bXb8QGBV<h
z==~`_gs=}89G;(mH~pG_=o>}|2rlf7IzN)9Bry#VpJV$gp!<sU#LcO&%Mk!&?+C+)
z%>u~LmJOQW87A_a1K*(){L0TB!!YLMJWOZ|g|G5%q<D}mgR{A+n3GX_oP6HphJAH>
zlu?2`qyU{I0=oFpDA8Wh{&#(?hV09VM9V^Zp08TvGMz?Aw{ir2f3NLQ{Am;v0&(Dm
zKG0MXHcmdFLA3OU?kiDAq@-*1g3U78Iw?ab@yiZp6fZy4+c1KEXI@~mV%L#<RGIcl
z?FFalZ*B8V<BU78?HJ3VPNrF=M}i|OoX)>>ZD3WRnIkK#BY0J*5%Obu$(QidIz6Y;
zCYc`#o$#?I5Bl^2zGaUe&2i+N?Q}CU$ypj%ls4ip*vi_?nStcWU5PdD>NI(_<b6hH
zp{OxnGWDs4+LBCP?cf90wcKTIsEE}9eF*Elh%-S^${+F!?@CMN{o-~}7w2pQd#L2U
zn{H+J$(ZPpKxG*k?_!Xg>~r?nE8u%NucaGcZ2fYi0N3cE?;fD|K#f1VhQSdtb|y(I
zj9U0kZ{cc%$Ti3O%GdmW4gIGFBL`{%Oo!pOOv?gHOPx$hEZ@4KWGu9vdzqHn3*EW#
zfrh}oOb=Fg;b8vhKM+`7yQ}K~v?4A7%GKuVwLg>EPZv$emW_ORKWd?dhQ4GP0&D-_
zT*QeM9GDmA)4|FQgmgKXRXwrhbr3>!_ukB?3V*6XD}}dE(+Ds2%PhTOeW?C?fLL~W
z@2u#pK+EY>vqU_%D|fPs<qYh4ZTX73@!0;<g6b|un#cx2cAUkU-Mx_K`dc#3@3s9b
zV|=f=@9NulIHRdlP&WfTgK7!9xz}mbz#({-eZqNq&*^*p=Xj4`&DSQHo!1}ttLNF;
z9=38+n>B+^Z~NZSLI4AYSd^zheu$&_ea>-iIO|f_tu-6CiC5Fhw|ApEel>k@l1)=j
z6L%Z@mGCppyrWH=U(Y09k)><=y?Dl2yfev;qhu)L(ppJ$aD(F00qL%dnR3yZ_$9tG
zCl9jvW^S8DmO6+ONY?mydZl4RLFg0nzHyUqxQMNzqA@>3kpZ9iq11}KK0lhG=>0@0
z=Pv@AsF=2z@l~%8%s=sg=}%?OAMW0sjo*Xe<zzPKj1z1Aw}JRaH<b{7T(mSThEqL+
z)H#B0S6<E@enRV6Q~c_zYi}`f>*L-l(`kC{FCfwlo3|oOwMaAPJWgtLJ4OV7FzX9V
z$)`#cGAF~m9a@-P!lVeA!ET-D+2ar;4Jcq9VESzb!~&<Fn_OaPiE=<$_cBKSN`oC@
z!<96x0zCx)>I}~V(H+2d3v2FUP89HJE)Z~v6zTZ<@<{ipOnutZZ+lVUpc53kv=E1l
zJ3h{CDl6?5yYo|R&fLS~jh~-o0Nd_T($jgIelP|Az>TQ+VD69b@7iM?ukB|9z!t1P
zsFED*@&r5<2B%}koYsh}nvNgX{#kn~IO<YN{^}~VmMsa0&~jV+1eK8!Y+!$+=Fq}w
zld#X0q~znx{WRg!-42c*k4LWEe8}?SeDMa)D0`w2)&PFMCjMwgl68i=8TbCOTAr(s
z9uJeVf9>Vm^S(KKDxlqCemZ)rciLzFWg+LI9D`^3%N9X!+i49L01E^I=D8NgM<4(W
zNK?315x4f)R&2gGD+j>==0q^SGfL5a9zefMq;s)BOK=kai2aj%9Dw43zGkyUPXly7
z0IvYuY3?!rps8^UNbmLsC`-%RGEm%&L;yeV+xg6;5&#g<3jExexcVU!j0O-vZ|A@q
z_R5EobEoOh`}|M?8#FzMhT>r<;LbnD#Y;-0Dw^&J7+eD2i(x>rRJVzO{T&6k-s7%2
zl=(0S;I+I2O?Ne{U%3?hi5c>qnRvLHKXjO%BPtK@46Oqbd#WG+3N0-G(;WxG{E0l{
zz|Xsc*+YIhDnMc~GQLfj?se2(-E}{|ShNB9`m(csW0`&9drJb}wYN0fRf`M-u!p*P
zMj;J}clV*Jd->6Qpp9K3mqR^1yM?ns<s|4y^TGS(KYaj>BSk(zRe}C`a5wQ@s=RkC
zks+7BVc7uZZU<%&2<>I(+T|p408H=#qzh4^mk7lwMqFwcMoI(rfo27Y-m*XtyMWS&
z3jVv2X?Uo%n<~oY?amd|l`46_HV7jLP%o@U?&aUUqsk7Er|GU@uhsRg)kA5zYo^>g
zq$+c1<7A(DzJP*+*A<CMWj^kAt^j}vLERKWytT)#R0sshwzDv+sWNDu;MMN>h<`hj
zlL%<RZ?s6z%jmS%>F&v*Gd0m<DKt^-0(}SHxQfIi%yzG<XNq=-0Rel&yW9DK32HES
zG}KVzLcXlThRUjZxJ16<$p)8Ps9W<bDgm$!cpfNE`$}-L_i(4lJ4@0bh;58P@}Yv=
z4<x%8=QWiSfDgsG=)juy`g@LWnoo{|BfaJDG~gBf7kE7=P-ZGslaN!9kOKp><nb1Y
zb`Sydej9$W3m+B=+6MwN-?{?;XV?oO_W0Ro#_N8hWSG_}SJ)eF6?{AJ6{Po*eVw~`
zBUw)~E~20qQov&fkoc~czL)>*u=o8@J~Lj&Tci)44}g5>c@ji;n$R!3pxtF9%*ar1
zQ}3-cvEySw=q>Zc9sw0LGW4}ihZ;HZo_7?an|Ny<dWIrnNh4mdk@i@K-xLsx`_Pb}
zZb|6lEp0ks{0qDSbjM+r;Rc*G082sx4S40%(}j&gjcC9tym3JRY^kMe`5Fe!)K{?~
zu7yYNQr_eD^698oi~uc?t@<;x<r+~6MUsxhJ+P=?;H?E=Rrm|Mb{>6bE$!cL)$ZXo
ze4ncaXcYQ(r}=fi0ziwHU7|YQUjH2oDDmmo=+iZFA#MZ$K2Jr^y;cGmQtheIqlfvQ
zM293en~RR3cEGep7bsY&w7Z-C5!`zQLIiXJ{Jdd(U?ONuN|)L+Xd<PHGx~8Tr-CJJ
zEHz1T4sASXccn^$WWg?_#B>Ppr~S}Ipi#4~GO#-=|1b*9-U|LC0TeQnOhlf5#Z9j9
z1A**e!+ZReaK(3bpgv-S*10BlIavE{{w?ZdLUB~lH33?9M%F7zUW(3{eS~-KgPiXO
zDdD5!feC&x@`j#(3aa2%W`|lW0AzDb`cL^KeG_BHcqx>r&OsFI-$(lnRLc`6r}hu<
zO1N^3#k5<@)VeImr16vWM-%O-P|!AD8F^W2jaDI2ZZu=+#1ns0-^?Y^?DnSuM|ZP3
zKjNI9nz_%6-Yy%x^JlcQ+sp%1plA+&nG-ek_?c{o-lm3oDS-R#0EbTkSlqyFfSR_u
zj<+>&zEJQo4R_6KxXT`fG*`}@j%5CeyN2E(fzNo3T=EQ4Q|~#U>8=Ex>sNYBJ!j0{
zVy`E-_kv`JgYoTP5#sd(38)s0=hT<g0klI3==O(qX|!wR^)q-tawE}j5da)lwEif)
zU0~=<h9(OEgl52FTrJjk3#~u=6ID$!N9MBM%^sCmglwA^HC_eEsunBU_>+Ibkfi|Z
zf1{*o=v)58gBL~s>J1$^ARF|u7JS0Y6Q)I#s%jwG??+y8fsRe7BwZrD{FCoVdo_yy
zEI(LC51W@*Pm?K=UZt>qX;<d)s2^OiTI?pK^8eDVL?8W#GE~7{xVqFNjEOW2&3q>o
zL%ak4LSq1xhmj1104V%J-ABMwIw05E`b0twi13slqqI>j0J<1}>`Y|E40M%e8XiL<
zv*np$057@1;8dwIE<{Kzk>cJ9$E%}dX}oy5E72NCB@X+9!EK1?rf<#GRAJ*EKH6JK
zOhORk89L&7k|c5SlH#d9`Ku1YG0V-iAC)NXP;V0eUAKz&I8Ap2v|9@lJ5JyAwYuw5
zGtqWqE6s=-N@NBQHv1IdqZZ}j3UBla_AUXSA_Q+-D0-j)JRW6FReH=qBu_^|TnraW
z02}tkbT|N-`(|ao!m+ObVr>FISTySf6tDn(SSgmzL{%t8F~b4i?ghq&TG$T?pw~CX
zL>Hl%Qhfq|nUV=J5yA-+Z}B5%PGWIjMxe=uM}RHLs6>=PXHzGJ{Y$$>AKHFC1r;j0
z@t1bhTB85K55-TzGXy$b*l3Q@BbC}&UUuIlN1!@^LMs|5mjUE!m=T`H$U4LHGk@5+
z0P1hj%q7kCu*KEz#$^D|BK<Nbvwbzlz;ZnN^rLPN+%DrsKJCcN`!EU50Un!0P&bi*
zaI0C~?#DFjc%|l3AJN+1$=d}06d7e_A?|D%0AI_%#-lu`(wwC5bYH3JndZY?r7Mn0
z2P<<Q8pkE*HL9ed6>)Y<vfZrG6X0Aey7@UUzAt?S;`(zLALa<W>F~>SS@Y&vaf}0D
zgeYhRIN^Q`+k#kuA<GPzcJINC5=@T6inbSx>t?(|soo2peWcH9E98h13b?0KJ~(=N
z60Lu(+&o?eZ|B=S9H?Lsp!Zyq@Un&IIT)>VEPibK&QK6=2z&=M`9IjZuc)TFztQ&z
zp#%sdp|=o1FQNBN2pv?qG?gyWM4B`qA@m|$5kUz>0qMP)P!s{BBS?{^qM#xm3L@-0
z&;Nb*JN6i7Uz~G&?sJnd)>@gF>o>n2;DT;Kh#5GjebQh_f!`UpXCC5uJ!F9v)PGeu
z*wM3cWt>%~xz(F$BtF*reZiIWE0dNW2Uq!;0j!aaj<rux|IV|oV%;3&C=-wQhu(C*
zX@H#oy?&h3QCTO`hpDelGj`=@SKPQc?po0LWGD`h4cd4{ri;J{@j06$ex@nB5dzzo
zaaM(fUX*?JdHC=%a_hYo|LEM#^VhMss=tC?G%rex1Avq5=RNrZKoHJ`*6h9vMT!r2
zHv6R(1l(lBow1d(ztC&jyaoxip;5uHX1b8-l2|AE$jm|xnVWq_W%Munti!fxLur2|
zP=6hZ@8Iws;HO9$INu=JuQt0@D#_Lt%Y(L+t;C-rOZ`I@5~$>Gz6-jvy%UA2!?M9i
zlD*I8SOcc}zkINn{^a8JxP0c3{Uv8=D_AQv)!qOy;nPyMv&m$DgST_bA%JOEm9yUQ
z=xbXLz^tyF+HQ&VNClVrb<m>LHb#YRL-Y0J&G)fqiBzrBMQs<JYl3bkEdr{(_VM4`
zH?lcM>b(NSQEt_BVO$jRF8PJeS7*1KhX!?DpEF$0J*SBPELZkYjMvDSKE)t68p`5r
zO9v_j@VvNHD+-|ckMX)dx!AOkO#d3MCJ7$m{}``dJe&jmHC}s{pVMTooG3fWtI`Gh
z$9N6eKj=|oc^iNc*Gs%Yd8#>s_Oy1E5)~aBnMgPg>E+ChE^=!Wya%|{cjH&jmxjSD
zNGYDtVbRwIM?(=}Cnp)VucuwqEDDQ1JHSD>_WFhN_@Lk8(t-nS`t-dBzfS6Xq>O`G
zlE8pL2#mtK0?fIbcQ|l>LglFs@9+P_$#4L?Awqa5J%^iaJ3<~_vlBs=-YQnPfqV=G
zWdQVz-pu}hv%iO~oA1w;3idu|ekhPu8<f%GO$1PhTU;-t-1*PxaNoSy!lV*>tiaQc
zF5r%qXvY<C5KBkN*<T<%%1>cL2rOap+af6Ft^9O5<DUAF{qzb*g|ZL=tUU*FP1R?7
zf+g+--Q2Y|!2#5Q{3lR7tKlz7_Gy=s>|u#~=YsX;C$?=gRuO8Pt3cN~-S&F+&W$sd
z&6g<4<Ou$EUCHGhK8gKO750Ex`;p7_-&f^=llqd&uavs6thEO;QezgVYyZ%gz!DlW
z|MVd>)Wyw+btl~~qF%p^8owq4XgKj`JXN|TO6TC1JQO4T_Oy8G^v$L6`MLLf^|S)N
zo>uhC)?B(X2Q@yQzj<f%`<=sqzsty>m0x!#o9io7XKTr%zov4VH)B81DW0P$x1R6F
z?6iD(9=nTdW*cq(e9h+^->?gf`|-AcH#qUzb3a(i*^g^+N0;h>QS}FLTL{h8qlUOY
z&`OZP`R}J^2Uh2Q=)fUVbS!9}z5ho9mgPz+?A8!+BwNrp7ky)2c=Z2*z#dyaD!S|Z
ztuxB|P<*<=?Ee3Oz)H^7I&}p9Hv%hD*;=`2{Mh$xbHL8ge<84%c^)r&qkirG4+86d
z{#$NiD2-DwaQD9vSc`>%mH$Ctl|OW)g?iF{nXS3p68QB*dH1cfMokJ+bbAU%`|X4O
zAh4u^FC33}I_Nk5L10&l)k3!3Jbh`;YN~X!`>x|31hyx<_qHg*XD%kKsC#;b<E5VP
zo9_<yP3v!-^M5@(J^3#LR?KiF2L>+?8;AssUVb0JN`5L31+hL9NMLu0Kv59b!gZV=
z+x8@$K5*oUFhUtTg@2n_btP4>__t-6)To+JCIx{lzpy{Pwyp?COeyz4#DdEr^<qVZ
z(+qjKg!3+F9D62czM1sU|A0UV=07kL5-DK(dtO+1#ku)yrT(?}NYSDjHC>_>`+V{r
zF>KB1_wVj@mBC^h-YnXeC@w#+d=$-~Ax=!3cX%94{pyDJW6UC_SZqdfqPTv#S(L<+
z2fk^DN-D?h&lg!Z4kfBoQ)_%GDr>qWpVbw8sfw=XcCtyAeIyc}*0O3Vh3WWMBh^S|
z81qf1d!g!oA>xjYXtRQZ6s+a7nWl7`PkV}Mn-YDOQ2XLQYhCVYnx;&bP;i1{m+q}-
zuWsqN&pD62j%v#G{iFrYLXK(@8v6g9{E;P<y<%-N1+h{PSbC{mxj`n)Q@J6yxt9De
zyYoK?tY5GEOGNak{0J&tOW~Es!~Y<#y$WN}J*Nue^8X^ROEHRX)OY@W1or<O0vkEc
zbkVkq<E;q_GC?6+6Dn97<fxc$jnG;rcqYl85;IePv_b}WwzuL0cp)jtFxwsOLt00k
zHl>Jj;h7o%f*h(_cX@e;khfeLe1R0gwRaLZsJDTvARD6d<<kQbCIx~`7*x32m<1ky
zSTk^m*bI0odfZK9ReS_6JOy@jNJ90jLp455f{XWFDwhG00)uk02))8_uJ}PSzJZ)G
zJx?Jf`rM1F`cSnPVKWl&ZcK_nL9K17#yN=y%^o6fjddnV%2%5|9NJ866bG>;twT){
zSd!C(Dfny-J$4!<q6#rInROd47$<`VsOeaOA{hCOJnpaNQwY}}CNvHx+%N9U=ChEg
zF(8;Gxt;)Tg|S!<<%tv*4l*h`(z?%jFh~3r)w{OAY;D;LQ7We64Dm6J!x88sI+Ngb
z3e0@*AYqd&qHc^8y|wKug>W5~OR-AzgHQ<9P9x>1e+k#LkIVn5-P6uKB<hvH?^z{@
zhvw(1dlEGD${2;VF&rA>24<(*(A#TrRdGHQ6v6d^x_t;&fzOt9=jW`aALVLnhEYa-
z8YU$w3T$%*k|xW*b4F8Y1>vzRPoc%ejJzuStTPisc3smUKZr8JY2g<E3n#nVXu$_-
zBQ@|7{D}BoK}y`Pn=3(b9;2}T^izhrmhY_;^+q5x7xqyL7dd3vye|AhPL#!K9U2i&
ztW@KBX}fdF*zZJ$%}7tu{SVpcEf26=E&r>htoo3V!a7f=Cx|_rK1uA%?Ew+}$#mP{
zf)Ispy*wwx(Y%ydom5fN)>miT6}htOd%uUw9w`4q?(P;xOHRQg4R7-U>~@joL$%YV
zy4j9S_hdGkEVg9=0@9rWzr01B{`?*}<vi~7JHGF$$cBI~CQWN2yI%x@4xk9Gd~b+F
zUfan^lml>X=L~ASsVhMUZODeOXhb$qfF{Gk<zK?}rjIOdQjX<ClHiMUlUFtm<jk{O
zu#9}nz9~SoMHI7IQ?^ntB4>Pq17yn>flEXykQa4L+_~2T60L5fQ2Wep@nfH)KB(qf
z_FK!Qe{E-&C50bSw<HXhLY@^JpgC1^9qtmdznA<(`*iMgO&A=~XoZMRU=*XIUwoCT
z5L$67tyf7l@$oKK4B))DHI-X*rgViuxLW3Q&py#nuCb}35UyC^(``{RC#Kx!5&L;@
zw=mOXx1HQIr@6um594GvYOTBkq*3<J?aaoDp5@d`UR<dm5B5Cr(6@!Z?X@;|q*%1-
z*qt|vp@v<?aQ_gl%M!QRP3BYSu4#qUi&VFpoC$3BzsyEjkSK&JK4F>#%NSTMBhf0C
zEItH+#2E}EGf@cFq5Dkb^K@cmmh{qEn!-D$gKjs8Bf1N>`0IYsakUDhiU;W<hekxX
zz5!{qf(4NTS1PUq$0hOX;#EFjZ<T~A>9OK)4wK(M>=p&+J#MQrI8@P0b)?Za;E2U-
zYAW(l%&ywOWe>M?q@l?UsRQ%weAomU_nul)Yug#bn%n@Y{tM$nzwFlq5nr?`+!A!N
z1$*Yd*5R|5_W$xn4|)}r!<X@Na7D})6zT<ACd?#MQF-V5!?ErM#3}}tz+`bQU?>&_
zoX9LI`N}gy$$*z8XRs8oK6xG;mPZ*kFyCnPlG7I3z#C_?T@`K<AFTTO4XTtMQs$UN
z_4TXxac$Y$`^M)+ZX#|`@=^SRR1R<L3>=*@)e5-QR(l6ipXfCXWIBn65?Q+uapN9}
zz2x)<G8^~Xjo|WQuXflzb1l8L%=#-Ul1@SWR=T*{^J9+Us%$(pddrHtYH;N>%h3l!
zbEb_J{fsu7{S5ab-4QCGbxfEkmS39^!^F&RlLc+x&RE?S%Y-B3$wEJ{V(_{8<M*_E
zEEcx+O^O{&J6%miT$$3SnO>}!9P%(8l|s)1V6;RSGYZZ@ga?}F?w*5m)(Bc7Sj}33
zUIana6{MtxRRCaR0ayiFl!_~Xjln>(m7s-Q*CD-w=T1_vS9MDiN58&AsJ;-FKC%|i
z6@+I;1Nm9-{2N4e2Owt(P@o=<Sim3;@hC2RA*BHk;SChWhCn?KF;7H%B=WNWk!M5!
z!3~l80jWtUIX#d{Ay#v3kee1paZpu-LDIc$LgOe-G+rc_%){j_6iOxLjS^4W;My3}
znKWeCAZWJ|)FTM&NAbJ^M80VhS_Y5i*$|BqRH+3?+!H(*!Aee3@g3p09PlD(c*Lx`
z#G$@ILYda#Mq<S}k3K=(ds8KRQ#E`*3II}RJtuHmdmK6l$@LD1jHA%OWKI2YrJ7d~
zS3M+J%edBvT!&;)DuU`{xi$mEZ^bI~>I*FZIbnER6@9gf1a%9K>Rqg+D^`}R0>M|o
z9^)Y)S7EFpyi4(00ayvH0gMcp$H!APf<X3U)QJFDs0{EdyXl8h$rTdRo42-iJ!M1V
z5zB5D`l*y^vD)v<bz4D7mRme%vguVSY1ctB9<L9rScQCj<T4TABcif^9TNB;g8sm=
zfDseMYDQFU)?#H{2JF)Cs9vhe;Se2HkRksTkBh!+A;E?D;<bD62sEAx{6yWLa-`Gq
z3V#J6pGqmz%WaxT2Y?mobw}o(Q>n03jvW$Id-aiW9zuuu7q5CR?ShnC22^<TWrr%?
zj1as})<yI{J~g6?BZE>dUdYJ-jnkKUH5>Bb1A_b;D9JMEU_og;EY|4>u@xkp|B)v@
z-v7(Tx2;$Se-E*U!PwS8rO5#ueqp!+UNzoBY??~O9;M`plCIt0<<U1CD2qJ8h#gX?
zREQEIuwtif64YYh-b^~Z`iSsPF$*B2ln;iqBC+k*!1*DGq)$#VK38MCiG^5+ARuQx
zRVd3OdJ7+G8?UsSsjf7@qD1BPBw01Z3mNVmJ5OUL_~Zta80EuaXgn(76EGkZ1{jDb
zo)H)+UUnVi2?9!Moo|P)VP(0fE?9dfdmCv22!2lF01fY=L&`1SuD~}5ak(B9!M8F(
zP|*iPt%0QZJcWb@^Wu}VEIzRulJ7C3sp`3>F=T7?0!;j|!WsG|F<9Y>!Egco9I`&|
z1Nc}KsEkLzLhXspLg@{Wn({OQ2{ceTpIW!J^a82$LLn&cYW&@L1MYcht!)EcJ?xF(
z?Kp=U<Vk8d2aJ%w4d-1@?W2U+SmQb>%KI9iN!fsoEk+GD1YaY-{Efv6*>qFjcXHwr
zODydF;#&rWl5z}0S_{mw<6DgIJp~DT`cGvbQ&k_RxnQ6Kp7@-a8q;htV<F%Ii2&a6
zRP)E0%$}1QIuo>)eIyRCl^X`CK9Vj8*#6oCsRg|YhlDHN2BoTo&|5<)<2ZUBDl_3)
zlPU~v!V8X4D$|UCyQH1>F$8)oVCldhE6zaEAFq2z3g4#UFwxgt9z?Az>Q|0ykMp+j
z08O_+PpBN*?<Sx`=Q=j1pTD41allB7BxqGhU8r~>h!Zy%*_j#@=B%wYw|MXJ`&rMz
zQ1KbjECn#zZ@{azYwA;Hvi#+`ZLR47?gaz0jz6A!h-LqcU5Yi<!Qr|4(W68DCN7|j
zE7+!@89|fy&J%*nDOnIbnAAlOHqqBP9BjQ?g|~}eHyc0?gT&DK#`q!RmcNO`Q?s@6
zt0pEgAKvhwD^{v<2GkM;kfDQWv++t0Drog!tC{_mdKse+1j>&1hqMG$2TV!LkP2Xc
zBDczN)R`oJ1pG0)*=3?yKyHAf&Ma9q8^gXfh;AhhrTHV!vZeEQK_7i~VSmIp6}JPH
z9pG!WKtOG;e@jb{<r_eOZA6DaCTNiSHda%5psEYRyBx2nlqU;`M{i@jbEr%%JiH)4
zQCw+FGW6Mf^ku(cg~eriCG~kN<4w5axPMm(9)9B}t}|7lf~Nq@cCl(HB$Wz~M0dQL
z<p67pK2;u&dz^x}V$>)~`xB4=ANfbT!P~SU@lH8NRuDY}akZ3{O*l8u$R@L@`9mh;
zxc%$Qe5hpo_c+*^<owATV35fg!Eqcn{ABQ_6V{|qdOaHt17nl`R9XNkk-h5M<3P0K
zYSw42Q}S*v)0&_FUU==Ha4A_1Js>2pqdd~^euavEZ&JAxZ2}2K9e}v9spRGGbyosS
zQ!pp@s6X*I2<h%umXSY{VLA;llBalCG=b&wg7Wep+zWepPk~pOg&z&#twosD0v{v=
zNaq=-wdx`Es1_JxO)9XAtw7mAJ&o}J$hbZNTuVWTnKJYlE3j(g@!$k%?$Q_V7z0Eh
zi6i4*#8nHg+|p!b0pfJUnucQ8LI;(5Va|?h27Tv1H8eqE3&d}L;T|Uoeb(n5`L@W;
z!H>gtR8spDQOmaC1Y`93Gvb-{^x4JZb;aXh4j`FRUnRXz6ShOlCvzx8ah)YMKB1Pb
z1)2#AJ_M8Du13670B)BC-6{;UbHHp9q!>2<hsEn^VR-!sQWl%cgaq@!P(*fXa&fD!
zK@*mcz!dXceyo*gvh@Pti*(k|jb3{0s(?Y?e-+n4B^fZV;SE4wJf6O=oC|q3tKU%7
zmFMCfsA=k!2`T>XC@ZU{oh5lds4ZAfYKgj?J>x^0;Hv=>6j^#Zo})EKIM1LsX-F??
zNaPy9l{H*o^P%oGrt`{_LdKwi>p3RuFZq2lUNSD%`zE`*3n2v&k4~1BPH|(c4;M<o
z*vd-3I>E~F*6A+GnN;a%p!Wi94k|oO7R@eGO*fc+;pbEc=y@{8U_8*f%Hx!qpt<&=
zqZ`CJj#briCge~(F%9^@6ffgR#f!tL%i}d%`AjR;eIMWUd)}@KCWl!{!)(do5v{tV
z@$}*YVGM)D4Y#BHTCuXbX4}_IadpheyQ*sg3g^DUvv><3g09cNko|!;o7W{|r>?M?
z30TbpFkp3)z<{IvB@;ood~@NEYE+MkDIZz9Fi~0f$C6B=T%n$-9a=Vy>V<ogZvM|N
zfS^p%Vkczg3WEST1IxyKe&6#kKdZR)Rl<<8obxq5uGc4nxljVfHdTSt7kjt*$h=Oi
ziVhQ(=6stjnJO$RK0)lyphz4`Y}?Hbca9V)B2Bwy_=>|n`ihs#sH@6gWHS<Ad({?s
zWwP&;XugBwe*uPM4j&T?f|3&iXED7sDGaTIZhNwd<v{Su1Wj8iR=Fj?plQDAg8~A0
z^z&d7969=PyetmOw$2-wMJ+uWS@J&eQ93pKACSV<7^Iafo)JGh9mSpk;N84!G9FcT
ze>XB_@cBFHq+hN7*sbWg_)8&#JfKObKC~70;z+4Q^G{+!MG}Ep7F?@4t`8k)O*Yqj
z*3(_$>|UEZ1h+Wv7WE%w1?c~5$M9FlnM5c{j_cKD4K%E((cQk_-jcAu^0n@Dg3f)Q
zoZZyKyg}C600iA}_H{cg0c!zuzpxM3R(<uniEnwbky>&X%VAK^mE*4R9z;#FiOc@W
z<QQ!jmV28JKtJ=K<5>Jv@%5Jt4>`I2j$Sk8(id~^=B)zi^uDS(i~O;HZFq_m_Q&Y@
zgEElay24RZ$^Nnmb-G$n6_=ta8QG*R*gmTUu~54jll5<yPO&#lug4Fmm3He^oqT<g
zFySl;^U>ERP15ab)K%)!#Wm?#4j6+pO~&u6_=Pqhqc8LVxbn)HWkclCag*2{QIqKS
zp&sUF=}q(V79Je+#-Bl@@aWZtB$dNK4oaloIC|pzG_^;w_vR~>H+o8Y1CTX>U<yF8
zf<S-jtHA}i8^R<vOEh=gt(_Q>Po~ych_FJYTT~HTni6g_3~5<%j-7Vuw&rL58H|JH
zu^UclufaKN<8?x{^4>e^#yrmz;vJ30a0{rvYA{&7-KEXQu3q_EXL3pqJ-}YlrIhhV
zx9V81>wzvHK}q}U6u~o}m6?NyOM-{~hHdD?zz|N+DE%2qm1rx~XX?fK4sJoV2RN~Y
zWcm!g3kHW=sij)HingRN(9E^h_w3rO$_(H>mdS&y`BN;Ts7GehitIEk8Ll1Tu9LsV
zUK*V<-ZNY~`#reveL{^07o!UE(l@N&KHH;zFcqKiTtm_OjiC5=xnkUPJ8`Ea50B0^
z4|?5<iVZ_VT!50cuuz$Ch0t#U*lfj%YtU}(0l2?MnW08pmJkvZp(c;f<NtF!BRpUL
zjm($!klDTDJ}I`ObmQHTr_!$M*$F+|s**u6uH0#IZf7Eip0}g=az`v8I{fQW*X>_t
ze^GLp1`xN7rp%t+<f$mNEwAn#&7I^Js|Gs$xY)mcj(<H*-g*Qej3$@G{9eDS_l#-?
zR5K7Pg~r4S9tQG1JDDnb`2A$jSbXY;-Z)`ijipH=(q#8LF`B=IE<M7!qDntmbU6!q
zo-!J2(pNgY9>j*SToyAf4TRJ@MoB2JbO=a%F*apG3|u!6&I!#Om8|P!8AEpYY_Sh)
zrFt?dPZ9zx+QsQ-C`#+1`#(ynC$HY4l#djpb$c8c<<f*I2|bC-x-ZFgEAzf|`(ph4
z)BT(eFzGMp$$53){SPq0spFH}O1|Lae5~ZF<U&8+V?rVNf;Riyw|aNNoQ;%QL8hN|
z-$hQjGXT~`@>L@-jl<|cSWjeN9gV|ZZ`ei(=P3H#qIbz1j(0xk(v^9!z1)6}`D@lH
z>3T+lt2%{(;Qt`4+pnpA`fu-mZMWBlX+6>ApHqbT*F{t)NbAQG?z=F2#<}#q2LYoJ
zvrY%GPH~GzR(E$9+26h=KR}FVtlHuc70BFxUCB_he3xy=|6uFu3AZs4{ll@{Gv(wn
z?bf|#=5&`H1oU%%Dh@Ncb&mtAF|c&-O@Y`ZZ8=rJ5MSdnPFonkZ3B*^cc19vn0+=-
zAY`OI!?Q*jD-<}X$82z1Y3+Q05Eh1~3&e_xrsUV3rczmJf!zgPl>A(M_`Uz{e-PN>
zpzpn1M=E+7qv&mUi62ESdU{UiteeQRcc>crs4Ri<tnF8-4bKUN-_&DJX7^|3e!MI(
zE6lF=+Ch#VM&42Sm~hl}AXEHn_0Bos_u4-QY|f7+D&8;NO~A+Jb1o<opSXwzK%}98
zo(RvEA5$a2$#P=i2zIBX<d8Tmy1%NY^;7ythm1WDe$lP;r~J3Ue4jkxmczyKvHRRZ
z;Ox;WY~h!+{x<@<pm!szjBSo=3<Vg`78_jG7*>A+fAous74kHi8Xiw?a5<5)%9Z28
zQoL07%)>)G9g5)?dnXi6BbQI)r3~*_A6}<MPhLbg>FG=EC27XPCh?}W8!Z1KusNwV
zf?%zM=`3y&CbPG%%BsCR3pi<p4Npv#QcE3-6d%DeZ`f|~v=Eqv)~~ZERt-Qz#d;0%
z*P#woP~JZ;m~~l(vM6Kx0_SQb`aIUzDW^i`s72t2fr52TW<~`Cc88eiv*hND3yVUl
zO^g|W^O9?~M4;Semf^X1S+*Y}E+4<NiVe=GLRX?49Zj5GG#6yXR7#jSj$PfDzSrU}
zg64g7*Gz#>m^Zs6ogO*nxo>^{o~@|jQ;Bic6P9}u7Q)CWAE;C>T=(xn65E~o(Dqw-
zHxZWC1y0FSVc|HMGw_h6rYl3-q$2nX4AOpZi#aNZjKq|FQn$cd3h%Zl`BD5y^K0rv
zbbU+7cUy67-jg>m-wsOto?h3ZbDF%(Z(Fusv5lR3Fp*`XL=^NAH`NTXiaj|f0kCgt
z()(KG57<;vQV*u44Ac2CwolPvH;mlQYc4(rpM3%zmayEBm`$d#twvCaL<F;mRF*j+
zm)$4z!ltPQH6b-BZN3-pbkF8^Qz$pXFQx@ib2Uzf)v5)Ob`Le|pZK!XJADOQo;!Kd
z_-M91*6<UzEGC`IA0G6@1;{r^Ca`PWquY)c@<9Fphgycy*y_>o$&ICXyWVTECHX6g
znmfMG;AqYruJw`_BPf*$(aNu31ST;w{LA(&k2=2wXiqJy^sB&nK44^uP%iJDU^-t<
zehs|g=e%6z(bfC&Yrr+$rN#O1jxP4Vn~97r>nv|OxAndS7VuvEw6E9G^Wob~H>stM
z-kjY_CG~z&@a2{G`&}Cs0z(_3SI-a4I(oj|`5w6WZ1wnzQk?Q?xN~zU!zJN%Z-?|=
zzzwP8WvAPu?GicYy!pyW>}4|Bylmw0LpSQ%h5b#hgFM5`9p~Ha+wy;+y_LrtM^y;y
zrFGKY9;Xg3+*O+MXr$azT|9--ElRd6_j4aCdy46Dk6PW^&#!jzlDft{<~YB9uWQ*$
zHjaDTjpLy3m5aCH^~e$9i-Jm|YH!uC4DMRBgW}IF*EQdBPejfiJUU*!u3Ikj`lfxU
zR;?>D2HEX->+GP6du97|e+#vnc=A1j)GD*m;HwYYIPd!qI+Lev)2?>|JT9;K*gWQ$
zb7590V_HbL+Q>6MZ5CW}<I0X~^tlEkC<Q}@e)xemUxVrXo5Lp$_;x97H^>cqPz7J7
zbEY7$PoGffd0YwbyY>gwa`&jc>$T^lPgIE7Z9UF`*94YYQgb)+07DTzg*RV-cI~XK
zQa->#Egw5mY#-c6zH*l<!FBrRQK(EsW4r*47ZIC+@ovL22L!1=C|GL%A$yN2NQE{y
zwv(J^`6DonZ_DXLdmd%n-&Umjwb13Rf>uQE{qlD+H*kYY8n~1fF97f?Lt{>jAdsX|
zIkhR}PrxUHKizEsdaXEv{`3`K0>x^5F+ww4z`Vr%8@T$RPz+izX&oxyK4bYfVoH-l
zAYSI%wT1l|TU<R7IS_b!E;W%QT-cZr^2Qfo?~}ZIe6{jk4`MI+s8z#UFVWO*6K*Sx
z0f&DJ72zF(Qq`#~K7{)}xLNes{9{KhksmS^UBqB>yIr2=4G5>&4tfXHr{6=wH-VOZ
zNOb}=;sJZXB+b39??*L%`b*qM^^Tc1qwlE`kL9+Vf4zFz^3)OT8=6m`5itS1=6%2C
z+R49@mwZRDROhRlfZ)NOa4mmL%e&u_*Z*vUhs(uV-MxLusq~%PuY+5cA{XAQ9{zsO
zw}1TDca`&8L((nlBgURo$-zSnV72t*O3gW$0FLc071nY)Nm7i~(}?<YEh6Yt4<wYn
zuO!DL>i0S2!a*(*^EvgGHa$z~G0X<P+xjSZ;Z%Uy`{pB=??1P{p7Ccg<d%X&zX9X+
zCeAJaZxWbDZhS9@ED<9}6Cj@?kgv9a6A}P^nk`regqNi~+Lma>Wixi5sUFn+gS2K#
zbIR=<`&`^`Xqe8Z=Zk2pY(<@-FEn+RuD@%nP{{u1UfMA(OC9xwi|;O-NZ`i2<$}BG
zk*zHC{A;?NZ1`6TaJ8lQx0LV~82WPoWT;zK@ep5asi}ZGkSxO}Z_ajJ4>yO8t;vmA
zT8)kp*IP5#AJ($p-(`P*=6E^|)rW3ty<xk3YrKfeq$RH@K82EW<M&*ruO5Qs(s8jj
zK4TkWvd8e9ms#;Vwc<0$;cS><3n4-&Hft0k@AI6oA!*v(8{9WH`LELO>5K5H;aNwj
z_}=GedYjRe=J4#u^VGrl4t@aJ$gElvXBjR~>0iF~L&X(iSew96kuC5i@ChH8AKA>K
zDX^@={JxdUl>vOOU@fGYE2KFsq{||V&1ILh7B-(2zGN*d%_3x#E8;vYY&R|9VJ)he
zD}3Er_`$fSGK;A0{$i2a9v`tn_y#K7i=`G<oTM;M?Mt%_7u>O;8v=?~>%A#sn#r!K
zEDM$-)=8Q(NOc5AH3ZKzH;Y-_e8!Kb8wy6})KPa|l<dnz{~AS4P0#o5OQe&jHs8EH
z!Lyz-WNVzDyh&K3wWzK>8T=6-@geX@k+nSDx+yAi-YlIj4akrNlzdOW;?JZYlBdAk
z0+MN&R|rv%YLS;eXcAOZ8phDEF&<kpDW&5TwGZUYZ4}Gpl{G_@t?HC3r)2V8za|kO
z8EahCAV`^BAW6vPaFf501P;ZItP!<Oy!jW_Qj2mV*bh)w6qPgaf424~_{j>-Z1@@#
zzqB9B_S!U&Y_!^1q%XYI(qz>}pfq3QX+O{789tZ}f~bDBQC$zwdOI`qE<|D{PxpJC
zW{-_-^)2>U`Ue>qY#AiX_irjGM78Hw<Qa=r1sS~csd0@gJyL2E?#)j*FwB9GJHJ0t
z!Z)o^*TPlWw4?A$??(nZ1S%c|F#LMUaF}TLw`Ib;mCw7?Xy=Df$f4o)4C6a&f`nO>
z<k>fAtstLP2?UubsC73#)U<kyFJsooQOT4u)3k(5kZ5Z*kvrvnX!h{Xcn2=NSv?X1
z<R~OzJ`8FIAEIL1V4fJc1|kawiv84$s~#U3h(}725yBXjLn2bakmsF|CB2>89XGfz
zinUsZHKSCL*_<iA{H8DwRa8}KFJP#v%#%)3(Zrd(wiwZHWlzH^*x1^>ueKfAwY3Se
zvkSGoRxs{vXQ$g{H}}f^CFJt;IgJ&Pf_&ygY=NC$+eF4sn?$>&l(32O{5A<^c6i1(
zXGSTcY)xmQRV|DNsc?gt;4j62IYvoHNfZMIo>dryto_Nc2XJXvhmqza7v`?~#j}o*
zI3<C<Ys!(ad92LomncZ95}w7kf`Yd?J3WD{%_0?=kj$3&WqK`)oqSUspW4o+UC7LM
z2u)eOJC<EXR;8sl?2XDiw=Rcgn4YI%`x}dPMeQRGX$}w5qj8sZ4=WX|^$?mjs2@=U
zWBwf87&~ucdk>KvPb&`1+wIrCLwqDuE~IB5^KE!+i3Zi!i}dkKv=~kWjK<g+$0=EL
ztWD~L8~402))Ql6g1P#79yvK5@Mw?Ys7-^yiXG=>9uXDJ`+?j8Kv*vgtc=JsUE%o~
zPk)L*`vM_+@$@Ay`~s#V=*WYpr+mYH+`aXY!A}d+<=}w4;KA|W3&0T6eIC{OKCgE}
zu$MzCb3z^4$1lD$x4Ew%9c1=tJWP?(>vBg3xi;KJ)pi&YK72SHuIkO6Kf*H`h*r{1
zXT5Cw$u&by=N{fg3d7;K6|lh(INu)i_DRrv%fM%w95LGh$3C=Cqzg(!I^Qk&JvTPF
zHqTZ8`xiitJv}*TI4c~y8-MTi!(evb7Cr~^^-A>1)mPy*x8vrj<IYt_sT@jZ9YPs9
zPfu@;vvq>FxPlSCaY7E^Vrp?ad5$71cvdxn1ee#jG*`ToYJzG6<#Hm3u@Gp~!ff*1
z(LUo}X48MR>H8ONNw1F{b>&(nCyj<hi3mqGTuz}E4EzbCpIzt4D2;x$3C(cTr;~!l
zddbs<3k4>zxdI`<$y}Lm{E=ybm71*t>!QNW{3MxcmY!jV%jDI9%7j{`rfcS+TH?w=
zMqftLM#SCE5gEh8jGKyM`wp4M5xR)!rcm3l7?#Xy_p%3P?gF{Ts2%U}s$XYXH0-m;
znfdJ<$tmu^RU(W}?I3W)RN2-GN^y{pp%nWPOg~!S0M<t)MbKaFLb@-exFxgJDqm?6
zLgp)`Or^2_@M6|r?)_5c<tEQ>K*$#i;(QVQfbg;eSCCtMOK(v+hwc(XX>ifgrlOF`
zqcPSc&FUFeoevw-i`ya}mNyl*K#Dc>if0^ojKdgP#)HKo-RUDsnrchlb3d{=DEY`e
z_9Zg&JNNZ;;8R-0xIzJEvWI?+z1==uZzD|e9v8iD;Y0CtajOKR8I2Ys7hl%(c*>Tp
zbd9fqVw?Xi`6ype3D+@wS8>g5dDgV@GLNKjcf}>1QTJ|B`lur3lP7K(m61icb_*pF
zKxTpCSMLs#u<xE;dp8;y_2hC<RVAq^=iRG(r=rNWrE_d0dnEAIPYpiX+LsjX^<C`*
zPu;5`O>he&yW{&l8L>fW=oi&*7O|d_Ty0W!Z{2vuFP+y^>fh{u=eBpPK6c{yt1(Iy
z-N?AqDAcTYu2FqiuaRE!*)dNO(7Bnjrx~kp*{(&8%pDpAh-3QGEEL_${qTuqwE1I5
zt6^BH)o=I&7~4duV-%{p$=ea)T-zgr3a*Se0`gp~lY7K1t^wEVY=h)Fcin&3H3onv
z92OAt5l^DS>NokTG-K{uZ{UsAwF#k->721H>Iul#ecqE$;J;TC+KX@PCG++TNB7xu
z_D%em^3>?B?ou(&^z8axa<!*vc&2w)q3`j2zoW+UDYxguizTPd86Ha+v5MBIFA>XZ
zz(iwy9y~aO)Ck7PRe4;xXvlJ|hU$^n;4l3R?Ji@vcnVeU<XZqRp3Mbu0vRU-_=OMc
z6;KiFn*CQ;d64N0Yo*+xlNO9FdeK@fIG2%Y_eVnJN8+?byrPPai(cOOHS#!S<i3mQ
z3JE?!ez}fgKa6O389mywJX#R*$}VE8=X7jNZJgJort@?3D`k8QdurMzmV3BPMA=~V
zU}p(sT7ggen_Dz}8N}DE8*0E9y3QZ5fc%JK`%Ol;({cpyMTGW}L=H-t7n$CjPOH8x
z8Frg#S~j8#;j91cm;YOgy)ugrwSB8LI$S)9S(&}mH#f!o2yvQvh*AG~gkvVkrG9eS
zBeH@)-0w=Sf!*2eC1KBxP%MvdkV!23-I^F**}^LT>=Xmv7_zi5oJ5vEeh2fjbhzE8
zVk~486xDvI={grOKmPVgKgEf#IhvD2=zQuUh1pjbA~e7L?f+5o<km_mSTPN1f_$WT
zJN7B^q!jAzj*cMGu&uMsyR-QVSkfB86G%KkM8&f8jc2qQ=lV1NB6EzedG`uxRDd;x
zs8b)#H`3;$PV}AXo1W8N^;`XTlmAo5)lat{-3C5N{Ybv>EE-QDV+bv`&DL3}uwd7+
zL3}BLk=xc^AiISg{OFsE$tv>RDpI4Dj@FBp7G!SmXp$2XU=s-o{VjD$<So{`>3Mb=
zUGj;7z*3I>pYN=GTU_{b-v^#S>fo%xkV!<EPuOZK^(2UUKK`ze+Z}o;?ixMnDhIB{
z{=L8Jdx{=H2JuUDE6Dy8)GS6r_5+MB9{Ew=^77T58)x7C3xPfVc%YNY!ZXS4!<+#q
zV5H-zb=_kGft64QZ&&FN0hys!Nb376COZ3wvR`rMvNFis27_JI_krbl=rf#yONC3p
z<Y6@3w=3`e{0D(G<UB%D9YI&|A5jb$0u3NK-cDCUJwbLhUV52IW-DICo8-J#MspZ1
z3(%i}#A%luGpbHL9!P}nQV`gjb!}0|7+2T!*!wzhpV8&bmj;Xv)ekrZM%n&9BCvMr
z3PMgNUVj->&<5^Cg+r|ADrlW&fB5RX#AV&P+shLw+M=MZ`ubo8UCs-aR<sjOk8<@R
zRc}$GS6<Cn2<6THt9&Wv{*2>o+hIzO%wxt8#U(VT|4>Ex6?l85_SaAOmnZ8Gl<`&n
zbc8(e;mWgXCmT$R9YM(%ioCjawYv5{j6c-8|IRI9J2HfXo_^VN&-e3k!+wiNO|(;t
zyIJb5`!dVNKX;or;+S>&Pmd3GmQ?$@?l_oMs((s%H&8ucT9{Nbp%&+mFAhDYW5P4*
zn5;$rx?tj#$Z<7gJ@^>oV8<PIte7El`<D9<l8*(<c=;GNm&tK6L6A>wwb;ZXv(vQD
z?XJc*3IeN>)<Vpb#BWWgjm?&gN&5_ktR?F|dYTL;h$kTIUGo#1CESO8dfvYpo4A?v
z9|Tr|W9vS1YABP$+YEw(LoyfqY0=;cAraoqmCF8zAroY7#Q5{}WwC(8RG%_<Vx)KZ
zT^)w%@*9%f*)n6HHt7y)T=3zv{0-3yj&ant=al2NS+itMAp0l@*9^L)r_I)*J{9e&
zX@2zw7fx<y6(j`D#~Nj8?A$m-2j>VoR1XdzufO)#&<`nXW9DpSJ5R4GYWp%8(6Ji3
z#MSWFJ(UCD;yt#gRp8Q!a5&~uC~WolIVI42^sZC7^W@vu&F5;VOCn-Jl1f?dA8B(V
zZNGv)zA0wIw~g?Hgkndv23>PLU%n|lE}wjS!WcXvXw0yeN2O^yab;m)O8)xhDJIZC
zF3Hdgh3?2Wz#+57Lnd@SIVjvNhP8mz2*t`5#glCZvUK~;$fi2QRn}w3q2DbQA_ZuJ
zab>$}UoWYq2eBNOUHy=uC}CvLB>yfjq~l;Bc;Z4w2*&(!8HejBF<sNjGdL4|yk^Rv
z*0wxo%9gzCPLW#u+bk((>vb-&4Q4BRT`DrJnD7}5WY+Mz_4Zs_l@F#TXLK>Ec=cbZ
z6{z|z)mriX>}Dvl;QAY62Pt?O#Xw(ge)B9SK3U%)e<%x{Bldk_pO{Zf54UTcy~{;p
zEu2txI}R{-v6L0}cDwV}GBxFVU-k^wmvUSl004#=Unm@rB^{rDsx|R!e}Uo-y%>XI
zSTS1RX?EVR5W{%LRVveAJ<~M|C)=T|d1oW@e$!Ll7h`5?8Ee{1X)p_g#rMb49sNhI
zps}hsNPxd_9=u96PPBJrCF$Tfz+Ru_m_&eolxG$~4<awv2!K+zNt>8ScQ2oJYH#Lq
zFVFfVxV<tGIfL;#BupaKn*=%j-pX=|7(rZ3J*N{(`<Uf~-h^$c8Gvna%fzYE(?Ua2
zkA1gg*_xqZ9u97&-Xj?gf(8?nhJ;oE#f$l<pnMLl`qHfc=1c=1W3ZAts0qerep1fj
zK%(MBJG@-L8E~$NXL7My(_3dW=ie{@u?jz7j>X~GhFqz1&q`^u<lNu`&aaA#xJF%{
zY~4*-zRzz525`Jf$gX2eMuHv3u}7D5cWa&~H>AGy_f<@lZc5fph-8-=$M7%$LGp*U
z3~uGxp!i%yl(T~vulSH{`*Fi461)!8L<aX!Kh<T|ANPsfDU3PvVEjY}0FP6HzC3)a
z_aSLy!9S#oZAH}X>aEl`YY}AQBo)tj(UWwAS$DIuwJPI>^Gr$*Ge)-AL=AvAqhoKa
z$iawBgc8FWoKC(ob)P9R@AxJ6$9Qg;(Cv%S99B%DgA8f`ue8smv&0iD8BO+9ZT`aT
zz7GpAT*a`np0Q*_k!+tFyO^rVC=5MGvVLkjY<DSO-^Odcq6#oVW~Y|Jakm#-H=PrZ
zF0HapsRBW~79N_8mS&SVR368bZo$IvGy~zFCvAn*=7ClmVl?&%{wsbJt4?{HXH!)B
zHvh3&x#n5~c6Pk~I!-P4=1J~Q4gS2U+5e__-m0`R)dxzkTE{QNs#^x2ZjZ^n&7IKd
z3`_BU?Dx86oM`Y`<Z)n*-}#f(H(MQJ)Fj#sJrjE_&Yr*4-+ph~t>oi2U6;F(IWihc
z597aeZz1x+hsi5lQMa?d_~F!EIA6Q-;C3`gE+OWU60>ObM^aJwP28Q(_oveavHxJL
zTW>W0x(m)A<}12yhF$4$66rU=^6&V1*Ac`ZDsi7%={CvNjxnTR=|Du{FgcTN!eCHh
z-Y)q9#IrFWUTT-AxzBQW6GChxG9|8GdQhvAxVj*!b#cEg7SbK2G%!Mag6-*y*<x{0
zzx<gM_h147fcW3;ysmOUJ>&)e#H@)j$sH7iBzjFs69Zg1E`7?_>(cRHe05u<l_-|?
z>9w+ZT0BRVCL6ln=sYfMGP%CBvLx5X)UO*w)SrxGYyDhnc`{ugqim(nr%p<8QoDtI
z802(VX6NiR`=q|DE-d~_N7x2?Gv&#rBl$?`XSZZ)e_K;#iC;$~HhPeQS$C3jNiIHD
zIo9{cJnhb||9y?cK)-~VI&B1i=1XRiJbO(&aTr4`8(O;xZf|4yjt%KqG17Sk_g3fg
zRyQ|o5G<4Zh9`wT*IcFU*zcXX2Z?(81o^{+DXb?X3%hKKYO~B8pu4)4q5FGHofTWl
z_J;dT=%JvM+9e%QP`g*v#?tE-oiDE4b-BB_%U%LFzL5kB2n)T=+*mj*_>HKxJ+<^f
zPBzNfYgHj;+~iy>U@fujeJg*g#qvi3)$Y0S)KGyeeQG<s#Mi^tp2-O%k{)!ya}9UH
zS-tx_cGklD*K)EOE>}h~$zM0yU1jN3r2g)z6aDTyaPWo-C(@ks8a>hoYmlu#jATa}
zypw<z<Rb*LuZ?VBcW;yY_{-vN)+4wOJbDK1GHH!u{dOX)9`2MUIjCHhw4Uw-5fpOc
z^KflFLMb;-Wqu+3ecbx-PxL|y%Vt%d=E%YyGqu#8_21vUt$BF-+C0wF@B4yNDf#+v
zMj4IgUfPw54N*~-wm3Rm2ef10G%B<4^k1qHrQ9O3{PIz}4CG3gNbd7vDdDr)>uW9N
zjS!z8;qR*Fbn&RTLpmc1z1WXp>XakBo$PmJ#PA>HA{#z1^{p{kDD%C43R{B3ezjNr
zd6}`lltyZwt{J9+7@`ILru!LsX{tFMa*N4AKwu0<!$73N+D0<K2{+iJ<186R%C+j}
zZ7J%j@o(w5m+~cg)Z<CK^^;UZYfw)CXn+7U?NlJKQTgEzegC9+_<d`pDT0TWqc+7v
zh0(ZT8PZE(R9q^O!!Yft#Hu0sB5J&QQbOdmqgiLdok_&|HHK?+%ubD**;|QcYm6U1
zDY<-r+9@P$!fd=!aNi8kLzc8Ba-Nk<c2|Z8V6~J)Fmw2CC!?z5N)rY41sCL}i0LM<
z1?il6V3V=fn)c?bgH^V@|0McM&(W(ey>M7&uoU{I6`Zao*%p!BwGFNNon}@6GY(CD
z0?vdEC+oFC(G;gufTNfcI8Xt#+en0p!#jSm&(IoejKEfW!XvmS7^Ln@r}lafuRDhJ
zAEy<V1^LHmb$5W{2B@!`gR{>UTq;KH(ku#n<Dw+X>29E)Ke^xxi?Bb1?8$O+wrts)
zsW~k_GiYDsR1mTs&M=4R(SFWmKEpx7_Lw{^Y5dml*C<S@9Aj@OWwVTtL7u_6kp{mF
zWqJjZKF&p{=ZdKR!?Z$(^q1sv&tQ3qj(Jjev7)v#qER-&w19m-rwDsat0)ID4x-kS
zpi*hP^LdIYjKnAylq=du<J<v#<ND8m)PYi%RyAy0?w(gF)Um7J3O93$02QM=qoN#R
zm}^uR?w;=}mVQ`}Ro4v))jDihkfp9LOrcsEePP`91zll9LAlPQFmFe?EB{ih>jG51
zuq@5b*=Lq?#h;<xpP~1vVSgs?Gg#4BZ$l*;nI2ce$`)B7TyLdy-N5{#p*|S?EKBiG
zF_sU)8ezfJFnu`&(a#TZN@0?d%-d76qPU2vF4&|*i60R>-UVy!f@x3YtB@GO^h!D+
zOVDtrL$(5``o_R#+7~w-pKQ<~aNuVu442lR0qezQljpR)IH<7z)n4hNxkcu6Qm!DN
zv|7ECCaUyo^6@$M!<Ns`oJN|zjsIw^^rMetP>fz8kMDRhP#$H!s>@c&KnPccXQEI_
z@09|!0)3e%U~7>aXeyg-$F#gk4y3>nyDvZ`ZJDoHL=ivp6wJ!c9V=!fpxUlf>R+JR
zP9+Q5EdBr$k$2a3CxKFpWo~Iwm$^0eT{Hg%iNjGj5d0Hnw<o^7nX>ZC4tjT87(53a
zl)2YD&CGr5=K54$p8<dL6!QXd?Mq>FT9pS2>$qH%ib8s(ucsTXEY+-9d%7%^p;~F0
z$rW(-L6qy&cfg;H)#XvByD-+>wQ416`X2@7HFWk>QfuG}$!EXt#RyVW-6-m$lx8XA
z*<2!69#zvKSv!&QSmxa`vFWUrMOUA{18V3M4>Ht^SV5$HYez>>Y&YuW?5eIY&`@?*
z-fM6V18C&ko-K}|F5Rf_9A+LLt-IUE@SUOIhh)QnS;J4?hF@t7$2ARqMjQTqX*g$S
zq<m?Rc_WQqBPFOv|E!VGx$*8AIIxjwE3Nu711iO|=?f3-fN4GNSQBEW3CY-ul4=$*
zZx-=u{=Xrx@?<JETn*<Ks{d8X7heW$UTUm)tD#@3aeAu(FRK=*^}<f;CB`-_7^~@j
z5LnZmR;y=imo(chQxI6cR>z(;kEJ$Ozjix{2HVr-72O{2tQAq(?mN~VXx@Q=Q6XSd
zs;~}AUXZ*MRhW6l?S~!Fe_HP>0ptAIDGXss&@<gJ)OYU3ccX71CL!Cd{~)jr9(L94
z<;WAe9y4}>KX;Xyci-2{EO+j%e3l?@)m6>dU7Viwl+2vlO;xwkeUGtcRGqKoPi1>_
zPnT5JkwO{ySx|;!Pe)IeO*DU1dT*grH)684D7rhJx37?~XV9&;KfRZ<gy@a#eg3R>
zdA;wQdH1q;?_yb{j}>j$7m>%e`g_cKww${^E+OQBbaQ@P*1SDW$-Q%$nTzS?&kx6V
zHhKG~&<N_{Zdx=SSnK)vpZ*1fr@Q9txsB$%CnB?Mh>yQX#bgrwE@`8w?iX+0$x`RE
z+w<S)%qLR)Kb%R(3|_=C>D3~?Tyd{LFTaw1pG+^gnWf529ul7>e%drBJ3hegKe!7Y
zcx^uLDQ8Hiw`#?CsQwwL2|uV@+oQ-gY+sAC(;CLsif5g$7YK+CHU`?3F*fQYKsQil
za?mybMrcal*2iI2tKrUPgBCFZ^*uv7Q$rm+FD;jQtYcm>77rIK4dYJx)MJJm_(q(x
zUM@6Om-w>#11P~k==nYMZ$V6NNi|~n!ka-%-(U<khHqwNaJXoVL@b{J1ueSc#$QGj
zch_f(>_>McTMT9Tk5tF-BmBptGRC$i$DW*uJUd}ex1_DGz6G(Or*aqa&o%P56oIRT
z4HUC0@r^G}y)2R%Yv>(qIvvU=9=Qv7vlaci|FrJ|<auVsn^}LMZVhJ3NOnm&!-_`8
ztti1OoiMTM6T8bSy|rT|kg>v^*MODRrJ9o)Zm-W{NRGX47*~3jE{s6yCQo-ofDZKc
zU$W@k2ES?nui$9RH$@s@3<NpmD}y1zhEsDcLojW=#o~eYrvfr1&*iiQ&U#0b`=(i6
z^Y@z9Uyc#fs+*Ar5c*}w80k)SBr-ck@obXDZvz>*q-SO1`_a<ph&wTpC+pLf?+mKn
znW0vg!}QJMzMJD4n9)JZrIj(y6xdT!*w(fAn@n$muFytI&R+j2pr<`AmOJE>IoCM;
z)>(QgGINI4Z(c>ACx1~SIpFQEKEw~fF+T$RGY)%B<}C<V^v@RaDh)vsnM?W>Wp6<r
zG0mlag?iPAE}7MfSO`U5nDLaJcg>u1zp|j;+;Y`=sp5ih@D?n$l!h{h33xi2ds#5f
zRq(RGGL-^zA>!I*BiI2)`$G>h#6%kwzXT&LgvY<Dxgu1x@=jNJDHTDRa%E++gri$J
zykD9lXUBG1+PY*#2^|LYvg8RVHTwp*D~4H>xV7~3O8vFm^ObhQ>b2(g#~0Qh@=Asw
zN<2U4a$#tfP_Ri5hdWl~Px9*5;nkZ;(7zuUoe4C8)3D!H)&wqBy$e`C1#YC}sz#SH
z4gqK>0m_u0j|$`nKP=Vn=c%(c@vHU2ys{}(PWaScu@v_7;vi>%*bU>mTc%fqdN(ym
ziePS5noT{1DM8~I8*L*TLPLh%=^NCm5nKV|@7A*p8NHZjC}UK=b)){Hp9~_6n(^}v
z)K!3~d^*J&g^_L(bO~H%|6%l{k;ktUb}C2bybbkv^D+7Eb}Bzd;A)8B0QKKerDHj;
z5e(|SWpI`FX`1}ObvZ+XHsK<{Owne0HefX84(E;WbJuM(ff{Cb?OjeH5&B5mSOyM#
zR7d^<T+A)uAg(NyzlNQzE$-EBpR9lUMWVIBQ9meSwk=@jer@_F|C14pCZYcG?rRzD
zCOF~;93{_k{o<F9@g?>%cACwduTxAPR=GO>LvW(<<9XQEH{WLKS)wjqB$sfgm@E@Z
zp+gsz7uFeF0krYWkSH9@E5#3SuIbF~s}T6NfgE}-z2za?rJ+9MUy}}Ta$MG+y|GEn
zI1+7&^6sTzC{E<=slY4sdd`?1uvkjI2E&!~<7-Iq=WE1Om3X?HQ2sBg6uWhQ0RQ3B
z!T}@sK&FY{%EmL6eTh=NU7K9Ih;^r@*sYZH-&+#2mjTD1yK_(M8!?A|s2NgJ$9x?{
zpIZv`_;0_JPLWvvxsQ3m+iS(1|C*Nl#;A+Tx<js#ImK@+&CJF9cynFZ0rdS$;J0fC
z6D25+h6;{r1b-i|*_r>H^&R?+MBA~(?6AQ|5MZpbW~=}(4w916C^2CY?dSlsS`K`J
z9ZKAzE69faEmc;_N})uC`$^DI)uWDj7N$>{B9)of-W+^$rT)(Mr=@|CBUX9~V`vok
zQ_y&E6A&{>XEb;@#yvEq!}#y3_fe~g%xwZp1i9BT_``d@4j6t6{xA0KGpMPz-y8i(
zqeB7$(g}gk!O%NtbPyvV(nUH5N>fomLa$0FQWO=Xs-Os{fQSJ?6*M3yAoveex-=CP
z;RN0H{p@|t>}TdVXXebAInTSiTQga+uC?a+eXs9_LyDb-+gXeH$|SbT!Udn#Ft}|w
z;1ZKw@o0^I_JrMDA%G_tSFv%sRNCf2c*ZN!WDY^G6LXU$X#y(lw1T74X4k}xu0VzN
z5m@x$+a`r}vsQU3ZY}l~GudhK?H2v(pH;2OPn&H_XxMcg%!@3#CpPGlaOZ`O8Hb4J
zg9s;n$LIC+GGAH7)z7gc|G3#@a`Juk;>KjEoiC4EOjECgs0l|=mZ{kqIkYP~hi;X<
zBmOhI+D1DjM)9g>`P+Y<5=(DyT+cl;uVQ!&pVw2*#q}f-fBJgkaPYM(z3>+GXI$w$
zD4FaU<uf*GpR_uU&aD%fy`wjLp3*T2)n~qWjM|);@C-XEd_cRs#+9>i`3S!FX_V#W
z33fre<8`4uvjMH6I(>0wyZ)d}^Mh)b*WYAmb_*gok<)>nlx?qgmajnb1J*n8L%kK*
zm{jYjDR=@h+XBlfnSdd%%azs;I1kY<#NTW(^112}_dD34)kC`_?~uV=cbqpSq42nZ
zf-cD`MX1V-gP%`%8Jv6M*^@7CkvbrGQU=vwAQ`L72480L^g_6)pMn%67LYz?@*lsU
z*5M*E(3L`p7-(0sq|!~*;w+vhTgN=htrCs#USE~|#rD95^2RQ~NB=;-p~h3w&c;C5
z7<!byu}=QQeo3Re^@^LZ5}xrGfv-Cyf+k-SG79Fmwpisgqfb=|>K~M12CO)}?6ETA
zKc)rum|m-ieat<fWPYQPlrAE|blINH`a_BBsAgSg*9qB;w9jzaVrh94_nky-=YWc`
zXU?Y|_fv>5GOfgeXE!fO8}?k;7?!mCS$Eh>q~BDhDs-nO$vm%C7|KriJ<!&8VY2$W
zyP=&{CEwX-kYCe>Dp&Sa4Rm2wigUBic_D58l{zQ9WokyJ3O?IcDkkNW^lf>z2Qs#I
zBv3<lPIMKndcNK{D#vk{6+JBZNyOCao`pe19iMGp==$Twxa@2C?(9v8D&c1p{3Voq
z&4ybGcZEJ5*Y;&0-oQS4mu!6I<uLk=yEOFuD|7ZV!jmYzl^T3ZQHS=K#?R$1&b;{2
z`9gXxI9Vb7&huXjOUlx719@)sUPbHo&yQB3B~)gPFIYKByo9kA?PTo?m_9q;!uRTv
z>d2k=$2OLdGD8bJhcLMQ3MC!RI%S`CM|DtMrP%M4lCqz~p@LazU7nUIcKny=LmsC_
zCG&mW-Fub!nl8sL-NM%>8Phi|9Imq3=oeYcuJ1jcnU=RQ|NJT4TvDZTpkiCS;HvYh
z`wy?2qdYI1m-~}3O^Mw8_EER$gzoR$eo64fZlw3R>@O8IZ?0Y!C|VcK;Xsc&*vCei
zBC0EU#B%=tSOp76>5~GhuF1y^3O);ObLx*5vMEmMa>!;^$-Qd?9hm6z_iwj9C(Yrp
z*X_hSng&x=Mn$lG%(v3z<+t62kv!;el_Nlsda=}@cu%lk)pMG<<`e7ZoR+iqs7aS2
z%H!X}oATEeYub4~kyJW8S~wobDLoW=>8A(8P1~G;^^oGY?@5eft7VhLv`P)qA=|Xi
zyc<7=>gW4jqa@591POt-{pEQjK`c2xUM@-;AjVamPe`z5C>n_GcvNK6;8}%h6wXC)
z>vjqy^7l(|gySGPj3m7Kx54~ZP+v?>JN%VEX@Oj7vS&nSW1hzY<Oj;#AbCESIQ}pA
z_oZ)$KV$ooXWDPZTy(PhIcbw6{;uGSA-j%2hg@3eA@u74$oC;j%0-ffB)Cd;@B6OL
z-OG-Tk;}PRdgxqsyO1Nrx)I6P@Y-TqZu0_oqQ41R|7cn^lq;ML5zOA^tB#G0Xoe0+
zj!;?1C}uNdbEm~9LN3#uP`38a-%M6#@bWotF~xpwn{!RaZhsr92utr0(5W9d`5^v=
zGXC?C|3F}mBnH}-=^uaKF#O;|N1(&grsI#!4?jE!JMGw^?@*gJT;*qa+IhIi;n}m{
z>a&TbU1#-A{6%0-yMJvu(eiEhaSSZT17_g(zY$n0OBf~5&>MAdwA<V)Ec<%1x2(=+
z&yl3C+%iKS#S^2wCpyFOo;LfaUKo9Sk|n&L!_Zeff3(lfEd0iBv+w`k5!k!`pGIIS
zF5-ay_tn<p|5jUFm};x5!(X-aFWDO8<@!HYTbX3*<&c2CYHL_{IFoFBdtRSOwuVQN
z<0C^ZUcC7BqS0TnHSNmzzhvvx*vNmYt#OGNf5=wDkfiGWOt${<T5IxB$^Rl-(@v$E
z-uNG6>)|L${eL1`8`rXrW#{DnC0noM-no~X_Mget%EC-0*&1=f<=<*+QBl$5+g{bT
zbH;D`jNcAlzwN`g6V4=CuiW+fL$;PM$=1JK>-BOP(`(%<5BoRSdZUucBwLwY>*oFQ
zOtSUi!z!lQ`j>3|x7T{_amV#PWGfSEt*fh})m8lUTA5gD)w3R^*ZME4^=ffr=3lS%
z@r!|PFLIb_>(a}jzhrCWtNg!YYyGQt->5hL4YxjQE27b8|DD?Uy!XLGZ}W0*-S^&y
zO?}mq{nT&$wf|OIssD>=E0b*P8*OK*txU3Y?BfJeZT(BOPE1VxTWuZwzoWKJ{aBt}
z_%i$B%l!XVTi5@esjc4s7q!)kf1VK!^wu#F_#Jc+|5a^m+gDrf9gy8!Yy0oi)@iuy
z|4>^Oi)XU+M;J3)8ue?%SIr#)X2UcjCcP2b^))^Sdy-lb&oTFaxx$Wq3+V*=dkb?n
z8v>sACdt;bf4&vjRDP9*^erHcO%W%I%vDVBAl!+rZ6)bW=JFrb6bd-dZ;To^aJYo!
zX}h)jLaxl)GKGN6Ugg{~TMFf((FeGV1@89--mW>b_br~gnN7w|1RS8z4(D5e6l+WO
zKs>MqN0D(D)Jqfr!SY0k0jH)Vq_Ww|n7~B~f^vBZL4ijV&E7e@K8ip!^Bt9E{YiY(
z_~hB;QTS7ip*LLG8wBFxSJx8W@-8@gE7wXXyjI3H1C=mQyD^Mi1AC8Nj~RChHK_>2
zb&t1QY&aCEj_5~$AMg72J$WH>#8=L&B@GdbzgsiOS_+=juofTT6YZC7<C-$puP_9|
zWrJ)83&xp-HWBiZGHqtfyVQ~`<u=3G4P58#ds_;S9vcl=+Rq$Yl-E!!Ctl^1jkai}
zjlml3in0>okV+pJZk(BL@2X^^WB9XC@X8*fehBQeY0+$?lcuKb0UuOQ@05sriXAhI
zTY0!;7}l#41dP9x&Wtc3rNe*abaHxax9gQRGom5}t>H5|V*^RAt;N$g`Fo`YhO$&<
zvb{C}XS(}VS<4?AX4@JR$w^+)Ehs%|UcC`1)y9>%d@QPBxBFcfYT(f$&3EYJS07|5
z>e~^rsfL@R-ea5*3FNzMTk&M)?VJ?y80D87+14A&q+7@Cu+^}@71;eRK-KcdR-ZF}
zoKw0C=5Jm7bg+2)M|>Q}`6ezG4Hn%#<-N<s8atJU=cU0ViC{{jgcO+N%~`=+4<Sy-
z5IBk<6~DU;=NA3S4f-MF3tSpb+yf$@HpRV605~4!%+CRcDB>K6cgcNPDxmx1;~Yiq
zJg^~fJ4g{HTb$g~o0tJAL?%FPBx*rrGS4N_$v|)30ob<g`sje_cr6GFCp=m(YLi-4
zO6jsEXY5saNWS03BL>&+2#&yUnHDsm;I*s5KaW6vhoD3U*INelPP24ZPD#K#l|^;E
zlEy4%P@(}%K0RK7`0Ys~Cwpad?m$ADe-;aDuo!qr_Cl2ks(;df#PkhPe))goN(g;*
zuzoNRMV4wWs_6^iR}@)59u#fK;sH{Fuk<b6WvllvjNS6$@>(mx4Q3H|#bS?3gqLe`
zJ%t|*t4-V`$!eG~_WBgx5JY1hTz}$APIZdVNNoW8xIm?y<ZJ5!Thxx_=71*QWgFXb
zBVEYy<cuo~SvGivsR)qEbNT$nHThedd=L|8T)|o7ODLsHgwG;woN}phi`CfuC@ai3
zEO_Qp!GZ5m$~O7~QSTNd8)X(U1$|z_t<#d8?9OLmO|vSDzY3A#keV^$x#6#Fyti3m
zXvdpC;7+;b7}0aDqoV|_&(u1y!P*Fix)0sp6gW5~&qhoR9w^+EFJSv7^(IHWRI*Me
z9t0oCB<OjSlo>1%t~;y6dIUNn!%Lo=|1L@8cz;&%09#|toLNlN^pW3n%CgO*%AXgN
z>t@?n$sWGPd-i0t${M26A)rz)`(&G=3N;?*Ac7>Tl$Jw6^VpoJ<AS=<;)ei!m}C!C
z&GV`RfLh$EU4q-D6vu3qC>GWVymJzI9rro$Q3S~31OJ9qWB<9;-z=SNZpJ8X;HIBu
zyu#i1UPw#-xlUiswzi)?;%x>?^RNz=5(r<9L*Wk}`+%VEP;C>5NTK$JtI0hS^!mxe
z(~mCv((#D%SdMnoaA=mvFyq~^X+0>$Al7|AiRW4+Ya?^qPAZLs{m9Sd6AQfX>gGq(
zW7ESOTjqkV(fX<)&yd{$Y?-NM53WjByc!Z`YxGE&Xcg4TS)TCR8xu^3p4V|1E6y~`
zIR5J1T;JX;iq|1^mV?(U0eP`wSD^QE&vgiW*@)KmxPIj#uT9kgz2I)yhB3yzI--EV
zx>fK#_S<>|^ceotn!lp^>{geHRZ61Y@}w|lHqWvTHx3&$Q~CAvkyzb<^CrIaA0)&B
zgi0KHP$~HpE*Cokgty->jj<Naf7N533olA}kI(EsUKs>CCiIxuL{<@<7s6!;b9@&_
zULNB)lZqVXvMl77ddNN6bb$Wbzf>|QA@kSdgD%%MtNA6r@9dgNlR+ZrM+Wj`!ljoR
zmw2WWxQ?^x{rEV(v*>|cJ1Q?AACez;OXBQz-aa3Y#Zfl%=N^8Di9z;u503hXqwi`4
zx3&CPy!J+tpV$;rv1v`nIYHE+i>IlJVM@bWvKyTSw@-ZU5u)vq8t*!{&`-XObQ5z|
z4gVqxt!;CvF()UB-de@E&l)}*deh`MxSoQK@@fNLdTuD&n)F1kR1!AmqWXNS(sc8&
zX>-G!dyML17vT>pYXnco2YJM)HNTBxx0$-*3n)L2Ik@^GD2u%ksC#;d^H_JvBle=F
z)-gq>CYKd^jKW;P2|Z)B{NFk3_0+rWvWBf+FPpr|nhym8awL?rK*vpW13!f3BY%bH
z7mqOX4AL1(`F$^N7^zEx2PZzyft#=%lDG#y$38n={zqv{yEwum-i2GggnnE$I(EC2
zY)?V#eR?jhT7C1CQlxGhR|FzKbBH6pc&kgM@_wlr6(PN~?a=4l!fTrm`#`ZAQD}w;
z4@Ybi+k&%VSk%Z&zP0?lr+!Dw>x!61z6e+);=J7vSnEFD$~S`SokNJp^Gc8G^Q~-5
zzLgU9`9qw07E9tEzBMxh>dfR@5%J6_f|Zg3-?feG2K@|pZR}#%S)h@s1qn~??(?nK
z1a@Zz)S0o*w+0~a09f5PmK}@Gv8C_xtvgJ<6`{i@Pw<}?p$Q=E={#wsNPMwb2+ie4
zUefu<<ik&rc4Xi$O!xU#{sYLDiOC6$DTnXE4pCB4Eg+^$zI6}5vEJc&&OasBF%>_M
z!gJ3guOYRlfWN>Id1EA%skZL(ts(nrYulP#>HkS>jZAMSNN;LLZ)WnX)P25{Ux=5#
z0p1yzk*t-m6rRyJlK#d*s-gyKOHC8zg<3NC){rFDqnPi>{t#5GErEAT5XrZlF~{Uv
zL*(z`9PSqID#sx(d5Cdc!~&W9ycx;W3o)t7`!zDNfRg!Hi1Gy=ph4yQh2X&CTBiv>
zfoaxhS=U_;Zg&r`d9jXd2yzVrfp1=0V?bpw7bTL8@Cdt}ZAWttUWI`C@LkR-lt9}!
zxa-C_X$99`7>IMR7wg{L>?J1NO5u5ofuzexjbX5K6y@Q+>{g3_Ty$21Jtbg$hV>A`
z;`@1w?2!G?0Ug$I%)}P)%RH+rdEai8VA`!A*Wd7ALpRw};<CYavn^;WU!?c#)-MoZ
zU;sfugM9|90ll03W&^UY<*#h7Z>Yykn##Q%3n@n;{@Sf+I7HfCyA{80w_e8Zjxg<3
z-WyN<*sUDXYS}cxn-HR^hVAB-`2tn(@RZg+?{OVN@W&Ju6|e%w+>PK8*!OSd%Fz5>
zz^|oEx#b>)BUhEGXWL?@vIjB_EmVC2R)$SOQ>m`CK9E!lwz92&viBEnMHc?sZe3*B
zt!ssRSx{YocS|q*!*hd8BK$!kiD|c<D%rPNvvaLj9c+xCc^xuxL3Ct`lM3L>+H}lp
z)YGpswMelitigBRZsmPo&|;_GOSsh)a0`Xpw_Ev~Stq<9N<Ya{3qs`{02l<yWZJD{
z@Vy1N<zKrMQK(MlhA;_wGWViFsfi*&_rbp1>PZH3Bk%mRTNfKyR~F!3fAHv%!LyXI
zC&)i`YjGKPpzNeb`IA3(>lK_s$Bddr%>_lW|2ZnV3Pt4*se&{Jzc`BI7_(PFaDQo6
zQ|{uF$f>xzw+N4oWA6;RyP%HskOsHS%4~Und!JQaN@H({Q<4ru#3_KQP|D_1&e9TZ
zm@rgZuq68wP)_F7d;mu<AZfUgT>!*QfeO{Iej%}Ia}){!fS?CxcI{#7BD_BEVM7{7
zsF+O<R|dJuma70kFyQh?7BC3-i2-vI1A=7G$QU5afN+qj#}?t^i`5LpM^Cyr`Mn|3
zDYbTA)n7O@bDTmmPF0(%+`J|y<f-<)fS9;pJQ^pZo%A?Yol_+{|K1H%W_P_pg?Dc!
z;cm!d6YmTZ@SyQq4R})d@djHAVP9~y+W;?5?F+8D9<bQ}4yNFGnGR&KgB<o4@HCHo
z!Zq_pDL_IPDj_gRb()-YVBR}S!F7QtxKfy;Z0>gjg!~`D_3+I{<Gm$coznZ|eFjWo
z+t|WMc?f=avpM^WB}fK@_nB~O%xq<C2EJO5RH&iEa$e~MqNW7GTW`!+Z{+g)!fBZO
z68t4oa3vKsI<wn8ggc2o9r>5wn*OoD<z~8sS5e3x!PSW=xZ+B`6yLtM^c>RKP`(5&
zR%)8{;NS+z0Aw|Ia$j)OT>K-rQl5rl8ZsZkbupk_@{6X|FIv*m`71JR8c2yU9_=Dn
zIf@^yI5j~}fmn(QKXTN6P(m<OIRhm?bdOvQTjx1Y41kNPpCADi57?cLzyS{+_cZf&
z)h?xF>0`^6U$<Ysc=dB2S9J1K)(eEy#U^Vf1f-}Mwo}S(h=BCH;;BlI2O8mqt;f}n
z9h!C^KJJ1PCG?g87-hLK0~aeLbO|HvzlwaRq4GDk*`8{hL!``ZaBX?<L^JtTOxr%+
zO1GV3Tn5zl`Br5^+CJYJLbE8MSvAva#%Z=uv>Xp(1#6mpGtz8_=2+C>97UT6YdgNv
z@%u@Kr(vg66e|VV>0c$8S=`P%jd_NP%e;zv4A<$o!*$lM%RH#lCa*K9S;8#pEFRHq
zUIlZ;by;Sx+xD@<?p1+PGH4e_7o){`rq{br#k8=XZi^~)M;qwXA{vu#byx1Ww=ABU
zLHmU3z7<0I#DGz8FlUOD7oF3dsbogc%E<eC>%bqrwX7IsLS?b+>#<(G{N)ed+RNly
zv*Lah@AIv_OuiM<`(9b3EQ3}S0&NT8IjspvML>g)?HV|?Stj2~>GBHUF!=$=0Z6H9
z9JmY`t(g`bq3%s*iKeqIB6xpzKv|gcR0e`p^Y&y2`-dX>ZK=0&A!n`nSSFgy9((X4
z6vNaF2QGv_=d0eBSM``TqwX8_-72EJOhtGz?bh{uyS0yLx02}`;_q&R(s=f6(GbzJ
z(-Aa*mjj1_24q8M^FsqKGu~Zbpg-Z>N(b{irt`edN64ulhM9INiTn0nyA}9jx6+wW
zBd)z=9tyB;w}Msn?bdAMdrHl|-5STVTh|BG-9F@H^;<-}`{dfgA3U(Yv|H)ypNiFQ
z(Fx|`-~&v%73lg@3@#%NSyn0k_8gR7f!EYP)5%au2y7Q%_rq|dQ`mQL94ATKuW?*^
zHZ0F6tfdV2um@Z93jF@dvFc#9XcD(Kg&TtZaDL)rR_q7!Wn~ox_htkw)nkA>2oB=%
zcgL_?G(6)4aFI5^c;ui(AD(PE3I=heV|bjH&%bpD+>F7Kr!sbe#0^=0JHde0V(2B}
z9~b*SF(=n%YwS(bu@~I$T3-H>f$z!W<95n;V}6SUJfeLfG3JW7A&*7|5YVd`6I|;<
zc}%;N&dPA(E?R*XBFC(2K7sG<+pQF)-3t5zh)+@eWw*}1ocP)QkNOoMvmkEUDH+i1
zHw8OwI=drt47Jgfq3hh7{AVU7|Jtn>`Y+f1AHWpKc1l(iada2fg8cZKYg%bwP~+3A
zV<>d^a2H$4^am#2Dm7{1KFOFEHKViCcuamrvRa40HlwGG8jpp4f^Qw3m0q1VNr643
z{KNT#i#a-9ui;(a3*mHnBk-F#n>;(;&$Zxw<=Ukxf_f2t324``!7kBlml*Aczosi`
z0fkA0;`dG0;lHLUase^0xI<kmMNG4TcuGCk7&T0Sl`HuT-**O2tpwjXeG&YGE9o|(
zS7MnvbQwCZoO32uL(`=o5-B7mg=IrF@U`g%sg``QlG#Bd(OKr)N986t=T_&qKs@>M
zC2-cvL#AMg7=9fB|G^YbL&m-q_f6oqrs?p-8m{lEh+UpFS{VG>wPmrR+@-irvZ2g?
z(+3DIe44bp>#;6$62W(5ef`S%JBbb3$<?)09`q`EQwV&W%u$HrpfD3n6n4rUgFTMU
z{S+~lPhnpKcxsUB*P}NJDVvKJcny6ci80Bk#$)=0bCtw>=+o9_@m3*&^J_7@1z;b>
zz^x1CYXF`ftDMhqTuqF1j=ON47|zuYID^F9Ud*{phfjyF*A##KLE^3<aa)gWwd2-k
z#XRRTzt^g8*J8FK;oqN!eE*L49{w19F6KKd3Qogu&_dupYreIUIOkP2Zah99^L98I
z$8m?c)Kok?j2ULoSqnYBGs7;?7_LDNw#bv*6vkxLm!CCQF6RmEnzx8W2K((AE~g`0
z*~L7+i<$Wdo)-AdI+8mK#}XaFK8%2uBH2xkaNS>HxkzWZxW@i?&v>4K`CW?SE~K#L
zd$85exl2P>!k82+0zMJKUW$S5)^Np9Si|V7**GpH+}b<F-3}m1XQ)ljgLv;-m*!>Z
zOPdeYL{9L%+3b4!9_5%Gcz;ty?tqNl_noUUPJ=U+xeCW0d5;dxS{JDKyeV~hH+Q&5
z@7(Il=)2EHit&j&Xy>8%qotP7aW9}}N-K<OJhDXO6o!q?r9X&`x9>k`7+q@7fAhoe
z$>B579oZ{4Qtgc{BsJGY$lZUdo^|~6Rq5G>t8Q64QI-$RXP$g&obMsbcQat!K252;
z#Vt=kpwwnD&~5SkVLpX(Ulre@1l~%jQIM9rb&i*0uov<LW7GFOpTGU+$h2X+;KW#c
zlg;zhiQamfLG-yM!^UG{<3GaZ2g;6AxKI2%w><jv>}QFb`^RF0^Y1S?e5o^V41T7K
zwtV2wQtLkOAX@UD>KD$7Zr7}@vkvOUMCe)Yz1!Y|;{w!0Q-$;_8p{Md0~<T?kCY0h
zmyHFkvo=^8O3C6ZI}0lwXGeuz6>=om4@e$3ylF1!RKLM0W@)^IK5)TotIXtsOm?Sa
zfNEn$j`%^l3ImxO`!Gw{n-Lq9@+G-pR)thG?<}7!VY!?HkI=4zL}b=XhEL1s$HsL-
zjkO|I#^WC=c|J-o!RBqG%H0W+8JMjy?Iw3f8mte!yA!Bx`S8wOpx`=M@&fg~Y5pmT
z`*UsA$986JBP*QCRgY}+B<Er+1J^Yj^Rj#j`JE!FB~RAOe6F&NcoN2Y&Y1gL>CuUv
zQo-mzg)>?)8Kq&4p6OcO9KCanpLg<gQ|vw%;x68G@MLM@X9-VlH`&{lsk{NDq1R?A
zMAJ61I`cz+vOh<KP4qkyY;+c3%{JaB=)ZHtd!haQ#if@zw~vg?w;zm-$RhIK&osj9
zEEU}Dix4-uA$cY+-^>nUXl#e($uY-LQU1fG!)BQ;LjAIo#=7GlY(dpb_$s1$BE1By
zzxfqhVs&73JazNy55MAg!At)4(k1c=Y_c8n7pzr}HZ7Eu<Xu|at3>PBBGkD+q%xlt
zM{p{-csq_uy%uqk>v5~`%?u@K%f02t`3+NP%C!ws=}LA^sRf2(4Q(mt?lsXh<xi9X
zE_sTD9$Y<-O>9M@Th}Y7Q~co0S?LUm#?Zz(l5l7T_PJrEMjo(}p)HS<zJB8B`F*uD
zKl=Pwy1PvHzS?@>)8+3*-+df5W-m;ocNyhe_fWfXaqgzh?)$NStF5<c2Ymjmw%)mX
z@YrCN_}0LQiW`B07xtpJr;qG?%v}V1zOwV;e!1w*ukTDZn1w`!h!y+ST);tPNwJ*X
z9uV<u9Ge-_SuOQ|sYK$rd`a=5Gah@aM$8?`q<yvZ6#L;w0)IIvQOWxhr`t9`sFReW
zQF@9yIFcwf7vhL2h{f_rfsttpfep5MY}XiYZT_PY1M(=*ozMi-&uIY^LQ0@Qh-R|w
z#e!d+gvaaBP!ejXcvnvZ(Z2)b8=8(=_T+69GEq~^O2sjwuq%<~IlzF}1^FqN+ec~0
z0wSkrRHr~}B`h3zH)XDPTG$kmiu%+lc6w$~;@5T;k~y8mE0+r6*-R{0j%Mc;#iHZq
z&2b#rlq8y$l3M`L=ms&buGB{*_@cG5_C^kh>T@XiqP5#4Ox`OQ-$U^~th{A465Eyc
zi;?<x)ZZ1pNtk0P+tcg!bU0S{amJU`k7N~Omy>pl>$B$5!q(Gy?+T`ueGMk=<Iibp
zu$gmB@`8nrc)qE-{hd~E=<5$#GK*$hCdC^YZApmd3r}GGU4|3?NrIK<+;z5yXM0Ds
zNcxn0PpaA9Ow0LbN|Jr)K#o7*ZK|#NrTRR%mmZdfd*5Vr+LxPz2VkAX26G>56=JUX
z+MesRxc$byl6ctR@cPALoFZQ<@lVT-oJ+I6XLkI7)g@Co_jQh2p0#PsQJqJgHd%*9
zXgws|3UumEyQLC{uVNYgYs99k{V`&Pdg*@kU#ml5ldembJ|xTySBDs#KE?f7{Gwsp
zRoGQOc~c~O@4%aZM=Z0_2q|kqk0<|~>(R@njFjH_8-mkJWr70^Uv?fUcX(Q6I^+Cg
zVPv?|;aOc-aBwhFZ3SmNnN0{j6aCAD!BkuC(frOPUv_=>2FV@3Sn|8|8rOk3(e&WB
zjK|IUiMAQ%n?BB-xo}!E!5j*D_$De*P~tA+OZkbHOE6Sqhe7|w?fjSTZna9^zWfiw
z%&Y!_(3c~>4PKMpcszf}g~sk(_JGQb<i{5Usp$lGz|0-nc71AmV}3B$FK-FwR4#L=
zrk_NZ!_&U>*I3=TYazAE*MScSPIcRv3NbEeS9#`xP~q|t``nPP?kj!u#3c)H(Jh)G
zS7?@Bg<}ZI-e|Gdr;>9Z<!<4v6FtXnZ=~|-u`9gZ5Xc?^r{CY1MY@cNIX;`sgDv=A
z^258oX@%WPH>2@a=-n>h$B-{>b4k8-dV8Q##$)r+XCv0Jj%dN9JAM>D{I9Sy4gW_s
z#aA>scytFk#A?}SFFZ|-IKLB~So0KDS~#36@)*?8USS&T##{4a;Gw&Nh{VN3Ut3f!
zB}2U`xOx)b0?tOXoO?W6wB+`S`E>$Scz89sO2v2VgXgV;np;=jt}Ff;eWzNdTsE<U
z{kAspQ8v%+{_o(BWS8-2UwNm-=rb#kH^-NJFT9vI92{Qa@@e?!_ZP60G?8V`8;%Se
zdEZ9PD_*f8dlFAg;JpiMSKi(&DkkYRz(d)>JzDv`oj>3FIXZNH=;l<wUnDl#V3Uc&
zl3RTO{vffBNEN~&w$?&Woap58J`x)n_MQR4R)b!rE`;svBe9iCB$k|b^`EgRA-_v@
znzy$UlH<YL1(ABf9ve<^p0kVmKUG*Cy%Av;7U_RjU>dPuC(r+`2>fHjhE}FuS~y%`
zaP+ps1@Q_TU|dm#E-y}|+-&DP2AJsjU;OGEc<W1TMAB=&-Lo16ApRts<T0O%T;{s>
z7UxDfn4;=MC+7Jj#~PSQyRmiOvE9vURP?CZsidx(@gm{WxL1Aw>8e$eLiNx+8ovzI
zx~}A9ex6R(p`f!oq<K;PvI_~qEoXQJa*Wr*DO9>&Pb?TJ@g?>4<%ySjIWNxcb@(16
zs65RA0VY)D>0C2i`YQmipbFQS7^(;yd95Y%d-~)dFd)bP01U)vjSL|H@HMgsCRtS%
z09lZoz))bskf)M7bqoOMk^!>8y#of}Aus@^@3aAM_`hV8*9R~_9s~xXV}&SXvbuN>
z5@>iw-u42%N$c|f0EaHlh*}0xrb29(4G3hXdt`nLD+dz90RW&#a^Wu+Ck@x|M~mH_
z2AuD)fT;TGob{`}j4?y0YfEih;ZQ)=*ompdR_gENEn#suV<xHS^x#$1M}4PS7?X>g
zf{-_uT&xB4twB<p7nyZFRsz6>%Y#{q&`d7YX)LjhNMJ4g!^IYqy?fCD!x;LpQQvRA
zn)yhu9C|JR0OnL8ADzXo0f22Mon#Q5e(EdB>%%c7Z<k(3AWeuSO;XHmYu7d|1dT1%
z#Hyb5)_}}apf{zF%-Id7^Vc8ZA_i2Yszr6ODVYxEltGcP&P`;Nf-){g;O8`9rmj5&
zLMGC{5Y1$MB-zEe)5O)}AQXs>2Zb)1a5Hp7XeK<$U8)#XDGWJC^QA^^S=N#Xu9StT
z#VW{mhi^UK*J9<380oaVDg!DKYQB_H=AMg|&ZQL|v%pc!qoL&RswST*5U8fpD7`Zv
z%Cex+EYGCoV1|*?&vxfPnp0Y1sEuKGgaHqm6%R(2XWPsr&fK&V9ZcyiQwE2xwR0e>
z;M*+Mmb-er$RUmZt{GjMQ)ae>(<negl=XWz+a-2jFChRtvYAnWj(P}cFfo~0vIwV;
zPv*8W;;ruQFu}<#9~;ocqMk$HmIcav*D02*TZgK>jGVK{Y?Wn99t|barYF<&D+jFs
zkS9veQUH)vislLFbhff8P$Ekp$g%HO0DthKdMoT7B-VY=3eFE6&TT(Y72D_Cw>xbR
zJpXD>p#XhErkq|{CP4z6;;1ij%NWNFzb`H0r}S0WzjnR{DBJY4dMmb%+ZN$$mWS@^
zR+T07J$Kvg(%Wu7IghO<A|9+s>{sq0)+84GhZ38pz-GIz!~%(40QAlh2omzPCbtYF
zL>i4U0RTYnuM<m8((|Y9JF)Z@rW0#kbeQSHl9*0x!7Elbh)Xx#rI-aWe+1`2=8Z^@
zAQ?O6ma$rxks{mO`AA?R^Mr?Ovzp1zqUdb5Na4CrW6gahcFCUpdB+wlZL=C>7qez7
z+h2Kb8UMx=3s?Z{N*%Dnpy4_^fani%rGsIKERJ+m0KaD)NrnjkN=7W#H(xm|V)bsJ
zMRxkm7UKb3ro2ppy~I1|AL-mN0oce~YkGb-EFe!#s!I^az(&_4=nl7zK%gK;y5KTe
z*Nqff%5q&A(Ae(gpjrd-t%hzS<HQy*ezHPM^Vt-#WznGQu&sRca6ZM(>99N>0+5P)
zYfyw`gu`yq%H045XML8HoU)US%>nn4-fp20LU_-xq*F{MHuAl>4c%kd;rZ6EyR(Dy
zSYqrl+ON9oq)<1J>BLgsyGE<YJsobN4WI9*I4eX*7SlNq0zD{X*8C9wsAQL-69+G!
zh>W(pDBu_chIt7*myieGbZSF*g170&UToQL+{+QeFvYY9$7?GiT+)siu=e<`j@c?s
zIj{$m!=t%Eqd8w&VIE`{!^{Z<Vj(*z^{cU0j<OVt_<})f9cpK{9QvY0VgB^68}V#N
zpkgNp)j$^a?sKyMaWnu2w-fdJ!NFSbvX$?fYyfVL_jzbp%5kSAuhE)nw1zwxl7bB}
zB!dBR%#hkX5-UXVv;r1N%UBVBNyHNv2DlvzhB$uYOp)V3kXh_?ucx<Sv{+pnUBC_Y
zMgUH4Jh6NBy%UOhK$%`A;F6AZiPZY|rmT#JAX`HZH{7ay<#WPCpWJNv5+D8K)$Aw^
zMs8E7;2$~G5DtBM4z}kP0!@tX=hRI)iGiE|sHPDH5bC%SM>2B=3}zb{_^n2-b|3g{
z8^|ETNC1lkD0rmxemK-|__-Gn#OhCGql^w3O)Ocvog8H08~Fqi(pOFa{t~et{}QqC
zSf62F?>f1=?xd3yh<&Yb_?-10A(reu0sAlk<2e6mUx=+S;!7d-ABbZkHOTG@vA|qM
zA6tz%4+g^g-vg;9VRZ8Mpg5)w+cd0m!o!q>F}~UC<^+bZul>V{Fn+EH@E4VB@|!#N
z(rvz4$rd#TxVoRH(SwDMTUKHL5Awp-vM1G_(qFhQZ#96$T={>$BlwWy4O{oVwogfE
zO*r?qHmsD1X#%iH0+WbUcYg(;CwV#In+1UPOd_`1j<bq<@3lQElKjAhk>i3zy(h8b
z#sRYTiEeVY03f>3_imWwgHaMclZa*W)_R6MP~`$30V<4Y=1z_!V!<9b>bXQkdvf>F
z0rA^t{$Lzu?x;)cw6W<+#VDYq9So8O5Zg_}_ast-J@q)5`NTR29&@rI&-Z(}j(Mu)
z=^V1{({qPNK21<_=)v*>+}(7}Vipnx&~pDr`}{xd&HyN+H>5z<V3!zJ{80~xjS(;e
zBf7XING|kv!nfW4ZB|p+dB7s}>^zuz1!Sd4=IRE7l3Mo6pB)WGPHA(!bF1;+_hHG7
zSb@(6ssNC@J_|i5gw!Zf5Z{z&L3L}B4zdWSW)dpnZy_I@(z-{qSdBcq`HFk>uY82C
zS+gRUFU|g@vNn|VXXm!h=<+$&pW~<J-UJESaHn{~DnWs`f!U{R-fzf<&5R@R(C5r1
zbUM*5PvZ_2U=2QzGEalIMaLC$Z9YW5Cu_5^3i+EFe}+)diJwRxo}xKwW}IrhlyiMa
zRIscez>+cGtk@*cJ>eigMr$_qB><Ta#^^bp4+6l9CTpQKYjETg{2RLYmgBA)mcvl*
znk-pCC{X0lN4-yp8d`wjvogB`--<l+>1%;|XKn_zDubQAy~;RGK8YZ6TFh~7dpk`{
zMEH8u%E~fj*sn|(w#ExM&on_HoH8_~3~L?XcBXm>Mm_!FYY;G^M;;<M{ajk)UpANV
zJawgS_jKFp72plJTdUj6yc+<K8b22?VOZdTZ(rjh0&C^jft}^I5D*tXS>|b(o*D6z
zw5R6yu!1)E4HQ^$a}Trtv1qP3kDYLP6FiX=`03h-tLFm!YL1#a;+2b6ri{-_I|K!W
zBnbqa`F0(x^Q|m|;X6~;Dp9jqp$tHZlX`BWQy^6I`6N5Twl^|o)9eFgA`-19=z3QS
zJ-CBJwYs&ViPlK6LzKx))utV7)4ko!&mR*H!*!39)_GCOCX+Z>J9mPt={ms$VAPzm
zuSr+P*MRUE>h_KfN@DS3CBb^z1xPg3KzgoRCIby;`TkisprifIv(CRVEGwFPOZLq4
z>Y_l=^Z}Ep!C-<~Kb{H00?*LFYyb?Q&!P!2Z~)jV+XQ#Qz>)p|--5tMfVGkgr2<Bk
zE`aNhi6FpACKGj&6oUY;BmLuXJyr$)k*A|wf!{`r&rLnUNqQ`6WHtm~@!0~9-~9b-
zMzLtD>0IKt7O-v5>V}DL8V0y@ffB>FvJtd*833I0;pI2{n`=hb`^X{<<fgJD7Ds^j
zaiH;%eD}@b-o&quvi?lX06@hUm%iUr&fBs)`P3@L%#VbnX#srnHnzwPF5r(08{!6$
zXRi3<SS2^q8y7gn2Q<>{oZX~Y^j+V$)!~zswD`qBt$1VEi@us<Fa@~wsEGyX8Jek!
zasUdx1f2-^T%v7JDQVA!B%{x<aLAK|q5yWe3*nCgNg?*M!(@pemaj}0w%EmP`3D4}
zcm4LIa3EpbY#h=s>SEW(8QFaB)euX9?mi6b(Z)tTHq;!TbA2@{#_NOyIa@k(ab=r+
zczygm%LxE>H6Q(EZztp@3-ew*uA7!{9HECNrapz8`mHlojSj2{=qii$)Mq&nX}lK{
z2J<}!yF0tX_XzFBi1r+V8Owt5-mzE%2|YK<PKH2n9&V$bqkC`0cL%w?jtT60yR)3H
zA@z3Gt6}%}cX`&zkJZapawm43e@AYeEmsf<-l|B#eNgBZ{jmHw@~e*ex3e+3Ut$y?
zY`mx)-v3T*710S>o?n;lrodr0l>R4b>%yiSy_j&8gFoQEsI9!2DUn)R|3z&*+rk%W
zqBvInA8M;>N`Q%t$m#E@pZ=<?ALhh)GpG1e|3huPl{dWcU2Ud2TkhDSARUY0jvG4R
ztII#aoiBoyoK=H=YBJT<%{*qVLvwkg*6&@p+xgDA;if-o>-UVlr^yEno!N<e*QjB!
zcV=}*Z)@Jk<&No@-}+3o72bPOiSYW?iMO3OhtBRA{@hypP<QsruF=l+#^-mB&+ZxT
z{#$LGKYT9{HynHc8ON?z>2w;bw~b8TwbGSJ{13IYK`L4N(zaBJRGKa-6@4QTm8S3@
zWm1W=X&aTHMnJz+$`n(BT+>@@kj^yvxh+k>K0{JC@L;`CHWi`2YO74{QNluTw%uGx
zDZ4{pBRb#h{GKH`-|>>3FC~CWR(fA;ojYGWaq56C%B0=**hFfLtL@Oh{oGrTQ>CA8
z$No`UwfV2&@O1vqMM)yVpKoe|7U#_=*~gJ(g@H{96(6J&<L;@cjVV}Uvhgq2gx<DX
zG%HUdKd^aFtFKi3bZjiouoaed)4Jr-gMo^>X^NzhSI+!F4`?DUl<WHSt&cvsu+hZl
zYtH{`*<=8kENau@DVp_c@chH&=d(91t5$E2I)bfo?r|Qi*Kq9MJNKdG1*v)Sk^PsK
zOttm#jcD}~*)M?UhvQT^fgsEUwlC=l?M$^bG!%TZ9@7DHO5^L~KU;;N38ypF))c34
zwVp?9dsf9BXvxwIOXbIl>it?DcXA(wibU37s}mQi`;GIVnr}@-qa(~7^`_QiTUnmh
z57_3s)*L?Wa*O1oVkchh^lhW>>C+SGM%tq`7j)u>{qkRGe+<st85<6HVWcy0?qjsh
zr~M7xf1-c=)?vhQ8tYCbieAy3N>ysnoxW<Yt2>irZLBwY-Q|kjT;b^!z0bEU@9NFp
zO*htGD7$$@fARjq7X78_7rXk)PhJ}vtUUdA#bC8@sm0*S%U`<&YptAE!}Si)7{iSo
zrB{ZV{RVr6TLacuqp!m*F-G4;ProwyK5==^XnQgpYy4yOW{mOAg@><<f33XOGu~N$
zjm7@{`f)D?yZdA56?X6UuRSbtouz{KYRD{x|7&XNvC1}q+L}bwC@C&4`F7#Knk4OJ
zDW34kcJYmxWaAwvM7%sritkB^nIVcVr;>(Nf0Ak&h2k%f?@+LNlIGBi60EE2PzigI
z?!JQ(YM1X+%YKsKYbY)9uCi0B_Q};VQPN`5@?Cm^Pp+MBmX_G8>@wPTl6hrE8VOP8
z#`D!uk_=@~2kv*9?miYRq?o8YXzjLa^Ox9^Pmy`#k#P7-EqAGW3R*$IY6&sTX+{Ps
zJixO^E8pc#M|Pn0-qiFMZ+r2QFa%K#wO+UPo#Hn%nLUN4tn|j)B-bgW*rX@D#un50
zCvdWdN`46AL$djUF>zvSsAROzBu5fvPEoSQ($b=?=+@nG-j<q-i1Y1|A7)B<)h9Cp
zag&@A+p{|T_m6Z?J#(@#CWgPC*hZG;Ac2>r650w!l9*f6KQI<V$wkCDGEowm%Bq$Z
znwhj(SAs}QRz8JKLUXlCQjqhqA1%40*{1jwnq`QZ3#oCH(q-_hcwQ?G9+{vG!JErW
zW}uf6xpi0M#5Nco6>BH&S}Qt|08<gqW|#K9i!3cxG*OpgwfvUDMXO8}+dvLIk)?^3
zHpmI9>g{Eo3{$_k3v}^qkgnS6dyCzKvf>?nSjKD<_)4h{v8$l;QwSp8un>##_)+en
z+aSRma-wR^;t488UQH5uNfrCVN?JLdiv%ni>5Z~nK$sjf>yB5}znGeo@J@1dL?+-D
zaKvr9q<omRfRO>cy}UCdSvxBe9Q>l^rDtB&t;7nskS6E228bX9>4$gyc_i}LDPc}a
zQ=Q+j6WVNBxx*M0{_RsPcp1UxtBz3X)>aqkEw5Xo?Nx=27nU2@&l)nKD*Ufoy^b7e
zLxlMgC6Gr4FJ{<Zht57COl1uo?`@Mj_8aW2qsQ~{J@KaA*Dkq?nz66nrdxTn+Y)q~
zPW{@m9n4*GC1^bwO>()n#aX)?Z_S=Il<0b(!mJ?~8}YGUX{|x@nF`w(wW>+#u6>u`
z>UyT7t7q=qDKTX;1w-`RbnUg=91Vw*BRUEWF;%%QGToA*@_`vnzsPp%N-efU%olw~
zxa{>>N6y_SEBsI#|M>XK^#iq^IDbh?-pqyA_RuqLq>Z+rRW!0jm;8cQF43#JHKdL3
zX_m*F`KD94bUy*J+FbF~g=ARS!2!gmYU@4deKWyb8)rghW9bPkjmw`41A`v@9H3nD
z72E(gom{70MU!djRD9ad89sK6{%#|it6ARvT)HznGQ;Ol#6hz5ydFmByyav$?i+5f
zC-XKhT+8UFPw<5o<B~tL8;&fb-w&&OFn8s-nH|^s#do6gl5-fjEZ|t=rl>+8!`Jwi
zN=QkAmly=A+jij5TB1g?!*511ej8+;geyXRuMFuB-dL;kHIx!PtBbzRK5|Ov)JL|-
zWM1SX{79+hEVmv+n1^o~o#HH|YMf#K<_RM_ifF8@{z9-g<)-d>O6)h{=W8!_M8#a|
z!P=*12xrbvjQKBpPMGQ9d&Gc8BV%9Cx(W56HfhS;AddCzINdCyfBi2nG5a&|tzWa)
z<t<R0R&puFeieUmsjq{N7O^J$UQblUfjJ84tZI=z6E8=dx>?wrjLch0%zh-sk+k>x
zlK7Du+}R)QNmeJo_)MxlYU9AO)TB0nz*Cq0aR&*W#09F@T^W4g(r~j7Q0%+v6xJ$=
z=bNwY(6wPt{|bI_r<8i%fO-l_oPU3?;Lda%TI%Cvi*~kXBrG$WYfAIQ4yU_q<DDLl
z!_p1X@I-g;3Oj+z<=ZF8#+VhkS4iKt>DL!c1flq`8mJv$fAHAXr46Hh#N1l>kg<*m
z$0fYuz=4w2s&9V}m6VYe5|;OnrL}AGLVpUIs8C{C6Yu<zy6)B?$?xHzJt}!t<>1Is
z53S;ZGV&g3>>grITr7v%1GIAHg<FYwjPLiy87lE&MX|=T+cGu+E5rQ4rC?m@p0gyf
z_2<fM1@61NLvd$?V-KypCup6VxY};z)24!J<!ob!jvl|y3snv|AY2*$%_*0Mz%UH3
z6U-elD*mukc1OASm;^)UnbSY3S*=S<Mwa2YJmH8Fey61pYq$=<-E!!Pl@hn)H)Ryy
z<y{E6o_GsSv<MV!HieH8lRke>?g~mi>7M*GltSJ;g(MT~GUQ*1EYXsw$h!U~MRsUP
z%Qap(?~fu|HDzowuJCPOUy-GwRBPMhgTT^Iuw*4(C<reg57Op|)%Nrfux}L%!V4wD
zij2gHuYn|?U=#){O^VY;#c6JU^d5k;9QI1Id`q->Kss^Lx-4z_*T8=y*><fzlB`-F
z?|(?LhSJhD(}MCK<1?`$MbgqiaoD+gIKCMSQ<BA*D*j87RrwaDL6An-cnMjQ@{wdD
zkzjNN80X%uFEoQ^$ud-yQNc+|CNO13FQJiE(^|qInRZ-nyE)2ST~%7Mxbz6PjKnu9
zTLZ?p5)FjBY#-2V!4M@<o2J!_Aj#+OCz-o4GDohp5ucUvC4eMJamOza9nQ?MOvdZU
zK$I|X;z6y54779x;gC(d9;5ULlaqBN9;z%8ulE)}__*@Py2+BT1rSUI0a;Tfvg5<F
zWXFL$F5^g|k9wSlYl+JlCMMf%XC}KB<$EY7PTbYYx0Z>?#ybq!>|?SsWg_x;FFUY`
zE5!Rj`7b6Wn*o+|EfL?I(;8_XtC2-Fm-CIZ$}%xow$DG9m@KL7%oz}>1{|`=ZR|>P
ze^x3&+Q($ig&m2!7AIcMEZ`;vgWq`j`dN>)%HxP3<$jwC2nIti*@(SRE<4SHWNW~Z
z%`!|#)^E{ooe9a3z$6smkiFboH!<dtG#VFAR`>tX4N+Q_-G^l9EY9lQR%gHlP15?0
zq|JUxtKi~Y=lm*|kgQmxNCr4DOn$W<q6Ey!MnZ!2Az85Fvl)c_UMtDHG<`76>^(}8
zfl{FptWa&9Rx;Tet+HEfTFRB>k?peNY59!GYrQ<iTl0cDm3~Y~R!Ht-UU}ZL_9R~u
z0?$JDvj8MizM`OAK5AONyHcnhEJ03^u^@gefJn=Oq>JVJ_~%0%K;$z4_6*s}sLGTx
zX?j6%d`K`QFY6gJRx&cljvYLUf2&p5Do7_3Nw64i5s>n&SEuA$>me9YoR+VD6c2L~
zo1iO86z<1e3u9qeW*Y9uXa=zu(+Sq<1odqN*KXofMUdoLV0mP`p`xNtPdg_fLEDfZ
z&rj1aB<PEE{=6lkj60^Ta818dNyN@1YB3(IYGPQqxAa1UCNB?Ck%3~B@0sE5nH4}#
z@*s53B9Y(Aj2dsg1<@4qzcbibtq9Gxf@17J=+Z#DWk`o=LWinZ=Oy?dvDj0$+l)zg
zT?CDnK}3jk%E<^~`QKg7BHR|>Ir}xX&o1GPRDujHpGb-8BY=j`G^^f9)q?ESbF_nq
z_##x>eeEhj#y%#?yxeJi=5&jQA8PHhNHFqPl;3K98D^rhrgSU;GG<6q8o`-u#h+h=
zDCyFaBNFy4Sr0I=z8YT&5~U^z7J&%~gb-5jccvw)i*IO)KY%bX@Q=mLQ%}ve3E-HP
zY`j#^O&9SuM)u<UA|S$ie9N^x=eH6xz1sKmFzAQ_P0PM@%pt*0SH&#C7X?+sJFYCE
zRs=CiCNrSB`iUcEw02wQ(<>#!6kx>;D%!n503PFms$6EO2_xix;^4;qpz$q;z;^qV
zs+n<AteWkkN&7Q+`}Uv5<K;~94k?3WgsQRg1WDyK_3c6f99U+Ch#g;E*@%~^KP2O5
zZ|L2I0tE3)3slhLsy>ue&}4V@aYrk7Q&>zPBVKL`uaiMkv4}@TW$TXzMdNFrUyd7h
zgE!Y7<0FXzjt`0c@sg1s(J1dl5fk0*SizcDyl32j41B{BQ9P<$hy*h31B;GVPri@k
zN<J+v1C}M>Kfd2<RnCajBH<gf6O5p7+G#cT?Kq~kZRtiZM9|a`@y57elu(gDeXB|X
z#O6mFvOCUr?VtjeLw^8Ny{7dl!bF|~l8u@%HY9Kz3r5wn$_SZ=X0}$yg4s{wHx;4M
zTzDZ2%{U>R&7a6z1(n#^WpqJu)ODeZR^?@gXaW%}>aD-s%G-d!b3Mi<5YQ)UQ5xz@
zXP0M_fG=$q(v2PWtd-5guNgyS*W!?;K}wwQg8s1>1k{+Tn`=H;f4fGDAG(?LRtSnm
zn8Zs`<0Wkf&lQuzsNmgH=L$=ySqC>^RWKhe?mfOun5!Mto%7m(D3~lsh_=%*QN>s8
zg-cMt*eH+!qMgsXXit_Vhzlifh1?jZGy1$Fy!}O(OPs%yAi3S9UT;@%yxpkMPTNC`
zh|MvWZB?(2-IPiY;a^%0(<CGiIfp=pgwAptFww6EMAzcjOWT$EsLDgJqiIRp34cA=
zHXMQ`#OUTNG8Hc%3nu*WWOYGDj?@ut+67&Sga`<K1X0UkFno5{_2pkqmMDP(33taD
zE`Wu-Yc}qlkca}&wG!eLnVc*R6#^bhU~;lx0hu_g3}K&>%?Q#QIft)0=TdT&Ibf9>
zYVFa6s#JoANXT($D{noUXeCu>y9Qet%hOEoo{nc5*#qRnT9MoF2Wn!qo58ke>Uh#K
zpAWH~@m5~HAgb@Q@FQg27n;7Owf%@D&T_P?qz)n6*>TT5o-9UN6$<KpLzZNEvdTW{
z`EM&!O?8$<&DY|4g2VAt!od^6d~1RMt#O7&w+uw_20h@2!($hcpP$<IWC?<}W5&`6
z^@6lu(FE)X$fbum`loMU9qX}_SXGsFUFCKGhNEP`Sy7XE9IW9iFHwvChLrc#`d}R9
z*}Vh}f>30{FzOMOQor~!UhY5wM`^s+<p%AP&LWREJl|7%{h48hWOiJzzQu;LYjvlZ
z9HF6I2VQNU+-ev>>}wTPSiZR;Xd=qC7pLk<5G6zGRATk##R)Pc30S>E7hOEG)njHA
zPQuG0o?(mP*kuUUIEbfyL9YKIt}X&@uU3f5kMKfg<qxjvFyj0(mZgV4zD!ltqitd}
zLcUZspsNwvr-!f6!*9o)J{`}2pdmi|xV5>qZmgGkLYE+hm*+~+qK19#eS#?fNV6*z
z;oyIEYq81~z_--O2gD=tdA?^$DQ7@b?h0Kw#Nexcci{j{rLqW1xp3#yBkT~fjWkwu
z=V#N;_j~${C9jFOufNm3{d~L>r%&a>^KV^AUR4hg7WjN8_Q(sol!JXwZ2bSh-hGC{
z`S$&y*Ud1@AbJ}uI-{3}E_#WGE>VL7Q4<oK=w<Yhh(RJc(M9jQMhn6qI*CpMvnJ)=
z@B3Nz+RwB1v0tp~&Gqtnbsfif{>t}*y({MXtp@)!>0z53j$DmpwOn$g?Uz02BGe&x
z#L=|ynjFGYj#ZvsZznBJ_L?{^xm`PJkEc>?5GzkWF@Kwky_+Zii`2T(m#l+QC5`VC
zOME1LQsArH2v%)SeQm<G^jo}wh(S=997k~A{28{OP5?kdD3!8<`MH$&aIaWY@eP2a
z{kI@kWy{u>mzGr<6{LgnT$b>Z*M7l!2w&2gR8np?@WWX<&pO6EmM6n^y}LrMNxOQ>
z(FHVH1&WFXFz&)=k#elsUpZg2fug)Qq8#$T`=1+X9Pjcp*v%>Vi%>^h;fr><@#5^*
z^`M|e@?mGYWL(0)lA-kYcFC+{37KzkcRMLuUn(lKO#Ncq#A<>vScY4Ac?yLs01uG1
zHdOsuA$#-M3b{B%kaU5g0Qn6?sDr$3xf~4=`!-e4y9$^z!dp@*km4{%)b3rwH|)lC
zmqlOJ?X#e!gZgIdbH&<rg%9K%XjnFi$-EUSkT;O;dg3?I4sneJ8NCL4F~!ZbHL$t7
zBr;4!uUrP%BtusrqaklmDkbObciP+_(;=nY&>}!<Js63n9x1!^#d}zcU<x}}#?Ju;
zOk`*N$U|a}(^R$!&Xko2$2k_tD$Yz+K2-#C2;VSQiDS9Iow?%jiNrAhX75Joh$rnW
zl)V>`rqYq`ezonZI=eQ4$dNUiLgdL6d)?RSX`&uySMKZO-%7)pEq{%&&!c7zQOgkE
zW|g*J@}ke$)HZu=qfYcyS8}+gvBGU*vg#>i>DW_s`L;lj5_F(EJgPE){Pg7uHUriT
zA?95Q)__+OCvG64@)GX5J??}bY>RahIB??w<ZmGE4ShVU5-7JL;qkNXdX|{1jL5RU
zn&km{Upp!DEx|qdQ0&gQ5jS}!tVQwt0{WzW?lYU-gCpf7sUaTgWcf*&gqMN3Qa}M$
zN^0feHNLjZ%Bza@a(M4Pr!|8r7XJi_^c^inlX!ck_e{@Hgc3SblECjQk4R!g@ku8R
zIYSy|HuRny<}1m2;$R-XVCrFNKMp-65|Bq&SEe)U#TE(qojfZ9Do~zA0f(MJB9JAP
z>TFSg{s~P_FvZv&zB2vbK6@868%-&rAB?0GhyK&XO|=kao<5)>%)S@Mnt#}q=^F?M
zAmGy4V^5@z<{4$A)hJ^smE36{8<slKBcQq#0{Fz4m5aso%FZ47pf`WczM%N^<_EGd
z6}AlFS5M)!`0um#nK&7Jb7v}LH4Xqo`JWQ8ZbS8k)8DlCmhWyC`5p^w_V~1sF!imw
z+NixWJ4oby^`s<Bnblm$QiS#PUb+V>5Xi=rVWa?T8}fO{rYawQ)~o-@p;)9K^T9!4
zzKH|pb;^(K6UC1RZy3s{y;QDL$>Em6ZL^K{VkEsm$lJAV3qd)adv4H*PE*CdG;mO1
z&+zSAdPWcdTT~)+tVDK}cv}mw64osBD#`_T3n+^DCC6De!{?YfA*%aKx#`Ad(0d=#
z9bb;Oh`PVjBh8r2TV2g@|C$}kuiNDYqRq2oN<^fjzgaha@$!BMG{!TlFu!U(eXFGL
z_(`JX+1_fNk2@lel3u=YYJkNVxOBx!<8%xM;UK#gcI$^SE4B3byE6N_?>A-E0>rz0
z-)bC<%&rmYh8YEBV$|p3**#A7(m;4p72XSv&4MXXvPfN|A5EG~y~}ht47ie6beF&4
z`NTsRt_-HfKh;+0S4PH=^{}dX(ym|>N0m4(85d4=Hk7t+`E?=moT5jk+!!Mw!XO5~
zcK1QstH{GS?|i&)6ZhV1n#XW|9C^P}%#Vz^SO@qKu`XmFqYg482GCFzn*kC4)I(xT
ztPquRc7maMp)-MFNvbcvPQHjC*<A?x>{o@S&m<FN`<UTt`N3>_`TZ6+%=mXl&{1)E
zp)zw!;cO~hzNcG34u?12Y4n8nVOk?0;f9JV3?$*-)z*x_ST0j5&WbWj>2qkHfgU_q
ztQV+ZjYa?T8EY_>YA8W=Wi090axgdMEwh3+T%VRUKvP&ZDFu1#lUl1=%Q|Mn3j08X
zPYRG5r&N$EsNz)y(ztNFPbg;U4=T#iHe_Fn38dXyY6Z%awcG{C(qo*J=+gW(80b_X
z8qU&wI*Yhmsh!kSyAgaos?Xf1V@M*FDJI-Qq>o#*iA$lh9@dz^e8V;=Uk<puG-+C|
z-l|~Q2Mt?-SQD%Oe8n??pq;ov&grPcasoY`9EdvO{=tM$uaTD9OR|g&ja3l_L&{<u
z3p`q$CFY)yQ0`i#j25eIY20#czq9tta~wNa{IlV}eIdm5`Wrd2Cpyn0#~BCAyA)_=
zbi#})vvIDk%cH_?2C5}y;~d#3i=^KSd71c%V})HsB4Q*y;_x*mxt)etf$p<%_g73w
z`C1PoZ>1Jgz9z5<RZK&X=!M-$%$0wgf79*B`)~%4e4UGY?Z-2^xirF=1C`3;Ge#-C
zb}Z?H1IicW@9K$P9Dy&*TaB)@VELT~6w^bV$t)4z_&GC`42Ub6)*->rjw8D4um{Fd
zPxNcrl8W7mxy?ok^s5;}OCoFv&G!2A8}}zl{mFSufZwKTZY008t>U(&e=t3KRTLc!
z>~QC#Z?fq!sW^b%!G8A1Oof_$W!6rSJ;~GA@si2%;_F)vM6S)YO;*>qUhrCddoo9S
zYE{t`&21f2Ki&88hz@<;bQmW1_(5x`x?YLTuDE|@ha#o2`*n#sd%x+7wAi~o+=s6G
zv-4Yzp!I7ug^yLQEub!vJ<<{pxc)$?hKdpl;`QlP0;&dVcg4U~Pz;VFa|0G90-KoJ
zNlA$7g*m5QEj1*@IgoM=iErT9Mlz2{GeQzXwT*zRo3|0$4dA%j1$GHf1_!zgEXjZJ
z#ILi%gIh)6LB+7UC1UoX9(Y?pzfkq?JQ9eqd0|D%ZqzN6`!+U!$C^2(y+`84eo9(H
z5Vwp`Key9fWQv0g`x;f>^&8!>Zre6&L0@|eb6wFq!J4qT1fJv2-t!93C+YXoLnbc|
z;@tLDVDD2$^h6J%-|*N8DN7DT<O*endao&eF&}umDwK<AxTk)Ns+&aXZG<-6B9Xyq
z8+DAcknyO6yEjU_t@xfZ8cHw+Jg#YJr8q7d_Rx2yqy5mUe_WpS(ZLq2wvHwrSLT0L
zTff`5XtnjD<3m5%xkZYT+F~LHOLkHkv+F1Cs=A`|;k5I6$tMjPW)Gh(&@OzPJZT!W
zaC*djli@b3yBYXd`0)YlBG5oQ<byF5U*hr%A)Xt4`rB<+cVt^nh(h})#-3BXVJo-c
zX^-lieTQ%L$Q#y*{JQh|9@Mj+1X3hw#D;LiI}q4p)yG7NF?bOsbj!WRb%T#bF!?-b
zKRr8bA4r>bk5|V8@ui%N1Bu<<+@;^@o%iG$870Vh?1Rr{*c$whIG9{G2O`EH2dW)9
z2sbdDL^*SGcMADBWV$ud2>>uVmWlUFy{Q1E%H52X<`xc!AX@6xHUdlM2T+hS9(7D>
zJy|mr6t=i$G<CjOs(B<C7w~*dE#%$xyHBneWgO)5f9)E@2&Hw0c3lGq2aN_y(W+!o
zvzcR=@^3%N6l0;JH^;ieBKJ7!vFxtyy1zi6%=wENs@4bm%1n}F*efzG&vbQsmwoQ~
z)LJqw&l+5u_Qr10Pfr}W2Xv59$W6Kx=Me0upw72~&-ND>7ieW30AFFaI4Q~#s6lb=
zgTKZMQe7fT8A`vUx2_q3m!rTRK7XE0<fo!>UVa5VO&+4+a>75>YL)b-^+({W^5N8$
zuAvB=ah)*e{msAhS?uhB@hXT{(An`Jn4y!;NDu*dkIVR45T7j}fMv&J<JRSoEILC3
z&Is}d0H+;cqEg!htI1+&mr*Bb6V&<>5@2HOlwg<?VfVEXye)$?IBlS>(tUC}(9fl1
zOxsbrxRhm`dS%#apK*gmh&7$?yx^Ryn3=1Xc3jyMDoSAdy?dlwS)U;!osL`a#ngJ-
zl=?`*y#k;}7B*70jLrd*lY|IbbQ;Kq6-`Wh8PO>mN7f&($DFm>XR&?>#nFSG(T(6N
z@DWpM5u_rpY4}Op;uiMdkhtt0*sL6>6cZ~Nn`OnMJA6fnS3>#xCNy;sjC#Rcveeh=
zK1%b}kt8AdyEYraN69)0xEs57Lubjil+NL1Rjmaf`{$Ng1aSCfWxCFlJN$V1t$^21
z97!Zz6efLHD+P7wUf<rDr7W%j3}=9tvh*g?S~O)w9LKt<XjcFgZZ>#dj&gTHYaolD
zqm#)VR!3aa#x-zB5zktvNuNPP8&US5FAG>2&6ZTm7PrHez<V`o2MmLq2$r%wCY?jG
zvyx++tb(kpXm*x~dXE)?0B}6ksV5#F(vzdh*5!JmOLrrly|kRwjfoMh&MIPZH|x$e
zlrW?Sa(>RTZNa=(&O|0?@uFvpHxsMc6@x23o-b#NtCf_WjD!}YZ$Zw*$B)vTS>i(H
z{BoMN8tw*Dq{hM2!PPWbe2f)b*AQF64?mZo*;$Lvg13ak5`?b37m^_pR;ZxkArn%1
zFRV=_qL3hbD?!ABOvK>5h}A7oi335~_reK-q9SCX*Aq6<<xn(ol??X<MpwuRphY1E
z3zzqCS4jmo1kvoQ_-o|H7ctmM+>&o9HVST4l^kqVk^yQHBxNA=%og}%Lf2&ADA<sc
zt=6@@NU5oW>zxM@k(i{T52w$V$S$2Z&*UDXD@yme`J~V&D~3cqadkSGT);t#JKw5e
z6kWt3FalHZ!~N}hLvl=d^5m7+Tzac~!t(6ya=eMH42KG+P9}WfZG6okg-AICiAp);
zD+)RLiekb_>P||p<E5{e!-9zDdRhQ6uAEI61jnI#I;(u27YU+dDKS6{H&i@VvxpM&
zIn&7G7!#DV-LYRMd}0oe&)1_XasOHXk^UO34jxc%6;|(dU+8mJ7_KBK)6=M_RL>{X
z;Eb7caMyA<)NI#NSB}w4NzghO*P3wGJV@lay;u}c(4x``pqaRc52Oln=R3@j*^sA+
z@{cJeU=X$jrLH_)l_PF4C&3txo9q)PtW=A{<VqTD10>BGXQBLs@U^P=Zr`RetkOOq
z((jkkw@>18BsVbgn157dz(i(fuV=UtZFtRG|9J%oY7VJi$ZwQ%n_wu*@PWteIP%5h
zDkG)?qns)!GGhJWBqN_BzJT||fB{N#3m}ch&2(m6r8Y_&ISPzQ8deJu-B!ksEE?iv
zic>k#IZRTh9OD_L%_})5hQ2va-<krG6z0mw*9riz7LJ)~hTxONEXV0vDBPT|$|<M1
zSBaf_d(O8QTQ7@>^~!C9<YE=kISmS%+oHFXCT&`Y?%kTSGCD50e?04?f3I+yh+~|8
zZ_w5t`QA~n-E~nru!G$fUi;?>Ht*HUqFaO+aPNfcQTE8v-~?Pbu1Yb-6k)|ApkN|{
zGBM^IQ|u!i6t+U%Rm+a(J6<r6^|Vm3F5;cMS4Igj6;gCDA~DIX1{j@TlF5I1(1SF)
zz-0Nx1OeL@Hym1#9IEv)wL3qY=PJ=Kz%XW{v|iA2<t?)B9dymmbrTcAmrQY8;dK`i
zb`ueEWj}H2=JgPG?B0B+X@I1|fZM+1ePnQAWisW)ebTD<*u8Z8kxR<_qZ60Wq?S`A
z)z?hqDju9mNn$v1lzdETy=ZMVOZh^M6w8V(dC}pz0)=kKl{r!G3k&Zr?9?pFoa0$$
zM+YxDawOqQbmvgTb12O;lBpqt@ibfX{vu(-9#z1V@ae^(dj@Wq7)p1iX3eXx^_i>(
z$pgq!Z&26H(oqH0lLx$x5A=IH2NMqz^W;KZJ9Y0Q3KsDUV!J~6ntWc%Fi<%qm^XFS
z)G%01pH5%gv^P4$NbDwN)J>Nh-6Z)Z7p-=dcCJz8H<OthY?zE>Lwydqy)#mMPnrEb
zCv!Tr0!omuL3=!3a~{|terhLhm+1=M<b!ggEn1u1$B^aTXHEf>c-DkGzeRqplFpdv
zaYpgv^yV|A+L+<Zn1k96$EQVSo<XQn!ab@vKpi%SI)Fq1PU-cG)+=Vi-Jb0h9N#OR
z-pifID6Tm=PQuHR-%F4!EmrAN@v&aUW|kSF$dhn)bKGpv9<(%TAyk_ZeoHBWoh3p*
zfe|iCU(gCDO65Fj0kDc>?jr2*+8&~eIy_V`DVi|C!p1mK03eRKcmsX;$e}hnV*04X
zqL<L;4?LdRk3Vm%!|w2Uu~GS=-fNZ=lriCz;Zm9LV0;EC@nX%3%V=DHlE=V<GSkK&
zv$^u+utX+)`lD}kw`&H)nvFcxsKjqeWB`Iv(*mi=Q}2P$KMxw2wGi;e1lAhd$5|3Q
zUkvA5Cg8D35em59FUqygr0QmrakUkUv`T_wf;SPojjIez2!=6N-pA=-lbg0AXQsA?
z+a-fy!)gSG_j&ocItl2>BAVqFXZf!M3v8x8<h{#Rl6YQWoPShWSo(xZshXyEFyOrr
z9o=I@>yv`cnS$OK#SfcBg}lY6&a`6N8mjx;nTK}3qGUcj+$Z_Wj0CfcGx}V?)Id|}
zjH`>{JHd>0A$%aAxG>|At$oc*Bwb~!b>ruvPy6L>1S`b8Wo8amq=}SfKB<&=I-^Bf
zsc?<UpuX}bwfGKgbtIErAvy7O-G}K)MFo@UYxUK)X7gNVmxnBB@&{`o--Vn=noV$m
zqgos@vTqj7zAL4zuP~{v`S$M35?P*T*n57)xqycL*@ofg4MK~A!qr8@RMm_L@?=Fd
z2Il0c7P!9O8s7*uWe~M(errm*)_n4`>4LWTV3rT8(Uex)yi?z@Kx=zbPcua_Xl1$u
z*R*xxc`K$=C8McHnr53qavQ3mjwxe9w-nlt5Lkc9w9}yBU4ENL3|=@|m^I|%3{K||
z-{&k(20ePw{dBIo7fA^7coiv6AK@MHVu>NjJCdxYk;psq#2uH}X!-tZZ}FAB*XPrR
zu||ar`laUy6)*bgq;#}}`<h=YN}CMCp0$i**%!i#<>z`^D+dN|^=AqVD$(YDctMi%
zr3mT$Lb)N$`-)|35B<z-NVp0El?5QgyanE-lq_#?6_-@dqBn9S^&1rSj`IC=E4mpZ
z!Qmuhmjy`)612pm8@Wmvme>3Kg;G|0D|+ucJ&UCOXvnXM#PnmErO)Ke+DUuLDGRen
znc2dF`iY0)Q$ZP%Pkk~`9}y%yixZ0o@+G78x`ydY`VU@>Q!e!%GOy3Hd(EKE>&AeQ
zH-o~xTLCe^a1J@3gA^-+52y3F)@jz5vL(M_An1Np&vmx%!mQl~#!o+lS$BL2U7s-h
z#!05c;`AA!rt6EGwFR_yJ``VBqMl#;V!D`SOvmcG^x(F2r`L3T<C56rlECHia(WS_
zS=u3!>Y_n7$U-(Y%wgAp430%T4Ryg`zLICFf4oTY!W<OBOfoGiEx)wd-2y&mBEiYE
zWPLra5C}SSW5A+vIawx1c4sBHGjR>EtSa`2>{7FtVY$6&D=T@sf8N9mLuYh;@@>YB
zmB~){Q^alQG*lC9T9OK5AYB+$9^<J$7_`KJMrKI^$Y88j955_7m`MV^BeU$;7JH4M
zySEi_&k@9VY`QO-g!x)2=j5MsV~Px1Cqo!)fnRPdFdY3-TNjRGl0P%rGt3<IkO1ju
zlKjcS$T=)H0})aT7x;P5D|`!#TCF&wa+f&rR4~S1-@8g2^0aqwbcOvyDYCq;8AGh=
z<j}&bzm&gPW&q^!s5|q#f8l(X@j^`enBJZw3Zsi8{AROx8DY<@ltAutOllbGOZluQ
zTr6sgz=$xN%X1*1?noxU@e)3``-UaG`5~ChxFJj+rz`3t*^u=XZ`M0e+!SiH9_<*^
ztKc#|M{l4|?m(LGg~vLS@6Aw#)YG$bpm5$umSQB$^$6kovDX^UC4C4)3dZyG3XRR4
zROC(;o7O+k6d&q|e|on+{d(lhm^dZ7+3IKdHg^XZQ^y89#qUKm`+|zeUj&bsoBO%%
zNJojk%{ED;mkH4T*t}?#t~&4J=GY)pPl>#i+2|!wxjy<z{ke3sWYy+G(erypplj9o
zRb|$*A=kkXaTYaC?>1E1WK0@d)suP>#@`b~@nmbDOu$NC&Vt!k{6N`MDZ8Dto%8sk
zI1@F?C!eqNxGSKvr{~Gm_AIvZ_ZALC0-d5|nlCTTzkNf2q5AaW%20=XsyHPXTs~AD
zxqzivm$}2KGuxCBnKA3|jg21iK6B7~P{(!V`-!pFfJZsRMwh!R%$zTj)@OY%htO)P
z=zN$}%xNQDj>!R>b(XUJNafQFI29&(6@RBaR01@FZUythaIB;qP19I4o6L=#$Cvl!
zS*89|TaUYQQtk}0bW=vIW1H}*6sWSxEXT>S8=N`_5JYVRC)gs~1HJBLg)l_eWk*CL
z<RV1m+GriVu1`kiD8&Q?lO(-V(zptex3bU6_6>iZo%=H4enCO{<a!=|oJF=w`+B+I
z)f<P4Tv27v)L5gB)_WoBN0`f+C0z_#<XMG${SFmFqO)A(9A3ghf>rA%S9Oy;YnsB!
zqZNx_C~oV<1m*sySRV!TlYXaqO3rT%4f{jtU!q6Lzugger6)8Ld5_vMxcT$UqhazJ
z>$=4TxRk=gJgaP1HY}g(i92_WwV6EZqIo#**6!q8VZY!<y+;({H)KZ(J8M)~^cl@u
zZ)-B1bu33p2cnzclunDwull4JBVD@X!J6))GCp%oQt_TxSw_lD=RywWJn{^zck(L~
z8B+#>9>}{^Rt-^9Dr#2e$<anXnz`Q{>0ZB9t<?R_hF>(6_0yoezH~^Q;mDNT9_Hp;
z;F{O*ObBC4ZI)wfI&l1QzzS!<RzUC=8Ci#2rhJc=Ih5`rTyPj>07soqJWI|jv0e->
z9eT2b$;Wqp84Y1hi#$R!O^f?9_$1%6jg#-$sRc7;ZI&>`dhZtztJq%c;K7Q4rbHiv
zGsW*(rLp>0$7^5BA0NXPxa48!Rl_B@MRdCK?foEg+Ac#vU<aXA1j)@*X}`-x>QZmi
zC2IJ}G|9TY(WyM6`yw%iX*SJ`9_3aQ%oyW27BU@JFke&)_%R&^)0IjnUN`153wYbZ
zGw#LOU~3Vwf)Sx}Z0JlM1|}eJkv$^Jg48<@6QE&EEA<uwhX>iV3@npYaaLw@!i-FQ
z(ZNVGu9Peo7aGVTCw&gX!p~Wc<$MwddIu+~vmT3q6_u%c^+ahHk=o&mMY}}bwYPwT
zC*xpX_~XlP2GMCF$uKcwF@(m$uO4#vi&Z;?9qy?x(%?mkjc_p%CE@}vn6CNB21Mxd
zsIamF!==_O6F8r%I!{w&IazOTgM<UA<-*m{Yj48oBbVv6@|2~H6=N|lvbCh4-LmC^
zF2RS<OeCB@l~35F2Y`M-eVkrCO;@EPjeBxeB|w7a59#)w1G%wM`bw=8o_Yp$TFnK#
zaXiM<J_*achW2het+Ae5<~>vGvIx6%-`YUO&RFz|eWvaXsY}VL9PK_xztn0xHF_MA
z*P~9m{is~5S%X=;q%7Fj8k24<ppAUfOI7VomMHa6C@ZSO`I)FYX=b&3EMH6Ob34nB
zD_525uML+459J3j-i6`{B)7y$TQh;x4Le9JuweG_?s*hOHu75&+J;!N$x;$|RIcTr
zK@7LE1`ftPmPAYx-S;RobzIfhwg6|}Um<jb-;i&T1^MtK6y4(u;~>)|Vx5zxGzv@O
zH@5&dyAxeKw+kZi<<j@2@hI3=+mykU?7xnMfhE!EPj{kXSj9UoYF1oiQ(r)?uftp>
z+>6gs?u@s+5eTY+q{v7S8gF|ngCPBFS3R;~6#C>T-aYS?0)?;-&AXMwc_dpr#Tt1{
zAe>TXj>pS1Ym%cm8N8nt=w#&zCOg6=i0#E9l_y1gY}A<&)X^CkNH)**99O8W{P;lQ
zo!m<+Y09Jq&Clh&{Rv1x5BBa17Fm3_`U!<&-PKo0B2$qh9^L^UJZm5|0kb*Qmntyj
z^<2IZ7}BYynxg7;FK@>fFGguu<C!M8_haU}0mibi1pXKp5Cq1jN3~Yx6V6=xgjOZ@
zJDu*HW=E>`ERsLpY?lPOSc<^{u5XgybKb~{5t&>fEnn)Q41b&O_8oauYD(`x|6Uwf
z=kklw+I);@S?81K2<E$9R;rVX$h;yFXO$A!lb%2lsb{NPTW$j?NjWkBk%oK^TM(`e
z{^A`PYfq9S{8|8tFR(>o*gzX2wH2<2;Y1r3ltWsR8AUhVp{IhZjPaeImv?18b=mPt
z*a72#RV#Fj_JVb;SnPHlh2N-50k!WYv?rGFI^IT`t|`9Hf299LlgOdi6HD#^arLmy
z$1PYLdM>+aB_*xV&}I4^dxO?-xvyq}2dr&cZ4-OG_Cm<ogjU(*ihtcO5eCT4sAo;|
z<R>$WU?+l|)MnkDIO4+eL*9W)>r8*K8vZ(u!!Q1zOjGKHxe$`jH8gvo$N5qCEb>Ze
ztqz1?FRVi2*7Z%jt^^V1$Vl%`I<4Y+m)~5@M#y}RzTPg=ZAuDH@Lt6ellUz9);g68
zV4f8XuX8UUPkZmZK3OfX*}!xI@jevAXnTsDauyhy=h4_G07;CN#&~2<(R)P6N=#TK
z(6WeYysQcTFi^0l8P=LTezzukqJsEw`oqSZs2imu_tl_9_Pi#NCUN|q_f!f9uYV4H
z{AEr%1@vwf&CH6A6*Ieo6+Tr%t9mFt;@>?T&_3EtCR7-{@`c*RJ6TF6Z;bL&O_ZJ|
z{d($D!<JF+*Vea|WQdwUSb7ODUN0ual5xj%uCUJPn#-dOeDiJG&{)ffP@)DM$>t{=
zvAsdQr=6v~`!Rm&I${0<Z}KjTB78`8rxeela+{8Zhb6a%9qA>$5J@#HUkvq;74v7I
zH2OSAzR}K}uYZxbJsO2BT{2c6P?Wf%KEP4p9*7^!o<4<~FYcZ{)u=y^B*3oA?=m!?
zFX^G!J$yoTTHjp&Z9G5}4w-@D`64{g0c3lhz(^!vKNPTfQ>!dcYg0%1?UGgqhW3Pc
zP&|ZtSw~vz)ZLQ}xC{$g3ucx#gmCo)uIEULJqn=ac*av5z$eNy((>>n3Bf=Xlp&jl
zWBL)j3t<fmeHF!Z)FD(y5LaQ`67&F1$l`s_fk<}Vl0FJ?0R&7S0uwsieab+#=Ddy^
z_?%dwuBYzmun?<JIm+PcG!)Nn0m1|IpJA+iCufJ0pmzWvck!j&3<;ayxQ%1@<t@@V
z<9H#{_>Yqe%-kX<ZlZ|PbvXN-adG4DyM+UAM<aH|MG`TUbUR#M9EHVkL=9*Ax>W!b
z;O>We1ib#hOBmjM3!WU5<n9`9l?8}S!%|oDEA$|#Q@KN)9C?W#)+v*I)k1NJ5w_iK
zOc5735k{Rhax>=iQM*cP&#kDg9(>R~QK`;TBpjDn@aBhga1)GTZpExNEMggEg0u^B
zJQnPb#XH*tDv*Ldu7E$qM_vNpNJuOOMbr@>{*7y_+kqFM3N*3|N8OpU$ypE@2La*X
zZcgAC2~iWMS`?`yP(Bhvd$Yb(fXERx7-xd;2ACs1eu!1InaYrnI$krJgT>44TiFwS
zOt4)X(BUyk`%ISa!*m$2os|uVhxSPlMOIQ)SE5#U@;$7iGcsa5R|>0LtgE}Ej`k$G
zP%OkMxnG#Jc2|l|ZwlX|WP8q3i}K{J2>?$d#XdBJ)+LoPAmy$FAg29>uWDKnr`5iA
zYFe7;GgYY_9egV|@dgrns)N4(!_$K?-Cf6ZC<9lt5T?rFjxB<-5V*!Iv6qNcimdda
zjWh&jdPNJKgE>hm5(lvXE&)C-@1-(;TU@1f3CK?y{VJJY=V0YbiS}k|InmziGruvc
z@7}Cz`c(w(%<tZ;4y4WqvbdYE7!ID4z@FX!FTx0!;gAXly@za|hwRH$P83-a#B+$+
z`8zlZ%^)lg_zuqQx<r3?$qXe)l}$I+fh-x}fA|fYwMQm@-T-^}XAuZ6ks3q3Au@60
za0k&H0|XJRF@!;q%*)&hug_U_1hb$8AtT9OFoG!y$?||hSU16PvXE0mR;<o<ZT1pQ
z>|l<CtCFoInZC3E4mW=VY|RGlVVB!uH|XGN(d69ZBHMGut<1^6?9Oq*c;&Lm<1~Wl
zx9gIH#JPl0s`TO6|HNi>a<ylO7vbs5Wp5%kz&>Yh0wkY%88h8AhQuOpy)CdVV0pG`
zWaTg$M;Zq-eX9+9lk<*C0*&GBy6j`nb77#sDnF>%R5Uf~kAJVP;LR?b5Jt$p4t?9#
zg13@|wRHuzd$W0wul5nxS0RO$I)&QCNy4LeTg&-fUBvWdSg#_AnN>3`u7YoU0AI-=
ziM1zLh#>j+j%3xCV%ZtjLZUdTD<?a>c<(-kI|1Gf7uPGe{PF$!1Lnm9T%{<rt75I7
zGa4>F)v_!+yext;!a|l@<5K)Bj*q*zX27?4`o;7ZZ$O1_g~kA4t;FP898-XDm#$Lo
z5ddvu`32J}dRQ3?Eyo!g*Knhp<``cr?k#6zMWNiAH<A^B*(ukbT8YeJN+5G29#p=%
z3CiuOkfr5_>#gMLDxEyTQF>Z=n;S*mxr-y#TCPpYf&2c2DXrl)v{H8#P+(qd8(D2%
zSpA^C+HtG;Az_URca58RjmLwU$B{K&g*8w6Ykan9{0M6UxNE&<0ntc2ZbTKBu-Z!=
z5lLvije#dsP?exwm-OI=+FDrmyuU7E>$}>T#r-Zv{oU&a@7_ed%P&M<65gSuR<Twr
z^WC>Gv>f7U^|AE?afCSa{q>Do_05D04Nu9g$u@L8Xy}e?xaLgO+TSp^)zEsap_jX{
zyS`!gLF3d`{phvES(C=;t;WH^#@TC)AHOxOa5vCHo0im@R{NV|e@e6PrXE^sv71;s
z{Y_uc6{4pNN3)nGTc}1fn&>xDUPH@qzb_Y$$NM`qi);adT1n_yi_4P5m|7{LT6OGO
zsRmlX-m$cEt@K5{VxuigQLR@RimNf}CXL&!Zntn~yh7)KbC0y~f!Yb^L|#O+JBA{J
zx7)}X8emv$GN4wPIZQ>KR>pxA6;LaO2K2gVyNq``NU;6pK<h12=xv@(xrTNbvSLR$
zyzTouGGm=bS)Gbeogh~-=avrQq6SU}T7`j*6F{fqi>^kOE)%I&*W<el20Ha#lu6UI
zJvQya&MC1hB8QLM61>*sxPSFoRCj<wC;NFf32Bu>RL4Wp7ToeK$0*{54NxD4wqUwm
zo}zAnf$sP@RO>6A_JZy1r=VWxpi)}_(APdbIB9<qQy=9(AFgY!Vo@(_zdwzq%-^9;
z)U>zQd!X>e0Ia;9e{P_Qr-yW|ziyis?;CmiF08%m(K4EvMI^doamU^wEFTH8Q+_nL
zO+I|yGO^vC;n3DP$I`ytw$C$&Uc)M*W7-A{o)xjyZx8iJ4ernlZVvE~s=qZI#Y4h~
z&vzgDE)zci*d~uLT*8Paki?mYJKnY<cCAC07en;^y>t%42cTgl)3K9*fy;*B5{*IJ
zjK2OTVkqy3h{k*R9WLf?<dL#?X1ZP!Ou*-)Twlku9A)|9*nPwshxjx{cy`zhd0IIg
z$C#s0W1Xg~j70B^2F5R<`n+7b#LV8C7LRjbS1j*VnZ`YtP$cMwB_#(&1LMGN#3pS<
zyUppxScqD6HCc7&Tc3O!6Xcz|uRCSrGZF7FCE_#fw!`7a0VMCCYB5Os=!`pQ#Z$Hm
z41^J{S3J#qJ+1CD5UvUJ-kEypGv?(u5jZ%GC~hk$nz{F)%y@Ppu)MA8;|Fp#aFsbM
z%3EaY3GFg;+zFE~#%xyLW@oV(<Dt}y67$R(P4>H*(?br^!#ivh^s_PYAKT3YHW3t?
zudklKh!=?F7wPA%;rPwbAKzchj9rXpyqHr9oEzAg7~L5k%$PrL<b)Gu)deoBISO>N
zpg!6PB%O~;QoUs}v_#_1<KZdb)v=RpB9S0zUohX?w9m(G(kkQn-sJuM9kb~KlaB$q
zi`|0tU4l#J(P~G*Byc!x`g;oh?%608ZXbW{8J6WFL1G}WE!vhfaK=O1vVxbmSXN8a
zZx_Z~7pWPzD2W#)FJ>6|X3gOX3VbV00ZUXQ432RvLM|(pvc|+Q*GoLW)-ANIExMma
zl6VDH_-`)tw3VvxaVcvp>F_PtYpu~PN{z5wUmL}TV=y7D(Yh@4&Ve+fXNggFeOe0a
zvqs46f?MfIVs~dPVrsRgd^OH#qg!4U?-gOkE^a>@h@YDqzZ<cKA<z6t%%lkgHPOOL
zL96$B%OE#%o;08+-bRYkR!z)Smad|5qGF(|V4NI**)468aitp=?0G}?LYn}u{Mp}`
z8*gsv;~a}tz1*5`+L^ioCBh}VyA8ezCE|07Qy=k6?@$e$W+`yG!E%#SCW&-)89W}d
zv&Z-4z?WiX=qW`b&V|nPuTTJ5l^qq<BnaHb3H(e!LY;7v8WK-^ATWugB{rv@e1~+8
zMqtlWV9_)S40h5MA_0S?ldqE^vFE8zpo_+>V6gAx;T_f)U$7$vu8I!zrny<Z{}Lm)
zZlf#shBNNxm)ndkVygiRo2?9=F&W?UeVQy<dgep{ciX!@Mx^<Ly2c#U&wo=Iw!d_{
znZ%Hv>=fNvn4&J{Sk6R%1^Jepmk96f;({wcUe35TuWb8365MrHDB=!}T!7Zl<qm{_
zU=!&{i@A?1#mAuIese{i5j_0d{SsF&>L}?PKC;HZ%o0z+=E}^e3*m7E^9fF2qsWc;
zxV%R6Va!KDS>V{aj9psExtWmH+GI7S?&WVmPm>OiNMy3y{ctoXTZS{y0yf+Tb#2}Y
zb~@p&01=iDr(go%2yic&lSSK_FtE1}aaiVQ?mafca&p{xy!iYf6TbB|`RkKtPS!aI
zj&Z6*CB2+;wB9T|0R{FmJSjs*7Mo9!H9pD~L&Yx=J36D#fvtQPi|TM5pS}BWfg%oZ
zG9g6t(!o@tS*1#j(67rWY9oRnd(ua7iKUsWs$*CA0zXA&vOb1GHxj5SSYAojoUil?
zJCShuoX=5HuW7NWCR`SfnCK0X6~(bp$FQi5Wi&r61F6zHen>_A`14tQ!c18@lfuM#
zbRnB2gfmSr<;dQ17@!f-&UY51xV<(W>LXr_OD9gI>m0cBwSEGB%);-p3bnjz?QFKj
z0oA+-si7NEy^MzM!SZhZqUYUnUO^ley0pP!v*r+blVgXOD#wMc43iV5`9>cU9)q{&
zYREDI#KQJQAW?lH>QjPx*Hn^c8iH!frejTzg{T;1HPr+nC^9kfOn8FrlqTtSH{|Q{
z8b!t@N1OXA=pk0EtA6i#^4M_cSSSRTWBE_}c*!<c>w4hQ1xzfoezG*SRH<E-kxaNg
z7BEJZo?5n8kQvKzyiF7I>Pzqg%(t`>QE-Kr6PPt1nT<jYE1o+_khT430X1QS*QrE%
zsZetMN)(%=-dZ<+-()G-B)Qf$jctZ%m7wCzQ*J(%`+J?Ns!|8|6slT5@+nQ1SVLjb
z<)_(Tv#_t0)VLSnYXqtVM$8P$@LMqj1Ho2#6~pDbohe0lNBC%8)+ig?_0lq0N1eY@
z_?D*FO64tW8C(&)v@ok4GPEyiQ=+bWuqJ`3YuS54@nYZH4%mOXp`~Da@wSR+cwFG2
z*j)s)Q_#=bB05nhl(#xdDq{Z)k(_(oD<WqN6Zs5j^Fbm5!-rnIVcPB_B&GcBS^bQ<
zf`=3WDpK2Bj7CH5gW@6g1qJ|y76FA5?h}KMWTh^Fha(>JOG5KDj}F<vG4FtbS)!~_
zRSVMhjZR+z!vl)@`=bn}Qr_RMdz@vJwVuM%9IVimk!~KK1c|>0u%y#Hd&bOg>t=@f
zh&qvt-J(Z@OXw(DZp52dwrZ(D-J6*qlK1o9<i5LKSlSe=*RVhGddquW=e@!@)e$?H
z;Ij^nsq*2Nhjf1Bz(+L>ICApVe&s!5JE)qC>e<DRCitrdcUuA;bUS(kB{Jzk)7JV+
zYUpyK)5(WnE*=Ym<a1N61O^!`XTtCaLR2i*B|?e$$dX-<f}V;V2&AD|LhRw2=RyqW
zwR%t3dacvUh`eI^6IawuC@%Y|!?V0f!hGaK{rZbyUCf<Wj`?40v<vy11qVMU^{KvM
z=O^n1AV}S}sMUL8(EiTnWFb_>_v>29-L2wNi3hJ9AHXabil^=YW}H{(tE;jo_Il*!
zT-$jK6}Kr=09UYCssY2Fu=yWT<1e0Dh&wIbU{uiwb>rK|jav!2zL%~OqI1#;p}}+m
zjlOtr_7<lGh((cgfG=L6lgQK37l?r>jN3F+uIslB(0IubBrR<bd=gy3c!^N|?3()Q
z>0C}|lNDfBQncYEy2W)iqD;}170VbOV9!mcb(o7UB=^DwcySucw9f=!=~(vtip`kS
zq1+S#QoQ46J+KzBEPO^j1`k!VW+tywsav;qH>j1T-Op-g8_y0!37KF#v<c?+yqX~V
z9KH7rdpWeRN@@gE$e<EzpUx0W^4q|>(&Sw4UCBgfU>J-?^ri;Khl7lgX_~TJwp<il
zeX~Upawa=JW53syvKY8%W_lpYQMt&#75It70`nOUop#zl@P|#$*R?js%M>?c*~yMZ
zLojdZ*ckY?-JOAOhVWPd)m5TV!oHMJQ=Z#bH-y{tDB@b4S+@gh#jy+Zj-?jzNba4$
z=}1-ZcvxRC+g`$PSlLv`wZ^!`pK7edwA|F>Xi+29fwxnqb~PzgkH6-BX0KsGL+6Vu
zWfHB@lrqnbl-;{wWy!f>1GVG{Ifv`qh>k>qvU+GxHve*c)bVWZ{m9~Bu1pott^EDc
zP=6A!ez*d8Re@CYsui7fgDUw&b^cRC5|e2$=Nmq`2rlC)ri)!Qg*kzIE_u7$-_+Kj
zRYKREc5?I(_qI<~5HFh{<ID(N$*P{aU~!lAEOK;EMZQ9V+rflJ+^F919$orvJG<NU
z#*@{PRfduHf&Qq2yyk+Sy!zJ72Ojk%^T(4l&A3j^&#sv+QB2i#D>=C))tj!0PSp)R
zb8>%u&1_SD>fKbQ)1#_-v(JyF>KAYyqVr4d>?cn(tSLQwGEsl$xO%Gb%d>~xE7$Ix
zO-?nPbUySws=s@AJk^XsXK~?5nPX8-x8UD!4kT|d#}k`w1&25Xvq@PH7)-ZOb~%TL
zG*}Qno^EHva|u(DvLsEJ?qI*+5^=l1lA>n1lRv~I%0|kHW@@@itji_Fqrr;dWV-wR
zs;x(j4}DK&7f^VfEx6J@r*oA(+sK=oL&WA5!J(cVY|<_f26Ic4-JV?{O)fEy=aw1q
zy?T_SUE@<w|G!pSyS-OMn!Sb|&mUys`>ZR;JQ+)wKYXL?vw6Gu$z;v^QE8~pwvEiw
znW_2Xnr@%Z9?ehZPv%dW@qKrn$#^eOE}V8N`|c+-d#{Qud>sz;J$x<WvuUt!Hr4HW
zT-EIJ`SHTH>kIgPr=2ps`zZ_OYs!9S6V1NIH47JCLjBHHWc<#i7A{Y^{VtE1{Vq=y
zP$>Ksj4LgetSwl=E!eD$=!!nmR~#S?1`2}*1O4FQj9`VL-v9tUh>(yN41s`&Ng-fz
zGE!;^a!N{SS}IC<S{fz>I#wn|HgrFgjfI!<DmNFGATO7w0H2_ch@^<1w1mjDYf|!3
z;tKNe>PoV@YD(%F+WK0m{JOEmx|+B2{#&A~my<0TmHjEo`ncZz{{)p)n~pL067&BG
zD(j1|MZ2>9Q>g69+vue7z~52Xw91f`%7nk8vbFyeD*L86746EFHqZP6mCg81QQ5(g
zzoD|Nqt%_GYXhTmE2HgSMjOA5R=t1!zH|It|M>FQ`0Unr$KiP6*NKL`$@ZS9rms^i
zXjB$0$_~u5qfuG3C_6W|@Dr8&U6h^tLzI2L@afCy%Ide3$)(ku_0`qm)tULV>GQSe
zm5sf#jrpa`kDHsDC!33_+l${t+0Xx1lx5UvsQo_|WslOeo0~4a9WHJy3^%{}U6c(|
z^aEVYgDP47S(MfJt0;>FL5s3WWLL5FupmMX=pZLpE@gHIjVsl1wD=RT93uAIbry*B
zAENAMv?zP+Z=x*o;;ZkX>}$wvJ-M!bh_a4<h_cm#{}5%Xe~7ZI(ZW=YEZ;?0mhYnM
z`^aCStRprd?=Ml7<quI7FPNwi!1{&;%TWj$f)-_wzl*YMFy>a~KnPwH6BN=Ckr)oR
z&8nzPoAyJLb^0mF#zB}{NaKDNWvL-QMcHHBAEGRn^bb+C5u;Y=FQV)ST9k!+7iB*L
zC<;PG|0&95SMGfmWfdaPqAWKNYdd6LSu#%+OZ%$hcTpBDrBTVT$T9XqlojS}m;Elv
zW@ig?p+#A@@1krBv-Nb`4^j3JE&RJE>&L^b^HY?Chm{X9KKZjKi>=y#7G+%o&B?~>
z1-qEhqU@~fcTrY0kbuV#V-Cy;|0&AmbP-yA7iAm&B+AZ4qD5I&0@ktV@1m?NT9oY_
zxWvybll@JUP0O=Di?ZHmQ5OD7lr8_0D4SQ=u5&d)_J=4N9PFPBzzOy@In4?4pZzY%
zYX2XJvgiL0Wuf0i+1TGj+4Vm}*^A#q+2CLe#3qor3@ysC{_jNDq@SW}_J1YH%KZ{$
z;Xg%LjKJSSS-8%hL|Mz<MA_b7qO6ov$gIjQQ8tJ|{tr>M{m-JT{+~tJkUvD(m)}KM
zHMA&e@MlrB`nxC_1hW1m%0j=3vaA0PWydUkin4H^F<O+Z`%RQ3p*ZaMU6g$^jn9;u
z@<WuBUw`%&QC9C?iL&Mv|5lXU0;|XWMU)NxLzLY?i?S*T{}g50{=Fz$3H>R`UjL6o
zS%<4l|6Y_`L5s2@{}5%R{)H$T`-dod%lKc5vhwnO5oLY4{vygo{9TlN0{xFf+3f$W
zD0}sXC_DQXQTE~QqHM@tMA@f*6J;>~zlpL2|0AO8{4Y_~?Y|Ob>wk%|pZ+e&s{T!s
zW#$6e{0E{e(N9r!;-@HU{eLXVa-us&MrA606J;@h^1q3)qkk7=8~-fIrl3VxEWv+@
zvIRdy+1_8GEaI0adyE!k@B9#DtAB~ILH|yaMGv?CCdvx_3sIJl=esDY@`osU-s*q*
zPonG-**4H4D2~YQqAaW6@1ks+7W{uol+F4s%Bn!Y=+$JCpQ0@DUq#utKZ&w|I5LSq
zlU*E>UED@E@%^8oY#dM)BBuSDC|mg_QTFx^QC9w6in6kQ5@p~15M>R&i?WYU(Eq(C
z+x|n8ZU28N%I1~HXro10rthL``@a`uv;QW_!v7-5ru{C;ju3u>{t#u^a4-&jiL!Ui
zu~ZOZ+P{mkyZ@0WYw}B!4f!t0mi-WAXaAKbdmAmv9{wv)_Vf=?w(_Saiw*oG%8vgV
zQ5Fm5FQRN5_8TaqABs&piV-ObiTsl&>kT8BDf=PHo`N2YF#i-~hyRr*TZZ^el&$y=
zMA-wJh##VC#Ggf3ncqa&a#_ePQ8o)l;;*7??+;OS_^+a@<4;lc{@+E};eU#<0XU@h
z{}5&0{3goE{19c;%0M!^nB{0u7EKgp5n&+yBFb9*6lIz48KKyly}v|Ri65eDISh{l
z3cCEODC_qpQTEZuKSWvR4^ejNcTqO}Ux~8me-UL>Mt+F0oWDfbH;5mi>@IfXPf-?u
zL)C)+#r)rhvSmL+*|)!mvao-Mvb%p3WvBll%Bsk6HvSN08~-WF%Ku%I&HkGxiv|2H
z%EJB-WhI<(SG)+Yp!nWDL|Fs0C>i-*in9Ix9Z~k$KSbH5e-dTy|0c?E;a~0&W9Sh7
zN209rpG4U*knkC{3<AsuuX6n%%1Zo8Q5O22iL&KrQP%l?LX>6x4@6lkqMxGd2wIf&
z$N%q&vQfW8SvXphg@BysK*|k7vuIHkMD#aNRvs<NHsG3|McEfXt-0SsS<iopvZg;o
zS^vL?vM<r1>@IGr4z3AY%^FE~8x41QcjUr>^AOPJ70{$Pac&u|(#U@#%I5n25@jQx
zIF4vhRtK;GB0`I@*8T*FKpeCv8-YRiyC`de#Pdb|5M`Zl@Z^ArNJwYdu(|)AMA^CT
zqHLKt@w2k;qO7O?zYt|@{v^u2{ojhRp1+B*Wxt8CQ#zn1XQE69A=VyY6a?4_h14VQ
zqguX;vT=|fqU`nWqHH2`GVX^c8`SczL|F|&F64Jn_T_J)?AQ-cHuq1W?AsQcC^$}>
zKkg+2XeSGbLI5vy2+W;{26R9uQ@mO@{%a(7%K0}@)(7D0Ol0#zltmk>k1l4d{)Ea#
z{D#WjmHm#&T0_30vhu&9vLu92C>XIZ60G42R{nv?8an?%Wh;K5vfDfJi3qSV20{G~
zRF>c-s2MR&yGY!;OMd@>Rx4o6S-m%w`Ij*ZLL0M?#nmz*aLM!-6eqgqhcQb}xQxVK
z^7(GerbA~mMt&Hx{)BN*$ZO~V#>b^N7+Beyu)d5C!|B6$2E>_ni58O>fh7G52XnZ9
zZ%9Kv?h;N!LDc6z5e0n0+4}_eT<{a2CHjHT8vQ_MXVC~PJt35DY1s#7uLY$16QONc
z;v-%b<b${o<6*x9U(9{H{t|+#3Hj_y^z<|M2!r^e|JYX)lK22lghYau;b;Jr=!P`$
zN5oPL@kTr!<ivbEX@}%>*)nS!xWj)En`A@P7n1uKlC8Cg6}Net@1=_KM|X`yvzH$|
zF-RDkR+;$bGkkEIAcV}mV7C?=L!AX7>9riq?F;jTN0&=TB0OVr!fziTeteM62;l2o
z;0`_bLkW=oB~hFXK{|9P5kY`}0Be!p4g~Pr?DN{o&j;|GOlJVmD0s@8uv&Job7X7^
zNqp}7<?Cng2@FsT0jm-d*S3Jp;NXufpn(yhdW=E5QSkCE;Q$PLh9Hg`0v#dI`<TGD
z&fsAw;*Jrb0V#0YosB67nDya)9|3VE<N%3k8TjlxgG8)B`S;I8_IWeFQ@aaaTfj7o
z6RQ`S@AA62Slg*9iDBODhZV#-mBi8@i!CTrsEk;JA1grxVgn;O!C1j{+1%QhB^&*8
zzI*g~WDRh0=W-Y51fAf&1lDMR?2zD2f80#IB_|mEKpCME61-PN=mvv4T{!W}B=9ny
zSsaAChXCvS31fW$cEw;{81Vq|6kZB`tAn0h2G+KKku89?vcP7@QXD$M0EVCO67mrN
z%=8CVj}X0v%&bcjSHSRn;RKX^M5%BBdOxB#XFzBRAhiY5@a0?I6QWuj0$<2}@m+$%
z-Hn>eZ}kh`=pUYpY6Clv#BWi~fJ|9n1@!pF-N=7hzxoT`t=~{2-f{C8+aBRDYHOVM
z(<KJPiFk*Lyf>5L-eq~#p20wLlkdm#x(_Q4>8SiJO9p$z-!3Wn+4vfDOpkt2wY0H}
z?qB1d%z8Rto@@HS)%2zARM*$`L|e+&a#JH3?=Aa>s}fYdcD4z}P~{rNQJF<5aX!~j
zd*8LuZ@YC%%1=;$J{xD#V5*e*Ao`oI-AsdSV%LYUaiT)~k~^(k*tgZpcr@R0(7zK^
zPpE$tPR@UCZhFtECyq@U{jq(Ufi#hat8*U?Y)7(`Vy~Lb9NLfP-!2t38qn^RNPPF<
z2o?JJd6TvcP1EP~8`<yTX`iCH03m5jy2cDs6(XML&0bEaUzsLj>kgu#3Ty}5di0BQ
zKc3GiEc21-b{$A}?!VC@yQ)bZ-dk)ykfLh&x<!yX2{pxIdESdo@jB(a8gF?@9U31O
zCQ;P%O_FAW(OFn^okru)*N)^ewGZJU5QQr)ilpkodx}?X>A5ITn7EHBg@$2nrN~7v
z-D54cq{fL1!4v4MIS%9wN_~2jd5BSsDy=g%p62<Rmo6}iSFd&Vow47t=e&q#H#uGG
z&QxKh?#^&(NgIoPI`jZkr@P-;mZ%$1w??M9S@-73G3z*gkzs0D=P(BQp>4W~^IJ{@
z)Z=))wIL~?^pOnhM~iEenh~5fte4W>F1NI<9Ub1%Q6Trw(^VI_UG5@`X~XUd`ex1Q
z4Ey>@K9XybgQD#7Ko9+GlJ*HkGl6kdiV(V4C4CvS(e6yomQ(8wRx+xOK5QW0<I|OM
z0KW_fk6Jm<+=%CSMy+<<5*#0V{$T~KzC{B2;F7v=ppCI`1Y=NZ5m!vO+ZEmkMlfS4
zn?3S#Nul!mYV?@Lq-&#8K~p=)(=vj)`qVN?Xwq}J(|7N5Io9z5n>Acr^s9A(RqG1n
z4aNH!34+;SfxrMN3D$^otCw~6WbVZ*!4)da1A)BzBVrM9Ej>AGo#ms!B(V4}%NUeG
zpLpP^ituO$m?xDZD6ZJ%xII>)NA%h@$GQI*p!#SqD4e4YVz*V&d}9{;F1DpDR%Nc`
zno+I<g|~AXq1d@|2U&_Zu$uPqxl0dAinnVwEq0LWfY8G^vrfy=bGH$NsfH_^>S7n}
z<F^caJl-#~fBGfLKB&1k>MF6gck<CM{592l5T&o@lGhj8w=R!v`g)l<wAy&B{}N^A
z&%%tRe1D0u>UTxG_xr_A-iPlE{CtjQe~7Xve!gd0H7MWngDF41%il#=R&z`u&;L}E
z)yn|fLxPpUWS=qnKa<kuz+yekA>vOA6}~f#=LcPUcIp2NaJkmbP@+R}nc7OAo!UlT
zz57hy#UjCjT6q-a-ZKTBY=YQRdA1UGxNv0_f$FIeY)SjsYD+sIJ7zQ`K`Wh!CzEhs
zUK?+!0)SsQlro1SP_+R9Ud_t}_S)SLF42j0FwLUPnwBA7b$Rx5dl__D+a{Fj67A@1
zMaApYdlEfL_xzJJ`}MD?I*-O;!mh}1XnLvX#JKvUE81{t=BsIR=_VtsUUNJ4sv2&V
zCf79B@O2uh-NAdGQo(vpKwAu38LuKmx*<o<OG4w@&RE);;9P-Xl-FRZ=KEy%uq+fD
zal^4X{`owPt+=*?mP78X47#8WhC#1BjHZetj6`;>DKBkreU0=Z(;S-1HzDHt2MH#-
zwkQm)kpK$eOhTLWH^)Z9_b0z(L2Ry~u5t~BiR$Ihl8-74q89+X4s*!O*kB|P|BJo*
zifZZ${|0|j2%$sh9YXKDw={Z@4pKvrCQX_specYzQ3O;JRJx#uponxy07V2ux&lfE
z1rZRHDieSIdEYg&X3f>y&h@!_);jy_z0dP}Kh}9M&Xo#uH!NN-IPSO5!oCI{*gRx#
zy0zl`@Gdb;1`o>0hwWUcOnq%RDDLbiGG1*l8|rlL;0`jfw0dWT2F8lBgdVZ+j7+^@
zuJAY&;{5B;>F-}$+YVeVq>n#xPYLs!y~uw7Ma|qCt3sNJT?Zw6c>F`LoN-$K)dABi
zPU%?pWO<AZMPaU}1cnC)AG)9PnYlj8$ys#189Mnk$n|;Aa(J-O;pyQ=xphN5;UWL0
zD4WF`9O`!H@n#6c5+=6p7m=mgLUnzacTd72qJ{31V#3RAsmOB%3Q!9;sQP7UFOOIQ
zWYNs6b<{;X=H|P1E5^55+wOrRBM)aOmH`ck?sX1>?<`G+@Qqc@fqL%`efD1eDF~l=
ztibTqXMe@*)k@`4yu*br$BbM8`D^RUe;IwCo;Ft|SyVBlYUVs;2r8yNoUD}W7mO+I
z;<l3#QakcvZ*%N+UD}dyTl>O(>L*3oCOS(-dNQzT?;cdTJnBQ+YyJYa*9M=r$&0!S
z!chpGq#1D9h2$l!!;>i?)ZeAt$&f(F;KXa6<ImkRU8cg#PZtrLRW91Xa}Z}w4}e%D
zJ-QE;)gFGNp1J?+PB43rR{66l8r4s3es7m+snZ!k-d9zWW~Pa<9$jC1$=<&dLvZAq
z!|8UrQKqP61M^nXu&#je2)(O9t7>m<tuzuo!m|t)UXGRzZ9T-=esfxJD9sDf%FKj^
zIG>6~R9D68-ey|&SQRLEIq^&8Ln76cej2C!J-#6)B|K2Z^Nuce!gDM({EWHhr_ri}
zhj+e*hsVM`jr06ei0)$Y2|~}5&Pl5D+)E3C?;?z&S0s9D>4Ve3pL@-q$blPa*3p9F
zlS2uwRGvqq{N&?5;RXnhu9SC7&SJpE=Orn5b`a3+e>b@Byo?_^AwqVPp4%RP7F&|(
z`MBv3QBu8wMIg39G7PXs@qmXyFCBWW<bn3yVTD*3HO0OR1p?iA{Fxc2IG0Oo{%D5I
zojXH1s`vt+dQa)am1B<iRRKar#I?1;_g?EcHT&ag#b8iwd;aYbst9Z3HFJA$_W8BI
z_eKnH4N*J%T<;TG-bbg~*Ut*sf00zDjnLgIBJ&b;u6)tqXT=51^V~DkmpQKcLp4Db
zSY7Vr{}y>IY*?IWX=O>Ny$co?r_S!&Wgv5BGtOyeR;X*PT@M4=v{(Gg5iHxP$NqHh
z<tQ2~w|XK;&lsKX^s(N$r_3eCR*@q>BL#kc#ta6qgCM}1;C%F7Fd#+@jvo1bFEvT#
zW7iIecNPw~6Cglzx>4dBz_>-A55cpl2%!Lmxj-?1J(1NJ|BI2m3k1f;-^A+2Cen!3
z7F!w>Ti8zD1)?=vKysVy?SU;a(KZH5&jo<%^;w#YVY$Y!U7&wjY{)Akc;&9=tKUf`
zLeYTT|6PmChQR**G<n<xg|Gwbiv+tzFwmCXlHl`s1!KwGD~k%$ql-`=q{Eh`#ZKv6
z6?}z?HUcG5Y(I6<W;twI|6#G?5W;dB6zC#$V$<UT2q*M3X+RYfs|r3?l%yXf*e;}1
zk<s+k|7o#v6|dJj=<sd9y06|!yqXlm7(sPJ0fISzMNFmtr^UkXV%@g#t%`UQTQrs`
zXdsHm>cq8hhf{cqDa`iWhoe|pIyRN2#rElr|EI-D+dP-B!7O-EJyV~WrMBBz0f?;%
zrVzlcpFlTkjEpl<Y1aV~yA|;!u@)dOP<cALTdx)c06KgYuQ6l5xoH%N3l+2rj^zVG
z0JGOgR9mZN3=TU00r*P532|mIo&cCY?A7QnJZkxU)+BMp;PZ5a<BTNlSa<eg7ywU=
zVm1e&U*9V-6<{a$a6Lcq8Z&*e*qf=TLK|MO)yJNCgtcqcJ(JuPRH4smVabZuVO4#7
zs?|(yqavd3%^gi}tZFx-y(QaTx-DZ*Kp;(vB@m7zE2k^;CA&1{B!35>IyAZwP*^=p
zi>+=OU6+jN2Gyow#})o*u})*u(QeCoG%dF8^=TVo_>6@}n?-hkUXHVMDp>#Rx+Fse
zaH=1GgrIq5sAo1hZS^4lyu(fa3{1VTTL3(FD+(K%!CN4Z#mfi)kO8C~gzMHo0laEu
znPiuEhK*7?P6!xi5i)6*PTwvE+o|`sVg~GXKy*`*hll;P`W=1619n!#_IAsfUE04+
zOtY8u$=xvPc}?T|16%%gm{VnMq8905D<D7#2+wCyM4NqXrlSO!;hNL3lhUDm03LwJ
zqXz$Jv2eOTI5h7k2vR>(F(WDA{(hjn8#acC-2x!ZsSzcRg9;F=nQpEP0P3-Wfq)O3
zj?ta4@%)r_a~gYlT9_(fhZzd9=rZ2|O?CI!UL?3PrzvPk{R%u49QRVBz&5tp>age3
zu_ir^b~mC6fVXV-8*LYD)S86s!js<d-;`leq)@VrY4Bvz*`EE>c2+2%C-5~a{Jnh$
z0hSCv+EeL6P@p-7K!WbhV#RiwqunP|_fa|vl=j|&P~j-H8Ohb+cUUOl1n2|ul3=S4
z0=V#{b#B)><fV1JBS(8XipG~#pqw6!z-(TJ5p==2WO6M~4<#UWM_|lO(@bbk3Apnx
z9X{19RQX}9(Lu2HgSD0nf}J4VJft#UJeovzomtvPY}^h5o12!zXBhZAf^{28v0HSx
zUQBn=x)NMCZjk-n@t4bEE*GbZ<8}*l@tRVne@Wu)&2h~Dcy8S8MZLhdv)|%a$i1p4
zcgjUvlUpK`*S+`ge@^VF_6b;#YgmNVS*^)XMmiTGZBd#N3!sXUQeDqX#tx3f_4dX0
zx?MhYBSc8W%}!dZPZEsWQ;#Q!Qtk#CQ>n)lM(zO2op9neBZ<Hht}Z*U=L6XhgrpZz
z?9K1l6wLgNt*?3m2XWH+8MGzpZImjBiI38<l*Uy;V2TFeOCT~^;~LQ<ukZcPVZc4b
zojC56u4H^g%EL~d4Av#A8@z_d(nRey>`nwIJK<M&CA4qQ?jlX>#4>pTkUe)9Rp4O<
z5U~J&3QZEpy3Cr6vCVW3r2yku$j?!XPl+dfS@KtG*Kg-fWk#QDmF&8-RB-GB6T^X;
zS+$0=iBtMOUA&=Yhib#Iy9OQ57+=K&I6Y2Etx8D?PJ|}@1O`lDcwMra>MOkpeaMuj
z9V5Mv7y&FhN&Quk#y!Jh?a^EdV|52kXjCrOR655%i+QzkG!}-4CcrWXnMN}`-#dDZ
zDkH=|U%Uwg??`Z62)jK2K4*yU1L*7t%dsvja9@VzwvE{eu3RARtk>f)0xX&Uhr9R?
zynLE{r*df6EHETNgu~m#Gl0Zc63l{DxY<|Pgvcd=hCRWrHvPK`z|w3dlL5fGJff56
ztO5zI;)e!iE9`R#TPeWUb1O(9$}VOoa6=OK<y2llNzU(@NTIvt1keMXqHq9K?H#7>
zF>_CE*2S9SY4SY9UfsnBpoJ#Jb*)YNahrObVnjdEs${1zv1{m9F_7f7PRJB2Ft_Uo
zH{tD48g$R$?_=Nuw(CT5V(-O%Nzdx!WVL5-p9V@6-THu5ZUU>+K+i0!&-6bhRyIIJ
z+Db0R7|iGSGi#B~LT6P1*cY63TSL>8Otb#N+g%*qUwoBGC#A&W^k$tx&)%lUPIH2Z
zWuA)w3!SmBCmoystzMFtm82{57GbTNKK9#UT*ztn*OvWYt?Dl{H+ppp06GX^a5_k|
z|7y;{npPzpJ5a=YC3$o~qc;6<C4`;Ntx<vy2(<@wq#0QRlsBG<jb4mprG*&5RN(fa
zU5ns88cU9!E?Q)rP3Nq`NGzu%YhQt}0~dvzKvO6<H{oUgAp%aHQ4Z4Y`jjLz&7X`u
zx!CApb7`?bsl9YrGP&3*b_${^4Z1(zUt>h5h$C<s10%g2BDnd$-xU!F^PW6Xq7%!P
z7MC-}2>PyoP<1+egtutmGV@-*r00rlSWxf11$%JYek^fg)E^|JD^qX${5z#Rb>_5G
zaBMUXn-Flum|z<g3`(0hRR$QXNGido9;|7KB@{@m3G=Utn?H$zH=RL+=yZq;T&#Kf
z$&5w17buao9EQYB!T5RRoIZU@I{v&i`YQb}7+eC*@5I-3`1{};A<grrXwLbyueSYX
z?lvhE)mcbX2ktBe(*rP2GvL}uK!28ee<n!Q_?v4#7?#lq1z<`dzVvY5M1RgiJDEVg
zhwY<tt@R;18T!-(Bjg&q0cIr|RtBGSc5^D9X%l)S0NteDo3`^uX;01kb7Bd)(-kx)
zmJo8^`tc^3zH76GYl8{_op1tt#}x|cm=6YivPaH>+5i<w_#81CW&zr_jyQENVYjj|
zbpPx7gr?yjYVg{yd2W|tbNHC+_p!+JutXR`>i5-INjc-n=)E(O>nPE_??p5xwi?#9
zBAKLN!h0#*EE!ET+)N2yn@pxN<{nn4GjNnzXN@qI>!8w{SgZE#?3KtLupbdaUL(H%
z>3BUQk!hy;FQW^sDV@;hX_&n3{DaEgV8w}CZTi3OhGGo-PV!;tBJI!y(^Jz1WKLKo
ztt8*gqTl;$y$stzE~NqP089NT@YdR>T|~*PE`@|HZsQpN!x4680zKcCQ=ifSd!Qiy
zmBz3?T`obSqDx!`xKOv;B@KY135*s1^Ax03%S1OK02B?tQP99O3QUXu8}Q1A1z1%H
zzl$k!YoF8eKXGf*X9NIj8ML)9mINhiCg8SMQ$-q2*QTTmY60u9C?8!&?SD?}?YJR<
zM(i7!6C3UNRGaduv)yk95NHN!pZt##3zF^t@>jkNb9%~DqiIYm*VB%hn=vAFu?A5J
zhUT5Ygw7W<CYGHFZ|-4+)0kMoi8a9sqWaH?jWd|xT=8JD2n6w2oT9dfwEtF2Kv}T%
z@fhu88j)4a5<UJov4qQ?TVT5L{;ytgx&oQ>8*UjvHzUpOnmfV80R9x36ALgW1Bb@H
z12031S=02qr=hZx2!b)BkMQ_RPp%1&es--$=L$-7^Mw(RLnoEdMrbXHHoj+))D1x3
zfIv1uKE)>I{>UfeJ-JJ1P<LJEOK&>1#CWNhjxXtMaJtK1Bq=J%XAaUm;b~=~{-TMK
z-AQRl9du4gI`4i}g!Qd8j~}^W(%q^%@E7UaQ_}LdlcB#Wg4vH<7wA-_L06~Kt>LNd
zi<0=nR8+Lr0B_1kM>%b?Fx_!G^wpPE;z^39`t}#|^v~zxh%rE|u+;+n-rSd(d6~bi
zW#I0rzhPoO^TF)_$0=*q{}$i9^iA~g4!zyhdFw8f%fEb20uKNFbdwWiRR8_p@`30J
zk#ALh-e_ADy*T)B`Gg)G3#Lc>FHv@Z1N2t3Cj%klSR1m9e4YKjMOmbIp5p%&Wm`CI
zWhgNPkJN_#lpZS9Kfkl_Kcegvgi_e9tYaz$*A?@1S8lA@@uB0BuwOJ$R(Sa;yPBNb
zRK5S3Jf*Y06=|aE8!DIhDTSHlnAMRd|3ukqs=+AF^*<_eT_k!=nkYLp$6R%RS0i#`
zk0#2V9?vM;{-wGy@SiCAF~n0c&piJ>QMPqQ_Dv6jN#H+Gwl3mOdvoT0L|L7!IqH9+
ztnSWI|80#ZpQMpnb!ARYPyZ8T5z`6ZH;)bWwie#}zlyS}MPWaFoR|<mu2O7@xngP%
znkd^WMrP5ciLz`>!#5c@FuJ91CHMa=%95t;r6Z*?N*SadH6yc>nk<l6vaPxSsbPka
zV*ew`PQ6IGVrP9-%=UWX6W5Pt4ANXH!U|4LjON)`=}Fym@i<+n>CHgQ&&Bzi@K4^*
z0BW2HeEqps3iWP=N*6`6?n@V+J0nNEr4`RF<C+_Hv&t6pIb+rNVrJLFd)~(kvSnB0
zTV>1t_T?9{rzph*mpcre4lc#I9*kA$IJC-DmuBjRC0uuvu5m<)%}doNTITclYNmXW
zw|aVC{;XT=NUOrrj)RLg4J~HEhVQ<*8~Ba6UY6@_-RsQM+Gh-E>xwVNJ(8Z7`AN&!
zH%yT#lrXaw-*Gh4Uo}u}{rYG+q-CYJEz&Fmp&;BY^44>>?bo+9l~+cjqNrC~4E@1z
ztaR-kx}e<2YZMlPqxyIfqn>aN-wT)3TJBSE4JiJzM{0fIqf*sXNVm99f2pDqA&&l*
zx+C=gH3K@%%j(#`M~?<OvwuF)K0MMGMqh6H#Ej-t(j2i=h|nB~QaaWgbFenjqKUF8
zS`(+wc4$p{Cmm}|`TY}R&lII-e+qs4Pn2yt)}A@{?*A8M|G$f}X5ZtmoCWp0S`)Hw
zR0ab?I7*>B*GkNdT1&Y&Y8Hhccgp<<^Kb{*UakIUsB|-tqY@7l*j=N)tcqkbkH#uO
zYu^5)3CrfP-CB%#^j>=sBIkDL)wsT12~9*WJ)DtLJgL#hFuFx$F)xJRR=QFp@bm1I
z&J}`xEUvmEIJKS|g82%G1Ce{(w~`D=(nsfVWC^8$_jk{zJ=eSIzIFp~g-~Tuux}HH
zSt@GoBa4(@<%lLoh$8$R8fcZVMz2AT+p;i?O^RK_&Zxw8MxbJU7u0`G0<kzIp^<ei
z6^#eqN$9Z<G2!5d7mJgK)diy|H=srfnCr)DG8S40HWM!h6Q0ng!YV*#kg#~Gp|HYC
z^BhzOSHY#RoFTo!ZXS87l<!v|Rs<tImepL&HK9lrUY&nyv@jw%hsTK25iN4EvDfDa
z8OY<c>%R77TyDSK82O{K{p}Y7dNR@s>du`wX!ejq8~P-z+78C+uf3?nrb)?iU4RA^
zh%@@WSP_|>W6juDfL|!26IHvxfj{ULz9>{HdcTF~vVFlVUMZN={R?c@4<w!?6^Ebs
zRXyG|bmQs!qaIUkCXVwxNJMwG1-4_~Mn`oKSu<B@61kopEwCeymIF4CH-I<#ObBPY
z%j#+;rCyTNVC>WijQ*uNL&;0HHpComCBx6=Ddf)@*@u;c>$4H1V~X2eSQxTD>N~xM
zt->ch7J1|F@!}Gq{4dbU!S#6NQZsL-dG1q@ub#6go}D{3&FM<B__t(|c;2OuHQiGe
zIXr!K;eWQwgDzZ6V>w^`jH6{E<tLNt^^>5)ZlT{>1cu~c!|VVGeTuYH!hCwprURAd
zYqbdZ8(Z4u#FK#xWlrO8-=lAn<%YknTqhR$bBh-6zlz?@V$p+p7Wm)3*m%yg;H>ZE
zCG7Rs<`Dh^^aruY+a)-W?U=S?Yt^g^H>~e3%2<i7>N)ufZS&C!`E0=a6<s(R3N<9u
z5vQfcIFXaXq}%icLE@ZaRi-|5nj9(CrfvI!J!2RVe>EnX#7VXrc$lsg(cMTIT_)9H
zUTR4Sv;Ol_;9?+^?6e(hB^$#!TEBxdfA`JXpm*G%YFQ?v_^c0Sn^foD7vh)2M~y}r
zr-sZJNUs#Xhh9Ei|9v(9A#$)0VQqTC+14ZdvYUnbd^UDwg@#UyKG}?SdMtXB3pX*&
zym218B(htnV>aW>ael51c@XqcEO_6=UkE+PHUEYKIe-0>nC3h`8p|&Y_LGKwLbBY?
zFz900QkQpraien6)XHI69sf^>-S3tVxp8Y{p7+L+2vcQc4wKvqi)WVTIqPXktfb$|
z-eGX9iWj5OfH>nefK|<B52~Oku^I{3mS3e;W$iIc@>eXZk8{1eR7csGY1y{NAea&k
z$#{3zTuqxXJ&Az6eYfw8SRnu-DH}2dy=>uTxywSDE)&hpHbsE%oz}sD=O0`H^Mw2D
z4f%`n;B{-15Rt==CvV@rd$K3nV|_ZhL6nGi^P*Rmk)LV#(%quU=4ykkbE(+C-@J(r
z%O1;dd`z-ggkO^FO;<bel{64yHnK~+{m%Z~KP5IW2)r!rm~EBtS@h2NT2Tsn;4Au@
zD-t45+)P)hV{$C7`uA_&d{3Dws){q9Z9_#gOE1m(CT@4Grbv!>!hW4ainOM}cclEY
z)C&yuhD<_TOntfLM3ql}398{4{_sUh$W5|ZRPO2nE+s+qIN7fuZ%&wK(DLPn+{~0(
zw@?Yu7$+jt$F=O>%wIv(p}Q+8N!f|;5zm?9n8E}LQ&hrl>A&z9&mm(%!OA!a1S7`f
z!d;5SDQ-B@fY{A(+Ww#VKy&#95Br#r(Bz`j7e!qs5wEEyA3v|$q$~=9B)r_0PV?#B
z%u`ZBYi@Vz@VmYO`EmDhT6h)WDm+Y^{cwGL!d6h>*Ymg|LBZdpqJPE3U}a*gNO7Jr
zaUawFix5jj(S%q$Rue~7hmuvGWOZkxHl8fW_@5A~xM18jEq?JoA=Vx#-2|44#z??1
zqP0Z6Xd<^FNEty?UMS;s2k}M|`7&tvG!)@ov?v^d)Wk?Qlhmb2ioZc>bs(jQGNqL=
zWdukCyr{}ZRnNmHjA2x95bghfSh-F1e?Y7(R;k@zVgSjj2-1!@p$G^CNJNu#g35IB
z7G-HdEZ!9Pzl2z+1Cj#OA30FQ*SClm4iJ^ZNaccc{k!!G7xgl84Qm6Gy8J~mh}`&c
zz8Q*96G=t3TerX41ZE*$=dUSNVNR;B$di<5#Hix228I4+%EM+btb#LDv0s9BIMCE5
zu&hGDJdbLiy@bd>i#n5RFJkRBB~Rwada_srO{#D-h=cizL@r6io~(yodP);w@njX*
zWns+<?%Y7<JSmq)r%Vd5s<|XF)n$R?N}3Qmy2V5TV!gGg0yAY!F&G*UYxVlfpQB2Z
zXsYmxzfTi}2E^K>(|}m4X5g}bBHGjS1fzt9c*(E)Y$U7aVnk;agcGH;r@BW~gQN^s
zXc_r3vRH!*>781#iZeAR290b4heWa%<FT&VO9IX$nh+cD+b%kfDy&&~?k@HWY0zsW
z2>Tf%hr@<QKU|-~s%l~ke-opmrKf2^Y$Hb0Fi>I-;~Td6bpxyE47QLasf<Z~?!%rx
z@R!1o6Q4a??ZYaB2Z@eR_3`wM&jK(pU=4i<nzw6wF+d4Nb`E-2-H25xUKPj%r|bl;
zG-4G9k}`>q_(q7<7}#E0lEa;1@wuElK{9sr*TnlPjbSj-RF8g%%-<lHJ+OAIOm!ke
z29S_ru1>dOHI9?zO+Hx*ox*AsO1tq?U2E#TbPK0{ZSAafjaX`Mbs<FV2q|Y#&HjNT
zQUQ~)!G15qN+_Zw#DYT$Rzp2NiJKv=c<I=(hXhilUNjXU3C`g8@EA@JEjF`a0nbuc
zwQE7VW0(ScnDHJ-Op%i2FXPjQRdpsQtpvv*txWbXs`6NlK~(xJ*wou=hRK1NxiI4~
z3|5<@o>+6kc@41(dgz*|V^Mw=e8aFEz=cC3GcdShh-3vhK=DCoFIAy5?^8A88B*K=
z_t1E1-n0k%O#d-1mx>s}m~M3o+=U9=P1Td6BAluBBXM%KpoY~r6I}O&1i1vSN2XhA
z=1?-X^9iQRtk-y8-E{16;N0UMyI@42l>7#kI~9Tx0~y1KwANdXZHU}QcRBp&kKwmO
zaf%jk{HFHQv!OUSTsT*km#Jb!>Ly0~rl%DFt!5F56q0ZAfbzE!7;>S8&8E22Zf#tu
zu&Ryu6y$y$#>8F0Dz3Z9(Nvdf(0U4Gxl4}R#43b9l`4Av@vwnlGsP!3T4e5AFHZ^B
zGy~&55dMS4!y1C>sok6?oIyCzWP=c}0p`Kcc-U_7H4mqIgGOUBJt82}HEa{3z#F?B
zHRW4<Wj*iHq1x`~k@Qr<Mn%iohsabp+*tU+eMR2-Z{|y&J07OPk!h9#-&Dd*QsEZL
z7LA}WAKa={YUiikagS7%Xr-;WZXR7*6KA4HS6$!|gs;$l=I-E(S&x?D7p-Kl*D+WE
zhk1L@t-J@4P{rPE!AjyV#=GQRS7j4>(vBI%sFy6QN_9i0if%;UoU6^Yd~xn7zb8Bu
z>wQ{oQgxF_qH*22Q&df6l4uRN*U{~;^Qr4{H|^<ft5h9#^pmh2?IQ|rBgI6dj#fd@
zaI|1yfV3fqA5bu!qUhw(OlpWyBYHgViLjw+{U;(a5W}tbM0gm??~dgL&YDe;#nu*1
zta?<0sN(Eg(mfEIDpqZ++gc6N(n1!TBN-TusW4L&*SZsKo{-#KiY+Cvf<kay28KJ3
zYO)ED)ZH48#|YYxaI$LrM>R<37Eg7ZsV0~s17x;=)y?SAt|04Csj4<q&NvKbK8Syq
zYTSs{?Q77h>ZbYRU@UaaDpj^mP58k%fkmtdK3WBb)6b=Fq9TO9sPQLmngwE1lDByz
zcT~eEJj@W>93*Z4n5gQ8d17%Dbz8Yab~sV<2xNFfk=zOk96&4LeM`3QF!x6ca*Iny
zq9xb7BuhYQsu)eJ4Xvr@t$X>R-rduf9<^1p+!lnd0HdY~>WqjojYc!MLHCfSHBV_Y
zl~I0|QTj~L@_Q5&Rfxp)N39tw@(h;c;mLCaEhiCGvS71_X)U@YFVffvr`t#n-leVy
zsNyQHOpR!jLX`e6m3f#X%&z1%MUZVo>8C=JGElf&5J`*}GDTzvC(34Y8E15H25Ksv
zg=$5Ew4HG}IJAxzR;Y!?)skC?0MV$%8ZV)_3MfLjQRM>S@uSb@mO*?3FSF){rn?v>
zS&R%<j_edl#hHlQBO~ENttC>IRkyP_)KMY+!v=xzh$ze#ZZ<|0z~j{6S?pqHr$!=U
zE(LZ-7T5q3o3)HH2rO}61Ut#Z5G@!EQN%BaVsT#YUkDd#-K&0K;vD0QO=Zd6!c6}1
zUez+^i#HX@sLw^O8=pi-7ZMD2u^y`=_M>&?Bal*Im(|^v?W3>Gapa~_s0p8tvN=w1
zP1RP762#)Fh;uU3_{pI<s@Q(3c)Ka;whLm8svJU5IIUsY6Na;I!iE3T;`(!r_xaF%
zx8Wg{KM<jj4bi|;()KA^twe(>`RC8Os(C@~2$PKRBb74zB|6VbWKfJpYd;=fQ4)0~
z8)~>}l)mBir6`CSyQOqtfQ5C>!pKHkVb{B=Zb2+*&<AHyFKyZkQOT+`Q2ocl_86U(
z3lUs4OBH0MD&t9lgl<bUqJD_5X~ja)%S0N@iGx$HUdrswMA_6ACM6^WSxh=B+5M25
zeb~Lcd4h7*`EJ&%V46+K%l@vj1a^ZfN=~7@WymIhm~sC`S;-*0Ns9?i4=1aKJEHhU
zkr`1?_^AswgH^vaHD|rkF%=`qqONFZKHD(fRxRu@_f|rkCr!jWGbu?pVBfyy;C+_Y
zZWH0BnB6TY>>mGAlv9;63JX=1EjEGb-2V8)#718&grXeR`YeIx&okYkcimYgFZ&`d
zKKwz_H$>nvG!jmfG}hdigTExcxu|!K+h&k*@%#^!-xr@=Swielad6Pni5Gf|yFLNi
z#$uZ67Ehcc3~*eDI9ZbL@J0?zhiwe!4)2yU)U{}aNU4G<HAp(MG1|-+#MIAtER?V3
zWJ>u6tZS1uRI`U0BRxITuV-q*l{A=0Vm}O^1T#po_=s0-M0nS;>*ml`hld{#Z*|~L
zED0Czhux};s70$5Q#U<+6jUBSGet+>-Hv)M>v?7B;da3v4j@V!DDR^E*OP}GC;Hmo
zl4u{4m%&tRLyBl%wBQ<1@Qto~36&Y%E(_myK;B+a{S!E?(6Tgbu^Yz^ACsbswB*v?
zT!|@DISA?{tFt)u__!O})4GycE3=L(-at5+T@B%U)!oSh(+dOUJ=*0RpC++t1w`XH
zUUWpP?pyuYtLIq`k4xuOSrSskqA>|gM1eVSeSyL=8C7GxWPKEsXSZ8>?nJNgkld)V
zJ@vPI@c`0v*5GAQn|U+Yz-7Fx28&>xck88IP{T;KjP781bbH!N1`huQ^~?v$um@uF
z#WGC#8cf_fO>&=^*pS?13~{@Ef1H2OjZL;}2jq$tdtyy7SzQak$<pENx7XT5uhji=
zYZO4G?jAzS?jCIwb!qQ*^Pn*A&bH4>{4Ju<y07|?Lj=uTD)Sr}nE}WHIDO9fqssi%
z_YZO+;QZQgd+h$WtDJJKjforqW;ud-3A=kAd{vdb)HCmj`<K4qZ{%ALd|l6r$o)Ik
z;+L>JtdjNf+Dy?tXNY|%_Nqtwn^eDA_r;?<tiacdB6r&#gMOs6le|s|_&HOI`?oNY
zCte+!RB)AzPWq)t53U{t-)?n>elg9grXph<b3V1q<);I>>7zShhB)R@L1|kCLFtL8
zA7UmMN}E|sA3ia0+zGPyDRT;!rTw?_o^v4he!H-=_GRt)Xx|VE`0~fXQt<uzAOA+b
zs(ThOQgNrJvETzZ(@(?-uEtG2+T_Wl8gjH8TTaI$5pCPB_fw*IXZcFKO*KKYThv%w
z!y|V)I5<7x*5CBBODosg8BN#DC$e7oD`VlDNMXJFsjos@9XAC+NN#a}N^Qor=ri^b
z#QIR29u{vz>G%uYih>w$YuASlwq-auY^Kon=_QI)+cWM@N#~!~G+ijea=+SoC@PMt
zE@N~);;2m9+qCY33TArby_LR~jIhcgwUFUxZO658GGAU0eIe?o?_PFHYxRBEK|{_#
zP5xGyt4TB2vJbB8%&(T~K91G6-X!~M0BOLn6I*rR(YiU)i=c18qE~fiWP~{Ejy4>!
zm#*$wKHz&qpOq-^tWg}z4=$+22_vp+n{slS!lnOwKp-8(zr7iE5cO~=yX2mR5Ooa5
zaT)YUIp&@!`8{8D!&NqqK2K@Pg26g<>kjVp*|ll^tlLN8fkh_wb61MAKXv7bxc|q)
z`hTlrG_~J2lNHglW?G#bq=#d=x9|aHka|gPN%eAJX`tRo`i$H%yVZ`|ih$>ltn^g6
zu-&M>j-*{a;_7Vk%KX&?P&b<@I3bT&@KFf5AY0|`!vIg4zacR3+(hxpn`iFdS-Bh0
zbcf6CU^}QRC84_Pw(!c?CUeOc4lwrxo9Yj#<nUoO2IsY}z3G8SFBS&L&aY=o-F^6A
zSNU_<iP=i2F%qYAF3r<tJ7)Tk9;~&tzyi(}eq=07tZz-fnpCbEcw1tv{mvGZ<#r3r
zhgIWzP{_90P(%@ZAS=u)^GfLFfYz5{aSsm^{A#I_!0S}bmnf-xdG<$Ov|!M>l$3a_
zS%!6?hi)~adoDYj$JuCTW>oj37HI~rgbxb>=kqe4h9{TzDANxd@9xNCCNahKI}N?~
za{q9%<3!|Wt5;OiJu0zjjqT47hd^nN%)anf6Eh9_>#0J2%zrDj;bf&#?aaZt+6S|z
zsz|wdM<m@g`x5=5c~&b`ioy{2zUbew>z$zsDr4_N_I0PwY?s(m#kuC;mem}|?jS+l
z(lnMW2c&zWid07-$e2qU>}(N`zPFZrER<)GT7jjL`DA`_wEYVBEGtX995VJlm+IR?
zX7I~2H=5yicn)qyVg~h!@2F)+%qWl@rtl1J-OV)abL50NFAC^T83MeaG+j@SKOulD
zx!q^(f}%2U2a<%h>%}pu6yPyUp&uq?coKR~vcpnwC8!m6-iNo|BN(AYF>{jpUY34i
zZmP4Yp9mi=gYToemD7F1%^K%rd961Jsa+CA$Ay%Qm@^nRZ3gG@j|Di*O15Q(%$pRh
z71gV!Z36Bh1Xr0dEgz|p_b=pfoY{i##KqVQG(d{rlojpchQaWJ(W1GfD&6N_Z4*Lb
zi&rF9^(Mbw57H#x`{o>MuqyXHI*;?-Ol`347ykFrn@$h@GzRN42n>^go<G=Ee26-E
zYfrv3TFPX!rpL)>f7y7q43QRsWqULn`)u*v;8uviSN;#z&EhI}DrF5V!$xk!#Fg{8
zgjl@^9d!QG&DhUuWzuxcdV9J2g7!Tx`iv7s_~m*+wJ@G&0^As5&8CXlv5-t!=f;AH
zyKB6+%-M@CUUSf;wV_IVb1b^+Ty3TG$kZsz@$I*<=hE?yTx`F&JZ~MZyQEd)cSgZ!
z_O5H0oz~N{!V12F-zHgmXdS7xk6c^sIzJ`3)LTg@I(#{Bd-W~8{!C@9ABTZkFXCpy
z`LtShsmC85#%MqBkcyx`B2EtKzj$)r^s(2~i`Rn2UNqn$lmh(>P7mB_divZ}G164f
zedP7;7tyv6fv49$jsBi!jB`<rFu;2*NXNe<rYR?+W%gT*m9@>!3OTs3)5mS$>Ao(5
z^d)b6-n9Y?Z+cU>hB@f>TdDjzT0gj!*0WE3w@$XNxu_&9Gx`465o1})Kr<)e;c=Qo
zdX7l2zBb1^JZhnx$F5#naRB12Ti(rThrM#o!H>y+kBX>@zM?iW4^?TVur+O^+9uC4
zn<sV)|BcT0pytnXyYP+N3Ml7vasX7JkRp43J5y=KpQW7K&GUKtYLd-@z#I2IT;#JG
zzCsWw&%(FboAtLO49^H*@AS0JHC&evTH(8XhpPH_CwF#ZNyEHlK&(o==mHQZAKWtJ
zWwuj1>FM`JV6O|BpmJ&1+V`+^lD}?PMSpMI$MoT3`wq=?jaTqFby;An11Ya>;T`7m
zKw!MamDVjh8|L;(V4~sHui8-Wvz}j01SVT1e$`!=J?ncSF!g*hu6mG<<sL%tqx#u&
z1=9aRlwIRXcxEokrcg+pp4a~P?74Sj?1Q#WOC>aKKl<$M?`FslDqc??^~LcGdNwrV
zWgTzwXYLZgIS_C2lb1@HY}!;_m|J4KnNjo=6T`{9O^lHLFlcY+0Cr-BZC~|{a*9e`
zFkD0NCd@`*0q}yH+l8)&?CEK*gjVJw_xeM9Vx1N}dDo(8txZE@L@m(C#YSZ;_RA0~
z5QFKx*KJ=uUehfgfBr4~>vgQpHNMo6S-Ys0%6o#T#pMuowZf;`!=)^T34U~HC2{Os
zB9Oz^gpVgdzG(KlT?s{Bgnu+%+t2IIedi;$IF-a}m>+cid^eNOm(YxE7X3NANTOcH
zTJ<-Us<~{0W@*i?_rdFXrCF?+rH}G54&E4S{gR8D<GWAa(aY`SQ*pbSU3iZ2^`pq4
zT(QshqT4A>XMLk)L`7()FD<qz{lpR+i6I*v_H@E8ErCz;z*@e2tHw7XnezqIDdeTL
zq*@vx6}3|-^Ggk&xHPSQ<`;BJ?lAWadz62$OSL!Yd^mTZK$N^;*mZEhpd?4E0QiOx
z`=e=h<T?i%7Khi@3FX!u2n??<Dj(>Q_>i*h0^$Nlb_f~CTrmVP82-35$o-o|xSvR8
zCB|~Xr*hP1#|LF+x0*YG5A)kaF}9X4F_#`!*&T7wY*;ibbeKJXbvYHy*FV4ZDd%w`
zWz{Sf^x+hR)&8X98pz0=k)9Q-!7d?NdUpjBz+Of>te>i7XBK^3JP^wGZfi1nXsmd?
zKF*IWq5e@{B&WU@YiC%;unOyFNeAxz;!M=i0^u=YgY{><(1;zPr%njP%8r=>0-}y#
zxnJ+9&Q_H$=%c<53?rUDVeHOD&HzHM{e)!aIr+-Cx`>D_kX15hM$>_tql_Q$dr{n9
zGqH{cZkQMz9%~hYVo*zQ^DO4M+as*Nmz<ydeh4;e!ASPceUF*?uJN5@ZkQ3bPy7ko
zX3>n85=i76Uw<TG)b4xgjYa=C;8+EkUWW+%AXKWv>BfO9`>OI<oQs3Xw&Tb9sK#=D
z!Wd~PtTx=(XWhAU_F#xZ?96vQw+OM*PlWoeO|b5au|FH*8X4nzHV%~jReZk*9ziAz
z@_!Z+)uIaXlMpL@JT@OJq2g)U2uM^``)53N4^hf<M5=dQRK-ym;>cUu0Kwq7f*fU{
zB33ItNGdFd$isx#r3E$7oP@73`7sg#*7UABQV;T^0%BwyjxfI<((Z<lHI53W2W!0S
z<m8Y%y1kZR;@qzsw*=mClsGE+J%hw;ZkE^yUYqADxu(26qWlA)^3ze}<WHUoo1^j}
zLKWhqdZ@0v8l%d_sRntj%9*bw$f<HNqINhkhJ3Ef>!ji|#9#NG<8S7@fe|+pg)zBb
zBR}V{YnR;Qj$AxSNIRCXFk*Shc8N7h%iC!g|MO{3{z|x$_Ii%CTK-9xH6pP@C&g*$
z*>#=RpE{2fbgytO#5rl@l(J;8jUAvlo3@Y#=okV<l*e4wcpkoj*9@p@u+KNt$!}L4
zn*W<6lnr9c_S4E|Tobc1`Z#Jd_#CqEbAIKy(U+fw%NiXMu_nD}`o1g(y`4!8#dur8
z=p^6xbPVdpa}?bs$`he)(4}C+BGf+z$L%1y#2BmSWq}~sO%T(`H9T)ClgMxL*cA$k
z9fQ=Ve8X`BntqqhKUeR$En<$-tk=)X;k_9|+5GKU^Q1;IPfm;YU8$?P<{)K@AF&p~
z^XPlxBa&Q}a$Hs^V-|NBt)6IFJ>0cO<C1qHR^zPNt>)oFar^RRe5hTSU2y}VzrZ!I
z%y34L2{JQoIcCL=wTr;f9GjCXuN0tZmg6UNDylOw?voe#P}_+f%q`F0BE+m^-C*nR
zj_4r#OHSOyk;CPa{4d8zM<?+Dr}9B3gAxaaQI5}Ij%T8rE#n!7=AA@e*qgqXvHIma
zsqW(DqC05o;5Y89_DfDDwuZXS>rZ4D(zH?cw-sFAh57NEH2)NkCH{k9Gv)=Vz`T1z
z#Edus`45K0SAoPEZ+dpP`0|M(*0zzV^YH5Ksxg#>whTg+oZ~)kOvmkedW27;5#pgW
zrTYZpO5vMvvj3x1bHqLMPn1ot-{<zbZ0kqQ<I8fZT4Z7pdCM<gmu1fBb1h2%(}dsC
z?*ZHK0dF4%JdOx-7{%vgx?jgD_v22Z<9Pe=0<co9M=tsPrOLA6jC^QLq`0UT5AV)g
z(9?PL$R_>NTOr42&i*-GSt9tU6IP2-^}1JdPMlL3?M#z~R~Cc%#ZDg+McTHQOyM;N
zn!ayi&E8Tv<=H+hDOtFoTt;1eOA8`a*8@+ASR$SBBG+B%Hzy(<L`40Fjr^JrF|8d%
zj)-1vin_pMMT22m-}^^JoMY1QW#f(da;synDJqyNMoQ<CyiP=#R{LHl?x8sM(Ju0q
zmKw~DSGCmi9l(1ejy)zK?)nQAiieE*^MI?kaud!Um!5y{hO5nAVr<_1Nq(U}Su;;u
z=r7**FG}DO$|F2oG#8^94r0dL;L_7fog!8X+>R_Ipg3<&a=n1K`}q=GlHc-T2G36p
zyQM_ABzumeXz)%goljYxl=`6)ecAT%*O!-OpR=5P@ey2@ayW5$-ffb-@bWJgA;v^E
z@*t7ryiMCX8>U5DB~tt`C4eg=;+mMvNughG@VwL3>%?;UM2Er)xyXxUJQC6K@OqTu
zl~5RAPD&jF$1O8#p}7{ugBs`jUyJkX5DXU2iC9+GDE=Wj#Bz%?3VHd(c-oHS$rJbg
zT)irv`LJ;OQDJpm^QGsB^p(w%?ah!b_vGHhtar_X_sv)H8w02Fvf7$+J~T&-7iPbI
zdF{)TRF3$y*}R-5g_r4fG1qHEu4&o2@#5OJ#i8ZQ85H3mYJ%<FDfc}E*FwczafY#Z
zfonjz8kOxD!S;zIo7HPn{e%YdLoR<1v-+9@HZPUhm9w8{KkKx#qOdSL&zHf-7^3GC
z!H<c(aND5dc1p{2BLD4kgYD@pg(o?ueQ)Stf+Ox+_;}}urqYMAj%SrL;_pO1zGGf`
zy0GSB5y$RbHtxx$3%B|I5OtpC<}k<`^Gjs<rSremuP1XH`SI2*@aA<TxWL3;Q$-#5
z6lsN1Jk9C#JJ<jzYE_VTJrwbGPKRBNf47S@cO+;N#QcpYn=?{o0IyM>C?fwtU%fV=
zo?l&s*TNo1J>50tFC4dN{p{#b>6uq)d2s?SQ2D*^*4a;$ZY&SaT&xn-tO-0fF?_qQ
z7ZmaM&O_^igBbm4&ph9&9uwKExAR-i<)EL{e$6Zdf{0*yXI{x2bnWqch*4R7zSxbd
zPy{a4a*yaoKq?Ndl|K-WFXdu98JhnslCYZbNbc(=sqX?$pSNV?KYDt6R|;hC)Gy+x
z?f4@Xfd;yyah|q%mg(#3--Q;$?z%j&gp55E^?b_E)_`q&=F9y&AmTatfY@-+{kk06
zH6T=L!6v}7DY&TV>~vF9Qj-ao%PWDLL$hH)&1BE!D}v2hAm%lfYU*VDIKp_)`nel{
z`>r3IZc>Z)vlh1}9c4+a4sESZ4_jUowLUhGfBUY*NvW;Up#8R|KLeM8?Zr!X+}k^*
z+e-yITBe^)7P&eNcKqS)+}9O$le23md8q(?$u!f&X4r)GS231O{Vgtls6*-tAh&Kv
z1T`@$3w3LFb-x3cm&P7QV1!RF#YD{o5nOwEw|Pr%+x4e$bQ61@;hw!`3VOYZ$LiiY
z2OK#B8(u#v^!l8kWqi9%gqK!Ia;3R|@QyYt|IsU#c5~0<H={XEueSHSUGE#++RX@i
z8@m6>#S%NtojNn`{_Ylesgxsw0Po5|{#``&NZBIMoOa1hxQ}di7ZO&zlwMO<>Iq@T
zenNa8reQIWiN*lcQnF)lA4i<j=vl@El-0h+!(PD;5{aFB-Yl10`ZdNm5Gf;qvm+`g
zy;><B^t=g1_sqX^arB`-EOv1he(XGFIO60zCMrB)D?BcfGJc_D{6+DLY|HfZveZlS
za0|Iqc|QipV)3yfr0k64$sTA(ctLiF%7ZDkYsB+z&fhrpW3?iR&Y)xbiNkt*!z%ZT
z@);|?h)wp+rUZPNvGg_@?U;G*-T&seqStTs<FUj3i`!>r$7k<-o;UiuEnH2$`0kXY
zsFm{t^ELKP&eTMhs4fwiSIR<#iQ|azh%=&M^9+4>ajsI9RI<3(edfPiqFmyhpXhAw
z-xKfe(qHvU>P^tApTh}Lr<pn+8?#Zryk|<eRu{cjBYe&zeO^81LT{t77Mnblb-(J0
zapU6)bGD%`%`c?xmUe4oBp;O0M*p29%XmFd9Qq(590fLP>dl3Q*NXGPF#>&`6I$<^
zIM1<dh`9_wmpRIqPgLi5<4EyuN|g!ToX+Q0C><*|e75KxY%zV=ViVo|`Qq!x5Rq%~
zJ@4Q`Lt{zZ54q*%k*Rp?F(LRP6xZBmQF{uMYkr^IpKn3rvibv)u`_}|kIjmRD&PG1
z?F;MzEe13gR@X4;@BL(|(e}TIf6+a%@80_P?a2&|YXr)>J{t;9+eUv%1uS(W&Oh9J
z2RDC(1Ihmg1+{6}<wqVoyqscKu4(r<?dxa#vtaSUd3HXM=*nC`+~wrN%X_O2{;q%d
z`{T=KmPt-i>qpBFR$u`xaT&@aV3?s=N=;)H)R*KN?C-onM+~&m2}n0l4?Oxcz4Bgw
zVu^vXDp(F9Pt0-*D)tYnZj=qA|0(2Cj2*-mocnt;wZnT|Ov;`v!0+x=%^Jr$!ulCW
z|4WqZ$kclLpD26Gs9ihN5cp4&)qe8nMR>QiH=|D7ObcvP=&GsCQ=gWfWkTXjI;vjb
zUK8SJXE1b<IeV!CAs;>rF$-#h+~NALaL1%ao~t2_U%6^7O)E-7@A#c)ooq<|%;Fnd
zR*~M%OcCK6!N}33_N2qVEQZZn^F3LDCdR)bHkSwZ)eXujeSdx>W(oTt3R)AAtz<-&
zBJDp@<2X%A$F6Pp<Rxuzuf)35KWI&Y?l-8!3wB&0wcVhJvUmcR)dEk1wT@FRy&F7P
zgvH{ID)FfnrZG4&V)Ml*(G{F7ncbot7)jf2Mwg{&96KU?cpWFd5S2UO0om$97Uh@w
zpA=3S#u6wQ#?2oc#jj!HdrtA27pMn%?M0*e(`YJeV1XlY%s<D~=jxeT9+7%;IZpE2
z4EW~dMK>K^X+1lHd7-77+Fcyq;GLMEt3EfqK3@&Ke{u8eLtUSdeS7|`ee8fTF*GJs
zl(4|Z6t_Pxp2HKJO!86vte6>Eb@AiJ;D`4wF@{xl9M{NU>i0ERHJUa^Sw7p<dLcE3
z%jbH;p!;xMz89h9jJykP8N=&Y&dG;0ycWr-ZKz;ezaBnW5HqN|KN#P~F{*wtJ!9l9
z)L{K6I@Eetx1qu{w~%;lLAdD~qjmVR%}%DMb~WY4o5}-mKRLbUggAQ3*X?u$<1bZL
zk7-?6<9x4jz^oo3hu=thpMGM;9NxC$lYQ>Bz)v%krfvHj%Y;}53)SA1?e4zN8(o#G
zoR^?l*URVzODFZc#{6T33O(A-y*EB#)^rgLXnX7vfAr`%{-=G6M{ewLEIdVHecZg*
z(l<r=JvwSIe)27APK~tGp~ia-$JKH8kUP_g-3#r(-aet&IH!KY9{i1`d1rqZRZjSv
zuq4i%Cv{X$!N)oIw9juTP3d0ZvgLJ%yXn}sknP)9_JtHRbYT^S=zJjEt9k++5<}-e
z`o#;jAY4+HLh`Ol*Gw&#tNm5QGDy*J$Fh8HIviz@xQp7%jVpZW-Ou4jIG_A8UVr(*
z?#L-ov9$xKM|6CbHWuu-3cX@+#-DD1uPOZrLG+5Z2~n;ayys5sJlMF-NvBphypjBu
z{_D@V{)3YTf`blh(Ln?NI$(d(l+T{QnF2tiyI5-60Wc5W9Ps4IeaYr-w&sj92Uc|M
z)^{rI?=VgTPEGx^wFuubC^d21yQ;ncwrIX+VbB9~i7!jY#D4wEv2&|iY{-<rvvC(e
zV_`*{dzmc^K`t~R79_?lUqmPaGIfoZ!`?_=Vs}%V!&fJ#M)B-PoMg-&anNx;8_t%u
z3Xt5X&(b}}LZ)#nq_v`{&4eFt!^U!&-;Ps+eb2D;LUP^H<(37PknHyX#8X*|_n|lR
zy>^jO$Qx`Pg8@S3_;eHZ^RG28#pFnZm(TWhwVva<j(k%8Npv}nWl~&@$1sjQ&;KjE
z<Sdzw6munRp_E}{znf=3w?~)t!<#fsc}8SXr3OEu&*C6E*Qz3upLM^-TzgS&#$Hmg
zvZck+?qQw?l%A&$&!j}aYB_X)HLx{iigR@L|CT^`>gUq+jGyb(f27j|x~)qK${w5u
zNedK;>BMhAm@8#roO|>1N=rnBY@ihTD6KywtiWm*vbu6o9clrHIm&+)>UP?jv%Q|K
zfp!SHYwgQ8TG$^~RZ)>)w9)XPg5bwGDhub!EM;@pY<vi%1fc6~K)p6FOt3>!MOF~&
z9j#Q+NL`X?Z0m=RM_d77FQm0O`Aq@ToE#s@pX;T7?m6`<RpAi|wl_vHt?=>E`x$9G
z!(FZ31r(m99dqv={jHHDrCuHxi^^jkdQT5f&vD&()0C?@nG(kRWc%AU=Q_EOaAQZ_
zLHniCa_d?z{+<$X&Dg+hf*xGL5wCbyVC?MIZ;XSb7)Q{2oO7JlFG?mfIL2G(*ezO)
zcE&s_iNAfOlJxP0S?_bp_7y<n^i18=-<MywS4MM|ov^AFpp#7HAn0dp-Zcl5d-rGP
zcp9g3dOndF)G593{_(S72%Xk9`jO6gMYc>R2M{{|fVs9#AAloTx8tik*$ka3R9Tp{
z6t_-R6z~oodFA)$)?w1@rm`zQ*O%<*_wd?RuDX2UaOG|5eE-{@uT5QG|Go84`lx_0
zp9>J|3g_~s`0*Yx_v}CZl*tRe_FQgF#6y=_bZKDW+Bf$ARh}!^x2+c=kqw}QzU@4%
z*8!_^Sau8JQQbnIR5_ro*X^@Y{sU%i*+`U-AOQ(^;<b`>rscvh>TY3qps@7T(onKQ
zZ1Fa(kD(YpOuml{5=X6}i<}1+=F-a_fLBdUy3Y<J*EKpCgM`IB^@A_n+Pwu2b$zZr
z^177gu`Zv|O^c+1vx*&?`T`AKCHE<z4J(a#Zue>>81a+sFaYLX?C102B6vX+0E|^{
z!ZrjZf0V`jyw%n2VV!Z=eCt7@%tUC=*`(?6uwU_l^ZjSd`-JhZvgSKCBO)Is&7L{;
zyXA{*F5yY2X(Z`oWaQvx^17hzX4Uf!?nax1QW?km10AvLjvuKCLQ2Q4g=BEy(Z|kA
zPZ1+7JvZ_;)6N>sv%D(SiB3HCeG9_kN^5Q2)f0|RE0%+QX@2K>?dCP#I*tkNebSM7
zU7+0?JiHC2^o~2rXnIDJ|4Pe;b4ou;f9{{WG{;w8^7#GC)o3ICRkJyNgwJmIS)(D#
z;9~WHq2fzDWX#pPVIx-1Y0^}gi`Dysi7%TAbw6#H5s<@>UBAgu92$pL713~X_?g=#
zyqS8vZsyMfquta!y&ka^eWd0U_o+;dKNb&|t{Cr8&t7_b#aGZ+IqkmoE^_IE2ZzZ>
z<eveWxp8CT=$@%KNxsB?JMKf=#U=kktN(+&JB^3>Z}|Q{#>^OuSrC$CEMw1J$U4Zr
zjFg@1Axa`dj5TDLL<z}S%95?@j5S;KBwJ%E*+L6h|D*ct$8nv<bzbM4|KoAqpSdyL
z$K06te&3(hvmoPZU1Me?dmTK=kcuNaOVQeA-#C)@A-B9j$A&}w&Xn%?#6~f3rMsEz
z7T)3LaxpFWM7zKUme=TN{sX=C^Ms9ea@#|fgDncqljOq#<bv@ae@45oP<J)DV8G4^
zc!=IU0NzMEfQ1oQYln3=Zp(+M>a~aKEtcS?6Xj8U2*cCVvv~X}Nf)U_UAhrW(IMX;
zWxxC(2-9(*_=EpGl5QaKST^A3;1!Pj61qJZ?-L=kRYcI{8m$ot@`4Cjw56p=#%=y+
zlYvl14Cjp0UBW@w@Pm6AJRhif@Q|n6;a9~uPy2=Qy#&dmgsqn=6&l;}x`aAaIjs3w
zPmyS+a2DIBFsXd+im>n(YqS<?0zu-m#5<aoN+N<tXK@&*Ko{g2BFMQJW~PGlCuuKe
zB12{MBxf1;!c~FH=8i6r_o5^OqE4i%fY6WGOZtKLOHdpA5LFWW$xZ4SW5d)nTBhWK
zz)&A#e3j+$d=%M(HCmI;6G!gjB8XCEkm;x=<YOr+h7O}%DN(UzxzTB(RHzNQk`g~s
zCU`l^plAWnNC+!GXBjtob2ihgqAEgNL%a<K*#^)c=@Aw4h^m>WL9I9vE_U51x>GCR
zWm&A5vG4R_&R8Ny51`se6q7YV&K?0b%|k?o7^bRhLZS$(ucccv5$D>Vv6<W;R|51S
zVs{}SPaT=<cqqztMMZ8$A$O2|bQB2xENazFy=}a3kwE0!8(XgsFFu(&km<z0lL=g%
zcW!tk95BGSRGA&g94rxubw!dn*lQ5xvsH$CkYpq3WcZ6aimu6i8wYo`bD-Btm^W;b
zXiJl+nv$+ufjT&7o{7Hedf%4QKiT7Z(Ao(6nhNA20ltq%Tw9}a#DOOy!p`?Yc2sEV
z3DoCokM5&sEK9)s3kVxm<c;t5uE^c<(Wdq2hd^#q8;alCN2Y|Cr;xSYwbO|oOp-5Y
zr=Cbm?p1>v4FPGDq;T6(if-{9x238_1ASeAmVkhrH5eZO)+r7HHKl-1@G|YREkdeP
zN$NflUV#RJv9!r{RNpU9Ro+iStkaq@r_Qtk*==EYA0H??z}ShvZ%lWIf<V#R)V|eV
zkWtz-V(Pvva19CP&V;BQP2abrTKb51{t+>+joj%^2N@lJv&kN83EiqTa$OtcPrUY4
z@DlbATz$asRDw*fVpTG(;gFjj5vpjKYi~0MD!)8f4_n~4??Von?1?NWs|6BZfr@aY
zthc4&w#dYgcRzS=)NJM(NY-VQEHxpq%l#C1+soN&pnY)^+Ze<RkI+H`*F1B0$QUf~
z9(RB4`Hu)g);wdk6x~I3NgX7i1k6dsU~zeJLJZ}Z_R4Oqh5Zybm0X`i(Np~tg|?SB
zRE`P(5Ntmz*!$v?gPByai;wfgk4mY8ZQze4lb78V`M2Ia7NpKRj?UgFq2v?K-}lVt
zNllcThBQ(>PWxfOUVHkqOY$IbkPpHC5%n<}>EMdoLl+RK3vS&nkd%O%;qK%KIU{u*
z7w8l|u+Oyv6ndYb8M#~NI|9oed(b9S<Uh#xs=x3mH{s3o3wGj<hZc)0LmziMExIsB
zXN$ZuTVwxtj6!w0Xhnx7zMpX!UwlE8TJz*H;ctb)B<O0_Gco%tcH5%OQ<&{cu!vyE
zIvA?oRJ_+!LSdilf4$`VOcH9zmU^7x6grEpptQ{n=0{V?D35WXE(3on%%=e#tt}Po
zKGqHZ>r<5Q$YaKUsp7ZJE!&pzEkO%1%jLVv6_?7D$?HAg3N_t|(-$i=Z&hd)ROohB
z=r2_m(mpp5er~M${M^NZ=eQ+k{2D}<R5qhie#Yy;`2g!>Bm}uw_MeNg`b|JP^fP;T
z3@oO~p_|6(7$||Z`nGU2S(GJ=Gb-S#@Ba{G75W*Ie~7Zl0o4yK)}-xJ=a5BN;p)7A
znrCS>g~GL2OEu2|YD(p6t1niw+t$9gRa-+_hyCfn_SdE#qtrJ7Hqq9#Sk}F)t?nGB
z=oYTELqhP#l3Vf^g~gn)TR!Y0*aEs?R<~i^vZ2^BRo|{*sk_1aNy9R2<7_|z8IoNu
zh}K6neC=*n7=PN0eUYDf(6}w!uzM?Od%aN@Nd)Q<r!Gof>LQ-3d;k?8e%PsIR&8X^
zYgiqpU~zBwOxwVw*RWf_iApCj)Dcl$L=3Evzm8MTz4^#4kx}aDbt6dQQ$ZMg%h+@?
zOHVUuknswjd1k44ua=D&*1W0JjGbs1Ds2%9%n}}K6^6A4^c2xsHR`6fj1Cr@RN!KC
zDv_z<QA})mg=$;B)wW|)rqa`-mR`TJ-hz#Vs}-W10^5vZIlSu{uZeK^DKuPgC!Q;8
z<|=&Y5PQ5^hq;wl*hJ44-qVUNYz&HRzpT*Y9?0biYfe&l8DB^YD{M)1Z%@~21Ejw+
z6yXhob;iO(-m)GrC#i_GBE2iiXiHV1jkyIJ9catZkxGxR=EIl+6^NN^Tz3l_Q>;1@
zMTo8Go!M3|bL(Da)HOU#?=cbS=&|bR-R&Ok=^i~({NX9%B>;Suh&XpsnVgt>WBbg@
zONgA5Tm{fHVSL`|F+YO!&~x{!-RfzZpm4Kl++=$dGV${BL}!<KLqA*BU@ROo+1wl3
zzZNU_Rfstj2N5c}Mvk4jtMd0s>RrMMU$}W4R?p~N*MB>`@0(ST(V4#G?mqBJAD4dn
z2s!3^gG;_=(6_KtYGuGnwPaSjTxZ?4;4Do~Nx_BY81QYx4d0<FsJ4@F9Q=w6g7w^b
z`V9s}gOqd!L%|~bVsWpG6PtC|`=LFrH5D;uwWt?0QOUkg{#NKD9{e;%uoOTOCJwJ-
z@V@~b;j|t)w>R7_(u&!`;MiXVvSYO4-k5l_o!1|_U`f2X(I}cW>T_IV)0TF8qfJEZ
z=_?61Q$2I3%1FFE%2ILEUvV&Cugt4?_zYc}?}OLcGjE^V;JY<B8uO~C@YUPYZ1^>l
zm5~=>Hgml8)p(sX#2^2*T#@(I-dkDw&PR&8Ut=d8(-9*lJEE+G9OX0ab5Azci?(@=
zds7tbB8MR%+!)~0^a^DB3?yL_xrm>7ugI`Tm`d}QEIuxbSt|2T;D1Rs>ZLkS#y(oQ
zH<sdcP?fszZe&HXCmeY@6MQ*`*~Ij%^lgElOo8HAlCvay_J-pu5o(5qtm9yCIOGjC
z32HP+<bL->pMT@VyAtaO33kZP-t_SdW>5wPG=q84azwJhbm7&h2p@zKfaR(<ZWVb)
zV|s=bMOs%JOO>1fG|UVr&go|$v(-*L%3%#cQops+y-5IJQ3@@y;gU*@C#N(&i~BTY
z%A45=P;t!}6nppS%;3+=xxqi&4^<p1r)>j3dNQe}+H#UqqSjTEzlAC1UEvBfKsw>6
z8wsq(I7Fwwgw%dpSB?+2ML*uz$FR0yIi#WA%NX*|Qay}nQr;jX)diH~q7xCChd<!0
z?KiErI6Hn$nqcs;RCKA_K%4p_R%#hxD^5pQ9zVLS5&4yT)^}cJKy%TStL-duSDfnU
z0;0rVsSmy~0B4>H|Crwl+9RC$E)La1BI=TK2Dz4Zj21g97!=nT-bygOxH2@s&Qd<%
zBzK>8tr)pc%(%+VyiJ&TrH)!BOvzMpk55hpG)*mde1bF~KGqKn#`6pZAub`o+G`Ap
z{T5GDNZ-N@n}R@Q#O0Ywv-)>f3kF!9p^lZWFLLyDKvw4i?M~hwqysmyRS`O9Z_6{6
zk)*^vAA5&<bphGO&vJ8tl$nWuuacBDXvy`Sxn`I@9?akRF$hOE1DqxIk2e-VsGUfp
zHsm>YvHYgEO^^y_sl%6^5^N9&GL^S>%L_4b;?6Gdm2fu4vQf|{6z69n&P}_GShiI!
z>?}T!O5KM`+z_?h|7`)aC@Z%G=Gu~MisGwe>p`E}^aPRcQz}^(&XajqBIpefAtD!n
zd-loN;47#FHeUqCqNs0YA|8`@SkfU6dqE2B9Q-ZtBsV6J@!bl<Il3#SVZJu>)KfAK
zTatL2^p(p@zS80IzU^+~Rk|e4MPFvxAR_dX$206r-@!hHRT89%1h3to4HKt@I?(1J
zX<JKfg_2{%WbM2K@kAWjbOez}qDmql_6YJp!Exk>G5PmDg57T$kk$82B@|4@6wBO+
z5Doq=9p`XXhf~>Cv%R|eO#*$ME9J8z4&E!qB5`a~@#9qkWF)o}Zp7-FVD<xvHP&7m
z%Tjx@8&`h91NS8C^exHHYHL%d5X$J&tSnE=+L9rA;!>&S3QY9TO>{9I5ceKx+3i&e
z`v_={UW%1|b<8iJ)1=0S);{Jm;eJ}EZF4*2Y{EcR*lgG6>2$Mo`}R0?<w!R34actJ
z<LBGc%|AQ$K8WkW$coaGp1Inq(d50N)sW{DWEcHduq(@2Q$SK)6?f8OyeGT0IS+hQ
zP?nVP<TF)dN~6Et7nDq~==lr*r}r)!l?Ac=XGrk};-?a+^j>$RS{a94@929j`F8hv
zh_)WdAe-{lf$GCgT1Tz?7llPB8Jvj%d>MQ0)6df6;!_;r=NFC%F!8ZybJL6Lh7j^D
zUW>8k2<oq*p>uY}hDAeOSKn0JG_waXTcuRpJjyqLhR{A_Qqy_D<NiI5M`vS$pGgOF
z%bvNQWN{g)TmfiFu#TY!JNkJynu=DZ*p8cHKuap_bRV=?SL}Gucg&+|h|WyLm6WxX
z!aMLCNdvhLx#b4(pIW616*uRMh5I4fxv|#nb~FslyXGE(p1Y-OSqcz)plFa+`6r`b
zZXX^opYYn{djdKk-4D;hg`Knvu^54bc!-w+;lNt_3S~Mm1@|)Hv~ZfYkrnsA2Pp2^
zdf!7W;%J^=u+9@P(^Bq%XUBq_kDiejfRup?d6?obg6eUKFB;5Pj%rp(-98T0y>P#}
z|Di(3V&t>X39|tvkG&G`WWbbgWGUP1Dd5}lpz;U{4ammX@sQ#T5o%wi7|dNP@Ed>3
z6`g^TF@8YyBtbDUXpQ#1{i^+el$f<3hjL2QI=}3WW3|)0^O17S_b)v1FH??q<-q*l
zb4ZKUp4qXtocj3X{)gH=JT=u<b~_`7y33C8MhEW=WVh$tkH5a?Lk$e0e-KQ;|Af}#
zx%;aSooL4lcAtjZEHb=GwMyj)PIm{bnbY{h4}xQ^@MH);##}OA({Rgln6+!WO&knI
zbH8(-`lhKKT!U>v`%%Q*rPog>{X&@cl=c&JxYA_c5(!DAqJ8;JEwQ|Mm*ugY3>%dL
ztMbMmf47#`l>e-l{I?6wLbH(q54|a@-<G7_yU^hO;o(iC>kF4Nq8~n#wm+G`^S;`A
zAvf;P@J`4n@0PoM6`nO^mJU~#@A1}Hy|dQX=+ZRH526`=Sb8~6?;-E75#3qh+Ot6P
zOY=`p45xRgh&;m{XkTMJ<&=^NY-{u7eE=1cNnXV1*Uv0br>tgXn3#_PTrWHIQwhYE
zur+>d;nc5YgFN?42=F9arCd*MP<>o_$A!FdIOuPd{W9GonG3Uf;BURmdNS&vcot`-
zthy59O1R(IPuCkh!`8wz3D}+)b3JL=cdF%*ACm`SFQ_}PzOHJ|Go$u2BZeN^xQ*o-
z4Go(-Hnzp<0}`3TB%snXB~sRo)tf^YECke&Al%rO?2@;&7Bv`&xaz<vEUlTX`hNSh
z=NrqK3^;0LmI|b}3_c6ylCL9}f(J9ZHQ%W#8{cD`Z4juM=75CeP&=T&$CC__3*A{}
zM15YI`$oyEsq&uY>vZI&o=>)BQNY9r;-e7pP-;DNkMyZcxwhp3u1<w!9hQ)W5T{wF
zi%Lrte5B?TZ>im;pCvu;#S`A#W_$8|(*w5o4tgbx0x1i<_Yp*+ZUGTDxKRov>zPM&
zCr%D$AtGGVF=I!A%o5N{$$AQ)vRk5d?`=*AI$FW$pN9CY>GGY^AwT&Y44rGq+m~$(
zMh_(<Y}4g1@8vt1b<tlsI(IY4uAR-L%6Ry;H0P|RotjJ43HeE$CzKyuPk#!JKGVPU
z2=wu$K6C~yGeA&e0ADm~J7rRK_p5|0`A~leQTx>>9JYJWrD~T1k@+H>6MSdk#KIyZ
zm^+d_K>xmZWwTO^0iDF`Xu&CPty%lYk<x@BbA^tUqbEYnvGdmJ8F1B__g)(*e+c$)
zIW2E7cz2}Y@o5jYU!v@@2oHCs19{7_k&zdbZ625YSCoD8w%51)D*49S1*OfmeZdg#
zOt7MhD)U(XO%3ntBlRvCGGhY?k>0r&MOPiuvB7)o-j7byyBhe84LyYT<R9*W?~M&V
z)*$bK>)lK$$6h~+^eJ>wylC-eY^1W?r`V_dqRr;mn?}gBk_bh2d*<=cmm1f~lIz`_
zWyat3MP94OQ}l2%9Uptse(lBcdXG!K<KyojzEy3Cm%Q$cPkhkut$AI4>00IZ<flmA
zx_QOR*WZj!ZMOS1{I4kc-xp<3e-&k?DS`h#Q)0<PY=EchPbKz0Bx28oo)`+%O$fVg
z8ZH|e5xW|pXc4L48Cf(OX>=*-xlJ_oYP5=XbjjUl{7AIPr)c$<m>9cTr&D9YoZ_|r
zD<AeueA2`0q!`b8rjhq5$M3nWr&#6RPZ+=N?wx8Gk=o>!e*RW^O?rBI<O92a42PnO
zI};gB6B$?6Gn_~dul_qC_VXjJ$j4VmkMXmQZ=~iEtMVVjJn@-+8eULP__-h;zR*9l
z=v6~;_Dpfi?PoW#pSArBhfVpHIBfMlaoD7#`t*i|hJ}VKvJ9KwnDS2?wy^oZ{{e@6
z(e-4qt8Tfge6y>drl;s{I4p7C`F|US9UGq{`>;Q8*vZN1-+kEEKYZ9XGyP+;pU38g
ze<xz6-jDvS#FB~FcMEU-8%pfX_iqOW2LLjWd;r*^X45LkYzl)i2w8QMWVPHx^5~>%
zm1eiyVv%y2=qSy3nSfS{Vbd<l?Ytvk{M4$mEU){XxI<UEcKM@MX|h)rCpya?_dQez
zqhZ&n$REhjx+7%WRq<r#F)l~vfzI=%uM5n|-6p%97rc39+Y-aB`=an|xy#T~>+Tmt
z<CUJXT@Q3CizjRSJ}*voS3Y~!h^M6G(5ot$Zi!+Lw&|%Voqb8*(aq4SE}QR8k-9k5
zQ(gX{FH`Lnhki}P$Dw@V0-IMg&zIhmICN*|*S=U8ue!Q4^{Te=(>r1q?SD^+{rG1k
zc8(tffC!NAAR3onO04~#mDqkpq_b>hIMcO-tRNQPXfuMW#M(3P?XNW>{*4kli_rf=
ziCrWsv8Vo~#IjC19xAa;NMk*&$bTrYPJbw|k#YY}VvC#lW!@!y>5*cw``klTVn6GV
zmDrqa{*Ot#eR+a*LpmZql~|w8Fr_0;y4*5KE**ReqpN}P^0NZ%q*@SUB^Ld=5(^aP
ze$K6mgcNa+5X2bAXs9u-dLQdu_ayjz3g@3ntPzsCf_{LXYFn+iy7WcBTf|Q#c2V_*
z5}SbfLy4^cq_nY~852KKMcql=sX^CJLRMm-hf3^gyKo6)+dq}qhlSIJN-TpeS&7}z
z;~_$4G*9J80~0V8Rme(goPypL{&#F;Ka^N+5u)^=5_>n>Tac{8mSf0DY%iDnu-y+O
z_8V*5p%NP;B1{lH-h)Rd#RZ1Oar*0Beeo8!azI%z4AdXeI#gmyC2VO2pGdT`l9kv|
z=|d$}`ize7MZkn1Pux!>Hmsf2{!odn`I8b`pi5R_zi9LH4Ie78mSiQiy=Rr`QIYgd
zC3aipZl)1giS;Hcv2nkY*bT0M;$rC`%*{q--n@zy0_LXl4<*(y9RCpdB@A!Abu|h<
zdZ@(e|6eJwTVy463lcIDfkm|<IMslJYSu#~R_u2rcJ7xF`<jm8`)^9DBS<&%DK&RK
zS&98Z4PX^gF;mOJ_nbIR@dSU4Cfx=O9tO5h2&wR8-mK|z`l-amv`K?_6MQ22@qn(o
z4B#!<^|u3}6J-=Yglh4}6Tg&L+aF5o&=&SLB{oi$ti<-m9o;qr?Rn0y4z4#0%3XxC
z|59Sb9U@16Q(}3Tuv^n;TI&28Ndw`;KP$0!C8lI3gL?)EJ1*le{2xkeYDv#!#>Jx_
z(QjC5Zo>i59zi{eS<tdWB~}e)|4WHwIaFf#{-MOS1Ai*9w$Wx}CHBQ{N^I$oFD1V#
zu|A_W(T^_tP-3zD;J+xb>Y&h+%jkL#p_!FlD|CWzJ^u@pl7-Q~Rbsmly4U}r#D@N%
z#4eGQSOuPcp~Q-Ih^5jVVV)6ys@?P$xW6xu0{zC-dxt%jvlRJLiIw=TlvwXs!@crC
zOwGSnV&9UL*p7cFvEu(iiACr~Wd?uF5xQS?WXSAaE3qeme^Fwc{;I^f{auOmNB&1j
zEH`_S&drnPJJ#og$GpDZOQL6U^KDEU=YDotzwL`AQ#a<6DC-M!#}Q~kw8qmo4z0#v
zc4)P2)MOLWi95@a_6K83Ka|+fzbLWKBp{n~T7ZRP#+Ux0#QOYAi6v3}ro<Zlk0`Mt
zzm!;p-;~(PFm15ekQ;t^41OsZ{TilypJwLPFC{jYGcr73XZq<&tKQXnIeQQH75}Eh
z+6%(Y{Rc`cMT;#>g}2ebPbJp=|5}MX`a_A;_?r?t0L6McGy|_!DxgdMuEf^-S&4na
zPgY_j{;9-1`l-aW|59R;ekrjdWF=PVhZ0-%ONqVs@08e)Ka^OJf1$*Zzc6GaR^bmN
zcB=_*{3j*WU%VOSjRZ;mP-3Zg^Plia{I0~J^rQZ#l-Q6%B~}BCh_eNmuhC5+!zk(h
zs>Is;Nr|-wDLYb|_k+y)!8HW9%TFcNj#?QhqyL){Tlyy@*7%1Ki~W~MEb>oE?Cl>)
ztk$6t>vOP1z20W!;}Vr*7L6T<f@iDWt%^=hVN5YYr;bKv%f={kA&5VeSmJ+IiOnlf
z)+Z~ms6!=|`0th2hksLI$){{Ia8?e;X<5`)zl6KLE3uihJ8RV9NxCsdK!DjFN~}1Y
zwJlI1Q%3)HCAR-RQew@2DY4FnN^H>&C3f_8B^C?cMkBRclQ6fvjmb*v9F-VJYx9~o
z-|*RC1{tbH;*($0J}vyA#FqY4Vuzr=l-P>DDzTK*b3iFjR$}i4<u4_cni@BglpI2t
zi$-?*P-3H0kWqh9VgtlcBlsUmYzNHeHzl^`Un#Lg_}`S+JO6<aI|RD<Ly5ilXC+pN
zti)pB-~qt1-<8<gAlbhvvF$&U*q*;Cu@`?Tu@-+<Vtf9n#M*)AE&fnqbAKwa+Hj>G
zN~|^>rnE-!jI6}k(ox#c0c`)G#M=E-Vkv$ovDLqnSXn%9j*#~Z3E^3z{hJaS^d}|O
zC-Wal>>BJ-i-gGI-<4SVf2G8_{Y8n@$o!$i9{r`n=Gy*HVo8)yKb2Slh^2(;llUJ>
z?A%&G(;}k6t)MD~+yeTc#D@H)#3KKp#FGB1#OD7+iPcaMtofnD*8Ee6rT@DU`|xi{
z>>%_|i3R+j#LD8p^V&2(09C*bCH5RyiH-U{DzP2^FG}pOe<-n*e^O#k{iejy{7_<5
z{-MO`!XYZTpE5K2mntcnsva#NGKFjARQ{yI;$hN@luAF8SkE6ytn9y3Vgdh|68j7d
zfZ+Zol-LbeN|Z3>iy)9&du0y6maF>mDEjPI)=wow#=2$$yQX<$)chdqi!uBL2>ptz
z#ClTA_Z!TU0suhjd0VuILaR6sJ@477mENjT*Qz(sY7p2;uvHS&Z9Q9u*4S+|OK-CX
zY@PFJKDXPpSK4N;(5@5sONoukY?&v~URtKrjHMeTE3p%>zbUa;vJ#sPHYY2w?$ic#
zzbUc4|5Rf2Kym4<E4F_qu@fpCX`ZbU{on?1usK1;zJ%7e<WPytv8A3M(GJYf4&mTA
z1h9I^pOjczcvlaC{&whgW;68_M3*~!Q@m?Lgf%ag{4P+l75t(!<xM2$B3VKaht5yH
z$V#j|jz;}EB>{lD*-!Jk66-*O+~}uzk3@aPfgt23t0ZJ|NuLewml8Ygd0D6KP>C(V
z!NUlLO02K#zffWw&~V1}K1dd#2Zk#CFO^td5@tfBkH;Eb^qUepjE2Ri(4~`T$V;6V
z60{kOtm>zVAsi~P@g(T?egu&2P>H>b9*HL_v7R&`ghM43#sx3O(=L^uHVLpP(vjm2
zkiq(>kmEz1X|J>bho-DL89fF*ve62aP)}q^rv0R273ul_FDEjAIe(&Ki%UQ;cu>48
zc%KAyM#5q|sma?s8x^`vH0(eD@*Gc<O+pNlhp;P%$_L}M9?%;qbPi<k75j#k3;w_s
zYFUH|sHZ!A1+gwZ%58*rt$-XBr~OPojvq`;!b2uO>yzR2b&)q(dk29N;)a@mP$oKo
z<HUCS2-u$Ra+VL$0KkYLLELezY@n3v<H+Jn=nPr0Edg!fK&vWaB_7~mapZx>WQllx
z>E1YM6~R!9INeWOl{wx?H$*!P&t99@_e6}V(2<G|Gb(ffy@=Hk_!NL{9fuGzpqn8g
zzIxIPBN0IC?2_$lPvMLRe2TqvQo)A)JCW8)5xH7I*WWW|u!_`fm;(;X8QM%4Xm=)T
zz|3QNH6OHE6}L_x-_PUe&d0y)LxSRV-@(?0b603)`l+Z4=$@`1?g7Si(UZWe!F?QU
zJQ|s8I}Mop5HF56?fItaV2uQX&(Ltq^xZ(zc~WQNXx9mdCQs^gBy}eeQH-Qc&xAG+
zU>P>l=_I<PwLzB^M0PKA?ke4PH0)kKwZ$az+Hsn+209XMe%urBJOj3wi6|$Nr@cMv
zMB3+QxR59;ivxDO7`aQLD@VdsGiRo7;|iDH>7F!=#fWjjg038596%?M0n=Yy>8hct
zBdm@SdzR3!Xwg@18&)O_=)mcS@s%Z^2D(lnt$*Bny-Vv5iPvCo{$p&Xn8?}#Yd8lb
z$v|<e81TU>o^%?C=){32>-%1(BLY`H;6)dJP3ty9TH<8ittn(Y{B?*Y_2aeI!z5_2
z3SBau*8YGU+6<uG5v6*;LH1Zz?x8pKiL|m}i&Z6bqKMDsMC5zqLKA+buAh3nA5l)C
znacbkkU{Q<KpIx)*3mSHqBQ+znjI0U8zdUj;>p`+n&h>OY$P<9v@t`XxrC=mN5e>>
zA1C$cVoLfVk<`s4bk~Ac>j2-fJrTp6-x3YzJjFJ>KW%0MrkY96Y$Ww_^vn%U@^)fn
zzxS2~@twEcd&sAEz5vvv{k1DWqylS@JBh|C2;o%%GC@+a?ym=Pj2FK{lo~GV<487m
zu;%#<*p&_CXX7PA>VD+%DiXoA3crV=-4jQAC6Z}k_$Hc0v+=7EVsFrJuL?=Mbl{12
z(7!{&1&^_X_Tv!b!Sih-tmimv#&G|AFrt_Qohv3^(eICKp~Xb%?N8&ygh?m`a@*>h
z*S*3-Va@ouS25mksX0316YE1am(C~zcQRU^Ijhb1EQWdS`_P4AW3=14`Z>v$OM@?N
zqWB|Q^9Rq>ncss6Z8%?<)XKz0z%drX3r4xx$)ZkU!yk?Fjq(igEM703D>Q$8X@2bW
zl4*%un^HYbb77RptKJxBwrKa5bJ2*ik&HvpDXoiKPb}rttlySzq{N3@`(!f^sP=h1
z?fNLEa*J?s4FkqKw?w6?)%q%x@R=s1=K_`-ow~zy0ol&qjXMjzd>k%!J57H;Rn+H}
zyZa(~kw=K5F(g}7e`4}jj=0gP&aBajPKvNixlrv>UvCb6)BOqSm{#h0%69RsZE&Gj
zhIYrHoZ6EK>k?w8JGY_>S~Jl8nJat#Lmv|?@+{7Nrb;zvJ-Va<VmRxGg&gx<!$NtI
zJXL9qxjPnJm^1H&2KSrkW?UFiZQ-o#-Owy9w^)BH7Az{Qd-@T~&Ow6`HRq&pvP`$@
zfexc!Y?-d}{k#|PLY-HnGxgN;iGH%#8k`u10D(lUQQ}H|;QRahESe(Y8tt#kCd#^F
zWhpM?I>M+Qaa?(E<r0%=V%Dlah-mc(Wn-b*;>3Ur)ajSqz1;!^X5sfE6c4acULfA!
z9_qn#Eg0&hp-L0O@B;(qkg~)tRy-x`G{2PCuV>F1pYu6qV(GNVA$Lbkk4^T<l@A<q
zi74l^fMN+Mfh!qvA6PGIC4TO-{d#mH&0kM#K|XiOn3tdx^ZI6`eO}&+(UomabraKV
zab9{Gnh4|G#rSLulo}8fk*YO^<E3}gS>j1Fe@|f;uk|AOwbi$+NxlrN5~3Q)wDroo
zts3LT&3gf#CoA6tg`#8#<~`qCRE$)7zB&-pnEV|R50%&?VbIGXcP%e{XT0Zd*WWqS
zoN3;WhfZ)rz;4vfJ{nU($U!Kymo&#I1wt$ql;()Q1&J8QcJzV7)8esM2`gc@Nu?42
zd+L+hYcop{+c<TUT+p{>ce%TMp>%RR1j^N;1J~r;pWPAw-pZZ)#_d+|+Ii>F={3LX
zDE>KUE9_)H)9Hsvhe~XhaOEypiGAF4q+WjWP>E%};oWB_7jt#c*wp&6QEaNy4<+{N
z$cf6mYZF)B-0+<WNN}qp`-fyD_Lj{47O7J1X@*DY<qTH4#4AD97Yiz<{BPV65;(eA
z&CHjwP|F<rONs3}==A+viQUiI&ia2-VtMVT_5D;CAK@Z|9qnkXw^Ui$agkEFc61(o
zYHaUuH|6K-5I45e&=8}jb%rL`?v<$L6{>0%ru$iy7_-X@n>aPhx}(*}fw1fjk(=lN
z^Vq0X#^VDb`hnTe+$n9(JxkS3E7;Sw2>>M_kQh@od-jzo`SK)6ap#b5i(dM0uey1W
zEBAHfLQC#?rGRg7cXXSt;^I&Asw7-r&oKuGYLz3;+`iyAXTfo_Q#&Is;bJwfRfV7C
z*+=wO{Y5l|t-tG-k(JnI6TJKv{B^Cm%I+c@okVZ=cUwO_lhVR#E*9*sX9^h#X;<fy
zOzu>1KKc1xAFuO?qJ!wCN43tR_U7gsuk6&P*7%%8Tz-GzmA}E6xX&qA5&;wk(DK<%
ze6SjRLE(y=q4#^^hbXsJo|Wisn*E`BjEpX#oBp_PA+2=qtL7-)s7Mh;@4Iw2$kPf|
z-55Ty5<B0e3f6fAzWya=-s%xllvS5-sKi>wXsz5I1l4@W<MqhYoBgT8s+4||y>gwH
zv7Pj&U;3lAtK9GdKA*=$qw2yIc4w7E%h+CtFP;syAS#?W^3?R4n<<0aJrS3$56x4W
zlrq+1sb9<--ATck(T>5&QjZj&&I(&j3gN2AH7J|;C4>3t?4w)858@a@Y(=1LFZQn{
zMCPIGkF)k2w0%2Q#u2E&lV8Qu^P3Wz_BJZ!Tx$59yX!9{w!o>#9JHf9_`>8xd7g)d
z$5Mx1`?nXhua{x{_{eGllPcb;sLOHVZ`G#0rkIbmIwkB_EojI*$GWH^Gh%v79J5fT
z2$y{8cdT_yHfvt?tX^vhm^dnJU$wM1DkU0lbKT@zLy^0qZSdQU>%FFpJM&_q?-EDP
z(?~Y%VLU_Tciz2xe})KYaFIe&q#PB$ThDOv$dRIM+k6iC<JH5SNcCHG$eVs?ukdR(
zjoj{nZke?SH(;V)Nm4SjY={Utugj!e(c(E{_A;l2aPs1AAJvjkb#b^l`U3JDC;!3s
zmoo7JyacOw69q|H4im5Bi#>B*vT}Eg;JnF2?z3u7eP24<?WcdZJMX+b(D3EBy_9{d
zv+S|a1mB2@X|sXkDW-XWPozXfrQp4zpnE-GHvJJcOCKDjMiYw`*3wXW3y?RP@Nh-x
z+~dcMs2cqStLnY+r_s);H(9Y9LSBzQ1<cj4y&W#Nv}S2>`yNHP#mLEPCkijbb=S$B
z9j=AnvSzz+vFPshNDIdYpJ07=$L>LLQ9IAVtLLJNFDAd|(Y5DAH$2=g-zgY)f71BT
z0}s!emJ_qiUtiSTSj`DcoA7i#P3JYxBiuU9P~3C6?io7n)|qUocaG|HAJ+5@chklW
zA_UasidCY0-i=KxI9K6@A9!MzbASL(V(o4J5E_u}yP{lmFgE~T5?c-f24i4Ae4NL(
zOdt)OD06WQ|8xXB*T7aCC`AhKA|r1!Rlru$`n5=^y=kQj>oNlUfbifu6vuq?_*Im8
z)4J*3%@$(2E5Cc?T%!c=zH}NcSoCow0svtCn!FGW??^=bGPgkpz<FOsM+=K!5~JeD
z#YJ7N^ZHogy*+N(8GAb?eacB7jDN!h{;aZ$CDvAbu=_Uc%X<#%MY|eY#VWT<O(v6X
zDc8*%mC!9L&xVDH-IRXs8R1`>$Yh06ldv&|3NlV5TYT6)&Tu~7Cbxkt!|$MyU%W3$
zQm>vZxl!TW2Q)=`Z6YN&b7yQl@LI(~%az^>B_k04U3W(S07X6uShG&IA_f4^+eQj+
z?sqjbo}rU}yfvHvz?09W0-XB8sNk6ZgkL6Pp43bMA^=Q<Kmbn#cs^jl7(gM52cT=y
z%WJ%B!GMKo6S5l%sHf_e1Bl}ZpFv<-WfqsbO(_5c8c;TbUv~g}>Xti1V>^@;Q}VWJ
z8+XSWSv>)!WHeTQiUv(VLq7cL2S{21gU+gy<$zF(%5Xo7D-!T1r$IKXVPW>g$E&J9
z2N0mY-h?d1YSj<|8bd#WC_0)<PBlIXs4>X~13W1vDDekNIUvBOa;Grlh6A2zA%ufK
z^pXVvyfIY$c$2P(q9H65A@Xt+fZ7xD%D4gCA@7``+#jYq<)DfUtmFUyG*r~+i4f;1
zvP2kZW7}eqS|i*qhbU?32&?7DRFhw>X02;tTW*38S|}LRRi)KC$zrTZ^|<g&+75tF
zos>YVs!Lk)`H5#b%XKDXF&3Xk7Gq7xVyt*0--M!+v@D>iMVQ#=MHXWTdDcBGiXbe&
zPlhF`U1J#UCxun_R&kpP^+EzERoZ)Mn@yUlG{V(f0RR>P@OnkN|DhO5(UVrM;$E|x
z)^tIy!Njf2q#27<uMQLmzpAGRC}}^)9d9FhvG(ERwv6r8JneBw&o+7LO|Gk%EvlJH
z%DK+fx-rVb{j}kuGH}m!vuzE<K#V)IBV8fX%d>?BuZ>uUjBwO!b--UX1IQ*}3NPj<
zg%c$`F}p+6EmvEZmm^+~xmcvaSU}#j0*Ys?E#nRyUIe@;quSVK?aXBeJ@louUWg}5
z8?&U906Rel@4n+z(-(lDjslpGx!5Y~F}4<0y+#uuN`Pm*DLoLt(qTFSI3J#uCQ=Pt
zpr9bixB~zgv3cs=7@02sz(Rzjg$|T4w41TTu#lpqr+YI%-rY}G&=aHi1@kg6j{}D{
zp(mEPW5#NGdc5-(x4I89T6N5_@w^q?Rq9WxW1DNF4Wen(%w{xwyTQKcVKU1Rn@jo-
zPYMeaJvR}Mg^HZB79O?`VM7RglN$ld2N()Os-{$Ph~rlRb&%nP{kv)a06;>73Ly^A
zAx6q|^s(9kEL<9B0RUx~KBNO|n284qH13_Hv@pY35FnJeK2=*hjbk{+f+Eg6kE-Le
zp{<Jf^}el&_8^9)36Yyc6Mg%;eO^cvE`cygG=8R{Z_3et=}z|?Z~1)dK=AcOX1$(O
zN<65eR;R9yaY2C*gnyaazLR8V=z`w~1W@OOQ&kyKKnLx&WVf#7Z7!WLmBh9$Ll}N=
zvFdew2aN8R#hz|W5FXHhzwZE9p~M4`vN{XI^#B<i(itY+dQ~KTXP0O>Hn<b3;kqRY
z6rj9W2q*{PnR$nH6o#fPu@r>R)}=@&i#lhK1pDLw`_h0x9GQy+aFKeYL>k{ZfD@A*
zS>axr3PrxZm}j$A>zoK_Z^a<<RnFT-njEKc?s%<S*mn+NQmp>k^66{SF0g+c#wsGu
zhVW9A%*7%{jKHOa;Bzz#uP^RBx|H7(RCm(E7Q~#=R`!F7HC{G>b(?rNiCuCs#fP1{
zxD*0h1E9XjX{4O<_b{CcH1)pqCWzfE^!TWi7rDkG8gjxc(qlB_^k{f;VT6y_f!Saf
z8A=74wVQBLK!~GgYYFOwQ3&ac1CV0>Y^k&QNORpNxTEiKY8cr8%vg@(slqe$bX#dr
z&{P4K7b4_jf%eD4c(z`b>XALgb1`2rQE_GssiV2ad&pModcY4W)>D(|(250YeaQm>
zdQHhzEKv<fwqnt5dBg!v>H$7vD|V|fc&7^GIOvrLeu4pDUsHZ(Xt5$%I{09Ax>ddh
zTIB7SK4Ndr=C<0S8CG-eDbSZJe?DS%3Q#hsAVVinjxj$82E5pN#3*iD<`ACm1a`I!
z5B}UkD-dZTKxsl~RAiK=+_E&?j$|cUv1X=i$r3G!6A5|~2NTJs$XM*56-$g{QaGhC
zI_xX_(~1SeIa!%mU<>Op?r4f>Ye0H!C{*Bw6{}Tm^TUc=$~i|TaGn}nx9X9{NWkB}
zWmWvsij{qBl{sNGdVVa9Y{lY-c|xF`3S3e6VEG?bEMc-a7VkBOm&D<nk|IBmtyoeo
z57~+(jrlr&4IJ@JdA+?J7()Vn;|6|gR)?}*#WcIuB`^<&Is51fHhhUV>J*Vowqnua
z9AqnY%i3$kI_tAFIw&u?R{41z?nH#~E@Lxnxq&mth{DBcKETS#0!xVlphT$XZD&^H
z0qz2k@LdZEQm2&`;DGxyk)~fx)dv97I`w_NYSq$?G8tb<hnIJbfDtVz(DH5WR_>V-
z_F5qTae#EZ{j1i&RUUkKvhpb#K;V!PaILZ235+@msKdyku3>2QltII0=8N{ylM1Ln
zd}S?=LI8kFIVE!vC*DJ}!r{rTv)-jalQa17<1-8lGm%#<s)p@P;EZ%|GqHhc6#aN$
zJ-~GhL>XoO(Pv`uK^|COc3Q1UG)T>LbW9Eq;$0*UjA{oe;w<_pPday5iQbge_yEuf
zxkLg|u7oIx;$a<lS`H<7K6!VuX;H^PtNssOE_fvq9Zu;cnj?S*4gmM9$b^CrInr3L
z!Z=3{_8@5Pwf^1N@??cv9}K>3!mB?_j*lX1&b~kq|JWOUL<!J0XTjq*?G%Z*bl1-M
zQeNJ?(}Rt9!Z1L=1kXx<(8O6&m;uCl0NAN|=Z05;88*TVc`tU9nFSg}mHMOQf$PSW
zs9oKzSFgQ9si<T>$U48Lbiw#4;kx25G|+`OFrK&7$*>B@sQ@@w!kG<Lb8K1Z9l>)<
z$hL&zqvhZA<T-X70gQ{>j1i@BFR`O+&wDoiW_?A8a!wY{2M`qhNcZ02crRG+1fD%U
zPp4u&CBrq<SuhRW$wPG9TDm~B046K3;&lMEOPB$l_c@Wy=WBqFg$B?<gs2i(iNznt
zsi>SHE3vZbT_;8gZ2-lq7EKU9N`NM%M_wt1L3vQ!5e=t?z(!8863a5-e>SYoDIA8x
zCv^A7K><`L@9XN^P~L#$pq{3?3P_v^MgD-<puI?7{gL+OGq3F^ae5Ue$889ajBAa<
zk$GO=`4ofP$-QL>+LiN;k^L(~Vd4)W_S!{P+emo0htMU=Vq4y2==({vCXSAk3^EZ*
zh^&RH6pd(_+DGd2VA~W{L)=})9l=;d+;Jv_bH^{Dj^j8*WOdMZgWZ<c5xLbDt)Je%
z@BONWAPi<K&6H2thU`SvvAOH`$+#0jkMLR8)U`X&ee_aM`IK9E<mAT#8zfdoeEb_*
zgQVH?`v5$kf3?@Z6Z}R3^0?UwN|x*Kd%S=IrIlg$B7ArT7C5c4*TiRy1^eMYlT#>A
z0Juu-KsZd)1VD{!LcqL$DHp7m+<|BSRX!d>1Spa$zLy)zG6AUYcvS%i${hf#>g(N;
zr6Q3(SRaQKer;a1;KsDqmMmlq4@Cmx&T9c=y*{lvpeD?Vog(^90M^6iB}o=^L_B4t
z_Tny9IkyM825{SRV*$Ajc6Y$?Lug4Bt}b{mfP#fENGtA|aZRyYF_iNQ9wvTe+R|0@
zz`C#ab6m|;en-e^fF&h51QUxl>;V`;0q{&v*9pMEbp#-gcK8Uy5@G8|fzvXRJcY`=
zCfZBXHqbeW@ryf7DJkk_bLhhY@CG#yGdp{ksv{<V>j-y~6zAk(%@ki_DB&&BV?2<h
zi7NlHgXXpLZ{Z3z#zB5qchVsaTa?!tuZ)koxNtw%Xf|k^?1P(cSJ5Ktpv=Pu!m==N
zJYcN}Iy%@jydYBK5&F!=L<<lnzm~JH=|brz)Cw_K3%_w0Q~znlV-aGp7XD;uh9lFo
z%K;pe2R6x*c@=?i?O3Qu4m>XeF+nQ1+Jh~fz{#%zAdwj7{=oAwPTZIfLJLGk0Mv3d
z&&D=fqA#!GLPSd%Wn->ojUnHu%AJF+%{$`<82ZOM_W64njRI7pvE1dopf`JAGka5g
z7(v<Pse6%cl%KR;G^sHRnt#Lp{&LXjry#>ud&~FCxW5H$hy}Z~?5`>F3!Resd^vct
zQM%gY@fUunGXcRnjlo*Nw79eb_B*t!lu=%PQeq|D7uLA`sl>LRxh=j6|E|P-+`#mt
zNd8lawd-Qw0@8Qn>fDp`Sp22LCXaUI*JW8$daW#e75=Hj%70#rbw2l|%wy@>@k1q6
zHC<v*WUB7^=Ee$HiM362QSVXFIoK4RX^kN(vAbWMLU}^?jf>sCOTO=Mo~L8FJ#SFp
zoc&9Q9e!$BeraX<#6OhSO;;`RSe+5~-5*NqL4^Akxi1TYkAEq#W0hAw{auN@z~8y6
zxVyFSVaQPM**P8_sc)ZuDzP-OnfT)@dB6}#RsmI7>O&<Kr6bD~!JzcUHe&a<i)tkM
z^)0R_w9VFZBv+~ynl)~?lB~qmY;nh`V6VMY=Z;>}i@keABgKvpYho3TUolHLtqk$!
zP1F{u=DlO7=x`Q^dK=|%=LVhjth$EDlQ+pq^aqug6uTHXzWW=Bf~rYyeRF4<IF<;E
z`pKsqeCC&803X!62CMlW-q`;B!Ej^rNVo-U5w(lig-1^w8J*=GOU}M>a$6uT+2Z<>
zlu&vT0afm!(*lny6dg=0=-64G;&LvzE#~IeYzq~ZvhpXO3RrXV3bC%I)P!mFpl-$T
zD`OW`8zBKAWt~Fu!vsZ|@TIb5xW*i|Un9V{9BLkLymIpTF^?C0LEk+LteGl~S4-U2
zMb><**%7S^avr}_C-ye_gC}>7`7^yu`lL?{yEF>oO*&()JOpqH$UOD2&;)%8P;OVe
z?TBT1`U4r8-Nfu`u664=?3FZ<otU)rH|JI#9JoJx`LH-P@zHIH9m!WG#skX@(_i7Q
zYM=UisKnCJUF|ogyK$(*)=LlR%m1$uo8Ls|RT9Rri-xKRG@}wr!ub@qXpHllkCc@}
zhz4@O90Xd94wgiotmA@T&HwKzu@skP>2IfiPqgQ2NRnw-zUc5HF=$P>GAtvX>n!VM
zKVCb(ET|!p`~qA!rUZ-1#)Ti98>I>sn4vyx8z%fkpp&VZC;l`G<%w;9n-*jm*7b{~
zIOr{vi`gK}!*pJuS%xUNm{7XY1U2o0xsq^hvnJ#N#@wSHSfbBvY$z6pgfb^m^muHw
zBwrP2#_VF_`2FmT-K}sE%ZX+)?U104RC%Nv?yqNicP{lgF^uibTl&j>Je>SokLAwW
z!!Ix7@U9~@Bv-Kpu7l-#>sq<O?Iq#1TP>*ZBp!(fqi~h8z?4hw+H7)m^j86ld|m=T
z<@yki+=y!YUOvBu1AT%Lu7$=%fLd(-J4oizY;v*LoUW)5NF+s_Q8=y>Ge^*Hi^sBj
zB~WrmJ~h5qrN-FH7Iy4|U8h|0Am@}BkRzX><6e|n{FFd6dW9TrQCDR&B=?i7P%u07
zP}U~T2>JYVoK#gPXK@s-R>Ady*M*m!7s$^$@q^669b>1dO?}?8y(PsblCq(Gcrd&0
zG`$s>hV`1b$Qd6^8!VobjG)utjrT{~+U6;}YUS=QFYvl@@pkdcxmGo>CB1J|Gpbfv
z8(ZYBcak>@^Efk4*`_<vefu`+jT=B^)??5Tr4jZR76Dm4%kUuRXX+PU9WKpRjn{jb
zB((Qj)M7rGV9ufncPEnnQOO~0K)lk*t+f>ZLRw~9YI!!Y1#E2tqt{#Mv-cO&Q6S-o
zpcLl%)3|4BZ^x~)zpba}W=0CXC3OT}=em7EVBw^47rm)c#UTyr=;|6leL1I;&wn{!
z_SU&u8h*`;FV=#-?-(i^L^%)-6r6cIn<Arojhcj?<g;B}M1=H?6n1K@(u*$JY<0cK
zmi~4#?h2bd>Oksfo%nk69!r#Yls%cBDAfsHvLVy3@m_ulEZa@}Y?b#ODom|;7VPSX
zT=XZXjqvcRXT3k6smivFym`!^C(;)7mA=@loZBjK6jM>oJ4_5s-mGzA|2&kZ$Wbgw
zv8RJg``$Cq3gob&xTRxOiHO&Vlu@TJljFu_ovPM+copcTc_E3_%c?oV@X7}*=oxsw
z=LT9vchUT6+pxAXhTn|sqQz$m;TH|hIsLN+<;p7FwC_{npA{}Uoi~3r|A2=cetp?B
zY@WV6obP%0$`RivwS)1g{gYKK$5*f1A=9w3)XJh`iC6E<aV$Ie>XI8CzC=sR2Hz&H
zssC$RM(l{-v?hve8essCCW%V4u;4;Tm^pt8SR-1#B<_<K&Dn}*CsAGXfiVd)EZbiH
zRujXe#Kf5p=4g*19gd(xB~SmE^K&oh3&}Jr+U`X&5%`o-ghr%entFXrRrEH&DRW1S
zP1sqj^6Qmoesv%%x0tr}4k<2RI5g!3eqNz>2_a_NgfgrOR|=Of5}RnDEvr*k0+xcr
z)~=Eaw`#hx7Wyu(1u*TQbA<_n4;^JqC_v*EhC=aMjiw_s#cR!)7f_zTO7-;>b*-mS
zQ=LJV>!G&~wpK)12Q*Egn}frQZEBO#aojB2Wpz=t4EpTRty7e&rx(Hm_+ZmJz_%ou
z{42x)g-8>oCU!s420iO}dOPXCjeSC$-O54)+dIX_BJVuWI?a)osF~C%oa;I5gzNkk
zcGOxOu3GD!(d&KtP2r6<R@hNf60ryL>jWq5(BMS#*sSpy<$cYxr@Q>EoOk;k7P?GZ
z?HILOmTTU+GWbnmpk&=xaqEcSiZv=_==*dA@rt!%N668Iu$j}LIwv^P;+h1lj5EGc
z&?7nLzoMv^nncc;pw^llqwjn?@j#ZWZ4EawplyLdM#k&r+EvXWaUpU&HuCzm+k(by
zb`;8!2Q8PmGS-?xC8nFg>c^IhrdZH6D1qiM!Hh6FWB%$vdR_))t2^gkTf&u$PQ7jo
zd!U~Gr1fZOD{IZPc10Fzc58id7W)(z$NMafRW8m$C3gD!mlh=wrBX+jLPgjqC`iUr
z?SyQY6kC|sa;O+v7>|kC36X4-3N`r-O0Lzg8VYWvl`w@QH6D#@p>S0`ULbl6%Zd+S
z!iCVc&LDg2Mb1zhaS36<Q?TTQu#Zx3u2G<QL&bGM#h=cIeY0n+$QEwM7U`Wq4%>@v
z*o*6^3gm~1Y=uglRg<frRKnZSO{>X!wn%gUh4_HNZXxsvIZU|};(V&)XH&e+vt%Wf
zTWOin9LlXUswSUADWfnWnr<(Y>LC0mhrW=9lNWfx#^FT1n#^?`s?IRkE>)oo3Km?G
zRA>l$RgTbdvxG~I!szU+C~m=1Ey@Om@T-P%sL+<`iHa8fQ;rnaT(SI6-V*y$Zde^5
zUNs<%tcIgN3J*&wH_KWGZy~Qt6|deHLMf?5B43qzG=vF8VZf&<u&gSbq^8E*tyH0Q
zV!7FH42wI1)nIip;lq6Yq9(VcDgaQ$31L}r^P-+%15lWfXP5<_Dl2gY=Nu}QM5&cJ
z|8;m?lq>=fXDpwFO69lcCX!j$FezClat_~2CsgFDnmN#UqoPG39LPyL$Y#empBSYa
zgg)YBd_+Hr<zpjbw2#*ETST=~9o?|p`Jql{=#<We8AF^{wVFkfC@)U+dPIh@3sA7E
zIm?MSk7UkYgygY@he}z!znl$M+EV4t<l*dpfBvq%vS*mk8WzjfEZXDb9oefS8^(K<
z*RR-lqJz?BDw|hU?OHtl`;IUnbw19H&{I8{hVeWq&OnK$_Tt=g@+LVVvMolc{7);w
zMEowWhKFA7`Y=}!CUn-3&$A_f%-nXU>O<y{I0}s#o{%n8g;Uv5>e(V4Koup-&Fcc3
zj?JQH!~E=NWE@pRBUOV`U1muw;cnOnp__`blovGSZ5mwUTOS+X4;&)zJ|X~t*CKV~
z!hxcZz|d8k$Q;F0b)a;WfgEorJ#Xk`ZYtkvd`GPKWA8>d(0uTn;eV8*#^?PcV!J;d
z6v8Q>sRdRY&oelY8^Y8PdfNh`v<yU7<y|!pw5bRa(`puO;P=|sR$dMj<p@K(B8G8m
zjugc!;BuwdsFXTXaeU1Z$i?#=EulgboGMTAJk=zFT;ZK9v`L_o(#`xS>N3)*r_3Ph
z-|q{j(+kAK$$fD{j)1%tTaJ~fD{L*6WT*=WgoxyWlnK)Yxzh&jPw2Ip)0)Hi7eNZU
z>dLZVzB(TRMHY2h1@yOoN3>KQUTafI7uL-!a4uO|SqMeBA2<mvw=f2(X|qr$fkK?T
zfoAKJ{M9J}D)-;$nQ$_?>z_5(QEzsw4;NruX2?v}N#O~dQRVbWGxQ4)XLI%G0#+4=
zvye^LIgmmW(JF}SF{`tKdh|xs(jrxrMJ^h;Q&xnw$t?FYkKzr!P`a;%3Dv2KY=I6<
zSTj}K-DT~}CRTt3Q<ADqV5oI^;fi+{wKTS<S&bn{UEVQ7c>(W43OyoAHetiKIxLJr
zUMW^gG%;ay7Q)IGkG5um#Nl__zP0v@sh_}M`^Lf*!riOWTe-|!wR7F8&pu|tFY1x7
zcVkY!>I$zK0X?0W(T&1S54N%*kLzl!YF8DU7dcqb83hc#hbuXT418%}+*14KrlI85
z#D90?O?r_wj&j|Il0Wl^m_R6xW1%uhl~X`f^6Y(i*-)N2HDv+!nGH4G-C~{!V+E^F
zZhT8u{r|__U4FIswvC<-!2&@O+!D07y9X&=q{XFJDaBn{C=gs)+@WZZ0)+y_p(MB!
zr+D#FibIPQCinf@&$FMIwfF2b^J3o2{u8cTYh|tTI*#-EsnOuw)tV{L;B`N1%H>J3
zYK}!pdMLqM!X-z6qBuy#>~OTO@#WjvC)?P(X{&}sI1+kcAG&bFFA>z$VRDBD8bRSO
zdla2d3A<<*%?!8v3_>CXMX{#LTaB2qb!8;-sF_1Co1iIfT^M_jG}=8BGat0(vEic|
zx9@NSXpqdukJ)>bHQ2%hcY8Frl$u+y>1U8K3={%5K#U3N6N@wwTYf~-L$|A@5rn2N
zLCPK8E3<-*hnUcGifE0?I-1d+%rov(L5G@bXtGd*)_#vf3_!e8S)vIjsHg;WR3eKH
zqv=J<SED4dJSED)VKk`w43+J7y$`a4=-fT2F(#~F9e<XJbPNJY=1N!liAMWS%LK`<
z?MZbmBxsMI0w`;&g?o$wrptP;b;C6R4i94xWH>01ODx$-EVf=Jhruu&m8b6}7YK7)
zN3IH4;9;zTd8}CoLCo)t%PUq<cNm<?sNXZ6(aXOX#(5l09fK6)#p?Ktb)FGH6;Y?D
zCy+#WCL~cs%h^EdvJA~rf*mUflR@(JF_W_?vC=w;TmzwXgm4||=X(`8d#9bYdvDDk
zW$;WGzxBsE3=!SfO}C3AC{^YiRpgz)`brf^9Hay;?UCq3g0doL_M^$wA2MbsQUxJF
z`{5wbFy+)!EtPPpC*hhdJx~{HvC`xhh;)NiEJ?O-sV!_KSrpA6LKss_t2o;IOT`p`
z)!(WT_%VXNv76Zu{WS<lyo;t_Kq@dOk!gqX&HoaCf7UoZ*F8!gsR)J5gmtw=@RlO9
zXq0Pk!pM_)=_*2LWa|_P!$=y@CY#})`A`m;F!-f1v>HnsvxxH5QzJ{v>>HMG$&m4l
zG7G)0#(Xy}cB5ItXY+yHM^zE8XX0pL4kyfz1cS;70iXGBP#s@GVZHZAg3wZq8%z(i
zPh8zx_c;8^r+SSRB)DM)qCIETswA8(B1nxTghIclG<6yGGiFBctpTa>QiQ7_Dsxn9
z3vfgqhr6Bm@sH#w6gDU%AlTT$F%M5EYXV#2r%&(}*YSTwfGy^c&0OuhGmPe-V+ni!
zr0EtJcB)aB7x{kOL!TKzSlUC@BOy+K`_@EB!mRN-@T0;E!ZWLTu&jqh0y*5D>sS^c
z(_P=!)&m*s5ocRYjzu;yf7GZ$z}J-6>%t_0W*}M0Fi8Q;7?!}qmcSB!4V<tz-a}Gt
z)B}^x3Ta3J26Q;E$M6O_?xtsBFH|3&PhZ8&=p$;@FPx9!KC)9>iLv6d&}BF~o2zmN
z`st!r@=bVhCeBVy1PmZ9UZJR=Cz!$$i2eL9CiOC~Jc2w3>7lI*FF3@wQv?<>Q*#X*
zl6-78%Fp9TNxsld$2NU$aU*R*O7c#Ha7kS8VF~s5Y0MzIufkm)XD?o37vp17tszVA
zot`0TW1?GS(<D93c}umV`LlYM(|g4vE|xjM6VmI>ZJI0nr;Ur!7()HeH;SuA+Elqw
z{DmrHy&uf{H|2W7phwCI_o0&{zO|VVuXB5uXRwC9#u7Fv4?e;YS5yjHijYykz~yZ$
zCez$cmEmxdw1~e(03vQ3C=k%YGPE3B9>F_$UH$F;x~2e!`X*dxf0U>i^&kj1J$yqE
z1K^r&(dfPDaOZpL6FzpRl716zd4r8%Vb_?hlz3Wc(p0!^6~T%%mI6UNj{{Au0yTDl
zU$2#UcSFtG1A9w)+Ztr}+hjCp5RK+QanUfC=rP?^7)?O{R~njV`R2hqPyS<}Z5#>P
zs;ahL`bUH3G`rKRvo())1AjHu7hqr8_k{}{U{)4Q<l)sN53Y;t<cbG+Ap3^0yT<Qx
zWrxdeMY?1v+o!+z8_0orXm+uKPN1UCrz@LRe9Jvn?rFizg_sH}hvE;qLM-_i&89yu
z?>Bn7%9UB|5enAIxzz0n46n$Z*2oclR1m$tX;8aqoQ{ymdi*#)R|<|rifrKt%4AVV
zk-~D<hzW1K!EOte)V`GSxeH}4?Rk9}PJ5%gd4tVygUx2~`Aa6w!BW=~(je5YUa+;7
z1V@nmWdjIw*JG~K`<P&K<kPnJ7o`$}2HO_}QMQ3!T?E$33ib%r1lit;zu!{>N50%v
zkZlmjhVzdC<Qb5lG$rY*(9W{($(gIIOW+nTLLm&Bfa+FM8K(&eriJ8@JHzFzv3+S@
z1SA(pi4O@vM0=}Bx&u`YBSixt&ot9{Oq+bJAlsen*p{u3Zv)@8)l}zO(1E&NAw0?F
zl;kEO$%^_)H<WTY6q%F)c1^_lJ(Krrh1!>(w}HYBt!FBi&OdP#t0(h>*!2=eM5z@P
zSpye%QCH$_b*~+;e`h;;!HlD(tzzm#H?tK2S<I?Wz7el8Lyxz93fh=_ibdYgNI*Ep
z`-v!zPXqo)n4M9$B*9VV)I=jRy!m(=v21k)E&?Xaa+vPdQ+aWdYEEGEblewtS1hpA
z{BT6vLy_Bcuy9EvO^B~UMAR-Rjh(|?VU?tcrP_x3jOC4U>4qv}h%+xa1*?)8E9<2S
zs4=3y0M<6WP9HWWSQP1V+bW<CzZ|YBA98D54GZBVN8vDTt&b}Ja-Ay(TzEg><Z@8;
z)`3H=36vtZ$~gN9bj^0%FiNP4AS&vQ&vNnrQ}8XhdREXUJCLGLJ%TxNi+Pupk<;s#
z-QVDPxAY~l12V$<dFzCU?eMC;D2Qq}x*)Tc=uivO#^MxA{YtT`^KFOVBaHWhS4}}M
zzkx@AyGn(gkfMHy+61o_T?G@*2J@~Sa)*KQ5$rebVC(pwnX^<la{2jC6!)`=0$nc4
znCbZIpFUba+?0khe3rqKb0*I^9btSB{r9YabVI;5Y{>~Ah*de3Ks+zUsT!Hft>Z?v
z+nh;>V#w}`z9^rmpXDr;Ws<#0mi65nV9S6}d@AKS0M|RM1ZWJk^495tY;`yKK}LO|
zST>kVMfQ7A8;8HtYxkkFkhgD;c5h0p#Vg3?*(^GCd*TB>QS?M{nO#QMr0;|UWF#!*
zGJ{yH)TcI6bmVEb(+u6X(zLJF@k)YyvXrP9yKW5ol3WRjDFU@=CL`EgG5bUYyOVu*
zcDD_qAl9}?_8ucEKz|Hv0vRHKH^5$5M?7GC0IVNjiY!=dDsr&#PZ82A42UXri1jHD
z#K~kCwxB)g_`Pbb>Ur)-2}`-6swi+hWa=pKDOSxp>1PaKIE}Y`fq=8RJ%Z3cxkrmB
zw93dF<E~wfwKLhm^~?%6xSVW;xXgq$QmxB{^wnB6HzMiSoKU!6r)311eCKvO+BHN4
zHB|6mDw3!CUX3+`>3a8l!Mp3dnlDT@>8)W4YzmEM0}f#xQ4xOc{(87{$+}Q17fj<D
zSQf_NY%Isjs+V@k72u?VQ_p)`eP_7yP-DwTN?WI_C3TuqTjnpy*pd=>MV_{X!)1a1
zTaks+E|bew=)FnpMdMv&>GAYtvRRG-V9{g<u6JQdL2!p)T+af<sUjrdf%5CS!h*k=
zjjT@A2n-hj6xjHL!_`;9gb7Vb?)!Cz`Jl<JKq}-@+uaWo^}<bOHmF+XRRvy?C&&!r
ze0+o?Wwh2IDr?n$Yc#{cnshABp{`Fv0KtK-xf2TLA$YyAB8?&(Rpe$St>PxAlVT#d
z>ynA@T}d2qKWAZs)g}8NJCllG7D5TxGg}-|3mUqw>tEJDK(ZgE6KM+{8FFi|SF=zu
zJhZgezrM6AQZ&^vUxj40&b;TVLUl4S+7pT>!f+{tqU24m*xG{_WU{!(9OS2A<1P-O
z?=^HB%^I?&?4w0$D|KAl&T{YcqJ+DD>bOUp<?U2+h_@1q`51ZUZCCHeth7Gz^@A4t
z9(^vdx$xCx(fb`>_J=6$^?0ybL&1644@GJxJtUq_!QC>4On)U&Y!oyfH{TH<@Ifyk
z1zJK!%%uVw)(i1F&l$cgm8)1AVf>9vUp#6hA5lKl?+YjoImQQjEMiezZj#C!061^&
znV-Nf?Z8Tg{ZbKaxFG;U#ScKFp6~GEygShfIrb0w@j27^e<-SyR-AMbb7tQ0f3DPh
zv-jkcnPDB!u-dZkr~cCQY!%wD%IiSUG<|sHoiybKxpZ#BgT2Qc8$Q+E=~d=OIflJ^
z>9x;)^E|?8H$t1u*1cuqwr}5iGV0e2a|y22>)|&2m_u3qL+_y(cKq}NB%?9<nTx~b
z%f+txxq9C|mltYUb6=^b8jDw4T*Tsyz85!Pf9P}7eQIvJA^ffEU0MWhvAN~$x(}|q
z;sA-!#0q2KCi%+2A?pP5Dy0e*qr2b{cZQAC!9!HX2&gvT^N8gU@>|Ci<q^r((6{$A
zz1H{<iuh1JJ!_6aY$z_jAV*Wx+8sm*CDYO;%)+}Sq7pz$U{n`M;9`xVmW3ieJPN^<
zwZ?^+^nl$w!e9)TPsTKi)J7grHp}abg*3f9JGCKLqwCNR6BM(bpftRCjoMwZpXQNg
ztZTw1{8vD)(D5f^SoH=-rnOtmK`2=$2uw55(rw6pl1{F@!S&r_RB6>Kxk1~8Ej$ok
z^r2VkG|@Arf~$4{s@m5V@lQ|c|E1d224sFByeP)*+W775|Jix<DC*nix%Bf=E<VA$
zV(jVcx$`oql^6d~VvDGLS7`i?mDu1tb>sWC_^%#Z9|LQIpH&ynp{V}U#ag=9!RQx;
zjQ-STzj<qZVHSQ`s3cWr>6-SpZDC>VPt)|$G{hy0p<>4^L8gxAQECbH?$|kfM{tx!
z`}LP4ORVOf7^Al8dSR}~n#HfkJ>>cR)CJXLxB1v1Uk5WDBmAfm^F~C{ZkB(}o%fJ-
zg_F3f&z^Af!a%E@iQi-hpI%-JYTO-#hA?b%eG_eW4|{89vAiwAi6R_~_kdSh(?+x)
z2y7=#qf(ca!(U@dP1Lw)D|Bpc#UMavzH^W7z%E5cDd{`1@G~=P#znm&DkCy%73{D*
zAw74Z(3;<rfG`4U<EzDmw|go0FNp4I@@9qn{`$4s{oHc>*50`g93`<_hz(o~OKXpR
zTe=D-9O1-*BI8yI6oP1*cLC6p>zHEQ4(!K?O87C%fx|q@Ulz8dq(GBlj4n+3?-S8G
zop%A#_+r0*I{aOI@$^RfXsyEkdopWAVNA|fO~xmV(TA}i?>m;5u7(^W9%+$9dN^;A
z>vJMNL<ND`&`nZ3-1c9YCmvtQZ%(rxN|#C8gO3_y2vdGY3XOJRm$^4%F9MVZVwjL~
zGRxOIEm+c_-9BE&vR6R8?bDh|GZq>mb!!NUmM{tH)fPD65r9>1e%_UGm6&l5W5TWx
z0cx)su^3;Y?l678Cer&1o3s03Yj9I28Tx3qdi;xYD8nN`T!Qs&$wTVbVGMr!%Z0;q
z_J=^Mq?=pk`{l%4fF3aMcokHK^_T^c@`8yf%EQ4%CnJea=V5Lm0YQVuoXMl<44Yav
z8(eF_N?9_f^cr#5UVBR|(Kx(=S9hcLXk!)d;o6yaDT$%&ki7aW1Lq;BlJ&jj(aj<0
zZbaQuaVUXw_pe4h@?0H)DnYjSZu(vX14|ebPl=*~8Pbi=@(WvJn1m82(cY~!L}*rY
zIg{%O&9>-GH(^ZJ?hQ8^A_21Fwzqfv#HWMnWEYzBCP~Y6&R|(G>L0_{2&`jUI3>T}
zze(6onh6vg$){iU9bc)K`SJef-YKo^K*%YZljrG9p!CIAGfE8H`tWNw%!4`mV<|%g
zz_2TsPz>BYI@0krk^a}@jNi$0H3}&AhC!BW_S$p$R%jYvFpVQTa|i!Rp?k2O%xvdM
zyV%WWY|DVp0@=Z$>R{Fapu$<a2#mq)ivUVAf=w-jttX6$9>RWbLY0PLVF45d5Dw#m
z?Sy1joed_ke){umI{tNtV<ksOJv)#GU#Xrg-hfS4m?PByT*FLhfLcz2aI5K5sE}|f
zqbccdwd{+aRR$M8XYvFHuTDL-h1)^QSGt%mnwUp?-%|LNrue=?_%{vsht_$gz5Y>R
z`R{)j2;58woTUid8wlbz@J*%&9vMuNc=KVO@yWQ+X1J5@5azW&tfj*U?c;=Nh(8#G
za`x17dczr5L<mC<HW%GLs-%j_eHFbR6w`MT3o8`Ug5DYYBKL!f8A9)J1XkQq*NjA3
zol+%Ud5a^wY0!cf+%+(MEJEF47>SzN`MP^R1T+p#B0PNv91&>{5&q=7j^ozVZ$p!3
zO{3IM?)Y}COGI|STSlf^7N10}FIBenOtu{?yDq}u1!#vKudaI2%r(e$rpix0W;;oh
z`#rsS>CG13fL-A=)nP*v2Vm7lgWmxHeN?PoZZTCCf;@`a)=(NO&za^!Q)TN#?i--I
zH&BHIchO%5<iiarJy@zz<2d0B3uYAUR-z9L(;jAzJzRjQQ8TMPPgAvQWV35rCOlA#
z6-9(Sd1#!r`Z7%<K20OhM=kJ)h8Bd<W4M@2ha#?9D@1@TqDW~;8J71LbB+Kd43@2}
zOZQqE&^>3`>IPFVOZUW-cTK72_|PbMoqes+jCZBX6A<<W=)UpN?J3gDPg?+{W3r}t
z@uzyw-@37H^clr?SwAa2@SW%Wj18I<p)MjOn>`oxeO$7}z&opVCHlDG&0{$+UWDNj
z*T+l1-%n(I>&FWVhYYs`peQrCwcfL__ol%En8~b}r7M{s6zddL;dDX8RQH$6kYyA(
z116Y?uqs5r3k}UG(=91b<WnbX+(n?!p0WwRLzV&ZJC;;~FuAiCOI0r#P$Raw?;N}a
zThE53UqpBFbNQ~}+&<;g--f!|vrp}at<PpHuPDn2spd$GtaTcRhtIfD$80Xrtut$E
zSHx^TIol@l*~z6o^>s3i@8+pyGvT42?g!8T5foNE$rf0=Eb9am>ktNJn0gb{apAK{
z6q%X0q=(V-zw40xP-+$|tn4#{0IKW*hJ{5z;5G)=C`cEpdq2SBFEir}g79-pxz)L4
z15|YY(FsYMA02yW41e;4$|~%M%XpQY^O%c*f$KMM{KX8HXg;_51rgU-ahHKVt}po9
zC;i-PDAX}5Y;mH^V?K|IKbALht|L?(TYhf(Gals4^Hdkk-m`6&2<4)6ioJ8Th;)7+
z7Bx3QWuTDi7KQlB4DnE6NLhEN0#fa$QUr<n{k8Fn#b-^nWgkTuXNqJ>ZVDx=)8DSi
z+^*5iS(_Y3!5oVD98h3ha;TV4_&ioQp0R5_T;cxDEbue70kf4m<*U!liml&fJE(&!
zDPO6j1i>=rCM1HsWwI?@xIHI+J?kGlAVQ=jHh*Xw^dsZ-So7?y@#}RlhCjwe&Tm4m
zjI^q%wARtuI!Zo&nQiZWIL9e!rZ79$U>VFu`M(+Plama%cR&ZcrDAs~0#yTeJYV3w
zwr1g7$LDxYaJ&xvO6gvwXw!?LJcdh;ku!>MR?swu%0VeXX$(fpo(f|VFZV*Wn`1op
zVp8X)Gib_l0)h)@@RB9xDq66sX<mJjjB5@EX%C2r_puu=h$|0B=nQZ}nZ(<?iC+lt
z8qebG%ZlBmR-k>7y@xVJiTd#PnBf-l^}}hF5!@!3;p-|9=`0ZiO0cAEhKeGPHVuZ;
z0QEn4e+sbM>3IPScUM7Cc65hvpR$PUf(Kg?E_`MA4m$`*7-O)?^Wf>kzUknZbemRe
z`@oF&#tif9*+y`tZ(t_0F_ZXwCR8dTI-Bk0jOV^pOP`WD8`n77rZLN1D!V+}BX>d9
z^g!sTse81f@b7?3KV*u&5{<$9(}-|M3KYx(!5M%>VA5=dgXX$j56?ss=GZ0+gxNbc
zv7aK8p{Chz6zP-j!~|y2z3vAmJ4_vgOg<?Os9z!j_G~`U8WT|b&^r+F<R(;_F4pqW
z6uF)emtK**E>ROM#l4(XZ!6iBOn+=vl3Dv+H-~L|mO^*zmA4c_hhL7(%hG3yr7y1K
zU+tCY@RdKyF30z$A<}xE<w&4yq_%<MW5WXbun2oO$IeDeaBGqY#}WyTfZeL9eN2hx
zG^=<6QO{pvFiNy~N>UzmTCE{m^X)ntF;;UgBUY*K^5a6z%pu*!O*6KOwvXv8<#%*-
z(ag3wzljqTreDs;Z<^IDwbh+17L&`Ye6{(cHTH?8Ei}{2IGunruKT$mT1#uGQJ4Pn
zWAo3(H;qq=q3YtuSd0l9_HQLNw@Cm6o)K&NNL`1jm;GGz$rw(VW`oOg)2t!fqQKV?
zche#z)0+9JC7-@E^@j74R*Otc>znqr5PF+4Z#4<&;K=#5_vY=fx$Q+VAHTdZl+o$f
zOz(KSK#w5Msev~sBR`*+f4OLHv_bQ-?I8c4Xs`L$*m9T`Kd~G55mDu#=$BCg-QX#o
zcl2lmZrRW$8%(@Gk+lQOHLtR>eQ@v50V{+{J-QUVstnT^wU4!y^>lCFJkIMiwa`2f
z>3!O<v})EbK-WG|WT#VCzOmF}*Vym=xDO#RuuWGI*a4OxEe{RK_;HiUL}9@<$Qa~H
z_&}WrVgrf_ZIiZ@dxSKz?IY*6>7m_DxdA*dqaLeLVwmqHOq+xCBFL+|i8c`0%w-Uc
ziXQI{1?Bqo;x*z76xj9mAhR#|?QI7zc;cjaf`EDw%W~rT;``M0aZ<@i*8B<j;Or%9
z^8WSl@79z^(@xWlDFw!9+RjPx_GtyV8N0xl0)|FEf=CogJZ4Ww@F$WDK|mA)@496p
zlhwK`8U-tHwAoT|cWBoEsP7NMlKvt{R4^>;x`zexIJ@IGSWfoUhmxhW*-!aFS~*K%
ze^tH&FSY+2Y{)O^VP5WA(c3o6c#uCcWVtf-cX>sw;sxEXlm<+cB0yx2EKZSx7vylv
z43$RH%oRG}Y(SONbpI5Q=O_|UY>>?ris5an^>vfpu9Ky0n_Iu1$G0WQ@MbEec6RR}
zlx&1oSdPntuKc80{luvL^lsU%Ya5ZV<9ui64cGKsozTz!fo=YS>s8KKaH<u3s)#y_
zWjTzc0(Kcn%Dc_tQ-n)`fL3fmT@=k*w#kszbS_1T?`(b<NAFE4<K7mMh;AFoTfzGa
zApuxyD#i@m=s5u_pL@gAMbo<<XI4iS?~ZO(kM8d*W93tKP{sm5@f|2FR?$~a5RgYK
zAlc245NksD_5Hs^6xwTKQM&L@tb--|)5&o2x-dBl)q`(J<W9}`*odUm9#|6=I)C7h
zb$1b~;E(h7Kkl##?~q_zg#?Ns5FjYNZ3bNS^5yC|8w3qY2$PQZ33W1oC)g0GSf@&b
zz>}U{p&kgqdp0!!4l*CJ;;_&X*}yLmBy1di8lM00efsxX!QZ9tf9dltz6@4ITZV6~
z@qQejt?0f~-oWQ&W(3&w6NT9JUjB+6`z{)C2gkJm?KAhlGNuU5%Qv&XxM9=2yafrD
z4kp8o_^u?Q7VifhY~23N-WFi$QO}oc`=BCR{xx6r)%E$eBITAMm3TV2IMK?f_u9GA
z!T$p#w#jLt;NME@TuC0w$Emhpu<=&M165>SC%8F>%GcgJTW``4-USyiqp23@=}#~r
zQ*E@~8Ly2~#umB0nIo@#l*$<&u(Mq|2Nkh9JTXT`zR3#|_jGzqEa5o6(CEC>^+u-o
za0R2pc1cq;9j_~-Qlh33TTa)}alFZ`ve#-s4i}N7clu02K645hY5b>5DX+HFcD#Rl
zDrkL0bd^lKP1kXoSRb<VB~jta-QU}r8|o!g(C}DKl$X^EyEW25>fS&ljL@lx6t>MN
zsZ92;BWWW1ZmZ{EG|63We6;HePRro?{21Ff?vI1E@qcjDY%R_P*CSc3K@wWwLWhzN
z1v?66!o(NrC90fsWoK`aH2G;$V)^9>o~0Q)(%612DBN0TiQZQJCT>E=MFLR`AjlNV
z<lG(2bo$6ukZRaP@I2281M*24*AGq8>|Q~M_;V}`RA2%9yThJW9iNG*+&owc1eS>i
zUzGZ{nm&J@VTDm*8&|kqsFz={J`!$NGZ?WviD`Xa4&2aJffKF7WMIaq)Nxdcm2u7=
zrS(6&sO`EVtgg-5+tYQLiBWnZdD8hzoqPn+zAR@%5vEn)sBu4%B>6FPCpjbMnJr`E
z24uv!Zs%RRTN^hC4?q8q3pUhZmExqgX!9Zd8}Hx*M=G)4T_~x*HBNmwr`1~Ic*F&N
zf^+MhJdtNFWW1lh@k9kp;NvbdDA3b$QWEq0ZQ--8kl;bl#6qW)_iw4{1BgUQNp!Wn
z$Hc!UJn5VG`jVQlx&L-iHaVbd)BK7Cy*li9lFTvjC`3x+tAVbLZ=JOAOO1iM(Z?!N
zp6sWm)3vSB`x@?CEYS>0F~YinM!hnn^IjsfzO#Pc-(2JxljiuU|8_Kb!|45m;}J}@
z#}H~!OvG}z_BPeTe>Fw-QESL6a6qhJTmUpid&9?8o$a>wo<akbx#c~?)o{+7pfIEY
ziB&`EHN5<F=Tb7r9(|OyylES6fI~5V^(ZJ;$?$E^>F^K#tDrF3byZkP%b5!M3`KHc
zV{w4Uh+L+u4TxX$c=N3%Q!woAazmCpfzykEG(`QHLDK8?4=MH4sedXK7LGkzWXv5q
z78gxuH%`3`1z52gcs>2}Y%3hc|GbFmV@oVE4N}e`Xb_g!jjf!~P4}8&J&5TXA0#D&
zXR!q`l6`?sb2v~ERI$Z3!vkElj_GOMsttRh1q1-P!%LIaqaP^70RZsOdvaW;8U=tf
z{X+3LuatDrE0X>;jdUNi5&VOG5~?Jr6m>oZd+KwK!{ib6@YQd70jZe@aq+B-Uz9dc
zuGMy?ewQkFS7b3tvbN-jUMc{=Bu?065%kQYl~eP1oMA!)>nZ9(U`z>U=y+ha|58;e
zDmmQBWr^nDgSV@{RVZ~DO3Xj%x4~O&qYgn3?i;ewS2)VLhw6`H`HMgvmv&S`f)SEL
z2(=W7JpwwB_d?!CHI+G+M1%?<?X9DVGPfP)0%(glol8pfVRSMjPBdkPAec9RRaCbQ
zC?rJikf#wh|1Ktivbq~jjLBQ792F_CFFcYRQ~d5?`8{n$lDPMA54f1DA96W~&%0(r
z5ZAKyDChT3pk|}SKu_6L)`A+~c9L_Bs7LSqkF`#`gNULgOOA$a+*H~JpZB@@v2y!D
zll1`zl8NIO>WHF5?XQhxM1du06_`}P8W4Q95y?Y@MUwtA0_MVrRJN0zw2z~(rSatu
z#fnt{C|YyUU=CH~aT2cF(eLf~c(jI!2{jadKe+P1r5Y8Kwn(s{`nZ^6zW!21#0Ly^
z?2VMF0D(;?K0Y|hGD@10)~!T}SsKa>i-^(bD6cBfhTZPjR&f~J422WMY!AszOea1V
zB?GJL4Lv7iS<I4UmI9aqUvB7=b`u&^$}B`Z=Uy;<%>Ac+$EjMMseQ8e302HELnw2g
z*5}bhU8>^I8uiijNFkMR4m)d*&-<$T8TqV+l$JUrpJuFiQ=+*CpFJLZ$cyh;VYx8w
z;v@7Zc@f6S4FCcZLxH^QtGQg%o&BO!A;y{+MS)?Fx1S4Mo>f);!HnEYR=RPL0#q25
zFLFR-3$HiJ<ABjyUl`<Hn9eDg6H^~`Q+A~xqtVuHf!5fGsvF!K78^O1G_SRxLK@xc
zpK(^O!K#v}Z`3R%X|(ox*VR9H7+Z|N#NiBrRQ0_M7P3zP8v{=v0}wKm?SbU^A#axY
z<XA7vkj@TUjlnv#^;VD*S_@McsZYsih{$LObTfY_lJ`e447zJNt{KFO^QZcGVw4oa
z0_VBjSC{8Lm4ROq#K8~VrfxpG@2UP8TQ<eixi^bwqM0@$9w>Z++|@LHQ~K3VjfIV`
zRGxx(HkG8lB79pJYw+b9pc@d!EbDBl3unLsbmPCB0+@cewut9=2Z<Wk!yl^!{nq+}
z=9Jra)Oz)})X$AY^QQ}L>*lb;sCcV|+<`~@jq2>5rq<1rTA}1Y?H>=pjRV9-0m|>^
z`<&g{Q6i%&Ll5-h+b$SUd`F?+Jf8DEmK?(SM^~cYTEY}V^w8;Hn3n7sZU}>f)uqSr
zaSzcW%xd!%Eu+h`<p<;iEkk{lCj;#0RaV$ni+Oas^}~UufRcXh_H9C`W(H1xLhE>l
zTUy#t-eeOW5b@)2eQNsNJ!Xr$PY&}}mVzC;=SbDI`Bunh`<#`Dh;SzS&?crw*q-V=
zUE56M+dmNVU=M3OlR29b(&m>t1a!mE)Gsp=9@pKjKi6&lp4|SYwUPzuZv044(v1Xn
z2u1nPpjWQj7+rC3dz41%zqTEfs5bPRxNR_?UcHy})0fVpbb(G`0fisBG1i3dIb|(a
z7$Nhis(-vWI)A!<SDcC0VFV?T$O>=1Y#P2TlVX0YYY&2KmMs2hahE^!xfc!M#FG6a
z2vRmXO7^2+y<|Q4spfb@ejML>v+gf`mY;anfw+I+*DdaOI{`XmK;to?@aS%ne4S{3
zS$D^H0x9I6LT0VT(tD=5h6f#6THW>}cv*aPJ)svKPcWGz>|K)2jiJd&+}8sk4Uc8$
z{9gaWM-Caf;XY*i8tQ^RA&5$5_`Xg$kGazM9P(KYtmQ%4ag5_42-dPDX*kx!@+F-S
z#QWBb={e~U{|-kCk||V#JZ<z0P9k!EbIWn!|H6t;+V#|ehl|F@Z-_|W{tjaXMTs}O
zR_q~e?<UR@gYoVnm7ArNCBYq`xY1MibsjPvn9ES}_zxqWaC=9?5X4$*>_gVLL}B>p
zDzAwqquWb`1tt-&QumnOkv5#M<RVdusRYWQo@<kYeAWaw%%sj_ICPU<d1NvNJ_H?W
zdcDoWFMpHAa^9P7rpMe_ljvH@6c>Vsup$F-A+hRlBAx{MTal>}u|0#z>5j2Mh47UL
z!pI-QCW=fO5pkGAmS}}pb!1EcCrKD?yitqYEenxdA!&Xn{G`t84!{#TpD?~l+#O?;
zte$WL;_U~Cx(x)M6@j$saHxC1=P3}TB1_#+a~Er2{^U0sebLyaRw_`U>xn0Eg&@|`
zL@cSKJCDSxK@Fm04HPJm{z~Ok{n<^OzZ4d!rze55zxFkNr(!<xyPCBdmKW2v6j)fw
z=LZQ4FH-$Cll#tyX@S(X7#ubUDsx4S!C_sasB|TD8OzeND${Ux-bxUpd!?lIdV>N(
zsZRm-X>9uGaGSIjHXyU<huT~jb_CXRwCT@jjaUbr4)pMClSqE9kzVTIufXvhD>CxW
z<2u)oekufK2;wHJlNKc5n${)Ug{H&8GG7j5xDjN2s>5?WCeN6_ar;Rc^fNQGmDb3^
z>bIktZfr&Y0sG@CNn1GCLu;HUE}(c4Qhf^OTL@->XL2OrerP5gwFdTE6Loi!MGujE
zpUA0=B`uZ0E(@gn1P3yagX8t_&yDdhXsj#>tT&LogTY}1i3(%$#YO&w!yYuHw{rpM
zYzVxvafz^UeLen-!yXf}gyP8#VaAR4+doO`ev*D4BD?X(BND>R$Jnr;#JfZHWWN@m
z0eXJZKV20kuqu-BiMfR;Ca@IO@_pCHPkxdjjtM*i-@WPnZ#b;8HE@o)faXKdj3<a<
zkNo;4xdI?dyb$c$U37m{Buh?ebSweNaV1>DBiSq2o5Eu}#y|K&ptD9gXH(=Hig#&^
z!vY``UMxB|Cidq7s^_HN6_#r6m4>}2T}KxaO@d5A$v7rR^)yT5vB1n_B`Fz%jB7Xw
zgylOa*o;Yp2OOkvMZjb0qUmEGi#37BF;SpkNuU{FtPr*UC+S<P?4Z5!P^YW_>6GgQ
zAOkn4v^DVc9w~CMi1jDb#ahNW&S`%Fi-)ZIJvXmYw(BWb%3rd3ezwVU80rIa(T9(8
zDGJOaM#m|Idk%!xWo3I+>5$T=g;fD8gk$2>-ep83FY~_)S9?MzhCQlXrV=NmpFdqI
z8;h%XB3zEvtZ}L*wyH~6ak493#FERY`LW0nPe!p1|L6oEke~Y~o>9$H2ikS2<pdTn
z0%}g;*snuzIfiO)f8!%;K3+K0U6Ggi(A7Ofrh%($u$Qo;x(o5OK6MBYd4H%QiD!RW
z`3X0px?~RrYW|5;hQ4PF2T@eZ7|%XcpUvHFv=8_MZwFN<Hi$VlNW?ctRsFA(Sj~1&
z`~)6P=zab2UcELX-!$H8{}`7ruHJ^H$xf^3nRC<sQi(;NfKR(WTEw&Cakp6J5<Ugv
z#8$P$kF>n`)e=WfAp`%H5}WSaDnmw*_-`dPk-jw(+?Jl(ny=ONex#*<zO7QGt!$(%
zH@>ZszO8DhtpVK12xzb4X>Y7*SNsQu^=Qwa$42M_+pF3;Z`x7jtvyRveIsp8k8wll
zY9r&>C2~q;cmhX4NtQ-BSAKP_wi7bZQhdiKu{?>J=3PHWI@4pi_NuymQBy4b>e{C7
zs%T@dlKF5d^JU5W3q%@r*?teiv{nAbcM7JK;dXe>(sti~yRxg84@SCIUUe~&p}voF
zF~YkkExw!;b<@grlT^b2`>1m;8pwhs((VTB3%z?uZI@J)q6FvWg*{+EaoxfZCwP>j
zomtLbMzB!Q7O{-gJ-gODQ-~f;3pBG!4S2sx)dj63iza3$65bbTzDC=xgNShJ1hrYk
zmHH+<dv)@92~R&sS)gQPJAud^<pdJhJh+YQmq#wWdI`Oc8CX4d`|hfk1C~3zZu=$-
zsy)bw`g3^RuJMIbGX&)g$QtyMC-l=z4L-lE*3A3jTRos_F=Xp9AX7Z}`nKOkyX#%T
zV4HBw3vz;G2$9sqJ$K6*Vd5a$%X+Z}0NB#eTUcWFMbY4`Og|fB=<sH+qobebb|h`I
zcaLY-J8y`sV@MV`Fpx0RH`@6%Xe9r%X5ER(W$j-H%SQvMhl<2AfLf<hE==R{5R<?B
z>@&?ko!>DcG&Qm<Gupk3<*+}Js?E}>-Ft95s?R%CkT-hOF*-^#+{Q4mN5pruM-?ZC
z$ExH9BPXy&bM)71xd3>qAH2kSLp4@Ce#kJoML*6UH~u@XK2LTco_FG2dm^)gO%ziI
z8SUkJGa0^7yD?GkknCT~MmVHb<>VE|WaBTxI4w)wFPINM>gf4X&GvAm6Bazqo<GH7
zIi+$iH3Gk%y$AOhGR`=iMkK>uzrzirXeBlxlTO(n%qIhF2+G788=K}&7ADM|+01B<
z4KjAlsPnNYcTT?Ap9>8BHWydV{f7PW=9`Ng|AioUy1tL?ta5~zgzOFV$BEg96)4N?
z9B^vHi;vCI^_wPoDyZh$mH9%J#l%yV`B1)v7F!bMFmp{W(v7vnTH>WTIlO?i`SO)-
zHqMJqQ-fLgGmK+PY{ZN2R%TjOxU81)lWmuqf(6iZiyq`Dw}2TKISZ50%Ip~4v@l-m
z0CcB&W$`ccVqzt^X8C;$H!QyXMF$6Fq8)bd4IMo2I)BLp(vl+leb`m4mjd!O6xYF<
zTDSRrK9`&`7|!{gb<K)}<lBMWMj^<^8t(*71U$qYxBbqNyxd~Dx;w_P)45to{C)5*
z?tt7n^IPgm##gtD)Zdn%dF$lfeJdqB#utKke$4ncTO>SzP?mSl-<GSad|cFzzQe4R
zCHc45lBIH|rHUr;-vStG>_O^qXiJHVhU12`!^V4AQtbioC(NC0AVflb%QUl^=IsON
zyX|MIT;ou=7C4br5>cj}r34*82o344X?cs%ji<)j>D}PMleGl{%bNfKoSkilN4t@3
zyDks}^a&!2On{e}kXu=svs6jdgVp~dJVPEY4o-+bf_;6f<k&4`MRubf?Y(!~1ETMB
zK6az;)^I241a>YN9A=E8ZGS#_3-PfhA(_%*LXmpu#oY<+mGkfSJlgk2-b=ve)|wzK
zOeGD|!#NSuDokVe%n#3E(&k-<2x2jcPSPQWS8~>epNOX_2_LfRA389vIu?<xSZd3W
zlddqPvYjqZzM)<lTlx9**NWwIUl(iTYf_hE9CZM6N71Z2^!p)>Zle{B(ebZYt8Eo*
zx?%)fSs2|1<~@k~@U`5w8%pewiFIl11g#H_(1z5NFyFhLvVT984hw=61=TXg09OgF
z;cLLxtQ~8(R^5C<q4-8?h{RQVKr0*D9XXu<EL{)}$WOGYclODfba57cKkQyws(=VG
zgYTkec}v1|F=4?sL^`L<vVmY~^k@3{iRs{kiAG^~=8%f>?Sp{s$8^G{az&)p0<bjx
zRKFu~-y>-Bu4ivDk)|)H>KgGfBh=I3*-0U(mLl=3b;={j^8@~EwQ+%=q?H{w^z9nx
zy721GgD^OW^lVLRBk8x<xFf>`^E06p7eGd{%TGOdo&u=!Z6PW9Pmun2SoNkf*AZ!}
zyUYw3K@N%kM@(&4ar!vN+tc`#Z=J+N4}2)d(?JHR0|++22|tn%HG}9o3PCP{!vBg7
zhnk;E5CoGEV7kP0(2J=G(A#eCZD?2y>_`UX3vFa(ul(tIM53yAKfPOf2Us76iP^+e
zczVqW7_d14`}iz&zkZi9j$(;zr*=t@@&7xjN+CIs#O!p}JBFlEf1;kjXGy3%_h74&
z<yr~Pn{6Ul&|j6UX+L#;Td!DE*@}CYPfs@F^R=Yy-grKzvU--=W1koAx?gD}yvD^G
zQmc}N=IhSUqVK3f;)q%)Bslgh+I$aI`*Mwsth$2#-r+Ks99yF!iD3_A8=ciXb&;_t
ztiLtbom5XJ8G1%EJG69(*16H+mh~)Za^X9f`>|DKCV25)*!<a2Ay&w%+-4P+%fim-
zI%cc&D|<*we<{UwO-wOMK*udk5SMppUevW7z4zGDf_Rk6y@5!hL7|V;%o!!^V{qbS
zn;kd%84EAdwdv31AublRudc@%mVEj+1Zve}8Xd1Hu#RE_FNIh+MN+c+64=j0esu4*
zm=$N3WwboVW}gT3$EECJK2fqbtiLZ(A3PmMS6_Syq%Mq5s*aJbJ1!=*h&W-P{dpTZ
z5T{;Y%JQzCDc*&p76NswuCH5*q)x~<$B%v0Yg(LG!H^QKA@Bu9L|bTptwCF4Tt#H8
zm<k$`D&&#<zD#rVbU-+#<K%fp5I;(}kiBW6yz%7v{D-dipzwegDj-lPt>$)Jm0#b=
zer7W1*ijuW4n)0&h<DgH6L?<(9@HtGRQHhw$L-=|-v7S!>;+r6K-4Kt9=Q%DpEaG}
zXHfrg(k?X3;4Xe*Z2uv3&g}1F6^3sajp^(xfjUu&A;)A+xeX?^%I&hr2X+}wM+=X#
z+BLU6fXoA5I8)hBlE>)V;}UWUu`T~Bp)$50=(P-aN2W$$Ul22(Bk62#s`bF89zEy0
zT;xR%yYbU5mRx7gK<ACbPK#Zl0-lt8@?Tr1k*o(o3MOGMdnC;Lw>3f)_b<UYXSO$V
zpum}eaz95g$@&|NS83GrM?rYMIGX?qBAeRXo+W9fyRLdRIq;E6V6XK&Aiy-baMp0*
z$pJEoFC@Z-_1yy;Gj;fgNnDevac?q#*`Lusw8edhO4zpo{J#tR2^np!XW!KMHKO#C
z-B>-Xa?)xdC9|9fUNG^TufFZ?>DW`w3tpI50y|#AwF+1mrKGkaIxXg54JI$qWkJ=h
zBAYD_`{n#s{C{-%e}5%l%KBQ{K;2k2F00%=%e~BWVjI^W>5b_I3i-TS)75jyEJ+>m
z%DBleqB_WWY^b#SZ!F!-mvaO<Z`kV;xf0~K=__-x;qd)03!2JtzwO#o=__!Z@bgs<
zz0n{Am8Mu%=hbsJ-?K%Py6)nJHwaihC)#ypjx=N<&I7L(Eq54(>(2HF9xs!*i77bq
z?kdAf$fD(GB%|VI!9saw%UwX56!!BHXw?0n8a$4Sbe-JYSKDdjml6bIa_$tZkD#{`
z{v*R}G#O{yYfJT69m@P^jL^thS-#sQl6@2zF&s~O4lu;wNn(F<pA#*ZQAgK+TLv+q
zQBK4GDt4|2C5kTgLp$ItL3LPQBRw3+!lwLUReZV3!Po}Of!_ZU3T!9XqpR`>hsWa>
zlK2Eu?=a3hkP9Qe$Qq~S+Kqc)jqu9d-|E^msxb4chkfQ$;uonP73X~rbY72!I`&5K
z5~z@CnV`)JizNGJaV_s86ZzSTWA;$L=u`#6X?Ilw#%S@PZ`$y`C9Qo_VP2=eIa6cn
zqUn#VJ28&YDCQ@?A$crc^u#LwdCxHF@oDMBWWha-qav=fUhlD80JD_i(+wM_1=|b3
zEkXjZy+O)MSxq>RJ>=nYbjoYTH1;b%r2=|0^R?m=R{~W|m79&pSk4i4{#z~KEx1w!
zp*<7TShS=hNQa!mRr_MTQqe+FBn?>!DJHYgznD)>YO&K|=_NtDmp1%hH2cALHlBJb
z6rV@5Ua;g0_ztjFEngQ#tZcZuh^I;1P`{q<9jjt45M@{rG+vF!jh9?((`oxNTN{Gw
zVy#9+y34SmX&@G@id$lU`j-+L>0-|=V>)a!SD)GE;vn|FmDq)0<9@G<&mGVB{TD`_
z;(2HF$vOyUE{r~Z=$$j$;czeByfEe-h1orpeJ=g~LnZd_^40^jz+uBKuZ-s9ZGq^(
z(P#4BIp3CdBnAS%`gVC^1`0nE@Lx_u%KH>kuk5O+y_`z#@+p&8`KcTIa^}6f?+4?R
zJ>!9wbDz6>Kl-oydW!#QzE9q-K67RNx!SA6*)G4P=9L5Y=vT|z^8Rh#Ru26KUakJ_
z^6$D>ISRoKTEkTcKvS<CN2>*GP<{#MmsmYXj1JmjR|p(7UOmkm2-*?*68P1B^{fCt
zcvn^7<y7YCdAVBfp5d35bIq&2YomkrpDDar{C}gwhFpXK{=XMtpI8~`iJBz$nUPzX
zo7<Zk%2=iiU?%mp7EkS*?Ck6Y?U+>UbJQL3h8$QtpIZ;V;P7>_({awnG>1oBc>~>^
zV^G+CMA%?2CogXwQ@@HZKQ~MN_v8LDeu2S}FTEyS%G(B4O$IB+hxi|ah)##9{e!|{
zL|E5|s>sO5f1|K6VNr>xQNjP=!YX>j*8iJ^t^E%dHo-RGVfKG_VYOc-*1t=No=<xE
zB3UOWrR6xq;7#hgg;aajG=sFXw34*=|LVf}WSe7L*#AUfbMxLs<=fQcr(#^#{|O3P
zd|K?BR?>kiby+P9$}H<?D$D&(7xt{&C$7>byRxsX@*ReT#h|d&)z#<KK^Ph~`D1YL
z$G(4n*wng^51)|#0I@ywW#{z~pBkF}0b=_<SLQXv{ceh{X&&Bg&idJ$UeNk>wC&?g
zTV82L>Yt9ZPo2~M=&<Eqvi{Lw+fWlTsK#HY_kU3NRp>kn4ZGJ@b<tN^*I&HQ-`Y4>
z{%f$dXK3dC-i1X?HvK<xVTb0w9Lx`&Eewn<_FOOaVO-ed<?sK{u>a}8&i&hk{lB2F
z|0%+*{+P$0u>WHb_GtU+Xm{`U$KT^02d8^Cr~4=8hi89IZ~vVBx%z$mzeU*2_KTyn
zp7?v1Zdb?E+3s}J)A6p(n~V18lm9BhvT^-~2pjO<L|FU(D#Gef{+~oxrGJUA8&Hlv
z$4dV*5!Q}W_rHs<caA+NBBK-NaB(KC?X;1xfZi0P`3Yc#(i44LS~*3H?JRpL3D!4c
z4^4M+TsE3;b7*r49ddo<elCjhiZ7I67|#j&P@NBOB*DwQ1w7^Th{pz^lh%zoqBk)r
zx}tG(Gb93~rH@l&)5;phcp6mN$jj5+&UHjDpZGX^@M~(LB@;isXPL-#0yT~iDXKS;
zhAt(rk%s=Yunz~JW6tA1N;ET3p>pTkQyeT$lF8&;UF!9vZSYzmD`*frd}>ND$C@go
z47<85n{6KspD7M<>&b}B4{8y&ok~OG)v}x?>o6D9T<UR7fNNB)vM+knS2@ld*y+VC
zmFV5$6k{F|c-s$<4=RergIce>J^Oz}$u8v49B?BWaFeI-;BN>c#(Djo(7TAHfRsV-
zpQS7Wvbl}=8l^YtXpf1~h!S=B!)xsE$p#QB!7w&)?(k$K(Ye=XF3vAq>9`~te14qD
zQLlMdbs%3iHWsp4v7=ECTmDjAX;?gT*M@k(4&10at_!}mf5UdTSMAt0=%W);Hc0eJ
zW%ka6RpWE@6srbzZR4c7LW+9vZ$&=g{X{x}q;=h$^iu<o$%m|R6RXc;e(?$TG4PXd
zrKs3Ne}1FTMNsvY6<Y?L-o>IJePHj_@nhYkIEt};_$(46qF$ePoO8{ZI2<P#e?6%Y
zzyH@Ny>yC1IhXTvRGCAWZ-N|{!lKuNeNz$>x)d?;AXL|clvft8Dxfrb9FP*~p_YVc
z%V4gh7J!<p<?dqv{`+9eJq2<UphyQk00|=oU<rprgex9?C<HA>Co*GFs3~Mvz%V${
z^pe$vi%1WAT!at4-c%5NG9!V51IomTF{B1gkl%~ze|QknO#*yD&UGn)+54}F0Mb!6
z;*=tv(2~8BpwI*3eJclKhcf+uPz&SP14&67spiO%WGA)}SinIu?Q_^>mzr9;{Rke8
zta?k~1A^$%S~&e<EaAHnWUxsIzLNSth#6b~prJ%=(}<F=txzC8507<K$G=f&uBL_C
z#RXCf*14=D(70_T#ae9bCb1`)f{LQU80-uF2=$W_mZ(xwsD}g3kqN<qW`ow>iEhcY
zln#|$MacSZt?Gs;n~ozVPY0kWv?K^sR>pOw9*HTe!rDkKQyGi3W1J~c;UpVxphh%-
zsz<~V*M#gPni+Y)N)5_u?CfC*ERk}_`*_!54WphM6o&(9jCErpcfzGe?2fkIcmkWc
z?$^$)LuiA<f(<Mplu7s+)$e|)L=4cxmy<9ZNcq|qgT)O*^h+dJ0(Y&6uUHXIG;)ux
zv0=4!;aK#sO&&rCu{W3L?Aem?j@tqjN#|<u)wnSbRXda5bNqsLS=0G$M2bq6*$R$1
zQdS6XnV(56qPQrUXLvI+?!&fxi_@@&&S*GLW1SiYtwarZL{9Frj;<fn4gqQ7+<+bo
zkxV6;CLu!c_o55)lJzIaDRb1)vlO{;YnVV0Z+g%xA=lU6Iz9L6@0}|YyHMq~I)2cn
zWE9vEb3#7r*ou6)dv<S}rWWtJA|tU3!Xi9`s;PDna86>qFH|hkVZ2&6eClrCyyUmk
z=Um7)D%Lbr4@m*Iz9DnJ@i|qJz6h#{Y0r86<c$(ToQhwx0^+I&ynQXU`Tbu5v~2j<
zi=tllHAH?%(?e`eT5U_SHsES7V?!@TBZ|&J$f+t24afH(Ac$$*B}VpK5zlCBJcUVy
z<x5(|%E1n4H%=wZ%?EK_f3f)lmNipRE*dlO;SyCjGD?y_He_o(Rb%aZEhh~0<iP7&
zlcLo~cGS;Ap15D$W(+QfI3CQQTimf|csJ~jekCkoBytwFT2CN*m3K$iRcU@8xaKqQ
z^`M;z5ygkG`GuBq7VLYE^$MI&^tyeBV&KbQP0AauA$j`Jy{?YSXR{va+T^mPkRo(a
z<CG1OX#(2}e-Xc6pRVQxtz0=C^cd#MRYZ~D8U2h`UHZdwF~IM-<f5)xd0cew!e5g~
zbLaCCW7!Rs_-@NQt7o)DVryn4&M=!e>K{x2<G56d^~IEFpI>t&7`>7joRHU&j4DNb
zuoP4DcE!JaG)9(M+1<Gmz$bIFoTv)4Rlm%7TB8{M?3dfZ!u`-w(QE2Ly+yNd-5f+~
z@~cBwnXR5*Kx$WCz5wwbY#7oY49ok<co#F@{Gvh?N}}rFb?=M!l`>xt&p}bs7*XM*
zSb0MyiY>fvXTotWXbnSHl6hk5XOdDE`ZV}D1>9e5&_?exJ9XN~lvr#}?EA*|`Pyu8
zG`~{<@#NmW#0jX=|G6-nKBhx|@FAX^F$LZ$!N6PSJ5mC11>`DU>le1KK&s*v)ndv5
ze_b)gtw{Jv)J5#=xhJFXIN;bf946hYr!Vk24P@@j*s5OV783Hw$kcO368*@rHf=pu
z<IamW)cGrHt81OU5vgb@pKT3hSbT=!8dKERT8g2=pAh^RW&l<B9bRN*=|@mc`u?Jl
zI5)Kc)MPc(2DXR3!w;VL=D+psCj9r`c<$QRr(%CPm0Ynk)kN!O3x(h18Goe)!Er86
zR-d1k8<B?G8=reb(83Lf>pv7e_^TiLA|-~1zZWFevR$9)jzeJ|;}lEj^#a*_06z_V
z1QZIvn+zcgBQ1@xm3S61pcYc?Kz3hF<}Iv?YZFSzOiDBlADknj;v{Db2*aNw0ZNh`
z3nDlCkyb@`NF}%$oHWG)$DEAhdmR#+1!u1WdiH;?cjy05{&C#suURk#Gh^Qw`(QBE
z>}Iirgj6CK`w}85A%;O?3oVjVgp%xAD#<XGkj9#d8i|x8qLTGY-}`aj_c=e@kMnq(
zpU;2rxwg-BU7yeU{d#hm9d@xYU9)$o=LRz_U<_00BTqukLd}}EJyxL}s~l~)h!7SY
z7|}Mb=Qd**9FCwKkVF2J7j9%3Oj)P+EJ)CW(MOqx%T{P2#X5W=!p<NqLhSM(=d>+F
zWb0A1GLDD;n#UQ;<%G@4q<Ri59F6J*A^t+2$HP}{oV*01UD@BH;Uj5?WXoK)^!x&$
zt8VD)G3iB<>1+tL6P3XhVLLlq?#5(P6l7GkW>igP)NE$diDfnzW;VHHwit?iBPWXv
zBN1Z!h*o5WSXRn-=7L~WM@(j)t=yvsi^Jp$aXF}E0ICy}#wCYaJ01k-q}UVr--@7l
z3$j=XGP`(88S2>W0)9Lyo1@-`+dCVQhq#Rn1mDo-tj`t%<@{{r-VnR8vng}c0Mb^6
zEMpO$M7t50T9nnWmvhL8RSx9{=!JDC7Z|DAf%{gWcbE*$x#|7;dTx8S!HE&{TSHW6
zK;WZs@WU3x&0HmquX!(<k-Bvp-a5xQov(g957pSuMbzRTmsR9qe1hC3bIR5bT+aV2
zSWDIGO3u+oBZ7ZGVOkxw>()4hGS}f*1MX<t)EG&W8>Z}}DW8jw^o2CyZVY@j4_DyU
z(76hBzG^+jxdb_AfP*Z}5(A8g%15|oMs%RgR|mk*uVX=~ipGW~xDVaGej^W3fkyTJ
zXTfISQCa`Pf(6~;)dt7o_}>@vqK0qPF7Tdb%5ybp=UyicIg!*G@oQr?-*VN=if_nw
z+~^uZ))sSWj9`Y#3PTz>)+cOK8Tor10ne{upP$8X`f0X3#XpzV*dI0v3)UPMQ3tO>
zGjdPX`a?20h~>!zxpEK%G|GIRRlw)`&w_2hqvl_sWb1ATlt7ID{?&IGqnAyvmdFR(
zhx(Z4Q&A>EXmD<{9k-r?iRJCRRpl@y`kAW6PB7OKUF!+?z|Mn3O1I9o7+{B3NWNH;
z=kmtA;5%KacjN)<{YWSxglozVqEblt_)V<hKMOYV1j0NQeD@pDuK1q?+rTW)DdvNe
z@Bzhq^WRGGYAC&sQg8_}AQ#NXy34`;&w`zQ#r5qQa_uj|C>K2ERNg@5R6z0Wk;}n(
z<sR?LA5S8+ioq1rv92a<-G~cnPC@4Zb}^8K7V6=l5#+gdXwL77!yV@0*Uq-pX`hRI
zxW`htjl&A=hiGEQ^yODQ?1{*1>xbu`aX)uamvz4;U#Rx-EVK<}Y{i*NMEPo{iE~om
z?}5@S0A$_)!+l4hn1CGx6u*kNg)Yqs1_5M{h!di<^6?(CvR2};7zLC?200m{vVdDU
z0BA249Dqgv#Ylx>08R#pp{n_CVDn;N*tmMnsrqeU^@nE}Z76~PQ{9o%Y_<W(9|g_p
z<eBk-ba(Q^C(8*!vJWU?mV7nD1bo*dR2!M{=UzRkYOzs1?w5aqSO(M*p;_|9kDjE}
z?bTtc<hkSJ5ALCP5B~&zJ6oBn4K|A4m`R6&QC#s%Ad?$(oQ2FnKiDIKGM|<K`%Wl5
zbrj}t12(e(JbagP4fHt#=tozN#a>@mMXA<-z;b|<dd+x7>Du3n-bp`=FO;^)v-bHY
z1kC!&M&?3kCM2&}+&l3TrXg#%N(6OF{WNFz;w@A}DI~AaAhS{bL(7>s4u?f#O9)C3
zb*rI}+xjum`F7K=#D5Ab+wk;gJz|n6sZbPTFSmsToIMbnK-mxS-N@5VAcWSti^zh<
zPv<CbzK$}Wt_tkkuvg5B`yUD{syVXm$>qmLBentyJa4dn-lCqljY2RCp9(gBzJ5nW
z76XlickkGvM94t?!D>UE7vQ|M0h2~>9SHA%`hf$%(ZJ}w8V{HZ9FKU)hhu{ft(;`w
z<#*&~`}X<F_Qiv38;@lVKIQ*&yOqcL`n|a89Q2nX-(T9RbwKDZf5mlJ7JzA)9lR%n
zAvz9dVe~LMy;+`EB#+K*a@@-$sOS}e1di6OA)r$oic3PsP(&O?^9>s9K}N(u(Qi8F
z@)WN5I>-6qIKYK_o{UzS>S9B%^C$+<lwo<2VI9w~m15k$naeG9IkutkMGP0yZdWPB
z47l@fQTMKM_sOYl%Pg)dW!*kivRCn4^8jxUFE62u?*ps*<PLA}R1bl-$Ht)Ne47m3
z^bE1Cm(a$cvD8Cs<F=jRjH?1CV;M21ix>9W`eyTb<?)PA-acZyj>}2tWmCp-1k`P?
zuV_j73YPJa)mwsMd|c(|aN_WYu=8W`9A$D=N--YQaeoAOHK4o`WW=L74l5=nDfE?9
zRor3#YNZ&#U_-Fl$y>O85G<n#@rU_}iIupAWju<2wuK^s^&lB&XjomRt`qFj4zC)n
z*Dn{2g+lR8+<RrP+Tt$a(tuT)jp7l`&{eL)Vg!F4(wdCQCvzhRyuW!l3vuUV@{q&v
z%!uKkdE6PxDbBY=*0p3rY8{8V)No7$^s~bd!QmBQ2aLz{zleWDD!L7G=A6azZ-t_^
z$b%?;9>@#SpAODYG+c6@j%<&BY09-I<ssLLQKn)17THXg6oc1{fsked3o!)m3}YOI
zl~IiOrr{@9V=;9~A6JLu!w|Jh#K=vQvIgoco;Nds?>>qLJj0W@3S*#A&sMoI>v*@8
z5IL*=q}W~TKPfgJ{Wd4!`c5&NTE`2W8R64LHnZMHmLS)d0$UM$W}X5&IK-wYic!pc
z?Goz7rFT61?+Wj{BYM6Z#WHNNU*}+lh0KN;i@_x<J{3W@nh-++H9Udh3t8eDPa7x2
zW4ByJRF;wT9nee)G>5IV;<$rwyqQeyJtsIhf^PuNyLFQDNiJ783;8wzHolA;Hk%&5
z1WVkH;PcOA%dwNZ-lMc-<oqGto+;!A8h(exvj-r$>Ui@}JX^&)EGPJV7Gev<Q;y@c
z&-k>pjM!r${ieB}u~2_-$UjWv4w-4MhT_>9++!gwNAN-OkbhV&CGH|6R#57PP&*wX
zzntLBc+?;K%*AOWLUTs#%14EEBkdKWQo?6Q-e>4AQqCNuu=j39>^-3ktHI)16JliG
zhcAtQ1EvDK@SIUQVSWJbp`TzPYJ^xsh=26~%q|kdA>3I=hX|xKo>gBw<wltSm%N!~
zAuns7%5$efhUW8&k=AJVGyL@I?#S(B9@=YUb1qlVGS5yiPblltW!wUJf0e5|mrFaF
z^FH$przSiHJrl}W*d0W6IW3g0a`9;+a!$c#b3fS_A?sO)yW!mB9iO^#xtf`L&=o{E
znfnO}`Bww(Kh15tjQm5HC}d3z6!Sc0a!(f{r^(!RaEP@CBm=$p#uV{nb-vjNK3%u;
zWOeWlj<=A^o#V9pm-#V=y|eGM)O&Yn%yDL=W3D&>IS|29Pv(wUo_)2@mnFb=1Uq!x
zjIrU!_?Y`+zK-vY`G;XN^m5i5@7j2~G|z0uH-`v5#xn9w@svZ|d~o}ly$GIb?Nbqs
zYa$j%YbTy(#XLbPAJ`=Ayv9s)1ndcpJJSgn&Enar<4t6J4c$i}SBiOlt#a1qB5@W~
zeHy3(_ttTV$V4Ze>_c3<k;wb2)6+QQ$|@IwiNwhw4<_>2pP5Oo;bu@a5-Ah)I9@Vt
z>f?(^_zVxp3!cN`$#LQ=T!rOF@ZE9Z42pm?<JZfJxieqzMmv2AU4=aZ7SHE=T#4YT
zU*#;1Kwen+l#l2A*D?0vPv-O|D&==?IJZBO`<)|eH6arp%4gr8_{)6gYF6i+dvHRV
z_KB787t%bi+EpJJ<Nz7E7y9PS(u_pn+8OgTu=m;?z`1${dGpZ6xGR(E#lN3L@Gw{i
zG7DiKy&i9l`jyMYB2Qm*V)-nuGqrZt$RoRWUhDmrs6U6e>H!415aS6B_MO7|B)ium
zh0H{+t<?Q#&Ru3iz-Bu*r*YhcVW>Y5+jl>5S0GTk`6s@gKXX(gk$ab4Q25QK2FGWX
z<CSx#y-BGndh9Iv$nh@6@4WJ^easm{=dK;k(JzmWs3we9W*>1Ioj+7$bZ+I#yV0+Q
z|BoW9+OPs~FpMq2o_-tT)qQ1m3x1fXqqp0gp}&%2p}Z#}?k%{uY-a3G=Qa|kI8%L)
z+y2|~+dpSmk?tKqa!-$4JDkvtRcd=;>-sWocE0|^1fRp*zH5RL1Eh6#nZ#Y1hJ<IV
z|J~T=v?TR?Qg2}U>6}T_`a{i}3XAofnTgjXAMc;$p04L_&YIMrecxj=mW6*cb*|re
zy6E@lx}8@}Pj*%C&yq_2X4=uV1*X>vm&_{aD74-9?^QASxzDc~j;VScEBvMg=FwaI
ze~7TIC?vm{(9DfMtPp{Au7$aJ>$u*O&mD2SlMe;>)KA!SiBFU;i5Dqqq{6tBSE~1J
z|D5@Xk=&hm*yAFzn10XwezC&S$OSSr+hs$QgGYH7cBmwF569P>5bu4zNv-yaiU`Jp
z9p8TGS!7_5qw$)JEY9l0sDs{k)x&FUQ*6N1+0tmeaN)t@D=MB0N$YDKc27Bq_H7FN
zj$D_xplB^vm`^xt_FJYr{k28@D;wDhma6`@Osh^d4X2`i^`gyuzm-V>9Ip06H{ToQ
zj=7(1{&nnR)VMz8pk9`>3}4Qw4IkfJx;06EM|GH(NNidaPITLN_!eHm@jX}RUCb{v
zuZHoVhY1EpG52Ct-sRnk`KgL6krp25osRtEDR}C_=X8~PQf&V`65B!U5;aK&L0Ffz
zcmE8!+y`cn=V+=B9u1jC{(1gaOckFNb+Xq<l$$Vfg`|yGXi@x%cp4v;^P94)R|lpv
z-`mBd`=(on_q#cF0|TG0re%*fGIbF3e&W}hkNus$`9m&^Pr0ATp>#W4wfot==i`>G
zkgCRs*wZ!7e{Y>moTvMQHVhbShc=BKlgz{v)E#;lc|Jcb{Mlm5cKEaCN{%z_+rPKZ
zbX+(u7~08mU?+khcsxF`r#wR?qEA7~_u*WFXG4|__HBIB(1Ab=6|V`AOVK0tqPrh@
zjvT*qZo=cj?zzc3{ekD-pZ*^r?2GdyE0J1+gst>T|B0|MU#=ZbxHy0N!rsM&(wqN@
zuzRsfjc*g;R-XUai(BpbUn1=2@x)92ON33>T72^VO@!6PB#Up7_$6XF>adDc211K&
zA|X_ZE5#)N>F7&3(Z^DSO0Ybs5h-tUyi=VjhyizU(%5m>4R{Pu;I|XhB4rrvzd*oP
z*GCBJ^k%BLrt_Y#RhMZ%(JcKCazTAk!i6O;CqFsUf-ahFg-=F<TZu+OMcTsi`)MPs
zJqGTuOo<F%(XSXQJg3fSS4Dd{zNf-EBhJvveu^gqg3XBrE>}-pEJJHteC2L+_G)&O
z-(S6_2d&SajlTyim$OPg==$I)L6_{SO8RRlr#W(?*7XZE_>tYoc^yKFX&EXdwY_R}
zB)1*<;8@B*5ufiaw+4zb6h~qP>#LB3sji>&UhQ`}ga%wwEi0NAxteOOA4)IuT2nUc
zHX5qAe&qI|U!YSf_v<4WKklril&kosJ6cXO-r4>VcxYaAFedHCJ$6_Z=12M)%I_m3
zlTsBLf?F@rjGKyonqrJ)pE+fH{wZ7%)2+_D)vZ%FE4~R0##-5pWCpmFS73)ltYZf?
z2FbF+H0!NX{MnZVJIa~y)((O0qwCXp4^7Mh4*T1U-cUYw>u2!<?_Hw--3+w#l1GVS
zYH;_X%G%1WO-jdZY#pt%W2e2zpFZ(A_E^({qt*VxU+oFv<IO!sYof|edoITwZ#%Z|
zs66HLsokyP9h}GNf|~r<Th?xkLwLRrK+R41x%z&H+_8pWJ_TpVr>Ra^=NfL$g$6FF
zK@Y;{rB~y-MHE5MHxG_AKTh=xviZ<AayP&E+MOgtnK%y*E8nV^7!C7F&u{1&-^dHp
zn?I8sck+wG2<e!=qG;xAwg~&@$-rFY*%^%IY4cJ6twO@F$Zb#93#X>Z-5@b7JqN>Q
zH`*5cy`d;ZGkCXR=lxwLGb|L0f`=h|+6{15fPz!dEimQn;YcD#Qd9`*ca6ZW{8
z_mzU*26REk2uk+}ZtmM%Sd<7jk)6!&%Y9NxOw(TC3DX<(T&F|6E-cA29xWJP*nMsA
zenb*aXJAZBk4b*GNc#IDQtNJgay87Hn~!JZME7+pb%T~N?>O8zwXFXt`{Y{MDeqH4
zhffUjj@Kltp^mDaIWai8qyu~DFsXguX7}NMbywOimLBo~XDxoXXg2=qQY>vqvNP%)
zs47s%?Cl#b!tj9)@e2>G!(LGnRExNFgN|Q0Kb-rZ$xYGoTdiME2W>vuMLr|g>9YG+
zsdBUWk@vx_i(f{|1I|76+zqj~XFT5cJJ8DeQs8kGS@hZ<vDSuu!*j!!XS{A+DZ#1V
zb|V&1F4f&YxI?onP~f@Q`m5Og&}sMDXYW<btvLV|#nb*LSQyrUXg!+_w*-Kih&l11
zX<;!aS+aPFz##-Axs0$tn+(u%<hSro0UeP2`C<?tl$#p%>F@hV$L1D6^O*>zV$hhT
z5@c}thI7@28(>kMde4K9c&f{%g&j`dqo?haS>3rI3JAEr8=<XLG;`;?;oy%rFlh6+
z`pv#hna;2)emwG0p7pKAb!yhD4ZEh-Ie&`};WA2YE6jNqSu4uZxyeV0zUNKa84Bca
zctmr2Ir%7d?6vc+`m8D8K=L!AO6|+ookI1N)lTs%!@>l^nQtdm|Gs*qb1rI!xH2!+
zU1P)l+qQ^4JHKi?nQhL+&0C}{h3R+`X6|?EjnuIIOVc=eb7*a-0tBG3N4c6Ek(B@f
zaw)p4F40-1i`1iVn@`Nlp#Zi61Q_mj$(Tj}95EdbJ=|qc1eyYkutEV$V=gsR3<r$G
zW><~qq;SM>0GRPu12{(Z04X+k$w~f$5ps$X3+?8f6$L=2YCsdZtd02&5Ep<4&HV7j
zwsW<wrsqJoSa7%@D5@9`C<Xu&g{$C+7p?tU+*5lT0CF=!EM$bBD87rPgSRoSM@@%D
z@k<#{K&-7gf=zuIFX?hk2|_ys0q_)jayFy%wh0iC)BypQ&!IpEsL~|OeiFnPLy?|L
zT0TPmG7D!DuGNzq*VOS`6=@M{!j+X#f4hxC%s7zsqG{koXBS>&s#zAG*w%3XVo6~U
zX*^DpGn*XyQd97pf#lV7irkoS?Is;9MNEO<L5g@NJGIfzTqT95YWkcFdtHQ>MzvCS
z0fO8>8^W&<>1VkBCpCV^fTBUQtrSjH2Cp0C?Q=u%>t?|aitIu&OZT!M8mPxxDlBFE
z`k*hi%D|3MPEjq?+RQs406U-&QejyyNv{@rg8f2x0%1$1V6v1|)jz{Esc!bU@^!+D
zpt;X=<5wTxW>XoU=+29eIRRA4i7G3=sizumDS-kGPHEf3TdHI-qD^aloqk?DNvO3Y
z*3h0D)-!evH9{=dAPfx<lZ;w&x13>T^<-Lrr7d$73RD1z8<aDX8ERiFIboOgIVyT;
z#hzB%b}pGfYGCcFnZ{{jFTHRCU=?_<_`If1Un=O8Jo~3zkBghtCAwsi7TuSS(#Map
zwKN4$<89y`Hs_<YFF@@+^&8eK!r78*Z65$ZbpR;@r>P9_sSI6!@_Z3K71vY4qF8NY
zByYgQFceu7;PZhKhyd3Y^i?wnNPyyn=E)vxm%|T;`jMns`^y++cRp}V9T~W|(MS5(
zUo#2fn9P_feO0|+(gby=F-&@>$Ms|b4zIwM^4cM!`cJ6$4_K;*ZovJ<nms42-j^nM
zb(k@!1kt+Gs=;o{y3~tNY0y53*CvMw-p~U>fs3X3qM(T%K>HB#A^I09588l|&`VK0
zw&Y5&pG-5db!1Df9(8SO$yMpPJ?CVqGh1?vcrj-R@u;)#sNjT59wLx|ADJn#xHf~S
z3@#kQnM`N^9A~7u{jTA=^|)@F9GZ`JjIxDFnX)BUV8GO|cWH22!0t6vYsiur>~66;
zYB$Q3T*aQ@EFBxKSpb{;CxtBNQmLG%mt2$PjxoTRAO&W|d2Yb0ro&8R4!$|te}-ZK
z7y_tb;@a(()x|H$ricKH!n=APP|OU#0D;d_)_q@iK2H&T@v=n_3PQcyP~Z_3wm4kH
zc}{_%JJ|!TI0!IbiVIsv`kQVGQm_Tj&d@0PD$&e+7bZt{HK+fmFFS2YEO}xI?h#?u
z9>sBSs?3u)T4TsL@FBws|LkBTXAM>nwc1WPn`W-h6=*xAq&H+%KE{rxX~2xtOmcWB
z@>u@L@LKJ*WJ|8Ou120(2QH2FW{e(bE<Xcw_(|y>r$I#l%YqL8yRX<d^r-7=hojS`
z9<$@WBslQG&C(bES<!wuGld|0?5Ewh*RI;JbH_rekDb1u7?eFxRyc8b`PiA|iO}(5
zH$G3CQOY!P1329Phbg!KnG&7tw0#x05Jm|IQ$&%6wni)+n(d-JDPOSVMl^Oq_lq-P
z$vhn|%cfEVizz%2NnQmImEtkoh~#~n8?T^DfTZ!31V0|xjX66$S!+lI8v+xv3<w7B
z+|lB&1wgPNk{zXQiG7_%x7-0p#c>rJaP<Y{1Y2^&xBDM?^815RR2|1vB?@MmIvq#%
z#Jk(iWqgu+IRia$<mdR6OZ7SB?zOg1P(f#n!#il>i6gri5ZZ}`Md#lQ?_#H&0d{AH
zagxNPr?z4zjz^@~y0tuMqxf#7>PDnan{?*uQXbA_M09|_7>eik`@M$uk2UJ5mIp&v
z6b>hV(=aKl!y-Kssz2TAiw1E8QDAPzYks|d1@UN@<P<2F;t*@a(kN_dn}Y^C-A?6o
z0yu16cZ>obZU7IXruVB2LENhc*l#$#Ab^Vom`tZOOmoa@Ou=XXcdm&54XBn(hPfH2
z1W}-^6nb+%jAn%}gm82)LMWbWFLEL}8Ahh$PwOAIC2@*5zK{A)&4O~*O>?b2zo7^G
zy!}FSF5`RANVWq$#KeMrjw6mOxnhV>lSu#>=+;oY5_U2nc4}b5fHivJ=ism`2SqTb
zV@=l#w)dvy7kv9eH?hHjjk$8`aS1GtM@=YUhH2~66CkGnPg?+<-42JnRApPPc=}A3
z{phUM;&sYBK8oV`R9?J0DEIKx`ui}<2VcW~maDYPOqQwhr~>8ow3)&wz(>*yY}kJL
z9LGMlD^Pah&EGlrPs{cNkK^?*Gm=Us-0{Gjf&VbqRYP>kkTY%M_R)WstNuK*+6iD}
zv+4`T@Ng9#13Qu5eP>!z_<E8sW;T2kLp&8}&NvFcjHjT%biEtJ*xxiHZbrI_Gye_*
z)pxX50XSSWwAhqtwmOrI1?0}Zt9GLRhDm2u!HZK#%Kto9V8h>3G5<{%%j<mC3*JeN
zK!eMiD8Rql8AN&cQ;3r6O9_K<ohwZ;3VP>t!~?3>@ymD2pvG%&ZYpaI9$@JaHA$6M
zPNGG7UpE7CqJcd#%9GF&js*dSe`g#QAzQD&Z4$nm%kV261C)*dQWc#0KZT~adB5-$
z`*cF)s!?;bR^AOAMqi>pZ{ubbHw;wV%<kOic!>RA+3g<{0eG(XpW6EZnS^_{4>jz<
z;W0inF*9)2FV1-DZzk=(+0*+rsMYKU2;Y(U+zz(dGUn=`tLXtUbck{bjGE+xw0|Tf
zzY8e$9F1#lsR{u1ffE8g<@?Wg!ki&)tXde!(tIJ_Wr5@yR4fJ7A2JI*Pw_%gcwk?6
zIzCqyd~nj7xnf?1B?F`O6t9?>v1kfVKwaSJ<cguFVm<87edC}7M~V5o|8PLKX{fp{
zxc|#Hr7vD)0d`YII{FhRkLEH~;~cdI0g%&yjv^`$0UU9(+t1I(vsVOb8Q&WrN#6u1
z;9a<gGNEnOOQ7rshXEjZ<0QR0P0-N%<?jsl8@^BPo_?0bAp83T=Dx8te2EQOY~MTm
z(wqXR;0!c;*{M8TZ8$@Oa|KFr{M`oi8gMyc*pme(bg*MTKG^pQJP<|#Gt7p5FID!m
zV_rCl1Q?r52mj^m5%j0qqXGSsofoczwPr)#C-^_PWRHY7r^L<N_V)_pxm?EhZa>)^
zhB*VNn6y;vKJ+3miq`%XYOpu=)hoBdzV5^)zc$^Vz*~HjxA}`HE8zhRrw>l00&W1G
zn<Kb5u>JSxOmhnn8H>Y;-W*??wvSM_I;NRC00*jdf7XO5%Jy7yJ2sw2fDHqz+C%=Q
z=SndPdN-}^BKM!?YH7&H&GuYT7Eg{I;9{}g@D9+Ez`JU%>(ghWoDTfwxl$A!T3lO<
zcrOCw_M6N<$I+@!8JB$NX-Lf<2Y3yEq%t!O*UpA40Er$i{P?mm+{9rBkZ7gkSEsS3
zaTFy9^#Vx9UwGblLd6M>>;v{rwZXF1maT(&j-IXaIcpuAHnM#JB9_FH1+YCCXEy2D
zn$nOO4uSzbv+jG@Cy=W?pjPWznjyEtIZ>IHIyKgy@!#jnAd&`v1Md<zml9%4=VW;~
z+%(vGG0o9yekA-v22bcd_mVT4`tFV9gkvbb<AAxIo<pLf%Q75_yYHaPmthz)NFR{T
z(RI;+k}3H$<p399a_OEK5F^ZU?m6&4{RhUXJ*W$Sz$nlxKv>^C#@e}i;(X5eR45Dp
za(-(Uo)0;$cKRkGEF#r8H?pQ8wo0q~OkJw;YOCnSB%fvD<3YzfSVzbn9<>!|7c}3u
zSd{rjq;`K$JdSfcKKZut$En(gv}YD&o)z8#<R@XRPy!3uxSeW?N~!nUewOphD8lak
zxmdg8tqQM4k8Z{v>_79+g0oL_J@_mozuWfJ;h+7z<paI()*+s|Hx@(sBBP%@b37M2
zqP6R4d}-|ErKx*$`|loJa%k9{+P}o=t(pFM$v#$2oG0PS;XQ4hJTLjZ53#y)ISJoB
z>A-`vzb00pN@~A-N?18uhik}Rynq!v+q9yUxZbN7xK^{eU#WDvX+1G<^J}>PX#dv*
ztj{gb&z!{FPl--v^XIu>iT|%6Y$@qth$U?@`RjP&b+zLSq5mfl_OgIR$e4e*hGGsS
z^nZ%5)giysj%C)`{@+B{)4#Frn?nA#2s=`J`j6(RrrL)8L|9fwGM8XGX8*^HG6h``
z-SDMN?Js>-RqVqFE*x{O@~xWsmj3E4Fz?%3lX=}772I?CP}x5bHgxi#SM8Os+YJ&2
zQ!lKqEN>rJWp&1#5l-rr`uU~*rn)Fm=l$w}oXt=LW5@V>RQD~r9|=xnwD0eFRX(lk
znr>};f7^KGhq<@jRbrp+1x@hQ_6jRd>S5w^d_vdq+k1%vATf41r&=qT%BLxI54J8G
zB%6TPQ|3Mh6$!d>>Dh@%$+VuZf|HkJ3uELnR4ZHMt$z-pW^^~4`+U4nc7`)idhmc*
zn(p^ag<JyM$S+zmP1N`NkhHU0UcA-%XI|T@UwyB+nO!VPbUpS|>85Aw{$GE~pHfLm
zQC!I<Zsh5<>3lrzaF_dN;pu?4^S95vzo>FobtUl5*?{@KV|OS2{{3o`wD&})Bwg(p
zru3zFrS$!51AX$XJiGV&<(%%Zst@nPZUtwKojAY_&rGc-agmR43$cEvcJq5>Rll)%
z_1&}}*$d4+u0<*C-;Mce`~GgJ*LO=i_ow}lKAo4XrS`na^7TASqj}tYd*)c2r{sf1
z`|$1DJo%Vyji+;kapB4GuPK_O?+t7bcCFu|z;s>Swf4o|@6WYf?rv>sb%1!-A}ohw
zJbTwsy$#pJXR?E1@Y|bevqji=?H=*dZQ8x;K3?rUxlGf4B5b@)zv|=tHk|>D=Q}!s
z+5@J#|3p~bA*01M-8W|2|B0|>dc#(d|Gx-J=XR+}7HLCs>Q)eLo+}m1ujtk{z;tS`
zxmHL$R3xjIDBMsY1W}!V`BupLQ0OpcOt*eN8LC|8&0p>Ym2lnUO2o>;t;r;;Uxg*t
zQ-xG(OqYI$?PU)(*DANsi;Ldm3O3~DIet=J45CL9&QIpEE~eraI-m;V8Pw6S60YMx
z>9~<KGhaQhSbkD(_-0p@x*kzwCo&sDDUo!H_LUZVbl0tdDR3Dmv)I_QF@=B0d(uaR
zLmr_bC<?OBnKBje`-q4I5_%2Yqq9OkXw@K~um<zN?)P`3cyG?~Uvrg{P4`YA1c7su
zU2Wl3+Ng7^2DxY)Sc9Gf75+#}-3?OGQx(XuI0@k)qi9;;;v9nKXS3?X<VnWfPz~NP
zq1k9#l?4>hIzLJ5S20QEzUmuVYpGBgmdgEgh9P`^Se8X5%G4y0(y~aYEEEmlxq$R?
zyD!AW&NTAT=Jj#=EYU?vHK~bo&|@Ua*4xS(NNzD{j!pO1QyyTVgHrsj%fXTQU*PXp
zh@^#1*u@GC9{qZhAzN!zEBYq8SHY8rx|Y=|m8P^8gACkKs8E**aXwnXyf%?no+#9<
zeNGK^f$^C?O3GGC`mc=vRzdDDxzxfna-U)QepNz08*Gtb49k)km(HA2GRzN2Nm$T^
zhc|nlJZkv%mP_-MgsfnL%VIh1Qpt$WzAl9zBjkzsh^wKtwx$t}y4*KOMdZy2c(3zV
zY#INpJya@xbmiNG7?CDxR5kpd$E4-NYK}u|n)o|1!y{RambfsdSbGblD>M3!Yjt@?
zOPxDkS^+Wo9(;tyIZ*k+)4_8qp}}zjrdhsEp6rw=Mbp##Yn)nP!4KfG-;kcCCQ1ij
zSi!re-Nz~?ZY}+~%>GL9T>f}gynS`$LYN`V{kl)Kn%)n>Mu<CGYfX(d3=rQU3~uJ<
z=WpCuIVBly4YQBAyj@+2v6K7EzwhBAwI<dp**=iwz0@dJFSaHxBH*fg-39%YnM@5d
z_WnCEQuJ&3F*-8dS~_mC>*p9z#>biGkl}A+jvJ?;UD6R@c|w8cQ=4p!WPgP>za`ZC
zI?o(m^RZvZMU3HA5fA(4^pAHBfRsxyeYXP)MlY&`Cp7Y1k{c4f+BlSO9v;rlJ|bAS
zJ-Fj3Cy?;>t5smR;Au<6QiV&x7qUnr`R#fSbgRD|YGiAzXqd&_N4bZ2zQ~j*H4{xQ
zp)M3}p)2Q`<a;-n-eQE;oHLjCW%xZ6qK~|V6G-B4@JVHcnA{5unhBb3k^j5PV}epB
z(aw27hwLr2oBNwcIg}edPu~|MXe<)09LlwDig~B-g-fvRAJ;n5z+i$4ay;M~OgZ=(
zK$6NsdB<=2O3nI{%73xjAKi#NbQ#+N`?+sDR@ab0MZJN$AWjVjdH5YBmv%mPS{#Lt
zeW$M%T>x;p-!*`X9C!i=yT#}J_P(rX7KeaOk*k3z`0e2<V382-^#?w3BIH(ff}!^S
zb>L?9otOtLx{I9>?w@O##ccR|OWvyJHVE}ba~Wnu(8{*JbG#c3O3AUvV6howxtr!$
zugp&;?b}{F4UZ7-4}xC!lGN#d-on$IEfofxKbU*Q#(T;fK705A3hWILv|F?Fq&1ef
z|1pNJ3ndg8y0<UxFF@x<6Q=G^>B~8Nq2jnt=`j_~=nE>g8vRbet=ka3x7dY|QgW=G
zK*A&U)F%tIk#B9tcQbO2v+f3;K;Ay<Ja4_K_|;4+QUgmx1TncBHRK%I1RHrPWBjuA
zDbN>h-9N{RssvKMXO@RtUF49xtZ5RNiP_xy1H)pnIRrBG^9j<yTK+%Z)+~lxxt9N@
zb@9#29gDGK**SXT!7d4o8$37YZ^Y^HQg5&4-BZ2AF9;Q|Fui)Hxo}(G33HGU$#0o2
zZOMhOgk41wvd}OQ#^W$FPfIaRJDRtrn0E-xH&IOe-$HAbG5Yd>7>EHLqNfPKZGdr#
z`w)H~hyhgY>_4KFiddmmyesBl6RibZC>c3yL9&WovfKt;f(8<GqYD(t@t4hryC(@p
zB#E`nNKDbCHwdz9hft5GKnBaamy_<Fk;sx0&zF;UAje--BH1$|?USt90oDK@dSvQ9
zqSb9?hea}pA?YxaMGcb0&e8>h<VC9p(gw*YSa|_+A4NMk^QEq%Ec8F2wSam+$XhFV
zMl@|kEa9_2ijTCKkAhE^v4gx)NRBC4UL)RHmX;(ebYE-=q*_SSQiLe>L)6t^A|Y~m
zWAZv`3cALnDji@PnPlQRgF_tF21BsqWU&N!(U@5+&eEH1_q7Z6!73Sa@eG12MjjW_
zWtgw9%%U18La=(B(h(s3CSL{otX=^XcdFmK31YATHv5=l=ANWm*lBK1W|84&Q2@ae
zB+E_C3RDq@zmpHJ1{zq@1Mz+eRY~HXOH}}>k?XAWu`71JlU1gY#IGu1@m<Eb3ePr3
zCipIV4PC%ZQJD!g2=Y55<7lEtRozGu|44B0p_=gy9`Z?c)MU%UM4cwm5%7@l23T3F
zTucm%#m;rHAO^f;W;Gz?jbx(~|LMAN)hW6Fjc~FM;^g9BbG4j3NL4)K$VmA+76hl4
ztnxcal?*wQ>|hZC!EVqs4TxIBW!?#|&G8Ur%zmld2H343%TzHy(g&<(8W7-~ZQ7CS
z{2QcEMT+b5Repb8WuZj+y|+yMXZaDZ-m0(n{6P~Y*uN%8H6<X#`jAOMvQBLBfifEt
z2Z%;RshL2Mu->e$j=V;ZJU_9Ee<WEswnWb9i^{P;*%+c084~a@{Xk5zWFa_I=IaOx
zg3XnSioI-xC%H-}I@}F3DW11-laCH5Pq<(1`#IgH04y4jq`LE9cQ9F|__C5M>3so7
z0ZULAERT*Mxi-l8-d8!sJLh?9{`ALmqnJ(sF=EvGn`<x-I>yF;5Bw^R&!7q<%1ln&
z;xyk#mdpA=*1>o+L2%IzgbM<^&L6bc*zc57ChZMUBJH>sx3WzY74$5*%$dn%21K3B
z1#%xXLX&-K1mB72lJ&vt_I2^V7zVarRbIvcTcYu1+Q)Zp*m!=Ci&@4~k9H4QdVMEx
z`-t5Atx7296kv7|R;ipm3@)D(qa}=TSrEx-#;OBivjNd_non-A$@`dT1yF_cI<tx0
z=J6rKl*)+Q%Bj^(ep5fSC6aIo6)y!chb5h%fvwjd!ncmAqTPD1<FXr-mU;yQx6b3*
zmZ}>eLX;1Ll$kT%iF`-jTT?*VI}hc?f*#02#o0)!8yjf_?9#dncvGYqaLY+*dLhvQ
zRcRefy6<RZSY=OYOXfSdZ)tIT&b$Lm8tk+V?cy!yP{u&p1yUrMK;EGQH8H4aTi=tO
z*9QtZ1lv?iO_T6VT_T$#<Yt;CnXa(WWhRwe_-nLhiu821l3y&vT&gll?lfU+#?k1p
zb=9IJnJQcWw(29bxI+WfI;n8W*7u>dXOr@YmNK?MN1N1J$teZT<VduRH`bPt8>fjF
z4MIUB8HFWI;yXw9%tJx#8zkXP(p$KVIfWn`Th&8Z!k?sm^n_IVjLMr5o3^N$J9K$0
ziTaevoFiGl9y5PZl_r-JuDh5<cgmYy$M1mp5h)QmDc|`lS%~mQ-JKIh-Bq)wm>t4_
zERu$87rJ#n*BGYm?Oijk=4y`1S3+qLVyMEos-#c|I-Vd|C;wW&(h%qrX`(BJcM9gx
zZ-1sr$3w(jLFR)*NmwZ3ebP$%BWX;hvMZ?lJsq2yr0+_<t(jsbMwF=3By4udNr5$j
ziKZ}y4vK0XKPvB9Xi`VlXzkMa+e!J><#Qw1QdrU&O_Ic<;d6<?p<wkDs^XWGCu&4V
zS1^I8CEipaU$-K1QiG@m=BFhQmq>=R4ui5T#r9;JYo{QkbN4Dpe6Z8JiC`G9s`vnc
zmP%TNTaF4qRU_)SY*wLcp_Nxli`UXPmoB)m$aNVfj@2NAg0&P^MF#6|p>z@0J{8X*
zxeVgz52$PIU3j<Z>D(j~jGzaAO#z}(Rd588fE7E%{>}}&6#De_CwVkoq2hyLF&&2`
zqUXNrr)W)iUghzG^ujHrz7kYdA!66T+Bi_9_zHmr`Yprw{Q0fSpZb#fNi+B9O;$;2
zJ4sqt2(o@se~N_ghip1Fi2ibx!9paX?+~i!*R7W^l9q-|6zNs)SWgYUjKtFf(kj3k
z4|ehnCQCCOo6;zJxon}8WH^`%<AsW2d-!pw(ghtNx&H~RrXcOp+9U^vD7lLeO%jUk
z(obP3#tRGG=#->%=~R%+zYv73gQTHXHLnvE0;WCZKw|j)55!Pq;wq5`1IASGs7?Y}
zu1WHnRC!pEJ}ddLb(aMaYW89M*#-p;Bun>wCo(%FFi@SWbd(hRR8tZ>H)(B)DzVX_
z9;9c!po5VD$!&HCHqi~*l5r2}@X;GKALy1gG^_0{<ex_TBxQZ#tnG&m+nXDu`DY23
zo`T$@iJyzg1r*Z_lGSW7s_Hv0(1|U;>k}hCHdVMrQ||{uEhY=ake1l%T1MJ*m)EXX
z=!o(M?OHz8@pLiwb!QD%A%Ur6%^<ocsDVKFhVP3a2>sM&{5tuv{@GuW$~H+{aabp-
zONUI4+@*hL04dvC^*JD{eG-x?4aV4LXjtycA;Zrr&_GU$ON^~9wYOCk*X!^Vc;hcW
zg3pjNNxjMr^16c1p=9+71syF9NSyY`tq<NGl}Ir`(-jRLo8aiC(WJWF<Ej{UCITwS
z%N`1teX{knlZ-J%1oBKk;Dx}%77JKXI7$QM3R2Z;vM5XD#w16=siX^kE~rFXES@Hn
zeI?*E;H0GkETZP~O2tWntpe2|G`RzztIAZg|N6vY=?R|s1P>%1IzxrS7(ajiNfbOY
z7VzYJTnj-8q^g*zKehUHz7|)|q03*TM(w0a)LS^6``Y>=o&V&quUYT<y|7tbsOe+m
zKpDYRes>;*#-@Y^yHj<Gl!M%-iYz4OeGNV$t$E&~)im?~K}aW0@~LJ;7m^#QAZRe4
zNsW#CF=N(}e|*F$Nl^Nv!Dr=)Tett}XcDx9QczXFwuj}_Z#MxysMtRpFTY0>@mPi;
zQ{*Q>t+6z=&)RZ~Zs6J(emKR%4J^3%Uf$3}EU*iW24RpbcnTrrTe23V3-##sIZ>!a
z(cfDS{}u|SK(`?}RRg?DAk|zVy)agoMiF`Z2Y-F*(GhHPJoULxN^)b91&qYAfKB9D
zPrR0dFC!wG@SP1!wUD^v(~49cs21a~#UK%xqL(80{2|r2Q1o*JlEE*urOalF0q|N&
zk_@>HuXj#uu%q(Ye)8i7tzZkjQzj{6L!p&NEsbv`VWsm1PBAiXE{na1$<|^!tiw{j
zzDLeM>fldvGQ)HK#IToH9J;BYN*7yB$BCca#tWTg9F8|bk;E4uA;T_mHY54hihQX*
zUVWO}lmOk*N|B2pdbcD=u(}FtLyAT<&D&y)Z97Fax(sMBcelIle$rwzd}f2P#mLwa
zS!1({E`&>k#%RKhnJf0B2)|OE3ilm+7WKh4<l${iHb_MP=*neXKARA(Z3uIlD!5Hj
zGHj~iNqJX#iTEkD#*4vYxTg3sR`X2*Y^<&B47h%_x3#oxbk7X;I0?V>!U8ti*!Y4w
zlw=W_r0BN4U1woAC_4Y-II-1&er<upYYEX}`>dE`SlK_H_3;BpdqwLg01+oL==rf$
zV?XgMNXBS%jcbZ=?hTULdD0*?@}fi5c9+d?s|DkxhTJe}nkwO)q_oi0bvPL>Bqp)}
z`L*8q%L^-ZJ?V-^JSlYV+D+X<Cj>Vasp1-)@`}!{?7Lpc$`t&C>`*US6bz$x2w6S4
zRQE0(Acb~F_x|5&D)+4<6F&veoczFd+hmlX5_&U8g`P_=CGYEjzG?87SmQ0hi}n32
zb~kj`BJ9sOoQ8iBt-qjG!1|Cb9osdj0T<KT`&mDn?9bn7u~)abt&30|ytH}0U8jV&
zKf;^1nKBqe=(%@C93AK_l*YVe@mNhLc-a|OG*J;%YUi@ndF7?SZTGAE!=w@ZczIm7
z%WQ4$q|6MiMSEEOj>St#4!J2)Q~{l`yAvkhegASBJrz0n+ED-dwXoX;VR7<**F_U|
zQ)m?~N;fQAG<qKV3hYYZ8|_LLJ&+)E@$B5dtpgYKc9iN&EP0il)K@=k%O8&Q`*QT%
z)9167<ArOvq%Xz(T7389@<rq;v%k*kF9v&SFJ8L;bA40lO03~7PGI%vMcQ|p%<$sH
zz<W>SKd4CY8|nrTXTLmRzQ|t*ek6naJiMv|(Us4A!RdLwQfc|V-9v&)N?(Mmus1QX
zW<MdQXsulA^mXm7{MDyx)>+9*d42NPrUI{I{><FxcXPOAb5&!kW95L_lS)gw(>weD
znHni{T5cF{QNHlZ`yi@z;=;xMJl3x!rz)MwbWgQR2JoC38+e#cYQkvUb-dcycaww=
z@44rXeWj{!!On<rHJ<kLLB0j;punhu{<#{Af$8fpfy3`w1CD%&2F)UIVoFzeB`brH
zuDjg2tupTJ=Xr)x?n(^3-{aD*@FY1^`uDLTrr&xcpZ)$;0zVatd2E*zWC9kIbII$4
zPB<`!I9smRrplZO#XqP^zhd}V@)SO9j)Pq{HUs1Dn<SbUZ25MHCUjs@#gsQemACg#
z+nx&)SJ27e;<2ysmS<uR!`-kQ+MR;W85#jK_aZk40{2d7oqu#MTybx*HF`wxp9p*E
z)*NqOFsM|a_{9)b(C~x&jYE|k74Y`Z1)8W@Dq2)wrR_A~x!NhCWFc(zMZOoQ+VVdn
z6vKzDGEYwtd;}_RpL@w!b|?DpVZg5;3d)wDx0YL`6C_t!=kDHKdA6J|blWc-0>v@{
z9yAD4RC8F$z1X0&l$Yr0NR<A-b^e9jaHmQ<b7PC)qPL>oos>?Ts!vI`X-9l`<hC<>
zdB)K}D{lF@XQK4)N&kCye!mZ^6_Zu3Qw<l9TpeB#&I<Z{`KI`)vt^3weQg=p{bbY|
z+sLdD=cL9<Qh&J4zVfvHA)&F6-VI}iLJ`|yzDGW6kCgw-wUlLPq<D{z1&jWLaepbj
zzw_(Uz5Tu2{d;bAajB83!;p)4C5j#Vh_KM86xQEvXv0Mr>l8A$|L6>dT0!@(mR0z8
zT|nHzH!jI69L?goji?(y5`QKqSU8z-$+{!?+gJ&QVg)g*vWvD0Op;{xP&5LYkV!Hu
z%j)n|-z@+QC!`c9`(#*Jf}CB=%W|r{X|(?(!a5sGGCg8#wW(@@#Su*&mg0Mq)Sr~K
zu%%oD>o0CLiDQvhE-*@Emiu~*KIchCFDamR#rlX_RPjOf|Gymf#Xf7DvpESuWzw=w
zdo4B3=G-XrQ<O8ZJske?T2$K?#r?il4ut~OFIxJmlEnL*Lj<lp%2HB4da>W>s!r~b
zt)gzkMO&L1otuxBl(3$UY`wti1ua$O*n>uc=AC(&zw0{1Mn`kP#I(=<U6s(Ao&cTU
z?3Bf>25`Bta`0J=kcX>W##B}guK1exSA3w@4nH*d?yS%P^r7L46GKr~j@(%~`Sn1T
zkz?Y0-QwBMuO_|XZ!S)(-~B7~)toQHF$FPpd$}lxupR77@o9qaq&_t5J$N|oir~Gi
zFBl`U@2^t=gi3{$7c4yCE_nvm%RcG_TORE{oIj#>$3Plmc4_}TDABg*!GbBqk)z+~
z%w4KD((KWJoJyDS7S{(BFM^KPs2#l<KK9W5P$lv5GnZ0%{fgrpm84hS#}N4O$Fo)6
zt;f}lhlleEHnlFETAY6^+yRm{b)%CnQV_Ph=j(FuTt3I~9MK&~_0>U~z94&!9)sCB
z8b=kG`?On+nn=B=EyUOd1(AV*rCnL{5b5po@tWU)Ntc#`AZzY2U+#;yScOT1e&BuE
zF4A1-uVI|P<MFQMd{enuScumL_YXZ2EltfD;pZ|DAKNFMj0<Zbi?-bthVq*p@P$XE
zZ%@r;h)6eI(m0oNditZtg{L2uYa&Y}Kd!a6w0$)D5r5{k$Np;Nh340NR_AJ;zu&15
zX>JLtKKo-}8nVuM-goFn^lm2kkB?|O-~5@BVUPEmq7%(Dj<6uJOt)7$6ZN@Pp}Ovb
zcVjv&3@QiKmnY7x@~3dG(S&w)TRK8^U#yQH@{=9v;HMxf{_5bdpI2{9`Kefl_dDnR
zy#DB<zq*(Bz=?^o*Uq%f$`GlAr$lsL6%1!++!KEtd~Ch&-BiGVm*PW_`MSo>Oat~_
zb;0NB*6(T^n>X4QXC@^q8QP=L&KjPmn^?x{rkuQjF#O#cfsU3y9GV;9JkOE*PlV;0
zGhP=@%wFKAIC!W^=7Pldqq_}dUBG3rXng&lcEW?vx&>>CeTly2aDAjPDoxExf<M9O
zS6%vxU^Qmr*gp~0<Lq}I3(5ER{Af+)a0Vi}<h>~yW))iej;<;er~QLj@yjRF3y0Ox
zNJdh8!Ln})-_NmORz&p*=_?Vg4g)t2&s-MMJ0`in<n-&ROBO3LfbCuZ`T3IPlNL?5
zxpRIqR9E~0{#5WfPr2%J#z*EzzIrDtYV=U)4yPg8Wu?JFc~RPK(a|N41I0vLyIiOR
zYip`mB!cTI5M|qB@>ZI4K-id^b#is;Ynf+~Y@g?qsGoSaoE4Y6%%KhH*EWc0>&4DT
zjvSA3q?Ww*wUO`tM*cEQ=FXf9cr@XidcHt<W#0<^bn@F?z`?jisH<U<0h*91kiwcH
z{;AjAA-_rSeIed#@V7K+&o^efV1e$`R`w_&+FMeAWm<fJY*L(!zD}8zYc;Osc$q9&
ztN`24<a)aJaVsd%cx6yLZ6RSC7Q~SGv&>C>?)fQB&;FV44Qm@CH>YI1V$)R+GHu~j
zLd?hk>OwC9A}_HYPQTUynWH6$JvbBQ&7~kVC-$dg`4L|j^4>3+%JMh;H{lc8GJAK@
zF0JJGrXLuhx{g$)CN6wR%m4}Gem)E|hQ6m%i4)aCkD<58nk@4Y$PRl)kY`N_$A?(_
z8u5B9mJhKM+=O9*2k0#H%%^_B+Z{A?-|<J0$e9gh*e+)_{Aw`-5e@`K49&mUr&0Mj
zyrp{R0^~kfJCGC>B$ZVry0OHWv#L}8;?H2ObU&&KLc#A<0ZCOnL^L!;LsTqc(`kr>
z*BXwlks{;Dno72WUe`WDvpR955~w*JbW4*K)MrQxis0m1VYM?Sd{`T%TF~}GoTVt#
z_#kIqgyuwFbPt_tA1xa_lO4;Ds-oDyhW9IKxWxwqzG|X$^IrAU^%)NL^~<q}c!j7~
zp~O(3q$;7DL8MyFyrQF^*IIueolnu(2&Jun^_B_ohNUx5=P!%wYE|y^^SKeEGKR%+
zoTYI5A~&4{qvQ}K?Bn;z6o1IyU!}o0_DwXM{UmZoDJw}Dmk8EjBzx<P9PPMh{Nkha
zVmI<6K12e|?4ndT;pse??4^>vJVPIEQdWvc7D{$@rA&$-&7~u5Qv6=|%5)Q5EGubR
zVnj|>KwiN`UgfI1x`2@Ah`g?g!hsQa;j3~+0*WLT1v3{#`w>M20foaO@<|TtBnd^8
zvy+80D^hZ$yx(NcqzY64x5IVbEd_Hh^U$NtT#O{;M;(J1*~2j!Wf?y)=^CoK8LIb|
zRd4<rF4R#r`tb;z#8vfE?P4|b{t%{IK>d@Q`cs$j2WK&v1kixv;8uy?&sxJRZ$BnU
z*1+1#k`DVqQQ3dJQkFcT6+BYw!#A#zDU|_&XCz^I(?7Uo<M;%%L5&a*-EoO^oS-gF
zJgN@fsMAg0+R6B1oUM}y(ou@S>5gh=*6S*)>l$h3Wjkxc9UAN?;msn8W<q%HQ$m@(
z&J(jTbsey1P%o>*<YR!$B$<}XkJ&wowrbSP25k+V9YPbduN{#pXk54(HCi@WTQO>U
zM;EJq$VB0qiFAoky`bqsLGkLSVYe*(;Zglp>&7pSFgw>(Mg`5^3L2M=n&ssQx24~V
zt`f?^<KJE}q{$s9A<51Qn3d6CeSx*C67{|gOZNbo1%OwCu9;|C1a&dG(I`gK{w|?z
z@vcgEf8&bsISOffjnpk?Ij1{h*CgerXEhpW<q>W9me<<<I{LJ${u$TTXPY2SdKhUs
zpPSxd{D#dVmQ=K>6`{#ypVv0^Iy!yK_K5(~F8Uxf+Ilokc|f%{UQVO{kMEu}<ZV)l
z_eO=#HEZbtA_U<bZ?PKs+3+M;ES+7F$G=e`D`F+l-s8A7rg_PmU#5gVlO&i$#{9P9
zJ3AYu402A!+&flGQfU^;l+!l>4mJ<=7*m8ZK-wl_F1@Np8bgnm{5oQ`;bJ2^U^jk5
zMgRX|?>>W?`rCfdC!wW55_%^T=_p-#@4ZV?se&{?ic|@`LqJ4&Zz@uxBVy=X0YQ+W
z0R#k*j?#n^@Bj1M&vVY4eP+*`Is3fX@A7hGvSww?@A_WfkJ(#o^SWenLv!gRB@qVl
z_xEVbOeNm?`I~so)OjC|hf46O(xCjt=#q=!rFgj!@tarvCGc`Wasp`J!b>}XV<S{)
z)0R-Nva@9#(;i@~>z0w#PkC|Xwtq^fMsRe35x<hl*zPq_{d%E)0c4ddq0}p9lLT5T
zRKka**%%wxex-%?CCKp2+{k&tjCNn2PM&P?B}t^V7kDa1*U}JuJjQB4&y(fgk8@y>
z92b`qy%yj=lVvXwFsdf$Al)J}>`U^#WY>Xa#4O8+Z^r4yCwp>tN9io-yOQ^2lkcHg
zbbXWALQNSh*j1By^+Y1cNtNluyQN0)v=_>fjsAQC_6%L-%5D+HI^DL-pV-=HJ!1E0
zzsyKYE9)&&CQCZ7W7(MjKx+Uy<GhmY^;ouS9NSfKDJ>4oi7^5n$FX!KIP=g#<*1xr
z)u??OHfi<qhTW1tw2n~zrlx)5oj&Q~V=>D0?4iIc{S7*&Mm^t(Okb2KFzske<(ZH4
zCtvnwBSz1B1<aXsW_4P}{B=Jm`UombYAD0RZ<;&%9`u9z92x3oC_S8&dMZ8o*WJ^9
zqXvKv!Y4dZR%xAF*_K^NgYmkOC1iTvAbSzi^v4cOc4h<Yv<JBBH0h}0xGlF|{!tk;
zCXLM2%J))g`Um*@rGJOL<$Ju*I<z&Lx6}IY@aFlq-y;`<IDMcuNnkjv%@5HQ_L0hx
zJR|(PH3F6GNRy30wMMd?5bmZ(L`KBVXTDdmRG)WVu=Zstr8wUI10>9d_($vrCTq;=
znZOS;oEg8#p8bwJq=rlrCR^y>lvPABUTIec;h=tFrx|ThN$miHTaeND8;5@xj+AaQ
zK|Psebf1~%rtgG6YqB*OEG1gol4S8o-EC3*mPr-x`jM05$&<u>_M}^l!}D`V%O~<A
zCiS+{!%i7VnzU&zO;a|rhqvdFiQ1iyE!8T<(%u9*-+jido1MoBjL(UpclvIUxWY@@
z&E^*YSp-8|r8tj(K|IPH3hiuKr?L9&RGH0GdREd0-8bFobNPWt!Y~P|jM!FUzOl}V
zD`xFPF^2>N^d(rJ7#Mb`7SB$0uF5gI>8JEhbNo~ExZe)vyv&ZO$jNzinp4tF-`qa@
zqMfMrb6(26Nm2bU<!>y4Hmy5nxGyJvG)HU@Qjnup@GiT+s)gQit9CjLl1n2G=DII^
zjcu#UHfJ?19UbEy#1j(DcAZ52Xfiz6s<7RRtQgN+j!8Rzl>fe=G$mb5#JWs#X1;T{
zOfi@DhD_Pb+#wwqtwV+!)!+*4jxu}3bos#i4?qfV&`^)Bn1FSqruDGxS-B!(RfSSj
zko8dLS@zvWMQ=0n4shTx8foI`zug;+)-PLgUp90|@4bcx+}t_nW*M2U`M~&Uw1WzV
zH}=u<HnwJ=p{kGHuD6b0xU#@kEzi@hbqsBt)gD^c!9+zjI;w8rYWF*yFXz^6&evbb
z5d2qjc`?P8K@a^gVaLG@u=9E#Qw8U_c3kpnq2t%mfymZ)<p!mixU!eG@|tZHUKB({
zTdW2A0y1h4;s^}f9LCbc&G6ub)^Mh_Q2?AVGwZGjOX?e6>?$kvO|bpOE249GSzi)b
zsVN!84s&XSD%q&8?VZS@j{D+op69)Jb^b<Hs<Sm@La(FqiL`_mVJ7|{UqiP3mFb&T
zuiwNye5>5?c5?Y`!uz~$3yHcmN%tC!JO^3&GOt`USs5e1@k(`ioYxbh^hKR1WlGxb
zuCT_RAhLQWB`*-vPRv(x0NA?313DmV0?i5+Hy5`LD16hY{)C<^35qXfpfJ)sTu^ZA
zY;av1P^TNTu^4pe9MEUXTV@<^d^8w$F%Z5ev4lenDGw|c(=47e)SVBN*$#(Y49cGj
zmxYeJZ5tt4tS-JE+~6Oc@ifkhj4BJzD#p>1q}rN5xGyf`3+XsVifL1s6q}Ujc7U;e
zA}DkSHmkjpLqxyxVE^HQ@ZfOH5_*hg$!E}tnYm!tTzrb@&*W^#WP8q(K!L`M<D{g;
zksD!CVz)mkzs(!9!o_J39*~}g8^~k~g$Iw-UN@B<5yL$Gws0hMaHaAuWy(Sfyj~SG
zkGUqwF*^)EUR@}o`o0+mud!|~vW)<)Z$vyGlH{oeNZsz4upzuZzjbbAUL3bs9DM7j
zetUA5YUyyn*|TFR$9HM=&608OObqx&l2rJSecLUbfU^?B8IJRNB%QSqN=aEjtDE#&
zv;nm;m@tB*=VYY6bcKEqG6NvD@#+~|^ERb$@ou^i$NPgon<vdw87&K_KMUix*KQTA
z*?d{M%esEI^-F{+YoB=gIT<r?ljPk&YT**8=weO|X7CFPweS}<lWt<_<)335tABvs
z|FHLjU<_K6uVbB7#Yzc(_3pAkNZU5PixQ^j5KjYz0807w53D~w-uXFO__I53J=_(Q
ztkiPOqjc46SG;*oB}tXIo`|6dl%lm9A_8J~p+t<eq|bf4`=?|VRfeVq%~ur6i>a_A
ziy2d}bDl&{Sj21>$gVAXIaFjjQoVa*b@?-7sAw}k{5uXTb?Q~z4Lx`)g|VZWvL|hd
zgyVX0FG{=w*jEvXoP=7xrPBSEms+)#?`I^T#VZJpHPzQMWQ0HBvByVMMQ1O+p4Gj3
zsLO^iEBXp_Wi7>l=YzfKBVeC^(w{g4T1o}FI0OeANQ>75t<gfCN`>gzwi3Q-C5O+y
z>X7qdhXO$QIUyI>uJ)=fh3{e-#Dzk^BBgx^)B@I>@#zk66e}|SA;NO$=E^0AR$Prd
z6}0IHg@{#-<%qk_cP5Bcy?@3ec6I>~ubwEm%wm|FN~<P_uo0AEJzRG_J~v}qVd^kk
zF^@msuN>9U(K0Xnja`)06)AcX_h)*^W@y)gFV69Y#ZsGC-Iuqa=VyOlQuX-mXvbeo
zNpl-=k_l{)BBC`7--cmq4EB1`hg}NmqK5hG--ePr3kB94qZq}E?ml;X`dA3{VEMm9
zSUFi-mRuS|w)z?6Y{!MHwDDu-<V+I<+9G<>i9Z#vTk>xLDqaVLTu~@=p6q{fVf&)s
zZ}P40w3L1`R^f4<kJcB{YoD~G#ZNEJM|bbs!GI{V>>@~40t&-bo?bO%DfWIhxy7S#
zQBoY*!2HzEbjfu;mbVVLsvpCVYRQNpEBr@<EtP^~1R5(}CO7H{bu5~g%N<LA9sPso
zMTS)R`AA|_Dsnh9ZpmLC<}&4O0sl*ct+;bTl5bLZHuK@Ql%KwTJnF6kWI^7Nz66${
zlhZyS)o=ou4E7JopvejNVm0~1d}r9D=<z|&wL-+^YrUJzMkJ{yV<%qM`%_BCaqeoj
z591W}Pf9<a$+JKjegzWH7sbJs+HTJ)3mNYerwlkI@S0S(M3<MC41D0wpx=)-*%IE5
zGdnaoL9&>?>Ln3sWKCMDuD(9%(fEG7!mUih!aOcxi2F)1?OH3xteHYwCyj@B*!CmO
zb}s&NkB+U{(ORv^>z@;9VB?O&ZDtY<HSG!QRNPdiLMmh|OPQh{ge{pzrY+8{*PuIo
z{uN=vyA~WfDQ8USBp(Uq&q;;r$v%xUeQGi^z+A*!)Js`6_HdNPB;S^&PZ0DTZIZ${
z!k)Faig+3Bmtn~Ba{7QwMBU0^ShdeqwQ2IwuThH!?U+eD!t>0bj~Z$-?*EYg4Lo4Z
zVVCsq0hJqYfUTpADu#QOK0Pg`0%JNVU!dj_e_eyXu^J<m3VwfCRTI(U>j_8+R6mo;
za$iYx`E@*J-%H?F9g~T**Yx9~fy7kaL>VMV%PVxy=FZsw8|BW0kFFp&%WLFfNA<cP
zPmo|=w8{nj{_mfc->&O0bTHp^()by_-xhjmD@L=RfzA&-@>lng8Px{>FbK|+2ze+6
z1b_kfgl0lcKxS!ON!6npyKG(q2c*%bxZ9)4Fsp4t>W;(5@5;{<Gstd(vBnC^Ju>B0
z1zr<gd=JDxhlHUsj}KSa%$qyETF4Z3V~9fm=mJd*%-cibdOznV{qrv_3EJOQH4o|I
zP+7}}!ezs7k#Bc@Ufik|-Sc2JKZFPl(R4p|>ZJ@1G!SI{p1J{Vh`($b6sG@{THaSi
zC4Q(Wl;soe!@Lqf+ipaCho(>XGCG*k<LVhnGf#$y(_RR>lZIwnw=ycr*yCF0IOH}N
zg`jW=tu-J{(F;W)80r&y-W%x--bCoy0bw5KVnWv^@-~K3)X+Bmnht7M+Zsi#2hNr`
z0mhmjqaYV2QH1x_XmuO~r~TA2=iU1#(f7u;UHZ@fad3u|mjUzR_*KEpHiaV(_v}8w
zN|Ce#J*Klh)?b)w#yBNH6gHOrte9QAq8&-1@QqQcE#`WY65rjv6(k;DkvwM?Z7$<m
z083xHQD8nQUh5OJOavg7i3D!P>=xL)EOW_#OklXhc<XV*vQZgnmaaf@xsU1$ZYZvB
zF254FAEb<|qHrOw5#5&eU7;(tWs&~;O=&X!O4-x)n!s4KlvXE4ux~e<Vuz|i@Q??z
zW*?Jr_KnqjQ<IvtnuJR@t?F`*?{EbbQ*N0EaZk{cmxG%4I+QcDMwS?`1)1dL>QtcZ
z`K~K+m;%1xp&)uCaC3)f9tW0IzLQ^l8W<~D{*%3dw^s$vf6Mn$87n+ZLc20gULAYH
z(~5znEke6%N{<a~|HR+=><ZlD`v+sa*D)9OoTlLib+t=61GQ&FNnn0Tp@Z0H)j;sK
zhNDFsaSvG+v#mvH_3hbv6`BQ8I^P;QuT>g-7iM45*==gB$Z(VGnYSfitUmFM0{3ie
z1C}I%S1D`NarRer-xgJ28bfLRESihoH8$H;w60q|gK2I{C^1jaJm{#*le42=c|*fU
zMuk?r+ZQwYR*<7ENFLNh9`8tmU$6~1T@XA`sAc;!awEL3C)!79&h1>?J5f*yNbPFb
z`%K`*3A)~%{K0kH3O+VL_MsiDOsAX5%g0pBCv&@_&6dVuKSHqDFf15bAwBR#UK^f4
zz0hVR7_cbADB^f}5n-cUxlbGy`r-$~Zp4ffK#GOg@EZn!R)hfn1!M-P9>Yi#|LfJP
z`etrb7axu6=-fJUN72!s_u(SGD~!Oto2r8>zhepunP^;OV8MhZ?qLyvC0+A#mCT9q
zkqJouyVjNN{IysETN{=?j5iE^N-%99E8{?$+DXCFT+jVx<$y_sJUn{v7=v^(p-iJE
z!Jir>C1yJ#<SgICvbk!xP_g7NNNzInzOHO;xaR3zE3q=wOPU(;rBD5X(TK^c6o-Z*
z`|>@-^0~ns$$}@ZelnQOfJ>ssYlCCT4EiVNe%BYZwEz4Wh+tT>(A8+;`<NDJ$=x>6
zKFF@sfwjhe|FW0W+I_0~ATwdv^tVB>0(J09UNasxyXtvSi*AqGbQgH$I?o<MQkbE5
zzG(0FW|>UYI7{ODsNcA}-JZAmsiU?p**54ERE}~b_Z;SKk5DKA6b`aKgnoZl6O^RQ
z9?4(saP`eBy+JLXmAbms^1E7{3`xrSdjIlyvAt~I$As6N@tE%W)C}i_Jrt<MmpNM&
z4`d-x&uu~lOT-(|y{cK4*Z}nE51L7Cwem|O&aiJcVpeQnDfQ%W&+XPnLyb-V_Jlg#
z9#X{TSVq9)o;$Nc(j_47MwSRzN*a~uscaopo82$;qW8#Ch4II(h=Fdh<Izt1%9c<!
z=eY0V`}$Nn%T$Qa1p5N}TM-($DAhz-EIXgWbGh~2Fa-DF3awsS+>KIPthKN*OEbQl
zXV)i1)X9;(Qmul&`^IGq=I-Iy>M>hZL@Z-a5rr4z>LiahY-@r1LGY^8{cyHWAn)y@
z!7HmT6R<B>)B4F!SOfWoDo-`l$IW<{HI_Zxn>V@@>ERt7jyCv4EXW8(&Ekmn8sL`o
z$RL0!{dWY~RUPLL(Gn$_S7{31#YlV?>}?e;R3dJ-V62+}<>3)dXoM%4coOMViWN_o
zhIG~I+;cHTbw@@XNBrJEY#~VuOrc5j$o=2qbR;Oj_~@)@Nc>T_;k_uAHcP4OsIX$@
zuX|8EG74*N+OWRpOFV35R!n;hp-LIEx@R2KAGvT%pwEc(4B(g^VW#sm;x}EKFPOq<
z$Vxmu_KB1TakUM6@X@;lupW-MeifEzLTcM|%h=A`11E5aj$sH)jA<6?Extm0ZvrQw
z`N}L4tG*-h<`Ql;A;ryNGruQYl*bCSAQ)UwdrC9~SkL-$glbRp<?l!3{nWTmY7=18
zsFeS`lcdkt3f<Xq%Sw!9%A_~!K(xy#NFah^!cGSmUO#Q~^Ly&gYMYGel*2ZT#S^K-
zVlqc|#HuCggdVloMjeN~p?s7|avxhflXO&#&2UUh_(&0;M7oKkxWpg=_Q;)#NN!DH
z?oN=N3&T3=A?Cs`m@?F+p5(!I#5own^f?{DkWM8H^PC_>Hb4xK>6d%y?9v(Z_S|t#
z6H>X;V0@WGQ`mS_QZZp7O>bhpzYJ^W>?9}v2jehG=dLHwYP~|dw*w7f;63$7{&wUt
z@~LS8LNg~*mw}=Y4MK>(#Drl1N<jg3Pc3s$U3f3W1XsZcV83u?7@tW01W*uj|MKK1
zhh21@QMye%((FE&?k0j8fLKO@-1buVhSM(X$PzaZW}ArUcI0_|7R;DLi9oT|lc%&J
zv71yu!rp-iuF4a@8vL`y&(~`vfXc$z0eeWhcBG0DlzKQjgK$+76rUzZx$Pchog%v+
z`L{~I9jD0RQ>1+T6G<E_0G(f9mCt}eSYkwKgIw!3Nt?6_H&;kmFyL$rs39I<)tz@a
zLF$G<Xre)Tn1bHV6wAfw9QeX#3`K`lMVIwgg+B>r9h-=ZdXhi&<OGfN_wxcpU<Cfu
zrD_6bWK>8uA}BKftis$sup<&H2JP(?ej;eB^$;;6c`&wsJr^prSMq^}@PmWIv`e`Y
zOZiSq*yjsH`STAZh`8-aFN;fi?<XsElREK~=nqh^)Pv}^$}3GW(>M`*a|nME6aa!U
z=SP_aSM-6YS1}}0+2ul{d9-KcE*(4@45W@w&WZ^s4;jZXTzP0hr9a~}rf#^m4o69K
zl^884jayYj2M1$EWf(ul5`gr*YxPlcIg4;%B=kAS3Ye*zB8i_P3x7LH=kCJ}P%83y
zku__}XJF8a=g?AwH8#0|-!{Jf3Y7+ZQ8&W0(O&Yxn*E2?%TN6;Sc-{WLtehMX6i34
zX$*b|<-qpx+ddpAH^RN_8mS34h8xwR%G_$8Q%^oxTW@1u4sU^LaIcoOUVVkuF7wx}
z>eQ~e)ovu#Zoa7fF;e?;t9BP!x6fa9s8e_BR`)xx?qCa?iYFC7zKU^sb!q<$81l*<
zkT;oF4|!P+8?7h*QICK%padGIbQ@^g8|ac67+y9ojW)3SXkdfAW*2zP`35D3Bz>w=
z5ADh23wc##SFa3c6cK0?(`}SsYGmpr`VSFyl!(c`QCXl#)xA;bN2BIwqmpiu?r4*k
zdy^KdS!bciRG^8_|KF@7&}{ay`Q`%fR!Fnen`V0^V)h9jyEoCDg+`Hj)HQUAy>83B
zq!ziCEiAYeQzlY-47hycHFT=rYkMp4EN~n{5vAJ}<K7m#03~ln#SuhU_q3#iwshUL
zZg6{sK)X~MD$>0@C9f?@i(z}ON}#wsPqwWfDX$*bp(oQ(?%ok@a~-wSF<<$tRJS7@
z)-+?>-fYvBwgBu1Y0G44>#}JpfH5_`>1bZ)7)kGF8trJ!V;&9ZOwa3VND|bvrg27B
z>b<6)PU<LOdYd8pcBBF2jqZ#(Z!FYhXcy@0cI_lUusOiDUFTizQ17y2-_;qv!~f`9
z3=y=;eXG2G1%96SLZ6bkS2^V(kN(vC-8qb9NT;hSq$~KGiGa#}_wM@e<L$vHuA&5Y
z7LvCx+1+y9{TbEM`=%QV=l7DK>D{Y*RLaUb*3Hm~<E&w!sCk33Ws!t;2fpYO?QH-3
zgW;NBPZg|3L9XvRd!G`#H?XHl&mQ8vf}Z2%>OjIo=h)yYh{HYO%Uhn4Eq(gzeH9@+
z(t6!_Nxh#-ddouw<ZC(<<pxgN`{G{qd5m>(>-DNH4rpHV4@Ooe%20a%C{}TZ?Eoo4
zrQj^~ISmKrsyF!#8fx*>E5w#Y`(nUp5r|-JcTXO0_Gr)58~m!<=F8k0BslogmIW#}
zLa%o<@*O*pvB;G@LY-tpn!(|Xw1?~|b67j5dkAw~lKRzlQnN3P45tso{TR**9WEH_
z4YVB$9vhpK9eXj>Il1^YNN*gc$5ACip`cAoH>+Av55Hs0u6u%{=6OH2O;znNA~7}`
z6Ee1)KbCU-eu91Mhu%Al(DC0j9jEZYbB_<-$GG-fAd$~dLXW_$jo>8=iA*n70~#77
zOriVaA&O*z5a7CiGxd9Pk1nz?dUi3hux*77vWHDx)v!EgdZlK|&g(fvqtEf%2<9S+
z(=DOUl3`fIjQXQs#6PDLfp6*mFx{8?@V#VGRlnz&{M5nzN1?E(@Z4!=<P`tX$H3An
z3Y@d~fe&J}c*bUY#`ZR85cZ?#IGf;~X&Q%K4gKl-<WHJEKRD}8fdyu`Kpm0oT)sk|
z8dc!8<Z1eb5F2n*O*&(Q(42=ix3l*{h7yW|usJ0kMB@0zM?Vq9Dc6P=Ur`EjxR6g7
z{hZd*|6sr}D;!AxnCG!98h5!+X~iU$qO?EneWdk4P#us_tEe@Qv#l!4eUYF@!jQNk
z5q-!7J7Ml}eN=!xcc$lOPL<C&Z>I`x&)O@^_K+_*+RqzS&6_W`%9<}-?inSFi!u5m
zoRJKE80{T=GC69AR%HH(&?|k1#nPXP`Was~guWu##l#)O!jH((_V~5^z*^`l8Y51L
zt!GQ~PnY!b`?uC%+EFA(O4PdiS8|@JL7`cM!E)e3$@^unJ^<<H1SDXlAPXJ2FDw<~
zD>eCyh5HieTny;~@N_M42OK99C|Oh7S(flxy{W+QqF1I?3=F0sSv7*<4%EBF<TQ+!
zc_~=5YL}9XpdU(LD3Z$0T(>@|tV(&U-AY}1=cCzR_m)s$Ifdj4p{D^f88eiABc?!+
z)>33gs3W=&e%R<sqctmo4S%l<(}p$vo1A(R2<az?C_Cc)JvG@(YL`nU9WVSTr#<bQ
zSQeM)L)OKN#aVy*{!{0aeV<M0^i9?MIh_(jBDsbl3XvFwo9Ui?{Pt=-m4*7Ecy2Lt
z<9ovzp%m8`LmXF1;Od~2ue6e#)-^CBK99eXbP0Kbv_Q&8(g>s(>*n3$d7}5!M^l>%
zljM_M=vyaxXd}dvX;Gi=pcV^Jt~d2lj3XO_pl8U1hTF_tgtjO^|0tHs(py&flB|4)
z?ISsA{E{)(h_pc;zDB*E?TZLGCVPMq|Ir11c}V7AcdPCT=kE!Ni6O+}(3N`;v{WUu
z9?P`e>~y1-{ju+<XZ1OPF#0q0KNU(4lvj)zcT#w-kUUpZ{8~R%8sO_k^LXr>JeB<~
z8p3HT@hlGU{Os{D>sG|Zc18*0^=o+SD+-f+a9S}!e;4s$?~3eH81YM#0`_6=dH~~d
zc52KxDG}eW4h3E#QcR{7afV4w6W;5*C9X-e;jt?|YX{LwrAPcG6#S0oBzgv<{U-F?
zdU(Tj?6|rnR<lfC6-ZcbaZEg+3K&P)-h+4{47Q*lbf}VLVG(~Y;+zlS2o=FyI7Hj*
zQN?4_*?<gXOtRkNgB?5Kh5XaJcgR^`u~{^<q4+clqrZv|ZkttWxEW$-7E&>I-taDH
zY&C9582s*nN{lU#{~c1$mZ1-Kw#a;xY5Y}!lcp8>_53#U&!4Zxj$Eu?={2vAqe`-N
zXqx>Az874mTSdpaMR&CnR$^Cwdmc*qI1)SKVV1&I>KCmy0n1)FsBjWlb?Nd^@H=N?
zhovbKqZPG88X*J0W70)Y|4SVF@Mc;<S2EMg+9*{8yujen?`gVZHMJCHQt~(8>duNm
zA*Jloedo>ecdFsFPlwlc(<*#=k51nNRA(9%s~j@$`3iiPE~FiGwI+?Vl&fie9Z=>N
zO~HaSZXa-X4IbtcG^(KOd?e(S8FVpmVHJDNN=RJq(~Hq0>KjjNTC*2z2BOD>1!p^~
zZGUO5$a6M_Y9G4rS#(=wT?i$XCUM|LUj;FqmXVCH-R{E)o^Re@rPZCy?qi~Jw&asZ
zy3O|W`F+1`XY0^Y#z$!hYFxhuL{6z5th9*^y}b%2W4m(^c(68Jq*-+5Pw=mwOYh>?
zuG;((N=LrGa8@g-R3%CIwhCtscN?yHA_sMFU=2TEA1WsLqm50OoKDb^zgx<yt{fh^
zSxf!#`j}CvoRUC%in8BiG`TkpV^p9>td^z>d=R9@#;G>xED+8LRDD(j<&P0y_*1g~
z!i!X#yd4jH;f#DuoUBfGF7<wYr9P10Dia==Kh(<k?D=SsT-JUSlO(SL=W}4iMH#K|
zu5n`auIR#8JUUGJ6)iWx&s5=qIgl%GEuOAsSvoMN8HShAS5fno#Sbc6RF@kngl9eh
zkD(iVG<CuLi5m!RL4kN#T|;#VbMsry&E{9P?#4)1SPCqOAZ~k&Z;;Q_f+kGEWvo)`
zNSH1pEYk<}dGeq$qxX<pdq<kE5v=|vE7!qHFkIK`n1p$JD_G?14@{_2;d`%Z{`8Xc
zBpEM#T0_6Rh;%(NV5I%S9-9(a$~%<7b@ei%$#P&)Pxm^^ga<0!`t2iI_lO#izJ$8=
zRE9xT&>j-oSw?k(f5UTg)`lyWEGgzG2UXYRCH;nxBrU0GuA;`rjaE&M{uwsw)!xi@
zv1^Gd&qI3zhZGX@o=V)Wcy_PjepOMd%+{eROC|jA1w$2^F1PY<d{6*s3)-IHXxLKH
zEkQHMc``~QtLTApsZ{v<Wl;L$!Dk=dtD3jRWVZAlK9WKFYegJ*h4;p)$~d2{Y~gWa
zH*D{4923rVxUno;Sz#Lkk!nK3eIcW*q}SVScQ#p4d=))H^@Fj$ehwC~eG~*U3+=RT
z_$I@q0^ci2pQGG`jwUsee2yS*;U>nZ57x2}EX3~IXQ(x7D5(fX;fuQW)-HFKe|#=-
zeteyG5?D4%arYoSt0V09*EmJOCU9Jl*q5_@5KQs_NCx9}J7u0rmJk$7=JrU+B@@ZU
zV?!!5sjPW>J)sWmG4jHZd_Od(ama?ydS#fUCGl6By3mmyNT7fonuRMSk#7LPot2^t
zTKWi~+V|1U-}|^c#Ot&}$-IoO?0V&gGTu%1b3m=ZR(!5=X{so=ijwt;P_nT4>}C|X
zL<3WCJu)V<0VqpiMNE}F!FJ!t!*OUcTd`I}y+BaKGjt>tHGzq})Z#MQ_4!h=({P>Z
zdxDCV5lOkqlXrhM$H2c=t+q%-`#Ug1@y19bOQ{l>xL{h?QLhuXM7y>@z|<4k<-r*)
zj*)}DRlW}FLNJ~y-CZ1cgJ#l5S%s&_%IhA-pXxQWg9hDF?-;p1mTO&F(j(?sJkMlc
zchut_6*^A<9}Nl)$vNbt?L0?4nzNpfci>5Py6&1?J*CFy{d*kJ;h1;nt$F5`m2KGa
zv0yjaMQ-g>L3n~4VTrcC3UMNheHTWl8*WF$)M2Ibxc`t5=&YKN>IjLx{-AKk$404S
zE!PL#l#1wg)sW~gP7Rpm*vGPm)`%JU_nFA|AGzw7cbH_gOjq29xv%FeW19PEy7FfK
zeFOgv)52fVRf;5TMlmvGrL;5En(A&QPdm&iC1;)+#<-dNrwH5cX3^YXUK=p;@-B(H
zWxtHY>#Ug?7j<{*nGTDVmYG)%V%%-lWNvkQnyG!%?|$dF<5t&yh_EEGmOZqe>f_Ws
z9BAHH4*YKsR^wsD(@rPuo1cdbV;^Q#$T{=h`rjgKVBa+bpTt{>D|CZ_0}@??F!<ss
z8(Gkhy28VZXTkqJiLfQ4#Q*C#R`Y*ztTqIW)z;!4j`bgl)x**D|CwVYSgax5_y6Ho
zANu+dEY=SJG6aj&HxLsQ=p7Uk^dU(8AB#2dalk(oYf41mzd6>(nB;$1ta9G5ul}3G
zs_dJf<d;yNm4Nw_V6mH^mYA4mpQN7qUlyx=D7NXpS*-1Q8KxOeGXG_<nx<wJm1ZUq
zELNXqma)%T7oOeU&$g}3Nh5Hqez`XP7FqN2^9dp=fn$AD_~d^evX&7<)_*wGr<HvK
zj`gte;lD-J+-e*_WF>H{htC5DBJ0bSH3XFPACdJRi#5G2thBEGAB&X$u{Jg~_BB@h
zW3dt-)|!@Kg2nnD5NlgXaeLZ77Hi#`$zN}t5Jc7=Z}b1*SpTtDo8Eo=h0FW5$ol_+
zV{QJQ=U7K(ai_Dm|D_!3@&D#niwxd&9RHYWbpQJPe~x4Q#)|@w^5QYX(EsFE9sfJW
ziu^xwtUZ4@)>10&%e|ie5y!fUF!(Qyb*uPWhRhuP8(geuuQ)~1;{Mu0G1g@#q-0aQ
zGt$gRB$mST&i(bA{&6i%!t&7OdS2W8hI_HxO^}U(z>by_3Zq~5Bf<Pi4CqY$csrG%
zu$FEkspU*+eQ|nEs&NI5Nh<v^(&pY#-px#|4;6f#M5BV4UPpYDOkq^y3N+70+zRWx
zu6{+4cY?X97(t$5y$H&mM0iQgVIn(4y3goHVUBJN6(nghJ05{cEKdNNaj6+H<$7dN
z<N)1_`87UTj2a_3aFmn0WM`_i?F}s<pApT_>GyES0~OV}cd5}IP@C3Hg0I>6Mg^5S
z0oCeECiB83ZIEH@VGZ)GiP(G&>QYoM^O6s-C~}+wRCnn**6@bQ@E(swS0d6=xvU8Y
zE(a}(jk3&9GU;>mP=mB&o~sesl01!6HWkw4^p1F!1*bGRFL7l@f<0=l50nNfOa1tX
zhV>e``_7)c=Wtw%fGG>T(+glq*OT2-!Uzf=ZwQTH5DMwZugTFNmcA{YK|imEnx;Wk
zRN9^LHxorf?dYcXL<d+SniUt+B7eR-Qp<n}dIA;=xzhdQjgk=OWdktBlV0h{PJF1}
zlrG}i&H2gL(NUH}n79tt<YKzew+#0Kw{JsZ6yVBwwG0E<d>*!7soZKG%~uD3>^<=G
zZPU=I%b|}49Fw)R;vcWYy`#JKyr~z<og{Z?G-3+#i^i0JkD@TvCyfM?6?@KuF>q2O
zn5^?f;CfO7AH?+$u}Bt1XCv*@UmyfT-M#aLuK46MDiUa&r<8dO!~}3~x&)I&ti%u^
zW(YP_5VoCz9Yp&60qvz7J&b4?6uQkGb$NmyXF4Va0y*vh2x+n_fFH4b@d$*YElSB+
z9139MSF%(s!Hh`=0iR>cq4{?xNTxx(Kz=3e;<%2Hm}FoMI+`dqMuM0t%|B)W0~pDo
zA~})T|2%np@ih>HP^sNi?_u8-h#xe=BwtnAv3)vGMo#S)(as^1(k=VwJ@--=&J2nF
zcsnpn?RQN{yOR!8udtFh2r@}I#x7`m<6yeq;XLd}t9-JIhC!;sGAE;ZT+>NOriuY?
zF^(MNw4z^b5`~XVVb5I`;L$$s=$fWtI56zJ`SoMo)clN_=vz!(=@ftj&&Ok1CEzAI
zxrif2xZ_^F(p0(%iaElZ)puPI-i*+H_&Vm&h+9k@e>KMc-hnCn#nXm+#R*n^VhL>k
z7dWtd0F#QMJ;L>Gci!({*w!<6G^fd48JGOHEnQC;AHxX9qzDN(NaZbnQ4*;UM`k}j
zza_@@Fj8toE@FeLkH{44e8@-?9(sNY&Zhd!E~qCn8TxUHt(|K#jn)~4)J=?Sxcr``
zsGeS>a7>ShM2m+nX8OL%{iL^xmyA+#L|A2N3N!hShK15R{r1`tOwyxrW9UXMjD~K7
z7pxlRIhk|Gn+^WO{{9I|Ia?!r6c90;rXuZFRw28k^3+-+!p_Ya?OWCm@S6<>{q%s1
z3fx}5t`Q!(YWSzIhP%_K`YcGWajl08V|UMd_=;PiqAe_m2v`n+EcaLn%|$6$FrqO+
z<&{J}Szv42BCQlB%MAcE3EMDE#36+hz_E4p`Uk==zBv4_j6df!%||Qx(a4RMT0fxL
zEcJm-`?&wkAJT!I+ZqJ8HqS*oimxPUgs5xWf8ZXhr|0Z6N^hz>OVJ`YTIJZB81b^s
z8Ay!qkyK+1q3?aU6E}>#wtrWDwf52ZO}j|D?J!F*i%za&4b+8RHytxxwQ-h%B~vF(
z68+@%U4i+Br_VAencW_}%Uj^6Q`hf5(xe@|CUc#!1wBLqPD{{uk;1C=Zkh$$ZWq7Q
zO)K$ad&%Kyo;Et{`%RmL;xxHr^LM4|V^;-O#~Y%gbQC%OUS`u&;^&$E{q(yBVUl)F
z9|xiIYBndbODYZ&gw0<0W#h??vOh)q+OHxuRerbU%716=XwXI{KE`ExnE{qTvF%K*
zq!{|G`gqhZLTWNV?OxL?E6aWQGRt9(_-9o%K?C<0PCosZC(HSMEDc%r&5!@2oHlM=
z?LlHnUq{=RUKN(*4c8{I{OE?+o~Q6iK+nLnbD%44$Uk>bP5g1?LdQm@oiD!_w0*zx
ztn5$Gr8*}D$at+*mbZeTJf!^xg#$m_pG^96Vew+iPI1qemxkB-S!4n0gWsqzXP}lb
zShLm61-Uc@>9vD4`5DjDPn}2*76h;6;u`ddaf*o@=yh6-8$s^4t%m|LN8ASkvW2&P
z57YNu8nu^LcTL<K4ZO{K=eqAM1M%w~t9ngL98<xL(w#NA=IQqxmQ$z%l~BhXP;jdp
z?__L)bU7Qzl+E?l`D*pUI`z)BqEh@T(;&pl>U!E)UJtuSk<Jg15WSV6djP@KaJrpS
zk90^ipt1P|%ycNe7Lwnr8(z-QVe`{Wm~TD$mb3!+*`FtnCS1uKZn^H`B(-<x-+cfy
zPgn&cfadB_ZnHkm(C6MV#q)S+*(CgrXJc=a#My(V=$1CtK^=;AY)UWA<~J-u*aYV#
zi~ZE1Y{+HGCd|3RA^<%YGc5AzODpg7S9$LQLZo`&en?`8X=qgO5!tos=j9?eB<InI
z#h6nU$}l<N1%D+nM+52Wi##Yc0HueMieLyXYvm^gnf~z6s_@!-NRnz~fQcbV_g|Nl
zat=MRj%4OVanAj9S-}LC6&txR``2ZS`IpO@?oDh>a9NR2M3lro%cy=!%9~8N$fER2
zN+6`ff!DL68%qAVtcv9jYdo<v{$DODQW*deRVaZdB5xW@{B>C`2ret~CcZM-^*du9
z4ccsiB2gW!T&&^UXJeQZ8xR<$-w=Djg?OX>*JY)qLcfiPi?)o{FCn>sjZe@bQa?sN
zx)O%&_uKlr#%Ee4C{M;yl&WR5CFEyQXIr9k=Mo4Ut0KW=_5RDT_UxII|6e%Pz@)b9
zq>i?vPJ+vd`|Gk&)1#={5Ceh9aT3Wte3J*}lHL<s)_O$)Tp|OCSexLoddHF(3;&LD
zCE|!MP(jVpqA5?3*9k7GH*cAeMM*YFFcK-8g<O<EZWcoVG>mK=k;_u3<G{3BY}y7r
zc31hn7!GzW3>D7QO{5_v)Zngi+g{p{-?0N}7T+}RM(+s|Ar4db@WkB0L9DTc6b!Zx
zdasdBr4RvKln1Saux<vC2-^dHPCnanVIu2dN3yGuj2{G*6-!YsOq9gKz96hP!GV4G
zpD3%={mg6WerDMF`vjB~uk|}Xn0wl6n(8K5rSQ^`>Mj_}jrohRvJy~M@2Br66@926
zLXjDuk_@eB(p}EKDC;hfs@r`PK2^v!kQi}E#`^=J%_CPqGZ{H;h|x;s(}@2&lvVjJ
z${O|$%8JTu{tkaM!2w+r$>>vg@2z@W%;4}ya}&p}zasJVlT!aQqMm@Vg7~28xt?Vt
zzkg{85<j~HxODXhc9jZ4Gq2;M4Z2K(u7C<YIoIEV1W8tjlW?}Lor#i!6{~x)u~+}7
ztmvG7qpVv5lyxtMGM!iofI5;+nr)RmR7JdKHzJ^{_GN!j){IOYG7CL<;;eoy9s<hR
zWhDd%ChIWO`0U^^kdV(m{IKnwAOU4Xy^!rPkr`1b7`$J=f&PoKQU;SPIS~n*VOIVV
zWlbZXtQb(~CPMoklogrtZ<KY5uUw5EDfQwn%Ibgtk)w-9*#DxeTc62(ZX%9PDWou<
zHEhLe^uJKn;tJ4Y#a+hAhJR32C5!%VB4YKA_%W`J@DL%a&<&$1qbWqtXEb!)ObAK7
z+bbeC2xEOx6>_zOh$w{&JS^E1RkY&-^{jCn5tis%s)JuZx*`QQ-H?%dpc)QAO&qMe
z%!!17Sdz9Z!yZswOfLQcfy5IfE0tXWfaF+W`U$dKZ-^u`hZX>!wF9p0z3kpXG`YQO
zO9ay6z_dygMBU&_J|ZL@!HXsZ0Rd;iAZRgw76Y7{2XNwvpqN+lTZqN2S9t!~h9MZW
z6A^Ajr1#$Sb0rZ?CB9Cj>yjA3&OIJ_2a!+Nsxb!&pCj2NW9u?SVL}<tN^`H9kfHgi
zoJIyz%Dn5;oRT>JFWP_AgO&yBC?Vl0+60=_<N&n2@|R|nvLjg|(5z?zS`A2p04=Tv
zHmhAF!DdZ6Ee9AO<phwz0*&IZMi8oqK(lTVXjUx2ip~7ZhvfYi&8nYQyEsyIY?U<5
z>pZCz(F681%0g1}YOI?j{~$^xLbWh-hp$z?PF8+JYm_4<KpG&Bi>xmrLNzJCn&fR-
zAGwp5{Xo1W(5yx|?ZFU(mk2AS<~jcVpjini2AjMjR>yqrf6=T~1e#T;e7CqT=tnD2
zcU$ETM6p1}Uz!zA0YJY3E&rui#s8sMvCR*K+tOYlqzE)C=1s@wo35lJ>Z;^CS#~CT
z?IoHFTKw{-RR^&>khC~w0opVxfSeF`D=PqCy23P(>{Cz`13<;EUZV+<Lz1Ee0F@me
z)1C0S<`UcWW1(yJym0i*yR*qmrsa3(Z;(1c9lBOXqWo7R7v&H+B+=MAikfI%Ks!RN
z+gt?QFKz;)B+rf)xOT(`;?Vy24Z&QlGRS~7J7(Oi$5D6o7}$5OBjeW&;75)WVFZ^|
zxQ7EvwmxC7jt>E-{B>Cc<@)}*tloWE`F%Q_eR_+12BCeKb_#sDeP*3#jf+0Z{C?}u
zzHbkE%rE-?H1s>j4d~>PVTlJ^YuM6@|GKPRaJVMHWmOt*xPU*98`Sg|(90SK?PS#m
zeV~jS(ySq|RvOf<ffy{3MqJf^;*<M=jDo_LhgbIpIg0xpdJJjRh+66qr{wn$T-G~+
z!=>9SnaO=$l!l7D2|6nYPKm@CtK&EUGn*i-5ACZe{_C<%{>x>pDkf2zAk`il*4+--
z{g=x+LU38rBhQNex~wCAT~^9d;gLB#x{Bn!DsSQ*4+?j2q9i1-C%RY64!l92S+RqT
zSg6`5Q6|7B2>??{?(6I93-c3o!jp#Yk!>MSr*_1o#*n9YWZ%SxyI2VMBsdrgaT7qz
zV!&gaG#7wzV&h5Lh{?}#-A5i2zbpGZ_r~3cVe58aYjiJH0hwm;`|Z%a+|WLOjFH~O
zVePBMJh1X#suk#oJQJQopkUB(<h~Is8vl_#9f8MF&I%)VmMM0WkiBS#bPCc~eujK`
z+DK@INxob2Vp5xVO0!c#(_>2TPY;hLNHf{s`qHR<0ok1u@?Ux%*8#Afc43f+k02lN
zz6tOw0NQ{?c1?gYl;EHeSoj2Z6gjbjhGY;%wMr9HXyk<vBuNOOJB)at1RhmFD*Z%`
zq9=)b$V-IbByfrbJ7@<Uu~QHKYzGaOhi`eqO7=eVB4J&^$a<lLt8K)p5v<Y(Mwr}F
zjYsy#Bg2uO>GYAe9jB>%5DkDuqLN84`x1P4aYE=b?b{jtH{)9HPxvd_;cH=2KjdKi
zdyp^1qD2!bnu{PVPx48?;Fn@h6>?U)M)1$WkESdz-3dZ^0Yb2xGrUQAC%}ZbW#t~p
zY(2aWIpO3D3$}w^A}5hM2>1>jnF<c~CU+tzualq2_din!kq6^p8GyxEC9=w5XfO`(
z5%-}1PkOOO<^_P}On@)E$t#VfLF}vIUaL!(l^gFD$$Su%81PeJiXHp}s02D~`%Uxx
zf|n6&6^XdSAzCNE&EAL|@A>K_FuVj2QUJkwBc_z#4FKrs1Y)%wQi7-W?M)C>Ast5J
zt9V!g64p@+T|#d7?jXDkCZ6J9zj25q05roJwtrQ>?s>T$dT0Dn7}1OYSK=v7y~&$z
zLuQMYfWu3g+ka))L%+Tx?<vd_$OG<rN0>B7&dU)1H#z_*3xCuaQ^q8GCCIQT!W33`
zgf2mb-J5PO!r#Jff>09#8MfJIf>dF7Aa(mGL54*_JNED_tkZDd3MgW^!w3?NT&*-h
zd<LwJ?vX4Z5l92Fr^19QTfIQ9P^Ii_QLGXxAXb$~KkFkamB^OR<U11xFYkpNEXgT$
z_k3qP8bIQuL|D$+cG>$}IYF*#1ku<dbK0AR`b=~y%w_D6WY~S1HG<sTBMB~s?iW*3
zVj*VN$-OY7PTr&`#W3!)1M@2dirKxDJirF87xXD|gI)39TKIw4dql$?*{v?fDi&g;
zG?8JqpSzQsdBHo0?cajWYBL|}Y?E6&pjc2k-eDnEo)~I+j|}{Yc%(oPj{7mY_w}+K
zLefP%cxM~*6VZx>fb5}TtiOH#6Nl|H`1Pp^Ik!XjCf}P0)~`3o;A8TYOETS{aliV{
zTS}y3q2vPBk?FgLCv}Ls$j^AYUAPGRt{wD^Jlq9`C;>n((P!lk7C#Cjy)fVoEF^e>
zJQG2(wMS+Vh9p8PuL7XOMvzJzV$=w-WQ2I(y>wX*&)b_G#X?%~v(4TMV;_zV>meyf
z#6A{+yn27Jg}E5H`=^r}+A2hzgNNk-pl4`u*DpsOT>C!ZxePdte<Tmz5WG6{q+m7u
z@u=Wy0|2>td1CYMgI1@r2LI{#;YQ)R(9`6T!$-Q5>ZX;vI_0jDU+L~5XN-^N1gNw#
z`S`A@_NA3_X&>+SA3nNgDJSD}(%`3^{$3({$M5V-W!1)qVyC0YNr~ML&kFfX1Kj=8
zpD8|e@(T0OOn+gX7@n2RWjg$<&VC7eI@;r%Z<evI)DMN~WIVUOjFn(~bi+a@b5zp*
z_B}T%A%|ua=niy}y0jH9iaOM+$&h)6(H8wh=Jj#TE5|LTBba>JrtP_T-MyvxWB0iR
z=MR-vw-<hSF1Gvct}iVRJXb=K7SEl<z!6U6F(H>Pi$RC3A1VyPDFhH6qScQ5lv)!-
zT%2AG<ei!>!%ub2xGg%rf0#afyd`^w`PrH-?f5mrmOEMMA1og+PB}h#?8Y8NVOl&9
z$CH75xB-7w+a5{bec^*tx&7Xo^GS)tk9F2CJ%%B++gbGcy-3X(F50k_eI6?9qa1Ca
zmPPAvj%a=cPx?n(pVipH941{GyD#{*>-%U0GK#D(0sPha4(*jCK9S51D>!zCzZcr@
zx5tW?8pwL-iH?dN>WP0e^VOGJ@H^C(3L8}=mQly7<;bXm9aw}8LP@jank`*o<z`E`
z46k%P4g1FWuh*Cs&JJPM3**X1G%G?&b6=S}=9O?({B-0qSfKkSfh^x=o#4Bg9d7Ed
znXhg=7kRAV&sS&_rD9GeBmQ)YRl63wnq-ejCWGE}`nxuDXhoWMV-Y!%B2cU3G!pW<
zZ6nRYf{85sT9*+?zDCwiX~sZ#32l0M7JC%@Zn+3tq(3=ymd+n3;_y`ww|@;L%J{k5
z#{ZS)?>nW7mOYh$W_&`_(<_;Q4v7LSCl1MCp8_3IjT5;(xPBWx1cy%#nHIVpnDw%$
z{5T?;kg?x)F%DO#G+m!X`Z#XHryM%F>|1^$axG1gJaa97@@XRFMzMGAZ04`0!ERSC
z{&K9GSz7vZHGetQ`ra>enW_K5v4(iIECif;@b(cn)-bb|zjg$QF`&O3>zmyce224F
z53DF}yY*ijE7PM3pCL}V_bmSWtrri+#Qt)uLTNt>3rDBP+=g{;{_&gsFOJpmS=hfh
z*04ukLVo{wgpZ<o{Qn`x`W)2_zi5b;>sE2{=dfZj$a*c)+|8yr^zmv`P3bM7C)ps$
z&Z>YJ+?}nDHK6G%9xbQqkxQ?4CJ(hEHs=M=DnO&yZ0!(XZIUuMy~ci}#D!bs`3f_e
zh7qEg$O9(|nFu4|xEH3ZV<No_V3e^&IThs}uAWVlh@nMaDeVulKDi*{1iK4+rlqz9
zw25Y_udM-fFE2=DJzXXs`402(iRSv=eo7P<SN;W9OCCxY9H-{QO0y}aA^9*hP0;C@
zkai`5lW|7sw`JIVo3_ChRAx!16QBP5eB&t*FjwB4hbGd4<}D`Db>#+vhC#Zv2i%kv
z<!gR5v%1n2i0tWMXOR@EJS~tZOdzk2u}OGrL$ERDL-al0@~a>M$7(7uynXFj-r%@b
zz{B*SntLq$&-MM>sPgNMxDP)KzxP$i$R{YJGCzYx9;Lo692u=rSUnvNvhXeX&E?8&
zzYnp*mF8+>mP!{I8^i`rl^|JMm4(hURPHaAG)?!wf1y%bjS#exbAxd4`B4|YqcZlV
zU$k_CO{^=Y%g}FK^>z6WdE=O8#pR`7w7)z&_voqW#r@+*opEEznMz#=H!i7co@x#A
z7p4_%=C2rMT)djn<=?v9dV6MGA8TIYcuk-nfM2^d%lwtQv%Afbb-!`t@hjh_Tkz>(
z(kxN)I>ttZ+kdRhd3wy!tWWw(uYxW6xFu_p<JFMVXPQ@*uI!XDMjp;WA)l{H{%QzL
z-gXi>pJh;Us4IJADPEWxH=bqMJX%s}aH!R9Rcq1GSn-qjoNHQ+Tco9V&GW&n5S#M(
zmZUD0bur%MY6j}3O{30KWGuRiF*1_|_1mQuB_X%Bbq*MYnrr>Gs28_mZ*@+8zFu%|
zVre7vQD<FfEEUU;?MdaPW3KJ4K$?JBw`d&Y`gd2iALn1sT7Ktb?$t@x^nOJb)8SxU
zwU}{b{FbFL403OedqDs+IdH4jG1o3a0ItQ^k=0Bd8XKt?>hP5jRmpcvB=Pp5oy@C~
z7VgIl%s`2#PA|*B?$bFd_nJZ24+!m4#a>zpLBh+ux`~iK-cK)pk8$1f9`+7<=q1wW
zC`dHubpGnV-35@O8rDAQc-^ZASHmM(mGkzV!nD`SMZT(t*r@L(@)FmJ^^}LF;~`(Z
zIqr_RDCrJ<h<Hp<_(j)6ZK1L#`kr4I%O6**2d_&LDx1t`S?>SUcJnL_%LV@2PqfYb
zc>S?Dc>qvLu-uw@?6dld2BQ>vhf=bPXtftV(Avg}xswT6(bDyp1mky~KNi<ERY#5E
z9nAm$3aMkZ8%7a;v0&-!Y9(U8UZQ@k^6YqoGN5I0h}BF9h{QUPvl_i;w98AKx9}vD
zvrA<JC;=^{er3n$Z>urA`EpE7M#2d2&=ysizZygJH{aa!+QbDvkw8D<9KSvO0ARQ9
zP%TheU<XbQD4snJIC#6S?-J%~+sTK-bmT=P@a>g+UdQxN6Qfes!Hd!)H%}ktm;8Lt
zI1eWr0*;Lv@2@cvQDOmY(gDVPzThzFWi4V_k4ffOG0pD^hB920hkLiO**Dg!HCXEF
z-PY$yVIEQ%zQiIVg<?D_R8<rc<NL7sJXPu{+WwF1_M|a+QJV%uK`dN*UhCe)00Fww
zB>BsI!MM)7*_1Y9eq#z8fCiBQa5sBUrz8L+(0jYou{_no^?KzmqZWZEKs|sAfP;tb
z;egb5!lVGld|L_wpu{mN1B$;hS6|^4XwVoUV!PEnuQusBKtS+~K_cq5Golr80Fj*y
zHI!Z+p7oLVI}8J0n#HU$7zG9T0szz)dA7>l;Mv|gza+c?zPwnFuMvirny`<{y7%+$
zg~AEbAYtPd8${unN&r_QY~-kA<@y#x`o)yKMiK+!->eb9Re+R-n7lGpmf*~-?a4)o
zwXG4LRPP8vm&#x-F#!9vT$a?z5kvMpf>lewmp5|3k%9oOuFa7oBq{y}xN4VL4eKPq
zNV^!leJT64ol}WLu9+1;Q1g^2=SW@J03;`|chTKzMpA<DHxb^-<+AOpcFJ_+H-Gsm
zo|L_V8!0b+RK8+8>MobXz)vJw#o}N?08&2@Vm%zW4NkV^6?b{Znihc4I~C>%SRcZW
zeD4Hh$|8;=0D;Paf%3juKoB-nI+?JCpa77Ppx5f-n8uj>P(TYRXl#Rgksu;~T6G9+
zEwF_{t=kO%pw9+b`1P6p3tX)-eZ$NpHD~%xmAG?_w|6a2k>#Srk~-QDt`6{4!{qfc
zA~6bb4RX`HCo8@8GljMnI@Y9=H>#D_ze}p;w`+_^QAlZ0WJ^#8_iePPF?ghU4)q5L
zf_#O$p-P&BvUGc{{vt<=w<Ul&Gd0d8l~GPX%r12{>1L6b^5Hp21`z-;)ZXl#`hT!@
zpHEGOef!|k=q>b4LhrqY8bS$8X-e;iNRuiE2q`q_ARvMwO+<<!y-RN*(nOj_?<yiH
zAdp}5x$oKC*?s<leUr(HWHOVSGuM^#{2s^0q6$bL>X*&@`oTo4cc#0s-XQ9nlwr7E
z)dXuYrVpsn_wkVO)g1{EQ>pTyB~q)~L~1qQ&9B97JxJ%K3>YBNz6AvV<_5M_0BRv=
zVH-`L9Uu_X=m)?ELDA6)|D4sLG_1NNZ@3XnM=!_WNS=bmgGJKm0??L>4nl5pYX?YT
zleV-!ylK<^JY{qXjV-7)NDQH+B-eguG7@7q;zm``#r29hgw{@>(NSgqq0-|lqY<&B
z&00%R<k3%bR&W2uS&b8wG5+hULjO9eq5D8^#u(lqjZfuW6|uh;0HFCRtpZHu;t`4O
z{z|LxztSpazY&3Sj^r=3y3#T40k((!qgKiPQmb3|Se_y^35PVYM3i}p_MVLCOh~`o
z53Lr3g!_-*Ep(U?sZ|Drztn11h-n+w*iQ??Zmyc#*sCtRnm?$FMv2rard25F9aB-;
zH!!BuqyM9csks;CV-#kiFP1Fa6gd3ey|!uEop!p)Y->le<UIZ>7y||X;ZdfC_Gtqt
zBm58yU>Fb@96t=kfF=}8iZtJ;5g#YMFCvgo%*O`Jy}XH!CjH*EN+21qdo>^(0{F2$
z@$uZOlTizp2P*m#Pd<nIlk)z}<Ey$=@5P=8GC%>md1G`N>Wz^k{<>w3(CIA|QbMnN
znsbG!b|q;^Hb2xw6A=_IN2FF0r#XG!$!=OEK`i&Yrnlxuu9eZMgr+&0{i9YVrX@S2
zPWvs&r=|?JpWSwOV;9w6je)S*pwj+Qs~G8OtDPh(!$wgf!4KvPBnqJoJVa`ht?M2>
zR`J>gi_R&_fjX<kYffLTIhzVNyt~G|_`zB7y8Fd7OXgV|->kdF8xj``30war97u|p
zJ!g`psF)?KxTXODE>OSHfy@*}&5|UV8dl<okY2=jJYNgoD0##Y4Ww)Vu%5&ryg-_Y
zc%hc*R1*MAz_jPHQjcr1k#4h?P+EBr40xggrH%ms0G3>TrBwn@#S~$LY4=SdgAyg^
zmn1R(e?Jh|W{wIVNDBolwk!HfYl0NX>}_m76Xu#|4VtC6yq}g^UK%^b@9@NWTtS-?
zxw%5WG+ihLCSjC#@hUxZW?Kc5l7nCzc$vO=oq+_Cl~cxaIFX8n#N8vgiHWtZ8l_T+
zcb36hqdVEhRKVS~TjUAEGglDXhvLvQEQwtR!$MazDXk5F_$@Hakskd}M(0ggs*y4T
zU`P`Iw<H%zX*$YsO8wx#E=NpQAC6oG3^l`$1KOR30Ysp6$la3W#DQY2^{rzXQwAW^
z-Y#hdLmGe~Kbdk2Sa7UxY)-|HX8>yXvE(8M0&gP5-UmmD#!$H|7N%gXYyjlVFv#lo
zv1<UDyfL9f0BOaXWh9B12cXb#tjdwrJOlIo9-yfd4NlbDvKiC$O<UeD$5m^&ly)`V
zBMBsGt2=W%<N(q<d(}$&_IE-Zp@uhtJ2P)wq1Q8?8`Ih;?Ks!CS{h3GJ=tat`j=WI
z$dfV1xQza#R!R5zY=DWQL~8Z&ypu9fnTJTN0#s(7D2<9cf6fME(_q-5<ERsDffHAX
z)ffB%7TnQ)sa1NXmF@7ZBog9_=VyXfNidDW{Fnvsy!D|LNuuqS4W})aD~o?LZsnv=
zk($5w@rF!BRRT&}0>C(wE8#N}2{(x?3DHx`TLU@Lk|f$+JfXe(^4a~&IlIh733}B8
zzT%~h1WsU<J22i*60nWSVCc%wvosPYAcC6ArG165nlz~f3?;vo%a74Lc=x%1L{r8U
zSLPmUvuZ($VItBMhwpeQR{w@x6P-Hou3whok7~3*pW^KQQLDBzlgRikN+>4$AGPXJ
zg+)}%*+Xp4@LG0dmg1hS8Kwx#4O)j3yWkZ(ixBW$!%Bh%1|Nbs(!f+!&t1xYM%_s>
z@%)VNPg5IQcbi)GodK|4$8c1TZaFLxEZ3=5Tw9GdHf=o0;#PLys*AzE@%EL^R!u^~
z9hpDh5DG#TRG9x#s}@eKx|*0xo6XN53)@8)PR}$d+HO@A5{Zg8;EK+@khJi9Y;~Lk
zut@9H4?}XZrimvD!guU|UdF+Bo<wT(gv3d;ch2sM!{~nJt^FIIJW$Zf<)mjTj%H@y
ziqG3#y(-Z+gR^crGMm(-^@wU}IQ|c{YPL=VSle8&)AL`!mGeuu07i+_YRk$*C<ai0
z|LopFq*h@ec3O=)B*R|G7q<W^&6daSHUYOfxpp}vKFgLHPS?NbiYBg2J*8ng^e_Ne
ztJGFaq*gHoX@*I^h<6GHrI5WcFm{Cz^DBy$GG4o0+?o8q;!F`x48e3dE)u-a*adl?
z?VTCPOK*`g+n0q_uU@*}oVbE6(v+y!tJCzUciQz1Al>uXA9PG3%PkGqac}+8#Z$W<
zA@P@5&G$@mGS>JN8ZQ*9RV;Ae=&;okMZ$eyN;$47%Y5sLuO4})wh0^~*3sjW);xAc
zXMB94s>X=U%q*haC8Ng4kt!h%;%%bR=$D5(+O$SQ^&>AlgHJj~JsOV$x1A5QOipa3
zX4K?GoQZWyfR=+-Y1`|A&o^d2JCb8aCNT2?0DmE$`d>HqN?mr0KbJJV0WoWlgkvV|
zrTLKqNCKJ{<ndHQZ1qrU|Icj@W>fX@)_<{8fM&(qOt3kD`M=sK!3O{ee^=G0L`KwB
z(WYnin0HT_5=@<gYnA?Ks{l5bK0xH~U6(7N;A7IgxN1er7{1F<2A}j#TfO68@~0kI
zo&unAu}af?Q@GsbHHIN-t4aUSR)Hj)fS}p!x<7M5wOT}N^=Q03WH#U;=R3Q!V8mC{
z%{=vNMF0cwtgNM%8X5;!0hk2Xfki+>ZPiA6;pm+Wor)U}s=vLXOkA;4@tVT4=$~A7
zZYhH4gzg{|Fhp(DiL`}O#2NX!@#q@B>-Vm8xJQV;Ubr$5TgCkTi>(5_L;~i8LQu^&
z%@fVDO#wd^<45E%1nMFip@U!GjHVlfVZqSY9{qW6%k|ybCaU4q?OF51eMM>+;!=D=
zo;Ok6zeS$2@0ze;jmCKK`-dxib$V0b{B+PSoWy+M=jP7cqT6M+Ye~$_TByEauRFF`
zS6s7)TV5}<+pdWBxieq+ywp8Bt^-wO9WZST{aC2%v>g!t@_DJ_jtfI~lV3Lkxud#u
zLV|`u%AcIQ{N0ME9m#Dx)$Tog>^#fy@y{W{?E)>*4(B7+AWRYsx_kR)mvq?^vU9C`
zPzmX|H~DvOzBZl4yMwpSkr7eDgs2JU+IQPg%17rDTK8rWth$8ng{;BpjPK2*UkHPl
zuDjjqT#%c8e~<7<t4?)9X7Q$&Ht^LaSoGQ}Y2n^SpPefyrs~&jM{f&D<(a?Sc=dww
zPyP0r=!2_*I>^giXR!y5fLrgQzrzUnxJL`$qBoV<=_f!lVzR%99BX>a>C>3AS22Iy
z#GJqX%duX5iy@FD-uz!VR{ezRhD2y!KWsRI&mc?U){(&I|H83~GF~4l()r7=9*azs
z89kKq`@eInv(<LZL0=Y_a^Kgw4P{CGmt$=drMpffSGWFgtjiq{zxVtm%}G9YM(Z_@
z`w~uM*7}oJ<(;@10^Hm1rn)bEPvtzv(xtDCA3S=MkM=WoAmw+aus2g_U9U-HrOOjs
zcXRrssTz97t0wG6_H+GyYNMtEM&;jU{NFYd?}1sJ&RY-GN1t21^1nd*I#_6~N|}`<
z4_R!{+u8Eh6!^jZx{vN*bYbM#&jX+KnA-%+%k#6}KW^_kLc)KfT06yj)SJqT`teA<
z(2L}H7~Gd~e6R@5Y!}WO&+eV~SX~})ViFGauULu!Qsyltw&#cxCyKV6@TJI(lDj8#
zV{N$n4WKIg-jm@feW??T!=<-07lxNJbj4Z)9+)Bw^VJQwZrR_vns$Aix>h}GDeZbW
zA?{i3K;W+6qZ|2mh4T5HZ7=y=E5AFN-`{$=WfR!+kv=G7uT}Wzy}g^y1H;d5U5~P&
zL{!+sO@)b+q$18l%KQdYZ<ZmDd2j<h1)JR~52tc>%O58p#9lnBgsg_&%}<*40SdK>
znbwT{602@ph}bWLW+m*K3P!Yuzmh*qa;qKSh?L0G#>Q2fC`QZ(){CoFxi@^Ui<E4V
zJ5xe6N%}2HwyY+pNkwgx3#7O1R<=vEe`)*2v8qXT{#=NZ?)v{Z))@7p5%D+bKi;Vk
z)Q=~PwKRTyu#eIBHShCA<M*dXg2u^evX<uQW<iYR*>2Sv%|Bn-37Y5M-)d=H{9Gi&
zXkDJ}ztJLG{2^!oz#`p1hFT1%Ivm7U(M=*}=JIJySI|2!mDFOw_(z@rS}c%+KOh6|
zFQZ3nE$X4~O=NSH0Wp~b(#Wy7QuuqtigE;!(q8t!QZYFCB`6ickqqkVToL_nKq}+Z
zD$8Z!5adFZn&lG7q1~aw5GgWn2`#~w2jJ;<01OC;9&&5#etKK-9@^_}NuEnrnNttr
zZdAPHyzF)(ORc4daR5^~?~p=!!Ur`Lgju+%A$%J<bV`Hfsc?!7$>Z)G)e;ET%5Vaj
zi^4Fc0?c&=FjP-`of4^%m0s9ysP4%|B`4v^cA25etGc7_#)gGHGUF#DnAaiAVs*JI
z9Voa{T#N$XSbXz}i<YLSNq+x2-N%+*R_(Q9D;*&I)3BR_cSV*d8!r{Fte&E69R<Q<
zBHaV7ud!2<;F={b^i_t0X9Ux87w{TycTA>|Ta@5aVJ5h~0$0)Q)q$S%vF6C=X<h`T
z+fd`#a#{vu+*Z?kHjb!YuNX+&sThkP4I#$nyi`ZnDOosN**!2i+TZ7p$}M1lHW?g`
z_iB$xnQqEu02!I_S%S)5FRZD-O)A0szREH<?=tTenNNfz?U8(G)Ug*AGSfI0*U$Yr
zLzf+OWTZVfN%L0azF5ajdUcy?hDgVtVR3hQ0fSDlYN!Ff9R(q+kfRvp8w;{ASGi7`
z+gPT*$<JlbHpVen%92=w=RAf}SdQbf#U(tfO&RE})zz|G7HzTejrIgCHSpNaJk!!~
zh2+*X!ZLEI=|$cm-!6Z6Ae=&My29!yugK&$=dHq=Y==DxA<3-@y&C7QEv21`n?JSO
zLI>r~zoTTzYyVPn8*6VjU2Z|Q?&T-8ZbRYNQv8s+ti~{Uq$ltUpW_&}Be&HSyW)1e
z{xL~;*agt(yVS$h7Y^~#MVyXI3?(e(JA7oX?HQWfW?`o*aPA<(_~^Nyj)#iR?j|qJ
z5<JbjA^xtBr{t8DW-YxrYzFFsz=WMPSGF%px)NebiP?m)5Q>M85yd*dN)}6A2k{zz
zchSgz`DW$-G%Y~Cz9_+FhK~_*ffvXH(ppwz<IzPoOuq)Y<%_Tned#16dkD3^7Tdxg
zQHEDIT<k4Dw7&Jh9!1rVQ||lEzxBLAmDiV|<7`%spH-KCJW{d%m~I^h3hlb9CC1te
zw!SZ$*Jb^=vyE&X;9iF-lrYxp=*hQD9_*26>Gr0(ln6}0TN7?brZS)(_H*Y;Q9S3q
z7!e~4VbfocGdyvH7@mNcDjh<N#<k-!hwo7ED~<RVtkEKq^JA+$_DsG+FjzX|P+PMZ
zXeDy*+a_#0iZ~oFd1aU7ki0=h`c;wQ^mVNG35ozi?}*9P!8e!k`KUrLI_h0A`U2E8
zpDx)9LO%s~-SY)e<_v@Ckw;@%)jwJM&+#nV^tLfkyi{43UZG=Tic|C|kMqi!&=E3G
zFsdiJCLYxLT2kA}vu~zxCxOZx8%zIfh9=7_G^02m&aUYExpm?IYt{=3!y>uQ4}Y!+
z5o4tMh50M`6}omlvT2NixEkcIQqiDY+5k2nz1q*XK_L02(bzH1luR$oWYYdq{PoV-
z%ib{S3uifpN%F4~c<e)$;0)+`yw>lbaaYP-=@izD^@clv6hH=Li5@2G42dFP{<s2s
zNNKFytMc$gf~id5eygAAT&L9ifh_Fz0zx7gE3)KH<_wNHfk$oW!QJ<*DC7^j{>ZD3
z#Qfhn^Vej#bkI|LBYH%2JR+fdBdGwx;e;n2NSsNz$BXE4uH*8Rng!Xd=!fYEKnlNa
zrxeMzAw%OctQt2qroU;>UiV*PF-z<`I1RhXh!<dS6u=`|q79dg3)48qaH8KbXY*cl
zvINYa{OePG7CzwJ()ZH!XP*D*%D^Jo!}T2nFP?cG=L|4qFxkjOOV}E!xS-K4BuNkw
z{S|a92l!4ASu~tHzKA>xPLW$gF^bkY0Bf$`)rV1P)p*}<ys`^eK^r9pKuH5oax-ux
z7d-W-zFGrby?RB{Y=J^-LUWjaSDk><HtC3l;P|O=uxccmFOpdV$U=){adTz1>S6Ik
zvc>jrtN?jVurO*Ip9+rO2FD?WV>$z}zXUR0FJ|^EW}yYL;#S#cdpUA-#3w*9+F+$T
zl-f!keIcD@172AGEU8}1Z?eiF0_5@U;dorkAA*Bz6~P(Splf}a)q0d`c#Q_UYB-+e
z7miV<n9szO4PC-uRss{j31)-fM1PfSjTe!wF2N_MT?~swGOxI@t@H>s5&hLZ_-LOn
z3z|WSSD~mx8dNI7;4a+o&tGM8m0BK`0-?lhdYO!fzk$2tGT$QsKIz<E{-zR!SS-v2
zrx<}!@+a``{q<K-;wm5>-yUd6DSx((v>9G?g|F-YrRIW?uHffsaAStLt1}2_*!}ZY
zvwPvS>m29q(&6AXE-KA%lpdm&!=YI14oD`iPfp)sEy_bW1jOUus^0`ssKzVB8*4Ry
z6*ks6M35*ukfaM(w{l~-0VS7>gE{c>oCqk*;X7-~1Ut$YR*=F1C^d4yPt_=Co8Bw_
zSiT0386~x*3re$Tjl)JqIuC!X+|(u)#M4k}n~yT(8PoN=A-;wb)kc|>Kbu_v%c$rG
zoMElYH~Nq9$_+SJM+yJ2j=`SbhXb&J4M;{zN7`z0Xc*-jQ7ov9cabZf8YZB`56WN@
zy@(|;gq)k$9S~<5FULz>p)+1dZM^!{W?=(Zl52}28+0ScbFu*?4saI^$KP!LD^7q^
zn%1CJJu*%uK16eM7Ot=Ymz>ZM6YJG6;tM)M3Lk@%B+3iJQNkEk(UfxkOKQ#IEtd20
zJ9A(KHbJf2vO7(Ep0m1qwA+?V+i*yEVIE2}%2jmO^K7h_C%`}u4gQ#i=NG~97YW{B
z+A_ZmbnzFqUlFk9EBBhZuNs155CH|$rKdxHaIYabdfb2`QC{s~nb3(6BGWwXg^Tp~
zt!;V}<y9LTv!|y+1W{hqVG{!X8PoQ6OX$9ls(#L=;6Q{|2|D5kqP)88J&f`b!@>@|
z^2705Vmqfqc@@*Iq}wYJ+pnyvgAg!SEVhx*&1BF^L6qG(>(O=C!;=*1s#ok5B<YHZ
z041{_S`tO3+C`>$cs>!Vpzn?mldEYr{t6La<?@VK9!kxJg!MvXtgwP*BDM$MXN9rP
zt{ar+(nxb*k>$ObW=IuGKm7^{DqtWY!lcDUf9DY{TGr(11-81kKPFRGP&daY4_B>&
zZOG{t8!eZ5JW;&a&kDsyiS^!Bsx(aLp~?dgKaO0&Q^gmBUP4y1#A>*Bi5~YoS<_WM
z+_jAbH&;U>=Cp}O%k{4)@rr(ljeeyu422f~WYkcFu0V2D$Fr1y3{!9kX5#ZvcnTGw
zD2r#r=&E^PwRW_Fc6yo7I$BF$zJPf()iDhR&KeG&;SRnq%jQ*DKYP<m?HZ(I5Taz&
z(>55Zt|D$4u+0Y%LEG$)^6j(8>>BR?vE^|s5y_@zyR4P5<P#Dm4cLyt{`X1!<>mTa
z`LQ%7`}4%jtq>0_GprWcFLa}im2I_O$z&kDU$NnnA_k{>s>6@Qz5eU3BKalyVp_rP
zi2mx*-n%1|U~P?ngN3@U4nKqmeU2Q8*Y&H6-Hz-3wDslL0B)K)Uo-{$Uw;+Mi^)JN
zRXVClZ5&x@o?H{$A=IG5QOq_kjEMefIFd8UZ8VAKui{u5u)N+l#uQ}US|4{*ADh`f
ze|4#<XBl`9zsoIw6EZ`#FZW2KU=_`fdF8Ph)HoL0OY{kd4~`SPp`(uZ=dbEo@^j^@
zwGjPPl*Fmdy<L>^BM|aazA4dP9VS7ifSA2{g}<T%I;0w<bU4j$=!$P_Q9FEzFIi-2
z3{`reu|T8$_^Wu{UYv{>jxk*4Pg)P#|M;uuTHe3@DsUecJCW2cf|enH1%QbD>V}kb
ztS%x2%Q);q;(W*k_+sP*l0JXMQdTSDg=HZJqgVR$$1q*x;BR&)v;@I#Aq5GA{Exp1
z5)2UyCHkv7pAzrpxtkv}K62)VV+8^V1RnRuDD-l*?kPHan-gRpcSQB$`q}rfqKAE~
zc_3K{Z25OTLtpHVT-}vQYp(Z!g@wS+g~->)|M6GxRCkH~Y9Hkd{7)e{rp`<r2|TAZ
zw_!ChlfzHw0nuOW=04P!ER;h3Km65R?!15gYRZ58)!2Tvu>tz1e(pRBOUgfgRRt@B
zdTnIZ$KrxA3<3Z3S52T+yNnt=Koto*Vgt{k4P>9_;o1eUJ4j7G%i)Q_);^1M&xc4i
zbn}ISnp1EzhXfF_1Wrpr2WkVBO7T{h2u7FvKm;e#Rsi5jJuk{3lGQ*XI6fQFLyytp
ztmtMte5qA|rS0xTt%D^Zd+C{QS}I6RU$Df=8W}!T*YcPfu7Htf(3+`L$H&q@zlqs5
z(6}_{)9neR$2y=#*wp<xym1u6C@m2MDG0D)8~`7~QAm{1*S|~1*Hb=Zzj6q!bPYuJ
z_x`e*W;nJo9O&iJljG#Xa(>XUGPkjg`HAH1k=)T?(aq$35Sty}ubSS^<BYd04P_55
z&@!ph%IKk$>{F5GW8RpBW!G@39KkPsUZw9-WMkvAshga_L7U(nYC3E)$8Y(nwPNc=
z&j@{__*lxazCS^~lsfACy>Psg_2>rQM!p0JZ6AbsfPlk(xvZdJ3z(IzN=<@@ul7|B
zJQO{A^e#S@6N;1az;R+wa*|lYA*Z1LuZME8hh>u%1naeNKxft?LjDh5mC*60?9(>*
z9rCAM{Y_QFi3G9<*%J+x>Nu*<@8z~pkUPN(E%`{L>lno=ME=1?;&mtEA@J&Br3wHV
zA|3U%`74KCu-b2r2mSOZz4|sND$6f_DDe~!%Pw4<@S!-}ACv`(_S7@4Q&sV;uixoF
zugZ*>_k8HOB$hK&5xoSeI>p=kVI4dJr_iB@_G;Rz-K#$(gN0kv)tk`=1lhFx7O4sp
zH8vK$9Xc!p4m13=OyBeXW}#!q$Su?KIl4I4=dO$xQaVK!8uCJqvqa>!!sS=67y;1P
z75oSvdn=)zZwc9`M8sF|^%gx!W+2}JOF;=_iZTf97^nmVG1$mC;rm%l9!i~nRA!*f
zqQB7-y}7sVK8$Ha!)vwR;N~%H&Xit}9iMVbEV=gUumniCPekwDpmIu;>2b4G>_2?9
z;~?^LT~s;{UDiw2fO!+&P(6)^L2bm~A<}t7d=*D)bBtM!D7%VyxL*7$p`U)ERmd05
z2*7=9>fuq5L6Z~lRm}7B-ija<0F|kIegCA=+wym@$`1%Y(ankB+1NxMKb8WOq~BKR
zwdU+2-u|1YnuYL`_a|@q!qp{^h6CVRKf~+Q+L?7C(FcJ&Fe1JRX5YbkKAPg8n|ffs
z<YNDA@VU(|4q)!{et3wE(_efQpUvj|s7gvRF#@5B`-`tyg%|wkD`>vm6U{evhI;b(
zZsE66W8y#DPnKmbhyxSO+5<XnioLW*hIiP06$N4oA7VSJW8^_UotF+`EKUnut2NP~
z1tn6uz1j~EXy1Du|I}C3N0@d1=sEeS-vo&zYmY9r39Urjb!aD}ll-(;$AN(?{Q*nS
zM$Q#<D;?umba8c`BaE}7oUW(|TD3Et3{#F1v=t6}saN{=61Bz3@DwTDh!BqiG8&m<
zU*kjZ^7s8>2@p-+aHFaulM4K`*Zpp<`qfvi_h+<d>CW8$(-&TxMf+hwBVdx*3a2@v
zl7jEQ=ZMr2ASBmw^hE>N8(Ml_K{n`Gl?s^TuD#K8G3Qs&c#sgQ;CsGo_(&^TE9W<u
zg}xV-Qla|ixnc)~+zYhzr%(K0omO=lxkRrwI98ooNZ0E~_<gKa9Odu(Ui5~=>YVac
z-HYH!=Yd$OCi9X8s0TWeFX0C71Hl;`jT|OVxzihudi~A19)ExM-ZWP{wfo|G*udwf
zf&2zv`wW<JDVQ@oPx@Fr^pj;TzmDap7!!(R62{L3uf48#k>+*Tt0)+e>m|S}{q@Ah
zJz$lM9>K@mBdk*_q<9%^^MU?~D<`Am)ae7`--$YnzRaMYx%W?n=!HUt+Y7>^7vl8q
zBj$+*GD^bn!ja!UN+*(wSy`NNe&`jmj!`n1n~35J^Z(R-_xG<0&hUWMK0Q#MyocFs
z&PCi?FuUoHj??|P_Qlj;>#q_0tzo|}xuZ@piPC}mRfVU+QRlelZ*DnV9b0^SyWQF=
z=A@(GqArAg`S#O#%D?_9Ty01D(}tm$dd64ai$d|WKr?|0mR`CJ0181Vu$^cm+-;8Y
z3V_iWtQ}TIo2i?ZF<2_RMrIt^2I>*wyi@3hxI&jQhuD74_hw#Kcp%ImIpgB5B=Dr9
zA5HXE^{FId%`1rhYT!SA6)Y38gZ<~P-b6T6*a*luHO%Q#Id!~!&Z1j4ELCV4ZZXWN
z3;pY_in-q64KqQO{nuaJ&79QdW~LQZ7Vv9eF#OcAWxgD8x|S{t7zm{1tnhNpHo+D=
zpSCl(@Q;V5g(F9<-FT8SYv<P)`oRK0^j8~xO=2mXLb}Ba<IL1R58)O_as|f6^{Z9<
z7R3pyoEalNMf_<e@vNgRcaeGgo+>)AvJHphsV7T^aZja9cs(hiJ@>XaOg`BTCdRF`
zmSp+lRxnZ$bVFou8V)p?Y^$-@{hM6(!uy4<$D#I~7vKbEC7(!1FXyeNX<WAS*xH%x
zkh?v6I|><YK<hDzF_rYfIpJ$0Bk-5k$Pv4C0cn&rX>4(ZKKkq9&T+Nvr1$MZM%FmO
zGBP|w;!Z}ac`c)k$dV90&Ace6ke3_>wF5i_2X*f>IlnX{{3y3x0z4Xh>dK6mhZ)6R
zXUR|kEtcA3_&SN)j4QYF+T=%2`gyInwdT`08%>b}g`NjK&k_{K%-<_=`)=?wMtPpg
z=hX+EC&yE!THHTpt~qnNMpbqTHQV}j56RkW>1PrBRolP*>LmA5_Q8_K;y27j1|-A3
z*q5FXdg)ke+I{LKgjx8b?%$-?Uwbk1<am&G?&%9wN|MaKn8%fgV(62fzdpslE>AX}
zK8<!zqnA^T3K0pTPVuUzQLI$Oec5mWO&`~U3!%A~or-X_GFPc;52?M1hMq(dJ6U5-
zP<KKC<D@f+IR#Y>je2j!iu+#Sw$;Xowf$0!t9}(No4rbX%Lc`{oDr{VN3Q;ODxH1F
zSHFXTuT&<4k&^y~&RGBlK44B)Sd%`<JbR7l9zL}x^d^&hQ7`pzd7FO5DxLK(E%U%2
zt-M%&%B^Dqj`uD4N^Rz;0qXpm^VmU^Df6_@u~MzP9%_v>`t(R@0r+PT1GUP)jN1q6
z1lZ?1v@T0lMp*U+zwq5bJ)WSn4Bs*#(RuwVo^@HF9cBFN^CK3xsRsqs0z&)4X_|8Q
zoJgh(Vf)h&n=Fg$=xjmBuot6N`3w)5Q~247z0$=TUaMWq#nYNTOs}Aq_vOy;grE0-
zZr#C<T$1-Is%cZk1Td0cu7H#u1=9Kl^}w`Owp7tQrrvgzM1ylnv6Eu__LchlkJ-Y?
z`*+_3r2WX>RKJP%I6v;wW%+brV_V}H`#63}zL4^nFiP$4YEb@<{2i-p#rfSUiEfr9
zQwKLu>`4=e<CbMijb7TaVy3AqGo^<RQKR-3Q;{W><=lq}NXyZ8_v&T}0XbW$c?8*s
zRHNYMJU?%tO%c;^q(4ja<91Ou&ZY~`ew4#Lh+g$+v&yGrs?zxaFn<>Du1s^L$}?_@
zQ4*Ql*v0HO<$&axc#UUX3MJdg>v#Nypa?k(C9%*p-~#L?c>;1@S^#|Ie~ntVEik`|
zAgOjfZNn=R@srBV_3%#g#BxXFQtYhs-_&}0zb)%mT>|_IZO~-Ohae@ID!)N5!?(8Y
zan~EF6u)>&7tFuAliN`I%<tCKKl3v$n;Ku~8TcBi*>5i2A?y9%7bux*`))z0rB(2Y
zzj-q4hb*PmM#q=F34iQ&jKbPyzW7ns8rywg2y5KA@C{GhcbwnSX&t*bh>YQMCQP0+
zbxv+dhwcCQblP^k<LnbQcp!2aSoN_DIKJ<7YBWD;l=~{4q}qkz?MKfR(CZyD31`_T
z>o$<mt4KXD2iqk#R+vftPR93?TMq7=pV^2U>-V&~OYZ**$4Yj0Kst?AAw!hNv8J%U
z3_r?kUAiG1!#?K9@*{7=!Bf7Jf7Ckdsd}Xgt>PP7S6j^=k9Qrmdz|Va4k8H|U)q*v
z75WA@cQ7tDxyaO?yS_({`#M^?+%(YQn9{u>|9Ejb(aDTsx+N*FO!d<)KW9EwU?R~^
z<k;X;K+wd{9v9tuyl3{U2<(79Dxsq%zxtWL@i9FY#3uL2$C-c-C>SSltfua$Z4md%
z#L&7hGaU2DwHa+2q&#gPo}nKw|NNJHks4P*5PAND+!e*TxAb`ELF;1Vc$^y+;~N6u
zBgK9oMKmC7h)4@5A8Bv9yY?KLSL?Dk0L1vq(U&+wKHQx~&z^Kr;bCRFO8+slmfk54
z&5581Y(bK#w1a;wGjp$ZV43pGK|;QkwF_55<%1@HLMg!vEB>KmOOkQ4Y^9sh!it{T
z5nqD1O2BHhr(IYnl7emfP2^{xNwRw($y(fd^2<mS!LQtg62<iI$7T?f6KRz(8U{@1
zXLCcoUbk|!DI;eG1<K5D(AdXY1UV&r_)P1!GG+b`?68Kho9h1Ti|TB5l^dAs{C(WV
zBFVO2`j9mMV;Q2<AZUZoCF=li2w-(-vqfoM)%m~>&#ltevQ*6lq?vfCsqR7^wr%_V
z2CAKJaz})W$|xf~weQ|?Phu3@$mREla^IH43W$}qCoFJ?yPjLb;4mSE{Kg`Jtw$uG
z@pttVKLz_=1#i?mC7+($zTNe6HT`(o{C$B@N+3_3+;zzf%jn;*l(Y~g!g)cIFNbnz
zNvjR^Xh`+;l@K`Xg6ONSUkOt#uiVl;oJq~DX+M#w0?^fR9r`h>)o?jTLUp>2Fju|_
z++J+?HeQCIK)^rmq(k1PoD-Jml$QWpgRWd+Kqi)6rtV^fZlpm(&pR_HnI4WE#QVJE
ze!)>C1RpSbkUrP~hv)!igNg|rx7QE9d_VKu9OZ?G8*!$*f4`ALwPi}l>Aj40U3bGU
zdt9Z|DFXX<v+YPizDs^CGW+1xeZ(ORDf5HGWzcpWK!Oh?y1ar1S4o)H=#G%AgChE4
z#gr}(y3gt58<e#G<Ac2kdTcdiumnSBHP@Euu-NNCiNHab%t3{~ArSV^=;aDeCey=e
z_T?4mJv<$23By(~ix<>@6nMwt`$dw`%Vihlek5yHChI^ky)iu-OqO-H7OaC|!qKxQ
zo6L7-umrF3h>>s+XazZyTp9B!*k8%2D2b5;y=HAUXN{3%@5{Vwz%twPFb>djho%&S
z({Kjzv+(E|c&(By(jO@8(Ra|p?!5+Qy<6!r<xJ^e>oSFtWx=VY;B*YUj267&^l;XH
z94qS)3@pbdKE($M;*<W%vBEjC_*t_CHG|;t47|5%*vG!oa~P%X1YXlArp&u97-{<C
zI)?MdYtCS8E(;6F28oXVnprU;;kyhUqw0!rL34==B4nl_ra|B1y&3Mfh(2PNowy>J
zUMD)VCt5l+oxvcS>`JH@A3bwroRL;O>v3yA!MFz1w0p?6;6hdYrM?zYmKHCKQl~kH
z_UbAHA&FP`)$Y7Hjr7kf>D@Z;W!*F=So%+$6!6E(BRSatUa}4EpL{g3$ygbhA5xr_
zGNH0^RKaq*HF9B-;%XRfXKJqDZgLk{<t_l_%XqcR4YjYUlquS*Hq<;NDBrCf8vkJy
z9}B7PlXCpiY?!O!?|m80r<4bHRc@!Lz`m$#im5&fRtcL@&8%mAR<FwaMU_e(0V|d-
zSnboEM(9neJ$is>3|1fcq1IQAD4yoDM&`SW44Cwg?^*5#;Mp7=s2s0Kw4#VqWaKg>
zPmvq70>onrOWRdMKNA#Ry~`8xLphn3)laH6Nq)?M_lt!b8P5!-pcR+MvHCk|)LSHq
zpxVHx!K5q6G^XF6`-5Ij!&2`}iXL&}+wX{ec?E@+(!XIvIbN)%7NX-CGVa-+|Kq!U
zFq7CWHR@irzG(xerCfpC7^|Br#ojdH4!;(%mzBJjW#))OteD=a2Nu7|!LrSAQp~V~
zWDr2Y&Q`CMA-$(UOg~Jqav&KXvdVHj<i2Y)GewI1`V1#!@ixUWyfbE@uh|gw;5)}7
zR@LC^#cU@GI*dQ_**=VLF<S^K>M(z>D4@3F|6nG1Egz9HqIu0S<_FC=!^H5Im2i&b
z+v;mHiq|&1uMJ6D_sg<)VQ7?!p)PV!tDR8{#Zs4Hp(d^-S4CKcyJ2ELN)A^>f&ecp
z{3o&M$L1A~KINxSS&rR>E8}oCtC;I?NGZ%Lm~mOmgeb2nU>Ow3U<z0pfq3edGcd?&
z*qn59wWuoHH7Wc9F7o7!4(f@*V3GhUXZjCne-vxIL*Igau~5yr1Or?Njc?hSWGI?k
zPCqy^{~8gw<HCJiwUa2XV!xmphgD|X=$PFZSzLZrx^gS2pze6Q8T0tbY-FDT^R(o!
z!XktDjhTCC$dRmauF4}sd39Cc;Rj)&yjt=>%NuBB0<?cL3wwOW+v|{}_nPudvC&9Y
z5=Sqr3&`FJgeH<eONwb8>$;w}Qk=Vrc&}2qn2}z45ITp<S8sB8sx3!Qygnk+0Jh;Z
ze=_6$eOCUb(#Xl|?c^E%F!O+Gvm?~MZ!<n*WwmxI7z?CV4m=GagoL~mV-4WG9z?-9
zqQV+Pe~n8{+3=}Jh_sTXZHi`dxz_h-MGcamxdHNOclPW?2CGfYiY@OdA@94a-m|kX
z6QED%I*SQ8&xjXkw2P6#Dw#q*#i1+HrIl;liUkp0J=T^a$Ur~eEVyzf#4m^$QP1Uo
z^$4TxfB7PqH!SMei>UY3LsQoIv&w;s)~91(BOA@&osa%se&73{9Q<23>Q(Ud-}KSz
z%9zuSt{1E^zm>3Ld92CBm{WSp2i73|dWGT_Je9|qp`|x3TuqtXL<qw~e6<Ikdo8T~
z8gE2ccuZK_{QuyqMd6`Dd{tZPqc@$=faFxDgvub3+bWgzb7tr7_qw$)yec}U46~s9
zX(GN_wo8$HqWfr0{;5imnoH6P6<p2S{nV6~b>YdaZ04OO@_31qXL%_jKX|@~=_VWq
z6t}p2v{8M>mi!?vO|m{!d}er!_{KXSmU8&}h74Y8Dv3R@EF{7qCG_V=)?DqB3_u*K
z4h+-m4R3{soyN815X-fdk6e{3^YTQ1P?a@ohAZ9IZVu)xo~|OEvP=$Z_R#8GtKAbr
zwcv%=1A%9TltELuk+0RM7(+sRACkR$7;~2uulf*QokxhY#S*EN1l6JZ)4a?_@~<e!
z@hP_(ZMcp?Q%h|hz8im3bC;D_u>k8^@O-X7qlr!1yQb?VMRbnZq5Dl<LD<x~9o9WQ
zvj}g%F615yV~JB+4vhAC^tf|U?db|v%1g@})BL9IMR#S3S<h0}f9JyyC82>O><dF&
z`T8GEA1b$%1do-<B1#3rC&qbc$JvIOe#r9Mm2sYxAQy7Y+YGGFh8)^*4Vs^nGUXq4
zlh@`b?>(qUUZ_atc=5pQMJhr?2W#!jdO$Q+%kwL%7Al`dFm`F1*;f0@bHFaLUfM;F
z*kIYOuRQC_XYD}@{Yt8S7x8@3u4bUEh6uF2F@H(uJsX^BtKMCxLSB=T40%Y$8nusj
z`6HtG_gM}9!mGIBL6Dj`87J=B;r+`WltpJsxg7QK_VxGeRAhE6ZEnJfR;T<?xdy$^
zdnlU`?Z&?xYXNl^KwHmNU<TVHn4tW%xamQ2NL$-W{uXuXl^CioC6SyeF={P0#tyu)
zThwM+IN4egB3ob8w?33>4U}ucvOk<ex?;cO!`qu5GPXSVGtP6?_S*hs!=FpvEBPJv
z_XQX4n=xLs9^$TSxUewb;c_L9@2*iOl?VcxaOg28A)EEqcmhu7qDmNO&*{$Hxt3Na
zM|1o*S1HHgJV*7Ga=_5=KW&ootlx|%*8u7S*x94~{61slT5T>uenZFAV|v7SKgwai
zda2p*yw7zh=!S#p=N0<lp1$>N=6;pe58L}Ai5|w|{?NxmSI>u@sSGdLKTq5Z&tZ;^
z>LGVY43$7q7)A1)sVQIKG&phX9zumP<EXu{P4oOzA*(#-IoM7&(@77vgb<6&d5A*P
zz|W)nh*O&U^Kp`odB3@au+#5<K7Rj}^Zi|0E`Y{_nw9zUx#75|3C7L|n$F3p`TS3R
z;*VXGT4(P;d&qZOLL*3E2&8;QF-^Z7uRhQd<N@RBp%}!dvJ}&3y78LaqXzWASbB_R
zW6i(1j$L4>hl6;Q?>O16QF_Y@Y^nDV)LbTEzb3yesXhHPQQA2ln6psz2_1|Pdi|vJ
z_T$9|wu`qSQe{8IKSm^cGJv^ohL}8uop;mmfh5C=NmzOq^WB(yyG<rM=yBZ~0YI4&
z*UzEx%Y8Z|fK^)kGJ_~?fnhjf6t7yu9j@%0QDxVgIi2H=E*9mT)|Cs_)t1+_F3m=s
z#BUWF`PoNz7i(_b39;*82;wJ)m%NF=Q0lL)T<|iRxX^b<i9?rRPK6S^Ak(HEiE!Oj
zRva}4(3|@aRF_SJXs$Xf`baE?9B^$^E$_YJ*{^rnXSCk9SwWw&Qoos?`KGAw{h)R*
z3X%tA&&MU}yGAgB*oo1(a2qy4xaOA&*Dvdy5?!u4VP!ibk0n01D*u7dv*2JmE0$%^
z&9c$^oS(nLU`PCK=G!&nS5%280BuT9<_A)a%9VrL>tqVN+@3|EgDzs(Be02F258q;
zR=#5cEs0-U-$FOOVW0REyNFzBUla1MH5`U9Jq@XFI!btYlKlB3U2Eg1Ly}y~r~R8e
zMcw303%<3kRI^y+4xH#?kXRW`tlEt<QBT|sBi;d$IKJGDy!dEduUWs&QnW%nyuvdx
z8?g)D+l|^|hn@a#Cj5R%Xe>Me_CD>#LZ~>@6J?5f<ES|~96SY#wG#eutbuS@e&e+p
z=j2&@nkj#%(*#7MT?uVjrMTFryL2O+kH~+ta?V}-q=7y6%pX0Lt1ye>MkJ~wDZC(Z
ztObaBl!}!zFRZHUI+GNuW@{YUBQ7YFs^?yN)U$9W{aRO7zC{yFq*iN|TB!utU5%Ar
z_1udd+cj0;AI@Z5yp$T-7Lr{~>S7v_qkdE|S(hzt-<6_TzxD31TI6N*PhXGDA3IUE
z%5MADw3phy*)SMP6#eM;-A`06(xok+HS!OS9aF>MYJW1PR+@V2(FAw&^Bkrye@zkn
zHq|$U0bE&oI`{oXX=vJs94i&6bDCx+almx39VXQlr7x#^K{K6m=Ru~{(a2Cz-h1Ou
z9zZgYQlhsSLn%erS-AU6gWNTi;R>2J=)3G3RLl58eq63`C+Mx&cVBB*{F_}@2ruZ_
zuSwP)Dc46?L?5BuQ*~5rT+<L=huzaPc|wa*$#1L<DwaFQ)0*k<y2WPcOx=0UtiLn0
zYG6*Oa7CgE%H(MGB>UJS&rL3NJ>9eLzGuF-9m_@@$v<_KoT#pvL3XyhrUH(K+}Z!5
zuF~=Td~`%&cXE<*votNY)w3+?iqUSFAA;kmU{N?zwqrEHn@uZ~%{5j4_M*NY#`CW4
zvvvq|<2XwL#;7VU<9d?M%eJqh%g@rf5_7rbXN^9p=VXj77@xxH9#o-D>3LpHO@)iU
znsp*1`!(g9danyTrBq0#e@D4FTs=LtN&A4aYlfUVB*cAGz0X1RCR+GO@;BTE@3*(#
zTwX3RH7iE=m}%T{#T#^mr2ZhQ)rsTF7L6CE4j9<@LKQH`aXY1|yVXy}gntFPHmOn!
zx1i9v^f((5I`u6vk|cJ1yqC)%?nNrfO&?rUPW4?2Krz~yG>Gc!21-vF{f?I%x}rtX
zn8q{R<jmrHUYx9E<`I-if2w<nQl)XJo`NZH#|@(ORa?Pq{^oNHTBg3dqrIs+(q-@M
z%a`AUd6*i|s94_61|Zo@Wp%<COk4pykR=gf%_0lrN~@J+dwi@~%o2mK#3MLg#>X}Z
z!q$7C2=a#h<a4&kU%QuOw3O^^)q`%RFR_!#cTXJ{vuE{Z3L+1KE*w=i4FLcEooNpC
zoWg{H81;<jAD}n}F{Nu*K5TAUh1m{*$f8ff9gRPM=nv?aD(j=Wp6(f!BuE{t?@qAn
zlgBtJm*Hm`={wfxx{ILFk!EU6N4aDg+ma*^fIKb>O-#o=eE@Ee)AV<jHHF~@SnogZ
zYEJRhd%PabyGz2-auvQ@s9>~s3A1*wM=3*0o~gv;cG~<{ZTw$&b!R>8e!n{--(PqY
zn-~aRi=jNFV^U%66S4EaFmB`lbA($Un$oy26-s3`ksdL(SGdepg3ESyV4UC#AJxj?
zkYrInoN!veJ?ro>t_$<~;toAD#}C{*6w0Uq`Zp6mFJeUjqG<j?SBkF|WLjM=lx`AO
zSj;evCwGE;LN?Y=?6_2TM1ft_?OPH#1Ov(e>C19GqjO=}WGj&8@fZopZK!@GdHa@5
z!dxHEQ(t=SGT97iC<-QU-YZR3@&@Ywrf8nfV*zX?+rU9wHFo4$OD+)8UqJ<s;u3L!
z-l#-=Q1S%6+gt|Iv2(9J$U}iz>NCYv2fH%n+?6f8Bl={C$H*IPaFnFg23^#i<&94&
zeZ<K?lG9xs?&T^yNw%$wyXad=zc$L1KaRW#ka|XK=iq`MkYrGK%9uT2BXLmsE}SlA
zmCg6N#Zas0@Qnl<8z%X4$oMWRorsC9nQ@Du`rhP3!u1EdpWw{o)@LKhxlHyP*C-8!
zb|*uQFs0zc6^qh47Uz>CacI*-M3;7a6^#Ik2XxrF&+eU8KYeUl3&^IO-YU^zgM~}f
z+}gcjrs}Bjh2h;j(FY(6D($O4C;$Lr(zfUflBf#X^i+pM8Ygq@Q#JZXTpm@<Iecdp
zjsCPoDg@QoSp~dy9rGPz6Yscg!@`^4_eDZlC*h)+1(T;J`AjJ?dpsfpd^NRD9PMMD
zTC5a4k^e=fTUJWsMi2RCS^uxzoJ;7{>s)Pmf&isMg5CxZUhPi(`X;_W&4s$Rm5O7C
zVMWKO3;D7AR=$5IFw!y57Z8!OFBN%8vfTC4-DX$vy?(At+NG3V=WoRaK;Zx!L^wR+
zY8(c~SZ%c9r_HrgacF*E@8Y{@-OWWyDZ-bvMEf+koBeAhaQe{|vR^C%0Ga2p4{@su
zKfL>*>=XEPO$xOHsD}7ypQY4<ssqXI4g<Qi{ZVQjyjQikh{0~M+$jJr;lxg1tAHVE
z(Eam9jg@U7%l+rnTQZ!_N5g_4)a?hHVUJnEy`r<z2dKAI+7rh7Ue+Uj^>cp?9~$R9
zt$R$M_NtpW^>^3|_Ib?KFiTyb9Y3D<6il;=Cdd!9JTdbtz13HC@7JK-!@=QFL7F`?
z)D7aiH|bZzCywaHyagHurLHey_e8sFXBu8M5@U-B226<Avf{MdJaTqziaicxbuS6f
z*uMYx!t9v8(zSpmzC5fS$TNItDy^7HbmNHds*H1k)|Z2Tx9kf>#`+C3M0j;huc@__
zj88-?!!CAb=@QV~@{Ptbh*6R{rR2B6apqMEWRLRcN$*5%agyWE!t#lKc>GVl*VjXO
zKgX~SR({CjMD*+ErM4u@JB0bit3_>0#)S_YW)@90U|Bo#r*5ABZzm-`-cYcv9#K=L
zq&MSbW@0r;q&W&shIIDHziOS7jR=mb=_5?VV~40C3Nt@3>*i4wx1q|eK&x)H?ihS)
zV|!329VNmmSI^d`9j-})SHXJ}hC;}AO=t_O|4ZO)`H!7xzpa0<(%l@Vg7dx3(wlRE
zFPeej=l5uIB_?4jhXZotuLWTsSz+a>_w)~1bVIFpjFlJ9HOg%76Nz+g<V=*HQTE9I
zBkHES{MS!EXd@r=W_9pmNpm;ll2}q)`J{NySKr@D7bL=~#zc6vXeHiGf(WnLc<_HC
z4%~a7;D70fV(EKWZLRNnmPB|pkd#jKDJ|mu<#D7))Y^l0zFwB|-p;T;C(?I*4gS=Z
z?kJv`J$8aGp4@A=p?|M&g~}F6fXB!PhX_Oc1EOP~rqeTGlxXP3TFC5cYHK(&0-!^_
zLkIQJt#QMY;}Q2~uN?}<2%b0|8{9$#cxM8sB#S66Wk`=ENRd#QZBj}Vyg|VVRlaU0
z$u%e!n>Af{^kosPS+{)o1UZO4TEpE8(t}mDK^FuVd~5a<@`|%2xkEWk5uL&L89=2$
zMr$j>=-YrNva18la)?bj2~h0%idoPA_IC!!QyprLBD!LXlWL<SMR>HUO8kmUT&^C@
z8l5N~j~oAR+jpBIwH9IwKy<kXdvxo1laLr}lD=4@L*`-f(AL9p)Mpse)Cuxvo%^|o
z_b<B>)53K?NF6I1LgK3yD_aq_KScqQKsue*6vMN|XWe{iJJGkTZFyI{HJDN$J;}P(
zakUjG5jVY7&DeBg|FWx;t0@p7yV~sx14egl*nQeb{iI@#Z%J8C6si+ZPp&2N;-#C;
zgYMWs=gAoo4<*fyQ-6A;XKp5KRHP5Mr?pPghROVgT@5>=an~l{pNw((A9l5f!b*k;
zBui;mMB=<dw~vNW&1VqUGQj`XRY)<#6==rgVFtZwCN;g_oo9*hLTP_Q9;i;G-;@6j
zyUPBTU5#v?1cm)&S2Ki)NK~8utFFSK9HK;ZH5+xGPWjOTHFm;Zb`|`OT@8~74|B;z
z&qKRb{G>;2{$p1k_>KHyS0}u_o@Dcx;q%Qh?BGz{yJTwr7rUCmK9WXECPeJg>F&~n
zh!WY=91xO3`X9S`k64+p3yqMu?KN^!djeRsl3Pk4Q#Aq9mU$Q^12q$cB4sEcBM&p-
zf7#W`3|c=Ikmt=j@M?aoDnoKnJ{b52{2eTQ3)~SvR%iRDaUS|TfP{4Y(H+wK+uHdb
zMx<{~0I?HZr7Mt2GluG2I=>>)lK==GfNn&!;0u(NQWW(0Zr++<;nptQ((aRV_D7dc
z3cCrqMHkQortqyHJ%EkyBy^CH`w%jFzvyEYn7f-YRfvvQ+bRa2Te(Fe4F~1RfG2Co
zMn#KX5JT2ykw<Wlq)ZlbL@|4QCRD6=S+%52ln&tnV%?+TL=-fm>HWLq!3#GICV=7@
zMOu~OilXXAX2}--AqrqR#I=kRS%$VtW|pP3mPtV@xE9?l(oTAoiF@Lr{Y=P>GIIKv
z${@AIXs)ey`ArL^F=#m(-+iAXcNdqUn_|y3>WUop%BiMkoDY-3@}1NdfHSJku?XID
zGp2*?=TsIH??Nkf70bmB$%!26H`jdbqVnVg*jWZio7am$W^z4XMJ8qCTkI3+wilFj
zsn7Nto-6=W;e`C+y~=)bYAU13iUrsax{7!suW<&cIjiifWFI($=pkP;FTf-XtE&cR
zD=VwgYboFDRlldKnG~y;HmdpHUGp)iX1=m!arFO-V@147KP10h3+nZLJ|qV76n!;J
zNm?XYeOmeI&*-a*y;lUvTA+9>*tnL&r<MrZ{l7U@y&jN@OU2Ix*y9(khes)YQ$qf7
ztj2YMK6QNdOln1S;&1CD_v_Tmn1ugvtilC#(#iFbob`%t>ott)lnd&S?e&_*4f0eC
z$bx#5eS>jw9XF-{UDaSB-lz=)aYG3p<--OkPOzRi$WpxV8c}3jtg~MPIvO{)07$WB
zFSr+B;}lPPjc@BsQtxOthx#;!MK-^Lm+4`f@9j4$jx<M$w}kqnVbxmj1#v-<Ex4-Y
z1akHRz;kh#=4AWk)a3jcV5<hAH9MI$m#TT1ujnbKpSNi1W1r^2w+h@YZQ)ccmF;bJ
z>|3~NTVE}<)F9jH-?mm5b3U?f%dTqA<7{nt+afF8HjOJqAxSO0`F+egx~p2N{<Jrk
zGX);Dg;3R}QL)F{cW#BZf8gwl>1pp(Yx%t2(W%zezsR}T-m<aSahKuQs1JP>#xP$@
z;8`HYz+6{waaUJzS661$Ogo|NV|x?L6cBJueA3=S)p?=D@u$6u`f(Sf`u}0?zQUSX
z*S+B<1VRacfHbM0w;;VEBqS6OF)9j3FA6AV5KvG`NNCbTL`6l6bQBN}6%Ya>6p<D>
zDkw;A3W(C-3p(dqbJe}p`|bT+@4-IFHO`WZYb4J-?(y9JUv=J$FvrlV`3JQZmUB?5
z>@IpTw43!eUF*Z*>x-6Za~11$^lO;Yb1PLT`$8&Nx2j|8DHDq1hmd+M18R^xRa{uc
zSCIR5iS!RYAH_^aDV(s35~JrVa!iCZfPD<NxRpbybPFj=mX-2bLb7d@r{^i$A!MF;
zA!~=qQwB{g4oz+eBFaP5;|QtXsyu;F@Q4b>R-JF)7{>q(8utV)ND&_x;dqR*emB{K
zMm72RP!tU+oT?k+LMjrr8udf!&-zfMEb0GbEwMv&UWF}DmXg;6xf7A#Fo}zd$5{I#
z#4(gz{TCx(#ODjDQ!ViNrn@1H;DlGnLvL)W-zbHM#8|dIK(qvWXt|w0J!dJpsoz%G
z22a!DIB<`PWxzPMg#G9fxSkG-$*leDJd7{BEvvrqN_=a_Qv0j6R=NO7*=lV_=x9QS
zjecmC5U&1O*uD)6yA8hr9rcUF=_S&jHh48HZpdRK%UH=(L1yeXL@PI<^QLOYG^}Hw
zi`H-7@wvWzW?t}(Pgm{DN{S$rt*mQ*B8~kL=L@*>3WR$$IV)V1BR`$56xS(!gzF1?
z_X~$toQWb(-yXptnmV*C<u$FNwL=t|hl2LFWpb1TT95g0j@9)ZS?IMo0=`<;Z4$cM
zhHmfCc-W)8@W!sF=l*8T$oW1@4Ln)#uBLIn^%2E}<X+UV_^sr2#x8+4@d5t@@Nr|X
zzyNHPG!W#-wOTTuoY=op(j{_4vQnWCR1KGH>*E#fj~o^wipcCgFPS1Tczgu|7H739
zIe_l+m9K%VmWYMdiD^i^?^opr9CjF^vDo0iOGx(2Z6>SZ?^yl%UEKy_+u_j%yW9`<
zCMorvIryPIk?$@v;DHj)#W`5L8EhweK;ag46$$o3F~^K^)K2SCieRbRQtojd1TKBJ
z1qIg~k$j&xJaGgDmsFD)GYyBcrl+7|@r<IQ>d36nCa821w865_myB1p!S9MO`O$ZZ
zUmV(&8dn-&z94zhU$Y9y?o5x2#GdM~W91g$^i$Uk%o-x!9A!X(>G_cM%kOQEpGvM^
zz0EtqlJr@=_%nNo?t>oPNUSneg(H`yaFj>?xjSP)>F7fAr$iUF=Z_%(UV1z=)OA8d
zmi+lp@%Z5{f@gUk&2ya2aA;^*v<T3MjTf#T_NlcUGmGap*MMyynRTW)%{#_DlP0}I
zd928O!ew+bLv0<&VhZClDmUKuc%ry;Z2h4j@GM^OggHzScGl_5g@=5H5H8JfqH#&E
zgd{HfHrGbU02afwR5GwOC*-@`?=?Db6*}We9_T2X92^~A9RXwUyNv#s9BMgicORNv
zOPw&qF?keEttBGtmrXs9;8l`1#+cdcz=x>xcRxh9N0(<hx}eR5{I5pp+5FV6o`Q8|
zz`8%eZ22uS68U)L-ajUBW-7fe7=_RiN72>nS8+^v=&^9@^>Ne?qw0LtO;!*1`v&BZ
z%tZB7(y8#0eaezwT1mR$Bj7Wdvl^E;9e5MAV9m8$`_xqfv?BKD)$cRpnvY7K5|0=X
z$Yict5o-Ga+elu_x;fUgwgeho;&~kL_5xQc_6P~eakWMbaMo#wM2}#FZjlN;HGfGJ
zz0#1ue{WH~6*n+D!j%GN-9WDFkl4bLIlrkK7=tf@l-*(<?+Wm94O~#U!E<rw8x$c!
zRNEqPR?4w%kgw{WQ13PTQ8dL#Pf#^Hzz<kuPNcQPUG=%Zxks>GpcAYB1Q{?!I1b6B
z6RgRRmqsCpBj8**!HQ%t<K=w3$b6fg>x)wtRE9+<v(gFHJhPQFGHmvxF7S4|;g=;k
z!P+joeoGlP08{&!47`4uv@}Kw&Kp3JWUm@wuBMu87CZ~89*gcqvXoeIDTrMWSB8lo
zVD$9h?5}M)yZqA!)kOUu^9vty0iTw))$5Kg1&n?Jm9l4lV-n@!yq<ChJi3Ctv9tYR
zl+Q~0a;>K0H%(I{n2cjWH-vdV*OD36T6nd~j)g%0ev0u%1SY5`Car`duQPI|;M?k%
zwA$dqE2;tc2Of#ac})8(=fx*z80XgQ_x8Ya@?T+dBqJ)WCp@!A*%IIIPqfqu4_8PO
z%I*B5iOF^AD7@Fna?k#10>#o?rl(A~;j>avW4VxsWWcng)P_cXimADj<NnjBBQ@tS
zkK4wsOm>#3x1M`w_nDpq^zi)Mp{f_-AIqdKL_1c3HAl;gn7-~Wm^ggD)}oZ9>B;yr
zE*?kbDFyI$_nSuu=bdSZA7}1ahA$OcSG|<_s3S+U>{=2!{i@aS4(ox|&#eO$*ABBu
zRBB&nc@zY0zWGkXaU)>1ugJMM!*TQSm*GD+)~a}ZMiWyTCCLpnaS1P}Pwu##a}yu3
zV@6Vfch>e_KV%fX=1)}%1kZNx%URBJiaC?irPZ1CBg}8Kuv{X-9M$|l>B?a1sT&(F
zH=mL1rMjA9u>pQ>#SW2aCUOMJ;3t@HE9)mhn`$2twFu|L$DeGtdAB|K!JfHPX4<s>
zjZSz9LQYHME~-`R;GVy#&2fn+yBSCKR~5d_To;%T@NZ)g4DBksBPJwnUN6DA;bZWd
zzbf8vB%CDBoGS4+R<`DQlEE{B@T-ck7J|?Hnp=SOaZ@*>xh1D{O|&P<PaHL3(zHHi
zCjG+t_`bknoQ|j3nUi)qQtux<9<H^tptK8+iaka6c-l=kybM+H+J^;2I1*l_(>CCI
zUGv9V0y*E~q;s7&yAoIBi3_HOCL?@KTE_T+X!{?%{c-3}s>F1|boM$;%xx%^nT?<@
zddyI&G44!yQ+i~#SRhH|+aaCp0>xJKiWP1iQN?#2`+;2d<n%NK^wb=a&(`FSf{R%y
zWD(8kUvBvQ2#_36&R(agg?ik=oIJISx@}+@{-F#m7x^~Ng3zsKe&R$pSkLQmj7*hR
z){TCSKG!!R&5!&x4q0$YPF}YgFxuQy&OJTlmvtwojOFrcF86|UJ}KNc&-wd8r3f*8
z-%IyThZl+*(+^F?P6_Tx`fL!|L*U(|d3mI2{jW7$HCz{lH)i_8jNPtlFDM>p%QSrT
zsKMqFu-Q=&@@YsK{Ro?oCigLH>t^X;LS4(}jB5&4(%`Y3>EBfMKkP6T3oR2cd(_%e
z*XzD)EE;^&INd4p5f;`G1C#u0S2dI8dMB{@-nL!tS;9v7*R{!^zK@>S&9b#2-#X2V
zLcfV!^Zlq;jFS|@729UsdHeL^M!zEB`G%6)9lSB(ed9w*j|lcB;w)nfr|Ljqg+kah
zO8xR^G{WIA*QMuo%3eOdp5sH2vD`4`8yb&RP99}f3hw4E#_4gS)Dz_`?tTt%*OIFk
z6}1WeH01`2LO8VXDD2KRXJ|Al!#`43%%mO~4&k|9cFnM1*V2UUpp#7zbesNW6IJ5n
zgX`;Pd2^pbl6BxbAAwPJPyA8Ttd!{Ig&EONW5NTDNXC<}IJK|wVr>aD!+W6@_M2lM
zI_FrTHfTV$03GyVL!P0jR`<;tkseag_h4ZfMesWfRtAxokn-Rd%VUBgr(xZ2f<v)E
zZa@NRBf^3>PQ9%i{5Ei7sU^sDIpt9Uhob9c{m5x6{Z<ljF5pmdaI%_M&$rCE^zQ}N
z(u?8MD>syMZ?m4Lu)5D05Tm|5n)J0kLHQP=r%t1;)ulVnL!3!O(P9#6ku(npd?0me
zX9TQ`RKK+>F}15XJp&e<$>rW;&(OVs*19UFs4+I^DacfXjn?XY%o*in{5gWMB-NZg
z3qNxOw||dg%@SksHaF2bo^q!*Th_$;e>v9WI|J2ICKs>vy>|NXa-imG)Wwhqedmq-
z0rG0&#jx+Mop*i=)b29j@Jt5uTjjwzW>Xx2x7r1)Jy_2fjf<2vaAmU@r0_T4qBW~s
zIj#&+#lU{CCI)WYcLy6}P5t6dR=e@N8f;XK_DeWp;4U~Y*reU$mlRm-F1k9{Yy`fP
z9A)4k!T;`!+5d8^hByNM&<L|x5QUeFi`E_*<&6249IMy=6^>OC%JRSX>I<jq$iKl?
zW8;#3;j4p5_Ft2ZoV{W3Cw$c^BxMg@{VA^=r^~CUsj0v4)&C=T_3SX|a_QqcnVEa?
zDlyyVV|K_tkyiu%TjbS@e<`o#)uuhGegF6J>azw?Lqo%C<I~l~?6RipcTJV$Z}R5e
zJfpVszI<CS{I+`j?eo>QPpjIBM%(Ltw3oGZ^nU56tm!PR@A?n$)xVKf-+vgU4K*(h
zwe=3q4-b!ae|)>~v32EBSN~|o_tD<>W8dD7_kJ4xIyo`9Inn=la$$OM^2g-+k5hwN
zQ-c#TOB*vEKhF-&&d#pRj!w>xuFsFne4SYTIz78MwY@mCusplDJiqk6`0C;R7+=l)
zJABpc{~o?7{`dImnZMwxxqpwZmi>XRdjAPujsFc__5SwupW>^Yf(+ij@Kw^E@zt6=
ze6{o^zMA?IU*#0K_Y+?|`v<;S&3*IV!&lRoe#cjJ_wdy^I=%|q!&l$^6MQwZWQlnX
zUya|xSD{iA*s_^kK9b?6jE^N9Urjc!ESDRVqx_DqBKPps%uJ0veARysUrmy58~lZ@
zY6&Ip;j7_);H$~8neAd%t^b0ro&^1lukQODUwx0<!&i}nw~9W1Ax^2}U-;^+CWzbL
z;j8g<d{v4~s%vl$U-kTnukJACK12SFuindc{S9AD{taI(`vYGckjgKoVrAm~z*jT(
z@Kw9DtXTZ}{~TZ4a{XI;75>-w>hxdm)ot<L@zqGnJ$$u<j;~7nyZEZfzra^fe}%91
z{RLl5#{LOkmG}qv>iho&e3k#t_-ff6zKUjd`!l|p`}g>&@h^Ne`LFTSCEh>btCt6v
z|AMcY{MY!Zlj}dlSLZnYIlj8Ehp(dlGkg{HpWv%L{}sMU`?v7b8&>}%zG^J-AK|N4
zVgEPr)%SmguO=PZ!&jsK-@{j*{)VrPi~Se)s)PdjnSUQ&?fHeTy8Sodt3cM@@l~1n
ze~GW&rQ@p%|24i!`a68J>^FRs_|Ndw!N1_EYX1OV{iOIe`07^uU*W4)f8wi=8b9&X
zW~uxFslVW>H?3m-yYSVUzu~LNI7YjFh_BxKYkW18)oz5*?kB$L{R>~c`TrYVz4;e>
z_3|$Ke;i-U|M&3K%)h}`lm7}|z4vE)75+QE`i*%HU&a0(;;VLl##f*H#8=<{GkkT0
z`5)k`Ys`O(uY!KZR~!BsUseA*d{y^1d^HaadkY6~bOGX#uy_(+-y)FVC%zh@!Zk=@
zhyBD?FaJw?^;z=o`0A~H3tx@<iLb`}x8SQjzwp&_{~o@2?l1Uio(q5h2>b{5Djo`o
zfCBK)KjW)se&MTJKk?O;zs6Uw{{UYN{}aA?nf71et115oU%mgY@YOv0Z}@8bANXn=
z^H-ODg0GhR#8*py$5*lcgZOIZ-{7kZ{|H|VW@CUchx~!B#{bXZtM>mAUp@CbzAE^i
z;H$WQjIa9r3w#y!|2V#i{~cdd`=|Kot$&TLCj5r4CjWu27DC_uGki6j$&QY%rn6eL
z{f@5&{d@Ro#_#y5U9yE69bc{6!&m8|<1c)*&xNi#GGXfeHNFZPbAgVKUUK_!_Sdy#
zZM9!I_SW2o%?#c)Sz@YAVnNk`)eJyUBORS2hF}CZADL>T!V1V?c?M`Ow`@B+WG1T)
z_8nmkBXMxu<TQ1Gr6O55Q0$D`OldS&0h0Euglmk%`klu84bU!rlXD#j8!KV&OMr<V
z?1qkZ!Iip44C*(3qO3kH9p_irCU>zcc5tdjBC{E+^V^?QRyxY63Z|p1EOeB0q@5E8
z;TneZ*Rk*_!McSx9kV!Fg!dd!y7BpCgkuNGxenu;UF`Z!;uxc8dieH>6&1E1`o(~d
zVHfU=683&TH`S#Ztjck10e0o#0BCd|q^5iGT7&Y#2G!7p^8pQ7?LEpNJu<k4>G7VL
zw!xqg>5sHdj4#JC8b|+Kn7I<HAIYBJ0(}I4FpNSHV5|*rSk(w~LJ2#|0>@1l>pG1S
zq6B5A=S+3^aI++JE18X0!p;cn<52B88Or&B#F~R0SS3Lo;aO90bfc9G8_Mzx0C|CB
zySYn(T-j#5uhKoVFg)^*ldLj)Gr5bs3ra<@FV(e!x}e`^oL``yc9J>6=w>OlE^HXO
zmCQNf0v%T2c-9X40*CfvIk#Y(UsO1TvF%^5Yz4I5t>lrBy0&fu4q*<C@A%QSHqKcW
zsFWc`n*ryr3v`Us$8%v6{_%r2l%vwOf1s@|S|s^%LPLCL$8ComZKclVB!-L;sKOYl
zQb2<evZoIQ#mz$%T-eedHoWatHhb8+1ArW^V=;&ANw7ER5^NpI{SnTbMW%kb1dFG+
z;~>FUHoC|jGcvjE%Xt3d<PMG{%mwOB$6zCdjvwh`@Pqi1AP|w^FcO5ko6NlA0`;t8
zq2gGUa4f!9$P3c+(g-BXWh}*NCeDyO7zb&ffiD%o`eCf40LWM}ClNcap~CV7JDW%T
zT&e<&NoJ#taE`%Pu{G>tBh0DE%xNmjS{bl`BG&s@$OsIQy2zSJf_%Zx5V4Sc70&*V
zA>Lu=eHd#3lJ!1*puf1V9{|ZwVJUGLE~uODgf4VjEqvOUOmmrEbcEalu%%)l7emK7
z)5iXgVB>H-ze%w0Jqgwg@JoX2-IHMLCK!N_1QibZUlJ_5zeHuy20rNTH1PHSEC)Wt
za%4G`&cFiLs$8ac#roKH9}hA3u@GU99AsY@7P3K`i#KGJ`Plv<gY!!=vm2Bn+38yW
za>X>9rG(VyuQJQ}7~)QXj9}Z}b#S(hFs~!Op9<&PhC_X63xOi@WEg7<4QgM)js-yc
z0UT^yoUdT4!y}MX(tH?_y#UGDufk5mv5=FY>vcnE@cwQUmYXBYF^jBK$hAwp!#N|&
z)RN)6P)HhWHC$|s=nRQ6>dzsujsW`lGFIPSpsi(my&ZD#1~=4BxbwlohQenJA7Pu5
zB<Qo+@h%u+B4UYM^}S8fY#3>&pEj}MGB4;nz);$|qp~V<W0|#P>!u2)DV7fLLL|OU
zsdG+W>0oKt#Z9i$z~04>izU<V!>3wtqo!Xu&7aLoIj@*}g{-TvXC{rTSh3>1a(L39
z#1RO6-^F*jy1un8RPIBn)k?Tf-`(q*L{?hj2-LS-8mT#+vsJl?nK^+7Z<UC6%?vr!
zc;^1l`mG<{w(^cI0-~&SOCG&2f3aLZwN{jp36wr6YFT+HJ=b-o(6#&IZ1#(zV+gC9
z(|xli3+-N9n0VheXH(+Zm?UlAKW|s=-B*0(L;r$(h2KO5uQ<g)Qz+OsZS2E<@+VJ)
z9S)g!?RcjXA)eP`a|08s!)2P+mtKu$+ze_>z%EZUcODF1U*5kzNU^&v0c3X9u%^+*
zE0EdM_5JR-cFxk^ooJKOXMOJ(THX(UZhY<#%o+l5DveDY=(NDSLMdO|sm@Y1YJA=w
z@3{cW3ENRw*S+=N^_9gPf%b7TmF^0^{yOOA)u>MmPuE>SyP2)_<sXmkx{(sJ(i5A1
zKU@CHJ=@ru*K==g%|vtCBK4o#3AWJn5C$E4(jtOAH|n|HBKFW3nSA(z^Co=u0ZS$V
z?x}vJg6GSZOobf{Bw{I7#}x&|h{E%{231#m;4O0Ylt<<XULd}=U+%eISCs3D(FnIh
zC%z3U_Go|PN0&(<kCL;GJoS@vjnoZuxgN=7y9|^~nUK5ZnSL6HJ`PVn`kNhza~XY}
zdadg5^VD74&n<87TD$2orbaYX8sCZ#2;?~)UZQ@e0Hqekl#ZT#eIxT}wre)e5yL|>
z))r2!E6Jzt0Dboxxg0Y?fko1<pR)f7Ji~6`W_MQDmP7sw%#?AN>69J%$w`s05LYQ)
zwr1U91^JhHFWX;u{r!hMj>>z*;ZiLntGLQ380^SJu$6^eeiR%vjOf1?F&rr4dL<=r
z@S*EN|E}9HPgS!k%{mK~4^<p2T^XMmIo?stCVXDuWyR++*`*b);`M*5(Z`Kuic+<r
zT`Lq)9#=5185sg6Zb_d8=Rj}UUA}iy+PWWeONnIb#%|g~V`Mvm=eY62&uu*$DrMUg
z=`HtuP43RF`Agf+>__s+pX1OHOVsnGU|r1l;=5X(=T%j7F%w#oEH7uDK2P$PE0ur8
zz*>BGDeKEo*n!oHbs+u_90j7iwO9&w)fNmMJV<$@F?d^6@N&=MlvBX=J^o>vt)&66
z#-4@QWGxFDzXQ$|;c8E{IxcSq4*tYfoo|#V$ekMqy)y8<z=Hqd9=`g~2(=Y7e#<5-
zc=ExOopoQ$C7-LaPhag^oqwKZSotKRU}E#@DkwZ;xm7zn<Y`lj*LH%T>u%`U*xm53
zjXCE}g45py!oznqS9ik!U@T&L@c{rDgk+S#MnF7VKq71Oy=(LY(`*+er63ghSu9a#
z++~;fAiYBwjg6F)a%DXdWXzL`jZ*Y*g*dJm3p8P))w5lpzCmc=No<V%xGQJq8X68h
z7K@g0<4O#|NXZ<#e%Qlp-@`SGoawQ+6WMOOML{Nrv&Z7?$KCjA)=X5Qk0rQEx$kce
zGJO{70^Y$gzIN);2{@PpP013j8XUPHS#sE4!b@CC+lJr7fy42<kL1*dEx&HJs=wlj
z<ZFiOx|(HOi7`AV38qtKhMC81Jz%$SY~w1avUGEt{>)WPlUBZZPm*O`&CGE_jv@3h
zgmV%<&Td%w>{x$J>e7ZJ1l>|>*S~ycnp^ty<>0q;qV-;D!%f+!6-!D*_ub18XEnEX
zC64gw_1y1okWsH$Z|C#&f6zI9mW{q;LHzc&$SF+Tjb2u(pr#W_>Lq9Nd+r@FJ>HXn
zy6VaLuClX!<wOQZTFw?Am<=~biqhB1zrkIF71b<P;Z*W6QF_m7-gZ1QGI-SV+PLuz
zzR65U>4K9x@?8kqq$uw<#^$>z-M3%%=7dIgAM!ojeM`%lB-K`6wd8FT+7XbaEj_D!
zjg9s=ZZY3{Tb}K1RcAKe$tMp&&go~dQJ$QBQ835;<nS}SlO-ujyct1_iVk{jZSIfl
zS2sCt*!Q;oS@g+b*J>NS{`WLQn~PYN7dyn6D>1aKu9!R2)M@p-4eyR-3DMWf_50g_
z-AdCtx0YFk*)`5}+QzxKs1#<oaI(E^uPS-2HZ1EUeeE=lDTq7R!{)r>=IOyEI=&j{
zd-$tfM_c!)SFh>#YUrl@2>8{3yC$9&qOLiN%h*)5-kvZ_Y;~9>Uj}=dgWQf?bG#6B
zpz6cz1%>^Pc0>^2#gO#H;P$x>aHIsw*`i6sG61Vcx()eT&a(r3txjH5{N(QwU)bRh
zj({;a!NNvRnCDd&azl4nXTli_*Om*5nU4A5^1S+y85dShTPjPginnZGEA-mR{#z`A
z?8ZVaJhgH+=AcV<Hu4OheUpu-3g39&5cdGXtOm`bvyKJ{?r`QxGri(g_8?)b7-V;y
z)M+~*cw)<gPrf+A!cgwI(fTmik|G?OsCv7m&_m``0Joz|_Z{!8Ga5u)7B`u1i08OT
zjj5p9yHS@Oeqv}o(ERRxmIIE^x0WC|XGaqkm3D`0PN8JqH${=>9w!z~`*oZL_rLJZ
z>CDvmY%F-+vVTJHtgzRS7`<%C18Smb54?}%UCqiql~wTI={ZO|zT-}Apq)hC8C&%r
z@H5&#vH$jYE^7S10>kCfy9l39*TF$z*IkSA+w&zuklxm?r@FW!zCLDxD(@yQUwbv|
zTU*%LLX){-Q^s~7AkThy?(FKp*6lAv>92>s<zA^-csN@@*?hN5ewE>PjOb{)53&p5
zG;zMHibG(jS$C&_dSa?LJ(4;P7qhkm%#{P-kol>p;}zMv{cGa2bpc)g9>n0(4zY#<
zpi`~V3NRp`BJ<%{QiZb%4B(saoS7F3V5Hd*ncK?2YW&>ooasQ$v@9?H3*a-(m`l1=
z-3<@FnoLDSfW3qtvbzL38*_cTEb&l<?V=|%#L$ZLdPNA3UwNa!u;-ON2n?tQ>N61u
zEEu>qd%4z+jS(48>p-8-(5ciFRgFSMQk5NcTL*xh{GK#}DX=zizwzTB|LTXz%|Q*4
z<rk71Lp}<pPaW2QMKIZ~HO_~Q8cdq)#!|9}dC#U*>*k}F5j@q(FQ<1Yf=Q!yk(Tw#
zp?23kT+0sj-!fjEWHG5j-`p@ui<qBOIXEkHl$lkkMp;-6Il7+VRXw%ca&31fdf-50
zt(PPS5Q_%_787xW;XnXg@Z6vT)#`jyKJRk1rNxO6U`v-@0qTPwP8|T#B7id==s!&W
z!SIaJ@kju^a}3XBZpZ|~gIMrYC#s&SGur?Fd1DYx5`OR+J_iH<C0Amx_#GmU?8U&#
z17OJ4hmwrIK}I=a000TVG(@DRAQ`QZ;6fntG=$9@=uZN0lK=o1p7~9s^P4(o;p@XH
z0AQLC$0Fn$3}38hgn}3?p;ebbXx3}=&t^!*0e68ky?dZKq>CXCYfP>)dIr)b|3qNN
zL4cLli~yIqE`4zHF9cQqMMq#+<{`{90C|w<rM)pTDH>M+V4aTd`#@&G8hFC%1|fBm
z-;6ETD?|Z!Ga8zk_B#T*h$h4J5w?1qNK6-`T2uvt3DA?o7)u9G*x?wqY|P<?hAz4R
z`$l*Crva-jtf4B51}IX!LP|~q93;~X*tK|w7oJQvU@K~sJq!&RbO7cUggJ80fQ2WV
zb!ae6Kmk~E1O%Fo_TnR6qmFDL{eKy-G}FGrXtH_bQ69`M1D1$sCj2yDdnL)chgS5M
zq$s#vL-Lvl+1%Kotul%|GGxdMfHW&Q-$X}X&-Xs}&Tg73Yr2yzzrXMxnWdpNsDWIe
zd&#HTKV6@L#e&02hXc@DA8Tg10`X0IlS4;f0S#<03pxUuw9?%66M;oZC6tfFo3W$R
zr{ftN^x8le_!d(w9f3`&{`@UI{3)=)8Z-XQoNmCnWK%yAEehxcY+CbK%ZT9gL(10<
zr5PyQ<FUN4p*Q#q!WxUOr5mtFiew@6Qm+x2ZosY`tfd>U`R27F0I#k1?DEPz0~V{}
zOE+LgES@rAI01O)>6^vuC~<niVnU-}U0Wj~vaSaVNGI%)0Vd+WBeiq{b|jv)`Y>6J
z-0N_p);!`(h{cO72-~1>gK%4sf~A*!+gxhC?iM75vBD8xuE)~g3_#`;qUi{1yM`GZ
zfldDdfdyFYA+Rh_?ktR%bOhF=vt&G8f`vAifT0hs>+K=1_`@`?o-J(;fn6li5m@uo
zBjCX(EZu-DsRcWN>_<@cBrs^O6X^oj7ZNFoGqf9zXSQv^#!^LrSfELB4Apo-Bj%+K
zjX4qPk7P9ZX~525uv7C^;*ypN>55;hkK<EN@FB}px&e!=K4D4Y!PN*e;%OSqj3P9w
z7oIT`&s81CY>wRprggjHD*^KmKu8a{0@b+{EyTEoz#g&0ij2oEJG5aL_Yl}j|LE^@
z1eR2B7>C+`&|iB*3u}<{UvgBvsCN&eh}k*3E**hQE(BCF0^sF6jO{08$53<xww;c^
z=40d>yXSqnZ_GWhsZrfSV7)pG%8fqzGd&o}bsRZas{{Tz7VjKna6S{<xxxigL5cfC
zJJStV+kSHcn$wF@uX_7Lbx+j}G7;vv&TPj!!_6@j00t60nO0Ti_Q{f~-2o<f7gZ=R
z*4j2fjQny<PktJ(4j}_Ddz;I*6|Q`@xxTMIU@n4T5zi4)WhQruusvW4wXMnO+l?u*
zjjtI5fo!kW6ht)I-q^M!^bIC9%EvL;-F;8oLtv*($#eu3`%WIJ#v1evjI;G(05UU`
zUF_{|wS329iw(%!LtyiMBCui(ZNDS1OmqbHJRO0J?XRLEu*g%lCh}rM?9>qNiiYL(
z5Li+z?k56^=TW00us{~9_#yoCN<1?RU{YR6H((#o4OqDkkP=zC0n3u0la_^2rW>$w
z_6(%ng91psp{T~jezFddSD02Zar)WAzSbxeIsj|AW%=TJS+&VPy$-(e%t2&LY4r;`
zBPM*UNghvKPt`TXvOp%!pvc&3?LPrn(5{U@ooTv0D0ztdOMsmoXs^jFZg-fU9sH90
zy8ufAi#1f4dG+Cc7hvx!40R5ZY2Uf%0_?0KKKl;=mR9pifL&2P1+8#q&97dah^Gs%
znL>`QdVdPAZ~7cnh8?|J#(oO0!*l_5&43QT#{L3e;U8NQ@Yj9<uotqU*XRJOSLYr8
z8}tG1&t&5PXjSSQn25(F<2OSAWB!Lhw)JGWPQR6S$P4RdA;yXR^`n7I8FT=);=>*Q
zYx_}@%WkSjZo0-Q1zkthJZ8vi&GgWiH=tII<9O#bM3k<RijJZ{SO7wUnS0S~RUbeX
zVEI$+fwt{*0amfSj?Gr@FkOJ9=`mc;U7d4fzYVB|;xU(_*litvq+=ah4!$bGzXaHW
zqGR>u^{?mxEbRkOW1I<F@m&(n+-q-BXUt^lAeb{sRyoGfhP)%4pxu9>pGsi{82l1o
z%RnCNP$r8$`#k{Gc0zdq!es6w|D{yn<#R<-OD!jmXbs~5rxqj+09rwVkfO0FcvTr^
zb;D1hb^svmEsj>9&4D?Gv)2PeglZZv2sA_5vG#)?qaPM$wPH|{Qvmabi_;A33lXLV
z=<5rfC)W^@d(3xwRC|SP@p|q0djWv9g9rQ0@)pt$^uV-e9KKSJM0}NKUK2=PpUgc2
z&lvZA=<0b-PJYv?8FNt1gPUZbZS?`fa+rB~6cp6{s>WFC$7C(uQ{uuTne^FHG~bKQ
z5{mU;$_JiP=^AY}cI^OIoHfKvLj1sv8VA^GiF7)<R=We6a-Oh0XOBp*>~ZW5(PCyE
zoI>qPf<_<_9oQZbcDA5#a?qHP!z8wjAZvhU4(Y13trCrOJjn}?_0VmL1f;Zn>N|L*
zhZjGl!F*eb*%#@?{)4MBaBw5A7UH8DCxe$CoZ$<z*ZRn$riqskO*mnBHtRyp<dNAo
zr_a?R2q!t}VlU%&ond$gY!XuEK_(634!9Tdanl9ZRk{EhG`2+-U`a%FjRv{^YpLPr
z<2%QMKVR{}2f$K=Z@`i(&d>JFna__pUbX~8Qf9;G7v~$z*kLoe0E^e1%BBmj0Dq^p
z7fr^@USDa|^Ii1kT0D435q7Op=#e>B&FYgfT7V8l{EUbb9e`zCS*WcTuuJlNm%Fe8
z`p_N-77S(NZ(!*EvheALZ+$M<6IcKFfHPUgU5u6a+*z{lJa8)PErSZ+ob5chq5>%8
z=BZ;MJ#P7>*!-rUl?|zv{mfX)SYLH+7ty*$r<#!=sL?!NCMW))b@s)eu;GCffLdUc
zcK?T6zT66&ZCfij65kUoKkfQ7uqj~v)B~*;_K>5*xzUF^Oo-~p>hDKq)rq1%$jmJG
z)g<5SA2?ju!ug>ndU*%+!ZM_JfBdoV<T6U@R6YEQgWT3}QEPey_Nks0O|N{juOZcg
z+?kRAh)9&8ES~6ewp9kefTLG_0QN!RD-k4y*8_+HuplGd>nLD2ePwb?qqh!K@W4O{
zQ`)CHhd;oznA6+=oUs6)&Poy^;J~A=W=)jbP<xwLM^Ks(?+}xEkUg{x4^nx%9BFK>
z(ay36@P9Z5&z^s8-@=|B0SU4{=Y?ki00rPZkinV!otkQ22DueH`{2?HXm(e}`6I?A
z;G)}#S3vZSeGVXa#DN67Z5tlT0^q1%?9s$a!0-TUMaRNu<#+s1K0wk|{8OrN;1zdX
zjfo<u<B6Vj>Lp`|S4=^209KM$(RsXR$K`}MS0<hHx0jjxcV>tNSCLTw2J_>dB>M7M
z&x~F4{rV%9Bg%w#h!J4y>tzIb19+ura^DDWXP<YDb_{axLj6H}nlyXbYkZ5kpG8z%
zJQYAMkYy9_S_j+jI-Qv457M|C#b~R`;pr5|sS;mn>WhoQ#s-noLR!W0E|x@L;jgv7
z0EtQmZE&{sizkWh!?h&vUDKgH{uFmy)XWDN8{{dQk#{YtBel5b-FN&cj`{A~$-2H3
zk;sZ_@>-M`3uE_@?RU)vdiXY~?^agELNmWDEGA62b*ae+JjEY);}ZVWu*KY?wVA2x
zH?MZi-6yoa3_Dlne|Ne1qHoBOSojfz@NaZ{)$IA&-Cgy}-OW9GmBs&ee3dAHSvx<y
zDBcjuEqlDsYe}LhK~VeB{PdFKpYc^yQLZHg@wPNI&+bC+Z!#U}dRLa`XTHhOe&MUB
zQ;J+>r~V3GebS^MAtSOd`(1JH4}6svgh5hfe<%%AT$-ZetJ?0}2=CS9g}GJbkvami
zEc@r(<pV$Q)eG}!PpYFFSWoQXtCMZ_Yh-xEzp75tGU@m#RC^}D^MTFt3kw^X^JVHB
z4~l&^wZ70t#5&T1H?<c>C^65zR9kB=kH5XE9#eP{!)Nd;<Jj-`s{hw7+xlyZpPO&d
z`=|yRE3*U7FMi!QxV839_KaOnweC-R_3mJ>I3CER1CL-541yC_6)NCFsNNbplFLFz
zJnA=mwL(0Gjod93D;}pK;k{hV(88sjUm+2%^b21VaECw&RI(B@<7f;?2RGIvlTmEC
z*~x%q^YJ*n`}jS4b$$Gnsa}Cp>dB5YQ+ug%mC|<|ukIEc^9&mINMq>=3BGMmy?*DG
zpQoOz@kR4@Q!)<&-v`TP95s24g=ydPKAVBfVa-eP>Dcdeg4ltTv+|Xo<Eu9<PETb>
ztQ_ijbW4k=#W<lKbN0^t%!UG%47Vz5e&&-Zg{MV#bnIbI8dD3N%AUMBQ*fsLba#<f
zSCwK(J)8dgiRHFCf|m3FRJl@d6aT`(=LZ^mo{JoWc$T+V*(<#ozPhP|SuT$(L?sbE
z+$_bBQ<MFAGp-%0QZJ0hzW%z0ucjze<?2pO#&?ldL^qz90L8|Y>sb}6apB-qeHAK?
z{JB}Gg$Y9SB9CN<YO}~S;nQ_O;q$P9jQ-~SH(a-OEom(Uxm#*&s_rHV_f}hmu%35!
z6#P3F7DCi%D2Ok2K^4bBXVLThA_3hWM7K41k2$CI#$fZFroKix*A(_TUfT{F@a}-W
z7<73Ms`XwaobU2`-`Cq(Lw>CXwTA;gglc~bo~zOR6uP;sJrV&i)ESKu3e)*~U6HIa
zmZ-m@Gk){1q3*<O`!L<fd*{izQxC80=uSV5H`JTSc@U;ITkw>uH&^s}M{mBg)lh%o
z#fLEcFO_p-`jFV>j{agj#K>T&QRsgTUoDB?2!S(7%GI+TFCp+%!@=tL_0UTtMA0oc
z3tEoCl~NKZV<66UBA>!rRuXj}M4a7Sj=I0QBwDLloWnn#DzaP>W4I*_Bg!?1bC<@N
z8c1;8%5RWXE4^+NBEgd-*C>CyH11Tj1mE-gMx{%o@lIP30#vys)s)hNvj&oaJ^4+V
zWu=K1LL`O9<eGK6OOq~FONxHWZ$7wOdLwL05)P7ogW@hrj<&Sb)<9i9Z9A5nG~R76
zISR9IsAsuT?jd9`nrv=Zc56+%i9Z1lb==mS-PG1tNZ=ToX?lH1*dnv!F3BZQtB!K(
zWpARsf_J2<tz@cyMU>I!F7t49YHC<=^nqt8ZT4!<HHZ}+^6y<Dbu~OV4y#ajIk+rO
zC@iO>ddcXReY2Ddaos;YA8nK!d`QxZBG!+m@KrrN>>K?&BPk+ETHcT4@&+}1PRbMg
zBRJl`w(KD<kXdJW2^OiaA~6eyF%;zHbVH1Zvb>NrRp-8OisHt8SRmR+V(IAN%v%Dc
z0*o?m<Xhsbm-lfTV?Ly+#w>~F5jHOwS3<nIk+57Yv9w6kEMAO?UUSRFCVOb-vc}su
zVfL9063`Y)y$N1!9ElB60<p(#=#D?mbGjX?Zz0~PYJN$ys#;2O8@QV!Jzg)EUHwJ}
z!I~7EcKp`PB9pX*s!jM1h>r>fOBbrL+g4Bo)enLYYry!^+?vm>EzCKCHc#3UD5<8l
zO#-A6n_#Ch=ohcp0}077wl3WJ_(pS$hFn`ZH(Vc9Eizj^*6ne{x;<Q_6&Rhq)-ur4
zpK|%(ytwM?j-ze8<xoFngv8R3m~87ub3RlxxfC{^4fiVF={&h2uG4ahk}rwyd7t6>
z*jt3Lm!{J(x{pbY$1V?~eA-6fI14&D_`cs>%5M~(q(vKG7_z@Dddcqw4_|K}X6GhE
z8KrMTHJ-jCTv}wN={?Jd6{s(tT!<m;_hDqV=cX(LddLk_GM?Wxe-14Zp5Z$^6O+2*
zpU-o1(lQap8Q#nHz^1}a+ifoSomB-Tq|ZC?VuHI!xIlwsJ5|TZpgZumF~4ucjI^V{
z&Gge{Pj^&i0(oC2{5as+%$-{j6&QCW-0NPeiPp0D-BF0NvRx`M-$cIH`;h$MhHCB~
zW`+pen0rZ&#Z(q9MWWay#U5#Q_KZJ&bToJp9hS+H6s95F#C5~3+O@@3pvg`X7;mOd
zktlLB#t6A3Dow9H5C5TNo+CK<t?E{9kH(8k{`NMdaUfr5U1Zoc?D`pe7EksIDQ*Xa
zlxvZCQVn-r94vBekuKEXeUKX|KLv;CK3abDhWyeZb@;4T7{l({z9y}TW0?!S@!kAZ
zHB#2pqAxd-gF3&2t!5m2FmhPJHD`|e>V$^hk*l9yf3oyz*4a{8jM!H_0ybJJ-l)G3
zv*@13YZrw60(6bF!Hl}(RA3NEi)M!Y&!{Sd7m^fCNeo5o5nR4S=~A>RGP3dT^a_TI
z1IJbnKMCz-9ZLLgdhK{NPnQUlx2cQs(bMz^jzi}}L%QBiTVN((OCZw49kVdRDBBK=
znY;LKf|AO$rkp{FFbQ@;Iba`asLX4lrloN$MhCI`cn0a0E-TSeeVh|DOnTeM_F$jK
zcbo@}rAQ>!P}o?ma|QF@UDEXsb~jdgKtao6cu)cLSoXW!wIC(>w5KinanB21w3I3N
zyqv>hzRb=AUYF9S$NhwHiHFxBOAD?)EH+4kubRoptA0G4AemaC^0j!$F793xNZ3>d
z;~R<!)>e4HT~rgJkuVZ-d?>9+NXGwdZSt9vsbKal4TAnMU|PD4OfPwIxX5<b`pzvw
z=(jvJk9WpU8rjgpa*c+8qrKIl;p-QwDco?B4ev=&F9PuNr-X+YKU|%qcm@RoNHPsX
zO-;u2gBYa*R9)aBqx5=g<H=1Fkm>lXt>HU<ej<#gsX-<LAj7TQ(yqz~>w~d;YQY&?
za;Xd#oLjbs)!OR!Pow9K5l+;LS|*|t=1=6U1G&?8KP^mToai&Yus=e1=nhKSc_@*1
z$eW^s1VUbt1RHttH5m~OJp%c}?<T!aHIn|x?y;r5pwN2$RA)r~3DLH}@<X2%5+j5J
zfs$>ub1ec!Ot&=TMei-#@^TgCCm%xxHY6OxlpexJ=wT#{KcfvKB#k4RL?mR+X3AWU
zkiDEK8zvzaooTT`H5>sMz9AZvQ}tLPwS%adNRWmUNM(gVMGAy)qH30BBFoYGZ;0|=
zh}7#6q6<WWG^%2Ugkmy-tOfzT5+N8F!Dk)8Z8-+B9@995;-x!-ktl)udXXWN*h&Ok
z%2-mvSUS~RLc?7wBumghQo~eI^VAs3VRuaHY8E_AQoe*i2>{Y?AnKNb3|ZWHN74F0
zXf+x^O^cv@E`qx)i!VPyM~gvrTvF-Bn9+uW;XLtVvV`FvT0f1b-QcDyHKry*P>)8T
z73$GHP!iS*^7CVwg=i$36lV(&)lE_RffBH;H;AqmF_%(Yp>v;E23{Wiuq;($s`=!&
z)sOL`mlzZQ^zVsQ>GoiKC#6ziEUn{?K39K&l5Hu$hWaQaFDGT8fD%|iNn>)fu{kGC
z!wl2VY9+>!LlJ!J5jI*3@+%aLG^!;>t6@1+bH&*1Bhcbh{n4@sXR<W#J5d(^l4qgV
zJ&ADoLC`Ktq>K=?k!L0IcOx`%rDXv`T>)wLk2lW#V2~Y(&^Rumh@|RSOSi3{^^qXQ
zClTE6v(hw*CgQAj?ooXyko-!7#z)izC*r~McJEV!a|-n$IAgVP^u@SNy%l5W!CXEm
z2F3Z@;Ss7PP1@oKN_vH$i<$b4la(I=o{rAbt(*L)BNLc8E|Scku_zNP!D$FUOR9K?
zdB}Q;S{Vg_6jvfFw2YNq&W3_J4UuT+c@K#dh5)N1gAq@yQw$m_QxTt&3`z*TKY&Vw
z=nDxGs1zyLba%a^EL|%P!)^wRa_P`w3w;^^{{$#+FdfxlrC&m^x<t_KHPyESDfviS
zaG-eCvN5@GO4hql2xBUun?WhrLqgyzn!{TRXRPc%jEIZV#!<9V2r>O$b0eUna}h}?
z(Fc)e+(&7zQ{MWv`R1_f8w#@b*%-o~#OWpzv{H=YFLxoPBfPN$4de}74Fb0YB`6Mz
zXY=Hp&%5o^=#w#pznq_+29lLSNzBU$96Su$0($fG!I2-A9f*QnK&6ryw-K~53xWI1
zbjW)XeE?b-BN<iZNm@ZG<J{HoUF@`cuSLgiZ-`dLXs;2F63IhS3Z3yj%AhWvd!@d}
zDo(rH{qcpH2GvNk7f33WfDQpkWmDbKALZ9m)VNNJ=7TCzT+K@I3^5WW4d}`zbLeCO
zH*J@IStN=lHAo~y>Piu~tqD19j4E-A2I&|hBoY7F`@)-9jDx%x0L^R7P+-_-Xn-)m
z%)4WKek@YB7-baZLA;S@v@p<+vEB{O;JO4-Ib<hK+dndNN37h(Y}^imrCf5v$d@B{
zR32i|JmO~=3YgLlg#cB{y(MB5C{~dI)p*uOMuVVebR<zrCsL#$!E}(ConmbC=KP@m
zYK?`7P6E`lngET(7+FslmQYOE2#36=>}g0DYsUA67{QVVM-QL^CQ`1gsmHBTI}N`N
zr)Z#qLYJfY)`%R4=mQQYsTJx$VZw`?+ap8h-kL%#Oe9@U${R&sV#mDKcYO}|6qz}o
zdDDu_-k`gqBO??T9%*5E?|-44t1rET5#5qM8Bk;@=VNB@RLd!nrTT(d3F^b~hA)PZ
zjonPcR*}&0g&!kmzQQAWZmiB%ce)$Pm^B9G7}tx`On;;q!r;EnK!4Cfqr0(dKuH8T
zqY^EJF*aNww!J-Igk{(;HO4d&WmG6mnvr5I#pt?e6BiPi_H5f!7y);#yG_vvA&3P~
zb$SUJ>;#ztVjE?ELA%6p0*!!w+BS^TwnmjZMQUwD@RvlGrhGw1QpG%gLW~|VIuQam
zMZ>{*?N}i12o+HhF$69aDOY**K0?BSftOSy(nb)l2Jzx{pPCF3;nwcVMv=<G6mdL{
zOamH?0I5z>kE<HjRicH42>OMo%IwC7X=><gf^+?lIUFREZH|s*;PoJwegR39EcPfc
z2w76lq*4K|ClVnzKKNIR2Az&Yne5TAc&%(Sl1xysB<u^I2*yY3(Xk~c9poisE>%nz
z#ikwk)i6>HStiB5EKa9m2UV1HFnX~O`^p!jY{~={514u|D6jbOrI)FAp!itO=n+t8
z8*(@o&0#}C3twD~{VB(80S&h5rCgr6w*e6}=RDW@`wTDiMu|(pQBt;!dvdIbv3^dW
zCf08inkr)l8q>n)PNDYX*wkG*9Sdxnc!u$+=RO>{oAOS-S-mC$wUbfbi9#u?MJOXc
z3a<AxhtTq8s61ljYB?uF5ojSfXG}h@gzc+|8J&*B)9Kj76damP$Cdz<(~x>?6!tcP
zNTjdFAYQH<sTWB_s9?~s5plxx#|I-=JtE{{>kMP@`-aNZof|Z~>NU+V+DMePEm~5Z
z-?6e!2v1eZM;nd<c@pY{%WoY>05S=E3Yw_rUraZVn#L>|L*$HQ6B6YH0m|42i8Z1G
zBT93G&}@o!(2ums`aU>~XWNPpi7hmt5d^In)ygq2;rf`82)0-h$0k~Ex=v9=i~jD=
z016k3F30Wyg}kVWZ631P4en+yMR;E3z+W1*E!%5HLK*!mj$S_FeAzVl1t#14aBTf@
znXgP5-e865I%W*>nP=asN2KA8ajUO+owE)g*4$<^icHtkXGFNDS}WE2hVmiGd(cmx
zbCFIU5O=e@wXZPqaSt(c9@ux#4D(zs(#Hs6Xip8gyQ*gU&<Im*lz>vAyRi+c3G1k}
zmq7Gt5AVFTsx62l!e9bXR$7rzI1nTmi84hmjBHTN?iL$)Ttep~^~#r`&Z9lj4#_Z%
zA2ni}HD2&btLx51OQH$A$1z62o|p=v)@I>PHWt)cWG6ppKd*-oVkaDMF{YnrtkQ0T
z-k>7}Hb#&QCK?5y8BzAMFPzv2xvdvQBm%1(Ln0f<Ws`Vo6SOc}Xa7{GZu*OJ8E}M7
z$6}(JjR_)_T54-(nKwm8;u*ZdUf$mXJ<!H1>NSXEztqY{qSs0uP}iZ5iz$kgM6(92
zScXt*ssj3=5QNA&&og{AKz69;z$VdeU$Vea!67B>X$NHi3Pq>7JGNyNcmSy9eFZ&a
z+_Fx+GWKqKgZPw_$~VnW{NVhB8RZnQDg%V>wavn!v8n_4R0T~&<bd|n0pjh0e%ssH
z&zXB&RQrU5*LKcHzI4|=N|$4i7?{hP2eXv9=Sz{V#6!DvAIiR0Xk%jacOxYRfxTz1
zvz4Q}k4I=(QsS;e>SHO~)q0ZCCp0~&a5&JU=L*^fb!&#8jHfEvJ-mr#RPwm?^5QkR
z3oE_}QcGxOFQH%3#=~v~ys>!o^Ob0akfwdb_d<vRNevmBRL@PKN;#gMId#O7AfUmh
zu!V$-FL*X@wau-&{Rl=c8V_zz5z}=Z%p2|K>W1^12B)gg!u2(t1TCF<u^|<qX`rOG
zt^yqz45*e1D$Lz1UC6%TbJ)jpuo%s=VB+&#AgC7+Tx^c7`tGD&@L<EYk*FJbqP4@;
zuntjFd$kZme%egs4mo8IG+3-2+G94>qmMBZGW<LMQcZ|3#O?~1Pxu>Y>W{Cl^7!xM
z+o|%Li-hACLd#HsBk047^A(R&3?oDIkj8u~L@mpWs!jCkXR0IT#%DLE)dQO~Q=6t0
zMB~Oj3SEy48Fi|s;8l&4<gGWf8gx{ujdVi5_L!NTDNYY#z5G}sWSJ3-Y{c^1$dbY3
zRtVZBeD!PK+h^70)p!-=@m8~@L-EMjfvt8>T%Z5)*X~_Q5JoV3$I1Fz%*7Eg6VT>8
zTE8+xDntT&mRlX>Zko8m=x3b26#Mefy>i{_S|Bm<{;r_M)=~^7_4bW!<=oPyMZZkc
z5B{;TzRwH$7=4{j^D2+`@f>u7cbBnsFFTjst&X%PuH8o}3Drr6?|H@TYL8<=m>znL
zXV|<r|L$errq*<gw18{9;8gRcA#>CBb(CutJ5m%=SAK0HJx<u<HB7f1xUJ+~<+>uN
z<<)!x)QsG(uChFSVdK4kYXi%jTGcTXi&phTT1kZOosmH3HQU;5;?^6Es*BH?&M9L&
zPR|_8h~@Ly3cdB@4WmJ@o+Xdj1>-TpiDdBG=c;HXgM&lcQO#B+<5JJ4G8chSs+>6y
zX)@vULr{93b!Yj-yGv1AxWy`pn33(KQbmH3DvHVctd3ml{?iq2lJ=8dzZG*$^>2E_
zbP_v`63JYWO=s>SV50cv7h@7F)wt1&B5+-|%-uM~je27dFSo8pzV0Pv)BUfPnN4{2
z9WNFOSL3Q@6d5l#b|?Zi-oomuCf>pdzqdkp6h?qWuqj}d%u@Lf<1{fL%MxI*)^Nza
z4xI^hwlw`{SVMk#Y87jiSHR#o^PC~^IK<=Gd;7XDypB9s*ODukk7q2ulM@R|y`O4i
z{;h6ac7#9)fMaX!$JB<s%x`-d_G4zIIh4XBerViH#3I9P%o37ywK!H*(m`E<SMu1W
z(<ieS*N5aEo-|>lw1*}Q%he}tT-VC-dbm*V$aBoH;I!BNZN4E~qwlGBQ`_}JqUL4h
zM1_OQ6wj1ED7Q>JqI@|9=1Xr_2x$!t-ptsw@uABCVHKaF;-b_>r6Im$BRNGOZn_@v
zWuLpG>LNmPrL@BDJjNI%49QQxESANa?w{U*pB=j6=u}>-<>8ddeeXlb<e5hS?<hBv
zjiXQODYB^4^r-uJQ>PP7o!e7nBc9~sWZa*9QuOjZkJZLfQ(kBQiNG(S5-`vziDPBp
z4YsW4j(p&=w#Z^VJ=zHNP{{leD@h*BX|ZvFO~&p|f}s)+@6WmSXoZYU#UGEgBZzHP
zm4ZF5+)?!*1%aQRy&nHq2g5IksJTzaSMOFm@>@aiJjy@%wd_Hc^Q!zq5zktY)uF&o
zB3X8)1*T(53%HvirJf_D_bGrgDJHu@6=P9P;PawyI*U$MT#vI!f=PcoSLP7!KNwO<
z2V^h5Y!Z=@(4~omsjTMlRBuIm{yebEaA$Sv`=>{{JKMWrcpwj{qPqSCX=_ws2PR~d
zuXg?G;|0z(*PEi<<9gxd&yI!*ve<wxRVOE8OZhCdA}2>6Kc*R?W*1}h<w_$P%D;w&
znI{_R<z4S>;|vG&j&cMKqQ!P#u_zw5V~fY4&a<51)2eG0!z{9aFVLh_=zMF^*ntEW
z9DD|gO8HTb3J=0c*}BDRz9ezl3e@v2*-}WKk8xhHJSUt<6gNfs#fGp`SomLy^IX!w
z80~N+NAQfpS?$cTaGxEF>tl8~SY*M=`PYv)G4ybyvq<j46%Yhj39RHPPK9bD)AL0)
zKBr?jicvVFDpiJyZ@C5EmUyy%*&n-EoGcjV17t0*r5O0=!00W^w0fRNmFsqv?z2g!
zK@rWU4OQZdU%VX6GPPu_=V`{Gh1ksVKGn*1M=pl#OCM#Q)MS5iCm-ty<{lT9Y#NDC
zOf^ZbaBntXRy%ragPO6@;AyxT+!@xb{%Afw&j_?}G(xaftj(nf1v!n4)GL3ywKawO
z%6cs9|6}hyqndiyHQ^_e5FjL>cL+^7f}r${bQDnmDM}Tj2~w37Izp(@Q923=g7i*8
z@4eShL<B^t6oE|qKWFBB-kI~RHRqjko-=dieA_E)f5={IubrKB-`DjMNXosavcJv4
zbT2p{DIZbDtIkh066<hOz%gm3ttVg*l<1Mq_^?>lw80=Ls;Yp%HbNym;eMz>QlX4(
z@m*`&`B>PMM3H85v7ViYLEgD|R!5ZvZC`InfIU|_!2rqcJefwQA1(aK0%IhLCI|!s
zm#{K~DUOj51-f#S4oGR3)MH_Yf@79^O-JMI^M{pr$t8}?f~FV&!-}h$rNKO(OjooG
z>&GTP`%DTxI(s!!c`c><iKn0~#rAYR=vF1Gg_GGg?Wu;P<dT<*j&}X$vt<H?mFcA=
zcEI0rBe7Fo3NN>w@ifl0)YQ~CGz(j9pU*>2tt)Eu1g+d<XSxE8Sq6|o4y{oOlOogA
zmBb=X-|5VK|CLhNYWw*Gy^h%wn`C`kr;97Q>C!hZM8h)ACr|0dr86(jwB#J(fV0L%
zT-j#;baMtn25uts&<sWsr4Y$bH4*UV5JD+jZi_RqSnx~KF@o>7B1z1!gpxiO(j_3%
z2xSPv4jR5`(FQdhAo6eu?i5-IMOy1xsdo5~)Z2q%@1sC0l7wAiclM)9FRWOG8M?V|
ziA6nRv8E?^)FtusON?8IHCujrw;1Rk`E^qWFZ-iDE|LA$5j!?q-3+}q)w^S?ooqR*
z&${)WzDR9FZHNj=gKT5>)ALblGL<uf_a7g|xx0N8s!SW!{dE|fT4HydS7tEysd$d}
z#fIuni~i^D#S4DQJ=I`l=pu!FiBx=xC6zqIP~LGBH@Ro&VJ3wsyyl8zcCsKc!qv9c
zPaS`5J$~qM!8C)R`&Ith+{v1qdA8T^S4H}wlbs^-+-S<Ls$z3z$0yA5vs1rn-o-dR
zCZu9|c=@ZYunT4A%Dnj9@T6gO(Z#!!d1*i8q-k`;`31>6wuhqK&1cRM?&Hi@AiY#*
zuL*%j(%LLx*9(#iv7HwlSPVK`6*G$5bI3GC3o@K`NiXf&&o?g1JE>h)d3@k@Hn+xa
zBwfurL@d>jLrCuRi$Wq66fVoMim9pZ_Z|U?7&EVh13LO%KlX^#0Ya`BosXTxyvWDn
ztC%bwk&#idY$JaX9%D@K6KE){L_1uPPZ?5l=P*ptY|@plyPfOGG4p;i3r-9SY#Wc=
zGc#iVKhPjSSYa)kazdCXH`>Uo_8bs9@*v7sOg&*M0YY?T?_TP~diLPat(c&UW$o}f
z;pLZ-((ev(f1Y-X0wS0_5S_9;;z6UpX=cq_Mji_S6Lu%BOi3<!Rto|%9*oyJZ>66G
zn@F)2t-sS!8PL|(BRFKr30K&&&J5rIE6&S)RVwVO<Mfxm>R~&qb(4pVuREw1Fq6+q
z^T~dIap&_y=ew=!OVl_A(gLKbi>3-04_J9S2<K=GSp5twJI}yuXv0?hU^7d*)1lWH
z$Xr(o5GUb73`{O08+Xt$NM>XX(Ub^LQQ5}%b7B_&E7D@O&vFNcg%RgN*Jpn6g|CEl
z6;kE|5!=NJqjP>3z)8lPS4}XhBe^WbIYcAaqtiI%5e^0!I9yu^pjgfrdY7yYNe%%5
z7eC{)O9=Zgq`4#T5|_<j4u(GE9r*6&a*l1kJtC6w4z+TE>0KiC5ej)1;%BaWe88*?
zpdCXVoz!jU$(}8NK+X~zUhTXUT*{~>NN<QGTlol<%q7Gsl|h^UjFc4cl9LxAKz}H7
zH>!g>fvP`fk308gpXE0I2a#I*8DxZTScHP~4p~|bA=!1fb;8nWJS;Ge0&U6C6-1=~
z<kAMR@BvxY3+R89(nY%=(tvQ3VCh&N+Gdn7*BOori6K`(5WNzirx_)=8@G2$f5oMY
z#q3^Hoh2FlZfji*xb<FTlq=1h>mWl6Ng;wr1`9#~S<5lBq-A>z`x{nDMB<`EO;Eb*
zdx+^6x)?X!8UCAHLG&bTe@I#EcRf5QTh)npBwBa%3BxpS2}<P3)MJUEV189T)0Yd*
zj^Pd~<qrD69U{z=KmkXH{^Bg-vZI>Mz)%QO@X=6l@maE2aWJf?!DGR^cKQuh{S*(B
zSrQHSQw>;dC0@&};Bx0+lSL4z0|m+q=1M-ZMo{tX<~~IOZ7Y<iB`h=R#)M)Bs$T&3
z(-Vc?jPZY=5+S5yHngN=5)t`nFgqsj9XE8qi+{9ZL+K(DuFJxzS#pJ8mHe_fTinlo
zlw%lBmOnV}-{5_7LvZ}Yb!u_(N){IC8#l+r6{#h}--xTek<g)*&={AvfBz=`p_tLQ
zc*x*Q9_pLIZ#FZOuUM2Tp$?)LVw#VLPhN*hyAH%tRARF?NIHO$h1dmDEWu4d>D0>2
zjQdqthu;gR!9{PRufrR-ElG03Wv<6xA%<j)?#Qe}%XYt!t3H&922x_4PoFDO@9OiN
zD|=0;up535R=|MQ0aEGE>L_X@x5HK&k*^Y{Kcs9FP`cM)+i*yU@_{mO6(Q4uuWS;^
z^d3sANoeSi3SN}G+6KuFsYENQ;P|VQBxzLM9H{b2sL8shB`3<uT3mOhVCh1G0}S}^
zr0lw#uu_-s-$>a#ayAJ~?~PoF&|<#V)Jm{7YKk5N$#2%UgOt-Buw;3hX29jY$7tjF
zwZBMc*Lo~9c&M~aQ06?)`B0^uPNl;bJ89;jXL+Ps`9NDTRyX2}-nR+8P7mF+B>smh
zpI&`z)y9CyCNGe|3_cHpk8%~JRhUo~F?nQcoNAEBuU;FL&=w@+US)h&pJ-;4Ry2@5
zY#4Kzv}lrh<tk31P%V7>A&X}9oo^Hm`;{L)N)|S!HPrK5d|GWtNp1A#fzf1)k*vkT
z=yA#g?8D6K#$gZfsH_pr)bl|QEjGN`nDWs0O|>i`^x?Z?W9MXHxABtGetHW_QZi5d
zNX~oWZS)`xy1j8Gz932iyef-fx>%(<4We4$pyI@<vOt>x%ajApC;Q{{3>;Jl13pm<
z_!rm5F$-NUUMj!#ctcAS<w>hI6%2+|geec_T}lZb<TB9EJP=PQk-9Z6M`v^U)`Oc<
zHeV=gRi~`9etk0eHTT%iHgkf4VM1hO@To?M?blK};ahe%N4sTV`{*||?b>EBIpR=a
z^Oq0kyOfwfxilNqDHbc@d_Xb=Wok|i_OxGg2RRO<EAWpgifBWpOJ(XVG(F!6@wajH
zn;aiOUF=v6>T5y9xN{C_(RGI|tl1@y^EU_V(!QkR$O?F*)yvUl@qCf#vyKtq5scn?
z_<<X1iGBT`Ta3XAUP%&xRJTcCcV3AXJd$qoCogJ+JvhAG%Z_x7uq=CVPjiJmHBPK_
zre83hpe4NBvnM<)Qx~6}xMGr9PdPLTIcTLG@{M`k0x8pra%gqqJ=t9K%OL#zB}>YR
zqaYWZ%6poDTfUc;zKgsJl<j;Ixn^GvGpq8Y<2hKa0IF9ArWrJ%B%FOC_$D5ceYH>T
zb`&wQ^2yNXMK(a~?)02~HK8Ggbu%rJIPErR-5i7==o2k6IWg$D_dG%>h}VZ-@YKDU
zB80~$n3jeTmrT2;U>qcw8p4`3r)wM{W{4l?nbyaIX-VquN9#YyzZatN^3sx=4;V(*
z4F=gVR@|ZsCU)<k4`@1xoVF9eeshjkr9)xKuEsK-Vo9nvsRNM4ZvpITE0(2C$z7hZ
zSa87hDmmB<B1fX|#DdgA%iI0Av{utICNU*<j6)VrKVgkyqhn%Q`(k++;>tv0zm&$w
zV&i~P@yBWL8Z+^;X?hWcVkc>FjA!wZk_jYdb7b|2-t>v|?g`t*A&MUAoyBZ@$NFzl
zHBLMc`1J<-fax<LkUuw4)%G>5>T7mY_IM@M5)3%YhwlOnrn#AQlw)t);iA#up$(*K
z!G_~}#(2ZP5T@A#4MSz$A&fDU6}9py%Ob<HI^z*dW_3MbU47>4QD)i8IRf3cz4dP`
zkKUS2%uc+_oPWu$H6cnOWN2%Y^)NN7?C4$l%dFq&o<Hj!d>Fh{`N(6IK~h8d?XR}f
zh+u|-G~4qvMFtGJhq9<2khI9?8K_O{0{EJKjf^Qj<z~>cMmqij4o$m9Z?CPuMpTpH
zm0>$MLZusQH92f;FN7RlMRaXFB|bMbI@-<}yw$2r7EfK2Zg4kZZZ?W(HD0DT`9<-=
znVGleMUpQwK4cVq{rNHf75~i|#&?6r?nf+;+U)9v;(Df!&2y@~0wtNwCH1o<Mzstk
zf?2p#d(yXF!fM1XQ#skM=Ggmg@%u26-eJUl56Q()cH^hQ7gX_n8Kv_Fx_C^sAkMmU
z_tV6Uiqsbsg0k6h6qT<%Kfh_H6!x7}F|Cx8<=6RL`7N!)z_dD=!!DB+imjjNsZy29
ztiJxcT7$XBmU(q3w<evUHn1UVTgI%DABI9ZMd#^fGdJX$Hhjoz_$1qqOhA)%E28~6
z`vRu1mAR>XzVYS?Id{#cE2C=I8)d?s8Y2tZG)v+avdyV4nqw$1OR_C7zAf90&HJV;
z-{ysJ(ao=aw5<GY9cO;3{6IHaCU}|weU^z{oJSw~R#KapypF+$PhmdPBVxYaE3;_C
z1+_KcB~_h^`qVs$fQ^V>KqgHnpU*2^zA?T$FNniJ*K?L`Yf=N*4BiP$_roH--IeZQ
z2IL4cdi&)aBc%kM-Rigntv7zXfqGYwlf9<2ePWOLGMoAik5rRc`bkA9Yvqb?<g8IO
zq`eO9aV$E`3$h<Bq&nYLhBXY3-aBm(7;LO>kM32coQhb;H9K~VSkI*lw*ddz=G9i?
zBYJv|Q<*xl$tZXhwwL#ctNBJ(F2!dhmrF|)hQBabs%kq?%LtU&fEEousV*5dhmq`y
z>B@y6>&gVH?&KrZQ1f@5*7B1^@|9m+wdh@j*_uzAE>3OFQm_QE=(9piEZ^byoBI4&
zXG5B&oXu-uSZ9;{Gt*gz;{@O4or;I|(4(-a0Yy|vfG#nD(J+;+<xqAObFOtxuC5$9
zzXgLDCHmdm<V#Dab`bl5vX_POglFW0IjeH-R?#A0o;WKgdk!11s72j^g|Q8hEERQH
zt}wPdyqS{uvU!#@Yn4M`RV<*iS!Os)i#?deKV%b*vVi(UI^y>$0tgsq5UwB<nl!tI
zzwl#vC5VR#<&2WNDCb5e7IvXbc~odg)43>S1zC4zt5LFEUn2{Dz;)q2A&Xv>Hd-UT
z(ydfjt-abxnA&b#GI0mo?Yx@IU)(Xu-0^SB)=)^RFii{5WUoPkaW3}A^IX_@j;voW
zy@?W~%!;xa1_Xb~LBj$52&A{?WP&Wex>8VkfQ9WKA5rmqmnNk4%N0uUW>Hw1zX^O<
z%!Vyh_@R+~q_cc<m;LxY&T4Tfek0c`=pqiCtA9q1G|r_8<pkFej^Z&{HRXd#Ag!(v
z<-~JDsO7<R%@b7{jw*~Ayzt;*2xY@b9*Jc#X$O0QC8Pxqs1%4KczoQ-e$oEqqC5M7
zH|?1GH6==^6Bnu9np1YxZ4hQ9Z~<gw<9?@xi6;3AlZ~1^#pA0=lyesxnJafSBm$S=
zWPV_=ypGp2TuY_|Zm8;rtvRrn*Ct1+bP`)z+XJyeTwk(~X~WTUZb)6agyUS(Yw-_5
z@8o>XFGwYdMsn4nndJW;e6`wsAoVYN^>{^!OJ~>i55C$Vt<LaT-j~iK+5dW=jkY9V
zE`!+BIc>=`R|9xZ+b=Q?a{64AaOmjArZl%TRlc>0v*NGUvy`-Rbn_%o(oO?KfACd^
zOx5OSflj7^zlX!dWJz&i*rd#_t(W>J$eS41)tkcGMJ+dS38+;3l%H1RINF8BFjk&M
z*{=*NKc|f%x(+dtl3b0jM){n4{YjT3ZoRv2T2VOo_GOBD<A*xN>Wj0Z?fKR?#nymg
z)}`N1no*RdM~6>>9#FO?+kh%?;c*Y0ZciZ84jv>yP4iBxvGSS=?Hsqy>JIf4w|u_B
z6j@SU%m&wY);@_AX#rcKZVd5dI|$_6jMFIfx15hrFr;}+DRXr?so<YxjfE()?5ijX
zY>cZXsWz-fCzVsqGDS<c^xCFA4j|p|zh(7$QqJ8E6RGfNl9M~#<zU>L-^C;>j;^36
z?T(cD?)Ud8mRF?qIl)lvA}Q;GGXw70(v-W-i-_|zDNTlb{12DC6+$B3rSDnF4O%jX
zqP$pb2m1)Gj4=kpxj0HB{FzlKd(lU5H1Z5NIY{^1?|@BoX@JbB-1zK~!<R0$=$$Vg
z$ONg>*M#mzi`2fQ9WMBE1NZwen>vIuKEv1_ljU1rFUC=`k;P2;rT25cOXF@=T}l1-
zNB5&{t`&f%IMlJxE>0(AmZ2iUR>x&ZYiNQc)o7-!-jGX$fs%%wcXZu4>AdN#H#7*1
zQ`lGrSrgIJst9FDn4P&5KAbwuy(`zUDc<w3&@YHiK{FBMUQYF7z<pQ&_x66*w=UIQ
zUb0|Xn?C8XE*RI+?cih?ol}lkxe5h|?nm49%Kc-H-5bP5tm5>3HK=4W?>_QO`dw{#
zsK08SY4Oz^{F=a4*pNM=X7J>#Wh#XaHkk00*M|(gAH#C$GpvSO<|oc+vgcMrbX@KO
zqk8;@5cja|N4LQ*H`T6i@;=|+XSY0AdCMkpPd?n-Jz_IFW=&(x@*$lee^`fz?@#i?
z*jIaPu;&heE)FUXE-Zv|Rw{=@g;X)&-fG0PGy6ns;ebD$Y*G?8Tx`mIxLI*gH1G8f
zLCQ_p<w6EZ;>{n!am;%i%W;8M>czWHN=%(rNX+X9$<oThDG&C`43PPBCnH2O&|Gq^
zy>?dMt4Kl)K8%}^B|{;a`BGs<m`#}?lzRYmdBl6`h7y3lrl*(FFpcOfzCVn5CR|Sl
z03^>5^||ncQ7x=Qn4(v?Irh7Oo?<+D>&gfn3z#Cx0>g8j|2mr?L}X@NIHigU!gFy?
zf#xt7$b@k>7s6Q^-l<c~<^ci#SmirC=q_q3KBfm(B7asvDno{d`LLbqE4msHf?1{b
z+}91XUQrG#A7a;c<)k65=uubagf$ec_n5RXi;EO7-|ve8#sJjyqQ-da*Vj6y@E!4E
z_hKb;xd0xTZ(!waaqn5)vbz&%DjRT8osCS%)l{IU_z$#Wghsg{_~X@~){rq~lHVq6
zQOz+o1ZQ)y-df}`c=r@%1jLWar+kNc!}-`U^s^KlfQfD_oJlmrv^24|27TJT-LIx$
z5m=0*zEScbw$i3cw`N7#WQy9gwnI-O0vszSluKs{(D1>-vfk=r2}a04wM%6@ESpP_
znq=pM8_FklU3i-QhM!pT_NyUrp_La~*lv1lWfad|JIu7For>X}TJmOeI@=F^HErn;
z@5TGc0E<FB0*A2lJ&qh@o}&G7n%W|5&yNpEKR%3`rShF=|L|b8jiq4!FIl$pNWhr5
ztvAB>k1X3sXShLb%tF9obe~iazfAk~#ltKmXMx7>jA8$pidX;=tt*P|k~vRyB90k+
z$WA`{$smk2dFGSO0Wezlt@5h|236s@udo3J!&i$^A#FAKTINMu@n0f|f0*2WA$xl(
z_II|e5{PFqH!F)S-r9<!t!Q^H(b>lk=gNIlnonLJRJ%k5Th$;#V}xo&hGHNz;0as>
z50a1V*rL>NyCKoVhc~U4w$M4kv}9q<rdGXF%XQwK7znXQ*}Qz@rmPulmtw@Zb=t-N
zuul{N7qsF^Ke2N%>6)8al3Q<r93A&fQWt^+r{|uN4x29DE3Un^^YsJqW)T1k007D0
zF5%a`o{-1gs1T|Vc!>QKCiL+%gh4^9=$7sqD9nqHx`>O_P2VbLF3pPn3W3kaC(sE#
z`uLE8+$Uk7g$edjUn=W$Y#bSqVy7my6nu~*XlQf(ouZEhNV0b29w*EIyl)eGL%vn$
z!L8N%wZWYSAV6OiD6+lZHNYtC8wo_Y>gC-vW0g3Nuq^+HwC+Q??&QTxTQ{5&GFEK;
zFmLww+ppsg=g2Oq;FOWHJF0g^Q-4tj;APndAI@VN!;l~Ezk49#qQo*^bgV06?qFkU
zGST$DkC(_}<MA45qJD`=fI8FI*oAR6j5ea=dGNLsz2kI?sRmc59=Bo-#k@3EO_gnx
zIxy0A0f0s(`^&kw{gW)~G6rx9G<|eexQuGO`v<{y)zCAxUzy)1_K?}(b1jac62Hw6
z-V7Niuw-g2F?2ujFceGiysnqeGhgSSpD`|_u3PalP1Nr@t<2tWvXduSW<NfzKYS_G
z^F+iop+A;d<7s{1QS~fwQ2)jQH|c>u5$E*iA!f7ndf!vG@TT)M92;w=9tL%%FP6}M
z>%oWDBe$o)iK_2zR*4a`&G2U?R}V1FJYWz~Y4%LhY~FH;IGY@gwclr2DZENxntXq|
zlIm=g?R99w@I2J#s72nR7wPMCP8o;j6i|&wD^+q36RyL_?<GCo!gA1uXEG{?pZAn_
z=j;_+FMrNhJR&p9`{ZmQ^WebWnwa+%d!{9~IV&iGP^hjm(pOGD>X}CKR$!Up)FB0X
z>nj+ukEMt2VkCR)a?{Ts*yRdo;7A@ENUIP0T~0L5`D8ZWLpD3U@x<la*;HfDjWBM<
z23N5|<EXu`oOoTG=&B9WdiwL{gBxqAq`T?F=0w5%uu*7FIWB-E!4SUU4@*E&yCKQa
zp8tvnq|`J!zGdz0>RP%_60gq@WkCqbrFgbS5^hHkQGVwN0BtFUgaFu<3j|gRpv#p4
zn;zgT8;a|iq@Qj;mkC33c#V=op+XFII4eR3#DaPF6xPM9;e0_lkybQCRulvjrzwni
zt}H~s99KCM9BE$kZsfHiv@HN)eEF764zxPQK*$p|B?_8Fz$I+&OC^Up^1+`;1;>PX
z1e8PU0K#@sBwTsnPIVqSBVp!l%9PylbnioTiy{LyLVtgyXvR|Xd}TLE3v>M-?`%wt
z5A)Zql6<jHcsBt;Zj!j&G%})&f?HDP?D6%x5)&lgNH7yf0=KAd9yjB1)pSE&q$Ed1
z_eA%q1UR>os_J{}?vn|}lU^Y}2WXITIo$Mw6st;_fhE7a9#BY2S-ELWc`N#lFsrXn
zXhC<C6R}}!0vC%OmSW6sy%$;M)w~(ob{LJGApspwlmUFP<-{yw`s16hmJ!;iF!Kt&
zsI?K3IdCNYeWpVcbPgbsr-Ds?g)QBPJ}rvFmdF0Cj{aGckV_Tkod1$|lO2WUW#LpU
z@Ec6~a1s#l`XuQ78Uqoj<@?P<YC6gG9GFih80E?%(3>do9mc7Z*wdj|UuVQvpP<3d
z$0}|A+u{{J5N4H2YEOUn94kET6A9+SSw9)|&`C{(D<>~c$7=GYSmh@jQA6)g(OK;g
zT#Ki&Bc<F!5WEeieaUxM=V_|<vs8hnN!GooW(FyT`QTSbx&w3yEoB-dN9rRtaHO@m
z&-b*r?^ZiAsc)oj1%8+PVL@UQ5B-jXom!AABR~&E5RW#AoyuXAX!3L=;=vVIUOe$5
zi?}PLG`Moc``76iz3G)`kQ0D19ZQt)9adDFQSy?(NZ%4M>*}kO-apHkGAnBZr`K>L
zs=y1gN?|X@2)xkboY?eh@x+sVC(Ksjh1vLb^RHne(u8B*VJo8KoO|#}G>g|rkQeqH
zwwJ19#JgwqxzGp>*ol5ito@fTTkaO|GK;euo{mj_Bnr=xes^U-um^{7#)Ir%XI)v4
zP;KD}R~SS9{#z*<&&zh>dD$EaFa2ElIjWcNmw+f&JTLpvB1d{o<RhM!Ezj}VgR^eI
zlo4d_df#~gNC|QYeqdqW(V%O4fvnmE>T`%FKmp7$54KNOg6CzC1=@WDLX<Egtc=9m
z^IKaWnUC*#Rza))Ff%XN9W2a=qrfTtpKRGD4S9H5HlLrs!zAs>;)Bn}52gGcV2OnU
zK+;DR^w&mUehmd8l;n4xzHhGiL(4k$6&K=Z*>W;wURZxF!5*Sua*u#Bo>Ux;qj(ix
zAV>x)%3%@D2|L(hX?p$fW8cRLt&ew~<q5|Z9OMvQ%lUYP{iuDOBr*#6>R#N|1!XNK
zcqdTGG8=h$4W>5>gQ`-#CZ(Jepqw_L#Gccxxe}YsmP9_y&y*?MCgXD^1AXh`FBDbT
z6L1&+loIuQKHK6E!$6K2`1!t<y#s+VK9&*daAlu=21fHO?hzXmm+Sv3VU2$e()l91
z3KqjaVbOe}MPHnsmI-3Pw1O2Un0(feGS)`k^KxQ?*A;Xiu$b5vF2Tz8qwjO(D*RMZ
zC1tIz&jY2A`FL|R`yM3Qp;D%iH~LwXz|*pkb0S6Ns=NI(cvn`;vO=p7$BTRM*09lN
z2VJSV4gLtIu@tPa)~T^|tg(x(dG@KsvA@Q7yXHB0t(#!2yUt(uYIN<(Pqn`NwO-rc
zSS(0TshadtwfkyzSmTo&0O*!>b<B2M9C>|$VEr4N`eeuY)ad&3PxYDo_3yUpv&kEB
z1sn2p8VVg7K14T&;cZ#`>q{f=jje{)jbzc}MAeRswb70BpBihJsb#T^t>jG@!6sQa
zb)#cbcXU(Zd}Dim6UMZum%Mp2y0L%0Y4Uf|Safr@PV?k^({yI@a(^Q$x_M!{8SB{c
zmn};mDcaJ;Oel7b;G1L1_r{hV%uPS%f&0<Tcv=?eTJZ&c{njS$0SmsYBalrbnzRH>
z-h?jIPZ7hQDTOfFq!=nE3@J+-tsjP7H$cn{%`Ak0nw3`M){UHF5GXX~PX5)sHbK`m
zzLGYgCW&N$_Gi2~BB(YBvnGK&jC2W_W&x-$fM#?;tCZkRW|zEZlV)iLjkW1GVe~H8
z?+$dxnzc(;me`4bHpqmeUv&Od?o<%!1W{4DT6BPQo4ACS<()eAi#qJ&y6Pyq9xmid
z-sryP)Okm)T&fA<cF}pM^4Uz6Ho^72(0r#|;<Z4bZeK_z$J=i5imInV9nUUWare6H
zP|#;)2yaMRKvT~(-EKjrZj>J;YoM(F)$Lh=>yhFrvlN3II*3G7^wnc}DV_Rol)VbN
zy#k5-ZwAU<LHa~5dOolW6v_<<81(b|4WI|QA%6XpC}BV*ZBo2wyQ|k?9(lP^l1rYz
z>-*$iTqA8ryhc#8y>HROsQy$)TcaOWGpcQ8U?8TX{bLhiqh#Pnm%AD@)Uhz|t!ZH0
zNd&T8ZaDfEEL-mFvj&~Apl|~5e_Mg!i&A&-<CidRfH2)g)A08NV4@RdZ((Sw34>rA
z?m`V8qxyy}hV#t^Hp@pZF50fgj25+hd4vI5yYj@7P$uc~XWqE}Z349P0v01VZkanQ
z$U4S)IogWi*%iWY$BYU4cW6@J#s&PxY^b_!m`{r6P2Q#u5|D*Ha-=Od(Jd^8=#lb|
zox;x$uO460dY4SH{1_#JOe(BSkef~4TO2+S>N|ToX68TXa?s&MF&_G3Dl#!5sT?Vk
z>l;z7hQiyj0C_Y4{@)pR4WUp&ViI9KROB>s<u?7&d74viS~q4g@N)J`!ld~n7mseW
z{~+(@!MV4C{3rV40PCK6?IjgrQ27|T^75IgMXC__`TWued#5>Hs<~eOIn3KR?tz|R
zy@8-+-p>^CZ85@IN_6YDubqfOmnoK3SeLBhNm^nSjXCEh26^j+=JbTee*EC-C|wFz
ztebA;kNT8T8NB?BLaYOgTeKWax<F1*-QzK^!jde30OFvkZmKOT7IH;(vWLYCE>8&y
z>F87^L-=<F7bfM)%NF_RM1)Gog}8^7^N#LNQIeV}N!ww(8~qu+tddly$cta`t;J)V
zZb4D5#CC94hv?c9^mSeZ%HM-R44+prgI8GD=Gk4A^|F@LM84W5tWtepwG%@NyM4XF
zK7xwK7kR?0U76i240c_UdBwi+TdvYSuEqqf^FTrOVg($tHaww}J^6A2)NBE8QnEa~
z2qaOWo5FYT2w@k5smS1AIWfK>mdB0wGZm%1%eQd5GOZzg4~6gPP@yYArN6nd83+q&
zZPH=}7*hvM*{AX=aqwmumK+OQ2XR?kD<-{h?R!S-cKzq=%mY<r3AGTc80sFG(cztk
z9=FwVu6>Gq8m<6B>65+4BhR`0+5RR-mKR>zvOW9x$NUvL2{HMj9T;Af<)co}iT6pe
z(F*e6iiE1O?o&$Nq{6PjW`=$oyZk(1qgx8_rEDg;+><*K{X@$3Pv{cm?Ob7Y;TVQk
zAS0Oy<Byd|g56s)zmkm&_G#Sq4V71nb73&(U13TXY$;ii3Lnd0q}s(YU#EhJOr2hF
zEd{`w0r)Bv#w~z(ar`P{^}X5`Fgz!F(6YlwDT(D^TeoD}%w>C~`g6T$H5^J8m4Bcx
zhNHOG%2W&J=iiqXAXt0!gwkx7>VSmuD1xy>YAq)RCa$pNu=)p+C9T9)!4m68>;#l2
zx)^+gj~@LDBDEG>>rgThe@u1aY7u~?ovtL#fvN?JfCx4YieA9Zlant*N48rySZ`3W
zQ*m-}!mqu6@vTmgWYazx;(zICC}4FgoC|w{W9!*X{)mGY|D^g-=TZ6v;yHPU#bOhH
z4q<e#^KzmoG|b?2gcoi<?DGkKC4~GlG?9`tAqO`26IP6`U=@XVi9=D#r+FYA0|Q#(
zB@jw$$W&o-WmRsZ9d-^+PEb14sFPn@JKlMsFr`E~H1x6@UmXmeg8JiEGH|$<6)0eI
zBc<`>)x{YTjn0!MlR|u1u8sbxS`@9Y!BJ<C9(Uk{0fos^Q8qrsq=VypHLbZ0RD$1r
z{<??(w?Dme6l(ojN~>Q+mzY3dT(&IN+QK{C`myYrR;UvH;4p(ij2r*`hC^@I6o>ZO
zE(P=2kh!9#5s!(iM^8qpTXg}2fal@H4Mi%vu=>oEK_f6BlCo2K^sZ)o7=@z)nTx($
zVC{vP)y}Yav8pD6w{=0W#S~AtJaZS3&T7Ri>Q>R%lTP-0Rod>DGZxcdPIJ}H%U$nG
zPh6Io{c#{Rvs2gA&gaY9y0m@e2JYOd7@I-OmPTto^Vc6p`#8+i!*L?wocCnCfA;5~
z8>)$YiY5O}p8euoCh~-h&w9iDKqFObNr0Gzi$RPt?mEG?9`!cg$|hW~gprFmP@Bmv
zEn_6AA3@?DB+Aa!RmT$twPhxJW7~qbmPP5v@g-9lm1Z4#CM5w*;bBnbOcYF!DQNdC
zQ6`Uic`9vPE}l~S6~*K5z^;dkLS;9_G^Nfioo9|=BdYpoe!mEp!@ez#w%Q>Howi|!
z3OxqQH3U|ynQ4QWN1j<Rl3c$2My6fzh%?JA#WA*T9d*cCHCnURNnZxNy^8;AkL$)q
z3ss5xdVi0v9$#DMKDU9GJ7CD);HECpcST$;iVHu;K}_-x0d0qShJi1fRV6$peh<>~
zY0nPO&uBjyH@4yFQ{@kwV^E{lodal8^GxhpPc3=9JEqG(0dCV%|2|hqZMxtuRCQ&J
zR_k!Ncx|gU3%Xg9(uqo=O=++&PhEssTH3H2Cpvm_Dt$BG&<H#L7iW%Lb7)sF!5!zP
zg#WCMXP9d%7>o4se^i>{$0Y-f3Z!5fkm6n#C8aY4iOsU}b@6|F!ndmB`LIc9{K35t
zCKpL&Z>TxJC!Y)BRh=49;hPS{AKo`Od@Adb*<QSJlP^)u11Os<xj>W9pn5q<q{k(@
zO6y#`&D@>s6nQC}sT_}(&Bh5gpiFlg55tY~g!zE;^sZayUrd*;-7HGd++d{MxgPOs
zZKF%p=Ix@-OIq(+&+yCGX}9niXHF6%!zC|tJk<7W16<)AE1%p``ma2f-!~vp0=G7)
zefdXi7@xq>VFSrOO-|?lqf5PbUN+}aMJi%@AkNLkCFIxjf_+s9e}ZEsC-VcK%>CR;
z4rfk2hraHWrQ85L$FpxAS_6Ln?8XIrz63_I*XTzXv7tocF6##oj`PVrOH<({9U*tn
z`*cFryvVtwy4fk;GH|J>wxsKSb-mJjTkDe#<1SK_VX>sSixn>;_q6xqmdK^NWfwox
z`<`7Vavou!+(7<VncozbMteq-l0VhF`{KbIL57MX$RF7TKIAZ0yhxy5GIu3EsUv}h
z*}+%+cYGA{`{<5x<AhPF>?$lF<0gi0x6JQ84YBB_ItNCnu3N*^BQ<bWMha^0uKQDI
zft#@mjH6oI0cWZ<oV4|tfACd~!#CeQyN2CbCuA`)RuM)TqpMi;jnwOc?PZ=-zJyzo
zegnRHF8U=*Y`qsDS+FQzs+H!Vv_js{ufbg7O04cD>gMk_5-EY94Dq)lzc&7rVF;dP
zfR6_oOoWPd-&Squ2@lq{Z<jZd(Bf$$ATu?7ES}9TK7IMoZD^-k7*#&RyOmEtGKT2?
z3?Oc+3Nip$cHpQ|Mwp&K%6uw-jCW_A5tWDr-=XXcryOz(H~QlAs_j|+!0tV1?ldQ3
zP0h}s3+2~ZhBpLrs*Kz&dWP782s8E5CRuVsBgCbC#K(m`)3uekpD}f0di4f;$CElP
zW3w$7y)yI2K&vpysSBZ^Mq}{fMnV9eC+8XRqhfGXW&lyLhs@wJeb2Rt5+W3*_4?qA
z4dm_5GQ&k@3=uRhgFDeLx7ZwRMjD+3P3l?Z(HIwO3wCo-dK;5P(^NdOAeJ?5qnj$v
zK5Jt+a3!`Ni||!SD#l!lgx~V<{7{%*e3NfJJU$?tD${e$@;Rq+-^LH|wHYVX+l?ku
zHB;4Pg(h+gI5ifn*$1rZmobKxjiyV#rfOS>U0lOt%~t8A>$-2dyhv^|+qgAdKOE-b
zQ7CJ^WjNh1-Ra_0-Dtk+HQl&O{M@Hg_VIt>tJxsWqTBKg2B~usAJjcRK5TX{teu-I
z3->Ism3K6mo|~%e^8D=C?1*oloo)qrm50eYS<%nWbgO$+BsV)fm7Jd)4)>}mly`P8
znxC8Q@~WwBc6RZepI-)f*LBLfyhxp2_@?gNFxl+lRXe}<Gu*rBtNim<)ALIwUEVFn
z&Cdf)=9h6GA2jj56ko;tL-5t-5xxsw6}%g!7k9n8eV2|~yjxBde+H8HVTl!e+US?|
zA~gI~X<L1|B$xK%BK+2Q6kqlkEghtG`)%B8eL3X4beK)zzj<5n)mZA%(FYCxt%t3z
zrfQdt%Od=DY!!Xyrk8%zcKh#ow)!reES<EH1nh+=`mNG0pLS~m93;2;ZAdPk4MzkV
z6)O5~87-ercL)5cZuQ^wUj8k=OcHq7sTgpOx_t3XBk+8(HQ-n6^5xHnz>BYnf#=i9
zS0~+pSI4b^S0~Fj90?jgg9dV=2_(>jLTDu5KSkMpMwE?;iu#)<Ya6TeH&piTL|MJR
ziL!}rlKvYi`@bN{+WoyK8~pDh$|h|$zinx0*=)%z`sYO1lD2nvPPVKw_iv)?m#+N(
zc~KVqZy?G}{@aMMzt4W*a5#LyDHsR1B*oX$<X}R;)B<Kb<+<&6cwYOh=9j$AXa;eI
zg`O|@-Ej!jC>E`Xg5EcL_dlBTRuuN9idy%*)vA0ym?`DHwa{DnVK`eUgp5_Ys%SJ{
z^NoOcUsdt=2mO5QciPn-CqEfiIxO~8f0{0{XpdsmsVSMQv>*Ry-d|HXU+cQo_fDtw
z^J1gV;nre*ZP{`wl8~HDx2}ApJ(61R@j%^|weEN>oh;q@im&}?;*LuL^_Aa-b5x_*
z^ct$Zj~Ctl^mwqLdV9Lux<5;=vF68oo%{CEU}NpiWpoHR`<<q`{k5Jqf=`B;>JPt-
z<o|1kvey4NQC94K6lI_NZz9S%{L4kzqJOj~YyEE`%3A*eL|K#n6lG6W5agsq{z;>u
zZT1Nu;;|e+Gt!!~fbPbUBw^sdSp0AMc}S>RD}B{i7$=gW{cZVxD~$ltcf|iol&$(B
z%34FL|3izi4F54iS%&`<Wm8-sTExcV4#=H3sLN}_Bt$EnZ1vw(l(qi%5M_h^|A?|x
z|7cOR;O|9Q)W3l!Yw|xQ%9>z_O#XF6+1&pWW%<p1ixQgrM-yf9|CdGCFG}#OUO4++
zI#mLZ6oB$bI(oWR_D~h}v0lGt1YwykJA@!eOwuMX)RiYn>E!19*A->Iz|(L1bD}K1
ztcn7WP5jS^vR@GY$BD9t|9eDP!T+N~*)IqH$bvX~9zbmYNOHs<mt4iSY|pp+{GHX`
z*m^#i#Jtj)&<NLl*`V_XPWZNz_@aPR4o*1G3M~oc1JuLhFb~BLoe~B>DvGp7L7pRi
z0#2<T>oArAm2O7FgJY(j<!G9wwmX)X4S3|&1IUpz)Sn13EZWBT4;E!hh)w<lqO2L+
z1){eAMW2M~SW@cwZ>X$EytegUsBFc5hsx&s_o(cETpwjZ@Oe%fsT*vd1bQ+8??;fg
z$HSN@VJ)tMW-9}v978n9LxmUU52%j!u0$P9P)7;EC^(T5qFr1ce0%{Bi0`(>=TXiG
z-vIQZ_Q;e_9bHWw{vJ1MMnC~rk}WvpnFSF@nKTIt?<gO6f+U^MB@MwsnOC5-fFZ#Z
zC_<0wSafVrpL{<a&iif*dT)&A%h)$v41qKB1oytfY2+_kRv&DFXqUm$vdH1{ztOT4
zeVq%vT6kJk`424%!_%@BLl7W21D=+Jld=fI@f0amAAK@HF*WjsS>3|^*#<e!fgS>&
zWAS5K@l(VDQ!ayJmd+Hjh(X3&(kTlnJW<)91m7K@SU|x;%x56`(?Rm^2-a~LzmA*l
zIwb$nW#xn?t}pzh%c@PZ>dyYrWtB#>|En&0=YP;;qf5yH(BS^PkzF`xLOh=L934Zz
zFO*1|SxI$zVa1~0ekHi!5BQ_zNj&&kxJTNb1KW=$%ibeRfWy{sNYacw(g4xLj6ZfM
z*@*>3p%ST(IoVhLr4vzD`5tMGE7-IYepwDF#B-{muomn<KNfnCvwZObc7i40qZnEQ
zkay(3zW*Tau%IZ<nI^)(u=?aJSm-(4m@S92$B*sqk#4dMF6NLs{D2*fP>kV$T{xB}
zVD)^2qD6F#cNf~>N<QTZ`;)J7StWi8o6;xmcZFS`SH`g9cYn+fqz`Gz&F-4@$}Wzd
z$&m|SNtbeNWR0k3ED*?;Q;Y(-mvRW+E6r(@2wjd%XhHvZY*zRV1f~b7jVCF@!lqoo
zfx9r@rEh@&-~gNjg$<sX-Cr;+oy1$LFZIdO(BORpc|<v+A3ZWP0?M|aNE?}d37CQS
z!}`ld2`EYPACGS3kVn8*+~e2DlpztK5Y5l9fRTkWJS6*gyB13JB%UM*Kz?CCfhS~>
zT*<L}padmQ#0aP&7QU!Nif_0r%vlORk|v;+%SB1t_ek4ErZ^Q~$RRMfKR8JVf)(BE
z6IjFRs+;mZCa=CPUj0~U*)3Gsy;6cClrL3dq4<S>48XEBTfA;S$IuwTlIUHH60kf4
zpD?-$xj}3l-@SGVga+_jhZAYVbg&Sm*|UAe8?%r8X3U~T%k{q*jZ72lk1S$g6*$pR
zFNICf>xcj3%woUA1WZCG7YQ)n5CFL#I}F^i@^+VGZ3MQ3hRx%dS@hABC=^vbc~9|p
z%@tgZIDQHL0TzSUpqF*{$piMLBlf1P6`?xP#~1I$@LFtx66xzZpv8FN7A%RF;*j`H
zXg`t^Ps^eJ&{`$ZXTqb42<$nQJOe#Ch6ZP&!QV>BqnA(b$}EOhP#l&oZJ|%CVosxm
zPgz)D6RfZXB>wItjX<oW0e%q=M<-qIjmCGL%FSuX{np;0sCy2bv%n{WD3nKf*oWbt
ze!$cfp#c^LQ+pd%Ii#K~M80=7;XnQ$w*<<I*A*`(6=CW)yfACAst8+*--RXbPEN(c
zUR+;xhEK1-zO|!anz#wWxZ|JfxCnjnLw)j*teKXatw9R-$(&GT<-ik#CkY1(N8XWX
zijnRNlZnKiGPC_`HpD7GqiY(0$J)sU-*%~a^lL9DqltFegpAo!pS}2Y*M#4y+;4L1
z>+`32ffwOoocPG*`>cM^VqeDbwY!0967p5y#fHUcQwlMJv;SYB>`<ZU^saf+%j4az
z%toPL_em#6jpfjuWk+~+vF5^zn3Zs-9%B{{C)1-FW|tTid?#3<ullO6xJqv}yW$CS
zL!4mWkUNr#qrwYE@jJRKWJ?YoubaxqHo%@giYEFrRho)YxP5*jR!ToGA*$=J-P0_~
zz^w2vU*Ypq?p@T4I8X24bq@c``KolIu?ya#E56>X?(46(y$>6LR0B8Iy30>jeq_0b
zGWOCZ@YVCO8*9Fbx|XT^NS)5g=YUitlVOxc-diH!Hmf$2F+!PyBUpf~<cKjm(bnL*
zmf+xd;(rxo-6z~M*nE%nyP4v^t74oK(eE|6nSF`lD!b+(DMJd;Ly@;E_II+RQ|f}L
z{7nwORnJuIeCVIc>syT$a+ocZtXQq@<ouly^g7LNp|~j1WQ$Qa`$OGW1jFRk%Qv5F
zFNi!?aE}avcwmbiAHxzfH;|nzFI)IJTQs=dP4K?v9JPC^3}sw@<8t0lf-Y~cRGTm;
z$yMXjE(nTbP~3=)xUXGN|E!J7jf-#EN3@p{rk+!BJ5QDK`_n=b+xp{ar!?AXI#07B
z5_Lr7<ll+13srlk+hs;s(ng_(sZpy%yT^}=qCKA)d%x3~dS~;_)6Tei!TqaPH00Ut
zy+J_*<-Tr(8t6th)?fxA$eSh*PWmZ|w%W%!R(8pU+qmQRI<^dYW<{FR+hhHe=fTk0
zdXkX~;a8rGw6!Rn_`19p!HTB(n9#<Ga7w(sX7yS;O5vPbk-^di%9qlU_Y7B*Yi}JZ
zzESt8`9p5G$ullg9cNs6?y1Vx&xP;jwr?@?u90!IDCGZ;Q_zYtYdW0rectl>*YD@(
z<zSmd`}IdB;J`6sqb&O=y>@or;bV;@_b2-wo&<t4PD)g#9J#t${Pq`$%QwKkJtpoO
z`Fl>8YOo%Cu5k7Dn!C%($Zh^dlwESfal2ywh_b8El2<<K)yKBne?-}roB63NXRq3r
zNLY5hq;}CeR-9b<?zIoIm5io{;ry&3r33wc&3pe5W#d{$*SBkN0T+K0WuHV_;)wN;
zgxnUue|J&Vff56`$c^-DZgc&n!orN7)4PAcuxl7kud5;3WDRz&M<EyL2O_)rO82ij
z`{l3ergeMni@mUwvt}aZCr|-FV!c_cd4x$nx26$V1g3{J4Bag7ekb_&@P-C_$~LwY
zdynW$hMsNUOAn*H!IP{Da=w+qZt52=%s+<~3Jp*8dd?ao)iv3O#hm5qUeijC)v^@<
zR_fYwzE9`TeJYWUlOD8wdOuU*<NKS*ul1<B#xu1DK7c!=hd7hnGq-Jc&7Z<`JQCj|
zM)*CIODMPl&l=B)!Pv=Op53k9q1IAXS|APM9^s^%$Wc|<w5B1`k5oSrig&eDWzAQK
zrs5A{^hc@5pWiFrtjsm>Ss)$HA&$KkUU2R9Gi_L<L3|fY0q1RdMMcf=j3M#2#~#Ic
zw&(YqS3R;7e&py!d>p4_n#@uocDOHG{J`UeXNZ1`fWctzc#`&HvFYWipxl0xQNhHU
zj}qPDW-^AaQjSYZzB-uJ+g}$>qs=u*!zkprrBk<XGW||dHe)`AG|bVK@k|Ilxs1|B
z<2$5WY<GCR=GNmFA4p`C&;+3k!QCxn9&b|gIG&n13=iHitl~m}xHs!WCf*xXf3kIU
zG|x0i>YL0=@^^N2_BCDD_#?{xc)~4vXYQ9_T|1A9Tg<$+FX*JM|KShFSbR7p*05oI
zjK#fl-sC=;SGvhw$Fs8E=6m6iwaQ2}cpKTEkv)(~2L9Z4@%NGmzJ{t__vfn>-$h0x
ztA^i~_ayE_N1Qc0K!;n}+9daCheM4q<WEHtmy#dZhTp(Yymt*Fxxfy~)TPi3ZHiw5
zmNUAhv~tx@vJUoJe#tN(0(zmMLJ+1j-Ns#OexOLpfq_;VpDx)Au>^;URK|t0Z0X%E
zO4*j$;)yupUVLqsT(r;#%+a7RB0W@kvu~BxuD(Y@{X2Jg6SrWialiG_3wXnYt&xNB
zfX(|a{Kt(pQr~Q2jGwwo$Un0nNZn^t`Rtx8z0=!HU^pCb%>xA#Hc}?3A6ZJ8hU78Z
zX?EMXwwfQ^h%@Uqs!JPA-jL9chuFyJr;NS3R()I1yi1>}c7l=)lgV|tRm=Ce?~}qF
z<Z;4v({Yn&)`02K*=k1%=KATg4A*kzH)V-!CbN!Trr*bu8oCdh&yGK>vMTa-J~CmR
zkGyA;n0oo6Qr~la?V5M}pufw@VADlgO38-BOBbK+%n2v++KPGMpE8YkpvK5+bQi2q
z?K^GDIO803_3NV{ZVGM79t?JT3@y%Th&C4EI--^ky`QgI&zI<i55xoj0FpiC4EiD^
z0Nf=_=K+EM;7TkrxaZn|MgZpap5mh=c=fLm1ao~xVUkslN-jmnCaOV!XHSJ(-%c?M
zOBG0d_F#($A)qKam11-~Xb%nky2;XDO%^-Ew7!rjd-uB}0C33Zxmf7n4T1m=ZbjZ1
z-}NF6$Ja#GXu#NSk@X!kzYs6n<*dkpz$8|mvlvQ$E{YEMNDmUafW$-d_BQkzEo1j1
zH6ARoG>$Y$i#$(rMG%nJDCy3?+|PP_uPEa<8U+WiKJNM<P-DQUrPFBGO%_72pfsGy
zI?URuin{n<<Mj5AK}xcKh~T3*(e~*<%JWgKEGQM?+)_#(fL?w#;{KsA@yBO>@=SB^
z>rr(O01hMsV3}7$aRdMa(2iweFH%d+YRc6kKCl@KFvhEt7UA-HNIcgE+e0#mMu<oO
zfSSm5FcDxx4q60Qy^j~dkN{+39<{8yD={AFY~KTrSu~S~$^b->Ddfb&XhjB5)HOb3
zAOcV~jy$mj91F@o0RS>Sw7d@rz=9@_Lo>M|+jEdKq9kMpAQ?Wk=>y34O-xp$RM$vE
z2nU?30XlL(K(x%>w)pOL3+3+?VW)Bp0ANiVLJvoNbgaK555=ufBRM5dXZ;PO;t*2+
zfF7X$U})9B)4@kg)>2X+A0*o*5GE19X@PEc1yG2h%%x<xJOB>h2=aJjyQuuODYDHy
z9A_<mrP?Corxvgc1o+?~51_MaIJrLZ`DvJ(1gfl^Apa1lyd&4L9i+t4Q9$0tA=Jh_
zfK>EDYoI!`j+*eOSO&9#dmR!2R#n_qxxR2+)JC0{x^qGtMT7|Is6&FJP!MCl*?8Mp
zX8UVGfJz4efkXri0?@6buBxU+M+6860Y0Blqu7&VEK#F?bc=|RaEKxugye5XKoZA0
z6be89WDq~N$Bn3t7y)2FG%ve%lnA2P*Sm0A;t+EQ2&bP~hIo%sj)pH0(yc_srUVF#
z?~-xvvP=4GucnpipgbcEQP73lmV>1KR_~zJs9ghOtph^Wkj_pJFFCc25m1CgAE#)9
zd<in^2>Be{<5wUD0!I*Us&*q}+x69;5+UsfrTok$`320A9$CO1pqo&kW2BbJxL<{(
z1tmd3itUsnYAJN;dyW8lt98-1YNQU_NH)_Nb?9vw;43wi?}$f&HBk^zBnOR(6jArN
zI7A!(SX6~@005C{5U6oi2cj=c5XlBd2IHw%``}NgKKUa6;FOpXqYb4Y81qv#ED7qB
z7`U95b)ISEmqO|3CJw5haBTX3c2}i(2?&-;Z(I#UW1(9p)ZdW<5M<G9tr9?+-NGad
zg}-R;(CqP_5A!b|RJaJc)X|pm0GbvJxT+DE=1ALVA|a<?Ptt-HtHKD1kor>LN~iT~
zqR7K_?RGwbD;qs^A^^Zg)qM{@SV!cXLr7Q(1eJ&FGy(v|9aA<)b1*TPG4fP(<Ysvo
za}}|JDBw4Q2n5DxYzD16-fs5+SVM?!aVK8x47)w3;}^Q)uB1csP#<)YM6E|vTna!C
zIRw<Zv$ON1wd781!w~1<2f792eqBX?CbEtCHi2HyM7}ZrJK)N#kAsAP5F;deXdNE_
z0iI=)4^Lie#kJ2U-js(h4h%exR|ZG{;6-W#rONGqyY1_005JZ-r0ql%0er}a#!wnR
z#el|8iB9Diav~sNgqE91f=B;(L3lD3-i+=cOVa_&V5E5TW&B&1X^{LyP0u3%nq~%E
zg?G3orAiDQGI9ZdaDt<P_S4_;Mv+>Mb77{pQPw>Q?We?@(bpV$1~`F1a9t|9k%#WC
zAZuGSVCSU0UcU(smE~=e`Kbmc|5V3mSfE-cIRa@H_K-$)%y3bFhiBUDJRI?$=Y@Ni
zhAYq_w1ENufaKiv{3_}$KmA^N+RwS}F;6WU9{`3{D)c3?xHR&&eHc*MX!OuHGRF8d
zZ8^^0**N`R`t_i3%;j`c^-TJ!nHardd1E|B3UHEuP+1@oJq_620Fs@Nq2|}%nj@^^
zT@J~*iRJ)8R$iG%0D)%TbG~5m9_99hFq#}Bxogmq9K0fHC~i;iG_0R!1Zhbz>uZIF
zYE|N^O`>mv5J(|U*18D!0Dzfpw);pTIN(Y*k;vjshYtYA_g~n%tFWlP23+7X0|NsL
z-7vt=HFQg-w3IYRNp}b;!q6#F3J5AKQUU@ZJ%BVyOScN5NGc_BHu(SIInQ@{?#}hT
z+|OQX?X}kX{(9)FKsfQUT*9E5Hgw1uAbcvtTD_wkHVUYL)^MV)FXCYDciRXrxXHu8
zC}r%%T*Zi`+2aMMDlRx*Z3H!sDw_B6O2+Y>pO`nMFPhIDF$Rs!`)NnW#I#&LwlwpN
zy>2Hx)rxjJhKl(@v8rls#n9MZ`DEWRFoXvb+F<S0WjXjvF!{Z{`wALr0K(G*d-Y>p
z-N!Zg{MHc(#&<=-q%DT0thd(}*v9ZELYAP&Yp8gT7zhlFN6($bzzsl9x(>T3(8*&^
zzwxbZO)$Z+%tt*PVpkA;Jjik}W^@sXOR@xu2N9IXQ^bQtC?jEZO<aI)+=O0!JPb>{
zP9ls0?bL9$y9FHu9eM&!K@Fd!%rw>U;;na0Y`S4kg4AVvSbM!Vh*A!|d#KTqI;uIM
z%~{z*b!cPOBm?yYz55XXvIDJirl;uH##`EMoi~Ad=E>S76a);oQJ6zV2j-E5o+jlt
zoav0>AZWG<HUJrc((k|-jdj$-G*W{m7GiMYjR-42MM)<3NObwxtxO$7#B&3J&3O>g
z$*dpLO^v2)(;b<L9hHxzf`M?#9EH5$6ed<6B+zNzp=67W6jOv4bT$XY@S1?SAB@o|
zB$L@F5z1Ng8LVHEZ{rO`w{=6nJRq{;X8Gr%1|gHpH_;$Xknyxpw*hF)%K;I!CY`Z{
zkz1E&8q;ZV$k<Q?kAeu=fEfphv%B__*l~|D9ZH5ShQ}ouJ1P{%)|cRr)qLt?2l)Wo
zcMUP}{p*!-&H=mY_es!H$FYLhqs&ShkbX2Ax%!oHgLVoJVcLyajER<v!y^MlHB4aL
z1u=wVpdv?*7cA~^1^AkQRcz%v2dXPtciQA)z4@rMTs}FL!zN$`M~N%qrLJS0Jg7Pl
zgiruYnON}-uX^ey2VK}ZDI{~7I)^)aX`e)^n4%f-W66$e_`ZLJhit6RJ9lq>8DU!Q
z>u-SuMjRVE68>r8@>OhorqT<yaV&8O@CDuf<>;jV>fUrABwp;z2dOK-B^p&6NuVf$
zE*t|TYCU+-Hh5a#CRnp8BUcx8EPX0rV@P5HCesh#aSIrYWqrQF<~AQ4vwWDLlzHD3
zk`2k#uy2rGw>dV#QCjOIQ+FV7H&L-IbVe2J46zB{zHoHKKZb&v(6;Sptd?Z*r_av9
z?cX>s5IoHe++(Oj=`DO1=vscKQYacfzi0HBX}vAF!FIkM5A=M!k3a(cF6=|Ivl^oD
zbI(EtXY>w!yfxYyXZk@joDBU~NB<fOgb#D+7T@L#1RZ|S9rz_jR-*(a8}F4~7hRA?
z2&!7hJK!|wf_!b4OJb=EIv4cecY|(Ed;j?KtG%kh+9hP{x~4Kp+G}C@$HI<>yKgKN
zuJ^74TtqP4H{{ED5r$dQy95Qo$;azffF~Suu-w5jM0E|dddGivT@8%6UNS0nr`4)t
zo0hs?^mexn5_Hq4CsXp;FXs2ZZC$2r>X9Cg7aOlPtFOip;df_#$Lg#|d1XToDRWL7
z*F7J)1>`Fo!KD$6Teq^ibn@rVLlwk2SHIr}P*tC4=5O%j(wQf{HZU~sed2P0vf6(v
z#D1faTc_BtAGT2uXj6uUfKI*OUNB%FxCRx+kuU`jWOq>~`$NcpT?S7G5`<rd#_dGQ
z8(3i(ClzQw_-K%tbS$qY2!b@2vXQ}G0paX^<gf<)R+p*!Y#(4QgSU%@k%5%^G(k=N
zzfCuI)hru=pwkkd-~1RGVVs635L_B)iv7rG-7}gDB88c~{etO>mCqPPGc<u3N@9Ug
zoD3Zy)CS6Rc3&)-=Q39z?FTUiw?A_ZSm!)c`B;iob<uE9>S&h$QFL~}?B2s+F`yN+
z4$KCJ2LgtnBfG5;cdST9oxn}~J*mySsNdp(7=y+^ma5|ni74sDV<&MmBo!T3-Hg|1
z@BTs>VG2r%^E89GJfqPpST+Wvakd~lLLM}2C>rwij_37n2Evo=dT6FeyhAZGTyx$a
z^aMxxU5enn02uD}&ODBtMW6XQBHvcB@JVQ<G_cwM8FayvjK@se!~}K{SscwYK^ZN(
z>kmRM5<}c3@yuY*SSfhlqfnnyJS$ktYh!>VG#?F!iEfCoCT^P0gS%^PVI=-=$l#gz
zDtP$E*ayYr2A#w8;V!;^IA)>JToKqO6R|ol+yU9-TOrX($JXP)e+G)8-cwok(7Jyz
zJr7&l{rp0N;rh9w=7s)89()6<isZ1k;0qmx^Ub(Y-kR^5FJonHyc(V`?fDt@^EJmV
zY54IYtcWA_7j4n+tnl-XSh^zYDL(r(NW9q>JPMTSF0w0{kXF?5e~YpSuhkHHF8dsV
znS5q-o?H8z|67#p)n#`u>Mz#L`Y%y7{yHv4q2*iu|A?}(0mV<s-9OcNZC{D9ym;h$
zgQ%s}dw)e)yPSPB#4``<vGA2BTYAkXy0tT%`>!Zl%kCoQ@%=>XQj~rB%w9_D+hjQ)
z%8q>6gcldPOk9exKl(Ur4t9QAin13Q^wb5=j}<O}bl|gdE_1j!{?hn=in8YiT9&Y%
zG&`4~?0%a9mnT-?N|gQi6RU{+-=ZvR#pb{wgf*7lJw9FTwUU1i{8E%n;CvdwmdIN;
z1F`2T%VtYrtKVgNC@~kpo+9%tyXb+~4v#}J*SR!DnmU7<(<61fyBryOrD;>KhT1Zm
zk8egE(J=>-(>#29j~vUb;z_$TU1D)7)@>}?sr(&Ru2-{#g?KcS)zF5`_oUR^*;&i*
zX~?}27xf3HGCTz_4EHv5{1Sz~ss=43@R+5NHM*z;sSxlQrY9=#sy%Ty<t-~nOe~Nq
zg^tmyrle?R7A8wJe=b*Uu;i_*ox8_h{qFQ8Uv?Rn$tUth-v*7vOZ~p2mUr)%c)sqR
zE=SdmY0FmW?IXs%D@PjLr+h62D^B(9@|HDzyUazk)3jCIQeEvlsFB+Eoe*!n1@Aro
zYn`3vL(J`ePS1p%pOOR$b)vxTLLJbKKwo8C{&V3Ta%}1AZi*Mhyf3%yZ~N)c(H8HO
zAd=)n2Qu9(UG8(f#2(TW4U~sc4B@;x7aft9UwB-4XDQjJqI9b@;N!;~Iq@;|d2yo{
z^#kqnCP^Wt$}vM7d5I~0a;d0EGqW~{Pd2i8K~A<w@{+T+FGX3miZ;pl|1Zk^KNn@a
zYZ;&Bs|i$M`jpGvm=B~0IIHcV)dlN_OQaK633vyH$k&N9&?>x@%6ROk0^(#IDEo&R
zO~vCVasy!%Mmv##o6UVpiQ*7?Y^D8x%t9B-9$B$sY^|1}=K5o^PEP))fm~(bIw~*W
zE`+XV94F9U8CUa}3)`=$4SVyninWxyy(Zc7PB%-RQ!%;tDyat$ds__oELQbOf3njd
zEmK-e`cJK%uk!@QZmT*o4X=I{8V7Nrq@{=@pbSE*vT!Bfi#+jr6juGFKs+Ii$6h&>
z6W+~|mj9KlMGMXjhfvPS73)x)BxIDa7m4IVk@FFfaG>^SlD@~OIud4t9Ag;Fjw7`~
zBMf;Eb&UPdP+t2&0(PfWjuK?KuDA%ka$^R(r>qaLkDPeb*uzvJ%}q}t^T<q8H0J`;
zN3n1BP`Aqok%SwkC3%9?3_p&fC{e0V+yN)qlSNTX)8U~O?1?j<gK5suF?<2vOq&KD
zSKldd7gny-Vn;>64ba;%^s{)u*=n>J{ZS}}goG@$36>pmj@y4g`ZmW!#qZU&gn7Up
z?zc{|6yD}=(`)H(V0)7K5c-wdpxGj$35O;v|BIH~slIQcJ-vXIy4atH1<C${^ywND
z)v^7Y@&<LojvelG491fE&@tB_WQVh)Mf00cV`KDrsZ)^lV94YeS%9l5Gn?VqU0sum
zLnlF<wX`w4!7dinKM*@w8Ip-<)g0a<e4gZ**&n~wJHV1%Xj%)q1MTtj73)Zel-XEg
zheM*m!>H?92@_AS2+9(TrZ`2D`C<N=CdN{E0(bJtm8N!+_bBhZBwlO#<S+IJL@$pt
zZ$Xk|O=cRqbAk>n@6B+}%y;27u_0NYbsX*xjF4BI;&a4prk`|0L%Z)EMT8D0PZm-Q
zTW_S9)h*(jv9l!Q;b;$xK1$b~?WC>}efVzM*{S#LhrA6@Rz<@^Wy+@%>+yZkOP~!&
zcvQtxG_-(zk77&^lh0MFL9?W5aqY&t!s`v9!F@SyPTr><(bdj0`ye6<yS28k_#V+t
z!^B}h3Ig`U0eMtahV_fNf@$*&3Z*<kO=E|QfYja`8LfF+F)RKKng9_+L#NwPEpw`O
zCF_N@k_trYuw~O1jW<N$U;Q!|KV%#Uv8REIeBaFTKecndHZR~)-Q<WkXqRd~sQUTf
zz{>K^3cmI+*f<Nc!10^M7h|*k^KldVD!)ZY2e+1P6G=C0$do`anT#Mjl&y#%e1N_`
zHJwaIc^tLptGz(}Gk)H$sD;|=u9XqtdipBi`exs-vfzHku{dcvS(Tqzq<`jd!3We^
zcEu;Y(C|$hf?-Y#n#hN1Mo#u52JwBg#R<4FE{iPdNPoufRit`K5fm0P@3ca{;s01F
z%nj50A_w~ZNXUtm!eBI7As#a>w6IPzG^wV5R~s#4lDTfsbT;-eWX#i~mFCYT2Pzfm
zHr2>VL641-psF@V8fy7PSaS@~_bAv)DqQRwnZ(sq_0~!HxCqPa^cLu~*E08{o&JG>
zYA=FG*byoX?V6$V;d%sPOR5YSyQ;kAc@8j_ll5D^b-jzac#aGhrn_Ya6xu!%4%y>J
z7Y2V^SWck4initIFZYnT<FTBXkmt>G<yLn|&qZzR2{cp7^$+qB{s^(W&kGMbP>&2t
z!(6zj$e}W{oLICcfpXd0!v`$-IggK(l_6XcC$-bw>Na3YoIC1W7gOWs56R!&G?BM9
z71Dc7em;R!UhW<H>&HfI8g>~xw$(~g=IhKT2K-oGmTe0PVg_Y_rYGdb5RV@jKXb5)
z(w>=I3lJ)_9V|A@;^tGWPKa1q#5L3l<tjT+N(S3)W%WgzI}y)+4RlF;1}C!4@6|HX
zqo0!tLlP5~65eMBFilXzQz~{&+?KJXdYYy*i<?*wU0v0~^1KJhz@|-Ah%CkJIVxaR
zVB^pz<j`m1G%e(`T{Hi0LKgmi5wcOd03n;ac16hIaPM??+OIKQ60)kirT<OHVlD|;
zj&(AWqbNYgdSd<uA?xYL26tpJDPo{15@9Y96<jA1cN8}&Li+w&ki}jRvMX$q{}8ee
zVM&OHcLYW8I!zf^5+Gz-i}*e`%8vttERKcizX;hp2cdHZVJ?VBEJle>S@|y^+XE1?
z-STVe@BtjfaTVc9LRR@2(D04CB4kI4<dlj-H`#<#R5jY2bU!%h{X@uh3zT!<*Ip5_
zWa~=a%7#xlv>6f=8aa4D#n=B5vWOBX9!_J)e-pA88aVjoKZLBRHs4=Dw##%W0%!%-
zOT2CK<nzVhUqV*JtQ>3&5VFyF7=Vza0|;5LXxNn?yIXA6OzQLt3lOqkQNAle7F9BM
zNytW70)*`G?Mp%y_ltAnUqTivx`gon2-!eA7gLDqKZI<zr}GsdTl3|TknQ1`2MF1+
zlIwp7S;Wf&O@NS%FtdFrlkL1fR_cH6ijeIuy>mgL01&b;Cl<Mv&cF1o2wAWuK*&me
zxwrP=l925I2-!$Kt`xbZuVMfpJM0qP4iK^sk4r)p$Jgn$qB{q7;JTDEyA;=kEI`O6
zm)uJM2w6xNK*&<LMwJ7Etcor`$nIVdvT7yQ0YY|^LnVwy09DMZqRIydvaU{SyPuW5
zU|p{WS)A}#fRI%YPlv=*^K7j|C3%CB>i|Nw+pDqUwxFA=@TUGI`$NdfEW*gpM1YWm
zh^KeO>t7PG9snUr_m_}Wxl<ndV9lAjhdbkmy89iMFn!muzl3a088!7KA?vX@iKMdK
z1qfMBut2=q?Z1R<zUw`R#w8((D2hyUDF6srO-E7lF?d;-d(Yx-KaQ@7syjf)h5&?Y
zcP=DWE*l_Zl`Fy$rIOd5YXF2STI-UK?b5m=WL0nbE|*{+!k@>N%Ay*b3-sb&Dj*zm
zdb%4U`L!<z*)Hu}9F~1G<o;hl77HorjTYF!l>@0OD&d4R^ZMqOV>WSxO_VuZ-Oaw^
zU>c(_&Kg|`q(TUcO<|XUfwFXV5BZ8JnF$`x2DRekc-mu?r?bQ!ClUQ~(YddHO#xcn
z%*cKf<<TnK>nUY|=IL#JdT7bIv$-Ipr~Ep}7@};nekYDoo|?34x7Lhu|7f&42OsYt
zPV=dnR6W0WG|qHS5C2T3{$aQO4i0~359&Nxau`kE6sZ#^pj`}R1jW+iM{37Mx{*~K
zghmlaN7Q#kQD&>jx<)8&D&5}fqE=H;1S*kHxn`>)@^nlC3=!I!-Oc)zL#4Qq{?o&!
zxRXmg5+;~w|D=!KaKrhqk$F#}$J_-!cq_l2R%4!gWv(gkZda{Vg<Utkb8`-tG2Tn3
zNl+VAd8=4JX9hj5L8{=YJadRceXP3ctf3H!5g^%Fq}tIk$N6p1&5ip+NLYnqrc!Y;
zl0~>nv?)hcO@(7aRWYw}YafTx(}#o3M9vk$-uYPTSb6<<bV8RJ&hws=($^S_%FkIV
z-sEoXV`ZsiRRPUzq+I&7JkPr)LZH_-75Y_vz7o<7QKd%k>$-Ncgn${9ishWDwE#cX
z70kHc$R&-T)4cLylmGg$nAy21rs$gbzkX~W;Kz1d`mvhZIshMwV#h7I;$uw!J{B9L
zb?L|A7>Go+{q<wffFB!)+Qhm4xXU^RaRcyU(eYZBek?={@MF=!W0!s`MB8_dPN|$t
zvxeropw6Wq8=>=$AKNYeFF%&{5#}F1mTX`C%8$j*Rr_8T%|lkl`gM;P@MFt_h4R#{
zB}Y)k|6t|br)%}r1^n2aS{lzfVSogOMQN=>-5W;Fm8ue%b!%<z947ylA1lr8JPbw^
zzbKZNBcrGuvtYgSV^M$o*huNSl@iF>!_^6P3)PjUYLfr>u>c>d+*SKi+Y>|jTJ79<
zRyqs&rujMe>^XSkA3s)=TLSQ7qquH&lm9#rx_jlvo<G+vi>R93QK|Ur$3lMC3Uj{&
zG44hZ6nCSBJ5e(cQzWs(@hU{cs?x)eu)H3+=zj9dXr^p5O?)KmdlXDMLYqiTSGSwS
zx?4LChbk~i0ygebGG*QdmPSQg+fZdz0@DviNN+*t5xYC~X3U|=!)-m`b+|(HXtqGe
zbbKW7E`*vVQjtf6%mhbJ*Hb+8NXzNS)bSxnStrX3=6yS^Kv{$ivbzBnL%slIEbFAJ
zuTd<HAZhKowH^hVQQ}5`S&ySAYa%3DRkStgv|y6<^I%({LEAHIH*Zpd){GKyK)pSC
zqr*_o&DXf`)<bm1-ZRdT1pTUtn-YS!;GPeiEW?omyBva6q{U(CQkA(kcDvv69sr94
zO4=!k8k*afNNM7FDMn?f0f;ZLWq{&a8&-_KrV0&+@>)et&2u%kA~jj7s36DR5<<@u
zsp=I|BlrM67S&CipUq<6!w9OEYkTWK9wjk3%Zd#AG2Vr`$A*?tp%V`rTdPvk6~~jR
z(*pe1=)FjfZaZHsu7x7qBHXVuKfJR+qot}y)vhr<YoGFHS?Pn}=5C5%RjGJH_T#SR
z$2(f}8002|s~#-9GD%U^J@+bF5F-7ENID`{jm!!9?E(v;j*qlH!{N(Dvz3(z4>u^{
zzEjMvCW$}#)T@?Jjr&8ze-ZFw;k`Y8A4_-T$L4uyCq+7IH)fsTWap|q$?akB1^igF
zR)0-)#tGpk!AHN3(G`Fn8+p&9o14^!4)9|;P3E)%xofKU&s4p)A5pVg&Ym=W=JBBh
z{Mb~A*c>UWfU=atTdjqz-jk@nxAbeLQDvm6fFD~CP~p+=Gv((yxnt>&kCo+b06!Lo
zCkI#lW$=bzcRF$H>6lc_Jf$sk3bFh4Oojc8Sc@*;#}=!RNmtk}v#aMuQ<m*1I31Fv
z{xG}M68z#&izkwaN+7dLN%j~;?b^)|iapkA!r??=%EY>4IRhl&5DKLDz1$vJSdQQ^
zL^^eR{Bwx*sLC6uvp3gewKr=OkvP-CAjbGeo-(g);|LfmAmasYw`}N=|A3UPz>U^-
zPFH^H*VuPWE?solSAJ|$l~dOFK+9db-gjENkyDp`EZY9l$sp}HM)v+SzH==ExaF@O
zTY2fnB5`Cc{aDRb9^J~KA(8DsDL0l%J05F&X$g8=Dn7j(eS>@Zf?}l}*F4^LOB!bM
z7n&<%qRJoLdo|Qn2H>#<rgFM76*vz@S=L8isL8IkEdh9JYJ>uZxq8DJIq3b>k>BL9
z3Z=Y$<R1V#78`l*5|8a}Sm1B+5mqn<@Yu*pJQi`SDOWA#MKsT(fLd6!Vtz~Wo0gVO
z(X!_m7T~;VNHBF5HEM;Hy=+|3@3mI4YUf#Zr`WEJb^E;wC9Y!C_+uQ_v#71JD1ozX
zj^Uu*+~@<<4y*fe{Xct%X7=S%&h1?5VV+@wug{<H$a4(soa6>FWcM7OscO&39p$1W
z52I+5R6gQFcj!8vQ;Ua?6(IGG$xdYpy^OfL^b1Ei<9sy4ZE2_zlpcRjlMdh7psp{d
zve$mhZ_yZdLgB2NBjz?;f0xol*UqZ3pGra%cQ9AXnZAd682OrA=FcmSH}Eg4w}igZ
zzw4vIdYD#Oy}R?^u1|upc}?%h9<5}0nq<xJQtq1#Le2*ogiDDgHB<{>K&*Z$=rd7{
zH{Ktm2d`2Kltm5tsm>Xja@!>}=tLqvKN^;f8sDdq6R)((<#d+0&phq3k5tURwWG68
zGe<<8BYK*_T?l0iUq<tZf^R%0p?u?&tJFj)RUEnRIcxyF@yI{?<3r;J>4dEslv5pA
zG&{~nS$DpJZU^u45PkT`oYT85Sl%rE#ks5ZABI(aN<QSsZk!OH$07ke_9;K0$NC2J
zvivbI=uy1XV-eVzf9tU%3|D$AgoT`Nkb^ipOxOTFO<KGlCh#0=*n=%O#~5@+UUXKm
zM5qZX<KNYm6M27T;;)jc%i-_P%hI;{@&!^YKa$YooV)~zLx0$ZN9nmsI4t}gkufZK
z3-Tp}6}MoEBTrkDhk+@*j+{H#DV?zN-ta=kM}<G)o6H<L^d=>t41;kjd2kz_Q8~EB
zKtmRdfU8mI7mL>~P<W2zFCLht`@Qg0+Z>ZLa!l_t5q&LM_MCrB#&s%6P@-(ST239N
zIInPIl8NkE_&Sp5?^X7~o|J)R=J6>(<8V@nSO1J+$+IVO?r-K?07BLcAY|(`Rm&ua
z07BNMLd$?iAoYrn&EEtFS>Lqhe+AjhwHQKm+%<I~tXKWY?TSz*8IGh^Yh$?Wk)bjh
zVgMn_As6-Eglz9zs`{^tHc8!I859}wHO@{?0#5)!mXA5$FCqKH{went%fMc@OF~w;
z?8QR`hOOeqrdNb)Y{_3jmW)bj@E=0fU_3hAGvr@{tUlEhAq(yQ7a?m87ie_v9{V>T
z`{JOvHuiS#lY)x;khMDJgqSNrmcoYNU|2%xl8~LHd{HPBSC>0<-G!Hl_QtJeN7FXp
zi}@CoJe%<qF#sXU+;B<A5*Bu;GG?x;mmwzwc|H_d@+2f;0YbK9!99DJ(EsBVAsaZ*
z#Sokt-=h$IY`^frXm}q#F-BI_!*pgboaN&9^NSZ3r$0J6EPe9Bwn!t-Yv(vra(WJ%
ze&H|rYLZ%0JX1`@=a!*X<Au&Hs<MfaSJjjt19oHX1db^O9d|Qjns?dsTvt%E)?i7S
z=(#=mN#VSWELJ3Q74BxP%DCjqbzIgZVJAw&xZ-&IH4KR>vzC@<T`ajKs)<9CPC|X?
z%0hnFhs#>WQDx3fbc&844<&!ZIm62gNIV6-_U|YdaH-<@`;f^s!Za$F80pM)#FqJW
z*(LHvcZ&(Q8=;h;n;;*@RQ;@WsuEr%<#?nh2Ae?@pNh=3yLXY_MPwpO#OuCFt!b1F
zeG|#RUgpgAh&=gD)A}<C+f~tT{SXSH+UUELHAvsdb(EWhj@1%H*1JHP`g8Cj?4cuG
zU%(UH*nyXpRrsd-cONUXX7Sl5P(B^Y{38BJYslmK4SvOfE;tFDszxe?)GS+D!lI8P
zfTkyJ>+t%ukMH#FG#fwLmE)G3jrb5UZv6ac_@!bt2L51;^2HgPM`@Y&#{Keu{GZ>y
zDlX?3MAKyE|IXZ0<-YeJhB@##nOB(x@0@;$bA91aYndwj+*o?#WD#Q(kH+>uN|<O=
z$r;t=b*s~{>~xdji%ed<;PUazr&L8!54mN0ux^j|?2P&UjN%FX$a=I(eiX=*%7;A1
zKwjNJLoYx*H)Vwh!+oh?7b_6696yq3e+-M#$~PGe%*}Gko8=aZ-)^=MPQTV~C^vh|
zZ?=7JswU;A{GSr3iuRkYEkAGDlrT(pf03w8Ea7*Q-8HLwdQ|RubNlA(H`9KHn{`G%
zJRIqhX8J$etj}!lv=iaKIYKl2#uqB!-cml-Qh2kGX*bT^cxbAvZn_%%_?t|&$jpd#
z(A(!nUaoqw^Y8I~*Y(EyaJ+pszjS)k_+m=H$D_r1j*zCM>j%iM<o?u#!gR}*m~sJr
z<)owb-$6z;V8m!`6!k(d{$^^=gP;5a*udRjsF4yr0<@6m49add0{M#l8oG5lN851<
ztqDJA!4c1A#}k=}U>(IoGlgaoY|iw=DYhn@rXP33BKJuA$C9Z7=!p5fd*ii+?Mb7|
zd-x^y5{2?siG#CySWEp9Zk(@Dy>5Chq;Wl2OU{vVIRsy2+AmEY*`9b_x?hHCFU2sK
zggQfdK*F{zIquw%N9XR4$&MeqM%O`r^6q=r3*YRA-*3}@RT<E|*v$<`xR9SUjTn9r
z%i2EwEYo5>d~Yct<9+BC<%-$Chz~#GPjprZb+S9~@M_Qm!^_U~5X`25aJa~WTc;4|
zjx%+^P>V%(Gaa4s&D5hxHyaPDWh}#|OHmfkd~ad@rznemf9iE9yLc*}mj~lR`l^s$
zjqet{e8L$QR%w1W4cK@G6tT~JY6Qp%JCdLdE0<Y?->q9VKf$*eaIJabYJRkAkcf9r
zf8Io+U5N2Ri|m*CKlnZ{v-62lM6C7bOSRsfiMKUCtWPHf^#G!*BV!(sZ@e=8IpcRm
zaRf1z<haxA*?#KJd>m`dUtPpt*rR2{SJEs9o#;})i;ny2GPI|oZeF|A`9;(s*H1~b
zYarM}1dQJ`met!Jk`D1_;{q?_<*ETm1f}&fui`x!2eQZq0S}hn83>c5q>w1}AUm-$
zO88Q+;TY;3rAZ~<`*0Wn$7|vNRLL%KDZw_Ro9OJT9b30Z$>U^qZsvV^!qZh=QopDo
zFp1PAC@#43%UPjgrBteln09A$6`}MtuaAb{wa(~T?X_)zpGxy3qhQCHr6Z2M-Owsq
z64gLE{Dx0wKT8bmx4vXPwqm;Ie0b~bSH<vYS(wMh8;S%@;k8%eme;B0lpp+za@!xJ
z#WoQOPElyuFE6A<Q)!byMnBq4_kyA=k5bN^ixCGnkN#A?7u=r1$HBt&3C%x#Nd~Xn
z>HPk!0;dTK)9&0>SvfW!xiDS98wJCLs}Ysn=aQ+LTsvp(4s@FRmJDD9g;88=0|efg
zf@79C53i=CAYmGefNFz?#ee>30y9N|A>absZ#N*h1;2{XL`|J!zl6T8kal0oM@0I<
zh*`Hh1?eIS5ar&>lZ1@ff_M_67s8bg^3iSaRA{&Gn%pj~V<bhd8?$*S^0a`4xdguK
z>$I8hyeE|;cVyGGik=VfW0eT{2=Ood*!-&fp$iZ>@h_rZ<|$YQ5|YVpU2t;pq17D@
z@XjFSGvLSa?f%{uf;6NM{nWekV|S}bboLhd$p8rIUw$kG`PYvfET&x$pbn_L^ke;#
zDw_B@bPeg^evr6b@v(M-wCBQj5<hnkHOp9&*9f)Rx+V<lk6wEd2>)emt*<YYIN-;!
z;{C^uRi^q$^0UzJvqL_FUKqD9g(_~0xs8|_fP31vM0>$BL|1-nua++0$7ZXu=%qGp
z5Oso3=R4$V5hDx%#Ef=ip9aDBF~sa10_-kc>~2-;!Ng>EsfREjwj2JlfFDcY&vibA
z1pHX10-8QGvXFRAy_%+tD?j$$ICr=af|-IdPLwU60CDNZM(||S&7=z=e8xF<SZ{Ym
zI9~d(n4Ekgem93V{%Gz93e<fgo}6^lHrb^g3#vwas{7QG__eW)(~i}&H=4$mT#(i0
z4T2Sg{VmEP3)&+5xP9rzVzvn<gh?qyD2+vEGej8QAaFB;nXW`xMoLkBK$Oi86*3l+
zoe(1r5LPr6b<-0k&Jd$M`0}*i98pkvxFz@!@MF=hY!Bup-J$L2LKwi0jgTl&n)lxU
zF;+;0Q+|znQx|KznM?^wrIe=jZ36t*_&3tjyXScN*W^D)_YqxtO)2{<Kq@JM^ySAX
zz>l3I<2uCz)~T>4xbR>4v1rL~?>GJ#3KqugfGp4O*N=^mdOf%$r>}T2q4?ts4y1k^
zuU-**pa4B={}rGN_^}&0P<DOgB#aWdxFSoY(tUpw(s~uv9hC<Za#-0F0SjV8e<#eD
zf(!6tKXCK&#Pa|3W2cFjnfrqPKh~X>+b=`mH-#$qB<R7xDhF68!UPdJ`3s#Y`;l1d
zvyN6yz2=L_g~CInmy_i2lUk3&wIb5Bus<f$4t2Bwb#f;)nMibeD0M%Y=vEzS4^i>l
zR4%t8YzO?<eepBvNIE+z{zF#zH-I0zk`zzK3~_>c-wyig$Igg7s?-*W64y+M;Pw#e
zTsfS#1phG?!{?Gf3EV^oOX!U}G#<hjD^sJ?ADc)_&Ff3tJW0Q)JbAN)*i?4KH~{ct
z?MxzGn|c9$EUT&Nk&#=_lDCA}iND!>iECRAjj=J*W;dx(7Gf1kSAOjNq`p((4N}05
zRi>HwFF$tXzx~(<hvEX{%#_XQls(|b!YH@^KXx*zY`jz3mYc#{^^xhS67Nm>`*m~*
z^*CV-vnE%5?0JR}<F9h$lUa@@4g!rvOs0-m4;}eU?L|z>RZM3!rX8aui9sd;eR{Wr
zXq<)woT(dcf8M_RzREd(((%=x<wHA>!)Pme6WabOKlTIlW4i*8fBUg$z>h_`0e)=y
z9r?0pcfgPB2mDxN+>gfU5)oxPC0U~O6y7B)qG07GvGB$z7Fas*VohwNwicH5i9%c^
z0_J(xO1x4S2o1UELw`r-OtRDe*DS=0o9L5o0LTy9I8XOmiQuj8$+Qpkr&*q0U#4KK
zw}H?P_J0iS%t(Lor=<y?r1d?j@M8+rR1FU77zsRjV!52e;%>rV1U9lSv{H2>3j|Z%
z%Y=JlSd1oFcrd75d-~El!cGMa+R7d|pIGvOL*2&&T~(OsrsPTpWbWY5cde3=ZIBj5
z5Pwj2J7z_R7typMX<X9O-Qt;w2Lp(H6Y!V>WIQyMwWDS*wfy=vO!+V@O(6WYl*QLi
z+*q@qXI|)&Pv~%p2+p^&G)-vY8O4)Pv$uMYXP^97q|uKAq8PL7-(w=Nxks}K$Nt-a
zZM*eikR#4}pIDqqqb_=3-<{~6n$oz&_*K6R1^z8C+^9hpPsb}f_KWCK0FO-t@Yog8
zOFY)z?lBjU=@lM3BZkD^k8S)Gs4OjYb5#|<V>P8dDg7uHZ;HT}m-l2R`;8=*5I!U}
zfB4upIqSzmS!BxB;FQ^!6al(NZFIUm(?atz5C2F%VhVn=Z9cnmoN8m1imiL}u_=Q4
zP_5z>b6wDlyR;h14M_2*OFR~|9^#X2bdOFbq)F%yOfZRINJhpxb^%c7jR7rE|5(*a
zHdrm-5|2g4*coy8z~C2jsY26=_JW-XfE}w`j(wh=t$LKLY?71n4kzy<2P6J8V|HdU
z>1ox;Q!VjaRq>gocR3v=+#)7IKPpUgvhrj<<z<QIy?mFqd=fArWBgE0BI})hTebv$
z&eQR=$BvP7@pMiz-SU@sELaf0V^co45Jn1}E5{wI5&r7RlmNRHO>^xRXlT8A3gEGo
z-RYNjERz567v}bS=JI{M8w|0P?zgw@S}K}+i`J7U(IyNrE{z!1^SCzSeQzc3-pdDd
zFJ+}ap|8DUe3zXxS2`s0D(;k<Ns=x~AiTl?vH$B?&gsi%mSqK&DzDwkBdW@u(O1a7
zrBh1E8+0XzmgMKV9UQ>MvNp$3_lwJto&YO)_bHdXBqo|giHm<DJ;iRWqT65R#R?*k
z)FDH^yw$%Zysn1y{<9#xTEB+M;L}?2`A=NAwTvy?Lb7#3$K{f_Z;}dbM^TgX(0{5C
zS7DrgLn&L&Z&j*wf91n!eYjqOBSZAZX3Giyk5%$;VY?A!)fAW8lr-P;=zfzQaO(Ob
z<`sa)g0Dnb#%2JIh0~O8WWD)Kp|r){@E4CYz26dE*An2>(RIJouch_lS<6&z>yQ=d
z^H7VAK-+uS_P4oCyp!5KPth&r?Thp67{-p-mfGL*<~}1Gj5M7|GAsdZ2Cwtq*+Aa$
zFLVjXH3c|`I>*KWcC6qBPOSAcPO>_##3yil#Cv1w_X8_Lu%m*TDohUNQO;}3P7Cqd
z*IPcH<$Vl<9yhJ1SoOtZ_C2tk9war3k~4|3PD?`cr?u*F*Y{<eFVV~oxLCH2vbsd<
zmNQuQ<%kcKO!No88Dz>WtwoS}+$e84&tXAinPlE_=?A`Z?^~M84EC_t&Nj<J6}v9m
zb0AQ#+H0@=<WDCmHER^#5iz$yI6TeL8$n*Z0$(e*;fP0R$J1AVP`$g~UJN36%1T-k
zG;B6SE-v4B?au_a^rT|eq|D+3t<|d`*$MTgNh_vF<3D+eo#g%Y6RY{u&9j|pa?`=j
zrVZt%v}8X8w|&Yz`Goys{kF_4o)IT56a#Zgh~-lzP+LI$LU3t@>K?O>l0#4=k#Kj`
zUP?})z*T02S(Y#PRL2-5U3?n8KQV&xlP3q|{&U1n+Lo|VWe1DXF`3JIHp_hrOMaG!
z^FPa~Q})kJrXu85NW)eL!d6=t%4b`j92RK2{S-@rfqk)y&BtSrF5pa!ApTa0R0D^|
z-DW{z2zo)BR1w5A-AK(a_(dlR6~+cqdZWumWH^9%CfK`sozR<#b!~B67P-puc6IxK
zPS*34T!pQ>G~bGBEdtPbuWTn1n6_o-zuBKX6L|jQ$^9o@nk<%iF}p8WPV-5h0F-tC
zl&XO8T$RcbeG7Z8P9B-h;H%70xVrNge}`QSdeKP|8gnD09oY|}47KOG7mQ#~os+N+
zei*it7Pig5yf4IZAa?6OD%>7p`{)a+l}l(!C+m&nw_yMtYsUu5bo_XU$J+1y#bcXa
zBcmgB>En;sdv4WZRDSjBibRp;OBLW3WPI&rX^wb5e|>*1Zb^pawCL99%NM5=%V>GU
zM|2pNbZE-%A<@#cFe+-U$S#&tjAD}(RelpPHG)vB^NHUwvVZv;>!K3k_%-}^cVvQ>
z(1D%=g9Jq`BeX9FfjGNxL01f%@!F**s}{#}ExsjQq^S2HLiXM{OtiQ^jYH?DT!QF7
zqHHLESm|(%xUp$o{9jR)2I1l~ApZgoW#7y6!HSA>a|NSKZ@>7!k~2P%z3MYe7yhUI
zq{7tKC^fRHm!{aAx+2B(qTN2|+TIdHj8i3VwCINyFDx(CsEcv=R+XEgS4}Guq-)pS
zCo{^1!DZ?;2Kaqw+LLEpjLdUngP-HS?-%}9%xF7b=l%6^Yt#Nct&>Jl)g9-VY>}kO
zc$yFARi*`+0`tB;I<%QOpW^**U3e?YsD5GY;Ix<<&f%sj*!w|DY788!w;u0p4CN~N
zyutZ>l$}LCF#f3R{8>-r>9ZH~w{E;5I^xg#ZE(#f!GR|1H`4D$B*|y&y1vSvGO<j>
za}M*wJIC~2neH)o_uI!Yhr!l@pV+`Y$$5qRigD$rJ~rUc$m?G-JUg`i5Gsc2*F$7$
zlYN6xp{p!INYS6h(S<%X-YH#MaKI^J<Dof+;lc18l>OAsbSTNtdw`T)BeU-Ijbl&c
z!I-URO6R9m%v(;m-t7b~dH#twB~P!Zi!wN$L{C3_hDwQwCVwERp3HTiyzWw%$lx}X
zm!d%ER-7(r`n8ZOZ7g50ds8KwOXJvnE2gG3>!abK(_Sxdhhbf>th!yBDmUYUwntUt
zG;rILK=12E>7mKOAp!mOl&+=C{#kM4QB;APhPUkAGVxl0LOdI$1+g64Rde1$UT>Md
zSb7CbXF7~X(=Z3clYh0{o|QMFD@b~+_U?=lHO!gGZJ)Q>=iSllyzSKqA=UMDSh1}b
z5?$PVPbICPWLVx&tVNm0qV~(_A<JpcdXhqvljR_-@2YW84_61FFNW{+u>TMflc$$l
zW~l$Np`dN3sPnmSp*4rvt2fasVIw&1Dgn|BA86_~hU*J?Ti`*HMjk|O8b+_(#Bb1}
zlqBUGbh~S!5T|B7I;M9Nu{rG?cXBxC-9h{|_oh%e!H0`sN8DLmiMqqN=yw@A*4ITu
z`w)wnq929Lgsn5f!xWhv=lyQz-~GHfQsue`pHiKX2v*Xckq)!Qj+of#J~rzAn*TcG
z#m18klKbB?%ior8^$0^gAj2Nw46<hKPSA3Oxu!qjdNsL*FLHrWB~XTvI}+~?o=p(5
zKTQ=h46UrNNhCLvZhvrG@=oyn$(I+eDZXq!c>10;Y;%o-D%;#qO=0H=L|@>yE95<E
zGaZIBxQUzf{D1}22ad7N?DAamK)x~B5X0Br72Qx}nH&UxVVMQ&N&R*d(ve`8t{o#o
zEeIE7hxzpCk*ua~9E&$NDGE`DJeq)}o);v@Q8^LJtj3YU%2dO5cPX7l)t@|-NV^kl
zABh@_vq_;)WEW0JFhOZUjr;33Kp>FZrY3!32qXmt0zqc5NDWC54X|CUKmWo9>vQ20
zy7ma;ld=~mx_DJK<$^dxRQ#9o+CI$<W!mUuI(-9U_4B~>SoMMz<j=GFHNR~ndZ4mt
z-fg}YiS=W5#03$G>_-Tc*QWb<6!|UDT{kxX>{!idIdmPI;BzhVex?D73qgNR8aQNq
zlv&?AO;U@7ld%hj67_tOM3{Vn)ULTtSom|wagQox)4_FtCw}pM2uM09JvEg(*RZcq
zv0-uaJZDRPny9N$a-mbNdgIuD;gbokQWP<t<6k@00(3n9uw#8LYM&^yLR|0?nY67}
z3B81irRBw#Y|xJ4AJ27o*{&ISJhvx^F~(QKwi^&Spdwhp`c;^pbjH(bbJ(<mmg!Kd
z4BWl9otJ~#$t6K?L&Q3obT5-v-p#D|H9=6Bnn1bXqkB4eGu_NWivzS@kPo9nBj`@c
zJ{uQVrmA!GFlaW#2-c;F-0EB-Tj8-(J08PhFROn=`ta3_x9Sst)fpL1xFB4?$OwV-
zy(*)MmoBM<Go5Tf+?8dxRsrdx=1!~d&Iu^Jdo3!Q<4$eob}#+zW2nkE6(--z7?fIE
z#@$vT-8kZxRwwQiP2OtHByYdu2>?*g9qI<bg9@C_hB4#X8_dMt@Ts0>Lpf$*-ddk{
z-O49>@lc>Zd9Uoci=u~VLZGTl?W7mS4IS*f#Vb?x$~HF*ry=zq5~a*puN*HXO`=<t
zS*+iVA@mE}bfQ$nZ9gR{SRf2KHrAN7#Z6BErQ8fF-1p|&&yaV97+?KxE^hf=-$_Re
z0)voB;5X{Nm=9KVT7-AHuP-KiYDf3LrFJ`M?qo)ablEj~+d-TV>?Ay>j}%1kZepjH
zc-pR21nFaLt%RM2Z?8Mh_igpiYKiEBYrxa#wba4@+31Q=sQ)v=x-!ame<uyfPUk+T
z#Pu@6rCB|&`cC!rC6L_P8IYg&$<R`y|1p{sCiv0~p<|Gir%dZ4DVxy0CcGb<hDsq$
z-iz{>K4@HMZ3}b#@j<;DkdwMxJFuT;M|GMvaP`q{y18i$Wc}i$LDzbT;~g1`+cgV#
zz4+Cx-<y&>>A7Dy?4F^=Fs0dCY<qO7#ko9Jy#_nd(AV3xc=a@B+f}X7aRa}G>CEX3
z$*;J29<-|tBZ!X2KdFT22SI!{ki+fNU?B5yStl%;z6m*gBEa%MiEOd%S6$OG@y`Kx
zZqP#*SIg)1lxsKkmZseAv|@>UQ-^bx&r7rOHBERT`vw=mK26;=qQ29w%vR_3xPCPS
zl$#jlabJWr^{q4cjrw)<GTyq;OqcY+<#8xC6Siq6ipjtKu44lKGKu1ceADoS?t+p6
zvyp)D{VXDzk0No_>|7TI!{}Zt?AMyJn`onm2ZHie4LWfA5BXt%hfS|~$LX_|9=NI1
z_^v9HPx?7FlJ2kUeYIF_o_{lc)W_Mq{e0`Xob@3u4pU@3^c64@0j2@b(o4VJR&?4L
zzlSzeYX>7BkJ|IwZWlwg_({)Kgl-LVy?#iYr`hTf8xasR>_SpwPQ$)4)`7HL+|Txr
zKNWv18Cstx>$##nGNjHHwky9^8Qk{M5&ynSk_xVgQq0#J$aW0JE$*R?fS=){4+f#(
z9^1&fZYzd)>)SmEL^*tFt&b>o_;Jr`!@>?fVkdY3J9a+jy(yu?d2~Gv{akRoDfRgI
z`sT(3!GL1c$fGc@xzz?2)*;x==NTZ!B9VX`OK>H}242dsdjH6=orn*(dZgoWIsSUH
z^?KiSBNWHvI73Js)d|)+BX-F2I5Y`*MI)$T^5g6dKu%aD#2z=>{uE67^$vZZFyo#f
z5@2J=LxTJPHWo?sA2znekO^R8mGEW_$T)+Hc!OdrLJ-r!5%&WFF4@>!{+rVHWRWqJ
zWdS-h(JF>YSR6TMY}B>*IIrHQ?JG9+T?4avNVIL7oE5;vrb0^q%uPu?c@oci6W>AI
zRQ({H5MX0RxdAp7nucH76Am>@m^Kl=pQb7s=oc3hcegC@t>^=*ZY+VSQo#Hb8*9Nz
z>Isz2r3JoNk;}{{XwNrVa<L#HPy7hAE7&Cc27*o)6Y8vzx@yX2m5>$mCxsUfz#iMb
zYD%1!=B?UHd?3uSyi52TpTr^+`3E=oVueV>&w2owm?};3JSf>a{x+>D+$o<lKc8(6
zZGAC{Dlkv^3L}|ujf3|+#3ztlY69Sx@NEoCrv_JSgNW3amcZ|pfq{(|nfN{OM_Ba)
zMqayHV(`;c)8tN=ntvML#9r*Ck|*din54pZGwO;`{ToR$@yT~bsh-*etrnAxK$3&v
z!&#lF<X#4-y&_W_aGjIR(A(mW;8j?yVb>MG6S9Mlv0@(+f=StGT-E$y*NPqOd7s$l
zJjC0|bRm#1pjSxD$M<C=H9H~md`D(uK^12wbyNJw-B(#mG#Rd2Sq~cGYNtu=2;*&~
zl3buk@9YvgDnU>EqHR0z&V-3tQwdB`88488mif^2O;Vp%WRK``qAarGWQaUF@d(oh
z^bN8vgmWI>%^_bE#GOt(@68N%%VjKlQYnUK=7)QIG>6R&M<s+yzz)9^2}y8+SPF-p
zt-!g^@O~s5x|#zeC+Ts^JFdwU8_m5SBYA^_5Qq>p+2a$t;t#ybqg*BOkjnku3t=*V
zza@BqYYb=Vgb;FPjq^f0(+Cn?L7{$mcUE#Q?6CisvBsBvEdHM@(!MRy-xg$NyU(D?
z(1t5B7Gz0=lSp}YH+cK5&!rhl_JZ@9z@-^$_u@_}8Nrnq8-Ma5)qsp|l;k3n#M2J)
zGb>-1ujsS@hI&dy@sv!_H%GFQ=#Ekm?Y$yOz>MvbK@NJeeZ%8&FPXbCV+pU!Sfka#
zf19z|mPLRWo5BmRBh0!$mO8nYW^a|8D;Gn-1eT-JfEnvLSS-Uzq`*~Dd1c0$C6?7+
znX!c2q;Cr#yDNqNGGmGF)fA^C5;lt9X!4M@_&v>Zf0aF#lUklZF$WRn!;)UJgFN|0
z`qZ-MS`MX`uzVDQ$M;b%e`;A91MfRtg?)6!pH3kX<t#$wN;qpJX>Fy32#J|pX45?v
zwtHpm?p40&C3eWFL?c4-`l_^Ec+2VYPukUbM&!f0RS8CETZ684c4eOlUu)Hs%?(!H
z87IDl%se`EY@P$(WO$7oWKA(3|DON)&RP<5==N$eBn4DM?7_@42i{DqaVsRX7|o!x
zvO^n?Uwo@!(xJB)ETgO7y2V?^R$9xHio@}(mVch^eN7pwRh^qdmPoGsYIDVn{5n*{
z8&N~}4Fhs=oi}b2xymiJ-+k+(053MbUT3IYZ@c~mQG+3WgRxG-O%H5?SyF>VMT6B)
zgUxosEu#O3vUY#L*xfgW+V%G7&wZ@w?U03v9&dyHCCWb7ej85I6v5vVrPCDS(G-`|
zlu*%>G}QEuC~HNI0^#BEzja$H$g--hP<pGh@-I>L>>YJ24j{_Ds%Wlg!J$@eeofR;
ztJ7RM)Z9?fT+M$e$`<IfG;X&vwX|S}TH3Z-8i`uFl3GjV!SAhF`*K@965+Crf?0iW
zhFh9N49Gb_Z6EpDCOz89liHZ_+b~3Ub|4r<#XGnCV#BBH6`#N(Xp%ktjsu;J!+Amj
z3-Y6ijx(!_la>xFKel6OvjYUIx6H_Qbvn=PcSLA0d|#>N2Xt9P2T^6=_G)Jf1BOBu
z^CMR*Vi05Y={Xq+^J}}AR<x5{uH(-<n8&&Ua^8-T1MpjB);tV*E9Srt!&ZsmM6t+N
zcLRL|ES{o`->96(s;V8>REC)phP#yISg67H!ibKlq0VBzF5&MF#Zm9|tr>KayR3(q
zZQ-4Etv#gY-A6jT+MWU*@Ab%%6YvDpYU%>ffnFQWUdiEZT8B4=!(ArH?cc%gjgm=B
z7P^Da-`}<FrAzMP9b|K;>~PELzgF29Z{7E2yh>LDzGNv7Vl>dZ+MhApkE-kA`QCRA
z(f=T{TG|uaPXHevZXHz89iZJG*q<Lv3+>%B7<vZh-?pU6^cCth2pR^!Sl>kZNZw#$
zqB?^(qpyL@)>Lm0-L;;BOr3qW)`J|PgY2Or<(2)oc|*WW(t6ZL-T5G;+=m6!z#3xk
z!*`+IPhZRbHDgonIIoj9G~EvC;{OZAPTjuqeSvEAd}KRq1luw)6FNAZH^@Qp;Y;g>
zjfD}{&<_;PK0v*O#t>tW5kY(_s$?ZRwY6YEWrC=5o;3$OuTj+Rnqb5T)tlroytdJ!
z+);l2(KD-wW93n5FU;rUAvv!x7-E9{&jjO-@oA&lb!4sr>)mz}!Xb1<*nSd08kRIQ
zcv54vUsYgYva&<QYeGz~!?tQdp=xU7eDJo{kn4{D=gMg_CN39Ef{V9Sulmv#eWC5^
zd^I4#C}EOO)q825r`1;9dwC(G<ok)4xMJns$J=mN5KqP|j6}Ch-?74k`C}BVW+S`=
z04nw;MW13oMX?A87cp%O^3zj!as||EOxvgf6MO8BITEk_iih;&e`ZAdXLGz}cibn-
zs`$U9QcY2F0#xjKuZ6w`3r?x{#XsgBj?BOPGZ%rF9~+rUBCfyVFyF?+nMJ(VM2vSt
z&qo4Z8W|DnK`!V<WSo;t!C5&J*Oq=R;{8;?E0iMtX19De68ihW+{m-}8VBqf#k0OJ
z(ZPwu{*P6QR^!Vx4)3b#RyLTlmV3z3QlXLSRPMBMH7C4bAil1m)d!*^du_MZJ7H$N
zcza54h70KS+6po2Qs4eE_&E=DWTs_tu}*%8KV@AXyb6y%_+r|n$JU{H=D&#La)L;m
zgc$;S4R?^4QEBU>V=EUA7OVHy;1`RpDL&t*{!C~u+f*bwvWlPP%Q6rM(_EpQ3Xtzp
zUOgb+xab@@@Vx^l(Po{zM5`NCJ3&BxDlz?Y$j;a5E`^;UqMltS(2Ti%RGjIXu!mM6
zbdvNEWbx9+%U&TG_FGeAy+!$ofc4JT@SUv}B;UfuRfMQiqdJ8{46%gj2YPBwY8rq-
z9Cq77|B{NeD<n!gs<b$=HJjKf*xBwN`M&LUqeiLcVi!7YCvwq*8!V+6a~R9Pwv}2;
zA{?pLB1$$({{2#v)u-#Wz1LQU`)5@4uM_*RM`sVby-ofjIF0uH7;U)ywTsd1@0Cl|
z0iN0x9H%>E=S!4lKPXRqmsg@G_k5Q%wb-`WmSX%!PunQZeV27ceu#*E|2>LlfW{3i
zAi+E)B&#-n-{kvkhikSXmnOJ<s~hnF%rvgdG>zHjs~)0g|8hM-3e>^2Xm^n9NAwg<
zJ`%u6yK_KFen`n0W)!sQTads&LU@|L$`Hocz6-tOixnD5#W%}WeYJy6_l{GxnoRT~
zQ??QwgFgIr$ttcN>F>|@s)llg9dN-7d@tlJN*~_e`L=2Uq(9+5V1-Cx43Y%G3Ke1f
zZNO^QwxhlWyc2x$AXeE&l&9$53#;F>PL2syk7f1}u6?2(vNL5PCHb{T`$)rOFP~J$
zj`(~u!@21Q_w|=s;UYuA%imUL)5r);k!KgFgkh<q2TGFbWWW7c+~oJ!<;Ir0e6v0*
zd~qcaXkC{*&nK0mCvdwJHSk7GmF3TbBXOqEb|U^|53u&Lk2l|jEWDuI8O3|MLNdBW
z6on*WG$sP-d%IVXV^)chNAVQ8FKdCPs7dozu=ts&q@b}!6r64s@Y93$Jn2GVnG5QP
z#Xna7QTEUKr2kus{Y<Gjn*UdeeO#B{;fI6&A1#*sN{f{uz0_hEMl8qi9@o)5UK3Ts
z|4E<b>id7#yYqM`|NnpV!!QPevG0t1mu$&8Gxjw}cCv5T3MI)hgY0`kWRxt0CQ-<~
z3uOyg$`-N{g)rx$-oNkXcfP;xx&6*Lx9{)vJLmTO>-zWl<GNkf^?JP?kLTTjADbGJ
z+O9kJQM%Nn-)dxpZVDH4;&Tu?GMfL+<bF!kdZ*5?GWJ(yE-A-2x1a^t!|Lq)XWsSa
zPFOgfD<mb@zkeWctuxp1hwFztl`sgW)vo){GsAqX^3R(sH;khn<j62n2wvCPu@#tK
z)l)V!rv5H1eKR{1+Ym-}4MI9vF8)-%f#|J4Uemd@qkiirn|A^N4|WJh9vSU)HCyN0
zOk%gl)Kukbt(eh_M|5NAp=GH(iytq2bf8N`%L%JqTkP$EO8fMHo8NagJ7=GZiS25(
zqF!^Q=3C5at0TZLF63G%F$)x7@_jvQg}AKy`7)h~PT5u;EQr+uH)_u{<!07=%M{qK
zbd8mdu5}dYEvbATV-+G2lh%3^5k=R98_*Q5G?r;i7H`~AXLf9~5NwREz_sTH%z3O=
zkNX&`BU)j-t<2X#4to(msML*IZ9!V6Quf!v>q}|`5?NyunLw4XdcRda?o#)_Go~`B
zh(7Mg3gWJOE5-M1ID!4S`!yh$J-1<biYvtz2SXyBFf_t*$`}Yjm#^;OlwEg<6Hx&z
zg;aiQ)@V*OQPT2ZJ>S@FsBwVqK)z1nfPh$-9+9!dTV4@7dzkZ$%F0pL^C$^E(Wqyl
zx_S4QkQOYg#kC3rc{&EyAJPuyD|fFzUd2w}UoqV{E+PGLcb9Kbn)kOfvDGz>7g5$)
zF!WU$Y^NR-`E6MYX(o#9Ct2JLJzD0tASQ1HG1*@>!-$}Q{?0rF^$rm(wM=+gQ4jUA
zTGvOuofqBmZZ96Z)_Bmb&Rp>04&QrXU+d4@hM5|J`9|?hZ0~Ly^>msJR<e@BVvl=>
zyGu(y1h3wqImFNv+#@O$r46GhH^S=0I&<+wG2P6Pmknh{65i%N8@=KvkzRB@EXIS6
zOBlx1jhGa4e5h;DS?Xy^`YD2U#*O)Bv1VA^MJ#U!V}B-{VJ6WYd^I{?U)0T)_0so5
zSk4kf@7|-Gs-`2B;yHP70-8;YV%V)u2g4P-Aglj#2_K6~5zY@{%(Gm4TwL53y!x_B
z_3m02B#t|W<cT~D-{OJg_maGyBOzF0ucw(om3TH;dxuxQnD{^Beznu0=+(BYaMydJ
zHVP^G2()5XN~p{m{qP|MT~>!g#`CZkB;Rg7BJ72MTBcMrs=3t<=y)@_rbX%Py|m#7
zwprL2eJC#O;paR6G@|V}+xFVHEe|-Lul<tmrlbTw2<P*fO@u0yT~OSI-K`3{4ru9i
zm}5z;?S`m4G)KIE8>awNXdNPh0ygh<>Qn7x+)hDt&smvfP|jM=tE^WKCi+G?aePzg
zdJ#^3!@LH~zC+t8FoKEvW<7DJ;1VguAeh4X2q?SbI9j40^p*(lL)a5kuZncql@$m>
z<3Mdl6%VDky#{FPr`$e^4!w=;7;|L`UOprO<_6Ul0gAxvo~;=jbu$D}CpF=!SuWbv
zr<4vvQQ}obnN?*h3+TN!mOtm2w89r*dxMa@wM_@}@Yak8dm*fpBe{Nff~?-{y7#aI
zzCl@HBNn2jD3>;<n}T{FmzmPA#w*8PHS7dBIx|uJ!d9mf90}K67CqXP5_q{4#WWA<
z3!8dU8)vn#Iu;dQG#h!s+~KYz7snPFw29zaH&Et(5-*ducum{G`I=~@C^k#VP_p{H
z#v##g>_S`7i9#esemFUujk=Iq#ly`#hyLc}g_wNHPL3c2)A3ib-1B%I?H~nt<TT%N
zh=`{)I4ag;Ypa;-dzUfw9JTWHmMXjEb*oQxW^dkHmARIs&Q*bYKeWF=NmAxscM8Tb
z$Q9lnE|J@xfM6-2>9C2}*8OO;Mju0|d6qI|MkUMlW}}r4*DaO5__HY%T;&vJG&DZ1
zWHppIT2-v+?RoXDC>!PN<w8)ho){f{^R~m=C-A>S+0P$tcltlxt9MiV_4#8MBmhUM
z;*MsX7`U$$@Px6!UF*WcU~+Uop@52qp83Sk!_I&rxdsoT+Y`h8CCXMe23FjjUcE+k
zcf3ROR^`L#H8<_M6Q3Gyy?Hym{=cs%%kdwIvh!f#GceW#L;#5c$3`Ghk^$oTz!eH5
zgHcja)4<_0)O2tfMtV9{CPrpvR(2L<PIfjPE)ISkZUH`C5dl645kWCgQE3TL`SX&}
zGIEM?(yABbl$4aw$_naew7w?NL{C%S;F6h<?m3fWD-**jrdRFEjAboSJFIA}t*xDH
z%#>_1y6oAmIe9ucIe9tRbUSfrI_K!P=JvSq-f**j?;#lI>12344;V?@=PlmvD|Oe;
zqyL7C+0BBR{{EJ?N<Q9Fw7vbzKPVg<<ag)JosV}^9Phmtyr&))dTTvQb~s!+F(Swm
zBR7oEH;+`nL?vuQsaQoT`$d<hN8cNXzU&hNfUzk5SY$vfJ~K9aG}df0R^vYjj17M5
zRQ@=9>aokzWB={PE;IT5p}7CmU~GO(BCa;MudZUTF8AfT!JqHa3+w+A!Pu7nn_z6u
zc+>j$`yZdX`X<^ACpreEx~8VS?o9QKOs@@nd4Kq&clYby=>KCdcH`T@=JLwc((%^P
z`p(Mlowe<~jUPXEj(+a^JlOj$F!n>kyI-3#ZSe%|OO5phKbD7IT>IGA@cY-h;q9DD
zO^wIDcV}0>erzffrUgNSXTnJ+f;7UQf+Yye|82n7H;L57KRqx|Q6wuOLo~)7oqw;g
z#aLlBgTYXi#hbogm3NTd@F}FaEnfJ02LH!rBHlmVi)Z-kiWITmqo-13EPe0!81F;)
ziKVKC^1HDSd&{)Z(5-`K<oSBQ_G-+Z5f~}n23|BA@``7Mra3Mn7HZ0`LBpQyl|h|N
z^#5@%wz8i)*uwwKXX14NxN3yh60BRVav|=#v_1Whh;%1cM77!^60`nd7m0Z<<^`If
z;ZF%rF^;GCo!&|LzYL6>O!+MoZse>ct_+&UhvFeLBING3NzP}6>n$Z81d81yW@y>?
z!i?KLz+#B39w9RXh}n-EoKK)+5pz)}+IAXlb>fs-1P?LfgD=yGJqsmxgg9iG2Ya$l
zL&d&FMRd&L3JU%dMF0gv8sOfO^Ww2cD}D+Pn<&yky&$|#PJ*a3{3=DR9X06)aT}2+
zQV@5)?tN4OQ8pqHoD(HS!k-)%H4qMZpGi-;udw}jP;#o0h?oXl@g3F5vnCePWg4D9
zD6!`r-ABQPw)2_BX^<(#?JV9~iL8g0NRIt@*@w0phb~@+beGI=kvfXAD>y|@>MZcG
zd(^q~I5DCA)4<q8c~~`#;myjZ6JtRc%^5<U=m$sku;&k6xu(Qg2FS$LfZSk2g`MF^
z+l;%-9c%R-b*yU!Mz_Yvc#7^Pgw~`Qpk_4LKpE6`Z|x)r=TXvuHApa7zK8~rlvXx6
z9n4fpaLF#2s+|KFsp?Jdh2SjuUp(Rlii07;E8MmG-;<eKR%!I(qF<dXC#z|u7OU>D
zgkuo0VN)6YO*x|m>of9L4RspJ3~ed)z}|Zyj1LwnEuf^W=yToYawr*@=Y*l^_q_+R
zPlU6eKY2c+a~5*H{x2~0(IoFnO~Z~|ZKhrUMM<_dh;Bw`a;(<#L@u4C5l(2Weav(V
zlU(}Rv?F1HDe~U(1?x#%vU0-JrYDPiguE1|bJ7szBwdg&$CYT3(u}|kmd%}e^7aox
z@6Z~QeILjwc($V|Wm+DPHAA+WH5&1AyO`t(s%gtz)b87Em$hC@l-t@YE70d$bD=`2
zg)Efp^<Iil7`&z7S~bSS>A~{UqK7x;VX^g{P7l`oQJ~(Gy}Wmke9=EQW)zj&f3?Jm
z^a{&Mrq`*(_x^`q>^rK@b@T(r?hD+}k;%VjpLf}O*m(H#IR8YGFPw-?ph8Lb8EfI)
z+Er>^QJ4$a#e>PIqZNC#t;@oU!hR1id0f7~X!~4<bS^`+-`cyur-#Vf>?x`OE)U~}
z_T}6m{{_Z=c`Gbg{-{YTSfLdb0FRU%p}^vHyZB2={|k&AkA0#Lr^Z9m>K9j%71z3D
zQaB!0u^)$LiLX?Mud;}L6BJ*Q6<=2qU$4OOy&1ziNW;KF%TPnp8I*8eE@9O_p>sU`
zgAPv#Ud^aEj+K@~*A?FC7fp6q>eqdDFmHqrns$N-LARf<xXg9zC;S9yR**$2j)6;M
z!lxAA-&4qMX&Ku%!Dkg{_kxnMQ<9fhQZ`W@GR>5~5foAx`f-dTpdV!Of;K1iRCe~n
z+PDiweuyn8FwKvotr-$QsXJWJm#A57eA@)5h7!R<Zm2FRi4;#G42{iBAm4uk#!gD9
z4e+MC*rq1COnr!e>v&`cqz0I#cx>;Iotx45bxTTc#B_xI0$GvN^sf5mKAB*+ByS2e
zmlOE4--8cyYB#{-5|}jNf;63W$R?kzycBp7tnTT77Lg%eAeJF1Nc*q@{=VxjZmOt!
zk=%GL<3R+t7y*Be08<Zw;*s!p9Eg64h!~X(J5L-UMLU6m!D(}<mtnUCcq!)3r?sO$
z_^C_E82#AQ{@yHVI4AdY6xlIC^D+e@K`cVCnB)Eb2QU^#1ug)j6{;1HLJd*4!t<xZ
z1vLNrfw4F$+2=Iy8E`!E=?RF4DusllnQYUZT%IDE2?S!YC;GPaqGg4q3P?1@5wYN*
zOvq>8SI`U*Fnoqa_`kr|22VJ>adxdIxzP(6OZMt<HnNi~YLGEC(4(<_6wl?9>!;6i
zhyYnyQ$vu2o4Ch!R^NhKYKm5AaAI}e{3xhE&p?QB;@Qd*987ivtcs)IPN}{jRg?UJ
zMnQ_`B>Y`n@4LqMc!uJHM@l^GGZiOrG78*_b;~*u2O<bAdy=ARObk9C)}SN?Vkd-G
zk#1Ad<3Pl?^8a6fvGr7w$WF&2n6Gk|wpXV?W@kt}msW@`3f`^#p9jW{+EW+(Pk^!Q
zAWDFWWdlH0V;bB41TdD0hbl)3x`C(N#`jA&^b4J*nNfz1f&KwwQU9;O*w1isP6_x1
z9yXmqLwufQ3=bQ_(Ey=_6$BN)vChM304kMJg?h+%lz4E|x8c*T6e?$lQ!{o5Fk@#Z
z+mY~X5Os(IJnG&!gmxUO0+0Q_Fk`*`2WIRT5|-dcl@FpM22OzC<ca^zj160-0nFH@
z|DhR+BL{@nZR1ljHi0lhJ&zd7pCS8XNS==*e`ZWGW=xUMJhXQ2%Xbx;DO+Gr@+XQG
znqK>9K#Q$2ZtlfVAEtbLwlxB1v4CAVRsRK`e}5qW`V}TrK2F?11NgCZGt^$kqm2WD
zD_i8x{AdnvGyv8+gwJqnfH@n&Hl*eRD#||lQA!z&t;|qX`%#Uo%_1b{`0bhx5L9?1
zY_EAV_#WjYs?VoXtj&Kw#d`lk#oGU+Vm1E*D%Q#H->BFzKj_^Jn%j?;?gCV--<cFk
zpq>6p#Udzkwx;pTlf5%!^C?u`#uQ^X@}@kpcH_a(df1)>Jay(fE|l^<a@61W%!x(9
z8l|WYXUMR5H2yQxZCfj^9@FG(k@~~Q@y#@2Gh~2=S`DK1ZiYHbLA{$-pf{+N%gJ->
zC{C$ZsTuqL#2*Ny8jt6LC`6{0DA&nOso1S`5s5h<!XF$;GeAuNNWQ8SfEuwrBMHa%
zf2lN{zJnuQ?(f&~Nz(bBqhg)EEdLu7J1~fcFPZxRI_?=2D>ZoYWJ#Q`x$~Eb#Vy4G
zRP6b`RIJb@b^C|W%*RyNt&xppn&!te+xFi9D)y`43VvocGZcFD((Z>OcpDN@Dn<R&
zhBDNT=1m@rEn)BJ(QYMRCeHu`$+axwWj7GDr4%fx0)7ahT)#(^)%+z@iW*R4#|Ee}
z!pXh+fhaX)?gkB@#p2-P_g+%QHtl!XPGkM3b`q!BaOBg-{b+8Qn3wyU4bymlD+a(=
z`1cvVLu>A>dYztRIx5SAkI(YjD_^#M@%z1qr>cJWZ4ge9SicP$oH#-3&d-qXhEZML
zpvi$R=@0A>(|$VfqfAA>M>&t-D#xi(f52EArRdjX<tDi5$D>y&)MF_$?UG;n?M}Q@
zVMklLmn8PAImx%q5$+=>w?UL{1BdZc@HXClp2bZ&c1QorgI=K&oLbm@3UqE;iJ64O
zG~^qfO!A;y43FmF3v<y2YPa)+AJlzIwkW*u%f5xK)*xLeY)Fq5`|U-hWSIPo!}+E7
zLFv$WDI!}f-8_RFo~T3i;?fy8gKE8=o!jffHK`6ANdnfRYnD|WpDJ7?N7t=uZhZR}
zFm`fm^ICJDW{i|uf2RZcBEvb?vi<D1&Qt-JQOtP8oF(s*0s-*o*S;H}M-sJe{9mN`
zGL8<m{gWM3`QW~q7=p!f295DbkFf0yV_O}ItRdGQKT6q~d{XsVo(ued7wP1^)MQ&Z
zHzXCheH705P@8^y_4C`Y;14A~EN}msd!Sgj>HkRnhw*c_O)h%z&<zpIxZ5w;Yt(lx
z&Oc6mKc~%PaMZ^Cz$7GF``O){h;Q<xKJQC2T%36pi*e$xINEDd{@U~wBL&VWH~0(T
zPfACzn)wdGmV%79`W<m8j(@;dZ3LF#rVelX)OHL)@QTSR_sjt4O7ks?)%uV2<leHY
z3GQH~!HsO79w0m@Bp>Gbf~qgHb0qP(cw_eyrkP0f>s<NG--}<wXATNIws!vB`S9*y
ztzdpiMT>4e!NulXmk=JdM>cr3^ZOMhwNM%TOm&uQuo|{;hT)3g#RrRts0n{J_^9mn
zq6Q*L@fYk`7GmGn^d=M{=~8TVu(TF)<eo`76@wyeRClc*<Jad37UC{KL|k&M78Mp!
zbm|5lm|sh#GBY>5e&c>;MWggho149Izia}Auim!3HR(;6+yc4#EjvgP>c}ava&PfL
zaJ7Y7bnsYq;TPS}(%aF2Gl}M0)!iwJTx0FL0fiy^v0{#)2uaNkl_9Uz=aW%HcbwDo
z<qw<;RUMLHdMhH=Q^Ye<4&vn(-JQsDmSXNK=6p=KL%xr*AdVI5u9;huk9(|8b{*2g
zN6D9oP+uaHG<7?rpeEpo@h^NKbyU(53hHa}m6^4P#fip`EMHD~nXL-c$g?k_7Q<Vi
z!V_EA1eukSc9q*;<`BPD$_qz+?ezJSX~9oZi@)$4={~i)^Q80wRTwB~j5~DxUPnIm
z*umyYHFd<xM0W6xZ@VS$bJV@ZogM;U?De-QxBT8?4sU(AYpyhh57@p3fU&=h={wTR
zL+|_rV}%|TXFq>?61?_$EcEwE1hanLjaC{$jzcpoA!K*h{8~sQNyFmtuTo1_*8P9L
zSi<p(^ph|UkTLrU#=f<HMNm51gE{w+P%UE&eW5+6L=Xz*YK&!HuqTkI06Ub?#*uvd
z4&;VGXoe!=C^2UTO51%jOQ&(POrZmncaS>AqVavD1qYgY`|1eD<rsB-N7}?74SvDP
zvHH%A^m+Rl!djQ(t`s^lmIrByyIzjBUT|b?*w>VbzMSC1@5I_4q$OK)Iq|ylytRfD
zI86A7-OC`GdfqO`drL_>udOcHm5z(F-BKxe><PTm%;yx|5Bdjk^l|>ExyV9YX%{^*
z#Xhf~trgdtN;&L=nB3PjetunQ(Rkcm5cM)hK;+u?gn3gRZDeq^lN5%brFkxj%-{4T
zq>!IQl<cYAJzDALqB3U5z@FZqyh^)f=Vwyt2L|p;9vPRO6gj&RE*i9&UU`&IyGU7F
z+wXl#CTE_%IH{4`$TMy@YDr@$eWV9{>y5wernsBRdhA2iHIv61yUzTtYcB~6UWwW!
zad##Oz7#1qB0(Bx0_SB`=RY5yOC9B&#;?d4Cu;hX-IkKy@6P3(0eGQa&a945+vSX+
z3~`c%5+*6;Hd*(U!o(XQ1}=)j9V4dCl&*^C3j_}^9PSn$+bpTwpfG(b_#hW8A#8G~
zd!&f2I?9-|<jRBKtHvf*ADc-On7tLf8pIY@WYghkIlNDCseX=8MpHnde;bzj=2O0J
zqL^iWu(=Ge0j1xA5++xCvb&dH^vjq|Rag92ylUIaaK<%C^6M6ac0JQqVN~LF66|_+
z5_}-s)5Q{+&3LwzZ9Gguz}-!F;t_FG)k7C=%BMu+YNPsZUO)Q-#(pp>3ehZf^Z#u<
z12O*t#wxLVcr*OA%f-h(@3+nJ7dl*TqEDcQ5>~db;8poIpIR+9+pRB5nW^PPOv<#A
zTSev#tDHV?1Z`xs=MP4!@JQ<MyVs5ue?8nx^p#t(zIGga8<Mi@6A{mlI6ha<q~L;g
z^s2S=oEUm?3dTyT6^0~c=Df(=ic&e6g}5nHvz!RTXdfo%3VT6{<ox3AENJiNWR>F?
zS}+3Y^N1}o0F1q%lwaV;Y3(n?w{asiv8<4rhTsZ8$uFlQ_YJr;(<Mn3-ArOB{wO3P
z+fm5B=_u$x-87-l>lAu3!$pz&yf%5?MM3{Zy&RD;#jFpl>|Z~+2h%4uxBPgo^l8?5
zy`d?3yu~*Jl1>P5r++G487Cn7gtNg(^T&fh{ZLuO13B#ahUIXegUwAb+kRof4x@tn
zZn2@a34<6b&Evh@Qd_Da)217rhVJb}Yo;t2E(J@b|Grtyr;Ig+!NwZ}f5!e`^t#Jv
z{n=RcXR~7cS~qO%SzXajYmk|z`|u}@h7Y&iO02W^-nVX?VY=Y7EceZ`_^yPV#O-%~
zz}WniqT5#E622iz)?a_$0@?wF>vw<r{z#}OX_0&rOB#9K@%%fa0@L&JL;Ab8ykw*T
z=L9Q7{6luy7%4I)NuDj2-@m`sQY&<Kg(Ogbnu#D|i=?7(P^{P@9b*g#WW#ew#yR)A
z6tr1>;4_v&7(~2Y)&lmk!ah<HS%Q5CC+oWm1_^^G1%Fj{Ygc?vyE5H9i$j7{zZgN<
zL(UiAYn2~KX5a694N=#28+1FQ0xgH=x^;<6=MjNHem1McZw^20<?c27P#`7NQFM|#
zAEkny;z-UyBU)Rs@E4-jqRbOyZf^XDdej0d2&%uhT#@CZJV$%&LYJhDZ_<F6AV*9y
zMuO$_&yL8(A0=V!&Qlu{GWK6MKH&&pCWb~9>i`F;E_(w+5&oc~*>*$ku>NA`_FezT
z)|mpoW4^wWTmEH@duhd3lH5iXY6j$X#O;8u$3`yA>D=vp%xI@KsYD=+W}p?Qr7+V3
z0_ilf#>Xl<34Y9yi&1=_|Be?FPU;5&Nnus~ogdo)_^}8Tz>i(}<HruXD|R~bW3v=H
z06!MrKo)-L$36o5SU8f!I6*Mz)Q@c#4nJ}N9o{|jV}qJivJyzWn#mGQ{n(EG-jB`y
zO-e(8YB=*_kLE$0B@iOG(w>s+52Yq1{U+&pJOKb?m#>@xvM=A&62l^w>BEIg6HeIQ
zRbDysWBpV??x%h%RHMNu=C2>i0Qj-^<_^G*HBPXNQ4$Ua|KrDYgsW^>hj;l$lT@jI
zGaAqLX<*O%ST+8L|K`V{OcScwh)aHiYbmR=twv~iwU=7A3Wl_b^o48mH5*K|8)-BE
zer*2rGe6csT|-G-R$NN1N{hm&<MWkMKeiL_V=Yeo*b~0C<<+(%Fi5+dnC#4t?Mczn
z$<SaY0b#L30sNX&NCmDV4LX~@eyneZ$^}!{L%t66vNJ!{qWhL<4dE1!^=nvYYkzgO
znP0YR^9sz-6eiTCk&o?0ZfS>;gx@++^Z@+WnNGE~POpUu?+o4CI@I(Pn7S8C&j$8b
zU%SUiyM7+@bO97QAAU0db~izza~zTodFsca%fg@ThWo;MB6iRGSOtw9Kcx<w2E8n{
z!w*@qT8|cQy~d&p+5+`mQSC(3u$A;`do`v4eymidvT5V<`cpqPB%_m|Sv!|QCZ|ky
zw63R(L!|PBN+;mQx}W;7g3f3a(=Ni5Q$Kdj>C}%+bcRuvbawi^&pY#D?@ylkvG}R?
z=rcc7fL5QLfq1M>-MTE|Lu4O;SiIg_xLL#^!6YPY$T<P<V>_CWji#_~{)Xeu2@H6H
z=OMiSVkqTh&`u)OQ6}HH@FBjntuw0|GZ}>`1gjrK5$Ecu0DkO#Um)PeZvC4dJNMuG
zSe-h+kKLEm?+_*iR~zaBer)$2KQ<EZW1(k$>^9)Xmb6d)<HsJSpZc+gswlvZ1yPYe
zEKdE{@9#7_f<W#tQYF(gVwHhgg*B2PM*b=Kz^a`R@MBptPW{;N50E^gZRN`LBcpnX
zk3te9?BeKw+*3cc%Sn^WFyiwM6iBK+Fu<6EDhlE^Kp;c50DvqRBS>5&I!C6tLl~)O
z3*+MG_nkTOWA`=4j!_-Pm%3#&PyJXOMYr%%KQ`fABx|1<_Fd#fM)Wk`$NCMhnbKVh
zG!7_>&H?;b;U0=*eUNagN}#b?e<K3$WA{(}Si>?C;XNY}fs3!6T;)3RV-I%Qj`dZ|
z$94TCqU>D~oLJO4_DSDQ7J0Jt3lK#xhS0eo%m6>uy;=jpIO?6(d+jQnt4o5dj*h^c
z(a!y-$TL6I>(f=%_#tZvG10)WTZhpCh26K${8*QfGe34qGg$6?P~zB&oUw?88mGWB
zKNgO9ewW0>(1L)ezKT75XY<S=aoQru1&?X4c#IxT;<QXN98V_w{P_KNTHaqj_J--H
zAN#PwgfAVG;~gGbE(p&W;N|P`{bumc76kP^^JBBl{8$!r_rLnF<EMV?^-rgMtgG$k
z@JfpeL-hxw)+uLx?2$~@sUIuc&3ER<g72k~;Eg%~KQ^eH6YyilPyN{HhVXlUA6tTq
ze^JZ9aRu;Ws|CUhrokkAZMNZ4KDIDO2#Q2*63=OE^KFU(@ME_$hC(LK|Cqd$m;i2`
z92Ya?`Z1ZuX$nG2-O`It{q#;-$NJQd#VZgd{sCl3GBoOC!h3E1`mqtDwmx*$AJ-*Q
z89)Bx$3}Rwv{u|Dv6QR%>&M1e4hq<A$xI7;hR}6?A@%z=KlbY%Ki0j;<rC=S0jU4!
zwGJI3avjByyuW_zwdtr&)1>5fXMXJdsUJH8__6rEe(b`xKIqJu9}DmD#Gm@H2VSRs
zY@M8fd6p(*+-9%Pwgd2EXTFkIG}g+3SZrW>8rq#R1BRUXqDM8X8g}MTMc|{;c;?40
zUrkHTvrBw#w_#8VVVGj18d1MzEFRKw@Y<2U$2r{zMb}(SLjZv6G8*t>&p&Pgk4HOY
zwY*~ljRSt{xCu=esATfgkA10cpZ!RUXTz9WVG87T>c@67hI3FE4oydY`s2s$JIN-&
zm<vz+*e1<pO}p^>ST$l?b5mfHq$#Moe~`m2fw3G(lVI6{n^#M0kPHcL{o}{#yhCpc
z7<Z2}o%yjAf>%0>K}!veJi~J;^K+dE^8hiR4|U3t)gT%GQ8xfz98xfHe%IFN=hag`
zwiI?h`Kgn7S#&Mn$AZQ?_&@;*#x#H*%d+q)!POtR5dO!HT^`^{IrC%vX4kGSa7;r8
zJVkBir=w!e0NEJQ5#P{LKeogv9Pndv06!LI9e*?_64Dx*J8EgP(4^V$(l#MJ;M9-R
z6pSd#b$Y7;dL01bQ3XvDT1#@w-S9~WHgfc^OAs$|jjUX38wuAo3uh~dX4JGhr@RR3
zURV}$>rhx4@}BQusiz2tIDYCxV^}NLtk$xQ?zORX-#hhV!?m1ms)9Nc+-Yp5yKx{r
zJD4Iw-5u~_ajjq+lFb`dvPv|0?<!GNYu2g(ROccg%GS)zmdM`7Kgh#>JX&yLMxb^w
z_S4scd1Q9)sUM5Wbf`<5x7E1<PMPbr*L1V<v`n)rej{F@+DG6GcL7)Z1!SEX!;Q=m
zrsUk@s8@vmKQ`;sk5&A6=ErU|YXW}kR{N)Qvs%0Gx{Aqu2<WLyH}zFm<A)DTZ!~xy
zi#_7aq9Yq*<2F$?;K?&THs{fqA8X;(9l0tQ06LI2{Gg=*_@_knL)|g+7sOS0Le=dO
z9l=mTP_x}ac{BsAdDaIO+Tk(@P^?-_m87<A-Gka$DDfEYS;382)iuD6Wi|ELy9$%H
zOY`eqT>jC*mF4ps@MB9L-FC1f^=AHC5VMfh0hn*1vd3aTl)>JBLTA1G-YSPn_l4?H
zKh~<MJv&<Qw@=4Wh1<k4LjsM?aOu<erU$bLlw{otYx+_(fFH~AWx^vs`^L0~{}%Gl
zMu7*ia&5U)e`}JcUsVP^w+;BQINwR1720#f(~E!oSaJbSF7?Lj=n8AXJhQChU^!Zv
z3QZaWA|xi9`myec6tZANz>i&SWt+N5Z13*=<zM_*oHdEpi26T%tR&#a`Wa7@pZT%K
z0TCO}(SwU`<sAJ>{`#?6%(@_`|54F`WQJ8;AnBwW=;-dLA6s|k$38RtC|cJ33Gibr
z%<JV_`$ko=&ivTA^1ptpYy$}Q#&hn+q+kh}006RxuEr;C{FeiFwYiIR-fFp}G_?VK
zEW8bh|HqHD`0K~sr?=(lw5CD05J7u7XX+$Feq9W0xeDp!Ki<!h!>T|IJkI>sgp)c5
z+|hSafyWG#Ip$?<;r7H;r|6t1;KvG``LP_pqeOQ5#={lk@R2sdaNa4%0pQ1GO<wIg
z0LRp(ho1VeTdGrFyk$>GEoE~(<Hr$-g)=`E*9uL!GFs@NaBm~o_tcNgqTF8Y4+2jH
z`AnVqvGL}xzONwxXMSwe(|Ilni%<ShvDHxywl(A437%QsJEM+;06(@_)$eAMYhV-s
z*KtJa19NLW7Wz!8A{g;#^3;$0V14Gt>e!BT9e;R=eeZ13<K{V4bcB`IUfDd){qV>s
z>*NZz2pP^AKNXtLbz)q3v_4iO0$N{x8LgUMI>=|<qZYPH;NQCzcKnqf|C;cd3>rpE
z_V2-1Y6hNGj?M(O3pdx6xB0qLc(v2SJ^mdSTROzsk*j!nXYKnBp#dEFKAnW;uJF(k
zZH@ZM@4F%+B__ot<(_+@qh+GkVinSM#m4cDU1<{6e~MdGd1x36t(<|eOGD+?F9>ka
zrVQ<@ul_nW(~KdD|Mr~lP4Wzk^;sMDh8IQt1!MbEzFB(x-ai9l)029yMk@E8g0bs|
z)t4(|9zQq*V>hPi+;pPPz}QxqmwB_67j_l^F!p}%#Ol@=7|Uh)#fsKyt3G(~SZRN2
zt}FeV?}_r^?#kF}-_0{Hc4_#f?;kKWIlr)jH(-=p0TDrJbvs9sT(ky(rBd8SMAGUh
z@I*0Moq@46Joh<+_jzLefU!pVaS<ZVYk1?cdVWywYxha<{R76<JWZ0YC?rl+Iuu4z
zqS)^6r|F8;@~7(yS~#c6QhT5?u3Fs@$h1(s^DV<Nn9$?IcDGtVFxw^Pjw`x&Hr2$L
zR|6|(IUZ}zq5rXkH8VG$!g(q0-r<1|E&{@ssENuQS$u@yeXx`xvRx{CIl+e%QTV_r
zSft2}P83tX&y(YEImKe6MAtixT-5kU9MV&_=*gjI*{k=@bCl~zQPw*79}b6$@`61t
zKY6z?a=o;f;;wjQkEpe2x&PeCWoK=YcjB6ZTk?}SbtYn|)gN51uf3U#Q`)H65s#A4
zPEKRL{8~nKZ_t0ZqSyG{W-!BM{lUt+&1ZMG?x)rr4Ove$v5|^Pp-;Z(i?mWH9pU3B
zz<pBf6uNbTEsQh)uUZ(cAD!>!d0FJw$xB%%`hxJC;8KYazFxRfD&DIs)9+R~;TkSS
z8DLdBG1@1irMh|w#u5sjKhmNc5%bk$?w766I|XAYZ$!<F^xqQL9I(>2mK%47r;@)V
zV`}?z8~|f~_LZjg%TL|tRk<)7IC<~FmpiKs7rx&6eSBdif>KpsHi|t|VJ=pzQDHt&
z=|o{6RbTbuw+Ggt7Z<ayH(p%IyL)nRxgcIu@%yt!p^7V|FB%nB%io<SuD$A2Ra&o}
z3{~2wU2Rm_Z1{bmwADhXro7$39;Uq0Bi5w+qhE=jygR6`rn2|RI!xu~=j%->zozdJ
zRQ6}%)l?6@JqlAj{Qjaz_4oQag6h$BubSHN-XtMR?c`v!NsVy)o1g{)3pW$d;lm-y
z2x9t@W>RT<1a%04gipAI+yswdsz*R%N?NFH;;~#u2&lSnD{UG+Qc#(P;z~&?V<kRH
zGK2@_B;3Y2g#S+mV|QL9haT}Ez#`o!y2_MjWqw}z&v+kq3|)0iG%ufS(VadgL`DsU
zRyw;!KEn}_k-;zgLOtOe3lYV$8VG9wK2l!l2}6Q{x**|rhDHn70`(5p6!vH3xNScK
zb*_PkEcsD}wS&`6ShPfs5s7woEm?ITuGb+2JtkExP=9zgN2YzG7zZY+)T>ZXgsA^U
zg;tK%eyj9{&s1TiSJJfxBGoF0qRs_8eK^f8q<Rh<Z(uS9-vnfY={rUd`#+fObn`1S
z5>xvv0A*fpVf7Ir>U&Uru6Bz~6{ehziHiJO_()RLOet8H1{#-bBXmAN3Tlx1I*p=b
zK?w3BDP7)~T8l+QAtj~9+PRXO<G2((H+%oO%`7GHc9d>`agUD$JyWG~j9@}aR73{)
zIrU&W2cq_pH2f)-e>d2;Ef{_~<H=*^k_F}9QbN!5LokPacblA1Ps$BvIu2r87op=>
zO1+HMijx{L@n{sV%6DSH`*q2A1w$;hz)UsDqSuZoEL!Ny%4$h8MHBHbX=KaGy%A^j
zDIT~j3lB}@IKLp%j$v30U;2|htWw}?a<<WMQ5!B&X>;&OShHDr<uh-=AD)()KBIa0
zcn?p~Icf_HbS~JzLv8wVv<p8!<K*uBz)8@6i5<4ec!tcI?1sf;9iZlt-uFoyNDe?3
zyn9CCE7&16F)Lb`htqs6K7To0y{~}kPE5Pb60M0Th3PwJY?tm85y~))J<6p11qF9&
z8m})S+&C$;=kR1QL~R^O`(YvSJG-t4q0XOtti+Yw(_`pd^AL?VW65QD6T?Srvs@?5
z>+&yg^F9N&5O1obq6rgMI97wYRG7A740G<^C>bx@D2$Yxz+ExyWZ_Zn=eIacHCdOx
z#kysSNfry4h5ZWXJz3s)n40UHF4@Lxc<ZJJ+2wc>cbW97sye}9Ysn$bH>u?X)YV)m
zTq%+R`p{<Q^2-mFkS|R7<Bl{$cqKga68O00gRtq7Qm|@IVx~0LcC`IFk~oS5Hp}JL
z?xdWHsb&xQRuY#=%d=Osln%2kyTRhl5wRzSJaoMvZ4skKy8P_{Lcb8zMoG4-A$EM}
z`hGV=l?`J}KSZzvnmzM-SiW8$%TD+(eAJ%ts$u;G*|W(nlF!aPdEQf+_HJ7F;;a05
z317AQnJqaQ82#z;&8P0@N57^nG{?^+-5{x-fv738(pPNR?qRt}X768Oob!vAa%!bF
z*J<kt-o`qI%%)`&UAylP>BSz&trZigrg~#2{oDe~S-3m?A;>clUxV1#f7?ZxJ+#nz
ztC3uUG_c1n>c%d3St9HJnUzC!tvR!ftn?!4NNPEkGL2im2BWqcL9$NANBQy14UtMI
zGU4`l${7t}T>nP$4V_vllCk@OIAp9i!WLn$2M+dqWu#`~&qe*Si@6d`F6@rxZXfv0
zys;hS<;ly9wP<D5%DE{Ff4t&P5ciPRu!|2Zqhrzm$@xse$<u$cQJ9yIe!p{<)FPy%
zq*~#Q?yAwOw`Xgyq|jnFkuQl})?21|gn;<a>gv7B)}js2eOl@W>uVOON&Q76UYk5r
zeES6qijA-Cf9%^i=XbCWA_$gCoJmrK1(R1YL(jX{-VK{-tj;?k&bmlrR!VsXPVCV}
zr#E}aR^!3T9^X(7+ZH+mkp<6HE_Y&L$Na=+T)#Z7@grDR5jeqib$Rm016mD<6rz@U
z+`m~FZ5y~5EN0{e^L+#!j_J<GWtsCMW~7K_*h?pMKB;?1&@Z#1)X&@hDzKT6XyeF@
zP_5?@(0H)c&%j!UQH#joMi5Yk-?&6b3us4(eOV*UEt{bwzD^~o>v^<FAW@Wc_Uwb7
zO2|pX-RW6Nz&|fDP%GLiJD4yfjHqOpujb{8S6$&6&ysbg_X?zAtpXHTOk#sw;xYaC
ztHX57^lJN8JiK$6-_vU7MkdmdRB~$YQETv<@S+TO`I$7jBzT2xJrN4!6^?!)oWv`V
zIcNN@imW}L$b#jOU|D{!)Go0UKUl&MEZ@$nRi&=fjTPNcZ_l3NI#p!b#J~JIMb>5>
z?mRE|A1ShhPP`gU+zC(F4EW^C2z>Ic^Kh^E3vo{oCI2w8_GgML3m?;8MHV9?kC6ow
z*(pGgjkpLXvb%hekOd?K->D*t`$v%-aXcqGFC&PNjYesRwrKoOWRLjd%hXY93p71g
z^iZqJsUq8=0*v~$I8$Vyg~~zvfrzKl=r-M-3zs0@j87F=uzZ#J`8j@y?`Mjvj+2H@
zi|J6Ip(q7<gI`2}U;mFHYx?Yh{WCMye^q27EdDC8ZH9t?A`6z^MO%F#(l=`{ZvAHe
z;TzH3A4Rqm5Mi$Yifm0{+YAAF!5Cm<BjnzkF|xt}&MV1oKLJHHLeB9_k#+vow+kq;
zU^_sOm2wprAeL8l^{o7($VSM0LHRmjRZ99j%`n&hDzfT+nP-aZ@|hxg<oaa>EI%Wl
z|3{HEE&dq}D6&M>nZ*|eioWUy-l{xPWI;l~k~F7^EYg`fK*&?n=uDA~&<7M*Ki5#Y
zkEe?45unHt2U;a5Z@FCn6j_pG%m$#yVtoE6vbo>TPxyt(oRl6vRkU+f0~FbIfzU=h
zr2$L?pvW35M^6BXZ0jXJk*z;dWJ3h>0Yw%{c&7PASi+fK0^KG7FtRvjUSU@aE{{`1
z)*g$&0E%qug)~geqVU=bIN2v6`Bafrzp)|U;p(B}zHEdjOi>hiL_r+>B<^Ag=0X}e
z0rQU{Yw$;rZN2jx62a!icvPI3+2LKW6cH`_SCKthX0bd|WD%bbI*)(YpDD7<B7YUx
z@#TAvGey>vFS@lD2Pm@PPSOd3u$dCiea_u(>?JhT6;NdHfFi4&4~bSD02JAl3dgt$
z?M_dEPZe3D*Qp|lJXK`DE``@hTQD-5^m8TPx|{-y=3-S-M|8V-T^&ITb;ih|wy?ZA
z?R<Y3Sxk{U$@#yEEH+|C#BbcQ^^YQp6E#`GwhNMUICgg21Qc16!yiQ!dZx%4Lxee)
z)L>U0JZR0MO7b}%>eD01XC)C(U{=o{?n6fmb4KcQmPn@1wVW!l>bZiLQfYDYKZ>j;
zOhdt|4LOeLLq@9D0E#TO0Z?Su07Vx2S@w@2t9}bmWTgN_w*8MHi!PHu0g5cisUnMt
zA@<c-|9Ps&64d~TEcA~e3;H)j)|uU!@q>y%ULRWoYFWK8dg22UA@bsLvw_3NF(VRr
zQ`Ce}q_R}Gk#Gqw=sD8ZdxdSCN&LFTLJKaAbX>JP)2O{Fm`^<>d`*vpz1bVRFNtzq
zyEY|(9tV951|Zpp$umfH*AakZQRlTJXAL%xHtL7AZ9>XtkSx6XFC@G54<tL{wGKeC
zWxo8zXOQgv1LS_oA~i{(bR>kj{dn;lAR6q@+WdErY(Sdg$XdunDUu}slEv(NKZgP!
zSyM4}ueMW2HfZ5Horc0u1QQ;Ga>dXm5Y^0KIYZi5jEPkHh}lOZW+#XMlAco-Eoj^_
zG0`HPK!}htCaRH)RDq)9F;b}gRvwO49S5{Bv|SpGRaIc*gXbz$wMYO%(GFS>-5Awn
za}ko!zHJg<X^;So6gEZ)1}&%}TPgL+dGRg$@OHN3h+<I;^m@w<uLd6s#Uk9U8i|E^
zsVg!ph(X)<6;MJo+W^cWz6NHGY~yEkRy=B<#p97A=TI@N{N~cUV$!O+>eN44k%et6
z3Pe*@(t^n?oAMfhTf~U#5u%h>Cie&_D2eKR7i`8`aSJa8i`>C{WFbMpHQKnF+qeyg
z-`aI@G-Hk<CW=r63r5o{(!_Kc#G{(6tS~TNGkvdJ8)H~LDsV_nxdMsv=gJ@utA(IM
z;B9m^90aa*CWUPj$yRocjLQ5f>((YK2`57#h8y^?FB>YdZBxOS$XmQZU!Yg|)*@X+
z^n*2$4Ss#wvkDcdPB~6=4!%iFsi9c)uaGR!=bQfm$->%M`nqX@qW%?<HPV(*2OwGd
zHq<F3+a`xJ@t?kG^WQ<TM9KgpYa_Lj4M4IHA0;%fyni5B%;$fFWG%pwkzTR`d&t5)
zt4DtzSyYeYDI|+Vw3z^qEDm}K$!`6HWS#y(vV=d9Y>Rw-t0ATmsUz<)N#yAN-Vv}a
zd#jP-AllbeE>3S;mD(-2BNN0sSQIuV|3I?B@{%MGU4I~1;cw@YlZydJb^(B7!96ZN
zkj<@3mp;)gXS%l#E9(X*v9~DpVEi?$ZiiiP_yfr*46CqfR8ebq)03!O!`^xN_M%gs
znlS*$5=s7nWXH3(Q+(N#Ws%1hd}-U{U=utx0o#DXUdbB?K(c<jBWx9FF|sR%U?Iv#
zib61l|GvCm=Obq{ib4)mwlRXfPp;sth?M3xmFScxM%AcaAS+iAZ&40t>#emESzuqM
z)?kNWB<%@k_HgWFi3r7+JQRX2@<MIol^P^Ti`~=)jd6r9^o<%0LoQ65MA2sd8=LXF
zZG9!&=B>B-LIn!GDMYhzVFs8oB+fq`;lhVib4E`uRte*Z+?#6E+G~*|wMak+_r+2`
zHQ*ob<gNN`%h#q~szGr?2=CvQtJ&FYeI=C@ereiU=Qifc&q_7^UqlaHJ?qKyPfq$7
z$0MGA70=GPCp1G>cI7r@y96#*E#}u_%L=u=Ln-G7$=$lT9W#RT#izY(>20?MHiBQS
zViarAkg$NzunlSFY=*Dg5!y;9*3m2dMA+XiFWkEO7W|BE7mXqzdTVtHl_cx7w5?jW
zOVdqQw|@E#nYE7uBw2&<EI^W#l3?^|<8R*AIE7@1%4N`M4rh?8jch1oJ2UbOlI^A&
z6}f{Nz`VVyR1>d+;;&RgU_bwXWM{m)07zEj^+WT>k>I1*#-0n25|==A?x&C}a`pXz
z;n)ES^bC^SDt8|{>L(mHQPd%~h(Dh}vM%h0AIy(B!hWlG9w9l1n%r9D6<WBL0Z6um
zPx}m#jj0!oTq`EKxlwh&+q_I2cYs7ls0YchMrKGvZ5U+)|Mc{K{<6-eLtQbJzHh=p
zwa=?!xUQW3qztfRW6YEzS@7!jM$G3&Xh_t=ROiPCXPB(bxX!i=Quo~gRShGyvDD=i
zgDQZ@5{I5yvL+1TbuXk;v;J7JZSwYt^}n(8@3v=x3s(=pjjKvczwc_)sH+b?Xe$NN
zMHXCZ!9<)VmXu@oP0_BPQLkp8Om<FVWqygq8LikCqh?U4Hq)ra@LJ8F)xNkM84|Yt
zySldxIITsVXI|*@kJgJvt}cZLu7x}SMW(Br9KGt%Fn$~p@LHpgXTLQ^Erf(1%sc+E
z{Y|J9VwN5yHOzwH)6Lu!iWzQC(|%+4zN%lhiWLwPVmhxE@zRzIWkZ+F<tbz2-(<@M
zGkBOh)6bR<JY?`RExl4|7D(Ym=*=vC;u<5Y7uZ>rx*wUi5ZL})EzmntPGuqfyE5Oe
zq0#EQ%)WLF2AdMB<dmZdzzu0h4?#v}?)qoi6cm1hwpgb^Gd-thDxKfgRfO;idl%-v
zF}VDkUk5_Lipf>EJv`P4<<r6+rLtZyvEstqkEZo{?d-QP-FDc*wNQLv_+F8|)m<Lm
zbi*)mYy9@F@)x}HTMOT%i0;+Jrv28a3XdG<gfVXI=KgwXr~Du@eTcdjEl63CdPkVH
zJ%A8DSQjxDFLTsWoG4ylPm<eGvDKA4nc<XFXl`Ikl*Y<W;TX-NQRx)D+rFcnwUfKu
zg=S<JG`{bCM6TUdhqydTN>HLubT2%wF+h~Yr%c>az>OZ6EyftQ^Kga*EYM1Xxt66q
z**V-6qNg<&Kt1Lz4RCLLnmaC-{xH{gNblUycOfWk367XCOv8hxo&NY$3kmzrI{J^w
zdsFF`io$E1pr|Lj&qWKg;<U(K=ajwAEB@m7{IRM)UdE7~b{$#lU0D@T?)076;^#&*
zBeKbZ8CFRmm&r}!%I{FG2~iFVt+;U)rcDWP&=%$Tm=`a654=>T^?WHVNQW+y-(1@f
z04epK3>ZHhD!rP4*qRcuN*9(b&G*)wV6rYe?74L*r}5M1P{1eKhtt>Jx<@iTTZqtz
zmu=+DK!gaEUf^}88h9d32!noJOwMX_z$Ws3zta&NF!X&%+^z&KOm9~;u0?6L^<Fzu
zy)s;k%aDb?`=NT!4>wl5L-w9L6Y2tfZpVt!4jRXa2G%7#S}*L9p2%!%;`N(GdJoSX
z?K`@tbm1f7m^4`HO7A39kghy;h0et=H$Kl<t!Ox5^TO-S7IOQhO=y#e1`RrBgbXSZ
zKSUU(c121V!rwy}laWzec3wyb|7McH9J^gb$Tw1lq^wyeZRY^-OL;x-Hs;Vq;ixQu
zeOCOV>yfwIvb&*iU9YZZLRsU~1I`nV;BCV=Z&mze)#ldS{;c>@=ADPiufidb%3m{4
z+>iI?v~!-3Vv^i{ixC_QvP>vVr3)|!QR>QBWxGZSVm}OA?geQ<Nzgaw<)78A2JZ~M
z_CLIyQlt4$yy6B~tPcO~eeS_y5f`a29Mtkc<mJq5s09+t1&<&%ogro&N8Y;A=4Ehz
z)j4W;QxM`p_dR`*yX*>FrH}mf$;_7mI?a^VaQ<NN8{`HXX)Kt&7UrLW9k5TcG`Ec%
z$unB=PmYl6_i~NstG2&_I4v~zxM*W_P3P#c$2Cf3o>GjvzZdrkPgaYWVPuwdFuKJ{
zpQA%|jgOTFHB^8RS)Y$Q(Q(jk4|sUp8O4p4!kn9X6{*$nlxt&oM8V>1TWa_m{D38r
z7A>eD3?Gb*HC-U^vVPXlR;5e3JgZTkgQ4M6@PTa<q~{G37V$Y>))thahw9Uj&=-E>
zHVulPa81>csGrk!a4fKmbBdgAj*`oNMH9OFx=n0Ai_;Q`7R{7OM$j#!q?#^DXMZ+u
z1Hjn!A55qjp48Aj+}*|CIC-ItGB78lNaqmQaX6!)|6}^R@1{$N4`UOdU!ufJvruHo
z-B9WMSqeXg;;r$)OPF1H+zF^ejZ|>}1KGu$a0n}%#12FWW)#5p$Yio;2k)zzK4EDn
zLD5ePgnN$Q7^+K9sKd)iJ|hJpa;195A|}bAyM_FT-}T59uVhtb6i7;Z*YS8i{Akp)
zNc^6N`ey>_vMcQB6V_^x%ieJ#d5cv~bZwuTVkt%*H;$A-r;BCQFGt<}@{D^j%N6|N
zMpOCE3a|%hq?$#_C^f#BJKXO&nbvG_EpZFCO_rF<hx6u=`(P+A<x_aEZuCtNW5vzD
z>$aPo=GB#-%474yoTlT<8|ogs3?(hICto#d(~_@95A?FyUa{=vm9L8D^d=L3H`Z9U
z_c9`I)t>V1#M>hI@(h7>ceQw{j>TKm<sEC+huN$@jQ+&GJ(jS=u8ubez6GBwi~B8!
zex8;8S?QrdCL=30S*7>(&8H4;-v?q=Yjtnlb;)_(EZ3iYuQ>K*Fi+CI<K0wW<Arye
zfWI|OVMiDqecR;b?JD5TV-IFNS1uL~R=kBLCffvYrupHq0uf2%FOd|>;cZdYg9()9
zEGU?Lq9cX=Z2vJ=Y(?G<hXk}EAWBjsidlFty9^QMBmAqx3oSF8@5bRuUr>@cJPWK(
zQQiFm+evOV^Xy9&-6~9#@eblnY?~}y`irlUy<yHg^q;$zkvmBbI9!D`5xtieZ^mEa
zm=|<neXo?clRQYfz=_T7aWtyTEDu?f?Y+})n$+^>Hph|#<-te!PXC9ixeGRtclzYz
zs~*ti&5P2r^`}3UdAeS<%)4}PNJ-fL@p0LA<XhHZ_~>?|dEXqvrJ6S84_nbfQwe4v
z1Qt%7$6GHr>t`s{En2^-Y~f>V*8-j~a`u@0tjwPFa#LfU7|i@xRch;f{Tln^=h6Q&
z80$qjIUXO`X+AvdQ*r(&<6`D180&lYEBn`j(O-=R)4l<?$!UWOZN@%YKdd^{mlL!7
zR@MrKx0&IT-@0#MJEkIBW#4gdcH=8&xBO&vjwYpCw<y@`Zl>plOoG%D=-3D2A2ik5
zc55B<d2FmF`4dr}Uq(i~x(7~s+A_y7wqF^M^n)`XoN|V#mIrj%zgTU0!2|^EE42&6
z_HwLPjvZDiJ*Et(BL05uD~jCAcox`aC+(MNr_zIiU;eJ2BQO`salB96P84EawmYW{
zLnF3p^_7`<Aega1q8Ju?3-;xK&gfb^hGl^b8kO7<?F8TKcnN|U#2k%Y{CePJeQe~s
z<yx24;xmxXb;;t_(aNPSH)NY<A)Hy;)R1-ifaN`iiMtkg7Gez6#<|?ztx1-JGuIu@
zTjoU6Gbq|8%rb{9oip>B>~)BtUJE}+ecQ;8MF^U?cCBJ!Ea;czwa_18cgcb@8*F)B
zk!WSf*{+tLl}4`-luA#I4#sYG4O<b5=-9CHqbT$cBtDl8()w9IJb2#C-#J9fc9-T;
zE`8pS{G4@;g$qAlXuqHHfrZYO>@cZC5y>8oBUzCoA=Ga!QTvhlfH=c(o9_$OcP~NS
z8hu;4BpQvnKk<wf2b43mB%5b8T#cbi<?~iV3j+ll7C4dt#7~&iHfELt5M^1UNFPNU
z{1IjO;hWT39e^lXAw@|=w3c%w%8nb&5$m&eQj<I3iLND(s^K>r{h*uhZ=M5Wc^JA~
z53a~XUe6ZOpDA#E*8(OA8v4|!I-k!u5!E*xNSlpc()rRWf~cXCt!#L@L1b%^@3J7!
zfkNPIyy%r)ad2FsqkhQ|M-4}Zla|vEUzXZf7?>>#Cs&-=X1L6JY)C_SS!4pl(dob;
zJWH?jgrPZtt~ugTaKTK-AS*eBl>j2DTlB0zcrm}cJjrt7a}9z7J+pihn35{>lj9|c
zh~)nJStd(;_8R;gT>>Q?4X3WywieG%M|;K;V+u45?9<G`u*t-^x!reu*)g0{TZ&{r
zlKItTp4D>Z{6XQhSozKZ7V<Mrc30#Qz{z%Z@Ob;x(yg^h!U#-h{4c#Z3)cCcmUGaZ
zoBTi8yUVXA*tT8ZLpQ?^L&MMvF?2U5ARW@6v=Sn%Ag%NuA)P}?cSt&PBhslefJ!PU
zNbd2zpZ9&&UVH67V6U~mU!Ts8=Xo8+&opJ(+-TX_d)d}#1)zfS;`xb|5zk-^{ThO!
zP?cRHg7UixIMq-eS0yf_k)WNwcTJgQ0E@5Kh;Pu2^TiCGwkYjs1CFXKb?pp)JK6re
zAv9xyB?O<zk(*Img=)-2U{#dQk)I&no9_oDU)3@HFC$Qk9nGC-IQP+vQ1P?cvMIqd
zY;e+j{ilWW1ShAC<Dl&sk%~r~p0_8vdW`U1x?OTHF=H{QcYncHB`R^V8Bw)&;@Y#~
zYE7a-C*o%BB(%jOtf(X%-ic`#ORD)SyNZcDo)ychrN8(D(&R6qHnveNBp%X|#(~wF
zD#KWPU_Q!BA;!cTWV^7R+vX&)r6)V(@0x4H_L^s9CCKFh#Bf`*Dg7bxgD2b9K>1D|
z`LindPfg#uW@X~pDCg^zFq|x)0eTt!VqcZjl|bk(CySD<(QD15QVA97ed+OC^IuLD
zEwf&^?>eQz_E43k8HX?RJ4{@a$5%ygu9xLh?GEF~QVI|nPN~JKsL3>|Xi%#a9^aD^
zzpw9czc@uvPFXnmA5IqD2*q%+m&34!+(Q3yvbdxyS}`v%oNQ(+G=oZo`Q3f}Il5{J
z#T#8p-c+qYv{sJ3wr;I9)xLJWxOVY7oo-*g&%Qd^wK`I#I?Q(JIlT++sk&aNdV>#j
z(c=1N&3eClbth9{CTultcaa!N7EE)Sj^QVpVW)*k2N+8h`L>mqMcR=xm+R%fmMnle
zWu;Q2s#z-@4b1}fw^Dz#MBjyA*r_y_p$XH&7X7P9lW{ClCqJ0Wys5?67jHi^)>$(b
zYV!kKb2*4<7RHiAnBLX>GEc@}vUcWABuo-a&?$ZvtW6dL^YXM)CKV<Y0e-Mhs#?+s
zT3b6JaEoF7hT(&MELp%Q18+FUsFyVg%|N*czQEiD*eKaCrK>7VCE<{38e6<{M~o#a
z+z7>3vZRhxGYH){9?BGs6jM7j-86^7MmpzaoTB-)h<_|u&bfz53pMvz*EAO#4SzpW
zNp~8Zbka|EFp;cr_Fr=aJ6Fw-@t$t{PIzK$>ip-~Q<>jSs05y#9X!o4c3LF1NdQQ&
z58A~3mnD0AmSL+R@!ytg3C5DOb*n>DwEk9}06+VWCCf%|KC2;NS9QlQ#QIki?X|dM
zqf+N|A3@mMU~ycjP*7FW^fWtwPPInu`hDxZz-o2OkQR)K4m;G|BJM8V61;OLeZ-^)
zB+a~c4t%6ey+zKwINE$B4}1lse0x*%%ur0Y22a`#{EXWi%rbm<r23SleCtyEpDljz
zZu6R)M_#Z!C}pF$*8=@AFNLo{E6k=fiUMC3YTSfV;yW;<7rLvcflbS(mwvyxVGBCZ
zpy%P>o3pby6U!Uflucq|y0yJ`3t?D-up^^buQw!JF)?TmefY!JCAJ!STAu>IeJiOo
z>lPeSw8Q9p7${SnhHi~+DZFhytk@{xRoj}tMYxzbpVSB6yV1$lBGRw9#3>6+zG%@!
zsF}TiUaXqay-_e_GP<yu)QvJZH^9>|^m8!E!VbK_a&a#Ah9eBq(QZz57WXuQ&!dB~
zmO`%WLw6UT9=(LMNa4>e_#p@ZQ8YpBAkm=;H6Pf$5%Ls+Y99lX`H$IiG;4idL}eM%
zI5#s{qWwz`7S<{wRbIZGt$h1SdgWNU=C}0gD>~8x^EKRd9Kz)=vOkGbGLf`0Z&$@#
zIH;0vWK!s5e3|K!X{F!sSn$Ocrf^ZEoYB3}_tjXgU|DD}EXdHrNr!m+!^z63y-Is&
zg7_esZ!Y$ilSMPY!{YKVoGifT`~fh(405q>|IYS3wJn<D%~Rg^##p3siprmdT&LT@
z6W^zM>1K9`>f6m)veY~O<j6sC2W3)6vvNA0^-js;%`ZDFx2rcC<n>zQpEZjx?whvM
zNOjZuozUy-Eax6sAS`?f%vx4&|K!-chzb=;TO1XRT874;<DTKGP`?3PtI#s^(<Uju
zs)&M!_OoU$iPi$dd@ZO-{N3NPv!+mIEW1$NDl1wN(Vrs8mnhwTqDgkK1m}(3CzRI&
znj*&i)MsI<fnqf!D4F;`zH?tSJL#2F%gyYSiek#jWQNu9><S6`oF>c4!i1`t%SxxY
znrhH09bMjFxYr4N^}Fo5j*jYLO2^NaD|d6UxvR4N@#xmyv5Dznt_Kk&xr=<qz4bSC
z&nnn6lM!k2E|hR8{fl1b{UTvnm+~Lku$@z)sqiaj@cs-ROvH*$BB$v}CTX3o`934x
zgU+U^gQhf-y1eWbUB;D1axErSsS-b#P>B2jK|Sq<%}-XF4CPwmW!v7TwbdN7#Rf+G
zxwKx!aI#^~3hfQ6Ry*n#JDaRJ+papQu&GOaM=xSH+3>FM)vixDT^LSQ_;)q2c?<J9
zRoaQRe>vH(tL{?Ko<iNe-K(A~xsT_sdTtm$o^-;fbb9h?J|1);zpgqPrkbQ(Mxd9F
zc-Fl;IlWlc&8$pTdAfZ{>3w%9?QDe=Ms<*`jEGJQ7;DzmQG+d+q8^L!WUW1*5i7jX
zqI|XKr2e_Xuhxb!oUDLJNunxqTvrrgg9R=hPdn00CZBrli^r0+X|Ot4Lp@e1zkH!@
zQ59rb*Y&O`cdWfjw_9GmWld)Ax+0N*S$2_loo^sdUZ?naoSD4&v-~8L`y^xXpPAjs
zhJb;BQ4MCv*fl#Fg3mEqg`g-~LSh}LZ3&dF40AQ6O20OTF9Y!%UI{Ua4;7Nt0-oR4
zG0~xkrywjWXHSKDW3rhhEl#1#I>acXp2}(!S?;_WUBB%*Xn20=)jY`ZX2HQ`@x{$(
z@XdVq`kP2*9gHP=H_|(g!DLYu{q0=~IqOSL@)pwamY?4&_sXo?$agG^#+mfTVl3H|
z2eBAS);)-msT=AkuYVCfqg^DViLqo0M^yf?WS#%Zl6^@4Ht3Fd7`(_fSChFy)^UU4
z`cO&BvRpHVrpZSiFrhOnnIMWAPiP$bmsd)IH^h221ba3|JF4$;vrgF_tY^gjwPYc&
z6BtWY1&Xm`!O@U=y@9U(TCxaUj3vA6!08@BimwVH{BF<d^hG0r^wfvtcG2@{lQ_MZ
z6JK#&&UW+u`6e)5uk*{s$B?}|)BWLmD<5T<$)52<n}Y_1gLt_D!;q|=tIWGBP1XqO
z7^d>Sm@EZ5^j}O?{2sNtvb}&RC<2qILh}@{9rbD)TKr?lRy!GG---+O(xR{fhgBp-
zY^ZW+_edV?t$sPxXFW51d}dZ~CTIGS!-ZwxY=nl032YKZ8$-ia2#r9=Gu;rBD^v4*
zWi{x<r4GL(RHYMm{3fvAzJNWW{XHY$kCJqDK{A09_J35a3mL<L!qmTpllGkTKfWF=
zxE}v{Ep~Cn77Ky{hG-rbehjMz#u(@H@n2)ni#z7uvx5_1)0Zpb0#s9#Li;cS;jzzA
zaumDXiTVD^s{b`Lzhzg<(MC5H^{BO6dF>?9DVqE^M{NgkC!j-b)$tdM)d~Hp%EtZ+
z#$H|%iI-0oV!&91IPr>^Qk@*xU}A~Nxr&GH7II@HsupUjfp5hcw;nAvIF4K9I=o3<
zZgDF#S(ZA{DDxF#cuT)oSD@;K!$Z$`u~=Z;LB@)~Ru{evy=4We(*O9RFBp1+Z-iZ%
z;<Pd8<Ysz9D%-sMxkNihF+sLvx719gGbDjVP++Oq=F@9?NArVqnucc<(PwEyG)W8_
zB%;N5kL1MMCo&}rGXGk#L}rEM!ULW$0YZwJLoqM^cS|-St1SqgZ?^g|QR(CD&Gpq)
z+e&W`c1J55WN|8H8(|K*!!dOt?ukk?^)#VoyMOGMN^V_*TZU55T*F~k|MS7eKxsGT
z8&C<7UbOtWYySK(Ty#p)AwlxX)5mVGMu|kt`rzc%x2n$6u^>fqnFYn*%wiO&3e!=9
zD(w5LdYZ=AR(x6$8xbR1I)unM)Bf#)?;*0@qx14ULA^1Gwe$9z+1|%gkD%VJk)OaN
zA2Ri%U))09XE>2-JuQr4i7S_Wf-P&z+0mX3^jH^`-ICU%6LGN^cv=JzPYoe<&5-2M
za;+%KkK=QRk6NLm=e!hy!(v_R->_D95XOi9Nt)LMKMxXR75=iO<=$XTl<nF$1{>dR
ztYUDZ)Yud-j)%2X-_d+3ty7hI%%V;znv`Q5j8za+;_k)Pwp(ijYMksLdERxra8ccH
zU}HQcvDvJ-z@~mU4tsWPZTAK?>n(Apyopr(qLRoxH2MZhpR}g)<PqF!h~c%VP-ln0
z?4+YpxC1VAr;&Azxb2^YQq#qYLVfw3ZLyK6(x6_jqE69-PXqWlsqeHZaNT%#Z%A#F
zhdjl^aa^Hu2*|N<zb{Qz`@(QpzLiCM*mBQZWqj8D^`+Qn=YoXao$7T~KP~-A<oxYV
z4A>v#I)3vZjKlGJX3CmBM0Szq^j`NRI*O{pzdT#|;FG-iwv8!=9YKDk+^zRLFo(~?
zXI<zCsZZpHjme#6z>X$)$jjZzy4%Ma2$+YVLad!n^iFKTrpBt1ovA4_a?az`A+TsF
z@Mws&&Na;2Rh5(jMQXGxjbKtGQc5-4i01zDG(}4=gktlPXljW#g~;MdV2{$ea8c|}
zAvRulR4E+@Z|CUiN5-R(U!OwnwAx_^OD8l*$aJI}A}rR8j*S(EA5YrV3#hA%rsxpH
zR$4Peyw*&L05cI#M;Q|Lpr5}%V^hv+#;8the+qTx$H9ddMCA)?L_R<f;X{P6Jhlh0
zDe3_v@dTIxnO^3Q4|oEmMwFof2DD}~_gL^7aW4-02^oTll!`8hM7Oc^HX<I#^(FPO
zeJd7mkhw#E?$Hj3`#VJ{QCm_1005TL5>iijEPYH!4{LyeCkI&!SozQa8H?r!F{cyw
z0;viTFaWck66{}N;X#eOAc=5C&SONpPQC#5N5jq69bToiywik^rzKFQK6Pb}{RFRE
z4wi!tRPxx!Xz4!yrn~a7exekqH{zUJ?8(6AlbihGn#mk()T7k8$C)^>Tf!r@-Cjr`
z?&^zGXlDx9{xT6b!7Dniafd)|eKYH)CqcwUA<>UN#b8eQVK%MUWNQ^Wm&IzHVD&WZ
z{syDB^3Z<%UoW+t*WNHT4mc?iwT-Wz9><_Q^ijGd<9VhM5SwK_;o=I2T(+KLP5sbE
zbGK6e;MI(?LI)t)Bi|*<C~2-_Prjd0@;!M-P$BhzIkwVuQlz{<IOu_I>_-H224TdR
zMv%9tXhQ@r-z`Dde;{HdwtV=8FHzgCs?ww`Zob;pFH58$TH#Gxn$Uy_1Hm6`k<(<I
zh7>;tLViRd$&<v!5$)6yHpqr-kjOYJCR5*rnjbuvEAQJYzqx)Qa6$+mT*JljoG7;a
zoNln<?$?;Q&Sz?F82fRIleK=NkG}dniRc`*^)0IUNzGz{n6v;%)?B14F_gpt1>-(}
zWaf!meL^axTfAA1ReDD}ZS_5ZzR`EzBNl8yIaW;kA$U|la}LNW&P}3uG2(N=erGeL
zjHM!Cg&n(L2wWPItP|RadKtHDZM^&Y!{}~}UP#qkF16I#TPCF7vRw04N)mWhr|$mT
z5uPZ80hc2kVHjSnnbO1N%#IJLVVzj3mJ_DjZGiFC>zux`jq`^;Cy9cvT(RW&0N4QK
zFl=}yI$?*l|9y3Jd`lcnM{r@h083$%u}&rV=2n07IuiFdMuRDL2_ZeS6sIu~$6&TK
zsMG3dI<5MMYxvjDeZ|zb&-*q@v2AfaPCD>MS$~5w(}#w<6IDlIwPUSwkf@_lv);o$
z2{Y2Xy*{n6Yw5y@=xe~*05s+PkobOurAG1mc2+u_qC|D|?N}&mHf=E3>Cc^q1rsCE
zf$V1O=}SD>kejfaqV@p<m-6@7R0rR(!GSTNT-*7oFPqQVkh>;QG>ME91X3QsR5}IO
z7CGE4bq&WvIHi9U<;BiwKMsryNv5aUnEKlfs_f-$UoMUAwj3^eCbZ`m1^UnWe}d~i
zW9&8rY{8^3iEbxIM$Q@)MKl)RFg#B@Yz^(d@Nl*Y_bNb6<x&{k6VLo3kR%9I+0c5(
zU^f}cGr}CBUfeg2=MkYDw4p3=(a%~ds&nwvm{!RY2_-*Hk{jIU+j~CzjYI!@^1azd
z*#J{^*l{LR?pEvOy%ZZ5BsBQ9%2uC@sV(dTVVv{5>;#`K7{(fsTX<J@`$0qV#XI4W
z;^R%#x{i4-Ro_{OzAdBB$!BnksI~CjNu(2BiWxuN@I@Z?!;c-SPWfjo{3~7RnH6Ex
zQ7vw0f%`olG&oAhPuocHyS;>LM7Q*ELI#R8TLPyQ$h}s>=Qb?8|AMis^L@rJQaLsG
zC#Rn+j+E`R9*2DuHR|;%uwpr>HY@#(Gfb@aGGDUayhD~+oWMLR9(10Gpjqs>Tp;-x
zT1UX77$w0fd5FDpxdKvR|Mdq2480uY4=KFQhRuht|LsKYf4@tK>X6^^a!%;uZZ&J0
z-&&B=;WqiX6p4OQ>%ChMdWZYl`tHX$p?5|SVv4B{)}}C8oQAt#g3sh5haq&IO{v*J
za6X5D8^Q>V!ko)Oub+gE_&t~KCm<qV3<VI;7ZFN&QmiK7hlahx^l1Is0-{hP<HCen
zB6_v<db`4kb$xo#D7{7H*Qtkmo5G3`OTPXXRF>lPH%E45X$s!*i0`izB}~I<2_yN^
z!v(->(}?G}Y{X;X5T-^l?hpQq7*Uo2{6C^B%1GD`xQG#Dg(;*<jpgT~o^OXOhD9Wo
z`2H1Tl?C0T33xW5JePd6DWdEeRA?L(=zhO3+>Qy8jJ*9vl%3#$SZ_z#{7~@vN0jZv
zh_VR9!a4jm+XQ}oW>&^=)LvxT!go*%DT|X#Fi0Ja(-61UERlk~XHepuJs*=u2%n4y
z@#-g1^YlIbN0hx4#y>{ls{lYY=R{j-MA;~k2b`f5CZIOnM^ygtw+M2BB*jt$_!bqt
zTWm?~6+iowKD*u!zU1G_n>Zu}A6OzFJ|?RZeuYZHgHReSZUcKLz$=3`txw}NDXhL|
z#<(qr4k+Va0*F;8fvewu8{YBP+li>dx3_2UC)>%TMu}dt0YtnIcs;JR0cDSYD2o>b
zF+Se*JiZwfJt5StlJ^~rsZ>7#7&J%-ujhghy%XI5a>u4j;6CWSFk}9ctnI?fX7ThY
zDNqm#=v+wTYNme)xq~f!h#}Q<a5(bST}-16Pb(-()p1F8+(^BkA~!MuI~-zjPgA-*
z03AZG^M`1HpX%$DWxT4$5HL-DLX`P9CH=gZFc67ZZe-9KX42SY*mx1bi`9dmS?`D(
z4(T#80wiBU<qvEL9FoX)P{0dYg0I5(4=LDew(;ESflWw~EM>fDG_VMPXNgF>4a=ks
z&#oNJ$|uThLgKqCgR)S#`8&Yso$UGwIx|l@&Oe@^v00y%Ws^1C9SmqSJaJp0*pf++
z!86$YND_8PHa7xqsSP+~i#-xX+9yoWCPRUq&ifh*oRh&>*a4!2N!UFpnhu%#ArbzN
z{4FA?p2NEr6MvoyOk)iK@`&O@2B)zEroH0Z^VtEQEJ(JcFa^qmU=cG#01yqqc0s1^
z?*RR63kgAN6tWaoVFfrUc;gsUww{b$mV$|aDnK~^x6<=3DvLlUFbMrcWe*Ylo)qkV
zQCW(Mu)-wa|3PJOc#AX{vQaz0IOP(8!XknroO&0WE?WYf%OZVZ44#MA_`3M6tk?rp
z{CrHnV;U=L+N%hKdkdgdAH#PE18P994~5HgSIE(x+3ZR0V|ReBR^Ep)<h+n&vyr7p
zLf{43Vc$@cJMmF9QaHI?x>ZeM=>y&uX7kBRV^vLi9iy1|06=xuJ2D{%c9t;CX9R&`
zWo7v^lNc)USeO~PTv^9Z)tXglTu~&5EICHta35CQ3RmgMrip&W-|4Ry7$Rq`$1ZZM
zfk5-FxPgYtK+4ykga@E?SI}xUXiFBn>52E4z9z1$7!g?WON-Z=7=MqLuhdiZRLgZj
zxrUIq?uL(BqL=jI5-I?#FTlqy*sUXq=O~e_!yD&aKg6@zsW+0WVMdh^$2W*<5K8ot
zQ;qY^Z#O(ItK&xz(z`WYVU;jb)U#djTqfa}jyBTa6H0hB@VGTqu)Qy3XbOwSkh5|S
zTg8$=7E5V27a5Y4R5mGI@g!C>3zXH(UE-=)H5-%A3?AO$N)$HgUh&{G<yu~u?E{((
zFtDt0tCL&nllWGbs#dr0)@OUI&q><6_}hH6+x-3yFgEaCS2nDLY_H`7J0f=P@jd`w
zHm)U^zx|zddzxE&Mtpl#ReR2Od*0rEfw9^hrEVSn0b|EIBzm!JryJl`Jd%8!37y1=
zB)AwbwsZWi6Wd`$B?sy1*X|m0>yk5|`dHO9KHl|_v1^#5doZVKQoDP8yz>)d_p)5~
z!g%+1eD^YA_v&i*CP^1Fpa;d@vsHy5Cb5|*u%$eEh8S@q46*mBdJe97j;y*)R<X{;
zyKMn?_+j;pEmu5GE6Z?6gP5mDw~<J)eI)Q2S(B75fz?an-mCYZ7hK&-W}Qgi)yoJE
zk!V1&y7yA%)-<C(%*pm~P9V7jO0ZM<`0M)w_WKC0#j{=e-JT#sC;C9SU9gQ_g?%L5
z8kQ<)FLO0geIN4}A}8OkVBJql*{@&SYbXyfCLL7D?N>Odc2mLM)e=x>96SjhRCOOD
zHlp%G43NURcyt(5st3-t2i$^&It_;`m`dclhfS&nje_dsuY3LEhp=AP+QMm)>y3pO
zhumhkU%L;7>I`zN4FivxUEK$s$s=)6hTP!f&vGHJbowH$NBH2wLe;}bUA;x5cm3rP
z!vXsv@(y)QBBbY)u(!u!U07o@)nhnDqpI*x*vxnaX?=*!n7I6CmGwkL&;%@HT(E0m
zfOLeSYrJhj5O<X(by~PT$sdhzWy4avH~11Tu55jbGmrn=1kL0ca&}@oN2l*&7f0_z
z-y!K_@_v8qHDq^x;sVauJ~1`IG`V*@v0V+L;BT<}7nPlU5wuDEa@#qzkp)w@xQHT0
zggpw>n079lx?7uKwjE{A`E;~D#VS8@Ry}c@`>9%B5+`_U6i&`UHZ3MF%Q(pgS*5|a
zvR0x2)G9<-$I$aey=M?uB0;cZ-jsmgG~XoGF=;Q4?hNGFOuzgcC-cFKS@qnN``8Pk
zAqj<9%Y-@J&Bo2?7E7<dSqv;ok(O$oK#&Y9rCo4n7=Co~ne6~+AjqkAgM8UNBTTmN
zRCLkIW<E)0QOst^YmzrulZdLEu16{r<I2vd3H<BIet-9>By#D2%|x^yBye&uz-H!!
z?tECyTz*1dHGIV}sNTGDJ}jlLwtJb%2iT%49A_;tZOOO^m~+P>fh(*Ei40aLupTq5
zs9~>^3i8+pE=}kxO-^z(+^oRa*LxL2cEiBik=&U6)%An*uQ%%$RJQxs`sekP>Gips
zpfyeVwXw<hPm^=w!C#Jap>OvPZT4Tk>52>>)}26iY1j1&;AAdSRTSPAd|WmBHUg?$
zB#M|Ngp7P`!DfB%xY;~sG<9ZtPhlxpZaq{KJxJL(K)G@GOzXrEgb`&ko4_IOSK|!%
zLu~n%a5mqGk`w%N{%=uM_!bYKwn3Zxb=n9`dkdxc`DJc>g_(TS*7K_h`8RjF4e$}O
zn-@~V@Y^lKlGH<?8iUFr7<~{%KkL)@LEi*LHinAo)XDko!#4EDH=e+L(D%wu;V68=
zpt2~)7Yr(EK)*MuNM63dEV{iQ4}A551nPy?XasUr{1MakeJJI7qTbFRyE1Oce?(cl
zsIt`QxFeJbWI)OyA7Y_*_m`C2`n*YOY|B?cB>sInO>eKoW3NE;-hJPDuOXs|hQwB4
z`WDUi)luAKwa$@Kgr&AT9m<y5W2V>(l1(9dvw8>fiVzY!5}SSCV+fgmak6&(%gmAo
zksmn9_0-u!C>8uDw>E(@9tXe3e;qvnFV()H?#8_lR``!7ORY<2zmIMIllq7*S%jY4
zoBjy20DwuYNTypKAJT!2EJ0|?LLix*z6c0N#*!|Fk$HRQ&jD!jULe_{g=0m|r4ZmV
z0G_5W{jRc2h3y9OnPI0lP~8)6KV+ZTP-@GLWxJ4NAI<Wad}|KA@mdf3*7!(nhD`et
zeVg*QpvavfY-Yo_0AvcJ`mF)FXrr$u+(aON!sMGC8zhep@yMD;13dBcPxnF&Q@lmL
zQG1=9gcCUeHV4AYg!3uS5w;-^@T$Y_apij<)A)E%$JO4zoB6bB&*^WsY;4{j4kLCR
zQ3^h9paA6})>j%ca=w6iQyBJ{NFgvmiFE*$UJ^=CEJW3^<XhiB8sK+=LZVXHT%*Cj
z%X-{JB+zs;+Oyy&LhoF#iIk|8JPkyYi~tV*0#=|1{s;pD#mJ*VFG|$8OjBrZzThXt
zPFav|e`8me>jz#Mq$Q)ybuJXpug|_0C@v}!jot>-qX^*23!prI1npfCn*5n3$xnkj
zSdTCvfKB^xmu0CfnZuSoS~ZG{S<!Jj-Y`e=_M()bS;tP^AcXhZo<?j+a}1pQ&xXdR
zO^N0uq-Tw8^b;nnC!XN&P>WURh5ArC4m73YquT(T%@r>HmS*JUy*S?=zgVi(Qis+V
z)rayrLv|6cF8}RmiO@~g2aFGixhI@Lz+c2RjL`LQx9p%j`j$f01h<>pc}MF1Sh5e7
z{;_1KfBv;(BhS;X2d`<Vsw2l&gs+XHztD!l$z_-{Fk#Y#8k>(%%vQhMS6ZHZ9m=yh
z_xREseE0TQ09u;2Uu)8W6mM37;}0t3$d4<Zn>X5*9^F1MqPn}#a3}N{d(RZSUiu}>
zs%+|OhTZLV!Ou@vx;ugb5J_3ZqXjV0r`q9S5g?A^3)Q++@$k1PapXsv45E!k!^K`v
zUQmG+YSn34yc3ZKxYhB8BneSri|-`%8$0!2U}si;jLi3^pHw4lEh0di?ClZdYOt;!
z+4cW$vKRkyvK#mP0)y%sxjfpPVqc|O6eZZzLaJI?zlaurA8Qu95eu~~ED`7RU9J-P
z3P0qC7rLH~%oIvjnJ#!)i`c?&vTRe*TO}Q&(vgyT0wj-v+W8DZlRiAj<+?VghR)-b
zHXCUR4T>A<N_}fK)>n#rARVd5rj}v3(YGZYn*ExD=`Pf@0Sb&vN5BgXgj45PEmu)G
z%*Wm*cyUI&C&RS!T2QeiJK8Y^-q01gd$c+$faqqfxugF1Rd>I$^mI7jJ}t$;r7CUv
zHT0XR2U+}^evj+qQk{hu<8p8x+>-{}W~xBDPGV>0$aIXYo57~=)rMOm^mw{F=M$YP
zPM_KNS#kQCU$IGai>=iYF}}gjn)E;_K5$$x%?61y=UNsK*c>0U%*s0ib$ZOZ!8Skl
z0Z@}_5J{;g#rT5ShQ0FTwK@BEBR5`)%lm>TS=Wm9WgWXK_geUYHmy@X$i!uQ^$bJB
zK~$RY9?YHl=R-$4IgfqDohdk#fAhriFMC*d+;z}D+9uIz{f)=e<~;$H(xBnvN(ty#
zlO4BP$)rCb0cy0ZTXjFvWth2UD@%BZFwo?T%yuY8iP+H(3r46tBp^=s%+;=m;be;o
zV>Hq-Fr4h@S<>%jdHPzP=bxXuXH#eYh+E`%*wi+DO*i~a^3h*TR(kfyC(Y*X*-x~B
ze-DdAAv~e1ks4025><;&J_etEjaCY|XqbvCXjFBT!f>*^vd<zXT4`R)Eks!kaF9Ij
zOlY+|s<(om^@)S%IHcbJJLjC3B2Ea<%}$KL5EbT$iV<4nbl_PRzbdV$4S~{A+;J$b
zPxa0)<&q?!dC(LqW*cbGh~gu@bW<<CGtS%Mdxt0D^_KJ!5D8j2X%D$jgSB<qfq!}>
zG9T-)^{kp7`Y)skY^$+a&_yc-YT}oc?n`}&&mYG(Oy@eqp^hFIhQKKjFV{c4ioh<o
z0E-e@Al(w;cGf&Ixs_DGGfC0+9NB4zXyqe+5}Q3$Q}q1s#&W+t)bZ+Z4crrN%GSvF
z1TsX~*CexM%TD5$`A*gTLe{vbQD{A^kJdFKQPL4j3`auHhyDn1mm+rTD^>8lg(#sU
zG-)7okg|6Ap6=<f6|9=X4f8!sat-Hxq5!)9A}Ml%%O?w_omWfoej;S8kMPICBE=O7
z2vN~KvB9=BBTFfTx_}+g`(*XIUm?Q`Z|8CI)MJP_$TO4N>CmK43~0u(hZ)5?_F0nD
zB1VED-#lEKU`>7L$XVL>AmD~OaeD$JT~35&Hi<>-BmH`2?!9Ju>s+Z&q>D~yKk!Ph
zq^vnMTHE)CXWf=mprjhE7E_wULR?w?+)h*J?O0Nf_&lpzrLI!YWqZ!b-1}yW%7>Tp
z6hbS`^gfyPrpZ!sLGa>Oi7fW7qJD`@e2!J(^VHm0B7>E%5>{)A7&&%{`vjwNb)k6f
zws>+&OF?$z0U!Ec0S?_l?n$NCCu)o<^(MIyu(HJ@cShN4dM!s&mp3-!*j(Ce6L5|u
zBE0_sV_lDglb$o&eKYeTm5?&?`~P6<6WPW855@*eI4SyMFRp!;8V;E9>+#7yU;Cj%
z5I7yF=vzd)zOA7VIFr`nTPC%>qaPhOSE}e&X|}#=HXOL{|0ozM_kRUrufHjUUM_yU
hJs%FeJ^L7Xd;azAjsOXuMq+UyvBi;}NeBUQ{|gnAg+TxS

literal 0
HcmV?d00001

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index bd109eecd0..6e7f0cb6fd 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -30,6 +30,11 @@ class BeamInferenceResult;
 
 class BatchConfig {
 public:
+  enum Mode {
+    INC_DECODING_MODE = 0,
+    BEAM_SEARCH_MODE = 1,
+    TREE_VERIFY_MODE = 2
+  };
   using RequestGuid = size_t;
   using TokenId = int;
   BatchConfig();
@@ -42,9 +47,10 @@ class BatchConfig {
   int num_active_requests() const;
   int num_active_tokens() const;
   void print() const;
-  static int const MAX_NUM_REQUESTS = 8;
+  virtual Mode get_mode() const;
+  static int const MAX_NUM_REQUESTS = 1;
   static int const MAX_NUM_TOKENS = 64;
-  static int const MAX_SEQ_LENGTH = 512;
+  static int const MAX_SEQ_LENGTH = 256;
 
   //  These are set by update
   int num_tokens;
@@ -69,6 +75,9 @@ class BatchConfig {
 
 class TreeVerifyBatchConfig : public BatchConfig {
 public:
+  TreeVerifyBatchConfig();
+  ~TreeVerifyBatchConfig();
+  Mode get_mode() const;
   // struct PerTokenInfo : BatchConfig::PerTokenInfo {
   //   int tree_branch_idx;
   // };
@@ -93,6 +102,7 @@ class BeamSearchBatchConfig : public BatchConfig {
 public:
   BeamSearchBatchConfig();
   BeamSearchBatchConfig(size_t beam_width, size_t target_iterations);
+  Mode get_mode() const;
 
   ~BeamSearchBatchConfig();
 
@@ -102,7 +112,7 @@ class BeamSearchBatchConfig : public BatchConfig {
   size_t beam_width;
   size_t target_iterations;
   static int const MAX_BEAM_WIDTH = 1;
-  static int const MAX_BEAM_DEPTH = 4;
+  static int const MAX_BEAM_DEPTH = 8;
 
   struct BeamSearchPerRequestInfo {
     bool request_completed;
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index ed5c6c3aa0..318dd7c9a3 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -72,12 +72,17 @@ struct BeamTree {
 //   std::vector<float> probs;
 // };
 
+class Tokenizer;
+
 class RequestManager {
 public:
   using RequestGuid = BatchConfig::RequestGuid;
   using TokenId = BatchConfig::TokenId;
+  RequestManager(Tokenizer *tokenizer, bool verbose = false);
   RequestManager();
   size_t get_num_processed_requests();
+  RequestGuid register_new_request(std::string const &prompt,
+                                   int max_sequence_length);
   RequestGuid register_new_request(std::vector<TokenId> const &prompt,
                                    int max_sequence_length);
   BatchConfig prepare_next_batch(BatchConfig const &bc,
@@ -111,8 +116,9 @@ class RequestManager {
       std::vector<std::pair<BatchConfig::TokenId, int>> const
           &outputSerializedTree);
 
-  TreeVerifyBatchConfig
-      convert_beam_to_tree_batch_config(BeamSearchBatchConfig const &beam_bc);
+  // TreeVerifyBatchConfig
+  //     convert_beam_to_tree_batch_config(BeamSearchBatchConfig const
+  //     &beam_bc);
 
   static void
       load_tokens_task(Legion::Task const *task,
@@ -126,6 +132,8 @@ class RequestManager {
                           Legion::Runtime *runtime);
 
 private:
+  Tokenizer *tokenizer;
+  bool verbose;
   std::queue<Request> pending_request_queue;
   std::unordered_map<RequestGuid, Request> running_request_queue;
   std::mutex request_queue_mutex;
@@ -142,7 +150,16 @@ class RequestManager {
   // Commited Tokens
   std::unordered_map<RequestGuid, std::vector<std::pair<int, int>>>
       committed_tokens;
+  // Performance profiling
   size_t num_processed_requests;
+
+private:
+  struct ProfileInfo {
+    int decoding_steps;
+    double start_time, finish_time;
+  };
+  std::unordered_map<RequestGuid, ProfileInfo> profiling_requests;
+  double total_request_run_time;
 };
 
 } // namespace FlexFlow
diff --git a/include/flexflow/tokenizers.h b/include/flexflow/tokenizers.h
new file mode 100644
index 0000000000..ffce2d423e
--- /dev/null
+++ b/include/flexflow/tokenizers.h
@@ -0,0 +1,103 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#pragma once
+#include "gpt_tokenizer.h"
+#include <sentencepiece_processor.h>
+
+namespace FlexFlow {
+
+/*!
+ * \brief a universal tokenizer that loads
+ * either HF's tokenizer or sentence piece, depending on the type.
+ */
+
+class Tokenizer {
+public:
+  // bos token
+  int32_t bos_token_id{0};
+  // eos token id
+  int32_t eos_token_id{1};
+
+  virtual ~Tokenizer() {}
+  virtual std::vector<int32_t> Encode(std::string const &text) = 0;
+  virtual std::string Decode(std::vector<int32_t> const &ids) = 0;
+
+  // static std::unique_ptr<Tokenizer> FromFile(const std::string& path);
+  // static std::unique_ptr<Tokenizer> ByteLevelBPEFromFile(const std::string&
+  // path);
+};
+
+class SentencePieceTokenizer : public Tokenizer {
+public:
+  SentencePieceTokenizer(std::string const &path) {
+    sentence_piece_.Load(path);
+  }
+
+  std::vector<int32_t> Encode(std::string const &text) final {
+    std::vector<int32_t> tokens;
+    sentence_piece_.Encode(text, &tokens).IgnoreError();
+    return tokens;
+  }
+
+  std::string Decode(std::vector<int32_t> const &ids) final {
+    std::string text;
+    sentence_piece_.Decode(ids, &text).IgnoreError();
+    return text;
+  }
+
+private:
+  // the tokenizer
+  sentencepiece::SentencePieceProcessor sentence_piece_;
+};
+
+class OptTokenizer : public Tokenizer {
+public:
+  OptTokenizer(std::string const &vocab_file,  // path to "gpt2-vocab.json"
+               std::string const &merges_file) // path to "gpt2-merges.txt"
+      : tokenizer(OPT, vocab_file, merges_file) {
+    bos_token_id = 0;
+    eos_token_id = 2;
+  }
+
+  std::vector<int32_t> Encode(std::string const &text) final {
+    std::vector<int32_t> tokens;
+    std::vector<int32_t> mask_ids;
+    tokenizer.encode(text, text.length(), &tokens, &mask_ids);
+
+    auto it = std::find(mask_ids.begin(), mask_ids.end(), 0);
+
+    if (it != mask_ids.end()) {
+      size_t index = std::distance(mask_ids.begin(), it);
+      tokens.erase(tokens.begin() + index, tokens.end());
+    }
+
+    return tokens;
+  }
+
+  std::string Decode(std::vector<int32_t> const &ids) final {
+    std::vector<int32_t> mask_ids;
+    for (int i = 0; i < ids.size(); i++) {
+      mask_ids.push_back(1);
+    }
+    std::string text = tokenizer.decode(ids, mask_ids);
+    return text;
+  }
+
+private:
+  GPT_Tokenizer tokenizer;
+};
+
+}; // namespace FlexFlow
diff --git a/examples/cpp/inference/gpt_tokenizer.h b/include/gpt_tokenizer.h
similarity index 96%
rename from examples/cpp/inference/gpt_tokenizer.h
rename to include/gpt_tokenizer.h
index 701436076a..0a2388925a 100644
--- a/examples/cpp/inference/gpt_tokenizer.h
+++ b/include/gpt_tokenizer.h
@@ -58,13 +58,13 @@ class GPT_Tokenizer {
   // ~GPT_Tokenizer();
   std::vector<std::string> bpe(std::wstring token);
   std::vector<std::string> tokenize(std::string str);
-  int64_t convert_token_to_id(std::string token);
+  int32_t convert_token_to_id(std::string token);
   void encode(std::string str,
               size_t max_length,
-              std::vector<int64_t> *input_ids,
-              std::vector<int64_t> *mask_ids);
-  std::string decode(std::vector<int64_t> input_ids,
-                     std::vector<int64_t> mask_ids);
+              std::vector<int32_t> *input_ids,
+              std::vector<int32_t> *mask_ids);
+  std::string decode(std::vector<int32_t> input_ids,
+                     std::vector<int32_t> mask_ids);
   tokenizer_mode mode;
   std::string bos_token;
   std::string eos_token;
@@ -74,8 +74,8 @@ class GPT_Tokenizer {
   std::string strip(std::string const &inpt);
 
 private:
-  std::unordered_map<std::string, int64_t> vocab;
-  std::unordered_map<int64_t, std::string> inverse_vocab;
+  std::unordered_map<std::string, int32_t> vocab;
+  std::unordered_map<int32_t, std::string> inverse_vocab;
   std::unordered_map<wbigram_pair, uint32_t, hash_pair> bpe_ranks;
   wchar_t *bytes_to_unicode();
   void unicode_to_bytes();
diff --git a/examples/cpp/inference/file_loader.cc b/inference/file_loader.cc
similarity index 86%
rename from examples/cpp/inference/file_loader.cc
rename to inference/file_loader.cc
index 15b88455e5..edd63ba167 100644
--- a/examples/cpp/inference/file_loader.cc
+++ b/inference/file_loader.cc
@@ -34,19 +34,15 @@ BatchConfig::TokenId *FileDataLoader::generate_requests(int num, int length) {
 
   BatchConfig::TokenId *prompts =
       (BatchConfig::TokenId *)malloc(sizeof(BatchConfig::TokenId) * 40);
-  std::cout << "load input from file: " << input_path << std::endl;
   std::ifstream in(input_path, std::ios::in | std::ios::binary);
   int size = num * length;
   std::vector<long> host_array(size);
   size_t loaded_data_size = sizeof(long) * size;
 
-  std::cout << "loaded_data_size: " << loaded_data_size << std::endl;
   in.seekg(0, in.end);
   in.seekg(0, in.beg);
   in.read((char *)host_array.data(), loaded_data_size);
 
-  std::cout << "loaded_data_size: " << loaded_data_size << std::endl;
-
   size_t in_get_size = in.gcount();
   if (in_get_size != loaded_data_size) {
     std::cout << "load data error" << std::endl;
@@ -54,15 +50,11 @@ BatchConfig::TokenId *FileDataLoader::generate_requests(int num, int length) {
   }
 
   assert(size == host_array.size());
-
   int index = 0;
   int data_index = 0;
 
-  std::cout << "loaded_data_size: " << loaded_data_size << std::endl;
-  std::cout << host_array.size() << "\n";
   for (auto v : host_array) {
     prompts[data_index++] = v;
-    std::cout << data_index << ", " << (int)v << "\n";
   }
   in.close();
   return prompts;
@@ -92,8 +84,6 @@ void load_attention_bias(float *ptr,
 
   for (auto file : bias_files) {
     size_t partial_size = hidden_dim;
-    std::cout << "partial_size in bias" << partial_size << ", file: " << file
-              << "\n";
     std::ifstream in(file, std::ios::in | std::ios::binary);
     std::vector<float> host_array(partial_size);
     size_t loaded_data_size = sizeof(float) * partial_size;
@@ -154,12 +144,8 @@ void load_attention_weights(float *ptr,
 
   // q, k, v, o -> 0, 1, 2, 3
   for (auto file : weight_files) {
-    std::cout << "file name and index: " << file << "->" << file_index << "\n";
     size_t partial_size = one_weight_file_size;
 
-    std::cout << "partial_size weight " << partial_size << ", " << volume
-              << ", " << hidden_dim << ", " << qkv_inner_dim << ", "
-              << num_heads << "\n";
     std::ifstream in(file, std::ios::in | std::ios::binary);
     std::vector<float> host_array(partial_size);
     size_t loaded_data_size = sizeof(float) * partial_size;
@@ -191,7 +177,6 @@ void load_attention_weights(float *ptr,
 }
 
 void load_from_file(float *ptr, size_t size, std::string filename) {
-  std::cout << "load from file: " << filename << std::endl;
   std::ifstream in(filename, std::ios::in | std::ios::binary);
   std::vector<float> host_array(size);
   size_t loaded_data_size = sizeof(float) * size;
@@ -200,16 +185,11 @@ void load_from_file(float *ptr, size_t size, std::string filename) {
   in.read((char *)host_array.data(), loaded_data_size);
 
   size_t in_get_size = in.gcount();
-  // std::cout << "size seee" << std::endl;
-  // std::cout << loaded_data_size << std::endl;
-  // std::cout << in_get_size << std::endl;
   if (in_get_size != loaded_data_size) {
     std::cout << "load weight data error " << in_get_size << ", "
               << loaded_data_size << ", " << sizeof(float) << std::endl;
     return;
   }
-
-  // std::cout << "finish loading input" << std::endl;
   assert(size == host_array.size());
 
   // normal
@@ -225,21 +205,17 @@ void FileDataLoader::load_positions(FFModel *ff,
                                     ParallelTensor position_pt,
                                     int max_seq_length,
                                     int offset) {
-  std::cout << "load positions" << std::endl;
   size_t volume = 1;
   std::vector<int> dims_vec;
   for (int i = 0; i < pt->num_dims; i++) {
-    // std::cout<< pt->dims[i] << "\n";
     volume *= pt->dims[i];
     dims_vec.push_back(pt->dims[i]);
-    std::cout << dims_vec.at(dims_vec.size() - 1) << ", ";
   }
 
   // load data;
   int *data = (int *)malloc(sizeof(int) * volume);
   for (int i = 0; i < volume; i++) {
     data[i] = i % max_seq_length + offset;
-    std::cout << data[i] << ", ";
   }
   // set tensor
 
@@ -255,12 +231,9 @@ void FileDataLoader::load_weights(
   for (auto &v : weights_layers) {
 
     int weights_num = v.second->numWeights;
-    std::cout << "weight layer: " << v.first << ", num" << weights_num << "\n";
-
     for (int i = 0; i < weights_num; i++) {
       Tensor weight = v.second->weights[i];
       if (weight == NULL) {
-        std::cout << "op no weights : " << v.first << "\n";
         continue;
       }
 
@@ -270,13 +243,11 @@ void FileDataLoader::load_weights(
         dims_vec.push_back(weight->dims[i]);
         volume *= weight->dims[i];
       }
-      std::cout << "load weights volume: " << volume << std::endl;
 
       assert(weight->data_type == DT_FLOAT);
       float *data = (float *)malloc(sizeof(float) * volume);
 
       if (v.first.find("attention_w") != std::string::npos) {
-        std::cout << "load weights bias: " << volume << "\n";
         if (i == 0) {
           load_attention_weights(data,
                                  num_heads,
diff --git a/examples/cpp/inference/file_loader.h b/inference/file_loader.h
similarity index 100%
rename from examples/cpp/inference/file_loader.h
rename to inference/file_loader.h
diff --git a/examples/cpp/inference/models/llama.cc b/inference/models/llama.cc
similarity index 83%
rename from examples/cpp/inference/models/llama.cc
rename to inference/models/llama.cc
index 7686ba746d..4a4eca1c8a 100644
--- a/examples/cpp/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -19,11 +19,45 @@ namespace FlexFlow {
 
 using namespace Legion;
 
+LLAMA::Config LLAMA::create_190m_config() {
+  Config config;
+  config.n_layers = 12;
+  config.vocab_size = 50265;
+  config.dim = 768;
+  config.n_heads = 12;
+  config.hidden_dim = 3072;
+  return config;
+}
+
+LLAMA::Config LLAMA::create_7b_config() {
+  // The default config is for llama 7b
+  Config config;
+  return config;
+}
+
+// Deprecated API
 void LLAMA::create_llama_model(FFModel &ff,
                                InferenceManager &im,
                                Config const &llama_config,
                                int num_pipeline_stages,
                                InferenceMode mode) {
+  assert(false);
+}
+
+void LLAMA::create_llama_model(FFModel &ff,
+                               InferenceManager &im,
+                               std::string const &model_name,
+                               std::string const &weight_file_path,
+                               int num_pipeline_stages,
+                               InferenceMode mode) {
+  Config llama_config;
+  if (model_name == "190m" || model_name == "190M") {
+    llama_config = create_190m_config();
+  } else if (model_name == "7b" || model_name == "7B") {
+    llama_config = create_7b_config();
+  } else {
+    assert(false && "Invalide model_name");
+  }
   //------------------------------compute machine views ------------------
   int num_devices = ff.config.workersPerNode * ff.config.numNodes;
   std::vector<MachineView> machine_views;
@@ -40,11 +74,9 @@ void LLAMA::create_llama_model(FFModel &ff,
   std::unordered_map<Tensor, std::vector<MachineView>> mapping;
   std::unordered_map<std::string, Layer *> weights_layers;
 
-  std::cout << "print llama config: " << llama_config.input_path << "-->"
-            << llama_config.batchSize << std::endl;
-
   Tensor input;
   {
+    assert(llama_config.max_num_tokens <= BatchConfig::MAX_NUM_TOKENS);
     int const token_dims[] = {BatchConfig::MAX_NUM_TOKENS, 1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
@@ -61,10 +93,11 @@ void LLAMA::create_llama_model(FFModel &ff,
   Layer *embedding = ff.layers.back();
   weights_layers.emplace("tok_embeddings_weight", embedding);
 
+  int num_transformer_layers = llama_config.n_layers;
   int num_transformer_layers_per_stage =
-      (32 + num_pipeline_stages - 1) / num_pipeline_stages;
+      (num_transformer_layers + num_pipeline_stages - 1) / num_pipeline_stages;
 
-  for (int i = 0; i < 1; i++) {
+  for (int i = 0; i < num_transformer_layers; i++) {
     // step 1: attention
     std::vector<int> axes = {2};
     Tensor att_norm =
@@ -170,7 +203,7 @@ void LLAMA::create_llama_model(FFModel &ff,
   }
   // final normalization and linear
   std::vector<int> axes = {2};
-  token = ff.rms_norm(token, 1e-6, 4096);
+  token = ff.rms_norm(token, llama_config.norm_eps, llama_config.dim);
   Layer *final_norm = ff.layers.back();
   weights_layers.emplace("norm_weight", final_norm);
 
@@ -189,8 +222,8 @@ void LLAMA::create_llama_model(FFModel &ff,
   // Compile the model
   std::cout << "------start compile ----------" << std::endl;
   im.compile_model_and_allocate_buffer(&ff, mapping);
-  FileDataLoader fileloader(llama_config.input_path,
-                            llama_config.weight_file_path,
+  FileDataLoader fileloader("",
+                            weight_file_path,
                             llama_config.n_heads,
                             llama_config.dim,
                             llama_config.dim / llama_config.n_heads);
diff --git a/examples/cpp/inference/models/llama.h b/inference/models/llama.h
similarity index 65%
rename from examples/cpp/inference/models/llama.h
rename to inference/models/llama.h
index 8c7d464936..e99beb92ca 100644
--- a/examples/cpp/inference/models/llama.h
+++ b/inference/models/llama.h
@@ -31,14 +31,12 @@ class LLAMA {
       dim = 4096;
       multiple_of = 256;
       norm_eps = 1e-6;
-      sentence_len = 347;
-      batchSize = 5;
       total_requests = 2560;
       incremental_mode = true;
-      sequence_length = BatchConfig::MAX_SEQ_LENGTH;
-      max_seq_len = BatchConfig::MAX_NUM_TOKENS;
-      max_beam_width = 1;
-      max_beam_depth = 4;
+      max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
+      max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
+      max_beam_width = BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+      max_beam_depth = BeamSearchBatchConfig::MAX_BEAM_DEPTH;
 
       // hidden dim
       hidden_dim = 4 * dim;
@@ -47,18 +45,27 @@ class LLAMA {
           multiple_of * int((hidden_dim + multiple_of - 1) / multiple_of);
     }
     int n_heads, n_layers, vocab_size, dim, multiple_of, hidden_dim,
-        sentence_len, batchSize, total_requests, incremental_mode,
-        sequence_length, max_seq_len, max_beam_width, max_beam_depth;
+        total_requests, incremental_mode, max_seq_len, max_num_tokens,
+        max_beam_width, max_beam_depth;
     float norm_eps;
     std::string weight_file_path;
     std::string input_path;
+    std::string tokenizer_file_path;
   };
 
   static void create_llama_model(FFModel &ff,
                                  InferenceManager &im,
-                                 Config const &llama_config,
+                                 std::string const &model_name,
+                                 std::string const &weight_file_path,
                                  int num_pipeline_stages,
                                  InferenceMode mode);
+  static void create_llama_model(FFModel &ff,
+                                 InferenceManager &im,
+                                 LLAMA::Config const &llama_config,
+                                 int num_pipeline_stages,
+                                 InferenceMode mode);
+  static Config create_190m_config();
+  static Config create_7b_config();
 };
 
 }; // namespace FlexFlow
diff --git a/examples/cpp/inference/models/opt.cc b/inference/models/opt.cc
similarity index 100%
rename from examples/cpp/inference/models/opt.cc
rename to inference/models/opt.cc
diff --git a/examples/cpp/inference/models/opt.h b/inference/models/opt.h
similarity index 85%
rename from examples/cpp/inference/models/opt.h
rename to inference/models/opt.h
index 11ae888eba..6ffc4220e9 100644
--- a/examples/cpp/inference/models/opt.h
+++ b/inference/models/opt.h
@@ -24,14 +24,14 @@ class OPT {
 public:
   struct Config {
     Config(void) {
-      vocab_size = 50272, word_embed_proj_dim = 768, hidden_size = 768;
+      vocab_size = 50272;
+      word_embed_proj_dim = 4096;
+      hidden_size = 4096;
       max_position_embeddings = 2048;
       layer_norm_elementwise_affine = true;
-      num_attention_heads = 12;
+      num_hidden_layers = 32;
       dropout = 0.1;
-      seed = 3;
-      ffn_dim = 3072;
-      num_hidden_layers = 12;
+      ffn_dim = 16384;
       max_beam_width = 1;
       batchSize = 8;
       sentence_len = 100;
@@ -43,10 +43,10 @@ class OPT {
     int num_attention_heads;
     std::string input_path;
     std::string weight_file_path;
+    std::string tokenizer_assets_folder;
     int max_position_embeddings;
     bool layer_norm_elementwise_affine;
     float dropout;
-    unsigned long long seed;
     int ffn_dim;
     int num_hidden_layers;
     int max_beam_width;
@@ -55,6 +55,16 @@ class OPT {
     int max_beam_depth;
   };
 
+  struct Small_Config : public Config {
+    Small_Config(void) {
+      word_embed_proj_dim = 768;
+      hidden_size = 768;
+      num_attention_heads = 12;
+      ffn_dim = 3072;
+      num_hidden_layers = 12;
+    }
+  };
+
   static void create_opt_model(FFModel &ff,
                                InferenceManager &im,
                                Config const &opt_config,
diff --git a/examples/cpp/inference/SPEC_LLAMA/CMakeLists.txt b/inference/spec_infer/CMakeLists.txt
similarity index 79%
rename from examples/cpp/inference/SPEC_LLAMA/CMakeLists.txt
rename to inference/spec_infer/CMakeLists.txt
index f273a385ea..c374d47506 100644
--- a/examples/cpp/inference/SPEC_LLAMA/CMakeLists.txt
+++ b/inference/spec_infer/CMakeLists.txt
@@ -1,19 +1,19 @@
 cmake_minimum_required(VERSION 3.10)
 
-project(FlexFlowExample_SPEC_LLAMA)
-set(project_target SPEC_LLAMA)
+project(FlexFlow_SpecInfer)
+set(project_target spec_infer)
 
 
 set(CPU_SRC
   ${FLEXFLOW_CPP_DRV_SRC}
-  llama.cc
+  spec_infer.cc
   ../file_loader.cc
-  ../models/llama.cc)
-
+  ../models/llama.cc
+  ../models/opt.cc)
 
 cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
 target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
-target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/examples/cpp/inference)
+target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/inference)
 target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
 
 set(BIN_DEST "bin")
diff --git a/inference/spec_infer/MODEL_WEIGHTS.md b/inference/spec_infer/MODEL_WEIGHTS.md
new file mode 100644
index 0000000000..79a194b159
--- /dev/null
+++ b/inference/spec_infer/MODEL_WEIGHTS.md
@@ -0,0 +1,27 @@
+To convert the weights of a HuggingFace LLM to SpecInfer's weight format, we first load the model and modify the tensor names to match SpecInfer's convention, and then convert these tensors to numpy arrays to store them in binary files.
+
+```python
+model = AutoModelForCausalLM.from_pretrained("decapoda-research/llama-7b-hf")
+
+for name, params in model.named_parameters():
+    for name, params in model.named_parameters():
+    name = (
+        name.replace(".", "_")
+        .replace("self_attn", "attention")
+        .replace("q_proj", "wq")
+        .replace("k_proj", "wk")
+        .replace("v_proj", "wv")
+        .replace("o_proj", "wo")
+        .replace("mlp", "feed_forward")
+        .replace("gate_proj", "w1")
+        .replace("down_proj", "w2")
+        .replace("up_proj", "w3")
+        .replace("input_layernorm", "attention_norm")
+        .replace("post_attention_layernorm", "ffn_norm")
+        .replace("embed_tokens", "tok_embeddings")
+        .replace("lm_head", "output")
+        .replace("model_", "")
+    )
+    params.detach().cpu().numpy().tofile('weights/' + name)
+```
+
diff --git a/examples/cpp/inference/SPEC_LLAMA/Makefile b/inference/spec_infer/Makefile
similarity index 94%
rename from examples/cpp/inference/SPEC_LLAMA/Makefile
rename to inference/spec_infer/Makefile
index 32e8e1cf3d..0e4b79f51f 100644
--- a/examples/cpp/inference/SPEC_LLAMA/Makefile
+++ b/inference/spec_infer/Makefile
@@ -23,10 +23,8 @@ USE_HDF         ?= 1		# Include HDF5 support (requires HDF5)
 ALT_MAPPERS     ?= 0		# Include alternative mappers (not recommended)
 
 # Put the binary file name here
-OUTFILE		?= spec_llama
+OUTFILE		?= llama_pipeline
 # List all the application source files here
-GEN_SRC		= llama.cc dataloader.cc 
-GEN_GPU_SRC	= dataloader.cu 
 ifndef CUDA_HOME
 CUDA_HOME = $(patsubst %/bin/nvcc,%,$(shell which nvcc | head -1))
 endif
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
new file mode 100644
index 0000000000..2068da7f3e
--- /dev/null
+++ b/inference/spec_infer/spec_infer.cc
@@ -0,0 +1,151 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/inference.h"
+#include "flexflow/tokenizers.h"
+#include "models/llama.h"
+#include <nlohmann/json.hpp>
+
+using namespace Legion;
+
+LegionRuntime::Logger::Category log_app("llama");
+
+struct FilePaths {
+  std::string llm_weight_file_path;
+  std::vector<std::string> ssm_weight_file_paths;
+  std::string prompt_file_path;
+  std::string tokenizer_file_path;
+};
+
+void parse_input_args(char **argv, int argc, FilePaths &paths) {
+  for (int i = 1; i < argc; i++) {
+    // weights
+    if (!strcmp(argv[i], "-llm-weight")) {
+      paths.llm_weight_file_path = std::string(argv[++i]);
+      continue;
+    }
+    // weights
+    if (!strcmp(argv[i], "-ssm-weight")) {
+      std::string file_path = std::string(argv[++i]);
+      paths.ssm_weight_file_paths.push_back(file_path);
+      continue;
+    }
+    // prompts
+    if (!strcmp(argv[i], "-prompt")) {
+      paths.prompt_file_path = std::string(argv[++i]);
+      continue;
+    }
+    // tokenizer
+    if (!strcmp(argv[i], "-tokenizer")) {
+      paths.tokenizer_file_path = std::string(argv[++i]);
+      continue;
+    }
+  }
+}
+
+void FlexFlow::top_level_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  FFConfig ffconfig;
+  FilePaths file_paths;
+
+  InputArgs const &command_args = HighLevelRuntime::get_input_args();
+  char **argv = command_args.argv;
+  int argc = command_args.argc;
+  parse_input_args(argv, argc, file_paths);
+  SentencePieceTokenizer tokenizer(file_paths.tokenizer_file_path);
+  InferenceManager im(ffconfig, BatchConfig::MAX_NUM_TOKENS, 1);
+  RequestManager rm(&tokenizer);
+  int total_num_requests = 0;
+  {
+    using json = nlohmann::json;
+    std::ifstream file_handle(file_paths.prompt_file_path);
+    assert(file_handle.good() && "Prompt file does not exist.");
+    json prompt_json = json::parse(file_handle,
+                                   /*parser_callback_t */ nullptr,
+                                   /*allow_exceptions */ true,
+                                   /*ignore_comments */ true);
+    for (auto &prompt : prompt_json) {
+      std::string text = prompt.get<std::string>();
+      printf("Prompt[%d]: %s\n", total_num_requests, text.c_str());
+      total_num_requests++;
+      rm.register_new_request(text, 128 /*max_sequence_length*/);
+    }
+  }
+  if (file_paths.ssm_weight_file_paths.size() == 0) {
+    assert(false &&
+           "SpecInfer needs at least one SSM for speculative inference");
+  }
+
+  FFModel beam_model(ffconfig);
+  FFModel tree_model(ffconfig);
+  LLAMA::create_llama_model(beam_model,
+                            im,
+                            "190m",
+                            file_paths.ssm_weight_file_paths[0],
+                            1,
+                            BEAM_SEARCH_MODE);
+  LLAMA::create_llama_model(tree_model,
+                            im,
+                            "7b",
+                            file_paths.llm_weight_file_path,
+                            ffconfig.workersPerNode * ffconfig.numNodes,
+                            TREE_VERIFY_MODE);
+
+  TreeVerifyBatchConfig tree_bc;
+  BeamSearchBatchConfig beam_bc;
+  InferenceResult tree_ir;
+
+  while (rm.get_num_processed_requests() < total_num_requests) {
+    int depth = 0;
+    // Beam Search
+    beam_bc = rm.prepare_next_batch_init(tree_bc, tree_ir);
+    if (rm.get_num_processed_requests() >= total_num_requests) {
+      break;
+    }
+    while (true) {
+      depth = beam_bc.beamRequestsInfo[0].current_depth;
+      FutureMap fm = im.inference(&beam_model, 0, beam_bc);
+      assert(fm.get_future_map_domain().get_volume() == 1);
+      Future future = fm.get_future(0);
+      BeamInferenceResult beam_ir = future.get_result<BeamInferenceResult>();
+      if (depth - 1 >= BeamSearchBatchConfig::MAX_BEAM_DEPTH) {
+        break;
+      } else {
+        beam_bc = rm.prepare_next_batch_beam(beam_bc, beam_ir);
+      }
+    }
+    // Token Tree Verification
+    {
+      tree_bc = rm.prepare_next_batch_verify(beam_bc);
+      FutureMap fm = im.inference(&tree_model, 0, tree_bc);
+      assert(fm.get_future_map_domain().get_volume() == 1);
+      Future future = fm.get_future(0);
+      tree_ir = future.get_result<InferenceResult>();
+    }
+  }
+
+  // Execution fence
+  {
+    Future future = runtime->issue_execution_fence(ctx);
+    future.get_void_result();
+  }
+
+  // float* data
+  std::cout << "----------inference finished--------------" << std::endl;
+}
+
+void FlexFlow::register_custom_tasks() {}
diff --git a/src/ops/beam_topk.cc b/src/ops/beam_topk.cc
index 6a49573538..16c14bdeca 100644
--- a/src/ops/beam_topk.cc
+++ b/src/ops/beam_topk.cc
@@ -344,8 +344,8 @@ BeamInferenceResult
 
   BeamSearchBatchConfig const *bc = (BeamSearchBatchConfig *)task->args;
 
-  std::cout << "beam search topk inference: "
-            << "\n";
+  // std::cout << "beam search topk inference: "
+  //           << "\n";
 
   BeamTopKMeta const *m = *((BeamTopKMeta **)task->local_args);
   Domain in1_domain = runtime->get_index_space_domain(
@@ -378,8 +378,8 @@ BeamInferenceResult
   size_t tokens_per_request = in1_domain.hi()[1] - in1_domain.lo()[1] + 1;
   size_t batch_size = in1_domain.get_volume() / length;
 
-  std::cout << "beam search topk params: " << length << ", " << k << ", "
-            << batch_size << "\n";
+  // std::cout << "beam search topk params: " << length << ", " << k << ", "
+  //           << batch_size << "\n";
   assert(out2_domain.get_volume() / k == batch_size);
 
   // std::vector<int> beam_width;
diff --git a/src/ops/beam_topk.cu b/src/ops/beam_topk.cu
index b6fccb68ba..d18d5c2f00 100644
--- a/src/ops/beam_topk.cu
+++ b/src/ops/beam_topk.cu
@@ -23,6 +23,8 @@ using Legion::coord_t;
 enum class HeapType { kMinHeap, kMaxHeap };
 enum class PreferIndices { kLower, kHigher };
 
+LegionRuntime::Logger::Category log_beam_topk("BeamTopK");
+
 template <typename T>
 struct Entry {
   int index;
@@ -268,7 +270,8 @@ __device__ void mergeBeamShards(int num_shards,
                                 Entry<T> *__restrict__ top_k_heap,
                                 T *top_k_values,
                                 int *top_k_indices,
-                                int *top_k_parents) {
+                                int *top_k_parents,
+                                bool verbose) {
   // If k < num_shards, we can use a min-heap with k elements to get the top k
   // of the sorted blocks.
   // If k > num_shards, we can initialize a min-heap with the top element from
@@ -288,7 +291,7 @@ __device__ void mergeBeamShards(int num_shards,
       float prob = probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
                          ((slot % max_heap_size) / k)];
       min_heap.assign(slot, {slot, (entries[slot].value * prob)});
-      if (batch_index == 0) {
+      if (verbose && batch_index == 0) {
         printf("slot %d, value %.15f, prob %15f\n",
                slot,
                entries[slot].value,
@@ -304,7 +307,7 @@ __device__ void mergeBeamShards(int num_shards,
 
       float prob = probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
                          ((shard % max_heap_size) / k)];
-      if (batch_index == 0) {
+      if (verbose && batch_index == 0) {
         printf("shard %d, index %d, value %.15f, prob %.15f\n",
                shard,
                entry.index,
@@ -397,7 +400,7 @@ __global__ void beam_topk_forward_kernel(T const *__restrict__ input,
                                          T *__restrict__ output,
                                          int *__restrict__ indices,
                                          int *__restrict__ parents,
-                                         bool is_print) {
+                                         bool verbose) {
   __shared__ char shared_memory[48 << 10];
   int const batch_index = blockIdx.x;
   // T const *batch_input = input + batch_index * length;
@@ -408,7 +411,7 @@ __global__ void beam_topk_forward_kernel(T const *__restrict__ input,
   Entry<T> *shared_entries = (Entry<T> *)shared_memory;
 
   int sub_request_id = thread_index / k;
-  // if (is_print) {
+  // if (verbose) {
   //   printf("beam kernel: batch_index: %d, thread_index %d, sub_request_id %d,
   //   "
   //          "request_id %d, token_nums %d\n",
@@ -422,7 +425,7 @@ __global__ void beam_topk_forward_kernel(T const *__restrict__ input,
   T const *batch_input = input + gpu_block_start_index[batch_index] +
                          (sub_request_id * token_nums * length);
 
-  if (batch_index == 0) {
+  if (verbose && batch_index == 0) {
     printf("request 0 start index: thread index %d, offset %d, batch_input %p, "
            "acc index %d acc "
            "prob %f, thread_count %d, request_id %d\n",
@@ -465,18 +468,18 @@ __global__ void beam_topk_forward_kernel(T const *__restrict__ input,
   if (thread_index == 0) {
     // merge beam_width heaps and store the parent
     // find which req it belongs to, replace the offset
-    printf("merge heaps, batch index: %d, sub_request_id %d, value %f\n",
-           batch_index,
-           sub_request_id,
-           acc_probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
-                     sub_request_id]);
+    // printf("merge heaps, batch index: %d, sub_request_id %d, value %f\n",
+    //       batch_index,
+    //       sub_request_id,
+    //       acc_probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+    //                 sub_request_id]);
     int const offset = batch_index * k;
     auto batch_output = output + offset;
     auto batch_indices = indices + offset;
     auto batch_parents = parents + offset;
     Entry<T> *top_k_heap = shared_entries + thread_count * k;
 
-    // if(batch_index == 0 && is_print){
+    // if(batch_index == 0 && verbose) {
     //   for(int i = 0; i < 18; i++){
     //       printf("see value: %.15f\n", shared_entries[i].value);
     //   }
@@ -494,7 +497,8 @@ __global__ void beam_topk_forward_kernel(T const *__restrict__ input,
                     top_k_heap,
                     batch_output,
                     batch_indices,
-                    batch_parents);
+                    batch_parents,
+                    verbose /*verbose prints*/);
   }
 }
 
@@ -529,8 +533,6 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
   std::vector<int> tokens_per_request;
 
   int block_start_index = 0;
-  int depth =
-      bc->beamRequestsInfo[bc->tokensInfo[0].request_index].current_depth;
 
   // a data structure for prob, parent_id,
   int max_total_requests =
@@ -551,7 +553,8 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
     int beam_size = bc->beamRequestsInfo[i].beam_size;
 
     // initial request
-    std::cout << "sub_requests: " << i << ", " << sub_requests[i] << "\n";
+    log_beam_topk.debug() << "sub_requests: " << i << ", " << sub_requests[i]
+                          << "\n";
     assert(sub_requests[i] > 0);
     // process sub requests
     for (int j = 0; j < sub_requests[i]; j++) {
@@ -559,12 +562,12 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
       // beam_slots[i].parent_id[j];
       acc_probs[req_index * BeamSearchBatchConfig::MAX_BEAM_WIDTH + j] =
           bc->beamRequestsInfo[i].probs[j];
-      std::cout << "probbbb req: " << i << ", sub req probability : "
-                << bc->beamRequestsInfo[i].probs[j] << ", sub request id " << j
-                << ", parent id " << bc->beamRequestsInfo[i].parent_id[j]
-                << ", data inddd"
-                << req_index * BeamSearchBatchConfig::MAX_BEAM_WIDTH + j
-                << "\n";
+      log_beam_topk.debug()
+          << "probbbb req: " << i
+          << ", sub req probability : " << bc->beamRequestsInfo[i].probs[j]
+          << ", sub request id " << j << ", parent id "
+          << bc->beamRequestsInfo[i].parent_id[j] << ", data inddd"
+          << req_index * BeamSearchBatchConfig::MAX_BEAM_WIDTH + j << "\n";
     }
 
     // process tokens
@@ -581,8 +584,8 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
     req_index += 1;
     block_start_index += (sub_requests[i] - 1) * num_new_tokens * length;
   }
-  std::cout << "what index: " << block_start_index
-            << ", block num: " << beam_num_blocks << "\n";
+  log_beam_topk.debug() << "what index: " << block_start_index
+                        << ", block num: " << beam_num_blocks << "\n";
 
   assert(batch_size >= beam_num_blocks);
   assert(bc->num_active_requests() == req_index);
@@ -596,9 +599,9 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
     if (num_shards > CUDA_NUM_THREADS) {
       num_shards = CUDA_NUM_THREADS;
     }
-    std::cout << "maxheap size:  " << max_heap_size << "\n";
-    std::cout << "maxbeam width:  " << max_beam_width
-              << ", heap size: " << heap_size << "\n";
+    log_beam_topk.debug() << "maxheap size:  " << max_heap_size << "\n";
+    log_beam_topk.debug() << "maxbeam width:  " << max_beam_width
+                          << ", heap size: " << heap_size << "\n";
   }
   // We are limited by the amount of shared memory we have per block.
   size_t shared_memory_size =
@@ -627,7 +630,8 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
                        tokens_per_request.data(),
                        sizeof(int) * beam_num_blocks,
                        cudaMemcpyHostToDevice));
-
+  // int depth =
+  //     bc->beamRequestsInfo[bc->tokensInfo[0].request_index].current_depth;
   beam_topk_forward_kernel<<<beam_num_blocks, num_shards, 0, stream>>>(
       input_ptr,
       shared_memory_size,
@@ -643,7 +647,8 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
       output_ptr,
       indices_ptr,
       parent_ptr,
-      depth == 1);
+      false /*verbose*/ // depth == 1
+  );
 
   // merge sub
 }
@@ -698,10 +703,13 @@ BeamTopKMeta::BeamTopKMeta(FFHandler handler) : OpMeta(handler) {
                        sizeof(float) * BeamSearchBatchConfig::MAX_BEAM_WIDTH *
                            BeamSearchBatchConfig::MAX_NUM_REQUESTS));
   checkCUDA(cudaMalloc(&block_start_index,
-                       sizeof(int) * BeamSearchBatchConfig::MAX_NUM_REQUESTS));
+                       sizeof(int) * BeamSearchBatchConfig::MAX_NUM_TOKENS *
+                           BeamSearchBatchConfig::MAX_NUM_REQUESTS));
   checkCUDA(cudaMalloc(&request_id,
-                       sizeof(int) * BeamSearchBatchConfig::MAX_NUM_REQUESTS));
+                       sizeof(int) * BeamSearchBatchConfig::MAX_NUM_TOKENS *
+                           BeamSearchBatchConfig::MAX_NUM_REQUESTS));
   checkCUDA(cudaMalloc(&tokens_per_request,
-                       sizeof(int) * BeamSearchBatchConfig::MAX_NUM_REQUESTS));
+                       sizeof(int) * BeamSearchBatchConfig::MAX_NUM_TOKENS *
+                           BeamSearchBatchConfig::MAX_NUM_REQUESTS));
 }
 }; // namespace FlexFlow
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index bc96e2a587..a0f0c34c1b 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -48,6 +48,8 @@ using Legion::TaskArgument;
 using Legion::TaskLauncher;
 using PCG::Node;
 
+LegionRuntime::Logger::Category log_inc_mha("IncrementalMHA");
+
 bool IncMultiHeadSelfAttentionParams::is_valid(
     ParallelTensorShape const &input) const {
   bool is_valid = input.is_valid();
@@ -589,9 +591,9 @@ FutureMap IncMultiHeadSelfAttention::inference(
   set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
   int idx = 0;
-  printf("BatchConfig, num_tokens: %d, num_requests: %d\n",
-         bc.num_tokens,
-         bc.num_active_requests());
+  log_inc_mha.debug("BatchConfig, num_tokens: %d, num_requests: %d",
+                    bc.num_tokens,
+                    bc.num_active_requests());
   IndexLauncher launcher(INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
                          parallel_is,
                          TaskArgument(&bc, sizeof(BatchConfig)),
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index ec13569665..ad4e59b710 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -769,8 +769,7 @@ void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
   // here because we need postion info in infernece 1
   cudaMemcpyAsync(m->tokenInfos,
                   &(bc->tokensInfo),
-                  bc->MAX_NUM_TOKENS * bc->MAX_BEAM_WIDTH *
-                      sizeof(BatchConfig::PerTokenInfo),
+                  bc->MAX_NUM_TOKENS * sizeof(BatchConfig::PerTokenInfo),
                   cudaMemcpyHostToDevice,
                   stream);
   cudaMemcpyAsync(m->requestInfos,
@@ -880,8 +879,7 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
         BatchConfig::MAX_SEQ_LENGTH * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
 
     // size_t token2ids_size = BatchConfig::MAX_NUM_TOKENS;
-    size_t tokeninfo_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
-                            BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+    size_t tokeninfo_size = BeamSearchBatchConfig::MAX_NUM_TOKENS;
 
     size_t beam_tokeninfo_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
                                  BeamSearchBatchConfig::MAX_BEAM_WIDTH;
@@ -906,9 +904,9 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
         beam_tokeninfo_size *
             sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo) +
         beam_requestinfo_size *
-            sizeof(BeamSearchBatchConfig::BeamSearchPerRequestInfo) +
-        complex_size * sizeof(cuFloatComplex); // more components will
-                                               // be added here later
+            sizeof(BeamSearchBatchConfig::
+                       BeamSearchPerRequestInfo); // more components will
+                                                  // be added here later
 
     Realm::Rect<1, coord_t> bounds(Realm::Point<1, coord_t>(0),
                                    Realm::Point<1, coord_t>(totalSize - 1));
@@ -941,8 +939,8 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
     qk_prods_softmax = (float *)(qk_prods + qk_prod_size);
     attn_heads = (float *)qk_prods_softmax + qk_prod_size;
     W_out_contiguous = (float *)attn_heads + attn_heads_size;
-    complex_input =
-        (cuFloatComplex *)(W_out_contiguous + W_out_contiguous_size);
+    checkCUDA(
+        cudaMalloc(&complex_input, complex_size * sizeof(cuFloatComplex)));
     int parallelism = vProjSize * oProjSize * num_heads;
     spec_build_w_out_tensor<<<GET_BLOCKS(parallelism),
                               min(CUDA_NUM_THREADS, parallelism),
diff --git a/src/ops/tree_inc_multihead_self_attention.cc b/src/ops/tree_inc_multihead_self_attention.cc
index 11c8e22e86..c5bbcc2cea 100644
--- a/src/ops/tree_inc_multihead_self_attention.cc
+++ b/src/ops/tree_inc_multihead_self_attention.cc
@@ -48,6 +48,8 @@ using Legion::TaskArgument;
 using Legion::TaskLauncher;
 using PCG::Node;
 
+LegionRuntime::Logger::Category log_tree_verify("TreeVerifyIncMHA");
+
 bool TreeIncMultiHeadSelfAttentionParams::is_valid(
     ParallelTensorShape const &input) const {
   bool is_valid = input.is_valid();
@@ -588,9 +590,10 @@ FutureMap TreeIncMultiHeadSelfAttention::inference(
   set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
   int idx = 0;
-  printf("TreeVerifyBatchConfig, num_tokens: %d, num_requests: %d\n",
-         bc.num_tokens,
-         bc.num_active_requests());
+  log_tree_verify.debug(
+      "TreeVerifyBatchConfig, num_tokens: %d, num_requests: %d",
+      bc.num_tokens,
+      bc.num_active_requests());
   IndexLauncher launcher(TREE_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
                          parallel_is,
                          TaskArgument(&bc, sizeof(TreeVerifyBatchConfig)),
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index c2864cc181..0cc3cf9191 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -897,8 +897,8 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
     qk_prods_softmax = (float *)(qk_prods + qk_prod_size);
     attn_heads = (float *)qk_prods_softmax + qk_prod_size;
     W_out_contiguous = (float *)attn_heads + attn_heads_size;
-    complex_input =
-        (cuFloatComplex *)(W_out_contiguous + W_out_contiguous_size);
+    checkCUDA(
+        cudaMalloc(&complex_input, complex_size * sizeof(cuFloatComplex)));
     int parallelism = vProjSize * oProjSize * num_heads;
     tree_build_w_out_tensor<<<GET_BLOCKS(parallelism),
                               min(CUDA_NUM_THREADS, parallelism),
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index d6b1c5bed9..a220c94085 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -22,8 +22,7 @@ namespace FlexFlow {
 
 LegionRuntime::Logger::Category log_bc("BatchConfig");
 
-BatchConfig::BatchConfig() {
-  num_tokens = 0;
+BatchConfig::BatchConfig() : num_tokens(0) {
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
     requestsInfo[i].token_start_offset = 0;
     requestsInfo[i].num_tokens_in_batch = 0;
@@ -36,6 +35,10 @@ BatchConfig::BatchConfig() {
   }
 }
 
+BatchConfig::Mode BatchConfig::get_mode() const {
+  return INC_DECODING_MODE;
+}
+
 // Deprecated API; should use RequestManager::update_batch
 int BatchConfig::update_results(InferenceResult const *ir) {
   assert(false);
diff --git a/src/runtime/beam_search_batch_config.cc b/src/runtime/beam_search_batch_config.cc
index 0bb5084d83..3adfb28241 100644
--- a/src/runtime/beam_search_batch_config.cc
+++ b/src/runtime/beam_search_batch_config.cc
@@ -41,6 +41,10 @@ BeamSearchBatchConfig::BeamSearchBatchConfig(size_t beam_width,
 
 BeamSearchBatchConfig::~BeamSearchBatchConfig() {}
 
+BatchConfig::Mode BeamSearchBatchConfig::get_mode() const {
+  return BEAM_SEARCH_MODE;
+}
+
 bool BeamSearchBatchConfig::done() const {
   assert(current_iteration <= target_iterations);
   return current_iteration == target_iterations;
@@ -85,4 +89,4 @@ void BeamSearchBatchConfig::print() const {
   }
 }
 
-}; // namespace FlexFlow
\ No newline at end of file
+}; // namespace FlexFlow
diff --git a/examples/cpp/inference/gpt_tokenizer.cc b/src/runtime/gpt_tokenizer.cc
similarity index 93%
rename from examples/cpp/inference/gpt_tokenizer.cc
rename to src/runtime/gpt_tokenizer.cc
index 1cb2bc1111..b011ad470a 100644
--- a/examples/cpp/inference/gpt_tokenizer.cc
+++ b/src/runtime/gpt_tokenizer.cc
@@ -29,19 +29,19 @@ std::string GPT_Tokenizer::utf32_to_utf8(std::u32string const &src) {
 };
 
 wchar_t *GPT_Tokenizer::bytes_to_unicode() {
-  std::vector<uint64_t> bs;
-  for (auto i = uint64_t(L'!'); i < uint64_t(L'~') + 1; ++i) {
+  std::vector<uint32_t> bs;
+  for (auto i = uint32_t(L'!'); i < uint32_t(L'~') + 1; ++i) {
     bs.push_back(i);
   }
-  for (auto i = uint64_t(L'¡'); i < uint64_t(L'¬') + 1; ++i) {
+  for (auto i = uint32_t(L'¡'); i < uint32_t(L'¬') + 1; ++i) {
     bs.push_back(i);
   }
-  for (auto i = uint64_t(L'®'); i < uint64_t(L'ÿ') + 1; ++i) {
+  for (auto i = uint32_t(L'®'); i < uint32_t(L'ÿ') + 1; ++i) {
     bs.push_back(i);
   }
-  std::vector<uint64_t> cs = bs;
-  uint64_t n = 0;
-  for (uint64_t b = 0; b < 256; ++b) {
+  std::vector<uint32_t> cs = bs;
+  uint32_t n = 0;
+  for (uint32_t b = 0; b < 256; ++b) {
     auto p = find(bs.begin(), bs.end(), b);
     if (p == bs.end()) {
       bs.push_back(b);
@@ -118,7 +118,7 @@ void GPT_Tokenizer::load_vocab(std::string const &vocab_file) {
                                  /*parser_callback_t */ nullptr,
                                  /*allow_exceptions */ true,
                                  /*ignore_comments */ true);
-  auto vocab_ = vocab_data_.get<std::unordered_map<std::string, int64_t>>();
+  auto vocab_ = vocab_data_.get<std::unordered_map<std::string, int32_t>>();
   for (auto item : vocab_) {
     vocab.insert({item.first, item.second});
     inverse_vocab.insert({item.second, item.first});
@@ -240,7 +240,7 @@ std::vector<std::string> GPT_Tokenizer::tokenize(std::string str) {
   return bpe_tokens;
 }
 
-int64_t GPT_Tokenizer::convert_token_to_id(std::string token) {
+int32_t GPT_Tokenizer::convert_token_to_id(std::string token) {
   auto p = vocab.find(token);
   if (p != vocab.end()) {
     return vocab[token];
@@ -251,8 +251,8 @@ int64_t GPT_Tokenizer::convert_token_to_id(std::string token) {
 
 void GPT_Tokenizer::encode(std::string str,
                            size_t max_length,
-                           std::vector<int64_t> *input_ids,
-                           std::vector<int64_t> *mask_ids) {
+                           std::vector<int32_t> *input_ids,
+                           std::vector<int32_t> *mask_ids) {
   if (not input_ids->empty()) {
     input_ids->clear();
   }
@@ -283,8 +283,8 @@ void GPT_Tokenizer::encode(std::string str,
   }
 }
 
-std::string GPT_Tokenizer::decode(std::vector<int64_t> input_ids,
-                                  std::vector<int64_t> mask_ids) {
+std::string GPT_Tokenizer::decode(std::vector<int32_t> input_ids,
+                                  std::vector<int32_t> mask_ids) {
   // look up each number in encoder.json dictionary
   std::ostringstream oss;
   int index = 0;
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 63a5bb6540..fd35b9aa76 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -25,6 +25,8 @@ namespace FlexFlow {
 
 using namespace Legion;
 
+LegionRuntime::Logger::Category log_inf_mgr("InferenceManager");
+
 InferenceManager::InferenceManager(FFConfig const &_config,
                                    int _max_num_tokens_per_batch,
                                    int _max_num_inflight_batches)
@@ -197,10 +199,10 @@ MachineView *InferenceManager::get_machine_view(int mv_id) {
 FutureMap InferenceManager::inference(FFModel *model,
                                       int index,
                                       BatchConfig const &bc) {
-  std::cout << "InferenceManager::inference" << index << std::endl;
-  std::cout << "num_active_tokens = " << bc.num_active_tokens()
-            << ", num_active_requests = " << bc.num_active_requests()
-            << std::endl;
+  log_inf_mgr.print("mode(%d) num_active_tokens(%d) num_active_requests(%d)",
+                    bc.get_mode(),
+                    bc.num_active_tokens(),
+                    bc.num_active_requests());
 
   assert(bc.num_active_tokens() > 0 && bc.num_active_requests() > 0);
   // We currently assume that the index-th batch will be placed
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 562b09e411..d7c18ebf94 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -3224,22 +3224,22 @@ void FFModel::compile(LossType loss_type,
   assert(final_operator->numOutputs == 1);
   for (size_t i = 0; i < operators.size(); i++) {
     Op *op = operators[i];
-    printf("operator[%zu]: type(%d)\n", i, operators[i]->op_type);
+    log_model.print("operator[%zu]: type(%d)", i, operators[i]->op_type);
     for (int j = 0; j < op->numInputs; j++) {
       LogicalRegion handle = op->inputs[j]->region;
-      printf("\tinputs[%d] region(%d,%d,%d)\n",
-             j,
-             handle.get_index_space().get_id(),
-             handle.get_field_space().get_id(),
-             handle.get_tree_id());
+      log_model.print("\tinputs[%d] region(%d,%d,%d)",
+                      j,
+                      handle.get_index_space().get_id(),
+                      handle.get_field_space().get_id(),
+                      handle.get_tree_id());
     }
     for (int j = 0; j < op->numOutputs; j++) {
       LogicalRegion handle = op->outputs[j]->region;
-      printf("\toutputs[%d] region(%d,%d,%d)\n",
-             j,
-             handle.get_index_space().get_id(),
-             handle.get_field_space().get_id(),
-             handle.get_tree_id());
+      log_model.print("\toutputs[%d] region(%d,%d,%d)",
+                      j,
+                      handle.get_index_space().get_id(),
+                      handle.get_field_space().get_id(),
+                      handle.get_tree_id());
     }
   }
   // assert(final_operator->outputs[0].num_dims == 2);
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 5b256d5bb7..ac038147d1 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -15,6 +15,7 @@
 
 #include "flexflow/inference.h"
 #include "flexflow/parallel_ops/parallel_op.h"
+#include "flexflow/tokenizers.h"
 #include <new>
 #include <stdexcept>
 
@@ -25,7 +26,12 @@ using namespace Legion;
 LegionRuntime::Logger::Category log_req_mgr("RequestManager");
 
 RequestManager::RequestManager()
-    : next_available_guid(1000000), num_processed_requests(0) {}
+    : tokenizer(nullptr), verbose(false), next_available_guid(1000000),
+      num_processed_requests(0) {}
+
+RequestManager::RequestManager(Tokenizer *_tokenizer, bool _verbose)
+    : tokenizer(_tokenizer), verbose(_verbose), next_available_guid(1000000),
+      num_processed_requests(0) {}
 
 RequestManager::RequestGuid
     RequestManager::register_new_request(std::vector<TokenId> const &prompt,
@@ -41,7 +47,36 @@ RequestManager::RequestGuid
 
   pending_request_queue.push(request);
 
-  std::cout << "new req: " << request.tokens.size() << std::endl;
+  if (verbose) {
+    std::cout << "new req: " << request.tokens.size() << std::endl;
+    for (int i = 0; i < request.tokens.size(); i++) {
+      std::cout << i << " : " << request.tokens[i] << std::endl;
+    }
+  }
+  return request.guid;
+}
+
+RequestManager::RequestGuid
+    RequestManager::register_new_request(std::string const &prompt,
+                                         int max_sequence_length) {
+  const std::lock_guard<std::mutex> lock(request_queue_mutex);
+
+  // Add a new request
+  Request request;
+  request.guid = next_available_guid++;
+  request.max_sequence_length = max_sequence_length;
+  request.tokens.push_back(tokenizer->bos_token_id);
+  std::vector<int32_t> tokens = tokenizer->Encode(prompt);
+  request.tokens.insert(request.tokens.end(), tokens.begin(), tokens.end());
+  request.initial_len = request.tokens.size();
+
+  pending_request_queue.push(request);
+  if (verbose) {
+    std::cout << "new req: " << request.tokens.size() << std::endl;
+    for (int i = 0; i < request.tokens.size(); i++) {
+      std::cout << i << " : " << request.tokens[i] << std::endl;
+    }
+  }
   return request.guid;
 }
 
@@ -64,8 +99,10 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
       assert(old_bc.tokensInfo[i].abs_depth_in_request + 1 ==
              request.tokens.size());
       // This is a decoding token
-      std::cout << "token is: " << result.token_ids[i];
+      log_req_mgr.print("Output token is: %d", result.token_ids[i]);
       request.tokens.push_back(result.token_ids[i]);
+      std::string output = tokenizer->Decode(request.tokens);
+      log_req_mgr.print("Output: %s", output.c_str());
     }
   }
   // Step 2: preparing the next batch for existing requests
@@ -86,10 +123,26 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
       log_req_mgr.print("[Done] guid(%zu) final_length(%zu)",
                         old_bc.requestsInfo[i].request_guid,
                         request.tokens.size());
-      std::cout << "print results: " << std::endl;
-      for (int i = 0; i < request.tokens.size(); i++) {
-        std::cout << request.tokens.at(i) << ", ";
-      }
+      std::string output = tokenizer->Decode(request.tokens);
+      log_req_mgr.print("Final output: %s", output.c_str());
+      num_processed_requests++;
+      ProfileInfo profile_info = profiling_requests[request.guid];
+      profile_info.finish_time = Realm::Clock::current_time_in_microseconds();
+      total_request_run_time +=
+          profile_info.finish_time - profile_info.start_time;
+      profiling_requests[request.guid] = profile_info;
+      log_req_mgr.print("[Profile] guid(%zu) decoding_steps(%d) start(%.1lf) "
+                        "finish(%.1lf) latency(%.1lf) acc_latency(%.1lf)",
+                        request.guid,
+                        profile_info.decoding_steps,
+                        profile_info.start_time,
+                        profile_info.finish_time,
+                        profile_info.finish_time - profile_info.start_time,
+                        total_request_run_time);
+      // std::cout << "print results: " << std::endl;
+      // for (int i = 0; i < request.tokens.size(); i++) {
+      //   std::cout << request.tokens.at(i) << ", ";
+      // }
     } else {
       new_bc.request_completed[i] = false;
       new_bc.requestsInfo[i].token_start_offset = processed_tokens;
@@ -115,6 +168,8 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
         new_bc.tokensInfo[new_bc.num_tokens].token_id = request.tokens[depth];
         new_bc.num_tokens++;
       }
+      // Update profiling
+      profiling_requests[new_bc.requestsInfo[i].request_guid].decoding_steps++;
     }
   }
   // Step 3: add new requests to the next batch
@@ -133,6 +188,11 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
         new_bc.requestsInfo[i].max_sequence_length =
             new_request.max_sequence_length;
         new_bc.request_completed[i] = false;
+        // add profile_info for the new request
+        ProfileInfo profile_info;
+        profile_info.decoding_steps = 1;
+        profile_info.start_time = Realm::Clock::current_time_in_microseconds();
+        profiling_requests[new_request.guid] = profile_info;
         for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
           int depth = new_bc.requestsInfo[i].token_start_offset + j;
           new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
@@ -159,13 +219,15 @@ BeamSearchBatchConfig
                                             BeamInferenceResult const &result) {
   const std::lock_guard<std::mutex> lock(request_queue_mutex);
 
-  std::cout << "print all results"
-            << "\n";
-  for (int i = 0; i < 40; i++) {
-    std::cout << result.token_ids[i] << ", ";
+  if (verbose) {
+    std::cout << "print all results"
+              << "\n";
+    for (int i = 0; i < 40; i++) {
+      std::cout << result.token_ids[i] << ", ";
+    }
+    std::cout << "Current Beam Depth: "
+              << old_bc.beamRequestsInfo[0].current_depth << "\n";
   }
-  std::cout << "Current Beam Depth: "
-            << old_bc.beamRequestsInfo[0].current_depth << "\n";
 
   // Step 1: Store result to the beam tree struct
   store_beam_metadata(old_bc, result);
@@ -184,7 +246,7 @@ BeamSearchBatchConfig
                            old_bc.requestsInfo[i].num_tokens_in_batch;
 
     // assert(processed_tokens < request.tokens.size());
-    std::cout << "\nprocessed_tokens: " << processed_tokens << "\n";
+    log_req_mgr.debug() << "processed_tokens: " << processed_tokens << "\n";
     if (processed_tokens >
         old_bc.beamRequestsInfo[i].max_depth + request.tokens.size()
         // || ir.results[t] == 0 TODO: replace this with <EOS>
@@ -199,8 +261,8 @@ BeamSearchBatchConfig
       new_bc.requestsInfo[i].max_sequence_length =
           old_bc.requestsInfo[i].max_sequence_length;
     } else {
-      std::cout << "num tokens: " << old_bc.num_tokens << ", "
-                << new_bc.num_tokens;
+      log_req_mgr.debug() << "num tokens: " << old_bc.num_tokens << ", "
+                          << new_bc.num_tokens;
       new_bc.request_completed[i] = false;
       new_bc.requestsInfo[i].token_start_offset = processed_tokens;
       new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
@@ -218,7 +280,7 @@ BeamSearchBatchConfig
           old_bc.beamRequestsInfo[i].beam_size;
 
       // do the slot exchange to minimize the cache exchange in kernel.
-      std::cout << "update metadata" << std::endl;
+      // std::cout << "update metadata" << std::endl;
       update_beam_metadata(new_bc, beam_trees[i], i);
 
       if (new_bc.requestsInfo[i].token_start_offset + 1 >=
@@ -263,8 +325,6 @@ BeamSearchBatchConfig
   new_bc.num_tokens = 0;
   int result_index = 0;
 
-  std::cout << "11111111" << std::endl;
-
   for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
     if (old_bc.request_completed[i]) {
       continue;
@@ -272,16 +332,12 @@ BeamSearchBatchConfig
     size_t guid = old_bc.requestsInfo[i].request_guid;
     Request &request = running_request_queue[guid];
 
-    printf("req %d\n", i);
-
     // Verify this: get verified tokens from result
     std::vector<std::pair<BatchConfig::TokenId, int>> tree_outputs =
         std::vector<std::pair<BatchConfig::TokenId, int>>();
 
     assert(old_bc.num_tokens > 0);
 
-    std::cout << "222222222" << std::endl;
-
     int start_depth = old_bc.tokensInfo[result_index].abs_depth_in_request;
     if (committed_tokens.find(guid) == committed_tokens.end()) {
       committed_tokens[guid] = std::vector<std::pair<int, int>>();
@@ -301,12 +357,14 @@ BeamSearchBatchConfig
             std::make_pair(old_bc.tokensInfo[result_index].abs_depth_in_request,
                            result_index));
 
-        std::cout << "Index with old_bacth: " << result_index << std::endl;
-        printf("  Input: [%d] %d ---> [%d] %d \n",
-               old_bc.tokensInfo[result_index].abs_depth_in_request,
-               old_bc.tokensInfo[result_index].token_id,
-               tree_outputs.back().second,
-               tree_outputs.back().first);
+        if (verbose) {
+          std::cout << "Index with old_bacth: " << result_index << std::endl;
+          printf("  Input: [%d] %d ---> [%d] %d \n",
+                 old_bc.tokensInfo[result_index].abs_depth_in_request,
+                 old_bc.tokensInfo[result_index].token_id,
+                 tree_outputs.back().second,
+                 tree_outputs.back().first);
+        }
         // std::cout << "  Input: " << old_bc.tokensInfo[result_index].token_id
         // << ""
         //   << old_bc.tokensInfo[result_index].abs_depth_in_request <<
@@ -319,11 +377,10 @@ BeamSearchBatchConfig
       result_index++;
     }
 
-    std::cout << "333333333333" << std::endl;
-
     std::vector<std::pair<BatchConfig::TokenId, int>> verified_tokens =
         traverse_verify_tree(guid, dfs_tree_inputs.at(guid), tree_outputs);
-
+    log_req_mgr.print("Number of Verified Tokens = %zu",
+                      verified_tokens.size());
     // check if the request is finished
     if (verified_tokens.size() + request.tokens.size() >=
         request.max_sequence_length) {
@@ -335,8 +392,21 @@ BeamSearchBatchConfig
       log_req_mgr.print("[Done] guid(%zu) with final length(%zu)",
                         request.guid,
                         request.tokens.size());
-
       new_bc.request_completed[i] = true;
+      num_processed_requests++;
+      ProfileInfo profile_info = profiling_requests[request.guid];
+      profile_info.finish_time = Realm::Clock::current_time_in_microseconds();
+      total_request_run_time +=
+          profile_info.finish_time - profile_info.start_time;
+      profiling_requests[request.guid] = profile_info;
+      log_req_mgr.print("[Profile] guid(%zu) decoding_steps(%d) start(%.1lf) "
+                        "finish(%.1lf) latency(%.1lf) acc_latency(%.1lf)",
+                        request.guid,
+                        profile_info.decoding_steps,
+                        profile_info.start_time,
+                        profile_info.finish_time,
+                        profile_info.finish_time - profile_info.start_time,
+                        total_request_run_time);
 
       beam_trees[i] = BeamTree{};
       dfs_tree_inputs.erase(
@@ -387,6 +457,8 @@ BeamSearchBatchConfig
         break;
       }
     }
+    std::string output = tokenizer->Decode(request.tokens);
+    log_req_mgr.print("Output: %s", output.c_str());
   }
 
   // Step 2: Initialize new request
@@ -404,7 +476,11 @@ BeamSearchBatchConfig
                      (int)new_request.tokens.size());
         new_bc.requestsInfo[i].max_sequence_length =
             new_request.max_sequence_length;
-
+        // add profile_info for the new request
+        ProfileInfo profile_info;
+        profile_info.decoding_steps = 0;
+        profile_info.start_time = Realm::Clock::current_time_in_microseconds();
+        profiling_requests[new_request.guid] = profile_info;
         // init the beam search metadata per request
         new_bc.beamRequestsInfo[i].beam_size =
             BeamSearchBatchConfig::MAX_BEAM_WIDTH;
@@ -458,10 +534,12 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
     std::vector<std::pair<BatchConfig::TokenId, int>> dfs_tree_inputs =
         traverse_beam_tree(old_bc, i, request.tokens.size() - 1);
 
-    std::cout << "11111" << std::endl;
-    std::cout << "Request Tokens Size: " << request.tokens.size() << std::endl;
-    for (int k = 0; k < request.tokens.size(); k++) {
-      std::cout << k << ": " << request.tokens[k] << std::endl;
+    if (verbose) {
+      std::cout << "Request Tokens Size: " << request.tokens.size()
+                << std::endl;
+      for (int k = 0; k < request.tokens.size(); k++) {
+        std::cout << k << ": " << request.tokens[k] << std::endl;
+      }
     }
 
     // Normal Request Info
@@ -471,9 +549,10 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
         old_bc.requestsInfo[i].max_sequence_length;
     // TODO: Check this
     new_bc.requestsInfo[i].num_tokens_in_batch = 0;
-
     new_bc.request_completed[i] = false;
 
+    // Profiling
+    profiling_requests[new_bc.requestsInfo[i].request_guid].decoding_steps += 1;
     // TODO: Add prompt token first in first verify iteration
     if (request.tokens.size() == request.initial_len) {
       for (int j = 0; j < request.initial_len; j++) {
@@ -508,8 +587,10 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       new_bc.requestsInfo[i].token_start_offset = request.tokens.size() - 1;
     }
 
-    std::cout << "dfs_tree_inputs.size(): " << dfs_tree_inputs.size()
-              << std::endl;
+    if (verbose) {
+      std::cout << "dfs_tree_inputs.size(): " << dfs_tree_inputs.size()
+                << std::endl;
+    }
 
     // add prompt to the dfs tree
     if (committed_tokens.find(guid) != committed_tokens.end()) {
@@ -524,9 +605,11 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
           new_bc.commited_tokens[new_bc.num_tokens_to_commit].token_index = j;
           new_bc.commited_tokens[new_bc.num_tokens_to_commit].request_index = i;
           new_bc.commited_tokens[new_bc.num_tokens_to_commit].token_depth = j;
-          std::cout << new_bc.num_tokens_to_commit
-                    << "- committed_token.token_depth: " << j
-                    << ", token_index: " << j << std::endl;
+          if (verbose) {
+            std::cout << new_bc.num_tokens_to_commit
+                      << "- committed_token.token_depth: " << j
+                      << ", token_index: " << j << std::endl;
+          }
           new_bc.num_tokens_to_commit++;
         }
       } else {
@@ -537,31 +620,37 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
         new_bc.commited_tokens[new_bc.num_tokens_to_commit].request_index = i;
         new_bc.commited_tokens[new_bc.num_tokens_to_commit].token_depth =
             committed_token.first;
-        std::cout << new_bc.num_tokens_to_commit
-                  << "- committed_token.token_depth: " << committed_token.first
-                  << ", token_index: " << committed_token.second << std::endl;
+        if (verbose) {
+          std::cout << new_bc.num_tokens_to_commit
+                    << "- committed_token.token_depth: "
+                    << committed_token.first
+                    << ", token_index: " << committed_token.second << std::endl;
+        }
         new_bc.num_tokens_to_commit++;
       }
-
-      std::cout << "new_bc.num_tokens_to_commit: "
-                << new_bc.num_tokens_to_commit << std::endl;
+      if (verbose) {
+        std::cout << "new_bc.num_tokens_to_commit: "
+                  << new_bc.num_tokens_to_commit << std::endl;
+      }
     }
 
     // Token Info
     for (int j = 1; j < dfs_tree_inputs.size(); j++) {
       auto token = dfs_tree_inputs.at(j);
-
-      std::cout << "[" << j << "] Token: " << token.first
-                << ", Depth:" << token.second << std::endl;
-
+      if (verbose) {
+        std::cout << "[" << j << "] Token: " << token.first
+                  << ", Depth:" << token.second << std::endl;
+      }
       // Normal Token Info
       new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
       new_bc.tokensInfo[new_bc.num_tokens].token_id = token.first;
       new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = token.second;
 
       // TODO: Add committed token info
-      std::cout << "committed_tokens.size(): " << new_bc.num_tokens_to_commit
-                << std::endl;
+      if (verbose) {
+        std::cout << "committed_tokens.size(): " << new_bc.num_tokens_to_commit
+                  << std::endl;
+      }
 
       if (committed_tokens.find(guid) != committed_tokens.end()) {
         // if (j == 1) {
@@ -582,15 +671,20 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
           new_bc.commited_tokens[new_bc.num_tokens_to_commit].request_index = i;
           new_bc.commited_tokens[new_bc.num_tokens_to_commit].token_depth =
               committed_token.first;
-          std::cout << new_bc.num_tokens_to_commit
-                    << "- committed_token.token_depth: "
-                    << committed_token.first
-                    << ", token_index: " << committed_token.second << std::endl;
+          if (verbose) {
+            std::cout << new_bc.num_tokens_to_commit
+                      << "- committed_token.token_depth: "
+                      << committed_token.first
+                      << ", token_index: " << committed_token.second
+                      << std::endl;
+          }
           new_bc.num_tokens_to_commit++;
         }
       }
-      std::cout << "new_bc.num_tokens_to_commit: "
-                << new_bc.num_tokens_to_commit << std::endl;
+      if (verbose) {
+        std::cout << "new_bc.num_tokens_to_commit: "
+                  << new_bc.num_tokens_to_commit << std::endl;
+      }
 
       new_bc.num_tokens++;
       new_bc.requestsInfo[i].num_tokens_in_batch++;
@@ -615,8 +709,10 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
   auto start_depth = old_bc.tokensInfo[0].abs_depth_in_request;
   int result_index = 0;
 
-  std::cout << "Store total of " << old_bc.num_tokens
-            << " tokens in the current batch.\n";
+  if (verbose) {
+    std::cout << "Store total of " << old_bc.num_tokens
+              << " tokens in the current batch.\n";
+  }
 
   for (int i = 0; i <= old_bc.num_tokens; i++) {
     int request_index = old_bc.tokensInfo[i].request_index;
@@ -634,24 +730,29 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
           (old_bc.tokensInfo[i - 1].abs_depth_in_request - start_depth) *
           beam_width;
 
-      std::cout << "i = " << i << ", result index = " << result_index
-                << ", value: " << result.token_ids[result_index] << "\n";
-
+      if (verbose) {
+        std::cout << "i = " << i << ", result index = " << result_index
+                  << ", value: " << result.token_ids[result_index] << "\n";
+      }
       int index = old_bc.tokensInfo[i - 1].request_index;
       int beam_size = old_bc.beamRequestsInfo[index].beam_size;
       int depth = old_bc.beamRequestsInfo[index].current_depth;
 
       if (depth == 1) {
         // store the last input into the tree;
-        std::cout << "try to store the input"
-                  << "\n";
+        if (verbose) {
+          std::cout << "try to store the input"
+                    << "\n";
+        }
         Request &request =
             running_request_queue[old_bc.requestsInfo[index].request_guid];
         beam_trees[index].treeLayers[0].tokens[0] = request.tokens.back();
         beam_trees[index].treeLayers[0].probs[0] = 1;
         beam_trees[index].treeLayers[0].parent_ids[0] = -1;
-        std::cout << "Store the previous last token to the tree root: "
-                  << request.tokens.back() << "\n";
+        if (verbose) {
+          std::cout << "Store the previous last token to the tree root: "
+                    << request.tokens.back() << "\n";
+        }
       }
 
       for (int beam_id = 0; beam_id < beam_width; beam_id++) {
@@ -662,9 +763,11 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
         beam_trees[index].treeLayers[depth].parent_ids[beam_id] =
             result.parent_id[result_index];
 
-        std::cout << "tree value: " << depth << "token: "
-                  << beam_trees[index].treeLayers[depth].tokens[beam_id]
-                  << "result tokens: " << result.token_ids[result_index];
+        if (verbose) {
+          std::cout << "tree value: " << depth << "token: "
+                    << beam_trees[index].treeLayers[depth].tokens[beam_id]
+                    << "result tokens: " << result.token_ids[result_index];
+        }
         result_index += 1;
       }
 
@@ -733,8 +836,10 @@ void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
         if (parents.find(j) == parents.end()) {
           // this slot has not been assigned
           // find the smallest not assigned child and put in
-          std::cout << "request_index" << request_index << ", miss slot: " << j
-                    << "\n";
+          if (verbose) {
+            std::cout << "request_index" << request_index
+                      << ", miss slot: " << j << "\n";
+          }
           for (int k = 0; k < beam_size; k++) {
             if (childs.find(k) == childs.end()) {
               // parent -> j to child k;
@@ -753,32 +858,37 @@ void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
       }
     }
   }
-  std::cout << "-----------after parent id exchange-----------" << std::endl;
-  for (int j = 0; j < beam_size; j++) {
-    std::cout << "after request id: " << request_index << "beam id = " << j
-              << "parnt: "
-              << new_bc.beamRequestsInfo[request_index].parent_id[j]
-              << "token: " << new_bc.beamRequestsInfo[request_index].tokens[j]
-              << "probs: " << new_bc.beamRequestsInfo[request_index].probs[j]
-              << std::endl;
+  if (verbose) {
+    std::cout << "-----------after parent id exchange-----------" << std::endl;
+    for (int j = 0; j < beam_size; j++) {
+      std::cout << "after request id: " << request_index << "beam id = " << j
+                << "parnt: "
+                << new_bc.beamRequestsInfo[request_index].parent_id[j]
+                << "token: " << new_bc.beamRequestsInfo[request_index].tokens[j]
+                << "probs: " << new_bc.beamRequestsInfo[request_index].probs[j]
+                << std::endl;
+    }
   }
 }
 
-bool PreOrder(BeamTree const &tree,
-              int max_depth,
-              int current_depth,
-              int beam_width,
-              int id,
-              std::vector<std::pair<BeamSearchBatchConfig::TokenId, int>>
-                  &serializedTree) {
+bool PreOrder(
+    BeamTree const &tree,
+    int max_depth,
+    int current_depth,
+    int beam_width,
+    int id,
+    std::vector<std::pair<BeamSearchBatchConfig::TokenId, int>> &serializedTree,
+    bool verbose) {
   // terminate
   if (current_depth >= max_depth) {
     serializedTree.push_back(std::make_pair(
         tree.treeLayers[current_depth].tokens[id], current_depth));
-    std::cout << "last tokens: " << tree.treeLayers[current_depth].tokens[id]
-              << "\n";
-    std::cout << "return true"
-              << "\n";
+    if (verbose) {
+      std::cout << "last tokens: " << tree.treeLayers[current_depth].tokens[id]
+                << "\n";
+      std::cout << "return true"
+                << "\n";
+    }
     return true;
   }
 
@@ -786,8 +896,10 @@ bool PreOrder(BeamTree const &tree,
   // std::cout<<"node: " << current_depth << ", id: " <<
   serializedTree.push_back(
       std::make_pair(tree.treeLayers[current_depth].tokens[id], current_depth));
-  std::cout << "push something: " << tree.treeLayers[current_depth].tokens[id]
-            << ", " << current_depth << std::endl;
+  if (verbose) {
+    std::cout << "push something: " << tree.treeLayers[current_depth].tokens[id]
+              << ", " << current_depth << std::endl;
+  }
   int index = serializedTree.size() - 1;
   int next_layers = current_depth + 1;
 
@@ -799,14 +911,17 @@ bool PreOrder(BeamTree const &tree,
 
     // for all childs, do preOrder
     if (child_parent == id) {
-      std::cout << "current depth: " << current_depth << ", child_parent, "
-                << child_parent << ", child_id, " << child_id << "\n";
+      if (verbose) {
+        std::cout << "current depth: " << current_depth << ", child_parent, "
+                  << child_parent << ", child_id, " << child_id << "\n";
+      }
       bool res = PreOrder(tree,
                           max_depth,
                           current_depth + 1,
                           beam_width,
                           child_id,
-                          serializedTree);
+                          serializedTree,
+                          verbose);
       flag = flag || res;
     }
   }
@@ -820,6 +935,7 @@ bool PreOrder(BeamTree const &tree,
   return flag;
 }
 
+#ifdef DEADCODE
 TreeVerifyBatchConfig RequestManager::convert_beam_to_tree_batch_config(
     BeamSearchBatchConfig const &beam_bc) {
   TreeVerifyBatchConfig tree_bc;
@@ -838,7 +954,8 @@ TreeVerifyBatchConfig RequestManager::convert_beam_to_tree_batch_config(
              0,
              beam_bc.beamRequestsInfo[i].beam_size,
              0,
-             serializedTree);
+             serializedTree,
+             verbose);
     tree_bc.requestsInfo[i].request_guid = beam_bc.requestsInfo[i].request_guid;
     tree_bc.requestsInfo[i].max_sequence_length =
         beam_bc.requestsInfo[i].max_sequence_length;
@@ -857,6 +974,7 @@ TreeVerifyBatchConfig RequestManager::convert_beam_to_tree_batch_config(
   }
   return tree_bc;
 }
+#endif
 
 std::vector<std::pair<BatchConfig::TokenId, int>>
     RequestManager::traverse_verify_tree(
@@ -870,20 +988,21 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
   std::vector<std::pair<int, int>> new_committed_tokens =
       std::vector<std::pair<int, int>>();
 
-  std::cout << "Input size: " << inputSerializedTree.size() << std::endl;
-  std::cout << "Output size: " << outputSerializedTree.size() << std::endl;
+  log_req_mgr.print("Input size (%zu) Output size (%zu)",
+                    inputSerializedTree.size(),
+                    outputSerializedTree.size());
 
-  std::cout << "========Input============" << std::endl;
+  log_req_mgr.print("========Input============");
   for (auto const &pair : inputSerializedTree) {
-    std::cout << "(" << pair.first << ", " << pair.second << ")" << std::endl;
+    log_req_mgr.print("(%d, %d)", pair.first, pair.second);
   }
-  std::cout << "========Output============" << std::endl;
+  log_req_mgr.print("========Output============");
   for (auto const &pair : outputSerializedTree) {
-    std::cout << "(" << pair.first << ", " << pair.second << ")" << std::endl;
+    log_req_mgr.print("(%d, %d)", pair.first, pair.second);
   }
-  std::cout << "========Committed============" << std::endl;
+  log_req_mgr.print("========Committed============");
   for (auto const &pair : committed_tokens.at(guid)) {
-    std::cout << "(" << pair.first << ", " << pair.second << ")" << std::endl;
+    log_req_mgr.print("(%d, %d)", pair.first, pair.second);
   }
 
   assert(inputSerializedTree.size() == outputSerializedTree.size());
@@ -898,9 +1017,9 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
           input.second,
           committed_tokens.at(guid).at(i).second)); // <input_abs_depth,
                                                     // input_index_in_batch>
-      std::cout << committed_tokens.at(guid).at(i).first << ", "
-                << committed_tokens.at(guid).at(i).second << std::endl;
-      std::cout << input.first << ", " << input.second << std::endl;
+      // std::cout << committed_tokens.at(guid).at(i).first << ", "
+      //           << committed_tokens.at(guid).at(i).second << std::endl;
+      // std::cout << input.first << ", " << input.second << std::endl;
 
       assert(committed_tokens.at(guid).at(i).first == input.second);
       continue;
@@ -917,14 +1036,14 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
     }
   }
   committed_tokens[guid] = new_committed_tokens;
-  std::cout << "========Verified============" << std::endl;
+  log_req_mgr.print("========Verified============");
   for (auto const &pair : verifiedTree) {
-    std::cout << "(" << pair.first << ", " << pair.second << ")" << std::endl;
+    log_req_mgr.print("(%d, %d)", pair.first, pair.second);
   }
 
-  std::cout << "========New Committed============" << std::endl;
+  log_req_mgr.print("========New Committed============");
   for (auto const &pair : committed_tokens.at(guid)) {
-    std::cout << "(" << pair.first << ", " << pair.second << ")" << std::endl;
+    log_req_mgr.print("(%d, %d)", pair.first, pair.second);
   }
 
   return verifiedTree;
@@ -934,14 +1053,16 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
     RequestManager::traverse_beam_tree(BeamSearchBatchConfig const &old_bc,
                                        int request_index,
                                        int token_start_offset) {
-
-  std::cout << "[Traverse Beam Tree] request_index: " << request_index << "\n";
-  std::cout << "[Traverse Beam Tree] max_depth: "
-            << old_bc.beamRequestsInfo[request_index].max_depth << "\n";
-  std::cout << "[Traverse Beam Tree] current_depth: "
-            << old_bc.beamRequestsInfo[request_index].current_depth << "\n";
-  std::cout << "[Traverse Beam Tree] beam_width: "
-            << old_bc.beamRequestsInfo[request_index].beam_size << "\n";
+  if (verbose) {
+    std::cout << "[Traverse Beam Tree] request_index: " << request_index
+              << "\n";
+    std::cout << "[Traverse Beam Tree] max_depth: "
+              << old_bc.beamRequestsInfo[request_index].max_depth << "\n";
+    std::cout << "[Traverse Beam Tree] current_depth: "
+              << old_bc.beamRequestsInfo[request_index].current_depth << "\n";
+    std::cout << "[Traverse Beam Tree] beam_width: "
+              << old_bc.beamRequestsInfo[request_index].beam_size << "\n";
+  }
   BeamTree tree = beam_trees[request_index];
 
   // token, index
@@ -952,18 +1073,23 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
            0,
            old_bc.beamRequestsInfo[request_index].beam_size,
            0,
-           serializedTree);
+           serializedTree,
+           verbose);
 
   // print it
-  std::cout << "Print serialized tree, " << request_index << "\n";
-  std::cout << serializedTree.size() << "\n";
+  if (verbose) {
+    std::cout << "Print serialized tree: size:" << request_index
+              << serializedTree.size() << "\n";
+  }
   for (int k = 0; k < serializedTree.size(); k++) {
     serializedTree.at(k).second += token_start_offset;
-    std::cout << "token id: " << serializedTree.at(k).first
-              << ", depth: " << serializedTree.at(k).second << "\n";
+    if (verbose) {
+      std::cout << "token id: " << serializedTree.at(k).first
+                << ", depth: " << serializedTree.at(k).second << "\n";
+    }
   }
-  std::cout << "Done printing serialized tree, "
-            << old_bc.requestsInfo[request_index].request_guid << "\n";
+  // std::cout << "Done printing serialized tree, "
+  //           << old_bc.requestsInfo[request_index].request_guid << "\n";
 
   if (dfs_tree_inputs.find(old_bc.requestsInfo[request_index].request_guid) !=
       dfs_tree_inputs.end()) {
diff --git a/src/runtime/tree_verify_batch_config.cc b/src/runtime/tree_verify_batch_config.cc
new file mode 100644
index 0000000000..e50a0e06fd
--- /dev/null
+++ b/src/runtime/tree_verify_batch_config.cc
@@ -0,0 +1,33 @@
+/* Copyright 2023 CMU, Stanford, Facebook, LANL
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/batch_config.h"
+#include "legion.h"
+#include <cassert>
+#include <climits>
+
+namespace FlexFlow {
+
+LegionRuntime::Logger::Category log_tree_bc("TreeVerifyBatchConfig");
+
+TreeVerifyBatchConfig::TreeVerifyBatchConfig() : BatchConfig() {}
+
+TreeVerifyBatchConfig::~TreeVerifyBatchConfig() {}
+
+BatchConfig::Mode TreeVerifyBatchConfig::get_mode() const {
+  return TREE_VERIFY_MODE;
+}
+
+}; // namespace FlexFlow
diff --git a/examples/cpp/inference/gpt_tokenizer.cpp b/tests/gpt_tokenizer.cpp
similarity index 97%
rename from examples/cpp/inference/gpt_tokenizer.cpp
rename to tests/gpt_tokenizer.cpp
index 8712f0e6b6..8ddfa75e1c 100644
--- a/examples/cpp/inference/gpt_tokenizer.cpp
+++ b/tests/gpt_tokenizer.cpp
@@ -49,8 +49,8 @@ int main(int argc, char *argv[]) {
     lines.push_back(line);
   }
 
-  std::vector<int64_t> input_ids;
-  std::vector<int64_t> mask_ids;
+  std::vector<int32_t> input_ids;
+  std::vector<int32_t> mask_ids;
   for (auto l = lines.begin(); l != lines.end(); ++l) {
     std::string stripped_line = tokenizer.strip(*l);
     if (stripped_line.length() == 0) {
diff --git a/examples/cpp/inference/gpt_tokenizer_test.sh b/tests/gpt_tokenizer_test.sh
similarity index 96%
rename from examples/cpp/inference/gpt_tokenizer_test.sh
rename to tests/gpt_tokenizer_test.sh
index b336dd05ff..6134d4e592 100755
--- a/examples/cpp/inference/gpt_tokenizer_test.sh
+++ b/tests/gpt_tokenizer_test.sh
@@ -13,7 +13,7 @@ cd "${BASH_SOURCE[0]%/*}"
 cleanup
 
 # Compile the FlexFlow C++ tokenizer stand-alone
-g++ -std=c++11 -I../../../deps/json/include -o gpt_tokenizer gpt_tokenizer.cpp gpt_tokenizer.cc
+g++ -std=c++11 -I../deps/json/include -I../include -o gpt_tokenizer gpt_tokenizer.cpp ../src/runtime/gpt_tokenizer.cc
 chmod +x gpt_tokenizer
 
 # Download and inflate wikitext dataset

From 16a5d025e5e895a5cad8e81de83c03f8595f6db5 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Mon, 15 May 2023 21:07:17 -0700
Subject: [PATCH 129/344] Update README.md

---
 .github/README.md | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/.github/README.md b/.github/README.md
index fdc52c53c4..bf734d8001 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -1,4 +1,4 @@
-# SpecInfer
+# SpecInfer: Accelerating Generative LLM Serving with Speculative Inference and Token Tree Verification
 ![build](https://github.com/flexflow/flexflow/workflows/build/badge.svg?branch=master) ![gpu tests](https://github.com/flexflow/flexflow/workflows/gpu-ci/badge.svg?branch=master) ![multinode gpu tests](https://github.com/flexflow/flexflow/workflows/multinode-test/badge.svg?branch=master) ![docker](https://github.com/flexflow/flexflow/workflows/docker-build/badge.svg?branch=master) ![pip](https://github.com/flexflow/flexflow/workflows/pip-install/badge.svg?branch=master) ![shell-check](https://github.com/flexflow/flexflow/workflows/Shell%20Check/badge.svg?branch=master) ![clang-format](https://github.com/flexflow/flexflow/workflows/clang-format%20Check/badge.svg?branch=master) [![Documentation Status](https://readthedocs.org/projects/flexflow/badge/?version=latest)](https://flexflow.readthedocs.io/en/latest/?badge=latest)
 
 <p align="center">

From b9fd233cecb4af6e3b128e04ab9d7bce5357a6c6 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Tue, 16 May 2023 14:53:43 -0500
Subject: [PATCH 130/344] Uses data and pipeline parallel by default. (#729)

* Support multiple FFModels in a single top_level_task

* [TreeVerifyMHA] bug fixes

* bug fixes

* TreeIncMHA and SpecIncMHA bug fixes

* fomat.

* .

* add sentence piece tokenizer

* format

* prepare spec_infer demo

* prettier prints

* make the llama model work

* add small model config

* enable speculative inference for spec_infer

* fix

* rename

* fix one of the bugs

* fix

* del

* attempt to fix ci

* integrated gpt/opt tokenizer

* integrate opt tokenizer with pipeline

* .

* format

* move files

* Update README.md

* add an overview figure

* update images

* Update README.md

* Update README.md

* Update README.md

* Update README.md

* Update README.md

* add tokenizer in readme

* fix

* fix

* fix

* Update README.md

* Update README.md

* add gif

* add weights to readme, clean some print

* Update README.md

* update demo

* Update README.md

* Update README.md

* remove outdate file

* Update README.md

* Update README.md

* .

* use data parallel by default

---------

Co-authored-by: xinhaoc <chengxh_98@163.com>
Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
Co-authored-by: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
---
 src/runtime/model.cc | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index d7c18ebf94..b27d2f3421 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -3644,7 +3644,7 @@ struct DefaultConfig {
       (size_t)2 * 1024 * 1024 * 1024; // 2GB
   constexpr static float searchAlpha = 1.2f;
   const static bool searchOverlapBackwardUpdate = false;
-  const static bool onlyDataParallel = false;
+  const static bool onlyDataParallel = true;
   const static bool enableSampleParallel = true;
   const static bool enableParameterParallel = false;
   const static bool enableAttributeParallel = false;

From b8e5586ca72ad523c6dd8872eda5d1416244ae9a Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Tue, 16 May 2023 12:54:48 -0700
Subject: [PATCH 131/344] Update README.md

---
 .github/README.md | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/.github/README.md b/.github/README.md
index bf734d8001..dc23d2e989 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -92,7 +92,7 @@ SpecInfer is under active development. We currently focus on the following tasks
 ## Acknowledgements
 This project is initiated by members from CMU, Stanford, and UCSD. We will be continuing developing and supporting SpecInfer and the underlying FlexFlow runtime system. The following paper describes design, implementation, and key optimizations of SpecInfer.
 
-* Xupeng Miao*, Gabriele Oliaro*, Zhihao Zhang*, Xinhao Cheng, Zeyu Wang, Rae Ying Yee Wong, Zhuoming Chen, Daiyaan Arfeen, Reyna Abhyankar, and Zhihao Jia. [SpecInfer: Accelerating Generative LLM Serving with Speculative Inference and Token Tree Verification]().
+* Xupeng Miao*, Gabriele Oliaro*, Zhihao Zhang*, Xinhao Cheng, Zeyu Wang, Rae Ying Yee Wong, Zhuoming Chen, Daiyaan Arfeen, Reyna Abhyankar, and Zhihao Jia. [SpecInfer: Accelerating Generative LLM Serving with Speculative Inference and Token Tree Verification](https://www.cs.cmu.edu/~zhihaoj2/papers/specinfer.pdf).
 
 ## License
 Both SpecInfer and FlexFlow use Apache License 2.0.

From 0aabf34f2492a3665ee7df815ecf3d2778bfca94 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 18 May 2023 15:34:30 +0800
Subject: [PATCH 132/344] fix make build, edit cmake

---
 CMakeLists.txt | 9 ---------
 FlexFlow.mk    | 2 +-
 2 files changed, 1 insertion(+), 10 deletions(-)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index f9e78aff12..e758eb577f 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -186,19 +186,10 @@ set(NVCC_FLAGS $ENV{NVCC_FLAGS})
 set(LD_FLAGS $ENV{LD_FLAGS})
 
 # Set global FLAGS
-if(INFERENCE_TESTS)
 list(APPEND CC_FLAGS
   -std=c++17)
-
 list(APPEND NVCC_FLAGS
   -std=c++17)
-else()
-list(APPEND CC_FLAGS
-  -std=c++17)
-
-list(APPEND NVCC_FLAGS
-  -std=c++17)
-endif()
 
 add_compile_options(${CC_FLAGS})
 set(CUDA_NVCC_FLAGS ${CUDA_NVCC_FLAGS} ${NVCC_FLAGS})
diff --git a/FlexFlow.mk b/FlexFlow.mk
index 4d63ec83d4..2f3029b434 100644
--- a/FlexFlow.mk
+++ b/FlexFlow.mk
@@ -87,7 +87,7 @@ ifneq ($(strip $(FF_USE_PYTHON)), 1)
 endif
 
 
-INC_FLAGS	+= -I${FF_HOME}/include -I${FF_HOME}/deps/optional/include -I${FF_HOME}/deps/variant/include -I${FF_HOME}/deps/json/include
+INC_FLAGS	+= -I${FF_HOME}/include -I${FF_HOME}/deps/optional/include -I${FF_HOME}/deps/variant/include -I${FF_HOME}/deps/json/include -I${FF_HOME}/deps/sentencepiece/src
 CC_FLAGS	+= -DMAX_TENSOR_DIM=$(MAX_DIM) -DLEGION_MAX_RETURN_SIZE=32768
 NVCC_FLAGS	+= -DMAX_TENSOR_DIM=$(MAX_DIM) -DLEGION_MAX_RETURN_SIZE=32768
 HIPCC_FLAGS     += -DMAX_TENSOR_DIM=$(MAX_DIM) -DLEGION_MAX_RETURN_SIZE=32768

From 427d6027d2bb0df199a3d9704f1d633ec2c665b0 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 18 May 2023 16:07:59 +0800
Subject: [PATCH 133/344] update std version in makefile

---
 FlexFlow.mk | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/FlexFlow.mk b/FlexFlow.mk
index 2f3029b434..27a0062d8c 100644
--- a/FlexFlow.mk
+++ b/FlexFlow.mk
@@ -93,9 +93,9 @@ NVCC_FLAGS	+= -DMAX_TENSOR_DIM=$(MAX_DIM) -DLEGION_MAX_RETURN_SIZE=32768
 HIPCC_FLAGS     += -DMAX_TENSOR_DIM=$(MAX_DIM) -DLEGION_MAX_RETURN_SIZE=32768
 GASNET_FLAGS	+=
 # For Point and Rect typedefs
-CC_FLAGS	+= -std=c++11
-NVCC_FLAGS	+= -std=c++11
-HIPCC_FLAGS     += -std=c++11
+CC_FLAGS	+= -std=c++17
+NVCC_FLAGS	+= -std=c++17
+HIPCC_FLAGS     += -std=c++17
 
 ifeq ($(strip $(FF_USE_NCCL)), 1)
 INC_FLAGS	+= -I$(MPI_HOME)/include -I$(NCCL_HOME)/include

From d87197da69f01709032b4b89a04e8884d9581721 Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Thu, 18 May 2023 17:25:36 -0400
Subject: [PATCH 134/344] file path adapt (#730)

* file path adapt

* fix

* fix

* fix
---
 inference/file_loader.cc | 16 ++++++++++------
 1 file changed, 10 insertions(+), 6 deletions(-)

diff --git a/inference/file_loader.cc b/inference/file_loader.cc
index edd63ba167..e21b39fcaf 100644
--- a/inference/file_loader.cc
+++ b/inference/file_loader.cc
@@ -85,6 +85,7 @@ void load_attention_bias(float *ptr,
   for (auto file : bias_files) {
     size_t partial_size = hidden_dim;
     std::ifstream in(file, std::ios::in | std::ios::binary);
+    assert(in.good() && "incorrect bias file path");
     std::vector<float> host_array(partial_size);
     size_t loaded_data_size = sizeof(float) * partial_size;
     in.seekg(0, in.end);
@@ -147,6 +148,7 @@ void load_attention_weights(float *ptr,
     size_t partial_size = one_weight_file_size;
 
     std::ifstream in(file, std::ios::in | std::ios::binary);
+    assert(in.good() && "incorrect weight file path");
     std::vector<float> host_array(partial_size);
     size_t loaded_data_size = sizeof(float) * partial_size;
     in.seekg(0, in.end);
@@ -178,6 +180,7 @@ void load_attention_weights(float *ptr,
 
 void load_from_file(float *ptr, size_t size, std::string filename) {
   std::ifstream in(filename, std::ios::in | std::ios::binary);
+  assert(in.good() && "incorrect weight file path");
   std::vector<float> host_array(size);
   size_t loaded_data_size = sizeof(float) * size;
   in.seekg(0, in.end);
@@ -247,13 +250,15 @@ void FileDataLoader::load_weights(
       assert(weight->data_type == DT_FLOAT);
       float *data = (float *)malloc(sizeof(float) * volume);
 
-      if (v.first.find("attention_w") != std::string::npos) {
+      std::string file_path = (v.first.back() == '/') ? v.first : "/" + v.first;
+
+      if (file_path.find("attention_w") != std::string::npos) {
         if (i == 0) {
           load_attention_weights(data,
                                  num_heads,
                                  hidden_dim,
                                  qkv_inner_dim,
-                                 v.first,
+                                 file_path,
                                  weight_file_path,
                                  volume);
         } else {
@@ -261,16 +266,15 @@ void FileDataLoader::load_weights(
                               num_heads,
                               hidden_dim,
                               qkv_inner_dim,
-                              v.first,
+                              file_path,
                               weight_file_path);
         }
 
       } else {
-        std::string file_path = v.first;
         if (i > 0) {
-          int index = v.first.find("_weight");
+          int index = file_path.find("_weight");
           assert(index != std::string::npos);
-          file_path = v.first.substr(0, index) + "_bias";
+          file_path = file_path.substr(0, index) + "_bias";
         }
         load_from_file(data, volume, weight_file_path + file_path);
       }

From b9fddec41e64de20c97d8eb05524a807d7a34697 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 19 May 2023 13:35:35 +0800
Subject: [PATCH 135/344] Update README.md

---
 .github/README.md | 8 ++++----
 1 file changed, 4 insertions(+), 4 deletions(-)

diff --git a/.github/README.md b/.github/README.md
index dc23d2e989..a2bb32da69 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -64,10 +64,10 @@ The weight files using in our demo is extracted from HuggingFace, and stored in
 
 |  Model   | Model id on Hugging Face  | Storage Location |
 |  :----  | :----  | :----  |
-| LLaMA-7B | decapoda-research/llama-7b-hf | s3://catalyst-llama/Flexflow_LLM_weights/LLAMA/llama_7B_weights.tar.gz |
-| LLaMA-190M  | Bingsu/llama-190m-arch | s3://catalyst-llama/Flexflow_LLM_weights/LLAMA/llama_190m_weights.tar.gz |
-| OPT-6.7B  | facebook/opt-6.7b | s3://catalyst-llama/Flexflow_LLM_weights/OPT/opt_6B_weights.tar.gz |
-| OPT-125M  | facebook/opt-125m | s3://catalyst-llama/Flexflow_LLM_weights/OPT/opt_125m_native.tar.gz |
+| LLaMA-7B | decapoda-research/llama-7b-hf | s3://specinfer/weights/llama_7B_weights.tar.gz |
+| LLaMA-190M  | Bingsu/llama-190m-arch | s3://specinfer/weights/llama_190m_weights.tar.gz |
+| OPT-6.7B  | facebook/opt-6.7b | s3://specinfer/weights/opt_6B_weights.tar.gz |
+| OPT-125M  | facebook/opt-125m | s3://specinfer/weights/opt_125m_native.tar.gz |
 
 You can use [this script](../inference/spec_infer/MODEL_WEIGHTS.md) to convert the weights of a HuggingFace LLM to the SpecInfer weight format.
 

From dc6dcf878836749fb8db179df9bc542aa05643e2 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 19 May 2023 13:41:09 +0800
Subject: [PATCH 136/344] Update README.md

---
 .github/README.md | 15 ++++++++++++++-
 1 file changed, 14 insertions(+), 1 deletion(-)

diff --git a/.github/README.md b/.github/README.md
index a2bb32da69..69731f40d1 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -92,7 +92,20 @@ SpecInfer is under active development. We currently focus on the following tasks
 ## Acknowledgements
 This project is initiated by members from CMU, Stanford, and UCSD. We will be continuing developing and supporting SpecInfer and the underlying FlexFlow runtime system. The following paper describes design, implementation, and key optimizations of SpecInfer.
 
-* Xupeng Miao*, Gabriele Oliaro*, Zhihao Zhang*, Xinhao Cheng, Zeyu Wang, Rae Ying Yee Wong, Zhuoming Chen, Daiyaan Arfeen, Reyna Abhyankar, and Zhihao Jia. [SpecInfer: Accelerating Generative LLM Serving with Speculative Inference and Token Tree Verification](https://www.cs.cmu.edu/~zhihaoj2/papers/specinfer.pdf).
+* Xupeng Miao*, Gabriele Oliaro*, Zhihao Zhang*, Xinhao Cheng, Zeyu Wang, Rae Ying Yee Wong, Zhuoming Chen, Daiyaan Arfeen, Reyna Abhyankar, and Zhihao Jia. [SpecInfer: Accelerating Generative LLM Serving with Speculative Inference and Token Tree Verification](https://arxiv.org/abs/2305.09781).
+
+Please cite as:
+
+``` bibtex
+@misc{miao2023specinfer,
+      title={SpecInfer: Accelerating Generative LLM Serving with Speculative Inference and Token Tree Verification}, 
+      author={Xupeng Miao and Gabriele Oliaro and Zhihao Zhang and Xinhao Cheng and Zeyu Wang and Rae Ying Yee Wong and Zhuoming Chen and Daiyaan Arfeen and Reyna Abhyankar and Zhihao Jia},
+      year={2023},
+      eprint={2305.09781},
+      archivePrefix={arXiv},
+      primaryClass={cs.CL}
+}
+```
 
 ## License
 Both SpecInfer and FlexFlow use Apache License 2.0.

From 1193b51a367c6c5fa744b7210279e08ac366b3fa Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 19 May 2023 15:53:58 +0800
Subject: [PATCH 137/344] Update README.md

---
 .github/README.md | 3 +++
 1 file changed, 3 insertions(+)

diff --git a/.github/README.md b/.github/README.md
index 69731f40d1..7a7ae6a3e2 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -94,6 +94,9 @@ This project is initiated by members from CMU, Stanford, and UCSD. We will be co
 
 * Xupeng Miao*, Gabriele Oliaro*, Zhihao Zhang*, Xinhao Cheng, Zeyu Wang, Rae Ying Yee Wong, Zhuoming Chen, Daiyaan Arfeen, Reyna Abhyankar, and Zhihao Jia. [SpecInfer: Accelerating Generative LLM Serving with Speculative Inference and Token Tree Verification](https://arxiv.org/abs/2305.09781).
 
+\* Denotes equal contribution
+
+### Citation
 Please cite as:
 
 ``` bibtex

From 155989a2cd3e655756c009c9791e0a6ee4eb02b8 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sat, 20 May 2023 23:49:26 +0800
Subject: [PATCH 138/344] [Inference][CI] - Fix GPU-CI and `hip_rocm`build
 tests (#731)

* fix hip_rocm build with sentencepiece

* shellcheck 1

* shellcheck 2

* shellecheck 3

* fix install script

* .github/workflows/helpers/install_dependencies.sh

* fix

* shellcheck

* restore unnecessary changes

* fix build

* removed outdated test from c++ tests

* update link in readme
---
 .github/README.md                                 |  2 +-
 .github/workflows/build.yml                       |  4 ++++
 .github/workflows/gpu-ci.yml                      |  2 +-
 .github/workflows/helpers/install_dependencies.sh | 15 +++++++++++++++
 CMakeLists.txt                                    |  3 +++
 .../flexflow/ops/inc_multihead_self_attention.h   |  2 ++
 .../ops/spec_inc_multihead_self_attention.h       |  2 ++
 .../ops/tree_inc_multihead_self_attention.h       |  2 ++
 tests/cpp_gpu_tests.sh                            |  8 ++++----
 9 files changed, 34 insertions(+), 6 deletions(-)

diff --git a/.github/README.md b/.github/README.md
index 7a7ae6a3e2..28b2ef789c 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -56,7 +56,7 @@ For example, you can use the following command line to serve a LLaMA-6B or LLaMA
 ### Tokenizers
 SpecInfer supports two tokenizers:
 
-* The SentencePiece tokenizer is used to support the LLaMA model family (e.g., LLaMA-6B, LLaMA-13B, and LLaMA-190M in our demo). We used the pretrained sentence piece tokenizer from Hugging Face (model id: [decapoda-research/llama-7b-hf](https://huggingface.co/decapoda-research/llama-7b-hf/blob/main/tokenizer.model)).
+* The SentencePiece tokenizer is used to support the LLaMA model family (e.g., LLaMA-6B, LLaMA-13B, and LLaMA-190M in our demo). We used the pretrained sentencepiece tokenizer from LLAMA, which is also available on Hugging Face (model id: `decapoda-research/llama-7b-hf`). We store the tokenizer on our S3 bucket at this link: [s3://specinfer/tokenizer/tokenizer.model](https://specinfer.s3.us-east-2.amazonaws.com/tokenizer/tokenizer.model).
 * The GPT2 tokenizer is used to support the Open Pre-trained Transformer model family (e.g., OPT-13B and OPT-125M). To use it, download the [vocab](https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-vocab.json) and [merges](https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-merges.txt) files and pass the folder containing them as a parameter. 
 
 ### LLM Weights
diff --git a/.github/workflows/build.yml b/.github/workflows/build.yml
index 9abd9c9a78..5d83aaedf4 100644
--- a/.github/workflows/build.yml
+++ b/.github/workflows/build.yml
@@ -99,6 +99,10 @@ jobs:
             export FF_BUILD_ALL_EXAMPLES=ON
             export FF_BUILD_ALL_INFERENCE_EXAMPLES=ON
             export FF_BUILD_UNIT_TESTS=ON
+          else 
+            export FF_BUILD_ALL_EXAMPLES=OFF
+            export FF_BUILD_ALL_INFERENCE_EXAMPLES=OFF
+            export FF_BUILD_UNIT_TESTS=OFF
           fi
           ../config/config.linux
           sudo make install
diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index 801924bd0d..135b569055 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -163,7 +163,7 @@ jobs:
           # C++ tests
           ./tests/cpp_gpu_tests.sh 4
           # GPT tokenizer test
-          ./examples/cpp/inference/gpt_tokenizer_test.sh
+          ./tests/gpt_tokenizer_test.sh
           # Python tests
           ./tests/multi_gpu_tests.sh 4
 
diff --git a/.github/workflows/helpers/install_dependencies.sh b/.github/workflows/helpers/install_dependencies.sh
index 5ab211c962..cf37f3b820 100755
--- a/.github/workflows/helpers/install_dependencies.sh
+++ b/.github/workflows/helpers/install_dependencies.sh
@@ -25,6 +25,21 @@ elif [[ "$FF_GPU_BACKEND" == "hip_cuda" || "$FF_GPU_BACKEND" = "hip_rocm" ]]; th
     rm ./amdgpu-install_22.20.50205-1_all.deb
     sudo amdgpu-install -y --usecase=hip,rocm --no-dkms
     sudo apt-get install -y hip-dev hipblas miopen-hip rocm-hip-sdk
+
+    # Install protobuf v3.20.x manually
+    sudo apt-get update -y && sudo apt-get install -y pkg-config zip g++ zlib1g-dev unzip python autoconf automake libtool curl make
+    git clone -b 3.20.x https://github.com/protocolbuffers/protobuf.git
+    cd protobuf/
+    git submodule update --init --recursive
+    ./autogen.sh
+    ./configure
+    cores_available=$(nproc --all)
+    n_build_cores=$(( cores_available -1 ))
+    if (( n_build_cores < 1 )) ; then n_build_cores=1 ; fi
+    make -j $n_build_cores
+    sudo make install
+    sudo ldconfig
+    cd ..
 else
     echo "FF_GPU_BACKEND: ${FF_GPU_BACKEND}. Skipping installing HIP dependencies"
 fi
diff --git a/CMakeLists.txt b/CMakeLists.txt
index e758eb577f..274955e628 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -475,6 +475,9 @@ if(FF_BUILD_VISUALIZATION_TOOL)
 endif()
 
 if(FF_BUILD_SENTENCEPIECE OR FF_BUILD_ALL_INFERENCE_EXAMPLES)
+  if (FF_GPU_BACKEND STREQUAL "hip_rocm")
+    SET(SPM_USE_BUILTIN_PROTOBUF OFF CACHE BOOL "Use builtin version of protobuf to compile SentencePiece")
+  endif()
   add_subdirectory(deps/sentencepiece sentencepiece EXCLUDE_FROM_ALL)
   target_include_directories(flexflow PUBLIC deps/sentencepiece/src)
   target_link_libraries(flexflow sentencepiece)
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index 4721086ec0..6b29feac67 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -144,7 +144,9 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
   float *qk_prods, *qk_prods_softmax;
   float *attn_heads, *W_out_contiguous;
   BatchConfig::PerTokenInfo *token_infos;
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
   cuFloatComplex *complex_input;
+#endif
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention.h b/include/flexflow/ops/spec_inc_multihead_self_attention.h
index 30e122278a..da2825c9d2 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention.h
@@ -152,7 +152,9 @@ class SpecIncMultiHeadSelfAttentionMeta : public OpMeta {
   float *devQKVProjArray, *keyCache, *valueCache;
   float *qk_prods, *qk_prods_softmax;
   float *attn_heads, *W_out_contiguous;
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
   cuFloatComplex *complex_input;
+#endif
   // void *reserveSpace;
 
   // BatchConfig::token_idxs *dev_token2ids;
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention.h b/include/flexflow/ops/tree_inc_multihead_self_attention.h
index fce4998e5d..b1b265e6d6 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention.h
@@ -144,7 +144,9 @@ class TreeIncMultiHeadSelfAttentionMeta : public OpMeta {
   float *devQKVProjArray, *keyCache, *valueCache;
   float *qk_prods, *qk_prods_softmax;
   float *attn_heads, *W_out_contiguous;
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
   cuFloatComplex *complex_input;
+#endif
 
   TreeVerifyBatchConfig::PerTokenInfo *token_infos;
   TreeVerifyBatchConfig::CommittedTokensInfo *committed_token_infos;
diff --git a/tests/cpp_gpu_tests.sh b/tests/cpp_gpu_tests.sh
index b285c2ad8e..760237cf3e 100755
--- a/tests/cpp_gpu_tests.sh
+++ b/tests/cpp_gpu_tests.sh
@@ -50,8 +50,8 @@ if [[ -f "$FF_HOME/build/examples/cpp/AlexNet/alexnet" ]]; then
 	# "$FF_HOME"/build/examples/cpp/split_test/split_test -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
 	# "$FF_HOME"/build/examples/cpp/split_test_2/split_test_2 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
 	# Inference examples
-	if [ $(( GPU_AVAILABLE )) -lt $(( 4 )) ]; then echo "Skipping LLAMA test because it requires 4 GPUs, but only $GPU_AVAILABLE are available. " ; exit 1; fi
-	"$FF_HOME"/build/examples/cpp/inference/LLAMA/LLAMA -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize 30000 --only-data-parallel
+	# if [ $(( GPU_AVAILABLE )) -lt $(( 4 )) ]; then echo "Skipping LLAMA test because it requires 4 GPUs, but only $GPU_AVAILABLE are available. " ; exit 1; fi
+	# "$FF_HOME"/build/examples/cpp/inference/LLAMA/LLAMA -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize 30000 --only-data-parallel
 	#"$FF_HOME"/build/examples/cpp/inference/mixture_of_experts/inference_moe -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
 	#"$FF_HOME"/build/examples/cpp/inference/transformers/inference_transformers -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
 else
@@ -83,8 +83,8 @@ else
 			# split_test -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
 			# split_test_2 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
 			# Inference examples
-			if [ $(( GPU_AVAILABLE )) -lt $(( 4 )) ]; then echo "Skipping LLAMA test because it requires 4 GPUs, but only $GPU_AVAILABLE are available. " ; exit 1; fi
-			LLAMA -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize 30000 --only-data-parallel
+			# if [ $(( GPU_AVAILABLE )) -lt $(( 4 )) ]; then echo "Skipping LLAMA test because it requires 4 GPUs, but only $GPU_AVAILABLE are available. " ; exit 1; fi
+			# LLAMA -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize 30000 --only-data-parallel
 			#inference_moe -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
 			#inference_transformers -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
 		fi

From f0604b30248f1793d1f611c95458228ed5cdb963 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 22 May 2023 06:32:52 +0800
Subject: [PATCH 139/344] [Inference] - Cleanup/refactor (#732)

* implemented file-based configs, remove spec_pipeline folder

* fix

* add inference test, script to downlaod weights

* update readme

* update ci scripts

* newlines

* fix gpu-ci

* fix

* fix

* update test file

* added incr decoding program, moved LLAMA folder from examples

* linting

* add incremental decoding to test

* update readme

* add script to download opt weights

* fix support for opt, move code to root inference folder

* linting

* update test file

* fix

* bug fix

* update test
---
 .github/README.md                             |  21 +-
 .github/workflows/build-skip.yml              |   1 +
 .github/workflows/build.yml                   |   2 +
 .github/workflows/clang-format-check.yml      |   1 +
 .github/workflows/gpu-ci.yml                  |  60 +++-
 .gitignore                                    |   1 +
 CMakeLists.txt                                |  13 +-
 conda/flexflow-cpu.yml                        |   1 +
 examples/cpp/inference/LLAMA/Makefile         |  39 ---
 examples/cpp/inference/LLAMA/dataloader.cc    | 285 ------------------
 examples/cpp/inference/LLAMA/dataloader.cu    | 110 -------
 examples/cpp/inference/LLAMA/llama.cc         | 140 ---------
 .../llama_spec_pipeline/CMakeLists.txt        |  20 --
 .../inference/llama_spec_pipeline/README.md   |  14 -
 .../inference/llama_spec_pipeline/llama.cc    | 256 ----------------
 .../llama_spec_pipeline/llama_rae.cc          | 246 ---------------
 examples/cpp/inference/opt/CMakeLists.txt     |  22 --
 examples/cpp/inference/opt/Makefile           |  38 ---
 examples/cpp/inference/opt/README.md          |  45 ---
 examples/cpp/inference/opt/opt.cc             | 238 ---------------
 examples/cpp/inference/opt/opt.h              |  40 ---
 examples/cpp/inference/opt/opt_baseline.py    |  23 --
 .../opt_spec_pipeline/CMakeLists.txt          |  20 --
 .../cpp/inference/opt_spec_pipeline/Makefile  |  37 ---
 .../opt_spec_pipeline/opt_pipeline.cc         | 203 -------------
 include/{ => flexflow}/gpt_tokenizer.h        |   2 +-
 include/flexflow/tokenizers.h                 |   2 +-
 inference/.gitignore                          |   3 +
 inference/{spec_infer => }/MODEL_WEIGHTS.md   |   3 +-
 inference/file_loader.cc                      |   9 +
 .../incr_decoding}/CMakeLists.txt             |  11 +-
 .../incr_decoding}/Makefile                   |   0
 inference/incr_decoding/incr_decoding.cc      | 187 ++++++++++++
 inference/models/configs/llama_190M.json      |  10 +
 inference/models/configs/llama_7B.json        |  10 +
 inference/models/configs/opt_125M.json        |  15 +
 inference/models/configs/opt_6B.json          |  15 +
 inference/models/llama.cc                     |  37 +--
 inference/models/llama.h                      |  72 ++++-
 inference/models/opt.cc                       |  13 +-
 inference/models/opt.h                        |  70 ++++-
 inference/spec_infer/spec_infer.cc            | 168 +++++++++--
 inference/utils/download_llama_weights.py     |  49 +++
 inference/utils/download_opt_weights.py       |  46 +++
 src/runtime/gpt_tokenizer.cc                  |  11 +-
 tests/.gitignore                              |   0
 tests/gpt_tokenizer.cpp                       |  15 +-
 tests/gpt_tokenizer_test.sh                   |   4 +-
 tests/inference_tests.sh                      |  55 ++++
 49 files changed, 776 insertions(+), 1907 deletions(-)
 delete mode 100644 examples/cpp/inference/LLAMA/Makefile
 delete mode 100644 examples/cpp/inference/LLAMA/dataloader.cc
 delete mode 100644 examples/cpp/inference/LLAMA/dataloader.cu
 delete mode 100644 examples/cpp/inference/LLAMA/llama.cc
 delete mode 100644 examples/cpp/inference/llama_spec_pipeline/CMakeLists.txt
 delete mode 100644 examples/cpp/inference/llama_spec_pipeline/README.md
 delete mode 100644 examples/cpp/inference/llama_spec_pipeline/llama.cc
 delete mode 100644 examples/cpp/inference/llama_spec_pipeline/llama_rae.cc
 delete mode 100644 examples/cpp/inference/opt/CMakeLists.txt
 delete mode 100644 examples/cpp/inference/opt/Makefile
 delete mode 100644 examples/cpp/inference/opt/README.md
 delete mode 100644 examples/cpp/inference/opt/opt.cc
 delete mode 100644 examples/cpp/inference/opt/opt.h
 delete mode 100644 examples/cpp/inference/opt/opt_baseline.py
 delete mode 100644 examples/cpp/inference/opt_spec_pipeline/CMakeLists.txt
 delete mode 100644 examples/cpp/inference/opt_spec_pipeline/Makefile
 delete mode 100644 examples/cpp/inference/opt_spec_pipeline/opt_pipeline.cc
 rename include/{ => flexflow}/gpt_tokenizer.h (99%)
 create mode 100644 inference/.gitignore
 rename inference/{spec_infer => }/MODEL_WEIGHTS.md (89%)
 rename {examples/cpp/inference/LLAMA => inference/incr_decoding}/CMakeLists.txt (76%)
 rename {examples/cpp/inference/llama_spec_pipeline => inference/incr_decoding}/Makefile (100%)
 create mode 100644 inference/incr_decoding/incr_decoding.cc
 create mode 100644 inference/models/configs/llama_190M.json
 create mode 100644 inference/models/configs/llama_7B.json
 create mode 100644 inference/models/configs/opt_125M.json
 create mode 100644 inference/models/configs/opt_6B.json
 create mode 100644 inference/utils/download_llama_weights.py
 create mode 100644 inference/utils/download_opt_weights.py
 create mode 100644 tests/.gitignore
 create mode 100755 tests/inference_tests.sh

diff --git a/.github/README.md b/.github/README.md
index 28b2ef789c..940bff486d 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -28,8 +28,8 @@ for serving generative LLMs while provably preserving model quality.
 <img src="../img/performance.png" alt="Performance comparison" height="320"/>
 </p>
 
-## Install SpecInfer
-SpecInfer is built on top of FlexFlow. You can install SpecInfer by building the inference branch of FlexFlow. Please read the [instructions](INSTALL.md) for installing FlexFlow from source code. If you would like to quickly try SpecInfer, we also provide pre-built Docker packages ([flexflow-cuda](https://github.com/flexflow/FlexFlow/pkgs/container/flexflow-cuda) with a CUDA backend, [flexflow-hip_rocm](https://github.com/flexflow/FlexFlow/pkgs/container/flexflow-hip_rocm) with a HIP-ROCM backend) with all dependencies pre-installed (N.B.: currently, the CUDA pre-built containers are only fully compatible with host machines that have CUDA 11.7 installed), together with [Dockerfiles](./docker) if you wish to build the containers manually. 
+## Build/Install SpecInfer
+SpecInfer is built on top of FlexFlow. You can build/install SpecInfer by building the inference branch of FlexFlow. Please read the [instructions](../INSTALL.md) for building/installing FlexFlow from source code. If you would like to quickly try SpecInfer, we also provide pre-built Docker packages ([flexflow-cuda](https://github.com/flexflow/FlexFlow/pkgs/container/flexflow-cuda) with a CUDA backend, [flexflow-hip_rocm](https://github.com/flexflow/FlexFlow/pkgs/container/flexflow-hip_rocm) with a HIP-ROCM backend) with all dependencies pre-installed (N.B.: currently, the CUDA pre-built containers are only fully compatible with host machines that have CUDA 11.7 installed), together with [Dockerfiles](./docker) if you wish to build the containers manually. 
 
 ## Run SpecInfer
 The source code of the SpecInfer pipeline is available at [this folder](../inference/spec_infer/). The SpecInfer executable will be available at `/build_dir/inference/spec_infer/spec_infer` at compilation. You can use the following command-line arguments to run SpecInfer:
@@ -37,8 +37,12 @@ The source code of the SpecInfer pipeline is available at [this folder](../infer
 * `-ll:gpu`: number of GPU processors to use on each node for serving an LLM (default: 0)
 * `-ll:fsize`: size of device memory on each GPU in MB
 * `-ll:zsize`: size of zero-copy memory (pinned DRAM with direct GPU access) in MB. SpecInfer keeps a replica of the LLM parameters on zero-copy memory, and therefore requires that the zero-copy memory is sufficient for storing the LLM parameters.
+* `-llm-model`: the LLM model type as a case-insensitive string (e.g. "opt" or "llama")
 * `-llm-weight`: path to the folder that stores the LLM weights
-* `-ssm-weight`: path to the folder that stores the small speculative models' weights. You can use multiple `-ssm-weight`s in the command line to launch multiple SSMs.
+* `-llm-config`: path to the json file that stores the LLM model configs
+* `-ssm-model`: the LLM model type as a case-insensitive string (e.g. "opt" or "llama"). You can use multiple `-ssm-model`s in the command line to launch multiple SSMs.
+* `-ssm-weight`: path to the folder that stores the small speculative models' weights. The number of `-ssm-weight`s must match the number of `-ssm-model`s and `-ssm-config`s.
+* `-ssm-config`: path to the json file that stores the SSM model configs. The number of `-ssm-config`s must match the number of `-ssm-model`s and `-ssm-weight`s.
 * `-tokenizer`: path to the tokenizer file (see [Tokenizers](#tokenizers) for preparing a tokenizer for SpecInfer).
 * `-prompt`: (optional) path to the prompt file. SpecInfer expects a json format file for prompts, all of which will be served by SpecInfer. In addition, users can also use the following API for registering requests:
 
@@ -47,10 +51,10 @@ class RequestManager {
   RequestGuid register_new_request(std::string const &prompt, int max_sequence_length);
 }
 ```
-For example, you can use the following command line to serve a LLaMA-6B or LLaMA-13B model on 4 GPUs and use two collectively boost-tuned LLaMA-190M models for speculative inference.
+For example, you can use the following command line to serve a LLaMA-7B or LLaMA-13B model on 4 GPUs and use two collectively boost-tuned LLaMA-190M models for speculative inference.
 
 ```bash
-./inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-weight /path/to/llm/weights -ssm-weight /path/to/ssm1/weights -smm-weight /path/to/ssm2/weights -tokenizer /path/to/tokenizer.model -prompt /path/to/prompt.json
+./inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight /path/to/llm/weights -llm-config /path/to/llm/config.json -ssm-model llama -ssm-weight /path/to/ssm1/weights -ssm-config /path/to/ssm/config.json -ssm-model llama -smm-weight /path/to/ssm2/weights -ssm-config /path/to/ssm2/config.json -tokenizer /path/to/tokenizer.model -prompt /path/to/prompt.json
 ```
 
 ### Tokenizers
@@ -60,7 +64,7 @@ SpecInfer supports two tokenizers:
 * The GPT2 tokenizer is used to support the Open Pre-trained Transformer model family (e.g., OPT-13B and OPT-125M). To use it, download the [vocab](https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-vocab.json) and [merges](https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-merges.txt) files and pass the folder containing them as a parameter. 
 
 ### LLM Weights
-The weight files using in our demo is extracted from HuggingFace, and stored in our AWS S3 bucket.
+The weight files used in our demo are extracted from HuggingFace, and stored in our AWS S3 bucket.
 
 |  Model   | Model id on Hugging Face  | Storage Location |
 |  :----  | :----  | :----  |
@@ -69,11 +73,14 @@ The weight files using in our demo is extracted from HuggingFace, and stored in
 | OPT-6.7B  | facebook/opt-6.7b | s3://specinfer/weights/opt_6B_weights.tar.gz |
 | OPT-125M  | facebook/opt-125m | s3://specinfer/weights/opt_125m_native.tar.gz |
 
-You can use [this script](../inference/spec_infer/MODEL_WEIGHTS.md) to convert the weights of a HuggingFace LLM to the SpecInfer weight format.
+You can use [this script](../inference/utils/download_llama_weights.py) to automatically download and convert the weights of a HuggingFace LLAMA LLM and a LLAMA SSM to the SpecInfer weight format. The script also downloads the LLAMA tokenizer. If you would like to try the OPT model instead, use [this script](../inference/utils/download_opt_weights.py) to download (and convert) the OPT weights and tokenizer.
 
 ### Prompt Datasets
 We have evaluated SpecInfer on the following prompts datasets: [Chatbot instruction prompts](https://specinfer.s3.us-east-2.amazonaws.com/prompts/chatbot.json), [ChatGPT Prompts](https://specinfer.s3.us-east-2.amazonaws.com/prompts/chatgpt.json), [WebQA](https://specinfer.s3.us-east-2.amazonaws.com/prompts/webqa.json), [Alpaca](https://specinfer.s3.us-east-2.amazonaws.com/prompts/alpaca.json), and [PIQA](https://specinfer.s3.us-east-2.amazonaws.com/prompts/piqa.json).
 
+### Script to run the demo
+You can take a look at [this script](../tests/inference_tests.sh), which is run in CI for each new commit, for an example of how to run the demo.
+
 ## Difference between SpecInfer and HuggingFace Assistant Model
 
 There are two major differences between the two systems.
diff --git a/.github/workflows/build-skip.yml b/.github/workflows/build-skip.yml
index a983d6dda4..65e9d04132 100644
--- a/.github/workflows/build-skip.yml
+++ b/.github/workflows/build-skip.yml
@@ -3,6 +3,7 @@ on:
   pull_request:
     paths-ignore:
       - "include/**"
+      - "inference/**"
       - "cmake/**"
       - "config/**"
       - "python/**"
diff --git a/.github/workflows/build.yml b/.github/workflows/build.yml
index 5d83aaedf4..99cb459aae 100644
--- a/.github/workflows/build.yml
+++ b/.github/workflows/build.yml
@@ -3,6 +3,7 @@ on:
   pull_request:
     paths:
       - "include/**"
+      - "inference/**"
       - "cmake/**"
       - "config/**"
       - "python/**"
@@ -14,6 +15,7 @@ on:
       - "master"
     paths:
       - "include/**"
+      - "inference/**"
       - "cmake/**"
       - "config/**"
       - "python/**"
diff --git a/.github/workflows/clang-format-check.yml b/.github/workflows/clang-format-check.yml
index 46c9bf3be2..1601da86b3 100644
--- a/.github/workflows/clang-format-check.yml
+++ b/.github/workflows/clang-format-check.yml
@@ -10,6 +10,7 @@ jobs:
           - check: "src"
             exclude: '\.proto$'
           - check: "include"
+          - check: "inference"
           - check: "nmt"
           - check: "python"
           - check: "scripts"
diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index 135b569055..b24e7236a8 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -7,6 +7,7 @@ on:
       - "python/**"
       - "setup.py"
       - "include/**"
+      - "inference/**"
       - "src/**"
       - ".github/workflows/gpu-ci.yml"
       - "tests/cpp_gpu_tests.sh"
@@ -21,6 +22,7 @@ on:
       - "python/**"
       - "setup.py"
       - "include/**"
+      - "inference/**"
       - "src/**"
       - ".github/workflows/gpu-ci.yml"
       - "tests/cpp_gpu_tests.sh"
@@ -122,10 +124,64 @@ jobs:
           export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$CONDA_PREFIX/lib
           ./tests/align/test_all_operators.sh
 
+  inference-tests:
+    name: Inference Tests
+    runs-on: self-hosted
+    defaults:
+      run:
+        shell: bash -l {0} # required to use an activated conda environment
+    env: 
+      CONDA: "3"    
+    needs: gpu-ci-concierge
+    container:
+      image: ghcr.io/flexflow/flexflow-environment-cuda:latest
+      options: --gpus all --shm-size=8192m
+    steps:
+      - name: Install updated git version
+        run: sudo add-apt-repository ppa:git-core/ppa -y && sudo apt update -y && sudo apt install -y --no-install-recommends git
+
+      - name: Checkout Git Repository
+        uses: actions/checkout@v3
+        with:
+          submodules: recursive
+          
+      - name: Install conda and FlexFlow dependencies
+        uses: conda-incubator/setup-miniconda@v2
+        with:
+          miniconda-version: "latest"
+          activate-environment: flexflow
+          environment-file: conda/flexflow-cpu.yml
+          auto-activate-base: false
+
+      - name: Build FlexFlow
+        run: |
+          export PATH=$CONDA_PREFIX/bin:$PATH
+          export FF_HOME=$(pwd)
+          export FF_USE_PREBUILT_LEGION=OFF #remove this after fixing python path issue in Legion
+          export FF_BUILD_ALL_INFERENCE_EXAMPLES=ON
+          mkdir build
+          cd build
+          ../config/config.linux
+          make -j
+
+      - name: Run inference tests
+        run: |
+          export PATH=$CONDA_PREFIX/bin:$PATH
+          export FF_HOME=$(pwd)
+          export CUDNN_DIR=/usr/local/cuda
+          export CUDA_DIR=/usr/local/cuda
+          export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$CONDA_PREFIX/lib
+          
+          # GPT tokenizer test
+          ./tests/gpt_tokenizer_test.sh
+
+          # Inference tests
+          ./tests/inference_tests.sh
+
   gpu-ci-flexflow:
     name: Single Machine, Multiple GPUs Tests
     runs-on: self-hosted
-    needs: gpu-ci-concierge
+    needs: inference-tests
     container:
       image: ghcr.io/flexflow/flexflow-environment-cuda:latest
       options: --gpus all --shm-size=8192m
@@ -162,8 +218,6 @@ jobs:
           export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/conda/lib
           # C++ tests
           ./tests/cpp_gpu_tests.sh 4
-          # GPT tokenizer test
-          ./tests/gpt_tokenizer_test.sh
           # Python tests
           ./tests/multi_gpu_tests.sh 4
 
diff --git a/.gitignore b/.gitignore
index 2feb324b11..1ba1e26bd9 100644
--- a/.gitignore
+++ b/.gitignore
@@ -181,3 +181,4 @@ train-labels-idx1-ubyte
 
 # Logs
 logs/
+gpt_tokenizer
diff --git a/CMakeLists.txt b/CMakeLists.txt
index 274955e628..5e305b15bb 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -550,21 +550,10 @@ if(FF_BUILD_MOE OR FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
 endif()
 
 if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/inference/LLAMA)
-endif()
-
-if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/inference/opt)
-endif()
-
-if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/inference/llama_spec_pipeline)
   add_subdirectory(inference/spec_infer)
+  add_subdirectory(inference/incr_decoding)
 endif()
 
-if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/inference/opt_spec_pipeline)
-endif()
 
 # installation
 set(INCLUDE_DEST "include")
diff --git a/conda/flexflow-cpu.yml b/conda/flexflow-cpu.yml
index 6bd9d6d663..e8cd4c1114 100644
--- a/conda/flexflow-cpu.yml
+++ b/conda/flexflow-cpu.yml
@@ -17,3 +17,4 @@ dependencies:
     - torch --index-url https://download.pytorch.org/whl/cpu
     - torchaudio --index-url https://download.pytorch.org/whl/cpu
     - torchvision --index-url https://download.pytorch.org/whl/cpu
+    - regex
diff --git a/examples/cpp/inference/LLAMA/Makefile b/examples/cpp/inference/LLAMA/Makefile
deleted file mode 100644
index 4249443f7d..0000000000
--- a/examples/cpp/inference/LLAMA/Makefile
+++ /dev/null
@@ -1,39 +0,0 @@
-# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-#     http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-#
-
-# Flags for directing the runtime makefile what to include
-DEBUG           ?= 0		# Include debugging symbols
-MAX_DIM         ?= 4		# Maximum number of dimensions
-OUTPUT_LEVEL    ?= LEVEL_DEBUG	# Compile time logging level
-USE_CUDA        ?= 1		# Include CUDA support (requires CUDA)
-USE_GASNET      ?= 0		# Include GASNet support (requires GASNet)
-USE_HDF         ?= 1		# Include HDF5 support (requires HDF5)
-ALT_MAPPERS     ?= 0		# Include alternative mappers (not recommended)
-
-# Put the binary file name here
-OUTFILE		?= llama
-# List all the application source files here
-GEN_SRC		= llama.cc dataloader.cc 
-GEN_GPU_SRC	= dataloader.cu 
-ifndef CUDA_HOME
-CUDA_HOME = $(patsubst %/bin/nvcc,%,$(shell which nvcc | head -1))
-endif
-
-
-ifndef FF_HOME
-$(error FF_HOME variable is not defined, aborting build)
-endif
-
-include $(FF_HOME)/FlexFlow.mk
diff --git a/examples/cpp/inference/LLAMA/dataloader.cc b/examples/cpp/inference/LLAMA/dataloader.cc
deleted file mode 100644
index 7f2cfe3577..0000000000
--- a/examples/cpp/inference/LLAMA/dataloader.cc
+++ /dev/null
@@ -1,285 +0,0 @@
-
-#include "llama.h"
-#include <random>
-
-using namespace Legion;
-
-DataLoader::DataLoader(FFModel &ff,
-                       LLAMAConfig const *llamaconfig,
-                       ParallelTensor const &input) {
-  Context ctx = ff.config.lg_ctx;
-  Runtime *runtime = ff.config.lg_hlr;
-  num_samples = llamaconfig->sentence_len;
-
-  {
-    batch_input = input;
-    int num_dims = input->num_dims;
-
-    ParallelDim dims[num_dims];
-    for (int i = 0; i < num_dims; i++) {
-      if (i == 0) {
-        dims[i].size = 1;
-      } else {
-        dims[i].size = input->dims[i].size;
-      }
-
-      dims[i].degree = 1;
-      dims[i].parallel_idx = -1;
-      dims[i].is_replica_dim = input->dims[i].is_replica_dim;
-      // Assume only the first dim can be the replica dim
-      assert(i == num_dims - 1 || (!dims[i].is_replica_dim));
-    }
-    // dims[num_dims - 1].size = num_samples;
-    // full_input =
-    //     ff.create_parallel_tensor_legion_ordering(num_dims, dims, DT_INT64);
-    // assert(full_input != nullptr && "full_input is nullptr");
-    // ff.map_tensor(full_input, NULL /*parallel_op*/);
-  }
-
-  // size_t llamaconfig_size = sizeof(llamaconfig);
-  // std::cout << "llama config dataloader: " << llamaconfig->input_path <<
-  // std::endl;
-
-  // // Load entire dataset
-  // TaskLauncher launcher(CUSTOM_CPU_TASK_ID_1,
-  //                      TaskArgument(llamaconfig, llamaconfig_size));
-  // // regions[1]: full_input
-  // launcher.add_region_requirement(RegionRequirement(full_input->region,
-  //                                                  WRITE_ONLY,
-  //                                                  EXCLUSIVE,
-  //                                                  full_input->region,
-  //                                                  MAP_TO_FB_MEMORY));
-  // launcher.add_field(0, FID_DATA);
-  // runtime->execute_task(ctx, launcher);
-}
-
-void DataLoader::load_entire_dataset(Task const *task,
-                                     std::vector<PhysicalRegion> const &regions,
-                                     Context ctx,
-                                     Runtime *runtime) {
-  assert(regions.size() == 1);
-  assert(task->regions.size() == 1);
-  LLAMAConfig const *llamaconfig = (LLAMAConfig *)task->args;
-
-  AccessorWO<long, 3> const acc_input(regions[0], FID_DATA);
-  Rect<3> rect_input = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  assert(acc_input.accessor.is_dense_arbitrary(rect_input));
-
-  long *input_ptr = acc_input.ptr(rect_input.lo);
-  std::cout << "load entire dataset" << rect_input.volume() << std::endl;
-
-  // load from file
-  load_from_file(input_ptr,
-                 rect_input.volume(),
-                 "/home/ubuntu/FlexFlow/examples/cpp/inference/LLAMA/tokens/"
-                 "llama_demo_tokens");
-}
-
-void DataLoader::next_batch(FFModel &ff,
-                            BatchConfig *bc,
-                            std::map<size_t, long> &batch_predictions) {
-  Context ctx = ff.config.lg_ctx;
-  Runtime *runtime = ff.config.lg_hlr;
-  // Load Input
-  {
-    Domain domain =
-        runtime->get_index_space_domain(ctx, batch_input->parallel_is);
-    ArgumentMap argmap;
-
-    DataLoaderNextBatchInput next_batch_input = {bc, batch_predictions};
-    DataLoaderNextBatchInput const *ptr = &next_batch_input;
-    size_t next_batch_input_sz = sizeof(next_batch_input);
-    assert(ptr->prev_batch_preds.size() == batch_predictions.size());
-
-    std::cout << "next batch internal" << std::endl;
-    IndexLauncher launcher(CUSTOM_GPU_TASK_ID_1,
-                           batch_input->parallel_is,
-                           TaskArgument(ptr, next_batch_input_sz),
-                           argmap,
-                           Predicate::TRUE_PRED,
-                           false /*must*/,
-                           0 /*mapper_id*/,
-                           batch_input->machine_view.hash());
-    launcher.add_region_requirement(RegionRequirement(full_input->region,
-                                                      0 /*projection id*/,
-                                                      READ_ONLY,
-                                                      EXCLUSIVE,
-                                                      full_input->region,
-                                                      MAP_TO_ZC_MEMORY));
-    launcher.add_field(0, FID_DATA);
-    launcher.add_region_requirement(RegionRequirement(batch_input->part,
-                                                      0 /*projection id*/,
-                                                      WRITE_ONLY,
-                                                      EXCLUSIVE,
-                                                      batch_input->region));
-    launcher.add_field(1, FID_DATA);
-
-    runtime->execute_index_space(ctx, launcher);
-  }
-  // progress next_index
-  next_index += ff.config.batchSize;
-  next_token_idx += 1;
-}
-
-void DataLoader::reset() {
-  next_index = 0;
-  next_token_idx = 0;
-  next_batch_index = 0;
-}
-
-template <typename T>
-void DataLoader::load_from_file(T *ptr, size_t size, std::string filename) {
-  std::cout << "load from file: " << filename << std::endl;
-  std::ifstream in(filename, std::ios::in | std::ios::binary);
-  std::vector<T> host_array(size);
-  size_t loaded_data_size = sizeof(T) * size;
-  in.seekg(0, in.end);
-  in.seekg(0, in.beg);
-  in.read((char *)host_array.data(), loaded_data_size);
-
-  size_t in_get_size = in.gcount();
-  // std::cout << "size seee" << std::endl;
-  // std::cout << loaded_data_size << std::endl;
-  // std::cout << in_get_size << std::endl;
-  if (in_get_size != loaded_data_size) {
-    std::cout << "load data error" << std::endl;
-    return;
-  }
-
-  // std::cout << "finish loading input";
-  assert(size == host_array.size());
-
-  // normal
-  long data_index = 0;
-  for (auto v : host_array) {
-    ptr[data_index++] = v;
-  }
-  in.close();
-}
-
-template <typename T>
-void DataLoader::load_attention_weights(T *ptr,
-                                        size_t size,
-                                        int hidden_dim,
-                                        int num_heads,
-                                        std::string layer_name,
-                                        std::string weight_path) {
-
-  std::string q_file = weight_path +
-                       layer_name.substr(0, layer_name.find("attention")) +
-                       "attention_wq_weight";
-  std::string k_file = weight_path +
-                       layer_name.substr(0, layer_name.find("attention")) +
-                       "attention_wk_weight";
-  std::string v_file = weight_path +
-                       layer_name.substr(0, layer_name.find("attention")) +
-                       "attention_wv_weight";
-  std::string o_file = weight_path +
-                       layer_name.substr(0, layer_name.find("attention")) +
-                       "attention_wo_weight";
-  std::vector<std::string> weight_files = {q_file, k_file, v_file, o_file};
-
-  int file_index = 0;
-
-  // q, k, v, o -> 0, 1, 2, 3
-  for (auto file : weight_files) {
-    std::cout << "file name and index: " << file << "->" << file_index << "\n";
-    size_t partial_size = size / 4;
-    std::ifstream in(file, std::ios::in | std::ios::binary);
-    std::vector<T> host_array(partial_size);
-    size_t loaded_data_size = sizeof(T) * partial_size;
-    in.seekg(0, in.end);
-    in.seekg(0, in.beg);
-    in.read((char *)host_array.data(), loaded_data_size);
-    size_t in_get_size = in.gcount();
-
-    if (in_get_size != loaded_data_size) {
-      std::cout << "load data error";
-      return;
-    }
-    assert(partial_size == host_array.size());
-
-    size_t one_head_size = hidden_dim * (hidden_dim / num_heads);
-    size_t data_index = 0;
-
-    for (int i = 0; i < num_heads; i++) {
-      size_t start_index = i * one_head_size * 4 + file_index * one_head_size;
-      for (size_t j = start_index; j < start_index + one_head_size; j++) {
-        ptr[j] = host_array.at(data_index);
-        data_index += 1;
-      }
-    }
-    file_index++;
-
-    in.close();
-  }
-}
-
-void DataLoader::store_outputs(BatchConfig *bc,
-                               InferenceResult const &ir,
-                               std::map<size_t, long> &batch_predictions) {
-
-  std::cout << "store outputs...." << std::endl;
-  batch_predictions.clear();
-
-  // size_t guid = bc->tokensInfo[0].guid;
-  auto guid = bc->requestsInfo[bc->tokensInfo[0].request_index].request_guid;
-
-  int start_idx = bc->tokensInfo[0].abs_depth_in_request;
-
-  // only store the last token of each req
-  for (size_t i = 0; i <= bc->num_active_tokens(); i++) {
-    auto current_guid =
-        bc->requestsInfo[bc->tokensInfo[i].request_index].request_guid;
-    if (i == bc->num_active_tokens() || current_guid != guid) {
-
-      int result_index = bc->tokensInfo[i - 1].abs_depth_in_request - start_idx;
-      batch_predictions[guid] = ir.token_ids[i - 1];
-
-      std::cout << "i: " << i << ", dds-" << guid << ", result index"
-                << result_index << ", result value: " << batch_predictions[guid]
-                << "\n";
-
-      if (i < bc->num_active_tokens()) {
-        guid = bc->requestsInfo[bc->tokensInfo[i].request_index].request_guid;
-        start_idx = bc->tokensInfo[i].abs_depth_in_request;
-      }
-    }
-  }
-
-  assert(batch_predictions.size() == bc->num_active_requests());
-}
-
-template void
-    DataLoader::load_attention_weights<float>(float *ptr,
-                                              size_t size,
-                                              int hidden_dim,
-                                              int num_heads,
-                                              std::string layer_name,
-                                              std::string weight_path);
-template void DataLoader::load_from_file<long>(long *ptr,
-                                               size_t size,
-                                               std::string filename);
-template void DataLoader::load_from_file<float>(float *ptr,
-                                                size_t size,
-                                                std::string filename);
-
-void FlexFlow::register_custom_tasks() {
-  // Load entire dataset
-  {
-    TaskVariantRegistrar registrar(CUSTOM_CPU_TASK_ID_1, "Load Entire Dataset");
-    registrar.add_constraint(ProcessorConstraint(Processor::LOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<DataLoader::load_entire_dataset>(
-        registrar, "Load Entire Dataset Task");
-  }
-  // Load input
-  {
-    TaskVariantRegistrar registrar(CUSTOM_GPU_TASK_ID_1, "Load Inputs");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<DataLoader::load_input>(
-        registrar, "Load Inputs Task");
-  }
-}
diff --git a/examples/cpp/inference/LLAMA/dataloader.cu b/examples/cpp/inference/LLAMA/dataloader.cu
deleted file mode 100644
index e32e3ddc33..0000000000
--- a/examples/cpp/inference/LLAMA/dataloader.cu
+++ /dev/null
@@ -1,110 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "flexflow/utils/cuda_helper.h"
-#include "llama.h"
-
-void DataLoader::load_input(Task const *task,
-                            std::vector<PhysicalRegion> const &regions,
-                            Context ctx,
-                            Runtime *runtime) {
-
-  LLAMAConfig llamaconfig;
-  assert(regions.size() == 2);
-  assert(task->regions.size() == 2);
-
-  DataLoaderNextBatchInput const input_struct =
-      *((DataLoaderNextBatchInput *)task->args);
-  BatchConfig *bc = input_struct.bc;
-
-  std::map<size_t, long> const &prev_batch_preds =
-      input_struct.prev_batch_preds;
-
-  TensorAccessorR<long, 3> full_input(
-      regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  TensorAccessorW<long, 3> batch_input(regions[1],
-                                       task->regions[1],
-                                       FID_DATA,
-                                       ctx,
-                                       runtime,
-                                       false /*readOutput*/);
-  Domain full_input_domain = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  Domain batch_input_domain = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-
-  coord_t sequence_length =
-      batch_input_domain.hi()[0] - batch_input_domain.lo()[0] + 1;
-  coord_t batch_size =
-      batch_input_domain.hi()[1] - batch_input_domain.lo()[1] + 1;
-
-  auto guid = bc->requestsInfo[bc->tokensInfo[0].request_index].request_guid;
-  int start_idx = bc->tokensInfo[0].abs_depth_in_request;
-  int dst_idx = 0;
-
-  for (int i = 0; i <= bc->num_active_tokens(); i++) {
-    auto current_guid =
-        bc->requestsInfo[bc->tokensInfo[i].request_index].request_guid;
-    if (i == bc->num_active_tokens() || current_guid != guid) {
-      int tokens_to_copy =
-          (bc->tokensInfo[i - 1].abs_depth_in_request - start_idx + 1);
-
-      int request_index = bc->tokensInfo[i - 1].request_index;
-      int token_start_offset =
-          bc->requestsInfo[request_index].token_start_offset;
-
-      std::cout << "size to copy:  " << tokens_to_copy
-                << ", start offset: " << token_start_offset << "\n";
-      if (tokens_to_copy > 1 || token_start_offset == 0) {
-        // token pos < init length, the init length is the input sentence length
-        // so this is the initial input, load from file.
-        int copy_start_index = guid * llamaconfig.sentence_len;
-        std::cout << "copy index:  " << copy_start_index << "\n";
-        copy_kernel<<<GET_BLOCKS(tokens_to_copy), CUDA_NUM_THREADS>>>(
-            batch_input.ptr + dst_idx,
-            full_input.ptr + copy_start_index,
-            tokens_to_copy);
-        std::cout << "------------req---------------: " << guid << "\n";
-        for (int i = 0; i < 8; i++) {
-          std::cout << "value: " << full_input.ptr[copy_start_index + i]
-                    << std::endl;
-        }
-        std::cout << "dst index: " << dst_idx << "\n";
-
-      } else {
-        // for token by token generating, get token from the previous inference.
-
-        long token = prev_batch_preds.at(guid);
-
-        std::cout << "next iter  " << bc->tokensInfo[i - 1].abs_depth_in_request
-                  << ", dst_idx: " << dst_idx << ", token:" << token << "\n";
-        long *dst_ptr = batch_input.ptr + dst_idx;
-
-        cudaMemcpy(dst_ptr,
-                   &token,
-                   sizeof(FlexFlow::RequestManager::TokenId),
-                   cudaMemcpyHostToDevice);
-      }
-
-      if (i < bc->num_active_tokens()) {
-        guid = bc->requestsInfo[bc->tokensInfo[i].request_index].request_guid;
-        start_idx = bc->tokensInfo[i].abs_depth_in_request;
-      }
-      dst_idx = i;
-    }
-  }
-
-  std::cout << "load input finished....." << std::endl;
-}
diff --git a/examples/cpp/inference/LLAMA/llama.cc b/examples/cpp/inference/LLAMA/llama.cc
deleted file mode 100644
index 8d25eb3a3a..0000000000
--- a/examples/cpp/inference/LLAMA/llama.cc
+++ /dev/null
@@ -1,140 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "models/llama.h"
-#include "flexflow/inference.h"
-#include "flexflow/tokenizers.h"
-#include <nlohmann/json.hpp>
-
-using namespace Legion;
-
-LegionRuntime::Logger::Category log_app("llama");
-
-struct FilePaths {
-  std::string weight1_file_path;
-  std::string weight2_file_path;
-  std::string weight3_file_path;
-  std::string weight4_file_path;
-  std::string prompt_file_path;
-  std::string tokenizer_file_path;
-};
-
-void parse_input_args(char **argv, int argc, FilePaths &paths) {
-  for (int i = 1; i < argc; i++) {
-    // weights
-    if (!strcmp(argv[i], "--weight1")) {
-      paths.weight1_file_path = std::string(argv[++i]);
-      continue;
-    }
-    // weights
-    if (!strcmp(argv[i], "--weight2")) {
-      paths.weight2_file_path = std::string(argv[++i]);
-      continue;
-    }
-    // weights
-    if (!strcmp(argv[i], "--weight3")) {
-      paths.weight3_file_path = std::string(argv[++i]);
-      continue;
-    }
-    // weights
-    if (!strcmp(argv[i], "--weight4")) {
-      paths.weight4_file_path = std::string(argv[++i]);
-      continue;
-    }
-    // prompts
-    if (!strcmp(argv[i], "--prompt")) {
-      paths.prompt_file_path = std::string(argv[++i]);
-      continue;
-    }
-    // tokenizer
-    if (!strcmp(argv[i], "--tokenizer")) {
-      paths.tokenizer_file_path = std::string(argv[++i]);
-      continue;
-    }
-  }
-}
-
-void FlexFlow::top_level_task(Task const *task,
-                              std::vector<PhysicalRegion> const &regions,
-                              Context ctx,
-                              Runtime *runtime) {
-  FFConfig ffconfig;
-  FilePaths file_paths;
-  FFModel ff(ffconfig);
-
-  InputArgs const &command_args = HighLevelRuntime::get_input_args();
-  char **argv = command_args.argv;
-  int argc = command_args.argc;
-  parse_input_args(argv, argc, file_paths);
-  SentencePieceTokenizer tokenizer(file_paths.tokenizer_file_path);
-  InferenceManager im(ffconfig, BatchConfig::MAX_NUM_TOKENS, 1);
-  RequestManager rm(&tokenizer);
-  std::string text2 = "I believe the meaning of life is";
-  std::string text3 = "Talk to me as if you are python programming language "
-                      "and want to sell me yourself";
-  std::string text4 = "Write podcast about importance to include ChatGPT into "
-                      "the evening routine.";
-  int total_num_requests = 0;
-  {
-    using json = nlohmann::json;
-    std::ifstream file_handle(file_paths.prompt_file_path);
-    assert(file_handle.good() && "Prompt file does not exist.");
-    json prompt_json = json::parse(file_handle,
-                                   /*parser_callback_t */ nullptr,
-                                   /*allow_exceptions */ true,
-                                   /*ignore_comments */ true);
-    for (auto &prompt : prompt_json) {
-      std::string text = prompt.get<std::string>();
-      printf("Prompt[%d]: %s\n", total_num_requests, text.c_str());
-      total_num_requests++;
-      rm.register_new_request(text, 128 /*max_sequence_length*/);
-      if (total_num_requests == 10) {
-        break;
-      }
-    }
-  }
-
-  FFModel model(ffconfig);
-  LLAMA::create_llama_model(model,
-                            im,
-                            "7b",
-                            file_paths.weight1_file_path,
-                            ffconfig.workersPerNode * ffconfig.numNodes,
-                            INC_DECODING_MODE);
-
-  BatchConfig bc;
-  InferenceResult ir;
-  while (rm.get_num_processed_requests() < total_num_requests) {
-    bc = rm.prepare_next_batch(bc, ir);
-    if (rm.get_num_processed_requests() >= total_num_requests) {
-      break;
-    }
-    FutureMap fm = im.inference(&model, 0, bc);
-    assert(fm.get_future_map_domain().get_volume() == 1);
-    Future future = fm.get_future(0);
-    ir = future.get_result<InferenceResult>();
-  }
-
-  // Execution fence
-  {
-    Future future = runtime->issue_execution_fence(ctx);
-    future.get_void_result();
-  }
-
-  // float* data
-  std::cout << "----------inference finished--------------" << std::endl;
-}
-
-void FlexFlow::register_custom_tasks() {}
diff --git a/examples/cpp/inference/llama_spec_pipeline/CMakeLists.txt b/examples/cpp/inference/llama_spec_pipeline/CMakeLists.txt
deleted file mode 100644
index 4c8b147e10..0000000000
--- a/examples/cpp/inference/llama_spec_pipeline/CMakeLists.txt
+++ /dev/null
@@ -1,20 +0,0 @@
-cmake_minimum_required(VERSION 3.10)
-
-project(FlexFlowExample_llama_pipeline)
-set(project_target llama_pipeline)
-
-
-set(CPU_SRC
-  ${FLEXFLOW_CPP_DRV_SRC}
-  llama.cc
-  ${CMAKE_SOURCE_DIR}/inference/file_loader.cc
-  ${CMAKE_SOURCE_DIR}/inference/models/llama.cc)
-
-
-cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
-target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
-target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/inference)
-target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
-
-set(BIN_DEST "bin")
-install(TARGETS ${project_target} DESTINATION ${BIN_DEST})
diff --git a/examples/cpp/inference/llama_spec_pipeline/README.md b/examples/cpp/inference/llama_spec_pipeline/README.md
deleted file mode 100644
index 4a112ba45f..0000000000
--- a/examples/cpp/inference/llama_spec_pipeline/README.md
+++ /dev/null
@@ -1,14 +0,0 @@
-# an example of running llama model with beam search
-
-## how to run it?
-1. build the flexflow with FF_BUILD_ALL_INFERENCE_EXAMPLES or FF_BUILD_ALL_EXAMPLES
-2. download the weight and token file from aws s3. 
-```bash
-aws s3 cp s3://catalyst-llama/7B_weights_float.tar.gz FF_HOME/examples/cpp/inference/spec_verify_pipeline/weights
-tar -zxvf 7B_weights_float.tar.gz 
-aws s3 cp s3://catalyst-llama/tokens.tar FF_HOME/examples/cpp/inference/spec_verify_pipeline/tokens
-tar -zxvf tokens.tar
-```
-3. run *spec_verify_pipeline* with `--weights` `--dataset`  `-b 5` `--only-data-parallel`
-4. [expected results](https://github.com/flexflow/FlexFlow/pull/681#issuecomment-1534264054)
-
diff --git a/examples/cpp/inference/llama_spec_pipeline/llama.cc b/examples/cpp/inference/llama_spec_pipeline/llama.cc
deleted file mode 100644
index f149b6c9d6..0000000000
--- a/examples/cpp/inference/llama_spec_pipeline/llama.cc
+++ /dev/null
@@ -1,256 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "models/llama.h"
-#include "flexflow/inference.h"
-#include "flexflow/tokenizers.h"
-
-using namespace Legion;
-
-LegionRuntime::Logger::Category log_app("llama");
-
-void parse_input_args(char **argv, int argc, LLAMA::Config &config) {
-  for (int i = 1; i < argc; i++) {
-    // input
-    if (!strcmp(argv[i], "--dataset")) {
-      config.input_path = std::string(argv[++i]);
-      continue;
-    }
-
-    // weights
-    if (!strcmp(argv[i], "--weights")) {
-      config.weight_file_path = std::string(argv[++i]);
-      continue;
-    }
-
-    // weights
-    if (!strcmp(argv[i], "--tokenizer")) {
-      config.tokenizer_file_path = std::string(argv[++i]);
-      continue;
-    }
-  }
-}
-
-void FlexFlow::top_level_task(Task const *task,
-                              std::vector<PhysicalRegion> const &regions,
-                              Context ctx,
-                              Runtime *runtime) {
-  FFConfig ffconfig;
-  LLAMA::Config llama_config;
-
-  InputArgs const &command_args = HighLevelRuntime::get_input_args();
-  char **argv = command_args.argv;
-  int argc = command_args.argc;
-  parse_input_args(argv, argc, llama_config);
-  SentencePieceTokenizer tokenizer(llama_config.tokenizer_file_path);
-  InferenceManager im(ffconfig, llama_config.max_num_tokens, 1);
-  RequestManager rm(&tokenizer);
-  // Add a single request
-  // std::vector<BatchConfig::TokenId> prompt{
-  //    1, 306, 4658, 278, 6593, 310, 2834, 338};
-  std::string text2 = "I believe the meaning of life is";
-  rm.register_new_request(text2, llama_config.max_seq_len);
-
-  FFModel beam_model(ffconfig), tree_model(ffconfig);
-  LLAMA::create_llama_model(beam_model, im, llama_config, 1, BEAM_SEARCH_MODE);
-  LLAMA::create_llama_model(tree_model, im, llama_config, 1, TREE_VERIFY_MODE);
-  // LLAMA::create_llama_model(inc_model, im, llama_config, 1,
-  // INC_DECODING_MODE);
-
-  // entry---------------------------
-  int depth = 0;
-  std::map<int, Future> beam_future_handlers, tree_future_handler;
-  std::map<int, BeamSearchBatchConfig> beam_batch_configs;
-  std::map<int, TreeVerifyBatchConfig> tree_batch_configs;
-
-  bool new_req = true;
-  TreeVerifyBatchConfig tree_bc;
-
-  int iteration = 0;
-
-  while (depth < llama_config.max_beam_depth) {
-    int bid = 0;
-    if (beam_future_handlers.find(bid) == beam_future_handlers.end()) {
-      BeamSearchBatchConfig bc;
-      InferenceResult ir;
-      bc = rm.prepare_next_batch_init(tree_bc, ir);
-
-      std::cout << "sub_requests: " << bc.sub_requests[0] << "\n";
-      FutureMap fm = im.inference(&beam_model, bid, bc);
-      assert(fm.get_future_map_domain().get_volume() == 1);
-      beam_future_handlers[bid] = fm.get_future(0);
-      beam_batch_configs[bid] = bc;
-    } else {
-      // have luanched this bid
-      Future future = beam_future_handlers[bid];
-      if (!future.is_ready(true /*subscribe*/)) {
-        continue;
-      } else {
-        std::cout << "future is ready...." << std::endl;
-      }
-      // process end
-      BeamInferenceResult ir = future.get_result<BeamInferenceResult>();
-      BeamSearchBatchConfig bc = beam_batch_configs[bid];
-      depth = bc.beamRequestsInfo[0].current_depth;
-      bc = rm.prepare_next_batch_beam(bc, ir);
-
-      std::cout << "llama current depth: " << depth << std::endl;
-      std::cout << "sub_requests: " << bc.sub_requests[0] << "\n";
-      FutureMap fm = im.inference(&beam_model, bid, bc);
-      assert(fm.get_future_map_domain().get_volume() == 1);
-      beam_future_handlers[bid] = fm.get_future(0);
-      beam_batch_configs[bid] = bc;
-
-      // tranverse the tree in dfs order;
-      if (depth >= llama_config.max_beam_depth) {
-
-        printf("\n\n ------Final Beam Search Batch------\n");
-        printf("[Beam] num_tokens: %d\n", bc.num_tokens);
-        for (int i = 0; i < bc.num_tokens; i++) {
-          std::cout << "[Token] Request Index: "
-                    << bc.tokensInfo[i].request_index
-                    << ", Abs Depth: " << bc.tokensInfo[i].abs_depth_in_request
-                    << ", Token Id: " << bc.tokensInfo[i].token_id << "\n";
-        }
-
-        // printf("\n\n prepare tree_bc from final beam search bc\n");
-        tree_bc = rm.prepare_next_batch_verify(bc);
-
-        printf("\n\n\n ------Tree Verify Batch-------\n");
-        // should have the same content as the hardcoded verification block
-        // below right now, it only contains the prompt need to add in the beam
-        // search result
-
-        printf("[Verify] num_tokens : %d\n", tree_bc.num_tokens);
-        printf("[Verify] num_tokens_in_batch: %d\n",
-               tree_bc.requestsInfo[0].num_tokens_in_batch);
-        printf("------------------------------\n");
-
-        for (int i = 0; i < tree_bc.num_tokens; i++) {
-          std::cout << "[Token] Request Index: "
-                    << tree_bc.tokensInfo[i].request_index << ", Abs Depth: "
-                    << tree_bc.tokensInfo[i].abs_depth_in_request
-                    << ", Token Id: " << tree_bc.tokensInfo[i].token_id << "\n";
-        }
-
-        printf("\n\n ------Commit Verified Tokens-------\n");
-        for (int i = 0; i < tree_bc.num_tokens_to_commit; i++) {
-          std::cout << "[Commit] Request Index: "
-                    << tree_bc.commited_tokens[i].request_index
-                    << ", Abs Depth: " << tree_bc.commited_tokens[i].token_depth
-                    << ", Token Index in batch: "
-                    << tree_bc.commited_tokens[i].token_index << "\n";
-        }
-
-        FutureMap fm = im.inference(&tree_model, 0, tree_bc);
-        assert(fm.get_future_map_domain().get_volume() == 1);
-        Future future = fm.get_future(0);
-        InferenceResult ir = future.get_result<InferenceResult>();
-        for (int i = 0; i < tree_bc.num_tokens; i++) {
-          if (i == 7) {
-            std::cout << "------------------\n";
-          }
-          printf("verify_tokens[%d] = %d\n", i, ir.token_ids[i]);
-        }
-
-        std::cout << "------Init New Beam Search Batch------\n";
-        bc = rm.prepare_next_batch_init(tree_bc, ir);
-        std::cout << "[Init] num_tokens: " << bc.num_tokens << "\n";
-        for (int i = 0; i < bc.num_tokens; i++) {
-          std::cout << "[Token] Request Index: "
-                    << bc.tokensInfo[i].request_index
-                    << ", Abs Depth: " << bc.tokensInfo[i].abs_depth_in_request
-                    << ", Token Id: " << bc.tokensInfo[i].token_id << "\n";
-        }
-        std::cout << "Batch Depth: " << bc.beamRequestsInfo[0].current_depth
-                  << "\n";
-
-        iteration++;
-
-        if (iteration < 4) {
-          std::cout << "\n\n~~~~~~~~~~teration " << iteration << "~~~~~~~~~~\n";
-          depth = bc.beamRequestsInfo[0].current_depth;
-          fm = im.inference(&beam_model, bid, bc);
-          assert(fm.get_future_map_domain().get_volume() == 1);
-          beam_future_handlers[bid] = fm.get_future(0);
-          beam_batch_configs[bid] = bc;
-        } else {
-          break;
-        }
-      }
-    }
-  }
-
-#ifdef DEADCODE
-  {
-    std::vector<BatchConfig::TokenId> prompt{1,
-                                             306,
-                                             4658,
-                                             278,
-                                             6593,
-                                             310,
-                                             2834,
-                                             338,
-                                             593,
-                                             595,
-                                             17252,
-                                             5031,
-                                             993,
-                                             616};
-    BatchConfig bc;
-    bc.request_completed[0] = false;
-    bc.num_tokens = prompt.size();
-    bc.requestsInfo[0].token_start_offset = 0;
-    bc.requestsInfo[0].num_tokens_in_batch = prompt.size();
-    bc.requestsInfo[0].max_sequence_length = 347;
-    bc.requestsInfo[0].request_guid = 1234;
-    for (size_t i = 0; i < prompt.size(); i++) {
-      bc.tokensInfo[i].abs_depth_in_request = i;
-      bc.tokensInfo[i].request_index = 0;
-      bc.tokensInfo[i].token_id = prompt[i];
-    }
-    FutureMap fm = im.inference(&inc_model, 0, bc);
-    assert(fm.get_future_map_domain().get_volume() == 1);
-    Future future = fm.get_future(0);
-    InferenceResult ir = future.get_result<InferenceResult>();
-    for (int i = 0; i < bc.num_tokens; i++) {
-      printf("decoding_tokens[%d] = %d\n", i, ir.token_ids[i]);
-    }
-    bc.num_tokens = 1;
-    bc.requestsInfo[0].token_start_offset = prompt.size();
-    bc.requestsInfo[0].num_tokens_in_batch = 1;
-    bc.tokensInfo[0].abs_depth_in_request = prompt.size();
-    bc.tokensInfo[0].request_index = 0;
-    bc.tokensInfo[0].token_id = ir.token_ids[prompt.size() - 1];
-    fm = im.inference(&inc_model, 0, bc);
-    assert(fm.get_future_map_domain().get_volume() == 1);
-    future = fm.get_future(0);
-    ir = future.get_result<InferenceResult>();
-    printf("decoding_tokens[%d] = %d\n",
-           bc.tokensInfo[0].abs_depth_in_request,
-           ir.token_ids[0]);
-  }
-#endif
-  // Execution fence
-  {
-    Future future = runtime->issue_execution_fence(ctx);
-    future.get_void_result();
-  }
-
-  // float* data
-  std::cout << "----------inference finished--------------" << std::endl;
-}
-
-void FlexFlow::register_custom_tasks() {}
diff --git a/examples/cpp/inference/llama_spec_pipeline/llama_rae.cc b/examples/cpp/inference/llama_spec_pipeline/llama_rae.cc
deleted file mode 100644
index 7116c4bf21..0000000000
--- a/examples/cpp/inference/llama_spec_pipeline/llama_rae.cc
+++ /dev/null
@@ -1,246 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "flexflow/inference.h"
-#include "models/llama.h"
-
-using namespace Legion;
-
-LegionRuntime::Logger::Category log_app("llama");
-
-void parse_input_args(char **argv, int argc, LLAMA::Config &config) {
-  for (int i = 1; i < argc; i++) {
-    // input
-    if (!strcmp(argv[i], "--dataset")) {
-      config.input_path = std::string(argv[++i]);
-      continue;
-    }
-
-    // weights
-    if (!strcmp(argv[i], "--weights")) {
-      config.weight_file_path = std::string(argv[++i]);
-      continue;
-    }
-  }
-}
-
-void FlexFlow::top_level_task(Task const *task,
-                              std::vector<PhysicalRegion> const &regions,
-                              Context ctx,
-                              Runtime *runtime) {
-  FFConfig ffconfig;
-  LLAMA::Config llama_config;
-
-  InputArgs const &command_args = HighLevelRuntime::get_input_args();
-  char **argv = command_args.argv;
-  int argc = command_args.argc;
-  parse_input_args(argv, argc, llama_config);
-  InferenceManager im(ffconfig, llama_config.batchSize, 1);
-  RequestManager rm;
-  // Add a single request
-  std::vector<BatchConfig::TokenId> prompt{
-      1, 306, 4658, 278, 6593, 310, 2834, 338};
-  rm.register_new_request(prompt, llama_config.sentence_len);
-
-  FFModel beam_model(ffconfig), tree_model(ffconfig), inc_model(ffconfig);
-  LLAMA::create_llama_model(beam_model, im, llama_config, 1, BEAM_SEARCH_MODE);
-  LLAMA::create_llama_model(tree_model, im, llama_config, 1, TREE_VERIFY_MODE);
-  // LLAMA::create_llama_model(inc_model, im, llama_config, 1,
-  // INC_DECODING_MODE);
-
-  // entry---------------------------
-  int abs_depth = 0;
-  std::map<int, Future> beam_future_handlers, tree_future_handler;
-  std::map<int, BeamSearchBatchConfig> beam_batch_configs;
-  std::map<int, TreeVerifyBatchConfig> tree_batch_configs;
-
-  bool new_req = true;
-  TreeVerifyBatchConfig tree_bc;
-  InferenceResult ir;
-  int num_iterations = 2;
-
-  for (int itr = 0; itr < num_iterations; itr++) {
-    printf("\n\n ITERATION %d \n\n", itr);
-
-    // first iteration of beam search, calling prepare_next_batch_init
-    int beam_search_depth = 0;
-    int bid = 0;
-    BeamSearchBatchConfig bc;
-    bc = rm.prepare_next_batch_init(tree_bc, ir);
-
-    printf("\n\n init beam search bc\n");
-    printf("bc.num_tokens: %d\n", bc.num_tokens);
-    for (int i = 0; i < bc.num_tokens; i++) {
-      printf("bc.tokensInfo[%d].token_id: %d\n", i, bc.tokensInfo[i].token_id);
-      printf("bc.tokensInfo[%d].abs_depth_in_request: %d\n",
-             i,
-             bc.tokensInfo[i].abs_depth_in_request);
-      printf("bc.tokensInfo[%d].request_index: %d\n",
-             i,
-             bc.tokensInfo[i].request_index);
-    }
-
-    std::cout << "sub_requests: " << bc.sub_requests[0] << "\n";
-    FutureMap fm = im.inference(&beam_model, bid, bc);
-    assert(fm.get_future_map_domain().get_volume() == 1);
-    beam_future_handlers[bid] = fm.get_future(0);
-    beam_batch_configs[bid] = bc;
-
-    // subsequent iterations of beam search
-    while (beam_search_depth < llama_config.max_beam_depth) {
-      // have luanched this bid
-      Future future = beam_future_handlers[bid];
-      if (!future.is_ready(true /*subscribe*/)) {
-        continue;
-      } else {
-        std::cout << "future is ready...." << std::endl;
-      }
-      // process end
-      BeamInferenceResult ir_beam = future.get_result<BeamInferenceResult>();
-      BeamSearchBatchConfig bc = beam_batch_configs[bid];
-      abs_depth = bc.beamRequestsInfo[0].current_depth;
-      bc = rm.prepare_next_batch_beam(bc, ir_beam);
-
-      std::cout << "llama current depth: " << abs_depth << std::endl;
-      std::cout << "sub_requests: " << bc.sub_requests[0] << "\n";
-      FutureMap fm = im.inference(&beam_model, bid, bc);
-      assert(fm.get_future_map_domain().get_volume() == 1);
-      beam_future_handlers[bid] = fm.get_future(0);
-      beam_batch_configs[bid] = bc;
-      beam_search_depth++;
-    }
-
-    // verify
-    printf("\n\n ------Final Beam Search Batch------\n");
-    printf("[Beam] num_tokens: %d\n", bc.num_tokens);
-    for (int i = 0; i < bc.num_tokens; i++) {
-      std::cout << "[Token] Request Index: " << bc.tokensInfo[i].request_index
-                << ", Abs Depth: " << bc.tokensInfo[i].abs_depth_in_request
-                << ", Token Id: " << bc.tokensInfo[i].token_id << "\n";
-    }
-
-    printf("\n\n prepare tree_bc from final beam search bc\n");
-    tree_bc = rm.prepare_next_batch_verify(bc);
-
-    printf("\n\n\n t------Tree Verify Batch-------\n");
-    // should have the same content as the hardcoded verification block below
-    // right now, it only contains the prompt
-    // need to add in the beam search result
-
-    printf("[Verify] num_tokens : %d\n", tree_bc.num_tokens);
-    printf("[Verify] num_tokens_in_batch: %d\n",
-           tree_bc.requestsInfo[0].num_tokens_in_batch);
-    printf("------------------------------\n");
-
-    for (int i = 0; i < tree_bc.num_tokens; i++) {
-      std::cout << "[Token] Request Index: "
-                << tree_bc.tokensInfo[i].request_index
-                << ", Abs Depth: " << tree_bc.tokensInfo[i].abs_depth_in_request
-                << ", Token Id: " << tree_bc.tokensInfo[i].token_id << "\n";
-    }
-
-    fm = im.inference(&tree_model, 0, tree_bc);
-    assert(fm.get_future_map_domain().get_volume() == 1);
-    Future future = fm.get_future(0);
-    ir = future.get_result<InferenceResult>();
-    for (int i = 0; i < tree_bc.num_tokens; i++) {
-      printf("verify_tokens[%d] = %d\n", i, ir.token_ids[i]);
-    }
-  }
-
-  // // original
-  // {
-  //   std::vector<BatchConfig::TokenId> tokens{1,
-  //                                            306,
-  //                                            4658,
-  //                                            278,
-  //                                            6593,
-  //                                            310,
-  //                                            2834,
-  //                                            338,
-  //                                            593,
-  //                                            595,
-  //                                            17252,
-  //                                            5031,
-  //                                            993,
-  //                                            616,
-  //                                            368,
-  //                                            2302};
-  //   BatchConfig bc;
-  //   bc.num_tokens = 16;
-  //   bc.requestsInfo[0].num_tokens_in_batch = bc.num_tokens;
-  //   bc.requestsInfo[0].token_start_offset = 0;
-  //   bc.requestsInfo[0].max_sequence_length = 347;
-  //   bc.requestsInfo[0].request_guid = 1000000;
-  //   bc.request_completed[0] = false;
-  //   for (int i = 0; i < bc.num_tokens; i++) {
-  //     bc.tokensInfo[i].token_id = tokens[i];
-  //     bc.tokensInfo[i].abs_depth_in_request = i;
-  //     bc.tokensInfo[i].request_index = 0;
-  //   }
-  //   FutureMap fm = im.inference(&inc_model, 0, bc);
-  //   assert(fm.get_future_map_domain().get_volume() == 1);
-  //   Future future = fm.get_future(0);
-  //   InferenceResult ir = future.get_result<InferenceResult>();
-  //   for (int i = 0; i < bc.num_tokens; i++) {
-  //     printf("decoding_tokens[%d] = %d\n", i, ir.token_ids[i]);
-  //   }
-  // }
-
-  // // verification
-  // {
-  //   std::vector<BatchConfig::TokenId> tokens{1,
-  //                                            306,
-  //                                            4658,
-  //                                            278,
-  //                                            6593,
-  //                                            310,
-  //                                            2834,
-  //                                            338,
-  //                                            593,
-  //                                            595,
-  //                                            17252,
-  //                                            5031,
-  //                                            993,
-  //                                            616,
-  //                                            368,
-  //                                            2302};
-  //   tree_bc.num_tokens = 16;
-  //   tree_bc.requestsInfo[0].num_tokens_in_batch = tree_bc.num_tokens;
-  //   for (int i = 0; i < tree_bc.num_tokens; i++) {
-  //     tree_bc.tokensInfo[i].token_id = tokens[i];
-  //     tree_bc.tokensInfo[i].abs_depth_in_request = i;
-  //     tree_bc.tokensInfo[i].request_index = 0;
-  //   }
-  //   FutureMap fm = im.inference(&tree_model, 0, tree_bc);
-  //   assert(fm.get_future_map_domain().get_volume() == 1);
-  //   Future future = fm.get_future(0);
-  //   InferenceResult ir = future.get_result<InferenceResult>();
-  //   for (int i = 0; i < tree_bc.num_tokens; i++) {
-  //     printf("verify_tokens[%d] = %d\n", i, ir.token_ids[i]);
-  //   }
-  // }
-
-  // Execution fence
-  {
-    Future future = runtime->issue_execution_fence(ctx);
-    future.get_void_result();
-  }
-
-  // float* data
-  std::cout << "----------inference finished--------------" << std::endl;
-}
-
-void FlexFlow::register_custom_tasks() {}
diff --git a/examples/cpp/inference/opt/CMakeLists.txt b/examples/cpp/inference/opt/CMakeLists.txt
deleted file mode 100644
index 3156e71f75..0000000000
--- a/examples/cpp/inference/opt/CMakeLists.txt
+++ /dev/null
@@ -1,22 +0,0 @@
-cmake_minimum_required(VERSION 3.10)
-
-project(FlexFlowExample_OPT)
-set(project_target OPT)
-
-
-set(CPU_SRC
-  ${FLEXFLOW_CPP_DRV_SRC}
-  opt.cc
-  opt.h
-  ${CMAKE_SOURCE_DIR}/inference/file_loader.cc)
-
-
-
-cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
-target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
-target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/inference)
-target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/examples/cpp/inference)
-target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
-
-set(BIN_DEST "bin")
-install(TARGETS ${project_target} DESTINATION ${BIN_DEST})
diff --git a/examples/cpp/inference/opt/Makefile b/examples/cpp/inference/opt/Makefile
deleted file mode 100644
index afe13d305a..0000000000
--- a/examples/cpp/inference/opt/Makefile
+++ /dev/null
@@ -1,38 +0,0 @@
-# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-#     http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-#
-
-# Flags for directing the runtime makefile what to include
-DEBUG           ?= 0		# Include debugging symbols
-MAX_DIM         ?= 4		# Maximum number of dimensions
-OUTPUT_LEVEL    ?= LEVEL_DEBUG	# Compile time logging level
-USE_CUDA        ?= 1		# Include CUDA support (requires CUDA)
-USE_GASNET      ?= 0		# Include GASNet support (requires GASNet)
-USE_HDF         ?= 1		# Include HDF5 support (requires HDF5)
-ALT_MAPPERS     ?= 0		# Include alternative mappers (not recommended)
-
-# Put the binary file name here
-OUTFILE		?= opt
-# List all the application source files here
-GEN_SRC		= opt.cc 
-ifndef CUDA_HOME
-CUDA_HOME = $(patsubst %/bin/nvcc,%,$(shell which nvcc | head -1))
-endif
-
-
-ifndef FF_HOME
-$(error FF_HOME variable is not defined, aborting build)
-endif
-
-include $(FF_HOME)/FlexFlow.mk
diff --git a/examples/cpp/inference/opt/README.md b/examples/cpp/inference/opt/README.md
deleted file mode 100644
index 8a7bd10ee5..0000000000
--- a/examples/cpp/inference/opt/README.md
+++ /dev/null
@@ -1,45 +0,0 @@
-# an example of running opt model
-## how to run?
-1. build the flexflow with FF_BUILD_ALL_INFERENCE_EXAMPLES or FF_BUILD_ALL_EXAMPLES
-2. download the weight and token file from aws s3. 
-```bash
-aws s3 cp s3://catalyst-llama/opt_125m_native.tar.gz FF_HOME/examples/cpp/inference/opt/weights
-
-tar -zxvf opt_125m_native.tar.gz
-```
-3. run *OPT* with `--weights` `--dataset` `--only-data-parallel`
-4. run examples/cpp/inference/opt/opt_baseline.py
-5. if get same result, it should be fine
-
-## code structure: 
-1. use two inputs, token & position, the position input should be after the token input
-2. for the attention model, set scaling_query = true, scaling_factor = 0.125 and qk_prod_scaling = false,
-all other models should set scaling_query = false and qk_prod_scaling = true
-## opt default configuration from huggingface opt-125m
-```python
-OPTConfig {
-  "_remove_final_layer_norm": false,
-  "activation_function": "relu",
-  "attention_dropout": 0.0,
-  "bos_token_id": 2,
-  "do_layer_norm_before": true,
-  "dropout": 0.1,
-  "enable_bias": true,
-  "eos_token_id": 2,
-  "ffn_dim": 3072,
-  "hidden_size": 768,
-  "init_std": 0.02,
-  "layer_norm_elementwise_affine": true,
-  "layerdrop": 0.0,
-  "max_position_embeddings": 2048,
-  "model_type": "opt",
-  "num_attention_heads": 12,
-  "num_hidden_layers": 12,
-  "pad_token_id": 1,
-  "transformers_version": "4.27.2",
-  "use_cache": true,
-  "vocab_size": 50272,
-  "word_embed_proj_dim": 768
-}
-```
-
diff --git a/examples/cpp/inference/opt/opt.cc b/examples/cpp/inference/opt/opt.cc
deleted file mode 100644
index 453633c383..0000000000
--- a/examples/cpp/inference/opt/opt.cc
+++ /dev/null
@@ -1,238 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "opt.h"
-#include "flexflow/inference.h"
-#include <cmath>
-
-using namespace Legion;
-
-LegionRuntime::Logger::Category log_app("opt");
-
-void parse_input_args(char **argv, int argc, OptConfig &config) {
-  for (int i = 1; i < argc; i++) {
-    // weights
-    if (!strcmp(argv[i], "--weights")) {
-      config.weight_file_path = std::string(argv[++i]);
-      continue;
-    }
-  }
-}
-
-void FlexFlow::top_level_task(Task const *task,
-                              std::vector<PhysicalRegion> const &regions,
-                              Context ctx,
-                              Runtime *runtime) {
-  FFConfig ffconfig;
-  OptConfig optConfig;
-  FFModel ff(ffconfig);
-
-  InputArgs const &command_args = HighLevelRuntime::get_input_args();
-  char **argv = command_args.argv;
-  int argc = command_args.argc;
-  parse_input_args(argv, argc, optConfig);
-
-  //------------------------------compute machine views ------------------
-  int num_devices = ffconfig.workersPerNode * ffconfig.numNodes;
-  std::vector<MachineView> machine_views;
-  for (int i = 0; i < num_devices; i++) {
-    MachineView view;
-    view.device_type = MachineView::GPU;
-    view.ndims = 1;
-    view.dim[0] = 1;
-    view.stride[0] = 0;
-    view.start_device_id = i;
-    machine_views.push_back(view);
-  }
-
-  std::unordered_map<Tensor, std::vector<MachineView>> mapping;
-  std::unordered_map<std::string, Layer *> weights_layers;
-
-  //------------------------------ build the model --------------------------
-  Tensor input;
-  Tensor position_input;
-  {
-    int const token_dims[] = {BatchConfig::MAX_NUM_TOKENS, 1};
-    input = ff.create_tensor<2>(token_dims, DT_INT32);
-    position_input = ff.create_tensor<2>(token_dims, DT_INT32);
-  }
-
-  mapping[input].push_back(machine_views[0]);
-  mapping[position_input].push_back(machine_views[0]);
-
-  Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
-  std::vector<int> axes = {0};
-
-  Tensor token = ff.embedding(input,
-                              optConfig.vocab_size,
-                              optConfig.word_embed_proj_dim,
-                              AGGR_MODE_NONE,
-                              DT_FLOAT,
-                              NULL,
-                              embed_init);
-  Layer *embedding = ff.layers.back();
-
-  weights_layers.emplace("embed_tokens_weight", embedding);
-
-  Tensor positional_embedding = ff.embedding(position_input,
-                                             optConfig.max_position_embeddings,
-                                             optConfig.hidden_size,
-                                             AGGR_MODE_NONE,
-                                             DT_FLOAT,
-                                             NULL,
-                                             embed_init);
-  Layer *pos_embedding = ff.layers.back();
-  weights_layers.emplace("embed_positions_weight", pos_embedding);
-
-  Tensor residual = ff.add(token, positional_embedding);
-
-  int num_transformer_layers_per_gpu = (32 + num_devices - 1) / num_devices;
-
-  for (int i = 0; i < optConfig.num_hidden_layers; i++) {
-    // 125m, 1.7B, ..., 175B applies layer norm BEFORE attention,
-    // 350m applies layer norm AFTER attention
-    // https://github.com/huggingface/transformers/blob/main/src/transformers/models/opt/modeling_opt.py#LL324C1-L325C1
-    // this version is before normalization
-
-    Tensor hidden_states = ff.layer_norm(
-        residual, axes, optConfig.layer_norm_elementwise_affine, 1e-05);
-    Layer *self_attn_layer_norm = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) +
-                               "_self_attn_layer_norm_weight",
-                           self_attn_layer_norm);
-    if (i % num_transformer_layers_per_gpu == 0) {
-      mapping[hidden_states].push_back(
-          machine_views[i / num_transformer_layers_per_gpu]);
-    }
-
-    Tensor mha = ff.inc_multihead_self_attention(
-        hidden_states,
-        optConfig.hidden_size,
-        optConfig.num_attention_heads,
-        optConfig.hidden_size / optConfig.num_attention_heads,
-        optConfig.hidden_size / optConfig.num_attention_heads,
-        0.0f,
-        true,
-        false,
-        false,
-        NULL,
-        false,
-        /*scaling query*/ true,
-        /*sacling factor*/
-        pow((optConfig.hidden_size / optConfig.num_attention_heads), -0.5),
-        /*qk_prod_scaling*/ false);
-
-    Layer *attention_layer = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) + "_attention_weight",
-                           attention_layer);
-    Tensor added = ff.add(mha, residual);
-
-    Tensor final_norm = ff.layer_norm(
-        added, axes, optConfig.layer_norm_elementwise_affine, 1e-05);
-    Layer *final_layer_norm = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) +
-                               "_final_layer_norm_weight",
-                           final_layer_norm);
-
-    //--------linear fc1 fc2 ----------
-    Tensor fc1 = ff.dense(final_norm, optConfig.ffn_dim, AC_MODE_NONE, true);
-    Layer *fc1_linear = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) + "_fc1_weight",
-                           fc1_linear);
-    Tensor activation = ff.relu(fc1, false);
-
-    Tensor fc2 =
-        ff.dense(activation, optConfig.hidden_size, AC_MODE_NONE, true);
-    Layer *fc2_linear = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) + "_fc2_weight",
-                           fc2_linear);
-    residual = ff.add(added, fc2);
-  }
-
-  // final
-  Tensor all_final_norm = ff.layer_norm(
-      residual, axes, optConfig.layer_norm_elementwise_affine, 1e-05);
-  Layer *all_final_norm_layer = ff.layers.back();
-  weights_layers.emplace("final_layer_norm_weight", all_final_norm_layer);
-
-  Tensor lm_head =
-      ff.dense(all_final_norm, optConfig.vocab_size, AC_MODE_NONE, false);
-  Layer *lm_head_layer = ff.layers.back();
-  weights_layers.emplace("embed_tokens_weight_lm_head", lm_head_layer);
-
-  Tensor output = ff.arg_top_k(lm_head, /*k=*/1, false);
-  //------------------- compile the model --------------------------------
-  std::cout << "------start compile ----------" << std::endl;
-  InferenceManager im(ffconfig, 1, 1);
-  im.compile_model_and_allocate_buffer(&ff, mapping);
-  RequestManager rm;
-
-  ParallelTensor input_pt;
-  ff.get_parallel_tensor_from_tensor(input, input_pt);
-  assert(im.tensor_buffer.find(input_pt) != im.tensor_buffer.end());
-
-  ParallelTensor pos_pt;
-  ff.get_parallel_tensor_from_tensor(position_input, pos_pt);
-  assert(im.tensor_buffer.find(pos_pt) != im.tensor_buffer.end());
-
-  //-------------------load weights and inputs------------------
-  FileDataLoader fileloader(optConfig.input_path,
-                            optConfig.weight_file_path,
-                            optConfig.num_attention_heads,
-                            optConfig.hidden_size,
-                            optConfig.hidden_size /
-                                optConfig.num_attention_heads);
-  //"Today is a beautiful day and I want"
-  std::vector<int> prompt = {2, 5625, 16, 10, 2721, 183, 8, 38, 236};
-  rm.register_new_request(prompt, 30);
-  fileloader.load_weights(&ff, weights_layers);
-
-  im.init_operators_inference(&ff);
-  int depth = 0;
-  std::map<int, Future> future_handlers;
-  std::map<int, BatchConfig> batch_configs;
-  int sentence_length = 9;
-  while (true) {
-    int bid = 0;
-    if (future_handlers.find(bid) == future_handlers.end()) {
-      BatchConfig bc;
-      InferenceResult ir;
-      bc = rm.prepare_next_batch(bc, ir);
-      FutureMap fm = im.inference(&ff, bid, bc);
-      assert(fm.get_future_map_domain().get_volume() == 1);
-      future_handlers[bid] = fm.get_future(0);
-      batch_configs[bid] = bc;
-    } else {
-      Future future = future_handlers[bid];
-      if (!future.is_ready(true /*subscribe*/)) {
-        continue;
-      } else {
-        std::cout << "future is ready...." << std::endl;
-      }
-      // process end
-      InferenceResult ir = future.get_result<InferenceResult>();
-      BatchConfig bc = batch_configs[bid];
-      bc = rm.prepare_next_batch(bc, ir);
-      sentence_length += bc.num_tokens;
-      FutureMap fm = im.inference(&ff, bid, bc);
-      assert(fm.get_future_map_domain().get_volume() == 1);
-      future_handlers[bid] = fm.get_future(0);
-      batch_configs[bid] = bc;
-    }
-  }
-  std::cout << "----------inference finished--------------" << std::endl;
-}
-
-void FlexFlow::register_custom_tasks() {}
diff --git a/examples/cpp/inference/opt/opt.h b/examples/cpp/inference/opt/opt.h
deleted file mode 100644
index 6b9a45f2d5..0000000000
--- a/examples/cpp/inference/opt/opt.h
+++ /dev/null
@@ -1,40 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#pragma once
-
-#include "file_loader.h"
-#include "inference_config.h"
-struct OptConfig : InferenceConfig {
-  OptConfig(void) : InferenceConfig() {
-    vocab_size = 50272, word_embed_proj_dim = 768, hidden_size = 768;
-    max_position_embeddings = 2048;
-    layer_norm_elementwise_affine = true;
-    num_attention_heads = 12;
-    dropout = 0.1;
-    seed = 3;
-    ffn_dim = 3072;
-    num_hidden_layers = 12;
-  }
-  int word_embed_proj_dim;
-  std::string input_path;
-  std::string weight_file_path;
-  int max_position_embeddings;
-  bool layer_norm_elementwise_affine;
-  float dropout;
-  unsigned long long seed;
-  int ffn_dim;
-  int num_hidden_layers;
-};
diff --git a/examples/cpp/inference/opt/opt_baseline.py b/examples/cpp/inference/opt/opt_baseline.py
deleted file mode 100644
index 3e8d7499f0..0000000000
--- a/examples/cpp/inference/opt/opt_baseline.py
+++ /dev/null
@@ -1,23 +0,0 @@
-from transformers import OPTConfig, OPTForCausalLM, GPT2Tokenizer
-
-model_id = "facebook/opt-125m"
-tokenizer = GPT2Tokenizer.from_pretrained(model_id)
-model = OPTForCausalLM.from_pretrained(model_id)
-
-prompts = [
-            "Today is a beautiful day and I want",
-        ]
-
-for prompt in prompts:
-    input_ids = tokenizer(prompt, return_tensors="pt", padding=True).input_ids
-    print(input_ids)
-    generated_ids = model.generate(input_ids, max_length=30)
-    generated_string = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)
-    print(generated_ids)
-    print(generated_string)
-
-#get same results with this and opt.cc
-# tensor([[    2,  5625,    16,    10,  2721,   183,     8,    38,   236,     7,
-#            458,    19,    47,     5,  2770,   527,     9,   127,    78,   655,
-#           1805,     7,     5,  4105,     4, 50118,   100,    21,    98,  2283]])
-# 2, 5625, 16, 10, 2721, 183, 8, 38, 236, 7, 458, 19, 47, 5, 2770, 527, 9, 127, 78, 655, 1805, 7, 5, 4105, 4, 50118, 100, 21, 98, 2283,
\ No newline at end of file
diff --git a/examples/cpp/inference/opt_spec_pipeline/CMakeLists.txt b/examples/cpp/inference/opt_spec_pipeline/CMakeLists.txt
deleted file mode 100644
index d7937d7595..0000000000
--- a/examples/cpp/inference/opt_spec_pipeline/CMakeLists.txt
+++ /dev/null
@@ -1,20 +0,0 @@
-cmake_minimum_required(VERSION 3.10)
-
-project(FlexFlowExample_opt_pipeline)
-set(project_target opt_pipeline)
-
-
-set(CPU_SRC
-  ${FLEXFLOW_CPP_DRV_SRC}
-  opt_pipeline.cc
-  ${CMAKE_SOURCE_DIR}/inference/file_loader.cc
-  ${CMAKE_SOURCE_DIR}/inference/models/opt.cc)
-
-
-cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
-target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
-target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/inference)
-target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
-
-set(BIN_DEST "bin")
-install(TARGETS ${project_target} DESTINATION ${BIN_DEST})
diff --git a/examples/cpp/inference/opt_spec_pipeline/Makefile b/examples/cpp/inference/opt_spec_pipeline/Makefile
deleted file mode 100644
index b4a7866073..0000000000
--- a/examples/cpp/inference/opt_spec_pipeline/Makefile
+++ /dev/null
@@ -1,37 +0,0 @@
-# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-#     http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-#
-
-# Flags for directing the runtime makefile what to include
-DEBUG           ?= 0		# Include debugging symbols
-MAX_DIM         ?= 4		# Maximum number of dimensions
-OUTPUT_LEVEL    ?= LEVEL_DEBUG	# Compile time logging level
-USE_CUDA        ?= 1		# Include CUDA support (requires CUDA)
-USE_GASNET      ?= 0		# Include GASNet support (requires GASNet)
-USE_HDF         ?= 1		# Include HDF5 support (requires HDF5)
-ALT_MAPPERS     ?= 0		# Include alternative mappers (not recommended)
-
-# Put the binary file name here
-OUTFILE		?= opt_pipeline
-# List all the application source files here
-ifndef CUDA_HOME
-CUDA_HOME = $(patsubst %/bin/nvcc,%,$(shell which nvcc | head -1))
-endif
-
-
-ifndef FF_HOME
-$(error FF_HOME variable is not defined, aborting build)
-endif
-
-include $(FF_HOME)/FlexFlow.mk
diff --git a/examples/cpp/inference/opt_spec_pipeline/opt_pipeline.cc b/examples/cpp/inference/opt_spec_pipeline/opt_pipeline.cc
deleted file mode 100644
index 1229ad13c3..0000000000
--- a/examples/cpp/inference/opt_spec_pipeline/opt_pipeline.cc
+++ /dev/null
@@ -1,203 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "flexflow/inference.h"
-#include "flexflow/tokenizers.h"
-#include "models/opt.h"
-
-using namespace Legion;
-
-LegionRuntime::Logger::Category log_app("opt");
-
-void parse_input_args(char **argv, int argc, OPT::Config &config) {
-  for (int i = 1; i < argc; i++) {
-    // weights
-    if (!strcmp(argv[i], "--weights")) {
-      config.weight_file_path = std::string(argv[++i]);
-      continue;
-    }
-    // tokenizer
-    if (!strcmp(argv[i], "--tokenizer")) {
-      config.tokenizer_assets_folder = std::string(argv[++i]);
-      continue;
-    }
-  }
-}
-
-void FlexFlow::top_level_task(Task const *task,
-                              std::vector<PhysicalRegion> const &regions,
-                              Context ctx,
-                              Runtime *runtime) {
-  FFConfig ffconfig;
-  OPT::Small_Config opt_config;
-
-  InputArgs const &command_args = HighLevelRuntime::get_input_args();
-  char **argv = command_args.argv;
-  int argc = command_args.argc;
-  parse_input_args(argv, argc, opt_config);
-  std::string const vocab_filepath =
-      opt_config.tokenizer_assets_folder + "/gpt2-vocab.json";
-  std::string const merges_filepath =
-      opt_config.tokenizer_assets_folder + "/gpt2-merges.txt";
-  OptTokenizer opt_tokenizer(vocab_filepath, merges_filepath);
-  InferenceManager im(ffconfig, opt_config.batchSize, 1);
-  RequestManager rm(&opt_tokenizer);
-  // Add a single request
-  // std::vector<BatchConfig::TokenId> prompt = {
-  //     2, 5625, 16, 10, 2721, 183, 8, 38, 236};
-  // rm.register_new_request(prompt, opt_config.sentence_len);
-  std::string text = "I believe the meaning of life is";
-  rm.register_new_request(text,
-                          opt_config.sentence_len /*max_sequence_length*/);
-
-  FFModel beam_model(ffconfig), tree_model(ffconfig);
-  OPT::create_opt_model(beam_model, im, opt_config, 1, BEAM_SEARCH_MODE);
-  OPT::create_opt_model(tree_model, im, opt_config, 1, TREE_VERIFY_MODE);
-
-  // entry---------------------------
-  int depth = 0;
-  std::map<int, Future> beam_future_handlers, tree_future_handler;
-  std::map<int, BeamSearchBatchConfig> beam_batch_configs;
-  std::map<int, TreeVerifyBatchConfig> tree_batch_configs;
-
-  bool new_req = true;
-  TreeVerifyBatchConfig tree_bc;
-
-  int iteration = 0;
-
-  while (depth < opt_config.max_beam_depth) {
-    int bid = 0;
-    if (beam_future_handlers.find(bid) == beam_future_handlers.end()) {
-      BeamSearchBatchConfig bc;
-      InferenceResult ir;
-      bc = rm.prepare_next_batch_init(tree_bc, ir);
-
-      std::cout << "sub_requests: " << bc.sub_requests[0] << "\n";
-      FutureMap fm = im.inference(&beam_model, bid, bc);
-      assert(fm.get_future_map_domain().get_volume() == 1);
-      beam_future_handlers[bid] = fm.get_future(0);
-      beam_batch_configs[bid] = bc;
-    } else {
-      // have luanched this bid
-      Future future = beam_future_handlers[bid];
-      if (!future.is_ready(true /*subscribe*/)) {
-        continue;
-      } else {
-        std::cout << "future is ready...." << std::endl;
-      }
-      // process end
-      BeamInferenceResult ir = future.get_result<BeamInferenceResult>();
-      BeamSearchBatchConfig bc = beam_batch_configs[bid];
-      depth = bc.beamRequestsInfo[0].current_depth;
-      bc = rm.prepare_next_batch_beam(bc, ir);
-
-      std::cout << "opt current depth: " << depth << std::endl;
-      std::cout << "sub_requests: " << bc.sub_requests[0] << "\n";
-      FutureMap fm = im.inference(&beam_model, bid, bc);
-      assert(fm.get_future_map_domain().get_volume() == 1);
-      beam_future_handlers[bid] = fm.get_future(0);
-      beam_batch_configs[bid] = bc;
-
-      // tranverse the tree in dfs order;
-      if (depth >= opt_config.max_beam_depth) {
-
-        printf("\n\n ------Final Beam Search Batch------\n");
-        printf("[Beam] num_tokens: %d\n", bc.num_tokens);
-        for (int i = 0; i < bc.num_tokens; i++) {
-          std::cout << "[Token] Request Index: "
-                    << bc.tokensInfo[i].request_index
-                    << ", Abs Depth: " << bc.tokensInfo[i].abs_depth_in_request
-                    << ", Token Id: " << bc.tokensInfo[i].token_id << "\n";
-        }
-
-        // printf("\n\n prepare tree_bc from final beam search bc\n");
-        tree_bc = rm.prepare_next_batch_verify(bc);
-
-        printf("\n\n\n ------Tree Verify Batch-------\n");
-        // should have the same content as the hardcoded verification block
-        // below right now, it only contains the prompt need to add in the beam
-        // search result
-
-        printf("[Verify] num_tokens : %d\n", tree_bc.num_tokens);
-        printf("[Verify] num_tokens_in_batch: %d\n",
-               tree_bc.requestsInfo[0].num_tokens_in_batch);
-        printf("------------------------------\n");
-
-        for (int i = 0; i < tree_bc.num_tokens; i++) {
-          std::cout << "[Token] Request Index: "
-                    << tree_bc.tokensInfo[i].request_index << ", Abs Depth: "
-                    << tree_bc.tokensInfo[i].abs_depth_in_request
-                    << ", Token Id: " << tree_bc.tokensInfo[i].token_id << "\n";
-        }
-
-        printf("\n\n ------Commit Verified Tokens-------\n");
-        for (int i = 0; i < tree_bc.num_tokens_to_commit; i++) {
-          std::cout << "[Commit] Request Index: "
-                    << tree_bc.commited_tokens[i].request_index
-                    << ", Abs Depth: " << tree_bc.commited_tokens[i].token_depth
-                    << ", Token Index in batch: "
-                    << tree_bc.commited_tokens[i].token_index << "\n";
-        }
-
-        FutureMap fm = im.inference(&tree_model, 0, tree_bc);
-        assert(fm.get_future_map_domain().get_volume() == 1);
-        Future future = fm.get_future(0);
-        InferenceResult ir = future.get_result<InferenceResult>();
-        for (int i = 0; i < tree_bc.num_tokens; i++) {
-          if (i == 7) {
-            std::cout << "------------------\n";
-          }
-          printf("verify_tokens[%d] = %d\n", i, ir.token_ids[i]);
-        }
-
-        std::cout << "------Init New Beam Search Batch------\n";
-        bc = rm.prepare_next_batch_init(tree_bc, ir);
-        std::cout << "[Init] num_tokens: " << bc.num_tokens << "\n";
-        for (int i = 0; i < bc.num_tokens; i++) {
-          std::cout << "[Token] Request Index: "
-                    << bc.tokensInfo[i].request_index
-                    << ", Abs Depth: " << bc.tokensInfo[i].abs_depth_in_request
-                    << ", Token Id: " << bc.tokensInfo[i].token_id << "\n";
-        }
-        std::cout << "Batch Depth: " << bc.beamRequestsInfo[0].current_depth
-                  << "\n";
-
-        iteration++;
-
-        if (iteration < 4) {
-          std::cout << "\n\n~~~~~~~~~~teration " << iteration << "~~~~~~~~~~\n";
-          depth = bc.beamRequestsInfo[0].current_depth;
-          fm = im.inference(&beam_model, bid, bc);
-          assert(fm.get_future_map_domain().get_volume() == 1);
-          beam_future_handlers[bid] = fm.get_future(0);
-          beam_batch_configs[bid] = bc;
-        } else {
-          break;
-        }
-      }
-    }
-  }
-
-  // Execution fence
-  {
-    Future future = runtime->issue_execution_fence(ctx);
-    future.get_void_result();
-  }
-
-  // float* data
-  std::cout << "----------inference finished--------------" << std::endl;
-}
-
-void FlexFlow::register_custom_tasks() {}
diff --git a/include/gpt_tokenizer.h b/include/flexflow/gpt_tokenizer.h
similarity index 99%
rename from include/gpt_tokenizer.h
rename to include/flexflow/gpt_tokenizer.h
index 0a2388925a..ec08435809 100644
--- a/include/gpt_tokenizer.h
+++ b/include/flexflow/gpt_tokenizer.h
@@ -31,7 +31,7 @@ struct hash_pair {
   }
 };
 
-enum tokenizer_mode { GPT2, OPT };
+enum tokenizer_mode { GPT2_TOKENIZER, OPT_TOKENIZER };
 
 class GPT_Tokenizer {
 
diff --git a/include/flexflow/tokenizers.h b/include/flexflow/tokenizers.h
index ffce2d423e..8f6c309aad 100644
--- a/include/flexflow/tokenizers.h
+++ b/include/flexflow/tokenizers.h
@@ -67,7 +67,7 @@ class OptTokenizer : public Tokenizer {
 public:
   OptTokenizer(std::string const &vocab_file,  // path to "gpt2-vocab.json"
                std::string const &merges_file) // path to "gpt2-merges.txt"
-      : tokenizer(OPT, vocab_file, merges_file) {
+      : tokenizer(OPT_TOKENIZER, vocab_file, merges_file) {
     bos_token_id = 0;
     eos_token_id = 2;
   }
diff --git a/inference/.gitignore b/inference/.gitignore
new file mode 100644
index 0000000000..93699cdd9f
--- /dev/null
+++ b/inference/.gitignore
@@ -0,0 +1,3 @@
+weights
+tokenizer
+prompt
\ No newline at end of file
diff --git a/inference/spec_infer/MODEL_WEIGHTS.md b/inference/MODEL_WEIGHTS.md
similarity index 89%
rename from inference/spec_infer/MODEL_WEIGHTS.md
rename to inference/MODEL_WEIGHTS.md
index 79a194b159..e46e6b45d1 100644
--- a/inference/spec_infer/MODEL_WEIGHTS.md
+++ b/inference/MODEL_WEIGHTS.md
@@ -1,6 +1,7 @@
 To convert the weights of a HuggingFace LLM to SpecInfer's weight format, we first load the model and modify the tensor names to match SpecInfer's convention, and then convert these tensors to numpy arrays to store them in binary files.
 
 ```python
+from transformers import AutoModelForCausalLM
 model = AutoModelForCausalLM.from_pretrained("decapoda-research/llama-7b-hf")
 
 for name, params in model.named_parameters():
@@ -22,6 +23,6 @@ for name, params in model.named_parameters():
         .replace("lm_head", "output")
         .replace("model_", "")
     )
-    params.detach().cpu().numpy().tofile('weights/' + name)
+    params.detach().cpu().numpy().tofile('weights/llama_7B_weights/' + name)
 ```
 
diff --git a/inference/file_loader.cc b/inference/file_loader.cc
index e21b39fcaf..250a030c4a 100644
--- a/inference/file_loader.cc
+++ b/inference/file_loader.cc
@@ -84,6 +84,7 @@ void load_attention_bias(float *ptr,
 
   for (auto file : bias_files) {
     size_t partial_size = hidden_dim;
+    // std::cout << "Loading filename: " << file << std::endl;
     std::ifstream in(file, std::ios::in | std::ios::binary);
     assert(in.good() && "incorrect bias file path");
     std::vector<float> host_array(partial_size);
@@ -148,6 +149,10 @@ void load_attention_weights(float *ptr,
     size_t partial_size = one_weight_file_size;
 
     std::ifstream in(file, std::ios::in | std::ios::binary);
+    // std::cout << "Loading filename: " << file << std::endl;
+    if (!in.good()) {
+      std::cout << "Could not open file: " << file << std::endl;
+    }
     assert(in.good() && "incorrect weight file path");
     std::vector<float> host_array(partial_size);
     size_t loaded_data_size = sizeof(float) * partial_size;
@@ -179,7 +184,11 @@ void load_attention_weights(float *ptr,
 }
 
 void load_from_file(float *ptr, size_t size, std::string filename) {
+  // std::cout << "Loading filename: " << filename << std::endl;
   std::ifstream in(filename, std::ios::in | std::ios::binary);
+  if (!in.good()) {
+    std::cout << "Could not open file: " << filename << std::endl;
+  }
   assert(in.good() && "incorrect weight file path");
   std::vector<float> host_array(size);
   size_t loaded_data_size = sizeof(float) * size;
diff --git a/examples/cpp/inference/LLAMA/CMakeLists.txt b/inference/incr_decoding/CMakeLists.txt
similarity index 76%
rename from examples/cpp/inference/LLAMA/CMakeLists.txt
rename to inference/incr_decoding/CMakeLists.txt
index b31e04b0a5..761a710d71 100644
--- a/examples/cpp/inference/LLAMA/CMakeLists.txt
+++ b/inference/incr_decoding/CMakeLists.txt
@@ -1,14 +1,15 @@
 cmake_minimum_required(VERSION 3.10)
 
-project(FlexFlowExample_LLAMA)
-set(project_target LLAMA)
+project(FlexFlow_IncrDecoding)
+set(project_target incr_decoding)
 
 
 set(CPU_SRC
   ${FLEXFLOW_CPP_DRV_SRC}
-  llama.cc
-  ${CMAKE_SOURCE_DIR}/inference/file_loader.cc
-  ${CMAKE_SOURCE_DIR}/inference/models/llama.cc)
+  incr_decoding.cc
+  ../file_loader.cc
+  ../models/llama.cc
+  ../models/opt.cc)
 
 cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
 target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
diff --git a/examples/cpp/inference/llama_spec_pipeline/Makefile b/inference/incr_decoding/Makefile
similarity index 100%
rename from examples/cpp/inference/llama_spec_pipeline/Makefile
rename to inference/incr_decoding/Makefile
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
new file mode 100644
index 0000000000..fb6269c568
--- /dev/null
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -0,0 +1,187 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/inference.h"
+#include "flexflow/tokenizers.h"
+#include "models/llama.h"
+#include "models/opt.h"
+#include <filesystem>
+#include <nlohmann/json.hpp>
+
+using namespace Legion;
+
+LegionRuntime::Logger::Category log_app("llama");
+
+struct FilePaths {
+  std::string llm_weight_file_path;
+  std::string llm_config_file_path;
+  std::string prompt_file_path;
+  std::string tokenizer_file_path;
+};
+
+enum ModelType { UNKNOWN, LLAMA, OPT };
+
+void parse_input_args(char **argv,
+                      int argc,
+                      FilePaths &paths,
+                      ModelType &llm_model_type) {
+  for (int i = 1; i < argc; i++) {
+    // llm model type
+    if (!strcmp(argv[i], "-llm-model")) {
+      std::string model_type_str = std::string(argv[++i]);
+      std::transform(model_type_str.begin(),
+                     model_type_str.end(),
+                     model_type_str.begin(),
+                     [](unsigned char c) { return std::tolower(c); });
+      if (model_type_str == "llama") {
+        llm_model_type = ModelType::LLAMA;
+      } else if (model_type_str == "opt") {
+        llm_model_type = ModelType::OPT;
+      } else {
+        llm_model_type = ModelType::UNKNOWN;
+      }
+      continue;
+    }
+    // llm model weights
+    if (!strcmp(argv[i], "-llm-weight")) {
+      paths.llm_weight_file_path = std::string(argv[++i]);
+      continue;
+    }
+    // llm model configs
+    if (!strcmp(argv[i], "-llm-config")) {
+      paths.llm_config_file_path = std::string(argv[++i]);
+      continue;
+    }
+    // prompts
+    if (!strcmp(argv[i], "-prompt")) {
+      paths.prompt_file_path = std::string(argv[++i]);
+      continue;
+    }
+    // tokenizer
+    if (!strcmp(argv[i], "-tokenizer")) {
+      paths.tokenizer_file_path = std::string(argv[++i]);
+      continue;
+    }
+  }
+}
+
+void FlexFlow::top_level_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  FFConfig ffconfig;
+  FilePaths file_paths;
+  ModelType model_type;
+
+  InputArgs const &command_args = HighLevelRuntime::get_input_args();
+  char **argv = command_args.argv;
+  int argc = command_args.argc;
+  parse_input_args(argv, argc, file_paths, model_type);
+
+  assert(model_type != ModelType::UNKNOWN &&
+         "Invalid LLM model type passed (or no type was passed).");
+
+  // Create SentencePiece tokenizer or OPT tokenizer
+  SentencePieceTokenizer *sp_tokenizer = nullptr;
+  OptTokenizer *opt_tokenizer = nullptr;
+  if (model_type == ModelType::LLAMA) {
+    sp_tokenizer = new SentencePieceTokenizer(file_paths.tokenizer_file_path);
+  } else {
+    std::string tokenizer_folder =
+        (!file_paths.tokenizer_file_path.empty() &&
+         file_paths.tokenizer_file_path.back() != '/')
+            ? file_paths.tokenizer_file_path + '/'
+            : file_paths.tokenizer_file_path;
+    std::string vocab_file = tokenizer_folder + "gpt2-vocab.json";
+    std::string merges_file = tokenizer_folder + "gpt2-merges.txt";
+    std::filesystem::path path1(vocab_file);
+    std::filesystem::path path2(merges_file);
+    assert(std::filesystem::exists(path1) &&
+           "Vocab file gpt2-vocab.json does not exist at the specified path");
+    assert(std::filesystem::exists(path2) &&
+           "Merge file gpt2-merges.txt does not exist at the specified path");
+    opt_tokenizer = new OptTokenizer(vocab_file, merges_file);
+  }
+
+  InferenceManager im(ffconfig, BatchConfig::MAX_NUM_TOKENS, 1);
+  RequestManager rm((model_type == ModelType::LLAMA)
+                        ? (Tokenizer *)sp_tokenizer
+                        : (Tokenizer *)opt_tokenizer);
+  int total_num_requests = 0;
+  {
+    using json = nlohmann::json;
+    std::ifstream file_handle(file_paths.prompt_file_path);
+    assert(file_handle.good() && "Prompt file does not exist.");
+    json prompt_json = json::parse(file_handle,
+                                   /*parser_callback_t */ nullptr,
+                                   /*allow_exceptions */ true,
+                                   /*ignore_comments */ true);
+    for (auto &prompt : prompt_json) {
+      std::string text = prompt.get<std::string>();
+      printf("Prompt[%d]: %s\n", total_num_requests, text.c_str());
+      total_num_requests++;
+      rm.register_new_request(text, 128 /*max_sequence_length*/);
+    }
+  }
+
+  FFModel model(ffconfig);
+  if (model_type == ModelType::LLAMA) {
+    LLAMA::create_llama_model(model,
+                              im,
+                              file_paths.llm_config_file_path,
+                              file_paths.llm_weight_file_path,
+                              ffconfig.workersPerNode * ffconfig.numNodes,
+                              INC_DECODING_MODE);
+  } else {
+    assert(model_type == ModelType::OPT);
+    OPT::create_opt_model(model,
+                          im,
+                          file_paths.llm_config_file_path,
+                          file_paths.llm_weight_file_path,
+                          ffconfig.workersPerNode * ffconfig.numNodes,
+                          INC_DECODING_MODE);
+  }
+
+  BatchConfig bc;
+  InferenceResult ir;
+  while (rm.get_num_processed_requests() < total_num_requests) {
+    bc = rm.prepare_next_batch(bc, ir);
+    if (rm.get_num_processed_requests() >= total_num_requests) {
+      break;
+    }
+    FutureMap fm = im.inference(&model, 0, bc);
+    assert(fm.get_future_map_domain().get_volume() == 1);
+    Future future = fm.get_future(0);
+    ir = future.get_result<InferenceResult>();
+  }
+
+  // Execution fence
+  {
+    Future future = runtime->issue_execution_fence(ctx);
+    future.get_void_result();
+  }
+
+  // float* data
+  std::cout << "----------inference finished--------------" << std::endl;
+
+  // free tokenizer space in memory
+  if (model_type == ModelType::LLAMA) {
+    delete sp_tokenizer;
+  } else {
+    delete opt_tokenizer;
+  }
+}
+
+void FlexFlow::register_custom_tasks() {}
diff --git a/inference/models/configs/llama_190M.json b/inference/models/configs/llama_190M.json
new file mode 100644
index 0000000000..d8d281fcf4
--- /dev/null
+++ b/inference/models/configs/llama_190M.json
@@ -0,0 +1,10 @@
+{
+    "n_layers": 12,
+    "vocab_size": 50265,
+    "n_heads": 12,
+    "dim": 768,
+    "multiple_of": 256,
+    "norm_eps": 1e-6,
+    "total_requests": 2560,
+    "incremental_mode": true
+}
diff --git a/inference/models/configs/llama_7B.json b/inference/models/configs/llama_7B.json
new file mode 100644
index 0000000000..5adfc68d90
--- /dev/null
+++ b/inference/models/configs/llama_7B.json
@@ -0,0 +1,10 @@
+{
+    "n_layers": 32,
+    "vocab_size": 32000,
+    "n_heads": 32,
+    "dim": 4096,
+    "multiple_of": 256,
+    "norm_eps": 1e-6,
+    "total_requests": 2560,
+    "incremental_mode": true
+}
diff --git a/inference/models/configs/opt_125M.json b/inference/models/configs/opt_125M.json
new file mode 100644
index 0000000000..0b9feed922
--- /dev/null
+++ b/inference/models/configs/opt_125M.json
@@ -0,0 +1,15 @@
+{
+    "vocab_size": 50272,
+    "word_embed_proj_dim": 768,
+    "hidden_size": 768,
+    "num_attention_heads": 12,
+    "max_position_embeddings": 2048,
+    "layer_norm_elementwise_affine": true,
+    "num_hidden_layers": 12,
+    "dropout": 0.1,
+    "ffn_dim": 3072,
+    "max_beam_width": 1,
+    "batchSize": 8,
+    "sentence_len": 100,
+    "max_beam_depth": 4
+}
diff --git a/inference/models/configs/opt_6B.json b/inference/models/configs/opt_6B.json
new file mode 100644
index 0000000000..cc86ce0f8f
--- /dev/null
+++ b/inference/models/configs/opt_6B.json
@@ -0,0 +1,15 @@
+{
+    "vocab_size": 50272,
+    "word_embed_proj_dim": 4096,
+    "hidden_size": 4096,
+    "num_attention_heads": 32,
+    "max_position_embeddings": 2048,
+    "layer_norm_elementwise_affine": true,
+    "num_hidden_layers": 32,
+    "dropout": 0.1,
+    "ffn_dim": 16384,
+    "max_beam_width": 1,
+    "batchSize": 8,
+    "sentence_len": 100,
+    "max_beam_depth": 4
+}
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index 4a4eca1c8a..d4b57be6e8 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -19,45 +19,14 @@ namespace FlexFlow {
 
 using namespace Legion;
 
-LLAMA::Config LLAMA::create_190m_config() {
-  Config config;
-  config.n_layers = 12;
-  config.vocab_size = 50265;
-  config.dim = 768;
-  config.n_heads = 12;
-  config.hidden_dim = 3072;
-  return config;
-}
-
-LLAMA::Config LLAMA::create_7b_config() {
-  // The default config is for llama 7b
-  Config config;
-  return config;
-}
-
-// Deprecated API
-void LLAMA::create_llama_model(FFModel &ff,
-                               InferenceManager &im,
-                               Config const &llama_config,
-                               int num_pipeline_stages,
-                               InferenceMode mode) {
-  assert(false);
-}
-
 void LLAMA::create_llama_model(FFModel &ff,
                                InferenceManager &im,
-                               std::string const &model_name,
+                               std::string const &model_config_file_path,
                                std::string const &weight_file_path,
                                int num_pipeline_stages,
                                InferenceMode mode) {
-  Config llama_config;
-  if (model_name == "190m" || model_name == "190M") {
-    llama_config = create_190m_config();
-  } else if (model_name == "7b" || model_name == "7B") {
-    llama_config = create_7b_config();
-  } else {
-    assert(false && "Invalide model_name");
-  }
+  Config llama_config(model_config_file_path);
+  llama_config.printConfig();
   //------------------------------compute machine views ------------------
   int num_devices = ff.config.workersPerNode * ff.config.numNodes;
   std::vector<MachineView> machine_views;
diff --git a/inference/models/llama.h b/inference/models/llama.h
index e99beb92ca..3233f00786 100644
--- a/inference/models/llama.h
+++ b/inference/models/llama.h
@@ -17,6 +17,9 @@
 #include "file_loader.h"
 #include "flexflow/batch_config.h"
 #include "flexflow/inference.h"
+#include <nlohmann/json.hpp>
+#include <string>
+using json = nlohmann::json;
 
 namespace FlexFlow {
 
@@ -44,28 +47,75 @@ class LLAMA {
       hidden_dim =
           multiple_of * int((hidden_dim + multiple_of - 1) / multiple_of);
     }
+
+    Config(std::string config_filepath) {
+      std::ifstream config_file(config_filepath);
+      if (config_file.is_open()) {
+        try {
+          json config_json;
+          config_file >> config_json;
+
+          n_layers = config_json["n_layers"];
+          vocab_size = config_json["vocab_size"];
+          n_heads = config_json["n_heads"];
+          dim = config_json["dim"];
+          multiple_of = config_json["multiple_of"];
+          norm_eps = config_json["norm_eps"];
+          total_requests = config_json["total_requests"];
+          incremental_mode = config_json["incremental_mode"];
+          // Override values below
+          /* max_seq_len = config_json["max_seq_len"];
+          max_num_tokens = config_json["max_num_tokens"];
+          max_beam_width = config_json["max_beam_width"];
+          max_beam_depth = config_json["max_beam_depth"];
+          hidden_dim = config_json["hidden_dim"]; */
+          max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
+          max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
+          max_beam_width = BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+          max_beam_depth = BeamSearchBatchConfig::MAX_BEAM_DEPTH;
+          hidden_dim = 4 * dim;
+          hidden_dim = int(2 * hidden_dim / 3);
+          hidden_dim =
+              multiple_of * int((hidden_dim + multiple_of - 1) / multiple_of);
+        } catch (json::exception const &e) {
+          std::cerr << "Error parsing JSON file: " << e.what() << std::endl;
+          assert(false);
+        }
+      } else {
+        std::cerr << "Error opening JSON file." << std::endl;
+        assert(false);
+      }
+    }
+
+    void printConfig() const {
+      std::cout << "LLAMA Config:" << std::endl;
+      std::cout << "n_layers: " << n_layers << std::endl;
+      std::cout << "vocab_size: " << vocab_size << std::endl;
+      std::cout << "n_heads: " << n_heads << std::endl;
+      std::cout << "dim: " << dim << std::endl;
+      std::cout << "multiple_of: " << multiple_of << std::endl;
+      std::cout << "norm_eps: " << norm_eps << std::endl;
+      std::cout << "total_requests: " << total_requests << std::endl;
+      std::cout << "incremental_mode: " << incremental_mode << std::endl;
+      std::cout << "max_seq_len: " << max_seq_len << std::endl;
+      std::cout << "max_num_tokens: " << max_num_tokens << std::endl;
+      std::cout << "max_beam_width: " << max_beam_width << std::endl;
+      std::cout << "max_beam_depth: " << max_beam_depth << std::endl;
+      std::cout << "hidden_dim: " << hidden_dim << std::endl;
+    }
+
     int n_heads, n_layers, vocab_size, dim, multiple_of, hidden_dim,
         total_requests, incremental_mode, max_seq_len, max_num_tokens,
         max_beam_width, max_beam_depth;
     float norm_eps;
-    std::string weight_file_path;
-    std::string input_path;
-    std::string tokenizer_file_path;
   };
 
   static void create_llama_model(FFModel &ff,
                                  InferenceManager &im,
-                                 std::string const &model_name,
+                                 std::string const &model_config_file_path,
                                  std::string const &weight_file_path,
                                  int num_pipeline_stages,
                                  InferenceMode mode);
-  static void create_llama_model(FFModel &ff,
-                                 InferenceManager &im,
-                                 LLAMA::Config const &llama_config,
-                                 int num_pipeline_stages,
-                                 InferenceMode mode);
-  static Config create_190m_config();
-  static Config create_7b_config();
 };
 
 }; // namespace FlexFlow
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index 52d1ed6a84..57406929fa 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -21,9 +21,12 @@ using namespace Legion;
 
 void OPT::create_opt_model(FFModel &ff,
                            InferenceManager &im,
-                           Config const &opt_config,
+                           std::string const &model_config_file_path,
+                           std::string const &weight_file_path,
                            int num_pipeline_stages,
                            InferenceMode mode) {
+  Config opt_config(model_config_file_path);
+  opt_config.printConfig();
   //------------------------------compute machine views ------------------
   int num_devices = ff.config.workersPerNode * ff.config.numNodes;
   std::vector<MachineView> machine_views;
@@ -90,7 +93,7 @@ void OPT::create_opt_model(FFModel &ff,
         residual, axes, opt_config.layer_norm_elementwise_affine, 1e-05);
     Layer *self_attn_layer_norm = ff.layers.back();
     weights_layers.emplace("layers_" + std::to_string(i) +
-                               "_self_attn_layer_norm_weight",
+                               "_attention_layer_norm_weight",
                            self_attn_layer_norm);
 
     if (i % num_transformer_layers_per_stage == 0) {
@@ -215,14 +218,14 @@ void OPT::create_opt_model(FFModel &ff,
   //------------------- compile the model --------------------------------
   std::cout << "------start compile ----------" << std::endl;
   im.compile_model_and_allocate_buffer(&ff, mapping);
-  FileDataLoader fileloader(opt_config.input_path,
-                            opt_config.weight_file_path,
+  FileDataLoader fileloader("",
+                            weight_file_path,
                             opt_config.num_attention_heads,
                             opt_config.hidden_size,
                             opt_config.hidden_size /
                                 opt_config.num_attention_heads);
   fileloader.load_weights(&ff, weights_layers);
-  std::cout << "------load wieght finished----------" << std::endl;
+  std::cout << "------finished loading weights----------" << std::endl;
   im.init_operators_inference(&ff);
 }
 
diff --git a/inference/models/opt.h b/inference/models/opt.h
index 6ffc4220e9..d336c498d9 100644
--- a/inference/models/opt.h
+++ b/inference/models/opt.h
@@ -17,6 +17,9 @@
 #include "file_loader.h"
 #include "flexflow/batch_config.h"
 #include "flexflow/inference.h"
+#include <nlohmann/json.hpp>
+#include <string>
+using json = nlohmann::json;
 
 namespace FlexFlow {
 
@@ -27,23 +30,69 @@ class OPT {
       vocab_size = 50272;
       word_embed_proj_dim = 4096;
       hidden_size = 4096;
+      num_attention_heads = 32;
       max_position_embeddings = 2048;
       layer_norm_elementwise_affine = true;
-      num_hidden_layers = 32;
       dropout = 0.1;
       ffn_dim = 16384;
+      num_hidden_layers = 32;
       max_beam_width = 1;
       batchSize = 8;
       sentence_len = 100;
       max_beam_depth = 4;
     }
+    Config(std::string config_filepath) {
+      std::ifstream config_file(config_filepath);
+      if (config_file.is_open()) {
+        try {
+          json config_json;
+          config_file >> config_json;
+
+          vocab_size = config_json["vocab_size"];
+          word_embed_proj_dim = config_json["word_embed_proj_dim"];
+          hidden_size = config_json["hidden_size"];
+          num_attention_heads = config_json["num_attention_heads"];
+          max_position_embeddings = config_json["max_position_embeddings"];
+          layer_norm_elementwise_affine =
+              config_json["layer_norm_elementwise_affine"];
+          dropout = config_json["dropout"];
+          ffn_dim = config_json["ffn_dim"];
+          num_hidden_layers = config_json["num_hidden_layers"];
+          max_beam_width = config_json["max_beam_width"];
+          batchSize = config_json["batchSize"];
+          sentence_len = config_json["sentence_len"];
+          max_beam_depth = config_json["max_beam_depth"];
+        } catch (json::exception const &e) {
+          std::cerr << "Error parsing JSON file: " << e.what() << std::endl;
+          assert(false);
+        }
+      } else {
+        std::cerr << "Error opening JSON file." << std::endl;
+        assert(false);
+      }
+    }
+    void printConfig() const {
+      std::cout << "OPT Config:" << std::endl;
+      std::cout << "vocab_size: " << vocab_size << std::endl;
+      std::cout << "word_embed_proj_dim: " << word_embed_proj_dim << std::endl;
+      std::cout << "hidden_size: " << hidden_size << std::endl;
+      std::cout << "num_attention_heads: " << num_attention_heads << std::endl;
+      std::cout << "max_position_embeddings: " << max_position_embeddings
+                << std::endl;
+      std::cout << "layer_norm_elementwise_affine: " << std::boolalpha
+                << layer_norm_elementwise_affine << std::endl;
+      std::cout << "dropout: " << dropout << std::endl;
+      std::cout << "ffn_dim: " << ffn_dim << std::endl;
+      std::cout << "num_hidden_layers: " << num_hidden_layers << std::endl;
+      std::cout << "max_beam_width: " << max_beam_width << std::endl;
+      std::cout << "batchSize: " << batchSize << std::endl;
+      std::cout << "sentence_len: " << sentence_len << std::endl;
+      std::cout << "max_beam_depth: " << max_beam_depth << std::endl;
+    }
     int vocab_size;
     int word_embed_proj_dim;
     int hidden_size;
     int num_attention_heads;
-    std::string input_path;
-    std::string weight_file_path;
-    std::string tokenizer_assets_folder;
     int max_position_embeddings;
     bool layer_norm_elementwise_affine;
     float dropout;
@@ -55,19 +104,10 @@ class OPT {
     int max_beam_depth;
   };
 
-  struct Small_Config : public Config {
-    Small_Config(void) {
-      word_embed_proj_dim = 768;
-      hidden_size = 768;
-      num_attention_heads = 12;
-      ffn_dim = 3072;
-      num_hidden_layers = 12;
-    }
-  };
-
   static void create_opt_model(FFModel &ff,
                                InferenceManager &im,
-                               Config const &opt_config,
+                               std::string const &model_config_file_path,
+                               std::string const &weight_file_path,
                                int num_pipeline_stages,
                                InferenceMode mode);
 };
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 2068da7f3e..d894b46084 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -16,6 +16,8 @@
 #include "flexflow/inference.h"
 #include "flexflow/tokenizers.h"
 #include "models/llama.h"
+#include "models/opt.h"
+#include <filesystem>
 #include <nlohmann/json.hpp>
 
 using namespace Legion;
@@ -24,24 +26,79 @@ LegionRuntime::Logger::Category log_app("llama");
 
 struct FilePaths {
   std::string llm_weight_file_path;
+  std::string llm_config_file_path;
   std::vector<std::string> ssm_weight_file_paths;
+  std::vector<std::string> ssm_config_file_paths;
   std::string prompt_file_path;
   std::string tokenizer_file_path;
 };
 
-void parse_input_args(char **argv, int argc, FilePaths &paths) {
+enum ModelType { UNKNOWN, LLAMA, OPT };
+
+struct ModelTypes {
+  ModelType llm_model_type;
+  std::vector<ModelType> ssm_model_types;
+};
+
+void parse_input_args(char **argv,
+                      int argc,
+                      FilePaths &paths,
+                      ModelTypes &model_types) {
   for (int i = 1; i < argc; i++) {
-    // weights
+    // llm model type
+    if (!strcmp(argv[i], "-llm-model")) {
+      std::string model_type_str = std::string(argv[++i]);
+      std::transform(model_type_str.begin(),
+                     model_type_str.end(),
+                     model_type_str.begin(),
+                     [](unsigned char c) { return std::tolower(c); });
+      if (model_type_str == "llama") {
+        model_types.llm_model_type = ModelType::LLAMA;
+      } else if (model_type_str == "opt") {
+        model_types.llm_model_type = ModelType::OPT;
+      } else {
+        model_types.llm_model_type = ModelType::UNKNOWN;
+      }
+      continue;
+    }
+    // llm model weights
     if (!strcmp(argv[i], "-llm-weight")) {
       paths.llm_weight_file_path = std::string(argv[++i]);
       continue;
     }
-    // weights
+    // llm model configs
+    if (!strcmp(argv[i], "-llm-config")) {
+      paths.llm_config_file_path = std::string(argv[++i]);
+      continue;
+    }
+    // ssm models types
+    if (!strcmp(argv[i], "-ssm-model")) {
+      std::string model_type_str = std::string(argv[++i]);
+      std::transform(model_type_str.begin(),
+                     model_type_str.end(),
+                     model_type_str.begin(),
+                     [](unsigned char c) { return std::tolower(c); });
+      if (model_type_str == "llama") {
+        model_types.ssm_model_types.push_back(ModelType::LLAMA);
+      } else if (model_type_str == "opt") {
+        model_types.ssm_model_types.push_back(ModelType::OPT);
+      } else {
+        model_types.ssm_model_types.push_back(ModelType::UNKNOWN);
+      }
+      continue;
+    }
+    // ssm model weights
     if (!strcmp(argv[i], "-ssm-weight")) {
       std::string file_path = std::string(argv[++i]);
       paths.ssm_weight_file_paths.push_back(file_path);
       continue;
     }
+    // ssm model configs
+    if (!strcmp(argv[i], "-ssm-config")) {
+      std::string file_path = std::string(argv[++i]);
+      paths.ssm_config_file_paths.push_back(file_path);
+      continue;
+    }
     // prompts
     if (!strcmp(argv[i], "-prompt")) {
       paths.prompt_file_path = std::string(argv[++i]);
@@ -61,14 +118,60 @@ void FlexFlow::top_level_task(Task const *task,
                               Runtime *runtime) {
   FFConfig ffconfig;
   FilePaths file_paths;
+  ModelTypes model_types;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
   char **argv = command_args.argv;
   int argc = command_args.argc;
-  parse_input_args(argv, argc, file_paths);
-  SentencePieceTokenizer tokenizer(file_paths.tokenizer_file_path);
+  parse_input_args(argv, argc, file_paths, model_types);
+  if (file_paths.ssm_weight_file_paths.size() == 0) {
+    assert(false &&
+           "SpecInfer needs at least one SSM for speculative inference");
+  }
+  if (file_paths.ssm_config_file_paths.size() !=
+      file_paths.ssm_weight_file_paths.size()) {
+    assert(false && "Number of SSM config files passed does not match number "
+                    "of SSM weights");
+  }
+  assert(model_types.llm_model_type != ModelType::UNKNOWN &&
+         "Invalid LLM model type passed (or no type was passed).");
+  if (model_types.ssm_model_types.size() !=
+      file_paths.ssm_weight_file_paths.size()) {
+    assert(false && "Number of valid SSM model types passed does not match "
+                    "number of SSM weights");
+  }
+  for (auto mt : model_types.ssm_model_types) {
+    if (mt == ModelType::UNKNOWN) {
+      assert(false && "One of the SSM model types passed is invalid.");
+    }
+  }
+
+  // Create SentencePiece tokenizer or OPT tokenizer
+  SentencePieceTokenizer *sp_tokenizer = nullptr;
+  OptTokenizer *opt_tokenizer = nullptr;
+  if (model_types.llm_model_type == ModelType::LLAMA) {
+    sp_tokenizer = new SentencePieceTokenizer(file_paths.tokenizer_file_path);
+  } else {
+    std::string tokenizer_folder =
+        (!file_paths.tokenizer_file_path.empty() &&
+         file_paths.tokenizer_file_path.back() != '/')
+            ? file_paths.tokenizer_file_path + '/'
+            : file_paths.tokenizer_file_path;
+    std::string vocab_file = tokenizer_folder + "gpt2-vocab.json";
+    std::string merges_file = tokenizer_folder + "gpt2-merges.txt";
+    std::filesystem::path path1(vocab_file);
+    std::filesystem::path path2(merges_file);
+    assert(std::filesystem::exists(path1) &&
+           "Vocab file gpt2-vocab.json does not exist at the specified path");
+    assert(std::filesystem::exists(path2) &&
+           "Merge file gpt2-merges.txt does not exist at the specified path");
+    opt_tokenizer = new OptTokenizer(vocab_file, merges_file);
+  }
+
   InferenceManager im(ffconfig, BatchConfig::MAX_NUM_TOKENS, 1);
-  RequestManager rm(&tokenizer);
+  RequestManager rm((model_types.llm_model_type == ModelType::LLAMA)
+                        ? (Tokenizer *)sp_tokenizer
+                        : (Tokenizer *)opt_tokenizer);
   int total_num_requests = 0;
   {
     using json = nlohmann::json;
@@ -85,25 +188,39 @@ void FlexFlow::top_level_task(Task const *task,
       rm.register_new_request(text, 128 /*max_sequence_length*/);
     }
   }
-  if (file_paths.ssm_weight_file_paths.size() == 0) {
-    assert(false &&
-           "SpecInfer needs at least one SSM for speculative inference");
-  }
 
   FFModel beam_model(ffconfig);
   FFModel tree_model(ffconfig);
-  LLAMA::create_llama_model(beam_model,
-                            im,
-                            "190m",
-                            file_paths.ssm_weight_file_paths[0],
-                            1,
-                            BEAM_SEARCH_MODE);
-  LLAMA::create_llama_model(tree_model,
-                            im,
-                            "7b",
-                            file_paths.llm_weight_file_path,
-                            ffconfig.workersPerNode * ffconfig.numNodes,
-                            TREE_VERIFY_MODE);
+  if (model_types.ssm_model_types[0] == ModelType::LLAMA) {
+    LLAMA::create_llama_model(beam_model,
+                              im,
+                              file_paths.ssm_config_file_paths[0],
+                              file_paths.ssm_weight_file_paths[0],
+                              1,
+                              BEAM_SEARCH_MODE);
+  } else {
+    OPT::create_opt_model(beam_model,
+                          im,
+                          file_paths.ssm_config_file_paths[0],
+                          file_paths.ssm_weight_file_paths[0],
+                          1,
+                          BEAM_SEARCH_MODE);
+  }
+  if (model_types.llm_model_type == ModelType::LLAMA) {
+    LLAMA::create_llama_model(tree_model,
+                              im,
+                              file_paths.llm_config_file_path,
+                              file_paths.llm_weight_file_path,
+                              ffconfig.workersPerNode * ffconfig.numNodes,
+                              TREE_VERIFY_MODE);
+  } else {
+    OPT::create_opt_model(tree_model,
+                          im,
+                          file_paths.llm_config_file_path,
+                          file_paths.llm_weight_file_path,
+                          ffconfig.workersPerNode * ffconfig.numNodes,
+                          TREE_VERIFY_MODE);
+  }
 
   TreeVerifyBatchConfig tree_bc;
   BeamSearchBatchConfig beam_bc;
@@ -146,6 +263,13 @@ void FlexFlow::top_level_task(Task const *task,
 
   // float* data
   std::cout << "----------inference finished--------------" << std::endl;
+
+  // free tokenizer space in memory
+  if (model_types.llm_model_type == ModelType::LLAMA) {
+    delete sp_tokenizer;
+  } else {
+    delete opt_tokenizer;
+  }
 }
 
 void FlexFlow::register_custom_tasks() {}
diff --git a/inference/utils/download_llama_weights.py b/inference/utils/download_llama_weights.py
new file mode 100644
index 0000000000..fa40125f00
--- /dev/null
+++ b/inference/utils/download_llama_weights.py
@@ -0,0 +1,49 @@
+#!/usr/bin/env python
+
+import os
+import requests
+from transformers import AutoModelForCausalLM
+
+# Change working dir to folder storing this script
+abspath = os.path.abspath(__file__)
+dname = os.path.dirname(abspath)
+os.chdir(dname)
+
+def convert_hf_model(model, dst_folder):
+    os.makedirs(dst_folder, exist_ok=True)
+    for name, params in model.named_parameters():
+        name = (
+            name.replace(".", "_")
+            .replace("self_attn", "attention")
+            .replace("q_proj", "wq")
+            .replace("k_proj", "wk")
+            .replace("v_proj", "wv")
+            .replace("o_proj", "wo")
+            .replace("mlp", "feed_forward")
+            .replace("gate_proj", "w1")
+            .replace("down_proj", "w2")
+            .replace("up_proj", "w3")
+            .replace("input_layernorm", "attention_norm")
+            .replace("post_attention_layernorm", "ffn_norm")
+            .replace("embed_tokens", "tok_embeddings")
+            .replace("lm_head", "output")
+            .replace("model_", "")
+        )
+        params.detach().cpu().numpy().tofile(f"{dst_folder}/{name}")
+
+# Download and convert big model weights
+model = AutoModelForCausalLM.from_pretrained("decapoda-research/llama-7b-hf")
+dst_folder="../weights/llama_7B_weights"
+convert_hf_model(model, dst_folder)
+
+# Download and convert small model weights
+model = AutoModelForCausalLM.from_pretrained("Bingsu/llama-190m-arch")
+dst_folder="../weights/llama_190M_weights"
+convert_hf_model(model, dst_folder)
+
+# Download tokenizer
+os.makedirs("../tokenizer", exist_ok=True)
+tokenizer_filepath = '../tokenizer/tokenizer.model'
+url = 'https://specinfer.s3.us-east-2.amazonaws.com/tokenizer/tokenizer.model'
+r = requests.get(url)
+open(tokenizer_filepath , 'wb').write(r.content)
diff --git a/inference/utils/download_opt_weights.py b/inference/utils/download_opt_weights.py
new file mode 100644
index 0000000000..ceade81e65
--- /dev/null
+++ b/inference/utils/download_opt_weights.py
@@ -0,0 +1,46 @@
+#!/usr/bin/env python
+
+import os
+import requests
+from transformers import AutoModelForCausalLM
+
+# Change working dir to folder storing this script
+abspath = os.path.abspath(__file__)
+dname = os.path.dirname(abspath)
+os.chdir(dname)
+
+def convert_hf_model(model, dst_folder):
+    os.makedirs(dst_folder, exist_ok=True)
+    for name, params in model.named_parameters():
+        name = (
+            name.replace(".", "_")
+            .replace("decoder_", "")
+            .replace("model_", "")
+            .replace("self_attn", "attention")
+            .replace("q_proj", "wq")
+            .replace("k_proj", "wk")
+            .replace("v_proj", "wv")
+            .replace("out_proj", "wo")
+        )
+        params.detach().cpu().numpy().tofile(f"{dst_folder}/{name}")
+
+# Download and convert big model weights
+model = AutoModelForCausalLM.from_pretrained("facebook/opt-6.7b")
+dst_folder="../weights/opt_6B_weights"
+convert_hf_model(model, dst_folder)
+
+# Download and convert small model weights
+model = AutoModelForCausalLM.from_pretrained("facebook/opt-125m")
+dst_folder="../weights/opt_125M_weights"
+convert_hf_model(model, dst_folder)
+
+# Download tokenizer files
+os.makedirs("../tokenizer", exist_ok=True)
+tokenizer_filepath = '../tokenizer/gpt2-vocab.json'
+url = 'https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-vocab.json'
+r = requests.get(url)
+open(tokenizer_filepath , 'wb').write(r.content)
+tokenizer_filepath = '../tokenizer/gpt2-merges.txt'
+url = 'https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-merges.txt'
+r = requests.get(url)
+open(tokenizer_filepath , 'wb').write(r.content)
diff --git a/src/runtime/gpt_tokenizer.cc b/src/runtime/gpt_tokenizer.cc
index b011ad470a..56fdd05b3b 100644
--- a/src/runtime/gpt_tokenizer.cc
+++ b/src/runtime/gpt_tokenizer.cc
@@ -3,7 +3,7 @@
 // SPDX-License-Identifier: MIT
 // Copyright (c) 2019-2020 zili wang <wzlnot@gmail.com>.
 
-#include "gpt_tokenizer.h"
+#include <flexflow/gpt_tokenizer.h>
 
 using json = nlohmann::json;
 
@@ -277,7 +277,7 @@ void GPT_Tokenizer::encode(std::string str,
     input_ids->push_back(vocab[pad_token]);
     mask_ids->push_back(0);
   }
-  if (mode == OPT) {
+  if (mode == OPT_TOKENIZER) {
     mask_ids->insert(mask_ids->begin(), 1);
     input_ids->insert(input_ids->begin(), 2);
   }
@@ -290,9 +290,10 @@ std::string GPT_Tokenizer::decode(std::vector<int32_t> input_ids,
   int index = 0;
   for (auto const &id : input_ids) {
     if (index == 0) {
-      if (mode == OPT) {
-        assert(id == 2);
-        index++;
+      if (mode == OPT_TOKENIZER) {
+        if (id == 2) {
+          index++;
+        }
         continue;
       }
     }
diff --git a/tests/.gitignore b/tests/.gitignore
new file mode 100644
index 0000000000..e69de29bb2
diff --git a/tests/gpt_tokenizer.cpp b/tests/gpt_tokenizer.cpp
index 8ddfa75e1c..eb8ea069af 100644
--- a/tests/gpt_tokenizer.cpp
+++ b/tests/gpt_tokenizer.cpp
@@ -13,7 +13,7 @@
  * limitations under the License.
  */
 
-#include "gpt_tokenizer.h"
+#include <flexflow/gpt_tokenizer.h>
 
 #include <string>
 
@@ -22,11 +22,12 @@ int main(int argc, char *argv[]) {
     fprintf(stderr, "Usage: %s <gpt-2|opt>\n", argv[0]);
     return 1;
   }
-  tokenizer_mode mode = strcmp(argv[1], "gpt-2") == 0 ? GPT2 : OPT;
-  std::string vocab_file =
-      mode == GPT2 ? "./gpt2_bpe/vocab.bpe" : "opt_bpe/vocab.bpe";
-  std::string merge_file =
-      mode == GPT2 ? "./gpt2_bpe/encoder.json" : "opt_bpe/encoder.json";
+  tokenizer_mode mode =
+      strcmp(argv[1], "gpt-2") == 0 ? GPT2_TOKENIZER : OPT_TOKENIZER;
+  std::string vocab_file = mode == GPT2_TOKENIZER ? "./gpt2_bpe/vocab.bpe"
+                                                  : "opt_bpe/gpt2-merges.txt";
+  std::string merge_file = mode == GPT2_TOKENIZER ? "./gpt2_bpe/encoder.json"
+                                                  : "opt_bpe/gpt2-vocab.json";
 
   GPT_Tokenizer tokenizer(mode, merge_file, vocab_file);
 
@@ -37,7 +38,7 @@ int main(int argc, char *argv[]) {
     std::cout << "Error opening input file" << std::endl;
     return -1;
   }
-  std::ofstream outfile(mode == GPT2
+  std::ofstream outfile(mode == GPT2_TOKENIZER
                             ? "./wikitext-103-raw/wiki.valid.bpe.flexflow.gpt2"
                             : "./wikitext-103-raw/wiki.valid.bpe.flexflow.opt",
                         std::ofstream::out);
diff --git a/tests/gpt_tokenizer_test.sh b/tests/gpt_tokenizer_test.sh
index 6134d4e592..de6d018372 100755
--- a/tests/gpt_tokenizer_test.sh
+++ b/tests/gpt_tokenizer_test.sh
@@ -69,8 +69,8 @@ diff ./wikitext-103-raw/wiki.valid.bpe.flexflow.gpt2 ./wikitext-103-raw/wiki.val
 
 # Download OPT vocab and merge files
 mkdir -p opt_bpe
-wget -O opt_bpe/encoder.json https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-vocab.json
-wget -O opt_bpe/vocab.bpe https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-merges.txt
+wget -O opt_bpe/gpt2-vocab.json https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-vocab.json
+wget -O opt_bpe/gpt2-merges.txt https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-merges.txt
 
 # Run the FlexFlow C++ tokenizer (OPT)
 ./gpt_tokenizer opt
diff --git a/tests/inference_tests.sh b/tests/inference_tests.sh
new file mode 100755
index 0000000000..5e7b746e49
--- /dev/null
+++ b/tests/inference_tests.sh
@@ -0,0 +1,55 @@
+#! /usr/bin/env bash
+set -x
+set -e
+
+cleanup() {
+    rm -rf ../inference/prompt ../inference/weights ../inference/tokenizer
+}
+
+copy_embedding_weights(){
+    cp ../inference/weights/opt_6B_weights/embed_tokens_weight ../inference/weights/opt_6B_weights/embed_tokens_weight_lm_head
+    cp ../inference/weights/opt_125M_weights/embed_tokens_weight ../inference/weights/opt_125M_weights/embed_tokens_weight_lm_head
+}
+
+# Cd into directory holding this script
+cd "${BASH_SOURCE[0]%/*}"
+
+# Clean up before test (just in case)
+cleanup
+
+# Update the transformers library to support the LLAMA model
+pip3 install --upgrade transformers
+
+# Download the weights
+python3 ../inference/utils/download_llama_weights.py
+python3 ../inference/utils/download_opt_weights.py
+
+# because huggingface reuse a weight in embedding and final linear
+copy_embedding_weights
+
+# Create test prompt file
+mkdir -p ../inference/prompt
+echo '["Give three tips for staying healthy."]' > ../inference/prompt/test.json
+
+###############################################################################################
+############################ Speculative inference tests ######################################
+###############################################################################################
+
+# LLAMA
+../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../inference/weights/llama_190M_weights/ -ssm-config ../inference/models/configs/llama_190M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json
+
+# OPT
+../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../inference/weights/opt_125M_weights/ -ssm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json
+
+###############################################################################################
+############################ Incremental decoding tests #######################################
+###############################################################################################
+
+# LLAMA
+../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json
+
+# OPT
+../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json
+
+# Clean up after test
+cleanup

From 28b31cde755d7161ca38733e6af71fb9e874e4a4 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Wed, 24 May 2023 22:00:20 -0500
Subject: [PATCH 140/344] Merging duplicate functions in IncMHA, SpecIncMHA,
 and TreeIncNHA (#736)

* making TreeIncMultiHeadSelfAttentionMeta a subclass of IncMultiHeadSelfAttentionMeta

* make BeamSearchIncMultiHeadAttentionMeta a subclass of IncMultiHeadAttentionMeta

* format

* merging kernel functions

* merge more functions

* merge compute_qkv_kernel

* format

* fix config

---------

Co-authored-by: xinhaoc <chengxh_98@163.com>
---
 include/flexflow/batch_config.h               |  12 +-
 .../ops/inc_multihead_self_attention.h        |  20 +
 .../inc_multihead_self_attention_kernels.h    |  60 +++
 .../ops/spec_inc_multihead_self_attention.h   |  38 +-
 .../ops/tree_inc_multihead_self_attention.h   |  26 +-
 inference/models/configs/llama_190M.json      |   1 +
 inference/models/configs/llama_7B.json        |   1 +
 inference/models/llama.h                      |  12 +-
 src/ops/inc_multihead_self_attention.cpp      |  27 +
 src/ops/inc_multihead_self_attention.cu       | 106 +++-
 src/ops/spec_inc_multihead_self_attention.cpp |  21 +-
 src/ops/spec_inc_multihead_self_attention.cu  | 472 +++---------------
 src/ops/tree_inc_multihead_self_attention.cpp |  22 +-
 src/ops/tree_inc_multihead_self_attention.cu  | 428 ++--------------
 src/runtime/batch_config.cc                   |   2 +-
 src/runtime/beam_search_batch_config.cc       |   2 +-
 src/runtime/request_manager.cc                |   7 +-
 src/runtime/tree_verify_batch_config.cc       |   2 +-
 18 files changed, 361 insertions(+), 898 deletions(-)
 create mode 100644 include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 6e7f0cb6fd..391b514de6 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -15,6 +15,7 @@
 
 #pragma once
 
+#include "flexflow/ffconst.h"
 #include <cstddef>
 #include <cstdlib>
 
@@ -30,11 +31,6 @@ class BeamInferenceResult;
 
 class BatchConfig {
 public:
-  enum Mode {
-    INC_DECODING_MODE = 0,
-    BEAM_SEARCH_MODE = 1,
-    TREE_VERIFY_MODE = 2
-  };
   using RequestGuid = size_t;
   using TokenId = int;
   BatchConfig();
@@ -47,7 +43,7 @@ class BatchConfig {
   int num_active_requests() const;
   int num_active_tokens() const;
   void print() const;
-  virtual Mode get_mode() const;
+  virtual InferenceMode get_mode() const;
   static int const MAX_NUM_REQUESTS = 1;
   static int const MAX_NUM_TOKENS = 64;
   static int const MAX_SEQ_LENGTH = 256;
@@ -77,7 +73,7 @@ class TreeVerifyBatchConfig : public BatchConfig {
 public:
   TreeVerifyBatchConfig();
   ~TreeVerifyBatchConfig();
-  Mode get_mode() const;
+  InferenceMode get_mode() const;
   // struct PerTokenInfo : BatchConfig::PerTokenInfo {
   //   int tree_branch_idx;
   // };
@@ -102,7 +98,7 @@ class BeamSearchBatchConfig : public BatchConfig {
 public:
   BeamSearchBatchConfig();
   BeamSearchBatchConfig(size_t beam_width, size_t target_iterations);
-  Mode get_mode() const;
+  InferenceMode get_mode() const;
 
   ~BeamSearchBatchConfig();
 
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index 6b29feac67..a118e62f0b 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -124,6 +124,26 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
                                 Legion::Memory gpu_mem,
                                 int num_samples,
                                 int _num_heads);
+  IncMultiHeadSelfAttentionMeta(FFHandler handler,
+                                InferenceMode infer_mode,
+                                Op const *attn,
+                                int _qSize,
+                                int _kSize,
+                                int _vSize,
+                                int _qProjSize,
+                                int _kProjSize,
+                                int _vProjSize,
+                                int _oProjSize,
+                                bool _apply_rotary_embedding,
+                                bool _bias,
+                                bool _scaling_query,
+                                bool _qk_prod_scaling,
+                                bool _add_bias_kv,
+                                float _scaling_factor,
+                                float const *weight_ptr,
+                                Legion::Memory gpu_mem,
+                                int num_samples,
+                                int _num_heads);
   ~IncMultiHeadSelfAttentionMeta(void);
 
 public:
diff --git a/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h b/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
new file mode 100644
index 0000000000..3cbaebe618
--- /dev/null
+++ b/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
@@ -0,0 +1,60 @@
+#ifndef _FLEXFLOW_OPS_KERNELS_INC_MULTIHEAD_SELF_ATTENTION_KERNELS_H
+#define _FLEXFLOW_OPS_KERNELS_INC_MULTIHEAD_SELF_ATTENTION_KERNELS_H
+
+#include "flexflow/batch_config.h"
+#include "flexflow/device.h"
+#include "flexflow/fftype.h"
+#include "flexflow/op_meta.h"
+#include "flexflow/ops/inc_multihead_self_attention.h"
+
+namespace FlexFlow {
+namespace Kernels {
+namespace IncMultiHeadAttention {
+
+__global__ void build_w_out_tensor(float const *weight_ptr,
+                                   float *contiguous_weight_ptr,
+                                   int vProjSize,
+                                   int oProjSize,
+                                   int num_heads,
+                                   int qkv_weight_block_size);
+
+__global__ void apply_proj_bias_w(float *input_ptr,
+                                  float const *bias_ptr,
+                                  int num_tokens,
+                                  int oProjSize);
+
+__global__ void apply_proj_bias_qkv(float *input_ptr,
+                                    float const *bias_ptr,
+                                    int num_tokens,
+                                    int qProjSize,
+                                    int kProjSize,
+                                    int vProjSize,
+                                    int num_heads,
+                                    bool scaling_query,
+                                    float scaling_factor);
+
+__global__ void
+    apply_rotary_embedding(float *input_ptr,
+                           cuFloatComplex *complex_input,
+                           BatchConfig::PerTokenInfo const *tokenInfos,
+                           int qProjSize,
+                           int kProjSize,
+                           int num_heads,
+                           int num_tokens,
+                           int q_block_size,
+                           int k_block_size,
+                           int v_block_size,
+                           bool q_tensor);
+
+void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
+                        BatchConfig const *bc,
+                        float const *input_ptr,
+                        float const *weight_ptr,
+                        float *output_ptr,
+                        float const *bias_ptr,
+                        cudaStream_t stream);
+} // namespace IncMultiHeadAttention
+} // namespace Kernels
+} // namespace FlexFlow
+
+#endif // _FLEXFLOW_OPS_KERNELS_INC_MULTIHEAD_SELF_ATTENTION_KERNELS_H
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention.h b/include/flexflow/ops/spec_inc_multihead_self_attention.h
index da2825c9d2..57afb73a03 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention.h
@@ -8,6 +8,7 @@
 #include "flexflow/node.h"
 #include "flexflow/op_meta.h"
 #include "flexflow/operator.h"
+#include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ops/spec_inc_multihead_self_attention_params.h"
 #include "math.h"
 #include <cfloat>
@@ -120,7 +121,7 @@ class SpecIncMultiHeadSelfAttention : public Op {
   int qoSeqLength, kvSeqLength;
 };
 
-class SpecIncMultiHeadSelfAttentionMeta : public OpMeta {
+class SpecIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
 public:
   SpecIncMultiHeadSelfAttentionMeta(FFHandler handler,
                                     SpecIncMultiHeadSelfAttention const *attn,
@@ -131,37 +132,10 @@ class SpecIncMultiHeadSelfAttentionMeta : public OpMeta {
   ~SpecIncMultiHeadSelfAttentionMeta(void);
 
 public:
-  Realm::RegionInstance reserveInst;
-  size_t weights_params, weightSize, reserveSpaceSize;
-  int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
-  int num_heads;
-  bool *has_load_weights;
-  bool *apply_rotary_embedding;
-  bool *bias;
-  bool *scaling_query;
-  bool *qk_prod_scaling;
-  float scaling_factor;
-#ifdef INFERENCE_TESTS
-  float *kcache, *vcache;
-#endif
-  /*#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
-    cudnnAttnDescriptor_t attnDesc;
-    cudnnSeqDataDescriptor_t qDesc, kDesc, vDesc, oDesc;
-  #endif*/
-  // int *devQoSeqArray, *devKvSeqArray, *loWinIdx, *hiWinIdx, *kvCache;
-  float *devQKVProjArray, *keyCache, *valueCache;
-  float *qk_prods, *qk_prods_softmax;
-  float *attn_heads, *W_out_contiguous;
-#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
-  cuFloatComplex *complex_input;
-#endif
-  // void *reserveSpace;
-
-  // BatchConfig::token_idxs *dev_token2ids;
-  BatchConfig::PerTokenInfo *tokenInfos;
-  BatchConfig::PerRequestInfo *requestInfos;
-  BeamSearchBatchConfig::BeamSearchPerTokenInfo *beamTokenInfos;
-  BeamSearchBatchConfig::BeamSearchPerRequestInfo *beamRequestInfos;
+  Realm::RegionInstance beam_search_reserve_inst;
+  BatchConfig::PerRequestInfo *request_infos;
+  BeamSearchBatchConfig::BeamSearchPerTokenInfo *beam_token_infos;
+  BeamSearchBatchConfig::BeamSearchPerRequestInfo *beam_request_infos;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention.h b/include/flexflow/ops/tree_inc_multihead_self_attention.h
index b1b265e6d6..58775bf40d 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention.h
@@ -8,7 +8,7 @@
 #include "flexflow/node.h"
 #include "flexflow/op_meta.h"
 #include "flexflow/operator.h"
-#include "flexflow/ops/inc_multihead_self_attention_params.h"
+#include "flexflow/ops/inc_multihead_self_attention.h"
 #include "math.h"
 #include <cfloat>
 #include <complex>
@@ -116,7 +116,7 @@ class TreeIncMultiHeadSelfAttention : public Op {
   int qoSeqLength, kvSeqLength;
 };
 
-class TreeIncMultiHeadSelfAttentionMeta : public OpMeta {
+class TreeIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
 public:
   TreeIncMultiHeadSelfAttentionMeta(FFHandler handler,
                                     TreeIncMultiHeadSelfAttention const *attn,
@@ -127,28 +127,8 @@ class TreeIncMultiHeadSelfAttentionMeta : public OpMeta {
   ~TreeIncMultiHeadSelfAttentionMeta(void);
 
 public:
-  Realm::RegionInstance reserveInst;
-  size_t weights_params, weightSize, reserveSpaceSize;
-  int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
-  int num_heads;
   int num_active_tokens;
-  bool *has_load_weights;
-  bool *apply_rotary_embedding;
-  bool *bias;
-  bool *scaling_query;
-  bool *qk_prod_scaling;
-  float scaling_factor;
-#ifdef INFERENCE_TESTS
-  float *kcache, *vcache;
-#endif
-  float *devQKVProjArray, *keyCache, *valueCache;
-  float *qk_prods, *qk_prods_softmax;
-  float *attn_heads, *W_out_contiguous;
-#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
-  cuFloatComplex *complex_input;
-#endif
-
-  TreeVerifyBatchConfig::PerTokenInfo *token_infos;
+  Realm::RegionInstance committed_token_reserve_inst;
   TreeVerifyBatchConfig::CommittedTokensInfo *committed_token_infos;
 };
 
diff --git a/inference/models/configs/llama_190M.json b/inference/models/configs/llama_190M.json
index d8d281fcf4..b0bd90cb82 100644
--- a/inference/models/configs/llama_190M.json
+++ b/inference/models/configs/llama_190M.json
@@ -6,5 +6,6 @@
     "multiple_of": 256,
     "norm_eps": 1e-6,
     "total_requests": 2560,
+    "hidden_dim": 3072,
     "incremental_mode": true
 }
diff --git a/inference/models/configs/llama_7B.json b/inference/models/configs/llama_7B.json
index 5adfc68d90..0c32ed320d 100644
--- a/inference/models/configs/llama_7B.json
+++ b/inference/models/configs/llama_7B.json
@@ -6,5 +6,6 @@
     "multiple_of": 256,
     "norm_eps": 1e-6,
     "total_requests": 2560,
+    "hidden_dim": 11008,
     "incremental_mode": true
 }
diff --git a/inference/models/llama.h b/inference/models/llama.h
index 3233f00786..dba68af678 100644
--- a/inference/models/llama.h
+++ b/inference/models/llama.h
@@ -36,16 +36,11 @@ class LLAMA {
       norm_eps = 1e-6;
       total_requests = 2560;
       incremental_mode = true;
+      hidden_dim = 11008;
       max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
       max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
       max_beam_width = BeamSearchBatchConfig::MAX_BEAM_WIDTH;
       max_beam_depth = BeamSearchBatchConfig::MAX_BEAM_DEPTH;
-
-      // hidden dim
-      hidden_dim = 4 * dim;
-      hidden_dim = int(2 * hidden_dim / 3);
-      hidden_dim =
-          multiple_of * int((hidden_dim + multiple_of - 1) / multiple_of);
     }
 
     Config(std::string config_filepath) {
@@ -63,6 +58,7 @@ class LLAMA {
           norm_eps = config_json["norm_eps"];
           total_requests = config_json["total_requests"];
           incremental_mode = config_json["incremental_mode"];
+          hidden_dim = config_json["hidden_dim"];
           // Override values below
           /* max_seq_len = config_json["max_seq_len"];
           max_num_tokens = config_json["max_num_tokens"];
@@ -73,10 +69,6 @@ class LLAMA {
           max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
           max_beam_width = BeamSearchBatchConfig::MAX_BEAM_WIDTH;
           max_beam_depth = BeamSearchBatchConfig::MAX_BEAM_DEPTH;
-          hidden_dim = 4 * dim;
-          hidden_dim = int(2 * hidden_dim / 3);
-          hidden_dim =
-              multiple_of * int((hidden_dim + multiple_of - 1) / multiple_of);
         } catch (json::exception const &e) {
           std::cerr << "Error parsing JSON file: " << e.what() << std::endl;
           assert(false);
diff --git a/src/ops/inc_multihead_self_attention.cpp b/src/ops/inc_multihead_self_attention.cpp
index c56e73a266..0669b347a7 100644
--- a/src/ops/inc_multihead_self_attention.cpp
+++ b/src/ops/inc_multihead_self_attention.cpp
@@ -70,6 +70,33 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   checkCUDNN(miopenSetStream(handler.dnn, stream));
 }
 
+IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
+    FFHandler handler,
+    InferenceMode infer_mode,
+    Op const *attn,
+    int _qSize,
+    int _kSize,
+    int _vSize,
+    int _qProjSize,
+    int _kProjSize,
+    int _vProjSize,
+    int _oProjSize,
+    bool _apply_rotary_embedding,
+    bool _bias,
+    bool _scaling_query,
+    bool _qk_prod_scaling,
+    bool _add_bias_kv,
+    float _scaling_factor,
+    float const *weight_ptr,
+    Memory gpu_mem,
+    int num_samples,
+    int _num_heads)
+    : OpMeta(handler, attn) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  checkCUDNN(miopenSetStream(handler.dnn, stream));
+}
+
 IncMultiHeadSelfAttentionMeta::~IncMultiHeadSelfAttentionMeta(void) {}
 
 }; // namespace FlexFlow
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 099e54305c..bc4c91aa4f 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -16,6 +16,7 @@
 #include "cuComplex.h"
 #endif
 #include "flexflow/ops/inc_multihead_self_attention.h"
+#include "flexflow/ops/kernels/inc_multihead_self_attention_kernels.h"
 #include "flexflow/utils/cuda_helper.h"
 
 namespace FlexFlow {
@@ -24,6 +25,9 @@ namespace FlexFlow {
 using Legion::coord_t;
 using Legion::Memory;
 
+namespace Kernels {
+namespace IncMultiHeadAttention {
+
 __global__ void build_w_out_tensor(float const *weight_ptr,
                                    float *contiguous_weight_ptr,
                                    int vProjSize,
@@ -301,6 +305,11 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
   }
 }
 
+} // namespace IncMultiHeadAttention
+} // namespace Kernels
+
+using namespace Kernels::IncMultiHeadAttention;
+
 __global__ void store_kv_cache(float const *devQKVProjArray,
                                float *cache_ptr,
                                BatchConfig::PerTokenInfo const *tokenInfos,
@@ -683,22 +692,64 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     Memory gpu_mem,
     int num_samples,
     int _num_heads)
+    : IncMultiHeadSelfAttentionMeta(handler,
+                                    INC_DECODING_MODE,
+                                    attn,
+                                    attn->qSize,
+                                    attn->kSize,
+                                    attn->vSize,
+                                    attn->qProjSize,
+                                    attn->kProjSize,
+                                    attn->vProjSize,
+                                    attn->oProjSize,
+                                    attn->apply_rotary_embedding,
+                                    attn->bias,
+                                    attn->scaling_query,
+                                    attn->qk_prod_scaling,
+                                    attn->add_bias_kv,
+                                    attn->scaling_factor,
+                                    weight_ptr,
+                                    gpu_mem,
+                                    num_samples,
+                                    _num_heads) {}
+
+IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
+    FFHandler handler,
+    InferenceMode infer_mode,
+    Op const *attn,
+    int _qSize,
+    int _kSize,
+    int _vSize,
+    int _qProjSize,
+    int _kProjSize,
+    int _vProjSize,
+    int _oProjSize,
+    bool _apply_rotary_embedding,
+    bool _bias,
+    bool _scaling_query,
+    bool _qk_prod_scaling,
+    bool _add_bias_kv,
+    float _scaling_factor,
+    float const *weight_ptr,
+    Memory gpu_mem,
+    int num_samples,
+    int _num_heads)
     : OpMeta(handler, attn) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDNN(cudnnSetStream(handler.dnn, stream));
 
-  qSize = attn->qSize;
-  kSize = attn->kSize;
-  vSize = attn->vSize;
+  qSize = _qSize;
+  kSize = _kSize;
+  vSize = _vSize;
   // assume dimensions match for now
   assert(qSize == kSize);
   assert(kSize == vSize);
-  qProjSize = attn->qProjSize;
-  kProjSize = attn->kProjSize;
+  qProjSize = _qProjSize;
+  kProjSize = _kProjSize;
   assert(qProjSize == kProjSize); // required for attention QK^T matmul
-  vProjSize = attn->vProjSize;
-  oProjSize = attn->oProjSize;
+  vProjSize = _vProjSize;
+  oProjSize = _oProjSize;
 
   num_heads = _num_heads;
   weights_params = (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize +
@@ -707,16 +758,16 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   has_load_weights = (bool *)calloc(1, sizeof(bool));
   *has_load_weights = false;
   apply_rotary_embedding = (bool *)calloc(1, sizeof(bool));
-  *apply_rotary_embedding = attn->apply_rotary_embedding;
+  *apply_rotary_embedding = _apply_rotary_embedding;
   bias = (bool *)calloc(1, sizeof(bool));
-  *bias = attn->bias;
+  *bias = _bias;
   scaling_query = (bool *)calloc(1, sizeof(bool));
-  *scaling_query = attn->scaling_query;
-  scaling_factor = attn->scaling_factor;
+  *scaling_query = _scaling_query;
+  scaling_factor = _scaling_factor;
   qk_prod_scaling = (bool *)calloc(1, sizeof(bool));
-  *qk_prod_scaling = attn->qk_prod_scaling;
+  *qk_prod_scaling = _qk_prod_scaling;
   // Currently do not support adding bias to key/value projection
-  assert(!attn->add_bias_kv);
+  assert(!_add_bias_kv);
 
 #ifdef INFERENCE_TESTS
   kcache = (float *)calloc(kProjSize * BatchConfig::MAX_SEQ_LENGTH * num_heads *
@@ -732,12 +783,29 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     size_t qkv_proj_dim = qProjSize + kProjSize + vProjSize;
     size_t qkv_max_proj_size =
         BatchConfig::MAX_NUM_TOKENS * qkv_proj_dim * num_heads;
-    size_t key_cache_size = num_heads * kProjSize *
-                            BatchConfig::MAX_NUM_REQUESTS *
-                            BatchConfig::MAX_SEQ_LENGTH;
-    size_t value_cache_size = num_heads * vProjSize *
-                              BatchConfig::MAX_NUM_REQUESTS *
-                              BatchConfig::MAX_SEQ_LENGTH;
+    size_t key_cache_size = 0, value_cache_size = 0;
+    switch (infer_mode) {
+      case INC_DECODING_MODE:
+      case TREE_VERIFY_MODE: {
+        key_cache_size = num_heads * kProjSize * BatchConfig::MAX_NUM_REQUESTS *
+                         BatchConfig::MAX_SEQ_LENGTH;
+        value_cache_size = num_heads * vProjSize *
+                           BatchConfig::MAX_NUM_REQUESTS *
+                           BatchConfig::MAX_SEQ_LENGTH;
+        break;
+      }
+      case BEAM_SEARCH_MODE: {
+        key_cache_size =
+            num_heads * kProjSize * BeamSearchBatchConfig::MAX_NUM_REQUESTS *
+            BatchConfig::MAX_SEQ_LENGTH * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+        value_cache_size =
+            num_heads * vProjSize * BeamSearchBatchConfig::MAX_NUM_REQUESTS *
+            BatchConfig::MAX_SEQ_LENGTH * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+        break;
+      }
+      default:
+        assert(false && "Unkown inference mode");
+    }
     size_t tokeninfo_size = BatchConfig::MAX_NUM_TOKENS;
     size_t qk_prod_size =
         BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_SEQ_LENGTH * num_heads;
diff --git a/src/ops/spec_inc_multihead_self_attention.cpp b/src/ops/spec_inc_multihead_self_attention.cpp
index 765891ed53..b898d472a8 100644
--- a/src/ops/spec_inc_multihead_self_attention.cpp
+++ b/src/ops/spec_inc_multihead_self_attention.cpp
@@ -64,7 +64,26 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
     Memory gpu_mem,
     int num_samples,
     int _num_heads)
-    : OpMeta(handler, attn) {
+    : IncMultiHeadSelfAttentionMeta(handler,
+                                    BEAM_SEARCH_MODE,
+                                    attn,
+                                    attn->qSize,
+                                    attn->kSize,
+                                    attn->vSize,
+                                    attn->qProjSize,
+                                    attn->kProjSize,
+                                    attn->vProjSize,
+                                    attn->oProjSize,
+                                    attn->apply_rotary_embedding,
+                                    attn->bias,
+                                    attn->scaling_query,
+                                    attn->qk_prod_scaling,
+                                    attn->add_bias_kv,
+                                    attn->scaling_factor,
+                                    weight_ptr,
+                                    gpu_mem,
+                                    num_samples,
+                                    _num_heads) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDNN(miopenSetStream(handler.dnn, stream));
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index ad4e59b710..f12d48ab1d 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -15,6 +15,7 @@
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
 #include "cuComplex.h"
 #endif
+#include "flexflow/ops/kernels/inc_multihead_self_attention_kernels.h"
 #include "flexflow/ops/spec_inc_multihead_self_attention.h"
 #include "flexflow/utils/cuda_helper.h"
 
@@ -23,286 +24,7 @@ namespace FlexFlow {
 // declare Legion names
 using Legion::coord_t;
 using Legion::Memory;
-
-__global__ void spec_build_w_out_tensor(float const *weight_ptr,
-                                        float *contiguous_weight_ptr,
-                                        int vProjSize,
-                                        int oProjSize,
-                                        int num_heads,
-                                        int qkv_weight_block_size) {
-  CUDA_KERNEL_LOOP(i, vProjSize * oProjSize * num_heads) {
-    int row_idx = i % vProjSize;
-    int col_idx = (i / vProjSize) % oProjSize;
-    int head_idx = i / (vProjSize * oProjSize);
-    contiguous_weight_ptr[i] =
-        weight_ptr[head_idx * (qkv_weight_block_size + vProjSize * oProjSize) +
-                   qkv_weight_block_size + col_idx * vProjSize + row_idx];
-  }
-}
-
-__global__ void spec_apply_proj_bias_w(float *input_ptr,
-                                       float const *bias_ptr,
-                                       int num_tokens,
-                                       int oProjSize) {
-  CUDA_KERNEL_LOOP(i, num_tokens * oProjSize) {
-    int bias_idx = 3 * oProjSize + i % oProjSize;
-    input_ptr[i] += bias_ptr[bias_idx];
-  }
-}
-
-__global__ void spec_apply_proj_bias_qkv(float *input_ptr,
-                                         float const *bias_ptr,
-                                         int num_tokens,
-                                         int qProjSize,
-                                         int kProjSize,
-                                         int vProjSize,
-                                         int num_heads,
-                                         bool scaling_query,
-                                         float scaling_factor) {
-  CUDA_KERNEL_LOOP(
-      i, num_tokens * (qProjSize + kProjSize + vProjSize) * num_heads) {
-    // for simplicity, assume q, k, v is in same shape
-    // 0->q, 1->k, 2->v
-    int qkv_index = i / (num_tokens * qProjSize) % 3;
-
-    int head_idx = i / (num_tokens * (qProjSize + kProjSize + vProjSize));
-    int qkv_block_size = (qProjSize + kProjSize + vProjSize) * num_tokens;
-    int q_block_size = qProjSize * num_tokens;
-
-    int idx = i % (num_tokens * (qProjSize));
-
-    int real_part_index =
-        head_idx * qkv_block_size + qkv_index * q_block_size + idx;
-    int bias_idx = qkv_index * qProjSize * num_heads + head_idx * qProjSize +
-                   (idx % qProjSize);
-    input_ptr[real_part_index] += bias_ptr[bias_idx];
-
-    if (scaling_query && qkv_index == 0) {
-      input_ptr[real_part_index] *= scaling_factor;
-    }
-  }
-}
-
-__global__ void
-    spec_apply_rotary_embedding(float *input_ptr,
-                                cuFloatComplex *complex_input,
-                                BatchConfig::PerTokenInfo *tokenInfos,
-                                int qProjSize,
-                                int kProjSize,
-                                int num_heads,
-                                int num_tokens,
-                                int q_block_size,
-                                int k_block_size,
-                                int v_block_size,
-                                bool q_tensor) {
-  int proj_size = q_tensor ? qProjSize : kProjSize;
-  CUDA_KERNEL_LOOP(i, num_tokens * proj_size * num_heads / 2) {
-    // create complex number
-    int head_idx = i / (num_tokens * proj_size / 2);
-    int idx = i % (num_tokens * proj_size / 2);
-    int token_idx =
-        (i - head_idx * (num_tokens * proj_size / 2)) / (proj_size / 2);
-
-    int real_part_index =
-        idx + token_idx * (proj_size / 2) +
-        head_idx * (q_block_size + k_block_size + v_block_size) +
-        (q_tensor ? 0 : q_block_size);
-    int complex_part_index = real_part_index + (proj_size / 2);
-
-    complex_input[i] = {input_ptr[real_part_index],
-                        input_ptr[complex_part_index]};
-
-    // get the freq_cis: shape 1 * (qProjSize/2) = 1 * 64
-    // apply a Cartesian coordinate transformation
-    // multiple with input & /copy back to q/k
-
-    // get position of token
-    //  int head_idx = i / (num_tokens * proj_size);
-
-    // size_t pos = id_map[token_idx].token_position;
-    size_t pos = tokenInfos[token_idx].abs_depth_in_request;
-
-    // float before_real = complex_input[i].x, before_complex =
-    // complex_input[i].y;
-
-    int pos_i = i % (proj_size / 2);
-    float freq = pos * (1.0 / pow(10000.0, (float)2 * pos_i / proj_size));
-    cuFloatComplex complex_pos = {cos(freq), sin(freq)};
-
-    complex_input[i] = cuCmulf(complex_input[i], complex_pos);
-
-    input_ptr[real_part_index] = complex_input[i].x;
-    input_ptr[complex_part_index] = complex_input[i].y;
-  }
-}
-
-void compute_qkv_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
-                        BeamSearchBatchConfig const *bc,
-                        float const *input_ptr,
-                        float const *weight_ptr,
-                        float *output_ptr,
-                        float const *bias_ptr,
-                        cudaStream_t stream) {
-
-  checkCUDA(cublasSetStream(m->handle.blas, stream));
-  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
-  float alpha = 1.0f, beta = 0.0f;
-  assert(m->qSize == m->vSize && m->qSize == m->kSize);
-  cudaDataType_t data_type = ff_to_cuda_datatype(DT_FLOAT);
-#if CUDA_VERSION >= 11000
-  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
-  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
-#else
-  cudaDataType_t compute_type = CUDA_R_32F;
-#endif
-  // Compute (W^T)x matmul: einsum(ijkl,im->jmkl)
-  // Weights: qSize x qProjSize x 3 x num_heads
-  // Input: qSize x num_tokens
-  // Output >>> qProjSize x num_tokens x 3 x num_heads
-  int m_q = m->qProjSize;
-  int m_k = m->kProjSize;
-  int m_v = m->vProjSize;
-  assert(m_q == m_k && m_k == m_v); // keep things simple for now
-  int n = bc->num_active_tokens();
-  int k = m->qSize;
-  int lda = k, ldb = k, ldc_q = m_q, ldc_k = m_k, ldc_v = m_v;
-  size_t strideA =
-      m->weights_params; // need to also skip over all the parameters for each
-                         // head, plus the unused W_o weights
-  size_t strideB = 0;    // input stays the same for all heads.
-  size_t strideC =
-      (m_q + m_k + m_v) * n; // size of the output block for each head.
-  // Q
-  checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                       CUBLAS_OP_T,
-                                       CUBLAS_OP_N,
-                                       m_q,
-                                       n,
-                                       k,
-                                       &alpha,
-                                       weight_ptr,
-                                       data_type,
-                                       lda,
-                                       strideA,
-                                       input_ptr,
-                                       data_type,
-                                       ldb,
-                                       strideB,
-                                       &beta,
-                                       output_ptr,
-                                       data_type,
-                                       ldc_q,
-                                       strideC,
-                                       m->num_heads,
-                                       compute_type,
-                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-
-  checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                       CUBLAS_OP_T,
-                                       CUBLAS_OP_N,
-                                       m_k,
-                                       n,
-                                       k,
-                                       &alpha,
-                                       weight_ptr + m_q * k,
-                                       data_type,
-                                       lda,
-                                       strideA,
-                                       input_ptr,
-                                       data_type,
-                                       ldb,
-                                       strideB,
-                                       &beta,
-                                       output_ptr + m_q * n,
-                                       data_type,
-                                       ldc_k,
-                                       strideC,
-                                       m->num_heads,
-                                       compute_type,
-                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-  // V
-  checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                       CUBLAS_OP_T,
-                                       CUBLAS_OP_N,
-                                       m_v,
-                                       n,
-                                       k,
-                                       &alpha,
-                                       weight_ptr + (m_q + m_k) * k,
-                                       data_type,
-                                       lda,
-                                       strideA,
-                                       input_ptr,
-                                       data_type,
-                                       ldb,
-                                       strideB,
-                                       &beta,
-                                       output_ptr + (m_q + m_k) * n,
-                                       data_type,
-                                       ldc_v,
-                                       strideC,
-                                       m->num_heads,
-                                       compute_type,
-                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-
-  // apply rotary emmmbedding for k and v
-  // step1 change the k, v to complex tensor
-  int num_tokens = bc->num_active_tokens();
-
-  int parallelism = m->kProjSize * num_tokens * m->num_heads;
-  int q_block_size = m->qProjSize * num_tokens;
-  int k_block_size = m->kProjSize * num_tokens;
-  int v_block_size = m->vProjSize * num_tokens;
-  // apply bias for q, k, v
-  if (*m->bias) {
-    spec_apply_proj_bias_qkv<<<GET_BLOCKS(parallelism),
-                               min(CUDA_NUM_THREADS, parallelism),
-                               0,
-                               stream>>>(output_ptr,
-                                         bias_ptr,
-                                         num_tokens,
-                                         m->qProjSize,
-                                         m->kProjSize,
-                                         m->vProjSize,
-                                         m->num_heads,
-                                         *m->scaling_query,
-                                         m->scaling_factor);
-  }
-
-  if (*m->apply_rotary_embedding) {
-    /*q*/
-    spec_apply_rotary_embedding<<<GET_BLOCKS(parallelism),
-                                  min(CUDA_NUM_THREADS, parallelism),
-                                  0,
-                                  stream>>>(output_ptr,
-                                            m->complex_input,
-                                            m->tokenInfos,
-                                            m->qProjSize,
-                                            m->kProjSize,
-                                            m->num_heads,
-                                            num_tokens,
-                                            q_block_size,
-                                            k_block_size,
-                                            v_block_size,
-                                            true);
-    /*k*/
-    spec_apply_rotary_embedding<<<GET_BLOCKS(parallelism),
-                                  min(CUDA_NUM_THREADS, parallelism),
-                                  0,
-                                  stream>>>(output_ptr,
-                                            m->complex_input,
-                                            m->tokenInfos,
-                                            m->qProjSize,
-                                            m->kProjSize,
-                                            m->num_heads,
-                                            num_tokens,
-                                            q_block_size,
-                                            k_block_size,
-                                            v_block_size,
-                                            false);
-  }
-  checkCUDA(cudaDeviceSynchronize());
-}
+using namespace Kernels::IncMultiHeadAttention;
 
 __global__ void spec_store_kv_cache(
     float const *devQKVProjArray,
@@ -445,10 +167,10 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                           0,
                           stream>>>(m->devQKVProjArray,
                                     m->keyCache,
-                                    m->tokenInfos,
-                                    m->requestInfos,
-                                    m->beamTokenInfos,
-                                    m->beamRequestInfos,
+                                    m->token_infos,
+                                    m->request_infos,
+                                    m->beam_token_infos,
+                                    m->beam_request_infos,
                                     m->qProjSize,
                                     m->kProjSize,
                                     m->vProjSize,
@@ -465,10 +187,10 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                           0,
                           stream>>>(m->devQKVProjArray,
                                     m->valueCache,
-                                    m->tokenInfos,
-                                    m->requestInfos,
-                                    m->beamTokenInfos,
-                                    m->beamRequestInfos,
+                                    m->token_infos,
+                                    m->request_infos,
+                                    m->beam_token_infos,
+                                    m->beam_request_infos,
                                     m->qProjSize,
                                     m->kProjSize,
                                     m->vProjSize,
@@ -719,10 +441,10 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
     }
     if (*m->bias) {
       int parallelism = m->oProjSize * num_tokens;
-      spec_apply_proj_bias_w<<<GET_BLOCKS(parallelism),
-                               min(CUDA_NUM_THREADS, parallelism),
-                               0,
-                               stream>>>(
+      apply_proj_bias_w<<<GET_BLOCKS(parallelism),
+                          min(CUDA_NUM_THREADS, parallelism),
+                          0,
+                          stream>>>(
           output_ptr, bias_ptr, num_tokens, m->oProjSize);
     }
   }
@@ -752,38 +474,38 @@ void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
 
   if (!(*m->has_load_weights)) {
     int parallelism = m->vProjSize * m->oProjSize * m->num_heads;
-    spec_build_w_out_tensor<<<GET_BLOCKS(parallelism),
-                              min(CUDA_NUM_THREADS, parallelism),
-                              0,
-                              stream>>>(weight_ptr,
-                                        m->W_out_contiguous,
-                                        m->vProjSize,
-                                        m->oProjSize,
-                                        m->num_heads,
-                                        (m->qSize * m->qProjSize +
-                                         m->kSize * m->kProjSize +
-                                         m->vSize * m->vProjSize));
+    build_w_out_tensor<<<GET_BLOCKS(parallelism),
+                         min(CUDA_NUM_THREADS, parallelism),
+                         0,
+                         stream>>>(weight_ptr,
+                                   m->W_out_contiguous,
+                                   m->vProjSize,
+                                   m->oProjSize,
+                                   m->num_heads,
+                                   (m->qSize * m->qProjSize +
+                                    m->kSize * m->kProjSize +
+                                    m->vSize * m->vProjSize));
     *m->has_load_weights = true;
   }
 
   // here because we need postion info in infernece 1
-  cudaMemcpyAsync(m->tokenInfos,
+  cudaMemcpyAsync(m->token_infos,
                   &(bc->tokensInfo),
                   bc->MAX_NUM_TOKENS * sizeof(BatchConfig::PerTokenInfo),
                   cudaMemcpyHostToDevice,
                   stream);
-  cudaMemcpyAsync(m->requestInfos,
+  cudaMemcpyAsync(m->request_infos,
                   &(bc->requestsInfo),
                   bc->MAX_NUM_REQUESTS * sizeof(BatchConfig::PerRequestInfo),
                   cudaMemcpyHostToDevice,
                   stream);
-  cudaMemcpyAsync(m->beamTokenInfos,
+  cudaMemcpyAsync(m->beam_token_infos,
                   &(bc->beamTokenInfo),
                   bc->MAX_NUM_TOKENS * bc->MAX_BEAM_WIDTH *
                       sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo),
                   cudaMemcpyHostToDevice,
                   stream);
-  cudaMemcpyAsync(m->beamRequestInfos,
+  cudaMemcpyAsync(m->beam_request_infos,
                   &(bc->beamRequestsInfo),
                   bc->MAX_NUM_REQUESTS *
                       sizeof(BeamSearchBatchConfig::BeamSearchPerRequestInfo),
@@ -820,86 +542,37 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
     Memory gpu_mem,
     int num_samples,
     int _num_heads)
-    : OpMeta(handler, attn) {
+    : IncMultiHeadSelfAttentionMeta(handler,
+                                    BEAM_SEARCH_MODE,
+                                    attn,
+                                    attn->qSize,
+                                    attn->kSize,
+                                    attn->vSize,
+                                    attn->qProjSize,
+                                    attn->kProjSize,
+                                    attn->vProjSize,
+                                    attn->oProjSize,
+                                    attn->apply_rotary_embedding,
+                                    attn->bias,
+                                    attn->scaling_query,
+                                    attn->qk_prod_scaling,
+                                    attn->add_bias_kv,
+                                    attn->scaling_factor,
+                                    weight_ptr,
+                                    gpu_mem,
+                                    num_samples,
+                                    _num_heads) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDNN(cudnnSetStream(handler.dnn, stream));
 
-  qSize = attn->qSize;
-  kSize = attn->kSize;
-  vSize = attn->vSize;
-  // assume dimensions match for now
-  assert(qSize == kSize);
-  assert(kSize == vSize);
-  qProjSize = attn->qProjSize;
-  kProjSize = attn->kProjSize;
-  assert(qProjSize == kProjSize); // required for attention QK^T matmul
-  vProjSize = attn->vProjSize;
-  oProjSize = attn->oProjSize;
-
-  // print params;
-
-  num_heads = _num_heads;
-  weights_params = (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize +
-                    oProjSize * (vProjSize > 0 ? vProjSize : vSize));
-  weightSize = weights_params * num_heads * sizeof(float);
-  has_load_weights = (bool *)calloc(1, sizeof(bool));
-  *has_load_weights = false;
-  apply_rotary_embedding = (bool *)calloc(1, sizeof(bool));
-  *apply_rotary_embedding = attn->apply_rotary_embedding;
-  bias = (bool *)calloc(1, sizeof(bool));
-  *bias = attn->bias;
-  scaling_query = (bool *)calloc(1, sizeof(bool));
-  *scaling_query = attn->scaling_query;
-  scaling_factor = attn->scaling_factor;
-  qk_prod_scaling = (bool *)calloc(1, sizeof(bool));
-  *qk_prod_scaling = attn->qk_prod_scaling;
-  // Currently do not support adding bias to key/value projection
-  assert(!attn->add_bias_kv);
-
-#ifdef INFERENCE_TESTS
-  kcache = (float *)calloc(kProjSize * BatchConfig::MAX_SEQ_LENGTH * num_heads *
-                               BeamSearchBatchConfig::MAX_NUM_REQUESTS,
-                           sizeof(float));
-  vcache = (float *)calloc(vProjSize * BatchConfig::MAX_SEQ_LENGTH * num_heads *
-                               BeamSearchBatchConfig::MAX_NUM_REQUESTS,
-                           sizeof(float));
-#endif
-
   // allocate memory for the seqArray and reserve space
   {
-    size_t qkv_proj_dim = qProjSize + kProjSize + vProjSize;
-    size_t qkv_max_proj_size =
-        BeamSearchBatchConfig::MAX_NUM_TOKENS * qkv_proj_dim * num_heads;
-    size_t key_cache_size =
-        num_heads * kProjSize * BeamSearchBatchConfig::MAX_NUM_REQUESTS *
-        BatchConfig::MAX_SEQ_LENGTH * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
-    size_t value_cache_size =
-        num_heads * vProjSize * BeamSearchBatchConfig::MAX_NUM_REQUESTS *
-        BatchConfig::MAX_SEQ_LENGTH * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
-
-    // size_t token2ids_size = BatchConfig::MAX_NUM_TOKENS;
-    size_t tokeninfo_size = BeamSearchBatchConfig::MAX_NUM_TOKENS;
-
     size_t beam_tokeninfo_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
                                  BeamSearchBatchConfig::MAX_BEAM_WIDTH;
-
     size_t requestinfo_size = BeamSearchBatchConfig::MAX_NUM_REQUESTS;
     size_t beam_requestinfo_size = BeamSearchBatchConfig::MAX_NUM_REQUESTS;
-
-    size_t qk_prod_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
-                          BeamSearchBatchConfig::MAX_NUM_TOKENS * num_heads;
-    size_t attn_heads_size =
-        BeamSearchBatchConfig::MAX_NUM_TOKENS * num_heads * vProjSize;
-    size_t W_out_block_size = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
-    size_t W_out_contiguous_size = W_out_block_size * num_heads;
-    size_t complex_size =
-        (BeamSearchBatchConfig::MAX_NUM_TOKENS * qProjSize * num_heads) / 2;
     size_t totalSize =
-        (qkv_max_proj_size + key_cache_size + value_cache_size +
-         2 * qk_prod_size + attn_heads_size + W_out_contiguous_size) *
-            sizeof(float) +
-        tokeninfo_size * sizeof(BatchConfig::PerTokenInfo) +
         requestinfo_size * sizeof(BatchConfig::PerRequestInfo) +
         beam_tokeninfo_size *
             sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo) +
@@ -912,57 +585,28 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
                                    Realm::Point<1, coord_t>(totalSize - 1));
     std::vector<size_t> field_sizes;
     field_sizes.push_back(sizeof(char));
-    Realm::RegionInstance::create_instance(reserveInst,
+    Realm::RegionInstance::create_instance(beam_search_reserve_inst,
                                            gpu_mem,
                                            bounds,
                                            field_sizes,
                                            0,
                                            Realm::ProfilingRequestSet())
         .wait();
-    devQKVProjArray = (float *)reserveInst.pointer_untyped(0, sizeof(char));
-    keyCache = (float *)devQKVProjArray + qkv_max_proj_size;
-    valueCache = (float *)keyCache + key_cache_size;
-    // dev_token2ids = (BatchConfig::token_idxs *)(valueCache +
-    // value_cache_size);
-
-    tokenInfos = (BatchConfig::PerTokenInfo *)(valueCache + value_cache_size);
-    beamTokenInfos =
-        (BeamSearchBatchConfig::BeamSearchPerTokenInfo *)(tokenInfos +
-                                                          tokeninfo_size);
-    requestInfos =
-        (BatchConfig::PerRequestInfo *)(beamTokenInfos + beam_tokeninfo_size);
-    beamRequestInfos =
-        (BeamSearchBatchConfig::BeamSearchPerRequestInfo *)(requestInfos +
+    beam_token_infos =
+        (BeamSearchBatchConfig::BeamSearchPerTokenInfo *)
+            beam_search_reserve_inst.pointer_untyped(0, sizeof(char));
+    request_infos =
+        (BatchConfig::PerRequestInfo *)(beam_token_infos + beam_tokeninfo_size);
+    beam_request_infos =
+        (BeamSearchBatchConfig::BeamSearchPerRequestInfo *)(request_infos +
                                                             requestinfo_size);
-
-    qk_prods = (float *)(beamRequestInfos + beam_requestinfo_size);
-    qk_prods_softmax = (float *)(qk_prods + qk_prod_size);
-    attn_heads = (float *)qk_prods_softmax + qk_prod_size;
-    W_out_contiguous = (float *)attn_heads + attn_heads_size;
-    checkCUDA(
-        cudaMalloc(&complex_input, complex_size * sizeof(cuFloatComplex)));
-    int parallelism = vProjSize * oProjSize * num_heads;
-    spec_build_w_out_tensor<<<GET_BLOCKS(parallelism),
-                              min(CUDA_NUM_THREADS, parallelism),
-                              0,
-                              stream>>>(
-        weight_ptr,
-        W_out_contiguous,
-        vProjSize,
-        oProjSize,
-        num_heads,
-        (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize));
   }
 
   cudaStreamSynchronize(stream);
 }
 
 SpecIncMultiHeadSelfAttentionMeta::~SpecIncMultiHeadSelfAttentionMeta(void) {
-  reserveInst.destroy();
-#ifdef INFERENCE_TESTS
-  free(kcache);
-  free(vcache);
-#endif
+  beam_search_reserve_inst.destroy();
 }
 
 }; // namespace FlexFlow
diff --git a/src/ops/tree_inc_multihead_self_attention.cpp b/src/ops/tree_inc_multihead_self_attention.cpp
index 28285b72ce..aa5aaf3039 100644
--- a/src/ops/tree_inc_multihead_self_attention.cpp
+++ b/src/ops/tree_inc_multihead_self_attention.cpp
@@ -64,7 +64,27 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
     Memory gpu_mem,
     int num_samples,
     int _num_heads)
-    : OpMeta(handler, attn) {
+    : IncMultiHeadSelfAttentionMeta(handler,
+                                    TREE_VERIFY_MODE,
+                                    attn,
+                                    attn->qSize,
+                                    attn->kSize,
+                                    attn->vSize,
+                                    attn->qProjSize,
+                                    attn->kProjSize,
+                                    attn->vProjSize,
+                                    attn->oProjSize,
+                                    attn->apply_rotary_embedding,
+                                    attn->bias,
+                                    attn->scaling_query,
+                                    attn->qk_prod_scaling,
+                                    attn->add_bias_kv,
+                                    attn->scaling_factor,
+                                    weight_ptr,
+                                    gpu_mem,
+                                    num_samples,
+                                    _num_heads),
+      num_active_tokens(0) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDNN(miopenSetStream(handler.dnn, stream));
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index 0cc3cf9191..d3fc5c1fb2 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -15,6 +15,7 @@
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
 #include "cuComplex.h"
 #endif
+#include "flexflow/ops/kernels/inc_multihead_self_attention_kernels.h"
 #include "flexflow/ops/tree_inc_multihead_self_attention.h"
 #include "flexflow/utils/cuda_helper.h"
 
@@ -24,64 +25,7 @@ namespace FlexFlow {
 using Legion::coord_t;
 using Legion::Memory;
 
-__global__ void tree_build_w_out_tensor(float const *weight_ptr,
-                                        float *contiguous_weight_ptr,
-                                        int vProjSize,
-                                        int oProjSize,
-                                        int num_heads,
-                                        int qkv_weight_block_size) {
-  CUDA_KERNEL_LOOP(i, vProjSize * oProjSize * num_heads) {
-    int row_idx = i % vProjSize;
-    int col_idx = (i / vProjSize) % oProjSize;
-    int head_idx = i / (vProjSize * oProjSize);
-    contiguous_weight_ptr[i] =
-        weight_ptr[head_idx * (qkv_weight_block_size + vProjSize * oProjSize) +
-                   qkv_weight_block_size + col_idx * vProjSize + row_idx];
-  }
-}
-
-__global__ void tree_apply_proj_bias_w(float *input_ptr,
-                                       float const *bias_ptr,
-                                       int num_tokens,
-                                       int oProjSize) {
-  CUDA_KERNEL_LOOP(i, num_tokens * oProjSize) {
-    int bias_idx = 3 * oProjSize + i % oProjSize;
-    input_ptr[i] += bias_ptr[bias_idx];
-  }
-}
-
-__global__ void tree_apply_proj_bias_qkv(float *input_ptr,
-                                         float const *bias_ptr,
-                                         int num_tokens,
-                                         int qProjSize,
-                                         int kProjSize,
-                                         int vProjSize,
-                                         int num_heads,
-                                         bool scaling_query,
-                                         float scaling_factor) {
-  CUDA_KERNEL_LOOP(
-      i, num_tokens * (qProjSize + kProjSize + vProjSize) * num_heads) {
-    // for simplicity, assume q, k, v is in same shape
-    // 0->q, 1->k, 2->v
-    int qkv_index = i / (num_tokens * qProjSize) % 3;
-
-    int head_idx = i / (num_tokens * (qProjSize + kProjSize + vProjSize));
-    int qkv_block_size = (qProjSize + kProjSize + vProjSize) * num_tokens;
-    int q_block_size = qProjSize * num_tokens;
-
-    int idx = i % (num_tokens * (qProjSize));
-
-    int real_part_index =
-        head_idx * qkv_block_size + qkv_index * q_block_size + idx;
-    int bias_idx = qkv_index * qProjSize * num_heads + head_idx * qProjSize +
-                   (idx % qProjSize);
-    input_ptr[real_part_index] += bias_ptr[bias_idx];
-
-    if (scaling_query && qkv_index == 0) {
-      input_ptr[real_part_index] *= scaling_factor;
-    }
-  }
-}
+using namespace Kernels::IncMultiHeadAttention;
 
 __global__ void commit_tokens_kernel(
     float const *devQKVProjArray,
@@ -165,221 +109,6 @@ void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
   }
 }
 
-__global__ void tree_apply_rotary_embedding(
-    float *input_ptr,
-    cuFloatComplex *complex_input,
-    TreeVerifyBatchConfig::PerTokenInfo const *tokenInfos,
-    int qProjSize,
-    int kProjSize,
-    int num_heads,
-    int num_tokens,
-    int q_block_size,
-    int k_block_size,
-    int v_block_size,
-    bool q_tensor) {
-  int proj_size = q_tensor ? qProjSize : kProjSize;
-  CUDA_KERNEL_LOOP(i, num_tokens * proj_size * num_heads / 2) {
-    // create complex number
-    int head_idx = i / (num_tokens * proj_size / 2);
-    int idx = i % (num_tokens * proj_size / 2);
-    int token_idx =
-        (i - head_idx * (num_tokens * proj_size / 2)) / (proj_size / 2);
-
-    int real_part_index =
-        idx + token_idx * (proj_size / 2) +
-        head_idx * (q_block_size + k_block_size + v_block_size) +
-        (q_tensor ? 0 : q_block_size);
-    int complex_part_index = real_part_index + (proj_size / 2);
-
-    complex_input[i] = {input_ptr[real_part_index],
-                        input_ptr[complex_part_index]};
-
-    // get the freq_cis: shape 1 * (qProjSize/2) = 1 * 64
-    // apply a Cartesian coordinate transformation
-    // multiple with input & /copy back to q/k
-
-    // get position of token
-    //  int head_idx = i / (num_tokens * proj_size);
-
-    // size_t pos = id_map[token_idx].token_position;
-    size_t pos = tokenInfos[token_idx].abs_depth_in_request;
-
-    // float before_real = complex_input[i].x, before_complex =
-    // complex_input[i].y;
-
-    int pos_i = i % (proj_size / 2);
-    float freq = pos * (1.0 / pow(10000.0, (float)2 * pos_i / proj_size));
-    cuFloatComplex complex_pos = {cos(freq), sin(freq)};
-
-    complex_input[i] = cuCmulf(complex_input[i], complex_pos);
-
-    input_ptr[real_part_index] = complex_input[i].x;
-    input_ptr[complex_part_index] = complex_input[i].y;
-  }
-}
-
-void compute_qkv_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
-                        TreeVerifyBatchConfig const *bc,
-                        float const *input_ptr,
-                        float const *weight_ptr,
-                        float *output_ptr,
-                        float const *bias_ptr,
-                        cudaStream_t stream) {
-  checkCUDA(cublasSetStream(m->handle.blas, stream));
-  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
-  float alpha = 1.0f, beta = 0.0f;
-  assert(m->qSize == m->vSize && m->qSize == m->kSize);
-  cudaDataType_t data_type = ff_to_cuda_datatype(DT_FLOAT);
-#if CUDA_VERSION >= 11000
-  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
-  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
-#else
-  cudaDataType_t compute_type = CUDA_R_32F;
-#endif
-  // Compute (W^T)x matmul: einsum(ijkl,im->jmkl)
-  // Weights: qSize x qProjSize x 3 x num_heads
-  // Input: qSize x num_tokens
-  // Output >>> qProjSize x num_tokens x 3 x num_heads
-  int m_q = m->qProjSize;
-  int m_k = m->kProjSize;
-  int m_v = m->vProjSize;
-  assert(m_q == m_k && m_k == m_v); // keep things simple for now
-  int n = bc->num_active_tokens();
-  int k = m->qSize;
-  int lda = k, ldb = k, ldc_q = m_q, ldc_k = m_k, ldc_v = m_v;
-  size_t strideA =
-      m->weights_params; // need to also skip over all the parameters for each
-                         // head, plus the unused W_o weights
-  size_t strideB = 0;    // input stays the same for all heads.
-  size_t strideC =
-      (m_q + m_k + m_v) * n; // size of the output block for each head.
-  // Q
-  checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                       CUBLAS_OP_T,
-                                       CUBLAS_OP_N,
-                                       m_q,
-                                       n,
-                                       k,
-                                       &alpha,
-                                       weight_ptr,
-                                       data_type,
-                                       lda,
-                                       strideA,
-                                       input_ptr,
-                                       data_type,
-                                       ldb,
-                                       strideB,
-                                       &beta,
-                                       output_ptr,
-                                       data_type,
-                                       ldc_q,
-                                       strideC,
-                                       m->num_heads,
-                                       compute_type,
-                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-  checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                       CUBLAS_OP_T,
-                                       CUBLAS_OP_N,
-                                       m_k,
-                                       n,
-                                       k,
-                                       &alpha,
-                                       weight_ptr + m_q * k,
-                                       data_type,
-                                       lda,
-                                       strideA,
-                                       input_ptr,
-                                       data_type,
-                                       ldb,
-                                       strideB,
-                                       &beta,
-                                       output_ptr + m_q * n,
-                                       data_type,
-                                       ldc_k,
-                                       strideC,
-                                       m->num_heads,
-                                       compute_type,
-                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-  // V
-  checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                       CUBLAS_OP_T,
-                                       CUBLAS_OP_N,
-                                       m_v,
-                                       n,
-                                       k,
-                                       &alpha,
-                                       weight_ptr + (m_q + m_k) * k,
-                                       data_type,
-                                       lda,
-                                       strideA,
-                                       input_ptr,
-                                       data_type,
-                                       ldb,
-                                       strideB,
-                                       &beta,
-                                       output_ptr + (m_q + m_k) * n,
-                                       data_type,
-                                       ldc_v,
-                                       strideC,
-                                       m->num_heads,
-                                       compute_type,
-                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-  // apply rotary emmmbedding for k and v
-  // step1 change the k, v to complex tensor
-  int num_tokens = bc->num_active_tokens();
-  int parallelism = m->kProjSize * num_tokens * m->num_heads;
-  int q_block_size = m->qProjSize * num_tokens;
-  int k_block_size = m->kProjSize * num_tokens;
-  int v_block_size = m->vProjSize * num_tokens;
-  // apply bias for q, k, v
-  if (*m->bias) {
-    tree_apply_proj_bias_qkv<<<GET_BLOCKS(parallelism),
-                               min(CUDA_NUM_THREADS, parallelism),
-                               0,
-                               stream>>>(output_ptr,
-                                         bias_ptr,
-                                         num_tokens,
-                                         m->qProjSize,
-                                         m->kProjSize,
-                                         m->vProjSize,
-                                         m->num_heads,
-                                         *m->scaling_query,
-                                         m->scaling_factor);
-  }
-  if (*m->apply_rotary_embedding) {
-    /*q*/
-    tree_apply_rotary_embedding<<<GET_BLOCKS(parallelism),
-                                  min(CUDA_NUM_THREADS, parallelism),
-                                  0,
-                                  stream>>>(output_ptr,
-                                            m->complex_input,
-                                            m->token_infos,
-                                            m->qProjSize,
-                                            m->kProjSize,
-                                            m->num_heads,
-                                            num_tokens,
-                                            q_block_size,
-                                            k_block_size,
-                                            v_block_size,
-                                            true);
-    /*k*/
-    tree_apply_rotary_embedding<<<GET_BLOCKS(parallelism),
-                                  min(CUDA_NUM_THREADS, parallelism),
-                                  0,
-                                  stream>>>(output_ptr,
-                                            m->complex_input,
-                                            m->token_infos,
-                                            m->qProjSize,
-                                            m->kProjSize,
-                                            m->num_heads,
-                                            num_tokens,
-                                            q_block_size,
-                                            k_block_size,
-                                            v_block_size,
-                                            false);
-  }
-}
-
 __global__ void update_tree_branch_kv_cache(
     float const *devQKVProjArray,
     float *cache_ptr,
@@ -700,10 +429,10 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
   }
   if (*m->bias) {
     int parallelism = m->oProjSize * processed_tokens_in_batch;
-    tree_apply_proj_bias_w<<<GET_BLOCKS(parallelism),
-                             min(CUDA_NUM_THREADS, parallelism),
-                             0,
-                             stream>>>(
+    apply_proj_bias_w<<<GET_BLOCKS(parallelism),
+                        min(CUDA_NUM_THREADS, parallelism),
+                        0,
+                        stream>>>(
         output_ptr, bias_ptr, processed_tokens_in_batch, m->oProjSize);
   }
 
@@ -747,17 +476,17 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
   // reload the weight_o
   if (!(*m->has_load_weights)) {
     int parallelism = m->vProjSize * m->oProjSize * m->num_heads;
-    tree_build_w_out_tensor<<<GET_BLOCKS(parallelism),
-                              min(CUDA_NUM_THREADS, parallelism),
-                              0,
-                              stream>>>(weight_ptr,
-                                        m->W_out_contiguous,
-                                        m->vProjSize,
-                                        m->oProjSize,
-                                        m->num_heads,
-                                        (m->qSize * m->qProjSize +
-                                         m->kSize * m->kProjSize +
-                                         m->vSize * m->vProjSize));
+    build_w_out_tensor<<<GET_BLOCKS(parallelism),
+                         min(CUDA_NUM_THREADS, parallelism),
+                         0,
+                         stream>>>(weight_ptr,
+                                   m->W_out_contiguous,
+                                   m->vProjSize,
+                                   m->oProjSize,
+                                   m->num_heads,
+                                   (m->qSize * m->qProjSize +
+                                    m->kSize * m->kProjSize +
+                                    m->vSize * m->vProjSize));
     *m->has_load_weights = true;
   }
   // here because we need postion info in infernece 1
@@ -800,127 +529,58 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
     Memory gpu_mem,
     int num_samples,
     int _num_heads)
-    : OpMeta(handler, attn), num_active_tokens(0) {
+    : IncMultiHeadSelfAttentionMeta(handler,
+                                    TREE_VERIFY_MODE,
+                                    attn,
+                                    attn->qSize,
+                                    attn->kSize,
+                                    attn->vSize,
+                                    attn->qProjSize,
+                                    attn->kProjSize,
+                                    attn->vProjSize,
+                                    attn->oProjSize,
+                                    attn->apply_rotary_embedding,
+                                    attn->bias,
+                                    attn->scaling_query,
+                                    attn->qk_prod_scaling,
+                                    attn->add_bias_kv,
+                                    attn->scaling_factor,
+                                    weight_ptr,
+                                    gpu_mem,
+                                    num_samples,
+                                    _num_heads),
+      num_active_tokens(0) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDNN(cudnnSetStream(handler.dnn, stream));
 
-  qSize = attn->qSize;
-  kSize = attn->kSize;
-  vSize = attn->vSize;
-  // assume dimensions match for now
-  assert(qSize == kSize);
-  assert(kSize == vSize);
-  qProjSize = attn->qProjSize;
-  kProjSize = attn->kProjSize;
-  assert(qProjSize == kProjSize); // required for attention QK^T matmul
-  vProjSize = attn->vProjSize;
-  oProjSize = attn->oProjSize;
-
-  num_heads = _num_heads;
-  weights_params = (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize +
-                    oProjSize * (vProjSize > 0 ? vProjSize : vSize));
-  weightSize = weights_params * num_heads * sizeof(float);
-  has_load_weights = (bool *)calloc(1, sizeof(bool));
-  *has_load_weights = false;
-  apply_rotary_embedding = (bool *)calloc(1, sizeof(bool));
-  *apply_rotary_embedding = attn->apply_rotary_embedding;
-  bias = (bool *)calloc(1, sizeof(bool));
-  *bias = attn->bias;
-  scaling_query = (bool *)calloc(1, sizeof(bool));
-  *scaling_query = attn->scaling_query;
-  scaling_factor = attn->scaling_factor;
-  qk_prod_scaling = (bool *)calloc(1, sizeof(bool));
-  *qk_prod_scaling = attn->qk_prod_scaling;
-  // Currently do not support adding bias to key/value projection
-  assert(!attn->add_bias_kv);
-
-#ifdef INFERENCE_TESTS
-  kcache = (float *)calloc(kProjSize * BatchConfig::MAX_SEQ_LENGTH * num_heads *
-                               TreeVerifyBatchConfig::MAX_NUM_REQUESTS,
-                           sizeof(float));
-  vcache = (float *)calloc(vProjSize * BatchConfig::MAX_SEQ_LENGTH * num_heads *
-                               TreeVerifyBatchConfig::MAX_NUM_REQUESTS,
-                           sizeof(float));
-#endif
-
   // allocate memory for the seqArray and reserve space
   {
-    size_t qkv_proj_dim = qProjSize + kProjSize + vProjSize;
-    size_t qkv_max_proj_size =
-        TreeVerifyBatchConfig::MAX_NUM_TOKENS * qkv_proj_dim * num_heads;
     size_t committed_tokeninfo_size = TreeVerifyBatchConfig::MAX_NUM_TOKENS;
-    size_t key_cache_size = num_heads * kProjSize *
-                            TreeVerifyBatchConfig::MAX_NUM_REQUESTS *
-                            BatchConfig::MAX_SEQ_LENGTH;
-    size_t value_cache_size = num_heads * vProjSize *
-                              TreeVerifyBatchConfig::MAX_NUM_REQUESTS *
-                              BatchConfig::MAX_SEQ_LENGTH;
-    size_t tokeninfo_size = TreeVerifyBatchConfig::MAX_NUM_TOKENS;
-    size_t qk_prod_size = TreeVerifyBatchConfig::MAX_NUM_TOKENS *
-                          TreeVerifyBatchConfig::MAX_NUM_TOKENS * num_heads;
-    size_t attn_heads_size =
-        TreeVerifyBatchConfig::MAX_NUM_TOKENS * num_heads * vProjSize;
-    size_t W_out_block_size = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
-    size_t W_out_contiguous_size = W_out_block_size * num_heads;
-    size_t complex_size =
-        (TreeVerifyBatchConfig::MAX_NUM_TOKENS * qProjSize * num_heads) / 2;
-    size_t totalSize =
-        (qkv_max_proj_size + key_cache_size + value_cache_size +
-         2 * qk_prod_size + attn_heads_size + W_out_contiguous_size) *
-            sizeof(float) +
-        tokeninfo_size * sizeof(TreeVerifyBatchConfig::PerTokenInfo) +
-        committed_tokeninfo_size *
-            sizeof(TreeVerifyBatchConfig::CommittedTokensInfo) +
-        complex_size * sizeof(cuFloatComplex);
+    size_t totalSize = committed_tokeninfo_size *
+                       sizeof(TreeVerifyBatchConfig::CommittedTokensInfo);
 
     Realm::Rect<1, coord_t> bounds(Realm::Point<1, coord_t>(0),
                                    Realm::Point<1, coord_t>(totalSize - 1));
     std::vector<size_t> field_sizes;
     field_sizes.push_back(sizeof(char));
-    Realm::RegionInstance::create_instance(reserveInst,
+    Realm::RegionInstance::create_instance(committed_token_reserve_inst,
                                            gpu_mem,
                                            bounds,
                                            field_sizes,
                                            0,
                                            Realm::ProfilingRequestSet())
         .wait();
-    devQKVProjArray = (float *)reserveInst.pointer_untyped(0, sizeof(char));
     committed_token_infos =
-        (TreeVerifyBatchConfig::CommittedTokensInfo *)(devQKVProjArray +
-                                                       qkv_max_proj_size);
-    keyCache = (float *)(committed_token_infos + committed_tokeninfo_size);
-    valueCache = (float *)keyCache + key_cache_size;
-    token_infos =
-        (TreeVerifyBatchConfig::PerTokenInfo *)(valueCache + value_cache_size);
-    qk_prods = (float *)(token_infos + tokeninfo_size);
-    qk_prods_softmax = (float *)(qk_prods + qk_prod_size);
-    attn_heads = (float *)qk_prods_softmax + qk_prod_size;
-    W_out_contiguous = (float *)attn_heads + attn_heads_size;
-    checkCUDA(
-        cudaMalloc(&complex_input, complex_size * sizeof(cuFloatComplex)));
-    int parallelism = vProjSize * oProjSize * num_heads;
-    tree_build_w_out_tensor<<<GET_BLOCKS(parallelism),
-                              min(CUDA_NUM_THREADS, parallelism),
-                              0,
-                              stream>>>(
-        weight_ptr,
-        W_out_contiguous,
-        vProjSize,
-        oProjSize,
-        num_heads,
-        (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize));
+        (TreeVerifyBatchConfig::CommittedTokensInfo *)
+            committed_token_reserve_inst.pointer_untyped(0, sizeof(char));
   }
 
   cudaStreamSynchronize(stream);
 }
 
 TreeIncMultiHeadSelfAttentionMeta::~TreeIncMultiHeadSelfAttentionMeta(void) {
-  reserveInst.destroy();
-#ifdef INFERENCE_TESTS
-  free(kcache);
-  free(vcache);
-#endif
+  committed_token_reserve_inst.destroy();
 }
 
 }; // namespace FlexFlow
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index a220c94085..4d81616dc3 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -35,7 +35,7 @@ BatchConfig::BatchConfig() : num_tokens(0) {
   }
 }
 
-BatchConfig::Mode BatchConfig::get_mode() const {
+InferenceMode BatchConfig::get_mode() const {
   return INC_DECODING_MODE;
 }
 
diff --git a/src/runtime/beam_search_batch_config.cc b/src/runtime/beam_search_batch_config.cc
index 3adfb28241..8d4aeeabb0 100644
--- a/src/runtime/beam_search_batch_config.cc
+++ b/src/runtime/beam_search_batch_config.cc
@@ -41,7 +41,7 @@ BeamSearchBatchConfig::BeamSearchBatchConfig(size_t beam_width,
 
 BeamSearchBatchConfig::~BeamSearchBatchConfig() {}
 
-BatchConfig::Mode BeamSearchBatchConfig::get_mode() const {
+InferenceMode BeamSearchBatchConfig::get_mode() const {
   return BEAM_SEARCH_MODE;
 }
 
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index ac038147d1..5349ec5439 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -71,11 +71,12 @@ RequestManager::RequestGuid
   request.initial_len = request.tokens.size();
 
   pending_request_queue.push(request);
-  if (verbose) {
-    std::cout << "new req: " << request.tokens.size() << std::endl;
+  {
+    std::string output = "New request tokens:";
     for (int i = 0; i < request.tokens.size(); i++) {
-      std::cout << i << " : " << request.tokens[i] << std::endl;
+      output = output + " " + std::to_string(request.tokens[i]);
     }
+    log_req_mgr.print("%s", output.c_str());
   }
   return request.guid;
 }
diff --git a/src/runtime/tree_verify_batch_config.cc b/src/runtime/tree_verify_batch_config.cc
index e50a0e06fd..76a8025507 100644
--- a/src/runtime/tree_verify_batch_config.cc
+++ b/src/runtime/tree_verify_batch_config.cc
@@ -26,7 +26,7 @@ TreeVerifyBatchConfig::TreeVerifyBatchConfig() : BatchConfig() {}
 
 TreeVerifyBatchConfig::~TreeVerifyBatchConfig() {}
 
-BatchConfig::Mode TreeVerifyBatchConfig::get_mode() const {
+InferenceMode TreeVerifyBatchConfig::get_mode() const {
   return TREE_VERIFY_MODE;
 }
 

From b0a5b9c0a4101ed6da7622269e0e4b8f5fceaf8b Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 28 May 2023 00:09:32 +0800
Subject: [PATCH 141/344] [Inference] - Alignment fixes (#740)

* fix alignment bugs (part 1)

* add missing file
---
 .../configs/{llama_190M.json => llama_160M.json}     |  2 +-
 inference/utils/download_llama_weights.py            |  6 +++---
 tests/inference_tests.sh                             | 12 +++++++++---
 3 files changed, 13 insertions(+), 7 deletions(-)
 rename inference/models/configs/{llama_190M.json => llama_160M.json} (88%)

diff --git a/inference/models/configs/llama_190M.json b/inference/models/configs/llama_160M.json
similarity index 88%
rename from inference/models/configs/llama_190M.json
rename to inference/models/configs/llama_160M.json
index b0bd90cb82..d912c64ab7 100644
--- a/inference/models/configs/llama_190M.json
+++ b/inference/models/configs/llama_160M.json
@@ -1,6 +1,6 @@
 {
     "n_layers": 12,
-    "vocab_size": 50265,
+    "vocab_size": 32000,
     "n_heads": 12,
     "dim": 768,
     "multiple_of": 256,
diff --git a/inference/utils/download_llama_weights.py b/inference/utils/download_llama_weights.py
index fa40125f00..bbf4f349ee 100644
--- a/inference/utils/download_llama_weights.py
+++ b/inference/utils/download_llama_weights.py
@@ -37,13 +37,13 @@ def convert_hf_model(model, dst_folder):
 convert_hf_model(model, dst_folder)
 
 # Download and convert small model weights
-model = AutoModelForCausalLM.from_pretrained("Bingsu/llama-190m-arch")
-dst_folder="../weights/llama_190M_weights"
+model = AutoModelForCausalLM.from_pretrained("JackFram/llama-160m")
+dst_folder="../weights/llama_160M_weights"
 convert_hf_model(model, dst_folder)
 
 # Download tokenizer
 os.makedirs("../tokenizer", exist_ok=True)
 tokenizer_filepath = '../tokenizer/tokenizer.model'
-url = 'https://specinfer.s3.us-east-2.amazonaws.com/tokenizer/tokenizer.model'
+url = 'https://huggingface.co/JackFram/llama-160m/resolve/main/tokenizer.model'
 r = requests.get(url)
 open(tokenizer_filepath , 'wb').write(r.content)
diff --git a/tests/inference_tests.sh b/tests/inference_tests.sh
index 5e7b746e49..fa44446a3d 100755
--- a/tests/inference_tests.sh
+++ b/tests/inference_tests.sh
@@ -36,7 +36,7 @@ echo '["Give three tips for staying healthy."]' > ../inference/prompt/test.json
 ###############################################################################################
 
 # LLAMA
-../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../inference/weights/llama_190M_weights/ -ssm-config ../inference/models/configs/llama_190M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json
+../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../inference/weights/llama_160M_weights/ -ssm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json
 
 # OPT
 ../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../inference/weights/opt_125M_weights/ -ssm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json
@@ -45,10 +45,16 @@ echo '["Give three tips for staying healthy."]' > ../inference/prompt/test.json
 ############################ Incremental decoding tests #######################################
 ###############################################################################################
 
-# LLAMA
+# LLAMA (small model)
+../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_160M_weights/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json
+
+# LLAMA (big model)
 ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json
 
-# OPT
+# OPT (small model)
+../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_125M_weights/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json
+
+# OPT (big model)
 ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json
 
 # Clean up after test

From 1ab3d809e8886e1b1c0f8169e15b44ac50e79b49 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 28 May 2023 00:26:00 +0800
Subject: [PATCH 142/344] Update README.md (#741)

---
 .github/README.md | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/.github/README.md b/.github/README.md
index 940bff486d..3f22993b00 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -60,7 +60,7 @@ For example, you can use the following command line to serve a LLaMA-7B or LLaMA
 ### Tokenizers
 SpecInfer supports two tokenizers:
 
-* The SentencePiece tokenizer is used to support the LLaMA model family (e.g., LLaMA-6B, LLaMA-13B, and LLaMA-190M in our demo). We used the pretrained sentencepiece tokenizer from LLAMA, which is also available on Hugging Face (model id: `decapoda-research/llama-7b-hf`). We store the tokenizer on our S3 bucket at this link: [s3://specinfer/tokenizer/tokenizer.model](https://specinfer.s3.us-east-2.amazonaws.com/tokenizer/tokenizer.model).
+* The SentencePiece tokenizer is used to support the LLaMA model family (e.g., LLaMA-6B, LLaMA-13B, and LLaMA-190M in our demo). We used the pretrained sentencepiece tokenizer from LLAMA, which is also available on Hugging Face (model id: `decapoda-research/llama-7b-hf`). If you  are using our LLAMA-160M weights for the demo, however, you should use the tokenizer from the [JackFram/llama-160m](https://huggingface.co/JackFram/llama-160m/resolve/main/tokenizer.model) HuggingFace repo.
 * The GPT2 tokenizer is used to support the Open Pre-trained Transformer model family (e.g., OPT-13B and OPT-125M). To use it, download the [vocab](https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-vocab.json) and [merges](https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-merges.txt) files and pass the folder containing them as a parameter. 
 
 ### LLM Weights
@@ -69,7 +69,7 @@ The weight files used in our demo are extracted from HuggingFace, and stored in
 |  Model   | Model id on Hugging Face  | Storage Location |
 |  :----  | :----  | :----  |
 | LLaMA-7B | decapoda-research/llama-7b-hf | s3://specinfer/weights/llama_7B_weights.tar.gz |
-| LLaMA-190M  | Bingsu/llama-190m-arch | s3://specinfer/weights/llama_190m_weights.tar.gz |
+| LLaMA-190M  | JackFram/llama-160m | s3://specinfer/weights/llama_160M_weights.tar.gz |
 | OPT-6.7B  | facebook/opt-6.7b | s3://specinfer/weights/opt_6B_weights.tar.gz |
 | OPT-125M  | facebook/opt-125m | s3://specinfer/weights/opt_125m_native.tar.gz |
 

From 9f5bf94d1de6e14794eac794588e048cdd1f6f6d Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Tue, 30 May 2023 16:22:38 -0500
Subject: [PATCH 143/344] Supporting mixed-precision (Spec/Tree/Normal)
 Incremental MultiHead Attention (#737)

* making TreeIncMultiHeadSelfAttentionMeta a subclass of IncMultiHeadSelfAttentionMeta

* make BeamSearchIncMultiHeadAttentionMeta a subclass of IncMultiHeadAttentionMeta

---------

Co-authored-by: xinhaoc <chengxh_98@163.com>
---
 include/flexflow/ffconst_utils.h              |   4 +-
 include/flexflow/model.h                      |  19 +-
 include/flexflow/ops/arg_topk.h               |  14 +-
 include/flexflow/ops/beam_topk.h              |   9 +-
 include/flexflow/ops/element_unary.h          |   1 +
 .../ops/inc_multihead_self_attention.h        |  18 +-
 .../ops/kernels/element_binary_kernels.h      |  18 +-
 .../inc_multihead_self_attention_kernels.h    |  27 +-
 include/flexflow/ops/kernels/linear_kernels.h |   9 +-
 .../flexflow/ops/kernels/rms_norm_kernels.h   |   6 +-
 .../flexflow/ops/kernels/softmax_kernels.h    |  24 +-
 include/flexflow/ops/layer_norm.h             |  12 +-
 include/flexflow/ops/linear.h                 |   6 +-
 include/flexflow/ops/softmax.h                |   4 +-
 .../ops/spec_inc_multihead_self_attention.h   |  10 +-
 .../ops/tree_inc_multihead_self_attention.h   |  11 +-
 include/flexflow/simulator.h                  |   4 +-
 include/flexflow/utils/cuda_helper.h          |   8 +-
 include/flexflow/utils/hip_helper.h           |   3 +-
 inference/file_loader.cc                      | 129 +++---
 inference/file_loader.h                       |   5 +
 inference/models/llama.cc                     |  34 +-
 inference/models/llama.h                      |   3 +-
 inference/models/opt.cc                       |  59 ++-
 inference/models/opt.h                        |   3 +-
 inference/spec_infer/spec_infer.cc            |  22 +-
 python/flexflow_c.cc                          |  10 +-
 src/ops/arg_topk.cc                           |  42 +-
 src/ops/arg_topk.cpp                          |  81 +++-
 src/ops/arg_topk.cu                           |  81 +++-
 src/ops/attention.cc                          |   3 +
 src/ops/beam_topk.cc                          |  22 +-
 src/ops/beam_topk.cpp                         | 222 +++++------
 src/ops/beam_topk.cu                          |  79 ++--
 src/ops/element_binary.cc                     |  99 +++--
 src/ops/element_unary.cc                      |  12 +-
 src/ops/element_unary.cpp                     |  18 +-
 src/ops/element_unary.cu                      |  19 +-
 src/ops/fused.cpp                             |   9 +-
 src/ops/fused.cu                              |   9 +-
 src/ops/inc_multihead_self_attention.cc       | 119 +++---
 src/ops/inc_multihead_self_attention.cpp      |  12 +-
 src/ops/inc_multihead_self_attention.cu       | 371 ++++++++++--------
 src/ops/kernels/element_binary_kernels.cpp    |  19 +-
 src/ops/kernels/element_binary_kernels.cu     |  46 ++-
 src/ops/kernels/linear_kernels.cpp            |  89 +++--
 src/ops/kernels/linear_kernels.cu             | 127 ++++--
 src/ops/kernels/rms_norm_kernels.cu           | 100 +++--
 src/ops/kernels/softmax.cpp                   |  39 +-
 src/ops/kernels/softmax.cu                    |  43 +-
 src/ops/layer_norm.cc                         |  80 ++--
 src/ops/layer_norm.cpp                        |  97 ++---
 src/ops/layer_norm.cu                         | 168 +++++---
 src/ops/linear.cc                             | 193 +++++----
 src/ops/rms_norm.cc                           |  45 ++-
 src/ops/softmax.cc                            |  84 ++--
 src/ops/spec_inc_multihead_self_attention.cc  | 115 +++---
 src/ops/spec_inc_multihead_self_attention.cpp |  12 +-
 src/ops/spec_inc_multihead_self_attention.cu  | 218 ++++++----
 src/ops/tree_inc_multihead_self_attention.cc  | 114 +++---
 src/ops/tree_inc_multihead_self_attention.cpp |  12 +-
 src/ops/tree_inc_multihead_self_attention.cu  | 216 ++++++----
 src/runtime/accessor.cc                       |   2 +
 src/runtime/cuda_helper.cu                    |  36 +-
 src/runtime/ffconst_utils.cc                  |  20 +
 src/runtime/hip_helper.cpp                    |  19 +-
 src/runtime/parallel_tensor.cc                |   7 +
 src/runtime/simulator.cc                      |  20 +-
 src/runtime/simulator.cpp                     |   4 +-
 src/runtime/simulator.cu                      |   5 +-
 tests/align/align_create_tensor_torch.py      |   1 -
 tests/align/align_utils.py                    |   2 +-
 72 files changed, 2216 insertions(+), 1387 deletions(-)

diff --git a/include/flexflow/ffconst_utils.h b/include/flexflow/ffconst_utils.h
index fcd881e57e..e2d04ad5a5 100644
--- a/include/flexflow/ffconst_utils.h
+++ b/include/flexflow/ffconst_utils.h
@@ -8,8 +8,10 @@ namespace FlexFlow {
 
 std::string get_operator_type_name(OperatorType type);
 
+size_t data_type_size(DataType type);
+
 std::ostream &operator<<(std::ostream &, OperatorType);
 
 }; // namespace FlexFlow
 
-#endif // _FLEXFLOW_FFCONST_UTILS_H
\ No newline at end of file
+#endif // _FLEXFLOW_FFCONST_UTILS_H
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index f75267bb00..2345722005 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -505,6 +505,7 @@ class FFModel {
                     std::vector<int> const &axes,
                     bool elementwise_affine,
                     float eps,
+                    DataType data_type = DT_NONE,
                     char const *name = NULL);
   // Add a batch_norm layer
   Tensor
@@ -516,8 +517,11 @@ class FFModel {
                       int b_seq_length_dim = -1,
                       char const *name = nullptr);
   // Add a root mean square layer
-  Tensor
-      rms_norm(const Tensor input, float eps, int dim, char const *name = NULL);
+  Tensor rms_norm(const Tensor input,
+                  float eps,
+                  int dim,
+                  DataType data_type = DT_NONE,
+                  char const *name = NULL);
   // Add a beam search top k layer
   Tensor beam_top_k(const Tensor input,
                     int max_beam_size,
@@ -529,7 +533,7 @@ class FFModel {
                int outDim,
                ActiMode activation = AC_MODE_NONE,
                bool use_bias = true,
-               DataType data_type = DT_FLOAT,
+               DataType data_type = DT_NONE,
                Layer const *shared_op = NULL,
                Initializer *kernel_initializer = NULL,
                Initializer *bias_initializer = NULL,
@@ -572,7 +576,10 @@ class FFModel {
   // Add a flat layer
   Tensor flat(const Tensor input, char const *name = NULL);
   // Add a softmax layer
-  Tensor softmax(const Tensor input, int dim = -1, char const *name = NULL);
+  Tensor softmax(const Tensor input,
+                 int dim = -1,
+                 DataType data_type = DT_NONE,
+                 char const *name = NULL);
   // Create input tensors and constants
   Tensor transpose(const Tensor input,
                    std::vector<int> const &perm,
@@ -606,6 +613,7 @@ class FFModel {
                              bool bias = true,
                              bool add_bias_kv = false,
                              bool add_zero_attn = false,
+                             DataType data_type = DT_NONE,
                              Initializer *kernel_initializer = NULL,
                              char const *name = NULL);
   Tensor inc_multihead_self_attention(const Tensor input,
@@ -617,6 +625,7 @@ class FFModel {
                                       bool bias = false,
                                       bool add_bias_kv = false,
                                       bool add_zero_attn = false,
+                                      DataType data_type = DT_NONE,
                                       Initializer *kernel_initializer = NULL,
                                       bool apply_rotary_embedding = false,
                                       bool scaling_query = false,
@@ -633,6 +642,7 @@ class FFModel {
                                         bool bias = false,
                                         bool add_bias_kv = false,
                                         bool add_zero_attn = false,
+                                        DataType data_type = DT_NONE,
                                         Initializer *kernel_initializer = NULL,
                                         bool apply_rotary_embedding = false,
                                         bool scaling_query = false,
@@ -649,6 +659,7 @@ class FFModel {
       bool bias = false,
       bool add_bias_kv = false,
       bool add_zero_attn = false,
+      DataType data_type = DT_NONE,
       Initializer *kernel_initializer = NULL,
       bool apply_rotary_embedding = false,
       bool scaling_query = false,
diff --git a/include/flexflow/ops/arg_topk.h b/include/flexflow/ops/arg_topk.h
index 4195efd142..a00ab76385 100644
--- a/include/flexflow/ops/arg_topk.h
+++ b/include/flexflow/ops/arg_topk.h
@@ -10,7 +10,7 @@ namespace FlexFlow {
 
 class ArgTopKMeta : public OpMeta {
 public:
-  ArgTopKMeta(FFHandler handle);
+  ArgTopKMeta(FFHandler handle, Op const *op);
   bool sorted;
 };
 
@@ -68,8 +68,9 @@ class ArgTopK : public Op {
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
                              CostMetrics &cost_metrics) const override;
+  template <typename DT>
   static void forward_kernel(ArgTopKMeta const *m,
-                             float const *input_ptr,
+                             DT const *input_ptr,
                              // float *output_ptr,
                              int *indices_ptr,
                              size_t batch_size,
@@ -78,13 +79,8 @@ class ArgTopK : public Op {
                              bool sorted,
                              ffStream_t stream);
   static void forward_kernel_wrapper(ArgTopKMeta const *m,
-                                     float const *input_ptr,
-                                     // float *output_ptr,
-                                     int *indices_ptr,
-                                     size_t batch_size,
-                                     int length,
-                                     int k,
-                                     bool sorted);
+                                     GenericTensorAccessorR const &input,
+                                     GenericTensorAccessorW const &indices);
   Params get_params() const;
 
 public:
diff --git a/include/flexflow/ops/beam_topk.h b/include/flexflow/ops/beam_topk.h
index 9fc0be22f4..76404bfb6d 100644
--- a/include/flexflow/ops/beam_topk.h
+++ b/include/flexflow/ops/beam_topk.h
@@ -10,11 +10,11 @@ namespace FlexFlow {
 
 class BeamTopKMeta : public OpMeta {
 public:
-  BeamTopKMeta(FFHandler handle);
+  BeamTopKMeta(FFHandler handle, Op const *op);
   bool sorted;
   int max_beam_width;
   int *parent_ids;
-  float *acc_probs;
+  void *acc_probs;
   int *block_start_index;
   int *request_id;
   int *tokens_per_request;
@@ -75,9 +75,10 @@ class BeamTopK : public Op {
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
                              CostMetrics &cost_metrics) const override;
+  template <typename DT>
   static void forward_kernel(BeamTopKMeta const *m,
                              BeamSearchBatchConfig const *bc,
-                             float const *input_ptr,
+                             DT const *input_ptr,
                              float *output_ptr,
                              int *indices_ptr,
                              int *parent_ptr,
@@ -87,7 +88,7 @@ class BeamTopK : public Op {
                              ffStream_t stream);
   static void forward_kernel_wrapper(BeamTopKMeta const *m,
                                      BeamSearchBatchConfig const *bc,
-                                     float const *input_ptr,
+                                     GenericTensorAccessorR const &input,
                                      float *output_ptr,
                                      int *indices_ptr,
                                      int *parent_ptr,
diff --git a/include/flexflow/ops/element_unary.h b/include/flexflow/ops/element_unary.h
index a9ca5ddfc9..db0c4b02ca 100644
--- a/include/flexflow/ops/element_unary.h
+++ b/include/flexflow/ops/element_unary.h
@@ -3,6 +3,7 @@
 
 #include "flexflow/device.h"
 #include "flexflow/fftype.h"
+#include "flexflow/inference.h"
 #include "flexflow/layer.h"
 #include "flexflow/node.h"
 #include "flexflow/op_meta.h"
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index a118e62f0b..baf126f41e 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -100,10 +100,10 @@ class IncMultiHeadSelfAttention : public Op {
 
   static void inference_kernel_wrapper(IncMultiHeadSelfAttentionMeta const *m,
                                        BatchConfig const *bc,
-                                       float const *input_ptr,
-                                       float const *weight_ptr,
-                                       float *output_ptr,
-                                       float const *bias_ptr);
+                                       GenericTensorAccessorR const &input,
+                                       GenericTensorAccessorR const &weight,
+                                       GenericTensorAccessorW const &output,
+                                       GenericTensorAccessorR const &bias);
   Params get_params() const;
 
 public:
@@ -120,7 +120,7 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
 public:
   IncMultiHeadSelfAttentionMeta(FFHandler handler,
                                 IncMultiHeadSelfAttention const *attn,
-                                float const *weight_ptr,
+                                GenericTensorAccessorR const &weight,
                                 Legion::Memory gpu_mem,
                                 int num_samples,
                                 int _num_heads);
@@ -140,7 +140,7 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
                                 bool _qk_prod_scaling,
                                 bool _add_bias_kv,
                                 float _scaling_factor,
-                                float const *weight_ptr,
+                                GenericTensorAccessorR const &weight,
                                 Legion::Memory gpu_mem,
                                 int num_samples,
                                 int _num_heads);
@@ -160,9 +160,9 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
 #ifdef INFERENCE_TESTS
   float *kcache, *vcache;
 #endif
-  float *devQKVProjArray, *keyCache, *valueCache;
-  float *qk_prods, *qk_prods_softmax;
-  float *attn_heads, *W_out_contiguous;
+  void *devQKVProjArray, *keyCache, *valueCache;
+  void *qk_prods, *qk_prods_softmax;
+  void *attn_heads, *W_out_contiguous;
   BatchConfig::PerTokenInfo *token_infos;
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
   cuFloatComplex *complex_input;
diff --git a/include/flexflow/ops/kernels/element_binary_kernels.h b/include/flexflow/ops/kernels/element_binary_kernels.h
index 529859195e..b0c596301b 100644
--- a/include/flexflow/ops/kernels/element_binary_kernels.h
+++ b/include/flexflow/ops/kernels/element_binary_kernels.h
@@ -1,6 +1,7 @@
 #ifndef _FLEXFLOW_OPS_KERNELS_ELEMENT_BINARY_KERNELS_H
 #define _FLEXFLOW_OPS_KERNELS_ELEMENT_BINARY_KERNELS_H
 
+#include "flexflow/accessor.h"
 #include "flexflow/device.h"
 #include "flexflow/fftype.h"
 #include "flexflow/op_meta.h"
@@ -9,7 +10,7 @@ namespace FlexFlow {
 
 class ElementBinaryMeta : public OpMeta {
 public:
-  ElementBinaryMeta(FFHandler handle);
+  ElementBinaryMeta(FFHandler handle, Op const *op);
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
   cudnnTensorDescriptor_t input1Tensor, input2Tensor, outputTensor;
   cudnnOpTensorDescriptor_t opDesc;
@@ -34,9 +35,9 @@ void init_kernel(ElementBinaryMeta *m,
                  Legion::Domain const &output_domain);
 
 void forward_kernel_wrapper(ElementBinaryMeta const *m,
-                            float const *in1_ptr,
-                            float const *in2_ptr,
-                            float *out_ptr);
+                            GenericTensorAccessorR const &in1,
+                            GenericTensorAccessorR const &in2,
+                            GenericTensorAccessorW const &out);
 
 void backward_kernel_wrapper(ElementBinaryMeta const *m,
                              float const *out_grad_ptr,
@@ -47,10 +48,11 @@ void backward_kernel_wrapper(ElementBinaryMeta const *m,
 
 namespace Internal {
 
+template <typename DT>
 void forward_kernel(ElementBinaryMeta const *m,
-                    float const *in1_ptr,
-                    float const *in2_ptr,
-                    float *out_ptr,
+                    DT const *in1_ptr,
+                    DT const *in2_ptr,
+                    DT *out_ptr,
                     ffStream_t stream);
 void backward_kernel(ElementBinaryMeta const *m,
                      float const *out_grad_ptr,
@@ -65,4 +67,4 @@ void backward_kernel(ElementBinaryMeta const *m,
 } // namespace Kernels
 } // namespace FlexFlow
 
-#endif // _FLEXFLOW_OPS_KERNELS_ELEMENT_BINARY_KERNELS_H
\ No newline at end of file
+#endif // _FLEXFLOW_OPS_KERNELS_ELEMENT_BINARY_KERNELS_H
diff --git a/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h b/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
index 3cbaebe618..0e0b1b4da9 100644
--- a/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
+++ b/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
@@ -11,20 +11,23 @@ namespace FlexFlow {
 namespace Kernels {
 namespace IncMultiHeadAttention {
 
-__global__ void build_w_out_tensor(float const *weight_ptr,
-                                   float *contiguous_weight_ptr,
+template <typename DT>
+__global__ void build_w_out_tensor(DT const *weight_ptr,
+                                   DT *contiguous_weight_ptr,
                                    int vProjSize,
                                    int oProjSize,
                                    int num_heads,
                                    int qkv_weight_block_size);
 
-__global__ void apply_proj_bias_w(float *input_ptr,
-                                  float const *bias_ptr,
+template <typename DT>
+__global__ void apply_proj_bias_w(DT *input_ptr,
+                                  DT const *bias_ptr,
                                   int num_tokens,
                                   int oProjSize);
 
-__global__ void apply_proj_bias_qkv(float *input_ptr,
-                                    float const *bias_ptr,
+template <typename DT>
+__global__ void apply_proj_bias_qkv(DT *input_ptr,
+                                    DT const *bias_ptr,
                                     int num_tokens,
                                     int qProjSize,
                                     int kProjSize,
@@ -33,8 +36,9 @@ __global__ void apply_proj_bias_qkv(float *input_ptr,
                                     bool scaling_query,
                                     float scaling_factor);
 
+template <typename DT>
 __global__ void
-    apply_rotary_embedding(float *input_ptr,
+    apply_rotary_embedding(DT *input_ptr,
                            cuFloatComplex *complex_input,
                            BatchConfig::PerTokenInfo const *tokenInfos,
                            int qProjSize,
@@ -46,12 +50,13 @@ __global__ void
                            int v_block_size,
                            bool q_tensor);
 
+template <typename DT>
 void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                         BatchConfig const *bc,
-                        float const *input_ptr,
-                        float const *weight_ptr,
-                        float *output_ptr,
-                        float const *bias_ptr,
+                        DT const *input_ptr,
+                        DT const *weight_ptr,
+                        DT *output_ptr,
+                        DT const *bias_ptr,
                         cudaStream_t stream);
 } // namespace IncMultiHeadAttention
 } // namespace Kernels
diff --git a/include/flexflow/ops/kernels/linear_kernels.h b/include/flexflow/ops/kernels/linear_kernels.h
index 6ca9fb89ac..9ed99c93a1 100644
--- a/include/flexflow/ops/kernels/linear_kernels.h
+++ b/include/flexflow/ops/kernels/linear_kernels.h
@@ -4,12 +4,13 @@
 #include "flexflow/device.h"
 #include "flexflow/fftype.h"
 #include "flexflow/op_meta.h"
+#include "flexflow/ops/linear.h"
 
 namespace FlexFlow {
 
 class LinearMeta : public OpMeta {
 public:
-  LinearMeta(FFHandler handle, int batch_size);
+  LinearMeta(FFHandler handle, int batch_size, Linear const *li);
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
   cudnnTensorDescriptor_t outputTensor;
   cudnnActivationDescriptor_t actiDesc;
@@ -17,7 +18,7 @@ class LinearMeta : public OpMeta {
   miopenTensorDescriptor_t outputTensor;
   miopenActivationDescriptor_t actiDesc;
 #endif
-  float const *one_ptr;
+  void *one_ptr;
   ActiMode activation;
   RegularizerMode kernel_reg_type;
   float kernel_reg_lambda;
@@ -51,6 +52,7 @@ void backward_kernel_wrapper(LinearMeta const *m,
 bool use_activation(ActiMode mode);
 
 namespace Internal {
+template <typename DT>
 void forward_kernel(LinearMeta const *m,
                     void const *input_ptr,
                     void *output_ptr,
@@ -60,6 +62,7 @@ void forward_kernel(LinearMeta const *m,
                     int out_dim,
                     int batch_size,
                     ffStream_t stream);
+template <typename DT>
 void backward_kernel(LinearMeta const *m,
                      void const *input_ptr,
                      void *input_grad_ptr,
@@ -72,6 +75,8 @@ void backward_kernel(LinearMeta const *m,
                      int out_dim,
                      int batch_size,
                      ffStream_t stream);
+template <typename DT>
+__global__ void build_one_ptr(DT *one_ptr, int batch_size);
 } // namespace Internal
 } // namespace Linear
 } // namespace Kernels
diff --git a/include/flexflow/ops/kernels/rms_norm_kernels.h b/include/flexflow/ops/kernels/rms_norm_kernels.h
index 5673880dcb..f38e55ae39 100644
--- a/include/flexflow/ops/kernels/rms_norm_kernels.h
+++ b/include/flexflow/ops/kernels/rms_norm_kernels.h
@@ -24,8 +24,8 @@ class RMSNormMeta : public OpMeta {
 
 public:
   float eps;
-  float *rms_ptr;
-  float *norm_ptr;
+  void *rms_ptr;
+  void *norm_ptr;
 
   float alpha;
   float beta;
@@ -46,4 +46,4 @@ void forward_kernel_wrapper(RMSNormMeta const *m,
 } // namespace Kernels
 } // namespace FlexFlow
 
-#endif // _FLEXFLOW_OPS_KERNELS_RMSNORM_KERNELS_H
\ No newline at end of file
+#endif // _FLEXFLOW_OPS_KERNELS_RMSNORM_KERNELS_H
diff --git a/include/flexflow/ops/kernels/softmax_kernels.h b/include/flexflow/ops/kernels/softmax_kernels.h
index 81b34d8558..14c07414e9 100644
--- a/include/flexflow/ops/kernels/softmax_kernels.h
+++ b/include/flexflow/ops/kernels/softmax_kernels.h
@@ -21,27 +21,31 @@ class SoftmaxMeta : public OpMeta {
   bool profiling;
   int dim;
   char op_name[MAX_OPNAME];
+  DataType input_type, output_type;
 };
 
 namespace Kernels {
 namespace Softmax {
-
+template <typename DT>
 void forward_kernel_wrapper(SoftmaxMeta const *m,
-                            float const *input_ptr,
-                            float *output_ptr);
-
+                            DT const *input_ptr,
+                            DT *output_ptr);
+template <typename DT>
 void backward_kernel_wrapper(SoftmaxMeta const *m,
-                             float *input_grad_ptr,
-                             float const *output_grad_ptr,
+                             DT *input_grad_ptr,
+                             DT const *output_grad_ptr,
                              size_t num_elements);
 
 namespace Internal {
+template <typename DT>
 void forward_kernel(SoftmaxMeta const *m,
-                    float const *input_ptr,
-                    float *output_ptr,
+                    DT const *input_ptr,
+                    DT *output_ptr,
                     ffStream_t stream);
-void backward_kernel(float *input_grad_ptr,
-                     float const *output_grad_ptr,
+
+template <typename DT>
+void backward_kernel(DT *input_grad_ptr,
+                     DT const *output_grad_ptr,
                      size_t num_elements,
                      ffStream_t stream);
 } // namespace Internal
diff --git a/include/flexflow/ops/layer_norm.h b/include/flexflow/ops/layer_norm.h
index 60987471b2..b962edf326 100644
--- a/include/flexflow/ops/layer_norm.h
+++ b/include/flexflow/ops/layer_norm.h
@@ -2,7 +2,6 @@
 
 #include "flexflow/inference.h"
 #include "flexflow/model.h"
-
 namespace FlexFlow {
 
 class LayerNormMeta;
@@ -76,12 +75,11 @@ class LayerNorm : public Op {
                              T *gamma_ptr,
                              T *beta_ptr,
                              ffStream_t stream);
-  template <typename T>
   static void forward_kernel_wrapper(LayerNormMeta const *m,
-                                     T const *input_ptr,
-                                     T *output_ptr,
-                                     T *gamma_ptr,
-                                     T *beta_ptr);
+                                     GenericTensorAccessorR const &input,
+                                     GenericTensorAccessorW &output,
+                                     GenericTensorAccessorW &gamma,
+                                     GenericTensorAccessorW &beta);
   template <typename T>
   static void backward_kernel(LayerNormMeta const *m,
                               T const *output_grad_ptr,
@@ -115,7 +113,7 @@ class LayerNormMeta : public OpMeta {
   bool elementwise_affine;
   int64_t effective_batch_size, effective_num_elements;
   float eps;
-  float *mean_ptr, *rstd_ptr, *ds_ptr, *db_ptr, *scale_ptr, *bias_ptr;
+  void *mean_ptr, *rstd_ptr, *ds_ptr, *db_ptr, *scale_ptr, *bias_ptr;
   char op_name[MAX_OPNAME];
 };
 
diff --git a/include/flexflow/ops/linear.h b/include/flexflow/ops/linear.h
index f991bd7a9b..bbc40ef320 100644
--- a/include/flexflow/ops/linear.h
+++ b/include/flexflow/ops/linear.h
@@ -96,19 +96,19 @@ class Linear : public Op {
          bool allocate_weights,
          char const *name);
 
-  template <int NDIM>
+  template <typename DT, int NDIM>
   static OpMeta *
       init_task_with_dim(Legion::Task const *task,
                          std::vector<Legion::PhysicalRegion> const &regions,
                          Legion::Context ctx,
                          Legion::Runtime *runtime);
-  template <int NDIM>
+  template <typename DT, int NDIM>
   static void
       forward_task_with_dim(Legion::Task const *task,
                             std::vector<Legion::PhysicalRegion> const &regions,
                             Legion::Context ctx,
                             Legion::Runtime *runtime);
-  template <int NDIM>
+  template <typename DT, int NDIM>
   static void
       backward_task_with_dim(Legion::Task const *task,
                              std::vector<Legion::PhysicalRegion> const &regions,
diff --git a/include/flexflow/ops/softmax.h b/include/flexflow/ops/softmax.h
index 04f1283f89..3f29de905b 100644
--- a/include/flexflow/ops/softmax.h
+++ b/include/flexflow/ops/softmax.h
@@ -64,13 +64,13 @@ class Softmax : public Op {
   Params get_params() const;
 
 private:
-  template <int NDIM>
+  template <typename DT, int NDIM>
   static void
       forward_task_with_dim(Legion::Task const *task,
                             std::vector<Legion::PhysicalRegion> const &regions,
                             Legion::Context ctx,
                             Legion::Runtime *runtime);
-  template <int NDIM>
+  template <typename DT, int NDIM>
   static void
       backward_task_with_dim(Legion::Task const *task,
                              std::vector<Legion::PhysicalRegion> const &regions,
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention.h b/include/flexflow/ops/spec_inc_multihead_self_attention.h
index 57afb73a03..92d52b43b1 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention.h
@@ -105,10 +105,10 @@ class SpecIncMultiHeadSelfAttention : public Op {
   static void
       inference_kernel_wrapper(SpecIncMultiHeadSelfAttentionMeta const *m,
                                BeamSearchBatchConfig const *bc,
-                               float const *input_ptr,
-                               float const *weight_ptr,
-                               float *output_ptr,
-                               float const *bias_ptr);
+                               GenericTensorAccessorR const &input,
+                               GenericTensorAccessorR const &weight,
+                               GenericTensorAccessorW const &output,
+                               GenericTensorAccessorR const &bias);
   Params get_params() const;
 
 public:
@@ -125,7 +125,7 @@ class SpecIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
 public:
   SpecIncMultiHeadSelfAttentionMeta(FFHandler handler,
                                     SpecIncMultiHeadSelfAttention const *attn,
-                                    float const *weight_ptr,
+                                    GenericTensorAccessorR const &weight,
                                     Legion::Memory gpu_mem,
                                     int num_samples,
                                     int _num_heads);
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention.h b/include/flexflow/ops/tree_inc_multihead_self_attention.h
index 58775bf40d..eef51bc21f 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention.h
@@ -100,10 +100,11 @@ class TreeIncMultiHeadSelfAttention : public Op {
 
   static void inference_kernel_wrapper(TreeIncMultiHeadSelfAttentionMeta *m,
                                        TreeVerifyBatchConfig const *bc,
-                                       float const *input_ptr,
-                                       float const *weight_ptr,
-                                       float *output_ptr,
-                                       float const *bias_ptr);
+                                       GenericTensorAccessorR const &input,
+                                       GenericTensorAccessorR const &weight,
+                                       GenericTensorAccessorW const &output,
+                                       GenericTensorAccessorR const &bias);
+
   Params get_params() const;
 
 public:
@@ -120,7 +121,7 @@ class TreeIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
 public:
   TreeIncMultiHeadSelfAttentionMeta(FFHandler handler,
                                     TreeIncMultiHeadSelfAttention const *attn,
-                                    float const *weight_ptr,
+                                    GenericTensorAccessorR const &weight,
                                     Legion::Memory gpu_mem,
                                     int num_samples,
                                     int _num_heads);
diff --git a/include/flexflow/simulator.h b/include/flexflow/simulator.h
index 9ee1b1eb09..6f0f327110 100644
--- a/include/flexflow/simulator.h
+++ b/include/flexflow/simulator.h
@@ -684,8 +684,6 @@ class TaskManager {
   std::map<size_t, SimTask *> hash_to_forward_task, hash_to_backward_task;
 };
 
-size_t data_type_size(DataType);
-
 using ProfilingRecordKey = std::tuple<OperatorParameters, MachineView>;
 
 class Simulator {
@@ -756,7 +754,7 @@ class Simulator {
   LinearMeta *linear_meta;
   Pool2DMeta *pool2d_meta;
   ElementUnaryMeta *ele_unary_meta;
-  ElementBinaryMeta *ele_binary_meta;
+  // ElementBinaryMeta *ele_binary_meta;
   // EmbeddingMeta *embedding_meta;
   // SoftmaxMeta *softmax_meta;
   BatchMatmulMeta *batch_matmul_meta;
diff --git a/include/flexflow/utils/cuda_helper.h b/include/flexflow/utils/cuda_helper.h
index b82426ac59..5ac4571118 100644
--- a/include/flexflow/utils/cuda_helper.h
+++ b/include/flexflow/utils/cuda_helper.h
@@ -155,15 +155,17 @@ template <typename T>
 bool download_tensor(T const *ptr, T *dst, size_t num_elements);
 
 cudnnStatus_t cudnnSetTensorDescriptorFromDomain(cudnnTensorDescriptor_t tensor,
-                                                 Legion::Domain domain);
+                                                 Legion::Domain domain,
+                                                 DataType data_type = DT_FLOAT);
 
 cudnnStatus_t
     cudnnSetTensorDescriptorFromDomain4SoftMax(cudnnTensorDescriptor_t tensor,
-                                               Legion::Domain domain);
+                                               Legion::Domain domain,
+                                               DataType data_type = DT_FLOAT);
 
 cudaDataType_t ff_to_cuda_datatype(DataType type);
 cudnnDataType_t ff_to_cudnn_datatype(DataType type);
 
 cudaDataType_t cudnn_to_cuda_datatype(cudnnDataType_t type);
 cudnnDataType_t cuda_to_cudnn_datatype(cudaDataType_t type);
-#endif
\ No newline at end of file
+#endif
diff --git a/include/flexflow/utils/hip_helper.h b/include/flexflow/utils/hip_helper.h
index f78102c0fe..c2c4d94cc3 100644
--- a/include/flexflow/utils/hip_helper.h
+++ b/include/flexflow/utils/hip_helper.h
@@ -141,7 +141,8 @@ bool download_tensor(T const *ptr, T *dst, size_t num_elements);
 
 miopenStatus_t
     cudnnSetTensorDescriptorFromDomain(miopenTensorDescriptor_t tensor,
-                                       Legion::Domain domain);
+                                       Legion::Domain domain,
+                                       DataType data_type = DT_FLOAT);
 
 hipblasDatatype_t ff_to_cuda_datatype(DataType type);
 
diff --git a/inference/file_loader.cc b/inference/file_loader.cc
index 250a030c4a..f0eff0e50b 100644
--- a/inference/file_loader.cc
+++ b/inference/file_loader.cc
@@ -14,6 +14,7 @@
  */
 
 #include "file_loader.h"
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/inference.h"
 
 #include <vector>
@@ -60,7 +61,8 @@ BatchConfig::TokenId *FileDataLoader::generate_requests(int num, int length) {
   return prompts;
 };
 
-void load_attention_bias(float *ptr,
+template <typename DT>
+void load_attention_bias(DT *ptr,
                          int num_heads,
                          size_t hidden_dim,
                          size_t qkv_inner_dim,
@@ -87,8 +89,8 @@ void load_attention_bias(float *ptr,
     // std::cout << "Loading filename: " << file << std::endl;
     std::ifstream in(file, std::ios::in | std::ios::binary);
     assert(in.good() && "incorrect bias file path");
-    std::vector<float> host_array(partial_size);
-    size_t loaded_data_size = sizeof(float) * partial_size;
+    std::vector<DT> host_array(partial_size);
+    size_t loaded_data_size = sizeof(DT) * partial_size;
     in.seekg(0, in.end);
     in.seekg(0, in.beg);
     in.read((char *)host_array.data(), loaded_data_size);
@@ -113,7 +115,8 @@ void load_attention_bias(float *ptr,
   }
 }
 
-void load_attention_weights(float *ptr,
+template <typename DT>
+void load_attention_weights(DT *ptr,
                             int num_heads,
                             size_t hidden_dim,
                             size_t qkv_inner_dim,
@@ -154,8 +157,8 @@ void load_attention_weights(float *ptr,
       std::cout << "Could not open file: " << file << std::endl;
     }
     assert(in.good() && "incorrect weight file path");
-    std::vector<float> host_array(partial_size);
-    size_t loaded_data_size = sizeof(float) * partial_size;
+    std::vector<DT> host_array(partial_size);
+    size_t loaded_data_size = sizeof(DT) * partial_size;
     in.seekg(0, in.end);
     in.seekg(0, in.beg);
     in.read((char *)host_array.data(), loaded_data_size);
@@ -183,15 +186,16 @@ void load_attention_weights(float *ptr,
   }
 }
 
-void load_from_file(float *ptr, size_t size, std::string filename) {
+template <typename DT>
+void load_from_file(DT *ptr, size_t size, std::string filename) {
   // std::cout << "Loading filename: " << filename << std::endl;
   std::ifstream in(filename, std::ios::in | std::ios::binary);
   if (!in.good()) {
     std::cout << "Could not open file: " << filename << std::endl;
   }
   assert(in.good() && "incorrect weight file path");
-  std::vector<float> host_array(size);
-  size_t loaded_data_size = sizeof(float) * size;
+  std::vector<DT> host_array(size);
+  size_t loaded_data_size = sizeof(DT) * size;
   in.seekg(0, in.end);
   in.seekg(0, in.beg);
   in.read((char *)host_array.data(), loaded_data_size);
@@ -199,7 +203,7 @@ void load_from_file(float *ptr, size_t size, std::string filename) {
   size_t in_get_size = in.gcount();
   if (in_get_size != loaded_data_size) {
     std::cout << "load weight data error " << in_get_size << ", "
-              << loaded_data_size << ", " << sizeof(float) << std::endl;
+              << loaded_data_size << ", " << sizeof(DT) << std::endl;
     return;
   }
   assert(size == host_array.size());
@@ -237,60 +241,77 @@ void FileDataLoader::load_positions(FFModel *ff,
   position_pt->set_tensor<int>(ff, dims_vec, data);
 }
 
+template <typename DT>
+void FileDataLoader::load_single_weight_tensor(FFModel *ff,
+                                               Tensor weight,
+                                               int weight_idx,
+                                               std::string const &layername) {
+  size_t volume = 1;
+  std::vector<int> dims_vec;
+  for (int i = 0; i < weight->num_dims; i++) {
+    dims_vec.push_back(weight->dims[i]);
+    volume *= weight->dims[i];
+  }
+
+  assert(data_type_size(weight->data_type) == sizeof(DT));
+  DT *data = (DT *)malloc(sizeof(DT) * volume);
+
+  std::string file_path =
+      (layername.back() == '/') ? layername : "/" + layername;
+
+  if (file_path.find("attention_w") != std::string::npos) {
+    if (weight_idx == 0) {
+      load_attention_weights(data,
+                             num_heads,
+                             hidden_dim,
+                             qkv_inner_dim,
+                             file_path,
+                             weight_file_path,
+                             volume);
+    } else {
+      load_attention_bias(data,
+                          num_heads,
+                          hidden_dim,
+                          qkv_inner_dim,
+                          file_path,
+                          weight_file_path);
+    }
+
+  } else {
+    if (weight_idx > 0) {
+      int index = file_path.find("_weight");
+      assert(index != std::string::npos);
+      file_path = file_path.substr(0, index) + "_bias";
+    }
+    load_from_file(data, volume, weight_file_path + file_path);
+  }
+
+  ParallelTensor weight_pt;
+  ff->get_parallel_tensor_from_tensor(weight, weight_pt);
+  weight_pt->set_tensor<DT>(ff, dims_vec, data);
+
+  delete data;
+}
+
 void FileDataLoader::load_weights(
     FFModel *ff, std::unordered_map<std::string, Layer *> weights_layers) {
-
   for (auto &v : weights_layers) {
-
     int weights_num = v.second->numWeights;
     for (int i = 0; i < weights_num; i++) {
       Tensor weight = v.second->weights[i];
       if (weight == NULL) {
         continue;
       }
-
-      size_t volume = 1;
-      std::vector<int> dims_vec;
-      for (int i = 0; i < weight->num_dims; i++) {
-        dims_vec.push_back(weight->dims[i]);
-        volume *= weight->dims[i];
-      }
-
-      assert(weight->data_type == DT_FLOAT);
-      float *data = (float *)malloc(sizeof(float) * volume);
-
-      std::string file_path = (v.first.back() == '/') ? v.first : "/" + v.first;
-
-      if (file_path.find("attention_w") != std::string::npos) {
-        if (i == 0) {
-          load_attention_weights(data,
-                                 num_heads,
-                                 hidden_dim,
-                                 qkv_inner_dim,
-                                 file_path,
-                                 weight_file_path,
-                                 volume);
-        } else {
-          load_attention_bias(data,
-                              num_heads,
-                              hidden_dim,
-                              qkv_inner_dim,
-                              file_path,
-                              weight_file_path);
-        }
-
-      } else {
-        if (i > 0) {
-          int index = file_path.find("_weight");
-          assert(index != std::string::npos);
-          file_path = file_path.substr(0, index) + "_bias";
-        }
-        load_from_file(data, volume, weight_file_path + file_path);
+      switch (weight->data_type) {
+        case DT_HALF:
+          load_single_weight_tensor<half>(ff, weight, i, v.first);
+          break;
+        case DT_FLOAT:
+          load_single_weight_tensor<float>(ff, weight, i, v.first);
+          break;
+        default:
+          assert(false && "Unsupported data type");
       }
-
-      ParallelTensor weight_pt;
-      ff->get_parallel_tensor_from_tensor(weight, weight_pt);
-      weight_pt->set_tensor<float>(ff, dims_vec, data);
     }
   }
 }
diff --git a/inference/file_loader.h b/inference/file_loader.h
index 06714293da..7ca94a8893 100644
--- a/inference/file_loader.h
+++ b/inference/file_loader.h
@@ -32,6 +32,11 @@ class FileDataLoader {
 
   BatchConfig::TokenId *generate_requests(int num, int length);
 
+  template <typename DT>
+  void load_single_weight_tensor(FFModel *ff,
+                                 Tensor weight,
+                                 int weight_idx,
+                                 std::string const &layername);
   void load_weights(FFModel *ff,
                     std::unordered_map<std::string, Layer *> weights_layers);
 
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index d4b57be6e8..6a5070790c 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -24,7 +24,8 @@ void LLAMA::create_llama_model(FFModel &ff,
                                std::string const &model_config_file_path,
                                std::string const &weight_file_path,
                                int num_pipeline_stages,
-                               InferenceMode mode) {
+                               InferenceMode mode,
+                               bool use_full_precision) {
   Config llama_config(model_config_file_path);
   llama_config.printConfig();
   //------------------------------compute machine views ------------------
@@ -52,13 +53,27 @@ void LLAMA::create_llama_model(FFModel &ff,
   mapping[input].push_back(machine_views[0]);
 
   Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
-  Tensor token = ff.embedding(input,
-                              llama_config.vocab_size,
-                              llama_config.dim,
-                              AGGR_MODE_NONE,
-                              DT_FLOAT,
-                              NULL,
-                              embed_init);
+
+  Tensor token;
+
+  if (use_full_precision) {
+    token = ff.embedding(input,
+                         llama_config.vocab_size,
+                         llama_config.dim,
+                         AGGR_MODE_NONE,
+                         DT_FLOAT,
+                         NULL,
+                         embed_init);
+  } else {
+    token = ff.embedding(input,
+                         llama_config.vocab_size,
+                         llama_config.dim,
+                         AGGR_MODE_NONE,
+                         DT_HALF,
+                         NULL,
+                         embed_init);
+  }
+
   Layer *embedding = ff.layers.back();
   weights_layers.emplace("tok_embeddings_weight", embedding);
 
@@ -98,6 +113,7 @@ void LLAMA::create_llama_model(FFModel &ff,
             false,
             false,
             false,
+            DT_NONE,
             NULL,
             true);
         break;
@@ -113,6 +129,7 @@ void LLAMA::create_llama_model(FFModel &ff,
             false,   /*bias*/
             false,   /*add_bias_kv*/
             false,   /*add_zero_attn*/
+            DT_NONE, /*data_type*/
             nullptr, /*kernel_initializer*/
             true     /*apply_rotary_embedding*/
         );
@@ -129,6 +146,7 @@ void LLAMA::create_llama_model(FFModel &ff,
             false,   /*bias*/
             false,   /*add_bias_kv*/
             false,   /*add_zero_attn*/
+            DT_NONE, /*data_type*/
             nullptr, /*kernel_initializer*/
             true     /*apply_rotary_embedding*/
         );
diff --git a/inference/models/llama.h b/inference/models/llama.h
index dba68af678..11fc354a2c 100644
--- a/inference/models/llama.h
+++ b/inference/models/llama.h
@@ -107,7 +107,8 @@ class LLAMA {
                                  std::string const &model_config_file_path,
                                  std::string const &weight_file_path,
                                  int num_pipeline_stages,
-                                 InferenceMode mode);
+                                 InferenceMode mode,
+                                 bool use_full_precision = false);
 };
 
 }; // namespace FlexFlow
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index 57406929fa..dd4bb18e85 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -24,7 +24,8 @@ void OPT::create_opt_model(FFModel &ff,
                            std::string const &model_config_file_path,
                            std::string const &weight_file_path,
                            int num_pipeline_stages,
-                           InferenceMode mode) {
+                           InferenceMode mode,
+                           bool use_full_precision) {
   Config opt_config(model_config_file_path);
   opt_config.printConfig();
   //------------------------------compute machine views ------------------
@@ -57,24 +58,46 @@ void OPT::create_opt_model(FFModel &ff,
   Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
   std::vector<int> axes = {0};
 
-  Tensor token = ff.embedding(input,
-                              opt_config.vocab_size,
-                              opt_config.word_embed_proj_dim,
-                              AGGR_MODE_NONE,
-                              DT_FLOAT,
-                              NULL,
-                              embed_init);
-  Layer *embedding = ff.layers.back();
+  Tensor token;
+  if (use_full_precision) {
+    token = ff.embedding(input,
+                         opt_config.vocab_size,
+                         opt_config.word_embed_proj_dim,
+                         AGGR_MODE_NONE,
+                         DT_FLOAT,
+                         NULL,
+                         embed_init);
+  } else {
+    token = ff.embedding(input,
+                         opt_config.vocab_size,
+                         opt_config.word_embed_proj_dim,
+                         AGGR_MODE_NONE,
+                         DT_HALF,
+                         NULL,
+                         embed_init);
+  }
 
+  Layer *embedding = ff.layers.back();
   weights_layers.emplace("embed_tokens_weight", embedding);
 
-  Tensor positional_embedding = ff.embedding(position_input,
-                                             opt_config.max_position_embeddings,
-                                             opt_config.hidden_size,
-                                             AGGR_MODE_NONE,
-                                             DT_FLOAT,
-                                             NULL,
-                                             embed_init);
+  Tensor positional_embedding;
+  if (use_full_precision) {
+    positional_embedding = ff.embedding(position_input,
+                                        opt_config.max_position_embeddings,
+                                        opt_config.hidden_size,
+                                        AGGR_MODE_NONE,
+                                        DT_FLOAT,
+                                        NULL,
+                                        embed_init);
+  } else {
+    positional_embedding = ff.embedding(position_input,
+                                        opt_config.max_position_embeddings,
+                                        opt_config.hidden_size,
+                                        AGGR_MODE_NONE,
+                                        DT_HALF,
+                                        NULL,
+                                        embed_init);
+  }
   Layer *pos_embedding = ff.layers.back();
   weights_layers.emplace("embed_positions_weight", pos_embedding);
 
@@ -82,7 +105,6 @@ void OPT::create_opt_model(FFModel &ff,
 
   int num_transformer_layers_per_stage =
       (32 + num_pipeline_stages - 1) / num_pipeline_stages;
-
   for (int i = 0; i < opt_config.num_hidden_layers; i++) {
     // 125m, 1.7B, ..., 175B applies layer norm BEFORE attention,
     // 350m applies layer norm AFTER attention
@@ -114,6 +136,7 @@ void OPT::create_opt_model(FFModel &ff,
             true,
             false,
             false,
+            DT_NONE, /*data_type*/
             NULL,
             false,
             /*scaling query*/ true,
@@ -134,6 +157,7 @@ void OPT::create_opt_model(FFModel &ff,
             true,
             false,
             false,
+            DT_NONE, /*data_type*/
             NULL,
             false,
             /*scaling query*/ true,
@@ -154,6 +178,7 @@ void OPT::create_opt_model(FFModel &ff,
             true,
             false,
             false,
+            DT_NONE, /*data_type*/
             NULL,
             false,
             /*scaling query*/ true,
diff --git a/inference/models/opt.h b/inference/models/opt.h
index d336c498d9..77d9aae962 100644
--- a/inference/models/opt.h
+++ b/inference/models/opt.h
@@ -109,7 +109,8 @@ class OPT {
                                std::string const &model_config_file_path,
                                std::string const &weight_file_path,
                                int num_pipeline_stages,
-                               InferenceMode mode);
+                               InferenceMode mode,
+                               bool use_full_precision = false);
 };
 
 }; // namespace FlexFlow
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index d894b46084..f7f7e70543 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -43,7 +43,8 @@ struct ModelTypes {
 void parse_input_args(char **argv,
                       int argc,
                       FilePaths &paths,
-                      ModelTypes &model_types) {
+                      ModelTypes &model_types,
+                      bool &use_full_precision) {
   for (int i = 1; i < argc; i++) {
     // llm model type
     if (!strcmp(argv[i], "-llm-model")) {
@@ -109,6 +110,10 @@ void parse_input_args(char **argv,
       paths.tokenizer_file_path = std::string(argv[++i]);
       continue;
     }
+    if (!strcmp(argv[i], "--use-full-precision")) {
+      use_full_precision = true;
+      continue;
+    }
   }
 }
 
@@ -119,11 +124,12 @@ void FlexFlow::top_level_task(Task const *task,
   FFConfig ffconfig;
   FilePaths file_paths;
   ModelTypes model_types;
+  bool use_full_precision = false;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
   char **argv = command_args.argv;
   int argc = command_args.argc;
-  parse_input_args(argv, argc, file_paths, model_types);
+  parse_input_args(argv, argc, file_paths, model_types, use_full_precision);
   if (file_paths.ssm_weight_file_paths.size() == 0) {
     assert(false &&
            "SpecInfer needs at least one SSM for speculative inference");
@@ -197,14 +203,16 @@ void FlexFlow::top_level_task(Task const *task,
                               file_paths.ssm_config_file_paths[0],
                               file_paths.ssm_weight_file_paths[0],
                               1,
-                              BEAM_SEARCH_MODE);
+                              BEAM_SEARCH_MODE,
+                              use_full_precision);
   } else {
     OPT::create_opt_model(beam_model,
                           im,
                           file_paths.ssm_config_file_paths[0],
                           file_paths.ssm_weight_file_paths[0],
                           1,
-                          BEAM_SEARCH_MODE);
+                          BEAM_SEARCH_MODE,
+                          use_full_precision);
   }
   if (model_types.llm_model_type == ModelType::LLAMA) {
     LLAMA::create_llama_model(tree_model,
@@ -212,14 +220,16 @@ void FlexFlow::top_level_task(Task const *task,
                               file_paths.llm_config_file_path,
                               file_paths.llm_weight_file_path,
                               ffconfig.workersPerNode * ffconfig.numNodes,
-                              TREE_VERIFY_MODE);
+                              TREE_VERIFY_MODE,
+                              use_full_precision);
   } else {
     OPT::create_opt_model(tree_model,
                           im,
                           file_paths.llm_config_file_path,
                           file_paths.llm_weight_file_path,
                           ffconfig.workersPerNode * ffconfig.numNodes,
-                          TREE_VERIFY_MODE);
+                          TREE_VERIFY_MODE,
+                          use_full_precision);
   }
 
   TreeVerifyBatchConfig tree_bc;
diff --git a/python/flexflow_c.cc b/python/flexflow_c.cc
index 776401c689..bb17f807a6 100644
--- a/python/flexflow_c.cc
+++ b/python/flexflow_c.cc
@@ -568,8 +568,8 @@ flexflow_tensor_t flexflow_model_add_layer_norm(flexflow_model_t handle_,
   for (int i = 0; i < n; i++) {
     axes_vec.push_back(axes[i]);
   }
-  Tensor tensor =
-      handle->layer_norm(input, axes_vec, elementwise_affine, eps, name);
+  Tensor tensor = handle->layer_norm(
+      input, axes_vec, elementwise_affine, eps, input->data_type, name);
   DEBUG_PRINT("[LayerNorm] new Tensor %p, input %p, elementwise_affine %d, eps "
               "%f, name %s",
               tensor,
@@ -737,7 +737,7 @@ flexflow_tensor_t flexflow_model_add_softmax(flexflow_model_t handle_,
                                              char const *name) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
   Tensor input = FFCObjectWrapper::unwrap(input_);
-  Tensor tensor = handle->softmax(input, dim, name);
+  Tensor tensor = handle->softmax(input, dim, input->data_type, name);
   DEBUG_PRINT(
       "[Softmax] new Tensor %p, input %p, name %s", tensor, input, name);
   return FFCObjectWrapper::wrap(tensor);
@@ -979,6 +979,7 @@ flexflow_tensor_t flexflow_model_add_multihead_attention(
                                               bias,
                                               add_bias_kv,
                                               add_zero_attn,
+                                              query->data_type,
                                               kernel_initializer,
                                               name);
   DEBUG_PRINT("[MultiHeadAttention] new Tensor %p, query %p, key %p, value %p, "
@@ -1027,6 +1028,7 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_attention(
                                                        bias,
                                                        add_bias_kv,
                                                        add_zero_attn,
+                                                       input->data_type,
                                                        kernel_initializer,
                                                        name);
   return FFCObjectWrapper::wrap(tensor);
@@ -1969,4 +1971,4 @@ void finish_flexflow_task() {
   // The previous call is asynchronous so we still need to
   // wait for the shutdown of the runtime to complete
   Runtime::wait_for_shutdown();
-}
+}
\ No newline at end of file
diff --git a/src/ops/arg_topk.cc b/src/ops/arg_topk.cc
index 5636b7b924..eedd89bd5f 100644
--- a/src/ops/arg_topk.cc
+++ b/src/ops/arg_topk.cc
@@ -233,7 +233,7 @@ OpMeta *ArgTopK::init_task(Task const *task,
                            Runtime *runtime) {
   ArgTopK *topk = (ArgTopK *)task->args;
   FFHandler handle = *((FFHandler *)task->local_args);
-  ArgTopKMeta *m = new ArgTopKMeta(handle);
+  ArgTopKMeta *m = new ArgTopKMeta(handle, topk);
   m->profiling = topk->profiling;
   m->sorted = topk->sorted;
   return m;
@@ -296,42 +296,20 @@ InferenceResult
   assert(task->regions.size() == 2);
   // const ArgTopK* topk = (const ArgTopK*) task->args;
   ArgTopKMeta const *m = *((ArgTopKMeta **)task->local_args);
-  Domain in1_domain = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  //   Domain out1_domain = runtime->get_index_space_domain(
-  //       ctx, task->regions[1].region.get_index_space());
-  Domain out2_domain = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  int numdims = in1_domain.get_dim();
-  assert(out2_domain.get_dim() == numdims);
 
-  int in_cols = in1_domain.hi()[0] - in1_domain.lo()[0] + 1;
-  // int out1_cols = out1_domain.hi()[0] - out1_domain.lo()[0] + 1;
-  int out2_cols = out2_domain.hi()[0] - out2_domain.lo()[0] + 1;
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW indices = helperGetGenericTensorAccessorWO(
+      DT_INT32, regions[1], task->regions[1], FID_DATA, ctx, runtime);
 
-  // assert(out1_domain == out2_domain);
-  for (int i = 1; i < in1_domain.get_dim(); i++) {
-    assert(in1_domain.lo()[i] == out2_domain.lo()[i]);
-    assert(in1_domain.hi()[i] == out2_domain.hi()[i]);
-  }
-  float const *in_ptr = helperGetTensorPointerRO<float>(
-      regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  //   float *value_ptr = helperGetTensorPointerWO<float>(
-  //       regions[1], task->regions[1], FID_DATA, ctx, runtime);
-  int *index_ptr = helperGetTensorPointerWO<int>(
-      regions[1], task->regions[1], FID_DATA, ctx, runtime);
-
-  int length = in1_domain.hi()[0] - in1_domain.lo()[0] + 1;
-  int k =
-      out2_domain.hi()[0] - out2_domain.lo()[0] + 1; /*TODO: This prints to 5*/
-  size_t batch_size = in1_domain.get_volume() / length;
-  assert(out2_domain.get_volume() / k == batch_size);
+  ArgTopK::forward_kernel_wrapper(m, input, indices);
 
-  ArgTopK::forward_kernel_wrapper(
-      m, in_ptr, index_ptr, batch_size, length, k, m->sorted);
+  int length = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+  int batch_size = input.domain.get_volume() / length;
 
   InferenceResult ir;
-  download_tensor<BatchConfig::TokenId>(index_ptr, ir.token_ids, batch_size);
+  download_tensor<BatchConfig::TokenId>(
+      indices.get_int32_ptr(), ir.token_ids, batch_size);
   return ir;
 }
 
diff --git a/src/ops/arg_topk.cpp b/src/ops/arg_topk.cpp
index cc43967894..d055e09def 100644
--- a/src/ops/arg_topk.cpp
+++ b/src/ops/arg_topk.cpp
@@ -364,8 +364,9 @@ __global__ void arg_topk_forward_kernel(T const *__restrict__ input,
 }
 
 /*static*/
+template <typename DT>
 void ArgTopK::forward_kernel(ArgTopKMeta const *m,
-                             float const *input_ptr,
+                             DT const *input_ptr,
                              // float *output_ptr,
                              int *indices_ptr,
                              size_t batch_size,
@@ -378,7 +379,7 @@ void ArgTopK::forward_kernel(ArgTopKMeta const *m,
   int num_shards = 0;
   {
     constexpr auto shared_memory_size = 48 << 10;
-    auto const heap_size = k * sizeof(Entry<float>);
+    auto const heap_size = k * sizeof(Entry<DT>);
     // shared_memory_size = (num_shards + 1) * heap_size <=>
     num_shards = shared_memory_size / heap_size - 1;
     assert(num_shards > 0);
@@ -387,7 +388,7 @@ void ArgTopK::forward_kernel(ArgTopKMeta const *m,
     }
   }
   // We are limited by the amount of shared memory we have per block.
-  size_t shared_memory_size = (num_shards + 1) * k * sizeof(Entry<float>);
+  size_t shared_memory_size = (num_shards + 1) * k * sizeof(Entry<DT>);
   // size_t num_blocks = (batch_size + num_shards - 1) / num_shards;
   size_t num_blocks = batch_size;
   assert(num_shards >= (size_t)k);
@@ -408,15 +409,41 @@ void ArgTopK::forward_kernel(ArgTopKMeta const *m,
 
 /*static*/
 void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
-                                     float const *input_ptr,
+                                     GenericTensorAccessorR const &input,
                                      // float *output_ptr,
-                                     int *indices_ptr,
-                                     size_t batch_size,
-                                     int length,
-                                     int k,
-                                     bool sorted) {
+                                     GenericTensorAccessorW const &indices) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
+  // Domain in1_domain = runtime->get_index_space_domain(
+  //     ctx, task->regions[0].region.get_index_space());
+  //   Domain out1_domain = runtime->get_index_space_domain(
+  //       ctx, task->regions[1].region.get_index_space());
+  // Domain out2_domain = runtime->get_index_space_domain(
+  //     ctx, task->regions[1].region.get_index_space());
+  int numdims = input.domain.get_dim();
+  assert(indices.domain.get_dim() == numdims);
+
+  int in_cols = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+  // int out1_cols = out1_domain.hi()[0] - out1_domain.lo()[0] + 1;
+  int out2_cols = indices.domain.hi()[0] - indices.domain.lo()[0] + 1;
+
+  // assert(out1_domain == out2_domain);
+  for (int i = 1; i < input.domain.get_dim(); i++) {
+    assert(input.domain.lo()[i] == indices.domain.lo()[i]);
+    assert(input.domain.hi()[i] == indices.domain.hi()[i]);
+  }
+  // float const *in_ptr = helperGetTensorPointerRO<float>(
+  //     regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  //   float *value_ptr = helperGetTensorPointerWO<float>(
+  //       regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  // int *index_ptr = helperGetTensorPointerWO<int>(
+  //    regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  int length = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+  int k = indices.domain.hi()[0] - indices.domain.lo()[0] +
+          1; /*TODO: This prints to 5*/
+  size_t batch_size = input.domain.get_volume() / length;
+  assert(indices.domain.get_volume() / k == batch_size);
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
@@ -425,16 +452,29 @@ void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
     hipEventRecord(t_start, stream);
   }
 
-  ArgTopK::forward_kernel(m,
-                          input_ptr,
-                          // output_ptr,
-                          indices_ptr,
-                          batch_size,
-                          length,
-                          k,
-                          sorted,
-                          stream);
-
+  if (input.data_type == DT_HALF) {
+    ArgTopK::forward_kernel(m,
+                            input.get_half_ptr(),
+                            // output_ptr,
+                            indices.get_int32_ptr(),
+                            batch_size,
+                            length,
+                            k,
+                            m->sorted,
+                            stream);
+  } else if (input.data_type == DT_FLOAT) {
+    ArgTopK::forward_kernel(m,
+                            input.get_float_ptr(),
+                            // output_ptr,
+                            indices.get_int32_ptr(),
+                            batch_size,
+                            length,
+                            k,
+                            m->sorted,
+                            stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
   if (m->profiling) {
     hipEventRecord(t_end, stream);
     checkCUDA(hipEventSynchronize(t_end));
@@ -445,6 +485,7 @@ void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
   }
 }
 
-ArgTopKMeta::ArgTopKMeta(FFHandler handler) : OpMeta(handler) {}
+ArgTopKMeta::ArgTopKMeta(FFHandler handler, Op const *op)
+    : OpMeta(handler, op) {}
 
 }; // namespace FlexFlow
diff --git a/src/ops/arg_topk.cu b/src/ops/arg_topk.cu
index 82fc113d4f..9583af525e 100644
--- a/src/ops/arg_topk.cu
+++ b/src/ops/arg_topk.cu
@@ -363,8 +363,9 @@ __global__ void arg_topk_forward_kernel(T const *__restrict__ input,
 }
 
 /*static*/
+template <typename DT>
 void ArgTopK::forward_kernel(ArgTopKMeta const *m,
-                             float const *input_ptr,
+                             DT const *input_ptr,
                              // float *output_ptr,
                              int *indices_ptr,
                              size_t batch_size,
@@ -377,7 +378,7 @@ void ArgTopK::forward_kernel(ArgTopKMeta const *m,
   int num_shards = 0;
   {
     constexpr auto shared_memory_size = 48 << 10;
-    auto const heap_size = k * sizeof(Entry<float>);
+    auto const heap_size = k * sizeof(Entry<DT>);
     // shared_memory_size = (num_shards + 1) * heap_size <=>
     num_shards = shared_memory_size / heap_size - 1;
     assert(num_shards > 0);
@@ -386,7 +387,7 @@ void ArgTopK::forward_kernel(ArgTopKMeta const *m,
     }
   }
   // We are limited by the amount of shared memory we have per block.
-  size_t shared_memory_size = (num_shards + 1) * k * sizeof(Entry<float>);
+  size_t shared_memory_size = (num_shards + 1) * k * sizeof(Entry<DT>);
   // size_t num_blocks = (batch_size + num_shards - 1) / num_shards;
   size_t num_blocks = batch_size;
   assert(num_shards >= (size_t)k);
@@ -403,16 +404,43 @@ void ArgTopK::forward_kernel(ArgTopKMeta const *m,
 
 /*static*/
 void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
-                                     float const *input_ptr,
+                                     GenericTensorAccessorR const &input,
                                      // float *output_ptr,
-                                     int *indices_ptr,
-                                     size_t batch_size,
-                                     int length,
-                                     int k,
-                                     bool sorted) {
+                                     GenericTensorAccessorW const &indices) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
+  // Domain in1_domain = runtime->get_index_space_domain(
+  //     ctx, task->regions[0].region.get_index_space());
+  //   Domain out1_domain = runtime->get_index_space_domain(
+  //       ctx, task->regions[1].region.get_index_space());
+  // Domain out2_domain = runtime->get_index_space_domain(
+  //     ctx, task->regions[1].region.get_index_space());
+  int numdims = input.domain.get_dim();
+  assert(indices.domain.get_dim() == numdims);
+
+  int in_cols = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+  // int out1_cols = out1_domain.hi()[0] - out1_domain.lo()[0] + 1;
+  int out2_cols = indices.domain.hi()[0] - indices.domain.lo()[0] + 1;
+
+  // assert(out1_domain == out2_domain);
+  for (int i = 1; i < input.domain.get_dim(); i++) {
+    assert(input.domain.lo()[i] == indices.domain.lo()[i]);
+    assert(input.domain.hi()[i] == indices.domain.hi()[i]);
+  }
+  // float const *in_ptr = helperGetTensorPointerRO<float>(
+  //     regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  //   float *value_ptr = helperGetTensorPointerWO<float>(
+  //       regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  // int *index_ptr = helperGetTensorPointerWO<int>(
+  //    regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  int length = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+  int k = indices.domain.hi()[0] - indices.domain.lo()[0] +
+          1; /*TODO: This prints to 5*/
+  size_t batch_size = input.domain.get_volume() / length;
+  assert(indices.domain.get_volume() / k == batch_size);
+
   cudaEvent_t t_start, t_end;
   if (m->profiling) {
     cudaEventCreate(&t_start);
@@ -420,15 +448,29 @@ void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
     cudaEventRecord(t_start, stream);
   }
 
-  ArgTopK::forward_kernel(m,
-                          input_ptr,
-                          // output_ptr,
-                          indices_ptr,
-                          batch_size,
-                          length,
-                          k,
-                          sorted,
-                          stream);
+  if (input.data_type == DT_HALF) {
+    ArgTopK::forward_kernel(m,
+                            input.get_half_ptr(),
+                            // output_ptr,
+                            indices.get_int32_ptr(),
+                            batch_size,
+                            length,
+                            k,
+                            m->sorted,
+                            stream);
+  } else if (input.data_type == DT_FLOAT) {
+    ArgTopK::forward_kernel(m,
+                            input.get_float_ptr(),
+                            // output_ptr,
+                            indices.get_int32_ptr(),
+                            batch_size,
+                            length,
+                            k,
+                            m->sorted,
+                            stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
 
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
@@ -441,6 +483,7 @@ void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
   }
 }
 
-ArgTopKMeta::ArgTopKMeta(FFHandler handler) : OpMeta(handler) {}
+ArgTopKMeta::ArgTopKMeta(FFHandler handler, Op const *op)
+    : OpMeta(handler, op) {}
 
 }; // namespace FlexFlow
diff --git a/src/ops/attention.cc b/src/ops/attention.cc
index 7af6cb8697..8494981cf6 100644
--- a/src/ops/attention.cc
+++ b/src/ops/attention.cc
@@ -59,8 +59,11 @@ Tensor FFModel::multihead_attention(const Tensor query,
                                     bool bias,
                                     bool add_bias_kv,
                                     bool add_zero_attn,
+                                    DataType data_type,
                                     Initializer *kernel_initializer,
                                     char const *name) {
+  // Currently only support float for the original attention operator
+  assert(data_type == DT_NONE || data_type == DT_FLOAT);
   Layer *li = new Layer(this,
                         OP_MULTIHEAD_ATTENTION,
                         DT_FLOAT,
diff --git a/src/ops/beam_topk.cc b/src/ops/beam_topk.cc
index 16c14bdeca..d67c84a9df 100644
--- a/src/ops/beam_topk.cc
+++ b/src/ops/beam_topk.cc
@@ -145,7 +145,7 @@ BeamTopK::BeamTopK(FFModel &model,
   outputs[0] = model.create_parallel_tensor_legion_ordering(
       numdim, inputs[0]->dims, DT_INT32, this, 0 /*owner_idx*/);
   outputs[1] = model.create_parallel_tensor_legion_ordering(
-      numdim, inputs[0]->dims, _input->data_type, this, 1 /*owner_idx*/);
+      numdim, inputs[0]->dims, DT_FLOAT, this, 1 /*owner_idx*/);
   outputs[2] = model.create_parallel_tensor_legion_ordering(
       numdim, inputs[0]->dims, DT_INT32, this, 2 /*owner_idx*/);
 }
@@ -270,10 +270,11 @@ OpMeta *BeamTopK::init_task(Task const *task,
                             Runtime *runtime) {
   BeamTopK *topk = (BeamTopK *)task->args;
   FFHandler handle = *((FFHandler *)task->local_args);
-  BeamTopKMeta *m = new BeamTopKMeta(handle);
+  BeamTopKMeta *m = new BeamTopKMeta(handle, topk);
   m->profiling = topk->profiling;
   m->sorted = topk->sorted;
   m->max_beam_width = topk->max_beam_width;
+  m->input_type[0] = topk->inputs[0]->data_type;
   return m;
 }
 
@@ -341,7 +342,6 @@ BeamInferenceResult
 
   assert(regions.size() == 4);
   assert(task->regions.size() == 4);
-
   BeamSearchBatchConfig const *bc = (BeamSearchBatchConfig *)task->args;
 
   // std::cout << "beam search topk inference: "
@@ -356,13 +356,16 @@ BeamInferenceResult
       ctx, task->regions[1].region.get_index_space());
   int numdims = in1_domain.get_dim();
 
-  float const *in_ptr = helperGetTensorPointerRO<float>(
-      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  // float const *in_ptr = helperGetTensorPointerRO<float>(
+  //     regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
   //   float *value_ptr = helperGetTensorPointerWO<float>(
   //       regions[1], task->regions[1], FID_DATA, ctx, runtime);
   int *index_ptr = helperGetTensorPointerWO<int>(
       regions[1], task->regions[1], FID_DATA, ctx, runtime);
 
+  // );
   float *value_ptr = helperGetTensorPointerWO<float>(
       regions[2], task->regions[2], FID_DATA, ctx, runtime);
 
@@ -396,7 +399,7 @@ BeamInferenceResult
   // need meta for: how many sub requests in a main request
   BeamTopK::forward_kernel_wrapper(m,
                                    bc,
-                                   in_ptr,
+                                   input,
                                    value_ptr,
                                    index_ptr,
                                    parent_ptr,
@@ -408,6 +411,13 @@ BeamInferenceResult
 
   download_tensor<int>(index_ptr, ir.token_ids, batch_size * m->max_beam_width);
   download_tensor<float>(value_ptr, ir.probs, batch_size * m->max_beam_width);
+  // if(m->output_type[0] == DT_FLOAT){
+  //     download_tensor<float>(value.get_float_ptr(), ir.probs, batch_size *
+  //     m->max_beam_width);
+  // }else if(m->output_type[0] == DT_HALF){
+  //     download_tensor<float>(value.get_half_ptr(), ir.probs, batch_size *
+  //     m->max_beam_width);
+  // }
   download_tensor<int>(
       parent_ptr, ir.parent_id, batch_size * m->max_beam_width);
   return ir;
diff --git a/src/ops/beam_topk.cpp b/src/ops/beam_topk.cpp
index 7e9421f299..1817eae4da 100644
--- a/src/ops/beam_topk.cpp
+++ b/src/ops/beam_topk.cpp
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/ops/beam_topk.h"
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/utils/hip_helper.h"
 #include <hip/hip_runtime.h>
 
@@ -24,6 +25,8 @@ using Legion::coord_t;
 enum class HeapType { kMinHeap, kMaxHeap };
 enum class PreferIndices { kLower, kHigher };
 
+LegionRuntime::Logger::Category log_beam_topk("BeamTopK");
+
 template <typename T>
 struct Entry {
   int index;
@@ -264,12 +267,13 @@ __device__ void mergeBeamShards(int num_shards,
                                 int max_heap_size,
                                 int request_id,
                                 int *parent_id,
-                                float *probs,
+                                T *probs,
                                 Entry<T> *__restrict__ entries,
                                 Entry<T> *__restrict__ top_k_heap,
-                                T *top_k_values,
+                                float *top_k_values,
                                 int *top_k_indices,
-                                int *top_k_parents) {
+                                int *top_k_parents,
+                                bool verbose) {
   // If k < num_shards, we can use a min-heap with k elements to get the top k
   // of the sorted blocks.
   // If k > num_shards, we can initialize a min-heap with the top element from
@@ -286,15 +290,9 @@ __device__ void mergeBeamShards(int num_shards,
     // Initialize the heap as a min-heap.
     for (int slot = 0; slot < heap_size; slot++) {
       // int beam = (slot % max_heap_size) / k;
-      float prob = probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
-                         ((slot % max_heap_size) / k)];
+      T prob = probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+                     ((slot % max_heap_size) / k)];
       min_heap.assign(slot, {slot, (entries[slot].value * prob)});
-      if (batch_index == 0) {
-        printf("slot %d, value %.15f, prob %15f\n",
-               slot,
-               entries[slot].value,
-               prob);
-      }
     }
     min_heap.build(heap_size);
 
@@ -303,15 +301,8 @@ __device__ void mergeBeamShards(int num_shards,
       auto const entry = entries[shard];
       auto const root = min_heap.root();
 
-      float prob = probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
-                         ((shard % max_heap_size) / k)];
-      if (batch_index == 0) {
-        printf("shard %d, index %d, value %.15f, prob %.15f\n",
-               shard,
-               entry.index,
-               entry.value,
-               prob);
-      }
+      T prob = probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+                     ((shard % max_heap_size) / k)];
       if (entry.value * prob < root.value) {
         continue;
       }
@@ -339,7 +330,7 @@ __device__ void mergeBeamShards(int num_shards,
     int const last_k = k - 1;
     for (int rank = 0; rank < last_k; rank++) {
       Entry<T> const &max_element = max_heap.root();
-      top_k_values[rank] = max_element.value;
+      top_k_values[rank] = __half2float(max_element.value);
       int shard_index = max_element.index;
       top_k_indices[rank] = entries[shard_index].index;
       top_k_parents[rank] =
@@ -347,14 +338,8 @@ __device__ void mergeBeamShards(int num_shards,
                     ((shard_index % max_heap_size) / k)];
       int next_shard_index = shard_index + num_shards;
 
-      float prob = probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
-                         ((next_shard_index % max_heap_size) / k)];
-      if (batch_index == 0) {
-        printf("next_shard_index %d, value %.15f, prob %.15f\n",
-               next_shard_index,
-               entries[next_shard_index].value,
-               prob);
-      }
+      T prob = probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+                     ((next_shard_index % max_heap_size) / k)];
 
       max_heap.replace_root(
           {next_shard_index, entries[next_shard_index].value * prob},
@@ -363,7 +348,7 @@ __device__ void mergeBeamShards(int num_shards,
 
     // rank == last_k.
     Entry<T> const &max_element = max_heap.root();
-    top_k_values[last_k] = max_element.value;
+    top_k_values[last_k] = __half2float(max_element.value);
     int shard_index = max_element.index;
     top_k_indices[last_k] = entries[shard_index].index;
     top_k_parents[last_k] =
@@ -390,15 +375,15 @@ __global__ void beam_topk_forward_kernel(T const *__restrict__ input,
                                          int k,
                                          int max_heap_size,
                                          int *parent_ids,
-                                         float *acc_probs,
+                                         T *acc_probs,
                                          int *gpu_block_start_index,
                                          int *gpu_request_id,
                                          int *tokens_per_request,
                                          bool sorted,
-                                         T *__restrict__ output,
+                                         float *__restrict__ output,
                                          int *__restrict__ indices,
                                          int *__restrict__ parents,
-                                         bool is_print) {
+                                         bool verbose) {
   __shared__ char shared_memory[48 << 10];
   int const batch_index = blockIdx.x;
   // T const *batch_input = input + batch_index * length;
@@ -409,7 +394,7 @@ __global__ void beam_topk_forward_kernel(T const *__restrict__ input,
   Entry<T> *shared_entries = (Entry<T> *)shared_memory;
 
   int sub_request_id = thread_index / k;
-  // if (is_print) {
+  // if (verbose) {
   //   printf("beam kernel: batch_index: %d, thread_index %d, sub_request_id %d,
   //   "
   //          "request_id %d, token_nums %d\n",
@@ -423,20 +408,6 @@ __global__ void beam_topk_forward_kernel(T const *__restrict__ input,
   T const *batch_input = input + gpu_block_start_index[batch_index] +
                          (sub_request_id * token_nums * length);
 
-  if (batch_index == 0) {
-    printf("request 0 start index: thread index %d, offset %d, batch_input %p, "
-           "acc index %d acc "
-           "prob %f, thread_count %d, request_id %d\n",
-           thread_index,
-           gpu_block_start_index[batch_index] +
-               (sub_request_id * token_nums * length),
-           batch_input,
-           request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH + sub_request_id,
-           acc_probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
-                     sub_request_id],
-           thread_count,
-           request_id);
-  }
   // printf("thread index %d, thread_count %d, batch_index %d\n", thread_index,
   // thread_count, batch_index);
   heapBeamTopK<T, StridedData>(batch_input,
@@ -466,18 +437,18 @@ __global__ void beam_topk_forward_kernel(T const *__restrict__ input,
   if (thread_index == 0) {
     // merge beam_width heaps and store the parent
     // find which req it belongs to, replace the offset
-    printf("merge heaps, batch index: %d, sub_request_id %d, value %f\n",
-           batch_index,
-           sub_request_id,
-           acc_probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
-                     sub_request_id]);
+    // printf("merge heaps, batch index: %d, sub_request_id %d, value %f\n",
+    //       batch_index,
+    //       sub_request_id,
+    //       acc_probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+    //                 sub_request_id]);
     int const offset = batch_index * k;
     auto batch_output = output + offset;
     auto batch_indices = indices + offset;
     auto batch_parents = parents + offset;
     Entry<T> *top_k_heap = shared_entries + thread_count * k;
 
-    // if(batch_index == 0 && is_print){
+    // if(batch_index == 0 && verbose) {
     //   for(int i = 0; i < 18; i++){
     //       printf("see value: %.15f\n", shared_entries[i].value);
     //   }
@@ -495,14 +466,16 @@ __global__ void beam_topk_forward_kernel(T const *__restrict__ input,
                     top_k_heap,
                     batch_output,
                     batch_indices,
-                    batch_parents);
+                    batch_parents,
+                    verbose /*verbose prints*/);
   }
 }
 
 /*static*/
+template <typename DT>
 void BeamTopK::forward_kernel(BeamTopKMeta const *m,
                               BeamSearchBatchConfig const *bc,
-                              float const *input_ptr,
+                              DT const *input_ptr,
                               float *output_ptr,
                               int *indices_ptr,
                               int *parent_ptr,
@@ -530,14 +503,12 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
   std::vector<int> tokens_per_request;
 
   int block_start_index = 0;
-  int depth =
-      bc->beamRequestsInfo[bc->tokensInfo[0].request_index].current_depth;
 
   // a data structure for prob, parent_id,
   int max_total_requests =
       BeamSearchBatchConfig::MAX_BEAM_WIDTH * bc->num_active_requests();
   int parent_ids[max_total_requests];
-  float acc_probs[max_total_requests];
+  DT acc_probs[max_total_requests];
 
   for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
     if (bc->request_completed[i]) {
@@ -552,7 +523,8 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
     int beam_size = bc->beamRequestsInfo[i].beam_size;
 
     // initial request
-    std::cout << "sub_requests: " << i << ", " << sub_requests[i] << "\n";
+    log_beam_topk.debug() << "sub_requests: " << i << ", " << sub_requests[i]
+                          << "\n";
     assert(sub_requests[i] > 0);
     // process sub requests
     for (int j = 0; j < sub_requests[i]; j++) {
@@ -560,12 +532,12 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
       // beam_slots[i].parent_id[j];
       acc_probs[req_index * BeamSearchBatchConfig::MAX_BEAM_WIDTH + j] =
           bc->beamRequestsInfo[i].probs[j];
-      std::cout << "probbbb req: " << i << ", sub req probability : "
-                << bc->beamRequestsInfo[i].probs[j] << ", sub request id " << j
-                << ", parent id " << bc->beamRequestsInfo[i].parent_id[j]
-                << ", data inddd"
-                << req_index * BeamSearchBatchConfig::MAX_BEAM_WIDTH + j
-                << "\n";
+      log_beam_topk.debug()
+          << "probbbb req: " << i
+          << ", sub req probability : " << bc->beamRequestsInfo[i].probs[j]
+          << ", sub request id " << j << ", parent id "
+          << bc->beamRequestsInfo[i].parent_id[j] << ", data inddd"
+          << req_index * BeamSearchBatchConfig::MAX_BEAM_WIDTH + j << "\n";
     }
 
     // process tokens
@@ -582,84 +554,71 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
     req_index += 1;
     block_start_index += (sub_requests[i] - 1) * num_new_tokens * length;
   }
-  std::cout << "what index: " << block_start_index
-            << ", block num: " << beam_num_blocks << "\n";
+  log_beam_topk.debug() << "what index: " << block_start_index
+                        << ", block num: " << beam_num_blocks << "\n";
 
   assert(batch_size >= beam_num_blocks);
   assert(bc->num_active_requests() == req_index);
 
   {
     constexpr auto shared_memory_size = 48 << 10;
-    auto const heap_size = max_heap_size * sizeof(Entry<float>);
+    auto const heap_size = max_heap_size * sizeof(Entry<DT>);
     // shared_memory_size = (num_shards + 1) * heap_size <=>
     num_shards = shared_memory_size / heap_size - 1;
     assert(num_shards > 0);
     if (num_shards > CUDA_NUM_THREADS) {
       num_shards = CUDA_NUM_THREADS;
     }
-    std::cout << "maxheap size:  " << max_heap_size << "\n";
-    std::cout << "maxbeam width:  " << max_beam_width
-              << ", heap size: " << heap_size << "\n";
+    log_beam_topk.debug() << "maxheap size:  " << max_heap_size << "\n";
+    log_beam_topk.debug() << "maxbeam width:  " << max_beam_width
+                          << ", heap size: " << heap_size << "\n";
   }
   // We are limited by the amount of shared memory we have per block.
   size_t shared_memory_size =
-      (num_shards + 1) * max_heap_size * sizeof(Entry<float>);
+      (num_shards + 1) * max_heap_size * sizeof(Entry<DT>);
 
   assert(num_shards >= (size_t)max_heap_size);
   num_shards = max_heap_size;
 
-  // parent_id, per token
-  int *gpu_parents;
-  // acc_porbs, per token
-  float *gpu_probs;
-  // each block's start index;
-  // one block means the single token in different requests;
-  int *gpu_block_start_index;
-  int *gpu_request_id;
-  int *gpu_tokens_per_request;
-
-  checkCUDA(hipMalloc(&gpu_parents, sizeof(int) * max_total_requests));
-  checkCUDA(hipMalloc(&gpu_probs, sizeof(float) * max_total_requests));
-  checkCUDA(hipMalloc(&gpu_block_start_index, sizeof(int) * beam_num_blocks));
-  checkCUDA(hipMalloc(&gpu_request_id, sizeof(int) * beam_num_blocks));
-  checkCUDA(hipMalloc(&gpu_tokens_per_request, sizeof(int) * beam_num_blocks));
-  checkCUDA(hipMemcpy(gpu_parents,
+  checkCUDA(hipMemcpy(m->parent_ids,
                       parent_ids,
                       sizeof(int) * max_total_requests,
                       hipMemcpyHostToDevice));
-  checkCUDA(hipMemcpy(gpu_probs,
+  checkCUDA(hipMemcpy(m->acc_probs,
                       acc_probs,
-                      sizeof(float) * max_total_requests,
+                      sizeof(DT) * max_total_requests,
                       hipMemcpyHostToDevice));
-  checkCUDA(hipMemcpy(gpu_block_start_index,
+  checkCUDA(hipMemcpy(m->block_start_index,
                       beam_block_start_index.data(),
                       sizeof(int) * beam_num_blocks,
                       hipMemcpyHostToDevice));
-  checkCUDA(hipMemcpy(gpu_request_id,
+  checkCUDA(hipMemcpy(m->request_id,
                       request_id.data(),
                       sizeof(int) * beam_num_blocks,
                       hipMemcpyHostToDevice));
-  checkCUDA(hipMemcpy(gpu_tokens_per_request,
+  checkCUDA(hipMemcpy(m->tokens_per_request,
                       tokens_per_request.data(),
                       sizeof(int) * beam_num_blocks,
                       hipMemcpyHostToDevice));
-
+  // int depth =
+  //     bc->beamRequestsInfo[bc->tokensInfo[0].request_index].current_depth;
   beam_topk_forward_kernel<<<beam_num_blocks, num_shards, 0, stream>>>(
       input_ptr,
       shared_memory_size,
       length,
       max_beam_width,
       max_heap_size,
-      gpu_parents,
-      gpu_probs,
-      gpu_block_start_index,
-      gpu_request_id,
-      gpu_tokens_per_request,
+      m->parent_ids,
+      static_cast<DT *>(m->acc_probs),
+      m->block_start_index,
+      m->request_id,
+      m->tokens_per_request,
       sorted,
       output_ptr,
       indices_ptr,
       parent_ptr,
-      depth == 1);
+      false /*verbose*/ // depth == 1
+  );
 
   // merge sub
 }
@@ -667,7 +626,7 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
 /*static*/
 void BeamTopK::forward_kernel_wrapper(BeamTopKMeta const *m,
                                       BeamSearchBatchConfig const *bc,
-                                      float const *input_ptr,
+                                      GenericTensorAccessorR const &input,
                                       float *output_ptr,
                                       int *indices_ptr,
                                       int *parent_ptr,
@@ -684,16 +643,29 @@ void BeamTopK::forward_kernel_wrapper(BeamTopKMeta const *m,
     hipEventRecord(t_start, stream);
   }
 
-  BeamTopK::forward_kernel(m,
-                           bc,
-                           input_ptr,
-                           output_ptr,
-                           indices_ptr,
-                           parent_ptr,
-                           batch_size,
-                           length,
-                           sorted,
-                           stream);
+  if (input.data_type == DT_HALF) {
+    BeamTopK::forward_kernel(m,
+                             bc,
+                             input.get_half_ptr(),
+                             output_ptr,
+                             indices_ptr,
+                             parent_ptr,
+                             batch_size,
+                             length,
+                             sorted,
+                             stream);
+  } else if (input.data_type == DT_FLOAT) {
+    BeamTopK::forward_kernel(m,
+                             bc,
+                             input.get_float_ptr(),
+                             output_ptr,
+                             indices_ptr,
+                             parent_ptr,
+                             batch_size,
+                             length,
+                             sorted,
+                             stream);
+  }
 
   if (m->profiling) {
     hipEventRecord(t_end, stream);
@@ -704,13 +676,25 @@ void BeamTopK::forward_kernel_wrapper(BeamTopKMeta const *m,
     hipEventDestroy(t_end);
     printf("[BeamTopK] forward time = %.2lfms\n", elapsed);
   }
-  // if(bc->beam_slots.at(0).current_depth == 1){
-  //     print_beam_tensor<float>((float *)input_ptr, 50, 32000, 15, "beam topk
-  //     input"); print_tensor<float>((float *)output_ptr, 50, "beam topk
-  //     output");
-  // }
 }
 
-BeamTopKMeta::BeamTopKMeta(FFHandler handler) : OpMeta(handler) {}
-
+BeamTopKMeta::BeamTopKMeta(FFHandler handler, Op const *op) : OpMeta(handler) {
+  DataType data_type = op->inputs[0]->data_type;
+  checkCUDA(hipMalloc(&parent_ids,
+                      sizeof(int) * BeamSearchBatchConfig::MAX_BEAM_WIDTH *
+                          BeamSearchBatchConfig::MAX_NUM_REQUESTS));
+  checkCUDA(hipMalloc(&acc_probs,
+                      sizeof(data_type_size(data_type)) *
+                          BeamSearchBatchConfig::MAX_BEAM_WIDTH *
+                          BeamSearchBatchConfig::MAX_NUM_REQUESTS));
+  checkCUDA(hipMalloc(&block_start_index,
+                      sizeof(int) * BeamSearchBatchConfig::MAX_NUM_TOKENS *
+                          BeamSearchBatchConfig::MAX_NUM_REQUESTS));
+  checkCUDA(hipMalloc(&request_id,
+                      sizeof(int) * BeamSearchBatchConfig::MAX_NUM_TOKENS *
+                          BeamSearchBatchConfig::MAX_NUM_REQUESTS));
+  checkCUDA(hipMalloc(&tokens_per_request,
+                      sizeof(int) * BeamSearchBatchConfig::MAX_NUM_TOKENS *
+                          BeamSearchBatchConfig::MAX_NUM_REQUESTS));
+}
 }; // namespace FlexFlow
diff --git a/src/ops/beam_topk.cu b/src/ops/beam_topk.cu
index d18d5c2f00..2c5ceda548 100644
--- a/src/ops/beam_topk.cu
+++ b/src/ops/beam_topk.cu
@@ -13,6 +13,7 @@
  * limitations under the License.
  */
 
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/ops/beam_topk.h"
 #include "flexflow/utils/cuda_helper.h"
 
@@ -265,10 +266,10 @@ __device__ void mergeBeamShards(int num_shards,
                                 int max_heap_size,
                                 int request_id,
                                 int *parent_id,
-                                float *probs,
+                                T *probs,
                                 Entry<T> *__restrict__ entries,
                                 Entry<T> *__restrict__ top_k_heap,
-                                T *top_k_values,
+                                float *top_k_values,
                                 int *top_k_indices,
                                 int *top_k_parents,
                                 bool verbose) {
@@ -288,8 +289,8 @@ __device__ void mergeBeamShards(int num_shards,
     // Initialize the heap as a min-heap.
     for (int slot = 0; slot < heap_size; slot++) {
       // int beam = (slot % max_heap_size) / k;
-      float prob = probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
-                         ((slot % max_heap_size) / k)];
+      T prob = probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+                     ((slot % max_heap_size) / k)];
       min_heap.assign(slot, {slot, (entries[slot].value * prob)});
       if (verbose && batch_index == 0) {
         printf("slot %d, value %.15f, prob %15f\n",
@@ -305,8 +306,8 @@ __device__ void mergeBeamShards(int num_shards,
       auto const entry = entries[shard];
       auto const root = min_heap.root();
 
-      float prob = probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
-                         ((shard % max_heap_size) / k)];
+      T prob = probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+                     ((shard % max_heap_size) / k)];
       if (verbose && batch_index == 0) {
         printf("shard %d, index %d, value %.15f, prob %.15f\n",
                shard,
@@ -341,7 +342,7 @@ __device__ void mergeBeamShards(int num_shards,
     int const last_k = k - 1;
     for (int rank = 0; rank < last_k; rank++) {
       Entry<T> const &max_element = max_heap.root();
-      top_k_values[rank] = max_element.value;
+      top_k_values[rank] = __half2float(max_element.value);
       int shard_index = max_element.index;
       top_k_indices[rank] = entries[shard_index].index;
       top_k_parents[rank] =
@@ -349,8 +350,8 @@ __device__ void mergeBeamShards(int num_shards,
                     ((shard_index % max_heap_size) / k)];
       int next_shard_index = shard_index + num_shards;
 
-      float prob = probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
-                         ((next_shard_index % max_heap_size) / k)];
+      T prob = probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+                     ((next_shard_index % max_heap_size) / k)];
       if (batch_index == 0) {
         printf("next_shard_index %d, value %.15f, prob %.15f\n",
                next_shard_index,
@@ -365,7 +366,7 @@ __device__ void mergeBeamShards(int num_shards,
 
     // rank == last_k.
     Entry<T> const &max_element = max_heap.root();
-    top_k_values[last_k] = max_element.value;
+    top_k_values[last_k] = __half2float(max_element.value);
     int shard_index = max_element.index;
     top_k_indices[last_k] = entries[shard_index].index;
     top_k_parents[last_k] =
@@ -392,12 +393,12 @@ __global__ void beam_topk_forward_kernel(T const *__restrict__ input,
                                          int k,
                                          int max_heap_size,
                                          int *parent_ids,
-                                         float *acc_probs,
+                                         T *acc_probs,
                                          int *gpu_block_start_index,
                                          int *gpu_request_id,
                                          int *tokens_per_request,
                                          bool sorted,
-                                         T *__restrict__ output,
+                                         float *__restrict__ output,
                                          int *__restrict__ indices,
                                          int *__restrict__ parents,
                                          bool verbose) {
@@ -503,9 +504,10 @@ __global__ void beam_topk_forward_kernel(T const *__restrict__ input,
 }
 
 /*static*/
+template <typename DT>
 void BeamTopK::forward_kernel(BeamTopKMeta const *m,
                               BeamSearchBatchConfig const *bc,
-                              float const *input_ptr,
+                              DT const *input_ptr,
                               float *output_ptr,
                               int *indices_ptr,
                               int *parent_ptr,
@@ -538,7 +540,7 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
   int max_total_requests =
       BeamSearchBatchConfig::MAX_BEAM_WIDTH * bc->num_active_requests();
   int parent_ids[max_total_requests];
-  float acc_probs[max_total_requests];
+  DT acc_probs[max_total_requests];
 
   for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
     if (bc->request_completed[i]) {
@@ -592,7 +594,7 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
 
   {
     constexpr auto shared_memory_size = 48 << 10;
-    auto const heap_size = max_heap_size * sizeof(Entry<float>);
+    auto const heap_size = max_heap_size * sizeof(Entry<DT>);
     // shared_memory_size = (num_shards + 1) * heap_size <=>
     num_shards = shared_memory_size / heap_size - 1;
     assert(num_shards > 0);
@@ -605,7 +607,7 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
   }
   // We are limited by the amount of shared memory we have per block.
   size_t shared_memory_size =
-      (num_shards + 1) * max_heap_size * sizeof(Entry<float>);
+      (num_shards + 1) * max_heap_size * sizeof(Entry<DT>);
 
   assert(num_shards >= (size_t)max_heap_size);
   num_shards = max_heap_size;
@@ -616,7 +618,7 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
                        cudaMemcpyHostToDevice));
   checkCUDA(cudaMemcpy(m->acc_probs,
                        acc_probs,
-                       sizeof(float) * max_total_requests,
+                       sizeof(DT) * max_total_requests,
                        cudaMemcpyHostToDevice));
   checkCUDA(cudaMemcpy(m->block_start_index,
                        beam_block_start_index.data(),
@@ -639,7 +641,7 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
       max_beam_width,
       max_heap_size,
       m->parent_ids,
-      m->acc_probs,
+      static_cast<DT *>(m->acc_probs),
       m->block_start_index,
       m->request_id,
       m->tokens_per_request,
@@ -656,7 +658,7 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
 /*static*/
 void BeamTopK::forward_kernel_wrapper(BeamTopKMeta const *m,
                                       BeamSearchBatchConfig const *bc,
-                                      float const *input_ptr,
+                                      GenericTensorAccessorR const &input,
                                       float *output_ptr,
                                       int *indices_ptr,
                                       int *parent_ptr,
@@ -673,16 +675,29 @@ void BeamTopK::forward_kernel_wrapper(BeamTopKMeta const *m,
     cudaEventRecord(t_start, stream);
   }
 
-  BeamTopK::forward_kernel(m,
-                           bc,
-                           input_ptr,
-                           output_ptr,
-                           indices_ptr,
-                           parent_ptr,
-                           batch_size,
-                           length,
-                           sorted,
-                           stream);
+  if (input.data_type == DT_HALF) {
+    BeamTopK::forward_kernel(m,
+                             bc,
+                             input.get_half_ptr(),
+                             output_ptr,
+                             indices_ptr,
+                             parent_ptr,
+                             batch_size,
+                             length,
+                             sorted,
+                             stream);
+  } else if (input.data_type == DT_FLOAT) {
+    BeamTopK::forward_kernel(m,
+                             bc,
+                             input.get_float_ptr(),
+                             output_ptr,
+                             indices_ptr,
+                             parent_ptr,
+                             batch_size,
+                             length,
+                             sorted,
+                             stream);
+  }
 
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
@@ -695,12 +710,14 @@ void BeamTopK::forward_kernel_wrapper(BeamTopKMeta const *m,
   }
 }
 
-BeamTopKMeta::BeamTopKMeta(FFHandler handler) : OpMeta(handler) {
+BeamTopKMeta::BeamTopKMeta(FFHandler handler, Op const *op) : OpMeta(handler) {
+  DataType data_type = op->inputs[0]->data_type;
   checkCUDA(cudaMalloc(&parent_ids,
                        sizeof(int) * BeamSearchBatchConfig::MAX_BEAM_WIDTH *
                            BeamSearchBatchConfig::MAX_NUM_REQUESTS));
   checkCUDA(cudaMalloc(&acc_probs,
-                       sizeof(float) * BeamSearchBatchConfig::MAX_BEAM_WIDTH *
+                       sizeof(data_type_size(data_type)) *
+                           BeamSearchBatchConfig::MAX_BEAM_WIDTH *
                            BeamSearchBatchConfig::MAX_NUM_REQUESTS));
   checkCUDA(cudaMalloc(&block_start_index,
                        sizeof(int) * BeamSearchBatchConfig::MAX_NUM_TOKENS *
diff --git a/src/ops/element_binary.cc b/src/ops/element_binary.cc
index 4e5d640c08..cf90919e6b 100644
--- a/src/ops/element_binary.cc
+++ b/src/ops/element_binary.cc
@@ -395,7 +395,7 @@ OpMeta *ElementBinary::init_task(Task const *task,
                                  Runtime *runtime) {
   ElementBinary *eb = (ElementBinary *)task->args;
   FFHandler handle = *((FFHandler *)task->local_args);
-  ElementBinaryMeta *m = new ElementBinaryMeta(handle);
+  ElementBinaryMeta *m = new ElementBinaryMeta(handle, eb);
   for (int i = 0; i < eb->numInputs; i++) {
     m->trainableInputs[i] = eb->trainableInputs[i];
   }
@@ -596,8 +596,11 @@ __host__ void
                                 Runtime *runtime) {
   // const ElementBinary* ele = (const ElementBinary*) task->args;
   ElementBinaryMeta const *m = *((ElementBinaryMeta **)task->local_args);
+  GenericTensorAccessorR in1, in2;
+  GenericTensorAccessorW out;
   Domain in1_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
+
   if (!m->has_same_operands) {
     Domain in2_domain = runtime->get_index_space_domain(
         ctx, task->regions[1].region.get_index_space());
@@ -607,53 +610,78 @@ __host__ void
              m->op_type == OP_EW_MUL);
     }
   }
-  float const *in1_ptr = NULL, *in2_ptr = NULL;
-  float *out_ptr = NULL;
+
   if (m->inplace_a) {
     if (m->has_same_operands) {
       assert(regions.size() == 1);
       assert(task->regions.size() == 1);
-      out_ptr = helperGetTensorPointerRW<float>(
-          regions[0], task->regions[0], FID_DATA, ctx, runtime);
-      in2_ptr = out_ptr;
-      in1_ptr = out_ptr;
+      out = helperGetGenericTensorAccessorRW(m->output_type[0],
+                                             regions[0],
+                                             task->regions[0],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
+      in2 = out;
+      in1 = out;
     } else {
       assert(regions.size() == 2);
       assert(task->regions.size() == 2);
-      out_ptr = helperGetTensorPointerRW<float>(
-          regions[0], task->regions[0], FID_DATA, ctx, runtime);
-      in2_ptr = helperGetTensorPointerRO<float>(
-          regions[1], task->regions[1], FID_DATA, ctx, runtime);
-      in1_ptr = out_ptr;
+      out = helperGetGenericTensorAccessorRW(m->output_type[0],
+                                             regions[0],
+                                             task->regions[0],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
+      in2 = helperGetGenericTensorAccessorRO(m->input_type[1],
+                                             regions[1],
+                                             task->regions[1],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
+      in1 = out;
     }
   } else {
     if (m->has_same_operands) {
       assert(regions.size() == 2);
       assert(task->regions.size() == 2);
-      Domain out_domain = runtime->get_index_space_domain(
-          ctx, task->regions[1].region.get_index_space());
-      // assert(out_domain == in1_domain);
-      in1_ptr = helperGetTensorPointerRO<float>(
-          regions[0], task->regions[0], FID_DATA, ctx, runtime);
-      in2_ptr = in1_ptr;
-      out_ptr = helperGetTensorPointerWO<float>(
-          regions[1], task->regions[1], FID_DATA, ctx, runtime);
+      in1 = helperGetGenericTensorAccessorRO(m->input_type[0],
+                                             regions[0],
+                                             task->regions[0],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
+      in2 = in1;
+      out = helperGetGenericTensorAccessorWO(m->output_type[0],
+                                             regions[1],
+                                             task->regions[1],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
     } else {
       assert(regions.size() == 3);
       assert(task->regions.size() == 3);
-      Domain out_domain = runtime->get_index_space_domain(
-          ctx, task->regions[2].region.get_index_space());
-      // assert(out_domain == in1_domain);
-      in1_ptr = helperGetTensorPointerRO<float>(
-          regions[0], task->regions[0], FID_DATA, ctx, runtime);
-      in2_ptr = helperGetTensorPointerRO<float>(
-          regions[1], task->regions[1], FID_DATA, ctx, runtime);
-      out_ptr = helperGetTensorPointerWO<float>(
-          regions[2], task->regions[2], FID_DATA, ctx, runtime);
+      in1 = helperGetGenericTensorAccessorRO(m->input_type[0],
+                                             regions[0],
+                                             task->regions[0],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
+      in2 = helperGetGenericTensorAccessorRO(m->input_type[1],
+                                             regions[1],
+                                             task->regions[1],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
+      out = helperGetGenericTensorAccessorWO(m->output_type[0],
+                                             regions[2],
+                                             task->regions[2],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
     }
   }
 
-  forward_kernel_wrapper(m, in1_ptr, in2_ptr, out_ptr);
+  forward_kernel_wrapper(m, in1, in2, out);
 }
 
 void ElementBinary::backward(FFModel const &ff) {
@@ -855,7 +883,7 @@ bool ElementBinary::measure_operator_cost(Simulator *sim,
   if (!inputs[1]->get_sub_tensor(mv, sub_input2)) {
     return false;
   }
-  ElementBinaryMeta *m = sim->ele_binary_meta;
+  ElementBinaryMeta *m = new ElementBinaryMeta(sim->handler, this);
   m->op_type = op_type;
   m->profiling = this->profiling;
   m->inplace_a = this->inplace_a;
@@ -871,8 +899,12 @@ bool ElementBinary::measure_operator_cost(Simulator *sim,
   sim->free_all();
   float *input1_ptr = (float *)sim->allocate(sub_input1.get_volume(), DT_FLOAT);
   assert(input1_ptr != NULL);
+  GenericTensorAccessorR input1_acc(
+      inputs[0]->data_type, input1_domain, input1_ptr);
   float *input2_ptr = (float *)sim->allocate(sub_input2.get_volume(), DT_FLOAT);
   assert(input2_ptr != NULL);
+  GenericTensorAccessorR input2_acc(
+      inputs[1]->data_type, input2_domain, input2_ptr);
   cost_metrics.inputs_memory += cost_metrics.total_mem_diff_from(sim->offset);
 
   float *output_ptr = NULL;
@@ -882,13 +914,15 @@ bool ElementBinary::measure_operator_cost(Simulator *sim,
     output_ptr = (float *)sim->allocate(sub_output.get_volume(), DT_FLOAT);
   }
   assert(output_ptr != NULL);
+  GenericTensorAccessorW output_acc(
+      outputs[0]->data_type, output_domain, output_ptr);
   cost_metrics.outputs_memory += cost_metrics.total_mem_diff_from(sim->offset);
 
   assert(m->profiling == false);
 
   std::function<void()> forward, backward;
   forward = [&] {
-    forward_kernel_wrapper(m, input1_ptr, input2_ptr, output_ptr);
+    forward_kernel_wrapper(m, input1_acc, input2_acc, output_acc);
   };
   if (sim->computationMode == COMP_MODE_TRAINING) {
     float *input1_grad_ptr =
@@ -937,6 +971,7 @@ bool ElementBinary::measure_operator_cost(Simulator *sim,
                       cost_metrics.forward_time);
   }
 
+  delete m;
   return true;
 }
 
diff --git a/src/ops/element_unary.cc b/src/ops/element_unary.cc
index 7752d30828..f0713dd0a1 100644
--- a/src/ops/element_unary.cc
+++ b/src/ops/element_unary.cc
@@ -27,11 +27,11 @@ Tensor FFModel::unary(OperatorType op,
                       char const *name,
                       float scalar) {
   Layer *ele = nullptr;
-  DataType dtype;
-  // FIXME: currently cast input to float if it has a lower type
-  if (x->data_type < DT_FLOAT) {
+  DataType dtype = x->data_type;
+  // if (x->data_type < DT_FLOAT) {
+  if (false) {
     dtype = DT_FLOAT;
-    std::string str(name);
+    std::string str = nullptr ? "" : std::string(name);
     Tensor new_x = cast(x, dtype, (str + "input_pre_cast").c_str());
     ele = new Layer(this,
                     op,
@@ -473,7 +473,9 @@ void ElementUnary::forward_task(Task const *task,
                                 Context ctx,
                                 Runtime *runtime) {
   ElementUnaryMeta const *m = *((ElementUnaryMeta **)task->local_args);
-  if (m->data_type == DT_FLOAT) {
+  if (m->data_type == DT_HALF) {
+    forward_task_with_type<half>(task, regions, ctx, runtime);
+  } else if (m->data_type == DT_FLOAT) {
     forward_task_with_type<float>(task, regions, ctx, runtime);
   } else if (m->data_type == DT_DOUBLE) {
     forward_task_with_type<double>(task, regions, ctx, runtime);
diff --git a/src/ops/element_unary.cpp b/src/ops/element_unary.cpp
index 43c84b0c41..424e739e13 100644
--- a/src/ops/element_unary.cpp
+++ b/src/ops/element_unary.cpp
@@ -45,10 +45,11 @@ void ElementUnary::init_kernel(ElementUnaryMeta *m,
       assert(false);
   }
   checkCUDNN(miopenSetActivationDescriptor(m->actiDesc, mode, 0.0, 0.0, 0.0));
-  checkCUDNN(cudnnSetTensorDescriptorFromDomain(m->inputTensor, input_domain));
+  checkCUDNN(cudnnSetTensorDescriptorFromDomain(
+      m->inputTensor, input_domain, m->data_type));
   // input_domain == output_domain
-  checkCUDNN(
-      cudnnSetTensorDescriptorFromDomain(m->outputTensor, output_domain));
+  checkCUDNN(cudnnSetTensorDescriptorFromDomain(
+      m->outputTensor, output_domain, m->data_type));
 }
 
 template <typename T>
@@ -81,7 +82,9 @@ __global__ void elewise_unary_forward_kernel(
         break;
       }
       case OP_GELU: {
-        out[i] = (T)(in[i] * 0.5 * erfc(-in[i] * M_SQRT1_2));
+        out[i] = (T)(in[i] * static_cast<T>(0.5f) *
+                     static_cast<T>(erfc(static_cast<float>(
+                         -in[i] * static_cast<T>(M_SQRT1_2)))));
         break;
       }
       case OP_RSQRT: {
@@ -189,7 +192,7 @@ __global__ void elewise_unary_backward_kernel(coord_t volume,
       case OP_GELU: {
         input_grad[i] =
             (T)(output_grad[i] *
-                (0.5 * erfc(-input[i] * M_SQRT1_2) -
+                (0.5 * static_cast<T>(erfc(-input[i] * M_SQRT1_2)) -
                  0.5 * M_SQRT1_2 * input[i] * exp(-input[i] * input[i] * 0.5)));
         break;
       }
@@ -284,6 +287,11 @@ ElementUnaryMeta::ElementUnaryMeta(FFHandler handler) : OpMeta(handler) {
   checkCUDNN(miopenCreateActivationDescriptor(&actiDesc));
 }
 
+template void
+    ElementUnary::forward_kernel_wrapper<half>(ElementUnaryMeta const *m,
+                                               half const *input_ptr,
+                                               half *output_ptr,
+                                               size_t num_elements);
 template void
     ElementUnary::forward_kernel_wrapper<float>(ElementUnaryMeta const *m,
                                                 float const *input_ptr,
diff --git a/src/ops/element_unary.cu b/src/ops/element_unary.cu
index d6e5bcfdc3..4a38dabe52 100644
--- a/src/ops/element_unary.cu
+++ b/src/ops/element_unary.cu
@@ -45,10 +45,11 @@ void ElementUnary::init_kernel(ElementUnaryMeta *m,
   }
   checkCUDNN(cudnnSetActivationDescriptor(
       m->actiDesc, mode, CUDNN_PROPAGATE_NAN, 0.0));
-  checkCUDNN(cudnnSetTensorDescriptorFromDomain(m->inputTensor, input_domain));
+  checkCUDNN(cudnnSetTensorDescriptorFromDomain(
+      m->inputTensor, input_domain, m->data_type));
   // input_domain == output_domain
-  checkCUDNN(
-      cudnnSetTensorDescriptorFromDomain(m->outputTensor, output_domain));
+  checkCUDNN(cudnnSetTensorDescriptorFromDomain(
+      m->outputTensor, output_domain, m->data_type));
 }
 
 template <typename T>
@@ -81,7 +82,9 @@ __global__ void elewise_unary_forward_kernel(
         break;
       }
       case OP_GELU: {
-        out[i] = (T)(in[i] * 0.5 * erfc(-in[i] * M_SQRT1_2));
+        out[i] = (T)(in[i] * static_cast<T>(0.5f) *
+                     static_cast<T>(erfc(static_cast<float>(
+                         -in[i] * static_cast<T>(M_SQRT1_2)))));
         break;
       }
       case OP_RSQRT: {
@@ -202,7 +205,7 @@ __global__ void elewise_unary_backward_kernel(coord_t volume,
       case OP_GELU: {
         input_grad[i] =
             (T)(output_grad[i] *
-                (0.5 * erfc(-input[i] * M_SQRT1_2) -
+                (0.5 * static_cast<T>(erfc(-input[i] * M_SQRT1_2)) -
                  0.5 * M_SQRT1_2 * input[i] * exp(-input[i] * input[i] * 0.5)));
         break;
       }
@@ -293,6 +296,11 @@ ElementUnaryMeta::ElementUnaryMeta(FFHandler handler) : OpMeta(handler) {
   checkCUDNN(cudnnCreateActivationDescriptor(&actiDesc));
 }
 
+template void
+    ElementUnary::forward_kernel_wrapper<half>(ElementUnaryMeta const *m,
+                                               half const *input_ptr,
+                                               half *output_ptr,
+                                               size_t num_elements);
 template void
     ElementUnary::forward_kernel_wrapper<float>(ElementUnaryMeta const *m,
                                                 float const *input_ptr,
@@ -313,7 +321,6 @@ template void
                                                   int64_t const *input_ptr,
                                                   int64_t *output_ptr,
                                                   size_t num_elements);
-
 template void
     ElementUnary::backward_kernel_wrapper<float>(ElementUnaryMeta const *m,
                                                  float const *input_ptr,
diff --git a/src/ops/fused.cpp b/src/ops/fused.cpp
index a602c5d6b1..712ed143b1 100644
--- a/src/ops/fused.cpp
+++ b/src/ops/fused.cpp
@@ -284,11 +284,10 @@ __host__ void FusedOp::forward_task(Task const *task,
         assert(my_input_accessor[0].domain == my_input_accessor[1].domain);
         assert(my_input_accessor[0].domain == my_output_accessor[0].domain);
         ElementBinaryMeta *m = (ElementBinaryMeta *)metas->meta[op];
-        Kernels::ElementBinary::forward_kernel_wrapper(
-            m,
-            my_input_accessor[0].get_float_ptr(),
-            my_input_accessor[1].get_float_ptr(),
-            my_output_accessor[0].get_float_ptr());
+        Kernels::ElementBinary::forward_kernel_wrapper(m,
+                                                       my_input_accessor[0],
+                                                       my_input_accessor[1],
+                                                       my_output_accessor[0]);
         break;
         break;
       }
diff --git a/src/ops/fused.cu b/src/ops/fused.cu
index ca2a331984..17b0f9616d 100644
--- a/src/ops/fused.cu
+++ b/src/ops/fused.cu
@@ -297,11 +297,10 @@ __host__ void FusedOp::forward_task(Task const *task,
         assert(my_input_accessor[0].domain == my_input_accessor[1].domain);
         assert(my_input_accessor[0].domain == my_output_accessor[0].domain);
         ElementBinaryMeta *m = (ElementBinaryMeta *)metas->meta[op];
-        Kernels::ElementBinary::forward_kernel_wrapper(
-            m,
-            my_input_accessor[0].get_float_ptr(),
-            my_input_accessor[1].get_float_ptr(),
-            my_output_accessor[0].get_float_ptr());
+        Kernels::ElementBinary::forward_kernel_wrapper(m,
+                                                       my_input_accessor[0],
+                                                       my_input_accessor[1],
+                                                       my_output_accessor[0]);
         break;
       }
       case OP_EMBEDDING: {
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index a0f0c34c1b..6027a2cd21 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/ops/inc_multihead_self_attention.h"
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/model.h"
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
 #include "flexflow/utils/cuda_helper.h"
@@ -65,22 +66,38 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
                                              bool bias,
                                              bool add_bias_kv,
                                              bool add_zero_attn,
+                                             DataType data_type,
                                              Initializer *kernel_initializer,
                                              bool apply_rotary_embedding,
                                              bool scaling_query,
                                              float scaling_factor,
                                              bool qk_prod_scaling,
                                              char const *name) {
+  if (data_type == DT_NONE) {
+    data_type = input->data_type;
+  }
+  Layer *li = nullptr;
   int weight_num = bias ? 2 : 1;
-  // Currently assume that
-  Layer *li = new Layer(this,
-                        OP_INC_MULTIHEAD_SELF_ATTENTION,
-                        DT_FLOAT,
-                        name,
-                        1 /*inputs*/,
-                        weight_num /*weights*/,
-                        1 /*outputs*/,
-                        input);
+  if (data_type != input->data_type) {
+    Tensor casted_input = cast(input, data_type, "type cast for IncMHA");
+    li = new Layer(this,
+                   OP_INC_MULTIHEAD_SELF_ATTENTION,
+                   data_type,
+                   name,
+                   1 /*inputs*/,
+                   weight_num /*weights*/,
+                   1 /*outputs*/,
+                   casted_input);
+  } else {
+    li = new Layer(this,
+                   OP_INC_MULTIHEAD_SELF_ATTENTION,
+                   data_type,
+                   name,
+                   1 /*inputs*/,
+                   weight_num /*weights*/,
+                   1 /*outputs*/,
+                   input);
+  }
   {
     int numdims = input->num_dims;
     int dims[MAX_TENSOR_DIM];
@@ -89,7 +106,7 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
     }
     dims[0] = embed_dim;
     li->outputs[0] = create_tensor_legion_ordering(
-        numdims, dims, DT_FLOAT, li, 0, true /*create_grad*/);
+        numdims, dims, data_type, li, 0, true /*create_grad*/);
   }
   {
     // Compute weight size
@@ -103,7 +120,7 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
     int dims[2] = {qParas + kParas + vParas + oParas, num_heads};
     li->weights[0] = create_weight_legion_ordering(2,
                                                    dims,
-                                                   DT_FLOAT,
+                                                   data_type,
                                                    li,
                                                    true /*create_grad*/,
                                                    kernel_initializer,
@@ -114,13 +131,13 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
     int dims[1] = {embed_dim * 4};
     li->weights[1] = create_weight_legion_ordering(1,
                                                    dims,
-                                                   DT_FLOAT,
+                                                   data_type,
                                                    li,
                                                    true /*create_grad*/,
                                                    kernel_initializer,
                                                    CHOSEN_SYNC_TYPE);
   }
-  li->data_type = DT_FLOAT;
+  li->data_type = data_type;
   li->add_int_property("embed_dim", embed_dim);
   li->add_int_property("num_heads", num_heads);
   li->add_int_property("kdim", kdim);
@@ -208,7 +225,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     // Initializer* _bias_initializer)
     : Op(model,
          OP_INC_MULTIHEAD_SELF_ATTENTION,
-         DT_FLOAT,
+         _input->data_type,
          name,
          1 /*inputs*/,
          (_bias ? 2 : 1), /*weights*/
@@ -260,8 +277,8 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     ParameterSyncType comm_type = ParameterSyncType::PS;
 #endif
     weights[0] = model.create_parallel_weight<3>(dims,
-                                                 DT_FLOAT,
-                                                 NULL /*owner_op*/,
+                                                 this->data_type,
+                                                 nullptr /*owner_op*/,
                                                  true /*create_grad*/,
                                                  initializer,
                                                  comm_type);
@@ -280,7 +297,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     ParameterSyncType comm_type = ParameterSyncType::PS;
 #endif
     weights[1] = model.create_parallel_weight<2>(dims,
-                                                 DT_FLOAT,
+                                                 this->data_type,
                                                  NULL /*owner_op*/,
                                                  true /*create_grad*/,
                                                  NULL,
@@ -288,7 +305,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
   }
 
   outputs[0] = model.create_parallel_tensor_legion_ordering(
-      _input->num_dims, dims, DT_FLOAT, this);
+      _input->num_dims, dims, this->data_type, this);
   /* for (int i = 0; i < numdim; i++) { */
   /*   register_output_input_parallel_dims(outputs[0], i, inputs[0], i); */
   /* } */
@@ -317,7 +334,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     // Initializer* _bias_initializer)
     : Op(model,
          OP_INC_MULTIHEAD_SELF_ATTENTION,
-         DT_FLOAT,
+         _input->data_type,
          name,
          1 /*inputs*/,
          (_bias ? 2 : 1), /*weights*/
@@ -367,7 +384,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     ParameterSyncType comm_type = ParameterSyncType::PS;
 #endif
     weights[0] = model.create_parallel_weight<3>(dims,
-                                                 DT_FLOAT,
+                                                 this->data_type,
                                                  NULL /*owner_op*/,
                                                  true /*create_grad*/,
                                                  initializer,
@@ -385,14 +402,14 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     ParameterSyncType comm_type = ParameterSyncType::PS;
 #endif
     weights[1] = model.create_parallel_weight<2>(dims,
-                                                 DT_FLOAT,
+                                                 this->data_type,
                                                  NULL /*owner_op*/,
                                                  true /*create_grad*/,
                                                  NULL,
                                                  comm_type);
   }
   outputs[0] = model.create_parallel_tensor_legion_ordering(
-      _input->num_dims, dims, DT_FLOAT, this);
+      _input->num_dims, dims, this->data_type, this);
 
   /* for (int i = 0; i < numdim; i++) { */
   /*   register_output_input_parallel_dims(outputs[0], i, inputs[0], i); */
@@ -547,12 +564,27 @@ OpMeta *IncMultiHeadSelfAttention::init_task(
       (IncMultiHeadSelfAttention *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
 
-  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
-      DT_FLOAT, regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
-      DT_FLOAT, regions[1], task->regions[1], FID_DATA, ctx, runtime);
-  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
-      DT_FLOAT, regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR input =
+      helperGetGenericTensorAccessorRO(attn->inputs[0]->data_type,
+                                       regions[0],
+                                       task->regions[0],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorR weight =
+      helperGetGenericTensorAccessorRO(attn->weights[0]->data_type,
+                                       regions[1],
+                                       task->regions[1],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorW output =
+      helperGetGenericTensorAccessorWO(attn->outputs[0]->data_type,
+                                       regions[2],
+                                       task->regions[2],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
 
   int num_samples = input.domain.hi()[2] - input.domain.lo()[2] + 1;
   assert(attn->qoSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
@@ -565,10 +597,11 @@ OpMeta *IncMultiHeadSelfAttention::init_task(
                        .best_affinity_to(task->target_proc)
                        .first();
   IncMultiHeadSelfAttentionMeta *m = new IncMultiHeadSelfAttentionMeta(
-      handle, attn, weight.get_float_ptr(), gpu_mem, num_samples, num_heads);
+      handle, attn, weight, gpu_mem, num_samples, num_heads);
 
   m->profiling = attn->profiling;
-  assert(weight.domain.get_volume() * sizeof(float) == m->weightSize);
+  assert(weight.domain.get_volume() * data_type_size(weight.data_type) ==
+         m->weightSize);
   return m;
 }
 
@@ -645,8 +678,6 @@ void IncMultiHeadSelfAttention::inference_task(
 
   assert(task->regions.size() == regions.size());
 
-  float const *bias_ptr = NULL;
-
   BatchConfig const *bc = (BatchConfig *)task->args;
   IncMultiHeadSelfAttentionMeta const *m =
       *((IncMultiHeadSelfAttentionMeta **)task->local_args);
@@ -659,19 +690,17 @@ void IncMultiHeadSelfAttention::inference_task(
       m->weight_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
   GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
       m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
-
+  GenericTensorAccessorR biases;
   if (*m->bias) {
-    GenericTensorAccessorR biases =
-        helperGetGenericTensorAccessorRO(m->weight_type[1],
-                                         regions[3],
-                                         task->regions[3],
-                                         FID_DATA,
-                                         ctx,
-                                         runtime);
+    biases = helperGetGenericTensorAccessorRO(m->weight_type[1],
+                                              regions[3],
+                                              task->regions[3],
+                                              FID_DATA,
+                                              ctx,
+                                              runtime);
     Domain bias_domain = runtime->get_index_space_domain(
         ctx, task->regions[3].region.get_index_space());
     assert(bias_domain.get_dim() == 2);
-    bias_ptr = biases.get_float_ptr();
   }
 
   Domain input_domain = runtime->get_index_space_domain(
@@ -685,12 +714,8 @@ void IncMultiHeadSelfAttention::inference_task(
   assert(weight_domain.get_dim() == 3);
   assert(output_domain.get_dim() == 4);
 
-  IncMultiHeadSelfAttention::inference_kernel_wrapper(m,
-                                                      bc,
-                                                      input.get_float_ptr(),
-                                                      weight.get_float_ptr(),
-                                                      output.get_float_ptr(),
-                                                      bias_ptr);
+  IncMultiHeadSelfAttention::inference_kernel_wrapper(
+      m, bc, input, weight, output, biases);
 #ifdef INFERENCE_TESTS
   printf("Checking IncMultiHeadSelfAttention computations...\n");
 
diff --git a/src/ops/inc_multihead_self_attention.cpp b/src/ops/inc_multihead_self_attention.cpp
index 0669b347a7..a627e0ef08 100644
--- a/src/ops/inc_multihead_self_attention.cpp
+++ b/src/ops/inc_multihead_self_attention.cpp
@@ -27,10 +27,10 @@ using Legion::Memory;
 void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     IncMultiHeadSelfAttentionMeta const *m,
     BatchConfig const *bc,
-    float const *input_ptr,
-    float const *weight_ptr,
-    float *output_ptr,
-    float const *bias_ptr) {
+    GenericTensorAccessorR const &input,
+    GenericTensorAccessorR const &weight,
+    GenericTensorAccessorW const &output,
+    GenericTensorAccessorR const &bias) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -60,7 +60,7 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
 IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     FFHandler handler,
     IncMultiHeadSelfAttention const *attn,
-    float const *weight_ptr,
+    GenericTensorAccessorR const &weight,
     Memory gpu_mem,
     int num_samples,
     int _num_heads)
@@ -87,7 +87,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     bool _qk_prod_scaling,
     bool _add_bias_kv,
     float _scaling_factor,
-    float const *weight_ptr,
+    GenericTensorAccessorR const &weight,
     Memory gpu_mem,
     int num_samples,
     int _num_heads)
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index bc4c91aa4f..33bc32224b 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -15,6 +15,7 @@
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
 #include "cuComplex.h"
 #endif
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ops/kernels/inc_multihead_self_attention_kernels.h"
 #include "flexflow/utils/cuda_helper.h"
@@ -28,8 +29,9 @@ using Legion::Memory;
 namespace Kernels {
 namespace IncMultiHeadAttention {
 
-__global__ void build_w_out_tensor(float const *weight_ptr,
-                                   float *contiguous_weight_ptr,
+template <typename DT>
+__global__ void build_w_out_tensor(DT const *weight_ptr,
+                                   DT *contiguous_weight_ptr,
                                    int vProjSize,
                                    int oProjSize,
                                    int num_heads,
@@ -44,8 +46,9 @@ __global__ void build_w_out_tensor(float const *weight_ptr,
   }
 }
 
-__global__ void apply_proj_bias_w(float *input_ptr,
-                                  float const *bias_ptr,
+template <typename DT>
+__global__ void apply_proj_bias_w(DT *input_ptr,
+                                  DT const *bias_ptr,
                                   int num_tokens,
                                   int oProjSize) {
   CUDA_KERNEL_LOOP(i, num_tokens * oProjSize) {
@@ -54,8 +57,9 @@ __global__ void apply_proj_bias_w(float *input_ptr,
   }
 }
 
-__global__ void apply_proj_bias_qkv(float *input_ptr,
-                                    float const *bias_ptr,
+template <typename DT>
+__global__ void apply_proj_bias_qkv(DT *input_ptr,
+                                    DT const *bias_ptr,
                                     int num_tokens,
                                     int qProjSize,
                                     int kProjSize,
@@ -87,8 +91,9 @@ __global__ void apply_proj_bias_qkv(float *input_ptr,
   }
 }
 
+template <typename DT>
 __global__ void
-    apply_rotary_embedding(float *input_ptr,
+    apply_rotary_embedding(DT *input_ptr,
                            cuFloatComplex *complex_input,
                            BatchConfig::PerTokenInfo const *tokenInfos,
                            int qProjSize,
@@ -139,24 +144,25 @@ __global__ void
   }
 }
 
+template <typename DT>
 void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                         BatchConfig const *bc,
-                        float const *input_ptr,
-                        float const *weight_ptr,
-                        float *output_ptr,
-                        float const *bias_ptr,
+                        DT const *input_ptr,
+                        DT const *weight_ptr,
+                        DT *output_ptr,
+                        DT const *bias_ptr,
                         cudaStream_t stream) {
 
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
-  float alpha = 1.0f, beta = 0.0f;
+  DT alpha = 1.0f, beta = 0.0f;
   assert(m->qSize == m->vSize && m->qSize == m->kSize);
-  cudaDataType_t data_type = ff_to_cuda_datatype(DT_FLOAT);
+  cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
 #if CUDA_VERSION >= 11000
   // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
   cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
 #else
-  cudaDataType_t compute_type = CUDA_R_32F;
+  cudaDataType_t compute_type = cublas_data_type;
 #endif
   // Compute (W^T)x matmul: einsum(ijkl,im->jmkl)
   // Weights: qSize x qProjSize x 3 x num_heads
@@ -184,16 +190,16 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                        k,
                                        &alpha,
                                        weight_ptr,
-                                       data_type,
+                                       cublas_data_type,
                                        lda,
                                        strideA,
                                        input_ptr,
-                                       data_type,
+                                       cublas_data_type,
                                        ldb,
                                        strideB,
                                        &beta,
                                        output_ptr,
-                                       data_type,
+                                       cublas_data_type,
                                        ldc_q,
                                        strideC,
                                        m->num_heads,
@@ -208,16 +214,16 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                        k,
                                        &alpha,
                                        weight_ptr + m_q * k,
-                                       data_type,
+                                       cublas_data_type,
                                        lda,
                                        strideA,
                                        input_ptr,
-                                       data_type,
+                                       cublas_data_type,
                                        ldb,
                                        strideB,
                                        &beta,
                                        output_ptr + m_q * n,
-                                       data_type,
+                                       cublas_data_type,
                                        ldc_k,
                                        strideC,
                                        m->num_heads,
@@ -232,16 +238,16 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                        k,
                                        &alpha,
                                        weight_ptr + (m_q + m_k) * k,
-                                       data_type,
+                                       cublas_data_type,
                                        lda,
                                        strideA,
                                        input_ptr,
-                                       data_type,
+                                       cublas_data_type,
                                        ldb,
                                        strideB,
                                        &beta,
                                        output_ptr + (m_q + m_k) * n,
-                                       data_type,
+                                       cublas_data_type,
                                        ldc_v,
                                        strideC,
                                        m->num_heads,
@@ -305,13 +311,83 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
   }
 }
 
+template <typename DT>
+void update_kv_cache_kernel(IncMultiHeadSelfAttentionMeta const *m,
+                            BatchConfig const *bc,
+                            cudaStream_t stream) {
+  int num_tokens = bc->num_active_tokens();
+  if (num_tokens > 0) {
+    int parallelism = m->kProjSize * num_tokens * m->num_heads;
+    store_kv_cache<<<GET_BLOCKS(parallelism),
+                     min(CUDA_NUM_THREADS, parallelism),
+                     0,
+                     stream>>>(static_cast<DT *>(m->devQKVProjArray),
+                               static_cast<DT *>(m->keyCache),
+                               m->token_infos,
+                               m->qProjSize,
+                               m->kProjSize,
+                               m->vProjSize,
+                               num_tokens,
+                               m->num_heads,
+                               BatchConfig::MAX_SEQ_LENGTH,
+                               /* k_cache = */ true);
+
+    parallelism = m->vProjSize * num_tokens * m->num_heads;
+    store_kv_cache<<<GET_BLOCKS(parallelism),
+                     min(CUDA_NUM_THREADS, parallelism),
+                     0,
+                     stream>>>(static_cast<DT *>(m->devQKVProjArray),
+                               static_cast<DT *>(m->valueCache),
+                               m->token_infos,
+                               m->qProjSize,
+                               m->kProjSize,
+                               m->vProjSize,
+                               num_tokens,
+                               m->num_heads,
+                               BatchConfig::MAX_SEQ_LENGTH,
+                               /* k_cache = */ false);
+  }
+}
+
+template <typename DT>
+void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
+                      BatchConfig const *bc,
+                      DT const *input_ptr,
+                      DT const *weight_ptr,
+                      DT *output_ptr,
+                      DT const *bias_ptr,
+                      cudaStream_t stream) {
+  // here because we need postion info in infernece 1
+  cudaMemcpyAsync(m->token_infos,
+                  &(bc->tokensInfo),
+                  bc->MAX_NUM_TOKENS * sizeof(BatchConfig::PerTokenInfo),
+                  cudaMemcpyHostToDevice,
+                  stream);
+  // phase 1: Implement kernel to compute KQV for input tokens
+  compute_qkv_kernel(m,
+                     bc,
+                     input_ptr,
+                     weight_ptr,
+                     static_cast<DT *>(m->devQKVProjArray),
+                     bias_ptr,
+                     stream);
+
+  // phase 2: Update key/val cache
+  update_kv_cache_kernel<DT>(m, bc, stream);
+
+  // phase 3: Compute attention score
+  // 3 kernels for pahse 3: matmul1 - softmax - matmal2
+  compute_attention_kernel(m, bc, output_ptr, bias_ptr, stream);
+}
+
 } // namespace IncMultiHeadAttention
 } // namespace Kernels
 
 using namespace Kernels::IncMultiHeadAttention;
 
-__global__ void store_kv_cache(float const *devQKVProjArray,
-                               float *cache_ptr,
+template <typename DT>
+__global__ void store_kv_cache(DT const *devQKVProjArray,
+                               DT *cache_ptr,
                                BatchConfig::PerTokenInfo const *tokenInfos,
                                int qProjSize,
                                int kProjSize,
@@ -330,7 +406,7 @@ __global__ void store_kv_cache(float const *devQKVProjArray,
     int qkv_block_size = (qProjSize + kProjSize + vProjSize) * num_tokens;
     int current_head_block_size =
         num_tokens * (k_cache ? qProjSize : qProjSize + kProjSize);
-    float val =
+    DT val =
         devQKVProjArray[head_idx * qkv_block_size + current_head_block_size +
                         token_idx * proj_size + data_idx];
     // int const req_id = id_map[token_idx].request_index;
@@ -344,49 +420,13 @@ __global__ void store_kv_cache(float const *devQKVProjArray,
   }
 }
 
-void update_kv_cache_kernel(IncMultiHeadSelfAttentionMeta const *m,
-                            BatchConfig const *bc,
-                            cudaStream_t stream) {
-  int num_tokens = bc->num_active_tokens();
-  if (num_tokens > 0) {
-    int parallelism = m->kProjSize * num_tokens * m->num_heads;
-    store_kv_cache<<<GET_BLOCKS(parallelism),
-                     min(CUDA_NUM_THREADS, parallelism),
-                     0,
-                     stream>>>(m->devQKVProjArray,
-                               m->keyCache,
-                               m->token_infos,
-                               m->qProjSize,
-                               m->kProjSize,
-                               m->vProjSize,
-                               num_tokens,
-                               m->num_heads,
-                               BatchConfig::MAX_SEQ_LENGTH,
-                               /* k_cache = */ true);
-
-    parallelism = m->vProjSize * num_tokens * m->num_heads;
-    store_kv_cache<<<GET_BLOCKS(parallelism),
-                     min(CUDA_NUM_THREADS, parallelism),
-                     0,
-                     stream>>>(m->devQKVProjArray,
-                               m->valueCache,
-                               m->token_infos,
-                               m->qProjSize,
-                               m->kProjSize,
-                               m->vProjSize,
-                               num_tokens,
-                               m->num_heads,
-                               BatchConfig::MAX_SEQ_LENGTH,
-                               /* k_cache = */ false);
-  }
-}
-
-__global__ void fill_entries_above_diagonal(float *matrix,
+template <typename DT>
+__global__ void fill_entries_above_diagonal(DT *matrix,
                                             size_t num_rows,
                                             size_t num_cols,
                                             size_t num_heads,
                                             size_t entries_above_diagonal,
-                                            float value) {
+                                            DT value) {
   CUDA_KERNEL_LOOP(i, entries_above_diagonal * num_heads) {
     size_t head_idx = i / entries_above_diagonal;
     size_t entry_idx = i % entries_above_diagonal;
@@ -397,19 +437,22 @@ __global__ void fill_entries_above_diagonal(float *matrix,
   }
 }
 
+template <typename DT>
 void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
                               BatchConfig const *bc,
-                              float *output_ptr,
-                              float const *bias_ptr,
+                              DT *output_ptr,
+                              DT const *bias_ptr,
                               cudaStream_t stream) {
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
-  cudaDataType_t cublas_data_type = ff_to_cuda_datatype(DT_FLOAT);
+  cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
+  cudnnDataType_t cudnn_data_type = ff_to_cudnn_datatype(m->output_type[0]);
+  assert(data_type_size(m->output_type[0]) == sizeof(DT));
 #if CUDA_VERSION >= 11000
   // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
   cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
 #else
-  cudaDataType_t compute_type = CUDA_R_32F;
+  cudaDataType_t compute_type = cublas_data_type;
 #endif
   // int num_requests = bc->num_active_requests();
   int num_tokens = bc->num_active_tokens();
@@ -440,16 +483,16 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     int strideC = num_new_tokens * total_tokens;
 
     // a flag of using this scaling alpha
-    float alpha = 1.0f, beta = 0.0f;
+    DT alpha = 1.0f, beta = 0.0f;
     if (*m->qk_prod_scaling) {
-      alpha = 1.0f / (float)sqrt(m->kProjSize), beta = 0.0f;
+      alpha = static_cast<DT>(1.0f / sqrt(m->kProjSize));
     }
     // To get A, skip over Q entries from previous requests (same head)
-    void const *A = (void const *)(m->devQKVProjArray +
-                                   tokens_previous_requests * m->qProjSize);
+    void const *A = static_cast<DT *>(m->devQKVProjArray) +
+                    tokens_previous_requests * m->qProjSize;
     // To get B, skip over K entries from previous requests (all heads +
     // padding)
-    void const *B = (void const *)(m->keyCache + i * kt_req_block_size);
+    void const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
     // To get C, skip over QK^T products from previous requests
     void *C = (void *)(m->qk_prods);
 
@@ -486,12 +529,12 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
       fill_entries_above_diagonal<<<GET_BLOCKS(parallelism),
                                     min((size_t)CUDA_NUM_THREADS, parallelism),
                                     0,
-                                    stream>>>((float *)C,
+                                    stream>>>(static_cast<DT *>(C),
                                               num_new_tokens,
                                               total_tokens,
                                               m->num_heads,
                                               entries_above_diagonal,
-                                              -INFINITY);
+                                              static_cast<DT>(-INFINITY));
     }
     // Compute Softmax(QK^T/sqrt(d_k))
     cudnnTensorDescriptor_t qk_tensor;
@@ -511,12 +554,12 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     int w_param = num_new_tokens;
     checkCUDNN(cudnnSetTensor4dDescriptor(qk_tensor,
                                           CUDNN_TENSOR_NCHW,
-                                          CUDNN_DATA_FLOAT,
+                                          cudnn_data_type,
                                           n_param,
                                           c_param,
                                           h_param,
                                           w_param));
-    alpha = 1.0f, beta = 0.0f;
+    float softmax_alpha = 1.0f, softmax_beta = 0.0f;
     void *C_softmax = (void *)(m->qk_prods_softmax);
     // The softmax operation below is executed according to the
     // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
@@ -525,12 +568,12 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     checkCUDNN(cudnnSoftmaxForward(m->handle.dnn,
                                    CUDNN_SOFTMAX_ACCURATE,
                                    CUDNN_SOFTMAX_MODE_CHANNEL,
-                                   &alpha,
+                                   &softmax_alpha,
                                    qk_tensor,
-                                   (void *)((float *)C),
-                                   &beta,
+                                   C,
+                                   &softmax_beta,
                                    qk_tensor,
-                                   (void *)((float *)C_softmax)));
+                                   C_softmax));
     // Matmul softmax(QK^T/sqrt(d_k)) by V
     alpha = 1.0f, beta = 0.0f;
     m_ = num_new_tokens;
@@ -542,14 +585,14 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     strideC = num_new_tokens * m->vProjSize;
     // To get A, skip over softmax(QK^T/sqrt(d_k)) entries from previous
     // requests (all heads)
-    A = (void const *)C_softmax;
+    A = static_cast<DT *>(C_softmax);
     // To get B, skip over V^T entries from previous requests (all heads +
     // padding)
-    B = (void const *)(m->valueCache + i * vt_req_block_size);
+    B = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
     // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
     // requests
-    C = (void *)(m->attn_heads +
-                 tokens_previous_requests * m->num_heads * m->vProjSize);
+    C = static_cast<DT *>(m->attn_heads) +
+        tokens_previous_requests * m->num_heads * m->vProjSize;
 
     checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                          CUBLAS_OP_N,
@@ -580,9 +623,9 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     k = m->vProjSize * m->num_heads;
     n = num_new_tokens;
     lda = k, ldb = n, ldc = m_;
-    A = (void const *)m->W_out_contiguous;
-    B = (void const *)C;
-    C = (void *)(output_ptr + tokens_previous_requests * m->oProjSize);
+    A = m->W_out_contiguous;
+    B = C;
+    C = (output_ptr + tokens_previous_requests * m->oProjSize);
 
     checkCUDA(cublasGemmEx(m->handle.blas,
                            CUBLAS_OP_T,
@@ -623,12 +666,13 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
 void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     IncMultiHeadSelfAttentionMeta const *m,
     BatchConfig const *bc,
-    float const *input_ptr,
-    float const *weight_ptr,
-    float *output_ptr,
-    float const *bias_ptr) {
+    GenericTensorAccessorR const &input,
+    GenericTensorAccessorR const &weight,
+    GenericTensorAccessorW const &output,
+    GenericTensorAccessorR const &bias) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
+  bool use_bias = *m->bias;
 
   cudaEvent_t t_start, t_end;
   if (m->profiling) {
@@ -637,40 +681,34 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     cudaEventRecord(t_start, stream);
   }
 
-  // reload the weight_o
-
-  if (!(*m->has_load_weights)) {
-    int parallelism = m->vProjSize * m->oProjSize * m->num_heads;
-    build_w_out_tensor<<<GET_BLOCKS(parallelism),
-                         min(CUDA_NUM_THREADS, parallelism),
-                         0,
-                         stream>>>(weight_ptr,
-                                   m->W_out_contiguous,
-                                   m->vProjSize,
-                                   m->oProjSize,
-                                   m->num_heads,
-                                   (m->qSize * m->qProjSize +
-                                    m->kSize * m->kProjSize +
-                                    m->vSize * m->vProjSize));
-    *m->has_load_weights = true;
+  assert(input.data_type == weight.data_type);
+  assert(input.data_type == output.data_type);
+  if (use_bias) {
+    assert(input.data_type == bias.data_type);
+  }
+  if (input.data_type == DT_HALF) {
+    half const *bias_ptr =
+        use_bias ? bias.get_half_ptr() : static_cast<half const *>(nullptr);
+    Kernels::IncMultiHeadAttention::inference_kernel(m,
+                                                     bc,
+                                                     input.get_half_ptr(),
+                                                     weight.get_half_ptr(),
+                                                     output.get_half_ptr(),
+                                                     bias_ptr,
+                                                     stream);
+  } else if (input.data_type == DT_FLOAT) {
+    float const *bias_ptr =
+        use_bias ? bias.get_float_ptr() : static_cast<float const *>(nullptr);
+    Kernels::IncMultiHeadAttention::inference_kernel(m,
+                                                     bc,
+                                                     input.get_float_ptr(),
+                                                     weight.get_float_ptr(),
+                                                     output.get_float_ptr(),
+                                                     bias_ptr,
+                                                     stream);
+  } else {
+    assert(false && "Unspported data type");
   }
-  // here because we need postion info in infernece 1
-  cudaMemcpyAsync(m->token_infos,
-                  &(bc->tokensInfo),
-                  bc->MAX_NUM_TOKENS * sizeof(BatchConfig::PerTokenInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
-  // phase 1: Implement kernel to compute KQV for input tokens
-  compute_qkv_kernel(
-      m, bc, input_ptr, weight_ptr, m->devQKVProjArray, bias_ptr, stream);
-
-  // phase 2: Update key/val cache
-  update_kv_cache_kernel(m, bc, stream);
-
-  // phase 3: Compute attention score
-  // 3 kernels for pahse 3: matmul1 - softmax - matmal2
-  compute_attention_kernel(m, bc, output_ptr, bias_ptr, stream);
-
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
     checkCUDA(cudaEventSynchronize(t_end));
@@ -688,7 +726,7 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
 IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     FFHandler handler,
     IncMultiHeadSelfAttention const *attn,
-    float const *weight_ptr,
+    GenericTensorAccessorR const &weight,
     Memory gpu_mem,
     int num_samples,
     int _num_heads)
@@ -708,7 +746,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
                                     attn->qk_prod_scaling,
                                     attn->add_bias_kv,
                                     attn->scaling_factor,
-                                    weight_ptr,
+                                    weight,
                                     gpu_mem,
                                     num_samples,
                                     _num_heads) {}
@@ -730,7 +768,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     bool _qk_prod_scaling,
     bool _add_bias_kv,
     float _scaling_factor,
-    float const *weight_ptr,
+    GenericTensorAccessorR const &weight,
     Memory gpu_mem,
     int num_samples,
     int _num_heads)
@@ -738,7 +776,6 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDNN(cudnnSetStream(handler.dnn, stream));
-
   qSize = _qSize;
   kSize = _kSize;
   vSize = _vSize;
@@ -750,11 +787,12 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   assert(qProjSize == kProjSize); // required for attention QK^T matmul
   vProjSize = _vProjSize;
   oProjSize = _oProjSize;
+  size_t size_of_dt = data_type_size(attn->data_type);
 
   num_heads = _num_heads;
   weights_params = (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize +
                     oProjSize * (vProjSize > 0 ? vProjSize : vSize));
-  weightSize = weights_params * num_heads * sizeof(float);
+  weightSize = weights_params * num_heads * size_of_dt;
   has_load_weights = (bool *)calloc(1, sizeof(bool));
   *has_load_weights = false;
   apply_rotary_embedding = (bool *)calloc(1, sizeof(bool));
@@ -818,7 +856,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     size_t totalSize =
         (qkv_max_proj_size + key_cache_size + value_cache_size +
          2 * qk_prod_size + attn_heads_size + W_out_contiguous_size) *
-            sizeof(float) +
+            size_of_dt +
         tokeninfo_size * sizeof(BatchConfig::PerTokenInfo) +
         complex_size * sizeof(cuFloatComplex); // more components will
                                                // be added here later
@@ -834,29 +872,54 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
                                            0,
                                            Realm::ProfilingRequestSet())
         .wait();
-    devQKVProjArray = (float *)reserveInst.pointer_untyped(0, sizeof(char));
-    keyCache = (float *)devQKVProjArray + qkv_max_proj_size;
-    valueCache = (float *)keyCache + key_cache_size;
-    token_infos = (BatchConfig::PerTokenInfo *)(valueCache + value_cache_size);
-    qk_prods = (float *)(token_infos + tokeninfo_size);
-    qk_prods_softmax = (float *)(qk_prods + qk_prod_size);
-    attn_heads = (float *)qk_prods_softmax + qk_prod_size;
-    W_out_contiguous = (float *)attn_heads + attn_heads_size;
-    complex_input =
-        (cuFloatComplex *)(W_out_contiguous + W_out_contiguous_size);
-    int parallelism = vProjSize * oProjSize * num_heads;
-    build_w_out_tensor<<<GET_BLOCKS(parallelism),
-                         min(CUDA_NUM_THREADS, parallelism),
-                         0,
-                         stream>>>(
-        weight_ptr,
-        W_out_contiguous,
-        vProjSize,
-        oProjSize,
-        num_heads,
-        (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize));
+    off_t offset = 0;
+    devQKVProjArray = reserveInst.pointer_untyped(offset, 0);
+    offset += qkv_max_proj_size * size_of_dt;
+    keyCache = reserveInst.pointer_untyped(offset, 0);
+    offset += key_cache_size * size_of_dt;
+    valueCache = reserveInst.pointer_untyped(offset, 0);
+    offset += value_cache_size * size_of_dt;
+    token_infos = reserveInst.pointer<BatchConfig::PerTokenInfo>(offset);
+    offset += sizeof(BatchConfig::PerTokenInfo) * tokeninfo_size;
+    qk_prods = reserveInst.pointer_untyped(offset, 0);
+    offset += qk_prod_size * size_of_dt;
+    qk_prods_softmax = reserveInst.pointer_untyped(offset, 0);
+    offset += qk_prod_size * size_of_dt;
+    attn_heads = reserveInst.pointer_untyped(offset, 0);
+    offset += attn_heads_size * size_of_dt;
+    W_out_contiguous = reserveInst.pointer_untyped(offset, 0);
+    offset += W_out_contiguous_size * size_of_dt;
+    complex_input = reserveInst.pointer<cuFloatComplex>(offset);
+    offset += complex_size * sizeof(cuFloatComplex);
+    if (weight.data_type == DT_FLOAT) {
+      int parallelism = vProjSize * oProjSize * num_heads;
+      build_w_out_tensor<<<GET_BLOCKS(parallelism),
+                           min(CUDA_NUM_THREADS, parallelism),
+                           0,
+                           stream>>>(
+          weight.get_float_ptr(),
+          (float *)W_out_contiguous,
+          vProjSize,
+          oProjSize,
+          num_heads,
+          (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize));
+    } else if (weight.data_type == DT_HALF) {
+      int parallelism = vProjSize * oProjSize * num_heads;
+      build_w_out_tensor<<<GET_BLOCKS(parallelism),
+                           min(CUDA_NUM_THREADS, parallelism),
+                           0,
+                           stream>>>(
+          weight.get_half_ptr(),
+          (half *)W_out_contiguous,
+          vProjSize,
+          oProjSize,
+          num_heads,
+          (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize));
+    } else {
+      assert(false && "Unsupported data_type");
+    }
+    assert(offset == totalSize);
   }
-
   cudaStreamSynchronize(stream);
 }
 
diff --git a/src/ops/kernels/element_binary_kernels.cpp b/src/ops/kernels/element_binary_kernels.cpp
index 4cdc839b59..3aef875d1f 100644
--- a/src/ops/kernels/element_binary_kernels.cpp
+++ b/src/ops/kernels/element_binary_kernels.cpp
@@ -22,7 +22,8 @@ namespace FlexFlow {
 using Legion::coord_t;
 using Legion::Domain;
 
-ElementBinaryMeta::ElementBinaryMeta(FFHandler handler) : OpMeta(handler) {
+ElementBinaryMeta::ElementBinaryMeta(FFHandler handler, Op const *op)
+    : OpMeta(handler, op) {
   checkCUDNN(miopenCreateTensorDescriptor(&input1Tensor));
   checkCUDNN(miopenCreateTensorDescriptor(&input2Tensor));
   checkCUDNN(miopenCreateTensorDescriptor(&outputTensor));
@@ -67,9 +68,9 @@ void init_kernel(ElementBinaryMeta *m,
 
 /*static*/
 void forward_kernel_wrapper(ElementBinaryMeta const *m,
-                            float const *in1_ptr,
-                            float const *in2_ptr,
-                            float *out_ptr) {
+                            GenericTensorAccessorR const &in1,
+                            GenericTensorAccessorR const &in2,
+                            GenericTensorAccessorW const &out) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -81,7 +82,8 @@ void forward_kernel_wrapper(ElementBinaryMeta const *m,
   }
   // print_tensor<float>(in1_ptr, in1_domain.get_volume(), "input1:");
   // print_tensor<float>(in2_ptr, in2_domain.get_volume(), "input2:");
-  Internal::forward_kernel(m, in1_ptr, in2_ptr, out_ptr, stream);
+  Internal::forward_kernel(
+      m, in1.get_float_ptr(), in2.get_float_ptr(), out.get_float_ptr(), stream);
   // print_tensor<float>(out_ptr, in1_domain.get_volume(), "output:");
   if (m->profiling) {
     hipEventRecord(t_end, stream);
@@ -238,10 +240,11 @@ __global__ void elewise_binary_backward_kernel(coord_t volume,
 }
 
 /*static*/
+template <typename DT>
 void forward_kernel(ElementBinaryMeta const *m,
-                    float const *in1_ptr,
-                    float const *in2_ptr,
-                    float *out_ptr,
+                    DT const *in1_ptr,
+                    DT const *in2_ptr,
+                    DT *out_ptr,
                     hipStream_t stream) {
   checkCUDA(hipblasSetStream(m->handle.blas, stream));
   checkCUDNN(miopenSetStream(m->handle.dnn, stream));
diff --git a/src/ops/kernels/element_binary_kernels.cu b/src/ops/kernels/element_binary_kernels.cu
index 5ef4eb1142..0cbff73b82 100644
--- a/src/ops/kernels/element_binary_kernels.cu
+++ b/src/ops/kernels/element_binary_kernels.cu
@@ -21,7 +21,8 @@ namespace FlexFlow {
 using Legion::coord_t;
 using Legion::Domain;
 
-ElementBinaryMeta::ElementBinaryMeta(FFHandler handler) : OpMeta(handler) {
+ElementBinaryMeta::ElementBinaryMeta(FFHandler handler, Op const *op)
+    : OpMeta(handler, op) {
   checkCUDNN(cudnnCreateTensorDescriptor(&input1Tensor));
   checkCUDNN(cudnnCreateTensorDescriptor(&input2Tensor));
   checkCUDNN(cudnnCreateTensorDescriptor(&outputTensor));
@@ -61,27 +62,28 @@ void init_kernel(ElementBinaryMeta *m,
     default:
       assert(false);
   }
+  cudnnDataType_t cudnn_data_type = ff_to_cudnn_datatype(m->output_type[0]);
   checkCUDNN(cudnnSetOpTensorDescriptor(
       m->opDesc, mode, CUDNN_DATA_FLOAT, CUDNN_PROPAGATE_NAN));
   checkCUDNN(cudnnSetReduceTensorDescriptor(m->reduceAddDesc,
                                             CUDNN_REDUCE_TENSOR_ADD,
-                                            CUDNN_DATA_FLOAT,
+                                            cudnn_data_type,
                                             CUDNN_PROPAGATE_NAN,
                                             CUDNN_REDUCE_TENSOR_NO_INDICES,
                                             CUDNN_32BIT_INDICES));
-  checkCUDNN(
-      cudnnSetTensorDescriptorFromDomain(m->input1Tensor, input1_domain));
-  checkCUDNN(
-      cudnnSetTensorDescriptorFromDomain(m->input2Tensor, input2_domain));
-  checkCUDNN(
-      cudnnSetTensorDescriptorFromDomain(m->outputTensor, output_domain));
+  checkCUDNN(cudnnSetTensorDescriptorFromDomain(
+      m->input1Tensor, input1_domain, m->input_type[0]));
+  checkCUDNN(cudnnSetTensorDescriptorFromDomain(
+      m->input2Tensor, input2_domain, m->input_type[1]));
+  checkCUDNN(cudnnSetTensorDescriptorFromDomain(
+      m->outputTensor, output_domain, m->output_type[0]));
 }
 
 /*static*/
 void forward_kernel_wrapper(ElementBinaryMeta const *m,
-                            float const *in1_ptr,
-                            float const *in2_ptr,
-                            float *out_ptr) {
+                            GenericTensorAccessorR const &in1,
+                            GenericTensorAccessorR const &in2,
+                            GenericTensorAccessorW const &out) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -91,7 +93,20 @@ void forward_kernel_wrapper(ElementBinaryMeta const *m,
     cudaEventCreate(&t_end);
     cudaEventRecord(t_start, stream);
   }
-  Internal::forward_kernel(m, in1_ptr, in2_ptr, out_ptr, stream);
+  assert(in1.data_type == in2.data_type);
+  assert(out.data_type == in1.data_type);
+  if (out.data_type == DT_HALF) {
+    Internal::forward_kernel(
+        m, in1.get_half_ptr(), in2.get_half_ptr(), out.get_half_ptr(), stream);
+  } else if (out.data_type == DT_FLOAT) {
+    Internal::forward_kernel(m,
+                             in1.get_float_ptr(),
+                             in2.get_float_ptr(),
+                             out.get_float_ptr(),
+                             stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
     checkCUDA(cudaEventSynchronize(t_end));
@@ -292,10 +307,11 @@ __global__ void elewise_binary_backward_kernel(coord_t volume,
 }
 
 /*static*/
+template <typename DT>
 void forward_kernel(ElementBinaryMeta const *m,
-                    float const *in1_ptr,
-                    float const *in2_ptr,
-                    float *out_ptr,
+                    DT const *in1_ptr,
+                    DT const *in2_ptr,
+                    DT *out_ptr,
                     cudaStream_t stream) {
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
diff --git a/src/ops/kernels/linear_kernels.cpp b/src/ops/kernels/linear_kernels.cpp
index 8066ddc812..a041f008bc 100644
--- a/src/ops/kernels/linear_kernels.cpp
+++ b/src/ops/kernels/linear_kernels.cpp
@@ -19,7 +19,8 @@
 
 namespace FlexFlow {
 
-LinearMeta::LinearMeta(FFHandler handler, int batch_size) : OpMeta(handler) {
+LinearMeta::LinearMeta(FFHandler handler, int batch_size, Linear const *li)
+    : OpMeta(handler, li) {
   // Allocate an all-one's vector
   float *dram_one_ptr = (float *)malloc(sizeof(float) * batch_size);
   for (int i = 0; i < batch_size; i++) {
@@ -31,7 +32,7 @@ LinearMeta::LinearMeta(FFHandler handler, int batch_size) : OpMeta(handler) {
                       dram_one_ptr,
                       sizeof(float) * batch_size,
                       hipMemcpyHostToDevice));
-  one_ptr = (float const *)fb_one_ptr;
+  one_ptr = (void *)fb_one_ptr;
   // Allocate descriptors
   checkCUDNN(miopenCreateActivationDescriptor(&actiDesc));
   checkCUDNN(miopenCreateTensorDescriptor(&outputTensor));
@@ -96,15 +97,28 @@ void forward_kernel_wrapper(LinearMeta const *m,
     hipEventCreate(&t_end);
     hipEventRecord(t_start, stream);
   }
-  Internal::forward_kernel(m,
-                           input_ptr,
-                           output_ptr,
-                           weight_ptr,
-                           bias_ptr,
-                           in_dim,
-                           out_dim,
-                           batch_size,
-                           stream);
+
+  if (m->input_type == DT_FLOAT) {
+    Internal::forward_kernel<float>(m,
+                                    input_ptr,
+                                    output_ptr,
+                                    weight_ptr,
+                                    bias_ptr,
+                                    in_dim,
+                                    out_dim,
+                                    batch_size,
+                                    stream);
+  } else if (m->input_type == DT_HALF) {
+    Internal::forward_kernel<half>(m,
+                                   input_ptr,
+                                   output_ptr,
+                                   weight_ptr,
+                                   bias_ptr,
+                                   in_dim,
+                                   out_dim,
+                                   batch_size,
+                                   stream);
+  }
 
   if (m->profiling) {
     hipEventRecord(t_end, stream);
@@ -143,18 +157,34 @@ void backward_kernel_wrapper(LinearMeta const *m,
     hipEventCreate(&t_end);
     hipEventRecord(t_start, stream);
   }
-  Internal::backward_kernel(m,
-                            input_ptr,
-                            input_grad_ptr,
-                            output_ptr,
-                            output_grad_ptr,
-                            kernel_ptr,
-                            kernel_grad_ptr,
-                            bias_grad_ptr,
-                            in_dim,
-                            out_dim,
-                            batch_size,
-                            stream);
+  if (m->input_type == DT_FLOAT) {
+    Internal::backward_kernel<float>(m,
+                                     input_ptr,
+                                     input_grad_ptr,
+                                     output_ptr,
+                                     output_grad_ptr,
+                                     kernel_ptr,
+                                     kernel_grad_ptr,
+                                     bias_grad_ptr,
+                                     in_dim,
+                                     out_dim,
+                                     batch_size,
+                                     stream);
+  } else if (m->input_type == DT_HALF) {
+    Internal::backward_kernel<half>(m,
+                                    input_ptr,
+                                    input_grad_ptr,
+                                    output_ptr,
+                                    output_grad_ptr,
+                                    kernel_ptr,
+                                    kernel_grad_ptr,
+                                    bias_grad_ptr,
+                                    in_dim,
+                                    out_dim,
+                                    batch_size,
+                                    stream);
+  }
+
   if (m->profiling) {
     hipEventRecord(t_end, stream);
     checkCUDA(hipEventSynchronize(t_end));
@@ -189,7 +219,7 @@ Parameter* Linear::get_parameter(int index)
 */
 
 namespace Internal {
-
+template <typename DT>
 void forward_kernel(LinearMeta const *m,
                     void const *input_ptr,
                     void *output_ptr,
@@ -201,7 +231,7 @@ void forward_kernel(LinearMeta const *m,
                     hipStream_t stream) {
   checkCUDA(hipblasSetStream(m->handle.blas, stream));
   checkCUDNN(miopenSetStream(m->handle.dnn, stream));
-  float alpha = 1.0f, beta = 0.0f;
+  DT alpha = 1.0f, beta = 0.0f;
   hipblasDatatype_t input_type = ff_to_cuda_datatype(m->input_type);
   hipblasDatatype_t weight_type = ff_to_cuda_datatype(m->weight_type);
   hipblasDatatype_t output_type = ff_to_cuda_datatype(m->output_type);
@@ -209,7 +239,7 @@ void forward_kernel(LinearMeta const *m,
   // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
   cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
 #else
-  hipblasDatatype_t compute_type = HIPBLAS_R_32F;
+  hipblasDatatype_t compute_type = input_type;
 #endif
   checkCUDA(hipblasGemmEx(m->handle.blas,
                           HIPBLAS_OP_T,
@@ -242,8 +272,8 @@ void forward_kernel(LinearMeta const *m,
                             bias_ptr,
                             weight_type,
                             1,
-                            m->one_ptr,
-                            HIPBLAS_R_32F,
+                            static_cast<DT *>(m->one_ptr),
+                            weight_type,
                             1,
                             &alpha,
                             output_ptr,
@@ -281,6 +311,7 @@ void forward_kernel(LinearMeta const *m,
   }
 }
 
+template <typename DT>
 void backward_kernel(LinearMeta const *m,
                      void const *input_ptr,
                      void *input_grad_ptr,
@@ -296,7 +327,7 @@ void backward_kernel(LinearMeta const *m,
   checkCUDA(hipblasSetStream(m->handle.blas, stream));
   checkCUDNN(miopenSetStream(m->handle.dnn, stream));
 
-  float alpha = 1.0f;
+  DT alpha = 1.0f;
   hipblasDatatype_t input_type = ff_to_cuda_datatype(m->input_type);
   hipblasDatatype_t weight_type = ff_to_cuda_datatype(m->weight_type);
   hipblasDatatype_t output_type = ff_to_cuda_datatype(m->output_type);
diff --git a/src/ops/kernels/linear_kernels.cu b/src/ops/kernels/linear_kernels.cu
index 3f408c7cb0..02b018566e 100644
--- a/src/ops/kernels/linear_kernels.cu
+++ b/src/ops/kernels/linear_kernels.cu
@@ -13,24 +13,34 @@
  * limitations under the License.
  */
 
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/ops/kernels/linear_kernels.h"
 #include "flexflow/utils/cuda_helper.h"
 
 namespace FlexFlow {
 
-LinearMeta::LinearMeta(FFHandler handler, int batch_size) : OpMeta(handler) {
+LinearMeta::LinearMeta(FFHandler handler, int batch_size, Linear const *li)
+    : OpMeta(handler, li) {
   // Allocate an all-one's vector
-  float *dram_one_ptr = (float *)malloc(sizeof(float) * batch_size);
-  for (int i = 0; i < batch_size; i++) {
-    dram_one_ptr[i] = 1.0f;
+  DataType data_type = li->data_type;
+  checkCUDA(cudaMalloc(&one_ptr, data_type_size(data_type) * batch_size));
+  int parallelism = batch_size;
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  if (data_type == DT_FLOAT) {
+    Kernels::Linear::Internal::
+        build_one_ptr<<<GET_BLOCKS(parallelism),
+                        min(CUDA_NUM_THREADS, parallelism),
+                        0,
+                        stream>>>((float *)one_ptr, batch_size);
+  } else if (data_type == DT_HALF) {
+    Kernels::Linear::Internal::
+        build_one_ptr<<<GET_BLOCKS(parallelism),
+                        min(CUDA_NUM_THREADS, parallelism),
+                        0,
+                        stream>>>((half *)one_ptr, batch_size);
   }
-  float *fb_one_ptr;
-  checkCUDA(cudaMalloc(&fb_one_ptr, sizeof(float) * batch_size));
-  checkCUDA(cudaMemcpy(fb_one_ptr,
-                       dram_one_ptr,
-                       sizeof(float) * batch_size,
-                       cudaMemcpyHostToDevice));
-  one_ptr = (float const *)fb_one_ptr;
+
   // Allocate descriptors
   checkCUDNN(cudnnCreateActivationDescriptor(&actiDesc));
   checkCUDNN(cudnnCreateTensorDescriptor(&outputTensor));
@@ -97,15 +107,27 @@ void forward_kernel_wrapper(LinearMeta const *m,
     cudaEventCreate(&t_end);
     cudaEventRecord(t_start, stream);
   }
-  Internal::forward_kernel(m,
-                           input_ptr,
-                           output_ptr,
-                           weight_ptr,
-                           bias_ptr,
-                           in_dim,
-                           out_dim,
-                           batch_size,
-                           stream);
+  if (m->input_type == DT_FLOAT) {
+    Internal::forward_kernel<float>(m,
+                                    input_ptr,
+                                    output_ptr,
+                                    weight_ptr,
+                                    bias_ptr,
+                                    in_dim,
+                                    out_dim,
+                                    batch_size,
+                                    stream);
+  } else if (m->input_type == DT_HALF) {
+    Internal::forward_kernel<half>(m,
+                                   input_ptr,
+                                   output_ptr,
+                                   weight_ptr,
+                                   bias_ptr,
+                                   in_dim,
+                                   out_dim,
+                                   batch_size,
+                                   stream);
+  }
 
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
@@ -143,18 +165,34 @@ void backward_kernel_wrapper(LinearMeta const *m,
     cudaEventCreate(&t_end);
     cudaEventRecord(t_start, stream);
   }
-  Internal::backward_kernel(m,
-                            input_ptr,
-                            input_grad_ptr,
-                            output_ptr,
-                            output_grad_ptr,
-                            kernel_ptr,
-                            kernel_grad_ptr,
-                            bias_grad_ptr,
-                            in_dim,
-                            out_dim,
-                            batch_size,
-                            stream);
+  if (m->input_type == DT_FLOAT) {
+    Internal::backward_kernel<float>(m,
+                                     input_ptr,
+                                     input_grad_ptr,
+                                     output_ptr,
+                                     output_grad_ptr,
+                                     kernel_ptr,
+                                     kernel_grad_ptr,
+                                     bias_grad_ptr,
+                                     in_dim,
+                                     out_dim,
+                                     batch_size,
+                                     stream);
+  } else if (m->input_type == DT_HALF) {
+    Internal::backward_kernel<half>(m,
+                                    input_ptr,
+                                    input_grad_ptr,
+                                    output_ptr,
+                                    output_grad_ptr,
+                                    kernel_ptr,
+                                    kernel_grad_ptr,
+                                    bias_grad_ptr,
+                                    in_dim,
+                                    out_dim,
+                                    batch_size,
+                                    stream);
+  }
+
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
     checkCUDA(cudaEventSynchronize(t_end));
@@ -189,6 +227,7 @@ Parameter* Linear::get_parameter(int index)
 */
 namespace Internal {
 
+template <typename DT>
 void forward_kernel(LinearMeta const *m,
                     void const *input_ptr,
                     void *output_ptr,
@@ -200,15 +239,16 @@ void forward_kernel(LinearMeta const *m,
                     ffStream_t stream) {
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
-  float alpha = 1.0f, beta = 0.0f;
+  DT alpha = 1.0f, beta = 0.0f;
   cudaDataType_t input_type = ff_to_cuda_datatype(m->input_type);
   cudaDataType_t weight_type = ff_to_cuda_datatype(m->weight_type);
   cudaDataType_t output_type = ff_to_cuda_datatype(m->output_type);
+  assert(input_type == weight_type && weight_type == output_type);
 #if CUDA_VERSION >= 11000
   // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
   cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
 #else
-  cudaDataType_t compute_type = CUDA_R_32F;
+  cudaDataType_t compute_type = input_type;
 #endif
   checkCUDA(cublasGemmEx(m->handle.blas,
                          CUBLAS_OP_T,
@@ -241,8 +281,8 @@ void forward_kernel(LinearMeta const *m,
                            bias_ptr,
                            weight_type,
                            1,
-                           m->one_ptr,
-                           CUDA_R_32F,
+                           static_cast<DT *>(m->one_ptr),
+                           weight_type,
                            1,
                            &alpha,
                            output_ptr,
@@ -273,6 +313,7 @@ void forward_kernel(LinearMeta const *m,
   }
 }
 
+template <typename DT>
 void backward_kernel(LinearMeta const *m,
                      void const *input_ptr,
                      void *input_grad_ptr,
@@ -288,7 +329,8 @@ void backward_kernel(LinearMeta const *m,
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
 
-  float alpha = 1.0f;
+  DT alpha = 1.0f;
+  float sgeam_alpha = 1.0f;
   cudaDataType_t input_type = ff_to_cuda_datatype(m->input_type);
   cudaDataType_t weight_type = ff_to_cuda_datatype(m->weight_type);
   cudaDataType_t output_type = ff_to_cuda_datatype(m->output_type);
@@ -338,7 +380,7 @@ void backward_kernel(LinearMeta const *m,
                           CUBLAS_OP_N,
                           in_dim,
                           out_dim,
-                          &alpha,
+                          &sgeam_alpha,
                           (float *)kernel_grad_ptr,
                           in_dim,
                           &(m->kernel_reg_lambda),
@@ -361,7 +403,7 @@ void backward_kernel(LinearMeta const *m,
                            out_dim,
                            batch_size,
                            &alpha,
-                           m->one_ptr,
+                           static_cast<DT *>(m->one_ptr),
                            CUDA_R_32F,
                            1,
                            output_grad_ptr,
@@ -399,6 +441,13 @@ void backward_kernel(LinearMeta const *m,
   }
 }
 
+template <typename DT>
+__global__ void build_one_ptr(DT *one_ptr, int batch_size) {
+  CUDA_KERNEL_LOOP(i, batch_size) {
+    one_ptr[i] = static_cast<DT>(1.0f);
+  }
+}
+
 } // namespace Internal
 } // namespace Linear
 } // namespace Kernels
diff --git a/src/ops/kernels/rms_norm_kernels.cu b/src/ops/kernels/rms_norm_kernels.cu
index f7945b316d..bf5b1021ae 100644
--- a/src/ops/kernels/rms_norm_kernels.cu
+++ b/src/ops/kernels/rms_norm_kernels.cu
@@ -13,6 +13,7 @@
  * limitations under the License.
  */
 
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/ops/kernels/rms_norm_kernels.h"
 #include "flexflow/ops/rms_norm.h"
 #include "flexflow/utils/cuda_helper.h"
@@ -36,8 +37,9 @@ RMSNormMeta::RMSNormMeta(FFHandler handler, RMSNorm const *rms)
   batch_size = rms->effective_batch_size;
   num_elements = in_dim * batch_size;
 
-  checkCUDA(cudaMalloc(&rms_ptr, batch_size * sizeof(float)));
-  checkCUDA(cudaMalloc(&norm_ptr, num_elements * sizeof(float)));
+  DataType data_type = rms->weights[0]->data_type;
+  checkCUDA(cudaMalloc(&rms_ptr, batch_size * data_type_size(data_type)));
+  checkCUDA(cudaMalloc(&norm_ptr, num_elements * data_type_size(data_type)));
 }
 
 namespace Kernels {
@@ -83,27 +85,18 @@ __inline__ __device__ T BlockReduceSum(T val, T *shared) {
 
 template <typename T>
 __global__ void
-    RowwiseRootMeanSquareKernel(int64_t N, T eps, T const *X, T *rms) {
-  __shared__ T v_shared[C10_WARP_SIZE];
-  const int64_t i = blockIdx.x;
-  T sum = 0;
-  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
-    const int64_t index = i * N + j;
-    sum += static_cast<T>(X[index]) * static_cast<T>(X[index]);
+    RowwiseRootMeanSquareKernel(long long N, float eps, T const *X, T *rms) {
+  __shared__ float v_shared[C10_WARP_SIZE];
+  long long const i = blockIdx.x;
+  float sum = 0.0f;
+  for (long long j = threadIdx.x; j < N; j += blockDim.x) {
+    long long const index = i * N + j;
+    sum += (static_cast<float>(X[index]) * static_cast<float>(X[index]));
   }
-  sum = BlockReduceSum<T>(sum, v_shared); // use BlockReduceSum() to sum X_ij^2
+  sum = BlockReduceSum<float>(sum, v_shared); // use BlockReduceSum() to sum X_ij^2
 
   if (threadIdx.x == 0) {
-    rms[i] = rsqrt((sum / static_cast<T>(N)) + static_cast<T>(eps));
-    // printf("index: %d, rms norm mean value: %.15f, rms norm sum value: "
-    //        "%.20f, eps: %f, value: %.20f, num:%d, num2: %d\n",
-    //        i,
-    //        sum / static_cast<T>(N),
-    //        sum,
-    //        static_cast<T>(eps),
-    //        rms[i],
-    //        blockDim.x,
-    //        warpSize);
+    rms[i] = static_cast<T>(rsqrt((sum / static_cast<float>(N)) + eps));    
   }
 }
 
@@ -117,23 +110,51 @@ __global__ void NormKernel(int64_t N, T const *X, T const *rstd, T *Y) {
   }
 }
 
+template <typename T>
 __global__ void elewise_apply_weights(int64_t batch_size,
                                       int64_t in_dim,
-                                      float const *norm,
-                                      float const *weights,
-                                      float *output) {
+                                      T const *norm,
+                                      T const *weights,
+                                      T *output) {
   CUDA_KERNEL_LOOP(i, batch_size * in_dim) {
     output[i] = norm[i] * weights[i % in_dim];
   }
 }
 
+template <typename T>
+void forward_kernel(RMSNormMeta const *m,
+                    T const *input_ptr,
+                    T const *weight_ptr,
+                    T *output_ptr,
+                    cudaStream_t stream) {
+  int parallelism = m->batch_size * m->in_dim;
+  RowwiseRootMeanSquareKernel<T>
+      <<<m->batch_size, kCUDABlockReduceNumThreads, 0, stream>>>(
+          m->in_dim,
+          m->eps,
+          input_ptr,
+          static_cast<T *>(m->rms_ptr));
+  NormKernel<T><<<m->batch_size, kCUDANumThreads, 0, stream>>>(
+      m->in_dim,
+      input_ptr,
+      static_cast<T *>(m->rms_ptr),
+      static_cast<T *>(m->norm_ptr));
+  elewise_apply_weights<<<GET_BLOCKS(parallelism),
+                          min(CUDA_NUM_THREADS, parallelism),
+                          0,
+                          stream>>>(m->batch_size,
+                                    m->in_dim,
+                                    static_cast<T *>(m->norm_ptr),
+                                    weight_ptr,
+                                    output_ptr);
+}
+
 void forward_kernel_wrapper(RMSNormMeta const *m,
                             GenericTensorAccessorR const &input,
                             GenericTensorAccessorR const &weight,
                             GenericTensorAccessorW const &output) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
-  int parallelism = m->batch_size * m->in_dim;
   cudaEvent_t t_start, t_end;
   if (m->profiling) {
     cudaEventCreate(&t_start);
@@ -141,21 +162,24 @@ void forward_kernel_wrapper(RMSNormMeta const *m,
     cudaEventRecord(t_start, stream);
   }
 
-  RowwiseRootMeanSquareKernel<float>
-      <<<m->batch_size, kCUDABlockReduceNumThreads, 0, stream>>>(
-          m->in_dim, m->eps, input.get_float_ptr(), m->rms_ptr);
-
-  NormKernel<float><<<m->batch_size, kCUDANumThreads, 0, stream>>>(
-      m->in_dim, input.get_float_ptr(), m->rms_ptr, m->norm_ptr);
+  assert(output.data_type == input.data_type);
+  assert(weight.data_type == output.data_type);
+  if (output.data_type == DT_HALF) {
+    forward_kernel(m,
+                   input.get_half_ptr(),
+                   weight.get_half_ptr(),
+                   output.get_half_ptr(),
+                   stream);
+  } else if (output.data_type == DT_FLOAT) {
+    forward_kernel(m,
+                   input.get_float_ptr(),
+                   weight.get_float_ptr(),
+                   output.get_float_ptr(),
+                   stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
 
-  elewise_apply_weights<<<GET_BLOCKS(parallelism),
-                          min(CUDA_NUM_THREADS, parallelism),
-                          0,
-                          stream>>>(m->batch_size,
-                                    m->in_dim,
-                                    m->norm_ptr,
-                                    weight.get_float_ptr(),
-                                    output.get_float_ptr());
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
     checkCUDA(cudaEventSynchronize(t_end));
diff --git a/src/ops/kernels/softmax.cpp b/src/ops/kernels/softmax.cpp
index d63bd0edc5..d09a5aaf6d 100644
--- a/src/ops/kernels/softmax.cpp
+++ b/src/ops/kernels/softmax.cpp
@@ -36,9 +36,10 @@ SoftmaxMeta::SoftmaxMeta(FFHandler handler,
 namespace Kernels {
 namespace Softmax {
 
+template <typename DT>
 void forward_kernel_wrapper(SoftmaxMeta const *m,
-                            float const *input_ptr,
-                            float *output_ptr) {
+                            DT const *input_ptr,
+                            DT *output_ptr) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -64,9 +65,10 @@ void forward_kernel_wrapper(SoftmaxMeta const *m,
   }
 }
 
+template <typename DT>
 void backward_kernel_wrapper(SoftmaxMeta const *m,
-                             float *input_grad_ptr,
-                             float const *output_grad_ptr,
+                             DT *input_grad_ptr,
+                             DT const *output_grad_ptr,
                              size_t num_elements) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
@@ -94,11 +96,27 @@ void backward_kernel_wrapper(SoftmaxMeta const *m,
   }
 }
 
-namespace Internal {
+template void forward_kernel_wrapper<float>(SoftmaxMeta const *m,
+                                            float const *input_ptr,
+                                            float *output_ptr);
+template void forward_kernel_wrapper<half>(SoftmaxMeta const *m,
+                                           half const *input_ptr,
+                                           half *output_ptr);
+
+template void backward_kernel_wrapper<float>(SoftmaxMeta const *m,
+                                             float *input_grad_ptr,
+                                             float const *output_grad_ptr,
+                                             size_t num_elements);
+template void backward_kernel_wrapper<half>(SoftmaxMeta const *m,
+                                            half *input_grad_ptr,
+                                            half const *output_grad_ptr,
+                                            size_t num_elements);
 
+namespace Internal {
+template <typename DT>
 void forward_kernel(SoftmaxMeta const *m,
-                    float const *input_ptr,
-                    float *output_ptr,
+                    DT const *input_ptr,
+                    DT *output_ptr,
                     hipStream_t stream) {
   checkCUDNN(miopenSetStream(m->handle.dnn, stream));
 
@@ -114,13 +132,14 @@ void forward_kernel(SoftmaxMeta const *m,
                                      MIOPEN_SOFTMAX_MODE_CHANNEL));
 }
 
-void backward_kernel(float *input_grad_ptr,
-                     float const *output_grad_ptr,
+template <typename DT>
+void backward_kernel(DT *input_grad_ptr,
+                     DT const *output_grad_ptr,
                      size_t num_elements,
                      hipStream_t stream) {
   checkCUDA(hipMemcpyAsync(input_grad_ptr,
                            output_grad_ptr,
-                           num_elements * sizeof(float),
+                           num_elements * sizeof(DT),
                            hipMemcpyDeviceToDevice,
                            stream));
 }
diff --git a/src/ops/kernels/softmax.cu b/src/ops/kernels/softmax.cu
index c9415a89a2..80683e7a2d 100644
--- a/src/ops/kernels/softmax.cu
+++ b/src/ops/kernels/softmax.cu
@@ -26,8 +26,8 @@ SoftmaxMeta::SoftmaxMeta(FFHandler handler,
                          Domain const &input_domain)
     : OpMeta(handler) {
   checkCUDNN(cudnnCreateTensorDescriptor(&inputTensor));
-  checkCUDNN(
-      cudnnSetTensorDescriptorFromDomain4SoftMax(inputTensor, input_domain));
+  checkCUDNN(cudnnSetTensorDescriptorFromDomain4SoftMax(
+      inputTensor, input_domain, softmax->data_type));
   dim = softmax->dim;
   profiling = softmax->profiling;
   std::strcpy(op_name, softmax->name);
@@ -36,9 +36,10 @@ SoftmaxMeta::SoftmaxMeta(FFHandler handler,
 namespace Kernels {
 namespace Softmax {
 
+template <typename DT>
 void forward_kernel_wrapper(SoftmaxMeta const *m,
-                            float const *input_ptr,
-                            float *output_ptr) {
+                            DT const *input_ptr,
+                            DT *output_ptr) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -62,11 +63,13 @@ void forward_kernel_wrapper(SoftmaxMeta const *m,
     log_measure.debug(
         "%s [Softmax] forward time = %.2fms\n", m->op_name, elapsed);
   }
+
 }
 
+template <typename DT>
 void backward_kernel_wrapper(SoftmaxMeta const *m,
-                             float *input_grad_ptr,
-                             float const *output_grad_ptr,
+                             DT *input_grad_ptr,
+                             DT const *output_grad_ptr,
                              size_t num_elements) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
@@ -94,11 +97,26 @@ void backward_kernel_wrapper(SoftmaxMeta const *m,
   }
 }
 
-namespace Internal {
+template void forward_kernel_wrapper<float>(SoftmaxMeta const *m,
+                                            float const *input_ptr,
+                                            float *output_ptr);
+template void forward_kernel_wrapper<half>(SoftmaxMeta const *m,
+                                           half const *input_ptr,
+                                           half *output_ptr);
 
+template void backward_kernel_wrapper<float>(SoftmaxMeta const *m,
+                                             float *input_grad_ptr,
+                                             float const *output_grad_ptr,
+                                             size_t num_elements);
+template void backward_kernel_wrapper<half>(SoftmaxMeta const *m,
+                                            half *input_grad_ptr,
+                                            half const *output_grad_ptr,
+                                            size_t num_elements);
+namespace Internal {
+template <typename DT>
 void forward_kernel(SoftmaxMeta const *m,
-                    float const *input_ptr,
-                    float *output_ptr,
+                    DT const *input_ptr,
+                    DT *output_ptr,
                     cudaStream_t stream) {
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
 
@@ -114,13 +132,14 @@ void forward_kernel(SoftmaxMeta const *m,
                                  output_ptr));
 }
 
-void backward_kernel(float *input_grad_ptr,
-                     float const *output_grad_ptr,
+template <typename DT>
+void backward_kernel(DT *input_grad_ptr,
+                     DT const *output_grad_ptr,
                      size_t num_elements,
                      cudaStream_t stream) {
   checkCUDA(cudaMemcpyAsync(input_grad_ptr,
                             output_grad_ptr,
-                            num_elements * sizeof(float),
+                            num_elements * sizeof(DT),
                             cudaMemcpyDeviceToDevice,
                             stream));
 }
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index 5103920413..3b20f932e2 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -61,6 +61,7 @@ Tensor FFModel::layer_norm(const Tensor input,
                            std::vector<int> const &axes,
                            bool elementwise_affine,
                            float eps,
+                           DataType data_type,
                            char const *name) {
   // In PyTorch, axes must be the sizes of the last axes.size() dimensions of
   // the input tensor. However, since the tensor dimensions are reversed in
@@ -93,15 +94,32 @@ Tensor FFModel::layer_norm(const Tensor input,
     }
   }
 #endif
+  if (data_type == DT_NONE) {
+    data_type = input->data_type;
+  }
   int num_weights = elementwise_affine ? 2 : 0;
-  Layer *ln = new Layer(this,
-                        OP_LAYERNORM,
-                        DT_FLOAT,
-                        name,
-                        1 /*inputs*/,
-                        num_weights,
-                        1 /*outputs*/,
-                        input);
+  Layer *ln = nullptr;
+  if (data_type != input->data_type) {
+    Tensor casted_input = cast(input, data_type, "type cast for layer_norm");
+    ln = new Layer(this,
+                   OP_LAYERNORM,
+                   data_type,
+                   name,
+                   1 /*inputs*/,
+                   num_weights,
+                   1 /*outputs*/,
+                   casted_input);
+  } else {
+    ln = new Layer(this,
+                   OP_LAYERNORM,
+                   data_type,
+                   name,
+                   1 /*inputs*/,
+                   num_weights,
+                   1 /*outputs*/,
+                   input);
+  }
+
   ln->outputs[0] = create_tensor_legion_ordering(input->num_dims,
                                                  input->dims,
                                                  input->data_type,
@@ -217,7 +235,7 @@ LayerNorm::LayerNorm(FFModel &model,
     weights[0] =
         model.create_parallel_weight_legion_ordering(axes.size(),
                                                      dims,
-                                                     DT_FLOAT,
+                                                     _input->data_type,
                                                      NULL /*owner_op*/,
                                                      true /*create_grad*/,
                                                      gamma_initializer,
@@ -225,7 +243,7 @@ LayerNorm::LayerNorm(FFModel &model,
     weights[1] =
         model.create_parallel_weight_legion_ordering(axes.size(),
                                                      dims,
-                                                     DT_FLOAT,
+                                                     _input->data_type,
                                                      NULL /*owner_op*/,
                                                      true /*create_grad*/,
                                                      beta_initializer,
@@ -337,6 +355,8 @@ OpMeta *LayerNorm::init_task(Task const *task,
   LayerNorm *ln = (LayerNorm *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
   LayerNormMeta *meta = new LayerNormMeta(handle, ln);
+  meta->input_type[0] = ln->inputs[0]->data_type;
+  meta->output_type[0] = ln->outputs[0]->data_type;
   return meta;
 }
 
@@ -447,14 +467,21 @@ void LayerNorm::forward_task(Task const *task,
   assert(task->regions.size() == regions.size());
   float const *in_ptr = NULL;
   float *out_ptr = NULL, *gamma_ptr = NULL, *beta_ptr = NULL;
+  GenericTensorAccessorR in;
+  GenericTensorAccessorW out, gamma, beta;
+
   Domain in_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
-  in_ptr = helperGetTensorPointerRO<float>(
-      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  // in_ptr = helperGetTensorPointerRO<float>(
+  //     regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  in = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
   Domain out_domain = runtime->get_index_space_domain(
       ctx, task->regions[1].region.get_index_space());
-  out_ptr = helperGetTensorPointerWO<float>(
-      regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  // out_ptr = helperGetTensorPointerWO<float>(
+  //     regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  out = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
   assert(in_domain == out_domain);
   assert(in_domain.get_volume() ==
          m->effective_num_elements * m->effective_batch_size);
@@ -462,12 +489,16 @@ void LayerNorm::forward_task(Task const *task,
     assert(regions.size() == 4);
     Domain gamma_domain = runtime->get_index_space_domain(
         ctx, task->regions[2].region.get_index_space());
-    gamma_ptr = helperGetTensorPointerRW<float>(
-        regions[2], task->regions[2], FID_DATA, ctx, runtime);
+    // gamma_ptr = helperGetTensorPointerRW<float>(
+    //     regions[2], task->regions[2], FID_DATA, ctx, runtime);
+    gamma = helperGetGenericTensorAccessorRW(
+        m->input_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
     Domain beta_domain = runtime->get_index_space_domain(
         ctx, task->regions[3].region.get_index_space());
-    beta_ptr = helperGetTensorPointerRW<float>(
-        regions[3], task->regions[3], FID_DATA, ctx, runtime);
+    // beta_ptr = helperGetTensorPointerRW<float>(
+    //     regions[3], task->regions[3], FID_DATA, ctx, runtime);
+    beta = helperGetGenericTensorAccessorRW(
+        m->input_type[0], regions[3], task->regions[3], FID_DATA, ctx, runtime);
     assert(gamma_domain == beta_domain);
     assert(gamma_domain.get_volume() == m->effective_num_elements);
     int numdims = gamma_domain.get_dim();
@@ -479,9 +510,7 @@ void LayerNorm::forward_task(Task const *task,
   } else {
     assert(regions.size() == 2);
   }
-
-  LayerNorm::forward_kernel_wrapper<float>(
-      m, in_ptr, out_ptr, gamma_ptr, beta_ptr);
+  LayerNorm::forward_kernel_wrapper(m, in, out, gamma, beta);
 }
 
 void LayerNorm::backward(FFModel const &ff) {
@@ -615,19 +644,26 @@ bool LayerNorm::measure_operator_cost(Simulator *sim,
   if (!inputs[0]->get_sub_tensor(mv, sub_input)) {
     return false;
   }
+  Domain input_domain = sub_input.get_domain();
+  Domain output_domain = sub_output.get_domain();
   LayerNormMeta *m = new LayerNormMeta(sim->handler, this);
 
   sim->free_all();
   float *in_ptr = (float *)sim->allocate(sub_input.get_volume(), DT_FLOAT);
   assert(in_ptr != NULL);
+  GenericTensorAccessorR input1_acc(inputs[0]->data_type, input_domain, in_ptr);
   cost_metrics.inputs_memory += cost_metrics.total_mem_diff_from(sim->offset);
 
   float *out_ptr = (float *)sim->allocate(sub_output.get_volume(), DT_FLOAT);
   assert(out_ptr != NULL);
+  GenericTensorAccessorW output_acc(
+      outputs[0]->data_type, output_domain, out_ptr);
   cost_metrics.outputs_memory += cost_metrics.total_mem_diff_from(sim->offset);
 
   // FIXME please add gamma_ptr and beta_ptr after finish the implementation
   float *gamma_ptr = NULL, *beta_ptr = NULL;
+  GenericTensorAccessorW gamma_acc;
+  GenericTensorAccessorW beta_acc;
 
   bool out_of_memory =
       (in_ptr == NULL) || (out_ptr == NULL) ||
@@ -640,7 +676,7 @@ bool LayerNorm::measure_operator_cost(Simulator *sim,
 
   std::function<void()> forward, backward;
   forward = [&] {
-    forward_kernel_wrapper(m, in_ptr, out_ptr, gamma_ptr, beta_ptr);
+    forward_kernel_wrapper(m, input1_acc, output_acc, gamma_acc, beta_acc);
   };
 
   if (sim->computationMode == COMP_MODE_TRAINING) {
diff --git a/src/ops/layer_norm.cpp b/src/ops/layer_norm.cpp
index c3030e20b4..3f1c621e71 100644
--- a/src/ops/layer_norm.cpp
+++ b/src/ops/layer_norm.cpp
@@ -79,26 +79,26 @@ __inline__ __device__ T BlockReduceSum(T val, T *shared) {
 }
 
 template <typename T>
-__global__ void
-    RowwiseMomentsCUDAKernel(int64_t N, T eps, T const *X, T *mean, T *rstd) {
-  __shared__ T m_shared[C10_WARP_SIZE];
-  __shared__ T v_shared[C10_WARP_SIZE];
+__global__ void RowwiseMomentsCUDAKernel(
+    int64_t N, float eps, T const *X, T *mean, T *rstd) {
+  __shared__ float m_shared[C10_WARP_SIZE];
+  __shared__ float v_shared[C10_WARP_SIZE];
   const int64_t i = blockIdx.x;
-  T sum1 = 0;
-  T sum2 = 0;
+  float sum1 = 0.0f;
+  float sum2 = 0.0f;
   for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
     const int64_t index = i * N + j;
-    sum1 += static_cast<T>(X[index]);
-    sum2 += static_cast<T>(X[index]) * static_cast<T>(X[index]);
+    sum1 += static_cast<float>(X[index]);
+    sum2 += static_cast<float>(X[index]) * static_cast<float>(X[index]);
   }
-  sum1 = BlockReduceSum<T>(sum1, m_shared);
-  sum2 = BlockReduceSum<T>(sum2, v_shared);
+  sum1 = BlockReduceSum<float>(sum1, m_shared);
+  sum2 = BlockReduceSum<float>(sum2, v_shared);
   if (threadIdx.x == 0) {
-    const T scale = T(1) / static_cast<T>(N);
+    float const scale = float(1) / static_cast<float>(N);
     sum1 *= scale;
-    sum2 = max(sum2 * scale - sum1 * sum1, T(0));
-    mean[i] = sum1;
-    rstd[i] = rsqrt(sum2 + static_cast<T>(eps));
+    sum2 = max(sum2 * scale - sum1 * sum1, float(0));
+    mean[i] = static_cast<T>(sum1);
+    rstd[i] = static_cast<T>(rsqrt(sum2 + eps));
   }
 }
 
@@ -132,7 +132,7 @@ void LayerNorm::forward_kernel(LayerNormMeta const *m,
                                T *gamma_ptr,
                                T *beta_ptr,
                                hipStream_t stream) {
-  hipLaunchKernelGGL(HIP_KERNEL_NAME(RowwiseMomentsCUDAKernel<float>),
+  hipLaunchKernelGGL(HIP_KERNEL_NAME(RowwiseMomentsCUDAKernel<T>),
                      m->effective_batch_size,
                      kCUDABlockReduceNumThreads,
                      0,
@@ -140,33 +140,47 @@ void LayerNorm::forward_kernel(LayerNormMeta const *m,
                      m->effective_num_elements,
                      m->eps,
                      in_ptr,
-                     m->mean_ptr,
-                     m->rstd_ptr);
-  hipLaunchKernelGGL(HIP_KERNEL_NAME(LayerNormForwardCUDAKernel<float>),
+                     static_cast<T *>(m->mean_ptr),
+                     static_cast<T *>(m->rstd_ptr));
+  hipLaunchKernelGGL(HIP_KERNEL_NAME(LayerNormForwardCUDAKernel<T>),
                      m->effective_batch_size,
                      kCUDANumThreads,
                      0,
                      stream,
                      m->effective_num_elements,
                      in_ptr,
-                     m->mean_ptr,
-                     m->rstd_ptr,
+                     static_cast<T *>(m->mean_ptr),
+                     static_cast<T *>(m->rstd_ptr),
                      gamma_ptr,
                      beta_ptr,
                      out_ptr);
 }
 
 /*static*/
-template <typename T>
 void LayerNorm::forward_kernel_wrapper(LayerNormMeta const *m,
-                                       T const *in_ptr,
-                                       T *out_ptr,
-                                       T *gamma_ptr,
-                                       T *beta_ptr) {
+                                       GenericTensorAccessorR const &input,
+                                       GenericTensorAccessorW &output,
+                                       GenericTensorAccessorW &gamma,
+                                       GenericTensorAccessorW &beta) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
-  LayerNorm::forward_kernel<float>(
-      m, in_ptr, out_ptr, gamma_ptr, beta_ptr, stream);
+  if (m->input_type[0] == DT_FLOAT) {
+    LayerNorm::forward_kernel<float>(m,
+                                     input.get_float_ptr(),
+                                     output.get_float_ptr(),
+                                     gamma.get_float_ptr(),
+                                     beta.get_float_ptr(),
+                                     stream);
+  } else if (m->input_type[0] == DT_HALF) {
+    LayerNorm::forward_kernel<half>(m,
+                                    input.get_half_ptr(),
+                                    output.get_half_ptr(),
+                                    gamma.get_half_ptr(),
+                                    beta.get_half_ptr(),
+                                    stream);
+  } else {
+    assert(false && "unsupport datatype in layernorm");
+  }
 }
 
 template <typename T>
@@ -367,8 +381,8 @@ void LayerNorm::backward_kernel(LayerNormMeta const *m,
                      output_grad_ptr,
                      input_ptr,
                      gamma_ptr,
-                     m->ds_ptr,
-                     m->db_ptr);
+                     static_cast<T *>(m->ds_ptr),
+                     static_cast<T *>(m->db_ptr));
   const int64_t B = (M + kCUDANumThreads - 1) / kCUDANumThreads;
   hipLaunchKernelGGL(HIP_KERNEL_NAME(ComputeGradientFusedParamsCUDAKernel<T>),
                      B,
@@ -377,12 +391,12 @@ void LayerNorm::backward_kernel(LayerNormMeta const *m,
                      stream,
                      M,
                      N,
-                     m->mean_ptr,
-                     m->rstd_ptr,
-                     m->ds_ptr,
-                     m->db_ptr,
-                     m->scale_ptr,
-                     m->bias_ptr);
+                     static_cast<T *>(m->mean_ptr),
+                     static_cast<T *>(m->rstd_ptr),
+                     static_cast<T *>(m->ds_ptr),
+                     static_cast<T *>(m->db_ptr),
+                     static_cast<T *>(m->scale_ptr),
+                     static_cast<T *>(m->bias_ptr));
   if (gamma_grad_ptr != NULL || beta_grad_ptr != NULL) {
     if (M < 512) {
       // For small batch size, do colwise reduce directly
@@ -396,8 +410,8 @@ void LayerNorm::backward_kernel(LayerNormMeta const *m,
                          N,
                          output_grad_ptr,
                          input_ptr,
-                         m->mean_ptr,
-                         m->rstd_ptr,
+                         static_cast<T *>(m->mean_ptr),
+                         static_cast<T *>(m->rstd_ptr),
                          gamma_grad_ptr,
                          beta_grad_ptr);
     } else {
@@ -414,8 +428,8 @@ void LayerNorm::backward_kernel(LayerNormMeta const *m,
                          N,
                          output_grad_ptr,
                          input_ptr,
-                         m->mean_ptr,
-                         m->rstd_ptr,
+                         static_cast<T *>(m->mean_ptr),
+                         static_cast<T *>(m->rstd_ptr),
                          gamma_grad_ptr,
                          beta_grad_ptr);
     }
@@ -443,11 +457,6 @@ void LayerNorm::backward_kernel_wrapper(LayerNormMeta const *m,
                                     stream);
 }
 
-template void LayerNorm::forward_kernel_wrapper<float>(LayerNormMeta const *m,
-                                                       float const *in_ptr,
-                                                       float *out_ptr,
-                                                       float *gamma_ptr,
-                                                       float *beta_ptr);
 template void
     LayerNorm::backward_kernel_wrapper<float>(LayerNormMeta const *m,
                                               float const *output_grad_ptr,
diff --git a/src/ops/layer_norm.cu b/src/ops/layer_norm.cu
index ac477ba2ad..35616de980 100644
--- a/src/ops/layer_norm.cu
+++ b/src/ops/layer_norm.cu
@@ -13,6 +13,7 @@
  * limitations under the License.
  */
 
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/ops/layer_norm.h"
 #include "flexflow/utils/cuda_helper.h"
 
@@ -30,12 +31,19 @@ LayerNormMeta::LayerNormMeta(FFHandler handle, LayerNorm const *ln)
   effective_num_elements = ln->effective_num_elements;
   profiling = ln->profiling;
   eps = ln->eps;
-  checkCUDA(cudaMalloc(&mean_ptr, sizeof(float) * effective_batch_size));
-  checkCUDA(cudaMalloc(&rstd_ptr, sizeof(float) * effective_batch_size));
-  checkCUDA(cudaMalloc(&ds_ptr, sizeof(float) * effective_batch_size));
-  checkCUDA(cudaMalloc(&db_ptr, sizeof(float) * effective_batch_size));
-  checkCUDA(cudaMalloc(&scale_ptr, sizeof(float) * effective_batch_size));
-  checkCUDA(cudaMalloc(&bias_ptr, sizeof(float) * effective_batch_size));
+  DataType data_type = ln->data_type;
+  checkCUDA(
+      cudaMalloc(&mean_ptr, data_type_size(data_type) * effective_batch_size));
+  checkCUDA(
+      cudaMalloc(&rstd_ptr, data_type_size(data_type) * effective_batch_size));
+  checkCUDA(
+      cudaMalloc(&ds_ptr, data_type_size(data_type) * effective_batch_size));
+  checkCUDA(
+      cudaMalloc(&db_ptr, data_type_size(data_type) * effective_batch_size));
+  checkCUDA(
+      cudaMalloc(&scale_ptr, data_type_size(data_type) * effective_batch_size));
+  checkCUDA(
+      cudaMalloc(&bias_ptr, data_type_size(data_type) * effective_batch_size));
 }
 
 template <typename T>
@@ -77,26 +85,26 @@ __inline__ __device__ T BlockReduceSum(T val, T *shared) {
 }
 
 template <typename T>
-__global__ void
-    RowwiseMomentsCUDAKernel(int64_t N, T eps, T const *X, T *mean, T *rstd) {
-  __shared__ T m_shared[C10_WARP_SIZE];
-  __shared__ T v_shared[C10_WARP_SIZE];
+__global__ void RowwiseMomentsCUDAKernel(
+    int64_t N, float eps, T const *X, T *mean, T *rstd) {
+  __shared__ float m_shared[C10_WARP_SIZE];
+  __shared__ float v_shared[C10_WARP_SIZE];
   const int64_t i = blockIdx.x;
-  T sum1 = 0;
-  T sum2 = 0;
+  float sum1 = 0.0f;
+  float sum2 = 0.0f;
   for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
     const int64_t index = i * N + j;
-    sum1 += static_cast<T>(X[index]);
-    sum2 += static_cast<T>(X[index]) * static_cast<T>(X[index]);
+    sum1 += static_cast<float>(X[index]);
+    sum2 += static_cast<float>(X[index]) * static_cast<float>(X[index]);
   }
-  sum1 = BlockReduceSum<T>(sum1, m_shared);
-  sum2 = BlockReduceSum<T>(sum2, v_shared);
+  sum1 = BlockReduceSum<float>(sum1, m_shared);
+  sum2 = BlockReduceSum<float>(sum2, v_shared);
   if (threadIdx.x == 0) {
-    const T scale = T(1) / static_cast<T>(N);
+    float const scale = float(1) / static_cast<float>(N);
     sum1 *= scale;
-    sum2 = max(sum2 * scale - sum1 * sum1, T(0));
-    mean[i] = sum1;
-    rstd[i] = rsqrt(sum2 + static_cast<T>(eps));
+    sum2 = max(sum2 * scale - sum1 * sum1, float(0));
+    mean[i] = static_cast<T>(sum1);
+    rstd[i] = static_cast<T>(rsqrt(sum2 + eps));
   }
 }
 
@@ -130,27 +138,30 @@ void LayerNorm::forward_kernel(LayerNormMeta const *m,
                                T *gamma_ptr,
                                T *beta_ptr,
                                cudaStream_t stream) {
-  RowwiseMomentsCUDAKernel<float>
+  RowwiseMomentsCUDAKernel<T>
       <<<m->effective_batch_size, kCUDABlockReduceNumThreads, 0, stream>>>(
-          m->effective_num_elements, m->eps, in_ptr, m->mean_ptr, m->rstd_ptr);
-  LayerNormForwardCUDAKernel<float>
+          m->effective_num_elements,
+          m->eps,
+          in_ptr,
+          static_cast<T *>(m->mean_ptr),
+          static_cast<T *>(m->rstd_ptr));
+  LayerNormForwardCUDAKernel<T>
       <<<m->effective_batch_size, kCUDANumThreads, 0, stream>>>(
           m->effective_num_elements,
           in_ptr,
-          m->mean_ptr,
-          m->rstd_ptr,
+          static_cast<T *>(m->mean_ptr),
+          static_cast<T *>(m->rstd_ptr),
           gamma_ptr,
           beta_ptr,
           out_ptr);
 }
 
 /*static*/
-template <typename T>
 void LayerNorm::forward_kernel_wrapper(LayerNormMeta const *m,
-                                       T const *in_ptr,
-                                       T *out_ptr,
-                                       T *gamma_ptr,
-                                       T *beta_ptr) {
+                                       GenericTensorAccessorR const &input,
+                                       GenericTensorAccessorW &output,
+                                       GenericTensorAccessorW &gamma,
+                                       GenericTensorAccessorW &beta) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -160,8 +171,24 @@ void LayerNorm::forward_kernel_wrapper(LayerNormMeta const *m,
     cudaEventCreate(&t_end);
     cudaEventRecord(t_start, stream);
   }
-  LayerNorm::forward_kernel<float>(
-      m, in_ptr, out_ptr, gamma_ptr, beta_ptr, stream);
+  if (m->input_type[0] == DT_FLOAT) {
+    LayerNorm::forward_kernel<float>(m,
+                                     input.get_float_ptr(),
+                                     output.get_float_ptr(),
+                                     gamma.get_float_ptr(),
+                                     beta.get_float_ptr(),
+                                     stream);
+  } else if (m->input_type[0] == DT_HALF) {
+    LayerNorm::forward_kernel<half>(m,
+                                    input.get_half_ptr(),
+                                    output.get_half_ptr(),
+                                    gamma.get_half_ptr(),
+                                    beta.get_half_ptr(),
+                                    stream);
+  } else {
+    assert(false && "unsupport datatype in layernorm");
+  }
+
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
     checkCUDA(cudaEventSynchronize(t_end));
@@ -170,8 +197,8 @@ void LayerNorm::forward_kernel_wrapper(LayerNormMeta const *m,
     cudaEventDestroy(t_start);
     cudaEventDestroy(t_end);
     printf("[LayerNorm] forward time (CF) = %.2fms\n", elapsed);
-    print_tensor<T>(in_ptr, 32, "[LayerNorm:forward:input]");
-    print_tensor<T>(out_ptr, 32, "[LayerNorm:forward:output]");
+    // print_tensor<T>(in_ptr, 32, "[LayerNorm:forward:input]");
+    // print_tensor<T>(out_ptr, 32, "[LayerNorm:forward:output]");
   }
 }
 
@@ -366,17 +393,22 @@ void LayerNorm::backward_kernel(LayerNormMeta const *m,
   const int64_t N = m->effective_num_elements;
   ComputeInternalGradientsCUDAKernel<T>
       <<<M, kCUDABlockReduceNumThreads, 0, stream>>>(
-          N, output_grad_ptr, input_ptr, gamma_ptr, m->ds_ptr, m->db_ptr);
+          N,
+          output_grad_ptr,
+          input_ptr,
+          gamma_ptr,
+          static_cast<T *>(m->ds_ptr),
+          static_cast<T *>(m->db_ptr));
   const int64_t B = (M + kCUDANumThreads - 1) / kCUDANumThreads;
   ComputeGradientFusedParamsCUDAKernel<T>
       <<<B, kCUDANumThreads, 0, stream>>>(M,
                                           N,
-                                          m->mean_ptr,
-                                          m->rstd_ptr,
-                                          m->ds_ptr,
-                                          m->db_ptr,
-                                          m->scale_ptr,
-                                          m->bias_ptr);
+                                          static_cast<T *>(m->mean_ptr),
+                                          static_cast<T *>(m->rstd_ptr),
+                                          static_cast<T *>(m->ds_ptr),
+                                          static_cast<T *>(m->db_ptr),
+                                          static_cast<T *>(m->scale_ptr),
+                                          static_cast<T *>(m->bias_ptr));
   if (gamma_grad_ptr != NULL || beta_grad_ptr != NULL) {
     if (M < 512) {
       // For small batch size, do colwise reduce directly
@@ -386,8 +418,8 @@ void LayerNorm::backward_kernel(LayerNormMeta const *m,
                                               N,
                                               output_grad_ptr,
                                               input_ptr,
-                                              m->mean_ptr,
-                                              m->rstd_ptr,
+                                              static_cast<T *>(m->mean_ptr),
+                                              static_cast<T *>(m->rstd_ptr),
                                               gamma_grad_ptr,
                                               beta_grad_ptr);
     } else {
@@ -396,14 +428,15 @@ void LayerNorm::backward_kernel(LayerNormMeta const *m,
       constexpr int kThreadX = kColwiseReduceTileSize;
       constexpr int kThreadY = kColwiseReduceTileSize / 2;
       GammaBetaBackwardCUDAKernel<T>
-          <<<B, dim3(kThreadX, kThreadY), 0, stream>>>(M,
-                                                       N,
-                                                       output_grad_ptr,
-                                                       input_ptr,
-                                                       m->mean_ptr,
-                                                       m->rstd_ptr,
-                                                       gamma_grad_ptr,
-                                                       beta_grad_ptr);
+          <<<B, dim3(kThreadX, kThreadY), 0, stream>>>(
+              M,
+              N,
+              output_grad_ptr,
+              input_ptr,
+              static_cast<T *>(m->mean_ptr),
+              static_cast<T *>(m->rstd_ptr),
+              gamma_grad_ptr,
+              beta_grad_ptr);
     }
   }
 }
@@ -419,21 +452,28 @@ void LayerNorm::backward_kernel_wrapper(LayerNormMeta const *m,
                                         T *beta_grad_ptr) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
-  LayerNorm::backward_kernel<float>(m,
-                                    output_grad_ptr,
-                                    input_ptr,
-                                    input_grad_ptr,
-                                    gamma_ptr,
-                                    gamma_grad_ptr,
-                                    beta_grad_ptr,
-                                    stream);
+  if (m->output_type[0] == DT_FLOAT) {
+    LayerNorm::backward_kernel<float>(m,
+                                      output_grad_ptr,
+                                      input_ptr,
+                                      input_grad_ptr,
+                                      gamma_ptr,
+                                      gamma_grad_ptr,
+                                      beta_grad_ptr,
+                                      stream);
+  }
+  // }else if(m->output_type[0] == DT_HALF){
+  //   LayerNorm::backward_kernel<half>(m,
+  //                                   output_grad_ptr,
+  //                                   input_ptr,
+  //                                   input_grad_ptr,
+  //                                   gamma_ptr,
+  //                                   gamma_grad_ptr,
+  //                                   beta_grad_ptr,
+  //                                   stream);
+  // }
 }
 
-template void LayerNorm::forward_kernel_wrapper<float>(LayerNormMeta const *m,
-                                                       float const *in_ptr,
-                                                       float *out_ptr,
-                                                       float *gamma_ptr,
-                                                       float *beta_ptr);
 template void
     LayerNorm::backward_kernel_wrapper<float>(LayerNormMeta const *m,
                                               float const *output_grad_ptr,
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index 51f2fc6eac..19845214e2 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -40,14 +40,31 @@ Tensor FFModel::dense(const Tensor input,
                       RegularizerMode kernel_reg_type,
                       float kernel_reg_lambda,
                       char const *name) {
-  Layer *li = new Layer(this,
-                        OP_LINEAR,
-                        data_type,
-                        name,
-                        1 /*inputs*/,
-                        use_bias ? 2 : 1 /*weights*/,
-                        1 /*outputs*/,
-                        input);
+  if (data_type == DT_NONE) {
+    data_type = input->data_type;
+  }
+  Layer *li = nullptr;
+  if (data_type != input->data_type) {
+    Tensor casted_input = cast(input, data_type, "type cast for dense");
+    li = new Layer(this,
+                   OP_LINEAR,
+                   data_type,
+                   name,
+                   1 /*inputs*/,
+                   use_bias ? 2 : 1 /*weights*/,
+                   1 /*outputs*/,
+                   casted_input);
+  } else {
+    li = new Layer(this,
+                   OP_LINEAR,
+                   data_type,
+                   name,
+                   1 /*inputs*/,
+                   use_bias ? 2 : 1 /*weights*/,
+                   1 /*outputs*/,
+                   input);
+  }
+
   {
     int numdims = input->num_dims;
     int dims[MAX_TENSOR_DIM];
@@ -333,12 +350,24 @@ OpMeta *Linear::init_task(Task const *task,
                           std::vector<PhysicalRegion> const &regions,
                           Context ctx,
                           Runtime *runtime) {
-  Domain out_domain = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  switch (out_domain.get_dim()) {
+  Linear const *linear = (Linear *)task->args;
+  GenericTensorAccessorW output =
+      helperGetGenericTensorAccessorWO(linear->inputs[0]->data_type,
+                                       regions[0],
+                                       task->regions[0],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  switch (output.domain.get_dim()) {
 #define DIMFUNC(DIM)                                                           \
   case DIM:                                                                    \
-    return init_task_with_dim<DIM>(task, regions, ctx, runtime);
+    if (output.data_type == DT_HALF) {                                         \
+      return init_task_with_dim<half, DIM>(task, regions, ctx, runtime);       \
+    } else if (output.data_type == DT_FLOAT) {                                 \
+      return init_task_with_dim<float, DIM>(task, regions, ctx, runtime);      \
+    } else {                                                                   \
+      assert(false && "Unsupported data type");                                \
+    }
     LEGION_FOREACH_N(DIMFUNC)
 #undef DIMFUNC
     default:
@@ -347,7 +376,7 @@ OpMeta *Linear::init_task(Task const *task,
   return NULL;
 }
 
-template <int NDIM>
+template <typename DT, int NDIM>
 OpMeta *Linear::init_task_with_dim(Task const *task,
                                    std::vector<PhysicalRegion> const &regions,
                                    Context ctx,
@@ -358,18 +387,18 @@ OpMeta *Linear::init_task_with_dim(Task const *task,
   FFHandler handle = *((FFHandler const *)task->local_args);
   // TensorAccessorR<float, 2> acc_input(
   //     regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  TensorAccessorW<float, NDIM> acc_output(regions[0],
-                                          task->regions[0],
-                                          FID_DATA,
-                                          ctx,
-                                          runtime,
-                                          false /*readOutput*/);
-  TensorAccessorW<float, NDIM> acc_kernel(regions[1],
-                                          task->regions[1],
-                                          FID_DATA,
-                                          ctx,
-                                          runtime,
-                                          false /*readOutput*/);
+  TensorAccessorW<DT, NDIM> acc_output(regions[0],
+                                       task->regions[0],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime,
+                                       false /*readOutput*/);
+  TensorAccessorW<DT, NDIM> acc_kernel(regions[1],
+                                       task->regions[1],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime,
+                                       false /*readOutput*/);
   // TensorAccessorR<float, 1> acc_bias(
   //     regions[3], task->regions[3], FID_DATA, ctx, runtime);
   // int in_dim = acc_input.rect.hi[0] - acc_input.rect.lo[0] + 1;
@@ -380,7 +409,7 @@ OpMeta *Linear::init_task_with_dim(Task const *task,
          in_dim,
          out_dim,
          batch_size);
-  LinearMeta *m = new LinearMeta(handle, batch_size);
+  LinearMeta *m = new LinearMeta(handle, batch_size, linear);
   m->activation = linear->activation;
   m->kernel_reg_type = linear->kernel_reg_type;
   m->kernel_reg_lambda = linear->kernel_reg_lambda;
@@ -494,12 +523,21 @@ void Linear::forward_task(Task const *task,
                           std::vector<PhysicalRegion> const &regions,
                           Context ctx,
                           Runtime *runtime) {
-  Domain in_domain = runtime->get_index_space_domain(
+  Domain input_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
-  switch (in_domain.get_dim()) {
+  LinearMeta const *m = *((LinearMeta **)task->local_args);
+  assert(m->input_type == m->weight_type);
+  assert(m->input_type == m->output_type);
+  switch (input_domain.get_dim()) {
 #define DIMFUNC(DIM)                                                           \
   case DIM:                                                                    \
-    return forward_task_with_dim<DIM>(task, regions, ctx, runtime);
+    if (m->output_type == DT_HALF) {                                           \
+      return forward_task_with_dim<half, DIM>(task, regions, ctx, runtime);    \
+    } else if (m->output_type == DT_FLOAT) {                                   \
+      return forward_task_with_dim<float, DIM>(task, regions, ctx, runtime);   \
+    } else {                                                                   \
+      assert(false && "Unsupported data type");                                \
+    }
     LEGION_FOREACH_N(DIMFUNC)
 #undef DIMFUNC
     default:
@@ -513,7 +551,7 @@ void Linear::forward_task(Task const *task,
   regions[2](I): kernel
   regions[3](I): bias
 */
-template <int NDIM>
+template <typename DT, int NDIM>
 void Linear::forward_task_with_dim(Task const *task,
                                    std::vector<PhysicalRegion> const &regions,
                                    Context ctx,
@@ -523,15 +561,15 @@ void Linear::forward_task_with_dim(Task const *task,
   assert(regions.size() == (3 + static_cast<size_t>(m->use_bias)));
   assert(task->regions.size() == (3 + static_cast<size_t>(m->use_bias)));
 
-  TensorAccessorR<float, NDIM> acc_input(
+  TensorAccessorR<DT, NDIM> acc_input(
       regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  TensorAccessorW<float, NDIM> acc_output(regions[1],
-                                          task->regions[1],
-                                          FID_DATA,
-                                          ctx,
-                                          runtime,
-                                          false /*readOutput*/);
-  TensorAccessorR<float, NDIM> acc_kernel(
+  TensorAccessorW<DT, NDIM> acc_output(regions[1],
+                                       task->regions[1],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime,
+                                       false /*readOutput*/);
+  TensorAccessorR<DT, NDIM> acc_kernel(
       regions[2], task->regions[2], FID_DATA, ctx, runtime);
   int in_dim = acc_input.rect.hi[0] - acc_input.rect.lo[0] + 1;
   int out_dim = acc_output.rect.hi[0] - acc_output.rect.lo[0] + 1;
@@ -539,9 +577,9 @@ void Linear::forward_task_with_dim(Task const *task,
   assert(acc_output.rect.volume() == static_cast<size_t>(out_dim * batch_size));
   assert(acc_input.rect.volume() == static_cast<size_t>(in_dim * batch_size));
   assert(acc_kernel.rect.volume() == static_cast<size_t>(in_dim * out_dim));
-  float const *acc_bias_ptr = NULL;
+  DT const *acc_bias_ptr = nullptr;
   if (m->use_bias) {
-    TensorAccessorR<float, NDIM> acc_bias(
+    TensorAccessorR<DT, NDIM> acc_bias(
         regions[3], task->regions[3], FID_DATA, ctx, runtime);
     assert(acc_bias.rect.volume() == static_cast<size_t>(out_dim));
     acc_bias_ptr = acc_bias.ptr;
@@ -639,10 +677,19 @@ void Linear::backward_task(Task const *task,
                            Runtime *runtime) {
   Domain in_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
+  LinearMeta const *m = *((LinearMeta **)task->local_args);
+  assert(m->input_type == m->weight_type);
+  assert(m->input_type == m->output_type);
   switch (in_domain.get_dim()) {
 #define DIMFUNC(DIM)                                                           \
   case DIM:                                                                    \
-    return backward_task_with_dim<DIM>(task, regions, ctx, runtime);
+    if (m->output_type == DT_HALF) {                                           \
+      return backward_task_with_dim<half, DIM>(task, regions, ctx, runtime);   \
+    } else if (m->output_type == DT_FLOAT) {                                   \
+      return backward_task_with_dim<float, DIM>(task, regions, ctx, runtime);  \
+    } else {                                                                   \
+      assert(false && "Unsupported data type");                                \
+    }
     LEGION_FOREACH_N(DIMFUNC)
 #undef DIMFUNC
     default:
@@ -659,7 +706,7 @@ void Linear::backward_task(Task const *task,
   regions[5](I/O): filter_grad
   regions[6](I/O): bias_grad
 */
-template <int NDIM>
+template <typename DT, int NDIM>
 void Linear::backward_task_with_dim(Task const *task,
                                     std::vector<PhysicalRegion> const &regions,
                                     Context ctx,
@@ -671,9 +718,9 @@ void Linear::backward_task_with_dim(Task const *task,
   assert(task->regions.size() ==
          (5 + static_cast<size_t>(m->trainableInputs[0]) +
           static_cast<size_t>(m->use_bias)));
-  float *input_grad = NULL;
+  DT *input_grad = nullptr;
   size_t rid = 0;
-  TensorAccessorR<float, NDIM> acc_input(
+  TensorAccessorR<DT, NDIM> acc_input(
       regions[rid], task->regions[rid], FID_DATA, ctx, runtime);
   rid++;
   if (m->trainableInputs[0]) {
@@ -681,39 +728,39 @@ void Linear::backward_task_with_dim(Task const *task,
         ctx, task->regions[rid].region.get_index_space());
     if (domain.get_dim() == NDIM + 1) {
       assert(domain.get_volume() == acc_input.rect.volume());
-      input_grad = helperGetTensorPointerWO<float>(
+      input_grad = helperGetTensorPointerWO<DT>(
           regions[rid], task->regions[rid], FID_DATA, ctx, runtime);
     } else {
-      TensorAccessorW<float, NDIM> acc_replica_grad(regions[rid],
-                                                    task->regions[rid],
-                                                    FID_DATA,
-                                                    ctx,
-                                                    runtime,
-                                                    true /*readOutput*/);
+      TensorAccessorW<DT, NDIM> acc_replica_grad(regions[rid],
+                                                 task->regions[rid],
+                                                 FID_DATA,
+                                                 ctx,
+                                                 runtime,
+                                                 true /*readOutput*/);
       assert(acc_replica_grad.rect.volume() == acc_input.rect.volume());
       input_grad = acc_replica_grad.ptr;
     }
     rid++;
   }
-  TensorAccessorR<float, NDIM> acc_output(
+  TensorAccessorR<DT, NDIM> acc_output(
       regions[rid], task->regions[rid], FID_DATA, ctx, runtime);
   rid++;
-  TensorAccessorW<float, NDIM> acc_output_grad(regions[rid],
-                                               task->regions[rid],
-                                               FID_DATA,
-                                               ctx,
-                                               runtime,
-                                               true /*readOutput*/);
+  TensorAccessorW<DT, NDIM> acc_output_grad(regions[rid],
+                                            task->regions[rid],
+                                            FID_DATA,
+                                            ctx,
+                                            runtime,
+                                            true /*readOutput*/);
   rid++;
-  TensorAccessorR<float, NDIM> acc_kernel(
+  TensorAccessorR<DT, NDIM> acc_kernel(
       regions[rid], task->regions[rid], FID_DATA, ctx, runtime);
   rid++;
-  TensorAccessorW<float, NDIM> acc_kernel_grad(regions[rid],
-                                               task->regions[rid],
-                                               FID_DATA,
-                                               ctx,
-                                               runtime,
-                                               true /*readOutput*/);
+  TensorAccessorW<DT, NDIM> acc_kernel_grad(regions[rid],
+                                            task->regions[rid],
+                                            FID_DATA,
+                                            ctx,
+                                            runtime,
+                                            true /*readOutput*/);
   rid++;
   // make sure the sizes match
   int in_dim = acc_input.rect.hi[0] - acc_input.rect.lo[0] + 1;
@@ -725,17 +772,17 @@ void Linear::backward_task_with_dim(Task const *task,
   assert(acc_kernel.rect.volume() == static_cast<size_t>(in_dim * out_dim));
   assert(acc_kernel_grad.rect.volume() ==
          static_cast<size_t>(in_dim * out_dim));
-  float *acc_bias_grad_ptr = NULL;
+  DT *acc_bias_grad_ptr = nullptr;
   if (m->use_bias) {
-    TensorAccessorW<float, 3> acc_bias_grad(regions[rid],
-                                            task->regions[rid],
-                                            FID_DATA,
-                                            ctx,
-                                            runtime,
-                                            true /*readOutput*/);
+    TensorAccessorW<DT, 3> acc_bias_grad(regions[rid],
+                                         task->regions[rid],
+                                         FID_DATA,
+                                         ctx,
+                                         runtime,
+                                         true /*readOutput*/);
     rid++;
     assert(acc_bias_grad.rect.volume() == static_cast<size_t>(out_dim));
-    acc_bias_grad_ptr = static_cast<float *>(acc_bias_grad.ptr);
+    acc_bias_grad_ptr = static_cast<DT *>(acc_bias_grad.ptr);
   }
   assert(rid == regions.size());
 
diff --git a/src/ops/rms_norm.cc b/src/ops/rms_norm.cc
index 57578f5793..a926fd3b22 100644
--- a/src/ops/rms_norm.cc
+++ b/src/ops/rms_norm.cc
@@ -57,23 +57,40 @@ RMSNormParams RMSNorm::get_params() const {
 Tensor FFModel::rms_norm(const Tensor input,
                          float eps,
                          int dim,
+                         DataType data_type,
                          char const *name) {
-  Layer *rm = new Layer(this,
-                        OP_RMS_NORM,
-                        DT_FLOAT,
-                        name,
-                        1 /*inputs*/,
-                        1 /*weights*/,
-                        1 /*outputs*/,
-                        input);
+  if (data_type == DT_NONE) {
+    data_type = input->data_type;
+  }
+  Layer *rm = nullptr;
+  if (data_type != input->data_type) {
+    Tensor casted_input = cast(input, data_type, "type cast for rms_norm");
+    rm = new Layer(this,
+                   OP_RMS_NORM,
+                   data_type,
+                   name,
+                   1 /*inputs*/,
+                   1 /*weights*/,
+                   1 /*outputs*/,
+                   casted_input);
+  } else {
+    rm = new Layer(this,
+                   OP_RMS_NORM,
+                   data_type,
+                   name,
+                   1 /*inputs*/,
+                   1 /*weights*/,
+                   1 /*outputs*/,
+                   input);
+  }
   rm->outputs[0] = create_tensor_legion_ordering(
-      input->num_dims, input->dims, DT_FLOAT, rm, 0, true /*create_grad*/);
+      input->num_dims, input->dims, data_type, rm, 0, true /*create_grad*/);
 
   // weights
   int weight_dims[1] = {dim};
   rm->weights[0] = create_weight_legion_ordering(1,
                                                  weight_dims,
-                                                 DT_FLOAT,
+                                                 data_type,
                                                  rm,
                                                  true /*create_grad*/,
                                                  nullptr,
@@ -362,11 +379,11 @@ void RMSNorm::forward_task(Task const *task,
   assert(regions.size() == 3);
   RMSNormMeta const *m = *((RMSNormMeta **)task->local_args);
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
-      DT_FLOAT, regions[0], task->regions[0], FID_DATA, ctx, runtime);
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
   GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
-      DT_FLOAT, regions[1], task->regions[1], FID_DATA, ctx, runtime);
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
   GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
-      DT_FLOAT, regions[2], task->regions[2], FID_DATA, ctx, runtime);
+      m->weight_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
   forward_kernel_wrapper(m, input, weight, output);
 }
 
@@ -423,4 +440,4 @@ size_t hash<FlexFlow::RMSNormParams>::operator()(
   hash_combine(key, params.dim);
   return key;
 }
-}; // namespace std
\ No newline at end of file
+}; // namespace std
diff --git a/src/ops/softmax.cc b/src/ops/softmax.cc
index 304fa7b418..90aef807e2 100644
--- a/src/ops/softmax.cc
+++ b/src/ops/softmax.cc
@@ -52,10 +52,16 @@ SoftmaxParams Softmax::get_params() const {
   return params;
 }
 
-Tensor FFModel::softmax(const Tensor _input, int dim, char const *name) {
+Tensor FFModel::softmax(const Tensor _input,
+                        int dim,
+                        DataType data_type,
+                        char const *name) {
+  if (data_type = DT_NONE) {
+    data_type = _input->data_type;
+  }
   Layer *sm = new Layer(this,
                         OP_SOFTMAX,
-                        DT_FLOAT,
+                        data_type,
                         name,
                         1 /*inputs*/,
                         0 /*weights*/,
@@ -67,7 +73,7 @@ Tensor FFModel::softmax(const Tensor _input, int dim, char const *name) {
     dims[i] = _input->dims[i];
   }
   sm->outputs[0] = create_tensor_legion_ordering(
-      numdims, dims, DT_FLOAT, sm, 0, true /*create_grad*/);
+      numdims, dims, data_type, sm, 0, true /*create_grad*/);
   sm->add_int_property("softmax_dim", dim);
   layers.push_back(sm);
   return sm->outputs[0];
@@ -106,7 +112,7 @@ Softmax::Softmax(FFModel &model,
   for (int i = 0; i < numdim; i++) {
     dims[i] = _input->dims[numdim - 1 - i];
   }
-  outputs[0] = model.create_parallel_tensor(numdim, dims, DT_FLOAT, this);
+  outputs[0] = model.create_parallel_tensor(numdim, dims, data_type, this);
 }
 
 Softmax::Softmax(FFModel &model,
@@ -221,6 +227,8 @@ OpMeta *Softmax::init_task(Task const *task,
     domain = input_domain;
   }
   SoftmaxMeta *m = new SoftmaxMeta(handle, softmax, domain);
+  m->input_type = softmax->inputs[0]->data_type;
+  m->output_type = softmax->outputs[0]->data_type;
   // checkCUDNN(cudnnCreateTensorDescriptor(&m->outputTensor));
   return m;
 }
@@ -241,7 +249,7 @@ FutureMap Softmax::inference(FFModel const &ff,
             << std::endl; */
   IndexLauncher launcher(SOFTMAX_INF_TASK_ID,
                          parallel_is,
-                         TaskArgument(NULL, 0),
+                         TaskArgument(nullptr, 0),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
@@ -296,10 +304,17 @@ void Softmax::forward_task(Task const *task,
                            Runtime *runtime) {
   Domain in_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
+  SoftmaxMeta const *m = *((SoftmaxMeta **)task->local_args);
   switch (in_domain.get_dim()) {
 #define DIMFUNC(DIM)                                                           \
   case DIM:                                                                    \
-    return forward_task_with_dim<DIM>(task, regions, ctx, runtime);
+    if (m->output_type == DT_HALF) {                                           \
+      return forward_task_with_dim<half, DIM>(task, regions, ctx, runtime);    \
+    } else if (m->output_type == DT_FLOAT) {                                   \
+      return forward_task_with_dim<float, DIM>(task, regions, ctx, runtime);   \
+    } else {                                                                   \
+      assert(false && "Unsupported data type");                                \
+    }
     LEGION_FOREACH_N(DIMFUNC)
 #undef DIMFUNC
     default:
@@ -311,7 +326,7 @@ void Softmax::forward_task(Task const *task,
   regions[0](I): input
   regions[1](O): output
 */
-template <int NDIM>
+template <typename DT, int NDIM>
 void Softmax::forward_task_with_dim(Task const *task,
                                     std::vector<PhysicalRegion> const &regions,
                                     Context ctx,
@@ -320,15 +335,14 @@ void Softmax::forward_task_with_dim(Task const *task,
   assert(task->regions.size() == 2);
   // const Softmax* softmax = (Softmax*) task->args;
   SoftmaxMeta const *m = *((SoftmaxMeta **)task->local_args);
-  TensorAccessorR<float, NDIM> acc_input(
+  TensorAccessorR<DT, NDIM> acc_input(
       regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  TensorAccessorW<float, NDIM> acc_output(regions[1],
-                                          task->regions[1],
-                                          FID_DATA,
-                                          ctx,
-                                          runtime,
-                                          false /*readOutput*/);
-
+  TensorAccessorW<DT, NDIM> acc_output(regions[1],
+                                       task->regions[1],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime,
+                                       false /*readOutput*/);
   forward_kernel_wrapper(m, acc_input.ptr, acc_output.ptr);
 }
 
@@ -366,10 +380,17 @@ void Softmax::backward_task(Task const *task,
                             Runtime *runtime) {
   Domain in_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
+  SoftmaxMeta const *m = *((SoftmaxMeta **)task->local_args);
   switch (in_domain.get_dim()) {
 #define DIMFUNC(DIM)                                                           \
   case DIM:                                                                    \
-    return backward_task_with_dim<DIM>(task, regions, ctx, runtime);
+    if (m->output_type == DT_HALF) {                                           \
+      return backward_task_with_dim<half, DIM>(task, regions, ctx, runtime);   \
+    } else if (m->output_type == DT_FLOAT) {                                   \
+      return backward_task_with_dim<float, DIM>(task, regions, ctx, runtime);  \
+    } else {                                                                   \
+      assert(false && "Unsupported data type");                                \
+    }
     LEGION_FOREACH_N(DIMFUNC)
 #undef DIMFUNC
     default:
@@ -384,7 +405,7 @@ void Softmax::backward_task(Task const *task,
 // Note that the backward task of softmax is actually a no op (i.e., input_grad
 // = output_grad) since the upstream cross_entropy_loss function computes
 // performs softmax_cross_entropy_loss to avoid intermediate zeros
-template <int NDIM>
+template <typename DT, int NDIM>
 void Softmax::backward_task_with_dim(Task const *task,
                                      std::vector<PhysicalRegion> const &regions,
                                      Context ctx,
@@ -393,13 +414,13 @@ void Softmax::backward_task_with_dim(Task const *task,
   assert(task->regions.size() == 2);
   // const Softmax* softmax = (Softmax*) task->args;
   SoftmaxMeta const *m = *((SoftmaxMeta **)task->local_args);
-  TensorAccessorW<float, NDIM> acc_input_grad(regions[0],
-                                              task->regions[0],
-                                              FID_DATA,
-                                              ctx,
-                                              runtime,
-                                              true /*readOutput*/);
-  TensorAccessorR<float, NDIM> acc_output_grad(
+  TensorAccessorW<DT, NDIM> acc_input_grad(regions[0],
+                                           task->regions[0],
+                                           FID_DATA,
+                                           ctx,
+                                           runtime,
+                                           true /*readOutput*/);
+  TensorAccessorR<DT, NDIM> acc_output_grad(
       regions[1], task->regions[1], FID_DATA, ctx, runtime);
   // make sure the image indices match!
   assert(acc_input_grad.rect == acc_output_grad.rect);
@@ -415,12 +436,19 @@ InferenceResult
                             Runtime *runtime) {
   Domain in_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
+  SoftmaxMeta const *m = *((SoftmaxMeta **)task->local_args);
   switch (in_domain.get_dim()) {
 #define DIMFUNC(DIM)                                                           \
-  case DIM: {                                                                  \
-    forward_task_with_dim<DIM>(task, regions, ctx, runtime);                   \
-    break;                                                                     \
-  }
+  case DIM:                                                                    \
+    if (m->output_type == DT_HALF) {                                           \
+      forward_task_with_dim<half, DIM>(task, regions, ctx, runtime);           \
+      break;                                                                   \
+    } else if (m->output_type == DT_FLOAT) {                                   \
+      forward_task_with_dim<float, DIM>(task, regions, ctx, runtime);          \
+      break;                                                                   \
+    } else {                                                                   \
+      assert(false && "Unsupported data type");                                \
+    }
     LEGION_FOREACH_N(DIMFUNC)
 #undef DIMFUNC
     default:
diff --git a/src/ops/spec_inc_multihead_self_attention.cc b/src/ops/spec_inc_multihead_self_attention.cc
index a764fbe8fa..e4c2837e87 100644
--- a/src/ops/spec_inc_multihead_self_attention.cc
+++ b/src/ops/spec_inc_multihead_self_attention.cc
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/ops/spec_inc_multihead_self_attention.h"
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/model.h"
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
 #include "flexflow/utils/cuda_helper.h"
@@ -64,22 +65,38 @@ Tensor
                                                bool bias,
                                                bool add_bias_kv,
                                                bool add_zero_attn,
+                                               DataType data_type,
                                                Initializer *kernel_initializer,
                                                bool apply_rotary_embedding,
                                                bool scaling_query,
                                                float scaling_factor,
                                                bool qk_prod_scaling,
                                                char const *name) {
-  // Currently assume that
+  if (data_type == DT_NONE) {
+    data_type = input->data_type;
+  }
+  Layer *li = nullptr;
   int weight_num = bias ? 2 : 1;
-  Layer *li = new Layer(this,
-                        OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION,
-                        DT_FLOAT,
-                        name,
-                        1 /*inputs*/,
-                        weight_num /*weights*/,
-                        1 /*outputs*/,
-                        input);
+  if (data_type != input->data_type) {
+    Tensor casted_input = cast(input, data_type, "type cast for IncMHA");
+    li = new Layer(this,
+                   OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION,
+                   data_type,
+                   name,
+                   1 /*inputs*/,
+                   weight_num /*weights*/,
+                   1 /*outputs*/,
+                   casted_input);
+  } else {
+    li = new Layer(this,
+                   OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION,
+                   data_type,
+                   name,
+                   1 /*inputs*/,
+                   weight_num /*weights*/,
+                   1 /*outputs*/,
+                   input);
+  }
   {
     int numdims = input->num_dims;
     int dims[MAX_TENSOR_DIM];
@@ -88,7 +105,7 @@ Tensor
     }
     dims[0] = embed_dim;
     li->outputs[0] = create_tensor_legion_ordering(
-        numdims, dims, DT_FLOAT, li, 0, true /*create_grad*/);
+        numdims, dims, data_type, li, 0, true /*create_grad*/);
   }
   {
     // Compute weight size
@@ -102,7 +119,7 @@ Tensor
     int dims[2] = {qParas + kParas + vParas + oParas, num_heads};
     li->weights[0] = create_weight_legion_ordering(2,
                                                    dims,
-                                                   DT_FLOAT,
+                                                   data_type,
                                                    li,
                                                    true /*create_grad*/,
                                                    kernel_initializer,
@@ -113,13 +130,13 @@ Tensor
     int dims[1] = {embed_dim * 4};
     li->weights[1] = create_weight_legion_ordering(1,
                                                    dims,
-                                                   DT_FLOAT,
+                                                   data_type,
                                                    li,
                                                    true /*create_grad*/,
                                                    kernel_initializer,
                                                    CHOSEN_SYNC_TYPE);
   }
-  li->data_type = DT_FLOAT;
+  li->data_type = data_type;
   li->add_int_property("embed_dim", embed_dim);
   li->add_int_property("num_heads", num_heads);
   li->add_int_property("kdim", kdim);
@@ -207,7 +224,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     // Initializer* _bias_initializer)
     : Op(model,
          OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION,
-         DT_FLOAT,
+         _input->data_type,
          name,
          1 /*inputs*/,
          (_bias ? 2 : 1) /*weights*/,
@@ -259,7 +276,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     ParameterSyncType comm_type = ParameterSyncType::PS;
 #endif
     weights[0] = model.create_parallel_weight<3>(dims,
-                                                 DT_FLOAT,
+                                                 this->data_type,
                                                  NULL /*owner_op*/,
                                                  true /*create_grad*/,
                                                  initializer,
@@ -279,14 +296,14 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     ParameterSyncType comm_type = ParameterSyncType::PS;
 #endif
     weights[1] = model.create_parallel_weight<2>(dims,
-                                                 DT_FLOAT,
+                                                 this->data_type,
                                                  NULL /*owner_op*/,
                                                  true /*create_grad*/,
                                                  NULL,
                                                  comm_type);
   }
   outputs[0] = model.create_parallel_tensor_legion_ordering(
-      _input->num_dims, dims, DT_FLOAT, this);
+      _input->num_dims, dims, this->data_type, this);
   /* for (int i = 0; i < numdim; i++) { */
   /*   register_output_input_parallel_dims(outputs[0], i, inputs[0], i); */
   /* } */
@@ -315,7 +332,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     // Initializer* _bias_initializer)
     : Op(model,
          OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION,
-         DT_FLOAT,
+         _input->data_type,
          name,
          1 /*inputs*/,
          (_bias ? 2 : 1) /*weights*/,
@@ -365,7 +382,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     ParameterSyncType comm_type = ParameterSyncType::PS;
 #endif
     weights[0] = model.create_parallel_weight<3>(dims,
-                                                 DT_FLOAT,
+                                                 this->data_type,
                                                  NULL /*owner_op*/,
                                                  true /*create_grad*/,
                                                  initializer,
@@ -383,14 +400,14 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     ParameterSyncType comm_type = ParameterSyncType::PS;
 #endif
     weights[1] = model.create_parallel_weight<2>(dims,
-                                                 DT_FLOAT,
+                                                 this->data_type,
                                                  NULL /*owner_op*/,
                                                  true /*create_grad*/,
                                                  NULL,
                                                  comm_type);
   }
   outputs[0] = model.create_parallel_tensor_legion_ordering(
-      _input->num_dims, dims, DT_FLOAT, this);
+      _input->num_dims, dims, this->data_type, this);
 
   /* for (int i = 0; i < numdim; i++) { */
   /*   register_output_input_parallel_dims(outputs[0], i, inputs[0], i); */
@@ -546,12 +563,27 @@ OpMeta *SpecIncMultiHeadSelfAttention::init_task(
       (SpecIncMultiHeadSelfAttention *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
 
-  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
-      DT_FLOAT, regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
-      DT_FLOAT, regions[1], task->regions[1], FID_DATA, ctx, runtime);
-  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
-      DT_FLOAT, regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR input =
+      helperGetGenericTensorAccessorRO(attn->inputs[0]->data_type,
+                                       regions[0],
+                                       task->regions[0],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorR weight =
+      helperGetGenericTensorAccessorRO(attn->weights[0]->data_type,
+                                       regions[1],
+                                       task->regions[1],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorW output =
+      helperGetGenericTensorAccessorWO(attn->outputs[0]->data_type,
+                                       regions[2],
+                                       task->regions[2],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
 
   int num_samples = input.domain.hi()[2] - input.domain.lo()[2] + 1;
   assert(attn->qoSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
@@ -564,9 +596,10 @@ OpMeta *SpecIncMultiHeadSelfAttention::init_task(
                        .best_affinity_to(task->target_proc)
                        .first();
   SpecIncMultiHeadSelfAttentionMeta *m = new SpecIncMultiHeadSelfAttentionMeta(
-      handle, attn, weight.get_float_ptr(), gpu_mem, num_samples, num_heads);
+      handle, attn, weight, gpu_mem, num_samples, num_heads);
   m->profiling = attn->profiling;
-  assert(weight.domain.get_volume() * sizeof(float) == m->weightSize);
+  assert(weight.domain.get_volume() * data_type_size(weight.data_type) ==
+         m->weightSize);
   return m;
 }
 
@@ -640,7 +673,6 @@ void SpecIncMultiHeadSelfAttention::inference_task(
     Context ctx,
     Runtime *runtime) {
   assert(task->regions.size() == regions.size());
-  float const *bias_ptr = NULL;
 
   BeamSearchBatchConfig const *bc = (BeamSearchBatchConfig *)task->args;
   SpecIncMultiHeadSelfAttentionMeta const *m =
@@ -653,19 +685,17 @@ void SpecIncMultiHeadSelfAttention::inference_task(
       m->weight_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
   GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
       m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
-
+  GenericTensorAccessorR biases;
   if (*m->bias) {
-    GenericTensorAccessorR biases =
-        helperGetGenericTensorAccessorRO(m->weight_type[1],
-                                         regions[3],
-                                         task->regions[3],
-                                         FID_DATA,
-                                         ctx,
-                                         runtime);
+    biases = helperGetGenericTensorAccessorRO(m->weight_type[1],
+                                              regions[3],
+                                              task->regions[3],
+                                              FID_DATA,
+                                              ctx,
+                                              runtime);
     Domain bias_domain = runtime->get_index_space_domain(
         ctx, task->regions[3].region.get_index_space());
     assert(bias_domain.get_dim() == 2);
-    bias_ptr = biases.get_float_ptr();
   }
   Domain input_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
@@ -679,12 +709,7 @@ void SpecIncMultiHeadSelfAttention::inference_task(
   assert(output_domain.get_dim() == 4);
 
   SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
-      m,
-      bc,
-      input.get_float_ptr(),
-      weight.get_float_ptr(),
-      output.get_float_ptr(),
-      bias_ptr);
+      m, bc, input, weight, output, biases);
 
   // print_tensor<float>(input.get_float_ptr(), 20, "attention input");
   // print_tensor<float>(output.get_float_ptr(), 20, "attention output");
diff --git a/src/ops/spec_inc_multihead_self_attention.cpp b/src/ops/spec_inc_multihead_self_attention.cpp
index b898d472a8..85bd71b205 100644
--- a/src/ops/spec_inc_multihead_self_attention.cpp
+++ b/src/ops/spec_inc_multihead_self_attention.cpp
@@ -27,10 +27,10 @@ using Legion::Memory;
 void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
     SpecIncMultiHeadSelfAttentionMeta const *m,
     BeamSearchBatchConfig const *bc,
-    float const *input_ptr,
-    float const *weight_ptr,
-    float *output_ptr,
-    float const *bias_ptr) {
+    GenericTensorAccessorR const &input,
+    GenericTensorAccessorR const &weight,
+    GenericTensorAccessorW const &output,
+    GenericTensorAccessorR const &bias) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -60,7 +60,7 @@ void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
 SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
     FFHandler handler,
     SpecIncMultiHeadSelfAttention const *attn,
-    float const *weight_ptr,
+    GenericTensorAccessorR const &weight,
     Memory gpu_mem,
     int num_samples,
     int _num_heads)
@@ -80,7 +80,7 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
                                     attn->qk_prod_scaling,
                                     attn->add_bias_kv,
                                     attn->scaling_factor,
-                                    weight_ptr,
+                                    weight,
                                     gpu_mem,
                                     num_samples,
                                     _num_heads) {
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index f12d48ab1d..7370ff446e 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -15,6 +15,7 @@
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
 #include "cuComplex.h"
 #endif
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/ops/kernels/inc_multihead_self_attention_kernels.h"
 #include "flexflow/ops/spec_inc_multihead_self_attention.h"
 #include "flexflow/utils/cuda_helper.h"
@@ -26,9 +27,13 @@ using Legion::coord_t;
 using Legion::Memory;
 using namespace Kernels::IncMultiHeadAttention;
 
+namespace Kernels {
+namespace SpecIncMultiHeadAttention {
+
+template <typename DT>
 __global__ void spec_store_kv_cache(
-    float const *devQKVProjArray,
-    float *cache_ptr,
+    DT const *devQKVProjArray,
+    DT *cache_ptr,
     BatchConfig::PerTokenInfo *tokenInfos,
     BatchConfig::PerRequestInfo *requestInfo,
     BeamSearchBatchConfig::BeamSearchPerTokenInfo *beamTokenInfos,
@@ -52,7 +57,7 @@ __global__ void spec_store_kv_cache(
     int qkv_block_size = (qProjSize + kProjSize + vProjSize) * num_tokens;
     int current_head_block_size =
         num_tokens * (k_cache ? qProjSize : qProjSize + kProjSize);
-    float val =
+    DT val =
         devQKVProjArray[head_idx * qkv_block_size + current_head_block_size +
                         token_idx * proj_size + data_idx];
 
@@ -153,6 +158,7 @@ __global__ void spec_store_kv_cache(
   }
 }
 
+template <typename DT>
 void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                             BeamSearchBatchConfig const *bc,
                             cudaStream_t stream) {
@@ -165,8 +171,8 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
     spec_store_kv_cache<<<GET_BLOCKS(parallelism),
                           min(CUDA_NUM_THREADS, parallelism),
                           0,
-                          stream>>>(m->devQKVProjArray,
-                                    m->keyCache,
+                          stream>>>(static_cast<DT *>(m->devQKVProjArray),
+                                    static_cast<DT *>(m->keyCache),
                                     m->token_infos,
                                     m->request_infos,
                                     m->beam_token_infos,
@@ -185,8 +191,8 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
     spec_store_kv_cache<<<GET_BLOCKS(parallelism),
                           min(CUDA_NUM_THREADS, parallelism),
                           0,
-                          stream>>>(m->devQKVProjArray,
-                                    m->valueCache,
+                          stream>>>(static_cast<DT *>(m->devQKVProjArray),
+                                    static_cast<DT *>(m->valueCache),
                                     m->token_infos,
                                     m->request_infos,
                                     m->beam_token_infos,
@@ -203,11 +209,12 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   }
 }
 
-__global__ void spec_fill_entries_above_diagonal(float *matrix,
+template <typename DT>
+__global__ void spec_fill_entries_above_diagonal(DT *matrix,
                                                  size_t new_tokens,
                                                  size_t total_tokens_in_request,
                                                  size_t num_heads,
-                                                 float value) {
+                                                 DT value) {
   CUDA_KERNEL_LOOP(i, new_tokens * total_tokens_in_request * num_heads) {
     // size_t head_idx = i / (new_tokens * total_tokens_in_request);
     size_t src_idx = (i / new_tokens) % total_tokens_in_request;
@@ -219,19 +226,22 @@ __global__ void spec_fill_entries_above_diagonal(float *matrix,
   }
 }
 
+template <typename DT>
 void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                               BeamSearchBatchConfig const *bc,
-                              float *output_ptr,
-                              float const *bias_ptr,
+                              DT *output_ptr,
+                              DT const *bias_ptr,
                               cudaStream_t stream) {
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
-  cudaDataType_t cublas_data_type = ff_to_cuda_datatype(DT_FLOAT);
+  cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
+  cudnnDataType_t cudnn_data_type = ff_to_cudnn_datatype(m->output_type[0]);
+  assert(data_type_size(m->output_type[0]) == sizeof(DT));
 #if CUDA_VERSION >= 11000
   // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
   cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
 #else
-  cudaDataType_t compute_type = CUDA_R_32F;
+  cudaDataType_t compute_type = cublas_data_type;
 #endif
   // int num_requests = bc->num_active_requests();
   int num_tokens = bc->num_active_tokens();
@@ -267,18 +277,17 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       int strideC = num_new_tokens * total_tokens;
 
       // a flag of using this scaling alpha
-      float alpha = 1.0f, beta = 0.0f;
+      DT alpha = 1.0f, beta = 0.0f;
       if (*m->qk_prod_scaling) {
-        alpha = 1.0f / (float)sqrt(m->kProjSize), beta = 0.0f;
+        alpha = static_cast<DT>(1.0f / sqrt(m->kProjSize));
       }
       // To get A, skip over Q entries from previous requests (same head)
-      void const *A = (void const *)(m->devQKVProjArray +
-                                     tokens_previous_requests * m->qProjSize);
+      void const *A = static_cast<DT *>(m->devQKVProjArray) +
+                      tokens_previous_requests * m->qProjSize;
       // To get B, skip over K entries from previous requests (all heads +
       // padding)
-      void const *B =
-          (void const *)(m->keyCache + (i * bc->MAX_BEAM_WIDTH + sub_req_id) *
-                                           kt_req_block_size);
+      void const *B = static_cast<DT *>(m->keyCache) +
+                      (i * bc->MAX_BEAM_WIDTH + sub_req_id) * kt_req_block_size;
 
       // if (i == 0 && sub_req_id == 0 &&
       //     bc->beam_slots.at(0).current_depth == 1) {
@@ -286,9 +295,8 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       //   printf("key cache offset %d\n", kt_req_block_size);
       // }
       // To get C, skip over QK^T products from previous requests
-      void *C =
-          (void *)(m->qk_prods + m->num_heads * tokens_prev_requests_squares);
-
+      void *C = static_cast<DT *>(m->qk_prods) +
+                m->num_heads * tokens_prev_requests_squares;
       checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                            CUBLAS_OP_T,
                                            CUBLAS_OP_N,
@@ -322,7 +330,11 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                                                parallelism),
                                            0,
                                            stream>>>(
-            (float *)C, num_new_tokens, total_tokens, m->num_heads, -INFINITY);
+            static_cast<DT *>(C),
+            num_new_tokens,
+            total_tokens,
+            m->num_heads,
+            static_cast<DT>(-INFINITY));
       }
       // Compute Softmax(QK^T/sqrt(d_k))
       cudnnTensorDescriptor_t qk_tensor;
@@ -342,14 +354,14 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       int w_param = num_new_tokens;
       checkCUDNN(cudnnSetTensor4dDescriptor(qk_tensor,
                                             CUDNN_TENSOR_NCHW,
-                                            CUDNN_DATA_FLOAT,
+                                            cudnn_data_type,
                                             n_param,
                                             c_param,
                                             h_param,
                                             w_param));
-      alpha = 1.0f, beta = 0.0f;
-      void *C_softmax = (void *)(m->qk_prods_softmax +
-                                 m->num_heads * tokens_prev_requests_squares);
+      float softmax_alpha = 1.0f, softmax_beta = 0.0f;
+      void *C_softmax = static_cast<DT *>(m->qk_prods_softmax) +
+                        m->num_heads * tokens_prev_requests_squares;
       // The softmax operation below is executed according to the
       // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
       // softmax operation is computed per spatial location (H,W) per image (N)
@@ -357,12 +369,12 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       checkCUDNN(cudnnSoftmaxForward(m->handle.dnn,
                                      CUDNN_SOFTMAX_ACCURATE,
                                      CUDNN_SOFTMAX_MODE_CHANNEL,
-                                     &alpha,
+                                     &softmax_alpha,
                                      qk_tensor,
-                                     (void *)((float *)C),
-                                     &beta,
+                                     C,
+                                     &softmax_beta,
                                      qk_tensor,
-                                     (void *)((float *)C_softmax)));
+                                     C_softmax));
       // Matmul softmax(QK^T/sqrt(d_k)) by V
       alpha = 1.0f, beta = 0.0f;
       m_ = num_new_tokens;
@@ -377,12 +389,12 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       A = (void const *)C_softmax;
       // To get B, skip over V^T entries from previous requests (all heads +
       // padding)
-      B = (void const *)(m->valueCache + (i * bc->MAX_BEAM_WIDTH + sub_req_id) *
-                                             vt_req_block_size);
+      B = static_cast<DT *>(m->valueCache) +
+          (i * bc->MAX_BEAM_WIDTH + sub_req_id) * vt_req_block_size;
       // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
       // requests
-      C = (void *)(m->attn_heads +
-                   tokens_previous_requests * m->num_heads * m->vProjSize);
+      C = static_cast<DT *>(m->attn_heads) +
+          tokens_previous_requests * m->num_heads * m->vProjSize;
 
       checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                            CUBLAS_OP_N,
@@ -452,42 +464,14 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   assert(tokens_previous_requests == num_tokens);
 }
 
-/*static*/
-void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
-    SpecIncMultiHeadSelfAttentionMeta const *m,
-    BeamSearchBatchConfig const *bc,
-    float const *input_ptr,
-    float const *weight_ptr,
-    float *output_ptr,
-    float const *bias_ptr) {
-  cudaStream_t stream;
-  checkCUDA(get_legion_stream(&stream));
-
-  cudaEvent_t t_start, t_end;
-  if (m->profiling) {
-    cudaEventCreate(&t_start);
-    cudaEventCreate(&t_end);
-    cudaEventRecord(t_start, stream);
-  }
-
-  // reload the weight_o
-
-  if (!(*m->has_load_weights)) {
-    int parallelism = m->vProjSize * m->oProjSize * m->num_heads;
-    build_w_out_tensor<<<GET_BLOCKS(parallelism),
-                         min(CUDA_NUM_THREADS, parallelism),
-                         0,
-                         stream>>>(weight_ptr,
-                                   m->W_out_contiguous,
-                                   m->vProjSize,
-                                   m->oProjSize,
-                                   m->num_heads,
-                                   (m->qSize * m->qProjSize +
-                                    m->kSize * m->kProjSize +
-                                    m->vSize * m->vProjSize));
-    *m->has_load_weights = true;
-  }
-
+template <typename DT>
+void inference_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
+                      BeamSearchBatchConfig const *bc,
+                      DT const *input_ptr,
+                      DT const *weight_ptr,
+                      DT *output_ptr,
+                      DT const *bias_ptr,
+                      cudaStream_t stream) {
   // here because we need postion info in infernece 1
   cudaMemcpyAsync(m->token_infos,
                   &(bc->tokensInfo),
@@ -512,14 +496,72 @@ void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
                   cudaMemcpyHostToDevice,
                   stream);
   // phase 1: Implement kernel to compute KQV for input tokens
-  compute_qkv_kernel(
-      m, bc, input_ptr, weight_ptr, m->devQKVProjArray, bias_ptr, stream);
+  compute_qkv_kernel(m,
+                     bc,
+                     input_ptr,
+                     weight_ptr,
+                     static_cast<DT *>(m->devQKVProjArray),
+                     bias_ptr,
+                     stream);
   // phase 2: Update key/val cache
-  update_kv_cache_kernel(m, bc, stream);
+  update_kv_cache_kernel<DT>(m, bc, stream);
 
   // phase 3: Compute attention score
   // 3 kernels for pahse 3: matmul1 - softmax - matmal2
   compute_attention_kernel(m, bc, output_ptr, bias_ptr, stream);
+}
+
+} // namespace SpecIncMultiHeadAttention
+} // namespace Kernels
+
+/*static*/
+void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
+    SpecIncMultiHeadSelfAttentionMeta const *m,
+    BeamSearchBatchConfig const *bc,
+    GenericTensorAccessorR const &input,
+    GenericTensorAccessorR const &weight,
+    GenericTensorAccessorW const &output,
+    GenericTensorAccessorR const &bias) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  bool use_bias = *m->bias;
+
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+
+  assert(input.data_type == weight.data_type);
+  assert(input.data_type == output.data_type);
+  if (use_bias) {
+    assert(input.data_type == bias.data_type);
+  }
+
+  if (input.data_type == DT_HALF) {
+    half const *bias_ptr =
+        use_bias ? bias.get_half_ptr() : static_cast<half const *>(nullptr);
+    Kernels::SpecIncMultiHeadAttention::inference_kernel(m,
+                                                         bc,
+                                                         input.get_half_ptr(),
+                                                         weight.get_half_ptr(),
+                                                         output.get_half_ptr(),
+                                                         bias_ptr,
+                                                         stream);
+  } else if (input.data_type == DT_FLOAT) {
+    float const *bias_ptr =
+        use_bias ? bias.get_float_ptr() : static_cast<float const *>(nullptr);
+    Kernels::SpecIncMultiHeadAttention::inference_kernel(m,
+                                                         bc,
+                                                         input.get_float_ptr(),
+                                                         weight.get_float_ptr(),
+                                                         output.get_float_ptr(),
+                                                         bias_ptr,
+                                                         stream);
+  } else {
+    assert(false && "Unspported data type");
+  }
 
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
@@ -533,12 +575,13 @@ void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
     // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
     // acc_output.rect, "[Attention:forward:output]");
   }
+  // print_tensor<half>(output.get_half_ptr(), 10000, "att output");
 }
 
 SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
     FFHandler handler,
     SpecIncMultiHeadSelfAttention const *attn,
-    float const *weight_ptr,
+    GenericTensorAccessorR const &weight,
     Memory gpu_mem,
     int num_samples,
     int _num_heads)
@@ -558,7 +601,7 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
                                     attn->qk_prod_scaling,
                                     attn->add_bias_kv,
                                     attn->scaling_factor,
-                                    weight_ptr,
+                                    weight,
                                     gpu_mem,
                                     num_samples,
                                     _num_heads) {
@@ -572,7 +615,7 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
                                  BeamSearchBatchConfig::MAX_BEAM_WIDTH;
     size_t requestinfo_size = BeamSearchBatchConfig::MAX_NUM_REQUESTS;
     size_t beam_requestinfo_size = BeamSearchBatchConfig::MAX_NUM_REQUESTS;
-    size_t totalSize =
+    size_t total_size =
         requestinfo_size * sizeof(BatchConfig::PerRequestInfo) +
         beam_tokeninfo_size *
             sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo) +
@@ -582,7 +625,7 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
                                                   // be added here later
 
     Realm::Rect<1, coord_t> bounds(Realm::Point<1, coord_t>(0),
-                                   Realm::Point<1, coord_t>(totalSize - 1));
+                                   Realm::Point<1, coord_t>(total_size - 1));
     std::vector<size_t> field_sizes;
     field_sizes.push_back(sizeof(char));
     Realm::RegionInstance::create_instance(beam_search_reserve_inst,
@@ -592,14 +635,21 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
                                            0,
                                            Realm::ProfilingRequestSet())
         .wait();
+    off_t offset = 0;
     beam_token_infos =
-        (BeamSearchBatchConfig::BeamSearchPerTokenInfo *)
-            beam_search_reserve_inst.pointer_untyped(0, sizeof(char));
+        beam_search_reserve_inst
+            .pointer<BeamSearchBatchConfig::BeamSearchPerTokenInfo>(offset);
+    offset += beam_tokeninfo_size *
+              sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo);
     request_infos =
-        (BatchConfig::PerRequestInfo *)(beam_token_infos + beam_tokeninfo_size);
+        beam_search_reserve_inst.pointer<BatchConfig::PerRequestInfo>(offset);
+    offset += requestinfo_size * sizeof(BatchConfig::PerRequestInfo);
     beam_request_infos =
-        (BeamSearchBatchConfig::BeamSearchPerRequestInfo *)(request_infos +
-                                                            requestinfo_size);
+        beam_search_reserve_inst
+            .pointer<BeamSearchBatchConfig::BeamSearchPerRequestInfo>(offset);
+    offset += beam_requestinfo_size *
+              sizeof(BeamSearchBatchConfig::BeamSearchPerRequestInfo);
+    assert(offset == total_size);
   }
 
   cudaStreamSynchronize(stream);
diff --git a/src/ops/tree_inc_multihead_self_attention.cc b/src/ops/tree_inc_multihead_self_attention.cc
index c5bbcc2cea..0df7e36f32 100644
--- a/src/ops/tree_inc_multihead_self_attention.cc
+++ b/src/ops/tree_inc_multihead_self_attention.cc
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/ops/tree_inc_multihead_self_attention.h"
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/model.h"
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
 #include "flexflow/utils/cuda_helper.h"
@@ -66,22 +67,38 @@ Tensor FFModel::inc_multihead_self_attention_verify(
     bool bias,
     bool add_bias_kv,
     bool add_zero_attn,
+    DataType data_type,
     Initializer *kernel_initializer,
     bool apply_rotary_embedding,
     bool scaling_query,
     float scaling_factor,
     bool qk_prod_scaling,
     char const *name) {
+  if (data_type == DT_NONE) {
+    data_type = input->data_type;
+  }
+  Layer *li = nullptr;
   int weight_num = bias ? 2 : 1;
-  // Currently assume that
-  Layer *li = new Layer(this,
-                        OP_TREE_INC_MULTIHEAD_SELF_ATTENTION,
-                        DT_FLOAT,
-                        name,
-                        1 /*inputs*/,
-                        weight_num /*weights*/,
-                        1 /*outputs*/,
-                        input);
+  if (data_type != input->data_type) {
+    Tensor casted_input = cast(input, data_type, "type cast for IncMHA");
+    li = new Layer(this,
+                   OP_TREE_INC_MULTIHEAD_SELF_ATTENTION,
+                   data_type,
+                   name,
+                   1 /*inputs*/,
+                   weight_num /*weights*/,
+                   1 /*outputs*/,
+                   casted_input);
+  } else {
+    li = new Layer(this,
+                   OP_TREE_INC_MULTIHEAD_SELF_ATTENTION,
+                   data_type,
+                   name,
+                   1 /*inputs*/,
+                   weight_num /*weights*/,
+                   1 /*outputs*/,
+                   input);
+  }
   {
     int numdims = input->num_dims;
     int dims[MAX_TENSOR_DIM];
@@ -90,7 +107,7 @@ Tensor FFModel::inc_multihead_self_attention_verify(
     }
     dims[0] = embed_dim;
     li->outputs[0] = create_tensor_legion_ordering(
-        numdims, dims, DT_FLOAT, li, 0, true /*create_grad*/);
+        numdims, dims, data_type, li, 0, true /*create_grad*/);
   }
   {
     // Compute weight size
@@ -104,7 +121,7 @@ Tensor FFModel::inc_multihead_self_attention_verify(
     int dims[2] = {qParas + kParas + vParas + oParas, num_heads};
     li->weights[0] = create_weight_legion_ordering(2,
                                                    dims,
-                                                   DT_FLOAT,
+                                                   data_type,
                                                    li,
                                                    true /*create_grad*/,
                                                    kernel_initializer,
@@ -115,13 +132,13 @@ Tensor FFModel::inc_multihead_self_attention_verify(
     int dims[1] = {embed_dim * 4};
     li->weights[1] = create_weight_legion_ordering(1,
                                                    dims,
-                                                   DT_FLOAT,
+                                                   data_type,
                                                    li,
                                                    true /*create_grad*/,
                                                    kernel_initializer,
                                                    CHOSEN_SYNC_TYPE);
   }
-  li->data_type = DT_FLOAT;
+  li->data_type = data_type;
   li->add_int_property("embed_dim", embed_dim);
   li->add_int_property("num_heads", num_heads);
   li->add_int_property("kdim", kdim);
@@ -207,7 +224,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     // Initializer* _bias_initializer)
     : Op(model,
          OP_TREE_INC_MULTIHEAD_SELF_ATTENTION,
-         DT_FLOAT,
+         _input->data_type,
          name,
          1 /*inputs*/,
          (_bias ? 2 : 1) /*weights*/,
@@ -259,7 +276,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     ParameterSyncType comm_type = ParameterSyncType::PS;
 #endif
     weights[0] = model.create_parallel_weight<3>(dims,
-                                                 DT_FLOAT,
+                                                 this->data_type,
                                                  NULL /*owner_op*/,
                                                  true /*create_grad*/,
                                                  initializer,
@@ -279,7 +296,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     ParameterSyncType comm_type = ParameterSyncType::PS;
 #endif
     weights[1] = model.create_parallel_weight<2>(dims,
-                                                 DT_FLOAT,
+                                                 this->data_type,
                                                  NULL /*owner_op*/,
                                                  true /*create_grad*/,
                                                  NULL,
@@ -287,7 +304,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
   }
 
   outputs[0] = model.create_parallel_tensor_legion_ordering(
-      _input->num_dims, dims, DT_FLOAT, this);
+      _input->num_dims, dims, this->data_type, this);
   /* for (int i = 0; i < numdim; i++) { */
   /*   register_output_input_parallel_dims(outputs[0], i, inputs[0], i); */
   /* } */
@@ -316,7 +333,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     // Initializer* _bias_initializer)
     : Op(model,
          OP_TREE_INC_MULTIHEAD_SELF_ATTENTION,
-         DT_FLOAT,
+         _input->data_type,
          name,
          1 /*inputs*/,
          (_bias ? 2 : 1) /*weights*/,
@@ -366,7 +383,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     ParameterSyncType comm_type = ParameterSyncType::PS;
 #endif
     weights[0] = model.create_parallel_weight<3>(dims,
-                                                 DT_FLOAT,
+                                                 this->data_type,
                                                  NULL /*owner_op*/,
                                                  true /*create_grad*/,
                                                  initializer,
@@ -384,14 +401,14 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     ParameterSyncType comm_type = ParameterSyncType::PS;
 #endif
     weights[1] = model.create_parallel_weight<2>(dims,
-                                                 DT_FLOAT,
+                                                 this->data_type,
                                                  NULL /*owner_op*/,
                                                  true /*create_grad*/,
                                                  NULL,
                                                  comm_type);
   }
   outputs[0] = model.create_parallel_tensor_legion_ordering(
-      _input->num_dims, dims, DT_FLOAT, this);
+      _input->num_dims, dims, this->data_type, this);
 
   /* for (int i = 0; i < numdim; i++) { */
   /*   register_output_input_parallel_dims(outputs[0], i, inputs[0], i); */
@@ -547,12 +564,27 @@ OpMeta *TreeIncMultiHeadSelfAttention::init_task(
       (TreeIncMultiHeadSelfAttention *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
 
-  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
-      DT_FLOAT, regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
-      DT_FLOAT, regions[1], task->regions[1], FID_DATA, ctx, runtime);
-  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
-      DT_FLOAT, regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR input =
+      helperGetGenericTensorAccessorRO(attn->inputs[0]->data_type,
+                                       regions[0],
+                                       task->regions[0],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorR weight =
+      helperGetGenericTensorAccessorRO(attn->weights[0]->data_type,
+                                       regions[1],
+                                       task->regions[1],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorW output =
+      helperGetGenericTensorAccessorWO(attn->outputs[0]->data_type,
+                                       regions[2],
+                                       task->regions[2],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
 
   int num_samples = input.domain.hi()[2] - input.domain.lo()[2] + 1;
   assert(attn->qoSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
@@ -565,9 +597,10 @@ OpMeta *TreeIncMultiHeadSelfAttention::init_task(
                        .best_affinity_to(task->target_proc)
                        .first();
   TreeIncMultiHeadSelfAttentionMeta *m = new TreeIncMultiHeadSelfAttentionMeta(
-      handle, attn, weight.get_float_ptr(), gpu_mem, num_samples, num_heads);
+      handle, attn, weight, gpu_mem, num_samples, num_heads);
   m->profiling = attn->profiling;
-  assert(weight.domain.get_volume() * sizeof(float) == m->weightSize);
+  assert(weight.domain.get_volume() * data_type_size(weight.data_type) ==
+         m->weightSize);
   return m;
 }
 
@@ -642,7 +675,6 @@ void TreeIncMultiHeadSelfAttention::inference_task(
     Context ctx,
     Runtime *runtime) {
   assert(task->regions.size() == regions.size());
-  float const *bias_ptr = NULL;
 
   TreeVerifyBatchConfig const *bc = (TreeVerifyBatchConfig *)task->args;
   TreeIncMultiHeadSelfAttentionMeta *m =
@@ -655,18 +687,17 @@ void TreeIncMultiHeadSelfAttention::inference_task(
       m->weight_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
   GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
       m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR biases;
   if (*m->bias) {
-    GenericTensorAccessorR biases =
-        helperGetGenericTensorAccessorRO(m->weight_type[1],
-                                         regions[3],
-                                         task->regions[3],
-                                         FID_DATA,
-                                         ctx,
-                                         runtime);
+    biases = helperGetGenericTensorAccessorRO(m->weight_type[1],
+                                              regions[3],
+                                              task->regions[3],
+                                              FID_DATA,
+                                              ctx,
+                                              runtime);
     Domain bias_domain = runtime->get_index_space_domain(
         ctx, task->regions[3].region.get_index_space());
     assert(bias_domain.get_dim() == 2);
-    bias_ptr = biases.get_float_ptr();
   }
 
   Domain input_domain = runtime->get_index_space_domain(
@@ -685,12 +716,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
                       "[Attention:forward:query]"); */
 
   TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
-      m,
-      bc,
-      input.get_float_ptr(),
-      weight.get_float_ptr(),
-      output.get_float_ptr(),
-      bias_ptr);
+      m, bc, input, weight, output, biases);
 #ifdef INFERENCE_TESTS
   printf("Checking TreeIncMultiHeadSelfAttention computations...\n");
 
diff --git a/src/ops/tree_inc_multihead_self_attention.cpp b/src/ops/tree_inc_multihead_self_attention.cpp
index aa5aaf3039..6e63860cd0 100644
--- a/src/ops/tree_inc_multihead_self_attention.cpp
+++ b/src/ops/tree_inc_multihead_self_attention.cpp
@@ -27,10 +27,10 @@ using Legion::Memory;
 void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
     TreeIncMultiHeadSelfAttentionMeta *m,
     TreeVerifyBatchConfig const *bc,
-    float const *input_ptr,
-    float const *weight_ptr,
-    float *output_ptr,
-    float const *bias_ptr) {
+    GenericTensorAccessorR const &input,
+    GenericTensorAccessorR const &weight,
+    GenericTensorAccessorW const &output,
+    GenericTensorAccessorR const &bias) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -60,7 +60,7 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
 TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
     FFHandler handler,
     TreeIncMultiHeadSelfAttention const *attn,
-    float const *weight_ptr,
+    GenericTensorAccessorR const &weight,
     Memory gpu_mem,
     int num_samples,
     int _num_heads)
@@ -80,7 +80,7 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
                                     attn->qk_prod_scaling,
                                     attn->add_bias_kv,
                                     attn->scaling_factor,
-                                    weight_ptr,
+                                    weight,
                                     gpu_mem,
                                     num_samples,
                                     _num_heads),
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index d3fc5c1fb2..b9bfc5b6a3 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -15,6 +15,7 @@
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
 #include "cuComplex.h"
 #endif
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/ops/kernels/inc_multihead_self_attention_kernels.h"
 #include "flexflow/ops/tree_inc_multihead_self_attention.h"
 #include "flexflow/utils/cuda_helper.h"
@@ -27,9 +28,13 @@ using Legion::Memory;
 
 using namespace Kernels::IncMultiHeadAttention;
 
+namespace Kernels {
+namespace TreeIncMultiHeadAttention {
+
+template <typename DT>
 __global__ void commit_tokens_kernel(
-    float const *devQKVProjArray,
-    float *cache_ptr,
+    DT const *devQKVProjArray,
+    DT *cache_ptr,
     TreeVerifyBatchConfig::CommittedTokensInfo const *committedTokenInfos,
     int qProjSize,
     int kProjSize,
@@ -54,7 +59,7 @@ __global__ void commit_tokens_kernel(
         (qProjSize + kProjSize + vProjSize) * num_active_tokens_in_last_batch;
     int current_head_block_size = num_active_tokens_in_last_batch *
                                   (k_cache ? qProjSize : qProjSize + kProjSize);
-    float val =
+    DT val =
         devQKVProjArray[head_idx * qkv_block_size + current_head_block_size +
                         token_idx_in_last_batch * proj_size + data_idx];
     // int const req_id = id_map[token_idx].request_index;
@@ -68,6 +73,7 @@ __global__ void commit_tokens_kernel(
   }
 }
 
+template <typename DT>
 void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
                    TreeVerifyBatchConfig const *bc,
                    cudaStream_t stream) {
@@ -78,8 +84,8 @@ void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
                            min(CUDA_NUM_THREADS, parallelism),
                            0,
                            stream>>>(
-        m->devQKVProjArray,
-        m->keyCache,
+        static_cast<DT *>(m->devQKVProjArray),
+        static_cast<DT *>(m->keyCache),
         m->committed_token_infos,
         m->qProjSize,
         m->kProjSize,
@@ -95,8 +101,8 @@ void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
                            min(CUDA_NUM_THREADS, parallelism),
                            0,
                            stream>>>(
-        m->devQKVProjArray,
-        m->valueCache,
+        static_cast<DT *>(m->devQKVProjArray),
+        static_cast<DT *>(m->valueCache),
         m->committed_token_infos,
         m->qProjSize,
         m->kProjSize,
@@ -109,9 +115,10 @@ void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
   }
 }
 
+template <typename DT>
 __global__ void update_tree_branch_kv_cache(
-    float const *devQKVProjArray,
-    float *cache_ptr,
+    DT const *devQKVProjArray,
+    DT *cache_ptr,
     TreeVerifyBatchConfig::PerTokenInfo const *tokenInfos,
     int qProjSize,
     int kProjSize,
@@ -130,7 +137,7 @@ __global__ void update_tree_branch_kv_cache(
         (i / proj_size) % num_tokens_in_branch; // index in the tree branch
     int head_idx = i / (proj_size * num_tokens_in_branch);
 
-    token_idx += processed_tokens_in_batch; // get index in the whole batch
+    token_idx += processed_tokens_in_batch;     // get index in the whole batch
     int qkv_block_size = (qProjSize + kProjSize + vProjSize) *
                          total_tokens_in_batch; // skip over previous heads
     int current_head_block_size =
@@ -138,7 +145,7 @@ __global__ void update_tree_branch_kv_cache(
         (k_cache ? qProjSize
                  : qProjSize + kProjSize); // skip over Q entries (and K entries
                                            // if we are working on the V cache)
-    float val =
+    DT val =
         devQKVProjArray[head_idx * qkv_block_size + current_head_block_size +
                         token_idx * proj_size + data_idx];
     int const req_id = tokenInfos[token_idx].request_index;
@@ -150,11 +157,12 @@ __global__ void update_tree_branch_kv_cache(
   }
 }
 
-__global__ void tree_fill_entries_above_diagonal(float *matrix,
+template <typename DT>
+__global__ void tree_fill_entries_above_diagonal(DT *matrix,
                                                  size_t new_tokens,
                                                  size_t total_tokens_in_request,
                                                  size_t num_heads,
-                                                 float value) {
+                                                 DT value) {
   CUDA_KERNEL_LOOP(i, new_tokens * total_tokens_in_request * num_heads) {
     // size_t head_idx = i / (new_tokens * total_tokens_in_request);
     size_t src_idx = (i / new_tokens) % total_tokens_in_request;
@@ -166,19 +174,22 @@ __global__ void tree_fill_entries_above_diagonal(float *matrix,
   }
 }
 
+template <typename DT>
 void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                               TreeVerifyBatchConfig const *bc,
-                              float *output_ptr,
-                              float const *bias_ptr,
+                              DT *output_ptr,
+                              DT const *bias_ptr,
                               cudaStream_t stream) {
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
-  cudaDataType_t cublas_data_type = ff_to_cuda_datatype(DT_FLOAT);
+  cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
+  cudnnDataType_t cudnn_data_type = ff_to_cudnn_datatype(m->output_type[0]);
+  assert(data_type_size(m->output_type[0]) == sizeof(DT));
 #if CUDA_VERSION >= 11000
   // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
   cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
 #else
-  cudaDataType_t compute_type = CUDA_R_32F;
+  cudaDataType_t compute_type = cublas_data_type;
 #endif
   // int num_requests = bc->num_active_requests();
   int processed_tokens_in_batch = 0;
@@ -215,8 +226,8 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                                       min(CUDA_NUM_THREADS, parallelism),
                                       0,
                                       stream>>>(
-            m->devQKVProjArray,
-            m->keyCache,
+            static_cast<DT *>(m->devQKVProjArray),
+            static_cast<DT *>(m->keyCache),
             m->token_infos,
             m->qProjSize,
             m->kProjSize,
@@ -233,8 +244,8 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                                       min(CUDA_NUM_THREADS, parallelism),
                                       0,
                                       stream>>>(
-            m->devQKVProjArray,
-            m->valueCache,
+            static_cast<DT *>(m->devQKVProjArray),
+            static_cast<DT *>(m->valueCache),
             m->token_infos,
             m->qProjSize,
             m->kProjSize,
@@ -258,18 +269,18 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       int strideC = num_new_tokens * total_tokens_in_request;
 
       // a flag of using this scaling alpha
-      float alpha = 1.0f, beta = 0.0f;
+      DT alpha = 1.0f, beta = 0.0f;
       if (*m->qk_prod_scaling) {
-        alpha = 1.0f / (float)sqrt(m->kProjSize), beta = 0.0f;
+        alpha = static_cast<DT>(1.0f / sqrt(m->kProjSize));
       }
       // To get A, skip over Q entries from previous requests (same head)
-      void const *A = (void const *)(m->devQKVProjArray +
-                                     processed_tokens_in_batch * m->qProjSize);
+      void const *A = static_cast<DT *>(m->devQKVProjArray) +
+                      processed_tokens_in_batch * m->qProjSize;
       // To get B, skip over K entries from previous requests (all heads +
       // padding)
-      void const *B = (void const *)(m->keyCache + i * kt_req_block_size);
+      void const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
       // To get C, skip over QK^T products from previous requests
-      void *C = (void *)(m->qk_prods);
+      void *C = static_cast<DT *>(m->qk_prods);
 
       checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                            CUBLAS_OP_T,
@@ -305,11 +316,12 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                                            min((size_t)CUDA_NUM_THREADS,
                                                parallelism),
                                            0,
-                                           stream>>>((float *)C,
-                                                     num_new_tokens,
-                                                     total_tokens_in_request,
-                                                     m->num_heads,
-                                                     -INFINITY);
+                                           stream>>>(
+            static_cast<DT *>(C),
+            num_new_tokens,
+            total_tokens_in_request,
+            m->num_heads,
+            static_cast<DT>(-INFINITY));
       }
       // Compute Softmax(QK^T/sqrt(d_k))
       cudnnTensorDescriptor_t qk_tensor;
@@ -329,12 +341,12 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       int w_param = num_new_tokens;
       checkCUDNN(cudnnSetTensor4dDescriptor(qk_tensor,
                                             CUDNN_TENSOR_NCHW,
-                                            CUDNN_DATA_FLOAT,
+                                            cudnn_data_type,
                                             n_param,
                                             c_param,
                                             h_param,
                                             w_param));
-      alpha = 1.0f, beta = 0.0f;
+      float softmax_alpha = 1.0f, softmax_beta = 0.0f;
       void *C_softmax = (void *)(m->qk_prods_softmax);
       // The softmax operation below is executed according to the
       // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
@@ -343,12 +355,12 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       checkCUDNN(cudnnSoftmaxForward(m->handle.dnn,
                                      CUDNN_SOFTMAX_ACCURATE,
                                      CUDNN_SOFTMAX_MODE_CHANNEL,
-                                     &alpha,
+                                     &softmax_alpha,
                                      qk_tensor,
-                                     (void *)((float *)C),
-                                     &beta,
+                                     C,
+                                     &softmax_beta,
                                      qk_tensor,
-                                     (void *)((float *)C_softmax)));
+                                     C_softmax));
       // Matmul softmax(QK^T/sqrt(d_k)) by V
       alpha = 1.0f, beta = 0.0f;
       m_ = num_new_tokens;
@@ -360,14 +372,14 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       strideC = num_new_tokens * m->vProjSize;
       // To get A, skip over softmax(QK^T/sqrt(d_k)) entries from previous
       // requests (all heads)
-      A = (void const *)C_softmax;
+      A = static_cast<DT *>(C_softmax);
       // To get B, skip over V^T entries from previous requests (all heads +
       // padding)
-      B = (void const *)(m->valueCache + i * vt_req_block_size);
+      B = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
       // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
       // requests
-      C = (void *)(m->attn_heads +
-                   processed_tokens_in_batch * m->num_heads * m->vProjSize);
+      C = static_cast<DT *>(m->attn_heads) +
+          processed_tokens_in_batch * m->num_heads * m->vProjSize;
 
       checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                            CUBLAS_OP_N,
@@ -398,9 +410,9 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       k = m->vProjSize * m->num_heads;
       n = num_new_tokens;
       lda = k, ldb = n, ldc = m_;
-      A = (void const *)m->W_out_contiguous;
-      B = (void const *)C;
-      C = (void *)(output_ptr + processed_tokens_in_batch * m->oProjSize);
+      A = m->W_out_contiguous;
+      B = C;
+      C = (output_ptr + processed_tokens_in_batch * m->oProjSize);
 
       checkCUDA(cublasGemmEx(m->handle.blas,
                              CUBLAS_OP_T,
@@ -439,24 +451,14 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
   assert(processed_tokens_in_batch == bc->num_active_tokens());
 }
 
-/*static*/
-void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
-    TreeIncMultiHeadSelfAttentionMeta *m,
-    TreeVerifyBatchConfig const *bc,
-    float const *input_ptr,
-    float const *weight_ptr,
-    float *output_ptr,
-    float const *bias_ptr) {
-  cudaStream_t stream;
-  checkCUDA(get_legion_stream(&stream));
-
-  cudaEvent_t t_start, t_end;
-  if (m->profiling) {
-    cudaEventCreate(&t_start);
-    cudaEventCreate(&t_end);
-    cudaEventRecord(t_start, stream);
-  }
-
+template <typename DT>
+void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
+                      TreeVerifyBatchConfig const *bc,
+                      DT const *input_ptr,
+                      DT const *weight_ptr,
+                      DT *output_ptr,
+                      DT const *bias_ptr,
+                      cudaStream_t stream) {
   // copy committed tokens info to GPU for the commit_tokens kernel
   // Note that m->num_active_tokens stores the number of active
   // tokens in the previous batch, which is needed for committing
@@ -467,28 +469,12 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
                       sizeof(TreeVerifyBatchConfig::CommittedTokensInfo),
                   cudaMemcpyHostToDevice,
                   stream);
-  commit_tokens(m, bc, stream);
+  commit_tokens<DT>(m, bc, stream);
 
   // After commit we update m->num_active_tokens to be the number of active
   // tokens for the current batch
   m->num_active_tokens = bc->num_active_tokens();
 
-  // reload the weight_o
-  if (!(*m->has_load_weights)) {
-    int parallelism = m->vProjSize * m->oProjSize * m->num_heads;
-    build_w_out_tensor<<<GET_BLOCKS(parallelism),
-                         min(CUDA_NUM_THREADS, parallelism),
-                         0,
-                         stream>>>(weight_ptr,
-                                   m->W_out_contiguous,
-                                   m->vProjSize,
-                                   m->oProjSize,
-                                   m->num_heads,
-                                   (m->qSize * m->qProjSize +
-                                    m->kSize * m->kProjSize +
-                                    m->vSize * m->vProjSize));
-    *m->has_load_weights = true;
-  }
   // here because we need postion info in infernece 1
   cudaMemcpyAsync(m->token_infos,
                   &(bc->tokensInfo),
@@ -497,8 +483,13 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
                   cudaMemcpyHostToDevice,
                   stream);
   // phase 1: Implement kernel to compute KQV for input tokens
-  compute_qkv_kernel(
-      m, bc, input_ptr, weight_ptr, m->devQKVProjArray, bias_ptr, stream);
+  compute_qkv_kernel(m,
+                     bc,
+                     input_ptr,
+                     weight_ptr,
+                     static_cast<DT *>(m->devQKVProjArray),
+                     bias_ptr,
+                     stream);
 
   // phase 2: No need to update key/val cache
   // IncMultiHeadSelfAttention::update_kv_cache_kernel(
@@ -507,6 +498,59 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
   // phase 3: Compute attention score
   // 3 kernels for pahse 3: matmul1 - softmax - matmal2
   compute_attention_kernel(m, bc, output_ptr, bias_ptr, stream);
+}
+
+} // namespace TreeIncMultiHeadAttention
+} // namespace Kernels
+
+/*static*/
+void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
+    TreeIncMultiHeadSelfAttentionMeta *m,
+    TreeVerifyBatchConfig const *bc,
+    GenericTensorAccessorR const &input,
+    GenericTensorAccessorR const &weight,
+    GenericTensorAccessorW const &output,
+    GenericTensorAccessorR const &bias) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  bool use_bias = *m->bias;
+
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+
+  assert(input.data_type == weight.data_type);
+  assert(input.data_type == output.data_type);
+  if (use_bias) {
+    assert(input.data_type == bias.data_type);
+  }
+
+  if (input.data_type == DT_HALF) {
+    half const *bias_ptr =
+        use_bias ? bias.get_half_ptr() : static_cast<half const *>(nullptr);
+    Kernels::TreeIncMultiHeadAttention::inference_kernel(m,
+                                                         bc,
+                                                         input.get_half_ptr(),
+                                                         weight.get_half_ptr(),
+                                                         output.get_half_ptr(),
+                                                         bias_ptr,
+                                                         stream);
+  } else if (input.data_type == DT_FLOAT) {
+    float const *bias_ptr =
+        use_bias ? bias.get_float_ptr() : static_cast<float const *>(nullptr);
+    Kernels::TreeIncMultiHeadAttention::inference_kernel(m,
+                                                         bc,
+                                                         input.get_float_ptr(),
+                                                         weight.get_float_ptr(),
+                                                         output.get_float_ptr(),
+                                                         bias_ptr,
+                                                         stream);
+  } else {
+    assert(false && "Unspported data type");
+  }
 
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
@@ -525,7 +569,7 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
 TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
     FFHandler handler,
     TreeIncMultiHeadSelfAttention const *attn,
-    float const *weight_ptr,
+    GenericTensorAccessorR const &weight,
     Memory gpu_mem,
     int num_samples,
     int _num_heads)
@@ -545,7 +589,7 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
                                     attn->qk_prod_scaling,
                                     attn->add_bias_kv,
                                     attn->scaling_factor,
-                                    weight_ptr,
+                                    weight,
                                     gpu_mem,
                                     num_samples,
                                     _num_heads),
@@ -572,8 +616,8 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
                                            Realm::ProfilingRequestSet())
         .wait();
     committed_token_infos =
-        (TreeVerifyBatchConfig::CommittedTokensInfo *)
-            committed_token_reserve_inst.pointer_untyped(0, sizeof(char));
+        committed_token_reserve_inst
+            .pointer<TreeVerifyBatchConfig::CommittedTokensInfo>(0);
   }
 
   cudaStreamSynchronize(stream);
diff --git a/src/runtime/accessor.cc b/src/runtime/accessor.cc
index 809d608402..100262e85a 100644
--- a/src/runtime/accessor.cc
+++ b/src/runtime/accessor.cc
@@ -345,10 +345,12 @@ GenericTensorAccessorW
 }
 
 #define DIMFUNC(DIM)                                                           \
+  template class TensorAccessorR<half, DIM>;                                   \
   template class TensorAccessorR<float, DIM>;                                  \
   template class TensorAccessorR<double, DIM>;                                 \
   template class TensorAccessorR<int32_t, DIM>;                                \
   template class TensorAccessorR<int64_t, DIM>;                                \
+  template class TensorAccessorW<half, DIM>;                                   \
   template class TensorAccessorW<float, DIM>;                                  \
   template class TensorAccessorW<double, DIM>;                                 \
   template class TensorAccessorW<int32_t, DIM>;                                \
diff --git a/src/runtime/cuda_helper.cu b/src/runtime/cuda_helper.cu
index f4c39c6b0b..434ef1d5e1 100644
--- a/src/runtime/cuda_helper.cu
+++ b/src/runtime/cuda_helper.cu
@@ -310,23 +310,23 @@ __host__ bool download_tensor(T const *ptr, T *dst, size_t num_elements) {
   // checkCUDA(cudaDeviceSynchronize());
   return true;
 }
-cudnnStatus_t
-    cudnnSetTensorDescriptorFromDomain4SoftMax(cudnnTensorDescriptor_t tensor,
-                                               Domain domain) {
+cudnnStatus_t cudnnSetTensorDescriptorFromDomain4SoftMax(
+    cudnnTensorDescriptor_t tensor, Domain domain, DataType data_type) {
   int dims[MAX_TENSOR_DIM];
+  cudnnDataType_t cudnn_data_type = ff_to_cudnn_datatype(data_type);
   switch (domain.get_dim()) {
     case 1: {
       Rect<1> rect = domain;
       dims[0] = rect.hi[0] - rect.lo[0] + 1;
       return cudnnSetTensor4dDescriptor(
-          tensor, CUDNN_TENSOR_NCHW, CUDNN_DATA_FLOAT, dims[0], 1, 1, 1);
+          tensor, CUDNN_TENSOR_NCHW, cudnn_data_type, dims[0], 1, 1, 1);
     }
     case 2: {
       Rect<2> rect = domain;
       dims[0] = rect.hi[0] - rect.lo[0] + 1;
       dims[1] = rect.hi[1] - rect.lo[1] + 1;
       return cudnnSetTensor4dDescriptor(
-          tensor, CUDNN_TENSOR_NCHW, CUDNN_DATA_FLOAT, dims[1], dims[0], 1, 1);
+          tensor, CUDNN_TENSOR_NCHW, cudnn_data_type, dims[1], dims[0], 1, 1);
     }
     case 3: {
       Rect<3> rect = domain;
@@ -335,7 +335,7 @@ cudnnStatus_t
       dims[2] = rect.hi[2] - rect.lo[2] + 1;
       return cudnnSetTensor4dDescriptor(tensor,
                                         CUDNN_TENSOR_NCHW,
-                                        CUDNN_DATA_FLOAT,
+                                        cudnn_data_type,
                                         dims[2] * dims[1],
                                         dims[0],
                                         1,
@@ -349,7 +349,7 @@ cudnnStatus_t
       dims[3] = rect.hi[3] - rect.lo[3] + 1;
       return cudnnSetTensor4dDescriptor(tensor,
                                         CUDNN_TENSOR_NCHW,
-                                        CUDNN_DATA_FLOAT,
+                                        cudnn_data_type,
                                         dims[3] * dims[2] * dims[1],
                                         dims[0],
                                         1,
@@ -362,21 +362,23 @@ cudnnStatus_t
 }
 
 cudnnStatus_t cudnnSetTensorDescriptorFromDomain(cudnnTensorDescriptor_t tensor,
-                                                 Domain domain) {
+                                                 Domain domain,
+                                                 DataType data_type) {
   int dims[MAX_TENSOR_DIM];
+  cudnnDataType_t cudnn_data_type = ff_to_cudnn_datatype(data_type);
   switch (domain.get_dim()) {
     case 1: {
       Rect<1> rect = domain;
       dims[0] = rect.hi[0] - rect.lo[0] + 1;
       return cudnnSetTensor4dDescriptor(
-          tensor, CUDNN_TENSOR_NCHW, CUDNN_DATA_FLOAT, dims[0], 1, 1, 1);
+          tensor, CUDNN_TENSOR_NCHW, cudnn_data_type, dims[0], 1, 1, 1);
     }
     case 2: {
       Rect<2> rect = domain;
       dims[0] = rect.hi[0] - rect.lo[0] + 1;
       dims[1] = rect.hi[1] - rect.lo[1] + 1;
       return cudnnSetTensor4dDescriptor(
-          tensor, CUDNN_TENSOR_NCHW, CUDNN_DATA_FLOAT, dims[1], dims[0], 1, 1);
+          tensor, CUDNN_TENSOR_NCHW, cudnn_data_type, dims[1], dims[0], 1, 1);
     }
     case 3: {
       Rect<3> rect = domain;
@@ -385,7 +387,7 @@ cudnnStatus_t cudnnSetTensorDescriptorFromDomain(cudnnTensorDescriptor_t tensor,
       dims[2] = rect.hi[2] - rect.lo[2] + 1;
       return cudnnSetTensor4dDescriptor(tensor,
                                         CUDNN_TENSOR_NCHW,
-                                        CUDNN_DATA_FLOAT,
+                                        cudnn_data_type,
                                         dims[2],
                                         dims[1],
                                         dims[0],
@@ -399,7 +401,7 @@ cudnnStatus_t cudnnSetTensorDescriptorFromDomain(cudnnTensorDescriptor_t tensor,
       dims[3] = rect.hi[3] - rect.lo[3] + 1;
       return cudnnSetTensor4dDescriptor(tensor,
                                         CUDNN_TENSOR_NCHW,
-                                        CUDNN_DATA_FLOAT,
+                                        cudnn_data_type,
                                         dims[3],
                                         dims[2],
                                         dims[1],
@@ -415,7 +417,7 @@ cudnnStatus_t cudnnSetTensorDescriptorFromDomain(cudnnTensorDescriptor_t tensor,
       dims[3] = rect.hi[3] - rect.lo[3] + 1;
       return cudnnSetTensor4dDescriptor(tensor,
                                         CUDNN_TENSOR_NCHW,
-                                        CUDNN_DATA_FLOAT,
+                                        cudnn_data_type,
                                         dims[3],
                                         dims[2],
                                         dims[1],
@@ -429,6 +431,8 @@ cudnnStatus_t cudnnSetTensorDescriptorFromDomain(cudnnTensorDescriptor_t tensor,
 
 cudnnDataType_t ff_to_cudnn_datatype(DataType type) {
   switch (type) {
+    case DT_HALF:
+      return CUDNN_DATA_HALF;
     case DT_FLOAT:
       return CUDNN_DATA_FLOAT;
     case DT_DOUBLE:
@@ -443,6 +447,8 @@ cudnnDataType_t ff_to_cudnn_datatype(DataType type) {
 
 cudaDataType_t ff_to_cuda_datatype(DataType type) {
   switch (type) {
+    case DT_HALF:
+      return CUDA_R_16F;
     case DT_FLOAT:
       return CUDA_R_32F;
     case DT_DOUBLE:
@@ -544,6 +550,8 @@ template __host__ void
     print_tensor<int32_t>(int32_t const *ptr, size_t rect, char const *prefix);
 template __host__ void
     print_tensor<int64_t>(int64_t const *ptr, size_t rect, char const *prefix);
+template __host__ void
+    print_tensor<half>(half const *ptr, size_t rect, char const *prefix);
 
 template __host__ void print_beam_tensor<float>(float const *ptr,
                                                 size_t num_elements,
@@ -566,6 +574,8 @@ template __host__ void
 template __host__ void save_tensor<int64_t>(int64_t const *ptr,
                                             size_t rect,
                                             char const *file_name);
+template __host__ void
+    save_tensor<half>(half const *ptr, size_t rect, char const *file_name);
 
 template __host__ float *download_tensor<float>(float const *ptr,
                                                 size_t num_elements);
diff --git a/src/runtime/ffconst_utils.cc b/src/runtime/ffconst_utils.cc
index 39e797ea42..7f50e4b69f 100644
--- a/src/runtime/ffconst_utils.cc
+++ b/src/runtime/ffconst_utils.cc
@@ -1,4 +1,5 @@
 #include "flexflow/ffconst_utils.h"
+#include "flexflow/accessor.h"
 #include <stdexcept>
 
 namespace FlexFlow {
@@ -192,6 +193,25 @@ std::string get_operator_type_name(OperatorType type) {
   }
 }
 
+size_t data_type_size(DataType type) {
+  switch (type) {
+    case DT_HALF:
+      return sizeof(half);
+    case DT_FLOAT:
+      return sizeof(float);
+    case DT_DOUBLE:
+      return sizeof(double);
+    case DT_INT32:
+      return sizeof(int32_t);
+    case DT_INT64:
+      return sizeof(int64_t);
+    case DT_BOOLEAN:
+      return sizeof(bool);
+    default:
+      assert(false);
+  }
+}
+
 std::ostream &operator<<(std::ostream &s, OperatorType op_type) {
   s << get_operator_type_name(op_type);
 
diff --git a/src/runtime/hip_helper.cpp b/src/runtime/hip_helper.cpp
index d6355def9a..6354c5d737 100644
--- a/src/runtime/hip_helper.cpp
+++ b/src/runtime/hip_helper.cpp
@@ -273,22 +273,23 @@ __host__ bool download_tensor(T const *ptr, T *dst, size_t num_elements) {
   return true;
 }
 
-miopenStatus_t
-    cudnnSetTensorDescriptorFromDomain(miopenTensorDescriptor_t tensor,
-                                       Domain domain) {
+miopenStatus_t cudnnSetTensorDescriptorFromDomain(
+    miopenTensorDescriptor_t tensor, Domain domain, DataType data_type) {
   int dims[MAX_TENSOR_DIM];
+  miopenDataType_t cudnn_data_type = ff_to_cudnn_datatype(data_type);
   switch (domain.get_dim()) {
     case 1: {
       Rect<1> rect = domain;
       dims[0] = rect.hi[0] - rect.lo[0] + 1;
-      return miopenSet4dTensorDescriptor(tensor, miopenFloat, dims[0], 1, 1, 1);
+      return miopenSet4dTensorDescriptor(
+          tensor, cudnn_data_type, dims[0], 1, 1, 1);
     }
     case 2: {
       Rect<2> rect = domain;
       dims[0] = rect.hi[0] - rect.lo[0] + 1;
       dims[1] = rect.hi[1] - rect.lo[1] + 1;
       return miopenSet4dTensorDescriptor(
-          tensor, miopenFloat, dims[1], dims[0], 1, 1);
+          tensor, cudnn_data_type, dims[1], dims[0], 1, 1);
     }
     case 3: {
       Rect<3> rect = domain;
@@ -296,7 +297,7 @@ miopenStatus_t
       dims[1] = rect.hi[1] - rect.lo[1] + 1;
       dims[2] = rect.hi[2] - rect.lo[2] + 1;
       return miopenSet4dTensorDescriptor(
-          tensor, miopenFloat, dims[2], dims[1], dims[0], 1);
+          tensor, cudnn_data_type, dims[2], dims[1], dims[0], 1);
     }
     case 4: {
       Rect<4> rect = domain;
@@ -305,7 +306,7 @@ miopenStatus_t
       dims[2] = rect.hi[2] - rect.lo[2] + 1;
       dims[3] = rect.hi[3] - rect.lo[3] + 1;
       return miopenSet4dTensorDescriptor(
-          tensor, miopenFloat, dims[3], dims[2], dims[1], dims[0]);
+          tensor, cudnn_data_type, dims[3], dims[2], dims[1], dims[0]);
     }
     case 5: {
       Rect<5> rect = domain;
@@ -316,7 +317,7 @@ miopenStatus_t
       dims[2] = rect.hi[2] - rect.lo[2] + 1;
       dims[3] = rect.hi[3] - rect.lo[3] + 1;
       return miopenSet4dTensorDescriptor(
-          tensor, miopenFloat, dims[3], dims[2], dims[1], dims[0]);
+          tensor, cudnn_data_type, dims[3], dims[2], dims[1], dims[0]);
     }
     default:
       assert(false && "Unsupported dim number");
@@ -326,6 +327,8 @@ miopenStatus_t
 
 miopenDataType_t ff_to_cudnn_datatype(DataType type) {
   switch (type) {
+    case DT_HALF:
+      return miopenHalf;
     case DT_FLOAT:
       return miopenFloat;
     case DT_DOUBLE:
diff --git a/src/runtime/parallel_tensor.cc b/src/runtime/parallel_tensor.cc
index 2147ac69b3..0fb98e05ea 100644
--- a/src/runtime/parallel_tensor.cc
+++ b/src/runtime/parallel_tensor.cc
@@ -1,3 +1,4 @@
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/model.h"
 #include "flexflow/ops/attention.h"
 #include "flexflow/ops/concat.h"
@@ -834,6 +835,12 @@ template bool TensorBase::get_tensor<int64_t>(FFModel const *ff,
                                               int64_t *data,
                                               bool get_gradients);
 
+template bool ParallelTensorBase::set_tensor<half>(FFModel const *ff,
+                                                   std::vector<int> const &dims,
+                                                   half const *data);
+template bool ParallelTensorBase::get_tensor<half>(FFModel const *ff,
+                                                   half *data,
+                                                   bool get_gradients);
 template bool ParallelTensorBase::set_tensor<float>(
     FFModel const *ff, std::vector<int> const &dims, float const *data);
 template bool ParallelTensorBase::get_tensor<float>(FFModel const *ff,
diff --git a/src/runtime/simulator.cc b/src/runtime/simulator.cc
index c363cdd296..d943376416 100644
--- a/src/runtime/simulator.cc
+++ b/src/runtime/simulator.cc
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/simulator.h"
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/model.h"
 #include "flexflow/parallel_ops/combine.h"
 #include "flexflow/parallel_ops/partition.h"
@@ -349,25 +350,6 @@ void Simulator::free_all() {
   offset = 0;
 }
 
-size_t data_type_size(DataType type) {
-  switch (type) {
-    case DT_HALF:
-      return sizeof(half);
-    case DT_FLOAT:
-      return sizeof(float);
-    case DT_DOUBLE:
-      return sizeof(double);
-    case DT_INT32:
-      return sizeof(int32_t);
-    case DT_INT64:
-      return sizeof(int64_t);
-    case DT_BOOLEAN:
-      return sizeof(bool);
-    default:
-      assert(false);
-  }
-}
-
 void *Simulator::allocate(size_t num_elements, DataType type) {
   size_t element_size = data_type_size(type);
   void *ret_ptr = base_ptr + offset;
diff --git a/src/runtime/simulator.cpp b/src/runtime/simulator.cpp
index 888b563af8..209d39243f 100644
--- a/src/runtime/simulator.cpp
+++ b/src/runtime/simulator.cpp
@@ -85,10 +85,10 @@ Simulator::Simulator(FFModel const *model,
   hipEventCreate(&start_event);
   hipEventCreate(&end_event);
   conv2d_meta = new Conv2DMeta(handler);
-  linear_meta = new LinearMeta(handler, 4096);
+  // linear_meta = new LinearMeta(handler, 4096);
   pool2d_meta = new Pool2DMeta(handler);
   ele_unary_meta = new ElementUnaryMeta(handler);
-  ele_binary_meta = new ElementBinaryMeta(handler);
+  // ele_binary_meta = new ElementBinaryMeta(handler);
   // embedding_meta = new EmbeddingMeta(handler);
   //  softmax_meta = new SoftmaxMeta(handler);
   batch_matmul_meta = new BatchMatmulMeta(handler);
diff --git a/src/runtime/simulator.cu b/src/runtime/simulator.cu
index 523b8217ef..8b0c60bebf 100644
--- a/src/runtime/simulator.cu
+++ b/src/runtime/simulator.cu
@@ -84,10 +84,10 @@ Simulator::Simulator(FFModel const *model,
   cudaEventCreate(&start_event);
   cudaEventCreate(&end_event);
   conv2d_meta = new Conv2DMeta(handler);
-  linear_meta = new LinearMeta(handler, 4096);
+  // linear_meta = new LinearMeta(handler, 4096);
   pool2d_meta = new Pool2DMeta(handler);
   ele_unary_meta = new ElementUnaryMeta(handler);
-  ele_binary_meta = new ElementBinaryMeta(handler);
+  // ele_binary_meta = new ElementBinaryMeta(handler);
   // embedding_meta = new EmbeddingMeta(handler);
   // softmax_meta = new SoftmaxMeta(handler);
   batch_matmul_meta = new BatchMatmulMeta(handler);
@@ -108,7 +108,6 @@ Simulator::~Simulator(void) {
   delete conv2d_meta;
   delete pool2d_meta;
   delete ele_unary_meta;
-  delete ele_binary_meta;
   delete batch_matmul_meta;
   delete concat_meta;
   delete transpose_meta;
diff --git a/tests/align/align_create_tensor_torch.py b/tests/align/align_create_tensor_torch.py
index 8b835a5276..ca1be143ed 100644
--- a/tests/align/align_create_tensor_torch.py
+++ b/tests/align/align_create_tensor_torch.py
@@ -2,7 +2,6 @@
 import sys
 
 import torch
-
 sys.path.append("./align/")
 from align_utils import gen_tensor, parse_create_tensor_args, create_general_test_tensor_torch, BATCH_SIZE, INPUT_SIZE, SEQ_LENGTH
 
diff --git a/tests/align/align_utils.py b/tests/align/align_utils.py
index 34f07a4928..368893c5eb 100644
--- a/tests/align/align_utils.py
+++ b/tests/align/align_utils.py
@@ -102,7 +102,7 @@ def align_tensors(tensor_alignment_data_iter: Iterable[TensorAlignmentData]):
         ff_tensor = torch.load(ff_filepath).cpu()
         torch_tensor = torch.load(torch_filepath).cpu()
         print(f"Checking {tensor_alignment_data.tensor_name} alignment...")
-        torch.testing.assert_close(ff_tensor, torch_tensor)
+        torch.testing.assert_close(ff_tensor, torch_tensor, rtol=1e-2, atol=1e-4)
 
 
 def parse_create_tensor_args():

From d7dd6bbe0fbe018623bfde715ab50795f77c9dd6 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 1 Jun 2023 04:55:51 +0800
Subject: [PATCH 144/344] [Inference] - Alignment tests (#742)

* save output to file

* add alignment tests

* fix

* change conflicting name, add comments

* fix typo

* formatting

* more comments and clean dead code

* formatting

* fixed issue with length mismatch

* fix ci skip

* update inf test

* add precision selection support in incr decoding
---
 .github/workflows/gpu-ci-skip.yml            |   9 +-
 include/flexflow/batch_config.h              |   6 +-
 include/flexflow/inference.h                 |   9 +-
 inference/.gitignore                         |   3 +-
 inference/incr_decoding/incr_decoding.cc     |  26 ++-
 inference/spec_infer/spec_infer.cc           |  14 +-
 src/ops/tree_inc_multihead_self_attention.cu |   2 +-
 src/runtime/batch_config.cc                  |  24 +--
 src/runtime/beam_search_batch_config.cc      |  68 +++++-
 src/runtime/inference_manager.cc             |  30 ---
 src/runtime/request_manager.cc               | 212 ++++++++++++-------
 src/runtime/tree_verify_batch_config.cc      |  50 +++++
 tests/inference_tests.sh                     |  28 ++-
 13 files changed, 327 insertions(+), 154 deletions(-)

diff --git a/.github/workflows/gpu-ci-skip.yml b/.github/workflows/gpu-ci-skip.yml
index 012302a57f..64907aa10f 100644
--- a/.github/workflows/gpu-ci-skip.yml
+++ b/.github/workflows/gpu-ci-skip.yml
@@ -29,10 +29,17 @@ jobs:
     needs: gpu-ci-concierge
     steps:
       - run: 'echo "No gpu-ci required"'
+  
+  inference-tests:
+    name: Inference Tests
+    runs-on: ubuntu-20.04
+    needs: gpu-ci-concierge
+    steps:
+      - run: 'echo "No gpu-ci required"'
 
   gpu-ci-flexflow:
     name: Single Machine, Multiple GPUs Tests
     runs-on: ubuntu-20.04
-    needs: gpu-ci-concierge
+    needs: inference-tests
     steps:
       - run: 'echo "No gpu-ci required"'
diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 391b514de6..fd0f419db6 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -74,6 +74,7 @@ class TreeVerifyBatchConfig : public BatchConfig {
   TreeVerifyBatchConfig();
   ~TreeVerifyBatchConfig();
   InferenceMode get_mode() const;
+  void print() const;
   // struct PerTokenInfo : BatchConfig::PerTokenInfo {
   //   int tree_branch_idx;
   // };
@@ -86,7 +87,7 @@ class TreeVerifyBatchConfig : public BatchConfig {
   // void compute_tree_branch_indexes();
 
   int num_tokens_to_commit;
-  CommittedTokensInfo commited_tokens[MAX_NUM_TOKENS];
+  CommittedTokensInfo committed_tokens[MAX_NUM_TOKENS];
 };
 
 struct InferenceResult {
@@ -104,6 +105,8 @@ class BeamSearchBatchConfig : public BatchConfig {
 
   void print() const;
   bool done() const;
+  int max_beam_depth_all_requests() const;
+  int current_depth_all_requests() const;
 
   size_t beam_width;
   size_t target_iterations;
@@ -111,7 +114,6 @@ class BeamSearchBatchConfig : public BatchConfig {
   static int const MAX_BEAM_DEPTH = 8;
 
   struct BeamSearchPerRequestInfo {
-    bool request_completed;
     int beam_size;
     int current_depth = -1;
     int max_depth = MAX_BEAM_DEPTH;
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index 318dd7c9a3..8825a79283 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -78,7 +78,9 @@ class RequestManager {
 public:
   using RequestGuid = BatchConfig::RequestGuid;
   using TokenId = BatchConfig::TokenId;
-  RequestManager(Tokenizer *tokenizer, bool verbose = false);
+  RequestManager(Tokenizer *tokenizer,
+                 bool verbose = false,
+                 std::string output_filepath = "");
   RequestManager();
   size_t get_num_processed_requests();
   RequestGuid register_new_request(std::string const &prompt,
@@ -134,6 +136,7 @@ class RequestManager {
 private:
   Tokenizer *tokenizer;
   bool verbose;
+  std::string output_filepath;
   std::queue<Request> pending_request_queue;
   std::unordered_map<RequestGuid, Request> running_request_queue;
   std::mutex request_queue_mutex;
@@ -143,11 +146,11 @@ class RequestManager {
 
   std::unordered_map<RequestGuid,
                      std::vector<std::pair<BatchConfig::TokenId, int>>>
-      dfs_tree_inputs;
+      dfs_tree_inputs_map;
 
   // std::unordered_map<RequestGuid, BeamTree_v2> beam_trees_v2;
   // TODO: cache config info for Verify/Beam exchange: Beam Width, Beam Depth,
-  // Commited Tokens
+  // Committed Tokens
   std::unordered_map<RequestGuid, std::vector<std::pair<int, int>>>
       committed_tokens;
   // Performance profiling
diff --git a/inference/.gitignore b/inference/.gitignore
index 93699cdd9f..05ccb57cd3 100644
--- a/inference/.gitignore
+++ b/inference/.gitignore
@@ -1,3 +1,4 @@
 weights
 tokenizer
-prompt
\ No newline at end of file
+prompt
+output
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index fb6269c568..77dabeb84d 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -29,6 +29,7 @@ struct FilePaths {
   std::string llm_config_file_path;
   std::string prompt_file_path;
   std::string tokenizer_file_path;
+  std::string output_file_path;
 };
 
 enum ModelType { UNKNOWN, LLAMA, OPT };
@@ -36,7 +37,8 @@ enum ModelType { UNKNOWN, LLAMA, OPT };
 void parse_input_args(char **argv,
                       int argc,
                       FilePaths &paths,
-                      ModelType &llm_model_type) {
+                      ModelType &llm_model_type,
+                      bool &use_full_precision) {
   for (int i = 1; i < argc; i++) {
     // llm model type
     if (!strcmp(argv[i], "-llm-model")) {
@@ -74,6 +76,15 @@ void parse_input_args(char **argv,
       paths.tokenizer_file_path = std::string(argv[++i]);
       continue;
     }
+    // output file
+    if (!strcmp(argv[i], "-output-file")) {
+      paths.output_file_path = std::string(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--use-full-precision")) {
+      use_full_precision = true;
+      continue;
+    }
   }
 }
 
@@ -84,11 +95,12 @@ void FlexFlow::top_level_task(Task const *task,
   FFConfig ffconfig;
   FilePaths file_paths;
   ModelType model_type;
+  bool use_full_precision = false;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
   char **argv = command_args.argv;
   int argc = command_args.argc;
-  parse_input_args(argv, argc, file_paths, model_type);
+  parse_input_args(argv, argc, file_paths, model_type, use_full_precision);
 
   assert(model_type != ModelType::UNKNOWN &&
          "Invalid LLM model type passed (or no type was passed).");
@@ -118,7 +130,9 @@ void FlexFlow::top_level_task(Task const *task,
   InferenceManager im(ffconfig, BatchConfig::MAX_NUM_TOKENS, 1);
   RequestManager rm((model_type == ModelType::LLAMA)
                         ? (Tokenizer *)sp_tokenizer
-                        : (Tokenizer *)opt_tokenizer);
+                        : (Tokenizer *)opt_tokenizer,
+                    /*verbose*/ false,
+                    file_paths.output_file_path);
   int total_num_requests = 0;
   {
     using json = nlohmann::json;
@@ -143,7 +157,8 @@ void FlexFlow::top_level_task(Task const *task,
                               file_paths.llm_config_file_path,
                               file_paths.llm_weight_file_path,
                               ffconfig.workersPerNode * ffconfig.numNodes,
-                              INC_DECODING_MODE);
+                              INC_DECODING_MODE,
+                              use_full_precision);
   } else {
     assert(model_type == ModelType::OPT);
     OPT::create_opt_model(model,
@@ -151,7 +166,8 @@ void FlexFlow::top_level_task(Task const *task,
                           file_paths.llm_config_file_path,
                           file_paths.llm_weight_file_path,
                           ffconfig.workersPerNode * ffconfig.numNodes,
-                          INC_DECODING_MODE);
+                          INC_DECODING_MODE,
+                          use_full_precision);
   }
 
   BatchConfig bc;
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index f7f7e70543..8df4cf4028 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -31,6 +31,7 @@ struct FilePaths {
   std::vector<std::string> ssm_config_file_paths;
   std::string prompt_file_path;
   std::string tokenizer_file_path;
+  std::string output_file_path;
 };
 
 enum ModelType { UNKNOWN, LLAMA, OPT };
@@ -110,6 +111,11 @@ void parse_input_args(char **argv,
       paths.tokenizer_file_path = std::string(argv[++i]);
       continue;
     }
+    // output file
+    if (!strcmp(argv[i], "-output-file")) {
+      paths.output_file_path = std::string(argv[++i]);
+      continue;
+    }
     if (!strcmp(argv[i], "--use-full-precision")) {
       use_full_precision = true;
       continue;
@@ -177,7 +183,9 @@ void FlexFlow::top_level_task(Task const *task,
   InferenceManager im(ffconfig, BatchConfig::MAX_NUM_TOKENS, 1);
   RequestManager rm((model_types.llm_model_type == ModelType::LLAMA)
                         ? (Tokenizer *)sp_tokenizer
-                        : (Tokenizer *)opt_tokenizer);
+                        : (Tokenizer *)opt_tokenizer,
+                    /*verbose*/ false,
+                    file_paths.output_file_path);
   int total_num_requests = 0;
   {
     using json = nlohmann::json;
@@ -244,12 +252,12 @@ void FlexFlow::top_level_task(Task const *task,
       break;
     }
     while (true) {
-      depth = beam_bc.beamRequestsInfo[0].current_depth;
+      depth = beam_bc.current_depth_all_requests();
       FutureMap fm = im.inference(&beam_model, 0, beam_bc);
       assert(fm.get_future_map_domain().get_volume() == 1);
       Future future = fm.get_future(0);
       BeamInferenceResult beam_ir = future.get_result<BeamInferenceResult>();
-      if (depth - 1 >= BeamSearchBatchConfig::MAX_BEAM_DEPTH) {
+      if (depth - 1 >= beam_bc.max_beam_depth_all_requests()) {
         break;
       } else {
         beam_bc = rm.prepare_next_batch_beam(beam_bc, beam_ir);
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index b9bfc5b6a3..cc2c6e0bfb 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -464,7 +464,7 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
   // tokens in the previous batch, which is needed for committing
   // keys/values to the key-value cache
   cudaMemcpyAsync(m->committed_token_infos,
-                  &(bc->commited_tokens),
+                  &(bc->committed_tokens),
                   bc->MAX_NUM_TOKENS *
                       sizeof(TreeVerifyBatchConfig::CommittedTokensInfo),
                   cudaMemcpyHostToDevice,
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index 4d81616dc3..c0e665b613 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -145,6 +145,8 @@ int BatchConfig::num_active_tokens() const {
 }
 
 void BatchConfig::print() const {
+  std::cout << "@@@@@@@@@@@@@@ Batch Config (mode " << get_mode()
+            << ") @@@@@@@@@@@@@@" << std::endl;
   std::cout << "Max number of requests: " << MAX_NUM_REQUESTS << std::endl;
   std::cout << "Max number of tokens: " << MAX_NUM_TOKENS << std::endl;
   std::cout << "Number of tokens: " << num_tokens << std::endl;
@@ -176,26 +178,8 @@ void BatchConfig::print() const {
               << std::endl;
     std::cout << "    Token id: " << tokensInfo[i].token_id << std::endl;
   }
+  std::cout << "@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@"
+            << std::endl;
 }
 
-#ifdef DEADCODE
-void TreeVerifyBatchConfig::compute_tree_branch_indexes() {
-  // Must be called only after setting num_tokens!
-  auto is_first_token_in_request = [&](int token_index) -> bool {
-    if (token_index == 0) {
-      return true; // First entry in tokensInfo is the first in a request.
-    }
-    return tokensInfo[token_index].request_index !=
-           tokensInfo[token_index - 1].request_index;
-  };
-  for (int i = 0; i < num_tokens; i++) {
-    if (is_first_token_in_request(i)) {
-      tokensInfo[i].tree_branch_idx = 0;
-    } else {
-      tokensInfo[i].tree_branch_idx = tokensInfo[i - 1].tree_branch_idx + 1;
-    }
-  }
-}
-#endif
-
 }; // namespace FlexFlow
diff --git a/src/runtime/beam_search_batch_config.cc b/src/runtime/beam_search_batch_config.cc
index 8d4aeeabb0..c177be0681 100644
--- a/src/runtime/beam_search_batch_config.cc
+++ b/src/runtime/beam_search_batch_config.cc
@@ -50,17 +50,54 @@ bool BeamSearchBatchConfig::done() const {
   return current_iteration == target_iterations;
 }
 
+int BeamSearchBatchConfig::max_beam_depth_all_requests() const {
+  int max_depth_all_requests = 0;
+  for (int i = 0; i < BeamSearchBatchConfig::MAX_NUM_REQUESTS; i++) {
+    if (!request_completed[i] &&
+        beamRequestsInfo[i].max_depth > max_depth_all_requests) {
+      /* printf("\treq %i has max_depth=%i. Increasing max_depth_all_requests "
+             "from %i\n",
+             i,
+             beamRequestsInfo[i].max_depth,
+             max_depth_all_requests); */
+      max_depth_all_requests = beamRequestsInfo[i].max_depth;
+    }
+  }
+  assert(max_depth_all_requests <= BeamSearchBatchConfig::MAX_BEAM_DEPTH);
+  return max_depth_all_requests;
+}
+
+int BeamSearchBatchConfig::current_depth_all_requests() const {
+  int current_depth = 0;
+  for (int i = 0; i < BeamSearchBatchConfig::MAX_NUM_REQUESTS; i++) {
+    if (!request_completed[i] &&
+        beamRequestsInfo[i].current_depth > current_depth) {
+      /* printf("\treq %i has current_depth=%i. Increasing "
+             "current_depth_all_requests from %i\n",
+             i,
+             beamRequestsInfo[i].current_depth,
+             current_depth); */
+      current_depth = beamRequestsInfo[i].current_depth;
+    }
+  }
+  assert(current_depth <= BeamSearchBatchConfig::MAX_BEAM_DEPTH + 1);
+  return current_depth;
+}
+
 void BeamSearchBatchConfig::print() const {
+  std::cout << "@@@@@@@@@@@@@@ BeamSearchBatchConfig (mode " << get_mode()
+            << ") @@@@@@@@@@@@@@" << std::endl;
   std::cout << "Max number of requests: " << MAX_NUM_REQUESTS << std::endl;
   std::cout << "Max number of tokens: " << MAX_NUM_TOKENS << std::endl;
   std::cout << "Number of tokens: " << num_tokens << std::endl;
   std::cout << "Number of requests: " << num_active_requests() << std::endl;
   std::cout << "Beam width: " << beam_width << std::endl;
-  std::cout << "Target Iterations" << target_iterations << std::endl;
-  std::cout << "Current Iterations" << current_iteration << std::endl;
+  std::cout << "Target Iterations: " << target_iterations << std::endl;
+  std::cout << "Current Iterations: " << current_iteration << std::endl;
 
   std::cout << "Per-request info:\n";
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
+    // assert(beamRequestsInfo[i].request_completed == request_completed[i]);
     if (!request_completed[i]) {
       std::cout << "  Request " << i << ":\n";
       std::cout << "    Token start offset: "
@@ -70,8 +107,28 @@ void BeamSearchBatchConfig::print() const {
       std::cout << "    GUID: " << requestsInfo[i].request_guid << std::endl;
       std::cout << "    Max sequence length: "
                 << requestsInfo[i].max_sequence_length << std::endl;
-      std::cout << "    Request completed: " << request_completed[i]
+      std::cout << "    Beam Search Specific: " << std::endl;
+      std::cout << "        beam_size: " << beamRequestsInfo[i].beam_size
                 << std::endl;
+      std::cout << "        current_depth: "
+                << beamRequestsInfo[i].current_depth << std::endl;
+      std::cout << "        max_depth: " << beamRequestsInfo[i].max_depth
+                << std::endl;
+      std::cout << "        tokens: ";
+      for (int j = 0; j < MAX_BEAM_WIDTH; j++) {
+        std::cout << beamRequestsInfo[i].tokens[j] << ", ";
+      }
+      std::cout << std::endl;
+      std::cout << "        probs: ";
+      for (int j = 0; j < MAX_BEAM_WIDTH; j++) {
+        std::cout << beamRequestsInfo[i].probs[j] << ", ";
+      }
+      std::cout << std::endl;
+      std::cout << "        parent_id: ";
+      for (int j = 0; j < MAX_BEAM_WIDTH; j++) {
+        std::cout << beamRequestsInfo[i].parent_id[j] << ", ";
+      }
+      std::cout << std::endl;
     }
   }
 
@@ -83,10 +140,15 @@ void BeamSearchBatchConfig::print() const {
     std::cout << "    Request index: " << tokensInfo[i].request_index
               << std::endl;
     std::cout << "    Token id: " << tokensInfo[i].token_id << std::endl;
+    std::cout << "    Beam Search Specific: " << std::endl;
+    std::cout << "        beam_size: " << beamTokenInfo[i].sub_request_index
+              << std::endl;
     // std::cout << "    Parent token id: " << tokensInfo[i].parent_token_id <<
     // std::endl; std::cout << "    Accumulated log prob: "
     //           << tokensInfo[i].cum_log_prob << std::endl;
   }
+  std::cout << "@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@"
+            << std::endl;
 }
 
 }; // namespace FlexFlow
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index fd35b9aa76..5a5c57bfea 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -118,36 +118,6 @@ void InferenceManager::compile_model_and_allocate_buffer(
       tensor_buffer[pt_base] = list;
     }
   }
-#ifdef DEADCODE
-  // Set machine_view for batch_tensors in the tensor_buffer
-  for (int batch_index = 0; batch_index < max_num_inflight_batches;
-       batch_index++) {
-    int expert_device_index = 0;
-    int device_index = batch_index % num_devices;
-    for (size_t o = 0; o < model->operators.size(); o++) {
-      Op *op = model->operators[o];
-      if (op->op_type == OP_WEIGHT) {
-        continue;
-      }
-      MachineView *view;
-      if (op->op_type == OP_EXPERTS) {
-        view = get_machine_view(expert_device_index);
-        // view = &machine_views[expert_device_index];
-        expert_device_index = (expert_device_index + 1) % num_devices;
-      } else {
-        // pick mv w startdeviceid = device_index
-        // view = &machine_views[device_index];
-        view = get_machine_view(device_index);
-      }
-      for (int i = 0; i < op->numOutputs; i++) {
-        tensor_buffer[op->outputs[i]][batch_index]->machine_view = *view;
-        Domain part_domain =
-            runtime->get_index_space_domain(ctx, op->outputs[i]->parallel_is);
-        assert(view->get_domain() == part_domain);
-      }
-    }
-  }
-#endif
 }
 
 void InferenceManager::init_operators_inference(FFModel *model) {
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 5349ec5439..cf0aeb94de 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -29,9 +29,11 @@ RequestManager::RequestManager()
     : tokenizer(nullptr), verbose(false), next_available_guid(1000000),
       num_processed_requests(0) {}
 
-RequestManager::RequestManager(Tokenizer *_tokenizer, bool _verbose)
+RequestManager::RequestManager(Tokenizer *_tokenizer,
+                               bool _verbose,
+                               std::string _output_filepath)
     : tokenizer(_tokenizer), verbose(_verbose), next_available_guid(1000000),
-      num_processed_requests(0) {}
+      num_processed_requests(0), output_filepath(_output_filepath) {}
 
 RequestManager::RequestGuid
     RequestManager::register_new_request(std::vector<TokenId> const &prompt,
@@ -88,7 +90,7 @@ size_t RequestManager::get_num_processed_requests() {
 BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
                                                InferenceResult const &result) {
   const std::lock_guard<std::mutex> lock(request_queue_mutex);
-  // Step 1: use result to update requests
+  // Step 1: append result from previous iteration to request's tokens
   for (int i = 0; i < old_bc.num_tokens; i++) {
     size_t guid =
         old_bc.requestsInfo[old_bc.tokensInfo[i].request_index].request_guid;
@@ -106,7 +108,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
       log_req_mgr.print("Output: %s", output.c_str());
     }
   }
-  // Step 2: preparing the next batch for existing requests
+  // Step 2: prepare the next batch for existing requests
   BatchConfig new_bc;
   for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
     if (old_bc.request_completed[i]) {
@@ -140,6 +142,26 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
                         profile_info.finish_time,
                         profile_info.finish_time - profile_info.start_time,
                         total_request_run_time);
+      // Write output to file if needed:
+      if (!output_filepath.empty()) {
+        std::ofstream outputFile(output_filepath);
+        if (outputFile.is_open()) {
+          for (int i = 0; i < request.tokens.size(); i++) {
+            outputFile << request.tokens[i];
+            if (i < request.tokens.size() - 1) {
+              outputFile << ",";
+            }
+          }
+          outputFile << std::endl;
+          outputFile << output;
+          outputFile.close();
+        } else {
+          std::cout << "Unable to open the output file: " << output_filepath
+                    << std::endl;
+          assert(false);
+        }
+      }
+
       // std::cout << "print results: " << std::endl;
       // for (int i = 0; i < request.tokens.size(); i++) {
       //   std::cout << request.tokens.at(i) << ", ";
@@ -219,7 +241,9 @@ BeamSearchBatchConfig
     RequestManager::prepare_next_batch_beam(BeamSearchBatchConfig const &old_bc,
                                             BeamInferenceResult const &result) {
   const std::lock_guard<std::mutex> lock(request_queue_mutex);
-
+  if (verbose) {
+    std::cout << "\n############### prepare_next_batch_beam ###############\n";
+  }
   if (verbose) {
     std::cout << "print all results"
               << "\n";
@@ -279,6 +303,8 @@ BeamSearchBatchConfig
           old_bc.beamRequestsInfo[i].current_depth + 1;
       new_bc.beamRequestsInfo[i].beam_size =
           old_bc.beamRequestsInfo[i].beam_size;
+      new_bc.beamRequestsInfo[i].max_depth =
+          old_bc.beamRequestsInfo[i].max_depth;
 
       // do the slot exchange to minimize the cache exchange in kernel.
       // std::cout << "update metadata" << std::endl;
@@ -313,6 +339,12 @@ BeamSearchBatchConfig
       }
     }
   }
+  if (verbose) {
+    std::cout << "prepare_next_batch_beam OLD vs NEW batchconfigs:"
+              << std::endl;
+    old_bc.print();
+    new_bc.print();
+  }
   return new_bc;
 }
 
@@ -320,7 +352,9 @@ BeamSearchBatchConfig
     RequestManager::prepare_next_batch_init(TreeVerifyBatchConfig const &old_bc,
                                             InferenceResult const &result) {
   const std::lock_guard<std::mutex> lock(request_queue_mutex);
-
+  if (verbose) {
+    std::cout << "\n############### prepare_next_batch_init ###############\n";
+  }
   // Step 1: use result to update requests
   BeamSearchBatchConfig new_bc;
   new_bc.num_tokens = 0;
@@ -345,21 +379,26 @@ BeamSearchBatchConfig
     } else {
       committed_tokens.at(guid).clear();
     }
+    // iterate through all the tokens that belong to request i
     while (result_index < old_bc.num_tokens &&
            old_bc.tokensInfo[result_index].request_index == i) {
+      // new tokens have not been appended yet, so the last appended token is
+      // the root of the beam search token tree
       int root_abs_depth = request.tokens.size() - 1;
       if (old_bc.tokensInfo[result_index].abs_depth_in_request >=
           root_abs_depth) {
+        // append to tree_outputs a pair consisting of (token id, depth)
         tree_outputs.push_back(std::make_pair(
             result.token_ids[result_index],
             old_bc.tokensInfo[result_index].abs_depth_in_request + 1));
-
+        // append (depth, index of the token in result) to committed_tokens
+        // array
         committed_tokens.at(guid).push_back(
             std::make_pair(old_bc.tokensInfo[result_index].abs_depth_in_request,
                            result_index));
 
         if (verbose) {
-          std::cout << "Index with old_bacth: " << result_index << std::endl;
+          std::cout << "Index within old batch: " << result_index << std::endl;
           printf("  Input: [%d] %d ---> [%d] %d \n",
                  old_bc.tokensInfo[result_index].abs_depth_in_request,
                  old_bc.tokensInfo[result_index].token_id,
@@ -379,7 +418,7 @@ BeamSearchBatchConfig
     }
 
     std::vector<std::pair<BatchConfig::TokenId, int>> verified_tokens =
-        traverse_verify_tree(guid, dfs_tree_inputs.at(guid), tree_outputs);
+        traverse_verify_tree(guid, dfs_tree_inputs_map.at(guid), tree_outputs);
     log_req_mgr.print("Number of Verified Tokens = %zu",
                       verified_tokens.size());
     // check if the request is finished
@@ -387,12 +426,16 @@ BeamSearchBatchConfig
         request.max_sequence_length) {
       // Append all verified tokens to the request
       for (int j = 0; j < verified_tokens.size(); j++) {
-        request.tokens.push_back(verified_tokens[j].first);
+        if (verified_tokens[j].second < request.max_sequence_length) {
+          request.tokens.push_back(verified_tokens[j].first);
+        }
       }
 
       log_req_mgr.print("[Done] guid(%zu) with final length(%zu)",
                         request.guid,
                         request.tokens.size());
+      std::string output = tokenizer->Decode(request.tokens);
+      log_req_mgr.print("Final output: %s", output.c_str());
       new_bc.request_completed[i] = true;
       num_processed_requests++;
       ProfileInfo profile_info = profiling_requests[request.guid];
@@ -409,15 +452,35 @@ BeamSearchBatchConfig
                         profile_info.finish_time - profile_info.start_time,
                         total_request_run_time);
 
+      // Write output to file if needed:
+      if (!output_filepath.empty()) {
+        std::ofstream outputFile(output_filepath);
+        if (outputFile.is_open()) {
+          for (int i = 0; i < request.tokens.size(); i++) {
+            outputFile << request.tokens[i];
+            if (i < request.tokens.size() - 1) {
+              outputFile << ",";
+            }
+          }
+          outputFile << std::endl;
+          outputFile << output;
+          outputFile.close();
+        } else {
+          std::cout << "Unable to open the output file: " << output_filepath
+                    << std::endl;
+          assert(false);
+        }
+      }
+
       beam_trees[i] = BeamTree{};
-      dfs_tree_inputs.erase(
+      dfs_tree_inputs_map.erase(
           request.guid); // delete the old input tree from cache
       continue;
     }
 
     new_bc.request_completed[i] = false;
 
-    // Normal Reuqest Info
+    // Normal Request Info
     new_bc.requestsInfo[i].token_start_offset = verified_tokens.front().second;
     new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
     new_bc.requestsInfo[i].max_sequence_length =
@@ -425,12 +488,14 @@ BeamSearchBatchConfig
     new_bc.requestsInfo[i].num_tokens_in_batch = verified_tokens.size();
 
     // TODO: Beam Request Info, missing from VerifyTreeBatchConfig
+    int new_max_depth = new_bc.requestsInfo[i].max_sequence_length -
+                        new_bc.requestsInfo[i].token_start_offset -
+                        verified_tokens.size();
     new_bc.beamRequestsInfo[i].current_depth = 1;
     new_bc.beamRequestsInfo[i].beam_size =
         BeamSearchBatchConfig::MAX_BEAM_WIDTH;
     new_bc.beamRequestsInfo[i].max_depth =
-        BeamSearchBatchConfig::MAX_BEAM_DEPTH;
-    new_bc.beamRequestsInfo[i].request_completed = false;
+        std::min(new_max_depth, BeamSearchBatchConfig::MAX_BEAM_DEPTH);
     for (int j = 0; j < BeamSearchBatchConfig::MAX_BEAM_WIDTH; j++) {
       new_bc.beamRequestsInfo[i].parent_id[j] = 0;
       new_bc.beamRequestsInfo[i].probs[j] = 1;
@@ -513,13 +578,23 @@ BeamSearchBatchConfig
       }
     }
   }
+
+  if (verbose) {
+    std::cout << "prepare_next_batch_init OLD vs NEW batchconfigs below:"
+              << std::endl;
+    old_bc.print();
+    new_bc.print();
+  }
   return new_bc;
 }
 
 TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
     BeamSearchBatchConfig const &old_bc) {
   const std::lock_guard<std::mutex> lock(request_queue_mutex);
-
+  if (verbose) {
+    std::cout
+        << "\n############### prepare_next_batch_verify ###############\n";
+  }
   TreeVerifyBatchConfig new_bc;
   new_bc.num_tokens_to_commit = 0;
   new_bc.num_tokens = 0;
@@ -556,6 +631,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
     profiling_requests[new_bc.requestsInfo[i].request_guid].decoding_steps += 1;
     // TODO: Add prompt token first in first verify iteration
     if (request.tokens.size() == request.initial_len) {
+      // Initialization (prompt) phase
       for (int j = 0; j < request.initial_len; j++) {
         new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
         new_bc.tokensInfo[new_bc.num_tokens].token_id = request.tokens[j];
@@ -565,13 +641,14 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
         new_bc.requestsInfo[i].num_tokens_in_batch++;
       }
       if (new_bc.num_tokens == BatchConfig::MAX_NUM_TOKENS) {
-        assert(false);
+        assert(false &&
+               "Exceeding the space available in the TreeVerify batch");
         break;
       }
 
       new_bc.requestsInfo[i].token_start_offset = 0;
     } else {
-      // Only add the last committed token
+      // Incremental phase: only add the last committed token
       new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
       new_bc.tokensInfo[new_bc.num_tokens].token_id = request.tokens.back();
       new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request =
@@ -581,7 +658,8 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       new_bc.requestsInfo[i].num_tokens_in_batch++;
 
       if (new_bc.num_tokens == BatchConfig::MAX_NUM_TOKENS) {
-        assert(false);
+        assert(false &&
+               "Exceeding the space available in the TreeVerify batch");
         break;
       }
 
@@ -603,9 +681,10 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       if (dfs_tree_inputs.at(0).second ==
           request.initial_len + committed_tokens.at(guid).size() - 1) {
         for (int j = 0; j < request.initial_len; j++) {
-          new_bc.commited_tokens[new_bc.num_tokens_to_commit].token_index = j;
-          new_bc.commited_tokens[new_bc.num_tokens_to_commit].request_index = i;
-          new_bc.commited_tokens[new_bc.num_tokens_to_commit].token_depth = j;
+          new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_index = j;
+          new_bc.committed_tokens[new_bc.num_tokens_to_commit].request_index =
+              i;
+          new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_depth = j;
           if (verbose) {
             std::cout << new_bc.num_tokens_to_commit
                       << "- committed_token.token_depth: " << j
@@ -616,10 +695,10 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       } else {
         // only add the root token
         auto committed_token = committed_tokens.at(guid).at(0);
-        new_bc.commited_tokens[new_bc.num_tokens_to_commit].token_index =
+        new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_index =
             committed_token.second;
-        new_bc.commited_tokens[new_bc.num_tokens_to_commit].request_index = i;
-        new_bc.commited_tokens[new_bc.num_tokens_to_commit].token_depth =
+        new_bc.committed_tokens[new_bc.num_tokens_to_commit].request_index = i;
+        new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_depth =
             committed_token.first;
         if (verbose) {
           std::cout << new_bc.num_tokens_to_commit
@@ -656,21 +735,23 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       if (committed_tokens.find(guid) != committed_tokens.end()) {
         // if (j == 1) {
         //   auto committed_token = committed_tokens.at(guid).at(0);
-        //   new_bc.commited_tokens[new_bc.num_tokens_to_commit].token_index =
+        //   new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_index =
         //   committed_token.second;
-        //   new_bc.commited_tokens[new_bc.num_tokens_to_commit].request_index =
-        //   i; new_bc.commited_tokens[new_bc.num_tokens_to_commit].token_depth
-        //   = committed_token.first; std:: cout << new_bc.num_tokens_to_commit
+        //   new_bc.committed_tokens[new_bc.num_tokens_to_commit].request_index
+        //   = i;
+        //   new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_depth =
+        //   committed_token.first; std:: cout << new_bc.num_tokens_to_commit
         //   << "- committed_token.token_depth: " << committed_token.first <<
         //     ", token_index: " << committed_token.second << std::endl;
         //   new_bc.num_tokens_to_commit++;
         // }
         if (j < committed_tokens.at(guid).size()) {
           auto committed_token = committed_tokens.at(guid).at(j);
-          new_bc.commited_tokens[new_bc.num_tokens_to_commit].token_index =
+          new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_index =
               committed_token.second;
-          new_bc.commited_tokens[new_bc.num_tokens_to_commit].request_index = i;
-          new_bc.commited_tokens[new_bc.num_tokens_to_commit].token_depth =
+          new_bc.committed_tokens[new_bc.num_tokens_to_commit].request_index =
+              i;
+          new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_depth =
               committed_token.first;
           if (verbose) {
             std::cout << new_bc.num_tokens_to_commit
@@ -696,6 +777,13 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
     }
   }
 
+  if (verbose) {
+    std::cout << "prepare_next_batch_verify OLD vs NEW batchconfigs below:"
+              << std::endl;
+    old_bc.print();
+    new_bc.print();
+  }
+
   return new_bc;
 }
 
@@ -765,9 +853,10 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
             result.parent_id[result_index];
 
         if (verbose) {
-          std::cout << "tree value: " << depth << "token: "
+          std::cout << "tree value: " << depth << " token: "
                     << beam_trees[index].treeLayers[depth].tokens[beam_id]
-                    << "result tokens: " << result.token_ids[result_index];
+                    << " result tokens: " << result.token_ids[result_index]
+                    << std::endl;
         }
         result_index += 1;
       }
@@ -863,7 +952,7 @@ void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
     std::cout << "-----------after parent id exchange-----------" << std::endl;
     for (int j = 0; j < beam_size; j++) {
       std::cout << "after request id: " << request_index << "beam id = " << j
-                << "parnt: "
+                << "parent: "
                 << new_bc.beamRequestsInfo[request_index].parent_id[j]
                 << "token: " << new_bc.beamRequestsInfo[request_index].tokens[j]
                 << "probs: " << new_bc.beamRequestsInfo[request_index].probs[j]
@@ -936,47 +1025,6 @@ bool PreOrder(
   return flag;
 }
 
-#ifdef DEADCODE
-TreeVerifyBatchConfig RequestManager::convert_beam_to_tree_batch_config(
-    BeamSearchBatchConfig const &beam_bc) {
-  TreeVerifyBatchConfig tree_bc;
-  for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
-    if (beam_bc.request_completed[i]) {
-      continue;
-    }
-    // We don't modify requests during the conversion
-    tree_bc.request_completed[i] = beam_bc.request_completed[i];
-    BeamTree const &tree = beam_trees[i];
-    // token, index
-    // todo make this one global for different stages
-    std::vector<std::pair<BeamSearchBatchConfig::TokenId, int>> serializedTree;
-    PreOrder(tree,
-             beam_bc.beamRequestsInfo[i].max_depth,
-             0,
-             beam_bc.beamRequestsInfo[i].beam_size,
-             0,
-             serializedTree,
-             verbose);
-    tree_bc.requestsInfo[i].request_guid = beam_bc.requestsInfo[i].request_guid;
-    tree_bc.requestsInfo[i].max_sequence_length =
-        beam_bc.requestsInfo[i].max_sequence_length;
-    tree_bc.requestsInfo[i].token_start_offset = serializedTree[0].second;
-    tree_bc.requestsInfo[i].num_tokens_in_batch = 0;
-
-    for (int k = 0; k < serializedTree.size(); k++) {
-      assert(tree_bc.num_tokens < BatchConfig::MAX_NUM_TOKENS);
-      tree_bc.tokensInfo[tree_bc.num_tokens].request_index = i;
-      tree_bc.tokensInfo[tree_bc.num_tokens].abs_depth_in_request =
-          serializedTree[k].second;
-      tree_bc.tokensInfo[tree_bc.num_tokens].token_id = serializedTree[k].first;
-      tree_bc.num_tokens++;
-      tree_bc.requestsInfo[i].num_tokens_in_batch++;
-    }
-  }
-  return tree_bc;
-}
-#endif
-
 std::vector<std::pair<BatchConfig::TokenId, int>>
     RequestManager::traverse_verify_tree(
         size_t guid,
@@ -994,14 +1042,19 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
                     outputSerializedTree.size());
 
   log_req_mgr.print("========Input============");
+  // inputSerializedTree is the dfs_tree_inputs_map[guid] array og (token id,
+  // depth) pairs
   for (auto const &pair : inputSerializedTree) {
     log_req_mgr.print("(%d, %d)", pair.first, pair.second);
   }
   log_req_mgr.print("========Output============");
+  // outputSerializedTree is an array of (token id, depth + 1) pairs
   for (auto const &pair : outputSerializedTree) {
     log_req_mgr.print("(%d, %d)", pair.first, pair.second);
   }
   log_req_mgr.print("========Committed============");
+  // committed_tokens[guid] is an array of (depth, result_index) pairs for the
+  // given request
   for (auto const &pair : committed_tokens.at(guid)) {
     log_req_mgr.print("(%d, %d)", pair.first, pair.second);
   }
@@ -1092,12 +1145,13 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
   // std::cout << "Done printing serialized tree, "
   //           << old_bc.requestsInfo[request_index].request_guid << "\n";
 
-  if (dfs_tree_inputs.find(old_bc.requestsInfo[request_index].request_guid) !=
-      dfs_tree_inputs.end()) {
-    dfs_tree_inputs[old_bc.requestsInfo[request_index].request_guid] =
+  if (dfs_tree_inputs_map.find(
+          old_bc.requestsInfo[request_index].request_guid) !=
+      dfs_tree_inputs_map.end()) {
+    dfs_tree_inputs_map[old_bc.requestsInfo[request_index].request_guid] =
         serializedTree;
   } else {
-    dfs_tree_inputs.insert(std::make_pair(
+    dfs_tree_inputs_map.insert(std::make_pair(
         old_bc.requestsInfo[request_index].request_guid, serializedTree));
   }
 
diff --git a/src/runtime/tree_verify_batch_config.cc b/src/runtime/tree_verify_batch_config.cc
index 76a8025507..78eff184c4 100644
--- a/src/runtime/tree_verify_batch_config.cc
+++ b/src/runtime/tree_verify_batch_config.cc
@@ -30,4 +30,54 @@ InferenceMode TreeVerifyBatchConfig::get_mode() const {
   return TREE_VERIFY_MODE;
 }
 
+void TreeVerifyBatchConfig::print() const {
+  std::cout << "@@@@@@@@@@@@@@ TreeVerifyBatchConfig (mode " << get_mode()
+            << ") @@@@@@@@@@@@@@" << std::endl;
+  std::cout << "Max number of requests: " << MAX_NUM_REQUESTS << std::endl;
+  std::cout << "Max number of tokens: " << MAX_NUM_TOKENS << std::endl;
+  std::cout << "Number of tokens: " << num_tokens << std::endl;
+  std::cout << "Number of requests: " << num_active_requests() << std::endl;
+  // std::cout << "Cached results: " << cached_results << std::endl;
+
+  std::cout << "Per-request info:\n";
+  for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
+    if (!request_completed[i]) {
+      std::cout << "  Request " << i << ":\n";
+      std::cout << "    Token start offset: "
+                << requestsInfo[i].token_start_offset << std::endl;
+      std::cout << "    Number of tokens in batch: "
+                << requestsInfo[i].num_tokens_in_batch << std::endl;
+      std::cout << "    GUID: " << requestsInfo[i].request_guid << std::endl;
+      std::cout << "    Max sequence length: "
+                << requestsInfo[i].max_sequence_length << std::endl;
+      std::cout << "    Request completed: " << request_completed[i]
+                << std::endl;
+    }
+  }
+
+  std::cout << "Per-token info:\n";
+  for (int i = 0; i < num_tokens; i++) {
+    std::cout << "  Token " << i << ":\n";
+    std::cout << "    Absolute depth in request: "
+              << tokensInfo[i].abs_depth_in_request << std::endl;
+    std::cout << "    Request index: " << tokensInfo[i].request_index
+              << std::endl;
+    std::cout << "    Token id: " << tokensInfo[i].token_id << std::endl;
+  }
+
+  std::cout << "Tokens to commit info:\n";
+  for (int i = 0; i < num_tokens_to_commit; i++) {
+    std::cout << "  Token " << i << ":\n";
+    std::cout << "    token_index: " << committed_tokens[i].token_index
+              << std::endl;
+    std::cout << "    request_index: " << committed_tokens[i].request_index
+              << std::endl;
+    std::cout << "    token_depth: " << committed_tokens[i].token_depth
+              << std::endl;
+  }
+
+  std::cout << "@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@"
+            << std::endl;
+}
+
 }; // namespace FlexFlow
diff --git a/tests/inference_tests.sh b/tests/inference_tests.sh
index fa44446a3d..d82b5e26fc 100755
--- a/tests/inference_tests.sh
+++ b/tests/inference_tests.sh
@@ -31,31 +31,47 @@ copy_embedding_weights
 mkdir -p ../inference/prompt
 echo '["Give three tips for staying healthy."]' > ../inference/prompt/test.json
 
+# Create output folder
+mkdir -p ../inference/output
+
 ###############################################################################################
 ############################ Speculative inference tests ######################################
 ###############################################################################################
 
 # LLAMA
-../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../inference/weights/llama_160M_weights/ -ssm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json
+../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../inference/weights/llama_160M_weights/ -ssm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_llama.txt
 
 # OPT
-../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../inference/weights/opt_125M_weights/ -ssm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json
+../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../inference/weights/opt_125M_weights/ -ssm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_opt.txt
 
 ###############################################################################################
 ############################ Incremental decoding tests #######################################
 ###############################################################################################
 
 # LLAMA (small model)
-../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_160M_weights/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json
+../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_160M_weights/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M.txt
 
 # LLAMA (big model)
-../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json
+../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_7B.txt
 
 # OPT (small model)
-../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_125M_weights/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json
+../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_125M_weights/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M.txt
 
 # OPT (big model)
-../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json
+../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_6B.txt
+
+
+###############################################################################################
+################################## Alignment tests ############################################
+###############################################################################################
+
+diff ../inference/output/incr_decoding_llama_7B.txt ../inference/output/spec_inference_llama.txt
+diff ../inference/output/incr_decoding_opt_6B.txt ../inference/output/spec_inference_opt.txt
+
+
+###############################################################################################
+###################################### Cleanup ################################################
+###############################################################################################
 
 # Clean up after test
 cleanup

From 6c13936d3bb967c3b41ea4b26203cff8d9300f4c Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Wed, 31 May 2023 17:08:51 -0400
Subject: [PATCH 145/344] Update README.md (#744)

* Update README.md

* update readme

* fix
---
 .github/README.md | 17 ++++++++++-------
 1 file changed, 10 insertions(+), 7 deletions(-)

diff --git a/.github/README.md b/.github/README.md
index 3f22993b00..59377e308e 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -54,7 +54,7 @@ class RequestManager {
 For example, you can use the following command line to serve a LLaMA-7B or LLaMA-13B model on 4 GPUs and use two collectively boost-tuned LLaMA-190M models for speculative inference.
 
 ```bash
-./inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight /path/to/llm/weights -llm-config /path/to/llm/config.json -ssm-model llama -ssm-weight /path/to/ssm1/weights -ssm-config /path/to/ssm/config.json -ssm-model llama -smm-weight /path/to/ssm2/weights -ssm-config /path/to/ssm2/config.json -tokenizer /path/to/tokenizer.model -prompt /path/to/prompt.json
+./inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight /path/to/llm/weights -llm-config /path/to/llm/config.json -ssm-model llama -ssm-weight /path/to/ssm1/weights -ssm-config /path/to/ssm/config.json -ssm-model llama -smm-weight /path/to/ssm2/weights -ssm-config /path/to/ssm2/config.json -tokenizer /path/to/tokenizer.model -prompt /path/to/prompt.json --use-full-precision
 ```
 
 ### Tokenizers
@@ -63,15 +63,18 @@ SpecInfer supports two tokenizers:
 * The SentencePiece tokenizer is used to support the LLaMA model family (e.g., LLaMA-6B, LLaMA-13B, and LLaMA-190M in our demo). We used the pretrained sentencepiece tokenizer from LLAMA, which is also available on Hugging Face (model id: `decapoda-research/llama-7b-hf`). If you  are using our LLAMA-160M weights for the demo, however, you should use the tokenizer from the [JackFram/llama-160m](https://huggingface.co/JackFram/llama-160m/resolve/main/tokenizer.model) HuggingFace repo.
 * The GPT2 tokenizer is used to support the Open Pre-trained Transformer model family (e.g., OPT-13B and OPT-125M). To use it, download the [vocab](https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-vocab.json) and [merges](https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-merges.txt) files and pass the folder containing them as a parameter. 
 
+### Mixed-precision support
+SpecInfer now supports single-precision floating points and half-precision floating points. By default we use half-precision. Add `--use-full-precision` to the command line to run the demo with single-precision, please make sure to use the correct weight files in the form below.
+
 ### LLM Weights
 The weight files used in our demo are extracted from HuggingFace, and stored in our AWS S3 bucket.
 
-|  Model   | Model id on Hugging Face  | Storage Location |
-|  :----  | :----  | :----  |
-| LLaMA-7B | decapoda-research/llama-7b-hf | s3://specinfer/weights/llama_7B_weights.tar.gz |
-| LLaMA-190M  | JackFram/llama-160m | s3://specinfer/weights/llama_160M_weights.tar.gz |
-| OPT-6.7B  | facebook/opt-6.7b | s3://specinfer/weights/opt_6B_weights.tar.gz |
-| OPT-125M  | facebook/opt-125m | s3://specinfer/weights/opt_125m_native.tar.gz |
+|  Model   | Model id on Hugging Face  | Storage Location (single precision) | Storage Location (half precision) |
+|  :----  | :----  | :----  | :----  |
+| LLaMA-7B | decapoda-research/llama-7b-hf | s3://specinfer/weights/llama_7B_weights.tar.gz | s3://specinfer/half_weights/llama_7B_weights.tar.gz
+| LLaMA-190M  | JackFram/llama-160m | s3://specinfer/weights/llama_160M_weights.tar.gz | s3://specinfer/half_weights/llama_160M_weights.tar.gz
+| OPT-6.7B  | facebook/opt-6.7b | s3://specinfer/weights/opt_6B_weights.tar.gz | s3://specinfer/half_weights/opt_6B_weights.tar.gz
+| OPT-125M  | facebook/opt-125m | s3://specinfer/weights/opt_125M_weights.tar.gz | s3://specinfer/half_weights/opt_125M_weights.tar.gz
 
 You can use [this script](../inference/utils/download_llama_weights.py) to automatically download and convert the weights of a HuggingFace LLAMA LLM and a LLAMA SSM to the SpecInfer weight format. The script also downloads the LLAMA tokenizer. If you would like to try the OPT model instead, use [this script](../inference/utils/download_opt_weights.py) to download (and convert) the OPT weights and tokenizer.
 

From d8072ab6efe7bae43058c6a3ffeb94499c804124 Mon Sep 17 00:00:00 2001
From: xinhaoc <chengxh_98@163.com>
Date: Thu, 1 Jun 2023 16:09:09 +0000
Subject: [PATCH 146/344] fix

---
 include/flexflow/inference.h       |  1 +
 inference/spec_infer/spec_infer.cc |  4 +++-
 src/runtime/request_manager.cc     | 23 +++++++++++++++++++++--
 3 files changed, 25 insertions(+), 3 deletions(-)

diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index 8825a79283..8ba110583c 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -117,6 +117,7 @@ class RequestManager {
           &inputSerializedTree,
       std::vector<std::pair<BatchConfig::TokenId, int>> const
           &outputSerializedTree);
+  int get_requests_init_length(BeamSearchBatchConfig const &old_bc);      
 
   // TreeVerifyBatchConfig
   //     convert_beam_to_tree_batch_config(BeamSearchBatchConfig const
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 8df4cf4028..3f08bf27fb 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -257,7 +257,9 @@ void FlexFlow::top_level_task(Task const *task,
       assert(fm.get_future_map_domain().get_volume() == 1);
       Future future = fm.get_future(0);
       BeamInferenceResult beam_ir = future.get_result<BeamInferenceResult>();
-      if (depth - 1 >= beam_bc.max_beam_depth_all_requests()) {
+      if (depth - 1 >= beam_bc.max_beam_depth_all_requests() ||
+          depth + 1 + rm.get_requests_init_length(beam_bc) >=
+              BatchConfig::MAX_NUM_TOKENS) {
         break;
       } else {
         beam_bc = rm.prepare_next_batch_beam(beam_bc, beam_ir);
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index cf0aeb94de..c5b874c798 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -236,6 +236,25 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
 
 /* ----- Speculative Inference Specific functions ----- */
 
+int RequestManager::get_requests_init_length(
+    BeamSearchBatchConfig const &old_bc) {
+  int init_length = 0;
+  for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
+    if (old_bc.request_completed[i]) {
+      continue;
+    }
+    Request &request =
+        running_request_queue[old_bc.requestsInfo[i].request_guid];
+    if (old_bc.requestsInfo[i].token_start_offset + 1 >=
+        request.tokens.size()) {
+      init_length = 0;
+    } else if (request.initial_len > init_length) {
+      init_length = request.initial_len;
+    }
+  }
+  return init_length;
+}
+
 // update beam search metadata
 BeamSearchBatchConfig
     RequestManager::prepare_next_batch_beam(BeamSearchBatchConfig const &old_bc,
@@ -247,7 +266,7 @@ BeamSearchBatchConfig
   if (verbose) {
     std::cout << "print all results"
               << "\n";
-    for (int i = 0; i < 40; i++) {
+    for (int i = 0; i < 64; i++) {
       std::cout << result.token_ids[i] << ", ";
     }
     std::cout << "Current Beam Depth: "
@@ -304,7 +323,7 @@ BeamSearchBatchConfig
       new_bc.beamRequestsInfo[i].beam_size =
           old_bc.beamRequestsInfo[i].beam_size;
       new_bc.beamRequestsInfo[i].max_depth =
-          old_bc.beamRequestsInfo[i].max_depth;
+          old_bc.beamRequestsInfo[i].current_depth;
 
       // do the slot exchange to minimize the cache exchange in kernel.
       // std::cout << "update metadata" << std::endl;

From 9f2688d4357ca3d30172729deb6318c321442fb8 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 4 Jun 2023 18:07:46 +0800
Subject: [PATCH 147/344] [Inference] - Add half precision & HuggingFace
 alignment tests + Speed tests (#749)

* add support for downloading mixed precision llama/opt weights

* fix

* update test script to also run half precision tests

* disable workflow for inference PRs

* add verbose option

* linting

* copy opt weights in download weights script

* add alignment tests with huggingface (llama)

* fix, add diff to test script

* fix

* add opt tests

* comment out tests not passing

* add e2e latency to output files

* add speed tests

* shellcheck

* shellcheck

* fix

* fix

* linting

* fix
---
 .github/workflows/gpu-ci-skip.yml            |   1 +
 .github/workflows/gpu-ci.yml                 |   2 +
 inference/incr_decoding/incr_decoding.cc     |  14 ++-
 inference/models/llama.cc                    |   2 +-
 inference/spec_infer/spec_infer.cc           |  14 ++-
 inference/utils/download_llama_weights.py    |  13 ++-
 inference/utils/download_opt_weights.py      |  16 ++-
 src/ops/kernels/rms_norm_kernels.cu          |  10 +-
 src/ops/kernels/softmax.cu                   |   1 -
 src/ops/tree_inc_multihead_self_attention.cu |   2 +-
 src/runtime/request_manager.cc               |   9 ++
 tests/inference/huggingface_inference.py     |  59 +++++++++++
 tests/inference_tests.sh                     | 104 ++++++++++++++++---
 13 files changed, 215 insertions(+), 32 deletions(-)
 create mode 100644 tests/inference/huggingface_inference.py

diff --git a/.github/workflows/gpu-ci-skip.yml b/.github/workflows/gpu-ci-skip.yml
index 64907aa10f..d8e5353e79 100644
--- a/.github/workflows/gpu-ci-skip.yml
+++ b/.github/workflows/gpu-ci-skip.yml
@@ -40,6 +40,7 @@ jobs:
   gpu-ci-flexflow:
     name: Single Machine, Multiple GPUs Tests
     runs-on: ubuntu-20.04
+    if: ${{ github.event_name != 'pull_request' || github.base_ref != 'inference' }}
     needs: inference-tests
     steps:
       - run: 'echo "No gpu-ci required"'
diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index b24e7236a8..00b3138e00 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -181,6 +181,8 @@ jobs:
   gpu-ci-flexflow:
     name: Single Machine, Multiple GPUs Tests
     runs-on: self-hosted
+    #skip this time-consuming test for PRs to the inference branch
+    if: ${{ github.event_name != 'pull_request' || github.base_ref != 'inference' }}
     needs: inference-tests
     container:
       image: ghcr.io/flexflow/flexflow-environment-cuda:latest
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index 77dabeb84d..895eafb601 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -38,7 +38,8 @@ void parse_input_args(char **argv,
                       int argc,
                       FilePaths &paths,
                       ModelType &llm_model_type,
-                      bool &use_full_precision) {
+                      bool &use_full_precision,
+                      bool &verbose) {
   for (int i = 1; i < argc; i++) {
     // llm model type
     if (!strcmp(argv[i], "-llm-model")) {
@@ -85,6 +86,11 @@ void parse_input_args(char **argv,
       use_full_precision = true;
       continue;
     }
+    // verbose logging to stdout
+    if (!strcmp(argv[i], "--verbose")) {
+      verbose = true;
+      continue;
+    }
   }
 }
 
@@ -96,11 +102,13 @@ void FlexFlow::top_level_task(Task const *task,
   FilePaths file_paths;
   ModelType model_type;
   bool use_full_precision = false;
+  bool verbose = false;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
   char **argv = command_args.argv;
   int argc = command_args.argc;
-  parse_input_args(argv, argc, file_paths, model_type, use_full_precision);
+  parse_input_args(
+      argv, argc, file_paths, model_type, use_full_precision, verbose);
 
   assert(model_type != ModelType::UNKNOWN &&
          "Invalid LLM model type passed (or no type was passed).");
@@ -131,7 +139,7 @@ void FlexFlow::top_level_task(Task const *task,
   RequestManager rm((model_type == ModelType::LLAMA)
                         ? (Tokenizer *)sp_tokenizer
                         : (Tokenizer *)opt_tokenizer,
-                    /*verbose*/ false,
+                    /*verbose*/ verbose,
                     file_paths.output_file_path);
   int total_num_requests = 0;
   {
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index 6a5070790c..0344f19b8a 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -215,7 +215,7 @@ void LLAMA::create_llama_model(FFModel &ff,
                             llama_config.dim,
                             llama_config.dim / llama_config.n_heads);
   fileloader.load_weights(&ff, weights_layers);
-  std::cout << "------load wieght finished----------" << std::endl;
+  std::cout << "------load weight finished----------" << std::endl;
 
   // init operators
   im.init_operators_inference(&ff);
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 8df4cf4028..896e4b082e 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -45,7 +45,8 @@ void parse_input_args(char **argv,
                       int argc,
                       FilePaths &paths,
                       ModelTypes &model_types,
-                      bool &use_full_precision) {
+                      bool &use_full_precision,
+                      bool &verbose) {
   for (int i = 1; i < argc; i++) {
     // llm model type
     if (!strcmp(argv[i], "-llm-model")) {
@@ -120,6 +121,11 @@ void parse_input_args(char **argv,
       use_full_precision = true;
       continue;
     }
+    // verbose logging to stdout
+    if (!strcmp(argv[i], "--verbose")) {
+      verbose = true;
+      continue;
+    }
   }
 }
 
@@ -131,11 +137,13 @@ void FlexFlow::top_level_task(Task const *task,
   FilePaths file_paths;
   ModelTypes model_types;
   bool use_full_precision = false;
+  bool verbose = false;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
   char **argv = command_args.argv;
   int argc = command_args.argc;
-  parse_input_args(argv, argc, file_paths, model_types, use_full_precision);
+  parse_input_args(
+      argv, argc, file_paths, model_types, use_full_precision, verbose);
   if (file_paths.ssm_weight_file_paths.size() == 0) {
     assert(false &&
            "SpecInfer needs at least one SSM for speculative inference");
@@ -184,7 +192,7 @@ void FlexFlow::top_level_task(Task const *task,
   RequestManager rm((model_types.llm_model_type == ModelType::LLAMA)
                         ? (Tokenizer *)sp_tokenizer
                         : (Tokenizer *)opt_tokenizer,
-                    /*verbose*/ false,
+                    /*verbose*/ verbose,
                     file_paths.output_file_path);
   int total_num_requests = 0;
   {
diff --git a/inference/utils/download_llama_weights.py b/inference/utils/download_llama_weights.py
index bbf4f349ee..1cd6928080 100644
--- a/inference/utils/download_llama_weights.py
+++ b/inference/utils/download_llama_weights.py
@@ -2,8 +2,17 @@
 
 import os
 import requests
+import argparse
 from transformers import AutoModelForCausalLM
 
+# You can pass the --use-full-precision flag to use the full-precision weight. By default, we use half precision.
+parser = argparse.ArgumentParser()
+parser.add_argument("--use-full-precision", action="store_true", help="Use full precision")
+args = parser.parse_args()
+if not args.use_full_precision:
+    import torch
+    torch.set_default_tensor_type(torch.HalfTensor)
+
 # Change working dir to folder storing this script
 abspath = os.path.abspath(__file__)
 dname = os.path.dirname(abspath)
@@ -33,12 +42,12 @@ def convert_hf_model(model, dst_folder):
 
 # Download and convert big model weights
 model = AutoModelForCausalLM.from_pretrained("decapoda-research/llama-7b-hf")
-dst_folder="../weights/llama_7B_weights"
+dst_folder="../weights/llama_7B_weights" if args.use_full_precision else "../weights/llama_7B_weights_half"
 convert_hf_model(model, dst_folder)
 
 # Download and convert small model weights
 model = AutoModelForCausalLM.from_pretrained("JackFram/llama-160m")
-dst_folder="../weights/llama_160M_weights"
+dst_folder="../weights/llama_160M_weights" if args.use_full_precision else "../weights/llama_160M_weights_half"
 convert_hf_model(model, dst_folder)
 
 # Download tokenizer
diff --git a/inference/utils/download_opt_weights.py b/inference/utils/download_opt_weights.py
index ceade81e65..de42689202 100644
--- a/inference/utils/download_opt_weights.py
+++ b/inference/utils/download_opt_weights.py
@@ -2,8 +2,18 @@
 
 import os
 import requests
+import argparse
+import shutil
 from transformers import AutoModelForCausalLM
 
+# You can pass the --use-full-precision flag to use the full-precision weight. By default, we use half precision.
+parser = argparse.ArgumentParser()
+parser.add_argument("--use-full-precision", action="store_true", help="Use full precision")
+args = parser.parse_args()
+if not args.use_full_precision:
+    import torch
+    torch.set_default_tensor_type(torch.HalfTensor)
+
 # Change working dir to folder storing this script
 abspath = os.path.abspath(__file__)
 dname = os.path.dirname(abspath)
@@ -23,15 +33,17 @@ def convert_hf_model(model, dst_folder):
             .replace("out_proj", "wo")
         )
         params.detach().cpu().numpy().tofile(f"{dst_folder}/{name}")
+    # copy embedding weights
+    shutil.copy(os.path.join(dst_folder, "embed_tokens_weight"), os.path.join(dst_folder, "embed_tokens_weight_lm_head"))
 
 # Download and convert big model weights
 model = AutoModelForCausalLM.from_pretrained("facebook/opt-6.7b")
-dst_folder="../weights/opt_6B_weights"
+dst_folder="../weights/opt_6B_weights" if args.use_full_precision else "../weights/opt_6B_weights_half"
 convert_hf_model(model, dst_folder)
 
 # Download and convert small model weights
 model = AutoModelForCausalLM.from_pretrained("facebook/opt-125m")
-dst_folder="../weights/opt_125M_weights"
+dst_folder="../weights/opt_125M_weights" if args.use_full_precision else "../weights/opt_125M_weights_half"
 convert_hf_model(model, dst_folder)
 
 # Download tokenizer files
diff --git a/src/ops/kernels/rms_norm_kernels.cu b/src/ops/kernels/rms_norm_kernels.cu
index bf5b1021ae..44e6288529 100644
--- a/src/ops/kernels/rms_norm_kernels.cu
+++ b/src/ops/kernels/rms_norm_kernels.cu
@@ -93,10 +93,11 @@ __global__ void
     long long const index = i * N + j;
     sum += (static_cast<float>(X[index]) * static_cast<float>(X[index]));
   }
-  sum = BlockReduceSum<float>(sum, v_shared); // use BlockReduceSum() to sum X_ij^2
+  sum = BlockReduceSum<float>(sum,
+                              v_shared); // use BlockReduceSum() to sum X_ij^2
 
   if (threadIdx.x == 0) {
-    rms[i] = static_cast<T>(rsqrt((sum / static_cast<float>(N)) + eps));    
+    rms[i] = static_cast<T>(rsqrt((sum / static_cast<float>(N)) + eps));
   }
 }
 
@@ -130,10 +131,7 @@ void forward_kernel(RMSNormMeta const *m,
   int parallelism = m->batch_size * m->in_dim;
   RowwiseRootMeanSquareKernel<T>
       <<<m->batch_size, kCUDABlockReduceNumThreads, 0, stream>>>(
-          m->in_dim,
-          m->eps,
-          input_ptr,
-          static_cast<T *>(m->rms_ptr));
+          m->in_dim, m->eps, input_ptr, static_cast<T *>(m->rms_ptr));
   NormKernel<T><<<m->batch_size, kCUDANumThreads, 0, stream>>>(
       m->in_dim,
       input_ptr,
diff --git a/src/ops/kernels/softmax.cu b/src/ops/kernels/softmax.cu
index 80683e7a2d..15130c19a7 100644
--- a/src/ops/kernels/softmax.cu
+++ b/src/ops/kernels/softmax.cu
@@ -63,7 +63,6 @@ void forward_kernel_wrapper(SoftmaxMeta const *m,
     log_measure.debug(
         "%s [Softmax] forward time = %.2fms\n", m->op_name, elapsed);
   }
-
 }
 
 template <typename DT>
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index cc2c6e0bfb..b591e19ed8 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -137,7 +137,7 @@ __global__ void update_tree_branch_kv_cache(
         (i / proj_size) % num_tokens_in_branch; // index in the tree branch
     int head_idx = i / (proj_size * num_tokens_in_branch);
 
-    token_idx += processed_tokens_in_batch;     // get index in the whole batch
+    token_idx += processed_tokens_in_batch; // get index in the whole batch
     int qkv_block_size = (qProjSize + kProjSize + vProjSize) *
                          total_tokens_in_batch; // skip over previous heads
     int current_head_block_size =
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index cf0aeb94de..c850e2173f 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -16,6 +16,7 @@
 #include "flexflow/inference.h"
 #include "flexflow/parallel_ops/parallel_op.h"
 #include "flexflow/tokenizers.h"
+#include <iomanip>
 #include <new>
 #include <stdexcept>
 
@@ -146,6 +147,10 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
       if (!output_filepath.empty()) {
         std::ofstream outputFile(output_filepath);
         if (outputFile.is_open()) {
+          outputFile << "end-to-end latency: " << std::fixed
+                     << std::setprecision(3) << total_request_run_time
+                     << std::endl;
+          outputFile << "token IDs: ";
           for (int i = 0; i < request.tokens.size(); i++) {
             outputFile << request.tokens[i];
             if (i < request.tokens.size() - 1) {
@@ -456,6 +461,10 @@ BeamSearchBatchConfig
       if (!output_filepath.empty()) {
         std::ofstream outputFile(output_filepath);
         if (outputFile.is_open()) {
+          outputFile << "end-to-end latency: " << std::fixed
+                     << std::setprecision(3) << total_request_run_time
+                     << std::endl;
+          outputFile << "token IDs: ";
           for (int i = 0; i < request.tokens.size(); i++) {
             outputFile << request.tokens[i];
             if (i < request.tokens.size() - 1) {
diff --git a/tests/inference/huggingface_inference.py b/tests/inference/huggingface_inference.py
new file mode 100644
index 0000000000..577121a8a8
--- /dev/null
+++ b/tests/inference/huggingface_inference.py
@@ -0,0 +1,59 @@
+import argparse
+import json
+import os
+from transformers import AutoModelForCausalLM
+from transformers import AutoTokenizer
+
+def main():
+    # Change working dir to folder storing this script
+    abspath = os.path.abspath(__file__)
+    dname = os.path.dirname(abspath)
+    os.chdir(dname)
+    
+    # Parse command line arguments
+    parser = argparse.ArgumentParser()
+    parser.add_argument('--model-name', type=str, required=True)
+    parser.add_argument('--tokenizer-model-name', type=str, required=True)
+    parser.add_argument('--max-length', type=int, default=128)
+    parser.add_argument('--prompt-file', type=str, required=True)
+    parser.add_argument('--output-file', type=str, required=True)
+    parser.add_argument("--use-full-precision", action="store_true", help="Use full precision")
+    parser.add_argument("--gpu", action="store_true", help="Run on GPU")
+    args = parser.parse_args()
+    # Check if max-length is greater than 0
+    if args.max_length <= 0:
+        print("Error: max-length must be greater than 0.")
+        return
+    # Check if prompt-file exists
+    if not os.path.isfile(args.prompt_file):
+        print(f"Error: {args.prompt_file} does not exist.")
+        return
+    
+    # Read prompt-file into a list of strings
+    with open(args.prompt_file, 'r') as f:
+        try:
+            prompt_list = json.load(f)
+        except json.JSONDecodeError:
+            print(f"Error: Unable to parse {args.prompt_file} as JSON.")
+            return
+    
+    # Set default tensor type depending on argument indicating the float type to use
+    if not args.use_full_precision:
+        import torch
+        torch.set_default_tensor_type(torch.HalfTensor)
+
+    # Run huggingface model
+    device = "cuda" if args.gpu else "cpu"
+    model = AutoModelForCausalLM.from_pretrained(args.model_name).to(device)
+    tokenizer = AutoTokenizer.from_pretrained(args.tokenizer_model_name)
+    with open(args.output_file, 'w') as f:
+        for i, prompt in enumerate(prompt_list):
+            batch = tokenizer(prompt_list, return_tensors="pt", add_special_tokens=True).to(device)
+            generated = model.generate(batch["input_ids"], max_length=args.max_length)
+            out = tokenizer.decode(generated[0])
+            # Write output to file
+            out_str = out if i == (len(prompt_list) - 1) else out + "\n"
+            f.write(out_str)
+
+if __name__ == '__main__':
+    main()
diff --git a/tests/inference_tests.sh b/tests/inference_tests.sh
index d82b5e26fc..46fa70c688 100755
--- a/tests/inference_tests.sh
+++ b/tests/inference_tests.sh
@@ -3,12 +3,7 @@ set -x
 set -e
 
 cleanup() {
-    rm -rf ../inference/prompt ../inference/weights ../inference/tokenizer
-}
-
-copy_embedding_weights(){
-    cp ../inference/weights/opt_6B_weights/embed_tokens_weight ../inference/weights/opt_6B_weights/embed_tokens_weight_lm_head
-    cp ../inference/weights/opt_125M_weights/embed_tokens_weight ../inference/weights/opt_125M_weights/embed_tokens_weight_lm_head
+    rm -rf ../inference/prompt ../inference/weights ../inference/tokenizer ../inference/output
 }
 
 # Cd into directory holding this script
@@ -20,12 +15,11 @@ cleanup
 # Update the transformers library to support the LLAMA model
 pip3 install --upgrade transformers
 
-# Download the weights
+# Download the weights in both half and full precision
 python3 ../inference/utils/download_llama_weights.py
+python3 ../inference/utils/download_llama_weights.py --use-full-precision
 python3 ../inference/utils/download_opt_weights.py
-
-# because huggingface reuse a weight in embedding and final linear
-copy_embedding_weights
+python3 ../inference/utils/download_opt_weights.py --use-full-precision
 
 # Create test prompt file
 mkdir -p ../inference/prompt
@@ -40,9 +34,13 @@ mkdir -p ../inference/output
 
 # LLAMA
 ../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../inference/weights/llama_160M_weights/ -ssm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_llama.txt
+# LLAMA (half precision)
+../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights_half/ -llm-config ../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../inference/weights/llama_160M_weights_half/ -ssm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_llama_half.txt
 
 # OPT
 ../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../inference/weights/opt_125M_weights/ -ssm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_opt.txt
+# OPT (half precision)
+../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights_half/ -llm-config ../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../inference/weights/opt_125M_weights_half/ -ssm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_opt_half.txt
 
 ###############################################################################################
 ############################ Incremental decoding tests #######################################
@@ -50,24 +48,104 @@ mkdir -p ../inference/output
 
 # LLAMA (small model)
 ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_160M_weights/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M.txt
+# LLAMA (small model, half precision)
+../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_160M_weights_half/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M_half.txt
 
 # LLAMA (big model)
 ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_7B.txt
+# LLAMA (big model, half precision)
+../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights_half/ -llm-config ../inference/models/configs/llama_7B.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_7B_half.txt
 
 # OPT (small model)
 ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_125M_weights/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M.txt
+# OPT (small model, half precision)
+../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_125M_weights_half/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M_half.txt
 
 # OPT (big model)
 ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_6B.txt
+# OPT (big model, half precision)
+../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights_half/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_6B_half.txt
 
 
 ###############################################################################################
-################################## Alignment tests ############################################
+############################### Alignment and Speed tests #####################################
 ###############################################################################################
 
-diff ../inference/output/incr_decoding_llama_7B.txt ../inference/output/spec_inference_llama.txt
-diff ../inference/output/incr_decoding_opt_6B.txt ../inference/output/spec_inference_opt.txt
+############ Alignment between speculative inference and incremental decoding #################
+# Full precision
+diff <(tail -n +2 "../inference/output/incr_decoding_llama_7B.txt") <(tail -n +2 "../inference/output/spec_inference_llama.txt")
+diff <(tail -n +2 "../inference/output/incr_decoding_opt_6B.txt") <(tail -n +2 "../inference/output/spec_inference_opt.txt")
+# Half precision
+#diff <(tail -n +2 "../inference/output/incr_decoding_llama_7B_half.txt") <(tail -n +2 "../inference/output/spec_inference_llama_half.txt")
+#diff <(tail -n +2 "../inference/output/incr_decoding_opt_6B_half.txt" ) <(tail -n +2 "../inference/output/spec_inference_opt_half.txt")
+
+# Speed test: speculative inference should be at very least 1.5x faster than incremental decoding
+function compare_speed_spec_infer_incr_decoding {
+    local incrDec_file="$1"
+    local specInf_file="$2"
+
+    # Read the float numbers from the first line of the files
+    incrDec=$(sed -n '1 s/end-to-end latency: \(.*\)/\1/p' "$incrDec_file")
+    specInf=$(sed -n '1 s/end-to-end latency: \(.*\)/\1/p' "$specInf_file")
+
+    if ! command -v bc &> /dev/null; then
+        echo "bc is not installed. Installing..."
+        sudo apt-get install -y bc
+    fi
+    
+    # Perform the comparison
+    threshold=$(bc <<< "$specInf * 1.5")
+    if (( $(echo "$incrDec >= $threshold" | bc -l) )); then
+        #echo "The latency in $specInf_file is at least 1.5x smaller than the latency from $incrDec_file."
+        :
+    else
+        echo "Error: The latency in $specInf_file is not at least 1.5x smaller than the latency in $incrDec_file!"
+        exit 1
+    fi
+}
+# Full precision
+compare_speed_spec_infer_incr_decoding "../inference/output/incr_decoding_llama_7B.txt" "../inference/output/spec_inference_llama.txt"
+compare_speed_spec_infer_incr_decoding "../inference/output/incr_decoding_opt_6B.txt" "../inference/output/spec_inference_opt.txt"
+# Half precision
+#compare_speed_spec_infer_incr_decoding "../inference/output/incr_decoding_llama_7B_half.txt" "../inference/output/spec_inference_llama_half.txt"
+#compare_speed_spec_infer_incr_decoding "../inference/output/incr_decoding_opt_6B_half.txt" "../inference/output/spec_inference_opt_half.txt"
+
+######################### Alignment tests with HuggingFace ####################################
+pip3 install protobuf==3.20.3
+
+# LLAMA (small model, full precision)
+python3 ./inference/huggingface_inference.py --model-name "JackFram/llama-160m" --tokenizer-model-name "JackFram/llama-160m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M.txt" --gpu
+
+# LLAMA (small model, half precision)
+python3 ./inference/huggingface_inference.py --model-name "JackFram/llama-160m" --tokenizer-model-name "JackFram/llama-160m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M_half.txt" --gpu
+
+# LLAMA (big model, full precision)
+python3 ./inference/huggingface_inference.py --model-name "decapoda-research/llama-7b-hf" --tokenizer-model-name "JackFram/llama-160m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B.txt"
+
+# LLAMA (big model, half precision)
+python3 ./inference/huggingface_inference.py --model-name "decapoda-research/llama-7b-hf" --tokenizer-model-name "JackFram/llama-160m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B_half.txt" --gpu
+
+# OPT (small model, full precision)
+python3 ./inference/huggingface_inference.py --model-name "facebook/opt-125m" --tokenizer-model-name "facebook/opt-125m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_125M.txt" --gpu --max-length 127
+
+# OPT (small model, half precision)
+python3 ./inference/huggingface_inference.py --model-name "facebook/opt-125m" --tokenizer-model-name "facebook/opt-125m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_125M_half.txt" --gpu --max-length 127
+
+# OPT (big model, full precision)
+#python3 ./inference/huggingface_inference.py --model-name "facebook/opt-6.7b" --tokenizer-model-name "facebook/opt-6.7b" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_6B.txt" --max-length 127
+
+# OPT (big model, half precision)
+#python3 ./inference/huggingface_inference.py --model-name "facebook/opt-6.7b" --tokenizer-model-name "facebook/opt-6.7b" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_6B_half.txt" --gpu --max-length 127
+
+diff <(tail -n +2 "../inference/output/huggingface_llama_160M.txt") <(tail -n +4 "../inference/output/incr_decoding_llama_160M.txt")
+diff <(tail -n +2 "../inference/output/huggingface_llama_160M_half.txt") <(tail -n +4 "../inference/output/incr_decoding_llama_160M_half.txt")
+diff <(tail -n +2 "../inference/output/huggingface_llama_7B.txt") <(tail -n +4 "../inference/output/incr_decoding_llama_7B.txt")
+diff <(tail -n +2 "../inference/output/huggingface_llama_7B_half.txt") <(tail -n +4 "../inference/output/incr_decoding_llama_7B_half.txt")
 
+diff <(tail -n +2 "../inference/output/huggingface_opt_125M.txt") <(tail -n +4 "../inference/output/incr_decoding_opt_125M.txt")
+diff <(tail -n +2 "../inference/output/huggingface_opt_125M_half.txt") <(tail -n +4 "../inference/output/incr_decoding_opt_125M_half.txt")
+#diff <(tail -n +2 "../inference/output/huggingface_opt_6B.txt") <(tail -n +4 "../inference/output/incr_decoding_opt_6B.txt")
+#diff <(tail -n +2 "../inference/output/huggingface_opt_6B_half.txt") <(tail -n +4 "../inference/output/incr_decoding_opt_6B_half.txt")
 
 ###############################################################################################
 ###################################### Cleanup ################################################

From 2de625568703b8ffc6ac43c0d0478285004e566b Mon Sep 17 00:00:00 2001
From: zwang86 <46699021+zwang86@users.noreply.github.com>
Date: Thu, 8 Jun 2023 21:23:18 +0800
Subject: [PATCH 148/344] [SpecInfer] Running multiple SSMs with single RM
 (#734)

* Add support for login information with multiple ssms.

* Update prepare_next_batch_verify.

* Add dedup tree merge.

* Format.

* Fix bugs.

* Runs with mutilmodels.

* Fix.

* Format

* Fix.

* Fix increamental decoding.

* fix use_full_precision issue.
---
 include/flexflow/batch_config.h          |   4 +
 include/flexflow/inference.h             |  39 ++--
 inference/incr_decoding/incr_decoding.cc |  33 +--
 inference/spec_infer/spec_infer.cc       | 142 ++++++++-----
 src/runtime/beam_search_batch_config.cc  |  17 ++
 src/runtime/request_manager.cc           | 256 ++++++++++++++++-------
 6 files changed, 334 insertions(+), 157 deletions(-)

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index fd0f419db6..39fcc49c68 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -98,7 +98,9 @@ struct InferenceResult {
 class BeamSearchBatchConfig : public BatchConfig {
 public:
   BeamSearchBatchConfig();
+  BeamSearchBatchConfig(int model_id);
   BeamSearchBatchConfig(size_t beam_width, size_t target_iterations);
+  BeamSearchBatchConfig(BeamSearchBatchConfig const &other, int model_id);
   InferenceMode get_mode() const;
 
   ~BeamSearchBatchConfig();
@@ -113,6 +115,8 @@ class BeamSearchBatchConfig : public BatchConfig {
   static int const MAX_BEAM_WIDTH = 1;
   static int const MAX_BEAM_DEPTH = 8;
 
+  int model_id;
+
   struct BeamSearchPerRequestInfo {
     int beam_size;
     int current_depth = -1;
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index 8825a79283..3753e5e50e 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -53,6 +53,8 @@ struct Request {
   int max_sequence_length;
   int initial_len;
   std::vector<BatchConfig::TokenId> tokens;
+
+  std::vector<struct BeamTree> beam_trees;
 };
 
 // store the result of beam search
@@ -83,6 +85,11 @@ class RequestManager {
                  std::string output_filepath = "");
   RequestManager();
   size_t get_num_processed_requests();
+
+  int register_new_model(FFModel *model);
+
+  FFModel *get_model(int model_id);
+
   RequestGuid register_new_request(std::string const &prompt,
                                    int max_sequence_length);
   RequestGuid register_new_request(std::vector<TokenId> const &prompt,
@@ -95,10 +102,11 @@ class RequestManager {
 
   BeamSearchBatchConfig
       prepare_next_batch_init(TreeVerifyBatchConfig const &old_bc,
-                              InferenceResult const &result);
+                              InferenceResult const &result,
+                              int model_id);
 
-  TreeVerifyBatchConfig
-      prepare_next_batch_verify(BeamSearchBatchConfig const &old_bc);
+  TreeVerifyBatchConfig prepare_next_batch_verify(
+      std::vector<BeamSearchBatchConfig> const &old_batches);
 
   void store_beam_metadata(BeamSearchBatchConfig const &old_bc,
                            BeamInferenceResult const &result);
@@ -111,6 +119,13 @@ class RequestManager {
                          int request_index,
                          int token_start_offset);
 
+  // remove guid after put the cached tree in request
+  std::vector<std::pair<BatchConfig::TokenId, int>> merge_dfs_trees(
+      std::vector<std::vector<std::pair<BatchConfig::TokenId, int>>>
+          input_trees,
+      int root_depth,
+      RequestGuid guid);
+
   std::vector<std::pair<BatchConfig::TokenId, int>> traverse_verify_tree(
       size_t guid,
       std::vector<std::pair<BatchConfig::TokenId, int>> const
@@ -118,10 +133,6 @@ class RequestManager {
       std::vector<std::pair<BatchConfig::TokenId, int>> const
           &outputSerializedTree);
 
-  // TreeVerifyBatchConfig
-  //     convert_beam_to_tree_batch_config(BeamSearchBatchConfig const
-  //     &beam_bc);
-
   static void
       load_tokens_task(Legion::Task const *task,
                        std::vector<Legion::PhysicalRegion> const &regions,
@@ -142,17 +153,17 @@ class RequestManager {
   std::mutex request_queue_mutex;
   RequestGuid next_available_guid;
 
-  struct BeamTree beam_trees[BatchConfig::MAX_NUM_REQUESTS];
-
+  // TODO: Move this two vector to request struct
   std::unordered_map<RequestGuid,
                      std::vector<std::pair<BatchConfig::TokenId, int>>>
-      dfs_tree_inputs_map;
-
-  // std::unordered_map<RequestGuid, BeamTree_v2> beam_trees_v2;
-  // TODO: cache config info for Verify/Beam exchange: Beam Width, Beam Depth,
-  // Committed Tokens
+      dfs_tree_inputs;
   std::unordered_map<RequestGuid, std::vector<std::pair<int, int>>>
       committed_tokens;
+
+  // Multi-model support
+  int num_ssms;
+  std::vector<FFModel *> models;
+
   // Performance profiling
   size_t num_processed_requests;
 
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index 895eafb601..d80ed9520b 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -141,22 +141,6 @@ void FlexFlow::top_level_task(Task const *task,
                         : (Tokenizer *)opt_tokenizer,
                     /*verbose*/ verbose,
                     file_paths.output_file_path);
-  int total_num_requests = 0;
-  {
-    using json = nlohmann::json;
-    std::ifstream file_handle(file_paths.prompt_file_path);
-    assert(file_handle.good() && "Prompt file does not exist.");
-    json prompt_json = json::parse(file_handle,
-                                   /*parser_callback_t */ nullptr,
-                                   /*allow_exceptions */ true,
-                                   /*ignore_comments */ true);
-    for (auto &prompt : prompt_json) {
-      std::string text = prompt.get<std::string>();
-      printf("Prompt[%d]: %s\n", total_num_requests, text.c_str());
-      total_num_requests++;
-      rm.register_new_request(text, 128 /*max_sequence_length*/);
-    }
-  }
 
   FFModel model(ffconfig);
   if (model_type == ModelType::LLAMA) {
@@ -178,6 +162,23 @@ void FlexFlow::top_level_task(Task const *task,
                           use_full_precision);
   }
 
+  int total_num_requests = 0;
+  {
+    using json = nlohmann::json;
+    std::ifstream file_handle(file_paths.prompt_file_path);
+    assert(file_handle.good() && "Prompt file does not exist.");
+    json prompt_json = json::parse(file_handle,
+                                   /*parser_callback_t */ nullptr,
+                                   /*allow_exceptions */ true,
+                                   /*ignore_comments */ true);
+    for (auto &prompt : prompt_json) {
+      std::string text = prompt.get<std::string>();
+      printf("Prompt[%d]: %s\n", total_num_requests, text.c_str());
+      total_num_requests++;
+      rm.register_new_request(text, 128 /*max_sequence_length*/);
+    }
+  }
+
   BatchConfig bc;
   InferenceResult ir;
   while (rm.get_num_processed_requests() < total_num_requests) {
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 896e4b082e..2e38723036 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -144,6 +144,7 @@ void FlexFlow::top_level_task(Task const *task,
   int argc = command_args.argc;
   parse_input_args(
       argv, argc, file_paths, model_types, use_full_precision, verbose);
+
   if (file_paths.ssm_weight_file_paths.size() == 0) {
     assert(false &&
            "SpecInfer needs at least one SSM for speculative inference");
@@ -194,42 +195,9 @@ void FlexFlow::top_level_task(Task const *task,
                         : (Tokenizer *)opt_tokenizer,
                     /*verbose*/ verbose,
                     file_paths.output_file_path);
-  int total_num_requests = 0;
-  {
-    using json = nlohmann::json;
-    std::ifstream file_handle(file_paths.prompt_file_path);
-    assert(file_handle.good() && "Prompt file does not exist.");
-    json prompt_json = json::parse(file_handle,
-                                   /*parser_callback_t */ nullptr,
-                                   /*allow_exceptions */ true,
-                                   /*ignore_comments */ true);
-    for (auto &prompt : prompt_json) {
-      std::string text = prompt.get<std::string>();
-      printf("Prompt[%d]: %s\n", total_num_requests, text.c_str());
-      total_num_requests++;
-      rm.register_new_request(text, 128 /*max_sequence_length*/);
-    }
-  }
 
-  FFModel beam_model(ffconfig);
+  // Create LLM model
   FFModel tree_model(ffconfig);
-  if (model_types.ssm_model_types[0] == ModelType::LLAMA) {
-    LLAMA::create_llama_model(beam_model,
-                              im,
-                              file_paths.ssm_config_file_paths[0],
-                              file_paths.ssm_weight_file_paths[0],
-                              1,
-                              BEAM_SEARCH_MODE,
-                              use_full_precision);
-  } else {
-    OPT::create_opt_model(beam_model,
-                          im,
-                          file_paths.ssm_config_file_paths[0],
-                          file_paths.ssm_weight_file_paths[0],
-                          1,
-                          BEAM_SEARCH_MODE,
-                          use_full_precision);
-  }
   if (model_types.llm_model_type == ModelType::LLAMA) {
     LLAMA::create_llama_model(tree_model,
                               im,
@@ -238,7 +206,7 @@ void FlexFlow::top_level_task(Task const *task,
                               ffconfig.workersPerNode * ffconfig.numNodes,
                               TREE_VERIFY_MODE,
                               use_full_precision);
-  } else {
+  } else if (model_types.llm_model_type == ModelType::OPT) {
     OPT::create_opt_model(tree_model,
                           im,
                           file_paths.llm_config_file_path,
@@ -246,35 +214,113 @@ void FlexFlow::top_level_task(Task const *task,
                           ffconfig.workersPerNode * ffconfig.numNodes,
                           TREE_VERIFY_MODE,
                           use_full_precision);
+  } else {
+    assert(false && "Invalid LLM model type passed (or no type was passed).");
+  }
+
+  // Create SSM models
+  int num_ssms = model_types.ssm_model_types.size();
+  std::vector<int> ssm_model_ids;
+  std::vector<FFModel> ssm_models;
+  for (int ssm_id = 0; ssm_id < num_ssms; ssm_id++) {
+    FFModel beam_model(ffconfig);
+    ssm_models.push_back(beam_model);
+  }
+
+  for (int ssm_id = 0; ssm_id < num_ssms; ssm_id++) {
+    FFModel &beam_model = ssm_models[ssm_id];
+    if (model_types.ssm_model_types[ssm_id] == ModelType::LLAMA) {
+      LLAMA::create_llama_model(beam_model,
+                                im,
+                                file_paths.ssm_config_file_paths[ssm_id],
+                                file_paths.ssm_weight_file_paths[ssm_id],
+                                1,
+                                BEAM_SEARCH_MODE,
+                                use_full_precision);
+    } else if (model_types.ssm_model_types[ssm_id] == ModelType::OPT) {
+      OPT::create_opt_model(beam_model,
+                            im,
+                            file_paths.ssm_config_file_paths[ssm_id],
+                            file_paths.ssm_weight_file_paths[ssm_id],
+                            1,
+                            BEAM_SEARCH_MODE,
+                            use_full_precision);
+    } else {
+      assert(false && "Invalid SSM model type passed.");
+    }
+
+    int beam_model_id = rm.register_new_model(&beam_model);
+    ssm_model_ids.push_back(beam_model_id);
+  }
+
+  // Register requests from prompt file
+  int total_num_requests = 0;
+  {
+    using json = nlohmann::json;
+    std::ifstream file_handle(file_paths.prompt_file_path);
+    assert(file_handle.good() && "Prompt file does not exist.");
+    json prompt_json = json::parse(file_handle,
+                                   /*parser_callback_t */ nullptr,
+                                   /*allow_exceptions */ true,
+                                   /*ignore_comments */ true);
+    for (auto &prompt : prompt_json) {
+      std::string text = prompt.get<std::string>();
+      printf("Prompt[%d]: %s\n", total_num_requests, text.c_str());
+      total_num_requests++;
+      rm.register_new_request(text, 128 /*max_sequence_length*/);
+    }
   }
 
   TreeVerifyBatchConfig tree_bc;
   BeamSearchBatchConfig beam_bc;
+  std::vector<BeamSearchBatchConfig> beam_bc_vec;
+  for (int ssm_id = 0; ssm_id < num_ssms; ssm_id++) {
+    beam_bc_vec.push_back(BeamSearchBatchConfig(ssm_model_ids[ssm_id]));
+  }
+
   InferenceResult tree_ir;
 
   while (rm.get_num_processed_requests() < total_num_requests) {
     int depth = 0;
     // Beam Search
-    beam_bc = rm.prepare_next_batch_init(tree_bc, tree_ir);
+    beam_bc = rm.prepare_next_batch_init(tree_bc, tree_ir, 0);
+    for (int ssm_id = 0; ssm_id < num_ssms; ssm_id++) {
+      beam_bc_vec[ssm_id] = beam_bc;
+      beam_bc_vec[ssm_id].model_id = ssm_id;
+    }
+
     if (rm.get_num_processed_requests() >= total_num_requests) {
       break;
     }
-    while (true) {
-      depth = beam_bc.current_depth_all_requests();
-      FutureMap fm = im.inference(&beam_model, 0, beam_bc);
-      assert(fm.get_future_map_domain().get_volume() == 1);
-      Future future = fm.get_future(0);
-      BeamInferenceResult beam_ir = future.get_result<BeamInferenceResult>();
-      if (depth - 1 >= beam_bc.max_beam_depth_all_requests()) {
-        break;
-      } else {
-        beam_bc = rm.prepare_next_batch_beam(beam_bc, beam_ir);
+
+    for (int i = 0; i < num_ssms; i++) {
+      while (true) {
+        beam_bc = beam_bc_vec[i];
+        depth = beam_bc.beamRequestsInfo[0].current_depth;
+
+        FutureMap fm = im.inference(rm.get_model(0), 0, beam_bc_vec[i]);
+        assert(fm.get_future_map_domain().get_volume() == 1);
+        Future future = fm.get_future(0);
+        BeamInferenceResult beam_ir = future.get_result<BeamInferenceResult>();
+
+        if (depth - 1 >= BeamSearchBatchConfig::MAX_BEAM_DEPTH) {
+          break;
+        } else {
+          beam_bc_vec[i] = rm.prepare_next_batch_beam(beam_bc_vec[i], beam_ir);
+          if (beam_bc_vec[i].num_active_tokens() == 0 &&
+              beam_bc_vec[i].num_active_requests() != 0) {
+            break;
+          }
+        }
       }
+      std::cout << "----------beam search finished for model "
+                << beam_bc_vec[i].model_id << "------------" << std::endl;
     }
     // Token Tree Verification
     {
-      tree_bc = rm.prepare_next_batch_verify(beam_bc);
+      tree_bc = rm.prepare_next_batch_verify(beam_bc_vec);
       FutureMap fm = im.inference(&tree_model, 0, tree_bc);
+
       assert(fm.get_future_map_domain().get_volume() == 1);
       Future future = fm.get_future(0);
       tree_ir = future.get_result<InferenceResult>();
@@ -298,4 +344,4 @@ void FlexFlow::top_level_task(Task const *task,
   }
 }
 
-void FlexFlow::register_custom_tasks() {}
+void FlexFlow::register_custom_tasks() {}
\ No newline at end of file
diff --git a/src/runtime/beam_search_batch_config.cc b/src/runtime/beam_search_batch_config.cc
index c177be0681..dc30d89d78 100644
--- a/src/runtime/beam_search_batch_config.cc
+++ b/src/runtime/beam_search_batch_config.cc
@@ -31,6 +31,14 @@ BeamSearchBatchConfig::BeamSearchBatchConfig() : BatchConfig() {
   current_iteration = 0;
 }
 
+BeamSearchBatchConfig::BeamSearchBatchConfig(int model_id) : BatchConfig() {
+  this->model_id = model_id;
+  std::cout << "==================\n"
+            << "Register Batch Config with Model " << this->model_id
+            << std::endl;
+  current_iteration = 0;
+}
+
 BeamSearchBatchConfig::BeamSearchBatchConfig(size_t beam_width,
                                              size_t target_iterations)
     : BatchConfig() {
@@ -39,6 +47,15 @@ BeamSearchBatchConfig::BeamSearchBatchConfig(size_t beam_width,
   current_iteration = 0;
 }
 
+BeamSearchBatchConfig::BeamSearchBatchConfig(BeamSearchBatchConfig const &other,
+                                             int model_id)
+    : BatchConfig() {
+  this->beam_width = other.beam_width;
+  this->target_iterations = other.target_iterations;
+  this->model_id = model_id;
+  current_iteration = 0;
+}
+
 BeamSearchBatchConfig::~BeamSearchBatchConfig() {}
 
 InferenceMode BeamSearchBatchConfig::get_mode() const {
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index c850e2173f..bceb6e5953 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -36,6 +36,20 @@ RequestManager::RequestManager(Tokenizer *_tokenizer,
     : tokenizer(_tokenizer), verbose(_verbose), next_available_guid(1000000),
       num_processed_requests(0), output_filepath(_output_filepath) {}
 
+int RequestManager::register_new_model(FFModel *model) {
+  int model_id = models.size();
+  models.push_back(model);
+  std::cout << "Register new model with id: " << model_id << std::endl;
+  num_ssms++;
+  assert(models.size() == num_ssms);
+  return model_id;
+}
+
+FFModel *RequestManager::get_model(int model_id) {
+  assert(model_id < models.size());
+  return models[model_id];
+}
+
 RequestManager::RequestGuid
     RequestManager::register_new_request(std::vector<TokenId> const &prompt,
                                          int max_sequence_length) {
@@ -48,6 +62,18 @@ RequestManager::RequestGuid
   request.initial_len = prompt.size();
   request.tokens = prompt;
 
+  if (num_ssms == 0) {
+    std::cout << "No small spective model registered yet, using increamental "
+                 "decoding."
+              << std::endl;
+  } else {
+    std::cout << "Num of models: " << num_ssms << std::endl;
+    for (int i = 0; i < num_ssms; i++) {
+      BeamTree beam_tree = BeamTree{};
+      request.beam_trees.push_back(beam_tree);
+    }
+  }
+
   pending_request_queue.push(request);
 
   if (verbose) {
@@ -73,6 +99,18 @@ RequestManager::RequestGuid
   request.tokens.insert(request.tokens.end(), tokens.begin(), tokens.end());
   request.initial_len = request.tokens.size();
 
+  if (num_ssms == 0) {
+    std::cout << "No small spective model registered yet, using increamental "
+                 "decoding."
+              << std::endl;
+  } else {
+    std::cout << "Num of models: " << num_ssms << std::endl;
+    for (int i = 0; i < num_ssms; i++) {
+      BeamTree beam_tree = BeamTree{};
+      request.beam_trees.push_back(beam_tree);
+    }
+  }
+
   pending_request_queue.push(request);
   {
     std::string output = "New request tokens:";
@@ -264,6 +302,8 @@ BeamSearchBatchConfig
 
   // Step 2: preparing the next batch for existing requests
   BeamSearchBatchConfig new_bc;
+  new_bc.model_id = old_bc.model_id;
+  std::cout << "old_bc.model_id: " << old_bc.model_id << "\n";
 
   for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
     if (old_bc.request_completed[i]) {
@@ -312,8 +352,8 @@ BeamSearchBatchConfig
           old_bc.beamRequestsInfo[i].max_depth;
 
       // do the slot exchange to minimize the cache exchange in kernel.
-      // std::cout << "update metadata" << std::endl;
-      update_beam_metadata(new_bc, beam_trees[i], i);
+      std::cout << "update metadata" << std::endl;
+      update_beam_metadata(new_bc, request.beam_trees.at(old_bc.model_id), i);
 
       if (new_bc.requestsInfo[i].token_start_offset + 1 >=
           request.tokens.size()) {
@@ -355,7 +395,8 @@ BeamSearchBatchConfig
 
 BeamSearchBatchConfig
     RequestManager::prepare_next_batch_init(TreeVerifyBatchConfig const &old_bc,
-                                            InferenceResult const &result) {
+                                            InferenceResult const &result,
+                                            int model_id) {
   const std::lock_guard<std::mutex> lock(request_queue_mutex);
   if (verbose) {
     std::cout << "\n############### prepare_next_batch_init ###############\n";
@@ -363,6 +404,7 @@ BeamSearchBatchConfig
   // Step 1: use result to update requests
   BeamSearchBatchConfig new_bc;
   new_bc.num_tokens = 0;
+  new_bc.model_id = model_id;
   int result_index = 0;
 
   for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
@@ -423,7 +465,7 @@ BeamSearchBatchConfig
     }
 
     std::vector<std::pair<BatchConfig::TokenId, int>> verified_tokens =
-        traverse_verify_tree(guid, dfs_tree_inputs_map.at(guid), tree_outputs);
+        traverse_verify_tree(guid, dfs_tree_inputs.at(guid), tree_outputs);
     log_req_mgr.print("Number of Verified Tokens = %zu",
                       verified_tokens.size());
     // check if the request is finished
@@ -481,9 +523,9 @@ BeamSearchBatchConfig
         }
       }
 
-      beam_trees[i] = BeamTree{};
-      dfs_tree_inputs_map.erase(
-          request.guid); // delete the old input tree from cache
+      // delete the old input tree from cache
+      dfs_tree_inputs.erase(request.guid);
+
       continue;
     }
 
@@ -598,26 +640,38 @@ BeamSearchBatchConfig
 }
 
 TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
-    BeamSearchBatchConfig const &old_bc) {
+    std::vector<BeamSearchBatchConfig> const &old_batches) {
   const std::lock_guard<std::mutex> lock(request_queue_mutex);
+
   if (verbose) {
     std::cout
         << "\n############### prepare_next_batch_verify ###############\n";
   }
+  assert(old_batches.size() > 0);
+
   TreeVerifyBatchConfig new_bc;
   new_bc.num_tokens_to_commit = 0;
   new_bc.num_tokens = 0;
 
   for (int i = 0; i < TreeVerifyBatchConfig::MAX_NUM_REQUESTS; i++) {
-    if (old_bc.request_completed[i]) {
+    if (old_batches.at(0).request_completed[i]) {
       continue;
     }
-    size_t guid = old_bc.requestsInfo[i].request_guid;
+    size_t guid = old_batches.at(0).requestsInfo[i].request_guid;
     Request &request = running_request_queue[guid];
 
     // Get the dfs tree
+    std::vector<std::vector<std::pair<BatchConfig::TokenId, int>>>
+        all_dfs_trees;
+
+    for (int j = 0; j < old_batches.size(); j++) {
+      std::vector<std::pair<BatchConfig::TokenId, int>> new_tree =
+          traverse_beam_tree(old_batches.at(j), i, request.tokens.size() - 1);
+      all_dfs_trees.push_back(new_tree);
+    }
+    assert(all_dfs_trees.size() == old_batches.size());
     std::vector<std::pair<BatchConfig::TokenId, int>> dfs_tree_inputs =
-        traverse_beam_tree(old_bc, i, request.tokens.size() - 1);
+        merge_dfs_trees(all_dfs_trees, request.tokens.size() - 1, guid);
 
     if (verbose) {
       std::cout << "Request Tokens Size: " << request.tokens.size()
@@ -629,9 +683,10 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
 
     // Normal Request Info
     new_bc.requestsInfo[i].token_start_offset = dfs_tree_inputs.front().second;
-    new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
+    new_bc.requestsInfo[i].request_guid =
+        old_batches.at(0).requestsInfo[i].request_guid;
     new_bc.requestsInfo[i].max_sequence_length =
-        old_bc.requestsInfo[i].max_sequence_length;
+        old_batches.at(0).requestsInfo[i].max_sequence_length;
     // TODO: Check this
     new_bc.requestsInfo[i].num_tokens_in_batch = 0;
     new_bc.request_completed[i] = false;
@@ -682,11 +737,6 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
 
     // add prompt to the dfs tree
     if (committed_tokens.find(guid) != committed_tokens.end()) {
-      // std::cout << "committed_tokens.size(): " <<
-      // committed_tokens.at(guid).size() << std::endl; std::cout <<
-      // "dfs_tree_inputs.at(0).second: " << dfs_tree_inputs.at(0).second <<
-      // std::endl; std::cout << "request.initial_len: " << request.initial_len
-      // << std::endl;
       if (dfs_tree_inputs.at(0).second ==
           request.initial_len + committed_tokens.at(guid).size() - 1) {
         for (int j = 0; j < request.initial_len; j++) {
@@ -742,18 +792,6 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       }
 
       if (committed_tokens.find(guid) != committed_tokens.end()) {
-        // if (j == 1) {
-        //   auto committed_token = committed_tokens.at(guid).at(0);
-        //   new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_index =
-        //   committed_token.second;
-        //   new_bc.committed_tokens[new_bc.num_tokens_to_commit].request_index
-        //   = i;
-        //   new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_depth =
-        //   committed_token.first; std:: cout << new_bc.num_tokens_to_commit
-        //   << "- committed_token.token_depth: " << committed_token.first <<
-        //     ", token_index: " << committed_token.second << std::endl;
-        //   new_bc.num_tokens_to_commit++;
-        // }
         if (j < committed_tokens.at(guid).size()) {
           auto committed_token = committed_tokens.at(guid).at(j);
           new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_index =
@@ -789,8 +827,8 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
   if (verbose) {
     std::cout << "prepare_next_batch_verify OLD vs NEW batchconfigs below:"
               << std::endl;
-    old_bc.print();
-    new_bc.print();
+    // old_batches.print();
+    // new_bc.print();
   }
 
   return new_bc;
@@ -836,17 +874,21 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
       int beam_size = old_bc.beamRequestsInfo[index].beam_size;
       int depth = old_bc.beamRequestsInfo[index].current_depth;
 
+      Request &request =
+          running_request_queue[old_bc.requestsInfo[index].request_guid];
+
       if (depth == 1) {
         // store the last input into the tree;
         if (verbose) {
           std::cout << "try to store the input"
                     << "\n";
         }
-        Request &request =
-            running_request_queue[old_bc.requestsInfo[index].request_guid];
-        beam_trees[index].treeLayers[0].tokens[0] = request.tokens.back();
-        beam_trees[index].treeLayers[0].probs[0] = 1;
-        beam_trees[index].treeLayers[0].parent_ids[0] = -1;
+
+        request.beam_trees.at(old_bc.model_id).treeLayers[0].tokens[0] =
+            request.tokens.back();
+        request.beam_trees.at(old_bc.model_id).treeLayers[0].probs[0] = 1;
+        request.beam_trees.at(old_bc.model_id).treeLayers[0].parent_ids[0] = -1;
+
         if (verbose) {
           std::cout << "Store the previous last token to the tree root: "
                     << request.tokens.back() << "\n";
@@ -854,18 +896,22 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
       }
 
       for (int beam_id = 0; beam_id < beam_width; beam_id++) {
-        beam_trees[index].treeLayers[depth].tokens[beam_id] =
-            result.token_ids[result_index];
-        beam_trees[index].treeLayers[depth].probs[beam_id] =
-            result.probs[result_index];
-        beam_trees[index].treeLayers[depth].parent_ids[beam_id] =
-            result.parent_id[result_index];
+        request.beam_trees.at(old_bc.model_id)
+            .treeLayers[depth]
+            .tokens[beam_id] = result.token_ids[result_index];
+        request.beam_trees.at(old_bc.model_id)
+            .treeLayers[depth]
+            .probs[beam_id] = result.probs[result_index];
+        request.beam_trees.at(old_bc.model_id)
+            .treeLayers[depth]
+            .parent_ids[beam_id] = result.parent_id[result_index];
 
         if (verbose) {
-          std::cout << "tree value: " << depth << " token: "
-                    << beam_trees[index].treeLayers[depth].tokens[beam_id]
-                    << " result tokens: " << result.token_ids[result_index]
-                    << std::endl;
+          std::cout << "tree value: " << depth << "token: "
+                    << request.beam_trees.at(old_bc.model_id)
+                           .treeLayers[depth]
+                           .tokens[beam_id]
+                    << "result tokens: " << result.token_ids[result_index];
         }
         result_index += 1;
       }
@@ -891,27 +937,16 @@ void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
   int depth = new_bc.beamRequestsInfo[request_index].current_depth - 1;
   int beam_size = new_bc.beamRequestsInfo[request_index].beam_size;
 
-  // std::cout << "-----------before parent id exchange-----------" <<
-  // std::endl; for (int j = 0; j < beam_size; j++) {
-  //   std::cout << "after request id: " << request_index << "beam id = " << j
-  //             << "parnt: "
-  //             << new_bc.beamRequestsInfo[request_index].parent_id[j]
-  //             << "token: " <<
-  //             new_bc.beamRequestsInfo[request_index].tokens[j]
-  //             << "probs: " << new_bc.beamRequestsInfo[request_index].probs[j]
-  //             << std::endl;
-  //   // std::fixed << std::setprecision(15)<<
-  // }
-
   if (new_bc.beamRequestsInfo[request_index].current_depth ==
       1) { // TODO: check if this is correct
-    for (int j = 0; j < beam_size; j++) {
-      new_bc.beamRequestsInfo[request_index].parent_id[j] = j;
-      new_bc.beamRequestsInfo[request_index].probs[j] =
-          tree.treeLayers[depth].probs[j]; // ?
-      new_bc.beamRequestsInfo[request_index].tokens[j] =
-          tree.treeLayers[depth].tokens[j]; // ?
-    }
+    // for (int j = 0; j < beam_size; j++) {
+    //   new_bc.beamRequestsInfo[request_index].parent_id[j] = j;
+    //   new_bc.beamRequestsInfo[request_index].probs[j] =
+    //       tree.treeLayers[depth].probs[j]; // ?
+    //   new_bc.beamRequestsInfo[request_index].tokens[j] =
+    //       tree.treeLayers[depth].tokens[j]; // ?
+    // }
+    assert(false);
   } else {
     std::set<int> parents;
     std::set<int> childs;
@@ -1126,7 +1161,13 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
     std::cout << "[Traverse Beam Tree] beam_width: "
               << old_bc.beamRequestsInfo[request_index].beam_size << "\n";
   }
-  BeamTree tree = beam_trees[request_index];
+
+  auto guid = old_bc.requestsInfo[request_index].request_guid;
+  Request &request = running_request_queue[guid];
+  std::cout << "request.beam_trees.size(): " << request.beam_trees.size()
+            << std::endl;
+  BeamTree tree = request.beam_trees.at(old_bc.model_id);
+  std::cout << "\n\n";
 
   // token, index
   // todo make this one global for different stages
@@ -1151,21 +1192,78 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
                 << ", depth: " << serializedTree.at(k).second << "\n";
     }
   }
-  // std::cout << "Done printing serialized tree, "
-  //           << old_bc.requestsInfo[request_index].request_guid << "\n";
-
-  if (dfs_tree_inputs_map.find(
-          old_bc.requestsInfo[request_index].request_guid) !=
-      dfs_tree_inputs_map.end()) {
-    dfs_tree_inputs_map[old_bc.requestsInfo[request_index].request_guid] =
-        serializedTree;
-  } else {
-    dfs_tree_inputs_map.insert(std::make_pair(
-        old_bc.requestsInfo[request_index].request_guid, serializedTree));
-  }
+
+  // if (dfs_tree_inputs.find(old_bc.requestsInfo[request_index].request_guid)
+  // !=
+  //     dfs_tree_inputs.end()) {
+  //   dfs_tree_inputs[old_bc.requestsInfo[request_index].request_guid] =
+  //       serializedTree;
+  // } else {
+  //   dfs_tree_inputs.insert(std::make_pair(
+  //       old_bc.requestsInfo[request_index].request_guid, serializedTree));
+  // }
 
   return serializedTree;
   // }
 }
 
+std::vector<std::pair<BatchConfig::TokenId, int>>
+    RequestManager::merge_dfs_trees(
+        std::vector<std::vector<std::pair<BatchConfig::TokenId, int>>>
+            input_trees,
+        int root_depth,
+        RequestGuid guid) {
+  std::vector<std::pair<BatchConfig::TokenId, int>> merged_tree;
+
+  std::unordered_map<int, std::set<int>> childrens;
+  std::unordered_map<int, int> curr_path;
+
+  // convert <token_id, depth> pair to an integer
+  auto root = input_trees.at(0).at(0);
+  int root_id = root.first * 10000 + root.second;
+
+  for (int i = 0; i < input_trees.size(); i++) {
+    auto tree = input_trees.at(i);
+    // all trees should have the same root
+    assert(tree.at(0) == root);
+
+    for (auto const &pair : tree) {
+      int id = pair.first * 10000 + pair.second; // current node
+      curr_path[pair.second] = id;               // log node in current search
+
+      if (childrens.find(id) == childrens.end()) {
+        // init empty set
+        childrens[id] = std::set<int>();
+      }
+
+      if (pair.second > root_depth) {
+        int parent_id = curr_path[pair.second - 1];
+        childrens[parent_id].insert(id);
+      }
+    }
+  }
+
+  std::stack<int> q;
+  q.push(root_id);
+
+  while (!q.empty()) {
+    int curr = q.top();
+    q.pop();
+    merged_tree.push_back(std::make_pair(curr / 10000, curr % 10000));
+    for (int child : childrens[curr]) {
+      q.push(child);
+    }
+  }
+
+  if (verbose) {
+    for (auto &pair : merged_tree) {
+      std::cout << pair.first << ", depth: " << pair.second << std::endl;
+    }
+  }
+
+  dfs_tree_inputs[guid] = merged_tree;
+
+  return merged_tree;
+}
+
 }; // namespace FlexFlow

From e13190852c98f084b49d5ade1b92d7bf0c4354cd Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 15 Jun 2023 18:52:41 +0800
Subject: [PATCH 149/344] Fix inference test (#767)

* fix

* fix workflow
---
 .github/workflows/gpu-ci-skip.yml        |  7 +++-
 .github/workflows/gpu-ci.yml             |  4 +++
 tests/inference/huggingface_inference.py | 41 +++++++++++++++---------
 tests/inference_tests.sh                 |  2 +-
 4 files changed, 36 insertions(+), 18 deletions(-)

diff --git a/.github/workflows/gpu-ci-skip.yml b/.github/workflows/gpu-ci-skip.yml
index d8e5353e79..766bd8d790 100644
--- a/.github/workflows/gpu-ci-skip.yml
+++ b/.github/workflows/gpu-ci-skip.yml
@@ -1,15 +1,20 @@
 name: "gpu-ci"
 on:
   pull_request:
-    paths-ignore:
+    paths:
       - "cmake/**"
       - "config/**"
       - "python/**"
       - "setup.py"
       - "include/**"
+      - "inference/**"
       - "src/**"
+      - "tests/inference/**"
       - ".github/workflows/gpu-ci.yml"
+      - "tests/cpp_gpu_tests.sh"
+      - "tests/inference_tests.sh"
       - "tests/multi_gpu_tests.sh"
+      - "tests/python_interface_test.sh"
   workflow_dispatch:
 
 concurrency:
diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index 00b3138e00..95983f889b 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -9,8 +9,10 @@ on:
       - "include/**"
       - "inference/**"
       - "src/**"
+      - "tests/inference/**"
       - ".github/workflows/gpu-ci.yml"
       - "tests/cpp_gpu_tests.sh"
+      - "tests/inference_tests.sh"
       - "tests/multi_gpu_tests.sh"
       - "tests/python_interface_test.sh"
   push:
@@ -24,8 +26,10 @@ on:
       - "include/**"
       - "inference/**"
       - "src/**"
+      - "tests/inference/**"
       - ".github/workflows/gpu-ci.yml"
       - "tests/cpp_gpu_tests.sh"
+      - "tests/inference_tests.sh"
       - "tests/multi_gpu_tests.sh"
       - "tests/python_interface_test.sh"
   workflow_dispatch:
diff --git a/tests/inference/huggingface_inference.py b/tests/inference/huggingface_inference.py
index 577121a8a8..3442fe6120 100644
--- a/tests/inference/huggingface_inference.py
+++ b/tests/inference/huggingface_inference.py
@@ -1,23 +1,25 @@
 import argparse
 import json
 import os
-from transformers import AutoModelForCausalLM
-from transformers import AutoTokenizer
+from transformers import AutoModelForCausalLM, AutoTokenizer, LlamaTokenizer
+
 
 def main():
     # Change working dir to folder storing this script
     abspath = os.path.abspath(__file__)
     dname = os.path.dirname(abspath)
     os.chdir(dname)
-    
+
     # Parse command line arguments
     parser = argparse.ArgumentParser()
-    parser.add_argument('--model-name', type=str, required=True)
-    parser.add_argument('--tokenizer-model-name', type=str, required=True)
-    parser.add_argument('--max-length', type=int, default=128)
-    parser.add_argument('--prompt-file', type=str, required=True)
-    parser.add_argument('--output-file', type=str, required=True)
-    parser.add_argument("--use-full-precision", action="store_true", help="Use full precision")
+    parser.add_argument("--model-name", type=str, required=True)
+    parser.add_argument("--tokenizer-model-name", type=str, required=True)
+    parser.add_argument("--max-length", type=int, default=128)
+    parser.add_argument("--prompt-file", type=str, required=True)
+    parser.add_argument("--output-file", type=str, required=True)
+    parser.add_argument(
+        "--use-full-precision", action="store_true", help="Use full precision"
+    )
     parser.add_argument("--gpu", action="store_true", help="Run on GPU")
     args = parser.parse_args()
     # Check if max-length is greater than 0
@@ -28,32 +30,39 @@ def main():
     if not os.path.isfile(args.prompt_file):
         print(f"Error: {args.prompt_file} does not exist.")
         return
-    
+
     # Read prompt-file into a list of strings
-    with open(args.prompt_file, 'r') as f:
+    with open(args.prompt_file, "r") as f:
         try:
             prompt_list = json.load(f)
         except json.JSONDecodeError:
             print(f"Error: Unable to parse {args.prompt_file} as JSON.")
             return
-    
+
     # Set default tensor type depending on argument indicating the float type to use
     if not args.use_full_precision:
         import torch
+
         torch.set_default_tensor_type(torch.HalfTensor)
 
     # Run huggingface model
     device = "cuda" if args.gpu else "cpu"
     model = AutoModelForCausalLM.from_pretrained(args.model_name).to(device)
-    tokenizer = AutoTokenizer.from_pretrained(args.tokenizer_model_name)
-    with open(args.output_file, 'w') as f:
+    if args.tokenizer_model_name == "JackFram/llama-160m":
+        tokenizer = LlamaTokenizer.from_pretrained("JackFram/llama-160m", use_fast=True)
+    else:
+        tokenizer = AutoTokenizer.from_pretrained(args.tokenizer_model_name)
+    with open(args.output_file, "w") as f:
         for i, prompt in enumerate(prompt_list):
-            batch = tokenizer(prompt_list, return_tensors="pt", add_special_tokens=True).to(device)
+            batch = tokenizer(
+                prompt_list, return_tensors="pt", add_special_tokens=True
+            ).to(device)
             generated = model.generate(batch["input_ids"], max_length=args.max_length)
             out = tokenizer.decode(generated[0])
             # Write output to file
             out_str = out if i == (len(prompt_list) - 1) else out + "\n"
             f.write(out_str)
 
-if __name__ == '__main__':
+
+if __name__ == "__main__":
     main()
diff --git a/tests/inference_tests.sh b/tests/inference_tests.sh
index 46fa70c688..c04000c72b 100755
--- a/tests/inference_tests.sh
+++ b/tests/inference_tests.sh
@@ -13,7 +13,7 @@ cd "${BASH_SOURCE[0]%/*}"
 cleanup
 
 # Update the transformers library to support the LLAMA model
-pip3 install --upgrade transformers
+pip3 install --upgrade transformers sentencepiece 
 
 # Download the weights in both half and full precision
 python3 ../inference/utils/download_llama_weights.py

From 7e84575fe5155f87adb1bbac096796ad4eae485f Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sat, 17 Jun 2023 21:06:13 +0800
Subject: [PATCH 150/344] Merge master into inference (#777)

* Fix bug in elementwise multiplication with broadcasting (#764)

* Fix multinode test (#766)

* Fix UCX multinode test (#768)

* fix

* fix 2

* Prevent format.sh from formatting triton (#756)

* [CI] - Increase timeout in multinode test (UCX & MPI) (#773)

* fix

* fix 2

* increase timeout

* Fix docker builds in CI (#774)

---------

Co-authored-by: Soumya Chatterjee <soumyac@stanford.edu>
Co-authored-by: Colin Unger <unger@stanford.edu>
---
 .github/workflows/docker-build.yml        | 29 ++++++++++++++++++-----
 .github/workflows/multinode-test.yml      | 10 ++++++++
 CMakeLists.txt                            |  4 ++++
 config/config.linux                       |  2 +-
 docker/flexflow-environment/Dockerfile    | 10 ++++++--
 scripts/format.sh                         |  5 ++--
 src/ops/kernels/element_binary_kernels.cu |  2 +-
 7 files changed, 50 insertions(+), 12 deletions(-)

diff --git a/.github/workflows/docker-build.yml b/.github/workflows/docker-build.yml
index bfb01a4b5b..14f64f5fe6 100644
--- a/.github/workflows/docker-build.yml
+++ b/.github/workflows/docker-build.yml
@@ -8,10 +8,9 @@ on:
   push:
     branches:
       - "master"
-    paths:
-      - "docker/**"
-      - "!docker/README.md"
-      - ".github/workflows/docker-build.yml"
+  schedule:
+    # Run every week on Sunday at midnight PT (3am ET / 8am UTC) to keep the docker images updated
+    - cron: "0 8 * * 0"
   workflow_dispatch:
 
 # Cancel outdated workflows if they are still running
@@ -43,11 +42,16 @@ jobs:
           # On push to master, build for all compatible architectures, so that we can publish 
           # a pre-built general-purpose image. On all other cases, only build for one architecture
           # to save time.
-          if [[ ${{ github.event_name }} == 'push' && ${GITHUB_REF#refs/heads/} == "master" ]]; then
+          if [[ ( ${{ github.event_name }} == 'push' || ${{ github.event_name }} == 'schedule' ) && ${GITHUB_REF#refs/heads/} == "master" ]]; then
             export FF_CUDA_ARCH=all
           else
             export FF_CUDA_ARCH=70
           fi
+          if [[ "${FF_GPU_BACKEND}" == "cuda" ]]; then
+            export FF_BUILD_ALL_INFERENCE_EXAMPLES=ON
+          else
+            export FF_BUILD_ALL_INFERENCE_EXAMPLES=OFF
+          fi
           ./docker/build.sh flexflow
 
       - name: Check availability of Python flexflow.core module
@@ -55,13 +59,26 @@ jobs:
         run: docker run --entrypoint python flexflow-cuda:latest -c "import flexflow.core; exit()"
 
       - name: Publish Docker environment image (on push to master)
+        if: github.repository_owner == 'flexflow'
         env:
           FLEXFLOW_CONTAINER_TOKEN: ${{ secrets.FLEXFLOW_CONTAINER_TOKEN }}
           FF_GPU_BACKEND: ${{ matrix.gpu_backend }}
         run: |
-          if [[ ${{ github.event_name }} == 'push' && ${GITHUB_REF#refs/heads/} == "master" ]]; then
+          if [[ ( ${{ github.event_name }} == 'push' || ${{ github.event_name }} == 'schedule' ) && ${GITHUB_REF#refs/heads/} == "master" ]]; then
             ./docker/publish.sh "flexflow-environment-${FF_GPU_BACKEND}"
             ./docker/publish.sh "flexflow-${FF_GPU_BACKEND}"
           else
             echo "No need to update Docker containers in ghrc.io registry at this time."
           fi
+  
+  notify-slack:
+    name: Notify Slack in case of failure
+    runs-on: ubuntu-20.04
+    needs: docker-build
+    if: ${{ failure() && github.event_name == 'schedule' && github.repository_owner == 'flexflow' }}
+    steps:
+      - name: Send Slack message
+        env:
+          SLACK_WEBHOOK: ${{ secrets.SLACK_WEBHOOK }}
+        run: |
+          curl -X POST -H 'Content-type: application/json' --data "{\"text\":\"Weekly FlexFlow Docker images build failed! <https://github.com/flexflow/FlexFlow/actions/runs/$GITHUB_RUN_ID|(See here).> :x: \"}" $SLACK_WEBHOOK
diff --git a/.github/workflows/multinode-test.yml b/.github/workflows/multinode-test.yml
index 8bde03094c..cfe3629211 100644
--- a/.github/workflows/multinode-test.yml
+++ b/.github/workflows/multinode-test.yml
@@ -34,6 +34,8 @@ jobs:
     if: github.repository_owner == 'flexflow'
     runs-on: self-hosted
     needs: gpu-ci-concierge
+    # 10h timeout, instead of default of 360min (6h)
+    timeout-minutes: 600
     container:
       image: ghcr.io/flexflow/flexflow-environment-cuda:latest
       options: --gpus all --shm-size=8192m
@@ -62,6 +64,7 @@ jobs:
           export FF_HOME=$(pwd)
           export PATH=/opt/conda/bin:$PATH
           export FF_HOME=$(pwd)
+          export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/conda/lib
           ./tests/python_interface_test.sh after-installation
 
       - name: Run multi-gpu tests
@@ -70,6 +73,7 @@ jobs:
           export CUDNN_DIR=/usr/local/cuda
           export CUDA_DIR=/usr/local/cuda
           export FF_HOME=$(pwd)
+          export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/conda/lib
           export OMPI_ALLOW_RUN_AS_ROOT=1
           export OMPI_ALLOW_RUN_AS_ROOT_CONFIRM=1
           export OMPI_MCA_btl_vader_single_copy_mechanism=none
@@ -84,6 +88,8 @@ jobs:
     container:
       image: ghcr.io/flexflow/flexflow-environment-cuda:latest
       options: --gpus all --shm-size=8192m
+    # 10h timeout, instead of default of 360min (6h)
+    timeout-minutes: 600
     steps:
       - name: Install updated git version
         run: sudo add-apt-repository ppa:git-core/ppa -y && sudo apt update -y && sudo apt install -y --no-install-recommends git
@@ -109,6 +115,7 @@ jobs:
           export FF_HOME=$(pwd)
           export PATH=/opt/conda/bin:$PATH
           export FF_HOME=$(pwd)
+          export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/conda/lib
           ./tests/python_interface_test.sh after-installation
 
       - name: Run multi-gpu tests
@@ -117,6 +124,7 @@ jobs:
           export CUDNN_DIR=/usr/local/cuda
           export CUDA_DIR=/usr/local/cuda
           export FF_HOME=$(pwd)
+          export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/conda/lib
           export OMPI_ALLOW_RUN_AS_ROOT=1
           export OMPI_ALLOW_RUN_AS_ROOT_CONFIRM=1
           export OMPI_MCA_btl_vader_single_copy_mechanism=none
@@ -155,6 +163,7 @@ jobs:
           export FF_HOME=$(pwd)
           export PATH=/opt/conda/bin:$PATH
           export FF_HOME=$(pwd)
+          export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/conda/lib
           ./tests/python_interface_test.sh after-installation
 
       - name: Run multi-gpu tests
@@ -163,6 +172,7 @@ jobs:
           export CUDNN_DIR=/usr/local/cuda
           export CUDA_DIR=/usr/local/cuda
           export FF_HOME=$(pwd)
+          export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/conda/lib
           export OMPI_ALLOW_RUN_AS_ROOT=1
           export OMPI_ALLOW_RUN_AS_ROOT_CONFIRM=1
           export OMPI_MCA_btl_vader_single_copy_mechanism=none
diff --git a/CMakeLists.txt b/CMakeLists.txt
index 5e305b15bb..11fcfbe533 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -139,6 +139,10 @@ if ((FF_LEGION_NETWORKS STREQUAL "gasnet" AND FF_GASNET_CONDUIT STREQUAL "ucx")
 
     if (FF_LEGION_NETWORKS STREQUAL "gasnet" AND FF_GASNET_CONDUIT STREQUAL "ucx")
         set(ENV{UCX_HOME} "${UCX_DIR}/install")
+        install(DIRECTORY ${UCX_DIR}/install/bin/ DESTINATION bin)
+        install(DIRECTORY ${UCX_DIR}/install/include/ DESTINATION include)
+        install(DIRECTORY ${UCX_DIR}/install/lib/ DESTINATION lib)
+        install(DIRECTORY ${UCX_DIR}/install/share/ DESTINATION share)
     endif()
 
     if (FF_LEGION_NETWORKS STREQUAL "ucx")
diff --git a/config/config.linux b/config/config.linux
index f63d722c13..482a154145 100755
--- a/config/config.linux
+++ b/config/config.linux
@@ -91,7 +91,7 @@ fi
 
 function get_build_configs() {
     # Create a string with the values of the variables set in this script
-    BUILD_CONFIGS="FF_CUDA_ARCH=${FF_CUDA_ARCH} CUDNN_DIR=${CUDNN_DIR} CUDA_DIR=${CUDA_DIR} FF_USE_PYTHON=${FF_USE_PYTHON} FF_GASNET_CONDUIT=${FF_GASNET_CONDUIT} FF_UCX_URL=${FF_UCX_URL} FF_LEGION_NETWORKS=${FF_LEGION_NETWORKS} FF_BUILD_ALL_EXAMPLES=${FF_BUILD_ALL_EXAMPLES} FF_BUILD_UNIT_TESTS=${FF_BUILD_UNIT_TESTS} FF_USE_PREBUILT_NCCL=${FF_USE_PREBUILT_NCCL} FF_USE_PREBUILT_LEGION=${FF_USE_PREBUILT_LEGION} FF_USE_ALL_PREBUILT_LIBRARIES=${FF_USE_ALL_PREBUILT_LIBRARIES} FF_USE_AVX2=${FF_USE_AVX2} FF_MAX_DIM=${FF_MAX_DIM} ROCM_PATH=${ROCM_PATH} FF_GPU_BACKEND=${FF_GPU_BACKEND}"
+    BUILD_CONFIGS="FF_CUDA_ARCH=${FF_CUDA_ARCH} CUDNN_DIR=${CUDNN_DIR} CUDA_DIR=${CUDA_DIR} FF_USE_PYTHON=${FF_USE_PYTHON} FF_GASNET_CONDUIT=${FF_GASNET_CONDUIT} FF_UCX_URL=${FF_UCX_URL} FF_LEGION_NETWORKS=${FF_LEGION_NETWORKS} FF_BUILD_ALL_EXAMPLES=${FF_BUILD_ALL_EXAMPLES} FF_BUILD_ALL_INFERENCE_EXAMPLES=${FF_BUILD_ALL_INFERENCE_EXAMPLES} FF_BUILD_UNIT_TESTS=${FF_BUILD_UNIT_TESTS} FF_USE_PREBUILT_NCCL=${FF_USE_PREBUILT_NCCL} FF_USE_PREBUILT_LEGION=${FF_USE_PREBUILT_LEGION} FF_USE_ALL_PREBUILT_LIBRARIES=${FF_USE_ALL_PREBUILT_LIBRARIES} FF_USE_AVX2=${FF_USE_AVX2} FF_MAX_DIM=${FF_MAX_DIM} ROCM_PATH=${ROCM_PATH} FF_GPU_BACKEND=${FF_GPU_BACKEND}"
 }
 
 if [ -n "$1" ]; then
diff --git a/docker/flexflow-environment/Dockerfile b/docker/flexflow-environment/Dockerfile
index 0586409a9f..00ecd6956c 100644
--- a/docker/flexflow-environment/Dockerfile
+++ b/docker/flexflow-environment/Dockerfile
@@ -37,6 +37,11 @@ RUN  if [ "$FF_GPU_BACKEND" = "hip_cuda" ] || [ "$FF_GPU_BACKEND" = "hip_rocm" ]
         rm ./amdgpu-install_22.20.50205-1_all.deb; \
         amdgpu-install -y --usecase=hip,rocm --no-dkms; \
         apt-get install -y hip-dev hipblas miopen-hip rocm-hip-sdk; \
+        # Install protobuf v3.20.x manually
+        apt-get update -y && sudo apt-get install -y pkg-config zip g++ zlib1g-dev autoconf automake libtool make; \
+        git clone -b 3.20.x https://github.com/protocolbuffers/protobuf.git; cd protobuf/ ; git submodule update --init --recursive; \
+        ./autogen.sh; ./configure; cores_available=$(nproc --all); n_build_cores=$(( cores_available -1 )); \
+        if (( n_build_cores < 1 )) ; then n_build_cores=1 ; fi; make -j $n_build_cores; make install; ldconfig; cd .. ; \
     else \
         echo "FF_GPU_BACKEND: ${FF_GPU_BACKEND}. Skipping installing HIP dependencies"; \
     fi
@@ -48,9 +53,10 @@ ENV CUDNN_DIR /usr/local/cuda
 ENV CUDA_DIR /usr/local/cuda
 
 # Install python packages and other dependencies
-RUN conda install -c conda-forge cmake make pillow cmake-build-extension pybind11 numpy pandas keras-preprocessing 
+RUN conda install -c conda-forge cmake make pillow cmake-build-extension pybind11 numpy pandas keras-preprocessing
 # Install CPU-only Pytorch and related dependencies
 RUN conda install pytorch torchvision torchaudio cpuonly -c pytorch
-RUN conda install -c conda-forge onnx tensorflow transformers sentencepiece
+RUN conda install -c conda-forge onnx transformers sentencepiece
+RUN pip3 install tensorflow
 
 ENTRYPOINT ["/bin/bash"]
diff --git a/scripts/format.sh b/scripts/format.sh
index bf13948955..2ed97b8f0a 100755
--- a/scripts/format.sh
+++ b/scripts/format.sh
@@ -52,11 +52,12 @@ download_clang_tool() {
       error "Unknown return value from get_os: $OS. Exiting..."
   esac
   URL="$BASE_URL/clang-${TOOL}-${VERSION}_${URL_OS}-amd64"
+  echo "Downloading from $URL..."
 
   if command -v wget &> /dev/null; then
     wget "$URL" -O "$TARGET_PATH"
   elif command -v curl &> /dev/null; then
-    curl "$URL" -o "$TARGET_PATH"
+    curl -L "$URL" -o "$TARGET_PATH"
   else
     error "Could not find either wget or curl. Exiting..."
   fi
@@ -67,5 +68,5 @@ if [[ ! -e $CLANG_FORMAT_PATH ]]; then
   chmod u+x "$CLANG_FORMAT_PATH"
 fi
 
-mapfile -t FILES < <(git ls-files | grep -E '\.(h|cc|cpp|cu)$' | grep -v '^triton')
+mapfile -t FILES < <(git ls-files ':!:triton/**' '*.h' '*.cc' '*.cpp' '*.cu' '*.c')
 "$CLANG_FORMAT_PATH" -i "${FILES[@]}"
diff --git a/src/ops/kernels/element_binary_kernels.cu b/src/ops/kernels/element_binary_kernels.cu
index 0cbff73b82..6d30ae690a 100644
--- a/src/ops/kernels/element_binary_kernels.cu
+++ b/src/ops/kernels/element_binary_kernels.cu
@@ -386,7 +386,7 @@ void forward_kernel(ElementBinaryMeta const *m,
                                m->opDesc,
                                &alpha1,
                                m->outputTensor,
-                               in1_ptr,
+                               out_ptr,
                                &alpha2,
                                m->input2Tensor,
                                in2_ptr,

From 3969a671d8a58ef84067c12f246af49f141127bb Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Sat, 17 Jun 2023 11:28:19 -0400
Subject: [PATCH 151/344] support falcon model (#762)

* init

* add mlc tokenizer.

* .

* fix

* fix pipeline,  fix name

* .

* format

* ci

* .

* add rust

* fix

* .

* inf test fix

* .

* fix

* .

* fix

* optimize

* move rust to conda env

* .

* .

* fix

* fix

* fix

* update git ignore

* fix rust install

* Update config.linux

---------

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
---
 .dockerignore                                 |    6 +
 .gitignore                                    |    5 +
 .gitmodules                                   |    7 +-
 CMakeLists.txt                                |   14 +-
 FlexFlow.mk                                   |    4 +-
 conda/environment.yml                         |    1 +
 conda/flexflow-cpu.yml                        |    1 +
 deps/sentencepiece                            |    1 -
 deps/tokenizers-cpp                           |    1 +
 docker/flexflow-environment/Dockerfile        |    4 +
 include/flexflow/ffconst.h                    |    3 +
 include/flexflow/inference.h                  |   12 +-
 include/flexflow/model.h                      |   18 +
 include/flexflow/operator_params.h            |    1 +
 .../ops/inc_multiquery_attention_params.h     |   30 +
 .../ops/inc_multiquery_self_attention.h       |  158 ++
 include/flexflow/tokenizers.h                 |  103 --
 inference/file_loader.cc                      |   52 +-
 inference/incr_decoding/CMakeLists.txt        |    3 +-
 inference/incr_decoding/incr_decoding.cc      |   53 +-
 inference/models/configs/falcon_7B.json       |   11 +
 inference/models/falcon.cc                    |  178 ++
 inference/models/falcon.h                     |  115 ++
 inference/spec_infer/spec_infer.cc            |   36 +-
 inference/utils/download_opt_weights.py       |    4 +
 python/Makefile                               |    2 +
 scripts/install_tokenizer.sh                  |    9 +
 src/ops/beam_topk.cu                          |   12 +-
 src/ops/inc_multiquery_self_attention.cc      | 1434 +++++++++++++++++
 src/ops/inc_multiquery_self_attention.cpp     |   96 ++
 src/ops/inc_multiquery_self_attention.cu      |  797 +++++++++
 src/runtime/ffconst_utils.cc                  |    4 +
 src/runtime/graph.cc                          |   46 +
 src/runtime/model.cc                          |   26 +
 src/runtime/operator_params.cc                |    1 +
 src/runtime/request_manager.cc                |   79 +-
 src/runtime/substitution.cc                   |    8 +
 tests/inference/huggingface_inference.py      |    1 -
 tests/inference_tests.sh                      |    7 +-
 39 files changed, 3130 insertions(+), 213 deletions(-)
 delete mode 160000 deps/sentencepiece
 create mode 160000 deps/tokenizers-cpp
 create mode 100644 include/flexflow/ops/inc_multiquery_attention_params.h
 create mode 100644 include/flexflow/ops/inc_multiquery_self_attention.h
 delete mode 100644 include/flexflow/tokenizers.h
 create mode 100644 inference/models/configs/falcon_7B.json
 create mode 100644 inference/models/falcon.cc
 create mode 100644 inference/models/falcon.h
 create mode 100755 scripts/install_tokenizer.sh
 create mode 100644 src/ops/inc_multiquery_self_attention.cc
 create mode 100644 src/ops/inc_multiquery_self_attention.cpp
 create mode 100644 src/ops/inc_multiquery_self_attention.cu

diff --git a/.dockerignore b/.dockerignore
index 22ec965249..a7470203e3 100644
--- a/.dockerignore
+++ b/.dockerignore
@@ -11,3 +11,9 @@ python/flexflow/core/legion_cffi_header.py
 *.pb.h
 *.o
 *.a
+
+# Ignore inference assets
+/inference/weights/*
+/inference/tokenizer/*
+/inference/prompt/*
+/inference/output/*
diff --git a/.gitignore b/.gitignore
index 1ba1e26bd9..2952fe3a2f 100644
--- a/.gitignore
+++ b/.gitignore
@@ -17,6 +17,11 @@ __pycache__/
 # C extensions
 *.so
 
+/inference/weights/*
+/inference/tokenizer/*
+/inference/prompt/*
+/inference/output/*
+
 # Distribution / packaging
 .Python
 build/
diff --git a/.gitmodules b/.gitmodules
index 82a77864f2..c68582d4ac 100644
--- a/.gitmodules
+++ b/.gitmodules
@@ -19,6 +19,7 @@
 [submodule "deps/json"]
 	path = deps/json
 	url = https://github.com/nlohmann/json.git
-[submodule "deps/sentencepiece"]
-	path = deps/sentencepiece
-	url = https://github.com/google/sentencepiece.git
+[submodule "deps/tokenizers-cpp"]
+	path = deps/tokenizers-cpp
+	url = https://github.com/mlc-ai/tokenizers-cpp.git
+	fetchRecurseSubmodules = true
\ No newline at end of file
diff --git a/CMakeLists.txt b/CMakeLists.txt
index 11fcfbe533..ae25c851a9 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -12,13 +12,13 @@ if (CMAKE_VERSION VERSION_GREATER_EQUAL "3.24.0")
 endif()
 set(CMAKE_MODULE_PATH ${CMAKE_MODULE_PATH} ${CMAKE_CURRENT_LIST_DIR}/cmake)
 set(FLEXFLOW_ROOT ${CMAKE_CURRENT_LIST_DIR})
-set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -UNDEBUG")
+set(CMAKE_CXX_FLAGS "-std=c++17 ${CMAKE_CXX_FLAGS} -fPIC -UNDEBUG")
 
 option(INFERENCE_TESTS "Run inference tests" OFF)
 set(LIBTORCH_PATH "${CMAKE_CURRENT_SOURCE_DIR}/../libtorch" CACHE STRING "LibTorch Path")
 if (INFERENCE_TESTS)
   find_package(Torch REQUIRED PATHS ${LIBTORCH_PATH} NO_DEFAULT_PATH)
-  set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} ${TORCH_CXX_FLAGS}")
+  set(CMAKE_CXX_FLAGS "-std=c++17 ${CMAKE_CXX_FLAGS} -fPIC ${TORCH_CXX_FLAGS}")
   message(STATUS "LIBTORCH_PATH: ${LIBTORCH_PATH}")
   message(STATUS "TORCH_LIBRARIES: ${TORCH_LIBRARIES}")
 endif()
@@ -443,7 +443,7 @@ if (INFERENCE_TESTS)
 endif()
 
 # build binary
-option(FF_BUILD_SENTENCEPIECE "build sentencepiece for LLM serving" ON)
+option(FF_BUILD_TOKENIZER "build tokenizer=cpp for LLM serving" ON)
 option(FF_BUILD_RESNET "build resnet example" OFF)
 option(FF_BUILD_RESNEXT "build resnext example" OFF)
 option(FF_BUILD_ALEXNET "build alexnet example" OFF)
@@ -478,13 +478,13 @@ if(FF_BUILD_VISUALIZATION_TOOL)
   add_subdirectory(tools/substitutions_to_dot)
 endif()
 
-if(FF_BUILD_SENTENCEPIECE OR FF_BUILD_ALL_INFERENCE_EXAMPLES)
+if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_TOKENIZER)
   if (FF_GPU_BACKEND STREQUAL "hip_rocm")
     SET(SPM_USE_BUILTIN_PROTOBUF OFF CACHE BOOL "Use builtin version of protobuf to compile SentencePiece")
   endif()
-  add_subdirectory(deps/sentencepiece sentencepiece EXCLUDE_FROM_ALL)
-  target_include_directories(flexflow PUBLIC deps/sentencepiece/src)
-  target_link_libraries(flexflow sentencepiece)
+  add_subdirectory(deps/tokenizers-cpp tokenizers EXCLUDE_FROM_ALL)
+  target_include_directories(flexflow PUBLIC deps/tokenizers-cpp/include)
+  target_link_libraries(flexflow tokenizers_cpp)
 endif()
 
 # Python
diff --git a/FlexFlow.mk b/FlexFlow.mk
index 27a0062d8c..980f600c7c 100644
--- a/FlexFlow.mk
+++ b/FlexFlow.mk
@@ -87,7 +87,7 @@ ifneq ($(strip $(FF_USE_PYTHON)), 1)
 endif
 
 
-INC_FLAGS	+= -I${FF_HOME}/include -I${FF_HOME}/deps/optional/include -I${FF_HOME}/deps/variant/include -I${FF_HOME}/deps/json/include -I${FF_HOME}/deps/sentencepiece/src
+INC_FLAGS	+= -I${FF_HOME}/include -I${FF_HOME}/deps/optional/include -I${FF_HOME}/deps/variant/include -I${FF_HOME}/deps/json/include -I${FF_HOME}/deps/tokenizers-cpp/include -I${FF_HOME}/deps/tokenizers-cpp/sentencepiece/src
 CC_FLAGS	+= -DMAX_TENSOR_DIM=$(MAX_DIM) -DLEGION_MAX_RETURN_SIZE=32768
 NVCC_FLAGS	+= -DMAX_TENSOR_DIM=$(MAX_DIM) -DLEGION_MAX_RETURN_SIZE=32768
 HIPCC_FLAGS     += -DMAX_TENSOR_DIM=$(MAX_DIM) -DLEGION_MAX_RETURN_SIZE=32768
@@ -97,6 +97,8 @@ CC_FLAGS	+= -std=c++17
 NVCC_FLAGS	+= -std=c++17
 HIPCC_FLAGS     += -std=c++17
 
+LD_FLAGS += -L$(FF_HOME)/deps/tokenizers-cpp/example/tokenizers -ltokenizers_cpp -ltokenizers_c -L$(FF_HOME)/deps/tokenizers-cpp/example/tokenizers/sentencepiece/src -lsentencepiece
+
 ifeq ($(strip $(FF_USE_NCCL)), 1)
 INC_FLAGS	+= -I$(MPI_HOME)/include -I$(NCCL_HOME)/include
 CC_FLAGS	+= -DFF_USE_NCCL
diff --git a/conda/environment.yml b/conda/environment.yml
index 8396dafcca..2844a2d8d2 100644
--- a/conda/environment.yml
+++ b/conda/environment.yml
@@ -8,6 +8,7 @@ dependencies:
   - numpy>=1.16.0
   - Pillow
   - pybind11
+  - rust
   - cmake-build-extension
   - pip
   - pip:
diff --git a/conda/flexflow-cpu.yml b/conda/flexflow-cpu.yml
index e8cd4c1114..5de189f049 100644
--- a/conda/flexflow-cpu.yml
+++ b/conda/flexflow-cpu.yml
@@ -8,6 +8,7 @@ dependencies:
   - numpy>=1.16.0
   - Pillow
   - pybind11
+  - rust
   - cmake-build-extension
   - pytest
   - pip
diff --git a/deps/sentencepiece b/deps/sentencepiece
deleted file mode 160000
index 3863f7648e..0000000000
--- a/deps/sentencepiece
+++ /dev/null
@@ -1 +0,0 @@
-Subproject commit 3863f7648e5d8edb571ac592f3ac4f5f0695275a
diff --git a/deps/tokenizers-cpp b/deps/tokenizers-cpp
new file mode 160000
index 0000000000..c53bc0444d
--- /dev/null
+++ b/deps/tokenizers-cpp
@@ -0,0 +1 @@
+Subproject commit c53bc0444dbe2ea1f66e364cd576a6c1e23539b4
diff --git a/docker/flexflow-environment/Dockerfile b/docker/flexflow-environment/Dockerfile
index 00ecd6956c..598690a8a7 100644
--- a/docker/flexflow-environment/Dockerfile
+++ b/docker/flexflow-environment/Dockerfile
@@ -59,4 +59,8 @@ RUN conda install pytorch torchvision torchaudio cpuonly -c pytorch
 RUN conda install -c conda-forge onnx transformers sentencepiece
 RUN pip3 install tensorflow
 
+# Install Rust
+RUN curl https://sh.rustup.rs -sSf | sh -s -- -y
+ENV PATH /root/.cargo/bin:$PATH
+
 ENTRYPOINT ["/bin/bash"]
diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index df7eb3aeee..3cd42ccffe 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -164,6 +164,7 @@ enum OperatorType {
   OP_INC_MULTIHEAD_SELF_ATTENTION,
   OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION,
   OP_TREE_INC_MULTIHEAD_SELF_ATTENTION,
+  OP_INC_MULTIQUERY_SELF_ATTENTION,
   // Parallel Ops
   OP_REPARTITION,
   OP_COMBINE,
@@ -174,6 +175,8 @@ enum OperatorType {
   OP_INVALID,
 };
 
+enum ModelType { UNKNOWN, LLAMA, OPT, FALCON };
+
 enum PMParameter {
   PM_OP_TYPE,            // AnyOp
   PM_NUM_INPUTS,         // AnyOp
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index 3753e5e50e..4da8dbaf20 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -18,11 +18,13 @@
 #include "flexflow/batch_config.h"
 #include "flexflow/model.h"
 #include <mutex>
+#include <tokenizers_cpp.h>
 
 namespace FlexFlow {
 
 class FFModel;
 class BeamTree;
+using tokenizers::Tokenizer;
 
 class InferenceManager {
 public:
@@ -74,13 +76,12 @@ struct BeamTree {
 //   std::vector<float> probs;
 // };
 
-class Tokenizer;
-
 class RequestManager {
 public:
   using RequestGuid = BatchConfig::RequestGuid;
   using TokenId = BatchConfig::TokenId;
-  RequestManager(Tokenizer *tokenizer,
+  RequestManager(ModelType model_type,
+                 std::string const &path,
                  bool verbose = false,
                  std::string output_filepath = "");
   RequestManager();
@@ -145,13 +146,16 @@ class RequestManager {
                           Legion::Runtime *runtime);
 
 private:
-  Tokenizer *tokenizer;
+  std::unique_ptr<Tokenizer> tokenizer_;
   bool verbose;
+  ModelType model_type;
   std::string output_filepath;
   std::queue<Request> pending_request_queue;
   std::unordered_map<RequestGuid, Request> running_request_queue;
   std::mutex request_queue_mutex;
   RequestGuid next_available_guid;
+  const std::map<ModelType, int> model_bos_map = {{ModelType::LLAMA, 0},
+                                                  {ModelType::OPT, 2}};
 
   // TODO: Move this two vector to request struct
   std::unordered_map<RequestGuid,
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 2345722005..1f06fb7994 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -149,6 +149,8 @@ enum TaskIDs {
   INC_MULTIHEAD_SELF_ATTENTION_FWD_TASK_ID,
   INC_MULTIHEAD_SELF_ATTENTION_BWD_TASK_ID,
   INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
+  INC_MULTIQUERY_SELF_ATTENTION_INIT_TASK_ID,
+  INC_MULTIQUERY_SELF_ATTENTION_INF_TASK_ID,
   SPEC_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
   SPEC_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
   TREE_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
@@ -304,6 +306,7 @@ class Transpose;
 class RMSNorm;
 class BeamTopK;
 class SpecIncMultiHeadSelfAttention;
+class IncMultiQuerySelfAttention;
 class Combine;
 class Repartition;
 class Reduction;
@@ -632,6 +635,18 @@ class FFModel {
                                       float scaling_factor = 1.0f,
                                       bool qk_prod_scaling = true,
                                       char const *name = NULL);
+  Tensor inc_multiquery_self_attention(const Tensor input,
+                                       int embed_dim,
+                                       int num_heads,
+                                       int kdim = 0,
+                                       int vdim = 0,
+                                       float dropout = 0.0f,
+                                       bool bias = false,
+                                       bool add_bias_kv = false,
+                                       bool add_zero_attn = false,
+                                       DataType data_type = DT_NONE,
+                                       Initializer *kernel_initializer = NULL,
+                                       char const *name = NULL);
   Tensor
       spec_inc_multihead_self_attention(const Tensor input,
                                         int embed_dim,
@@ -1029,6 +1044,9 @@ class FFModel {
       std::unordered_map<
           std::pair<ParallelTensorShape, IncMultiHeadSelfAttentionParams>,
           IncMultiHeadSelfAttention *>,
+      std::unordered_map<
+          std::pair<ParallelTensorShape, IncMultiQuerySelfAttentionParams>,
+          IncMultiQuerySelfAttention *>,
       std::unordered_map<std::pair<ParallelTensorShape, BeamTopKParams>,
                          BeamTopK *>,
       std::unordered_map<
diff --git a/include/flexflow/operator_params.h b/include/flexflow/operator_params.h
index 9549ffc084..8c52dfb584 100644
--- a/include/flexflow/operator_params.h
+++ b/include/flexflow/operator_params.h
@@ -19,6 +19,7 @@
 #include "flexflow/ops/gather_params.h"
 #include "flexflow/ops/groupby_params.h"
 #include "flexflow/ops/inc_multihead_self_attention_params.h"
+#include "flexflow/ops/inc_multiquery_attention_params.h"
 #include "flexflow/ops/layer_norm_params.h"
 #include "flexflow/ops/linear_params.h"
 #include "flexflow/ops/pool_2d_params.h"
diff --git a/include/flexflow/ops/inc_multiquery_attention_params.h b/include/flexflow/ops/inc_multiquery_attention_params.h
new file mode 100644
index 0000000000..b781669473
--- /dev/null
+++ b/include/flexflow/ops/inc_multiquery_attention_params.h
@@ -0,0 +1,30 @@
+#ifndef _FLEXFLOW_INC_MULTIQUERY_ATTENTION_PARAMS_H
+#define _FLEXFLOW_INC_MULTIQUERY_ATTENTION_PARAMS_H
+
+#include "flexflow/fftype.h"
+#include "flexflow/parallel_tensor.h"
+
+namespace FlexFlow {
+
+struct IncMultiQuerySelfAttentionParams {
+  LayerID layer_guid;
+  int embed_dim, num_heads, kdim, vdim;
+  float dropout;
+  bool bias, add_bias_kv, add_zero_attn;
+
+  bool is_valid(ParallelTensorShape const &) const;
+};
+
+bool operator==(IncMultiQuerySelfAttentionParams const &,
+                IncMultiQuerySelfAttentionParams const &);
+
+} // namespace FlexFlow
+
+namespace std {
+template <>
+struct hash<FlexFlow::IncMultiQuerySelfAttentionParams> {
+  size_t operator()(FlexFlow::IncMultiQuerySelfAttentionParams const &) const;
+};
+} // namespace std
+
+#endif // _FLEXFLOW_INC_MULTIQUERY_ATTENTION_PARAMS_H
diff --git a/include/flexflow/ops/inc_multiquery_self_attention.h b/include/flexflow/ops/inc_multiquery_self_attention.h
new file mode 100644
index 0000000000..ba6a1feeaf
--- /dev/null
+++ b/include/flexflow/ops/inc_multiquery_self_attention.h
@@ -0,0 +1,158 @@
+#ifndef _FLEXFLOW_INC_MULTIQUERY_ATTENTION_H
+#define _FLEXFLOW_INC_MULTIQUERY_ATTENTION_H
+
+#include "flexflow/device.h"
+#include "flexflow/fftype.h"
+#include "flexflow/inference.h"
+#include "flexflow/layer.h"
+#include "flexflow/node.h"
+#include "flexflow/op_meta.h"
+#include "flexflow/operator.h"
+#include "flexflow/ops/inc_multiquery_attention_params.h"
+#include "math.h"
+#include <cfloat>
+#include <complex>
+
+namespace FlexFlow {
+
+class IncMultiQuerySelfAttentionMeta;
+
+class IncMultiQuerySelfAttention : public Op {
+public:
+  using Params = IncMultiQuerySelfAttentionParams;
+  using Input = ParallelTensor;
+
+  IncMultiQuerySelfAttention(FFModel &model,
+                             LayerID const &layer_guid,
+                             const ParallelTensor _input,
+                             int _embed_dim,
+                             int _num_heads,
+                             int _kdim,
+                             int _vdim,
+                             float _dropout,
+                             bool _bias,
+                             bool _add_bias_kv,
+                             bool _add_zero_attn,
+                             bool allocate_weights,
+                             char const *name);
+  IncMultiQuerySelfAttention(FFModel &model,
+                             const ParallelTensor _input,
+                             const ParallelTensor _weight,
+                             int _embed_dim,
+                             int _num_heads,
+                             int _kdim,
+                             int _vdim,
+                             float _dropout,
+                             bool _bias,
+                             bool _add_bias_kv,
+                             bool _add_zero_attn,
+                             bool allocate_weights,
+                             char const *name);
+  IncMultiQuerySelfAttention(FFModel &model,
+                             IncMultiQuerySelfAttention const &other,
+                             const ParallelTensor input,
+                             bool allocate_weights);
+  IncMultiQuerySelfAttention(FFModel &model,
+                             Params const &params,
+                             Input const &inputs,
+                             bool allocate_weights = false,
+                             char const *name = nullptr);
+  static Op *
+      create_operator_from_layer(FFModel &model,
+                                 Layer const *layer,
+                                 std::vector<ParallelTensor> const &inputs);
+  void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
+  void forward(FFModel const &) override;
+  void backward(FFModel const &) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
+  void print_layer(FFModel const &model) override {
+    assert(0);
+  }
+  bool get_int_parameter(PMParameter, int *) const override;
+
+  static OpMeta *init_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
+  bool measure_operator_cost(Simulator *sim,
+                             MachineView const &mv,
+                             CostMetrics &cost_metrics) const override;
+
+  static void inference_kernel_wrapper(IncMultiQuerySelfAttentionMeta const *m,
+                                       BatchConfig const *bc,
+                                       GenericTensorAccessorR const &input,
+                                       GenericTensorAccessorR const &weight,
+                                       GenericTensorAccessorW const &output);
+  Params get_params() const;
+
+public:
+  int num_heads;
+  float dropout;
+  bool bias;
+  bool add_bias_kv, add_zero_attn;
+  int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize,
+      embed_dim;
+  int qoSeqLength, kvSeqLength;
+};
+
+class IncMultiQuerySelfAttentionMeta : public OpMeta {
+public:
+  IncMultiQuerySelfAttentionMeta(FFHandler handler,
+                                 IncMultiQuerySelfAttention const *attn,
+                                 GenericTensorAccessorR const &weight,
+                                 Legion::Memory gpu_mem,
+                                 int num_samples);
+  IncMultiQuerySelfAttentionMeta(FFHandler handler,
+                                 InferenceMode infer_mode,
+                                 Op const *attn,
+                                 int _qSize,
+                                 int _kSize,
+                                 int _vSize,
+                                 int _qProjSize,
+                                 int _kProjSize,
+                                 int _vProjSize,
+                                 int _oProjSize,
+                                 int _embed_dim,
+                                 bool _bias,
+                                 bool _add_bias_kv,
+                                 GenericTensorAccessorR const &weight,
+                                 Legion::Memory gpu_mem,
+                                 int num_samples);
+  ~IncMultiQuerySelfAttentionMeta(void);
+
+public:
+  Realm::RegionInstance reserveInst;
+  size_t weights_params, weightSize, reserveSpaceSize;
+  int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize,
+      embed_dim;
+  int num_heads;
+  bool *has_load_weights;
+  bool *bias;
+  bool *multi_query_attention;
+#ifdef INFERENCE_TESTS
+  float *kcache, *vcache;
+#endif
+  void *devQKVProjArray, *keyCache, *valueCache;
+  void *qk_prods, *qk_prods_softmax;
+  void *attn_heads, *W_out_contiguous;
+  BatchConfig::PerTokenInfo *token_infos;
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+  cuFloatComplex *complex_input;
+#endif
+};
+
+}; // namespace FlexFlow
+
+#endif // _FLEXFLOW_ATTENTION_H
diff --git a/include/flexflow/tokenizers.h b/include/flexflow/tokenizers.h
deleted file mode 100644
index 8f6c309aad..0000000000
--- a/include/flexflow/tokenizers.h
+++ /dev/null
@@ -1,103 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#pragma once
-#include "gpt_tokenizer.h"
-#include <sentencepiece_processor.h>
-
-namespace FlexFlow {
-
-/*!
- * \brief a universal tokenizer that loads
- * either HF's tokenizer or sentence piece, depending on the type.
- */
-
-class Tokenizer {
-public:
-  // bos token
-  int32_t bos_token_id{0};
-  // eos token id
-  int32_t eos_token_id{1};
-
-  virtual ~Tokenizer() {}
-  virtual std::vector<int32_t> Encode(std::string const &text) = 0;
-  virtual std::string Decode(std::vector<int32_t> const &ids) = 0;
-
-  // static std::unique_ptr<Tokenizer> FromFile(const std::string& path);
-  // static std::unique_ptr<Tokenizer> ByteLevelBPEFromFile(const std::string&
-  // path);
-};
-
-class SentencePieceTokenizer : public Tokenizer {
-public:
-  SentencePieceTokenizer(std::string const &path) {
-    sentence_piece_.Load(path);
-  }
-
-  std::vector<int32_t> Encode(std::string const &text) final {
-    std::vector<int32_t> tokens;
-    sentence_piece_.Encode(text, &tokens).IgnoreError();
-    return tokens;
-  }
-
-  std::string Decode(std::vector<int32_t> const &ids) final {
-    std::string text;
-    sentence_piece_.Decode(ids, &text).IgnoreError();
-    return text;
-  }
-
-private:
-  // the tokenizer
-  sentencepiece::SentencePieceProcessor sentence_piece_;
-};
-
-class OptTokenizer : public Tokenizer {
-public:
-  OptTokenizer(std::string const &vocab_file,  // path to "gpt2-vocab.json"
-               std::string const &merges_file) // path to "gpt2-merges.txt"
-      : tokenizer(OPT_TOKENIZER, vocab_file, merges_file) {
-    bos_token_id = 0;
-    eos_token_id = 2;
-  }
-
-  std::vector<int32_t> Encode(std::string const &text) final {
-    std::vector<int32_t> tokens;
-    std::vector<int32_t> mask_ids;
-    tokenizer.encode(text, text.length(), &tokens, &mask_ids);
-
-    auto it = std::find(mask_ids.begin(), mask_ids.end(), 0);
-
-    if (it != mask_ids.end()) {
-      size_t index = std::distance(mask_ids.begin(), it);
-      tokens.erase(tokens.begin() + index, tokens.end());
-    }
-
-    return tokens;
-  }
-
-  std::string Decode(std::vector<int32_t> const &ids) final {
-    std::vector<int32_t> mask_ids;
-    for (int i = 0; i < ids.size(); i++) {
-      mask_ids.push_back(1);
-    }
-    std::string text = tokenizer.decode(ids, mask_ids);
-    return text;
-  }
-
-private:
-  GPT_Tokenizer tokenizer;
-};
-
-}; // namespace FlexFlow
diff --git a/inference/file_loader.cc b/inference/file_loader.cc
index f0eff0e50b..d7bb8a7b4c 100644
--- a/inference/file_loader.cc
+++ b/inference/file_loader.cc
@@ -83,7 +83,6 @@ void load_attention_bias(DT *ptr,
   std::vector<std::string> bias_files = {q_file, k_file, v_file, o_file};
 
   int file_index = 0;
-
   for (auto file : bias_files) {
     size_t partial_size = hidden_dim;
     // std::cout << "Loading filename: " << file << std::endl;
@@ -115,6 +114,54 @@ void load_attention_bias(DT *ptr,
   }
 }
 
+template <typename DT>
+void load_attention_weights_multi_query(DT *ptr,
+                                        std::string layer_name,
+                                        std::string weight_path,
+                                        size_t hidden_dim,
+                                        int num_heads) {
+
+  std::string qkv_file = weight_path +
+                         layer_name.substr(0, layer_name.find("attention")) +
+                         "attention_query_key_value_weight";
+  std::string o_file = weight_path +
+                       layer_name.substr(0, layer_name.find("attention")) +
+                       "attention_dense_weight";
+
+  // q has n_heads heads, k and v only have one head, o have n_head heads
+  std::vector<std::string> weight_files = {qkv_file, o_file};
+  int file_index = 0;
+  int data_index = 0;
+  for (auto file : weight_files) {
+    size_t partial_size =
+        file_index == 0 ? (hidden_dim + 2 * hidden_dim / num_heads) * hidden_dim
+                        : hidden_dim * hidden_dim;
+
+    std::ifstream in(file, std::ios::in | std::ios::binary);
+    // std::cout << "Loading filename: " << file << std::endl;
+    if (!in.good()) {
+      std::cout << "Could not open file: " << file << std::endl;
+    }
+    assert(in.good() && "incorrect weight file path");
+    std::vector<DT> host_array(partial_size);
+    size_t loaded_data_size = sizeof(DT) * partial_size;
+    in.seekg(0, in.end);
+    in.seekg(0, in.beg);
+    in.read((char *)host_array.data(), loaded_data_size);
+    size_t in_get_size = in.gcount();
+
+    if (in_get_size != loaded_data_size) {
+      std::cout << "load data error " << in_get_size << ", "
+                << loaded_data_size;
+      assert(false && "data size mismatch");
+    }
+    for (int i = 0; i < partial_size; i++) {
+      ptr[data_index++] = host_array.at(i);
+    }
+    file_index++;
+  }
+}
+
 template <typename DT>
 void load_attention_weights(DT *ptr,
                             int num_heads,
@@ -277,6 +324,9 @@ void FileDataLoader::load_single_weight_tensor(FFModel *ff,
                           weight_file_path);
     }
 
+  } else if (file_path.find("self_attention") != std::string::npos) {
+    load_attention_weights_multi_query(
+        data, file_path, weight_file_path, hidden_dim, num_heads);
   } else {
     if (weight_idx > 0) {
       int index = file_path.find("_weight");
diff --git a/inference/incr_decoding/CMakeLists.txt b/inference/incr_decoding/CMakeLists.txt
index 761a710d71..d1313d328b 100644
--- a/inference/incr_decoding/CMakeLists.txt
+++ b/inference/incr_decoding/CMakeLists.txt
@@ -9,7 +9,8 @@ set(CPU_SRC
   incr_decoding.cc
   ../file_loader.cc
   ../models/llama.cc
-  ../models/opt.cc)
+  ../models/opt.cc
+  ../models/falcon.cc)
 
 cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
 target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index d80ed9520b..a9ec63bc00 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -14,10 +14,10 @@
  */
 
 #include "flexflow/inference.h"
-#include "flexflow/tokenizers.h"
+#include "models/falcon.h"
 #include "models/llama.h"
 #include "models/opt.h"
-#include <filesystem>
+
 #include <nlohmann/json.hpp>
 
 using namespace Legion;
@@ -32,8 +32,6 @@ struct FilePaths {
   std::string output_file_path;
 };
 
-enum ModelType { UNKNOWN, LLAMA, OPT };
-
 void parse_input_args(char **argv,
                       int argc,
                       FilePaths &paths,
@@ -52,6 +50,8 @@ void parse_input_args(char **argv,
         llm_model_type = ModelType::LLAMA;
       } else if (model_type_str == "opt") {
         llm_model_type = ModelType::OPT;
+      } else if (model_type_str == "falcon") {
+        llm_model_type = ModelType::FALCON;
       } else {
         llm_model_type = ModelType::UNKNOWN;
       }
@@ -113,32 +113,9 @@ void FlexFlow::top_level_task(Task const *task,
   assert(model_type != ModelType::UNKNOWN &&
          "Invalid LLM model type passed (or no type was passed).");
 
-  // Create SentencePiece tokenizer or OPT tokenizer
-  SentencePieceTokenizer *sp_tokenizer = nullptr;
-  OptTokenizer *opt_tokenizer = nullptr;
-  if (model_type == ModelType::LLAMA) {
-    sp_tokenizer = new SentencePieceTokenizer(file_paths.tokenizer_file_path);
-  } else {
-    std::string tokenizer_folder =
-        (!file_paths.tokenizer_file_path.empty() &&
-         file_paths.tokenizer_file_path.back() != '/')
-            ? file_paths.tokenizer_file_path + '/'
-            : file_paths.tokenizer_file_path;
-    std::string vocab_file = tokenizer_folder + "gpt2-vocab.json";
-    std::string merges_file = tokenizer_folder + "gpt2-merges.txt";
-    std::filesystem::path path1(vocab_file);
-    std::filesystem::path path2(merges_file);
-    assert(std::filesystem::exists(path1) &&
-           "Vocab file gpt2-vocab.json does not exist at the specified path");
-    assert(std::filesystem::exists(path2) &&
-           "Merge file gpt2-merges.txt does not exist at the specified path");
-    opt_tokenizer = new OptTokenizer(vocab_file, merges_file);
-  }
-
   InferenceManager im(ffconfig, BatchConfig::MAX_NUM_TOKENS, 1);
-  RequestManager rm((model_type == ModelType::LLAMA)
-                        ? (Tokenizer *)sp_tokenizer
-                        : (Tokenizer *)opt_tokenizer,
+  RequestManager rm(model_type,
+                    file_paths.tokenizer_file_path,
                     /*verbose*/ verbose,
                     file_paths.output_file_path);
 
@@ -151,8 +128,7 @@ void FlexFlow::top_level_task(Task const *task,
                               ffconfig.workersPerNode * ffconfig.numNodes,
                               INC_DECODING_MODE,
                               use_full_precision);
-  } else {
-    assert(model_type == ModelType::OPT);
+  } else if (model_type == ModelType::OPT) {
     OPT::create_opt_model(model,
                           im,
                           file_paths.llm_config_file_path,
@@ -160,6 +136,16 @@ void FlexFlow::top_level_task(Task const *task,
                           ffconfig.workersPerNode * ffconfig.numNodes,
                           INC_DECODING_MODE,
                           use_full_precision);
+  } else if (model_type == ModelType::FALCON) {
+    FALCON::create_falcon_model(model,
+                                im,
+                                file_paths.llm_config_file_path,
+                                file_paths.llm_weight_file_path,
+                                ffconfig.workersPerNode * ffconfig.numNodes,
+                                INC_DECODING_MODE,
+                                use_full_precision);
+  } else {
+    assert(false && "unknow model type");
   }
 
   int total_num_requests = 0;
@@ -202,11 +188,6 @@ void FlexFlow::top_level_task(Task const *task,
   std::cout << "----------inference finished--------------" << std::endl;
 
   // free tokenizer space in memory
-  if (model_type == ModelType::LLAMA) {
-    delete sp_tokenizer;
-  } else {
-    delete opt_tokenizer;
-  }
 }
 
 void FlexFlow::register_custom_tasks() {}
diff --git a/inference/models/configs/falcon_7B.json b/inference/models/configs/falcon_7B.json
new file mode 100644
index 0000000000..445da54272
--- /dev/null
+++ b/inference/models/configs/falcon_7B.json
@@ -0,0 +1,11 @@
+{
+    "n_layers": 32,
+    "vocab_size": 65024,
+    "n_heads": 71,
+    "dim": 4544,
+    "multiple_of": 256,
+    "norm_eps": 1e-05,
+    "total_requests": 2560,
+    "hidden_dim": 11008,
+    "incremental_mode": true
+}
\ No newline at end of file
diff --git a/inference/models/falcon.cc b/inference/models/falcon.cc
new file mode 100644
index 0000000000..b137bf6944
--- /dev/null
+++ b/inference/models/falcon.cc
@@ -0,0 +1,178 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "falcon.h"
+
+namespace FlexFlow {
+
+using namespace Legion;
+
+void FALCON::create_falcon_model(FFModel &ff,
+                                 InferenceManager &im,
+                                 std::string const &model_config_file_path,
+                                 std::string const &weight_file_path,
+                                 int num_pipeline_stages,
+                                 InferenceMode mode,
+                                 bool use_full_precision) {
+  Config falcon_config(model_config_file_path);
+  falcon_config.printConfig();
+  //------------------------------compute machine views ------------------
+  int num_devices = ff.config.workersPerNode * ff.config.numNodes;
+  std::vector<MachineView> machine_views;
+  for (int i = 0; i < num_devices; i++) {
+    MachineView view;
+    view.device_type = MachineView::GPU;
+    view.ndims = 1;
+    view.dim[0] = 1;
+    view.stride[0] = 0;
+    view.start_device_id = i;
+    machine_views.push_back(view);
+  }
+
+  std::unordered_map<Tensor, std::vector<MachineView>> mapping;
+  std::unordered_map<std::string, Layer *> weights_layers;
+
+  Tensor input;
+  {
+    assert(falcon_config.max_num_tokens <= BatchConfig::MAX_NUM_TOKENS);
+    int const token_dims[] = {BatchConfig::MAX_NUM_TOKENS, 1};
+    input = ff.create_tensor<2>(token_dims, DT_INT32);
+  }
+  mapping[input].push_back(machine_views[0]);
+
+  Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
+
+  Tensor token;
+  std::vector<int> axes = {0};
+
+  if (use_full_precision) {
+    token = ff.embedding(input,
+                         falcon_config.vocab_size,
+                         falcon_config.dim,
+                         AGGR_MODE_NONE,
+                         DT_FLOAT,
+                         NULL,
+                         embed_init);
+  } else {
+    token = ff.embedding(input,
+                         falcon_config.vocab_size,
+                         falcon_config.dim,
+                         AGGR_MODE_NONE,
+                         DT_HALF,
+                         NULL,
+                         embed_init);
+  }
+
+  Layer *embedding = ff.layers.back();
+  weights_layers.emplace("tok_embeddings_weight", embedding);
+
+  int num_transformer_layers = falcon_config.n_layers;
+  int num_transformer_layers_per_stage =
+      (num_transformer_layers + num_pipeline_stages - 1) / num_pipeline_stages;
+
+  for (int i = 0; i < num_transformer_layers; i++) {
+    // step 1: attention
+    Tensor att_norm = ff.layer_norm(token, axes, true, falcon_config.norm_eps);
+    Layer *attention_norm = ff.layers.back();
+
+    if (i % num_transformer_layers_per_stage == 0) {
+      // Map att_norm to the next GPU
+      // since the size of att_norm is minimum across
+      // all tensors
+      mapping[att_norm].push_back(
+          machine_views[i / num_transformer_layers_per_stage]);
+    }
+
+    weights_layers.emplace("layers_" + std::to_string(i) +
+                               "_input_layernorm_weight",
+                           attention_norm);
+    Tensor mha;
+    switch (mode) {
+      case INC_DECODING_MODE: {
+        mha = ff.inc_multiquery_self_attention(
+            att_norm,
+            falcon_config.dim,
+            falcon_config.n_heads,
+            falcon_config.dim / falcon_config.n_heads,
+            falcon_config.dim / falcon_config.n_heads,
+            0.0f,    /*dropout*/
+            false,   /*bias*/
+            false,   /*add_bias_kv*/
+            false,   /*add_zero_attn*/
+            DT_NONE, /*data_type*/
+            nullptr  /*kernel_initializer*/
+        );
+        break;
+      }
+      default: {
+        assert(false);
+      }
+    }
+    Layer *attention_layer = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) +
+                               "_self_attention_dense_weight",
+                           attention_layer);
+
+    Tensor dense_h_to_4h =
+        ff.dense(att_norm, falcon_config.dim * 4, AC_MODE_NONE, false);
+    Layer *dense_h_to_4h_layer = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) +
+                               "_mlp_dense_h_to_4layers_weight",
+                           dense_h_to_4h_layer);
+    dense_h_to_4h = ff.gelu(dense_h_to_4h);
+    Tensor mlp_output =
+        ff.dense(dense_h_to_4h, falcon_config.dim, AC_MODE_NONE, false);
+    Layer *dense_4h_to_h_layer = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) +
+                               "_mlp_dense_4h_to_layers_weight",
+                           dense_4h_to_h_layer);
+
+    token = ff.add(token, mha);
+    token = ff.add(token, mlp_output);
+  }
+  // final normalization and linear
+  Tensor ln_f = ff.layer_norm(token, axes, true, falcon_config.norm_eps);
+  Layer *ln_f_layer = ff.layers.back();
+  weights_layers.emplace("ln_f_weight", ln_f_layer);
+
+  Tensor lm_head =
+      ff.dense(ln_f, falcon_config.vocab_size, AC_MODE_NONE, false);
+  Layer *lm_head_layer = ff.layers.back();
+  weights_layers.emplace("lm_head_weight", lm_head_layer);
+
+  Tensor output;
+  if (mode == BEAM_SEARCH_MODE) {
+    Tensor softmax = ff.softmax(lm_head, -1);
+    output = ff.beam_top_k(softmax, falcon_config.max_beam_width, false);
+  } else {
+    output = ff.arg_top_k(lm_head, /*k=*/1, false);
+  }
+
+  // Compile the model
+  std::cout << "------start compile ----------" << std::endl;
+  im.compile_model_and_allocate_buffer(&ff, mapping);
+  FileDataLoader fileloader("",
+                            weight_file_path,
+                            falcon_config.n_heads,
+                            falcon_config.dim,
+                            falcon_config.dim / falcon_config.n_heads);
+  fileloader.load_weights(&ff, weights_layers);
+  std::cout << "------load weight finished----------" << std::endl;
+
+  // init operators
+  im.init_operators_inference(&ff);
+}
+
+}; // namespace FlexFlow
diff --git a/inference/models/falcon.h b/inference/models/falcon.h
new file mode 100644
index 0000000000..03cef07e58
--- /dev/null
+++ b/inference/models/falcon.h
@@ -0,0 +1,115 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+#pragma once
+
+#include "file_loader.h"
+#include "flexflow/batch_config.h"
+#include "flexflow/inference.h"
+#include <nlohmann/json.hpp>
+#include <string>
+using json = nlohmann::json;
+
+namespace FlexFlow {
+
+class FALCON {
+public:
+  struct Config {
+    Config(void) {
+      // todo read from config/param file
+      n_layers = 32;
+      vocab_size = 32000;
+      n_heads = 32;
+      dim = 4096;
+      multiple_of = 256;
+      norm_eps = 1e-6;
+      total_requests = 2560;
+      incremental_mode = true;
+      hidden_dim = 11008;
+      max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
+      max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
+      max_beam_width = BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+      max_beam_depth = BeamSearchBatchConfig::MAX_BEAM_DEPTH;
+    }
+
+    Config(std::string config_filepath) {
+      std::ifstream config_file(config_filepath);
+      if (config_file.is_open()) {
+        try {
+          json config_json;
+          config_file >> config_json;
+
+          n_layers = config_json["n_layers"];
+          vocab_size = config_json["vocab_size"];
+          n_heads = config_json["n_heads"];
+          dim = config_json["dim"];
+          multiple_of = config_json["multiple_of"];
+          norm_eps = config_json["norm_eps"];
+          total_requests = config_json["total_requests"];
+          incremental_mode = config_json["incremental_mode"];
+          hidden_dim = config_json["hidden_dim"];
+          head_dim = dim / n_heads;
+          // Override values below
+          /* max_seq_len = config_json["max_seq_len"];
+          max_num_tokens = config_json["max_num_tokens"];
+          max_beam_width = config_json["max_beam_width"];
+          max_beam_depth = config_json["max_beam_depth"];
+          hidden_dim = config_json["hidden_dim"]; */
+          max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
+          max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
+          max_beam_width = BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+          max_beam_depth = BeamSearchBatchConfig::MAX_BEAM_DEPTH;
+        } catch (json::exception const &e) {
+          std::cerr << "Error parsing JSON file: " << e.what() << std::endl;
+          assert(false);
+        }
+      } else {
+        std::cerr << "Error opening JSON file." << std::endl;
+        assert(false);
+      }
+    }
+
+    void printConfig() const {
+      std::cout << "Falcon Config:" << std::endl;
+      std::cout << "n_layers: " << n_layers << std::endl;
+      std::cout << "vocab_size: " << vocab_size << std::endl;
+      std::cout << "n_heads: " << n_heads << std::endl;
+      std::cout << "dim: " << dim << std::endl;
+      std::cout << "multiple_of: " << multiple_of << std::endl;
+      std::cout << "norm_eps: " << norm_eps << std::endl;
+      std::cout << "total_requests: " << total_requests << std::endl;
+      std::cout << "incremental_mode: " << incremental_mode << std::endl;
+      std::cout << "max_seq_len: " << max_seq_len << std::endl;
+      std::cout << "max_num_tokens: " << max_num_tokens << std::endl;
+      std::cout << "max_beam_width: " << max_beam_width << std::endl;
+      std::cout << "max_beam_depth: " << max_beam_depth << std::endl;
+      std::cout << "hidden_dim: " << hidden_dim << std::endl;
+    }
+
+    int n_heads, n_layers, vocab_size, dim, multiple_of, hidden_dim,
+        total_requests, incremental_mode, max_seq_len, max_num_tokens,
+        max_beam_width, max_beam_depth, head_dim;
+    float norm_eps;
+  };
+
+  static void create_falcon_model(FFModel &ff,
+                                  InferenceManager &im,
+                                  std::string const &model_config_file_path,
+                                  std::string const &weight_file_path,
+                                  int num_pipeline_stages,
+                                  InferenceMode mode,
+                                  bool use_full_precision = false);
+};
+
+}; // namespace FlexFlow
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 2e38723036..ae577dd02e 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -14,7 +14,6 @@
  */
 
 #include "flexflow/inference.h"
-#include "flexflow/tokenizers.h"
 #include "models/llama.h"
 #include "models/opt.h"
 #include <filesystem>
@@ -34,8 +33,6 @@ struct FilePaths {
   std::string output_file_path;
 };
 
-enum ModelType { UNKNOWN, LLAMA, OPT };
-
 struct ModelTypes {
   ModelType llm_model_type;
   std::vector<ModelType> ssm_model_types;
@@ -168,31 +165,9 @@ void FlexFlow::top_level_task(Task const *task,
   }
 
   // Create SentencePiece tokenizer or OPT tokenizer
-  SentencePieceTokenizer *sp_tokenizer = nullptr;
-  OptTokenizer *opt_tokenizer = nullptr;
-  if (model_types.llm_model_type == ModelType::LLAMA) {
-    sp_tokenizer = new SentencePieceTokenizer(file_paths.tokenizer_file_path);
-  } else {
-    std::string tokenizer_folder =
-        (!file_paths.tokenizer_file_path.empty() &&
-         file_paths.tokenizer_file_path.back() != '/')
-            ? file_paths.tokenizer_file_path + '/'
-            : file_paths.tokenizer_file_path;
-    std::string vocab_file = tokenizer_folder + "gpt2-vocab.json";
-    std::string merges_file = tokenizer_folder + "gpt2-merges.txt";
-    std::filesystem::path path1(vocab_file);
-    std::filesystem::path path2(merges_file);
-    assert(std::filesystem::exists(path1) &&
-           "Vocab file gpt2-vocab.json does not exist at the specified path");
-    assert(std::filesystem::exists(path2) &&
-           "Merge file gpt2-merges.txt does not exist at the specified path");
-    opt_tokenizer = new OptTokenizer(vocab_file, merges_file);
-  }
-
   InferenceManager im(ffconfig, BatchConfig::MAX_NUM_TOKENS, 1);
-  RequestManager rm((model_types.llm_model_type == ModelType::LLAMA)
-                        ? (Tokenizer *)sp_tokenizer
-                        : (Tokenizer *)opt_tokenizer,
+  RequestManager rm(model_types.llm_model_type,
+                    file_paths.tokenizer_file_path,
                     /*verbose*/ verbose,
                     file_paths.output_file_path);
 
@@ -335,13 +310,6 @@ void FlexFlow::top_level_task(Task const *task,
 
   // float* data
   std::cout << "----------inference finished--------------" << std::endl;
-
-  // free tokenizer space in memory
-  if (model_types.llm_model_type == ModelType::LLAMA) {
-    delete sp_tokenizer;
-  } else {
-    delete opt_tokenizer;
-  }
 }
 
 void FlexFlow::register_custom_tasks() {}
\ No newline at end of file
diff --git a/inference/utils/download_opt_weights.py b/inference/utils/download_opt_weights.py
index de42689202..747d471d1a 100644
--- a/inference/utils/download_opt_weights.py
+++ b/inference/utils/download_opt_weights.py
@@ -56,3 +56,7 @@ def convert_hf_model(model, dst_folder):
 url = 'https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-merges.txt'
 r = requests.get(url)
 open(tokenizer_filepath , 'wb').write(r.content)
+tokenizer_filepath = '../tokenizer/added_tokens.json'
+url = 'https://huggingface.co/truongpdd/vietnews-gpt2/raw/main/added_tokens.json'
+r = requests.get(url)
+open(tokenizer_filepath , 'wb').write(r.content)
\ No newline at end of file
diff --git a/python/Makefile b/python/Makefile
index 10b300841d..ad43bb8890 100644
--- a/python/Makefile
+++ b/python/Makefile
@@ -28,6 +28,8 @@ USE_GPU_REDUCTIONS ?= 0
 FF_USE_NCCL  ?= 0
 # FF_PYTHON_USE_INDEX_LOADER = 1
 
+INSTALL_TOKENIZERS := $(shell $(FF_HOME)/scripts/install_tokenizer.sh)
+
 ifeq ($(strip $(DARWIN)),1)
   PYTHON_EXT := dylib
 else
diff --git a/scripts/install_tokenizer.sh b/scripts/install_tokenizer.sh
new file mode 100755
index 0000000000..4632b7e818
--- /dev/null
+++ b/scripts/install_tokenizer.sh
@@ -0,0 +1,9 @@
+#! /usr/bin/env bash
+set -x
+set -e
+
+# Cd into directory holding this script
+cd "${BASH_SOURCE[0]%/*}"
+cd ../deps/tokenizers-cpp/example
+cmake -D CMAKE_CXX_FLAGS=-fPIC
+make -j
diff --git a/src/ops/beam_topk.cu b/src/ops/beam_topk.cu
index 2c5ceda548..934353d8e8 100644
--- a/src/ops/beam_topk.cu
+++ b/src/ops/beam_topk.cu
@@ -352,12 +352,12 @@ __device__ void mergeBeamShards(int num_shards,
 
       T prob = probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
                      ((next_shard_index % max_heap_size) / k)];
-      if (batch_index == 0) {
-        printf("next_shard_index %d, value %.15f, prob %.15f\n",
-               next_shard_index,
-               entries[next_shard_index].value,
-               prob);
-      }
+      // if (batch_index == 0) {
+      //   printf("next_shard_index %d, value %.15f, prob %.15f\n",
+      //          next_shard_index,
+      //          entries[next_shard_index].value,
+      //          prob);
+      // }
 
       max_heap.replace_root(
           {next_shard_index, entries[next_shard_index].value * prob},
diff --git a/src/ops/inc_multiquery_self_attention.cc b/src/ops/inc_multiquery_self_attention.cc
new file mode 100644
index 0000000000..eae98cd7d5
--- /dev/null
+++ b/src/ops/inc_multiquery_self_attention.cc
@@ -0,0 +1,1434 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/inc_multiquery_self_attention.h"
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/model.h"
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+#include "flexflow/utils/cuda_helper.h"
+#else
+#include "flexflow/utils/hip_helper.h"
+#endif
+#include "flexflow/utils/hash_utils.h"
+#include "legion/legion_utilities.h"
+#ifdef INFERENCE_TESTS
+#include <torch/torch.h>
+using namespace at::indexing;
+#endif
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::ArgumentMap;
+using Legion::Context;
+using Legion::coord_t;
+using Legion::Domain;
+using Legion::FutureMap;
+using Legion::IndexLauncher;
+using Legion::Machine;
+using Legion::Memory;
+using Legion::PhysicalRegion;
+using Legion::Predicate;
+using Legion::Rect;
+using Legion::RegionRequirement;
+using Legion::Runtime;
+using Legion::Task;
+using Legion::TaskArgument;
+using Legion::TaskLauncher;
+using PCG::Node;
+
+LegionRuntime::Logger::Category log_inc_mqa("IncrementalMQA");
+
+bool IncMultiQuerySelfAttentionParams::is_valid(
+    ParallelTensorShape const &input) const {
+  bool is_valid = input.is_valid();
+  return is_valid;
+}
+
+Tensor FFModel::inc_multiquery_self_attention(const Tensor input,
+                                              int embed_dim,
+                                              int num_heads,
+                                              int kdim,
+                                              int vdim,
+                                              float dropout,
+                                              bool bias,
+                                              bool add_bias_kv,
+                                              bool add_zero_attn,
+                                              DataType data_type,
+                                              Initializer *kernel_initializer,
+                                              char const *name) {
+  if (data_type == DT_NONE) {
+    data_type = input->data_type;
+  }
+  Layer *li = nullptr;
+  int weight_num = bias ? 2 : 1;
+  if (data_type != input->data_type) {
+    Tensor casted_input = cast(input, data_type, "type cast for IncMQA");
+    li = new Layer(this,
+                   OP_INC_MULTIQUERY_SELF_ATTENTION,
+                   data_type,
+                   name,
+                   1 /*inputs*/,
+                   weight_num /*weights*/,
+                   1 /*outputs*/,
+                   casted_input);
+  } else {
+    li = new Layer(this,
+                   OP_INC_MULTIQUERY_SELF_ATTENTION,
+                   data_type,
+                   name,
+                   1 /*inputs*/,
+                   weight_num /*weights*/,
+                   1 /*outputs*/,
+                   input);
+  }
+  {
+    int numdims = input->num_dims;
+    int dims[MAX_TENSOR_DIM];
+    for (int i = 0; i < numdims; i++) {
+      dims[i] = input->dims[i];
+    }
+    dims[0] = embed_dim;
+    li->outputs[0] = create_tensor_legion_ordering(
+        numdims, dims, data_type, li, 0, true /*create_grad*/);
+  }
+  {
+    // Compute weight size
+    int qProjSize = kdim, kProjSize = kdim, vProjSize = kdim,
+        oProjSize = embed_dim;
+    // int qSize = input->dims[0], kSize = input->dims[0], vSize =
+    // input->dims[0]; int qParas = qSize; int kParas = kProjSize; int vParas =
+    // vProjSize; int oParas = oProjSize; int dims[2] = {qParas + kParas +
+    // vParas + oParas, num_heads};
+
+    int dims[2] = {embed_dim + kProjSize + vProjSize + oProjSize, embed_dim};
+
+    li->weights[0] = create_weight_legion_ordering(2,
+                                                   dims,
+                                                   data_type,
+                                                   li,
+                                                   true /*create_grad*/,
+                                                   kernel_initializer,
+                                                   CHOSEN_SYNC_TYPE);
+  }
+  li->data_type = data_type;
+  li->add_int_property("embed_dim", embed_dim);
+  li->add_int_property("num_heads", num_heads);
+  li->add_int_property("kdim", kdim);
+  li->add_int_property("vdim", vdim);
+  li->add_int_property("bias", bias);
+  li->add_int_property("add_bias_kv", add_bias_kv);
+  li->add_int_property("add_zero_attn", add_zero_attn);
+  li->add_float_property("dropout", dropout);
+  layers.push_back(li);
+
+  return li->outputs[0];
+}
+
+Op *IncMultiQuerySelfAttention::create_operator_from_layer(
+    FFModel &model,
+    Layer const *layer,
+    std::vector<ParallelTensor> const &inputs) {
+  long long value;
+  layer->get_int_property("embed_dim", value);
+  int embed_dim = value;
+  layer->get_int_property("num_heads", value);
+  int num_heads = value;
+  layer->get_int_property("kdim", value);
+  int kdim = value;
+  layer->get_int_property("vdim", value);
+  int vdim = value;
+  float dropout;
+  layer->get_float_property("dropout", dropout);
+  layer->get_int_property("bias", value);
+  bool bias = (bool)value;
+  layer->get_int_property("add_bias_kv", value);
+  bool add_bias_kv = (bool)value;
+  layer->get_int_property("add_zero_attn", value);
+  bool add_zero_attn = (bool)value;
+  return new IncMultiQuerySelfAttention(model,
+                                        layer->layer_guid,
+                                        inputs[0],
+                                        embed_dim,
+                                        num_heads,
+                                        kdim,
+                                        vdim,
+                                        dropout,
+                                        bias,
+                                        add_bias_kv,
+                                        add_zero_attn,
+                                        true /*allocate_weights*/,
+                                        layer->name);
+}
+
+IncMultiQuerySelfAttention::IncMultiQuerySelfAttention(
+    FFModel &model,
+    LayerID const &_layer_guid,
+    const ParallelTensor _input,
+    int _embed_dim,
+    int _num_heads,
+    int _kdim,
+    int _vdim,
+    float _dropout,
+    bool _bias,
+    bool _add_bias_kv,
+    bool _add_zero_attn,
+    bool allocate_weights,
+    char const *name)
+    // Initializer* _bias_initializer)
+    : Op(model,
+         OP_INC_MULTIQUERY_SELF_ATTENTION,
+         _input->data_type,
+         name,
+         1 /*inputs*/,
+         (_bias ? 2 : 1), /*weights*/
+         1 /*outputs*/,
+         _input),
+      num_heads(_num_heads), dropout(_dropout), bias(_bias),
+      add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      qSize(_input->dims[0].size), kSize(_input->dims[0].size),
+      vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
+      vProjSize(_vdim), oProjSize(_embed_dim), embed_dim(_embed_dim),
+      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size) {
+  // overwrite layer_guid
+  layer_guid = _layer_guid;
+
+  numOutputs = 1;
+  int numdim = _input->num_dims;
+  ParallelDim dims[MAX_TENSOR_DIM];
+  for (int i = 0; i < numdim; i++) {
+    dims[i] = _input->dims[i];
+  }
+  dims[0].size = _embed_dim;
+  // Currently require no parallelism along this dim
+  assert(dims[0].degree == 1);
+  if (allocate_weights) {
+    // Create weight tensor
+    int num_dims = inputs[0]->num_dims;
+    // Compute weight size
+    // int qParas = this->qProjSize * this->qSize;
+    // int kParas = this->kProjSize * this->kSize;
+    // int vParas = this->vProjSize * this->vSize;
+    // int oParas =
+    //     this->oProjSize * (this->vProjSize > 0 ? this->vProjSize :
+    //     this->vSize);
+    ParallelDim dims[3];
+    dims[0] = inputs[0]->dims[num_dims - 2];
+    dims[0].size = dims[0].degree;
+    dims[1] = inputs[0]->dims[num_dims - 1];
+    dims[1].size = this->embed_dim;
+    dims[2].size =
+        this->embed_dim + this->kProjSize + this->vProjSize + this->oProjSize;
+    dims[2].degree = 1;
+    dims[2].parallel_idx = -1;
+    int seed = std::rand();
+    Initializer *initializer = new GlorotUniform(seed);
+#ifdef USE_NCCL
+    ParameterSyncType comm_type = ParameterSyncType::NCCL;
+#else
+    ParameterSyncType comm_type = ParameterSyncType::PS;
+#endif
+    weights[0] = model.create_parallel_weight<3>(dims,
+                                                 this->data_type,
+                                                 nullptr /*owner_op*/,
+                                                 true /*create_grad*/,
+                                                 initializer,
+                                                 comm_type);
+  }
+
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      _input->num_dims, dims, this->data_type, this);
+  /* for (int i = 0; i < numdim; i++) { */
+  /*   register_output_input_parallel_dims(outputs[0], i, inputs[0], i); */
+  /* } */
+  /* // Check correctness */
+  /* assert(check_output_input_weight_parallel_dims()); */
+}
+
+IncMultiQuerySelfAttention::IncMultiQuerySelfAttention(
+    FFModel &model,
+    const ParallelTensor _input,
+    const ParallelTensor _weight,
+    int _embed_dim,
+    int _num_heads,
+    int _kdim,
+    int _vdim,
+    float _dropout,
+    bool _bias,
+    bool _add_bias_kv,
+    bool _add_zero_attn,
+    bool allocate_weights,
+    char const *name)
+    // Initializer* _bias_initializer)
+    : Op(model,
+         OP_INC_MULTIQUERY_SELF_ATTENTION,
+         _input->data_type,
+         name,
+         1 /*inputs*/,
+         (_bias ? 2 : 1), /*weights*/
+         1 /*outputs*/,
+         _input,
+         _weight),
+      num_heads(_num_heads), dropout(_dropout), bias(_bias),
+      add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      qSize(_input->dims[0].size), kSize(_input->dims[0].size),
+      vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
+      vProjSize(_vdim), oProjSize(_embed_dim), embed_dim(_embed_dim),
+      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size)
+// bias_initializer(_bias_initializer)
+{
+  numOutputs = 1;
+  int numdim = _input->num_dims;
+  ParallelDim dims[MAX_TENSOR_DIM];
+  for (int i = 0; i < numdim; i++) {
+    dims[i] = _input->dims[i];
+  }
+  dims[0].size = _embed_dim;
+  // Currently require no parallelism along this dim
+  assert(dims[0].degree == 1);
+  if (allocate_weights) {
+    // Create weight tensor
+    int num_dims = inputs[0]->num_dims;
+    // Compute weight size
+    // int qParas = this->qProjSize * this->qSize;
+    // int kParas = this->kProjSize * this->kSize;
+    // int vParas = this->vProjSize * this->vSize;
+    // int oParas =
+    //     this->oProjSize * (this->vProjSize > 0 ? this->vProjSize :
+    //     this->vSize);
+    ParallelDim dims[3];
+    dims[0] = inputs[0]->dims[num_dims - 2];
+    dims[0].size = dims[0].degree;
+    dims[1] = inputs[0]->dims[num_dims - 1];
+    dims[1].size = this->embed_dim;
+    dims[2].size =
+        this->embed_dim + this->kProjSize + this->vProjSize + this->oProjSize;
+    int seed = std::rand();
+    Initializer *initializer = new GlorotUniform(seed);
+#ifdef USE_NCCL
+    ParameterSyncType comm_type = ParameterSyncType::NCCL;
+#else
+    ParameterSyncType comm_type = ParameterSyncType::PS;
+#endif
+    weights[0] = model.create_parallel_weight<3>(dims,
+                                                 this->data_type,
+                                                 NULL /*owner_op*/,
+                                                 true /*create_grad*/,
+                                                 initializer,
+                                                 comm_type);
+  }
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      _input->num_dims, dims, this->data_type, this);
+
+  /* for (int i = 0; i < numdim; i++) { */
+  /*   register_output_input_parallel_dims(outputs[0], i, inputs[0], i); */
+  /* } */
+  /* register_output_weight_parallel_dims(outputs[0], numdim-1, _weight, 1); */
+  /* register_output_weight_parallel_dims(outputs[0], numdim-2, _weight, 2); */
+  // Check correctness
+  /* assert(check_output_input_weight_parallel_dims()); */
+}
+
+IncMultiQuerySelfAttention::IncMultiQuerySelfAttention(
+    FFModel &model,
+    IncMultiQuerySelfAttention const &other,
+    const ParallelTensor input,
+    bool allocate_weights)
+    : IncMultiQuerySelfAttention(model,
+                                 other.layer_guid,
+                                 input,
+                                 other.oProjSize,
+                                 other.num_heads,
+                                 other.qProjSize,
+                                 other.vProjSize,
+                                 other.dropout,
+                                 other.bias,
+                                 other.add_bias_kv,
+                                 other.add_zero_attn,
+                                 allocate_weights,
+                                 other.name) {}
+
+IncMultiQuerySelfAttention::IncMultiQuerySelfAttention(
+    FFModel &model,
+    IncMultiQuerySelfAttentionParams const &params,
+    ParallelTensor const &input,
+    bool allocate_weights,
+    char const *name)
+    : IncMultiQuerySelfAttention(model,
+                                 params.layer_guid,
+                                 input,
+                                 params.embed_dim,
+                                 params.num_heads,
+                                 params.kdim,
+                                 params.vdim,
+                                 params.dropout,
+                                 params.bias,
+                                 params.add_bias_kv,
+                                 params.add_zero_attn,
+                                 allocate_weights,
+                                 name) {}
+
+void IncMultiQuerySelfAttention::init_inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher launcher(INC_MULTIQUERY_SELF_ATTENTION_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(IncMultiQuerySelfAttention)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
+}
+
+void IncMultiQuerySelfAttention::init(FFModel const &ff) {
+
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(INC_MULTIQUERY_SELF_ATTENTION_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(IncMultiQuerySelfAttention)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
+/*
+  regions[0](I): input
+  regions[1](I): weight
+  regions[2](O): output
+*/
+OpMeta *IncMultiQuerySelfAttention::init_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  IncMultiQuerySelfAttention const *attn =
+      (IncMultiQuerySelfAttention *)task->args;
+  FFHandler handle = *((FFHandler const *)task->local_args);
+  GenericTensorAccessorR input =
+      helperGetGenericTensorAccessorRO(attn->inputs[0]->data_type,
+                                       regions[0],
+                                       task->regions[0],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorR weight =
+      helperGetGenericTensorAccessorRO(attn->weights[0]->data_type,
+                                       regions[1],
+                                       task->regions[1],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorW output =
+      helperGetGenericTensorAccessorWO(attn->outputs[0]->data_type,
+                                       regions[2],
+                                       task->regions[2],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+
+  int num_samples = input.domain.hi()[2] - input.domain.lo()[2] + 1;
+  // assert(attn->qoSeqLength == input.domain.hi()[1] - input.domain.lo()[1] +
+  // 1); assert(attn->kvSeqLength == input.domain.hi()[1] - input.domain.lo()[1]
+  // + 1);
+  int num_heads = (weight.domain.hi()[1] - weight.domain.lo()[1] + 1);
+  // assert(attn->oProjSize == output.domain.hi()[0] - output.domain.lo()[0] +
+  // 1);
+
+  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                       .only_kind(Memory::GPU_FB_MEM)
+                       .best_affinity_to(task->target_proc)
+                       .first();
+  IncMultiQuerySelfAttentionMeta *m = new IncMultiQuerySelfAttentionMeta(
+      handle, attn, weight, gpu_mem, num_samples);
+
+  m->profiling = attn->profiling;
+  assert(weight.domain.get_volume() * data_type_size(weight.data_type) ==
+         m->weightSize);
+  return m;
+}
+
+void IncMultiQuerySelfAttention::forward(FFModel const &ff) {
+  // IncMultiQuerySelfAttention doesn't support forward
+  assert(false);
+}
+
+FutureMap IncMultiQuerySelfAttention::inference(
+    FFModel const &ff,
+    BatchConfig const &bc,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+  int idx = 0;
+  log_inc_mqa.debug("BatchConfig, num_tokens: %d, num_requests: %d",
+                    bc.num_tokens,
+                    bc.num_active_requests());
+  IndexLauncher launcher(INC_MULTIQUERY_SELF_ATTENTION_INF_TASK_ID,
+                         parallel_is,
+                         TaskArgument(&bc, sizeof(BatchConfig)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(idx++, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(idx++, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(idx++, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+/*
+  regions[0](I): input
+  regions[3](I): weight
+  regions[4](O): output
+*/
+void IncMultiQuerySelfAttention::inference_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+
+  assert(task->regions.size() == regions.size());
+
+  BatchConfig const *bc = (BatchConfig *)task->args;
+  IncMultiQuerySelfAttentionMeta const *m =
+      *((IncMultiQuerySelfAttentionMeta **)task->local_args);
+
+  assert(regions.size() == 3);
+
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
+      m->weight_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+
+  Domain input_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  Domain weight_domain = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+  Domain output_domain = runtime->get_index_space_domain(
+      ctx, task->regions[2].region.get_index_space());
+
+  assert(input_domain.get_dim() == 4);
+  assert(weight_domain.get_dim() == 3);
+  assert(output_domain.get_dim() == 4);
+
+  IncMultiQuerySelfAttention::inference_kernel_wrapper(
+      m, bc, input, weight, output);
+#ifdef INFERENCE_TESTS
+  printf("Checking IncMultiQuerySelfAttention computations...\n");
+
+  // =============================================================================
+  //  Define helper functions to handle row-major arrays
+  // =============================================================================
+
+  auto set_value_row_major = [](float *arr,
+                                std::vector<int> const &shape,
+                                std::vector<int> const &indices,
+                                float value) -> void {
+    int offset = 0;
+    for (int i = 0; i < shape.size(); i++) {
+      int index = indices[i];
+      int stride = 1;
+      for (int j = i + 1; j < shape.size(); j++) {
+        stride *= shape[j];
+      }
+      offset += index * stride;
+    }
+    *(arr + offset) = value;
+  };
+
+  // =============================================================================
+  //  Load input/output/weights and parse general configs
+  // =============================================================================
+
+  float *input_cpu =
+      download_tensor<float>(input.get_float_ptr(), input_domain.get_volume());
+  assert(input_cpu != nullptr);
+  float *weight_cpu = download_tensor<float>(weight.get_float_ptr(),
+                                             weight_domain.get_volume());
+  assert(weight_cpu != nullptr);
+  float *output_cpu = download_tensor<float>(output.get_float_ptr(),
+                                             output_domain.get_volume());
+  assert(output_cpu != nullptr);
+
+  // Input tensor dimensions
+  coord_t data_dim = input_domain.hi()[0] - input_domain.lo()[0] + 1;
+  coord_t max_sequence_length = input_domain.hi()[1] - input_domain.lo()[1] + 1;
+  coord_t batch_size = input_domain.hi()[2] - input_domain.lo()[2] + 1;
+  coord_t replica_dim = input_domain.hi()[3] - input_domain.lo()[3] + 1;
+  assert(replica_dim == 1);
+
+  size_t effective_batch_size = max_sequence_length * batch_size;
+  float inputs_arr[data_dim][effective_batch_size] = {0};
+  for (size_t i = 0; i < data_dim * bc->num_active_tokens(); i++) {
+    size_t data_index = i % data_dim;
+    size_t token_index = i / data_dim;
+    assert(data_index < data_dim);
+    assert(token_index < effective_batch_size);
+    inputs_arr[data_index][token_index] = input_cpu[i];
+  }
+  torch::Tensor torch_input = torch::from_blob(
+      inputs_arr, {data_dim, (long int)effective_batch_size}, torch::kFloat32);
+
+  // Weight tensor dimensions
+  coord_t all_weight_params = weight_domain.hi()[0] - weight_domain.lo()[0] + 1;
+  coord_t num_heads = weight_domain.hi()[1] - weight_domain.lo()[1] + 1;
+  replica_dim = weight_domain.hi()[2] - weight_domain.lo()[2] + 1;
+  size_t qParas = m->qProjSize * m->qSize;
+  size_t kParas = m->kProjSize * m->kSize;
+  size_t vParas = m->vProjSize * m->vSize;
+  size_t oParas = m->oProjSize * (m->vProjSize > 0 ? m->vProjSize : m->vSize);
+
+  assert(all_weight_params == qParas + kParas + vParas + oParas);
+  assert(num_heads == m->num_heads);
+  assert(replica_dim == 1);
+
+  assert(m->qSize == m->kSize && m->kSize == m->vSize);
+  // printf("m->qSize: %i\n", m->qSize);
+  //  keep things simple for now
+  assert(m->qProjSize == m->kProjSize && m->kProjSize == m->vProjSize);
+  long int proj_sum = m->qProjSize + m->kProjSize + m->vProjSize;
+  // load weight manually because Torch can't easily read a tensor serialized in
+  // column-major order.
+
+  // printf("m->kProjSize: %i, BatchConfig::MAX_NUM_TOKENS: %i, "
+  //     "bc->num_active_tokens(): %i, num_heads: %lli,
+  //     BatchConfig::MAX_NUM_REQUESTS: %i, " "bc->num_active_requests(): %i\n",
+  //     m->kProjSize, BatchConfig::MAX_NUM_TOKENS, bc->num_active_tokens(),
+  //     num_heads, BatchConfig::MAX_NUM_REQUESTS, bc->num_active_requests());
+  // for (int t=0; t < bc->num_active_tokens(); t++) {
+  //   printf("token %i has request_index: %li and token_position: %li\n",
+  //   t, bc->token2ids.token_indexes[t].request_index,
+  //   bc->token2ids.token_indexes[t].token_position);
+  // }
+
+  // =============================================================================
+  //  Load the output tensor (with CUDA results), and create a Torch tensor
+  // =============================================================================
+
+  float output_cuda[m->oProjSize][effective_batch_size] = {0};
+  for (int i = 0; i < m->oProjSize * effective_batch_size; i++) {
+    int row_idx = i % m->oProjSize;
+    int col_idx = i / m->oProjSize;
+    assert(row_idx < m->oProjSize && col_idx < effective_batch_size);
+    output_cuda[row_idx][col_idx] = output_cpu[i];
+  }
+  torch::Tensor torch_out_cuda =
+      torch::from_blob(output_cuda,
+                       {m->oProjSize, (int64_t)effective_batch_size},
+                       torch::kFloat32);
+
+  // =============================================================================
+  //  Load the Q/K/V projection weights, and create a Torch tensor
+  // =============================================================================
+  std::vector<int> w_qkv_shape = {m->qSize, m->qProjSize, 3, (int)num_heads};
+  float *w_qkv =
+      (float *)calloc(m->qSize * m->qProjSize * 3 * num_heads, sizeof(float));
+  assert(w_qkv[0] == 0.0f);
+
+  for (int h = 0; h < num_heads; h++) {
+    for (size_t i = 0; i < m->qProjSize * m->qSize; i++) {
+      int row_index = i % m->qSize;
+      int column_index = i / m->qSize;
+      // Q
+      set_value_row_major(w_qkv,
+                          w_qkv_shape,
+                          {row_index, column_index, 0, h},
+                          weight_cpu[all_weight_params * h +
+                                     m->qSize * column_index + row_index]);
+      // K
+      set_value_row_major(
+          w_qkv,
+          w_qkv_shape,
+          {row_index, column_index, 1, h},
+          weight_cpu[all_weight_params * h + m->qProjSize * m->qSize +
+                     m->qSize * column_index + row_index]);
+      // V
+      set_value_row_major(
+          w_qkv,
+          w_qkv_shape,
+          {row_index, column_index, 2, h},
+          weight_cpu[all_weight_params * h + 2 * m->qProjSize * m->qSize +
+                     m->qSize * column_index + row_index]);
+    }
+  }
+  // convert weights to torch tensor
+  torch::Tensor torch_w_qkv = torch::from_blob(
+      w_qkv, {m->qSize, m->qProjSize, 3, (int)num_heads}, torch::kFloat32);
+
+  /* std::cout << "Torch projection weights size: " << torch_w_qkv.sizes()
+            << std::endl;
+  std::cout << "Torch input size: " << torch_input.sizes() << std::endl;
+  std::cout << "Number of active tokens: " << bc->num_active_tokens()
+            << std::endl; */
+  // std::cout << "torch_w_qkv:" << std::endl << torch_w_qkv << std::endl;
+
+  // =============================================================================
+  //  Compute the Q/K/V projections, and compare the results with CUDA
+  // =============================================================================
+
+  //  ----------------------- C++ computations & checks ------------------------
+  torch::Tensor qkv_projs = torch::einsum(
+      "ijkl,im->jmkl",
+      {torch_w_qkv,
+       torch_input.index({Slice(), Slice(0, bc->num_active_tokens())})});
+  // std::cout << "qkv_projs size: " << qkv_projs.sizes() << std::endl;
+  assert(qkv_projs.sizes()[0] == m->qProjSize);
+  assert(qkv_projs.sizes()[1] == bc->num_active_tokens() &&
+         qkv_projs.sizes()[1] <= effective_batch_size);
+  assert(qkv_projs.sizes()[2] == 3);
+  assert(qkv_projs.sizes()[3] == num_heads);
+  free(w_qkv);
+
+  //  ----------------------- Loading CUDA results for this step ---------------
+  float *QKVProjArray_cpu = download_tensor<float>(m->devQKVProjArray,
+                                                   BatchConfig::MAX_NUM_TOKENS *
+                                                       proj_sum * m->num_heads);
+  assert(QKVProjArray_cpu != nullptr);
+
+  std::vector<int> QKVProjArray_converted_shape = {
+      m->qProjSize, bc->num_active_tokens(), 3, (int)num_heads};
+  float *QKVProjArray_converted = (float *)calloc(
+      m->qProjSize * bc->num_active_tokens() * 3 * num_heads, sizeof(float));
+
+  // skip over padding at the end of QKVProjArray_cpu
+  // convert from column order to 3D matrix because torch cannot automatically
+  // import matrices flattened in column order
+  for (size_t i = 0; i < proj_sum * bc->num_active_tokens() * num_heads; i++) {
+    int proj_size_index = i % m->qProjSize;
+    int head_index = i / (proj_sum * bc->num_active_tokens());
+    int token_index =
+        ((i - head_index * proj_sum * bc->num_active_tokens()) / m->qProjSize) %
+        bc->num_active_tokens();
+    int qkv_offset = (i - head_index * proj_sum * bc->num_active_tokens()) /
+                     (m->qProjSize * bc->num_active_tokens());
+    assert(proj_size_index < proj_sum);
+    assert(head_index < num_heads);
+    assert(token_index < bc->num_active_tokens());
+    assert(qkv_offset < 3);
+    set_value_row_major(QKVProjArray_converted,
+                        QKVProjArray_converted_shape,
+                        {proj_size_index, token_index, qkv_offset, head_index},
+                        QKVProjArray_cpu[i]);
+  }
+  torch::Tensor QKVProjArray_torch =
+      torch::from_blob(QKVProjArray_converted,
+                       {m->qProjSize, bc->num_active_tokens(), 3, num_heads},
+                       torch::kFloat32);
+
+  //  ----------------------- Comparing C++ & CUDA results ---------------------
+  // std::cout << "QKVProjArray_torch" << std::endl;
+  // for (int i=0; i<num_heads; i++) {
+  //   for (int j=0; j<3; j++) {
+  //     std::cout << QKVProjArray_torch.index({Slice(), Slice(), j, i}) <<
+  //     std::endl;
+  //   }
+  // }
+  // std::cout << "qkv_projs" << std::endl;
+  // for (int i=0; i<num_heads; i++) {
+  //   for (int j=0; j<3; j++) {
+  //     std::cout << qkv_projs.index({Slice(), Slice(), j, i}) << std::endl;
+  //   }
+  // }
+  assert(torch::allclose(QKVProjArray_torch, qkv_projs, 1e-05, 1e-05));
+  free(QKVProjArray_converted);
+
+  // =============================================================================
+  //  Store the K/V projections into the cache
+  // =============================================================================
+
+  //  ----------------------- C++ operations & checks --------------------------
+  // Store projections into k/v cache arrays
+  for (size_t h = 0; h < num_heads; h++) {
+    for (size_t t = 0; t < bc->num_active_tokens(); t++) {
+      for (size_t d = 0; d < m->kProjSize; d++) {
+        size_t kcache_idx =
+            d * MAX_SEQ_LEN * m->num_heads * BatchConfig::MAX_NUM_REQUESTS +
+            bc->tokensInfo[t].abs_depth_in_request * m->num_heads *
+                BatchConfig::MAX_NUM_REQUESTS +
+            h * BatchConfig::MAX_NUM_REQUESTS + bc->tokensInfo[t].request_index;
+        m->kcache[kcache_idx] =
+            qkv_projs.index({(int64_t)d, (int64_t)t, 1, (int64_t)h})
+                .item<float>();
+      }
+      for (size_t d = 0; d < m->vProjSize; d++) {
+        size_t vcache_idx =
+            d * MAX_SEQ_LEN * m->num_heads * BatchConfig::MAX_NUM_REQUESTS +
+            bc->tokensInfo[t].abs_depth_in_request * m->num_heads *
+                BatchConfig::MAX_NUM_REQUESTS +
+            h * BatchConfig::MAX_NUM_REQUESTS + bc->tokensInfo[t].request_index;
+        m->vcache[vcache_idx] =
+            qkv_projs.index({(int64_t)d, (int64_t)t, 2, (int64_t)h})
+                .item<float>();
+      }
+    }
+  }
+  // Create torch tensors from the arrays
+  torch::Tensor K_t = torch::from_blob(
+      m->kcache,
+      {m->kProjSize, MAX_SEQ_LEN, num_heads, BatchConfig::MAX_NUM_REQUESTS},
+      torch::kFloat32);
+  torch::Tensor V_t = torch::from_blob(
+      m->vcache,
+      {m->vProjSize, MAX_SEQ_LEN, num_heads, BatchConfig::MAX_NUM_REQUESTS},
+      torch::kFloat32);
+
+  // Compute useful indices
+  std::vector<size_t> req_idxs;
+  std::vector<size_t> r_first_idx;
+  std::vector<size_t> r_num_tokens;
+  for (size_t t = 0; t < bc->num_active_tokens(); t++) {
+    size_t rid = bc->tokensInfo[t].request_index;
+    if (req_idxs.size() == 0 || req_idxs[req_idxs.size() - 1] != rid) {
+      req_idxs.push_back(rid);
+      r_first_idx.push_back(t);
+      r_num_tokens.push_back(1);
+    } else {
+      r_num_tokens[r_num_tokens.size() - 1]++;
+    }
+    assert(req_idxs.size() == r_first_idx.size() &&
+           r_first_idx.size() == r_num_tokens.size());
+  }
+  assert(req_idxs.size() == bc->num_active_requests());
+  assert(std::accumulate(r_num_tokens.begin(),
+                         r_num_tokens.end(),
+                         decltype(r_num_tokens)::value_type(0)) ==
+         bc->num_active_tokens());
+
+  //  ----------------------- Loading CUDA results for this step ---------------
+  float *keyCache_cpu =
+      download_tensor<float>(m->keyCache,
+                             m->num_heads * m->kProjSize *
+                                 BatchConfig::MAX_NUM_REQUESTS * MAX_SEQ_LEN);
+  float *valueCache_cpu =
+      download_tensor<float>(m->valueCache,
+                             m->num_heads * m->vProjSize *
+                                 BatchConfig::MAX_NUM_REQUESTS * MAX_SEQ_LEN);
+  assert(keyCache_cpu != nullptr);
+  assert(valueCache_cpu != nullptr);
+
+  float *kcache_cuda = (float *)calloc(
+      m->kProjSize * MAX_SEQ_LEN * m->num_heads * BatchConfig::MAX_NUM_REQUESTS,
+      sizeof(float));
+  float *vcache_cuda = (float *)calloc(
+      m->vProjSize * MAX_SEQ_LEN * m->num_heads * BatchConfig::MAX_NUM_REQUESTS,
+      sizeof(float));
+  int index = 0;
+  for (int i = 0; i < m->kProjSize; i++) {
+    for (int j = 0; j < MAX_SEQ_LEN; j++) {
+      for (int k = 0; k < m->num_heads; k++) {
+        for (int l = 0; l < BatchConfig::MAX_NUM_REQUESTS; l++) {
+          int col_major_index = l * m->kProjSize * MAX_SEQ_LEN * m->num_heads +
+                                k * m->kProjSize * MAX_SEQ_LEN +
+                                j * m->kProjSize + i;
+          kcache_cuda[index++] = keyCache_cpu[col_major_index];
+        }
+      }
+    }
+  }
+  index = 0;
+  for (int i = 0; i < m->vProjSize; i++) {
+    for (int j = 0; j < MAX_SEQ_LEN; j++) {
+      for (int k = 0; k < m->num_heads; k++) {
+        for (int l = 0; l < BatchConfig::MAX_NUM_REQUESTS; l++) {
+          int col_major_index = l * m->vProjSize * MAX_SEQ_LEN * m->num_heads +
+                                k * m->vProjSize * MAX_SEQ_LEN +
+                                j * m->vProjSize + i;
+          vcache_cuda[index++] = valueCache_cpu[col_major_index];
+        }
+      }
+    }
+  }
+  torch::Tensor K_t_cuda = torch::from_blob(
+      kcache_cuda,
+      {m->kProjSize, MAX_SEQ_LEN, num_heads, BatchConfig::MAX_NUM_REQUESTS},
+      torch::kFloat32);
+  torch::Tensor V_t_cuda = torch::from_blob(
+      vcache_cuda,
+      {m->vProjSize, MAX_SEQ_LEN, num_heads, BatchConfig::MAX_NUM_REQUESTS},
+      torch::kFloat32);
+
+  //  ----------------------- Comparing C++ & CUDA results ---------------------
+
+  // std::cout << "kcache differences:" << std::endl;
+  // for (int i=0; i < bc->num_active_requests() + 1; i++) {
+  //   for (int j=0; j < num_heads; j++) {
+  //     for (int l=0; l < m->kProjSize; l++) {
+  //       for (int k=0; k < MAX_SEQ_LEN; k++) {
+  //         size_t kcache_idx =
+  //           l * MAX_SEQ_LEN * num_heads * BatchConfig::MAX_NUM_REQUESTS +
+  //           k * num_heads * BatchConfig::MAX_NUM_REQUESTS +
+  //           j * BatchConfig::MAX_NUM_REQUESTS +
+  //           i;
+  //           if ( abs(m->kcache[kcache_idx] - keyCache_cpu[
+  //               i * m->kProjSize * MAX_SEQ_LEN * num_heads +
+  //               j * m->kProjSize * MAX_SEQ_LEN +
+  //               k * m->kProjSize +
+  //               l
+  //           ]) > 0.00001) {
+  //             printf("req: %i (rid: %i), head: %i, data_dim: %i, token_pos:
+  //             %i\n",
+  //                   i, req_idxs[i], j, l, k);
+  //           }
+  //       }
+  //     }
+  //   }
+  // }
+
+  //  std::cout << "keyCache from CUDA:" << std::endl;
+  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
+  //    for (int j=0; j<num_heads; j++) {
+  //     for (int l=0; l<m->kProjSize; l++) {
+  //       for (int k=0; k< MAX_SEQ_LEN; k++) {
+  //         printf("%f ",
+  //           keyCache_cpu[i * m->kProjSize * MAX_SEQ_LEN * num_heads +
+  //               j * m->kProjSize * MAX_SEQ_LEN +
+  //               k * m->kProjSize +
+  //               l
+  //         ]);
+  //       }
+  //       printf("\n");
+  //     }
+  //     printf("\n");
+  //    }
+  //    printf("\n");
+  //  }
+
+  //  std::cout << "valueCache from CUDA:" << std::endl;
+  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
+  //    for (int j=0; j<num_heads; j++) {
+  //       for (int l=0; l<m->vProjSize; l++) {
+  //         for (int k=0; k< MAX_SEQ_LEN; k++) {
+  //           printf("%f ",
+  //             valueCache_cpu[
+  //                 i * m->vProjSize * MAX_SEQ_LEN * num_heads +
+  //                 j * m->vProjSize * MAX_SEQ_LEN +
+  //                 k * m->vProjSize +
+  //             l]);
+  //         }
+  //         printf("\n");
+  //       }
+  //       printf("\n");
+  //    }
+  //    printf("\n");
+  //  }
+
+  //  printf("\n");
+
+  //  std::cout << "C++ kcache:" << std::endl;
+  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
+  //    for (int j=0; j < num_heads; j++) {
+  //       for (int l=0; l < m->kProjSize; l++) {
+  //         for (int k=0; k < MAX_SEQ_LEN; k++) {
+  //           size_t kcache_idx =
+  //             l * MAX_SEQ_LEN * num_heads * BatchConfig::MAX_NUM_REQUESTS +
+  //             k * num_heads * BatchConfig::MAX_NUM_REQUESTS +
+  //             j * BatchConfig::MAX_NUM_REQUESTS +
+  //             i;
+  //           printf("%f ", m->kcache[kcache_idx]);
+  //         }
+  //         printf("\n");
+  //       }
+  //       printf("\n");
+  //    }
+  //    printf("\n");
+  //  }
+
+  //  std::cout << "C++ vcache:" << std::endl;
+  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
+  //    for (int j=0; j<num_heads; j++) {
+  //       for (int l=0; l<m->vProjSize; l++) {
+  //         for (int k=0; k< MAX_SEQ_LEN; k++) {
+  //             size_t vcache_idx =
+  //               l * MAX_SEQ_LEN * num_heads * BatchConfig::MAX_NUM_REQUESTS +
+  //               k * num_heads * BatchConfig::MAX_NUM_REQUESTS +
+  //               j * BatchConfig::MAX_NUM_REQUESTS +
+  //               i;
+  //             printf("%f ", m->vcache[vcache_idx]);
+  //         }
+  //         printf("\n");
+  //       }
+  //       printf("\n");
+  //    }
+  //    printf("\n");
+  //  }
+
+  assert(torch::allclose(K_t_cuda, K_t, 1e-05, 1e-05));
+  assert(torch::allclose(V_t_cuda, V_t, 1e-05, 1e-05));
+  free(kcache_cuda);
+  free(vcache_cuda);
+
+  // =============================================================================
+  //  Load the W_out projection weights
+  // =============================================================================
+
+  //  ----------------------- C++ operations & checks --------------------------
+  float *w_out = (float *)calloc(m->vProjSize * m->num_heads * m->oProjSize,
+                                 sizeof(float));
+  std::vector<int> w_out_shape = {m->vProjSize, m->num_heads, m->oProjSize};
+  assert(m->qProjSize == m->kProjSize && m->kProjSize == m->vProjSize);
+  for (int h = 0; h < num_heads; h++) {
+    for (int v = 0; v < m->vProjSize; v++) {
+      for (int o = 0; o < m->oProjSize; o++) {
+        set_value_row_major(
+            w_out,
+            w_out_shape,
+            {v, h, o},
+            weight_cpu[all_weight_params * h + 3 * m->qProjSize * m->qSize +
+                       m->vProjSize * o + v]);
+      }
+    }
+  }
+  // convert weights to torch tensor
+  torch::Tensor torch_w_out = torch::from_blob(
+      w_out, {m->vProjSize, m->num_heads, m->oProjSize}, torch::kFloat32);
+
+  //  ----------------------- Loading CUDA results for this step ---------------
+  float *w_out_cuda = download_tensor<float>(
+      m->W_out_contiguous, m->vProjSize * m->oProjSize * m->num_heads);
+  assert(w_out_cuda != nullptr);
+  float *converted_wout_tensor = (float *)calloc(
+      m->vProjSize * m->num_heads * m->oProjSize, sizeof(float));
+  std::vector<int> converted_wout_tensor_shape = {
+      m->vProjSize, m->num_heads, m->oProjSize};
+
+  for (int i = 0; i < m->vProjSize * m->num_heads * m->oProjSize; i++) {
+    int v_idx = i % m->vProjSize;
+    int h_idx = (i / m->vProjSize) % m->num_heads;
+    int o_idx = i / (m->vProjSize * m->num_heads);
+    assert(v_idx < m->vProjSize && h_idx < m->num_heads &&
+           o_idx < m->oProjSize);
+    set_value_row_major(converted_wout_tensor,
+                        converted_wout_tensor_shape,
+                        {v_idx, h_idx, o_idx},
+                        w_out_cuda[i]);
+  }
+  torch::Tensor w_out_cuda_tensor =
+      torch::from_blob(converted_wout_tensor,
+                       {m->vProjSize, m->num_heads, m->oProjSize},
+                       torch::kFloat32);
+
+  //  ----------------------- Comparing C++ & CUDA results ---------------------
+  assert(torch::allclose(w_out_cuda_tensor, torch_w_out, 1e-05, 1e-05));
+  free(converted_wout_tensor);
+
+  // =============================================================================
+  //  Compute the softmax(QK^T/sqrt(d_k))V product, request by request
+  // =============================================================================
+
+  //  ----------------------- C++ initialization steps -------------------------
+  torch::Tensor Q_projs = qkv_projs.index({Slice(), Slice(), 0, Slice()})
+                              .reshape({qkv_projs.sizes()[0],
+                                        qkv_projs.sizes()[1],
+                                        qkv_projs.sizes()[3]});
+
+  torch::Tensor qk_products[bc->num_active_requests()];
+  torch::Tensor qk_softmax[bc->num_active_requests()];
+  torch::Tensor attn_heads[bc->num_active_requests()];
+
+  torch::Tensor cpp_output =
+      torch::zeros({m->oProjSize, bc->num_active_tokens()});
+
+  //  ----------------------- Loading CUDA results for this step ---------------
+  float *qk_prods_cpu = download_tensor<float>(
+      m->qk_prods,
+      BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_NUM_TOKENS * num_heads);
+  assert(qk_prods_cpu != nullptr);
+
+  float *qk_prods_softmax_cpu = download_tensor<float>(
+      m->qk_prods_softmax,
+      BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_NUM_TOKENS * num_heads);
+  assert(qk_prods_softmax_cpu != nullptr);
+
+  float *attn_heads_cpu = download_tensor<float>(
+      m->attn_heads, BatchConfig::MAX_NUM_TOKENS * m->num_heads * m->vProjSize);
+  assert(attn_heads_cpu != nullptr);
+
+  //  ----------------------- Main loop (request by request) -------------------
+  size_t qk_prods_cpu_offset = 0;
+
+  for (size_t r = 0; r < bc->num_active_requests(); r++) {
+    // Compute pre-request parameters
+    size_t num_new_tokens = r_num_tokens[r];
+    int64_t rid = (int64_t)(req_idxs[r]);
+    int64_t num_tokens_received_so_far =
+        (int64_t)(bc->requestsInfo[rid].token_start_offset +
+                  bc->requestsInfo[rid].num_tokens_in_batch);
+    assert(num_new_tokens == bc->requestsInfo[rid].num_tokens_in_batch);
+    assert(num_tokens_received_so_far >= (int64_t)num_new_tokens);
+
+    //  ----------------------- C++ computations -------------------------------
+    // Get the slice of the Q projection tensor with the tokens in the current
+    // request
+    torch::Tensor Q_req =
+        Q_projs.index({Slice(),
+                       Slice(r_first_idx[r], r_first_idx[r] + num_new_tokens),
+                       Slice()});
+    // std::cout << "Q_req.sizes(): " << Q_req.sizes() << std::endl;
+    assert(Q_req.sizes()[0] == m->qProjSize);
+    assert(Q_req.sizes()[1] == num_new_tokens);
+    assert(Q_req.sizes()[2] == num_heads);
+
+    /*printf("\n------------ QK multiplication (C++) -------------\n");
+    printf("Request r=%lu. num_new_tokens: %lu, num_tokens_received_so_far: %li,
+    rid: %li, Qproj slice: (%i, %i)\n", r, num_new_tokens,
+    num_tokens_received_so_far, rid, r_first_idx[r], r_first_idx[r] +
+    num_new_tokens);
+
+    std::cout << "Q_req matrix (idk dims):" << std::endl <<
+    Q_req.index({Slice(), Slice(), 0}) << std::endl << std::endl; std::cout <<
+    "K_t matrix (ilk dims):" << std::endl << K_t.index({Slice(), Slice(0,
+    num_tokens_received_so_far), 0, rid}) << std::endl << std::endl; std::cout
+    << "C++ alpha: " << (1.0f / sqrt(m->kProjSize)) << std::endl;*/
+
+    // Compute (Q*K^T)/sqrt(d_k) matmul
+    qk_products[r] =
+        torch::einsum("ijk,ilk->jlk",
+                      {Q_req,
+                       K_t.index({Slice(),
+                                  Slice(0, num_tokens_received_so_far),
+                                  Slice(),
+                                  rid})}) *
+        (1.0f / sqrt(m->kProjSize));
+
+    // Set entries above diagonal to -inf to make attention causal.
+    for (int h = 0; h < num_heads; h++) {
+      qk_products[r].index(
+          {Slice(), Slice(num_tokens_received_so_far - num_new_tokens), h}) =
+          qk_products[r]
+              .index({Slice(),
+                      Slice(num_tokens_received_so_far - num_new_tokens),
+                      h})
+              .tril() +
+          torch::full({(int64_t)num_new_tokens, (int64_t)num_new_tokens},
+                      -INFINITY)
+              .triu()
+              .fill_diagonal_(0);
+    }
+    // Compute softmax for each request block
+    qk_softmax[r] = torch::softmax(qk_products[r], -2);
+    assert(qk_softmax[r].sizes()[0] == num_new_tokens);
+    assert(qk_softmax[r].sizes()[1] == num_tokens_received_so_far);
+    assert(qk_softmax[r].sizes()[2] == m->num_heads);
+
+    //  ------------------- Loading CUDA results for this step ---------------
+    float *converted_qk_prod = (float *)calloc(
+        num_new_tokens * num_tokens_received_so_far * num_heads, sizeof(float));
+    float *converted_qk_prod_softmax = (float *)calloc(
+        num_new_tokens * num_tokens_received_so_far * num_heads, sizeof(float));
+    std::vector<int> converted_qk_prod_shape = {
+        (int)num_new_tokens, (int)num_tokens_received_so_far, (int)num_heads};
+
+    for (size_t i = 0;
+         i < num_new_tokens * num_tokens_received_so_far * num_heads;
+         i++) {
+      size_t new_t_idx = i % num_new_tokens;
+      size_t all_t_idx = (i / num_new_tokens) % num_tokens_received_so_far;
+      size_t head_idx = i / (num_new_tokens * num_tokens_received_so_far);
+      assert(new_t_idx < num_new_tokens &&
+             all_t_idx < num_tokens_received_so_far && head_idx < num_heads);
+      set_value_row_major(converted_qk_prod,
+                          converted_qk_prod_shape,
+                          {(int)new_t_idx, (int)all_t_idx, (int)head_idx},
+                          qk_prods_cpu[i + qk_prods_cpu_offset]);
+      set_value_row_major(converted_qk_prod_softmax,
+                          converted_qk_prod_shape,
+                          {(int)new_t_idx, (int)all_t_idx, (int)head_idx},
+                          qk_prods_softmax_cpu[i + qk_prods_cpu_offset]);
+    }
+    torch::Tensor qk_prods_cuda = torch::from_blob(
+        converted_qk_prod,
+        {(int64_t)num_new_tokens, num_tokens_received_so_far, num_heads},
+        torch::kFloat32);
+    torch::Tensor qk_prods_softmax_cuda = torch::from_blob(
+        converted_qk_prod_softmax,
+        {(int64_t)num_new_tokens, num_tokens_received_so_far, num_heads},
+        torch::kFloat32);
+
+    //  ------------------- Comparing C++ & CUDA results ------------------
+    /* std::cout << "C++:" <<std::endl;
+    for (int h=0; h<num_heads; h++) {
+      std::cout << qk_products[r].index({Slice(), Slice(), h}) << std::endl;
+    }
+    std::cout << "CUDA:" <<std::endl;
+    for (int h=0; h<num_heads; h++) {
+      std::cout << qk_prods_cuda.index({Slice(), Slice(), h}) << std::endl;
+    } */
+    /* //
+    std::cout << "C++:" <<std::endl;
+    for (int h=0; h<num_heads; h++) {
+      std::cout << qk_softmax[r].index({Slice(), Slice(), h}) << std::endl;
+    }
+    std::cout << "CUDA:" <<std::endl;
+    for (int h=0; h<num_heads; h++) {
+      std::cout << qk_prods_softmax_cuda.index({Slice(), Slice(), h}) <<
+    std::endl;
+    } */
+    // std::cout << "C++ tril:" <<std::endl;
+    // for (int h=0; h<num_heads; h++) {
+    //   std::cout << qk_products[r].tril().index({Slice(), Slice(), h}) <<
+    //   std::endl;
+    // }
+    assert(torch::allclose(qk_prods_cuda, qk_products[r], 1e-05, 1e-05));
+    assert(torch::allclose(qk_prods_softmax_cuda, qk_softmax[r], 1e-05, 1e-05));
+    free(converted_qk_prod);
+    free(converted_qk_prod_softmax);
+
+    //  --------------------- C++ computations --------------------------
+    // Multiply softmax results by V
+    assert(
+        V_t.index({Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})
+            .sizes()[0] == m->vProjSize);
+    assert(
+        V_t.index({Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})
+            .sizes()[1] == num_tokens_received_so_far);
+    assert(
+        V_t.index({Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})
+            .sizes()[2] == m->num_heads);
+    attn_heads[r] = torch::einsum(
+        "ijk,ljk->ilk",
+        {qk_softmax[r],
+         V_t.index(
+             {Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})});
+    assert(attn_heads[r].sizes()[0] == num_new_tokens);
+    assert(attn_heads[r].sizes()[1] == m->vProjSize);
+    assert(attn_heads[r].sizes()[2] == m->num_heads);
+
+    //  ------------------- Loading CUDA results for this step  ---------------
+    float converted_attn_heads_cpu[num_new_tokens][m->vProjSize][m->num_heads] =
+        {0};
+    for (int i = 0; i < num_new_tokens * m->vProjSize * m->num_heads; i++) {
+      int token_ix = i % num_new_tokens;
+      int vproj_idx = (i / num_new_tokens) % m->vProjSize;
+      int head_idx = i / (num_new_tokens * m->vProjSize);
+      assert(token_ix < num_new_tokens && vproj_idx < m->vProjSize &&
+             head_idx < m->num_heads);
+      converted_attn_heads_cpu[token_ix][vproj_idx][head_idx] =
+          attn_heads_cpu[r_first_idx[r] * m->vProjSize * m->num_heads + i];
+    }
+    torch::Tensor converted_attn_heads_cuda =
+        torch::from_blob(converted_attn_heads_cpu,
+                         {(int64_t)num_new_tokens, m->vProjSize, m->num_heads},
+                         torch::kFloat32);
+
+    //  -------------------- Comparing C++ & CUDA results -------------------
+    /* std::cout << "CUDA attn head for req " << r << ":" <<std::endl;
+    for (int h=0; h<m->num_heads; h++) {
+      std::cout << converted_attn_heads_cuda.index({Slice(), Slice(), h}) <<
+    std::endl;
+    }
+    std::cout << "C++ attn head for req " << r << ":" <<std::endl;
+    for (int h=0; h<m->num_heads; h++) {
+      std::cout << attn_heads[r].index({Slice(), Slice(), h}) << std::endl;
+    } */
+    assert(torch::allclose(
+        converted_attn_heads_cuda, attn_heads[r], 1e-05, 1e-05));
+
+    //  ----------------------- C++ computations ----------------------------
+    // Compute output values by projecting all heads to output space
+    cpp_output.index(
+        {Slice(),
+         Slice(r_first_idx[r], r_first_idx[r] + (int64_t)num_new_tokens)}) =
+        torch::einsum("jkl,ijk->li", {torch_w_out, attn_heads[r]});
+
+    // increment main loop's auxiliary index
+    qk_prods_cpu_offset +=
+        num_new_tokens * num_tokens_received_so_far * num_heads;
+  }
+
+  //  ----------------------- Comparing C++ & CUDA results ---------------------
+  /* std::cout << "C++:" <<std::endl;
+  for (int i=0; i<m->oProjSize; i++) {
+    std::cout << cpp_output.index({i, Slice()}) << std::endl;
+  }
+  std::cout << "CUDA:" <<std::endl;
+  for (int i=0; i<m->oProjSize; i++) {
+    std::cout << torch_out_cuda.index({i, Slice(0,
+  (int64_t)bc->num_active_tokens())}) << std::endl;
+  } */
+
+  assert(torch::allclose(
+      torch_out_cuda.index(
+          {Slice(), Slice(0, (int64_t)bc->num_active_tokens())}),
+      cpp_output,
+      1e-05,
+      1e-05));
+
+  // =============================================================================
+  //  Cleanup
+  // =============================================================================
+  free(w_out);
+  checkCUDA(cudaFreeHost(input_cpu));
+  checkCUDA(cudaFreeHost(weight_cpu));
+  checkCUDA(cudaFreeHost(output_cpu));
+  checkCUDA(cudaFreeHost(QKVProjArray_cpu));
+  checkCUDA(cudaFreeHost(keyCache_cpu));
+  checkCUDA(cudaFreeHost(valueCache_cpu));
+  checkCUDA(cudaFreeHost(qk_prods_cpu));
+  checkCUDA(cudaFreeHost(qk_prods_softmax_cpu));
+  checkCUDA(cudaFreeHost(attn_heads_cpu));
+  checkCUDA(cudaFreeHost(w_out_cuda));
+  // assert(false && "All good if you see this assert failure! :)");
+#endif
+  // Done with INFERENCE_TESTS block
+}
+
+void IncMultiQuerySelfAttention::backward(FFModel const &ff) {
+  // IncMultiQuerySelfAttention does not support backward
+  assert(false);
+}
+
+bool IncMultiQuerySelfAttention::get_int_parameter(PMParameter para,
+                                                   int *value) const {
+  switch (para) {
+    case PM_NUM_HEADS:
+      *value = num_heads;
+      return true;
+    default:
+      return Op::get_int_parameter(para, value);
+  }
+}
+
+bool IncMultiQuerySelfAttention::measure_operator_cost(
+    Simulator *sim, MachineView const &mv, CostMetrics &cost_metrics) const {
+  return false;
+}
+
+bool operator==(IncMultiQuerySelfAttentionParams const &lhs,
+                IncMultiQuerySelfAttentionParams const &rhs) {
+  return lhs.layer_guid == rhs.layer_guid && lhs.embed_dim == rhs.embed_dim &&
+         lhs.num_heads == rhs.num_heads && lhs.kdim == rhs.kdim &&
+         lhs.vdim == rhs.vdim && lhs.dropout == rhs.dropout &&
+         lhs.bias == rhs.bias && lhs.add_bias_kv == rhs.add_bias_kv &&
+         lhs.add_zero_attn == rhs.add_zero_attn;
+}
+
+IncMultiQuerySelfAttentionParams
+    IncMultiQuerySelfAttention::get_params() const {
+  IncMultiQuerySelfAttentionParams params;
+  params.layer_guid = this->layer_guid;
+  params.embed_dim = this->oProjSize;
+  params.num_heads = this->num_heads;
+  params.kdim = this->kProjSize;
+  params.vdim = this->vProjSize;
+  params.dropout = this->dropout;
+  params.bias = this->bias;
+  params.add_bias_kv = this->add_bias_kv;
+  params.add_zero_attn = this->add_zero_attn;
+
+  return params;
+}
+
+}; // namespace FlexFlow
+
+namespace std {
+size_t hash<FlexFlow::IncMultiQuerySelfAttentionParams>::operator()(
+    FlexFlow::IncMultiQuerySelfAttentionParams const &params) const {
+  size_t key = 0;
+  hash_combine(key, params.layer_guid.id);
+  hash_combine(key, params.embed_dim);
+  hash_combine(key, params.num_heads);
+  hash_combine(key, params.kdim);
+  hash_combine(key, params.vdim);
+  hash_combine(key, params.dropout);
+  hash_combine(key, params.bias);
+  hash_combine(key, params.add_bias_kv);
+  hash_combine(key, params.add_zero_attn);
+  return key;
+}
+}; // namespace std
diff --git a/src/ops/inc_multiquery_self_attention.cpp b/src/ops/inc_multiquery_self_attention.cpp
new file mode 100644
index 0000000000..c032e887a7
--- /dev/null
+++ b/src/ops/inc_multiquery_self_attention.cpp
@@ -0,0 +1,96 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/inc_multiquery_self_attention.h"
+#include "flexflow/utils/hip_helper.h"
+#include <hip/hip_runtime.h>
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::coord_t;
+using Legion::Memory;
+
+/*static*/
+void IncMultiQuerySelfAttention::inference_kernel_wrapper(
+    IncMultiQuerySelfAttentionMeta const *m,
+    BatchConfig const *bc,
+    GenericTensorAccessorR const &input,
+    GenericTensorAccessorR const &weight,
+    GenericTensorAccessorW const &output) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    hipEventCreate(&t_start);
+    hipEventCreate(&t_end);
+    hipEventRecord(t_start, stream);
+  }
+
+  handle_unimplemented_hip_kernel(OP_INC_MULTIQUERY_SELF_ATTENTION);
+
+  if (m->profiling) {
+    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    hipEventDestroy(t_start);
+    hipEventDestroy(t_end);
+    printf("IncMultiQuerySelfAttention forward time = %.2fms\n", elapsed);
+    // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
+    // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
+    // acc_output.rect, "[Attention:forward:output]");
+  }
+}
+
+IncMultiQuerySelfAttentionMeta::IncMultiQuerySelfAttentionMeta(
+    FFHandler handler,
+    IncMultiQuerySelfAttention const *attn,
+    GenericTensorAccessorR const &weight,
+    Memory gpu_mem,
+    int num_samples)
+    : OpMeta(handler, attn) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  checkCUDNN(miopenSetStream(handler.dnn, stream));
+}
+
+IncMultiQuerySelfAttentionMeta::IncMultiQuerySelfAttentionMeta(
+    FFHandler handler,
+    InferenceMode infer_mode,
+    Op const *attn,
+    int _qSize,
+    int _kSize,
+    int _vSize,
+    int _qProjSize,
+    int _kProjSize,
+    int _vProjSize,
+    int _oProjSize,
+    int _embed_dim,
+    bool _bias,
+    bool _add_bias_kv,
+    GenericTensorAccessorR const &weight,
+    Legion::Memory gpu_mem,
+    int num_samples)
+    : OpMeta(handler, attn) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  checkCUDNN(miopenSetStream(handler.dnn, stream));
+}
+
+IncMultiQuerySelfAttentionMeta::~IncMultiQuerySelfAttentionMeta(void) {}
+
+}; // namespace FlexFlow
diff --git a/src/ops/inc_multiquery_self_attention.cu b/src/ops/inc_multiquery_self_attention.cu
new file mode 100644
index 0000000000..ed6153de2d
--- /dev/null
+++ b/src/ops/inc_multiquery_self_attention.cu
@@ -0,0 +1,797 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+#include "cuComplex.h"
+#endif
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/ops/inc_multiquery_self_attention.h"
+#include "flexflow/utils/cuda_helper.h"
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::coord_t;
+using Legion::Memory;
+
+namespace Kernels {
+namespace IncMultiHeadAttention {
+
+template <typename DT>
+__global__ void apply_rotary_embedding_multi_query(
+    DT *input_ptr,
+    cuFloatComplex *complex_input,
+    BatchConfig::PerTokenInfo const *tokenInfos,
+    int qProjSize,
+    int kProjSize,
+    int num_heads,
+    int num_tokens,
+    int q_block_size,
+    int k_block_size,
+    int v_block_size,
+    bool q_tensor) {
+  int proj_size = q_tensor ? qProjSize : kProjSize;
+  int real_num_heads = q_tensor ? num_heads : 1;
+
+  CUDA_KERNEL_LOOP(i, num_tokens * proj_size * real_num_heads / 2) {
+    // create complex number
+    int head_idx = q_tensor ? i / (num_tokens * proj_size / 2) : 0;
+    int idx = i % (num_tokens * proj_size / 2);
+    int token_idx =
+        (i - head_idx * (num_tokens * proj_size / 2)) / (proj_size / 2);
+
+    int real_part_index =
+        idx + token_idx * (proj_size / 2) +
+        (q_tensor ? head_idx * q_block_size : num_heads * q_block_size);
+    int complex_part_index = real_part_index + (proj_size / 2);
+
+    complex_input[i] = {input_ptr[real_part_index],
+                        input_ptr[complex_part_index]};
+
+    // get the freq_cis: shape 1 * (qProjSize/2) = 1 * 64
+    // apply a Cartesian coordinate transformation
+    // multiple with input & /copy back to q/k
+
+    // get position of token
+    //  int head_idx = i / (num_tokens * proj_size);
+
+    // size_t pos = id_map[token_idx].token_position;
+    size_t pos = tokenInfos[token_idx].abs_depth_in_request;
+
+    // float before_real = complex_input[i].x, before_complex =
+    // complex_input[i].y;
+    int pos_i = i % (proj_size / 2);
+    float freq = pos * (1.0 / pow(10000.0, (float)2 * pos_i / proj_size));
+    cuFloatComplex complex_pos = {cos(freq), sin(freq)};
+
+    complex_input[i] = cuCmulf(complex_input[i], complex_pos);
+
+    input_ptr[real_part_index] = complex_input[i].x;
+    input_ptr[complex_part_index] = complex_input[i].y;
+  }
+}
+
+template <typename DT>
+void compute_qkv_kernel(IncMultiQuerySelfAttentionMeta const *m,
+                        BatchConfig const *bc,
+                        DT const *input_ptr,
+                        DT const *weight_ptr,
+                        DT *output_ptr,
+                        cudaStream_t stream) {
+
+  checkCUDA(cublasSetStream(m->handle.blas, stream));
+  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
+  DT alpha = 1.0f, beta = 0.0f;
+  assert(m->qSize == m->vSize && m->qSize == m->kSize);
+  cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
+#if CUDA_VERSION >= 11000
+  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
+  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+#else
+  cudaDataType_t compute_type = cublas_data_type;
+#endif
+  // Compute (W^T)x matmul: einsum(ijkl,im->jmkl)
+  // Weights: qSize x qProjSize x 3 x num_heads
+  // Input: qSize x num_tokens
+  // Output >>> qProjSize x num_tokens x 3 x num_heads
+  int num_tokens = bc->num_active_tokens();
+  int m_q = m->qProjSize;
+  int n = bc->num_active_tokens();
+  int k = m->qSize;
+  int lda = k, ldb = k, ldc = m_q;
+  size_t strideA = m_q * k;
+  size_t strideB = 0;
+  size_t strideC = m_q * n; // size of the output block for each head.
+  // q
+  checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                       CUBLAS_OP_T,
+                                       CUBLAS_OP_N,
+                                       m_q,
+                                       n,
+                                       k,
+                                       &alpha,
+                                       weight_ptr,
+                                       cublas_data_type,
+                                       lda,
+                                       strideA,
+                                       input_ptr,
+                                       cublas_data_type,
+                                       ldb,
+                                       strideB,
+                                       &beta,
+                                       output_ptr,
+                                       cublas_data_type,
+                                       ldc,
+                                       strideC,
+                                       m->num_heads,
+                                       compute_type,
+                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+  // k
+  int m_ = m->kProjSize;
+  int k_ = m->embed_dim;
+  int n_ = num_tokens;
+  lda = k_, ldb = k_, ldc = m_;
+  checkCUDA(cublasGemmEx(m->handle.blas,
+                         CUBLAS_OP_T,
+                         CUBLAS_OP_N,
+                         m_,
+                         n_,
+                         k_,
+                         &alpha,
+                         weight_ptr + m->embed_dim * m->embed_dim,
+                         cublas_data_type,
+                         lda,
+                         input_ptr,
+                         cublas_data_type,
+                         ldb,
+                         &beta,
+                         output_ptr + num_tokens * m->embed_dim,
+                         cublas_data_type,
+                         ldc,
+                         compute_type,
+                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
+  // v
+  checkCUDA(
+      cublasGemmEx(m->handle.blas,
+                   CUBLAS_OP_T,
+                   CUBLAS_OP_N,
+                   m_,
+                   n_,
+                   k_,
+                   &alpha,
+                   weight_ptr + m->embed_dim * (m->embed_dim + m->kProjSize),
+                   cublas_data_type,
+                   lda,
+                   input_ptr,
+                   cublas_data_type,
+                   ldb,
+                   &beta,
+                   output_ptr + num_tokens * (m->embed_dim + m->kProjSize),
+                   cublas_data_type,
+                   ldc,
+                   compute_type,
+                   CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+  // save_tensor<DT>(output_ptr, 4544 *
+  // 7,"/home/ubuntu/FlexFlow/inference/q_before.txt");
+  int q_block_size = m->qProjSize * num_tokens;
+  int k_block_size = m->kProjSize * num_tokens;
+  int v_block_size = m->vProjSize * num_tokens;
+  int parallelism = m->qProjSize * num_tokens * m->num_heads / 2;
+  apply_rotary_embedding_multi_query<<<GET_BLOCKS(parallelism),
+                                       min(CUDA_NUM_THREADS, parallelism),
+                                       0,
+                                       stream>>>(output_ptr,
+                                                 m->complex_input,
+                                                 m->token_infos,
+                                                 m->qProjSize,
+                                                 m->kProjSize,
+                                                 m->num_heads,
+                                                 num_tokens,
+                                                 q_block_size,
+                                                 k_block_size,
+                                                 v_block_size,
+                                                 true);
+  parallelism = m->kProjSize * num_tokens / 2;
+  apply_rotary_embedding_multi_query<<<GET_BLOCKS(parallelism),
+                                       min(CUDA_NUM_THREADS, parallelism),
+                                       0,
+                                       stream>>>(output_ptr,
+                                                 m->complex_input,
+                                                 m->token_infos,
+                                                 m->qProjSize,
+                                                 m->kProjSize,
+                                                 m->num_heads,
+                                                 num_tokens,
+                                                 q_block_size,
+                                                 k_block_size,
+                                                 v_block_size,
+                                                 false);
+
+  // save_tensor<DT>(output_ptr, 64 * 7 * 2,
+  // "/home/ubuntu/FlexFlow/inference/query.txt");
+  // save_tensor<DT>(output_ptr, 4544 *
+  // 7,"/home/ubuntu/FlexFlow/inference/q.txt"); print_tensor<DT>(output_ptr
+  // + num_new_tokens * (m->embed_dim + m->kProjSize), 32, "vvvvvvvvv");
+}
+
+template <typename DT>
+void update_kv_cache_kernel(IncMultiQuerySelfAttentionMeta const *m,
+                            BatchConfig const *bc,
+                            cudaStream_t stream) {
+  int num_tokens = bc->num_active_tokens();
+  if (num_tokens > 0) {
+    int parallelism = m->kProjSize * num_tokens;
+    store_kv_cache_multi_query<<<GET_BLOCKS(parallelism),
+                                 min(CUDA_NUM_THREADS, parallelism),
+                                 0,
+                                 stream>>>(
+        static_cast<DT *>(m->devQKVProjArray),
+        static_cast<DT *>(m->keyCache),
+        m->token_infos,
+        m->qProjSize,
+        m->kProjSize,
+        m->vProjSize,
+        num_tokens,
+        m->num_heads,
+        BatchConfig::MAX_SEQ_LENGTH,
+        /* k_cache = */ true);
+
+    parallelism = m->vProjSize * num_tokens;
+    store_kv_cache_multi_query<<<GET_BLOCKS(parallelism),
+                                 min(CUDA_NUM_THREADS, parallelism),
+                                 0,
+                                 stream>>>(
+        static_cast<DT *>(m->devQKVProjArray),
+        static_cast<DT *>(m->valueCache),
+        m->token_infos,
+        m->qProjSize,
+        m->kProjSize,
+        m->vProjSize,
+        num_tokens,
+        m->num_heads,
+        BatchConfig::MAX_SEQ_LENGTH,
+        /* k_cache = */ false);
+  }
+}
+
+template <typename DT>
+void inference_kernel(IncMultiQuerySelfAttentionMeta const *m,
+                      BatchConfig const *bc,
+                      DT const *input_ptr,
+                      DT const *weight_ptr,
+                      DT *output_ptr,
+                      cudaStream_t stream) {
+  // here because we need postion info in infernece 1
+  cudaMemcpyAsync(m->token_infos,
+                  &(bc->tokensInfo),
+                  bc->MAX_NUM_TOKENS * sizeof(BatchConfig::PerTokenInfo),
+                  cudaMemcpyHostToDevice,
+                  stream);
+  // phase 1: Implement kernel to compute KQV for input tokens
+  compute_qkv_kernel(m,
+                     bc,
+                     input_ptr,
+                     weight_ptr,
+                     static_cast<DT *>(m->devQKVProjArray),
+                     stream);
+
+  // phase 2: Update key/val cache
+  update_kv_cache_kernel<DT>(m, bc, stream);
+
+  // phase 3: Compute attention score
+  // 3 kernels for pahse 3: matmul1 - softmax - matmal2
+  compute_attention_kernel(m, bc, output_ptr, weight_ptr, stream);
+}
+
+} // namespace IncMultiHeadAttention
+} // namespace Kernels
+
+using namespace Kernels::IncMultiHeadAttention;
+
+template <typename DT>
+__global__ void
+    store_kv_cache_multi_query(DT const *devQKVProjArray,
+                               DT *cache_ptr,
+                               BatchConfig::PerTokenInfo const *tokenInfos,
+                               int qProjSize,
+                               int kProjSize,
+                               int vProjSize,
+                               int num_tokens,
+                               int num_heads,
+                               int max_seq_len,
+                               bool k_cache) {
+  CUDA_KERNEL_LOOP(i, num_tokens * (k_cache ? kProjSize : vProjSize)) {
+    int proj_size = k_cache ? kProjSize : vProjSize;
+    // int head_idx = i / (num_tokens * proj_size);
+    // int token_idx = (i - head_idx * (num_tokens * proj_size)) / proj_size;
+    int token_idx = i / proj_size;
+    int data_idx = i % proj_size;
+
+    // int qkv_block_size = (qProjSize + kProjSize + vProjSize) * num_tokens;
+    // int current_head_block_size =
+    //     num_tokens * (k_cache ? qProjSize : qProjSize + kProjSize);
+
+    // |q|k|v|
+    int pre_size = num_tokens * qProjSize * num_heads +
+                   (k_cache ? 0 : kProjSize * num_tokens);
+
+    DT val = devQKVProjArray[pre_size + token_idx * proj_size + data_idx];
+    // int const req_id = id_map[token_idx].request_index;
+    // int const tok_id = id_map[token_idx].token_position;
+    int const req_id = tokenInfos[token_idx].request_index;
+    int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
+    cache_ptr[req_id * (max_seq_len * proj_size) + tok_id * proj_size +
+              data_idx] = val;
+  }
+}
+
+template <typename DT>
+__global__ void
+    fill_entries_above_diagonal_multi_query(DT *matrix,
+                                            size_t num_rows,
+                                            size_t num_cols,
+                                            size_t num_heads,
+                                            size_t entries_above_diagonal,
+                                            DT value) {
+  CUDA_KERNEL_LOOP(i, entries_above_diagonal * num_heads) {
+    size_t head_idx = i / entries_above_diagonal;
+    size_t entry_idx = i % entries_above_diagonal;
+    size_t y = (-1 + sqrt(8 * (float)entry_idx + 1)) / 2;
+    size_t x = entry_idx - y * (y + 1) / 2;
+    y += (num_cols - num_rows) + 1;
+    matrix[head_idx * num_rows * num_cols + num_cols * y + x] = value;
+  }
+}
+
+template <typename DT>
+void compute_attention_kernel(IncMultiQuerySelfAttentionMeta const *m,
+                              BatchConfig const *bc,
+                              DT *output_ptr,
+                              DT const *weight_ptr,
+                              cudaStream_t stream) {
+  checkCUDA(cublasSetStream(m->handle.blas, stream));
+  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
+  cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
+  cudnnDataType_t cudnn_data_type = ff_to_cudnn_datatype(m->output_type[0]);
+  assert(data_type_size(m->output_type[0]) == sizeof(DT));
+#if CUDA_VERSION >= 11000
+  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
+  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+#else
+  cudaDataType_t compute_type = cublas_data_type;
+#endif
+  // int num_requests = bc->num_active_requests();
+  int num_tokens = bc->num_active_tokens();
+  int tokens_previous_requests = 0;
+  int qkv_block_size = (m->qProjSize) * num_tokens;
+  int kt_block_size = m->kProjSize * BatchConfig::MAX_SEQ_LENGTH;
+  int kt_req_block_size = kt_block_size;
+  int vt_block_size = m->vProjSize * BatchConfig::MAX_SEQ_LENGTH;
+  int vt_req_block_size = vt_block_size;
+  assert(m->qProjSize == m->kProjSize);
+
+  for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+    int total_tokens = bc->requestsInfo[i].token_start_offset +
+                       bc->requestsInfo[i].num_tokens_in_batch;
+    // bc->token_last_available_idx[i] + 1;
+    // Compute (QK^T/sqrt(d_k))
+    int m_ = num_new_tokens;
+    int n = total_tokens;
+    int k = m->qProjSize;
+    int lda = k, ldb = k, ldc = m_;
+    int strideA = qkv_block_size;
+    int strideB = 0;
+    int strideC = num_new_tokens * total_tokens;
+
+    // a flag of using this scaling alpha
+    DT alpha = 1.0f, beta = 0.0f;
+    alpha = static_cast<DT>(1.0f / sqrt(m->kProjSize));
+    // To get A, skip over Q entries from previous requests (same head)
+    void const *A = static_cast<DT *>(m->devQKVProjArray) +
+                    tokens_previous_requests * m->qProjSize;
+    // To get B, skip over K entries from previous requests (all heads +
+    // padding)
+    void const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
+    // To get C, skip over QK^T products from previous requests
+    void *C = (void *)(m->qk_prods);
+
+    checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                         CUBLAS_OP_T,
+                                         CUBLAS_OP_N,
+                                         m_,
+                                         n,
+                                         k,
+                                         &alpha,
+                                         A,
+                                         cublas_data_type,
+                                         lda,
+                                         strideA,
+                                         B,
+                                         cublas_data_type,
+                                         ldb,
+                                         strideB,
+                                         &beta,
+                                         C,
+                                         cublas_data_type,
+                                         ldc,
+                                         strideC,
+                                         m->num_heads,
+                                         compute_type,
+                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+    // save_tensor<DT>(
+    //     (DT *)A, 64 * 7 * 2, "/home/ubuntu/FlexFlow/inference/query.txt");
+    // save_tensor<DT>((DT *)B, 64 * 7,
+    // "/home/ubuntu/FlexFlow/inference/key.txt"); print_tensor<DT>((DT
+    // *)m->qk_prods, 32, "output qkprod");
+
+    // Fill all elements above diagonal in qk prods with -inf to force
+    // causal attention.
+    assert(num_new_tokens <= total_tokens);
+    size_t entries_above_diagonal = num_new_tokens * (num_new_tokens - 1) / 2;
+    if (entries_above_diagonal > 0) {
+      size_t parallelism = m->num_heads * entries_above_diagonal;
+      fill_entries_above_diagonal_multi_query<<<GET_BLOCKS(parallelism),
+                                                min((size_t)CUDA_NUM_THREADS,
+                                                    parallelism),
+                                                0,
+                                                stream>>>(
+          static_cast<DT *>(C),
+          num_new_tokens,
+          total_tokens,
+          m->num_heads,
+          entries_above_diagonal,
+          static_cast<DT>(-INFINITY));
+    }
+    // Compute Softmax(QK^T/sqrt(d_k))
+    cudnnTensorDescriptor_t qk_tensor;
+    checkCUDNN(cudnnCreateTensorDescriptor(&qk_tensor));
+    // Before modifying the parameters below, make sure to read the following
+    // description of the CUDNN_TENSOR_NCHW tensor layout, from
+    // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#cudnnTensorFormat_t:
+    // This tensor format specifies that the data is laid out in the following
+    // order: batch size, feature maps, rows, columns. The strides are
+    // implicitly defined in such a way that the data are contiguous in memory
+    // with no padding between images, feature maps, rows, and columns; the
+    // columns are the inner dimension and the images are the outermost
+    // dimension.
+    int n_param = m->num_heads;
+    int c_param = total_tokens;
+    int h_param = 1;
+    int w_param = num_new_tokens;
+    checkCUDNN(cudnnSetTensor4dDescriptor(qk_tensor,
+                                          CUDNN_TENSOR_NCHW,
+                                          cudnn_data_type,
+                                          n_param,
+                                          c_param,
+                                          h_param,
+                                          w_param));
+    float softmax_alpha = 1.0f, softmax_beta = 0.0f;
+    void *C_softmax = (void *)(m->qk_prods_softmax);
+    // The softmax operation below is executed according to the
+    // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
+    // softmax operation is computed per spatial location (H,W) per image (N)
+    // across dimension C.
+    checkCUDNN(cudnnSoftmaxForward(m->handle.dnn,
+                                   CUDNN_SOFTMAX_ACCURATE,
+                                   CUDNN_SOFTMAX_MODE_CHANNEL,
+                                   &softmax_alpha,
+                                   qk_tensor,
+                                   C,
+                                   &softmax_beta,
+                                   qk_tensor,
+                                   C_softmax));
+    // Matmul softmax(QK^T/sqrt(d_k)) by V
+    alpha = 1.0f, beta = 0.0f;
+    m_ = num_new_tokens;
+    n = m->vProjSize;
+    k = total_tokens;
+    lda = m_, ldb = n, ldc = m_;
+    strideA = num_new_tokens * total_tokens;
+    strideB = 0;
+    strideC = num_new_tokens * m->vProjSize;
+    // To get A, skip over softmax(QK^T/sqrt(d_k)) entries from previous
+    // requests (all heads)
+    A = static_cast<DT *>(C_softmax);
+    // To get B, skip over V^T entries from previous requests (all heads +
+    // padding)
+    B = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
+    // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
+    // requests
+    C = static_cast<DT *>(m->attn_heads) +
+        tokens_previous_requests * m->num_heads * m->vProjSize;
+
+    checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                         CUBLAS_OP_N,
+                                         CUBLAS_OP_T,
+                                         m_,
+                                         n,
+                                         k,
+                                         &alpha,
+                                         A,
+                                         cublas_data_type,
+                                         lda,
+                                         strideA,
+                                         B,
+                                         cublas_data_type,
+                                         ldb,
+                                         strideB,
+                                         &beta,
+                                         C,
+                                         cublas_data_type,
+                                         ldc,
+                                         strideC,
+                                         m->num_heads,
+                                         compute_type,
+                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+    // Project to output, save result directly on output tensor
+    alpha = 1.0f, beta = 0.0f;
+    m_ = m->oProjSize;
+    k = m->vProjSize * m->num_heads;
+    n = num_new_tokens;
+    lda = k, ldb = n, ldc = m_;
+    A = weight_ptr +
+        m->embed_dim * (m->embed_dim + m->kProjSize + m->vProjSize);
+    B = C;
+    C = (output_ptr + tokens_previous_requests * m->oProjSize);
+
+    checkCUDA(cublasGemmEx(m->handle.blas,
+                           CUBLAS_OP_T,
+                           CUBLAS_OP_T,
+                           m_,
+                           n,
+                           k,
+                           &alpha,
+                           A,
+                           cublas_data_type,
+                           lda,
+                           B,
+                           cublas_data_type,
+                           ldb,
+                           &beta,
+                           C,
+                           cublas_data_type,
+                           ldc,
+                           compute_type,
+                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
+    tokens_previous_requests += num_new_tokens;
+  }
+
+  // print_tensor<DT>(output_ptr, 32, "output 3");
+  // save_tensor<DT>(
+  //     output_ptr, 7 * 4544, "/home/ubuntu/FlexFlow/inference/op.txt");
+  // assert(false);
+
+  assert(tokens_previous_requests == num_tokens);
+}
+
+/*static*/
+void IncMultiQuerySelfAttention::inference_kernel_wrapper(
+    IncMultiQuerySelfAttentionMeta const *m,
+    BatchConfig const *bc,
+    GenericTensorAccessorR const &input,
+    GenericTensorAccessorR const &weight,
+    GenericTensorAccessorW const &output) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  // bool use_bias = *m->bias;
+
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+
+  assert(input.data_type == weight.data_type);
+  assert(input.data_type == output.data_type);
+  if (input.data_type == DT_HALF) {
+    Kernels::IncMultiHeadAttention::inference_kernel(m,
+                                                     bc,
+                                                     input.get_half_ptr(),
+                                                     weight.get_half_ptr(),
+                                                     output.get_half_ptr(),
+                                                     stream);
+  } else if (input.data_type == DT_FLOAT) {
+    Kernels::IncMultiHeadAttention::inference_kernel(m,
+                                                     bc,
+                                                     input.get_float_ptr(),
+                                                     weight.get_float_ptr(),
+                                                     output.get_float_ptr(),
+                                                     stream);
+  } else {
+    assert(false && "Unspported data type");
+  }
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("IncMultiQuerySelfAttention forward time = %.2fms\n", elapsed);
+    // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
+    // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
+    // acc_output.rect, "[Attention:forward:output]");
+  }
+}
+
+IncMultiQuerySelfAttentionMeta::IncMultiQuerySelfAttentionMeta(
+    FFHandler handler,
+    IncMultiQuerySelfAttention const *attn,
+    GenericTensorAccessorR const &weight,
+    Memory gpu_mem,
+    int num_samples)
+    : IncMultiQuerySelfAttentionMeta(handler,
+                                 INC_DECODING_MODE,
+                                 attn,
+                                 attn->qSize,
+                                 attn->kSize,
+                                 attn->vSize,
+                                 attn->qProjSize,
+                                 attn->kProjSize,
+                                 attn->vProjSize,
+                                 attn->oProjSize,
+                                 attn->embed_dim,
+                                 attn->bias,
+                                 attn->add_bias_kv,
+                                 weight,
+                                 gpu_mem,
+                                 num_samples) {}
+
+IncMultiQuerySelfAttentionMeta::IncMultiQuerySelfAttentionMeta(
+    FFHandler handler,
+    InferenceMode infer_mode,
+    Op const *attn,
+    int _qSize,
+    int _kSize,
+    int _vSize,
+    int _qProjSize,
+    int _kProjSize,
+    int _vProjSize,
+    int _oProjSize,
+    int _embed_dim,
+    bool _bias,
+    bool _add_bias_kv,
+    GenericTensorAccessorR const &weight,
+    Memory gpu_mem,
+    int num_samples)
+    : OpMeta(handler, attn) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  checkCUDNN(cudnnSetStream(handler.dnn, stream));
+  qSize = _qSize;
+  kSize = _kSize;
+  vSize = _vSize;
+  embed_dim = _embed_dim;
+  // assume dimensions match for now
+  assert(qSize == kSize);
+  assert(kSize == vSize);
+  qProjSize = _qProjSize;
+  kProjSize = _kProjSize;
+  assert(qProjSize == kProjSize); // required for attention QK^T matmul
+  vProjSize = _vProjSize;
+  oProjSize = _oProjSize;
+  size_t size_of_dt = data_type_size(attn->data_type);
+
+  num_heads = _embed_dim / qProjSize;
+  weights_params = (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize +
+                    oProjSize * (vProjSize > 0 ? vProjSize : vSize));
+  weightSize = (_embed_dim + _embed_dim + kProjSize + vProjSize) * _embed_dim *
+               size_of_dt;
+  has_load_weights = (bool *)calloc(1, sizeof(bool));
+  *has_load_weights = false;
+  bias = (bool *)calloc(1, sizeof(bool));
+  *bias = _bias;
+  assert(!_add_bias_kv);
+
+#ifdef INFERENCE_TESTS
+  kcache = (float *)calloc(kProjSize * BatchConfig::MAX_SEQ_LENGTH * num_heads *
+                               BatchConfig::MAX_NUM_REQUESTS,
+                           sizeof(float));
+  vcache = (float *)calloc(vProjSize * BatchConfig::MAX_SEQ_LENGTH * num_heads *
+                               BatchConfig::MAX_NUM_REQUESTS,
+                           sizeof(float));
+#endif
+
+  // allocate memory for the seqArray and reserve space
+  {
+    // size_t qkv_proj_dim = qProjSize + kProjSize + vProjSize;
+
+    size_t qkv_max_proj_size = BatchConfig::MAX_NUM_TOKENS *
+                               (qProjSize * num_heads + kProjSize + vProjSize);
+    size_t key_cache_size = 0, value_cache_size = 0;
+    switch (infer_mode) {
+      case INC_DECODING_MODE:
+      case TREE_VERIFY_MODE: {
+        key_cache_size = kProjSize * BatchConfig::MAX_NUM_REQUESTS *
+                         BatchConfig::MAX_SEQ_LENGTH;
+        value_cache_size = vProjSize * BatchConfig::MAX_NUM_REQUESTS *
+                           BatchConfig::MAX_SEQ_LENGTH;
+        break;
+      }
+      case BEAM_SEARCH_MODE: {
+        key_cache_size = kProjSize * BeamSearchBatchConfig::MAX_NUM_REQUESTS *
+                         BatchConfig::MAX_SEQ_LENGTH *
+                         BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+        value_cache_size = vProjSize * BeamSearchBatchConfig::MAX_NUM_REQUESTS *
+                           BatchConfig::MAX_SEQ_LENGTH *
+                           BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+        break;
+      }
+      default:
+        assert(false && "Unkown inference mode");
+    }
+    size_t tokeninfo_size = BatchConfig::MAX_NUM_TOKENS;
+    size_t qk_prod_size =
+        BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_SEQ_LENGTH * num_heads;
+    size_t attn_heads_size =
+        BatchConfig::MAX_NUM_TOKENS * num_heads * vProjSize;
+    size_t complex_size =
+        (BatchConfig::MAX_NUM_TOKENS * qProjSize * num_heads) / 2;
+    size_t totalSize =
+        (qkv_max_proj_size + key_cache_size + value_cache_size +
+         2 * qk_prod_size + attn_heads_size) *
+            size_of_dt +
+        tokeninfo_size * sizeof(BatchConfig::PerTokenInfo) +
+        complex_size * sizeof(cuFloatComplex); // more components will
+                                               // be added here later
+
+    Realm::Rect<1, coord_t> bounds(Realm::Point<1, coord_t>(0),
+                                   Realm::Point<1, coord_t>(totalSize - 1));
+    std::vector<size_t> field_sizes;
+    field_sizes.push_back(sizeof(char));
+    Realm::RegionInstance::create_instance(reserveInst,
+                                           gpu_mem,
+                                           bounds,
+                                           field_sizes,
+                                           0,
+                                           Realm::ProfilingRequestSet())
+        .wait();
+    off_t offset = 0;
+    devQKVProjArray = reserveInst.pointer_untyped(offset, 0);
+    offset += qkv_max_proj_size * size_of_dt;
+    keyCache = reserveInst.pointer_untyped(offset, 0);
+    offset += key_cache_size * size_of_dt;
+    valueCache = reserveInst.pointer_untyped(offset, 0);
+    offset += value_cache_size * size_of_dt;
+    token_infos = reserveInst.pointer<BatchConfig::PerTokenInfo>(offset);
+    offset += sizeof(BatchConfig::PerTokenInfo) * tokeninfo_size;
+    qk_prods = reserveInst.pointer_untyped(offset, 0);
+    offset += qk_prod_size * size_of_dt;
+    qk_prods_softmax = reserveInst.pointer_untyped(offset, 0);
+    offset += qk_prod_size * size_of_dt;
+    attn_heads = reserveInst.pointer_untyped(offset, 0);
+    offset += attn_heads_size * size_of_dt;
+    complex_input = reserveInst.pointer<cuFloatComplex>(offset);
+    offset += complex_size * sizeof(cuFloatComplex);
+    assert(offset == totalSize);
+  }
+  cudaStreamSynchronize(stream);
+}
+
+IncMultiQuerySelfAttentionMeta::~IncMultiQuerySelfAttentionMeta(void) {
+  reserveInst.destroy();
+#ifdef INFERENCE_TESTS
+  free(kcache);
+  free(vcache);
+#endif
+}
+
+}; // namespace FlexFlow
diff --git a/src/runtime/ffconst_utils.cc b/src/runtime/ffconst_utils.cc
index 7f50e4b69f..63b625edac 100644
--- a/src/runtime/ffconst_utils.cc
+++ b/src/runtime/ffconst_utils.cc
@@ -154,6 +154,8 @@ std::string get_operator_type_name(OperatorType type) {
       return "SpecIncMultiHeadSelfAttention";
     case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION:
       return "TreeIncMultiHeadSelfAttention";
+    case OP_INC_MULTIQUERY_SELF_ATTENTION:
+      return "IncMultiQuerySelfAttention";
     case OP_INPUT:
       return "Input";
     case OP_WEIGHT:
@@ -172,6 +174,8 @@ std::string get_operator_type_name(OperatorType type) {
       return "LayerNorm";
     case OP_RMS_NORM:
       return "RMSNorm";
+    case OP_GELU:
+      return "GELU";
     case OP_IDENTITY:
       return "Identity";
     // Parallel Ops
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index bcead0bfaf..c43fe140b9 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -32,6 +32,7 @@
 #include "flexflow/ops/gather.h"
 #include "flexflow/ops/groupby.h"
 #include "flexflow/ops/inc_multihead_self_attention.h"
+#include "flexflow/ops/inc_multiquery_self_attention.h"
 #include "flexflow/ops/layer_norm.h"
 #include "flexflow/ops/linear.h"
 #include "flexflow/ops/noop.h"
@@ -2316,6 +2317,19 @@ GraphOptimalViewSerialized
         sez.serialize(attn->qk_prod_scaling);
         break;
       }
+      case OP_INC_MULTIQUERY_SELF_ATTENTION: {
+        IncMultiQuerySelfAttention *attn = (IncMultiQuerySelfAttention *)op;
+        sez.serialize(attn->layer_guid.id);
+        sez.serialize(attn->oProjSize);
+        sez.serialize(attn->num_heads);
+        sez.serialize(attn->qProjSize);
+        sez.serialize(attn->vProjSize);
+        sez.serialize(attn->dropout);
+        sez.serialize(attn->bias);
+        sez.serialize(attn->add_bias_kv);
+        sez.serialize(attn->add_zero_attn);
+        break;
+      }
       case OP_SOFTMAX: {
         Softmax *softmax = (Softmax *)op;
         sez.serialize(softmax->dim);
@@ -2794,6 +2808,38 @@ void FFModel::deserialize_graph_optimal_view(
                                                                  params);
         break;
       }
+      case OP_INC_MULTIQUERY_SELF_ATTENTION: {
+        assert(num_inputs == 1);
+        int embed_dim, num_heads, k_dim, v_dim;
+        float dropout, scaling_factor;
+        bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
+            scaling_query, qk_prod_scaling;
+        size_t id;
+        dez.deserialize(id);
+        LayerID layer_guid(id);
+        dez.deserialize(embed_dim);
+        dez.deserialize(num_heads);
+        dez.deserialize(k_dim);
+        dez.deserialize(v_dim);
+        dez.deserialize(dropout);
+        dez.deserialize(bias);
+        dez.deserialize(add_bias_kv);
+        dez.deserialize(add_zero_attn);
+
+        IncMultiQuerySelfAttentionParams params;
+        params.embed_dim = embed_dim;
+        params.num_heads = num_heads;
+        params.kdim = k_dim;
+        params.vdim = v_dim;
+        params.dropout = dropout;
+        params.bias = bias;
+        params.add_bias_kv = add_bias_kv;
+        params.add_zero_attn = add_zero_attn;
+        params.layer_guid = layer_guid;
+        node =
+            get_or_create_node<IncMultiQuerySelfAttention>(inputs[0], params);
+        break;
+      }
       case OP_TOPK: {
         node = TopK::deserialize(*this, dez, inputs, num_inputs);
         break;
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index b27d2f3421..8d1133f7c9 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -43,6 +43,7 @@
 #include "flexflow/ops/gather.h"
 #include "flexflow/ops/groupby.h"
 #include "flexflow/ops/inc_multihead_self_attention.h"
+#include "flexflow/ops/inc_multiquery_self_attention.h"
 #include "flexflow/ops/layer_norm.h"
 #include "flexflow/ops/linear.h"
 #include "flexflow/ops/noop.h"
@@ -2783,6 +2784,12 @@ Op *FFModel::create_operator_from_layer(
       operators.push_back(op);
       return op;
     }
+    case OP_INC_MULTIQUERY_SELF_ATTENTION: {
+      Op *op = IncMultiQuerySelfAttention::create_operator_from_layer(
+          *this, layer, inputs);
+      operators.push_back(op);
+      return op;
+    }
     case OP_BATCHMATMUL: {
       Op *op = BatchMatmul::create_operator_from_layer(*this, layer, inputs);
       operators.push_back(op);
@@ -4656,6 +4663,25 @@ void register_flexflow_internal_tasks() {
         IncMultiHeadSelfAttention::inference_task>(
         registrar, "IncMultiHeadSelfAttention Inference Task");
   }
+  // MultiQueryAttention task
+  {
+    TaskVariantRegistrar registrar(INC_MULTIQUERY_SELF_ATTENTION_INIT_TASK_ID,
+                                   "IncMultiQuerySelfAttention Init");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<OpMeta *,
+                                      IncMultiQuerySelfAttention::init_task>(
+        registrar, "IncMultiQuerySelfAttention Init Task");
+  }
+  {
+    TaskVariantRegistrar registrar(INC_MULTIQUERY_SELF_ATTENTION_INF_TASK_ID,
+                                   "IncMultiQuerySelfAttention Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<
+        IncMultiQuerySelfAttention::inference_task>(
+        registrar, "IncMultiQuerySelfAttention Inference Task");
+  }
   // speculative MultiHeadAttention task
   {
     TaskVariantRegistrar registrar(
diff --git a/src/runtime/operator_params.cc b/src/runtime/operator_params.cc
index cd5e68d750..8fdeacc623 100644
--- a/src/runtime/operator_params.cc
+++ b/src/runtime/operator_params.cc
@@ -18,6 +18,7 @@
 #include "flexflow/ops/gather.h"
 #include "flexflow/ops/groupby.h"
 #include "flexflow/ops/inc_multihead_self_attention.h"
+#include "flexflow/ops/inc_multiquery_self_attention.h"
 #include "flexflow/ops/layer_norm.h"
 #include "flexflow/ops/linear.h"
 #include "flexflow/ops/mean.h"
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index bceb6e5953..6cbd92dee6 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -15,26 +15,71 @@
 
 #include "flexflow/inference.h"
 #include "flexflow/parallel_ops/parallel_op.h"
-#include "flexflow/tokenizers.h"
+// #include "flexflow/tokenizers.h"
+#include <filesystem>
 #include <iomanip>
 #include <new>
+#include <stack>
 #include <stdexcept>
 
 namespace FlexFlow {
 
 using namespace Legion;
+using tokenizers::Tokenizer;
 
 LegionRuntime::Logger::Category log_req_mgr("RequestManager");
 
+std::string LoadBytesFromFile(std::string const &path) {
+  std::ifstream fs(path, std::ios::in | std::ios::binary);
+  assert(!fs.fail() && "no such file");
+  std::string data;
+  fs.seekg(0, std::ios::end);
+  size_t size = static_cast<size_t>(fs.tellg());
+  fs.seekg(0, std::ios::beg);
+  data.resize(size);
+  fs.read(data.data(), size);
+  return data;
+}
+
 RequestManager::RequestManager()
-    : tokenizer(nullptr), verbose(false), next_available_guid(1000000),
-      num_processed_requests(0) {}
+    : verbose(false), next_available_guid(1000000), num_processed_requests(0) {}
 
-RequestManager::RequestManager(Tokenizer *_tokenizer,
+RequestManager::RequestManager(ModelType model_type,
+                               std::string const &path,
                                bool _verbose,
                                std::string _output_filepath)
-    : tokenizer(_tokenizer), verbose(_verbose), next_available_guid(1000000),
-      num_processed_requests(0), output_filepath(_output_filepath) {}
+    : verbose(_verbose), next_available_guid(1000000),
+      num_processed_requests(0), output_filepath(_output_filepath) {
+
+  // bos id
+  this->model_type = model_type;
+  if (model_type == ModelType::LLAMA) {
+    this->tokenizer_ =
+        Tokenizer::FromBlobSentencePiece(LoadBytesFromFile(path));
+  } else if (model_type == ModelType::OPT) {
+    std::string tokenizer_folder =
+        (!path.empty() && path.back() != '/') ? path + '/' : path;
+    std::string vocab_file = tokenizer_folder + "gpt2-vocab.json";
+    std::string merges_file = tokenizer_folder + "gpt2-merges.txt";
+    std::string added_tokens_file = tokenizer_folder + "added_tokens.json";
+    std::filesystem::path path1(vocab_file);
+    std::filesystem::path path2(merges_file);
+    std::filesystem::path path3(added_tokens_file);
+    assert(std::filesystem::exists(path1) &&
+           "Vocab file gpt2-vocab.json does not exist at the specified path");
+    assert(std::filesystem::exists(path2) &&
+           "Merge file gpt2-merges.txt does not exist at the specified path");
+    // opt_tokenizer = new OptTokenizer(vocab_file, merges_file);
+    std::string vocab = LoadBytesFromFile(path1.string());
+    std::string merges = LoadBytesFromFile(path2.string());
+    std::string added_tokens = LoadBytesFromFile(path3.string());
+
+    this->tokenizer_ =
+        Tokenizer::FromBlobByteLevelBPE(vocab, merges, added_tokens);
+  } else if (model_type == ModelType::FALCON) {
+    this->tokenizer_ = Tokenizer::FromBlobJSON(LoadBytesFromFile(path));
+  }
+}
 
 int RequestManager::register_new_model(FFModel *model) {
   int model_id = models.size();
@@ -94,8 +139,14 @@ RequestManager::RequestGuid
   Request request;
   request.guid = next_available_guid++;
   request.max_sequence_length = max_sequence_length;
-  request.tokens.push_back(tokenizer->bos_token_id);
-  std::vector<int32_t> tokens = tokenizer->Encode(prompt);
+  request.tokens.push_back(this->model_bos_map.at(this->model_type));
+  std::vector<int32_t> tokens = this->tokenizer_->Encode(prompt);
+
+  for (int i = 0; i < tokens.size(); i++) {
+    std::cout << tokens.at(i) << "\n";
+  }
+
+  // assert(false);
   request.tokens.insert(request.tokens.end(), tokens.begin(), tokens.end());
   request.initial_len = request.tokens.size();
 
@@ -143,7 +194,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
       // This is a decoding token
       log_req_mgr.print("Output token is: %d", result.token_ids[i]);
       request.tokens.push_back(result.token_ids[i]);
-      std::string output = tokenizer->Decode(request.tokens);
+      std::string output = this->tokenizer_->Decode(request.tokens);
       log_req_mgr.print("Output: %s", output.c_str());
     }
   }
@@ -165,7 +216,11 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
       log_req_mgr.print("[Done] guid(%zu) final_length(%zu)",
                         old_bc.requestsInfo[i].request_guid,
                         request.tokens.size());
-      std::string output = tokenizer->Decode(request.tokens);
+      std::string output = this->tokenizer_->Decode(request.tokens);
+
+      for (int i = 0; i < request.tokens.size(); i++) {
+        std::cout << request.tokens.at(i) << "\n";
+      }
       log_req_mgr.print("Final output: %s", output.c_str());
       num_processed_requests++;
       ProfileInfo profile_info = profiling_requests[request.guid];
@@ -481,7 +536,7 @@ BeamSearchBatchConfig
       log_req_mgr.print("[Done] guid(%zu) with final length(%zu)",
                         request.guid,
                         request.tokens.size());
-      std::string output = tokenizer->Decode(request.tokens);
+      std::string output = this->tokenizer_->Decode(request.tokens);
       log_req_mgr.print("Final output: %s", output.c_str());
       new_bc.request_completed[i] = true;
       num_processed_requests++;
@@ -574,7 +629,7 @@ BeamSearchBatchConfig
         break;
       }
     }
-    std::string output = tokenizer->Decode(request.tokens);
+    std::string output = this->tokenizer_->Decode(request.tokens);
     log_req_mgr.print("Output: %s", output.c_str());
   }
 
diff --git a/src/runtime/substitution.cc b/src/runtime/substitution.cc
index 0c2a2e3f84..58623258f1 100644
--- a/src/runtime/substitution.cc
+++ b/src/runtime/substitution.cc
@@ -29,6 +29,7 @@
 #include "flexflow/ops/experts.h"
 #include "flexflow/ops/flat.h"
 #include "flexflow/ops/inc_multihead_self_attention.h"
+#include "flexflow/ops/inc_multiquery_self_attention.h"
 #include "flexflow/ops/linear.h"
 #include "flexflow/ops/noop.h"
 #include "flexflow/ops/pool_2d.h"
@@ -3715,6 +3716,13 @@ bool FFModel::convert_graph_to_operators(
         new_op = new IncMultiHeadSelfAttention(*this, *attn, inputs[0], true);
         break;
       }
+      case OP_INC_MULTIQUERY_SELF_ATTENTION: {
+        assert(inList.size() == 1);
+        IncMultiQuerySelfAttention *attn =
+            (IncMultiQuerySelfAttention *)node.ptr;
+        new_op = new IncMultiQuerySelfAttention(*this, *attn, inputs[0], true);
+        break;
+      }
       case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(inList.size() == 1);
         TreeIncMultiHeadSelfAttention *attn =
diff --git a/tests/inference/huggingface_inference.py b/tests/inference/huggingface_inference.py
index 3442fe6120..788d001dd8 100644
--- a/tests/inference/huggingface_inference.py
+++ b/tests/inference/huggingface_inference.py
@@ -3,7 +3,6 @@
 import os
 from transformers import AutoModelForCausalLM, AutoTokenizer, LlamaTokenizer
 
-
 def main():
     # Change working dir to folder storing this script
     abspath = os.path.abspath(__file__)
diff --git a/tests/inference_tests.sh b/tests/inference_tests.sh
index c04000c72b..8971fc206e 100755
--- a/tests/inference_tests.sh
+++ b/tests/inference_tests.sh
@@ -13,7 +13,8 @@ cd "${BASH_SOURCE[0]%/*}"
 cleanup
 
 # Update the transformers library to support the LLAMA model
-pip3 install --upgrade transformers sentencepiece 
+
+pip3 install --upgrade transformers sentencepiece
 
 # Download the weights in both half and full precision
 python3 ../inference/utils/download_llama_weights.py
@@ -126,10 +127,10 @@ python3 ./inference/huggingface_inference.py --model-name "decapoda-research/lla
 python3 ./inference/huggingface_inference.py --model-name "decapoda-research/llama-7b-hf" --tokenizer-model-name "JackFram/llama-160m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B_half.txt" --gpu
 
 # OPT (small model, full precision)
-python3 ./inference/huggingface_inference.py --model-name "facebook/opt-125m" --tokenizer-model-name "facebook/opt-125m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_125M.txt" --gpu --max-length 127
+python3 ./inference/huggingface_inference.py --model-name "facebook/opt-125m" --tokenizer-model-name "facebook/opt-125m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_125M.txt" --gpu --max-length 128
 
 # OPT (small model, half precision)
-python3 ./inference/huggingface_inference.py --model-name "facebook/opt-125m" --tokenizer-model-name "facebook/opt-125m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_125M_half.txt" --gpu --max-length 127
+python3 ./inference/huggingface_inference.py --model-name "facebook/opt-125m" --tokenizer-model-name "facebook/opt-125m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_125M_half.txt" --gpu --max-length 128
 
 # OPT (big model, full precision)
 #python3 ./inference/huggingface_inference.py --model-name "facebook/opt-6.7b" --tokenizer-model-name "facebook/opt-6.7b" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_6B.txt" --max-length 127

From 2fd3d69361726156b7995cd66a023faa937fc62c Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 19 Jun 2023 17:41:45 +0800
Subject: [PATCH 152/344] [Inference] - Fix build issues (#779)

* fix gpu-ci

* add check for rust in cmake
---
 .github/workflows/gpu-ci.yml | 9 +++++++++
 CMakeLists.txt               | 8 ++++++++
 2 files changed, 17 insertions(+)

diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index 95983f889b..9797670c77 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -194,10 +194,19 @@ jobs:
     steps:
       - name: Install updated git version
         run: sudo add-apt-repository ppa:git-core/ppa -y && sudo apt update -y && sudo apt install -y --no-install-recommends git
+      
       - name: Checkout Git Repository
         uses: actions/checkout@v3
         with:
           submodules: recursive
+      
+      - name: Install conda and FlexFlow dependencies
+        uses: conda-incubator/setup-miniconda@v2
+        with:
+          miniconda-version: "latest"
+          activate-environment: flexflow
+          environment-file: conda/flexflow-cpu.yml
+          auto-activate-base: false
 
       - name: Build and Install FlexFlow
         run: |
diff --git a/CMakeLists.txt b/CMakeLists.txt
index ae25c851a9..aeec820452 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -482,6 +482,14 @@ if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_TOKENIZER)
   if (FF_GPU_BACKEND STREQUAL "hip_rocm")
     SET(SPM_USE_BUILTIN_PROTOBUF OFF CACHE BOOL "Use builtin version of protobuf to compile SentencePiece")
   endif()
+  # Ensure Rust is installed
+  execute_process(COMMAND rustc --version
+                RESULT_VARIABLE RUST_COMMAND_RESULT
+                OUTPUT_VARIABLE RUSTC_OUTPUT
+                ERROR_QUIET)
+  if(NOT RUST_COMMAND_RESULT EQUAL 0)
+    message(FATAL_ERROR "Rust is not installed on the system. Cannot build the tokenizers.")
+  endif()
   add_subdirectory(deps/tokenizers-cpp tokenizers EXCLUDE_FROM_ALL)
   target_include_directories(flexflow PUBLIC deps/tokenizers-cpp/include)
   target_link_libraries(flexflow tokenizers_cpp)

From c44a64b00b17a84094d729f7f97798ae18506b31 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Thu, 22 Jun 2023 16:16:51 -0500
Subject: [PATCH 153/344] Support CPU Offload in SpecInfer (#765)

* decomp

* initial implementation

* add missing file

* checkpoint

* more bug fixes

* update default offload size

* fix non-offload

* undo changes to spec_inc_mha

* fix a parallel tensor reuse bug

* prepare_next_batch for offload(inc_decode)

* format

* int4&int8 offload

* fix merge issue

* fix build

* spec_infer offload&quantize

* fix, update readme.

* remove redundant

* hip build

* hip

* model param

---------

Co-authored-by: xinhaoc <chengxh_98@163.com>
---
 .github/README.md                             |  15 +-
 include/flexflow/accessor.h                   |   2 +
 include/flexflow/batch_config.h               |   4 +-
 include/flexflow/config.h                     |   8 +
 include/flexflow/ffconst.h                    |   2 +
 include/flexflow/ffconst_utils.h              |   6 +
 include/flexflow/model.h                      |   3 +-
 .../ops/inc_multihead_self_attention.h        |  22 +-
 .../ops/inc_multihead_self_attention_params.h |   3 +-
 .../flexflow/ops/kernels/decompress_kernels.h |  43 +++
 .../inc_multihead_self_attention_kernels.h    |   6 +
 include/flexflow/ops/kernels/linear_kernels.h |  12 +-
 include/flexflow/ops/linear.h                 |   9 +-
 include/flexflow/ops/linear_params.h          |   2 +
 .../ops/spec_inc_multihead_self_attention.h   |   2 +-
 .../ops/tree_inc_multihead_self_attention.h   |   8 +-
 ...tree_inc_multihead_self_attention_params.h |   3 +-
 include/flexflow/utils/memory_allocator.h     |  67 ++++
 inference/file_loader.cc                      | 327 +++++++++++++++++-
 inference/file_loader.h                       |   9 +-
 inference/incr_decoding/incr_decoding.cc      |   5 +-
 inference/models/falcon.cc                    |   2 +-
 inference/models/llama.cc                     |   3 +-
 inference/models/opt.cc                       |   2 +-
 inference/spec_infer/spec_infer.cc            |   2 +-
 inference/utils/compress_llama_weights.py     | 117 +++++++
 src/ops/beam_topk.cu                          |  16 +-
 src/ops/inc_multihead_self_attention.cc       | 146 +++++---
 src/ops/inc_multihead_self_attention.cpp      |   8 +-
 src/ops/inc_multihead_self_attention.cu       | 290 +++++++++++++---
 src/ops/kernels/decompress_kernels.cu         | 261 ++++++++++++++
 src/ops/kernels/linear_kernels.cpp            |   6 +-
 src/ops/kernels/linear_kernels.cu             |  69 +++-
 src/ops/linear.cc                             | 198 ++++++++---
 src/ops/spec_inc_multihead_self_attention.cc  |   7 +-
 src/ops/spec_inc_multihead_self_attention.cpp |   8 +-
 src/ops/spec_inc_multihead_self_attention.cu  |  54 +--
 src/ops/tree_inc_multihead_self_attention.cc  | 141 +++++---
 src/ops/tree_inc_multihead_self_attention.cpp |   8 +-
 src/ops/tree_inc_multihead_self_attention.cu  | 125 +++++--
 src/runtime/accessor.cc                       |  60 ++++
 src/runtime/ffconst_utils.cc                  |   9 +
 src/runtime/graph.cc                          |  18 +-
 src/runtime/inference_manager.cc              |  94 ++++-
 src/runtime/memory_allocator.cc               |  54 +++
 src/runtime/model.cc                          |  36 +-
 src/runtime/model.cu                          |  27 ++
 src/runtime/parallel_tensor.cc                |   8 +
 48 files changed, 2008 insertions(+), 319 deletions(-)
 create mode 100644 include/flexflow/ops/kernels/decompress_kernels.h
 create mode 100644 include/flexflow/utils/memory_allocator.h
 create mode 100644 inference/utils/compress_llama_weights.py
 create mode 100644 src/ops/kernels/decompress_kernels.cu
 create mode 100644 src/runtime/memory_allocator.cc

diff --git a/.github/README.md b/.github/README.md
index 59377e308e..010d7c07bb 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -63,9 +63,22 @@ SpecInfer supports two tokenizers:
 * The SentencePiece tokenizer is used to support the LLaMA model family (e.g., LLaMA-6B, LLaMA-13B, and LLaMA-190M in our demo). We used the pretrained sentencepiece tokenizer from LLAMA, which is also available on Hugging Face (model id: `decapoda-research/llama-7b-hf`). If you  are using our LLAMA-160M weights for the demo, however, you should use the tokenizer from the [JackFram/llama-160m](https://huggingface.co/JackFram/llama-160m/resolve/main/tokenizer.model) HuggingFace repo.
 * The GPT2 tokenizer is used to support the Open Pre-trained Transformer model family (e.g., OPT-13B and OPT-125M). To use it, download the [vocab](https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-vocab.json) and [merges](https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-merges.txt) files and pass the folder containing them as a parameter. 
 
-### Mixed-precision support
+### Mixed-precision Support
 SpecInfer now supports single-precision floating points and half-precision floating points. By default we use half-precision. Add `--use-full-precision` to the command line to run the demo with single-precision, please make sure to use the correct weight files in the form below.
 
+### CPU Offloading
+SpecInfer offers offloading-based inference for running large models (e.g., llama-7B) on a single GPU. CPU offloading is a choice to save tensors in CPU memory, and only copy the tensor to GPU when doing calculation. Notice that now we selectively offload the largest weight tensors (weights tensor in Linear, Attention). Besides, since the small model occupies considerably less space, it it does not pose a bottleneck for GPU memory, the offloading will bring more runtime space and computational cost, so we only do the offloading for the large model. You can run the offloading example by adding `-offload` and `-offload-reserve-space-size` flags.
+#### Quantization
+To reduce data transferred between the CPU and GPU, SpecInfer provides int4 and int8 quantization. The compressed tensors are stored on the CPU side. Once copied to the GPU, these tensors undergo decompression and conversion back to their original precision. Please find the compressed weight files in our s3 bucket, or use [this script](../inference/utils/compress_llama_weights.py) from [FlexGen](https://github.com/FMInference/FlexGen) project to do the compression manually. The quantization method can be selected using the `--4bit-quantization` and `--8bit-quantization` flags.
+
+Below is an example command line to use offloading and quantization in SpecInfer.
+
+```bash
+./inference/spec_infer/spec_infer -ll:gpu 1 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight /path/to/llm/weights -llm-config /path/to/llm/config.json -ssm-model llama -ssm-weight /path/to/ssm1/weights -ssm-config /path/to/ssm/config.json -ssm-model llama -smm-weight /path/to/ssm2/weights -ssm-config /path/to/ssm2/config.json -tokenizer /path/to/tokenizer.model -prompt /path/to/prompt.json --use-full-precision -offload -offload-reserve-space-size 6000 --8bit-quantization
+```
+
+
+
 ### LLM Weights
 The weight files used in our demo are extracted from HuggingFace, and stored in our AWS S3 bucket.
 
diff --git a/include/flexflow/accessor.h b/include/flexflow/accessor.h
index 6f95354823..65ab33b513 100644
--- a/include/flexflow/accessor.h
+++ b/include/flexflow/accessor.h
@@ -61,6 +61,7 @@ class GenericTensorAccessorW {
   float *get_float_ptr() const;
   double *get_double_ptr() const;
   half *get_half_ptr() const;
+  char *get_byte_ptr() const;
   DataType data_type;
   Legion::Domain domain;
   void *ptr;
@@ -79,6 +80,7 @@ class GenericTensorAccessorR {
   float const *get_float_ptr() const;
   double const *get_double_ptr() const;
   half const *get_half_ptr() const;
+  char const *get_byte_ptr() const;
   DataType data_type;
   Legion::Domain domain;
   void const *ptr;
diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 39fcc49c68..b56466bfe5 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -112,8 +112,8 @@ class BeamSearchBatchConfig : public BatchConfig {
 
   size_t beam_width;
   size_t target_iterations;
-  static int const MAX_BEAM_WIDTH = 1;
-  static int const MAX_BEAM_DEPTH = 8;
+  inline static int const MAX_BEAM_WIDTH = 1;
+  inline static int const MAX_BEAM_DEPTH = 8;
 
   int model_id;
 
diff --git a/include/flexflow/config.h b/include/flexflow/config.h
index c8a9f50aa2..f5eb2e069a 100644
--- a/include/flexflow/config.h
+++ b/include/flexflow/config.h
@@ -70,6 +70,9 @@ struct FFHandler {
 #endif
   void *workSpace;
   size_t workSpaceSize;
+  void *offload_reserve_space;
+  size_t offload_reserve_space_size;
+  DataType quantization_type;
   bool allowTensorOpMathConversion;
 #ifdef FF_USE_NCCL
   ncclComm_t ncclComm;
@@ -78,6 +81,8 @@ struct FFHandler {
 
 struct FFInitInfo {
   size_t workSpaceSize;
+  size_t offload_reserve_space_size;
+  DataType quantization_type;
   bool allowTensorOpMathConversion;
   // int myRank, allRanks;
 };
@@ -129,6 +134,9 @@ class FFConfig {
   float search_alpha;
   bool search_overlap_backward_update;
   CompMode computationMode;
+  bool cpu_offload;
+  size_t offload_reserve_space_size;
+  DataType quantization_type;
   // Control parallelizable dimensions
   bool only_data_parallel;
   bool enable_sample_parallel;
diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index 3cd42ccffe..0b572a9674 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -33,6 +33,8 @@ enum DataType {
   DT_HALF = 43,
   DT_FLOAT = 44,
   DT_DOUBLE = 45,
+  DT_INT4 = 46,
+  DT_INT8 = 47,
   DT_NONE = 49,
 };
 
diff --git a/include/flexflow/ffconst_utils.h b/include/flexflow/ffconst_utils.h
index e2d04ad5a5..421a139d57 100644
--- a/include/flexflow/ffconst_utils.h
+++ b/include/flexflow/ffconst_utils.h
@@ -10,6 +10,12 @@ std::string get_operator_type_name(OperatorType type);
 
 size_t data_type_size(DataType type);
 
+#define INT4_NUM_OF_ELEMENTS_PER_GROUP 32
+
+size_t get_quantization_to_byte_size(DataType type,
+                                     DataType quantization_type,
+                                     size_t num_elements);
+
 std::ostream &operator<<(std::ostream &, OperatorType);
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 1f06fb7994..1277b29b3d 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -360,12 +360,13 @@ std::vector<ParallelTensorShape>
 
 class FFModel {
 public:
-  FFModel(FFConfig &config);
+  FFModel(FFConfig &config, bool cpu_offload = false);
 
   static constexpr float PROPAGATION_CHANCE = 0.25;
   static constexpr float CONTINUE_PROPAGATION_CHANCE = 0.75;
   static constexpr float PROPAGATION_SIZE_WEIGHT = 1.0;
 
+  bool cpu_offload;
   // C++ APIs for constructing models
   // Add an exp layer
   Tensor exp(const Tensor x, char const *name = NULL);
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index baf126f41e..a178dad577 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -9,6 +9,7 @@
 #include "flexflow/op_meta.h"
 #include "flexflow/operator.h"
 #include "flexflow/ops/inc_multihead_self_attention_params.h"
+#include "flexflow/utils/memory_allocator.h"
 #include "math.h"
 #include <cfloat>
 #include <complex>
@@ -38,6 +39,8 @@ class IncMultiHeadSelfAttention : public Op {
                             float _scaling_factor,
                             bool _qk_prod_scaling,
                             bool allocate_weights,
+                            DataType _quantization_type,
+                            bool _offload,
                             char const *name);
   IncMultiHeadSelfAttention(FFModel &model,
                             const ParallelTensor _input,
@@ -55,6 +58,8 @@ class IncMultiHeadSelfAttention : public Op {
                             float _scaling_factor,
                             bool _qk_prod_scaling,
                             bool allocate_weights,
+                            DataType _quantization_type,
+                            bool _offload,
                             char const *name);
   IncMultiHeadSelfAttention(FFModel &model,
                             IncMultiHeadSelfAttention const &other,
@@ -114,6 +119,8 @@ class IncMultiHeadSelfAttention : public Op {
       qk_prod_scaling;
   int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
   int qoSeqLength, kvSeqLength;
+  DataType quantization_type;
+  bool offload;
 };
 
 class IncMultiHeadSelfAttentionMeta : public OpMeta {
@@ -121,7 +128,7 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
   IncMultiHeadSelfAttentionMeta(FFHandler handler,
                                 IncMultiHeadSelfAttention const *attn,
                                 GenericTensorAccessorR const &weight,
-                                Legion::Memory gpu_mem,
+                                MemoryAllocator &gpu_mem_allocator,
                                 int num_samples,
                                 int _num_heads);
   IncMultiHeadSelfAttentionMeta(FFHandler handler,
@@ -141,14 +148,17 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
                                 bool _add_bias_kv,
                                 float _scaling_factor,
                                 GenericTensorAccessorR const &weight,
-                                Legion::Memory gpu_mem,
+                                MemoryAllocator &gpu_mem_allocator,
                                 int num_samples,
-                                int _num_heads);
+                                int _num_heads,
+                                DataType _quantization_type,
+                                bool _offload);
   ~IncMultiHeadSelfAttentionMeta(void);
 
 public:
   Realm::RegionInstance reserveInst;
-  size_t weights_params, weightSize, reserveSpaceSize;
+  size_t weights_params, weightSize, biasSize, reserveSpaceSize,
+      quantized_weightSize;
   int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
   int num_heads;
   bool *has_load_weights;
@@ -160,10 +170,14 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
 #ifdef INFERENCE_TESTS
   float *kcache, *vcache;
 #endif
+  void *weight_ptr, *bias_ptr; // for weight offload
   void *devQKVProjArray, *keyCache, *valueCache;
   void *qk_prods, *qk_prods_softmax;
   void *attn_heads, *W_out_contiguous;
+  char *quantized_weight_ptr;
   BatchConfig::PerTokenInfo *token_infos;
+  DataType quantization_type;
+  bool offload;
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
   cuFloatComplex *complex_input;
 #endif
diff --git a/include/flexflow/ops/inc_multihead_self_attention_params.h b/include/flexflow/ops/inc_multihead_self_attention_params.h
index 66aed3bf3b..d95aaf2e05 100644
--- a/include/flexflow/ops/inc_multihead_self_attention_params.h
+++ b/include/flexflow/ops/inc_multihead_self_attention_params.h
@@ -12,7 +12,8 @@ struct IncMultiHeadSelfAttentionParams {
   float dropout, scaling_factor;
   bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
       qk_prod_scaling;
-
+  DataType quantization_type;
+  bool offload;
   bool is_valid(ParallelTensorShape const &) const;
 };
 
diff --git a/include/flexflow/ops/kernels/decompress_kernels.h b/include/flexflow/ops/kernels/decompress_kernels.h
new file mode 100644
index 0000000000..7cfedd6265
--- /dev/null
+++ b/include/flexflow/ops/kernels/decompress_kernels.h
@@ -0,0 +1,43 @@
+#ifndef _FLEXFLOW_DECOMPRESS_KERNELS_H
+#define _FLEXFLOW_DECOMPRESS_KERNELS_H
+
+#include "flexflow/device.h"
+
+namespace FlexFlow {
+namespace Kernels {
+
+template <typename DT>
+__global__ void decompress_int4_general_weights(char const *input_weight_ptr,
+                                                DT *weight_ptr,
+                                                int in_dim,
+                                                int valueSize);
+template <typename DT>
+__global__ void decompress_int8_general_weights(char const *input_weight_ptr,
+                                                DT *weight_ptr,
+                                                int in_dim,
+                                                int valueSize);
+
+template <typename DT>
+__global__ void decompress_int4_attention_weights(char *input_weight_ptr,
+                                                  DT *weight_ptr,
+                                                  int qProjSize,
+                                                  int qSize,
+                                                  int num_heads);
+
+template <typename DT>
+__global__ void decompress_int8_attention_weights(char *input_weight_ptr,
+                                                  DT *weight_ptr,
+                                                  int qProjSize,
+                                                  int qSize,
+                                                  int num_heads);
+// template <typename T1, typename T2>
+// void decompress_weight_bias(T1 *input_weight_ptr,
+//                             T2 *weight_ptr,
+//                             T2 *params,
+//                             int group_size,
+//                             int tensor_size);
+
+} // namespace Kernels
+} // namespace FlexFlow
+
+#endif // _FLEXFLOW_DECOMPRESS_KERNELS_H
diff --git a/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h b/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
index 0e0b1b4da9..a35cf9d7f2 100644
--- a/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
+++ b/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
@@ -58,6 +58,12 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                         DT *output_ptr,
                         DT const *bias_ptr,
                         cudaStream_t stream);
+
+template <typename DT>
+void pre_build_weight_kernel(IncMultiHeadSelfAttentionMeta const *m,
+                             GenericTensorAccessorR const weight,
+                             DataType data_type,
+                             cudaStream_t stream);
 } // namespace IncMultiHeadAttention
 } // namespace Kernels
 } // namespace FlexFlow
diff --git a/include/flexflow/ops/kernels/linear_kernels.h b/include/flexflow/ops/kernels/linear_kernels.h
index 9ed99c93a1..ed4864b1ab 100644
--- a/include/flexflow/ops/kernels/linear_kernels.h
+++ b/include/flexflow/ops/kernels/linear_kernels.h
@@ -10,7 +10,11 @@ namespace FlexFlow {
 
 class LinearMeta : public OpMeta {
 public:
-  LinearMeta(FFHandler handle, int batch_size, Linear const *li);
+  LinearMeta(FFHandler handle,
+             int batch_size,
+             Linear const *li,
+             MemoryAllocator gpu_mem_allocator,
+             int weightSize);
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
   cudnnTensorDescriptor_t outputTensor;
   cudnnActivationDescriptor_t actiDesc;
@@ -19,6 +23,12 @@ class LinearMeta : public OpMeta {
   miopenActivationDescriptor_t actiDesc;
 #endif
   void *one_ptr;
+  void *weight_ptr;
+  DataType weight_ptr_type;
+  DataType quantization_type;
+  bool offload;
+  char *quantized_weight_ptr;
+  size_t quantized_weightSize;
   ActiMode activation;
   RegularizerMode kernel_reg_type;
   float kernel_reg_lambda;
diff --git a/include/flexflow/ops/linear.h b/include/flexflow/ops/linear.h
index bbc40ef320..7b134502b7 100644
--- a/include/flexflow/ops/linear.h
+++ b/include/flexflow/ops/linear.h
@@ -5,6 +5,7 @@
 #include "flexflow/node.h"
 #include "flexflow/operator.h"
 #include "flexflow/ops/linear_params.h"
+#include "flexflow/utils/memory_allocator.h"
 
 namespace FlexFlow {
 
@@ -25,6 +26,8 @@ class Linear : public Op {
          float kernel_reg_lambda,
          bool _use_bias,
          DataType _data_type,
+         DataType _quantization_type,
+         bool offload,
          bool allocate_weights,
          char const *name);
   Linear(FFModel &model,
@@ -96,13 +99,13 @@ class Linear : public Op {
          bool allocate_weights,
          char const *name);
 
-  template <typename DT, int NDIM>
+  template <typename DT, typename WT, int NDIM>
   static OpMeta *
       init_task_with_dim(Legion::Task const *task,
                          std::vector<Legion::PhysicalRegion> const &regions,
                          Legion::Context ctx,
                          Legion::Runtime *runtime);
-  template <typename DT, int NDIM>
+  template <typename DT, typename WT, int NDIM>
   static void
       forward_task_with_dim(Legion::Task const *task,
                             std::vector<Legion::PhysicalRegion> const &regions,
@@ -126,6 +129,8 @@ class Linear : public Op {
   float kernel_reg_lambda;
   bool use_bias;
   ParallelTensor replica;
+  DataType quantization_type;
+  bool offload;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/ops/linear_params.h b/include/flexflow/ops/linear_params.h
index 2c41694960..563304e89f 100644
--- a/include/flexflow/ops/linear_params.h
+++ b/include/flexflow/ops/linear_params.h
@@ -18,6 +18,8 @@ class LinearParams {
   ActiMode activation;
   RegularizerMode kernel_reg_type;
   float kernel_reg_lambda;
+  DataType quantization_type;
+  bool offload;
 
   bool is_valid(ParallelTensorShape const &input_shape) const;
   void solve_dims(const ParallelTensor input,
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention.h b/include/flexflow/ops/spec_inc_multihead_self_attention.h
index 92d52b43b1..db12be5792 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention.h
@@ -126,7 +126,7 @@ class SpecIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
   SpecIncMultiHeadSelfAttentionMeta(FFHandler handler,
                                     SpecIncMultiHeadSelfAttention const *attn,
                                     GenericTensorAccessorR const &weight,
-                                    Legion::Memory gpu_mem,
+                                    MemoryAllocator &gpu_mem_allocator,
                                     int num_samples,
                                     int _num_heads);
   ~SpecIncMultiHeadSelfAttentionMeta(void);
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention.h b/include/flexflow/ops/tree_inc_multihead_self_attention.h
index eef51bc21f..328ab128b2 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention.h
@@ -38,6 +38,8 @@ class TreeIncMultiHeadSelfAttention : public Op {
                                 float _scaling_factor,
                                 bool _qk_prod_scaling,
                                 bool allocate_weights,
+                                DataType _quantization_type,
+                                bool _offload,
                                 char const *name);
   TreeIncMultiHeadSelfAttention(FFModel &model,
                                 const ParallelTensor _input,
@@ -55,6 +57,8 @@ class TreeIncMultiHeadSelfAttention : public Op {
                                 float _scaling_factor,
                                 bool _qk_prod_scaling,
                                 bool allocate_weights,
+                                DataType _quantization_type,
+                                bool _offload,
                                 char const *name);
   TreeIncMultiHeadSelfAttention(FFModel &model,
                                 TreeIncMultiHeadSelfAttention const &other,
@@ -115,6 +119,8 @@ class TreeIncMultiHeadSelfAttention : public Op {
       qk_prod_scaling;
   int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
   int qoSeqLength, kvSeqLength;
+  DataType quantization_type;
+  bool offload;
 };
 
 class TreeIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
@@ -122,7 +128,7 @@ class TreeIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
   TreeIncMultiHeadSelfAttentionMeta(FFHandler handler,
                                     TreeIncMultiHeadSelfAttention const *attn,
                                     GenericTensorAccessorR const &weight,
-                                    Legion::Memory gpu_mem,
+                                    MemoryAllocator &gpu_mem_allocator,
                                     int num_samples,
                                     int _num_heads);
   ~TreeIncMultiHeadSelfAttentionMeta(void);
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention_params.h b/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
index f8fbac7e8e..0eede3bd2f 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
@@ -12,7 +12,8 @@ struct TreeIncMultiHeadSelfAttentionParams {
   float dropout, scaling_factor;
   bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
       qk_prod_scaling;
-
+  DataType quantization_type;
+  bool offload;
   bool is_valid(ParallelTensorShape const &) const;
 };
 
diff --git a/include/flexflow/utils/memory_allocator.h b/include/flexflow/utils/memory_allocator.h
new file mode 100644
index 0000000000..8e50a4c3b3
--- /dev/null
+++ b/include/flexflow/utils/memory_allocator.h
@@ -0,0 +1,67 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#ifndef _FLEXFLOW_UTILS_MEMORY_ALLOCATOR_H_
+#define _FLEXFLOW_UTILS_MEMORY_ALLOCATOR_H_
+
+#include "flexflow/config.h"
+
+namespace FlexFlow {
+
+class MemoryAllocator {
+public:
+  MemoryAllocator(Legion::Memory memory);
+  void create_legion_instance(Realm::RegionInstance &inst, size_t size);
+  void register_reserved_work_space(void *base, size_t size);
+  inline void *allocate_reserved_untyped(size_t datalen) {
+    void *ptr = static_cast<char *>(reserved_ptr) + reserved_allocated_size;
+    reserved_allocated_size += datalen;
+    assert(reserved_allocated_size <= reserved_total_size);
+    return ptr;
+  }
+  template <typename DT>
+  inline DT *allocate_reserved(size_t count) {
+    void *ptr = static_cast<char *>(reserved_ptr) + reserved_allocated_size;
+    reserved_allocated_size += sizeof(DT) * count;
+    assert(reserved_allocated_size <= reserved_total_size);
+    return static_cast<DT *>(ptr);
+  }
+
+  inline void *allocate_instance_untyped(size_t datalen) {
+    void *ptr = static_cast<char *>(instance_ptr) + instance_allocated_size;
+    instance_allocated_size += datalen;
+    assert(instance_allocated_size <= instance_total_size);
+    return ptr;
+  }
+
+  template <typename DT>
+  inline DT *allocate_instance(size_t count) {
+    void *ptr = static_cast<char *>(instance_ptr) + instance_allocated_size;
+    instance_allocated_size += sizeof(DT) * count;
+    assert(instance_allocated_size <= instance_total_size);
+    return static_cast<DT *>(ptr);
+  }
+
+public:
+  Legion::Memory memory;
+  void *reserved_ptr;
+  void *instance_ptr;
+  size_t reserved_total_size, reserved_allocated_size;
+  size_t instance_total_size, instance_allocated_size;
+};
+
+}; // namespace FlexFlow
+
+#endif // _FLEXFLOW_RUNTIME_H_
diff --git a/inference/file_loader.cc b/inference/file_loader.cc
index d7bb8a7b4c..a7386d6597 100644
--- a/inference/file_loader.cc
+++ b/inference/file_loader.cc
@@ -85,7 +85,6 @@ void load_attention_bias(DT *ptr,
   int file_index = 0;
   for (auto file : bias_files) {
     size_t partial_size = hidden_dim;
-    // std::cout << "Loading filename: " << file << std::endl;
     std::ifstream in(file, std::ios::in | std::ios::binary);
     assert(in.good() && "incorrect bias file path");
     std::vector<DT> host_array(partial_size);
@@ -199,7 +198,6 @@ void load_attention_weights(DT *ptr,
     size_t partial_size = one_weight_file_size;
 
     std::ifstream in(file, std::ios::in | std::ios::binary);
-    // std::cout << "Loading filename: " << file << std::endl;
     if (!in.good()) {
       std::cout << "Could not open file: " << file << std::endl;
     }
@@ -235,7 +233,6 @@ void load_attention_weights(DT *ptr,
 
 template <typename DT>
 void load_from_file(DT *ptr, size_t size, std::string filename) {
-  // std::cout << "Loading filename: " << filename << std::endl;
   std::ifstream in(filename, std::ios::in | std::ios::binary);
   if (!in.good()) {
     std::cout << "Could not open file: " << filename << std::endl;
@@ -288,6 +285,320 @@ void FileDataLoader::load_positions(FFModel *ff,
   position_pt->set_tensor<int>(ff, dims_vec, data);
 }
 
+//--------------------- quantization functions ----------------------
+// the data layout is 32 * quantized data + 1 scaling factor + 1 offset factor
+// in the decompression mode, the real data = quantized data * scaling factor +
+// offset
+
+void load_attention_weights_quantized(char *ptr,
+                                      int num_heads,
+                                      size_t hidden_dim,
+                                      size_t qkv_inner_dim,
+                                      std::string layer_name,
+                                      std::string weight_path,
+                                      DataType data_type,
+                                      bool use_full_precision) {
+  // layers_0_attention_wq_weight
+  // layers_0_self_attn_q_proj_weight
+  std::string q_file = weight_path +
+                       layer_name.substr(0, layer_name.find("attention")) +
+                       "attention_wq_weight";
+  std::string k_file = weight_path +
+                       layer_name.substr(0, layer_name.find("attention")) +
+                       "attention_wk_weight";
+  std::string v_file = weight_path +
+                       layer_name.substr(0, layer_name.find("attention")) +
+                       "attention_wv_weight";
+  std::string o_file = weight_path +
+                       layer_name.substr(0, layer_name.find("attention")) +
+                       "attention_wo_weight";
+  std::vector<std::string> weight_files = {q_file, k_file, v_file, o_file};
+
+  int file_index = 0;
+
+  size_t single_proj_size =
+      hidden_dim *
+      qkv_inner_dim; // size of each of Q,K,V,O weights for a single head
+  size_t one_weight_file_size =
+      num_heads * single_proj_size; // size of each of Q/K/V/O for all heads
+
+  // q, k, v, o -> 0, 1, 2, 3
+  for (auto file : weight_files) {
+    size_t partial_size = one_weight_file_size;
+    std::ifstream in(file, std::ios::in | std::ios::binary);
+    if (!in.good()) {
+      std::cout << "Could not open file: " << file << std::endl;
+    }
+    assert(in.good() && "incorrect weight file path");
+    std::vector<char> host_array(partial_size);
+    size_t loaded_data_size = sizeof(char) * partial_size;
+    in.seekg(0, in.end);
+    in.seekg(0, in.beg);
+    in.read((char *)host_array.data(), loaded_data_size);
+    size_t in_get_size = in.gcount();
+
+    if (in_get_size != loaded_data_size) {
+      std::cout << "load data error";
+      return;
+    }
+    assert(partial_size == host_array.size());
+
+    size_t one_head_size = data_type == DT_INT8
+                               ? hidden_dim * (hidden_dim / num_heads)
+                               : hidden_dim * (hidden_dim / num_heads) / 2;
+
+    size_t data_index = 0;
+    for (int i = 0; i < num_heads; i++) {
+      size_t start_index = i * one_head_size * 4 + file_index * one_head_size;
+      for (size_t j = start_index; j < start_index + one_head_size; j++) {
+        if (data_type == DT_INT4) {
+          char v1 = host_array.at(data_index);
+          char v2 = host_array.at(data_index + 1);
+          ptr[j] = (v2 & 0XF) | (v1 << 4);
+          data_index += 2;
+        } else {
+          ptr[j] = host_array.at(data_index);
+          data_index += 1;
+        }
+      }
+    }
+    file_index++;
+    in.close();
+  }
+
+  // load scale and offset to the end of weight tensor
+  // the layout is like |values * 32 heads|offset|scale|
+  size_t offset = data_type == DT_INT8 ? one_weight_file_size * 4
+                                       : (one_weight_file_size * 4) / 2;
+  for (auto file : weight_files) {
+    for (int i = 0; i < 2; i++) {
+      std::string meta_file = i == 0 ? (file + "_offset") : (file + "_scale");
+      size_t partial_size =
+          one_weight_file_size / INT4_NUM_OF_ELEMENTS_PER_GROUP;
+      std::ifstream in(meta_file, std::ios::in | std::ios::binary);
+      if (!in.good()) {
+        std::cout << "Could not open file: " << meta_file << std::endl;
+      }
+      assert(in.good() && "incorrect weight file path");
+
+      if (use_full_precision) {
+        // float
+        std::vector<float> host_array(partial_size);
+        size_t loaded_data_size = sizeof(float) * partial_size;
+        in.seekg(0, in.end);
+        in.seekg(0, in.beg);
+        in.read((char *)host_array.data(), loaded_data_size);
+        size_t in_get_size = in.gcount();
+
+        if (in_get_size != loaded_data_size) {
+          std::cout << "load data error";
+          return;
+        }
+        assert(partial_size == host_array.size());
+
+        for (auto v : host_array) {
+          *(float *)(ptr + offset) = v;
+          offset += sizeof(float);
+        }
+      } else {
+        // half
+        std::vector<half> host_array(partial_size);
+        size_t loaded_data_size = sizeof(half) * partial_size;
+        in.seekg(0, in.end);
+        in.seekg(0, in.beg);
+        in.read((char *)host_array.data(), loaded_data_size);
+        size_t in_get_size = in.gcount();
+
+        if (in_get_size != loaded_data_size) {
+          std::cout << "load data error";
+          return;
+        }
+        assert(partial_size == host_array.size());
+        for (auto v : host_array) {
+          *(half *)(ptr + offset) = v;
+          offset += sizeof(half);
+        }
+      }
+    }
+  }
+}
+
+void load_from_quantized_file(char *ptr,
+                              size_t size,
+                              std::string filename,
+                              DataType data_type,
+                              bool use_full_precision) {
+  assert(data_type == DT_INT4 || data_type == DT_INT8);
+
+  std::string value_file = filename;
+  std::string offset_file = filename + "_offset";
+  std::string scaling_file = filename + "_scale";
+  size_t value_size = 0, offset_size = 0, scaling_size = 0;
+
+  if (data_type == DT_INT4) {
+    // float/half + 4bit quantization
+    // size1 = volume / 2, size2 = volume / 32 * (sizeof(DT)), size3 = size2
+    value_size = 2 * (use_full_precision ? (size * 2 / 3) : (size * 4 / 5));
+    offset_size = use_full_precision ? (size / 6) : (size / 10);
+    scaling_size = use_full_precision ? (size / 6) : (size / 10);
+  } else if (data_type == DT_INT8) {
+    // float/half + 8bit quantization
+    // size1 = volume * 1, size2 = volume / 32 * (sizeof(DT)), size3 = size2
+    value_size = use_full_precision ? (size * 4 / 5) : (size * 8 / 9);
+    offset_size = use_full_precision ? (size / 10) : (size / 18);
+    scaling_size = use_full_precision ? (size / 10) : (size / 18);
+  }
+
+  std::vector<std::string> quantized_files = {
+      value_file, offset_file, scaling_file};
+  std::vector<size_t> quantized_sizes = {value_size, offset_size, scaling_size};
+
+  int file_idx = 0;
+  long data_index = 0;
+  for (auto file : quantized_files) {
+    std::ifstream in(file, std::ios::in | std::ios::binary);
+    if (!in.good()) {
+      std::cout << "Could not open file: " << file << std::endl;
+    }
+    assert(in.good() && "incorrect weight file path");
+
+    // value file, every element is in one byte
+    if (file_idx == 0) {
+      size = quantized_sizes.at(file_idx);
+      std::vector<char> host_array(size);
+      size_t loaded_data_size = size;
+      in.seekg(0, in.end);
+      in.seekg(0, in.beg);
+      in.read((char *)host_array.data(), loaded_data_size);
+
+      size_t in_get_size = in.gcount();
+      if (in_get_size != loaded_data_size) {
+        std::cout << "load weight data error quantized" << in_get_size << ", "
+                  << loaded_data_size << ", " << sizeof(char) << std::endl;
+        return;
+      }
+      assert(size == host_array.size());
+
+      // normal
+      size_t idx = 0;
+      while (idx < host_array.size()) {
+        if (data_type == DT_INT4) {
+          // pack 2 elements into one byte
+          char v1 = host_array.at(idx);
+          char v2 = host_array.at(idx + 1);
+          // v1 in first 4 bit and v2 in last 4 bit;
+          ptr[data_index++] = (v2 & 0XF) | (v1 << 4);
+          idx += 2;
+        } else {
+          ptr[data_index++] = host_array.at(idx++);
+        }
+      }
+    } else if (use_full_precision) {
+      // load offset/scale in float type;
+      size = quantized_sizes.at(file_idx);
+      std::vector<float> host_array(size / sizeof(float));
+      size_t loaded_data_size = size;
+      in.seekg(0, in.end);
+      in.seekg(0, in.beg);
+      in.read((char *)host_array.data(), loaded_data_size);
+
+      size_t in_get_size = in.gcount();
+      if (in_get_size != loaded_data_size) {
+        std::cout << "load weight data error scale/offset" << in_get_size
+                  << ", " << loaded_data_size << ", " << sizeof(float) << ", "
+                  << file << ", " << size << std::endl;
+        return;
+      }
+      assert(size / sizeof(float) == host_array.size());
+      for (auto v : host_array) {
+        *(float *)(ptr + data_index) = v;
+        data_index += sizeof(float);
+      }
+
+    } else {
+      // load offset/scale in half type;
+      size = quantized_sizes.at(file_idx);
+      std::vector<half> host_array(size / sizeof(half));
+      size_t loaded_data_size = size;
+      in.seekg(0, in.end);
+      in.seekg(0, in.beg);
+      in.read((char *)host_array.data(), loaded_data_size);
+
+      size_t in_get_size = in.gcount();
+      if (in_get_size != loaded_data_size) {
+        std::cout << "load weight data error " << in_get_size << ", "
+                  << loaded_data_size << ", " << sizeof(half) << std::endl;
+        return;
+      }
+      assert(size / sizeof(half) == host_array.size());
+      // normal
+      for (auto v : host_array) {
+        *(half *)(ptr + data_index) = v;
+        data_index += sizeof(half);
+      }
+    }
+    in.close();
+    file_idx++;
+  }
+}
+
+void FileDataLoader::load_quantization_weight(FFModel *ff,
+                                              Tensor weight,
+                                              int weight_idx,
+                                              std::string const &layername,
+                                              bool use_full_precision) {
+  size_t volume = 1;
+  std::vector<int> dims_vec;
+  for (int i = 0; i < weight->num_dims; i++) {
+    dims_vec.push_back(weight->dims[i]);
+    volume *= weight->dims[i];
+  }
+
+  char *data = (char *)malloc(sizeof(char) * volume);
+
+  std::string file_path =
+      (layername.back() == '/') ? layername : "/" + layername;
+
+  if (file_path.find("attention_w") != std::string::npos) {
+    if (weight_idx == 0) {
+      load_attention_weights_quantized(data,
+                                       num_heads,
+                                       hidden_dim,
+                                       qkv_inner_dim,
+                                       file_path,
+                                       weight_file_path,
+                                       weight->data_type,
+                                       use_full_precision);
+    }
+    // else {
+    //   load_attention_bias_quantized(data,
+    //                                 num_heads,
+    //                                 hidden_dim,
+    //                                 qkv_inner_dim,
+    //                                 file_path,
+    //                                 weight_file_path);
+    // }
+
+  } else {
+    if (weight_idx > 0) {
+      int index = file_path.find("_weight");
+      assert(index != std::string::npos);
+      file_path = file_path.substr(0, index) + "_bias";
+    }
+    load_from_quantized_file(data,
+                             volume,
+                             weight_file_path + file_path,
+                             weight->data_type,
+                             use_full_precision);
+  }
+
+  ParallelTensor weight_pt;
+  ff->get_parallel_tensor_from_tensor(weight, weight_pt);
+  weight_pt->set_tensor<char>(ff, dims_vec, data);
+
+  delete data;
+}
+
 template <typename DT>
 void FileDataLoader::load_single_weight_tensor(FFModel *ff,
                                                Tensor weight,
@@ -344,7 +655,9 @@ void FileDataLoader::load_single_weight_tensor(FFModel *ff,
 }
 
 void FileDataLoader::load_weights(
-    FFModel *ff, std::unordered_map<std::string, Layer *> weights_layers) {
+    FFModel *ff,
+    std::unordered_map<std::string, Layer *> weights_layers,
+    bool use_full_precision) {
   for (auto &v : weights_layers) {
     int weights_num = v.second->numWeights;
     for (int i = 0; i < weights_num; i++) {
@@ -352,6 +665,7 @@ void FileDataLoader::load_weights(
       if (weight == NULL) {
         continue;
       }
+
       switch (weight->data_type) {
         case DT_HALF:
           load_single_weight_tensor<half>(ff, weight, i, v.first);
@@ -359,6 +673,11 @@ void FileDataLoader::load_weights(
         case DT_FLOAT:
           load_single_weight_tensor<float>(ff, weight, i, v.first);
           break;
+        case DT_INT4:
+        case DT_INT8:
+          // load weights in quantization
+          load_quantization_weight(ff, weight, i, v.first, use_full_precision);
+          break;
         default:
           assert(false && "Unsupported data type");
       }
diff --git a/inference/file_loader.h b/inference/file_loader.h
index 7ca94a8893..8be820b1bd 100644
--- a/inference/file_loader.h
+++ b/inference/file_loader.h
@@ -37,8 +37,15 @@ class FileDataLoader {
                                  Tensor weight,
                                  int weight_idx,
                                  std::string const &layername);
+
+  void load_quantization_weight(FFModel *ff,
+                                Tensor weight,
+                                int weight_idx,
+                                std::string const &layername,
+                                bool use_full_precision);
   void load_weights(FFModel *ff,
-                    std::unordered_map<std::string, Layer *> weights_layers);
+                    std::unordered_map<std::string, Layer *> weights_layers,
+                    bool use_full_precision);
 
   void load_positions(FFModel *ff,
                       Tensor pt,
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index a9ec63bc00..b59586de07 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -99,6 +99,9 @@ void FlexFlow::top_level_task(Task const *task,
                               Context ctx,
                               Runtime *runtime) {
   FFConfig ffconfig;
+  if (ffconfig.cpu_offload == false && ffconfig.quantization_type != DT_NONE) {
+    assert(false && "Doesn't support quantization in non-offload mode");
+  }
   FilePaths file_paths;
   ModelType model_type;
   bool use_full_precision = false;
@@ -119,7 +122,7 @@ void FlexFlow::top_level_task(Task const *task,
                     /*verbose*/ verbose,
                     file_paths.output_file_path);
 
-  FFModel model(ffconfig);
+  FFModel model(ffconfig, ffconfig.cpu_offload);
   if (model_type == ModelType::LLAMA) {
     LLAMA::create_llama_model(model,
                               im,
diff --git a/inference/models/falcon.cc b/inference/models/falcon.cc
index b137bf6944..7fc3124278 100644
--- a/inference/models/falcon.cc
+++ b/inference/models/falcon.cc
@@ -168,7 +168,7 @@ void FALCON::create_falcon_model(FFModel &ff,
                             falcon_config.n_heads,
                             falcon_config.dim,
                             falcon_config.dim / falcon_config.n_heads);
-  fileloader.load_weights(&ff, weights_layers);
+  fileloader.load_weights(&ff, weights_layers, use_full_precision);
   std::cout << "------load weight finished----------" << std::endl;
 
   // init operators
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index 0344f19b8a..f7c1563095 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -26,6 +26,7 @@ void LLAMA::create_llama_model(FFModel &ff,
                                int num_pipeline_stages,
                                InferenceMode mode,
                                bool use_full_precision) {
+  // do not apply cpu offload in beam search model.
   Config llama_config(model_config_file_path);
   llama_config.printConfig();
   //------------------------------compute machine views ------------------
@@ -214,7 +215,7 @@ void LLAMA::create_llama_model(FFModel &ff,
                             llama_config.n_heads,
                             llama_config.dim,
                             llama_config.dim / llama_config.n_heads);
-  fileloader.load_weights(&ff, weights_layers);
+  fileloader.load_weights(&ff, weights_layers, use_full_precision);
   std::cout << "------load weight finished----------" << std::endl;
 
   // init operators
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index dd4bb18e85..1e81e4eba7 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -249,7 +249,7 @@ void OPT::create_opt_model(FFModel &ff,
                             opt_config.hidden_size,
                             opt_config.hidden_size /
                                 opt_config.num_attention_heads);
-  fileloader.load_weights(&ff, weights_layers);
+  fileloader.load_weights(&ff, weights_layers, use_full_precision);
   std::cout << "------finished loading weights----------" << std::endl;
   im.init_operators_inference(&ff);
 }
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index ae577dd02e..ec0b222075 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -172,7 +172,7 @@ void FlexFlow::top_level_task(Task const *task,
                     file_paths.output_file_path);
 
   // Create LLM model
-  FFModel tree_model(ffconfig);
+  FFModel tree_model(ffconfig, ffconfig.cpu_offload);
   if (model_types.llm_model_type == ModelType::LLAMA) {
     LLAMA::create_llama_model(tree_model,
                               im,
diff --git a/inference/utils/compress_llama_weights.py b/inference/utils/compress_llama_weights.py
new file mode 100644
index 0000000000..c92ae6aca9
--- /dev/null
+++ b/inference/utils/compress_llama_weights.py
@@ -0,0 +1,117 @@
+import torch
+import numpy as np
+from transformers import AutoModelForCausalLM
+import dataclasses
+
+@dataclasses.dataclass
+class CompressionConfig:
+    """Group-wise quantization."""
+    num_bits: int
+    group_size: int
+    group_dim: int
+    symmetric: bool
+    enabled: bool = True
+    
+def compress(tensor, config):
+    """Simulate group-wise quantization."""
+    if not config.enabled:
+        return tensor
+
+    group_size, num_bits, group_dim, symmetric = (
+        config.group_size, config.num_bits, config.group_dim, config.symmetric)
+    assert num_bits <= 8
+
+    original_shape = tensor.shape
+    num_groups = (original_shape[group_dim] + group_size - 1) // group_size
+    new_shape = (original_shape[:group_dim] + (num_groups, group_size) +
+                 original_shape[group_dim+1:])
+
+    # Pad
+    pad_len = (group_size - original_shape[group_dim] % group_size) % group_size
+    if pad_len != 0:
+        pad_shape = original_shape[:group_dim] + (pad_len,) + original_shape[group_dim+1:]
+        tensor = torch.cat([
+            tensor,
+            torch.zeros(pad_shape, dtype=tensor.dtype, device=tensor.device)],
+            dim=group_dim)
+    data = tensor.view(new_shape)
+
+    # Quantize
+    if symmetric:
+        B = 2 ** (num_bits - 1) - 1
+        scale = B / torch.max(data.abs(), dim=group_dim + 1, keepdim=True)[0]
+        data = data * scale
+        data = data.clamp_(-B, B).round_().to(torch.int8)
+        return data, scale, original_shape
+    else:
+        B = 2 ** num_bits - 1
+        # print('max value')
+        # print(B)
+        mn = torch.min(data, dim=group_dim + 1, keepdim=True)[0]
+        mx = torch.max(data, dim=group_dim + 1, keepdim=True)[0]
+
+        scale = B / (mx - mn)
+        data = data - mn
+        data.mul_(scale)
+
+        data = data.clamp_(0, B).round_().to(torch.uint8)
+        return data, mn, scale, original_shape
+
+
+def decompress(packed_data, config):
+    """Simulate group-wise dequantization."""
+    if not config.enabled:
+        return packed_data
+
+    group_size, num_bits, group_dim, symmetric = (
+        config.group_size, config.num_bits, config.group_dim, config.symmetric)
+
+    # Dequantize
+    if symmetric:
+        data, scale, original_shape = packed_data
+        data = data / scale
+    else:
+        data, mn, scale, original_shape = packed_data
+        data = data / scale
+        data.add_(mn)
+    
+    # Unpad
+    pad_len = (group_size - original_shape[group_dim] % group_size) % group_size
+    if pad_len:
+        padded_original_shape = (
+            original_shape[:group_dim] +
+            (original_shape[group_dim] + pad_len,) +
+            original_shape[group_dim+1:])
+        data = data.reshape(padded_original_shape)
+        indices = [slice(0, x) for x in original_shape]
+        return data[indices].contiguous()
+    else:
+        return data.view(original_shape)
+
+if __name__ == "__main__":
+    # torch.set_default_tensor_type(torch.HalfTensor)
+    # torch.set_default_tensor_type(torch.cuda.HalfTensor)
+    model = AutoModelForCausalLM.from_pretrained("decapoda-research/llama-7b-hf")
+    config = CompressionConfig(
+        num_bits=8, group_size=32, group_dim=0, symmetric=False)
+    for name, params in model.named_parameters():
+        name = (
+            name.replace(".", "_")
+            .replace("self_attn", "attention")
+            .replace("q_proj", "wq")
+            .replace("k_proj", "wk")
+            .replace("v_proj", "wv")
+            .replace("o_proj", "wo")
+            .replace("mlp", "feed_forward")
+            .replace("gate_proj", "w1")
+            .replace("down_proj", "w2")
+            .replace("up_proj", "w3")
+            .replace("input_layernorm", "attention_norm")
+            .replace("post_attention_layernorm", "ffn_norm")
+            .replace("embed_tokens", "tok_embeddings")
+            .replace("lm_head", "output")
+            .replace("model_", "")
+        )        
+        if "feed_forward" in name or "output" in name or "attention_w" in name:
+            data, mn, scale, original_shape = compress(params, config)
+            
\ No newline at end of file
diff --git a/src/ops/beam_topk.cu b/src/ops/beam_topk.cu
index 934353d8e8..9a5cd86486 100644
--- a/src/ops/beam_topk.cu
+++ b/src/ops/beam_topk.cu
@@ -295,8 +295,8 @@ __device__ void mergeBeamShards(int num_shards,
       if (verbose && batch_index == 0) {
         printf("slot %d, value %.15f, prob %15f\n",
                slot,
-               entries[slot].value,
-               prob);
+               static_cast<float>(entries[slot].value),
+               static_cast<float>(prob));
       }
     }
     min_heap.build(heap_size);
@@ -312,8 +312,8 @@ __device__ void mergeBeamShards(int num_shards,
         printf("shard %d, index %d, value %.15f, prob %.15f\n",
                shard,
                entry.index,
-               entry.value,
-               prob);
+               static_cast<float>(entry.value),
+               static_cast<float>(prob));
       }
       if (entry.value * prob < root.value) {
         continue;
@@ -358,7 +358,6 @@ __device__ void mergeBeamShards(int num_shards,
       //          entries[next_shard_index].value,
       //          prob);
       // }
-
       max_heap.replace_root(
           {next_shard_index, entries[next_shard_index].value * prob},
           heap_size);
@@ -435,8 +434,9 @@ __global__ void beam_topk_forward_kernel(T const *__restrict__ input,
                (sub_request_id * token_nums * length),
            batch_input,
            request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH + sub_request_id,
-           acc_probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
-                     sub_request_id],
+           static_cast<float>(
+               acc_probs[request_id * BeamSearchBatchConfig::MAX_BEAM_WIDTH +
+                         sub_request_id]),
            thread_count,
            request_id);
   }
@@ -716,7 +716,7 @@ BeamTopKMeta::BeamTopKMeta(FFHandler handler, Op const *op) : OpMeta(handler) {
                        sizeof(int) * BeamSearchBatchConfig::MAX_BEAM_WIDTH *
                            BeamSearchBatchConfig::MAX_NUM_REQUESTS));
   checkCUDA(cudaMalloc(&acc_probs,
-                       sizeof(data_type_size(data_type)) *
+                       data_type_size(data_type) *
                            BeamSearchBatchConfig::MAX_BEAM_WIDTH *
                            BeamSearchBatchConfig::MAX_NUM_REQUESTS));
   checkCUDA(cudaMalloc(&block_start_index,
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index 6027a2cd21..b2528a7c14 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -76,6 +76,8 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
   if (data_type == DT_NONE) {
     data_type = input->data_type;
   }
+  DataType quantization_type = cpu_offload ? config.quantization_type : DT_NONE;
+  bool offload = cpu_offload;
   Layer *li = nullptr;
   int weight_num = bias ? 2 : 1;
   if (data_type != input->data_type) {
@@ -117,14 +119,22 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
     int kParas = kProjSize * kSize;
     int vParas = vProjSize * vSize;
     int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
-    int dims[2] = {qParas + kParas + vParas + oParas, num_heads};
-    li->weights[0] = create_weight_legion_ordering(2,
-                                                   dims,
-                                                   data_type,
-                                                   li,
-                                                   true /*create_grad*/,
-                                                   kernel_initializer,
-                                                   CHOSEN_SYNC_TYPE);
+    int one_head_size = qParas + kParas + vParas + oParas;
+
+    // compress the weight size if quantization.
+    if (quantization_type != DT_NONE) {
+      one_head_size = get_quantization_to_byte_size(
+          data_type, quantization_type, one_head_size);
+    }
+    int dims[2] = {one_head_size, num_heads};
+    li->weights[0] = create_weight_legion_ordering(
+        2,
+        dims,
+        quantization_type == DT_NONE ? data_type : quantization_type,
+        li,
+        true /*create_grad*/,
+        kernel_initializer,
+        CHOSEN_SYNC_TYPE);
   }
   if (bias) {
     // q, k, v, o
@@ -150,6 +160,8 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
   li->add_int_property("scaling_query", scaling_query);
   li->add_float_property("scaling_factor", scaling_factor);
   li->add_int_property("qk_prod_scaling", qk_prod_scaling);
+  li->add_int_property("quantization_type", quantization_type);
+  li->add_int_property("offload", offload);
   layers.push_back(li);
 
   return li->outputs[0];
@@ -184,6 +196,10 @@ Op *IncMultiHeadSelfAttention::create_operator_from_layer(
   layer->get_float_property("scaling_factor", scaling_factor);
   layer->get_int_property("qk_prod_scaling", value);
   bool qk_prod_scaling = (bool)value;
+  layer->get_int_property("quantization_type", value);
+  DataType quantization_type = (DataType)value;
+  layer->get_int_property("offload", value);
+  bool offload = (bool)value;
 
   return new IncMultiHeadSelfAttention(model,
                                        layer->layer_guid,
@@ -201,6 +217,8 @@ Op *IncMultiHeadSelfAttention::create_operator_from_layer(
                                        scaling_factor,
                                        qk_prod_scaling,
                                        false /*allocate_weights*/,
+                                       quantization_type,
+                                       offload,
                                        layer->name);
 }
 
@@ -221,6 +239,8 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     float _scaling_factor,
     bool _qk_prod_scaling,
     bool allocate_weights,
+    DataType _quantization_type,
+    bool _offload,
     char const *name)
     // Initializer* _bias_initializer)
     : Op(model,
@@ -239,10 +259,10 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
       vProjSize(_vdim), oProjSize(_embed_dim),
       qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
       scaling_query(_scaling_query), scaling_factor(_scaling_factor),
-      qk_prod_scaling(_qk_prod_scaling) {
+      qk_prod_scaling(_qk_prod_scaling), quantization_type(_quantization_type),
+      offload(_offload) {
   // overwrite layer_guid
   layer_guid = _layer_guid;
-
   numOutputs = 1;
   int numdim = _input->num_dims;
   ParallelDim dims[MAX_TENSOR_DIM];
@@ -267,6 +287,11 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     dims[1] = inputs[0]->dims[num_dims - 1];
     dims[1].size = this->num_heads;
     dims[2].size = qParas + kParas + vParas + oParas;
+
+    if (quantization_type != DT_NONE) {
+      dims[2].size = get_quantization_to_byte_size(
+          data_type, quantization_type, dims[2].size);
+    }
     dims[2].degree = 1;
     dims[2].parallel_idx = -1;
     int seed = std::rand();
@@ -276,12 +301,13 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
 #else
     ParameterSyncType comm_type = ParameterSyncType::PS;
 #endif
-    weights[0] = model.create_parallel_weight<3>(dims,
-                                                 this->data_type,
-                                                 nullptr /*owner_op*/,
-                                                 true /*create_grad*/,
-                                                 initializer,
-                                                 comm_type);
+    weights[0] = model.create_parallel_weight<3>(
+        dims,
+        quantization_type == DT_NONE ? this->data_type : quantization_type,
+        nullptr /*owner_op*/,
+        true /*create_grad*/,
+        initializer,
+        comm_type);
   }
   if (bias) {
     ParallelDim dims[2];
@@ -330,6 +356,8 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     float _scaling_factor,
     bool _qk_prod_scaling,
     bool allocate_weights,
+    DataType _quantization_type,
+    bool _offload,
     char const *name)
     // Initializer* _bias_initializer)
     : Op(model,
@@ -349,7 +377,8 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
       vProjSize(_vdim), oProjSize(_embed_dim),
       qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
       scaling_query(_scaling_query), scaling_factor(_scaling_factor),
-      qk_prod_scaling(_qk_prod_scaling)
+      qk_prod_scaling(_qk_prod_scaling), quantization_type(_quantization_type),
+      offload(_offload)
 // bias_initializer(_bias_initializer)
 {
   numOutputs = 1;
@@ -376,6 +405,10 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     dims[1] = inputs[0]->dims[num_dims - 1];
     dims[1].size = this->num_heads;
     dims[2].size = qParas + kParas + vParas + oParas;
+    if (quantization_type != DT_NONE) {
+      dims[2].size = get_quantization_to_byte_size(
+          data_type, quantization_type, dims[2].size);
+    }
     int seed = std::rand();
     Initializer *initializer = new GlorotUniform(seed);
 #ifdef USE_NCCL
@@ -383,12 +416,13 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
 #else
     ParameterSyncType comm_type = ParameterSyncType::PS;
 #endif
-    weights[0] = model.create_parallel_weight<3>(dims,
-                                                 this->data_type,
-                                                 NULL /*owner_op*/,
-                                                 true /*create_grad*/,
-                                                 initializer,
-                                                 comm_type);
+    weights[0] = model.create_parallel_weight<3>(
+        dims,
+        quantization_type == DT_NONE ? this->data_type : quantization_type,
+        NULL /*owner_op*/,
+        true /*create_grad*/,
+        initializer,
+        comm_type);
   }
   if (bias) {
     ParallelDim dims[2];
@@ -441,6 +475,8 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
                                 other.scaling_factor,
                                 other.qk_prod_scaling,
                                 allocate_weights,
+                                other.quantization_type,
+                                other.offload,
                                 other.name) {}
 
 IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
@@ -465,6 +501,8 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
                                 params.scaling_factor,
                                 params.qk_prod_scaling,
                                 allocate_weights,
+                                params.quantization_type,
+                                params.offload,
                                 name) {}
 
 void IncMultiHeadSelfAttention::init_inference(
@@ -494,11 +532,13 @@ void IncMultiHeadSelfAttention::init_inference(
                                                     EXCLUSIVE,
                                                     batch_inputs[0]->region));
   launcher.add_field(0, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    weights[0]->region));
+  launcher.add_region_requirement(
+      RegionRequirement(weights[0]->part,
+                        0 /*projection id*/,
+                        READ_ONLY,
+                        EXCLUSIVE,
+                        weights[0]->region,
+                        ff.cpu_offload ? MAP_TO_ZC_MEMORY : 0));
   launcher.add_field(1, FID_DATA);
   launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
                                                     0 /*projection id*/,
@@ -596,12 +636,26 @@ OpMeta *IncMultiHeadSelfAttention::init_task(
                        .only_kind(Memory::GPU_FB_MEM)
                        .best_affinity_to(task->target_proc)
                        .first();
+  MemoryAllocator gpu_mem_allocator(gpu_mem);
+  if (attn->offload) {
+    // cpu-offload enabled
+    // use offload_reserved_space
+    gpu_mem_allocator.register_reserved_work_space(
+        handle.offload_reserve_space, handle.offload_reserve_space_size);
+  }
   IncMultiHeadSelfAttentionMeta *m = new IncMultiHeadSelfAttentionMeta(
-      handle, attn, weight, gpu_mem, num_samples, num_heads);
-
+      handle, attn, weight, gpu_mem_allocator, num_samples, num_heads);
+  if (handle.offload_reserve_space == nullptr) {
+    // assert that we didn't over allocate memory
+    assert(gpu_mem_allocator.reserved_allocated_size ==
+           gpu_mem_allocator.reserved_total_size);
+  }
   m->profiling = attn->profiling;
-  assert(weight.domain.get_volume() * data_type_size(weight.data_type) ==
-         m->weightSize);
+  if (attn->quantization_type == DT_NONE) {
+    assert(weight.domain.get_volume() * data_type_size(weight.data_type) ==
+           m->weightSize);
+  }
+
   return m;
 }
 
@@ -641,11 +695,13 @@ FutureMap IncMultiHeadSelfAttention::inference(
                                                     EXCLUSIVE,
                                                     batch_inputs[0]->region));
   launcher.add_field(idx++, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    weights[0]->region));
+  launcher.add_region_requirement(
+      RegionRequirement(weights[0]->part,
+                        0 /*projection id*/,
+                        READ_ONLY,
+                        EXCLUSIVE,
+                        weights[0]->region,
+                        ff.cpu_offload ? MAP_TO_ZC_MEMORY : 0));
   launcher.add_field(idx++, FID_DATA);
   launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
                                                     0 /*projection id*/,
@@ -655,11 +711,13 @@ FutureMap IncMultiHeadSelfAttention::inference(
   launcher.add_field(idx++, FID_DATA);
 
   if (bias) {
-    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
-                                                      0 /*projection id*/,
-                                                      READ_ONLY,
-                                                      EXCLUSIVE,
-                                                      weights[1]->region));
+    launcher.add_region_requirement(
+        RegionRequirement(weights[1]->part,
+                          0 /*projection id*/,
+                          READ_ONLY,
+                          EXCLUSIVE,
+                          weights[1]->region,
+                          ff.cpu_offload ? MAP_TO_ZC_MEMORY : 0));
     launcher.add_field(idx++, FID_DATA);
   }
   return runtime->execute_index_space(ctx, launcher);
@@ -1524,6 +1582,8 @@ IncMultiHeadSelfAttentionParams IncMultiHeadSelfAttention::get_params() const {
   params.scaling_query = this->scaling_query;
   params.scaling_factor = this->scaling_factor;
   params.qk_prod_scaling = this->qk_prod_scaling;
+  params.quantization_type = this->quantization_type;
+  params.offload = this->offload;
 
   return params;
 }
@@ -1547,6 +1607,8 @@ size_t hash<FlexFlow::IncMultiHeadSelfAttentionParams>::operator()(
   hash_combine(key, params.scaling_query);
   hash_combine(key, params.scaling_factor);
   hash_combine(key, params.qk_prod_scaling);
+  hash_combine(key, params.quantization_type);
+  hash_combine(key, params.offload);
   return key;
 }
 }; // namespace std
diff --git a/src/ops/inc_multihead_self_attention.cpp b/src/ops/inc_multihead_self_attention.cpp
index a627e0ef08..669cbd2636 100644
--- a/src/ops/inc_multihead_self_attention.cpp
+++ b/src/ops/inc_multihead_self_attention.cpp
@@ -61,7 +61,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     FFHandler handler,
     IncMultiHeadSelfAttention const *attn,
     GenericTensorAccessorR const &weight,
-    Memory gpu_mem,
+    MemoryAllocator &gpu_mem_allocator,
     int num_samples,
     int _num_heads)
     : OpMeta(handler, attn) {
@@ -88,9 +88,11 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     bool _add_bias_kv,
     float _scaling_factor,
     GenericTensorAccessorR const &weight,
-    Memory gpu_mem,
+    MemoryAllocator &gpu_mem_allocator,
     int num_samples,
-    int _num_heads)
+    int _num_heads,
+    DataType _quantization_type,
+    bool _offload)
     : OpMeta(handler, attn) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 33bc32224b..408c1ab012 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -17,6 +17,7 @@
 #endif
 #include "flexflow/ffconst_utils.h"
 #include "flexflow/ops/inc_multihead_self_attention.h"
+#include "flexflow/ops/kernels/decompress_kernels.h"
 #include "flexflow/ops/kernels/inc_multihead_self_attention_kernels.h"
 #include "flexflow/utils/cuda_helper.h"
 
@@ -349,6 +350,79 @@ void update_kv_cache_kernel(IncMultiHeadSelfAttentionMeta const *m,
   }
 }
 
+template <typename DT>
+void pre_build_weight_kernel(IncMultiHeadSelfAttentionMeta const *m,
+                             GenericTensorAccessorR const weight,
+                             DataType data_type,
+                             cudaStream_t stream) {
+  // additional processing for weight uploading
+  // Note that we update weight_ptr and bias_ptr when uploading weight and
+  // bias
+  if (m->quantization_type != DT_NONE) {
+    // copy weight_ptr to quantized_weight_ptr, do compression and store in
+    // m->weight_ptr
+    cudaMemcpyAsync(m->quantized_weight_ptr,
+                    weight.get_byte_ptr(),
+                    m->quantized_weightSize,
+                    cudaMemcpyHostToDevice,
+                    stream);
+
+    if (m->quantization_type == DT_INT4) {
+      int parallelism = m->qProjSize * m->qSize * m->num_heads / 2;
+      decompress_int4_attention_weights<<<GET_BLOCKS(parallelism),
+                                          min(CUDA_NUM_THREADS, parallelism),
+                                          0,
+                                          stream>>>(
+          m->quantized_weight_ptr,
+          static_cast<DT *>(m->weight_ptr),
+          m->qProjSize,
+          m->qSize,
+          m->num_heads);
+    } else {
+      assert(m->quantization_type == DT_INT8);
+      int parallelism = m->qProjSize * m->qSize * m->num_heads;
+      decompress_int8_attention_weights<<<GET_BLOCKS(parallelism),
+                                          min(CUDA_NUM_THREADS, parallelism),
+                                          0,
+                                          stream>>>(
+          m->quantized_weight_ptr,
+          static_cast<DT *>(m->weight_ptr),
+          m->qProjSize,
+          m->qSize,
+          m->num_heads);
+    }
+  } else {
+    if (data_type == DT_FLOAT) {
+      cudaMemcpyAsync(m->weight_ptr,
+                      weight.get_float_ptr(),
+                      m->weightSize,
+                      cudaMemcpyHostToDevice,
+                      stream);
+    } else if (data_type == DT_HALF) {
+      cudaMemcpyAsync(m->weight_ptr,
+                      weight.get_half_ptr(),
+                      m->weightSize,
+                      cudaMemcpyHostToDevice,
+                      stream);
+    } else {
+      assert(false);
+    }
+  }
+  // reload weight_o for offloading case
+  int parallelism = m->vProjSize * m->oProjSize * m->num_heads;
+  build_w_out_tensor<<<GET_BLOCKS(parallelism),
+                       min(CUDA_NUM_THREADS, parallelism),
+                       0,
+                       stream>>>(static_cast<DT *>(m->weight_ptr),
+                                 static_cast<DT *>(m->W_out_contiguous),
+                                 m->vProjSize,
+                                 m->oProjSize,
+                                 m->num_heads,
+                                 (m->qSize * m->qProjSize +
+                                  m->kSize * m->kProjSize +
+                                  m->vSize * m->vProjSize));
+}
+
 template <typename DT>
 void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
                       BatchConfig const *bc,
@@ -358,6 +432,12 @@ void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
                       DT const *bias_ptr,
                       cudaStream_t stream) {
   // here because we need postion info in infernece 1
+
+  if (m->offload && m->biasSize > 0) {
+    cudaMemcpyAsync(
+        m->bias_ptr, bias_ptr, m->biasSize, cudaMemcpyHostToDevice, stream);
+    bias_ptr = static_cast<DT *>(m->bias_ptr);
+  }
   cudaMemcpyAsync(m->token_infos,
                   &(bc->tokensInfo),
                   bc->MAX_NUM_TOKENS * sizeof(BatchConfig::PerTokenInfo),
@@ -681,31 +761,41 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     cudaEventRecord(t_start, stream);
   }
 
-  assert(input.data_type == weight.data_type);
+  // assert(input.data_type == weight.data_type);
   assert(input.data_type == output.data_type);
   if (use_bias) {
     assert(input.data_type == bias.data_type);
   }
+
   if (input.data_type == DT_HALF) {
+    if (m->offload) {
+      pre_build_weight_kernel<half>(m, weight, input.data_type, stream);
+    }
     half const *bias_ptr =
         use_bias ? bias.get_half_ptr() : static_cast<half const *>(nullptr);
-    Kernels::IncMultiHeadAttention::inference_kernel(m,
-                                                     bc,
-                                                     input.get_half_ptr(),
-                                                     weight.get_half_ptr(),
-                                                     output.get_half_ptr(),
-                                                     bias_ptr,
-                                                     stream);
+    Kernels::IncMultiHeadAttention::inference_kernel(
+        m,
+        bc,
+        input.get_half_ptr(),
+        m->offload ? static_cast<half *>(m->weight_ptr) : weight.get_half_ptr(),
+        output.get_half_ptr(),
+        bias_ptr,
+        stream);
   } else if (input.data_type == DT_FLOAT) {
+    if (m->offload) {
+      pre_build_weight_kernel<float>(m, weight, input.data_type, stream);
+    }
     float const *bias_ptr =
         use_bias ? bias.get_float_ptr() : static_cast<float const *>(nullptr);
-    Kernels::IncMultiHeadAttention::inference_kernel(m,
-                                                     bc,
-                                                     input.get_float_ptr(),
-                                                     weight.get_float_ptr(),
-                                                     output.get_float_ptr(),
-                                                     bias_ptr,
-                                                     stream);
+    Kernels::IncMultiHeadAttention::inference_kernel(
+        m,
+        bc,
+        input.get_float_ptr(),
+        m->offload ? static_cast<float *>(m->weight_ptr)
+                   : weight.get_float_ptr(),
+        output.get_float_ptr(),
+        bias_ptr,
+        stream);
   } else {
     assert(false && "Unspported data type");
   }
@@ -727,7 +817,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     FFHandler handler,
     IncMultiHeadSelfAttention const *attn,
     GenericTensorAccessorR const &weight,
-    Memory gpu_mem,
+    MemoryAllocator &gpu_mem_allocator,
     int num_samples,
     int _num_heads)
     : IncMultiHeadSelfAttentionMeta(handler,
@@ -747,9 +837,11 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
                                     attn->add_bias_kv,
                                     attn->scaling_factor,
                                     weight,
-                                    gpu_mem,
+                                    gpu_mem_allocator,
                                     num_samples,
-                                    _num_heads) {}
+                                    _num_heads,
+                                    attn->quantization_type,
+                                    attn->offload) {}
 
 IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     FFHandler handler,
@@ -769,10 +861,12 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     bool _add_bias_kv,
     float _scaling_factor,
     GenericTensorAccessorR const &weight,
-    Memory gpu_mem,
+    MemoryAllocator &gpu_mem_allocator,
     int num_samples,
-    int _num_heads)
-    : OpMeta(handler, attn) {
+    int _num_heads,
+    DataType _quantization_type,
+    bool _offload)
+    : OpMeta(handler, attn), weight_ptr(nullptr), bias_ptr(nullptr) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDNN(cudnnSetStream(handler.dnn, stream));
@@ -788,13 +882,20 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   vProjSize = _vProjSize;
   oProjSize = _oProjSize;
   size_t size_of_dt = data_type_size(attn->data_type);
+  quantization_type = _quantization_type;
+  offload = _offload;
 
   num_heads = _num_heads;
   weights_params = (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize +
                     oProjSize * (vProjSize > 0 ? vProjSize : vSize));
   weightSize = weights_params * num_heads * size_of_dt;
-  has_load_weights = (bool *)calloc(1, sizeof(bool));
-  *has_load_weights = false;
+  if (quantization_type != DT_NONE) {
+    quantized_weightSize = get_quantization_to_byte_size(
+        attn->data_type, quantization_type, weightSize);
+  }
+  biasSize = _bias ? oProjSize * size_of_dt * 4 : 0;
+  // has_load_weights = (bool *)calloc(1, sizeof(bool));
+  //*has_load_weights = false;
   apply_rotary_embedding = (bool *)calloc(1, sizeof(bool));
   *apply_rotary_embedding = _apply_rotary_embedding;
   bias = (bool *)calloc(1, sizeof(bool));
@@ -807,6 +908,12 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   // Currently do not support adding bias to key/value projection
   assert(!_add_bias_kv);
 
+  // allocate weight and bias in the reserve space for cpu offloading
+  if (offload) {
+    weight_ptr = gpu_mem_allocator.allocate_reserved_untyped(weightSize);
+    bias_ptr = gpu_mem_allocator.allocate_reserved_untyped(biasSize);
+  }
+
 #ifdef INFERENCE_TESTS
   kcache = (float *)calloc(kProjSize * BatchConfig::MAX_SEQ_LENGTH * num_heads *
                                BatchConfig::MAX_NUM_REQUESTS,
@@ -860,37 +967,91 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
         tokeninfo_size * sizeof(BatchConfig::PerTokenInfo) +
         complex_size * sizeof(cuFloatComplex); // more components will
                                                // be added here later
+    if (offload) {
+      // assert that we have enough reserved work space left
+      size_t totalSharedSize =
+          infer_mode == TREE_VERIFY_MODE
+              ? totalSize -
+                    (key_cache_size + value_cache_size + qkv_max_proj_size) *
+                        size_of_dt
+              : totalSize - (key_cache_size + value_cache_size) * size_of_dt;
+
+      size_t instance_size =
+          size_of_dt *
+          (infer_mode == TREE_VERIFY_MODE
+               ? key_cache_size + value_cache_size + qkv_max_proj_size
+               : key_cache_size + value_cache_size);
+
+      if (quantization_type != DT_NONE) {
+        totalSharedSize += quantized_weightSize;
+      }
+      assert(gpu_mem_allocator.reserved_total_size -
+                 gpu_mem_allocator.reserved_allocated_size >=
+             totalSharedSize);
+      gpu_mem_allocator.create_legion_instance(reserveInst, instance_size);
+    } else {
+      gpu_mem_allocator.create_legion_instance(reserveInst, totalSize);
+    }
+
+    // in tree_verify, enable devQKVProjArray;
+    if (!offload || infer_mode == TREE_VERIFY_MODE) {
+      devQKVProjArray = gpu_mem_allocator.allocate_instance_untyped(
+          qkv_max_proj_size * size_of_dt);
+    } else {
+      devQKVProjArray = gpu_mem_allocator.allocate_reserved_untyped(
+          qkv_max_proj_size * size_of_dt);
+      // offset += qkv_max_proj_size * size_of_dt;
+    }
+
+    // use key value cache in all mode.
+    keyCache = gpu_mem_allocator.allocate_instance_untyped(key_cache_size *
+                                                           size_of_dt);
+    valueCache = gpu_mem_allocator.allocate_instance_untyped(value_cache_size *
+                                                             size_of_dt);
+
+    if (offload) {
+      token_infos =
+          gpu_mem_allocator.allocate_reserved<BatchConfig::PerTokenInfo>(
+              tokeninfo_size);
+      // offset += sizeof(BatchConfig::PerTokenInfo) * tokeninfo_size;
+      qk_prods = gpu_mem_allocator.allocate_reserved_untyped(qk_prod_size *
+                                                             size_of_dt);
+      // offset += qk_prod_size * size_of_dt;
+      qk_prods_softmax = gpu_mem_allocator.allocate_reserved_untyped(
+          qk_prod_size * size_of_dt);
+      // offset += qk_prod_size * size_of_dt;
+      attn_heads = gpu_mem_allocator.allocate_reserved_untyped(attn_heads_size *
+                                                               size_of_dt);
+      // offset += attn_heads_size * size_of_dt;
+      W_out_contiguous = gpu_mem_allocator.allocate_reserved_untyped(
+          W_out_contiguous_size * size_of_dt);
+      // offset += W_out_contiguous_size * size_of_dt;
+      complex_input =
+          gpu_mem_allocator.allocate_reserved<cuFloatComplex>(complex_size);
+      // offset += complex_size * sizeof(cuFloatComplex);
+    } else {
+      token_infos =
+          gpu_mem_allocator.allocate_instance<BatchConfig::PerTokenInfo>(
+              tokeninfo_size);
+      qk_prods = gpu_mem_allocator.allocate_instance_untyped(qk_prod_size *
+                                                             size_of_dt);
+      qk_prods_softmax = gpu_mem_allocator.allocate_instance_untyped(
+          qk_prod_size * size_of_dt);
+      attn_heads = gpu_mem_allocator.allocate_instance_untyped(attn_heads_size *
+                                                               size_of_dt);
+      W_out_contiguous = gpu_mem_allocator.allocate_instance_untyped(
+          W_out_contiguous_size * size_of_dt);
+      complex_input =
+          gpu_mem_allocator.allocate_instance<cuFloatComplex>(complex_size);
+    }
+
+    // allocate more size for quantization data
+    if (quantization_type != DT_NONE) {
+      assert(offload);
+      quantized_weight_ptr =
+          gpu_mem_allocator.allocate_reserved<char>(quantized_weightSize);
+    }
 
-    Realm::Rect<1, coord_t> bounds(Realm::Point<1, coord_t>(0),
-                                   Realm::Point<1, coord_t>(totalSize - 1));
-    std::vector<size_t> field_sizes;
-    field_sizes.push_back(sizeof(char));
-    Realm::RegionInstance::create_instance(reserveInst,
-                                           gpu_mem,
-                                           bounds,
-                                           field_sizes,
-                                           0,
-                                           Realm::ProfilingRequestSet())
-        .wait();
-    off_t offset = 0;
-    devQKVProjArray = reserveInst.pointer_untyped(offset, 0);
-    offset += qkv_max_proj_size * size_of_dt;
-    keyCache = reserveInst.pointer_untyped(offset, 0);
-    offset += key_cache_size * size_of_dt;
-    valueCache = reserveInst.pointer_untyped(offset, 0);
-    offset += value_cache_size * size_of_dt;
-    token_infos = reserveInst.pointer<BatchConfig::PerTokenInfo>(offset);
-    offset += sizeof(BatchConfig::PerTokenInfo) * tokeninfo_size;
-    qk_prods = reserveInst.pointer_untyped(offset, 0);
-    offset += qk_prod_size * size_of_dt;
-    qk_prods_softmax = reserveInst.pointer_untyped(offset, 0);
-    offset += qk_prod_size * size_of_dt;
-    attn_heads = reserveInst.pointer_untyped(offset, 0);
-    offset += attn_heads_size * size_of_dt;
-    W_out_contiguous = reserveInst.pointer_untyped(offset, 0);
-    offset += W_out_contiguous_size * size_of_dt;
-    complex_input = reserveInst.pointer<cuFloatComplex>(offset);
-    offset += complex_size * sizeof(cuFloatComplex);
     if (weight.data_type == DT_FLOAT) {
       int parallelism = vProjSize * oProjSize * num_heads;
       build_w_out_tensor<<<GET_BLOCKS(parallelism),
@@ -916,19 +1077,36 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
           num_heads,
           (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize));
     } else {
-      assert(false && "Unsupported data_type");
+      assert(weight.data_type == DT_INT4 || weight.data_type == DT_INT8);
+    }
+    if (!offload) {
+      assert(gpu_mem_allocator.reserved_total_size ==
+             gpu_mem_allocator.reserved_allocated_size);
     }
-    assert(offset == totalSize);
   }
   cudaStreamSynchronize(stream);
 }
 
 IncMultiHeadSelfAttentionMeta::~IncMultiHeadSelfAttentionMeta(void) {
-  reserveInst.destroy();
+  if (reserveInst != Realm::RegionInstance::NO_INST) {
+    reserveInst.destroy();
+  }
 #ifdef INFERENCE_TESTS
   free(kcache);
   free(vcache);
 #endif
 }
 
+template void Kernels::IncMultiHeadAttention::pre_build_weight_kernel<float>(
+    IncMultiHeadSelfAttentionMeta const *m,
+    GenericTensorAccessorR const weight,
+    DataType data_type,
+    cudaStream_t stream);
+
+template void Kernels::IncMultiHeadAttention::pre_build_weight_kernel<half>(
+    IncMultiHeadSelfAttentionMeta const *m,
+    GenericTensorAccessorR const weight,
+    DataType data_type,
+    cudaStream_t stream);
+
 }; // namespace FlexFlow
diff --git a/src/ops/kernels/decompress_kernels.cu b/src/ops/kernels/decompress_kernels.cu
new file mode 100644
index 0000000000..2e02ce1eec
--- /dev/null
+++ b/src/ops/kernels/decompress_kernels.cu
@@ -0,0 +1,261 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/ops/kernels/decompress_kernels.h"
+#include "flexflow/utils/cuda_helper.h"
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::coord_t;
+using Legion::Memory;
+
+namespace Kernels {
+
+template <typename DT>
+__global__ void decompress_int4_general_weights(char const *input_weight_ptr,
+                                                DT *weight_ptr,
+                                                int in_dim,
+                                                int valueSize) {
+  // eg. in dim = 3072, out dim = 768
+  CUDA_KERNEL_LOOP(i, valueSize / 2) {
+    size_t real_idx_first = i * 2;
+    size_t real_idx_second = i * 2 + 1;
+    size_t group_idx =
+        (real_idx_first / (in_dim * INT4_NUM_OF_ELEMENTS_PER_GROUP)) * in_dim +
+        real_idx_first % in_dim;
+    size_t idx = i;
+    size_t offset_idx = (valueSize / 2) + group_idx * sizeof(DT);
+    size_t scale_idx = offset_idx + sizeof(DT) * (valueSize / 32);
+
+    weight_ptr[real_idx_first] =
+        static_cast<DT>((input_weight_ptr[idx] >> 4) & 0xF) /
+            (*(DT *)(input_weight_ptr + scale_idx)) +
+        (*(DT *)(input_weight_ptr + offset_idx));
+    weight_ptr[real_idx_second] =
+        static_cast<DT>(input_weight_ptr[idx] & 0xF) /
+            (*(DT *)(input_weight_ptr + scale_idx + sizeof(DT))) +
+        (*(DT *)(input_weight_ptr + offset_idx + sizeof(DT)));
+  }
+}
+
+template <typename DT>
+__global__ void decompress_int8_general_weights(char const *input_weight_ptr,
+                                                DT *weight_ptr,
+                                                int in_dim,
+                                                int valueSize) {
+  CUDA_KERNEL_LOOP(i, valueSize) {
+    size_t idx = i;
+    size_t group_idx =
+        (idx / (in_dim * INT4_NUM_OF_ELEMENTS_PER_GROUP)) * in_dim +
+        idx % in_dim;
+    size_t offset_idx = valueSize + group_idx * sizeof(DT);
+    size_t scale_idx = offset_idx + sizeof(DT) * (valueSize / 32);
+    weight_ptr[idx] = static_cast<DT>(input_weight_ptr[idx] & 0xFF) /
+                          (*(DT *)(input_weight_ptr + scale_idx)) +
+                      (*(DT *)(input_weight_ptr + offset_idx));
+  }
+}
+
+template <typename DT>
+__global__ void decompress_int4_attention_weights(char *input_weight_ptr,
+                                                  DT *weight_ptr,
+                                                  int qProjSize,
+                                                  int qSize,
+                                                  int num_heads) {
+  // TODO this is because in top level function we assume q,k,v in same size
+  CUDA_KERNEL_LOOP(i, qProjSize * num_heads * qSize / 2) {
+    int q_block_size = (qProjSize * qSize) / 2;
+    int real_q_block_size = q_block_size * 2;
+    size_t qkvo_block_size = q_block_size * 4;
+    size_t real_qkvo_block_size = qkvo_block_size * 2;
+
+    int group_idx = (i * 2 / (INT4_NUM_OF_ELEMENTS_PER_GROUP * qSize)) * qSize +
+                    (i * 2) % qSize;
+    // i * 2 / (INT4_NUM_OF_ELEMENTS_PER_GROUP);
+    int head_idx = i / q_block_size;
+    int data_idx = i % q_block_size;
+
+    size_t idx_q = head_idx * qkvo_block_size + data_idx;
+    size_t idx_k = idx_q + q_block_size;
+    size_t idx_v = idx_k + q_block_size;
+    size_t idx_o = idx_v + q_block_size;
+
+    size_t real_idx_q_first = head_idx * real_qkvo_block_size + data_idx * 2;
+    size_t real_idx_q_second = real_idx_q_first + 1;
+    size_t real_idx_k_first =
+        head_idx * real_qkvo_block_size + real_q_block_size + data_idx * 2;
+    size_t real_idx_k_second = real_idx_k_first + 1;
+    size_t real_idx_v_first =
+        head_idx * real_qkvo_block_size + real_q_block_size * 2 + data_idx * 2;
+    size_t real_idx_v_second = real_idx_v_first + 1;
+    size_t real_idx_o_first =
+        head_idx * real_qkvo_block_size + real_q_block_size * 3 + data_idx * 2;
+    size_t real_idx_o_second = real_idx_o_first + 1;
+
+    size_t meta_offset = num_heads * qkvo_block_size;
+    size_t one_meta_size = sizeof(DT) * (qProjSize * num_heads * qSize / 32);
+    size_t q_offset_idx = meta_offset + group_idx * sizeof(DT);
+    size_t q_scaling_idx = q_offset_idx + one_meta_size;
+
+    size_t k_offset_idx = q_scaling_idx + one_meta_size;
+    size_t k_scaling_idx = k_offset_idx + one_meta_size;
+
+    size_t v_offset_idx = k_scaling_idx + one_meta_size;
+    size_t v_scaling_idx = v_offset_idx + one_meta_size;
+
+    size_t o_offset_idx = v_scaling_idx + one_meta_size;
+    size_t o_scaling_idx = o_offset_idx + one_meta_size;
+
+    weight_ptr[real_idx_q_first] =
+        static_cast<DT>((input_weight_ptr[idx_q] >> 4) & 0xF) /
+            (*(DT *)(input_weight_ptr + q_scaling_idx)) +
+        (*(DT *)(input_weight_ptr + q_offset_idx));
+    weight_ptr[real_idx_q_second] =
+        static_cast<DT>((input_weight_ptr[idx_q] & 0xF)) /
+            (*(DT *)(input_weight_ptr + q_scaling_idx + sizeof(DT))) +
+        (*(DT *)(input_weight_ptr + q_offset_idx + sizeof(DT)));
+    weight_ptr[real_idx_k_first] =
+        static_cast<DT>((input_weight_ptr[idx_k] >> 4) & 0xF) /
+            (*(DT *)(input_weight_ptr + k_scaling_idx)) +
+        (*(DT *)(input_weight_ptr + k_offset_idx));
+    weight_ptr[real_idx_k_second] =
+        static_cast<DT>((input_weight_ptr[idx_k] & 0xF)) /
+            (*(DT *)(input_weight_ptr + k_scaling_idx + sizeof(DT))) +
+        (*(DT *)(input_weight_ptr + k_offset_idx + sizeof(DT)));
+    weight_ptr[real_idx_v_first] =
+        static_cast<DT>((input_weight_ptr[idx_v] >> 4) & 0xF) /
+            (*(DT *)(input_weight_ptr + v_scaling_idx)) +
+        (*(DT *)(input_weight_ptr + v_offset_idx));
+    weight_ptr[real_idx_v_second] =
+        static_cast<DT>((input_weight_ptr[idx_v] & 0xF)) /
+            (*(DT *)(input_weight_ptr + v_scaling_idx + sizeof(DT))) +
+        (*(DT *)(input_weight_ptr + v_offset_idx + sizeof(DT)));
+    weight_ptr[real_idx_o_first] =
+        static_cast<DT>((input_weight_ptr[idx_o] >> 4) & 0xF) /
+            (*(DT *)(input_weight_ptr + o_scaling_idx)) +
+        (*(DT *)(input_weight_ptr + o_offset_idx));
+    weight_ptr[real_idx_o_second] =
+        static_cast<DT>((input_weight_ptr[idx_o] & 0xF)) /
+            (*(DT *)(input_weight_ptr + o_scaling_idx + sizeof(DT))) +
+        (*(DT *)(input_weight_ptr + o_offset_idx + sizeof(DT)));
+  }
+}
+
+template <typename DT>
+__global__ void decompress_int8_attention_weights(char *input_weight_ptr,
+                                                  DT *weight_ptr,
+                                                  int qProjSize,
+                                                  int qSize,
+                                                  int num_heads) {
+  // TODO this is because in top level function we assume q,k,v in same size
+  CUDA_KERNEL_LOOP(i, qProjSize * num_heads * qSize) {
+    int q_block_size = qProjSize * qSize;
+    size_t qkvo_block_size = q_block_size * 4;
+
+    int group_idx =
+        (i / (INT4_NUM_OF_ELEMENTS_PER_GROUP * qSize)) * qSize + i % qSize;
+    // i * 2 / (INT4_NUM_OF_ELEMENTS_PER_GROUP);
+    int head_idx = i / q_block_size;
+    int data_idx = i % q_block_size;
+
+    size_t idx_q = head_idx * qkvo_block_size + data_idx;
+    size_t idx_k = idx_q + q_block_size;
+    size_t idx_v = idx_k + q_block_size;
+    size_t idx_o = idx_v + q_block_size;
+
+    size_t meta_offset = num_heads * qkvo_block_size;
+    size_t one_meta_size = sizeof(DT) * (qProjSize * num_heads * qSize / 32);
+    size_t q_offset_idx = meta_offset + group_idx * sizeof(DT);
+    size_t q_scaling_idx = q_offset_idx + one_meta_size;
+
+    size_t k_offset_idx = q_scaling_idx + one_meta_size;
+    size_t k_scaling_idx = k_offset_idx + one_meta_size;
+
+    size_t v_offset_idx = k_scaling_idx + one_meta_size;
+    size_t v_scaling_idx = v_offset_idx + one_meta_size;
+
+    size_t o_offset_idx = v_scaling_idx + one_meta_size;
+    size_t o_scaling_idx = o_offset_idx + one_meta_size;
+
+    weight_ptr[idx_q] = static_cast<DT>(input_weight_ptr[idx_q] & 0xFF) /
+                            (*(DT *)(input_weight_ptr + q_scaling_idx)) +
+                        (*(DT *)(input_weight_ptr + q_offset_idx));
+    weight_ptr[idx_k] = static_cast<DT>(input_weight_ptr[idx_k] & 0xFF) /
+                            (*(DT *)(input_weight_ptr + k_scaling_idx)) +
+                        (*(DT *)(input_weight_ptr + k_offset_idx));
+    weight_ptr[idx_v] = static_cast<DT>(input_weight_ptr[idx_v] & 0xFF) /
+                            (*(DT *)(input_weight_ptr + v_scaling_idx)) +
+                        (*(DT *)(input_weight_ptr + v_offset_idx));
+    weight_ptr[idx_o] = static_cast<DT>(input_weight_ptr[idx_o] & 0xFF) /
+                            (*(DT *)(input_weight_ptr + o_scaling_idx)) +
+                        (*(DT *)(input_weight_ptr + o_offset_idx));
+  }
+}
+
+template __global__ void decompress_int4_general_weights<float>(
+    char const *input_weight_ptr, float *weight_ptr, int in_dim, int valueSize);
+template __global__ void decompress_int4_general_weights<half>(
+    char const *input_weight_ptr, half *weight_ptr, int in_dim, int valueSize);
+template __global__ void decompress_int8_general_weights<float>(
+    char const *input_weight_ptr, float *weight_ptr, int in_dim, int valueSize);
+template __global__ void decompress_int8_general_weights<half>(
+    char const *input_weight_ptr, half *weight_ptr, int in_dim, int valueSize);
+template __global__ void
+    decompress_int4_attention_weights<float>(char *input_weight_ptr,
+                                             float *weight_ptr,
+                                             int qProjSize,
+                                             int qSize,
+                                             int num_heads);
+
+template __global__ void
+    decompress_int4_attention_weights<half>(char *input_weight_ptr,
+                                            half *weight_ptr,
+                                            int qProjSize,
+                                            int qSize,
+                                            int num_heads);
+
+template __global__ void
+    decompress_int8_attention_weights<float>(char *input_weight_ptr,
+                                             float *weight_ptr,
+                                             int qProjSize,
+                                             int qSize,
+                                             int num_heads);
+
+template __global__ void
+    decompress_int8_attention_weights<half>(char *input_weight_ptr,
+                                            half *weight_ptr,
+                                            int qProjSize,
+                                            int qSize,
+                                            int num_heads);
+// template <typename T1, typename T2>
+// void decompress_weight_bias(T1 *input_weight_ptr,
+//                             T2 *weight_ptr,
+//                             T2 *params,
+//                             int group_size,
+//                             int tensor_size) {
+
+//   // convert to DT, scaling, add offset;
+//   cudaStream_t stream;
+//   checkCUDA(get_legion_stream(&stream));
+//   int parallelism = tensor_size;
+//   decompress_kernel<<<GET_BLOCKS(parallelism),
+//                       min(CUDA_NUM_THREADS, parallelism),
+//                       0,
+//                       stream>>>(
+//       input_weight_ptr, weight_ptr, params, group_size);
+// }
+} // namespace Kernels
+}; // namespace FlexFlow
diff --git a/src/ops/kernels/linear_kernels.cpp b/src/ops/kernels/linear_kernels.cpp
index a041f008bc..55a47d7108 100644
--- a/src/ops/kernels/linear_kernels.cpp
+++ b/src/ops/kernels/linear_kernels.cpp
@@ -19,7 +19,11 @@
 
 namespace FlexFlow {
 
-LinearMeta::LinearMeta(FFHandler handler, int batch_size, Linear const *li)
+LinearMeta::LinearMeta(FFHandler handler,
+                       int batch_size,
+                       Linear const *li,
+                       MemoryAllocator gpu_mem_allocator,
+                       int weightSize)
     : OpMeta(handler, li) {
   // Allocate an all-one's vector
   float *dram_one_ptr = (float *)malloc(sizeof(float) * batch_size);
diff --git a/src/ops/kernels/linear_kernels.cu b/src/ops/kernels/linear_kernels.cu
index 02b018566e..3f806dd4f5 100644
--- a/src/ops/kernels/linear_kernels.cu
+++ b/src/ops/kernels/linear_kernels.cu
@@ -14,15 +14,31 @@
  */
 
 #include "flexflow/ffconst_utils.h"
+#include "flexflow/ops/kernels/decompress_kernels.h"
 #include "flexflow/ops/kernels/linear_kernels.h"
 #include "flexflow/utils/cuda_helper.h"
 
 namespace FlexFlow {
 
-LinearMeta::LinearMeta(FFHandler handler, int batch_size, Linear const *li)
-    : OpMeta(handler, li) {
-  // Allocate an all-one's vector
+LinearMeta::LinearMeta(FFHandler handler,
+                       int batch_size,
+                       Linear const *li,
+                       MemoryAllocator gpu_mem_allocator,
+                       int weightSize)
+    : OpMeta(handler, li), weight_ptr(nullptr) {
   DataType data_type = li->data_type;
+  // allocate weight and bias in the reserve space for cpu offloading
+  if (li->offload) {
+    weight_ptr = gpu_mem_allocator.allocate_reserved_untyped(
+        weightSize * data_type_size(data_type));
+    if (li->quantization_type != DT_NONE) {
+      quantized_weightSize = get_quantization_to_byte_size(
+          data_type, li->quantization_type, weightSize);
+      quantized_weight_ptr =
+          gpu_mem_allocator.allocate_reserved<char>(quantized_weightSize);
+    }
+  }
+  // Allocate an all-one's vector
   checkCUDA(cudaMalloc(&one_ptr, data_type_size(data_type) * batch_size));
   int parallelism = batch_size;
   cudaStream_t stream;
@@ -100,7 +116,6 @@ void forward_kernel_wrapper(LinearMeta const *m,
                             int batch_size) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
-
   cudaEvent_t t_start, t_end;
   if (m->profiling) {
     cudaEventCreate(&t_start);
@@ -237,11 +252,53 @@ void forward_kernel(LinearMeta const *m,
                     int out_dim,
                     int batch_size,
                     ffStream_t stream) {
+  // additional processing for uploading weights
+  if (m->offload) {
+    // Note that we update weight_ptr when uploading weight
+    if (m->quantization_type != DT_NONE) {
+      cudaMemcpyAsync(m->quantized_weight_ptr,
+                      weight_ptr,
+                      m->quantized_weightSize,
+                      cudaMemcpyHostToDevice,
+                      stream);
+      if (m->quantization_type == DT_INT4) {
+        int parallelism = in_dim * out_dim / 2;
+        decompress_int4_general_weights<DT>
+            <<<GET_BLOCKS(parallelism),
+               min(CUDA_NUM_THREADS, parallelism),
+               0,
+               stream>>>(m->quantized_weight_ptr,
+                         static_cast<DT *>(m->weight_ptr),
+                         in_dim,
+                         in_dim * out_dim);
+      } else {
+        assert(m->quantization_type == DT_INT8);
+        int parallelism = in_dim * out_dim;
+        decompress_int8_general_weights<DT>
+            <<<GET_BLOCKS(parallelism),
+               min(CUDA_NUM_THREADS, parallelism),
+               0,
+               stream>>>(m->quantized_weight_ptr,
+                         static_cast<DT *>(m->weight_ptr),
+                         in_dim,
+                         in_dim * out_dim);
+      }
+
+    } else {
+      cudaMemcpyAsync(m->weight_ptr,
+                      weight_ptr,
+                      in_dim * out_dim * sizeof(DT),
+                      cudaMemcpyHostToDevice,
+                      stream);
+    }
+  }
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
   DT alpha = 1.0f, beta = 0.0f;
   cudaDataType_t input_type = ff_to_cuda_datatype(m->input_type);
-  cudaDataType_t weight_type = ff_to_cuda_datatype(m->weight_type);
+  cudaDataType_t weight_type = m->offload
+                                   ? ff_to_cuda_datatype(m->weight_ptr_type)
+                                   : ff_to_cuda_datatype(m->weight_type);
   cudaDataType_t output_type = ff_to_cuda_datatype(m->output_type);
   assert(input_type == weight_type && weight_type == output_type);
 #if CUDA_VERSION >= 11000
@@ -257,7 +314,7 @@ void forward_kernel(LinearMeta const *m,
                          batch_size,
                          in_dim,
                          &alpha,
-                         weight_ptr,
+                         m->offload ? m->weight_ptr : weight_ptr,
                          weight_type,
                          in_dim,
                          input_ptr,
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index 19845214e2..6ab99e6892 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -1,4 +1,5 @@
 #include "flexflow/ops/linear.h"
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/layer.h"
 #include "flexflow/model.h"
 #include "flexflow/ops/kernels/linear_kernels.h"
@@ -15,6 +16,8 @@ using Legion::Domain;
 using Legion::FutureMap;
 using Legion::IndexLauncher;
 using Legion::InlineLauncher;
+using Legion::Machine;
+using Legion::Memory;
 using Legion::PhysicalRegion;
 using Legion::Predicate;
 using Legion::Rect;
@@ -43,6 +46,8 @@ Tensor FFModel::dense(const Tensor input,
   if (data_type == DT_NONE) {
     data_type = input->data_type;
   }
+  DataType quantization_type = cpu_offload ? config.quantization_type : DT_NONE;
+  bool offload = cpu_offload;
   Layer *li = nullptr;
   if (data_type != input->data_type) {
     Tensor casted_input = cast(input, data_type, "type cast for dense");
@@ -77,14 +82,18 @@ Tensor FFModel::dense(const Tensor input,
   }
   {
     int dims[2] = {input->dims[0], outDim};
-    li->weights[KERNEL_IDX] =
-        create_weight_legion_ordering(2,
-                                      dims,
-                                      data_type,
-                                      li,
-                                      true /*create_grad*/,
-                                      kernel_initializer,
-                                      CHOSEN_SYNC_TYPE);
+    if (quantization_type != DT_NONE) {
+      dims[0] =
+          get_quantization_to_byte_size(data_type, quantization_type, dims[0]);
+    }
+    li->weights[KERNEL_IDX] = create_weight_legion_ordering(
+        2,
+        dims,
+        quantization_type == DT_NONE ? data_type : quantization_type,
+        li,
+        true /*create_grad*/,
+        kernel_initializer,
+        CHOSEN_SYNC_TYPE);
   }
   if (use_bias) {
     int dims[1] = {outDim};
@@ -101,6 +110,8 @@ Tensor FFModel::dense(const Tensor input,
   li->add_int_property("activation", activation);
   li->add_int_property("kernel_reg_type", kernel_reg_type);
   li->add_float_property("kernel_reg_lambda", kernel_reg_lambda);
+  li->add_int_property("quantization_type", quantization_type);
+  li->add_int_property("offload", offload);
   layers.push_back(li);
   return li->outputs[0];
 }
@@ -120,6 +131,10 @@ Op *Linear::create_operator_from_layer(
   RegularizerMode kernel_reg_type = (RegularizerMode)value;
   float kernel_reg_lambda;
   layer->get_float_property("kernel_reg_lambda", kernel_reg_lambda);
+  layer->get_int_property("quantization_type", value);
+  DataType quantization_type = (DataType)value;
+  layer->get_int_property("offload", value);
+  bool offload = (bool)value;
   return new Linear(model,
                     layer->layer_guid,
                     inputs[0],
@@ -129,6 +144,8 @@ Op *Linear::create_operator_from_layer(
                     kernel_reg_lambda,
                     use_bias,
                     layer->data_type,
+                    quantization_type,
+                    offload,
                     false /*allocate_weights*/,
                     layer->name);
 }
@@ -150,6 +167,8 @@ Linear::Linear(FFModel &model,
              other.kernel_reg_lambda,
              other.use_bias,
              other.data_type,
+             other.quantization_type,
+             other.offload,
              allocate_weights,
              other.name) {}
 
@@ -167,6 +186,8 @@ Linear::Linear(FFModel &model,
              params.kernel_reg_lambda,
              params.use_bias,
              params.data_type,
+             params.quantization_type,
+             params.offload,
              allocate_weights,
              name) {}
 
@@ -179,6 +200,8 @@ Linear::Linear(FFModel &model,
                float _kernel_reg_lambda,
                bool _use_bias,
                DataType _data_type,
+               DataType _quantization_type,
+               bool _offload,
                bool allocate_weights,
                char const *name)
     : Op(model,
@@ -192,6 +215,7 @@ Linear::Linear(FFModel &model,
          _input),
       out_channels(out_dim), activation(_activation), use_bias(_use_bias),
       kernel_reg_type(_kernel_reg_type), kernel_reg_lambda(_kernel_reg_lambda),
+      quantization_type(_quantization_type), offload(_offload),
       replica(ParallelTensorBase::NO_TENSOR) {
   // overwrite layer_guid
   layer_guid = _layer_guid;
@@ -206,18 +230,20 @@ Linear::Linear(FFModel &model,
   LinearParams params = this->get_params();
   params.construct_mappings(*this->parallel_dims_mapping, input_shape);
   params.solve_dims(input_shape, output_shape, kernel_shape, bias_shape);
-
   if (allocate_weights) {
     Initializer *kernel_initializer = new GlorotUniform(std::rand() /*seed*/);
-
-    weights[KERNEL_IDX] =
-        model.create_parallel_weight_legion_ordering(kernel_shape.num_dims,
-                                                     kernel_shape.dims,
-                                                     _data_type,
-                                                     NULL /*owner_op*/,
-                                                     true /*create_grad*/,
-                                                     kernel_initializer,
-                                                     CHOSEN_SYNC_TYPE);
+    if (quantization_type != DT_NONE) {
+      kernel_shape.dims[0].size = get_quantization_to_byte_size(
+          data_type, quantization_type, kernel_shape.dims[0].size);
+    }
+    weights[KERNEL_IDX] = model.create_parallel_weight_legion_ordering(
+        kernel_shape.num_dims,
+        kernel_shape.dims,
+        quantization_type == DT_NONE ? _data_type : quantization_type,
+        NULL /*owner_op*/,
+        true /*create_grad*/,
+        kernel_initializer,
+        CHOSEN_SYNC_TYPE);
 
     if (use_bias) {
       Initializer *bias_initializer = new ZeroInitializer();
@@ -260,18 +286,24 @@ void Linear::init(FFModel const &ff) {
   //     RegionRequirement(input_lps[0], 0/*projection id*/,
   //                       READ_ONLY, EXCLUSIVE, inputs[0]->region));
   // launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
   launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
                                                     0 /*projection id*/,
                                                     WRITE_ONLY,
                                                     EXCLUSIVE,
                                                     outputs[0]->region));
-  launcher.add_field(0, FID_DATA);
+  launcher.add_field(1, FID_DATA);
   launcher.add_region_requirement(RegionRequirement(weights[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
                                                     EXCLUSIVE,
                                                     weights[0]->region));
-  launcher.add_field(1, FID_DATA);
+  launcher.add_field(2, FID_DATA);
   // launcher.add_region_requirement(
   //     RegionRequirement(weights[1]->part, 0/*projection id*/,
   //                       READ_ONLY, EXCLUSIVE, weights[1]->region));
@@ -313,18 +345,26 @@ void Linear::init_inference(FFModel const &ff,
   //     RegionRequirement(input_lps[0], 0/*projection id*/,
   //                       READ_ONLY, EXCLUSIVE, inputs[0]->region));
   // launcher.add_field(0, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
-                                                    WRITE_ONLY,
+                                                    READ_ONLY,
                                                     EXCLUSIVE,
-                                                    batch_outputs[0]->region));
+                                                    batch_inputs[0]->region));
   launcher.add_field(0, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
                                                     0 /*projection id*/,
-                                                    READ_ONLY,
+                                                    WRITE_ONLY,
                                                     EXCLUSIVE,
-                                                    weights[0]->region));
+                                                    batch_outputs[0]->region));
   launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(
+      RegionRequirement(weights[0]->part,
+                        0 /*projection id*/,
+                        READ_ONLY,
+                        EXCLUSIVE,
+                        weights[0]->region,
+                        ff.cpu_offload ? MAP_TO_ZC_MEMORY : 0));
+  launcher.add_field(2, FID_DATA);
   // launcher.add_region_requirement(
   //     RegionRequirement(weights[1]->part, 0/*projection id*/,
   //                       READ_ONLY, EXCLUSIVE, weights[1]->region));
@@ -351,6 +391,7 @@ OpMeta *Linear::init_task(Task const *task,
                           Context ctx,
                           Runtime *runtime) {
   Linear const *linear = (Linear *)task->args;
+  FFHandler handle = *((FFHandler const *)task->local_args);
   GenericTensorAccessorW output =
       helperGetGenericTensorAccessorWO(linear->inputs[0]->data_type,
                                        regions[0],
@@ -362,9 +403,21 @@ OpMeta *Linear::init_task(Task const *task,
 #define DIMFUNC(DIM)                                                           \
   case DIM:                                                                    \
     if (output.data_type == DT_HALF) {                                         \
-      return init_task_with_dim<half, DIM>(task, regions, ctx, runtime);       \
+      if (linear->quantization_type != DT_NONE) {                              \
+        return init_task_with_dim<half, char, DIM>(                            \
+            task, regions, ctx, runtime);                                      \
+      } else {                                                                 \
+        return init_task_with_dim<half, half, DIM>(                            \
+            task, regions, ctx, runtime);                                      \
+      }                                                                        \
     } else if (output.data_type == DT_FLOAT) {                                 \
-      return init_task_with_dim<float, DIM>(task, regions, ctx, runtime);      \
+      if (linear->quantization_type != DT_NONE) {                              \
+        return init_task_with_dim<float, char, DIM>(                           \
+            task, regions, ctx, runtime);                                      \
+      } else {                                                                 \
+        return init_task_with_dim<float, float, DIM>(                          \
+            task, regions, ctx, runtime);                                      \
+      }                                                                        \
     } else {                                                                   \
       assert(false && "Unsupported data type");                                \
     }
@@ -376,7 +429,7 @@ OpMeta *Linear::init_task(Task const *task,
   return NULL;
 }
 
-template <typename DT, int NDIM>
+template <typename DT, typename WT, int NDIM>
 OpMeta *Linear::init_task_with_dim(Task const *task,
                                    std::vector<PhysicalRegion> const &regions,
                                    Context ctx,
@@ -387,29 +440,45 @@ OpMeta *Linear::init_task_with_dim(Task const *task,
   FFHandler handle = *((FFHandler const *)task->local_args);
   // TensorAccessorR<float, 2> acc_input(
   //     regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  TensorAccessorW<DT, NDIM> acc_output(regions[0],
-                                       task->regions[0],
+  TensorAccessorR<DT, NDIM> acc_input(
+      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  TensorAccessorW<DT, NDIM> acc_output(regions[1],
+                                       task->regions[1],
                                        FID_DATA,
                                        ctx,
                                        runtime,
                                        false /*readOutput*/);
-  TensorAccessorW<DT, NDIM> acc_kernel(regions[1],
-                                       task->regions[1],
+  TensorAccessorW<WT, NDIM> acc_kernel(regions[2],
+                                       task->regions[2],
                                        FID_DATA,
                                        ctx,
                                        runtime,
                                        false /*readOutput*/);
+
   // TensorAccessorR<float, 1> acc_bias(
   //     regions[3], task->regions[3], FID_DATA, ctx, runtime);
-  // int in_dim = acc_input.rect.hi[0] - acc_input.rect.lo[0] + 1;
-  int in_dim = acc_kernel.rect.hi[0] - acc_kernel.rect.lo[0] + 1;
+  int in_dim = acc_input.rect.hi[0] - acc_input.rect.lo[0] + 1;
+  // int in_dim = acc_kernel.rect.hi[0] - acc_kernel.rect.lo[0] + 1;
   int out_dim = acc_output.rect.hi[0] - acc_output.rect.lo[0] + 1;
   int batch_size = acc_output.rect.volume() / out_dim;
   printf("init linear (input): in_dim(%d) out_dim(%d) batch_size(%d)\n",
          in_dim,
          out_dim,
          batch_size);
-  LinearMeta *m = new LinearMeta(handle, batch_size, linear);
+  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                       .only_kind(Memory::GPU_FB_MEM)
+                       .best_affinity_to(task->target_proc)
+                       .first();
+  MemoryAllocator gpu_mem_allocator(gpu_mem);
+  if (linear->offload) {
+    // cpu-offload enabled
+    // use offload_reserved_space
+    gpu_mem_allocator.register_reserved_work_space(
+        handle.offload_reserve_space, handle.offload_reserve_space_size);
+  }
+
+  LinearMeta *m = new LinearMeta(
+      handle, batch_size, linear, gpu_mem_allocator, in_dim * out_dim);
   m->activation = linear->activation;
   m->kernel_reg_type = linear->kernel_reg_type;
   m->kernel_reg_lambda = linear->kernel_reg_lambda;
@@ -419,6 +488,9 @@ OpMeta *Linear::init_task_with_dim(Task const *task,
   m->input_type = linear->inputs[0]->data_type;
   m->weight_type = linear->weights[0]->data_type;
   m->output_type = linear->outputs[0]->data_type;
+  m->weight_ptr_type = m->input_type;
+  m->quantization_type = linear->quantization_type;
+  m->offload = linear->offload;
   std::strcpy(m->op_name, linear->name);
 
   init_kernel(m, batch_size, out_dim);
@@ -502,11 +574,13 @@ FutureMap Linear::inference(FFModel const &ff,
                                                     EXCLUSIVE,
                                                     batch_outputs[0]->region));
   launcher.add_field(1, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    weights[0]->region));
+  launcher.add_region_requirement(
+      RegionRequirement(weights[0]->part,
+                        0 /*projection id*/,
+                        READ_ONLY,
+                        EXCLUSIVE,
+                        weights[0]->region,
+                        ff.cpu_offload ? MAP_TO_ZC_MEMORY : 0));
   launcher.add_field(2, FID_DATA);
   if (use_bias) {
     launcher.add_region_requirement(RegionRequirement(weights[1]->part,
@@ -526,15 +600,29 @@ void Linear::forward_task(Task const *task,
   Domain input_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
   LinearMeta const *m = *((LinearMeta **)task->local_args);
-  assert(m->input_type == m->weight_type);
+  if (m->quantization_type == DT_NONE) {
+    assert(m->input_type == m->weight_type);
+  }
   assert(m->input_type == m->output_type);
   switch (input_domain.get_dim()) {
 #define DIMFUNC(DIM)                                                           \
   case DIM:                                                                    \
     if (m->output_type == DT_HALF) {                                           \
-      return forward_task_with_dim<half, DIM>(task, regions, ctx, runtime);    \
+      if (m->quantization_type != DT_NONE) {                                   \
+        return forward_task_with_dim<half, char, DIM>(                         \
+            task, regions, ctx, runtime);                                      \
+      } else {                                                                 \
+        return forward_task_with_dim<half, half, DIM>(                         \
+            task, regions, ctx, runtime);                                      \
+      }                                                                        \
     } else if (m->output_type == DT_FLOAT) {                                   \
-      return forward_task_with_dim<float, DIM>(task, regions, ctx, runtime);   \
+      if (m->quantization_type != DT_NONE) {                                   \
+        return forward_task_with_dim<float, char, DIM>(                        \
+            task, regions, ctx, runtime);                                      \
+      } else {                                                                 \
+        return forward_task_with_dim<float, float, DIM>(                       \
+            task, regions, ctx, runtime);                                      \
+      }                                                                        \
     } else {                                                                   \
       assert(false && "Unsupported data type");                                \
     }
@@ -551,7 +639,7 @@ void Linear::forward_task(Task const *task,
   regions[2](I): kernel
   regions[3](I): bias
 */
-template <typename DT, int NDIM>
+template <typename DT, typename WT, int NDIM>
 void Linear::forward_task_with_dim(Task const *task,
                                    std::vector<PhysicalRegion> const &regions,
                                    Context ctx,
@@ -569,14 +657,14 @@ void Linear::forward_task_with_dim(Task const *task,
                                        ctx,
                                        runtime,
                                        false /*readOutput*/);
-  TensorAccessorR<DT, NDIM> acc_kernel(
+  TensorAccessorR<WT, NDIM> acc_kernel(
       regions[2], task->regions[2], FID_DATA, ctx, runtime);
   int in_dim = acc_input.rect.hi[0] - acc_input.rect.lo[0] + 1;
   int out_dim = acc_output.rect.hi[0] - acc_output.rect.lo[0] + 1;
   int batch_size = acc_output.rect.volume() / out_dim;
   assert(acc_output.rect.volume() == static_cast<size_t>(out_dim * batch_size));
   assert(acc_input.rect.volume() == static_cast<size_t>(in_dim * batch_size));
-  assert(acc_kernel.rect.volume() == static_cast<size_t>(in_dim * out_dim));
+  // assert(acc_kernel.rect.volume() == static_cast<size_t>(in_dim * out_dim));
   DT const *acc_bias_ptr = nullptr;
   if (m->use_bias) {
     TensorAccessorR<DT, NDIM> acc_bias(
@@ -678,7 +766,9 @@ void Linear::backward_task(Task const *task,
   Domain in_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
   LinearMeta const *m = *((LinearMeta **)task->local_args);
-  assert(m->input_type == m->weight_type);
+  if (m->quantization_type == DT_NONE) {
+    assert(m->input_type == m->weight_type);
+  }
   assert(m->input_type == m->output_type);
   switch (in_domain.get_dim()) {
 #define DIMFUNC(DIM)                                                           \
@@ -1082,6 +1172,8 @@ void Linear::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->kernel_reg_lambda);
   sez.serialize(this->use_bias);
   sez.serialize(this->data_type);
+  sez.serialize(this->quantization_type);
+  sez.serialize(this->offload);
 }
 
 /* static */
@@ -1097,6 +1189,8 @@ Node Linear::deserialize(FFModel &ff,
   float kernel_reg_lambda;
   bool use_bias;
   DataType data_type;
+  DataType quantization_type;
+  bool offload;
   size_t id;
   dez.deserialize(id);
   LayerID layer_guid(id);
@@ -1106,6 +1200,8 @@ Node Linear::deserialize(FFModel &ff,
   dez.deserialize(kernel_reg_lambda);
   dez.deserialize(use_bias);
   dez.deserialize(data_type);
+  dez.deserialize(quantization_type);
+  dez.deserialize(offload);
 
   LinearParams params;
   params.activation = activation;
@@ -1115,6 +1211,8 @@ Node Linear::deserialize(FFModel &ff,
   params.use_bias = use_bias;
   params.data_type = data_type;
   params.layer_guid = layer_guid;
+  params.quantization_type = quantization_type;
+  params.offload = offload;
   return ff.get_or_create_node<Linear>(inputs[0], params);
 }
 
@@ -1127,6 +1225,8 @@ LinearParams Linear::get_params() const {
   params.activation = this->activation;
   params.kernel_reg_type = this->kernel_reg_type;
   params.kernel_reg_lambda = this->kernel_reg_lambda;
+  params.quantization_type = this->quantization_type;
+  params.offload = this->offload;
 
   return params;
 }
@@ -1330,6 +1430,8 @@ size_t hash<FlexFlow::LinearParams>::operator()(
   hash_combine(key, params.activation);
   hash_combine(key, params.kernel_reg_type);
   hash_combine(key, params.kernel_reg_lambda);
+  hash_combine(key, params.quantization_type);
+  hash_combine(key, params.offload);
   return key;
 }
 }; // namespace std
diff --git a/src/ops/spec_inc_multihead_self_attention.cc b/src/ops/spec_inc_multihead_self_attention.cc
index e4c2837e87..db3e83847f 100644
--- a/src/ops/spec_inc_multihead_self_attention.cc
+++ b/src/ops/spec_inc_multihead_self_attention.cc
@@ -595,8 +595,13 @@ OpMeta *SpecIncMultiHeadSelfAttention::init_task(
                        .only_kind(Memory::GPU_FB_MEM)
                        .best_affinity_to(task->target_proc)
                        .first();
+  MemoryAllocator gpu_mem_allocator(gpu_mem);
+  // We don't do offloading for SSMs (small speculative models)
   SpecIncMultiHeadSelfAttentionMeta *m = new SpecIncMultiHeadSelfAttentionMeta(
-      handle, attn, weight, gpu_mem, num_samples, num_heads);
+      handle, attn, weight, gpu_mem_allocator, num_samples, num_heads);
+  // assert that we didn't over allocate memory
+  assert(gpu_mem_allocator.instance_allocated_size ==
+         gpu_mem_allocator.instance_total_size);
   m->profiling = attn->profiling;
   assert(weight.domain.get_volume() * data_type_size(weight.data_type) ==
          m->weightSize);
diff --git a/src/ops/spec_inc_multihead_self_attention.cpp b/src/ops/spec_inc_multihead_self_attention.cpp
index 85bd71b205..90a4c89a39 100644
--- a/src/ops/spec_inc_multihead_self_attention.cpp
+++ b/src/ops/spec_inc_multihead_self_attention.cpp
@@ -61,7 +61,7 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
     FFHandler handler,
     SpecIncMultiHeadSelfAttention const *attn,
     GenericTensorAccessorR const &weight,
-    Memory gpu_mem,
+    MemoryAllocator &gpu_mem_allocator,
     int num_samples,
     int _num_heads)
     : IncMultiHeadSelfAttentionMeta(handler,
@@ -81,9 +81,11 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
                                     attn->add_bias_kv,
                                     attn->scaling_factor,
                                     weight,
-                                    gpu_mem,
+                                    gpu_mem_allocator,
                                     num_samples,
-                                    _num_heads) {
+                                    _num_heads,
+                                    DT_NONE,
+                                    false) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDNN(miopenSetStream(handler.dnn, stream));
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 7370ff446e..867ef4b6b9 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -582,7 +582,7 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
     FFHandler handler,
     SpecIncMultiHeadSelfAttention const *attn,
     GenericTensorAccessorR const &weight,
-    Memory gpu_mem,
+    MemoryAllocator &gpu_mem_allocator,
     int num_samples,
     int _num_heads)
     : IncMultiHeadSelfAttentionMeta(handler,
@@ -602,9 +602,11 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
                                     attn->add_bias_kv,
                                     attn->scaling_factor,
                                     weight,
-                                    gpu_mem,
+                                    gpu_mem_allocator,
                                     num_samples,
-                                    _num_heads) {
+                                    _num_heads,
+                                    DT_NONE,
+                                    false) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDNN(cudnnSetStream(handler.dnn, stream));
@@ -624,39 +626,37 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
                        BeamSearchPerRequestInfo); // more components will
                                                   // be added here later
 
-    Realm::Rect<1, coord_t> bounds(Realm::Point<1, coord_t>(0),
-                                   Realm::Point<1, coord_t>(total_size - 1));
-    std::vector<size_t> field_sizes;
-    field_sizes.push_back(sizeof(char));
-    Realm::RegionInstance::create_instance(beam_search_reserve_inst,
-                                           gpu_mem,
-                                           bounds,
-                                           field_sizes,
-                                           0,
-                                           Realm::ProfilingRequestSet())
-        .wait();
-    off_t offset = 0;
+    // We always directly allocate memory for small speculative models
+    gpu_mem_allocator.create_legion_instance(beam_search_reserve_inst,
+                                             total_size);
     beam_token_infos =
-        beam_search_reserve_inst
-            .pointer<BeamSearchBatchConfig::BeamSearchPerTokenInfo>(offset);
-    offset += beam_tokeninfo_size *
-              sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo);
+        gpu_mem_allocator
+            .allocate_instance<BeamSearchBatchConfig::BeamSearchPerTokenInfo>(
+                beam_tokeninfo_size);
+    // offset += beam_tokeninfo_size *
+    //           sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo);
     request_infos =
-        beam_search_reserve_inst.pointer<BatchConfig::PerRequestInfo>(offset);
-    offset += requestinfo_size * sizeof(BatchConfig::PerRequestInfo);
+        gpu_mem_allocator.allocate_instance<BatchConfig::PerRequestInfo>(
+            requestinfo_size);
+    // offset += requestinfo_size * sizeof(BatchConfig::PerRequestInfo);
     beam_request_infos =
-        beam_search_reserve_inst
-            .pointer<BeamSearchBatchConfig::BeamSearchPerRequestInfo>(offset);
-    offset += beam_requestinfo_size *
-              sizeof(BeamSearchBatchConfig::BeamSearchPerRequestInfo);
-    assert(offset == total_size);
+        gpu_mem_allocator
+            .allocate_instance<BeamSearchBatchConfig::BeamSearchPerRequestInfo>(
+                beam_requestinfo_size);
+    // offset += beam_requestinfo_size *
+    //           sizeof(BeamSearchBatchConfig::BeamSearchPerRequestInfo);
+    // assert(offset == total_size);
+    assert(gpu_mem_allocator.instance_total_size ==
+           gpu_mem_allocator.instance_allocated_size);
   }
 
   cudaStreamSynchronize(stream);
 }
 
 SpecIncMultiHeadSelfAttentionMeta::~SpecIncMultiHeadSelfAttentionMeta(void) {
-  beam_search_reserve_inst.destroy();
+  if (beam_search_reserve_inst != Realm::RegionInstance::NO_INST) {
+    beam_search_reserve_inst.destroy();
+  }
 }
 
 }; // namespace FlexFlow
diff --git a/src/ops/tree_inc_multihead_self_attention.cc b/src/ops/tree_inc_multihead_self_attention.cc
index 0df7e36f32..4fe218e06c 100644
--- a/src/ops/tree_inc_multihead_self_attention.cc
+++ b/src/ops/tree_inc_multihead_self_attention.cc
@@ -77,6 +77,8 @@ Tensor FFModel::inc_multihead_self_attention_verify(
   if (data_type == DT_NONE) {
     data_type = input->data_type;
   }
+  DataType quantization_type = cpu_offload ? config.quantization_type : DT_NONE;
+  bool offload = cpu_offload;
   Layer *li = nullptr;
   int weight_num = bias ? 2 : 1;
   if (data_type != input->data_type) {
@@ -118,14 +120,22 @@ Tensor FFModel::inc_multihead_self_attention_verify(
     int kParas = kProjSize * kSize;
     int vParas = vProjSize * vSize;
     int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
-    int dims[2] = {qParas + kParas + vParas + oParas, num_heads};
-    li->weights[0] = create_weight_legion_ordering(2,
-                                                   dims,
-                                                   data_type,
-                                                   li,
-                                                   true /*create_grad*/,
-                                                   kernel_initializer,
-                                                   CHOSEN_SYNC_TYPE);
+    int one_head_size = qParas + kParas + vParas + oParas;
+    // compress the weight size if quantization.
+    if (quantization_type != DT_NONE) {
+      one_head_size = get_quantization_to_byte_size(
+          data_type, quantization_type, one_head_size);
+    }
+
+    int dims[2] = {one_head_size, num_heads};
+    li->weights[0] = create_weight_legion_ordering(
+        2,
+        dims,
+        quantization_type == DT_NONE ? data_type : quantization_type,
+        li,
+        true /*create_grad*/,
+        kernel_initializer,
+        CHOSEN_SYNC_TYPE);
   }
   if (bias) {
     // q, k, v, o
@@ -151,6 +161,8 @@ Tensor FFModel::inc_multihead_self_attention_verify(
   li->add_int_property("scaling_query", scaling_query);
   li->add_float_property("scaling_factor", scaling_factor);
   li->add_int_property("qk_prod_scaling", qk_prod_scaling);
+  li->add_int_property("quantization_type", quantization_type);
+  li->add_int_property("offload", offload);
   layers.push_back(li);
   return li->outputs[0];
 }
@@ -184,6 +196,10 @@ Op *TreeIncMultiHeadSelfAttention::create_operator_from_layer(
   layer->get_float_property("scaling_factor", scaling_factor);
   layer->get_int_property("qk_prod_scaling", value);
   bool qk_prod_scaling = (bool)value;
+  layer->get_int_property("quantization_type", value);
+  DataType quantization_type = (DataType)value;
+  layer->get_int_property("offload", value);
+  bool offload = (bool)value;
   return new TreeIncMultiHeadSelfAttention(model,
                                            layer->layer_guid,
                                            inputs[0],
@@ -200,6 +216,8 @@ Op *TreeIncMultiHeadSelfAttention::create_operator_from_layer(
                                            scaling_factor,
                                            qk_prod_scaling,
                                            false /*allocate_weights*/,
+                                           quantization_type,
+                                           offload,
                                            layer->name);
 }
 
@@ -220,6 +238,8 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     float _scaling_factor,
     bool _qk_prod_scaling,
     bool allocate_weights,
+    DataType _quantization_type,
+    bool _offload,
     char const *name)
     // Initializer* _bias_initializer)
     : Op(model,
@@ -238,7 +258,8 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
       vProjSize(_vdim), oProjSize(_embed_dim),
       qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
       scaling_query(_scaling_query), scaling_factor(_scaling_factor),
-      qk_prod_scaling(_qk_prod_scaling) {
+      qk_prod_scaling(_qk_prod_scaling), quantization_type(_quantization_type),
+      offload(_offload) {
   // overwrite layer_guid
   layer_guid = _layer_guid;
 
@@ -266,6 +287,10 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     dims[1] = inputs[0]->dims[num_dims - 1];
     dims[1].size = this->num_heads;
     dims[2].size = qParas + kParas + vParas + oParas;
+    if (quantization_type != DT_NONE) {
+      dims[2].size = get_quantization_to_byte_size(
+          data_type, quantization_type, dims[2].size);
+    }
     dims[2].degree = 1;
     dims[2].parallel_idx = -1;
     int seed = std::rand();
@@ -275,12 +300,13 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
 #else
     ParameterSyncType comm_type = ParameterSyncType::PS;
 #endif
-    weights[0] = model.create_parallel_weight<3>(dims,
-                                                 this->data_type,
-                                                 NULL /*owner_op*/,
-                                                 true /*create_grad*/,
-                                                 initializer,
-                                                 comm_type);
+    weights[0] = model.create_parallel_weight<3>(
+        dims,
+        quantization_type == DT_NONE ? this->data_type : quantization_type,
+        NULL /*owner_op*/,
+        true /*create_grad*/,
+        initializer,
+        comm_type);
   }
   if (bias) {
     ParallelDim dims[2];
@@ -329,6 +355,8 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     float _scaling_factor,
     bool _qk_prod_scaling,
     bool allocate_weights,
+    DataType _quantization_type,
+    bool _offload,
     char const *name)
     // Initializer* _bias_initializer)
     : Op(model,
@@ -348,7 +376,8 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
       vProjSize(_vdim), oProjSize(_embed_dim),
       qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
       scaling_query(_scaling_query), scaling_factor(_scaling_factor),
-      qk_prod_scaling(_qk_prod_scaling)
+      qk_prod_scaling(_qk_prod_scaling), quantization_type(_quantization_type),
+      offload(_offload)
 // bias_initializer(_bias_initializer)
 {
   numOutputs = 1;
@@ -375,6 +404,10 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     dims[1] = inputs[0]->dims[num_dims - 1];
     dims[1].size = this->num_heads;
     dims[2].size = qParas + kParas + vParas + oParas;
+    if (quantization_type != DT_NONE) {
+      dims[2].size = get_quantization_to_byte_size(
+          data_type, quantization_type, dims[2].size);
+    }
     int seed = std::rand();
     Initializer *initializer = new GlorotUniform(seed);
 #ifdef USE_NCCL
@@ -382,12 +415,13 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
 #else
     ParameterSyncType comm_type = ParameterSyncType::PS;
 #endif
-    weights[0] = model.create_parallel_weight<3>(dims,
-                                                 this->data_type,
-                                                 NULL /*owner_op*/,
-                                                 true /*create_grad*/,
-                                                 initializer,
-                                                 comm_type);
+    weights[0] = model.create_parallel_weight<3>(
+        dims,
+        quantization_type == DT_NONE ? this->data_type : quantization_type,
+        NULL /*owner_op*/,
+        true /*create_grad*/,
+        initializer,
+        comm_type);
   }
   if (bias) {
     ParallelDim dims[2];
@@ -440,6 +474,8 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
                                     other.scaling_factor,
                                     other.qk_prod_scaling,
                                     allocate_weights,
+                                    other.quantization_type,
+                                    other.offload,
                                     other.name) {}
 
 TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
@@ -464,6 +500,8 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
                                     params.scaling_factor,
                                     params.qk_prod_scaling,
                                     allocate_weights,
+                                    params.quantization_type,
+                                    params.offload,
                                     name) {}
 
 void TreeIncMultiHeadSelfAttention::init_inference(
@@ -494,11 +532,13 @@ void TreeIncMultiHeadSelfAttention::init_inference(
                                                     EXCLUSIVE,
                                                     batch_inputs[0]->region));
   launcher.add_field(0, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    weights[0]->region));
+  launcher.add_region_requirement(
+      RegionRequirement(weights[0]->part,
+                        0 /*projection id*/,
+                        READ_ONLY,
+                        EXCLUSIVE,
+                        weights[0]->region,
+                        ff.cpu_offload ? MAP_TO_ZC_MEMORY : 0));
   launcher.add_field(1, FID_DATA);
   launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
                                                     0 /*projection id*/,
@@ -596,11 +636,26 @@ OpMeta *TreeIncMultiHeadSelfAttention::init_task(
                        .only_kind(Memory::GPU_FB_MEM)
                        .best_affinity_to(task->target_proc)
                        .first();
+  MemoryAllocator gpu_mem_allocator(gpu_mem);
+  if (attn->offload) {
+    // cpu-offload enabled
+    // use offload_reserved_space
+    gpu_mem_allocator.register_reserved_work_space(
+        handle.offload_reserve_space, handle.offload_reserve_space_size);
+  }
   TreeIncMultiHeadSelfAttentionMeta *m = new TreeIncMultiHeadSelfAttentionMeta(
-      handle, attn, weight, gpu_mem, num_samples, num_heads);
+      handle, attn, weight, gpu_mem_allocator, num_samples, num_heads);
+  if (!attn->offload) {
+    // assert that we didn't over allocate memory
+    assert(gpu_mem_allocator.reserved_allocated_size ==
+           gpu_mem_allocator.reserved_total_size);
+  }
   m->profiling = attn->profiling;
-  assert(weight.domain.get_volume() * data_type_size(weight.data_type) ==
-         m->weightSize);
+
+  if (attn->quantization_type == DT_NONE) {
+    assert(weight.domain.get_volume() * data_type_size(weight.data_type) ==
+           m->weightSize);
+  }
   return m;
 }
 
@@ -641,11 +696,13 @@ FutureMap TreeIncMultiHeadSelfAttention::inference(
                                                     EXCLUSIVE,
                                                     batch_inputs[0]->region));
   launcher.add_field(idx++, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    weights[0]->region));
+  launcher.add_region_requirement(
+      RegionRequirement(weights[0]->part,
+                        0 /*projection id*/,
+                        READ_ONLY,
+                        EXCLUSIVE,
+                        weights[0]->region,
+                        ff.cpu_offload ? MAP_TO_ZC_MEMORY : 0));
   launcher.add_field(idx++, FID_DATA);
   launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
                                                     0 /*projection id*/,
@@ -654,11 +711,13 @@ FutureMap TreeIncMultiHeadSelfAttention::inference(
                                                     batch_outputs[0]->region));
   launcher.add_field(idx++, FID_DATA);
   if (bias) {
-    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
-                                                      0 /*projection id*/,
-                                                      READ_ONLY,
-                                                      EXCLUSIVE,
-                                                      weights[1]->region));
+    launcher.add_region_requirement(
+        RegionRequirement(weights[1]->part,
+                          0 /*projection id*/,
+                          READ_ONLY,
+                          EXCLUSIVE,
+                          weights[1]->region,
+                          ff.cpu_offload ? MAP_TO_ZC_MEMORY : 0));
     launcher.add_field(idx++, FID_DATA);
   }
   return runtime->execute_index_space(ctx, launcher);
@@ -1571,6 +1630,8 @@ size_t hash<FlexFlow::TreeIncMultiHeadSelfAttentionParams>::operator()(
   hash_combine(key, params.scaling_query);
   hash_combine(key, params.scaling_factor);
   hash_combine(key, params.qk_prod_scaling);
+  hash_combine(key, params.quantization_type);
+  hash_combine(key, params.offload);
   return key;
 }
 }; // namespace std
diff --git a/src/ops/tree_inc_multihead_self_attention.cpp b/src/ops/tree_inc_multihead_self_attention.cpp
index 6e63860cd0..eddf20cc08 100644
--- a/src/ops/tree_inc_multihead_self_attention.cpp
+++ b/src/ops/tree_inc_multihead_self_attention.cpp
@@ -61,7 +61,7 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
     FFHandler handler,
     TreeIncMultiHeadSelfAttention const *attn,
     GenericTensorAccessorR const &weight,
-    Memory gpu_mem,
+    MemoryAllocator &gpu_mem_allocator,
     int num_samples,
     int _num_heads)
     : IncMultiHeadSelfAttentionMeta(handler,
@@ -81,9 +81,11 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
                                     attn->add_bias_kv,
                                     attn->scaling_factor,
                                     weight,
-                                    gpu_mem,
+                                    gpu_mem_allocator,
                                     num_samples,
-                                    _num_heads),
+                                    _num_heads,
+                                    attn->quantization_type,
+                                    attn->offload),
       num_active_tokens(0) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index b591e19ed8..1458085d38 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -137,7 +137,7 @@ __global__ void update_tree_branch_kv_cache(
         (i / proj_size) % num_tokens_in_branch; // index in the tree branch
     int head_idx = i / (proj_size * num_tokens_in_branch);
 
-    token_idx += processed_tokens_in_batch; // get index in the whole batch
+    token_idx += processed_tokens_in_batch;     // get index in the whole batch
     int qkv_block_size = (qProjSize + kProjSize + vProjSize) *
                          total_tokens_in_batch; // skip over previous heads
     int current_head_block_size =
@@ -459,6 +459,36 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
                       DT *output_ptr,
                       DT const *bias_ptr,
                       cudaStream_t stream) {
+  // additional processing for weight uploading
+  // if (m->handle.offload_reserve_space != nullptr) {
+  //   // Note that we update weight_ptr and bias_ptr when uploading weight and
+  //   // bias
+  //   cudaMemcpyAsync(m->weight_ptr,
+  //                   weight_ptr,
+  //                   m->weightSize,
+  //                   cudaMemcpyHostToDevice,
+  //                   stream);
+  //   weight_ptr = static_cast<DT *>(m->weight_ptr);
+  //   if (m->biasSize > 0) {
+  //     cudaMemcpyAsync(
+  //         m->bias_ptr, bias_ptr, m->biasSize, cudaMemcpyHostToDevice,
+  //         stream);
+  //     bias_ptr = static_cast<DT *>(m->bias_ptr);
+  //   }
+  //   // reload weight_o for offloading case
+  //   int parallelism = m->vProjSize * m->oProjSize * m->num_heads;
+  //   build_w_out_tensor<<<GET_BLOCKS(parallelism),
+  //                        min(CUDA_NUM_THREADS, parallelism),
+  //                        0,
+  //                        stream>>>(weight_ptr,
+  //                                  static_cast<DT *>(m->W_out_contiguous),
+  //                                  m->vProjSize,
+  //                                  m->oProjSize,
+  //                                  m->num_heads,
+  //                                  (m->qSize * m->qProjSize +
+  //                                   m->kSize * m->kProjSize +
+  //                                   m->vSize * m->vProjSize));
+  // }
   // copy committed tokens info to GPU for the commit_tokens kernel
   // Note that m->num_active_tokens stores the number of active
   // tokens in the previous batch, which is needed for committing
@@ -476,6 +506,11 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
   m->num_active_tokens = bc->num_active_tokens();
 
   // here because we need postion info in infernece 1
+  if (m->offload && m->biasSize > 0) {
+    cudaMemcpyAsync(
+        m->bias_ptr, bias_ptr, m->biasSize, cudaMemcpyHostToDevice, stream);
+    bias_ptr = static_cast<DT *>(m->bias_ptr);
+  }
   cudaMemcpyAsync(m->token_infos,
                   &(bc->tokensInfo),
                   bc->MAX_NUM_TOKENS *
@@ -522,32 +557,42 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
     cudaEventRecord(t_start, stream);
   }
 
-  assert(input.data_type == weight.data_type);
+  // assert(input.data_type == weight.data_type);
   assert(input.data_type == output.data_type);
   if (use_bias) {
     assert(input.data_type == bias.data_type);
   }
 
   if (input.data_type == DT_HALF) {
+    if (m->offload) {
+      pre_build_weight_kernel<half>(m, weight, input.data_type, stream);
+    }
+
     half const *bias_ptr =
         use_bias ? bias.get_half_ptr() : static_cast<half const *>(nullptr);
-    Kernels::TreeIncMultiHeadAttention::inference_kernel(m,
-                                                         bc,
-                                                         input.get_half_ptr(),
-                                                         weight.get_half_ptr(),
-                                                         output.get_half_ptr(),
-                                                         bias_ptr,
-                                                         stream);
+    Kernels::TreeIncMultiHeadAttention::inference_kernel(
+        m,
+        bc,
+        input.get_half_ptr(),
+        m->offload ? static_cast<half *>(m->weight_ptr) : weight.get_half_ptr(),
+        output.get_half_ptr(),
+        bias_ptr,
+        stream);
   } else if (input.data_type == DT_FLOAT) {
+    if (m->offload) {
+      pre_build_weight_kernel<float>(m, weight, input.data_type, stream);
+    }
     float const *bias_ptr =
         use_bias ? bias.get_float_ptr() : static_cast<float const *>(nullptr);
-    Kernels::TreeIncMultiHeadAttention::inference_kernel(m,
-                                                         bc,
-                                                         input.get_float_ptr(),
-                                                         weight.get_float_ptr(),
-                                                         output.get_float_ptr(),
-                                                         bias_ptr,
-                                                         stream);
+    Kernels::TreeIncMultiHeadAttention::inference_kernel(
+        m,
+        bc,
+        input.get_float_ptr(),
+        m->offload ? static_cast<float *>(m->weight_ptr)
+                   : weight.get_float_ptr(),
+        output.get_float_ptr(),
+        bias_ptr,
+        stream);
   } else {
     assert(false && "Unspported data type");
   }
@@ -570,7 +615,7 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
     FFHandler handler,
     TreeIncMultiHeadSelfAttention const *attn,
     GenericTensorAccessorR const &weight,
-    Memory gpu_mem,
+    MemoryAllocator &gpu_mem_allocator,
     int num_samples,
     int _num_heads)
     : IncMultiHeadSelfAttentionMeta(handler,
@@ -590,9 +635,11 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
                                     attn->add_bias_kv,
                                     attn->scaling_factor,
                                     weight,
-                                    gpu_mem,
+                                    gpu_mem_allocator,
                                     num_samples,
-                                    _num_heads),
+                                    _num_heads,
+                                    attn->quantization_type,
+                                    attn->offload),
       num_active_tokens(0) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
@@ -601,30 +648,34 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
   // allocate memory for the seqArray and reserve space
   {
     size_t committed_tokeninfo_size = TreeVerifyBatchConfig::MAX_NUM_TOKENS;
-    size_t totalSize = committed_tokeninfo_size *
-                       sizeof(TreeVerifyBatchConfig::CommittedTokensInfo);
-
-    Realm::Rect<1, coord_t> bounds(Realm::Point<1, coord_t>(0),
-                                   Realm::Point<1, coord_t>(totalSize - 1));
-    std::vector<size_t> field_sizes;
-    field_sizes.push_back(sizeof(char));
-    Realm::RegionInstance::create_instance(committed_token_reserve_inst,
-                                           gpu_mem,
-                                           bounds,
-                                           field_sizes,
-                                           0,
-                                           Realm::ProfilingRequestSet())
-        .wait();
-    committed_token_infos =
-        committed_token_reserve_inst
-            .pointer<TreeVerifyBatchConfig::CommittedTokensInfo>(0);
+    size_t total_size = committed_tokeninfo_size *
+                        sizeof(TreeVerifyBatchConfig::CommittedTokensInfo);
+    if (offload) {
+      // assert that we have enough reserved work space left
+      assert(gpu_mem_allocator.reserved_total_size -
+                 gpu_mem_allocator.reserved_allocated_size >=
+             total_size);
+      committed_token_infos =
+          gpu_mem_allocator
+              .allocate_reserved<TreeVerifyBatchConfig::CommittedTokensInfo>(
+                  committed_tokeninfo_size);
+    } else {
+      gpu_mem_allocator.create_legion_instance(committed_token_reserve_inst,
+                                               total_size);
+      committed_token_infos =
+          gpu_mem_allocator
+              .allocate_instance<TreeVerifyBatchConfig::CommittedTokensInfo>(
+                  committed_tokeninfo_size);
+    }
   }
 
   cudaStreamSynchronize(stream);
 }
 
 TreeIncMultiHeadSelfAttentionMeta::~TreeIncMultiHeadSelfAttentionMeta(void) {
-  committed_token_reserve_inst.destroy();
+  if (committed_token_reserve_inst != Realm::RegionInstance::NO_INST) {
+    committed_token_reserve_inst.destroy();
+  }
 }
 
 }; // namespace FlexFlow
diff --git a/src/runtime/accessor.cc b/src/runtime/accessor.cc
index 100262e85a..d3b94bf14a 100644
--- a/src/runtime/accessor.cc
+++ b/src/runtime/accessor.cc
@@ -77,6 +77,15 @@ half const *GenericTensorAccessorR::get_half_ptr() const {
   }
 }
 
+char const *GenericTensorAccessorR::get_byte_ptr() const {
+  if (data_type == DT_INT4 || data_type == DT_INT8) {
+    return static_cast<char const *>(ptr);
+  } else {
+    assert(false && "Invalid Accessor Type");
+    return static_cast<char const *>(nullptr);
+  }
+}
+
 template <typename DT, int dim>
 TensorAccessorW<DT, dim>::TensorAccessorW(PhysicalRegion region,
                                           RegionRequirement req,
@@ -156,6 +165,15 @@ half *GenericTensorAccessorW::get_half_ptr() const {
   }
 }
 
+char *GenericTensorAccessorW::get_byte_ptr() const {
+  if (data_type == DT_INT4 || data_type == DT_INT8) {
+    return static_cast<char *>(ptr);
+  } else {
+    assert(false && "Invalid Accessor Type");
+    return static_cast<char *>(nullptr);
+  }
+}
+
 template <typename DT>
 const DT *helperGetTensorPointerRO(PhysicalRegion region,
                                    RegionRequirement req,
@@ -261,6 +279,14 @@ GenericTensorAccessorR
       ptr = helperGetTensorPointerRO<double>(region, req, fid, ctx, runtime);
       break;
     }
+    case DT_INT4: {
+      ptr = helperGetTensorPointerRO<char>(region, req, fid, ctx, runtime);
+      break;
+    }
+    case DT_INT8: {
+      ptr = helperGetTensorPointerRO<char>(region, req, fid, ctx, runtime);
+      break;
+    }
     default: {
       assert(false);
     }
@@ -299,6 +325,14 @@ GenericTensorAccessorW
       ptr = helperGetTensorPointerWO<double>(region, req, fid, ctx, runtime);
       break;
     }
+    case DT_INT4: {
+      ptr = helperGetTensorPointerWO<char>(region, req, fid, ctx, runtime);
+      break;
+    }
+    case DT_INT8: {
+      ptr = helperGetTensorPointerWO<char>(region, req, fid, ctx, runtime);
+      break;
+    }
     default: {
       assert(false);
     }
@@ -337,6 +371,14 @@ GenericTensorAccessorW
       ptr = helperGetTensorPointerRW<double>(region, req, fid, ctx, runtime);
       break;
     }
+    case DT_INT4: {
+      ptr = helperGetTensorPointerRW<char>(region, req, fid, ctx, runtime);
+      break;
+    }
+    case DT_INT8: {
+      ptr = helperGetTensorPointerRW<char>(region, req, fid, ctx, runtime);
+      break;
+    }
     default: {
       assert(false);
     }
@@ -345,11 +387,13 @@ GenericTensorAccessorW
 }
 
 #define DIMFUNC(DIM)                                                           \
+  template class TensorAccessorR<char, DIM>;                                   \
   template class TensorAccessorR<half, DIM>;                                   \
   template class TensorAccessorR<float, DIM>;                                  \
   template class TensorAccessorR<double, DIM>;                                 \
   template class TensorAccessorR<int32_t, DIM>;                                \
   template class TensorAccessorR<int64_t, DIM>;                                \
+  template class TensorAccessorW<char, DIM>;                                   \
   template class TensorAccessorW<half, DIM>;                                   \
   template class TensorAccessorW<float, DIM>;                                  \
   template class TensorAccessorW<double, DIM>;                                 \
@@ -373,6 +417,22 @@ template half *helperGetTensorPointerWO(PhysicalRegion region,
                                         Context ctx,
                                         Runtime *runtime);
 
+template char const *helperGetTensorPointerRO(PhysicalRegion region,
+                                              RegionRequirement req,
+                                              FieldID fid,
+                                              Context ctx,
+                                              Runtime *runtime);
+template char *helperGetTensorPointerRW(PhysicalRegion region,
+                                        RegionRequirement req,
+                                        FieldID fid,
+                                        Context ctx,
+                                        Runtime *runtime);
+template char *helperGetTensorPointerWO(PhysicalRegion region,
+                                        RegionRequirement req,
+                                        FieldID fid,
+                                        Context ctx,
+                                        Runtime *runtime);
+
 template float const *helperGetTensorPointerRO(PhysicalRegion region,
                                                RegionRequirement req,
                                                FieldID fid,
diff --git a/src/runtime/ffconst_utils.cc b/src/runtime/ffconst_utils.cc
index 63b625edac..d2b68595bd 100644
--- a/src/runtime/ffconst_utils.cc
+++ b/src/runtime/ffconst_utils.cc
@@ -216,6 +216,15 @@ size_t data_type_size(DataType type) {
   }
 }
 
+size_t get_quantization_to_byte_size(DataType type,
+                                     DataType quantization_type,
+                                     size_t num_elements) {
+  assert(quantization_type == DT_INT4 || quantization_type == DT_INT8);
+  return (num_elements / (quantization_type == DT_INT4 ? 2 : 1)) +
+         (num_elements / INT4_NUM_OF_ELEMENTS_PER_GROUP) * 2 *
+             data_type_size(type);
+}
+
 std::ostream &operator<<(std::ostream &s, OperatorType op_type) {
   s << get_operator_type_name(op_type);
 
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index c43fe140b9..e8a1b6f9f1 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -2279,6 +2279,8 @@ GraphOptimalViewSerialized
         sez.serialize(attn->scaling_query);
         sez.serialize(attn->scaling_factor);
         sez.serialize(attn->qk_prod_scaling);
+        sez.serialize(attn->quantization_type);
+        sez.serialize(attn->offload);
         break;
       }
       case OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION: {
@@ -2315,6 +2317,8 @@ GraphOptimalViewSerialized
         sez.serialize(attn->scaling_query);
         sez.serialize(attn->scaling_factor);
         sez.serialize(attn->qk_prod_scaling);
+        sez.serialize(attn->quantization_type);
+        sez.serialize(attn->offload);
         break;
       }
       case OP_INC_MULTIQUERY_SELF_ATTENTION: {
@@ -2694,7 +2698,8 @@ void FFModel::deserialize_graph_optimal_view(
         int embed_dim, num_heads, k_dim, v_dim;
         float dropout, scaling_factor;
         bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
-            scaling_query, qk_prod_scaling;
+            scaling_query, qk_prod_scaling, offload;
+        DataType quantization_type;
         size_t id;
         dez.deserialize(id);
         LayerID layer_guid(id);
@@ -2710,6 +2715,8 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(scaling_query);
         dez.deserialize(scaling_factor);
         dez.deserialize(qk_prod_scaling);
+        dez.deserialize(quantization_type);
+        dez.deserialize(offload);
 
         IncMultiHeadSelfAttentionParams params;
         params.embed_dim = embed_dim;
@@ -2725,6 +2732,8 @@ void FFModel::deserialize_graph_optimal_view(
         params.scaling_query = scaling_query;
         params.scaling_factor = scaling_factor;
         params.qk_prod_scaling = qk_prod_scaling;
+        params.quantization_type = quantization_type;
+        params.offload = offload;
         node = get_or_create_node<IncMultiHeadSelfAttention>(inputs[0], params);
         break;
       }
@@ -2773,7 +2782,8 @@ void FFModel::deserialize_graph_optimal_view(
         int embed_dim, num_heads, k_dim, v_dim;
         float dropout, scaling_factor;
         bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
-            scaling_query, qk_prod_scaling;
+            scaling_query, qk_prod_scaling, offload;
+        DataType quantization_type;
         size_t id;
         dez.deserialize(id);
         LayerID layer_guid(id);
@@ -2789,6 +2799,8 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(scaling_query);
         dez.deserialize(scaling_factor);
         dez.deserialize(qk_prod_scaling);
+        dez.deserialize(quantization_type);
+        dez.deserialize(offload);
 
         TreeIncMultiHeadSelfAttentionParams params;
         params.embed_dim = embed_dim;
@@ -2804,6 +2816,8 @@ void FFModel::deserialize_graph_optimal_view(
         params.scaling_query = scaling_query;
         params.scaling_factor = scaling_factor;
         params.qk_prod_scaling = qk_prod_scaling;
+        params.quantization_type = quantization_type;
+        params.offload = offload;
         node = get_or_create_node<TreeIncMultiHeadSelfAttention>(inputs[0],
                                                                  params);
         break;
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 5a5c57bfea..c7fe4d6a82 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -26,6 +26,7 @@ namespace FlexFlow {
 using namespace Legion;
 
 LegionRuntime::Logger::Category log_inf_mgr("InferenceManager");
+LegionRuntime::Logger::Category log_offload("Offloading");
 
 InferenceManager::InferenceManager(FFConfig const &_config,
                                    int _max_num_tokens_per_batch,
@@ -45,6 +46,18 @@ InferenceManager::InferenceManager(FFConfig const &_config,
   }
 }
 
+bool parallel_tensor_list_overlaps(std::vector<ParallelTensor> const &list1,
+                                   std::vector<ParallelTensor> const &list2) {
+  for (auto const &pt1 : list1) {
+    for (auto const &pt2 : list2) {
+      if (pt1 == pt2) {
+        return true;
+      }
+    }
+  }
+  return false;
+}
+
 void InferenceManager::compile_model_and_allocate_buffer(
     FFModel *model,
     std::unordered_map<Tensor, std::vector<MachineView>> const
@@ -61,7 +74,8 @@ void InferenceManager::compile_model_and_allocate_buffer(
     assert(pt->owner_op != nullptr);
     mapping[pt->owner_op] = it.second;
   }
-  for (auto const &op : model->operators) {
+  for (int op_idx = 0; op_idx < model->operators.size(); op_idx++) {
+    Op const *op = model->operators[op_idx];
     // Skip weight operators
     if (op->op_type == OP_WEIGHT) {
       continue;
@@ -99,20 +113,70 @@ void InferenceManager::compile_model_and_allocate_buffer(
       ParallelTensor pt_base = op->outputs[i];
       assert(tensor_buffer.find(pt_base) == tensor_buffer.end());
       std::vector<ParallelTensor> list;
-      for (int j = 0; j < max_num_inflight_batches; j++) {
-        // Copy the metadata from pt_base to pt
-        ParallelTensor pt = new ParallelTensorBase(*pt_base);
-        pt->region =
-            runtime->create_logical_region(ctx,
-                                           pt_base->region.get_index_space(),
-                                           pt_base->region.get_field_space());
-        pt->part = runtime->get_logical_partition(
-            ctx, pt->region, pt_base->part.get_index_partition());
-        pt->machine_view = machine_views[j];
-        Domain part_domain =
-            runtime->get_index_space_domain(ctx, pt_base->parallel_is);
-        assert(pt->machine_view.get_domain() == part_domain);
-        list.push_back(pt);
+      bool found_parallel_tensor = false;
+      if (model->cpu_offload) {
+        for (auto const &pre_pt : tensor_buffer) {
+          bool used_by_future_operator = false;
+          bool used_by_current_operator = false;
+          if (pre_pt.first->get_shape() != pt_base->get_shape()) {
+            // Continue if shape mismatches
+            continue;
+          }
+          // Check that pt cannot be used as an input to the current operator
+          for (int j = 0; j < op->numInputs; j++) {
+            if (parallel_tensor_list_overlaps(tensor_buffer[op->inputs[j]],
+                                              pre_pt.second)) {
+              used_by_current_operator = true;
+            }
+          }
+          for (int j = 0; j < i; j++) {
+            assert(tensor_buffer.find(op->outputs[j]) != tensor_buffer.end());
+            if (parallel_tensor_list_overlaps(tensor_buffer[op->outputs[j]],
+                                              pre_pt.second)) {
+              used_by_current_operator = true;
+            }
+          }
+          // Check that pt cannot be used by any subsequent operators
+          for (int op_idx2 = op_idx; op_idx2 < model->operators.size();
+               op_idx2++) {
+            Op const *op2 = model->operators[op_idx2];
+            for (int j = 0; j < op2->numInputs; j++) {
+              if (tensor_buffer.find(op2->inputs[j]) != tensor_buffer.end()) {
+                if (parallel_tensor_list_overlaps(tensor_buffer[op2->inputs[j]],
+                                                  pre_pt.second)) {
+                  used_by_future_operator = true;
+                }
+              }
+            }
+          }
+          if (!used_by_future_operator && !used_by_current_operator) {
+            found_parallel_tensor = true;
+            list = pre_pt.second;
+          }
+        }
+        if (!found_parallel_tensor) {
+          log_offload.print(
+              "Cannot find a previous tensor for operator(%d) output_idx(%d)",
+              op_idx,
+              i);
+        }
+      }
+      if (!found_parallel_tensor) {
+        for (int j = 0; j < max_num_inflight_batches; j++) {
+          // Copy the metadata from pt_base to pt
+          ParallelTensor pt = new ParallelTensorBase(*pt_base);
+          pt->region =
+              runtime->create_logical_region(ctx,
+                                             pt_base->region.get_index_space(),
+                                             pt_base->region.get_field_space());
+          pt->part = runtime->get_logical_partition(
+              ctx, pt->region, pt_base->part.get_index_partition());
+          pt->machine_view = machine_views[j];
+          Domain part_domain =
+              runtime->get_index_space_domain(ctx, pt_base->parallel_is);
+          assert(pt->machine_view.get_domain() == part_domain);
+          list.push_back(pt);
+        }
       }
       assert(tensor_buffer.find(pt_base) == tensor_buffer.end());
       tensor_buffer[pt_base] = list;
diff --git a/src/runtime/memory_allocator.cc b/src/runtime/memory_allocator.cc
new file mode 100644
index 0000000000..06a7c468a4
--- /dev/null
+++ b/src/runtime/memory_allocator.cc
@@ -0,0 +1,54 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/utils/memory_allocator.h"
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::coord_t;
+using Legion::Memory;
+using Realm::RegionInstance;
+
+MemoryAllocator::MemoryAllocator(Memory _memory)
+    : memory(_memory), reserved_ptr(nullptr), instance_ptr(nullptr),
+      reserved_total_size(0), reserved_allocated_size(0),
+      instance_total_size(0), instance_allocated_size(0) {}
+
+void MemoryAllocator::create_legion_instance(RegionInstance &inst,
+                                             size_t size) {
+  // Assert that we have used up previously created region instance
+  assert(instance_total_size == instance_allocated_size);
+  Realm::Rect<1, coord_t> bounds(Realm::Point<1, coord_t>(0),
+                                 Realm::Point<1, coord_t>(size - 1));
+  std::vector<size_t> field_sizes;
+  field_sizes.push_back(sizeof(char));
+  Realm::RegionInstance::create_instance(
+      inst, memory, bounds, field_sizes, 0, Realm::ProfilingRequestSet())
+      .wait();
+  instance_ptr = inst.pointer_untyped(0, 0);
+  instance_total_size = size;
+  instance_allocated_size = 0;
+}
+
+void MemoryAllocator::register_reserved_work_space(void *base, size_t size) {
+  // Assert that we haven't allocated anything before
+  assert(reserved_total_size == 0);
+  reserved_ptr = base;
+  reserved_total_size = size;
+  reserved_allocated_size = 0;
+}
+
+}; // namespace FlexFlow
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 8d1133f7c9..e6e432040f 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -1271,6 +1271,9 @@ FFRuntime::FFRuntime(FFConfig &config) {
     // info.myRank = rank++;
     // info.allRanks = config.workersPerNode * config.numNodes;
     info.workSpaceSize = config.workSpaceSize;
+    info.offload_reserve_space_size =
+        config.cpu_offload ? config.offload_reserve_space_size : 0;
+    info.quantization_type = config.quantization_type;
     info.allowTensorOpMathConversion = config.allow_tensor_op_math_conversion;
     argmap.set_point(*it, TaskArgument(&info, sizeof(FFInitInfo)));
   }
@@ -1294,7 +1297,7 @@ FFRuntime::FFRuntime(FFConfig &config) {
 
 FFRuntime *ffruntime_singleton = nullptr;
 
-FFModel::FFModel(FFConfig &_config)
+FFModel::FFModel(FFConfig &_config, bool cpu_offload)
     : op_global_guid(OP_GUID_FIRST_VALID),
       layer_global_guid(LAYER_GUID_FIRST_VALID),
       tensor_global_guid(TENSOR_GUID_FIRST_VALID),
@@ -1303,6 +1306,7 @@ FFModel::FFModel(FFConfig &_config)
       loss_op(NULL), metrics_op(NULL), simulator(NULL) {
   this->search = new PCG::SearchHelper(this);
   this->graph_search = new PCG::GraphSearchHelper(this);
+  this->cpu_offload = cpu_offload;
 
   if (ffruntime_singleton == nullptr) {
     ffruntime_singleton = new FFRuntime(_config);
@@ -1715,6 +1719,12 @@ void FFModel::map_tensor_with_dim2(ParallelTensor tensor,
     case DT_INT64:
       allocator.allocate_field(sizeof(int64_t), FID_DATA);
       break;
+    case DT_INT4:
+      allocator.allocate_field(sizeof(char), FID_DATA);
+      break;
+    case DT_INT8:
+      allocator.allocate_field(sizeof(char), FID_DATA);
+      break;
     default:
       assert(false);
   }
@@ -3648,9 +3658,12 @@ struct DefaultConfig {
   const static int cpusPerNode = 0;
   const static size_t searchBudget = -1;
   const static size_t simulatorWorkSpaceSize =
-      (size_t)2 * 1024 * 1024 * 1024; // 2GB
+      (size_t)2 * 1024 * 1024 * 1024; // 2 GB
   constexpr static float searchAlpha = 1.2f;
   const static bool searchOverlapBackwardUpdate = false;
+  const static size_t offloadReserveSpaceSize =
+      (size_t)8 * 1024 * 1024 * 1024; // 8 GB
+  const static bool cpuOffload = false;
   const static bool onlyDataParallel = true;
   const static bool enableSampleParallel = true;
   const static bool enableParameterParallel = false;
@@ -3682,6 +3695,9 @@ FFConfig::FFConfig() {
   search_alpha = DefaultConfig::searchAlpha;
   search_overlap_backward_update = DefaultConfig::searchOverlapBackwardUpdate;
   computationMode = COMP_MODE_TRAINING;
+  cpu_offload = DefaultConfig::cpuOffload;
+  offload_reserve_space_size = DefaultConfig::offloadReserveSpaceSize;
+  quantization_type = DT_NONE;
   only_data_parallel = DefaultConfig::onlyDataParallel;
   enable_sample_parallel = DefaultConfig::enableSampleParallel;
   enable_parameter_parallel = DefaultConfig::enableParameterParallel;
@@ -3775,6 +3791,22 @@ void FFConfig::parse_args(char **argv, int argc) {
       export_strategy_file = std::string(argv[++i]);
       continue;
     }
+    if ((!strcmp(argv[i], "-offload"))) {
+      cpu_offload = true;
+      continue;
+    }
+    if (!strcmp(argv[i], "-offload-reserve-space-size")) {
+      offload_reserve_space_size = atoll(argv[++i]) * 1024 * 1024;
+      continue;
+    }
+    if ((!strcmp(argv[i], "--4bit-quantization"))) {
+      quantization_type = DT_INT4;
+      continue;
+    }
+    if ((!strcmp(argv[i], "--8bit-quantization"))) {
+      quantization_type = DT_INT8;
+      continue;
+    }
     if ((!strcmp(argv[i], "--only-data-parallel"))) {
       only_data_parallel = true;
       continue;
diff --git a/src/runtime/model.cu b/src/runtime/model.cu
index e07a7465a9..17401a0f14 100644
--- a/src/runtime/model.cu
+++ b/src/runtime/model.cu
@@ -86,6 +86,8 @@ FFHandler
   printf("workSpaceSize (%zu MB)\n", info->workSpaceSize / 1024 / 1024);
   FFHandler handle;
   handle.workSpaceSize = info->workSpaceSize;
+  handle.offload_reserve_space_size = info->offload_reserve_space_size;
+  handle.quantization_type = info->quantization_type;
   handle.allowTensorOpMathConversion = info->allowTensorOpMathConversion;
   checkCUDA(cublasCreate(&handle.blas));
   if (handle.allowTensorOpMathConversion) {
@@ -125,6 +127,31 @@ FFHandler
         .wait();
     handle.workSpace = workspaceInst.pointer_untyped(0, sizeof(char));
   }
+  if (handle.offload_reserve_space_size > 0) {
+    // allocate memory for offload reserve space
+    Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                         .only_kind(Memory::GPU_FB_MEM)
+                         .best_affinity_to(task->target_proc)
+                         .first();
+    Realm::Rect<1, coord_t> bounds(
+        Realm::Point<1, coord_t>(0),
+        Realm::Point<1, coord_t>(handle.offload_reserve_space_size - 1));
+    std::vector<size_t> field_sizes;
+    field_sizes.push_back(sizeof(char));
+    Realm::RegionInstance workspaceInst;
+    Realm::RegionInstance::create_instance(workspaceInst,
+                                           gpu_mem,
+                                           bounds,
+                                           field_sizes,
+                                           0,
+                                           Realm::ProfilingRequestSet())
+        .wait();
+    handle.offload_reserve_space =
+        workspaceInst.pointer_untyped(0, sizeof(char));
+  } else {
+    handle.offload_reserve_space = nullptr;
+  }
+
   // checkCUDA(cudaMalloc(&handle.workSpace, handle.workSpaceSize));
 #ifdef FF_USE_NCCL
   handle.ncclComm = NULL;
diff --git a/src/runtime/parallel_tensor.cc b/src/runtime/parallel_tensor.cc
index 0fb98e05ea..7bce941c68 100644
--- a/src/runtime/parallel_tensor.cc
+++ b/src/runtime/parallel_tensor.cc
@@ -841,6 +841,14 @@ template bool ParallelTensorBase::set_tensor<half>(FFModel const *ff,
 template bool ParallelTensorBase::get_tensor<half>(FFModel const *ff,
                                                    half *data,
                                                    bool get_gradients);
+
+template bool ParallelTensorBase::set_tensor<char>(FFModel const *ff,
+                                                   std::vector<int> const &dims,
+                                                   char const *data);
+template bool ParallelTensorBase::get_tensor<char>(FFModel const *ff,
+                                                   char *data,
+                                                   bool get_gradients);
+
 template bool ParallelTensorBase::set_tensor<float>(
     FFModel const *ff, std::vector<int> const &dims, float const *data);
 template bool ParallelTensorBase::get_tensor<float>(FFModel const *ff,

From 0f3be1f05910d91b043ec44cc56c40e5254358c2 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 25 Jun 2023 22:45:19 +0800
Subject: [PATCH 154/344] [Inference] Tensor model parallelism (#778)

* add parallel operators

* add cmd line param

* setting machine views

* move bias blocks

* comment out print of partitions

* add unimplemented methods

* add impl of inference functions to replicate and reduce ops

* replicate bias in file loader

* fixes, now works

* only add bias once

* load and use weights according to partition

* fix wout weight

* cleanup

* add support for mixed precision in parallel ops

* cleanup

* rocm build fix

* hip rocm fix 2

* fix machine views

* fix rocm build

* adjust numbe of pipeline stages

* add model parallelism to opt linear layers

* fix

* fxi multi gpu test

* fix

* add tensor parallelism tests to inference test script

* enable tensor parallelism for dense layers in llama

* fix

* fix set_tensor-related issues

* fix and linting
---
 .github/workflows/gpu-ci-skip.yml             |   2 +-
 .github/workflows/gpu-ci.yml                  |   9 +-
 config/config.linux                           |   2 +-
 include/flexflow/config.h                     |   2 +
 include/flexflow/operator.h                   |   1 +
 .../ops/inc_multihead_self_attention.h        |   4 +-
 .../inc_multihead_self_attention_kernels.h    |   2 +
 include/flexflow/ops/kernels/linear_kernels.h |   2 +-
 .../ops/spec_inc_multihead_self_attention.h   |   1 +
 .../ops/tree_inc_multihead_self_attention.h   |   1 +
 .../parallel_ops/kernels/reduction_kernels.h  |   8 +
 .../parallel_ops/kernels/replicate_kernels.h  |   8 +
 include/flexflow/parallel_ops/reduction.h     |  17 ++
 include/flexflow/parallel_ops/replicate.h     |  24 +++
 inference/file_loader.cc                      |  70 ++++++--
 inference/incr_decoding/incr_decoding.cc      |  25 ++-
 inference/spec_infer/spec_infer.cc            |  25 ++-
 src/ops/attention.cc                          |  14 +-
 src/ops/experts.cc                            |   9 +-
 src/ops/inc_multihead_self_attention.cc       | 108 +++++------
 src/ops/inc_multihead_self_attention.cpp      |   2 +
 src/ops/inc_multihead_self_attention.cu       |  44 +++--
 src/ops/inc_multiquery_self_attention.cc      |  14 +-
 src/ops/inc_multiquery_self_attention.cu      |  30 ++--
 src/ops/layer_norm.cc                         |   9 +-
 src/ops/linear.cc                             |  24 ++-
 src/ops/spec_inc_multihead_self_attention.cc  | 105 +++++------
 src/ops/spec_inc_multihead_self_attention.cpp |   2 +
 src/ops/spec_inc_multihead_self_attention.cu  |  18 +-
 src/ops/tree_inc_multihead_self_attention.cc  | 107 +++++------
 src/ops/tree_inc_multihead_self_attention.cpp |   2 +
 src/ops/tree_inc_multihead_self_attention.cu  |  18 +-
 .../kernels/reduction_kernels.cpp             |  12 ++
 src/parallel_ops/kernels/reduction_kernels.cu |  12 ++
 .../kernels/replicate_kernels.cpp             |   7 +
 src/parallel_ops/kernels/replicate_kernels.cu |   7 +
 src/parallel_ops/reduction.cc                 | 169 +++++++++++++++++-
 src/parallel_ops/replicate.cc                 | 147 +++++++++++++--
 src/runtime/cuda_helper.cu                    |   4 +
 src/runtime/inference_manager.cc              |  49 +++++
 src/runtime/model.cc                          |  76 +++++++-
 src/runtime/parallel_tensor.cc                |   9 +-
 src/runtime/request_manager.cc                |   4 +-
 tests/inference_tests.sh                      |  42 +++++
 44 files changed, 931 insertions(+), 316 deletions(-)

diff --git a/.github/workflows/gpu-ci-skip.yml b/.github/workflows/gpu-ci-skip.yml
index 766bd8d790..a9b5132ef6 100644
--- a/.github/workflows/gpu-ci-skip.yml
+++ b/.github/workflows/gpu-ci-skip.yml
@@ -45,7 +45,7 @@ jobs:
   gpu-ci-flexflow:
     name: Single Machine, Multiple GPUs Tests
     runs-on: ubuntu-20.04
-    if: ${{ github.event_name != 'pull_request' || github.base_ref != 'inference' }}
+    # if: ${{ github.event_name != 'pull_request' || github.base_ref != 'inference' }}
     needs: inference-tests
     steps:
       - run: 'echo "No gpu-ci required"'
diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index 9797670c77..7f83fb2691 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -185,8 +185,13 @@ jobs:
   gpu-ci-flexflow:
     name: Single Machine, Multiple GPUs Tests
     runs-on: self-hosted
-    #skip this time-consuming test for PRs to the inference branch
-    if: ${{ github.event_name != 'pull_request' || github.base_ref != 'inference' }}
+    # skip this time-consuming test for PRs to the inference branch
+    # if: ${{ github.event_name != 'pull_request' || github.base_ref != 'inference' }}
+    defaults:
+      run:
+        shell: bash -l {0} # required to use an activated conda environment
+    env: 
+      CONDA: "3"
     needs: inference-tests
     container:
       image: ghcr.io/flexflow/flexflow-environment-cuda:latest
diff --git a/config/config.linux b/config/config.linux
index 482a154145..8039402a13 100755
--- a/config/config.linux
+++ b/config/config.linux
@@ -72,7 +72,7 @@ FF_USE_AVX2=${FF_USE_AVX2:-OFF}
 FF_MAX_DIM=${FF_MAX_DIM:-5}
 
 # set LEGION_MAX_RETURN_SIZE
-LEGION_MAX_RETURN_SIZE=${LEGION_MAX_RETURN_SIZE:-65536}
+LEGION_MAX_RETURN_SIZE=${LEGION_MAX_RETURN_SIZE:-131072}
 
 # set ROCM path
 ROCM_PATH=${ROCM_PATH:-"/opt/rocm"}
diff --git a/include/flexflow/config.h b/include/flexflow/config.h
index f5eb2e069a..f7c59f7b58 100644
--- a/include/flexflow/config.h
+++ b/include/flexflow/config.h
@@ -143,6 +143,8 @@ class FFConfig {
   bool enable_parameter_parallel;
   bool enable_attribute_parallel;
   bool enable_inplace_optimizations;
+  // Control tensor model parallelism degree in inference
+  int tensor_parallelism_degree;
   // Control Tensor Op Math Conversion
   bool allow_tensor_op_math_conversion;
   std::string dataset_path;
diff --git a/include/flexflow/operator.h b/include/flexflow/operator.h
index 122850ec05..13b2bb8ba8 100644
--- a/include/flexflow/operator.h
+++ b/include/flexflow/operator.h
@@ -294,6 +294,7 @@ class Op {
   std::map<ParallelTensor, OpMeta *[MAX_NUM_WORKERS]> inference_meta;
   int numInputs, numWeights, numOutputs;
   bool profiling;
+  bool add_bias_only_once;
 #ifdef FF_USE_NCCL
   ncclUniqueId ncclId;
 #endif
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index a178dad577..b5d441713f 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -105,6 +105,7 @@ class IncMultiHeadSelfAttention : public Op {
 
   static void inference_kernel_wrapper(IncMultiHeadSelfAttentionMeta const *m,
                                        BatchConfig const *bc,
+                                       int shard_id,
                                        GenericTensorAccessorR const &input,
                                        GenericTensorAccessorR const &weight,
                                        GenericTensorAccessorW const &output,
@@ -150,6 +151,7 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
                                 GenericTensorAccessorR const &weight,
                                 MemoryAllocator &gpu_mem_allocator,
                                 int num_samples,
+                                int _global_num_heads,
                                 int _num_heads,
                                 DataType _quantization_type,
                                 bool _offload);
@@ -160,7 +162,7 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
   size_t weights_params, weightSize, biasSize, reserveSpaceSize,
       quantized_weightSize;
   int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
-  int num_heads;
+  int global_num_heads, num_heads;
   bool *has_load_weights;
   bool *apply_rotary_embedding;
   bool *bias;
diff --git a/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h b/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
index a35cf9d7f2..5b40136524 100644
--- a/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
+++ b/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
@@ -28,6 +28,7 @@ __global__ void apply_proj_bias_w(DT *input_ptr,
 template <typename DT>
 __global__ void apply_proj_bias_qkv(DT *input_ptr,
                                     DT const *bias_ptr,
+                                    int shard_id,
                                     int num_tokens,
                                     int qProjSize,
                                     int kProjSize,
@@ -53,6 +54,7 @@ __global__ void
 template <typename DT>
 void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                         BatchConfig const *bc,
+                        int shard_id,
                         DT const *input_ptr,
                         DT const *weight_ptr,
                         DT *output_ptr,
diff --git a/include/flexflow/ops/kernels/linear_kernels.h b/include/flexflow/ops/kernels/linear_kernels.h
index ed4864b1ab..9644fd9c8f 100644
--- a/include/flexflow/ops/kernels/linear_kernels.h
+++ b/include/flexflow/ops/kernels/linear_kernels.h
@@ -32,7 +32,7 @@ class LinearMeta : public OpMeta {
   ActiMode activation;
   RegularizerMode kernel_reg_type;
   float kernel_reg_lambda;
-  bool use_bias;
+  bool use_bias, add_bias_only_once;
   DataType input_type, weight_type, output_type;
   char op_name[MAX_OPNAME];
 };
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention.h b/include/flexflow/ops/spec_inc_multihead_self_attention.h
index db12be5792..eef684cdb7 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention.h
@@ -105,6 +105,7 @@ class SpecIncMultiHeadSelfAttention : public Op {
   static void
       inference_kernel_wrapper(SpecIncMultiHeadSelfAttentionMeta const *m,
                                BeamSearchBatchConfig const *bc,
+                               int shard_id,
                                GenericTensorAccessorR const &input,
                                GenericTensorAccessorR const &weight,
                                GenericTensorAccessorW const &output,
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention.h b/include/flexflow/ops/tree_inc_multihead_self_attention.h
index 328ab128b2..a9e584aa2b 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention.h
@@ -104,6 +104,7 @@ class TreeIncMultiHeadSelfAttention : public Op {
 
   static void inference_kernel_wrapper(TreeIncMultiHeadSelfAttentionMeta *m,
                                        TreeVerifyBatchConfig const *bc,
+                                       int shard_id,
                                        GenericTensorAccessorR const &input,
                                        GenericTensorAccessorR const &weight,
                                        GenericTensorAccessorW const &output,
diff --git a/include/flexflow/parallel_ops/kernels/reduction_kernels.h b/include/flexflow/parallel_ops/kernels/reduction_kernels.h
index e9f6a9d070..51ddced227 100644
--- a/include/flexflow/parallel_ops/kernels/reduction_kernels.h
+++ b/include/flexflow/parallel_ops/kernels/reduction_kernels.h
@@ -3,8 +3,16 @@
 
 #include "flexflow/device.h"
 #include "flexflow/fftype.h"
+#include "flexflow/op_meta.h"
+#include "flexflow/parallel_ops/reduction.h"
 
 namespace FlexFlow {
+
+class ReductionMeta : public OpMeta {
+public:
+  ReductionMeta(FFHandler handle, Reduction const *reduct);
+};
+
 namespace Kernels {
 namespace Reduction {
 
diff --git a/include/flexflow/parallel_ops/kernels/replicate_kernels.h b/include/flexflow/parallel_ops/kernels/replicate_kernels.h
index 619d06efef..d5d52797c3 100644
--- a/include/flexflow/parallel_ops/kernels/replicate_kernels.h
+++ b/include/flexflow/parallel_ops/kernels/replicate_kernels.h
@@ -3,8 +3,16 @@
 
 #include "flexflow/device.h"
 #include "flexflow/fftype.h"
+#include "flexflow/op_meta.h"
+#include "flexflow/parallel_ops/replicate.h"
 
 namespace FlexFlow {
+
+class ReplicateMeta : public OpMeta {
+public:
+  ReplicateMeta(FFHandler handle, Replicate const *repl);
+};
+
 namespace Kernels {
 namespace Replicate {
 
diff --git a/include/flexflow/parallel_ops/reduction.h b/include/flexflow/parallel_ops/reduction.h
index fed5f049c7..1918c3b587 100644
--- a/include/flexflow/parallel_ops/reduction.h
+++ b/include/flexflow/parallel_ops/reduction.h
@@ -25,12 +25,29 @@ class Reduction : public ParallelOp {
             Input const input,
             char const *name = nullptr);
   void create_input_partition(FFModel &model) override;
+  void create_input_partition_inference(
+      FFModel &model,
+      std::vector<ParallelTensor> const &batch_inputs,
+      std::vector<ParallelTensor> const &batch_outputs) override;
   void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfig const &bc,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
   void backward(FFModel const &) override;
   bool get_int_parameter(PMParameter, int *) const override;
   bool append_parallel_op_info(
       std::vector<ParallelOpInfo> &parallel_ops) const override;
+  static OpMeta *init_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
   static void forward_task(Legion::Task const *task,
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
diff --git a/include/flexflow/parallel_ops/replicate.h b/include/flexflow/parallel_ops/replicate.h
index 381f690cdc..f8f2c42559 100644
--- a/include/flexflow/parallel_ops/replicate.h
+++ b/include/flexflow/parallel_ops/replicate.h
@@ -10,6 +10,8 @@
 
 namespace FlexFlow {
 
+class ReplicateMeta;
+
 class Replicate : public ParallelOp {
 public:
   using Params = ReplicateParams;
@@ -25,12 +27,29 @@ class Replicate : public ParallelOp {
             Input const input,
             char const *name = nullptr);
   void create_input_partition(FFModel &model) override;
+  void create_input_partition_inference(
+      FFModel &model,
+      std::vector<ParallelTensor> const &batch_inputs,
+      std::vector<ParallelTensor> const &batch_outputs) override;
   void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfig const &bc,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
   void backward(FFModel const &) override;
   bool get_int_parameter(PMParameter, int *) const override;
   bool append_parallel_op_info(
       std::vector<ParallelOpInfo> &parallel_ops) const override;
+  static OpMeta *init_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
   static void forward_task(Legion::Task const *task,
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
@@ -39,6 +58,11 @@ class Replicate : public ParallelOp {
                             std::vector<Legion::PhysicalRegion> const &regions,
                             Legion::Context ctx,
                             Legion::Runtime *runtime);
+  static void forward_kernel_wrapper(ReplicateMeta const *m,
+                                     GenericTensorAccessorR const &input,
+                                     GenericTensorAccessorW const &output,
+                                     size_t num_elements,
+                                     size_t num_replicas);
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
                              CostMetrics &cost_metrics) const override;
diff --git a/inference/file_loader.cc b/inference/file_loader.cc
index a7386d6597..071124fc0d 100644
--- a/inference/file_loader.cc
+++ b/inference/file_loader.cc
@@ -84,7 +84,11 @@ void load_attention_bias(DT *ptr,
 
   int file_index = 0;
   for (auto file : bias_files) {
-    size_t partial_size = hidden_dim;
+    size_t qkv_partial_size = qkv_inner_dim * num_heads;
+    size_t out_partial_size = hidden_dim;
+    size_t partial_size =
+        (file_index < 3) ? qkv_partial_size : out_partial_size;
+    // std::cout << "Loading filename: " << file << std::endl;
     std::ifstream in(file, std::ios::in | std::ios::binary);
     assert(in.good() && "incorrect bias file path");
     std::vector<DT> host_array(partial_size);
@@ -95,15 +99,18 @@ void load_attention_bias(DT *ptr,
     size_t in_get_size = in.gcount();
 
     if (in_get_size != loaded_data_size) {
-      std::cout << "load bias data error";
-      return;
+      printf(
+          "load bias data error: in_get_size (%lu) != loaded_data_size (%lu)\n",
+          in_get_size,
+          loaded_data_size);
+      assert(false);
     }
     assert(partial_size == host_array.size());
 
     size_t data_index = 0;
 
-    for (int i = 0; i < hidden_dim; i++) {
-      ptr[file_index * hidden_dim + i] = host_array.at(data_index);
+    for (int i = 0; i < partial_size; i++) {
+      ptr[file_index * qkv_partial_size + i] = host_array.at(data_index);
       data_index++;
     }
 
@@ -183,7 +190,7 @@ void load_attention_weights(DT *ptr,
   std::string o_file = weight_path +
                        layer_name.substr(0, layer_name.find("attention")) +
                        "attention_wo_weight";
-  std::vector<std::string> weight_files = {q_file, k_file, v_file, o_file};
+  std::vector<std::string> weight_files = {q_file, k_file, v_file};
 
   int file_index = 0;
 
@@ -193,7 +200,7 @@ void load_attention_weights(DT *ptr,
   size_t one_weight_file_size =
       num_heads * single_proj_size; // size of each of Q/K/V/O for all heads
 
-  // q, k, v, o -> 0, 1, 2, 3
+  // q, k, v -> 0, 1, 2
   for (auto file : weight_files) {
     size_t partial_size = one_weight_file_size;
 
@@ -210,23 +217,60 @@ void load_attention_weights(DT *ptr,
     size_t in_get_size = in.gcount();
 
     if (in_get_size != loaded_data_size) {
-      std::cout << "load data error";
+      std::cout << "load data error" << std::endl;
+      assert(false);
       return;
     }
     assert(partial_size == host_array.size());
 
-    size_t one_head_size = hidden_dim * (hidden_dim / num_heads);
     size_t data_index = 0;
-
     for (int i = 0; i < num_heads; i++) {
-      size_t start_index = i * one_head_size * 4 + file_index * one_head_size;
-      for (size_t j = start_index; j < start_index + one_head_size; j++) {
+      size_t start_index =
+          i * single_proj_size * 4 + file_index * single_proj_size;
+      for (size_t j = start_index; j < start_index + single_proj_size; j++) {
         ptr[j] = host_array.at(data_index);
         data_index += 1;
       }
     }
+    assert(data_index == partial_size);
     file_index++;
 
+    in.close();
+  }
+  // output weight file gets special treatment
+  {
+    std::ifstream in(o_file, std::ios::in | std::ios::binary);
+    std::cout << "Loading attention filename: " << o_file << std::endl;
+    if (!in.good()) {
+      std::cout << "Could not open file: " << o_file << std::endl;
+    }
+    assert(in.good() && "incorrect weight file path");
+    size_t full_output_weight_size = num_heads * single_proj_size;
+    std::vector<DT> host_array(full_output_weight_size);
+    size_t loaded_data_size = sizeof(DT) * full_output_weight_size;
+    in.seekg(0, in.end);
+    in.seekg(0, in.beg);
+    in.read((char *)host_array.data(), loaded_data_size);
+    size_t in_get_size = in.gcount();
+
+    if (in_get_size != loaded_data_size) {
+      std::cout << "load data error" << std::endl;
+      assert(false);
+    }
+    assert(full_output_weight_size == host_array.size());
+
+    for (int i = 0; i < num_heads; i++) {
+      size_t start_index = i * single_proj_size * 4 + 3 * single_proj_size;
+      for (size_t j = 0; j < single_proj_size; j++) {
+        int ff_row_idx = j % hidden_dim;
+        int ff_col_idx = j / hidden_dim;
+        assert(ff_row_idx < hidden_dim && ff_col_idx < qkv_inner_dim);
+        size_t data_index = ff_row_idx * (qkv_inner_dim * num_heads) +
+                            qkv_inner_dim * i + ff_col_idx;
+        ptr[j + start_index] = host_array.at(data_index);
+      }
+    }
+
     in.close();
   }
 }
@@ -248,7 +292,7 @@ void load_from_file(DT *ptr, size_t size, std::string filename) {
   if (in_get_size != loaded_data_size) {
     std::cout << "load weight data error " << in_get_size << ", "
               << loaded_data_size << ", " << sizeof(DT) << std::endl;
-    return;
+    assert(false);
   }
   assert(size == host_array.size());
 
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index b59586de07..a281f52853 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -37,7 +37,8 @@ void parse_input_args(char **argv,
                       FilePaths &paths,
                       ModelType &llm_model_type,
                       bool &use_full_precision,
-                      bool &verbose) {
+                      bool &verbose,
+                      int &tensor_parallelism_degree) {
   for (int i = 1; i < argc; i++) {
     // llm model type
     if (!strcmp(argv[i], "-llm-model")) {
@@ -82,6 +83,11 @@ void parse_input_args(char **argv,
       paths.output_file_path = std::string(argv[++i]);
       continue;
     }
+    // tensor parallelism degree
+    if (!strcmp(argv[i], "-tensor-parallelism-degree")) {
+      tensor_parallelism_degree = std::stoi(argv[++i]);
+      continue;
+    }
     if (!strcmp(argv[i], "--use-full-precision")) {
       use_full_precision = true;
       continue;
@@ -106,12 +112,19 @@ void FlexFlow::top_level_task(Task const *task,
   ModelType model_type;
   bool use_full_precision = false;
   bool verbose = false;
+  int tensor_parallelism_degree = 1;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
   char **argv = command_args.argv;
   int argc = command_args.argc;
-  parse_input_args(
-      argv, argc, file_paths, model_type, use_full_precision, verbose);
+  parse_input_args(argv,
+                   argc,
+                   file_paths,
+                   model_type,
+                   use_full_precision,
+                   verbose,
+                   tensor_parallelism_degree);
+  ffconfig.tensor_parallelism_degree = tensor_parallelism_degree;
 
   assert(model_type != ModelType::UNKNOWN &&
          "Invalid LLM model type passed (or no type was passed).");
@@ -128,7 +141,8 @@ void FlexFlow::top_level_task(Task const *task,
                               im,
                               file_paths.llm_config_file_path,
                               file_paths.llm_weight_file_path,
-                              ffconfig.workersPerNode * ffconfig.numNodes,
+                              ffconfig.workersPerNode * ffconfig.numNodes /
+                                  tensor_parallelism_degree,
                               INC_DECODING_MODE,
                               use_full_precision);
   } else if (model_type == ModelType::OPT) {
@@ -136,7 +150,8 @@ void FlexFlow::top_level_task(Task const *task,
                           im,
                           file_paths.llm_config_file_path,
                           file_paths.llm_weight_file_path,
-                          ffconfig.workersPerNode * ffconfig.numNodes,
+                          ffconfig.workersPerNode * ffconfig.numNodes /
+                              tensor_parallelism_degree,
                           INC_DECODING_MODE,
                           use_full_precision);
   } else if (model_type == ModelType::FALCON) {
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index ec0b222075..72666ed312 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -43,7 +43,8 @@ void parse_input_args(char **argv,
                       FilePaths &paths,
                       ModelTypes &model_types,
                       bool &use_full_precision,
-                      bool &verbose) {
+                      bool &verbose,
+                      int &tensor_parallelism_degree) {
   for (int i = 1; i < argc; i++) {
     // llm model type
     if (!strcmp(argv[i], "-llm-model")) {
@@ -114,6 +115,11 @@ void parse_input_args(char **argv,
       paths.output_file_path = std::string(argv[++i]);
       continue;
     }
+    // tensor parallelism degree
+    if (!strcmp(argv[i], "-tensor-parallelism-degree")) {
+      tensor_parallelism_degree = std::stoi(argv[++i]);
+      continue;
+    }
     if (!strcmp(argv[i], "--use-full-precision")) {
       use_full_precision = true;
       continue;
@@ -135,12 +141,19 @@ void FlexFlow::top_level_task(Task const *task,
   ModelTypes model_types;
   bool use_full_precision = false;
   bool verbose = false;
+  int tensor_parallelism_degree = 1;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
   char **argv = command_args.argv;
   int argc = command_args.argc;
-  parse_input_args(
-      argv, argc, file_paths, model_types, use_full_precision, verbose);
+  parse_input_args(argv,
+                   argc,
+                   file_paths,
+                   model_types,
+                   use_full_precision,
+                   verbose,
+                   tensor_parallelism_degree);
+  ffconfig.tensor_parallelism_degree = tensor_parallelism_degree;
 
   if (file_paths.ssm_weight_file_paths.size() == 0) {
     assert(false &&
@@ -178,7 +191,8 @@ void FlexFlow::top_level_task(Task const *task,
                               im,
                               file_paths.llm_config_file_path,
                               file_paths.llm_weight_file_path,
-                              ffconfig.workersPerNode * ffconfig.numNodes,
+                              ffconfig.workersPerNode * ffconfig.numNodes /
+                                  tensor_parallelism_degree,
                               TREE_VERIFY_MODE,
                               use_full_precision);
   } else if (model_types.llm_model_type == ModelType::OPT) {
@@ -186,7 +200,8 @@ void FlexFlow::top_level_task(Task const *task,
                           im,
                           file_paths.llm_config_file_path,
                           file_paths.llm_weight_file_path,
-                          ffconfig.workersPerNode * ffconfig.numNodes,
+                          ffconfig.workersPerNode * ffconfig.numNodes /
+                              tensor_parallelism_degree,
                           TREE_VERIFY_MODE,
                           use_full_precision);
   } else {
diff --git a/src/ops/attention.cc b/src/ops/attention.cc
index 8494981cf6..ca709bdc51 100644
--- a/src/ops/attention.cc
+++ b/src/ops/attention.cc
@@ -220,17 +220,12 @@ MultiHeadAttention::MultiHeadAttention(FFModel &model,
     dims[2].parallel_idx = -1;
     int seed = std::rand();
     Initializer *initializer = new GlorotUniform(seed);
-#ifdef USE_NCCL
-    ParameterSyncType comm_type = ParameterSyncType::NCCL;
-#else
-    ParameterSyncType comm_type = ParameterSyncType::PS;
-#endif
     weights[0] = model.create_parallel_weight<3>(dims,
                                                  DT_FLOAT,
                                                  NULL /*owner_op*/,
                                                  true /*create_grad*/,
                                                  initializer,
-                                                 comm_type);
+                                                 CHOSEN_SYNC_TYPE);
   }
 
   outputs[0] = model.create_parallel_tensor_legion_ordering(
@@ -307,17 +302,12 @@ MultiHeadAttention::MultiHeadAttention(FFModel &model,
     dims[2].size = qParas + kParas + vParas + oParas;
     int seed = std::rand();
     Initializer *initializer = new GlorotUniform(seed);
-#ifdef USE_NCCL
-    ParameterSyncType comm_type = ParameterSyncType::NCCL;
-#else
-    ParameterSyncType comm_type = ParameterSyncType::PS;
-#endif
     weights[0] = model.create_parallel_weight<3>(dims,
                                                  DT_FLOAT,
                                                  NULL /*owner_op*/,
                                                  true /*create_grad*/,
                                                  initializer,
-                                                 comm_type);
+                                                 CHOSEN_SYNC_TYPE);
   }
   outputs[0] = model.create_parallel_tensor_legion_ordering(
       _query->num_dims, dims, DT_FLOAT, this);
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index 8ec77131a9..77cd748f9c 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -340,11 +340,6 @@ Experts::Experts(FFModel &model,
   assert(outputs[0] != nullptr);
 
   if (allocate_weights) {
-#ifdef USE_NCCL
-    ParameterSyncType comm_type = ParameterSyncType::NCCL;
-#else
-    ParameterSyncType comm_type = ParameterSyncType::PS;
-#endif
     {
       ParallelDim dims[3];
       int nparams = (experts_num_layers == 1)
@@ -367,7 +362,7 @@ Experts::Experts(FFModel &model,
                                                        NULL /*owner_op*/,
                                                        true /*create_grad*/,
                                                        kernel_initializer,
-                                                       comm_type);
+                                                       CHOSEN_SYNC_TYPE);
       assert(weights[0] != nullptr);
     }
     if (use_bias) {
@@ -391,7 +386,7 @@ Experts::Experts(FFModel &model,
                                                        NULL /*owner_op*/,
                                                        true /*create_grad*/,
                                                        bias_initializer,
-                                                       comm_type);
+                                                       CHOSEN_SYNC_TYPE);
       assert(weights[1] != nullptr);
     }
   }
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index b2528a7c14..765b3c5bfc 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -110,17 +110,16 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
     li->outputs[0] = create_tensor_legion_ordering(
         numdims, dims, data_type, li, 0, true /*create_grad*/);
   }
+  // Compute weight size
+  int qProjSize = kdim, kProjSize = kdim, vProjSize = kdim,
+      oProjSize = embed_dim;
+  int qSize = input->dims[0], kSize = input->dims[0], vSize = input->dims[0];
+  int qParas = qProjSize * qSize;
+  int kParas = kProjSize * kSize;
+  int vParas = vProjSize * vSize;
+  int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
+  int one_head_size = qParas + kParas + vParas + oParas;
   {
-    // Compute weight size
-    int qProjSize = kdim, kProjSize = kdim, vProjSize = kdim,
-        oProjSize = embed_dim;
-    int qSize = input->dims[0], kSize = input->dims[0], vSize = input->dims[0];
-    int qParas = qProjSize * qSize;
-    int kParas = kProjSize * kSize;
-    int vParas = vProjSize * vSize;
-    int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
-    int one_head_size = qParas + kParas + vParas + oParas;
-
     // compress the weight size if quantization.
     if (quantization_type != DT_NONE) {
       one_head_size = get_quantization_to_byte_size(
@@ -138,7 +137,7 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
   }
   if (bias) {
     // q, k, v, o
-    int dims[1] = {embed_dim * 4};
+    int dims[1] = {(qProjSize + kProjSize + vProjSize) * num_heads + oProjSize};
     li->weights[1] = create_weight_legion_ordering(1,
                                                    dims,
                                                    data_type,
@@ -296,38 +295,27 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     dims[2].parallel_idx = -1;
     int seed = std::rand();
     Initializer *initializer = new GlorotUniform(seed);
-#ifdef USE_NCCL
-    ParameterSyncType comm_type = ParameterSyncType::NCCL;
-#else
-    ParameterSyncType comm_type = ParameterSyncType::PS;
-#endif
     weights[0] = model.create_parallel_weight<3>(
         dims,
         quantization_type == DT_NONE ? this->data_type : quantization_type,
         nullptr /*owner_op*/,
         true /*create_grad*/,
         initializer,
-        comm_type);
-  }
-  if (bias) {
-    ParallelDim dims[2];
-    int num_dims = inputs[0]->num_dims;
-    dims[0] = inputs[0]->dims[num_dims - 1];
-    dims[0].size = dims[0].degree;
-    dims[1].size = oProjSize * 4;
-    dims[1].degree = 1;
-    dims[1].parallel_idx = -1;
-#ifdef USE_NCCL
-    ParameterSyncType comm_type = ParameterSyncType::NCCL;
-#else
-    ParameterSyncType comm_type = ParameterSyncType::PS;
-#endif
-    weights[1] = model.create_parallel_weight<2>(dims,
-                                                 this->data_type,
-                                                 NULL /*owner_op*/,
-                                                 true /*create_grad*/,
-                                                 NULL,
-                                                 comm_type);
+        CHOSEN_SYNC_TYPE);
+    if (bias) {
+      ParallelTensorShape bias_shape = _input->get_shape();
+      bias_shape.dims[0].size =
+          (qProjSize + kProjSize + vProjSize) * num_heads + oProjSize;
+      bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
+      weights[1] =
+          model.create_parallel_weight_legion_ordering(bias_shape.num_dims,
+                                                       bias_shape.dims,
+                                                       this->data_type,
+                                                       nullptr /*owner_op*/,
+                                                       true /*create_grad*/,
+                                                       initializer,
+                                                       CHOSEN_SYNC_TYPE);
+    }
   }
 
   outputs[0] = model.create_parallel_tensor_legion_ordering(
@@ -411,37 +399,29 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     }
     int seed = std::rand();
     Initializer *initializer = new GlorotUniform(seed);
-#ifdef USE_NCCL
-    ParameterSyncType comm_type = ParameterSyncType::NCCL;
-#else
-    ParameterSyncType comm_type = ParameterSyncType::PS;
-#endif
     weights[0] = model.create_parallel_weight<3>(
         dims,
         quantization_type == DT_NONE ? this->data_type : quantization_type,
         NULL /*owner_op*/,
         true /*create_grad*/,
         initializer,
-        comm_type);
-  }
-  if (bias) {
-    ParallelDim dims[2];
-    int num_dims = inputs[0]->num_dims;
-    dims[0] = inputs[0]->dims[num_dims - 1];
-    dims[0].size = dims[0].degree;
-    dims[1].size = oProjSize * 4;
-#ifdef USE_NCCL
-    ParameterSyncType comm_type = ParameterSyncType::NCCL;
-#else
-    ParameterSyncType comm_type = ParameterSyncType::PS;
-#endif
-    weights[1] = model.create_parallel_weight<2>(dims,
-                                                 this->data_type,
-                                                 NULL /*owner_op*/,
-                                                 true /*create_grad*/,
-                                                 NULL,
-                                                 comm_type);
+        CHOSEN_SYNC_TYPE);
+    if (bias) {
+      ParallelTensorShape bias_shape = _input->get_shape();
+      bias_shape.dims[0].size =
+          (qProjSize + kProjSize + vProjSize) * num_heads + oProjSize;
+      bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
+      weights[1] =
+          model.create_parallel_weight_legion_ordering(bias_shape.num_dims,
+                                                       bias_shape.dims,
+                                                       this->data_type,
+                                                       nullptr /*owner_op*/,
+                                                       true /*create_grad*/,
+                                                       initializer,
+                                                       CHOSEN_SYNC_TYPE);
+    }
   }
+
   outputs[0] = model.create_parallel_tensor_legion_ordering(
       _input->num_dims, dims, this->data_type, this);
 
@@ -758,7 +738,7 @@ void IncMultiHeadSelfAttention::inference_task(
                                               runtime);
     Domain bias_domain = runtime->get_index_space_domain(
         ctx, task->regions[3].region.get_index_space());
-    assert(bias_domain.get_dim() == 2);
+    assert(bias_domain.get_dim() == 4);
   }
 
   Domain input_domain = runtime->get_index_space_domain(
@@ -772,8 +752,10 @@ void IncMultiHeadSelfAttention::inference_task(
   assert(weight_domain.get_dim() == 3);
   assert(output_domain.get_dim() == 4);
 
+  assert(task->index_point.get_dim() == 1);
+
   IncMultiHeadSelfAttention::inference_kernel_wrapper(
-      m, bc, input, weight, output, biases);
+      m, bc, task->index_point.point_data[0], input, weight, output, biases);
 #ifdef INFERENCE_TESTS
   printf("Checking IncMultiHeadSelfAttention computations...\n");
 
diff --git a/src/ops/inc_multihead_self_attention.cpp b/src/ops/inc_multihead_self_attention.cpp
index 669cbd2636..9fce37fc30 100644
--- a/src/ops/inc_multihead_self_attention.cpp
+++ b/src/ops/inc_multihead_self_attention.cpp
@@ -27,6 +27,7 @@ using Legion::Memory;
 void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     IncMultiHeadSelfAttentionMeta const *m,
     BatchConfig const *bc,
+    int shard_id,
     GenericTensorAccessorR const &input,
     GenericTensorAccessorR const &weight,
     GenericTensorAccessorW const &output,
@@ -90,6 +91,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     GenericTensorAccessorR const &weight,
     MemoryAllocator &gpu_mem_allocator,
     int num_samples,
+    int _global_num_heads,
     int _num_heads,
     DataType _quantization_type,
     bool _offload)
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 408c1ab012..991b6d2236 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -38,12 +38,16 @@ __global__ void build_w_out_tensor(DT const *weight_ptr,
                                    int num_heads,
                                    int qkv_weight_block_size) {
   CUDA_KERNEL_LOOP(i, vProjSize * oProjSize * num_heads) {
-    int row_idx = i % vProjSize;
-    int col_idx = (i / vProjSize) % oProjSize;
-    int head_idx = i / (vProjSize * oProjSize);
-    contiguous_weight_ptr[i] =
-        weight_ptr[head_idx * (qkv_weight_block_size + vProjSize * oProjSize) +
-                   qkv_weight_block_size + col_idx * vProjSize + row_idx];
+    // Each slice (one per head) in the weight_ptr has shape (oProjSize,
+    // vProjSize)
+    int row_idx = i % oProjSize;
+    int col_idx = (i / oProjSize) % vProjSize;
+    int head_idx = i / (oProjSize * vProjSize);
+    // The contiguous_weight_ptr has shape (vProjSize * num_heads, oProjSize)
+    int idx = row_idx * vProjSize * num_heads + vProjSize * head_idx + col_idx;
+    contiguous_weight_ptr[idx] =
+        weight_ptr[(qkv_weight_block_size + vProjSize * oProjSize) * head_idx +
+                   qkv_weight_block_size + col_idx * oProjSize + row_idx];
   }
 }
 
@@ -61,10 +65,12 @@ __global__ void apply_proj_bias_w(DT *input_ptr,
 template <typename DT>
 __global__ void apply_proj_bias_qkv(DT *input_ptr,
                                     DT const *bias_ptr,
+                                    int shard_id,
                                     int num_tokens,
                                     int qProjSize,
                                     int kProjSize,
                                     int vProjSize,
+                                    int global_num_heads,
                                     int num_heads,
                                     bool scaling_query,
                                     float scaling_factor) {
@@ -82,8 +88,10 @@ __global__ void apply_proj_bias_qkv(DT *input_ptr,
 
     int real_part_index =
         head_idx * qkv_block_size + qkv_index * q_block_size + idx;
-    int bias_idx = qkv_index * qProjSize * num_heads + head_idx * qProjSize +
-                   (idx % qProjSize);
+
+    int global_head_idx = head_idx + shard_id * num_heads;
+    int bias_idx = qkv_index * qProjSize * global_num_heads +
+                   global_head_idx * qProjSize + (idx % qProjSize);
     input_ptr[real_part_index] += bias_ptr[bias_idx];
 
     if (scaling_query && qkv_index == 0) {
@@ -148,6 +156,7 @@ __global__ void
 template <typename DT>
 void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                         BatchConfig const *bc,
+                        int shard_id,
                         DT const *input_ptr,
                         DT const *weight_ptr,
                         DT *output_ptr,
@@ -269,10 +278,12 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                           0,
                           stream>>>(output_ptr,
                                     bias_ptr,
+                                    shard_id,
                                     num_tokens,
                                     m->qProjSize,
                                     m->kProjSize,
                                     m->vProjSize,
+                                    m->global_num_heads,
                                     m->num_heads,
                                     *m->scaling_query,
                                     m->scaling_factor);
@@ -426,6 +437,7 @@ void pre_build_weight_kernel(IncMultiHeadSelfAttentionMeta const *m,
 template <typename DT>
 void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
                       BatchConfig const *bc,
+                      int shard_id,
                       DT const *input_ptr,
                       DT const *weight_ptr,
                       DT *output_ptr,
@@ -446,6 +458,7 @@ void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
   // phase 1: Implement kernel to compute KQV for input tokens
   compute_qkv_kernel(m,
                      bc,
+                     shard_id,
                      input_ptr,
                      weight_ptr,
                      static_cast<DT *>(m->devQKVProjArray),
@@ -457,7 +470,7 @@ void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
 
   // phase 3: Compute attention score
   // 3 kernels for pahse 3: matmul1 - softmax - matmal2
-  compute_attention_kernel(m, bc, output_ptr, bias_ptr, stream);
+  compute_attention_kernel(m, bc, shard_id, output_ptr, bias_ptr, stream);
 }
 
 } // namespace IncMultiHeadAttention
@@ -520,6 +533,7 @@ __global__ void fill_entries_above_diagonal(DT *matrix,
 template <typename DT>
 void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
                               BatchConfig const *bc,
+                              int shard_id,
                               DT *output_ptr,
                               DT const *bias_ptr,
                               cudaStream_t stream) {
@@ -703,9 +717,9 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     k = m->vProjSize * m->num_heads;
     n = num_new_tokens;
     lda = k, ldb = n, ldc = m_;
-    A = m->W_out_contiguous;
+    A = static_cast<DT *>(m->W_out_contiguous);
     B = C;
-    C = (output_ptr + tokens_previous_requests * m->oProjSize);
+    C = static_cast<DT *>(output_ptr) + tokens_previous_requests * m->oProjSize;
 
     checkCUDA(cublasGemmEx(m->handle.blas,
                            CUBLAS_OP_T,
@@ -730,7 +744,7 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     tokens_previous_requests += num_new_tokens;
   }
 
-  if (*m->bias) {
+  if (*m->bias && shard_id == 0) {
     int parallelism = m->oProjSize * num_tokens;
     apply_proj_bias_w<<<GET_BLOCKS(parallelism),
                         min(CUDA_NUM_THREADS, parallelism),
@@ -746,6 +760,7 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
 void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     IncMultiHeadSelfAttentionMeta const *m,
     BatchConfig const *bc,
+    int shard_id,
     GenericTensorAccessorR const &input,
     GenericTensorAccessorR const &weight,
     GenericTensorAccessorW const &output,
@@ -776,6 +791,7 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     Kernels::IncMultiHeadAttention::inference_kernel(
         m,
         bc,
+        shard_id,
         input.get_half_ptr(),
         m->offload ? static_cast<half *>(m->weight_ptr) : weight.get_half_ptr(),
         output.get_half_ptr(),
@@ -790,6 +806,7 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     Kernels::IncMultiHeadAttention::inference_kernel(
         m,
         bc,
+        shard_id,
         input.get_float_ptr(),
         m->offload ? static_cast<float *>(m->weight_ptr)
                    : weight.get_float_ptr(),
@@ -839,6 +856,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
                                     weight,
                                     gpu_mem_allocator,
                                     num_samples,
+                                    attn->num_heads,
                                     _num_heads,
                                     attn->quantization_type,
                                     attn->offload) {}
@@ -863,6 +881,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     GenericTensorAccessorR const &weight,
     MemoryAllocator &gpu_mem_allocator,
     int num_samples,
+    int _global_num_heads,
     int _num_heads,
     DataType _quantization_type,
     bool _offload)
@@ -885,6 +904,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   quantization_type = _quantization_type;
   offload = _offload;
 
+  global_num_heads = _global_num_heads;
   num_heads = _num_heads;
   weights_params = (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize +
                     oProjSize * (vProjSize > 0 ? vProjSize : vSize));
diff --git a/src/ops/inc_multiquery_self_attention.cc b/src/ops/inc_multiquery_self_attention.cc
index eae98cd7d5..05c57af2ff 100644
--- a/src/ops/inc_multiquery_self_attention.cc
+++ b/src/ops/inc_multiquery_self_attention.cc
@@ -235,17 +235,12 @@ IncMultiQuerySelfAttention::IncMultiQuerySelfAttention(
     dims[2].parallel_idx = -1;
     int seed = std::rand();
     Initializer *initializer = new GlorotUniform(seed);
-#ifdef USE_NCCL
-    ParameterSyncType comm_type = ParameterSyncType::NCCL;
-#else
-    ParameterSyncType comm_type = ParameterSyncType::PS;
-#endif
     weights[0] = model.create_parallel_weight<3>(dims,
                                                  this->data_type,
                                                  nullptr /*owner_op*/,
                                                  true /*create_grad*/,
                                                  initializer,
-                                                 comm_type);
+                                                 CHOSEN_SYNC_TYPE);
   }
 
   outputs[0] = model.create_parallel_tensor_legion_ordering(
@@ -317,17 +312,12 @@ IncMultiQuerySelfAttention::IncMultiQuerySelfAttention(
         this->embed_dim + this->kProjSize + this->vProjSize + this->oProjSize;
     int seed = std::rand();
     Initializer *initializer = new GlorotUniform(seed);
-#ifdef USE_NCCL
-    ParameterSyncType comm_type = ParameterSyncType::NCCL;
-#else
-    ParameterSyncType comm_type = ParameterSyncType::PS;
-#endif
     weights[0] = model.create_parallel_weight<3>(dims,
                                                  this->data_type,
                                                  NULL /*owner_op*/,
                                                  true /*create_grad*/,
                                                  initializer,
-                                                 comm_type);
+                                                 CHOSEN_SYNC_TYPE);
   }
   outputs[0] = model.create_parallel_tensor_legion_ordering(
       _input->num_dims, dims, this->data_type, this);
diff --git a/src/ops/inc_multiquery_self_attention.cu b/src/ops/inc_multiquery_self_attention.cu
index ed6153de2d..1193219c9c 100644
--- a/src/ops/inc_multiquery_self_attention.cu
+++ b/src/ops/inc_multiquery_self_attention.cu
@@ -639,21 +639,21 @@ IncMultiQuerySelfAttentionMeta::IncMultiQuerySelfAttentionMeta(
     Memory gpu_mem,
     int num_samples)
     : IncMultiQuerySelfAttentionMeta(handler,
-                                 INC_DECODING_MODE,
-                                 attn,
-                                 attn->qSize,
-                                 attn->kSize,
-                                 attn->vSize,
-                                 attn->qProjSize,
-                                 attn->kProjSize,
-                                 attn->vProjSize,
-                                 attn->oProjSize,
-                                 attn->embed_dim,
-                                 attn->bias,
-                                 attn->add_bias_kv,
-                                 weight,
-                                 gpu_mem,
-                                 num_samples) {}
+                                     INC_DECODING_MODE,
+                                     attn,
+                                     attn->qSize,
+                                     attn->kSize,
+                                     attn->vSize,
+                                     attn->qProjSize,
+                                     attn->kProjSize,
+                                     attn->vProjSize,
+                                     attn->oProjSize,
+                                     attn->embed_dim,
+                                     attn->bias,
+                                     attn->add_bias_kv,
+                                     weight,
+                                     gpu_mem,
+                                     num_samples) {}
 
 IncMultiQuerySelfAttentionMeta::IncMultiQuerySelfAttentionMeta(
     FFHandler handler,
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index 3b20f932e2..0c08a2426f 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -227,11 +227,6 @@ LayerNorm::LayerNorm(FFModel &model,
     int seed = std::rand();
     Initializer *gamma_initializer = new UniformInitializer(seed, 1.0f, 1.0f);
     Initializer *beta_initializer = new UniformInitializer(seed, 0.0f, 0.0f);
-#ifdef USE_NCCL
-    ParameterSyncType comm_type = ParameterSyncType::NCCL;
-#else
-    ParameterSyncType comm_type = ParameterSyncType::PS;
-#endif
     weights[0] =
         model.create_parallel_weight_legion_ordering(axes.size(),
                                                      dims,
@@ -239,7 +234,7 @@ LayerNorm::LayerNorm(FFModel &model,
                                                      NULL /*owner_op*/,
                                                      true /*create_grad*/,
                                                      gamma_initializer,
-                                                     comm_type);
+                                                     CHOSEN_SYNC_TYPE);
     weights[1] =
         model.create_parallel_weight_legion_ordering(axes.size(),
                                                      dims,
@@ -247,7 +242,7 @@ LayerNorm::LayerNorm(FFModel &model,
                                                      NULL /*owner_op*/,
                                                      true /*create_grad*/,
                                                      beta_initializer,
-                                                     comm_type);
+                                                     CHOSEN_SYNC_TYPE);
   }
 }
 
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index 6ab99e6892..e3204c01d9 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -230,6 +230,23 @@ Linear::Linear(FFModel &model,
   LinearParams params = this->get_params();
   params.construct_mappings(*this->parallel_dims_mapping, input_shape);
   params.solve_dims(input_shape, output_shape, kernel_shape, bias_shape);
+  kernel_shape.dims[0].size = this->in_channels;
+  bias_shape.dims[0].degree = _input->dims[_input->num_dims - 1].degree;
+  bias_shape.dims[0].parallel_idx =
+      _input->dims[_input->num_dims - 1].parallel_idx;
+  bias_shape.dims[1].size = bias_shape.dims[1].degree = 1;
+  bias_shape.dims[1].parallel_idx = -1;
+  bias_shape.dims[bias_shape.num_dims - 1].size =
+      bias_shape.dims[bias_shape.num_dims - 1].degree = 1;
+  for (int i = 0; i < input_shape.num_dims - 1; i++) {
+    if (_input->dims[i].degree > 1) {
+      bias_shape.dims[bias_shape.num_dims - 1].size *= _input->dims[i].degree;
+      bias_shape.dims[bias_shape.num_dims - 1].degree *= _input->dims[i].degree;
+      bias_shape.dims[bias_shape.num_dims - 1].parallel_idx =
+          _input->dims[i].parallel_idx;
+    }
+  }
+
   if (allocate_weights) {
     Initializer *kernel_initializer = new GlorotUniform(std::rand() /*seed*/);
     if (quantization_type != DT_NONE) {
@@ -256,6 +273,7 @@ Linear::Linear(FFModel &model,
                                                        true /*create_grad*/,
                                                        bias_initializer,
                                                        CHOSEN_SYNC_TYPE);
+      add_bias_only_once = _input->dims[0].degree > 1;
     }
   }
 
@@ -263,7 +281,7 @@ Linear::Linear(FFModel &model,
   outputs[0] = model.create_parallel_tensor_legion_ordering(
       output_shape.num_dims, output_shape.dims, _data_type, this);
 
-  assert(check_output_input_weight_parallel_dims(allocate_weights));
+  // assert(check_output_input_weight_parallel_dims(allocate_weights));
 }
 
 void Linear::init(FFModel const &ff) {
@@ -483,6 +501,7 @@ OpMeta *Linear::init_task_with_dim(Task const *task,
   m->kernel_reg_type = linear->kernel_reg_type;
   m->kernel_reg_lambda = linear->kernel_reg_lambda;
   m->use_bias = linear->use_bias;
+  m->add_bias_only_once = linear->add_bias_only_once;
   m->profiling = linear->profiling;
   m->trainableInputs[0] = linear->trainableInputs[0];
   m->input_type = linear->inputs[0]->data_type;
@@ -666,7 +685,8 @@ void Linear::forward_task_with_dim(Task const *task,
   assert(acc_input.rect.volume() == static_cast<size_t>(in_dim * batch_size));
   // assert(acc_kernel.rect.volume() == static_cast<size_t>(in_dim * out_dim));
   DT const *acc_bias_ptr = nullptr;
-  if (m->use_bias) {
+  if (m->use_bias &&
+      !(m->add_bias_only_once && task->index_point.point_data[0] != 0)) {
     TensorAccessorR<DT, NDIM> acc_bias(
         regions[3], task->regions[3], FID_DATA, ctx, runtime);
     assert(acc_bias.rect.volume() == static_cast<size_t>(out_dim));
diff --git a/src/ops/spec_inc_multihead_self_attention.cc b/src/ops/spec_inc_multihead_self_attention.cc
index db3e83847f..b9dedda418 100644
--- a/src/ops/spec_inc_multihead_self_attention.cc
+++ b/src/ops/spec_inc_multihead_self_attention.cc
@@ -107,15 +107,15 @@ Tensor
     li->outputs[0] = create_tensor_legion_ordering(
         numdims, dims, data_type, li, 0, true /*create_grad*/);
   }
+  // Compute weight size
+  int qProjSize = kdim, kProjSize = kdim, vProjSize = kdim,
+      oProjSize = embed_dim;
+  int qSize = input->dims[0], kSize = input->dims[0], vSize = input->dims[0];
+  int qParas = qProjSize * qSize;
+  int kParas = kProjSize * kSize;
+  int vParas = vProjSize * vSize;
+  int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
   {
-    // Compute weight size
-    int qProjSize = kdim, kProjSize = kdim, vProjSize = kdim,
-        oProjSize = embed_dim;
-    int qSize = input->dims[0], kSize = input->dims[0], vSize = input->dims[0];
-    int qParas = qProjSize * qSize;
-    int kParas = kProjSize * kSize;
-    int vParas = vProjSize * vSize;
-    int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
     int dims[2] = {qParas + kParas + vParas + oParas, num_heads};
     li->weights[0] = create_weight_legion_ordering(2,
                                                    dims,
@@ -127,7 +127,7 @@ Tensor
   }
   if (bias) {
     // q, k, v, o
-    int dims[1] = {embed_dim * 4};
+    int dims[1] = {(qProjSize + kProjSize + vProjSize) * num_heads + oProjSize};
     li->weights[1] = create_weight_legion_ordering(1,
                                                    dims,
                                                    data_type,
@@ -270,38 +270,28 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     dims[2].parallel_idx = -1;
     int seed = std::rand();
     Initializer *initializer = new GlorotUniform(seed);
-#ifdef USE_NCCL
-    ParameterSyncType comm_type = ParameterSyncType::NCCL;
-#else
-    ParameterSyncType comm_type = ParameterSyncType::PS;
-#endif
     weights[0] = model.create_parallel_weight<3>(dims,
                                                  this->data_type,
                                                  NULL /*owner_op*/,
                                                  true /*create_grad*/,
                                                  initializer,
-                                                 comm_type);
-  }
-  if (bias) {
-    ParallelDim dims[2];
-    int num_dims = inputs[0]->num_dims;
-    dims[0] = inputs[0]->dims[num_dims - 1];
-    dims[0].size = dims[0].degree;
-    dims[1].size = oProjSize * 4;
-    dims[1].degree = 1;
-    dims[1].parallel_idx = -1;
-#ifdef USE_NCCL
-    ParameterSyncType comm_type = ParameterSyncType::NCCL;
-#else
-    ParameterSyncType comm_type = ParameterSyncType::PS;
-#endif
-    weights[1] = model.create_parallel_weight<2>(dims,
-                                                 this->data_type,
-                                                 NULL /*owner_op*/,
-                                                 true /*create_grad*/,
-                                                 NULL,
-                                                 comm_type);
+                                                 CHOSEN_SYNC_TYPE);
+    if (bias) {
+      ParallelTensorShape bias_shape = _input->get_shape();
+      bias_shape.dims[0].size =
+          (qProjSize + kProjSize + vProjSize) * num_heads + oProjSize;
+      bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
+      weights[1] =
+          model.create_parallel_weight_legion_ordering(bias_shape.num_dims,
+                                                       bias_shape.dims,
+                                                       this->data_type,
+                                                       nullptr /*owner_op*/,
+                                                       true /*create_grad*/,
+                                                       initializer,
+                                                       CHOSEN_SYNC_TYPE);
+    }
   }
+
   outputs[0] = model.create_parallel_tensor_legion_ordering(
       _input->num_dims, dims, this->data_type, this);
   /* for (int i = 0; i < numdim; i++) { */
@@ -376,36 +366,28 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     dims[2].size = qParas + kParas + vParas + oParas;
     int seed = std::rand();
     Initializer *initializer = new GlorotUniform(seed);
-#ifdef USE_NCCL
-    ParameterSyncType comm_type = ParameterSyncType::NCCL;
-#else
-    ParameterSyncType comm_type = ParameterSyncType::PS;
-#endif
     weights[0] = model.create_parallel_weight<3>(dims,
                                                  this->data_type,
                                                  NULL /*owner_op*/,
                                                  true /*create_grad*/,
                                                  initializer,
-                                                 comm_type);
-  }
-  if (bias) {
-    ParallelDim dims[2];
-    int num_dims = inputs[0]->num_dims;
-    dims[0] = inputs[0]->dims[num_dims - 1];
-    dims[0].size = dims[0].degree;
-    dims[1].size = oProjSize * 4;
-#ifdef USE_NCCL
-    ParameterSyncType comm_type = ParameterSyncType::NCCL;
-#else
-    ParameterSyncType comm_type = ParameterSyncType::PS;
-#endif
-    weights[1] = model.create_parallel_weight<2>(dims,
-                                                 this->data_type,
-                                                 NULL /*owner_op*/,
-                                                 true /*create_grad*/,
-                                                 NULL,
-                                                 comm_type);
+                                                 CHOSEN_SYNC_TYPE);
+    if (bias) {
+      ParallelTensorShape bias_shape = _input->get_shape();
+      bias_shape.dims[0].size =
+          (qProjSize + kProjSize + vProjSize) * num_heads + oProjSize;
+      bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
+      weights[1] =
+          model.create_parallel_weight_legion_ordering(bias_shape.num_dims,
+                                                       bias_shape.dims,
+                                                       this->data_type,
+                                                       nullptr /*owner_op*/,
+                                                       true /*create_grad*/,
+                                                       initializer,
+                                                       CHOSEN_SYNC_TYPE);
+    }
   }
+
   outputs[0] = model.create_parallel_tensor_legion_ordering(
       _input->num_dims, dims, this->data_type, this);
 
@@ -700,7 +682,7 @@ void SpecIncMultiHeadSelfAttention::inference_task(
                                               runtime);
     Domain bias_domain = runtime->get_index_space_domain(
         ctx, task->regions[3].region.get_index_space());
-    assert(bias_domain.get_dim() == 2);
+    assert(bias_domain.get_dim() == 4);
   }
   Domain input_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
@@ -713,8 +695,9 @@ void SpecIncMultiHeadSelfAttention::inference_task(
   assert(weight_domain.get_dim() == 3);
   assert(output_domain.get_dim() == 4);
 
+  assert(task->index_point.get_dim() == 1);
   SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
-      m, bc, input, weight, output, biases);
+      m, bc, task->index_point.point_data[0], input, weight, output, biases);
 
   // print_tensor<float>(input.get_float_ptr(), 20, "attention input");
   // print_tensor<float>(output.get_float_ptr(), 20, "attention output");
diff --git a/src/ops/spec_inc_multihead_self_attention.cpp b/src/ops/spec_inc_multihead_self_attention.cpp
index 90a4c89a39..1caf1c1d1b 100644
--- a/src/ops/spec_inc_multihead_self_attention.cpp
+++ b/src/ops/spec_inc_multihead_self_attention.cpp
@@ -27,6 +27,7 @@ using Legion::Memory;
 void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
     SpecIncMultiHeadSelfAttentionMeta const *m,
     BeamSearchBatchConfig const *bc,
+    int shard_id,
     GenericTensorAccessorR const &input,
     GenericTensorAccessorR const &weight,
     GenericTensorAccessorW const &output,
@@ -83,6 +84,7 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
                                     weight,
                                     gpu_mem_allocator,
                                     num_samples,
+                                    attn->num_heads,
                                     _num_heads,
                                     DT_NONE,
                                     false) {
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 867ef4b6b9..44080b7c5c 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -229,6 +229,7 @@ __global__ void spec_fill_entries_above_diagonal(DT *matrix,
 template <typename DT>
 void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                               BeamSearchBatchConfig const *bc,
+                              int shard_id,
                               DT *output_ptr,
                               DT const *bias_ptr,
                               cudaStream_t stream) {
@@ -425,9 +426,10 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       k = m->vProjSize * m->num_heads;
       n = num_new_tokens;
       lda = k, ldb = n, ldc = m_;
-      A = (void const *)m->W_out_contiguous;
-      B = (void const *)C;
-      C = (void *)(output_ptr + tokens_previous_requests * m->oProjSize);
+      A = static_cast<DT *>(m->W_out_contiguous);
+      B = static_cast<DT *>(C);
+      C = static_cast<DT *>(output_ptr) +
+          tokens_previous_requests * m->oProjSize;
 
       checkCUDA(cublasGemmEx(m->handle.blas,
                              CUBLAS_OP_T,
@@ -451,7 +453,7 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       tokens_previous_requests += num_new_tokens;
       tokens_prev_requests_squares += num_new_tokens * total_tokens;
     }
-    if (*m->bias) {
+    if (*m->bias && shard_id == 0) {
       int parallelism = m->oProjSize * num_tokens;
       apply_proj_bias_w<<<GET_BLOCKS(parallelism),
                           min(CUDA_NUM_THREADS, parallelism),
@@ -467,6 +469,7 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
 template <typename DT>
 void inference_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                       BeamSearchBatchConfig const *bc,
+                      int shard_id,
                       DT const *input_ptr,
                       DT const *weight_ptr,
                       DT *output_ptr,
@@ -498,6 +501,7 @@ void inference_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   // phase 1: Implement kernel to compute KQV for input tokens
   compute_qkv_kernel(m,
                      bc,
+                     shard_id,
                      input_ptr,
                      weight_ptr,
                      static_cast<DT *>(m->devQKVProjArray),
@@ -508,7 +512,7 @@ void inference_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
 
   // phase 3: Compute attention score
   // 3 kernels for pahse 3: matmul1 - softmax - matmal2
-  compute_attention_kernel(m, bc, output_ptr, bias_ptr, stream);
+  compute_attention_kernel(m, bc, shard_id, output_ptr, bias_ptr, stream);
 }
 
 } // namespace SpecIncMultiHeadAttention
@@ -518,6 +522,7 @@ void inference_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
 void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
     SpecIncMultiHeadSelfAttentionMeta const *m,
     BeamSearchBatchConfig const *bc,
+    int shard_id,
     GenericTensorAccessorR const &input,
     GenericTensorAccessorR const &weight,
     GenericTensorAccessorW const &output,
@@ -544,6 +549,7 @@ void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
         use_bias ? bias.get_half_ptr() : static_cast<half const *>(nullptr);
     Kernels::SpecIncMultiHeadAttention::inference_kernel(m,
                                                          bc,
+                                                         shard_id,
                                                          input.get_half_ptr(),
                                                          weight.get_half_ptr(),
                                                          output.get_half_ptr(),
@@ -554,6 +560,7 @@ void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
         use_bias ? bias.get_float_ptr() : static_cast<float const *>(nullptr);
     Kernels::SpecIncMultiHeadAttention::inference_kernel(m,
                                                          bc,
+                                                         shard_id,
                                                          input.get_float_ptr(),
                                                          weight.get_float_ptr(),
                                                          output.get_float_ptr(),
@@ -604,6 +611,7 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
                                     weight,
                                     gpu_mem_allocator,
                                     num_samples,
+                                    attn->num_heads,
                                     _num_heads,
                                     DT_NONE,
                                     false) {
diff --git a/src/ops/tree_inc_multihead_self_attention.cc b/src/ops/tree_inc_multihead_self_attention.cc
index 4fe218e06c..d0bf1d5675 100644
--- a/src/ops/tree_inc_multihead_self_attention.cc
+++ b/src/ops/tree_inc_multihead_self_attention.cc
@@ -111,16 +111,16 @@ Tensor FFModel::inc_multihead_self_attention_verify(
     li->outputs[0] = create_tensor_legion_ordering(
         numdims, dims, data_type, li, 0, true /*create_grad*/);
   }
+  // Compute weight size
+  int qProjSize = kdim, kProjSize = kdim, vProjSize = kdim,
+      oProjSize = embed_dim;
+  int qSize = input->dims[0], kSize = input->dims[0], vSize = input->dims[0];
+  int qParas = qProjSize * qSize;
+  int kParas = kProjSize * kSize;
+  int vParas = vProjSize * vSize;
+  int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
+  int one_head_size = qParas + kParas + vParas + oParas;
   {
-    // Compute weight size
-    int qProjSize = kdim, kProjSize = kdim, vProjSize = kdim,
-        oProjSize = embed_dim;
-    int qSize = input->dims[0], kSize = input->dims[0], vSize = input->dims[0];
-    int qParas = qProjSize * qSize;
-    int kParas = kProjSize * kSize;
-    int vParas = vProjSize * vSize;
-    int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
-    int one_head_size = qParas + kParas + vParas + oParas;
     // compress the weight size if quantization.
     if (quantization_type != DT_NONE) {
       one_head_size = get_quantization_to_byte_size(
@@ -139,7 +139,7 @@ Tensor FFModel::inc_multihead_self_attention_verify(
   }
   if (bias) {
     // q, k, v, o
-    int dims[1] = {embed_dim * 4};
+    int dims[1] = {(qProjSize + kProjSize + vProjSize) * num_heads + oProjSize};
     li->weights[1] = create_weight_legion_ordering(1,
                                                    dims,
                                                    data_type,
@@ -295,38 +295,27 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     dims[2].parallel_idx = -1;
     int seed = std::rand();
     Initializer *initializer = new GlorotUniform(seed);
-#ifdef USE_NCCL
-    ParameterSyncType comm_type = ParameterSyncType::NCCL;
-#else
-    ParameterSyncType comm_type = ParameterSyncType::PS;
-#endif
     weights[0] = model.create_parallel_weight<3>(
         dims,
         quantization_type == DT_NONE ? this->data_type : quantization_type,
         NULL /*owner_op*/,
         true /*create_grad*/,
         initializer,
-        comm_type);
-  }
-  if (bias) {
-    ParallelDim dims[2];
-    int num_dims = inputs[0]->num_dims;
-    dims[0] = inputs[0]->dims[num_dims - 1];
-    dims[0].size = dims[0].degree;
-    dims[1].size = oProjSize * 4;
-    dims[1].degree = 1;
-    dims[1].parallel_idx = -1;
-#ifdef USE_NCCL
-    ParameterSyncType comm_type = ParameterSyncType::NCCL;
-#else
-    ParameterSyncType comm_type = ParameterSyncType::PS;
-#endif
-    weights[1] = model.create_parallel_weight<2>(dims,
-                                                 this->data_type,
-                                                 NULL /*owner_op*/,
-                                                 true /*create_grad*/,
-                                                 NULL,
-                                                 comm_type);
+        CHOSEN_SYNC_TYPE);
+    if (bias) {
+      ParallelTensorShape bias_shape = _input->get_shape();
+      bias_shape.dims[0].size =
+          (qProjSize + kProjSize + vProjSize) * num_heads + oProjSize;
+      bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
+      weights[1] =
+          model.create_parallel_weight_legion_ordering(bias_shape.num_dims,
+                                                       bias_shape.dims,
+                                                       this->data_type,
+                                                       nullptr /*owner_op*/,
+                                                       true /*create_grad*/,
+                                                       initializer,
+                                                       CHOSEN_SYNC_TYPE);
+    }
   }
 
   outputs[0] = model.create_parallel_tensor_legion_ordering(
@@ -410,37 +399,29 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     }
     int seed = std::rand();
     Initializer *initializer = new GlorotUniform(seed);
-#ifdef USE_NCCL
-    ParameterSyncType comm_type = ParameterSyncType::NCCL;
-#else
-    ParameterSyncType comm_type = ParameterSyncType::PS;
-#endif
     weights[0] = model.create_parallel_weight<3>(
         dims,
         quantization_type == DT_NONE ? this->data_type : quantization_type,
         NULL /*owner_op*/,
         true /*create_grad*/,
         initializer,
-        comm_type);
-  }
-  if (bias) {
-    ParallelDim dims[2];
-    int num_dims = inputs[0]->num_dims;
-    dims[0] = inputs[0]->dims[num_dims - 1];
-    dims[0].size = dims[0].degree;
-    dims[1].size = oProjSize * 4;
-#ifdef USE_NCCL
-    ParameterSyncType comm_type = ParameterSyncType::NCCL;
-#else
-    ParameterSyncType comm_type = ParameterSyncType::PS;
-#endif
-    weights[1] = model.create_parallel_weight<2>(dims,
-                                                 this->data_type,
-                                                 NULL /*owner_op*/,
-                                                 true /*create_grad*/,
-                                                 NULL,
-                                                 comm_type);
+        CHOSEN_SYNC_TYPE);
+    if (bias) {
+      ParallelTensorShape bias_shape = _input->get_shape();
+      bias_shape.dims[0].size =
+          (qProjSize + kProjSize + vProjSize) * num_heads + oProjSize;
+      bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
+      weights[1] =
+          model.create_parallel_weight_legion_ordering(bias_shape.num_dims,
+                                                       bias_shape.dims,
+                                                       this->data_type,
+                                                       nullptr /*owner_op*/,
+                                                       true /*create_grad*/,
+                                                       initializer,
+                                                       CHOSEN_SYNC_TYPE);
+    }
   }
+
   outputs[0] = model.create_parallel_tensor_legion_ordering(
       _input->num_dims, dims, this->data_type, this);
 
@@ -756,7 +737,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
                                               runtime);
     Domain bias_domain = runtime->get_index_space_domain(
         ctx, task->regions[3].region.get_index_space());
-    assert(bias_domain.get_dim() == 2);
+    assert(bias_domain.get_dim() == 4);
   }
 
   Domain input_domain = runtime->get_index_space_domain(
@@ -774,8 +755,10 @@ void TreeIncMultiHeadSelfAttention::inference_task(
                       input_domain.get_volume(),
                       "[Attention:forward:query]"); */
 
+  assert(task->index_point.get_dim() == 1);
+
   TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
-      m, bc, input, weight, output, biases);
+      m, bc, task->index_point.point_data[0], input, weight, output, biases);
 #ifdef INFERENCE_TESTS
   printf("Checking TreeIncMultiHeadSelfAttention computations...\n");
 
diff --git a/src/ops/tree_inc_multihead_self_attention.cpp b/src/ops/tree_inc_multihead_self_attention.cpp
index eddf20cc08..74cea451c4 100644
--- a/src/ops/tree_inc_multihead_self_attention.cpp
+++ b/src/ops/tree_inc_multihead_self_attention.cpp
@@ -27,6 +27,7 @@ using Legion::Memory;
 void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
     TreeIncMultiHeadSelfAttentionMeta *m,
     TreeVerifyBatchConfig const *bc,
+    int shard_id,
     GenericTensorAccessorR const &input,
     GenericTensorAccessorR const &weight,
     GenericTensorAccessorW const &output,
@@ -83,6 +84,7 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
                                     weight,
                                     gpu_mem_allocator,
                                     num_samples,
+                                    attn->num_heads,
                                     _num_heads,
                                     attn->quantization_type,
                                     attn->offload),
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index 1458085d38..541322efc4 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -137,7 +137,7 @@ __global__ void update_tree_branch_kv_cache(
         (i / proj_size) % num_tokens_in_branch; // index in the tree branch
     int head_idx = i / (proj_size * num_tokens_in_branch);
 
-    token_idx += processed_tokens_in_batch;     // get index in the whole batch
+    token_idx += processed_tokens_in_batch; // get index in the whole batch
     int qkv_block_size = (qProjSize + kProjSize + vProjSize) *
                          total_tokens_in_batch; // skip over previous heads
     int current_head_block_size =
@@ -177,6 +177,7 @@ __global__ void tree_fill_entries_above_diagonal(DT *matrix,
 template <typename DT>
 void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                               TreeVerifyBatchConfig const *bc,
+                              int shard_id,
                               DT *output_ptr,
                               DT const *bias_ptr,
                               cudaStream_t stream) {
@@ -410,9 +411,10 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       k = m->vProjSize * m->num_heads;
       n = num_new_tokens;
       lda = k, ldb = n, ldc = m_;
-      A = m->W_out_contiguous;
+      A = static_cast<DT *>(m->W_out_contiguous);
       B = C;
-      C = (output_ptr + processed_tokens_in_batch * m->oProjSize);
+      C = static_cast<DT *>(output_ptr) +
+          processed_tokens_in_batch * m->oProjSize;
 
       checkCUDA(cublasGemmEx(m->handle.blas,
                              CUBLAS_OP_T,
@@ -439,7 +441,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
     // check that we have finished all tokens of the request
     assert(last_token_idx_of_the_request + 1 == processed_tokens_in_batch);
   }
-  if (*m->bias) {
+  if (*m->bias && shard_id == 0) {
     int parallelism = m->oProjSize * processed_tokens_in_batch;
     apply_proj_bias_w<<<GET_BLOCKS(parallelism),
                         min(CUDA_NUM_THREADS, parallelism),
@@ -454,6 +456,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
 template <typename DT>
 void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
                       TreeVerifyBatchConfig const *bc,
+                      int shard_id,
                       DT const *input_ptr,
                       DT const *weight_ptr,
                       DT *output_ptr,
@@ -520,6 +523,7 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
   // phase 1: Implement kernel to compute KQV for input tokens
   compute_qkv_kernel(m,
                      bc,
+                     shard_id,
                      input_ptr,
                      weight_ptr,
                      static_cast<DT *>(m->devQKVProjArray),
@@ -532,7 +536,7 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
 
   // phase 3: Compute attention score
   // 3 kernels for pahse 3: matmul1 - softmax - matmal2
-  compute_attention_kernel(m, bc, output_ptr, bias_ptr, stream);
+  compute_attention_kernel(m, bc, shard_id, output_ptr, bias_ptr, stream);
 }
 
 } // namespace TreeIncMultiHeadAttention
@@ -542,6 +546,7 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
 void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
     TreeIncMultiHeadSelfAttentionMeta *m,
     TreeVerifyBatchConfig const *bc,
+    int shard_id,
     GenericTensorAccessorR const &input,
     GenericTensorAccessorR const &weight,
     GenericTensorAccessorW const &output,
@@ -573,6 +578,7 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
     Kernels::TreeIncMultiHeadAttention::inference_kernel(
         m,
         bc,
+        shard_id,
         input.get_half_ptr(),
         m->offload ? static_cast<half *>(m->weight_ptr) : weight.get_half_ptr(),
         output.get_half_ptr(),
@@ -587,6 +593,7 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
     Kernels::TreeIncMultiHeadAttention::inference_kernel(
         m,
         bc,
+        shard_id,
         input.get_float_ptr(),
         m->offload ? static_cast<float *>(m->weight_ptr)
                    : weight.get_float_ptr(),
@@ -637,6 +644,7 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
                                     weight,
                                     gpu_mem_allocator,
                                     num_samples,
+                                    attn->num_heads,
                                     _num_heads,
                                     attn->quantization_type,
                                     attn->offload),
diff --git a/src/parallel_ops/kernels/reduction_kernels.cpp b/src/parallel_ops/kernels/reduction_kernels.cpp
index 9143fee936..2a3fe5cca1 100644
--- a/src/parallel_ops/kernels/reduction_kernels.cpp
+++ b/src/parallel_ops/kernels/reduction_kernels.cpp
@@ -18,6 +18,10 @@
 #include <hip/hip_runtime.h>
 
 namespace FlexFlow {
+
+ReductionMeta::ReductionMeta(FFHandler handle, Reduction const *reduct)
+    : OpMeta(handle) {}
+
 namespace Kernels {
 namespace Reduction {
 
@@ -70,10 +74,18 @@ template __global__ void reduction_forward_kernel<float>(float const *input_ptr,
                                                          float *output_ptr,
                                                          size_t num_elements,
                                                          size_t num_replicas);
+template __global__ void reduction_forward_kernel<half>(half const *input_ptr,
+                                                        half *output_ptr,
+                                                        size_t num_elements,
+                                                        size_t num_replicas);
 template void forward_kernel<float>(float const *input_ptr,
                                     float *output_ptr,
                                     size_t num_elements,
                                     size_t num_replicas);
+template void forward_kernel<half>(half const *input_ptr,
+                                   half *output_ptr,
+                                   size_t num_elements,
+                                   size_t num_replicas);
 template void backward_kernel<float>(float const *output_grad_ptr,
                                      float *input_grad_ptr,
                                      size_t num_elements);
diff --git a/src/parallel_ops/kernels/reduction_kernels.cu b/src/parallel_ops/kernels/reduction_kernels.cu
index 8496a107e3..34ae8007da 100644
--- a/src/parallel_ops/kernels/reduction_kernels.cu
+++ b/src/parallel_ops/kernels/reduction_kernels.cu
@@ -17,6 +17,10 @@
 #include "flexflow/utils/cuda_helper.h"
 
 namespace FlexFlow {
+
+ReductionMeta::ReductionMeta(FFHandler handle, Reduction const *reduct)
+    : OpMeta(handle) {}
+
 namespace Kernels {
 namespace Reduction {
 
@@ -63,10 +67,18 @@ template __global__ void reduction_forward_kernel<float>(float const *input_ptr,
                                                          float *output_ptr,
                                                          size_t num_elements,
                                                          size_t num_replicas);
+template __global__ void reduction_forward_kernel<half>(half const *input_ptr,
+                                                        half *output_ptr,
+                                                        size_t num_elements,
+                                                        size_t num_replicas);
 template void forward_kernel<float>(float const *input_ptr,
                                     float *output_ptr,
                                     size_t num_elements,
                                     size_t num_replicas);
+template void forward_kernel<half>(half const *input_ptr,
+                                   half *output_ptr,
+                                   size_t num_elements,
+                                   size_t num_replicas);
 template void backward_kernel<float>(float const *output_grad_ptr,
                                      float *input_grad_ptr,
                                      size_t num_elements);
diff --git a/src/parallel_ops/kernels/replicate_kernels.cpp b/src/parallel_ops/kernels/replicate_kernels.cpp
index 29f1d30d1f..1647f014be 100644
--- a/src/parallel_ops/kernels/replicate_kernels.cpp
+++ b/src/parallel_ops/kernels/replicate_kernels.cpp
@@ -18,6 +18,10 @@
 #include <hip/hip_runtime.h>
 
 namespace FlexFlow {
+
+ReplicateMeta::ReplicateMeta(FFHandler handle, Replicate const *repl)
+    : OpMeta(handle) {}
+
 namespace Kernels {
 namespace Replicate {
 
@@ -66,6 +70,9 @@ void backward_kernel(T const *output_grad_ptr,
 template void forward_kernel<float>(float const *input_ptr,
                                     float *output_ptr,
                                     size_t num_elements);
+template void forward_kernel<half>(half const *input_ptr,
+                                   half *output_ptr,
+                                   size_t num_elements);
 template __global__ void
     replicate_backward_kernel<float>(float const *input_ptr,
                                      float *output_ptr,
diff --git a/src/parallel_ops/kernels/replicate_kernels.cu b/src/parallel_ops/kernels/replicate_kernels.cu
index de208d2aed..35bc109bd3 100644
--- a/src/parallel_ops/kernels/replicate_kernels.cu
+++ b/src/parallel_ops/kernels/replicate_kernels.cu
@@ -17,6 +17,10 @@
 #include "flexflow/utils/cuda_helper.h"
 
 namespace FlexFlow {
+
+ReplicateMeta::ReplicateMeta(FFHandler handle, Replicate const *repl)
+    : OpMeta(handle) {}
+
 namespace Kernels {
 namespace Replicate {
 
@@ -59,6 +63,9 @@ void backward_kernel(T const *output_grad_ptr,
 template void forward_kernel<float>(float const *input_ptr,
                                     float *output_ptr,
                                     size_t num_elements);
+template void forward_kernel<half>(half const *input_ptr,
+                                   half *output_ptr,
+                                   size_t num_elements);
 template __global__ void
     replicate_backward_kernel<float>(float const *input_ptr,
                                      float *output_ptr,
diff --git a/src/parallel_ops/reduction.cc b/src/parallel_ops/reduction.cc
index 737f86239c..1d6130d6a6 100644
--- a/src/parallel_ops/reduction.cc
+++ b/src/parallel_ops/reduction.cc
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/parallel_ops/reduction.h"
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/model.h"
 #include "flexflow/parallel_ops/kernels/reduction_kernels.h"
 #include "flexflow/utils/hash_utils.h"
@@ -77,7 +78,7 @@ Reduction::Reduction(FFModel &model,
   dims[reduction_dim].size /= reduction_degree;
   ParallelTensorBase::update_parallel_ids(numdim, dims);
   outputs[0] = model.create_parallel_tensor_legion_ordering(
-      numdim, dims, DT_FLOAT, this);
+      numdim, dims, _input->data_type, this);
 }
 
 Reduction::Reduction(FFModel &model,
@@ -108,16 +109,153 @@ void Reduction::create_input_partition(FFModel &ff) {
                               output_grad_lp);
 }
 
+void Reduction::create_input_partition_inference(
+    FFModel &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs) {
+  assert(ff.config.computationMode == COMP_MODE_INFERENCE);
+  assert(batch_outputs[0]->part != LogicalPartition::NO_PART);
+  assert(batch_inputs[0]->part != LogicalPartition::NO_PART);
+  // input_lp is a disjoint partition
+  ff.create_disjoint_partition(batch_outputs[0]->num_dims,
+                               batch_outputs[0]->dims,
+                               batch_outputs[0]->parallel_is,
+                               batch_inputs[0]->region,
+                               inference_input_lps[batch_inputs[0]]);
+}
+
+OpMeta *Reduction::init_task(Task const *task,
+                             std::vector<PhysicalRegion> const &regions,
+                             Context ctx,
+                             Runtime *runtime) {
+  Reduction *reduct = (Reduction *)task->args;
+  FFHandler handle = *((FFHandler const *)task->local_args);
+  ReductionMeta *meta = new ReductionMeta(handle, reduct);
+  meta->input_type[0] = reduct->inputs[0]->data_type;
+  meta->output_type[0] = reduct->outputs[0]->data_type;
+  assert(meta->input_type[0] == meta->output_type[0]);
+  return meta;
+}
+
 void Reduction::init(FFModel const &ff) {
-  forward(ff);
+  ArgumentMap argmap;
+  parallel_is = outputs[0]->parallel_is;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(REDUCTION_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(Reduction)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(
+      input_lp, 0 /*projection id*/, READ_ONLY, EXCLUSIVE, inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
+void Reduction::init_inference(FFModel const &ff,
+                               std::vector<ParallelTensor> const &batch_inputs,
+                               std::vector<ParallelTensor> const &batch_outputs,
+                               MachineView const *mv) {
+  ArgumentMap argmap;
+  parallel_is = batch_outputs[0]->parallel_is;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  size_t machine_view_hash =
+      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher launcher(REDUCTION_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(Reduction)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  assert(inference_input_lps.find(batch_inputs[0]) !=
+         inference_input_lps.end());
+  launcher.add_region_requirement(
+      RegionRequirement(inference_input_lps[batch_inputs[0]],
+                        0 /*projection id*/,
+                        READ_ONLY,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
+}
+
+FutureMap Reduction::inference(FFModel const &ff,
+                               BatchConfig const &bc,
+                               std::vector<ParallelTensor> const &batch_inputs,
+                               std::vector<ParallelTensor> const &batch_outputs,
+                               MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  assert(batch_inputs[0]->data_type == batch_outputs[0]->data_type);
+  DataType data_type = batch_inputs[0]->data_type;
+  size_t machine_view_hash =
+      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher launcher(REDUCTION_FWD_TASK_ID,
+                         batch_outputs[0]->parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(
+      RegionRequirement(inference_input_lps[batch_inputs[0]],
+                        0 /*projection id*/,
+                        READ_ONLY,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 void Reduction::forward(FFModel const &ff) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = outputs[0]->parallel_is;
   assert(numOutputs == 1);
   assert(numInputs == 1);
+  set_argumentmap_for_forward(ff, argmap);
   IndexLauncher launcher(REDUCTION_FWD_TASK_ID,
                          outputs[0]->parallel_is,
                          TaskArgument(NULL, 0),
@@ -211,6 +349,9 @@ void Reduction::forward_task(Task const *task,
                              Runtime *runtime) {
   assert(regions.size() == 2);
   assert(task->regions.size() == 2);
+
+  ReductionMeta const *m = *((ReductionMeta **)task->local_args);
+
   Domain input_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
   Domain output_domain = runtime->get_index_space_domain(
@@ -222,12 +363,26 @@ void Reduction::forward_task(Task const *task,
   }
   size_t num_elements = output_domain.get_volume();
   size_t num_replicas = input_domain.get_volume() / num_elements;
-  float const *input_ptr = helperGetTensorPointerRO<float>(
-      regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  float *output_ptr = helperGetTensorPointerRW<float>(
-      regions[1], task->regions[1], FID_DATA, ctx, runtime);
 
-  forward_kernel<float>(input_ptr, output_ptr, num_elements, num_replicas);
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  assert(input.data_type == output.data_type);
+  if (input.data_type == DT_HALF) {
+    forward_kernel<half>(input.get_half_ptr(),
+                         output.get_half_ptr(),
+                         num_elements,
+                         num_replicas);
+  } else if (input.data_type == DT_FLOAT) {
+    forward_kernel<float>(input.get_float_ptr(),
+                          output.get_float_ptr(),
+                          num_elements,
+                          num_replicas);
+  } else {
+    assert(false && "Unspported data type");
+  }
 }
 
 void Reduction::backward_task(Task const *task,
diff --git a/src/parallel_ops/replicate.cc b/src/parallel_ops/replicate.cc
index fee78043bd..794db0f67f 100644
--- a/src/parallel_ops/replicate.cc
+++ b/src/parallel_ops/replicate.cc
@@ -75,7 +75,7 @@ Replicate::Replicate(FFModel &model,
   dims[replicate_dim].degree *= replicate_degree;
   ParallelTensorBase::update_parallel_ids(numdim, dims);
   outputs[0] = model.create_parallel_tensor_legion_ordering(
-      numdim, dims, DT_FLOAT, this);
+      numdim, dims, _input->data_type, this);
   // inputs[0]->print("Replicate::input");
   // outputs[0]->print("Replicate::output");
 }
@@ -108,16 +108,85 @@ void Replicate::create_input_partition(FFModel &ff) {
                                output_grad_lp);
 }
 
+void Replicate::create_input_partition_inference(
+    FFModel &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs) {
+  assert(ff.config.computationMode == COMP_MODE_INFERENCE);
+  assert(batch_outputs[0]->part != LogicalPartition::NO_PART);
+  assert(batch_inputs[0]->part != LogicalPartition::NO_PART);
+  // input_lp is an aliased partitioning along the replica dim
+  ff.create_aliased_partition(batch_outputs[0]->num_dims,
+                              batch_outputs[0]->dims,
+                              replicate_dim,
+                              batch_outputs[0]->parallel_is,
+                              batch_inputs[0]->region,
+                              inference_input_lps[batch_inputs[0]]);
+}
+
+OpMeta *Replicate::init_task(Task const *task,
+                             std::vector<PhysicalRegion> const &regions,
+                             Context ctx,
+                             Runtime *runtime) {
+  Replicate *repl = (Replicate *)task->args;
+  FFHandler handle = *((FFHandler const *)task->local_args);
+  ReplicateMeta *meta = new ReplicateMeta(handle, repl);
+  meta->input_type[0] = repl->inputs[0]->data_type;
+  meta->output_type[0] = repl->outputs[0]->data_type;
+  assert(meta->input_type[0] == meta->output_type[0]);
+  return meta;
+}
+
+void Replicate::init_inference(FFModel const &ff,
+                               std::vector<ParallelTensor> const &batch_inputs,
+                               std::vector<ParallelTensor> const &batch_outputs,
+                               MachineView const *mv) {
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  size_t machine_view_hash =
+      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher launcher(REPLICATE_INIT_TASK_ID,
+                         batch_outputs[0]->parallel_is,
+                         TaskArgument(this, sizeof(Replicate)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(
+      RegionRequirement(inference_input_lps[batch_inputs[0]],
+                        0 /*projection id*/,
+                        READ_ONLY,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
+}
+
 void Replicate::init(FFModel const &ff) {
-  // Do nothing
+  parallel_is = outputs[0]->parallel_is;
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
   assert(numOutputs == 1);
   assert(numInputs == 1);
-  IndexLauncher launcher(REPLICATE_FWD_TASK_ID,
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(REPLICATE_INIT_TASK_ID,
                          outputs[0]->parallel_is,
-                         TaskArgument(NULL, 0),
+                         TaskArgument(this, sizeof(Replicate)),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
@@ -132,15 +201,58 @@ void Replicate::init(FFModel const &ff) {
                                                     EXCLUSIVE,
                                                     outputs[0]->region));
   launcher.add_field(1, FID_DATA);
-  runtime->execute_index_space(ctx, launcher);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
+FutureMap Replicate::inference(FFModel const &ff,
+                               BatchConfig const &bc,
+                               std::vector<ParallelTensor> const &batch_inputs,
+                               std::vector<ParallelTensor> const &batch_outputs,
+                               MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  DataType data_type = batch_inputs[0]->data_type;
+  size_t machine_view_hash =
+      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher launcher(REPLICATE_FWD_TASK_ID,
+                         batch_outputs[0]->parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(
+      RegionRequirement(inference_input_lps[batch_inputs[0]],
+                        0 /*projection id*/,
+                        READ_ONLY,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 void Replicate::forward(FFModel const &ff) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = outputs[0]->parallel_is;
   assert(numOutputs == 1);
   assert(numInputs == 1);
+  set_argumentmap_for_forward(ff, argmap);
   IndexLauncher launcher(REPLICATE_FWD_TASK_ID,
                          outputs[0]->parallel_is,
                          TaskArgument(NULL, 0),
@@ -233,6 +345,9 @@ void Replicate::forward_task(Task const *task,
                              Runtime *runtime) {
   assert(regions.size() == 2);
   assert(task->regions.size() == 2);
+
+  ReplicateMeta const *m = *((ReplicateMeta **)task->local_args);
+
   Domain input_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
   Domain output_domain = runtime->get_index_space_domain(
@@ -243,12 +358,24 @@ void Replicate::forward_task(Task const *task,
     assert(output_domain.hi()[i] == input_domain.hi()[i]);
   }
   assert(input_domain.get_volume() == output_domain.get_volume());
-  float const *input_ptr = helperGetTensorPointerRO<float>(
-      regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  float *output_ptr = helperGetTensorPointerRW<float>(
-      regions[1], task->regions[1], FID_DATA, ctx, runtime);
 
-  forward_kernel<float>(input_ptr, output_ptr, input_domain.get_volume());
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  assert(input.data_type == output.data_type);
+
+  if (input.data_type == DT_HALF) {
+    forward_kernel<half>(
+        input.get_half_ptr(), output.get_half_ptr(), input_domain.get_volume());
+  } else if (input.data_type == DT_FLOAT) {
+    forward_kernel<float>(input.get_float_ptr(),
+                          output.get_float_ptr(),
+                          input_domain.get_volume());
+  } else {
+    assert(false && "Unspported data type");
+  }
 }
 
 void Replicate::backward_task(Task const *task,
diff --git a/src/runtime/cuda_helper.cu b/src/runtime/cuda_helper.cu
index 434ef1d5e1..6ef06e1f65 100644
--- a/src/runtime/cuda_helper.cu
+++ b/src/runtime/cuda_helper.cu
@@ -579,6 +579,8 @@ template __host__ void
 
 template __host__ float *download_tensor<float>(float const *ptr,
                                                 size_t num_elements);
+template __host__ half *download_tensor<half>(half const *ptr,
+                                              size_t num_elements);
 template __host__ double *download_tensor<double>(double const *ptr,
                                                   size_t num_elements);
 template __host__ int32_t *download_tensor<int32_t>(int32_t const *ptr,
@@ -587,6 +589,8 @@ template __host__ int64_t *download_tensor<int64_t>(int64_t const *ptr,
                                                     size_t num_elements);
 template __host__ bool
     download_tensor<float>(float const *ptr, float *dst, size_t num_elements);
+template __host__ bool
+    download_tensor<half>(half const *ptr, half *dst, size_t num_elements);
 template __host__ bool download_tensor<double>(double const *ptr,
                                                double *dst,
                                                size_t num_elements);
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index c7fe4d6a82..f844834761 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -42,8 +42,24 @@ InferenceManager::InferenceManager(FFConfig const &_config,
     view.dim[0] = 1;
     view.stride[0] = 0;
     view.start_device_id = i;
+    // std::cout << "Registering machine view: " << view << std::endl;
     machine_views.push_back(view);
   }
+  // multiple-device machine views
+  if (ff_config.tensor_parallelism_degree > 1) {
+    for (int i = 0; i < num_devices; i++) {
+      if (i + ff_config.tensor_parallelism_degree <= num_devices) {
+        MachineView view;
+        view.device_type = MachineView::GPU;
+        view.ndims = 1;
+        view.dim[0] = ff_config.tensor_parallelism_degree;
+        view.stride[0] = 1;
+        view.start_device_id = i;
+        // std::cout << "Registering machine view: " << view << std::endl;
+        machine_views.push_back(view);
+      }
+    }
+  }
 }
 
 bool parallel_tensor_list_overlaps(std::vector<ParallelTensor> const &list1,
@@ -105,13 +121,46 @@ void InferenceManager::compile_model_and_allocate_buffer(
             }
           }
         }
+        if (op->op_type == OP_REPLICATE) {
+          // std::cout << "Replicate operator got machine view: " << mv
+          //           << std::endl;
+          assert(model->config.tensor_parallelism_degree > 1);
+          mv.dim[0] = ff_config.tensor_parallelism_degree;
+          mv.stride[0] = 1;
+          if (mv.start_device_id + mv.dim[0] > num_devices) {
+            mv.start_device_id -=
+                (mv.start_device_id + mv.dim[0]) - num_devices;
+          }
+          // std::cout << "Corrected machine view: " << mv << std::endl;
+        } else if (op->op_type == OP_REDUCTION) {
+          // std::cout << "Reduction operator got machine view: " << mv
+          //           << std::endl;
+          assert(model->config.tensor_parallelism_degree > 1);
+          mv.dim[0] = 1;
+          mv.stride[0] = 0;
+          // std::cout << "Corrected machine view: " << mv << std::endl;
+        }
+        assert(mv.start_device_id + mv.dim[0] <= num_devices);
         machine_views.push_back(mv);
       }
       assert(machine_views.size() == max_num_inflight_batches);
     }
+    // std::cout << "operator: " << op->name << std::endl;
+    // for (int i = 0; i < op->numInputs; i++) {
+    //   op->inputs[i]->print("input pt");
+    //   std::cout << "input mv: " << op->inputs[i]->machine_view << std::endl;
+    // }
+
     for (int i = 0; i < op->numOutputs; i++) {
       ParallelTensor pt_base = op->outputs[i];
       assert(tensor_buffer.find(pt_base) == tensor_buffer.end());
+
+      if (op->op_type == OP_REPLICATE) {
+        assert(op->numInputs == 1 && op->numOutputs == 1);
+      }
+      // pt_base->print("output pt");
+      // std::cout << "output mv: " << pt_base->machine_view << std::endl;
+
       std::vector<ParallelTensor> list;
       bool found_parallel_tensor = false;
       if (model->cpu_offload) {
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index e6e432040f..64c3a2eb61 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -2956,7 +2956,9 @@ Op *FFModel::create_operator_from_layer(
 
 void FFModel::create_operators_from_layers() {
   std::map<const Tensor, ParallelTensor> tensors_to_parallel_tensors;
-  for (auto const &l : layers) {
+  // for (auto const &l : layers) {
+  for (int layer_idx = 0; layer_idx < layers.size(); layer_idx++) {
+    auto const &l = layers[layer_idx];
     std::vector<ParallelTensor> inputs;
     for (int i = 0; i < l->numInputs; i++) {
       // create new input tensors
@@ -2964,7 +2966,63 @@ void FFModel::create_operators_from_layers() {
              tensors_to_parallel_tensors.end());
       inputs.push_back(tensors_to_parallel_tensors[l->inputs[i]]);
     }
-    Op *op = create_operator_from_layer(l, inputs);
+    Op *op = nullptr;
+    // add replicate operators if needed
+    if (config.computationMode == COMP_MODE_INFERENCE &&
+        config.tensor_parallelism_degree > 1 &&
+        (l->op_type == OP_INC_MULTIHEAD_SELF_ATTENTION ||
+         l->op_type == OP_TREE_INC_MULTIHEAD_SELF_ATTENTION ||
+         (l->op_type == OP_LINEAR && layer_idx + 3 <= layers.size() &&
+          layers[layer_idx + 1]->op_type == OP_RELU &&
+          layers[layer_idx + 2]->op_type == OP_LINEAR) ||
+         (l->op_type == OP_LINEAR && layer_idx + 6 <= layers.size() &&
+          layers[layer_idx + 1]->op_type == OP_LINEAR &&
+          layers[layer_idx + 2]->op_type == OP_SIGMOID &&
+          layers[layer_idx + 3]->op_type == OP_EW_MUL &&
+          layers[layer_idx + 4]->op_type == OP_EW_MUL &&
+          layers[layer_idx + 5]->op_type == OP_LINEAR) ||
+         (l->op_type == OP_LINEAR && layer_idx + 5 <= layers.size() &&
+          layer_idx >= 1 && layers[layer_idx - 1]->op_type == OP_LINEAR &&
+          layers[layer_idx + 1]->op_type == OP_SIGMOID &&
+          layers[layer_idx + 2]->op_type == OP_EW_MUL &&
+          layers[layer_idx + 3]->op_type == OP_EW_MUL &&
+          layers[layer_idx + 4]->op_type == OP_LINEAR))) {
+      std::vector<ParallelTensor> partitioned_inputs;
+      assert(inputs.size() == 1);
+      Replicate *repl = new Replicate(*this,
+                                      inputs[0],
+                                      inputs[0]->num_dims - 1,
+                                      config.tensor_parallelism_degree);
+      partitioned_inputs.push_back(repl->outputs[0]);
+      operators.push_back(repl);
+      op = create_operator_from_layer(l, partitioned_inputs);
+    } else {
+      op = create_operator_from_layer(l, inputs);
+    }
+    // Op *op = create_operator_from_layer(l, inputs);
+    //  add reduce operators if needed
+    if (config.computationMode == COMP_MODE_INFERENCE &&
+        config.tensor_parallelism_degree > 1 &&
+        (l->op_type == OP_INC_MULTIHEAD_SELF_ATTENTION ||
+         l->op_type == OP_TREE_INC_MULTIHEAD_SELF_ATTENTION ||
+         (l->op_type == OP_LINEAR && layer_idx >= 2 &&
+          layers[layer_idx - 1]->op_type == OP_RELU &&
+          layers[layer_idx - 2]->op_type == OP_LINEAR) ||
+         (l->op_type == OP_LINEAR && layer_idx >= 5 &&
+          layers[layer_idx - 1]->op_type == OP_EW_MUL &&
+          layers[layer_idx - 2]->op_type == OP_EW_MUL &&
+          layers[layer_idx - 3]->op_type == OP_SIGMOID &&
+          layers[layer_idx - 4]->op_type == OP_LINEAR &&
+          layers[layer_idx - 5]->op_type == OP_LINEAR))) {
+      assert(op->numOutputs == 1);
+      Reduction *reduct = new Reduction(*this,
+                                        op->outputs[0],
+                                        op->outputs[0]->num_dims - 1,
+                                        config.tensor_parallelism_degree);
+      operators.push_back(reduct);
+      op = reduct;
+    }
+
     assert(op->numOutputs == l->numOutputs);
     for (int i = 0; i < op->numOutputs; i++) {
       tensors_to_parallel_tensors[l->outputs[i]] = op->outputs[i];
@@ -4834,6 +4892,13 @@ void register_flexflow_internal_tasks() {
         registrar, "Combine Backward Task");
   }
   // Replicate
+  {
+    TaskVariantRegistrar registrar(REPLICATE_INIT_TASK_ID, "Replicate Init");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<OpMeta *, Replicate::init_task>(
+        registrar, "Replicate init Task");
+  }
   {
     TaskVariantRegistrar registrar(REPLICATE_FWD_TASK_ID, "Replicate Forward");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
@@ -4849,6 +4914,13 @@ void register_flexflow_internal_tasks() {
         registrar, "Replicate Backward Task");
   }
   // Reduction
+  {
+    TaskVariantRegistrar registrar(REDUCTION_INIT_TASK_ID, "Reduction Init");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<OpMeta *, Reduction::init_task>(
+        registrar, "Reduction init Task");
+  }
   {
     TaskVariantRegistrar registrar(REDUCTION_FWD_TASK_ID, "Reduction Forward");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
diff --git a/src/runtime/parallel_tensor.cc b/src/runtime/parallel_tensor.cc
index 7bce941c68..0ed594fd7e 100644
--- a/src/runtime/parallel_tensor.cc
+++ b/src/runtime/parallel_tensor.cc
@@ -656,10 +656,13 @@ bool ParallelTensorBase::set_tensor(FFModel const *ff,
   // TODO: check data type matches
   // TODO: Currently we use a task launch, change to index launch for NCCL
   // parameter
-  size_t volume = 1, num_replicas = 0;
+  size_t volume = 1, num_replicas = 1;
   if (sync_type == ParameterSyncType::NCCL) {
-    Domain domain = runtime->get_index_space_domain(ctx, parallel_is);
-    num_replicas = domain.get_volume();
+    // Domain domain = runtime->get_index_space_domain(ctx, parallel_is);
+    // num_replicas = domain.get_volume();
+    if (this->num_dims >= 2 && this->dims[this->num_dims - 1].is_replica_dim) {
+      num_replicas = this->dims[this->num_dims - 1].size;
+    }
   } else if (sync_type == ParameterSyncType::PS) {
     num_replicas = 1;
   } else {
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 6cbd92dee6..56b9bf6241 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -108,7 +108,7 @@ RequestManager::RequestGuid
   request.tokens = prompt;
 
   if (num_ssms == 0) {
-    std::cout << "No small spective model registered yet, using increamental "
+    std::cout << "No small speculative model registered yet, using incremental "
                  "decoding."
               << std::endl;
   } else {
@@ -151,7 +151,7 @@ RequestManager::RequestGuid
   request.initial_len = request.tokens.size();
 
   if (num_ssms == 0) {
-    std::cout << "No small spective model registered yet, using increamental "
+    std::cout << "No small speculative model registered yet, using incremental "
                  "decoding."
               << std::endl;
   } else {
diff --git a/tests/inference_tests.sh b/tests/inference_tests.sh
index 8971fc206e..1262ec21d5 100755
--- a/tests/inference_tests.sh
+++ b/tests/inference_tests.sh
@@ -9,6 +9,9 @@ cleanup() {
 # Cd into directory holding this script
 cd "${BASH_SOURCE[0]%/*}"
 
+# Enable model parallelism tests, if desired
+TENSOR_PARALLELISM_TESTS=${TENSOR_PARALLELISM_TESTS:-OFF}
+
 # Clean up before test (just in case)
 cleanup
 
@@ -43,6 +46,15 @@ mkdir -p ../inference/output
 # OPT (half precision)
 ../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights_half/ -llm-config ../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../inference/weights/opt_125M_weights_half/ -ssm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_opt_half.txt
 
+# Tensor parallelism tests
+if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
+    # LLAMA (half precision)
+    ../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights_half/ -llm-config ../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../inference/weights/llama_160M_weights_half/ -ssm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_llama_half_tp.txt -tensor-parallelism-degree 2
+    
+    # OPT (half precision)
+    ../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights_half/ -llm-config ../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../inference/weights/opt_125M_weights_half/ -ssm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_opt_half_tp.txt -tensor-parallelism-degree 2
+fi
+
 ###############################################################################################
 ############################ Incremental decoding tests #######################################
 ###############################################################################################
@@ -67,6 +79,24 @@ mkdir -p ../inference/output
 # OPT (big model, half precision)
 ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights_half/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_6B_half.txt
 
+# Tensor parallelism tests
+if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
+    # LLAMA (small model)
+    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_160M_weights/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M_tp.txt -tensor-parallelism-degree 2
+    # LLAMA (small model, half precision)
+    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_160M_weights_half/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M_half_tp.txt -tensor-parallelism-degree 2
+
+    # LLAMA (big model, half precision)
+    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights_half/ -llm-config ../inference/models/configs/llama_7B.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_7B_half_tp.txt -tensor-parallelism-degree 2
+
+    # OPT (small model)
+    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_125M_weights/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M_tp.txt -tensor-parallelism-degree 2
+    # OPT (small model, half precision)
+    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_125M_weights_half/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M_half_tp.txt -tensor-parallelism-degree 2
+
+    # OPT (big model, half precision)
+    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights_half/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_6B_half_tp.txt -tensor-parallelism-degree 2
+fi
 
 ###############################################################################################
 ############################### Alignment and Speed tests #####################################
@@ -111,6 +141,18 @@ compare_speed_spec_infer_incr_decoding "../inference/output/incr_decoding_opt_6B
 #compare_speed_spec_infer_incr_decoding "../inference/output/incr_decoding_llama_7B_half.txt" "../inference/output/spec_inference_llama_half.txt"
 #compare_speed_spec_infer_incr_decoding "../inference/output/incr_decoding_opt_6B_half.txt" "../inference/output/spec_inference_opt_half.txt"
 
+############ Alignment between tensor model parallelism and pipeline parallelism only #################
+if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
+    # diff <(tail -n +2 "../inference/output/spec_inference_llama_half_tp.txt") <(tail -n +2 "../inference/output/spec_inference_llama_half.txt")
+    diff <(tail -n +2 "../inference/output/spec_inference_opt_half_tp.txt") <(tail -n +2 "../inference/output/spec_inference_opt_half.txt")
+    diff <(tail -n +2 "../inference/output/incr_decoding_llama_160M_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_llama_160M.txt")
+    diff <(tail -n +2 "../inference/output/incr_decoding_llama_160M_half_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_llama_160M_half.txt")
+    diff <(tail -n +2 "../inference/output/incr_decoding_llama_7B_half_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_llama_7B_half.txt")
+    diff <(tail -n +2 "../inference/output/incr_decoding_opt_125M_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_opt_125M.txt")
+    diff <(tail -n +2 "../inference/output/incr_decoding_opt_125M_half_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_opt_125M_half.txt")
+    diff <(tail -n +2 "../inference/output/incr_decoding_opt_6B_half_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_opt_6B_half.txt")
+fi
+
 ######################### Alignment tests with HuggingFace ####################################
 pip3 install protobuf==3.20.3
 

From f74377afa8c029fe0b87e8efb08bc36adbde7237 Mon Sep 17 00:00:00 2001
From: Zeyu Wang <zwang86@huskers.unl.edu>
Date: Tue, 27 Jun 2023 01:43:12 +0000
Subject: [PATCH 155/344] Formatting.

---
 examples/cpp/inference/mixture_of_experts/moe.h | 4 ++--
 include/flexflow/inference.h                    | 2 +-
 inference/spec_infer/spec_infer.cc              | 2 +-
 3 files changed, 4 insertions(+), 4 deletions(-)

diff --git a/examples/cpp/inference/mixture_of_experts/moe.h b/examples/cpp/inference/mixture_of_experts/moe.h
index 183229bc07..4fdd3b2e3f 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.h
+++ b/examples/cpp/inference/mixture_of_experts/moe.h
@@ -22,9 +22,9 @@ struct MoeConfig : InferenceConfig {
   MoeConfig(void) : InferenceConfig() {
     //----------------------- MoE layer --------------------------------
     // total number of experts
-    num_exp = 128;
+    num_exp = 64;
     // number of experts in each block of fused experts
-    experts_per_block = 32;
+    experts_per_block = 16;
     // number of experts to route each token to
     num_select = 2;
     // expert capacity parameters
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index 1d3b62fb00..5cf9926cff 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -133,7 +133,7 @@ class RequestManager {
           &inputSerializedTree,
       std::vector<std::pair<BatchConfig::TokenId, int>> const
           &outputSerializedTree);
-  int get_requests_init_length(BeamSearchBatchConfig const &old_bc);      
+  int get_requests_init_length(BeamSearchBatchConfig const &old_bc);
 
   static void
       load_tokens_task(Legion::Task const *task,
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 3cf568fe17..b532f7318d 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -294,7 +294,7 @@ void FlexFlow::top_level_task(Task const *task,
 
         if (depth - 1 >= beam_bc_vec[i].max_beam_depth_all_requests() ||
             depth + 1 + rm.get_requests_init_length(beam_bc_vec[i]) >=
-              BatchConfig::MAX_NUM_TOKENS) {
+                BatchConfig::MAX_NUM_TOKENS) {
           break;
         } else {
           beam_bc_vec[i] = rm.prepare_next_batch_beam(beam_bc_vec[i], beam_ir);

From 95e09ebc01d88a906ff86bd4a2702533321a296c Mon Sep 17 00:00:00 2001
From: DerrickYLJ <99985904+DerrickYLJ@users.noreply.github.com>
Date: Tue, 27 Jun 2023 05:22:12 -0400
Subject: [PATCH 156/344] Docker-build and Publish Modification (#776)

* Docker-build and Publish Modification
**Description of changes:**
Add code in docker-build.yml that allows automatic build and publish process when push happens to inference branch. Moreover, modifies publish.sh so that image name will be created as "image" and "branch" name to distinguish from those created in master branch.

**Related Issues:**

Linked Issues:
- Issue #

Issues closed by this PR:
- Closes #

**Before merging:**

- [ ] Did you update the [flexflow-third-party](https://github.com/flexflow/flexflow-third-party) repo, if modifying any of the Cmake files, the build configs, or the submodules?

* update container name

* specinfer env publish

* tag specinfer

* add spaces

* newline

* fix

* fix gpu ci workflow

---------

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
---
 .github/workflows/docker-build.yml |  5 ++++-
 .github/workflows/gpu-ci-skip.yml  |  2 +-
 docker/publish.sh                  | 26 +++++++++++++++++++++++---
 3 files changed, 28 insertions(+), 5 deletions(-)

diff --git a/.github/workflows/docker-build.yml b/.github/workflows/docker-build.yml
index 14f64f5fe6..51ac4a1bd3 100644
--- a/.github/workflows/docker-build.yml
+++ b/.github/workflows/docker-build.yml
@@ -7,6 +7,7 @@ on:
       - ".github/workflows/docker-build.yml"
   push:
     branches:
+      - "inference"
       - "master"
   schedule:
     # Run every week on Sunday at midnight PT (3am ET / 8am UTC) to keep the docker images updated
@@ -42,7 +43,7 @@ jobs:
           # On push to master, build for all compatible architectures, so that we can publish 
           # a pre-built general-purpose image. On all other cases, only build for one architecture
           # to save time.
-          if [[ ( ${{ github.event_name }} == 'push' || ${{ github.event_name }} == 'schedule' ) && ${GITHUB_REF#refs/heads/} == "master" ]]; then
+          if [[ ( ${{ github.event_name }} == 'push' || ${{ github.event_name }} == 'schedule' ) && ( ${GITHUB_REF#refs/heads/} == "master" || ${GITHUB_REF#refs/heads/} == "inference" ) ]]; then
             export FF_CUDA_ARCH=all
           else
             export FF_CUDA_ARCH=70
@@ -67,6 +68,8 @@ jobs:
           if [[ ( ${{ github.event_name }} == 'push' || ${{ github.event_name }} == 'schedule' ) && ${GITHUB_REF#refs/heads/} == "master" ]]; then
             ./docker/publish.sh "flexflow-environment-${FF_GPU_BACKEND}"
             ./docker/publish.sh "flexflow-${FF_GPU_BACKEND}"
+          elif [[ ( ${{ github.event_name }} == 'push'  || ${{ github.event_name }} == 'schedule' ) && ${GITHUB_REF#refs/heads/} == "inference" ]]; then
+            ./docker/publish.sh "specinfer-${FF_GPU_BACKEND}"
           else
             echo "No need to update Docker containers in ghrc.io registry at this time."
           fi
diff --git a/.github/workflows/gpu-ci-skip.yml b/.github/workflows/gpu-ci-skip.yml
index a9b5132ef6..b95f337760 100644
--- a/.github/workflows/gpu-ci-skip.yml
+++ b/.github/workflows/gpu-ci-skip.yml
@@ -1,7 +1,7 @@
 name: "gpu-ci"
 on:
   pull_request:
-    paths:
+    paths-ignore:
       - "cmake/**"
       - "config/**"
       - "python/**"
diff --git a/docker/publish.sh b/docker/publish.sh
index 6f0ac19f7d..844c616091 100755
--- a/docker/publish.sh
+++ b/docker/publish.sh
@@ -5,13 +5,25 @@ set -euo pipefail
 cd "${BASH_SOURCE[0]%/*}"
 
 image=${1:-"flexflow-cuda"}
-if [[ "${image}" != @(flexflow-environment-cuda|flexflow-environment-hip_cuda|flexflow-environment-hip_rocm|flexflow-environment-intel|flexflow-cuda|flexflow-hip_cuda|flexflow-hip_rocm|flexflow-intel) ]]; then
+# Check publish specinfer environment image
+if [[ "${image}" == @(specinfer-environment-cuda|specinfer-environment-hip_cuda|specinfer-environment-hip_rocm|specinfer-environment-intel) ]]; then
+  echo "specinfer does not publish environment images"
+  exit 1
+fi
+
+# Check valid image name
+if [[ "${image}" != @(flexflow-environment-cuda|flexflow-environment-hip_cuda|flexflow-environment-hip_rocm|flexflow-environment-intel|flexflow-cuda|flexflow-hip_cuda|flexflow-hip_rocm|flexflow-intel|specinfer-cuda|specinfer-hip_cuda|specinfer-hip_rocm|specinfer-intel) ]]; then
   echo "Error, image name ${image} is invalid. Choose between 'flexflow-environment-{cuda,hip_cuda,hip_rocm,intel}' and 'flexflow-{cuda,hip_cuda,hip_rocm,intel}'."
   exit 1
 fi
 
 # Check that image exists
-docker image inspect "${image}":latest > /dev/null
+if [[ "${image}" == @(specinfer-cuda|specinfer-hip_cuda|specinfer-hip_rocm|specinfer-intel) ]]; then 
+  SUBSTR="${image:10}"
+  docker image inspect "flexflow-${SUBSTR}":latest > /dev/null
+else
+  docker image inspect "${image}":latest > /dev/null
+fi
 
 # Log into container registry
 FLEXFLOW_CONTAINER_TOKEN=${FLEXFLOW_CONTAINER_TOKEN:-}
@@ -21,7 +33,15 @@ echo "$FLEXFLOW_CONTAINER_TOKEN" | docker login ghcr.io -u flexflow --password-s
 # Tag image to be uploaded
 git_sha=${GITHUB_SHA:-$(git rev-parse HEAD)}
 if [ -z "$git_sha" ]; then echo "Commit hash cannot be detected, cannot publish the docker image to ghrc.io"; exit; fi
-docker tag "$image":latest ghcr.io/flexflow/"$image":latest
+
+# If in "inference" branch, which tries to publish "specinfer" images,
+# tags the all images as "specinfer-{cuda, hip_cuda, hip_rocm, intel}"; if in others, do as orginal
+if [[ "${image}" == @(specinfer-cuda|specinfer-hip_cuda|specinfer-hip_rocm|specinfer-intel) ]]; then 
+  SUBSTR="${image:10}"
+  docker tag flexflow-"$SUBSTR":latest ghcr.io/flexflow/specinfer-"$SUBSTR":latest
+else
+  docker tag "$image":latest ghcr.io/flexflow/"$image":latest
+fi
 
 # Upload image
 docker push ghcr.io/flexflow/"$image":latest

From c40c3f11f778cdbf36ce402698f09900ee14a410 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 28 Jun 2023 23:12:06 +0800
Subject: [PATCH 157/344] add check for cargo (#812)

---
 CMakeLists.txt | 9 ++++++++-
 1 file changed, 8 insertions(+), 1 deletion(-)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index aeec820452..4e64fb2ed7 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -488,7 +488,14 @@ if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_TOKENIZER)
                 OUTPUT_VARIABLE RUSTC_OUTPUT
                 ERROR_QUIET)
   if(NOT RUST_COMMAND_RESULT EQUAL 0)
-    message(FATAL_ERROR "Rust is not installed on the system. Cannot build the tokenizers.")
+    message(FATAL_ERROR "Rust is not installed on the system. Please install it by running: 'curl https://sh.rustup.rs -sSf | sh -s -- -y' and following the instructions on the screen.")
+  endif()
+  # Ensure Cargo is installed
+  execute_process(COMMAND cargo --version
+                  RESULT_VARIABLE CARGO_RESULT
+                  OUTPUT_QUIET ERROR_QUIET)
+  if(NOT CARGO_RESULT EQUAL 0)
+    message(FATAL_ERROR "Rust is installed, but cargo is not. Please install it by running: 'curl https://sh.rustup.rs -sSf | sh -s -- -y' and following the instructions on the screen.")
   endif()
   add_subdirectory(deps/tokenizers-cpp tokenizers EXCLUDE_FROM_ALL)
   target_include_directories(flexflow PUBLIC deps/tokenizers-cpp/include)

From 3a87e02a9e6ffca9ebfc4dc3694dba4aeea929aa Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 29 Jun 2023 15:55:03 +0800
Subject: [PATCH 158/344] [Inference] - Fix Multiple-GPUs CI test (#804)

* fix linear region requirement

* fix set tensor issue
---
 src/ops/inc_multihead_self_attention.cc      | 2 ++
 src/ops/inc_multiquery_self_attention.cc     | 2 ++
 src/ops/linear.cc                            | 4 ++--
 src/ops/spec_inc_multihead_self_attention.cc | 2 ++
 src/ops/tree_inc_multihead_self_attention.cc | 2 ++
 src/runtime/parallel_tensor.cc               | 6 ++++--
 6 files changed, 14 insertions(+), 4 deletions(-)

diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index 765b3c5bfc..07598f99ea 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -285,6 +285,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
     dims[1].size = this->num_heads;
+    dims[1].is_replica_dim = false;
     dims[2].size = qParas + kParas + vParas + oParas;
 
     if (quantization_type != DT_NONE) {
@@ -392,6 +393,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
     dims[1].size = this->num_heads;
+    dims[1].is_replica_dim = false;
     dims[2].size = qParas + kParas + vParas + oParas;
     if (quantization_type != DT_NONE) {
       dims[2].size = get_quantization_to_byte_size(
diff --git a/src/ops/inc_multiquery_self_attention.cc b/src/ops/inc_multiquery_self_attention.cc
index 05c57af2ff..6ce448c9ec 100644
--- a/src/ops/inc_multiquery_self_attention.cc
+++ b/src/ops/inc_multiquery_self_attention.cc
@@ -228,6 +228,7 @@ IncMultiQuerySelfAttention::IncMultiQuerySelfAttention(
     dims[0] = inputs[0]->dims[num_dims - 2];
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
+    dims[1].is_replica_dim = false;
     dims[1].size = this->embed_dim;
     dims[2].size =
         this->embed_dim + this->kProjSize + this->vProjSize + this->oProjSize;
@@ -308,6 +309,7 @@ IncMultiQuerySelfAttention::IncMultiQuerySelfAttention(
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
     dims[1].size = this->embed_dim;
+    dims[1].is_replica_dim = false;
     dims[2].size =
         this->embed_dim + this->kProjSize + this->vProjSize + this->oProjSize;
     int seed = std::rand();
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index e3204c01d9..cca92f014f 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -306,7 +306,7 @@ void Linear::init(FFModel const &ff) {
   // launcher.add_field(0, FID_DATA);
   launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
                                                     0 /*projection id*/,
-                                                    READ_ONLY,
+                                                    WRITE_ONLY,
                                                     EXCLUSIVE,
                                                     inputs[0]->region));
   launcher.add_field(0, FID_DATA);
@@ -365,7 +365,7 @@ void Linear::init_inference(FFModel const &ff,
   // launcher.add_field(0, FID_DATA);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
-                                                    READ_ONLY,
+                                                    WRITE_ONLY,
                                                     EXCLUSIVE,
                                                     batch_inputs[0]->region));
   launcher.add_field(0, FID_DATA);
diff --git a/src/ops/spec_inc_multihead_self_attention.cc b/src/ops/spec_inc_multihead_self_attention.cc
index b9dedda418..e765960985 100644
--- a/src/ops/spec_inc_multihead_self_attention.cc
+++ b/src/ops/spec_inc_multihead_self_attention.cc
@@ -265,6 +265,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
     dims[1].size = this->num_heads;
+    dims[1].is_replica_dim = false;
     dims[2].size = qParas + kParas + vParas + oParas;
     dims[2].degree = 1;
     dims[2].parallel_idx = -1;
@@ -363,6 +364,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
     dims[1].size = this->num_heads;
+    dims[1].is_replica_dim = false;
     dims[2].size = qParas + kParas + vParas + oParas;
     int seed = std::rand();
     Initializer *initializer = new GlorotUniform(seed);
diff --git a/src/ops/tree_inc_multihead_self_attention.cc b/src/ops/tree_inc_multihead_self_attention.cc
index d0bf1d5675..105bd41647 100644
--- a/src/ops/tree_inc_multihead_self_attention.cc
+++ b/src/ops/tree_inc_multihead_self_attention.cc
@@ -286,6 +286,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
     dims[1].size = this->num_heads;
+    dims[1].is_replica_dim = false;
     dims[2].size = qParas + kParas + vParas + oParas;
     if (quantization_type != DT_NONE) {
       dims[2].size = get_quantization_to_byte_size(
@@ -392,6 +393,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
     dims[1].size = this->num_heads;
+    dims[1].is_replica_dim = false;
     dims[2].size = qParas + kParas + vParas + oParas;
     if (quantization_type != DT_NONE) {
       dims[2].size = get_quantization_to_byte_size(
diff --git a/src/runtime/parallel_tensor.cc b/src/runtime/parallel_tensor.cc
index 0ed594fd7e..8f1be15fd1 100644
--- a/src/runtime/parallel_tensor.cc
+++ b/src/runtime/parallel_tensor.cc
@@ -660,8 +660,10 @@ bool ParallelTensorBase::set_tensor(FFModel const *ff,
   if (sync_type == ParameterSyncType::NCCL) {
     // Domain domain = runtime->get_index_space_domain(ctx, parallel_is);
     // num_replicas = domain.get_volume();
-    if (this->num_dims >= 2 && this->dims[this->num_dims - 1].is_replica_dim) {
-      num_replicas = this->dims[this->num_dims - 1].size;
+    for (int i = 0; i < this->num_dims; i++) {
+      if (this->dims[i].is_replica_dim) {
+        num_replicas *= this->dims[i].size;
+      }
     }
   } else if (sync_type == ParameterSyncType::PS) {
     num_replicas = 1;

From f02c9a0e870129c2cde0ef064405883a06f8d4ac Mon Sep 17 00:00:00 2001
From: DerrickYLJ <99985904+DerrickYLJ@users.noreply.github.com>
Date: Thu, 29 Jun 2023 04:12:56 -0400
Subject: [PATCH 159/344] Update README.md (#814)

Update links/names of docker container from flexflow-{cuda, hip_rocm} to specinfer-{cuda, hip_rocm} with the disclaimer of CUDA version.

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
---
 .github/README.md | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/.github/README.md b/.github/README.md
index 010d7c07bb..576b1ca84e 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -29,7 +29,7 @@ for serving generative LLMs while provably preserving model quality.
 </p>
 
 ## Build/Install SpecInfer
-SpecInfer is built on top of FlexFlow. You can build/install SpecInfer by building the inference branch of FlexFlow. Please read the [instructions](../INSTALL.md) for building/installing FlexFlow from source code. If you would like to quickly try SpecInfer, we also provide pre-built Docker packages ([flexflow-cuda](https://github.com/flexflow/FlexFlow/pkgs/container/flexflow-cuda) with a CUDA backend, [flexflow-hip_rocm](https://github.com/flexflow/FlexFlow/pkgs/container/flexflow-hip_rocm) with a HIP-ROCM backend) with all dependencies pre-installed (N.B.: currently, the CUDA pre-built containers are only fully compatible with host machines that have CUDA 11.7 installed), together with [Dockerfiles](./docker) if you wish to build the containers manually. 
+SpecInfer is built on top of FlexFlow. You can build/install SpecInfer by building the inference branch of FlexFlow. Please read the [instructions](../INSTALL.md) for building/installing FlexFlow from source code. If you would like to quickly try SpecInfer, we also provide pre-built Docker packages ([specinfer-cuda](https://github.com/flexflow/FlexFlow/pkgs/container/specinfer-cuda) with a CUDA backend, [specinfer-hip_rocm](https://github.com/flexflow/FlexFlow/pkgs/container/specinfer-hip_rocm) with a HIP-ROCM backend) with all dependencies pre-installed (N.B.: currently, the CUDA pre-built containers are only fully compatible with host machines that have CUDA 11.7 installed), together with [Dockerfiles](./docker) if you wish to build the containers manually. 
 
 ## Run SpecInfer
 The source code of the SpecInfer pipeline is available at [this folder](../inference/spec_infer/). The SpecInfer executable will be available at `/build_dir/inference/spec_infer/spec_infer` at compilation. You can use the following command-line arguments to run SpecInfer:

From 08bda773c8dd968e75c6fbbf2bfa8a902197874e Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 29 Jun 2023 21:57:02 +0800
Subject: [PATCH 160/344] [Inference] - Better device placement in tensor model
 parallelism (#805)

* add data parallelism degree setting

* compute multi-device machines views

* fix bugs

* fix and linting

* update inference test, comment out print statements

* fix
---
 .github/workflows/gpu-ci.yml                  |  1 +
 .../cpp/inference/mixture_of_experts/moe.cc   |  9 ++-
 .../inference/transformers/transformers.cc    | 10 ++--
 include/flexflow/config.h                     |  4 +-
 include/flexflow/inference.h                  |  5 +-
 inference/incr_decoding/incr_decoding.cc      | 29 +++++++--
 inference/models/llama.cc                     | 59 +++++++++++++++----
 inference/models/opt.cc                       | 49 +++++++++++++--
 inference/spec_infer/spec_infer.cc            | 29 +++++++--
 src/runtime/inference_manager.cc              | 47 +++++++++++----
 tests/inference_tests.sh                      | 16 ++++-
 11 files changed, 203 insertions(+), 55 deletions(-)

diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index 7f83fb2691..bdbb8a751b 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -180,6 +180,7 @@ jobs:
           ./tests/gpt_tokenizer_test.sh
 
           # Inference tests
+          export TENSOR_PARALLELISM_TESTS=ON
           ./tests/inference_tests.sh
 
   gpu-ci-flexflow:
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index 0c94452ec1..39459d63ac 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -139,8 +139,7 @@ void FlexFlow::top_level_task(Task const *task,
   Tensor output = ff.arg_top_k(t, /*k=*/1, /*sorted=*/false);
 
   //------------------- Initialize the inference manager ------------------
-  InferenceManager im(
-      ff.config, moeConfig.batch_size, moeConfig.num_inflight_batches);
+  InferenceManager im(ff.config, moeConfig.batch_size);
   std::unordered_map<Tensor, std::vector<MachineView>> mapping;
   im.compile_model_and_allocate_buffer(&ff, mapping);
   im.init_operators_inference(&ff);
@@ -162,7 +161,7 @@ void FlexFlow::top_level_task(Task const *task,
   ParallelTensor input_pt;
   ff.get_parallel_tensor_from_tensor(input, input_pt);
   assert(im.tensor_buffer.find(input_pt) != im.tensor_buffer.end());
-  assert(im.tensor_buffer[input_pt].size() == im.max_num_inflight_batches);
+  assert(im.tensor_buffer[input_pt].size() == ffConfig.data_parallelism_degree);
   DataLoader data_loader(
       ff, moeConfig, data_generator, im.tensor_buffer[input_pt]);
 
@@ -184,13 +183,13 @@ void FlexFlow::top_level_task(Task const *task,
   std::map<int, BatchConfig *> batch_configs;
   std::pair<size_t, size_t> new_prompts;
   BatchConfig *bc = nullptr;
-  std::map<size_t, int> batch_predictions[im.max_num_inflight_batches];
+  std::map<size_t, int> batch_predictions[ffConfig.data_parallelism_degree];
 
   assert(im.max_num_tokens_per_batch == moeConfig.batch_size);
 
   // simulation loop. For deployment, we will use a while(true)
   while (processed_requests < moeConfig.total_requests) {
-    for (int bid = 0; bid < im.max_num_inflight_batches; bid++) {
+    for (int bid = 0; bid < ffConfig.data_parallelism_degree; bid++) {
       size_t max_reqs, max_tkns;
       if (future_handlers.find(bid) == future_handlers.end()) {
         max_reqs = moeConfig.incremental_mode ? bc->MAX_NUM_REQUESTS
diff --git a/examples/cpp/inference/transformers/transformers.cc b/examples/cpp/inference/transformers/transformers.cc
index d416fdca3c..d56473c8bd 100644
--- a/examples/cpp/inference/transformers/transformers.cc
+++ b/examples/cpp/inference/transformers/transformers.cc
@@ -114,9 +114,7 @@ void FlexFlow::top_level_task(Task const *task,
   Tensor output = ff.arg_top_k(t, /*k=*/1, false);
 
   //------------------- Initialize the inference manager ------------------
-  InferenceManager im(ff.config,
-                      transformerConfig.batch_size,
-                      transformerConfig.num_inflight_batches);
+  InferenceManager im(ff.config, transformerConfig.batch_size);
   std::unordered_map<Tensor, std::vector<MachineView>> mapping;
   im.compile_model_and_allocate_buffer(&ff, mapping);
   im.init_operators_inference(&ff);
@@ -138,7 +136,7 @@ void FlexFlow::top_level_task(Task const *task,
   ParallelTensor input_pt;
   ff.get_parallel_tensor_from_tensor(input, input_pt);
   assert(im.tensor_buffer.find(input_pt) != im.tensor_buffer.end());
-  assert(im.tensor_buffer[input_pt].size() == im.max_num_inflight_batches);
+  assert(im.tensor_buffer[input_pt].size() == ffConfig.data_parallelism_degree);
   DataLoader data_loader(
       ff, transformerConfig, data_generator, im.tensor_buffer[input_pt]);
 
@@ -160,14 +158,14 @@ void FlexFlow::top_level_task(Task const *task,
   std::map<int, BatchConfig *> batch_configs;
   std::pair<size_t, size_t> new_prompts;
   BatchConfig *bc = nullptr;
-  std::map<size_t, int> batch_predictions[im.max_num_inflight_batches];
+  std::map<size_t, int> batch_predictions[ffConfig.data_parallelism_degree];
 
   assert(im.max_num_tokens_per_batch == transformerConfig.batch_size);
   // assert(transformerConfig.batch_size <= BatchConfig::MAX_NUM_REQUESTS);
 
   // simulation loop. For deployment, we will use a while(true)
   while (processed_requests < transformerConfig.total_requests) {
-    for (int bid = 0; bid < im.max_num_inflight_batches; bid++) {
+    for (int bid = 0; bid < ffConfig.data_parallelism_degree; bid++) {
       size_t max_reqs, max_tkns;
       if (future_handlers.find(bid) == future_handlers.end()) {
         max_reqs = transformerConfig.incremental_mode
diff --git a/include/flexflow/config.h b/include/flexflow/config.h
index f7c59f7b58..f1b218e50f 100644
--- a/include/flexflow/config.h
+++ b/include/flexflow/config.h
@@ -143,8 +143,10 @@ class FFConfig {
   bool enable_parameter_parallel;
   bool enable_attribute_parallel;
   bool enable_inplace_optimizations;
-  // Control tensor model parallelism degree in inference
+  // Control parallelism degrees in inference
+  int data_parallelism_degree;
   int tensor_parallelism_degree;
+  int pipeline_parallelism_degree;
   // Control Tensor Op Math Conversion
   bool allow_tensor_op_math_conversion;
   std::string dataset_path;
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index 4da8dbaf20..1fd2fdff78 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -28,9 +28,7 @@ using tokenizers::Tokenizer;
 
 class InferenceManager {
 public:
-  InferenceManager(FFConfig const &config,
-                   int max_num_tokens_per_batch,
-                   int max_num_inflight_batches);
+  InferenceManager(FFConfig const &config, int max_num_tokens_per_batch);
   void compile_model_and_allocate_buffer(
       FFModel *model,
       std::unordered_map<Tensor, std::vector<MachineView>> const &mapping);
@@ -45,7 +43,6 @@ class InferenceManager {
   FFConfig ff_config;
   std::unordered_map<ParallelTensor, std::vector<ParallelTensor>> tensor_buffer;
   int max_num_tokens_per_batch;
-  int max_num_inflight_batches;
   int num_devices;
   std::vector<MachineView> machine_views;
 };
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index a281f52853..d43cab17f9 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -38,7 +38,9 @@ void parse_input_args(char **argv,
                       ModelType &llm_model_type,
                       bool &use_full_precision,
                       bool &verbose,
-                      int &tensor_parallelism_degree) {
+                      int &data_parallelism_degree,
+                      int &tensor_parallelism_degree,
+                      int &pipeline_parallelism_degree) {
   for (int i = 1; i < argc; i++) {
     // llm model type
     if (!strcmp(argv[i], "-llm-model")) {
@@ -83,11 +85,21 @@ void parse_input_args(char **argv,
       paths.output_file_path = std::string(argv[++i]);
       continue;
     }
+    // data parallelism degree
+    if (!strcmp(argv[i], "-data-parallelism-degree")) {
+      data_parallelism_degree = std::stoi(argv[++i]);
+      continue;
+    }
     // tensor parallelism degree
     if (!strcmp(argv[i], "-tensor-parallelism-degree")) {
       tensor_parallelism_degree = std::stoi(argv[++i]);
       continue;
     }
+    // pipeline parallelism degree
+    if (!strcmp(argv[i], "-pipeline-parallelism-degree")) {
+      pipeline_parallelism_degree = std::stoi(argv[++i]);
+      continue;
+    }
     if (!strcmp(argv[i], "--use-full-precision")) {
       use_full_precision = true;
       continue;
@@ -112,7 +124,9 @@ void FlexFlow::top_level_task(Task const *task,
   ModelType model_type;
   bool use_full_precision = false;
   bool verbose = false;
-  int tensor_parallelism_degree = 1;
+  size_t num_devices = ffconfig.workersPerNode * ffconfig.numNodes;
+  int data_parallelism_degree = 1, tensor_parallelism_degree = 1,
+      pipeline_parallelism_degree = -1;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
   char **argv = command_args.argv;
@@ -123,13 +137,20 @@ void FlexFlow::top_level_task(Task const *task,
                    model_type,
                    use_full_precision,
                    verbose,
-                   tensor_parallelism_degree);
+                   data_parallelism_degree,
+                   tensor_parallelism_degree,
+                   pipeline_parallelism_degree);
+  ffconfig.data_parallelism_degree = data_parallelism_degree;
   ffconfig.tensor_parallelism_degree = tensor_parallelism_degree;
+  ffconfig.pipeline_parallelism_degree =
+      pipeline_parallelism_degree == -1
+          ? num_devices / (tensor_parallelism_degree * data_parallelism_degree)
+          : pipeline_parallelism_degree;
 
   assert(model_type != ModelType::UNKNOWN &&
          "Invalid LLM model type passed (or no type was passed).");
 
-  InferenceManager im(ffconfig, BatchConfig::MAX_NUM_TOKENS, 1);
+  InferenceManager im(ffconfig, BatchConfig::MAX_NUM_TOKENS);
   RequestManager rm(model_type,
                     file_paths.tokenizer_file_path,
                     /*verbose*/ verbose,
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index f7c1563095..1e61f43a98 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -29,8 +29,27 @@ void LLAMA::create_llama_model(FFModel &ff,
   // do not apply cpu offload in beam search model.
   Config llama_config(model_config_file_path);
   llama_config.printConfig();
-  //------------------------------compute machine views ------------------
+  //---------------------- parallelization setup work ----------------------
   int num_devices = ff.config.workersPerNode * ff.config.numNodes;
+  int num_transformer_layers = llama_config.n_layers;
+  assert(num_transformer_layers % ff.config.pipeline_parallelism_degree == 0);
+  int num_layers_per_pp_block =
+      num_transformer_layers / ff.config.pipeline_parallelism_degree;
+  int num_devices_per_data_parallelism_line =
+      num_devices / ff.config.data_parallelism_degree;
+
+  // std::cout << "dp: " << ff.config.data_parallelism_degree
+  //           << " tp: " << ff.config.tensor_parallelism_degree
+  //           << " pp: " << ff.config.pipeline_parallelism_degree << std::endl;
+  // std::cout << "num_devices: " << num_devices << std::endl;
+  // std::cout << "num_transformer_layers: " << num_transformer_layers
+  //           << std::endl;
+  // std::cout << "num_devices_per_data_parallelism_line: "
+  //           << num_devices_per_data_parallelism_line << std::endl;
+  // std::cout << "num layers: " << llama_config.n_layers << std::endl;
+
+  //------------------------------compute machine views ------------------
+  // single device
   std::vector<MachineView> machine_views;
   for (int i = 0; i < num_devices; i++) {
     MachineView view;
@@ -41,6 +60,7 @@ void LLAMA::create_llama_model(FFModel &ff,
     view.start_device_id = i;
     machine_views.push_back(view);
   }
+  assert(machine_views.size() == num_devices);
 
   std::unordered_map<Tensor, std::vector<MachineView>> mapping;
   std::unordered_map<std::string, Layer *> weights_layers;
@@ -51,7 +71,10 @@ void LLAMA::create_llama_model(FFModel &ff,
     int const token_dims[] = {BatchConfig::MAX_NUM_TOKENS, 1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
-  mapping[input].push_back(machine_views[0]);
+  for (int i = 0; i < ff.config.data_parallelism_degree; i++) {
+    mapping[input].push_back(
+        machine_views[i * num_devices_per_data_parallelism_line]);
+  }
 
   Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
 
@@ -78,9 +101,10 @@ void LLAMA::create_llama_model(FFModel &ff,
   Layer *embedding = ff.layers.back();
   weights_layers.emplace("tok_embeddings_weight", embedding);
 
-  int num_transformer_layers = llama_config.n_layers;
-  int num_transformer_layers_per_stage =
-      (num_transformer_layers + num_pipeline_stages - 1) / num_pipeline_stages;
+  // int num_transformer_layers = llama_config.n_layers;
+  // int num_transformer_layers_per_stage =
+  //     (num_transformer_layers + num_pipeline_stages - 1) /
+  //     num_pipeline_stages;
 
   for (int i = 0; i < num_transformer_layers; i++) {
     // step 1: attention
@@ -89,12 +113,25 @@ void LLAMA::create_llama_model(FFModel &ff,
         ff.rms_norm(token, llama_config.norm_eps, llama_config.dim);
     Layer *attention_norm = ff.layers.back();
 
-    if (i % num_transformer_layers_per_stage == 0) {
-      // Map att_norm to the next GPU
-      // since the size of att_norm is minimum across
-      // all tensors
-      mapping[att_norm].push_back(
-          machine_views[i / num_transformer_layers_per_stage]);
+    // if (i % num_transformer_layers_per_stage == 0) {
+    //   // Map att_norm to the next GPU
+    //   // since the size of att_norm is minimum across
+    //   // all tensors
+    //   mapping[att_norm].push_back(
+    //       machine_views[i / num_transformer_layers_per_stage]);
+    // }
+    for (int dp_index = 0; dp_index < ff.config.data_parallelism_degree;
+         dp_index++) {
+      int pp_block_idx = i / num_layers_per_pp_block;
+      int first_device_idx = dp_index * num_devices_per_data_parallelism_line +
+                             ff.config.tensor_parallelism_degree * pp_block_idx;
+      // std::cout << "assigning layer " << i << " to devices " <<
+      // first_device_idx
+      //           << "-"
+      //           << first_device_idx + ff.config.tensor_parallelism_degree - 1
+      //           << std::endl;
+      assert(first_device_idx < num_devices);
+      mapping[att_norm].push_back(machine_views[first_device_idx]);
     }
 
     weights_layers.emplace("layers_" + std::to_string(i) +
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index 1e81e4eba7..499eb92642 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -28,8 +28,27 @@ void OPT::create_opt_model(FFModel &ff,
                            bool use_full_precision) {
   Config opt_config(model_config_file_path);
   opt_config.printConfig();
-  //------------------------------compute machine views ------------------
+  //---------------------- parallelization setup work ----------------------
   int num_devices = ff.config.workersPerNode * ff.config.numNodes;
+  int num_transformer_layers = opt_config.num_hidden_layers;
+  assert(num_transformer_layers % ff.config.pipeline_parallelism_degree == 0);
+  int num_layers_per_pp_block =
+      num_transformer_layers / ff.config.pipeline_parallelism_degree;
+  int num_devices_per_data_parallelism_line =
+      num_devices / ff.config.data_parallelism_degree;
+
+  // std::cout << "dp: " << ff.config.data_parallelism_degree
+  //           << " tp: " << ff.config.tensor_parallelism_degree
+  //           << " pp: " << ff.config.pipeline_parallelism_degree << std::endl;
+  // std::cout << "num_devices: " << num_devices << std::endl;
+  // std::cout << "num_transformer_layers: " << num_transformer_layers
+  //           << std::endl;
+  // std::cout << "num_devices_per_data_parallelism_line: "
+  //           << num_devices_per_data_parallelism_line << std::endl;
+  // std::cout << "num layers: " << opt_config.num_hidden_layers << std::endl;
+
+  //------------------------------compute machine views ------------------
+  // single device
   std::vector<MachineView> machine_views;
   for (int i = 0; i < num_devices; i++) {
     MachineView view;
@@ -40,6 +59,7 @@ void OPT::create_opt_model(FFModel &ff,
     view.start_device_id = i;
     machine_views.push_back(view);
   }
+  assert(machine_views.size() == num_devices);
 
   std::unordered_map<Tensor, std::vector<MachineView>> mapping;
   std::unordered_map<std::string, Layer *> weights_layers;
@@ -52,8 +72,12 @@ void OPT::create_opt_model(FFModel &ff,
     input = ff.create_tensor<2>(token_dims, DT_INT32);
     position_input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
-  mapping[input].push_back(machine_views[0]);
-  mapping[position_input].push_back(machine_views[0]);
+  for (int i = 0; i < ff.config.data_parallelism_degree; i++) {
+    mapping[input].push_back(
+        machine_views[i * num_devices_per_data_parallelism_line]);
+    mapping[position_input].push_back(
+        machine_views[i * num_devices_per_data_parallelism_line]);
+  }
 
   Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
   std::vector<int> axes = {0};
@@ -118,10 +142,23 @@ void OPT::create_opt_model(FFModel &ff,
                                "_attention_layer_norm_weight",
                            self_attn_layer_norm);
 
-    if (i % num_transformer_layers_per_stage == 0) {
-      mapping[hidden_states].push_back(
-          machine_views[i / num_transformer_layers_per_stage]);
+    for (int dp_index = 0; dp_index < ff.config.data_parallelism_degree;
+         dp_index++) {
+      int pp_block_idx = i / num_layers_per_pp_block;
+      int first_device_idx = dp_index * num_devices_per_data_parallelism_line +
+                             ff.config.tensor_parallelism_degree * pp_block_idx;
+      // std::cout << "assigning layer " << i << " to devices " <<
+      // first_device_idx
+      //           << "-"
+      //           << first_device_idx + ff.config.tensor_parallelism_degree - 1
+      //           << std::endl;
+      assert(first_device_idx < num_devices);
+      mapping[hidden_states].push_back(machine_views[first_device_idx]);
     }
+    // if (i % num_transformer_layers_per_stage == 0) {
+    //   mapping[hidden_states].push_back(
+    //       machine_views[i / num_transformer_layers_per_stage]);
+    // }
 
     Tensor mha;
     switch (mode) {
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 72666ed312..fbb07b2b25 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -44,7 +44,9 @@ void parse_input_args(char **argv,
                       ModelTypes &model_types,
                       bool &use_full_precision,
                       bool &verbose,
-                      int &tensor_parallelism_degree) {
+                      int &data_parallelism_degree,
+                      int &tensor_parallelism_degree,
+                      int &pipeline_parallelism_degree) {
   for (int i = 1; i < argc; i++) {
     // llm model type
     if (!strcmp(argv[i], "-llm-model")) {
@@ -115,11 +117,21 @@ void parse_input_args(char **argv,
       paths.output_file_path = std::string(argv[++i]);
       continue;
     }
+    // data parallelism degree
+    if (!strcmp(argv[i], "-data-parallelism-degree")) {
+      data_parallelism_degree = std::stoi(argv[++i]);
+      continue;
+    }
     // tensor parallelism degree
     if (!strcmp(argv[i], "-tensor-parallelism-degree")) {
       tensor_parallelism_degree = std::stoi(argv[++i]);
       continue;
     }
+    // pipeline parallelism degree
+    if (!strcmp(argv[i], "-pipeline-parallelism-degree")) {
+      pipeline_parallelism_degree = std::stoi(argv[++i]);
+      continue;
+    }
     if (!strcmp(argv[i], "--use-full-precision")) {
       use_full_precision = true;
       continue;
@@ -141,7 +153,9 @@ void FlexFlow::top_level_task(Task const *task,
   ModelTypes model_types;
   bool use_full_precision = false;
   bool verbose = false;
-  int tensor_parallelism_degree = 1;
+  size_t num_devices = ffconfig.workersPerNode * ffconfig.numNodes;
+  int data_parallelism_degree = 1, tensor_parallelism_degree = 1,
+      pipeline_parallelism_degree = -1;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
   char **argv = command_args.argv;
@@ -152,8 +166,15 @@ void FlexFlow::top_level_task(Task const *task,
                    model_types,
                    use_full_precision,
                    verbose,
-                   tensor_parallelism_degree);
+                   data_parallelism_degree,
+                   tensor_parallelism_degree,
+                   pipeline_parallelism_degree);
+  ffconfig.data_parallelism_degree = data_parallelism_degree;
   ffconfig.tensor_parallelism_degree = tensor_parallelism_degree;
+  ffconfig.pipeline_parallelism_degree =
+      pipeline_parallelism_degree == -1
+          ? num_devices / (tensor_parallelism_degree * data_parallelism_degree)
+          : pipeline_parallelism_degree;
 
   if (file_paths.ssm_weight_file_paths.size() == 0) {
     assert(false &&
@@ -178,7 +199,7 @@ void FlexFlow::top_level_task(Task const *task,
   }
 
   // Create SentencePiece tokenizer or OPT tokenizer
-  InferenceManager im(ffconfig, BatchConfig::MAX_NUM_TOKENS, 1);
+  InferenceManager im(ffconfig, BatchConfig::MAX_NUM_TOKENS);
   RequestManager rm(model_types.llm_model_type,
                     file_paths.tokenizer_file_path,
                     /*verbose*/ verbose,
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index f844834761..67a78f9700 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -29,12 +29,32 @@ LegionRuntime::Logger::Category log_inf_mgr("InferenceManager");
 LegionRuntime::Logger::Category log_offload("Offloading");
 
 InferenceManager::InferenceManager(FFConfig const &_config,
-                                   int _max_num_tokens_per_batch,
-                                   int _max_num_inflight_batches)
-    : ff_config(_config), max_num_tokens_per_batch(_max_num_tokens_per_batch),
-      max_num_inflight_batches(_max_num_inflight_batches) {
-  // populate array of valid single-device machine views
+                                   int _max_num_tokens_per_batch)
+    : ff_config(_config), max_num_tokens_per_batch(_max_num_tokens_per_batch) {
   num_devices = ff_config.workersPerNode * ff_config.numNodes;
+  // Check parallelization degrees
+  assert(ff_config.data_parallelism_degree <= num_devices &&
+         "Data parallelism degree exceeds number of available devices");
+  assert(num_devices % ff_config.data_parallelism_degree == 0 &&
+         "Number of available devices is not divisible by data parallelism "
+         "degree");
+  assert(ff_config.tensor_parallelism_degree <= num_devices &&
+         "Tensor parallelism degree exceeds number of available devices");
+  assert(num_devices % ff_config.tensor_parallelism_degree == 0 &&
+         "Number of available devices is not divisible by tensor parallelism "
+         "degree");
+  assert(ff_config.pipeline_parallelism_degree <= num_devices &&
+         "Pipeline parallelism degree exceeds number of available devices");
+  assert(num_devices % ff_config.pipeline_parallelism_degree == 0 &&
+         "Number of available devices is not divisible by pipeline parallelism "
+         "degree");
+  assert(ff_config.data_parallelism_degree *
+                 ff_config.tensor_parallelism_degree *
+                 ff_config.pipeline_parallelism_degree ==
+             num_devices &&
+         "Product of data, tensor, and pipeline parallelism degrees does not "
+         "match the number of available devices");
+  // populate array of valid single-device machine views
   for (int i = 0; i < num_devices; i++) {
     MachineView view;
     view.device_type = MachineView::GPU;
@@ -90,6 +110,7 @@ void InferenceManager::compile_model_and_allocate_buffer(
     assert(pt->owner_op != nullptr);
     mapping[pt->owner_op] = it.second;
   }
+  // std::cout << std::endl << std::endl << "Operators MVs:" << std::endl;
   for (int op_idx = 0; op_idx < model->operators.size(); op_idx++) {
     Op const *op = model->operators[op_idx];
     // Skip weight operators
@@ -100,12 +121,12 @@ void InferenceManager::compile_model_and_allocate_buffer(
     std::vector<MachineView> machine_views;
     if (mapping.find(op) != mapping.end()) {
       machine_views = mapping[op];
-      assert(machine_views.size() == max_num_inflight_batches);
+      assert(machine_views.size() == ff_config.data_parallelism_degree);
     } else {
       // Mapping the current operator using the same machine
       // view as the inputs
       assert(op->numInputs > 0);
-      for (int j = 0; j < max_num_inflight_batches; j++) {
+      for (int j = 0; j < ff_config.data_parallelism_degree; j++) {
         MachineView mv = tensor_buffer[op->inputs[0]][j]->machine_view;
         for (int k = 1; k < op->numInputs; k++) {
           if (mv != tensor_buffer[op->inputs[k]][j]->machine_view) {
@@ -143,14 +164,14 @@ void InferenceManager::compile_model_and_allocate_buffer(
         assert(mv.start_device_id + mv.dim[0] <= num_devices);
         machine_views.push_back(mv);
       }
-      assert(machine_views.size() == max_num_inflight_batches);
+      assert(machine_views.size() == ff_config.data_parallelism_degree);
     }
     // std::cout << "operator: " << op->name << std::endl;
     // for (int i = 0; i < op->numInputs; i++) {
     //   op->inputs[i]->print("input pt");
     //   std::cout << "input mv: " << op->inputs[i]->machine_view << std::endl;
     // }
-
+    // std::cout << "Op " << op->name << ": ";
     for (int i = 0; i < op->numOutputs; i++) {
       ParallelTensor pt_base = op->outputs[i];
       assert(tensor_buffer.find(pt_base) == tensor_buffer.end());
@@ -211,7 +232,7 @@ void InferenceManager::compile_model_and_allocate_buffer(
         }
       }
       if (!found_parallel_tensor) {
-        for (int j = 0; j < max_num_inflight_batches; j++) {
+        for (int j = 0; j < ff_config.data_parallelism_degree; j++) {
           // Copy the metadata from pt_base to pt
           ParallelTensor pt = new ParallelTensorBase(*pt_base);
           pt->region =
@@ -221,6 +242,7 @@ void InferenceManager::compile_model_and_allocate_buffer(
           pt->part = runtime->get_logical_partition(
               ctx, pt->region, pt_base->part.get_index_partition());
           pt->machine_view = machine_views[j];
+          // std::cout << "output mv: " << pt->machine_view << std::endl;
           Domain part_domain =
               runtime->get_index_space_domain(ctx, pt_base->parallel_is);
           assert(pt->machine_view.get_domain() == part_domain);
@@ -230,11 +252,12 @@ void InferenceManager::compile_model_and_allocate_buffer(
       assert(tensor_buffer.find(pt_base) == tensor_buffer.end());
       tensor_buffer[pt_base] = list;
     }
+    // std::cout << std::endl;
   }
 }
 
 void InferenceManager::init_operators_inference(FFModel *model) {
-  for (int batch_index = 0; batch_index < max_num_inflight_batches;
+  for (int batch_index = 0; batch_index < ff_config.data_parallelism_degree;
        batch_index++) {
     int expert_device_index = 0;
     int device_index = batch_index % num_devices;
@@ -290,7 +313,7 @@ FutureMap InferenceManager::inference(FFModel *model,
   assert(bc.num_active_tokens() > 0 && bc.num_active_requests() > 0);
   // We currently assume that the index-th batch will be placed
   // on the device_index-th device (except for the experts layers)
-  int batch_index = index % max_num_inflight_batches;
+  int batch_index = index % ff_config.data_parallelism_degree;
   FutureMap fm;
   bool found_input_operator = false;
   for (size_t o = 0; o < model->operators.size(); o++) {
diff --git a/tests/inference_tests.sh b/tests/inference_tests.sh
index 1262ec21d5..3e0d7cac53 100755
--- a/tests/inference_tests.sh
+++ b/tests/inference_tests.sh
@@ -48,9 +48,13 @@ mkdir -p ../inference/output
 
 # Tensor parallelism tests
 if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
+    # LLAMA
+    ../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../inference/weights/llama_160M_weights/ -ssm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_llama_tp.txt -tensor-parallelism-degree 2
     # LLAMA (half precision)
     ../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights_half/ -llm-config ../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../inference/weights/llama_160M_weights_half/ -ssm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_llama_half_tp.txt -tensor-parallelism-degree 2
     
+    # OPT
+    ../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../inference/weights/opt_125M_weights/ -ssm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_opt_tp.txt -tensor-parallelism-degree 2
     # OPT (half precision)
     ../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights_half/ -llm-config ../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../inference/weights/opt_125M_weights_half/ -ssm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_opt_half_tp.txt -tensor-parallelism-degree 2
 fi
@@ -86,6 +90,8 @@ if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
     # LLAMA (small model, half precision)
     ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_160M_weights_half/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M_half_tp.txt -tensor-parallelism-degree 2
 
+    # LLAMA (big model)
+    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_7B_tp.txt -tensor-parallelism-degree 2
     # LLAMA (big model, half precision)
     ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights_half/ -llm-config ../inference/models/configs/llama_7B.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_7B_half_tp.txt -tensor-parallelism-degree 2
 
@@ -94,6 +100,8 @@ if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
     # OPT (small model, half precision)
     ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_125M_weights_half/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M_half_tp.txt -tensor-parallelism-degree 2
 
+    # OPT (big model)
+    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_6B_tp.txt -tensor-parallelism-degree 2
     # OPT (big model, half precision)
     ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights_half/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_6B_half_tp.txt -tensor-parallelism-degree 2
 fi
@@ -143,13 +151,17 @@ compare_speed_spec_infer_incr_decoding "../inference/output/incr_decoding_opt_6B
 
 ############ Alignment between tensor model parallelism and pipeline parallelism only #################
 if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
-    # diff <(tail -n +2 "../inference/output/spec_inference_llama_half_tp.txt") <(tail -n +2 "../inference/output/spec_inference_llama_half.txt")
+    diff <(tail -n +2 "../inference/output/spec_inference_llama_tp.txt") <(tail -n +2 "../inference/output/spec_inference_llama.txt")
+    diff <(tail -n +2 "../inference/output/spec_inference_opt_tp.txt") <(tail -n +2 "../inference/output/spec_inference_opt.txt")
+    diff <(tail -n +2 "../inference/output/spec_inference_llama_half_tp.txt") <(tail -n +2 "../inference/output/spec_inference_llama_half.txt")
     diff <(tail -n +2 "../inference/output/spec_inference_opt_half_tp.txt") <(tail -n +2 "../inference/output/spec_inference_opt_half.txt")
     diff <(tail -n +2 "../inference/output/incr_decoding_llama_160M_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_llama_160M.txt")
-    diff <(tail -n +2 "../inference/output/incr_decoding_llama_160M_half_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_llama_160M_half.txt")
+    # diff <(tail -n +2 "../inference/output/incr_decoding_llama_160M_half_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_llama_160M_half.txt")
+    diff <(tail -n +2 "../inference/output/incr_decoding_llama_7B_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_llama_7B.txt")
     diff <(tail -n +2 "../inference/output/incr_decoding_llama_7B_half_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_llama_7B_half.txt")
     diff <(tail -n +2 "../inference/output/incr_decoding_opt_125M_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_opt_125M.txt")
     diff <(tail -n +2 "../inference/output/incr_decoding_opt_125M_half_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_opt_125M_half.txt")
+    diff <(tail -n +2 "../inference/output/incr_decoding_opt_6B_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_opt_6B.txt")
     diff <(tail -n +2 "../inference/output/incr_decoding_opt_6B_half_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_opt_6B_half.txt")
 fi
 

From e47a1795045c2fc4a0fe4fe54ab87bd601069d55 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 30 Jun 2023 15:01:33 +0800
Subject: [PATCH 161/344] Revert "[Inference] fix bug when init_length +
 beam_depth > max_num_tokens" (#821)

---
 .../cpp/inference/mixture_of_experts/moe.h    |  4 ++--
 include/flexflow/inference.h                  |  1 -
 inference/spec_infer/spec_infer.cc            |  7 +++---
 src/runtime/request_manager.cc                | 23 ++-----------------
 4 files changed, 7 insertions(+), 28 deletions(-)

diff --git a/examples/cpp/inference/mixture_of_experts/moe.h b/examples/cpp/inference/mixture_of_experts/moe.h
index 4fdd3b2e3f..183229bc07 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.h
+++ b/examples/cpp/inference/mixture_of_experts/moe.h
@@ -22,9 +22,9 @@ struct MoeConfig : InferenceConfig {
   MoeConfig(void) : InferenceConfig() {
     //----------------------- MoE layer --------------------------------
     // total number of experts
-    num_exp = 64;
+    num_exp = 128;
     // number of experts in each block of fused experts
-    experts_per_block = 16;
+    experts_per_block = 32;
     // number of experts to route each token to
     num_select = 2;
     // expert capacity parameters
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index ca3a61592f..1fd2fdff78 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -130,7 +130,6 @@ class RequestManager {
           &inputSerializedTree,
       std::vector<std::pair<BatchConfig::TokenId, int>> const
           &outputSerializedTree);
-  int get_requests_init_length(BeamSearchBatchConfig const &old_bc);
 
   static void
       load_tokens_task(Legion::Task const *task,
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 2f581b7c34..fbb07b2b25 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -306,16 +306,15 @@ void FlexFlow::top_level_task(Task const *task,
 
     for (int i = 0; i < num_ssms; i++) {
       while (true) {
-        depth = beam_bc_vec[i].current_depth_all_requests();
+        beam_bc = beam_bc_vec[i];
+        depth = beam_bc.beamRequestsInfo[0].current_depth;
 
         FutureMap fm = im.inference(rm.get_model(0), 0, beam_bc_vec[i]);
         assert(fm.get_future_map_domain().get_volume() == 1);
         Future future = fm.get_future(0);
         BeamInferenceResult beam_ir = future.get_result<BeamInferenceResult>();
 
-        if (depth - 1 >= beam_bc_vec[i].max_beam_depth_all_requests() ||
-            depth + 1 + rm.get_requests_init_length(beam_bc_vec[i]) >=
-                BatchConfig::MAX_NUM_TOKENS) {
+        if (depth - 1 >= BeamSearchBatchConfig::MAX_BEAM_DEPTH) {
           break;
         } else {
           beam_bc_vec[i] = rm.prepare_next_batch_beam(beam_bc_vec[i], beam_ir);
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 2211a8df78..56b9bf6241 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -334,25 +334,6 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
 
 /* ----- Speculative Inference Specific functions ----- */
 
-int RequestManager::get_requests_init_length(
-    BeamSearchBatchConfig const &old_bc) {
-  int init_length = 0;
-  for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
-    if (old_bc.request_completed[i]) {
-      continue;
-    }
-    Request &request =
-        running_request_queue[old_bc.requestsInfo[i].request_guid];
-    if (old_bc.requestsInfo[i].token_start_offset + 1 >=
-        request.tokens.size()) {
-      init_length = 0;
-    } else if (request.initial_len > init_length) {
-      init_length = request.initial_len;
-    }
-  }
-  return init_length;
-}
-
 // update beam search metadata
 BeamSearchBatchConfig
     RequestManager::prepare_next_batch_beam(BeamSearchBatchConfig const &old_bc,
@@ -364,7 +345,7 @@ BeamSearchBatchConfig
   if (verbose) {
     std::cout << "print all results"
               << "\n";
-    for (int i = 0; i < 64; i++) {
+    for (int i = 0; i < 40; i++) {
       std::cout << result.token_ids[i] << ", ";
     }
     std::cout << "Current Beam Depth: "
@@ -423,7 +404,7 @@ BeamSearchBatchConfig
       new_bc.beamRequestsInfo[i].beam_size =
           old_bc.beamRequestsInfo[i].beam_size;
       new_bc.beamRequestsInfo[i].max_depth =
-          old_bc.beamRequestsInfo[i].current_depth;
+          old_bc.beamRequestsInfo[i].max_depth;
 
       // do the slot exchange to minimize the cache exchange in kernel.
       std::cout << "update metadata" << std::endl;

From d038e946e4e0dd5fdf4048e698767b447425dda0 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 5 Jul 2023 14:41:31 -0400
Subject: [PATCH 162/344] Merge `master` branch into `inference` (#835)

* Fix directory in python example in INSTALL.md (#783)

* Remove incomplete sentence in readme (#784)

* Fix Code Color in README (#822)

Specify code block is Python to have correct coloring in second code block in README.md

* Update README.md (#824)

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>

* fix-link (#829)

Co-authored-by: Kate Unger <kateunger@sapling2.stanford.edu>

* Fix CUDA version in Docker image (11.7.0 to 11.7.1) (#833)

---------

Co-authored-by: Colin Unger <unger@stanford.edu>
Co-authored-by: Kate Unger <32380357+KateUnger@users.noreply.github.com>
Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
Co-authored-by: Kate Unger <kateunger@sapling2.stanford.edu>
Co-authored-by: DerrickYLJ <99985904+DerrickYLJ@users.noreply.github.com>
---
 INSTALL.md                             | 6 +++---
 README.md                              | 9 ++++-----
 docker/flexflow-environment/Dockerfile | 2 +-
 3 files changed, 8 insertions(+), 9 deletions(-)

diff --git a/INSTALL.md b/INSTALL.md
index b0f8133483..4165683370 100644
--- a/INSTALL.md
+++ b/INSTALL.md
@@ -90,11 +90,11 @@ To run the Python examples, you have two options: you can use the `flexflow_pyth
 * `export PYTHONPATH="${FF_HOME}/python:${FF_HOME}/build/python"`
 * `export FF_USE_NATIVE_PYTHON=1`
 
-**We recommend that you run the `mnist_mlp` test under `native` using the following cmd to check if FlexFlow has been installed correctly:**
+**We recommend that you run the** `mnist_mlp` **test under** `native` **using the following cmd to check if FlexFlow has been installed correctly:**
 
 ```
-cd python
-./flexflow_python examples/python/native/mnist_mlp.py -ll:py 1 -ll:gpu 1 -ll:fsize <size of gpu buffer> -ll:zsize <size of zero buffer>
+cd "$FF_HOME"
+./python/flexflow_python examples/python/native/mnist_mlp.py -ll:py 1 -ll:gpu 1 -ll:fsize <size of gpu buffer> -ll:zsize <size of zero buffer>
 ```
 A script to run all the Python examples is available at `tests/multi_gpu_tests.sh`
 
diff --git a/README.md b/README.md
index 0420f8f902..c26904749d 100644
--- a/README.md
+++ b/README.md
@@ -4,7 +4,7 @@
 FlexFlow is a deep learning framework that accelerates distributed DNN training by automatically searching for efficient parallelization strategies. FlexFlow provides a drop-in replacement for PyTorch and TensorFlow Keras. Running existing PyTorch and Keras programs in FlexFlow only requires [a few lines of changes to the program](https://flexflow.ai/keras).
 
 ## Install FlexFlow
-To install FlexFlow from source code, please read the [instructions](INSTALL.md). If you would like to quickly try FlexFlow, we also provide pre-built Docker packages ([flexflow-cuda](https://github.com/flexflow/FlexFlow/pkgs/container/flexflow-cuda) with a CUDA backend, [flexflow-hip_rocm](https://github.com/flexflow/FlexFlow/pkgs/container/flexflow-hip_rocm) with a HIP-ROCM backend) with all dependencies pre-installed (N.B.: currently, the CUDA pre-built containers are only fully compatible with host machines that have CUDA 11.7 installed), together with [Dockerfiles](./docker) if you wish to build the containers manually. You can also use `conda` to install the FlexFlow Python package (coming soon).
+To install FlexFlow from source code, please read the [instructions](https://flexflow.readthedocs.io/en/latest/installation.html). If you would like to quickly try FlexFlow, we also provide pre-built Docker packages ([flexflow-cuda](https://github.com/flexflow/FlexFlow/pkgs/container/flexflow-cuda) with a CUDA backend, [flexflow-hip_rocm](https://github.com/flexflow/FlexFlow/pkgs/container/flexflow-hip_rocm) with a HIP-ROCM backend) with all dependencies pre-installed (N.B.: currently, the CUDA pre-built containers are only fully compatible with host machines that have CUDA 11.7 installed), together with [Dockerfiles](./docker) if you wish to build the containers manually. You can also use `conda` to install the FlexFlow Python package (coming soon).
 
 ## PyTorch Support
 Users can also use FlexFlow to optimize the parallelization performance of existing PyTorch models in two steps. First, a PyTorch model can be exported to the FlexFlow model format using `flexflow.torch.fx.torch_to_flexflow`.
@@ -18,7 +18,7 @@ fx.torch_to_flexflow(model, "mymodel.ff")
 
 Second, a FlexFlow program can directly import a previously saved PyTorch model and [autotune](https://www.usenix.org/conference/osdi22/presentation/unger) the parallelization performance for a given parallel machine.
 
-```
+```python
 from flexflow.pytorch.model import PyTorchModel
 
 def top_level_task():
@@ -39,7 +39,7 @@ FlexFlow prioritizes PyTorch compatibility, but also includes frontends for [Ten
 ## C++ Interface
 For users that prefer to program in C/C++. FlexFlow supports a C++ program inference that is equivalent to its Python APIs.
 
-**More FlexFlow C++ examples**: see the [C++ examples folder](https://github.com/flexflow/FlexFlow/tree/master/examples/c++).
+**More FlexFlow C++ examples**: see the [C++ examples folder](https://github.com/flexflow/FlexFlow/tree/master/examples/cpp).
 
 
 ## Command-Line Flags
@@ -69,12 +69,11 @@ Performance auto-tuning flags:
 For performance tuning related flags: see [performance autotuning](https://flexflow.ai/search).
 
 ## Contributing
+
 Please let us know if you encounter any bugs or have any suggestions by [submitting an issue](https://github.com/flexflow/flexflow/issues).
 
 We welcome all contributions to FlexFlow from bug fixes to new features and extensions.
 
-Please subscribe to the FlexFlow users mailing list for 
-
 ## Citations
 * Colin Unger, Zhihao Jia, Wei Wu, Sina Lin, Mandeep Baines, Carlos Efrain Quintero Narvaez, Vinay Ramakrishnaiah, Nirmal Prajapati, Pat McCormick, Jamaludin Mohd-Yusof, Xi Luo, Dheevatsa Mudigere, Jongsoo Park, Misha Smelyanskiy, and Alex Aiken. [Unity: Accelerating DNN Training Through Joint Optimization of Algebraic Transformations and Parallelization](https://www.usenix.org/conference/osdi22/presentation/unger). In Proceedings of the Symposium on Operating Systems Design and Implementation (OSDI), July 2022. 
 
diff --git a/docker/flexflow-environment/Dockerfile b/docker/flexflow-environment/Dockerfile
index 598690a8a7..43c1599d0f 100644
--- a/docker/flexflow-environment/Dockerfile
+++ b/docker/flexflow-environment/Dockerfile
@@ -1,4 +1,4 @@
-FROM nvidia/cuda:11.7.0-cudnn8-devel-ubuntu20.04
+FROM nvidia/cuda:11.7.1-cudnn8-devel-ubuntu20.04
 
 LABEL org.opencontainers.image.source=https://github.com/flexflow/FlexFlow
 LABEL org.opencontainers.image.description="FlexFlow environment container"

From 869d166916c7167eb9dea39d63419e4163990453 Mon Sep 17 00:00:00 2001
From: zwang86 <46699021+zwang86@users.noreply.github.com>
Date: Fri, 7 Jul 2023 20:11:07 -0400
Subject: [PATCH 163/344] Fixation. (#840)

---
 include/flexflow/batch_config.h    | 1 +
 inference/spec_infer/spec_infer.cc | 6 +++++-
 src/runtime/request_manager.cc     | 4 ++++
 3 files changed, 10 insertions(+), 1 deletion(-)

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index b56466bfe5..61a1e345ae 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -116,6 +116,7 @@ class BeamSearchBatchConfig : public BatchConfig {
   inline static int const MAX_BEAM_DEPTH = 8;
 
   int model_id;
+  int max_init_length = 0;
 
   struct BeamSearchPerRequestInfo {
     int beam_size;
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index fbb07b2b25..e5a6c8d5e6 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -314,7 +314,11 @@ void FlexFlow::top_level_task(Task const *task,
         Future future = fm.get_future(0);
         BeamInferenceResult beam_ir = future.get_result<BeamInferenceResult>();
 
-        if (depth - 1 >= BeamSearchBatchConfig::MAX_BEAM_DEPTH) {
+        int iteration =
+            std::min(BeamSearchBatchConfig::MAX_BEAM_DEPTH,
+                     BatchConfig::MAX_SEQ_LENGTH - beam_bc.max_init_length);
+
+        if (depth - 1 >= iteration) {
           break;
         } else {
           beam_bc_vec[i] = rm.prepare_next_batch_beam(beam_bc_vec[i], beam_ir);
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 56b9bf6241..b47b17ad12 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -357,6 +357,7 @@ BeamSearchBatchConfig
 
   // Step 2: preparing the next batch for existing requests
   BeamSearchBatchConfig new_bc;
+  new_bc.max_init_length = 0;
   new_bc.model_id = old_bc.model_id;
   std::cout << "old_bc.model_id: " << old_bc.model_id << "\n";
 
@@ -634,12 +635,15 @@ BeamSearchBatchConfig
   }
 
   // Step 2: Initialize new request
+  new_bc.max_init_length = 0;
   for (int i = 0; i < BeamSearchBatchConfig::MAX_NUM_REQUESTS; i++) {
     if (new_bc.request_completed[i]) {
       if (!pending_request_queue.empty() &&
           new_bc.num_tokens < BeamSearchBatchConfig::MAX_NUM_TOKENS) {
         Request new_request = pending_request_queue.front();
         pending_request_queue.pop();
+        new_bc.max_init_length =
+            std::max(new_bc.max_init_length, new_request.initial_len);
         running_request_queue[new_request.guid] = new_request;
         new_bc.requestsInfo[i].token_start_offset = 0;
         new_bc.requestsInfo[i].request_guid = new_request.guid;

From 93e3896d219496fee4b2b3c4518e20b32c51748f Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sat, 8 Jul 2023 09:21:04 -0400
Subject: [PATCH 164/344] [Inference] - Save output of inference test as an
 artifact (#845)

---
 .github/workflows/gpu-ci.yml | 9 +++++++++
 tests/inference_tests.sh     | 2 +-
 2 files changed, 10 insertions(+), 1 deletion(-)

diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index bdbb8a751b..699ca9fc11 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -182,6 +182,15 @@ jobs:
           # Inference tests
           export TENSOR_PARALLELISM_TESTS=ON
           ./tests/inference_tests.sh
+          cd inference
+          tar -zcvf output.tar.gz ./output
+          cd ..
+
+      - name: Save inference output as an artifact
+        uses: actions/upload-artifact@v3
+        with:
+          name: output
+          path: inference/output.tar.gz
 
   gpu-ci-flexflow:
     name: Single Machine, Multiple GPUs Tests
diff --git a/tests/inference_tests.sh b/tests/inference_tests.sh
index 3e0d7cac53..761c6cf332 100755
--- a/tests/inference_tests.sh
+++ b/tests/inference_tests.sh
@@ -207,4 +207,4 @@ diff <(tail -n +2 "../inference/output/huggingface_opt_125M_half.txt") <(tail -n
 ###############################################################################################
 
 # Clean up after test
-cleanup
+# cleanup

From 53c5617a8e5149ca1475978f391e4eb73c3434c5 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Sun, 9 Jul 2023 21:53:47 -0500
Subject: [PATCH 165/344] Using AllReduce instead of Reduce + Replicate when
 tensor model parallelism is enabled (#813)

* [AllReduce] initial implementation

* checkpoint

* format

* fusion

* support half precision in fusedop

* format

* checkpoint

* bug fixes

* fix a performance issue in linear inference

* fix

* fix

* fix specinfer and incr decoding

* update readme

* default data_parallelism_degree=1

* fix fusion

* reduce unnecessary calculation.

* makefile & rocm cmake fixes

* only compare first 30 tokens in half precision

* fix test script

* check incr decoding steps instead of latency

* hip rocm fix

* makefile fix

* more inference test fixes

* update fusedop to support specinfer

* fix rocm linking issue

---------

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
Co-authored-by: xinhaoc <chengxh_98@163.com>
---
 .github/README.md                             |   5 +-
 .../cpp/inference/mixture_of_experts/moe.cc   |   3 +-
 .../inference/transformers/transformers.cc    |   3 +-
 include/flexflow/config.h                     |  11 +-
 include/flexflow/ffconst.h                    |   2 +
 include/flexflow/fftype.h                     |   7 +-
 include/flexflow/inference.h                  |   4 +-
 include/flexflow/model.h                      |  13 +
 include/flexflow/operator_params.h            |   2 +
 include/flexflow/ops/arg_topk.h               |   9 +-
 include/flexflow/ops/arg_topk_params.h        |   2 +
 include/flexflow/ops/element_binary.h         |  10 +-
 include/flexflow/ops/element_binary_params.h  |   2 +
 include/flexflow/ops/fused.h                  |  13 +
 include/flexflow/ops/kernels/linear_kernels.h |   1 -
 include/flexflow/ops/layer_norm.h             |   8 +-
 include/flexflow/ops/linear.h                 |   4 +
 include/flexflow/parallel_ops/allreduce.h     |  70 +++
 .../flexflow/parallel_ops/allreduce_params.h  |  21 +
 include/flexflow/parallel_ops/combine.h       |  14 +
 .../parallel_ops/kernels/allreduce_kernels.h  |  31 ++
 .../parallel_ops/kernels/combine_kernels.h    |   1 +
 include/flexflow/utils/cuda_helper.h          |   6 +
 inference/incr_decoding/incr_decoding.cc      |  14 +-
 inference/models/falcon.cc                    |  27 +-
 inference/models/llama.cc                     |  37 +-
 inference/models/llama.h                      |   1 -
 inference/models/opt.cc                       |  47 +-
 inference/models/opt.h                        |   1 -
 inference/spec_infer/spec_infer.cc            |  23 +-
 src/ops/arg_topk.cc                           |  27 +-
 src/ops/arg_topk.cpp                          |   7 +-
 src/ops/arg_topk.cu                           |   8 +-
 src/ops/beam_topk.cc                          |   6 +-
 src/ops/conv_2d.cc                            |   6 +-
 src/ops/element_binary.cc                     |  61 ++-
 src/ops/element_unary.cc                      |   6 +-
 src/ops/experts.cc                            |   6 +-
 src/ops/fused.cc                              | 155 +++++-
 src/ops/fused.cpp                             | 417 +++++++++++++++++
 src/ops/fused.cu                              | 442 +++++++++++++++++-
 src/ops/gather.cc                             |   6 +-
 src/ops/inc_multihead_self_attention.cu       |   2 +-
 src/ops/kernels/linear_kernels.cpp            |  37 +-
 src/ops/kernels/linear_kernels.cu             |  39 +-
 src/ops/layer_norm.cc                         |  74 +--
 src/ops/layer_norm.cpp                        |   8 +-
 src/ops/layer_norm.cu                         |   8 +-
 src/ops/linear.cc                             |  83 +++-
 src/ops/reduce.cc                             |   6 +-
 src/ops/reshape.cc                            |   6 +-
 src/ops/rms_norm.cc                           |  23 +-
 src/ops/tree_inc_multihead_self_attention.cu  |   2 +-
 src/parallel_ops/allreduce.cc                 | 362 ++++++++++++++
 src/parallel_ops/combine.cc                   | 121 ++++-
 .../kernels/allreduce_kernels.cpp             |  46 ++
 src/parallel_ops/kernels/allreduce_kernels.cu |  56 +++
 src/parallel_ops/kernels/combine_kernels.cpp  |   6 +
 src/parallel_ops/kernels/combine_kernels.cu   |   6 +
 src/runtime/cuda_helper.cu                    |  24 +
 src/runtime/ffconst_utils.cc                  |   2 +
 src/runtime/fftype.cc                         |  14 +-
 src/runtime/graph.cc                          | 124 +++--
 src/runtime/hip_helper.cpp                    |  17 +-
 src/runtime/inference_manager.cc              | 151 +++---
 src/runtime/layer.cc                          |  10 +-
 src/runtime/model.cc                          | 128 ++++-
 src/runtime/operator_params.cc                |   3 +
 src/runtime/request_manager.cc                |   4 +
 src/runtime/substitution.cc                   |  21 +-
 tests/inference_tests.sh                      | 169 ++++---
 71 files changed, 2605 insertions(+), 486 deletions(-)
 create mode 100644 include/flexflow/parallel_ops/allreduce.h
 create mode 100644 include/flexflow/parallel_ops/allreduce_params.h
 create mode 100644 include/flexflow/parallel_ops/kernels/allreduce_kernels.h
 create mode 100644 src/parallel_ops/allreduce.cc
 create mode 100644 src/parallel_ops/kernels/allreduce_kernels.cpp
 create mode 100644 src/parallel_ops/kernels/allreduce_kernels.cu

diff --git a/.github/README.md b/.github/README.md
index 576b1ca84e..c4f220e222 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -44,7 +44,10 @@ The source code of the SpecInfer pipeline is available at [this folder](../infer
 * `-ssm-weight`: path to the folder that stores the small speculative models' weights. The number of `-ssm-weight`s must match the number of `-ssm-model`s and `-ssm-config`s.
 * `-ssm-config`: path to the json file that stores the SSM model configs. The number of `-ssm-config`s must match the number of `-ssm-model`s and `-ssm-weight`s.
 * `-tokenizer`: path to the tokenizer file (see [Tokenizers](#tokenizers) for preparing a tokenizer for SpecInfer).
+* `-data-parallelism-degree`, `-tensor-parallelism-degree` and `-pipeline-parallelism-degree`: parallelization degrees in the data, tensor, and pipeline dimensions. Their product must equal the number of GPUs available on the machine. When any of the three parallelism degree arguments is omitted, a default value of 1 will be used. 
 * `-prompt`: (optional) path to the prompt file. SpecInfer expects a json format file for prompts, all of which will be served by SpecInfer. In addition, users can also use the following API for registering requests:
+* `-output-file`: (optional) filepath to use to save the output of the model, together with the generation latency
+
 
 ```c++
 class RequestManager {
@@ -54,7 +57,7 @@ class RequestManager {
 For example, you can use the following command line to serve a LLaMA-7B or LLaMA-13B model on 4 GPUs and use two collectively boost-tuned LLaMA-190M models for speculative inference.
 
 ```bash
-./inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight /path/to/llm/weights -llm-config /path/to/llm/config.json -ssm-model llama -ssm-weight /path/to/ssm1/weights -ssm-config /path/to/ssm/config.json -ssm-model llama -smm-weight /path/to/ssm2/weights -ssm-config /path/to/ssm2/config.json -tokenizer /path/to/tokenizer.model -prompt /path/to/prompt.json --use-full-precision
+./inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight /path/to/llm/weights -llm-config /path/to/llm/config.json -ssm-model llama -ssm-weight /path/to/ssm1/weights -ssm-config /path/to/ssm/config.json -ssm-model llama -smm-weight /path/to/ssm2/weights -ssm-config /path/to/ssm2/config.json -tokenizer /path/to/tokenizer.model -prompt /path/to/prompt.json --use-full-precision -tensor-parallelism-degree 2 -pipeline-parallelism-degree 2
 ```
 
 ### Tokenizers
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index 39459d63ac..ff3f6bb53a 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -140,8 +140,7 @@ void FlexFlow::top_level_task(Task const *task,
 
   //------------------- Initialize the inference manager ------------------
   InferenceManager im(ff.config, moeConfig.batch_size);
-  std::unordered_map<Tensor, std::vector<MachineView>> mapping;
-  im.compile_model_and_allocate_buffer(&ff, mapping);
+  im.compile_model_and_allocate_buffer(&ff);
   im.init_operators_inference(&ff);
 
   //------------ Initialize the data loader and data generator ------------
diff --git a/examples/cpp/inference/transformers/transformers.cc b/examples/cpp/inference/transformers/transformers.cc
index d56473c8bd..074e832d47 100644
--- a/examples/cpp/inference/transformers/transformers.cc
+++ b/examples/cpp/inference/transformers/transformers.cc
@@ -115,8 +115,7 @@ void FlexFlow::top_level_task(Task const *task,
 
   //------------------- Initialize the inference manager ------------------
   InferenceManager im(ff.config, transformerConfig.batch_size);
-  std::unordered_map<Tensor, std::vector<MachineView>> mapping;
-  im.compile_model_and_allocate_buffer(&ff, mapping);
+  im.compile_model_and_allocate_buffer(&ff);
   im.init_operators_inference(&ff);
 
   //------------ Initialize the data loader and data generator ------------
diff --git a/include/flexflow/config.h b/include/flexflow/config.h
index f1b218e50f..be6c0d21da 100644
--- a/include/flexflow/config.h
+++ b/include/flexflow/config.h
@@ -37,14 +37,15 @@ namespace FlexFlow {
 // ========================================================
 // Define Runtime Constants
 // ========================================================
-#define MAX_NUM_INPUTS 256
-#define MAX_NUM_WEIGHTS 64
-#define MAX_NUM_OUTPUTS 256
-#define MAX_NUM_FUSED_OPERATORS 64
-#define MAX_NUM_FUSED_TENSORS 64
+#define MAX_NUM_INPUTS 2048
+#define MAX_NUM_WEIGHTS 2048
+#define MAX_NUM_OUTPUTS 2048
+#define MAX_NUM_FUSED_OPERATORS 2048
+#define MAX_NUM_FUSED_TENSORS 2048
 #define MAX_NUM_WORKERS 1024
 #define MAX_FILENAME 200
 #define MAX_OPNAME 128
+#define MAX_NUM_TRANSFORMER_LAYERS 100
 // DataLoader
 #define MAX_SAMPLES_PER_LOAD 64
 #define MAX_FILE_LENGTH 128
diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index 0b572a9674..3d899ac91d 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -173,6 +173,7 @@ enum OperatorType {
   OP_REPLICATE,
   OP_REDUCTION,
   OP_PIPELINE,
+  OP_ALLREDUCE,
   OP_FUSED_PARALLEL,
   OP_INVALID,
 };
@@ -207,6 +208,7 @@ enum PMParameter {
   PM_COMBINE_DEGREE,     // Combine
   PM_REDUCTION_DIM,      // Reduction
   PM_REDUCTION_DEGREE,   // Reduction
+  PM_ALLREDUCE_DIM,      // AllReduce
   PM_SOFTMAX_DIM,        // Softmax
   PM_NUM_HEADS,          // MultiHeadAttention
   PM_INVALID,
diff --git a/include/flexflow/fftype.h b/include/flexflow/fftype.h
index a71c85dbc8..18ed6b8100 100644
--- a/include/flexflow/fftype.h
+++ b/include/flexflow/fftype.h
@@ -8,15 +8,16 @@ namespace FlexFlow {
 
 class LayerID {
 public:
+  static const LayerID NO_ID;
   LayerID();
-  LayerID(size_t id);
+  LayerID(size_t id, size_t transformer_layer_id);
   bool is_valid_id() const;
   friend bool operator==(LayerID const &lhs, LayerID const &rhs);
 
 public:
-  size_t id;
+  size_t id, transformer_layer_id;
 };
 
 }; // namespace FlexFlow
 
-#endif // _FF_TYPE_H
\ No newline at end of file
+#endif // _FF_TYPE_H
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index 1fd2fdff78..a1846c96dc 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -29,9 +29,7 @@ using tokenizers::Tokenizer;
 class InferenceManager {
 public:
   InferenceManager(FFConfig const &config, int max_num_tokens_per_batch);
-  void compile_model_and_allocate_buffer(
-      FFModel *model,
-      std::unordered_map<Tensor, std::vector<MachineView>> const &mapping);
+  void compile_model_and_allocate_buffer(FFModel *model);
   void init_operators_inference(FFModel *model);
   MachineView *get_machine_view(int mv_id);
   Legion::FutureMap inference(FFModel *model, int index, BatchConfig const &bc);
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 1277b29b3d..2b95eecac0 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -104,6 +104,7 @@ enum TaskIDs {
   LAYERNORM_BWD_TASK_ID,
   LINEAR_INIT_TASK_ID,
   LINEAR_INIT_PARA_TASK_ID,
+  LINEAR_INF_TASK_ID,
   LINEAR_FWD_TASK_ID,
   LINEAR_BWD_TASK_ID,
   LINEAR_BWD2_TASK_ID,
@@ -159,6 +160,7 @@ enum TaskIDs {
   FUSEDOP_INIT_TASK_ID,
   FUSEDOP_FWD_TASK_ID,
   FUSEDOP_BWD_TASK_ID,
+  FUSEDOP_INF_TASK_ID,
   NOOP_INIT_TASK_ID,
   // Metrics tasks
   METRICS_COMP_TASK_ID,
@@ -212,6 +214,9 @@ enum TaskIDs {
   PIPELINE_INIT_TASK_ID,
   PIPELINE_FWD_TASK_ID,
   PIPELINE_BWD_TASK_ID,
+  ALLREDUCE_INIT_TASK_ID,
+  ALLREDUCE_FWD_TASK_ID,
+  ALLREDUCE_BWD_TASK_ID,
   FUSED_PARALLELOP_INIT_TASK_ID,
   FUSED_PARALLELOP_FWD_TASK_ID,
   FUSED_PARALLELOP_BWD_TASK_ID,
@@ -311,6 +316,7 @@ class Combine;
 class Repartition;
 class Reduction;
 class Replicate;
+class AllReduce;
 class FusedParallelOp;
 class ParallelOpInfo;
 
@@ -897,6 +903,9 @@ class FFModel {
                           std::vector<Legion::PhysicalRegion> const &regions,
                           Legion::Context ctx,
                           Legion::Runtime *runtime);
+  // ========================================
+  // Internal APIs that should not be invoked from applications
+  // ========================================
   void reset_metrics();
   void init_operators();
   void init_operators_inference(
@@ -919,6 +928,7 @@ class FFModel {
                std::vector<MetricsType> const &metrics,
                CompMode comp_mode = COMP_MODE_TRAINING);
   void compile_inference();
+  void set_transformer_layer_id(int id);
   void graph_optimize(size_t budget,
                       bool only_data_parallel,
                       std::unique_ptr<PCG::Graph> &best_graph,
@@ -975,6 +985,7 @@ class FFModel {
 public:
   size_t op_global_guid, layer_global_guid;
   size_t tensor_global_guid, parallel_tensor_global_guid, node_global_guid;
+  size_t current_transformer_layer_id;
   FFConfig config;
   FFIterationConfig iter_config;
   Optimizer *optimizer;
@@ -1078,6 +1089,8 @@ class FFModel {
                          Reduction *>,
       std::unordered_map<std::pair<ParallelTensorShape, CombineParams>,
                          Combine *>,
+      std::unordered_map<std::pair<ParallelTensorShape, AllReduceParams>,
+                         AllReduce *>,
       std::unordered_map<std::pair<ParallelTensorShape, FusedParallelOpParams>,
                          FusedParallelOp *>>
       cached_ops;
diff --git a/include/flexflow/operator_params.h b/include/flexflow/operator_params.h
index 8c52dfb584..f6918ff581 100644
--- a/include/flexflow/operator_params.h
+++ b/include/flexflow/operator_params.h
@@ -32,6 +32,7 @@
 #include "flexflow/ops/topk_params.h"
 #include "flexflow/ops/transpose_params.h"
 #include "flexflow/ops/tree_inc_multihead_self_attention_params.h"
+#include "flexflow/parallel_ops/allreduce_params.h"
 #include "flexflow/parallel_ops/combine_params.h"
 #include "flexflow/parallel_ops/fused_parallel_op_params.h"
 #include "flexflow/parallel_ops/partition_params.h"
@@ -76,6 +77,7 @@ using OperatorParameters = mp::variant<AggregateParams,
                                        ReplicateParams,
                                        ReductionParams,
                                        CombineParams,
+                                       AllReduceParams,
                                        FusedParallelOpParams>;
 
 tl::optional<OperatorParameters> get_op_parameters(Op const *op);
diff --git a/include/flexflow/ops/arg_topk.h b/include/flexflow/ops/arg_topk.h
index a00ab76385..ed92200fbe 100644
--- a/include/flexflow/ops/arg_topk.h
+++ b/include/flexflow/ops/arg_topk.h
@@ -19,11 +19,15 @@ class ArgTopK : public Op {
   using Params = ArgTopKParams;
   using Input = ParallelTensor;
   ArgTopK(FFModel &model,
+          LayerID const &layer_guid,
           const ParallelTensor input,
           int k,
           bool sorted,
           char const *name);
-  ArgTopK(FFModel &model, ArgTopK const &other, const ParallelTensor input);
+  ArgTopK(FFModel &model,
+          LayerID const &layer_guid,
+          ArgTopK const &other,
+          const ParallelTensor input);
   ArgTopK(FFModel &model,
           Params const &params,
           Input const input,
@@ -80,7 +84,8 @@ class ArgTopK : public Op {
                              ffStream_t stream);
   static void forward_kernel_wrapper(ArgTopKMeta const *m,
                                      GenericTensorAccessorR const &input,
-                                     GenericTensorAccessorW const &indices);
+                                     GenericTensorAccessorW const &indices,
+                                     int batch_size);
   Params get_params() const;
 
 public:
diff --git a/include/flexflow/ops/arg_topk_params.h b/include/flexflow/ops/arg_topk_params.h
index ca88a5b9be..9d2a21034f 100644
--- a/include/flexflow/ops/arg_topk_params.h
+++ b/include/flexflow/ops/arg_topk_params.h
@@ -2,11 +2,13 @@
 #define _FLEXFLOW_ARG_TOPK_PARAMS_H
 
 #include "flexflow/ffconst.h"
+#include "flexflow/fftype.h"
 #include "flexflow/parallel_tensor.h"
 
 namespace FlexFlow {
 
 struct ArgTopKParams {
+  LayerID layer_guid;
   int k;
   bool sorted;
   bool is_valid(ParallelTensorShape const &) const;
diff --git a/include/flexflow/ops/element_binary.h b/include/flexflow/ops/element_binary.h
index 9c2e6c1252..fe7dc2602c 100644
--- a/include/flexflow/ops/element_binary.h
+++ b/include/flexflow/ops/element_binary.h
@@ -15,6 +15,7 @@ class ElementBinary : public Op {
   using Input = std::pair<ParallelTensor, ParallelTensor>;
 
   ElementBinary(FFModel &model,
+                LayerID const &layer_guid,
                 OperatorType type,
                 const ParallelTensor x,
                 const ParallelTensor y,
@@ -23,8 +24,7 @@ class ElementBinary : public Op {
   ElementBinary(FFModel &model,
                 Params const &params,
                 Input const &inputs,
-                char const *name = nullptr,
-                bool inplace_a = false);
+                char const *name = nullptr);
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
                       std::vector<ParallelTensor> const &,
@@ -63,6 +63,12 @@ class ElementBinary : public Op {
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
                              CostMetrics &cost_metrics) const override;
+
+  void serialize(Legion::Serializer &) const override;
+  static PCG::Node deserialize(FFModel &ff,
+                               Legion::Deserializer &d,
+                               ParallelTensor inputs[],
+                               int num_inputs);
   Params get_params() const;
 
 public:
diff --git a/include/flexflow/ops/element_binary_params.h b/include/flexflow/ops/element_binary_params.h
index 5aa20e25a5..8b26877af2 100644
--- a/include/flexflow/ops/element_binary_params.h
+++ b/include/flexflow/ops/element_binary_params.h
@@ -7,7 +7,9 @@
 namespace FlexFlow {
 
 struct ElementBinaryParams {
+  LayerID layer_guid;
   OperatorType type;
+  bool inplace_a;
 
   bool is_valid(
       std::pair<ParallelTensorShape, ParallelTensorShape> const &) const;
diff --git a/include/flexflow/ops/fused.h b/include/flexflow/ops/fused.h
index 87d35da902..87e562d143 100644
--- a/include/flexflow/ops/fused.h
+++ b/include/flexflow/ops/fused.h
@@ -29,8 +29,17 @@ class FusedOp : public Op {
     return ParallelTensor();
   }
   void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
@@ -38,6 +47,10 @@ class FusedOp : public Op {
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
                            Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
   static void forward_task(Legion::Task const *task,
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
diff --git a/include/flexflow/ops/kernels/linear_kernels.h b/include/flexflow/ops/kernels/linear_kernels.h
index 9644fd9c8f..29791b53ff 100644
--- a/include/flexflow/ops/kernels/linear_kernels.h
+++ b/include/flexflow/ops/kernels/linear_kernels.h
@@ -33,7 +33,6 @@ class LinearMeta : public OpMeta {
   RegularizerMode kernel_reg_type;
   float kernel_reg_lambda;
   bool use_bias, add_bias_only_once;
-  DataType input_type, weight_type, output_type;
   char op_name[MAX_OPNAME];
 };
 
diff --git a/include/flexflow/ops/layer_norm.h b/include/flexflow/ops/layer_norm.h
index b962edf326..b5a36262b4 100644
--- a/include/flexflow/ops/layer_norm.h
+++ b/include/flexflow/ops/layer_norm.h
@@ -72,14 +72,14 @@ class LayerNorm : public Op {
   static void forward_kernel(LayerNormMeta const *m,
                              T const *input_ptr,
                              T *output_ptr,
-                             T *gamma_ptr,
-                             T *beta_ptr,
+                             T const *gamma_ptr,
+                             T const *beta_ptr,
                              ffStream_t stream);
   static void forward_kernel_wrapper(LayerNormMeta const *m,
                                      GenericTensorAccessorR const &input,
                                      GenericTensorAccessorW &output,
-                                     GenericTensorAccessorW &gamma,
-                                     GenericTensorAccessorW &beta);
+                                     GenericTensorAccessorR const &gamma,
+                                     GenericTensorAccessorR const &beta);
   template <typename T>
   static void backward_kernel(LayerNormMeta const *m,
                               T const *output_grad_ptr,
diff --git a/include/flexflow/ops/linear.h b/include/flexflow/ops/linear.h
index 7b134502b7..ff6ba1ef90 100644
--- a/include/flexflow/ops/linear.h
+++ b/include/flexflow/ops/linear.h
@@ -62,6 +62,10 @@ class Linear : public Op {
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
                            Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
   static void forward_task(Legion::Task const *task,
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
diff --git a/include/flexflow/parallel_ops/allreduce.h b/include/flexflow/parallel_ops/allreduce.h
new file mode 100644
index 0000000000..2faf128d93
--- /dev/null
+++ b/include/flexflow/parallel_ops/allreduce.h
@@ -0,0 +1,70 @@
+#ifndef _FLEXFLOW_ALLREDUCE_H
+#define _FLEXFLOW_ALLREDUCE_H
+
+#include "flexflow/layer.h"
+#include "flexflow/node.h"
+#include "flexflow/op_meta.h"
+#include "flexflow/operator.h"
+#include "flexflow/parallel_ops/allreduce_params.h"
+#include "parallel_op.h"
+
+namespace FlexFlow {
+
+class AllReduce : public ParallelOp {
+public:
+  using Params = AllReduceParams;
+  using Input = ParallelTensor;
+
+  AllReduce(FFModel &model,
+            const ParallelTensor input,
+            int allreduce_legion_dim,
+            char const *name = NULL);
+  AllReduce(FFModel &model,
+            Params const &params,
+            Input const input,
+            char const *name = nullptr);
+  void create_input_partition(FFModel &model) override;
+  void create_input_partition_inference(
+      FFModel &model,
+      std::vector<ParallelTensor> const &batch_inputs,
+      std::vector<ParallelTensor> const &batch_outputs) override;
+  void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
+  void forward(FFModel const &) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfig const &bc,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
+  void backward(FFModel const &) override;
+  bool get_int_parameter(PMParameter, int *) const override;
+  bool append_parallel_op_info(
+      std::vector<ParallelOpInfo> &parallel_ops) const override;
+  static OpMeta *init_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static void forward_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static void backward_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
+  bool measure_operator_cost(Simulator *sim,
+                             MachineView const &pc,
+                             CostMetrics &cost_metrics) const override;
+
+  Params get_params() const;
+
+public:
+  int allreduce_dim;
+};
+
+}; // namespace FlexFlow
+
+#endif // _FLEXFLOW_ALLREDUCE_H
diff --git a/include/flexflow/parallel_ops/allreduce_params.h b/include/flexflow/parallel_ops/allreduce_params.h
new file mode 100644
index 0000000000..c04676ffeb
--- /dev/null
+++ b/include/flexflow/parallel_ops/allreduce_params.h
@@ -0,0 +1,21 @@
+#ifndef _FLEXFLOW_ALLREDUCE_PARAMS_H
+#define _FLEXFLOW_ALLREDUCE_PARAMS_H
+
+namespace FlexFlow {
+
+struct AllReduceParams {
+  int allreduce_legion_dim;
+  bool is_valid(ParallelTensorShape const &) const;
+};
+bool operator==(AllReduceParams const &, AllReduceParams const &);
+
+} // namespace FlexFlow
+
+namespace std {
+template <>
+struct hash<FlexFlow::AllReduceParams> {
+  size_t operator()(FlexFlow::AllReduceParams const &) const;
+};
+} // namespace std
+
+#endif // _FLEXFLOW_ALLREDUCE_PARAMS_H
diff --git a/include/flexflow/parallel_ops/combine.h b/include/flexflow/parallel_ops/combine.h
index 310e599f54..d09a789de2 100644
--- a/include/flexflow/parallel_ops/combine.h
+++ b/include/flexflow/parallel_ops/combine.h
@@ -3,6 +3,7 @@
 
 #include "flexflow/layer.h"
 #include "flexflow/node.h"
+#include "flexflow/op_meta.h"
 #include "flexflow/operator.h"
 #include "flexflow/parallel_ops/combine_params.h"
 #include "parallel_op.h"
@@ -24,8 +25,21 @@ class Combine : public ParallelOp {
           Input const input,
           char const *name = nullptr);
   void create_input_partition(FFModel &model) override;
+  void create_input_partition_inference(
+      FFModel &model,
+      std::vector<ParallelTensor> const &batch_inputs,
+      std::vector<ParallelTensor> const &batch_outputs) override;
   void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfig const &bc,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
   void backward(FFModel const &) override;
   bool get_int_parameter(PMParameter, int *) const override;
   bool append_parallel_op_info(
diff --git a/include/flexflow/parallel_ops/kernels/allreduce_kernels.h b/include/flexflow/parallel_ops/kernels/allreduce_kernels.h
new file mode 100644
index 0000000000..02a5026fcf
--- /dev/null
+++ b/include/flexflow/parallel_ops/kernels/allreduce_kernels.h
@@ -0,0 +1,31 @@
+#ifndef _FLEXFLOW_OPS_KERNELS_ALLREDUCE_KERNELS_H
+#define _FLEXFLOW_OPS_KERNELS_ALLREDUCE_KERNELS_H
+
+#include "flexflow/device.h"
+#include "flexflow/fftype.h"
+#include "flexflow/op_meta.h"
+#include "flexflow/parallel_ops/allreduce.h"
+
+namespace FlexFlow {
+
+class AllReduceMeta : public OpMeta {
+public:
+  AllReduceMeta(FFHandler handle, AllReduce const *reduct);
+};
+
+namespace Kernels {
+namespace AllReduce {
+
+void forward_kernel_wrapper(AllReduceMeta const *m,
+                            GenericTensorAccessorR const &input,
+                            GenericTensorAccessorW const &output);
+
+void backward_kernel_wrapper(AllReduceMeta const *m,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &output_grad);
+
+} // namespace AllReduce
+} // namespace Kernels
+} // namespace FlexFlow
+
+#endif // _FLEXFLOW_OPS_KERNELS_ALLREDUCE_KERNELS_H
diff --git a/include/flexflow/parallel_ops/kernels/combine_kernels.h b/include/flexflow/parallel_ops/kernels/combine_kernels.h
index 6f540679a2..456013cd81 100644
--- a/include/flexflow/parallel_ops/kernels/combine_kernels.h
+++ b/include/flexflow/parallel_ops/kernels/combine_kernels.h
@@ -4,6 +4,7 @@
 #include "flexflow/device.h"
 #include "flexflow/fftype.h"
 #include "flexflow/op_meta.h"
+#include "flexflow/parallel_ops/combine.h"
 
 namespace FlexFlow {
 
diff --git a/include/flexflow/utils/cuda_helper.h b/include/flexflow/utils/cuda_helper.h
index 5ac4571118..1787c5a0b7 100644
--- a/include/flexflow/utils/cuda_helper.h
+++ b/include/flexflow/utils/cuda_helper.h
@@ -4,6 +4,9 @@
 #include "legion.h"
 #include <cublas_v2.h>
 #include <cudnn.h>
+#ifdef FF_USE_NCCL
+#include <nccl.h>
+#endif
 
 #define FatalError(s)                                                          \
   do {                                                                         \
@@ -165,6 +168,9 @@ cudnnStatus_t
 
 cudaDataType_t ff_to_cuda_datatype(DataType type);
 cudnnDataType_t ff_to_cudnn_datatype(DataType type);
+#ifdef FF_USE_NCCL
+ncclDataType_t ff_to_nccl_datatype(DataType type);
+#endif
 
 cudaDataType_t cudnn_to_cuda_datatype(cudnnDataType_t type);
 cudnnDataType_t cuda_to_cudnn_datatype(cudaDataType_t type);
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index d43cab17f9..68a8e10042 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -126,7 +126,7 @@ void FlexFlow::top_level_task(Task const *task,
   bool verbose = false;
   size_t num_devices = ffconfig.workersPerNode * ffconfig.numNodes;
   int data_parallelism_degree = 1, tensor_parallelism_degree = 1,
-      pipeline_parallelism_degree = -1;
+      pipeline_parallelism_degree = 1;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
   char **argv = command_args.argv;
@@ -142,10 +142,10 @@ void FlexFlow::top_level_task(Task const *task,
                    pipeline_parallelism_degree);
   ffconfig.data_parallelism_degree = data_parallelism_degree;
   ffconfig.tensor_parallelism_degree = tensor_parallelism_degree;
-  ffconfig.pipeline_parallelism_degree =
-      pipeline_parallelism_degree == -1
-          ? num_devices / (tensor_parallelism_degree * data_parallelism_degree)
-          : pipeline_parallelism_degree;
+  ffconfig.pipeline_parallelism_degree = pipeline_parallelism_degree;
+  assert(data_parallelism_degree * tensor_parallelism_degree *
+             pipeline_parallelism_degree ==
+         ffconfig.numNodes * ffconfig.workersPerNode);
 
   assert(model_type != ModelType::UNKNOWN &&
          "Invalid LLM model type passed (or no type was passed).");
@@ -162,8 +162,6 @@ void FlexFlow::top_level_task(Task const *task,
                               im,
                               file_paths.llm_config_file_path,
                               file_paths.llm_weight_file_path,
-                              ffconfig.workersPerNode * ffconfig.numNodes /
-                                  tensor_parallelism_degree,
                               INC_DECODING_MODE,
                               use_full_precision);
   } else if (model_type == ModelType::OPT) {
@@ -171,8 +169,6 @@ void FlexFlow::top_level_task(Task const *task,
                           im,
                           file_paths.llm_config_file_path,
                           file_paths.llm_weight_file_path,
-                          ffconfig.workersPerNode * ffconfig.numNodes /
-                              tensor_parallelism_degree,
                           INC_DECODING_MODE,
                           use_full_precision);
   } else if (model_type == ModelType::FALCON) {
diff --git a/inference/models/falcon.cc b/inference/models/falcon.cc
index 7fc3124278..bced5dc1e0 100644
--- a/inference/models/falcon.cc
+++ b/inference/models/falcon.cc
@@ -28,20 +28,6 @@ void FALCON::create_falcon_model(FFModel &ff,
                                  bool use_full_precision) {
   Config falcon_config(model_config_file_path);
   falcon_config.printConfig();
-  //------------------------------compute machine views ------------------
-  int num_devices = ff.config.workersPerNode * ff.config.numNodes;
-  std::vector<MachineView> machine_views;
-  for (int i = 0; i < num_devices; i++) {
-    MachineView view;
-    view.device_type = MachineView::GPU;
-    view.ndims = 1;
-    view.dim[0] = 1;
-    view.stride[0] = 0;
-    view.start_device_id = i;
-    machine_views.push_back(view);
-  }
-
-  std::unordered_map<Tensor, std::vector<MachineView>> mapping;
   std::unordered_map<std::string, Layer *> weights_layers;
 
   Tensor input;
@@ -50,7 +36,6 @@ void FALCON::create_falcon_model(FFModel &ff,
     int const token_dims[] = {BatchConfig::MAX_NUM_TOKENS, 1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
-  mapping[input].push_back(machine_views[0]);
 
   Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
 
@@ -83,18 +68,12 @@ void FALCON::create_falcon_model(FFModel &ff,
       (num_transformer_layers + num_pipeline_stages - 1) / num_pipeline_stages;
 
   for (int i = 0; i < num_transformer_layers; i++) {
+    // set transformer layer id
+    ff.set_transformer_layer_id(i);
     // step 1: attention
     Tensor att_norm = ff.layer_norm(token, axes, true, falcon_config.norm_eps);
     Layer *attention_norm = ff.layers.back();
 
-    if (i % num_transformer_layers_per_stage == 0) {
-      // Map att_norm to the next GPU
-      // since the size of att_norm is minimum across
-      // all tensors
-      mapping[att_norm].push_back(
-          machine_views[i / num_transformer_layers_per_stage]);
-    }
-
     weights_layers.emplace("layers_" + std::to_string(i) +
                                "_input_layernorm_weight",
                            attention_norm);
@@ -162,7 +141,7 @@ void FALCON::create_falcon_model(FFModel &ff,
 
   // Compile the model
   std::cout << "------start compile ----------" << std::endl;
-  im.compile_model_and_allocate_buffer(&ff, mapping);
+  im.compile_model_and_allocate_buffer(&ff);
   FileDataLoader fileloader("",
                             weight_file_path,
                             falcon_config.n_heads,
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index 1e61f43a98..e54ec13147 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -23,7 +23,6 @@ void LLAMA::create_llama_model(FFModel &ff,
                                InferenceManager &im,
                                std::string const &model_config_file_path,
                                std::string const &weight_file_path,
-                               int num_pipeline_stages,
                                InferenceMode mode,
                                bool use_full_precision) {
   // do not apply cpu offload in beam search model.
@@ -62,7 +61,6 @@ void LLAMA::create_llama_model(FFModel &ff,
   }
   assert(machine_views.size() == num_devices);
 
-  std::unordered_map<Tensor, std::vector<MachineView>> mapping;
   std::unordered_map<std::string, Layer *> weights_layers;
 
   Tensor input;
@@ -71,10 +69,6 @@ void LLAMA::create_llama_model(FFModel &ff,
     int const token_dims[] = {BatchConfig::MAX_NUM_TOKENS, 1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
-  for (int i = 0; i < ff.config.data_parallelism_degree; i++) {
-    mapping[input].push_back(
-        machine_views[i * num_devices_per_data_parallelism_line]);
-  }
 
   Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
 
@@ -101,39 +95,14 @@ void LLAMA::create_llama_model(FFModel &ff,
   Layer *embedding = ff.layers.back();
   weights_layers.emplace("tok_embeddings_weight", embedding);
 
-  // int num_transformer_layers = llama_config.n_layers;
-  // int num_transformer_layers_per_stage =
-  //     (num_transformer_layers + num_pipeline_stages - 1) /
-  //     num_pipeline_stages;
-
   for (int i = 0; i < num_transformer_layers; i++) {
+    // set transformer layer id
+    ff.set_transformer_layer_id(i);
     // step 1: attention
     std::vector<int> axes = {2};
     Tensor att_norm =
         ff.rms_norm(token, llama_config.norm_eps, llama_config.dim);
     Layer *attention_norm = ff.layers.back();
-
-    // if (i % num_transformer_layers_per_stage == 0) {
-    //   // Map att_norm to the next GPU
-    //   // since the size of att_norm is minimum across
-    //   // all tensors
-    //   mapping[att_norm].push_back(
-    //       machine_views[i / num_transformer_layers_per_stage]);
-    // }
-    for (int dp_index = 0; dp_index < ff.config.data_parallelism_degree;
-         dp_index++) {
-      int pp_block_idx = i / num_layers_per_pp_block;
-      int first_device_idx = dp_index * num_devices_per_data_parallelism_line +
-                             ff.config.tensor_parallelism_degree * pp_block_idx;
-      // std::cout << "assigning layer " << i << " to devices " <<
-      // first_device_idx
-      //           << "-"
-      //           << first_device_idx + ff.config.tensor_parallelism_degree - 1
-      //           << std::endl;
-      assert(first_device_idx < num_devices);
-      mapping[att_norm].push_back(machine_views[first_device_idx]);
-    }
-
     weights_layers.emplace("layers_" + std::to_string(i) +
                                "_attention_norm_weight",
                            attention_norm);
@@ -246,7 +215,7 @@ void LLAMA::create_llama_model(FFModel &ff,
 
   // Compile the model
   std::cout << "------start compile ----------" << std::endl;
-  im.compile_model_and_allocate_buffer(&ff, mapping);
+  im.compile_model_and_allocate_buffer(&ff);
   FileDataLoader fileloader("",
                             weight_file_path,
                             llama_config.n_heads,
diff --git a/inference/models/llama.h b/inference/models/llama.h
index 11fc354a2c..ab9bd4c7f3 100644
--- a/inference/models/llama.h
+++ b/inference/models/llama.h
@@ -106,7 +106,6 @@ class LLAMA {
                                  InferenceManager &im,
                                  std::string const &model_config_file_path,
                                  std::string const &weight_file_path,
-                                 int num_pipeline_stages,
                                  InferenceMode mode,
                                  bool use_full_precision = false);
 };
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index 499eb92642..503be39672 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -23,7 +23,6 @@ void OPT::create_opt_model(FFModel &ff,
                            InferenceManager &im,
                            std::string const &model_config_file_path,
                            std::string const &weight_file_path,
-                           int num_pipeline_stages,
                            InferenceMode mode,
                            bool use_full_precision) {
   Config opt_config(model_config_file_path);
@@ -47,21 +46,6 @@ void OPT::create_opt_model(FFModel &ff,
   //           << num_devices_per_data_parallelism_line << std::endl;
   // std::cout << "num layers: " << opt_config.num_hidden_layers << std::endl;
 
-  //------------------------------compute machine views ------------------
-  // single device
-  std::vector<MachineView> machine_views;
-  for (int i = 0; i < num_devices; i++) {
-    MachineView view;
-    view.device_type = MachineView::GPU;
-    view.ndims = 1;
-    view.dim[0] = 1;
-    view.stride[0] = 0;
-    view.start_device_id = i;
-    machine_views.push_back(view);
-  }
-  assert(machine_views.size() == num_devices);
-
-  std::unordered_map<Tensor, std::vector<MachineView>> mapping;
   std::unordered_map<std::string, Layer *> weights_layers;
 
   //------------------------------ build the model --------------------------
@@ -72,12 +56,6 @@ void OPT::create_opt_model(FFModel &ff,
     input = ff.create_tensor<2>(token_dims, DT_INT32);
     position_input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
-  for (int i = 0; i < ff.config.data_parallelism_degree; i++) {
-    mapping[input].push_back(
-        machine_views[i * num_devices_per_data_parallelism_line]);
-    mapping[position_input].push_back(
-        machine_views[i * num_devices_per_data_parallelism_line]);
-  }
 
   Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
   std::vector<int> axes = {0};
@@ -127,9 +105,10 @@ void OPT::create_opt_model(FFModel &ff,
 
   Tensor residual = ff.add(token, positional_embedding);
 
-  int num_transformer_layers_per_stage =
-      (32 + num_pipeline_stages - 1) / num_pipeline_stages;
   for (int i = 0; i < opt_config.num_hidden_layers; i++) {
+    // set transformer layer id
+    ff.set_transformer_layer_id(i);
+
     // 125m, 1.7B, ..., 175B applies layer norm BEFORE attention,
     // 350m applies layer norm AFTER attention
     // https://github.com/huggingface/transformers/blob/main/src/transformers/models/opt/modeling_opt.py#LL324C1-L325C1
@@ -142,24 +121,6 @@ void OPT::create_opt_model(FFModel &ff,
                                "_attention_layer_norm_weight",
                            self_attn_layer_norm);
 
-    for (int dp_index = 0; dp_index < ff.config.data_parallelism_degree;
-         dp_index++) {
-      int pp_block_idx = i / num_layers_per_pp_block;
-      int first_device_idx = dp_index * num_devices_per_data_parallelism_line +
-                             ff.config.tensor_parallelism_degree * pp_block_idx;
-      // std::cout << "assigning layer " << i << " to devices " <<
-      // first_device_idx
-      //           << "-"
-      //           << first_device_idx + ff.config.tensor_parallelism_degree - 1
-      //           << std::endl;
-      assert(first_device_idx < num_devices);
-      mapping[hidden_states].push_back(machine_views[first_device_idx]);
-    }
-    // if (i % num_transformer_layers_per_stage == 0) {
-    //   mapping[hidden_states].push_back(
-    //       machine_views[i / num_transformer_layers_per_stage]);
-    // }
-
     Tensor mha;
     switch (mode) {
       case BEAM_SEARCH_MODE: {
@@ -279,7 +240,7 @@ void OPT::create_opt_model(FFModel &ff,
 
   //------------------- compile the model --------------------------------
   std::cout << "------start compile ----------" << std::endl;
-  im.compile_model_and_allocate_buffer(&ff, mapping);
+  im.compile_model_and_allocate_buffer(&ff);
   FileDataLoader fileloader("",
                             weight_file_path,
                             opt_config.num_attention_heads,
diff --git a/inference/models/opt.h b/inference/models/opt.h
index 77d9aae962..d5fa845cd5 100644
--- a/inference/models/opt.h
+++ b/inference/models/opt.h
@@ -108,7 +108,6 @@ class OPT {
                                InferenceManager &im,
                                std::string const &model_config_file_path,
                                std::string const &weight_file_path,
-                               int num_pipeline_stages,
                                InferenceMode mode,
                                bool use_full_precision = false);
 };
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index e5a6c8d5e6..9cdcb454a2 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -155,7 +155,7 @@ void FlexFlow::top_level_task(Task const *task,
   bool verbose = false;
   size_t num_devices = ffconfig.workersPerNode * ffconfig.numNodes;
   int data_parallelism_degree = 1, tensor_parallelism_degree = 1,
-      pipeline_parallelism_degree = -1;
+      pipeline_parallelism_degree = 1;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
   char **argv = command_args.argv;
@@ -171,10 +171,10 @@ void FlexFlow::top_level_task(Task const *task,
                    pipeline_parallelism_degree);
   ffconfig.data_parallelism_degree = data_parallelism_degree;
   ffconfig.tensor_parallelism_degree = tensor_parallelism_degree;
-  ffconfig.pipeline_parallelism_degree =
-      pipeline_parallelism_degree == -1
-          ? num_devices / (tensor_parallelism_degree * data_parallelism_degree)
-          : pipeline_parallelism_degree;
+  ffconfig.pipeline_parallelism_degree = pipeline_parallelism_degree;
+  assert(data_parallelism_degree * tensor_parallelism_degree *
+             pipeline_parallelism_degree ==
+         ffconfig.numNodes * ffconfig.workersPerNode);
 
   if (file_paths.ssm_weight_file_paths.size() == 0) {
     assert(false &&
@@ -212,8 +212,6 @@ void FlexFlow::top_level_task(Task const *task,
                               im,
                               file_paths.llm_config_file_path,
                               file_paths.llm_weight_file_path,
-                              ffconfig.workersPerNode * ffconfig.numNodes /
-                                  tensor_parallelism_degree,
                               TREE_VERIFY_MODE,
                               use_full_precision);
   } else if (model_types.llm_model_type == ModelType::OPT) {
@@ -221,8 +219,6 @@ void FlexFlow::top_level_task(Task const *task,
                           im,
                           file_paths.llm_config_file_path,
                           file_paths.llm_weight_file_path,
-                          ffconfig.workersPerNode * ffconfig.numNodes /
-                              tensor_parallelism_degree,
                           TREE_VERIFY_MODE,
                           use_full_precision);
   } else {
@@ -233,8 +229,11 @@ void FlexFlow::top_level_task(Task const *task,
   int num_ssms = model_types.ssm_model_types.size();
   std::vector<int> ssm_model_ids;
   std::vector<FFModel> ssm_models;
+  FFConfig bm_config = ffconfig;
+  bm_config.data_parallelism_degree = bm_config.tensor_parallelism_degree =
+      bm_config.pipeline_parallelism_degree = 1;
   for (int ssm_id = 0; ssm_id < num_ssms; ssm_id++) {
-    FFModel beam_model(ffconfig);
+    FFModel beam_model(bm_config);
     ssm_models.push_back(beam_model);
   }
 
@@ -245,7 +244,6 @@ void FlexFlow::top_level_task(Task const *task,
                                 im,
                                 file_paths.ssm_config_file_paths[ssm_id],
                                 file_paths.ssm_weight_file_paths[ssm_id],
-                                1,
                                 BEAM_SEARCH_MODE,
                                 use_full_precision);
     } else if (model_types.ssm_model_types[ssm_id] == ModelType::OPT) {
@@ -253,7 +251,6 @@ void FlexFlow::top_level_task(Task const *task,
                             im,
                             file_paths.ssm_config_file_paths[ssm_id],
                             file_paths.ssm_weight_file_paths[ssm_id],
-                            1,
                             BEAM_SEARCH_MODE,
                             use_full_precision);
     } else {
@@ -352,4 +349,4 @@ void FlexFlow::top_level_task(Task const *task,
   std::cout << "----------inference finished--------------" << std::endl;
 }
 
-void FlexFlow::register_custom_tasks() {}
\ No newline at end of file
+void FlexFlow::register_custom_tasks() {}
diff --git a/src/ops/arg_topk.cc b/src/ops/arg_topk.cc
index eedd89bd5f..a604c016d2 100644
--- a/src/ops/arg_topk.cc
+++ b/src/ops/arg_topk.cc
@@ -88,7 +88,8 @@ Op *ArgTopK::create_operator_from_layer(
   int k = value;
   layer->get_int_property("sorted", value);
   bool sorted = (bool)value;
-  return new ArgTopK(model, inputs[0], k, sorted, layer->name);
+  return new ArgTopK(
+      model, layer->layer_guid, inputs[0], k, sorted, layer->name);
 }
 
 ArgTopKParams ArgTopK::get_params() const {
@@ -108,6 +109,7 @@ bool operator==(ArgTopKParams const &lhs, ArgTopKParams const &rhs) {
 }
 
 ArgTopK::ArgTopK(FFModel &model,
+                 LayerID const &_layer_guid,
                  const ParallelTensor _input,
                  int _k,
                  bool _sorted,
@@ -121,6 +123,8 @@ ArgTopK::ArgTopK(FFModel &model,
          1 /*outputs*/,
          _input),
       k(_k), sorted(_sorted) {
+  // overwrite layer_guid
+  layer_guid = _layer_guid;
   int numdim = inputs[0]->num_dims;
   ParallelDim dims[MAX_TENSOR_DIM];
   for (int i = 0; i < numdim; i++) {
@@ -136,15 +140,16 @@ ArgTopK::ArgTopK(FFModel &model,
 }
 
 ArgTopK::ArgTopK(FFModel &model,
+                 LayerID const &layer_guid,
                  ArgTopK const &other,
                  const ParallelTensor input)
-    : ArgTopK(model, input, other.k, other.sorted, other.name) {}
+    : ArgTopK(model, layer_guid, input, other.k, other.sorted, other.name) {}
 
 ArgTopK::ArgTopK(FFModel &model,
                  ArgTopKParams const &params,
                  const ParallelTensor input,
                  char const *name)
-    : ArgTopK(model, input, params.k, params.sorted, name) {}
+    : ArgTopK(model, params.layer_guid, input, params.k, params.sorted, name) {}
 
 void ArgTopK::init_inference(FFModel const &ff,
                              std::vector<ParallelTensor> const &batch_inputs,
@@ -260,7 +265,7 @@ FutureMap ArgTopK::inference(FFModel const &ff,
             << std::endl; */
   IndexLauncher launcher(ARG_TOPK_INF_TASK_ID,
                          parallel_is,
-                         TaskArgument(NULL, 0),
+                         TaskArgument(&bc, sizeof(BatchConfig)),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
@@ -295,6 +300,7 @@ InferenceResult
   assert(regions.size() == 2);
   assert(task->regions.size() == 2);
   // const ArgTopK* topk = (const ArgTopK*) task->args;
+  BatchConfig const *bc = (BatchConfig *)task->args;
   ArgTopKMeta const *m = *((ArgTopKMeta **)task->local_args);
 
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
@@ -302,10 +308,11 @@ InferenceResult
   GenericTensorAccessorW indices = helperGetGenericTensorAccessorWO(
       DT_INT32, regions[1], task->regions[1], FID_DATA, ctx, runtime);
 
-  ArgTopK::forward_kernel_wrapper(m, input, indices);
+  int batch_size = bc->num_active_tokens();
+  ArgTopK::forward_kernel_wrapper(m, input, indices, batch_size);
 
   int length = input.domain.hi()[0] - input.domain.lo()[0] + 1;
-  int batch_size = input.domain.get_volume() / length;
+  batch_size = input.domain.get_volume() / length;
 
   InferenceResult ir;
   download_tensor<BatchConfig::TokenId>(
@@ -319,6 +326,8 @@ void ArgTopK::backward(FFModel const &ff) {
 }
 
 void ArgTopK::serialize(Legion::Serializer &sez) const {
+  sez.serialize(this->layer_guid.id);
+  sez.serialize(this->layer_guid.transformer_layer_id);
   sez.serialize(this->k);
   sez.serialize(this->sorted);
 }
@@ -328,11 +337,16 @@ Node ArgTopK::deserialize(FFModel &ff,
                           ParallelTensor inputs[],
                           int num_inputs) {
   assert(num_inputs == 1);
+  size_t id, transformer_layer_id;
+  dez.deserialize(id);
+  dez.deserialize(transformer_layer_id);
+  LayerID layer_guid(id, transformer_layer_id);
   int k;
   bool sorted;
   dez.deserialize(k);
   dez.deserialize(sorted);
   ArgTopKParams params;
+  params.layer_guid = layer_guid;
   params.k = k;
   params.sorted = sorted;
   return ff.get_or_create_node<ArgTopK>(inputs[0], params);
@@ -357,6 +371,7 @@ namespace std {
 size_t hash<FlexFlow::ArgTopKParams>::operator()(
     FlexFlow::ArgTopKParams const &params) const {
   size_t key = 0;
+  hash_combine(key, params.layer_guid.id);
   hash_combine(key, params.k);
   hash_combine(key, params.sorted);
   return key;
diff --git a/src/ops/arg_topk.cpp b/src/ops/arg_topk.cpp
index d055e09def..4937166b66 100644
--- a/src/ops/arg_topk.cpp
+++ b/src/ops/arg_topk.cpp
@@ -411,7 +411,8 @@ void ArgTopK::forward_kernel(ArgTopKMeta const *m,
 void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
                                      GenericTensorAccessorR const &input,
                                      // float *output_ptr,
-                                     GenericTensorAccessorW const &indices) {
+                                     GenericTensorAccessorW const &indices,
+                                     int batch_size) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   // Domain in1_domain = runtime->get_index_space_domain(
@@ -442,8 +443,8 @@ void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
   int length = input.domain.hi()[0] - input.domain.lo()[0] + 1;
   int k = indices.domain.hi()[0] - indices.domain.lo()[0] +
           1; /*TODO: This prints to 5*/
-  size_t batch_size = input.domain.get_volume() / length;
-  assert(indices.domain.get_volume() / k == batch_size);
+  // size_t batch_size = input.domain.get_volume() / length;
+  // assert(indices.domain.get_volume() / k == batch_size);
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
diff --git a/src/ops/arg_topk.cu b/src/ops/arg_topk.cu
index 9583af525e..575e0183b4 100644
--- a/src/ops/arg_topk.cu
+++ b/src/ops/arg_topk.cu
@@ -406,7 +406,8 @@ void ArgTopK::forward_kernel(ArgTopKMeta const *m,
 void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
                                      GenericTensorAccessorR const &input,
                                      // float *output_ptr,
-                                     GenericTensorAccessorW const &indices) {
+                                     GenericTensorAccessorW const &indices,
+                                     int batch_size) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -438,9 +439,8 @@ void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
   int length = input.domain.hi()[0] - input.domain.lo()[0] + 1;
   int k = indices.domain.hi()[0] - indices.domain.lo()[0] +
           1; /*TODO: This prints to 5*/
-  size_t batch_size = input.domain.get_volume() / length;
-  assert(indices.domain.get_volume() / k == batch_size);
-
+  // batch_size = input.domain.get_volume() / length;
+  // assert(indices.domain.get_volume() / k == batch_size);
   cudaEvent_t t_start, t_end;
   if (m->profiling) {
     cudaEventCreate(&t_start);
diff --git a/src/ops/beam_topk.cc b/src/ops/beam_topk.cc
index d67c84a9df..db507c1729 100644
--- a/src/ops/beam_topk.cc
+++ b/src/ops/beam_topk.cc
@@ -429,6 +429,7 @@ void BeamTopK::backward(FFModel const &ff) {
 
 void BeamTopK::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
+  sez.serialize(this->layer_guid.transformer_layer_id);
   sez.serialize(this->sorted);
   sez.serialize(this->max_beam_width);
 }
@@ -439,10 +440,11 @@ Node BeamTopK::deserialize(FFModel &ff,
                            int num_inputs) {
   assert(num_inputs == 1);
   bool sorted;
-  size_t id;
+  size_t id, transformer_layer_id;
   int max_beam_width;
   dez.deserialize(id);
-  LayerID layer_guid(id);
+  dez.deserialize(transformer_layer_id);
+  LayerID layer_guid(id, transformer_layer_id);
   dez.deserialize(sorted);
   dez.deserialize(max_beam_width);
   BeamTopKParams params;
diff --git a/src/ops/conv_2d.cc b/src/ops/conv_2d.cc
index 786c3427e9..ce7b6ebc01 100644
--- a/src/ops/conv_2d.cc
+++ b/src/ops/conv_2d.cc
@@ -1012,6 +1012,7 @@ bool Conv2D::estimate_sync_cost(Simulator *sim,
 
 void Conv2D::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
+  sez.serialize(this->layer_guid.transformer_layer_id);
   sez.serialize(this->out_channels);
   sez.serialize(this->kernel_h);
   sez.serialize(this->kernel_w);
@@ -1036,9 +1037,10 @@ Node Conv2D::deserialize(FFModel &ff,
       padding_w, groups;
   bool use_bias;
   ActiMode activation;
-  size_t id;
+  size_t id, transformer_layer_id;
   dez.deserialize(id);
-  LayerID layer_guid(id);
+  dez.deserialize(transformer_layer_id);
+  LayerID layer_guid(id, transformer_layer_id);
   dez.deserialize(out_channels);
   dez.deserialize(kernel_h);
   dez.deserialize(kernel_w);
diff --git a/src/ops/element_binary.cc b/src/ops/element_binary.cc
index cf90919e6b..7562a727d7 100644
--- a/src/ops/element_binary.cc
+++ b/src/ops/element_binary.cc
@@ -97,8 +97,13 @@ Op *ElementBinary::create_operator_from_layer(
   long long value;
   layer->get_int_property("inplace_a", value);
   bool inplace_a = (bool)value;
-  return new ElementBinary(
-      model, layer->op_type, inputs[0], inputs[1], inplace_a, layer->name);
+  return new ElementBinary(model,
+                           layer->layer_guid,
+                           layer->op_type,
+                           inputs[0],
+                           inputs[1],
+                           inplace_a,
+                           layer->name);
 }
 
 Tensor FFModel::add(const Tensor in1,
@@ -166,10 +171,12 @@ bool ElementBinaryParams::is_valid(
 
 bool operator==(ElementBinaryParams const &lhs,
                 ElementBinaryParams const &rhs) {
-  return lhs.type == rhs.type;
+  return lhs.type == rhs.type && lhs.layer_guid == rhs.layer_guid &&
+         lhs.inplace_a == rhs.inplace_a;
 }
 
 ElementBinary::ElementBinary(FFModel &model,
+                             LayerID const &_layer_guid,
                              OperatorType _op_type,
                              const ParallelTensor in1,
                              const ParallelTensor in2,
@@ -185,6 +192,8 @@ ElementBinary::ElementBinary(FFModel &model,
          in1,
          in2),
       inplace_a(_inplace_a) {
+  // overwrite layer_guid
+  layer_guid = _layer_guid;
   numOutputs = 1;
   numWeights = 0;
   assert(in1->data_type == in2->data_type);
@@ -217,10 +226,14 @@ ElementBinary::ElementBinary(
     FFModel &model,
     ElementBinaryParams const &params,
     std::pair<ParallelTensor, ParallelTensor> const &inputs,
-    char const *name,
-    bool inplace_a)
-    : ElementBinary(
-          model, params.type, inputs.first, inputs.second, inplace_a, name) {}
+    char const *name)
+    : ElementBinary(model,
+                    params.layer_guid,
+                    params.type,
+                    inputs.first,
+                    inputs.second,
+                    params.inplace_a,
+                    name) {}
 
 void ElementBinary::map_output_tensors(FFModel &ff) {
   if (has_inplace_output()) {
@@ -975,9 +988,41 @@ bool ElementBinary::measure_operator_cost(Simulator *sim,
   return true;
 }
 
+void ElementBinary::serialize(Legion::Serializer &sez) const {
+  sez.serialize(this->layer_guid.id);
+  sez.serialize(this->layer_guid.transformer_layer_id);
+  sez.serialize(this->op_type);
+  sez.serialize(this->inplace_a);
+}
+
+using PCG::Node;
+/*static*/
+Node ElementBinary::deserialize(FFModel &ff,
+                                Legion::Deserializer &dez,
+                                ParallelTensor inputs[],
+                                int num_inputs) {
+  assert(num_inputs == 2);
+  OperatorType op_type;
+  size_t id, transformer_layer_id;
+  bool inplace_a;
+  dez.deserialize(id);
+  dez.deserialize(transformer_layer_id);
+  LayerID layer_guid(id, transformer_layer_id);
+  dez.deserialize(op_type);
+  dez.deserialize(inplace_a);
+
+  ElementBinaryParams params;
+  params.layer_guid = layer_guid;
+  params.type = op_type;
+  params.inplace_a = inplace_a;
+  return ff.get_or_create_node<ElementBinary>({inputs[0], inputs[1]}, params);
+}
+
 ElementBinaryParams ElementBinary::get_params() const {
   ElementBinaryParams params;
+  params.layer_guid = this->layer_guid;
   params.type = this->op_type;
+  params.inplace_a = this->inplace_a;
   return params;
 }
 
@@ -987,7 +1032,9 @@ namespace std {
 size_t hash<FlexFlow::ElementBinaryParams>::operator()(
     FlexFlow::ElementBinaryParams const &params) const {
   size_t key = 0;
+  hash_combine(key, params.layer_guid.id);
   hash_combine(key, params.type);
+  hash_combine(key, params.inplace_a);
   return key;
 }
 }; // namespace std
diff --git a/src/ops/element_unary.cc b/src/ops/element_unary.cc
index f0713dd0a1..69533db53d 100644
--- a/src/ops/element_unary.cc
+++ b/src/ops/element_unary.cc
@@ -672,6 +672,7 @@ void ElementUnary::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->inplace);
   sez.serialize(scalar);
   sez.serialize(this->layer_guid.id);
+  sez.serialize(this->layer_guid.transformer_layer_id);
 }
 
 bool ElementUnary::measure_operator_cost(Simulator *sim,
@@ -782,9 +783,10 @@ Node ElementUnary::deserialize(FFModel &ff,
   dez.deserialize(op_type);
   dez.deserialize(inplace);
   dez.deserialize(scalar);
-  size_t id;
+  size_t id, transformer_layer_id;
   dez.deserialize(id);
-  LayerID layer_guid(id);
+  dez.deserialize(transformer_layer_id);
+  LayerID layer_guid(id, transformer_layer_id);
 
   ElementUnaryParams params;
   params.op_type = op_type;
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index 77cd748f9c..06e007abef 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -396,6 +396,7 @@ Experts::Experts(FFModel &model,
 void Experts::serialize(Legion::Serializer &sez) const {
   ExpertsParams params = get_params();
   sez.serialize(params.layer_guid.id);
+  sez.serialize(params.layer_guid.transformer_layer_id);
   sez.serialize(params.num_experts);
   sez.serialize(params.experts_start_idx);
   sez.serialize(params.experts_output_dim_size);
@@ -416,9 +417,10 @@ Node Experts::deserialize(FFModel &ff,
   float alpha;
   ActiMode activation;
   bool use_bias;
-  size_t id;
+  size_t id, transformer_layer_id;
   dez.deserialize(id);
-  LayerID layer_guid(id);
+  dez.deserialize(transformer_layer_id);
+  LayerID layer_guid(id, transformer_layer_id);
   dez.deserialize(num_experts);
   dez.deserialize(experts_start_idx);
   dez.deserialize(experts_output_dim_size);
diff --git a/src/ops/fused.cc b/src/ops/fused.cc
index 3dc442708f..cf01f5bd1e 100644
--- a/src/ops/fused.cc
+++ b/src/ops/fused.cc
@@ -100,6 +100,7 @@ FusedOp::FusedOp(FFModel &model, Op *op)
   op_num_outputs[0] = op->numOutputs;
   op_op_type[0] = op->op_type;
   operators[0] = op;
+  layer_guid = op->layer_guid;
   // for (int i = 0; i < numInputs; i++) {
   //   op_input_source[i] = SOURCE_INPUT;
   //   op_input_idx[i] = i;
@@ -127,9 +128,9 @@ bool FusedOp::add_operator(FFModel &model, Op *op) {
   // assert(model.config.find_parallel_config(my_domain.get_dim(), name,
   // my_config)); assert(model.config.find_parallel_config(op_domain.get_dim(),
   // op->name, op_config));
-  // Cannot fuse parallel operators since they have different paralel_is
-  // in forward and backward
-  assert(!op->is_parallel_op());
+  // Cannot fuse parallel operators (except allreduce) since they have different
+  // paralel_is in forward and backward
+  assert(!op->is_parallel_op() || op->op_type == OP_ALLREDUCE);
   // Currently don't consider nested fusion
   assert(op->op_type != OP_FUSED);
   MachineView my_view = outputs[0]->machine_view;
@@ -149,12 +150,14 @@ bool FusedOp::add_operator(FFModel &model, Op *op) {
       (weight_offset + op->numWeights > MAX_NUM_FUSED_TENSORS) ||
       (output_offset + op->numOutputs > MAX_NUM_FUSED_TENSORS)) {
     fprintf(stderr, "Cannot fuse. Consider increase MAX_NUM_FUSED_TENSORS\n");
+    assert(false);
     return false;
   }
   if (numOperators + 1 > MAX_NUM_FUSED_OPERATORS) {
     fprintf(
         stderr,
         "Reach to the fusion limit. Consider increase MAX_NUM_FUSED_OPERATORS");
+    assert(false);
     return false;
   }
   // Set inputs
@@ -331,6 +334,92 @@ void FusedOp::init(FFModel const &ff) {
   }
 }
 
+void FusedOp::init_inference(FFModel const &ff,
+                             std::vector<ParallelTensor> const &batch_inputs,
+                             std::vector<ParallelTensor> const &batch_outputs,
+                             MachineView const *mv) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  // Call init methods in individual operators
+  Domain domain = runtime->get_index_space_domain(ctx, parallel_is);
+  int ioff = 0, ooff = 0;
+  for (int op = 0; op < numOperators; op++) {
+    // prepare batch_inputs, batch_outputs for operators[i]
+    std::vector<ParallelTensor> my_batch_inputs;
+    std::vector<ParallelTensor> my_batch_outputs;
+    for (int i = 0; i < op_num_inputs[op]; i++) {
+      int my_off = op_input_idx[i + ioff];
+      if (op_input_source[i + ioff] == SOURCE_INPUT) {
+        my_batch_inputs.push_back(batch_inputs[my_off]);
+      } else if (op_input_source[i + ioff] == SOURCE_OUTPUT) {
+        my_batch_inputs.push_back(batch_outputs[my_off]);
+      } else {
+        assert(false);
+      }
+    }
+    for (int i = 0; i < op_num_outputs[op]; i++) {
+      assert(op_output_source[i + ooff] == SOURCE_OUTPUT);
+      my_batch_outputs.push_back(batch_outputs[i + ooff]);
+    }
+    ioff += op_num_inputs[op];
+    ooff += op_num_outputs[op];
+    operators[op]->init_inference(ff, my_batch_inputs, my_batch_outputs, mv);
+    for (size_t j = 0; j < domain.get_volume(); j++) {
+      fused_meta[j].meta[op] =
+          operators[op]->inference_meta[my_batch_outputs[0]][j];
+    }
+  }
+  for (size_t j = 0; j < domain.get_volume(); j++) {
+    fused_meta[j].numOperators = numOperators;
+  }
+  switch (domain.get_dim()) {
+#define DIMFUNC(DIM)                                                           \
+  case DIM: {                                                                  \
+    Rect<DIM> rect = domain;                                                   \
+    int idx = 0;                                                               \
+    for (PointInRectIterator<DIM> it(rect); it(); it++) {                      \
+      argmap.set_point(*it,                                                    \
+                       TaskArgument(&fused_meta[idx++], sizeof(FusedOpMeta))); \
+    }                                                                          \
+    break;                                                                     \
+  }
+    LEGION_FOREACH_N(DIMFUNC)
+#undef DIMFUNC
+    default:
+      assert(false);
+  }
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  IndexLauncher launcher(FUSEDOP_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(FusedOp)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  switch (domain.get_dim()) {
+#define DIMFUNC(DIM)                                                           \
+  case DIM: {                                                                  \
+    Rect<DIM> rect = domain;                                                   \
+    int idx = 0;                                                               \
+    for (PointInRectIterator<DIM> it(rect); it(); it++) {                      \
+      inference_meta[batch_outputs[0]][idx++] = fm.get_result<OpMeta *>(*it);  \
+    }                                                                          \
+    break;                                                                     \
+  }
+    LEGION_FOREACH_N(DIMFUNC)
+#undef DIMFUNC
+    default:
+      assert(false);
+  }
+}
+
 void FusedOp::forward(FFModel const &ff) {
   // Set iter_config
   iter_config = ff.iter_config;
@@ -380,6 +469,66 @@ void FusedOp::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
+FutureMap FusedOp::inference(FFModel const &ff,
+                             BatchConfig const &bc,
+                             std::vector<ParallelTensor> const &batch_inputs,
+                             std::vector<ParallelTensor> const &batch_outputs,
+                             MachineView const *mv) {
+  // Set iter_config
+  iter_config = ff.iter_config;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  // bc is one of BatchConfig, TreeVerifyBatchConfig, and BeamSearchBatchConfig
+  // so we transfer the maximum of them
+  size_t batch_config_size =
+      std::max(sizeof(TreeVerifyBatchConfig), sizeof(BeamSearchBatchConfig));
+  IndexLauncher launcher(FUSEDOP_INF_TASK_ID,
+                         parallel_is,
+                         TaskArgument(&bc, batch_config_size),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  int offset = 0;
+  for (int i = 0; i < numInputs; i++) {
+    assert(inputs[i]->part != LogicalPartition::NO_PART);
+    assert(inputs[i]->region != LogicalRegion::NO_REGION);
+    launcher.add_region_requirement(RegionRequirement(batch_inputs[i]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      batch_inputs[i]->region));
+    launcher.add_field(offset + i, FID_DATA);
+  }
+  offset += numInputs;
+  for (int i = 0; i < numWeights; i++) {
+    assert(weights[i]->region != LogicalRegion::NO_REGION);
+    launcher.add_region_requirement(RegionRequirement(weights[i]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[i]->region));
+    launcher.add_field(offset + i, FID_DATA);
+  }
+  offset += numWeights;
+  for (int i = 0; i < numOutputs; i++) {
+    assert(outputs[i]->region != LogicalRegion::NO_REGION);
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[i]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[i]->region));
+    launcher.add_field(offset + i, FID_DATA);
+  }
+  return runtime->execute_index_space(ctx, launcher);
+}
+
 void FusedOp::backward(FFModel const &ff) {
   // Set iter_config
   iter_config = ff.iter_config;
diff --git a/src/ops/fused.cpp b/src/ops/fused.cpp
index 712ed143b1..c717881e66 100644
--- a/src/ops/fused.cpp
+++ b/src/ops/fused.cpp
@@ -14,20 +14,29 @@
  */
 
 #include "flexflow/ops/fused.h"
+#include "flexflow/accessor.h"
 #include "flexflow/model.h"
 #include "flexflow/ops/batch_norm.h"
 #include "flexflow/ops/element_unary.h"
+#include "flexflow/ops/embedding.h"
+#include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ops/kernels/batch_matmul_kernels.h"
 #include "flexflow/ops/kernels/concat_kernels.h"
 #include "flexflow/ops/kernels/conv_2d_kernels.h"
 #include "flexflow/ops/kernels/dropout_kernels.h"
 #include "flexflow/ops/kernels/element_binary_kernels.h"
+#include "flexflow/ops/kernels/embedding_kernels.h"
 #include "flexflow/ops/kernels/flat_kernels.h"
 #include "flexflow/ops/kernels/linear_kernels.h"
 #include "flexflow/ops/kernels/pool_2d_kernels.h"
 #include "flexflow/ops/kernels/reshape_kernels.h"
+#include "flexflow/ops/kernels/rms_norm_kernels.h"
 #include "flexflow/ops/kernels/transpose_kernels.h"
+#include "flexflow/ops/layer_norm.h"
 #include "flexflow/ops/linear.h"
+#include "flexflow/ops/spec_inc_multihead_self_attention.h"
+#include "flexflow/ops/tree_inc_multihead_self_attention.h"
+#include "flexflow/parallel_ops/kernels/allreduce_kernels.h"
 #include "flexflow/utils/hip_helper.h"
 #include <hip/hip_runtime.h>
 
@@ -373,6 +382,414 @@ __host__ void FusedOp::forward_task(Task const *task,
   //   "[Fused:forward:output]");
 }
 
+/*
+  regions[...](I): inputs
+  regions[...](I): weights
+  regions[...](I): outputs
+*/
+__host__ void
+    FusedOp::inference_task(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
+  // const FusedOp* fused = (FusedOp*) task->args;
+  FusedOpMeta const *metas = *((FusedOpMeta **)task->local_args);
+  FusedOp const *fused = metas->fused_op;
+  BatchConfig const *bc = (BatchConfig *)task->args;
+  assert(metas->numOperators == fused->numOperators);
+  assert(regions.size() == task->regions.size());
+  assert((int)regions.size() ==
+         fused->numInputs + fused->numWeights + fused->numOutputs);
+  GenericTensorAccessorR input_accessor[MAX_NUM_INPUTS];
+  GenericTensorAccessorR weight_accessor[MAX_NUM_WEIGHTS];
+  GenericTensorAccessorW output_accessor[MAX_NUM_OUTPUTS];
+  assert(fused->numInputs <= MAX_NUM_INPUTS);
+  for (int i = 0; i < fused->numInputs; i++) {
+    input_accessor[i] =
+        helperGetGenericTensorAccessorRO(fused->input_data_types[i],
+                                         regions[i],
+                                         task->regions[i],
+                                         FID_DATA,
+                                         ctx,
+                                         runtime);
+  }
+  int roff = fused->numInputs;
+  assert(fused->numWeights <= MAX_NUM_WEIGHTS);
+  for (int i = 0; i < fused->numWeights; i++) {
+    weight_accessor[i] =
+        helperGetGenericTensorAccessorRO(fused->weight_data_types[i],
+                                         regions[i + roff],
+                                         task->regions[i + roff],
+                                         FID_DATA,
+                                         ctx,
+                                         runtime);
+  }
+  roff += fused->numWeights;
+  assert(fused->numOutputs <= MAX_NUM_OUTPUTS);
+  for (int i = 0; i < fused->numOutputs; i++) {
+    output_accessor[i] =
+        helperGetGenericTensorAccessorWO(fused->output_data_types[i],
+                                         regions[i + roff],
+                                         task->regions[i + roff],
+                                         FID_DATA,
+                                         ctx,
+                                         runtime);
+  }
+  // Assert that all meta share the same dnn/blas handler
+  int start = 0;
+  for (start = 0; start < fused->numOperators; start++) {
+    if (metas->meta[start] != NULL) {
+      break;
+    }
+  }
+  for (int op = start + 1; op < fused->numOperators; op++) {
+    if (metas->meta[op] != NULL) {
+      assert(metas->meta[start]->handle.blas == metas->meta[op]->handle.blas);
+      assert(metas->meta[start]->handle.dnn == metas->meta[op]->handle.dnn);
+    }
+  }
+
+  hipStream_t stream;
+  if (start < fused->numOperators) {
+    checkCUDA(get_legion_stream(&stream));
+  }
+
+  int ioff = 0, woff = 0, ooff = 0;
+  for (int op = 0; op < fused->numOperators; op++) {
+    GenericTensorAccessorR my_input_accessor[MAX_NUM_INPUTS];
+    GenericTensorAccessorR my_weight_accessor[MAX_NUM_WEIGHTS];
+    GenericTensorAccessorW my_output_accessor[MAX_NUM_OUTPUTS];
+    for (int i = 0; i < fused->op_num_inputs[op]; i++) {
+      int my_off = fused->op_input_idx[i + ioff];
+      if (fused->op_input_source[i + ioff] == SOURCE_INPUT) {
+        my_input_accessor[i] = input_accessor[my_off];
+      } else if (fused->op_input_source[i + ioff] == SOURCE_OUTPUT) {
+        my_input_accessor[i] = output_accessor[my_off];
+      } else {
+        assert(false);
+      }
+    }
+    for (int i = 0; i < fused->op_num_weights[op]; i++) {
+      assert(fused->op_weight_source[i + woff] == SOURCE_WEIGHT);
+      my_weight_accessor[i] = weight_accessor[fused->op_weight_idx[i + woff]];
+    }
+    for (int i = 0; i < fused->op_num_outputs[op]; i++) {
+      assert(fused->op_output_source[i + ooff] == SOURCE_OUTPUT);
+      my_output_accessor[i] = output_accessor[i + ooff];
+    }
+    switch (fused->op_op_type[op]) {
+      case OP_CONCAT: {
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        ConcatMeta *m = (ConcatMeta *)metas->meta[op];
+        int num_inputs = fused->op_num_inputs[op];
+        Kernels::Concat::forward_kernel_wrapper(m,
+                                                my_output_accessor[0],
+                                                my_input_accessor,
+                                                num_inputs,
+                                                m->legion_axis);
+        break;
+      }
+      case OP_BATCHNORM: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_accessor[0].domain.get_dim() == 5);
+        assert(my_output_accessor[0].domain.get_dim() == 5);
+        assert(my_weight_accessor[0].domain.get_dim() == 2);
+        assert(my_weight_accessor[1].domain.get_dim() == 2);
+        BatchNormMeta *m = (BatchNormMeta *)metas->meta[op];
+        BatchNorm::forward_kernel(m,
+                                  my_input_accessor[0].get_float_ptr(),
+                                  my_output_accessor[0].get_float_ptr(),
+                                  my_weight_accessor[0].get_float_ptr(),
+                                  my_weight_accessor[1].get_float_ptr());
+        break;
+      }
+      case OP_LINEAR: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        Domain kernel_domain = my_weight_accessor[0].domain;
+        int in_dim = kernel_domain.hi()[0] - kernel_domain.lo()[0] + 1;
+        int out_dim = kernel_domain.hi()[1] - kernel_domain.lo()[1] + 1;
+        int batch_size = my_input_accessor[0].domain.get_volume() / in_dim;
+        assert(my_output_accessor[0].domain.get_volume() ==
+               out_dim * batch_size);
+        assert(my_input_accessor[0].domain.get_volume() == in_dim * batch_size);
+        void const *bias_ptr = nullptr;
+        if (fused->op_num_weights[op] == 2) {
+          assert(my_weight_accessor[1].domain.get_volume() == out_dim);
+          bias_ptr = my_weight_accessor[1].ptr;
+        } else {
+          assert(fused->op_num_weights[op] == 1);
+        }
+        LinearMeta *m = (LinearMeta *)metas->meta[op];
+        assert(m->input_type[0] == my_input_accessor[0].data_type);
+        assert(m->input_type[0] == my_output_accessor[0].data_type);
+        batch_size = bc->num_active_tokens();
+        Kernels::Linear::forward_kernel_wrapper(m,
+                                                my_input_accessor[0].ptr,
+                                                my_output_accessor[0].ptr,
+                                                my_weight_accessor[0].ptr,
+                                                bias_ptr,
+                                                in_dim,
+                                                out_dim,
+                                                batch_size);
+        break;
+      }
+      case OP_BATCHMATMUL: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        Domain out_domain = my_output_accessor[0].domain;
+        Domain a_domain = my_input_accessor[0].domain;
+        Domain b_domain = my_input_accessor[1].domain;
+        int m = b_domain.hi()[0] - b_domain.lo()[0] + 1;
+        assert(m == out_domain.hi()[0] - out_domain.lo()[0] + 1);
+        int n = a_domain.hi()[1] - a_domain.lo()[1] + 1;
+        assert(n == out_domain.hi()[1] - out_domain.lo()[1] + 1);
+        int k = a_domain.hi()[0] - a_domain.lo()[0] + 1;
+        assert(k == b_domain.hi()[1] - b_domain.lo()[1] + 1);
+        assert(a_domain.get_dim() == b_domain.get_dim());
+        assert(a_domain.get_dim() == out_domain.get_dim());
+        int batch = 1;
+        for (int i = 2; i < a_domain.get_dim(); i++) {
+          int dim_size = a_domain.hi()[i] - a_domain.lo()[i] + 1;
+          assert(dim_size == b_domain.hi()[i] - b_domain.lo()[i] + 1);
+          assert(dim_size == out_domain.hi()[i] - out_domain.lo()[i] + 1);
+          batch *= dim_size;
+        }
+        BatchMatmulMeta *meta = (BatchMatmulMeta *)metas->meta[op];
+        Kernels::BatchMatmul::forward_kernel_wrapper(
+            meta,
+            my_output_accessor[0].get_float_ptr(),
+            my_input_accessor[0].get_float_ptr(),
+            my_input_accessor[1].get_float_ptr(),
+            (float const *)nullptr,
+            m,
+            n,
+            k,
+            batch,
+            meta->a_seq_length_dim,
+            meta->b_seq_length_dim,
+            fused->iter_config.seq_length);
+        break;
+      }
+      case OP_EW_ADD:
+      case OP_EW_SUB:
+      case OP_EW_MUL:
+      case OP_EW_DIV:
+      case OP_EW_MAX:
+      case OP_EW_MIN: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_accessor[0].domain == my_input_accessor[1].domain);
+        assert(my_input_accessor[0].domain == my_output_accessor[0].domain);
+        ElementBinaryMeta *m = (ElementBinaryMeta *)metas->meta[op];
+        Kernels::ElementBinary::forward_kernel_wrapper(m,
+                                                       my_input_accessor[0],
+                                                       my_input_accessor[1],
+                                                       my_output_accessor[0]);
+        break;
+        break;
+      }
+      case OP_EMBEDDING: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        EmbeddingMeta *m = (EmbeddingMeta *)metas->meta[op];
+        if (m->aggr == AGGR_MODE_NONE) {
+          // assert(kernel_domain.get_dim() == 2);
+          assert(my_input_accessor[0].domain.get_dim() + 1 ==
+                 my_output_accessor[0].domain.get_dim());
+          for (size_t i = 0; i < my_input_accessor[0].domain.get_dim(); i++) {
+            assert(my_input_accessor[0].domain.hi()[i] ==
+                   my_output_accessor[0].domain.hi()[i + 1]);
+            assert(my_input_accessor[0].domain.lo()[i] ==
+                   my_output_accessor[0].domain.lo()[i + 1]);
+          }
+          assert(my_weight_accessor[0].domain.hi()[0] -
+                     my_weight_accessor[0].domain.lo()[0] ==
+                 my_output_accessor[0].domain.hi()[0] -
+                     my_output_accessor[0].domain.lo()[0]);
+        } else {
+          assert(my_input_accessor[0].domain.get_dim() ==
+                 my_output_accessor[0].domain.get_dim());
+          for (size_t i = 1; i < my_input_accessor[0].domain.get_dim(); i++) {
+            assert(my_input_accessor[0].domain.hi()[i] ==
+                   my_output_accessor[0].domain.hi()[i]);
+            assert(my_input_accessor[0].domain.lo()[i] ==
+                   my_output_accessor[0].domain.lo()[i]);
+          }
+          assert(my_weight_accessor[0].domain.hi()[0] -
+                     my_weight_accessor[0].domain.lo()[0] ==
+                 my_output_accessor[0].domain.hi()[0] -
+                     my_output_accessor[0].domain.lo()[0]);
+        }
+        int in_dim, out_dim, effective_batch_size;
+        if (m->aggr == AGGR_MODE_NONE) {
+          in_dim = 1;
+          out_dim = my_output_accessor[0].domain.hi()[0] -
+                    my_output_accessor[0].domain.lo()[0] + 1;
+          effective_batch_size =
+              my_output_accessor[0].domain.get_volume() / out_dim;
+          assert(effective_batch_size * in_dim ==
+                 my_input_accessor[0].domain.get_volume());
+        } else {
+          assert(m->aggr == AGGR_MODE_AVG || m->aggr == AGGR_MODE_SUM);
+          in_dim = my_input_accessor[0].domain.hi()[0] -
+                   my_input_accessor[0].domain.lo()[0] + 1;
+          out_dim = my_output_accessor[0].domain.hi()[0] -
+                    my_output_accessor[0].domain.lo()[0] + 1;
+          effective_batch_size =
+              my_output_accessor[0].domain.get_volume() / out_dim;
+          assert(effective_batch_size * in_dim ==
+                 my_input_accessor[0].domain.get_volume());
+        }
+
+        assert(my_input_accessor[0].data_type == DT_INT32 ||
+               my_input_accessor[0].data_type == DT_INT64);
+        Kernels::Embedding::forward_kernel_wrapper(m,
+                                                   my_input_accessor[0],
+                                                   my_output_accessor[0],
+                                                   my_weight_accessor[0],
+                                                   in_dim,
+                                                   out_dim,
+                                                   effective_batch_size);
+        break;
+      }
+      case OP_RELU:
+      case OP_SIGMOID:
+      case OP_TANH:
+      case OP_ELU: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_accessor[0].domain == my_output_accessor[0].domain);
+        ElementUnaryMeta *m = (ElementUnaryMeta *)metas->meta[op];
+        ElementUnary::forward_kernel_wrapper(
+            m,
+            my_input_accessor[0].get_float_ptr(),
+            my_output_accessor[0].get_float_ptr(),
+            my_input_accessor[0].domain.get_volume());
+        break;
+      }
+      case OP_RMS_NORM: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        RMSNormMeta const *m = (RMSNormMeta *)metas->meta[op];
+        Kernels::RMSNorm::forward_kernel_wrapper(m,
+                                                 my_input_accessor[0],
+                                                 my_weight_accessor[0],
+                                                 my_output_accessor[0]);
+        break;
+      }
+      case OP_INC_MULTIHEAD_SELF_ATTENTION: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        IncMultiHeadSelfAttentionMeta const *m =
+            (IncMultiHeadSelfAttentionMeta *)metas->meta[op];
+        assert(fused->op_num_weights[op] == (1 + (int)(*m->bias)));
+        GenericTensorAccessorR biases;
+        if (*m->bias) {
+          assert(fused->op_num_weights[op] == 2);
+          biases = my_weight_accessor[1];
+        }
+        IncMultiHeadSelfAttention::inference_kernel_wrapper(
+            m,
+            bc,
+            task->index_point.point_data[0],
+            my_input_accessor[0],
+            my_weight_accessor[0],
+            my_output_accessor[0],
+            biases);
+        break;
+      }
+      case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        TreeIncMultiHeadSelfAttentionMeta *m =
+            (TreeIncMultiHeadSelfAttentionMeta *)metas->meta[op];
+        TreeVerifyBatchConfig const *tree_bc =
+            (TreeVerifyBatchConfig *)task->args;
+        assert(fused->op_num_weights[op] == (1 + (int)(*m->bias)));
+        GenericTensorAccessorR biases;
+        if (*m->bias) {
+          assert(fused->op_num_weights[op] == 2);
+          biases = my_weight_accessor[1];
+        }
+        TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
+            m,
+            tree_bc,
+            task->index_point.point_data[0],
+            my_input_accessor[0],
+            my_weight_accessor[0],
+            my_output_accessor[0],
+            biases);
+        break;
+      }
+      case OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        SpecIncMultiHeadSelfAttentionMeta const *m =
+            (SpecIncMultiHeadSelfAttentionMeta *)metas->meta[op];
+        BeamSearchBatchConfig const *beam_bc =
+            (BeamSearchBatchConfig *)task->args;
+        assert(fused->op_num_weights[op] == (1 + (int)(*m->bias)));
+        GenericTensorAccessorR biases;
+        if (*m->bias) {
+          assert(fused->op_num_weights[op] == 2);
+          biases = my_weight_accessor[1];
+        }
+        SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
+            m,
+            beam_bc,
+            task->index_point.point_data[0],
+            my_input_accessor[0],
+            my_weight_accessor[0],
+            my_output_accessor[0],
+            biases);
+        break;
+      }
+      case OP_LAYERNORM: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        LayerNormMeta const *m = (LayerNormMeta *)metas->meta[op];
+        assert(fused->op_num_weights[op] == 2 * (int)(m->elementwise_affine));
+        GenericTensorAccessorR gamma, beta;
+        if (m->elementwise_affine) {
+          gamma = my_weight_accessor[0];
+          beta = my_weight_accessor[1];
+        }
+        LayerNorm::forward_kernel_wrapper(
+            m, my_input_accessor[0], my_output_accessor[0], gamma, beta);
+        break;
+      }
+      case OP_ALLREDUCE: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        AllReduceMeta const *m = (AllReduceMeta *)metas->meta[op];
+        Kernels::AllReduce::forward_kernel_wrapper(
+            m, my_input_accessor[0], my_output_accessor[0]);
+        break;
+      }
+      default: {
+        fprintf(stderr,
+                "Fusion currently does not support type = %d\n",
+                fused->op_op_type[op]);
+        assert(false && "Fusion currently does not support type");
+      }
+    }
+    ioff += fused->op_num_inputs[op];
+    woff += fused->op_num_weights[op];
+    ooff += fused->op_num_outputs[op];
+  }
+  // for (int i = 0; i < fused->numOutputs; i++)
+  //   print_tensor<float>(output_ptr[i], output_domain[i].get_volume(),
+  //   "[Fused:forward:output]");
+}
+
 /*
   regions[...](I): input
   regions[...](I): weight
diff --git a/src/ops/fused.cu b/src/ops/fused.cu
index 17b0f9616d..2f84100554 100644
--- a/src/ops/fused.cu
+++ b/src/ops/fused.cu
@@ -20,6 +20,7 @@
 #include "flexflow/ops/embedding.h"
 #include "flexflow/ops/flat.h"
 #include "flexflow/ops/fused.h"
+#include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ops/kernels/batch_matmul_kernels.h"
 #include "flexflow/ops/kernels/concat_kernels.h"
 #include "flexflow/ops/kernels/conv_2d_kernels.h"
@@ -30,7 +31,12 @@
 #include "flexflow/ops/kernels/linear_kernels.h"
 #include "flexflow/ops/kernels/pool_2d_kernels.h"
 #include "flexflow/ops/kernels/reshape_kernels.h"
+#include "flexflow/ops/kernels/rms_norm_kernels.h"
 #include "flexflow/ops/kernels/transpose_kernels.h"
+#include "flexflow/ops/layer_norm.h"
+#include "flexflow/ops/spec_inc_multihead_self_attention.h"
+#include "flexflow/ops/tree_inc_multihead_self_attention.h"
+#include "flexflow/parallel_ops/kernels/allreduce_kernels.h"
 #include "flexflow/utils/cuda_helper.h"
 
 namespace FlexFlow {
@@ -62,7 +68,7 @@ OpMeta *FusedOp::init_task(Task const *task,
 /*
   regions[...](I): inputs
   regions[...](I): weights
-  regions[...](I): outputs
+  regions[...](O): outputs
 */
 __host__ void FusedOp::forward_task(Task const *task,
                                     std::vector<PhysicalRegion> const &regions,
@@ -357,7 +363,8 @@ __host__ void FusedOp::forward_task(Task const *task,
                  my_input_accessor[0].domain.get_volume());
         }
 
-        assert(my_input_accessor[0].data_type == DT_INT64);
+        assert(my_input_accessor[0].data_type == DT_INT32 ||
+               my_input_accessor[0].data_type == DT_INT64);
         Kernels::Embedding::forward_kernel_wrapper(m,
                                                    my_input_accessor[0],
                                                    my_output_accessor[0],
@@ -450,6 +457,436 @@ __host__ void FusedOp::forward_task(Task const *task,
   //   "[Fused:forward:output]");
 }
 
+/*
+  regions[...](I): inputs
+  regions[...](I): weights
+  regions[...](O): outputs
+*/
+__host__ void
+    FusedOp::inference_task(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
+  // const FusedOp* fused = (FusedOp*) task->args;
+  FusedOpMeta const *metas = *((FusedOpMeta **)task->local_args);
+  FusedOp const *fused = metas->fused_op;
+  BatchConfig const *bc = (BatchConfig *)task->args;
+  assert(metas->numOperators == fused->numOperators);
+  assert(regions.size() == task->regions.size());
+  assert((int)regions.size() ==
+         fused->numInputs + fused->numWeights + fused->numOutputs);
+  // Domain input_domain[MAX_NUM_INPUTS];
+  // Domain weight_domain[MAX_NUM_WEIGHTS];
+  // Domain output_domain[MAX_NUM_OUTPUTS];
+  GenericTensorAccessorR input_accessor[MAX_NUM_INPUTS];
+  GenericTensorAccessorR weight_accessor[MAX_NUM_WEIGHTS];
+  GenericTensorAccessorW output_accessor[MAX_NUM_OUTPUTS];
+  assert(fused->numInputs <= MAX_NUM_INPUTS);
+  for (int i = 0; i < fused->numInputs; i++) {
+    // input_domain[i] = runtime->get_index_space_domain(
+    //     ctx, task->regions[i].region.get_index_space());
+    input_accessor[i] =
+        helperGetGenericTensorAccessorRO(fused->input_data_types[i],
+                                         regions[i],
+                                         task->regions[i],
+                                         FID_DATA,
+                                         ctx,
+                                         runtime);
+  }
+  int roff = fused->numInputs;
+  assert(fused->numWeights <= MAX_NUM_WEIGHTS);
+  for (int i = 0; i < fused->numWeights; i++) {
+    // weight_domain[i] = runtime->get_index_space_domain(
+    //     ctx, task->regions[i + roff].region.get_index_space());
+    weight_accessor[i] =
+        helperGetGenericTensorAccessorRO(fused->weight_data_types[i],
+                                         regions[i + roff],
+                                         task->regions[i + roff],
+                                         FID_DATA,
+                                         ctx,
+                                         runtime);
+  }
+  roff += fused->numWeights;
+  assert(fused->numOutputs <= MAX_NUM_OUTPUTS);
+  for (int i = 0; i < fused->numOutputs; i++) {
+    // output_domain[i] = runtime->get_index_space_domain(
+    //     ctx, task->regions[i + roff].region.get_index_space());
+    output_accessor[i] =
+        helperGetGenericTensorAccessorWO(fused->output_data_types[i],
+                                         regions[i + roff],
+                                         task->regions[i + roff],
+                                         FID_DATA,
+                                         ctx,
+                                         runtime);
+  }
+  // Assert that all meta share the same dnn/blas handler
+  int start = 0;
+  for (start = 0; start < fused->numOperators; start++) {
+    if (metas->meta[start] != NULL) {
+      break;
+    }
+  }
+  for (int op = start + 1; op < fused->numOperators; op++) {
+    if (metas->meta[op] != NULL) {
+      assert(metas->meta[start]->handle.blas == metas->meta[op]->handle.blas);
+      assert(metas->meta[start]->handle.dnn == metas->meta[op]->handle.dnn);
+    }
+  }
+
+  int ioff = 0, woff = 0, ooff = 0;
+  for (int op = 0; op < fused->numOperators; op++) {
+    // Domain my_id[MAX_NUM_INPUTS];
+    // Domain my_wd[MAX_NUM_WEIGHTS];
+    // Domain my_od[MAX_NUM_OUTPUTS];
+    GenericTensorAccessorR my_input_accessor[MAX_NUM_INPUTS];
+    GenericTensorAccessorR my_weight_accessor[MAX_NUM_WEIGHTS];
+    GenericTensorAccessorW my_output_accessor[MAX_NUM_OUTPUTS];
+    for (int i = 0; i < fused->op_num_inputs[op]; i++) {
+      int my_off = fused->op_input_idx[i + ioff];
+      if (fused->op_input_source[i + ioff] == SOURCE_INPUT) {
+        // my_id[i] = input_domain[my_off];
+        my_input_accessor[i] = input_accessor[my_off];
+      } else if (fused->op_input_source[i + ioff] == SOURCE_OUTPUT) {
+        // my_id[i] = output_domain[my_off];
+        my_input_accessor[i] = output_accessor[my_off];
+      } else {
+        assert(false);
+      }
+    }
+    for (int i = 0; i < fused->op_num_weights[op]; i++) {
+      assert(fused->op_weight_source[i + woff] == SOURCE_WEIGHT);
+      // my_wd[i] = weight_domain[fused->op_weight_idx[i + woff]];
+      // my_wp[i] = weight_ptr[fused->op_weight_idx[i + woff]];
+      my_weight_accessor[i] = weight_accessor[fused->op_weight_idx[i + woff]];
+    }
+    for (int i = 0; i < fused->op_num_outputs[op]; i++) {
+      assert(fused->op_output_source[i + ooff] == SOURCE_OUTPUT);
+      // my_od[i] = output_domain[fused->op_output_idx[i + ooff]];
+      // my_op[i] = output_ptr[fused->op_output_idx[i + ooff]];
+      my_output_accessor[i] = output_accessor[i + ooff];
+    }
+    switch (fused->op_op_type[op]) {
+      case OP_CONCAT: {
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        ConcatMeta *m = (ConcatMeta *)metas->meta[op];
+        int num_inputs = fused->op_num_inputs[op];
+        Kernels::Concat::forward_kernel_wrapper(m,
+                                                my_output_accessor[0],
+                                                my_input_accessor,
+                                                num_inputs,
+                                                m->legion_axis);
+        break;
+      }
+      case OP_BATCHNORM: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_accessor[0].domain.get_dim() == 5);
+        assert(my_output_accessor[0].domain.get_dim() == 5);
+        assert(my_weight_accessor[0].domain.get_dim() == 2);
+        assert(my_weight_accessor[1].domain.get_dim() == 2);
+        BatchNormMeta *m = (BatchNormMeta *)metas->meta[op];
+        BatchNorm::forward_kernel(m,
+                                  my_input_accessor[0].get_float_ptr(),
+                                  my_output_accessor[0].get_float_ptr(),
+                                  my_weight_accessor[0].get_float_ptr(),
+                                  my_weight_accessor[1].get_float_ptr());
+        break;
+      }
+      case OP_LINEAR: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        Domain kernel_domain = my_weight_accessor[0].domain;
+        int in_dim = kernel_domain.hi()[0] - kernel_domain.lo()[0] + 1;
+        int out_dim = kernel_domain.hi()[1] - kernel_domain.lo()[1] + 1;
+        int batch_size = my_input_accessor[0].domain.get_volume() / in_dim;
+        assert(my_output_accessor[0].domain.get_volume() ==
+               out_dim * batch_size);
+        assert(my_input_accessor[0].domain.get_volume() == in_dim * batch_size);
+        void const *bias_ptr = nullptr;
+        if (fused->op_num_weights[op] == 2) {
+          assert(my_weight_accessor[1].domain.get_volume() == out_dim);
+          bias_ptr = my_weight_accessor[1].ptr;
+        } else {
+          assert(fused->op_num_weights[op] == 1);
+        }
+        LinearMeta *m = (LinearMeta *)metas->meta[op];
+        assert(m->input_type[0] == my_input_accessor[0].data_type);
+        assert(m->input_type[0] == my_output_accessor[0].data_type);
+        batch_size = bc->num_active_tokens();
+        Kernels::Linear::forward_kernel_wrapper(m,
+                                                my_input_accessor[0].ptr,
+                                                my_output_accessor[0].ptr,
+                                                my_weight_accessor[0].ptr,
+                                                bias_ptr,
+                                                in_dim,
+                                                out_dim,
+                                                batch_size);
+        break;
+      }
+      case OP_BATCHMATMUL: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        Domain out_domain = my_output_accessor[0].domain;
+        Domain a_domain = my_input_accessor[0].domain;
+        Domain b_domain = my_input_accessor[1].domain;
+        int m = b_domain.hi()[0] - b_domain.lo()[0] + 1;
+        assert(m == out_domain.hi()[0] - out_domain.lo()[0] + 1);
+        int n = a_domain.hi()[1] - a_domain.lo()[1] + 1;
+        assert(n == out_domain.hi()[1] - out_domain.lo()[1] + 1);
+        int k = a_domain.hi()[0] - a_domain.lo()[0] + 1;
+        assert(k == b_domain.hi()[1] - b_domain.lo()[1] + 1);
+        assert(a_domain.get_dim() == b_domain.get_dim());
+        assert(a_domain.get_dim() == out_domain.get_dim());
+        int batch = 1;
+        for (int i = 2; i < a_domain.get_dim(); i++) {
+          int dim_size = a_domain.hi()[i] - a_domain.lo()[i] + 1;
+          assert(dim_size == b_domain.hi()[i] - b_domain.lo()[i] + 1);
+          assert(dim_size == out_domain.hi()[i] - out_domain.lo()[i] + 1);
+          batch *= dim_size;
+        }
+        BatchMatmulMeta *meta = (BatchMatmulMeta *)metas->meta[op];
+        Kernels::BatchMatmul::forward_kernel_wrapper(
+            meta,
+            my_output_accessor[0].get_float_ptr(),
+            my_input_accessor[0].get_float_ptr(),
+            my_input_accessor[1].get_float_ptr(),
+            (float const *)nullptr,
+            m,
+            n,
+            k,
+            batch,
+            meta->a_seq_length_dim,
+            meta->b_seq_length_dim,
+            fused->iter_config.seq_length);
+        break;
+      }
+      case OP_EW_ADD:
+      case OP_EW_SUB:
+      case OP_EW_MUL:
+      case OP_EW_DIV:
+      case OP_EW_MAX:
+      case OP_EW_MIN: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_accessor[0].domain == my_input_accessor[1].domain);
+        assert(my_input_accessor[0].domain == my_output_accessor[0].domain);
+        ElementBinaryMeta *m = (ElementBinaryMeta *)metas->meta[op];
+        Kernels::ElementBinary::forward_kernel_wrapper(m,
+                                                       my_input_accessor[0],
+                                                       my_input_accessor[1],
+                                                       my_output_accessor[0]);
+        break;
+      }
+      case OP_EMBEDDING: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        EmbeddingMeta *m = (EmbeddingMeta *)metas->meta[op];
+        if (m->aggr == AGGR_MODE_NONE) {
+          // assert(kernel_domain.get_dim() == 2);
+          assert(my_input_accessor[0].domain.get_dim() + 1 ==
+                 my_output_accessor[0].domain.get_dim());
+          for (size_t i = 0; i < my_input_accessor[0].domain.get_dim(); i++) {
+            assert(my_input_accessor[0].domain.hi()[i] ==
+                   my_output_accessor[0].domain.hi()[i + 1]);
+            assert(my_input_accessor[0].domain.lo()[i] ==
+                   my_output_accessor[0].domain.lo()[i + 1]);
+          }
+          assert(my_weight_accessor[0].domain.hi()[0] -
+                     my_weight_accessor[0].domain.lo()[0] ==
+                 my_output_accessor[0].domain.hi()[0] -
+                     my_output_accessor[0].domain.lo()[0]);
+        } else {
+          assert(my_input_accessor[0].domain.get_dim() ==
+                 my_output_accessor[0].domain.get_dim());
+          for (size_t i = 1; i < my_input_accessor[0].domain.get_dim(); i++) {
+            assert(my_input_accessor[0].domain.hi()[i] ==
+                   my_output_accessor[0].domain.hi()[i]);
+            assert(my_input_accessor[0].domain.lo()[i] ==
+                   my_output_accessor[0].domain.lo()[i]);
+          }
+          assert(my_weight_accessor[0].domain.hi()[0] -
+                     my_weight_accessor[0].domain.lo()[0] ==
+                 my_output_accessor[0].domain.hi()[0] -
+                     my_output_accessor[0].domain.lo()[0]);
+        }
+        int in_dim, out_dim, effective_batch_size;
+        if (m->aggr == AGGR_MODE_NONE) {
+          in_dim = 1;
+          out_dim = my_output_accessor[0].domain.hi()[0] -
+                    my_output_accessor[0].domain.lo()[0] + 1;
+          effective_batch_size =
+              my_output_accessor[0].domain.get_volume() / out_dim;
+          assert(effective_batch_size * in_dim ==
+                 my_input_accessor[0].domain.get_volume());
+        } else {
+          assert(m->aggr == AGGR_MODE_AVG || m->aggr == AGGR_MODE_SUM);
+          in_dim = my_input_accessor[0].domain.hi()[0] -
+                   my_input_accessor[0].domain.lo()[0] + 1;
+          out_dim = my_output_accessor[0].domain.hi()[0] -
+                    my_output_accessor[0].domain.lo()[0] + 1;
+          effective_batch_size =
+              my_output_accessor[0].domain.get_volume() / out_dim;
+          assert(effective_batch_size * in_dim ==
+                 my_input_accessor[0].domain.get_volume());
+        }
+
+        assert(my_input_accessor[0].data_type == DT_INT32 ||
+               my_input_accessor[0].data_type == DT_INT64);
+        Kernels::Embedding::forward_kernel_wrapper(m,
+                                                   my_input_accessor[0],
+                                                   my_output_accessor[0],
+                                                   my_weight_accessor[0],
+                                                   in_dim,
+                                                   out_dim,
+                                                   effective_batch_size);
+        break;
+      }
+      case OP_RELU:
+      case OP_SIGMOID:
+      case OP_TANH:
+      case OP_ELU: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_accessor[0].domain == my_output_accessor[0].domain);
+        ElementUnaryMeta *m = (ElementUnaryMeta *)metas->meta[op];
+        if (m->data_type == DT_HALF) {
+          ElementUnary::forward_kernel_wrapper(
+              m,
+              my_input_accessor[0].get_half_ptr(),
+              my_output_accessor[0].get_half_ptr(),
+              my_input_accessor[0].domain.get_volume());
+        } else if (m->data_type == DT_FLOAT) {
+          ElementUnary::forward_kernel_wrapper(
+              m,
+              my_input_accessor[0].get_float_ptr(),
+              my_output_accessor[0].get_float_ptr(),
+              my_input_accessor[0].domain.get_volume());
+        } else {
+          assert(false && "Unsupported data type in ElementUnary forward");
+        }
+        break;
+      }
+      case OP_RMS_NORM: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        RMSNormMeta const *m = (RMSNormMeta *)metas->meta[op];
+        Kernels::RMSNorm::forward_kernel_wrapper(m,
+                                                 my_input_accessor[0],
+                                                 my_weight_accessor[0],
+                                                 my_output_accessor[0]);
+        break;
+      }
+      case OP_INC_MULTIHEAD_SELF_ATTENTION: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        IncMultiHeadSelfAttentionMeta const *m =
+            (IncMultiHeadSelfAttentionMeta *)metas->meta[op];
+        assert(fused->op_num_weights[op] == (1 + (int)(*m->bias)));
+        GenericTensorAccessorR biases;
+        if (*m->bias) {
+          assert(fused->op_num_weights[op] == 2);
+          biases = my_weight_accessor[1];
+        }
+        IncMultiHeadSelfAttention::inference_kernel_wrapper(
+            m,
+            bc,
+            task->index_point.point_data[0],
+            my_input_accessor[0],
+            my_weight_accessor[0],
+            my_output_accessor[0],
+            biases);
+        break;
+      }
+      case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        TreeIncMultiHeadSelfAttentionMeta *m =
+            (TreeIncMultiHeadSelfAttentionMeta *)metas->meta[op];
+        TreeVerifyBatchConfig const *tree_bc =
+            (TreeVerifyBatchConfig *)task->args;
+        assert(fused->op_num_weights[op] == (1 + (int)(*m->bias)));
+        GenericTensorAccessorR biases;
+        if (*m->bias) {
+          assert(fused->op_num_weights[op] == 2);
+          biases = my_weight_accessor[1];
+        }
+        TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
+            m,
+            tree_bc,
+            task->index_point.point_data[0],
+            my_input_accessor[0],
+            my_weight_accessor[0],
+            my_output_accessor[0],
+            biases);
+        break;
+      }
+      case OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        SpecIncMultiHeadSelfAttentionMeta const *m =
+            (SpecIncMultiHeadSelfAttentionMeta *)metas->meta[op];
+        BeamSearchBatchConfig const *beam_bc =
+            (BeamSearchBatchConfig *)task->args;
+        assert(fused->op_num_weights[op] == (1 + (int)(*m->bias)));
+        GenericTensorAccessorR biases;
+        if (*m->bias) {
+          assert(fused->op_num_weights[op] == 2);
+          biases = my_weight_accessor[1];
+        }
+        SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
+            m,
+            beam_bc,
+            task->index_point.point_data[0],
+            my_input_accessor[0],
+            my_weight_accessor[0],
+            my_output_accessor[0],
+            biases);
+        break;
+      }
+      case OP_LAYERNORM: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        LayerNormMeta const *m = (LayerNormMeta *)metas->meta[op];
+        assert(fused->op_num_weights[op] == 2 * (int)(m->elementwise_affine));
+        GenericTensorAccessorR gamma, beta;
+        if (m->elementwise_affine) {
+          gamma = my_weight_accessor[0];
+          beta = my_weight_accessor[1];
+        }
+        LayerNorm::forward_kernel_wrapper(
+            m, my_input_accessor[0], my_output_accessor[0], gamma, beta);
+        break;
+      }
+      case OP_ALLREDUCE: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        AllReduceMeta const *m = (AllReduceMeta *)metas->meta[op];
+        Kernels::AllReduce::forward_kernel_wrapper(
+            m, my_input_accessor[0], my_output_accessor[0]);
+        break;
+      }
+      default: {
+        fprintf(stderr,
+                "Fusion currently does not support type = %d\n",
+                fused->op_op_type[op]);
+        assert(false && "Fusion currently does not support type");
+      }
+    }
+    ioff += fused->op_num_inputs[op];
+    woff += fused->op_num_weights[op];
+    ooff += fused->op_num_outputs[op];
+  }
+  // for (int i = 0; i < fused->numOutputs; i++)
+  //   print_tensor<float>(output_ptr[i], output_domain[i].get_volume(),
+  //   "[Fused:forward:output]");
+}
+
 /*
   regions[...](I): input
   regions[...](I): weight
@@ -458,7 +895,6 @@ __host__ void FusedOp::forward_task(Task const *task,
   regions[...](I/O): weight_grad
   regions[...](I/O): output_grad
 */
-
 __host__ void FusedOp::backward_task(Task const *task,
                                      std::vector<PhysicalRegion> const &regions,
                                      Context ctx,
diff --git a/src/ops/gather.cc b/src/ops/gather.cc
index f094fe38b0..635c741d8b 100644
--- a/src/ops/gather.cc
+++ b/src/ops/gather.cc
@@ -166,6 +166,7 @@ void Gather::serialize(Legion::Serializer &sez) const {
   GatherParams params = get_params();
   sez.serialize(params.legion_dim);
   sez.serialize(this->layer_guid.id);
+  sez.serialize(this->layer_guid.transformer_layer_id);
 }
 
 using PCG::Node;
@@ -177,9 +178,10 @@ Node Gather::deserialize(FFModel &ff,
   assert(num_inputs == 2);
   int legion_dim;
   dez.deserialize(legion_dim);
-  size_t id;
+  size_t id, transformer_layer_id;
   dez.deserialize(id);
-  LayerID layer_guid(id);
+  dez.deserialize(transformer_layer_id);
+  LayerID layer_guid(id, transformer_layer_id);
 
   GatherParams params;
   params.legion_dim = legion_dim;
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 991b6d2236..f5b72b9ac8 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -452,7 +452,7 @@ void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
   }
   cudaMemcpyAsync(m->token_infos,
                   &(bc->tokensInfo),
-                  bc->MAX_NUM_TOKENS * sizeof(BatchConfig::PerTokenInfo),
+                  bc->num_active_tokens() * sizeof(BatchConfig::PerTokenInfo),
                   cudaMemcpyHostToDevice,
                   stream);
   // phase 1: Implement kernel to compute KQV for input tokens
diff --git a/src/ops/kernels/linear_kernels.cpp b/src/ops/kernels/linear_kernels.cpp
index 55a47d7108..41b9912702 100644
--- a/src/ops/kernels/linear_kernels.cpp
+++ b/src/ops/kernels/linear_kernels.cpp
@@ -75,12 +75,13 @@ void Linear::init_kernel(LinearMeta *m, int batch_size, int channel) {
         assert(false);
     }
     checkCUDNN(miopenSetActivationDescriptor(m->actiDesc, mode, 0.0, 0.0, 0.0));
-    checkCUDNN(miopenSet4dTensorDescriptor(m->outputTensor,
-                                           ff_to_cudnn_datatype(m->output_type),
-                                           batch_size,
-                                           channel,
-                                           1,
-                                           1));
+    checkCUDNN(
+        miopenSet4dTensorDescriptor(m->outputTensor,
+                                    ff_to_cudnn_datatype(m->output_type[0]),
+                                    batch_size,
+                                    channel,
+                                    1,
+                                    1));
   }
 }
 
@@ -102,7 +103,7 @@ void forward_kernel_wrapper(LinearMeta const *m,
     hipEventRecord(t_start, stream);
   }
 
-  if (m->input_type == DT_FLOAT) {
+  if (m->input_type[0] == DT_FLOAT) {
     Internal::forward_kernel<float>(m,
                                     input_ptr,
                                     output_ptr,
@@ -112,7 +113,7 @@ void forward_kernel_wrapper(LinearMeta const *m,
                                     out_dim,
                                     batch_size,
                                     stream);
-  } else if (m->input_type == DT_HALF) {
+  } else if (m->input_type[0] == DT_HALF) {
     Internal::forward_kernel<half>(m,
                                    input_ptr,
                                    output_ptr,
@@ -161,7 +162,7 @@ void backward_kernel_wrapper(LinearMeta const *m,
     hipEventCreate(&t_end);
     hipEventRecord(t_start, stream);
   }
-  if (m->input_type == DT_FLOAT) {
+  if (m->input_type[0] == DT_FLOAT) {
     Internal::backward_kernel<float>(m,
                                      input_ptr,
                                      input_grad_ptr,
@@ -174,7 +175,7 @@ void backward_kernel_wrapper(LinearMeta const *m,
                                      out_dim,
                                      batch_size,
                                      stream);
-  } else if (m->input_type == DT_HALF) {
+  } else if (m->input_type[0] == DT_HALF) {
     Internal::backward_kernel<half>(m,
                                     input_ptr,
                                     input_grad_ptr,
@@ -236,9 +237,9 @@ void forward_kernel(LinearMeta const *m,
   checkCUDA(hipblasSetStream(m->handle.blas, stream));
   checkCUDNN(miopenSetStream(m->handle.dnn, stream));
   DT alpha = 1.0f, beta = 0.0f;
-  hipblasDatatype_t input_type = ff_to_cuda_datatype(m->input_type);
-  hipblasDatatype_t weight_type = ff_to_cuda_datatype(m->weight_type);
-  hipblasDatatype_t output_type = ff_to_cuda_datatype(m->output_type);
+  hipblasDatatype_t input_type = ff_to_cuda_datatype(m->input_type[0]);
+  hipblasDatatype_t weight_type = ff_to_cuda_datatype(m->weight_type[0]);
+  hipblasDatatype_t output_type = ff_to_cuda_datatype(m->output_type[0]);
 #if CUDA_VERSION >= 11000
   // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
   cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
@@ -332,9 +333,9 @@ void backward_kernel(LinearMeta const *m,
   checkCUDNN(miopenSetStream(m->handle.dnn, stream));
 
   DT alpha = 1.0f;
-  hipblasDatatype_t input_type = ff_to_cuda_datatype(m->input_type);
-  hipblasDatatype_t weight_type = ff_to_cuda_datatype(m->weight_type);
-  hipblasDatatype_t output_type = ff_to_cuda_datatype(m->output_type);
+  hipblasDatatype_t input_type = ff_to_cuda_datatype(m->input_type[0]);
+  hipblasDatatype_t weight_type = ff_to_cuda_datatype(m->weight_type[0]);
+  hipblasDatatype_t output_type = ff_to_cuda_datatype(m->output_type[0]);
 #if CUDA_VERSION >= 11000
   // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
   cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
@@ -344,10 +345,10 @@ void backward_kernel(LinearMeta const *m,
   int output_size = out_dim * batch_size;
   if (m->activation == AC_MODE_RELU) {
     relu_backward_kernel(
-        m->output_type, output_grad_ptr, output_ptr, output_size, stream);
+        m->output_type[0], output_grad_ptr, output_ptr, output_size, stream);
   } else if (m->activation == AC_MODE_SIGMOID) {
     sigmoid_backward_kernel(
-        m->output_type, output_grad_ptr, output_ptr, output_size, stream);
+        m->output_type[0], output_grad_ptr, output_ptr, output_size, stream);
   } else {
     // TODO: only support relu and sigmoid for now
     assert(m->activation == AC_MODE_NONE);
diff --git a/src/ops/kernels/linear_kernels.cu b/src/ops/kernels/linear_kernels.cu
index 3f806dd4f5..06677f86e6 100644
--- a/src/ops/kernels/linear_kernels.cu
+++ b/src/ops/kernels/linear_kernels.cu
@@ -96,13 +96,14 @@ void init_kernel(LinearMeta *m, int batch_size, int channel) {
     }
     checkCUDNN(cudnnSetActivationDescriptor(
         m->actiDesc, mode, CUDNN_PROPAGATE_NAN, 0.0));
-    checkCUDNN(cudnnSetTensor4dDescriptor(m->outputTensor,
-                                          CUDNN_TENSOR_NCHW,
-                                          ff_to_cudnn_datatype(m->output_type),
-                                          batch_size,
-                                          channel,
-                                          1,
-                                          1));
+    checkCUDNN(
+        cudnnSetTensor4dDescriptor(m->outputTensor,
+                                   CUDNN_TENSOR_NCHW,
+                                   ff_to_cudnn_datatype(m->output_type[0]),
+                                   batch_size,
+                                   channel,
+                                   1,
+                                   1));
   }
 }
 
@@ -122,7 +123,7 @@ void forward_kernel_wrapper(LinearMeta const *m,
     cudaEventCreate(&t_end);
     cudaEventRecord(t_start, stream);
   }
-  if (m->input_type == DT_FLOAT) {
+  if (m->input_type[0] == DT_FLOAT) {
     Internal::forward_kernel<float>(m,
                                     input_ptr,
                                     output_ptr,
@@ -132,7 +133,7 @@ void forward_kernel_wrapper(LinearMeta const *m,
                                     out_dim,
                                     batch_size,
                                     stream);
-  } else if (m->input_type == DT_HALF) {
+  } else if (m->input_type[0] == DT_HALF) {
     Internal::forward_kernel<half>(m,
                                    input_ptr,
                                    output_ptr,
@@ -180,7 +181,7 @@ void backward_kernel_wrapper(LinearMeta const *m,
     cudaEventCreate(&t_end);
     cudaEventRecord(t_start, stream);
   }
-  if (m->input_type == DT_FLOAT) {
+  if (m->input_type[0] == DT_FLOAT) {
     Internal::backward_kernel<float>(m,
                                      input_ptr,
                                      input_grad_ptr,
@@ -193,7 +194,7 @@ void backward_kernel_wrapper(LinearMeta const *m,
                                      out_dim,
                                      batch_size,
                                      stream);
-  } else if (m->input_type == DT_HALF) {
+  } else if (m->input_type[0] == DT_HALF) {
     Internal::backward_kernel<half>(m,
                                     input_ptr,
                                     input_grad_ptr,
@@ -295,11 +296,11 @@ void forward_kernel(LinearMeta const *m,
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
   DT alpha = 1.0f, beta = 0.0f;
-  cudaDataType_t input_type = ff_to_cuda_datatype(m->input_type);
+  cudaDataType_t input_type = ff_to_cuda_datatype(m->input_type[0]);
   cudaDataType_t weight_type = m->offload
                                    ? ff_to_cuda_datatype(m->weight_ptr_type)
-                                   : ff_to_cuda_datatype(m->weight_type);
-  cudaDataType_t output_type = ff_to_cuda_datatype(m->output_type);
+                                   : ff_to_cuda_datatype(m->weight_type[0]);
+  cudaDataType_t output_type = ff_to_cuda_datatype(m->output_type[0]);
   assert(input_type == weight_type && weight_type == output_type);
 #if CUDA_VERSION >= 11000
   // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
@@ -388,9 +389,9 @@ void backward_kernel(LinearMeta const *m,
 
   DT alpha = 1.0f;
   float sgeam_alpha = 1.0f;
-  cudaDataType_t input_type = ff_to_cuda_datatype(m->input_type);
-  cudaDataType_t weight_type = ff_to_cuda_datatype(m->weight_type);
-  cudaDataType_t output_type = ff_to_cuda_datatype(m->output_type);
+  cudaDataType_t input_type = ff_to_cuda_datatype(m->input_type[0]);
+  cudaDataType_t weight_type = ff_to_cuda_datatype(m->weight_type[0]);
+  cudaDataType_t output_type = ff_to_cuda_datatype(m->output_type[0]);
 #if CUDA_VERSION >= 11000
   // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
   cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
@@ -400,10 +401,10 @@ void backward_kernel(LinearMeta const *m,
   int output_size = out_dim * batch_size;
   if (m->activation == AC_MODE_RELU) {
     relu_backward_kernel(
-        m->output_type, output_grad_ptr, output_ptr, output_size, stream);
+        m->output_type[0], output_grad_ptr, output_ptr, output_size, stream);
   } else if (m->activation == AC_MODE_SIGMOID) {
     sigmoid_backward_kernel(
-        m->output_type, output_grad_ptr, output_ptr, output_size, stream);
+        m->output_type[0], output_grad_ptr, output_ptr, output_size, stream);
   } else {
     // TODO: only support relu and sigmoid for now
     assert(m->activation == AC_MODE_NONE);
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index 0c08a2426f..0124c827f3 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -216,33 +216,39 @@ LayerNorm::LayerNorm(FFModel &model,
   for (int i = 0; i < axes.size(); i++) {
     M *= inputs[0]->dims[axes[i]].size;
   }
+  int num_replicas = 1;
+  for (int i = 0; i < inputs[0]->num_dims; i++) {
+    if (inputs[0]->dims[i].is_replica_dim) {
+      num_replicas *= inputs[0]->dims[i].size;
+    }
+  }
   effective_num_elements = M;
-  effective_batch_size = inputs[0]->get_volume() / M;
+  effective_batch_size = (inputs[0]->get_volume() / num_replicas) / M;
   assert(elementwise_affine == (numWeights == 2));
   if (numWeights > 0 && allocate_weights) {
-    ParallelDim dims[axes.size()];
-    for (int i = 0; i < axes.size(); i++) {
-      dims[i] = inputs[0]->dims[i];
+    ParallelTensorShape beta_gamma_shape = _input->get_shape();
+    for (int i = axes.size(); i < beta_gamma_shape.num_dims - 1; i++) {
+      beta_gamma_shape.dims[i].size = 1;
     }
     int seed = std::rand();
     Initializer *gamma_initializer = new UniformInitializer(seed, 1.0f, 1.0f);
     Initializer *beta_initializer = new UniformInitializer(seed, 0.0f, 0.0f);
-    weights[0] =
-        model.create_parallel_weight_legion_ordering(axes.size(),
-                                                     dims,
-                                                     _input->data_type,
-                                                     NULL /*owner_op*/,
-                                                     true /*create_grad*/,
-                                                     gamma_initializer,
-                                                     CHOSEN_SYNC_TYPE);
-    weights[1] =
-        model.create_parallel_weight_legion_ordering(axes.size(),
-                                                     dims,
-                                                     _input->data_type,
-                                                     NULL /*owner_op*/,
-                                                     true /*create_grad*/,
-                                                     beta_initializer,
-                                                     CHOSEN_SYNC_TYPE);
+    weights[0] = model.create_parallel_weight_legion_ordering(
+        beta_gamma_shape.num_dims, // axes.size(),
+        beta_gamma_shape.dims,
+        _input->data_type,
+        NULL /*owner_op*/,
+        true /*create_grad*/,
+        gamma_initializer,
+        CHOSEN_SYNC_TYPE);
+    weights[1] = model.create_parallel_weight_legion_ordering(
+        beta_gamma_shape.num_dims, //.size(),
+        beta_gamma_shape.dims,
+        _input->data_type,
+        NULL /*owner_op*/,
+        true /*create_grad*/,
+        beta_initializer,
+        CHOSEN_SYNC_TYPE);
   }
 }
 
@@ -383,13 +389,13 @@ void LayerNorm::forward(FFModel const &ff) {
   if (elementwise_affine) {
     launcher.add_region_requirement(RegionRequirement(weights[0]->part,
                                                       0 /*projection id*/,
-                                                      READ_WRITE,
+                                                      READ_ONLY,
                                                       EXCLUSIVE,
                                                       weights[0]->region));
     launcher.add_field(2, FID_DATA);
     launcher.add_region_requirement(RegionRequirement(weights[1]->part,
                                                       0 /*projection id*/,
-                                                      READ_WRITE,
+                                                      READ_ONLY,
                                                       EXCLUSIVE,
                                                       weights[1]->region));
     launcher.add_field(3, FID_DATA);
@@ -434,13 +440,13 @@ FutureMap LayerNorm::inference(FFModel const &ff,
   if (elementwise_affine) {
     launcher.add_region_requirement(RegionRequirement(weights[0]->part,
                                                       0 /*projection id*/,
-                                                      READ_WRITE,
+                                                      READ_ONLY,
                                                       EXCLUSIVE,
                                                       weights[0]->region));
     launcher.add_field(2, FID_DATA);
     launcher.add_region_requirement(RegionRequirement(weights[1]->part,
                                                       0 /*projection id*/,
-                                                      READ_WRITE,
+                                                      READ_ONLY,
                                                       EXCLUSIVE,
                                                       weights[1]->region));
     launcher.add_field(3, FID_DATA);
@@ -462,8 +468,8 @@ void LayerNorm::forward_task(Task const *task,
   assert(task->regions.size() == regions.size());
   float const *in_ptr = NULL;
   float *out_ptr = NULL, *gamma_ptr = NULL, *beta_ptr = NULL;
-  GenericTensorAccessorR in;
-  GenericTensorAccessorW out, gamma, beta;
+  GenericTensorAccessorR in, gamma, beta;
+  GenericTensorAccessorW out;
 
   Domain in_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
@@ -486,21 +492,25 @@ void LayerNorm::forward_task(Task const *task,
         ctx, task->regions[2].region.get_index_space());
     // gamma_ptr = helperGetTensorPointerRW<float>(
     //     regions[2], task->regions[2], FID_DATA, ctx, runtime);
-    gamma = helperGetGenericTensorAccessorRW(
+    gamma = helperGetGenericTensorAccessorRO(
         m->input_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
     Domain beta_domain = runtime->get_index_space_domain(
         ctx, task->regions[3].region.get_index_space());
     // beta_ptr = helperGetTensorPointerRW<float>(
     //     regions[3], task->regions[3], FID_DATA, ctx, runtime);
-    beta = helperGetGenericTensorAccessorRW(
+    beta = helperGetGenericTensorAccessorRO(
         m->input_type[0], regions[3], task->regions[3], FID_DATA, ctx, runtime);
     assert(gamma_domain == beta_domain);
     assert(gamma_domain.get_volume() == m->effective_num_elements);
     int numdims = gamma_domain.get_dim();
-    for (int i = 0; i < numdims; i++) {
+    size_t vol = 1;
+    int i = 0;
+    while (vol < gamma_domain.get_volume()) {
       int g_d = gamma_domain.hi()[i] - gamma_domain.lo()[i] + 1;
       int in_d = in_domain.hi()[i] - in_domain.lo()[i] + 1;
       assert(g_d == in_d);
+      vol *= g_d;
+      i++;
     }
   } else {
     assert(regions.size() == 2);
@@ -730,6 +740,7 @@ bool LayerNorm::measure_operator_cost(Simulator *sim,
 
 void LayerNorm::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
+  sez.serialize(this->layer_guid.transformer_layer_id);
   sez.serialize(this->axes.size());
   for (size_t i = 0; i < this->axes.size(); i++) {
     sez.serialize(this->axes[i]);
@@ -749,9 +760,10 @@ Node LayerNorm::deserialize(FFModel &ff,
   std::vector<int> axes;
   bool elementwise_affine;
   float eps;
-  size_t id;
+  size_t id, transformer_layer_id;
   dez.deserialize(id);
-  LayerID layer_guid(id);
+  dez.deserialize(transformer_layer_id);
+  LayerID layer_guid(id, transformer_layer_id);
   dez.deserialize(num_axes);
   for (size_t i = 0; i < num_axes; i++) {
     int axis_idx;
diff --git a/src/ops/layer_norm.cpp b/src/ops/layer_norm.cpp
index 3f1c621e71..fc6be70c74 100644
--- a/src/ops/layer_norm.cpp
+++ b/src/ops/layer_norm.cpp
@@ -129,8 +129,8 @@ template <typename T>
 void LayerNorm::forward_kernel(LayerNormMeta const *m,
                                T const *in_ptr,
                                T *out_ptr,
-                               T *gamma_ptr,
-                               T *beta_ptr,
+                               T const *gamma_ptr,
+                               T const *beta_ptr,
                                hipStream_t stream) {
   hipLaunchKernelGGL(HIP_KERNEL_NAME(RowwiseMomentsCUDAKernel<T>),
                      m->effective_batch_size,
@@ -160,8 +160,8 @@ void LayerNorm::forward_kernel(LayerNormMeta const *m,
 void LayerNorm::forward_kernel_wrapper(LayerNormMeta const *m,
                                        GenericTensorAccessorR const &input,
                                        GenericTensorAccessorW &output,
-                                       GenericTensorAccessorW &gamma,
-                                       GenericTensorAccessorW &beta) {
+                                       GenericTensorAccessorR const &gamma,
+                                       GenericTensorAccessorR const &beta) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   if (m->input_type[0] == DT_FLOAT) {
diff --git a/src/ops/layer_norm.cu b/src/ops/layer_norm.cu
index 35616de980..1f4e7d3933 100644
--- a/src/ops/layer_norm.cu
+++ b/src/ops/layer_norm.cu
@@ -135,8 +135,8 @@ template <typename T>
 void LayerNorm::forward_kernel(LayerNormMeta const *m,
                                T const *in_ptr,
                                T *out_ptr,
-                               T *gamma_ptr,
-                               T *beta_ptr,
+                               T const *gamma_ptr,
+                               T const *beta_ptr,
                                cudaStream_t stream) {
   RowwiseMomentsCUDAKernel<T>
       <<<m->effective_batch_size, kCUDABlockReduceNumThreads, 0, stream>>>(
@@ -160,8 +160,8 @@ void LayerNorm::forward_kernel(LayerNormMeta const *m,
 void LayerNorm::forward_kernel_wrapper(LayerNormMeta const *m,
                                        GenericTensorAccessorR const &input,
                                        GenericTensorAccessorW &output,
-                                       GenericTensorAccessorW &gamma,
-                                       GenericTensorAccessorW &beta) {
+                                       GenericTensorAccessorR const &gamma,
+                                       GenericTensorAccessorR const &beta) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index cca92f014f..c5903c1e74 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -504,10 +504,7 @@ OpMeta *Linear::init_task_with_dim(Task const *task,
   m->add_bias_only_once = linear->add_bias_only_once;
   m->profiling = linear->profiling;
   m->trainableInputs[0] = linear->trainableInputs[0];
-  m->input_type = linear->inputs[0]->data_type;
-  m->weight_type = linear->weights[0]->data_type;
-  m->output_type = linear->outputs[0]->data_type;
-  m->weight_ptr_type = m->input_type;
+  m->weight_ptr_type = m->input_type[0];
   m->quantization_type = linear->quantization_type;
   m->offload = linear->offload;
   std::strcpy(m->op_name, linear->name);
@@ -573,9 +570,9 @@ FutureMap Linear::inference(FFModel const &ff,
   size_t machine_view_hash = view->hash();
   /* std::cout << "Linear op machine_view: " << *(MachineView const *)mv
             << std::endl; */
-  IndexLauncher launcher(LINEAR_FWD_TASK_ID,
+  IndexLauncher launcher(LINEAR_INF_TASK_ID,
                          parallel_is,
-                         TaskArgument(nullptr, 0),
+                         TaskArgument(&bc, sizeof(BatchConfig)),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
@@ -612,6 +609,52 @@ FutureMap Linear::inference(FFModel const &ff,
   return runtime->execute_index_space(ctx, launcher);
 }
 
+void Linear::inference_task(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
+  Domain input_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  LinearMeta const *m = *((LinearMeta **)task->local_args);
+  BatchConfig const *bc = (BatchConfig *)task->args;
+  assert(regions.size() == (3 + static_cast<size_t>(m->use_bias)));
+  assert(task->regions.size() == (3 + static_cast<size_t>(m->use_bias)));
+  if (m->quantization_type == DT_NONE) {
+    assert(m->input_type[0] == m->weight_type[0]);
+  }
+  assert(m->input_type[0] == m->output_type[0]);
+
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
+      m->weight_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  int in_dim = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+  int out_dim = output.domain.hi()[0] - output.domain.lo()[0] + 1;
+
+  int batch_size = bc->num_active_tokens();
+  GenericTensorAccessorR bias;
+  if (m->use_bias &&
+      !(m->add_bias_only_once && task->index_point.point_data[0] != 0)) {
+    bias = helperGetGenericTensorAccessorRO(m->weight_type[1],
+                                            regions[3],
+                                            task->regions[3],
+                                            FID_DATA,
+                                            ctx,
+                                            runtime);
+    assert(bias.domain.get_volume() == static_cast<size_t>(out_dim));
+  }
+  forward_kernel_wrapper(m,
+                         input.ptr,
+                         output.ptr,
+                         weight.ptr,
+                         bias.ptr,
+                         in_dim,
+                         out_dim,
+                         batch_size);
+}
+
 void Linear::forward_task(Task const *task,
                           std::vector<PhysicalRegion> const &regions,
                           Context ctx,
@@ -620,13 +663,13 @@ void Linear::forward_task(Task const *task,
       ctx, task->regions[0].region.get_index_space());
   LinearMeta const *m = *((LinearMeta **)task->local_args);
   if (m->quantization_type == DT_NONE) {
-    assert(m->input_type == m->weight_type);
+    assert(m->input_type[0] == m->weight_type[0]);
   }
-  assert(m->input_type == m->output_type);
+  assert(m->input_type[0] == m->output_type[0]);
   switch (input_domain.get_dim()) {
 #define DIMFUNC(DIM)                                                           \
   case DIM:                                                                    \
-    if (m->output_type == DT_HALF) {                                           \
+    if (m->output_type[0] == DT_HALF) {                                        \
       if (m->quantization_type != DT_NONE) {                                   \
         return forward_task_with_dim<half, char, DIM>(                         \
             task, regions, ctx, runtime);                                      \
@@ -634,7 +677,7 @@ void Linear::forward_task(Task const *task,
         return forward_task_with_dim<half, half, DIM>(                         \
             task, regions, ctx, runtime);                                      \
       }                                                                        \
-    } else if (m->output_type == DT_FLOAT) {                                   \
+    } else if (m->output_type[0] == DT_FLOAT) {                                \
       if (m->quantization_type != DT_NONE) {                                   \
         return forward_task_with_dim<float, char, DIM>(                        \
             task, regions, ctx, runtime);                                      \
@@ -787,15 +830,15 @@ void Linear::backward_task(Task const *task,
       ctx, task->regions[0].region.get_index_space());
   LinearMeta const *m = *((LinearMeta **)task->local_args);
   if (m->quantization_type == DT_NONE) {
-    assert(m->input_type == m->weight_type);
+    assert(m->input_type[0] == m->weight_type[0]);
   }
-  assert(m->input_type == m->output_type);
+  assert(m->input_type[0] == m->output_type[0]);
   switch (in_domain.get_dim()) {
 #define DIMFUNC(DIM)                                                           \
   case DIM:                                                                    \
-    if (m->output_type == DT_HALF) {                                           \
+    if (m->output_type[0] == DT_HALF) {                                        \
       return backward_task_with_dim<half, DIM>(task, regions, ctx, runtime);   \
-    } else if (m->output_type == DT_FLOAT) {                                   \
+    } else if (m->output_type[0] == DT_FLOAT) {                                \
       return backward_task_with_dim<float, DIM>(task, regions, ctx, runtime);  \
     } else {                                                                   \
       assert(false && "Unsupported data type");                                \
@@ -1068,9 +1111,9 @@ bool Linear::measure_operator_cost(Simulator *sim,
   m->activation = activation;
   m->kernel_reg_type = kernel_reg_type;
   m->kernel_reg_lambda = kernel_reg_lambda;
-  m->input_type = inputs[0]->data_type;
-  m->weight_type = this->data_type;
-  m->output_type = outputs[0]->data_type;
+  m->input_type[0] = inputs[0]->data_type;
+  m->weight_type[0] = this->data_type;
+  m->output_type[0] = outputs[0]->data_type;
   assert(m->profiling == false);
 
   init_kernel(m, output_n, output_c);
@@ -1186,6 +1229,7 @@ bool operator==(LinearParams const &lhs, LinearParams const &rhs) {
 
 void Linear::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
+  sez.serialize(this->layer_guid.transformer_layer_id);
   sez.serialize(this->out_channels);
   sez.serialize(this->activation);
   sez.serialize(this->kernel_reg_type);
@@ -1211,9 +1255,10 @@ Node Linear::deserialize(FFModel &ff,
   DataType data_type;
   DataType quantization_type;
   bool offload;
-  size_t id;
+  size_t id, transformer_layer_id;
   dez.deserialize(id);
-  LayerID layer_guid(id);
+  dez.deserialize(transformer_layer_id);
+  LayerID layer_guid(id, transformer_layer_id);
   dez.deserialize(out_channels);
   dez.deserialize(activation);
   dez.deserialize(kernel_reg_type);
diff --git a/src/ops/reduce.cc b/src/ops/reduce.cc
index 5761281686..36112b0812 100644
--- a/src/ops/reduce.cc
+++ b/src/ops/reduce.cc
@@ -374,6 +374,7 @@ void Reduce::serialize(Legion::Serializer &sez) const {
   }
   sez.serialize(params.keepdims);
   sez.serialize(this->layer_guid.id);
+  sez.serialize(this->layer_guid.transformer_layer_id);
 }
 
 using PCG::Node;
@@ -392,9 +393,10 @@ Node Reduce::deserialize(FFModel &ff,
     axes.push_back(dim_idx);
   }
   dez.deserialize(keepdims);
-  size_t id;
+  size_t id, transformer_layer_id;
   dez.deserialize(id);
-  LayerID layer_guid(id);
+  dez.deserialize(transformer_layer_id);
+  LayerID layer_guid(id, transformer_layer_id);
 
   return ff.get_or_create_node<Reduce>(inputs[0], {axes, keepdims, layer_guid});
 }
diff --git a/src/ops/reshape.cc b/src/ops/reshape.cc
index 2b8a60bf21..41c3fcdbf1 100644
--- a/src/ops/reshape.cc
+++ b/src/ops/reshape.cc
@@ -410,6 +410,7 @@ void Reshape::serialize(Legion::Serializer &sez) const {
     sez.serialize(this->shape_array[i]);
   }
   sez.serialize(this->layer_guid.id);
+  sez.serialize(this->layer_guid.transformer_layer_id);
 }
 
 using PCG::Node;
@@ -427,9 +428,10 @@ Node Reshape::deserialize(FFModel &ff,
     dez.deserialize(value);
     shape.push_back(value);
   }
-  size_t id;
+  size_t id, transformer_layer_id;
   dez.deserialize(id);
-  LayerID layer_guid(id);
+  dez.deserialize(transformer_layer_id);
+  LayerID layer_guid(id, transformer_layer_id);
 
   ReshapeParams params;
   params.shape = shape;
diff --git a/src/ops/rms_norm.cc b/src/ops/rms_norm.cc
index a926fd3b22..e0076b5202 100644
--- a/src/ops/rms_norm.cc
+++ b/src/ops/rms_norm.cc
@@ -165,7 +165,11 @@ RMSNorm::RMSNorm(FFModel &model,
   for (int i = 1; i <= num_dims - 2; i++) {
     effective_batch_size *= _input->dims[i].size;
   }
-
+  // Currently assert that all non-replica dims are not parallelized
+  // We only support parallelism along the replica dim now
+  for (int i = 0; i < _input->num_dims - 1; i++) {
+    assert(_input->dims[i].degree == 1);
+  }
   // output has the same parallel dims as input
   ParallelDim output_dims[MAX_TENSOR_DIM];
   for (int i = 0; i < _input->num_dims; i++) {
@@ -173,15 +177,14 @@ RMSNorm::RMSNorm(FFModel &model,
   }
   outputs[0] = model.create_parallel_tensor_legion_ordering(
       _input->num_dims, output_dims, _input->data_type, this);
-
   if (allocate_weights) {
     // weights should have the shape of (data_dim, data_dim)
     ParallelDim new_weight_dims[MAX_TENSOR_DIM];
 
-    new_weight_dims[0] = _input->dims[_input->num_dims - 1];
-    new_weight_dims[1].size = dim;
-    new_weight_dims[1].degree = 1;
-    new_weight_dims[1].parallel_idx = -1;
+    new_weight_dims[0].size = dim;
+    new_weight_dims[0].degree = 1;
+    new_weight_dims[0].parallel_idx = -1;
+    new_weight_dims[1] = _input->dims[_input->num_dims - 1]; // replica dim
 
     // weights
     Initializer *kernel_initializer = new GlorotUniform(std::rand() /*seed*/);
@@ -189,7 +192,7 @@ RMSNorm::RMSNorm(FFModel &model,
         model.create_parallel_weight_legion_ordering(2,
                                                      new_weight_dims,
                                                      _input->data_type,
-                                                     NULL /*owner_op*/,
+                                                     nullptr /*owner_op*/,
                                                      false /*create_grad*/,
                                                      kernel_initializer,
                                                      CHOSEN_SYNC_TYPE);
@@ -389,6 +392,7 @@ void RMSNorm::forward_task(Task const *task,
 
 void RMSNorm::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
+  sez.serialize(this->layer_guid.transformer_layer_id);
   sez.serialize(this->eps);
   sez.serialize(this->dim);
 }
@@ -401,11 +405,12 @@ Node RMSNorm::deserialize(FFModel &ff,
                           int num_inputs) {
   assert(num_inputs == 1);
   float eps;
-  size_t id;
+  size_t id, transformer_layer_id;
   int dim;
   dez.deserialize(id);
+  dez.deserialize(transformer_layer_id);
 
-  LayerID layer_guid(id);
+  LayerID layer_guid(id, transformer_layer_id);
   dez.deserialize(eps);
   dez.deserialize(dim);
   RMSNormParams params;
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index 541322efc4..b46ccb4853 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -498,7 +498,7 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
   // keys/values to the key-value cache
   cudaMemcpyAsync(m->committed_token_infos,
                   &(bc->committed_tokens),
-                  bc->MAX_NUM_TOKENS *
+                  bc->num_tokens_to_commit *
                       sizeof(TreeVerifyBatchConfig::CommittedTokensInfo),
                   cudaMemcpyHostToDevice,
                   stream);
diff --git a/src/parallel_ops/allreduce.cc b/src/parallel_ops/allreduce.cc
new file mode 100644
index 0000000000..123e85c7c5
--- /dev/null
+++ b/src/parallel_ops/allreduce.cc
@@ -0,0 +1,362 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/parallel_ops/allreduce.h"
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/model.h"
+#include "flexflow/parallel_ops/kernels/allreduce_kernels.h"
+#include "flexflow/utils/hash_utils.h"
+
+namespace FlexFlow {
+// declare Legion names
+using Legion::ArgumentMap;
+using Legion::Context;
+using Legion::coord_t;
+using Legion::Domain;
+using Legion::FutureMap;
+using Legion::IndexLauncher;
+using Legion::LogicalPartition;
+using Legion::LogicalRegion;
+using Legion::Machine;
+using Legion::Memory;
+using Legion::PhysicalRegion;
+using Legion::Predicate;
+using Legion::Rect;
+using Legion::RegionRequirement;
+using Legion::Runtime;
+using Legion::Task;
+using Legion::TaskArgument;
+using Legion::TaskLauncher;
+
+using namespace FlexFlow::Kernels::AllReduce;
+
+/* Params */
+bool operator==(AllReduceParams const &lhs, AllReduceParams const &rhs) {
+  return lhs.allreduce_legion_dim == rhs.allreduce_legion_dim;
+}
+
+bool AllReduceParams::is_valid(ParallelTensorShape const &input) const {
+  return input.is_valid();
+}
+
+AllReduceParams AllReduce::get_params() const {
+  AllReduceParams params;
+  params.allreduce_legion_dim = this->allreduce_dim;
+  return params;
+}
+
+AllReduce::AllReduce(FFModel &model,
+                     const ParallelTensor _input,
+                     int _allreduce_legion_dim,
+                     char const *name)
+    : ParallelOp(model, OP_ALLREDUCE, name, _input),
+      allreduce_dim(_allreduce_legion_dim) {
+  int numdim = _input->num_dims;
+  ParallelDim dims[MAX_TENSOR_DIM];
+  for (int i = 0; i < numdim; i++) {
+    dims[i] = _input->dims[i];
+  }
+  assert(dims[allreduce_dim].degree > 1);
+  // ParallelTensorBase::update_parallel_ids(numdim, dims);
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      numdim, dims, _input->data_type, this);
+}
+
+AllReduce::AllReduce(FFModel &model,
+                     AllReduceParams const &params,
+                     ParallelTensor const input,
+                     char const *name)
+    : AllReduce(model, input, params.allreduce_legion_dim, name) {}
+
+void AllReduce::create_input_partition(FFModel &ff) {
+  // Do nothing
+  return;
+}
+
+void AllReduce::create_input_partition_inference(
+    FFModel &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs) {
+  assert(ff.config.computationMode == COMP_MODE_INFERENCE);
+  assert(batch_outputs[0]->part != LogicalPartition::NO_PART);
+  assert(batch_inputs[0]->part != LogicalPartition::NO_PART);
+  // Do nothing
+  return;
+}
+
+OpMeta *AllReduce::init_task(Task const *task,
+                             std::vector<PhysicalRegion> const &regions,
+                             Context ctx,
+                             Runtime *runtime) {
+  AllReduce *ar = (AllReduce *)task->args;
+  FFHandler handle = *((FFHandler const *)task->local_args);
+  AllReduceMeta *meta = new AllReduceMeta(handle, ar);
+  meta->input_type[0] = ar->inputs[0]->data_type;
+  meta->output_type[0] = ar->outputs[0]->data_type;
+  assert(meta->input_type[0] == meta->output_type[0]);
+  return meta;
+}
+
+void AllReduce::init(FFModel const &ff) {
+  ArgumentMap argmap;
+  parallel_is = outputs[0]->parallel_is;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(ALLREDUCE_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(AllReduce)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
+void AllReduce::init_inference(FFModel const &ff,
+                               std::vector<ParallelTensor> const &batch_inputs,
+                               std::vector<ParallelTensor> const &batch_outputs,
+                               MachineView const *mv) {
+  ArgumentMap argmap;
+  parallel_is = batch_outputs[0]->parallel_is;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  size_t machine_view_hash =
+      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher launcher(ALLREDUCE_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(AllReduce)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
+}
+
+FutureMap AllReduce::inference(FFModel const &ff,
+                               BatchConfig const &bc,
+                               std::vector<ParallelTensor> const &batch_inputs,
+                               std::vector<ParallelTensor> const &batch_outputs,
+                               MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  assert(batch_inputs[0]->data_type == batch_outputs[0]->data_type);
+  DataType data_type = batch_inputs[0]->data_type;
+  size_t machine_view_hash =
+      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher launcher(ALLREDUCE_FWD_TASK_ID,
+                         batch_outputs[0]->parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+void AllReduce::forward(FFModel const &ff) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = outputs[0]->parallel_is;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  set_argumentmap_for_forward(ff, argmap);
+  IndexLauncher launcher(ALLREDUCE_FWD_TASK_ID,
+                         outputs[0]->parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  runtime->execute_index_space(ctx, launcher);
+}
+
+void AllReduce::backward(FFModel const &ff) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  IndexLauncher launcher(ALLREDUCE_BWD_TASK_ID,
+                         inputs[0]->parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         inputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region_grad));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region_grad));
+  launcher.add_field(1, FID_DATA);
+  runtime->execute_index_space(ctx, launcher);
+}
+
+bool AllReduce::measure_operator_cost(Simulator *sim,
+                                      MachineView const &pc,
+                                      CostMetrics &cost_metrics) const {
+  cost_metrics = CostMetrics();
+  cost_metrics.forward_time = 0.0f;
+  cost_metrics.backward_time = 0.0f;
+
+  cost_metrics.sync_time = 0;
+  cost_metrics.inputs_memory = 0;
+  cost_metrics.outputs_memory = 0;
+  cost_metrics.weights_memory = 0;
+  return true;
+}
+
+bool AllReduce::get_int_parameter(PMParameter para, int *value) const {
+  switch (para) {
+    case PM_ALLREDUCE_DIM:
+      *value = allreduce_dim;
+      return true;
+    default:
+      return Op::get_int_parameter(para, value);
+  }
+}
+
+bool AllReduce::append_parallel_op_info(
+    std::vector<ParallelOpInfo> &parallel_ops) const {
+  ParallelOpInfo ret;
+  ret.op_type = op_type;
+  ret.parallel_dim = allreduce_dim;
+  ret.parallel_degree = -1; // AllReduce does not affect parallel degree
+  parallel_ops.push_back(ret);
+  return true;
+}
+
+/*static*/
+void AllReduce::forward_task(Task const *task,
+                             std::vector<PhysicalRegion> const &regions,
+                             Context ctx,
+                             Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+
+  AllReduceMeta const *m = *((AllReduceMeta **)task->local_args);
+
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  assert(input.data_type == output.data_type);
+  forward_kernel_wrapper(m, input, output);
+}
+
+void AllReduce::backward_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+  AllReduceMeta const *m = *((AllReduceMeta **)task->local_args);
+
+  GenericTensorAccessorW input_grad = helperGetGenericTensorAccessorRW(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR output_grad = helperGetGenericTensorAccessorRO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  assert(input_grad.data_type == output_grad.data_type);
+  backward_kernel_wrapper(m, input_grad, output_grad);
+}
+
+}; // namespace FlexFlow
+
+namespace std {
+size_t hash<FlexFlow::AllReduceParams>::operator()(
+    FlexFlow::AllReduceParams const &params) const {
+  size_t key = 0;
+  hash_combine(key, params.allreduce_legion_dim);
+  return key;
+}
+
+} // namespace std
diff --git a/src/parallel_ops/combine.cc b/src/parallel_ops/combine.cc
index a4169ea306..198f450636 100644
--- a/src/parallel_ops/combine.cc
+++ b/src/parallel_ops/combine.cc
@@ -88,7 +88,7 @@ Combine::Combine(FFModel &model,
   dims[combine_dim].degree /= combine_degree;
   ParallelTensorBase::update_parallel_ids(numdim, dims);
   outputs[0] = model.create_parallel_tensor_legion_ordering(
-      numdim, dims, DT_FLOAT, this);
+      numdim, dims, _input->data_type, this);
   // inputs[0]->print("Combine::input");
   // outputs[0]->print("Combine::output");
 }
@@ -97,11 +97,13 @@ OpMeta *Combine::init_task(Task const *task,
                            std::vector<PhysicalRegion> const &regions,
                            Context ctx,
                            Runtime *runtime) {
-  Combine *rep = (Combine *)task->args;
-  // FFHandler handle = *((FFHandler *)task->local_args);
-  // CombineMeta* m = new CombineMeta(handle);
-  // m->data_type = rep->outputs[0]->data_type;
-  return nullptr;
+  Combine *cmb = (Combine *)task->args;
+  FFHandler handle = *((FFHandler *)task->local_args);
+  CombineMeta *m = new CombineMeta(handle);
+  m->input_type[0] = cmb->inputs[0]->data_type;
+  m->output_type[0] = cmb->outputs[0]->data_type;
+  assert(m->input_type[0] == m->output_type[0]);
+  return m;
 }
 
 void Combine::init(FFModel const &ff) {
@@ -111,6 +113,7 @@ void Combine::init(FFModel const &ff) {
   Runtime *runtime = ff.config.lg_hlr;
   assert(numOutputs == 1);
   assert(numInputs == 1);
+  set_argumentmap_for_init(ff, argmap);
   IndexLauncher launcher(COMBINE_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(Combine)),
@@ -130,6 +133,48 @@ void Combine::init(FFModel const &ff) {
   launcher.add_field(1, FID_DATA);
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
+void Combine::init_inference(FFModel const &ff,
+                             std::vector<ParallelTensor> const &batch_inputs,
+                             std::vector<ParallelTensor> const &batch_outputs,
+                             MachineView const *mv) {
+  ArgumentMap argmap;
+  parallel_is = batch_outputs[0]->parallel_is;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  size_t machine_view_hash =
+      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher launcher(COMBINE_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(Combine)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  assert(inference_input_lps.find(batch_inputs[0]) !=
+         inference_input_lps.end());
+  launcher.add_region_requirement(
+      RegionRequirement(inference_input_lps[batch_inputs[0]],
+                        0 /*projection id*/,
+                        READ_ONLY,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
 }
 
 void Combine::create_input_partition(FFModel &ff) {
@@ -147,6 +192,61 @@ void Combine::create_input_partition(FFModel &ff) {
                                output_grad_lp);
 }
 
+void Combine::create_input_partition_inference(
+    FFModel &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs) {
+  assert(ff.config.computationMode == COMP_MODE_INFERENCE);
+  assert(batch_outputs[0]->part != LogicalPartition::NO_PART);
+  assert(batch_inputs[0]->part != LogicalPartition::NO_PART);
+  // input_lp is a disjoint partition
+  ff.create_disjoint_partition(batch_outputs[0]->num_dims,
+                               batch_outputs[0]->dims,
+                               batch_outputs[0]->parallel_is,
+                               batch_inputs[0]->region,
+                               inference_input_lps[batch_inputs[0]]);
+}
+
+FutureMap Combine::inference(FFModel const &ff,
+                             BatchConfig const &bc,
+                             std::vector<ParallelTensor> const &batch_inputs,
+                             std::vector<ParallelTensor> const &batch_outputs,
+                             MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  assert(batch_inputs[0]->data_type == batch_outputs[0]->data_type);
+  DataType data_type = batch_inputs[0]->data_type;
+  size_t machine_view_hash =
+      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher launcher(COMBINE_FWD_TASK_ID,
+                         batch_outputs[0]->parallel_is,
+                         TaskArgument(nullptr, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(
+      RegionRequirement(inference_input_lps[batch_inputs[0]],
+                        0 /*projection id*/,
+                        READ_ONLY,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
 void Combine::forward(FFModel const &ff) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
@@ -157,7 +257,7 @@ void Combine::forward(FFModel const &ff) {
   DataType data_type = inputs[0]->data_type;
   IndexLauncher launcher(COMBINE_FWD_TASK_ID,
                          outputs[0]->parallel_is,
-                         TaskArgument(&data_type, sizeof(data_type)),
+                         TaskArgument(nullptr, 0),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
@@ -261,8 +361,11 @@ void Combine::forward_task(Task const *task,
                            Runtime *runtime) {
   assert(regions.size() == 2);
   assert(task->regions.size() == 2);
-  DataType data_type = *((DataType *)task->args);
-  if (data_type == DT_FLOAT) {
+  CombineMeta const *m = *((CombineMeta **)task->local_args);
+  DataType data_type = m->input_type[0];
+  if (data_type == DT_HALF) {
+    forward_task_with_type<half>(task, regions, ctx, runtime);
+  } else if (data_type == DT_FLOAT) {
     forward_task_with_type<float>(task, regions, ctx, runtime);
   } else if (data_type == DT_DOUBLE) {
     forward_task_with_type<double>(task, regions, ctx, runtime);
diff --git a/src/parallel_ops/kernels/allreduce_kernels.cpp b/src/parallel_ops/kernels/allreduce_kernels.cpp
new file mode 100644
index 0000000000..78742568c6
--- /dev/null
+++ b/src/parallel_ops/kernels/allreduce_kernels.cpp
@@ -0,0 +1,46 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/parallel_ops/kernels/allreduce_kernels.h"
+#include "flexflow/utils/hip_helper.h"
+#include <hip/hip_runtime.h>
+
+namespace FlexFlow {
+
+AllReduceMeta::AllReduceMeta(FFHandler handle, AllReduce const *reduct)
+    : OpMeta(handle) {}
+
+namespace Kernels {
+namespace AllReduce {
+
+void forward_kernel_wrapper(AllReduceMeta const *m,
+                            GenericTensorAccessorR const &input,
+                            GenericTensorAccessorW const &output) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  assert(input.data_type == output.data_type);
+  assert(input.domain == output.domain);
+  assert(false && "To be implemented");
+}
+
+void backward_kernel_wrapper(AllReduceMeta const *m,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &output_grad) {
+  assert(false && "To be implemented");
+}
+
+} // namespace AllReduce
+} // namespace Kernels
+} // namespace FlexFlow
diff --git a/src/parallel_ops/kernels/allreduce_kernels.cu b/src/parallel_ops/kernels/allreduce_kernels.cu
new file mode 100644
index 0000000000..1ae9ee27b8
--- /dev/null
+++ b/src/parallel_ops/kernels/allreduce_kernels.cu
@@ -0,0 +1,56 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/parallel_ops/kernels/allreduce_kernels.h"
+#include "flexflow/utils/cuda_helper.h"
+
+namespace FlexFlow {
+
+AllReduceMeta::AllReduceMeta(FFHandler handle, AllReduce const *reduct)
+    : OpMeta(handle) {}
+
+namespace Kernels {
+namespace AllReduce {
+
+void forward_kernel_wrapper(AllReduceMeta const *m,
+                            GenericTensorAccessorR const &input,
+                            GenericTensorAccessorW const &output) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  assert(input.data_type == output.data_type);
+  assert(input.domain == output.domain);
+#ifdef FF_USE_NCCL
+  ncclDataType_t nccl_data_type = ff_to_nccl_datatype(input.data_type);
+  checkNCCL(ncclAllReduce(input.ptr,
+                          output.ptr,
+                          input.domain.get_volume(),
+                          nccl_data_type,
+                          ncclSum,
+                          m->handle.ncclComm,
+                          stream));
+#else
+  assert(false && "Must enable FF_USE_NCCL to use AllReduce operators");
+#endif
+}
+
+void backward_kernel_wrapper(AllReduceMeta const *m,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &output_grad) {
+  assert(false && "To be implemented");
+}
+
+} // namespace AllReduce
+} // namespace Kernels
+} // namespace FlexFlow
diff --git a/src/parallel_ops/kernels/combine_kernels.cpp b/src/parallel_ops/kernels/combine_kernels.cpp
index 2d748cfab3..d6e9568223 100644
--- a/src/parallel_ops/kernels/combine_kernels.cpp
+++ b/src/parallel_ops/kernels/combine_kernels.cpp
@@ -51,6 +51,9 @@ void backward_kernel(T const *output_grad_ptr,
                      num_elements);
 }
 
+template void forward_kernel<half>(half const *input_ptr,
+                                   half *output_ptr,
+                                   size_t num_elements);
 template void forward_kernel<float>(float const *input_ptr,
                                     float *output_ptr,
                                     size_t num_elements);
@@ -63,6 +66,9 @@ template void forward_kernel<int32_t>(int32_t const *input_ptr,
 template void forward_kernel<int64_t>(int64_t const *input_ptr,
                                       int64_t *output_ptr,
                                       size_t num_elements);
+template void backward_kernel<half>(half const *output_grad_ptr,
+                                    half *input_grad_ptr,
+                                    size_t num_elements);
 template void backward_kernel<float>(float const *output_grad_ptr,
                                      float *input_grad_ptr,
                                      size_t num_elements);
diff --git a/src/parallel_ops/kernels/combine_kernels.cu b/src/parallel_ops/kernels/combine_kernels.cu
index d8f414ef0f..1ab79a7944 100644
--- a/src/parallel_ops/kernels/combine_kernels.cu
+++ b/src/parallel_ops/kernels/combine_kernels.cu
@@ -44,6 +44,9 @@ void backward_kernel(T const *output_grad_ptr,
       input_grad_ptr, output_grad_ptr, num_elements);
 }
 
+template void forward_kernel<half>(half const *input_ptr,
+                                   half *output_ptr,
+                                   size_t num_elements);
 template void forward_kernel<float>(float const *input_ptr,
                                     float *output_ptr,
                                     size_t num_elements);
@@ -56,6 +59,9 @@ template void forward_kernel<int32_t>(int32_t const *input_ptr,
 template void forward_kernel<int64_t>(int64_t const *input_ptr,
                                       int64_t *output_ptr,
                                       size_t num_elements);
+template void backward_kernel<half>(half const *output_grad_ptr,
+                                    half *input_grad_ptr,
+                                    size_t num_elements);
 template void backward_kernel<float>(float const *output_grad_ptr,
                                      float *input_grad_ptr,
                                      size_t num_elements);
diff --git a/src/runtime/cuda_helper.cu b/src/runtime/cuda_helper.cu
index 6ef06e1f65..1aa216e5c9 100644
--- a/src/runtime/cuda_helper.cu
+++ b/src/runtime/cuda_helper.cu
@@ -461,6 +461,24 @@ cudaDataType_t ff_to_cuda_datatype(DataType type) {
   return CUDA_R_32F;
 }
 
+#ifdef FF_USE_NCCL
+ncclDataType_t ff_to_nccl_datatype(DataType type) {
+  switch (type) {
+    case DT_HALF:
+      return ncclHalf;
+    case DT_FLOAT:
+      return ncclFloat;
+    case DT_DOUBLE:
+      return ncclDouble;
+    case DT_INT32:
+      return ncclInt;
+    default:
+      assert(false && "Unspoorted nccl data type");
+  }
+  return ncclFloat;
+}
+#endif
+
 cudaDataType_t cudnn_to_cuda_datatype(cudnnDataType_t type) {
   switch (type) {
     case CUDNN_DATA_FLOAT:
@@ -500,6 +518,8 @@ template __global__ void
 template __global__ void
     assign_kernel<int64_t>(int64_t *ptr, coord_t size, int64_t value);
 
+template __global__ void
+    add_kernel<half>(half *dst, half const *src, size_t size);
 template __global__ void
     add_kernel<float>(float *dst, float const *src, size_t size);
 template __global__ void
@@ -509,8 +529,12 @@ template __global__ void
 template __global__ void
     add_kernel<int64_t>(int64_t *dst, int64_t const *src, size_t size);
 
+template __global__ void
+    copy_kernel<half>(half *dst, half const *src, coord_t size);
 template __global__ void
     copy_kernel<float>(float *dst, float const *src, coord_t size);
+template __global__ void
+    copy_kernel<double>(double *dst, double const *src, coord_t size);
 template __global__ void
     copy_kernel<int32_t>(int32_t *dst, int32_t const *src, coord_t size);
 template __global__ void
diff --git a/src/runtime/ffconst_utils.cc b/src/runtime/ffconst_utils.cc
index d2b68595bd..39f9d1dd0d 100644
--- a/src/runtime/ffconst_utils.cc
+++ b/src/runtime/ffconst_utils.cc
@@ -187,6 +187,8 @@ std::string get_operator_type_name(OperatorType type) {
       return "Replicate";
     case OP_REDUCTION:
       return "Reduction";
+    case OP_ALLREDUCE:
+      return "AllReduce";
     case OP_PIPELINE:
       return "Pipeline";
     case OP_FUSED_PARALLEL:
diff --git a/src/runtime/fftype.cc b/src/runtime/fftype.cc
index 91e0d077c4..2b94f07999 100644
--- a/src/runtime/fftype.cc
+++ b/src/runtime/fftype.cc
@@ -1,11 +1,15 @@
 #include "flexflow/fftype.h"
+#include "flexflow/config.h"
 #include <cassert>
 
 namespace FlexFlow {
 
-LayerID::LayerID() : id(0) {}
+const LayerID LayerID::NO_ID = LayerID();
 
-LayerID::LayerID(size_t _id) : id(_id) {
+LayerID::LayerID() : id(0), transformer_layer_id(MAX_NUM_TRANSFORMER_LAYERS) {}
+
+LayerID::LayerID(size_t _id, size_t _transformer_layer_id)
+    : id(_id), transformer_layer_id(_transformer_layer_id) {
   assert(is_valid_id());
 }
 
@@ -14,7 +18,11 @@ bool LayerID::is_valid_id() const {
 }
 
 bool operator==(LayerID const &lhs, LayerID const &rhs) {
+  // id should be sufficient to distinguish different layers
+  if (lhs.id == rhs.id) {
+    assert(lhs.transformer_layer_id == rhs.transformer_layer_id);
+  }
   return lhs.id == rhs.id;
 }
 
-}; // namespace FlexFlow
\ No newline at end of file
+}; // namespace FlexFlow
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index e8a1b6f9f1..5c0513baa8 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -46,6 +46,7 @@
 #include "flexflow/ops/topk.h"
 #include "flexflow/ops/transpose.h"
 #include "flexflow/ops/tree_inc_multihead_self_attention.h"
+#include "flexflow/parallel_ops/allreduce.h"
 #include "flexflow/parallel_ops/combine.h"
 #include "flexflow/parallel_ops/fused_parallel_op.h"
 #include "flexflow/parallel_ops/partition.h"
@@ -1961,14 +1962,61 @@ std::pair<std::unique_ptr<Graph>, std::unordered_map<Node, MachineView>>
     }
     curr_best_graph = std::unique_ptr<Graph>(graph);
     MachineView data_parallel_view;
-    data_parallel_view.device_type = MachineView::GPU;
-    data_parallel_view.ndims = 1;
-    data_parallel_view.dim[0] =
-        model->config.numNodes * model->config.workersPerNode;
-    data_parallel_view.stride[0] = 1;
-    data_parallel_view.start_device_id = 0;
+    int degree, num_transformer_layers_per_stage;
+    if (model->config.computationMode == COMP_MODE_TRAINING) {
+      data_parallel_view.device_type = MachineView::GPU;
+      data_parallel_view.ndims = 1;
+      data_parallel_view.dim[0] =
+          model->config.numNodes * model->config.workersPerNode;
+      data_parallel_view.stride[0] = 1;
+      data_parallel_view.start_device_id = 0;
+    } else {
+      // Currently assume a 1D machine view is needed
+      assert(model->config.data_parallelism_degree == 1 ||
+             model->config.tensor_parallelism_degree == 1);
+      degree = model->config.data_parallelism_degree *
+               model->config.tensor_parallelism_degree;
+      num_transformer_layers_per_stage =
+          model->current_transformer_layer_id /
+              model->config.pipeline_parallelism_degree +
+          1;
+    }
     for (auto const &node : curr_best_graph->inEdges) {
-      curr_optimal_views[node.first] = data_parallel_view;
+      Op const *op = node.first.ptr;
+      if (model->config.computationMode == COMP_MODE_TRAINING) {
+        curr_optimal_views[node.first] = data_parallel_view;
+      } else {
+        MachineView mv;
+        mv.device_type = MachineView::GPU;
+        mv.ndims = 1;
+        int total_parallel_degree = 1;
+        for (int i = 0; i < op->outputs[0]->num_dims; i++) {
+          total_parallel_degree *= op->outputs[0]->dims[i].degree;
+        }
+        mv.dim[0] = total_parallel_degree;
+        mv.stride[0] = 1;
+        LayerID layer_guid = op->layer_guid;
+        if (op->op_type == OP_INPUT) {
+          // All inputs are assigned to the first stage
+          layer_guid.transformer_layer_id = 0;
+        } else if (layer_guid == LayerID::NO_ID) {
+          // Assert that we only have a single input
+          while (op->layer_guid == LayerID::NO_ID) {
+            assert(op->numInputs == 1);
+            op = op->inputs[0]->owner_op;
+            assert(op != nullptr);
+          }
+          layer_guid = op->layer_guid;
+        }
+        mv.start_device_id = degree * (layer_guid.transformer_layer_id /
+                                       num_transformer_layers_per_stage);
+        assert(mv.start_device_id + degree - 1 <
+               model->config.numNodes * model->config.workersPerNode);
+        curr_optimal_views[node.first] = mv;
+        for (int i = 0; i < node.first.ptr->numOutputs; i++) {
+          assert(node.first.ptr->outputs[i]->is_valid_machine_view(mv));
+        }
+      }
     }
   } else {
     // Main step to optimize the PCG of an FFModel
@@ -2237,23 +2285,17 @@ GraphOptimalViewSerialized
       case OP_EMBEDDING: {
         Embedding *embed = (Embedding *)op;
         sez.serialize(embed->layer_guid.id);
+        sez.serialize(embed->layer_guid.transformer_layer_id);
         sez.serialize(embed->num_entries);
         sez.serialize(embed->out_channels);
         sez.serialize(embed->aggr);
         sez.serialize(embed->data_type);
         break;
       }
-      case OP_EW_ADD:
-      case OP_EW_SUB:
-      case OP_EW_MUL:
-      case OP_EW_MAX:
-      case OP_EW_MIN: {
-        sez.serialize(op->op_type);
-        break;
-      }
       case OP_MULTIHEAD_ATTENTION: {
         MultiHeadAttention *attn = (MultiHeadAttention *)op;
         sez.serialize(attn->layer_guid.id);
+        sez.serialize(attn->layer_guid.transformer_layer_id);
         sez.serialize(attn->oProjSize);
         sez.serialize(attn->num_heads);
         sez.serialize(attn->qProjSize);
@@ -2267,6 +2309,7 @@ GraphOptimalViewSerialized
       case OP_INC_MULTIHEAD_SELF_ATTENTION: {
         IncMultiHeadSelfAttention *attn = (IncMultiHeadSelfAttention *)op;
         sez.serialize(attn->layer_guid.id);
+        sez.serialize(attn->layer_guid.transformer_layer_id);
         sez.serialize(attn->oProjSize);
         sez.serialize(attn->num_heads);
         sez.serialize(attn->qProjSize);
@@ -2287,6 +2330,7 @@ GraphOptimalViewSerialized
         SpecIncMultiHeadSelfAttention *attn =
             (SpecIncMultiHeadSelfAttention *)op;
         sez.serialize(attn->layer_guid.id);
+        sez.serialize(attn->layer_guid.transformer_layer_id);
         sez.serialize(attn->oProjSize);
         sez.serialize(attn->num_heads);
         sez.serialize(attn->qProjSize);
@@ -2305,6 +2349,7 @@ GraphOptimalViewSerialized
         TreeIncMultiHeadSelfAttention *attn =
             (TreeIncMultiHeadSelfAttention *)op;
         sez.serialize(attn->layer_guid.id);
+        sez.serialize(attn->layer_guid.transformer_layer_id);
         sez.serialize(attn->oProjSize);
         sez.serialize(attn->num_heads);
         sez.serialize(attn->qProjSize);
@@ -2324,6 +2369,7 @@ GraphOptimalViewSerialized
       case OP_INC_MULTIQUERY_SELF_ATTENTION: {
         IncMultiQuerySelfAttention *attn = (IncMultiQuerySelfAttention *)op;
         sez.serialize(attn->layer_guid.id);
+        sez.serialize(attn->layer_guid.transformer_layer_id);
         sez.serialize(attn->oProjSize);
         sez.serialize(attn->num_heads);
         sez.serialize(attn->qProjSize);
@@ -2363,6 +2409,11 @@ GraphOptimalViewSerialized
         sez.serialize(combine->combine_degree);
         break;
       }
+      case OP_ALLREDUCE: {
+        AllReduce *allreduce = (AllReduce *)op;
+        sez.serialize(allreduce->allreduce_dim);
+        break;
+      }
       case OP_FUSED_PARALLEL: {
         FusedParallelOp *fused = (FusedParallelOp *)op;
         sez.serialize(fused->num_parallel_ops);
@@ -2589,10 +2640,11 @@ void FFModel::deserialize_graph_optimal_view(
         assert(num_inputs == 1);
         AggrMode aggr;
         int num_entries, out_channels;
-        size_t id;
+        size_t id, transformer_layer_id;
         DataType data_type;
         dez.deserialize(id);
-        LayerID layer_guid(id);
+        dez.deserialize(transformer_layer_id);
+        LayerID layer_guid(id, transformer_layer_id);
         dez.deserialize(num_entries);
         dez.deserialize(out_channels);
         dez.deserialize(aggr);
@@ -2612,11 +2664,7 @@ void FFModel::deserialize_graph_optimal_view(
       case OP_EW_MUL:
       case OP_EW_MAX:
       case OP_EW_MIN: {
-        assert(num_inputs == 2);
-        OperatorType op_type;
-        dez.deserialize(op_type);
-        node = get_or_create_node<ElementBinary>({inputs[0], inputs[1]},
-                                                 {op_type});
+        node = ElementBinary::deserialize(*this, dez, inputs, num_inputs);
         break;
       }
       case OP_CONV2D: {
@@ -2667,9 +2715,10 @@ void FFModel::deserialize_graph_optimal_view(
         int embed_dim, num_heads, k_dim, v_dim;
         float dropout;
         bool bias, add_bias_kv, add_zero_attn;
-        size_t id;
+        size_t id, transformer_layer_id;
         dez.deserialize(id);
-        LayerID layer_guid(id);
+        dez.deserialize(transformer_layer_id);
+        LayerID layer_guid(id, transformer_layer_id);
         dez.deserialize(embed_dim);
         dez.deserialize(num_heads);
         dez.deserialize(k_dim);
@@ -2700,9 +2749,10 @@ void FFModel::deserialize_graph_optimal_view(
         bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
             scaling_query, qk_prod_scaling, offload;
         DataType quantization_type;
-        size_t id;
+        size_t id, transformer_layer_id;
         dez.deserialize(id);
-        LayerID layer_guid(id);
+        dez.deserialize(transformer_layer_id);
+        LayerID layer_guid(id, transformer_layer_id);
         dez.deserialize(embed_dim);
         dez.deserialize(num_heads);
         dez.deserialize(k_dim);
@@ -2743,9 +2793,10 @@ void FFModel::deserialize_graph_optimal_view(
         float dropout, scaling_factor;
         bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
             scaling_query, qk_prod_scaling;
-        size_t id;
+        size_t id, transformer_layer_id;
         dez.deserialize(id);
-        LayerID layer_guid(id);
+        dez.deserialize(transformer_layer_id);
+        LayerID layer_guid(id, transformer_layer_id);
         dez.deserialize(embed_dim);
         dez.deserialize(num_heads);
         dez.deserialize(k_dim);
@@ -2784,9 +2835,10 @@ void FFModel::deserialize_graph_optimal_view(
         bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
             scaling_query, qk_prod_scaling, offload;
         DataType quantization_type;
-        size_t id;
+        size_t id, transformer_layer_id;
         dez.deserialize(id);
-        LayerID layer_guid(id);
+        dez.deserialize(transformer_layer_id);
+        LayerID layer_guid(id, transformer_layer_id);
         dez.deserialize(embed_dim);
         dez.deserialize(num_heads);
         dez.deserialize(k_dim);
@@ -2828,9 +2880,10 @@ void FFModel::deserialize_graph_optimal_view(
         float dropout, scaling_factor;
         bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
             scaling_query, qk_prod_scaling;
-        size_t id;
+        size_t id, transformer_layer_id;
         dez.deserialize(id);
-        LayerID layer_guid(id);
+        dez.deserialize(transformer_layer_id);
+        LayerID layer_guid(id, transformer_layer_id);
         dez.deserialize(embed_dim);
         dez.deserialize(num_heads);
         dez.deserialize(k_dim);
@@ -2949,6 +3002,13 @@ void FFModel::deserialize_graph_optimal_view(
                                              {reduction_dim, reduction_degree});
         break;
       }
+      case OP_ALLREDUCE: {
+        assert(num_inputs == 1);
+        int allreduce_dim;
+        dez.deserialize(allreduce_dim);
+        node = get_or_create_node<AllReduce>(inputs[0], {allreduce_dim});
+        break;
+      }
       case OP_FUSED_PARALLEL: {
         assert(num_inputs == 1);
         std::vector<ParallelOpInfo> parallel_ops;
diff --git a/src/runtime/hip_helper.cpp b/src/runtime/hip_helper.cpp
index 6354c5d737..9bcccb041a 100644
--- a/src/runtime/hip_helper.cpp
+++ b/src/runtime/hip_helper.cpp
@@ -372,16 +372,23 @@ template __global__ void
 template __global__ void
     assign_kernel<int64_t>(int64_t *ptr, coord_t size, int64_t value);
 
+template __global__ void
+    add_kernel<half>(half *dst, half const *src, size_t size);
 template __global__ void
     add_kernel<float>(float *dst, float const *src, size_t size);
 template __global__ void
     add_kernel<double>(double *dst, double const *src, size_t size);
-template __global__ void add_kernel<int>(int *dst, int const *src, size_t size);
 template __global__ void
-    add_kernel<long>(long *dst, long const *src, size_t size);
+    add_kernel<int32_t>(int32_t *dst, int32_t const *src, size_t size);
+template __global__ void
+    add_kernel<int64_t>(int64_t *dst, int64_t const *src, size_t size);
 
+template __global__ void
+    copy_kernel<half>(half *dst, half const *src, coord_t size);
 template __global__ void
     copy_kernel<float>(float *dst, float const *src, coord_t size);
+template __global__ void
+    copy_kernel<double>(double *dst, double const *src, coord_t size);
 template __global__ void
     copy_kernel<int32_t>(int32_t *dst, int32_t const *src, coord_t size);
 template __global__ void
@@ -406,13 +413,19 @@ template __global__ void apply_add_with_scale<int64_t>(int64_t *data_ptr,
 
 template __host__ void
     print_tensor<float>(float const *ptr, size_t rect, char const *prefix);
+template __host__ void
+    print_tensor<double>(double const *ptr, size_t rect, char const *prefix);
 template __host__ void
     print_tensor<int32_t>(int32_t const *ptr, size_t rect, char const *prefix);
 template __host__ void
     print_tensor<int64_t>(int64_t const *ptr, size_t rect, char const *prefix);
+template __host__ void
+    print_tensor<half>(half const *ptr, size_t rect, char const *prefix);
 
 template __host__ float *download_tensor<float>(float const *ptr,
                                                 size_t num_elements);
+template __host__ half *download_tensor<half>(half const *ptr,
+                                              size_t num_elements);
 template __host__ double *download_tensor<double>(double const *ptr,
                                                   size_t num_elements);
 template __host__ int32_t *download_tensor<int32_t>(int32_t const *ptr,
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 67a78f9700..b6be945a94 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -54,6 +54,7 @@ InferenceManager::InferenceManager(FFConfig const &_config,
              num_devices &&
          "Product of data, tensor, and pipeline parallelism degrees does not "
          "match the number of available devices");
+  // Deprecated logic below
   // populate array of valid single-device machine views
   for (int i = 0; i < num_devices; i++) {
     MachineView view;
@@ -94,23 +95,23 @@ bool parallel_tensor_list_overlaps(std::vector<ParallelTensor> const &list1,
   return false;
 }
 
-void InferenceManager::compile_model_and_allocate_buffer(
-    FFModel *model,
-    std::unordered_map<Tensor, std::vector<MachineView>> const
-        &tensor_mapping) {
+void InferenceManager::compile_model_and_allocate_buffer(FFModel *model) {
+  // TODO: currently assume there is a single data-parallel pipeline
+  // (i.e., data-parallel-degree == 1)
+  assert(model->config.data_parallelism_degree == 1);
   model->config.batchSize = max_num_tokens_per_batch;
   model->compile_inference();
   Context ctx = model->config.lg_ctx;
   Runtime *runtime = model->config.lg_hlr;
 
-  std::unordered_map<Op const *, std::vector<MachineView>> mapping;
-  for (auto const &it : tensor_mapping) {
-    ParallelTensor pt;
-    model->get_parallel_tensor_from_tensor(it.first, pt);
-    assert(pt->owner_op != nullptr);
-    mapping[pt->owner_op] = it.second;
-  }
   // std::cout << std::endl << std::endl << "Operators MVs:" << std::endl;
+  int num_transformer_layers_per_stage =
+      model->current_transformer_layer_id /
+          model->config.pipeline_parallelism_degree +
+      1;
+  int degree = model->config.data_parallelism_degree *
+               model->config.tensor_parallelism_degree;
+
   for (int op_idx = 0; op_idx < model->operators.size(); op_idx++) {
     Op const *op = model->operators[op_idx];
     // Skip weight operators
@@ -119,52 +120,35 @@ void InferenceManager::compile_model_and_allocate_buffer(
     }
     // Get machine views
     std::vector<MachineView> machine_views;
-    if (mapping.find(op) != mapping.end()) {
-      machine_views = mapping[op];
-      assert(machine_views.size() == ff_config.data_parallelism_degree);
-    } else {
-      // Mapping the current operator using the same machine
-      // view as the inputs
-      assert(op->numInputs > 0);
-      for (int j = 0; j < ff_config.data_parallelism_degree; j++) {
-        MachineView mv = tensor_buffer[op->inputs[0]][j]->machine_view;
-        for (int k = 1; k < op->numInputs; k++) {
-          if (mv != tensor_buffer[op->inputs[k]][j]->machine_view) {
-            fprintf(stderr,
-                    "[Warning] a potentially unnecessary "
-                    " inter-GPU copy of size %zu\n",
-                    op->inputs[k]->get_volume());
-            // Heuristics: we use the mv with a larger start_device_id
-            // to promote load balancing
-            if (mv.start_device_id <
-                tensor_buffer[op->inputs[k]][j]->machine_view.start_device_id) {
-              mv = tensor_buffer[op->inputs[k]][j]->machine_view;
-            }
-          }
-        }
-        if (op->op_type == OP_REPLICATE) {
-          // std::cout << "Replicate operator got machine view: " << mv
-          //           << std::endl;
-          assert(model->config.tensor_parallelism_degree > 1);
-          mv.dim[0] = ff_config.tensor_parallelism_degree;
-          mv.stride[0] = 1;
-          if (mv.start_device_id + mv.dim[0] > num_devices) {
-            mv.start_device_id -=
-                (mv.start_device_id + mv.dim[0]) - num_devices;
-          }
-          // std::cout << "Corrected machine view: " << mv << std::endl;
-        } else if (op->op_type == OP_REDUCTION) {
-          // std::cout << "Reduction operator got machine view: " << mv
-          //           << std::endl;
-          assert(model->config.tensor_parallelism_degree > 1);
-          mv.dim[0] = 1;
-          mv.stride[0] = 0;
-          // std::cout << "Corrected machine view: " << mv << std::endl;
+    for (int j = 0; j < model->config.data_parallelism_degree; j++) {
+      MachineView mv;
+      mv.device_type == MachineView::GPU;
+      mv.ndims = 1;
+      // mv.start_device_id = 0;
+      mv.stride[0] = 1;
+      int parallel_degree = 1;
+      for (int k = 0; k < op->outputs[0]->num_dims; k++) {
+        parallel_degree *= op->outputs[0]->dims[k].degree;
+      }
+      mv.dim[0] = parallel_degree;
+      LayerID layer_guid = op->layer_guid;
+      if (op->op_type == OP_INPUT) {
+        // All inputs are assigned to the first stage
+        layer_guid.transformer_layer_id = 0;
+      } else if (layer_guid == LayerID::NO_ID) {
+        Op const *op_with_guid = op;
+        // Assert that we only have a single input
+        while (op_with_guid->layer_guid == LayerID::NO_ID) {
+          assert(op_with_guid->numInputs == 1);
+          op_with_guid = op_with_guid->inputs[0]->owner_op;
+          assert(op_with_guid != nullptr);
         }
-        assert(mv.start_device_id + mv.dim[0] <= num_devices);
-        machine_views.push_back(mv);
+        layer_guid = op_with_guid->layer_guid;
       }
-      assert(machine_views.size() == ff_config.data_parallelism_degree);
+      mv.start_device_id = degree * (layer_guid.transformer_layer_id /
+                                     num_transformer_layers_per_stage);
+      assert(mv == op->outputs[0]->machine_view);
+      machine_views.push_back(mv);
     }
     // std::cout << "operator: " << op->name << std::endl;
     // for (int i = 0; i < op->numInputs; i++) {
@@ -232,7 +216,7 @@ void InferenceManager::compile_model_and_allocate_buffer(
         }
       }
       if (!found_parallel_tensor) {
-        for (int j = 0; j < ff_config.data_parallelism_degree; j++) {
+        for (int j = 0; j < model->config.data_parallelism_degree; j++) {
           // Copy the metadata from pt_base to pt
           ParallelTensor pt = new ParallelTensorBase(*pt_base);
           pt->region =
@@ -257,7 +241,7 @@ void InferenceManager::compile_model_and_allocate_buffer(
 }
 
 void InferenceManager::init_operators_inference(FFModel *model) {
-  for (int batch_index = 0; batch_index < ff_config.data_parallelism_degree;
+  for (int batch_index = 0; batch_index < model->config.data_parallelism_degree;
        batch_index++) {
     int expert_device_index = 0;
     int device_index = batch_index % num_devices;
@@ -313,7 +297,7 @@ FutureMap InferenceManager::inference(FFModel *model,
   assert(bc.num_active_tokens() > 0 && bc.num_active_requests() > 0);
   // We currently assume that the index-th batch will be placed
   // on the device_index-th device (except for the experts layers)
-  int batch_index = index % ff_config.data_parallelism_degree;
+  int batch_index = index % model->config.data_parallelism_degree;
   FutureMap fm;
   bool found_input_operator = false;
   for (size_t o = 0; o < model->operators.size(); o++) {
@@ -410,15 +394,19 @@ void InferenceManager::load_positions(BatchConfig const &bc,
   runtime->execute_index_space(ctx, launcher);
 }
 
+void FFModel::set_transformer_layer_id(int id) {
+  // We assume that users call this function with
+  // monotonically increasing ids
+  assert(id == current_transformer_layer_id + 1 ||
+         (id == 0 && current_transformer_layer_id == 0));
+  current_transformer_layer_id = id;
+  assert(id < MAX_NUM_TRANSFORMER_LAYERS);
+}
+
 void FFModel::compile_inference() {
   Context ctx = config.lg_ctx;
   Runtime *runtime = config.lg_hlr;
   config.computationMode = COMP_MODE_INFERENCE;
-  {
-    fprintf(
-        stderr,
-        "Note: inference currently only supports data/pipeline parallel.\n");
-  }
   create_operators_from_layers();
   // Launch the graph optimize task
   {
@@ -651,5 +639,42 @@ void FFModel::compile_inference() {
              handle.get_tree_id());
     }
   }
+#ifdef FF_USE_NCCL
+  for (size_t l = 0; l < operators.size(); l++) {
+    // Only create nccl for allreduce and fusedop for inference
+    // (fusedop may include allreduces)
+    if (operators[l]->op_type == OP_ALLREDUCE ||
+        operators[l]->op_type == OP_FUSED) {
+      MachineView view = operators[l]->outputs[0]->machine_view;
+      if (view_hash_to_nccl_comms.find(view.hash()) ==
+          view_hash_to_nccl_comms.end()) {
+        TaskLauncher launcher(NCCL_GETUNIQUEID_TASK_ID, TaskArgument(NULL, 0));
+        Future future = runtime->execute_task(ctx, launcher);
+        ncclUniqueId ncclId = future.get_result<ncclUniqueId>();
+        IndexSpace task_is = get_or_create_task_is(view);
+        ArgumentMap argmap;
+        IndexLauncher index_launcher(
+            NCCL_INIT_COMMS_TASK_ID,
+            task_is,
+            TaskArgument(&ncclId, sizeof(ncclUniqueId)),
+            argmap,
+            Predicate::TRUE_PRED,
+            false /*must*/,
+            0 /*mapper_id*/,
+            view.hash() /*MappingTagID*/);
+        FutureMap fm = runtime->execute_index_space(ctx, index_launcher);
+        fm.wait_all_results();
+        int idx = 0;
+        Domain task_domain = runtime->get_index_space_domain(ctx, task_is);
+        ncclComm_t *nccl_comms =
+            (ncclComm_t *)malloc(sizeof(ncclComm_t) * task_domain.get_volume());
+        for (Domain::DomainPointIterator it(task_domain); it; it++, idx++) {
+          nccl_comms[idx] = fm.get_result<ncclComm_t>(*it);
+        }
+        view_hash_to_nccl_comms[view.hash()] = nccl_comms;
+      }
+    }
+  }
+#endif
 }
 }; // namespace FlexFlow
diff --git a/src/runtime/layer.cc b/src/runtime/layer.cc
index 6dfd5f2f35..d2473f4b2b 100644
--- a/src/runtime/layer.cc
+++ b/src/runtime/layer.cc
@@ -16,8 +16,9 @@ Layer::Layer(FFModel *model,
              const Tensor _input3,
              const Tensor _input4)
     : op_type(_otype), data_type(_dtype),
-      layer_guid(model->layer_global_guid++), numInputs(_numInputs),
-      numWeights(_numWeights), numOutputs(_numOutputs) {
+      layer_guid(model->layer_global_guid++,
+                 model->current_transformer_layer_id),
+      numInputs(_numInputs), numWeights(_numWeights), numOutputs(_numOutputs) {
   std::string pcname;
   if (_name == nullptr) {
     pcname = get_operator_type_name(op_type);
@@ -50,8 +51,9 @@ Layer::Layer(FFModel *model,
              int _numOutputs,
              Tensor const *_tensors)
     : op_type(_otype), data_type(_dtype),
-      layer_guid(model->layer_global_guid++), numInputs(_numInputs),
-      numWeights(_numWeights), numOutputs(_numOutputs) {
+      layer_guid(model->layer_global_guid++,
+                 model->current_transformer_layer_id),
+      numInputs(_numInputs), numWeights(_numWeights), numOutputs(_numOutputs) {
   std::string pcname;
   if (_name == nullptr) {
     pcname = get_operator_type_name(op_type);
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 64c3a2eb61..763a5bcfd5 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -58,6 +58,7 @@
 #include "flexflow/ops/topk.h"
 #include "flexflow/ops/transpose.h"
 #include "flexflow/ops/tree_inc_multihead_self_attention.h"
+#include "flexflow/parallel_ops/allreduce.h"
 #include "flexflow/parallel_ops/combine.h"
 #include "flexflow/parallel_ops/fused_parallel_op.h"
 #include "flexflow/parallel_ops/partition.h"
@@ -990,6 +991,7 @@ void Op::set_argumentmap_for_init_inference(FFModel const &ff,
   Runtime *runtime = ff.config.lg_hlr;
   Domain domain = runtime->get_index_space_domain(ctx, this->parallel_is);
   MachineView const view = output0->machine_view;
+  assert(ff.config.computationMode == COMP_MODE_INFERENCE);
   switch (domain.get_dim()) {
 #ifdef FF_USE_NCCL
 #define DIMFUNC(DIM)                                                           \
@@ -998,8 +1000,7 @@ void Op::set_argumentmap_for_init_inference(FFModel const &ff,
     int idx = 0;                                                               \
     for (PointInRectIterator<DIM> it(rect); it(); it++) {                      \
       FFHandler handle = ff.handlers[view.get_device_id(*it)];                 \
-      if (ff.config.computationMode == COMP_MODE_TRAINING &&                   \
-          op_type == OP_WEIGHT) {                                              \
+      if (op_type == OP_ALLREDUCE) {                                           \
         ncclComm_t *nccl_comms = ff.find_nccl_comms(view);                     \
         handle.ncclComm = nccl_comms[idx++];                                   \
       }                                                                        \
@@ -1302,8 +1303,9 @@ FFModel::FFModel(FFConfig &_config, bool cpu_offload)
       layer_global_guid(LAYER_GUID_FIRST_VALID),
       tensor_global_guid(TENSOR_GUID_FIRST_VALID),
       parallel_tensor_global_guid(PARALLEL_TENSOR_GUID_FIRST_VALID),
-      node_global_guid(NODE_GUID_FIRST_VALID), config(_config), optimizer(NULL),
-      loss_op(NULL), metrics_op(NULL), simulator(NULL) {
+      node_global_guid(NODE_GUID_FIRST_VALID), current_transformer_layer_id(0),
+      config(_config), optimizer(NULL), loss_op(NULL), metrics_op(NULL),
+      simulator(NULL) {
   this->search = new PCG::SearchHelper(this);
   this->graph_search = new PCG::GraphSearchHelper(this);
   this->cpu_offload = cpu_offload;
@@ -1348,7 +1350,7 @@ ncclComm_t *FFModel::find_nccl_comms(MachineView const &view) const {
   auto const &it = view_hash_to_nccl_comms.find(view.hash());
   if (it == view_hash_to_nccl_comms.end()) {
     assert(config.computationMode == COMP_MODE_INFERENCE);
-    return NULL;
+    return nullptr;
   } else {
     return it->second;
   }
@@ -2630,9 +2632,14 @@ bool FFModel::apply_fusion(std::vector<Op *> const &operators,
         operators[l]->op_type == OP_WEIGHT) {
       continue;
     }
-    // don't fuse parallel op since they have different parallel_is in
-    // forward/backward
-    if (operators[l]->is_parallel_op()) {
+    // don't fuse parallel op except allReduce since they have different
+    // parallel_is in forward/backward
+    if (operators[l]->is_parallel_op() &&
+        operators[l]->op_type != OP_ALLREDUCE) {
+      continue;
+    }
+    // don't fuse softmax since it returns inference results
+    if (operators[l]->op_type == OP_SOFTMAX) {
       continue;
     }
     size_t start = 0;
@@ -2675,9 +2682,10 @@ bool FFModel::apply_fusion(std::vector<Op *> const &operators,
               operators[i]->op_type == OP_WEIGHT) {
             continue;
           }
-          // don't fuse parallel op since they have different parallel_is in
-          // forward/backward
-          if (operators[i]->is_parallel_op()) {
+          // don't fuse parallel op except allReduce since they have different
+          // parallel_is in forward/backward
+          if (operators[i]->is_parallel_op() &&
+              operators[i]->op_type != OP_ALLREDUCE) {
             continue;
           }
           fused_op = new FusedOp(*this, operators[i]);
@@ -2967,7 +2975,51 @@ void FFModel::create_operators_from_layers() {
       inputs.push_back(tensors_to_parallel_tensors[l->inputs[i]]);
     }
     Op *op = nullptr;
-    // add replicate operators if needed
+    // add a combine before arg_topk
+    if (config.computationMode == COMP_MODE_INFERENCE &&
+        config.tensor_parallelism_degree > 1 && l->op_type == OP_ARG_TOPK) {
+      std::vector<ParallelTensor> partitioned_inputs;
+      assert(inputs.size() == 1);
+      Combine *comb = new Combine(*this,
+                                  inputs[0],
+                                  0 /*inner most dim*/,
+                                  config.tensor_parallelism_degree);
+      partitioned_inputs.push_back(comb->outputs[0]);
+      operators.push_back(comb);
+      op = create_operator_from_layer(l, partitioned_inputs);
+    } else {
+      op = create_operator_from_layer(l, inputs);
+    }
+    // add replicate operators after op if needed
+    if (config.computationMode == COMP_MODE_INFERENCE &&
+        config.tensor_parallelism_degree > 1 && l->op_type == OP_EMBEDDING) {
+      assert(op->numOutputs == 1);
+      Replicate *repl = new Replicate(*this,
+                                      op->outputs[0],
+                                      op->outputs[0]->num_dims - 1,
+                                      config.tensor_parallelism_degree);
+      operators.push_back(repl);
+      op = repl;
+    } else if (config.computationMode == COMP_MODE_INFERENCE &&
+               config.tensor_parallelism_degree > 1 &&
+               (l->op_type == OP_INC_MULTIHEAD_SELF_ATTENTION ||
+                l->op_type == OP_TREE_INC_MULTIHEAD_SELF_ATTENTION ||
+                (l->op_type == OP_LINEAR && layer_idx >= 2 &&
+                 layers[layer_idx - 1]->op_type == OP_RELU &&
+                 layers[layer_idx - 2]->op_type == OP_LINEAR) ||
+                (l->op_type == OP_LINEAR && layer_idx >= 5 &&
+                 layers[layer_idx - 1]->op_type == OP_EW_MUL &&
+                 layers[layer_idx - 2]->op_type == OP_EW_MUL &&
+                 layers[layer_idx - 3]->op_type == OP_SIGMOID &&
+                 layers[layer_idx - 4]->op_type == OP_LINEAR &&
+                 layers[layer_idx - 5]->op_type == OP_LINEAR))) {
+      assert(op->numOutputs == 1);
+      AllReduce *allreduce =
+          new AllReduce(*this, op->outputs[0], op->outputs[0]->num_dims - 1);
+      operators.push_back(allreduce);
+      op = allreduce;
+    }
+#ifdef DEADCODE
     if (config.computationMode == COMP_MODE_INFERENCE &&
         config.tensor_parallelism_degree > 1 &&
         (l->op_type == OP_INC_MULTIHEAD_SELF_ATTENTION ||
@@ -3022,7 +3074,7 @@ void FFModel::create_operators_from_layers() {
       operators.push_back(reduct);
       op = reduct;
     }
-
+#endif
     assert(op->numOutputs == l->numOutputs);
     for (int i = 0; i < op->numOutputs; i++) {
       tensors_to_parallel_tensors[l->outputs[i]] = op->outputs[i];
@@ -3364,13 +3416,10 @@ void FFModel::compile(LossType loss_type,
   }
 
 #ifdef FF_USE_NCCL
-  if (config.computationMode == COMP_MODE_TRAINING) {
-    // init all nccl communicators
-    for (size_t l = 0; l < operators.size(); l++) {
-      // Only create nccl for weights
-      if (operators[l]->op_type != OP_WEIGHT) {
-        continue;
-      }
+  for (size_t l = 0; l < operators.size(); l++) {
+    // Only create nccl for weights in training
+    if ((operators[l]->op_type == OP_WEIGHT &&
+         config.computationMode == COMP_MODE_TRAINING)) {
       MachineView view = operators[l]->outputs[0]->machine_view;
       if (view_hash_to_nccl_comms.find(view.hash()) ==
           view_hash_to_nccl_comms.end()) {
@@ -3789,6 +3838,9 @@ FFConfig::FFConfig() {
   }
   // Use Real::Machine::get_address_space_count() to obtain the number of nodes
   numNodes = Realm::Machine::get_machine().get_address_space_count();
+  data_parallelism_degree = 1;
+  tensor_parallelism_degree = 1;
+  pipeline_parallelism_degree = 1;
 
   Runtime *runtime = Runtime::get_runtime();
   lg_hlr = runtime;
@@ -4426,6 +4478,13 @@ void register_flexflow_internal_tasks() {
     Runtime::preregister_task_variant<OpMeta *, Linear::init_task>(
         registrar, "Linear Init Task");
   }
+  {
+    TaskVariantRegistrar registrar(LINEAR_INF_TASK_ID, "Linear Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<Linear::inference_task>(
+        registrar, "Linear Inference Task");
+  }
   {
     TaskVariantRegistrar registrar(LINEAR_FWD_TASK_ID, "Linear Forward");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
@@ -4836,6 +4895,13 @@ void register_flexflow_internal_tasks() {
     Runtime::preregister_task_variant<FusedOp::forward_task>(
         registrar, "FusedOp Forward Task");
   }
+  {
+    TaskVariantRegistrar registrar(FUSEDOP_INF_TASK_ID, "FusedOp Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<FusedOp::inference_task>(
+        registrar, "FusedOp Inference Task");
+  }
   {
     TaskVariantRegistrar registrar(FUSEDOP_BWD_TASK_ID, "FusedOp Backward");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
@@ -4935,6 +5001,28 @@ void register_flexflow_internal_tasks() {
     Runtime::preregister_task_variant<Reduction::backward_task>(
         registrar, "Reduction Backward Task");
   }
+  // AllReduce
+  {
+    TaskVariantRegistrar registrar(ALLREDUCE_INIT_TASK_ID, "AllReduce Init");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<OpMeta *, AllReduce::init_task>(
+        registrar, "AllReduce init Task");
+  }
+  {
+    TaskVariantRegistrar registrar(ALLREDUCE_FWD_TASK_ID, "AllReduce Forward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<AllReduce::forward_task>(
+        registrar, "AllReduce Forward Task");
+  }
+  {
+    TaskVariantRegistrar registrar(ALLREDUCE_BWD_TASK_ID, "AllReduce Backward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    Runtime::preregister_task_variant<AllReduce::backward_task>(
+        registrar, "AllReduce Backward Task");
+  }
   // FusedParallelOp
   {
     TaskVariantRegistrar registrar(FUSED_PARALLELOP_FWD_TASK_ID,
diff --git a/src/runtime/operator_params.cc b/src/runtime/operator_params.cc
index 8fdeacc623..6b61d5ac7a 100644
--- a/src/runtime/operator_params.cc
+++ b/src/runtime/operator_params.cc
@@ -34,6 +34,7 @@
 #include "flexflow/ops/topk.h"
 #include "flexflow/ops/transpose.h"
 #include "flexflow/ops/tree_inc_multihead_self_attention.h"
+#include "flexflow/parallel_ops/allreduce.h"
 #include "flexflow/parallel_ops/combine.h"
 #include "flexflow/parallel_ops/fused_parallel_op.h"
 #include "flexflow/parallel_ops/partition.h"
@@ -105,6 +106,8 @@ tl::optional<OperatorParameters> get_op_parameters(Op const *op) {
       return ((Reduction *)op)->get_params();
     case OP_COMBINE:
       return ((Combine *)op)->get_params();
+    case OP_ALLREDUCE:
+      return ((AllReduce *)op)->get_params();
     case OP_FUSED_PARALLEL:
       return ((FusedParallelOp *)op)->get_params();
     case OP_TRANSPOSE:
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index b47b17ad12..478092727f 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -243,6 +243,8 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
           outputFile << "end-to-end latency: " << std::fixed
                      << std::setprecision(3) << total_request_run_time
                      << std::endl;
+          outputFile << "num decoding steps: " << profile_info.decoding_steps
+                     << std::endl;
           outputFile << "token IDs: ";
           for (int i = 0; i < request.tokens.size(); i++) {
             outputFile << request.tokens[i];
@@ -562,6 +564,8 @@ BeamSearchBatchConfig
           outputFile << "end-to-end latency: " << std::fixed
                      << std::setprecision(3) << total_request_run_time
                      << std::endl;
+          outputFile << "num decoding steps: " << profile_info.decoding_steps
+                     << std::endl;
           outputFile << "token IDs: ";
           for (int i = 0; i < request.tokens.size(); i++) {
             outputFile << request.tokens[i];
diff --git a/src/runtime/substitution.cc b/src/runtime/substitution.cc
index 58623258f1..6a61e70fc6 100644
--- a/src/runtime/substitution.cc
+++ b/src/runtime/substitution.cc
@@ -37,6 +37,7 @@
 #include "flexflow/ops/softmax.h"
 #include "flexflow/ops/split.h"
 #include "flexflow/ops/tree_inc_multihead_self_attention.h"
+#include "flexflow/parallel_ops/allreduce.h"
 #include "flexflow/parallel_ops/combine.h"
 #include "flexflow/parallel_ops/fused_parallel_op.h"
 #include "flexflow/parallel_ops/partition.h"
@@ -898,8 +899,11 @@ bool GraphXfer::create_new_operator(OpX const *opx, Node &op) {
     case OP_EW_MUL:
     case OP_EW_MAX:
     case OP_EW_MIN: {
+      ElementBinaryParams params;
+      params.type = opx->type;
+      params.inplace_a = false;
       op = model->get_or_create_node<ElementBinary>({inputs[0], inputs[1]},
-                                                    {opx->type});
+                                                    params);
       break;
     }
     case OP_RELU: {
@@ -3683,8 +3687,13 @@ bool FFModel::convert_graph_to_operators(
       case OP_EW_MIN: {
         assert(inList.size() == 2);
         ElementBinary *eb = (ElementBinary *)node.ptr;
-        new_op = new ElementBinary(
-            *this, eb->op_type, inputs[0], inputs[1], eb->inplace_a, NULL);
+        new_op = new ElementBinary(*this,
+                                   eb->layer_guid,
+                                   eb->op_type,
+                                   inputs[0],
+                                   inputs[1],
+                                   eb->inplace_a,
+                                   NULL);
         break;
       }
       case OP_POOL2D: {
@@ -3777,6 +3786,12 @@ bool FFModel::convert_graph_to_operators(
                                reduction->reduction_degree);
         break;
       }
+      case OP_ALLREDUCE: {
+        assert(inList.size() == 1);
+        AllReduce *allreduce = (AllReduce *)node.ptr;
+        new_op = new AllReduce(*this, inputs[0], allreduce->allreduce_dim);
+        break;
+      }
       case OP_FUSED_PARALLEL: {
         assert(inList.size() == 1);
         FusedParallelOp *fused = (FusedParallelOp *)node.ptr;
diff --git a/tests/inference_tests.sh b/tests/inference_tests.sh
index 761c6cf332..f50d374633 100755
--- a/tests/inference_tests.sh
+++ b/tests/inference_tests.sh
@@ -37,26 +37,26 @@ mkdir -p ../inference/output
 ###############################################################################################
 
 # LLAMA
-../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../inference/weights/llama_160M_weights/ -ssm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_llama.txt
+../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../inference/weights/llama_160M_weights/ -ssm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_llama.txt -pipeline-parallelism-degree 4
 # LLAMA (half precision)
-../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights_half/ -llm-config ../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../inference/weights/llama_160M_weights_half/ -ssm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_llama_half.txt
+../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights_half/ -llm-config ../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../inference/weights/llama_160M_weights_half/ -ssm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_llama_half.txt -pipeline-parallelism-degree 4
 
 # OPT
-../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../inference/weights/opt_125M_weights/ -ssm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_opt.txt
+../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../inference/weights/opt_125M_weights/ -ssm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_opt.txt -pipeline-parallelism-degree 4
 # OPT (half precision)
-../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights_half/ -llm-config ../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../inference/weights/opt_125M_weights_half/ -ssm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_opt_half.txt
+../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights_half/ -llm-config ../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../inference/weights/opt_125M_weights_half/ -ssm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_opt_half.txt -pipeline-parallelism-degree 4
 
 # Tensor parallelism tests
 if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
     # LLAMA
-    ../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../inference/weights/llama_160M_weights/ -ssm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_llama_tp.txt -tensor-parallelism-degree 2
+    ../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../inference/weights/llama_160M_weights/ -ssm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_llama_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     # LLAMA (half precision)
-    ../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights_half/ -llm-config ../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../inference/weights/llama_160M_weights_half/ -ssm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_llama_half_tp.txt -tensor-parallelism-degree 2
+    ../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights_half/ -llm-config ../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../inference/weights/llama_160M_weights_half/ -ssm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_llama_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     
     # OPT
-    ../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../inference/weights/opt_125M_weights/ -ssm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_opt_tp.txt -tensor-parallelism-degree 2
+    ../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../inference/weights/opt_125M_weights/ -ssm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_opt_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     # OPT (half precision)
-    ../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights_half/ -llm-config ../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../inference/weights/opt_125M_weights_half/ -ssm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_opt_half_tp.txt -tensor-parallelism-degree 2
+    ../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights_half/ -llm-config ../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../inference/weights/opt_125M_weights_half/ -ssm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_opt_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
 fi
 
 ###############################################################################################
@@ -64,61 +64,80 @@ fi
 ###############################################################################################
 
 # LLAMA (small model)
-../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_160M_weights/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M.txt
+../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_160M_weights/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M.txt -pipeline-parallelism-degree 4
 # LLAMA (small model, half precision)
-../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_160M_weights_half/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M_half.txt
+../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_160M_weights_half/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M_half.txt -pipeline-parallelism-degree 4
 
 # LLAMA (big model)
-../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_7B.txt
+../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_7B.txt -pipeline-parallelism-degree 4
 # LLAMA (big model, half precision)
-../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights_half/ -llm-config ../inference/models/configs/llama_7B.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_7B_half.txt
+../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights_half/ -llm-config ../inference/models/configs/llama_7B.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_7B_half.txt -pipeline-parallelism-degree 4
 
 # OPT (small model)
-../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_125M_weights/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M.txt
+../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_125M_weights/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M.txt -pipeline-parallelism-degree 4
 # OPT (small model, half precision)
-../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_125M_weights_half/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M_half.txt
+../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_125M_weights_half/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M_half.txt -pipeline-parallelism-degree 4
 
 # OPT (big model)
-../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_6B.txt
+../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_6B.txt -pipeline-parallelism-degree 4
 # OPT (big model, half precision)
-../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights_half/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_6B_half.txt
+../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights_half/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_6B_half.txt -pipeline-parallelism-degree 4
 
 # Tensor parallelism tests
 if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
     # LLAMA (small model)
-    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_160M_weights/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M_tp.txt -tensor-parallelism-degree 2
+    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_160M_weights/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     # LLAMA (small model, half precision)
-    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_160M_weights_half/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M_half_tp.txt -tensor-parallelism-degree 2
+    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_160M_weights_half/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
 
     # LLAMA (big model)
-    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_7B_tp.txt -tensor-parallelism-degree 2
+    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_7B_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     # LLAMA (big model, half precision)
-    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights_half/ -llm-config ../inference/models/configs/llama_7B.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_7B_half_tp.txt -tensor-parallelism-degree 2
+    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights_half/ -llm-config ../inference/models/configs/llama_7B.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_7B_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
 
     # OPT (small model)
-    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_125M_weights/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M_tp.txt -tensor-parallelism-degree 2
+    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_125M_weights/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     # OPT (small model, half precision)
-    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_125M_weights_half/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M_half_tp.txt -tensor-parallelism-degree 2
+    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_125M_weights_half/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
 
     # OPT (big model)
-    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_6B_tp.txt -tensor-parallelism-degree 2
+    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_6B_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     # OPT (big model, half precision)
-    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights_half/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_6B_half_tp.txt -tensor-parallelism-degree 2
+    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights_half/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_6B_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
 fi
 
 ###############################################################################################
 ############################### Alignment and Speed tests #####################################
 ###############################################################################################
 
-############ Alignment between speculative inference and incremental decoding #################
-# Full precision
-diff <(tail -n +2 "../inference/output/incr_decoding_llama_7B.txt") <(tail -n +2 "../inference/output/spec_inference_llama.txt")
-diff <(tail -n +2 "../inference/output/incr_decoding_opt_6B.txt") <(tail -n +2 "../inference/output/spec_inference_opt.txt")
-# Half precision
-#diff <(tail -n +2 "../inference/output/incr_decoding_llama_7B_half.txt") <(tail -n +2 "../inference/output/spec_inference_llama_half.txt")
-#diff <(tail -n +2 "../inference/output/incr_decoding_opt_6B_half.txt" ) <(tail -n +2 "../inference/output/spec_inference_opt_half.txt")
+##################################### Helper functions #######################################
+function check_partial_token_match {
+    local file1="$1"
+    local file2="$2"
+    local num_tokens_to_match=30
+
+    # Read the second line of the first file
+    third_line=$(sed -n '3p' "$file1")
+    read -r line1 <<< "$third_line"
+    tokens1=${line1#*: }
+    IFS=',' read -ra arr1 <<< "$tokens1"
+
+    # Read the second line of the second file
+    third_line=$(sed -n '3p' "$file2")
+    read -r line2 <<< "$third_line"
+    tokens2=${line2#*: }
+    IFS=',' read -ra arr2 <<< "$tokens2"
+
+    # Compare the first few integers in the two lists
+    for ((i = 0; i < num_tokens_to_match; i++)); do
+        if [[ "${arr1[$i]}" != "${arr2[$i]}" ]]; then
+            echo "The first $num_tokens_to_match tokens in files $file1 and $file2 are not identical."
+            exit 1
+        fi
+    done
+    #echo "The first $num_tokens_to_match integers are identical."
+}
 
-# Speed test: speculative inference should be at very least 1.5x faster than incremental decoding
 function compare_speed_spec_infer_incr_decoding {
     local incrDec_file="$1"
     local specInf_file="$2"
@@ -142,27 +161,69 @@ function compare_speed_spec_infer_incr_decoding {
         exit 1
     fi
 }
+
+function compare_decoding_steps_spec_infer_incr_decoding {
+    local incrDec_file="$1"
+    local specInf_file="$2"
+
+    # Read the number of decoding steps from the second line of the files
+    second_line=$(sed -n '2p' "$incrDec_file")
+    read -r line <<< "$second_line"
+    incrDec=${line#*: }
+    second_line=$(sed -n '2p' "$specInf_file")
+    read -r line <<< "$second_line"
+    specInf=${line#*: }
+
+    if ! command -v bc &> /dev/null; then
+        echo "bc is not installed. Installing..."
+        sudo apt-get install -y bc
+    fi
+    
+    # Perform the comparison
+    threshold=$(bc <<< "$specInf * 1.5")
+    if (( $(echo "$incrDec >= $threshold" | bc -l) )); then
+        #echo "The decoding steps in $specInf_file are at least 1.5x less than those in $incrDec_file."
+        :
+    else
+        echo "Error: The decoding steps in $specInf_file are not at least 1.5x less than those in $incrDec_file!"
+        exit 1
+    fi
+}
+
+############ Alignment between speculative inference and incremental decoding #################
+# Full precision
+diff <(tail -n +3 "../inference/output/incr_decoding_llama_7B.txt") <(tail -n +3 "../inference/output/spec_inference_llama.txt")
+diff <(tail -n +3 "../inference/output/incr_decoding_opt_6B.txt")   <(tail -n +3 "../inference/output/spec_inference_opt.txt")
+# Half precision
+check_partial_token_match "../inference/output/incr_decoding_llama_7B_half.txt" "../inference/output/spec_inference_llama_half.txt"
+check_partial_token_match "../inference/output/incr_decoding_opt_6B_half.txt" "../inference/output/spec_inference_opt_half.txt"
+
+# Speed test: speculative inference should be at very least 1.5x faster than incremental decoding
 # Full precision
-compare_speed_spec_infer_incr_decoding "../inference/output/incr_decoding_llama_7B.txt" "../inference/output/spec_inference_llama.txt"
-compare_speed_spec_infer_incr_decoding "../inference/output/incr_decoding_opt_6B.txt" "../inference/output/spec_inference_opt.txt"
+#compare_speed_spec_infer_incr_decoding "../inference/output/incr_decoding_llama_7B.txt" "../inference/output/spec_inference_llama.txt"
+#compare_speed_spec_infer_incr_decoding "../inference/output/incr_decoding_opt_6B.txt" "../inference/output/spec_inference_opt.txt"
+compare_decoding_steps_spec_infer_incr_decoding "../inference/output/incr_decoding_llama_7B.txt" "../inference/output/spec_inference_llama.txt"
+compare_decoding_steps_spec_infer_incr_decoding "../inference/output/incr_decoding_opt_6B.txt" "../inference/output/spec_inference_opt.txt"
 # Half precision
 #compare_speed_spec_infer_incr_decoding "../inference/output/incr_decoding_llama_7B_half.txt" "../inference/output/spec_inference_llama_half.txt"
 #compare_speed_spec_infer_incr_decoding "../inference/output/incr_decoding_opt_6B_half.txt" "../inference/output/spec_inference_opt_half.txt"
+compare_decoding_steps_spec_infer_incr_decoding "../inference/output/incr_decoding_llama_7B_half.txt" "../inference/output/spec_inference_llama_half.txt"
+compare_decoding_steps_spec_infer_incr_decoding "../inference/output/incr_decoding_opt_6B_half.txt" "../inference/output/spec_inference_opt_half.txt"
 
 ############ Alignment between tensor model parallelism and pipeline parallelism only #################
 if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
-    diff <(tail -n +2 "../inference/output/spec_inference_llama_tp.txt") <(tail -n +2 "../inference/output/spec_inference_llama.txt")
-    diff <(tail -n +2 "../inference/output/spec_inference_opt_tp.txt") <(tail -n +2 "../inference/output/spec_inference_opt.txt")
-    diff <(tail -n +2 "../inference/output/spec_inference_llama_half_tp.txt") <(tail -n +2 "../inference/output/spec_inference_llama_half.txt")
-    diff <(tail -n +2 "../inference/output/spec_inference_opt_half_tp.txt") <(tail -n +2 "../inference/output/spec_inference_opt_half.txt")
-    diff <(tail -n +2 "../inference/output/incr_decoding_llama_160M_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_llama_160M.txt")
-    # diff <(tail -n +2 "../inference/output/incr_decoding_llama_160M_half_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_llama_160M_half.txt")
-    diff <(tail -n +2 "../inference/output/incr_decoding_llama_7B_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_llama_7B.txt")
-    diff <(tail -n +2 "../inference/output/incr_decoding_llama_7B_half_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_llama_7B_half.txt")
-    diff <(tail -n +2 "../inference/output/incr_decoding_opt_125M_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_opt_125M.txt")
-    diff <(tail -n +2 "../inference/output/incr_decoding_opt_125M_half_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_opt_125M_half.txt")
-    diff <(tail -n +2 "../inference/output/incr_decoding_opt_6B_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_opt_6B.txt")
-    diff <(tail -n +2 "../inference/output/incr_decoding_opt_6B_half_tp.txt") <(tail -n +2 "../inference/output/incr_decoding_opt_6B_half.txt")
+    diff <(tail -n +3 "../inference/output/spec_inference_llama_tp.txt") <(tail -n +3 "../inference/output/spec_inference_llama.txt")
+    diff <(tail -n +3 "../inference/output/spec_inference_opt_tp.txt")  <(tail -n +3 "../inference/output/spec_inference_opt.txt")
+    check_partial_token_match "../inference/output/spec_inference_llama_half_tp.txt" "../inference/output/spec_inference_llama_half.txt"
+    check_partial_token_match "../inference/output/spec_inference_opt_half_tp.txt" "../inference/output/spec_inference_opt_half.txt"
+    diff <(tail -n +3 "../inference/output/incr_decoding_llama_160M_tp.txt") <(tail -n +3 "../inference/output/incr_decoding_llama_160M.txt")
+    check_partial_token_match "../inference/output/incr_decoding_llama_160M_half_tp.txt" "../inference/output/incr_decoding_llama_160M_half.txt"
+    diff <(tail -n +3 "../inference/output/incr_decoding_llama_7B_tp.txt") <(tail -n +3 "../inference/output/incr_decoding_llama_7B.txt")
+    check_partial_token_match "../inference/output/incr_decoding_llama_7B_half_tp.txt" "../inference/output/incr_decoding_llama_7B_half.txt"
+    diff <(tail -n +3 "../inference/output/incr_decoding_opt_125M_tp.txt") <(tail -n +3 "../inference/output/incr_decoding_opt_125M.txt")
+    check_partial_token_match "../inference/output/incr_decoding_opt_125M_half_tp.txt" "../inference/output/incr_decoding_opt_125M_half.txt"
+    diff <(tail -n +3 "../inference/output/incr_decoding_opt_6B_tp.txt") <(tail -n +3 "../inference/output/incr_decoding_opt_6B.txt")
+    check_partial_token_match "../inference/output/incr_decoding_opt_6B_half_tp.txt" "../inference/output/incr_decoding_opt_6B_half.txt"
 fi
 
 ######################### Alignment tests with HuggingFace ####################################
@@ -192,15 +253,15 @@ python3 ./inference/huggingface_inference.py --model-name "facebook/opt-125m" --
 # OPT (big model, half precision)
 #python3 ./inference/huggingface_inference.py --model-name "facebook/opt-6.7b" --tokenizer-model-name "facebook/opt-6.7b" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_6B_half.txt" --gpu --max-length 127
 
-diff <(tail -n +2 "../inference/output/huggingface_llama_160M.txt") <(tail -n +4 "../inference/output/incr_decoding_llama_160M.txt")
-diff <(tail -n +2 "../inference/output/huggingface_llama_160M_half.txt") <(tail -n +4 "../inference/output/incr_decoding_llama_160M_half.txt")
-diff <(tail -n +2 "../inference/output/huggingface_llama_7B.txt") <(tail -n +4 "../inference/output/incr_decoding_llama_7B.txt")
-diff <(tail -n +2 "../inference/output/huggingface_llama_7B_half.txt") <(tail -n +4 "../inference/output/incr_decoding_llama_7B_half.txt")
+diff <(tail -n +2 "../inference/output/huggingface_llama_160M.txt") <(tail -n +5 "../inference/output/incr_decoding_llama_160M.txt")
+diff <(tail -n +2 "../inference/output/huggingface_llama_160M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../inference/output/incr_decoding_llama_160M_half.txt" | tr -s '[:space:]' '\n' | head -n 20)
+diff <(tail -n +2 "../inference/output/huggingface_llama_7B.txt") <(tail -n +5 "../inference/output/incr_decoding_llama_7B.txt")
+diff <(tail -n +2 "../inference/output/huggingface_llama_7B_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../inference/output/incr_decoding_llama_7B_half.txt" | tr -s '[:space:]' '\n' | head -n 20)
 
-diff <(tail -n +2 "../inference/output/huggingface_opt_125M.txt") <(tail -n +4 "../inference/output/incr_decoding_opt_125M.txt")
-diff <(tail -n +2 "../inference/output/huggingface_opt_125M_half.txt") <(tail -n +4 "../inference/output/incr_decoding_opt_125M_half.txt")
-#diff <(tail -n +2 "../inference/output/huggingface_opt_6B.txt") <(tail -n +4 "../inference/output/incr_decoding_opt_6B.txt")
-#diff <(tail -n +2 "../inference/output/huggingface_opt_6B_half.txt") <(tail -n +4 "../inference/output/incr_decoding_opt_6B_half.txt")
+diff <(tail -n +2 "../inference/output/huggingface_opt_125M.txt") <(tail -n +5 "../inference/output/incr_decoding_opt_125M.txt")
+diff <(tail -n +2 "../inference/output/huggingface_opt_125M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../inference/output/incr_decoding_opt_125M_half.txt" | tr -s '[:space:]' '\n' | head -n 20)
+#diff <(tail -n +2 "../inference/output/huggingface_opt_6B.txt") <(tail -n +5 "../inference/output/incr_decoding_opt_6B.txt")
+#diff <(tail -n +2 "../inference/output/huggingface_opt_6B_half.txt") <(tail -n +5 "../inference/output/incr_decoding_opt_6B_half.txt")
 
 ###############################################################################################
 ###################################### Cleanup ################################################

From ae67898b00405a130e8197b0b7808b5fc27d4867 Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Sun, 16 Jul 2023 14:45:58 -0400
Subject: [PATCH 166/344] change batch_size to num_active_tokens (#861)

---
 include/flexflow/ops/beam_topk.h | 4 ++--
 src/ops/arg_topk.cc              | 3 ---
 src/ops/beam_topk.cc             | 5 +----
 src/ops/beam_topk.cpp            | 4 ++--
 src/ops/beam_topk.cu             | 4 ++--
 5 files changed, 7 insertions(+), 13 deletions(-)

diff --git a/include/flexflow/ops/beam_topk.h b/include/flexflow/ops/beam_topk.h
index 76404bfb6d..57ab5c1074 100644
--- a/include/flexflow/ops/beam_topk.h
+++ b/include/flexflow/ops/beam_topk.h
@@ -82,7 +82,7 @@ class BeamTopK : public Op {
                              float *output_ptr,
                              int *indices_ptr,
                              int *parent_ptr,
-                             size_t batch_size,
+                             int batch_size,
                              int length,
                              bool sorted,
                              ffStream_t stream);
@@ -92,7 +92,7 @@ class BeamTopK : public Op {
                                      float *output_ptr,
                                      int *indices_ptr,
                                      int *parent_ptr,
-                                     size_t batch_size,
+                                     int batch_size,
                                      int length,
                                      bool sorted);
   Params get_params() const;
diff --git a/src/ops/arg_topk.cc b/src/ops/arg_topk.cc
index a604c016d2..c1bbb65f1e 100644
--- a/src/ops/arg_topk.cc
+++ b/src/ops/arg_topk.cc
@@ -311,9 +311,6 @@ InferenceResult
   int batch_size = bc->num_active_tokens();
   ArgTopK::forward_kernel_wrapper(m, input, indices, batch_size);
 
-  int length = input.domain.hi()[0] - input.domain.lo()[0] + 1;
-  batch_size = input.domain.get_volume() / length;
-
   InferenceResult ir;
   download_tensor<BatchConfig::TokenId>(
       indices.get_int32_ptr(), ir.token_ids, batch_size);
diff --git a/src/ops/beam_topk.cc b/src/ops/beam_topk.cc
index db507c1729..0920105acc 100644
--- a/src/ops/beam_topk.cc
+++ b/src/ops/beam_topk.cc
@@ -379,12 +379,9 @@ BeamInferenceResult
 
   // total token nums
   size_t tokens_per_request = in1_domain.hi()[1] - in1_domain.lo()[1] + 1;
-  size_t batch_size = in1_domain.get_volume() / length;
-
+  int batch_size = bc->num_active_tokens();
   // std::cout << "beam search topk params: " << length << ", " << k << ", "
   //           << batch_size << "\n";
-  assert(out2_domain.get_volume() / k == batch_size);
-
   // std::vector<int> beam_width;
   // std::unordered_map<size_t, int> sub_requests = bc->sub_requests;
   // for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
diff --git a/src/ops/beam_topk.cpp b/src/ops/beam_topk.cpp
index 1817eae4da..248ab188da 100644
--- a/src/ops/beam_topk.cpp
+++ b/src/ops/beam_topk.cpp
@@ -479,7 +479,7 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
                               float *output_ptr,
                               int *indices_ptr,
                               int *parent_ptr,
-                              size_t batch_size,
+                              int batch_size,
                               int length,
                               bool sorted,
                               hipStream_t stream) {
@@ -630,7 +630,7 @@ void BeamTopK::forward_kernel_wrapper(BeamTopKMeta const *m,
                                       float *output_ptr,
                                       int *indices_ptr,
                                       int *parent_ptr,
-                                      size_t batch_size,
+                                      int batch_size,
                                       int length,
                                       bool sorted) {
   hipStream_t stream;
diff --git a/src/ops/beam_topk.cu b/src/ops/beam_topk.cu
index 9a5cd86486..ceddb55f2d 100644
--- a/src/ops/beam_topk.cu
+++ b/src/ops/beam_topk.cu
@@ -511,7 +511,7 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
                               float *output_ptr,
                               int *indices_ptr,
                               int *parent_ptr,
-                              size_t batch_size,
+                              int batch_size,
                               int length,
                               bool sorted,
                               cudaStream_t stream) {
@@ -662,7 +662,7 @@ void BeamTopK::forward_kernel_wrapper(BeamTopKMeta const *m,
                                       float *output_ptr,
                                       int *indices_ptr,
                                       int *parent_ptr,
-                                      size_t batch_size,
+                                      int batch_size,
                                       int length,
                                       bool sorted) {
   cudaStream_t stream;

From 58b745d04c67a85fb42392ecd692fda30b8e80ae Mon Sep 17 00:00:00 2001
From: lambda shi <lambda7xx@gmail.com>
Date: Mon, 17 Jul 2023 05:03:50 +0800
Subject: [PATCH 167/344] Add opt-13B config (#841)

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 inference/models/configs/opt_13B.json | 15 +++++++++++++++
 1 file changed, 15 insertions(+)
 create mode 100644 inference/models/configs/opt_13B.json

diff --git a/inference/models/configs/opt_13B.json b/inference/models/configs/opt_13B.json
new file mode 100644
index 0000000000..96cad5c99b
--- /dev/null
+++ b/inference/models/configs/opt_13B.json
@@ -0,0 +1,15 @@
+{
+    "vocab_size": 50272,
+    "word_embed_proj_dim": 5120,
+    "hidden_size": 5120,
+    "num_attention_heads": 40,
+    "max_position_embeddings": 2048,
+    "layer_norm_elementwise_affine": true,
+    "num_hidden_layers": 40,
+    "dropout": 0.1,
+    "ffn_dim": 20480,
+    "max_beam_width": 1,
+    "batchSize": 8,
+    "sentence_len": 100,
+    "max_beam_depth": 4
+}

From b359ce9294d9b72d7fd411edfc0ac9780d206e90 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 16 Jul 2023 23:00:01 -0400
Subject: [PATCH 168/344] temp fix to bug

---
 src/ops/arg_topk.cu | 7 +++++++
 1 file changed, 7 insertions(+)

diff --git a/src/ops/arg_topk.cu b/src/ops/arg_topk.cu
index 575e0183b4..1011f42d51 100644
--- a/src/ops/arg_topk.cu
+++ b/src/ops/arg_topk.cu
@@ -411,6 +411,9 @@ void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
+  // TODO: remove this
+  cudaStreamSynchronize(stream);
+
   // Domain in1_domain = runtime->get_index_space_domain(
   //     ctx, task->regions[0].region.get_index_space());
   //   Domain out1_domain = runtime->get_index_space_domain(
@@ -481,6 +484,10 @@ void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
     cudaEventDestroy(t_end);
     printf("[ArgTopK] forward time = %.2lfms\n", elapsed);
   }
+
+  // TODO: remove this
+  cudaStreamSynchronize(stream);
+
 }
 
 ArgTopKMeta::ArgTopKMeta(FFHandler handler, Op const *op)

From 28fd257bcd48a8336b5fea613080c6110b59c45d Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 16 Jul 2023 23:00:24 -0400
Subject: [PATCH 169/344] linting

---
 src/ops/arg_topk.cu | 1 -
 1 file changed, 1 deletion(-)

diff --git a/src/ops/arg_topk.cu b/src/ops/arg_topk.cu
index 1011f42d51..8bd8222fa3 100644
--- a/src/ops/arg_topk.cu
+++ b/src/ops/arg_topk.cu
@@ -487,7 +487,6 @@ void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
 
   // TODO: remove this
   cudaStreamSynchronize(stream);
-
 }
 
 ArgTopKMeta::ArgTopKMeta(FFHandler handler, Op const *op)

From 96e41380326eec9ae014f768bb843793da971dbc Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 17 Jul 2023 14:19:39 -0400
Subject: [PATCH 170/344] replaced cudamemcpy with cudamemcpyasync

---
 src/ops/arg_topk.cu        |  6 +++---
 src/runtime/cuda_helper.cu | 41 ++++++++++++++++++--------------------
 2 files changed, 22 insertions(+), 25 deletions(-)

diff --git a/src/ops/arg_topk.cu b/src/ops/arg_topk.cu
index 8bd8222fa3..3ac19dec8e 100644
--- a/src/ops/arg_topk.cu
+++ b/src/ops/arg_topk.cu
@@ -411,9 +411,6 @@ void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
-  // TODO: remove this
-  cudaStreamSynchronize(stream);
-
   // Domain in1_domain = runtime->get_index_space_domain(
   //     ctx, task->regions[0].region.get_index_space());
   //   Domain out1_domain = runtime->get_index_space_domain(
@@ -484,9 +481,12 @@ void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
     cudaEventDestroy(t_end);
     printf("[ArgTopK] forward time = %.2lfms\n", elapsed);
   }
+<<<<<<< HEAD
 
   // TODO: remove this
   cudaStreamSynchronize(stream);
+=======
+>>>>>>> parent of b359ce92 (temp fix to bug)
 }
 
 ArgTopKMeta::ArgTopKMeta(FFHandler handler, Op const *op)
diff --git a/src/runtime/cuda_helper.cu b/src/runtime/cuda_helper.cu
index aa87a383af..d36413f993 100644
--- a/src/runtime/cuda_helper.cu
+++ b/src/runtime/cuda_helper.cu
@@ -211,15 +211,14 @@ __host__ void updateGAS(float *para_ptr,
 template <typename T>
 __host__ void
     print_tensor(T const *ptr, size_t num_elements, char const *prefix) {
-  // device synchronize to make sure the data are ready
-  // checkCUDA(cudaDeviceSynchronize());
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
   T *host_ptr;
   checkCUDA(cudaHostAlloc(&host_ptr,
                           sizeof(T) * num_elements,
                           cudaHostAllocPortable | cudaHostAllocMapped));
-  checkCUDA(cudaMemcpy(
-      host_ptr, ptr, sizeof(T) * num_elements, cudaMemcpyDeviceToHost));
-  // checkCUDA(cudaDeviceSynchronize());
+  checkCUDA(cudaMemcpyAsync(
+      host_ptr, ptr, sizeof(T) * num_elements, cudaMemcpyDeviceToHost, stream));
   int idx = 0;
   printf("%s", prefix);
   for (idx = 0; idx < num_elements; idx++) {
@@ -238,14 +237,14 @@ __host__ void print_beam_tensor(T const *ptr,
                                 int skip,
                                 int channel,
                                 char const *prefix) {
-  // device synchronize to make sure the data are ready
-  // checkCUDA(cudaDeviceSynchronize());
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
   T *host_ptr;
   checkCUDA(cudaHostAlloc(&host_ptr,
                           sizeof(T) * channel * skip,
                           cudaHostAllocPortable | cudaHostAllocMapped));
-  checkCUDA(cudaMemcpy(
-      host_ptr, ptr, sizeof(T) * channel * skip, cudaMemcpyDeviceToHost));
+  checkCUDA(cudaMemcpyAsync(
+      host_ptr, ptr, sizeof(T) * channel * skip, cudaMemcpyDeviceToHost, stream));
   // checkCUDA(cudaDeviceSynchronize());
   int idx = 0;
   printf("%s", prefix);
@@ -266,14 +265,14 @@ __host__ void print_beam_tensor(T const *ptr,
 template <typename T>
 __host__ void
     save_tensor(T const *ptr, size_t num_elements, char const *file_name) {
-  // device synchronize to make sure the data are ready
-  // checkCUDA(cudaDeviceSynchronize());
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
   T *host_ptr;
   checkCUDA(cudaHostAlloc(&host_ptr,
                           sizeof(T) * num_elements,
                           cudaHostAllocPortable | cudaHostAllocMapped));
-  checkCUDA(cudaMemcpy(
-      host_ptr, ptr, sizeof(T) * num_elements, cudaMemcpyDeviceToHost));
+  checkCUDA(cudaMemcpyAsync(
+      host_ptr, ptr, sizeof(T) * num_elements, cudaMemcpyDeviceToHost, stream));
   // checkCUDA(cudaDeviceSynchronize());
 
   FILE *tensor_file;
@@ -288,26 +287,24 @@ __host__ void
 
 template <typename T>
 __host__ T *download_tensor(T const *ptr, size_t num_elements) {
-  // device synchronize to make sure the data are ready
-  // checkCUDA(cudaDeviceSynchronize());
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
   T *host_ptr;
   checkCUDA(cudaHostAlloc(&host_ptr,
                           sizeof(T) * num_elements,
                           cudaHostAllocPortable | cudaHostAllocMapped));
-  checkCUDA(cudaMemcpy(
-      host_ptr, ptr, sizeof(T) * num_elements, cudaMemcpyDeviceToHost));
-  // checkCUDA(cudaDeviceSynchronize());
+  checkCUDA(cudaMemcpyAsync(
+      host_ptr, ptr, sizeof(T) * num_elements, cudaMemcpyDeviceToHost, stream));
   return host_ptr;
 }
 
 template <typename T>
 __host__ bool download_tensor(T const *ptr, T *dst, size_t num_elements) {
-  // device synchronize to make sure the data are ready
-  // checkCUDA(cudaDeviceSynchronize());
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
   assert(dst != nullptr);
   checkCUDA(
-      cudaMemcpy(dst, ptr, sizeof(T) * num_elements, cudaMemcpyDeviceToHost));
-  // checkCUDA(cudaDeviceSynchronize());
+      cudaMemcpyAsync(dst, ptr, sizeof(T) * num_elements, cudaMemcpyDeviceToHost, stream));
   return true;
 }
 cudnnStatus_t cudnnSetTensorDescriptorFromDomain4SoftMax(

From f6e4c5dfeba84e96eb59f4209b61cd2291d36a6d Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 17 Jul 2023 14:21:03 -0400
Subject: [PATCH 171/344] linting

---
 src/runtime/cuda_helper.cu | 11 +++++++----
 1 file changed, 7 insertions(+), 4 deletions(-)

diff --git a/src/runtime/cuda_helper.cu b/src/runtime/cuda_helper.cu
index d36413f993..dff5157a8a 100644
--- a/src/runtime/cuda_helper.cu
+++ b/src/runtime/cuda_helper.cu
@@ -243,8 +243,11 @@ __host__ void print_beam_tensor(T const *ptr,
   checkCUDA(cudaHostAlloc(&host_ptr,
                           sizeof(T) * channel * skip,
                           cudaHostAllocPortable | cudaHostAllocMapped));
-  checkCUDA(cudaMemcpyAsync(
-      host_ptr, ptr, sizeof(T) * channel * skip, cudaMemcpyDeviceToHost, stream));
+  checkCUDA(cudaMemcpyAsync(host_ptr,
+                            ptr,
+                            sizeof(T) * channel * skip,
+                            cudaMemcpyDeviceToHost,
+                            stream));
   // checkCUDA(cudaDeviceSynchronize());
   int idx = 0;
   printf("%s", prefix);
@@ -303,8 +306,8 @@ __host__ bool download_tensor(T const *ptr, T *dst, size_t num_elements) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   assert(dst != nullptr);
-  checkCUDA(
-      cudaMemcpyAsync(dst, ptr, sizeof(T) * num_elements, cudaMemcpyDeviceToHost, stream));
+  checkCUDA(cudaMemcpyAsync(
+      dst, ptr, sizeof(T) * num_elements, cudaMemcpyDeviceToHost, stream));
   return true;
 }
 cudnnStatus_t cudnnSetTensorDescriptorFromDomain4SoftMax(

From 319c69ddf163e50a819ed040cfd65b87905eb3e3 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 17 Jul 2023 14:23:15 -0400
Subject: [PATCH 172/344] fix merge issue

---
 src/ops/arg_topk.cu | 6 ------
 1 file changed, 6 deletions(-)

diff --git a/src/ops/arg_topk.cu b/src/ops/arg_topk.cu
index 3ac19dec8e..575e0183b4 100644
--- a/src/ops/arg_topk.cu
+++ b/src/ops/arg_topk.cu
@@ -481,12 +481,6 @@ void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
     cudaEventDestroy(t_end);
     printf("[ArgTopK] forward time = %.2lfms\n", elapsed);
   }
-<<<<<<< HEAD
-
-  // TODO: remove this
-  cudaStreamSynchronize(stream);
-=======
->>>>>>> parent of b359ce92 (temp fix to bug)
 }
 
 ArgTopKMeta::ArgTopKMeta(FFHandler handler, Op const *op)

From 3d494a1a58085c081e5585d0f186012c5754896e Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 17 Jul 2023 23:01:43 +0000
Subject: [PATCH 173/344] fix bugs

---
 docker/run.sh        |   4 +-
 src/runtime/model.cc | 363 +++++++++++++++++++++++++++++++++++--------
 2 files changed, 297 insertions(+), 70 deletions(-)

diff --git a/docker/run.sh b/docker/run.sh
index e04e7d68c1..aad3c1da27 100755
--- a/docker/run.sh
+++ b/docker/run.sh
@@ -28,9 +28,9 @@ fi
 
 
 if [[ "$image" == "flexflow-environment" ]]; then
-    eval docker run -it "$gpu_arg" "--shm-size=${SHM_SIZE}" "flexflow-environment-${FF_GPU_BACKEND}:latest"
+    eval docker run -it "$gpu_arg" "--shm-size=${SHM_SIZE}" "flexflow-environment-${FF_GPU_BACKEND}-11.8.0:latest"
 elif [[ "$image" == "flexflow" ]]; then
-    eval docker run -it "$gpu_arg" "--shm-size=${SHM_SIZE}" "flexflow-${FF_GPU_BACKEND}:latest"
+    eval docker run -it "$gpu_arg" "--shm-size=${SHM_SIZE}" "flexflow-${FF_GPU_BACKEND}-11.8.0:latest"
 elif [[ "$image" == "mt5" ]]; then
     # Backward compatibility
     eval docker run -it "$gpu_arg" "--shm-size=${SHM_SIZE}" \
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index f1c794cef7..5179178cd9 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -4069,8 +4069,16 @@ void register_flexflow_internal_tasks(Runtime *runtime,
                                    "RequestManager Load Tokens");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<RequestManager::load_tokens_task>(
-        registrar, "RequestManager Load Tokens Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<RequestManager::load_tokens_task>(
+          registrar, "RequestManager Load Tokens Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<RequestManager::load_tokens_task>(
+          registrar);
+    }
   }
   // RequestManager load position tokens
   {
@@ -4078,8 +4086,16 @@ void register_flexflow_internal_tasks(Runtime *runtime,
                                    "RequestManager Load Position tokens");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<RequestManager::load_positions_task>(
-        registrar, "RequestManager Load Position Tokens Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<RequestManager::load_positions_task>(
+          registrar, "RequestManager Load Position Tokens Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<RequestManager::load_positions_task>(
+          registrar);
+    }
   }
   // ElementUnary task
   {
@@ -4180,29 +4196,57 @@ void register_flexflow_internal_tasks(Runtime *runtime,
     TaskVariantRegistrar registrar(EXPERTS_INIT_TASK_ID, "Experts Init");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<OpMeta *, Experts::init_task>(
-        registrar, "Experts Init Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<OpMeta *, Experts::init_task>(
+          registrar, "Experts Init Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<OpMeta *, Experts::init_task>(registrar);
+    }
   }
   {
     TaskVariantRegistrar registrar(EXPERTS_FWD_TASK_ID, "Experts Forward");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<Experts::forward_task>(
-        registrar, "Experts Forward Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<Experts::forward_task>(
+          registrar, "Experts Forward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<Experts::forward_task>(registrar);
+    }
   }
   {
     TaskVariantRegistrar registrar(EXPERTS_BWD_TASK_ID, "Experts Backward");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<Experts::backward_task>(
-        registrar, "Experts Backward Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<Experts::backward_task>(
+          registrar, "Experts Backward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<Experts::backward_task>(registrar);
+    }
   }
   {
     TaskVariantRegistrar registrar(EXPERTS_INF_TASK_ID, "Experts Inference");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<Experts::inference_task>(
-        registrar, "Experts Inference Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<Experts::inference_task>(
+          registrar, "Experts Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<Experts::inference_task>(registrar);
+    }
   }
   // Cast
   {
@@ -4789,15 +4833,29 @@ void register_flexflow_internal_tasks(Runtime *runtime,
     TaskVariantRegistrar registrar(RMSNROM_INIT_TASK_ID, "rmsnorm_init_task");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<OpMeta *, RMSNorm::init_task>(
-        registrar, "rmsnorm_init_task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<OpMeta *, RMSNorm::init_task>(
+          registrar, "rmsnorm_init_task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<OpMeta *, RMSNorm::init_task>(registrar);
+    }
   }
   {
     TaskVariantRegistrar registrar(RMSNROM_FWD_TASK_ID, "rmsnorm_fwd_task");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<RMSNorm::forward_task>(
-        registrar, "rmsnorm_fwd_task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<RMSNorm::forward_task>(
+          registrar, "rmsnorm_fwd_task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<RMSNorm::forward_task>(registrar);
+    }
   }
   {
     TaskVariantRegistrar registrar(LAYERNORM_BWD_TASK_ID, "layernorm_bwd_task");
@@ -4832,8 +4890,15 @@ void register_flexflow_internal_tasks(Runtime *runtime,
     TaskVariantRegistrar registrar(LINEAR_INF_TASK_ID, "Linear Inference");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<Linear::inference_task>(
-        registrar, "Linear Inference Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<Linear::inference_task>(
+          registrar, "Linear Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<Linear::inference_task>(registrar);
+    }
   }
   {
     TaskVariantRegistrar registrar(LINEAR_FWD_TASK_ID, "Linear Forward");
@@ -4953,8 +5018,17 @@ void register_flexflow_internal_tasks(Runtime *runtime,
     TaskVariantRegistrar registrar(SOFTMAX_INF_TASK_ID, "softmax_inf_task");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<InferenceResult, Softmax::inference_task>(
-        registrar, "softmax_inf_task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<InferenceResult,
+                                        Softmax::inference_task>(
+          registrar, "softmax_inf_task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<InferenceResult, Softmax::inference_task>(
+          registrar);
+    }
   }
   // compute Loss
   {
@@ -5275,31 +5349,62 @@ void register_flexflow_internal_tasks(Runtime *runtime,
     TaskVariantRegistrar registrar(ARG_TOPK_INIT_TASK_ID, "ArgTopK Init");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<OpMeta *, ArgTopK::init_task>(
-        registrar, "ArgTopK Init Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<OpMeta *, ArgTopK::init_task>(
+          registrar, "ArgTopK Init Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<OpMeta *, ArgTopK::init_task>(registrar);
+    }
   }
   {
     TaskVariantRegistrar registrar(ARG_TOPK_INF_TASK_ID, "ArgTopK Inference");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<InferenceResult, ArgTopK::inference_task>(
-        registrar, "ArgTopK Inference Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<InferenceResult,
+                                        ArgTopK::inference_task>(
+          registrar, "ArgTopK Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<InferenceResult, ArgTopK::inference_task>(
+          registrar);
+    }
   }
   // BeamTopk task
   {
     TaskVariantRegistrar registrar(BEAM_TOPK_INIT_TASK_ID, "BeamTopK Init");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<OpMeta *, BeamTopK::init_task>(
-        registrar, "BeamTopK Init Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<OpMeta *, BeamTopK::init_task>(
+          registrar, "BeamTopK Init Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<OpMeta *, BeamTopK::init_task>(registrar);
+    }
   }
   {
     TaskVariantRegistrar registrar(BEAM_TOPK_INF_TASK_ID, "BeamTopK Inference");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<BeamInferenceResult,
-                                      BeamTopK::inference_task>(
-        registrar, "BeamTopK Inference Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<BeamInferenceResult,
+                                        BeamTopK::inference_task>(
+          registrar, "BeamTopK Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<BeamInferenceResult,
+                                     BeamTopK::inference_task>(registrar);
+    }
   }
   // Transpose task
   {
@@ -5400,18 +5505,35 @@ void register_flexflow_internal_tasks(Runtime *runtime,
                                    "IncMultiHeadSelfAttention Init");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<OpMeta *,
-                                      IncMultiHeadSelfAttention::init_task>(
-        registrar, "IncMultiHeadSelfAttention Init Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<OpMeta *,
+                                        IncMultiHeadSelfAttention::init_task>(
+          registrar, "IncMultiHeadSelfAttention Init Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<OpMeta *,
+                                     IncMultiHeadSelfAttention::init_task>(
+          registrar);
+    }
   }
   {
     TaskVariantRegistrar registrar(INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
                                    "IncMultiHeadSelfAttention Inference");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<
-        IncMultiHeadSelfAttention::inference_task>(
-        registrar, "IncMultiHeadSelfAttention Inference Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<
+          IncMultiHeadSelfAttention::inference_task>(
+          registrar, "IncMultiHeadSelfAttention Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<IncMultiHeadSelfAttention::inference_task>(
+          registrar);
+    }
   }
   // MultiQueryAttention task
   {
@@ -5419,18 +5541,36 @@ void register_flexflow_internal_tasks(Runtime *runtime,
                                    "IncMultiQuerySelfAttention Init");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<OpMeta *,
-                                      IncMultiQuerySelfAttention::init_task>(
-        registrar, "IncMultiQuerySelfAttention Init Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<OpMeta *,
+                                        IncMultiQuerySelfAttention::init_task>(
+          registrar, "IncMultiQuerySelfAttention Init Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<OpMeta *,
+                                     IncMultiQuerySelfAttention::init_task>(
+          registrar);
+    }
   }
   {
     TaskVariantRegistrar registrar(INC_MULTIQUERY_SELF_ATTENTION_INF_TASK_ID,
                                    "IncMultiQuerySelfAttention Inference");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<
-        IncMultiQuerySelfAttention::inference_task>(
-        registrar, "IncMultiQuerySelfAttention Inference Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<
+          IncMultiQuerySelfAttention::inference_task>(
+          registrar, "IncMultiQuerySelfAttention Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime
+          ->register_task_variant<IncMultiQuerySelfAttention::inference_task>(
+              registrar);
+    }
   }
   // speculative MultiHeadAttention task
   {
@@ -5439,9 +5579,19 @@ void register_flexflow_internal_tasks(Runtime *runtime,
         "Speculative IncMultiHeadSelfAttention Init");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<OpMeta *,
-                                      SpecIncMultiHeadSelfAttention::init_task>(
-        registrar, "Speculative IncMultiHeadSelfAttention Init Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<
+          OpMeta *,
+          SpecIncMultiHeadSelfAttention::init_task>(
+          registrar, "Speculative IncMultiHeadSelfAttention Init Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<OpMeta *,
+                                     SpecIncMultiHeadSelfAttention::init_task>(
+          registrar);
+    }
   }
   {
     TaskVariantRegistrar registrar(
@@ -5449,9 +5599,17 @@ void register_flexflow_internal_tasks(Runtime *runtime,
         "Speculative IncMultiHeadSelfAttention Inference");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<
-        SpecIncMultiHeadSelfAttention::inference_task>(
-        registrar, "Speculative IncMultiHeadSelfAttention Inference Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<
+          SpecIncMultiHeadSelfAttention::inference_task>(
+          registrar, "Speculative IncMultiHeadSelfAttention Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<
+          SpecIncMultiHeadSelfAttention::inference_task>(registrar);
+    }
   }
   {
     TaskVariantRegistrar registrar(
@@ -5459,9 +5617,19 @@ void register_flexflow_internal_tasks(Runtime *runtime,
         "TreeIncMultiHeadSelfAttention Init");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<OpMeta *,
-                                      TreeIncMultiHeadSelfAttention::init_task>(
-        registrar, "TreeIncMultiHeadSelfAttention Init Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<
+          OpMeta *,
+          TreeIncMultiHeadSelfAttention::init_task>(
+          registrar, "TreeIncMultiHeadSelfAttention Init Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<OpMeta *,
+                                     TreeIncMultiHeadSelfAttention::init_task>(
+          registrar);
+    }
   }
   {
     TaskVariantRegistrar registrar(
@@ -5469,9 +5637,17 @@ void register_flexflow_internal_tasks(Runtime *runtime,
         "TreeIncMultiHeadSelfAttention Inference");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<
-        TreeIncMultiHeadSelfAttention::inference_task>(
-        registrar, "TreeIncMultiHeadSelfAttention Inference Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<
+          TreeIncMultiHeadSelfAttention::inference_task>(
+          registrar, "TreeIncMultiHeadSelfAttention Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<
+          TreeIncMultiHeadSelfAttention::inference_task>(registrar);
+    }
   }
   // NoOp
   {
@@ -5521,8 +5697,15 @@ void register_flexflow_internal_tasks(Runtime *runtime,
     TaskVariantRegistrar registrar(FUSEDOP_INF_TASK_ID, "FusedOp Inference");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<FusedOp::inference_task>(
-        registrar, "FusedOp Inference Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<FusedOp::inference_task>(
+          registrar, "FusedOp Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<FusedOp::inference_task>(registrar);
+    }
   }
   {
     TaskVariantRegistrar registrar(FUSEDOP_BWD_TASK_ID, "FusedOp Backward");
@@ -5634,8 +5817,15 @@ void register_flexflow_internal_tasks(Runtime *runtime,
     TaskVariantRegistrar registrar(REPLICATE_INIT_TASK_ID, "Replicate Init");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<OpMeta *, Replicate::init_task>(
-        registrar, "Replicate init Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<OpMeta *, Replicate::init_task>(
+          registrar, "Replicate init Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<OpMeta *, Replicate::init_task>(registrar);
+    }
   }
   {
     TaskVariantRegistrar registrar(REPLICATE_FWD_TASK_ID, "Replicate Forward");
@@ -5670,8 +5860,15 @@ void register_flexflow_internal_tasks(Runtime *runtime,
     TaskVariantRegistrar registrar(REDUCTION_INIT_TASK_ID, "Reduction Init");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<OpMeta *, Reduction::init_task>(
-        registrar, "Reduction init Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<OpMeta *, Reduction::init_task>(
+          registrar, "Reduction init Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<OpMeta *, Reduction::init_task>(registrar);
+    }
   }
   {
     TaskVariantRegistrar registrar(REDUCTION_FWD_TASK_ID, "Reduction Forward");
@@ -5706,22 +5903,43 @@ void register_flexflow_internal_tasks(Runtime *runtime,
     TaskVariantRegistrar registrar(ALLREDUCE_INIT_TASK_ID, "AllReduce Init");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<OpMeta *, AllReduce::init_task>(
-        registrar, "AllReduce init Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<OpMeta *, AllReduce::init_task>(
+          registrar, "AllReduce init Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<OpMeta *, AllReduce::init_task>(registrar);
+    }
   }
   {
     TaskVariantRegistrar registrar(ALLREDUCE_FWD_TASK_ID, "AllReduce Forward");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<AllReduce::forward_task>(
-        registrar, "AllReduce Forward Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<AllReduce::forward_task>(
+          registrar, "AllReduce Forward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<AllReduce::forward_task>(registrar);
+    }
   }
   {
     TaskVariantRegistrar registrar(ALLREDUCE_BWD_TASK_ID, "AllReduce Backward");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<AllReduce::backward_task>(
-        registrar, "AllReduce Backward Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<AllReduce::backward_task>(
+          registrar, "AllReduce Backward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<AllReduce::backward_task>(registrar);
+    }
   }
   // FusedParallelOp
   {
@@ -6006,9 +6224,18 @@ void register_flexflow_internal_tasks(Runtime *runtime,
     TaskVariantRegistrar registrar(TENSOR_EQUAL_TASK_ID, "Tensor Equal");
     registrar.add_constraint(ProcessorConstraint(Processor::LOC_PROC));
     registrar.set_leaf();
-    Runtime::preregister_task_variant<bool,
-                                      ParallelTensorBase::tensor_equal_task>(
-        registrar, "Tensor Equal Task");
+    if (pre_register) {
+      Runtime::preregister_task_variant<bool,
+                                        ParallelTensorBase::tensor_equal_task>(
+          registrar, "Tensor Equal Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime
+          ->register_task_variant<bool, ParallelTensorBase::tensor_equal_task>(
+              registrar);
+    }
   }
 }
 

From b483b6698fcf4e004c49ef92bfd5d9d7b4d3f223 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 17 Jul 2023 23:05:44 +0000
Subject: [PATCH 174/344] undo accidental change

---
 docker/run.sh | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/docker/run.sh b/docker/run.sh
index aad3c1da27..e04e7d68c1 100755
--- a/docker/run.sh
+++ b/docker/run.sh
@@ -28,9 +28,9 @@ fi
 
 
 if [[ "$image" == "flexflow-environment" ]]; then
-    eval docker run -it "$gpu_arg" "--shm-size=${SHM_SIZE}" "flexflow-environment-${FF_GPU_BACKEND}-11.8.0:latest"
+    eval docker run -it "$gpu_arg" "--shm-size=${SHM_SIZE}" "flexflow-environment-${FF_GPU_BACKEND}:latest"
 elif [[ "$image" == "flexflow" ]]; then
-    eval docker run -it "$gpu_arg" "--shm-size=${SHM_SIZE}" "flexflow-${FF_GPU_BACKEND}-11.8.0:latest"
+    eval docker run -it "$gpu_arg" "--shm-size=${SHM_SIZE}" "flexflow-${FF_GPU_BACKEND}:latest"
 elif [[ "$image" == "mt5" ]]; then
     # Backward compatibility
     eval docker run -it "$gpu_arg" "--shm-size=${SHM_SIZE}" \

From d3cd3709a35dc939a60dc6e153cb9ccb2c3ef4f3 Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Tue, 18 Jul 2023 21:02:13 -0400
Subject: [PATCH 175/344] Inference: Sampling result (#854)

* init

* sort

* .

* del

* .

* finish impl.

* clean up, format, hip_rocm

* format

* .

* fix half precision.

* try torch1.

* .

* batch size

* fix

* rename GenerationConfig SamplingConfig

---------

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 include/flexflow/ffconst.h               |   1 +
 include/flexflow/inference.h             |  12 +
 include/flexflow/model.h                 |   6 +
 include/flexflow/operator_params.h       |   2 +
 include/flexflow/ops/sampling.h          | 108 +++++++
 include/flexflow/ops/sampling_params.h   |  24 ++
 inference/incr_decoding/incr_decoding.cc |  25 ++
 inference/models/llama.cc                |  10 +-
 inference/models/llama.h                 |   1 +
 inference/spec_infer/spec_infer.cc       |   3 +
 src/ops/fused.cu                         |   3 +-
 src/ops/sampling.cc                      | 343 +++++++++++++++++++++++
 src/ops/sampling.cpp                     |  67 +++++
 src/ops/sampling.cu                      | 267 ++++++++++++++++++
 src/runtime/ffconst_utils.cc             |   2 +
 src/runtime/graph.cc                     |   5 +
 src/runtime/model.cc                     |  40 ++-
 src/runtime/operator_params.cc           |   3 +
 18 files changed, 919 insertions(+), 3 deletions(-)
 create mode 100644 include/flexflow/ops/sampling.h
 create mode 100644 include/flexflow/ops/sampling_params.h
 create mode 100644 src/ops/sampling.cc
 create mode 100644 src/ops/sampling.cpp
 create mode 100644 src/ops/sampling.cu

diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index 3d899ac91d..65fa23569b 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -167,6 +167,7 @@ enum OperatorType {
   OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION,
   OP_TREE_INC_MULTIHEAD_SELF_ATTENTION,
   OP_INC_MULTIQUERY_SELF_ATTENTION,
+  OP_SAMPLING,
   // Parallel Ops
   OP_REPARTITION,
   OP_COMBINE,
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index a1846c96dc..0c5274e15b 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -65,6 +65,18 @@ struct BeamTree {
   treeLayer treeLayers[BeamSearchBatchConfig::MAX_BEAM_DEPTH + 1];
 };
 
+struct SamplingConfig {
+  bool do_sample = false;
+  float temperature = 0.8;
+  float topp = 0.6;
+  SamplingConfig(bool _do_sample, float _temperature, float _topp) {
+    temperature = _temperature > 0 ? _temperature : temperature;
+    topp = _topp > 0 ? _topp : topp;
+    do_sample = _do_sample;
+  }
+  SamplingConfig() {}
+};
+
 // struct BeamTree_v2 {
 //   std::vector<BatchConfig::TokenId> tokens;
 //   std::vector<int> parent_ids;
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 38c1cec838..3a76209b98 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -136,6 +136,8 @@ enum TaskIDs {
   TOPK_BWD_TASK_ID,
   ARG_TOPK_INIT_TASK_ID,
   ARG_TOPK_INF_TASK_ID,
+  SAMPLING_INIT_TASK_ID,
+  SAMPLING_INF_TASK_ID,
   TRANSPOSE_INIT_TASK_ID,
   TRANSPOSE_FWD_TASK_ID,
   TRANSPOSE_BWD_TASK_ID,
@@ -312,6 +314,7 @@ class RMSNorm;
 class BeamTopK;
 class SpecIncMultiHeadSelfAttention;
 class IncMultiQuerySelfAttention;
+class Sampling;
 class Combine;
 class Repartition;
 class Reduction;
@@ -612,6 +615,7 @@ class FFModel {
                    int k,
                    bool sorted,
                    char const *name = NULL);
+  Tensor sampling(const Tensor input, float top_p, char const *name = NULL);
   Tensor multihead_attention(const Tensor query,
                              const Tensor key,
                              const Tensor value,
@@ -1061,6 +1065,8 @@ class FFModel {
           IncMultiQuerySelfAttention *>,
       std::unordered_map<std::pair<ParallelTensorShape, BeamTopKParams>,
                          BeamTopK *>,
+      std::unordered_map<std::pair<ParallelTensorShape, SamplingParams>,
+                         Sampling *>,
       std::unordered_map<
           std::pair<ParallelTensorShape, SpecIncMultiHeadSelfAttentionParams>,
           SpecIncMultiHeadSelfAttention *>,
diff --git a/include/flexflow/operator_params.h b/include/flexflow/operator_params.h
index f6918ff581..5c2101d190 100644
--- a/include/flexflow/operator_params.h
+++ b/include/flexflow/operator_params.h
@@ -26,6 +26,7 @@
 #include "flexflow/ops/reduce_params.h"
 #include "flexflow/ops/reshape_params.h"
 #include "flexflow/ops/rms_norm_params.h"
+#include "flexflow/ops/sampling_params.h"
 #include "flexflow/ops/softmax_params.h"
 #include "flexflow/ops/spec_inc_multihead_self_attention_params.h"
 #include "flexflow/ops/split_params.h"
@@ -71,6 +72,7 @@ using OperatorParameters = mp::variant<AggregateParams,
                                        SplitParams,
                                        TopKParams,
                                        ArgTopKParams,
+                                       SamplingParams,
                                        SoftmaxParams,
                                        TransposeParams,
                                        RepartitionParams,
diff --git a/include/flexflow/ops/sampling.h b/include/flexflow/ops/sampling.h
new file mode 100644
index 0000000000..8ffa6a290a
--- /dev/null
+++ b/include/flexflow/ops/sampling.h
@@ -0,0 +1,108 @@
+#ifndef _FLEXFLOW_SAMPLING_TOPK_H_
+#define _FLEXFLOW_SAMPLING_TOPK_H_
+
+#include "flexflow/inference.h"
+#include "flexflow/model.h"
+#include "flexflow/node.h"
+#include "flexflow/ops/sampling_params.h"
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+#include <curand.h>
+#include <curand_kernel.h>
+#endif
+
+namespace FlexFlow {
+
+class SamplingMeta : public OpMeta {
+public:
+  float top_p;
+  void *sorted_logits;
+  int *sorted_idx;
+  int *begin_offset;
+  int *end_offset;
+  int *idx;
+  void *d_temp_storage;
+  size_t temp_storage_bytes;
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+  curandState *state;
+#endif
+  SamplingMeta(FFHandler handle,
+               Op const *op,
+               int batch_size,
+               int total_ele,
+               GenericTensorAccessorW input);
+};
+
+class Sampling : public Op {
+public:
+  using Params = SamplingParams;
+  using Input = ParallelTensor;
+  Sampling(FFModel &model,
+           const ParallelTensor input,
+           float top_p,
+           char const *name);
+  Sampling(FFModel &model, Sampling const &other, const ParallelTensor input);
+  Sampling(FFModel &model,
+           Params const &params,
+           Input const input,
+           char const *name = nullptr);
+  void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
+  void forward(FFModel const &) override;
+  void backward(FFModel const &) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
+  void print_layer(FFModel const &model) override {
+    assert(0);
+  }
+  static Op *
+      create_operator_from_layer(FFModel &model,
+                                 Layer const *layer,
+                                 std::vector<ParallelTensor> const &inputs);
+
+  static OpMeta *init_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static InferenceResult
+      inference_task(Legion::Task const *task,
+                     std::vector<Legion::PhysicalRegion> const &regions,
+                     Legion::Context ctx,
+                     Legion::Runtime *runtime);
+  void serialize(Legion::Serializer &s) const override;
+  static PCG::Node deserialize(FFModel &ff,
+                               Legion::Deserializer &d,
+                               ParallelTensor inputs[],
+                               int num_inputs);
+  Op *materialize(FFModel &ff,
+                  ParallelTensor inputs[],
+                  int num_inputs) const override;
+  bool measure_operator_cost(Simulator *sim,
+                             MachineView const &pc,
+                             CostMetrics &cost_metrics) const override;
+  template <typename DT>
+  static void forward_kernel(SamplingMeta const *m,
+                             DT *input_ptr,
+                             int *indices_ptr,
+                             float top_p,
+                             int length,
+                             int batch_size,
+                             ffStream_t stream);
+  static void forward_kernel_wrapper(SamplingMeta const *m,
+                                     GenericTensorAccessorW const &input,
+                                     GenericTensorAccessorW const &indices,
+                                     int batch_size);
+  Params get_params() const;
+
+public:
+  float top_p;
+};
+
+}; // namespace FlexFlow
+
+#endif
\ No newline at end of file
diff --git a/include/flexflow/ops/sampling_params.h b/include/flexflow/ops/sampling_params.h
new file mode 100644
index 0000000000..1449ddbf54
--- /dev/null
+++ b/include/flexflow/ops/sampling_params.h
@@ -0,0 +1,24 @@
+#ifndef _FLEXFLOW_SAMPLING_PARAMS_H
+#define _FLEXFLOW_SAMPLING_PARAMS_H
+
+#include "flexflow/ffconst.h"
+#include "flexflow/parallel_tensor.h"
+
+namespace FlexFlow {
+
+struct SamplingParams {
+  float top_p;
+  bool is_valid(ParallelTensorShape const &) const;
+};
+bool operator==(SamplingParams const &, SamplingParams const &);
+
+} // namespace FlexFlow
+
+namespace std {
+template <>
+struct hash<FlexFlow::SamplingParams> {
+  size_t operator()(FlexFlow::SamplingParams const &) const;
+};
+} // namespace std
+
+#endif // _FLEXFLOW_SAMPLING_PARAMS_H
\ No newline at end of file
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index 68a8e10042..17fc58c53a 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -38,6 +38,9 @@ void parse_input_args(char **argv,
                       ModelType &llm_model_type,
                       bool &use_full_precision,
                       bool &verbose,
+                      bool &do_sample,
+                      float &temperature,
+                      float &topp,
                       int &data_parallelism_degree,
                       int &tensor_parallelism_degree,
                       int &pipeline_parallelism_degree) {
@@ -109,6 +112,18 @@ void parse_input_args(char **argv,
       verbose = true;
       continue;
     }
+    if (!strcmp(argv[i], "--do-sample")) {
+      do_sample = true;
+      continue;
+    }
+    if (!strcmp(argv[i], "--temperature")) {
+      temperature = std::stof(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--topp")) {
+      topp = std::stof(argv[++i]);
+      continue;
+    }
   }
 }
 
@@ -124,6 +139,9 @@ void FlexFlow::top_level_task(Task const *task,
   ModelType model_type;
   bool use_full_precision = false;
   bool verbose = false;
+  bool do_sample = false;
+  float temperature = 0.0f;
+  float topp = 0.0f;
   size_t num_devices = ffconfig.workersPerNode * ffconfig.numNodes;
   int data_parallelism_degree = 1, tensor_parallelism_degree = 1,
       pipeline_parallelism_degree = 1;
@@ -137,12 +155,16 @@ void FlexFlow::top_level_task(Task const *task,
                    model_type,
                    use_full_precision,
                    verbose,
+                   do_sample,
+                   temperature,
+                   topp,
                    data_parallelism_degree,
                    tensor_parallelism_degree,
                    pipeline_parallelism_degree);
   ffconfig.data_parallelism_degree = data_parallelism_degree;
   ffconfig.tensor_parallelism_degree = tensor_parallelism_degree;
   ffconfig.pipeline_parallelism_degree = pipeline_parallelism_degree;
+
   assert(data_parallelism_degree * tensor_parallelism_degree *
              pipeline_parallelism_degree ==
          ffconfig.numNodes * ffconfig.workersPerNode);
@@ -150,6 +172,7 @@ void FlexFlow::top_level_task(Task const *task,
   assert(model_type != ModelType::UNKNOWN &&
          "Invalid LLM model type passed (or no type was passed).");
 
+  SamplingConfig samplingConfig(do_sample, temperature, topp);
   InferenceManager im(ffconfig, BatchConfig::MAX_NUM_TOKENS);
   RequestManager rm(model_type,
                     file_paths.tokenizer_file_path,
@@ -163,6 +186,7 @@ void FlexFlow::top_level_task(Task const *task,
                               file_paths.llm_config_file_path,
                               file_paths.llm_weight_file_path,
                               INC_DECODING_MODE,
+                              samplingConfig,
                               use_full_precision);
   } else if (model_type == ModelType::OPT) {
     OPT::create_opt_model(model,
@@ -211,6 +235,7 @@ void FlexFlow::top_level_task(Task const *task,
     assert(fm.get_future_map_domain().get_volume() == 1);
     Future future = fm.get_future(0);
     ir = future.get_result<InferenceResult>();
+    // assert(false);
   }
 
   // Execution fence
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index e54ec13147..06dfaebcb1 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -24,6 +24,7 @@ void LLAMA::create_llama_model(FFModel &ff,
                                std::string const &model_config_file_path,
                                std::string const &weight_file_path,
                                InferenceMode mode,
+                               SamplingConfig samplingConfig,
                                bool use_full_precision) {
   // do not apply cpu offload in beam search model.
   Config llama_config(model_config_file_path);
@@ -210,7 +211,14 @@ void LLAMA::create_llama_model(FFModel &ff,
     Tensor softmax = ff.softmax(dense, -1);
     output = ff.beam_top_k(softmax, llama_config.max_beam_width, false);
   } else {
-    output = ff.arg_top_k(dense, /*k=*/1, false);
+    // Tensor softmax = ff.softmax(dense, -1);
+    if (samplingConfig.do_sample) {
+      dense = ff.scalar_truediv(dense, samplingConfig.temperature, false);
+      Tensor softmax = ff.softmax(dense, -1);
+      output = ff.sampling(softmax, samplingConfig.topp);
+    } else {
+      output = ff.arg_top_k(dense, /*k=*/1, false);
+    }
   }
 
   // Compile the model
diff --git a/inference/models/llama.h b/inference/models/llama.h
index ab9bd4c7f3..6f80194d72 100644
--- a/inference/models/llama.h
+++ b/inference/models/llama.h
@@ -107,6 +107,7 @@ class LLAMA {
                                  std::string const &model_config_file_path,
                                  std::string const &weight_file_path,
                                  InferenceMode mode,
+                                 SamplingConfig samplingConfig,
                                  bool use_full_precision = false);
 };
 
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 9cdcb454a2..a4c3dc64f9 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -199,6 +199,7 @@ void FlexFlow::top_level_task(Task const *task,
   }
 
   // Create SentencePiece tokenizer or OPT tokenizer
+  SamplingConfig samplingConfig;
   InferenceManager im(ffconfig, BatchConfig::MAX_NUM_TOKENS);
   RequestManager rm(model_types.llm_model_type,
                     file_paths.tokenizer_file_path,
@@ -213,6 +214,7 @@ void FlexFlow::top_level_task(Task const *task,
                               file_paths.llm_config_file_path,
                               file_paths.llm_weight_file_path,
                               TREE_VERIFY_MODE,
+                              samplingConfig,
                               use_full_precision);
   } else if (model_types.llm_model_type == ModelType::OPT) {
     OPT::create_opt_model(tree_model,
@@ -245,6 +247,7 @@ void FlexFlow::top_level_task(Task const *task,
                                 file_paths.ssm_config_file_paths[ssm_id],
                                 file_paths.ssm_weight_file_paths[ssm_id],
                                 BEAM_SEARCH_MODE,
+                                samplingConfig,
                                 use_full_precision);
     } else if (model_types.ssm_model_types[ssm_id] == ModelType::OPT) {
       OPT::create_opt_model(beam_model,
diff --git a/src/ops/fused.cu b/src/ops/fused.cu
index 2f84100554..ef6c856871 100644
--- a/src/ops/fused.cu
+++ b/src/ops/fused.cu
@@ -748,7 +748,8 @@ __host__ void
       case OP_RELU:
       case OP_SIGMOID:
       case OP_TANH:
-      case OP_ELU: {
+      case OP_ELU:
+      case OP_SCALAR_TRUE_DIV: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_weights[op] == 0);
         assert(fused->op_num_outputs[op] == 1);
diff --git a/src/ops/sampling.cc b/src/ops/sampling.cc
new file mode 100644
index 0000000000..8c01464042
--- /dev/null
+++ b/src/ops/sampling.cc
@@ -0,0 +1,343 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/sampling.h"
+#include "flexflow/model.h"
+#include "flexflow/utils/hash_utils.h"
+#include "legion/legion_utilities.h"
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+#include "flexflow/utils/cuda_helper.h"
+#else
+#include "flexflow/utils/hip_helper.h"
+#endif
+
+namespace FlexFlow {
+// declare Legion names
+using Legion::ArgumentMap;
+using Legion::Context;
+using Legion::coord_t;
+using Legion::Domain;
+using Legion::FutureMap;
+using Legion::IndexLauncher;
+using Legion::InlineLauncher;
+using Legion::Machine;
+using Legion::Memory;
+using Legion::PhysicalRegion;
+using Legion::Predicate;
+using Legion::Rect;
+using Legion::RegionRequirement;
+using Legion::Runtime;
+using Legion::Task;
+using Legion::TaskArgument;
+using Legion::TaskLauncher;
+using PCG::Node;
+
+// For an input tensor, computes the top k entries in each row
+// (resp. vector along the last dimension). Thus,
+// values.shape = indices.shape = input.shape[:-1] + [k]
+Tensor FFModel::sampling(const Tensor input, float top_p, char const *name) {
+  Layer *li = new Layer(this,
+                        OP_SAMPLING,
+                        input->data_type,
+                        name,
+                        1 /*inputs*/,
+                        0 /*weights*/,
+                        1 /*outputs*/,
+                        input);
+  {
+    int numdims = input->num_dims;
+    int dims[MAX_TENSOR_DIM];
+    for (int i = 0; i < numdims; i++) {
+      dims[i] = input->dims[i];
+    }
+    // now just support 1 output
+    dims[0] = 1;
+    // li->outputs[0] = create_tensor_legion_ordering(
+    //     numdims, dims, input->data_type, li, 0, true /*create_grad*/);
+    li->outputs[0] = create_tensor_legion_ordering(
+        numdims, dims, DT_INT32, li, 0, false /*create_grad*/);
+  }
+  layers.push_back(li);
+  li->add_float_property("top_p", top_p);
+  // outputs[0] = li->outputs[0];
+  // outputs[1] = li->outputs[1];
+  return li->outputs[0];
+}
+
+Op *Sampling::create_operator_from_layer(
+    FFModel &model,
+    Layer const *layer,
+    std::vector<ParallelTensor> const &inputs) {
+  float top_p;
+  layer->get_float_property("top_p", top_p);
+  return new Sampling(model, inputs[0], top_p, layer->name);
+}
+
+SamplingParams Sampling::get_params() const {
+  SamplingParams params;
+  params.top_p = this->top_p;
+  return params;
+}
+
+bool SamplingParams::is_valid(ParallelTensorShape const &) const {
+  return true;
+}
+
+bool operator==(SamplingParams const &lhs, SamplingParams const &rhs) {
+  return lhs.top_p == rhs.top_p;
+}
+
+Sampling::Sampling(FFModel &model,
+                   const ParallelTensor _input,
+                   float _top_p,
+                   char const *name)
+    : Op(model,
+         OP_SAMPLING,
+         _input->data_type,
+         name,
+         1 /*inputs*/,
+         0 /*weights*/,
+         1 /*outputs*/,
+         _input),
+      top_p(_top_p) {
+  int numdim = inputs[0]->num_dims;
+  ParallelDim dims[MAX_TENSOR_DIM];
+  for (int i = 0; i < numdim; i++) {
+    dims[i] = inputs[0]->dims[i];
+  }
+  dims[0].size = 1;
+  std::cout << "degree: " << inputs[0]->dims[0].degree << "\n";
+  assert(inputs[0]->dims[0].degree == 1);
+  assert(inputs[0]->dims[0].parallel_idx == -1);
+  //   outputs[0] = model.create_parallel_tensor_legion_ordering(
+  //       numdim, dims, _input->data_type, this, 0 /*owner_idx*/);
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      numdim, dims, DT_INT32, this, 0 /*owner_idx*/);
+}
+
+Sampling::Sampling(FFModel &model,
+                   Sampling const &other,
+                   const ParallelTensor input)
+    : Sampling(model, input, other.top_p, other.name) {}
+
+Sampling::Sampling(FFModel &model,
+                   SamplingParams const &params,
+                   const ParallelTensor input,
+                   char const *name)
+    : Sampling(model, input, params.top_p, name) {}
+
+void Sampling::init_inference(FFModel const &ff,
+                              std::vector<ParallelTensor> const &batch_inputs,
+                              std::vector<ParallelTensor> const &batch_outputs,
+                              MachineView const *mv) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher launcher(SAMPLING_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(Sampling)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
+}
+
+void Sampling::init(FFModel const &ff) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(SAMPLING_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(Sampling)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
+OpMeta *Sampling::init_task(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
+  Sampling *s = (Sampling *)task->args;
+  FFHandler handle = *((FFHandler *)task->local_args);
+  GenericTensorAccessorW acc_input =
+      helperGetGenericTensorAccessorRW(s->inputs[0]->data_type,
+                                       regions[0],
+                                       task->regions[0],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+
+  int length = acc_input.domain.hi()[0] - acc_input.domain.lo()[0] + 1;
+  int batch_size = acc_input.domain.get_volume() / length;
+
+  SamplingMeta *m =
+      new SamplingMeta(handle, s, batch_size, length * batch_size, acc_input);
+  m->profiling = s->profiling;
+  m->top_p = s->top_p;
+  return m;
+}
+
+void Sampling::forward(FFModel const &ff) {
+  // Sampling does not support forward
+  assert(false);
+}
+
+FutureMap Sampling::inference(FFModel const &ff,
+                              BatchConfig const &bc,
+                              std::vector<ParallelTensor> const &batch_inputs,
+                              std::vector<ParallelTensor> const &batch_outputs,
+                              MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+  /* std::cout << "Sampling op machine_view: " << *(MachineView const *)mv
+            << std::endl; */
+  IndexLauncher launcher(SAMPLING_INF_TASK_ID,
+                         parallel_is,
+                         TaskArgument(&bc, sizeof(BatchConfig)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+InferenceResult
+    Sampling::inference_task(Task const *task,
+                             std::vector<PhysicalRegion> const &regions,
+                             Context ctx,
+                             Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+  BatchConfig const *bc = (BatchConfig *)task->args;
+  SamplingMeta const *m = *((SamplingMeta **)task->local_args);
+
+  GenericTensorAccessorW input = helperGetGenericTensorAccessorRW(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW indices = helperGetGenericTensorAccessorWO(
+      DT_INT32, regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  int batch_size = bc->num_active_tokens();
+  Sampling::forward_kernel_wrapper(m, input, indices, batch_size);
+
+  InferenceResult ir;
+  download_tensor<BatchConfig::TokenId>(
+      indices.get_int32_ptr(), ir.token_ids, batch_size);
+  return ir;
+}
+
+void Sampling::backward(FFModel const &ff) {
+  // Sampling does not support backward
+  assert(false);
+}
+
+void Sampling::serialize(Legion::Serializer &sez) const {
+  sez.serialize(this->top_p);
+}
+
+Node Sampling::deserialize(FFModel &ff,
+                           Legion::Deserializer &dez,
+                           ParallelTensor inputs[],
+                           int num_inputs) {
+  assert(num_inputs == 1);
+  float top_p;
+  dez.deserialize(top_p);
+  SamplingParams params;
+  params.top_p = top_p;
+  return ff.get_or_create_node<Sampling>(inputs[0], params);
+}
+
+Op *Sampling::materialize(FFModel &ff,
+                          ParallelTensor inputs[],
+                          int num_inputs) const {
+  SamplingParams params = get_params();
+  return new Sampling(ff, params, inputs[0], this->name);
+}
+
+bool Sampling::measure_operator_cost(Simulator *sim,
+                                     MachineView const &mv,
+                                     CostMetrics &cost_metrics) const {
+  return false;
+}
+
+}; // namespace FlexFlow
+
+namespace std {
+size_t hash<FlexFlow::SamplingParams>::operator()(
+    FlexFlow::SamplingParams const &params) const {
+  size_t key = 0;
+  hash_combine(key, params.top_p);
+  return key;
+}
+}; // namespace std
\ No newline at end of file
diff --git a/src/ops/sampling.cpp b/src/ops/sampling.cpp
new file mode 100644
index 0000000000..4901fe400c
--- /dev/null
+++ b/src/ops/sampling.cpp
@@ -0,0 +1,67 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/sampling.h"
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/utils/hip_helper.h"
+#include <hip/hip_runtime.h>
+
+namespace FlexFlow {
+
+/*static*/
+template <typename DT>
+void Sampling::forward_kernel(SamplingMeta const *m,
+                              DT *input_ptr,
+                              int *indices_ptr,
+                              float const top_p,
+                              int const length,
+                              int const batch_size,
+                              hipStream_t stream) {}
+
+/*static*/
+void Sampling::forward_kernel_wrapper(SamplingMeta const *m,
+                                      GenericTensorAccessorW const &input,
+                                      GenericTensorAccessorW const &indices,
+                                      int batch_size) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    hipEventCreate(&t_start);
+    hipEventCreate(&t_end);
+    hipEventRecord(t_start, stream);
+  }
+
+  handle_unimplemented_hip_kernel(OP_RMS_NORM);
+
+  if (m->profiling) {
+    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    hipEventDestroy(t_start);
+    hipEventDestroy(t_end);
+  }
+}
+
+SamplingMeta::SamplingMeta(FFHandler handler,
+                           Op const *op,
+                           int batch_size,
+                           int total_ele,
+                           GenericTensorAccessorW input)
+    : OpMeta(handler, op) {}
+
+}; // namespace FlexFlow
\ No newline at end of file
diff --git a/src/ops/sampling.cu b/src/ops/sampling.cu
new file mode 100644
index 0000000000..a91263a621
--- /dev/null
+++ b/src/ops/sampling.cu
@@ -0,0 +1,267 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "cub/cub.cuh"
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/ops/sampling.h"
+#include "flexflow/utils/cuda_helper.h"
+#include <curand.h>
+#include <curand_kernel.h>
+
+namespace FlexFlow {
+
+constexpr int SamplingNumThreads = 1024;
+struct BlockPrefixCallbackOp {
+  // Running prefix
+  float running_total;
+  // Constructor
+  __device__ BlockPrefixCallbackOp(float running_total)
+      : running_total(running_total) {}
+  // Callback operator to be entered by the first warp of threads in the block.
+  // Thread-0 is responsible for returning a value for seeding the block-wide
+  // scan.
+  __device__ float operator()(float block_aggregate) {
+    float old_prefix = running_total;
+    running_total += block_aggregate;
+    return old_prefix;
+  }
+};
+
+__global__ void init_idxs(int batch_size,
+                          int vocab_size,
+                          int total_eles,
+                          int *idx,
+                          int *begin_offset,
+                          int *end_offset) {
+  CUDA_KERNEL_LOOP(i, total_eles) {
+    idx[i] = i % vocab_size;
+    if (i % vocab_size == 0) {
+      begin_offset[i / vocab_size] = i;
+      end_offset[i / vocab_size] = i;
+    }
+  }
+}
+
+__global__ void
+    init_random_kernel(curandState *state, int batch_size, long rand) {
+  CUDA_KERNEL_LOOP(i, batch_size) {
+    curand_init(rand, i, 0, &state[i]);
+  }
+}
+
+// multinominal and gather
+template <typename DT, int BLOCK_SIZE>
+__global__ void sampling_topp_kernel(int batch_size,
+                                     int const vocab_size,
+                                     curandState *state,
+                                     DT *sorted_logits,
+                                     int *sorted_idx,
+                                     int *indices_ptr,
+                                     float topp) {
+  // int const vocab_id = threadIdx.x;
+  int const batch_idx = blockIdx.x;
+  __shared__ float random_n;
+  __shared__ long long result_idx;
+
+  // random num
+  if (threadIdx.x == 0) {
+    // number must < topp
+    random_n = curand_uniform(state + batch_idx) * topp;
+    // printf("batch idx: %d, random num%f\n", batch_idx, random_n);
+  }
+
+  __syncthreads();
+
+  // cumsum;
+  typedef cub::BlockScan<float, BLOCK_SIZE> BlockScan;
+  __shared__ typename BlockScan::TempStorage temp_storage;
+
+  int offset = batch_idx * vocab_size;
+  float prefix_sum = 0.0f;
+  BlockPrefixCallbackOp prefix_op(0);
+  result_idx = vocab_size - 1;
+
+  for (long long j = threadIdx.x; j < vocab_size; j += blockDim.x) {
+    float logit = (float)(sorted_logits[offset + j]);
+    BlockScan(temp_storage).InclusiveSum(logit, prefix_sum, prefix_op);
+    prefix_sum /= topp;
+    if (prefix_sum >= random_n) {
+      atomicMin(&result_idx, j);
+    }
+  }
+  indices_ptr[batch_idx] = sorted_idx[offset + result_idx];
+
+  // if (threadIdx.x == 0) {
+  //   printf("selected idx: %d, %d\n", blockIdx.x, result_idx);
+  // }
+}
+
+/*static*/
+template <typename DT>
+void Sampling::forward_kernel(SamplingMeta const *m,
+                              DT *input_ptr,
+                              int *indices_ptr,
+                              float const top_p,
+                              int const length,
+                              int const batch_size,
+                              cudaStream_t stream) {
+  // 1. sort
+  size_t temp_storage_bytes = m->temp_storage_bytes;
+  checkCUDA(cub::DeviceSegmentedRadixSort::SortPairsDescending(
+      m->d_temp_storage,
+      temp_storage_bytes,
+      input_ptr,
+      static_cast<DT *>(m->sorted_logits),
+      m->idx,
+      m->sorted_idx,
+      length * batch_size,
+      batch_size,
+      m->begin_offset,
+      m->end_offset + 1,
+      0,              // begin_bit
+      sizeof(DT) * 8, // end_bit = sizeof(KeyT) * 8
+      stream));
+  int parallelism = batch_size;
+  init_random_kernel<<<GET_BLOCKS(parallelism),
+                       min(CUDA_NUM_THREADS, parallelism),
+                       0,
+                       stream>>>(m->state, batch_size, rand());
+  // sampling
+  sampling_topp_kernel<DT, SamplingNumThreads>
+      <<<batch_size, SamplingNumThreads, 0, stream>>>(
+          batch_size,
+          length,
+          m->state,
+          static_cast<DT *>(m->sorted_logits),
+          m->sorted_idx,
+          indices_ptr,
+          top_p);
+}
+
+/*static*/
+void Sampling::forward_kernel_wrapper(SamplingMeta const *m,
+                                      GenericTensorAccessorW const &input,
+                                      GenericTensorAccessorW const &indices,
+                                      int batch_size) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+  int length = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+
+  if (input.data_type == DT_HALF) {
+    Sampling::forward_kernel<half>(m,
+                                   input.get_half_ptr(),
+                                   indices.get_int32_ptr(),
+                                   m->top_p,
+                                   length,
+                                   batch_size,
+                                   stream);
+  } else if (input.data_type == DT_FLOAT) {
+    Sampling::forward_kernel<float>(m,
+                                    input.get_float_ptr(),
+                                    indices.get_int32_ptr(),
+                                    m->top_p,
+                                    length,
+                                    batch_size,
+                                    stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[Sampling] forward time = %.2lfms\n", elapsed);
+  }
+}
+
+SamplingMeta::SamplingMeta(FFHandler handler,
+                           Op const *op,
+                           int batch_size,
+                           int total_ele,
+                           GenericTensorAccessorW input)
+    : OpMeta(handler, op) {
+  DataType data_type = op->data_type;
+  checkCUDA(cudaMalloc(&begin_offset, (batch_size + 1) * sizeof(int)));
+  checkCUDA(cudaMalloc(&end_offset, (batch_size + 1) * sizeof(int)));
+  checkCUDA(cudaMalloc(&idx, total_ele * sizeof(int)));
+
+  checkCUDA(cudaMalloc(&sorted_idx, total_ele * sizeof(int)));
+  checkCUDA(cudaMalloc(&sorted_logits, total_ele * data_type_size(data_type)));
+  cudaMalloc(&state, sizeof(curandState) * batch_size);
+
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  // init offset
+  int parallelism = total_ele;
+  init_idxs<<<GET_BLOCKS(parallelism),
+              min(CUDA_NUM_THREADS, parallelism),
+              0,
+              stream>>>(batch_size,
+                        total_ele / batch_size,
+                        total_ele,
+                        idx,
+                        begin_offset,
+                        end_offset);
+
+  // init sort function
+  if (data_type == DT_FLOAT) {
+    checkCUDA(cub::DeviceSegmentedRadixSort::SortPairsDescending(
+        d_temp_storage,
+        temp_storage_bytes,
+        input.get_float_ptr(),
+        input.get_float_ptr(),
+        idx,
+        idx,
+        total_ele,
+        batch_size,
+        begin_offset,
+        end_offset + 1,
+        0,                             // begin_bit
+        data_type_size(data_type) * 8, // end_bit = sizeof(KeyT) * 8
+        stream));
+  } else if (data_type == DT_HALF) {
+    checkCUDA(cub::DeviceSegmentedRadixSort::SortPairsDescending(
+        d_temp_storage,
+        temp_storage_bytes,
+        input.get_half_ptr(),
+        input.get_half_ptr(),
+        idx,
+        idx,
+        total_ele,
+        batch_size,
+        begin_offset,
+        end_offset + 1,
+        0,                             // begin_bit
+        data_type_size(data_type) * 8, // end_bit = sizeof(KeyT) * 8
+        stream));
+  } else {
+    assert(false && "input type in float and half");
+  }
+  checkCUDA(cudaMalloc(&d_temp_storage, temp_storage_bytes));
+}
+
+}; // namespace FlexFlow
\ No newline at end of file
diff --git a/src/runtime/ffconst_utils.cc b/src/runtime/ffconst_utils.cc
index 39f9d1dd0d..a777605daf 100644
--- a/src/runtime/ffconst_utils.cc
+++ b/src/runtime/ffconst_utils.cc
@@ -178,6 +178,8 @@ std::string get_operator_type_name(OperatorType type) {
       return "GELU";
     case OP_IDENTITY:
       return "Identity";
+    case OP_SAMPLING:
+      return "Sampling";
     // Parallel Ops
     case OP_REPARTITION:
       return "Repartition";
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index 5c0513baa8..16bccc25df 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -40,6 +40,7 @@
 #include "flexflow/ops/reduce.h"
 #include "flexflow/ops/reshape.h"
 #include "flexflow/ops/rms_norm.h"
+#include "flexflow/ops/sampling.h"
 #include "flexflow/ops/softmax.h"
 #include "flexflow/ops/spec_inc_multihead_self_attention.h"
 #include "flexflow/ops/split.h"
@@ -2919,6 +2920,10 @@ void FFModel::deserialize_graph_optimal_view(
         node = BeamTopK::deserialize(*this, dez, inputs, num_inputs);
         break;
       }
+      case OP_SAMPLING: {
+        node = Sampling::deserialize(*this, dez, inputs, num_inputs);
+        break;
+      }
       case OP_GROUP_BY: {
         node = Group_by::deserialize(*this, dez, inputs, num_inputs);
         break;
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 5179178cd9..22515a2bb0 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -52,6 +52,7 @@
 #include "flexflow/ops/reshape.h"
 #include "flexflow/ops/reverse.h"
 #include "flexflow/ops/rms_norm.h"
+#include "flexflow/ops/sampling.h"
 #include "flexflow/ops/softmax.h"
 #include "flexflow/ops/spec_inc_multihead_self_attention.h"
 #include "flexflow/ops/split.h"
@@ -2937,6 +2938,11 @@ Op *FFModel::create_operator_from_layer(
       operators.push_back(op);
       return op;
     }
+    case OP_SAMPLING: {
+      Op *op = Sampling::create_operator_from_layer(*this, layer, inputs);
+      operators.push_back(op);
+      return op;
+    }
     case OP_GROUP_BY: {
       Op *op = Group_by::create_operator_from_layer(*this, layer, inputs);
       operators.push_back(op);
@@ -2977,7 +2983,8 @@ void FFModel::create_operators_from_layers() {
     Op *op = nullptr;
     // add a combine before arg_topk
     if (config.computationMode == COMP_MODE_INFERENCE &&
-        config.tensor_parallelism_degree > 1 && l->op_type == OP_ARG_TOPK) {
+        config.tensor_parallelism_degree > 1 &&
+        (l->op_type == OP_ARG_TOPK || l->op_type == OP_SOFTMAX)) {
       std::vector<ParallelTensor> partitioned_inputs;
       assert(inputs.size() == 1);
       Combine *comb = new Combine(*this,
@@ -5406,6 +5413,37 @@ void register_flexflow_internal_tasks(Runtime *runtime,
                                      BeamTopK::inference_task>(registrar);
     }
   }
+  // Sampling task
+  {
+    TaskVariantRegistrar registrar(SAMPLING_INIT_TASK_ID, "Sampling Init");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<OpMeta *, Sampling::init_task>(
+          registrar, "Sampling Init Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<OpMeta *, Sampling::init_task>(registrar);
+    }
+  }
+  {
+    TaskVariantRegistrar registrar(SAMPLING_INF_TASK_ID, "Sampling Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<InferenceResult,
+                                        Sampling::inference_task>(
+          registrar, "Sampling Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<InferenceResult, Sampling::inference_task>(
+          registrar);
+    }
+  }
   // Transpose task
   {
     TaskVariantRegistrar registrar(TRANSPOSE_INIT_TASK_ID, "Transpose Init");
diff --git a/src/runtime/operator_params.cc b/src/runtime/operator_params.cc
index 6b61d5ac7a..8fb8c89b10 100644
--- a/src/runtime/operator_params.cc
+++ b/src/runtime/operator_params.cc
@@ -28,6 +28,7 @@
 #include "flexflow/ops/reshape.h"
 #include "flexflow/ops/reverse.h"
 #include "flexflow/ops/rms_norm.h"
+#include "flexflow/ops/sampling.h"
 #include "flexflow/ops/softmax.h"
 #include "flexflow/ops/spec_inc_multihead_self_attention.h"
 #include "flexflow/ops/split.h"
@@ -130,6 +131,8 @@ tl::optional<OperatorParameters> get_op_parameters(Op const *op) {
       return ((ArgTopK *)op)->get_params();
     case OP_BEAM_TOPK:
       return ((BeamTopK *)op)->get_params();
+    case OP_SAMPLING:
+      return ((Sampling *)op)->get_params();
 
       // TODO: implement the get_params() function for the operators below and
       // uncomment the lines below

From 3e23dd8444af7ff24120a0cdc2e95a4afec592d5 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 19 Jul 2023 16:07:26 -0400
Subject: [PATCH 176/344] fix

---
 .github/workflows/docker-build.yml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/.github/workflows/docker-build.yml b/.github/workflows/docker-build.yml
index 280539eb5f..d059a0605f 100644
--- a/.github/workflows/docker-build.yml
+++ b/.github/workflows/docker-build.yml
@@ -44,7 +44,7 @@ jobs:
     env:
       FF_GPU_BACKEND: ${{ matrix.gpu_backend }}
       cuda_version: ${{ matrix.cuda_version }}
-      branch_name: ${GITHUB_REF#refs/heads/}
+      branch_name: ${{ github.head_ref || github.ref_name }}
     steps:
       - name: Checkout Git Repository
         uses: actions/checkout@v3

From 02d4b2058dd145e10427ce5edb931149f1e43833 Mon Sep 17 00:00:00 2001
From: DerrickYLJ <99985904+DerrickYLJ@users.noreply.github.com>
Date: Fri, 21 Jul 2023 00:17:21 -0400
Subject: [PATCH 177/344] update new models weights (#837)

* update new models weights

* update public model

---------

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 inference/utils/download_llama_weights.py | 19 +++++++++++++++++++
 1 file changed, 19 insertions(+)

diff --git a/inference/utils/download_llama_weights.py b/inference/utils/download_llama_weights.py
index 1cd6928080..0cf4453aa0 100644
--- a/inference/utils/download_llama_weights.py
+++ b/inference/utils/download_llama_weights.py
@@ -8,6 +8,9 @@
 # You can pass the --use-full-precision flag to use the full-precision weight. By default, we use half precision.
 parser = argparse.ArgumentParser()
 parser.add_argument("--use-full-precision", action="store_true", help="Use full precision")
+parser.add_argument("--use_13B", action="store_true", help="Use full precision")
+parser.add_argument("--use_30B", action="store_true", help="Use full precision")
+parser.add_argument("--use_65B", action="store_true", help="Use full precision")
 args = parser.parse_args()
 if not args.use_full_precision:
     import torch
@@ -45,6 +48,22 @@ def convert_hf_model(model, dst_folder):
 dst_folder="../weights/llama_7B_weights" if args.use_full_precision else "../weights/llama_7B_weights_half"
 convert_hf_model(model, dst_folder)
 
+# Download and convert model weights only for hf
+if args.use_13B:
+    model = AutoModelForCausalLM.from_pretrained("decapoda-research/llama-13b-hf")
+    dst_folder="../weights/llama_13B_weights_half"
+    convert_hf_model(model, dst_folder)
+
+if args.use_30B:
+    model = AutoModelForCausalLM.from_pretrained("decapoda-research/llama-30b-hf")
+    dst_folder="../weights/llama_30B_weights_half"
+    convert_hf_model(model, dst_folder)
+
+if args.use_65B:
+    model = AutoModelForCausalLM.from_pretrained("decapoda-research/llama-65b-hf")
+    dst_folder="../weights/llama_65B_weights_half"
+    convert_hf_model(model, dst_folder)
+
 # Download and convert small model weights
 model = AutoModelForCausalLM.from_pretrained("JackFram/llama-160m")
 dst_folder="../weights/llama_160M_weights" if args.use_full_precision else "../weights/llama_160M_weights_half"

From 8caa8032a3dfef2b7b9d277d7fa192fe3fa52c96 Mon Sep 17 00:00:00 2001
From: DerrickYLJ <99985904+DerrickYLJ@users.noreply.github.com>
Date: Fri, 21 Jul 2023 10:52:44 -0400
Subject: [PATCH 178/344] Model weight flag explanation (#880)

* update new models weights

* update public model

* update optional flag

* add flag explanation

---------

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
---
 inference/utils/download_llama_weights.py | 7 ++++---
 1 file changed, 4 insertions(+), 3 deletions(-)

diff --git a/inference/utils/download_llama_weights.py b/inference/utils/download_llama_weights.py
index 0cf4453aa0..d2b11453e6 100644
--- a/inference/utils/download_llama_weights.py
+++ b/inference/utils/download_llama_weights.py
@@ -6,11 +6,12 @@
 from transformers import AutoModelForCausalLM
 
 # You can pass the --use-full-precision flag to use the full-precision weight. By default, we use half precision.
+# and pass "--use_13B", "--use_30B", and "--use_65B" to use the corresponding "llama-13B/30B/65B" model weights
 parser = argparse.ArgumentParser()
 parser.add_argument("--use-full-precision", action="store_true", help="Use full precision")
-parser.add_argument("--use_13B", action="store_true", help="Use full precision")
-parser.add_argument("--use_30B", action="store_true", help="Use full precision")
-parser.add_argument("--use_65B", action="store_true", help="Use full precision")
+parser.add_argument("--use_13B", action="store_true", help="choose to use llama-13B")
+parser.add_argument("--use_30B", action="store_true", help="choose to use llama-30B")
+parser.add_argument("--use_65B", action="store_true", help="choose to use llama-65B")
 args = parser.parse_args()
 if not args.use_full_precision:
     import torch

From 2ba481b2aec29dcc9fa34eb140cb41a3651443c2 Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Fri, 21 Jul 2023 10:53:53 -0400
Subject: [PATCH 179/344] Inference: fix batch_size issue. (#863)

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
---
 include/flexflow/batch_config.h | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 61a1e345ae..e3ce1c5b95 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -44,7 +44,7 @@ class BatchConfig {
   int num_active_tokens() const;
   void print() const;
   virtual InferenceMode get_mode() const;
-  static int const MAX_NUM_REQUESTS = 1;
+  static int const MAX_NUM_REQUESTS = 16;
   static int const MAX_NUM_TOKENS = 64;
   static int const MAX_SEQ_LENGTH = 256;
 

From d047aa6d6d84d4fa217c9c67cc218c3d800d0cac Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sat, 22 Jul 2023 17:49:02 -0400
Subject: [PATCH 180/344] Python interface for inference (part 1) (#878)

* first commit

* add flexflow inference stub

* some updates

* fix

* add stubs for models

* fix

* add batch config support in cffi

* checkpoint

* updates

* finished stub of llama model

* cleanup c++ models

* moved inference loop into inference manager, begin surfacing to python

* checkpoint

* checkpoint

* linting
---
 include/flexflow/flexflow_c.h            | 137 +++++++++-
 include/flexflow/inference.h             |   8 +
 include/flexflow/model.h                 |   2 +-
 inference/flexflow_inference.py          |  43 +++
 inference/incr_decoding/incr_decoding.cc |  14 +-
 inference/models/llama.cc                |  35 +--
 inference/models/opt.cc                  |  18 --
 inference/spec_infer/spec_infer.cc       |  60 +----
 python/flexflow/core/flexflow_cffi.py    | 322 ++++++++++++++++++++++-
 python/flexflow/serve/__init__.py        |  15 ++
 python/flexflow/serve/models/__init__.py |  17 ++
 python/flexflow/serve/models/falcon.py   |  19 ++
 python/flexflow/serve/models/llama.py    | 130 +++++++++
 python/flexflow/serve/models/opt.py      |  19 ++
 python/flexflow/serve/serve.py           |  85 ++++++
 python/flexflow/type.py                  |  13 +
 src/c/flexflow_c.cc                      | 290 +++++++++++++++++++-
 src/ops/element_binary.cc                |  14 +-
 src/runtime/inference_manager.cc         |  84 ++++++
 19 files changed, 1181 insertions(+), 144 deletions(-)
 create mode 100644 inference/flexflow_inference.py
 create mode 100644 python/flexflow/serve/__init__.py
 create mode 100644 python/flexflow/serve/models/__init__.py
 create mode 100644 python/flexflow/serve/models/falcon.py
 create mode 100644 python/flexflow/serve/models/llama.py
 create mode 100644 python/flexflow/serve/models/opt.py
 create mode 100644 python/flexflow/serve/serve.py

diff --git a/include/flexflow/flexflow_c.h b/include/flexflow/flexflow_c.h
index 93b0444cb9..f8f9b97aad 100644
--- a/include/flexflow/flexflow_c.h
+++ b/include/flexflow/flexflow_c.h
@@ -47,6 +47,12 @@ FF_NEW_OPAQUE_TYPE(flexflow_dlrm_config_t);
 FF_NEW_OPAQUE_TYPE(flexflow_dataloader_4d_t);
 FF_NEW_OPAQUE_TYPE(flexflow_dataloader_2d_t);
 FF_NEW_OPAQUE_TYPE(flexflow_single_dataloader_t);
+// Inference
+FF_NEW_OPAQUE_TYPE(flexflow_batch_config_t);
+FF_NEW_OPAQUE_TYPE(flexflow_tree_verify_batch_config_t);
+FF_NEW_OPAQUE_TYPE(flexflow_beam_search_batch_config_t);
+FF_NEW_OPAQUE_TYPE(flexflow_inference_manager_t);
+FF_NEW_OPAQUE_TYPE(flexflow_request_manager_t);
 
 // -----------------------------------------------------------------------
 // FFConfig
@@ -73,6 +79,7 @@ int flexflow_config_get_epochs(flexflow_config_t handle);
 bool flexflow_config_get_enable_control_replication(flexflow_config_t handle);
 
 int flexflow_config_get_python_data_loader_type(flexflow_config_t handle);
+
 // -----------------------------------------------------------------------
 // FFModel
 // -----------------------------------------------------------------------
@@ -197,9 +204,10 @@ flexflow_tensor_t
 flexflow_tensor_t
     flexflow_model_add_embedding(flexflow_model_t handle,
                                  const flexflow_tensor_t input,
-                                 int num_entires,
+                                 int num_entries,
                                  int out_dim,
                                  enum AggrMode aggr,
+                                 enum DataType dtype,
                                  flexflow_op_t shared_op,
                                  flexflow_initializer_t kernel_initializer,
                                  char const *name);
@@ -383,8 +391,62 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_attention(
     bool add_bias_kv,
     bool add_zero_attn,
     flexflow_initializer_t kernel_initializer_,
+    bool apply_rotary_embedding,
+    char const *name);
+
+flexflow_tensor_t flexflow_model_add_spec_inc_multihead_attention(
+    flexflow_model_t handle_,
+    const flexflow_tensor_t input_,
+    int embed_dim,
+    int num_heads,
+    int kdim,
+    int vdim,
+    float dropout,
+    bool bias,
+    bool add_bias_kv,
+    bool add_zero_attn,
+    flexflow_initializer_t kernel_initializer_,
+    bool apply_rotary_embedding,
+    char const *name);
+
+flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention_verify(
+    flexflow_model_t handle_,
+    const flexflow_tensor_t input_,
+    int embed_dim,
+    int num_heads,
+    int kdim,
+    int vdim,
+    float dropout,
+    bool bias,
+    bool add_bias_kv,
+    bool add_zero_attn,
+    flexflow_initializer_t kernel_initializer_,
+    bool apply_rotary_embedding,
     char const *name);
 
+flexflow_tensor_t flexflow_model_add_rms_norm(flexflow_model_t handle_,
+                                              const flexflow_tensor_t input_,
+                                              float eps,
+                                              int dim,
+                                              char const *name);
+
+flexflow_tensor_t flexflow_model_add_arg_top_k(flexflow_model_t handle_,
+                                               const flexflow_tensor_t input_,
+                                               int k,
+                                               bool sorted,
+                                               char const *name);
+
+flexflow_tensor_t flexflow_model_add_beam_top_k(flexflow_model_t handle_,
+                                                const flexflow_tensor_t input_,
+                                                int max_beam_size,
+                                                bool sorted,
+                                                char const *name);
+
+flexflow_tensor_t flexflow_model_add_sampling(flexflow_model_t handle_,
+                                              const flexflow_tensor_t input_,
+                                              float top_p,
+                                              char const *name);
+
 void flexflow_model_set_sgd_optimizer(flexflow_model_t handle,
                                       flexflow_sgd_optimizer_t optimizer);
 
@@ -404,6 +466,8 @@ flexflow_tensor_t flexflow_model_get_parameter_by_id(flexflow_model_t handle,
 flexflow_perf_metrics_t
     flexflow_model_get_perf_metrics(flexflow_model_t handle);
 
+void flexflow_model_set_transformer_layer_id(flexflow_model_t handle, int id);
+
 // -----------------------------------------------------------------------
 // Tensor
 // -----------------------------------------------------------------------
@@ -713,6 +777,77 @@ void flexflow_op_forward(flexflow_op_t handle, flexflow_model_t model);
 
 void flexflow_perform_registration(void);
 
+// -----------------------------------------------------------------------
+// BatchConfig
+// -----------------------------------------------------------------------
+
+flexflow_batch_config_t flexflow_batch_config_create(void);
+
+void flexflow_batch_config_destroy(flexflow_batch_config_t handle);
+
+// -----------------------------------------------------------------------
+// TreeVerifyBatchConfig
+// -----------------------------------------------------------------------
+
+flexflow_tree_verify_batch_config_t
+    flexflow_tree_verify_batch_config_create(void);
+
+void flexflow_tree_verify_batch_config_destroy(
+    flexflow_tree_verify_batch_config_t handle);
+
+// -----------------------------------------------------------------------
+// BeamSearchBatchConfig
+// -----------------------------------------------------------------------
+
+flexflow_beam_search_batch_config_t
+    flexflow_beam_search_batch_config_create(void);
+
+void flexflow_beam_search_batch_config_destroy(
+    flexflow_beam_search_batch_config_t handle);
+
+// -----------------------------------------------------------------------
+// RequestManager
+// -----------------------------------------------------------------------
+
+flexflow_request_manager_t flexflow_request_manager_create(void);
+
+void flexflow_request_manager_destroy(flexflow_request_manager_t handle);
+
+long unsigned int flexflow_request_manager_register_new_request(
+    flexflow_request_manager_t handle,
+    char const *prompt,
+    int max_sequence_length);
+
+// -----------------------------------------------------------------------
+// InferenceManager
+// -----------------------------------------------------------------------
+
+flexflow_inference_manager_t
+    flexflow_inference_manager_create(flexflow_config_t config_handle,
+                                      int max_num_tokens_per_batch);
+
+void flexflow_inference_manager_destroy(flexflow_inference_manager_t handle);
+
+void flexflow_inference_manager_compile_model_and_allocate_buffer(
+    flexflow_inference_manager_t handle, flexflow_model_t model_handle);
+
+void flexflow_inference_manager_init_operators_inference(
+    flexflow_inference_manager_t handle, flexflow_model_t model_handle);
+
+void flexflow_inference_manager_incr_decoding_loop(
+    flexflow_inference_manager_t handle,
+    flexflow_model_t model_handle,
+    flexflow_request_manager_t rm_handle,
+    int total_num_requests);
+
+void flexflow_inference_manager_spec_inference_loop(
+    flexflow_inference_manager_t handle,
+    flexflow_model_t model_handle,
+    flexflow_request_manager_t rm_handle,
+    int total_num_requests,
+    int num_ssms,
+    int *ssm_model_ids);
+
 #ifdef __cplusplus
 }
 #endif
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index 0c5274e15b..823bac9fd6 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -24,6 +24,7 @@ namespace FlexFlow {
 
 class FFModel;
 class BeamTree;
+class RequestManager;
 using tokenizers::Tokenizer;
 
 class InferenceManager {
@@ -36,6 +37,13 @@ class InferenceManager {
   void load_input_tokens_from_batch_config(BatchConfig const &bc,
                                            ParallelTensor const input);
   void load_positions(BatchConfig const &bc, ParallelTensor position_input);
+  void incr_decoding_loop(FFModel *model,
+                          RequestManager &rm,
+                          int total_num_requests);
+  void spec_inference_loop(FFModel *model,
+                           RequestManager &rm,
+                           int total_num_requests,
+                           std::vector<int> ssm_model_ids);
 
 public:
   FFConfig ff_config;
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 3a76209b98..a95c229a08 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -467,7 +467,7 @@ class FFModel {
                  char const *name = NULL);
   // Add an embedding layer
   Tensor embedding(const Tensor input,
-                   int num_entires,
+                   int num_entries,
                    int outDim,
                    AggrMode aggr,
                    DataType dtype = DT_FLOAT,
diff --git a/inference/flexflow_inference.py b/inference/flexflow_inference.py
new file mode 100644
index 0000000000..6caace0f2d
--- /dev/null
+++ b/inference/flexflow_inference.py
@@ -0,0 +1,43 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+from flexflow.serve import LLM, SamplingConfig
+from flexflow.core import *
+
+def get_prompts(json_filepath):
+   json_obj = None
+   return json_obj
+
+def top_level_task():
+    # Incremental decoding
+    llama = LLM("decapoda-research/llama-30b-hf", data_type = "half")
+    sampling_config = SamplingConfig(do_sample=False, temperature = 0.9, topp = 0.8, topk = 1)
+    llama.compile(InferenceMode.INC_DECODING_MODE, sampling_config, use_full_precision=False, max_batch_size = 1, max_seq_length = 256, max_tokens_per_batch=64, tensor_parallel_degree = 4, pipeline_parallel_degree = 2)
+    
+    prompts = llama.generate(prompts, sampling=sampling_config)
+    # result = llama.generate("What's the best xxx in yyy?", sampling = sampling_config)
+    # print(result)
+
+    # # Speculative inference
+    # llama = LLM("decapoda-research/llama-30b-hf", data_type = "half")
+    # ssm1 = LLM("Jackfram/llama-160m", data_type = "half")
+    # ssm2 = LLM("facebook/opt-125m", data_type = "half")
+    # sampling_config = SamplingConfig(temperature = 0.9, topp = 0.8, topk = 1)
+    # llama.serve(max_batch_size = 1, max_seq_length = 256, max_tokens_per_batch=64, tensor_parallel_degree = 4, pipeline_parallel_degree = 2, ssms = {ssm1, ssm2})
+    # result = llama.generate("What's the best xxx in yyy?", sampling = sampling_config)
+    # print(result)
+
+if __name__ == "__main__":
+  print("flexflow inference")
+  top_level_task()
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index 17fc58c53a..0059b30ae0 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -224,19 +224,7 @@ void FlexFlow::top_level_task(Task const *task,
     }
   }
 
-  BatchConfig bc;
-  InferenceResult ir;
-  while (rm.get_num_processed_requests() < total_num_requests) {
-    bc = rm.prepare_next_batch(bc, ir);
-    if (rm.get_num_processed_requests() >= total_num_requests) {
-      break;
-    }
-    FutureMap fm = im.inference(&model, 0, bc);
-    assert(fm.get_future_map_domain().get_volume() == 1);
-    Future future = fm.get_future(0);
-    ir = future.get_result<InferenceResult>();
-    // assert(false);
-  }
+  im.incr_decoding_loop(&model, rm, total_num_requests);
 
   // Execution fence
   {
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index 06dfaebcb1..588d6d264c 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -29,38 +29,6 @@ void LLAMA::create_llama_model(FFModel &ff,
   // do not apply cpu offload in beam search model.
   Config llama_config(model_config_file_path);
   llama_config.printConfig();
-  //---------------------- parallelization setup work ----------------------
-  int num_devices = ff.config.workersPerNode * ff.config.numNodes;
-  int num_transformer_layers = llama_config.n_layers;
-  assert(num_transformer_layers % ff.config.pipeline_parallelism_degree == 0);
-  int num_layers_per_pp_block =
-      num_transformer_layers / ff.config.pipeline_parallelism_degree;
-  int num_devices_per_data_parallelism_line =
-      num_devices / ff.config.data_parallelism_degree;
-
-  // std::cout << "dp: " << ff.config.data_parallelism_degree
-  //           << " tp: " << ff.config.tensor_parallelism_degree
-  //           << " pp: " << ff.config.pipeline_parallelism_degree << std::endl;
-  // std::cout << "num_devices: " << num_devices << std::endl;
-  // std::cout << "num_transformer_layers: " << num_transformer_layers
-  //           << std::endl;
-  // std::cout << "num_devices_per_data_parallelism_line: "
-  //           << num_devices_per_data_parallelism_line << std::endl;
-  // std::cout << "num layers: " << llama_config.n_layers << std::endl;
-
-  //------------------------------compute machine views ------------------
-  // single device
-  std::vector<MachineView> machine_views;
-  for (int i = 0; i < num_devices; i++) {
-    MachineView view;
-    view.device_type = MachineView::GPU;
-    view.ndims = 1;
-    view.dim[0] = 1;
-    view.stride[0] = 0;
-    view.start_device_id = i;
-    machine_views.push_back(view);
-  }
-  assert(machine_views.size() == num_devices);
 
   std::unordered_map<std::string, Layer *> weights_layers;
 
@@ -96,11 +64,10 @@ void LLAMA::create_llama_model(FFModel &ff,
   Layer *embedding = ff.layers.back();
   weights_layers.emplace("tok_embeddings_weight", embedding);
 
-  for (int i = 0; i < num_transformer_layers; i++) {
+  for (int i = 0; i < llama_config.n_layers; i++) {
     // set transformer layer id
     ff.set_transformer_layer_id(i);
     // step 1: attention
-    std::vector<int> axes = {2};
     Tensor att_norm =
         ff.rms_norm(token, llama_config.norm_eps, llama_config.dim);
     Layer *attention_norm = ff.layers.back();
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index 503be39672..94aeb7f2bd 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -27,24 +27,6 @@ void OPT::create_opt_model(FFModel &ff,
                            bool use_full_precision) {
   Config opt_config(model_config_file_path);
   opt_config.printConfig();
-  //---------------------- parallelization setup work ----------------------
-  int num_devices = ff.config.workersPerNode * ff.config.numNodes;
-  int num_transformer_layers = opt_config.num_hidden_layers;
-  assert(num_transformer_layers % ff.config.pipeline_parallelism_degree == 0);
-  int num_layers_per_pp_block =
-      num_transformer_layers / ff.config.pipeline_parallelism_degree;
-  int num_devices_per_data_parallelism_line =
-      num_devices / ff.config.data_parallelism_degree;
-
-  // std::cout << "dp: " << ff.config.data_parallelism_degree
-  //           << " tp: " << ff.config.tensor_parallelism_degree
-  //           << " pp: " << ff.config.pipeline_parallelism_degree << std::endl;
-  // std::cout << "num_devices: " << num_devices << std::endl;
-  // std::cout << "num_transformer_layers: " << num_transformer_layers
-  //           << std::endl;
-  // std::cout << "num_devices_per_data_parallelism_line: "
-  //           << num_devices_per_data_parallelism_line << std::endl;
-  // std::cout << "num layers: " << opt_config.num_hidden_layers << std::endl;
 
   std::unordered_map<std::string, Layer *> weights_layers;
 
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index a4c3dc64f9..a34c1b6a84 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -282,65 +282,7 @@ void FlexFlow::top_level_task(Task const *task,
     }
   }
 
-  TreeVerifyBatchConfig tree_bc;
-  BeamSearchBatchConfig beam_bc;
-  std::vector<BeamSearchBatchConfig> beam_bc_vec;
-  for (int ssm_id = 0; ssm_id < num_ssms; ssm_id++) {
-    beam_bc_vec.push_back(BeamSearchBatchConfig(ssm_model_ids[ssm_id]));
-  }
-
-  InferenceResult tree_ir;
-
-  while (rm.get_num_processed_requests() < total_num_requests) {
-    int depth = 0;
-    // Beam Search
-    beam_bc = rm.prepare_next_batch_init(tree_bc, tree_ir, 0);
-    for (int ssm_id = 0; ssm_id < num_ssms; ssm_id++) {
-      beam_bc_vec[ssm_id] = beam_bc;
-      beam_bc_vec[ssm_id].model_id = ssm_id;
-    }
-
-    if (rm.get_num_processed_requests() >= total_num_requests) {
-      break;
-    }
-
-    for (int i = 0; i < num_ssms; i++) {
-      while (true) {
-        beam_bc = beam_bc_vec[i];
-        depth = beam_bc.beamRequestsInfo[0].current_depth;
-
-        FutureMap fm = im.inference(rm.get_model(0), 0, beam_bc_vec[i]);
-        assert(fm.get_future_map_domain().get_volume() == 1);
-        Future future = fm.get_future(0);
-        BeamInferenceResult beam_ir = future.get_result<BeamInferenceResult>();
-
-        int iteration =
-            std::min(BeamSearchBatchConfig::MAX_BEAM_DEPTH,
-                     BatchConfig::MAX_SEQ_LENGTH - beam_bc.max_init_length);
-
-        if (depth - 1 >= iteration) {
-          break;
-        } else {
-          beam_bc_vec[i] = rm.prepare_next_batch_beam(beam_bc_vec[i], beam_ir);
-          if (beam_bc_vec[i].num_active_tokens() == 0 &&
-              beam_bc_vec[i].num_active_requests() != 0) {
-            break;
-          }
-        }
-      }
-      std::cout << "----------beam search finished for model "
-                << beam_bc_vec[i].model_id << "------------" << std::endl;
-    }
-    // Token Tree Verification
-    {
-      tree_bc = rm.prepare_next_batch_verify(beam_bc_vec);
-      FutureMap fm = im.inference(&tree_model, 0, tree_bc);
-
-      assert(fm.get_future_map_domain().get_volume() == 1);
-      Future future = fm.get_future(0);
-      tree_ir = future.get_result<InferenceResult>();
-    }
-  }
+  im.spec_inference_loop(&tree_model, rm, total_num_requests, ssm_model_ids);
 
   // Execution fence
   {
diff --git a/python/flexflow/core/flexflow_cffi.py b/python/flexflow/core/flexflow_cffi.py
index bb63dc153e..52ae0d9ef9 100644
--- a/python/flexflow/core/flexflow_cffi.py
+++ b/python/flexflow/core/flexflow_cffi.py
@@ -22,7 +22,7 @@
 import warnings
 import numpy as np
 from .flexflow_logger import fflogger
-from flexflow.type import ActiMode, RegularizerMode, AggrMode, PoolType, DataType, LossType, CompMode, MetricsType, OpType, ParameterSyncType, enum_to_int, int_to_enum
+from flexflow.type import ActiMode, RegularizerMode, AggrMode, PoolType, DataType, LossType, CompMode, MetricsType, InferenceMode, OpType, ParameterSyncType, enum_to_int, int_to_enum
 _FF_BUILD_DOCS = bool(os.environ.get('READTHEDOCS') or os.environ.get("FF_BUILD_DOCS"))
 if not _FF_BUILD_DOCS:
   from .flexflowlib import ffi, flexflow_library
@@ -429,12 +429,40 @@ def __init__(self, handle, idx=None, name=None):
     super(MultiHeadAttention, self).__init__(handle, idx, name)
 
 # -----------------------------------------------------------------------
-# Increamental MultiHeadAttention
+# Incremental MultiHeadAttention
 # -----------------------------------------------------------------------
 class IncMultiHeadAttention(Op):
   def __init__(self, handle, idx=None, name=None):
     super(IncMultiHeadAttention, self).__init__(handle, idx, name)
 
+# -----------------------------------------------------------------------
+# RMS Norm
+# -----------------------------------------------------------------------
+class RMSNorm(Op):
+  def __init__(self, handle, idx=None, name=None):
+    super(RMSNorm, self).__init__(handle, idx, name)
+
+# -----------------------------------------------------------------------
+# ArgTopK
+# -----------------------------------------------------------------------
+class ArgTopK(Op):
+  def __init__(self, handle, idx=None, name=None):
+    super(ArgTopK, self).__init__(handle, idx, name)
+
+# -----------------------------------------------------------------------
+# BeamTopK
+# -----------------------------------------------------------------------
+class BeamTopK(Op):
+  def __init__(self, handle, idx=None, name=None):
+    super(BeamTopK, self).__init__(handle, idx, name)
+
+# -----------------------------------------------------------------------
+# Sampling
+# -----------------------------------------------------------------------
+class Sampling(Op):
+  def __init__(self, handle, idx=None, name=None):
+    super(Sampling, self).__init__(handle, idx, name)
+
 # -----------------------------------------------------------------------
 # flexflow_op_t handle to Op
 # -----------------------------------------------------------------------
@@ -516,7 +544,15 @@ def convert_op_handle_to_op(op_type, handle, idx=None, name=None):
   elif op_type == OpType.MULTIHEAD_ATTENTION:
     return MultiHeadAttention(handle, idx, name)
   elif op_type == OpType.INC_MULTIHEAD_ATTENTION:
-        return MultiHeadAttention(handle, idx, name)
+    return IncMultiHeadAttention(handle, idx, name)
+  elif op_type == OpType.RMS_NORM:
+    return RMSNorm(handle, idx, name)
+  elif op_type == OpType.ARG_TOPK:
+    return ArgTopK(handle, idx, name)
+  elif op_type == OpType.BEAM_TOPK:
+    return BeamTopK(handle, idx, name)
+  elif op_type == OpType.SAMPLING:
+    return Sampling(handle, idx, name)
   elif op_type == OpType.RSQRT:
     return Rsqrt(handle, idx, name)
   elif op_type == OpType.POW:
@@ -1299,7 +1335,7 @@ def conv2d(self, input, out_channels,
     return Tensor(handle, owner_op_type=OpType.CONV2D)
 
   def embedding(self, input, num_embeddings, embedding_dim, 
-                aggr, shared_op=None, kernel_initializer=None, name=None):
+                aggr, dtype=DataType.DT_FLOAT, shared_op=None, kernel_initializer=None, name=None):
     """Layer that turns positive integers into dense vectors of fixed size
              
     :param input: the input Tensor.
@@ -1313,6 +1349,9 @@ def embedding(self, input, num_embeddings, embedding_dim,
                 
     :param aggr: aggregation mode. Options are AGGR_MODE_NONE, AGGR_MODE_SUM and AGGR_MODE_AVG.
     :type aggr: AggrMode
+
+    :param dtype: the tensor data type. Options are DT_BOOLEAN, DT_INT32, DT_INT64, DT_HALF, DT_FLOAT, DT_DOUBLE, DT_INT4, DT_INT8, DT_NONE
+    :type dtype: DataType
                 
     :param shared_op: the layer whose parameters are shared with. Default is None.
     :type shared_op: Op  
@@ -1328,6 +1367,7 @@ def embedding(self, input, num_embeddings, embedding_dim,
     c_name = get_c_name(name)
     shared_op_handle = self.__get_op_handle(shared_op)
     c_aggr = enum_to_int(AggrMode, aggr)
+    c_dtype = enum_to_int(DataType, dtype)
     if kernel_initializer is None:
       kernel_initializer = GlorotUniformInitializer(42)
     assert (type(kernel_initializer) is GlorotUniformInitializer) or \
@@ -1336,7 +1376,7 @@ def embedding(self, input, num_embeddings, embedding_dim,
       (type(kernel_initializer) is NormInitializer), \
       f"Unknown initializer type: {kernel_initializer}"
     handle = ffc.flexflow_model_add_embedding(
-      self.handle, input.handle, num_embeddings, embedding_dim, c_aggr,
+      self.handle, input.handle, num_embeddings, embedding_dim, c_aggr, c_dtype,
       shared_op_handle, kernel_initializer.handle, c_name,
     )
     # NOTE: We must keep a reference to the initializer or else it will be
@@ -1977,17 +2017,18 @@ def multihead_attention(self, query, key, value,
     handle = ffc.flexflow_model_add_multihead_attention(self.handle, query.handle, key.handle, value.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, kernel_init_handle, c_name)
     self.add_layer(OpType.MULTIHEAD_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.MULTIHEAD_ATTENTION)
+  
   def inc_multihead_attention(self, input, 
                           embed_dim, num_heads, 
                           kdim=0, vdim=0, dropout=0.0, 
                           bias=True, add_bias_kv=False, add_zero_attn=False, 
-                          kernel_initializer=None, name=None):
+                          kernel_initializer=None, apply_rotary_embedding=False, name=None):
     """Defines the MultiHead Attention operation as described in Attention Is All You Need 
     which takes in the tensors :attr:`query`, :attr:`key`, and :attr:`value`, 
     and returns the dot-product attention between them:.
              
     :param input: the input Tensor.
-    :type query: Tensor
+    :type input: Tensor
 
     :param embed_dim: total dimension of the model
     :type embed_dim: int
@@ -2015,6 +2056,9 @@ def inc_multihead_attention(self, input,
     
     :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
     :type kernel_initializer: Initializer
+
+    :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
+    :type apply_rotary_embedding: bool
              
     :param name: the name of the layer. Default is None.
     :type name: string
@@ -2023,9 +2067,201 @@ def inc_multihead_attention(self, input,
     """     
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-    handle = ffc.flexflow_model_add_inc_multihead_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, kernel_init_handle, c_name)
+    handle = ffc.flexflow_model_add_inc_multihead_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, kernel_init_handle, apply_rotary_embedding, c_name)
     self.add_layer(OpType.INC_MULTIHEAD_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.INC_MULTIHEAD_ATTENTION)
+  
+  def spec_inc_multihead_attention(self, input, 
+                          embed_dim, num_heads, 
+                          kdim=0, vdim=0, dropout=0.0, 
+                          bias=True, add_bias_kv=False, add_zero_attn=False, 
+                          kernel_initializer=None, apply_rotary_embedding=False, name=None):
+    """Defines the MultiHead Attention operation as described in Attention Is All You Need 
+    which takes in the tensors :attr:`query`, :attr:`key`, and :attr:`value`, 
+    and returns the dot-product attention between them:.
+             
+    :param input: the input Tensor.
+    :type input: Tensor
+
+    :param embed_dim: total dimension of the model
+    :type embed_dim: int
+                          
+    :param num_heads: Number of attention heads.
+    :type num_heads: int
+                          
+    :param kdim: total number of features in key. Default is 0
+    :type kdim: int
+                          
+    :param vdim: total number of features in value. Default is 0
+    :type vdim: int
+                          
+    :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
+    :type dropout: float(0-1)
+                          
+    :param bias: Whether the dense layers use bias vectors. Default is True.
+    :type bias: bool
+                          
+    :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
+    :type add_bias_kv: bool
+                          
+    :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
+    :type add_zero_attn: bool
+    
+    :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+    :type kernel_initializer: Initializer
+
+    :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
+    :type apply_rotary_embedding: bool
+             
+    :param name: the name of the layer. Default is None.
+    :type name: string
+
+    :returns:  Tensor -- the output tensor.
+    """     
+    c_name = get_c_name(name)                 
+    kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+    handle = ffc.flexflow_model_add_spec_inc_multihead_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, kernel_init_handle, apply_rotary_embedding, c_name)
+    self.add_layer(OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION, name)
+    return Tensor(handle, owner_op_type=OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION)
+  
+  def inc_multihead_self_attention_verify(self, input, 
+                          embed_dim, num_heads, 
+                          kdim=0, vdim=0, dropout=0.0, 
+                          bias=True, add_bias_kv=False, add_zero_attn=False, 
+                          kernel_initializer=None, apply_rotary_embedding=False, name=None):
+    """Defines the MultiHead Attention operation as described in Attention Is All You Need 
+    which takes in the tensors :attr:`query`, :attr:`key`, and :attr:`value`, 
+    and returns the dot-product attention between them:.
+             
+    :param input: the input Tensor.
+    :type input: Tensor
+
+    :param embed_dim: total dimension of the model
+    :type embed_dim: int
+                          
+    :param num_heads: Number of attention heads.
+    :type num_heads: int
+                          
+    :param kdim: total number of features in key. Default is 0
+    :type kdim: int
+                          
+    :param vdim: total number of features in value. Default is 0
+    :type vdim: int
+                          
+    :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
+    :type dropout: float(0-1)
+                          
+    :param bias: Whether the dense layers use bias vectors. Default is True.
+    :type bias: bool
+                          
+    :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
+    :type add_bias_kv: bool
+                          
+    :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
+    :type add_zero_attn: bool
+    
+    :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+    :type kernel_initializer: Initializer
+
+    :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
+    :type apply_rotary_embedding: bool
+             
+    :param name: the name of the layer. Default is None.
+    :type name: string
+
+    :returns:  Tensor -- the output tensor.
+    """     
+    c_name = get_c_name(name)                 
+    kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+    handle = ffc.flexflow_model_add_inc_multihead_self_attention_verify(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, kernel_init_handle, apply_rotary_embedding, c_name)
+    self.add_layer(OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION, name)
+    return Tensor(handle, owner_op_type=OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION)
+  
+  def rms_norm(self, input, eps, dim, name=None):
+    """Defines the RMS Norm layer.
+             
+    :param input: the input Tensor.
+    :type input: Tensor
+
+    :param eps: a value added to the denominator for numerical stability
+    :type eps: float
+                          
+    :param dim: The dimension with respect to which to take the norm
+    :type dim: int
+             
+    :param name: the name of the layer. Default is None.
+    :type name: string
+
+    :returns:  Tensor -- the output tensor.
+    """
+    c_name = get_c_name(name)
+    handle = ffc.flexflow_model_add_rms_norm(self.handle, input.handle, eps, dim, c_name)
+    self.add_layer(OpType.RMS_NORM, name)
+    return Tensor(handle, owner_op_type=OpType.RMS_NORM)
+  
+  def arg_top_k(self, input, k, sorted, name=None):
+    """Defines the Arg TopK layer.
+             
+    :param input: the input Tensor.
+    :type input: Tensor
+
+    :param k: the top k indices to select
+    :type k: int
+                          
+    :param sorted: Whether the entries should be sorted
+    :type sorted: bool
+             
+    :param name: the name of the layer. Default is None.
+    :type name: string
+
+    :returns:  Tensor -- the output tensor.
+    """
+    c_name = get_c_name(name)
+    handle = ffc.flexflow_model_add_arg_top_k(self.handle, input.handle, k, sorted, c_name)
+    self.add_layer(OpType.ARG_TOPK, name)
+    return Tensor(handle, owner_op_type=OpType.ARG_TOPK)
+
+  def beam_top_k(self, input, max_beam_size, sorted, name=None):
+    """Defines the Beam TopK layer.
+             
+    :param input: the input Tensor.
+    :type input: Tensor
+
+    :param max_beam_size: the top max_beam_size indices to select
+    :type max_beam_size: int
+                          
+    :param sorted: Whether the entries should be sorted
+    :type sorted: bool
+             
+    :param name: the name of the layer. Default is None.
+    :type name: string
+
+    :returns:  Tensor -- the output tensor.
+    """
+    c_name = get_c_name(name)
+    handle = ffc.flexflow_model_add_beam_top_k(self.handle, input.handle, max_beam_size, sorted, c_name)
+    self.add_layer(OpType.BEAM_TOPK, name)
+    return Tensor(handle, owner_op_type=OpType.BEAM_TOPK)
+  
+  def sampling(self, input, top_p, name=None):
+    """Defines the Sampling layer.
+             
+    :param input: the input Tensor.
+    :type input: Tensor
+
+    :param top_p: The top_p parameter of the sampling
+    :type top_p: float
+             
+    :param name: the name of the layer. Default is None.
+    :type name: string
+
+    :returns:  Tensor -- the output tensor.
+    """
+    c_name = get_c_name(name)
+    handle = ffc.flexflow_model_add_sampling(self.handle, input.handle, top_p, c_name)
+    self.add_layer(OpType.SAMPLING, name)
+    return Tensor(handle, owner_op_type=OpType.SAMPLING)
+
   def reset_metrics(self):
     """Reset performance metrics.
              
@@ -2249,6 +2485,9 @@ def label_tensor(self):
   def get_perf_metrics(self):
     handle = ffc.flexflow_model_get_perf_metrics(self.handle)
     return PerfMetrics(handle)
+  
+  def set_transformer_layer_id(self, id):
+    ffc.flexflow_model_set_transformer_layer_id(self.handle, id)
     
   def create_data_loader(self, batch_tensor, full_array):
     """Create a SingleDataloader instance. 
@@ -2566,3 +2805,70 @@ def __init__(self, shape, data_type, base_ptr, strides, read_only):
       'data': (base_ptr, read_only),
       'strides': strides,
     }
+
+# -----------------------------------------------------------------------
+# BatchConfig
+# -----------------------------------------------------------------------
+
+class BatchConfig(object):
+  __slots__ = ['handle', '_handle']
+  def __init__(self):
+    self.handle = ffc.flexflow_batch_config_create()
+    self._handle = ffi.gc(self.handle, ffc.flexflow_batch_config_destroy)
+
+# -----------------------------------------------------------------------
+# TreeVerifyBatchConfig
+# -----------------------------------------------------------------------
+
+class TreeVerifyBatchConfig(object):
+  __slots__ = ['handle', '_handle']
+  def __init__(self):
+    self.handle = ffc.flexflow_tree_verify_batch_config_create()
+    self._handle = ffi.gc(self.handle, ffc.flexflow_tree_verify_batch_config_destroy)
+
+# -----------------------------------------------------------------------
+# BeamSearchBatchConfig
+# -----------------------------------------------------------------------
+
+class BatchConfig(object):
+  __slots__ = ['handle', '_handle']
+  def __init__(self):
+    self.handle = ffc.flexflow_beam_search_batch_config_create()
+    self._handle = ffi.gc(self.handle, ffc.flexflow_beam_search_batch_config_destroy)
+
+# -----------------------------------------------------------------------
+# RequestManager
+# -----------------------------------------------------------------------
+
+class RequestManager(object):
+  __slots__ = ['handle', '_handle']
+  def __init__(self):
+    self.handle = ffc.flexflow_request_manager_create()
+    self._handle = ffi.gc(self.handle, ffc.flexflow_request_manager_destroy)
+
+  def flexflow_request_manager_register_new_request(self, prompt, max_sequence_length):
+    return ffc.flexflow_request_manager_register_new_request(self.handle, prompt, max_sequence_length)
+  
+# -----------------------------------------------------------------------
+# InferenceManager
+# -----------------------------------------------------------------------
+
+class InferenceManager(object):
+  __slots__ = ['handle', '_handle', 'max_num_tokens_per_batch']
+  def __init__(self, ffconfig, max_num_tokens_per_batch):
+    self.max_num_tokens_per_batch = max_num_tokens_per_batch
+    self.handle = ffc.flexflow_inference_manager_create(ffconfig.handle, max_num_tokens_per_batch)
+    self._handle = ffi.gc(self.handle, ffc.flexflow_inference_manager_destroy)
+
+  def compile_model_and_allocate_buffer(self, model):
+    ffc.flexflow_inference_manager_compile_model_and_allocate_buffer(self.handle, model.handle)
+
+  def init_operators_inference(self, model):
+    ffc.flexflow_inference_manager_init_operators_inference(self.handle, model.handle)
+
+  def incr_decoding_loop(self, model, request_manager, total_num_requests):
+    ffc.flexflow_inference_manager_incr_decoding_loop(self.handle, model.handle, request_manager.handle, total_num_requests)
+
+  def spec_inference_loop(self, model, request_manager, total_num_requests, ssm_model_ids):
+    c_ssm_model_ids = ffi.new("int[]", ssm_model_ids)
+    ffc.flexflow_inference_manager_spec_inference_loop(self.handle, model.handle, request_manager.handle, total_num_requests, len(ssm_model_ids), c_ssm_model_ids)
diff --git a/python/flexflow/serve/__init__.py b/python/flexflow/serve/__init__.py
new file mode 100644
index 0000000000..e832bc7de4
--- /dev/null
+++ b/python/flexflow/serve/__init__.py
@@ -0,0 +1,15 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+from .serve import LLM, SamplingConfig
diff --git a/python/flexflow/serve/models/__init__.py b/python/flexflow/serve/models/__init__.py
new file mode 100644
index 0000000000..3b4087203b
--- /dev/null
+++ b/python/flexflow/serve/models/__init__.py
@@ -0,0 +1,17 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+from .llama import FlexFlowLLAMA
+from .opt import FlexFlowOPT
+from .falcon import FlexFlowFalcon
diff --git a/python/flexflow/serve/models/falcon.py b/python/flexflow/serve/models/falcon.py
new file mode 100644
index 0000000000..6fb4a13320
--- /dev/null
+++ b/python/flexflow/serve/models/falcon.py
@@ -0,0 +1,19 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+from flexflow.core import *
+
+class FlexFlowFalcon:
+    def __init__(self, max_batch_size=1, max_seq_length=256, max_tokens_per_batch=64):
+        pass
diff --git a/python/flexflow/serve/models/llama.py b/python/flexflow/serve/models/llama.py
new file mode 100644
index 0000000000..9d5953c773
--- /dev/null
+++ b/python/flexflow/serve/models/llama.py
@@ -0,0 +1,130 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+from flexflow.core import *
+import random
+
+class LLAMAConfig:
+    def __init__(self):
+        self.n_layers = 32
+        self.vocab_size = 3200
+        self.n_heads = 32
+        self.dim = 4096
+        self.multiple_of = 256
+        self.norm_eps = 1e-6
+        self.total_requests = 2560
+        self.incremental_mode = True
+        self.hidden_dim = 11008
+        self.max_seq_len = 256
+        self.max_num_tokens = 64
+        self.max_beam_width = 1
+        self.max_beam_depth = 8
+
+class FlexFlowLLAMA:
+    def __init__(self, mode, sampling_config, ffconfig, max_batch_size=1, max_seq_length=256, max_tokens_per_batch=64, use_full_precision=False):
+        self.mode = mode
+        self.sampling_config = sampling_config
+        self.ffconfig = ffconfig
+        self.max_batch_size = max_batch_size
+        self.use_full_precision = use_full_precision
+        self.llama_config = LLAMAConfig()
+        self.llama_config.max_seq_length = max_seq_length
+        self.llama_config.max_num_tokens = max_tokens_per_batch
+        
+        self.build_model()
+    
+    def build_model(self):
+        ffmodel = FFModel(self.ffconfig)
+        
+        tokens_dims = [self.llama_config.max_num_tokens, 1]
+        input_tensor = ffmodel.create_tensor(tokens_dims, DataType.DT_INT32)
+
+        embed_init = UniformInitializer(random.randint(0, 2**31-1), 0, 0)
+        token = ffmodel.embedding(input_tensor, self.llama_config.vocab_size, self.llama_config.dim, AggrMode.AGGR_MODE_NONE, DataType.DT_FLOAT if self.use_full_precision else DataType.DT_HALF, None, embed_init)
+
+        for i in range(self.llama_config.n_layers):
+            ffmodel.set_transformer_layer_id(i)
+
+            attn_norm = ffmodel.rms_norm(token, self.llama_config.norm_eps, self.llama_config.dim)
+
+            if self.mode == InferenceMode.BEAM_SEARCH_MODE:
+                mha = ffmodel.spec_inc_multihead_attention(
+                    attn_norm, 
+                    self.llama_config.dim,
+                    self.llama_config.n_heads,
+                    self.llama_config.dim // self.llama_config.n_heads,
+                    self.llama_config.dim // self.llama_config.n_heads,
+                    0.0,    # dropout
+                    False,  # bias 
+                    False,  # add_bias_kv 
+                    False,  # add_zero_attn 
+                    None,   # kernel initializer
+                    True    # apply_rotary_embedding 
+                )
+            elif self.mode == InferenceMode.TREE_VERIFY_MODE:
+                mha = ffmodel.inc_multihead_self_attention_verify(
+                    attn_norm, 
+                    self.llama_config.dim,
+                    self.llama_config.n_heads,
+                    self.llama_config.dim // self.llama_config.n_heads,
+                    self.llama_config.dim // self.llama_config.n_heads,
+                    0.0,    # dropout
+                    False,  # bias 
+                    False,  # add_bias_kv 
+                    False,  # add_zero_attn 
+                    None,   # kernel initializer
+                    True    # apply_rotary_embedding 
+                )
+            elif self.mode == InferenceMode.INC_DECODING_MODE:
+                mha = ffmodel.inc_multihead_attention(
+                    attn_norm, 
+                    self.llama_config.dim,
+                    self.llama_config.n_heads,
+                    self.llama_config.dim // self.llama_config.n_heads,
+                    self.llama_config.dim // self.llama_config.n_heads,
+                    0.0,    # dropout
+                    False,  # bias 
+                    False,  # add_bias_kv 
+                    False,  # add_zero_attn 
+                    None,   # kernel initializer
+                    True    # apply_rotary_embedding 
+                )
+            else:
+                assert(False)
+            
+            token = ffmodel.add(token, mha)
+            ff_norm = ffmodel.rms_norm(token, self.llama_config.norm_eps, self.llama_config.dim)
+            w1 = ffmodel.dense(ff_norm, self.llama_config.hidden_dim, ActiMode.AC_MODE_NONE, False)
+            w3 = ffmodel.dense(ff_norm, self.llama_config.hidden_dim, ActiMode.AC_MODE_NONE, False)
+            sigmoid = ffmodel.sigmoid(w1)
+            silu = ffmodel.multiply(w1, sigmoid)
+            multi = ffmodel.multiply(silu, w3)
+            w2 = ffmodel.dense(multi, self.llama_config.dim, ActiMode.AC_MODE_NONE, False)
+            token = ffmodel.add(token, w2)
+
+            token = ffmodel.rms_norm(token, self.llama_config.norm_eps, self.llama_config.dim)
+            dense = ffmodel.dense(token, self.llama_config.vocab_size, ActiMode.AC_MODE_NONE, False)
+            
+            if self.mode == InferenceMode.BEAM_SEARCH_MODE:
+                softmax = ffmodel.softmax(dense, -1)
+                output = ffmodel.beam_top_k(softmax, self.llama_config.max_beam_width, False)
+            else:
+                if self.sampling_config.do_sample:
+                    dense = ffmodel.scalar_true_divide(dense, self.sampling_config.temperature, False)
+                    softmax = ffmodel.softmax(dense, -1)
+                    output = ffmodel.sampling(softmax, self.sampling_config.topp)
+                else:
+                    output = ffmodel.arg_top_k(dense, 1, False)
+
+
diff --git a/python/flexflow/serve/models/opt.py b/python/flexflow/serve/models/opt.py
new file mode 100644
index 0000000000..50ac3611d9
--- /dev/null
+++ b/python/flexflow/serve/models/opt.py
@@ -0,0 +1,19 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+from flexflow.core import *
+
+class FlexFlowOPT:
+    def __init__(self, max_batch_size=1, max_seq_length=256, max_tokens_per_batch=64):
+        pass
diff --git a/python/flexflow/serve/serve.py b/python/flexflow/serve/serve.py
new file mode 100644
index 0000000000..2c33cff58d
--- /dev/null
+++ b/python/flexflow/serve/serve.py
@@ -0,0 +1,85 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+from flexflow.serve.models import FlexFlowLLAMA, FlexFlowOPT, FlexFlowFalcon
+from flexflow.core import *
+from transformers import AutoConfig
+import sys
+
+class SamplingConfig:
+    def __init__(self, do_sample = False, temperature=0.9, topp=0.8, topk=1):
+        self.do_sample = False
+        self.temperature = 0.8
+        self.topp = 0.6
+        self.topk = 1
+
+class LLM:
+    def __init__(self, model_name, data_type="half"):
+        self.model_name = model_name
+        self.supported_models = {
+            "LlamaForCausalLM": FlexFlowLLAMA,
+            "LLaMAForCausalLM": FlexFlowLLAMA,
+            "OPTForCausalLM": FlexFlowOPT,
+            "RWForCausalLM": FlexFlowFalcon # falcon
+        }
+        self.model_type = self.__get_ff_model_type(model_name)
+        self.data_type = data_type
+        self.ffconfig = FFConfig()
+
+    def __get_ff_model_type(self, model_name):
+        hf_config = AutoConfig.from_pretrained(model_name)
+        architectures = getattr(hf_config, "architectures", [])
+        ff_arch = None
+        if next(iter(architectures), None) is not None:
+            ff_arch = self.supported_models.get(architectures[0])
+        if ff_arch is None:
+            print("Huggingface model of type {architectures} is not yet supported by FlexFlow")
+            sys.exit(1)
+        return ff_arch
+
+    def compile(
+        self,
+        mode = InferenceMode.INC_DECODING_MODE,
+        sampling_config = SamplingConfig(),
+        use_full_precision = False,
+        max_batch_size=1,
+        max_seq_length=256,
+        max_tokens_per_batch=64,
+        tensor_parallel_degree=4,
+        pipeline_parallel_degree=2,
+        ssms=[],
+    ):
+        self.max_batch_size = max_batch_size
+        self.max_seq_length = max_seq_length
+        self.max_tokens_per_batch = max_tokens_per_batch
+        self.tensor_parallel_degree = tensor_parallel_degree
+        self.pipeline_parallel_degree = pipeline_parallel_degree
+        self.ssms = ssms
+        self.sampling_config = SamplingConfig()
+        assert((mode == InferenceMode.INC_DECODING_MODE or mode == InferenceMode.BEAM_SEARCH_MODE) == (len(ssms) == 0))
+        
+        # Create model
+        self.model = self.model_type(mode, sampling_config, self.ffconfig, max_batch_size, max_seq_length, max_tokens_per_batch, use_full_precision)
+
+        # Create inference manager
+        self.im = InferenceManager(self.ffconfig, max_tokens_per_batch)
+
+        # Create request manager
+        self.rm = RequestManager()
+        
+        assert False and "Not implemented yet"
+
+    def generate(self, prompt, sampling=None):
+        self.sampling = sampling if sampling is not None else self.default_config
+        assert False and "Not implemented yet"
diff --git a/python/flexflow/type.py b/python/flexflow/type.py
index cf2706f746..dd1d40baf0 100644
--- a/python/flexflow/type.py
+++ b/python/flexflow/type.py
@@ -56,6 +56,11 @@ class MetricsType(Enum):
   METRICS_ROOT_MEAN_SQUARED_ERROR = 1016
   METRICS_MEAN_ABSOLUTE_ERROR=1032
 
+class InferenceMode(Enum):
+  INC_DECODING_MODE = 2001
+  BEAM_SEARCH_MODE = 2002
+  TREE_VERIFY_MODE = 2003
+
 class OpType(Enum):
   CONV2D = 2011
   EMBEDDING = 2012
@@ -93,6 +98,10 @@ class OpType(Enum):
   MIN = 2054
   MULTIHEAD_ATTENTION = 2060
   INC_MULTIHEAD_ATTENTION = 2061
+  SPEC_INC_MULTIHEAD_SELF_ATTENTION = 2062
+  TREE_INC_MULTIHEAD_SELF_ATTENTION = 2063
+  INC_MULTIQUERY_SELF_ATTENTION = 2064
+  SAMPLING = 2065
   GETITEM = 2070
   GETATTR = 2080
   EXPAND = 2081
@@ -115,6 +124,10 @@ class OpType(Enum):
   VIEW = 2105
   GATHER = 2106
   ATTRIBUTE = 2200
+  RMS_NORM = 2300
+  ARG_TOPK = 2301
+  BEAM_TOPK = 2302
+
 def enum_to_int(enum, enum_item):
   for item in enum:
     if (enum_item == item):
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index 09258d8206..d7f1b70232 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -15,6 +15,7 @@
 
 #include "flexflow/flexflow_c.h"
 #include "flexflow/dataloader.h"
+#include "flexflow/inference.h"
 #include "flexflow/mapper.h"
 
 using namespace Legion;
@@ -55,6 +56,14 @@ class FFCObjectWrapper {
   FF_NEW_OPAQUE_WRAPPER(flexflow_net_config_t, NetConfig *);
   FF_NEW_OPAQUE_WRAPPER(flexflow_dlrm_config_t, DLRMConfig *);
   FF_NEW_OPAQUE_WRAPPER(flexflow_single_dataloader_t, SingleDataLoader *);
+  // inference
+  FF_NEW_OPAQUE_WRAPPER(flexflow_batch_config_t, BatchConfig *);
+  FF_NEW_OPAQUE_WRAPPER(flexflow_tree_verify_batch_config_t,
+                        TreeVerifyBatchConfig *);
+  FF_NEW_OPAQUE_WRAPPER(flexflow_beam_search_batch_config_t,
+                        BeamSearchBatchConfig *);
+  FF_NEW_OPAQUE_WRAPPER(flexflow_inference_manager_t, InferenceManager *);
+  FF_NEW_OPAQUE_WRAPPER(flexflow_request_manager_t, RequestManager *);
 };
 
 Logger ffc_log("flexflow_c");
@@ -456,9 +465,10 @@ flexflow_tensor_t
 flexflow_tensor_t
     flexflow_model_add_embedding(flexflow_model_t handle_,
                                  const flexflow_tensor_t input_,
-                                 int num_entires,
+                                 int num_entries,
                                  int out_dim,
                                  enum AggrMode aggr,
+                                 DataType dtype,
                                  flexflow_op_t shared_op_,
                                  flexflow_initializer_t kernel_initializer_,
                                  char const *name) {
@@ -470,20 +480,21 @@ flexflow_tensor_t
   // TODO: update the flexflow_c and Python API to support other data types
   // Currently we assume it's float
   Tensor tensor = handle->embedding(input,
-                                    num_entires,
+                                    num_entries,
                                     out_dim,
                                     aggr,
-                                    DT_FLOAT,
+                                    dtype,
                                     shared_op,
                                     kernel_initializer,
                                     name);
-  DEBUG_PRINT("[Embedding] new Tensor %p, input %p, num_entires %d, out_dim "
-              "%d, aggr %d, shared_op %p, kernel_init %p, name %s",
+  DEBUG_PRINT("[Embedding] new Tensor %p, input %p, num_entries %d, out_dim "
+              "%d, aggr %d, dtype %d, shared_op %p, kernel_init %p, name %s",
               tensor,
               input,
-              num_entires,
+              num_entries,
               out_dim,
               aggr,
+              dtype,
               shared_op,
               kernel_initializer,
               name);
@@ -1014,6 +1025,7 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_attention(
     bool add_bias_kv,
     bool add_zero_attn,
     flexflow_initializer_t kernel_initializer_,
+    bool apply_rotary_embedding,
     char const *name) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
   Tensor input = FFCObjectWrapper::unwrap(input_);
@@ -1030,10 +1042,124 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_attention(
                                                        add_zero_attn,
                                                        input->data_type,
                                                        kernel_initializer,
+                                                       apply_rotary_embedding,
                                                        name);
   return FFCObjectWrapper::wrap(tensor);
 }
 
+flexflow_tensor_t flexflow_model_add_spec_inc_multihead_attention(
+    flexflow_model_t handle_,
+    const flexflow_tensor_t input_,
+    int embed_dim,
+    int num_heads,
+    int kdim,
+    int vdim,
+    float dropout,
+    bool bias,
+    bool add_bias_kv,
+    bool add_zero_attn,
+    flexflow_initializer_t kernel_initializer_,
+    bool apply_rotary_embedding,
+    char const *name) {
+  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
+  Tensor input = FFCObjectWrapper::unwrap(input_);
+  Initializer *kernel_initializer =
+      FFCObjectWrapper::unwrap(kernel_initializer_);
+  Tensor tensor =
+      handle->spec_inc_multihead_self_attention(input,
+                                                embed_dim,
+                                                num_heads,
+                                                kdim,
+                                                vdim,
+                                                dropout,
+                                                bias,
+                                                add_bias_kv,
+                                                add_zero_attn,
+                                                input->data_type,
+                                                kernel_initializer,
+                                                apply_rotary_embedding,
+                                                name);
+  return FFCObjectWrapper::wrap(tensor);
+}
+
+flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention_verify(
+    flexflow_model_t handle_,
+    const flexflow_tensor_t input_,
+    int embed_dim,
+    int num_heads,
+    int kdim,
+    int vdim,
+    float dropout,
+    bool bias,
+    bool add_bias_kv,
+    bool add_zero_attn,
+    flexflow_initializer_t kernel_initializer_,
+    bool apply_rotary_embedding,
+    char const *name) {
+  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
+  Tensor input = FFCObjectWrapper::unwrap(input_);
+  Initializer *kernel_initializer =
+      FFCObjectWrapper::unwrap(kernel_initializer_);
+  Tensor tensor =
+      handle->inc_multihead_self_attention_verify(input,
+                                                  embed_dim,
+                                                  num_heads,
+                                                  kdim,
+                                                  vdim,
+                                                  dropout,
+                                                  bias,
+                                                  add_bias_kv,
+                                                  add_zero_attn,
+                                                  input->data_type,
+                                                  kernel_initializer,
+                                                  apply_rotary_embedding,
+                                                  name);
+  return FFCObjectWrapper::wrap(tensor);
+}
+
+flexflow_tensor_t flexflow_model_add_rms_norm(flexflow_model_t handle_,
+                                              const flexflow_tensor_t input_,
+                                              float eps,
+                                              int dim,
+                                              char const *name) {
+  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
+  Tensor input = FFCObjectWrapper::unwrap(input_);
+  Tensor tensor = handle->rms_norm(input, eps, dim, input->data_type, name);
+  return FFCObjectWrapper::wrap(tensor);
+}
+
+flexflow_tensor_t flexflow_model_add_arg_top_k(flexflow_model_t handle_,
+                                               const flexflow_tensor_t input_,
+                                               int k,
+                                               bool sorted,
+                                               char const *name) {
+  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
+  Tensor input = FFCObjectWrapper::unwrap(input_);
+  Tensor tensor = handle->arg_top_k(input, k, sorted, name);
+  return FFCObjectWrapper::wrap(tensor);
+}
+
+flexflow_tensor_t flexflow_model_add_beam_top_k(flexflow_model_t handle_,
+                                                const flexflow_tensor_t input_,
+                                                int max_beam_size,
+                                                bool sorted,
+                                                char const *name) {
+  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
+  Tensor input = FFCObjectWrapper::unwrap(input_);
+  Tensor tensor = handle->beam_top_k(input, max_beam_size, sorted, name);
+  return FFCObjectWrapper::wrap(tensor);
+}
+
+flexflow_tensor_t flexflow_model_add_sampling(flexflow_model_t handle_,
+                                              const flexflow_tensor_t input_,
+                                              float top_p,
+                                              char const *name) {
+  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
+  Tensor input = FFCObjectWrapper::unwrap(input_);
+  Tensor tensor = handle->sampling(input, top_p, name);
+  return FFCObjectWrapper::wrap(tensor);
+}
+
 void flexflow_model_set_sgd_optimizer(flexflow_model_t handle_,
                                       flexflow_sgd_optimizer_t optimizer_) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
@@ -1082,6 +1208,11 @@ flexflow_perf_metrics_t
   return FFCObjectWrapper::wrap(perf_metrics);
 }
 
+void flexflow_model_set_transformer_layer_id(flexflow_model_t handle_, int id) {
+  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
+  handle->set_transformer_layer_id(id);
+}
+
 // -----------------------------------------------------------------------
 // Tensor
 // -----------------------------------------------------------------------
@@ -1961,3 +2092,150 @@ void flexflow_perform_registration(void) {
   Runtime::perform_registration_callback(FFMapper::update_mappers,
                                          true /*global*/);
 }
+
+// -----------------------------------------------------------------------
+// BatchConfig
+// -----------------------------------------------------------------------
+
+flexflow_batch_config_t flexflow_batch_config_create(void) {
+  BatchConfig *config = new BatchConfig();
+  DEBUG_PRINT("[BatchConfig] new %p", config);
+  return FFCObjectWrapper::wrap(config);
+}
+
+void flexflow_batch_config_destroy(flexflow_batch_config_t handle_) {
+  BatchConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  DEBUG_PRINT("[BatchConfig] delete %p", handle);
+  delete handle;
+}
+
+// -----------------------------------------------------------------------
+// TreeVerifyBatchConfig
+// -----------------------------------------------------------------------
+
+flexflow_tree_verify_batch_config_t
+    flexflow_tree_verify_batch_config_create(void) {
+  TreeVerifyBatchConfig *config = new TreeVerifyBatchConfig();
+  DEBUG_PRINT("[TreeVerifyBatchConfig] new %p", config);
+  return FFCObjectWrapper::wrap(config);
+}
+
+void flexflow_tree_verify_batch_config_destroy(
+    flexflow_tree_verify_batch_config_t handle_) {
+  TreeVerifyBatchConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  DEBUG_PRINT("[TreeVerifyBatchConfig] delete %p", handle);
+  delete handle;
+}
+
+// -----------------------------------------------------------------------
+// BeamSearchBatchConfig
+// -----------------------------------------------------------------------
+
+flexflow_beam_search_batch_config_t
+    flexflow_beam_search_batch_config_create(void) {
+  BeamSearchBatchConfig *config = new BeamSearchBatchConfig();
+  DEBUG_PRINT("[BeamSearchBatchConfig] new %p", config);
+  return FFCObjectWrapper::wrap(config);
+}
+
+void flexflow_beam_search_batch_config_destroy(
+    flexflow_beam_search_batch_config_t handle_) {
+  BeamSearchBatchConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  DEBUG_PRINT("[BeamSearchBatchConfig] delete %p", handle);
+  delete handle;
+}
+
+// -----------------------------------------------------------------------
+// RequestManager
+// -----------------------------------------------------------------------
+
+flexflow_request_manager_t flexflow_request_manager_create(void) {
+  RequestManager *rm = new RequestManager();
+  DEBUG_PRINT("[RequestManager] new %p", rm);
+  return FFCObjectWrapper::wrap(rm);
+}
+
+void flexflow_request_manager_destroy(flexflow_request_manager_t handle_) {
+  RequestManager *handle = FFCObjectWrapper::unwrap(handle_);
+  DEBUG_PRINT("[RequestManager] delete %p", handle);
+  delete handle;
+}
+
+long unsigned int flexflow_request_manager_register_new_request(
+    flexflow_request_manager_t handle_,
+    char const *prompt,
+    int max_sequence_length) {
+  RequestManager *handle = FFCObjectWrapper::unwrap(handle_);
+  assert(prompt != nullptr && "Cannot convert nullptr char * to std::string");
+  std::string const prompt_str(prompt);
+  DEBUG_PRINT("[RequestManager] register_new_request %p %s", handle, prompt);
+  return handle->register_new_request(prompt_str, max_sequence_length);
+}
+
+// -----------------------------------------------------------------------
+// InferenceManager
+// -----------------------------------------------------------------------
+
+flexflow_inference_manager_t
+    flexflow_inference_manager_create(flexflow_config_t config_handle,
+                                      int max_num_tokens_per_batch) {
+  FFConfig *config = FFCObjectWrapper::unwrap(config_handle);
+  InferenceManager *im =
+      new InferenceManager(*config, max_num_tokens_per_batch);
+  DEBUG_PRINT("[InferenceManager] new %p", im);
+  return FFCObjectWrapper::wrap(im);
+}
+
+void flexflow_inference_manager_destroy(flexflow_inference_manager_t handle_) {
+  InferenceManager *handle = FFCObjectWrapper::unwrap(handle_);
+  DEBUG_PRINT("[InferenceManager] delete %p", handle);
+  delete handle;
+}
+
+void flexflow_inference_manager_compile_model_and_allocate_buffer(
+    flexflow_inference_manager_t handle_, flexflow_model_t model_handle_) {
+  InferenceManager *handle = FFCObjectWrapper::unwrap(handle_);
+  FFModel *model_handle = FFCObjectWrapper::unwrap(model_handle_);
+  DEBUG_PRINT("[InferenceManager] compile_model_and_allocate_buffer %p",
+              handle);
+  handle->compile_model_and_allocate_buffer(model_handle);
+}
+
+void flexflow_inference_manager_init_operators_inference(
+    flexflow_inference_manager_t handle_, flexflow_model_t model_handle_) {
+  InferenceManager *handle = FFCObjectWrapper::unwrap(handle_);
+  FFModel *model_handle = FFCObjectWrapper::unwrap(model_handle_);
+  DEBUG_PRINT("[InferenceManager] init_operators_inference %p", handle);
+  handle->init_operators_inference(model_handle);
+}
+
+void flexflow_inference_manager_incr_decoding_loop(
+    flexflow_inference_manager_t handle_,
+    flexflow_model_t model_handle_,
+    flexflow_request_manager_t rm_handle_,
+    int total_num_requests) {
+  InferenceManager *handle = FFCObjectWrapper::unwrap(handle_);
+  FFModel *model_handle = FFCObjectWrapper::unwrap(model_handle_);
+  RequestManager *rm_handle = FFCObjectWrapper::unwrap(rm_handle_);
+  DEBUG_PRINT("[InferenceManager] incr_decoding_loop %p", handle);
+  handle->incr_decoding_loop(model_handle, *rm_handle, total_num_requests);
+}
+
+void flexflow_inference_manager_spec_inference_loop(
+    flexflow_inference_manager_t handle_,
+    flexflow_model_t model_handle_,
+    flexflow_request_manager_t rm_handle_,
+    int total_num_requests,
+    int num_ssms,
+    int *ssm_model_ids) {
+  InferenceManager *handle = FFCObjectWrapper::unwrap(handle_);
+  FFModel *model_handle = FFCObjectWrapper::unwrap(model_handle_);
+  RequestManager *rm_handle = FFCObjectWrapper::unwrap(rm_handle_);
+  std::vector<int> ssm_model_ids_vec;
+  for (int i = 0; i < num_ssms; i++) {
+    ssm_model_ids_vec.push_back(ssm_model_ids[i]);
+  }
+  DEBUG_PRINT("[InferenceManager] spec_inference_loop %p", handle);
+  handle->spec_inference_loop(
+      model_handle, *rm_handle, total_num_requests, ssm_model_ids_vec);
+}
diff --git a/src/ops/element_binary.cc b/src/ops/element_binary.cc
index 7562a727d7..1535cfcd77 100644
--- a/src/ops/element_binary.cc
+++ b/src/ops/element_binary.cc
@@ -45,8 +45,11 @@ Tensor FFModel::binary(OperatorType op,
   assert(broadcastable(in1, in2));
   if (in1->data_type < in2->data_type) {
     dtype = in2->data_type;
-    std::string str(name);
-    Tensor new_in1 = cast(in1, dtype, (str + "input1_pre_cast").c_str());
+    std::string str;
+    if (name != nullptr) {
+      str = std::string(name) + "input1_pre_cast";
+    }
+    Tensor new_in1 = cast(in1, dtype, str.c_str());
     ele = new Layer(this,
                     op,
                     dtype,
@@ -58,8 +61,11 @@ Tensor FFModel::binary(OperatorType op,
                     in2);
   } else if (in1->data_type > in2->data_type) {
     dtype = in1->data_type;
-    std::string str(name);
-    Tensor new_in2 = cast(in2, dtype, (str + "input2_pre_cast").c_str());
+    std::string str;
+    if (name != nullptr) {
+      str = std::string(name) + "input2_pre_cast";
+    }
+    Tensor new_in2 = cast(in2, dtype, str.c_str());
     ele = new Layer(this,
                     op,
                     dtype,
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index b6be945a94..adb8d9d706 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -347,6 +347,90 @@ FutureMap InferenceManager::inference(FFModel *model,
   return fm;
 };
 
+void InferenceManager::incr_decoding_loop(FFModel *model,
+                                          RequestManager &rm,
+                                          int total_num_requests) {
+  BatchConfig bc;
+  InferenceResult ir;
+  while (rm.get_num_processed_requests() < total_num_requests) {
+    bc = rm.prepare_next_batch(bc, ir);
+    if (rm.get_num_processed_requests() >= total_num_requests) {
+      break;
+    }
+    FutureMap fm = inference(model, 0, bc);
+    assert(fm.get_future_map_domain().get_volume() == 1);
+    Future future = fm.get_future(0);
+    ir = future.get_result<InferenceResult>();
+    // assert(false);
+  }
+}
+
+void InferenceManager::spec_inference_loop(FFModel *model,
+                                           RequestManager &rm,
+                                           int total_num_requests,
+                                           std::vector<int> ssm_model_ids) {
+  TreeVerifyBatchConfig tree_bc;
+  BeamSearchBatchConfig beam_bc;
+  std::vector<BeamSearchBatchConfig> beam_bc_vec;
+  int num_ssms = ssm_model_ids.size();
+  for (int ssm_id = 0; ssm_id < num_ssms; ssm_id++) {
+    beam_bc_vec.push_back(BeamSearchBatchConfig(ssm_model_ids[ssm_id]));
+  }
+
+  InferenceResult tree_ir;
+
+  while (rm.get_num_processed_requests() < total_num_requests) {
+    int depth = 0;
+    // Beam Search
+    beam_bc = rm.prepare_next_batch_init(tree_bc, tree_ir, 0);
+    for (int ssm_id = 0; ssm_id < num_ssms; ssm_id++) {
+      beam_bc_vec[ssm_id] = beam_bc;
+      beam_bc_vec[ssm_id].model_id = ssm_id;
+    }
+
+    if (rm.get_num_processed_requests() >= total_num_requests) {
+      break;
+    }
+
+    for (int i = 0; i < num_ssms; i++) {
+      while (true) {
+        beam_bc = beam_bc_vec[i];
+        depth = beam_bc.beamRequestsInfo[0].current_depth;
+
+        FutureMap fm = inference(rm.get_model(0), 0, beam_bc_vec[i]);
+        assert(fm.get_future_map_domain().get_volume() == 1);
+        Future future = fm.get_future(0);
+        BeamInferenceResult beam_ir = future.get_result<BeamInferenceResult>();
+
+        int iteration =
+            std::min(BeamSearchBatchConfig::MAX_BEAM_DEPTH,
+                     BatchConfig::MAX_SEQ_LENGTH - beam_bc.max_init_length);
+
+        if (depth - 1 >= iteration) {
+          break;
+        } else {
+          beam_bc_vec[i] = rm.prepare_next_batch_beam(beam_bc_vec[i], beam_ir);
+          if (beam_bc_vec[i].num_active_tokens() == 0 &&
+              beam_bc_vec[i].num_active_requests() != 0) {
+            break;
+          }
+        }
+      }
+      std::cout << "----------beam search finished for model "
+                << beam_bc_vec[i].model_id << "------------" << std::endl;
+    }
+    // Token Tree Verification
+    {
+      tree_bc = rm.prepare_next_batch_verify(beam_bc_vec);
+      FutureMap fm = inference(model, 0, tree_bc);
+
+      assert(fm.get_future_map_domain().get_volume() == 1);
+      Future future = fm.get_future(0);
+      tree_ir = future.get_result<InferenceResult>();
+    }
+  }
+}
+
 void InferenceManager::load_input_tokens_from_batch_config(
     BatchConfig const &bc, ParallelTensor const input) {
   Context ctx = ff_config.lg_ctx;

From aef158aec228fa91b8b62d7ac0092785f90dabb2 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 27 Jul 2023 02:10:54 -0400
Subject: [PATCH 181/344] Fix fusion bug (#889)

---
 src/ops/fused.cu         | 12 ++++++++----
 tests/inference_tests.sh |  4 ++++
 2 files changed, 12 insertions(+), 4 deletions(-)

diff --git a/src/ops/fused.cu b/src/ops/fused.cu
index ef6c856871..02a4995b0f 100644
--- a/src/ops/fused.cu
+++ b/src/ops/fused.cu
@@ -235,13 +235,15 @@ __host__ void FusedOp::forward_task(Task const *task,
                out_dim * batch_size);
         assert(my_input_accessor[0].domain.get_volume() == in_dim * batch_size);
         float const *bias_ptr = nullptr;
+        LinearMeta *m = (LinearMeta *)metas->meta[op];
         if (fused->op_num_weights[op] == 2) {
           assert(my_weight_accessor[1].domain.get_volume() == out_dim);
-          bias_ptr = my_weight_accessor[1].get_float_ptr();
+          if (!m->add_bias_only_once || task->index_point.point_data[0] == 0) {
+            bias_ptr = my_weight_accessor[1].get_float_ptr();
+          }
         } else {
           assert(fused->op_num_weights[op] == 1);
         }
-        LinearMeta *m = (LinearMeta *)metas->meta[op];
         Kernels::Linear::forward_kernel_wrapper(
             m,
             my_input_accessor[0].get_float_ptr(),
@@ -604,13 +606,15 @@ __host__ void
                out_dim * batch_size);
         assert(my_input_accessor[0].domain.get_volume() == in_dim * batch_size);
         void const *bias_ptr = nullptr;
+        LinearMeta *m = (LinearMeta *)metas->meta[op];
         if (fused->op_num_weights[op] == 2) {
           assert(my_weight_accessor[1].domain.get_volume() == out_dim);
-          bias_ptr = my_weight_accessor[1].ptr;
+          if (!m->add_bias_only_once || task->index_point.point_data[0] == 0) {
+            bias_ptr = my_weight_accessor[1].ptr;
+          }
         } else {
           assert(fused->op_num_weights[op] == 1);
         }
-        LinearMeta *m = (LinearMeta *)metas->meta[op];
         assert(m->input_type[0] == my_input_accessor[0].data_type);
         assert(m->input_type[0] == my_output_accessor[0].data_type);
         batch_size = bc->num_active_tokens();
diff --git a/tests/inference_tests.sh b/tests/inference_tests.sh
index f50d374633..8616bb845e 100755
--- a/tests/inference_tests.sh
+++ b/tests/inference_tests.sh
@@ -87,8 +87,10 @@ fi
 if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
     # LLAMA (small model)
     ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_160M_weights/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_160M_weights/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
     # LLAMA (small model, half precision)
     ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_160M_weights_half/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_160M_weights_half/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M_half_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
 
     # LLAMA (big model)
     ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_7B_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
@@ -97,8 +99,10 @@ if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
 
     # OPT (small model)
     ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_125M_weights/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_125M_weights/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
     # OPT (small model, half precision)
     ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_125M_weights_half/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_125M_weights_half/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M_half_tp.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
 
     # OPT (big model)
     ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_6B_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2

From 6b7e6f0ca158bb33685e6ed2fd77b9e867c2ab53 Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Thu, 27 Jul 2023 14:36:09 -0400
Subject: [PATCH 182/344] Inference: add argmax operator (#888)

* add argmax operator

* support spec infer.

* format

* remove redundant

* half precision

* fix

* fix

* hip_rocm
---
 include/flexflow/ffconst.h           |   1 +
 include/flexflow/model.h             |   7 +
 include/flexflow/operator_params.h   |   2 +
 include/flexflow/ops/argmax.h        | 109 +++++++
 include/flexflow/ops/argmax_params.h |  24 ++
 inference/models/llama.cc            |   6 +-
 inference/models/opt.cc              |   6 +-
 src/ops/argmax.cc                    | 442 +++++++++++++++++++++++++++
 src/ops/argmax.cpp                   |  69 +++++
 src/ops/argmax.cu                    | 151 +++++++++
 src/runtime/cuda_helper.cu           |   1 +
 src/runtime/ffconst_utils.cc         |   2 +
 src/runtime/graph.cc                 |   5 +
 src/runtime/model.cc                 |  59 +++-
 src/runtime/operator_params.cc       |   3 +
 15 files changed, 882 insertions(+), 5 deletions(-)
 create mode 100644 include/flexflow/ops/argmax.h
 create mode 100644 include/flexflow/ops/argmax_params.h
 create mode 100644 src/ops/argmax.cc
 create mode 100644 src/ops/argmax.cpp
 create mode 100644 src/ops/argmax.cu

diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index 65fa23569b..7521613477 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -163,6 +163,7 @@ enum OperatorType {
   OP_GATHER, // https://pytorch.org/docs/stable/generated/torch.gather.html
   OP_RMS_NORM,
   OP_BEAM_TOPK,
+  OP_ARGMAX,
   OP_INC_MULTIHEAD_SELF_ATTENTION,
   OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION,
   OP_TREE_INC_MULTIHEAD_SELF_ATTENTION,
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index a95c229a08..0e98b6e8ad 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -138,6 +138,9 @@ enum TaskIDs {
   ARG_TOPK_INF_TASK_ID,
   SAMPLING_INIT_TASK_ID,
   SAMPLING_INF_TASK_ID,
+  ARGMAX_INIT_TASK_ID,
+  ARGMAX_BEAM_INF_TASK_ID,
+  ARGMAX_NORM_INF_TASK_ID,
   TRANSPOSE_INIT_TASK_ID,
   TRANSPOSE_FWD_TASK_ID,
   TRANSPOSE_BWD_TASK_ID,
@@ -315,6 +318,7 @@ class BeamTopK;
 class SpecIncMultiHeadSelfAttention;
 class IncMultiQuerySelfAttention;
 class Sampling;
+class ArgMax;
 class Combine;
 class Repartition;
 class Reduction;
@@ -615,6 +619,7 @@ class FFModel {
                    int k,
                    bool sorted,
                    char const *name = NULL);
+  Tensor argmax(const Tensor input, bool beam_search, char const *name = NULL);
   Tensor sampling(const Tensor input, float top_p, char const *name = NULL);
   Tensor multihead_attention(const Tensor query,
                              const Tensor key,
@@ -1067,6 +1072,8 @@ class FFModel {
                          BeamTopK *>,
       std::unordered_map<std::pair<ParallelTensorShape, SamplingParams>,
                          Sampling *>,
+      std::unordered_map<std::pair<ParallelTensorShape, ArgMaxParams>,
+                         ArgMax *>,
       std::unordered_map<
           std::pair<ParallelTensorShape, SpecIncMultiHeadSelfAttentionParams>,
           SpecIncMultiHeadSelfAttention *>,
diff --git a/include/flexflow/operator_params.h b/include/flexflow/operator_params.h
index 5c2101d190..982d5482a0 100644
--- a/include/flexflow/operator_params.h
+++ b/include/flexflow/operator_params.h
@@ -4,6 +4,7 @@
 #include "flexflow/ops/aggregate_params.h"
 #include "flexflow/ops/aggregate_spec_params.h"
 #include "flexflow/ops/arg_topk_params.h"
+#include "flexflow/ops/argmax_params.h"
 #include "flexflow/ops/attention_params.h"
 #include "flexflow/ops/batch_matmul_params.h"
 #include "flexflow/ops/beam_topk_params.h"
@@ -73,6 +74,7 @@ using OperatorParameters = mp::variant<AggregateParams,
                                        TopKParams,
                                        ArgTopKParams,
                                        SamplingParams,
+                                       ArgMaxParams,
                                        SoftmaxParams,
                                        TransposeParams,
                                        RepartitionParams,
diff --git a/include/flexflow/ops/argmax.h b/include/flexflow/ops/argmax.h
new file mode 100644
index 0000000000..d6d15f2a3c
--- /dev/null
+++ b/include/flexflow/ops/argmax.h
@@ -0,0 +1,109 @@
+#ifndef _FLEXFLOW_ARG_MAX_H_
+#define _FLEXFLOW_ARG_MAX_H_
+
+#include "flexflow/inference.h"
+#include "flexflow/model.h"
+#include "flexflow/node.h"
+#include "flexflow/ops/argmax_params.h"
+
+namespace FlexFlow {
+
+class ArgMaxMeta : public OpMeta {
+public:
+  bool beam_search;
+  float *probs;
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+  cudnnTensorDescriptor_t inputTensor, outputTensor;
+  cudnnReduceTensorDescriptor_t reduceMaxDesc;
+#else
+  miopenTensorDescriptor_t inputTensor, outputTensor;
+  miopenReduceTensorDescriptor_t reduceMaxDesc;
+#endif
+  ArgMaxMeta(FFHandler handler,
+             Op const *op,
+             Legion::Domain const &input_domain,
+             Legion::Domain const &output_domain,
+             GenericTensorAccessorW input);
+};
+
+class ArgMax : public Op {
+public:
+  using Params = ArgMaxParams;
+  using Input = ParallelTensor;
+  ArgMax(FFModel &model,
+         const ParallelTensor input,
+         bool beam_search,
+         char const *name);
+  ArgMax(FFModel &model, ArgMax const &other, const ParallelTensor input);
+  ArgMax(FFModel &model,
+         Params const &params,
+         Input const input,
+         char const *name = nullptr);
+  void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
+  void forward(FFModel const &) override;
+  void backward(FFModel const &) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfig const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
+  void print_layer(FFModel const &model) override {
+    assert(0);
+  }
+  static Op *
+      create_operator_from_layer(FFModel &model,
+                                 Layer const *layer,
+                                 std::vector<ParallelTensor> const &inputs);
+
+  static OpMeta *init_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static BeamInferenceResult
+      inference_task_beam(Legion::Task const *task,
+                          std::vector<Legion::PhysicalRegion> const &regions,
+                          Legion::Context ctx,
+                          Legion::Runtime *runtime);
+  static InferenceResult
+      inference_task_norm(Legion::Task const *task,
+                          std::vector<Legion::PhysicalRegion> const &regions,
+                          Legion::Context ctx,
+                          Legion::Runtime *runtime);
+  void serialize(Legion::Serializer &s) const override;
+  static PCG::Node deserialize(FFModel &ff,
+                               Legion::Deserializer &d,
+                               ParallelTensor inputs[],
+                               int num_inputs);
+  Op *materialize(FFModel &ff,
+                  ParallelTensor inputs[],
+                  int num_inputs) const override;
+  bool measure_operator_cost(Simulator *sim,
+                             MachineView const &pc,
+                             CostMetrics &cost_metrics) const override;
+  template <typename DT>
+  static void forward_kernel(ArgMaxMeta const *m,
+                             DT *input_ptr,
+                             int *indices_ptr,
+                             DT *prob_ptr,
+                             int *parent_ptr,
+                             int length,
+                             int batch_size,
+                             ffStream_t stream);
+  static void forward_kernel_wrapper(ArgMaxMeta const *m,
+                                     GenericTensorAccessorW const &input,
+                                     GenericTensorAccessorW const &indices,
+                                     GenericTensorAccessorW const &value,
+                                     GenericTensorAccessorW const &parent);
+  Params get_params() const;
+
+public:
+  bool beam_search;
+};
+
+}; // namespace FlexFlow
+
+#endif
\ No newline at end of file
diff --git a/include/flexflow/ops/argmax_params.h b/include/flexflow/ops/argmax_params.h
new file mode 100644
index 0000000000..a8f629619f
--- /dev/null
+++ b/include/flexflow/ops/argmax_params.h
@@ -0,0 +1,24 @@
+#ifndef _FLEXFLOW_ARGMAX_PARAMS_H
+#define _FLEXFLOW_ARGMAX_PARAMS_H
+
+#include "flexflow/ffconst.h"
+#include "flexflow/parallel_tensor.h"
+
+namespace FlexFlow {
+
+struct ArgMaxParams {
+  bool beam_search;
+  bool is_valid(ParallelTensorShape const &) const;
+};
+bool operator==(ArgMaxParams const &, ArgMaxParams const &);
+
+} // namespace FlexFlow
+
+namespace std {
+template <>
+struct hash<FlexFlow::ArgMaxParams> {
+  size_t operator()(FlexFlow::ArgMaxParams const &) const;
+};
+} // namespace std
+
+#endif // _FLEXFLOW_ARGMAX_PARAMS_H
\ No newline at end of file
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index 588d6d264c..e4cd54192d 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -176,7 +176,8 @@ void LLAMA::create_llama_model(FFModel &ff,
   Tensor output;
   if (mode == BEAM_SEARCH_MODE) {
     Tensor softmax = ff.softmax(dense, -1);
-    output = ff.beam_top_k(softmax, llama_config.max_beam_width, false);
+    // output = ff.beam_top_k(softmax, llama_config.max_beam_width, false);
+    output = ff.argmax(softmax, /*beam_Search*/ true);
   } else {
     // Tensor softmax = ff.softmax(dense, -1);
     if (samplingConfig.do_sample) {
@@ -184,7 +185,8 @@ void LLAMA::create_llama_model(FFModel &ff,
       Tensor softmax = ff.softmax(dense, -1);
       output = ff.sampling(softmax, samplingConfig.topp);
     } else {
-      output = ff.arg_top_k(dense, /*k=*/1, false);
+      // output = ff.arg_top_k(dense, /*k=*/1, false);
+      output = ff.argmax(dense, /*beam_Search*/ false);
     }
   }
 
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index 94aeb7f2bd..05cee2bf9d 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -215,9 +215,11 @@ void OPT::create_opt_model(FFModel &ff,
   Tensor output;
   if (mode == BEAM_SEARCH_MODE) {
     Tensor softmax = ff.softmax(lm_head, -1);
-    output = ff.beam_top_k(softmax, opt_config.max_beam_width, false);
+    // output = ff.beam_top_k(softmax, opt_config.max_beam_width, false);
+    output = ff.argmax(softmax, /*beam_Search*/ true);
   } else {
-    output = ff.arg_top_k(lm_head, /*k=*/1, false);
+    // output = ff.arg_top_k(lm_head, /*k=*/1, false);
+    output = ff.argmax(lm_head, /*beam_Search*/ false);
   }
 
   //------------------- compile the model --------------------------------
diff --git a/src/ops/argmax.cc b/src/ops/argmax.cc
new file mode 100644
index 0000000000..754337448e
--- /dev/null
+++ b/src/ops/argmax.cc
@@ -0,0 +1,442 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/argmax.h"
+#include "flexflow/model.h"
+#include "flexflow/utils/hash_utils.h"
+#include "legion/legion_utilities.h"
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+#include "flexflow/utils/cuda_helper.h"
+#else
+#include "flexflow/utils/hip_helper.h"
+#endif
+
+namespace FlexFlow {
+// declare Legion names
+using Legion::ArgumentMap;
+using Legion::Context;
+using Legion::coord_t;
+using Legion::Domain;
+using Legion::FutureMap;
+using Legion::IndexLauncher;
+using Legion::InlineLauncher;
+using Legion::Machine;
+using Legion::Memory;
+using Legion::PhysicalRegion;
+using Legion::Predicate;
+using Legion::Rect;
+using Legion::RegionRequirement;
+using Legion::Runtime;
+using Legion::Task;
+using Legion::TaskArgument;
+using Legion::TaskLauncher;
+using PCG::Node;
+
+Tensor FFModel::argmax(const Tensor input, bool beam_search, char const *name) {
+  Layer *li = new Layer(this,
+                        OP_ARGMAX,
+                        input->data_type,
+                        name,
+                        1 /*inputs*/,
+                        0 /*weights*/,
+                        beam_search ? 3 : 2 /*outputs*/,
+                        input);
+  {
+    int numdims = input->num_dims;
+    int dims[MAX_TENSOR_DIM];
+    for (int i = 0; i < numdims; i++) {
+      dims[i] = input->dims[i];
+    }
+    // now just support 1 output
+    dims[0] = 1;
+    // li->outputs[0] = create_tensor_legion_ordering(
+    //     numdims, dims, input->data_type, li, 0, true /*create_grad*/);
+    li->outputs[0] = create_tensor_legion_ordering(
+        numdims, dims, DT_INT32, li, 0, false /*create_grad*/);
+    // logits
+    li->outputs[1] = create_tensor_legion_ordering(
+        numdims, dims, input->data_type, li, 1, false /*create_grad*/);
+
+    if (beam_search) {
+      // parent id
+      li->outputs[2] = create_tensor_legion_ordering(
+          numdims, dims, DT_INT32, li, 1, false /*create_grad*/);
+    }
+  }
+  li->add_int_property("beam_search", beam_search);
+  layers.push_back(li);
+  // outputs[0] = li->outputs[0];
+  // outputs[1] = li->outputs[1];
+  return li->outputs[0];
+}
+
+Op *ArgMax::create_operator_from_layer(
+    FFModel &model,
+    Layer const *layer,
+    std::vector<ParallelTensor> const &inputs) {
+  long long value;
+  layer->get_int_property("beam_search", value);
+  bool beam_search = (bool)value;
+  return new ArgMax(model, inputs[0], beam_search, layer->name);
+}
+
+ArgMaxParams ArgMax::get_params() const {
+  ArgMaxParams params;
+  params.beam_search = this->beam_search;
+  return params;
+}
+
+bool ArgMaxParams::is_valid(ParallelTensorShape const &) const {
+  return true;
+}
+
+bool operator==(ArgMaxParams const &lhs, ArgMaxParams const &rhs) {
+  return lhs.beam_search == rhs.beam_search;
+}
+
+ArgMax::ArgMax(FFModel &model,
+               const ParallelTensor _input,
+               bool _beam_search,
+               char const *name)
+    : Op(model,
+         OP_ARGMAX,
+         _input->data_type,
+         name,
+         1 /*inputs*/,
+         0 /*weights*/,
+         _beam_search ? 3 : 2 /*outputs*/,
+         _input),
+      beam_search(_beam_search) {
+  int numdim = inputs[0]->num_dims;
+  ParallelDim dims[MAX_TENSOR_DIM];
+  for (int i = 0; i < numdim; i++) {
+    dims[i] = inputs[0]->dims[i];
+  }
+  dims[0].size = 1;
+  assert(inputs[0]->dims[0].degree == 1);
+  assert(inputs[0]->dims[0].parallel_idx == -1);
+  //   outputs[0] = model.create_parallel_tensor_legion_ordering(
+  //       numdim, dims, _input->data_type, this, 0 /*owner_idx*/);
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      numdim, dims, DT_INT32, this, 0 /*owner_idx*/);
+  outputs[1] = model.create_parallel_tensor_legion_ordering(
+      numdim, dims, _input->data_type, this, 1 /*owner_idx*/);
+  if (_beam_search) {
+    outputs[2] = model.create_parallel_tensor_legion_ordering(
+        numdim, dims, DT_INT32, this, 2 /*owner_idx*/);
+  }
+}
+
+ArgMax::ArgMax(FFModel &model, ArgMax const &other, const ParallelTensor input)
+    : ArgMax(model, input, other.beam_search, other.name) {}
+
+ArgMax::ArgMax(FFModel &model,
+               ArgMaxParams const &params,
+               const ParallelTensor input,
+               char const *name)
+    : ArgMax(model, input, params.beam_search, name) {}
+
+void ArgMax::init_inference(FFModel const &ff,
+                            std::vector<ParallelTensor> const &batch_inputs,
+                            std::vector<ParallelTensor> const &batch_outputs,
+                            MachineView const *mv) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher launcher(ARGMAX_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(ArgMax)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[1]->region));
+  launcher.add_field(2, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
+}
+
+void ArgMax::init(FFModel const &ff) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(ARGMAX_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(ArgMax)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
+OpMeta *ArgMax::init_task(Task const *task,
+                          std::vector<PhysicalRegion> const &regions,
+                          Context ctx,
+                          Runtime *runtime) {
+  ArgMax *s = (ArgMax *)task->args;
+  FFHandler handle = *((FFHandler *)task->local_args);
+  GenericTensorAccessorW acc_input =
+      helperGetGenericTensorAccessorRW(s->inputs[0]->data_type,
+                                       regions[0],
+                                       task->regions[0],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  Domain input_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  Domain output_domain = runtime->get_index_space_domain(
+      ctx, task->regions[2].region.get_index_space());
+
+  ArgMaxMeta *m =
+      new ArgMaxMeta(handle, s, input_domain, output_domain, acc_input);
+  m->profiling = s->profiling;
+  m->beam_search = s->beam_search;
+  return m;
+}
+
+void ArgMax::forward(FFModel const &ff) {
+  // ArgMax does not support forward
+  assert(false);
+}
+
+FutureMap ArgMax::inference(FFModel const &ff,
+                            BatchConfig const &bc,
+                            std::vector<ParallelTensor> const &batch_inputs,
+                            std::vector<ParallelTensor> const &batch_outputs,
+                            MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+  /* std::cout << "ArgMax op machine_view: " << *(MachineView const *)mv
+            << std::endl; */
+  if (beam_search) {
+    IndexLauncher launcher(ARGMAX_BEAM_INF_TASK_ID,
+                           parallel_is,
+                           TaskArgument(&bc, sizeof(BatchConfig)),
+                           argmap,
+                           Predicate::TRUE_PRED,
+                           false /*must*/,
+                           0 /*mapper_id*/,
+                           machine_view_hash);
+    launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                      0 /*projection id*/,
+                                                      READ_WRITE,
+                                                      EXCLUSIVE,
+                                                      batch_inputs[0]->region));
+    launcher.add_field(0, FID_DATA);
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[0]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[0]->region));
+    launcher.add_field(1, FID_DATA);
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[1]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[1]->region));
+    launcher.add_field(2, FID_DATA);
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[2]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[2]->region));
+    launcher.add_field(3, FID_DATA);
+    return runtime->execute_index_space(ctx, launcher);
+  } else {
+    IndexLauncher launcher(ARGMAX_NORM_INF_TASK_ID,
+                           parallel_is,
+                           TaskArgument(&bc, sizeof(BatchConfig)),
+                           argmap,
+                           Predicate::TRUE_PRED,
+                           false /*must*/,
+                           0 /*mapper_id*/,
+                           machine_view_hash);
+    launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                      0 /*projection id*/,
+                                                      READ_WRITE,
+                                                      EXCLUSIVE,
+                                                      batch_inputs[0]->region));
+    launcher.add_field(0, FID_DATA);
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[0]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[0]->region));
+    launcher.add_field(1, FID_DATA);
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[1]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[1]->region));
+    launcher.add_field(2, FID_DATA);
+    return runtime->execute_index_space(ctx, launcher);
+  }
+}
+
+BeamInferenceResult
+    ArgMax::inference_task_beam(Task const *task,
+                                std::vector<PhysicalRegion> const &regions,
+                                Context ctx,
+                                Runtime *runtime) {
+  assert(regions.size() == 4);
+  assert(task->regions.size() == 4);
+  BatchConfig const *bc = (BatchConfig *)task->args;
+  ArgMaxMeta const *m = *((ArgMaxMeta **)task->local_args);
+
+  GenericTensorAccessorW input = helperGetGenericTensorAccessorRW(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW indices = helperGetGenericTensorAccessorWO(
+      DT_INT32, regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  int batch_size = bc->num_active_tokens();
+  GenericTensorAccessorW value = helperGetGenericTensorAccessorWO(
+      m->input_type[0], regions[2], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW parent = helperGetGenericTensorAccessorWO(
+      DT_INT32, regions[3], task->regions[1], FID_DATA, ctx, runtime);
+  ArgMax::forward_kernel_wrapper(m, input, indices, value, parent);
+
+  BeamInferenceResult ir;
+  download_tensor<BatchConfig::TokenId>(
+      indices.get_int32_ptr(), ir.token_ids, batch_size);
+  if (m->input_type[0] == DT_FLOAT) {
+    download_tensor<float>(value.get_float_ptr(), ir.probs, batch_size);
+  } else if (m->input_type[0] == DT_HALF) {
+    download_tensor(m->probs, ir.probs, batch_size);
+  }
+
+  download_tensor<int>(parent.get_int32_ptr(), ir.parent_id, batch_size);
+  return ir;
+}
+
+InferenceResult
+    ArgMax::inference_task_norm(Task const *task,
+                                std::vector<PhysicalRegion> const &regions,
+                                Context ctx,
+                                Runtime *runtime) {
+  assert(regions.size() == 3);
+  assert(task->regions.size() == 3);
+  BatchConfig const *bc = (BatchConfig *)task->args;
+  ArgMaxMeta const *m = *((ArgMaxMeta **)task->local_args);
+
+  GenericTensorAccessorW input = helperGetGenericTensorAccessorRW(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW indices = helperGetGenericTensorAccessorWO(
+      DT_INT32, regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW value = helperGetGenericTensorAccessorWO(
+      m->input_type[0], regions[2], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW parent;
+  int batch_size = bc->num_active_tokens();
+  ArgMax::forward_kernel_wrapper(m, input, indices, value, parent);
+  InferenceResult ir;
+  download_tensor<BatchConfig::TokenId>(
+      indices.get_int32_ptr(), ir.token_ids, batch_size);
+  return ir;
+}
+
+void ArgMax::backward(FFModel const &ff) {
+  // ArgMax does not support backward
+  assert(false);
+}
+
+void ArgMax::serialize(Legion::Serializer &sez) const {
+  sez.serialize(this->beam_search);
+}
+
+Node ArgMax::deserialize(FFModel &ff,
+                         Legion::Deserializer &dez,
+                         ParallelTensor inputs[],
+                         int num_inputs) {
+  assert(num_inputs == 1);
+  bool beam_search;
+  dez.deserialize(beam_search);
+  ArgMaxParams params;
+  params.beam_search = beam_search;
+  return ff.get_or_create_node<ArgMax>(inputs[0], params);
+}
+
+Op *ArgMax::materialize(FFModel &ff,
+                        ParallelTensor inputs[],
+                        int num_inputs) const {
+  ArgMaxParams params = get_params();
+  return new ArgMax(ff, params, inputs[0], this->name);
+}
+
+bool ArgMax::measure_operator_cost(Simulator *sim,
+                                   MachineView const &mv,
+                                   CostMetrics &cost_metrics) const {
+  return false;
+}
+
+}; // namespace FlexFlow
+
+namespace std {
+size_t hash<FlexFlow::ArgMaxParams>::operator()(
+    FlexFlow::ArgMaxParams const &params) const {
+  size_t key = 0;
+  hash_combine(key, params.beam_search);
+  return key;
+}
+}; // namespace std
\ No newline at end of file
diff --git a/src/ops/argmax.cpp b/src/ops/argmax.cpp
new file mode 100644
index 0000000000..1395a1cdeb
--- /dev/null
+++ b/src/ops/argmax.cpp
@@ -0,0 +1,69 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/argmax.h"
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/utils/hip_helper.h"
+#include <hip/hip_runtime.h>
+
+namespace FlexFlow {
+
+/*static*/
+template <typename DT>
+void ArgMax::forward_kernel(ArgMaxMeta const *m,
+                            DT *input_ptr,
+                            int *indices_ptr,
+                            DT *prob_ptr,
+                            int *parent_ptr,
+                            int length,
+                            int batch_size,
+                            ffStream_t stream) {}
+
+/*static*/
+void ArgMax::forward_kernel_wrapper(ArgMaxMeta const *m,
+                                    GenericTensorAccessorW const &input,
+                                    GenericTensorAccessorW const &indices,
+                                    GenericTensorAccessorW const &value,
+                                    GenericTensorAccessorW const &parent) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    hipEventCreate(&t_start);
+    hipEventCreate(&t_end);
+    hipEventRecord(t_start, stream);
+  }
+
+  handle_unimplemented_hip_kernel(OP_RMS_NORM);
+
+  if (m->profiling) {
+    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    hipEventDestroy(t_start);
+    hipEventDestroy(t_end);
+  }
+}
+
+ArgMaxMeta::ArgMaxMeta(FFHandler handler,
+                       Op const *op,
+                       Legion::Domain const &input_domain,
+                       Legion::Domain const &output_domain,
+                       GenericTensorAccessorW input)
+    : OpMeta(handler, op) {}
+
+}; // namespace FlexFlow
\ No newline at end of file
diff --git a/src/ops/argmax.cu b/src/ops/argmax.cu
new file mode 100644
index 0000000000..99487ea380
--- /dev/null
+++ b/src/ops/argmax.cu
@@ -0,0 +1,151 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/ops/argmax.h"
+#include "flexflow/utils/cuda_helper.h"
+
+namespace FlexFlow {
+
+__global__ void
+    half_2_float_array(half *ptr, float *ptr_f, int num_of_elements) {
+  CUDA_KERNEL_LOOP(i, num_of_elements) {
+    ptr_f[i] = __half2float(ptr[i]);
+  }
+}
+
+/*static*/
+template <typename DT>
+void ArgMax::forward_kernel(ArgMaxMeta const *m,
+                            DT *input_ptr,
+                            int *indices_ptr,
+                            DT *prob_ptr,
+                            int *parent,
+                            int const length,
+                            int const batch_size,
+                            cudaStream_t stream) {
+
+  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
+  DT alpha = 1.0f, beta = 0.0f;
+  if (m->beam_search) {
+    // set all parents id zero in arg top1 case.
+    checkCUDA(cudaMemset(parent, 0, batch_size * sizeof(int)));
+  }
+  checkCUDNN(cudnnReduceTensor(m->handle.dnn,
+                               m->reduceMaxDesc,
+                               indices_ptr /*indices*/,
+                               batch_size * sizeof(int) /*indicesSizeInBytes*/,
+                               m->handle.workSpace,
+                               m->handle.workSpaceSize,
+                               &alpha,
+                               m->inputTensor,
+                               input_ptr,
+                               &beta,
+                               m->outputTensor,
+                               prob_ptr));
+}
+
+/*static*/
+void ArgMax::forward_kernel_wrapper(ArgMaxMeta const *m,
+                                    GenericTensorAccessorW const &input,
+                                    GenericTensorAccessorW const &indices,
+                                    GenericTensorAccessorW const &value,
+                                    GenericTensorAccessorW const &parent) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+  int length = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+  int batch_size = input.domain.get_volume() / length;
+
+  if (input.data_type == DT_HALF) {
+    ArgMax::forward_kernel<half>(m,
+                                 input.get_half_ptr(),
+                                 indices.get_int32_ptr(),
+                                 value.get_half_ptr(),
+                                 m->beam_search ? parent.get_int32_ptr()
+                                                : nullptr,
+                                 length,
+                                 batch_size,
+                                 stream);
+    if (m->beam_search) {
+      half_2_float_array<<<GET_BLOCKS(batch_size),
+                           CUDA_NUM_THREADS,
+                           0,
+                           stream>>>(
+          value.get_half_ptr(), m->probs, batch_size);
+    }
+
+  } else if (input.data_type == DT_FLOAT) {
+    ArgMax::forward_kernel<float>(m,
+                                  input.get_float_ptr(),
+                                  indices.get_int32_ptr(),
+                                  value.get_float_ptr(),
+                                  m->beam_search ? parent.get_int32_ptr()
+                                                 : nullptr,
+                                  length,
+                                  batch_size,
+                                  stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[ArgMax] forward time = %.2lfms\n", elapsed);
+  }
+}
+
+ArgMaxMeta::ArgMaxMeta(FFHandler handler,
+                       Op const *op,
+                       Legion::Domain const &input_domain,
+                       Legion::Domain const &output_domain,
+                       GenericTensorAccessorW input)
+    : OpMeta(handler, op) {
+  DataType data_type = op->data_type;
+  checkCUDNN(cudnnCreateTensorDescriptor(&inputTensor));
+  checkCUDNN(cudnnCreateTensorDescriptor(&outputTensor));
+  checkCUDNN(cudnnCreateReduceTensorDescriptor(&reduceMaxDesc));
+
+  // Float and Half use save type, according to
+  // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#cudnnReduceTensor:~:text=not%20coordinate%20tuples.-,The%20data%20types%20of%20the%20tensors,.,-Note%3A
+  cudnnDataType_t cudnn_data_type = CUDNN_DATA_FLOAT;
+
+  checkCUDNN(
+      cudnnSetReduceTensorDescriptor(reduceMaxDesc,
+                                     CUDNN_REDUCE_TENSOR_MAX,
+                                     cudnn_data_type,
+                                     CUDNN_PROPAGATE_NAN,
+                                     CUDNN_REDUCE_TENSOR_FLATTENED_INDICES,
+                                     CUDNN_32BIT_INDICES));
+  checkCUDNN(cudnnSetTensorDescriptorFromDomain(
+      outputTensor, output_domain, data_type));
+  checkCUDNN(
+      cudnnSetTensorDescriptorFromDomain(inputTensor, input_domain, data_type));
+
+  checkCUDA(cudaMalloc(&probs, sizeof(float) * BatchConfig::MAX_NUM_TOKENS));
+}
+
+}; // namespace FlexFlow
\ No newline at end of file
diff --git a/src/runtime/cuda_helper.cu b/src/runtime/cuda_helper.cu
index dff5157a8a..da22a245f1 100644
--- a/src/runtime/cuda_helper.cu
+++ b/src/runtime/cuda_helper.cu
@@ -219,6 +219,7 @@ __host__ void
                           cudaHostAllocPortable | cudaHostAllocMapped));
   checkCUDA(cudaMemcpyAsync(
       host_ptr, ptr, sizeof(T) * num_elements, cudaMemcpyDeviceToHost, stream));
+  cudaDeviceSynchronize();
   int idx = 0;
   printf("%s", prefix);
   for (idx = 0; idx < num_elements; idx++) {
diff --git a/src/runtime/ffconst_utils.cc b/src/runtime/ffconst_utils.cc
index a777605daf..35ec59ce03 100644
--- a/src/runtime/ffconst_utils.cc
+++ b/src/runtime/ffconst_utils.cc
@@ -180,6 +180,8 @@ std::string get_operator_type_name(OperatorType type) {
       return "Identity";
     case OP_SAMPLING:
       return "Sampling";
+    case OP_ARGMAX:
+      return "ArgMax";
     // Parallel Ops
     case OP_REPARTITION:
       return "Repartition";
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index 16bccc25df..a82add4b62 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -17,6 +17,7 @@
 #include "flexflow/ffconst_utils.h"
 #include "flexflow/ops/aggregate.h"
 #include "flexflow/ops/arg_topk.h"
+#include "flexflow/ops/argmax.h"
 #include "flexflow/ops/attention.h"
 #include "flexflow/ops/batch_matmul.h"
 #include "flexflow/ops/beam_topk.h"
@@ -2924,6 +2925,10 @@ void FFModel::deserialize_graph_optimal_view(
         node = Sampling::deserialize(*this, dez, inputs, num_inputs);
         break;
       }
+      case OP_ARGMAX: {
+        node = ArgMax::deserialize(*this, dez, inputs, num_inputs);
+        break;
+      }
       case OP_GROUP_BY: {
         node = Group_by::deserialize(*this, dez, inputs, num_inputs);
         break;
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 22515a2bb0..66cad1f248 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -25,6 +25,7 @@
 #include "flexflow/ops/aggregate.h"
 #include "flexflow/ops/aggregate_spec.h"
 #include "flexflow/ops/arg_topk.h"
+#include "flexflow/ops/argmax.h"
 #include "flexflow/ops/attention.h"
 #include "flexflow/ops/batch_matmul.h"
 #include "flexflow/ops/batch_norm.h"
@@ -2943,6 +2944,11 @@ Op *FFModel::create_operator_from_layer(
       operators.push_back(op);
       return op;
     }
+    case OP_ARGMAX: {
+      Op *op = ArgMax::create_operator_from_layer(*this, layer, inputs);
+      operators.push_back(op);
+      return op;
+    }
     case OP_GROUP_BY: {
       Op *op = Group_by::create_operator_from_layer(*this, layer, inputs);
       operators.push_back(op);
@@ -2984,7 +2990,8 @@ void FFModel::create_operators_from_layers() {
     // add a combine before arg_topk
     if (config.computationMode == COMP_MODE_INFERENCE &&
         config.tensor_parallelism_degree > 1 &&
-        (l->op_type == OP_ARG_TOPK || l->op_type == OP_SOFTMAX)) {
+        (l->op_type == OP_ARG_TOPK || l->op_type == OP_SOFTMAX ||
+         l->op_type == OP_ARGMAX)) {
       std::vector<ParallelTensor> partitioned_inputs;
       assert(inputs.size() == 1);
       Combine *comb = new Combine(*this,
@@ -5444,6 +5451,56 @@ void register_flexflow_internal_tasks(Runtime *runtime,
           registrar);
     }
   }
+  // ArgMax task
+  {
+    TaskVariantRegistrar registrar(ARGMAX_INIT_TASK_ID, "ArgMax Init");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<OpMeta *, ArgMax::init_task>(
+          registrar, "ArgMax Init Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<OpMeta *, ArgMax::init_task>(registrar);
+    }
+  }
+  {
+    TaskVariantRegistrar registrar(ARGMAX_BEAM_INF_TASK_ID,
+                                   "ArgMax Beam Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<BeamInferenceResult,
+                                        ArgMax::inference_task_beam>(
+          registrar, "ArgMax Inference Task Beam");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<BeamInferenceResult,
+                                     ArgMax::inference_task_beam>(registrar);
+    }
+  }
+  {
+    TaskVariantRegistrar registrar(ARGMAX_NORM_INF_TASK_ID,
+                                   "ArgMax Norm Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<InferenceResult,
+                                        ArgMax::inference_task_norm>(
+          registrar, "ArgMax Inference Task Norm");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime
+          ->register_task_variant<InferenceResult, ArgMax::inference_task_norm>(
+              registrar);
+    }
+  }
   // Transpose task
   {
     TaskVariantRegistrar registrar(TRANSPOSE_INIT_TASK_ID, "Transpose Init");
diff --git a/src/runtime/operator_params.cc b/src/runtime/operator_params.cc
index 8fb8c89b10..bf817f5351 100644
--- a/src/runtime/operator_params.cc
+++ b/src/runtime/operator_params.cc
@@ -2,6 +2,7 @@
 #include "flexflow/ops/aggregate.h"
 #include "flexflow/ops/aggregate_spec.h"
 #include "flexflow/ops/arg_topk.h"
+#include "flexflow/ops/argmax.h"
 #include "flexflow/ops/attention.h"
 #include "flexflow/ops/batch_matmul.h"
 #include "flexflow/ops/batch_norm.h"
@@ -133,6 +134,8 @@ tl::optional<OperatorParameters> get_op_parameters(Op const *op) {
       return ((BeamTopK *)op)->get_params();
     case OP_SAMPLING:
       return ((Sampling *)op)->get_params();
+    case OP_ARGMAX:
+      return ((ArgMax *)op)->get_params();
 
       // TODO: implement the get_params() function for the operators below and
       // uncomment the lines below

From 821b32f25a19bfe51abdb6001dd3851cc3f1bdb7 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 27 Jul 2023 16:52:19 -0400
Subject: [PATCH 183/344] [Docker] - Make it easier to attach inference weights
 to docker (#891)

---
 docker/run.sh | 12 +++++++++++-
 1 file changed, 11 insertions(+), 1 deletion(-)

diff --git a/docker/run.sh b/docker/run.sh
index 307628f4fd..f326db0a6c 100755
--- a/docker/run.sh
+++ b/docker/run.sh
@@ -17,6 +17,9 @@ ATTACH_GPUS=${ATTACH_GPUS:-true}
 gpu_arg=""
 if $ATTACH_GPUS ; then gpu_arg="--gpus all" ; fi
 
+# Whether to attach inference weights / files (make sure to download the weights first)
+ATTACH_INFERENCE_FILES=${ATTACH_INFERENCE_FILES:-false}
+
 # Amount of shared memory to give the Docker container access to
 # If you get a Bus Error, increase this value. If you don't have enough memory
 # on your machine, decrease this value.
@@ -69,4 +72,11 @@ if [[ "$(docker images -q "$image"-"$FF_GPU_BACKEND""$cuda_version_hyphen":lates
   exit 1
 fi
 
-eval docker run -it "$gpu_arg" "--shm-size=${SHM_SIZE}" "${image}-${FF_GPU_BACKEND}${cuda_version_hyphen}:latest"
+inference_volumes=""
+if $ATTACH_INFERENCE_FILES ; then 
+  inference_volumes="-v $(pwd)/../inference/weights:/usr/FlexFlow/inference/weights \
+    -v $(pwd)/../inference/prompt:/usr/FlexFlow/inference/prompt \
+    -v $(pwd)/../inference/tokenizer:/usr/FlexFlow/inference/tokenizer"; 
+fi
+
+eval docker run -it "$gpu_arg" "--shm-size=${SHM_SIZE}" "${inference_volumes}" "${image}-${FF_GPU_BACKEND}${cuda_version_hyphen}:latest"

From bf0f30e9eae5d313b3164fb9bd7cb7e3b3f98167 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Thu, 27 Jul 2023 20:41:04 -0500
Subject: [PATCH 184/344] Make BatchConfig and InferenceResult Legion futures
 (#860)

* checkpoint

* format

* bug fixes

* fix python segfault

* fix python segfault 2

* fix build error

* compiled

* make inc_decoding work

* bug fix

* disable early stop

* fix future error

* Fix edge cases with specific prompt lengths.

* Discard long prompt request.

* fix

* include flexflow/accessor.h in the cuda_/hip_helper header files

* hip rocm fix

---------

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
Co-authored-by: Zeyu Wang <zwang86@huskers.unl.edu>
Co-authored-by: zwang86 <46699021+zwang86@users.noreply.github.com>
---
 config/config.linux                           |   2 +-
 examples/cpp/inference/dataloader.cu          |   1 +
 .../cpp/inference/mixture_of_experts/moe.cc   |   1 +
 .../inference/transformers/transformers.cc    |   1 +
 include/flexflow/batch_config.h               |  12 +-
 include/flexflow/inference.h                  | 167 +------
 include/flexflow/model.h                      |  10 +
 include/flexflow/operator.h                   |   2 +-
 include/flexflow/ops/aggregate.h              |   2 +-
 include/flexflow/ops/aggregate_spec.h         |   2 +-
 include/flexflow/ops/arg_topk.h               |   2 +-
 include/flexflow/ops/argmax.h                 |   2 +-
 include/flexflow/ops/attention.h              |   2 +-
 include/flexflow/ops/beam_topk.h              |   2 +-
 include/flexflow/ops/cast.h                   |   2 +-
 include/flexflow/ops/element_binary.h         |   2 +-
 include/flexflow/ops/element_unary.h          |   2 +-
 include/flexflow/ops/embedding.h              |   2 +-
 include/flexflow/ops/experts.h                |   2 +-
 include/flexflow/ops/fused.h                  |   2 +-
 include/flexflow/ops/groupby.h                |   2 +-
 .../ops/inc_multihead_self_attention.h        |   3 +-
 .../ops/inc_multiquery_self_attention.h       |   3 +-
 include/flexflow/ops/layer_norm.h             |   2 +-
 include/flexflow/ops/linear.h                 |   2 +-
 include/flexflow/ops/noop.h                   |   2 +-
 include/flexflow/ops/rms_norm.h               |   4 +-
 include/flexflow/ops/sampling.h               |   2 +-
 include/flexflow/ops/softmax.h                |   2 +-
 .../ops/spec_inc_multihead_self_attention.h   |   3 +-
 include/flexflow/ops/split.h                  |   2 +-
 include/flexflow/ops/topk.h                   |   2 +-
 .../ops/tree_inc_multihead_self_attention.h   |   4 +-
 include/flexflow/parallel_ops/allreduce.h     |   6 +-
 include/flexflow/parallel_ops/combine.h       |   2 +-
 .../parallel_ops/kernels/allreduce_kernels.h  |   6 +
 include/flexflow/parallel_ops/partition.h     |   2 +-
 include/flexflow/parallel_ops/reduction.h     |   2 +-
 include/flexflow/parallel_ops/replicate.h     |   2 +-
 include/flexflow/request_manager.h            | 242 ++++++++++
 include/flexflow/utils/cuda_helper.h          |   1 +
 include/flexflow/utils/hip_helper.h           |   1 +
 inference/incr_decoding/incr_decoding.cc      |  58 +--
 inference/models/falcon.cc                    |   6 +-
 inference/models/falcon.h                     |   2 +-
 inference/models/llama.cc                     |   6 +-
 inference/models/llama.h                      |   2 +-
 inference/models/opt.cc                       |   6 +-
 inference/models/opt.h                        |   2 +-
 inference/spec_infer/spec_infer.cc            |  64 +--
 src/c/flexflow_c.cc                           |   2 +-
 src/mapper/mapper.cc                          |   7 +
 src/ops/aggregate.cc                          |   2 +-
 src/ops/aggregate_spec.cc                     |   2 +-
 src/ops/arg_topk.cc                           |  13 +-
 src/ops/argmax.cc                             |  22 +-
 src/ops/attention.cc                          |   2 +-
 src/ops/beam_topk.cc                          |  43 +-
 src/ops/cast.cc                               |   2 +-
 src/ops/element_binary.cc                     |   2 +-
 src/ops/element_unary.cc                      |   2 +-
 src/ops/embedding.cc                          |   2 +-
 src/ops/experts.cc                            |  14 +-
 src/ops/fused.cc                              |   9 +-
 src/ops/fused.cu                              |  30 +-
 src/ops/group_by.cc                           |   2 +-
 src/ops/inc_multihead_self_attention.cc       |  22 +-
 src/ops/inc_multiquery_self_attention.cc      |  18 +-
 src/ops/layer_norm.cc                         |   2 +-
 src/ops/linear.cc                             |   8 +-
 src/ops/noop.cc                               |   2 +-
 src/ops/rms_norm.cc                           |   2 +-
 src/ops/sampling.cc                           |   2 +-
 src/ops/softmax.cc                            |   2 +-
 src/ops/spec_inc_multihead_self_attention.cc  |  34 +-
 src/ops/split.cc                              |   2 +-
 src/ops/topk.cc                               |   2 +-
 src/ops/tree_inc_multihead_self_attention.cc  | 124 ++---
 src/parallel_ops/allreduce.cc                 |  28 +-
 src/parallel_ops/combine.cc                   |   2 +-
 .../kernels/allreduce_kernels.cpp             |  11 +
 src/parallel_ops/kernels/allreduce_kernels.cu |  24 +
 src/parallel_ops/partition.cc                 |   2 +-
 src/parallel_ops/reduction.cc                 |   2 +-
 src/parallel_ops/replicate.cc                 |   2 +-
 src/runtime/batch_config.cc                   |  19 +
 src/runtime/inference_manager.cc              |  96 ++--
 src/runtime/model.cc                          | 121 ++++-
 src/runtime/request_manager.cc                | 440 ++++++++++++++++--
 src/runtime/request_manager.cpp               |   2 +-
 src/runtime/request_manager.cu                |  34 +-
 91 files changed, 1283 insertions(+), 539 deletions(-)
 create mode 100644 include/flexflow/request_manager.h

diff --git a/config/config.linux b/config/config.linux
index dbfdf6f275..738812b8b5 100755
--- a/config/config.linux
+++ b/config/config.linux
@@ -75,7 +75,7 @@ FF_USE_AVX2=${FF_USE_AVX2:-OFF}
 FF_MAX_DIM=${FF_MAX_DIM:-5}
 
 # set LEGION_MAX_RETURN_SIZE
-LEGION_MAX_RETURN_SIZE=${LEGION_MAX_RETURN_SIZE:-131072}
+LEGION_MAX_RETURN_SIZE=${LEGION_MAX_RETURN_SIZE:-262144}
 
 # set ROCM path
 ROCM_PATH=${ROCM_PATH:-"/opt/rocm"}
diff --git a/examples/cpp/inference/dataloader.cu b/examples/cpp/inference/dataloader.cu
index 7fb3478020..434dc337c9 100644
--- a/examples/cpp/inference/dataloader.cu
+++ b/examples/cpp/inference/dataloader.cu
@@ -15,6 +15,7 @@
 
 #include "dataloader.h"
 #include "flexflow/inference.h"
+#include "flexflow/request_manager.h"
 #include "flexflow/utils/cuda_helper.h"
 
 void DataLoader::load_input(Task const *task,
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index ff3f6bb53a..4a5c33c9b0 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -15,6 +15,7 @@
 
 #include "moe.h"
 #include "flexflow/inference.h"
+#include "flexflow/request_manager.h"
 #include <cstdlib>
 #include <fstream>
 #include <iostream>
diff --git a/examples/cpp/inference/transformers/transformers.cc b/examples/cpp/inference/transformers/transformers.cc
index 074e832d47..0717ddc90f 100644
--- a/examples/cpp/inference/transformers/transformers.cc
+++ b/examples/cpp/inference/transformers/transformers.cc
@@ -15,6 +15,7 @@
 
 #include "transformers.h"
 #include "flexflow/inference.h"
+#include "flexflow/request_manager.h"
 #include <cstdlib>
 #include <fstream>
 #include <iostream>
diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index e3ce1c5b95..5e68a65d8c 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -16,6 +16,7 @@
 #pragma once
 
 #include "flexflow/ffconst.h"
+#include "legion.h"
 #include <cstddef>
 #include <cstdlib>
 
@@ -29,6 +30,12 @@ namespace FlexFlow {
 class InferenceResult;
 class BeamInferenceResult;
 
+using BatchConfigFuture = Legion::Future;
+using InferenceResultFuture = Legion::Future;
+using BeamSearchBatchConfigFuture = Legion::Future;
+using TreeVerifyBatchConfigFuture = Legion::Future;
+using BeamInferenceResultFuture = Legion::Future;
+
 class BatchConfig {
 public:
   using RequestGuid = size_t;
@@ -44,8 +51,11 @@ class BatchConfig {
   int num_active_tokens() const;
   void print() const;
   virtual InferenceMode get_mode() const;
-  static int const MAX_NUM_REQUESTS = 16;
+  static BatchConfig const *from_future(BatchConfigFuture const &future);
+  static int const MAX_NUM_REQUESTS = 1;
   static int const MAX_NUM_TOKENS = 64;
+  static int const MAX_PROMPT_LENGTH =
+      63; // should be MAX_NUM_TOKENS - 1 for SpecInfer
   static int const MAX_SEQ_LENGTH = 256;
 
   //  These are set by update
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index 823bac9fd6..c30b0c0be3 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -14,65 +14,10 @@
  */
 
 #pragma once
-
 #include "flexflow/batch_config.h"
-#include "flexflow/model.h"
-#include <mutex>
-#include <tokenizers_cpp.h>
 
 namespace FlexFlow {
 
-class FFModel;
-class BeamTree;
-class RequestManager;
-using tokenizers::Tokenizer;
-
-class InferenceManager {
-public:
-  InferenceManager(FFConfig const &config, int max_num_tokens_per_batch);
-  void compile_model_and_allocate_buffer(FFModel *model);
-  void init_operators_inference(FFModel *model);
-  MachineView *get_machine_view(int mv_id);
-  Legion::FutureMap inference(FFModel *model, int index, BatchConfig const &bc);
-  void load_input_tokens_from_batch_config(BatchConfig const &bc,
-                                           ParallelTensor const input);
-  void load_positions(BatchConfig const &bc, ParallelTensor position_input);
-  void incr_decoding_loop(FFModel *model,
-                          RequestManager &rm,
-                          int total_num_requests);
-  void spec_inference_loop(FFModel *model,
-                           RequestManager &rm,
-                           int total_num_requests,
-                           std::vector<int> ssm_model_ids);
-
-public:
-  FFConfig ff_config;
-  std::unordered_map<ParallelTensor, std::vector<ParallelTensor>> tensor_buffer;
-  int max_num_tokens_per_batch;
-  int num_devices;
-  std::vector<MachineView> machine_views;
-};
-
-struct Request {
-  BatchConfig::RequestGuid guid;
-  int max_sequence_length;
-  int initial_len;
-  std::vector<BatchConfig::TokenId> tokens;
-
-  std::vector<struct BeamTree> beam_trees;
-};
-
-// store the result of beam search
-struct BeamTree {
-  struct treeLayer {
-    BeamSearchBatchConfig::TokenId
-        tokens[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
-    int parent_ids[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
-    float probs[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
-  };
-  treeLayer treeLayers[BeamSearchBatchConfig::MAX_BEAM_DEPTH + 1];
-};
-
 struct SamplingConfig {
   bool do_sample = false;
   float temperature = 0.8;
@@ -85,114 +30,14 @@ struct SamplingConfig {
   SamplingConfig() {}
 };
 
-// struct BeamTree_v2 {
-//   std::vector<BatchConfig::TokenId> tokens;
-//   std::vector<int> parent_ids;
-//   std::vector<float> probs;
-// };
-
-class RequestManager {
-public:
+struct GenerationResult {
   using RequestGuid = BatchConfig::RequestGuid;
   using TokenId = BatchConfig::TokenId;
-  RequestManager(ModelType model_type,
-                 std::string const &path,
-                 bool verbose = false,
-                 std::string output_filepath = "");
-  RequestManager();
-  size_t get_num_processed_requests();
-
-  int register_new_model(FFModel *model);
-
-  FFModel *get_model(int model_id);
-
-  RequestGuid register_new_request(std::string const &prompt,
-                                   int max_sequence_length);
-  RequestGuid register_new_request(std::vector<TokenId> const &prompt,
-                                   int max_sequence_length);
-  BatchConfig prepare_next_batch(BatchConfig const &bc,
-                                 InferenceResult const &result);
-  BeamSearchBatchConfig
-      prepare_next_batch_beam(BeamSearchBatchConfig const &old_bc,
-                              BeamInferenceResult const &result);
-
-  BeamSearchBatchConfig
-      prepare_next_batch_init(TreeVerifyBatchConfig const &old_bc,
-                              InferenceResult const &result,
-                              int model_id);
-
-  TreeVerifyBatchConfig prepare_next_batch_verify(
-      std::vector<BeamSearchBatchConfig> const &old_batches);
-
-  void store_beam_metadata(BeamSearchBatchConfig const &old_bc,
-                           BeamInferenceResult const &result);
-  void update_beam_metadata(BeamSearchBatchConfig &new_bc,
-                            BeamTree &tree,
-                            int request_index);
-
-  std::vector<std::pair<BatchConfig::TokenId, int>>
-      traverse_beam_tree(BeamSearchBatchConfig const &old_bc,
-                         int request_index,
-                         int token_start_offset);
-
-  // remove guid after put the cached tree in request
-  std::vector<std::pair<BatchConfig::TokenId, int>> merge_dfs_trees(
-      std::vector<std::vector<std::pair<BatchConfig::TokenId, int>>>
-          input_trees,
-      int root_depth,
-      RequestGuid guid);
-
-  std::vector<std::pair<BatchConfig::TokenId, int>> traverse_verify_tree(
-      size_t guid,
-      std::vector<std::pair<BatchConfig::TokenId, int>> const
-          &inputSerializedTree,
-      std::vector<std::pair<BatchConfig::TokenId, int>> const
-          &outputSerializedTree);
-
-  static void
-      load_tokens_task(Legion::Task const *task,
-                       std::vector<Legion::PhysicalRegion> const &regions,
-                       Legion::Context ctx,
-                       Legion::Runtime *runtime);
-  static void
-      load_positions_task(Legion::Task const *task,
-                          std::vector<Legion::PhysicalRegion> const &regions,
-                          Legion::Context ctx,
-                          Legion::Runtime *runtime);
-
-private:
-  std::unique_ptr<Tokenizer> tokenizer_;
-  bool verbose;
-  ModelType model_type;
-  std::string output_filepath;
-  std::queue<Request> pending_request_queue;
-  std::unordered_map<RequestGuid, Request> running_request_queue;
-  std::mutex request_queue_mutex;
-  RequestGuid next_available_guid;
-  const std::map<ModelType, int> model_bos_map = {{ModelType::LLAMA, 0},
-                                                  {ModelType::OPT, 2}};
-
-  // TODO: Move this two vector to request struct
-  std::unordered_map<RequestGuid,
-                     std::vector<std::pair<BatchConfig::TokenId, int>>>
-      dfs_tree_inputs;
-  std::unordered_map<RequestGuid, std::vector<std::pair<int, int>>>
-      committed_tokens;
-
-  // Multi-model support
-  int num_ssms;
-  std::vector<FFModel *> models;
-
-  // Performance profiling
-  size_t num_processed_requests;
-
-private:
-  struct ProfileInfo {
-    int decoding_steps;
-    double start_time, finish_time;
-  };
-  std::unordered_map<RequestGuid, ProfileInfo> profiling_requests;
-  double total_request_run_time;
+  RequestGuid guid;
+  std::string input_text;
+  std::string output_text;
+  std::vector<TokenId> input_tokens;
+  std::vector<TokenId> output_tokens;
 };
 
 } // namespace FlexFlow
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 0e98b6e8ad..1f30d451ef 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -17,6 +17,7 @@
 #include "accessor.h"
 #include "config.h"
 #include "device.h"
+#include "flexflow/inference.h"
 #include "flexflow/memory_optimization.h"
 #include "flexflow/node.h"
 #include "flexflow/operator_params.h"
@@ -220,6 +221,7 @@ enum TaskIDs {
   PIPELINE_FWD_TASK_ID,
   PIPELINE_BWD_TASK_ID,
   ALLREDUCE_INIT_TASK_ID,
+  ALLREDUCE_INF_TASK_ID,
   ALLREDUCE_FWD_TASK_ID,
   ALLREDUCE_BWD_TASK_ID,
   FUSED_PARALLELOP_INIT_TASK_ID,
@@ -228,6 +230,10 @@ enum TaskIDs {
   // InferenceManager & RequestManager
   RM_LOAD_TOKENS_TASK_ID,
   RM_LOAD_POSITION_TASK_ID,
+  RM_PREPARE_NEXT_BATCH_TASK_ID,
+  RM_PREPARE_NEXT_BATCH_BEAM_TASK_ID,
+  RM_PREPARE_NEXT_BATCH_INIT_TASK_ID,
+  RM_PREPARE_NEXT_BATCH_VERIFY_TASK_ID,
   // Custom tasks
   CUSTOM_GPU_TASK_ID_FIRST,
   CUSTOM_GPU_TASK_ID_1,
@@ -697,6 +703,10 @@ class FFModel {
       float scaling_factor = 1.0f,
       bool qk_prod_scaling = true,
       char const *name = NULL);
+  // ========================================
+  // Inference APIs
+  // ========================================
+  GenerationResult generate(std::string const &text, int max_seq_length);
 
   Tensor create_tensor_legion_ordering(int num_dim,
                                        int const dims[],
diff --git a/include/flexflow/operator.h b/include/flexflow/operator.h
index 13b2bb8ba8..0ef7f6cbac 100644
--- a/include/flexflow/operator.h
+++ b/include/flexflow/operator.h
@@ -196,7 +196,7 @@ class Op {
   virtual void backward(FFModel const &) = 0;
   // Pure virtual functions for inference
   virtual Legion::FutureMap inference(FFModel const &,
-                                      BatchConfig const &,
+                                      BatchConfigFuture const &,
                                       std::vector<ParallelTensor> const &,
                                       std::vector<ParallelTensor> const &,
                                       MachineView const *mv = nullptr) {
diff --git a/include/flexflow/ops/aggregate.h b/include/flexflow/ops/aggregate.h
index 9200c4b123..3ba4f414d1 100644
--- a/include/flexflow/ops/aggregate.h
+++ b/include/flexflow/ops/aggregate.h
@@ -42,7 +42,7 @@ class Aggregate : public Op {
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/aggregate_spec.h b/include/flexflow/ops/aggregate_spec.h
index 2c17674181..4302dd0733 100644
--- a/include/flexflow/ops/aggregate_spec.h
+++ b/include/flexflow/ops/aggregate_spec.h
@@ -34,7 +34,7 @@ class AggregateSpec : public Op {
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/arg_topk.h b/include/flexflow/ops/arg_topk.h
index ed92200fbe..8b2d2aa11c 100644
--- a/include/flexflow/ops/arg_topk.h
+++ b/include/flexflow/ops/arg_topk.h
@@ -40,7 +40,7 @@ class ArgTopK : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/argmax.h b/include/flexflow/ops/argmax.h
index d6d15f2a3c..709861f51c 100644
--- a/include/flexflow/ops/argmax.h
+++ b/include/flexflow/ops/argmax.h
@@ -47,7 +47,7 @@ class ArgMax : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/attention.h b/include/flexflow/ops/attention.h
index 3f4c14593f..7f52e0dad4 100644
--- a/include/flexflow/ops/attention.h
+++ b/include/flexflow/ops/attention.h
@@ -72,7 +72,7 @@ class MultiHeadAttention : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/beam_topk.h b/include/flexflow/ops/beam_topk.h
index 57ab5c1074..639a8ead92 100644
--- a/include/flexflow/ops/beam_topk.h
+++ b/include/flexflow/ops/beam_topk.h
@@ -43,7 +43,7 @@ class BeamTopK : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/cast.h b/include/flexflow/ops/cast.h
index b1e078f60e..a06f87b3c8 100644
--- a/include/flexflow/ops/cast.h
+++ b/include/flexflow/ops/cast.h
@@ -42,7 +42,7 @@ class Cast : public Op {
   void forward(FFModel const &);
   void backward(FFModel const &);
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/element_binary.h b/include/flexflow/ops/element_binary.h
index fe7dc2602c..4aa41ed9e4 100644
--- a/include/flexflow/ops/element_binary.h
+++ b/include/flexflow/ops/element_binary.h
@@ -33,7 +33,7 @@ class ElementBinary : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/element_unary.h b/include/flexflow/ops/element_unary.h
index db0c4b02ca..2df9ea61bc 100644
--- a/include/flexflow/ops/element_unary.h
+++ b/include/flexflow/ops/element_unary.h
@@ -53,7 +53,7 @@ class ElementUnary : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/embedding.h b/include/flexflow/ops/embedding.h
index bd7c15b2fe..ae93ef4d1d 100644
--- a/include/flexflow/ops/embedding.h
+++ b/include/flexflow/ops/embedding.h
@@ -56,7 +56,7 @@ class Embedding : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/experts.h b/include/flexflow/ops/experts.h
index c0a6c107aa..d68957d890 100644
--- a/include/flexflow/ops/experts.h
+++ b/include/flexflow/ops/experts.h
@@ -112,7 +112,7 @@ class Experts : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/fused.h b/include/flexflow/ops/fused.h
index 87e562d143..87c2201c28 100644
--- a/include/flexflow/ops/fused.h
+++ b/include/flexflow/ops/fused.h
@@ -36,7 +36,7 @@ class FusedOp : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/groupby.h b/include/flexflow/ops/groupby.h
index ae421751c3..ec6cdfb9ab 100644
--- a/include/flexflow/ops/groupby.h
+++ b/include/flexflow/ops/groupby.h
@@ -42,7 +42,7 @@ class Group_by : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index b5d441713f..244100bc6f 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -1,6 +1,7 @@
 #ifndef _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_H
 #define _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_H
 
+#include "flexflow/accessor.h"
 #include "flexflow/device.h"
 #include "flexflow/fftype.h"
 #include "flexflow/inference.h"
@@ -82,7 +83,7 @@ class IncMultiHeadSelfAttention : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/inc_multiquery_self_attention.h b/include/flexflow/ops/inc_multiquery_self_attention.h
index ba6a1feeaf..1e36876c57 100644
--- a/include/flexflow/ops/inc_multiquery_self_attention.h
+++ b/include/flexflow/ops/inc_multiquery_self_attention.h
@@ -1,6 +1,7 @@
 #ifndef _FLEXFLOW_INC_MULTIQUERY_ATTENTION_H
 #define _FLEXFLOW_INC_MULTIQUERY_ATTENTION_H
 
+#include "flexflow/accessor.h"
 #include "flexflow/device.h"
 #include "flexflow/fftype.h"
 #include "flexflow/inference.h"
@@ -69,7 +70,7 @@ class IncMultiQuerySelfAttention : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/layer_norm.h b/include/flexflow/ops/layer_norm.h
index b5a36262b4..058884cc9a 100644
--- a/include/flexflow/ops/layer_norm.h
+++ b/include/flexflow/ops/layer_norm.h
@@ -31,7 +31,7 @@ class LayerNorm : public Op {
   void forward(FFModel const &);
   void backward(FFModel const &);
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/linear.h b/include/flexflow/ops/linear.h
index ff6ba1ef90..025674c7ba 100644
--- a/include/flexflow/ops/linear.h
+++ b/include/flexflow/ops/linear.h
@@ -48,7 +48,7 @@ class Linear : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/noop.h b/include/flexflow/ops/noop.h
index add4150e85..e07d10a05e 100644
--- a/include/flexflow/ops/noop.h
+++ b/include/flexflow/ops/noop.h
@@ -24,7 +24,7 @@ class NoOp : public Op {
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/rms_norm.h b/include/flexflow/ops/rms_norm.h
index db18ebdd39..38ce983dd0 100644
--- a/include/flexflow/ops/rms_norm.h
+++ b/include/flexflow/ops/rms_norm.h
@@ -38,7 +38,7 @@ class RMSNorm : public Op {
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
@@ -79,4 +79,4 @@ class RMSNorm : public Op {
   int dim, data_dim;
 };
 } // namespace FlexFlow
-#endif // _FLEXFLOW_RMS_NORM_H
\ No newline at end of file
+#endif // _FLEXFLOW_RMS_NORM_H
diff --git a/include/flexflow/ops/sampling.h b/include/flexflow/ops/sampling.h
index 8ffa6a290a..da554d4f34 100644
--- a/include/flexflow/ops/sampling.h
+++ b/include/flexflow/ops/sampling.h
@@ -53,7 +53,7 @@ class Sampling : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/softmax.h b/include/flexflow/ops/softmax.h
index 3f29de905b..1d5191d7ee 100644
--- a/include/flexflow/ops/softmax.h
+++ b/include/flexflow/ops/softmax.h
@@ -28,7 +28,7 @@ class Softmax : public Op {
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention.h b/include/flexflow/ops/spec_inc_multihead_self_attention.h
index eef684cdb7..c8c1c4c9cf 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention.h
@@ -1,6 +1,7 @@
 #ifndef _FLEXFLOW_SPEC_INC_MULTIHEAD_SELF_ATTENTION_H
 #define _FLEXFLOW_SPEC_INC_MULTIHEAD_SELF_ATTENTION_H
 
+#include "flexflow/accessor.h"
 #include "flexflow/device.h"
 #include "flexflow/fftype.h"
 #include "flexflow/inference.h"
@@ -78,7 +79,7 @@ class SpecIncMultiHeadSelfAttention : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/split.h b/include/flexflow/ops/split.h
index cd40d73e18..cb9c6bdb57 100644
--- a/include/flexflow/ops/split.h
+++ b/include/flexflow/ops/split.h
@@ -27,7 +27,7 @@ class Split : public Op {
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/topk.h b/include/flexflow/ops/topk.h
index ec3691ea11..47144bf6d7 100644
--- a/include/flexflow/ops/topk.h
+++ b/include/flexflow/ops/topk.h
@@ -36,7 +36,7 @@ class TopK : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention.h b/include/flexflow/ops/tree_inc_multihead_self_attention.h
index a9e584aa2b..ba1d80dd60 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention.h
@@ -1,6 +1,7 @@
 #ifndef _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_VERIFY_H
 #define _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_VERIFY_H
 
+#include "flexflow/accessor.h"
 #include "flexflow/device.h"
 #include "flexflow/fftype.h"
 #include "flexflow/inference.h"
@@ -9,6 +10,7 @@
 #include "flexflow/op_meta.h"
 #include "flexflow/operator.h"
 #include "flexflow/ops/inc_multihead_self_attention.h"
+#include "flexflow/ops/tree_inc_multihead_self_attention_params.h"
 #include "math.h"
 #include <cfloat>
 #include <complex>
@@ -81,7 +83,7 @@ class TreeIncMultiHeadSelfAttention : public Op {
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &,
+                              BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/parallel_ops/allreduce.h b/include/flexflow/parallel_ops/allreduce.h
index 2faf128d93..045f9b36a0 100644
--- a/include/flexflow/parallel_ops/allreduce.h
+++ b/include/flexflow/parallel_ops/allreduce.h
@@ -35,7 +35,7 @@ class AllReduce : public ParallelOp {
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &bc,
+                              BatchConfigFuture const &bc,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
@@ -47,6 +47,10 @@ class AllReduce : public ParallelOp {
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
                            Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
   static void forward_task(Legion::Task const *task,
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
diff --git a/include/flexflow/parallel_ops/combine.h b/include/flexflow/parallel_ops/combine.h
index d09a789de2..2e4fdb86a9 100644
--- a/include/flexflow/parallel_ops/combine.h
+++ b/include/flexflow/parallel_ops/combine.h
@@ -36,7 +36,7 @@ class Combine : public ParallelOp {
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &bc,
+                              BatchConfigFuture const &bc,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/parallel_ops/kernels/allreduce_kernels.h b/include/flexflow/parallel_ops/kernels/allreduce_kernels.h
index 02a5026fcf..bdf7aae501 100644
--- a/include/flexflow/parallel_ops/kernels/allreduce_kernels.h
+++ b/include/flexflow/parallel_ops/kernels/allreduce_kernels.h
@@ -1,6 +1,7 @@
 #ifndef _FLEXFLOW_OPS_KERNELS_ALLREDUCE_KERNELS_H
 #define _FLEXFLOW_OPS_KERNELS_ALLREDUCE_KERNELS_H
 
+#include "flexflow/batch_config.h"
 #include "flexflow/device.h"
 #include "flexflow/fftype.h"
 #include "flexflow/op_meta.h"
@@ -16,6 +17,11 @@ class AllReduceMeta : public OpMeta {
 namespace Kernels {
 namespace AllReduce {
 
+void inference_kernel_wrapper(AllReduceMeta const *m,
+                              BatchConfig const *bc,
+                              GenericTensorAccessorR const &input,
+                              GenericTensorAccessorW const &output);
+
 void forward_kernel_wrapper(AllReduceMeta const *m,
                             GenericTensorAccessorR const &input,
                             GenericTensorAccessorW const &output);
diff --git a/include/flexflow/parallel_ops/partition.h b/include/flexflow/parallel_ops/partition.h
index 21eda315ed..4b0013b11d 100644
--- a/include/flexflow/parallel_ops/partition.h
+++ b/include/flexflow/parallel_ops/partition.h
@@ -36,7 +36,7 @@ class Repartition : public ParallelOp {
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &bc,
+                              BatchConfigFuture const &bc,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/parallel_ops/reduction.h b/include/flexflow/parallel_ops/reduction.h
index 1918c3b587..89f8bfbee0 100644
--- a/include/flexflow/parallel_ops/reduction.h
+++ b/include/flexflow/parallel_ops/reduction.h
@@ -36,7 +36,7 @@ class Reduction : public ParallelOp {
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &bc,
+                              BatchConfigFuture const &bc,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/parallel_ops/replicate.h b/include/flexflow/parallel_ops/replicate.h
index f8f2c42559..65d69d8564 100644
--- a/include/flexflow/parallel_ops/replicate.h
+++ b/include/flexflow/parallel_ops/replicate.h
@@ -38,7 +38,7 @@ class Replicate : public ParallelOp {
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
-                              BatchConfig const &bc,
+                              BatchConfigFuture const &bc,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
new file mode 100644
index 0000000000..9dd19ee7f9
--- /dev/null
+++ b/include/flexflow/request_manager.h
@@ -0,0 +1,242 @@
+/* Copyright 2023 CMU, Stanford, Facebook, LANL
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#pragma once
+
+#include "flexflow/batch_config.h"
+#include "flexflow/inference.h"
+#include "flexflow/model.h"
+#include <mutex>
+#include <tokenizers_cpp.h>
+
+namespace FlexFlow {
+
+class FFModel;
+class BeamTree;
+class RequestManager;
+using tokenizers::Tokenizer;
+
+class InferenceManager {
+public:
+  InferenceManager(FFConfig const &config, int max_num_tokens_per_batch);
+  static InferenceManager *get_inference_manager();
+  void compile_model_and_allocate_buffer(FFModel *model);
+  void init_operators_inference(FFModel *model);
+  MachineView *get_machine_view(int mv_id);
+  Legion::FutureMap inference(FFModel *model, int index, BatchConfig const &bc);
+  Legion::FutureMap
+      inference(FFModel *model, int index, BatchConfigFuture const &bc);
+  void load_input_tokens_from_batch_config(BatchConfigFuture const &bc,
+                                           ParallelTensor const input);
+  void load_positions(BatchConfigFuture const &bc,
+                      ParallelTensor position_input);
+  void incr_decoding_loop(FFModel *model,
+                          RequestManager &rm,
+                          int total_num_requests);
+  void spec_inference_loop(FFModel *model,
+                           RequestManager &rm,
+                           int total_num_requests,
+                           std::vector<int> ssm_model_ids);
+
+public:
+  FFConfig ff_config;
+  std::unordered_map<ParallelTensor, std::vector<ParallelTensor>> tensor_buffer;
+  int max_num_tokens_per_batch;
+  int num_devices;
+  std::vector<MachineView> machine_views;
+};
+
+struct Request {
+  BatchConfig::RequestGuid guid;
+  int max_sequence_length;
+  int initial_len;
+  std::vector<BatchConfig::TokenId> tokens;
+
+  std::vector<struct BeamTree> beam_trees;
+};
+
+// store the result of beam search
+struct BeamTree {
+  struct treeLayer {
+    BeamSearchBatchConfig::TokenId
+        tokens[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
+    int parent_ids[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
+    float probs[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
+  };
+  treeLayer treeLayers[BeamSearchBatchConfig::MAX_BEAM_DEPTH + 1];
+};
+
+// struct BeamTree_v2 {
+//   std::vector<BatchConfig::TokenId> tokens;
+//   std::vector<int> parent_ids;
+//   std::vector<float> probs;
+// };
+
+class RequestManager {
+public:
+  using RequestGuid = BatchConfig::RequestGuid;
+  using TokenId = BatchConfig::TokenId;
+  // RequestManager(ModelType model_type,
+  //                std::string const &path,
+  //                bool verbose = false,
+  //                std::string output_filepath = "");
+  RequestManager();
+  static RequestManager *get_request_manager();
+  size_t get_num_processed_requests();
+  size_t get_num_ssms();
+
+  int register_ssm_model(FFModel *model);
+  void register_tokenizer(ModelType model_type, std::string const &path);
+  void register_output_filepath(std::string const &);
+
+  FFModel *get_model(int model_id);
+  static void serve(FFModel *model);
+
+  GenerationResult generate_incr_decoding(FFModel *model,
+                                          std::string const &text,
+                                          int max_seq_length);
+  GenerationResult generate_spec_infer(FFModel *model,
+                                       std::string const &text,
+                                       int max_seq_length);
+  GenerationResult get_generation_result(RequestGuid const &guid);
+  RequestGuid register_new_request(std::string const &prompt,
+                                   int max_sequence_length);
+  RequestGuid register_new_request(std::vector<TokenId> const &prompt,
+                                   int max_sequence_length);
+  bool is_request_completed(RequestGuid const &guid);
+  BatchConfig prepare_next_batch(BatchConfig const &bc,
+                                 InferenceResult const &result);
+  BatchConfigFuture prepare_next_batch(BatchConfigFuture const &bc,
+                                       InferenceResultFuture const &result);
+  BeamSearchBatchConfig
+      prepare_next_batch_beam(BeamSearchBatchConfig const &old_bc,
+                              BeamInferenceResult const &result);
+  BeamSearchBatchConfigFuture
+      prepare_next_batch_beam(BeamSearchBatchConfigFuture const &old_bc,
+                              BeamInferenceResultFuture const &result);
+  BeamSearchBatchConfig
+      prepare_next_batch_init(TreeVerifyBatchConfig const &old_bc,
+                              InferenceResult const &result,
+                              int model_id);
+  BeamSearchBatchConfigFuture
+      prepare_next_batch_init(TreeVerifyBatchConfigFuture const &old_bc,
+                              InferenceResultFuture const &result,
+                              int model_id);
+  TreeVerifyBatchConfig prepare_next_batch_verify(
+      std::vector<BeamSearchBatchConfig> const &old_batches);
+  TreeVerifyBatchConfigFuture prepare_next_batch_verify(
+      std::vector<BeamSearchBatchConfigFuture> const &old_batches);
+
+  void store_beam_metadata(BeamSearchBatchConfig const &old_bc,
+                           BeamInferenceResult const &result);
+  void update_beam_metadata(BeamSearchBatchConfig &new_bc,
+                            BeamTree &tree,
+                            int request_index);
+
+  std::vector<std::pair<BatchConfig::TokenId, int>>
+      traverse_beam_tree(BeamSearchBatchConfig const &old_bc,
+                         int request_index,
+                         int token_start_offset);
+
+  // remove guid after put the cached tree in request
+  std::vector<std::pair<BatchConfig::TokenId, int>> merge_dfs_trees(
+      std::vector<std::vector<std::pair<BatchConfig::TokenId, int>>>
+          input_trees,
+      int root_depth,
+      RequestGuid guid);
+
+  std::vector<std::pair<BatchConfig::TokenId, int>> traverse_verify_tree(
+      size_t guid,
+      std::vector<std::pair<BatchConfig::TokenId, int>> const
+          &inputSerializedTree,
+      std::vector<std::pair<BatchConfig::TokenId, int>> const
+          &outputSerializedTree);
+
+  static void
+      load_tokens_task(Legion::Task const *task,
+                       std::vector<Legion::PhysicalRegion> const &regions,
+                       Legion::Context ctx,
+                       Legion::Runtime *runtime);
+  static void
+      load_positions_task(Legion::Task const *task,
+                          std::vector<Legion::PhysicalRegion> const &regions,
+                          Legion::Context ctx,
+                          Legion::Runtime *runtime);
+
+  static BatchConfig prepare_next_batch_task(
+      Legion::Task const *task,
+      std::vector<Legion::PhysicalRegion> const &regions,
+      Legion::Context ctx,
+      Legion::Runtime *runtime);
+
+  static BeamSearchBatchConfig prepare_next_batch_beam_task(
+      Legion::Task const *task,
+      std::vector<Legion::PhysicalRegion> const &regions,
+      Legion::Context ctx,
+      Legion::Runtime *runtime);
+
+  static BeamSearchBatchConfig prepare_next_batch_init_task(
+      Legion::Task const *task,
+      std::vector<Legion::PhysicalRegion> const &regions,
+      Legion::Context ctx,
+      Legion::Runtime *runtime);
+
+  static TreeVerifyBatchConfig prepare_next_batch_verify_task(
+      Legion::Task const *task,
+      std::vector<Legion::PhysicalRegion> const &regions,
+      Legion::Context ctx,
+      Legion::Runtime *runtime);
+
+private:
+  std::unique_ptr<Tokenizer> tokenizer_;
+  bool verbose;
+  ModelType model_type;
+  std::string output_filepath;
+  std::queue<Request> pending_request_queue;
+  std::unordered_map<RequestGuid, Request> all_requests;
+  std::unordered_map<RequestGuid, GenerationResult> request_generation_results;
+  std::mutex request_queue_mutex;
+  RequestGuid next_available_guid;
+  // Legion futures for inc_decoding and spec_infer
+  BatchConfigFuture last_bcf;
+  InferenceResultFuture last_irf;
+  TreeVerifyBatchConfigFuture last_tree_bcf;
+  InferenceResultFuture last_tree_irf;
+  const std::map<ModelType, int> model_bos_map = {{ModelType::LLAMA, 0},
+                                                  {ModelType::OPT, 2}};
+
+  // TODO: Move this two vector to request struct
+  std::unordered_map<RequestGuid,
+                     std::vector<std::pair<BatchConfig::TokenId, int>>>
+      dfs_tree_inputs;
+  std::unordered_map<RequestGuid, std::vector<std::pair<int, int>>>
+      committed_tokens;
+
+  // Multi-model support
+  std::vector<FFModel *> models;
+
+  // Performance profiling
+  size_t num_processed_requests;
+
+private:
+  struct ProfileInfo {
+    int decoding_steps;
+    double start_time, finish_time;
+  };
+  std::unordered_map<RequestGuid, ProfileInfo> profiling_requests;
+  double total_request_run_time;
+};
+
+}; // namespace FlexFlow
diff --git a/include/flexflow/utils/cuda_helper.h b/include/flexflow/utils/cuda_helper.h
index 1787c5a0b7..e67e50484c 100644
--- a/include/flexflow/utils/cuda_helper.h
+++ b/include/flexflow/utils/cuda_helper.h
@@ -1,5 +1,6 @@
 #ifndef _FLEXFLOW_CUDA_HELPER_H_
 #define _FLEXFLOW_CUDA_HELPER_H_
+#include "flexflow/accessor.h"
 #include "flexflow/ffconst.h"
 #include "legion.h"
 #include <cublas_v2.h>
diff --git a/include/flexflow/utils/hip_helper.h b/include/flexflow/utils/hip_helper.h
index c2c4d94cc3..d16f353ade 100644
--- a/include/flexflow/utils/hip_helper.h
+++ b/include/flexflow/utils/hip_helper.h
@@ -1,5 +1,6 @@
 #ifndef _FLEXFLOW_HIP_HELPER_H_
 #define _FLEXFLOW_HIP_HELPER_H_
+#include "flexflow/accessor.h"
 #include "flexflow/ffconst.h"
 #include "legion.h"
 #include <hipblas.h>
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index 0059b30ae0..957c41b103 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/inference.h"
+#include "flexflow/request_manager.h"
 #include "models/falcon.h"
 #include "models/llama.h"
 #include "models/opt.h"
@@ -40,10 +41,7 @@ void parse_input_args(char **argv,
                       bool &verbose,
                       bool &do_sample,
                       float &temperature,
-                      float &topp,
-                      int &data_parallelism_degree,
-                      int &tensor_parallelism_degree,
-                      int &pipeline_parallelism_degree) {
+                      float &topp) {
   for (int i = 1; i < argc; i++) {
     // llm model type
     if (!strcmp(argv[i], "-llm-model")) {
@@ -88,21 +86,6 @@ void parse_input_args(char **argv,
       paths.output_file_path = std::string(argv[++i]);
       continue;
     }
-    // data parallelism degree
-    if (!strcmp(argv[i], "-data-parallelism-degree")) {
-      data_parallelism_degree = std::stoi(argv[++i]);
-      continue;
-    }
-    // tensor parallelism degree
-    if (!strcmp(argv[i], "-tensor-parallelism-degree")) {
-      tensor_parallelism_degree = std::stoi(argv[++i]);
-      continue;
-    }
-    // pipeline parallelism degree
-    if (!strcmp(argv[i], "-pipeline-parallelism-degree")) {
-      pipeline_parallelism_degree = std::stoi(argv[++i]);
-      continue;
-    }
     if (!strcmp(argv[i], "--use-full-precision")) {
       use_full_precision = true;
       continue;
@@ -143,8 +126,6 @@ void FlexFlow::top_level_task(Task const *task,
   float temperature = 0.0f;
   float topp = 0.0f;
   size_t num_devices = ffconfig.workersPerNode * ffconfig.numNodes;
-  int data_parallelism_degree = 1, tensor_parallelism_degree = 1,
-      pipeline_parallelism_degree = 1;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
   char **argv = command_args.argv;
@@ -157,32 +138,28 @@ void FlexFlow::top_level_task(Task const *task,
                    verbose,
                    do_sample,
                    temperature,
-                   topp,
-                   data_parallelism_degree,
-                   tensor_parallelism_degree,
-                   pipeline_parallelism_degree);
-  ffconfig.data_parallelism_degree = data_parallelism_degree;
-  ffconfig.tensor_parallelism_degree = tensor_parallelism_degree;
-  ffconfig.pipeline_parallelism_degree = pipeline_parallelism_degree;
-
-  assert(data_parallelism_degree * tensor_parallelism_degree *
-             pipeline_parallelism_degree ==
+                   topp);
+
+  assert(ffconfig.data_parallelism_degree * ffconfig.tensor_parallelism_degree *
+             ffconfig.pipeline_parallelism_degree ==
          ffconfig.numNodes * ffconfig.workersPerNode);
 
   assert(model_type != ModelType::UNKNOWN &&
          "Invalid LLM model type passed (or no type was passed).");
 
   SamplingConfig samplingConfig(do_sample, temperature, topp);
-  InferenceManager im(ffconfig, BatchConfig::MAX_NUM_TOKENS);
-  RequestManager rm(model_type,
-                    file_paths.tokenizer_file_path,
-                    /*verbose*/ verbose,
-                    file_paths.output_file_path);
+  RequestManager *rm = RequestManager::get_request_manager();
+  rm->register_tokenizer(model_type, file_paths.tokenizer_file_path);
+  rm->register_output_filepath(file_paths.output_file_path);
+  // InferenceManager im(ffconfig, BatchConfig::MAX_NUM_TOKENS);
+  // RequestManager rm(model_type,
+  //                   file_paths.tokenizer_file_path,
+  //                   /*verbose*/ verbose,
+  //                   file_paths.output_file_path);
 
   FFModel model(ffconfig, ffconfig.cpu_offload);
   if (model_type == ModelType::LLAMA) {
     LLAMA::create_llama_model(model,
-                              im,
                               file_paths.llm_config_file_path,
                               file_paths.llm_weight_file_path,
                               INC_DECODING_MODE,
@@ -190,14 +167,12 @@ void FlexFlow::top_level_task(Task const *task,
                               use_full_precision);
   } else if (model_type == ModelType::OPT) {
     OPT::create_opt_model(model,
-                          im,
                           file_paths.llm_config_file_path,
                           file_paths.llm_weight_file_path,
                           INC_DECODING_MODE,
                           use_full_precision);
   } else if (model_type == ModelType::FALCON) {
     FALCON::create_falcon_model(model,
-                                im,
                                 file_paths.llm_config_file_path,
                                 file_paths.llm_weight_file_path,
                                 ffconfig.workersPerNode * ffconfig.numNodes,
@@ -220,12 +195,11 @@ void FlexFlow::top_level_task(Task const *task,
       std::string text = prompt.get<std::string>();
       printf("Prompt[%d]: %s\n", total_num_requests, text.c_str());
       total_num_requests++;
-      rm.register_new_request(text, 128 /*max_sequence_length*/);
+      GenerationResult result =
+          model.generate(text, 128 /*max_sequence_length*/);
     }
   }
 
-  im.incr_decoding_loop(&model, rm, total_num_requests);
-
   // Execution fence
   {
     Future future = runtime->issue_execution_fence(ctx);
diff --git a/inference/models/falcon.cc b/inference/models/falcon.cc
index bced5dc1e0..d0ec83508b 100644
--- a/inference/models/falcon.cc
+++ b/inference/models/falcon.cc
@@ -20,7 +20,6 @@ namespace FlexFlow {
 using namespace Legion;
 
 void FALCON::create_falcon_model(FFModel &ff,
-                                 InferenceManager &im,
                                  std::string const &model_config_file_path,
                                  std::string const &weight_file_path,
                                  int num_pipeline_stages,
@@ -141,7 +140,8 @@ void FALCON::create_falcon_model(FFModel &ff,
 
   // Compile the model
   std::cout << "------start compile ----------" << std::endl;
-  im.compile_model_and_allocate_buffer(&ff);
+  InferenceManager *im = InferenceManager::get_inference_manager();
+  im->compile_model_and_allocate_buffer(&ff);
   FileDataLoader fileloader("",
                             weight_file_path,
                             falcon_config.n_heads,
@@ -151,7 +151,7 @@ void FALCON::create_falcon_model(FFModel &ff,
   std::cout << "------load weight finished----------" << std::endl;
 
   // init operators
-  im.init_operators_inference(&ff);
+  im->init_operators_inference(&ff);
 }
 
 }; // namespace FlexFlow
diff --git a/inference/models/falcon.h b/inference/models/falcon.h
index 03cef07e58..d9c330a8b9 100644
--- a/inference/models/falcon.h
+++ b/inference/models/falcon.h
@@ -17,6 +17,7 @@
 #include "file_loader.h"
 #include "flexflow/batch_config.h"
 #include "flexflow/inference.h"
+#include "flexflow/request_manager.h"
 #include <nlohmann/json.hpp>
 #include <string>
 using json = nlohmann::json;
@@ -104,7 +105,6 @@ class FALCON {
   };
 
   static void create_falcon_model(FFModel &ff,
-                                  InferenceManager &im,
                                   std::string const &model_config_file_path,
                                   std::string const &weight_file_path,
                                   int num_pipeline_stages,
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index e4cd54192d..fd2b7fe4f9 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -20,7 +20,6 @@ namespace FlexFlow {
 using namespace Legion;
 
 void LLAMA::create_llama_model(FFModel &ff,
-                               InferenceManager &im,
                                std::string const &model_config_file_path,
                                std::string const &weight_file_path,
                                InferenceMode mode,
@@ -190,9 +189,10 @@ void LLAMA::create_llama_model(FFModel &ff,
     }
   }
 
+  InferenceManager *im = InferenceManager::get_inference_manager();
   // Compile the model
   std::cout << "------start compile ----------" << std::endl;
-  im.compile_model_and_allocate_buffer(&ff);
+  im->compile_model_and_allocate_buffer(&ff);
   FileDataLoader fileloader("",
                             weight_file_path,
                             llama_config.n_heads,
@@ -202,7 +202,7 @@ void LLAMA::create_llama_model(FFModel &ff,
   std::cout << "------load weight finished----------" << std::endl;
 
   // init operators
-  im.init_operators_inference(&ff);
+  im->init_operators_inference(&ff);
 }
 
 }; // namespace FlexFlow
diff --git a/inference/models/llama.h b/inference/models/llama.h
index 6f80194d72..61d8908d0c 100644
--- a/inference/models/llama.h
+++ b/inference/models/llama.h
@@ -17,6 +17,7 @@
 #include "file_loader.h"
 #include "flexflow/batch_config.h"
 #include "flexflow/inference.h"
+#include "flexflow/request_manager.h"
 #include <nlohmann/json.hpp>
 #include <string>
 using json = nlohmann::json;
@@ -103,7 +104,6 @@ class LLAMA {
   };
 
   static void create_llama_model(FFModel &ff,
-                                 InferenceManager &im,
                                  std::string const &model_config_file_path,
                                  std::string const &weight_file_path,
                                  InferenceMode mode,
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index 05cee2bf9d..2cdffe2715 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -20,7 +20,6 @@ namespace FlexFlow {
 using namespace Legion;
 
 void OPT::create_opt_model(FFModel &ff,
-                           InferenceManager &im,
                            std::string const &model_config_file_path,
                            std::string const &weight_file_path,
                            InferenceMode mode,
@@ -224,7 +223,8 @@ void OPT::create_opt_model(FFModel &ff,
 
   //------------------- compile the model --------------------------------
   std::cout << "------start compile ----------" << std::endl;
-  im.compile_model_and_allocate_buffer(&ff);
+  InferenceManager *im = InferenceManager::get_inference_manager();
+  im->compile_model_and_allocate_buffer(&ff);
   FileDataLoader fileloader("",
                             weight_file_path,
                             opt_config.num_attention_heads,
@@ -233,7 +233,7 @@ void OPT::create_opt_model(FFModel &ff,
                                 opt_config.num_attention_heads);
   fileloader.load_weights(&ff, weights_layers, use_full_precision);
   std::cout << "------finished loading weights----------" << std::endl;
-  im.init_operators_inference(&ff);
+  im->init_operators_inference(&ff);
 }
 
 }; // namespace FlexFlow
diff --git a/inference/models/opt.h b/inference/models/opt.h
index d5fa845cd5..45ee6e6181 100644
--- a/inference/models/opt.h
+++ b/inference/models/opt.h
@@ -17,6 +17,7 @@
 #include "file_loader.h"
 #include "flexflow/batch_config.h"
 #include "flexflow/inference.h"
+#include "flexflow/request_manager.h"
 #include <nlohmann/json.hpp>
 #include <string>
 using json = nlohmann::json;
@@ -105,7 +106,6 @@ class OPT {
   };
 
   static void create_opt_model(FFModel &ff,
-                               InferenceManager &im,
                                std::string const &model_config_file_path,
                                std::string const &weight_file_path,
                                InferenceMode mode,
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index a34c1b6a84..99131edb34 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -43,10 +43,7 @@ void parse_input_args(char **argv,
                       FilePaths &paths,
                       ModelTypes &model_types,
                       bool &use_full_precision,
-                      bool &verbose,
-                      int &data_parallelism_degree,
-                      int &tensor_parallelism_degree,
-                      int &pipeline_parallelism_degree) {
+                      bool &verbose) {
   for (int i = 1; i < argc; i++) {
     // llm model type
     if (!strcmp(argv[i], "-llm-model")) {
@@ -117,21 +114,6 @@ void parse_input_args(char **argv,
       paths.output_file_path = std::string(argv[++i]);
       continue;
     }
-    // data parallelism degree
-    if (!strcmp(argv[i], "-data-parallelism-degree")) {
-      data_parallelism_degree = std::stoi(argv[++i]);
-      continue;
-    }
-    // tensor parallelism degree
-    if (!strcmp(argv[i], "-tensor-parallelism-degree")) {
-      tensor_parallelism_degree = std::stoi(argv[++i]);
-      continue;
-    }
-    // pipeline parallelism degree
-    if (!strcmp(argv[i], "-pipeline-parallelism-degree")) {
-      pipeline_parallelism_degree = std::stoi(argv[++i]);
-      continue;
-    }
     if (!strcmp(argv[i], "--use-full-precision")) {
       use_full_precision = true;
       continue;
@@ -160,20 +142,10 @@ void FlexFlow::top_level_task(Task const *task,
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
   char **argv = command_args.argv;
   int argc = command_args.argc;
-  parse_input_args(argv,
-                   argc,
-                   file_paths,
-                   model_types,
-                   use_full_precision,
-                   verbose,
-                   data_parallelism_degree,
-                   tensor_parallelism_degree,
-                   pipeline_parallelism_degree);
-  ffconfig.data_parallelism_degree = data_parallelism_degree;
-  ffconfig.tensor_parallelism_degree = tensor_parallelism_degree;
-  ffconfig.pipeline_parallelism_degree = pipeline_parallelism_degree;
-  assert(data_parallelism_degree * tensor_parallelism_degree *
-             pipeline_parallelism_degree ==
+  parse_input_args(
+      argv, argc, file_paths, model_types, use_full_precision, verbose);
+  assert(ffconfig.data_parallelism_degree * ffconfig.tensor_parallelism_degree *
+             ffconfig.pipeline_parallelism_degree ==
          ffconfig.numNodes * ffconfig.workersPerNode);
 
   if (file_paths.ssm_weight_file_paths.size() == 0) {
@@ -200,17 +172,21 @@ void FlexFlow::top_level_task(Task const *task,
 
   // Create SentencePiece tokenizer or OPT tokenizer
   SamplingConfig samplingConfig;
-  InferenceManager im(ffconfig, BatchConfig::MAX_NUM_TOKENS);
-  RequestManager rm(model_types.llm_model_type,
-                    file_paths.tokenizer_file_path,
-                    /*verbose*/ verbose,
-                    file_paths.output_file_path);
+  InferenceManager *im = InferenceManager::get_inference_manager();
+  RequestManager *rm = RequestManager::get_request_manager();
+  rm->register_tokenizer(model_types.llm_model_type,
+                         file_paths.tokenizer_file_path);
+  rm->register_output_filepath(file_paths.output_file_path);
+  // InferenceManager im(ffconfig, BatchConfig::MAX_NUM_TOKENS);
+  // RequestManager rm(model_types.llm_model_type,
+  //                   file_paths.tokenizer_file_path,
+  //                   /*verbose*/ verbose,
+  //                   file_paths.output_file_path);
 
   // Create LLM model
   FFModel tree_model(ffconfig, ffconfig.cpu_offload);
   if (model_types.llm_model_type == ModelType::LLAMA) {
     LLAMA::create_llama_model(tree_model,
-                              im,
                               file_paths.llm_config_file_path,
                               file_paths.llm_weight_file_path,
                               TREE_VERIFY_MODE,
@@ -218,7 +194,6 @@ void FlexFlow::top_level_task(Task const *task,
                               use_full_precision);
   } else if (model_types.llm_model_type == ModelType::OPT) {
     OPT::create_opt_model(tree_model,
-                          im,
                           file_paths.llm_config_file_path,
                           file_paths.llm_weight_file_path,
                           TREE_VERIFY_MODE,
@@ -243,7 +218,6 @@ void FlexFlow::top_level_task(Task const *task,
     FFModel &beam_model = ssm_models[ssm_id];
     if (model_types.ssm_model_types[ssm_id] == ModelType::LLAMA) {
       LLAMA::create_llama_model(beam_model,
-                                im,
                                 file_paths.ssm_config_file_paths[ssm_id],
                                 file_paths.ssm_weight_file_paths[ssm_id],
                                 BEAM_SEARCH_MODE,
@@ -251,7 +225,6 @@ void FlexFlow::top_level_task(Task const *task,
                                 use_full_precision);
     } else if (model_types.ssm_model_types[ssm_id] == ModelType::OPT) {
       OPT::create_opt_model(beam_model,
-                            im,
                             file_paths.ssm_config_file_paths[ssm_id],
                             file_paths.ssm_weight_file_paths[ssm_id],
                             BEAM_SEARCH_MODE,
@@ -260,8 +233,7 @@ void FlexFlow::top_level_task(Task const *task,
       assert(false && "Invalid SSM model type passed.");
     }
 
-    int beam_model_id = rm.register_new_model(&beam_model);
-    ssm_model_ids.push_back(beam_model_id);
+    rm->register_ssm_model(&beam_model);
   }
 
   // Register requests from prompt file
@@ -278,12 +250,10 @@ void FlexFlow::top_level_task(Task const *task,
       std::string text = prompt.get<std::string>();
       printf("Prompt[%d]: %s\n", total_num_requests, text.c_str());
       total_num_requests++;
-      rm.register_new_request(text, 128 /*max_sequence_length*/);
+      tree_model.generate(text, 128 /*max_sequence_length*/);
     }
   }
 
-  im.spec_inference_loop(&tree_model, rm, total_num_requests, ssm_model_ids);
-
   // Execution fence
   {
     Future future = runtime->issue_execution_fence(ctx);
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index d7f1b70232..1c3103683f 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -15,8 +15,8 @@
 
 #include "flexflow/flexflow_c.h"
 #include "flexflow/dataloader.h"
-#include "flexflow/inference.h"
 #include "flexflow/mapper.h"
+#include "flexflow/request_manager.h"
 
 using namespace Legion;
 using namespace FlexFlow;
diff --git a/src/mapper/mapper.cc b/src/mapper/mapper.cc
index ca6d574501..3d08eb0bcc 100644
--- a/src/mapper/mapper.cc
+++ b/src/mapper/mapper.cc
@@ -283,6 +283,13 @@ void FFMapper::select_task_options(const MapperContext ctx,
     output.initial_proc = all_cpus[0];
     return;
   }
+  if ((task.task_id == RM_PREPARE_NEXT_BATCH_TASK_ID) ||
+      (task.task_id == RM_PREPARE_NEXT_BATCH_BEAM_TASK_ID) ||
+      (task.task_id == RM_PREPARE_NEXT_BATCH_INIT_TASK_ID) ||
+      (task.task_id == RM_PREPARE_NEXT_BATCH_VERIFY_TASK_ID)) {
+    output.initial_proc = all_cpus[0];
+    return;
+  }
   if (task.task_id == TOP_LEVEL_TASK_ID) {
     output.initial_proc = all_cpus[0];
     // control replicate top level task
diff --git a/src/ops/aggregate.cc b/src/ops/aggregate.cc
index bb3eaf8f52..c7217bb700 100644
--- a/src/ops/aggregate.cc
+++ b/src/ops/aggregate.cc
@@ -285,7 +285,7 @@ void Aggregate::forward(FFModel const &ff) {
 }
 
 FutureMap Aggregate::inference(FFModel const &ff,
-                               BatchConfig const &bc,
+                               BatchConfigFuture const &bc,
                                std::vector<ParallelTensor> const &batch_inputs,
                                std::vector<ParallelTensor> const &batch_outputs,
                                MachineView const *mv) {
diff --git a/src/ops/aggregate_spec.cc b/src/ops/aggregate_spec.cc
index 5ec8ab6857..5190983148 100644
--- a/src/ops/aggregate_spec.cc
+++ b/src/ops/aggregate_spec.cc
@@ -260,7 +260,7 @@ void AggregateSpec::forward(FFModel const &ff) {
 
 FutureMap
     AggregateSpec::inference(FFModel const &ff,
-                             BatchConfig const &bc,
+                             BatchConfigFuture const &bc,
                              std::vector<ParallelTensor> const &batch_inputs,
                              std::vector<ParallelTensor> const &batch_outputs,
                              MachineView const *mv) {
diff --git a/src/ops/arg_topk.cc b/src/ops/arg_topk.cc
index c1bbb65f1e..b877a9f96d 100644
--- a/src/ops/arg_topk.cc
+++ b/src/ops/arg_topk.cc
@@ -29,6 +29,7 @@ using Legion::ArgumentMap;
 using Legion::Context;
 using Legion::coord_t;
 using Legion::Domain;
+using Legion::Future;
 using Legion::FutureMap;
 using Legion::IndexLauncher;
 using Legion::InlineLauncher;
@@ -250,7 +251,7 @@ void ArgTopK::forward(FFModel const &ff) {
 }
 
 FutureMap ArgTopK::inference(FFModel const &ff,
-                             BatchConfig const &bc,
+                             BatchConfigFuture const &bc,
                              std::vector<ParallelTensor> const &batch_inputs,
                              std::vector<ParallelTensor> const &batch_outputs,
                              MachineView const *mv) {
@@ -265,12 +266,13 @@ FutureMap ArgTopK::inference(FFModel const &ff,
             << std::endl; */
   IndexLauncher launcher(ARG_TOPK_INF_TASK_ID,
                          parallel_is,
-                         TaskArgument(&bc, sizeof(BatchConfig)),
+                         TaskArgument(nullptr, 0),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
                          machine_view_hash);
+  launcher.add_future(bc);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
@@ -300,7 +302,12 @@ InferenceResult
   assert(regions.size() == 2);
   assert(task->regions.size() == 2);
   // const ArgTopK* topk = (const ArgTopK*) task->args;
-  BatchConfig const *bc = (BatchConfig *)task->args;
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_tokens == 0) {
+    // Directly return for empty batch config
+    InferenceResult ir;
+    return ir;
+  }
   ArgTopKMeta const *m = *((ArgTopKMeta **)task->local_args);
 
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
diff --git a/src/ops/argmax.cc b/src/ops/argmax.cc
index 754337448e..8598a71d50 100644
--- a/src/ops/argmax.cc
+++ b/src/ops/argmax.cc
@@ -254,7 +254,7 @@ void ArgMax::forward(FFModel const &ff) {
 }
 
 FutureMap ArgMax::inference(FFModel const &ff,
-                            BatchConfig const &bc,
+                            BatchConfigFuture const &bc,
                             std::vector<ParallelTensor> const &batch_inputs,
                             std::vector<ParallelTensor> const &batch_outputs,
                             MachineView const *mv) {
@@ -270,12 +270,13 @@ FutureMap ArgMax::inference(FFModel const &ff,
   if (beam_search) {
     IndexLauncher launcher(ARGMAX_BEAM_INF_TASK_ID,
                            parallel_is,
-                           TaskArgument(&bc, sizeof(BatchConfig)),
+                           TaskArgument(nullptr, 0),
                            argmap,
                            Predicate::TRUE_PRED,
                            false /*must*/,
                            0 /*mapper_id*/,
                            machine_view_hash);
+    launcher.add_future(bc);
     launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                       0 /*projection id*/,
                                                       READ_WRITE,
@@ -307,12 +308,13 @@ FutureMap ArgMax::inference(FFModel const &ff,
   } else {
     IndexLauncher launcher(ARGMAX_NORM_INF_TASK_ID,
                            parallel_is,
-                           TaskArgument(&bc, sizeof(BatchConfig)),
+                           TaskArgument(nullptr, 0),
                            argmap,
                            Predicate::TRUE_PRED,
                            false /*must*/,
                            0 /*mapper_id*/,
                            machine_view_hash);
+    launcher.add_future(bc);
     launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                       0 /*projection id*/,
                                                       READ_WRITE,
@@ -344,7 +346,12 @@ BeamInferenceResult
                                 Runtime *runtime) {
   assert(regions.size() == 4);
   assert(task->regions.size() == 4);
-  BatchConfig const *bc = (BatchConfig *)task->args;
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_tokens == 0) {
+    // Directly return for empty batch config
+    BeamInferenceResult ir;
+    return ir;
+  }
   ArgMaxMeta const *m = *((ArgMaxMeta **)task->local_args);
 
   GenericTensorAccessorW input = helperGetGenericTensorAccessorRW(
@@ -378,8 +385,13 @@ InferenceResult
                                 Runtime *runtime) {
   assert(regions.size() == 3);
   assert(task->regions.size() == 3);
-  BatchConfig const *bc = (BatchConfig *)task->args;
   ArgMaxMeta const *m = *((ArgMaxMeta **)task->local_args);
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_tokens == 0) {
+    // Directly return for empty batch config
+    InferenceResult ir;
+    return ir;
+  }
 
   GenericTensorAccessorW input = helperGetGenericTensorAccessorRW(
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
diff --git a/src/ops/attention.cc b/src/ops/attention.cc
index ca709bdc51..23bd98c648 100644
--- a/src/ops/attention.cc
+++ b/src/ops/attention.cc
@@ -574,7 +574,7 @@ void MultiHeadAttention::forward(FFModel const &ff) {
 
 FutureMap MultiHeadAttention::inference(
     FFModel const &ff,
-    BatchConfig const &bc,
+    BatchConfigFuture const &bc,
     std::vector<ParallelTensor> const &batch_inputs,
     std::vector<ParallelTensor> const &batch_outputs,
     MachineView const *mv) {
diff --git a/src/ops/beam_topk.cc b/src/ops/beam_topk.cc
index 0920105acc..1c71e69c9d 100644
--- a/src/ops/beam_topk.cc
+++ b/src/ops/beam_topk.cc
@@ -29,6 +29,7 @@ using Legion::ArgumentMap;
 using Legion::Context;
 using Legion::coord_t;
 using Legion::Domain;
+using Legion::Future;
 using Legion::FutureMap;
 using Legion::IndexLauncher;
 using Legion::InlineLauncher;
@@ -283,7 +284,7 @@ void BeamTopK::forward(FFModel const &ff) {
 }
 
 FutureMap BeamTopK::inference(FFModel const &ff,
-                              BatchConfig const &bc,
+                              BatchConfigFuture const &bc,
                               std::vector<ParallelTensor> const &batch_inputs,
                               std::vector<ParallelTensor> const &batch_outputs,
                               MachineView const *mv) {
@@ -295,17 +296,15 @@ FutureMap BeamTopK::inference(FFModel const &ff,
   set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
 
-  IndexLauncher launcher(
-      BEAM_TOPK_INF_TASK_ID,
-      parallel_is,
-      TaskArgument(
-          &bc, std::max(sizeof(BatchConfig), sizeof(BeamSearchBatchConfig))),
-      argmap,
-      Predicate::TRUE_PRED,
-      false /*must*/,
-      0 /*mapper_id*/,
-      machine_view_hash);
-
+  IndexLauncher launcher(BEAM_TOPK_INF_TASK_ID,
+                         parallel_is,
+                         TaskArgument(nullptr, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
@@ -342,10 +341,16 @@ BeamInferenceResult
 
   assert(regions.size() == 4);
   assert(task->regions.size() == 4);
-  BeamSearchBatchConfig const *bc = (BeamSearchBatchConfig *)task->args;
+  // BeamSearchBatchConfig const *bc = (BeamSearchBatchConfig *)task->args;
 
+  BeamSearchBatchConfig const &bc =
+      Future(task->futures[0]).get_result<BeamSearchBatchConfig>();
   // std::cout << "beam search topk inference: "
   //           << "\n";
+  if (bc.num_tokens == 0) {
+    BeamInferenceResult ir;
+    return ir;
+  }
 
   BeamTopKMeta const *m = *((BeamTopKMeta **)task->local_args);
   Domain in1_domain = runtime->get_index_space_domain(
@@ -374,14 +379,12 @@ BeamInferenceResult
   // embedding size: eg. 4096
   int length = in1_domain.hi()[0] - in1_domain.lo()[0] + 1;
 
-  int k =
-      out2_domain.hi()[0] - out2_domain.lo()[0] + 1; /*TODO: This prints to 5*/
+  // int k = out2_domain.hi()[0] - out2_domain.lo()[0] + 1;
 
   // total token nums
-  size_t tokens_per_request = in1_domain.hi()[1] - in1_domain.lo()[1] + 1;
-  int batch_size = bc->num_active_tokens();
-  // std::cout << "beam search topk params: " << length << ", " << k << ", "
-  //           << batch_size << "\n";
+  // size_t tokens_per_request = in1_domain.hi()[1] - in1_domain.lo()[1] + 1;
+  // size_t batch_size = in1_domain.get_volume() / length;
+  size_t batch_size = bc.num_active_tokens();
   // std::vector<int> beam_width;
   // std::unordered_map<size_t, int> sub_requests = bc->sub_requests;
   // for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
@@ -395,7 +398,7 @@ BeamInferenceResult
 
   // need meta for: how many sub requests in a main request
   BeamTopK::forward_kernel_wrapper(m,
-                                   bc,
+                                   &bc,
                                    input,
                                    value_ptr,
                                    index_ptr,
diff --git a/src/ops/cast.cc b/src/ops/cast.cc
index 3adf85a435..d98a54fe62 100644
--- a/src/ops/cast.cc
+++ b/src/ops/cast.cc
@@ -225,7 +225,7 @@ void Cast::forward(FFModel const &ff) {
 }
 
 FutureMap Cast::inference(FFModel const &ff,
-                          BatchConfig const &bc,
+                          BatchConfigFuture const &bc,
                           std::vector<ParallelTensor> const &batch_inputs,
                           std::vector<ParallelTensor> const &batch_outputs,
                           MachineView const *mv) {
diff --git a/src/ops/element_binary.cc b/src/ops/element_binary.cc
index 1535cfcd77..0721009bbb 100644
--- a/src/ops/element_binary.cc
+++ b/src/ops/element_binary.cc
@@ -527,7 +527,7 @@ void ElementBinary::forward(FFModel const &ff) {
 
 FutureMap
     ElementBinary::inference(FFModel const &ff,
-                             BatchConfig const &bc,
+                             BatchConfigFuture const &bc,
                              std::vector<ParallelTensor> const &batch_inputs,
                              std::vector<ParallelTensor> const &batch_outputs,
                              MachineView const *mv) {
diff --git a/src/ops/element_unary.cc b/src/ops/element_unary.cc
index 69533db53d..30397830a7 100644
--- a/src/ops/element_unary.cc
+++ b/src/ops/element_unary.cc
@@ -420,7 +420,7 @@ void ElementUnary::forward(FFModel const &ff) {
 
 FutureMap
     ElementUnary::inference(FFModel const &ff,
-                            BatchConfig const &bc,
+                            BatchConfigFuture const &bc,
                             std::vector<ParallelTensor> const &batch_inputs,
                             std::vector<ParallelTensor> const &batch_outputs,
                             MachineView const *mv) {
diff --git a/src/ops/embedding.cc b/src/ops/embedding.cc
index 832e3e3deb..409dcb398e 100644
--- a/src/ops/embedding.cc
+++ b/src/ops/embedding.cc
@@ -459,7 +459,7 @@ void Embedding::forward(FFModel const &ff) {
 }
 
 FutureMap Embedding::inference(FFModel const &ff,
-                               BatchConfig const &bc,
+                               BatchConfigFuture const &bc,
                                std::vector<ParallelTensor> const &batch_inputs,
                                std::vector<ParallelTensor> const &batch_outputs,
                                MachineView const *mv) {
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index 06e007abef..c8b0ec0f26 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -26,6 +26,7 @@ using Legion::ArgumentMap;
 using Legion::Context;
 using Legion::coord_t;
 using Legion::Domain;
+using Legion::Future;
 using Legion::FutureMap;
 using Legion::IndexLauncher;
 using Legion::PhysicalRegion;
@@ -656,7 +657,7 @@ void Experts::forward(FFModel const &ff) {
 }
 
 FutureMap Experts::inference(FFModel const &ff,
-                             BatchConfig const &bc,
+                             BatchConfigFuture const &bc,
                              std::vector<ParallelTensor> const &batch_inputs,
                              std::vector<ParallelTensor> const &batch_outputs,
                              MachineView const *mv) {
@@ -669,15 +670,16 @@ FutureMap Experts::inference(FFModel const &ff,
   size_t machine_view_hash = view->hash();
   /* std::cout << "Experts op machine_view: " << *(MachineView const *)mv
             << std::endl; */
-  int num_active_tokens = bc.num_active_tokens();
+  // int num_active_tokens = bc->num_active_tokens();
   IndexLauncher launcher(EXPERTS_INF_TASK_ID,
                          parallel_is,
-                         TaskArgument(&num_active_tokens, sizeof(int)),
+                         TaskArgument(nullptr, 0),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
                          machine_view_hash);
+  launcher.add_future(bc);
   // expert predictions
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
@@ -731,8 +733,8 @@ void Experts::inference_task(Task const *task,
   assert(regions.size() == task->regions.size());
 
   ExpertsMeta const *m = *((ExpertsMeta **)task->local_args);
-  int num_active_tokens = *(int *)task->args;
-  if (num_active_tokens == 0) {
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_tokens == 0) {
     return;
   }
 
@@ -1056,7 +1058,7 @@ void Experts::inference_task(Task const *task,
                                   output_ptr,
                                   weights_ptr,
                                   bias_ptr,
-                                  num_active_tokens,
+                                  bc->num_active_tokens(),
                                   chosen_experts,
                                   batch_size,
                                   out_dim);
diff --git a/src/ops/fused.cc b/src/ops/fused.cc
index cf01f5bd1e..1d5db2f461 100644
--- a/src/ops/fused.cc
+++ b/src/ops/fused.cc
@@ -470,7 +470,7 @@ void FusedOp::forward(FFModel const &ff) {
 }
 
 FutureMap FusedOp::inference(FFModel const &ff,
-                             BatchConfig const &bc,
+                             BatchConfigFuture const &bc,
                              std::vector<ParallelTensor> const &batch_inputs,
                              std::vector<ParallelTensor> const &batch_outputs,
                              MachineView const *mv) {
@@ -484,16 +484,17 @@ FutureMap FusedOp::inference(FFModel const &ff,
   size_t machine_view_hash = view->hash();
   // bc is one of BatchConfig, TreeVerifyBatchConfig, and BeamSearchBatchConfig
   // so we transfer the maximum of them
-  size_t batch_config_size =
-      std::max(sizeof(TreeVerifyBatchConfig), sizeof(BeamSearchBatchConfig));
+  // size_t batch_config_size =
+  //    std::max(sizeof(TreeVerifyBatchConfig), sizeof(BeamSearchBatchConfig));
   IndexLauncher launcher(FUSEDOP_INF_TASK_ID,
                          parallel_is,
-                         TaskArgument(&bc, batch_config_size),
+                         TaskArgument(nullptr, 0),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
                          machine_view_hash);
+  launcher.add_future(bc);
   int offset = 0;
   for (int i = 0; i < numInputs; i++) {
     assert(inputs[i]->part != LogicalPartition::NO_PART);
diff --git a/src/ops/fused.cu b/src/ops/fused.cu
index 02a4995b0f..9b81836de5 100644
--- a/src/ops/fused.cu
+++ b/src/ops/fused.cu
@@ -44,8 +44,10 @@ namespace FlexFlow {
 using Legion::Context;
 using Legion::coord_t;
 using Legion::Domain;
+using Legion::Future;
 using Legion::LogicalPartition;
 using Legion::LogicalRegion;
+using Legion::Memory;
 using Legion::PhysicalRegion;
 using Legion::Runtime;
 using Legion::Task;
@@ -472,7 +474,13 @@ __host__ void
   // const FusedOp* fused = (FusedOp*) task->args;
   FusedOpMeta const *metas = *((FusedOpMeta **)task->local_args);
   FusedOp const *fused = metas->fused_op;
-  BatchConfig const *bc = (BatchConfig *)task->args;
+  // BatchConfig const *bc = (BatchConfig *)task->args;
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  // Return if no active tokens
+  if (bc->num_tokens == 0) {
+    return;
+  }
+
   assert(metas->numOperators == fused->numOperators);
   assert(regions.size() == task->regions.size());
   assert((int)regions.size() ==
@@ -813,8 +821,10 @@ __host__ void
         assert(fused->op_num_outputs[op] == 1);
         TreeIncMultiHeadSelfAttentionMeta *m =
             (TreeIncMultiHeadSelfAttentionMeta *)metas->meta[op];
-        TreeVerifyBatchConfig const *tree_bc =
-            (TreeVerifyBatchConfig *)task->args;
+        // TreeVerifyBatchConfig const *tree_bc =
+        //     (TreeVerifyBatchConfig *)task->args;
+        TreeVerifyBatchConfig const &tree_bc =
+            Future(task->futures[0]).get_result<TreeVerifyBatchConfig>();
         assert(fused->op_num_weights[op] == (1 + (int)(*m->bias)));
         GenericTensorAccessorR biases;
         if (*m->bias) {
@@ -823,7 +833,7 @@ __host__ void
         }
         TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
             m,
-            tree_bc,
+            &tree_bc,
             task->index_point.point_data[0],
             my_input_accessor[0],
             my_weight_accessor[0],
@@ -836,8 +846,10 @@ __host__ void
         assert(fused->op_num_outputs[op] == 1);
         SpecIncMultiHeadSelfAttentionMeta const *m =
             (SpecIncMultiHeadSelfAttentionMeta *)metas->meta[op];
-        BeamSearchBatchConfig const *beam_bc =
-            (BeamSearchBatchConfig *)task->args;
+        // BeamSearchBatchConfig const *beam_bc =
+        //     (BeamSearchBatchConfig *)task->args;
+        BeamSearchBatchConfig const &beam_bc =
+            Future(task->futures[0]).get_result<BeamSearchBatchConfig>();
         assert(fused->op_num_weights[op] == (1 + (int)(*m->bias)));
         GenericTensorAccessorR biases;
         if (*m->bias) {
@@ -846,7 +858,7 @@ __host__ void
         }
         SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
             m,
-            beam_bc,
+            &beam_bc,
             task->index_point.point_data[0],
             my_input_accessor[0],
             my_weight_accessor[0],
@@ -872,8 +884,8 @@ __host__ void
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
         AllReduceMeta const *m = (AllReduceMeta *)metas->meta[op];
-        Kernels::AllReduce::forward_kernel_wrapper(
-            m, my_input_accessor[0], my_output_accessor[0]);
+        Kernels::AllReduce::inference_kernel_wrapper(
+            m, bc, my_input_accessor[0], my_output_accessor[0]);
         break;
       }
       default: {
diff --git a/src/ops/group_by.cc b/src/ops/group_by.cc
index c805b5fb29..f2f94234c3 100644
--- a/src/ops/group_by.cc
+++ b/src/ops/group_by.cc
@@ -312,7 +312,7 @@ void Group_by::forward(FFModel const &ff) {
 }
 
 FutureMap Group_by::inference(FFModel const &ff,
-                              BatchConfig const &bc,
+                              BatchConfigFuture const &bc,
                               std::vector<ParallelTensor> const &batch_inputs,
                               std::vector<ParallelTensor> const &batch_outputs,
                               MachineView const *mv) {
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index 07598f99ea..aa2310b0f2 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -35,6 +35,7 @@ using Legion::ArgumentMap;
 using Legion::Context;
 using Legion::coord_t;
 using Legion::Domain;
+using Legion::Future;
 using Legion::FutureMap;
 using Legion::IndexLauncher;
 using Legion::Machine;
@@ -648,7 +649,7 @@ void IncMultiHeadSelfAttention::forward(FFModel const &ff) {
 
 FutureMap IncMultiHeadSelfAttention::inference(
     FFModel const &ff,
-    BatchConfig const &bc,
+    BatchConfigFuture const &bc,
     std::vector<ParallelTensor> const &batch_inputs,
     std::vector<ParallelTensor> const &batch_outputs,
     MachineView const *mv) {
@@ -660,17 +661,18 @@ FutureMap IncMultiHeadSelfAttention::inference(
   set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
   int idx = 0;
-  log_inc_mha.debug("BatchConfig, num_tokens: %d, num_requests: %d",
-                    bc.num_tokens,
-                    bc.num_active_requests());
+  // log_inc_mha.debug("BatchConfig, num_tokens: %d, num_requests: %d",
+  //                   bc->num_tokens,
+  //                   bc->num_active_requests());
   IndexLauncher launcher(INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
                          parallel_is,
-                         TaskArgument(&bc, sizeof(BatchConfig)),
+                         TaskArgument(nullptr, 0),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
                          machine_view_hash);
+  launcher.add_future(bc);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
@@ -718,7 +720,15 @@ void IncMultiHeadSelfAttention::inference_task(
 
   assert(task->regions.size() == regions.size());
 
-  BatchConfig const *bc = (BatchConfig *)task->args;
+  // BatchConfig const *bc = (BatchConfig *)task->args;
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  log_inc_mha.debug("BatchConfig, num_tokens: %d, num_requests: %d",
+                    bc->num_tokens,
+                    bc->num_active_requests());
+  if (bc->num_tokens == 0) {
+    return;
+  }
+
   IncMultiHeadSelfAttentionMeta const *m =
       *((IncMultiHeadSelfAttentionMeta **)task->local_args);
 
diff --git a/src/ops/inc_multiquery_self_attention.cc b/src/ops/inc_multiquery_self_attention.cc
index 6ce448c9ec..6aa6042b1a 100644
--- a/src/ops/inc_multiquery_self_attention.cc
+++ b/src/ops/inc_multiquery_self_attention.cc
@@ -35,6 +35,7 @@ using Legion::ArgumentMap;
 using Legion::Context;
 using Legion::coord_t;
 using Legion::Domain;
+using Legion::Future;
 using Legion::FutureMap;
 using Legion::IndexLauncher;
 using Legion::Machine;
@@ -518,7 +519,7 @@ void IncMultiQuerySelfAttention::forward(FFModel const &ff) {
 
 FutureMap IncMultiQuerySelfAttention::inference(
     FFModel const &ff,
-    BatchConfig const &bc,
+    BatchConfigFuture const &bc,
     std::vector<ParallelTensor> const &batch_inputs,
     std::vector<ParallelTensor> const &batch_outputs,
     MachineView const *mv) {
@@ -530,17 +531,18 @@ FutureMap IncMultiQuerySelfAttention::inference(
   set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
   int idx = 0;
-  log_inc_mqa.debug("BatchConfig, num_tokens: %d, num_requests: %d",
-                    bc.num_tokens,
-                    bc.num_active_requests());
+  // log_inc_mqa.debug("BatchConfig, num_tokens: %d, num_requests: %d",
+  //                   bc->num_tokens,
+  //                   bc->num_active_requests());
   IndexLauncher launcher(INC_MULTIQUERY_SELF_ATTENTION_INF_TASK_ID,
                          parallel_is,
-                         TaskArgument(&bc, sizeof(BatchConfig)),
+                         TaskArgument(nullptr, 0),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
                          machine_view_hash);
+  launcher.add_future(bc);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
@@ -575,7 +577,11 @@ void IncMultiQuerySelfAttention::inference_task(
 
   assert(task->regions.size() == regions.size());
 
-  BatchConfig const *bc = (BatchConfig *)task->args;
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_tokens == 0) {
+    return;
+  }
+
   IncMultiQuerySelfAttentionMeta const *m =
       *((IncMultiQuerySelfAttentionMeta **)task->local_args);
 
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index 0124c827f3..b9b3abe0f1 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -404,7 +404,7 @@ void LayerNorm::forward(FFModel const &ff) {
 }
 
 FutureMap LayerNorm::inference(FFModel const &ff,
-                               BatchConfig const &bc,
+                               BatchConfigFuture const &bc,
                                std::vector<ParallelTensor> const &batch_inputs,
                                std::vector<ParallelTensor> const &batch_outputs,
                                MachineView const *mv) {
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index c5903c1e74..2376f80bec 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -13,6 +13,7 @@ using Legion::ArgumentMap;
 using Legion::Context;
 using Legion::coord_t;
 using Legion::Domain;
+using Legion::Future;
 using Legion::FutureMap;
 using Legion::IndexLauncher;
 using Legion::InlineLauncher;
@@ -557,7 +558,7 @@ void Linear::forward(FFModel const &ff) {
 }
 
 FutureMap Linear::inference(FFModel const &ff,
-                            BatchConfig const &bc,
+                            BatchConfigFuture const &bc,
                             std::vector<ParallelTensor> const &batch_inputs,
                             std::vector<ParallelTensor> const &batch_outputs,
                             MachineView const *mv) {
@@ -572,12 +573,13 @@ FutureMap Linear::inference(FFModel const &ff,
             << std::endl; */
   IndexLauncher launcher(LINEAR_INF_TASK_ID,
                          parallel_is,
-                         TaskArgument(&bc, sizeof(BatchConfig)),
+                         TaskArgument(nullptr, 0),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
                          machine_view_hash);
+  launcher.add_future(bc);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
@@ -616,7 +618,7 @@ void Linear::inference_task(Task const *task,
   Domain input_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
   LinearMeta const *m = *((LinearMeta **)task->local_args);
-  BatchConfig const *bc = (BatchConfig *)task->args;
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
   assert(regions.size() == (3 + static_cast<size_t>(m->use_bias)));
   assert(task->regions.size() == (3 + static_cast<size_t>(m->use_bias)));
   if (m->quantization_type == DT_NONE) {
diff --git a/src/ops/noop.cc b/src/ops/noop.cc
index 2b54bdf302..da2d4922e3 100644
--- a/src/ops/noop.cc
+++ b/src/ops/noop.cc
@@ -259,7 +259,7 @@ void NoOp::init(FFModel const &ff) {
 void NoOp::forward(FFModel const &ff) {}
 
 FutureMap NoOp::inference(FFModel const &ff,
-                          BatchConfig const &bc,
+                          BatchConfigFuture const &bc,
                           std::vector<ParallelTensor> const &batch_inputs,
                           std::vector<ParallelTensor> const &batch_outputs,
                           MachineView const *mv) {
diff --git a/src/ops/rms_norm.cc b/src/ops/rms_norm.cc
index e0076b5202..5529abba20 100644
--- a/src/ops/rms_norm.cc
+++ b/src/ops/rms_norm.cc
@@ -328,7 +328,7 @@ void RMSNorm::forward(FFModel const &ff) {
 }
 
 FutureMap RMSNorm::inference(FFModel const &ff,
-                             BatchConfig const &bc,
+                             BatchConfigFuture const &bc,
                              std::vector<ParallelTensor> const &batch_inputs,
                              std::vector<ParallelTensor> const &batch_outputs,
                              MachineView const *mv) {
diff --git a/src/ops/sampling.cc b/src/ops/sampling.cc
index 8c01464042..66b3420a39 100644
--- a/src/ops/sampling.cc
+++ b/src/ops/sampling.cc
@@ -237,7 +237,7 @@ void Sampling::forward(FFModel const &ff) {
 }
 
 FutureMap Sampling::inference(FFModel const &ff,
-                              BatchConfig const &bc,
+                              BatchConfigFuture const &bc,
                               std::vector<ParallelTensor> const &batch_inputs,
                               std::vector<ParallelTensor> const &batch_outputs,
                               MachineView const *mv) {
diff --git a/src/ops/softmax.cc b/src/ops/softmax.cc
index 90aef807e2..450f7c009a 100644
--- a/src/ops/softmax.cc
+++ b/src/ops/softmax.cc
@@ -234,7 +234,7 @@ OpMeta *Softmax::init_task(Task const *task,
 }
 
 FutureMap Softmax::inference(FFModel const &ff,
-                             BatchConfig const &bc,
+                             BatchConfigFuture const &bc,
                              std::vector<ParallelTensor> const &batch_inputs,
                              std::vector<ParallelTensor> const &batch_outputs,
                              MachineView const *mv) {
diff --git a/src/ops/spec_inc_multihead_self_attention.cc b/src/ops/spec_inc_multihead_self_attention.cc
index e765960985..fe241bb8de 100644
--- a/src/ops/spec_inc_multihead_self_attention.cc
+++ b/src/ops/spec_inc_multihead_self_attention.cc
@@ -35,6 +35,7 @@ using Legion::ArgumentMap;
 using Legion::Context;
 using Legion::coord_t;
 using Legion::Domain;
+using Legion::Future;
 using Legion::FutureMap;
 using Legion::IndexLauncher;
 using Legion::Machine;
@@ -599,7 +600,7 @@ void SpecIncMultiHeadSelfAttention::forward(FFModel const &ff) {
 
 FutureMap SpecIncMultiHeadSelfAttention::inference(
     FFModel const &ff,
-    BatchConfig const &bc,
+    BatchConfigFuture const &bc,
     std::vector<ParallelTensor> const &batch_inputs,
     std::vector<ParallelTensor> const &batch_outputs,
     MachineView const *mv) {
@@ -611,16 +612,15 @@ FutureMap SpecIncMultiHeadSelfAttention::inference(
   set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
   int idx = 0;
-  IndexLauncher launcher(
-      SPEC_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
-      parallel_is,
-      TaskArgument(
-          &bc, std::max(sizeof(BatchConfig), sizeof(BeamSearchBatchConfig))),
-      argmap,
-      Predicate::TRUE_PRED,
-      false /*must*/,
-      0 /*mapper_id*/,
-      machine_view_hash);
+  IndexLauncher launcher(SPEC_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
+                         parallel_is,
+                         TaskArgument(nullptr, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
@@ -663,7 +663,13 @@ void SpecIncMultiHeadSelfAttention::inference_task(
     Runtime *runtime) {
   assert(task->regions.size() == regions.size());
 
-  BeamSearchBatchConfig const *bc = (BeamSearchBatchConfig *)task->args;
+  // BeamSearchBatchConfig const *bc = (BeamSearchBatchConfig *)task->args;
+  BeamSearchBatchConfig const &bc =
+      Future(task->futures[0]).get_result<BeamSearchBatchConfig>();
+  if (bc.num_tokens == 0) {
+    return;
+  }
+
   SpecIncMultiHeadSelfAttentionMeta const *m =
       *((SpecIncMultiHeadSelfAttentionMeta **)task->local_args);
   assert((*m->bias ? regions.size() == 4 : regions.size() == 3));
@@ -699,11 +705,11 @@ void SpecIncMultiHeadSelfAttention::inference_task(
 
   assert(task->index_point.get_dim() == 1);
   SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
-      m, bc, task->index_point.point_data[0], input, weight, output, biases);
+      m, &bc, task->index_point.point_data[0], input, weight, output, biases);
 
   // print_tensor<float>(input.get_float_ptr(), 20, "attention input");
   // print_tensor<float>(output.get_float_ptr(), 20, "attention output");
-  // if(bc->beam_slots.at(0).current_depth == 1){
+  // if(bc.beam_slots.at(0).current_depth == 1){
   //     print_beam_tensor<float>(input.get_float_ptr(), 50, 4096, 40, "mha topk
   //     input"); print_beam_tensor<float>(output.get_float_ptr(), 50, 4096, 40,
   //     "mha topk output");
diff --git a/src/ops/split.cc b/src/ops/split.cc
index a9a5000f3d..9298850a99 100644
--- a/src/ops/split.cc
+++ b/src/ops/split.cc
@@ -247,7 +247,7 @@ void Split::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 FutureMap Split::inference(FFModel const &ff,
-                           BatchConfig const &bc,
+                           BatchConfigFuture const &bc,
                            std::vector<ParallelTensor> const &batch_inputs,
                            std::vector<ParallelTensor> const &batch_outputs,
                            MachineView const *mv) {
diff --git a/src/ops/topk.cc b/src/ops/topk.cc
index 45fdb7a3db..d76ad75167 100644
--- a/src/ops/topk.cc
+++ b/src/ops/topk.cc
@@ -264,7 +264,7 @@ void TopK::forward(FFModel const &ff) {
 }
 
 FutureMap TopK::inference(FFModel const &ff,
-                          BatchConfig const &bc,
+                          BatchConfigFuture const &bc,
                           std::vector<ParallelTensor> const &batch_inputs,
                           std::vector<ParallelTensor> const &batch_outputs,
                           MachineView const *mv) {
diff --git a/src/ops/tree_inc_multihead_self_attention.cc b/src/ops/tree_inc_multihead_self_attention.cc
index 105bd41647..7a7ea4f366 100644
--- a/src/ops/tree_inc_multihead_self_attention.cc
+++ b/src/ops/tree_inc_multihead_self_attention.cc
@@ -35,6 +35,7 @@ using Legion::ArgumentMap;
 using Legion::Context;
 using Legion::coord_t;
 using Legion::Domain;
+using Legion::Future;
 using Legion::FutureMap;
 using Legion::IndexLauncher;
 using Legion::Machine;
@@ -649,7 +650,7 @@ void TreeIncMultiHeadSelfAttention::forward(FFModel const &ff) {
 
 FutureMap TreeIncMultiHeadSelfAttention::inference(
     FFModel const &ff,
-    BatchConfig const &bc,
+    BatchConfigFuture const &bc,
     std::vector<ParallelTensor> const &batch_inputs,
     std::vector<ParallelTensor> const &batch_outputs,
     MachineView const *mv) {
@@ -661,18 +662,15 @@ FutureMap TreeIncMultiHeadSelfAttention::inference(
   set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
   int idx = 0;
-  log_tree_verify.debug(
-      "TreeVerifyBatchConfig, num_tokens: %d, num_requests: %d",
-      bc.num_tokens,
-      bc.num_active_requests());
   IndexLauncher launcher(TREE_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
                          parallel_is,
-                         TaskArgument(&bc, sizeof(TreeVerifyBatchConfig)),
+                         TaskArgument(nullptr, 0),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
                          machine_view_hash);
+  launcher.add_future(bc);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
@@ -718,7 +716,17 @@ void TreeIncMultiHeadSelfAttention::inference_task(
     Runtime *runtime) {
   assert(task->regions.size() == regions.size());
 
-  TreeVerifyBatchConfig const *bc = (TreeVerifyBatchConfig *)task->args;
+  // TreeVerifyBatchConfig const *bc = (TreeVerifyBatchConfig *)task->args;
+  TreeVerifyBatchConfig const &bc =
+      Future(task->futures[0]).get_result<TreeVerifyBatchConfig>();
+  log_tree_verify.debug(
+      "TreeVerifyBatchConfig, num_tokens: %d, num_requests: %d",
+      bc.num_tokens,
+      bc.num_active_requests());
+  if (bc.num_tokens == 0) {
+    return;
+  }
+
   TreeIncMultiHeadSelfAttentionMeta *m =
       *((TreeIncMultiHeadSelfAttentionMeta **)task->local_args);
   assert((*m->bias ? regions.size() == 4 : regions.size() == 3));
@@ -760,7 +768,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   assert(task->index_point.get_dim() == 1);
 
   TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
-      m, bc, task->index_point.point_data[0], input, weight, output, biases);
+      m, &bc, task->index_point.point_data[0], input, weight, output, biases);
 #ifdef INFERENCE_TESTS
   printf("Checking TreeIncMultiHeadSelfAttention computations...\n");
 
@@ -807,7 +815,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
 
   size_t effective_batch_size = max_sequence_length * batch_size;
   float inputs_arr[data_dim][effective_batch_size] = {0};
-  for (size_t i = 0; i < data_dim * bc->num_active_tokens(); i++) {
+  for (size_t i = 0; i < data_dim * bc.num_active_tokens(); i++) {
     size_t data_index = i % data_dim;
     size_t token_index = i / data_dim;
     assert(data_index < data_dim);
@@ -839,16 +847,16 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   // column-major order.
 
   // printf("m->kProjSize: %i, TreeVerifyBatchConfig::MAX_NUM_TOKENS: %i, "
-  //     "bc->num_active_tokens(): %i, num_heads: %lli,
+  //     "bc.num_active_tokens(): %i, num_heads: %lli,
   //     TreeVerifyBatchConfig::MAX_NUM_REQUESTS: %i, "
-  //     "bc->num_active_requests(): %i\n", m->kProjSize,
-  //     TreeVerifyBatchConfig::MAX_NUM_TOKENS, bc->num_active_tokens(),
+  //     "bc.num_active_requests(): %i\n", m->kProjSize,
+  //     TreeVerifyBatchConfig::MAX_NUM_TOKENS, bc.num_active_tokens(),
   //     num_heads, TreeVerifyBatchConfig::MAX_NUM_REQUESTS,
-  //     bc->num_active_requests());
-  // for (int t=0; t < bc->num_active_tokens(); t++) {
+  //     bc.num_active_requests());
+  // for (int t=0; t < bc.num_active_tokens(); t++) {
   //   printf("token %i has request_index: %li and token_position: %li\n",
-  //   t, bc->token2ids.token_indexes[t].request_index,
-  //   bc->token2ids.token_indexes[t].token_position);
+  //   t, bc.token2ids.token_indexes[t].request_index,
+  //   bc.token2ids.token_indexes[t].token_position);
   // }
 
   // =============================================================================
@@ -908,7 +916,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   /* std::cout << "Torch projection weights size: " << torch_w_qkv.sizes()
             << std::endl;
   std::cout << "Torch input size: " << torch_input.sizes() << std::endl;
-  std::cout << "Number of active tokens: " << bc->num_active_tokens()
+  std::cout << "Number of active tokens: " << bc.num_active_tokens()
             << std::endl; */
   // std::cout << "torch_w_qkv:" << std::endl << torch_w_qkv << std::endl;
 
@@ -920,10 +928,10 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   torch::Tensor qkv_projs = torch::einsum(
       "ijkl,im->jmkl",
       {torch_w_qkv,
-       torch_input.index({Slice(), Slice(0, bc->num_active_tokens())})});
+       torch_input.index({Slice(), Slice(0, bc.num_active_tokens())})});
   // std::cout << "qkv_projs size: " << qkv_projs.sizes() << std::endl;
   assert(qkv_projs.sizes()[0] == m->qProjSize);
-  assert(qkv_projs.sizes()[1] == bc->num_active_tokens() &&
+  assert(qkv_projs.sizes()[1] == bc.num_active_tokens() &&
          qkv_projs.sizes()[1] <= effective_batch_size);
   assert(qkv_projs.sizes()[2] == 3);
   assert(qkv_projs.sizes()[3] == num_heads);
@@ -936,24 +944,24 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   assert(QKVProjArray_cpu != nullptr);
 
   std::vector<int> QKVProjArray_converted_shape = {
-      m->qProjSize, bc->num_active_tokens(), 3, (int)num_heads};
+      m->qProjSize, bc.num_active_tokens(), 3, (int)num_heads};
   float *QKVProjArray_converted = (float *)calloc(
-      m->qProjSize * bc->num_active_tokens() * 3 * num_heads, sizeof(float));
+      m->qProjSize * bc.num_active_tokens() * 3 * num_heads, sizeof(float));
 
   // skip over padding at the end of QKVProjArray_cpu
   // convert from column order to 3D matrix because torch cannot automatically
   // import matrices flattened in column order
-  for (size_t i = 0; i < proj_sum * bc->num_active_tokens() * num_heads; i++) {
+  for (size_t i = 0; i < proj_sum * bc.num_active_tokens() * num_heads; i++) {
     int proj_size_index = i % m->qProjSize;
-    int head_index = i / (proj_sum * bc->num_active_tokens());
+    int head_index = i / (proj_sum * bc.num_active_tokens());
     int token_index =
-        ((i - head_index * proj_sum * bc->num_active_tokens()) / m->qProjSize) %
-        bc->num_active_tokens();
-    int qkv_offset = (i - head_index * proj_sum * bc->num_active_tokens()) /
-                     (m->qProjSize * bc->num_active_tokens());
+        ((i - head_index * proj_sum * bc.num_active_tokens()) / m->qProjSize) %
+        bc.num_active_tokens();
+    int qkv_offset = (i - head_index * proj_sum * bc.num_active_tokens()) /
+                     (m->qProjSize * bc.num_active_tokens());
     assert(proj_size_index < proj_sum);
     assert(head_index < num_heads);
-    assert(token_index < bc->num_active_tokens());
+    assert(token_index < bc.num_active_tokens());
     assert(qkv_offset < 3);
     set_value_row_major(QKVProjArray_converted,
                         QKVProjArray_converted_shape,
@@ -962,7 +970,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   }
   torch::Tensor QKVProjArray_torch =
       torch::from_blob(QKVProjArray_converted,
-                       {m->qProjSize, bc->num_active_tokens(), 3, num_heads},
+                       {m->qProjSize, bc.num_active_tokens(), 3, num_heads},
                        torch::kFloat32);
 
   //  ----------------------- Comparing C++ & CUDA results ---------------------
@@ -989,15 +997,15 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   //  ----------------------- C++ operations & checks --------------------------
   // Store projections into k/v cache arrays
   for (size_t h = 0; h < num_heads; h++) {
-    for (size_t t = 0; t < bc->num_active_tokens(); t++) {
+    for (size_t t = 0; t < bc.num_active_tokens(); t++) {
       for (size_t d = 0; d < m->kProjSize; d++) {
         size_t kcache_idx = d * MAX_SEQ_LEN * m->num_heads *
                                 TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
-                            bc->tokensInfo[t].abs_depth_in_request *
+                            bc.tokensInfo[t].abs_depth_in_request *
                                 m->num_heads *
                                 TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
                             h * TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
-                            bc->tokensInfo[t].request_index;
+                            bc.tokensInfo[t].request_index;
         m->kcache[kcache_idx] =
             qkv_projs.index({(int64_t)d, (int64_t)t, 1, (int64_t)h})
                 .item<float>();
@@ -1005,11 +1013,11 @@ void TreeIncMultiHeadSelfAttention::inference_task(
       for (size_t d = 0; d < m->vProjSize; d++) {
         size_t vcache_idx = d * MAX_SEQ_LEN * m->num_heads *
                                 TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
-                            bc->tokensInfo[t].abs_depth_in_request *
+                            bc.tokensInfo[t].abs_depth_in_request *
                                 m->num_heads *
                                 TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
                             h * TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
-                            bc->tokensInfo[t].request_index;
+                            bc.tokensInfo[t].request_index;
         m->vcache[vcache_idx] =
             qkv_projs.index({(int64_t)d, (int64_t)t, 2, (int64_t)h})
                 .item<float>();
@@ -1036,8 +1044,8 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   std::vector<size_t> req_idxs;
   std::vector<size_t> r_first_idx;
   std::vector<size_t> r_num_tokens;
-  for (size_t t = 0; t < bc->num_active_tokens(); t++) {
-    size_t rid = bc->tokensInfo[t].request_index;
+  for (size_t t = 0; t < bc.num_active_tokens(); t++) {
+    size_t rid = bc.tokensInfo[t].request_index;
     if (req_idxs.size() == 0 || req_idxs[req_idxs.size() - 1] != rid) {
       req_idxs.push_back(rid);
       r_first_idx.push_back(t);
@@ -1048,11 +1056,11 @@ void TreeIncMultiHeadSelfAttention::inference_task(
     assert(req_idxs.size() == r_first_idx.size() &&
            r_first_idx.size() == r_num_tokens.size());
   }
-  assert(req_idxs.size() == bc->num_active_requests());
+  assert(req_idxs.size() == bc.num_active_requests());
   assert(std::accumulate(r_num_tokens.begin(),
                          r_num_tokens.end(),
                          decltype(r_num_tokens)::value_type(0)) ==
-         bc->num_active_tokens());
+         bc.num_active_tokens());
 
   //  ----------------------- Loading CUDA results for this step ---------------
   float *keyCache_cpu = download_tensor<float>(
@@ -1118,7 +1126,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   //  ----------------------- Comparing C++ & CUDA results ---------------------
 
   // std::cout << "kcache differences:" << std::endl;
-  // for (int i=0; i < bc->num_active_requests() + 1; i++) {
+  // for (int i=0; i < bc.num_active_requests() + 1; i++) {
   //   for (int j=0; j < num_heads; j++) {
   //     for (int l=0; l < m->kProjSize; l++) {
   //       for (int k=0; k < MAX_SEQ_LEN; k++) {
@@ -1143,7 +1151,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   // }
 
   //  std::cout << "keyCache from CUDA:" << std::endl;
-  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
+  //  for (int i=0; i<bc.num_active_requests()+1; i++) {
   //    for (int j=0; j<num_heads; j++) {
   //     for (int l=0; l<m->kProjSize; l++) {
   //       for (int k=0; k< MAX_SEQ_LEN; k++) {
@@ -1162,7 +1170,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   //  }
 
   //  std::cout << "valueCache from CUDA:" << std::endl;
-  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
+  //  for (int i=0; i<bc.num_active_requests()+1; i++) {
   //    for (int j=0; j<num_heads; j++) {
   //       for (int l=0; l<m->vProjSize; l++) {
   //         for (int k=0; k< MAX_SEQ_LEN; k++) {
@@ -1183,7 +1191,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   //  printf("\n");
 
   //  std::cout << "C++ kcache:" << std::endl;
-  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
+  //  for (int i=0; i<bc.num_active_requests()+1; i++) {
   //    for (int j=0; j < num_heads; j++) {
   //       for (int l=0; l < m->kProjSize; l++) {
   //         for (int k=0; k < MAX_SEQ_LEN; k++) {
@@ -1202,7 +1210,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   //  }
 
   //  std::cout << "C++ vcache:" << std::endl;
-  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
+  //  for (int i=0; i<bc.num_active_requests()+1; i++) {
   //    for (int j=0; j<num_heads; j++) {
   //       for (int l=0; l<m->vProjSize; l++) {
   //         for (int k=0; k< MAX_SEQ_LEN; k++) {
@@ -1289,12 +1297,12 @@ void TreeIncMultiHeadSelfAttention::inference_task(
                                         qkv_projs.sizes()[1],
                                         qkv_projs.sizes()[3]});
 
-  torch::Tensor qk_products[bc->num_active_requests()];
-  torch::Tensor qk_softmax[bc->num_active_requests()];
-  torch::Tensor attn_heads[bc->num_active_requests()];
+  torch::Tensor qk_products[bc.num_active_requests()];
+  torch::Tensor qk_softmax[bc.num_active_requests()];
+  torch::Tensor attn_heads[bc.num_active_requests()];
 
   torch::Tensor cpp_output =
-      torch::zeros({m->oProjSize, bc->num_active_tokens()});
+      torch::zeros({m->oProjSize, bc.num_active_tokens()});
 
   //  ----------------------- Loading CUDA results for this step ---------------
   float *qk_prods_cpu = download_tensor<float>(
@@ -1317,14 +1325,14 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   //  ----------------------- Main loop (request by request) -------------------
   size_t qk_prods_cpu_offset = 0;
 
-  for (size_t r = 0; r < bc->num_active_requests(); r++) {
+  for (size_t r = 0; r < bc.num_active_requests(); r++) {
     // Compute pre-request parameters
     size_t num_new_tokens = r_num_tokens[r];
     int64_t rid = (int64_t)(req_idxs[r]);
     int64_t num_tokens_received_so_far =
-        (int64_t)(bc->requestsInfo[rid].token_start_offset +
-                  bc->requestsInfo[rid].num_tokens_in_batch);
-    assert(num_new_tokens == bc->requestsInfo[rid].num_tokens_in_batch);
+        (int64_t)(bc.requestsInfo[rid].token_start_offset +
+                  bc.requestsInfo[rid].num_tokens_in_batch);
+    assert(num_new_tokens == bc.requestsInfo[rid].num_tokens_in_batch);
     assert(num_tokens_received_so_far >= (int64_t)num_new_tokens);
 
     //  ----------------------- C++ computations -------------------------------
@@ -1514,15 +1522,15 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   std::cout << "CUDA:" <<std::endl;
   for (int i=0; i<m->oProjSize; i++) {
     std::cout << torch_out_cuda.index({i, Slice(0,
-  (int64_t)bc->num_active_tokens())}) << std::endl;
+  (int64_t)bc.num_active_tokens())}) << std::endl;
   } */
 
-  assert(torch::allclose(
-      torch_out_cuda.index(
-          {Slice(), Slice(0, (int64_t)bc->num_active_tokens())}),
-      cpp_output,
-      1e-05,
-      1e-05));
+  assert(
+      torch::allclose(torch_out_cuda.index(
+                          {Slice(), Slice(0, (int64_t)bc.num_active_tokens())}),
+                      cpp_output,
+                      1e-05,
+                      1e-05));
 
   // =============================================================================
   //  Cleanup
diff --git a/src/parallel_ops/allreduce.cc b/src/parallel_ops/allreduce.cc
index 123e85c7c5..027d15c929 100644
--- a/src/parallel_ops/allreduce.cc
+++ b/src/parallel_ops/allreduce.cc
@@ -25,6 +25,7 @@ using Legion::ArgumentMap;
 using Legion::Context;
 using Legion::coord_t;
 using Legion::Domain;
+using Legion::Future;
 using Legion::FutureMap;
 using Legion::IndexLauncher;
 using Legion::LogicalPartition;
@@ -181,7 +182,7 @@ void AllReduce::init_inference(FFModel const &ff,
 }
 
 FutureMap AllReduce::inference(FFModel const &ff,
-                               BatchConfig const &bc,
+                               BatchConfigFuture const &bc,
                                std::vector<ParallelTensor> const &batch_inputs,
                                std::vector<ParallelTensor> const &batch_outputs,
                                MachineView const *mv) {
@@ -196,14 +197,15 @@ FutureMap AllReduce::inference(FFModel const &ff,
   size_t machine_view_hash =
       mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
   set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
-  IndexLauncher launcher(ALLREDUCE_FWD_TASK_ID,
+  IndexLauncher launcher(ALLREDUCE_INF_TASK_ID,
                          batch_outputs[0]->parallel_is,
-                         TaskArgument(NULL, 0),
+                         TaskArgument(nullptr, 0),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
                          machine_view_hash);
+  launcher.add_future(bc);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
@@ -313,6 +315,26 @@ bool AllReduce::append_parallel_op_info(
   return true;
 }
 
+/*static*/
+void AllReduce::inference_task(Task const *task,
+                               std::vector<PhysicalRegion> const &regions,
+                               Context ctx,
+                               Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+
+  AllReduceMeta const *m = *((AllReduceMeta **)task->local_args);
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  assert(input.data_type == output.data_type);
+  inference_kernel_wrapper(m, bc, input, output);
+}
+
 /*static*/
 void AllReduce::forward_task(Task const *task,
                              std::vector<PhysicalRegion> const &regions,
diff --git a/src/parallel_ops/combine.cc b/src/parallel_ops/combine.cc
index 198f450636..7c266c5392 100644
--- a/src/parallel_ops/combine.cc
+++ b/src/parallel_ops/combine.cc
@@ -208,7 +208,7 @@ void Combine::create_input_partition_inference(
 }
 
 FutureMap Combine::inference(FFModel const &ff,
-                             BatchConfig const &bc,
+                             BatchConfigFuture const &bc,
                              std::vector<ParallelTensor> const &batch_inputs,
                              std::vector<ParallelTensor> const &batch_outputs,
                              MachineView const *mv) {
diff --git a/src/parallel_ops/kernels/allreduce_kernels.cpp b/src/parallel_ops/kernels/allreduce_kernels.cpp
index 78742568c6..8d0d5e97c5 100644
--- a/src/parallel_ops/kernels/allreduce_kernels.cpp
+++ b/src/parallel_ops/kernels/allreduce_kernels.cpp
@@ -25,6 +25,17 @@ AllReduceMeta::AllReduceMeta(FFHandler handle, AllReduce const *reduct)
 namespace Kernels {
 namespace AllReduce {
 
+void inference_kernel_wrapper(AllReduceMeta const *m,
+                              BatchConfig const *bc,
+                              GenericTensorAccessorR const &input,
+                              GenericTensorAccessorW const &output) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  assert(input.data_type == output.data_type);
+  assert(input.domain == output.domain);
+  assert(false && "To be implemented");
+}
+
 void forward_kernel_wrapper(AllReduceMeta const *m,
                             GenericTensorAccessorR const &input,
                             GenericTensorAccessorW const &output) {
diff --git a/src/parallel_ops/kernels/allreduce_kernels.cu b/src/parallel_ops/kernels/allreduce_kernels.cu
index 1ae9ee27b8..2c000137a1 100644
--- a/src/parallel_ops/kernels/allreduce_kernels.cu
+++ b/src/parallel_ops/kernels/allreduce_kernels.cu
@@ -24,6 +24,30 @@ AllReduceMeta::AllReduceMeta(FFHandler handle, AllReduce const *reduct)
 namespace Kernels {
 namespace AllReduce {
 
+void inference_kernel_wrapper(AllReduceMeta const *m,
+                              BatchConfig const *bc,
+                              GenericTensorAccessorR const &input,
+                              GenericTensorAccessorW const &output) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  assert(input.data_type == output.data_type);
+  assert(input.domain == output.domain);
+  size_t hidden_dim_size = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+  size_t num_elements = bc->num_tokens * hidden_dim_size;
+#ifdef FF_USE_NCCL
+  ncclDataType_t nccl_data_type = ff_to_nccl_datatype(input.data_type);
+  checkNCCL(ncclAllReduce(input.ptr,
+                          output.ptr,
+                          num_elements,
+                          nccl_data_type,
+                          ncclSum,
+                          m->handle.ncclComm,
+                          stream));
+#else
+  assert(false && "Must enable FF_USE_NCCL to use AllReduce operators");
+#endif
+}
+
 void forward_kernel_wrapper(AllReduceMeta const *m,
                             GenericTensorAccessorR const &input,
                             GenericTensorAccessorW const &output) {
diff --git a/src/parallel_ops/partition.cc b/src/parallel_ops/partition.cc
index aaa28b7576..353b3ce398 100644
--- a/src/parallel_ops/partition.cc
+++ b/src/parallel_ops/partition.cc
@@ -201,7 +201,7 @@ void Repartition::create_input_partition_inference(
 
 FutureMap
     Repartition::inference(FFModel const &ff,
-                           BatchConfig const &bc,
+                           BatchConfigFuture const &bc,
                            std::vector<ParallelTensor> const &batch_inputs,
                            std::vector<ParallelTensor> const &batch_outputs,
                            MachineView const *mv) {
diff --git a/src/parallel_ops/reduction.cc b/src/parallel_ops/reduction.cc
index 1d6130d6a6..5dca591328 100644
--- a/src/parallel_ops/reduction.cc
+++ b/src/parallel_ops/reduction.cc
@@ -209,7 +209,7 @@ void Reduction::init_inference(FFModel const &ff,
 }
 
 FutureMap Reduction::inference(FFModel const &ff,
-                               BatchConfig const &bc,
+                               BatchConfigFuture const &bc,
                                std::vector<ParallelTensor> const &batch_inputs,
                                std::vector<ParallelTensor> const &batch_outputs,
                                MachineView const *mv) {
diff --git a/src/parallel_ops/replicate.cc b/src/parallel_ops/replicate.cc
index 794db0f67f..20face74e8 100644
--- a/src/parallel_ops/replicate.cc
+++ b/src/parallel_ops/replicate.cc
@@ -207,7 +207,7 @@ void Replicate::init(FFModel const &ff) {
 }
 
 FutureMap Replicate::inference(FFModel const &ff,
-                               BatchConfig const &bc,
+                               BatchConfigFuture const &bc,
                                std::vector<ParallelTensor> const &batch_inputs,
                                std::vector<ParallelTensor> const &batch_outputs,
                                MachineView const *mv) {
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index c0e665b613..52b1660e53 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -21,6 +21,8 @@
 namespace FlexFlow {
 
 LegionRuntime::Logger::Category log_bc("BatchConfig");
+using Legion::Future;
+using Legion::Memory;
 
 BatchConfig::BatchConfig() : num_tokens(0) {
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
@@ -35,6 +37,23 @@ BatchConfig::BatchConfig() : num_tokens(0) {
   }
 }
 
+/*static*/
+BatchConfig const *BatchConfig::from_future(BatchConfigFuture const &future) {
+  BatchConfig const *bc = static_cast<BatchConfig const *>(
+      Future(future).get_buffer(Memory::SYSTEM_MEM));
+  // Check future size
+  if (bc->get_mode() == INC_DECODING_MODE) {
+    assert(Future(future).get_untyped_size() == sizeof(BatchConfig));
+  } else if (bc->get_mode() == BEAM_SEARCH_MODE) {
+    assert(Future(future).get_untyped_size() == sizeof(BeamSearchBatchConfig));
+  } else if (bc->get_mode() == TREE_VERIFY_MODE) {
+    assert(Future(future).get_untyped_size() == sizeof(TreeVerifyBatchConfig));
+  } else {
+    assert(false && "Unsupported inference mode");
+  }
+  return bc;
+}
+
 InferenceMode BatchConfig::get_mode() const {
   return INC_DECODING_MODE;
 }
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index adb8d9d706..cfcc938204 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -15,11 +15,11 @@
 
 #include "flexflow/ffconst_utils.h"
 #include "flexflow/graph.h"
-#include "flexflow/inference.h"
 #include "flexflow/model.h"
 #include "flexflow/ops/fused.h"
 #include "flexflow/ops/noop.h"
 #include "flexflow/parallel_ops/parallel_op.h"
+#include "flexflow/request_manager.h"
 
 namespace FlexFlow {
 
@@ -83,6 +83,18 @@ InferenceManager::InferenceManager(FFConfig const &_config,
   }
 }
 
+InferenceManager *inference_manager_singleton = nullptr;
+
+/*static*/
+InferenceManager *InferenceManager::get_inference_manager() {
+  if (inference_manager_singleton == nullptr) {
+    FFConfig ffconfig;
+    inference_manager_singleton =
+        new InferenceManager(ffconfig, BatchConfig::MAX_NUM_TOKENS);
+  }
+  return inference_manager_singleton;
+}
+
 bool parallel_tensor_list_overlaps(std::vector<ParallelTensor> const &list1,
                                    std::vector<ParallelTensor> const &list2) {
   for (auto const &pt1 : list1) {
@@ -289,14 +301,38 @@ MachineView *InferenceManager::get_machine_view(int mv_id) {
 FutureMap InferenceManager::inference(FFModel *model,
                                       int index,
                                       BatchConfig const &bc) {
-  log_inf_mgr.print("mode(%d) num_active_tokens(%d) num_active_requests(%d)",
-                    bc.get_mode(),
-                    bc.num_active_tokens(),
-                    bc.num_active_requests());
-
-  assert(bc.num_active_tokens() > 0 && bc.num_active_requests() > 0);
-  // We currently assume that the index-th batch will be placed
-  // on the device_index-th device (except for the experts layers)
+  if (bc.get_mode() == INC_DECODING_MODE) {
+    BatchConfigFuture bcf = Future::from_value<BatchConfig>(bc);
+    return inference(model, index, bcf);
+  } else if (bc.get_mode() == BEAM_SEARCH_MODE) {
+    BatchConfig const *bc_ptr = &bc;
+    BeamSearchBatchConfig const *bsbc_ptr =
+        static_cast<BeamSearchBatchConfig const *>(bc_ptr);
+    BeamSearchBatchConfigFuture bcf =
+        Future::from_value<BeamSearchBatchConfig>(*bsbc_ptr);
+    return inference(model, index, bcf);
+  } else if (bc.get_mode() == TREE_VERIFY_MODE) {
+    BatchConfig const *bc_ptr = &bc;
+    TreeVerifyBatchConfig const *tvbc_ptr =
+        static_cast<TreeVerifyBatchConfig const *>(bc_ptr);
+    TreeVerifyBatchConfigFuture bcf =
+        Future::from_value<TreeVerifyBatchConfig>(*tvbc_ptr);
+    return inference(model, index, bcf);
+  } else {
+    assert(false && "Unsupported inference mode");
+  }
+}
+
+FutureMap InferenceManager::inference(FFModel *model,
+                                      int index,
+                                      BatchConfigFuture const &bc) {
+  // log_inf_mgr.print("mode(%d) num_active_tokens(%d) num_active_requests(%d)",
+  //                   bc.get_mode(),
+  //                   bc.num_active_tokens(),
+  //                   bc.num_active_requests());
+  //  assert(bc.num_active_tokens() > 0 && bc.num_active_requests() > 0);
+  //  We currently assume that the index-th batch will be placed
+  //  on the device_index-th device (except for the experts layers)
   int batch_index = index % model->config.data_parallelism_degree;
   FutureMap fm;
   bool found_input_operator = false;
@@ -432,43 +468,41 @@ void InferenceManager::spec_inference_loop(FFModel *model,
 }
 
 void InferenceManager::load_input_tokens_from_batch_config(
-    BatchConfig const &bc, ParallelTensor const input) {
+    BatchConfigFuture const &bc, ParallelTensor const input) {
   Context ctx = ff_config.lg_ctx;
   Runtime *runtime = ff_config.lg_hlr;
   size_t machine_view_hash = input->machine_view.hash();
   ArgumentMap argmap;
-  IndexLauncher launcher(
-      RM_LOAD_TOKENS_TASK_ID,
-      input->parallel_is,
-      TaskArgument(
-          &bc, std::max(sizeof(BeamSearchBatchConfig), sizeof(BatchConfig))),
-      argmap,
-      Predicate::TRUE_PRED,
-      false /*must*/,
-      0 /*mapper_id*/,
-      machine_view_hash);
+  IndexLauncher launcher(RM_LOAD_TOKENS_TASK_ID,
+                         input->parallel_is,
+                         TaskArgument(nullptr, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
   launcher.add_region_requirement(RegionRequirement(
       input->part, 0 /*projection id*/, WRITE_ONLY, EXCLUSIVE, input->region));
   launcher.add_field(0, FID_DATA);
   runtime->execute_index_space(ctx, launcher);
 }
 
-void InferenceManager::load_positions(BatchConfig const &bc,
+void InferenceManager::load_positions(BatchConfigFuture const &bc,
                                       ParallelTensor position_input) {
   Context ctx = ff_config.lg_ctx;
   Runtime *runtime = ff_config.lg_hlr;
   size_t machine_view_hash = position_input->machine_view.hash();
   ArgumentMap argmap;
-  IndexLauncher launcher(
-      RM_LOAD_POSITION_TASK_ID,
-      position_input->parallel_is,
-      TaskArgument(
-          &bc, std::max(sizeof(BeamSearchBatchConfig), sizeof(BatchConfig))),
-      argmap,
-      Predicate::TRUE_PRED,
-      false /*must*/,
-      0 /*mapper_id*/,
-      machine_view_hash);
+  IndexLauncher launcher(RM_LOAD_POSITION_TASK_ID,
+                         position_input->parallel_is,
+                         TaskArgument(nullptr, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
   launcher.add_region_requirement(RegionRequirement(position_input->part,
                                                     0 /*projection id*/,
                                                     WRITE_ONLY,
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 66cad1f248..0eafd979c1 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -66,6 +66,7 @@
 #include "flexflow/parallel_ops/partition.h"
 #include "flexflow/parallel_ops/reduction.h"
 #include "flexflow/parallel_ops/replicate.h"
+#include "flexflow/request_manager.h"
 #include "flexflow/substitution.h"
 #include "flexflow/utils/random_utils.h"
 #include "flexflow/utils/test_utils.h"
@@ -3821,6 +3822,9 @@ FFConfig::FFConfig() {
   offload_reserve_space_size = DefaultConfig::offloadReserveSpaceSize;
   quantization_type = DT_NONE;
   only_data_parallel = DefaultConfig::onlyDataParallel;
+  data_parallelism_degree = 1;
+  tensor_parallelism_degree = 1;
+  pipeline_parallelism_degree = 1;
   enable_sample_parallel = DefaultConfig::enableSampleParallel;
   enable_parameter_parallel = DefaultConfig::enableParameterParallel;
   enable_attribute_parallel = DefaultConfig::enableAttributeParallel;
@@ -3862,9 +3866,6 @@ FFConfig::FFConfig() {
                     .local_address_space()
                     .only_kind(Processor::LOC_PROC)
                     .count();
-  data_parallelism_degree = 1;
-  tensor_parallelism_degree = 1;
-  pipeline_parallelism_degree = 1;
 
   Runtime *runtime = Runtime::get_runtime();
   lg_hlr = runtime;
@@ -3945,6 +3946,21 @@ void FFConfig::parse_args(char **argv, int argc) {
       only_data_parallel = true;
       continue;
     }
+    // data parallelism degree
+    if (!strcmp(argv[i], "-data-parallelism-degree")) {
+      data_parallelism_degree = std::stoi(argv[++i]);
+      continue;
+    }
+    // tensor parallelism degree
+    if (!strcmp(argv[i], "-tensor-parallelism-degree")) {
+      tensor_parallelism_degree = std::stoi(argv[++i]);
+      continue;
+    }
+    // pipeline parallelism degree
+    if (!strcmp(argv[i], "-pipeline-parallelism-degree")) {
+      pipeline_parallelism_degree = std::stoi(argv[++i]);
+      continue;
+    }
     if ((!strcmp(argv[i], "--enable-parameter-parallel"))) {
       enable_parameter_parallel = true;
       continue;
@@ -4111,6 +4127,90 @@ void register_flexflow_internal_tasks(Runtime *runtime,
           registrar);
     }
   }
+  // RequestManager prepare_next_batch
+  {
+    TaskVariantRegistrar registrar(RM_PREPARE_NEXT_BATCH_TASK_ID,
+                                   "RequestManager Prepare Next Batch");
+    registrar.add_constraint(ProcessorConstraint(Processor::LOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<
+          BatchConfig,
+          RequestManager::prepare_next_batch_task>(
+          registrar, "RequestManager Prepare Next Batch Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<BatchConfig,
+                                     RequestManager::prepare_next_batch_task>(
+          registrar);
+    }
+  }
+  // RequestManager prepare_next_batch_beam
+  {
+    TaskVariantRegistrar registrar(RM_PREPARE_NEXT_BATCH_BEAM_TASK_ID,
+                                   "RequestManager Prepare Next Batch (Beam)");
+    registrar.add_constraint(ProcessorConstraint(Processor::LOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<
+          BeamSearchBatchConfig,
+          RequestManager::prepare_next_batch_beam_task>(
+          registrar, "RequestManager Prepare Next Batch (Beam) Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime
+          ->register_task_variant<BeamSearchBatchConfig,
+                                  RequestManager::prepare_next_batch_beam_task>(
+              registrar);
+    }
+  }
+  // RequestManager prepare_next_batch_init
+  {
+    TaskVariantRegistrar registrar(
+        RM_PREPARE_NEXT_BATCH_INIT_TASK_ID,
+        "RequestManager Prepare Next Batch (Init Beam)");
+    registrar.add_constraint(ProcessorConstraint(Processor::LOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<
+          BeamSearchBatchConfig,
+          RequestManager::prepare_next_batch_init_task>(
+          registrar, "RequestManager Prepare Next Batch (Init Beam) Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime
+          ->register_task_variant<BeamSearchBatchConfig,
+                                  RequestManager::prepare_next_batch_init_task>(
+              registrar);
+    }
+  }
+  // RequestManager prepare_next_batch_verify
+  {
+    TaskVariantRegistrar registrar(
+        RM_PREPARE_NEXT_BATCH_VERIFY_TASK_ID,
+        "RequestManager Prepare Next Batch (Verify)");
+    registrar.add_constraint(ProcessorConstraint(Processor::LOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<
+          TreeVerifyBatchConfig,
+          RequestManager::prepare_next_batch_verify_task>(
+          registrar, "RequestManager Prepare Next Batch (Verify) Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<
+          TreeVerifyBatchConfig,
+          RequestManager::prepare_next_batch_verify_task>(registrar);
+    }
+  }
   // ElementUnary task
   {
     TaskVariantRegistrar registrar(ELEMENTUNARY_INIT_TASK_ID,
@@ -6008,6 +6108,21 @@ void register_flexflow_internal_tasks(Runtime *runtime,
       runtime->register_task_variant<OpMeta *, AllReduce::init_task>(registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(ALLREDUCE_INF_TASK_ID,
+                                   "AllReduce Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<AllReduce::inference_task>(
+          registrar, "AllReduce Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<AllReduce::inference_task>(registrar);
+    }
+  }
   {
     TaskVariantRegistrar registrar(ALLREDUCE_FWD_TASK_ID, "AllReduce Forward");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 478092727f..0856c1663f 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -13,7 +13,7 @@
  * limitations under the License.
  */
 
-#include "flexflow/inference.h"
+#include "flexflow/request_manager.h"
 #include "flexflow/parallel_ops/parallel_op.h"
 // #include "flexflow/tokenizers.h"
 #include <filesystem>
@@ -42,17 +42,33 @@ std::string LoadBytesFromFile(std::string const &path) {
 }
 
 RequestManager::RequestManager()
-    : verbose(false), next_available_guid(1000000), num_processed_requests(0) {}
-
-RequestManager::RequestManager(ModelType model_type,
-                               std::string const &path,
-                               bool _verbose,
-                               std::string _output_filepath)
-    : verbose(_verbose), next_available_guid(1000000),
-      num_processed_requests(0), output_filepath(_output_filepath) {
+    : verbose(false), next_available_guid(1000000), num_processed_requests(0) {
+  {
+    // Initialize futures for spec infer
+    TreeVerifyBatchConfig tree_bc;
+    InferenceResult tree_ir;
+    TreeVerifyBatchConfigFuture tree_bcf =
+        Future::from_value<TreeVerifyBatchConfig>(tree_bc);
+    InferenceResultFuture tree_irf =
+        Future::from_value<InferenceResult>(tree_ir);
+    last_tree_bcf = tree_bcf;
+    last_tree_irf = tree_irf;
+  }
+  {
+    // Initialize futures for incr decoding
+    BatchConfig bc;
+    InferenceResult ir;
+    BatchConfigFuture bcf = Future::from_value<BatchConfig>(bc);
+    InferenceResultFuture irf = Future::from_value<InferenceResult>(ir);
+    last_bcf = bcf;
+    last_irf = irf;
+  }
+}
 
+void RequestManager::register_tokenizer(ModelType type,
+                                        std::string const &path) {
   // bos id
-  this->model_type = model_type;
+  this->model_type = type;
   if (model_type == ModelType::LLAMA) {
     this->tokenizer_ =
         Tokenizer::FromBlobSentencePiece(LoadBytesFromFile(path));
@@ -81,12 +97,15 @@ RequestManager::RequestManager(ModelType model_type,
   }
 }
 
-int RequestManager::register_new_model(FFModel *model) {
+void RequestManager::register_output_filepath(
+    std::string const &_output_filepath) {
+  this->output_filepath = _output_filepath;
+}
+
+int RequestManager::register_ssm_model(FFModel *model) {
   int model_id = models.size();
   models.push_back(model);
   std::cout << "Register new model with id: " << model_id << std::endl;
-  num_ssms++;
-  assert(models.size() == num_ssms);
   return model_id;
 }
 
@@ -95,6 +114,10 @@ FFModel *RequestManager::get_model(int model_id) {
   return models[model_id];
 }
 
+size_t RequestManager::get_num_ssms() {
+  return models.size();
+}
+
 RequestManager::RequestGuid
     RequestManager::register_new_request(std::vector<TokenId> const &prompt,
                                          int max_sequence_length) {
@@ -104,22 +127,38 @@ RequestManager::RequestGuid
   Request request;
   request.guid = next_available_guid++;
   request.max_sequence_length = max_sequence_length;
-  request.initial_len = prompt.size();
-  request.tokens = prompt;
 
-  if (num_ssms == 0) {
+  if (prompt.size() > BatchConfig::MAX_PROMPT_LENGTH) {
+    std::cout << "Warning: too many tokens in prompt, only load up to "
+              << BatchConfig::MAX_PROMPT_LENGTH << " tokens, but got "
+              << prompt.size() << ".\n";
+    // Truncate the prompt to MAX_NUM_TOKENS
+    // request.tokens.insert(request.tokens.end(),
+    //                       prompt.begin(),
+    //                       prompt.begin() + BatchConfig::MAX_PROMPT_LENGTH);
+    // request.initial_len = BatchConfig::MAX_PROMPT_LENGTH;
+    printf("tokens size: %zu\n", request.tokens.size());
+    // assert(false);
+    return 0;
+  } else {
+    request.initial_len = prompt.size();
+    request.tokens = prompt;
+  }
+
+  if (get_num_ssms() == 0) {
     std::cout << "No small speculative model registered yet, using incremental "
                  "decoding."
               << std::endl;
   } else {
-    std::cout << "Num of models: " << num_ssms << std::endl;
-    for (int i = 0; i < num_ssms; i++) {
+    std::cout << "Num of models: " << get_num_ssms() << std::endl;
+    for (int i = 0; i < get_num_ssms(); i++) {
       BeamTree beam_tree = BeamTree{};
       request.beam_trees.push_back(beam_tree);
     }
   }
 
   pending_request_queue.push(request);
+  all_requests[request.guid] = request;
 
   if (verbose) {
     std::cout << "new req: " << request.tokens.size() << std::endl;
@@ -127,6 +166,15 @@ RequestManager::RequestGuid
       std::cout << i << " : " << request.tokens[i] << std::endl;
     }
   }
+
+  GenerationResult gr;
+  gr.guid = request.guid;
+  gr.input_text = "";
+  gr.input_tokens = prompt;
+  gr.output_text = "";
+  gr.output_tokens = prompt;
+  request_generation_results[request.guid] = gr;
+
   return request.guid;
 }
 
@@ -142,27 +190,39 @@ RequestManager::RequestGuid
   request.tokens.push_back(this->model_bos_map.at(this->model_type));
   std::vector<int32_t> tokens = this->tokenizer_->Encode(prompt);
 
+  if (tokens.size() > BatchConfig::MAX_PROMPT_LENGTH) {
+    std::cout << "Warning: too many tokens in prompt, only load up to "
+              << BatchConfig::MAX_PROMPT_LENGTH << " tokens, but got "
+              << tokens.size() << ".\n";
+    // Truncate the prompt to MAX_NUM_TOKENS
+    // tokens.resize(BatchConfig::MAX_PROMPT_LENGTH);
+    printf("tokens size: %zu\n", tokens.size());
+    // assert(false);
+    return 0;
+  }
+
   for (int i = 0; i < tokens.size(); i++) {
-    std::cout << tokens.at(i) << "\n";
+    std::cout << "[" << i << "]" << tokens.at(i) << "\n";
   }
 
   // assert(false);
   request.tokens.insert(request.tokens.end(), tokens.begin(), tokens.end());
   request.initial_len = request.tokens.size();
 
-  if (num_ssms == 0) {
+  if (get_num_ssms() == 0) {
     std::cout << "No small speculative model registered yet, using incremental "
                  "decoding."
               << std::endl;
   } else {
-    std::cout << "Num of models: " << num_ssms << std::endl;
-    for (int i = 0; i < num_ssms; i++) {
+    std::cout << "Num of models: " << get_num_ssms() << std::endl;
+    for (int i = 0; i < get_num_ssms(); i++) {
       BeamTree beam_tree = BeamTree{};
       request.beam_trees.push_back(beam_tree);
     }
   }
 
   pending_request_queue.push(request);
+  all_requests[request.guid] = request;
   {
     std::string output = "New request tokens:";
     for (int i = 0; i < request.tokens.size(); i++) {
@@ -170,13 +230,62 @@ RequestManager::RequestGuid
     }
     log_req_mgr.print("%s", output.c_str());
   }
+
+  GenerationResult gr;
+  gr.guid = request.guid;
+  gr.input_text = prompt;
+  gr.input_tokens = request.tokens;
+  gr.output_text = prompt;
+  gr.output_tokens = request.tokens;
+  request_generation_results[request.guid] = gr;
   return request.guid;
 }
 
+bool RequestManager::is_request_completed(RequestGuid const &guid) {
+  const std::lock_guard<std::mutex> lock(request_queue_mutex);
+  assert(all_requests.find(guid) != all_requests.end());
+  Request const &request = all_requests[guid];
+  return request.tokens.size() >= request.max_sequence_length;
+}
+
+GenerationResult
+    RequestManager::get_generation_result(RequestGuid const &guid) {
+  const std::lock_guard<std::mutex> lock(request_queue_mutex);
+  assert(request_generation_results.find(guid) !=
+         request_generation_results.end());
+  return request_generation_results[guid];
+}
+
 size_t RequestManager::get_num_processed_requests() {
   return num_processed_requests;
 }
 
+BatchConfigFuture
+    RequestManager::prepare_next_batch(BatchConfigFuture const &old_bc,
+                                       InferenceResultFuture const &result) {
+  Runtime *runtime = Runtime::get_runtime();
+  Context ctx = Runtime::get_context();
+
+  RequestManager *rm = this;
+  TaskLauncher launcher(RM_PREPARE_NEXT_BATCH_TASK_ID,
+                        TaskArgument(&rm, sizeof(RequestManager *)));
+  launcher.add_future(old_bc);
+  launcher.add_future(result);
+  return runtime->execute_task(ctx, launcher);
+}
+
+BatchConfig RequestManager::prepare_next_batch_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  RequestManager *rm = *((RequestManager **)task->args);
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  InferenceResult const &result =
+      Future(task->futures[1]).get_result<InferenceResult>();
+  return rm->prepare_next_batch(*bc, result);
+}
+
 BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
                                                InferenceResult const &result) {
   const std::lock_guard<std::mutex> lock(request_queue_mutex);
@@ -184,7 +293,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
   for (int i = 0; i < old_bc.num_tokens; i++) {
     size_t guid =
         old_bc.requestsInfo[old_bc.tokensInfo[i].request_index].request_guid;
-    Request &request = running_request_queue[guid];
+    Request &request = all_requests[guid];
     if (old_bc.tokensInfo[i].abs_depth_in_request + 1 < request.tokens.size()) {
       // This is a prompt token
       continue;
@@ -205,8 +314,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
       continue;
     }
     assert(old_bc.requestsInfo[i].num_tokens_in_batch > 0);
-    Request &request =
-        running_request_queue[old_bc.requestsInfo[i].request_guid];
+    Request &request = all_requests[old_bc.requestsInfo[i].request_guid];
     int processed_tokens = old_bc.requestsInfo[i].token_start_offset +
                            old_bc.requestsInfo[i].num_tokens_in_batch;
     assert(processed_tokens < request.tokens.size());
@@ -221,6 +329,13 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
       for (int i = 0; i < request.tokens.size(); i++) {
         std::cout << request.tokens.at(i) << "\n";
       }
+      {
+        // update generation result and trigger future
+        GenerationResult &gr = request_generation_results[request.guid];
+        assert(gr.guid == request.guid);
+        gr.output_tokens = request.tokens;
+        gr.output_text = output;
+      }
       log_req_mgr.print("Final output: %s", output.c_str());
       num_processed_requests++;
       ProfileInfo profile_info = profiling_requests[request.guid];
@@ -302,7 +417,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
           new_bc.num_tokens < BatchConfig::MAX_NUM_TOKENS) {
         Request new_request = pending_request_queue.front();
         pending_request_queue.pop();
-        running_request_queue[new_request.guid] = new_request;
+        // all_requests[new_request.guid] = new_request;
         new_bc.requestsInfo[i].token_start_offset = 0;
         new_bc.requestsInfo[i].request_guid = new_request.guid;
         new_bc.requestsInfo[i].num_tokens_in_batch =
@@ -335,6 +450,32 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
 }
 
 /* ----- Speculative Inference Specific functions ----- */
+BeamSearchBatchConfigFuture RequestManager::prepare_next_batch_beam(
+    BeamSearchBatchConfigFuture const &old_bc,
+    BeamInferenceResultFuture const &result) {
+  Runtime *runtime = Runtime::get_runtime();
+  Context ctx = Runtime::get_context();
+
+  RequestManager *rm = this;
+  TaskLauncher launcher(RM_PREPARE_NEXT_BATCH_BEAM_TASK_ID,
+                        TaskArgument(&rm, sizeof(RequestManager *)));
+  launcher.add_future(old_bc);
+  launcher.add_future(result);
+  return runtime->execute_task(ctx, launcher);
+}
+
+BeamSearchBatchConfig RequestManager::prepare_next_batch_beam_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  RequestManager *rm = *((RequestManager **)task->args);
+  BeamSearchBatchConfig const &bc =
+      Future(task->futures[0]).get_result<BeamSearchBatchConfig>();
+  BeamInferenceResult const &result =
+      Future(task->futures[1]).get_result<BeamInferenceResult>();
+  return rm->prepare_next_batch_beam(bc, result);
+}
 
 // update beam search metadata
 BeamSearchBatchConfig
@@ -361,15 +502,16 @@ BeamSearchBatchConfig
   BeamSearchBatchConfig new_bc;
   new_bc.max_init_length = 0;
   new_bc.model_id = old_bc.model_id;
-  std::cout << "old_bc.model_id: " << old_bc.model_id << "\n";
+  // std::cout << "old_bc.model_id: " << old_bc.model_id << "\n";
 
   for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
     if (old_bc.request_completed[i]) {
       continue;
     }
-    assert(old_bc.requestsInfo[i].num_tokens_in_batch > 0);
-    Request &request =
-        running_request_queue[old_bc.requestsInfo[i].request_guid];
+    // Comment out this assertion since num_tokens_in_batch can be
+    // zero when beam search has reached required sequence length
+    // assert(old_bc.requestsInfo[i].num_tokens_in_batch > 0);
+    Request &request = all_requests[old_bc.requestsInfo[i].request_guid];
     int processed_tokens = old_bc.requestsInfo[i].token_start_offset +
                            old_bc.requestsInfo[i].num_tokens_in_batch;
 
@@ -451,6 +593,36 @@ BeamSearchBatchConfig
   return new_bc;
 }
 
+BeamSearchBatchConfigFuture RequestManager::prepare_next_batch_init(
+    TreeVerifyBatchConfigFuture const &old_bc,
+    InferenceResultFuture const &result,
+    int model_id) {
+  Runtime *runtime = Runtime::get_runtime();
+  Context ctx = Runtime::get_context();
+
+  RequestManager *rm = this;
+  TaskLauncher launcher(RM_PREPARE_NEXT_BATCH_INIT_TASK_ID,
+                        TaskArgument(&rm, sizeof(RequestManager *)));
+  launcher.add_future(old_bc);
+  launcher.add_future(result);
+  launcher.add_future(Future::from_value<int>(model_id));
+  return runtime->execute_task(ctx, launcher);
+}
+
+BeamSearchBatchConfig RequestManager::prepare_next_batch_init_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  RequestManager *rm = *((RequestManager **)task->args);
+  TreeVerifyBatchConfig const &bc =
+      Future(task->futures[0]).get_result<TreeVerifyBatchConfig>();
+  InferenceResult const &result =
+      Future(task->futures[1]).get_result<InferenceResult>();
+  int model_id = Future(task->futures[2]).get_result<int>();
+  return rm->prepare_next_batch_init(bc, result, model_id);
+}
+
 BeamSearchBatchConfig
     RequestManager::prepare_next_batch_init(TreeVerifyBatchConfig const &old_bc,
                                             InferenceResult const &result,
@@ -470,7 +642,7 @@ BeamSearchBatchConfig
       continue;
     }
     size_t guid = old_bc.requestsInfo[i].request_guid;
-    Request &request = running_request_queue[guid];
+    Request &request = all_requests[guid];
 
     // Verify this: get verified tokens from result
     std::vector<std::pair<BatchConfig::TokenId, int>> tree_outputs =
@@ -540,6 +712,13 @@ BeamSearchBatchConfig
                         request.guid,
                         request.tokens.size());
       std::string output = this->tokenizer_->Decode(request.tokens);
+      {
+        // update generation result and trigger future
+        GenerationResult &gr = request_generation_results[request.guid];
+        assert(gr.guid == request.guid);
+        gr.output_tokens = request.tokens;
+        gr.output_text = output;
+      }
       log_req_mgr.print("Final output: %s", output.c_str());
       new_bc.request_completed[i] = true;
       num_processed_requests++;
@@ -648,7 +827,7 @@ BeamSearchBatchConfig
         pending_request_queue.pop();
         new_bc.max_init_length =
             std::max(new_bc.max_init_length, new_request.initial_len);
-        running_request_queue[new_request.guid] = new_request;
+        // all_requests[new_request.guid] = new_request;
         new_bc.requestsInfo[i].token_start_offset = 0;
         new_bc.requestsInfo[i].request_guid = new_request.guid;
         new_bc.requestsInfo[i].num_tokens_in_batch =
@@ -656,6 +835,7 @@ BeamSearchBatchConfig
                      (int)new_request.tokens.size());
         new_bc.requestsInfo[i].max_sequence_length =
             new_request.max_sequence_length;
+
         // add profile_info for the new request
         ProfileInfo profile_info;
         profile_info.decoding_steps = 0;
@@ -665,6 +845,10 @@ BeamSearchBatchConfig
         new_bc.beamRequestsInfo[i].beam_size =
             BeamSearchBatchConfig::MAX_BEAM_WIDTH;
         new_bc.beamRequestsInfo[i].current_depth = 1;
+        new_bc.beamRequestsInfo[i].max_depth =
+            std::min(BeamSearchBatchConfig::MAX_BEAM_DEPTH,
+                     BatchConfig::MAX_NUM_TOKENS -
+                         new_bc.requestsInfo[i].num_tokens_in_batch - 1);
         for (int j = 0; j < BeamSearchBatchConfig::MAX_BEAM_WIDTH; j++) {
           new_bc.beamRequestsInfo[i].parent_id[j] = 0;
           new_bc.beamRequestsInfo[i].probs[j] = 1;
@@ -702,6 +886,33 @@ BeamSearchBatchConfig
   return new_bc;
 }
 
+TreeVerifyBatchConfigFuture RequestManager::prepare_next_batch_verify(
+    std::vector<BeamSearchBatchConfigFuture> const &old_batches) {
+  Runtime *runtime = Runtime::get_runtime();
+  Context ctx = Runtime::get_context();
+
+  RequestManager *rm = this;
+  TaskLauncher launcher(RM_PREPARE_NEXT_BATCH_VERIFY_TASK_ID,
+                        TaskArgument(&rm, sizeof(RequestManager *)));
+  for (auto const &bcf : old_batches) {
+    launcher.add_future(bcf);
+  }
+  return runtime->execute_task(ctx, launcher);
+}
+
+TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  RequestManager *rm = *((RequestManager **)task->args);
+  std::vector<BeamSearchBatchConfig> old_batches;
+  for (auto const &bcf : task->futures) {
+    old_batches.push_back(Future(bcf).get_result<BeamSearchBatchConfig>());
+  }
+  return rm->prepare_next_batch_verify(old_batches);
+}
+
 TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
     std::vector<BeamSearchBatchConfig> const &old_batches) {
   const std::lock_guard<std::mutex> lock(request_queue_mutex);
@@ -721,7 +932,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       continue;
     }
     size_t guid = old_batches.at(0).requestsInfo[i].request_guid;
-    Request &request = running_request_queue[guid];
+    Request &request = all_requests[guid];
 
     // Get the dfs tree
     std::vector<std::vector<std::pair<BatchConfig::TokenId, int>>>
@@ -767,7 +978,9 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
         new_bc.num_tokens++;
         new_bc.requestsInfo[i].num_tokens_in_batch++;
       }
-      if (new_bc.num_tokens == BatchConfig::MAX_NUM_TOKENS) {
+
+      std::cout << "new_bc.num_tokens: " << new_bc.num_tokens << std::endl;
+      if (new_bc.num_tokens >= BatchConfig::MAX_NUM_TOKENS) {
         assert(false &&
                "Exceeding the space available in the TreeVerify batch");
         break;
@@ -885,6 +1098,8 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
         break;
       }
     }
+
+    std::cout << "new_bc.num_tokens: " << new_bc.num_tokens << std::endl;
   }
 
   if (verbose) {
@@ -937,8 +1152,7 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
       int beam_size = old_bc.beamRequestsInfo[index].beam_size;
       int depth = old_bc.beamRequestsInfo[index].current_depth;
 
-      Request &request =
-          running_request_queue[old_bc.requestsInfo[index].request_guid];
+      Request &request = all_requests[old_bc.requestsInfo[index].request_guid];
 
       if (depth == 1) {
         // store the last input into the tree;
@@ -1009,7 +1223,8 @@ void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
     //   new_bc.beamRequestsInfo[request_index].tokens[j] =
     //       tree.treeLayers[depth].tokens[j]; // ?
     // }
-    assert(false);
+    // Do nothing
+    // assert(false);
   } else {
     std::set<int> parents;
     std::set<int> childs;
@@ -1166,9 +1381,11 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
     log_req_mgr.print("(%d, %d)", pair.first, pair.second);
   }
 
-  assert(inputSerializedTree.size() == outputSerializedTree.size());
+  // It's safe to have inputSerializedTree.size() > outputSerializedTree.size()
+  // In this case the inputSeriedTree ends with padding 0s
+  assert(inputSerializedTree.size() >= outputSerializedTree.size());
 
-  for (int i = 0; i < inputSerializedTree.size(); i++) {
+  for (int i = 0; i < outputSerializedTree.size(); i++) {
     auto input = inputSerializedTree.at(i);
     auto output = outputSerializedTree.at(i);
 
@@ -1226,7 +1443,7 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
   }
 
   auto guid = old_bc.requestsInfo[request_index].request_guid;
-  Request &request = running_request_queue[guid];
+  Request &request = all_requests[guid];
   std::cout << "request.beam_trees.size(): " << request.beam_trees.size()
             << std::endl;
   BeamTree tree = request.beam_trees.at(old_bc.model_id);
@@ -1329,4 +1546,147 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
   return merged_tree;
 }
 
+GenerationResult FFModel::generate(std::string const &text,
+                                   int max_seq_length) {
+  RequestManager *rm = RequestManager::get_request_manager();
+  if (rm->get_num_ssms() == 0) {
+    // No SSMs: perform incremental decoding
+    return rm->generate_incr_decoding(this, text, max_seq_length);
+  } else {
+    // Registered SSMs: perform speculative inference
+    return rm->generate_spec_infer(this, text, max_seq_length);
+  }
+}
+
+/*static*/
+GenerationResult RequestManager::generate_incr_decoding(FFModel *llm,
+                                                        std::string const &text,
+                                                        int max_seq_length) {
+  InferenceManager *im = InferenceManager::get_inference_manager();
+  RequestGuid guid = register_new_request(text, max_seq_length);
+  if (guid == 0) {
+    std::cout
+        << "=========== Discard request exceed prompt maximum... ==========="
+        << std::endl;
+    return GenerationResult();
+  }
+
+  int tokens_to_generate = max_seq_length - all_requests[guid].tokens.size();
+  std::queue<std::pair<BatchConfigFuture, InferenceResultFuture>>
+      batch_pipeline;
+  { batch_pipeline.push(std::make_pair(last_bcf, last_irf)); }
+  while (!is_request_completed(guid)) {
+    if (batch_pipeline.size() >= 4) {
+      // Block here to avoid launching too many batches
+      auto const &batch = batch_pipeline.front();
+      batch.second.get_void_result();
+    }
+    // deque finished batches
+    while (batch_pipeline.size() > 1) {
+      auto const &batch = batch_pipeline.front();
+      if (batch.second.is_ready()) {
+        batch_pipeline.pop();
+      } else {
+        break;
+      }
+    }
+    if (is_request_completed(guid)) {
+      break;
+    }
+    auto const &next_batch = batch_pipeline.back();
+    BatchConfigFuture bcf =
+        prepare_next_batch(next_batch.first, next_batch.second);
+    FutureMap fm = im->inference(llm, 0, bcf);
+    assert(fm.get_future_map_domain().get_volume() == 1);
+    InferenceResultFuture irf = fm.get_future(0);
+    batch_pipeline.push(std::make_pair(bcf, irf));
+    last_bcf = bcf;
+    last_irf = irf;
+  }
+  GenerationResult gr = get_generation_result(guid);
+  assert(gr.output_tokens.size() >= max_seq_length);
+  return gr;
+}
+
+/*static*/
+GenerationResult RequestManager::generate_spec_infer(FFModel *llm,
+                                                     std::string const &text,
+                                                     int max_seq_length) {
+  InferenceManager *im = InferenceManager::get_inference_manager();
+  RequestGuid guid = register_new_request(text, max_seq_length);
+  if (guid == 0) {
+    std::cout
+        << "=========== Discard request exceed prompt maximum... ==========="
+        << std::endl;
+    return GenerationResult();
+  }
+
+  std::queue<std::pair<TreeVerifyBatchConfigFuture, InferenceResultFuture>>
+      batch_pipeline;
+  batch_pipeline.push(std::make_pair(last_tree_bcf, last_tree_irf));
+  while (!is_request_completed(guid)) {
+    if (batch_pipeline.size() >= 4) {
+      // Block here to avoid launching too many batches
+      auto const &batch = batch_pipeline.front();
+      batch.second.get_void_result();
+    }
+    // deque finished batches
+    while (batch_pipeline.size() > 1) {
+      auto const &batch = batch_pipeline.front();
+      if (batch.second.is_ready()) {
+        batch_pipeline.pop();
+      } else {
+        break;
+      }
+    }
+    auto const &next_batch = batch_pipeline.back();
+    BeamSearchBatchConfigFuture beam_bcf =
+        prepare_next_batch_init(next_batch.first, next_batch.second, 0);
+    std::vector<BeamSearchBatchConfigFuture> beam_bcf_vec(get_num_ssms());
+    for (size_t ssm_id = 0; ssm_id < get_num_ssms(); ssm_id++) {
+      beam_bcf_vec[ssm_id] = beam_bcf;
+    }
+    // if (is_request_completed(guid)) {
+    //   break;
+    // }
+
+    for (size_t i = 0; i < get_num_ssms(); i++) {
+      for (int depth = 0; depth < BeamSearchBatchConfig::MAX_BEAM_DEPTH;
+           depth++) {
+        beam_bcf = beam_bcf_vec[i];
+
+        FutureMap fm = im->inference(get_model(i), 0, beam_bcf_vec[i]);
+        assert(fm.get_future_map_domain().get_volume() == 1);
+        BeamInferenceResultFuture beam_irf = fm.get_future(0);
+        beam_bcf_vec[i] = prepare_next_batch_beam(beam_bcf_vec[i], beam_irf);
+      }
+    }
+    // Token Tree Verification
+    {
+      TreeVerifyBatchConfigFuture tree_bcf =
+          prepare_next_batch_verify(beam_bcf_vec);
+      FutureMap fm = im->inference(llm, 0, tree_bcf);
+      assert(fm.get_future_map_domain().get_volume() == 1);
+      InferenceResultFuture tree_irf = fm.get_future(0);
+      batch_pipeline.push(std::make_pair(tree_bcf, tree_irf));
+      last_tree_bcf = tree_bcf;
+      last_tree_irf = tree_irf;
+    }
+  }
+
+  GenerationResult gr = get_generation_result(guid);
+  assert(gr.output_tokens.size() >= max_seq_length);
+  return gr;
+}
+
+RequestManager *request_manager_singleton = nullptr;
+
+/*static*/
+RequestManager *RequestManager::get_request_manager() {
+  if (request_manager_singleton == nullptr) {
+    request_manager_singleton = new RequestManager();
+  }
+  return request_manager_singleton;
+}
+
 }; // namespace FlexFlow
diff --git a/src/runtime/request_manager.cpp b/src/runtime/request_manager.cpp
index ffbdac68cd..80554c2add 100644
--- a/src/runtime/request_manager.cpp
+++ b/src/runtime/request_manager.cpp
@@ -13,7 +13,7 @@
  * limitations under the License.
  */
 
-#include "flexflow/inference.h"
+#include "flexflow/request_manager.h"
 #include "flexflow/utils/hip_helper.h"
 #include <hip/hip_runtime.h>
 
diff --git a/src/runtime/request_manager.cu b/src/runtime/request_manager.cu
index a50ca5ad95..abfcd72a38 100644
--- a/src/runtime/request_manager.cu
+++ b/src/runtime/request_manager.cu
@@ -13,7 +13,7 @@
  * limitations under the License.
  */
 
-#include "flexflow/inference.h"
+#include "flexflow/request_manager.h"
 #include "flexflow/utils/cuda_helper.h"
 
 namespace FlexFlow {
@@ -28,22 +28,32 @@ void RequestManager::load_tokens_task(
   assert(regions.size() == 1);
   assert(task->regions.size() == 1);
 
-  BatchConfig const batch_config = *((BatchConfig *)task->args);
+  // BatchConfig const batch_config = *((BatchConfig *)task->args);
+  BatchConfig const *batch_config = BatchConfig::from_future(task->futures[0]);
   BatchConfig::TokenId dram_copy[BatchConfig::MAX_NUM_TOKENS];
-  assert(batch_config.num_tokens <= BatchConfig::MAX_NUM_TOKENS);
-  for (int i = 0; i < batch_config.num_tokens; i++) {
-    dram_copy[i] = batch_config.tokensInfo[i].token_id;
+
+  // Extreme long prompts are not supported, only load up to MAX_NUM_TOKENS as
+  // prompt
+  if (batch_config->num_tokens > BatchConfig::MAX_NUM_TOKENS) {
+    printf("Warning: too many tokens in prompt, only load up to %d tokens\n",
+           BatchConfig::MAX_NUM_TOKENS);
+    printf("Got: %d tokens\n", batch_config->num_tokens);
+  }
+  // assert(batch_config->num_tokens <= BatchConfig::MAX_NUM_TOKENS);
+
+  for (int i = 0; i < batch_config->num_tokens; i++) {
+    dram_copy[i] = batch_config->tokensInfo[i].token_id;
   }
   TokenId *fb_ptr = helperGetTensorPointerWO<TokenId>(
       regions[0], task->regions[0], FID_DATA, ctx, runtime);
   Domain domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
-  assert(batch_config.num_tokens <= domain.get_volume());
+  assert(batch_config->num_tokens <= domain.get_volume());
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDA(cudaMemcpyAsync(fb_ptr,
                             dram_copy,
-                            sizeof(TokenId) * batch_config.num_tokens,
+                            sizeof(TokenId) * batch_config->num_tokens,
                             cudaMemcpyHostToDevice,
                             stream));
 }
@@ -56,7 +66,9 @@ void RequestManager::load_positions_task(
   assert(regions.size() == 1);
   assert(task->regions.size() == 1);
 
-  BatchConfig const batch_config = *((BatchConfig *)task->args);
+  // BatchConfig const batch_config = *((BatchConfig *)task->args);
+  BatchConfig const *batch_config = BatchConfig::from_future(task->futures[0]);
+
   int offset = 2;
   int *pos_ptr = helperGetTensorPointerWO<int>(
       regions[0], task->regions[0], FID_DATA, ctx, runtime);
@@ -64,15 +76,15 @@ void RequestManager::load_positions_task(
       ctx, task->regions[0].region.get_index_space());
   int dram_copy[BatchConfig::MAX_NUM_TOKENS];
 
-  for (int i = 0; i < batch_config.num_tokens; i++) {
-    dram_copy[i] = batch_config.tokensInfo[i].abs_depth_in_request + offset;
+  for (int i = 0; i < batch_config->num_tokens; i++) {
+    dram_copy[i] = batch_config->tokensInfo[i].abs_depth_in_request + offset;
   }
 
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDA(cudaMemcpyAsync(pos_ptr,
                             dram_copy,
-                            sizeof(int) * batch_config.num_tokens,
+                            sizeof(int) * batch_config->num_tokens,
                             cudaMemcpyHostToDevice,
                             stream));
 }

From 664667ecee080f3375f9105bc0eed9d60702f666 Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Fri, 28 Jul 2023 15:50:24 -0400
Subject: [PATCH 185/344] change argmax to DeviceSegmentedReduce::ArgMax &&
 replace cudamalloc with legion instance (#896)

* change argmax to DeviceSegmentedReduce::ArgMax

* replace argmax, beam_topk, rms_norm cudamalloc

* replace layernorm, linear, sampling.

* destructor

* format
---
 include/flexflow/ops/argmax.h                 |  25 +--
 include/flexflow/ops/beam_topk.h              |   7 +-
 include/flexflow/ops/kernels/linear_kernels.h |   2 +
 .../flexflow/ops/kernels/rms_norm_kernels.h   |   7 +-
 include/flexflow/ops/layer_norm.h             |   7 +-
 include/flexflow/ops/rms_norm.h               |   1 +
 include/flexflow/ops/sampling.h               |   6 +-
 include/flexflow/simulator.h                  |   2 +
 src/ops/argmax.cc                             |  78 +++------
 src/ops/argmax.cpp                            |  13 +-
 src/ops/argmax.cu                             | 165 ++++++++++++------
 src/ops/beam_topk.cc                          |   7 +-
 src/ops/beam_topk.cpp                         |   7 +-
 src/ops/beam_topk.cu                          |  58 ++++--
 src/ops/kernels/linear_kernels.cpp            |   1 +
 src/ops/kernels/linear_kernels.cu             |  11 +-
 src/ops/kernels/rms_norm_kernels.cpp          |   6 +-
 src/ops/kernels/rms_norm_kernels.cu           |  19 +-
 src/ops/layer_norm.cc                         |   9 +-
 src/ops/layer_norm.cpp                        |   6 +-
 src/ops/layer_norm.cu                         |  36 ++--
 src/ops/rms_norm.cc                           |   9 +-
 src/ops/sampling.cc                           |  10 +-
 src/ops/sampling.cpp                          |   4 +-
 src/ops/sampling.cu                           |  36 +++-
 25 files changed, 357 insertions(+), 175 deletions(-)

diff --git a/include/flexflow/ops/argmax.h b/include/flexflow/ops/argmax.h
index 709861f51c..298059e3ed 100644
--- a/include/flexflow/ops/argmax.h
+++ b/include/flexflow/ops/argmax.h
@@ -5,6 +5,7 @@
 #include "flexflow/model.h"
 #include "flexflow/node.h"
 #include "flexflow/ops/argmax_params.h"
+#include "flexflow/utils/memory_allocator.h"
 
 namespace FlexFlow {
 
@@ -12,18 +13,20 @@ class ArgMaxMeta : public OpMeta {
 public:
   bool beam_search;
   float *probs;
-#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
-  cudnnTensorDescriptor_t inputTensor, outputTensor;
-  cudnnReduceTensorDescriptor_t reduceMaxDesc;
-#else
-  miopenTensorDescriptor_t inputTensor, outputTensor;
-  miopenReduceTensorDescriptor_t reduceMaxDesc;
-#endif
+  void *d_temp_storage;
+  size_t temp_storage_bytes = 0;
+  int *d_offsets;
+  void *d_out;
+  Realm::RegionInstance reserveInst;
   ArgMaxMeta(FFHandler handler,
              Op const *op,
              Legion::Domain const &input_domain,
              Legion::Domain const &output_domain,
-             GenericTensorAccessorW input);
+             GenericTensorAccessorW input,
+             int batch_size,
+             int total_ele,
+             MemoryAllocator &gpu_mem_allocator);
+  ~ArgMaxMeta(void);
 };
 
 class ArgMax : public Op {
@@ -88,7 +91,7 @@ class ArgMax : public Op {
   static void forward_kernel(ArgMaxMeta const *m,
                              DT *input_ptr,
                              int *indices_ptr,
-                             DT *prob_ptr,
+                             float *prob_ptr,
                              int *parent_ptr,
                              int length,
                              int batch_size,
@@ -96,8 +99,8 @@ class ArgMax : public Op {
   static void forward_kernel_wrapper(ArgMaxMeta const *m,
                                      GenericTensorAccessorW const &input,
                                      GenericTensorAccessorW const &indices,
-                                     GenericTensorAccessorW const &value,
-                                     GenericTensorAccessorW const &parent);
+                                     GenericTensorAccessorW const &parent,
+                                     int batch_size);
   Params get_params() const;
 
 public:
diff --git a/include/flexflow/ops/beam_topk.h b/include/flexflow/ops/beam_topk.h
index 639a8ead92..9466ba2a3b 100644
--- a/include/flexflow/ops/beam_topk.h
+++ b/include/flexflow/ops/beam_topk.h
@@ -5,12 +5,16 @@
 #include "flexflow/model.h"
 #include "flexflow/node.h"
 #include "flexflow/ops/beam_topk_params.h"
+#include "flexflow/utils/memory_allocator.h"
 
 namespace FlexFlow {
 
 class BeamTopKMeta : public OpMeta {
 public:
-  BeamTopKMeta(FFHandler handle, Op const *op);
+  BeamTopKMeta(FFHandler handle,
+               Op const *op,
+               MemoryAllocator &gpu_mem_allocator);
+  ~BeamTopKMeta(void);
   bool sorted;
   int max_beam_width;
   int *parent_ids;
@@ -18,6 +22,7 @@ class BeamTopKMeta : public OpMeta {
   int *block_start_index;
   int *request_id;
   int *tokens_per_request;
+  Realm::RegionInstance reserveInst;
 };
 
 class BeamTopK : public Op {
diff --git a/include/flexflow/ops/kernels/linear_kernels.h b/include/flexflow/ops/kernels/linear_kernels.h
index 29791b53ff..bbebe3c79b 100644
--- a/include/flexflow/ops/kernels/linear_kernels.h
+++ b/include/flexflow/ops/kernels/linear_kernels.h
@@ -15,6 +15,7 @@ class LinearMeta : public OpMeta {
              Linear const *li,
              MemoryAllocator gpu_mem_allocator,
              int weightSize);
+  ~LinearMeta(void);
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
   cudnnTensorDescriptor_t outputTensor;
   cudnnActivationDescriptor_t actiDesc;
@@ -34,6 +35,7 @@ class LinearMeta : public OpMeta {
   float kernel_reg_lambda;
   bool use_bias, add_bias_only_once;
   char op_name[MAX_OPNAME];
+  Realm::RegionInstance reserveInst;
 };
 
 namespace Kernels {
diff --git a/include/flexflow/ops/kernels/rms_norm_kernels.h b/include/flexflow/ops/kernels/rms_norm_kernels.h
index f38e55ae39..2063777ef1 100644
--- a/include/flexflow/ops/kernels/rms_norm_kernels.h
+++ b/include/flexflow/ops/kernels/rms_norm_kernels.h
@@ -5,6 +5,7 @@
 #include "flexflow/device.h"
 #include "flexflow/fftype.h"
 #include "flexflow/op_meta.h"
+#include "flexflow/utils/memory_allocator.h"
 
 namespace FlexFlow {
 using Legion::coord_t;
@@ -13,7 +14,10 @@ class RMSNorm;
 
 class RMSNormMeta : public OpMeta {
 public:
-  RMSNormMeta(FFHandler handler, RMSNorm const *rms);
+  RMSNormMeta(FFHandler handler,
+              RMSNorm const *rms,
+              MemoryAllocator &gpu_mem_allocator);
+  ~RMSNormMeta(void);
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
   cudnnTensorDescriptor_t inputTensor, outputTensor;
   cudnnReduceTensorDescriptor_t reduceDesc;
@@ -34,6 +38,7 @@ class RMSNormMeta : public OpMeta {
   int batch_size;
   int num_elements;
   char op_name[MAX_OPNAME];
+  Realm::RegionInstance reserveInst;
 };
 
 namespace Kernels {
diff --git a/include/flexflow/ops/layer_norm.h b/include/flexflow/ops/layer_norm.h
index 058884cc9a..cb977fc6a6 100644
--- a/include/flexflow/ops/layer_norm.h
+++ b/include/flexflow/ops/layer_norm.h
@@ -2,6 +2,7 @@
 
 #include "flexflow/inference.h"
 #include "flexflow/model.h"
+#include "flexflow/utils/memory_allocator.h"
 namespace FlexFlow {
 
 class LayerNormMeta;
@@ -107,7 +108,10 @@ class LayerNorm : public Op {
 
 class LayerNormMeta : public OpMeta {
 public:
-  LayerNormMeta(FFHandler handle, LayerNorm const *ln);
+  LayerNormMeta(FFHandler handle,
+                LayerNorm const *ln,
+                MemoryAllocator &gpu_mem_allocator);
+  ~LayerNormMeta(void);
 
 public:
   bool elementwise_affine;
@@ -115,6 +119,7 @@ class LayerNormMeta : public OpMeta {
   float eps;
   void *mean_ptr, *rstd_ptr, *ds_ptr, *db_ptr, *scale_ptr, *bias_ptr;
   char op_name[MAX_OPNAME];
+  Realm::RegionInstance reserveInst;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/ops/rms_norm.h b/include/flexflow/ops/rms_norm.h
index 38ce983dd0..979a20976c 100644
--- a/include/flexflow/ops/rms_norm.h
+++ b/include/flexflow/ops/rms_norm.h
@@ -4,6 +4,7 @@
 #include "flexflow/inference.h"
 #include "flexflow/model.h"
 #include "flexflow/ops/rms_norm_params.h"
+#include "flexflow/utils/memory_allocator.h"
 
 namespace FlexFlow {
 
diff --git a/include/flexflow/ops/sampling.h b/include/flexflow/ops/sampling.h
index da554d4f34..789904df32 100644
--- a/include/flexflow/ops/sampling.h
+++ b/include/flexflow/ops/sampling.h
@@ -9,6 +9,7 @@
 #include <curand.h>
 #include <curand_kernel.h>
 #endif
+#include "flexflow/utils/memory_allocator.h"
 
 namespace FlexFlow {
 
@@ -22,6 +23,7 @@ class SamplingMeta : public OpMeta {
   int *idx;
   void *d_temp_storage;
   size_t temp_storage_bytes;
+  Realm::RegionInstance reserveInst;
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
   curandState *state;
 #endif
@@ -29,7 +31,9 @@ class SamplingMeta : public OpMeta {
                Op const *op,
                int batch_size,
                int total_ele,
-               GenericTensorAccessorW input);
+               GenericTensorAccessorW input,
+               MemoryAllocator &gpu_mem_allocator);
+  ~SamplingMeta(void);
 };
 
 class Sampling : public Op {
diff --git a/include/flexflow/simulator.h b/include/flexflow/simulator.h
index 6f0f327110..e410f66325 100644
--- a/include/flexflow/simulator.h
+++ b/include/flexflow/simulator.h
@@ -38,6 +38,7 @@ class LinearMeta;
 class Pool2DMeta;
 class ElementUnaryMeta;
 class ElementBinaryMeta;
+class LayerNormMeta;
 // class EmbeddingMeta;
 // class SoftmaxMeta;
 class BatchMatmulMeta;
@@ -754,6 +755,7 @@ class Simulator {
   LinearMeta *linear_meta;
   Pool2DMeta *pool2d_meta;
   ElementUnaryMeta *ele_unary_meta;
+  LayerNormMeta *layernorm_meta;
   // ElementBinaryMeta *ele_binary_meta;
   // EmbeddingMeta *embedding_meta;
   // SoftmaxMeta *softmax_meta;
diff --git a/src/ops/argmax.cc b/src/ops/argmax.cc
index 8598a71d50..a7476928ba 100644
--- a/src/ops/argmax.cc
+++ b/src/ops/argmax.cc
@@ -51,7 +51,7 @@ Tensor FFModel::argmax(const Tensor input, bool beam_search, char const *name) {
                         name,
                         1 /*inputs*/,
                         0 /*weights*/,
-                        beam_search ? 3 : 2 /*outputs*/,
+                        beam_search ? 2 : 1 /*outputs*/,
                         input);
   {
     int numdims = input->num_dims;
@@ -65,13 +65,9 @@ Tensor FFModel::argmax(const Tensor input, bool beam_search, char const *name) {
     //     numdims, dims, input->data_type, li, 0, true /*create_grad*/);
     li->outputs[0] = create_tensor_legion_ordering(
         numdims, dims, DT_INT32, li, 0, false /*create_grad*/);
-    // logits
-    li->outputs[1] = create_tensor_legion_ordering(
-        numdims, dims, input->data_type, li, 1, false /*create_grad*/);
-
     if (beam_search) {
       // parent id
-      li->outputs[2] = create_tensor_legion_ordering(
+      li->outputs[1] = create_tensor_legion_ordering(
           numdims, dims, DT_INT32, li, 1, false /*create_grad*/);
     }
   }
@@ -116,7 +112,7 @@ ArgMax::ArgMax(FFModel &model,
          name,
          1 /*inputs*/,
          0 /*weights*/,
-         _beam_search ? 3 : 2 /*outputs*/,
+         _beam_search ? 2 : 1 /*outputs*/,
          _input),
       beam_search(_beam_search) {
   int numdim = inputs[0]->num_dims;
@@ -131,11 +127,9 @@ ArgMax::ArgMax(FFModel &model,
   //       numdim, dims, _input->data_type, this, 0 /*owner_idx*/);
   outputs[0] = model.create_parallel_tensor_legion_ordering(
       numdim, dims, DT_INT32, this, 0 /*owner_idx*/);
-  outputs[1] = model.create_parallel_tensor_legion_ordering(
-      numdim, dims, _input->data_type, this, 1 /*owner_idx*/);
   if (_beam_search) {
-    outputs[2] = model.create_parallel_tensor_legion_ordering(
-        numdim, dims, DT_INT32, this, 2 /*owner_idx*/);
+    outputs[1] = model.create_parallel_tensor_legion_ordering(
+        numdim, dims, DT_INT32, this, 1 /*owner_idx*/);
   }
 }
 
@@ -180,12 +174,6 @@ void ArgMax::init_inference(FFModel const &ff,
                                                     EXCLUSIVE,
                                                     batch_outputs[0]->region));
   launcher.add_field(1, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
-                                                    0 /*projection id*/,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_outputs[1]->region));
-  launcher.add_field(2, FID_DATA);
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
   set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
@@ -240,9 +228,22 @@ OpMeta *ArgMax::init_task(Task const *task,
       ctx, task->regions[0].region.get_index_space());
   Domain output_domain = runtime->get_index_space_domain(
       ctx, task->regions[2].region.get_index_space());
+  int length = acc_input.domain.hi()[0] - acc_input.domain.lo()[0] + 1;
+  int batch_size = acc_input.domain.get_volume() / length;
+  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                       .only_kind(Memory::GPU_FB_MEM)
+                       .best_affinity_to(task->target_proc)
+                       .first();
+  MemoryAllocator gpu_mem_allocator(gpu_mem);
 
-  ArgMaxMeta *m =
-      new ArgMaxMeta(handle, s, input_domain, output_domain, acc_input);
+  ArgMaxMeta *m = new ArgMaxMeta(handle,
+                                 s,
+                                 input_domain,
+                                 output_domain,
+                                 acc_input,
+                                 batch_size,
+                                 length * batch_size,
+                                 gpu_mem_allocator);
   m->profiling = s->profiling;
   m->beam_search = s->beam_search;
   return m;
@@ -297,13 +298,6 @@ FutureMap ArgMax::inference(FFModel const &ff,
                           EXCLUSIVE,
                           batch_outputs[1]->region));
     launcher.add_field(2, FID_DATA);
-    launcher.add_region_requirement(
-        RegionRequirement(batch_outputs[2]->part,
-                          0 /*projection id*/,
-                          WRITE_ONLY,
-                          EXCLUSIVE,
-                          batch_outputs[2]->region));
-    launcher.add_field(3, FID_DATA);
     return runtime->execute_index_space(ctx, launcher);
   } else {
     IndexLauncher launcher(ARGMAX_NORM_INF_TASK_ID,
@@ -328,13 +322,6 @@ FutureMap ArgMax::inference(FFModel const &ff,
                           EXCLUSIVE,
                           batch_outputs[0]->region));
     launcher.add_field(1, FID_DATA);
-    launcher.add_region_requirement(
-        RegionRequirement(batch_outputs[1]->part,
-                          0 /*projection id*/,
-                          WRITE_ONLY,
-                          EXCLUSIVE,
-                          batch_outputs[1]->region));
-    launcher.add_field(2, FID_DATA);
     return runtime->execute_index_space(ctx, launcher);
   }
 }
@@ -344,8 +331,8 @@ BeamInferenceResult
                                 std::vector<PhysicalRegion> const &regions,
                                 Context ctx,
                                 Runtime *runtime) {
-  assert(regions.size() == 4);
-  assert(task->regions.size() == 4);
+  assert(regions.size() == 3);
+  assert(task->regions.size() == 3);
   BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
   if (bc->num_tokens == 0) {
     // Directly return for empty batch config
@@ -359,21 +346,14 @@ BeamInferenceResult
   GenericTensorAccessorW indices = helperGetGenericTensorAccessorWO(
       DT_INT32, regions[1], task->regions[1], FID_DATA, ctx, runtime);
   int batch_size = bc->num_active_tokens();
-  GenericTensorAccessorW value = helperGetGenericTensorAccessorWO(
-      m->input_type[0], regions[2], task->regions[1], FID_DATA, ctx, runtime);
   GenericTensorAccessorW parent = helperGetGenericTensorAccessorWO(
-      DT_INT32, regions[3], task->regions[1], FID_DATA, ctx, runtime);
-  ArgMax::forward_kernel_wrapper(m, input, indices, value, parent);
+      DT_INT32, regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  ArgMax::forward_kernel_wrapper(m, input, indices, parent, batch_size);
 
   BeamInferenceResult ir;
   download_tensor<BatchConfig::TokenId>(
       indices.get_int32_ptr(), ir.token_ids, batch_size);
-  if (m->input_type[0] == DT_FLOAT) {
-    download_tensor<float>(value.get_float_ptr(), ir.probs, batch_size);
-  } else if (m->input_type[0] == DT_HALF) {
-    download_tensor(m->probs, ir.probs, batch_size);
-  }
-
+  download_tensor(m->probs, ir.probs, batch_size);
   download_tensor<int>(parent.get_int32_ptr(), ir.parent_id, batch_size);
   return ir;
 }
@@ -383,8 +363,8 @@ InferenceResult
                                 std::vector<PhysicalRegion> const &regions,
                                 Context ctx,
                                 Runtime *runtime) {
-  assert(regions.size() == 3);
-  assert(task->regions.size() == 3);
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
   ArgMaxMeta const *m = *((ArgMaxMeta **)task->local_args);
   BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
   if (bc->num_tokens == 0) {
@@ -397,11 +377,9 @@ InferenceResult
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
   GenericTensorAccessorW indices = helperGetGenericTensorAccessorWO(
       DT_INT32, regions[1], task->regions[1], FID_DATA, ctx, runtime);
-  GenericTensorAccessorW value = helperGetGenericTensorAccessorWO(
-      m->input_type[0], regions[2], task->regions[1], FID_DATA, ctx, runtime);
   GenericTensorAccessorW parent;
   int batch_size = bc->num_active_tokens();
-  ArgMax::forward_kernel_wrapper(m, input, indices, value, parent);
+  ArgMax::forward_kernel_wrapper(m, input, indices, parent, batch_size);
   InferenceResult ir;
   download_tensor<BatchConfig::TokenId>(
       indices.get_int32_ptr(), ir.token_ids, batch_size);
diff --git a/src/ops/argmax.cpp b/src/ops/argmax.cpp
index 1395a1cdeb..778ddf3c9d 100644
--- a/src/ops/argmax.cpp
+++ b/src/ops/argmax.cpp
@@ -25,7 +25,7 @@ template <typename DT>
 void ArgMax::forward_kernel(ArgMaxMeta const *m,
                             DT *input_ptr,
                             int *indices_ptr,
-                            DT *prob_ptr,
+                            float *prob_ptr,
                             int *parent_ptr,
                             int length,
                             int batch_size,
@@ -35,8 +35,8 @@ void ArgMax::forward_kernel(ArgMaxMeta const *m,
 void ArgMax::forward_kernel_wrapper(ArgMaxMeta const *m,
                                     GenericTensorAccessorW const &input,
                                     GenericTensorAccessorW const &indices,
-                                    GenericTensorAccessorW const &value,
-                                    GenericTensorAccessorW const &parent) {
+                                    GenericTensorAccessorW const &parent,
+                                    int batch_size) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -63,7 +63,12 @@ ArgMaxMeta::ArgMaxMeta(FFHandler handler,
                        Op const *op,
                        Legion::Domain const &input_domain,
                        Legion::Domain const &output_domain,
-                       GenericTensorAccessorW input)
+                       GenericTensorAccessorW input,
+                       int batch_size,
+                       int total_ele,
+                       MemoryAllocator &gpu_mem_allocator)
     : OpMeta(handler, op) {}
 
+ArgMaxMeta::~ArgMaxMeta(void) {}
+
 }; // namespace FlexFlow
\ No newline at end of file
diff --git a/src/ops/argmax.cu b/src/ops/argmax.cu
index 99487ea380..37e067006c 100644
--- a/src/ops/argmax.cu
+++ b/src/ops/argmax.cu
@@ -12,17 +12,35 @@
  * See the License for the specific language governing permissions and
  * limitations under the License.
  */
-
 #include "flexflow/ffconst_utils.h"
 #include "flexflow/ops/argmax.h"
 #include "flexflow/utils/cuda_helper.h"
+#include <cub/cub.cuh>
 
 namespace FlexFlow {
 
-__global__ void
-    half_2_float_array(half *ptr, float *ptr_f, int num_of_elements) {
-  CUDA_KERNEL_LOOP(i, num_of_elements) {
-    ptr_f[i] = __half2float(ptr[i]);
+__global__ void init_offset(int batch_size,
+                            int vocab_size,
+                            int total_eles,
+                            int *d_offsets) {
+  CUDA_KERNEL_LOOP(i, total_eles) {
+    if (i % vocab_size == 0) {
+      d_offsets[i / vocab_size] = i;
+    }
+  }
+}
+
+template <typename DT>
+__global__ void copy_result(cub::KeyValuePair<int, DT> *d_out,
+                            int *indices,
+                            float *prob_ptr,
+                            int batch_size,
+                            bool beam_search) {
+  CUDA_KERNEL_LOOP(i, batch_size) {
+    indices[i] = d_out[i].key;
+    if (beam_search) {
+      prob_ptr[i] = static_cast<float>(d_out[i].value);
+    }
   }
 }
 
@@ -31,7 +49,7 @@ template <typename DT>
 void ArgMax::forward_kernel(ArgMaxMeta const *m,
                             DT *input_ptr,
                             int *indices_ptr,
-                            DT *prob_ptr,
+                            float *prob_ptr,
                             int *parent,
                             int const length,
                             int const batch_size,
@@ -43,26 +61,36 @@ void ArgMax::forward_kernel(ArgMaxMeta const *m,
     // set all parents id zero in arg top1 case.
     checkCUDA(cudaMemset(parent, 0, batch_size * sizeof(int)));
   }
-  checkCUDNN(cudnnReduceTensor(m->handle.dnn,
-                               m->reduceMaxDesc,
-                               indices_ptr /*indices*/,
-                               batch_size * sizeof(int) /*indicesSizeInBytes*/,
-                               m->handle.workSpace,
-                               m->handle.workSpaceSize,
-                               &alpha,
-                               m->inputTensor,
-                               input_ptr,
-                               &beta,
-                               m->outputTensor,
-                               prob_ptr));
+  size_t temp_storage_bytes = m->temp_storage_bytes;
+  // use cub
+  checkCUDA(cub::DeviceSegmentedReduce::ArgMax(
+      m->d_temp_storage,
+      temp_storage_bytes,
+      input_ptr,
+      static_cast<cub::KeyValuePair<int, DT> *>(m->d_out),
+      batch_size,
+      m->d_offsets,
+      m->d_offsets + 1,
+      stream));
+
+  // copy dout to incides
+  int parallelism = batch_size;
+  copy_result<<<GET_BLOCKS(parallelism),
+                min(CUDA_NUM_THREADS, parallelism),
+                0,
+                stream>>>(static_cast<cub::KeyValuePair<int, DT> *>(m->d_out),
+                          indices_ptr,
+                          prob_ptr,
+                          batch_size,
+                          m->beam_search);
 }
 
 /*static*/
 void ArgMax::forward_kernel_wrapper(ArgMaxMeta const *m,
                                     GenericTensorAccessorW const &input,
                                     GenericTensorAccessorW const &indices,
-                                    GenericTensorAccessorW const &value,
-                                    GenericTensorAccessorW const &parent) {
+                                    GenericTensorAccessorW const &parent,
+                                    int batch_size) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -73,31 +101,23 @@ void ArgMax::forward_kernel_wrapper(ArgMaxMeta const *m,
     cudaEventRecord(t_start, stream);
   }
   int length = input.domain.hi()[0] - input.domain.lo()[0] + 1;
-  int batch_size = input.domain.get_volume() / length;
 
   if (input.data_type == DT_HALF) {
     ArgMax::forward_kernel<half>(m,
                                  input.get_half_ptr(),
                                  indices.get_int32_ptr(),
-                                 value.get_half_ptr(),
+                                 m->probs,
                                  m->beam_search ? parent.get_int32_ptr()
                                                 : nullptr,
                                  length,
                                  batch_size,
                                  stream);
-    if (m->beam_search) {
-      half_2_float_array<<<GET_BLOCKS(batch_size),
-                           CUDA_NUM_THREADS,
-                           0,
-                           stream>>>(
-          value.get_half_ptr(), m->probs, batch_size);
-    }
 
   } else if (input.data_type == DT_FLOAT) {
     ArgMax::forward_kernel<float>(m,
                                   input.get_float_ptr(),
                                   indices.get_int32_ptr(),
-                                  value.get_float_ptr(),
+                                  m->probs,
                                   m->beam_search ? parent.get_int32_ptr()
                                                  : nullptr,
                                   length,
@@ -122,30 +142,71 @@ ArgMaxMeta::ArgMaxMeta(FFHandler handler,
                        Op const *op,
                        Legion::Domain const &input_domain,
                        Legion::Domain const &output_domain,
-                       GenericTensorAccessorW input)
+                       GenericTensorAccessorW input,
+                       int batch_size,
+                       int total_ele,
+                       MemoryAllocator &gpu_mem_allocator)
     : OpMeta(handler, op) {
   DataType data_type = op->data_type;
-  checkCUDNN(cudnnCreateTensorDescriptor(&inputTensor));
-  checkCUDNN(cudnnCreateTensorDescriptor(&outputTensor));
-  checkCUDNN(cudnnCreateReduceTensorDescriptor(&reduceMaxDesc));
-
-  // Float and Half use save type, according to
-  // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#cudnnReduceTensor:~:text=not%20coordinate%20tuples.-,The%20data%20types%20of%20the%20tensors,.,-Note%3A
-  cudnnDataType_t cudnn_data_type = CUDNN_DATA_FLOAT;
-
-  checkCUDNN(
-      cudnnSetReduceTensorDescriptor(reduceMaxDesc,
-                                     CUDNN_REDUCE_TENSOR_MAX,
-                                     cudnn_data_type,
-                                     CUDNN_PROPAGATE_NAN,
-                                     CUDNN_REDUCE_TENSOR_FLATTENED_INDICES,
-                                     CUDNN_32BIT_INDICES));
-  checkCUDNN(cudnnSetTensorDescriptorFromDomain(
-      outputTensor, output_domain, data_type));
-  checkCUDNN(
-      cudnnSetTensorDescriptorFromDomain(inputTensor, input_domain, data_type));
-
-  checkCUDA(cudaMalloc(&probs, sizeof(float) * BatchConfig::MAX_NUM_TOKENS));
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  size_t d_offsets_size = batch_size;
+  size_t prob_size = batch_size;
+  assert(data_type == DT_FLOAT || data_type == DT_HALF);
+  size_t total_size =
+      d_offsets_size * sizeof(int) +
+      (data_type == DT_FLOAT
+           ? sizeof(cub::KeyValuePair<int, float>) * batch_size
+           : sizeof(cub::KeyValuePair<int, half>) * batch_size) +
+      prob_size * sizeof(float);
+  gpu_mem_allocator.create_legion_instance(reserveInst, total_size);
+  d_offsets = gpu_mem_allocator.allocate_instance<int>(d_offsets_size);
+  d_out = data_type == DT_FLOAT
+              ? gpu_mem_allocator.allocate_instance_untyped(
+                    batch_size * sizeof(cub::KeyValuePair<int, float>))
+              : gpu_mem_allocator.allocate_instance_untyped(
+                    batch_size * sizeof(cub::KeyValuePair<int, half>));
+  probs = gpu_mem_allocator.allocate_instance<float>(prob_size);
+  // init offset
+  int parallelism = total_ele;
+  init_offset<<<GET_BLOCKS(parallelism),
+                min(CUDA_NUM_THREADS, parallelism),
+                0,
+                stream>>>(
+      batch_size, total_ele / batch_size, total_ele, d_offsets);
+
+  if (data_type == DT_FLOAT) {
+    checkCUDA(cub::DeviceSegmentedReduce::ArgMax(
+        d_temp_storage,
+        temp_storage_bytes,
+        input.get_float_ptr(),
+        static_cast<cub::KeyValuePair<int, float> *>(d_out),
+        batch_size,
+        d_offsets,
+        d_offsets + 1,
+        stream));
+
+  } else if (data_type == DT_HALF) {
+    checkCUDA(cub::DeviceSegmentedReduce::ArgMax(
+        d_temp_storage,
+        temp_storage_bytes,
+        input.get_half_ptr(),
+        static_cast<cub::KeyValuePair<int, half> *>(d_out),
+        batch_size,
+        d_offsets,
+        d_offsets + 1,
+        stream));
+  }
+
+  gpu_mem_allocator.create_legion_instance(reserveInst, temp_storage_bytes);
+  d_temp_storage =
+      gpu_mem_allocator.allocate_instance_untyped(temp_storage_bytes);
 }
 
+ArgMaxMeta::~ArgMaxMeta(void) {
+  if (reserveInst != Realm::RegionInstance::NO_INST) {
+    reserveInst.destroy();
+  }
+}
 }; // namespace FlexFlow
\ No newline at end of file
diff --git a/src/ops/beam_topk.cc b/src/ops/beam_topk.cc
index 1c71e69c9d..93a6de5a8f 100644
--- a/src/ops/beam_topk.cc
+++ b/src/ops/beam_topk.cc
@@ -271,7 +271,12 @@ OpMeta *BeamTopK::init_task(Task const *task,
                             Runtime *runtime) {
   BeamTopK *topk = (BeamTopK *)task->args;
   FFHandler handle = *((FFHandler *)task->local_args);
-  BeamTopKMeta *m = new BeamTopKMeta(handle, topk);
+  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                       .only_kind(Memory::GPU_FB_MEM)
+                       .best_affinity_to(task->target_proc)
+                       .first();
+  MemoryAllocator gpu_mem_allocator(gpu_mem);
+  BeamTopKMeta *m = new BeamTopKMeta(handle, topk, gpu_mem_allocator);
   m->profiling = topk->profiling;
   m->sorted = topk->sorted;
   m->max_beam_width = topk->max_beam_width;
diff --git a/src/ops/beam_topk.cpp b/src/ops/beam_topk.cpp
index 248ab188da..293feecff0 100644
--- a/src/ops/beam_topk.cpp
+++ b/src/ops/beam_topk.cpp
@@ -678,7 +678,10 @@ void BeamTopK::forward_kernel_wrapper(BeamTopKMeta const *m,
   }
 }
 
-BeamTopKMeta::BeamTopKMeta(FFHandler handler, Op const *op) : OpMeta(handler) {
+BeamTopKMeta::BeamTopKMeta(FFHandler handler,
+                           Op const *op,
+                           MemoryAllocator &gpu_mem_allocator)
+    : OpMeta(handler) {
   DataType data_type = op->inputs[0]->data_type;
   checkCUDA(hipMalloc(&parent_ids,
                       sizeof(int) * BeamSearchBatchConfig::MAX_BEAM_WIDTH *
@@ -697,4 +700,6 @@ BeamTopKMeta::BeamTopKMeta(FFHandler handler, Op const *op) : OpMeta(handler) {
                       sizeof(int) * BeamSearchBatchConfig::MAX_NUM_TOKENS *
                           BeamSearchBatchConfig::MAX_NUM_REQUESTS));
 }
+
+BeamTopKMeta::~BeamTopKMeta(void) {}
 }; // namespace FlexFlow
diff --git a/src/ops/beam_topk.cu b/src/ops/beam_topk.cu
index ceddb55f2d..42fa7a5ab5 100644
--- a/src/ops/beam_topk.cu
+++ b/src/ops/beam_topk.cu
@@ -710,23 +710,47 @@ void BeamTopK::forward_kernel_wrapper(BeamTopKMeta const *m,
   }
 }
 
-BeamTopKMeta::BeamTopKMeta(FFHandler handler, Op const *op) : OpMeta(handler) {
+BeamTopKMeta::BeamTopKMeta(FFHandler handler,
+                           Op const *op,
+                           MemoryAllocator &gpu_mem_allocator)
+    : OpMeta(handler) {
   DataType data_type = op->inputs[0]->data_type;
-  checkCUDA(cudaMalloc(&parent_ids,
-                       sizeof(int) * BeamSearchBatchConfig::MAX_BEAM_WIDTH *
-                           BeamSearchBatchConfig::MAX_NUM_REQUESTS));
-  checkCUDA(cudaMalloc(&acc_probs,
-                       data_type_size(data_type) *
-                           BeamSearchBatchConfig::MAX_BEAM_WIDTH *
-                           BeamSearchBatchConfig::MAX_NUM_REQUESTS));
-  checkCUDA(cudaMalloc(&block_start_index,
-                       sizeof(int) * BeamSearchBatchConfig::MAX_NUM_TOKENS *
-                           BeamSearchBatchConfig::MAX_NUM_REQUESTS));
-  checkCUDA(cudaMalloc(&request_id,
-                       sizeof(int) * BeamSearchBatchConfig::MAX_NUM_TOKENS *
-                           BeamSearchBatchConfig::MAX_NUM_REQUESTS));
-  checkCUDA(cudaMalloc(&tokens_per_request,
-                       sizeof(int) * BeamSearchBatchConfig::MAX_NUM_TOKENS *
-                           BeamSearchBatchConfig::MAX_NUM_REQUESTS));
+  size_t parent_id_size = BeamSearchBatchConfig::MAX_BEAM_WIDTH *
+                          BeamSearchBatchConfig::MAX_NUM_REQUESTS;
+  size_t acc_probs_size = BeamSearchBatchConfig::MAX_BEAM_WIDTH *
+                          BeamSearchBatchConfig::MAX_NUM_REQUESTS;
+  size_t block_start_index_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
+                                  BeamSearchBatchConfig::MAX_NUM_REQUESTS;
+  size_t request_id_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
+                           BeamSearchBatchConfig::MAX_NUM_REQUESTS;
+  size_t tokens_per_request_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
+                                   BeamSearchBatchConfig::MAX_NUM_REQUESTS;
+  size_t totalSize = sizeof(int) * parent_id_size +
+                     data_type_size(data_type) * acc_probs_size +
+                     sizeof(int) * block_start_index_size +
+                     sizeof(int) * request_id_size +
+                     sizeof(int) * tokens_per_request_size;
+
+  gpu_mem_allocator.create_legion_instance(reserveInst, totalSize);
+  parent_ids = gpu_mem_allocator.allocate_instance<int>(parent_id_size);
+  if (data_type == DT_FLOAT) {
+    acc_probs = gpu_mem_allocator.allocate_instance<float>(acc_probs_size);
+  } else if (data_type == DT_HALF) {
+    acc_probs = gpu_mem_allocator.allocate_instance<half>(acc_probs_size);
+  } else {
+    assert(false);
+  }
+
+  block_start_index =
+      gpu_mem_allocator.allocate_instance<int>(block_start_index_size);
+  request_id = gpu_mem_allocator.allocate_instance<int>(request_id_size);
+  tokens_per_request =
+      gpu_mem_allocator.allocate_instance<int>(tokens_per_request_size);
+}
+
+BeamTopKMeta::~BeamTopKMeta(void) {
+  if (reserveInst != Realm::RegionInstance::NO_INST) {
+    reserveInst.destroy();
+  }
 }
 }; // namespace FlexFlow
diff --git a/src/ops/kernels/linear_kernels.cpp b/src/ops/kernels/linear_kernels.cpp
index 41b9912702..0d70e91d47 100644
--- a/src/ops/kernels/linear_kernels.cpp
+++ b/src/ops/kernels/linear_kernels.cpp
@@ -41,6 +41,7 @@ LinearMeta::LinearMeta(FFHandler handler,
   checkCUDNN(miopenCreateActivationDescriptor(&actiDesc));
   checkCUDNN(miopenCreateTensorDescriptor(&outputTensor));
 }
+LinearMeta::~LinearMeta(void) {}
 
 namespace Kernels {
 namespace Linear {
diff --git a/src/ops/kernels/linear_kernels.cu b/src/ops/kernels/linear_kernels.cu
index 06677f86e6..8a93357dcf 100644
--- a/src/ops/kernels/linear_kernels.cu
+++ b/src/ops/kernels/linear_kernels.cu
@@ -39,7 +39,10 @@ LinearMeta::LinearMeta(FFHandler handler,
     }
   }
   // Allocate an all-one's vector
-  checkCUDA(cudaMalloc(&one_ptr, data_type_size(data_type) * batch_size));
+  gpu_mem_allocator.create_legion_instance(
+      reserveInst, data_type_size(data_type) * batch_size);
+  one_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * batch_size);
   int parallelism = batch_size;
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
@@ -62,6 +65,12 @@ LinearMeta::LinearMeta(FFHandler handler,
   checkCUDNN(cudnnCreateTensorDescriptor(&outputTensor));
 }
 
+LinearMeta::~LinearMeta(void) {
+  if (reserveInst != Realm::RegionInstance::NO_INST) {
+    reserveInst.destroy();
+  }
+}
+
 namespace Kernels {
 namespace Linear {
 
diff --git a/src/ops/kernels/rms_norm_kernels.cpp b/src/ops/kernels/rms_norm_kernels.cpp
index 5de12b3f1f..b2e2648785 100644
--- a/src/ops/kernels/rms_norm_kernels.cpp
+++ b/src/ops/kernels/rms_norm_kernels.cpp
@@ -22,9 +22,11 @@ namespace FlexFlow {
 // declare Legion names
 using Legion::coord_t;
 
-RMSNormMeta::RMSNormMeta(FFHandler handler, RMSNorm const *rms)
+RMSNormMeta::RMSNormMeta(FFHandler handler,
+                         RMSNorm const *rms,
+                         MemoryAllocator &gpu_mem_allocator)
     : OpMeta(handler, rms) {}
-
+RMSNormMeta::~RMSNormMeta(void) {}
 namespace Kernels {
 namespace RMSNorm {
 
diff --git a/src/ops/kernels/rms_norm_kernels.cu b/src/ops/kernels/rms_norm_kernels.cu
index 44e6288529..234bf73150 100644
--- a/src/ops/kernels/rms_norm_kernels.cu
+++ b/src/ops/kernels/rms_norm_kernels.cu
@@ -27,7 +27,9 @@ using Legion::coord_t;
 constexpr int kCUDABlockReduceNumThreads = 512;
 constexpr int kCUDANumThreads = 256;
 
-RMSNormMeta::RMSNormMeta(FFHandler handler, RMSNorm const *rms)
+RMSNormMeta::RMSNormMeta(FFHandler handler,
+                         RMSNorm const *rms,
+                         MemoryAllocator &gpu_mem_allocator)
     : OpMeta(handler, rms) {
   eps = rms->eps;
   alpha = 1.0f;
@@ -38,8 +40,19 @@ RMSNormMeta::RMSNormMeta(FFHandler handler, RMSNorm const *rms)
   num_elements = in_dim * batch_size;
 
   DataType data_type = rms->weights[0]->data_type;
-  checkCUDA(cudaMalloc(&rms_ptr, batch_size * data_type_size(data_type)));
-  checkCUDA(cudaMalloc(&norm_ptr, num_elements * data_type_size(data_type)));
+  size_t rms_ptr_size = batch_size;
+  size_t norm_ptr_size = num_elements;
+  size_t totalSize = (rms_ptr_size + norm_ptr_size) * data_type_size(data_type);
+  gpu_mem_allocator.create_legion_instance(reserveInst, totalSize);
+  rms_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      rms_ptr_size * data_type_size(data_type));
+  norm_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      norm_ptr_size * data_type_size(data_type));
+}
+RMSNormMeta::~RMSNormMeta(void) {
+  if (reserveInst != Realm::RegionInstance::NO_INST) {
+    reserveInst.destroy();
+  }
 }
 
 namespace Kernels {
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index b9b3abe0f1..dcbb0cc1e5 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -355,7 +355,12 @@ OpMeta *LayerNorm::init_task(Task const *task,
                              Runtime *runtime) {
   LayerNorm *ln = (LayerNorm *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
-  LayerNormMeta *meta = new LayerNormMeta(handle, ln);
+  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                       .only_kind(Memory::GPU_FB_MEM)
+                       .best_affinity_to(task->target_proc)
+                       .first();
+  MemoryAllocator gpu_mem_allocator(gpu_mem);
+  LayerNormMeta *meta = new LayerNormMeta(handle, ln, gpu_mem_allocator);
   meta->input_type[0] = ln->inputs[0]->data_type;
   meta->output_type[0] = ln->outputs[0]->data_type;
   return meta;
@@ -651,7 +656,7 @@ bool LayerNorm::measure_operator_cost(Simulator *sim,
   }
   Domain input_domain = sub_input.get_domain();
   Domain output_domain = sub_output.get_domain();
-  LayerNormMeta *m = new LayerNormMeta(sim->handler, this);
+  LayerNormMeta *m = sim->layernorm_meta;
 
   sim->free_all();
   float *in_ptr = (float *)sim->allocate(sub_input.get_volume(), DT_FLOAT);
diff --git a/src/ops/layer_norm.cpp b/src/ops/layer_norm.cpp
index fc6be70c74..855f7296e8 100644
--- a/src/ops/layer_norm.cpp
+++ b/src/ops/layer_norm.cpp
@@ -24,7 +24,9 @@ constexpr int kCUDABlockReduceNumThreads = 512;
 constexpr int kCUDANumThreads = 256;
 constexpr int kColwiseReduceTileSize = 32;
 
-LayerNormMeta::LayerNormMeta(FFHandler handle, LayerNorm const *ln)
+LayerNormMeta::LayerNormMeta(FFHandler handle,
+                             LayerNorm const *ln,
+                             MemoryAllocator &gpu_mem_allocator)
     : OpMeta(handle) {
   elementwise_affine = ln->elementwise_affine;
   effective_batch_size = ln->effective_batch_size;
@@ -38,6 +40,8 @@ LayerNormMeta::LayerNormMeta(FFHandler handle, LayerNorm const *ln)
   checkCUDA(hipMalloc(&bias_ptr, sizeof(float) * effective_batch_size));
 }
 
+LayerNormMeta::~LayerNormMeta(void) {}
+
 template <typename T>
 __device__ __forceinline__ T WARP_SHFL_DOWN(T value,
                                             unsigned int delta,
diff --git a/src/ops/layer_norm.cu b/src/ops/layer_norm.cu
index 1f4e7d3933..f594f8f7a8 100644
--- a/src/ops/layer_norm.cu
+++ b/src/ops/layer_norm.cu
@@ -24,7 +24,9 @@ constexpr int kCUDABlockReduceNumThreads = 512;
 constexpr int kCUDANumThreads = 256;
 constexpr int kColwiseReduceTileSize = 32;
 
-LayerNormMeta::LayerNormMeta(FFHandler handle, LayerNorm const *ln)
+LayerNormMeta::LayerNormMeta(FFHandler handle,
+                             LayerNorm const *ln,
+                             MemoryAllocator &gpu_mem_allocator)
     : OpMeta(handle) {
   elementwise_affine = ln->elementwise_affine;
   effective_batch_size = ln->effective_batch_size;
@@ -32,18 +34,26 @@ LayerNormMeta::LayerNormMeta(FFHandler handle, LayerNorm const *ln)
   profiling = ln->profiling;
   eps = ln->eps;
   DataType data_type = ln->data_type;
-  checkCUDA(
-      cudaMalloc(&mean_ptr, data_type_size(data_type) * effective_batch_size));
-  checkCUDA(
-      cudaMalloc(&rstd_ptr, data_type_size(data_type) * effective_batch_size));
-  checkCUDA(
-      cudaMalloc(&ds_ptr, data_type_size(data_type) * effective_batch_size));
-  checkCUDA(
-      cudaMalloc(&db_ptr, data_type_size(data_type) * effective_batch_size));
-  checkCUDA(
-      cudaMalloc(&scale_ptr, data_type_size(data_type) * effective_batch_size));
-  checkCUDA(
-      cudaMalloc(&bias_ptr, data_type_size(data_type) * effective_batch_size));
+  size_t totalSize = effective_batch_size * data_type_size(data_type) * 6;
+  gpu_mem_allocator.create_legion_instance(reserveInst, totalSize);
+  mean_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+  rstd_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+  ds_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+  db_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+  scale_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+  bias_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+}
+
+LayerNormMeta::~LayerNormMeta(void) {
+  if (reserveInst != Realm::RegionInstance::NO_INST) {
+    reserveInst.destroy();
+  }
 }
 
 template <typename T>
diff --git a/src/ops/rms_norm.cc b/src/ops/rms_norm.cc
index 5529abba20..1f21591130 100644
--- a/src/ops/rms_norm.cc
+++ b/src/ops/rms_norm.cc
@@ -27,6 +27,8 @@ using Legion::Context;
 using Legion::Domain;
 using Legion::FutureMap;
 using Legion::IndexLauncher;
+using Legion::Machine;
+using Legion::Memory;
 using Legion::PhysicalRegion;
 using Legion::Predicate;
 using Legion::Rect;
@@ -289,7 +291,12 @@ OpMeta *RMSNorm::init_task(Task const *task,
                            Runtime *runtime) {
   RMSNorm *rn = (RMSNorm *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
-  RMSNormMeta *meta = new RMSNormMeta(handle, rn);
+  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                       .only_kind(Memory::GPU_FB_MEM)
+                       .best_affinity_to(task->target_proc)
+                       .first();
+  MemoryAllocator gpu_mem_allocator(gpu_mem);
+  RMSNormMeta *meta = new RMSNormMeta(handle, rn, gpu_mem_allocator);
   return meta;
 }
 
diff --git a/src/ops/sampling.cc b/src/ops/sampling.cc
index 66b3420a39..79e6027b7c 100644
--- a/src/ops/sampling.cc
+++ b/src/ops/sampling.cc
@@ -223,9 +223,13 @@ OpMeta *Sampling::init_task(Task const *task,
 
   int length = acc_input.domain.hi()[0] - acc_input.domain.lo()[0] + 1;
   int batch_size = acc_input.domain.get_volume() / length;
-
-  SamplingMeta *m =
-      new SamplingMeta(handle, s, batch_size, length * batch_size, acc_input);
+  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                       .only_kind(Memory::GPU_FB_MEM)
+                       .best_affinity_to(task->target_proc)
+                       .first();
+  MemoryAllocator gpu_mem_allocator(gpu_mem);
+  SamplingMeta *m = new SamplingMeta(
+      handle, s, batch_size, length * batch_size, acc_input, gpu_mem_allocator);
   m->profiling = s->profiling;
   m->top_p = s->top_p;
   return m;
diff --git a/src/ops/sampling.cpp b/src/ops/sampling.cpp
index 4901fe400c..56f3f604d5 100644
--- a/src/ops/sampling.cpp
+++ b/src/ops/sampling.cpp
@@ -61,7 +61,9 @@ SamplingMeta::SamplingMeta(FFHandler handler,
                            Op const *op,
                            int batch_size,
                            int total_ele,
-                           GenericTensorAccessorW input)
+                           GenericTensorAccessorW input,
+                           MemoryAllocator &gpu_mem_allocator)
     : OpMeta(handler, op) {}
 
+SamplingMeta::~SamplingMeta(void) {}
 }; // namespace FlexFlow
\ No newline at end of file
diff --git a/src/ops/sampling.cu b/src/ops/sampling.cu
index a91263a621..461d72ec71 100644
--- a/src/ops/sampling.cu
+++ b/src/ops/sampling.cu
@@ -201,17 +201,29 @@ SamplingMeta::SamplingMeta(FFHandler handler,
                            Op const *op,
                            int batch_size,
                            int total_ele,
-                           GenericTensorAccessorW input)
+                           GenericTensorAccessorW input,
+                           MemoryAllocator &gpu_mem_allocator)
     : OpMeta(handler, op) {
   DataType data_type = op->data_type;
-  checkCUDA(cudaMalloc(&begin_offset, (batch_size + 1) * sizeof(int)));
-  checkCUDA(cudaMalloc(&end_offset, (batch_size + 1) * sizeof(int)));
-  checkCUDA(cudaMalloc(&idx, total_ele * sizeof(int)));
 
-  checkCUDA(cudaMalloc(&sorted_idx, total_ele * sizeof(int)));
-  checkCUDA(cudaMalloc(&sorted_logits, total_ele * data_type_size(data_type)));
-  cudaMalloc(&state, sizeof(curandState) * batch_size);
+  size_t begin_offset_size, end_offset_size;
+  begin_offset_size = end_offset_size = batch_size + 1;
+  size_t idx_size, sorted_idx_size, sorted_logits_size;
+  idx_size = sorted_idx_size = sorted_logits_size = total_ele;
+  size_t state_size = batch_size;
 
+  size_t totalSize = sizeof(int) * (begin_offset_size + end_offset_size +
+                                    idx_size + sorted_idx_size) +
+                     data_type_size(data_type) * sorted_logits_size +
+                     sizeof(curandState) * state_size;
+  gpu_mem_allocator.create_legion_instance(reserveInst, totalSize);
+  begin_offset = gpu_mem_allocator.allocate_instance<int>(begin_offset_size);
+  end_offset = gpu_mem_allocator.allocate_instance<int>(end_offset_size);
+  idx = gpu_mem_allocator.allocate_instance<int>(idx_size);
+  sorted_idx = gpu_mem_allocator.allocate_instance<int>(sorted_idx_size);
+  sorted_logits = gpu_mem_allocator.allocate_instance_untyped(
+      sorted_logits_size * data_type_size(data_type));
+  state = gpu_mem_allocator.allocate_instance<curandState>(state_size);
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -261,7 +273,15 @@ SamplingMeta::SamplingMeta(FFHandler handler,
   } else {
     assert(false && "input type in float and half");
   }
-  checkCUDA(cudaMalloc(&d_temp_storage, temp_storage_bytes));
+
+  gpu_mem_allocator.create_legion_instance(reserveInst, temp_storage_bytes);
+  d_temp_storage =
+      gpu_mem_allocator.allocate_instance_untyped(temp_storage_bytes);
 }
 
+SamplingMeta::~SamplingMeta(void) {
+  if (reserveInst != Realm::RegionInstance::NO_INST) {
+    reserveInst.destroy();
+  }
+}
 }; // namespace FlexFlow
\ No newline at end of file

From 0f8b4868edb190c0d09b30fa9a762e860a4d5f29 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Sun, 30 Jul 2023 17:13:54 -0500
Subject: [PATCH 186/344] enable tracing (#901)

---
 src/runtime/request_manager.cc | 8 ++++++++
 1 file changed, 8 insertions(+)

diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 0856c1663f..eea02601e8 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -1593,6 +1593,9 @@ GenerationResult RequestManager::generate_incr_decoding(FFModel *llm,
     if (is_request_completed(guid)) {
       break;
     }
+    Runtime *runtime = Runtime::get_runtime();
+    Context ctx = Runtime::get_context();
+    runtime->begin_trace(ctx, 12346 /*trace_id*/);
     auto const &next_batch = batch_pipeline.back();
     BatchConfigFuture bcf =
         prepare_next_batch(next_batch.first, next_batch.second);
@@ -1602,6 +1605,7 @@ GenerationResult RequestManager::generate_incr_decoding(FFModel *llm,
     batch_pipeline.push(std::make_pair(bcf, irf));
     last_bcf = bcf;
     last_irf = irf;
+    runtime->end_trace(ctx, 12346 /*trace_id*/);
   }
   GenerationResult gr = get_generation_result(guid);
   assert(gr.output_tokens.size() >= max_seq_length);
@@ -1649,6 +1653,9 @@ GenerationResult RequestManager::generate_spec_infer(FFModel *llm,
     // if (is_request_completed(guid)) {
     //   break;
     // }
+    Runtime *runtime = Runtime::get_runtime();
+    Context ctx = Runtime::get_context();
+    runtime->begin_trace(ctx, 12345 /*trace_id*/);
 
     for (size_t i = 0; i < get_num_ssms(); i++) {
       for (int depth = 0; depth < BeamSearchBatchConfig::MAX_BEAM_DEPTH;
@@ -1672,6 +1679,7 @@ GenerationResult RequestManager::generate_spec_infer(FFModel *llm,
       last_tree_bcf = tree_bcf;
       last_tree_irf = tree_irf;
     }
+    runtime->end_trace(ctx, 12345 /*trace_id*/);
   }
 
   GenerationResult gr = get_generation_result(guid);

From f07de46bbc5dd23e0267d142b96e511fdce2cbd4 Mon Sep 17 00:00:00 2001
From: zwang86 <46699021+zwang86@users.noreply.github.com>
Date: Mon, 31 Jul 2023 09:06:01 -0400
Subject: [PATCH 187/344] Fixed edge case. (#903)

---
 include/flexflow/batch_config.h         |  3 +--
 inference/models/configs/llama_68M.json | 11 +++++++++
 inference/utils/convert_llama_config.py | 32 +++++++++++++++++++++++++
 src/runtime/request_manager.cc          |  3 ++-
 4 files changed, 46 insertions(+), 3 deletions(-)
 create mode 100644 inference/models/configs/llama_68M.json
 create mode 100644 inference/utils/convert_llama_config.py

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 5e68a65d8c..bae847106a 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -54,8 +54,7 @@ class BatchConfig {
   static BatchConfig const *from_future(BatchConfigFuture const &future);
   static int const MAX_NUM_REQUESTS = 1;
   static int const MAX_NUM_TOKENS = 64;
-  static int const MAX_PROMPT_LENGTH =
-      63; // should be MAX_NUM_TOKENS - 1 for SpecInfer
+  static int const MAX_PROMPT_LENGTH = 62;
   static int const MAX_SEQ_LENGTH = 256;
 
   //  These are set by update
diff --git a/inference/models/configs/llama_68M.json b/inference/models/configs/llama_68M.json
new file mode 100644
index 0000000000..11e21531c4
--- /dev/null
+++ b/inference/models/configs/llama_68M.json
@@ -0,0 +1,11 @@
+{
+    "n_layers": 2,
+    "vocab_size": 32000,
+    "n_heads": 12,
+    "dim": 768,
+    "multiple_of": 256,
+    "norm_eps": 1e-06,
+    "total_requests": 2560,
+    "hidden_dim": 3072,
+    "incremental_mode": true
+}
\ No newline at end of file
diff --git a/inference/utils/convert_llama_config.py b/inference/utils/convert_llama_config.py
new file mode 100644
index 0000000000..dfae42f841
--- /dev/null
+++ b/inference/utils/convert_llama_config.py
@@ -0,0 +1,32 @@
+import argparse
+import json
+
+def convert_json(input_file, output_file):
+    # Load the input JSON data from the file
+    with open(input_file, 'r') as file:
+        input_data = json.load(file)
+
+    # Extract the required fields and create the output JSON object
+    output_data = {
+        "n_layers": input_data["num_hidden_layers"],
+        "vocab_size": input_data["vocab_size"],
+        "n_heads": input_data["num_attention_heads"],
+        "dim": input_data["hidden_size"],
+        "multiple_of": 256,
+        "norm_eps": input_data["rms_norm_eps"],
+        "total_requests": 2560,
+        "hidden_dim": input_data["intermediate_size"],
+        "incremental_mode": input_data["use_cache"]
+    }
+
+    # Save the output JSON data to the file
+    with open(output_file, 'w') as file:
+        json.dump(output_data, file, indent=4)
+
+if __name__ == "__main__":
+    parser = argparse.ArgumentParser(description="Convert JSON file to a different format.")
+    parser.add_argument("input_file", help="Path to the input JSON file.")
+    parser.add_argument("output_file", help="Path to the output JSON file.")
+    args = parser.parse_args()
+
+    convert_json(args.input_file, args.output_file)
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index eea02601e8..189cf08a39 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -1094,7 +1094,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       new_bc.num_tokens++;
       new_bc.requestsInfo[i].num_tokens_in_batch++;
 
-      if (new_bc.num_tokens == BatchConfig::MAX_NUM_TOKENS) {
+      if (new_bc.num_tokens == BatchConfig::MAX_NUM_TOKENS - 1) {
         break;
       }
     }
@@ -1148,6 +1148,7 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
         std::cout << "i = " << i << ", result index = " << result_index
                   << ", value: " << result.token_ids[result_index] << "\n";
       }
+
       int index = old_bc.tokensInfo[i - 1].request_index;
       int beam_size = old_bc.beamRequestsInfo[index].beam_size;
       int depth = old_bc.beamRequestsInfo[index].current_depth;

From ba91733352a29cb47c912360c9e75f2c67154a97 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 2 Aug 2023 13:52:37 -0400
Subject: [PATCH 188/344] Python interface for inference (part 2) (#893)

* add argmax, add default args to test file

* updates

* comment out print

* updates

* added code to get configs and weights from hf

* added FileDataLoader to cffi

* remove aggressive reformatting

* update

* fix

* add code to load weights from python

* fix half precision weight loading from python

* fixed loading weights

* fixed loading weights

* checkpoint

* generation from python now works

* make it easier to set flags needed to run native python

* downloading tokenizers from hf

* add support for opt

* implement falcon

* add support for multiple prompts and prompts from json file

* implement speculative inference

* finished specinfer implementation

* updated arguments parsing

* remove unnecessary args from compile func

* .

* update interface examples

* fix ssm bug

* fix fusion-related bugs

* standardize argument parsing in python examples

* docstrings

* update

* moved c++ inference tests
---
 CMakeLists.txt                           |   3 +
 FlexFlow.mk                              |   5 +-
 INSTALL.md                               |   7 +-
 include/flexflow/ffconst.h               |   2 +-
 include/flexflow/flexflow_c.h            | 114 ++++++--
 inference/file_loader.cc                 |   1 -
 inference/flexflow_inference.py          |  43 ---
 inference/incr_decoding/incr_decoding.cc |   5 -
 inference/models/falcon.cc               |   6 +-
 inference/models/opt.cc                  |   6 +-
 inference/python/incr_decoding.py        | 118 ++++++++
 inference/python/spec_infer.py           | 168 +++++++++++
 inference/utils/download_opt_weights.py  |  42 ++-
 python/flexflow/core/flexflow_cffi.py    | 332 ++++++++++++++++++---
 python/flexflow/serve/__init__.py        | 129 ++++++++-
 python/flexflow/serve/models/base.py     |  39 +++
 python/flexflow/serve/models/falcon.py   | 183 +++++++++++-
 python/flexflow/serve/models/llama.py    | 263 ++++++++++++-----
 python/flexflow/serve/models/opt.py      | 285 +++++++++++++++++-
 python/flexflow/serve/serve.py           | 353 ++++++++++++++++++++---
 python/flexflow/type.py                  | 273 ++++++++++--------
 python/flexflow_python_build.py          |  31 +-
 src/c/flexflow_c.cc                      | 254 ++++++++++++----
 src/ops/argmax.cc                        |   2 +-
 src/ops/fused.cu                         |  41 +++
 src/runtime/model.cc                     |   4 -
 src/runtime/request_manager.cc           |  23 +-
 tests/inference/cpp_inference_tests.sh   | 275 ++++++++++++++++++
 tests/inference_tests.sh                 | 270 +----------------
 29 files changed, 2541 insertions(+), 736 deletions(-)
 delete mode 100644 inference/flexflow_inference.py
 create mode 100644 inference/python/incr_decoding.py
 create mode 100644 inference/python/spec_infer.py
 create mode 100644 python/flexflow/serve/models/base.py
 create mode 100755 tests/inference/cpp_inference_tests.sh

diff --git a/CMakeLists.txt b/CMakeLists.txt
index f7e58bf0aa..b35fb1613d 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -321,11 +321,13 @@ list(APPEND FLEXFLOW_INCLUDE_DIRS
 file(GLOB_RECURSE FLEXFLOW_HDR
   LIST_DIRECTORIES False
   ${FLEXFLOW_ROOT}/include/*.h)
+  list(APPEND FLEXFLOW_HDR ${FLEXFLOW_ROOT}/inference/file_loader.h)
 
 file(GLOB_RECURSE FLEXFLOW_SRC
   LIST_DIRECTORIES False
   ${FLEXFLOW_ROOT}/src/*.cc)
 list(REMOVE_ITEM FLEXFLOW_SRC "${FLEXFLOW_ROOT}/src/runtime/cpp_driver.cc")
+list(APPEND FLEXFLOW_SRC ${FLEXFLOW_ROOT}/inference/file_loader.cc)
 
 set(FLEXFLOW_CPP_DRV_SRC
   ${FLEXFLOW_ROOT}/src/runtime/cpp_driver.cc)
@@ -460,6 +462,7 @@ if (FF_USE_PYTHON)
     WORKING_DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}/deps/legion/bindings/python
   )
   # create flexflow_python interpreter. When building from pip, we install the FF_HOME/python/flexflow_python script instead.
+  # create set_python_envs.sh script to set up the environment variables to run flexflow_python
   if (NOT FF_BUILD_FROM_PYPI)
     add_custom_command(TARGET flexflow
       PRE_BUILD	
diff --git a/FlexFlow.mk b/FlexFlow.mk
index 8dc6a017b4..14f32a7639 100644
--- a/FlexFlow.mk
+++ b/FlexFlow.mk
@@ -59,7 +59,8 @@ GEN_SRC += $(shell find $(FF_HOME)/src/loss_functions/ -name '*.cc')\
 		$(shell find $(FF_HOME)/src/runtime/ -name '*.cc')\
 		$(shell find $(FF_HOME)/src/utils/dot/ -name '*.cc')\
 		$(shell find $(FF_HOME)/src/dataloader/ -name '*.cc')\
-		$(shell find $(FF_HOME)/src/c/ -name '*.cc')
+		$(shell find $(FF_HOME)/src/c/ -name '*.cc')\
+		$(shell find $(FF_HOME)/inference/ -name 'file_loader.cc')
 GEN_SRC := $(filter-out $(FF_HOME)/src/runtime/cpp_driver.cc, $(GEN_SRC))
 
 FF_CUDA_SRC += $(shell find $(FF_HOME)/src/loss_functions/ -name '*.cu')\
@@ -94,7 +95,7 @@ ifneq ($(strip $(FF_USE_PYTHON)), 1)
 endif
 
 
-INC_FLAGS	+= -I${FF_HOME}/include -I${FF_HOME}/deps/optional/include -I${FF_HOME}/deps/variant/include -I${FF_HOME}/deps/json/include -I${FF_HOME}/deps/tokenizers-cpp/include -I${FF_HOME}/deps/tokenizers-cpp/sentencepiece/src
+INC_FLAGS	+= -I${FF_HOME}/include -I${FF_HOME}/inference -I${FF_HOME}/deps/optional/include -I${FF_HOME}/deps/variant/include -I${FF_HOME}/deps/json/include -I${FF_HOME}/deps/tokenizers-cpp/include -I${FF_HOME}/deps/tokenizers-cpp/sentencepiece/src
 CC_FLAGS	+= -DMAX_TENSOR_DIM=$(MAX_DIM) -DLEGION_MAX_RETURN_SIZE=32768
 NVCC_FLAGS	+= -DMAX_TENSOR_DIM=$(MAX_DIM) -DLEGION_MAX_RETURN_SIZE=32768
 HIPCC_FLAGS     += -DMAX_TENSOR_DIM=$(MAX_DIM) -DLEGION_MAX_RETURN_SIZE=32768
diff --git a/INSTALL.md b/INSTALL.md
index d2e3c1d2f6..cdc2a2abbd 100644
--- a/INSTALL.md
+++ b/INSTALL.md
@@ -85,10 +85,11 @@ export FF_HOME=/path/to/FlexFlow
 ### Run FlexFlow Python examples
 The Python examples are in the [examples/python](https://github.com/flexflow/FlexFlow/tree/master/examples/python). The native, Keras integration and PyTorch integration examples are listed in `native`, `keras` and `pytorch` respectively.
 
-To run the Python examples, you have two options: you can use the `flexflow_python` interpreter, available in the `build` folder, or you can use the native Python interpreter. If you choose to use the native Python interpreter, you should either install FlexFlow, or, if you prefer to build without installing, export the following flags:
+To run the Python examples, you have two options: you can use the `flexflow_python` interpreter, available in the `build` folder, or you can use the native Python interpreter. If you choose to use the native Python interpreter, you should either install FlexFlow, or, if you prefer to build without installing, export the required environment flags by running the following command (edit the path if your build folder is not named `build`):
 
-* `export PYTHONPATH="${FF_HOME}/python:${FF_HOME}/build/deps/legion/bindings/python:${PYTHONPATH}"`
-* `export LD_LIBRARY_PATH="${FF_HOME}/build:${FF_HOME}/build/deps/legion/lib:${LD_LIBRARY_PATH}"`
+```
+source ./build/set_python_envs.sh
+```
 
 **We recommend that you run the** `mnist_mlp` **test under** `native` **using the following cmd to check if FlexFlow has been installed correctly:**
 
diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index 7521613477..170180aeaf 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -180,7 +180,7 @@ enum OperatorType {
   OP_INVALID,
 };
 
-enum ModelType { UNKNOWN, LLAMA, OPT, FALCON };
+enum ModelType { UNKNOWN = 3001, LLAMA = 3002, OPT = 3003, FALCON = 3004 };
 
 enum PMParameter {
   PM_OP_TYPE,            // AnyOp
diff --git a/include/flexflow/flexflow_c.h b/include/flexflow/flexflow_c.h
index f8f9b97aad..9983898130 100644
--- a/include/flexflow/flexflow_c.h
+++ b/include/flexflow/flexflow_c.h
@@ -53,6 +53,8 @@ FF_NEW_OPAQUE_TYPE(flexflow_tree_verify_batch_config_t);
 FF_NEW_OPAQUE_TYPE(flexflow_beam_search_batch_config_t);
 FF_NEW_OPAQUE_TYPE(flexflow_inference_manager_t);
 FF_NEW_OPAQUE_TYPE(flexflow_request_manager_t);
+FF_NEW_OPAQUE_TYPE(flexflow_file_data_loader_t);
+FF_NEW_OPAQUE_TYPE(flexflow_generation_result_t);
 
 // -----------------------------------------------------------------------
 // FFConfig
@@ -78,6 +80,21 @@ int flexflow_config_get_epochs(flexflow_config_t handle);
 
 bool flexflow_config_get_enable_control_replication(flexflow_config_t handle);
 
+int flexflow_config_get_data_parallelism_degree(flexflow_config_t handle_);
+
+int flexflow_config_get_tensor_parallelism_degree(flexflow_config_t handle_);
+
+int flexflow_config_get_pipeline_parallelism_degree(flexflow_config_t handle_);
+
+void flexflow_config_set_data_parallelism_degree(flexflow_config_t handle_,
+                                                 int value);
+
+void flexflow_config_set_tensor_parallelism_degree(flexflow_config_t handle_,
+                                                   int value);
+
+void flexflow_config_set_pipeline_parallelism_degree(flexflow_config_t handle_,
+                                                     int value);
+
 int flexflow_config_get_python_data_loader_type(flexflow_config_t handle);
 
 // -----------------------------------------------------------------------
@@ -390,8 +407,12 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_attention(
     bool bias,
     bool add_bias_kv,
     bool add_zero_attn,
+    enum DataType data_type,
     flexflow_initializer_t kernel_initializer_,
     bool apply_rotary_embedding,
+    bool scaling_query,
+    float scaling_factor,
+    bool qk_prod_scaling,
     char const *name);
 
 flexflow_tensor_t flexflow_model_add_spec_inc_multihead_attention(
@@ -405,8 +426,12 @@ flexflow_tensor_t flexflow_model_add_spec_inc_multihead_attention(
     bool bias,
     bool add_bias_kv,
     bool add_zero_attn,
+    enum DataType data_type,
     flexflow_initializer_t kernel_initializer_,
     bool apply_rotary_embedding,
+    bool scaling_query,
+    float scaling_factor,
+    bool qk_prod_scaling,
     char const *name);
 
 flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention_verify(
@@ -420,8 +445,27 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention_verify(
     bool bias,
     bool add_bias_kv,
     bool add_zero_attn,
+    enum DataType data_type,
     flexflow_initializer_t kernel_initializer_,
     bool apply_rotary_embedding,
+    bool scaling_query,
+    float scaling_factor,
+    bool qk_prod_scaling,
+    char const *name);
+
+flexflow_tensor_t flexflow_model_add_inc_multiquery_self_attention(
+    flexflow_model_t handle_,
+    const flexflow_tensor_t input_,
+    int embed_dim,
+    int num_heads,
+    int kdim,
+    int vdim,
+    float dropout,
+    bool bias,
+    bool add_bias_kv,
+    bool add_zero_attn,
+    enum DataType data_type,
+    flexflow_initializer_t kernel_initializer_,
     char const *name);
 
 flexflow_tensor_t flexflow_model_add_rms_norm(flexflow_model_t handle_,
@@ -447,6 +491,11 @@ flexflow_tensor_t flexflow_model_add_sampling(flexflow_model_t handle_,
                                               float top_p,
                                               char const *name);
 
+flexflow_tensor_t flexflow_model_add_argmax(flexflow_model_t handle_,
+                                            const flexflow_tensor_t input_,
+                                            bool beam_search,
+                                            char const *name);
+
 void flexflow_model_set_sgd_optimizer(flexflow_model_t handle,
                                       flexflow_sgd_optimizer_t optimizer);
 
@@ -468,6 +517,10 @@ flexflow_perf_metrics_t
 
 void flexflow_model_set_transformer_layer_id(flexflow_model_t handle, int id);
 
+flexflow_generation_result_t flexflow_model_generate(flexflow_model_t handle_,
+                                                     char const *text,
+                                                     int max_seq_length);
+
 // -----------------------------------------------------------------------
 // Tensor
 // -----------------------------------------------------------------------
@@ -809,44 +862,55 @@ void flexflow_beam_search_batch_config_destroy(
 // RequestManager
 // -----------------------------------------------------------------------
 
-flexflow_request_manager_t flexflow_request_manager_create(void);
+flexflow_request_manager_t flexflow_request_manager_get_request_manager(void);
+
+// void flexflow_request_manager_destroy(flexflow_request_manager_t handle_);
 
-void flexflow_request_manager_destroy(flexflow_request_manager_t handle);
+void flexflow_request_manager_register_tokenizer(
+    flexflow_request_manager_t handle_,
+    enum ModelType model_type,
+    char const *tokenizer_filepath);
 
-long unsigned int flexflow_request_manager_register_new_request(
-    flexflow_request_manager_t handle,
-    char const *prompt,
-    int max_sequence_length);
+void flexflow_request_manager_register_output_filepath(
+    flexflow_request_manager_t handle_, char const *output_filepath);
+
+int flexflow_request_manager_register_ssm_model(
+    flexflow_request_manager_t handle_, flexflow_model_t model_handle_);
 
 // -----------------------------------------------------------------------
 // InferenceManager
 // -----------------------------------------------------------------------
 
 flexflow_inference_manager_t
-    flexflow_inference_manager_create(flexflow_config_t config_handle,
-                                      int max_num_tokens_per_batch);
+    flexflow_inference_manager_get_inference_manager(void);
 
-void flexflow_inference_manager_destroy(flexflow_inference_manager_t handle);
+// void flexflow_inference_manager_destroy(flexflow_inference_manager_t
+// handle_);
 
 void flexflow_inference_manager_compile_model_and_allocate_buffer(
-    flexflow_inference_manager_t handle, flexflow_model_t model_handle);
+    flexflow_inference_manager_t handle_, flexflow_model_t model_handle);
 
 void flexflow_inference_manager_init_operators_inference(
-    flexflow_inference_manager_t handle, flexflow_model_t model_handle);
-
-void flexflow_inference_manager_incr_decoding_loop(
-    flexflow_inference_manager_t handle,
-    flexflow_model_t model_handle,
-    flexflow_request_manager_t rm_handle,
-    int total_num_requests);
-
-void flexflow_inference_manager_spec_inference_loop(
-    flexflow_inference_manager_t handle,
-    flexflow_model_t model_handle,
-    flexflow_request_manager_t rm_handle,
-    int total_num_requests,
-    int num_ssms,
-    int *ssm_model_ids);
+    flexflow_inference_manager_t handle_, flexflow_model_t model_handle);
+
+// -----------------------------------------------------------------------
+// FileDataLoader
+// -----------------------------------------------------------------------
+
+flexflow_file_data_loader_t
+    flexflow_file_data_loader_create(char const *weight_file_path,
+                                     int num_heads,
+                                     int hidden_dim,
+                                     int qkv_inner_dim);
+
+void flexflow_file_data_loader_destroy(flexflow_file_data_loader_t handle_);
+
+void flexflow_file_data_loader_load_weights(flexflow_file_data_loader_t handle_,
+                                            flexflow_model_t model_handle_,
+                                            int num_layers,
+                                            char const **layer_names,
+                                            flexflow_op_t *layers,
+                                            bool use_full_precision);
 
 #ifdef __cplusplus
 }
diff --git a/inference/file_loader.cc b/inference/file_loader.cc
index 071124fc0d..e89c3eb622 100644
--- a/inference/file_loader.cc
+++ b/inference/file_loader.cc
@@ -709,7 +709,6 @@ void FileDataLoader::load_weights(
       if (weight == NULL) {
         continue;
       }
-
       switch (weight->data_type) {
         case DT_HALF:
           load_single_weight_tensor<half>(ff, weight, i, v.first);
diff --git a/inference/flexflow_inference.py b/inference/flexflow_inference.py
deleted file mode 100644
index 6caace0f2d..0000000000
--- a/inference/flexflow_inference.py
+++ /dev/null
@@ -1,43 +0,0 @@
-# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-#     http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-
-from flexflow.serve import LLM, SamplingConfig
-from flexflow.core import *
-
-def get_prompts(json_filepath):
-   json_obj = None
-   return json_obj
-
-def top_level_task():
-    # Incremental decoding
-    llama = LLM("decapoda-research/llama-30b-hf", data_type = "half")
-    sampling_config = SamplingConfig(do_sample=False, temperature = 0.9, topp = 0.8, topk = 1)
-    llama.compile(InferenceMode.INC_DECODING_MODE, sampling_config, use_full_precision=False, max_batch_size = 1, max_seq_length = 256, max_tokens_per_batch=64, tensor_parallel_degree = 4, pipeline_parallel_degree = 2)
-    
-    prompts = llama.generate(prompts, sampling=sampling_config)
-    # result = llama.generate("What's the best xxx in yyy?", sampling = sampling_config)
-    # print(result)
-
-    # # Speculative inference
-    # llama = LLM("decapoda-research/llama-30b-hf", data_type = "half")
-    # ssm1 = LLM("Jackfram/llama-160m", data_type = "half")
-    # ssm2 = LLM("facebook/opt-125m", data_type = "half")
-    # sampling_config = SamplingConfig(temperature = 0.9, topp = 0.8, topk = 1)
-    # llama.serve(max_batch_size = 1, max_seq_length = 256, max_tokens_per_batch=64, tensor_parallel_degree = 4, pipeline_parallel_degree = 2, ssms = {ssm1, ssm2})
-    # result = llama.generate("What's the best xxx in yyy?", sampling = sampling_config)
-    # print(result)
-
-if __name__ == "__main__":
-  print("flexflow inference")
-  top_level_task()
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index 957c41b103..4246a78824 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -151,11 +151,6 @@ void FlexFlow::top_level_task(Task const *task,
   RequestManager *rm = RequestManager::get_request_manager();
   rm->register_tokenizer(model_type, file_paths.tokenizer_file_path);
   rm->register_output_filepath(file_paths.output_file_path);
-  // InferenceManager im(ffconfig, BatchConfig::MAX_NUM_TOKENS);
-  // RequestManager rm(model_type,
-  //                   file_paths.tokenizer_file_path,
-  //                   /*verbose*/ verbose,
-  //                   file_paths.output_file_path);
 
   FFModel model(ffconfig, ffconfig.cpu_offload);
   if (model_type == ModelType::LLAMA) {
diff --git a/inference/models/falcon.cc b/inference/models/falcon.cc
index d0ec83508b..2d79040f5f 100644
--- a/inference/models/falcon.cc
+++ b/inference/models/falcon.cc
@@ -62,11 +62,7 @@ void FALCON::create_falcon_model(FFModel &ff,
   Layer *embedding = ff.layers.back();
   weights_layers.emplace("tok_embeddings_weight", embedding);
 
-  int num_transformer_layers = falcon_config.n_layers;
-  int num_transformer_layers_per_stage =
-      (num_transformer_layers + num_pipeline_stages - 1) / num_pipeline_stages;
-
-  for (int i = 0; i < num_transformer_layers; i++) {
+  for (int i = 0; i < falcon_config.n_layers; i++) {
     // set transformer layer id
     ff.set_transformer_layer_id(i);
     // step 1: attention
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index 2cdffe2715..68b931716f 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -119,7 +119,7 @@ void OPT::create_opt_model(FFModel &ff,
             NULL,
             false,
             /*scaling query*/ true,
-            /*sacling factor*/
+            /*scaling factor*/
             pow((opt_config.hidden_size / opt_config.num_attention_heads),
                 -0.5),
             /*qk_prod_scaling*/ false);
@@ -140,7 +140,7 @@ void OPT::create_opt_model(FFModel &ff,
             NULL,
             false,
             /*scaling query*/ true,
-            /*sacling factor*/
+            /*scaling factor*/
             pow((opt_config.hidden_size / opt_config.num_attention_heads),
                 -0.5),
             /*qk_prod_scaling*/ false);
@@ -161,7 +161,7 @@ void OPT::create_opt_model(FFModel &ff,
             NULL,
             false,
             /*scaling query*/ true,
-            /*sacling factor*/
+            /*scaling factor*/
             pow((opt_config.hidden_size / opt_config.num_attention_heads),
                 -0.5),
             /*qk_prod_scaling*/ false);
diff --git a/inference/python/incr_decoding.py b/inference/python/incr_decoding.py
new file mode 100644
index 0000000000..6db7d09c56
--- /dev/null
+++ b/inference/python/incr_decoding.py
@@ -0,0 +1,118 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+import flexflow.serve as ff
+import argparse, json, os
+from types import SimpleNamespace
+
+
+def get_configs():
+    parser = argparse.ArgumentParser()
+    parser.add_argument(
+        "-config-file",
+        help="The path to a JSON file with the configs. If omitted, a sample model and configs will be used instead.",
+        type=str,
+        default="",
+    )
+    args = parser.parse_args()
+
+    # Load configs from JSON file (if specified)
+    if len(args.config_file) > 0:
+        if not os.path.isfile(args.config_file):
+            raise FileNotFoundError(f"Config file {args.config_file} not found.")
+        try:
+            with open(args.config_file) as f:
+                return json.load(f)
+        except json.JSONDecodeError as e:
+            print("JSON format error:")
+            print(e)
+    else:
+        # Define sample configs
+        ff_init_configs = {
+            # required parameters
+            "num_gpus": 4,
+            "memory_per_gpu": 14000,
+            "zero_copy_memory_per_gpu": 30000,
+            # optional parameters
+            "num_cpus": 4,
+            "legion_utility_processors": 4,
+            "data_parallelism_degree": 1,
+            "tensor_parallelism_degree": 2,
+            "pipeline_parallelism_degree": 2,
+            "offload": False,
+            "offload_reserve_space_size": 1024**2,
+            "use_4bit_quantization": False,
+            "use_8bit_quantization": False,
+            "profiling": False,
+            "fusion": True,
+        }
+        llm_configs = {
+            # required parameters
+            "llm_model": "decapoda-research/llama-7b-hf",
+            # optional parameters
+            "llm_weight": "",
+            "llm_tokenizer": "",
+            "clean_model_cache": False,
+            "full_precision": False,
+            "prompt": "",
+            "output_file": "",
+        }
+        # Merge dictionaries
+        ff_init_configs.update(llm_configs)
+        return ff_init_configs
+
+
+def main():
+    configs_dict = get_configs()
+    configs = SimpleNamespace(**configs_dict)
+
+    # Initialize the FlexFlow runtime. ff.init() takes a dictionary or the path to a JSON file with the configs
+    ff.init(configs_dict)
+
+    # Create the FlexFlow LLM
+    ff_data_type = (
+        ff.DataType.DT_FLOAT if configs.full_precision else ff.DataType.DT_HALF
+    )
+    llm = ff.LLM(
+        configs.llm_model,
+        data_type=ff_data_type,
+        tokenizer_path=configs.llm_tokenizer,
+        weights_path=configs.llm_weight,
+        clean_cache=configs.clean_model_cache,
+        output_file=configs.output_file,
+    )
+
+    # Compile the LLM for inference and load the weights into memory
+    sampling_config = ff.SamplingConfig(
+        do_sample=False, temperature=0.9, topp=0.8, topk=1
+    )
+    llm.compile(
+        ff.InferenceMode.INC_DECODING_MODE,
+        sampling_config,
+        max_batch_size=1,
+        max_seq_length=256,
+        max_tokens_per_batch=64,
+    )
+
+    # Generation begins!
+    if len(configs.prompt) > 0:
+        prompts = [s for s in json.load(open(configs.prompt))]
+        results = llm.generate(prompts)
+    else:
+        result = llm.generate("Here are some travel tips for Tokyo:\n")
+
+
+if __name__ == "__main__":
+    print("flexflow inference example (incremental decoding)")
+    main()
diff --git a/inference/python/spec_infer.py b/inference/python/spec_infer.py
new file mode 100644
index 0000000000..7a0cd1dc64
--- /dev/null
+++ b/inference/python/spec_infer.py
@@ -0,0 +1,168 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+import flexflow.serve as ff
+import argparse, json, os
+from types import SimpleNamespace
+
+
+def get_configs():
+    parser = argparse.ArgumentParser()
+    parser.add_argument(
+        "-config-file",
+        help="The path to a JSON file with the configs. If omitted, a sample model and configs will be used instead.",
+        type=str,
+        default="",
+    )
+    args = parser.parse_args()
+
+    # Load configs from JSON file (if specified)
+    if len(args.config_file) > 0:
+        if not os.path.isfile(args.config_file):
+            raise FileNotFoundError(f"Config file {args.config_file} not found.")
+        try:
+            with open(args.config_file) as f:
+                return json.load(f)
+        except json.JSONDecodeError as e:
+            print("JSON format error:")
+            print(e)
+    else:
+        # Define sample configs
+        ff_init_configs = {
+            # required parameters
+            "num_gpus": 4,
+            "memory_per_gpu": 14000,
+            "zero_copy_memory_per_gpu": 30000,
+            # optional parameters
+            "num_cpus": 4,
+            "legion_utility_processors": 4,
+            "data_parallelism_degree": 1,
+            "tensor_parallelism_degree": 2,
+            "pipeline_parallelism_degree": 2,
+            "offload": False,
+            "offload_reserve_space_size": 1024**2,
+            "use_4bit_quantization": False,
+            "use_8bit_quantization": False,
+            "profiling": False,
+            "fusion": True,
+        }
+        llm_configs = {
+            # required llm arguments
+            "llm_model": "decapoda-research/llama-7b-hf",
+            # optional llm parameters
+            "llm_weight": "",
+            "llm_tokenizer": "",
+            "clean_model_cache": False,
+            "full_precision": False,
+            "ssms": [
+                {
+                    # required ssm parameter
+                    "ssm_model": "JackFram/llama-160m",
+                    # optional ssm parameters
+                    "ssm_weight": "",
+                    "ssm_tokenizer": "",
+                    "clean_model_cache": False,
+                    "full_precision": False,
+                },
+                {
+                    # required ssm parameter
+                    "ssm_model": "facebook/opt-125m",
+                    # optional ssm parameters
+                    "ssm_weight": "",
+                    "ssm_tokenizer": "",
+                    "clean_model_cache": False,
+                    "full_precision": False,
+                },
+            ],
+            "prompt": "../prompt/test.json",
+            "output_file": "",
+        }
+        # Merge dictionaries
+        ff_init_configs.update(llm_configs)
+        return ff_init_configs
+
+
+def main():
+    configs_dict = get_configs()
+    configs = SimpleNamespace(**configs_dict)
+
+    # Initialize the FlexFlow runtime. ff.init() takes a dictionary or the path to a JSON file with the configs
+    ff.init(configs_dict)
+
+    # Create the FlexFlow LLM
+    ff_data_type = (
+        ff.DataType.DT_FLOAT if configs.full_precision else ff.DataType.DT_HALF
+    )
+    llm = ff.LLM(
+        configs.llm_model,
+        data_type=ff_data_type,
+        tokenizer_path=configs.llm_tokenizer,
+        weights_path=configs.llm_weight,
+        clean_cache=configs.clean_model_cache,
+        output_file=configs.output_file,
+    )
+
+    # Create the SSMs
+    ssms = []
+    for ssm_config in configs.ssms:
+        ssm_config = SimpleNamespace(**ssm_config)
+        ff_data_type = (
+            ff.DataType.DT_FLOAT if ssm_config.full_precision else ff.DataType.DT_HALF
+        )
+        ssm = ff.SSM(
+            ssm_config.ssm_model,
+            data_type=ff_data_type,
+            tokenizer_path=ssm_config.ssm_tokenizer,
+            weights_path=ssm_config.ssm_weight,
+            clean_cache=ssm_config.clean_model_cache,
+            output_file=configs.output_file,
+        )
+        ssms.append(ssm)
+
+    # Create the sampling configs
+    sampling_config = ff.SamplingConfig(
+        do_sample=False, temperature=0.9, topp=0.8, topk=1
+    )
+
+    # Compile the SSMs for inference and load the weights into memory
+    for ssm in ssms:
+        ssm.compile(
+            ff.InferenceMode.BEAM_SEARCH_MODE,
+            sampling_config,
+            max_batch_size=1,
+            max_seq_length=256,
+            max_tokens_per_batch=64,
+        )
+
+    # Compile the LLM for inference and load the weights into memory
+    llm.compile(
+        ff.InferenceMode.TREE_VERIFY_MODE,
+        sampling_config,
+        max_batch_size=1,
+        max_seq_length=256,
+        max_tokens_per_batch=64,
+        ssms=ssms,
+    )
+
+    # Generation begins!
+    if len(configs.prompt) > 0:
+        prompts = [s for s in json.load(open(configs.prompt))]
+        results = llm.generate(prompts)
+    else:
+        result = llm.generate("Here are some travel tips for Tokyo:\n")
+
+
+if __name__ == "__main__":
+    print("flexflow inference example (speculative inference)")
+    main()
diff --git a/inference/utils/download_opt_weights.py b/inference/utils/download_opt_weights.py
index 747d471d1a..c3707df304 100644
--- a/inference/utils/download_opt_weights.py
+++ b/inference/utils/download_opt_weights.py
@@ -8,10 +8,13 @@
 
 # You can pass the --use-full-precision flag to use the full-precision weight. By default, we use half precision.
 parser = argparse.ArgumentParser()
-parser.add_argument("--use-full-precision", action="store_true", help="Use full precision")
+parser.add_argument(
+    "--use-full-precision", action="store_true", help="Use full precision"
+)
 args = parser.parse_args()
 if not args.use_full_precision:
     import torch
+
     torch.set_default_tensor_type(torch.HalfTensor)
 
 # Change working dir to folder storing this script
@@ -19,6 +22,7 @@
 dname = os.path.dirname(abspath)
 os.chdir(dname)
 
+
 def convert_hf_model(model, dst_folder):
     os.makedirs(dst_folder, exist_ok=True)
     for name, params in model.named_parameters():
@@ -34,29 +38,41 @@ def convert_hf_model(model, dst_folder):
         )
         params.detach().cpu().numpy().tofile(f"{dst_folder}/{name}")
     # copy embedding weights
-    shutil.copy(os.path.join(dst_folder, "embed_tokens_weight"), os.path.join(dst_folder, "embed_tokens_weight_lm_head"))
+    shutil.copy(
+        os.path.join(dst_folder, "embed_tokens_weight"),
+        os.path.join(dst_folder, "embed_tokens_weight_lm_head"),
+    )
+
 
 # Download and convert big model weights
 model = AutoModelForCausalLM.from_pretrained("facebook/opt-6.7b")
-dst_folder="../weights/opt_6B_weights" if args.use_full_precision else "../weights/opt_6B_weights_half"
+dst_folder = (
+    "../weights/opt_6B_weights"
+    if args.use_full_precision
+    else "../weights/opt_6B_weights_half"
+)
 convert_hf_model(model, dst_folder)
 
 # Download and convert small model weights
 model = AutoModelForCausalLM.from_pretrained("facebook/opt-125m")
-dst_folder="../weights/opt_125M_weights" if args.use_full_precision else "../weights/opt_125M_weights_half"
+dst_folder = (
+    "../weights/opt_125M_weights"
+    if args.use_full_precision
+    else "../weights/opt_125M_weights_half"
+)
 convert_hf_model(model, dst_folder)
 
 # Download tokenizer files
 os.makedirs("../tokenizer", exist_ok=True)
-tokenizer_filepath = '../tokenizer/gpt2-vocab.json'
-url = 'https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-vocab.json'
+tokenizer_filepath = "../tokenizer/vocab.json"
+url = "https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-vocab.json"
 r = requests.get(url)
-open(tokenizer_filepath , 'wb').write(r.content)
-tokenizer_filepath = '../tokenizer/gpt2-merges.txt'
-url = 'https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-merges.txt'
+open(tokenizer_filepath, "wb").write(r.content)
+tokenizer_filepath = "../tokenizer/merges.txt"
+url = "https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-merges.txt"
 r = requests.get(url)
-open(tokenizer_filepath , 'wb').write(r.content)
-tokenizer_filepath = '../tokenizer/added_tokens.json'
-url = 'https://huggingface.co/truongpdd/vietnews-gpt2/raw/main/added_tokens.json'
+open(tokenizer_filepath, "wb").write(r.content)
+tokenizer_filepath = "../tokenizer/special_tokens_map.json"
+url = "https://huggingface.co/truongpdd/vietnews-gpt2/raw/main/added_tokens.json"
 r = requests.get(url)
-open(tokenizer_filepath , 'wb').write(r.content)
\ No newline at end of file
+open(tokenizer_filepath, "wb").write(r.content)
diff --git a/python/flexflow/core/flexflow_cffi.py b/python/flexflow/core/flexflow_cffi.py
index 52ae0d9ef9..db36090587 100644
--- a/python/flexflow/core/flexflow_cffi.py
+++ b/python/flexflow/core/flexflow_cffi.py
@@ -22,7 +22,7 @@
 import warnings
 import numpy as np
 from .flexflow_logger import fflogger
-from flexflow.type import ActiMode, RegularizerMode, AggrMode, PoolType, DataType, LossType, CompMode, MetricsType, InferenceMode, OpType, ParameterSyncType, enum_to_int, int_to_enum
+from flexflow.type import ActiMode, RegularizerMode, AggrMode, PoolType, DataType, LossType, CompMode, MetricsType, InferenceMode, ModelType, OpType, ParameterSyncType, enum_to_int, int_to_enum
 _FF_BUILD_DOCS = bool(os.environ.get('READTHEDOCS') or os.environ.get("FF_BUILD_DOCS"))
 if not _FF_BUILD_DOCS:
   from .flexflowlib import ffi, flexflow_library
@@ -39,6 +39,8 @@ def get_c_name(name):
     return ffi.new("char[]", name.encode('ascii'))
 
 def get_datatype_size(datatype):
+  if (datatype == DataType.DT_HALF):
+    return 2
   if (datatype == DataType.DT_FLOAT):
     return 4
   elif (datatype == DataType.DT_DOUBLE):
@@ -435,6 +437,27 @@ class IncMultiHeadAttention(Op):
   def __init__(self, handle, idx=None, name=None):
     super(IncMultiHeadAttention, self).__init__(handle, idx, name)
 
+# -----------------------------------------------------------------------
+# Speculative Incremental MultiHeadAttention
+# -----------------------------------------------------------------------
+class SpecIncMultiHeadSelfAttention(Op):
+  def __init__(self, handle, idx=None, name=None):
+    super(SpecIncMultiHeadSelfAttention, self).__init__(handle, idx, name)
+
+# -----------------------------------------------------------------------
+# TreeVerify Incremental MultiHeadAttention
+# -----------------------------------------------------------------------
+class TreeIncMultiHeadSelfAttention(Op):
+  def __init__(self, handle, idx=None, name=None):
+    super(TreeIncMultiHeadSelfAttention, self).__init__(handle, idx, name)
+
+# -----------------------------------------------------------------------
+# Multi-query Incremental MultiHeadAttention
+# -----------------------------------------------------------------------
+class IncMultiQuerySelfAttention(Op):
+  def __init__(self, handle, idx=None, name=None):
+    super(IncMultiQuerySelfAttention, self).__init__(handle, idx, name)
+
 # -----------------------------------------------------------------------
 # RMS Norm
 # -----------------------------------------------------------------------
@@ -463,6 +486,13 @@ class Sampling(Op):
   def __init__(self, handle, idx=None, name=None):
     super(Sampling, self).__init__(handle, idx, name)
 
+# -----------------------------------------------------------------------
+# ArgMax
+# -----------------------------------------------------------------------
+class ArgMax(Op):
+  def __init__(self, handle, idx=None, name=None):
+    super(ArgMax, self).__init__(handle, idx, name)
+
 # -----------------------------------------------------------------------
 # flexflow_op_t handle to Op
 # -----------------------------------------------------------------------
@@ -545,6 +575,12 @@ def convert_op_handle_to_op(op_type, handle, idx=None, name=None):
     return MultiHeadAttention(handle, idx, name)
   elif op_type == OpType.INC_MULTIHEAD_ATTENTION:
     return IncMultiHeadAttention(handle, idx, name)
+  elif op_type == OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION:
+    return SpecIncMultiHeadSelfAttention(handle, idx, name)
+  elif op_type == OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION:
+    return TreeIncMultiHeadSelfAttention(handle, idx, name)
+  elif op_type == OpType.INC_MULTIQUERY_SELF_ATTENTION:
+    return IncMultiQuerySelfAttention(handle, idx, name)
   elif op_type == OpType.RMS_NORM:
     return RMSNorm(handle, idx, name)
   elif op_type == OpType.ARG_TOPK:
@@ -553,6 +589,8 @@ def convert_op_handle_to_op(op_type, handle, idx=None, name=None):
     return BeamTopK(handle, idx, name)
   elif op_type == OpType.SAMPLING:
     return Sampling(handle, idx, name)
+  elif op_type == OpType.ARGMAX:
+    return ArgMax(handle, idx, name)
   elif op_type == OpType.RSQRT:
     return Rsqrt(handle, idx, name)
   elif op_type == OpType.POW:
@@ -598,6 +636,42 @@ def epochs(self):
   @property
   def enable_control_replication(self):
     return ffc.flexflow_config_get_enable_control_replication(self.handle)
+  
+  @property
+  def data_parallelism_degree(self):
+    return ffc.flexflow_config_get_data_parallelism_degree(self.handle)
+  
+  @data_parallelism_degree.setter
+  def data_parallelism_degree(self, value):
+    if type(value) is not int: 
+      raise ValueError("The data parallelism degree must be specified as an integer number")
+    elif value < 1:
+      raise ValueError("The data parallelism degree cannot be lower than 1")
+    ffc.flexflow_config_set_data_parallelism_degree(self.handle, value)
+  
+  @property
+  def tensor_parallelism_degree(self):
+    return ffc.flexflow_config_get_tensor_parallelism_degree(self.handle)
+  
+  @tensor_parallelism_degree.setter
+  def tensor_parallelism_degree(self, value):
+    if type(value) is not int: 
+      raise ValueError("The tensor parallelism degree must be specified as an integer number")
+    elif value < 1:
+      raise ValueError("The tensor parallelism degree cannot be lower than 1")
+    ffc.flexflow_config_set_tensor_parallelism_degree(self.handle, value)
+  
+  @property
+  def pipeline_parallelism_degree(self):
+    return ffc.flexflow_config_get_pipeline_parallelism_degree(self.handle)
+  
+  @pipeline_parallelism_degree.setter
+  def pipeline_parallelism_degree(self, value):
+    if type(value) is not int: 
+      raise ValueError("The pipeline parallelism degree must be specified as an integer number")
+    elif value < 1:
+      raise ValueError("The pipeline parallelism degree cannot be lower than 1")
+    ffc.flexflow_config_set_pipeline_parallelism_degree(self.handle, value)
     
   @property
   def python_data_loader_type(self):
@@ -715,7 +789,11 @@ def set_tensor(self, ffmodel, np_array):
       assert np_shape[i] == self.dims[i], "please check shape dim %d (%d == %d)" %(i, np_shape[i], self.dims[i])
     c_dims = ffi.new("int[]", self.dims)
     np_raw_ptr = np_array.__array_interface__['data']
-    if np_array.dtype == np.float32:
+    if np_array.dtype == np.float16:
+      assert self.data_type == DataType.DT_HALF, "Wrong datatype"
+      raw_ptr = ffi.cast("half*", np_raw_ptr[0])
+      ret_val = ffc.flexflow_tensor_set_tensor_float(self.handle, ffmodel.handle, num_dims, c_dims, raw_ptr)
+    elif np_array.dtype == np.float32:
       assert self.data_type == DataType.DT_FLOAT, "Wrong datatype"
       raw_ptr = ffi.cast("float*", np_raw_ptr[0])
       ret_val = ffc.flexflow_tensor_set_tensor_float(self.handle, ffmodel.handle, num_dims, c_dims, raw_ptr)
@@ -730,7 +808,9 @@ def set_tensor(self, ffmodel, np_array):
     
   def get_tensor(self, ffmodel):
     shape = self.dims
-    if self.data_type == DataType.DT_FLOAT:
+    if self.data_type == DataType.DT_HALF:
+      np_array = np.empty(shape, dtype=np.float16)
+    elif self.data_type == DataType.DT_FLOAT:
       np_array = np.empty(shape, dtype=np.float32)
     elif self.data_type == DataType.DT_INT32:
       np_array = np.empty(shape, dtype=np.int32)
@@ -754,7 +834,9 @@ def get_tensor(self, ffmodel):
 
   def get_gradients(self, ffmodel, comm_type):
     shape = self.dims
-    if self.data_type == DataType.DT_FLOAT:
+    if self.data_type == DataType.DT_HALF:
+      np_array = np.empty(shape, dtype=np.float16)
+    elif self.data_type == DataType.DT_FLOAT:
       np_array = np.empty(shape, dtype=np.float32)
     elif self.data_type == DataType.DT_INT32:
       np_array = np.empty(shape, dtype=np.int32)
@@ -779,7 +861,9 @@ def get_gradients(self, ffmodel, comm_type):
   
   def get_model_output_gradients(self, ffmodel, comm_type):
     shape = self.dims
-    if self.data_type == DataType.DT_FLOAT:
+    if self.data_type == DataType.DT_HALF:
+      np_array = np.empty(shape, dtype=np.float16)
+    elif self.data_type == DataType.DT_FLOAT:
       np_array = np.empty(shape, dtype=np.float32)
     elif self.data_type == DataType.DT_INT32:
       np_array = np.empty(shape, dtype=np.int32)
@@ -800,7 +884,9 @@ def get_model_output_gradients(self, ffmodel, comm_type):
   
   def get_model_output_tensor(self, ffmodel):
     shape = self.dims
-    if self.data_type == DataType.DT_FLOAT:
+    if self.data_type == DataType.DT_HALF:
+      np_array = np.empty(shape, dtype=np.float16)
+    elif self.data_type == DataType.DT_FLOAT:
       np_array = np.empty(shape, dtype=np.float32)
     elif self.data_type == DataType.DT_INT32:
       np_array = np.empty(shape, dtype=np.int32)
@@ -820,7 +906,9 @@ def get_model_output_tensor(self, ffmodel):
 
   def __get_raw_ptr(self, ffmodel, ffconfig, data_type):
     assert data_type == self.data_type, "Tensor check data type"
-    if (data_type == DataType.DT_FLOAT):
+    if (data_type == DataType.DT_HALF):
+      return ffc.flexflow_tensor_get_raw_ptr_float(self.handle, ffmodel.handle, ffconfig.handle)
+    elif (data_type == DataType.DT_FLOAT):
       return ffc.flexflow_tensor_get_raw_ptr_float(self.handle, ffmodel.handle, ffconfig.handle)
     elif (data_type == DataType.DT_INT32):
       return ffc.flexflow_tensor_get_raw_ptr_int32(self.handle, ffmodel.handle, ffconfig.handle)
@@ -1520,7 +1608,7 @@ def batch_matmul(self, A, B, a_seq_length_dim=None, b_seq_length_dim=None, name=
   def dense(self, input, out_dim, 
             activation=ActiMode.AC_MODE_NONE, 
             use_bias=True, 
-            datatype=DataType.DT_FLOAT, 
+            datatype=DataType.DT_NONE, 
             shared_op=None,
             kernel_initializer=None, bias_initializer=None, 
             kernel_regularizer=None, name=None):
@@ -2019,10 +2107,12 @@ def multihead_attention(self, query, key, value,
     return Tensor(handle, owner_op_type=OpType.MULTIHEAD_ATTENTION)
   
   def inc_multihead_attention(self, input, 
-                          embed_dim, num_heads, 
-                          kdim=0, vdim=0, dropout=0.0, 
-                          bias=True, add_bias_kv=False, add_zero_attn=False, 
-                          kernel_initializer=None, apply_rotary_embedding=False, name=None):
+                              embed_dim, num_heads, 
+                              kdim=0, vdim=0, dropout=0.0, 
+                              bias=True, add_bias_kv=False, add_zero_attn=False, 
+                              data_type=DataType.DT_NONE, kernel_initializer=None, 
+                              apply_rotary_embedding=False, scaling_query=False, scaling_factor=1.0,
+                              qk_prod_scaling=True, name=None):
     """Defines the MultiHead Attention operation as described in Attention Is All You Need 
     which takes in the tensors :attr:`query`, :attr:`key`, and :attr:`value`, 
     and returns the dot-product attention between them:.
@@ -2053,12 +2143,24 @@ def inc_multihead_attention(self, input,
                           
     :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
     :type add_zero_attn: bool
+
+    :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
+    :type data_type: DataType
     
     :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
     :type kernel_initializer: Initializer
 
     :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
     :type apply_rotary_embedding: bool
+
+    :param scaling_query: Whether to apply scaling query. Default is False.
+    :type scaling_query: bool
+
+    :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
+    :type scaling_factor: float
+
+    :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
+    :type qk_prod_scaling: bool
              
     :param name: the name of the layer. Default is None.
     :type name: string
@@ -2067,15 +2169,18 @@ def inc_multihead_attention(self, input,
     """     
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-    handle = ffc.flexflow_model_add_inc_multihead_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, kernel_init_handle, apply_rotary_embedding, c_name)
+    c_data_type = enum_to_int(DataType, data_type)
+    handle = ffc.flexflow_model_add_inc_multihead_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
     self.add_layer(OpType.INC_MULTIHEAD_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.INC_MULTIHEAD_ATTENTION)
   
   def spec_inc_multihead_attention(self, input, 
-                          embed_dim, num_heads, 
-                          kdim=0, vdim=0, dropout=0.0, 
-                          bias=True, add_bias_kv=False, add_zero_attn=False, 
-                          kernel_initializer=None, apply_rotary_embedding=False, name=None):
+                                   embed_dim, num_heads, 
+                                   kdim=0, vdim=0, dropout=0.0, 
+                                   bias=True, add_bias_kv=False, add_zero_attn=False, 
+                                   data_type=DataType.DT_NONE, kernel_initializer=None, 
+                                   apply_rotary_embedding=False, scaling_query=False, scaling_factor=1.0,
+                                   qk_prod_scaling=True, name=None):
     """Defines the MultiHead Attention operation as described in Attention Is All You Need 
     which takes in the tensors :attr:`query`, :attr:`key`, and :attr:`value`, 
     and returns the dot-product attention between them:.
@@ -2106,12 +2211,24 @@ def spec_inc_multihead_attention(self, input,
                           
     :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
     :type add_zero_attn: bool
+
+    :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
+    :type data_type: DataType
     
     :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
     :type kernel_initializer: Initializer
 
     :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
     :type apply_rotary_embedding: bool
+
+    :param scaling_query: Whether to apply scaling query. Default is False.
+    :type scaling_query: bool
+
+    :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
+    :type scaling_factor: float
+
+    :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
+    :type qk_prod_scaling: bool
              
     :param name: the name of the layer. Default is None.
     :type name: string
@@ -2120,15 +2237,18 @@ def spec_inc_multihead_attention(self, input,
     """     
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-    handle = ffc.flexflow_model_add_spec_inc_multihead_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, kernel_init_handle, apply_rotary_embedding, c_name)
+    c_data_type = enum_to_int(DataType, data_type)
+    handle = ffc.flexflow_model_add_spec_inc_multihead_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
     self.add_layer(OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION)
   
   def inc_multihead_self_attention_verify(self, input, 
-                          embed_dim, num_heads, 
-                          kdim=0, vdim=0, dropout=0.0, 
-                          bias=True, add_bias_kv=False, add_zero_attn=False, 
-                          kernel_initializer=None, apply_rotary_embedding=False, name=None):
+                                          embed_dim, num_heads, 
+                                          kdim=0, vdim=0, dropout=0.0, 
+                                          bias=True, add_bias_kv=False, add_zero_attn=False, 
+                                          data_type=DataType.DT_NONE, kernel_initializer=None, 
+                                          apply_rotary_embedding=False, scaling_query=False, scaling_factor=1.0,
+                                          qk_prod_scaling=True, name=None):
     """Defines the MultiHead Attention operation as described in Attention Is All You Need 
     which takes in the tensors :attr:`query`, :attr:`key`, and :attr:`value`, 
     and returns the dot-product attention between them:.
@@ -2159,12 +2279,24 @@ def inc_multihead_self_attention_verify(self, input,
                           
     :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
     :type add_zero_attn: bool
+
+    :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
+    :type data_type: DataType
     
     :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
     :type kernel_initializer: Initializer
 
     :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
     :type apply_rotary_embedding: bool
+
+    :param scaling_query: Whether to apply scaling query. Default is False.
+    :type scaling_query: bool
+
+    :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
+    :type scaling_factor: float
+
+    :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
+    :type qk_prod_scaling: bool
              
     :param name: the name of the layer. Default is None.
     :type name: string
@@ -2173,10 +2305,64 @@ def inc_multihead_self_attention_verify(self, input,
     """     
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-    handle = ffc.flexflow_model_add_inc_multihead_self_attention_verify(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, kernel_init_handle, apply_rotary_embedding, c_name)
+    c_data_type = enum_to_int(DataType, data_type)
+    handle = ffc.flexflow_model_add_inc_multihead_self_attention_verify(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
     self.add_layer(OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION)
   
+  def inc_multiquery_self_attention(self, input, 
+                                          embed_dim, num_heads, 
+                                          kdim=0, vdim=0, dropout=0.0, 
+                                          bias=False, add_bias_kv=False, add_zero_attn=False, 
+                                          data_type=DataType.DT_NONE, kernel_initializer=None, 
+                                          name=None):
+    """Defines the Multi-query self attention operation
+             
+    :param input: the input Tensor.
+    :type input: Tensor
+
+    :param embed_dim: total dimension of the model
+    :type embed_dim: int
+                          
+    :param num_heads: Number of attention heads.
+    :type num_heads: int
+                          
+    :param kdim: total number of features in key. Default is 0
+    :type kdim: int
+                          
+    :param vdim: total number of features in value. Default is 0
+    :type vdim: int
+                          
+    :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
+    :type dropout: float(0-1)
+                          
+    :param bias: Whether the dense layers use bias vectors. Default is True.
+    :type bias: bool
+                          
+    :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
+    :type add_bias_kv: bool
+                          
+    :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
+    :type add_zero_attn: bool
+
+    :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
+    :type data_type: DataType
+    
+    :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+    :type kernel_initializer: Initializer
+             
+    :param name: the name of the layer. Default is None.
+    :type name: string
+
+    :returns:  Tensor -- the output tensor.
+    """     
+    c_name = get_c_name(name)                 
+    kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+    c_data_type = enum_to_int(DataType, data_type)
+    handle = ffc.flexflow_model_add_inc_multiquery_self_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, c_name)
+    self.add_layer(OpType.INC_MULTIQUERY_SELF_ATTENTION, name)
+    return Tensor(handle, owner_op_type=OpType.INC_MULTIQUERY_SELF_ATTENTION)
+  
   def rms_norm(self, input, eps, dim, name=None):
     """Defines the RMS Norm layer.
              
@@ -2261,6 +2447,25 @@ def sampling(self, input, top_p, name=None):
     handle = ffc.flexflow_model_add_sampling(self.handle, input.handle, top_p, c_name)
     self.add_layer(OpType.SAMPLING, name)
     return Tensor(handle, owner_op_type=OpType.SAMPLING)
+  
+  def argmax(self, input, beam_search, name=None):
+    """Defines the Sampling layer.
+             
+    :param input: the input Tensor.
+    :type input: Tensor
+
+    :param beam_search: Whether you need to perform beam search
+    :type beam_search: bool
+             
+    :param name: the name of the layer. Default is None.
+    :type name: string
+
+    :returns:  Tensor -- the output tensor.
+    """
+    c_name = get_c_name(name)
+    handle = ffc.flexflow_model_add_argmax(self.handle, input.handle, beam_search, c_name)
+    self.add_layer(OpType.ARGMAX, name)
+    return Tensor(handle, owner_op_type=OpType.ARGMAX)
 
   def reset_metrics(self):
     """Reset performance metrics.
@@ -2514,7 +2719,9 @@ def __create_data_loader_attach(self, batch_tensor, full_array):
     full_array_shape = full_array.shape
     num_samples = full_array_shape[0]
     num_dim = len(full_array_shape)
-    if (full_array.dtype == "float32"):
+    if (full_array.dtype == "float16"):
+      datatype = DataType.DT_HALF
+    elif (full_array.dtype == "float32"):
       datatype = DataType.DT_FLOAT
     elif (full_array.dtype == "int32"):
       datatype = DataType.DT_INT32
@@ -2541,7 +2748,9 @@ def __create_data_loader_attach(self, batch_tensor, full_array):
   def __create_data_loader_ptr(self, batch_tensor, full_array):
     full_array_shape = full_array.shape
     num_samples = full_array_shape[0]
-    if (full_array.dtype == "float32"):
+    if (full_array.dtype == "float16"):
+      datatype = DataType.DT_HALF
+    elif (full_array.dtype == "float32"):
       datatype = DataType.DT_FLOAT
     elif (full_array.dtype == "int32"):
       datatype = DataType.DT_INT32
@@ -2574,7 +2783,9 @@ def __get_op_handle(self, shared_op):
   
   def get_output_tensor(self, ffmodel, data_type):
     shape = self.dims
-    if data_type == DataType.DT_FLOAT:
+    if data_type == DataType.DT_HALF:
+      np_array = np.empty(shape, dtype=np.float16)
+    elif data_type == DataType.DT_FLOAT:
       np_array = np.empty(shape, dtype=np.float32)
     elif self.data_type == DataType.DT_INT32:
       np_array = np.empty(shape, dtype=np.int32)
@@ -2595,6 +2806,10 @@ def get_output_tensor(self, ffmodel, data_type):
     fflogger.debug("get weights raw_ptr: %s, %s, %s, %s" %( str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(shape)))
     assert ret_val == True
     return np_array   
+  
+  def generate(self, text, max_sequence_length):
+    c_text = get_c_name(text)
+    return ffc.flexflow_model_generate(self.handle, c_text, max_sequence_length)
 
 # -----------------------------------------------------------------------
 # SGDOptimizer
@@ -2791,7 +3006,9 @@ class RegionNdarray(object):
   __slots__ = ['__array_interface__']
   def __init__(self, shape, data_type, base_ptr, strides, read_only):
     # See: https://docs.scipy.org/doc/numpy/reference/arrays.interface.html
-    if (data_type == DataType.DT_FLOAT):
+    if (data_type == DataType.DT_HALF):
+      field_type = "<f2" 
+    elif (data_type == DataType.DT_FLOAT):
       field_type = "<f4"
     elif (data_type == DataType.DT_INT32):
       field_type = "<i4"
@@ -2841,24 +3058,32 @@ def __init__(self):
 # -----------------------------------------------------------------------
 
 class RequestManager(object):
-  __slots__ = ['handle', '_handle']
+  __slots__ = ['handle']
   def __init__(self):
-    self.handle = ffc.flexflow_request_manager_create()
-    self._handle = ffi.gc(self.handle, ffc.flexflow_request_manager_destroy)
+    self.handle = ffc.flexflow_request_manager_get_request_manager()
+    #self._handle = ffi.gc(self.handle, ffc.flexflow_request_manager_destroy)
+
+  def register_tokenizer(self, model_type, tokenizer_filepath):
+    c_model_type = enum_to_int(ModelType, model_type)
+    c_tokenizer_filepath = get_c_name(tokenizer_filepath)
+    return ffc.flexflow_request_manager_register_tokenizer(self.handle, c_model_type, c_tokenizer_filepath)
+  
+  def register_output_filepath(self, output_filepath):
+    c_output_filepath = get_c_name(output_filepath)
+    return ffc.flexflow_request_manager_register_output_filepath(self.handle, c_output_filepath)
 
-  def flexflow_request_manager_register_new_request(self, prompt, max_sequence_length):
-    return ffc.flexflow_request_manager_register_new_request(self.handle, prompt, max_sequence_length)
+  def register_ssm_model(self, model):
+    return ffc.flexflow_request_manager_register_ssm_model(self.handle, model.handle)
   
 # -----------------------------------------------------------------------
 # InferenceManager
 # -----------------------------------------------------------------------
 
 class InferenceManager(object):
-  __slots__ = ['handle', '_handle', 'max_num_tokens_per_batch']
-  def __init__(self, ffconfig, max_num_tokens_per_batch):
-    self.max_num_tokens_per_batch = max_num_tokens_per_batch
-    self.handle = ffc.flexflow_inference_manager_create(ffconfig.handle, max_num_tokens_per_batch)
-    self._handle = ffi.gc(self.handle, ffc.flexflow_inference_manager_destroy)
+  __slots__ = ['handle']
+  def __init__(self):
+    self.handle = ffc.flexflow_inference_manager_get_inference_manager()
+    #self._handle = ffi.gc(self.handle, ffc.flexflow_inference_manager_destroy)
 
   def compile_model_and_allocate_buffer(self, model):
     ffc.flexflow_inference_manager_compile_model_and_allocate_buffer(self.handle, model.handle)
@@ -2866,9 +3091,32 @@ def compile_model_and_allocate_buffer(self, model):
   def init_operators_inference(self, model):
     ffc.flexflow_inference_manager_init_operators_inference(self.handle, model.handle)
 
-  def incr_decoding_loop(self, model, request_manager, total_num_requests):
-    ffc.flexflow_inference_manager_incr_decoding_loop(self.handle, model.handle, request_manager.handle, total_num_requests)
+# -----------------------------------------------------------------------
+# FileDataLoader
+# -----------------------------------------------------------------------
 
-  def spec_inference_loop(self, model, request_manager, total_num_requests, ssm_model_ids):
-    c_ssm_model_ids = ffi.new("int[]", ssm_model_ids)
-    ffc.flexflow_inference_manager_spec_inference_loop(self.handle, model.handle, request_manager.handle, total_num_requests, len(ssm_model_ids), c_ssm_model_ids)
+class FileDataLoader(object):
+  __slots__ = ['handle', '_handle']
+  def __init__(self, weight_file_path, num_heads, hidden_dim, qkv_inner_dim):
+    c_weight_file_path = get_c_name(weight_file_path)
+    self.handle = ffc.flexflow_file_data_loader_create(c_weight_file_path, num_heads, hidden_dim, qkv_inner_dim)
+    self._handle = ffi.gc(self.handle, ffc.flexflow_file_data_loader_destroy)
+  
+  def load_weights(self, model, model_layers_with_weights, data_type):
+    # Extract keys and values into arrays
+    layer_names = list(model_layers_with_weights.keys()) 
+    layers = list(model_layers_with_weights.values())
+    
+    # Convert to char** and flexflow_op_t* for CFFI
+    layer_names_c = [ffi.new("char[]", x.encode('ascii')) for x in layer_names]
+    layer_handles_list = [layer.handle for layer in layers]
+    layer_handles_c = ffi.new("flexflow_op_t[]", layer_handles_list)
+    
+    # Compute number of layers (key-value pairs)
+    num_layers = len(layer_names)
+    assert(len(layer_names) == len(layers))
+
+    # Check data type and create use_full_precision boolean
+    assert(data_type == DataType.DT_FLOAT or data_type == DataType.DT_HALF)
+    use_full_precision = data_type == DataType.DT_FLOAT
+    ffc.flexflow_file_data_loader_load_weights(self.handle, model.handle, num_layers, layer_names_c, layer_handles_c, use_full_precision)
diff --git a/python/flexflow/serve/__init__.py b/python/flexflow/serve/__init__.py
index e832bc7de4..4c28146d82 100644
--- a/python/flexflow/serve/__init__.py
+++ b/python/flexflow/serve/__init__.py
@@ -12,4 +12,131 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 
-from .serve import LLM, SamplingConfig
+import json, sys
+from typing import Union
+from ..type import *
+
+
+def _parse_positive_int_config(name: str, variable: str, ff_cli_name: str = None):
+    if variable is not None:
+        if type(variable) is not int:
+            raise ValueError(
+                f"The following configs take positive integers only: {name}"
+            )
+        elif variable <= 0:
+            raise ValueError(
+                f"The following configs take positive integers only: {name}"
+            )
+        if not ff_cli_name:
+            sys.argv += ["-{name}", str(variable)]
+        else:
+            sys.argv += [f"{ff_cli_name}", str(variable)]
+
+
+def init(configs: Union[str, dict]):
+    """Configure FlexFlow for inference and start the FlexFlow runtime by importing the flexflow.core package.
+
+    The configurations are passed down to the FlexFlow runtime (implemented in C++) via command line arguments.
+
+    The init function takes three mandatory parameters, which cannot be changed after starting the runtime. These are:
+    - num_gpus: the number of GPUs to reserve for the runtime
+    - memory_per_gpu: the amount of memory (in MB) to pre-allocate on each GPU
+    - zero_copy_memory_per_gpu: the amount of zero-copy memory (in MB) to pre-allocate for each GPU
+
+    In addition, the following optional parameters can be passed:
+    - num_cpus: the number of CPU processors to reserve for the runtime, defaults to 4
+    - legion_utility_processors: number of Legion utility threads to create per process, defaults to 1
+    - data_parallelism_degree: the degree of parallelization in the data parallel dimension, defaults to 1
+    - tensor_parallelism_degree: the degree of parallelization in the tensor parallel dimension (using the Megatron technique), defaults to 1
+    - pipeline_parallelism_degree: the degree of parallelization in the pipeline parallel dimension, defaults to 1
+    - offload: whether to enable offloading of the weights to CPU, defaults to False
+    - offload_reserve_space_size: the space (in MB) to reserve on CPU for offloading, default to 1024^2
+    - use_4bit_quantization: whether to use 4-bit quantization, defaults to False
+    - use_8bit_quantization: whether to use 8-bit quantization, defaults to False
+    - profiling: whether to enable the FlexFlow profiling mode, defaults to False
+    - fusion: whether to enable the FlexFlow operator fusion optimization, defaults to True
+
+    :param configs: The runtime configs, in the form of a dictionary or the path to a JSON file
+    :type configs: Union[str, dict]
+    :raises ValueError: This function will raise an exception if the JSON file pointed to by the input string is not in the right format
+    :raises ValueError: This function will raise an exception if the mandatory FlexFlow initialization parameters are missing, or are not positive integers: num_gpus, memory_per_gpu, zero_copy_memory_per_gpu
+    """
+    configs_dict = {}
+    if type(configs) == str:
+        try:
+            with open(configs) as f:
+                configs_dict = json.load(f)
+        except json.JSONDecodeError as e:
+            print("JSON format error:")
+            print(e)
+    elif type(configs) == dict:
+        configs_dict = configs
+    else:
+        raise ValueError(
+            "configs should be a dictionary or the path to a valid JSON file"
+        )
+
+    # configs should contain the following mandatory keys with non-zero integer values:
+    num_gpus = configs_dict.get("num_gpus")
+    memory_per_gpu = configs_dict.get("memory_per_gpu")
+    zero_copy_memory_per_gpu = configs_dict.get("zero_copy_memory_per_gpu")
+    if not num_gpus or not memory_per_gpu or not zero_copy_memory_per_gpu:
+        raise ValueError(
+            "Missing one of the following configs: num_gpus, memory_per_gpu, zero_copy_memory_per_gpu"
+        )
+    _parse_positive_int_config("num_gpus", num_gpus, "-ll:gpu")
+    _parse_positive_int_config("memory_per_gpu", memory_per_gpu, "-ll:fsize")
+    _parse_positive_int_config(
+        "zero_copy_memory_per_gpu", zero_copy_memory_per_gpu, "-ll:zsize"
+    )
+
+    # parse optional arguments
+    num_cpus = configs_dict.get("num_cpus")
+    _parse_positive_int_config("num_cpus", num_cpus, "-ll:cpu")
+    legion_utility_processors = configs_dict.get("legion_utility_processors")
+    _parse_positive_int_config(
+        "legion_utility_processors", legion_utility_processors, "-ll:util"
+    )
+
+    data_parallelism_degree = configs_dict.get("data_parallelism_degree")
+    tensor_parallelism_degree = configs_dict.get("tensor_parallelism_degree")
+    pipeline_parallelism_degree = configs_dict.get("pipeline_parallelism_degree")
+    _parse_positive_int_config(
+        "data_parallelism_degree", data_parallelism_degree, "-data-parallelism-degree"
+    )
+    _parse_positive_int_config(
+        "tensor_parallelism_degree",
+        tensor_parallelism_degree,
+        "-tensor-parallelism-degree",
+    )
+    _parse_positive_int_config(
+        "pipeline_parallelism_degree",
+        pipeline_parallelism_degree,
+        "-pipeline-parallelism-degree",
+    )
+
+    offload = configs_dict.get("offload", False)
+    if offload:
+        sys.argv += ["-offload"]
+    offload_reserve_space_size = configs_dict.get("offload_reserve_space_size")
+    _parse_positive_int_config(
+        "offload_reserve_space_size",
+        offload_reserve_space_size,
+        "-offload-reserve-space-size",
+    )
+    use_4bit_quantization = configs_dict.get("use_4bit_quantization", False)
+    if use_4bit_quantization:
+        sys.argv += ["--4bit-quantization"]
+    use_8bit_quantization = configs_dict.get("use_8bit_quantization", False)
+    if use_8bit_quantization:
+        sys.argv += ["--8bit-quantization"]
+
+    profiling = configs_dict.get("profiling", False)
+    if profiling:
+        sys.argv += ["--profiling"]
+    fusion = configs_dict.get("fusion", True)
+    if fusion:
+        sys.argv += ["--fusion"]
+
+    global LLM, SSM, SamplingConfig
+    from .serve import LLM, SSM, SamplingConfig
diff --git a/python/flexflow/serve/models/base.py b/python/flexflow/serve/models/base.py
new file mode 100644
index 0000000000..7538ed1676
--- /dev/null
+++ b/python/flexflow/serve/models/base.py
@@ -0,0 +1,39 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+
+class FlexFlowModel:
+    def __init__(
+        self,
+        mode,
+        sampling_config,
+        ffconfig,
+        hf_config,
+        data_type,
+        max_batch_size=1,
+        max_seq_length=256,
+        max_tokens_per_batch=64,
+        weights_filepath="",
+        tokenizer_filepath="",
+    ):
+        self.build_model()
+
+    def build_model(self):
+        assert False, "Not implemented yet"
+
+    def convert_hf_model(model, dst_folder):
+        assert False, "Not implemented yet"
+
+    def get_layers_with_weights(self):
+        assert False, "Not implemented yet"
diff --git a/python/flexflow/serve/models/falcon.py b/python/flexflow/serve/models/falcon.py
index 6fb4a13320..eeee0ba19d 100644
--- a/python/flexflow/serve/models/falcon.py
+++ b/python/flexflow/serve/models/falcon.py
@@ -13,7 +13,184 @@
 # limitations under the License.
 
 from flexflow.core import *
+from .base import FlexFlowModel
+import random, shutil
 
-class FlexFlowFalcon:
-    def __init__(self, max_batch_size=1, max_seq_length=256, max_tokens_per_batch=64):
-        pass
+
+class FalconConfig:
+    def __init__(self, hf_config):
+        self.max_seq_len = 256
+        self.max_num_tokens = 64
+        self.max_beam_width = 1
+        self.max_beam_depth = 8
+        self.bias = hf_config.bias
+        self.hidden_size = hf_config.hidden_size
+        self.layer_norm_epsilon = hf_config.layer_norm_epsilon
+        self.multi_query = hf_config.multi_query
+        self.n_head = hf_config.n_head
+        self.n_layer = hf_config.n_layer
+        self.parallel_attn = hf_config.parallel_attn
+        self.vocab_size = hf_config.vocab_size
+
+
+class FlexFlowFalcon(FlexFlowModel):
+    def __init__(
+        self,
+        mode,
+        sampling_config,
+        ffconfig,
+        hf_config,
+        data_type,
+        max_batch_size=1,
+        max_seq_length=256,
+        max_tokens_per_batch=64,
+        weights_filepath="",
+        tokenizer_filepath="",
+    ):
+        self.mode = mode
+        self.sampling_config = sampling_config
+        self.ffconfig = ffconfig
+        self.max_batch_size = max_batch_size
+        self.data_type = data_type
+        self.falcon_config = FalconConfig(hf_config)
+        self.falcon_config.max_seq_length = max_seq_length
+        self.falcon_config.max_num_tokens = max_tokens_per_batch
+        self.weights_filepath = weights_filepath
+        self.tokenizer_filepath = tokenizer_filepath
+        self.maxint = 2**31 - 1
+
+        self.build_model()
+
+    def build_model(self):
+        ffmodel = FFModel(self.ffconfig)
+
+        tokens_dims = [self.falcon_config.max_num_tokens, 1]
+        input_tensor = ffmodel.create_tensor(tokens_dims, DataType.DT_INT32)
+
+        embed_init = UniformInitializer(random.randint(0, self.maxint), 0, 0)
+        token = ffmodel.embedding(
+            input_tensor,
+            self.falcon_config.vocab_size,
+            self.falcon_config.hidden_size,
+            AggrMode.AGGR_MODE_NONE,
+            self.data_type,
+            None,
+            embed_init,
+            name="word_embeddings_weight",
+        )
+        axes = [
+            0,
+        ]
+
+        for i in range(self.falcon_config.n_layer):
+            ffmodel.set_transformer_layer_id(i)
+
+            att_norm = ffmodel.layer_norm(
+                token,
+                axes,
+                True,
+                self.falcon_config.layer_norm_epsilon,
+                name=f"layers_{i}_input_layernorm_weight",
+            )
+
+            if self.mode == InferenceMode.INC_DECODING_MODE:
+                mha = ffmodel.inc_multiquery_self_attention(
+                    att_norm,
+                    self.falcon_config.hidden_size,
+                    self.falcon_config.n_head,
+                    self.falcon_config.hidden_size // self.falcon_config.n_head,
+                    self.falcon_config.hidden_size // self.falcon_config.n_head,
+                    0.0,  # dropout
+                    False,  # bias
+                    False,  # add_bias_kv
+                    False,  # add_zero_attn
+                    DataType.DT_NONE,  # data_type
+                    None,  # kernel initializer
+                    name=f"layers_{i}_self_attention_dense_weight",
+                )
+            else:
+                assert False
+
+            dense_h_to_4h = ffmodel.dense(
+                att_norm,
+                self.falcon_config.hidden_size * 4,
+                ActiMode.AC_MODE_NONE,
+                False,
+                name=f"layers_{i}_mlp_dense_h_to_4h_weight",
+            )
+            dense_h_to_4h = ffmodel.gelu(dense_h_to_4h)
+            mlp_output = ffmodel.dense(
+                dense_h_to_4h,
+                self.falcon_config.hidden_size,
+                ActiMode.AC_MODE_NONE,
+                False,
+                name=f"layers_{i}_mlp_dense_4h_to_h_weight",
+            )
+
+            token = ffmodel.add(token, mha)
+            token = ffmodel.add(token, mlp_output)
+
+        ln_f = ffmodel.layer_norm(
+            token, axes, True, self.falcon_config.layer_norm_epsilon, name="ln_f_weight"
+        )
+        lm_head = ffmodel.dense(
+            ln_f,
+            self.falcon_config.vocab_size,
+            ActiMode.AC_MODE_NONE,
+            False,
+            name="lm_head_weight",
+        )
+
+        if self.mode == InferenceMode.BEAM_SEARCH_MODE:
+            softmax = ffmodel.softmax(lm_head, -1)
+            # output = ffmodel.beam_top_k(softmax, self.falcon_config.max_beam_width, False)
+            output = ffmodel.argmax(softmax, True)
+        else:
+            if self.sampling_config.do_sample:
+                dense = ffmodel.scalar_true_divide(
+                    lm_head, self.sampling_config.temperature, False
+                )
+                softmax = ffmodel.softmax(dense, -1)
+                output = ffmodel.sampling(softmax, self.sampling_config.topp)
+            else:
+                # output = ffmodel.arg_top_k(lm_head, 1, False)
+                output = ffmodel.argmax(lm_head, False)
+
+        self.ffmodel = ffmodel
+
+    def convert_hf_model(model, dst_folder):
+        os.makedirs(dst_folder, exist_ok=True)
+        for name, params in model.named_parameters():
+            name = (
+                name.replace(".", "_")
+                .replace("transformer_h_", "layers_")
+                .replace("transformer_", "")
+            )
+            params.detach().cpu().numpy().tofile(f"{dst_folder}/{name}")
+        # copy embedding weights
+        shutil.copy(
+            os.path.join(dst_folder, "word_embeddings_weight"),
+            os.path.join(dst_folder, "lm_head_weight"),
+        )
+
+    def get_layers_with_weights(self):
+        layer_names = [
+            "word_embeddings_weight",
+            "ln_f_weight",
+            "lm_head_weight",
+        ] + [
+            expr
+            for i in range(self.falcon_config.n_layer)
+            for expr in (
+                f"layers_{i}_input_layernorm_weight",
+                f"layers_{i}_self_attention_dense_weight",
+                f"layers_{i}_mlp_dense_h_to_4h_weight",
+                f"layers_{i}_mlp_dense_4h_to_h_weight",
+            )
+        ]
+        layers_with_weights = {
+            layer_name: self.ffmodel.get_layer_by_name(layer_name)
+            for layer_name in layer_names
+        }
+
+        return layers_with_weights
diff --git a/python/flexflow/serve/models/llama.py b/python/flexflow/serve/models/llama.py
index 9d5953c773..13245af6ff 100644
--- a/python/flexflow/serve/models/llama.py
+++ b/python/flexflow/serve/models/llama.py
@@ -13,118 +13,239 @@
 # limitations under the License.
 
 from flexflow.core import *
+from .base import FlexFlowModel
 import random
 
+
 class LLAMAConfig:
-    def __init__(self):
-        self.n_layers = 32
-        self.vocab_size = 3200
-        self.n_heads = 32
-        self.dim = 4096
-        self.multiple_of = 256
-        self.norm_eps = 1e-6
-        self.total_requests = 2560
-        self.incremental_mode = True
-        self.hidden_dim = 11008
+    def __init__(self, hf_config):
         self.max_seq_len = 256
         self.max_num_tokens = 64
         self.max_beam_width = 1
         self.max_beam_depth = 8
+        self.num_hidden_layers = hf_config.num_hidden_layers
+        self.vocab_size = hf_config.vocab_size
+        self.num_attention_heads = hf_config.num_attention_heads
+        self.hidden_size = hf_config.hidden_size
+        self.rms_norm_eps = hf_config.rms_norm_eps
+        self.intermediate_size = hf_config.intermediate_size
+
 
-class FlexFlowLLAMA:
-    def __init__(self, mode, sampling_config, ffconfig, max_batch_size=1, max_seq_length=256, max_tokens_per_batch=64, use_full_precision=False):
+class FlexFlowLLAMA(FlexFlowModel):
+    def __init__(
+        self,
+        mode,
+        sampling_config,
+        ffconfig,
+        hf_config,
+        data_type,
+        max_batch_size=1,
+        max_seq_length=256,
+        max_tokens_per_batch=64,
+        weights_filepath="",
+        tokenizer_filepath="",
+    ):
         self.mode = mode
         self.sampling_config = sampling_config
         self.ffconfig = ffconfig
         self.max_batch_size = max_batch_size
-        self.use_full_precision = use_full_precision
-        self.llama_config = LLAMAConfig()
+        self.data_type = data_type
+        self.llama_config = LLAMAConfig(hf_config)
         self.llama_config.max_seq_length = max_seq_length
         self.llama_config.max_num_tokens = max_tokens_per_batch
-        
+        self.weights_filepath = weights_filepath
+        self.tokenizer_filepath = tokenizer_filepath
+        self.maxint = 2**31 - 1
+
         self.build_model()
-    
+
     def build_model(self):
         ffmodel = FFModel(self.ffconfig)
-        
+
         tokens_dims = [self.llama_config.max_num_tokens, 1]
         input_tensor = ffmodel.create_tensor(tokens_dims, DataType.DT_INT32)
 
-        embed_init = UniformInitializer(random.randint(0, 2**31-1), 0, 0)
-        token = ffmodel.embedding(input_tensor, self.llama_config.vocab_size, self.llama_config.dim, AggrMode.AGGR_MODE_NONE, DataType.DT_FLOAT if self.use_full_precision else DataType.DT_HALF, None, embed_init)
+        embed_init = UniformInitializer(random.randint(0, self.maxint), 0, 0)
+        token = ffmodel.embedding(
+            input_tensor,
+            self.llama_config.vocab_size,
+            self.llama_config.hidden_size,
+            AggrMode.AGGR_MODE_NONE,
+            self.data_type,
+            None,
+            embed_init,
+            name="tok_embeddings_weight",
+        )
 
-        for i in range(self.llama_config.n_layers):
+        for i in range(self.llama_config.num_hidden_layers):
             ffmodel.set_transformer_layer_id(i)
 
-            attn_norm = ffmodel.rms_norm(token, self.llama_config.norm_eps, self.llama_config.dim)
+            attn_norm = ffmodel.rms_norm(
+                token,
+                self.llama_config.rms_norm_eps,
+                self.llama_config.hidden_size,
+                name=f"layers_{i}_attention_norm_weight",
+            )
 
             if self.mode == InferenceMode.BEAM_SEARCH_MODE:
                 mha = ffmodel.spec_inc_multihead_attention(
-                    attn_norm, 
-                    self.llama_config.dim,
-                    self.llama_config.n_heads,
-                    self.llama_config.dim // self.llama_config.n_heads,
-                    self.llama_config.dim // self.llama_config.n_heads,
-                    0.0,    # dropout
-                    False,  # bias 
-                    False,  # add_bias_kv 
-                    False,  # add_zero_attn 
-                    None,   # kernel initializer
-                    True    # apply_rotary_embedding 
+                    attn_norm,
+                    self.llama_config.hidden_size,
+                    self.llama_config.num_attention_heads,
+                    self.llama_config.hidden_size
+                    // self.llama_config.num_attention_heads,
+                    self.llama_config.hidden_size
+                    // self.llama_config.num_attention_heads,
+                    0.0,  # dropout
+                    False,  # bias
+                    False,  # add_bias_kv
+                    False,  # add_zero_attn
+                    DataType.DT_NONE,  # data_type
+                    None,  # kernel initializer
+                    True,  # apply_rotary_embedding
+                    name=f"layers_{i}_attention_weight",
                 )
             elif self.mode == InferenceMode.TREE_VERIFY_MODE:
                 mha = ffmodel.inc_multihead_self_attention_verify(
-                    attn_norm, 
-                    self.llama_config.dim,
-                    self.llama_config.n_heads,
-                    self.llama_config.dim // self.llama_config.n_heads,
-                    self.llama_config.dim // self.llama_config.n_heads,
-                    0.0,    # dropout
-                    False,  # bias 
-                    False,  # add_bias_kv 
-                    False,  # add_zero_attn 
-                    None,   # kernel initializer
-                    True    # apply_rotary_embedding 
+                    attn_norm,
+                    self.llama_config.hidden_size,
+                    self.llama_config.num_attention_heads,
+                    self.llama_config.hidden_size
+                    // self.llama_config.num_attention_heads,
+                    self.llama_config.hidden_size
+                    // self.llama_config.num_attention_heads,
+                    0.0,  # dropout
+                    False,  # bias
+                    False,  # add_bias_kv
+                    False,  # add_zero_attn
+                    DataType.DT_NONE,  # data_type
+                    None,  # kernel initializer
+                    True,  # apply_rotary_embedding
+                    name=f"layers_{i}_attention_weight",
                 )
             elif self.mode == InferenceMode.INC_DECODING_MODE:
                 mha = ffmodel.inc_multihead_attention(
-                    attn_norm, 
-                    self.llama_config.dim,
-                    self.llama_config.n_heads,
-                    self.llama_config.dim // self.llama_config.n_heads,
-                    self.llama_config.dim // self.llama_config.n_heads,
-                    0.0,    # dropout
-                    False,  # bias 
-                    False,  # add_bias_kv 
-                    False,  # add_zero_attn 
-                    None,   # kernel initializer
-                    True    # apply_rotary_embedding 
+                    attn_norm,
+                    self.llama_config.hidden_size,
+                    self.llama_config.num_attention_heads,
+                    self.llama_config.hidden_size
+                    // self.llama_config.num_attention_heads,
+                    self.llama_config.hidden_size
+                    // self.llama_config.num_attention_heads,
+                    0.0,  # dropout
+                    False,  # bias
+                    False,  # add_bias_kv
+                    False,  # add_zero_attn
+                    DataType.DT_NONE,  # data_type
+                    None,  # kernel initializer
+                    True,  # apply_rotary_embedding
+                    name=f"layers_{i}_attention_weight",
                 )
             else:
-                assert(False)
-            
+                assert False
+
             token = ffmodel.add(token, mha)
-            ff_norm = ffmodel.rms_norm(token, self.llama_config.norm_eps, self.llama_config.dim)
-            w1 = ffmodel.dense(ff_norm, self.llama_config.hidden_dim, ActiMode.AC_MODE_NONE, False)
-            w3 = ffmodel.dense(ff_norm, self.llama_config.hidden_dim, ActiMode.AC_MODE_NONE, False)
+            ff_norm = ffmodel.rms_norm(
+                token,
+                self.llama_config.rms_norm_eps,
+                self.llama_config.hidden_size,
+                name=f"layers_{i}_ffn_norm_weight",
+            )
+            w1 = ffmodel.dense(
+                ff_norm,
+                self.llama_config.intermediate_size,
+                ActiMode.AC_MODE_NONE,
+                False,
+                name=f"layers_{i}_feed_forward_w1_weight",
+            )
+            w3 = ffmodel.dense(
+                ff_norm,
+                self.llama_config.intermediate_size,
+                ActiMode.AC_MODE_NONE,
+                False,
+                name=f"layers_{i}_feed_forward_w3_weight",
+            )
             sigmoid = ffmodel.sigmoid(w1)
             silu = ffmodel.multiply(w1, sigmoid)
             multi = ffmodel.multiply(silu, w3)
-            w2 = ffmodel.dense(multi, self.llama_config.dim, ActiMode.AC_MODE_NONE, False)
+            w2 = ffmodel.dense(
+                multi,
+                self.llama_config.hidden_size,
+                ActiMode.AC_MODE_NONE,
+                False,
+                name=f"layers_{i}_feed_forward_w2_weight",
+            )
             token = ffmodel.add(token, w2)
 
-            token = ffmodel.rms_norm(token, self.llama_config.norm_eps, self.llama_config.dim)
-            dense = ffmodel.dense(token, self.llama_config.vocab_size, ActiMode.AC_MODE_NONE, False)
-            
-            if self.mode == InferenceMode.BEAM_SEARCH_MODE:
+        token = ffmodel.rms_norm(
+            token,
+            self.llama_config.rms_norm_eps,
+            self.llama_config.hidden_size,
+            name="norm_weight",
+        )
+        dense = ffmodel.dense(
+            token,
+            self.llama_config.vocab_size,
+            ActiMode.AC_MODE_NONE,
+            False,
+            name="output_weight",
+        )
+
+        if self.mode == InferenceMode.BEAM_SEARCH_MODE:
+            softmax = ffmodel.softmax(dense, -1)
+            # output = ffmodel.beam_top_k(softmax, self.llama_config.max_beam_width, False)
+            output = ffmodel.argmax(softmax, True)
+        else:
+            if self.sampling_config.do_sample:
+                dense = ffmodel.scalar_true_divide(
+                    dense, self.sampling_config.temperature, False
+                )
                 softmax = ffmodel.softmax(dense, -1)
-                output = ffmodel.beam_top_k(softmax, self.llama_config.max_beam_width, False)
+                output = ffmodel.sampling(softmax, self.sampling_config.topp)
             else:
-                if self.sampling_config.do_sample:
-                    dense = ffmodel.scalar_true_divide(dense, self.sampling_config.temperature, False)
-                    softmax = ffmodel.softmax(dense, -1)
-                    output = ffmodel.sampling(softmax, self.sampling_config.topp)
-                else:
-                    output = ffmodel.arg_top_k(dense, 1, False)
+                # output = ffmodel.arg_top_k(dense, 1, False)
+                output = ffmodel.argmax(dense, False)
+
+        self.ffmodel = ffmodel
+
+    def convert_hf_model(model, dst_folder):
+        os.makedirs(dst_folder, exist_ok=True)
+        for name, params in model.named_parameters():
+            name = (
+                name.replace(".", "_")
+                .replace("self_attn", "attention")
+                .replace("q_proj", "wq")
+                .replace("k_proj", "wk")
+                .replace("v_proj", "wv")
+                .replace("o_proj", "wo")
+                .replace("mlp", "feed_forward")
+                .replace("gate_proj", "w1")
+                .replace("down_proj", "w2")
+                .replace("up_proj", "w3")
+                .replace("input_layernorm", "attention_norm")
+                .replace("post_attention_layernorm", "ffn_norm")
+                .replace("embed_tokens", "tok_embeddings")
+                .replace("lm_head", "output")
+                .replace("model_", "")
+            )
+            params.detach().cpu().numpy().tofile(f"{dst_folder}/{name}")
 
+    def get_layers_with_weights(self):
+        layer_names = ["tok_embeddings_weight", "norm_weight", "output_weight"] + [
+            expr
+            for i in range(self.llama_config.num_hidden_layers)
+            for expr in (
+                f"layers_{i}_attention_norm_weight",
+                f"layers_{i}_attention_weight",
+                f"layers_{i}_ffn_norm_weight",
+                f"layers_{i}_feed_forward_w1_weight",
+                f"layers_{i}_feed_forward_w3_weight",
+                f"layers_{i}_feed_forward_w2_weight",
+            )
+        ]
+        layers_with_weights = {
+            layer_name: self.ffmodel.get_layer_by_name(layer_name)
+            for layer_name in layer_names
+        }
 
+        return layers_with_weights
diff --git a/python/flexflow/serve/models/opt.py b/python/flexflow/serve/models/opt.py
index 50ac3611d9..d7d89f5fda 100644
--- a/python/flexflow/serve/models/opt.py
+++ b/python/flexflow/serve/models/opt.py
@@ -13,7 +13,286 @@
 # limitations under the License.
 
 from flexflow.core import *
+from .base import FlexFlowModel
+import random, shutil
 
-class FlexFlowOPT:
-    def __init__(self, max_batch_size=1, max_seq_length=256, max_tokens_per_batch=64):
-        pass
+
+class OPTConfig:
+    def __init__(self, hf_config):
+        self.max_seq_len = 256
+        self.max_num_tokens = 64
+        self.max_beam_width = 1
+        self.max_beam_depth = 8
+        self.do_layer_norm_before = hf_config.do_layer_norm_before
+        self.dropout = hf_config.dropout
+        self.enable_bias = hf_config.enable_bias
+        self.ffn_dim = hf_config.ffn_dim
+        self.hidden_size = hf_config.hidden_size
+        self.layer_norm_elementwise_affine = hf_config.layer_norm_elementwise_affine
+        self.max_position_embeddings = hf_config.max_position_embeddings
+        self.num_attention_heads = hf_config.num_attention_heads
+        self.num_hidden_layers = hf_config.num_hidden_layers
+        self.vocab_size = hf_config.vocab_size
+        self.word_embed_proj_dim = hf_config.word_embed_proj_dim
+
+
+class FlexFlowOPT(FlexFlowModel):
+    def __init__(
+        self,
+        mode,
+        sampling_config,
+        ffconfig,
+        hf_config,
+        data_type,
+        max_batch_size=1,
+        max_seq_length=256,
+        max_tokens_per_batch=64,
+        weights_filepath="",
+        tokenizer_filepath="",
+    ):
+        self.mode = mode
+        self.sampling_config = sampling_config
+        self.ffconfig = ffconfig
+        self.max_batch_size = max_batch_size
+        self.data_type = data_type
+        self.opt_config = OPTConfig(hf_config)
+        self.opt_config.max_seq_length = max_seq_length
+        self.opt_config.max_num_tokens = max_tokens_per_batch
+        self.weights_filepath = weights_filepath
+        self.tokenizer_filepath = tokenizer_filepath
+        self.maxint = 2**31 - 1
+
+        self.build_model()
+
+    def build_model(self):
+        ffmodel = FFModel(self.ffconfig)
+
+        tokens_dims = [self.opt_config.max_num_tokens, 1]
+        input_tensor = ffmodel.create_tensor(tokens_dims, DataType.DT_INT32)
+        position_tensor = ffmodel.create_tensor(tokens_dims, DataType.DT_INT32)
+
+        embed_init = UniformInitializer(random.randint(0, self.maxint), 0, 0)
+        token = ffmodel.embedding(
+            input_tensor,
+            self.opt_config.vocab_size,
+            self.opt_config.word_embed_proj_dim,
+            AggrMode.AGGR_MODE_NONE,
+            self.data_type,
+            None,
+            embed_init,
+            name="embed_tokens_weight",
+        )
+        positional_embedding = ffmodel.embedding(
+            position_tensor,
+            self.opt_config.max_position_embeddings,
+            self.opt_config.hidden_size,
+            AggrMode.AGGR_MODE_NONE,
+            self.data_type,
+            None,
+            embed_init,
+            name="embed_positions_weight",
+        )
+
+        residual = ffmodel.add(token, positional_embedding)
+
+        axes = [
+            0,
+        ]
+
+        for i in range(self.opt_config.num_hidden_layers):
+            ffmodel.set_transformer_layer_id(i)
+
+            if self.opt_config.do_layer_norm_before:
+                hidden_states = ffmodel.layer_norm(
+                    residual,
+                    axes,
+                    self.opt_config.layer_norm_elementwise_affine,
+                    1e-05,
+                    name=f"layers_{i}_attention_layer_norm_weight",
+                )
+            else:
+                hidden_states = residual
+
+            if self.mode == InferenceMode.BEAM_SEARCH_MODE:
+                mha = ffmodel.spec_inc_multihead_attention(
+                    hidden_states,
+                    self.opt_config.hidden_size,
+                    self.opt_config.num_attention_heads,
+                    self.opt_config.hidden_size // self.opt_config.num_attention_heads,
+                    self.opt_config.hidden_size // self.opt_config.num_attention_heads,
+                    0.0,  # dropout
+                    True,  # bias
+                    False,  # add_bias_kv
+                    False,  # add_zero_attn
+                    DataType.DT_NONE,  # data_type
+                    None,  # kernel initializer
+                    False,  # apply_rotary_embedding
+                    True,  # scaling_query
+                    (self.opt_config.hidden_size / self.opt_config.num_attention_heads)
+                    ** (-0.5),  # scaling_factor
+                    False,  # qk_prod_scaling
+                    name=f"layers_{i}_attention_weight",
+                )
+            elif self.mode == InferenceMode.TREE_VERIFY_MODE:
+                mha = ffmodel.inc_multihead_self_attention_verify(
+                    hidden_states,
+                    self.opt_config.hidden_size,
+                    self.opt_config.num_attention_heads,
+                    self.opt_config.hidden_size // self.opt_config.num_attention_heads,
+                    self.opt_config.hidden_size // self.opt_config.num_attention_heads,
+                    0.0,  # dropout
+                    True,  # bias
+                    False,  # add_bias_kv
+                    False,  # add_zero_attn
+                    DataType.DT_NONE,  # data_type
+                    None,  # kernel initializer
+                    False,  # apply_rotary_embedding
+                    True,  # scaling_query
+                    (self.opt_config.hidden_size / self.opt_config.num_attention_heads)
+                    ** (-0.5),  # scaling_factor
+                    False,  # qk_prod_scaling
+                    name=f"layers_{i}_attention_weight",
+                )
+            elif self.mode == InferenceMode.INC_DECODING_MODE:
+                mha = ffmodel.inc_multihead_attention(
+                    hidden_states,
+                    self.opt_config.hidden_size,
+                    self.opt_config.num_attention_heads,
+                    self.opt_config.hidden_size // self.opt_config.num_attention_heads,
+                    self.opt_config.hidden_size // self.opt_config.num_attention_heads,
+                    0.0,  # dropout
+                    True,  # bias
+                    False,  # add_bias_kv
+                    False,  # add_zero_attn
+                    DataType.DT_NONE,  # data_type
+                    None,  # kernel initializer
+                    False,  # apply_rotary_embedding
+                    True,  # scaling_query
+                    (self.opt_config.hidden_size / self.opt_config.num_attention_heads)
+                    ** (-0.5),  # scaling_factor
+                    False,  # qk_prod_scaling
+                    name=f"layers_{i}_attention_weight",
+                )
+            else:
+                assert False
+
+            residual = ffmodel.add(mha, residual)
+
+            # This is either a before or after attention LayerNorm. In both cases, we need to compute the LN here.
+            norm_name = (
+                f"layers_{i}_final_layer_norm_weight"
+                if self.opt_config.do_layer_norm_before
+                else f"layers_{i}_attention_layer_norm_weight"
+            )
+            ff_norm = ffmodel.layer_norm(
+                residual,
+                axes,
+                self.opt_config.layer_norm_elementwise_affine,
+                1e-05,
+                name=norm_name,
+            )
+
+            if not self.opt_config.do_layer_norm_before:
+                residual = ff_norm
+
+            fc1 = ffmodel.dense(
+                ff_norm,
+                self.opt_config.ffn_dim,
+                ActiMode.AC_MODE_NONE,
+                True,
+                name=f"layers_{i}_fc1_weight",
+            )
+            activation = ffmodel.relu(fc1, False)
+            fc2 = ffmodel.dense(
+                activation,
+                self.opt_config.hidden_size,
+                ActiMode.AC_MODE_NONE,
+                True,
+                name=f"layers_{i}_fc2_weight",
+            )
+            residual = ffmodel.add(residual, fc2)
+
+            if not self.opt_config.do_layer_norm_before:
+                residual = ffmodel.layer_norm(
+                    residual,
+                    axes,
+                    self.opt_config.layer_norm_elementwise_affine,
+                    1e-05,
+                    name=f"layers_{i}_final_layer_norm_weight",
+                )
+
+        all_final_norm = ffmodel.layer_norm(
+            residual,
+            axes,
+            self.opt_config.layer_norm_elementwise_affine,
+            1e-05,
+            name=f"final_layer_norm_weight",
+        )
+        lm_head = ffmodel.dense(
+            all_final_norm,
+            self.opt_config.vocab_size,
+            ActiMode.AC_MODE_NONE,
+            False,
+            name="embed_tokens_weight_lm_head",
+        )
+
+        if self.mode == InferenceMode.BEAM_SEARCH_MODE:
+            softmax = ffmodel.softmax(lm_head, -1)
+            # output = ffmodel.beam_top_k(softmax, self.opt_config.max_beam_width, False)
+            output = ffmodel.argmax(softmax, True)
+        else:
+            if self.sampling_config.do_sample:
+                dense = ffmodel.scalar_true_divide(
+                    lm_head, self.sampling_config.temperature, False
+                )
+                softmax = ffmodel.softmax(dense, -1)
+                output = ffmodel.sampling(softmax, self.sampling_config.topp)
+            else:
+                # output = ffmodel.arg_top_k(lm_head, 1, False)
+                output = ffmodel.argmax(lm_head, False)
+
+        self.ffmodel = ffmodel
+
+    def convert_hf_model(model, dst_folder):
+        os.makedirs(dst_folder, exist_ok=True)
+        for name, params in model.named_parameters():
+            name = (
+                name.replace(".", "_")
+                .replace("decoder_", "")
+                .replace("model_", "")
+                .replace("self_attn", "attention")
+                .replace("q_proj", "wq")
+                .replace("k_proj", "wk")
+                .replace("v_proj", "wv")
+                .replace("out_proj", "wo")
+            )
+            params.detach().cpu().numpy().tofile(f"{dst_folder}/{name}")
+        # copy embedding weights
+        shutil.copy(
+            os.path.join(dst_folder, "embed_tokens_weight"),
+            os.path.join(dst_folder, "embed_tokens_weight_lm_head"),
+        )
+
+    def get_layers_with_weights(self):
+        layer_names = [
+            "embed_tokens_weight",
+            "embed_positions_weight",
+            "final_layer_norm_weight",
+            "embed_tokens_weight_lm_head",
+        ] + [
+            expr
+            for i in range(self.opt_config.num_hidden_layers)
+            for expr in (
+                f"layers_{i}_attention_layer_norm_weight",
+                f"layers_{i}_attention_weight",
+                f"layers_{i}_final_layer_norm_weight",
+                f"layers_{i}_fc1_weight",
+                f"layers_{i}_fc2_weight",
+            )
+        ]
+        layers_with_weights = {
+            layer_name: self.ffmodel.get_layer_by_name(layer_name)
+            for layer_name in layer_names
+        }
+
+        return layers_with_weights
diff --git a/python/flexflow/serve/serve.py b/python/flexflow/serve/serve.py
index 2c33cff58d..d1f13e17de 100644
--- a/python/flexflow/serve/serve.py
+++ b/python/flexflow/serve/serve.py
@@ -14,72 +14,347 @@
 
 from flexflow.serve.models import FlexFlowLLAMA, FlexFlowOPT, FlexFlowFalcon
 from flexflow.core import *
-from transformers import AutoConfig
-import sys
+from transformers import AutoConfig, AutoModelForCausalLM, AutoTokenizer, LlamaTokenizer
+from huggingface_hub import HfApi
+import sys, torch, shutil
+from typing import Union, List
+
 
 class SamplingConfig:
-    def __init__(self, do_sample = False, temperature=0.9, topp=0.8, topk=1):
-        self.do_sample = False
-        self.temperature = 0.8
-        self.topp = 0.6
-        self.topk = 1
+    """A class to store the sampling configs."""
+
+    def __init__(
+        self,
+        do_sample: bool = False,
+        temperature: float = 0.9,
+        topp: float = 0.8,
+        topk: int = 1,
+    ):
+        """Initialize the sampling configs
+
+        :param do_sample: Whether to perform sampling, or use greedy decoding, defaults to False
+        :type do_sample: bool, optional
+        :param temperature: The temperature setting, defaults to 0.9
+        :type temperature: float, optional
+        :param topp: The top probabilities (top-p) setting, defaults to 0.8
+        :type topp: float, optional
+        :param topk: The top-k setting, defaults to 1
+        :type topk: int, optional
+        """
+        self.do_sample = do_sample
+        self.temperature = temperature
+        self.topp = topp
+        self.topk = topk
+
 
 class LLM:
-    def __init__(self, model_name, data_type="half"):
-        self.model_name = model_name
+    """This class creates a LLM (Large-Language Model) object based on a model from HuggingFace"""
+
+    def __init__(
+        self,
+        model_name: str,
+        data_type: DataType = DataType.DT_HALF,
+        tokenizer_path: str = "",
+        weights_path: str = "",
+        clean_cache: bool = False,
+        output_file: str = "",
+    ):
+        """Create the LLM object
+
+        :param model_name: The name of the HuggingFace model to use. E.g. 'decapoda-research/llama-7b-hf'
+        :type model_name: str
+        :param data_type: The data type to use for the tensors (e.g. DataType.DT_FLOAT for full precision, or DataType.DT_HALF for half precision), defaults to DataType.DT_HALF
+        :type data_type: DataType, optional
+        :param tokenizer_path: Path to the tokenizer file or folder for the LLM. If left blank, FlexFlow will download (and cache) the relevant tokenizer from HuggingFace, defaults to ""
+        :type tokenizer_path: str, optional
+        :param weights_path: Path to the weights for the LLM. If left blank, FlexFlow will download (and cache) the weights from HuggingFace, defaults to ""
+        :type weights_path: str, optional
+        :param clean_cache: Use this flag to discard previous weights/tokenizer cache for this LLM, defaults to False
+        :type clean_cache: bool, optional
+        :param output_file: Path to the output file. If left blank, the output will not be written to file, defaults to ""
+        :type output_file: str, optional
+        """
         self.supported_models = {
-            "LlamaForCausalLM": FlexFlowLLAMA,
-            "LLaMAForCausalLM": FlexFlowLLAMA,
-            "OPTForCausalLM": FlexFlowOPT,
-            "RWForCausalLM": FlexFlowFalcon # falcon
+            "LlamaForCausalLM": (ModelType.LLAMA, FlexFlowLLAMA),
+            "LLaMAForCausalLM": (ModelType.LLAMA, FlexFlowLLAMA),
+            "OPTForCausalLM": (ModelType.OPT, FlexFlowOPT),
+            "RWForCausalLM": (ModelType.FALCON, FlexFlowFalcon),
         }
-        self.model_type = self.__get_ff_model_type(model_name)
+        self.hf_config = AutoConfig.from_pretrained(model_name, trust_remote_code=True)
+        self.model_type, self.model_class = self.__get_ff_model_type()
         self.data_type = data_type
+        assert self.data_type == DataType.DT_HALF or self.data_type == DataType.DT_FLOAT
+        self.tokenizer_path = tokenizer_path
+        self.weights_path = weights_path
+        self.clean_cache = clean_cache
+        self.output_file = output_file
         self.ffconfig = FFConfig()
 
-    def __get_ff_model_type(self, model_name):
-        hf_config = AutoConfig.from_pretrained(model_name)
-        architectures = getattr(hf_config, "architectures", [])
+    def __get_ff_model_type(self):
+        architectures = getattr(self.hf_config, "architectures", [])
         ff_arch = None
         if next(iter(architectures), None) is not None:
             ff_arch = self.supported_models.get(architectures[0])
         if ff_arch is None:
-            print("Huggingface model of type {architectures} is not yet supported by FlexFlow")
+            print(
+                "Huggingface model of type {architectures} is not yet supported by FlexFlow"
+            )
             sys.exit(1)
         return ff_arch
 
+    def __download_hf_weights(self):
+        # Use local cache, or download new version
+        self.weights_path = os.path.expanduser(
+            f"~/.cache/flexflow/models/{self.hf_config._name_or_path}/{'full-precision' if self.data_type == DataType.DT_FLOAT else 'half-precision'}"
+        )
+        if self.clean_cache:
+            print(
+                f"Discarding cached weights (if they exist) for model {self.hf_config._name_or_path}..."
+            )
+            if os.path.exists(self.weights_path):
+                shutil.rmtree(self.weights_path)
+        os.makedirs(self.weights_path, exist_ok=True)
+        print(f"Creating directory {self.weights_path} (if it doesn't exist)...")
+
+        # Get local revision SHA, check if it matches latest one on huggingface
+        local_revision = None
+        local_revision_file = os.path.join(self.weights_path, "rev_sha.txt")
+        if os.path.exists(local_revision_file):
+            local_revision = "".join(open(local_revision_file).read().split())
+        hf_api = HfApi()
+        latest_revision = hf_api.model_info(self.hf_config._name_or_path).sha
+
+        # Download if needed
+        if local_revision != latest_revision:
+            print(
+                f"'{self.hf_config._name_or_path}' model weights not found in cache or outdated. Downloading from huggingface.co ..."
+            )
+            hf_model = AutoModelForCausalLM.from_pretrained(
+                self.hf_config._name_or_path, trust_remote_code=True
+            )
+            print("Done downloading HF weights. Converting them now...")
+            self.model_class.convert_hf_model(hf_model, self.weights_path)
+            with open(local_revision_file, "w+") as f:
+                f.write(latest_revision)
+            print("Done converting the weights...")
+        else:
+            print(
+                f"Loading '{self.hf_config._name_or_path}' model weights from the cache..."
+            )
+
+    def __load_hf_tokenizer(self):
+        print("Loading tokenizer...")
+        if len(self.tokenizer_path) > 0:
+            print(f"Using tokenizer from {self.tokenizer_path}")
+            # check that tokenizer exist
+            if not os.path.exists(self.tokenizer_path):
+                raise FileNotFoundError(f"Path {self.tokenizer_path} does not exist")
+            elif (
+                os.path.isdir(self.tokenizer_path)
+                and len(os.listdir(self.tokenizer_path)) == 0
+            ):
+                raise FileNotFoundError(f"Folder {self.tokenizer_path} is empty")
+            return
+
+        # Download tokenizer
+
+        # Use local cache, or download new version
+        self.tokenizer_path = os.path.expanduser(
+            f"~/.cache/flexflow/tokenizers/{self.hf_config._name_or_path}/"
+        )
+        if self.clean_cache:
+            print(
+                f"Discarding cached tokenizer files (if they exist) for model {self.hf_config._name_or_path}..."
+            )
+            if os.path.exists(self.tokenizer_path):
+                shutil.rmtree(self.tokenizer_path)
+        if not os.path.exists(self.tokenizer_path):
+            print(f"Creating directory {self.tokenizer_path} (if it doesn't exist)...")
+        os.makedirs(self.tokenizer_path, exist_ok=True)
+
+        # Get local revision SHA, check if it matches latest one on huggingface
+        local_revision = None
+        local_revision_file = os.path.join(self.tokenizer_path, "rev_sha.txt")
+        if os.path.exists(local_revision_file):
+            local_revision = "".join(open(local_revision_file).read().split())
+        hf_api = HfApi()
+        latest_revision = hf_api.model_info(self.hf_config._name_or_path).sha
+
+        # Download if needed
+        if local_revision != latest_revision:
+            print(
+                f"'{self.hf_config._name_or_path}' tokenizer not found in cache or outdated. Downloading from huggingface.co ..."
+            )
+            if self.model_type == ModelType.LLAMA:
+                hf_tokenizer = LlamaTokenizer.from_pretrained(
+                    self.hf_config._name_or_path, use_fast=True
+                )
+            else:
+                hf_tokenizer = AutoTokenizer.from_pretrained(
+                    self.hf_config._name_or_path
+                )
+            hf_tokenizer.save_pretrained(self.tokenizer_path)
+            print("Done downloading HF tokenizer.")
+            with open(local_revision_file, "w+") as f:
+                f.write(latest_revision)
+            print("Loading the tokenizer...")
+        else:
+            print(
+                f"Loading '{self.hf_config._name_or_path}' tokenizer from the cache..."
+            )
+
+    def __load_hf_weights(self):
+        print("Loading hf weights...")
+
+        if self.data_type == DataType.DT_HALF:
+            torch.set_default_tensor_type(torch.HalfTensor)
+
+        if len(self.weights_path) > 0:
+            print(f"Using weights from {self.weights_path}")
+            # check that weights exist
+            if not os.path.exists(self.weights_path) or not os.path.isdir(
+                self.weights_path
+            ):
+                raise FileNotFoundError(
+                    f"Path {self.weights_path} does not exist or is not a directory"
+                )
+            elif len(os.listdir(self.weights_path)) == 0:
+                raise FileNotFoundError(f"Folder {self.weights_path} is empty")
+        else:
+            self.__download_hf_weights()
+
+        # Create file data loader, load weights into tensors
+        self.fileloader = FileDataLoader(
+            self.weights_path,
+            self.hf_config.num_attention_heads,
+            self.hf_config.hidden_size,
+            self.hf_config.hidden_size // self.hf_config.num_attention_heads,
+        )
+
+        model_layers_with_weights = self.model.get_layers_with_weights()
+        self.fileloader.load_weights(
+            self.model.ffmodel, model_layers_with_weights, self.data_type
+        )
+
     def compile(
         self,
-        mode = InferenceMode.INC_DECODING_MODE,
-        sampling_config = SamplingConfig(),
-        use_full_precision = False,
-        max_batch_size=1,
-        max_seq_length=256,
-        max_tokens_per_batch=64,
-        tensor_parallel_degree=4,
-        pipeline_parallel_degree=2,
-        ssms=[],
+        mode: InferenceMode = InferenceMode.INC_DECODING_MODE,
+        sampling_config: SamplingConfig = SamplingConfig(),
+        max_batch_size: int = 1,
+        max_seq_length: int = 256,
+        max_tokens_per_batch: int = 64,
+        ssms: list = [],
     ):
+        """Compile the LLM for inference and load the weights into memory
+
+        :param mode: The LLM inference mode (InferenceMode.INC_DECODING_MODE for incremental decoding, InferenceMode.BEAM_SEARCH_MODE for beam search, or InferenceMode.TREE_VERIFY_MODE for token tree verification), defaults to InferenceMode.INC_DECODING_MODE
+        :type mode: InferenceMode, optional
+        :param sampling_config: The SamplingConfig object with the configurations to use for sampling, defaults to SamplingConfig()
+        :type sampling_config: SamplingConfig, optional
+        :param max_batch_size: The maximum batch size to allow, defaults to 1
+        :type max_batch_size: int, optional
+        :param max_seq_length: The maximum sequence length to allow per batch, defaults to 256
+        :type max_seq_length: int, optional
+        :param max_tokens_per_batch: The maximum number of tokens (across requests) to allow per batch, defaults to 64
+        :type max_tokens_per_batch: int, optional
+        :param ssms: The SSMs to use when operating in speculative inference mode, defaults to []
+        :type ssms: list, optional
+        """
         self.max_batch_size = max_batch_size
         self.max_seq_length = max_seq_length
         self.max_tokens_per_batch = max_tokens_per_batch
-        self.tensor_parallel_degree = tensor_parallel_degree
-        self.pipeline_parallel_degree = pipeline_parallel_degree
         self.ssms = ssms
         self.sampling_config = SamplingConfig()
-        assert((mode == InferenceMode.INC_DECODING_MODE or mode == InferenceMode.BEAM_SEARCH_MODE) == (len(ssms) == 0))
-        
-        # Create model
-        self.model = self.model_type(mode, sampling_config, self.ffconfig, max_batch_size, max_seq_length, max_tokens_per_batch, use_full_precision)
+        assert (
+            mode == InferenceMode.INC_DECODING_MODE
+            or mode == InferenceMode.BEAM_SEARCH_MODE
+        ) == (len(ssms) == 0)
+
+        # Instantiate the relevant model
+        self.model = self.model_class(
+            mode,
+            sampling_config,
+            self.ffconfig,
+            self.hf_config,
+            self.data_type,
+            max_batch_size,
+            max_seq_length,
+            max_tokens_per_batch,
+        )
 
         # Create inference manager
-        self.im = InferenceManager(self.ffconfig, max_tokens_per_batch)
+        self.im = InferenceManager()
+        self.im.compile_model_and_allocate_buffer(self.model.ffmodel)
+
+        # Download the weights and tokenizer from huggingface (if needed) and load them
+        self.__load_hf_weights()
+        self.__load_hf_tokenizer()
 
         # Create request manager
         self.rm = RequestManager()
-        
-        assert False and "Not implemented yet"
+        self.rm.register_tokenizer(self.model_type, self.tokenizer_path)
+        self.rm.register_output_filepath(self.output_file)
+
+        self.im.init_operators_inference(self.model.ffmodel)
+
+        for ssm in self.ssms:
+            self.rm.register_ssm_model(ssm.model.ffmodel)
+
+    def generate(self, prompts: Union[str, List[str]]):
+        """Generate tokens based on the input prompt(s)
+
+        :param prompts: The generation prompt(s) in the form of a string, or list of strings
+        :type prompts: Union[str, List[str]]
+        :return: the generation results
+        :rtype: GenerationResult
+        """
+        if type(prompts) == str:
+            if len(prompts) == 0:
+                return None
+            return self.model.ffmodel.generate(prompts, 128)
+        elif type(prompts) == list:
+            if len(prompts) == 0:
+                return []
+            return [self.model.ffmodel.generate(prompt, 128) for prompt in prompts]
+        else:
+            assert False, "Please pass a non-empty string or list of strings"
+
+
+class SSM(LLM):
+    """This class creates a SSM (Small-Speculative Model) object based on a model from HuggingFace"""
+
+    def __init__(
+        self,
+        model_name: str,
+        data_type: DataType = DataType.DT_HALF,
+        tokenizer_path: str = "",
+        weights_path: str = "",
+        clean_cache: bool = False,
+        output_file: str = "",
+    ):
+        """Create the SSM object
 
-    def generate(self, prompt, sampling=None):
-        self.sampling = sampling if sampling is not None else self.default_config
-        assert False and "Not implemented yet"
+        :param model_name: The name of the HuggingFace model to use. E.g. 'decapoda-research/llama-7b-hf'
+        :type model_name: str
+        :param data_type: The data type to use for the tensors (e.g. DataType.DT_FLOAT for full precision, or DataType.DT_HALF for half precision), defaults to DataType.DT_HALF
+        :type data_type: DataType, optional
+        :param tokenizer_path: Path to the tokenizer file or folder for the LLM. If left blank, FlexFlow will download (and cache) the relevant tokenizer from HuggingFace, defaults to ""
+        :type tokenizer_path: str, optional
+        :param weights_path: Path to the weights for the LLM. If left blank, FlexFlow will download (and cache) the weights from HuggingFace, defaults to ""
+        :type weights_path: str, optional
+        :param clean_cache: Use this flag to discard previous weights/tokenizer cache for this LLM, defaults to False
+        :type clean_cache: bool, optional
+        :param output_file: Path to the output file. If left blank, the output will not be written to file, defaults to ""
+        :type output_file: str, optional
+        """
+        super().__init__(
+            model_name,
+            data_type,
+            tokenizer_path,
+            weights_path,
+            clean_cache,
+            output_file,
+        )
+        self.ffconfig.data_parallelism_degree = 1
+        self.ffconfig.tensor_parallelism_degree = 1
+        self.ffconfig.pipeline_parallelism_degree = 1
diff --git a/python/flexflow/type.py b/python/flexflow/type.py
index dd1d40baf0..94a0b6085c 100644
--- a/python/flexflow/type.py
+++ b/python/flexflow/type.py
@@ -2,156 +2,179 @@
 
 from enum import Enum
 
+
 class ActiMode(Enum):
-  AC_MODE_NONE = 10
-  AC_MODE_RELU = 11
-  AC_MODE_SIGMOID = 12
-  AC_MODE_TANH = 13
-  AC_MODE_GELU = 14
+    AC_MODE_NONE = 10
+    AC_MODE_RELU = 11
+    AC_MODE_SIGMOID = 12
+    AC_MODE_TANH = 13
+    AC_MODE_GELU = 14
+
 
 class RegularizerMode(Enum):
-  REG_MODE_NONE = 17
-  REG_MODE_L1 = 18
-  REG_MODE_L2 = 19
+    REG_MODE_NONE = 17
+    REG_MODE_L1 = 18
+    REG_MODE_L2 = 19
+
 
 class AggrMode(Enum):
-  AGGR_MODE_NONE = 20
-  AGGR_MODE_SUM = 21
-  AGGR_MODE_AVG = 22
+    AGGR_MODE_NONE = 20
+    AGGR_MODE_SUM = 21
+    AGGR_MODE_AVG = 22
+
 
 class PoolType(Enum):
-  POOL_MAX = 30
-  POOL_AVG = 31
+    POOL_MAX = 30
+    POOL_AVG = 31
+
 
 class DataType(Enum):
-  DT_BOOLEAN = 40
-  DT_INT32 = 41
-  DT_INT64 = 42
-  DT_HALF = 43
-  DT_FLOAT = 44
-  DT_DOUBLE = 45
-  DT_NONE = 49
+    DT_BOOLEAN = 40
+    DT_INT32 = 41
+    DT_INT64 = 42
+    DT_HALF = 43
+    DT_FLOAT = 44
+    DT_DOUBLE = 45
+    DT_NONE = 49
+
 
 class LossType(Enum):
-  LOSS_CATEGORICAL_CROSSENTROPY = 50
-  LOSS_SPARSE_CATEGORICAL_CROSSENTROPY = 51
-  LOSS_MEAN_SQUARED_ERROR_AVG_REDUCE = 52
-  LOSS_MEAN_SQUARED_ERROR_SUM_REDUCE = 53
-  LOSS_IDENTITY = 54
+    LOSS_CATEGORICAL_CROSSENTROPY = 50
+    LOSS_SPARSE_CATEGORICAL_CROSSENTROPY = 51
+    LOSS_MEAN_SQUARED_ERROR_AVG_REDUCE = 52
+    LOSS_MEAN_SQUARED_ERROR_SUM_REDUCE = 53
+    LOSS_IDENTITY = 54
+
 
 class CompMode(Enum):
-  TRAINING = 70
-  INFERENCE = 71
-  
+    TRAINING = 70
+    INFERENCE = 71
+
+
 class ParameterSyncType(Enum):
-  NONE = 80
-  PS = 81
-  NCCL = 82
-  
+    NONE = 80
+    PS = 81
+    NCCL = 82
+
+
 class MetricsType(Enum):
-  METRICS_ACCURACY = 1001
-  METRICS_CATEGORICAL_CROSSENTROPY = 1002
-  METRICS_SPARSE_CATEGORICAL_CROSSENTROPY = 1004
-  METRICS_MEAN_SQUARED_ERROR = 1008
-  METRICS_ROOT_MEAN_SQUARED_ERROR = 1016
-  METRICS_MEAN_ABSOLUTE_ERROR=1032
+    METRICS_ACCURACY = 1001
+    METRICS_CATEGORICAL_CROSSENTROPY = 1002
+    METRICS_SPARSE_CATEGORICAL_CROSSENTROPY = 1004
+    METRICS_MEAN_SQUARED_ERROR = 1008
+    METRICS_ROOT_MEAN_SQUARED_ERROR = 1016
+    METRICS_MEAN_ABSOLUTE_ERROR = 1032
+
 
 class InferenceMode(Enum):
-  INC_DECODING_MODE = 2001
-  BEAM_SEARCH_MODE = 2002
-  TREE_VERIFY_MODE = 2003
+    INC_DECODING_MODE = 2001
+    BEAM_SEARCH_MODE = 2002
+    TREE_VERIFY_MODE = 2003
+
+
+class ModelType(Enum):
+    UNKNOWN = 3001
+    LLAMA = 3002
+    OPT = 3003
+    FALCON = 3004
+
 
 class OpType(Enum):
-  CONV2D = 2011
-  EMBEDDING = 2012
-  POOL2D = 2013
-  LINEAR = 2014
-  SOFTMAX = 2015
-  CONCAT = 2016
-  FLAT = 2017
-  MSELOSS = 2020
-  BATCH_NORM = 2021
-  RELU = 2022
-  SIGMOID = 2023
-  TANH = 2024
-  ELU = 2025
-  DROPOUT = 2026
-  BATCH_MATMUL = 2027
-  SPLIT = 2028
-  RESHAPE = 2029
-  TRANSPOSE = 2030
-  REVERSE = 2031
-  EXP = 2040
-  ADD = 2041
-  SUBTRACT = 2042
-  MULTIPLY = 2043
-  DIVIDE = 2044
-  POW = 2045
-  MEAN = 2046
-  RSQRT = 2047
-  SIN = 2048
-  COS = 2049
-  INPUT = 2050
-  OUTPUT = 2051
-  REDUCE_SUM = 2052
-  MAX = 2053
-  MIN = 2054
-  MULTIHEAD_ATTENTION = 2060
-  INC_MULTIHEAD_ATTENTION = 2061
-  SPEC_INC_MULTIHEAD_SELF_ATTENTION = 2062
-  TREE_INC_MULTIHEAD_SELF_ATTENTION = 2063
-  INC_MULTIQUERY_SELF_ATTENTION = 2064
-  SAMPLING = 2065
-  GETITEM = 2070
-  GETATTR = 2080
-  EXPAND = 2081
-  LAYER_NORM = 2082
-  FLOOR_DIVIDE = 2083
-  IDENTITY = 2084
-  GELU = 2085
-  PERMUTE = 2086
-  SCALAR_MULTIPLY = 2087
-  SCALAR_FLOORDIV = 2088
-  SCALAR_ADD = 2089
-  SCALAR_SUB = 2090
-  SCALAR_TRUEDIV = 2091
-  INIT_PARAM = 2092
-  FLOAT = 2100
-  CONTIGUOUS = 2101
-  TO = 2102
-  UNSQUEEZE = 2103
-  TYPE_AS = 2104
-  VIEW = 2105
-  GATHER = 2106
-  ATTRIBUTE = 2200
-  RMS_NORM = 2300
-  ARG_TOPK = 2301
-  BEAM_TOPK = 2302
+    CONV2D = 2011
+    EMBEDDING = 2012
+    POOL2D = 2013
+    LINEAR = 2014
+    SOFTMAX = 2015
+    CONCAT = 2016
+    FLAT = 2017
+    MSELOSS = 2020
+    BATCH_NORM = 2021
+    RELU = 2022
+    SIGMOID = 2023
+    TANH = 2024
+    ELU = 2025
+    DROPOUT = 2026
+    BATCH_MATMUL = 2027
+    SPLIT = 2028
+    RESHAPE = 2029
+    TRANSPOSE = 2030
+    REVERSE = 2031
+    EXP = 2040
+    ADD = 2041
+    SUBTRACT = 2042
+    MULTIPLY = 2043
+    DIVIDE = 2044
+    POW = 2045
+    MEAN = 2046
+    RSQRT = 2047
+    SIN = 2048
+    COS = 2049
+    INPUT = 2050
+    OUTPUT = 2051
+    REDUCE_SUM = 2052
+    MAX = 2053
+    MIN = 2054
+    MULTIHEAD_ATTENTION = 2060
+    INC_MULTIHEAD_ATTENTION = 2061
+    SPEC_INC_MULTIHEAD_SELF_ATTENTION = 2062
+    TREE_INC_MULTIHEAD_SELF_ATTENTION = 2063
+    INC_MULTIQUERY_SELF_ATTENTION = 2064
+    SAMPLING = 2065
+    ARGMAX = 2066
+    GETITEM = 2070
+    GETATTR = 2080
+    EXPAND = 2081
+    LAYER_NORM = 2082
+    FLOOR_DIVIDE = 2083
+    IDENTITY = 2084
+    GELU = 2085
+    PERMUTE = 2086
+    SCALAR_MULTIPLY = 2087
+    SCALAR_FLOORDIV = 2088
+    SCALAR_ADD = 2089
+    SCALAR_SUB = 2090
+    SCALAR_TRUEDIV = 2091
+    INIT_PARAM = 2092
+    FLOAT = 2100
+    CONTIGUOUS = 2101
+    TO = 2102
+    UNSQUEEZE = 2103
+    TYPE_AS = 2104
+    VIEW = 2105
+    GATHER = 2106
+    ATTRIBUTE = 2200
+    RMS_NORM = 2300
+    ARG_TOPK = 2301
+    BEAM_TOPK = 2302
+
 
 def enum_to_int(enum, enum_item):
-  for item in enum:
-    if (enum_item == item):
-      return item.value
+    for item in enum:
+        if enum_item == item:
+            return item.value
+
+    print(enum_item)
+    print(enum)
+    assert 0, "unknown enum type " + str(enum_item) + " " + str(enum)
+    return -1
 
-  print(enum_item)
-  print(enum)
-  assert 0, "unknown enum type " + str(enum_item) + " " + str(enum)
-  return -1
 
 def int_to_enum(enum, value):
-  for item in enum:
-    if (item.value == value):
-      return item
+    for item in enum:
+        if item.value == value:
+            return item
+
+    assert 0, "unknown enum value " + str(value) + " " + str(enum)
+
 
-  assert 0, "unknown enum value " + str(value) + " " + str(enum)
-  
 def enum_to_str(enum, enum_item):
-  name = enum(enum_item).name
-  return name
-  
+    name = enum(enum_item).name
+    return name
+
+
 def str_to_enum(enum, value):
-  for item in enum:
-    if (item.name == value):
-      return item
+    for item in enum:
+        if item.name == value:
+            return item
 
-  assert 0, "unknown enum value " + value + " " + str(enum)
+    assert 0, "unknown enum value " + value + " " + str(enum)
diff --git a/python/flexflow_python_build.py b/python/flexflow_python_build.py
index 0e58193ef7..c9749d8369 100755
--- a/python/flexflow_python_build.py
+++ b/python/flexflow_python_build.py
@@ -29,14 +29,15 @@
     sys.exit(1)
 build_dir = os.path.abspath(build_dir)
 script_dir = os.path.abspath(os.path.dirname(__file__))
-script_path = os.path.join(build_dir, "flexflow_python")
 if not os.path.isdir(build_dir):
     print(f"Folder {build_dir} does not exist")
     sys.exit(1)
 if not os.path.isdir(script_dir):
     print(f"Folder {script_dir} does not exist")
     sys.exit(1)
-script_path = os.path.abspath(script_path)
+# Build flexflow_python script
+flexflow_python_path = os.path.join(build_dir, "flexflow_python")
+flexflow_python_path = os.path.abspath(flexflow_python_path)
 lines = [
     '#! /usr/bin/env bash',
     f'BUILD_FOLDER="{build_dir}"',
@@ -52,10 +53,26 @@
     '\tlegion_python "$@"',
     'fi'
 ]
-
-with open(script_path, "w+") as script_file:
+with open(flexflow_python_path, "w+") as flexflow_python_file:
     for line in lines:
-        script_file.write(line + "\n")
+        flexflow_python_file.write(line + "\n")
+cur_stat = os.stat(flexflow_python_path)
+os.chmod(flexflow_python_path, cur_stat.st_mode | stat.S_IEXEC)
 
-cur_stat = os.stat(script_path)
-os.chmod(script_path, cur_stat.st_mode | stat.S_IEXEC)
+# Build set_python_envs.sh
+python_envs_path = os.path.join(build_dir, "set_python_envs.sh")
+python_envs_path = os.path.abspath(python_envs_path)
+lines = [
+    '#! /usr/bin/env bash',
+    f'BUILD_FOLDER="{build_dir}"',
+    f'PYTHON_FOLDER="{script_dir}"',
+    'PYLIB_PATH="$("$PYTHON_FOLDER"/flexflow/findpylib.py)"',
+    'PYLIB_DIR="$(dirname "$PYLIB_PATH")"',
+    'export LD_LIBRARY_PATH="$BUILD_FOLDER:$BUILD_FOLDER/deps/legion/lib:$PYLIB_DIR:$LD_LIBRARY_PATH"',
+    'export PYTHONPATH="$PYTHON_FOLDER:$BUILD_FOLDER/deps/legion/bindings/python:$PYTHONPATH"',
+]
+with open(python_envs_path, "w+") as python_envs_file:
+    for line in lines:
+        python_envs_file.write(line + "\n")
+cur_stat = os.stat(python_envs_path)
+os.chmod(python_envs_path, cur_stat.st_mode | stat.S_IEXEC)
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index 1c3103683f..c210836d9b 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -17,6 +17,7 @@
 #include "flexflow/dataloader.h"
 #include "flexflow/mapper.h"
 #include "flexflow/request_manager.h"
+#include "inference/file_loader.h"
 
 using namespace Legion;
 using namespace FlexFlow;
@@ -64,6 +65,8 @@ class FFCObjectWrapper {
                         BeamSearchBatchConfig *);
   FF_NEW_OPAQUE_WRAPPER(flexflow_inference_manager_t, InferenceManager *);
   FF_NEW_OPAQUE_WRAPPER(flexflow_request_manager_t, RequestManager *);
+  FF_NEW_OPAQUE_WRAPPER(flexflow_file_data_loader_t, FileDataLoader *);
+  FF_NEW_OPAQUE_WRAPPER(flexflow_generation_result_t, GenerationResult *);
 };
 
 Logger ffc_log("flexflow_c");
@@ -130,6 +133,39 @@ bool flexflow_config_get_enable_control_replication(flexflow_config_t handle_) {
   return handle->enable_control_replication;
 }
 
+int flexflow_config_get_data_parallelism_degree(flexflow_config_t handle_) {
+  FFConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  return handle->data_parallelism_degree;
+}
+
+int flexflow_config_get_tensor_parallelism_degree(flexflow_config_t handle_) {
+  FFConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  return handle->tensor_parallelism_degree;
+}
+
+int flexflow_config_get_pipeline_parallelism_degree(flexflow_config_t handle_) {
+  FFConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  return handle->pipeline_parallelism_degree;
+}
+
+void flexflow_config_set_data_parallelism_degree(flexflow_config_t handle_,
+                                                 int value) {
+  FFConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  handle->data_parallelism_degree = value;
+}
+
+void flexflow_config_set_tensor_parallelism_degree(flexflow_config_t handle_,
+                                                   int value) {
+  FFConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  handle->tensor_parallelism_degree = value;
+}
+
+void flexflow_config_set_pipeline_parallelism_degree(flexflow_config_t handle_,
+                                                     int value) {
+  FFConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  handle->pipeline_parallelism_degree = value;
+}
+
 int flexflow_config_get_python_data_loader_type(flexflow_config_t handle_) {
   FFConfig *handle = FFCObjectWrapper::unwrap(handle_);
   return handle->python_data_loader_type;
@@ -1024,8 +1060,12 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_attention(
     bool bias,
     bool add_bias_kv,
     bool add_zero_attn,
+    enum DataType data_type,
     flexflow_initializer_t kernel_initializer_,
     bool apply_rotary_embedding,
+    bool scaling_query,
+    float scaling_factor,
+    bool qk_prod_scaling,
     char const *name) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
   Tensor input = FFCObjectWrapper::unwrap(input_);
@@ -1040,9 +1080,12 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_attention(
                                                        bias,
                                                        add_bias_kv,
                                                        add_zero_attn,
-                                                       input->data_type,
+                                                       data_type,
                                                        kernel_initializer,
                                                        apply_rotary_embedding,
+                                                       scaling_query,
+                                                       scaling_factor,
+                                                       qk_prod_scaling,
                                                        name);
   return FFCObjectWrapper::wrap(tensor);
 }
@@ -1058,8 +1101,12 @@ flexflow_tensor_t flexflow_model_add_spec_inc_multihead_attention(
     bool bias,
     bool add_bias_kv,
     bool add_zero_attn,
+    enum DataType data_type,
     flexflow_initializer_t kernel_initializer_,
     bool apply_rotary_embedding,
+    bool scaling_query,
+    float scaling_factor,
+    bool qk_prod_scaling,
     char const *name) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
   Tensor input = FFCObjectWrapper::unwrap(input_);
@@ -1075,9 +1122,12 @@ flexflow_tensor_t flexflow_model_add_spec_inc_multihead_attention(
                                                 bias,
                                                 add_bias_kv,
                                                 add_zero_attn,
-                                                input->data_type,
+                                                data_type,
                                                 kernel_initializer,
                                                 apply_rotary_embedding,
+                                                scaling_query,
+                                                scaling_factor,
+                                                qk_prod_scaling,
                                                 name);
   return FFCObjectWrapper::wrap(tensor);
 }
@@ -1093,8 +1143,12 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention_verify(
     bool bias,
     bool add_bias_kv,
     bool add_zero_attn,
+    enum DataType data_type,
     flexflow_initializer_t kernel_initializer_,
     bool apply_rotary_embedding,
+    bool scaling_query,
+    float scaling_factor,
+    bool qk_prod_scaling,
     char const *name) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
   Tensor input = FFCObjectWrapper::unwrap(input_);
@@ -1110,9 +1164,46 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention_verify(
                                                   bias,
                                                   add_bias_kv,
                                                   add_zero_attn,
-                                                  input->data_type,
+                                                  data_type,
                                                   kernel_initializer,
                                                   apply_rotary_embedding,
+                                                  scaling_query,
+                                                  scaling_factor,
+                                                  qk_prod_scaling,
+                                                  name);
+  return FFCObjectWrapper::wrap(tensor);
+}
+
+flexflow_tensor_t flexflow_model_add_inc_multiquery_self_attention(
+    flexflow_model_t handle_,
+    const flexflow_tensor_t input_,
+    int embed_dim,
+    int num_heads,
+    int kdim,
+    int vdim,
+    float dropout,
+    bool bias,
+    bool add_bias_kv,
+    bool add_zero_attn,
+    enum DataType data_type,
+    flexflow_initializer_t kernel_initializer_,
+    char const *name) {
+  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
+  Tensor input = FFCObjectWrapper::unwrap(input_);
+  Initializer *kernel_initializer =
+      FFCObjectWrapper::unwrap(kernel_initializer_);
+  Tensor tensor =
+      handle->inc_multihead_self_attention_verify(input,
+                                                  embed_dim,
+                                                  num_heads,
+                                                  kdim,
+                                                  vdim,
+                                                  dropout,
+                                                  bias,
+                                                  add_bias_kv,
+                                                  add_zero_attn,
+                                                  data_type,
+                                                  kernel_initializer,
                                                   name);
   return FFCObjectWrapper::wrap(tensor);
 }
@@ -1160,6 +1251,16 @@ flexflow_tensor_t flexflow_model_add_sampling(flexflow_model_t handle_,
   return FFCObjectWrapper::wrap(tensor);
 }
 
+flexflow_tensor_t flexflow_model_add_argmax(flexflow_model_t handle_,
+                                            const flexflow_tensor_t input_,
+                                            bool beam_search,
+                                            char const *name) {
+  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
+  Tensor input = FFCObjectWrapper::unwrap(input_);
+  Tensor tensor = handle->argmax(input, beam_search, name);
+  return FFCObjectWrapper::wrap(tensor);
+}
+
 void flexflow_model_set_sgd_optimizer(flexflow_model_t handle_,
                                       flexflow_sgd_optimizer_t optimizer_) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
@@ -1213,6 +1314,16 @@ void flexflow_model_set_transformer_layer_id(flexflow_model_t handle_, int id) {
   handle->set_transformer_layer_id(id);
 }
 
+flexflow_generation_result_t flexflow_model_generate(flexflow_model_t handle_,
+                                                     char const *text,
+                                                     int max_seq_length) {
+  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
+  std::string const text_str(text);
+  GenerationResult result = handle->generate(text_str, max_seq_length);
+  DEBUG_PRINT("[Model] generate %p %s %i", handle, text, max_seq_length);
+  return FFCObjectWrapper::wrap(&result);
+}
+
 // -----------------------------------------------------------------------
 // Tensor
 // -----------------------------------------------------------------------
@@ -2149,27 +2260,43 @@ void flexflow_beam_search_batch_config_destroy(
 // RequestManager
 // -----------------------------------------------------------------------
 
-flexflow_request_manager_t flexflow_request_manager_create(void) {
-  RequestManager *rm = new RequestManager();
-  DEBUG_PRINT("[RequestManager] new %p", rm);
+flexflow_request_manager_t flexflow_request_manager_get_request_manager(void) {
+  RequestManager *rm = RequestManager::get_request_manager();
+  DEBUG_PRINT("[RequestManager] get %p", rm);
   return FFCObjectWrapper::wrap(rm);
 }
 
-void flexflow_request_manager_destroy(flexflow_request_manager_t handle_) {
+void flexflow_request_manager_register_tokenizer(
+    flexflow_request_manager_t handle_,
+    enum ModelType model_type,
+    char const *tokenizer_filepath) {
   RequestManager *handle = FFCObjectWrapper::unwrap(handle_);
-  DEBUG_PRINT("[RequestManager] delete %p", handle);
-  delete handle;
+  assert(tokenizer_filepath != nullptr &&
+         "Cannot convert nullptr char * to std::string");
+  std::string const tokenizer_filepath_str(tokenizer_filepath);
+  handle->register_tokenizer(model_type, tokenizer_filepath_str);
+  DEBUG_PRINT(
+      "[RequestManager] register tokenizer %p %s", handle, tokenizer_filepath);
 }
 
-long unsigned int flexflow_request_manager_register_new_request(
-    flexflow_request_manager_t handle_,
-    char const *prompt,
-    int max_sequence_length) {
+void flexflow_request_manager_register_output_filepath(
+    flexflow_request_manager_t handle_, char const *output_filepath) {
   RequestManager *handle = FFCObjectWrapper::unwrap(handle_);
-  assert(prompt != nullptr && "Cannot convert nullptr char * to std::string");
-  std::string const prompt_str(prompt);
-  DEBUG_PRINT("[RequestManager] register_new_request %p %s", handle, prompt);
-  return handle->register_new_request(prompt_str, max_sequence_length);
+  assert(output_filepath != nullptr &&
+         "Cannot convert nullptr char * to std::string");
+  std::string const output_filepath_str(output_filepath);
+  handle->register_output_filepath(output_filepath_str);
+  DEBUG_PRINT("[RequestManager] register output filepath %p %s",
+              handle,
+              output_filepath);
+}
+
+int flexflow_request_manager_register_ssm_model(
+    flexflow_request_manager_t handle_, flexflow_model_t model_handle_) {
+  RequestManager *handle = FFCObjectWrapper::unwrap(handle_);
+  FFModel *model_handle = FFCObjectWrapper::unwrap(model_handle_);
+  DEBUG_PRINT("[RequestManager] register ssm %p %p", handle, model_handle);
+  return handle->register_ssm_model(model_handle);
 }
 
 // -----------------------------------------------------------------------
@@ -2177,65 +2304,66 @@ long unsigned int flexflow_request_manager_register_new_request(
 // -----------------------------------------------------------------------
 
 flexflow_inference_manager_t
-    flexflow_inference_manager_create(flexflow_config_t config_handle,
-                                      int max_num_tokens_per_batch) {
-  FFConfig *config = FFCObjectWrapper::unwrap(config_handle);
-  InferenceManager *im =
-      new InferenceManager(*config, max_num_tokens_per_batch);
-  DEBUG_PRINT("[InferenceManager] new %p", im);
+    flexflow_inference_manager_get_inference_manager() {
+  InferenceManager *im = InferenceManager::get_inference_manager();
+  DEBUG_PRINT("[InferenceManager] get %p", im);
   return FFCObjectWrapper::wrap(im);
 }
 
-void flexflow_inference_manager_destroy(flexflow_inference_manager_t handle_) {
-  InferenceManager *handle = FFCObjectWrapper::unwrap(handle_);
-  DEBUG_PRINT("[InferenceManager] delete %p", handle);
-  delete handle;
-}
-
 void flexflow_inference_manager_compile_model_and_allocate_buffer(
-    flexflow_inference_manager_t handle_, flexflow_model_t model_handle_) {
+    flexflow_inference_manager_t handle_, flexflow_model_t model_handle) {
   InferenceManager *handle = FFCObjectWrapper::unwrap(handle_);
-  FFModel *model_handle = FFCObjectWrapper::unwrap(model_handle_);
+  FFModel *model = FFCObjectWrapper::unwrap(model_handle);
   DEBUG_PRINT("[InferenceManager] compile_model_and_allocate_buffer %p",
               handle);
-  handle->compile_model_and_allocate_buffer(model_handle);
+  handle->compile_model_and_allocate_buffer(model);
 }
 
 void flexflow_inference_manager_init_operators_inference(
-    flexflow_inference_manager_t handle_, flexflow_model_t model_handle_) {
+    flexflow_inference_manager_t handle_, flexflow_model_t model_handle) {
   InferenceManager *handle = FFCObjectWrapper::unwrap(handle_);
-  FFModel *model_handle = FFCObjectWrapper::unwrap(model_handle_);
+  FFModel *model = FFCObjectWrapper::unwrap(model_handle);
   DEBUG_PRINT("[InferenceManager] init_operators_inference %p", handle);
-  handle->init_operators_inference(model_handle);
+  handle->init_operators_inference(model);
 }
 
-void flexflow_inference_manager_incr_decoding_loop(
-    flexflow_inference_manager_t handle_,
-    flexflow_model_t model_handle_,
-    flexflow_request_manager_t rm_handle_,
-    int total_num_requests) {
-  InferenceManager *handle = FFCObjectWrapper::unwrap(handle_);
-  FFModel *model_handle = FFCObjectWrapper::unwrap(model_handle_);
-  RequestManager *rm_handle = FFCObjectWrapper::unwrap(rm_handle_);
-  DEBUG_PRINT("[InferenceManager] incr_decoding_loop %p", handle);
-  handle->incr_decoding_loop(model_handle, *rm_handle, total_num_requests);
-}
-
-void flexflow_inference_manager_spec_inference_loop(
-    flexflow_inference_manager_t handle_,
-    flexflow_model_t model_handle_,
-    flexflow_request_manager_t rm_handle_,
-    int total_num_requests,
-    int num_ssms,
-    int *ssm_model_ids) {
-  InferenceManager *handle = FFCObjectWrapper::unwrap(handle_);
-  FFModel *model_handle = FFCObjectWrapper::unwrap(model_handle_);
-  RequestManager *rm_handle = FFCObjectWrapper::unwrap(rm_handle_);
-  std::vector<int> ssm_model_ids_vec;
-  for (int i = 0; i < num_ssms; i++) {
-    ssm_model_ids_vec.push_back(ssm_model_ids[i]);
+// -----------------------------------------------------------------------
+// FileDataLoader
+// -----------------------------------------------------------------------
+
+flexflow_file_data_loader_t
+    flexflow_file_data_loader_create(char const *weight_file_path,
+                                     int num_heads,
+                                     int hidden_dim,
+                                     int qkv_inner_dim) {
+  assert(weight_file_path != nullptr &&
+         "Cannot convert nullptr char * to std::string");
+  std::string const weight_file_path_str(weight_file_path);
+  FileDataLoader *handle = new FileDataLoader(
+      "", weight_file_path_str, num_heads, hidden_dim, qkv_inner_dim);
+  DEBUG_PRINT("[FileDataLoader] new %p", handle);
+  return FFCObjectWrapper::wrap(handle);
+}
+
+void flexflow_file_data_loader_destroy(flexflow_file_data_loader_t handle_) {
+  FileDataLoader *handle = FFCObjectWrapper::unwrap(handle_);
+  DEBUG_PRINT("[FileDataLoader] delete %p", handle);
+  delete handle;
+}
+
+void flexflow_file_data_loader_load_weights(flexflow_file_data_loader_t handle_,
+                                            flexflow_model_t model_handle_,
+                                            int num_layers,
+                                            char const **layer_names,
+                                            flexflow_op_t *layers,
+                                            bool use_full_precision) {
+  FileDataLoader *handle = FFCObjectWrapper::unwrap(handle_);
+  FFModel *model = FFCObjectWrapper::unwrap(model_handle_);
+  std::unordered_map<std::string, Layer *> weights_layers;
+  for (int i = 0; i < num_layers; i++) {
+    std::string const layer_name(layer_names[i]);
+    Layer *layer_ptr = FFCObjectWrapper::unwrap(layers[i]);
+    weights_layers.emplace(layer_name, layer_ptr);
   }
-  DEBUG_PRINT("[InferenceManager] spec_inference_loop %p", handle);
-  handle->spec_inference_loop(
-      model_handle, *rm_handle, total_num_requests, ssm_model_ids_vec);
+  handle->load_weights(model, weights_layers, use_full_precision);
 }
diff --git a/src/ops/argmax.cc b/src/ops/argmax.cc
index a7476928ba..7863931c82 100644
--- a/src/ops/argmax.cc
+++ b/src/ops/argmax.cc
@@ -227,7 +227,7 @@ OpMeta *ArgMax::init_task(Task const *task,
   Domain input_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
   Domain output_domain = runtime->get_index_space_domain(
-      ctx, task->regions[2].region.get_index_space());
+      ctx, task->regions[1].region.get_index_space());
   int length = acc_input.domain.hi()[0] - acc_input.domain.lo()[0] + 1;
   int batch_size = acc_input.domain.get_volume() / length;
   Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
diff --git a/src/ops/fused.cu b/src/ops/fused.cu
index 9b81836de5..02853bbf09 100644
--- a/src/ops/fused.cu
+++ b/src/ops/fused.cu
@@ -32,6 +32,7 @@
 #include "flexflow/ops/kernels/pool_2d_kernels.h"
 #include "flexflow/ops/kernels/reshape_kernels.h"
 #include "flexflow/ops/kernels/rms_norm_kernels.h"
+#include "flexflow/ops/kernels/softmax_kernels.h"
 #include "flexflow/ops/kernels/transpose_kernels.h"
 #include "flexflow/ops/layer_norm.h"
 #include "flexflow/ops/spec_inc_multihead_self_attention.h"
@@ -418,6 +419,26 @@ __host__ void FusedOp::forward_task(Task const *task,
             my_input_accessor[0].domain.get_volume());
         break;
       }
+      case OP_SOFTMAX: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_accessor[0].domain.get_volume() ==
+               my_output_accessor[0].domain.get_volume());
+        SoftmaxMeta *m = (SoftmaxMeta *)metas->meta[op];
+        if (m->input_type == DT_HALF) {
+          Kernels::Softmax::forward_kernel_wrapper(
+              m,
+              my_input_accessor[0].get_half_ptr(),
+              my_output_accessor[0].get_half_ptr());
+        } else if (m->input_type == DT_FLOAT) {
+          Kernels::Softmax::forward_kernel_wrapper(
+              m,
+              my_input_accessor[0].get_float_ptr(),
+              my_output_accessor[0].get_float_ptr());
+        }
+        break;
+      }
       case OP_RESHAPE: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_weights[op] == 0);
@@ -880,6 +901,26 @@ __host__ void
             m, my_input_accessor[0], my_output_accessor[0], gamma, beta);
         break;
       }
+      case OP_SOFTMAX: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_accessor[0].domain.get_volume() ==
+               my_output_accessor[0].domain.get_volume());
+        SoftmaxMeta *m = (SoftmaxMeta *)metas->meta[op];
+        if (m->input_type == DT_HALF) {
+          Kernels::Softmax::forward_kernel_wrapper(
+              m,
+              my_input_accessor[0].get_half_ptr(),
+              my_output_accessor[0].get_half_ptr());
+        } else if (m->input_type == DT_FLOAT) {
+          Kernels::Softmax::forward_kernel_wrapper(
+              m,
+              my_input_accessor[0].get_float_ptr(),
+              my_output_accessor[0].get_float_ptr());
+        }
+        break;
+      }
       case OP_ALLREDUCE: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 0eafd979c1..2a7ece3c06 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -2641,10 +2641,6 @@ bool FFModel::apply_fusion(std::vector<Op *> const &operators,
         operators[l]->op_type != OP_ALLREDUCE) {
       continue;
     }
-    // don't fuse softmax since it returns inference results
-    if (operators[l]->op_type == OP_SOFTMAX) {
-      continue;
-    }
     size_t start = 0;
     {
       Op *opl = operators[l];
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 189cf08a39..2712d21c3f 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -69,22 +69,29 @@ void RequestManager::register_tokenizer(ModelType type,
                                         std::string const &path) {
   // bos id
   this->model_type = type;
+  std::string tokenizer_folder =
+      (!path.empty() && path.back() != '/') ? path + '/' : path;
   if (model_type == ModelType::LLAMA) {
+    bool path_to_file = !path.empty() &&
+                        (path.size() >= strlen("tokenizer.model")) &&
+                        path.find("tokenizer.model") ==
+                            (path.size() - strlen("tokenizer.model"));
+    std::string tokenizer_filepath =
+        path_to_file ? path : tokenizer_folder + "tokenizer.model";
     this->tokenizer_ =
-        Tokenizer::FromBlobSentencePiece(LoadBytesFromFile(path));
+        Tokenizer::FromBlobSentencePiece(LoadBytesFromFile(tokenizer_filepath));
   } else if (model_type == ModelType::OPT) {
-    std::string tokenizer_folder =
-        (!path.empty() && path.back() != '/') ? path + '/' : path;
-    std::string vocab_file = tokenizer_folder + "gpt2-vocab.json";
-    std::string merges_file = tokenizer_folder + "gpt2-merges.txt";
-    std::string added_tokens_file = tokenizer_folder + "added_tokens.json";
+    std::string vocab_file = tokenizer_folder + "vocab.json";
+    std::string merges_file = tokenizer_folder + "merges.txt";
+    std::string added_tokens_file =
+        tokenizer_folder + "special_tokens_map.json";
     std::filesystem::path path1(vocab_file);
     std::filesystem::path path2(merges_file);
     std::filesystem::path path3(added_tokens_file);
     assert(std::filesystem::exists(path1) &&
-           "Vocab file gpt2-vocab.json does not exist at the specified path");
+           "Vocab file vocab.json does not exist at the specified path");
     assert(std::filesystem::exists(path2) &&
-           "Merge file gpt2-merges.txt does not exist at the specified path");
+           "Merge file merges.txt does not exist at the specified path");
     // opt_tokenizer = new OptTokenizer(vocab_file, merges_file);
     std::string vocab = LoadBytesFromFile(path1.string());
     std::string merges = LoadBytesFromFile(path2.string());
diff --git a/tests/inference/cpp_inference_tests.sh b/tests/inference/cpp_inference_tests.sh
new file mode 100755
index 0000000000..dc8cc1f78a
--- /dev/null
+++ b/tests/inference/cpp_inference_tests.sh
@@ -0,0 +1,275 @@
+#! /usr/bin/env bash
+set -x
+set -e
+
+cleanup() {
+    rm -rf ../../inference/prompt ../../inference/weights ../../inference/tokenizer ../../inference/output
+}
+
+# Cd into directory holding this script
+cd "${BASH_SOURCE[0]%/*}"
+
+# Enable model parallelism tests, if desired
+TENSOR_PARALLELISM_TESTS=${TENSOR_PARALLELISM_TESTS:-OFF}
+
+# Clean up before test (just in case)
+cleanup
+
+# Update the transformers library to support the LLAMA model
+
+pip3 install --upgrade transformers sentencepiece
+
+# Download the weights in both half and full precision
+python3 ../../inference/utils/download_llama_weights.py
+python3 ../../inference/utils/download_llama_weights.py --use-full-precision
+python3 ../../inference/utils/download_opt_weights.py
+python3 ../../inference/utils/download_opt_weights.py --use-full-precision
+
+# Create test prompt file
+mkdir -p ../../inference/prompt
+echo '["Give three tips for staying healthy."]' > ../../inference/prompt/test.json
+
+# Create output folder
+mkdir -p ../../inference/output
+
+###############################################################################################
+############################ Speculative inference tests ######################################
+###############################################################################################
+
+# LLAMA
+../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../../inference/weights/llama_7B_weights/ -llm-config ../../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../../inference/weights/llama_160M_weights/ -ssm-config ../../inference/models/configs/llama_160M.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama.txt -pipeline-parallelism-degree 4
+# LLAMA (half precision)
+../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../../inference/weights/llama_7B_weights_half/ -llm-config ../../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../../inference/weights/llama_160M_weights_half/ -ssm-config ../../inference/models/configs/llama_160M.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_half.txt -pipeline-parallelism-degree 4
+
+# OPT
+../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../../inference/weights/opt_6B_weights/ -llm-config ../../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../../inference/weights/opt_125M_weights/ -ssm-config ../../inference/models/configs/opt_125M.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt.txt -pipeline-parallelism-degree 4
+# OPT (half precision)
+../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../../inference/weights/opt_6B_weights_half/ -llm-config ../../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../../inference/weights/opt_125M_weights_half/ -ssm-config ../../inference/models/configs/opt_125M.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt_half.txt -pipeline-parallelism-degree 4
+
+# Tensor parallelism tests
+if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
+    # LLAMA
+    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../../inference/weights/llama_7B_weights/ -llm-config ../../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../../inference/weights/llama_160M_weights/ -ssm-config ../../inference/models/configs/llama_160M.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    # LLAMA (half precision)
+    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../../inference/weights/llama_7B_weights_half/ -llm-config ../../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../../inference/weights/llama_160M_weights_half/ -ssm-config ../../inference/models/configs/llama_160M.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    
+    # OPT
+    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../../inference/weights/opt_6B_weights/ -llm-config ../../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../../inference/weights/opt_125M_weights/ -ssm-config ../../inference/models/configs/opt_125M.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    # OPT (half precision)
+    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../../inference/weights/opt_6B_weights_half/ -llm-config ../../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../../inference/weights/opt_125M_weights_half/ -ssm-config ../../inference/models/configs/opt_125M.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+fi
+
+###############################################################################################
+############################ Incremental decoding tests #######################################
+###############################################################################################
+
+# LLAMA (small model)
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../../inference/weights/llama_160M_weights/ -llm-config ../../inference/models/configs/llama_160M.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M.txt -pipeline-parallelism-degree 4
+# LLAMA (small model, half precision)
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../../inference/weights/llama_160M_weights_half/ -llm-config ../../inference/models/configs/llama_160M.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half.txt -pipeline-parallelism-degree 4
+
+# LLAMA (big model)
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../../inference/weights/llama_7B_weights/ -llm-config ../../inference/models/configs/llama_7B.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_7B.txt -pipeline-parallelism-degree 4
+# LLAMA (big model, half precision)
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../../inference/weights/llama_7B_weights_half/ -llm-config ../../inference/models/configs/llama_7B.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_7B_half.txt -pipeline-parallelism-degree 4
+
+# OPT (small model)
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../../inference/weights/opt_125M_weights/ -llm-config ../../inference/models/configs/opt_125M.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M.txt -pipeline-parallelism-degree 4
+# OPT (small model, half precision)
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../../inference/weights/opt_125M_weights_half/ -llm-config ../../inference/models/configs/opt_125M.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_half.txt -pipeline-parallelism-degree 4
+
+# OPT (big model)
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../../inference/weights/opt_6B_weights/ -llm-config ../../inference/models/configs/opt_6B.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_6B.txt -pipeline-parallelism-degree 4
+# OPT (big model, half precision)
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../../inference/weights/opt_6B_weights_half/ -llm-config ../../inference/models/configs/opt_6B.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_6B_half.txt -pipeline-parallelism-degree 4
+
+# Tensor parallelism tests
+if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
+    # LLAMA (small model)
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../../inference/weights/llama_160M_weights/ -llm-config ../../inference/models/configs/llama_160M.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../../inference/weights/llama_160M_weights/ -llm-config ../../inference/models/configs/llama_160M.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
+    # LLAMA (small model, half precision)
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../../inference/weights/llama_160M_weights_half/ -llm-config ../../inference/models/configs/llama_160M.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../../inference/weights/llama_160M_weights_half/ -llm-config ../../inference/models/configs/llama_160M.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
+
+    # LLAMA (big model)
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../../inference/weights/llama_7B_weights/ -llm-config ../../inference/models/configs/llama_7B.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_7B_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    # LLAMA (big model, half precision)
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../../inference/weights/llama_7B_weights_half/ -llm-config ../../inference/models/configs/llama_7B.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_7B_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+
+    # OPT (small model)
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../../inference/weights/opt_125M_weights/ -llm-config ../../inference/models/configs/opt_125M.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../../inference/weights/opt_125M_weights/ -llm-config ../../inference/models/configs/opt_125M.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
+    # OPT (small model, half precision)
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../../inference/weights/opt_125M_weights_half/ -llm-config ../../inference/models/configs/opt_125M.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../../inference/weights/opt_125M_weights_half/ -llm-config ../../inference/models/configs/opt_125M.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_half_tp.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
+
+    # OPT (big model)
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../../inference/weights/opt_6B_weights/ -llm-config ../../inference/models/configs/opt_6B.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_6B_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    # OPT (big model, half precision)
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../../inference/weights/opt_6B_weights_half/ -llm-config ../../inference/models/configs/opt_6B.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_6B_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+fi
+
+###############################################################################################
+############################### Alignment and Speed tests #####################################
+###############################################################################################
+
+##################################### Helper functions #######################################
+function check_partial_token_match {
+    local file1="$1"
+    local file2="$2"
+    local num_tokens_to_match=30
+
+    # Read the second line of the first file
+    third_line=$(sed -n '3p' "$file1")
+    read -r line1 <<< "$third_line"
+    tokens1=${line1#*: }
+    IFS=',' read -ra arr1 <<< "$tokens1"
+
+    # Read the second line of the second file
+    third_line=$(sed -n '3p' "$file2")
+    read -r line2 <<< "$third_line"
+    tokens2=${line2#*: }
+    IFS=',' read -ra arr2 <<< "$tokens2"
+
+    # Compare the first few integers in the two lists
+    for ((i = 0; i < num_tokens_to_match; i++)); do
+        if [[ "${arr1[$i]}" != "${arr2[$i]}" ]]; then
+            echo "The first $num_tokens_to_match tokens in files $file1 and $file2 are not identical."
+            exit 1
+        fi
+    done
+    #echo "The first $num_tokens_to_match integers are identical."
+}
+
+function compare_speed_spec_infer_incr_decoding {
+    local incrDec_file="$1"
+    local specInf_file="$2"
+
+    # Read the float numbers from the first line of the files
+    incrDec=$(sed -n '1 s/end-to-end latency: \(.*\)/\1/p' "$incrDec_file")
+    specInf=$(sed -n '1 s/end-to-end latency: \(.*\)/\1/p' "$specInf_file")
+
+    if ! command -v bc &> /dev/null; then
+        echo "bc is not installed. Installing..."
+        sudo apt-get install -y bc
+    fi
+    
+    # Perform the comparison
+    threshold=$(bc <<< "$specInf * 1.5")
+    if (( $(echo "$incrDec >= $threshold" | bc -l) )); then
+        #echo "The latency in $specInf_file is at least 1.5x smaller than the latency from $incrDec_file."
+        :
+    else
+        echo "Error: The latency in $specInf_file is not at least 1.5x smaller than the latency in $incrDec_file!"
+        exit 1
+    fi
+}
+
+function compare_decoding_steps_spec_infer_incr_decoding {
+    local incrDec_file="$1"
+    local specInf_file="$2"
+
+    # Read the number of decoding steps from the second line of the files
+    second_line=$(sed -n '2p' "$incrDec_file")
+    read -r line <<< "$second_line"
+    incrDec=${line#*: }
+    second_line=$(sed -n '2p' "$specInf_file")
+    read -r line <<< "$second_line"
+    specInf=${line#*: }
+
+    if ! command -v bc &> /dev/null; then
+        echo "bc is not installed. Installing..."
+        sudo apt-get install -y bc
+    fi
+    
+    # Perform the comparison
+    threshold=$(bc <<< "$specInf * 1.5")
+    if (( $(echo "$incrDec >= $threshold" | bc -l) )); then
+        #echo "The decoding steps in $specInf_file are at least 1.5x less than those in $incrDec_file."
+        :
+    else
+        echo "Error: The decoding steps in $specInf_file are not at least 1.5x less than those in $incrDec_file!"
+        exit 1
+    fi
+}
+
+############ Alignment between speculative inference and incremental decoding #################
+# Full precision
+diff <(tail -n +3 "../../inference/output/incr_decoding_llama_7B.txt") <(tail -n +3 "../../inference/output/spec_inference_llama.txt")
+diff <(tail -n +3 "../../inference/output/incr_decoding_opt_6B.txt")   <(tail -n +3 "../../inference/output/spec_inference_opt.txt")
+# Half precision
+check_partial_token_match "../../inference/output/incr_decoding_llama_7B_half.txt" "../../inference/output/spec_inference_llama_half.txt"
+check_partial_token_match "../../inference/output/incr_decoding_opt_6B_half.txt" "../../inference/output/spec_inference_opt_half.txt"
+
+# Speed test: speculative inference should be at very least 1.5x faster than incremental decoding
+# Full precision
+#compare_speed_spec_infer_incr_decoding "../../inference/output/incr_decoding_llama_7B.txt" "../../inference/output/spec_inference_llama.txt"
+#compare_speed_spec_infer_incr_decoding "../../inference/output/incr_decoding_opt_6B.txt" "../../inference/output/spec_inference_opt.txt"
+compare_decoding_steps_spec_infer_incr_decoding "../../inference/output/incr_decoding_llama_7B.txt" "../../inference/output/spec_inference_llama.txt"
+compare_decoding_steps_spec_infer_incr_decoding "../../inference/output/incr_decoding_opt_6B.txt" "../../inference/output/spec_inference_opt.txt"
+# Half precision
+#compare_speed_spec_infer_incr_decoding "../../inference/output/incr_decoding_llama_7B_half.txt" "../../inference/output/spec_inference_llama_half.txt"
+#compare_speed_spec_infer_incr_decoding "../../inference/output/incr_decoding_opt_6B_half.txt" "../../inference/output/spec_inference_opt_half.txt"
+compare_decoding_steps_spec_infer_incr_decoding "../../inference/output/incr_decoding_llama_7B_half.txt" "../../inference/output/spec_inference_llama_half.txt"
+compare_decoding_steps_spec_infer_incr_decoding "../../inference/output/incr_decoding_opt_6B_half.txt" "../../inference/output/spec_inference_opt_half.txt"
+
+############ Alignment between tensor model parallelism and pipeline parallelism only #################
+if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
+    diff <(tail -n +3 "../../inference/output/spec_inference_llama_tp.txt") <(tail -n +3 "../../inference/output/spec_inference_llama.txt")
+    diff <(tail -n +3 "../../inference/output/spec_inference_opt_tp.txt")  <(tail -n +3 "../../inference/output/spec_inference_opt.txt")
+    check_partial_token_match "../../inference/output/spec_inference_llama_half_tp.txt" "../../inference/output/spec_inference_llama_half.txt"
+    check_partial_token_match "../../inference/output/spec_inference_opt_half_tp.txt" "../../inference/output/spec_inference_opt_half.txt"
+    diff <(tail -n +3 "../../inference/output/incr_decoding_llama_160M_tp.txt") <(tail -n +3 "../../inference/output/incr_decoding_llama_160M.txt")
+    check_partial_token_match "../../inference/output/incr_decoding_llama_160M_half_tp.txt" "../../inference/output/incr_decoding_llama_160M_half.txt"
+    diff <(tail -n +3 "../../inference/output/incr_decoding_llama_7B_tp.txt") <(tail -n +3 "../../inference/output/incr_decoding_llama_7B.txt")
+    check_partial_token_match "../../inference/output/incr_decoding_llama_7B_half_tp.txt" "../../inference/output/incr_decoding_llama_7B_half.txt"
+    diff <(tail -n +3 "../../inference/output/incr_decoding_opt_125M_tp.txt") <(tail -n +3 "../../inference/output/incr_decoding_opt_125M.txt")
+    check_partial_token_match "../../inference/output/incr_decoding_opt_125M_half_tp.txt" "../../inference/output/incr_decoding_opt_125M_half.txt"
+    diff <(tail -n +3 "../../inference/output/incr_decoding_opt_6B_tp.txt") <(tail -n +3 "../../inference/output/incr_decoding_opt_6B.txt")
+    check_partial_token_match "../../inference/output/incr_decoding_opt_6B_half_tp.txt" "../../inference/output/incr_decoding_opt_6B_half.txt"
+fi
+
+######################### Alignment tests with HuggingFace ####################################
+pip3 install protobuf==3.20.3
+
+# LLAMA (small model, full precision)
+python3 ./huggingface_inference.py --model-name "JackFram/llama-160m" --tokenizer-model-name "JackFram/llama-160m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M.txt" --gpu
+
+# LLAMA (small model, half precision)
+python3 ./huggingface_inference.py --model-name "JackFram/llama-160m" --tokenizer-model-name "JackFram/llama-160m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M_half.txt" --gpu
+
+# LLAMA (big model, full precision)
+python3 ./huggingface_inference.py --model-name "decapoda-research/llama-7b-hf" --tokenizer-model-name "JackFram/llama-160m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B.txt"
+
+# LLAMA (big model, half precision)
+python3 ./huggingface_inference.py --model-name "decapoda-research/llama-7b-hf" --tokenizer-model-name "JackFram/llama-160m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B_half.txt" --gpu
+
+# OPT (small model, full precision)
+python3 ./huggingface_inference.py --model-name "facebook/opt-125m" --tokenizer-model-name "facebook/opt-125m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_125M.txt" --gpu --max-length 128
+
+# OPT (small model, half precision)
+python3 ./huggingface_inference.py --model-name "facebook/opt-125m" --tokenizer-model-name "facebook/opt-125m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_125M_half.txt" --gpu --max-length 128
+
+# OPT (big model, full precision)
+#python3 ./huggingface_inference.py --model-name "facebook/opt-6.7b" --tokenizer-model-name "facebook/opt-6.7b" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_6B.txt" --max-length 127
+
+# OPT (big model, half precision)
+#python3 ./huggingface_inference.py --model-name "facebook/opt-6.7b" --tokenizer-model-name "facebook/opt-6.7b" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_6B_half.txt" --gpu --max-length 127
+
+diff <(tail -n +2 "../../inference/output/huggingface_llama_160M.txt") <(tail -n +5 "../../inference/output/incr_decoding_llama_160M.txt")
+diff <(tail -n +2 "../../inference/output/huggingface_llama_160M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_decoding_llama_160M_half.txt" | tr -s '[:space:]' '\n' | head -n 20)
+diff <(tail -n +2 "../../inference/output/huggingface_llama_7B.txt") <(tail -n +5 "../../inference/output/incr_decoding_llama_7B.txt")
+diff <(tail -n +2 "../../inference/output/huggingface_llama_7B_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_decoding_llama_7B_half.txt" | tr -s '[:space:]' '\n' | head -n 20)
+
+diff <(tail -n +2 "../../inference/output/huggingface_opt_125M.txt") <(tail -n +5 "../../inference/output/incr_decoding_opt_125M.txt")
+diff <(tail -n +2 "../../inference/output/huggingface_opt_125M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_decoding_opt_125M_half.txt" | tr -s '[:space:]' '\n' | head -n 20)
+#diff <(tail -n +2 "../../inference/output/huggingface_opt_6B.txt") <(tail -n +5 "../../inference/output/incr_decoding_opt_6B.txt")
+#diff <(tail -n +2 "../../inference/output/huggingface_opt_6B_half.txt") <(tail -n +5 "../../inference/output/incr_decoding_opt_6B_half.txt")
+
+###############################################################################################
+###################################### Cleanup ################################################
+###############################################################################################
+
+# Clean up after test
+# cleanup
diff --git a/tests/inference_tests.sh b/tests/inference_tests.sh
index 8616bb845e..ca95acc785 100755
--- a/tests/inference_tests.sh
+++ b/tests/inference_tests.sh
@@ -2,274 +2,8 @@
 set -x
 set -e
 
-cleanup() {
-    rm -rf ../inference/prompt ../inference/weights ../inference/tokenizer ../inference/output
-}
-
 # Cd into directory holding this script
 cd "${BASH_SOURCE[0]%/*}"
 
-# Enable model parallelism tests, if desired
-TENSOR_PARALLELISM_TESTS=${TENSOR_PARALLELISM_TESTS:-OFF}
-
-# Clean up before test (just in case)
-cleanup
-
-# Update the transformers library to support the LLAMA model
-
-pip3 install --upgrade transformers sentencepiece
-
-# Download the weights in both half and full precision
-python3 ../inference/utils/download_llama_weights.py
-python3 ../inference/utils/download_llama_weights.py --use-full-precision
-python3 ../inference/utils/download_opt_weights.py
-python3 ../inference/utils/download_opt_weights.py --use-full-precision
-
-# Create test prompt file
-mkdir -p ../inference/prompt
-echo '["Give three tips for staying healthy."]' > ../inference/prompt/test.json
-
-# Create output folder
-mkdir -p ../inference/output
-
-###############################################################################################
-############################ Speculative inference tests ######################################
-###############################################################################################
-
-# LLAMA
-../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../inference/weights/llama_160M_weights/ -ssm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_llama.txt -pipeline-parallelism-degree 4
-# LLAMA (half precision)
-../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights_half/ -llm-config ../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../inference/weights/llama_160M_weights_half/ -ssm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_llama_half.txt -pipeline-parallelism-degree 4
-
-# OPT
-../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../inference/weights/opt_125M_weights/ -ssm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_opt.txt -pipeline-parallelism-degree 4
-# OPT (half precision)
-../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights_half/ -llm-config ../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../inference/weights/opt_125M_weights_half/ -ssm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_opt_half.txt -pipeline-parallelism-degree 4
-
-# Tensor parallelism tests
-if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
-    # LLAMA
-    ../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../inference/weights/llama_160M_weights/ -ssm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_llama_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-    # LLAMA (half precision)
-    ../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights_half/ -llm-config ../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../inference/weights/llama_160M_weights_half/ -ssm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_llama_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-    
-    # OPT
-    ../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../inference/weights/opt_125M_weights/ -ssm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_opt_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-    # OPT (half precision)
-    ../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights_half/ -llm-config ../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../inference/weights/opt_125M_weights_half/ -ssm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/spec_inference_opt_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-fi
-
-###############################################################################################
-############################ Incremental decoding tests #######################################
-###############################################################################################
-
-# LLAMA (small model)
-../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_160M_weights/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M.txt -pipeline-parallelism-degree 4
-# LLAMA (small model, half precision)
-../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_160M_weights_half/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M_half.txt -pipeline-parallelism-degree 4
-
-# LLAMA (big model)
-../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_7B.txt -pipeline-parallelism-degree 4
-# LLAMA (big model, half precision)
-../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights_half/ -llm-config ../inference/models/configs/llama_7B.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_7B_half.txt -pipeline-parallelism-degree 4
-
-# OPT (small model)
-../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_125M_weights/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M.txt -pipeline-parallelism-degree 4
-# OPT (small model, half precision)
-../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_125M_weights_half/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M_half.txt -pipeline-parallelism-degree 4
-
-# OPT (big model)
-../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_6B.txt -pipeline-parallelism-degree 4
-# OPT (big model, half precision)
-../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights_half/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_6B_half.txt -pipeline-parallelism-degree 4
-
-# Tensor parallelism tests
-if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
-    # LLAMA (small model)
-    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_160M_weights/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_160M_weights/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
-    # LLAMA (small model, half precision)
-    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_160M_weights_half/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_160M_weights_half/ -llm-config ../inference/models/configs/llama_160M.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_160M_half_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
-
-    # LLAMA (big model)
-    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../inference/weights/llama_7B_weights/ -llm-config ../inference/models/configs/llama_7B.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_7B_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-    # LLAMA (big model, half precision)
-    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../inference/weights/llama_7B_weights_half/ -llm-config ../inference/models/configs/llama_7B.json -tokenizer ../inference/tokenizer/tokenizer.model -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_llama_7B_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-
-    # OPT (small model)
-    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_125M_weights/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_125M_weights/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
-    # OPT (small model, half precision)
-    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_125M_weights_half/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_125M_weights_half/ -llm-config ../inference/models/configs/opt_125M.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_125M_half_tp.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
-
-    # OPT (big model)
-    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../inference/weights/opt_6B_weights/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_6B_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-    # OPT (big model, half precision)
-    ../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../inference/weights/opt_6B_weights_half/ -llm-config ../inference/models/configs/opt_6B.json -tokenizer ../inference/tokenizer/ -prompt ../inference/prompt/test.json -output-file ../inference/output/incr_decoding_opt_6B_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-fi
-
-###############################################################################################
-############################### Alignment and Speed tests #####################################
-###############################################################################################
-
-##################################### Helper functions #######################################
-function check_partial_token_match {
-    local file1="$1"
-    local file2="$2"
-    local num_tokens_to_match=30
-
-    # Read the second line of the first file
-    third_line=$(sed -n '3p' "$file1")
-    read -r line1 <<< "$third_line"
-    tokens1=${line1#*: }
-    IFS=',' read -ra arr1 <<< "$tokens1"
-
-    # Read the second line of the second file
-    third_line=$(sed -n '3p' "$file2")
-    read -r line2 <<< "$third_line"
-    tokens2=${line2#*: }
-    IFS=',' read -ra arr2 <<< "$tokens2"
-
-    # Compare the first few integers in the two lists
-    for ((i = 0; i < num_tokens_to_match; i++)); do
-        if [[ "${arr1[$i]}" != "${arr2[$i]}" ]]; then
-            echo "The first $num_tokens_to_match tokens in files $file1 and $file2 are not identical."
-            exit 1
-        fi
-    done
-    #echo "The first $num_tokens_to_match integers are identical."
-}
-
-function compare_speed_spec_infer_incr_decoding {
-    local incrDec_file="$1"
-    local specInf_file="$2"
-
-    # Read the float numbers from the first line of the files
-    incrDec=$(sed -n '1 s/end-to-end latency: \(.*\)/\1/p' "$incrDec_file")
-    specInf=$(sed -n '1 s/end-to-end latency: \(.*\)/\1/p' "$specInf_file")
-
-    if ! command -v bc &> /dev/null; then
-        echo "bc is not installed. Installing..."
-        sudo apt-get install -y bc
-    fi
-    
-    # Perform the comparison
-    threshold=$(bc <<< "$specInf * 1.5")
-    if (( $(echo "$incrDec >= $threshold" | bc -l) )); then
-        #echo "The latency in $specInf_file is at least 1.5x smaller than the latency from $incrDec_file."
-        :
-    else
-        echo "Error: The latency in $specInf_file is not at least 1.5x smaller than the latency in $incrDec_file!"
-        exit 1
-    fi
-}
-
-function compare_decoding_steps_spec_infer_incr_decoding {
-    local incrDec_file="$1"
-    local specInf_file="$2"
-
-    # Read the number of decoding steps from the second line of the files
-    second_line=$(sed -n '2p' "$incrDec_file")
-    read -r line <<< "$second_line"
-    incrDec=${line#*: }
-    second_line=$(sed -n '2p' "$specInf_file")
-    read -r line <<< "$second_line"
-    specInf=${line#*: }
-
-    if ! command -v bc &> /dev/null; then
-        echo "bc is not installed. Installing..."
-        sudo apt-get install -y bc
-    fi
-    
-    # Perform the comparison
-    threshold=$(bc <<< "$specInf * 1.5")
-    if (( $(echo "$incrDec >= $threshold" | bc -l) )); then
-        #echo "The decoding steps in $specInf_file are at least 1.5x less than those in $incrDec_file."
-        :
-    else
-        echo "Error: The decoding steps in $specInf_file are not at least 1.5x less than those in $incrDec_file!"
-        exit 1
-    fi
-}
-
-############ Alignment between speculative inference and incremental decoding #################
-# Full precision
-diff <(tail -n +3 "../inference/output/incr_decoding_llama_7B.txt") <(tail -n +3 "../inference/output/spec_inference_llama.txt")
-diff <(tail -n +3 "../inference/output/incr_decoding_opt_6B.txt")   <(tail -n +3 "../inference/output/spec_inference_opt.txt")
-# Half precision
-check_partial_token_match "../inference/output/incr_decoding_llama_7B_half.txt" "../inference/output/spec_inference_llama_half.txt"
-check_partial_token_match "../inference/output/incr_decoding_opt_6B_half.txt" "../inference/output/spec_inference_opt_half.txt"
-
-# Speed test: speculative inference should be at very least 1.5x faster than incremental decoding
-# Full precision
-#compare_speed_spec_infer_incr_decoding "../inference/output/incr_decoding_llama_7B.txt" "../inference/output/spec_inference_llama.txt"
-#compare_speed_spec_infer_incr_decoding "../inference/output/incr_decoding_opt_6B.txt" "../inference/output/spec_inference_opt.txt"
-compare_decoding_steps_spec_infer_incr_decoding "../inference/output/incr_decoding_llama_7B.txt" "../inference/output/spec_inference_llama.txt"
-compare_decoding_steps_spec_infer_incr_decoding "../inference/output/incr_decoding_opt_6B.txt" "../inference/output/spec_inference_opt.txt"
-# Half precision
-#compare_speed_spec_infer_incr_decoding "../inference/output/incr_decoding_llama_7B_half.txt" "../inference/output/spec_inference_llama_half.txt"
-#compare_speed_spec_infer_incr_decoding "../inference/output/incr_decoding_opt_6B_half.txt" "../inference/output/spec_inference_opt_half.txt"
-compare_decoding_steps_spec_infer_incr_decoding "../inference/output/incr_decoding_llama_7B_half.txt" "../inference/output/spec_inference_llama_half.txt"
-compare_decoding_steps_spec_infer_incr_decoding "../inference/output/incr_decoding_opt_6B_half.txt" "../inference/output/spec_inference_opt_half.txt"
-
-############ Alignment between tensor model parallelism and pipeline parallelism only #################
-if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
-    diff <(tail -n +3 "../inference/output/spec_inference_llama_tp.txt") <(tail -n +3 "../inference/output/spec_inference_llama.txt")
-    diff <(tail -n +3 "../inference/output/spec_inference_opt_tp.txt")  <(tail -n +3 "../inference/output/spec_inference_opt.txt")
-    check_partial_token_match "../inference/output/spec_inference_llama_half_tp.txt" "../inference/output/spec_inference_llama_half.txt"
-    check_partial_token_match "../inference/output/spec_inference_opt_half_tp.txt" "../inference/output/spec_inference_opt_half.txt"
-    diff <(tail -n +3 "../inference/output/incr_decoding_llama_160M_tp.txt") <(tail -n +3 "../inference/output/incr_decoding_llama_160M.txt")
-    check_partial_token_match "../inference/output/incr_decoding_llama_160M_half_tp.txt" "../inference/output/incr_decoding_llama_160M_half.txt"
-    diff <(tail -n +3 "../inference/output/incr_decoding_llama_7B_tp.txt") <(tail -n +3 "../inference/output/incr_decoding_llama_7B.txt")
-    check_partial_token_match "../inference/output/incr_decoding_llama_7B_half_tp.txt" "../inference/output/incr_decoding_llama_7B_half.txt"
-    diff <(tail -n +3 "../inference/output/incr_decoding_opt_125M_tp.txt") <(tail -n +3 "../inference/output/incr_decoding_opt_125M.txt")
-    check_partial_token_match "../inference/output/incr_decoding_opt_125M_half_tp.txt" "../inference/output/incr_decoding_opt_125M_half.txt"
-    diff <(tail -n +3 "../inference/output/incr_decoding_opt_6B_tp.txt") <(tail -n +3 "../inference/output/incr_decoding_opt_6B.txt")
-    check_partial_token_match "../inference/output/incr_decoding_opt_6B_half_tp.txt" "../inference/output/incr_decoding_opt_6B_half.txt"
-fi
-
-######################### Alignment tests with HuggingFace ####################################
-pip3 install protobuf==3.20.3
-
-# LLAMA (small model, full precision)
-python3 ./inference/huggingface_inference.py --model-name "JackFram/llama-160m" --tokenizer-model-name "JackFram/llama-160m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M.txt" --gpu
-
-# LLAMA (small model, half precision)
-python3 ./inference/huggingface_inference.py --model-name "JackFram/llama-160m" --tokenizer-model-name "JackFram/llama-160m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M_half.txt" --gpu
-
-# LLAMA (big model, full precision)
-python3 ./inference/huggingface_inference.py --model-name "decapoda-research/llama-7b-hf" --tokenizer-model-name "JackFram/llama-160m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B.txt"
-
-# LLAMA (big model, half precision)
-python3 ./inference/huggingface_inference.py --model-name "decapoda-research/llama-7b-hf" --tokenizer-model-name "JackFram/llama-160m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B_half.txt" --gpu
-
-# OPT (small model, full precision)
-python3 ./inference/huggingface_inference.py --model-name "facebook/opt-125m" --tokenizer-model-name "facebook/opt-125m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_125M.txt" --gpu --max-length 128
-
-# OPT (small model, half precision)
-python3 ./inference/huggingface_inference.py --model-name "facebook/opt-125m" --tokenizer-model-name "facebook/opt-125m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_125M_half.txt" --gpu --max-length 128
-
-# OPT (big model, full precision)
-#python3 ./inference/huggingface_inference.py --model-name "facebook/opt-6.7b" --tokenizer-model-name "facebook/opt-6.7b" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_6B.txt" --max-length 127
-
-# OPT (big model, half precision)
-#python3 ./inference/huggingface_inference.py --model-name "facebook/opt-6.7b" --tokenizer-model-name "facebook/opt-6.7b" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_6B_half.txt" --gpu --max-length 127
-
-diff <(tail -n +2 "../inference/output/huggingface_llama_160M.txt") <(tail -n +5 "../inference/output/incr_decoding_llama_160M.txt")
-diff <(tail -n +2 "../inference/output/huggingface_llama_160M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../inference/output/incr_decoding_llama_160M_half.txt" | tr -s '[:space:]' '\n' | head -n 20)
-diff <(tail -n +2 "../inference/output/huggingface_llama_7B.txt") <(tail -n +5 "../inference/output/incr_decoding_llama_7B.txt")
-diff <(tail -n +2 "../inference/output/huggingface_llama_7B_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../inference/output/incr_decoding_llama_7B_half.txt" | tr -s '[:space:]' '\n' | head -n 20)
-
-diff <(tail -n +2 "../inference/output/huggingface_opt_125M.txt") <(tail -n +5 "../inference/output/incr_decoding_opt_125M.txt")
-diff <(tail -n +2 "../inference/output/huggingface_opt_125M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../inference/output/incr_decoding_opt_125M_half.txt" | tr -s '[:space:]' '\n' | head -n 20)
-#diff <(tail -n +2 "../inference/output/huggingface_opt_6B.txt") <(tail -n +5 "../inference/output/incr_decoding_opt_6B.txt")
-#diff <(tail -n +2 "../inference/output/huggingface_opt_6B_half.txt") <(tail -n +5 "../inference/output/incr_decoding_opt_6B_half.txt")
-
-###############################################################################################
-###################################### Cleanup ################################################
-###############################################################################################
-
-# Clean up after test
-# cleanup
+# replace this with python tests
+./inference/cpp_inference_tests.sh

From d1ef0ed8ce6876c37bbd99dd0a8f46728b7c25d2 Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Thu, 3 Aug 2023 00:30:10 -0400
Subject: [PATCH 189/344] Support Group Attention (Llama 2) (#883)

* n_kv_heads in inc_mha

* .

* .

* .

* .

* .

* fix

* fix

* tensor parallelism

* change weight layout

* tensor parallelism

* merge multiquery attention into inc_mha

* llama2 70B config

* spec infer change 1

* fix.

* spec infer.

* falcon spec infer.

* fix llama 70B

* fix

* fix & cleanup

* fix

* hip rocm

* issue 908

* clean debug code.

* format.

* remove multiquery. remove warning, fix python.

---------

Co-authored-by: goliaro <goliaro@cs.cmu.edu>
---
 .../cpp/inference/mixture_of_experts/moe.cc   |    1 +
 .../inference/transformers/transformers.cc    |    1 +
 include/flexflow/ffconst.h                    |    9 +-
 include/flexflow/flexflow_c.h                 |   21 +-
 include/flexflow/model.h                      |   21 +-
 include/flexflow/operator_params.h            |    1 -
 .../ops/inc_multihead_self_attention.h        |   14 +-
 .../ops/inc_multihead_self_attention_params.h |    2 +-
 .../ops/inc_multiquery_attention_params.h     |   30 -
 .../ops/inc_multiquery_self_attention.h       |  159 --
 .../inc_multihead_self_attention_kernels.h    |   13 +-
 .../ops/spec_inc_multihead_self_attention.h   |    7 +-
 ...spec_inc_multihead_self_attention_params.h |    2 +-
 .../ops/tree_inc_multihead_self_attention.h   |    9 +-
 ...tree_inc_multihead_self_attention_params.h |    2 +-
 include/flexflow/request_manager.h            |    4 +-
 include/flexflow/utils/cuda_helper.h          |    5 +-
 inference/file_loader.cc                      |  237 +--
 inference/file_loader.h                       |    6 +-
 inference/incr_decoding/incr_decoding.cc      |    5 +-
 inference/models/configs/falcon_7B.json       |    1 +
 inference/models/configs/llama2_70B.json      |   12 +
 inference/models/configs/llama2_7B.json       |   12 +
 inference/models/configs/llama_160M.json      |    1 +
 inference/models/configs/llama_7B.json        |    1 +
 inference/models/falcon.cc                    |   75 +-
 inference/models/falcon.h                     |    5 +-
 inference/models/llama.cc                     |    8 +-
 inference/models/llama.h                      |    4 +-
 inference/models/opt.cc                       |    8 +-
 inference/spec_infer/CMakeLists.txt           |    3 +-
 inference/spec_infer/spec_infer.cc            |   27 +-
 inference/utils/download_falcon_weights.py    |   45 +
 python/flexflow/core/flexflow_cffi.py         |   74 +-
 python/flexflow/serve/models/falcon.py        |    3 +-
 python/flexflow/serve/models/llama.py         |    3 +
 python/flexflow/serve/models/opt.py           |    3 +
 python/flexflow/serve/serve.py                |    2 +
 python/flexflow/type.py                       |    6 +-
 src/c/flexflow_c.cc                           |   53 +-
 src/ops/inc_multihead_self_attention.cc       |  100 +-
 src/ops/inc_multihead_self_attention.cpp      |    5 +-
 src/ops/inc_multihead_self_attention.cu       |  672 ++++----
 src/ops/inc_multiquery_self_attention.cc      | 1432 -----------------
 src/ops/inc_multiquery_self_attention.cpp     |   96 --
 src/ops/inc_multiquery_self_attention.cu      |  797 ---------
 src/ops/spec_inc_multihead_self_attention.cc  |   73 +-
 src/ops/spec_inc_multihead_self_attention.cpp |    5 +-
 src/ops/spec_inc_multihead_self_attention.cu  |  296 ++--
 src/ops/tree_inc_multihead_self_attention.cc  |   96 +-
 src/ops/tree_inc_multihead_self_attention.cpp |    5 +-
 src/ops/tree_inc_multihead_self_attention.cu  |  379 +++--
 src/runtime/cuda_helper.cu                    |   40 +-
 src/runtime/ffconst_utils.cc                  |    2 -
 src/runtime/graph.cc                          |   71 +-
 src/runtime/model.cc                          |   44 -
 src/runtime/operator_params.cc                |    1 -
 src/runtime/request_manager.cc                |   12 +-
 src/runtime/substitution.cc                   |    8 -
 59 files changed, 1412 insertions(+), 3617 deletions(-)
 delete mode 100644 include/flexflow/ops/inc_multiquery_attention_params.h
 delete mode 100644 include/flexflow/ops/inc_multiquery_self_attention.h
 create mode 100644 inference/models/configs/llama2_70B.json
 create mode 100644 inference/models/configs/llama2_7B.json
 create mode 100644 inference/utils/download_falcon_weights.py
 delete mode 100644 src/ops/inc_multiquery_self_attention.cc
 delete mode 100644 src/ops/inc_multiquery_self_attention.cpp
 delete mode 100644 src/ops/inc_multiquery_self_attention.cu

diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index 4a5c33c9b0..5125e5d98e 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -79,6 +79,7 @@ Tensor create_moe_encoder(FFModel *model,
                          x,
                          moeConfig->hidden_size,
                          moeConfig->num_attention_heads,
+                         moeConfig->num_attention_heads,
                          moeConfig->attention_kdim,
                          moeConfig->attention_vdim)
                    : model->multihead_attention(x,
diff --git a/examples/cpp/inference/transformers/transformers.cc b/examples/cpp/inference/transformers/transformers.cc
index 0717ddc90f..2d818e8e4e 100644
--- a/examples/cpp/inference/transformers/transformers.cc
+++ b/examples/cpp/inference/transformers/transformers.cc
@@ -47,6 +47,7 @@ Tensor create_inc_multihead_attention_decoder(
                 input,
                 transformerConfig->hidden_size,
                 transformerConfig->num_attention_heads,
+                transformerConfig->num_attention_heads,
                 transformerConfig->attention_kdim,
                 transformerConfig->attention_vdim)
           : model->multihead_attention(input,
diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index 170180aeaf..1694041163 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -167,7 +167,6 @@ enum OperatorType {
   OP_INC_MULTIHEAD_SELF_ATTENTION,
   OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION,
   OP_TREE_INC_MULTIHEAD_SELF_ATTENTION,
-  OP_INC_MULTIQUERY_SELF_ATTENTION,
   OP_SAMPLING,
   // Parallel Ops
   OP_REPARTITION,
@@ -180,7 +179,13 @@ enum OperatorType {
   OP_INVALID,
 };
 
-enum ModelType { UNKNOWN = 3001, LLAMA = 3002, OPT = 3003, FALCON = 3004 };
+enum ModelType {
+  UNKNOWN = 3001,
+  LLAMA = 3002,
+  LLAMA2 = 3003,
+  OPT = 3004,
+  FALCON = 3005
+};
 
 enum PMParameter {
   PM_OP_TYPE,            // AnyOp
diff --git a/include/flexflow/flexflow_c.h b/include/flexflow/flexflow_c.h
index 9983898130..949c0f7885 100644
--- a/include/flexflow/flexflow_c.h
+++ b/include/flexflow/flexflow_c.h
@@ -401,6 +401,7 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_attention(
     const flexflow_tensor_t input_,
     int embed_dim,
     int num_heads,
+    int num_kv_heads,
     int kdim,
     int vdim,
     float dropout,
@@ -420,6 +421,7 @@ flexflow_tensor_t flexflow_model_add_spec_inc_multihead_attention(
     const flexflow_tensor_t input_,
     int embed_dim,
     int num_heads,
+    int num_kv_heads,
     int kdim,
     int vdim,
     float dropout,
@@ -439,6 +441,7 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention_verify(
     const flexflow_tensor_t input_,
     int embed_dim,
     int num_heads,
+    int num_kv_heads,
     int kdim,
     int vdim,
     float dropout,
@@ -453,21 +456,6 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention_verify(
     bool qk_prod_scaling,
     char const *name);
 
-flexflow_tensor_t flexflow_model_add_inc_multiquery_self_attention(
-    flexflow_model_t handle_,
-    const flexflow_tensor_t input_,
-    int embed_dim,
-    int num_heads,
-    int kdim,
-    int vdim,
-    float dropout,
-    bool bias,
-    bool add_bias_kv,
-    bool add_zero_attn,
-    enum DataType data_type,
-    flexflow_initializer_t kernel_initializer_,
-    char const *name);
-
 flexflow_tensor_t flexflow_model_add_rms_norm(flexflow_model_t handle_,
                                               const flexflow_tensor_t input_,
                                               float eps,
@@ -901,7 +889,8 @@ flexflow_file_data_loader_t
     flexflow_file_data_loader_create(char const *weight_file_path,
                                      int num_heads,
                                      int hidden_dim,
-                                     int qkv_inner_dim);
+                                     int qkv_inner_dim,
+                                     int tensor_partition_num);
 
 void flexflow_file_data_loader_destroy(flexflow_file_data_loader_t handle_);
 
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 1f30d451ef..d34cf14a76 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -156,8 +156,6 @@ enum TaskIDs {
   INC_MULTIHEAD_SELF_ATTENTION_FWD_TASK_ID,
   INC_MULTIHEAD_SELF_ATTENTION_BWD_TASK_ID,
   INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
-  INC_MULTIQUERY_SELF_ATTENTION_INIT_TASK_ID,
-  INC_MULTIQUERY_SELF_ATTENTION_INF_TASK_ID,
   SPEC_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
   SPEC_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
   TREE_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
@@ -322,7 +320,6 @@ class Transpose;
 class RMSNorm;
 class BeamTopK;
 class SpecIncMultiHeadSelfAttention;
-class IncMultiQuerySelfAttention;
 class Sampling;
 class ArgMax;
 class Combine;
@@ -644,6 +641,7 @@ class FFModel {
   Tensor inc_multihead_self_attention(const Tensor input,
                                       int embed_dim,
                                       int num_heads,
+                                      int num_kv_heads,
                                       int kdim = 0,
                                       int vdim = 0,
                                       float dropout = 0.0f,
@@ -657,22 +655,11 @@ class FFModel {
                                       float scaling_factor = 1.0f,
                                       bool qk_prod_scaling = true,
                                       char const *name = NULL);
-  Tensor inc_multiquery_self_attention(const Tensor input,
-                                       int embed_dim,
-                                       int num_heads,
-                                       int kdim = 0,
-                                       int vdim = 0,
-                                       float dropout = 0.0f,
-                                       bool bias = false,
-                                       bool add_bias_kv = false,
-                                       bool add_zero_attn = false,
-                                       DataType data_type = DT_NONE,
-                                       Initializer *kernel_initializer = NULL,
-                                       char const *name = NULL);
   Tensor
       spec_inc_multihead_self_attention(const Tensor input,
                                         int embed_dim,
                                         int num_heads,
+                                        int num_kv_heads,
                                         int kdim = 0,
                                         int vdim = 0,
                                         float dropout = 0.0f,
@@ -690,6 +677,7 @@ class FFModel {
       const Tensor input,
       int embed_dim,
       int num_heads,
+      int num_kv_heads,
       int kdim = 0,
       int vdim = 0,
       float dropout = 0.0f,
@@ -1075,9 +1063,6 @@ class FFModel {
       std::unordered_map<
           std::pair<ParallelTensorShape, IncMultiHeadSelfAttentionParams>,
           IncMultiHeadSelfAttention *>,
-      std::unordered_map<
-          std::pair<ParallelTensorShape, IncMultiQuerySelfAttentionParams>,
-          IncMultiQuerySelfAttention *>,
       std::unordered_map<std::pair<ParallelTensorShape, BeamTopKParams>,
                          BeamTopK *>,
       std::unordered_map<std::pair<ParallelTensorShape, SamplingParams>,
diff --git a/include/flexflow/operator_params.h b/include/flexflow/operator_params.h
index 982d5482a0..4f0432cb93 100644
--- a/include/flexflow/operator_params.h
+++ b/include/flexflow/operator_params.h
@@ -20,7 +20,6 @@
 #include "flexflow/ops/gather_params.h"
 #include "flexflow/ops/groupby_params.h"
 #include "flexflow/ops/inc_multihead_self_attention_params.h"
-#include "flexflow/ops/inc_multiquery_attention_params.h"
 #include "flexflow/ops/layer_norm_params.h"
 #include "flexflow/ops/linear_params.h"
 #include "flexflow/ops/pool_2d_params.h"
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index 244100bc6f..ce1ef6f37c 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -29,6 +29,7 @@ class IncMultiHeadSelfAttention : public Op {
                             const ParallelTensor _input,
                             int _embed_dim,
                             int _num_heads,
+                            int _num_kv_heads,
                             int _kdim,
                             int _vdim,
                             float _dropout,
@@ -42,12 +43,14 @@ class IncMultiHeadSelfAttention : public Op {
                             bool allocate_weights,
                             DataType _quantization_type,
                             bool _offload,
+                            int _tensor_parallelism_degree,
                             char const *name);
   IncMultiHeadSelfAttention(FFModel &model,
                             const ParallelTensor _input,
                             const ParallelTensor _weight,
                             int _embed_dim,
                             int _num_heads,
+                            int _num_kv_heads,
                             int _kdim,
                             int _vdim,
                             float _dropout,
@@ -61,6 +64,7 @@ class IncMultiHeadSelfAttention : public Op {
                             bool allocate_weights,
                             DataType _quantization_type,
                             bool _offload,
+                            int _tensor_parallelism_degree,
                             char const *name);
   IncMultiHeadSelfAttention(FFModel &model,
                             IncMultiHeadSelfAttention const &other,
@@ -114,7 +118,7 @@ class IncMultiHeadSelfAttention : public Op {
   Params get_params() const;
 
 public:
-  int num_heads;
+  int num_heads, num_kv_heads, tensor_parallelism_degree;
   float dropout, scaling_factor;
   bool bias;
   bool add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
@@ -132,7 +136,8 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
                                 GenericTensorAccessorR const &weight,
                                 MemoryAllocator &gpu_mem_allocator,
                                 int num_samples,
-                                int _num_heads);
+                                int _num_heads,
+                                int _num_kv_heads);
   IncMultiHeadSelfAttentionMeta(FFHandler handler,
                                 InferenceMode infer_mode,
                                 Op const *attn,
@@ -153,7 +158,9 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
                                 MemoryAllocator &gpu_mem_allocator,
                                 int num_samples,
                                 int _global_num_heads,
+                                int _global_num_kv_heads,
                                 int _num_heads,
+                                int _num_kv_heads,
                                 DataType _quantization_type,
                                 bool _offload);
   ~IncMultiHeadSelfAttentionMeta(void);
@@ -163,7 +170,7 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
   size_t weights_params, weightSize, biasSize, reserveSpaceSize,
       quantized_weightSize;
   int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
-  int global_num_heads, num_heads;
+  int global_num_heads, global_num_kv_heads, num_heads, num_kv_heads;
   bool *has_load_weights;
   bool *apply_rotary_embedding;
   bool *bias;
@@ -182,6 +189,7 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
   DataType quantization_type;
   bool offload;
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+  cudnnTensorDescriptor_t qk_tensor;
   cuFloatComplex *complex_input;
 #endif
 };
diff --git a/include/flexflow/ops/inc_multihead_self_attention_params.h b/include/flexflow/ops/inc_multihead_self_attention_params.h
index d95aaf2e05..84fedb45a7 100644
--- a/include/flexflow/ops/inc_multihead_self_attention_params.h
+++ b/include/flexflow/ops/inc_multihead_self_attention_params.h
@@ -8,7 +8,7 @@ namespace FlexFlow {
 
 struct IncMultiHeadSelfAttentionParams {
   LayerID layer_guid;
-  int embed_dim, num_heads, kdim, vdim;
+  int embed_dim, num_heads, kdim, vdim, num_kv_heads, tensor_parallelism_degree;
   float dropout, scaling_factor;
   bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
       qk_prod_scaling;
diff --git a/include/flexflow/ops/inc_multiquery_attention_params.h b/include/flexflow/ops/inc_multiquery_attention_params.h
deleted file mode 100644
index b781669473..0000000000
--- a/include/flexflow/ops/inc_multiquery_attention_params.h
+++ /dev/null
@@ -1,30 +0,0 @@
-#ifndef _FLEXFLOW_INC_MULTIQUERY_ATTENTION_PARAMS_H
-#define _FLEXFLOW_INC_MULTIQUERY_ATTENTION_PARAMS_H
-
-#include "flexflow/fftype.h"
-#include "flexflow/parallel_tensor.h"
-
-namespace FlexFlow {
-
-struct IncMultiQuerySelfAttentionParams {
-  LayerID layer_guid;
-  int embed_dim, num_heads, kdim, vdim;
-  float dropout;
-  bool bias, add_bias_kv, add_zero_attn;
-
-  bool is_valid(ParallelTensorShape const &) const;
-};
-
-bool operator==(IncMultiQuerySelfAttentionParams const &,
-                IncMultiQuerySelfAttentionParams const &);
-
-} // namespace FlexFlow
-
-namespace std {
-template <>
-struct hash<FlexFlow::IncMultiQuerySelfAttentionParams> {
-  size_t operator()(FlexFlow::IncMultiQuerySelfAttentionParams const &) const;
-};
-} // namespace std
-
-#endif // _FLEXFLOW_INC_MULTIQUERY_ATTENTION_PARAMS_H
diff --git a/include/flexflow/ops/inc_multiquery_self_attention.h b/include/flexflow/ops/inc_multiquery_self_attention.h
deleted file mode 100644
index 1e36876c57..0000000000
--- a/include/flexflow/ops/inc_multiquery_self_attention.h
+++ /dev/null
@@ -1,159 +0,0 @@
-#ifndef _FLEXFLOW_INC_MULTIQUERY_ATTENTION_H
-#define _FLEXFLOW_INC_MULTIQUERY_ATTENTION_H
-
-#include "flexflow/accessor.h"
-#include "flexflow/device.h"
-#include "flexflow/fftype.h"
-#include "flexflow/inference.h"
-#include "flexflow/layer.h"
-#include "flexflow/node.h"
-#include "flexflow/op_meta.h"
-#include "flexflow/operator.h"
-#include "flexflow/ops/inc_multiquery_attention_params.h"
-#include "math.h"
-#include <cfloat>
-#include <complex>
-
-namespace FlexFlow {
-
-class IncMultiQuerySelfAttentionMeta;
-
-class IncMultiQuerySelfAttention : public Op {
-public:
-  using Params = IncMultiQuerySelfAttentionParams;
-  using Input = ParallelTensor;
-
-  IncMultiQuerySelfAttention(FFModel &model,
-                             LayerID const &layer_guid,
-                             const ParallelTensor _input,
-                             int _embed_dim,
-                             int _num_heads,
-                             int _kdim,
-                             int _vdim,
-                             float _dropout,
-                             bool _bias,
-                             bool _add_bias_kv,
-                             bool _add_zero_attn,
-                             bool allocate_weights,
-                             char const *name);
-  IncMultiQuerySelfAttention(FFModel &model,
-                             const ParallelTensor _input,
-                             const ParallelTensor _weight,
-                             int _embed_dim,
-                             int _num_heads,
-                             int _kdim,
-                             int _vdim,
-                             float _dropout,
-                             bool _bias,
-                             bool _add_bias_kv,
-                             bool _add_zero_attn,
-                             bool allocate_weights,
-                             char const *name);
-  IncMultiQuerySelfAttention(FFModel &model,
-                             IncMultiQuerySelfAttention const &other,
-                             const ParallelTensor input,
-                             bool allocate_weights);
-  IncMultiQuerySelfAttention(FFModel &model,
-                             Params const &params,
-                             Input const &inputs,
-                             bool allocate_weights = false,
-                             char const *name = nullptr);
-  static Op *
-      create_operator_from_layer(FFModel &model,
-                                 Layer const *layer,
-                                 std::vector<ParallelTensor> const &inputs);
-  void init(FFModel const &) override;
-  void init_inference(FFModel const &,
-                      std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &,
-                      MachineView const *mv = nullptr) override;
-  void forward(FFModel const &) override;
-  void backward(FFModel const &) override;
-  Legion::FutureMap inference(FFModel const &,
-                              BatchConfigFuture const &,
-                              std::vector<ParallelTensor> const &,
-                              std::vector<ParallelTensor> const &,
-                              MachineView const *mv = nullptr) override;
-  void print_layer(FFModel const &model) override {
-    assert(0);
-  }
-  bool get_int_parameter(PMParameter, int *) const override;
-
-  static OpMeta *init_task(Legion::Task const *task,
-                           std::vector<Legion::PhysicalRegion> const &regions,
-                           Legion::Context ctx,
-                           Legion::Runtime *runtime);
-  static void inference_task(Legion::Task const *task,
-                             std::vector<Legion::PhysicalRegion> const &regions,
-                             Legion::Context ctx,
-                             Legion::Runtime *runtime);
-  bool measure_operator_cost(Simulator *sim,
-                             MachineView const &mv,
-                             CostMetrics &cost_metrics) const override;
-
-  static void inference_kernel_wrapper(IncMultiQuerySelfAttentionMeta const *m,
-                                       BatchConfig const *bc,
-                                       GenericTensorAccessorR const &input,
-                                       GenericTensorAccessorR const &weight,
-                                       GenericTensorAccessorW const &output);
-  Params get_params() const;
-
-public:
-  int num_heads;
-  float dropout;
-  bool bias;
-  bool add_bias_kv, add_zero_attn;
-  int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize,
-      embed_dim;
-  int qoSeqLength, kvSeqLength;
-};
-
-class IncMultiQuerySelfAttentionMeta : public OpMeta {
-public:
-  IncMultiQuerySelfAttentionMeta(FFHandler handler,
-                                 IncMultiQuerySelfAttention const *attn,
-                                 GenericTensorAccessorR const &weight,
-                                 Legion::Memory gpu_mem,
-                                 int num_samples);
-  IncMultiQuerySelfAttentionMeta(FFHandler handler,
-                                 InferenceMode infer_mode,
-                                 Op const *attn,
-                                 int _qSize,
-                                 int _kSize,
-                                 int _vSize,
-                                 int _qProjSize,
-                                 int _kProjSize,
-                                 int _vProjSize,
-                                 int _oProjSize,
-                                 int _embed_dim,
-                                 bool _bias,
-                                 bool _add_bias_kv,
-                                 GenericTensorAccessorR const &weight,
-                                 Legion::Memory gpu_mem,
-                                 int num_samples);
-  ~IncMultiQuerySelfAttentionMeta(void);
-
-public:
-  Realm::RegionInstance reserveInst;
-  size_t weights_params, weightSize, reserveSpaceSize;
-  int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize,
-      embed_dim;
-  int num_heads;
-  bool *has_load_weights;
-  bool *bias;
-  bool *multi_query_attention;
-#ifdef INFERENCE_TESTS
-  float *kcache, *vcache;
-#endif
-  void *devQKVProjArray, *keyCache, *valueCache;
-  void *qk_prods, *qk_prods_softmax;
-  void *attn_heads, *W_out_contiguous;
-  BatchConfig::PerTokenInfo *token_infos;
-#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
-  cuFloatComplex *complex_input;
-#endif
-};
-
-}; // namespace FlexFlow
-
-#endif // _FLEXFLOW_ATTENTION_H
diff --git a/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h b/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
index 5b40136524..6b294bc211 100644
--- a/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
+++ b/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
@@ -11,18 +11,11 @@ namespace FlexFlow {
 namespace Kernels {
 namespace IncMultiHeadAttention {
 
-template <typename DT>
-__global__ void build_w_out_tensor(DT const *weight_ptr,
-                                   DT *contiguous_weight_ptr,
-                                   int vProjSize,
-                                   int oProjSize,
-                                   int num_heads,
-                                   int qkv_weight_block_size);
-
 template <typename DT>
 __global__ void apply_proj_bias_w(DT *input_ptr,
                                   DT const *bias_ptr,
                                   int num_tokens,
+                                  int qkv_weight_size,
                                   int oProjSize);
 
 template <typename DT>
@@ -34,6 +27,7 @@ __global__ void apply_proj_bias_qkv(DT *input_ptr,
                                     int kProjSize,
                                     int vProjSize,
                                     int num_heads,
+                                    int num_kv_heads,
                                     bool scaling_query,
                                     float scaling_factor);
 
@@ -46,9 +40,10 @@ __global__ void
                            int kProjSize,
                            int num_heads,
                            int num_tokens,
+                           int num_kv_heads,
                            int q_block_size,
                            int k_block_size,
-                           int v_block_size,
+                           int q_array_size,
                            bool q_tensor);
 
 template <typename DT>
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention.h b/include/flexflow/ops/spec_inc_multihead_self_attention.h
index c8c1c4c9cf..f5b06c830e 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention.h
@@ -29,6 +29,7 @@ class SpecIncMultiHeadSelfAttention : public Op {
                                 const ParallelTensor _input,
                                 int _embed_dim,
                                 int _num_heads,
+                                int _num_kv_heads,
                                 int _kdim,
                                 int _vdim,
                                 float _dropout,
@@ -46,6 +47,7 @@ class SpecIncMultiHeadSelfAttention : public Op {
                                 const ParallelTensor _weight,
                                 int _embed_dim,
                                 int _num_heads,
+                                int _num_kv_heads,
                                 int _kdim,
                                 int _vdim,
                                 float _dropout,
@@ -114,7 +116,7 @@ class SpecIncMultiHeadSelfAttention : public Op {
   Params get_params() const;
 
 public:
-  int num_heads;
+  int num_heads, num_kv_heads, tensor_parallelism_degree;
   float dropout, scaling_factor;
   bool bias;
   bool add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
@@ -130,7 +132,8 @@ class SpecIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
                                     GenericTensorAccessorR const &weight,
                                     MemoryAllocator &gpu_mem_allocator,
                                     int num_samples,
-                                    int _num_heads);
+                                    int _num_heads,
+                                    int _num_kv_heads);
   ~SpecIncMultiHeadSelfAttentionMeta(void);
 
 public:
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention_params.h b/include/flexflow/ops/spec_inc_multihead_self_attention_params.h
index 5995e95fe1..1741b23745 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention_params.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention_params.h
@@ -8,7 +8,7 @@ namespace FlexFlow {
 
 struct SpecIncMultiHeadSelfAttentionParams {
   LayerID layer_guid;
-  int embed_dim, num_heads, kdim, vdim;
+  int embed_dim, num_heads, num_kv_heads, kdim, vdim;
   float dropout, scaling_factor;
   bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
       qk_prod_scaling;
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention.h b/include/flexflow/ops/tree_inc_multihead_self_attention.h
index ba1d80dd60..cf714fe515 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention.h
@@ -29,6 +29,7 @@ class TreeIncMultiHeadSelfAttention : public Op {
                                 const ParallelTensor _input,
                                 int _embed_dim,
                                 int _num_heads,
+                                int _num_kv_heads,
                                 int _kdim,
                                 int _vdim,
                                 float _dropout,
@@ -42,12 +43,14 @@ class TreeIncMultiHeadSelfAttention : public Op {
                                 bool allocate_weights,
                                 DataType _quantization_type,
                                 bool _offload,
+                                int _tensor_parallelism_degree,
                                 char const *name);
   TreeIncMultiHeadSelfAttention(FFModel &model,
                                 const ParallelTensor _input,
                                 const ParallelTensor _weight,
                                 int _embed_dim,
                                 int _num_heads,
+                                int _num_kv_heads,
                                 int _kdim,
                                 int _vdim,
                                 float _dropout,
@@ -61,6 +64,7 @@ class TreeIncMultiHeadSelfAttention : public Op {
                                 bool allocate_weights,
                                 DataType _quantization_type,
                                 bool _offload,
+                                int _tensor_parallelism_degree,
                                 char const *name);
   TreeIncMultiHeadSelfAttention(FFModel &model,
                                 TreeIncMultiHeadSelfAttention const &other,
@@ -115,7 +119,7 @@ class TreeIncMultiHeadSelfAttention : public Op {
   Params get_params() const;
 
 public:
-  int num_heads;
+  int num_heads, num_kv_heads, tensor_parallelism_degree;
   float dropout, scaling_factor;
   bool bias;
   bool add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
@@ -133,7 +137,8 @@ class TreeIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
                                     GenericTensorAccessorR const &weight,
                                     MemoryAllocator &gpu_mem_allocator,
                                     int num_samples,
-                                    int _num_heads);
+                                    int _num_heads,
+                                    int _num_kv_heads);
   ~TreeIncMultiHeadSelfAttentionMeta(void);
 
 public:
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention_params.h b/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
index 0eede3bd2f..a00e56bda6 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
@@ -8,7 +8,7 @@ namespace FlexFlow {
 
 struct TreeIncMultiHeadSelfAttentionParams {
   LayerID layer_guid;
-  int embed_dim, num_heads, kdim, vdim;
+  int embed_dim, num_heads, kdim, vdim, num_kv_heads, tensor_parallelism_degree;
   float dropout, scaling_factor;
   bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
       qk_prod_scaling;
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index 9dd19ee7f9..446f884eac 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -214,8 +214,8 @@ class RequestManager {
   InferenceResultFuture last_irf;
   TreeVerifyBatchConfigFuture last_tree_bcf;
   InferenceResultFuture last_tree_irf;
-  const std::map<ModelType, int> model_bos_map = {{ModelType::LLAMA, 0},
-                                                  {ModelType::OPT, 2}};
+  const std::map<ModelType, int> model_bos_map = {
+      {ModelType::LLAMA, 0}, {ModelType::OPT, 2}, {ModelType::LLAMA2, 1}};
 
   // TODO: Move this two vector to request struct
   std::unordered_map<RequestGuid,
diff --git a/include/flexflow/utils/cuda_helper.h b/include/flexflow/utils/cuda_helper.h
index e67e50484c..f8bf67b3e1 100644
--- a/include/flexflow/utils/cuda_helper.h
+++ b/include/flexflow/utils/cuda_helper.h
@@ -141,7 +141,10 @@ __host__ void updateGAS(float *para_ptr,
                         float learning_rate);
 
 template <typename T>
-void print_tensor(T const *ptr, size_t num_elements, char const *prefix);
+void print_tensor(T const *ptr,
+                  size_t num_elements,
+                  char const *prefix,
+                  int shard_id = 0);
 template <typename T>
 void print_beam_tensor(T const *ptr,
                        size_t num_elements,
diff --git a/inference/file_loader.cc b/inference/file_loader.cc
index e89c3eb622..94e604ac2d 100644
--- a/inference/file_loader.cc
+++ b/inference/file_loader.cc
@@ -25,11 +25,14 @@ using namespace Legion;
 FileDataLoader::FileDataLoader(std::string _input_path,
                                std::string _weight_file_path,
                                int _num_heads,
+                               int _num_kv_heads,
                                size_t _hidden_dim,
-                               size_t _qkv_inner_dim)
+                               size_t _qkv_inner_dim,
+                               int _tensor_partition_num)
     : input_path(_input_path), weight_file_path(_weight_file_path),
-      num_heads(_num_heads), hidden_dim(_hidden_dim),
-      qkv_inner_dim(_qkv_inner_dim){};
+      num_heads(_num_heads), num_kv_heads(_num_kv_heads),
+      hidden_dim(_hidden_dim), qkv_inner_dim(_qkv_inner_dim),
+      tensor_partition_num(_tensor_partition_num){};
 
 BatchConfig::TokenId *FileDataLoader::generate_requests(int num, int length) {
 
@@ -61,65 +64,6 @@ BatchConfig::TokenId *FileDataLoader::generate_requests(int num, int length) {
   return prompts;
 };
 
-template <typename DT>
-void load_attention_bias(DT *ptr,
-                         int num_heads,
-                         size_t hidden_dim,
-                         size_t qkv_inner_dim,
-                         std::string layer_name,
-                         std::string weight_path) {
-  std::string q_file = weight_path +
-                       layer_name.substr(0, layer_name.find("attention")) +
-                       "attention_wq_bias";
-  std::string k_file = weight_path +
-                       layer_name.substr(0, layer_name.find("attention")) +
-                       "attention_wk_bias";
-  std::string v_file = weight_path +
-                       layer_name.substr(0, layer_name.find("attention")) +
-                       "attention_wv_bias";
-  std::string o_file = weight_path +
-                       layer_name.substr(0, layer_name.find("attention")) +
-                       "attention_wo_bias";
-  std::vector<std::string> bias_files = {q_file, k_file, v_file, o_file};
-
-  int file_index = 0;
-  for (auto file : bias_files) {
-    size_t qkv_partial_size = qkv_inner_dim * num_heads;
-    size_t out_partial_size = hidden_dim;
-    size_t partial_size =
-        (file_index < 3) ? qkv_partial_size : out_partial_size;
-    // std::cout << "Loading filename: " << file << std::endl;
-    std::ifstream in(file, std::ios::in | std::ios::binary);
-    assert(in.good() && "incorrect bias file path");
-    std::vector<DT> host_array(partial_size);
-    size_t loaded_data_size = sizeof(DT) * partial_size;
-    in.seekg(0, in.end);
-    in.seekg(0, in.beg);
-    in.read((char *)host_array.data(), loaded_data_size);
-    size_t in_get_size = in.gcount();
-
-    if (in_get_size != loaded_data_size) {
-      printf(
-          "load bias data error: in_get_size (%lu) != loaded_data_size (%lu)\n",
-          in_get_size,
-          loaded_data_size);
-      assert(false);
-    }
-    assert(partial_size == host_array.size());
-
-    size_t data_index = 0;
-
-    for (int i = 0; i < partial_size; i++) {
-      ptr[file_index * qkv_partial_size + i] = host_array.at(data_index);
-      data_index++;
-    }
-
-    file_index++;
-
-    in.close();
-  }
-}
-
 template <typename DT>
 void load_attention_weights_multi_query(DT *ptr,
                                         std::string layer_name,
@@ -169,13 +113,79 @@ void load_attention_weights_multi_query(DT *ptr,
 }
 
 template <typename DT>
-void load_attention_weights(DT *ptr,
+void load_attention_bias_v2(DT *ptr,
                             int num_heads,
+                            int num_kv_heads,
                             size_t hidden_dim,
                             size_t qkv_inner_dim,
                             std::string layer_name,
-                            std::string weight_path,
-                            size_t volume) {
+                            std::string weight_path) {
+  std::string q_file = weight_path +
+                       layer_name.substr(0, layer_name.find("attention")) +
+                       "attention_wq_bias";
+  std::string k_file = weight_path +
+                       layer_name.substr(0, layer_name.find("attention")) +
+                       "attention_wk_bias";
+  std::string v_file = weight_path +
+                       layer_name.substr(0, layer_name.find("attention")) +
+                       "attention_wv_bias";
+  std::string o_file = weight_path +
+                       layer_name.substr(0, layer_name.find("attention")) +
+                       "attention_wo_bias";
+  std::vector<std::string> bias_files = {q_file, k_file, v_file, o_file};
+
+  int file_index = 0;
+
+  // now only opt use this.
+  assert(num_heads == num_kv_heads);
+
+  for (auto file : bias_files) {
+    int n_heads = file_index == 0 ? num_heads : num_kv_heads;
+    size_t qkv_partial_size = qkv_inner_dim * n_heads;
+    size_t out_partial_size = hidden_dim;
+    size_t partial_size =
+        (file_index < 3) ? qkv_partial_size : out_partial_size;
+    std::ifstream in(file, std::ios::in | std::ios::binary);
+    assert(in.good() && "incorrect bias file path");
+    std::vector<DT> host_array(partial_size);
+    size_t loaded_data_size = sizeof(DT) * partial_size;
+    in.seekg(0, in.end);
+    in.seekg(0, in.beg);
+    in.read((char *)host_array.data(), loaded_data_size);
+    size_t in_get_size = in.gcount();
+
+    if (in_get_size != loaded_data_size) {
+      printf(
+          "load bias data error: in_get_size (%lu) != loaded_data_size (%lu)\n",
+          in_get_size,
+          loaded_data_size);
+      assert(false);
+    }
+    assert(partial_size == host_array.size());
+
+    size_t data_index = 0;
+
+    for (int i = 0; i < partial_size; i++) {
+      ptr[file_index * qkv_partial_size + i] = host_array.at(data_index);
+      data_index++;
+    }
+
+    file_index++;
+
+    in.close();
+  }
+}
+
+template <typename DT>
+void load_attention_weights_v2(DT *ptr,
+                               int num_heads,
+                               int num_kv_heads,
+                               size_t hidden_dim,
+                               size_t qkv_inner_dim,
+                               std::string layer_name,
+                               std::string weight_path,
+                               size_t volume,
+                               int tensor_partition_num) {
   // layers_0_attention_wq_weight
   // layers_0_self_attn_q_proj_weight
   std::string q_file = weight_path +
@@ -191,18 +201,28 @@ void load_attention_weights(DT *ptr,
                        layer_name.substr(0, layer_name.find("attention")) +
                        "attention_wo_weight";
   std::vector<std::string> weight_files = {q_file, k_file, v_file};
-
   int file_index = 0;
 
+  int base_index = 0;
   size_t single_proj_size =
       hidden_dim *
       qkv_inner_dim; // size of each of Q,K,V,O weights for a single head
   size_t one_weight_file_size =
       num_heads * single_proj_size; // size of each of Q/K/V/O for all heads
 
-  // q, k, v -> 0, 1, 2
+  size_t q_size = one_weight_file_size, o_size = one_weight_file_size;
+  size_t k_size = single_proj_size * num_kv_heads,
+         v_size = single_proj_size * num_kv_heads;
+
+  // stride for q, k, v, o
+  size_t stride_size =
+      (q_size + v_size + k_size + o_size) / tensor_partition_num;
   for (auto file : weight_files) {
-    size_t partial_size = one_weight_file_size;
+    int data_index = 0;
+    size_t partial_size = (file_index == 0 || file_index == 3)
+                              ? one_weight_file_size
+                              : single_proj_size * num_kv_heads;
+    size_t one_partition_size = partial_size / tensor_partition_num;
 
     std::ifstream in(file, std::ios::in | std::ios::binary);
     if (!in.good()) {
@@ -217,37 +237,30 @@ void load_attention_weights(DT *ptr,
     size_t in_get_size = in.gcount();
 
     if (in_get_size != loaded_data_size) {
-      std::cout << "load data error" << std::endl;
-      assert(false);
-      return;
+      std::cout << "load attention data error " << in_get_size << ", "
+                << loaded_data_size;
+      assert(false && "data size mismatch");
     }
-    assert(partial_size == host_array.size());
-
-    size_t data_index = 0;
-    for (int i = 0; i < num_heads; i++) {
-      size_t start_index =
-          i * single_proj_size * 4 + file_index * single_proj_size;
-      for (size_t j = start_index; j < start_index + single_proj_size; j++) {
-        ptr[j] = host_array.at(data_index);
-        data_index += 1;
+    // wq, wk, wo
+    for (int i = 0; i < tensor_partition_num; i++) {
+      for (int j = 0; j < one_partition_size; j++) {
+        ptr[base_index + i * stride_size + j] = host_array.at(data_index++);
       }
     }
     assert(data_index == partial_size);
+    base_index += one_partition_size;
     file_index++;
-
-    in.close();
   }
-  // output weight file gets special treatment
+  assert(base_index == (q_size + k_size + v_size) / tensor_partition_num);
+
   {
     std::ifstream in(o_file, std::ios::in | std::ios::binary);
-    std::cout << "Loading attention filename: " << o_file << std::endl;
     if (!in.good()) {
       std::cout << "Could not open file: " << o_file << std::endl;
     }
     assert(in.good() && "incorrect weight file path");
-    size_t full_output_weight_size = num_heads * single_proj_size;
-    std::vector<DT> host_array(full_output_weight_size);
-    size_t loaded_data_size = sizeof(DT) * full_output_weight_size;
+    std::vector<DT> host_array(one_weight_file_size);
+    size_t loaded_data_size = sizeof(DT) * one_weight_file_size;
     in.seekg(0, in.end);
     in.seekg(0, in.beg);
     in.read((char *)host_array.data(), loaded_data_size);
@@ -257,21 +270,22 @@ void load_attention_weights(DT *ptr,
       std::cout << "load data error" << std::endl;
       assert(false);
     }
-    assert(full_output_weight_size == host_array.size());
-
-    for (int i = 0; i < num_heads; i++) {
-      size_t start_index = i * single_proj_size * 4 + 3 * single_proj_size;
-      for (size_t j = 0; j < single_proj_size; j++) {
-        int ff_row_idx = j % hidden_dim;
-        int ff_col_idx = j / hidden_dim;
-        assert(ff_row_idx < hidden_dim && ff_col_idx < qkv_inner_dim);
-        size_t data_index = ff_row_idx * (qkv_inner_dim * num_heads) +
-                            qkv_inner_dim * i + ff_col_idx;
-        ptr[j + start_index] = host_array.at(data_index);
-      }
+    assert(one_weight_file_size == host_array.size());
+    int data_index = 0;
+
+    int one_partition_size = qkv_inner_dim * (num_heads / tensor_partition_num);
+    for (int i = 0; i < one_weight_file_size; i++) {
+      int part_idx = (i / one_partition_size) % tensor_partition_num;
+      int block_num = (i / one_partition_size);
+      int offset = block_num / tensor_partition_num * one_partition_size +
+                   (i % one_partition_size);
+      ptr[base_index + part_idx * stride_size + offset] =
+          host_array.at(data_index++);
     }
 
     in.close();
+
+    assert(data_index == one_weight_file_size);
   }
 }
 
@@ -655,6 +669,8 @@ void FileDataLoader::load_single_weight_tensor(FFModel *ff,
     volume *= weight->dims[i];
   }
 
+  std::cout << "load weights: " << layername << "\n";
+
   assert(data_type_size(weight->data_type) == sizeof(DT));
   DT *data = (DT *)malloc(sizeof(DT) * volume);
 
@@ -663,20 +679,23 @@ void FileDataLoader::load_single_weight_tensor(FFModel *ff,
 
   if (file_path.find("attention_w") != std::string::npos) {
     if (weight_idx == 0) {
-      load_attention_weights(data,
+      load_attention_weights_v2(data,
+                                num_heads,
+                                num_kv_heads,
+                                hidden_dim,
+                                qkv_inner_dim,
+                                file_path,
+                                weight_file_path,
+                                volume,
+                                tensor_partition_num);
+    } else {
+      load_attention_bias_v2(data,
                              num_heads,
+                             num_kv_heads,
                              hidden_dim,
                              qkv_inner_dim,
                              file_path,
-                             weight_file_path,
-                             volume);
-    } else {
-      load_attention_bias(data,
-                          num_heads,
-                          hidden_dim,
-                          qkv_inner_dim,
-                          file_path,
-                          weight_file_path);
+                             weight_file_path);
     }
 
   } else if (file_path.find("self_attention") != std::string::npos) {
diff --git a/inference/file_loader.h b/inference/file_loader.h
index 8be820b1bd..0c9dfa56cd 100644
--- a/inference/file_loader.h
+++ b/inference/file_loader.h
@@ -27,8 +27,10 @@ class FileDataLoader {
   FileDataLoader(std::string _input_path,
                  std::string _weight_file_path,
                  int _num_heads,
+                 int _num_kv_heads,
                  size_t _hidden_dim,
-                 size_t _qkv_inner_dim);
+                 size_t _qkv_inner_dim,
+                 int _tensor_partition_num);
 
   BatchConfig::TokenId *generate_requests(int num, int length);
 
@@ -54,7 +56,7 @@ class FileDataLoader {
                       int offset);
 
 private:
-  int num_heads;
+  int num_heads, num_kv_heads, tensor_partition_num;
   size_t hidden_dim, qkv_inner_dim;
   std::string input_path;
   std::string weight_file_path;
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index 4246a78824..84217a22f1 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -52,6 +52,8 @@ void parse_input_args(char **argv,
                      [](unsigned char c) { return std::tolower(c); });
       if (model_type_str == "llama") {
         llm_model_type = ModelType::LLAMA;
+      } else if (model_type_str == "llama2") {
+        llm_model_type = ModelType::LLAMA2;
       } else if (model_type_str == "opt") {
         llm_model_type = ModelType::OPT;
       } else if (model_type_str == "falcon") {
@@ -153,7 +155,7 @@ void FlexFlow::top_level_task(Task const *task,
   rm->register_output_filepath(file_paths.output_file_path);
 
   FFModel model(ffconfig, ffconfig.cpu_offload);
-  if (model_type == ModelType::LLAMA) {
+  if (model_type == ModelType::LLAMA || model_type == ModelType::LLAMA2) {
     LLAMA::create_llama_model(model,
                               file_paths.llm_config_file_path,
                               file_paths.llm_weight_file_path,
@@ -170,7 +172,6 @@ void FlexFlow::top_level_task(Task const *task,
     FALCON::create_falcon_model(model,
                                 file_paths.llm_config_file_path,
                                 file_paths.llm_weight_file_path,
-                                ffconfig.workersPerNode * ffconfig.numNodes,
                                 INC_DECODING_MODE,
                                 use_full_precision);
   } else {
diff --git a/inference/models/configs/falcon_7B.json b/inference/models/configs/falcon_7B.json
index 445da54272..d89564557a 100644
--- a/inference/models/configs/falcon_7B.json
+++ b/inference/models/configs/falcon_7B.json
@@ -2,6 +2,7 @@
     "n_layers": 32,
     "vocab_size": 65024,
     "n_heads": 71,
+    "n_kv_heads" : 1,
     "dim": 4544,
     "multiple_of": 256,
     "norm_eps": 1e-05,
diff --git a/inference/models/configs/llama2_70B.json b/inference/models/configs/llama2_70B.json
new file mode 100644
index 0000000000..45751787e6
--- /dev/null
+++ b/inference/models/configs/llama2_70B.json
@@ -0,0 +1,12 @@
+{
+    "n_layers": 80,
+    "vocab_size": 32000,
+    "n_heads": 64,
+    "n_kv_heads": 8,
+    "dim": 8192,
+    "multiple_of": 256,
+    "norm_eps": 1e-5,
+    "total_requests": 2560,
+    "hidden_dim": 28672,
+    "incremental_mode": true
+}
diff --git a/inference/models/configs/llama2_7B.json b/inference/models/configs/llama2_7B.json
new file mode 100644
index 0000000000..5796f70db7
--- /dev/null
+++ b/inference/models/configs/llama2_7B.json
@@ -0,0 +1,12 @@
+{
+    "n_layers": 32,
+    "vocab_size": 32000,
+    "n_heads": 32,
+    "n_kv_heads": 32,
+    "dim": 4096,
+    "multiple_of": 256,
+    "norm_eps": 1e-5,
+    "total_requests": 2560,
+    "hidden_dim": 11008,
+    "incremental_mode": true
+}
diff --git a/inference/models/configs/llama_160M.json b/inference/models/configs/llama_160M.json
index d912c64ab7..85e83804aa 100644
--- a/inference/models/configs/llama_160M.json
+++ b/inference/models/configs/llama_160M.json
@@ -2,6 +2,7 @@
     "n_layers": 12,
     "vocab_size": 32000,
     "n_heads": 12,
+    "n_kv_heads": 12,
     "dim": 768,
     "multiple_of": 256,
     "norm_eps": 1e-6,
diff --git a/inference/models/configs/llama_7B.json b/inference/models/configs/llama_7B.json
index 0c32ed320d..f0ef126096 100644
--- a/inference/models/configs/llama_7B.json
+++ b/inference/models/configs/llama_7B.json
@@ -2,6 +2,7 @@
     "n_layers": 32,
     "vocab_size": 32000,
     "n_heads": 32,
+    "n_kv_heads": 32,
     "dim": 4096,
     "multiple_of": 256,
     "norm_eps": 1e-6,
diff --git a/inference/models/falcon.cc b/inference/models/falcon.cc
index 2d79040f5f..2846549d28 100644
--- a/inference/models/falcon.cc
+++ b/inference/models/falcon.cc
@@ -22,11 +22,25 @@ using namespace Legion;
 void FALCON::create_falcon_model(FFModel &ff,
                                  std::string const &model_config_file_path,
                                  std::string const &weight_file_path,
-                                 int num_pipeline_stages,
                                  InferenceMode mode,
                                  bool use_full_precision) {
   Config falcon_config(model_config_file_path);
   falcon_config.printConfig();
+
+  if (ff.config.tensor_parallelism_degree > falcon_config.n_heads ||
+      ff.config.tensor_parallelism_degree > falcon_config.n_kv_heads) {
+    assert(false && "The degree of tensor parallelism should be greater than "
+                    "or equal to the number of heads");
+  }
+
+  int num_devices = ff.config.workersPerNode * ff.config.numNodes;
+  int num_transformer_layers = falcon_config.n_layers;
+  assert(num_transformer_layers % ff.config.pipeline_parallelism_degree == 0);
+  int num_layers_per_pp_block =
+      num_transformer_layers / ff.config.pipeline_parallelism_degree;
+  int num_devices_per_data_parallelism_line =
+      num_devices / ff.config.data_parallelism_degree;
+
   std::unordered_map<std::string, Layer *> weights_layers;
 
   Tensor input;
@@ -74,11 +88,49 @@ void FALCON::create_falcon_model(FFModel &ff,
                            attention_norm);
     Tensor mha;
     switch (mode) {
+      case BEAM_SEARCH_MODE: {
+        mha = ff.spec_inc_multihead_self_attention(
+            att_norm,
+            falcon_config.dim,
+            falcon_config.n_heads,
+            falcon_config.n_kv_heads,
+            falcon_config.dim / falcon_config.n_heads,
+            falcon_config.dim / falcon_config.n_heads,
+            0.0f,
+            false,
+            false,
+            false,
+            DT_NONE,
+            NULL,
+            true);
+        break;
+      }
+
+      case TREE_VERIFY_MODE: {
+        mha = ff.inc_multihead_self_attention_verify(
+            att_norm,
+            falcon_config.dim,
+            falcon_config.n_heads,
+            falcon_config.n_kv_heads,
+            falcon_config.dim / falcon_config.n_heads,
+            falcon_config.dim / falcon_config.n_heads,
+            0.0f,    /*dropout*/
+            false,   /*bias*/
+            false,   /*add_bias_kv*/
+            false,   /*add_zero_attn*/
+            DT_NONE, /*data_type*/
+            nullptr, /*kernel_initializer*/
+            true     /*apply_rotary_embedding*/
+        );
+        break;
+      }
+
       case INC_DECODING_MODE: {
-        mha = ff.inc_multiquery_self_attention(
+        mha = ff.inc_multihead_self_attention(
             att_norm,
             falcon_config.dim,
             falcon_config.n_heads,
+            falcon_config.n_kv_heads,
             falcon_config.dim / falcon_config.n_heads,
             falcon_config.dim / falcon_config.n_heads,
             0.0f,    /*dropout*/
@@ -86,7 +138,8 @@ void FALCON::create_falcon_model(FFModel &ff,
             false,   /*add_bias_kv*/
             false,   /*add_zero_attn*/
             DT_NONE, /*data_type*/
-            nullptr  /*kernel_initializer*/
+            nullptr, /*kernel_initializer*/
+            true     /*apply_rotary_embedding*/
         );
         break;
       }
@@ -95,10 +148,14 @@ void FALCON::create_falcon_model(FFModel &ff,
       }
     }
     Layer *attention_layer = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) +
-                               "_self_attention_dense_weight",
-                           attention_layer);
 
+    // multi query
+    //  weights_layers.emplace("layers_" + std::to_string(i) +
+    //                             "_self_attention_dense_weight",
+    //                         attention_layer);
+
+    weights_layers.emplace("layers_" + std::to_string(i) + "_attention_weight",
+                           attention_layer);
     Tensor dense_h_to_4h =
         ff.dense(att_norm, falcon_config.dim * 4, AC_MODE_NONE, false);
     Layer *dense_h_to_4h_layer = ff.layers.back();
@@ -136,13 +193,17 @@ void FALCON::create_falcon_model(FFModel &ff,
 
   // Compile the model
   std::cout << "------start compile ----------" << std::endl;
+  int tensor_partition_num = ff.config.tensor_parallelism_degree;
   InferenceManager *im = InferenceManager::get_inference_manager();
   im->compile_model_and_allocate_buffer(&ff);
   FileDataLoader fileloader("",
                             weight_file_path,
                             falcon_config.n_heads,
+                            falcon_config.n_kv_heads,
                             falcon_config.dim,
-                            falcon_config.dim / falcon_config.n_heads);
+                            falcon_config.dim / falcon_config.n_heads,
+                            tensor_partition_num);
+  std::cout << "------laod weights ----------" << std::endl;
   fileloader.load_weights(&ff, weights_layers, use_full_precision);
   std::cout << "------load weight finished----------" << std::endl;
 
diff --git a/inference/models/falcon.h b/inference/models/falcon.h
index d9c330a8b9..d37ffbc713 100644
--- a/inference/models/falcon.h
+++ b/inference/models/falcon.h
@@ -32,6 +32,7 @@ class FALCON {
       n_layers = 32;
       vocab_size = 32000;
       n_heads = 32;
+      n_kv_heads = 1;
       dim = 4096;
       multiple_of = 256;
       norm_eps = 1e-6;
@@ -54,6 +55,7 @@ class FALCON {
           n_layers = config_json["n_layers"];
           vocab_size = config_json["vocab_size"];
           n_heads = config_json["n_heads"];
+          n_kv_heads = config_json["n_kv_heads"];
           dim = config_json["dim"];
           multiple_of = config_json["multiple_of"];
           norm_eps = config_json["norm_eps"];
@@ -100,14 +102,13 @@ class FALCON {
 
     int n_heads, n_layers, vocab_size, dim, multiple_of, hidden_dim,
         total_requests, incremental_mode, max_seq_len, max_num_tokens,
-        max_beam_width, max_beam_depth, head_dim;
+        max_beam_width, max_beam_depth, head_dim, n_kv_heads;
     float norm_eps;
   };
 
   static void create_falcon_model(FFModel &ff,
                                   std::string const &model_config_file_path,
                                   std::string const &weight_file_path,
-                                  int num_pipeline_stages,
                                   InferenceMode mode,
                                   bool use_full_precision = false);
 };
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index fd2b7fe4f9..0cd53fb141 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -81,6 +81,7 @@ void LLAMA::create_llama_model(FFModel &ff,
             att_norm,
             llama_config.dim,
             llama_config.n_heads,
+            llama_config.n_kv_heads,
             llama_config.dim / llama_config.n_heads,
             llama_config.dim / llama_config.n_heads,
             0.0f,
@@ -97,6 +98,7 @@ void LLAMA::create_llama_model(FFModel &ff,
             att_norm,
             llama_config.dim,
             llama_config.n_heads,
+            llama_config.n_kv_heads,
             llama_config.dim / llama_config.n_heads,
             llama_config.dim / llama_config.n_heads,
             0.0f,    /*dropout*/
@@ -114,6 +116,7 @@ void LLAMA::create_llama_model(FFModel &ff,
             att_norm,
             llama_config.dim,
             llama_config.n_heads,
+            llama_config.n_kv_heads,
             llama_config.dim / llama_config.n_heads,
             llama_config.dim / llama_config.n_heads,
             0.0f,    /*dropout*/
@@ -192,12 +195,15 @@ void LLAMA::create_llama_model(FFModel &ff,
   InferenceManager *im = InferenceManager::get_inference_manager();
   // Compile the model
   std::cout << "------start compile ----------" << std::endl;
+  int tensor_partition_num = ff.config.tensor_parallelism_degree;
   im->compile_model_and_allocate_buffer(&ff);
   FileDataLoader fileloader("",
                             weight_file_path,
                             llama_config.n_heads,
+                            llama_config.n_kv_heads,
                             llama_config.dim,
-                            llama_config.dim / llama_config.n_heads);
+                            llama_config.dim / llama_config.n_heads,
+                            tensor_partition_num);
   fileloader.load_weights(&ff, weights_layers, use_full_precision);
   std::cout << "------load weight finished----------" << std::endl;
 
diff --git a/inference/models/llama.h b/inference/models/llama.h
index 61d8908d0c..46a22954e0 100644
--- a/inference/models/llama.h
+++ b/inference/models/llama.h
@@ -38,6 +38,7 @@ class LLAMA {
       total_requests = 2560;
       incremental_mode = true;
       hidden_dim = 11008;
+      n_kv_heads = 32;
       max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
       max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
       max_beam_width = BeamSearchBatchConfig::MAX_BEAM_WIDTH;
@@ -54,6 +55,7 @@ class LLAMA {
           n_layers = config_json["n_layers"];
           vocab_size = config_json["vocab_size"];
           n_heads = config_json["n_heads"];
+          n_kv_heads = config_json["n_kv_heads"];
           dim = config_json["dim"];
           multiple_of = config_json["multiple_of"];
           norm_eps = config_json["norm_eps"];
@@ -99,7 +101,7 @@ class LLAMA {
 
     int n_heads, n_layers, vocab_size, dim, multiple_of, hidden_dim,
         total_requests, incremental_mode, max_seq_len, max_num_tokens,
-        max_beam_width, max_beam_depth;
+        max_beam_width, max_beam_depth, n_kv_heads;
     float norm_eps;
   };
 
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index 68b931716f..86ced698f0 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -109,6 +109,7 @@ void OPT::create_opt_model(FFModel &ff,
             hidden_states,
             opt_config.hidden_size,
             opt_config.num_attention_heads,
+            opt_config.num_attention_heads,
             opt_config.hidden_size / opt_config.num_attention_heads,
             opt_config.hidden_size / opt_config.num_attention_heads,
             0.0f,
@@ -130,6 +131,7 @@ void OPT::create_opt_model(FFModel &ff,
             hidden_states,
             opt_config.hidden_size,
             opt_config.num_attention_heads,
+            opt_config.num_attention_heads,
             opt_config.hidden_size / opt_config.num_attention_heads,
             opt_config.hidden_size / opt_config.num_attention_heads,
             0.0f,
@@ -151,6 +153,7 @@ void OPT::create_opt_model(FFModel &ff,
             hidden_states,
             opt_config.hidden_size,
             opt_config.num_attention_heads,
+            opt_config.num_attention_heads,
             opt_config.hidden_size / opt_config.num_attention_heads,
             opt_config.hidden_size / opt_config.num_attention_heads,
             0.0f,
@@ -223,14 +226,17 @@ void OPT::create_opt_model(FFModel &ff,
 
   //------------------- compile the model --------------------------------
   std::cout << "------start compile ----------" << std::endl;
+  int tensor_partition_num = ff.config.tensor_parallelism_degree;
   InferenceManager *im = InferenceManager::get_inference_manager();
   im->compile_model_and_allocate_buffer(&ff);
   FileDataLoader fileloader("",
                             weight_file_path,
                             opt_config.num_attention_heads,
+                            opt_config.num_attention_heads,
                             opt_config.hidden_size,
                             opt_config.hidden_size /
-                                opt_config.num_attention_heads);
+                                opt_config.num_attention_heads,
+                            tensor_partition_num);
   fileloader.load_weights(&ff, weights_layers, use_full_precision);
   std::cout << "------finished loading weights----------" << std::endl;
   im->init_operators_inference(&ff);
diff --git a/inference/spec_infer/CMakeLists.txt b/inference/spec_infer/CMakeLists.txt
index c374d47506..9697bd8256 100644
--- a/inference/spec_infer/CMakeLists.txt
+++ b/inference/spec_infer/CMakeLists.txt
@@ -9,7 +9,8 @@ set(CPU_SRC
   spec_infer.cc
   ../file_loader.cc
   ../models/llama.cc
-  ../models/opt.cc)
+  ../models/opt.cc
+  ../models/falcon.cc)
 
 cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
 target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 99131edb34..6b218e107c 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/inference.h"
+#include "models/falcon.h"
 #include "models/llama.h"
 #include "models/opt.h"
 #include <filesystem>
@@ -54,8 +55,12 @@ void parse_input_args(char **argv,
                      [](unsigned char c) { return std::tolower(c); });
       if (model_type_str == "llama") {
         model_types.llm_model_type = ModelType::LLAMA;
+      } else if (model_type_str == "llama2") {
+        model_types.llm_model_type = ModelType::LLAMA2;
       } else if (model_type_str == "opt") {
         model_types.llm_model_type = ModelType::OPT;
+      } else if (model_type_str == "falcon") {
+        model_types.llm_model_type = ModelType::FALCON;
       } else {
         model_types.llm_model_type = ModelType::UNKNOWN;
       }
@@ -80,8 +85,12 @@ void parse_input_args(char **argv,
                      [](unsigned char c) { return std::tolower(c); });
       if (model_type_str == "llama") {
         model_types.ssm_model_types.push_back(ModelType::LLAMA);
+      } else if (model_type_str == "llama2") {
+        model_types.ssm_model_types.push_back(ModelType::LLAMA2);
       } else if (model_type_str == "opt") {
         model_types.ssm_model_types.push_back(ModelType::OPT);
+      } else if (model_type_str == "falcon") {
+        model_types.ssm_model_types.push_back(ModelType::FALCON);
       } else {
         model_types.ssm_model_types.push_back(ModelType::UNKNOWN);
       }
@@ -185,7 +194,8 @@ void FlexFlow::top_level_task(Task const *task,
 
   // Create LLM model
   FFModel tree_model(ffconfig, ffconfig.cpu_offload);
-  if (model_types.llm_model_type == ModelType::LLAMA) {
+  if (model_types.llm_model_type == ModelType::LLAMA ||
+      model_types.llm_model_type == ModelType::LLAMA2) {
     LLAMA::create_llama_model(tree_model,
                               file_paths.llm_config_file_path,
                               file_paths.llm_weight_file_path,
@@ -198,6 +208,12 @@ void FlexFlow::top_level_task(Task const *task,
                           file_paths.llm_weight_file_path,
                           TREE_VERIFY_MODE,
                           use_full_precision);
+  } else if (model_types.llm_model_type == ModelType::FALCON) {
+    FALCON::create_falcon_model(tree_model,
+                                file_paths.llm_config_file_path,
+                                file_paths.llm_weight_file_path,
+                                TREE_VERIFY_MODE,
+                                use_full_precision);
   } else {
     assert(false && "Invalid LLM model type passed (or no type was passed).");
   }
@@ -216,7 +232,8 @@ void FlexFlow::top_level_task(Task const *task,
 
   for (int ssm_id = 0; ssm_id < num_ssms; ssm_id++) {
     FFModel &beam_model = ssm_models[ssm_id];
-    if (model_types.ssm_model_types[ssm_id] == ModelType::LLAMA) {
+    if (model_types.ssm_model_types[ssm_id] == ModelType::LLAMA ||
+        model_types.ssm_model_types[ssm_id] == ModelType::LLAMA2) {
       LLAMA::create_llama_model(beam_model,
                                 file_paths.ssm_config_file_paths[ssm_id],
                                 file_paths.ssm_weight_file_paths[ssm_id],
@@ -229,6 +246,12 @@ void FlexFlow::top_level_task(Task const *task,
                             file_paths.ssm_weight_file_paths[ssm_id],
                             BEAM_SEARCH_MODE,
                             use_full_precision);
+    } else if (model_types.ssm_model_types[ssm_id] == ModelType::FALCON) {
+      FALCON::create_falcon_model(beam_model,
+                                  file_paths.ssm_config_file_paths[ssm_id],
+                                  file_paths.ssm_weight_file_paths[ssm_id],
+                                  BEAM_SEARCH_MODE,
+                                  use_full_precision);
     } else {
       assert(false && "Invalid SSM model type passed.");
     }
diff --git a/inference/utils/download_falcon_weights.py b/inference/utils/download_falcon_weights.py
new file mode 100644
index 0000000000..a9a094f327
--- /dev/null
+++ b/inference/utils/download_falcon_weights.py
@@ -0,0 +1,45 @@
+# from transformer import RWForCausalLM
+# from configuration_RW import RWConfig
+from transformers import AutoModel
+import torch
+from transformers import AutoModelForCausalLM
+model = AutoModelForCausalLM.from_pretrained("tiiuae/falcon-7b", trust_remote_code=True)
+# model = AutoModel.from_pretrained("tiiuae/falcon-7b", trust_remote_code=True)
+
+
+# model = RWForCausalLM.from_pretrained("tiiuae/falcon-7b")
+# print(model.config)
+
+#lm_head
+lm_head_weight = model.lm_head.weight
+lm_head_weight.detach().cpu().numpy().tofile('/home/ubuntu/FlexFlow/inference/weights/falcon_7B_weights_new/lm_head_weight')
+
+for name, params in model.named_parameters():
+    name = (
+        name.replace("h.", "layers_")
+        .replace(".", "_").replace("word_embeddings", "tok_embeddings")
+        .replace("self_attn", "attention").replace("transformer_", "").replace("self_attention_dense", "attention_wo"))
+    # name = (
+    #     name.replace("h.", "layers_")
+    #     .replace(".", "_").replace("word_embeddings", "tok_embeddings")
+    #     .replace("self_attn", "attention").replace("transformer_", ""))
+
+    print(name)
+    print(params.shape)
+    
+    #split q, k, v
+    if "self_attention_query_key_value" in name:
+        name_q = name.replace("self_attention_query_key_value", "attention_wq")
+        name_k = name.replace("self_attention_query_key_value", "attention_wk")
+        name_v = name.replace("self_attention_query_key_value", "attention_wv")
+        q, k, v = torch.split(params, [4544, 64, 64], 0)
+        print(q.shape)
+        print(k.shape)
+        print(v.shape)
+        q.detach().cpu().numpy().tofile('/home/ubuntu/FlexFlow/inference/weights/falcon_7B_weights_new/' + name_q)
+        k.detach().cpu().numpy().tofile('/home/ubuntu/FlexFlow/inference/weights/falcon_7B_weights_new/' + name_k)
+        v.detach().cpu().numpy().tofile('/home/ubuntu/FlexFlow/inference/weights/falcon_7B_weights_new/' + name_v)
+    
+    else:
+       params.detach().cpu().numpy().tofile('/home/ubuntu/FlexFlow/inference/weights/falcon_7B_weights_new/' + name)
+
diff --git a/python/flexflow/core/flexflow_cffi.py b/python/flexflow/core/flexflow_cffi.py
index db36090587..55ece74bc1 100644
--- a/python/flexflow/core/flexflow_cffi.py
+++ b/python/flexflow/core/flexflow_cffi.py
@@ -451,13 +451,6 @@ class TreeIncMultiHeadSelfAttention(Op):
   def __init__(self, handle, idx=None, name=None):
     super(TreeIncMultiHeadSelfAttention, self).__init__(handle, idx, name)
 
-# -----------------------------------------------------------------------
-# Multi-query Incremental MultiHeadAttention
-# -----------------------------------------------------------------------
-class IncMultiQuerySelfAttention(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(IncMultiQuerySelfAttention, self).__init__(handle, idx, name)
-
 # -----------------------------------------------------------------------
 # RMS Norm
 # -----------------------------------------------------------------------
@@ -579,8 +572,6 @@ def convert_op_handle_to_op(op_type, handle, idx=None, name=None):
     return SpecIncMultiHeadSelfAttention(handle, idx, name)
   elif op_type == OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION:
     return TreeIncMultiHeadSelfAttention(handle, idx, name)
-  elif op_type == OpType.INC_MULTIQUERY_SELF_ATTENTION:
-    return IncMultiQuerySelfAttention(handle, idx, name)
   elif op_type == OpType.RMS_NORM:
     return RMSNorm(handle, idx, name)
   elif op_type == OpType.ARG_TOPK:
@@ -2107,7 +2098,7 @@ def multihead_attention(self, query, key, value,
     return Tensor(handle, owner_op_type=OpType.MULTIHEAD_ATTENTION)
   
   def inc_multihead_attention(self, input, 
-                              embed_dim, num_heads, 
+                              embed_dim, num_heads, num_kv_heads,
                               kdim=0, vdim=0, dropout=0.0, 
                               bias=True, add_bias_kv=False, add_zero_attn=False, 
                               data_type=DataType.DT_NONE, kernel_initializer=None, 
@@ -2170,12 +2161,12 @@ def inc_multihead_attention(self, input,
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
     c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc.flexflow_model_add_inc_multihead_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
+    handle = ffc.flexflow_model_add_inc_multihead_attention(self.handle, input.handle, embed_dim, num_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
     self.add_layer(OpType.INC_MULTIHEAD_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.INC_MULTIHEAD_ATTENTION)
   
   def spec_inc_multihead_attention(self, input, 
-                                   embed_dim, num_heads, 
+                                   embed_dim, num_heads, num_kv_heads,
                                    kdim=0, vdim=0, dropout=0.0, 
                                    bias=True, add_bias_kv=False, add_zero_attn=False, 
                                    data_type=DataType.DT_NONE, kernel_initializer=None, 
@@ -2238,12 +2229,12 @@ def spec_inc_multihead_attention(self, input,
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
     c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc.flexflow_model_add_spec_inc_multihead_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
+    handle = ffc.flexflow_model_add_spec_inc_multihead_attention(self.handle, input.handle, embed_dim, num_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
     self.add_layer(OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION)
   
   def inc_multihead_self_attention_verify(self, input, 
-                                          embed_dim, num_heads, 
+                                          embed_dim, num_heads, num_kv_heads,
                                           kdim=0, vdim=0, dropout=0.0, 
                                           bias=True, add_bias_kv=False, add_zero_attn=False, 
                                           data_type=DataType.DT_NONE, kernel_initializer=None, 
@@ -2306,63 +2297,10 @@ def inc_multihead_self_attention_verify(self, input,
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
     c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc.flexflow_model_add_inc_multihead_self_attention_verify(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
+    handle = ffc.flexflow_model_add_inc_multihead_self_attention_verify(self.handle, input.handle, embed_dim, num_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
     self.add_layer(OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION)
   
-  def inc_multiquery_self_attention(self, input, 
-                                          embed_dim, num_heads, 
-                                          kdim=0, vdim=0, dropout=0.0, 
-                                          bias=False, add_bias_kv=False, add_zero_attn=False, 
-                                          data_type=DataType.DT_NONE, kernel_initializer=None, 
-                                          name=None):
-    """Defines the Multi-query self attention operation
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-
-    :param embed_dim: total dimension of the model
-    :type embed_dim: int
-                          
-    :param num_heads: Number of attention heads.
-    :type num_heads: int
-                          
-    :param kdim: total number of features in key. Default is 0
-    :type kdim: int
-                          
-    :param vdim: total number of features in value. Default is 0
-    :type vdim: int
-                          
-    :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
-    :type dropout: float(0-1)
-                          
-    :param bias: Whether the dense layers use bias vectors. Default is True.
-    :type bias: bool
-                          
-    :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
-    :type add_bias_kv: bool
-                          
-    :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
-    :type add_zero_attn: bool
-
-    :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
-    :type data_type: DataType
-    
-    :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
-    :type kernel_initializer: Initializer
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """     
-    c_name = get_c_name(name)                 
-    kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-    c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc.flexflow_model_add_inc_multiquery_self_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, c_name)
-    self.add_layer(OpType.INC_MULTIQUERY_SELF_ATTENTION, name)
-    return Tensor(handle, owner_op_type=OpType.INC_MULTIQUERY_SELF_ATTENTION)
-  
   def rms_norm(self, input, eps, dim, name=None):
     """Defines the RMS Norm layer.
              
diff --git a/python/flexflow/serve/models/falcon.py b/python/flexflow/serve/models/falcon.py
index eeee0ba19d..81f80474dd 100644
--- a/python/flexflow/serve/models/falcon.py
+++ b/python/flexflow/serve/models/falcon.py
@@ -94,10 +94,11 @@ def build_model(self):
             )
 
             if self.mode == InferenceMode.INC_DECODING_MODE:
-                mha = ffmodel.inc_multiquery_self_attention(
+                mha = ffmodel.inc_multihead_self_attention(
                     att_norm,
                     self.falcon_config.hidden_size,
                     self.falcon_config.n_head,
+                    1,
                     self.falcon_config.hidden_size // self.falcon_config.n_head,
                     self.falcon_config.hidden_size // self.falcon_config.n_head,
                     0.0,  # dropout
diff --git a/python/flexflow/serve/models/llama.py b/python/flexflow/serve/models/llama.py
index 13245af6ff..3c83905d61 100644
--- a/python/flexflow/serve/models/llama.py
+++ b/python/flexflow/serve/models/llama.py
@@ -92,6 +92,7 @@ def build_model(self):
                     attn_norm,
                     self.llama_config.hidden_size,
                     self.llama_config.num_attention_heads,
+                    self.llama_config.num_attention_heads,
                     self.llama_config.hidden_size
                     // self.llama_config.num_attention_heads,
                     self.llama_config.hidden_size
@@ -110,6 +111,7 @@ def build_model(self):
                     attn_norm,
                     self.llama_config.hidden_size,
                     self.llama_config.num_attention_heads,
+                    self.llama_config.num_attention_heads,
                     self.llama_config.hidden_size
                     // self.llama_config.num_attention_heads,
                     self.llama_config.hidden_size
@@ -128,6 +130,7 @@ def build_model(self):
                     attn_norm,
                     self.llama_config.hidden_size,
                     self.llama_config.num_attention_heads,
+                    self.llama_config.num_attention_heads,
                     self.llama_config.hidden_size
                     // self.llama_config.num_attention_heads,
                     self.llama_config.hidden_size
diff --git a/python/flexflow/serve/models/opt.py b/python/flexflow/serve/models/opt.py
index d7d89f5fda..deb7a304ff 100644
--- a/python/flexflow/serve/models/opt.py
+++ b/python/flexflow/serve/models/opt.py
@@ -118,6 +118,7 @@ def build_model(self):
                     hidden_states,
                     self.opt_config.hidden_size,
                     self.opt_config.num_attention_heads,
+                    self.opt_config.num_attention_heads,
                     self.opt_config.hidden_size // self.opt_config.num_attention_heads,
                     self.opt_config.hidden_size // self.opt_config.num_attention_heads,
                     0.0,  # dropout
@@ -138,6 +139,7 @@ def build_model(self):
                     hidden_states,
                     self.opt_config.hidden_size,
                     self.opt_config.num_attention_heads,
+                    self.opt_config.num_attention_heads,
                     self.opt_config.hidden_size // self.opt_config.num_attention_heads,
                     self.opt_config.hidden_size // self.opt_config.num_attention_heads,
                     0.0,  # dropout
@@ -158,6 +160,7 @@ def build_model(self):
                     hidden_states,
                     self.opt_config.hidden_size,
                     self.opt_config.num_attention_heads,
+                    self.opt_config.num_attention_heads,
                     self.opt_config.hidden_size // self.opt_config.num_attention_heads,
                     self.opt_config.hidden_size // self.opt_config.num_attention_heads,
                     0.0,  # dropout
diff --git a/python/flexflow/serve/serve.py b/python/flexflow/serve/serve.py
index d1f13e17de..a6723b38a2 100644
--- a/python/flexflow/serve/serve.py
+++ b/python/flexflow/serve/serve.py
@@ -227,8 +227,10 @@ def __load_hf_weights(self):
         self.fileloader = FileDataLoader(
             self.weights_path,
             self.hf_config.num_attention_heads,
+            self.hf_config.num_attention_heads,
             self.hf_config.hidden_size,
             self.hf_config.hidden_size // self.hf_config.num_attention_heads,
+            self.ffconfig.tensor_parallelism_degree,
         )
 
         model_layers_with_weights = self.model.get_layers_with_weights()
diff --git a/python/flexflow/type.py b/python/flexflow/type.py
index 94a0b6085c..137c8a872a 100644
--- a/python/flexflow/type.py
+++ b/python/flexflow/type.py
@@ -75,8 +75,9 @@ class InferenceMode(Enum):
 class ModelType(Enum):
     UNKNOWN = 3001
     LLAMA = 3002
-    OPT = 3003
-    FALCON = 3004
+    LLAMA2 = 3003
+    OPT = 3004
+    FALCON = 3005
 
 
 class OpType(Enum):
@@ -118,7 +119,6 @@ class OpType(Enum):
     INC_MULTIHEAD_ATTENTION = 2061
     SPEC_INC_MULTIHEAD_SELF_ATTENTION = 2062
     TREE_INC_MULTIHEAD_SELF_ATTENTION = 2063
-    INC_MULTIQUERY_SELF_ATTENTION = 2064
     SAMPLING = 2065
     ARGMAX = 2066
     GETITEM = 2070
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index c210836d9b..788b95bfcc 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -1054,6 +1054,7 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_attention(
     const flexflow_tensor_t input_,
     int embed_dim,
     int num_heads,
+    int num_kv_heads,
     int kdim,
     int vdim,
     float dropout,
@@ -1074,6 +1075,7 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_attention(
   Tensor tensor = handle->inc_multihead_self_attention(input,
                                                        embed_dim,
                                                        num_heads,
+                                                       num_kv_heads,
                                                        kdim,
                                                        vdim,
                                                        dropout,
@@ -1095,6 +1097,7 @@ flexflow_tensor_t flexflow_model_add_spec_inc_multihead_attention(
     const flexflow_tensor_t input_,
     int embed_dim,
     int num_heads,
+    int num_kv_heads,
     int kdim,
     int vdim,
     float dropout,
@@ -1116,6 +1119,7 @@ flexflow_tensor_t flexflow_model_add_spec_inc_multihead_attention(
       handle->spec_inc_multihead_self_attention(input,
                                                 embed_dim,
                                                 num_heads,
+                                                num_kv_heads,
                                                 kdim,
                                                 vdim,
                                                 dropout,
@@ -1137,6 +1141,7 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention_verify(
     const flexflow_tensor_t input_,
     int embed_dim,
     int num_heads,
+    int num_kv_heads,
     int kdim,
     int vdim,
     float dropout,
@@ -1158,6 +1163,7 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention_verify(
       handle->inc_multihead_self_attention_verify(input,
                                                   embed_dim,
                                                   num_heads,
+                                                  num_kv_heads,
                                                   kdim,
                                                   vdim,
                                                   dropout,
@@ -1174,40 +1180,6 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention_verify(
   return FFCObjectWrapper::wrap(tensor);
 }
 
-flexflow_tensor_t flexflow_model_add_inc_multiquery_self_attention(
-    flexflow_model_t handle_,
-    const flexflow_tensor_t input_,
-    int embed_dim,
-    int num_heads,
-    int kdim,
-    int vdim,
-    float dropout,
-    bool bias,
-    bool add_bias_kv,
-    bool add_zero_attn,
-    enum DataType data_type,
-    flexflow_initializer_t kernel_initializer_,
-    char const *name) {
-  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
-  Tensor input = FFCObjectWrapper::unwrap(input_);
-  Initializer *kernel_initializer =
-      FFCObjectWrapper::unwrap(kernel_initializer_);
-  Tensor tensor =
-      handle->inc_multihead_self_attention_verify(input,
-                                                  embed_dim,
-                                                  num_heads,
-                                                  kdim,
-                                                  vdim,
-                                                  dropout,
-                                                  bias,
-                                                  add_bias_kv,
-                                                  add_zero_attn,
-                                                  data_type,
-                                                  kernel_initializer,
-                                                  name);
-  return FFCObjectWrapper::wrap(tensor);
-}
-
 flexflow_tensor_t flexflow_model_add_rms_norm(flexflow_model_t handle_,
                                               const flexflow_tensor_t input_,
                                               float eps,
@@ -2334,13 +2306,20 @@ void flexflow_inference_manager_init_operators_inference(
 flexflow_file_data_loader_t
     flexflow_file_data_loader_create(char const *weight_file_path,
                                      int num_heads,
+                                     int num_kv_heads,
                                      int hidden_dim,
-                                     int qkv_inner_dim) {
+                                     int qkv_inner_dim,
+                                     int tensor_partition_num) {
   assert(weight_file_path != nullptr &&
          "Cannot convert nullptr char * to std::string");
   std::string const weight_file_path_str(weight_file_path);
-  FileDataLoader *handle = new FileDataLoader(
-      "", weight_file_path_str, num_heads, hidden_dim, qkv_inner_dim);
+  FileDataLoader *handle = new FileDataLoader("",
+                                              weight_file_path_str,
+                                              num_heads,
+                                              num_kv_heads,
+                                              hidden_dim,
+                                              qkv_inner_dim,
+                                              tensor_partition_num);
   DEBUG_PRINT("[FileDataLoader] new %p", handle);
   return FFCObjectWrapper::wrap(handle);
 }
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index aa2310b0f2..e3ee54f4a2 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -61,6 +61,7 @@ bool IncMultiHeadSelfAttentionParams::is_valid(
 Tensor FFModel::inc_multihead_self_attention(const Tensor input,
                                              int embed_dim,
                                              int num_heads,
+                                             int num_kv_heads,
                                              int kdim,
                                              int vdim,
                                              float dropout,
@@ -119,16 +120,19 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
   int kParas = kProjSize * kSize;
   int vParas = vProjSize * vSize;
   int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
+  int weight_size = qParas * num_heads + kParas * num_kv_heads +
+                    vParas * num_kv_heads + oParas * num_heads;
   int one_head_size = qParas + kParas + vParas + oParas;
+
   {
     // compress the weight size if quantization.
     if (quantization_type != DT_NONE) {
       one_head_size = get_quantization_to_byte_size(
           data_type, quantization_type, one_head_size);
     }
-    int dims[2] = {one_head_size, num_heads};
+    int dims[1] = {weight_size};
     li->weights[0] = create_weight_legion_ordering(
-        2,
+        1,
         dims,
         quantization_type == DT_NONE ? data_type : quantization_type,
         li,
@@ -138,7 +142,8 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
   }
   if (bias) {
     // q, k, v, o
-    int dims[1] = {(qProjSize + kProjSize + vProjSize) * num_heads + oProjSize};
+    int dims[1] = {qProjSize * num_heads +
+                   (kProjSize + vProjSize) * num_kv_heads + oProjSize};
     li->weights[1] = create_weight_legion_ordering(1,
                                                    dims,
                                                    data_type,
@@ -150,6 +155,7 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
   li->data_type = data_type;
   li->add_int_property("embed_dim", embed_dim);
   li->add_int_property("num_heads", num_heads);
+  li->add_int_property("num_kv_heads", num_kv_heads);
   li->add_int_property("kdim", kdim);
   li->add_int_property("vdim", vdim);
   li->add_int_property("bias", bias);
@@ -162,6 +168,8 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
   li->add_int_property("qk_prod_scaling", qk_prod_scaling);
   li->add_int_property("quantization_type", quantization_type);
   li->add_int_property("offload", offload);
+  li->add_int_property("tensor_parallelism_degree",
+                       config.tensor_parallelism_degree);
   layers.push_back(li);
 
   return li->outputs[0];
@@ -176,6 +184,8 @@ Op *IncMultiHeadSelfAttention::create_operator_from_layer(
   int embed_dim = value;
   layer->get_int_property("num_heads", value);
   int num_heads = value;
+  layer->get_int_property("num_kv_heads", value);
+  int num_kv_heads = value;
   layer->get_int_property("kdim", value);
   int kdim = value;
   layer->get_int_property("vdim", value);
@@ -200,12 +210,15 @@ Op *IncMultiHeadSelfAttention::create_operator_from_layer(
   DataType quantization_type = (DataType)value;
   layer->get_int_property("offload", value);
   bool offload = (bool)value;
+  layer->get_int_property("tensor_parallelism_degree", value);
+  int tensor_parallelism_degree = (int)value;
 
   return new IncMultiHeadSelfAttention(model,
                                        layer->layer_guid,
                                        inputs[0],
                                        embed_dim,
                                        num_heads,
+                                       num_kv_heads,
                                        kdim,
                                        vdim,
                                        dropout,
@@ -219,6 +232,7 @@ Op *IncMultiHeadSelfAttention::create_operator_from_layer(
                                        false /*allocate_weights*/,
                                        quantization_type,
                                        offload,
+                                       tensor_parallelism_degree,
                                        layer->name);
 }
 
@@ -228,6 +242,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     const ParallelTensor _input,
     int _embed_dim,
     int _num_heads,
+    int _num_kv_heads,
     int _kdim,
     int _vdim,
     float _dropout,
@@ -241,6 +256,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     bool allocate_weights,
     DataType _quantization_type,
     bool _offload,
+    int _tensor_parallelism_degree,
     char const *name)
     // Initializer* _bias_initializer)
     : Op(model,
@@ -251,8 +267,8 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
          (_bias ? 2 : 1), /*weights*/
          1 /*outputs*/,
          _input),
-      num_heads(_num_heads), dropout(_dropout), bias(_bias),
-      add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      num_heads(_num_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
+      bias(_bias), add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
       apply_rotary_embedding(_apply_rotary_embedding),
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
       vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
@@ -260,14 +276,16 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
       qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
       scaling_query(_scaling_query), scaling_factor(_scaling_factor),
       qk_prod_scaling(_qk_prod_scaling), quantization_type(_quantization_type),
-      offload(_offload) {
+      offload(_offload), tensor_parallelism_degree(_tensor_parallelism_degree) {
   // overwrite layer_guid
   layer_guid = _layer_guid;
   numOutputs = 1;
   int numdim = _input->num_dims;
   ParallelDim dims[MAX_TENSOR_DIM];
+  size_t x = 1;
   for (int i = 0; i < numdim; i++) {
     dims[i] = _input->dims[i];
+    x *= _input->dims[i].size;
   }
   dims[0].size = _embed_dim;
   // Currently require no parallelism along this dim
@@ -281,23 +299,21 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     int vParas = this->vProjSize * this->vSize;
     int oParas =
         this->oProjSize * (this->vProjSize > 0 ? this->vProjSize : this->vSize);
-    ParallelDim dims[3];
+    ParallelDim dims[2];
     dims[0] = inputs[0]->dims[num_dims - 2];
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
-    dims[1].size = this->num_heads;
+    dims[1].size = this->num_heads * (qParas + oParas) +
+                   this->num_kv_heads * (kParas + vParas);
     dims[1].is_replica_dim = false;
-    dims[2].size = qParas + kParas + vParas + oParas;
 
     if (quantization_type != DT_NONE) {
-      dims[2].size = get_quantization_to_byte_size(
-          data_type, quantization_type, dims[2].size);
+      dims[1].size = get_quantization_to_byte_size(
+          data_type, quantization_type, (qParas + kParas + vParas + oParas));
     }
-    dims[2].degree = 1;
-    dims[2].parallel_idx = -1;
     int seed = std::rand();
     Initializer *initializer = new GlorotUniform(seed);
-    weights[0] = model.create_parallel_weight<3>(
+    weights[0] = model.create_parallel_weight<2>(
         dims,
         quantization_type == DT_NONE ? this->data_type : quantization_type,
         nullptr /*owner_op*/,
@@ -306,8 +322,9 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
         CHOSEN_SYNC_TYPE);
     if (bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
-      bias_shape.dims[0].size =
-          (qProjSize + kProjSize + vProjSize) * num_heads + oProjSize;
+      bias_shape.dims[0].size = qProjSize * num_heads +
+                                (kProjSize + vProjSize) * num_kv_heads +
+                                oProjSize;
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
       weights[1] =
           model.create_parallel_weight_legion_ordering(bias_shape.num_dims,
@@ -335,6 +352,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     const ParallelTensor _weight,
     int _embed_dim,
     int _num_heads,
+    int _num_kv_heads,
     int _kdim,
     int _vdim,
     float _dropout,
@@ -348,6 +366,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     bool allocate_weights,
     DataType _quantization_type,
     bool _offload,
+    int _tensor_parallelism_degree,
     char const *name)
     // Initializer* _bias_initializer)
     : Op(model,
@@ -359,8 +378,8 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
          1 /*outputs*/,
          _input,
          _weight),
-      num_heads(_num_heads), dropout(_dropout), bias(_bias),
-      add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      num_heads(_num_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
+      bias(_bias), add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
       apply_rotary_embedding(_apply_rotary_embedding),
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
       vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
@@ -368,7 +387,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
       qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
       scaling_query(_scaling_query), scaling_factor(_scaling_factor),
       qk_prod_scaling(_qk_prod_scaling), quantization_type(_quantization_type),
-      offload(_offload)
+      offload(_offload), tensor_parallelism_degree(_tensor_parallelism_degree)
 // bias_initializer(_bias_initializer)
 {
   numOutputs = 1;
@@ -389,20 +408,22 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     int vParas = this->vProjSize * this->vSize;
     int oParas =
         this->oProjSize * (this->vProjSize > 0 ? this->vProjSize : this->vSize);
-    ParallelDim dims[3];
+    ParallelDim dims[2];
     dims[0] = inputs[0]->dims[num_dims - 2];
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
-    dims[1].size = this->num_heads;
+    dims[1].size = this->num_heads * (qParas + oParas) +
+                   this->num_kv_heads * (kParas + vParas);
     dims[1].is_replica_dim = false;
-    dims[2].size = qParas + kParas + vParas + oParas;
+    // dims[2].size = this->num_heads * (qParas + oParas) + this->num_kv_heads *
+    // (kParas + vParas);
     if (quantization_type != DT_NONE) {
-      dims[2].size = get_quantization_to_byte_size(
-          data_type, quantization_type, dims[2].size);
+      dims[1].size = get_quantization_to_byte_size(
+          data_type, quantization_type, (qParas + kParas + vParas + oParas));
     }
     int seed = std::rand();
     Initializer *initializer = new GlorotUniform(seed);
-    weights[0] = model.create_parallel_weight<3>(
+    weights[0] = model.create_parallel_weight<2>(
         dims,
         quantization_type == DT_NONE ? this->data_type : quantization_type,
         NULL /*owner_op*/,
@@ -411,8 +432,9 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
         CHOSEN_SYNC_TYPE);
     if (bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
-      bias_shape.dims[0].size =
-          (qProjSize + kProjSize + vProjSize) * num_heads + oProjSize;
+      bias_shape.dims[0].size = qProjSize * num_heads +
+                                (kProjSize + vProjSize) * num_kv_heads +
+                                oProjSize;
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
       weights[1] =
           model.create_parallel_weight_legion_ordering(bias_shape.num_dims,
@@ -447,6 +469,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
                                 input,
                                 other.oProjSize,
                                 other.num_heads,
+                                other.num_kv_heads,
                                 other.qProjSize,
                                 other.vProjSize,
                                 other.dropout,
@@ -460,6 +483,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
                                 allocate_weights,
                                 other.quantization_type,
                                 other.offload,
+                                other.tensor_parallelism_degree,
                                 other.name) {}
 
 IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
@@ -473,6 +497,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
                                 input,
                                 params.embed_dim,
                                 params.num_heads,
+                                params.num_kv_heads,
                                 params.kdim,
                                 params.vdim,
                                 params.dropout,
@@ -486,6 +511,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
                                 allocate_weights,
                                 params.quantization_type,
                                 params.offload,
+                                params.tensor_parallelism_degree,
                                 name) {}
 
 void IncMultiHeadSelfAttention::init_inference(
@@ -612,7 +638,9 @@ OpMeta *IncMultiHeadSelfAttention::init_task(
   int num_samples = input.domain.hi()[2] - input.domain.lo()[2] + 1;
   assert(attn->qoSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
   assert(attn->kvSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
-  int num_heads = weight.domain.hi()[1] - weight.domain.lo()[1] + 1;
+  int num_heads = attn->num_heads / attn->tensor_parallelism_degree;
+  int num_kv_heads = attn->num_kv_heads / attn->tensor_parallelism_degree;
+
   assert(attn->oProjSize == output.domain.hi()[0] - output.domain.lo()[0] + 1);
 
   Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
@@ -626,8 +654,14 @@ OpMeta *IncMultiHeadSelfAttention::init_task(
     gpu_mem_allocator.register_reserved_work_space(
         handle.offload_reserve_space, handle.offload_reserve_space_size);
   }
-  IncMultiHeadSelfAttentionMeta *m = new IncMultiHeadSelfAttentionMeta(
-      handle, attn, weight, gpu_mem_allocator, num_samples, num_heads);
+  IncMultiHeadSelfAttentionMeta *m =
+      new IncMultiHeadSelfAttentionMeta(handle,
+                                        attn,
+                                        weight,
+                                        gpu_mem_allocator,
+                                        num_samples,
+                                        num_heads,
+                                        num_kv_heads);
   if (handle.offload_reserve_space == nullptr) {
     // assert that we didn't over allocate memory
     assert(gpu_mem_allocator.reserved_allocated_size ==
@@ -761,7 +795,7 @@ void IncMultiHeadSelfAttention::inference_task(
       ctx, task->regions[2].region.get_index_space());
 
   assert(input_domain.get_dim() == 4);
-  assert(weight_domain.get_dim() == 3);
+  assert(weight_domain.get_dim() == 2);
   assert(output_domain.get_dim() == 4);
 
   assert(task->index_point.get_dim() == 1);
@@ -1576,8 +1610,10 @@ IncMultiHeadSelfAttentionParams IncMultiHeadSelfAttention::get_params() const {
   params.scaling_query = this->scaling_query;
   params.scaling_factor = this->scaling_factor;
   params.qk_prod_scaling = this->qk_prod_scaling;
+  params.tensor_parallelism_degree = this->tensor_parallelism_degree,
   params.quantization_type = this->quantization_type;
   params.offload = this->offload;
+  params.num_kv_heads = this->num_kv_heads;
 
   return params;
 }
@@ -1591,6 +1627,7 @@ size_t hash<FlexFlow::IncMultiHeadSelfAttentionParams>::operator()(
   hash_combine(key, params.layer_guid.id);
   hash_combine(key, params.embed_dim);
   hash_combine(key, params.num_heads);
+  hash_combine(key, params.num_kv_heads);
   hash_combine(key, params.kdim);
   hash_combine(key, params.vdim);
   hash_combine(key, params.dropout);
@@ -1603,6 +1640,7 @@ size_t hash<FlexFlow::IncMultiHeadSelfAttentionParams>::operator()(
   hash_combine(key, params.qk_prod_scaling);
   hash_combine(key, params.quantization_type);
   hash_combine(key, params.offload);
+  hash_combine(key, params.tensor_parallelism_degree);
   return key;
 }
 }; // namespace std
diff --git a/src/ops/inc_multihead_self_attention.cpp b/src/ops/inc_multihead_self_attention.cpp
index 9fce37fc30..c68df398df 100644
--- a/src/ops/inc_multihead_self_attention.cpp
+++ b/src/ops/inc_multihead_self_attention.cpp
@@ -64,7 +64,8 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     GenericTensorAccessorR const &weight,
     MemoryAllocator &gpu_mem_allocator,
     int num_samples,
-    int _num_heads)
+    int _num_heads,
+    int _num_kv_heads)
     : OpMeta(handler, attn) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
@@ -92,7 +93,9 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     MemoryAllocator &gpu_mem_allocator,
     int num_samples,
     int _global_num_heads,
+    int _global_num_kv_heads,
     int _num_heads,
+    int _num_kv_heads,
     DataType _quantization_type,
     bool _offload)
     : OpMeta(handler, attn) {
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index f5b72b9ac8..a014b684f3 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -30,34 +30,14 @@ using Legion::Memory;
 namespace Kernels {
 namespace IncMultiHeadAttention {
 
-template <typename DT>
-__global__ void build_w_out_tensor(DT const *weight_ptr,
-                                   DT *contiguous_weight_ptr,
-                                   int vProjSize,
-                                   int oProjSize,
-                                   int num_heads,
-                                   int qkv_weight_block_size) {
-  CUDA_KERNEL_LOOP(i, vProjSize * oProjSize * num_heads) {
-    // Each slice (one per head) in the weight_ptr has shape (oProjSize,
-    // vProjSize)
-    int row_idx = i % oProjSize;
-    int col_idx = (i / oProjSize) % vProjSize;
-    int head_idx = i / (oProjSize * vProjSize);
-    // The contiguous_weight_ptr has shape (vProjSize * num_heads, oProjSize)
-    int idx = row_idx * vProjSize * num_heads + vProjSize * head_idx + col_idx;
-    contiguous_weight_ptr[idx] =
-        weight_ptr[(qkv_weight_block_size + vProjSize * oProjSize) * head_idx +
-                   qkv_weight_block_size + col_idx * oProjSize + row_idx];
-  }
-}
-
 template <typename DT>
 __global__ void apply_proj_bias_w(DT *input_ptr,
                                   DT const *bias_ptr,
                                   int num_tokens,
+                                  int qkv_weight_size,
                                   int oProjSize) {
   CUDA_KERNEL_LOOP(i, num_tokens * oProjSize) {
-    int bias_idx = 3 * oProjSize + i % oProjSize;
+    int bias_idx = qkv_weight_size + i % oProjSize;
     input_ptr[i] += bias_ptr[bias_idx];
   }
 }
@@ -71,60 +51,144 @@ __global__ void apply_proj_bias_qkv(DT *input_ptr,
                                     int kProjSize,
                                     int vProjSize,
                                     int global_num_heads,
+                                    int global_num_kv_heads,
                                     int num_heads,
+                                    int num_kv_heads,
                                     bool scaling_query,
                                     float scaling_factor) {
-  CUDA_KERNEL_LOOP(
-      i, num_tokens * (qProjSize + kProjSize + vProjSize) * num_heads) {
+  CUDA_KERNEL_LOOP(i,
+                   num_tokens *
+                       (qProjSize * num_heads + kProjSize * num_kv_heads +
+                        vProjSize * num_kv_heads)) {
     // for simplicity, assume q, k, v is in same shape
     // 0->q, 1->k, 2->v
-    int qkv_index = i / (num_tokens * qProjSize) % 3;
+    // int qkv_index = i / (num_tokens * qProjSize) % 3;
+
+    int qkv_index = i < num_tokens * qProjSize * num_heads
+                        ? 0
+                        : (i < num_tokens * (qProjSize * num_heads +
+                                             kProjSize * num_kv_heads)
+                               ? 1
+                               : 2);
+
+    // int head_idx = i / (num_tokens * (qProjSize + kProjSize + vProjSize));
+    // int qkv_block_size = (qProjSize + kProjSize + vProjSize) * num_tokens;
+    int q_block_size = qProjSize * num_tokens * num_heads;
+    int k_block_size = kProjSize * num_tokens * num_kv_heads;
+
+    // int idx = i % (num_tokens * (qProjSize));
+
+    // int real_part_index =
+    //     head_idx * qkv_block_size + qkv_index * q_block_size + idx;
+    int bias_idx = 0;
+    if (qkv_index == 0) {
+      int head_idx = i / (num_tokens * qProjSize);
+      int global_head_idx = head_idx + shard_id * num_heads;
+      int global_i = i + shard_id * num_heads * num_tokens * qProjSize;
+      bias_idx = global_head_idx * qProjSize +
+                 (global_i % (num_tokens * (qProjSize)) % qProjSize);
+    } else {
 
-    int head_idx = i / (num_tokens * (qProjSize + kProjSize + vProjSize));
-    int qkv_block_size = (qProjSize + kProjSize + vProjSize) * num_tokens;
-    int q_block_size = qProjSize * num_tokens;
+      int idx =
+          qkv_index == 1 ? i - q_block_size : i - q_block_size - k_block_size;
+      int pre_length = qkv_index == 1 ? qProjSize * global_num_heads
+                                      : qProjSize * global_num_heads +
+                                            kProjSize * global_num_kv_heads;
 
-    int idx = i % (num_tokens * (qProjSize));
+      int head_idx = idx / (num_tokens * kProjSize);
+      int global_head_idx = head_idx + shard_id * num_kv_heads;
+      int global_idx = idx + shard_id * num_tokens * num_kv_heads * kProjSize;
 
-    int real_part_index =
-        head_idx * qkv_block_size + qkv_index * q_block_size + idx;
+      bias_idx = pre_length + global_head_idx * kProjSize +
+                 (global_idx % (num_tokens * (qProjSize)) % qProjSize);
+    }
+    // int bias_idx = qkv_index * qProjSize * global_num_heads +
+    //                global_head_idx * qProjSize + (idx % qProjSize);
 
-    int global_head_idx = head_idx + shard_id * num_heads;
-    int bias_idx = qkv_index * qProjSize * global_num_heads +
-                   global_head_idx * qProjSize + (idx % qProjSize);
-    input_ptr[real_part_index] += bias_ptr[bias_idx];
+    input_ptr[i] += bias_ptr[bias_idx];
 
     if (scaling_query && qkv_index == 0) {
-      input_ptr[real_part_index] *= scaling_factor;
+      input_ptr[i] *= scaling_factor;
     }
   }
 }
 
 template <typename DT>
 __global__ void
-    apply_rotary_embedding(DT *input_ptr,
-                           cuFloatComplex *complex_input,
-                           BatchConfig::PerTokenInfo const *tokenInfos,
-                           int qProjSize,
-                           int kProjSize,
-                           int num_heads,
-                           int num_tokens,
-                           int q_block_size,
-                           int k_block_size,
-                           int v_block_size,
-                           bool q_tensor) {
-  int proj_size = q_tensor ? qProjSize : kProjSize;
-  CUDA_KERNEL_LOOP(i, num_tokens * proj_size * num_heads / 2) {
+    apply_rotary_embedding_native(DT *input_ptr,
+                                  cuFloatComplex *complex_input,
+                                  BatchConfig::PerTokenInfo const *tokenInfos,
+                                  int qProjSize,
+                                  int kProjSize,
+                                  int num_heads,
+                                  int num_tokens,
+                                  int num_kv_heads,
+                                  int q_block_size,
+                                  int k_block_size,
+                                  int q_array_size) {
+  CUDA_KERNEL_LOOP(
+      i, num_tokens * (qProjSize * num_heads + kProjSize * num_kv_heads) / 2) {
+    // create complex number
+    bool q_tensor = i < (q_array_size / 2);
+    int proj_size = q_tensor ? qProjSize : kProjSize;
+    int real_i = q_tensor ? i : i - q_array_size / 2;
+
+    int head_idx = real_i / (num_tokens * proj_size / 2);
+    int idx = real_i % (num_tokens * proj_size / 2);
+    int real_part_index = idx * 2 +
+                          head_idx * (q_tensor ? q_block_size : k_block_size) +
+                          (q_tensor ? 0 : q_array_size);
+
+    int complex_part_index = real_part_index + 1;
+
+    complex_input[i] = {input_ptr[real_part_index],
+                        input_ptr[complex_part_index]};
+
+    int token_idx =
+        (real_i - head_idx * (num_tokens * proj_size / 2)) / (proj_size / 2);
+    size_t pos = tokenInfos[token_idx].abs_depth_in_request;
+
+    // float before_real = complex_input[i].x, before_complex =
+    // complex_input[i].y;
+
+    int pos_i = real_i % (proj_size / 2);
+    float freq = pos * (1.0 / pow(10000.0, (float)2 * pos_i / proj_size));
+    cuFloatComplex complex_pos = {cos(freq), sin(freq)};
+
+    complex_input[i] = cuCmulf(complex_input[i], complex_pos);
+    input_ptr[real_part_index] = complex_input[i].x;
+    input_ptr[complex_part_index] = complex_input[i].y;
+  }
+}
+
+template <typename DT>
+__global__ void
+    apply_rotary_embedding_hf(DT *input_ptr,
+                              cuFloatComplex *complex_input,
+                              BatchConfig::PerTokenInfo const *tokenInfos,
+                              int qProjSize,
+                              int kProjSize,
+                              int num_heads,
+                              int num_tokens,
+                              int num_kv_heads,
+                              int q_block_size,
+                              int k_block_size,
+                              int q_array_size) {
+  CUDA_KERNEL_LOOP(
+      i, num_tokens * (qProjSize * num_heads + kProjSize * num_kv_heads) / 2) {
     // create complex number
-    int head_idx = i / (num_tokens * proj_size / 2);
-    int idx = i % (num_tokens * proj_size / 2);
+    bool q_tensor = i < (q_array_size / 2);
+    int proj_size = q_tensor ? qProjSize : kProjSize;
+    int real_i = q_tensor ? i : i - q_array_size / 2;
+
+    int head_idx = real_i / (num_tokens * proj_size / 2);
+    int idx = real_i % (num_tokens * proj_size / 2);
     int token_idx =
-        (i - head_idx * (num_tokens * proj_size / 2)) / (proj_size / 2);
+        (real_i - head_idx * (num_tokens * proj_size / 2)) / (proj_size / 2);
 
-    int real_part_index =
-        idx + token_idx * (proj_size / 2) +
-        head_idx * (q_block_size + k_block_size + v_block_size) +
-        (q_tensor ? 0 : q_block_size);
+    int real_part_index = idx + token_idx * (proj_size / 2) +
+                          head_idx * (q_tensor ? q_block_size : k_block_size) +
+                          (q_tensor ? 0 : q_array_size);
     int complex_part_index = real_part_index + (proj_size / 2);
 
     complex_input[i] = {input_ptr[real_part_index],
@@ -135,19 +199,16 @@ __global__ void
     // multiple with input & /copy back to q/k
 
     // get position of token
-    //  int head_idx = i / (num_tokens * proj_size);
 
     // size_t pos = id_map[token_idx].token_position;
     size_t pos = tokenInfos[token_idx].abs_depth_in_request;
 
     // float before_real = complex_input[i].x, before_complex =
-    // complex_input[i].y;
-    int pos_i = i % (proj_size / 2);
+    int pos_i = real_i % (proj_size / 2);
     float freq = pos * (1.0 / pow(10000.0, (float)2 * pos_i / proj_size));
     cuFloatComplex complex_pos = {cos(freq), sin(freq)};
 
     complex_input[i] = cuCmulf(complex_input[i], complex_pos);
-
     input_ptr[real_part_index] = complex_input[i].x;
     input_ptr[complex_part_index] = complex_input[i].y;
   }
@@ -184,18 +245,18 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
   assert(m_q == m_k && m_k == m_v); // keep things simple for now
   int n = bc->num_active_tokens();
   int k = m->qSize;
-  int lda = k, ldb = k, ldc_q = m_q, ldc_k = m_k, ldc_v = m_v;
-  size_t strideA =
-      m->weights_params; // need to also skip over all the parameters for each
-                         // head, plus the unused W_o weights
-  size_t strideB = 0;    // input stays the same for all heads.
-  size_t strideC =
-      (m_q + m_k + m_v) * n; // size of the output block for each head.
-  // Q
+  int m_ = m_q;
+  int lda = k, ldb = k, ldc = m_q;
+
+  size_t strideA = m_q * k; // query weight head size
+  size_t strideB = 0;       // input stays the same for all heads.
+  size_t strideC = m_q * n; // size of the output block for each head.
+
+  // compute QKV
   checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                        CUBLAS_OP_T,
                                        CUBLAS_OP_N,
-                                       m_q,
+                                       m_,
                                        n,
                                        k,
                                        &alpha,
@@ -210,67 +271,20 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                        &beta,
                                        output_ptr,
                                        cublas_data_type,
-                                       ldc_q,
+                                       ldc,
                                        strideC,
-                                       m->num_heads,
+                                       m->num_heads + m->num_kv_heads +
+                                           m->num_kv_heads,
                                        compute_type,
                                        CUBLAS_GEMM_DEFAULT_TENSOR_OP));
 
-  checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                       CUBLAS_OP_T,
-                                       CUBLAS_OP_N,
-                                       m_k,
-                                       n,
-                                       k,
-                                       &alpha,
-                                       weight_ptr + m_q * k,
-                                       cublas_data_type,
-                                       lda,
-                                       strideA,
-                                       input_ptr,
-                                       cublas_data_type,
-                                       ldb,
-                                       strideB,
-                                       &beta,
-                                       output_ptr + m_q * n,
-                                       cublas_data_type,
-                                       ldc_k,
-                                       strideC,
-                                       m->num_heads,
-                                       compute_type,
-                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-  // V
-  checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                       CUBLAS_OP_T,
-                                       CUBLAS_OP_N,
-                                       m_v,
-                                       n,
-                                       k,
-                                       &alpha,
-                                       weight_ptr + (m_q + m_k) * k,
-                                       cublas_data_type,
-                                       lda,
-                                       strideA,
-                                       input_ptr,
-                                       cublas_data_type,
-                                       ldb,
-                                       strideB,
-                                       &beta,
-                                       output_ptr + (m_q + m_k) * n,
-                                       cublas_data_type,
-                                       ldc_v,
-                                       strideC,
-                                       m->num_heads,
-                                       compute_type,
-                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-
-  // apply rotary emmmbedding for k and v
+  // apply rotary emmmbedding for q and k
   // step1 change the k, v to complex tensor
   int num_tokens = bc->num_active_tokens();
   int parallelism = m->kProjSize * num_tokens * m->num_heads;
   int q_block_size = m->qProjSize * num_tokens;
   int k_block_size = m->kProjSize * num_tokens;
-  int v_block_size = m->vProjSize * num_tokens;
+  int q_array_size = m->qProjSize * num_tokens * m->num_heads;
   // apply bias for q, k, v
   if (*m->bias) {
     apply_proj_bias_qkv<<<GET_BLOCKS(parallelism),
@@ -284,42 +298,31 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                     m->kProjSize,
                                     m->vProjSize,
                                     m->global_num_heads,
+                                    m->global_num_kv_heads,
                                     m->num_heads,
+                                    m->num_kv_heads,
                                     *m->scaling_query,
                                     m->scaling_factor);
   }
-
   if (*m->apply_rotary_embedding) {
-    /*q*/
-    apply_rotary_embedding<<<GET_BLOCKS(parallelism),
-                             min(CUDA_NUM_THREADS, parallelism),
-                             0,
-                             stream>>>(output_ptr,
-                                       m->complex_input,
-                                       m->token_infos,
-                                       m->qProjSize,
-                                       m->kProjSize,
-                                       m->num_heads,
-                                       num_tokens,
-                                       q_block_size,
-                                       k_block_size,
-                                       v_block_size,
-                                       true);
-    /*k*/
-    apply_rotary_embedding<<<GET_BLOCKS(parallelism),
-                             min(CUDA_NUM_THREADS, parallelism),
-                             0,
-                             stream>>>(output_ptr,
-                                       m->complex_input,
-                                       m->token_infos,
-                                       m->qProjSize,
-                                       m->kProjSize,
-                                       m->num_heads,
-                                       num_tokens,
-                                       q_block_size,
-                                       k_block_size,
-                                       v_block_size,
-                                       false);
+    /*q&k*/
+    parallelism =
+        num_tokens *
+        (m->qProjSize * m->num_heads + m->kProjSize * m->num_kv_heads) / 2;
+    apply_rotary_embedding_hf<<<GET_BLOCKS(parallelism),
+                                min(CUDA_NUM_THREADS, parallelism),
+                                0,
+                                stream>>>(output_ptr,
+                                          m->complex_input,
+                                          m->token_infos,
+                                          m->qProjSize,
+                                          m->kProjSize,
+                                          m->num_heads,
+                                          num_tokens,
+                                          m->num_kv_heads,
+                                          q_block_size,
+                                          k_block_size,
+                                          q_array_size);
   }
 }
 
@@ -329,26 +332,13 @@ void update_kv_cache_kernel(IncMultiHeadSelfAttentionMeta const *m,
                             cudaStream_t stream) {
   int num_tokens = bc->num_active_tokens();
   if (num_tokens > 0) {
-    int parallelism = m->kProjSize * num_tokens * m->num_heads;
+    int parallelism =
+        (m->kProjSize + m->vProjSize) * num_tokens * m->num_kv_heads;
     store_kv_cache<<<GET_BLOCKS(parallelism),
                      min(CUDA_NUM_THREADS, parallelism),
                      0,
                      stream>>>(static_cast<DT *>(m->devQKVProjArray),
                                static_cast<DT *>(m->keyCache),
-                               m->token_infos,
-                               m->qProjSize,
-                               m->kProjSize,
-                               m->vProjSize,
-                               num_tokens,
-                               m->num_heads,
-                               BatchConfig::MAX_SEQ_LENGTH,
-                               /* k_cache = */ true);
-
-    parallelism = m->vProjSize * num_tokens * m->num_heads;
-    store_kv_cache<<<GET_BLOCKS(parallelism),
-                     min(CUDA_NUM_THREADS, parallelism),
-                     0,
-                     stream>>>(static_cast<DT *>(m->devQKVProjArray),
                                static_cast<DT *>(m->valueCache),
                                m->token_infos,
                                m->qProjSize,
@@ -356,8 +346,8 @@ void update_kv_cache_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                m->vProjSize,
                                num_tokens,
                                m->num_heads,
-                               BatchConfig::MAX_SEQ_LENGTH,
-                               /* k_cache = */ false);
+                               m->num_kv_heads,
+                               BatchConfig::MAX_SEQ_LENGTH);
   }
 }
 
@@ -419,19 +409,6 @@ void pre_build_weight_kernel(IncMultiHeadSelfAttentionMeta const *m,
       assert(false);
     }
   }
-  // reload weight_o for offloading case
-  int parallelism = m->vProjSize * m->oProjSize * m->num_heads;
-  build_w_out_tensor<<<GET_BLOCKS(parallelism),
-                       min(CUDA_NUM_THREADS, parallelism),
-                       0,
-                       stream>>>(static_cast<DT *>(m->weight_ptr),
-                                 static_cast<DT *>(m->W_out_contiguous),
-                                 m->vProjSize,
-                                 m->oProjSize,
-                                 m->num_heads,
-                                 (m->qSize * m->qProjSize +
-                                  m->kSize * m->kProjSize +
-                                  m->vSize * m->vProjSize));
 }
 
 template <typename DT>
@@ -470,7 +447,8 @@ void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
 
   // phase 3: Compute attention score
   // 3 kernels for pahse 3: matmul1 - softmax - matmal2
-  compute_attention_kernel(m, bc, shard_id, output_ptr, bias_ptr, stream);
+  compute_attention_kernel(
+      m, bc, shard_id, output_ptr, bias_ptr, weight_ptr, stream);
 }
 
 } // namespace IncMultiHeadAttention
@@ -480,34 +458,36 @@ using namespace Kernels::IncMultiHeadAttention;
 
 template <typename DT>
 __global__ void store_kv_cache(DT const *devQKVProjArray,
-                               DT *cache_ptr,
+                               DT *kCache_ptr,
+                               DT *vCache_ptr,
                                BatchConfig::PerTokenInfo const *tokenInfos,
                                int qProjSize,
                                int kProjSize,
                                int vProjSize,
                                int num_tokens,
                                int num_heads,
-                               int max_seq_len,
-                               bool k_cache) {
-  CUDA_KERNEL_LOOP(i,
-                   num_tokens * (k_cache ? kProjSize : vProjSize) * num_heads) {
+                               int num_kv_heads,
+                               int max_seq_len) {
+  CUDA_KERNEL_LOOP(i, num_tokens * (kProjSize + vProjSize) * num_kv_heads) {
+    int q_array_size = qProjSize * num_tokens * num_heads;
+    int k_array_size = kProjSize * num_tokens * num_kv_heads;
+
+    bool k_cache = i < k_array_size;
+    int real_i = k_cache ? i : i - k_array_size;
+
     int proj_size = k_cache ? kProjSize : vProjSize;
-    int head_idx = i / (num_tokens * proj_size);
-    int token_idx = (i - head_idx * (num_tokens * proj_size)) / proj_size;
-    int data_idx = i % proj_size;
-
-    int qkv_block_size = (qProjSize + kProjSize + vProjSize) * num_tokens;
-    int current_head_block_size =
-        num_tokens * (k_cache ? qProjSize : qProjSize + kProjSize);
-    DT val =
-        devQKVProjArray[head_idx * qkv_block_size + current_head_block_size +
-                        token_idx * proj_size + data_idx];
-    // int const req_id = id_map[token_idx].request_index;
-    // int const tok_id = id_map[token_idx].token_position;
+    int head_idx = real_i / (num_tokens * proj_size);
+    int token_idx = (real_i - head_idx * (num_tokens * proj_size)) / proj_size;
+    int data_idx = real_i % proj_size;
+
+    DT val = devQKVProjArray[q_array_size + (k_cache ? 0 : k_array_size) +
+                             head_idx * proj_size * num_tokens +
+                             token_idx * proj_size + data_idx];
     int const req_id = tokenInfos[token_idx].request_index;
     int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
 
-    cache_ptr[req_id * (num_heads * max_seq_len * proj_size) +
+    DT *cache_ptr = k_cache ? kCache_ptr : vCache_ptr;
+    cache_ptr[req_id * (num_kv_heads * max_seq_len * proj_size) +
               head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
               data_idx] = val;
   }
@@ -536,6 +516,7 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
                               int shard_id,
                               DT *output_ptr,
                               DT const *bias_ptr,
+                              DT const *weight_ptr,
                               cudaStream_t stream) {
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
@@ -551,12 +532,11 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
   // int num_requests = bc->num_active_requests();
   int num_tokens = bc->num_active_tokens();
   int tokens_previous_requests = 0;
-  int qkv_block_size =
-      (m->qProjSize + m->kProjSize + m->vProjSize) * num_tokens;
+  int q_block_size = m->qProjSize * num_tokens;
   int kt_block_size = m->kProjSize * BatchConfig::MAX_SEQ_LENGTH;
-  int kt_req_block_size = kt_block_size * m->num_heads;
+  int kt_req_block_size = kt_block_size * m->num_kv_heads;
   int vt_block_size = m->vProjSize * BatchConfig::MAX_SEQ_LENGTH;
-  int vt_req_block_size = vt_block_size * m->num_heads;
+  int vt_req_block_size = vt_block_size * m->num_kv_heads;
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
@@ -568,51 +548,86 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
                        bc->requestsInfo[i].num_tokens_in_batch;
     // bc->token_last_available_idx[i] + 1;
     // Compute (QK^T/sqrt(d_k))
+    // a flag of using this scaling alpha
     int m_ = num_new_tokens;
     int n = total_tokens;
     int k = m->qProjSize;
     int lda = k, ldb = k, ldc = m_;
-    int strideA = qkv_block_size;
+    int strideA = q_block_size;
     int strideB = kt_block_size;
     int strideC = num_new_tokens * total_tokens;
-
-    // a flag of using this scaling alpha
     DT alpha = 1.0f, beta = 0.0f;
     if (*m->qk_prod_scaling) {
       alpha = static_cast<DT>(1.0f / sqrt(m->kProjSize));
     }
     // To get A, skip over Q entries from previous requests (same head)
-    void const *A = static_cast<DT *>(m->devQKVProjArray) +
-                    tokens_previous_requests * m->qProjSize;
+    DT const *A = static_cast<DT *>(m->devQKVProjArray) +
+                  tokens_previous_requests * m->qProjSize;
     // To get B, skip over K entries from previous requests (all heads +
     // padding)
-    void const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
+    DT const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
     // To get C, skip over QK^T products from previous requests
-    void *C = (void *)(m->qk_prods);
-
-    checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                         CUBLAS_OP_T,
-                                         CUBLAS_OP_N,
-                                         m_,
-                                         n,
-                                         k,
-                                         &alpha,
-                                         A,
-                                         cublas_data_type,
-                                         lda,
-                                         strideA,
-                                         B,
-                                         cublas_data_type,
-                                         ldb,
-                                         strideB,
-                                         &beta,
-                                         C,
-                                         cublas_data_type,
-                                         ldc,
-                                         strideC,
-                                         m->num_heads,
-                                         compute_type,
-                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+    DT *C = static_cast<DT *>(m->qk_prods);
+    if (m->num_kv_heads == m->num_heads) {
+      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                           CUBLAS_OP_T,
+                                           CUBLAS_OP_N,
+                                           m_,
+                                           n,
+                                           k,
+                                           &alpha,
+                                           A,
+                                           cublas_data_type,
+                                           lda,
+                                           strideA,
+                                           B,
+                                           cublas_data_type,
+                                           ldb,
+                                           strideB,
+                                           &beta,
+                                           C,
+                                           cublas_data_type,
+                                           ldc,
+                                           strideC,
+                                           m->num_heads,
+                                           compute_type,
+                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
+    } else {
+      strideB = 0;
+      // use cublasGemmStridedBatchedEx
+      int one_step_heads = m->num_heads / m->num_kv_heads;
+      m_ = num_new_tokens;
+      n = total_tokens;
+      k = m->qProjSize;
+      lda = k, ldb = k, ldc = m_;
+      for (int step = 0; step < m->num_kv_heads; step++) {
+        checkCUDA(
+            cublasGemmStridedBatchedEx(m->handle.blas,
+                                       CUBLAS_OP_T,
+                                       CUBLAS_OP_N,
+                                       m_,
+                                       n,
+                                       k,
+                                       &alpha,
+                                       A + step * strideA * one_step_heads,
+                                       cublas_data_type,
+                                       lda,
+                                       strideA,
+                                       B + step * kt_block_size,
+                                       cublas_data_type,
+                                       ldb,
+                                       strideB,
+                                       &beta,
+                                       C + step * strideC * one_step_heads,
+                                       cublas_data_type,
+                                       ldc,
+                                       strideC,
+                                       one_step_heads,
+                                       compute_type,
+                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+      }
+    }
 
     // Fill all elements above diagonal in qk prods with -inf to force
     // causal attention.
@@ -623,7 +638,7 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
       fill_entries_above_diagonal<<<GET_BLOCKS(parallelism),
                                     min((size_t)CUDA_NUM_THREADS, parallelism),
                                     0,
-                                    stream>>>(static_cast<DT *>(C),
+                                    stream>>>(C,
                                               num_new_tokens,
                                               total_tokens,
                                               m->num_heads,
@@ -631,8 +646,6 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                               static_cast<DT>(-INFINITY));
     }
     // Compute Softmax(QK^T/sqrt(d_k))
-    cudnnTensorDescriptor_t qk_tensor;
-    checkCUDNN(cudnnCreateTensorDescriptor(&qk_tensor));
     // Before modifying the parameters below, make sure to read the following
     // description of the CUDNN_TENSOR_NCHW tensor layout, from
     // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#cudnnTensorFormat_t:
@@ -646,7 +659,7 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     int c_param = total_tokens;
     int h_param = 1;
     int w_param = num_new_tokens;
-    checkCUDNN(cudnnSetTensor4dDescriptor(qk_tensor,
+    checkCUDNN(cudnnSetTensor4dDescriptor(m->qk_tensor,
                                           CUDNN_TENSOR_NCHW,
                                           cudnn_data_type,
                                           n_param,
@@ -654,7 +667,7 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                           h_param,
                                           w_param));
     float softmax_alpha = 1.0f, softmax_beta = 0.0f;
-    void *C_softmax = (void *)(m->qk_prods_softmax);
+    DT *C_softmax = static_cast<DT *>(m->qk_prods_softmax);
     // The softmax operation below is executed according to the
     // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
     // softmax operation is computed per spatial location (H,W) per image (N)
@@ -663,10 +676,10 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                    CUDNN_SOFTMAX_ACCURATE,
                                    CUDNN_SOFTMAX_MODE_CHANNEL,
                                    &softmax_alpha,
-                                   qk_tensor,
+                                   m->qk_tensor,
                                    C,
                                    &softmax_beta,
-                                   qk_tensor,
+                                   m->qk_tensor,
                                    C_softmax));
     // Matmul softmax(QK^T/sqrt(d_k)) by V
     alpha = 1.0f, beta = 0.0f;
@@ -679,7 +692,7 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     strideC = num_new_tokens * m->vProjSize;
     // To get A, skip over softmax(QK^T/sqrt(d_k)) entries from previous
     // requests (all heads)
-    A = static_cast<DT *>(C_softmax);
+    A = C_softmax;
     // To get B, skip over V^T entries from previous requests (all heads +
     // padding)
     B = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
@@ -688,36 +701,73 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     C = static_cast<DT *>(m->attn_heads) +
         tokens_previous_requests * m->num_heads * m->vProjSize;
 
-    checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                         CUBLAS_OP_N,
-                                         CUBLAS_OP_T,
-                                         m_,
-                                         n,
-                                         k,
-                                         &alpha,
-                                         A,
-                                         cublas_data_type,
-                                         lda,
-                                         strideA,
-                                         B,
-                                         cublas_data_type,
-                                         ldb,
-                                         strideB,
-                                         &beta,
-                                         C,
-                                         cublas_data_type,
-                                         ldc,
-                                         strideC,
-                                         m->num_heads,
-                                         compute_type,
-                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+    if (m->num_heads == m->num_kv_heads) {
+      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                           CUBLAS_OP_N,
+                                           CUBLAS_OP_T,
+                                           m_,
+                                           n,
+                                           k,
+                                           &alpha,
+                                           A,
+                                           cublas_data_type,
+                                           lda,
+                                           strideA,
+                                           B,
+                                           cublas_data_type,
+                                           ldb,
+                                           strideB,
+                                           &beta,
+                                           C,
+                                           cublas_data_type,
+                                           ldc,
+                                           strideC,
+                                           m->num_heads,
+                                           compute_type,
+                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+    } else {
+      int one_step_heads = m->num_heads / m->num_kv_heads;
+      n = m->vProjSize;
+      lda = m_, ldb = n, ldc = m_;
+      strideA = num_new_tokens * total_tokens;
+      strideB = 0;
+      strideC = num_new_tokens * m->vProjSize;
+      for (int step = 0; step < m->num_kv_heads; step++) {
+        checkCUDA(
+            cublasGemmStridedBatchedEx(m->handle.blas,
+                                       CUBLAS_OP_N,
+                                       CUBLAS_OP_T,
+                                       m_,
+                                       n,
+                                       k,
+                                       &alpha,
+                                       A + step * one_step_heads * strideA,
+                                       cublas_data_type,
+                                       lda,
+                                       strideA,
+                                       B + step * vt_block_size,
+                                       cublas_data_type,
+                                       ldb,
+                                       strideB,
+                                       &beta,
+                                       C + step * one_step_heads * strideC,
+                                       cublas_data_type,
+                                       ldc,
+                                       strideC,
+                                       one_step_heads,
+                                       compute_type,
+                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+      }
+    }
     // Project to output, save result directly on output tensor
     alpha = 1.0f, beta = 0.0f;
     m_ = m->oProjSize;
     k = m->vProjSize * m->num_heads;
     n = num_new_tokens;
     lda = k, ldb = n, ldc = m_;
-    A = static_cast<DT *>(m->W_out_contiguous);
+    A = weight_ptr + m->qSize * (m->qProjSize * m->num_heads +
+                                 m->kProjSize * m->num_kv_heads +
+                                 m->vProjSize * m->num_kv_heads);
     B = C;
     C = static_cast<DT *>(output_ptr) + tokens_previous_requests * m->oProjSize;
 
@@ -746,11 +796,15 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
 
   if (*m->bias && shard_id == 0) {
     int parallelism = m->oProjSize * num_tokens;
+    int qkv_weight_size = m->qProjSize * m->global_num_heads +
+                          m->kProjSize * m->global_num_kv_heads +
+                          m->vProjSize * m->global_num_kv_heads;
+
     apply_proj_bias_w<<<GET_BLOCKS(parallelism),
                         min(CUDA_NUM_THREADS, parallelism),
                         0,
                         stream>>>(
-        output_ptr, bias_ptr, num_tokens, m->oProjSize);
+        output_ptr, bias_ptr, num_tokens, qkv_weight_size, m->oProjSize);
   }
 
   assert(tokens_previous_requests == num_tokens);
@@ -836,7 +890,8 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     GenericTensorAccessorR const &weight,
     MemoryAllocator &gpu_mem_allocator,
     int num_samples,
-    int _num_heads)
+    int _num_heads,
+    int _num_kv_heads)
     : IncMultiHeadSelfAttentionMeta(handler,
                                     INC_DECODING_MODE,
                                     attn,
@@ -857,7 +912,9 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
                                     gpu_mem_allocator,
                                     num_samples,
                                     attn->num_heads,
+                                    attn->num_kv_heads,
                                     _num_heads,
+                                    _num_kv_heads,
                                     attn->quantization_type,
                                     attn->offload) {}
 
@@ -882,13 +939,16 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     MemoryAllocator &gpu_mem_allocator,
     int num_samples,
     int _global_num_heads,
+    int _global_num_kv_heads,
     int _num_heads,
+    int _num_kv_heads,
     DataType _quantization_type,
     bool _offload)
     : OpMeta(handler, attn), weight_ptr(nullptr), bias_ptr(nullptr) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDNN(cudnnSetStream(handler.dnn, stream));
+  checkCUDNN(cudnnCreateTensorDescriptor(&qk_tensor));
   qSize = _qSize;
   kSize = _kSize;
   vSize = _vSize;
@@ -905,10 +965,19 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   offload = _offload;
 
   global_num_heads = _global_num_heads;
+  global_num_kv_heads = _global_num_kv_heads;
   num_heads = _num_heads;
-  weights_params = (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize +
-                    oProjSize * (vProjSize > 0 ? vProjSize : vSize));
-  weightSize = weights_params * num_heads * size_of_dt;
+  num_kv_heads = _num_kv_heads;
+  // weights_params = (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize
+  // +
+  //                   oProjSize * (vProjSize > 0 ? vProjSize : vSize));
+  // weightSize = weights_params * num_heads * size_of_dt;
+
+  weightSize =
+      ((qSize * qProjSize + oProjSize * (vProjSize > 0 ? vProjSize : vSize)) *
+           num_heads +
+       (kSize * kProjSize + vSize * vProjSize) * num_kv_heads) *
+      size_of_dt;
   if (quantization_type != DT_NONE) {
     quantized_weightSize = get_quantization_to_byte_size(
         attn->data_type, quantization_type, weightSize);
@@ -945,26 +1014,38 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
 
   // allocate memory for the seqArray and reserve space
   {
-    size_t qkv_proj_dim = qProjSize + kProjSize + vProjSize;
+    // size_t qkv_proj_dim = qProjSize + kProjSize + vProjSize;
+    // size_t qkv_max_proj_size =
+    //     BatchConfig::MAX_NUM_TOKENS * qkv_proj_dim * num_heads;
+
     size_t qkv_max_proj_size =
-        BatchConfig::MAX_NUM_TOKENS * qkv_proj_dim * num_heads;
+        BatchConfig::MAX_NUM_TOKENS *
+        (qProjSize * num_heads + kProjSize * num_kv_heads +
+         vProjSize * num_kv_heads);
+    // std::cout << "num_kv_heads: " << BatchConfig::MAX_NUM_TOKENS << ", "
+    //           << qProjSize << ", " << kProjSize << ", " << vProjSize << ", "
+    //           << num_heads << ", " << num_kv_heads << ", " <<
+    //           qkv_max_proj_size
+    //           << std::endl;
+    // assert(false);
     size_t key_cache_size = 0, value_cache_size = 0;
     switch (infer_mode) {
       case INC_DECODING_MODE:
       case TREE_VERIFY_MODE: {
-        key_cache_size = num_heads * kProjSize * BatchConfig::MAX_NUM_REQUESTS *
+        key_cache_size = num_kv_heads * kProjSize *
+                         BatchConfig::MAX_NUM_REQUESTS *
                          BatchConfig::MAX_SEQ_LENGTH;
-        value_cache_size = num_heads * vProjSize *
+        value_cache_size = num_kv_heads * vProjSize *
                            BatchConfig::MAX_NUM_REQUESTS *
                            BatchConfig::MAX_SEQ_LENGTH;
         break;
       }
       case BEAM_SEARCH_MODE: {
         key_cache_size =
-            num_heads * kProjSize * BeamSearchBatchConfig::MAX_NUM_REQUESTS *
+            num_kv_heads * kProjSize * BeamSearchBatchConfig::MAX_NUM_REQUESTS *
             BatchConfig::MAX_SEQ_LENGTH * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
         value_cache_size =
-            num_heads * vProjSize * BeamSearchBatchConfig::MAX_NUM_REQUESTS *
+            num_kv_heads * vProjSize * BeamSearchBatchConfig::MAX_NUM_REQUESTS *
             BatchConfig::MAX_SEQ_LENGTH * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
         break;
       }
@@ -978,8 +1059,9 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
         BatchConfig::MAX_NUM_TOKENS * num_heads * vProjSize;
     size_t W_out_block_size = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
     size_t W_out_contiguous_size = W_out_block_size * num_heads;
-    size_t complex_size =
-        (BatchConfig::MAX_NUM_TOKENS * qProjSize * num_heads) / 2;
+    size_t complex_size = (BatchConfig::MAX_NUM_TOKENS *
+                           (qProjSize * num_heads + kProjSize * num_kv_heads)) /
+                          2;
     size_t totalSize =
         (qkv_max_proj_size + key_cache_size + value_cache_size +
          2 * qk_prod_size + attn_heads_size + W_out_contiguous_size) *
@@ -1071,34 +1153,6 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
       quantized_weight_ptr =
           gpu_mem_allocator.allocate_reserved<char>(quantized_weightSize);
     }
-
-    if (weight.data_type == DT_FLOAT) {
-      int parallelism = vProjSize * oProjSize * num_heads;
-      build_w_out_tensor<<<GET_BLOCKS(parallelism),
-                           min(CUDA_NUM_THREADS, parallelism),
-                           0,
-                           stream>>>(
-          weight.get_float_ptr(),
-          (float *)W_out_contiguous,
-          vProjSize,
-          oProjSize,
-          num_heads,
-          (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize));
-    } else if (weight.data_type == DT_HALF) {
-      int parallelism = vProjSize * oProjSize * num_heads;
-      build_w_out_tensor<<<GET_BLOCKS(parallelism),
-                           min(CUDA_NUM_THREADS, parallelism),
-                           0,
-                           stream>>>(
-          weight.get_half_ptr(),
-          (half *)W_out_contiguous,
-          vProjSize,
-          oProjSize,
-          num_heads,
-          (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize));
-    } else {
-      assert(weight.data_type == DT_INT4 || weight.data_type == DT_INT8);
-    }
     if (!offload) {
       assert(gpu_mem_allocator.reserved_total_size ==
              gpu_mem_allocator.reserved_allocated_size);
diff --git a/src/ops/inc_multiquery_self_attention.cc b/src/ops/inc_multiquery_self_attention.cc
deleted file mode 100644
index 6aa6042b1a..0000000000
--- a/src/ops/inc_multiquery_self_attention.cc
+++ /dev/null
@@ -1,1432 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "flexflow/ops/inc_multiquery_self_attention.h"
-#include "flexflow/ffconst_utils.h"
-#include "flexflow/model.h"
-#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
-#include "flexflow/utils/cuda_helper.h"
-#else
-#include "flexflow/utils/hip_helper.h"
-#endif
-#include "flexflow/utils/hash_utils.h"
-#include "legion/legion_utilities.h"
-#ifdef INFERENCE_TESTS
-#include <torch/torch.h>
-using namespace at::indexing;
-#endif
-
-namespace FlexFlow {
-
-// declare Legion names
-using Legion::ArgumentMap;
-using Legion::Context;
-using Legion::coord_t;
-using Legion::Domain;
-using Legion::Future;
-using Legion::FutureMap;
-using Legion::IndexLauncher;
-using Legion::Machine;
-using Legion::Memory;
-using Legion::PhysicalRegion;
-using Legion::Predicate;
-using Legion::Rect;
-using Legion::RegionRequirement;
-using Legion::Runtime;
-using Legion::Task;
-using Legion::TaskArgument;
-using Legion::TaskLauncher;
-using PCG::Node;
-
-LegionRuntime::Logger::Category log_inc_mqa("IncrementalMQA");
-
-bool IncMultiQuerySelfAttentionParams::is_valid(
-    ParallelTensorShape const &input) const {
-  bool is_valid = input.is_valid();
-  return is_valid;
-}
-
-Tensor FFModel::inc_multiquery_self_attention(const Tensor input,
-                                              int embed_dim,
-                                              int num_heads,
-                                              int kdim,
-                                              int vdim,
-                                              float dropout,
-                                              bool bias,
-                                              bool add_bias_kv,
-                                              bool add_zero_attn,
-                                              DataType data_type,
-                                              Initializer *kernel_initializer,
-                                              char const *name) {
-  if (data_type == DT_NONE) {
-    data_type = input->data_type;
-  }
-  Layer *li = nullptr;
-  int weight_num = bias ? 2 : 1;
-  if (data_type != input->data_type) {
-    Tensor casted_input = cast(input, data_type, "type cast for IncMQA");
-    li = new Layer(this,
-                   OP_INC_MULTIQUERY_SELF_ATTENTION,
-                   data_type,
-                   name,
-                   1 /*inputs*/,
-                   weight_num /*weights*/,
-                   1 /*outputs*/,
-                   casted_input);
-  } else {
-    li = new Layer(this,
-                   OP_INC_MULTIQUERY_SELF_ATTENTION,
-                   data_type,
-                   name,
-                   1 /*inputs*/,
-                   weight_num /*weights*/,
-                   1 /*outputs*/,
-                   input);
-  }
-  {
-    int numdims = input->num_dims;
-    int dims[MAX_TENSOR_DIM];
-    for (int i = 0; i < numdims; i++) {
-      dims[i] = input->dims[i];
-    }
-    dims[0] = embed_dim;
-    li->outputs[0] = create_tensor_legion_ordering(
-        numdims, dims, data_type, li, 0, true /*create_grad*/);
-  }
-  {
-    // Compute weight size
-    int qProjSize = kdim, kProjSize = kdim, vProjSize = kdim,
-        oProjSize = embed_dim;
-    // int qSize = input->dims[0], kSize = input->dims[0], vSize =
-    // input->dims[0]; int qParas = qSize; int kParas = kProjSize; int vParas =
-    // vProjSize; int oParas = oProjSize; int dims[2] = {qParas + kParas +
-    // vParas + oParas, num_heads};
-
-    int dims[2] = {embed_dim + kProjSize + vProjSize + oProjSize, embed_dim};
-
-    li->weights[0] = create_weight_legion_ordering(2,
-                                                   dims,
-                                                   data_type,
-                                                   li,
-                                                   true /*create_grad*/,
-                                                   kernel_initializer,
-                                                   CHOSEN_SYNC_TYPE);
-  }
-  li->data_type = data_type;
-  li->add_int_property("embed_dim", embed_dim);
-  li->add_int_property("num_heads", num_heads);
-  li->add_int_property("kdim", kdim);
-  li->add_int_property("vdim", vdim);
-  li->add_int_property("bias", bias);
-  li->add_int_property("add_bias_kv", add_bias_kv);
-  li->add_int_property("add_zero_attn", add_zero_attn);
-  li->add_float_property("dropout", dropout);
-  layers.push_back(li);
-
-  return li->outputs[0];
-}
-
-Op *IncMultiQuerySelfAttention::create_operator_from_layer(
-    FFModel &model,
-    Layer const *layer,
-    std::vector<ParallelTensor> const &inputs) {
-  long long value;
-  layer->get_int_property("embed_dim", value);
-  int embed_dim = value;
-  layer->get_int_property("num_heads", value);
-  int num_heads = value;
-  layer->get_int_property("kdim", value);
-  int kdim = value;
-  layer->get_int_property("vdim", value);
-  int vdim = value;
-  float dropout;
-  layer->get_float_property("dropout", dropout);
-  layer->get_int_property("bias", value);
-  bool bias = (bool)value;
-  layer->get_int_property("add_bias_kv", value);
-  bool add_bias_kv = (bool)value;
-  layer->get_int_property("add_zero_attn", value);
-  bool add_zero_attn = (bool)value;
-  return new IncMultiQuerySelfAttention(model,
-                                        layer->layer_guid,
-                                        inputs[0],
-                                        embed_dim,
-                                        num_heads,
-                                        kdim,
-                                        vdim,
-                                        dropout,
-                                        bias,
-                                        add_bias_kv,
-                                        add_zero_attn,
-                                        true /*allocate_weights*/,
-                                        layer->name);
-}
-
-IncMultiQuerySelfAttention::IncMultiQuerySelfAttention(
-    FFModel &model,
-    LayerID const &_layer_guid,
-    const ParallelTensor _input,
-    int _embed_dim,
-    int _num_heads,
-    int _kdim,
-    int _vdim,
-    float _dropout,
-    bool _bias,
-    bool _add_bias_kv,
-    bool _add_zero_attn,
-    bool allocate_weights,
-    char const *name)
-    // Initializer* _bias_initializer)
-    : Op(model,
-         OP_INC_MULTIQUERY_SELF_ATTENTION,
-         _input->data_type,
-         name,
-         1 /*inputs*/,
-         (_bias ? 2 : 1), /*weights*/
-         1 /*outputs*/,
-         _input),
-      num_heads(_num_heads), dropout(_dropout), bias(_bias),
-      add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
-      qSize(_input->dims[0].size), kSize(_input->dims[0].size),
-      vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
-      vProjSize(_vdim), oProjSize(_embed_dim), embed_dim(_embed_dim),
-      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size) {
-  // overwrite layer_guid
-  layer_guid = _layer_guid;
-
-  numOutputs = 1;
-  int numdim = _input->num_dims;
-  ParallelDim dims[MAX_TENSOR_DIM];
-  for (int i = 0; i < numdim; i++) {
-    dims[i] = _input->dims[i];
-  }
-  dims[0].size = _embed_dim;
-  // Currently require no parallelism along this dim
-  assert(dims[0].degree == 1);
-  if (allocate_weights) {
-    // Create weight tensor
-    int num_dims = inputs[0]->num_dims;
-    // Compute weight size
-    // int qParas = this->qProjSize * this->qSize;
-    // int kParas = this->kProjSize * this->kSize;
-    // int vParas = this->vProjSize * this->vSize;
-    // int oParas =
-    //     this->oProjSize * (this->vProjSize > 0 ? this->vProjSize :
-    //     this->vSize);
-    ParallelDim dims[3];
-    dims[0] = inputs[0]->dims[num_dims - 2];
-    dims[0].size = dims[0].degree;
-    dims[1] = inputs[0]->dims[num_dims - 1];
-    dims[1].is_replica_dim = false;
-    dims[1].size = this->embed_dim;
-    dims[2].size =
-        this->embed_dim + this->kProjSize + this->vProjSize + this->oProjSize;
-    dims[2].degree = 1;
-    dims[2].parallel_idx = -1;
-    int seed = std::rand();
-    Initializer *initializer = new GlorotUniform(seed);
-    weights[0] = model.create_parallel_weight<3>(dims,
-                                                 this->data_type,
-                                                 nullptr /*owner_op*/,
-                                                 true /*create_grad*/,
-                                                 initializer,
-                                                 CHOSEN_SYNC_TYPE);
-  }
-
-  outputs[0] = model.create_parallel_tensor_legion_ordering(
-      _input->num_dims, dims, this->data_type, this);
-  /* for (int i = 0; i < numdim; i++) { */
-  /*   register_output_input_parallel_dims(outputs[0], i, inputs[0], i); */
-  /* } */
-  /* // Check correctness */
-  /* assert(check_output_input_weight_parallel_dims()); */
-}
-
-IncMultiQuerySelfAttention::IncMultiQuerySelfAttention(
-    FFModel &model,
-    const ParallelTensor _input,
-    const ParallelTensor _weight,
-    int _embed_dim,
-    int _num_heads,
-    int _kdim,
-    int _vdim,
-    float _dropout,
-    bool _bias,
-    bool _add_bias_kv,
-    bool _add_zero_attn,
-    bool allocate_weights,
-    char const *name)
-    // Initializer* _bias_initializer)
-    : Op(model,
-         OP_INC_MULTIQUERY_SELF_ATTENTION,
-         _input->data_type,
-         name,
-         1 /*inputs*/,
-         (_bias ? 2 : 1), /*weights*/
-         1 /*outputs*/,
-         _input,
-         _weight),
-      num_heads(_num_heads), dropout(_dropout), bias(_bias),
-      add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
-      qSize(_input->dims[0].size), kSize(_input->dims[0].size),
-      vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
-      vProjSize(_vdim), oProjSize(_embed_dim), embed_dim(_embed_dim),
-      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size)
-// bias_initializer(_bias_initializer)
-{
-  numOutputs = 1;
-  int numdim = _input->num_dims;
-  ParallelDim dims[MAX_TENSOR_DIM];
-  for (int i = 0; i < numdim; i++) {
-    dims[i] = _input->dims[i];
-  }
-  dims[0].size = _embed_dim;
-  // Currently require no parallelism along this dim
-  assert(dims[0].degree == 1);
-  if (allocate_weights) {
-    // Create weight tensor
-    int num_dims = inputs[0]->num_dims;
-    // Compute weight size
-    // int qParas = this->qProjSize * this->qSize;
-    // int kParas = this->kProjSize * this->kSize;
-    // int vParas = this->vProjSize * this->vSize;
-    // int oParas =
-    //     this->oProjSize * (this->vProjSize > 0 ? this->vProjSize :
-    //     this->vSize);
-    ParallelDim dims[3];
-    dims[0] = inputs[0]->dims[num_dims - 2];
-    dims[0].size = dims[0].degree;
-    dims[1] = inputs[0]->dims[num_dims - 1];
-    dims[1].size = this->embed_dim;
-    dims[1].is_replica_dim = false;
-    dims[2].size =
-        this->embed_dim + this->kProjSize + this->vProjSize + this->oProjSize;
-    int seed = std::rand();
-    Initializer *initializer = new GlorotUniform(seed);
-    weights[0] = model.create_parallel_weight<3>(dims,
-                                                 this->data_type,
-                                                 NULL /*owner_op*/,
-                                                 true /*create_grad*/,
-                                                 initializer,
-                                                 CHOSEN_SYNC_TYPE);
-  }
-  outputs[0] = model.create_parallel_tensor_legion_ordering(
-      _input->num_dims, dims, this->data_type, this);
-
-  /* for (int i = 0; i < numdim; i++) { */
-  /*   register_output_input_parallel_dims(outputs[0], i, inputs[0], i); */
-  /* } */
-  /* register_output_weight_parallel_dims(outputs[0], numdim-1, _weight, 1); */
-  /* register_output_weight_parallel_dims(outputs[0], numdim-2, _weight, 2); */
-  // Check correctness
-  /* assert(check_output_input_weight_parallel_dims()); */
-}
-
-IncMultiQuerySelfAttention::IncMultiQuerySelfAttention(
-    FFModel &model,
-    IncMultiQuerySelfAttention const &other,
-    const ParallelTensor input,
-    bool allocate_weights)
-    : IncMultiQuerySelfAttention(model,
-                                 other.layer_guid,
-                                 input,
-                                 other.oProjSize,
-                                 other.num_heads,
-                                 other.qProjSize,
-                                 other.vProjSize,
-                                 other.dropout,
-                                 other.bias,
-                                 other.add_bias_kv,
-                                 other.add_zero_attn,
-                                 allocate_weights,
-                                 other.name) {}
-
-IncMultiQuerySelfAttention::IncMultiQuerySelfAttention(
-    FFModel &model,
-    IncMultiQuerySelfAttentionParams const &params,
-    ParallelTensor const &input,
-    bool allocate_weights,
-    char const *name)
-    : IncMultiQuerySelfAttention(model,
-                                 params.layer_guid,
-                                 input,
-                                 params.embed_dim,
-                                 params.num_heads,
-                                 params.kdim,
-                                 params.vdim,
-                                 params.dropout,
-                                 params.bias,
-                                 params.add_bias_kv,
-                                 params.add_zero_attn,
-                                 allocate_weights,
-                                 name) {}
-
-void IncMultiQuerySelfAttention::init_inference(
-    FFModel const &ff,
-    std::vector<ParallelTensor> const &batch_inputs,
-    std::vector<ParallelTensor> const &batch_outputs,
-    MachineView const *mv) {
-  assert(check_output_input_weight_same_parallel_is());
-  parallel_is = batch_outputs[0]->parallel_is;
-  ArgumentMap argmap;
-  Context ctx = ff.config.lg_ctx;
-  Runtime *runtime = ff.config.lg_hlr;
-  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
-  size_t machine_view_hash = view->hash();
-  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
-  IndexLauncher launcher(INC_MULTIQUERY_SELF_ATTENTION_INIT_TASK_ID,
-                         parallel_is,
-                         TaskArgument(this, sizeof(IncMultiQuerySelfAttention)),
-                         argmap,
-                         Predicate::TRUE_PRED,
-                         false /*must*/,
-                         0 /*mapper_id*/,
-                         machine_view_hash);
-  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_inputs[0]->region));
-  launcher.add_field(0, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    weights[0]->region));
-  launcher.add_field(1, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_outputs[0]->region));
-  launcher.add_field(2, FID_DATA);
-  FutureMap fm = runtime->execute_index_space(ctx, launcher);
-  fm.wait_all_results();
-  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
-}
-
-void IncMultiQuerySelfAttention::init(FFModel const &ff) {
-
-  assert(check_output_input_weight_same_parallel_is());
-  parallel_is = outputs[0]->parallel_is;
-  ArgumentMap argmap;
-  Context ctx = ff.config.lg_ctx;
-  Runtime *runtime = ff.config.lg_hlr;
-  set_argumentmap_for_init(ff, argmap);
-  IndexLauncher launcher(INC_MULTIQUERY_SELF_ATTENTION_INIT_TASK_ID,
-                         parallel_is,
-                         TaskArgument(this, sizeof(IncMultiQuerySelfAttention)),
-                         argmap,
-                         Predicate::TRUE_PRED,
-                         false /*must*/,
-                         0 /*mapper_id*/,
-                         outputs[0]->machine_view.hash());
-  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    inputs[0]->region));
-  launcher.add_field(0, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    weights[0]->region));
-  launcher.add_field(1, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    outputs[0]->region));
-  launcher.add_field(2, FID_DATA);
-  FutureMap fm = runtime->execute_index_space(ctx, launcher);
-  fm.wait_all_results();
-  set_opmeta_from_futuremap(ff, fm);
-}
-
-/*
-  regions[0](I): input
-  regions[1](I): weight
-  regions[2](O): output
-*/
-OpMeta *IncMultiQuerySelfAttention::init_task(
-    Task const *task,
-    std::vector<PhysicalRegion> const &regions,
-    Context ctx,
-    Runtime *runtime) {
-  IncMultiQuerySelfAttention const *attn =
-      (IncMultiQuerySelfAttention *)task->args;
-  FFHandler handle = *((FFHandler const *)task->local_args);
-  GenericTensorAccessorR input =
-      helperGetGenericTensorAccessorRO(attn->inputs[0]->data_type,
-                                       regions[0],
-                                       task->regions[0],
-                                       FID_DATA,
-                                       ctx,
-                                       runtime);
-  GenericTensorAccessorR weight =
-      helperGetGenericTensorAccessorRO(attn->weights[0]->data_type,
-                                       regions[1],
-                                       task->regions[1],
-                                       FID_DATA,
-                                       ctx,
-                                       runtime);
-  GenericTensorAccessorW output =
-      helperGetGenericTensorAccessorWO(attn->outputs[0]->data_type,
-                                       regions[2],
-                                       task->regions[2],
-                                       FID_DATA,
-                                       ctx,
-                                       runtime);
-
-  int num_samples = input.domain.hi()[2] - input.domain.lo()[2] + 1;
-  // assert(attn->qoSeqLength == input.domain.hi()[1] - input.domain.lo()[1] +
-  // 1); assert(attn->kvSeqLength == input.domain.hi()[1] - input.domain.lo()[1]
-  // + 1);
-  int num_heads = (weight.domain.hi()[1] - weight.domain.lo()[1] + 1);
-  // assert(attn->oProjSize == output.domain.hi()[0] - output.domain.lo()[0] +
-  // 1);
-
-  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                       .only_kind(Memory::GPU_FB_MEM)
-                       .best_affinity_to(task->target_proc)
-                       .first();
-  IncMultiQuerySelfAttentionMeta *m = new IncMultiQuerySelfAttentionMeta(
-      handle, attn, weight, gpu_mem, num_samples);
-
-  m->profiling = attn->profiling;
-  assert(weight.domain.get_volume() * data_type_size(weight.data_type) ==
-         m->weightSize);
-  return m;
-}
-
-void IncMultiQuerySelfAttention::forward(FFModel const &ff) {
-  // IncMultiQuerySelfAttention doesn't support forward
-  assert(false);
-}
-
-FutureMap IncMultiQuerySelfAttention::inference(
-    FFModel const &ff,
-    BatchConfigFuture const &bc,
-    std::vector<ParallelTensor> const &batch_inputs,
-    std::vector<ParallelTensor> const &batch_outputs,
-    MachineView const *mv) {
-  ArgumentMap argmap;
-  Context ctx = ff.config.lg_ctx;
-  Runtime *runtime = ff.config.lg_hlr;
-  parallel_is = batch_outputs[0]->parallel_is;
-  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
-  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
-  size_t machine_view_hash = view->hash();
-  int idx = 0;
-  // log_inc_mqa.debug("BatchConfig, num_tokens: %d, num_requests: %d",
-  //                   bc->num_tokens,
-  //                   bc->num_active_requests());
-  IndexLauncher launcher(INC_MULTIQUERY_SELF_ATTENTION_INF_TASK_ID,
-                         parallel_is,
-                         TaskArgument(nullptr, 0),
-                         argmap,
-                         Predicate::TRUE_PRED,
-                         false /*must*/,
-                         0 /*mapper_id*/,
-                         machine_view_hash);
-  launcher.add_future(bc);
-  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_inputs[0]->region));
-  launcher.add_field(idx++, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    weights[0]->region));
-  launcher.add_field(idx++, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_outputs[0]->region));
-  launcher.add_field(idx++, FID_DATA);
-  return runtime->execute_index_space(ctx, launcher);
-}
-
-/*
-  regions[0](I): input
-  regions[3](I): weight
-  regions[4](O): output
-*/
-void IncMultiQuerySelfAttention::inference_task(
-    Task const *task,
-    std::vector<PhysicalRegion> const &regions,
-    Context ctx,
-    Runtime *runtime) {
-
-  assert(task->regions.size() == regions.size());
-
-  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
-  if (bc->num_tokens == 0) {
-    return;
-  }
-
-  IncMultiQuerySelfAttentionMeta const *m =
-      *((IncMultiQuerySelfAttentionMeta **)task->local_args);
-
-  assert(regions.size() == 3);
-
-  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
-      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
-      m->weight_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
-  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
-      m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
-
-  Domain input_domain = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  Domain weight_domain = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  Domain output_domain = runtime->get_index_space_domain(
-      ctx, task->regions[2].region.get_index_space());
-
-  assert(input_domain.get_dim() == 4);
-  assert(weight_domain.get_dim() == 3);
-  assert(output_domain.get_dim() == 4);
-
-  IncMultiQuerySelfAttention::inference_kernel_wrapper(
-      m, bc, input, weight, output);
-#ifdef INFERENCE_TESTS
-  printf("Checking IncMultiQuerySelfAttention computations...\n");
-
-  // =============================================================================
-  //  Define helper functions to handle row-major arrays
-  // =============================================================================
-
-  auto set_value_row_major = [](float *arr,
-                                std::vector<int> const &shape,
-                                std::vector<int> const &indices,
-                                float value) -> void {
-    int offset = 0;
-    for (int i = 0; i < shape.size(); i++) {
-      int index = indices[i];
-      int stride = 1;
-      for (int j = i + 1; j < shape.size(); j++) {
-        stride *= shape[j];
-      }
-      offset += index * stride;
-    }
-    *(arr + offset) = value;
-  };
-
-  // =============================================================================
-  //  Load input/output/weights and parse general configs
-  // =============================================================================
-
-  float *input_cpu =
-      download_tensor<float>(input.get_float_ptr(), input_domain.get_volume());
-  assert(input_cpu != nullptr);
-  float *weight_cpu = download_tensor<float>(weight.get_float_ptr(),
-                                             weight_domain.get_volume());
-  assert(weight_cpu != nullptr);
-  float *output_cpu = download_tensor<float>(output.get_float_ptr(),
-                                             output_domain.get_volume());
-  assert(output_cpu != nullptr);
-
-  // Input tensor dimensions
-  coord_t data_dim = input_domain.hi()[0] - input_domain.lo()[0] + 1;
-  coord_t max_sequence_length = input_domain.hi()[1] - input_domain.lo()[1] + 1;
-  coord_t batch_size = input_domain.hi()[2] - input_domain.lo()[2] + 1;
-  coord_t replica_dim = input_domain.hi()[3] - input_domain.lo()[3] + 1;
-  assert(replica_dim == 1);
-
-  size_t effective_batch_size = max_sequence_length * batch_size;
-  float inputs_arr[data_dim][effective_batch_size] = {0};
-  for (size_t i = 0; i < data_dim * bc->num_active_tokens(); i++) {
-    size_t data_index = i % data_dim;
-    size_t token_index = i / data_dim;
-    assert(data_index < data_dim);
-    assert(token_index < effective_batch_size);
-    inputs_arr[data_index][token_index] = input_cpu[i];
-  }
-  torch::Tensor torch_input = torch::from_blob(
-      inputs_arr, {data_dim, (long int)effective_batch_size}, torch::kFloat32);
-
-  // Weight tensor dimensions
-  coord_t all_weight_params = weight_domain.hi()[0] - weight_domain.lo()[0] + 1;
-  coord_t num_heads = weight_domain.hi()[1] - weight_domain.lo()[1] + 1;
-  replica_dim = weight_domain.hi()[2] - weight_domain.lo()[2] + 1;
-  size_t qParas = m->qProjSize * m->qSize;
-  size_t kParas = m->kProjSize * m->kSize;
-  size_t vParas = m->vProjSize * m->vSize;
-  size_t oParas = m->oProjSize * (m->vProjSize > 0 ? m->vProjSize : m->vSize);
-
-  assert(all_weight_params == qParas + kParas + vParas + oParas);
-  assert(num_heads == m->num_heads);
-  assert(replica_dim == 1);
-
-  assert(m->qSize == m->kSize && m->kSize == m->vSize);
-  // printf("m->qSize: %i\n", m->qSize);
-  //  keep things simple for now
-  assert(m->qProjSize == m->kProjSize && m->kProjSize == m->vProjSize);
-  long int proj_sum = m->qProjSize + m->kProjSize + m->vProjSize;
-  // load weight manually because Torch can't easily read a tensor serialized in
-  // column-major order.
-
-  // printf("m->kProjSize: %i, BatchConfig::MAX_NUM_TOKENS: %i, "
-  //     "bc->num_active_tokens(): %i, num_heads: %lli,
-  //     BatchConfig::MAX_NUM_REQUESTS: %i, " "bc->num_active_requests(): %i\n",
-  //     m->kProjSize, BatchConfig::MAX_NUM_TOKENS, bc->num_active_tokens(),
-  //     num_heads, BatchConfig::MAX_NUM_REQUESTS, bc->num_active_requests());
-  // for (int t=0; t < bc->num_active_tokens(); t++) {
-  //   printf("token %i has request_index: %li and token_position: %li\n",
-  //   t, bc->token2ids.token_indexes[t].request_index,
-  //   bc->token2ids.token_indexes[t].token_position);
-  // }
-
-  // =============================================================================
-  //  Load the output tensor (with CUDA results), and create a Torch tensor
-  // =============================================================================
-
-  float output_cuda[m->oProjSize][effective_batch_size] = {0};
-  for (int i = 0; i < m->oProjSize * effective_batch_size; i++) {
-    int row_idx = i % m->oProjSize;
-    int col_idx = i / m->oProjSize;
-    assert(row_idx < m->oProjSize && col_idx < effective_batch_size);
-    output_cuda[row_idx][col_idx] = output_cpu[i];
-  }
-  torch::Tensor torch_out_cuda =
-      torch::from_blob(output_cuda,
-                       {m->oProjSize, (int64_t)effective_batch_size},
-                       torch::kFloat32);
-
-  // =============================================================================
-  //  Load the Q/K/V projection weights, and create a Torch tensor
-  // =============================================================================
-  std::vector<int> w_qkv_shape = {m->qSize, m->qProjSize, 3, (int)num_heads};
-  float *w_qkv =
-      (float *)calloc(m->qSize * m->qProjSize * 3 * num_heads, sizeof(float));
-  assert(w_qkv[0] == 0.0f);
-
-  for (int h = 0; h < num_heads; h++) {
-    for (size_t i = 0; i < m->qProjSize * m->qSize; i++) {
-      int row_index = i % m->qSize;
-      int column_index = i / m->qSize;
-      // Q
-      set_value_row_major(w_qkv,
-                          w_qkv_shape,
-                          {row_index, column_index, 0, h},
-                          weight_cpu[all_weight_params * h +
-                                     m->qSize * column_index + row_index]);
-      // K
-      set_value_row_major(
-          w_qkv,
-          w_qkv_shape,
-          {row_index, column_index, 1, h},
-          weight_cpu[all_weight_params * h + m->qProjSize * m->qSize +
-                     m->qSize * column_index + row_index]);
-      // V
-      set_value_row_major(
-          w_qkv,
-          w_qkv_shape,
-          {row_index, column_index, 2, h},
-          weight_cpu[all_weight_params * h + 2 * m->qProjSize * m->qSize +
-                     m->qSize * column_index + row_index]);
-    }
-  }
-  // convert weights to torch tensor
-  torch::Tensor torch_w_qkv = torch::from_blob(
-      w_qkv, {m->qSize, m->qProjSize, 3, (int)num_heads}, torch::kFloat32);
-
-  /* std::cout << "Torch projection weights size: " << torch_w_qkv.sizes()
-            << std::endl;
-  std::cout << "Torch input size: " << torch_input.sizes() << std::endl;
-  std::cout << "Number of active tokens: " << bc->num_active_tokens()
-            << std::endl; */
-  // std::cout << "torch_w_qkv:" << std::endl << torch_w_qkv << std::endl;
-
-  // =============================================================================
-  //  Compute the Q/K/V projections, and compare the results with CUDA
-  // =============================================================================
-
-  //  ----------------------- C++ computations & checks ------------------------
-  torch::Tensor qkv_projs = torch::einsum(
-      "ijkl,im->jmkl",
-      {torch_w_qkv,
-       torch_input.index({Slice(), Slice(0, bc->num_active_tokens())})});
-  // std::cout << "qkv_projs size: " << qkv_projs.sizes() << std::endl;
-  assert(qkv_projs.sizes()[0] == m->qProjSize);
-  assert(qkv_projs.sizes()[1] == bc->num_active_tokens() &&
-         qkv_projs.sizes()[1] <= effective_batch_size);
-  assert(qkv_projs.sizes()[2] == 3);
-  assert(qkv_projs.sizes()[3] == num_heads);
-  free(w_qkv);
-
-  //  ----------------------- Loading CUDA results for this step ---------------
-  float *QKVProjArray_cpu = download_tensor<float>(m->devQKVProjArray,
-                                                   BatchConfig::MAX_NUM_TOKENS *
-                                                       proj_sum * m->num_heads);
-  assert(QKVProjArray_cpu != nullptr);
-
-  std::vector<int> QKVProjArray_converted_shape = {
-      m->qProjSize, bc->num_active_tokens(), 3, (int)num_heads};
-  float *QKVProjArray_converted = (float *)calloc(
-      m->qProjSize * bc->num_active_tokens() * 3 * num_heads, sizeof(float));
-
-  // skip over padding at the end of QKVProjArray_cpu
-  // convert from column order to 3D matrix because torch cannot automatically
-  // import matrices flattened in column order
-  for (size_t i = 0; i < proj_sum * bc->num_active_tokens() * num_heads; i++) {
-    int proj_size_index = i % m->qProjSize;
-    int head_index = i / (proj_sum * bc->num_active_tokens());
-    int token_index =
-        ((i - head_index * proj_sum * bc->num_active_tokens()) / m->qProjSize) %
-        bc->num_active_tokens();
-    int qkv_offset = (i - head_index * proj_sum * bc->num_active_tokens()) /
-                     (m->qProjSize * bc->num_active_tokens());
-    assert(proj_size_index < proj_sum);
-    assert(head_index < num_heads);
-    assert(token_index < bc->num_active_tokens());
-    assert(qkv_offset < 3);
-    set_value_row_major(QKVProjArray_converted,
-                        QKVProjArray_converted_shape,
-                        {proj_size_index, token_index, qkv_offset, head_index},
-                        QKVProjArray_cpu[i]);
-  }
-  torch::Tensor QKVProjArray_torch =
-      torch::from_blob(QKVProjArray_converted,
-                       {m->qProjSize, bc->num_active_tokens(), 3, num_heads},
-                       torch::kFloat32);
-
-  //  ----------------------- Comparing C++ & CUDA results ---------------------
-  // std::cout << "QKVProjArray_torch" << std::endl;
-  // for (int i=0; i<num_heads; i++) {
-  //   for (int j=0; j<3; j++) {
-  //     std::cout << QKVProjArray_torch.index({Slice(), Slice(), j, i}) <<
-  //     std::endl;
-  //   }
-  // }
-  // std::cout << "qkv_projs" << std::endl;
-  // for (int i=0; i<num_heads; i++) {
-  //   for (int j=0; j<3; j++) {
-  //     std::cout << qkv_projs.index({Slice(), Slice(), j, i}) << std::endl;
-  //   }
-  // }
-  assert(torch::allclose(QKVProjArray_torch, qkv_projs, 1e-05, 1e-05));
-  free(QKVProjArray_converted);
-
-  // =============================================================================
-  //  Store the K/V projections into the cache
-  // =============================================================================
-
-  //  ----------------------- C++ operations & checks --------------------------
-  // Store projections into k/v cache arrays
-  for (size_t h = 0; h < num_heads; h++) {
-    for (size_t t = 0; t < bc->num_active_tokens(); t++) {
-      for (size_t d = 0; d < m->kProjSize; d++) {
-        size_t kcache_idx =
-            d * MAX_SEQ_LEN * m->num_heads * BatchConfig::MAX_NUM_REQUESTS +
-            bc->tokensInfo[t].abs_depth_in_request * m->num_heads *
-                BatchConfig::MAX_NUM_REQUESTS +
-            h * BatchConfig::MAX_NUM_REQUESTS + bc->tokensInfo[t].request_index;
-        m->kcache[kcache_idx] =
-            qkv_projs.index({(int64_t)d, (int64_t)t, 1, (int64_t)h})
-                .item<float>();
-      }
-      for (size_t d = 0; d < m->vProjSize; d++) {
-        size_t vcache_idx =
-            d * MAX_SEQ_LEN * m->num_heads * BatchConfig::MAX_NUM_REQUESTS +
-            bc->tokensInfo[t].abs_depth_in_request * m->num_heads *
-                BatchConfig::MAX_NUM_REQUESTS +
-            h * BatchConfig::MAX_NUM_REQUESTS + bc->tokensInfo[t].request_index;
-        m->vcache[vcache_idx] =
-            qkv_projs.index({(int64_t)d, (int64_t)t, 2, (int64_t)h})
-                .item<float>();
-      }
-    }
-  }
-  // Create torch tensors from the arrays
-  torch::Tensor K_t = torch::from_blob(
-      m->kcache,
-      {m->kProjSize, MAX_SEQ_LEN, num_heads, BatchConfig::MAX_NUM_REQUESTS},
-      torch::kFloat32);
-  torch::Tensor V_t = torch::from_blob(
-      m->vcache,
-      {m->vProjSize, MAX_SEQ_LEN, num_heads, BatchConfig::MAX_NUM_REQUESTS},
-      torch::kFloat32);
-
-  // Compute useful indices
-  std::vector<size_t> req_idxs;
-  std::vector<size_t> r_first_idx;
-  std::vector<size_t> r_num_tokens;
-  for (size_t t = 0; t < bc->num_active_tokens(); t++) {
-    size_t rid = bc->tokensInfo[t].request_index;
-    if (req_idxs.size() == 0 || req_idxs[req_idxs.size() - 1] != rid) {
-      req_idxs.push_back(rid);
-      r_first_idx.push_back(t);
-      r_num_tokens.push_back(1);
-    } else {
-      r_num_tokens[r_num_tokens.size() - 1]++;
-    }
-    assert(req_idxs.size() == r_first_idx.size() &&
-           r_first_idx.size() == r_num_tokens.size());
-  }
-  assert(req_idxs.size() == bc->num_active_requests());
-  assert(std::accumulate(r_num_tokens.begin(),
-                         r_num_tokens.end(),
-                         decltype(r_num_tokens)::value_type(0)) ==
-         bc->num_active_tokens());
-
-  //  ----------------------- Loading CUDA results for this step ---------------
-  float *keyCache_cpu =
-      download_tensor<float>(m->keyCache,
-                             m->num_heads * m->kProjSize *
-                                 BatchConfig::MAX_NUM_REQUESTS * MAX_SEQ_LEN);
-  float *valueCache_cpu =
-      download_tensor<float>(m->valueCache,
-                             m->num_heads * m->vProjSize *
-                                 BatchConfig::MAX_NUM_REQUESTS * MAX_SEQ_LEN);
-  assert(keyCache_cpu != nullptr);
-  assert(valueCache_cpu != nullptr);
-
-  float *kcache_cuda = (float *)calloc(
-      m->kProjSize * MAX_SEQ_LEN * m->num_heads * BatchConfig::MAX_NUM_REQUESTS,
-      sizeof(float));
-  float *vcache_cuda = (float *)calloc(
-      m->vProjSize * MAX_SEQ_LEN * m->num_heads * BatchConfig::MAX_NUM_REQUESTS,
-      sizeof(float));
-  int index = 0;
-  for (int i = 0; i < m->kProjSize; i++) {
-    for (int j = 0; j < MAX_SEQ_LEN; j++) {
-      for (int k = 0; k < m->num_heads; k++) {
-        for (int l = 0; l < BatchConfig::MAX_NUM_REQUESTS; l++) {
-          int col_major_index = l * m->kProjSize * MAX_SEQ_LEN * m->num_heads +
-                                k * m->kProjSize * MAX_SEQ_LEN +
-                                j * m->kProjSize + i;
-          kcache_cuda[index++] = keyCache_cpu[col_major_index];
-        }
-      }
-    }
-  }
-  index = 0;
-  for (int i = 0; i < m->vProjSize; i++) {
-    for (int j = 0; j < MAX_SEQ_LEN; j++) {
-      for (int k = 0; k < m->num_heads; k++) {
-        for (int l = 0; l < BatchConfig::MAX_NUM_REQUESTS; l++) {
-          int col_major_index = l * m->vProjSize * MAX_SEQ_LEN * m->num_heads +
-                                k * m->vProjSize * MAX_SEQ_LEN +
-                                j * m->vProjSize + i;
-          vcache_cuda[index++] = valueCache_cpu[col_major_index];
-        }
-      }
-    }
-  }
-  torch::Tensor K_t_cuda = torch::from_blob(
-      kcache_cuda,
-      {m->kProjSize, MAX_SEQ_LEN, num_heads, BatchConfig::MAX_NUM_REQUESTS},
-      torch::kFloat32);
-  torch::Tensor V_t_cuda = torch::from_blob(
-      vcache_cuda,
-      {m->vProjSize, MAX_SEQ_LEN, num_heads, BatchConfig::MAX_NUM_REQUESTS},
-      torch::kFloat32);
-
-  //  ----------------------- Comparing C++ & CUDA results ---------------------
-
-  // std::cout << "kcache differences:" << std::endl;
-  // for (int i=0; i < bc->num_active_requests() + 1; i++) {
-  //   for (int j=0; j < num_heads; j++) {
-  //     for (int l=0; l < m->kProjSize; l++) {
-  //       for (int k=0; k < MAX_SEQ_LEN; k++) {
-  //         size_t kcache_idx =
-  //           l * MAX_SEQ_LEN * num_heads * BatchConfig::MAX_NUM_REQUESTS +
-  //           k * num_heads * BatchConfig::MAX_NUM_REQUESTS +
-  //           j * BatchConfig::MAX_NUM_REQUESTS +
-  //           i;
-  //           if ( abs(m->kcache[kcache_idx] - keyCache_cpu[
-  //               i * m->kProjSize * MAX_SEQ_LEN * num_heads +
-  //               j * m->kProjSize * MAX_SEQ_LEN +
-  //               k * m->kProjSize +
-  //               l
-  //           ]) > 0.00001) {
-  //             printf("req: %i (rid: %i), head: %i, data_dim: %i, token_pos:
-  //             %i\n",
-  //                   i, req_idxs[i], j, l, k);
-  //           }
-  //       }
-  //     }
-  //   }
-  // }
-
-  //  std::cout << "keyCache from CUDA:" << std::endl;
-  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
-  //    for (int j=0; j<num_heads; j++) {
-  //     for (int l=0; l<m->kProjSize; l++) {
-  //       for (int k=0; k< MAX_SEQ_LEN; k++) {
-  //         printf("%f ",
-  //           keyCache_cpu[i * m->kProjSize * MAX_SEQ_LEN * num_heads +
-  //               j * m->kProjSize * MAX_SEQ_LEN +
-  //               k * m->kProjSize +
-  //               l
-  //         ]);
-  //       }
-  //       printf("\n");
-  //     }
-  //     printf("\n");
-  //    }
-  //    printf("\n");
-  //  }
-
-  //  std::cout << "valueCache from CUDA:" << std::endl;
-  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
-  //    for (int j=0; j<num_heads; j++) {
-  //       for (int l=0; l<m->vProjSize; l++) {
-  //         for (int k=0; k< MAX_SEQ_LEN; k++) {
-  //           printf("%f ",
-  //             valueCache_cpu[
-  //                 i * m->vProjSize * MAX_SEQ_LEN * num_heads +
-  //                 j * m->vProjSize * MAX_SEQ_LEN +
-  //                 k * m->vProjSize +
-  //             l]);
-  //         }
-  //         printf("\n");
-  //       }
-  //       printf("\n");
-  //    }
-  //    printf("\n");
-  //  }
-
-  //  printf("\n");
-
-  //  std::cout << "C++ kcache:" << std::endl;
-  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
-  //    for (int j=0; j < num_heads; j++) {
-  //       for (int l=0; l < m->kProjSize; l++) {
-  //         for (int k=0; k < MAX_SEQ_LEN; k++) {
-  //           size_t kcache_idx =
-  //             l * MAX_SEQ_LEN * num_heads * BatchConfig::MAX_NUM_REQUESTS +
-  //             k * num_heads * BatchConfig::MAX_NUM_REQUESTS +
-  //             j * BatchConfig::MAX_NUM_REQUESTS +
-  //             i;
-  //           printf("%f ", m->kcache[kcache_idx]);
-  //         }
-  //         printf("\n");
-  //       }
-  //       printf("\n");
-  //    }
-  //    printf("\n");
-  //  }
-
-  //  std::cout << "C++ vcache:" << std::endl;
-  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
-  //    for (int j=0; j<num_heads; j++) {
-  //       for (int l=0; l<m->vProjSize; l++) {
-  //         for (int k=0; k< MAX_SEQ_LEN; k++) {
-  //             size_t vcache_idx =
-  //               l * MAX_SEQ_LEN * num_heads * BatchConfig::MAX_NUM_REQUESTS +
-  //               k * num_heads * BatchConfig::MAX_NUM_REQUESTS +
-  //               j * BatchConfig::MAX_NUM_REQUESTS +
-  //               i;
-  //             printf("%f ", m->vcache[vcache_idx]);
-  //         }
-  //         printf("\n");
-  //       }
-  //       printf("\n");
-  //    }
-  //    printf("\n");
-  //  }
-
-  assert(torch::allclose(K_t_cuda, K_t, 1e-05, 1e-05));
-  assert(torch::allclose(V_t_cuda, V_t, 1e-05, 1e-05));
-  free(kcache_cuda);
-  free(vcache_cuda);
-
-  // =============================================================================
-  //  Load the W_out projection weights
-  // =============================================================================
-
-  //  ----------------------- C++ operations & checks --------------------------
-  float *w_out = (float *)calloc(m->vProjSize * m->num_heads * m->oProjSize,
-                                 sizeof(float));
-  std::vector<int> w_out_shape = {m->vProjSize, m->num_heads, m->oProjSize};
-  assert(m->qProjSize == m->kProjSize && m->kProjSize == m->vProjSize);
-  for (int h = 0; h < num_heads; h++) {
-    for (int v = 0; v < m->vProjSize; v++) {
-      for (int o = 0; o < m->oProjSize; o++) {
-        set_value_row_major(
-            w_out,
-            w_out_shape,
-            {v, h, o},
-            weight_cpu[all_weight_params * h + 3 * m->qProjSize * m->qSize +
-                       m->vProjSize * o + v]);
-      }
-    }
-  }
-  // convert weights to torch tensor
-  torch::Tensor torch_w_out = torch::from_blob(
-      w_out, {m->vProjSize, m->num_heads, m->oProjSize}, torch::kFloat32);
-
-  //  ----------------------- Loading CUDA results for this step ---------------
-  float *w_out_cuda = download_tensor<float>(
-      m->W_out_contiguous, m->vProjSize * m->oProjSize * m->num_heads);
-  assert(w_out_cuda != nullptr);
-  float *converted_wout_tensor = (float *)calloc(
-      m->vProjSize * m->num_heads * m->oProjSize, sizeof(float));
-  std::vector<int> converted_wout_tensor_shape = {
-      m->vProjSize, m->num_heads, m->oProjSize};
-
-  for (int i = 0; i < m->vProjSize * m->num_heads * m->oProjSize; i++) {
-    int v_idx = i % m->vProjSize;
-    int h_idx = (i / m->vProjSize) % m->num_heads;
-    int o_idx = i / (m->vProjSize * m->num_heads);
-    assert(v_idx < m->vProjSize && h_idx < m->num_heads &&
-           o_idx < m->oProjSize);
-    set_value_row_major(converted_wout_tensor,
-                        converted_wout_tensor_shape,
-                        {v_idx, h_idx, o_idx},
-                        w_out_cuda[i]);
-  }
-  torch::Tensor w_out_cuda_tensor =
-      torch::from_blob(converted_wout_tensor,
-                       {m->vProjSize, m->num_heads, m->oProjSize},
-                       torch::kFloat32);
-
-  //  ----------------------- Comparing C++ & CUDA results ---------------------
-  assert(torch::allclose(w_out_cuda_tensor, torch_w_out, 1e-05, 1e-05));
-  free(converted_wout_tensor);
-
-  // =============================================================================
-  //  Compute the softmax(QK^T/sqrt(d_k))V product, request by request
-  // =============================================================================
-
-  //  ----------------------- C++ initialization steps -------------------------
-  torch::Tensor Q_projs = qkv_projs.index({Slice(), Slice(), 0, Slice()})
-                              .reshape({qkv_projs.sizes()[0],
-                                        qkv_projs.sizes()[1],
-                                        qkv_projs.sizes()[3]});
-
-  torch::Tensor qk_products[bc->num_active_requests()];
-  torch::Tensor qk_softmax[bc->num_active_requests()];
-  torch::Tensor attn_heads[bc->num_active_requests()];
-
-  torch::Tensor cpp_output =
-      torch::zeros({m->oProjSize, bc->num_active_tokens()});
-
-  //  ----------------------- Loading CUDA results for this step ---------------
-  float *qk_prods_cpu = download_tensor<float>(
-      m->qk_prods,
-      BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_NUM_TOKENS * num_heads);
-  assert(qk_prods_cpu != nullptr);
-
-  float *qk_prods_softmax_cpu = download_tensor<float>(
-      m->qk_prods_softmax,
-      BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_NUM_TOKENS * num_heads);
-  assert(qk_prods_softmax_cpu != nullptr);
-
-  float *attn_heads_cpu = download_tensor<float>(
-      m->attn_heads, BatchConfig::MAX_NUM_TOKENS * m->num_heads * m->vProjSize);
-  assert(attn_heads_cpu != nullptr);
-
-  //  ----------------------- Main loop (request by request) -------------------
-  size_t qk_prods_cpu_offset = 0;
-
-  for (size_t r = 0; r < bc->num_active_requests(); r++) {
-    // Compute pre-request parameters
-    size_t num_new_tokens = r_num_tokens[r];
-    int64_t rid = (int64_t)(req_idxs[r]);
-    int64_t num_tokens_received_so_far =
-        (int64_t)(bc->requestsInfo[rid].token_start_offset +
-                  bc->requestsInfo[rid].num_tokens_in_batch);
-    assert(num_new_tokens == bc->requestsInfo[rid].num_tokens_in_batch);
-    assert(num_tokens_received_so_far >= (int64_t)num_new_tokens);
-
-    //  ----------------------- C++ computations -------------------------------
-    // Get the slice of the Q projection tensor with the tokens in the current
-    // request
-    torch::Tensor Q_req =
-        Q_projs.index({Slice(),
-                       Slice(r_first_idx[r], r_first_idx[r] + num_new_tokens),
-                       Slice()});
-    // std::cout << "Q_req.sizes(): " << Q_req.sizes() << std::endl;
-    assert(Q_req.sizes()[0] == m->qProjSize);
-    assert(Q_req.sizes()[1] == num_new_tokens);
-    assert(Q_req.sizes()[2] == num_heads);
-
-    /*printf("\n------------ QK multiplication (C++) -------------\n");
-    printf("Request r=%lu. num_new_tokens: %lu, num_tokens_received_so_far: %li,
-    rid: %li, Qproj slice: (%i, %i)\n", r, num_new_tokens,
-    num_tokens_received_so_far, rid, r_first_idx[r], r_first_idx[r] +
-    num_new_tokens);
-
-    std::cout << "Q_req matrix (idk dims):" << std::endl <<
-    Q_req.index({Slice(), Slice(), 0}) << std::endl << std::endl; std::cout <<
-    "K_t matrix (ilk dims):" << std::endl << K_t.index({Slice(), Slice(0,
-    num_tokens_received_so_far), 0, rid}) << std::endl << std::endl; std::cout
-    << "C++ alpha: " << (1.0f / sqrt(m->kProjSize)) << std::endl;*/
-
-    // Compute (Q*K^T)/sqrt(d_k) matmul
-    qk_products[r] =
-        torch::einsum("ijk,ilk->jlk",
-                      {Q_req,
-                       K_t.index({Slice(),
-                                  Slice(0, num_tokens_received_so_far),
-                                  Slice(),
-                                  rid})}) *
-        (1.0f / sqrt(m->kProjSize));
-
-    // Set entries above diagonal to -inf to make attention causal.
-    for (int h = 0; h < num_heads; h++) {
-      qk_products[r].index(
-          {Slice(), Slice(num_tokens_received_so_far - num_new_tokens), h}) =
-          qk_products[r]
-              .index({Slice(),
-                      Slice(num_tokens_received_so_far - num_new_tokens),
-                      h})
-              .tril() +
-          torch::full({(int64_t)num_new_tokens, (int64_t)num_new_tokens},
-                      -INFINITY)
-              .triu()
-              .fill_diagonal_(0);
-    }
-    // Compute softmax for each request block
-    qk_softmax[r] = torch::softmax(qk_products[r], -2);
-    assert(qk_softmax[r].sizes()[0] == num_new_tokens);
-    assert(qk_softmax[r].sizes()[1] == num_tokens_received_so_far);
-    assert(qk_softmax[r].sizes()[2] == m->num_heads);
-
-    //  ------------------- Loading CUDA results for this step ---------------
-    float *converted_qk_prod = (float *)calloc(
-        num_new_tokens * num_tokens_received_so_far * num_heads, sizeof(float));
-    float *converted_qk_prod_softmax = (float *)calloc(
-        num_new_tokens * num_tokens_received_so_far * num_heads, sizeof(float));
-    std::vector<int> converted_qk_prod_shape = {
-        (int)num_new_tokens, (int)num_tokens_received_so_far, (int)num_heads};
-
-    for (size_t i = 0;
-         i < num_new_tokens * num_tokens_received_so_far * num_heads;
-         i++) {
-      size_t new_t_idx = i % num_new_tokens;
-      size_t all_t_idx = (i / num_new_tokens) % num_tokens_received_so_far;
-      size_t head_idx = i / (num_new_tokens * num_tokens_received_so_far);
-      assert(new_t_idx < num_new_tokens &&
-             all_t_idx < num_tokens_received_so_far && head_idx < num_heads);
-      set_value_row_major(converted_qk_prod,
-                          converted_qk_prod_shape,
-                          {(int)new_t_idx, (int)all_t_idx, (int)head_idx},
-                          qk_prods_cpu[i + qk_prods_cpu_offset]);
-      set_value_row_major(converted_qk_prod_softmax,
-                          converted_qk_prod_shape,
-                          {(int)new_t_idx, (int)all_t_idx, (int)head_idx},
-                          qk_prods_softmax_cpu[i + qk_prods_cpu_offset]);
-    }
-    torch::Tensor qk_prods_cuda = torch::from_blob(
-        converted_qk_prod,
-        {(int64_t)num_new_tokens, num_tokens_received_so_far, num_heads},
-        torch::kFloat32);
-    torch::Tensor qk_prods_softmax_cuda = torch::from_blob(
-        converted_qk_prod_softmax,
-        {(int64_t)num_new_tokens, num_tokens_received_so_far, num_heads},
-        torch::kFloat32);
-
-    //  ------------------- Comparing C++ & CUDA results ------------------
-    /* std::cout << "C++:" <<std::endl;
-    for (int h=0; h<num_heads; h++) {
-      std::cout << qk_products[r].index({Slice(), Slice(), h}) << std::endl;
-    }
-    std::cout << "CUDA:" <<std::endl;
-    for (int h=0; h<num_heads; h++) {
-      std::cout << qk_prods_cuda.index({Slice(), Slice(), h}) << std::endl;
-    } */
-    /* //
-    std::cout << "C++:" <<std::endl;
-    for (int h=0; h<num_heads; h++) {
-      std::cout << qk_softmax[r].index({Slice(), Slice(), h}) << std::endl;
-    }
-    std::cout << "CUDA:" <<std::endl;
-    for (int h=0; h<num_heads; h++) {
-      std::cout << qk_prods_softmax_cuda.index({Slice(), Slice(), h}) <<
-    std::endl;
-    } */
-    // std::cout << "C++ tril:" <<std::endl;
-    // for (int h=0; h<num_heads; h++) {
-    //   std::cout << qk_products[r].tril().index({Slice(), Slice(), h}) <<
-    //   std::endl;
-    // }
-    assert(torch::allclose(qk_prods_cuda, qk_products[r], 1e-05, 1e-05));
-    assert(torch::allclose(qk_prods_softmax_cuda, qk_softmax[r], 1e-05, 1e-05));
-    free(converted_qk_prod);
-    free(converted_qk_prod_softmax);
-
-    //  --------------------- C++ computations --------------------------
-    // Multiply softmax results by V
-    assert(
-        V_t.index({Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})
-            .sizes()[0] == m->vProjSize);
-    assert(
-        V_t.index({Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})
-            .sizes()[1] == num_tokens_received_so_far);
-    assert(
-        V_t.index({Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})
-            .sizes()[2] == m->num_heads);
-    attn_heads[r] = torch::einsum(
-        "ijk,ljk->ilk",
-        {qk_softmax[r],
-         V_t.index(
-             {Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})});
-    assert(attn_heads[r].sizes()[0] == num_new_tokens);
-    assert(attn_heads[r].sizes()[1] == m->vProjSize);
-    assert(attn_heads[r].sizes()[2] == m->num_heads);
-
-    //  ------------------- Loading CUDA results for this step  ---------------
-    float converted_attn_heads_cpu[num_new_tokens][m->vProjSize][m->num_heads] =
-        {0};
-    for (int i = 0; i < num_new_tokens * m->vProjSize * m->num_heads; i++) {
-      int token_ix = i % num_new_tokens;
-      int vproj_idx = (i / num_new_tokens) % m->vProjSize;
-      int head_idx = i / (num_new_tokens * m->vProjSize);
-      assert(token_ix < num_new_tokens && vproj_idx < m->vProjSize &&
-             head_idx < m->num_heads);
-      converted_attn_heads_cpu[token_ix][vproj_idx][head_idx] =
-          attn_heads_cpu[r_first_idx[r] * m->vProjSize * m->num_heads + i];
-    }
-    torch::Tensor converted_attn_heads_cuda =
-        torch::from_blob(converted_attn_heads_cpu,
-                         {(int64_t)num_new_tokens, m->vProjSize, m->num_heads},
-                         torch::kFloat32);
-
-    //  -------------------- Comparing C++ & CUDA results -------------------
-    /* std::cout << "CUDA attn head for req " << r << ":" <<std::endl;
-    for (int h=0; h<m->num_heads; h++) {
-      std::cout << converted_attn_heads_cuda.index({Slice(), Slice(), h}) <<
-    std::endl;
-    }
-    std::cout << "C++ attn head for req " << r << ":" <<std::endl;
-    for (int h=0; h<m->num_heads; h++) {
-      std::cout << attn_heads[r].index({Slice(), Slice(), h}) << std::endl;
-    } */
-    assert(torch::allclose(
-        converted_attn_heads_cuda, attn_heads[r], 1e-05, 1e-05));
-
-    //  ----------------------- C++ computations ----------------------------
-    // Compute output values by projecting all heads to output space
-    cpp_output.index(
-        {Slice(),
-         Slice(r_first_idx[r], r_first_idx[r] + (int64_t)num_new_tokens)}) =
-        torch::einsum("jkl,ijk->li", {torch_w_out, attn_heads[r]});
-
-    // increment main loop's auxiliary index
-    qk_prods_cpu_offset +=
-        num_new_tokens * num_tokens_received_so_far * num_heads;
-  }
-
-  //  ----------------------- Comparing C++ & CUDA results ---------------------
-  /* std::cout << "C++:" <<std::endl;
-  for (int i=0; i<m->oProjSize; i++) {
-    std::cout << cpp_output.index({i, Slice()}) << std::endl;
-  }
-  std::cout << "CUDA:" <<std::endl;
-  for (int i=0; i<m->oProjSize; i++) {
-    std::cout << torch_out_cuda.index({i, Slice(0,
-  (int64_t)bc->num_active_tokens())}) << std::endl;
-  } */
-
-  assert(torch::allclose(
-      torch_out_cuda.index(
-          {Slice(), Slice(0, (int64_t)bc->num_active_tokens())}),
-      cpp_output,
-      1e-05,
-      1e-05));
-
-  // =============================================================================
-  //  Cleanup
-  // =============================================================================
-  free(w_out);
-  checkCUDA(cudaFreeHost(input_cpu));
-  checkCUDA(cudaFreeHost(weight_cpu));
-  checkCUDA(cudaFreeHost(output_cpu));
-  checkCUDA(cudaFreeHost(QKVProjArray_cpu));
-  checkCUDA(cudaFreeHost(keyCache_cpu));
-  checkCUDA(cudaFreeHost(valueCache_cpu));
-  checkCUDA(cudaFreeHost(qk_prods_cpu));
-  checkCUDA(cudaFreeHost(qk_prods_softmax_cpu));
-  checkCUDA(cudaFreeHost(attn_heads_cpu));
-  checkCUDA(cudaFreeHost(w_out_cuda));
-  // assert(false && "All good if you see this assert failure! :)");
-#endif
-  // Done with INFERENCE_TESTS block
-}
-
-void IncMultiQuerySelfAttention::backward(FFModel const &ff) {
-  // IncMultiQuerySelfAttention does not support backward
-  assert(false);
-}
-
-bool IncMultiQuerySelfAttention::get_int_parameter(PMParameter para,
-                                                   int *value) const {
-  switch (para) {
-    case PM_NUM_HEADS:
-      *value = num_heads;
-      return true;
-    default:
-      return Op::get_int_parameter(para, value);
-  }
-}
-
-bool IncMultiQuerySelfAttention::measure_operator_cost(
-    Simulator *sim, MachineView const &mv, CostMetrics &cost_metrics) const {
-  return false;
-}
-
-bool operator==(IncMultiQuerySelfAttentionParams const &lhs,
-                IncMultiQuerySelfAttentionParams const &rhs) {
-  return lhs.layer_guid == rhs.layer_guid && lhs.embed_dim == rhs.embed_dim &&
-         lhs.num_heads == rhs.num_heads && lhs.kdim == rhs.kdim &&
-         lhs.vdim == rhs.vdim && lhs.dropout == rhs.dropout &&
-         lhs.bias == rhs.bias && lhs.add_bias_kv == rhs.add_bias_kv &&
-         lhs.add_zero_attn == rhs.add_zero_attn;
-}
-
-IncMultiQuerySelfAttentionParams
-    IncMultiQuerySelfAttention::get_params() const {
-  IncMultiQuerySelfAttentionParams params;
-  params.layer_guid = this->layer_guid;
-  params.embed_dim = this->oProjSize;
-  params.num_heads = this->num_heads;
-  params.kdim = this->kProjSize;
-  params.vdim = this->vProjSize;
-  params.dropout = this->dropout;
-  params.bias = this->bias;
-  params.add_bias_kv = this->add_bias_kv;
-  params.add_zero_attn = this->add_zero_attn;
-
-  return params;
-}
-
-}; // namespace FlexFlow
-
-namespace std {
-size_t hash<FlexFlow::IncMultiQuerySelfAttentionParams>::operator()(
-    FlexFlow::IncMultiQuerySelfAttentionParams const &params) const {
-  size_t key = 0;
-  hash_combine(key, params.layer_guid.id);
-  hash_combine(key, params.embed_dim);
-  hash_combine(key, params.num_heads);
-  hash_combine(key, params.kdim);
-  hash_combine(key, params.vdim);
-  hash_combine(key, params.dropout);
-  hash_combine(key, params.bias);
-  hash_combine(key, params.add_bias_kv);
-  hash_combine(key, params.add_zero_attn);
-  return key;
-}
-}; // namespace std
diff --git a/src/ops/inc_multiquery_self_attention.cpp b/src/ops/inc_multiquery_self_attention.cpp
deleted file mode 100644
index c032e887a7..0000000000
--- a/src/ops/inc_multiquery_self_attention.cpp
+++ /dev/null
@@ -1,96 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "flexflow/ops/inc_multiquery_self_attention.h"
-#include "flexflow/utils/hip_helper.h"
-#include <hip/hip_runtime.h>
-
-namespace FlexFlow {
-
-// declare Legion names
-using Legion::coord_t;
-using Legion::Memory;
-
-/*static*/
-void IncMultiQuerySelfAttention::inference_kernel_wrapper(
-    IncMultiQuerySelfAttentionMeta const *m,
-    BatchConfig const *bc,
-    GenericTensorAccessorR const &input,
-    GenericTensorAccessorR const &weight,
-    GenericTensorAccessorW const &output) {
-  hipStream_t stream;
-  checkCUDA(get_legion_stream(&stream));
-
-  hipEvent_t t_start, t_end;
-  if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
-  }
-
-  handle_unimplemented_hip_kernel(OP_INC_MULTIQUERY_SELF_ATTENTION);
-
-  if (m->profiling) {
-    hipEventRecord(t_end, stream);
-    checkCUDA(hipEventSynchronize(t_end));
-    float elapsed = 0;
-    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
-    printf("IncMultiQuerySelfAttention forward time = %.2fms\n", elapsed);
-    // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
-    // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
-    // acc_output.rect, "[Attention:forward:output]");
-  }
-}
-
-IncMultiQuerySelfAttentionMeta::IncMultiQuerySelfAttentionMeta(
-    FFHandler handler,
-    IncMultiQuerySelfAttention const *attn,
-    GenericTensorAccessorR const &weight,
-    Memory gpu_mem,
-    int num_samples)
-    : OpMeta(handler, attn) {
-  hipStream_t stream;
-  checkCUDA(get_legion_stream(&stream));
-  checkCUDNN(miopenSetStream(handler.dnn, stream));
-}
-
-IncMultiQuerySelfAttentionMeta::IncMultiQuerySelfAttentionMeta(
-    FFHandler handler,
-    InferenceMode infer_mode,
-    Op const *attn,
-    int _qSize,
-    int _kSize,
-    int _vSize,
-    int _qProjSize,
-    int _kProjSize,
-    int _vProjSize,
-    int _oProjSize,
-    int _embed_dim,
-    bool _bias,
-    bool _add_bias_kv,
-    GenericTensorAccessorR const &weight,
-    Legion::Memory gpu_mem,
-    int num_samples)
-    : OpMeta(handler, attn) {
-  hipStream_t stream;
-  checkCUDA(get_legion_stream(&stream));
-  checkCUDNN(miopenSetStream(handler.dnn, stream));
-}
-
-IncMultiQuerySelfAttentionMeta::~IncMultiQuerySelfAttentionMeta(void) {}
-
-}; // namespace FlexFlow
diff --git a/src/ops/inc_multiquery_self_attention.cu b/src/ops/inc_multiquery_self_attention.cu
deleted file mode 100644
index 1193219c9c..0000000000
--- a/src/ops/inc_multiquery_self_attention.cu
+++ /dev/null
@@ -1,797 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
-#include "cuComplex.h"
-#endif
-#include "flexflow/ffconst_utils.h"
-#include "flexflow/ops/inc_multiquery_self_attention.h"
-#include "flexflow/utils/cuda_helper.h"
-
-namespace FlexFlow {
-
-// declare Legion names
-using Legion::coord_t;
-using Legion::Memory;
-
-namespace Kernels {
-namespace IncMultiHeadAttention {
-
-template <typename DT>
-__global__ void apply_rotary_embedding_multi_query(
-    DT *input_ptr,
-    cuFloatComplex *complex_input,
-    BatchConfig::PerTokenInfo const *tokenInfos,
-    int qProjSize,
-    int kProjSize,
-    int num_heads,
-    int num_tokens,
-    int q_block_size,
-    int k_block_size,
-    int v_block_size,
-    bool q_tensor) {
-  int proj_size = q_tensor ? qProjSize : kProjSize;
-  int real_num_heads = q_tensor ? num_heads : 1;
-
-  CUDA_KERNEL_LOOP(i, num_tokens * proj_size * real_num_heads / 2) {
-    // create complex number
-    int head_idx = q_tensor ? i / (num_tokens * proj_size / 2) : 0;
-    int idx = i % (num_tokens * proj_size / 2);
-    int token_idx =
-        (i - head_idx * (num_tokens * proj_size / 2)) / (proj_size / 2);
-
-    int real_part_index =
-        idx + token_idx * (proj_size / 2) +
-        (q_tensor ? head_idx * q_block_size : num_heads * q_block_size);
-    int complex_part_index = real_part_index + (proj_size / 2);
-
-    complex_input[i] = {input_ptr[real_part_index],
-                        input_ptr[complex_part_index]};
-
-    // get the freq_cis: shape 1 * (qProjSize/2) = 1 * 64
-    // apply a Cartesian coordinate transformation
-    // multiple with input & /copy back to q/k
-
-    // get position of token
-    //  int head_idx = i / (num_tokens * proj_size);
-
-    // size_t pos = id_map[token_idx].token_position;
-    size_t pos = tokenInfos[token_idx].abs_depth_in_request;
-
-    // float before_real = complex_input[i].x, before_complex =
-    // complex_input[i].y;
-    int pos_i = i % (proj_size / 2);
-    float freq = pos * (1.0 / pow(10000.0, (float)2 * pos_i / proj_size));
-    cuFloatComplex complex_pos = {cos(freq), sin(freq)};
-
-    complex_input[i] = cuCmulf(complex_input[i], complex_pos);
-
-    input_ptr[real_part_index] = complex_input[i].x;
-    input_ptr[complex_part_index] = complex_input[i].y;
-  }
-}
-
-template <typename DT>
-void compute_qkv_kernel(IncMultiQuerySelfAttentionMeta const *m,
-                        BatchConfig const *bc,
-                        DT const *input_ptr,
-                        DT const *weight_ptr,
-                        DT *output_ptr,
-                        cudaStream_t stream) {
-
-  checkCUDA(cublasSetStream(m->handle.blas, stream));
-  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
-  DT alpha = 1.0f, beta = 0.0f;
-  assert(m->qSize == m->vSize && m->qSize == m->kSize);
-  cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
-#if CUDA_VERSION >= 11000
-  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
-  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
-#else
-  cudaDataType_t compute_type = cublas_data_type;
-#endif
-  // Compute (W^T)x matmul: einsum(ijkl,im->jmkl)
-  // Weights: qSize x qProjSize x 3 x num_heads
-  // Input: qSize x num_tokens
-  // Output >>> qProjSize x num_tokens x 3 x num_heads
-  int num_tokens = bc->num_active_tokens();
-  int m_q = m->qProjSize;
-  int n = bc->num_active_tokens();
-  int k = m->qSize;
-  int lda = k, ldb = k, ldc = m_q;
-  size_t strideA = m_q * k;
-  size_t strideB = 0;
-  size_t strideC = m_q * n; // size of the output block for each head.
-  // q
-  checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                       CUBLAS_OP_T,
-                                       CUBLAS_OP_N,
-                                       m_q,
-                                       n,
-                                       k,
-                                       &alpha,
-                                       weight_ptr,
-                                       cublas_data_type,
-                                       lda,
-                                       strideA,
-                                       input_ptr,
-                                       cublas_data_type,
-                                       ldb,
-                                       strideB,
-                                       &beta,
-                                       output_ptr,
-                                       cublas_data_type,
-                                       ldc,
-                                       strideC,
-                                       m->num_heads,
-                                       compute_type,
-                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-  // k
-  int m_ = m->kProjSize;
-  int k_ = m->embed_dim;
-  int n_ = num_tokens;
-  lda = k_, ldb = k_, ldc = m_;
-  checkCUDA(cublasGemmEx(m->handle.blas,
-                         CUBLAS_OP_T,
-                         CUBLAS_OP_N,
-                         m_,
-                         n_,
-                         k_,
-                         &alpha,
-                         weight_ptr + m->embed_dim * m->embed_dim,
-                         cublas_data_type,
-                         lda,
-                         input_ptr,
-                         cublas_data_type,
-                         ldb,
-                         &beta,
-                         output_ptr + num_tokens * m->embed_dim,
-                         cublas_data_type,
-                         ldc,
-                         compute_type,
-                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-
-  // v
-  checkCUDA(
-      cublasGemmEx(m->handle.blas,
-                   CUBLAS_OP_T,
-                   CUBLAS_OP_N,
-                   m_,
-                   n_,
-                   k_,
-                   &alpha,
-                   weight_ptr + m->embed_dim * (m->embed_dim + m->kProjSize),
-                   cublas_data_type,
-                   lda,
-                   input_ptr,
-                   cublas_data_type,
-                   ldb,
-                   &beta,
-                   output_ptr + num_tokens * (m->embed_dim + m->kProjSize),
-                   cublas_data_type,
-                   ldc,
-                   compute_type,
-                   CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-  // save_tensor<DT>(output_ptr, 4544 *
-  // 7,"/home/ubuntu/FlexFlow/inference/q_before.txt");
-  int q_block_size = m->qProjSize * num_tokens;
-  int k_block_size = m->kProjSize * num_tokens;
-  int v_block_size = m->vProjSize * num_tokens;
-  int parallelism = m->qProjSize * num_tokens * m->num_heads / 2;
-  apply_rotary_embedding_multi_query<<<GET_BLOCKS(parallelism),
-                                       min(CUDA_NUM_THREADS, parallelism),
-                                       0,
-                                       stream>>>(output_ptr,
-                                                 m->complex_input,
-                                                 m->token_infos,
-                                                 m->qProjSize,
-                                                 m->kProjSize,
-                                                 m->num_heads,
-                                                 num_tokens,
-                                                 q_block_size,
-                                                 k_block_size,
-                                                 v_block_size,
-                                                 true);
-  parallelism = m->kProjSize * num_tokens / 2;
-  apply_rotary_embedding_multi_query<<<GET_BLOCKS(parallelism),
-                                       min(CUDA_NUM_THREADS, parallelism),
-                                       0,
-                                       stream>>>(output_ptr,
-                                                 m->complex_input,
-                                                 m->token_infos,
-                                                 m->qProjSize,
-                                                 m->kProjSize,
-                                                 m->num_heads,
-                                                 num_tokens,
-                                                 q_block_size,
-                                                 k_block_size,
-                                                 v_block_size,
-                                                 false);
-
-  // save_tensor<DT>(output_ptr, 64 * 7 * 2,
-  // "/home/ubuntu/FlexFlow/inference/query.txt");
-  // save_tensor<DT>(output_ptr, 4544 *
-  // 7,"/home/ubuntu/FlexFlow/inference/q.txt"); print_tensor<DT>(output_ptr
-  // + num_new_tokens * (m->embed_dim + m->kProjSize), 32, "vvvvvvvvv");
-}
-
-template <typename DT>
-void update_kv_cache_kernel(IncMultiQuerySelfAttentionMeta const *m,
-                            BatchConfig const *bc,
-                            cudaStream_t stream) {
-  int num_tokens = bc->num_active_tokens();
-  if (num_tokens > 0) {
-    int parallelism = m->kProjSize * num_tokens;
-    store_kv_cache_multi_query<<<GET_BLOCKS(parallelism),
-                                 min(CUDA_NUM_THREADS, parallelism),
-                                 0,
-                                 stream>>>(
-        static_cast<DT *>(m->devQKVProjArray),
-        static_cast<DT *>(m->keyCache),
-        m->token_infos,
-        m->qProjSize,
-        m->kProjSize,
-        m->vProjSize,
-        num_tokens,
-        m->num_heads,
-        BatchConfig::MAX_SEQ_LENGTH,
-        /* k_cache = */ true);
-
-    parallelism = m->vProjSize * num_tokens;
-    store_kv_cache_multi_query<<<GET_BLOCKS(parallelism),
-                                 min(CUDA_NUM_THREADS, parallelism),
-                                 0,
-                                 stream>>>(
-        static_cast<DT *>(m->devQKVProjArray),
-        static_cast<DT *>(m->valueCache),
-        m->token_infos,
-        m->qProjSize,
-        m->kProjSize,
-        m->vProjSize,
-        num_tokens,
-        m->num_heads,
-        BatchConfig::MAX_SEQ_LENGTH,
-        /* k_cache = */ false);
-  }
-}
-
-template <typename DT>
-void inference_kernel(IncMultiQuerySelfAttentionMeta const *m,
-                      BatchConfig const *bc,
-                      DT const *input_ptr,
-                      DT const *weight_ptr,
-                      DT *output_ptr,
-                      cudaStream_t stream) {
-  // here because we need postion info in infernece 1
-  cudaMemcpyAsync(m->token_infos,
-                  &(bc->tokensInfo),
-                  bc->MAX_NUM_TOKENS * sizeof(BatchConfig::PerTokenInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
-  // phase 1: Implement kernel to compute KQV for input tokens
-  compute_qkv_kernel(m,
-                     bc,
-                     input_ptr,
-                     weight_ptr,
-                     static_cast<DT *>(m->devQKVProjArray),
-                     stream);
-
-  // phase 2: Update key/val cache
-  update_kv_cache_kernel<DT>(m, bc, stream);
-
-  // phase 3: Compute attention score
-  // 3 kernels for pahse 3: matmul1 - softmax - matmal2
-  compute_attention_kernel(m, bc, output_ptr, weight_ptr, stream);
-}
-
-} // namespace IncMultiHeadAttention
-} // namespace Kernels
-
-using namespace Kernels::IncMultiHeadAttention;
-
-template <typename DT>
-__global__ void
-    store_kv_cache_multi_query(DT const *devQKVProjArray,
-                               DT *cache_ptr,
-                               BatchConfig::PerTokenInfo const *tokenInfos,
-                               int qProjSize,
-                               int kProjSize,
-                               int vProjSize,
-                               int num_tokens,
-                               int num_heads,
-                               int max_seq_len,
-                               bool k_cache) {
-  CUDA_KERNEL_LOOP(i, num_tokens * (k_cache ? kProjSize : vProjSize)) {
-    int proj_size = k_cache ? kProjSize : vProjSize;
-    // int head_idx = i / (num_tokens * proj_size);
-    // int token_idx = (i - head_idx * (num_tokens * proj_size)) / proj_size;
-    int token_idx = i / proj_size;
-    int data_idx = i % proj_size;
-
-    // int qkv_block_size = (qProjSize + kProjSize + vProjSize) * num_tokens;
-    // int current_head_block_size =
-    //     num_tokens * (k_cache ? qProjSize : qProjSize + kProjSize);
-
-    // |q|k|v|
-    int pre_size = num_tokens * qProjSize * num_heads +
-                   (k_cache ? 0 : kProjSize * num_tokens);
-
-    DT val = devQKVProjArray[pre_size + token_idx * proj_size + data_idx];
-    // int const req_id = id_map[token_idx].request_index;
-    // int const tok_id = id_map[token_idx].token_position;
-    int const req_id = tokenInfos[token_idx].request_index;
-    int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
-    cache_ptr[req_id * (max_seq_len * proj_size) + tok_id * proj_size +
-              data_idx] = val;
-  }
-}
-
-template <typename DT>
-__global__ void
-    fill_entries_above_diagonal_multi_query(DT *matrix,
-                                            size_t num_rows,
-                                            size_t num_cols,
-                                            size_t num_heads,
-                                            size_t entries_above_diagonal,
-                                            DT value) {
-  CUDA_KERNEL_LOOP(i, entries_above_diagonal * num_heads) {
-    size_t head_idx = i / entries_above_diagonal;
-    size_t entry_idx = i % entries_above_diagonal;
-    size_t y = (-1 + sqrt(8 * (float)entry_idx + 1)) / 2;
-    size_t x = entry_idx - y * (y + 1) / 2;
-    y += (num_cols - num_rows) + 1;
-    matrix[head_idx * num_rows * num_cols + num_cols * y + x] = value;
-  }
-}
-
-template <typename DT>
-void compute_attention_kernel(IncMultiQuerySelfAttentionMeta const *m,
-                              BatchConfig const *bc,
-                              DT *output_ptr,
-                              DT const *weight_ptr,
-                              cudaStream_t stream) {
-  checkCUDA(cublasSetStream(m->handle.blas, stream));
-  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
-  cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
-  cudnnDataType_t cudnn_data_type = ff_to_cudnn_datatype(m->output_type[0]);
-  assert(data_type_size(m->output_type[0]) == sizeof(DT));
-#if CUDA_VERSION >= 11000
-  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
-  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
-#else
-  cudaDataType_t compute_type = cublas_data_type;
-#endif
-  // int num_requests = bc->num_active_requests();
-  int num_tokens = bc->num_active_tokens();
-  int tokens_previous_requests = 0;
-  int qkv_block_size = (m->qProjSize) * num_tokens;
-  int kt_block_size = m->kProjSize * BatchConfig::MAX_SEQ_LENGTH;
-  int kt_req_block_size = kt_block_size;
-  int vt_block_size = m->vProjSize * BatchConfig::MAX_SEQ_LENGTH;
-  int vt_req_block_size = vt_block_size;
-  assert(m->qProjSize == m->kProjSize);
-
-  for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
-    if (bc->request_completed[i]) {
-      continue;
-    }
-    int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
-    int total_tokens = bc->requestsInfo[i].token_start_offset +
-                       bc->requestsInfo[i].num_tokens_in_batch;
-    // bc->token_last_available_idx[i] + 1;
-    // Compute (QK^T/sqrt(d_k))
-    int m_ = num_new_tokens;
-    int n = total_tokens;
-    int k = m->qProjSize;
-    int lda = k, ldb = k, ldc = m_;
-    int strideA = qkv_block_size;
-    int strideB = 0;
-    int strideC = num_new_tokens * total_tokens;
-
-    // a flag of using this scaling alpha
-    DT alpha = 1.0f, beta = 0.0f;
-    alpha = static_cast<DT>(1.0f / sqrt(m->kProjSize));
-    // To get A, skip over Q entries from previous requests (same head)
-    void const *A = static_cast<DT *>(m->devQKVProjArray) +
-                    tokens_previous_requests * m->qProjSize;
-    // To get B, skip over K entries from previous requests (all heads +
-    // padding)
-    void const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
-    // To get C, skip over QK^T products from previous requests
-    void *C = (void *)(m->qk_prods);
-
-    checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                         CUBLAS_OP_T,
-                                         CUBLAS_OP_N,
-                                         m_,
-                                         n,
-                                         k,
-                                         &alpha,
-                                         A,
-                                         cublas_data_type,
-                                         lda,
-                                         strideA,
-                                         B,
-                                         cublas_data_type,
-                                         ldb,
-                                         strideB,
-                                         &beta,
-                                         C,
-                                         cublas_data_type,
-                                         ldc,
-                                         strideC,
-                                         m->num_heads,
-                                         compute_type,
-                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-    // save_tensor<DT>(
-    //     (DT *)A, 64 * 7 * 2, "/home/ubuntu/FlexFlow/inference/query.txt");
-    // save_tensor<DT>((DT *)B, 64 * 7,
-    // "/home/ubuntu/FlexFlow/inference/key.txt"); print_tensor<DT>((DT
-    // *)m->qk_prods, 32, "output qkprod");
-
-    // Fill all elements above diagonal in qk prods with -inf to force
-    // causal attention.
-    assert(num_new_tokens <= total_tokens);
-    size_t entries_above_diagonal = num_new_tokens * (num_new_tokens - 1) / 2;
-    if (entries_above_diagonal > 0) {
-      size_t parallelism = m->num_heads * entries_above_diagonal;
-      fill_entries_above_diagonal_multi_query<<<GET_BLOCKS(parallelism),
-                                                min((size_t)CUDA_NUM_THREADS,
-                                                    parallelism),
-                                                0,
-                                                stream>>>(
-          static_cast<DT *>(C),
-          num_new_tokens,
-          total_tokens,
-          m->num_heads,
-          entries_above_diagonal,
-          static_cast<DT>(-INFINITY));
-    }
-    // Compute Softmax(QK^T/sqrt(d_k))
-    cudnnTensorDescriptor_t qk_tensor;
-    checkCUDNN(cudnnCreateTensorDescriptor(&qk_tensor));
-    // Before modifying the parameters below, make sure to read the following
-    // description of the CUDNN_TENSOR_NCHW tensor layout, from
-    // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#cudnnTensorFormat_t:
-    // This tensor format specifies that the data is laid out in the following
-    // order: batch size, feature maps, rows, columns. The strides are
-    // implicitly defined in such a way that the data are contiguous in memory
-    // with no padding between images, feature maps, rows, and columns; the
-    // columns are the inner dimension and the images are the outermost
-    // dimension.
-    int n_param = m->num_heads;
-    int c_param = total_tokens;
-    int h_param = 1;
-    int w_param = num_new_tokens;
-    checkCUDNN(cudnnSetTensor4dDescriptor(qk_tensor,
-                                          CUDNN_TENSOR_NCHW,
-                                          cudnn_data_type,
-                                          n_param,
-                                          c_param,
-                                          h_param,
-                                          w_param));
-    float softmax_alpha = 1.0f, softmax_beta = 0.0f;
-    void *C_softmax = (void *)(m->qk_prods_softmax);
-    // The softmax operation below is executed according to the
-    // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
-    // softmax operation is computed per spatial location (H,W) per image (N)
-    // across dimension C.
-    checkCUDNN(cudnnSoftmaxForward(m->handle.dnn,
-                                   CUDNN_SOFTMAX_ACCURATE,
-                                   CUDNN_SOFTMAX_MODE_CHANNEL,
-                                   &softmax_alpha,
-                                   qk_tensor,
-                                   C,
-                                   &softmax_beta,
-                                   qk_tensor,
-                                   C_softmax));
-    // Matmul softmax(QK^T/sqrt(d_k)) by V
-    alpha = 1.0f, beta = 0.0f;
-    m_ = num_new_tokens;
-    n = m->vProjSize;
-    k = total_tokens;
-    lda = m_, ldb = n, ldc = m_;
-    strideA = num_new_tokens * total_tokens;
-    strideB = 0;
-    strideC = num_new_tokens * m->vProjSize;
-    // To get A, skip over softmax(QK^T/sqrt(d_k)) entries from previous
-    // requests (all heads)
-    A = static_cast<DT *>(C_softmax);
-    // To get B, skip over V^T entries from previous requests (all heads +
-    // padding)
-    B = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
-    // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
-    // requests
-    C = static_cast<DT *>(m->attn_heads) +
-        tokens_previous_requests * m->num_heads * m->vProjSize;
-
-    checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                         CUBLAS_OP_N,
-                                         CUBLAS_OP_T,
-                                         m_,
-                                         n,
-                                         k,
-                                         &alpha,
-                                         A,
-                                         cublas_data_type,
-                                         lda,
-                                         strideA,
-                                         B,
-                                         cublas_data_type,
-                                         ldb,
-                                         strideB,
-                                         &beta,
-                                         C,
-                                         cublas_data_type,
-                                         ldc,
-                                         strideC,
-                                         m->num_heads,
-                                         compute_type,
-                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-    // Project to output, save result directly on output tensor
-    alpha = 1.0f, beta = 0.0f;
-    m_ = m->oProjSize;
-    k = m->vProjSize * m->num_heads;
-    n = num_new_tokens;
-    lda = k, ldb = n, ldc = m_;
-    A = weight_ptr +
-        m->embed_dim * (m->embed_dim + m->kProjSize + m->vProjSize);
-    B = C;
-    C = (output_ptr + tokens_previous_requests * m->oProjSize);
-
-    checkCUDA(cublasGemmEx(m->handle.blas,
-                           CUBLAS_OP_T,
-                           CUBLAS_OP_T,
-                           m_,
-                           n,
-                           k,
-                           &alpha,
-                           A,
-                           cublas_data_type,
-                           lda,
-                           B,
-                           cublas_data_type,
-                           ldb,
-                           &beta,
-                           C,
-                           cublas_data_type,
-                           ldc,
-                           compute_type,
-                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-
-    tokens_previous_requests += num_new_tokens;
-  }
-
-  // print_tensor<DT>(output_ptr, 32, "output 3");
-  // save_tensor<DT>(
-  //     output_ptr, 7 * 4544, "/home/ubuntu/FlexFlow/inference/op.txt");
-  // assert(false);
-
-  assert(tokens_previous_requests == num_tokens);
-}
-
-/*static*/
-void IncMultiQuerySelfAttention::inference_kernel_wrapper(
-    IncMultiQuerySelfAttentionMeta const *m,
-    BatchConfig const *bc,
-    GenericTensorAccessorR const &input,
-    GenericTensorAccessorR const &weight,
-    GenericTensorAccessorW const &output) {
-  cudaStream_t stream;
-  checkCUDA(get_legion_stream(&stream));
-  // bool use_bias = *m->bias;
-
-  cudaEvent_t t_start, t_end;
-  if (m->profiling) {
-    cudaEventCreate(&t_start);
-    cudaEventCreate(&t_end);
-    cudaEventRecord(t_start, stream);
-  }
-
-  assert(input.data_type == weight.data_type);
-  assert(input.data_type == output.data_type);
-  if (input.data_type == DT_HALF) {
-    Kernels::IncMultiHeadAttention::inference_kernel(m,
-                                                     bc,
-                                                     input.get_half_ptr(),
-                                                     weight.get_half_ptr(),
-                                                     output.get_half_ptr(),
-                                                     stream);
-  } else if (input.data_type == DT_FLOAT) {
-    Kernels::IncMultiHeadAttention::inference_kernel(m,
-                                                     bc,
-                                                     input.get_float_ptr(),
-                                                     weight.get_float_ptr(),
-                                                     output.get_float_ptr(),
-                                                     stream);
-  } else {
-    assert(false && "Unspported data type");
-  }
-  if (m->profiling) {
-    cudaEventRecord(t_end, stream);
-    checkCUDA(cudaEventSynchronize(t_end));
-    float elapsed = 0;
-    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
-    cudaEventDestroy(t_start);
-    cudaEventDestroy(t_end);
-    printf("IncMultiQuerySelfAttention forward time = %.2fms\n", elapsed);
-    // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
-    // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
-    // acc_output.rect, "[Attention:forward:output]");
-  }
-}
-
-IncMultiQuerySelfAttentionMeta::IncMultiQuerySelfAttentionMeta(
-    FFHandler handler,
-    IncMultiQuerySelfAttention const *attn,
-    GenericTensorAccessorR const &weight,
-    Memory gpu_mem,
-    int num_samples)
-    : IncMultiQuerySelfAttentionMeta(handler,
-                                     INC_DECODING_MODE,
-                                     attn,
-                                     attn->qSize,
-                                     attn->kSize,
-                                     attn->vSize,
-                                     attn->qProjSize,
-                                     attn->kProjSize,
-                                     attn->vProjSize,
-                                     attn->oProjSize,
-                                     attn->embed_dim,
-                                     attn->bias,
-                                     attn->add_bias_kv,
-                                     weight,
-                                     gpu_mem,
-                                     num_samples) {}
-
-IncMultiQuerySelfAttentionMeta::IncMultiQuerySelfAttentionMeta(
-    FFHandler handler,
-    InferenceMode infer_mode,
-    Op const *attn,
-    int _qSize,
-    int _kSize,
-    int _vSize,
-    int _qProjSize,
-    int _kProjSize,
-    int _vProjSize,
-    int _oProjSize,
-    int _embed_dim,
-    bool _bias,
-    bool _add_bias_kv,
-    GenericTensorAccessorR const &weight,
-    Memory gpu_mem,
-    int num_samples)
-    : OpMeta(handler, attn) {
-  cudaStream_t stream;
-  checkCUDA(get_legion_stream(&stream));
-  checkCUDNN(cudnnSetStream(handler.dnn, stream));
-  qSize = _qSize;
-  kSize = _kSize;
-  vSize = _vSize;
-  embed_dim = _embed_dim;
-  // assume dimensions match for now
-  assert(qSize == kSize);
-  assert(kSize == vSize);
-  qProjSize = _qProjSize;
-  kProjSize = _kProjSize;
-  assert(qProjSize == kProjSize); // required for attention QK^T matmul
-  vProjSize = _vProjSize;
-  oProjSize = _oProjSize;
-  size_t size_of_dt = data_type_size(attn->data_type);
-
-  num_heads = _embed_dim / qProjSize;
-  weights_params = (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize +
-                    oProjSize * (vProjSize > 0 ? vProjSize : vSize));
-  weightSize = (_embed_dim + _embed_dim + kProjSize + vProjSize) * _embed_dim *
-               size_of_dt;
-  has_load_weights = (bool *)calloc(1, sizeof(bool));
-  *has_load_weights = false;
-  bias = (bool *)calloc(1, sizeof(bool));
-  *bias = _bias;
-  assert(!_add_bias_kv);
-
-#ifdef INFERENCE_TESTS
-  kcache = (float *)calloc(kProjSize * BatchConfig::MAX_SEQ_LENGTH * num_heads *
-                               BatchConfig::MAX_NUM_REQUESTS,
-                           sizeof(float));
-  vcache = (float *)calloc(vProjSize * BatchConfig::MAX_SEQ_LENGTH * num_heads *
-                               BatchConfig::MAX_NUM_REQUESTS,
-                           sizeof(float));
-#endif
-
-  // allocate memory for the seqArray and reserve space
-  {
-    // size_t qkv_proj_dim = qProjSize + kProjSize + vProjSize;
-
-    size_t qkv_max_proj_size = BatchConfig::MAX_NUM_TOKENS *
-                               (qProjSize * num_heads + kProjSize + vProjSize);
-    size_t key_cache_size = 0, value_cache_size = 0;
-    switch (infer_mode) {
-      case INC_DECODING_MODE:
-      case TREE_VERIFY_MODE: {
-        key_cache_size = kProjSize * BatchConfig::MAX_NUM_REQUESTS *
-                         BatchConfig::MAX_SEQ_LENGTH;
-        value_cache_size = vProjSize * BatchConfig::MAX_NUM_REQUESTS *
-                           BatchConfig::MAX_SEQ_LENGTH;
-        break;
-      }
-      case BEAM_SEARCH_MODE: {
-        key_cache_size = kProjSize * BeamSearchBatchConfig::MAX_NUM_REQUESTS *
-                         BatchConfig::MAX_SEQ_LENGTH *
-                         BeamSearchBatchConfig::MAX_BEAM_WIDTH;
-        value_cache_size = vProjSize * BeamSearchBatchConfig::MAX_NUM_REQUESTS *
-                           BatchConfig::MAX_SEQ_LENGTH *
-                           BeamSearchBatchConfig::MAX_BEAM_WIDTH;
-        break;
-      }
-      default:
-        assert(false && "Unkown inference mode");
-    }
-    size_t tokeninfo_size = BatchConfig::MAX_NUM_TOKENS;
-    size_t qk_prod_size =
-        BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_SEQ_LENGTH * num_heads;
-    size_t attn_heads_size =
-        BatchConfig::MAX_NUM_TOKENS * num_heads * vProjSize;
-    size_t complex_size =
-        (BatchConfig::MAX_NUM_TOKENS * qProjSize * num_heads) / 2;
-    size_t totalSize =
-        (qkv_max_proj_size + key_cache_size + value_cache_size +
-         2 * qk_prod_size + attn_heads_size) *
-            size_of_dt +
-        tokeninfo_size * sizeof(BatchConfig::PerTokenInfo) +
-        complex_size * sizeof(cuFloatComplex); // more components will
-                                               // be added here later
-
-    Realm::Rect<1, coord_t> bounds(Realm::Point<1, coord_t>(0),
-                                   Realm::Point<1, coord_t>(totalSize - 1));
-    std::vector<size_t> field_sizes;
-    field_sizes.push_back(sizeof(char));
-    Realm::RegionInstance::create_instance(reserveInst,
-                                           gpu_mem,
-                                           bounds,
-                                           field_sizes,
-                                           0,
-                                           Realm::ProfilingRequestSet())
-        .wait();
-    off_t offset = 0;
-    devQKVProjArray = reserveInst.pointer_untyped(offset, 0);
-    offset += qkv_max_proj_size * size_of_dt;
-    keyCache = reserveInst.pointer_untyped(offset, 0);
-    offset += key_cache_size * size_of_dt;
-    valueCache = reserveInst.pointer_untyped(offset, 0);
-    offset += value_cache_size * size_of_dt;
-    token_infos = reserveInst.pointer<BatchConfig::PerTokenInfo>(offset);
-    offset += sizeof(BatchConfig::PerTokenInfo) * tokeninfo_size;
-    qk_prods = reserveInst.pointer_untyped(offset, 0);
-    offset += qk_prod_size * size_of_dt;
-    qk_prods_softmax = reserveInst.pointer_untyped(offset, 0);
-    offset += qk_prod_size * size_of_dt;
-    attn_heads = reserveInst.pointer_untyped(offset, 0);
-    offset += attn_heads_size * size_of_dt;
-    complex_input = reserveInst.pointer<cuFloatComplex>(offset);
-    offset += complex_size * sizeof(cuFloatComplex);
-    assert(offset == totalSize);
-  }
-  cudaStreamSynchronize(stream);
-}
-
-IncMultiQuerySelfAttentionMeta::~IncMultiQuerySelfAttentionMeta(void) {
-  reserveInst.destroy();
-#ifdef INFERENCE_TESTS
-  free(kcache);
-  free(vcache);
-#endif
-}
-
-}; // namespace FlexFlow
diff --git a/src/ops/spec_inc_multihead_self_attention.cc b/src/ops/spec_inc_multihead_self_attention.cc
index fe241bb8de..c4b4214f69 100644
--- a/src/ops/spec_inc_multihead_self_attention.cc
+++ b/src/ops/spec_inc_multihead_self_attention.cc
@@ -60,6 +60,7 @@ Tensor
     FFModel::spec_inc_multihead_self_attention(const Tensor input,
                                                int embed_dim,
                                                int num_heads,
+                                               int num_kv_heads,
                                                int kdim,
                                                int vdim,
                                                float dropout,
@@ -116,9 +117,11 @@ Tensor
   int kParas = kProjSize * kSize;
   int vParas = vProjSize * vSize;
   int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
+  int weight_size = qParas * num_heads + kParas * num_kv_heads +
+                    vParas * num_kv_heads + oParas * num_heads;
   {
-    int dims[2] = {qParas + kParas + vParas + oParas, num_heads};
-    li->weights[0] = create_weight_legion_ordering(2,
+    int dims[1] = {weight_size};
+    li->weights[0] = create_weight_legion_ordering(1,
                                                    dims,
                                                    data_type,
                                                    li,
@@ -128,7 +131,8 @@ Tensor
   }
   if (bias) {
     // q, k, v, o
-    int dims[1] = {(qProjSize + kProjSize + vProjSize) * num_heads + oProjSize};
+    int dims[1] = {qProjSize * num_heads +
+                   (kProjSize + vProjSize) * num_kv_heads + oProjSize};
     li->weights[1] = create_weight_legion_ordering(1,
                                                    dims,
                                                    data_type,
@@ -140,6 +144,7 @@ Tensor
   li->data_type = data_type;
   li->add_int_property("embed_dim", embed_dim);
   li->add_int_property("num_heads", num_heads);
+  li->add_int_property("num_kv_heads", num_kv_heads);
   li->add_int_property("kdim", kdim);
   li->add_int_property("vdim", vdim);
   li->add_int_property("bias", bias);
@@ -165,6 +170,8 @@ Op *SpecIncMultiHeadSelfAttention::create_operator_from_layer(
   int embed_dim = value;
   layer->get_int_property("num_heads", value);
   int num_heads = value;
+  layer->get_int_property("num_kv_heads", value);
+  int num_kv_heads = value;
   layer->get_int_property("kdim", value);
   int kdim = value;
   layer->get_int_property("vdim", value);
@@ -190,6 +197,7 @@ Op *SpecIncMultiHeadSelfAttention::create_operator_from_layer(
                                            inputs[0],
                                            embed_dim,
                                            num_heads,
+                                           num_kv_heads,
                                            kdim,
                                            vdim,
                                            dropout,
@@ -210,6 +218,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     const ParallelTensor _input,
     int _embed_dim,
     int _num_heads,
+    int _num_kv_heads,
     int _kdim,
     int _vdim,
     float _dropout,
@@ -231,8 +240,8 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
          (_bias ? 2 : 1) /*weights*/,
          1 /*outputs*/,
          _input),
-      num_heads(_num_heads), dropout(_dropout), bias(_bias),
-      add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      num_heads(_num_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
+      bias(_bias), add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
       apply_rotary_embedding(_apply_rotary_embedding),
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
       vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
@@ -261,18 +270,16 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     int vParas = this->vProjSize * this->vSize;
     int oParas =
         this->oProjSize * (this->vProjSize > 0 ? this->vProjSize : this->vSize);
-    ParallelDim dims[3];
+    ParallelDim dims[2];
     dims[0] = inputs[0]->dims[num_dims - 2];
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
-    dims[1].size = this->num_heads;
+    dims[1].size = this->num_heads * (qParas + oParas) +
+                   this->num_kv_heads * (kParas + vParas);
     dims[1].is_replica_dim = false;
-    dims[2].size = qParas + kParas + vParas + oParas;
-    dims[2].degree = 1;
-    dims[2].parallel_idx = -1;
     int seed = std::rand();
     Initializer *initializer = new GlorotUniform(seed);
-    weights[0] = model.create_parallel_weight<3>(dims,
+    weights[0] = model.create_parallel_weight<2>(dims,
                                                  this->data_type,
                                                  NULL /*owner_op*/,
                                                  true /*create_grad*/,
@@ -280,8 +287,9 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
                                                  CHOSEN_SYNC_TYPE);
     if (bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
-      bias_shape.dims[0].size =
-          (qProjSize + kProjSize + vProjSize) * num_heads + oProjSize;
+      bias_shape.dims[0].size = qProjSize * num_heads +
+                                (kProjSize + vProjSize) * num_kv_heads +
+                                oProjSize;
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
       weights[1] =
           model.create_parallel_weight_legion_ordering(bias_shape.num_dims,
@@ -309,6 +317,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     const ParallelTensor _weight,
     int _embed_dim,
     int _num_heads,
+    int _num_kv_heads,
     int _kdim,
     int _vdim,
     float _dropout,
@@ -331,8 +340,8 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
          1 /*outputs*/,
          _input,
          _weight),
-      num_heads(_num_heads), dropout(_dropout), bias(_bias),
-      add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      num_heads(_num_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
+      bias(_bias), add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
       apply_rotary_embedding(_apply_rotary_embedding),
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
       vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
@@ -360,16 +369,17 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     int vParas = this->vProjSize * this->vSize;
     int oParas =
         this->oProjSize * (this->vProjSize > 0 ? this->vProjSize : this->vSize);
-    ParallelDim dims[3];
+    ParallelDim dims[2];
     dims[0] = inputs[0]->dims[num_dims - 2];
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
-    dims[1].size = this->num_heads;
+    dims[1].size = this->num_heads * (qParas + oParas) +
+                   this->num_kv_heads * (kParas + vParas);
     dims[1].is_replica_dim = false;
-    dims[2].size = qParas + kParas + vParas + oParas;
+    // dims[2].size = qParas + kParas + vParas + oParas;
     int seed = std::rand();
     Initializer *initializer = new GlorotUniform(seed);
-    weights[0] = model.create_parallel_weight<3>(dims,
+    weights[0] = model.create_parallel_weight<2>(dims,
                                                  this->data_type,
                                                  NULL /*owner_op*/,
                                                  true /*create_grad*/,
@@ -377,8 +387,9 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
                                                  CHOSEN_SYNC_TYPE);
     if (bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
-      bias_shape.dims[0].size =
-          (qProjSize + kProjSize + vProjSize) * num_heads + oProjSize;
+      bias_shape.dims[0].size = qProjSize * num_heads +
+                                (kProjSize + vProjSize) * num_kv_heads +
+                                oProjSize;
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
       weights[1] =
           model.create_parallel_weight_legion_ordering(bias_shape.num_dims,
@@ -413,6 +424,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
                                     input,
                                     other.oProjSize,
                                     other.num_heads,
+                                    other.num_kv_heads,
                                     other.qProjSize,
                                     other.vProjSize,
                                     other.dropout,
@@ -437,6 +449,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
                                     input,
                                     params.embed_dim,
                                     params.num_heads,
+                                    params.num_kv_heads,
                                     params.kdim,
                                     params.vdim,
                                     params.dropout,
@@ -573,7 +586,8 @@ OpMeta *SpecIncMultiHeadSelfAttention::init_task(
   int num_samples = input.domain.hi()[2] - input.domain.lo()[2] + 1;
   assert(attn->qoSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
   assert(attn->kvSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
-  int num_heads = weight.domain.hi()[1] - weight.domain.lo()[1] + 1;
+  int num_heads = attn->num_heads;
+  int num_kv_heads = attn->num_kv_heads;
   assert(attn->oProjSize == output.domain.hi()[0] - output.domain.lo()[0] + 1);
 
   Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
@@ -582,8 +596,14 @@ OpMeta *SpecIncMultiHeadSelfAttention::init_task(
                        .first();
   MemoryAllocator gpu_mem_allocator(gpu_mem);
   // We don't do offloading for SSMs (small speculative models)
-  SpecIncMultiHeadSelfAttentionMeta *m = new SpecIncMultiHeadSelfAttentionMeta(
-      handle, attn, weight, gpu_mem_allocator, num_samples, num_heads);
+  SpecIncMultiHeadSelfAttentionMeta *m =
+      new SpecIncMultiHeadSelfAttentionMeta(handle,
+                                            attn,
+                                            weight,
+                                            gpu_mem_allocator,
+                                            num_samples,
+                                            num_heads,
+                                            num_kv_heads);
   // assert that we didn't over allocate memory
   assert(gpu_mem_allocator.instance_allocated_size ==
          gpu_mem_allocator.instance_total_size);
@@ -700,7 +720,7 @@ void SpecIncMultiHeadSelfAttention::inference_task(
       ctx, task->regions[2].region.get_index_space());
 
   assert(input_domain.get_dim() == 4);
-  assert(weight_domain.get_dim() == 3);
+  assert(weight_domain.get_dim() == 2);
   assert(output_domain.get_dim() == 4);
 
   assert(task->index_point.get_dim() == 1);
@@ -764,6 +784,7 @@ SpecIncMultiHeadSelfAttentionParams
   params.layer_guid = this->layer_guid;
   params.embed_dim = this->oProjSize;
   params.num_heads = this->num_heads;
+  params.num_kv_heads = this->num_kv_heads;
   params.kdim = this->kProjSize;
   params.vdim = this->vProjSize;
   params.dropout = this->dropout;
@@ -774,6 +795,7 @@ SpecIncMultiHeadSelfAttentionParams
   params.scaling_query = this->scaling_query;
   params.scaling_factor = this->scaling_factor;
   params.qk_prod_scaling = this->qk_prod_scaling;
+
   return params;
 }
 
@@ -786,6 +808,7 @@ size_t hash<FlexFlow::SpecIncMultiHeadSelfAttentionParams>::operator()(
   hash_combine(key, params.layer_guid.id);
   hash_combine(key, params.embed_dim);
   hash_combine(key, params.num_heads);
+  hash_combine(key, params.num_kv_heads);
   hash_combine(key, params.kdim);
   hash_combine(key, params.vdim);
   hash_combine(key, params.dropout);
diff --git a/src/ops/spec_inc_multihead_self_attention.cpp b/src/ops/spec_inc_multihead_self_attention.cpp
index 1caf1c1d1b..b95b215b5b 100644
--- a/src/ops/spec_inc_multihead_self_attention.cpp
+++ b/src/ops/spec_inc_multihead_self_attention.cpp
@@ -64,7 +64,8 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
     GenericTensorAccessorR const &weight,
     MemoryAllocator &gpu_mem_allocator,
     int num_samples,
-    int _num_heads)
+    int _num_heads,
+    int _num_kv_heads)
     : IncMultiHeadSelfAttentionMeta(handler,
                                     BEAM_SEARCH_MODE,
                                     attn,
@@ -85,7 +86,9 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
                                     gpu_mem_allocator,
                                     num_samples,
                                     attn->num_heads,
+                                    attn->num_kv_heads,
                                     _num_heads,
+                                    _num_kv_heads,
                                     DT_NONE,
                                     false) {
   hipStream_t stream;
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 44080b7c5c..664b746096 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -33,7 +33,8 @@ namespace SpecIncMultiHeadAttention {
 template <typename DT>
 __global__ void spec_store_kv_cache(
     DT const *devQKVProjArray,
-    DT *cache_ptr,
+    DT *kCache_ptr,
+    DT *vCache_ptr,
     BatchConfig::PerTokenInfo *tokenInfos,
     BatchConfig::PerRequestInfo *requestInfo,
     BeamSearchBatchConfig::BeamSearchPerTokenInfo *beamTokenInfos,
@@ -43,23 +44,21 @@ __global__ void spec_store_kv_cache(
     int vProjSize,
     int num_tokens,
     int num_heads,
+    int num_kv_heads,
     int max_seq_len,
     int max_beam_width,
-    bool k_cache,
     bool is_root) {
-  CUDA_KERNEL_LOOP(i,
-                   num_tokens * (k_cache ? kProjSize : vProjSize) * num_heads) {
-    int proj_size = k_cache ? kProjSize : vProjSize;
-    int head_idx = i / (num_tokens * proj_size);
-    int token_idx = (i - head_idx * (num_tokens * proj_size)) / proj_size;
-    int data_idx = i % proj_size;
+  CUDA_KERNEL_LOOP(i, num_tokens * (kProjSize + vProjSize) * num_kv_heads) {
+    int q_array_size = qProjSize * num_tokens * num_heads;
+    int k_array_size = kProjSize * num_tokens * num_kv_heads;
+
+    bool k_cache = i < k_array_size;
+    int real_i = k_cache ? i : i - k_array_size;
 
-    int qkv_block_size = (qProjSize + kProjSize + vProjSize) * num_tokens;
-    int current_head_block_size =
-        num_tokens * (k_cache ? qProjSize : qProjSize + kProjSize);
-    DT val =
-        devQKVProjArray[head_idx * qkv_block_size + current_head_block_size +
-                        token_idx * proj_size + data_idx];
+    int proj_size = k_cache ? kProjSize : vProjSize;
+    int head_idx = real_i / (num_tokens * proj_size);
+    int token_idx = (real_i - head_idx * (num_tokens * proj_size)) / proj_size;
+    int data_idx = real_i % proj_size;
 
     // above no need to be changed
     // int const req_id = id_map[token_idx].request_index;
@@ -69,6 +68,10 @@ __global__ void spec_store_kv_cache(
     // int const beam_depth = id_map[token_idx].beam_depth;
     // int const beam_width = id_map[token_idx].beam_width;
 
+    DT val = devQKVProjArray[q_array_size + (k_cache ? 0 : k_array_size) +
+                             head_idx * proj_size * num_tokens +
+                             token_idx * proj_size + data_idx];
+
     int const req_id = tokenInfos[token_idx].request_index;
     int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
     int const sub_req_id = beamTokenInfos[token_idx].sub_request_index;
@@ -78,16 +81,18 @@ __global__ void spec_store_kv_cache(
 
     // new token
     int new_token_cache_idx = (req_id * max_beam_width + sub_req_id) *
-                                  (num_heads * max_seq_len * proj_size) +
+                                  (num_kv_heads * max_seq_len * proj_size) +
                               head_idx * (max_seq_len * proj_size) +
                               tok_id * proj_size + data_idx;
+
+    DT *cache_ptr = k_cache ? kCache_ptr : vCache_ptr;
     cache_ptr[new_token_cache_idx] = val;
 
     // replica in the root iteration
     if (beam_depth == 1) {
       for (int i = 1; i < beam_width; i++) {
         cache_ptr[(req_id * max_beam_width + i) *
-                      (num_heads * max_seq_len * proj_size) +
+                      (num_kv_heads * max_seq_len * proj_size) +
                   head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
                   data_idx] = val;
       }
@@ -97,7 +102,8 @@ __global__ void spec_store_kv_cache(
     //   // printf("token idx %d\n", token_idx);
     //   printf("data idx: %d, tok_id %d, new_token_cache_idx %d, parent_id %d,
     //   "
-    //          "sub_req_id %d, num_tokens %d, kProjSize %d, num_heads %d, val "
+    //          "sub_req_id %d, num_tokens %d, kProjSize %d, num_kv_heads %d,
+    //          val "
     //          "%f, beam_width %d\n",
     //          data_idx,
     //          tok_id,
@@ -106,7 +112,7 @@ __global__ void spec_store_kv_cache(
     //          sub_req_id,
     //          num_tokens,
     //          kProjSize,
-    //          num_heads,
+    //          num_kv_heads,
     //          val,
     //          beam_width);
     // }
@@ -126,11 +132,11 @@ __global__ void spec_store_kv_cache(
       for (int depth = 0; depth < beam_depth; depth++) {
         int steal_token_idx = tok_id - beam_depth + depth;
         int steal_from_idx = (req_id * max_beam_width + parent_id) *
-                                 (num_heads * max_seq_len * proj_size) +
+                                 (num_kv_heads * max_seq_len * proj_size) +
                              head_idx * (max_seq_len * proj_size) +
                              steal_token_idx * proj_size + data_idx;
         int steal_to_idx = (req_id * max_beam_width + sub_req_id) *
-                               (num_heads * max_seq_len * proj_size) +
+                               (num_kv_heads * max_seq_len * proj_size) +
                            head_idx * (max_seq_len * proj_size) +
                            steal_token_idx * proj_size + data_idx;
         cache_ptr[steal_to_idx] = cache_ptr[steal_from_idx];
@@ -167,31 +173,13 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   // printf("curr depth: %d\n", curr_depth);
   // assert(curr_depth < 3);
   if (num_tokens > 0) {
-    int parallelism = m->kProjSize * num_tokens * m->num_heads;
+    int parallelism =
+        (m->kProjSize + m->vProjSize) * num_tokens * m->num_kv_heads;
     spec_store_kv_cache<<<GET_BLOCKS(parallelism),
                           min(CUDA_NUM_THREADS, parallelism),
                           0,
                           stream>>>(static_cast<DT *>(m->devQKVProjArray),
                                     static_cast<DT *>(m->keyCache),
-                                    m->token_infos,
-                                    m->request_infos,
-                                    m->beam_token_infos,
-                                    m->beam_request_infos,
-                                    m->qProjSize,
-                                    m->kProjSize,
-                                    m->vProjSize,
-                                    num_tokens,
-                                    m->num_heads,
-                                    BatchConfig::MAX_SEQ_LENGTH,
-                                    BeamSearchBatchConfig::MAX_BEAM_WIDTH,
-                                    /* k_cache = */ true,
-                                    /*root*/ curr_depth == 0);
-
-    parallelism = m->vProjSize * num_tokens * m->num_heads;
-    spec_store_kv_cache<<<GET_BLOCKS(parallelism),
-                          min(CUDA_NUM_THREADS, parallelism),
-                          0,
-                          stream>>>(static_cast<DT *>(m->devQKVProjArray),
                                     static_cast<DT *>(m->valueCache),
                                     m->token_infos,
                                     m->request_infos,
@@ -202,9 +190,9 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                                     m->vProjSize,
                                     num_tokens,
                                     m->num_heads,
+                                    m->num_kv_heads,
                                     BatchConfig::MAX_SEQ_LENGTH,
                                     BeamSearchBatchConfig::MAX_BEAM_WIDTH,
-                                    /* k_cache = */ false,
                                     /*root*/ curr_depth == 0);
   }
 }
@@ -232,6 +220,7 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                               int shard_id,
                               DT *output_ptr,
                               DT const *bias_ptr,
+                              DT const *weight_ptr,
                               cudaStream_t stream) {
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
@@ -248,12 +237,14 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   int num_tokens = bc->num_active_tokens();
   int tokens_previous_requests = 0;
   int tokens_prev_requests_squares = 0;
-  int qkv_block_size =
-      (m->qProjSize + m->kProjSize + m->vProjSize) * num_tokens;
+  // int qkv_block_size =
+  //     (m->qProjSize + m->kProjSize + m->vProjSize) * num_tokens;
+  int q_block_size = m->qProjSize * num_tokens;
+
   int kt_block_size = m->kProjSize * BatchConfig::MAX_SEQ_LENGTH;
-  int kt_req_block_size = kt_block_size * m->num_heads;
+  int kt_req_block_size = kt_block_size * m->num_kv_heads;
   int vt_block_size = m->vProjSize * BatchConfig::MAX_SEQ_LENGTH;
-  int vt_req_block_size = vt_block_size * m->num_heads;
+  int vt_req_block_size = vt_block_size * m->num_kv_heads;
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
@@ -273,7 +264,7 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       int n = total_tokens;
       int k = m->qProjSize;
       int lda = k, ldb = k, ldc = m_;
-      int strideA = qkv_block_size;
+      int strideA = q_block_size;
       int strideB = kt_block_size;
       int strideC = num_new_tokens * total_tokens;
 
@@ -283,12 +274,12 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
         alpha = static_cast<DT>(1.0f / sqrt(m->kProjSize));
       }
       // To get A, skip over Q entries from previous requests (same head)
-      void const *A = static_cast<DT *>(m->devQKVProjArray) +
-                      tokens_previous_requests * m->qProjSize;
+      DT const *A = static_cast<DT *>(m->devQKVProjArray) +
+                    tokens_previous_requests * m->qProjSize;
       // To get B, skip over K entries from previous requests (all heads +
       // padding)
-      void const *B = static_cast<DT *>(m->keyCache) +
-                      (i * bc->MAX_BEAM_WIDTH + sub_req_id) * kt_req_block_size;
+      DT const *B = static_cast<DT *>(m->keyCache) +
+                    (i * bc->MAX_BEAM_WIDTH + sub_req_id) * kt_req_block_size;
 
       // if (i == 0 && sub_req_id == 0 &&
       //     bc->beam_slots.at(0).current_depth == 1) {
@@ -296,31 +287,68 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       //   printf("key cache offset %d\n", kt_req_block_size);
       // }
       // To get C, skip over QK^T products from previous requests
-      void *C = static_cast<DT *>(m->qk_prods) +
-                m->num_heads * tokens_prev_requests_squares;
-      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                           CUBLAS_OP_T,
-                                           CUBLAS_OP_N,
-                                           m_,
-                                           n,
-                                           k,
-                                           &alpha,
-                                           A,
-                                           cublas_data_type,
-                                           lda,
-                                           strideA,
-                                           B,
-                                           cublas_data_type,
-                                           ldb,
-                                           strideB,
-                                           &beta,
-                                           C,
-                                           cublas_data_type,
-                                           ldc,
-                                           strideC,
-                                           m->num_heads,
-                                           compute_type,
-                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+      DT *C = static_cast<DT *>(m->qk_prods) +
+              m->num_heads * tokens_prev_requests_squares;
+
+      if (m->num_heads == m->num_kv_heads) {
+        checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                             CUBLAS_OP_T,
+                                             CUBLAS_OP_N,
+                                             m_,
+                                             n,
+                                             k,
+                                             &alpha,
+                                             A,
+                                             cublas_data_type,
+                                             lda,
+                                             strideA,
+                                             B,
+                                             cublas_data_type,
+                                             ldb,
+                                             strideB,
+                                             &beta,
+                                             C,
+                                             cublas_data_type,
+                                             ldc,
+                                             strideC,
+                                             m->num_heads,
+                                             compute_type,
+                                             CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+      } else {
+        strideB = 0;
+        int one_step_heads = m->num_heads / m->num_kv_heads;
+        m_ = num_new_tokens;
+        n = total_tokens;
+        k = m->qProjSize;
+        lda = k, ldb = k, ldc = m_;
+        for (int step = 0; step < m->num_kv_heads; step++) {
+          checkCUDA(
+              cublasGemmStridedBatchedEx(m->handle.blas,
+                                         CUBLAS_OP_T,
+                                         CUBLAS_OP_N,
+                                         m_,
+                                         n,
+                                         k,
+                                         &alpha,
+                                         A + step * strideA * one_step_heads,
+                                         cublas_data_type,
+                                         lda,
+                                         strideA,
+                                         B + step * kt_block_size,
+                                         cublas_data_type,
+                                         ldb,
+                                         strideB,
+                                         &beta,
+                                         C + step * strideC * one_step_heads,
+                                         cublas_data_type,
+                                         ldc,
+                                         strideC,
+                                         one_step_heads,
+                                         compute_type,
+                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+        }
+      }
+
       // Fill all elements above diagonal in qk prods with -inf to force
       // causal attention.
       assert(num_new_tokens <= total_tokens);
@@ -331,15 +359,13 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                                                parallelism),
                                            0,
                                            stream>>>(
-            static_cast<DT *>(C),
+            C,
             num_new_tokens,
             total_tokens,
             m->num_heads,
             static_cast<DT>(-INFINITY));
       }
       // Compute Softmax(QK^T/sqrt(d_k))
-      cudnnTensorDescriptor_t qk_tensor;
-      checkCUDNN(cudnnCreateTensorDescriptor(&qk_tensor));
       // Before modifying the parameters below, make sure to read the following
       // description of the CUDNN_TENSOR_NCHW tensor layout, from
       // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#cudnnTensorFormat_t:
@@ -353,7 +379,7 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       int c_param = total_tokens;
       int h_param = 1;
       int w_param = num_new_tokens;
-      checkCUDNN(cudnnSetTensor4dDescriptor(qk_tensor,
+      checkCUDNN(cudnnSetTensor4dDescriptor(m->qk_tensor,
                                             CUDNN_TENSOR_NCHW,
                                             cudnn_data_type,
                                             n_param,
@@ -361,8 +387,8 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                                             h_param,
                                             w_param));
       float softmax_alpha = 1.0f, softmax_beta = 0.0f;
-      void *C_softmax = static_cast<DT *>(m->qk_prods_softmax) +
-                        m->num_heads * tokens_prev_requests_squares;
+      DT *C_softmax = static_cast<DT *>(m->qk_prods_softmax) +
+                      m->num_heads * tokens_prev_requests_squares;
       // The softmax operation below is executed according to the
       // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
       // softmax operation is computed per spatial location (H,W) per image (N)
@@ -371,10 +397,10 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                                      CUDNN_SOFTMAX_ACCURATE,
                                      CUDNN_SOFTMAX_MODE_CHANNEL,
                                      &softmax_alpha,
-                                     qk_tensor,
+                                     m->qk_tensor,
                                      C,
                                      &softmax_beta,
-                                     qk_tensor,
+                                     m->qk_tensor,
                                      C_softmax));
       // Matmul softmax(QK^T/sqrt(d_k)) by V
       alpha = 1.0f, beta = 0.0f;
@@ -387,7 +413,7 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       strideC = num_new_tokens * m->vProjSize;
       // To get A, skip over softmax(QK^T/sqrt(d_k)) entries from previous
       // requests (all heads)
-      A = (void const *)C_softmax;
+      A = C_softmax;
       // To get B, skip over V^T entries from previous requests (all heads +
       // padding)
       B = static_cast<DT *>(m->valueCache) +
@@ -397,37 +423,75 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       C = static_cast<DT *>(m->attn_heads) +
           tokens_previous_requests * m->num_heads * m->vProjSize;
 
-      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                           CUBLAS_OP_N,
-                                           CUBLAS_OP_T,
-                                           m_,
-                                           n,
-                                           k,
-                                           &alpha,
-                                           A,
-                                           cublas_data_type,
-                                           lda,
-                                           strideA,
-                                           B,
-                                           cublas_data_type,
-                                           ldb,
-                                           strideB,
-                                           &beta,
-                                           C,
-                                           cublas_data_type,
-                                           ldc,
-                                           strideC,
-                                           m->num_heads,
-                                           compute_type,
-                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+      if (m->num_heads == m->num_kv_heads) {
+        checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                             CUBLAS_OP_N,
+                                             CUBLAS_OP_T,
+                                             m_,
+                                             n,
+                                             k,
+                                             &alpha,
+                                             A,
+                                             cublas_data_type,
+                                             lda,
+                                             strideA,
+                                             B,
+                                             cublas_data_type,
+                                             ldb,
+                                             strideB,
+                                             &beta,
+                                             C,
+                                             cublas_data_type,
+                                             ldc,
+                                             strideC,
+                                             m->num_heads,
+                                             compute_type,
+                                             CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+      } else {
+        int one_step_heads = m->num_heads / m->num_kv_heads;
+        n = m->vProjSize;
+        lda = m_, ldb = n, ldc = m_;
+        strideA = num_new_tokens * total_tokens;
+        strideB = 0;
+        strideC = num_new_tokens * m->vProjSize;
+        for (int step = 0; step < m->num_kv_heads; step++) {
+          checkCUDA(
+              cublasGemmStridedBatchedEx(m->handle.blas,
+                                         CUBLAS_OP_N,
+                                         CUBLAS_OP_T,
+                                         m_,
+                                         n,
+                                         k,
+                                         &alpha,
+                                         A + step * one_step_heads * strideA,
+                                         cublas_data_type,
+                                         lda,
+                                         strideA,
+                                         B + step * vt_block_size,
+                                         cublas_data_type,
+                                         ldb,
+                                         strideB,
+                                         &beta,
+                                         C + step * one_step_heads,
+                                         cublas_data_type,
+                                         ldc,
+                                         strideC,
+                                         one_step_heads,
+                                         compute_type,
+                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+        }
+      }
+
       // Project to output, save result directly on output tensor
       alpha = 1.0f, beta = 0.0f;
       m_ = m->oProjSize;
       k = m->vProjSize * m->num_heads;
       n = num_new_tokens;
       lda = k, ldb = n, ldc = m_;
-      A = static_cast<DT *>(m->W_out_contiguous);
-      B = static_cast<DT *>(C);
+      A = weight_ptr + m->qSize * (m->qProjSize * m->num_heads +
+                                   m->kProjSize * m->num_kv_heads +
+                                   m->vProjSize * m->num_kv_heads);
+      B = C;
       C = static_cast<DT *>(output_ptr) +
           tokens_previous_requests * m->oProjSize;
 
@@ -455,11 +519,14 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
     }
     if (*m->bias && shard_id == 0) {
       int parallelism = m->oProjSize * num_tokens;
+      int qkv_weight_size = m->qProjSize * m->global_num_heads +
+                            m->kProjSize * m->global_num_kv_heads +
+                            m->vProjSize * m->global_num_kv_heads;
       apply_proj_bias_w<<<GET_BLOCKS(parallelism),
                           min(CUDA_NUM_THREADS, parallelism),
                           0,
                           stream>>>(
-          output_ptr, bias_ptr, num_tokens, m->oProjSize);
+          output_ptr, bias_ptr, num_tokens, qkv_weight_size, m->oProjSize);
     }
   }
 
@@ -512,7 +579,8 @@ void inference_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
 
   // phase 3: Compute attention score
   // 3 kernels for pahse 3: matmul1 - softmax - matmal2
-  compute_attention_kernel(m, bc, shard_id, output_ptr, bias_ptr, stream);
+  compute_attention_kernel(
+      m, bc, shard_id, output_ptr, bias_ptr, weight_ptr, stream);
 }
 
 } // namespace SpecIncMultiHeadAttention
@@ -582,7 +650,6 @@ void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
     // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
     // acc_output.rect, "[Attention:forward:output]");
   }
-  // print_tensor<half>(output.get_half_ptr(), 10000, "att output");
 }
 
 SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
@@ -591,7 +658,8 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
     GenericTensorAccessorR const &weight,
     MemoryAllocator &gpu_mem_allocator,
     int num_samples,
-    int _num_heads)
+    int _num_heads,
+    int _num_kv_heads)
     : IncMultiHeadSelfAttentionMeta(handler,
                                     BEAM_SEARCH_MODE,
                                     attn,
@@ -612,7 +680,9 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
                                     gpu_mem_allocator,
                                     num_samples,
                                     attn->num_heads,
+                                    attn->num_kv_heads,
                                     _num_heads,
+                                    _num_kv_heads,
                                     DT_NONE,
                                     false) {
   cudaStream_t stream;
diff --git a/src/ops/tree_inc_multihead_self_attention.cc b/src/ops/tree_inc_multihead_self_attention.cc
index 7a7ea4f366..133543650b 100644
--- a/src/ops/tree_inc_multihead_self_attention.cc
+++ b/src/ops/tree_inc_multihead_self_attention.cc
@@ -62,6 +62,7 @@ Tensor FFModel::inc_multihead_self_attention_verify(
     const Tensor input,
     int embed_dim,
     int num_heads,
+    int num_kv_heads,
     int kdim,
     int vdim,
     float dropout,
@@ -121,6 +122,8 @@ Tensor FFModel::inc_multihead_self_attention_verify(
   int vParas = vProjSize * vSize;
   int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
   int one_head_size = qParas + kParas + vParas + oParas;
+  int weight_size = qParas * num_heads + kParas * num_kv_heads +
+                    vParas * num_kv_heads + oParas * num_heads;
   {
     // compress the weight size if quantization.
     if (quantization_type != DT_NONE) {
@@ -128,9 +131,9 @@ Tensor FFModel::inc_multihead_self_attention_verify(
           data_type, quantization_type, one_head_size);
     }
 
-    int dims[2] = {one_head_size, num_heads};
+    int dims[1] = {weight_size};
     li->weights[0] = create_weight_legion_ordering(
-        2,
+        1,
         dims,
         quantization_type == DT_NONE ? data_type : quantization_type,
         li,
@@ -140,7 +143,8 @@ Tensor FFModel::inc_multihead_self_attention_verify(
   }
   if (bias) {
     // q, k, v, o
-    int dims[1] = {(qProjSize + kProjSize + vProjSize) * num_heads + oProjSize};
+    int dims[1] = {qProjSize * num_heads +
+                   (kProjSize + vProjSize) * num_kv_heads + oProjSize};
     li->weights[1] = create_weight_legion_ordering(1,
                                                    dims,
                                                    data_type,
@@ -152,6 +156,7 @@ Tensor FFModel::inc_multihead_self_attention_verify(
   li->data_type = data_type;
   li->add_int_property("embed_dim", embed_dim);
   li->add_int_property("num_heads", num_heads);
+  li->add_int_property("num_kv_heads", num_kv_heads);
   li->add_int_property("kdim", kdim);
   li->add_int_property("vdim", vdim);
   li->add_int_property("bias", bias);
@@ -164,6 +169,8 @@ Tensor FFModel::inc_multihead_self_attention_verify(
   li->add_int_property("qk_prod_scaling", qk_prod_scaling);
   li->add_int_property("quantization_type", quantization_type);
   li->add_int_property("offload", offload);
+  li->add_int_property("tensor_parallelism_degree",
+                       config.tensor_parallelism_degree);
   layers.push_back(li);
   return li->outputs[0];
 }
@@ -177,6 +184,8 @@ Op *TreeIncMultiHeadSelfAttention::create_operator_from_layer(
   int embed_dim = value;
   layer->get_int_property("num_heads", value);
   int num_heads = value;
+  layer->get_int_property("num_kv_heads", value);
+  int num_kv_heads = value;
   layer->get_int_property("kdim", value);
   int kdim = value;
   layer->get_int_property("vdim", value);
@@ -201,11 +210,14 @@ Op *TreeIncMultiHeadSelfAttention::create_operator_from_layer(
   DataType quantization_type = (DataType)value;
   layer->get_int_property("offload", value);
   bool offload = (bool)value;
+  layer->get_int_property("tensor_parallelism_degree", value);
+  int tensor_parallelism_degree = (int)value;
   return new TreeIncMultiHeadSelfAttention(model,
                                            layer->layer_guid,
                                            inputs[0],
                                            embed_dim,
                                            num_heads,
+                                           num_kv_heads,
                                            kdim,
                                            vdim,
                                            dropout,
@@ -219,6 +231,7 @@ Op *TreeIncMultiHeadSelfAttention::create_operator_from_layer(
                                            false /*allocate_weights*/,
                                            quantization_type,
                                            offload,
+                                           tensor_parallelism_degree,
                                            layer->name);
 }
 
@@ -228,6 +241,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     const ParallelTensor _input,
     int _embed_dim,
     int _num_heads,
+    int _num_kv_heads,
     int _kdim,
     int _vdim,
     float _dropout,
@@ -241,6 +255,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     bool allocate_weights,
     DataType _quantization_type,
     bool _offload,
+    int _tensor_parallelism_degree,
     char const *name)
     // Initializer* _bias_initializer)
     : Op(model,
@@ -251,8 +266,8 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
          (_bias ? 2 : 1) /*weights*/,
          1 /*outputs*/,
          _input),
-      num_heads(_num_heads), dropout(_dropout), bias(_bias),
-      add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      num_heads(_num_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
+      bias(_bias), add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
       apply_rotary_embedding(_apply_rotary_embedding),
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
       vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
@@ -260,7 +275,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
       qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
       scaling_query(_scaling_query), scaling_factor(_scaling_factor),
       qk_prod_scaling(_qk_prod_scaling), quantization_type(_quantization_type),
-      offload(_offload) {
+      offload(_offload), tensor_parallelism_degree(_tensor_parallelism_degree) {
   // overwrite layer_guid
   layer_guid = _layer_guid;
 
@@ -282,22 +297,23 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     int vParas = this->vProjSize * this->vSize;
     int oParas =
         this->oProjSize * (this->vProjSize > 0 ? this->vProjSize : this->vSize);
-    ParallelDim dims[3];
+    ParallelDim dims[2];
     dims[0] = inputs[0]->dims[num_dims - 2];
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
-    dims[1].size = this->num_heads;
+    dims[1].size = this->num_heads * (qParas + oParas) +
+                   this->num_kv_heads * (kParas + vParas);
     dims[1].is_replica_dim = false;
-    dims[2].size = qParas + kParas + vParas + oParas;
+    // dims[2].size = qParas + kParas + vParas + oParas;
     if (quantization_type != DT_NONE) {
-      dims[2].size = get_quantization_to_byte_size(
+      dims[1].size = get_quantization_to_byte_size(
           data_type, quantization_type, dims[2].size);
     }
-    dims[2].degree = 1;
-    dims[2].parallel_idx = -1;
+    // dims[2].degree = 1;
+    // dims[2].parallel_idx = -1;
     int seed = std::rand();
     Initializer *initializer = new GlorotUniform(seed);
-    weights[0] = model.create_parallel_weight<3>(
+    weights[0] = model.create_parallel_weight<2>(
         dims,
         quantization_type == DT_NONE ? this->data_type : quantization_type,
         NULL /*owner_op*/,
@@ -306,8 +322,9 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
         CHOSEN_SYNC_TYPE);
     if (bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
-      bias_shape.dims[0].size =
-          (qProjSize + kProjSize + vProjSize) * num_heads + oProjSize;
+      bias_shape.dims[0].size = qProjSize * num_heads +
+                                (kProjSize + vProjSize) * num_kv_heads +
+                                oProjSize;
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
       weights[1] =
           model.create_parallel_weight_legion_ordering(bias_shape.num_dims,
@@ -335,6 +352,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     const ParallelTensor _weight,
     int _embed_dim,
     int _num_heads,
+    int _num_kv_heads,
     int _kdim,
     int _vdim,
     float _dropout,
@@ -348,6 +366,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     bool allocate_weights,
     DataType _quantization_type,
     bool _offload,
+    int _tensor_parallelism_degree,
     char const *name)
     // Initializer* _bias_initializer)
     : Op(model,
@@ -359,8 +378,8 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
          1 /*outputs*/,
          _input,
          _weight),
-      num_heads(_num_heads), dropout(_dropout), bias(_bias),
-      add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      num_heads(_num_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
+      bias(_bias), add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
       apply_rotary_embedding(_apply_rotary_embedding),
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
       vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
@@ -368,7 +387,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
       qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
       scaling_query(_scaling_query), scaling_factor(_scaling_factor),
       qk_prod_scaling(_qk_prod_scaling), quantization_type(_quantization_type),
-      offload(_offload)
+      offload(_offload), tensor_parallelism_degree(_tensor_parallelism_degree)
 // bias_initializer(_bias_initializer)
 {
   numOutputs = 1;
@@ -389,20 +408,21 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     int vParas = this->vProjSize * this->vSize;
     int oParas =
         this->oProjSize * (this->vProjSize > 0 ? this->vProjSize : this->vSize);
-    ParallelDim dims[3];
+    ParallelDim dims[2];
     dims[0] = inputs[0]->dims[num_dims - 2];
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
-    dims[1].size = this->num_heads;
+    dims[1].size = this->num_heads * (qParas + oParas) +
+                   this->num_kv_heads * (kParas + vParas);
     dims[1].is_replica_dim = false;
-    dims[2].size = qParas + kParas + vParas + oParas;
+    // dims[2].size = qParas + kParas + vParas + oParas;
     if (quantization_type != DT_NONE) {
-      dims[2].size = get_quantization_to_byte_size(
+      dims[1].size = get_quantization_to_byte_size(
           data_type, quantization_type, dims[2].size);
     }
     int seed = std::rand();
     Initializer *initializer = new GlorotUniform(seed);
-    weights[0] = model.create_parallel_weight<3>(
+    weights[0] = model.create_parallel_weight<2>(
         dims,
         quantization_type == DT_NONE ? this->data_type : quantization_type,
         NULL /*owner_op*/,
@@ -411,8 +431,9 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
         CHOSEN_SYNC_TYPE);
     if (bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
-      bias_shape.dims[0].size =
-          (qProjSize + kProjSize + vProjSize) * num_heads + oProjSize;
+      bias_shape.dims[0].size = qProjSize * num_heads +
+                                (kProjSize + vProjSize) * num_kv_heads +
+                                oProjSize;
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
       weights[1] =
           model.create_parallel_weight_legion_ordering(bias_shape.num_dims,
@@ -447,6 +468,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
                                     input,
                                     other.oProjSize,
                                     other.num_heads,
+                                    other.num_kv_heads,
                                     other.qProjSize,
                                     other.vProjSize,
                                     other.dropout,
@@ -460,6 +482,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
                                     allocate_weights,
                                     other.quantization_type,
                                     other.offload,
+                                    other.tensor_parallelism_degree,
                                     other.name) {}
 
 TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
@@ -473,6 +496,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
                                     input,
                                     params.embed_dim,
                                     params.num_heads,
+                                    params.num_kv_heads,
                                     params.kdim,
                                     params.vdim,
                                     params.dropout,
@@ -486,6 +510,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
                                     allocate_weights,
                                     params.quantization_type,
                                     params.offload,
+                                    params.tensor_parallelism_degree,
                                     name) {}
 
 void TreeIncMultiHeadSelfAttention::init_inference(
@@ -613,7 +638,10 @@ OpMeta *TreeIncMultiHeadSelfAttention::init_task(
   int num_samples = input.domain.hi()[2] - input.domain.lo()[2] + 1;
   assert(attn->qoSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
   assert(attn->kvSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
-  int num_heads = weight.domain.hi()[1] - weight.domain.lo()[1] + 1;
+  // int num_heads = weight.domain.hi()[1] - weight.domain.lo()[1] + 1;
+  int num_heads = attn->num_heads / attn->tensor_parallelism_degree;
+  int num_kv_heads = attn->num_kv_heads / attn->tensor_parallelism_degree;
+
   assert(attn->oProjSize == output.domain.hi()[0] - output.domain.lo()[0] + 1);
 
   Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
@@ -627,8 +655,14 @@ OpMeta *TreeIncMultiHeadSelfAttention::init_task(
     gpu_mem_allocator.register_reserved_work_space(
         handle.offload_reserve_space, handle.offload_reserve_space_size);
   }
-  TreeIncMultiHeadSelfAttentionMeta *m = new TreeIncMultiHeadSelfAttentionMeta(
-      handle, attn, weight, gpu_mem_allocator, num_samples, num_heads);
+  TreeIncMultiHeadSelfAttentionMeta *m =
+      new TreeIncMultiHeadSelfAttentionMeta(handle,
+                                            attn,
+                                            weight,
+                                            gpu_mem_allocator,
+                                            num_samples,
+                                            num_heads,
+                                            num_kv_heads);
   if (!attn->offload) {
     // assert that we didn't over allocate memory
     assert(gpu_mem_allocator.reserved_allocated_size ==
@@ -758,7 +792,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
       ctx, task->regions[2].region.get_index_space());
 
   assert(input_domain.get_dim() == 4);
-  assert(weight_domain.get_dim() == 3);
+  assert(weight_domain.get_dim() == 2);
   assert(output_domain.get_dim() == 4);
 
   /* print_tensor<float>(input.get_float_ptr(),
@@ -1591,6 +1625,7 @@ TreeIncMultiHeadSelfAttentionParams
   params.layer_guid = this->layer_guid;
   params.embed_dim = this->oProjSize;
   params.num_heads = this->num_heads;
+  params.num_kv_heads = this->num_kv_heads;
   params.kdim = this->kProjSize;
   params.vdim = this->vProjSize;
   params.dropout = this->dropout;
@@ -1601,6 +1636,7 @@ TreeIncMultiHeadSelfAttentionParams
   params.scaling_query = this->scaling_query;
   params.scaling_factor = this->scaling_factor;
   params.qk_prod_scaling = this->qk_prod_scaling;
+  params.tensor_parallelism_degree = this->tensor_parallelism_degree;
   return params;
 }
 
@@ -1613,6 +1649,7 @@ size_t hash<FlexFlow::TreeIncMultiHeadSelfAttentionParams>::operator()(
   hash_combine(key, params.layer_guid.id);
   hash_combine(key, params.embed_dim);
   hash_combine(key, params.num_heads);
+  hash_combine(key, params.num_kv_heads);
   hash_combine(key, params.kdim);
   hash_combine(key, params.vdim);
   hash_combine(key, params.dropout);
@@ -1625,6 +1662,7 @@ size_t hash<FlexFlow::TreeIncMultiHeadSelfAttentionParams>::operator()(
   hash_combine(key, params.qk_prod_scaling);
   hash_combine(key, params.quantization_type);
   hash_combine(key, params.offload);
+  hash_combine(key, params.tensor_parallelism_degree);
   return key;
 }
 }; // namespace std
diff --git a/src/ops/tree_inc_multihead_self_attention.cpp b/src/ops/tree_inc_multihead_self_attention.cpp
index 74cea451c4..9927ef7af0 100644
--- a/src/ops/tree_inc_multihead_self_attention.cpp
+++ b/src/ops/tree_inc_multihead_self_attention.cpp
@@ -64,7 +64,8 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
     GenericTensorAccessorR const &weight,
     MemoryAllocator &gpu_mem_allocator,
     int num_samples,
-    int _num_heads)
+    int _num_heads,
+    int _num_kv_heads)
     : IncMultiHeadSelfAttentionMeta(handler,
                                     TREE_VERIFY_MODE,
                                     attn,
@@ -85,7 +86,9 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
                                     gpu_mem_allocator,
                                     num_samples,
                                     attn->num_heads,
+                                    attn->num_kv_heads,
                                     _num_heads,
+                                    _num_kv_heads,
                                     attn->quantization_type,
                                     attn->offload),
       num_active_tokens(0) {
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index b46ccb4853..c19f4f37b3 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -34,7 +34,8 @@ namespace TreeIncMultiHeadAttention {
 template <typename DT>
 __global__ void commit_tokens_kernel(
     DT const *devQKVProjArray,
-    DT *cache_ptr,
+    DT *kCache_ptr,
+    DT *vCache_ptr,
     TreeVerifyBatchConfig::CommittedTokensInfo const *committedTokenInfos,
     int qProjSize,
     int kProjSize,
@@ -42,32 +43,36 @@ __global__ void commit_tokens_kernel(
     int num_tokens_to_commit,
     int num_active_tokens_in_last_batch,
     int num_heads,
-    int max_seq_len,
-    bool k_cache) {
+    int num_kv_heads,
+    int max_seq_len) {
 
   CUDA_KERNEL_LOOP(
-      i, num_tokens_to_commit * (k_cache ? kProjSize : vProjSize) * num_heads) {
+      i, num_tokens_to_commit * (kProjSize + vProjSize) * num_kv_heads) {
+    bool k_cache = i < (num_tokens_to_commit * kProjSize * num_kv_heads);
+    int real_i =
+        k_cache ? i : i - (num_tokens_to_commit * kProjSize * num_kv_heads);
+
     int proj_size = k_cache ? kProjSize : vProjSize;
-    int data_idx = i % proj_size;
-    int head_idx = i / (num_tokens_to_commit * proj_size);
+    int data_idx = real_i % proj_size;
+    int head_idx = real_i / (num_tokens_to_commit * proj_size);
     int token_pos =
-        (i - head_idx * (num_tokens_to_commit * proj_size)) / proj_size;
+        (real_i - head_idx * (num_tokens_to_commit * proj_size)) / proj_size;
     int token_idx_in_last_batch = committedTokenInfos[token_pos].token_index;
     assert(token_idx_in_last_batch < num_active_tokens_in_last_batch);
 
-    int qkv_block_size =
-        (qProjSize + kProjSize + vProjSize) * num_active_tokens_in_last_batch;
-    int current_head_block_size = num_active_tokens_in_last_batch *
-                                  (k_cache ? qProjSize : qProjSize + kProjSize);
+    int q_array_size = qProjSize * num_active_tokens_in_last_batch * num_heads;
+    int k_array_size =
+        kProjSize * num_active_tokens_in_last_batch * num_kv_heads;
+
     DT val =
-        devQKVProjArray[head_idx * qkv_block_size + current_head_block_size +
+        devQKVProjArray[q_array_size + (k_cache ? 0 : k_array_size) +
+                        head_idx * proj_size * num_active_tokens_in_last_batch +
                         token_idx_in_last_batch * proj_size + data_idx];
-    // int const req_id = id_map[token_idx].request_index;
-    // int const tok_id = id_map[token_idx].token_position;
     int const req_id = committedTokenInfos[token_pos].request_index;
     int const tok_id = committedTokenInfos[token_pos].token_depth;
 
-    cache_ptr[req_id * (num_heads * max_seq_len * proj_size) +
+    DT *cache_ptr = k_cache ? kCache_ptr : vCache_ptr;
+    cache_ptr[req_id * (num_kv_heads * max_seq_len * proj_size) +
               head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
               data_idx] = val;
   }
@@ -79,29 +84,14 @@ void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
                    cudaStream_t stream) {
   int num_tokens_to_commit = bc->num_tokens_to_commit;
   if (num_tokens_to_commit > 0) {
-    int parallelism = m->kProjSize * num_tokens_to_commit * m->num_heads;
+    int parallelism =
+        (m->kProjSize + m->vProjSize) * num_tokens_to_commit * m->num_kv_heads;
     commit_tokens_kernel<<<GET_BLOCKS(parallelism),
                            min(CUDA_NUM_THREADS, parallelism),
                            0,
                            stream>>>(
         static_cast<DT *>(m->devQKVProjArray),
         static_cast<DT *>(m->keyCache),
-        m->committed_token_infos,
-        m->qProjSize,
-        m->kProjSize,
-        m->vProjSize,
-        num_tokens_to_commit,
-        m->num_active_tokens, // number of active tokens in previous batch
-        m->num_heads,
-        BatchConfig::MAX_SEQ_LENGTH,
-        /* k_cache = */ true);
-
-    parallelism = m->vProjSize * num_tokens_to_commit * m->num_heads;
-    commit_tokens_kernel<<<GET_BLOCKS(parallelism),
-                           min(CUDA_NUM_THREADS, parallelism),
-                           0,
-                           stream>>>(
-        static_cast<DT *>(m->devQKVProjArray),
         static_cast<DT *>(m->valueCache),
         m->committed_token_infos,
         m->qProjSize,
@@ -110,15 +100,16 @@ void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
         num_tokens_to_commit,
         m->num_active_tokens, // number of active tokens in previous batch
         m->num_heads,
-        BatchConfig::MAX_SEQ_LENGTH,
-        /* k_cache = */ false);
+        m->num_kv_heads,
+        BatchConfig::MAX_SEQ_LENGTH);
   }
 }
 
 template <typename DT>
 __global__ void update_tree_branch_kv_cache(
     DT const *devQKVProjArray,
-    DT *cache_ptr,
+    DT *kCache_ptr,
+    DT *vCache_ptr,
     TreeVerifyBatchConfig::PerTokenInfo const *tokenInfos,
     int qProjSize,
     int kProjSize,
@@ -127,31 +118,34 @@ __global__ void update_tree_branch_kv_cache(
     int processed_tokens_in_batch,
     int total_tokens_in_batch,
     int num_heads,
-    int max_seq_len,
-    bool k_cache) {
+    int num_kv_heads,
+    int max_seq_len) {
   CUDA_KERNEL_LOOP(
-      i, num_tokens_in_branch * (k_cache ? kProjSize : vProjSize) * num_heads) {
+      i, num_tokens_in_branch * (kProjSize + vProjSize) * num_kv_heads) {
+
+    int q_array_size = qProjSize * total_tokens_in_batch * num_heads;
+    int k_array_size = kProjSize * total_tokens_in_batch * num_kv_heads;
+
+    bool k_cache = i < (num_tokens_in_branch * kProjSize * num_kv_heads);
+    int real_i =
+        k_cache ? i : i - (num_tokens_in_branch * kProjSize * num_kv_heads);
+
     int proj_size = k_cache ? kProjSize : vProjSize;
-    int data_idx = i % proj_size;
+    int data_idx = real_i % proj_size;
     int token_idx =
-        (i / proj_size) % num_tokens_in_branch; // index in the tree branch
-    int head_idx = i / (proj_size * num_tokens_in_branch);
+        (real_i / proj_size) % num_tokens_in_branch; // index in the tree branch
+    int head_idx = real_i / (proj_size * num_tokens_in_branch);
 
     token_idx += processed_tokens_in_batch; // get index in the whole batch
-    int qkv_block_size = (qProjSize + kProjSize + vProjSize) *
-                         total_tokens_in_batch; // skip over previous heads
-    int current_head_block_size =
-        total_tokens_in_batch *
-        (k_cache ? qProjSize
-                 : qProjSize + kProjSize); // skip over Q entries (and K entries
-                                           // if we are working on the V cache)
-    DT val =
-        devQKVProjArray[head_idx * qkv_block_size + current_head_block_size +
-                        token_idx * proj_size + data_idx];
+    DT val = devQKVProjArray[q_array_size + (k_cache ? 0 : k_array_size) +
+                             head_idx * proj_size * total_tokens_in_batch +
+                             token_idx * proj_size + data_idx];
+
     int const req_id = tokenInfos[token_idx].request_index;
     int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
+    DT *cache_ptr = k_cache ? kCache_ptr : vCache_ptr;
 
-    cache_ptr[req_id * (num_heads * max_seq_len * proj_size) +
+    cache_ptr[req_id * (num_kv_heads * max_seq_len * proj_size) +
               head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
               data_idx] = val;
   }
@@ -180,6 +174,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                               int shard_id,
                               DT *output_ptr,
                               DT const *bias_ptr,
+                              DT const *weight_ptr,
                               cudaStream_t stream) {
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
@@ -194,12 +189,13 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
 #endif
   // int num_requests = bc->num_active_requests();
   int processed_tokens_in_batch = 0;
-  int qkv_block_size =
-      (m->qProjSize + m->kProjSize + m->vProjSize) * bc->num_active_tokens();
+  // int qkv_block_size =
+  //     (m->qProjSize + m->kProjSize + m->vProjSize) * bc->num_active_tokens();
+  int q_block_size = m->qProjSize * bc->num_active_tokens();
   int kt_block_size = m->kProjSize * BatchConfig::MAX_SEQ_LENGTH;
-  int kt_req_block_size = kt_block_size * m->num_heads;
+  int kt_req_block_size = kt_block_size * m->num_kv_heads;
   int vt_block_size = m->vProjSize * BatchConfig::MAX_SEQ_LENGTH;
-  int vt_req_block_size = vt_block_size * m->num_heads;
+  int vt_req_block_size = vt_block_size * m->num_kv_heads;
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
@@ -222,30 +218,14 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       assert(num_new_tokens >= 1 && total_tokens_in_request >= num_new_tokens);
       {
         // update K-V cache
-        int parallelism = m->kProjSize * num_new_tokens * m->num_heads;
+        int parallelism =
+            (m->kProjSize + m->vProjSize) * num_new_tokens * m->num_kv_heads;
         update_tree_branch_kv_cache<<<GET_BLOCKS(parallelism),
                                       min(CUDA_NUM_THREADS, parallelism),
                                       0,
                                       stream>>>(
             static_cast<DT *>(m->devQKVProjArray),
             static_cast<DT *>(m->keyCache),
-            m->token_infos,
-            m->qProjSize,
-            m->kProjSize,
-            m->vProjSize,
-            num_new_tokens,            // num_tokens_in_branch
-            processed_tokens_in_batch, // num_processed_tokens_in_batch
-            m->num_active_tokens,      // total_tokens_in_batch
-            m->num_heads,
-            BatchConfig::MAX_SEQ_LENGTH,
-            /* k_cache = */ true);
-
-        parallelism = m->vProjSize * num_new_tokens * m->num_heads;
-        update_tree_branch_kv_cache<<<GET_BLOCKS(parallelism),
-                                      min(CUDA_NUM_THREADS, parallelism),
-                                      0,
-                                      stream>>>(
-            static_cast<DT *>(m->devQKVProjArray),
             static_cast<DT *>(m->valueCache),
             m->token_infos,
             m->qProjSize,
@@ -255,8 +235,8 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
             processed_tokens_in_batch, // num_processed_tokens_in_batch
             m->num_active_tokens,      // total_tokens_in_batch
             m->num_heads,
-            BatchConfig::MAX_SEQ_LENGTH,
-            /* k_cache = */ false);
+            m->num_kv_heads,
+            BatchConfig::MAX_SEQ_LENGTH);
       }
 
       // bc->token_last_available_idx[i] + 1;
@@ -265,7 +245,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       int n = total_tokens_in_request;
       int k = m->qProjSize;
       int lda = k, ldb = k, ldc = m_;
-      int strideA = qkv_block_size;
+      int strideA = q_block_size;
       int strideB = kt_block_size;
       int strideC = num_new_tokens * total_tokens_in_request;
 
@@ -275,37 +255,68 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
         alpha = static_cast<DT>(1.0f / sqrt(m->kProjSize));
       }
       // To get A, skip over Q entries from previous requests (same head)
-      void const *A = static_cast<DT *>(m->devQKVProjArray) +
-                      processed_tokens_in_batch * m->qProjSize;
+      DT const *A = static_cast<DT *>(m->devQKVProjArray) +
+                    processed_tokens_in_batch * m->qProjSize;
       // To get B, skip over K entries from previous requests (all heads +
       // padding)
-      void const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
+      DT const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
       // To get C, skip over QK^T products from previous requests
-      void *C = static_cast<DT *>(m->qk_prods);
-
-      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                           CUBLAS_OP_T,
-                                           CUBLAS_OP_N,
-                                           m_,
-                                           n,
-                                           k,
-                                           &alpha,
-                                           A,
-                                           cublas_data_type,
-                                           lda,
-                                           strideA,
-                                           B,
-                                           cublas_data_type,
-                                           ldb,
-                                           strideB,
-                                           &beta,
-                                           C,
-                                           cublas_data_type,
-                                           ldc,
-                                           strideC,
-                                           m->num_heads,
-                                           compute_type,
-                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+      DT *C = static_cast<DT *>(m->qk_prods);
+
+      if (m->num_heads == m->num_kv_heads) {
+        checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                             CUBLAS_OP_T,
+                                             CUBLAS_OP_N,
+                                             m_,
+                                             n,
+                                             k,
+                                             &alpha,
+                                             A,
+                                             cublas_data_type,
+                                             lda,
+                                             strideA,
+                                             B,
+                                             cublas_data_type,
+                                             ldb,
+                                             strideB,
+                                             &beta,
+                                             C,
+                                             cublas_data_type,
+                                             ldc,
+                                             strideC,
+                                             m->num_heads,
+                                             compute_type,
+                                             CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+      } else {
+        strideB = 0;
+        int one_step_heads = m->num_heads / m->num_kv_heads;
+        for (int step = 0; step < m->num_kv_heads; step++) {
+          checkCUDA(
+              cublasGemmStridedBatchedEx(m->handle.blas,
+                                         CUBLAS_OP_T,
+                                         CUBLAS_OP_N,
+                                         m_,
+                                         n,
+                                         k,
+                                         &alpha,
+                                         A + step * strideA * one_step_heads,
+                                         cublas_data_type,
+                                         lda,
+                                         strideA,
+                                         B + step * kt_block_size,
+                                         cublas_data_type,
+                                         ldb,
+                                         strideB,
+                                         &beta,
+                                         C + step * strideC * one_step_heads,
+                                         cublas_data_type,
+                                         ldc,
+                                         strideC,
+                                         one_step_heads,
+                                         compute_type,
+                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+        }
+      }
 
       // Fill all elements above diagonal in qk prods with -inf to force
       // causal attention.
@@ -318,15 +329,13 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                                                parallelism),
                                            0,
                                            stream>>>(
-            static_cast<DT *>(C),
+            C,
             num_new_tokens,
             total_tokens_in_request,
             m->num_heads,
             static_cast<DT>(-INFINITY));
       }
       // Compute Softmax(QK^T/sqrt(d_k))
-      cudnnTensorDescriptor_t qk_tensor;
-      checkCUDNN(cudnnCreateTensorDescriptor(&qk_tensor));
       // Before modifying the parameters below, make sure to read the following
       // description of the CUDNN_TENSOR_NCHW tensor layout, from
       // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#cudnnTensorFormat_t:
@@ -340,7 +349,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       int c_param = total_tokens_in_request;
       int h_param = 1;
       int w_param = num_new_tokens;
-      checkCUDNN(cudnnSetTensor4dDescriptor(qk_tensor,
+      checkCUDNN(cudnnSetTensor4dDescriptor(m->qk_tensor,
                                             CUDNN_TENSOR_NCHW,
                                             cudnn_data_type,
                                             n_param,
@@ -348,7 +357,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                                             h_param,
                                             w_param));
       float softmax_alpha = 1.0f, softmax_beta = 0.0f;
-      void *C_softmax = (void *)(m->qk_prods_softmax);
+      DT *C_softmax = static_cast<DT *>(m->qk_prods_softmax);
       // The softmax operation below is executed according to the
       // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
       // softmax operation is computed per spatial location (H,W) per image (N)
@@ -357,10 +366,10 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                                      CUDNN_SOFTMAX_ACCURATE,
                                      CUDNN_SOFTMAX_MODE_CHANNEL,
                                      &softmax_alpha,
-                                     qk_tensor,
+                                     m->qk_tensor,
                                      C,
                                      &softmax_beta,
-                                     qk_tensor,
+                                     m->qk_tensor,
                                      C_softmax));
       // Matmul softmax(QK^T/sqrt(d_k)) by V
       alpha = 1.0f, beta = 0.0f;
@@ -373,7 +382,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       strideC = num_new_tokens * m->vProjSize;
       // To get A, skip over softmax(QK^T/sqrt(d_k)) entries from previous
       // requests (all heads)
-      A = static_cast<DT *>(C_softmax);
+      A = C_softmax;
       // To get B, skip over V^T entries from previous requests (all heads +
       // padding)
       B = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
@@ -382,36 +391,70 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       C = static_cast<DT *>(m->attn_heads) +
           processed_tokens_in_batch * m->num_heads * m->vProjSize;
 
-      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                           CUBLAS_OP_N,
-                                           CUBLAS_OP_T,
-                                           m_,
-                                           n,
-                                           k,
-                                           &alpha,
-                                           A,
-                                           cublas_data_type,
-                                           lda,
-                                           strideA,
-                                           B,
-                                           cublas_data_type,
-                                           ldb,
-                                           strideB,
-                                           &beta,
-                                           C,
-                                           cublas_data_type,
-                                           ldc,
-                                           strideC,
-                                           m->num_heads,
-                                           compute_type,
-                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+      if (m->num_heads == m->num_kv_heads) {
+        checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                             CUBLAS_OP_N,
+                                             CUBLAS_OP_T,
+                                             m_,
+                                             n,
+                                             k,
+                                             &alpha,
+                                             A,
+                                             cublas_data_type,
+                                             lda,
+                                             strideA,
+                                             B,
+                                             cublas_data_type,
+                                             ldb,
+                                             strideB,
+                                             &beta,
+                                             C,
+                                             cublas_data_type,
+                                             ldc,
+                                             strideC,
+                                             m->num_heads,
+                                             compute_type,
+                                             CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+      } else {
+        int one_step_heads = m->num_heads / m->num_kv_heads;
+        strideB = 0;
+        for (int step = 0; step < m->num_kv_heads; step++) {
+          checkCUDA(
+              cublasGemmStridedBatchedEx(m->handle.blas,
+                                         CUBLAS_OP_N,
+                                         CUBLAS_OP_T,
+                                         m_,
+                                         n,
+                                         k,
+                                         &alpha,
+                                         A + step * one_step_heads * strideA,
+                                         cublas_data_type,
+                                         lda,
+                                         strideA,
+                                         B + step * vt_block_size,
+                                         cublas_data_type,
+                                         ldb,
+                                         strideB,
+                                         &beta,
+                                         C + step * one_step_heads * strideC,
+                                         cublas_data_type,
+                                         ldc,
+                                         strideC,
+                                         one_step_heads,
+                                         compute_type,
+                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+        }
+      }
+
       // Project to output, save result directly on output tensor
       alpha = 1.0f, beta = 0.0f;
       m_ = m->oProjSize;
       k = m->vProjSize * m->num_heads;
       n = num_new_tokens;
       lda = k, ldb = n, ldc = m_;
-      A = static_cast<DT *>(m->W_out_contiguous);
+      A = weight_ptr + m->qSize * (m->qProjSize * m->num_heads +
+                                   m->kProjSize * m->num_kv_heads +
+                                   m->vProjSize * m->num_kv_heads);
       B = C;
       C = static_cast<DT *>(output_ptr) +
           processed_tokens_in_batch * m->oProjSize;
@@ -443,11 +486,17 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
   }
   if (*m->bias && shard_id == 0) {
     int parallelism = m->oProjSize * processed_tokens_in_batch;
+    int qkv_weight_size = m->qProjSize * m->global_num_heads +
+                          m->kProjSize * m->global_num_kv_heads +
+                          m->vProjSize * m->global_num_kv_heads;
     apply_proj_bias_w<<<GET_BLOCKS(parallelism),
                         min(CUDA_NUM_THREADS, parallelism),
                         0,
-                        stream>>>(
-        output_ptr, bias_ptr, processed_tokens_in_batch, m->oProjSize);
+                        stream>>>(output_ptr,
+                                  bias_ptr,
+                                  processed_tokens_in_batch,
+                                  qkv_weight_size,
+                                  m->oProjSize);
   }
 
   assert(processed_tokens_in_batch == bc->num_active_tokens());
@@ -463,35 +512,21 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
                       DT const *bias_ptr,
                       cudaStream_t stream) {
   // additional processing for weight uploading
-  // if (m->handle.offload_reserve_space != nullptr) {
-  //   // Note that we update weight_ptr and bias_ptr when uploading weight and
-  //   // bias
-  //   cudaMemcpyAsync(m->weight_ptr,
-  //                   weight_ptr,
-  //                   m->weightSize,
-  //                   cudaMemcpyHostToDevice,
-  //                   stream);
-  //   weight_ptr = static_cast<DT *>(m->weight_ptr);
-  //   if (m->biasSize > 0) {
-  //     cudaMemcpyAsync(
-  //         m->bias_ptr, bias_ptr, m->biasSize, cudaMemcpyHostToDevice,
-  //         stream);
-  //     bias_ptr = static_cast<DT *>(m->bias_ptr);
-  //   }
-  //   // reload weight_o for offloading case
-  //   int parallelism = m->vProjSize * m->oProjSize * m->num_heads;
-  //   build_w_out_tensor<<<GET_BLOCKS(parallelism),
-  //                        min(CUDA_NUM_THREADS, parallelism),
-  //                        0,
-  //                        stream>>>(weight_ptr,
-  //                                  static_cast<DT *>(m->W_out_contiguous),
-  //                                  m->vProjSize,
-  //                                  m->oProjSize,
-  //                                  m->num_heads,
-  //                                  (m->qSize * m->qProjSize +
-  //                                   m->kSize * m->kProjSize +
-  //                                   m->vSize * m->vProjSize));
-  // }
+  if (m->handle.offload_reserve_space != nullptr) {
+    // Note that we update weight_ptr and bias_ptr when uploading weight and
+    // bias
+    cudaMemcpyAsync(m->weight_ptr,
+                    weight_ptr,
+                    m->weightSize,
+                    cudaMemcpyHostToDevice,
+                    stream);
+    weight_ptr = static_cast<DT *>(m->weight_ptr);
+    if (m->biasSize > 0) {
+      cudaMemcpyAsync(
+          m->bias_ptr, bias_ptr, m->biasSize, cudaMemcpyHostToDevice, stream);
+      bias_ptr = static_cast<DT *>(m->bias_ptr);
+    }
+  }
   // copy committed tokens info to GPU for the commit_tokens kernel
   // Note that m->num_active_tokens stores the number of active
   // tokens in the previous batch, which is needed for committing
@@ -536,7 +571,8 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
 
   // phase 3: Compute attention score
   // 3 kernels for pahse 3: matmul1 - softmax - matmal2
-  compute_attention_kernel(m, bc, shard_id, output_ptr, bias_ptr, stream);
+  compute_attention_kernel(
+      m, bc, shard_id, output_ptr, bias_ptr, weight_ptr, stream);
 }
 
 } // namespace TreeIncMultiHeadAttention
@@ -624,7 +660,8 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
     GenericTensorAccessorR const &weight,
     MemoryAllocator &gpu_mem_allocator,
     int num_samples,
-    int _num_heads)
+    int _num_heads,
+    int _num_kv_heads)
     : IncMultiHeadSelfAttentionMeta(handler,
                                     TREE_VERIFY_MODE,
                                     attn,
@@ -645,7 +682,9 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
                                     gpu_mem_allocator,
                                     num_samples,
                                     attn->num_heads,
+                                    attn->num_kv_heads,
                                     _num_heads,
+                                    _num_kv_heads,
                                     attn->quantization_type,
                                     attn->offload),
       num_active_tokens(0) {
diff --git a/src/runtime/cuda_helper.cu b/src/runtime/cuda_helper.cu
index da22a245f1..e4728bdb88 100644
--- a/src/runtime/cuda_helper.cu
+++ b/src/runtime/cuda_helper.cu
@@ -209,8 +209,10 @@ __host__ void updateGAS(float *para_ptr,
 }
 
 template <typename T>
-__host__ void
-    print_tensor(T const *ptr, size_t num_elements, char const *prefix) {
+__host__ void print_tensor(T const *ptr,
+                           size_t num_elements,
+                           char const *prefix,
+                           int shard_id) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   T *host_ptr;
@@ -221,7 +223,7 @@ __host__ void
       host_ptr, ptr, sizeof(T) * num_elements, cudaMemcpyDeviceToHost, stream));
   cudaDeviceSynchronize();
   int idx = 0;
-  printf("%s", prefix);
+  printf("%s, %d---->", prefix, shard_id);
   for (idx = 0; idx < num_elements; idx++) {
     printf(" %.20lf", (float)host_ptr[idx]);
     if (idx >= 100) {
@@ -278,7 +280,7 @@ __host__ void
   checkCUDA(cudaMemcpyAsync(
       host_ptr, ptr, sizeof(T) * num_elements, cudaMemcpyDeviceToHost, stream));
   // checkCUDA(cudaDeviceSynchronize());
-
+  cudaDeviceSynchronize();
   FILE *tensor_file;
   tensor_file = fopen(file_name, "w");
   for (unsigned i = 0; i < num_elements; i++) {
@@ -567,16 +569,26 @@ template __global__ void apply_add_with_scale<int64_t>(int64_t *data_ptr,
                                                        size_t size,
                                                        int64_t scale);
 
-template __host__ void
-    print_tensor<float>(float const *ptr, size_t rect, char const *prefix);
-template __host__ void
-    print_tensor<double>(double const *ptr, size_t rect, char const *prefix);
-template __host__ void
-    print_tensor<int32_t>(int32_t const *ptr, size_t rect, char const *prefix);
-template __host__ void
-    print_tensor<int64_t>(int64_t const *ptr, size_t rect, char const *prefix);
-template __host__ void
-    print_tensor<half>(half const *ptr, size_t rect, char const *prefix);
+template __host__ void print_tensor<float>(float const *ptr,
+                                           size_t rect,
+                                           char const *prefix,
+                                           int shard_id);
+template __host__ void print_tensor<double>(double const *ptr,
+                                            size_t rect,
+                                            char const *prefix,
+                                            int shard_id);
+template __host__ void print_tensor<int32_t>(int32_t const *ptr,
+                                             size_t rect,
+                                             char const *prefix,
+                                             int shard_id);
+template __host__ void print_tensor<int64_t>(int64_t const *ptr,
+                                             size_t rect,
+                                             char const *prefix,
+                                             int shard_id);
+template __host__ void print_tensor<half>(half const *ptr,
+                                          size_t rect,
+                                          char const *prefix,
+                                          int shard_id);
 
 template __host__ void print_beam_tensor<float>(float const *ptr,
                                                 size_t num_elements,
diff --git a/src/runtime/ffconst_utils.cc b/src/runtime/ffconst_utils.cc
index 35ec59ce03..0723ee136d 100644
--- a/src/runtime/ffconst_utils.cc
+++ b/src/runtime/ffconst_utils.cc
@@ -154,8 +154,6 @@ std::string get_operator_type_name(OperatorType type) {
       return "SpecIncMultiHeadSelfAttention";
     case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION:
       return "TreeIncMultiHeadSelfAttention";
-    case OP_INC_MULTIQUERY_SELF_ATTENTION:
-      return "IncMultiQuerySelfAttention";
     case OP_INPUT:
       return "Input";
     case OP_WEIGHT:
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index a82add4b62..a3a9e5c4d9 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -33,7 +33,6 @@
 #include "flexflow/ops/gather.h"
 #include "flexflow/ops/groupby.h"
 #include "flexflow/ops/inc_multihead_self_attention.h"
-#include "flexflow/ops/inc_multiquery_self_attention.h"
 #include "flexflow/ops/layer_norm.h"
 #include "flexflow/ops/linear.h"
 #include "flexflow/ops/noop.h"
@@ -2326,6 +2325,8 @@ GraphOptimalViewSerialized
         sez.serialize(attn->qk_prod_scaling);
         sez.serialize(attn->quantization_type);
         sez.serialize(attn->offload);
+        sez.serialize(attn->num_kv_heads);
+        sez.serialize(attn->tensor_parallelism_degree);
         break;
       }
       case OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION: {
@@ -2345,6 +2346,7 @@ GraphOptimalViewSerialized
         sez.serialize(attn->scaling_query);
         sez.serialize(attn->scaling_factor);
         sez.serialize(attn->qk_prod_scaling);
+        sez.serialize(attn->num_kv_heads);
         break;
       }
       case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION: {
@@ -2366,20 +2368,8 @@ GraphOptimalViewSerialized
         sez.serialize(attn->qk_prod_scaling);
         sez.serialize(attn->quantization_type);
         sez.serialize(attn->offload);
-        break;
-      }
-      case OP_INC_MULTIQUERY_SELF_ATTENTION: {
-        IncMultiQuerySelfAttention *attn = (IncMultiQuerySelfAttention *)op;
-        sez.serialize(attn->layer_guid.id);
-        sez.serialize(attn->layer_guid.transformer_layer_id);
-        sez.serialize(attn->oProjSize);
-        sez.serialize(attn->num_heads);
-        sez.serialize(attn->qProjSize);
-        sez.serialize(attn->vProjSize);
-        sez.serialize(attn->dropout);
-        sez.serialize(attn->bias);
-        sez.serialize(attn->add_bias_kv);
-        sez.serialize(attn->add_zero_attn);
+        sez.serialize(attn->num_kv_heads);
+        sez.serialize(attn->tensor_parallelism_degree);
         break;
       }
       case OP_SOFTMAX: {
@@ -2746,7 +2736,8 @@ void FFModel::deserialize_graph_optimal_view(
       }
       case OP_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(num_inputs == 1);
-        int embed_dim, num_heads, k_dim, v_dim;
+        int embed_dim, num_heads, k_dim, v_dim, num_kv_heads,
+            tensor_parallelism_degree;
         float dropout, scaling_factor;
         bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
             scaling_query, qk_prod_scaling, offload;
@@ -2769,6 +2760,8 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(qk_prod_scaling);
         dez.deserialize(quantization_type);
         dez.deserialize(offload);
+        dez.deserialize(num_kv_heads);
+        dez.deserialize(tensor_parallelism_degree);
 
         IncMultiHeadSelfAttentionParams params;
         params.embed_dim = embed_dim;
@@ -2786,12 +2779,14 @@ void FFModel::deserialize_graph_optimal_view(
         params.qk_prod_scaling = qk_prod_scaling;
         params.quantization_type = quantization_type;
         params.offload = offload;
+        params.num_kv_heads = num_kv_heads;
+        params.tensor_parallelism_degree = tensor_parallelism_degree;
         node = get_or_create_node<IncMultiHeadSelfAttention>(inputs[0], params);
         break;
       }
       case OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(num_inputs == 1);
-        int embed_dim, num_heads, k_dim, v_dim;
+        int embed_dim, num_heads, k_dim, v_dim, num_kv_heads;
         float dropout, scaling_factor;
         bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
             scaling_query, qk_prod_scaling;
@@ -2811,6 +2806,7 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(scaling_query);
         dez.deserialize(scaling_factor);
         dez.deserialize(qk_prod_scaling);
+        dez.deserialize(num_kv_heads);
 
         SpecIncMultiHeadSelfAttentionParams params;
         params.embed_dim = embed_dim;
@@ -2826,13 +2822,15 @@ void FFModel::deserialize_graph_optimal_view(
         params.scaling_query = scaling_query;
         params.scaling_factor = scaling_factor;
         params.qk_prod_scaling = qk_prod_scaling;
+        params.num_kv_heads = num_kv_heads;
         node = get_or_create_node<SpecIncMultiHeadSelfAttention>(inputs[0],
                                                                  params);
         break;
       }
       case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(num_inputs == 1);
-        int embed_dim, num_heads, k_dim, v_dim;
+        int embed_dim, num_heads, k_dim, v_dim, num_kv_heads,
+            tensor_parallelism_degree;
         float dropout, scaling_factor;
         bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
             scaling_query, qk_prod_scaling, offload;
@@ -2855,6 +2853,8 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(qk_prod_scaling);
         dez.deserialize(quantization_type);
         dez.deserialize(offload);
+        dez.deserialize(num_kv_heads);
+        dez.deserialize(tensor_parallelism_degree);
 
         TreeIncMultiHeadSelfAttentionParams params;
         params.embed_dim = embed_dim;
@@ -2872,43 +2872,12 @@ void FFModel::deserialize_graph_optimal_view(
         params.qk_prod_scaling = qk_prod_scaling;
         params.quantization_type = quantization_type;
         params.offload = offload;
+        params.num_kv_heads = num_kv_heads;
+        params.tensor_parallelism_degree = tensor_parallelism_degree;
         node = get_or_create_node<TreeIncMultiHeadSelfAttention>(inputs[0],
                                                                  params);
         break;
       }
-      case OP_INC_MULTIQUERY_SELF_ATTENTION: {
-        assert(num_inputs == 1);
-        int embed_dim, num_heads, k_dim, v_dim;
-        float dropout, scaling_factor;
-        bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
-            scaling_query, qk_prod_scaling;
-        size_t id, transformer_layer_id;
-        dez.deserialize(id);
-        dez.deserialize(transformer_layer_id);
-        LayerID layer_guid(id, transformer_layer_id);
-        dez.deserialize(embed_dim);
-        dez.deserialize(num_heads);
-        dez.deserialize(k_dim);
-        dez.deserialize(v_dim);
-        dez.deserialize(dropout);
-        dez.deserialize(bias);
-        dez.deserialize(add_bias_kv);
-        dez.deserialize(add_zero_attn);
-
-        IncMultiQuerySelfAttentionParams params;
-        params.embed_dim = embed_dim;
-        params.num_heads = num_heads;
-        params.kdim = k_dim;
-        params.vdim = v_dim;
-        params.dropout = dropout;
-        params.bias = bias;
-        params.add_bias_kv = add_bias_kv;
-        params.add_zero_attn = add_zero_attn;
-        params.layer_guid = layer_guid;
-        node =
-            get_or_create_node<IncMultiQuerySelfAttention>(inputs[0], params);
-        break;
-      }
       case OP_TOPK: {
         node = TopK::deserialize(*this, dez, inputs, num_inputs);
         break;
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 2a7ece3c06..b54a58448e 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -44,7 +44,6 @@
 #include "flexflow/ops/gather.h"
 #include "flexflow/ops/groupby.h"
 #include "flexflow/ops/inc_multihead_self_attention.h"
-#include "flexflow/ops/inc_multiquery_self_attention.h"
 #include "flexflow/ops/layer_norm.h"
 #include "flexflow/ops/linear.h"
 #include "flexflow/ops/noop.h"
@@ -2801,12 +2800,6 @@ Op *FFModel::create_operator_from_layer(
       operators.push_back(op);
       return op;
     }
-    case OP_INC_MULTIQUERY_SELF_ATTENTION: {
-      Op *op = IncMultiQuerySelfAttention::create_operator_from_layer(
-          *this, layer, inputs);
-      operators.push_back(op);
-      return op;
-    }
     case OP_BATCHMATMUL: {
       Op *op = BatchMatmul::create_operator_from_layer(*this, layer, inputs);
       operators.push_back(op);
@@ -5726,43 +5719,6 @@ void register_flexflow_internal_tasks(Runtime *runtime,
           registrar);
     }
   }
-  // MultiQueryAttention task
-  {
-    TaskVariantRegistrar registrar(INC_MULTIQUERY_SELF_ATTENTION_INIT_TASK_ID,
-                                   "IncMultiQuerySelfAttention Init");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    if (pre_register) {
-      Runtime::preregister_task_variant<OpMeta *,
-                                        IncMultiQuerySelfAttention::init_task>(
-          registrar, "IncMultiQuerySelfAttention Init Task");
-    } else {
-      if (enable_control_replication) {
-        registrar.global_registration = false;
-      }
-      runtime->register_task_variant<OpMeta *,
-                                     IncMultiQuerySelfAttention::init_task>(
-          registrar);
-    }
-  }
-  {
-    TaskVariantRegistrar registrar(INC_MULTIQUERY_SELF_ATTENTION_INF_TASK_ID,
-                                   "IncMultiQuerySelfAttention Inference");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    if (pre_register) {
-      Runtime::preregister_task_variant<
-          IncMultiQuerySelfAttention::inference_task>(
-          registrar, "IncMultiQuerySelfAttention Inference Task");
-    } else {
-      if (enable_control_replication) {
-        registrar.global_registration = false;
-      }
-      runtime
-          ->register_task_variant<IncMultiQuerySelfAttention::inference_task>(
-              registrar);
-    }
-  }
   // speculative MultiHeadAttention task
   {
     TaskVariantRegistrar registrar(
diff --git a/src/runtime/operator_params.cc b/src/runtime/operator_params.cc
index bf817f5351..5f9ae98936 100644
--- a/src/runtime/operator_params.cc
+++ b/src/runtime/operator_params.cc
@@ -19,7 +19,6 @@
 #include "flexflow/ops/gather.h"
 #include "flexflow/ops/groupby.h"
 #include "flexflow/ops/inc_multihead_self_attention.h"
-#include "flexflow/ops/inc_multiquery_self_attention.h"
 #include "flexflow/ops/layer_norm.h"
 #include "flexflow/ops/linear.h"
 #include "flexflow/ops/mean.h"
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 2712d21c3f..2041bdd9a7 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -71,7 +71,7 @@ void RequestManager::register_tokenizer(ModelType type,
   this->model_type = type;
   std::string tokenizer_folder =
       (!path.empty() && path.back() != '/') ? path + '/' : path;
-  if (model_type == ModelType::LLAMA) {
+  if (model_type == ModelType::LLAMA || model_type == ModelType::LLAMA2) {
     bool path_to_file = !path.empty() &&
                         (path.size() >= strlen("tokenizer.model")) &&
                         path.find("tokenizer.model") ==
@@ -189,14 +189,15 @@ RequestManager::RequestGuid
     RequestManager::register_new_request(std::string const &prompt,
                                          int max_sequence_length) {
   const std::lock_guard<std::mutex> lock(request_queue_mutex);
-
   // Add a new request
   Request request;
   request.guid = next_available_guid++;
   request.max_sequence_length = max_sequence_length;
-  request.tokens.push_back(this->model_bos_map.at(this->model_type));
-  std::vector<int32_t> tokens = this->tokenizer_->Encode(prompt);
+  if (this->model_bos_map.find(this->model_type) != this->model_bos_map.end()) {
+    request.tokens.push_back(this->model_bos_map.at(this->model_type));
+  }
 
+  std::vector<int32_t> tokens = this->tokenizer_->Encode(prompt);
   if (tokens.size() > BatchConfig::MAX_PROMPT_LENGTH) {
     std::cout << "Warning: too many tokens in prompt, only load up to "
               << BatchConfig::MAX_PROMPT_LENGTH << " tokens, but got "
@@ -207,12 +208,9 @@ RequestManager::RequestGuid
     // assert(false);
     return 0;
   }
-
   for (int i = 0; i < tokens.size(); i++) {
     std::cout << "[" << i << "]" << tokens.at(i) << "\n";
   }
-
-  // assert(false);
   request.tokens.insert(request.tokens.end(), tokens.begin(), tokens.end());
   request.initial_len = request.tokens.size();
 
diff --git a/src/runtime/substitution.cc b/src/runtime/substitution.cc
index 6a61e70fc6..3a25d99b6f 100644
--- a/src/runtime/substitution.cc
+++ b/src/runtime/substitution.cc
@@ -29,7 +29,6 @@
 #include "flexflow/ops/experts.h"
 #include "flexflow/ops/flat.h"
 #include "flexflow/ops/inc_multihead_self_attention.h"
-#include "flexflow/ops/inc_multiquery_self_attention.h"
 #include "flexflow/ops/linear.h"
 #include "flexflow/ops/noop.h"
 #include "flexflow/ops/pool_2d.h"
@@ -3725,13 +3724,6 @@ bool FFModel::convert_graph_to_operators(
         new_op = new IncMultiHeadSelfAttention(*this, *attn, inputs[0], true);
         break;
       }
-      case OP_INC_MULTIQUERY_SELF_ATTENTION: {
-        assert(inList.size() == 1);
-        IncMultiQuerySelfAttention *attn =
-            (IncMultiQuerySelfAttention *)node.ptr;
-        new_op = new IncMultiQuerySelfAttention(*this, *attn, inputs[0], true);
-        break;
-      }
       case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(inList.size() == 1);
         TreeIncMultiHeadSelfAttention *attn =

From c19882ee29db820c79f88826856e8d38a2531d18 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 4 Aug 2023 04:12:23 +0000
Subject: [PATCH 190/344] api update

---
 .../cpp/inference/mixture_of_experts/moe.cc   |   1 -
 .../inference/transformers/transformers.cc    |   1 -
 include/flexflow/flexflow_c.h                 |  61 +++-
 include/flexflow/model.h                      |  54 +++-
 .../ops/inc_multihead_self_attention.h        |  14 +-
 .../ops/inc_multihead_self_attention_params.h |   3 +-
 .../ops/spec_inc_multihead_self_attention.h   |   8 +-
 ...spec_inc_multihead_self_attention_params.h |   2 +-
 .../ops/tree_inc_multihead_self_attention.h   |   8 +-
 ...tree_inc_multihead_self_attention_params.h |   3 +-
 inference/models/configs/llama2_70B.json      |   1 -
 inference/models/configs/llama2_7B.json       |   1 -
 inference/models/configs/llama_160M.json      |   1 -
 inference/models/configs/llama_7B.json        |   1 -
 inference/models/falcon.cc                    |   6 +-
 inference/models/llama.cc                     |   5 +-
 inference/models/llama.h                      |   4 +-
 inference/models/opt.cc                       |   3 -
 src/c/flexflow_c.cc                           | 137 +++++++-
 src/ops/inc_multihead_self_attention.cc       | 300 ++++++++++--------
 src/ops/inc_multihead_self_attention.cpp      |   6 +-
 src/ops/inc_multihead_self_attention.cu       | 139 ++++----
 src/ops/spec_inc_multihead_self_attention.cc  |  84 +++--
 src/ops/spec_inc_multihead_self_attention.cpp |   6 +-
 src/ops/spec_inc_multihead_self_attention.cu  |  46 +--
 src/ops/tree_inc_multihead_self_attention.cc  | 278 +++++++++-------
 src/ops/tree_inc_multihead_self_attention.cpp |   6 +-
 src/ops/tree_inc_multihead_self_attention.cu  |  49 +--
 src/runtime/graph.cc                          |  24 +-
 29 files changed, 795 insertions(+), 457 deletions(-)

diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
index 5125e5d98e..4a5c33c9b0 100644
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ b/examples/cpp/inference/mixture_of_experts/moe.cc
@@ -79,7 +79,6 @@ Tensor create_moe_encoder(FFModel *model,
                          x,
                          moeConfig->hidden_size,
                          moeConfig->num_attention_heads,
-                         moeConfig->num_attention_heads,
                          moeConfig->attention_kdim,
                          moeConfig->attention_vdim)
                    : model->multihead_attention(x,
diff --git a/examples/cpp/inference/transformers/transformers.cc b/examples/cpp/inference/transformers/transformers.cc
index 2d818e8e4e..0717ddc90f 100644
--- a/examples/cpp/inference/transformers/transformers.cc
+++ b/examples/cpp/inference/transformers/transformers.cc
@@ -47,7 +47,6 @@ Tensor create_inc_multihead_attention_decoder(
                 input,
                 transformerConfig->hidden_size,
                 transformerConfig->num_attention_heads,
-                transformerConfig->num_attention_heads,
                 transformerConfig->attention_kdim,
                 transformerConfig->attention_vdim)
           : model->multihead_attention(input,
diff --git a/include/flexflow/flexflow_c.h b/include/flexflow/flexflow_c.h
index 949c0f7885..7f1374415c 100644
--- a/include/flexflow/flexflow_c.h
+++ b/include/flexflow/flexflow_c.h
@@ -401,7 +401,6 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_attention(
     const flexflow_tensor_t input_,
     int embed_dim,
     int num_heads,
-    int num_kv_heads,
     int kdim,
     int vdim,
     float dropout,
@@ -421,7 +420,6 @@ flexflow_tensor_t flexflow_model_add_spec_inc_multihead_attention(
     const flexflow_tensor_t input_,
     int embed_dim,
     int num_heads,
-    int num_kv_heads,
     int kdim,
     int vdim,
     float dropout,
@@ -441,6 +439,65 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention_verify(
     const flexflow_tensor_t input_,
     int embed_dim,
     int num_heads,
+    int kdim,
+    int vdim,
+    float dropout,
+    bool bias,
+    bool add_bias_kv,
+    bool add_zero_attn,
+    enum DataType data_type,
+    flexflow_initializer_t kernel_initializer_,
+    bool apply_rotary_embedding,
+    bool scaling_query,
+    float scaling_factor,
+    bool qk_prod_scaling,
+    char const *name);
+
+flexflow_tensor_t flexflow_model_add_inc_multiquery_attention(
+    flexflow_model_t handle_,
+    const flexflow_tensor_t input_,
+    int embed_dim,
+    int num_q_heads,
+    int num_kv_heads,
+    int kdim,
+    int vdim,
+    float dropout,
+    bool bias,
+    bool add_bias_kv,
+    bool add_zero_attn,
+    enum DataType data_type,
+    flexflow_initializer_t kernel_initializer_,
+    bool apply_rotary_embedding,
+    bool scaling_query,
+    float scaling_factor,
+    bool qk_prod_scaling,
+    char const *name);
+
+flexflow_tensor_t flexflow_model_add_spec_inc_multiquery_attention(
+    flexflow_model_t handle_,
+    const flexflow_tensor_t input_,
+    int embed_dim,
+    int num_q_heads,
+    int num_kv_heads,
+    int kdim,
+    int vdim,
+    float dropout,
+    bool bias,
+    bool add_bias_kv,
+    bool add_zero_attn,
+    enum DataType data_type,
+    flexflow_initializer_t kernel_initializer_,
+    bool apply_rotary_embedding,
+    bool scaling_query,
+    float scaling_factor,
+    bool qk_prod_scaling,
+    char const *name);
+
+flexflow_tensor_t flexflow_model_add_inc_multiquery_self_attention_verify(
+    flexflow_model_t handle_,
+    const flexflow_tensor_t input_,
+    int embed_dim,
+    int num_q_heads,
     int num_kv_heads,
     int kdim,
     int vdim,
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index d34cf14a76..7bd13224df 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -641,7 +641,6 @@ class FFModel {
   Tensor inc_multihead_self_attention(const Tensor input,
                                       int embed_dim,
                                       int num_heads,
-                                      int num_kv_heads,
                                       int kdim = 0,
                                       int vdim = 0,
                                       float dropout = 0.0f,
@@ -659,7 +658,6 @@ class FFModel {
       spec_inc_multihead_self_attention(const Tensor input,
                                         int embed_dim,
                                         int num_heads,
-                                        int num_kv_heads,
                                         int kdim = 0,
                                         int vdim = 0,
                                         float dropout = 0.0f,
@@ -677,6 +675,58 @@ class FFModel {
       const Tensor input,
       int embed_dim,
       int num_heads,
+      int kdim = 0,
+      int vdim = 0,
+      float dropout = 0.0f,
+      bool bias = false,
+      bool add_bias_kv = false,
+      bool add_zero_attn = false,
+      DataType data_type = DT_NONE,
+      Initializer *kernel_initializer = NULL,
+      bool apply_rotary_embedding = false,
+      bool scaling_query = false,
+      float scaling_factor = 1.0f,
+      bool qk_prod_scaling = true,
+      char const *name = NULL);
+  Tensor inc_multiquery_self_attention(const Tensor input,
+                                       int embed_dim,
+                                       int num_q_heads,
+                                       int num_kv_heads,
+                                       int kdim = 0,
+                                       int vdim = 0,
+                                       float dropout = 0.0f,
+                                       bool bias = false,
+                                       bool add_bias_kv = false,
+                                       bool add_zero_attn = false,
+                                       DataType data_type = DT_NONE,
+                                       Initializer *kernel_initializer = NULL,
+                                       bool apply_rotary_embedding = false,
+                                       bool scaling_query = false,
+                                       float scaling_factor = 1.0f,
+                                       bool qk_prod_scaling = true,
+                                       char const *name = NULL);
+  Tensor
+      spec_inc_multiquery_self_attention(const Tensor input,
+                                         int embed_dim,
+                                         int num_q_heads,
+                                         int num_kv_heads,
+                                         int kdim = 0,
+                                         int vdim = 0,
+                                         float dropout = 0.0f,
+                                         bool bias = false,
+                                         bool add_bias_kv = false,
+                                         bool add_zero_attn = false,
+                                         DataType data_type = DT_NONE,
+                                         Initializer *kernel_initializer = NULL,
+                                         bool apply_rotary_embedding = false,
+                                         bool scaling_query = false,
+                                         float scaling_factor = 1.0f,
+                                         bool qk_prod_scaling = true,
+                                         char const *name = NULL);
+  Tensor inc_multiquery_self_attention_verify(
+      const Tensor input,
+      int embed_dim,
+      int num_q_heads,
       int num_kv_heads,
       int kdim = 0,
       int vdim = 0,
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index ce1ef6f37c..91621074b3 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -28,7 +28,7 @@ class IncMultiHeadSelfAttention : public Op {
                             LayerID const &layer_guid,
                             const ParallelTensor _input,
                             int _embed_dim,
-                            int _num_heads,
+                            int _num_q_heads,
                             int _num_kv_heads,
                             int _kdim,
                             int _vdim,
@@ -49,7 +49,7 @@ class IncMultiHeadSelfAttention : public Op {
                             const ParallelTensor _input,
                             const ParallelTensor _weight,
                             int _embed_dim,
-                            int _num_heads,
+                            int _num_q_heads,
                             int _num_kv_heads,
                             int _kdim,
                             int _vdim,
@@ -118,7 +118,7 @@ class IncMultiHeadSelfAttention : public Op {
   Params get_params() const;
 
 public:
-  int num_heads, num_kv_heads, tensor_parallelism_degree;
+  int num_q_heads, num_kv_heads, tensor_parallelism_degree;
   float dropout, scaling_factor;
   bool bias;
   bool add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
@@ -136,7 +136,7 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
                                 GenericTensorAccessorR const &weight,
                                 MemoryAllocator &gpu_mem_allocator,
                                 int num_samples,
-                                int _num_heads,
+                                int _num_q_heads,
                                 int _num_kv_heads);
   IncMultiHeadSelfAttentionMeta(FFHandler handler,
                                 InferenceMode infer_mode,
@@ -157,9 +157,9 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
                                 GenericTensorAccessorR const &weight,
                                 MemoryAllocator &gpu_mem_allocator,
                                 int num_samples,
-                                int _global_num_heads,
+                                int _global_num_q_heads,
                                 int _global_num_kv_heads,
-                                int _num_heads,
+                                int _num_q_heads,
                                 int _num_kv_heads,
                                 DataType _quantization_type,
                                 bool _offload);
@@ -170,7 +170,7 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
   size_t weights_params, weightSize, biasSize, reserveSpaceSize,
       quantized_weightSize;
   int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
-  int global_num_heads, global_num_kv_heads, num_heads, num_kv_heads;
+  int global_num_q_heads, global_num_kv_heads, num_q_heads, num_kv_heads;
   bool *has_load_weights;
   bool *apply_rotary_embedding;
   bool *bias;
diff --git a/include/flexflow/ops/inc_multihead_self_attention_params.h b/include/flexflow/ops/inc_multihead_self_attention_params.h
index 84fedb45a7..be38b9ab1b 100644
--- a/include/flexflow/ops/inc_multihead_self_attention_params.h
+++ b/include/flexflow/ops/inc_multihead_self_attention_params.h
@@ -8,7 +8,8 @@ namespace FlexFlow {
 
 struct IncMultiHeadSelfAttentionParams {
   LayerID layer_guid;
-  int embed_dim, num_heads, kdim, vdim, num_kv_heads, tensor_parallelism_degree;
+  int embed_dim, num_q_heads, kdim, vdim, num_kv_heads,
+      tensor_parallelism_degree;
   float dropout, scaling_factor;
   bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
       qk_prod_scaling;
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention.h b/include/flexflow/ops/spec_inc_multihead_self_attention.h
index f5b06c830e..c6364805e3 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention.h
@@ -28,7 +28,7 @@ class SpecIncMultiHeadSelfAttention : public Op {
                                 LayerID const &layer_guid,
                                 const ParallelTensor _input,
                                 int _embed_dim,
-                                int _num_heads,
+                                int _num_q_heads,
                                 int _num_kv_heads,
                                 int _kdim,
                                 int _vdim,
@@ -46,7 +46,7 @@ class SpecIncMultiHeadSelfAttention : public Op {
                                 const ParallelTensor _input,
                                 const ParallelTensor _weight,
                                 int _embed_dim,
-                                int _num_heads,
+                                int _num_q_heads,
                                 int _num_kv_heads,
                                 int _kdim,
                                 int _vdim,
@@ -116,7 +116,7 @@ class SpecIncMultiHeadSelfAttention : public Op {
   Params get_params() const;
 
 public:
-  int num_heads, num_kv_heads, tensor_parallelism_degree;
+  int num_q_heads, num_kv_heads, tensor_parallelism_degree;
   float dropout, scaling_factor;
   bool bias;
   bool add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
@@ -132,7 +132,7 @@ class SpecIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
                                     GenericTensorAccessorR const &weight,
                                     MemoryAllocator &gpu_mem_allocator,
                                     int num_samples,
-                                    int _num_heads,
+                                    int _num_q_heads,
                                     int _num_kv_heads);
   ~SpecIncMultiHeadSelfAttentionMeta(void);
 
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention_params.h b/include/flexflow/ops/spec_inc_multihead_self_attention_params.h
index 1741b23745..d6f08dd9e6 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention_params.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention_params.h
@@ -8,7 +8,7 @@ namespace FlexFlow {
 
 struct SpecIncMultiHeadSelfAttentionParams {
   LayerID layer_guid;
-  int embed_dim, num_heads, num_kv_heads, kdim, vdim;
+  int embed_dim, num_q_heads, num_kv_heads, kdim, vdim;
   float dropout, scaling_factor;
   bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
       qk_prod_scaling;
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention.h b/include/flexflow/ops/tree_inc_multihead_self_attention.h
index cf714fe515..d5be344cca 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention.h
@@ -28,7 +28,7 @@ class TreeIncMultiHeadSelfAttention : public Op {
                                 LayerID const &layer_guid,
                                 const ParallelTensor _input,
                                 int _embed_dim,
-                                int _num_heads,
+                                int _num_q_heads,
                                 int _num_kv_heads,
                                 int _kdim,
                                 int _vdim,
@@ -49,7 +49,7 @@ class TreeIncMultiHeadSelfAttention : public Op {
                                 const ParallelTensor _input,
                                 const ParallelTensor _weight,
                                 int _embed_dim,
-                                int _num_heads,
+                                int _num_q_heads,
                                 int _num_kv_heads,
                                 int _kdim,
                                 int _vdim,
@@ -119,7 +119,7 @@ class TreeIncMultiHeadSelfAttention : public Op {
   Params get_params() const;
 
 public:
-  int num_heads, num_kv_heads, tensor_parallelism_degree;
+  int num_q_heads, num_kv_heads, tensor_parallelism_degree;
   float dropout, scaling_factor;
   bool bias;
   bool add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
@@ -137,7 +137,7 @@ class TreeIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
                                     GenericTensorAccessorR const &weight,
                                     MemoryAllocator &gpu_mem_allocator,
                                     int num_samples,
-                                    int _num_heads,
+                                    int _num_q_heads,
                                     int _num_kv_heads);
   ~TreeIncMultiHeadSelfAttentionMeta(void);
 
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention_params.h b/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
index a00e56bda6..3ba49dcbad 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
@@ -8,7 +8,8 @@ namespace FlexFlow {
 
 struct TreeIncMultiHeadSelfAttentionParams {
   LayerID layer_guid;
-  int embed_dim, num_heads, kdim, vdim, num_kv_heads, tensor_parallelism_degree;
+  int embed_dim, num_q_heads, kdim, vdim, num_kv_heads,
+      tensor_parallelism_degree;
   float dropout, scaling_factor;
   bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
       qk_prod_scaling;
diff --git a/inference/models/configs/llama2_70B.json b/inference/models/configs/llama2_70B.json
index 45751787e6..017e71888d 100644
--- a/inference/models/configs/llama2_70B.json
+++ b/inference/models/configs/llama2_70B.json
@@ -2,7 +2,6 @@
     "n_layers": 80,
     "vocab_size": 32000,
     "n_heads": 64,
-    "n_kv_heads": 8,
     "dim": 8192,
     "multiple_of": 256,
     "norm_eps": 1e-5,
diff --git a/inference/models/configs/llama2_7B.json b/inference/models/configs/llama2_7B.json
index 5796f70db7..46dd138e4f 100644
--- a/inference/models/configs/llama2_7B.json
+++ b/inference/models/configs/llama2_7B.json
@@ -2,7 +2,6 @@
     "n_layers": 32,
     "vocab_size": 32000,
     "n_heads": 32,
-    "n_kv_heads": 32,
     "dim": 4096,
     "multiple_of": 256,
     "norm_eps": 1e-5,
diff --git a/inference/models/configs/llama_160M.json b/inference/models/configs/llama_160M.json
index 85e83804aa..d912c64ab7 100644
--- a/inference/models/configs/llama_160M.json
+++ b/inference/models/configs/llama_160M.json
@@ -2,7 +2,6 @@
     "n_layers": 12,
     "vocab_size": 32000,
     "n_heads": 12,
-    "n_kv_heads": 12,
     "dim": 768,
     "multiple_of": 256,
     "norm_eps": 1e-6,
diff --git a/inference/models/configs/llama_7B.json b/inference/models/configs/llama_7B.json
index f0ef126096..0c32ed320d 100644
--- a/inference/models/configs/llama_7B.json
+++ b/inference/models/configs/llama_7B.json
@@ -2,7 +2,6 @@
     "n_layers": 32,
     "vocab_size": 32000,
     "n_heads": 32,
-    "n_kv_heads": 32,
     "dim": 4096,
     "multiple_of": 256,
     "norm_eps": 1e-6,
diff --git a/inference/models/falcon.cc b/inference/models/falcon.cc
index 2846549d28..00f7864e7f 100644
--- a/inference/models/falcon.cc
+++ b/inference/models/falcon.cc
@@ -89,7 +89,7 @@ void FALCON::create_falcon_model(FFModel &ff,
     Tensor mha;
     switch (mode) {
       case BEAM_SEARCH_MODE: {
-        mha = ff.spec_inc_multihead_self_attention(
+        mha = ff.spec_inc_multiquery_self_attention(
             att_norm,
             falcon_config.dim,
             falcon_config.n_heads,
@@ -107,7 +107,7 @@ void FALCON::create_falcon_model(FFModel &ff,
       }
 
       case TREE_VERIFY_MODE: {
-        mha = ff.inc_multihead_self_attention_verify(
+        mha = ff.inc_multiquery_self_attention_verify(
             att_norm,
             falcon_config.dim,
             falcon_config.n_heads,
@@ -126,7 +126,7 @@ void FALCON::create_falcon_model(FFModel &ff,
       }
 
       case INC_DECODING_MODE: {
-        mha = ff.inc_multihead_self_attention(
+        mha = ff.inc_multiquery_self_attention(
             att_norm,
             falcon_config.dim,
             falcon_config.n_heads,
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index 0cd53fb141..79b042b97c 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -81,7 +81,6 @@ void LLAMA::create_llama_model(FFModel &ff,
             att_norm,
             llama_config.dim,
             llama_config.n_heads,
-            llama_config.n_kv_heads,
             llama_config.dim / llama_config.n_heads,
             llama_config.dim / llama_config.n_heads,
             0.0f,
@@ -98,7 +97,6 @@ void LLAMA::create_llama_model(FFModel &ff,
             att_norm,
             llama_config.dim,
             llama_config.n_heads,
-            llama_config.n_kv_heads,
             llama_config.dim / llama_config.n_heads,
             llama_config.dim / llama_config.n_heads,
             0.0f,    /*dropout*/
@@ -116,7 +114,6 @@ void LLAMA::create_llama_model(FFModel &ff,
             att_norm,
             llama_config.dim,
             llama_config.n_heads,
-            llama_config.n_kv_heads,
             llama_config.dim / llama_config.n_heads,
             llama_config.dim / llama_config.n_heads,
             0.0f,    /*dropout*/
@@ -200,7 +197,7 @@ void LLAMA::create_llama_model(FFModel &ff,
   FileDataLoader fileloader("",
                             weight_file_path,
                             llama_config.n_heads,
-                            llama_config.n_kv_heads,
+                            llama_config.n_heads,
                             llama_config.dim,
                             llama_config.dim / llama_config.n_heads,
                             tensor_partition_num);
diff --git a/inference/models/llama.h b/inference/models/llama.h
index 46a22954e0..61d8908d0c 100644
--- a/inference/models/llama.h
+++ b/inference/models/llama.h
@@ -38,7 +38,6 @@ class LLAMA {
       total_requests = 2560;
       incremental_mode = true;
       hidden_dim = 11008;
-      n_kv_heads = 32;
       max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
       max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
       max_beam_width = BeamSearchBatchConfig::MAX_BEAM_WIDTH;
@@ -55,7 +54,6 @@ class LLAMA {
           n_layers = config_json["n_layers"];
           vocab_size = config_json["vocab_size"];
           n_heads = config_json["n_heads"];
-          n_kv_heads = config_json["n_kv_heads"];
           dim = config_json["dim"];
           multiple_of = config_json["multiple_of"];
           norm_eps = config_json["norm_eps"];
@@ -101,7 +99,7 @@ class LLAMA {
 
     int n_heads, n_layers, vocab_size, dim, multiple_of, hidden_dim,
         total_requests, incremental_mode, max_seq_len, max_num_tokens,
-        max_beam_width, max_beam_depth, n_kv_heads;
+        max_beam_width, max_beam_depth;
     float norm_eps;
   };
 
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index 86ced698f0..8a1a17d3af 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -109,7 +109,6 @@ void OPT::create_opt_model(FFModel &ff,
             hidden_states,
             opt_config.hidden_size,
             opt_config.num_attention_heads,
-            opt_config.num_attention_heads,
             opt_config.hidden_size / opt_config.num_attention_heads,
             opt_config.hidden_size / opt_config.num_attention_heads,
             0.0f,
@@ -131,7 +130,6 @@ void OPT::create_opt_model(FFModel &ff,
             hidden_states,
             opt_config.hidden_size,
             opt_config.num_attention_heads,
-            opt_config.num_attention_heads,
             opt_config.hidden_size / opt_config.num_attention_heads,
             opt_config.hidden_size / opt_config.num_attention_heads,
             0.0f,
@@ -153,7 +151,6 @@ void OPT::create_opt_model(FFModel &ff,
             hidden_states,
             opt_config.hidden_size,
             opt_config.num_attention_heads,
-            opt_config.num_attention_heads,
             opt_config.hidden_size / opt_config.num_attention_heads,
             opt_config.hidden_size / opt_config.num_attention_heads,
             0.0f,
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index 788b95bfcc..59f9046c57 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -1054,7 +1054,6 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_attention(
     const flexflow_tensor_t input_,
     int embed_dim,
     int num_heads,
-    int num_kv_heads,
     int kdim,
     int vdim,
     float dropout,
@@ -1075,7 +1074,6 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_attention(
   Tensor tensor = handle->inc_multihead_self_attention(input,
                                                        embed_dim,
                                                        num_heads,
-                                                       num_kv_heads,
                                                        kdim,
                                                        vdim,
                                                        dropout,
@@ -1097,7 +1095,6 @@ flexflow_tensor_t flexflow_model_add_spec_inc_multihead_attention(
     const flexflow_tensor_t input_,
     int embed_dim,
     int num_heads,
-    int num_kv_heads,
     int kdim,
     int vdim,
     float dropout,
@@ -1119,7 +1116,6 @@ flexflow_tensor_t flexflow_model_add_spec_inc_multihead_attention(
       handle->spec_inc_multihead_self_attention(input,
                                                 embed_dim,
                                                 num_heads,
-                                                num_kv_heads,
                                                 kdim,
                                                 vdim,
                                                 dropout,
@@ -1141,7 +1137,6 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention_verify(
     const flexflow_tensor_t input_,
     int embed_dim,
     int num_heads,
-    int num_kv_heads,
     int kdim,
     int vdim,
     float dropout,
@@ -1163,7 +1158,6 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention_verify(
       handle->inc_multihead_self_attention_verify(input,
                                                   embed_dim,
                                                   num_heads,
-                                                  num_kv_heads,
                                                   kdim,
                                                   vdim,
                                                   dropout,
@@ -1180,6 +1174,137 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention_verify(
   return FFCObjectWrapper::wrap(tensor);
 }
 
+flexflow_tensor_t flexflow_model_add_inc_multiquery_attention(
+    flexflow_model_t handle_,
+    const flexflow_tensor_t input_,
+    int embed_dim,
+    int num_q_heads,
+    int num_kv_heads,
+    int kdim,
+    int vdim,
+    float dropout,
+    bool bias,
+    bool add_bias_kv,
+    bool add_zero_attn,
+    enum DataType data_type,
+    flexflow_initializer_t kernel_initializer_,
+    bool apply_rotary_embedding,
+    bool scaling_query,
+    float scaling_factor,
+    bool qk_prod_scaling,
+    char const *name) {
+  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
+  Tensor input = FFCObjectWrapper::unwrap(input_);
+  Initializer *kernel_initializer =
+      FFCObjectWrapper::unwrap(kernel_initializer_);
+  Tensor tensor = handle->inc_multiquery_self_attention(input,
+                                                        embed_dim,
+                                                        num_q_heads,
+                                                        num_kv_heads,
+                                                        kdim,
+                                                        vdim,
+                                                        dropout,
+                                                        bias,
+                                                        add_bias_kv,
+                                                        add_zero_attn,
+                                                        data_type,
+                                                        kernel_initializer,
+                                                        apply_rotary_embedding,
+                                                        scaling_query,
+                                                        scaling_factor,
+                                                        qk_prod_scaling,
+                                                        name);
+  return FFCObjectWrapper::wrap(tensor);
+}
+
+flexflow_tensor_t flexflow_model_add_spec_inc_multiquery_attention(
+    flexflow_model_t handle_,
+    const flexflow_tensor_t input_,
+    int embed_dim,
+    int num_q_heads,
+    int num_kv_heads,
+    int kdim,
+    int vdim,
+    float dropout,
+    bool bias,
+    bool add_bias_kv,
+    bool add_zero_attn,
+    enum DataType data_type,
+    flexflow_initializer_t kernel_initializer_,
+    bool apply_rotary_embedding,
+    bool scaling_query,
+    float scaling_factor,
+    bool qk_prod_scaling,
+    char const *name) {
+  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
+  Tensor input = FFCObjectWrapper::unwrap(input_);
+  Initializer *kernel_initializer =
+      FFCObjectWrapper::unwrap(kernel_initializer_);
+  Tensor tensor =
+      handle->spec_inc_multiquery_self_attention(input,
+                                                 embed_dim,
+                                                 num_q_heads,
+                                                 num_kv_heads,
+                                                 kdim,
+                                                 vdim,
+                                                 dropout,
+                                                 bias,
+                                                 add_bias_kv,
+                                                 add_zero_attn,
+                                                 data_type,
+                                                 kernel_initializer,
+                                                 apply_rotary_embedding,
+                                                 scaling_query,
+                                                 scaling_factor,
+                                                 qk_prod_scaling,
+                                                 name);
+  return FFCObjectWrapper::wrap(tensor);
+}
+
+flexflow_tensor_t flexflow_model_add_inc_multiquery_self_attention_verify(
+    flexflow_model_t handle_,
+    const flexflow_tensor_t input_,
+    int embed_dim,
+    int num_q_heads,
+    int num_kv_heads,
+    int kdim,
+    int vdim,
+    float dropout,
+    bool bias,
+    bool add_bias_kv,
+    bool add_zero_attn,
+    enum DataType data_type,
+    flexflow_initializer_t kernel_initializer_,
+    bool apply_rotary_embedding,
+    bool scaling_query,
+    float scaling_factor,
+    bool qk_prod_scaling,
+    char const *name) {
+  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
+  Tensor input = FFCObjectWrapper::unwrap(input_);
+  Initializer *kernel_initializer =
+      FFCObjectWrapper::unwrap(kernel_initializer_);
+  Tensor tensor =
+      handle->inc_multiquery_self_attention_verify(input,
+                                                   embed_dim,
+                                                   num_q_heads,
+                                                   num_kv_heads,
+                                                   kdim,
+                                                   vdim,
+                                                   dropout,
+                                                   bias,
+                                                   add_bias_kv,
+                                                   add_zero_attn,
+                                                   data_type,
+                                                   kernel_initializer,
+                                                   apply_rotary_embedding,
+                                                   scaling_query,
+                                                   scaling_factor,
+                                                   qk_prod_scaling,
+                                                   name);
+  return FFCObjectWrapper::wrap(tensor);
+}
+
 flexflow_tensor_t flexflow_model_add_rms_norm(flexflow_model_t handle_,
                                               const flexflow_tensor_t input_,
                                               float eps,
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index e3ee54f4a2..f4f64aee8a 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -61,7 +61,6 @@ bool IncMultiHeadSelfAttentionParams::is_valid(
 Tensor FFModel::inc_multihead_self_attention(const Tensor input,
                                              int embed_dim,
                                              int num_heads,
-                                             int num_kv_heads,
                                              int kdim,
                                              int vdim,
                                              float dropout,
@@ -75,6 +74,42 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
                                              float scaling_factor,
                                              bool qk_prod_scaling,
                                              char const *name) {
+  return inc_multiquery_self_attention(input,
+                                       embed_dim,
+                                       num_heads,
+                                       num_heads,
+                                       kdim,
+                                       vdim,
+                                       dropout,
+                                       bias,
+                                       add_bias_kv,
+                                       add_zero_attn,
+                                       data_type,
+                                       kernel_initializer,
+                                       apply_rotary_embedding,
+                                       scaling_query,
+                                       scaling_factor,
+                                       qk_prod_scaling,
+                                       name);
+}
+
+Tensor FFModel::inc_multiquery_self_attention(const Tensor input,
+                                              int embed_dim,
+                                              int num_q_heads,
+                                              int num_kv_heads,
+                                              int kdim,
+                                              int vdim,
+                                              float dropout,
+                                              bool bias,
+                                              bool add_bias_kv,
+                                              bool add_zero_attn,
+                                              DataType data_type,
+                                              Initializer *kernel_initializer,
+                                              bool apply_rotary_embedding,
+                                              bool scaling_query,
+                                              float scaling_factor,
+                                              bool qk_prod_scaling,
+                                              char const *name) {
   if (data_type == DT_NONE) {
     data_type = input->data_type;
   }
@@ -120,8 +155,8 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
   int kParas = kProjSize * kSize;
   int vParas = vProjSize * vSize;
   int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
-  int weight_size = qParas * num_heads + kParas * num_kv_heads +
-                    vParas * num_kv_heads + oParas * num_heads;
+  int weight_size = qParas * num_q_heads + kParas * num_kv_heads +
+                    vParas * num_kv_heads + oParas * num_q_heads;
   int one_head_size = qParas + kParas + vParas + oParas;
 
   {
@@ -142,7 +177,7 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
   }
   if (bias) {
     // q, k, v, o
-    int dims[1] = {qProjSize * num_heads +
+    int dims[1] = {qProjSize * num_q_heads +
                    (kProjSize + vProjSize) * num_kv_heads + oProjSize};
     li->weights[1] = create_weight_legion_ordering(1,
                                                    dims,
@@ -154,7 +189,7 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
   }
   li->data_type = data_type;
   li->add_int_property("embed_dim", embed_dim);
-  li->add_int_property("num_heads", num_heads);
+  li->add_int_property("num_q_heads", num_q_heads);
   li->add_int_property("num_kv_heads", num_kv_heads);
   li->add_int_property("kdim", kdim);
   li->add_int_property("vdim", vdim);
@@ -182,8 +217,8 @@ Op *IncMultiHeadSelfAttention::create_operator_from_layer(
   long long value;
   layer->get_int_property("embed_dim", value);
   int embed_dim = value;
-  layer->get_int_property("num_heads", value);
-  int num_heads = value;
+  layer->get_int_property("num_q_heads", value);
+  int num_q_heads = value;
   layer->get_int_property("num_kv_heads", value);
   int num_kv_heads = value;
   layer->get_int_property("kdim", value);
@@ -217,7 +252,7 @@ Op *IncMultiHeadSelfAttention::create_operator_from_layer(
                                        layer->layer_guid,
                                        inputs[0],
                                        embed_dim,
-                                       num_heads,
+                                       num_q_heads,
                                        num_kv_heads,
                                        kdim,
                                        vdim,
@@ -241,7 +276,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     LayerID const &_layer_guid,
     const ParallelTensor _input,
     int _embed_dim,
-    int _num_heads,
+    int _num_q_heads,
     int _num_kv_heads,
     int _kdim,
     int _vdim,
@@ -267,7 +302,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
          (_bias ? 2 : 1), /*weights*/
          1 /*outputs*/,
          _input),
-      num_heads(_num_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
+      num_q_heads(_num_q_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
       bias(_bias), add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
       apply_rotary_embedding(_apply_rotary_embedding),
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
@@ -303,7 +338,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     dims[0] = inputs[0]->dims[num_dims - 2];
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
-    dims[1].size = this->num_heads * (qParas + oParas) +
+    dims[1].size = this->num_q_heads * (qParas + oParas) +
                    this->num_kv_heads * (kParas + vParas);
     dims[1].is_replica_dim = false;
 
@@ -322,7 +357,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
         CHOSEN_SYNC_TYPE);
     if (bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
-      bias_shape.dims[0].size = qProjSize * num_heads +
+      bias_shape.dims[0].size = qProjSize * num_q_heads +
                                 (kProjSize + vProjSize) * num_kv_heads +
                                 oProjSize;
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
@@ -351,7 +386,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     const ParallelTensor _input,
     const ParallelTensor _weight,
     int _embed_dim,
-    int _num_heads,
+    int _num_q_heads,
     int _num_kv_heads,
     int _kdim,
     int _vdim,
@@ -378,7 +413,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
          1 /*outputs*/,
          _input,
          _weight),
-      num_heads(_num_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
+      num_q_heads(_num_q_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
       bias(_bias), add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
       apply_rotary_embedding(_apply_rotary_embedding),
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
@@ -412,11 +447,11 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     dims[0] = inputs[0]->dims[num_dims - 2];
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
-    dims[1].size = this->num_heads * (qParas + oParas) +
+    dims[1].size = this->num_q_heads * (qParas + oParas) +
                    this->num_kv_heads * (kParas + vParas);
     dims[1].is_replica_dim = false;
-    // dims[2].size = this->num_heads * (qParas + oParas) + this->num_kv_heads *
-    // (kParas + vParas);
+    // dims[2].size = this->num_q_heads * (qParas + oParas) + this->num_kv_heads
+    // * (kParas + vParas);
     if (quantization_type != DT_NONE) {
       dims[1].size = get_quantization_to_byte_size(
           data_type, quantization_type, (qParas + kParas + vParas + oParas));
@@ -432,7 +467,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
         CHOSEN_SYNC_TYPE);
     if (bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
-      bias_shape.dims[0].size = qProjSize * num_heads +
+      bias_shape.dims[0].size = qProjSize * num_q_heads +
                                 (kProjSize + vProjSize) * num_kv_heads +
                                 oProjSize;
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
@@ -468,7 +503,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
                                 other.layer_guid,
                                 input,
                                 other.oProjSize,
-                                other.num_heads,
+                                other.num_q_heads,
                                 other.num_kv_heads,
                                 other.qProjSize,
                                 other.vProjSize,
@@ -496,7 +531,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
                                 params.layer_guid,
                                 input,
                                 params.embed_dim,
-                                params.num_heads,
+                                params.num_q_heads,
                                 params.num_kv_heads,
                                 params.kdim,
                                 params.vdim,
@@ -638,7 +673,7 @@ OpMeta *IncMultiHeadSelfAttention::init_task(
   int num_samples = input.domain.hi()[2] - input.domain.lo()[2] + 1;
   assert(attn->qoSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
   assert(attn->kvSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
-  int num_heads = attn->num_heads / attn->tensor_parallelism_degree;
+  int num_q_heads = attn->num_q_heads / attn->tensor_parallelism_degree;
   int num_kv_heads = attn->num_kv_heads / attn->tensor_parallelism_degree;
 
   assert(attn->oProjSize == output.domain.hi()[0] - output.domain.lo()[0] + 1);
@@ -660,7 +695,7 @@ OpMeta *IncMultiHeadSelfAttention::init_task(
                                         weight,
                                         gpu_mem_allocator,
                                         num_samples,
-                                        num_heads,
+                                        num_q_heads,
                                         num_kv_heads);
   if (handle.offload_reserve_space == nullptr) {
     // assert that we didn't over allocate memory
@@ -860,7 +895,7 @@ void IncMultiHeadSelfAttention::inference_task(
 
   // Weight tensor dimensions
   coord_t all_weight_params = weight_domain.hi()[0] - weight_domain.lo()[0] + 1;
-  coord_t num_heads = weight_domain.hi()[1] - weight_domain.lo()[1] + 1;
+  coord_t num_q_heads = weight_domain.hi()[1] - weight_domain.lo()[1] + 1;
   replica_dim = weight_domain.hi()[2] - weight_domain.lo()[2] + 1;
   size_t qParas = m->qProjSize * m->qSize;
   size_t kParas = m->kProjSize * m->kSize;
@@ -868,7 +903,7 @@ void IncMultiHeadSelfAttention::inference_task(
   size_t oParas = m->oProjSize * (m->vProjSize > 0 ? m->vProjSize : m->vSize);
 
   assert(all_weight_params == qParas + kParas + vParas + oParas);
-  assert(num_heads == m->num_heads);
+  assert(num_q_heads == m->num_q_heads);
   assert(replica_dim == 1);
 
   assert(m->qSize == m->kSize && m->kSize == m->vSize);
@@ -880,10 +915,10 @@ void IncMultiHeadSelfAttention::inference_task(
   // column-major order.
 
   // printf("m->kProjSize: %i, BatchConfig::MAX_NUM_TOKENS: %i, "
-  //     "bc->num_active_tokens(): %i, num_heads: %lli,
+  //     "bc->num_active_tokens(): %i, num_q_heads: %lli,
   //     BatchConfig::MAX_NUM_REQUESTS: %i, " "bc->num_active_requests(): %i\n",
   //     m->kProjSize, BatchConfig::MAX_NUM_TOKENS, bc->num_active_tokens(),
-  //     num_heads, BatchConfig::MAX_NUM_REQUESTS, bc->num_active_requests());
+  //     num_q_heads, BatchConfig::MAX_NUM_REQUESTS, bc->num_active_requests());
   // for (int t=0; t < bc->num_active_tokens(); t++) {
   //   printf("token %i has request_index: %li and token_position: %li\n",
   //   t, bc->token2ids.token_indexes[t].request_index,
@@ -909,12 +944,12 @@ void IncMultiHeadSelfAttention::inference_task(
   // =============================================================================
   //  Load the Q/K/V projection weights, and create a Torch tensor
   // =============================================================================
-  std::vector<int> w_qkv_shape = {m->qSize, m->qProjSize, 3, (int)num_heads};
+  std::vector<int> w_qkv_shape = {m->qSize, m->qProjSize, 3, (int)num_q_heads};
   float *w_qkv =
-      (float *)calloc(m->qSize * m->qProjSize * 3 * num_heads, sizeof(float));
+      (float *)calloc(m->qSize * m->qProjSize * 3 * num_q_heads, sizeof(float));
   assert(w_qkv[0] == 0.0f);
 
-  for (int h = 0; h < num_heads; h++) {
+  for (int h = 0; h < num_q_heads; h++) {
     for (size_t i = 0; i < m->qProjSize * m->qSize; i++) {
       int row_index = i % m->qSize;
       int column_index = i / m->qSize;
@@ -942,7 +977,7 @@ void IncMultiHeadSelfAttention::inference_task(
   }
   // convert weights to torch tensor
   torch::Tensor torch_w_qkv = torch::from_blob(
-      w_qkv, {m->qSize, m->qProjSize, 3, (int)num_heads}, torch::kFloat32);
+      w_qkv, {m->qSize, m->qProjSize, 3, (int)num_q_heads}, torch::kFloat32);
 
   /* std::cout << "Torch projection weights size: " << torch_w_qkv.sizes()
             << std::endl;
@@ -965,24 +1000,25 @@ void IncMultiHeadSelfAttention::inference_task(
   assert(qkv_projs.sizes()[1] == bc->num_active_tokens() &&
          qkv_projs.sizes()[1] <= effective_batch_size);
   assert(qkv_projs.sizes()[2] == 3);
-  assert(qkv_projs.sizes()[3] == num_heads);
+  assert(qkv_projs.sizes()[3] == num_q_heads);
   free(w_qkv);
 
   //  ----------------------- Loading CUDA results for this step ---------------
-  float *QKVProjArray_cpu = download_tensor<float>(m->devQKVProjArray,
-                                                   BatchConfig::MAX_NUM_TOKENS *
-                                                       proj_sum * m->num_heads);
+  float *QKVProjArray_cpu = download_tensor<float>(
+      m->devQKVProjArray,
+      BatchConfig::MAX_NUM_TOKENS * proj_sum * m->num_q_heads);
   assert(QKVProjArray_cpu != nullptr);
 
   std::vector<int> QKVProjArray_converted_shape = {
-      m->qProjSize, bc->num_active_tokens(), 3, (int)num_heads};
+      m->qProjSize, bc->num_active_tokens(), 3, (int)num_q_heads};
   float *QKVProjArray_converted = (float *)calloc(
-      m->qProjSize * bc->num_active_tokens() * 3 * num_heads, sizeof(float));
+      m->qProjSize * bc->num_active_tokens() * 3 * num_q_heads, sizeof(float));
 
   // skip over padding at the end of QKVProjArray_cpu
   // convert from column order to 3D matrix because torch cannot automatically
   // import matrices flattened in column order
-  for (size_t i = 0; i < proj_sum * bc->num_active_tokens() * num_heads; i++) {
+  for (size_t i = 0; i < proj_sum * bc->num_active_tokens() * num_q_heads;
+       i++) {
     int proj_size_index = i % m->qProjSize;
     int head_index = i / (proj_sum * bc->num_active_tokens());
     int token_index =
@@ -991,7 +1027,7 @@ void IncMultiHeadSelfAttention::inference_task(
     int qkv_offset = (i - head_index * proj_sum * bc->num_active_tokens()) /
                      (m->qProjSize * bc->num_active_tokens());
     assert(proj_size_index < proj_sum);
-    assert(head_index < num_heads);
+    assert(head_index < num_q_heads);
     assert(token_index < bc->num_active_tokens());
     assert(qkv_offset < 3);
     set_value_row_major(QKVProjArray_converted,
@@ -1001,19 +1037,19 @@ void IncMultiHeadSelfAttention::inference_task(
   }
   torch::Tensor QKVProjArray_torch =
       torch::from_blob(QKVProjArray_converted,
-                       {m->qProjSize, bc->num_active_tokens(), 3, num_heads},
+                       {m->qProjSize, bc->num_active_tokens(), 3, num_q_heads},
                        torch::kFloat32);
 
   //  ----------------------- Comparing C++ & CUDA results ---------------------
   // std::cout << "QKVProjArray_torch" << std::endl;
-  // for (int i=0; i<num_heads; i++) {
+  // for (int i=0; i<num_q_heads; i++) {
   //   for (int j=0; j<3; j++) {
   //     std::cout << QKVProjArray_torch.index({Slice(), Slice(), j, i}) <<
   //     std::endl;
   //   }
   // }
   // std::cout << "qkv_projs" << std::endl;
-  // for (int i=0; i<num_heads; i++) {
+  // for (int i=0; i<num_q_heads; i++) {
   //   for (int j=0; j<3; j++) {
   //     std::cout << qkv_projs.index({Slice(), Slice(), j, i}) << std::endl;
   //   }
@@ -1027,12 +1063,12 @@ void IncMultiHeadSelfAttention::inference_task(
 
   //  ----------------------- C++ operations & checks --------------------------
   // Store projections into k/v cache arrays
-  for (size_t h = 0; h < num_heads; h++) {
+  for (size_t h = 0; h < num_q_heads; h++) {
     for (size_t t = 0; t < bc->num_active_tokens(); t++) {
       for (size_t d = 0; d < m->kProjSize; d++) {
         size_t kcache_idx =
-            d * MAX_SEQ_LEN * m->num_heads * BatchConfig::MAX_NUM_REQUESTS +
-            bc->tokensInfo[t].abs_depth_in_request * m->num_heads *
+            d * MAX_SEQ_LEN * m->num_q_heads * BatchConfig::MAX_NUM_REQUESTS +
+            bc->tokensInfo[t].abs_depth_in_request * m->num_q_heads *
                 BatchConfig::MAX_NUM_REQUESTS +
             h * BatchConfig::MAX_NUM_REQUESTS + bc->tokensInfo[t].request_index;
         m->kcache[kcache_idx] =
@@ -1041,8 +1077,8 @@ void IncMultiHeadSelfAttention::inference_task(
       }
       for (size_t d = 0; d < m->vProjSize; d++) {
         size_t vcache_idx =
-            d * MAX_SEQ_LEN * m->num_heads * BatchConfig::MAX_NUM_REQUESTS +
-            bc->tokensInfo[t].abs_depth_in_request * m->num_heads *
+            d * MAX_SEQ_LEN * m->num_q_heads * BatchConfig::MAX_NUM_REQUESTS +
+            bc->tokensInfo[t].abs_depth_in_request * m->num_q_heads *
                 BatchConfig::MAX_NUM_REQUESTS +
             h * BatchConfig::MAX_NUM_REQUESTS + bc->tokensInfo[t].request_index;
         m->vcache[vcache_idx] =
@@ -1054,11 +1090,11 @@ void IncMultiHeadSelfAttention::inference_task(
   // Create torch tensors from the arrays
   torch::Tensor K_t = torch::from_blob(
       m->kcache,
-      {m->kProjSize, MAX_SEQ_LEN, num_heads, BatchConfig::MAX_NUM_REQUESTS},
+      {m->kProjSize, MAX_SEQ_LEN, num_q_heads, BatchConfig::MAX_NUM_REQUESTS},
       torch::kFloat32);
   torch::Tensor V_t = torch::from_blob(
       m->vcache,
-      {m->vProjSize, MAX_SEQ_LEN, num_heads, BatchConfig::MAX_NUM_REQUESTS},
+      {m->vProjSize, MAX_SEQ_LEN, num_q_heads, BatchConfig::MAX_NUM_REQUESTS},
       torch::kFloat32);
 
   // Compute useful indices
@@ -1086,29 +1122,31 @@ void IncMultiHeadSelfAttention::inference_task(
   //  ----------------------- Loading CUDA results for this step ---------------
   float *keyCache_cpu =
       download_tensor<float>(m->keyCache,
-                             m->num_heads * m->kProjSize *
+                             m->num_q_heads * m->kProjSize *
                                  BatchConfig::MAX_NUM_REQUESTS * MAX_SEQ_LEN);
   float *valueCache_cpu =
       download_tensor<float>(m->valueCache,
-                             m->num_heads * m->vProjSize *
+                             m->num_q_heads * m->vProjSize *
                                  BatchConfig::MAX_NUM_REQUESTS * MAX_SEQ_LEN);
   assert(keyCache_cpu != nullptr);
   assert(valueCache_cpu != nullptr);
 
-  float *kcache_cuda = (float *)calloc(
-      m->kProjSize * MAX_SEQ_LEN * m->num_heads * BatchConfig::MAX_NUM_REQUESTS,
-      sizeof(float));
-  float *vcache_cuda = (float *)calloc(
-      m->vProjSize * MAX_SEQ_LEN * m->num_heads * BatchConfig::MAX_NUM_REQUESTS,
-      sizeof(float));
+  float *kcache_cuda =
+      (float *)calloc(m->kProjSize * MAX_SEQ_LEN * m->num_q_heads *
+                          BatchConfig::MAX_NUM_REQUESTS,
+                      sizeof(float));
+  float *vcache_cuda =
+      (float *)calloc(m->vProjSize * MAX_SEQ_LEN * m->num_q_heads *
+                          BatchConfig::MAX_NUM_REQUESTS,
+                      sizeof(float));
   int index = 0;
   for (int i = 0; i < m->kProjSize; i++) {
     for (int j = 0; j < MAX_SEQ_LEN; j++) {
-      for (int k = 0; k < m->num_heads; k++) {
+      for (int k = 0; k < m->num_q_heads; k++) {
         for (int l = 0; l < BatchConfig::MAX_NUM_REQUESTS; l++) {
-          int col_major_index = l * m->kProjSize * MAX_SEQ_LEN * m->num_heads +
-                                k * m->kProjSize * MAX_SEQ_LEN +
-                                j * m->kProjSize + i;
+          int col_major_index =
+              l * m->kProjSize * MAX_SEQ_LEN * m->num_q_heads +
+              k * m->kProjSize * MAX_SEQ_LEN + j * m->kProjSize + i;
           kcache_cuda[index++] = keyCache_cpu[col_major_index];
         }
       }
@@ -1117,11 +1155,11 @@ void IncMultiHeadSelfAttention::inference_task(
   index = 0;
   for (int i = 0; i < m->vProjSize; i++) {
     for (int j = 0; j < MAX_SEQ_LEN; j++) {
-      for (int k = 0; k < m->num_heads; k++) {
+      for (int k = 0; k < m->num_q_heads; k++) {
         for (int l = 0; l < BatchConfig::MAX_NUM_REQUESTS; l++) {
-          int col_major_index = l * m->vProjSize * MAX_SEQ_LEN * m->num_heads +
-                                k * m->vProjSize * MAX_SEQ_LEN +
-                                j * m->vProjSize + i;
+          int col_major_index =
+              l * m->vProjSize * MAX_SEQ_LEN * m->num_q_heads +
+              k * m->vProjSize * MAX_SEQ_LEN + j * m->vProjSize + i;
           vcache_cuda[index++] = valueCache_cpu[col_major_index];
         }
       }
@@ -1129,27 +1167,27 @@ void IncMultiHeadSelfAttention::inference_task(
   }
   torch::Tensor K_t_cuda = torch::from_blob(
       kcache_cuda,
-      {m->kProjSize, MAX_SEQ_LEN, num_heads, BatchConfig::MAX_NUM_REQUESTS},
+      {m->kProjSize, MAX_SEQ_LEN, num_q_heads, BatchConfig::MAX_NUM_REQUESTS},
       torch::kFloat32);
   torch::Tensor V_t_cuda = torch::from_blob(
       vcache_cuda,
-      {m->vProjSize, MAX_SEQ_LEN, num_heads, BatchConfig::MAX_NUM_REQUESTS},
+      {m->vProjSize, MAX_SEQ_LEN, num_q_heads, BatchConfig::MAX_NUM_REQUESTS},
       torch::kFloat32);
 
   //  ----------------------- Comparing C++ & CUDA results ---------------------
 
   // std::cout << "kcache differences:" << std::endl;
   // for (int i=0; i < bc->num_active_requests() + 1; i++) {
-  //   for (int j=0; j < num_heads; j++) {
+  //   for (int j=0; j < num_q_heads; j++) {
   //     for (int l=0; l < m->kProjSize; l++) {
   //       for (int k=0; k < MAX_SEQ_LEN; k++) {
   //         size_t kcache_idx =
-  //           l * MAX_SEQ_LEN * num_heads * BatchConfig::MAX_NUM_REQUESTS +
-  //           k * num_heads * BatchConfig::MAX_NUM_REQUESTS +
+  //           l * MAX_SEQ_LEN * num_q_heads * BatchConfig::MAX_NUM_REQUESTS +
+  //           k * num_q_heads * BatchConfig::MAX_NUM_REQUESTS +
   //           j * BatchConfig::MAX_NUM_REQUESTS +
   //           i;
   //           if ( abs(m->kcache[kcache_idx] - keyCache_cpu[
-  //               i * m->kProjSize * MAX_SEQ_LEN * num_heads +
+  //               i * m->kProjSize * MAX_SEQ_LEN * num_q_heads +
   //               j * m->kProjSize * MAX_SEQ_LEN +
   //               k * m->kProjSize +
   //               l
@@ -1165,11 +1203,11 @@ void IncMultiHeadSelfAttention::inference_task(
 
   //  std::cout << "keyCache from CUDA:" << std::endl;
   //  for (int i=0; i<bc->num_active_requests()+1; i++) {
-  //    for (int j=0; j<num_heads; j++) {
+  //    for (int j=0; j<num_q_heads; j++) {
   //     for (int l=0; l<m->kProjSize; l++) {
   //       for (int k=0; k< MAX_SEQ_LEN; k++) {
   //         printf("%f ",
-  //           keyCache_cpu[i * m->kProjSize * MAX_SEQ_LEN * num_heads +
+  //           keyCache_cpu[i * m->kProjSize * MAX_SEQ_LEN * num_q_heads +
   //               j * m->kProjSize * MAX_SEQ_LEN +
   //               k * m->kProjSize +
   //               l
@@ -1184,12 +1222,12 @@ void IncMultiHeadSelfAttention::inference_task(
 
   //  std::cout << "valueCache from CUDA:" << std::endl;
   //  for (int i=0; i<bc->num_active_requests()+1; i++) {
-  //    for (int j=0; j<num_heads; j++) {
+  //    for (int j=0; j<num_q_heads; j++) {
   //       for (int l=0; l<m->vProjSize; l++) {
   //         for (int k=0; k< MAX_SEQ_LEN; k++) {
   //           printf("%f ",
   //             valueCache_cpu[
-  //                 i * m->vProjSize * MAX_SEQ_LEN * num_heads +
+  //                 i * m->vProjSize * MAX_SEQ_LEN * num_q_heads +
   //                 j * m->vProjSize * MAX_SEQ_LEN +
   //                 k * m->vProjSize +
   //             l]);
@@ -1205,12 +1243,12 @@ void IncMultiHeadSelfAttention::inference_task(
 
   //  std::cout << "C++ kcache:" << std::endl;
   //  for (int i=0; i<bc->num_active_requests()+1; i++) {
-  //    for (int j=0; j < num_heads; j++) {
+  //    for (int j=0; j < num_q_heads; j++) {
   //       for (int l=0; l < m->kProjSize; l++) {
   //         for (int k=0; k < MAX_SEQ_LEN; k++) {
   //           size_t kcache_idx =
-  //             l * MAX_SEQ_LEN * num_heads * BatchConfig::MAX_NUM_REQUESTS +
-  //             k * num_heads * BatchConfig::MAX_NUM_REQUESTS +
+  //             l * MAX_SEQ_LEN * num_q_heads * BatchConfig::MAX_NUM_REQUESTS +
+  //             k * num_q_heads * BatchConfig::MAX_NUM_REQUESTS +
   //             j * BatchConfig::MAX_NUM_REQUESTS +
   //             i;
   //           printf("%f ", m->kcache[kcache_idx]);
@@ -1224,14 +1262,13 @@ void IncMultiHeadSelfAttention::inference_task(
 
   //  std::cout << "C++ vcache:" << std::endl;
   //  for (int i=0; i<bc->num_active_requests()+1; i++) {
-  //    for (int j=0; j<num_heads; j++) {
+  //    for (int j=0; j<num_q_heads; j++) {
   //       for (int l=0; l<m->vProjSize; l++) {
   //         for (int k=0; k< MAX_SEQ_LEN; k++) {
   //             size_t vcache_idx =
-  //               l * MAX_SEQ_LEN * num_heads * BatchConfig::MAX_NUM_REQUESTS +
-  //               k * num_heads * BatchConfig::MAX_NUM_REQUESTS +
-  //               j * BatchConfig::MAX_NUM_REQUESTS +
-  //               i;
+  //               l * MAX_SEQ_LEN * num_q_heads * BatchConfig::MAX_NUM_REQUESTS
+  //               + k * num_q_heads * BatchConfig::MAX_NUM_REQUESTS + j *
+  //               BatchConfig::MAX_NUM_REQUESTS + i;
   //             printf("%f ", m->vcache[vcache_idx]);
   //         }
   //         printf("\n");
@@ -1251,11 +1288,11 @@ void IncMultiHeadSelfAttention::inference_task(
   // =============================================================================
 
   //  ----------------------- C++ operations & checks --------------------------
-  float *w_out = (float *)calloc(m->vProjSize * m->num_heads * m->oProjSize,
+  float *w_out = (float *)calloc(m->vProjSize * m->num_q_heads * m->oProjSize,
                                  sizeof(float));
-  std::vector<int> w_out_shape = {m->vProjSize, m->num_heads, m->oProjSize};
+  std::vector<int> w_out_shape = {m->vProjSize, m->num_q_heads, m->oProjSize};
   assert(m->qProjSize == m->kProjSize && m->kProjSize == m->vProjSize);
-  for (int h = 0; h < num_heads; h++) {
+  for (int h = 0; h < num_q_heads; h++) {
     for (int v = 0; v < m->vProjSize; v++) {
       for (int o = 0; o < m->oProjSize; o++) {
         set_value_row_major(
@@ -1269,22 +1306,22 @@ void IncMultiHeadSelfAttention::inference_task(
   }
   // convert weights to torch tensor
   torch::Tensor torch_w_out = torch::from_blob(
-      w_out, {m->vProjSize, m->num_heads, m->oProjSize}, torch::kFloat32);
+      w_out, {m->vProjSize, m->num_q_heads, m->oProjSize}, torch::kFloat32);
 
   //  ----------------------- Loading CUDA results for this step ---------------
   float *w_out_cuda = download_tensor<float>(
-      m->W_out_contiguous, m->vProjSize * m->oProjSize * m->num_heads);
+      m->W_out_contiguous, m->vProjSize * m->oProjSize * m->num_q_heads);
   assert(w_out_cuda != nullptr);
   float *converted_wout_tensor = (float *)calloc(
-      m->vProjSize * m->num_heads * m->oProjSize, sizeof(float));
+      m->vProjSize * m->num_q_heads * m->oProjSize, sizeof(float));
   std::vector<int> converted_wout_tensor_shape = {
-      m->vProjSize, m->num_heads, m->oProjSize};
+      m->vProjSize, m->num_q_heads, m->oProjSize};
 
-  for (int i = 0; i < m->vProjSize * m->num_heads * m->oProjSize; i++) {
+  for (int i = 0; i < m->vProjSize * m->num_q_heads * m->oProjSize; i++) {
     int v_idx = i % m->vProjSize;
-    int h_idx = (i / m->vProjSize) % m->num_heads;
-    int o_idx = i / (m->vProjSize * m->num_heads);
-    assert(v_idx < m->vProjSize && h_idx < m->num_heads &&
+    int h_idx = (i / m->vProjSize) % m->num_q_heads;
+    int o_idx = i / (m->vProjSize * m->num_q_heads);
+    assert(v_idx < m->vProjSize && h_idx < m->num_q_heads &&
            o_idx < m->oProjSize);
     set_value_row_major(converted_wout_tensor,
                         converted_wout_tensor_shape,
@@ -1293,7 +1330,7 @@ void IncMultiHeadSelfAttention::inference_task(
   }
   torch::Tensor w_out_cuda_tensor =
       torch::from_blob(converted_wout_tensor,
-                       {m->vProjSize, m->num_heads, m->oProjSize},
+                       {m->vProjSize, m->num_q_heads, m->oProjSize},
                        torch::kFloat32);
 
   //  ----------------------- Comparing C++ & CUDA results ---------------------
@@ -1320,16 +1357,17 @@ void IncMultiHeadSelfAttention::inference_task(
   //  ----------------------- Loading CUDA results for this step ---------------
   float *qk_prods_cpu = download_tensor<float>(
       m->qk_prods,
-      BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_NUM_TOKENS * num_heads);
+      BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_NUM_TOKENS * num_q_heads);
   assert(qk_prods_cpu != nullptr);
 
   float *qk_prods_softmax_cpu = download_tensor<float>(
       m->qk_prods_softmax,
-      BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_NUM_TOKENS * num_heads);
+      BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_NUM_TOKENS * num_q_heads);
   assert(qk_prods_softmax_cpu != nullptr);
 
   float *attn_heads_cpu = download_tensor<float>(
-      m->attn_heads, BatchConfig::MAX_NUM_TOKENS * m->num_heads * m->vProjSize);
+      m->attn_heads,
+      BatchConfig::MAX_NUM_TOKENS * m->num_q_heads * m->vProjSize);
   assert(attn_heads_cpu != nullptr);
 
   //  ----------------------- Main loop (request by request) -------------------
@@ -1355,7 +1393,7 @@ void IncMultiHeadSelfAttention::inference_task(
     // std::cout << "Q_req.sizes(): " << Q_req.sizes() << std::endl;
     assert(Q_req.sizes()[0] == m->qProjSize);
     assert(Q_req.sizes()[1] == num_new_tokens);
-    assert(Q_req.sizes()[2] == num_heads);
+    assert(Q_req.sizes()[2] == num_q_heads);
 
     /*printf("\n------------ QK multiplication (C++) -------------\n");
     printf("Request r=%lu. num_new_tokens: %lu, num_tokens_received_so_far: %li,
@@ -1380,7 +1418,7 @@ void IncMultiHeadSelfAttention::inference_task(
         (1.0f / sqrt(m->kProjSize));
 
     // Set entries above diagonal to -inf to make attention causal.
-    for (int h = 0; h < num_heads; h++) {
+    for (int h = 0; h < num_q_heads; h++) {
       qk_products[r].index(
           {Slice(), Slice(num_tokens_received_so_far - num_new_tokens), h}) =
           qk_products[r]
@@ -1397,24 +1435,26 @@ void IncMultiHeadSelfAttention::inference_task(
     qk_softmax[r] = torch::softmax(qk_products[r], -2);
     assert(qk_softmax[r].sizes()[0] == num_new_tokens);
     assert(qk_softmax[r].sizes()[1] == num_tokens_received_so_far);
-    assert(qk_softmax[r].sizes()[2] == m->num_heads);
+    assert(qk_softmax[r].sizes()[2] == m->num_q_heads);
 
     //  ------------------- Loading CUDA results for this step ---------------
     float *converted_qk_prod = (float *)calloc(
-        num_new_tokens * num_tokens_received_so_far * num_heads, sizeof(float));
+        num_new_tokens * num_tokens_received_so_far * num_q_heads,
+        sizeof(float));
     float *converted_qk_prod_softmax = (float *)calloc(
-        num_new_tokens * num_tokens_received_so_far * num_heads, sizeof(float));
+        num_new_tokens * num_tokens_received_so_far * num_q_heads,
+        sizeof(float));
     std::vector<int> converted_qk_prod_shape = {
-        (int)num_new_tokens, (int)num_tokens_received_so_far, (int)num_heads};
+        (int)num_new_tokens, (int)num_tokens_received_so_far, (int)num_q_heads};
 
     for (size_t i = 0;
-         i < num_new_tokens * num_tokens_received_so_far * num_heads;
+         i < num_new_tokens * num_tokens_received_so_far * num_q_heads;
          i++) {
       size_t new_t_idx = i % num_new_tokens;
       size_t all_t_idx = (i / num_new_tokens) % num_tokens_received_so_far;
       size_t head_idx = i / (num_new_tokens * num_tokens_received_so_far);
       assert(new_t_idx < num_new_tokens &&
-             all_t_idx < num_tokens_received_so_far && head_idx < num_heads);
+             all_t_idx < num_tokens_received_so_far && head_idx < num_q_heads);
       set_value_row_major(converted_qk_prod,
                           converted_qk_prod_shape,
                           {(int)new_t_idx, (int)all_t_idx, (int)head_idx},
@@ -1426,34 +1466,34 @@ void IncMultiHeadSelfAttention::inference_task(
     }
     torch::Tensor qk_prods_cuda = torch::from_blob(
         converted_qk_prod,
-        {(int64_t)num_new_tokens, num_tokens_received_so_far, num_heads},
+        {(int64_t)num_new_tokens, num_tokens_received_so_far, num_q_heads},
         torch::kFloat32);
     torch::Tensor qk_prods_softmax_cuda = torch::from_blob(
         converted_qk_prod_softmax,
-        {(int64_t)num_new_tokens, num_tokens_received_so_far, num_heads},
+        {(int64_t)num_new_tokens, num_tokens_received_so_far, num_q_heads},
         torch::kFloat32);
 
     //  ------------------- Comparing C++ & CUDA results ------------------
     /* std::cout << "C++:" <<std::endl;
-    for (int h=0; h<num_heads; h++) {
+    for (int h=0; h<num_q_heads; h++) {
       std::cout << qk_products[r].index({Slice(), Slice(), h}) << std::endl;
     }
     std::cout << "CUDA:" <<std::endl;
-    for (int h=0; h<num_heads; h++) {
+    for (int h=0; h<num_q_heads; h++) {
       std::cout << qk_prods_cuda.index({Slice(), Slice(), h}) << std::endl;
     } */
     /* //
     std::cout << "C++:" <<std::endl;
-    for (int h=0; h<num_heads; h++) {
+    for (int h=0; h<num_q_heads; h++) {
       std::cout << qk_softmax[r].index({Slice(), Slice(), h}) << std::endl;
     }
     std::cout << "CUDA:" <<std::endl;
-    for (int h=0; h<num_heads; h++) {
+    for (int h=0; h<num_q_heads; h++) {
       std::cout << qk_prods_softmax_cuda.index({Slice(), Slice(), h}) <<
     std::endl;
     } */
     // std::cout << "C++ tril:" <<std::endl;
-    // for (int h=0; h<num_heads; h++) {
+    // for (int h=0; h<num_q_heads; h++) {
     //   std::cout << qk_products[r].tril().index({Slice(), Slice(), h}) <<
     //   std::endl;
     // }
@@ -1472,7 +1512,7 @@ void IncMultiHeadSelfAttention::inference_task(
             .sizes()[1] == num_tokens_received_so_far);
     assert(
         V_t.index({Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})
-            .sizes()[2] == m->num_heads);
+            .sizes()[2] == m->num_q_heads);
     attn_heads[r] = torch::einsum(
         "ijk,ljk->ilk",
         {qk_softmax[r],
@@ -1480,33 +1520,33 @@ void IncMultiHeadSelfAttention::inference_task(
              {Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})});
     assert(attn_heads[r].sizes()[0] == num_new_tokens);
     assert(attn_heads[r].sizes()[1] == m->vProjSize);
-    assert(attn_heads[r].sizes()[2] == m->num_heads);
+    assert(attn_heads[r].sizes()[2] == m->num_q_heads);
 
     //  ------------------- Loading CUDA results for this step  ---------------
-    float converted_attn_heads_cpu[num_new_tokens][m->vProjSize][m->num_heads] =
-        {0};
-    for (int i = 0; i < num_new_tokens * m->vProjSize * m->num_heads; i++) {
+    float converted_attn_heads_cpu[num_new_tokens][m->vProjSize]
+                                  [m->num_q_heads] = {0};
+    for (int i = 0; i < num_new_tokens * m->vProjSize * m->num_q_heads; i++) {
       int token_ix = i % num_new_tokens;
       int vproj_idx = (i / num_new_tokens) % m->vProjSize;
       int head_idx = i / (num_new_tokens * m->vProjSize);
       assert(token_ix < num_new_tokens && vproj_idx < m->vProjSize &&
-             head_idx < m->num_heads);
+             head_idx < m->num_q_heads);
       converted_attn_heads_cpu[token_ix][vproj_idx][head_idx] =
-          attn_heads_cpu[r_first_idx[r] * m->vProjSize * m->num_heads + i];
+          attn_heads_cpu[r_first_idx[r] * m->vProjSize * m->num_q_heads + i];
     }
-    torch::Tensor converted_attn_heads_cuda =
-        torch::from_blob(converted_attn_heads_cpu,
-                         {(int64_t)num_new_tokens, m->vProjSize, m->num_heads},
-                         torch::kFloat32);
+    torch::Tensor converted_attn_heads_cuda = torch::from_blob(
+        converted_attn_heads_cpu,
+        {(int64_t)num_new_tokens, m->vProjSize, m->num_q_heads},
+        torch::kFloat32);
 
     //  -------------------- Comparing C++ & CUDA results -------------------
     /* std::cout << "CUDA attn head for req " << r << ":" <<std::endl;
-    for (int h=0; h<m->num_heads; h++) {
+    for (int h=0; h<m->num_q_heads; h++) {
       std::cout << converted_attn_heads_cuda.index({Slice(), Slice(), h}) <<
     std::endl;
     }
     std::cout << "C++ attn head for req " << r << ":" <<std::endl;
-    for (int h=0; h<m->num_heads; h++) {
+    for (int h=0; h<m->num_q_heads; h++) {
       std::cout << attn_heads[r].index({Slice(), Slice(), h}) << std::endl;
     } */
     assert(torch::allclose(
@@ -1521,7 +1561,7 @@ void IncMultiHeadSelfAttention::inference_task(
 
     // increment main loop's auxiliary index
     qk_prods_cpu_offset +=
-        num_new_tokens * num_tokens_received_so_far * num_heads;
+        num_new_tokens * num_tokens_received_so_far * num_q_heads;
   }
 
   //  ----------------------- Comparing C++ & CUDA results ---------------------
@@ -1570,7 +1610,7 @@ bool IncMultiHeadSelfAttention::get_int_parameter(PMParameter para,
                                                   int *value) const {
   switch (para) {
     case PM_NUM_HEADS:
-      *value = num_heads;
+      *value = num_q_heads;
       return true;
     default:
       return Op::get_int_parameter(para, value);
@@ -1585,7 +1625,7 @@ bool IncMultiHeadSelfAttention::measure_operator_cost(
 bool operator==(IncMultiHeadSelfAttentionParams const &lhs,
                 IncMultiHeadSelfAttentionParams const &rhs) {
   return lhs.layer_guid == rhs.layer_guid && lhs.embed_dim == rhs.embed_dim &&
-         lhs.num_heads == rhs.num_heads && lhs.kdim == rhs.kdim &&
+         lhs.num_q_heads == rhs.num_q_heads && lhs.kdim == rhs.kdim &&
          lhs.vdim == rhs.vdim && lhs.dropout == rhs.dropout &&
          lhs.bias == rhs.bias && lhs.add_bias_kv == rhs.add_bias_kv &&
          lhs.add_zero_attn == rhs.add_zero_attn &&
@@ -1599,7 +1639,7 @@ IncMultiHeadSelfAttentionParams IncMultiHeadSelfAttention::get_params() const {
   IncMultiHeadSelfAttentionParams params;
   params.layer_guid = this->layer_guid;
   params.embed_dim = this->oProjSize;
-  params.num_heads = this->num_heads;
+  params.num_q_heads = this->num_q_heads;
   params.kdim = this->kProjSize;
   params.vdim = this->vProjSize;
   params.dropout = this->dropout;
@@ -1626,7 +1666,7 @@ size_t hash<FlexFlow::IncMultiHeadSelfAttentionParams>::operator()(
   size_t key = 0;
   hash_combine(key, params.layer_guid.id);
   hash_combine(key, params.embed_dim);
-  hash_combine(key, params.num_heads);
+  hash_combine(key, params.num_q_heads);
   hash_combine(key, params.num_kv_heads);
   hash_combine(key, params.kdim);
   hash_combine(key, params.vdim);
diff --git a/src/ops/inc_multihead_self_attention.cpp b/src/ops/inc_multihead_self_attention.cpp
index c68df398df..b7ed189040 100644
--- a/src/ops/inc_multihead_self_attention.cpp
+++ b/src/ops/inc_multihead_self_attention.cpp
@@ -64,7 +64,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     GenericTensorAccessorR const &weight,
     MemoryAllocator &gpu_mem_allocator,
     int num_samples,
-    int _num_heads,
+    int _num_q_heads,
     int _num_kv_heads)
     : OpMeta(handler, attn) {
   hipStream_t stream;
@@ -92,9 +92,9 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     GenericTensorAccessorR const &weight,
     MemoryAllocator &gpu_mem_allocator,
     int num_samples,
-    int _global_num_heads,
+    int _global_num_q_heads,
     int _global_num_kv_heads,
-    int _num_heads,
+    int _num_q_heads,
     int _num_kv_heads,
     DataType _quantization_type,
     bool _offload)
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index a014b684f3..be6a4fd301 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -50,30 +50,30 @@ __global__ void apply_proj_bias_qkv(DT *input_ptr,
                                     int qProjSize,
                                     int kProjSize,
                                     int vProjSize,
-                                    int global_num_heads,
+                                    int global_num_q_heads,
                                     int global_num_kv_heads,
-                                    int num_heads,
+                                    int num_q_heads,
                                     int num_kv_heads,
                                     bool scaling_query,
                                     float scaling_factor) {
   CUDA_KERNEL_LOOP(i,
                    num_tokens *
-                       (qProjSize * num_heads + kProjSize * num_kv_heads +
+                       (qProjSize * num_q_heads + kProjSize * num_kv_heads +
                         vProjSize * num_kv_heads)) {
     // for simplicity, assume q, k, v is in same shape
     // 0->q, 1->k, 2->v
     // int qkv_index = i / (num_tokens * qProjSize) % 3;
 
-    int qkv_index = i < num_tokens * qProjSize * num_heads
+    int qkv_index = i < num_tokens * qProjSize * num_q_heads
                         ? 0
-                        : (i < num_tokens * (qProjSize * num_heads +
+                        : (i < num_tokens * (qProjSize * num_q_heads +
                                              kProjSize * num_kv_heads)
                                ? 1
                                : 2);
 
     // int head_idx = i / (num_tokens * (qProjSize + kProjSize + vProjSize));
     // int qkv_block_size = (qProjSize + kProjSize + vProjSize) * num_tokens;
-    int q_block_size = qProjSize * num_tokens * num_heads;
+    int q_block_size = qProjSize * num_tokens * num_q_heads;
     int k_block_size = kProjSize * num_tokens * num_kv_heads;
 
     // int idx = i % (num_tokens * (qProjSize));
@@ -83,16 +83,16 @@ __global__ void apply_proj_bias_qkv(DT *input_ptr,
     int bias_idx = 0;
     if (qkv_index == 0) {
       int head_idx = i / (num_tokens * qProjSize);
-      int global_head_idx = head_idx + shard_id * num_heads;
-      int global_i = i + shard_id * num_heads * num_tokens * qProjSize;
+      int global_head_idx = head_idx + shard_id * num_q_heads;
+      int global_i = i + shard_id * num_q_heads * num_tokens * qProjSize;
       bias_idx = global_head_idx * qProjSize +
                  (global_i % (num_tokens * (qProjSize)) % qProjSize);
     } else {
 
       int idx =
           qkv_index == 1 ? i - q_block_size : i - q_block_size - k_block_size;
-      int pre_length = qkv_index == 1 ? qProjSize * global_num_heads
-                                      : qProjSize * global_num_heads +
+      int pre_length = qkv_index == 1 ? qProjSize * global_num_q_heads
+                                      : qProjSize * global_num_q_heads +
                                             kProjSize * global_num_kv_heads;
 
       int head_idx = idx / (num_tokens * kProjSize);
@@ -102,7 +102,7 @@ __global__ void apply_proj_bias_qkv(DT *input_ptr,
       bias_idx = pre_length + global_head_idx * kProjSize +
                  (global_idx % (num_tokens * (qProjSize)) % qProjSize);
     }
-    // int bias_idx = qkv_index * qProjSize * global_num_heads +
+    // int bias_idx = qkv_index * qProjSize * global_num_q_heads +
     //                global_head_idx * qProjSize + (idx % qProjSize);
 
     input_ptr[i] += bias_ptr[bias_idx];
@@ -120,14 +120,15 @@ __global__ void
                                   BatchConfig::PerTokenInfo const *tokenInfos,
                                   int qProjSize,
                                   int kProjSize,
-                                  int num_heads,
+                                  int num_q_heads,
                                   int num_tokens,
                                   int num_kv_heads,
                                   int q_block_size,
                                   int k_block_size,
                                   int q_array_size) {
   CUDA_KERNEL_LOOP(
-      i, num_tokens * (qProjSize * num_heads + kProjSize * num_kv_heads) / 2) {
+      i,
+      num_tokens * (qProjSize * num_q_heads + kProjSize * num_kv_heads) / 2) {
     // create complex number
     bool q_tensor = i < (q_array_size / 2);
     int proj_size = q_tensor ? qProjSize : kProjSize;
@@ -168,14 +169,15 @@ __global__ void
                               BatchConfig::PerTokenInfo const *tokenInfos,
                               int qProjSize,
                               int kProjSize,
-                              int num_heads,
+                              int num_q_heads,
                               int num_tokens,
                               int num_kv_heads,
                               int q_block_size,
                               int k_block_size,
                               int q_array_size) {
   CUDA_KERNEL_LOOP(
-      i, num_tokens * (qProjSize * num_heads + kProjSize * num_kv_heads) / 2) {
+      i,
+      num_tokens * (qProjSize * num_q_heads + kProjSize * num_kv_heads) / 2) {
     // create complex number
     bool q_tensor = i < (q_array_size / 2);
     int proj_size = q_tensor ? qProjSize : kProjSize;
@@ -236,9 +238,9 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
   cudaDataType_t compute_type = cublas_data_type;
 #endif
   // Compute (W^T)x matmul: einsum(ijkl,im->jmkl)
-  // Weights: qSize x qProjSize x 3 x num_heads
+  // Weights: qSize x qProjSize x 3 x num_q_heads
   // Input: qSize x num_tokens
-  // Output >>> qProjSize x num_tokens x 3 x num_heads
+  // Output >>> qProjSize x num_tokens x 3 x num_q_heads
   int m_q = m->qProjSize;
   int m_k = m->kProjSize;
   int m_v = m->vProjSize;
@@ -273,7 +275,7 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                        cublas_data_type,
                                        ldc,
                                        strideC,
-                                       m->num_heads + m->num_kv_heads +
+                                       m->num_q_heads + m->num_kv_heads +
                                            m->num_kv_heads,
                                        compute_type,
                                        CUBLAS_GEMM_DEFAULT_TENSOR_OP));
@@ -281,10 +283,10 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
   // apply rotary emmmbedding for q and k
   // step1 change the k, v to complex tensor
   int num_tokens = bc->num_active_tokens();
-  int parallelism = m->kProjSize * num_tokens * m->num_heads;
+  int parallelism = m->kProjSize * num_tokens * m->num_q_heads;
   int q_block_size = m->qProjSize * num_tokens;
   int k_block_size = m->kProjSize * num_tokens;
-  int q_array_size = m->qProjSize * num_tokens * m->num_heads;
+  int q_array_size = m->qProjSize * num_tokens * m->num_q_heads;
   // apply bias for q, k, v
   if (*m->bias) {
     apply_proj_bias_qkv<<<GET_BLOCKS(parallelism),
@@ -297,9 +299,9 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                     m->qProjSize,
                                     m->kProjSize,
                                     m->vProjSize,
-                                    m->global_num_heads,
+                                    m->global_num_q_heads,
                                     m->global_num_kv_heads,
-                                    m->num_heads,
+                                    m->num_q_heads,
                                     m->num_kv_heads,
                                     *m->scaling_query,
                                     m->scaling_factor);
@@ -308,7 +310,7 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
     /*q&k*/
     parallelism =
         num_tokens *
-        (m->qProjSize * m->num_heads + m->kProjSize * m->num_kv_heads) / 2;
+        (m->qProjSize * m->num_q_heads + m->kProjSize * m->num_kv_heads) / 2;
     apply_rotary_embedding_hf<<<GET_BLOCKS(parallelism),
                                 min(CUDA_NUM_THREADS, parallelism),
                                 0,
@@ -317,7 +319,7 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                           m->token_infos,
                                           m->qProjSize,
                                           m->kProjSize,
-                                          m->num_heads,
+                                          m->num_q_heads,
                                           num_tokens,
                                           m->num_kv_heads,
                                           q_block_size,
@@ -345,7 +347,7 @@ void update_kv_cache_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                m->kProjSize,
                                m->vProjSize,
                                num_tokens,
-                               m->num_heads,
+                               m->num_q_heads,
                                m->num_kv_heads,
                                BatchConfig::MAX_SEQ_LENGTH);
   }
@@ -369,7 +371,7 @@ void pre_build_weight_kernel(IncMultiHeadSelfAttentionMeta const *m,
                     stream);
 
     if (m->quantization_type == DT_INT4) {
-      int parallelism = m->qProjSize * m->qSize * m->num_heads / 2;
+      int parallelism = m->qProjSize * m->qSize * m->num_q_heads / 2;
       decompress_int4_attention_weights<<<GET_BLOCKS(parallelism),
                                           min(CUDA_NUM_THREADS, parallelism),
                                           0,
@@ -378,10 +380,10 @@ void pre_build_weight_kernel(IncMultiHeadSelfAttentionMeta const *m,
           static_cast<DT *>(m->weight_ptr),
           m->qProjSize,
           m->qSize,
-          m->num_heads);
+          m->num_q_heads);
     } else {
       assert(m->quantization_type == DT_INT8);
-      int parallelism = m->qProjSize * m->qSize * m->num_heads;
+      int parallelism = m->qProjSize * m->qSize * m->num_q_heads;
       decompress_int8_attention_weights<<<GET_BLOCKS(parallelism),
                                           min(CUDA_NUM_THREADS, parallelism),
                                           0,
@@ -390,7 +392,7 @@ void pre_build_weight_kernel(IncMultiHeadSelfAttentionMeta const *m,
           static_cast<DT *>(m->weight_ptr),
           m->qProjSize,
           m->qSize,
-          m->num_heads);
+          m->num_q_heads);
     }
   } else {
     if (data_type == DT_FLOAT) {
@@ -465,11 +467,11 @@ __global__ void store_kv_cache(DT const *devQKVProjArray,
                                int kProjSize,
                                int vProjSize,
                                int num_tokens,
-                               int num_heads,
+                               int num_q_heads,
                                int num_kv_heads,
                                int max_seq_len) {
   CUDA_KERNEL_LOOP(i, num_tokens * (kProjSize + vProjSize) * num_kv_heads) {
-    int q_array_size = qProjSize * num_tokens * num_heads;
+    int q_array_size = qProjSize * num_tokens * num_q_heads;
     int k_array_size = kProjSize * num_tokens * num_kv_heads;
 
     bool k_cache = i < k_array_size;
@@ -497,10 +499,10 @@ template <typename DT>
 __global__ void fill_entries_above_diagonal(DT *matrix,
                                             size_t num_rows,
                                             size_t num_cols,
-                                            size_t num_heads,
+                                            size_t num_q_heads,
                                             size_t entries_above_diagonal,
                                             DT value) {
-  CUDA_KERNEL_LOOP(i, entries_above_diagonal * num_heads) {
+  CUDA_KERNEL_LOOP(i, entries_above_diagonal * num_q_heads) {
     size_t head_idx = i / entries_above_diagonal;
     size_t entry_idx = i % entries_above_diagonal;
     size_t y = (-1 + sqrt(8 * (float)entry_idx + 1)) / 2;
@@ -568,7 +570,7 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     DT const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
     // To get C, skip over QK^T products from previous requests
     DT *C = static_cast<DT *>(m->qk_prods);
-    if (m->num_kv_heads == m->num_heads) {
+    if (m->num_kv_heads == m->num_q_heads) {
       checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                            CUBLAS_OP_T,
                                            CUBLAS_OP_N,
@@ -589,14 +591,14 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                            cublas_data_type,
                                            ldc,
                                            strideC,
-                                           m->num_heads,
+                                           m->num_q_heads,
                                            compute_type,
                                            CUBLAS_GEMM_DEFAULT_TENSOR_OP));
 
     } else {
       strideB = 0;
       // use cublasGemmStridedBatchedEx
-      int one_step_heads = m->num_heads / m->num_kv_heads;
+      int one_step_heads = m->num_q_heads / m->num_kv_heads;
       m_ = num_new_tokens;
       n = total_tokens;
       k = m->qProjSize;
@@ -634,14 +636,14 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     assert(num_new_tokens <= total_tokens);
     size_t entries_above_diagonal = num_new_tokens * (num_new_tokens - 1) / 2;
     if (entries_above_diagonal > 0) {
-      size_t parallelism = m->num_heads * entries_above_diagonal;
+      size_t parallelism = m->num_q_heads * entries_above_diagonal;
       fill_entries_above_diagonal<<<GET_BLOCKS(parallelism),
                                     min((size_t)CUDA_NUM_THREADS, parallelism),
                                     0,
                                     stream>>>(C,
                                               num_new_tokens,
                                               total_tokens,
-                                              m->num_heads,
+                                              m->num_q_heads,
                                               entries_above_diagonal,
                                               static_cast<DT>(-INFINITY));
     }
@@ -655,7 +657,7 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     // with no padding between images, feature maps, rows, and columns; the
     // columns are the inner dimension and the images are the outermost
     // dimension.
-    int n_param = m->num_heads;
+    int n_param = m->num_q_heads;
     int c_param = total_tokens;
     int h_param = 1;
     int w_param = num_new_tokens;
@@ -699,9 +701,9 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
     // requests
     C = static_cast<DT *>(m->attn_heads) +
-        tokens_previous_requests * m->num_heads * m->vProjSize;
+        tokens_previous_requests * m->num_q_heads * m->vProjSize;
 
-    if (m->num_heads == m->num_kv_heads) {
+    if (m->num_q_heads == m->num_kv_heads) {
       checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                            CUBLAS_OP_N,
                                            CUBLAS_OP_T,
@@ -722,11 +724,11 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                            cublas_data_type,
                                            ldc,
                                            strideC,
-                                           m->num_heads,
+                                           m->num_q_heads,
                                            compute_type,
                                            CUBLAS_GEMM_DEFAULT_TENSOR_OP));
     } else {
-      int one_step_heads = m->num_heads / m->num_kv_heads;
+      int one_step_heads = m->num_q_heads / m->num_kv_heads;
       n = m->vProjSize;
       lda = m_, ldb = n, ldc = m_;
       strideA = num_new_tokens * total_tokens;
@@ -762,10 +764,10 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     // Project to output, save result directly on output tensor
     alpha = 1.0f, beta = 0.0f;
     m_ = m->oProjSize;
-    k = m->vProjSize * m->num_heads;
+    k = m->vProjSize * m->num_q_heads;
     n = num_new_tokens;
     lda = k, ldb = n, ldc = m_;
-    A = weight_ptr + m->qSize * (m->qProjSize * m->num_heads +
+    A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
                                  m->kProjSize * m->num_kv_heads +
                                  m->vProjSize * m->num_kv_heads);
     B = C;
@@ -796,7 +798,7 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
 
   if (*m->bias && shard_id == 0) {
     int parallelism = m->oProjSize * num_tokens;
-    int qkv_weight_size = m->qProjSize * m->global_num_heads +
+    int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
                           m->kProjSize * m->global_num_kv_heads +
                           m->vProjSize * m->global_num_kv_heads;
 
@@ -890,7 +892,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     GenericTensorAccessorR const &weight,
     MemoryAllocator &gpu_mem_allocator,
     int num_samples,
-    int _num_heads,
+    int _num_q_heads,
     int _num_kv_heads)
     : IncMultiHeadSelfAttentionMeta(handler,
                                     INC_DECODING_MODE,
@@ -911,9 +913,9 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
                                     weight,
                                     gpu_mem_allocator,
                                     num_samples,
-                                    attn->num_heads,
+                                    attn->num_q_heads,
                                     attn->num_kv_heads,
-                                    _num_heads,
+                                    _num_q_heads,
                                     _num_kv_heads,
                                     attn->quantization_type,
                                     attn->offload) {}
@@ -938,9 +940,9 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     GenericTensorAccessorR const &weight,
     MemoryAllocator &gpu_mem_allocator,
     int num_samples,
-    int _global_num_heads,
+    int _global_num_q_heads,
     int _global_num_kv_heads,
-    int _num_heads,
+    int _num_q_heads,
     int _num_kv_heads,
     DataType _quantization_type,
     bool _offload)
@@ -964,18 +966,18 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   quantization_type = _quantization_type;
   offload = _offload;
 
-  global_num_heads = _global_num_heads;
+  global_num_q_heads = _global_num_q_heads;
   global_num_kv_heads = _global_num_kv_heads;
-  num_heads = _num_heads;
+  num_q_heads = _num_q_heads;
   num_kv_heads = _num_kv_heads;
   // weights_params = (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize
   // +
   //                   oProjSize * (vProjSize > 0 ? vProjSize : vSize));
-  // weightSize = weights_params * num_heads * size_of_dt;
+  // weightSize = weights_params * num_q_heads * size_of_dt;
 
   weightSize =
       ((qSize * qProjSize + oProjSize * (vProjSize > 0 ? vProjSize : vSize)) *
-           num_heads +
+           num_q_heads +
        (kSize * kProjSize + vSize * vProjSize) * num_kv_heads) *
       size_of_dt;
   if (quantization_type != DT_NONE) {
@@ -1004,11 +1006,11 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   }
 
 #ifdef INFERENCE_TESTS
-  kcache = (float *)calloc(kProjSize * BatchConfig::MAX_SEQ_LENGTH * num_heads *
-                               BatchConfig::MAX_NUM_REQUESTS,
+  kcache = (float *)calloc(kProjSize * BatchConfig::MAX_SEQ_LENGTH *
+                               num_q_heads * BatchConfig::MAX_NUM_REQUESTS,
                            sizeof(float));
-  vcache = (float *)calloc(vProjSize * BatchConfig::MAX_SEQ_LENGTH * num_heads *
-                               BatchConfig::MAX_NUM_REQUESTS,
+  vcache = (float *)calloc(vProjSize * BatchConfig::MAX_SEQ_LENGTH *
+                               num_q_heads * BatchConfig::MAX_NUM_REQUESTS,
                            sizeof(float));
 #endif
 
@@ -1016,15 +1018,15 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   {
     // size_t qkv_proj_dim = qProjSize + kProjSize + vProjSize;
     // size_t qkv_max_proj_size =
-    //     BatchConfig::MAX_NUM_TOKENS * qkv_proj_dim * num_heads;
+    //     BatchConfig::MAX_NUM_TOKENS * qkv_proj_dim * num_q_heads;
 
     size_t qkv_max_proj_size =
         BatchConfig::MAX_NUM_TOKENS *
-        (qProjSize * num_heads + kProjSize * num_kv_heads +
+        (qProjSize * num_q_heads + kProjSize * num_kv_heads +
          vProjSize * num_kv_heads);
     // std::cout << "num_kv_heads: " << BatchConfig::MAX_NUM_TOKENS << ", "
     //           << qProjSize << ", " << kProjSize << ", " << vProjSize << ", "
-    //           << num_heads << ", " << num_kv_heads << ", " <<
+    //           << num_q_heads << ", " << num_kv_heads << ", " <<
     //           qkv_max_proj_size
     //           << std::endl;
     // assert(false);
@@ -1054,14 +1056,15 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     }
     size_t tokeninfo_size = BatchConfig::MAX_NUM_TOKENS;
     size_t qk_prod_size =
-        BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_SEQ_LENGTH * num_heads;
+        BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_SEQ_LENGTH * num_q_heads;
     size_t attn_heads_size =
-        BatchConfig::MAX_NUM_TOKENS * num_heads * vProjSize;
+        BatchConfig::MAX_NUM_TOKENS * num_q_heads * vProjSize;
     size_t W_out_block_size = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
-    size_t W_out_contiguous_size = W_out_block_size * num_heads;
-    size_t complex_size = (BatchConfig::MAX_NUM_TOKENS *
-                           (qProjSize * num_heads + kProjSize * num_kv_heads)) /
-                          2;
+    size_t W_out_contiguous_size = W_out_block_size * num_q_heads;
+    size_t complex_size =
+        (BatchConfig::MAX_NUM_TOKENS *
+         (qProjSize * num_q_heads + kProjSize * num_kv_heads)) /
+        2;
     size_t totalSize =
         (qkv_max_proj_size + key_cache_size + value_cache_size +
          2 * qk_prod_size + attn_heads_size + W_out_contiguous_size) *
diff --git a/src/ops/spec_inc_multihead_self_attention.cc b/src/ops/spec_inc_multihead_self_attention.cc
index c4b4214f69..9395c9aab4 100644
--- a/src/ops/spec_inc_multihead_self_attention.cc
+++ b/src/ops/spec_inc_multihead_self_attention.cc
@@ -60,7 +60,6 @@ Tensor
     FFModel::spec_inc_multihead_self_attention(const Tensor input,
                                                int embed_dim,
                                                int num_heads,
-                                               int num_kv_heads,
                                                int kdim,
                                                int vdim,
                                                float dropout,
@@ -74,6 +73,43 @@ Tensor
                                                float scaling_factor,
                                                bool qk_prod_scaling,
                                                char const *name) {
+  return spec_inc_multiquery_self_attention(input,
+                                            embed_dim,
+                                            num_heads,
+                                            num_heads,
+                                            kdim,
+                                            vdim,
+                                            dropout,
+                                            bias,
+                                            add_bias_kv,
+                                            add_zero_attn,
+                                            data_type,
+                                            kernel_initializer,
+                                            apply_rotary_embedding,
+                                            scaling_query,
+                                            scaling_factor,
+                                            qk_prod_scaling,
+                                            name);
+}
+
+Tensor
+    FFModel::spec_inc_multiquery_self_attention(const Tensor input,
+                                                int embed_dim,
+                                                int num_q_heads,
+                                                int num_kv_heads,
+                                                int kdim,
+                                                int vdim,
+                                                float dropout,
+                                                bool bias,
+                                                bool add_bias_kv,
+                                                bool add_zero_attn,
+                                                DataType data_type,
+                                                Initializer *kernel_initializer,
+                                                bool apply_rotary_embedding,
+                                                bool scaling_query,
+                                                float scaling_factor,
+                                                bool qk_prod_scaling,
+                                                char const *name) {
   if (data_type == DT_NONE) {
     data_type = input->data_type;
   }
@@ -117,8 +153,8 @@ Tensor
   int kParas = kProjSize * kSize;
   int vParas = vProjSize * vSize;
   int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
-  int weight_size = qParas * num_heads + kParas * num_kv_heads +
-                    vParas * num_kv_heads + oParas * num_heads;
+  int weight_size = qParas * num_q_heads + kParas * num_kv_heads +
+                    vParas * num_kv_heads + oParas * num_q_heads;
   {
     int dims[1] = {weight_size};
     li->weights[0] = create_weight_legion_ordering(1,
@@ -131,7 +167,7 @@ Tensor
   }
   if (bias) {
     // q, k, v, o
-    int dims[1] = {qProjSize * num_heads +
+    int dims[1] = {qProjSize * num_q_heads +
                    (kProjSize + vProjSize) * num_kv_heads + oProjSize};
     li->weights[1] = create_weight_legion_ordering(1,
                                                    dims,
@@ -143,7 +179,7 @@ Tensor
   }
   li->data_type = data_type;
   li->add_int_property("embed_dim", embed_dim);
-  li->add_int_property("num_heads", num_heads);
+  li->add_int_property("num_q_heads", num_q_heads);
   li->add_int_property("num_kv_heads", num_kv_heads);
   li->add_int_property("kdim", kdim);
   li->add_int_property("vdim", vdim);
@@ -168,8 +204,8 @@ Op *SpecIncMultiHeadSelfAttention::create_operator_from_layer(
   long long value;
   layer->get_int_property("embed_dim", value);
   int embed_dim = value;
-  layer->get_int_property("num_heads", value);
-  int num_heads = value;
+  layer->get_int_property("num_q_heads", value);
+  int num_q_heads = value;
   layer->get_int_property("num_kv_heads", value);
   int num_kv_heads = value;
   layer->get_int_property("kdim", value);
@@ -196,7 +232,7 @@ Op *SpecIncMultiHeadSelfAttention::create_operator_from_layer(
                                            layer->layer_guid,
                                            inputs[0],
                                            embed_dim,
-                                           num_heads,
+                                           num_q_heads,
                                            num_kv_heads,
                                            kdim,
                                            vdim,
@@ -217,7 +253,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     LayerID const &_layer_guid,
     const ParallelTensor _input,
     int _embed_dim,
-    int _num_heads,
+    int _num_q_heads,
     int _num_kv_heads,
     int _kdim,
     int _vdim,
@@ -240,7 +276,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
          (_bias ? 2 : 1) /*weights*/,
          1 /*outputs*/,
          _input),
-      num_heads(_num_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
+      num_q_heads(_num_q_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
       bias(_bias), add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
       apply_rotary_embedding(_apply_rotary_embedding),
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
@@ -274,7 +310,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     dims[0] = inputs[0]->dims[num_dims - 2];
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
-    dims[1].size = this->num_heads * (qParas + oParas) +
+    dims[1].size = this->num_q_heads * (qParas + oParas) +
                    this->num_kv_heads * (kParas + vParas);
     dims[1].is_replica_dim = false;
     int seed = std::rand();
@@ -287,7 +323,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
                                                  CHOSEN_SYNC_TYPE);
     if (bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
-      bias_shape.dims[0].size = qProjSize * num_heads +
+      bias_shape.dims[0].size = qProjSize * num_q_heads +
                                 (kProjSize + vProjSize) * num_kv_heads +
                                 oProjSize;
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
@@ -316,7 +352,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     const ParallelTensor _input,
     const ParallelTensor _weight,
     int _embed_dim,
-    int _num_heads,
+    int _num_q_heads,
     int _num_kv_heads,
     int _kdim,
     int _vdim,
@@ -340,7 +376,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
          1 /*outputs*/,
          _input,
          _weight),
-      num_heads(_num_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
+      num_q_heads(_num_q_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
       bias(_bias), add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
       apply_rotary_embedding(_apply_rotary_embedding),
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
@@ -373,7 +409,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     dims[0] = inputs[0]->dims[num_dims - 2];
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
-    dims[1].size = this->num_heads * (qParas + oParas) +
+    dims[1].size = this->num_q_heads * (qParas + oParas) +
                    this->num_kv_heads * (kParas + vParas);
     dims[1].is_replica_dim = false;
     // dims[2].size = qParas + kParas + vParas + oParas;
@@ -387,7 +423,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
                                                  CHOSEN_SYNC_TYPE);
     if (bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
-      bias_shape.dims[0].size = qProjSize * num_heads +
+      bias_shape.dims[0].size = qProjSize * num_q_heads +
                                 (kProjSize + vProjSize) * num_kv_heads +
                                 oProjSize;
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
@@ -423,7 +459,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
                                     other.layer_guid,
                                     input,
                                     other.oProjSize,
-                                    other.num_heads,
+                                    other.num_q_heads,
                                     other.num_kv_heads,
                                     other.qProjSize,
                                     other.vProjSize,
@@ -448,7 +484,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
                                     params.layer_guid,
                                     input,
                                     params.embed_dim,
-                                    params.num_heads,
+                                    params.num_q_heads,
                                     params.num_kv_heads,
                                     params.kdim,
                                     params.vdim,
@@ -586,7 +622,7 @@ OpMeta *SpecIncMultiHeadSelfAttention::init_task(
   int num_samples = input.domain.hi()[2] - input.domain.lo()[2] + 1;
   assert(attn->qoSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
   assert(attn->kvSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
-  int num_heads = attn->num_heads;
+  int num_q_heads = attn->num_q_heads;
   int num_kv_heads = attn->num_kv_heads;
   assert(attn->oProjSize == output.domain.hi()[0] - output.domain.lo()[0] + 1);
 
@@ -602,7 +638,7 @@ OpMeta *SpecIncMultiHeadSelfAttention::init_task(
                                             weight,
                                             gpu_mem_allocator,
                                             num_samples,
-                                            num_heads,
+                                            num_q_heads,
                                             num_kv_heads);
   // assert that we didn't over allocate memory
   assert(gpu_mem_allocator.instance_allocated_size ==
@@ -745,7 +781,7 @@ bool SpecIncMultiHeadSelfAttention::get_int_parameter(PMParameter para,
                                                       int *value) const {
   switch (para) {
     case PM_NUM_HEADS:
-      *value = num_heads;
+      *value = num_q_heads;
       return true;
     default:
       return Op::get_int_parameter(para, value);
@@ -768,7 +804,7 @@ bool SpecIncMultiHeadSelfAttention::measure_operator_cost(
 bool operator==(SpecIncMultiHeadSelfAttentionParams const &lhs,
                 SpecIncMultiHeadSelfAttentionParams const &rhs) {
   return lhs.layer_guid == rhs.layer_guid && lhs.embed_dim == rhs.embed_dim &&
-         lhs.num_heads == rhs.num_heads && lhs.kdim == rhs.kdim &&
+         lhs.num_q_heads == rhs.num_q_heads && lhs.kdim == rhs.kdim &&
          lhs.vdim == rhs.vdim && lhs.dropout == rhs.dropout &&
          lhs.bias == rhs.bias && lhs.add_bias_kv == rhs.add_bias_kv &&
          lhs.add_zero_attn == rhs.add_zero_attn &&
@@ -783,7 +819,7 @@ SpecIncMultiHeadSelfAttentionParams
   SpecIncMultiHeadSelfAttentionParams params;
   params.layer_guid = this->layer_guid;
   params.embed_dim = this->oProjSize;
-  params.num_heads = this->num_heads;
+  params.num_q_heads = this->num_q_heads;
   params.num_kv_heads = this->num_kv_heads;
   params.kdim = this->kProjSize;
   params.vdim = this->vProjSize;
@@ -807,7 +843,7 @@ size_t hash<FlexFlow::SpecIncMultiHeadSelfAttentionParams>::operator()(
   size_t key = 0;
   hash_combine(key, params.layer_guid.id);
   hash_combine(key, params.embed_dim);
-  hash_combine(key, params.num_heads);
+  hash_combine(key, params.num_q_heads);
   hash_combine(key, params.num_kv_heads);
   hash_combine(key, params.kdim);
   hash_combine(key, params.vdim);
diff --git a/src/ops/spec_inc_multihead_self_attention.cpp b/src/ops/spec_inc_multihead_self_attention.cpp
index b95b215b5b..09198c5751 100644
--- a/src/ops/spec_inc_multihead_self_attention.cpp
+++ b/src/ops/spec_inc_multihead_self_attention.cpp
@@ -64,7 +64,7 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
     GenericTensorAccessorR const &weight,
     MemoryAllocator &gpu_mem_allocator,
     int num_samples,
-    int _num_heads,
+    int _num_q_heads,
     int _num_kv_heads)
     : IncMultiHeadSelfAttentionMeta(handler,
                                     BEAM_SEARCH_MODE,
@@ -85,9 +85,9 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
                                     weight,
                                     gpu_mem_allocator,
                                     num_samples,
-                                    attn->num_heads,
+                                    attn->num_q_heads,
                                     attn->num_kv_heads,
-                                    _num_heads,
+                                    _num_q_heads,
                                     _num_kv_heads,
                                     DT_NONE,
                                     false) {
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 664b746096..52a619a5d8 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -43,13 +43,13 @@ __global__ void spec_store_kv_cache(
     int kProjSize,
     int vProjSize,
     int num_tokens,
-    int num_heads,
+    int num_q_heads,
     int num_kv_heads,
     int max_seq_len,
     int max_beam_width,
     bool is_root) {
   CUDA_KERNEL_LOOP(i, num_tokens * (kProjSize + vProjSize) * num_kv_heads) {
-    int q_array_size = qProjSize * num_tokens * num_heads;
+    int q_array_size = qProjSize * num_tokens * num_q_heads;
     int k_array_size = kProjSize * num_tokens * num_kv_heads;
 
     bool k_cache = i < k_array_size;
@@ -189,7 +189,7 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                                     m->kProjSize,
                                     m->vProjSize,
                                     num_tokens,
-                                    m->num_heads,
+                                    m->num_q_heads,
                                     m->num_kv_heads,
                                     BatchConfig::MAX_SEQ_LENGTH,
                                     BeamSearchBatchConfig::MAX_BEAM_WIDTH,
@@ -201,9 +201,9 @@ template <typename DT>
 __global__ void spec_fill_entries_above_diagonal(DT *matrix,
                                                  size_t new_tokens,
                                                  size_t total_tokens_in_request,
-                                                 size_t num_heads,
+                                                 size_t num_q_heads,
                                                  DT value) {
-  CUDA_KERNEL_LOOP(i, new_tokens * total_tokens_in_request * num_heads) {
+  CUDA_KERNEL_LOOP(i, new_tokens * total_tokens_in_request * num_q_heads) {
     // size_t head_idx = i / (new_tokens * total_tokens_in_request);
     size_t src_idx = (i / new_tokens) % total_tokens_in_request;
     size_t dst_idx = i % new_tokens + total_tokens_in_request - new_tokens;
@@ -288,9 +288,9 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       // }
       // To get C, skip over QK^T products from previous requests
       DT *C = static_cast<DT *>(m->qk_prods) +
-              m->num_heads * tokens_prev_requests_squares;
+              m->num_q_heads * tokens_prev_requests_squares;
 
-      if (m->num_heads == m->num_kv_heads) {
+      if (m->num_q_heads == m->num_kv_heads) {
         checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                              CUBLAS_OP_T,
                                              CUBLAS_OP_N,
@@ -311,12 +311,12 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                                              cublas_data_type,
                                              ldc,
                                              strideC,
-                                             m->num_heads,
+                                             m->num_q_heads,
                                              compute_type,
                                              CUBLAS_GEMM_DEFAULT_TENSOR_OP));
       } else {
         strideB = 0;
-        int one_step_heads = m->num_heads / m->num_kv_heads;
+        int one_step_heads = m->num_q_heads / m->num_kv_heads;
         m_ = num_new_tokens;
         n = total_tokens;
         k = m->qProjSize;
@@ -353,7 +353,7 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       // causal attention.
       assert(num_new_tokens <= total_tokens);
       if (num_new_tokens > 1) {
-        size_t parallelism = m->num_heads * num_new_tokens * total_tokens;
+        size_t parallelism = m->num_q_heads * num_new_tokens * total_tokens;
         spec_fill_entries_above_diagonal<<<GET_BLOCKS(parallelism),
                                            min((size_t)CUDA_NUM_THREADS,
                                                parallelism),
@@ -362,7 +362,7 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
             C,
             num_new_tokens,
             total_tokens,
-            m->num_heads,
+            m->num_q_heads,
             static_cast<DT>(-INFINITY));
       }
       // Compute Softmax(QK^T/sqrt(d_k))
@@ -375,7 +375,7 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       // with no padding between images, feature maps, rows, and columns; the
       // columns are the inner dimension and the images are the outermost
       // dimension.
-      int n_param = m->num_heads;
+      int n_param = m->num_q_heads;
       int c_param = total_tokens;
       int h_param = 1;
       int w_param = num_new_tokens;
@@ -388,7 +388,7 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                                             w_param));
       float softmax_alpha = 1.0f, softmax_beta = 0.0f;
       DT *C_softmax = static_cast<DT *>(m->qk_prods_softmax) +
-                      m->num_heads * tokens_prev_requests_squares;
+                      m->num_q_heads * tokens_prev_requests_squares;
       // The softmax operation below is executed according to the
       // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
       // softmax operation is computed per spatial location (H,W) per image (N)
@@ -421,9 +421,9 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
       // requests
       C = static_cast<DT *>(m->attn_heads) +
-          tokens_previous_requests * m->num_heads * m->vProjSize;
+          tokens_previous_requests * m->num_q_heads * m->vProjSize;
 
-      if (m->num_heads == m->num_kv_heads) {
+      if (m->num_q_heads == m->num_kv_heads) {
         checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                              CUBLAS_OP_N,
                                              CUBLAS_OP_T,
@@ -444,11 +444,11 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                                              cublas_data_type,
                                              ldc,
                                              strideC,
-                                             m->num_heads,
+                                             m->num_q_heads,
                                              compute_type,
                                              CUBLAS_GEMM_DEFAULT_TENSOR_OP));
       } else {
-        int one_step_heads = m->num_heads / m->num_kv_heads;
+        int one_step_heads = m->num_q_heads / m->num_kv_heads;
         n = m->vProjSize;
         lda = m_, ldb = n, ldc = m_;
         strideA = num_new_tokens * total_tokens;
@@ -485,10 +485,10 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       // Project to output, save result directly on output tensor
       alpha = 1.0f, beta = 0.0f;
       m_ = m->oProjSize;
-      k = m->vProjSize * m->num_heads;
+      k = m->vProjSize * m->num_q_heads;
       n = num_new_tokens;
       lda = k, ldb = n, ldc = m_;
-      A = weight_ptr + m->qSize * (m->qProjSize * m->num_heads +
+      A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
                                    m->kProjSize * m->num_kv_heads +
                                    m->vProjSize * m->num_kv_heads);
       B = C;
@@ -519,7 +519,7 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
     }
     if (*m->bias && shard_id == 0) {
       int parallelism = m->oProjSize * num_tokens;
-      int qkv_weight_size = m->qProjSize * m->global_num_heads +
+      int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
                             m->kProjSize * m->global_num_kv_heads +
                             m->vProjSize * m->global_num_kv_heads;
       apply_proj_bias_w<<<GET_BLOCKS(parallelism),
@@ -658,7 +658,7 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
     GenericTensorAccessorR const &weight,
     MemoryAllocator &gpu_mem_allocator,
     int num_samples,
-    int _num_heads,
+    int _num_q_heads,
     int _num_kv_heads)
     : IncMultiHeadSelfAttentionMeta(handler,
                                     BEAM_SEARCH_MODE,
@@ -679,9 +679,9 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
                                     weight,
                                     gpu_mem_allocator,
                                     num_samples,
-                                    attn->num_heads,
+                                    attn->num_q_heads,
                                     attn->num_kv_heads,
-                                    _num_heads,
+                                    _num_q_heads,
                                     _num_kv_heads,
                                     DT_NONE,
                                     false) {
diff --git a/src/ops/tree_inc_multihead_self_attention.cc b/src/ops/tree_inc_multihead_self_attention.cc
index 133543650b..875f38c77a 100644
--- a/src/ops/tree_inc_multihead_self_attention.cc
+++ b/src/ops/tree_inc_multihead_self_attention.cc
@@ -62,6 +62,42 @@ Tensor FFModel::inc_multihead_self_attention_verify(
     const Tensor input,
     int embed_dim,
     int num_heads,
+    int kdim,
+    int vdim,
+    float dropout,
+    bool bias,
+    bool add_bias_kv,
+    bool add_zero_attn,
+    DataType data_type,
+    Initializer *kernel_initializer,
+    bool apply_rotary_embedding,
+    bool scaling_query,
+    float scaling_factor,
+    bool qk_prod_scaling,
+    char const *name) {
+  return inc_multiquery_self_attention_verify(input,
+                                              embed_dim,
+                                              num_heads,
+                                              num_heads,
+                                              kdim,
+                                              vdim,
+                                              dropout,
+                                              bias,
+                                              add_bias_kv,
+                                              add_zero_attn,
+                                              data_type,
+                                              kernel_initializer,
+                                              apply_rotary_embedding,
+                                              scaling_query,
+                                              scaling_factor,
+                                              qk_prod_scaling,
+                                              name);
+}
+
+Tensor FFModel::inc_multiquery_self_attention_verify(
+    const Tensor input,
+    int embed_dim,
+    int num_q_heads,
     int num_kv_heads,
     int kdim,
     int vdim,
@@ -122,8 +158,8 @@ Tensor FFModel::inc_multihead_self_attention_verify(
   int vParas = vProjSize * vSize;
   int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
   int one_head_size = qParas + kParas + vParas + oParas;
-  int weight_size = qParas * num_heads + kParas * num_kv_heads +
-                    vParas * num_kv_heads + oParas * num_heads;
+  int weight_size = qParas * num_q_heads + kParas * num_kv_heads +
+                    vParas * num_kv_heads + oParas * num_q_heads;
   {
     // compress the weight size if quantization.
     if (quantization_type != DT_NONE) {
@@ -143,7 +179,7 @@ Tensor FFModel::inc_multihead_self_attention_verify(
   }
   if (bias) {
     // q, k, v, o
-    int dims[1] = {qProjSize * num_heads +
+    int dims[1] = {qProjSize * num_q_heads +
                    (kProjSize + vProjSize) * num_kv_heads + oProjSize};
     li->weights[1] = create_weight_legion_ordering(1,
                                                    dims,
@@ -155,7 +191,7 @@ Tensor FFModel::inc_multihead_self_attention_verify(
   }
   li->data_type = data_type;
   li->add_int_property("embed_dim", embed_dim);
-  li->add_int_property("num_heads", num_heads);
+  li->add_int_property("num_q_heads", num_q_heads);
   li->add_int_property("num_kv_heads", num_kv_heads);
   li->add_int_property("kdim", kdim);
   li->add_int_property("vdim", vdim);
@@ -182,8 +218,8 @@ Op *TreeIncMultiHeadSelfAttention::create_operator_from_layer(
   long long value;
   layer->get_int_property("embed_dim", value);
   int embed_dim = value;
-  layer->get_int_property("num_heads", value);
-  int num_heads = value;
+  layer->get_int_property("num_q_heads", value);
+  int num_q_heads = value;
   layer->get_int_property("num_kv_heads", value);
   int num_kv_heads = value;
   layer->get_int_property("kdim", value);
@@ -216,7 +252,7 @@ Op *TreeIncMultiHeadSelfAttention::create_operator_from_layer(
                                            layer->layer_guid,
                                            inputs[0],
                                            embed_dim,
-                                           num_heads,
+                                           num_q_heads,
                                            num_kv_heads,
                                            kdim,
                                            vdim,
@@ -240,7 +276,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     LayerID const &_layer_guid,
     const ParallelTensor _input,
     int _embed_dim,
-    int _num_heads,
+    int _num_q_heads,
     int _num_kv_heads,
     int _kdim,
     int _vdim,
@@ -266,7 +302,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
          (_bias ? 2 : 1) /*weights*/,
          1 /*outputs*/,
          _input),
-      num_heads(_num_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
+      num_q_heads(_num_q_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
       bias(_bias), add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
       apply_rotary_embedding(_apply_rotary_embedding),
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
@@ -301,7 +337,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     dims[0] = inputs[0]->dims[num_dims - 2];
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
-    dims[1].size = this->num_heads * (qParas + oParas) +
+    dims[1].size = this->num_q_heads * (qParas + oParas) +
                    this->num_kv_heads * (kParas + vParas);
     dims[1].is_replica_dim = false;
     // dims[2].size = qParas + kParas + vParas + oParas;
@@ -322,7 +358,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
         CHOSEN_SYNC_TYPE);
     if (bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
-      bias_shape.dims[0].size = qProjSize * num_heads +
+      bias_shape.dims[0].size = qProjSize * num_q_heads +
                                 (kProjSize + vProjSize) * num_kv_heads +
                                 oProjSize;
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
@@ -351,7 +387,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     const ParallelTensor _input,
     const ParallelTensor _weight,
     int _embed_dim,
-    int _num_heads,
+    int _num_q_heads,
     int _num_kv_heads,
     int _kdim,
     int _vdim,
@@ -378,7 +414,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
          1 /*outputs*/,
          _input,
          _weight),
-      num_heads(_num_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
+      num_q_heads(_num_q_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
       bias(_bias), add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
       apply_rotary_embedding(_apply_rotary_embedding),
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
@@ -412,7 +448,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     dims[0] = inputs[0]->dims[num_dims - 2];
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
-    dims[1].size = this->num_heads * (qParas + oParas) +
+    dims[1].size = this->num_q_heads * (qParas + oParas) +
                    this->num_kv_heads * (kParas + vParas);
     dims[1].is_replica_dim = false;
     // dims[2].size = qParas + kParas + vParas + oParas;
@@ -431,7 +467,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
         CHOSEN_SYNC_TYPE);
     if (bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
-      bias_shape.dims[0].size = qProjSize * num_heads +
+      bias_shape.dims[0].size = qProjSize * num_q_heads +
                                 (kProjSize + vProjSize) * num_kv_heads +
                                 oProjSize;
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
@@ -467,7 +503,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
                                     other.layer_guid,
                                     input,
                                     other.oProjSize,
-                                    other.num_heads,
+                                    other.num_q_heads,
                                     other.num_kv_heads,
                                     other.qProjSize,
                                     other.vProjSize,
@@ -495,7 +531,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
                                     params.layer_guid,
                                     input,
                                     params.embed_dim,
-                                    params.num_heads,
+                                    params.num_q_heads,
                                     params.num_kv_heads,
                                     params.kdim,
                                     params.vdim,
@@ -638,8 +674,8 @@ OpMeta *TreeIncMultiHeadSelfAttention::init_task(
   int num_samples = input.domain.hi()[2] - input.domain.lo()[2] + 1;
   assert(attn->qoSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
   assert(attn->kvSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
-  // int num_heads = weight.domain.hi()[1] - weight.domain.lo()[1] + 1;
-  int num_heads = attn->num_heads / attn->tensor_parallelism_degree;
+  // int num_q_heads = weight.domain.hi()[1] - weight.domain.lo()[1] + 1;
+  int num_q_heads = attn->num_q_heads / attn->tensor_parallelism_degree;
   int num_kv_heads = attn->num_kv_heads / attn->tensor_parallelism_degree;
 
   assert(attn->oProjSize == output.domain.hi()[0] - output.domain.lo()[0] + 1);
@@ -661,7 +697,7 @@ OpMeta *TreeIncMultiHeadSelfAttention::init_task(
                                             weight,
                                             gpu_mem_allocator,
                                             num_samples,
-                                            num_heads,
+                                            num_q_heads,
                                             num_kv_heads);
   if (!attn->offload) {
     // assert that we didn't over allocate memory
@@ -861,7 +897,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
 
   // Weight tensor dimensions
   coord_t all_weight_params = weight_domain.hi()[0] - weight_domain.lo()[0] + 1;
-  coord_t num_heads = weight_domain.hi()[1] - weight_domain.lo()[1] + 1;
+  coord_t num_q_heads = weight_domain.hi()[1] - weight_domain.lo()[1] + 1;
   replica_dim = weight_domain.hi()[2] - weight_domain.lo()[2] + 1;
   size_t qParas = m->qProjSize * m->qSize;
   size_t kParas = m->kProjSize * m->kSize;
@@ -869,7 +905,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   size_t oParas = m->oProjSize * (m->vProjSize > 0 ? m->vProjSize : m->vSize);
 
   assert(all_weight_params == qParas + kParas + vParas + oParas);
-  assert(num_heads == m->num_heads);
+  assert(num_q_heads == m->num_q_heads);
   assert(replica_dim == 1);
 
   assert(m->qSize == m->kSize && m->kSize == m->vSize);
@@ -881,11 +917,11 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   // column-major order.
 
   // printf("m->kProjSize: %i, TreeVerifyBatchConfig::MAX_NUM_TOKENS: %i, "
-  //     "bc.num_active_tokens(): %i, num_heads: %lli,
+  //     "bc.num_active_tokens(): %i, num_q_heads: %lli,
   //     TreeVerifyBatchConfig::MAX_NUM_REQUESTS: %i, "
   //     "bc.num_active_requests(): %i\n", m->kProjSize,
   //     TreeVerifyBatchConfig::MAX_NUM_TOKENS, bc.num_active_tokens(),
-  //     num_heads, TreeVerifyBatchConfig::MAX_NUM_REQUESTS,
+  //     num_q_heads, TreeVerifyBatchConfig::MAX_NUM_REQUESTS,
   //     bc.num_active_requests());
   // for (int t=0; t < bc.num_active_tokens(); t++) {
   //   printf("token %i has request_index: %li and token_position: %li\n",
@@ -912,12 +948,12 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   // =============================================================================
   //  Load the Q/K/V projection weights, and create a Torch tensor
   // =============================================================================
-  std::vector<int> w_qkv_shape = {m->qSize, m->qProjSize, 3, (int)num_heads};
+  std::vector<int> w_qkv_shape = {m->qSize, m->qProjSize, 3, (int)num_q_heads};
   float *w_qkv =
-      (float *)calloc(m->qSize * m->qProjSize * 3 * num_heads, sizeof(float));
+      (float *)calloc(m->qSize * m->qProjSize * 3 * num_q_heads, sizeof(float));
   assert(w_qkv[0] == 0.0f);
 
-  for (int h = 0; h < num_heads; h++) {
+  for (int h = 0; h < num_q_heads; h++) {
     for (size_t i = 0; i < m->qProjSize * m->qSize; i++) {
       int row_index = i % m->qSize;
       int column_index = i / m->qSize;
@@ -945,7 +981,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   }
   // convert weights to torch tensor
   torch::Tensor torch_w_qkv = torch::from_blob(
-      w_qkv, {m->qSize, m->qProjSize, 3, (int)num_heads}, torch::kFloat32);
+      w_qkv, {m->qSize, m->qProjSize, 3, (int)num_q_heads}, torch::kFloat32);
 
   /* std::cout << "Torch projection weights size: " << torch_w_qkv.sizes()
             << std::endl;
@@ -968,24 +1004,24 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   assert(qkv_projs.sizes()[1] == bc.num_active_tokens() &&
          qkv_projs.sizes()[1] <= effective_batch_size);
   assert(qkv_projs.sizes()[2] == 3);
-  assert(qkv_projs.sizes()[3] == num_heads);
+  assert(qkv_projs.sizes()[3] == num_q_heads);
   free(w_qkv);
 
   //  ----------------------- Loading CUDA results for this step ---------------
   float *QKVProjArray_cpu = download_tensor<float>(
       m->devQKVProjArray,
-      TreeVerifyBatchConfig::MAX_NUM_TOKENS * proj_sum * m->num_heads);
+      TreeVerifyBatchConfig::MAX_NUM_TOKENS * proj_sum * m->num_q_heads);
   assert(QKVProjArray_cpu != nullptr);
 
   std::vector<int> QKVProjArray_converted_shape = {
-      m->qProjSize, bc.num_active_tokens(), 3, (int)num_heads};
+      m->qProjSize, bc.num_active_tokens(), 3, (int)num_q_heads};
   float *QKVProjArray_converted = (float *)calloc(
-      m->qProjSize * bc.num_active_tokens() * 3 * num_heads, sizeof(float));
+      m->qProjSize * bc.num_active_tokens() * 3 * num_q_heads, sizeof(float));
 
   // skip over padding at the end of QKVProjArray_cpu
   // convert from column order to 3D matrix because torch cannot automatically
   // import matrices flattened in column order
-  for (size_t i = 0; i < proj_sum * bc.num_active_tokens() * num_heads; i++) {
+  for (size_t i = 0; i < proj_sum * bc.num_active_tokens() * num_q_heads; i++) {
     int proj_size_index = i % m->qProjSize;
     int head_index = i / (proj_sum * bc.num_active_tokens());
     int token_index =
@@ -994,7 +1030,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
     int qkv_offset = (i - head_index * proj_sum * bc.num_active_tokens()) /
                      (m->qProjSize * bc.num_active_tokens());
     assert(proj_size_index < proj_sum);
-    assert(head_index < num_heads);
+    assert(head_index < num_q_heads);
     assert(token_index < bc.num_active_tokens());
     assert(qkv_offset < 3);
     set_value_row_major(QKVProjArray_converted,
@@ -1004,19 +1040,19 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   }
   torch::Tensor QKVProjArray_torch =
       torch::from_blob(QKVProjArray_converted,
-                       {m->qProjSize, bc.num_active_tokens(), 3, num_heads},
+                       {m->qProjSize, bc.num_active_tokens(), 3, num_q_heads},
                        torch::kFloat32);
 
   //  ----------------------- Comparing C++ & CUDA results ---------------------
   // std::cout << "QKVProjArray_torch" << std::endl;
-  // for (int i=0; i<num_heads; i++) {
+  // for (int i=0; i<num_q_heads; i++) {
   //   for (int j=0; j<3; j++) {
   //     std::cout << QKVProjArray_torch.index({Slice(), Slice(), j, i}) <<
   //     std::endl;
   //   }
   // }
   // std::cout << "qkv_projs" << std::endl;
-  // for (int i=0; i<num_heads; i++) {
+  // for (int i=0; i<num_q_heads; i++) {
   //   for (int j=0; j<3; j++) {
   //     std::cout << qkv_projs.index({Slice(), Slice(), j, i}) << std::endl;
   //   }
@@ -1030,13 +1066,13 @@ void TreeIncMultiHeadSelfAttention::inference_task(
 
   //  ----------------------- C++ operations & checks --------------------------
   // Store projections into k/v cache arrays
-  for (size_t h = 0; h < num_heads; h++) {
+  for (size_t h = 0; h < num_q_heads; h++) {
     for (size_t t = 0; t < bc.num_active_tokens(); t++) {
       for (size_t d = 0; d < m->kProjSize; d++) {
-        size_t kcache_idx = d * MAX_SEQ_LEN * m->num_heads *
+        size_t kcache_idx = d * MAX_SEQ_LEN * m->num_q_heads *
                                 TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
                             bc.tokensInfo[t].abs_depth_in_request *
-                                m->num_heads *
+                                m->num_q_heads *
                                 TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
                             h * TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
                             bc.tokensInfo[t].request_index;
@@ -1045,10 +1081,10 @@ void TreeIncMultiHeadSelfAttention::inference_task(
                 .item<float>();
       }
       for (size_t d = 0; d < m->vProjSize; d++) {
-        size_t vcache_idx = d * MAX_SEQ_LEN * m->num_heads *
+        size_t vcache_idx = d * MAX_SEQ_LEN * m->num_q_heads *
                                 TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
                             bc.tokensInfo[t].abs_depth_in_request *
-                                m->num_heads *
+                                m->num_q_heads *
                                 TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
                             h * TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
                             bc.tokensInfo[t].request_index;
@@ -1063,14 +1099,14 @@ void TreeIncMultiHeadSelfAttention::inference_task(
       torch::from_blob(m->kcache,
                        {m->kProjSize,
                         MAX_SEQ_LEN,
-                        num_heads,
+                        num_q_heads,
                         TreeVerifyBatchConfig::MAX_NUM_REQUESTS},
                        torch::kFloat32);
   torch::Tensor V_t =
       torch::from_blob(m->vcache,
                        {m->vProjSize,
                         MAX_SEQ_LEN,
-                        num_heads,
+                        num_q_heads,
                         TreeVerifyBatchConfig::MAX_NUM_REQUESTS},
                        torch::kFloat32);
 
@@ -1099,31 +1135,31 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   //  ----------------------- Loading CUDA results for this step ---------------
   float *keyCache_cpu = download_tensor<float>(
       m->keyCache,
-      m->num_heads * m->kProjSize * TreeVerifyBatchConfig::MAX_NUM_REQUESTS *
+      m->num_q_heads * m->kProjSize * TreeVerifyBatchConfig::MAX_NUM_REQUESTS *
           MAX_SEQ_LEN);
   float *valueCache_cpu = download_tensor<float>(
       m->valueCache,
-      m->num_heads * m->vProjSize * TreeVerifyBatchConfig::MAX_NUM_REQUESTS *
+      m->num_q_heads * m->vProjSize * TreeVerifyBatchConfig::MAX_NUM_REQUESTS *
           MAX_SEQ_LEN);
   assert(keyCache_cpu != nullptr);
   assert(valueCache_cpu != nullptr);
 
   float *kcache_cuda =
-      (float *)calloc(m->kProjSize * MAX_SEQ_LEN * m->num_heads *
+      (float *)calloc(m->kProjSize * MAX_SEQ_LEN * m->num_q_heads *
                           TreeVerifyBatchConfig::MAX_NUM_REQUESTS,
                       sizeof(float));
   float *vcache_cuda =
-      (float *)calloc(m->vProjSize * MAX_SEQ_LEN * m->num_heads *
+      (float *)calloc(m->vProjSize * MAX_SEQ_LEN * m->num_q_heads *
                           TreeVerifyBatchConfig::MAX_NUM_REQUESTS,
                       sizeof(float));
   int index = 0;
   for (int i = 0; i < m->kProjSize; i++) {
     for (int j = 0; j < MAX_SEQ_LEN; j++) {
-      for (int k = 0; k < m->num_heads; k++) {
+      for (int k = 0; k < m->num_q_heads; k++) {
         for (int l = 0; l < TreeVerifyBatchConfig::MAX_NUM_REQUESTS; l++) {
-          int col_major_index = l * m->kProjSize * MAX_SEQ_LEN * m->num_heads +
-                                k * m->kProjSize * MAX_SEQ_LEN +
-                                j * m->kProjSize + i;
+          int col_major_index =
+              l * m->kProjSize * MAX_SEQ_LEN * m->num_q_heads +
+              k * m->kProjSize * MAX_SEQ_LEN + j * m->kProjSize + i;
           kcache_cuda[index++] = keyCache_cpu[col_major_index];
         }
       }
@@ -1132,11 +1168,11 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   index = 0;
   for (int i = 0; i < m->vProjSize; i++) {
     for (int j = 0; j < MAX_SEQ_LEN; j++) {
-      for (int k = 0; k < m->num_heads; k++) {
+      for (int k = 0; k < m->num_q_heads; k++) {
         for (int l = 0; l < TreeVerifyBatchConfig::MAX_NUM_REQUESTS; l++) {
-          int col_major_index = l * m->vProjSize * MAX_SEQ_LEN * m->num_heads +
-                                k * m->vProjSize * MAX_SEQ_LEN +
-                                j * m->vProjSize + i;
+          int col_major_index =
+              l * m->vProjSize * MAX_SEQ_LEN * m->num_q_heads +
+              k * m->vProjSize * MAX_SEQ_LEN + j * m->vProjSize + i;
           vcache_cuda[index++] = valueCache_cpu[col_major_index];
         }
       }
@@ -1146,14 +1182,14 @@ void TreeIncMultiHeadSelfAttention::inference_task(
       torch::from_blob(kcache_cuda,
                        {m->kProjSize,
                         MAX_SEQ_LEN,
-                        num_heads,
+                        num_q_heads,
                         TreeVerifyBatchConfig::MAX_NUM_REQUESTS},
                        torch::kFloat32);
   torch::Tensor V_t_cuda =
       torch::from_blob(vcache_cuda,
                        {m->vProjSize,
                         MAX_SEQ_LEN,
-                        num_heads,
+                        num_q_heads,
                         TreeVerifyBatchConfig::MAX_NUM_REQUESTS},
                        torch::kFloat32);
 
@@ -1161,16 +1197,16 @@ void TreeIncMultiHeadSelfAttention::inference_task(
 
   // std::cout << "kcache differences:" << std::endl;
   // for (int i=0; i < bc.num_active_requests() + 1; i++) {
-  //   for (int j=0; j < num_heads; j++) {
+  //   for (int j=0; j < num_q_heads; j++) {
   //     for (int l=0; l < m->kProjSize; l++) {
   //       for (int k=0; k < MAX_SEQ_LEN; k++) {
   //         size_t kcache_idx =
-  //           l * MAX_SEQ_LEN * num_heads *
-  //           TreeVerifyBatchConfig::MAX_NUM_REQUESTS + k * num_heads *
+  //           l * MAX_SEQ_LEN * num_q_heads *
+  //           TreeVerifyBatchConfig::MAX_NUM_REQUESTS + k * num_q_heads *
   //           TreeVerifyBatchConfig::MAX_NUM_REQUESTS + j *
   //           TreeVerifyBatchConfig::MAX_NUM_REQUESTS + i; if (
   //           abs(m->kcache[kcache_idx] - keyCache_cpu[
-  //               i * m->kProjSize * MAX_SEQ_LEN * num_heads +
+  //               i * m->kProjSize * MAX_SEQ_LEN * num_q_heads +
   //               j * m->kProjSize * MAX_SEQ_LEN +
   //               k * m->kProjSize +
   //               l
@@ -1186,11 +1222,11 @@ void TreeIncMultiHeadSelfAttention::inference_task(
 
   //  std::cout << "keyCache from CUDA:" << std::endl;
   //  for (int i=0; i<bc.num_active_requests()+1; i++) {
-  //    for (int j=0; j<num_heads; j++) {
+  //    for (int j=0; j<num_q_heads; j++) {
   //     for (int l=0; l<m->kProjSize; l++) {
   //       for (int k=0; k< MAX_SEQ_LEN; k++) {
   //         printf("%f ",
-  //           keyCache_cpu[i * m->kProjSize * MAX_SEQ_LEN * num_heads +
+  //           keyCache_cpu[i * m->kProjSize * MAX_SEQ_LEN * num_q_heads +
   //               j * m->kProjSize * MAX_SEQ_LEN +
   //               k * m->kProjSize +
   //               l
@@ -1205,12 +1241,12 @@ void TreeIncMultiHeadSelfAttention::inference_task(
 
   //  std::cout << "valueCache from CUDA:" << std::endl;
   //  for (int i=0; i<bc.num_active_requests()+1; i++) {
-  //    for (int j=0; j<num_heads; j++) {
+  //    for (int j=0; j<num_q_heads; j++) {
   //       for (int l=0; l<m->vProjSize; l++) {
   //         for (int k=0; k< MAX_SEQ_LEN; k++) {
   //           printf("%f ",
   //             valueCache_cpu[
-  //                 i * m->vProjSize * MAX_SEQ_LEN * num_heads +
+  //                 i * m->vProjSize * MAX_SEQ_LEN * num_q_heads +
   //                 j * m->vProjSize * MAX_SEQ_LEN +
   //                 k * m->vProjSize +
   //             l]);
@@ -1226,12 +1262,12 @@ void TreeIncMultiHeadSelfAttention::inference_task(
 
   //  std::cout << "C++ kcache:" << std::endl;
   //  for (int i=0; i<bc.num_active_requests()+1; i++) {
-  //    for (int j=0; j < num_heads; j++) {
+  //    for (int j=0; j < num_q_heads; j++) {
   //       for (int l=0; l < m->kProjSize; l++) {
   //         for (int k=0; k < MAX_SEQ_LEN; k++) {
   //           size_t kcache_idx =
-  //             l * MAX_SEQ_LEN * num_heads *
-  //             TreeVerifyBatchConfig::MAX_NUM_REQUESTS + k * num_heads *
+  //             l * MAX_SEQ_LEN * num_q_heads *
+  //             TreeVerifyBatchConfig::MAX_NUM_REQUESTS + k * num_q_heads *
   //             TreeVerifyBatchConfig::MAX_NUM_REQUESTS + j *
   //             TreeVerifyBatchConfig::MAX_NUM_REQUESTS + i;
   //           printf("%f ", m->kcache[kcache_idx]);
@@ -1245,12 +1281,12 @@ void TreeIncMultiHeadSelfAttention::inference_task(
 
   //  std::cout << "C++ vcache:" << std::endl;
   //  for (int i=0; i<bc.num_active_requests()+1; i++) {
-  //    for (int j=0; j<num_heads; j++) {
+  //    for (int j=0; j<num_q_heads; j++) {
   //       for (int l=0; l<m->vProjSize; l++) {
   //         for (int k=0; k< MAX_SEQ_LEN; k++) {
   //             size_t vcache_idx =
-  //               l * MAX_SEQ_LEN * num_heads *
-  //               TreeVerifyBatchConfig::MAX_NUM_REQUESTS + k * num_heads *
+  //               l * MAX_SEQ_LEN * num_q_heads *
+  //               TreeVerifyBatchConfig::MAX_NUM_REQUESTS + k * num_q_heads *
   //               TreeVerifyBatchConfig::MAX_NUM_REQUESTS + j *
   //               TreeVerifyBatchConfig::MAX_NUM_REQUESTS + i;
   //             printf("%f ", m->vcache[vcache_idx]);
@@ -1272,11 +1308,11 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   // =============================================================================
 
   //  ----------------------- C++ operations & checks --------------------------
-  float *w_out = (float *)calloc(m->vProjSize * m->num_heads * m->oProjSize,
+  float *w_out = (float *)calloc(m->vProjSize * m->num_q_heads * m->oProjSize,
                                  sizeof(float));
-  std::vector<int> w_out_shape = {m->vProjSize, m->num_heads, m->oProjSize};
+  std::vector<int> w_out_shape = {m->vProjSize, m->num_q_heads, m->oProjSize};
   assert(m->qProjSize == m->kProjSize && m->kProjSize == m->vProjSize);
-  for (int h = 0; h < num_heads; h++) {
+  for (int h = 0; h < num_q_heads; h++) {
     for (int v = 0; v < m->vProjSize; v++) {
       for (int o = 0; o < m->oProjSize; o++) {
         set_value_row_major(
@@ -1290,22 +1326,22 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   }
   // convert weights to torch tensor
   torch::Tensor torch_w_out = torch::from_blob(
-      w_out, {m->vProjSize, m->num_heads, m->oProjSize}, torch::kFloat32);
+      w_out, {m->vProjSize, m->num_q_heads, m->oProjSize}, torch::kFloat32);
 
   //  ----------------------- Loading CUDA results for this step ---------------
   float *w_out_cuda = download_tensor<float>(
-      m->W_out_contiguous, m->vProjSize * m->oProjSize * m->num_heads);
+      m->W_out_contiguous, m->vProjSize * m->oProjSize * m->num_q_heads);
   assert(w_out_cuda != nullptr);
   float *converted_wout_tensor = (float *)calloc(
-      m->vProjSize * m->num_heads * m->oProjSize, sizeof(float));
+      m->vProjSize * m->num_q_heads * m->oProjSize, sizeof(float));
   std::vector<int> converted_wout_tensor_shape = {
-      m->vProjSize, m->num_heads, m->oProjSize};
+      m->vProjSize, m->num_q_heads, m->oProjSize};
 
-  for (int i = 0; i < m->vProjSize * m->num_heads * m->oProjSize; i++) {
+  for (int i = 0; i < m->vProjSize * m->num_q_heads * m->oProjSize; i++) {
     int v_idx = i % m->vProjSize;
-    int h_idx = (i / m->vProjSize) % m->num_heads;
-    int o_idx = i / (m->vProjSize * m->num_heads);
-    assert(v_idx < m->vProjSize && h_idx < m->num_heads &&
+    int h_idx = (i / m->vProjSize) % m->num_q_heads;
+    int o_idx = i / (m->vProjSize * m->num_q_heads);
+    assert(v_idx < m->vProjSize && h_idx < m->num_q_heads &&
            o_idx < m->oProjSize);
     set_value_row_major(converted_wout_tensor,
                         converted_wout_tensor_shape,
@@ -1314,7 +1350,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   }
   torch::Tensor w_out_cuda_tensor =
       torch::from_blob(converted_wout_tensor,
-                       {m->vProjSize, m->num_heads, m->oProjSize},
+                       {m->vProjSize, m->num_q_heads, m->oProjSize},
                        torch::kFloat32);
 
   //  ----------------------- Comparing C++ & CUDA results ---------------------
@@ -1342,18 +1378,18 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   float *qk_prods_cpu = download_tensor<float>(
       m->qk_prods,
       TreeVerifyBatchConfig::MAX_NUM_TOKENS *
-          TreeVerifyBatchConfig::MAX_NUM_TOKENS * num_heads);
+          TreeVerifyBatchConfig::MAX_NUM_TOKENS * num_q_heads);
   assert(qk_prods_cpu != nullptr);
 
   float *qk_prods_softmax_cpu = download_tensor<float>(
       m->qk_prods_softmax,
       TreeVerifyBatchConfig::MAX_NUM_TOKENS *
-          TreeVerifyBatchConfig::MAX_NUM_TOKENS * num_heads);
+          TreeVerifyBatchConfig::MAX_NUM_TOKENS * num_q_heads);
   assert(qk_prods_softmax_cpu != nullptr);
 
   float *attn_heads_cpu = download_tensor<float>(
       m->attn_heads,
-      TreeVerifyBatchConfig::MAX_NUM_TOKENS * m->num_heads * m->vProjSize);
+      TreeVerifyBatchConfig::MAX_NUM_TOKENS * m->num_q_heads * m->vProjSize);
   assert(attn_heads_cpu != nullptr);
 
   //  ----------------------- Main loop (request by request) -------------------
@@ -1379,7 +1415,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
     // std::cout << "Q_req.sizes(): " << Q_req.sizes() << std::endl;
     assert(Q_req.sizes()[0] == m->qProjSize);
     assert(Q_req.sizes()[1] == num_new_tokens);
-    assert(Q_req.sizes()[2] == num_heads);
+    assert(Q_req.sizes()[2] == num_q_heads);
 
     /*printf("\n------------ QK multiplication (C++) -------------\n");
     printf("Request r=%lu. num_new_tokens: %lu, num_tokens_received_so_far: %li,
@@ -1404,7 +1440,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
         (1.0f / sqrt(m->kProjSize));
 
     // Set entries above diagonal to -inf to make attention causal.
-    for (int h = 0; h < num_heads; h++) {
+    for (int h = 0; h < num_q_heads; h++) {
       qk_products[r].index(
           {Slice(), Slice(num_tokens_received_so_far - num_new_tokens), h}) =
           qk_products[r]
@@ -1421,24 +1457,26 @@ void TreeIncMultiHeadSelfAttention::inference_task(
     qk_softmax[r] = torch::softmax(qk_products[r], -2);
     assert(qk_softmax[r].sizes()[0] == num_new_tokens);
     assert(qk_softmax[r].sizes()[1] == num_tokens_received_so_far);
-    assert(qk_softmax[r].sizes()[2] == m->num_heads);
+    assert(qk_softmax[r].sizes()[2] == m->num_q_heads);
 
     //  ------------------- Loading CUDA results for this step ---------------
     float *converted_qk_prod = (float *)calloc(
-        num_new_tokens * num_tokens_received_so_far * num_heads, sizeof(float));
+        num_new_tokens * num_tokens_received_so_far * num_q_heads,
+        sizeof(float));
     float *converted_qk_prod_softmax = (float *)calloc(
-        num_new_tokens * num_tokens_received_so_far * num_heads, sizeof(float));
+        num_new_tokens * num_tokens_received_so_far * num_q_heads,
+        sizeof(float));
     std::vector<int> converted_qk_prod_shape = {
-        (int)num_new_tokens, (int)num_tokens_received_so_far, (int)num_heads};
+        (int)num_new_tokens, (int)num_tokens_received_so_far, (int)num_q_heads};
 
     for (size_t i = 0;
-         i < num_new_tokens * num_tokens_received_so_far * num_heads;
+         i < num_new_tokens * num_tokens_received_so_far * num_q_heads;
          i++) {
       size_t new_t_idx = i % num_new_tokens;
       size_t all_t_idx = (i / num_new_tokens) % num_tokens_received_so_far;
       size_t head_idx = i / (num_new_tokens * num_tokens_received_so_far);
       assert(new_t_idx < num_new_tokens &&
-             all_t_idx < num_tokens_received_so_far && head_idx < num_heads);
+             all_t_idx < num_tokens_received_so_far && head_idx < num_q_heads);
       set_value_row_major(converted_qk_prod,
                           converted_qk_prod_shape,
                           {(int)new_t_idx, (int)all_t_idx, (int)head_idx},
@@ -1450,34 +1488,34 @@ void TreeIncMultiHeadSelfAttention::inference_task(
     }
     torch::Tensor qk_prods_cuda = torch::from_blob(
         converted_qk_prod,
-        {(int64_t)num_new_tokens, num_tokens_received_so_far, num_heads},
+        {(int64_t)num_new_tokens, num_tokens_received_so_far, num_q_heads},
         torch::kFloat32);
     torch::Tensor qk_prods_softmax_cuda = torch::from_blob(
         converted_qk_prod_softmax,
-        {(int64_t)num_new_tokens, num_tokens_received_so_far, num_heads},
+        {(int64_t)num_new_tokens, num_tokens_received_so_far, num_q_heads},
         torch::kFloat32);
 
     //  ------------------- Comparing C++ & CUDA results ------------------
     /* std::cout << "C++:" <<std::endl;
-    for (int h=0; h<num_heads; h++) {
+    for (int h=0; h<num_q_heads; h++) {
       std::cout << qk_products[r].index({Slice(), Slice(), h}) << std::endl;
     }
     std::cout << "CUDA:" <<std::endl;
-    for (int h=0; h<num_heads; h++) {
+    for (int h=0; h<num_q_heads; h++) {
       std::cout << qk_prods_cuda.index({Slice(), Slice(), h}) << std::endl;
     } */
     /* //
     std::cout << "C++:" <<std::endl;
-    for (int h=0; h<num_heads; h++) {
+    for (int h=0; h<num_q_heads; h++) {
       std::cout << qk_softmax[r].index({Slice(), Slice(), h}) << std::endl;
     }
     std::cout << "CUDA:" <<std::endl;
-    for (int h=0; h<num_heads; h++) {
+    for (int h=0; h<num_q_heads; h++) {
       std::cout << qk_prods_softmax_cuda.index({Slice(), Slice(), h}) <<
     std::endl;
     } */
     // std::cout << "C++ tril:" <<std::endl;
-    // for (int h=0; h<num_heads; h++) {
+    // for (int h=0; h<num_q_heads; h++) {
     //   std::cout << qk_products[r].tril().index({Slice(), Slice(), h}) <<
     //   std::endl;
     // }
@@ -1496,7 +1534,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
             .sizes()[1] == num_tokens_received_so_far);
     assert(
         V_t.index({Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})
-            .sizes()[2] == m->num_heads);
+            .sizes()[2] == m->num_q_heads);
     attn_heads[r] = torch::einsum(
         "ijk,ljk->ilk",
         {qk_softmax[r],
@@ -1504,33 +1542,33 @@ void TreeIncMultiHeadSelfAttention::inference_task(
              {Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})});
     assert(attn_heads[r].sizes()[0] == num_new_tokens);
     assert(attn_heads[r].sizes()[1] == m->vProjSize);
-    assert(attn_heads[r].sizes()[2] == m->num_heads);
+    assert(attn_heads[r].sizes()[2] == m->num_q_heads);
 
     //  ------------------- Loading CUDA results for this step  ---------------
-    float converted_attn_heads_cpu[num_new_tokens][m->vProjSize][m->num_heads] =
-        {0};
-    for (int i = 0; i < num_new_tokens * m->vProjSize * m->num_heads; i++) {
+    float converted_attn_heads_cpu[num_new_tokens][m->vProjSize]
+                                  [m->num_q_heads] = {0};
+    for (int i = 0; i < num_new_tokens * m->vProjSize * m->num_q_heads; i++) {
       int token_ix = i % num_new_tokens;
       int vproj_idx = (i / num_new_tokens) % m->vProjSize;
       int head_idx = i / (num_new_tokens * m->vProjSize);
       assert(token_ix < num_new_tokens && vproj_idx < m->vProjSize &&
-             head_idx < m->num_heads);
+             head_idx < m->num_q_heads);
       converted_attn_heads_cpu[token_ix][vproj_idx][head_idx] =
-          attn_heads_cpu[r_first_idx[r] * m->vProjSize * m->num_heads + i];
+          attn_heads_cpu[r_first_idx[r] * m->vProjSize * m->num_q_heads + i];
     }
-    torch::Tensor converted_attn_heads_cuda =
-        torch::from_blob(converted_attn_heads_cpu,
-                         {(int64_t)num_new_tokens, m->vProjSize, m->num_heads},
-                         torch::kFloat32);
+    torch::Tensor converted_attn_heads_cuda = torch::from_blob(
+        converted_attn_heads_cpu,
+        {(int64_t)num_new_tokens, m->vProjSize, m->num_q_heads},
+        torch::kFloat32);
 
     //  -------------------- Comparing C++ & CUDA results -------------------
     /* std::cout << "CUDA attn head for req " << r << ":" <<std::endl;
-    for (int h=0; h<m->num_heads; h++) {
+    for (int h=0; h<m->num_q_heads; h++) {
       std::cout << converted_attn_heads_cuda.index({Slice(), Slice(), h}) <<
     std::endl;
     }
     std::cout << "C++ attn head for req " << r << ":" <<std::endl;
-    for (int h=0; h<m->num_heads; h++) {
+    for (int h=0; h<m->num_q_heads; h++) {
       std::cout << attn_heads[r].index({Slice(), Slice(), h}) << std::endl;
     } */
     assert(torch::allclose(
@@ -1545,7 +1583,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
 
     // increment main loop's auxiliary index
     qk_prods_cpu_offset +=
-        num_new_tokens * num_tokens_received_so_far * num_heads;
+        num_new_tokens * num_tokens_received_so_far * num_q_heads;
   }
 
   //  ----------------------- Comparing C++ & CUDA results ---------------------
@@ -1594,7 +1632,7 @@ bool TreeIncMultiHeadSelfAttention::get_int_parameter(PMParameter para,
                                                       int *value) const {
   switch (para) {
     case PM_NUM_HEADS:
-      *value = num_heads;
+      *value = num_q_heads;
       return true;
     default:
       return Op::get_int_parameter(para, value);
@@ -1609,7 +1647,7 @@ bool TreeIncMultiHeadSelfAttention::measure_operator_cost(
 bool operator==(TreeIncMultiHeadSelfAttentionParams const &lhs,
                 TreeIncMultiHeadSelfAttentionParams const &rhs) {
   return lhs.layer_guid == rhs.layer_guid && lhs.embed_dim == rhs.embed_dim &&
-         lhs.num_heads == rhs.num_heads && lhs.kdim == rhs.kdim &&
+         lhs.num_q_heads == rhs.num_q_heads && lhs.kdim == rhs.kdim &&
          lhs.vdim == rhs.vdim && lhs.dropout == rhs.dropout &&
          lhs.bias == rhs.bias && lhs.add_bias_kv == rhs.add_bias_kv &&
          lhs.add_zero_attn == rhs.add_zero_attn &&
@@ -1624,7 +1662,7 @@ TreeIncMultiHeadSelfAttentionParams
   TreeIncMultiHeadSelfAttentionParams params;
   params.layer_guid = this->layer_guid;
   params.embed_dim = this->oProjSize;
-  params.num_heads = this->num_heads;
+  params.num_q_heads = this->num_q_heads;
   params.num_kv_heads = this->num_kv_heads;
   params.kdim = this->kProjSize;
   params.vdim = this->vProjSize;
@@ -1648,7 +1686,7 @@ size_t hash<FlexFlow::TreeIncMultiHeadSelfAttentionParams>::operator()(
   size_t key = 0;
   hash_combine(key, params.layer_guid.id);
   hash_combine(key, params.embed_dim);
-  hash_combine(key, params.num_heads);
+  hash_combine(key, params.num_q_heads);
   hash_combine(key, params.num_kv_heads);
   hash_combine(key, params.kdim);
   hash_combine(key, params.vdim);
diff --git a/src/ops/tree_inc_multihead_self_attention.cpp b/src/ops/tree_inc_multihead_self_attention.cpp
index 9927ef7af0..a20077efb4 100644
--- a/src/ops/tree_inc_multihead_self_attention.cpp
+++ b/src/ops/tree_inc_multihead_self_attention.cpp
@@ -64,7 +64,7 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
     GenericTensorAccessorR const &weight,
     MemoryAllocator &gpu_mem_allocator,
     int num_samples,
-    int _num_heads,
+    int _num_q_heads,
     int _num_kv_heads)
     : IncMultiHeadSelfAttentionMeta(handler,
                                     TREE_VERIFY_MODE,
@@ -85,9 +85,9 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
                                     weight,
                                     gpu_mem_allocator,
                                     num_samples,
-                                    attn->num_heads,
+                                    attn->num_q_heads,
                                     attn->num_kv_heads,
-                                    _num_heads,
+                                    _num_q_heads,
                                     _num_kv_heads,
                                     attn->quantization_type,
                                     attn->offload),
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index c19f4f37b3..69f085d3eb 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -42,7 +42,7 @@ __global__ void commit_tokens_kernel(
     int vProjSize,
     int num_tokens_to_commit,
     int num_active_tokens_in_last_batch,
-    int num_heads,
+    int num_q_heads,
     int num_kv_heads,
     int max_seq_len) {
 
@@ -60,7 +60,8 @@ __global__ void commit_tokens_kernel(
     int token_idx_in_last_batch = committedTokenInfos[token_pos].token_index;
     assert(token_idx_in_last_batch < num_active_tokens_in_last_batch);
 
-    int q_array_size = qProjSize * num_active_tokens_in_last_batch * num_heads;
+    int q_array_size =
+        qProjSize * num_active_tokens_in_last_batch * num_q_heads;
     int k_array_size =
         kProjSize * num_active_tokens_in_last_batch * num_kv_heads;
 
@@ -99,7 +100,7 @@ void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
         m->vProjSize,
         num_tokens_to_commit,
         m->num_active_tokens, // number of active tokens in previous batch
-        m->num_heads,
+        m->num_q_heads,
         m->num_kv_heads,
         BatchConfig::MAX_SEQ_LENGTH);
   }
@@ -117,13 +118,13 @@ __global__ void update_tree_branch_kv_cache(
     int num_tokens_in_branch,
     int processed_tokens_in_batch,
     int total_tokens_in_batch,
-    int num_heads,
+    int num_q_heads,
     int num_kv_heads,
     int max_seq_len) {
   CUDA_KERNEL_LOOP(
       i, num_tokens_in_branch * (kProjSize + vProjSize) * num_kv_heads) {
 
-    int q_array_size = qProjSize * total_tokens_in_batch * num_heads;
+    int q_array_size = qProjSize * total_tokens_in_batch * num_q_heads;
     int k_array_size = kProjSize * total_tokens_in_batch * num_kv_heads;
 
     bool k_cache = i < (num_tokens_in_branch * kProjSize * num_kv_heads);
@@ -155,9 +156,9 @@ template <typename DT>
 __global__ void tree_fill_entries_above_diagonal(DT *matrix,
                                                  size_t new_tokens,
                                                  size_t total_tokens_in_request,
-                                                 size_t num_heads,
+                                                 size_t num_q_heads,
                                                  DT value) {
-  CUDA_KERNEL_LOOP(i, new_tokens * total_tokens_in_request * num_heads) {
+  CUDA_KERNEL_LOOP(i, new_tokens * total_tokens_in_request * num_q_heads) {
     // size_t head_idx = i / (new_tokens * total_tokens_in_request);
     size_t src_idx = (i / new_tokens) % total_tokens_in_request;
     size_t dst_idx = i % new_tokens + total_tokens_in_request - new_tokens;
@@ -234,7 +235,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
             num_new_tokens,            // num_tokens_in_branch
             processed_tokens_in_batch, // num_processed_tokens_in_batch
             m->num_active_tokens,      // total_tokens_in_batch
-            m->num_heads,
+            m->num_q_heads,
             m->num_kv_heads,
             BatchConfig::MAX_SEQ_LENGTH);
       }
@@ -263,7 +264,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       // To get C, skip over QK^T products from previous requests
       DT *C = static_cast<DT *>(m->qk_prods);
 
-      if (m->num_heads == m->num_kv_heads) {
+      if (m->num_q_heads == m->num_kv_heads) {
         checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                              CUBLAS_OP_T,
                                              CUBLAS_OP_N,
@@ -284,12 +285,12 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                                              cublas_data_type,
                                              ldc,
                                              strideC,
-                                             m->num_heads,
+                                             m->num_q_heads,
                                              compute_type,
                                              CUBLAS_GEMM_DEFAULT_TENSOR_OP));
       } else {
         strideB = 0;
-        int one_step_heads = m->num_heads / m->num_kv_heads;
+        int one_step_heads = m->num_q_heads / m->num_kv_heads;
         for (int step = 0; step < m->num_kv_heads; step++) {
           checkCUDA(
               cublasGemmStridedBatchedEx(m->handle.blas,
@@ -323,7 +324,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       assert(num_new_tokens <= total_tokens_in_request);
       if (num_new_tokens > 1) {
         size_t parallelism =
-            m->num_heads * num_new_tokens * total_tokens_in_request;
+            m->num_q_heads * num_new_tokens * total_tokens_in_request;
         tree_fill_entries_above_diagonal<<<GET_BLOCKS(parallelism),
                                            min((size_t)CUDA_NUM_THREADS,
                                                parallelism),
@@ -332,7 +333,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
             C,
             num_new_tokens,
             total_tokens_in_request,
-            m->num_heads,
+            m->num_q_heads,
             static_cast<DT>(-INFINITY));
       }
       // Compute Softmax(QK^T/sqrt(d_k))
@@ -345,7 +346,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       // with no padding between images, feature maps, rows, and columns; the
       // columns are the inner dimension and the images are the outermost
       // dimension.
-      int n_param = m->num_heads;
+      int n_param = m->num_q_heads;
       int c_param = total_tokens_in_request;
       int h_param = 1;
       int w_param = num_new_tokens;
@@ -389,9 +390,9 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
       // requests
       C = static_cast<DT *>(m->attn_heads) +
-          processed_tokens_in_batch * m->num_heads * m->vProjSize;
+          processed_tokens_in_batch * m->num_q_heads * m->vProjSize;
 
-      if (m->num_heads == m->num_kv_heads) {
+      if (m->num_q_heads == m->num_kv_heads) {
         checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                              CUBLAS_OP_N,
                                              CUBLAS_OP_T,
@@ -412,11 +413,11 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                                              cublas_data_type,
                                              ldc,
                                              strideC,
-                                             m->num_heads,
+                                             m->num_q_heads,
                                              compute_type,
                                              CUBLAS_GEMM_DEFAULT_TENSOR_OP));
       } else {
-        int one_step_heads = m->num_heads / m->num_kv_heads;
+        int one_step_heads = m->num_q_heads / m->num_kv_heads;
         strideB = 0;
         for (int step = 0; step < m->num_kv_heads; step++) {
           checkCUDA(
@@ -449,10 +450,10 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       // Project to output, save result directly on output tensor
       alpha = 1.0f, beta = 0.0f;
       m_ = m->oProjSize;
-      k = m->vProjSize * m->num_heads;
+      k = m->vProjSize * m->num_q_heads;
       n = num_new_tokens;
       lda = k, ldb = n, ldc = m_;
-      A = weight_ptr + m->qSize * (m->qProjSize * m->num_heads +
+      A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
                                    m->kProjSize * m->num_kv_heads +
                                    m->vProjSize * m->num_kv_heads);
       B = C;
@@ -486,7 +487,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
   }
   if (*m->bias && shard_id == 0) {
     int parallelism = m->oProjSize * processed_tokens_in_batch;
-    int qkv_weight_size = m->qProjSize * m->global_num_heads +
+    int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
                           m->kProjSize * m->global_num_kv_heads +
                           m->vProjSize * m->global_num_kv_heads;
     apply_proj_bias_w<<<GET_BLOCKS(parallelism),
@@ -660,7 +661,7 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
     GenericTensorAccessorR const &weight,
     MemoryAllocator &gpu_mem_allocator,
     int num_samples,
-    int _num_heads,
+    int _num_q_heads,
     int _num_kv_heads)
     : IncMultiHeadSelfAttentionMeta(handler,
                                     TREE_VERIFY_MODE,
@@ -681,9 +682,9 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
                                     weight,
                                     gpu_mem_allocator,
                                     num_samples,
-                                    attn->num_heads,
+                                    attn->num_q_heads,
                                     attn->num_kv_heads,
-                                    _num_heads,
+                                    _num_q_heads,
                                     _num_kv_heads,
                                     attn->quantization_type,
                                     attn->offload),
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index a3a9e5c4d9..f348ca9016 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -2312,7 +2312,7 @@ GraphOptimalViewSerialized
         sez.serialize(attn->layer_guid.id);
         sez.serialize(attn->layer_guid.transformer_layer_id);
         sez.serialize(attn->oProjSize);
-        sez.serialize(attn->num_heads);
+        sez.serialize(attn->num_q_heads);
         sez.serialize(attn->qProjSize);
         sez.serialize(attn->vProjSize);
         sez.serialize(attn->dropout);
@@ -2335,7 +2335,7 @@ GraphOptimalViewSerialized
         sez.serialize(attn->layer_guid.id);
         sez.serialize(attn->layer_guid.transformer_layer_id);
         sez.serialize(attn->oProjSize);
-        sez.serialize(attn->num_heads);
+        sez.serialize(attn->num_q_heads);
         sez.serialize(attn->qProjSize);
         sez.serialize(attn->vProjSize);
         sez.serialize(attn->dropout);
@@ -2355,7 +2355,7 @@ GraphOptimalViewSerialized
         sez.serialize(attn->layer_guid.id);
         sez.serialize(attn->layer_guid.transformer_layer_id);
         sez.serialize(attn->oProjSize);
-        sez.serialize(attn->num_heads);
+        sez.serialize(attn->num_q_heads);
         sez.serialize(attn->qProjSize);
         sez.serialize(attn->vProjSize);
         sez.serialize(attn->dropout);
@@ -2736,7 +2736,7 @@ void FFModel::deserialize_graph_optimal_view(
       }
       case OP_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(num_inputs == 1);
-        int embed_dim, num_heads, k_dim, v_dim, num_kv_heads,
+        int embed_dim, num_q_heads, k_dim, v_dim, num_kv_heads,
             tensor_parallelism_degree;
         float dropout, scaling_factor;
         bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
@@ -2747,7 +2747,7 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(transformer_layer_id);
         LayerID layer_guid(id, transformer_layer_id);
         dez.deserialize(embed_dim);
-        dez.deserialize(num_heads);
+        dez.deserialize(num_q_heads);
         dez.deserialize(k_dim);
         dez.deserialize(v_dim);
         dez.deserialize(dropout);
@@ -2765,7 +2765,7 @@ void FFModel::deserialize_graph_optimal_view(
 
         IncMultiHeadSelfAttentionParams params;
         params.embed_dim = embed_dim;
-        params.num_heads = num_heads;
+        params.num_q_heads = num_q_heads;
         params.kdim = k_dim;
         params.vdim = v_dim;
         params.dropout = dropout;
@@ -2786,7 +2786,7 @@ void FFModel::deserialize_graph_optimal_view(
       }
       case OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(num_inputs == 1);
-        int embed_dim, num_heads, k_dim, v_dim, num_kv_heads;
+        int embed_dim, num_q_heads, k_dim, v_dim, num_kv_heads;
         float dropout, scaling_factor;
         bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
             scaling_query, qk_prod_scaling;
@@ -2795,7 +2795,7 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(transformer_layer_id);
         LayerID layer_guid(id, transformer_layer_id);
         dez.deserialize(embed_dim);
-        dez.deserialize(num_heads);
+        dez.deserialize(num_q_heads);
         dez.deserialize(k_dim);
         dez.deserialize(v_dim);
         dez.deserialize(dropout);
@@ -2810,7 +2810,7 @@ void FFModel::deserialize_graph_optimal_view(
 
         SpecIncMultiHeadSelfAttentionParams params;
         params.embed_dim = embed_dim;
-        params.num_heads = num_heads;
+        params.num_q_heads = num_q_heads;
         params.kdim = k_dim;
         params.vdim = v_dim;
         params.dropout = dropout;
@@ -2829,7 +2829,7 @@ void FFModel::deserialize_graph_optimal_view(
       }
       case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(num_inputs == 1);
-        int embed_dim, num_heads, k_dim, v_dim, num_kv_heads,
+        int embed_dim, num_q_heads, k_dim, v_dim, num_kv_heads,
             tensor_parallelism_degree;
         float dropout, scaling_factor;
         bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
@@ -2840,7 +2840,7 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(transformer_layer_id);
         LayerID layer_guid(id, transformer_layer_id);
         dez.deserialize(embed_dim);
-        dez.deserialize(num_heads);
+        dez.deserialize(num_q_heads);
         dez.deserialize(k_dim);
         dez.deserialize(v_dim);
         dez.deserialize(dropout);
@@ -2858,7 +2858,7 @@ void FFModel::deserialize_graph_optimal_view(
 
         TreeIncMultiHeadSelfAttentionParams params;
         params.embed_dim = embed_dim;
-        params.num_heads = num_heads;
+        params.num_q_heads = num_q_heads;
         params.kdim = k_dim;
         params.vdim = v_dim;
         params.dropout = dropout;

From fafbbc2ff5f6d16fed5c1a9350c002b1a6f3a8f8 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 4 Aug 2023 19:34:53 -0400
Subject: [PATCH 191/344] Cleanup (#914)

---
 CMakeLists.txt                                |   5 -
 examples/cpp/inference/.gitignore             |   1 -
 examples/cpp/inference/data_generator.cc      | 165 -----------
 examples/cpp/inference/data_generator.cpp     |  80 ------
 examples/cpp/inference/data_generator.h       |  76 ------
 examples/cpp/inference/dataloader.cc          | 218 ---------------
 examples/cpp/inference/dataloader.cu          | 136 ---------
 examples/cpp/inference/dataloader.h           |  68 -----
 examples/cpp/inference/inference_config.h     |  79 ------
 .../mixture_of_experts/CMakeLists.txt         |  23 --
 .../cpp/inference/mixture_of_experts/Makefile |  35 ---
 .../cpp/inference/mixture_of_experts/moe.cc   | 257 ------------------
 .../cpp/inference/mixture_of_experts/moe.h    |  43 ---
 .../cpp/inference/transformers/CMakeLists.txt |  23 --
 .../inference/transformers/transformers.cc    | 236 ----------------
 .../cpp/inference/transformers/transformers.h |  25 --
 include/flexflow/batch_config.h               |  13 -
 include/flexflow/request_manager.h            |   2 -
 src/runtime/batch_config.cc                   |  91 -------
 src/runtime/inference_manager.cc              |  34 ---
 20 files changed, 1610 deletions(-)
 delete mode 100644 examples/cpp/inference/.gitignore
 delete mode 100644 examples/cpp/inference/data_generator.cc
 delete mode 100644 examples/cpp/inference/data_generator.cpp
 delete mode 100644 examples/cpp/inference/data_generator.h
 delete mode 100644 examples/cpp/inference/dataloader.cc
 delete mode 100644 examples/cpp/inference/dataloader.cu
 delete mode 100644 examples/cpp/inference/dataloader.h
 delete mode 100644 examples/cpp/inference/inference_config.h
 delete mode 100644 examples/cpp/inference/mixture_of_experts/CMakeLists.txt
 delete mode 100644 examples/cpp/inference/mixture_of_experts/Makefile
 delete mode 100644 examples/cpp/inference/mixture_of_experts/moe.cc
 delete mode 100644 examples/cpp/inference/mixture_of_experts/moe.h
 delete mode 100644 examples/cpp/inference/transformers/CMakeLists.txt
 delete mode 100644 examples/cpp/inference/transformers/transformers.cc
 delete mode 100644 examples/cpp/inference/transformers/transformers.h

diff --git a/CMakeLists.txt b/CMakeLists.txt
index b35fb1613d..a5852406a4 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -593,11 +593,6 @@ if(FF_BUILD_MOE OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(examples/cpp/mixture_of_experts)
 endif()
 
-if(FF_BUILD_MOE OR FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/inference/mixture_of_experts)
-  add_subdirectory(examples/cpp/inference/transformers)
-endif()
-
 if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
   add_subdirectory(inference/spec_infer)
   add_subdirectory(inference/incr_decoding)
diff --git a/examples/cpp/inference/.gitignore b/examples/cpp/inference/.gitignore
deleted file mode 100644
index 05424f2a4c..0000000000
--- a/examples/cpp/inference/.gitignore
+++ /dev/null
@@ -1 +0,0 @@
-weights
diff --git a/examples/cpp/inference/data_generator.cc b/examples/cpp/inference/data_generator.cc
deleted file mode 100644
index 9d8fe1b7be..0000000000
--- a/examples/cpp/inference/data_generator.cc
+++ /dev/null
@@ -1,165 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "data_generator.h"
-#include "flexflow/batch_config.h"
-#include <algorithm>
-#include <iostream>
-#include <vector>
-using namespace std;
-using namespace FlexFlow;
-
-DataGenerator::DataGenerator(size_t _num_requests,
-                             size_t _vocab_size,
-                             size_t _min_input_tokens,
-                             size_t _max_input_tokens,
-                             size_t _min_tokens_to_generate,
-                             size_t _max_tokens_to_generate,
-                             bool _poisson_distr,
-                             double _lambda)
-    : num_requests(_num_requests), vocab_size(_vocab_size),
-      min_input_tokens(_min_input_tokens), max_input_tokens(_max_input_tokens),
-      min_tokens_to_generate(_min_tokens_to_generate),
-      max_tokens_to_generate(_max_tokens_to_generate),
-      poisson_distr(_poisson_distr), lambda(_lambda), timer_started(false) {
-  assert(max_input_tokens >= min_input_tokens);
-  assert(max_tokens_to_generate >= min_tokens_to_generate);
-  assert(max_input_tokens + max_tokens_to_generate <=
-         BatchConfig::MAX_SEQ_LENGTH);
-  generate_requests_meta();
-};
-
-// generate each request's arrival time and sequence length
-void DataGenerator::generate_requests_meta() {
-  random_device rnd1, rnd2, rnd3;
-  mt19937 gen1(rnd1()), gen2(rnd2()), gen3(rnd3());
-  // set up a uniform number generator with range [0,1) (in seconds) for the
-  // arrival times
-  uniform_real_distribution<double> dist1{0, 1.0};
-  double cur_arrival = 0; // assume first request comes in at time 0
-  // set up a uniform number generator for the initial/generated sequence length
-  uniform_int_distribution<unsigned long> dist2{min_input_tokens,
-                                                max_input_tokens};
-  uniform_int_distribution<unsigned long> dist3{min_tokens_to_generate,
-                                                max_tokens_to_generate};
-  size_t cur_seq_len = dist2(gen2);
-  size_t tokens_to_generate = dist3(gen3);
-
-  for (size_t i = 0; i < num_requests; i++) {
-    arrivals.push_back(cur_arrival);
-    if (poisson_distr) {
-      double u = dist1(gen1);
-      double interval = -(1 / lambda) * log(1 - u) * 1000;
-      cur_arrival += interval;
-    } else {
-      cur_arrival += (1000 / lambda);
-    }
-    seq_lengths.push_back(std::make_pair(cur_seq_len, tokens_to_generate));
-    cur_seq_len = dist2(gen2);
-    tokens_to_generate = dist3(gen3);
-  }
-  // cout << "Arrivals : [";
-  // copy(arrivals.begin(), arrivals.end(), ostream_iterator<int>(cout, " "));
-  // cout << "]" << endl;
-};
-
-void DataGenerator::generate_requests(int *req_ptr) {
-  assert(req_ptr != nullptr);
-  /* for (size_t i=0; i<num_requests; i++) {
-    for (size_t j=0; j<max_sequence_length; j++) {
-      for (size_t k=0; k<token_dim; k++) {
-        req_ptr[i * max_sequence_length + j] = (float)std::rand()/RAND_MAX;
-      }
-    }
-  } */
-  // faster generation assuming req_ptr points to a tensor with contiguous
-  // memory of size token_dim * max_input_tokens * num_requests, enough to
-  // contain all requests data
-  random_device rnd_device;
-  mt19937 mersenne_engine{rnd_device()};
-
-  // uniform_real_distribution<float> float_dist{0, 1.0};
-  //  auto gen = [&float_dist, &mersenne_engine]() {
-  //    return float_dist(mersenne_engine);
-  //  };
-  std::uniform_int_distribution<int> int_dist(0, vocab_size - 1);
-  auto gen = [&int_dist, &mersenne_engine]() {
-    return int_dist(mersenne_engine);
-  };
-  std::generate(req_ptr, req_ptr + max_input_tokens * num_requests, gen);
-};
-
-void DataGenerator::start_timer(void) {
-  arrivals_ptr = arrivals.begin();
-  start_time = Clock::now();
-  timer_started = true;
-};
-
-// In non-incremental mode, the number of requests we want is limited by the
-// tensor's batch size. As long as each request has a length that is shorter
-// than the tensor's max sequence length, we do not need to impose any
-// additional requirement on the max number of tokens across requests. We can
-// thus pass max_tokens = max_requests * tensor max sequence length as a
-// placeholder. In incremental mode, the max number of requests is only limited
-// by the BatchConfig request capacity (for storing each request's metadata),
-// whereas the total number number of tokens across requests will be limited by
-// the tensor's batch_size * sequence length.
-std::pair<size_t, size_t> DataGenerator::get_requests(size_t max_requests,
-                                                      size_t max_tokens) {
-  // printf("\nget_requests(%lu, %lu)\n\n", max_requests, max_tokens);
-  if (!timer_started) {
-    std::cout << "Warning: tried to get number of requests before the timer "
-                 "was started."
-              << std::endl;
-    return std::make_pair(0, 0);
-  }
-  Clock::time_point cur_time = Clock::now();
-  size_t ms_from_start =
-      chrono::duration_cast<milliseconds>(cur_time - start_time).count();
-  std::vector<double>::iterator new_arrivals_ptr =
-      upper_bound(arrivals_ptr, arrivals.end(), ms_from_start);
-  // number of new requests received
-  size_t received_requests = 0;
-  // id of first received request
-  size_t first_request_guid = arrivals_ptr - arrivals.begin();
-  size_t new_tokens = 0;
-  for (size_t j = 0;
-       j < std::min((size_t)(new_arrivals_ptr - arrivals_ptr), max_requests) &&
-       new_tokens < max_tokens;
-       j++) {
-    if (seq_lengths[first_request_guid + j].first <= max_tokens - new_tokens) {
-      received_requests++;
-      new_tokens += seq_lengths[first_request_guid + j].first;
-    } else {
-      break;
-    }
-  }
-  std::advance(arrivals_ptr, received_requests);
-
-  /* if (received_requests > 0) {
-    std::cout << "received " << received_requests
-              << " request(s) by arrival time +" << ms_from_start << "ms"
-              << "\n";
-  } */
-
-  return std::make_pair(first_request_guid, received_requests);
-}
-
-std::pair<size_t, size_t> DataGenerator::get_request_length(size_t guid) {
-  assert(seq_lengths.size() >
-         guid); // make sure the guid is valid (seq_lengths has an entry for the
-                // sequence with given guid)
-  return seq_lengths[guid];
-}
diff --git a/examples/cpp/inference/data_generator.cpp b/examples/cpp/inference/data_generator.cpp
deleted file mode 100644
index 765e9813b9..0000000000
--- a/examples/cpp/inference/data_generator.cpp
+++ /dev/null
@@ -1,80 +0,0 @@
-//
-//  main.cpp
-//  dataloader
-//
-//  Created by User on 11/15/22.
-//
-
-#include "data_generator.h"
-#include <ctime>
-#include <iostream>
-#include <random>
-#include <unistd.h>
-using namespace std;
-
-// This is for testing the request generator standalone
-int main(int argc, char const *argv[]) {
-
-  cout << "Starting the Data DataGenerator!\n";
-
-  // DataGenerator parameters
-  size_t total_requests = 2560;
-  size_t vocab_size = 50257;
-  size_t max_sequence_length = 512 + 128;
-  bool use_poisson_distr = true;
-  // average number of request arrivals per second
-  double lambda = 250;
-
-  size_t min_input_tokens = 32, max_input_tokens = 512,
-         min_tokens_to_generate = 1, max_tokens_to_generate = 128;
-
-  int *requests =
-      (int *)calloc(max_sequence_length * total_requests, sizeof(int));
-
-  DataGenerator data_generator(total_requests,
-                               vocab_size,
-                               min_input_tokens,
-                               max_input_tokens,
-                               min_tokens_to_generate,
-                               max_tokens_to_generate,
-                               use_poisson_distr,
-                               lambda);
-  data_generator.generate_requests(requests);
-  data_generator.start_timer();
-
-  size_t received_requests = 0;
-  std::pair<size_t, size_t> reqs = data_generator.get_requests(0, 0);
-  size_t guid = reqs.first;
-  assert(reqs.second == 0);
-  this_thread::sleep_for(milliseconds(50));
-
-  reqs = data_generator.get_requests(2560, 2560 * (512));
-  received_requests += reqs.second;
-  std::cout << "t=0ms: received " << received_requests << std::endl;
-
-  this_thread::sleep_for(milliseconds(1200));
-  reqs = data_generator.get_requests(2560, 2560 * (512));
-  received_requests += reqs.second;
-  std::cout << "t=1200ms: received " << received_requests << std::endl;
-
-  this_thread::sleep_for(milliseconds(10));
-  reqs = data_generator.get_requests(2560, 2560 * (512));
-  received_requests += reqs.second;
-  std::cout << "t=1210ms: received " << received_requests << std::endl;
-
-  this_thread::sleep_for(milliseconds(4000));
-  reqs = data_generator.get_requests(2560, 2560 * (512));
-  received_requests += reqs.second;
-  std::cout << "t=5210ms: received " << received_requests << std::endl;
-  this_thread::sleep_for(milliseconds(5000));
-
-  reqs = data_generator.get_requests(2560, 2560 * (512));
-  received_requests += reqs.second;
-  std::cout << "t=10210ms: received " << received_requests << std::endl;
-
-  free(requests);
-
-  assert(received_requests == total_requests);
-
-  return 0;
-}
diff --git a/examples/cpp/inference/data_generator.h b/examples/cpp/inference/data_generator.h
deleted file mode 100644
index 3ba3007123..0000000000
--- a/examples/cpp/inference/data_generator.h
+++ /dev/null
@@ -1,76 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#pragma once
-
-#include <cassert>
-#include <chrono>
-#include <ctime>
-#include <iostream>
-#include <iterator>
-#include <math.h>
-#include <random>
-#include <thread>
-#include <unistd.h>
-
-using namespace std;
-
-typedef std::chrono::high_resolution_clock Clock;
-typedef std::chrono::milliseconds milliseconds;
-
-class DataGenerator {
-public:
-  DataGenerator(size_t _num_requests,
-                size_t _vocab_size,
-                size_t _min_input_tokens,
-                size_t _max_input_tokens,
-                size_t _min_tokens_to_generate,
-                size_t _max_tokens_to_generate,
-                bool _poisson_distr,
-                double _lambda);
-
-  // Generate random requests by filling each tensor with random tokens. For
-  // now, assume all requests have the same sequence length.
-  void generate_requests(int *req_ptr);
-  void start_timer(void);
-  // Get number of requests that have arrived since the last time this function
-  // was called
-  std::pair<size_t, size_t> get_requests(size_t max_requests,
-                                         size_t max_tokens);
-  std::pair<size_t, size_t> get_request_length(size_t guid);
-
-private:
-  // Compute the arrival times of each request and save them in the arrivals
-  // vector.
-  // void generate_arrival_times(void);
-  void generate_requests_meta();
-
-  size_t num_requests; // total number of requests
-  size_t vocab_size;   // number of words in the vocab
-  size_t min_input_tokens;
-  size_t max_input_tokens;
-  size_t min_tokens_to_generate;
-  size_t max_tokens_to_generate;
-  bool poisson_distr; // false implies uniform distribution
-  double lambda;      // mean #num of arrivals per sec
-  bool timer_started; // whether timer was initiated
-  // time when get_requests() is called for the first time
-  Clock::time_point start_time;
-  // arrival times (ms) generated based on distribution
-  std::vector<double> arrivals;
-  std::vector<double>::iterator arrivals_ptr;
-  // sequence lengths generated based on uniform distribution
-  std::vector<std::pair<size_t, size_t>> seq_lengths;
-};
diff --git a/examples/cpp/inference/dataloader.cc b/examples/cpp/inference/dataloader.cc
deleted file mode 100644
index ce49086a92..0000000000
--- a/examples/cpp/inference/dataloader.cc
+++ /dev/null
@@ -1,218 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "dataloader.h"
-#include "flexflow/inference.h"
-#include "inference_config.h"
-
-using namespace Legion;
-
-DataLoader::DataLoader(FFModel &ff,
-                       InferenceConfig const &inferenceConfig,
-                       DataGenerator &data_generator,
-                       std::vector<ParallelTensor> input) {
-  Context ctx = ff.config.lg_ctx;
-  Runtime *runtime = ff.config.lg_hlr;
-
-  assert(input.size() > 0);
-  int numdims = input[0]->num_dims;
-  for (int i = 1; i < input.size(); i++) {
-    assert(input[i]->num_dims == numdims);
-    for (int j = 0; j < numdims; j++) {
-      assert(input[i]->dims[j].size == input[0]->dims[j].size);
-      assert(input[i]->dims[j].degree == input[0]->dims[j].degree);
-      assert(input[i]->dims[j].parallel_idx == input[0]->dims[j].parallel_idx);
-    }
-  }
-
-  int replica_idx = numdims - 1;
-  int batch_idx = numdims - 2;
-  num_samples = inferenceConfig.total_requests;
-
-  // Create full input
-  {
-    batch_input = input;
-
-    ParallelDim dims[numdims];
-    for (int i = 0; i < numdims; i++) {
-      dims[i].size = input[0]->dims[i].size;
-      dims[i].degree = 1;
-      dims[i].parallel_idx = -1;
-      dims[i].is_replica_dim = input[0]->dims[i].is_replica_dim;
-      // Assume only the first dim can be the replica dim
-      assert(i == replica_idx || (!dims[i].is_replica_dim));
-    }
-    assert(dims[batch_idx].size == inferenceConfig.batch_size);
-    dims[batch_idx].size = num_samples;
-
-    full_input =
-        ff.create_parallel_tensor_legion_ordering(numdims, dims, DT_INT32);
-    ff.map_tensor(full_input, NULL /*parallel_op*/);
-  }
-
-  // Load entire dataset
-  // TODO: Use index launcher instead of task launcher
-  assert(full_input != nullptr && "full_input is nullptr");
-
-  DataLoaderInput dataloader_input = {inferenceConfig, data_generator};
-  DataLoaderInput const *ptr = &dataloader_input;
-
-  TaskLauncher launcher(CUSTOM_CPU_TASK_ID_1,
-                        TaskArgument(ptr, sizeof(DataLoaderInput)));
-  // regions[0]: full_input
-  launcher.add_region_requirement(RegionRequirement(full_input->region,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    full_input->region,
-                                                    MAP_TO_ZC_MEMORY));
-  launcher.add_field(0, FID_DATA);
-
-  runtime->execute_task(ctx, launcher);
-}
-
-void DataLoader::load_entire_dataset(Task const *task,
-                                     std::vector<PhysicalRegion> const &regions,
-                                     Context ctx,
-                                     Runtime *runtime) {
-  DataLoaderInput const input_struct = *((DataLoaderInput *)task->args);
-  InferenceConfig const &conf = input_struct._inferenceConfig;
-  DataGenerator &datagen = input_struct._data_generator;
-  assert(regions.size() == 1);
-  assert(task->regions.size() == regions.size());
-
-  // get input pointer
-  int *input_ptr = helperGetTensorPointerWO<int>(
-      regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  Domain input_domain = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  int input_dims = input_domain.get_dim();
-  for (int i = 0; i < input_dims; i++) {
-    int input_dim = input_domain.hi()[i] - input_domain.lo()[i] + 1;
-  }
-
-  if (conf.dataset_path.length() == 0) {
-    printf("Input dataset path is empty, using random input samples\n");
-    datagen.generate_requests(input_ptr);
-  } else {
-    // Load specific dataset
-  }
-}
-
-void DataLoader::next_batch(FFModel &ff,
-                            int bid,
-                            BatchConfig *bc,
-                            std::map<size_t, int> &batch_predictions,
-                            MachineView const *mv) {
-  size_t num_active_tokens = bc->num_active_tokens();
-  if (num_active_tokens == 0) {
-    return;
-  }
-  assert(bid < batch_input.size());
-  Context ctx = ff.config.lg_ctx;
-  Runtime *runtime = ff.config.lg_hlr;
-  // Load input
-  {
-    Domain domain =
-        runtime->get_index_space_domain(ctx, batch_input[bid]->parallel_is);
-    ArgumentMap argmap;
-    // No partitioning of the batch input token in inference mode
-    int input_dims = batch_input[bid]->num_dims;
-    for (int i = 0; i < input_dims; i++) {
-      assert(batch_input[bid]->dims[i].degree == 1 &&
-             "Dataloader does not support input token partitioning in "
-             "inference mode");
-    }
-    int batch_size = batch_input[bid]->dims[input_dims - 2].size;
-    int seq_len = batch_input[bid]->dims[input_dims - 3].size;
-
-    assert(ff.config.batchSize == batch_size &&
-           batch_size * seq_len >= num_active_tokens);
-
-    DataLoaderNextBatchInput next_batch_input = {bc, batch_predictions};
-    DataLoaderNextBatchInput const *ptr = &next_batch_input;
-    size_t next_batch_input_sz = sizeof(next_batch_input);
-    assert(ptr->prev_batch_preds.size() == batch_predictions.size());
-    MachineView const *view = mv ? mv : &batch_input[bid]->machine_view;
-    size_t machine_view_hash = view->hash();
-    IndexLauncher launcher(CUSTOM_GPU_TASK_ID_1,
-                           batch_input[bid]->parallel_is,
-                           TaskArgument(ptr, next_batch_input_sz),
-                           argmap,
-                           Predicate::TRUE_PRED,
-                           false /*must*/,
-                           0 /*mapper_id*/,
-                           machine_view_hash);
-    launcher.add_region_requirement(RegionRequirement(full_input->region,
-                                                      0 /*projection id*/,
-                                                      READ_ONLY,
-                                                      EXCLUSIVE,
-                                                      full_input->region,
-                                                      MAP_TO_ZC_MEMORY));
-    launcher.add_field(0, FID_DATA);
-    launcher.add_region_requirement(
-        RegionRequirement(batch_input[bid]->part,
-                          0 /*projection id*/,
-                          WRITE_ONLY,
-                          EXCLUSIVE,
-                          batch_input[bid]->region));
-    launcher.add_field(1, FID_DATA);
-    runtime->execute_index_space(ctx, launcher);
-  }
-}
-
-void DataLoader::store_outputs(BatchConfig *bc,
-                               InferenceResult const &ir,
-                               std::map<size_t, int> &batch_predictions) {
-  assert((bc->num_active_tokens() == 0) == (bc->num_active_requests() == 0));
-  if (bc->num_active_tokens() == 0) {
-    return;
-  }
-  // there is no num_samples, replace it with num_active_tokens
-  batch_predictions.clear();
-  for (size_t i = 0; i < bc->num_active_tokens(); i++) {
-    auto guid = bc->requestsInfo[bc->tokensInfo[i].request_index].request_guid;
-    if (i == bc->num_active_tokens() - 1 ||
-        guid != bc->requestsInfo[bc->tokensInfo[i + 1].request_index]
-                    .request_guid) {
-      if (outputs.find(guid) == outputs.end()) {
-        std::vector<int> v{ir.token_ids[i]};
-        outputs[guid] = v;
-      } else {
-        outputs[guid].push_back(ir.token_ids[i]);
-      }
-      batch_predictions[guid] = ir.token_ids[i];
-    }
-  }
-  assert(batch_predictions.size() == bc->num_active_requests());
-}
-
-void FlexFlow::register_custom_tasks() {
-  // Load entire dataset
-  {
-    TaskVariantRegistrar registrar(CUSTOM_CPU_TASK_ID_1, "Load Entire Dataset");
-    registrar.add_constraint(ProcessorConstraint(Processor::LOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<DataLoader::load_entire_dataset>(
-        registrar, "Load Entire Dataset Task");
-  }
-  // Load input
-  {
-    TaskVariantRegistrar registrar(CUSTOM_GPU_TASK_ID_1, "Load Inputs");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<DataLoader::load_input>(
-        registrar, "Load Input Task");
-  }
-}
diff --git a/examples/cpp/inference/dataloader.cu b/examples/cpp/inference/dataloader.cu
deleted file mode 100644
index 434dc337c9..0000000000
--- a/examples/cpp/inference/dataloader.cu
+++ /dev/null
@@ -1,136 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "dataloader.h"
-#include "flexflow/inference.h"
-#include "flexflow/request_manager.h"
-#include "flexflow/utils/cuda_helper.h"
-
-void DataLoader::load_input(Task const *task,
-                            std::vector<PhysicalRegion> const &regions,
-                            Context ctx,
-                            Runtime *runtime) {
-  assert(regions.size() == 2);
-  assert(task->regions.size() == 2);
-
-  DataLoaderNextBatchInput const input_struct =
-      *((DataLoaderNextBatchInput *)task->args);
-
-  BatchConfig *bc = input_struct.bc;
-  BatchConfig::PerRequestInfo *requestInfo = bc->requestsInfo;
-  BatchConfig::PerTokenInfo *tokensInfo = bc->tokensInfo;
-  std::map<size_t, int> const &prev_batch_preds = input_struct.prev_batch_preds;
-
-  if (bc->num_active_tokens() == 0) {
-    return;
-  }
-  int const *full_input_ptr = helperGetTensorPointerRO<int>(
-      regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  int *batch_input_ptr = helperGetTensorPointerWO<int>(
-      regions[1], task->regions[1], FID_DATA, ctx, runtime);
-
-  Domain full_input_domain = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  Domain batch_input_domain = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-
-  coord_t sequence_length =
-      batch_input_domain.hi()[0] - batch_input_domain.lo()[0] + 1;
-  coord_t batch_size =
-      batch_input_domain.hi()[1] - batch_input_domain.lo()[1] + 1;
-
-  coord_t full_input_sequence_length =
-      batch_input_domain.hi()[0] - batch_input_domain.lo()[0] + 1;
-  coord_t full_input_batch_size =
-      batch_input_domain.hi()[1] - batch_input_domain.lo()[1] + 1;
-
-  assert(sequence_length == full_input_sequence_length);
-  assert(batch_size <= full_input_batch_size);
-
-  // Currently assume continous indices
-  assert(bc->num_active_tokens() <= batch_size * sequence_length);
-  for (int i = 1; i < bc->num_active_tokens(); i++) {
-    auto prev_guid = requestInfo[tokensInfo[i - 1].request_index].request_guid;
-    auto guid = requestInfo[tokensInfo[i].request_index].request_guid;
-    if (guid == prev_guid) {
-      assert(tokensInfo[i].abs_depth_in_request ==
-             tokensInfo[i - 1].abs_depth_in_request + 1);
-    }
-  }
-  // keep things simple for now
-  assert(batch_input_domain.get_volume() == batch_size * sequence_length);
-
-  // pad inputs if needed (this is really only useful for debugging)
-  checkCUDA(cudaMemset(
-      batch_input_ptr, 0, batch_input_domain.get_volume() * sizeof(int)));
-
-  auto guid = requestInfo[tokensInfo[0].request_index].request_guid;
-  int start_idx = tokensInfo[0].abs_depth_in_request;
-  int dst_idx = 0;
-  int total_tokens = 0;
-
-  for (size_t i = 1; i <= bc->num_active_tokens(); i++) {
-    auto current_guid = requestInfo[tokensInfo[i].request_index].request_guid;
-    if (i == bc->num_active_tokens() || current_guid != guid) {
-
-      size_t tokens_to_copy =
-          (tokensInfo[i - 1].abs_depth_in_request - start_idx + 1);
-      assert(tokens_to_copy > 0);
-
-      int request_index = tokensInfo[i - 1].request_index;
-      int token_start_offset =
-          bc->requestsInfo[request_index].token_start_offset;
-      int num_processing_tokens =
-          bc->requestsInfo[request_index].num_tokens_in_batch;
-      if (tokens_to_copy > 1 || token_start_offset == 0) {
-        // initialization phase
-        assert(tokensInfo[i - 1].abs_depth_in_request <
-               (token_start_offset + num_processing_tokens));
-        int const *input_zc =
-            full_input_ptr + (guid * sequence_length) + start_idx;
-        int *dst_ptr = batch_input_ptr + dst_idx;
-        copy_kernel<<<GET_BLOCKS(tokens_to_copy), CUDA_NUM_THREADS>>>(
-            dst_ptr, input_zc, tokens_to_copy);
-      } else {
-        // incremental phase
-        assert(tokensInfo[i - 1].abs_depth_in_request >= token_start_offset);
-        assert(tokens_to_copy == 1);
-
-        assert(prev_batch_preds.find(guid) != prev_batch_preds.end());
-        int token = prev_batch_preds.at(guid);
-        int *dst_ptr = batch_input_ptr + dst_idx;
-        cudaMemcpy(dst_ptr,
-                   &token,
-                   sizeof(FlexFlow::RequestManager::TokenId),
-                   cudaMemcpyHostToDevice);
-      }
-      total_tokens += tokens_to_copy;
-
-      if (i < bc->num_active_tokens()) {
-        guid = bc->requestsInfo[bc->tokensInfo[i].request_index].request_guid;
-        start_idx = tokensInfo[i].abs_depth_in_request;
-      }
-      dst_idx = i;
-    }
-  }
-  assert(total_tokens == bc->num_active_tokens());
-  /*printf("token_dim: %lli, sequence_length: %lli, batch_size: %lli\n",
-  token_dim, sequence_length, batch_size); printf("total_tokens: %lu\n",
-  total_tokens); printf("guid: %lu\n", guid);
-  print_tensor<int>(batch_input_ptr,
-                      batch_input_domain.get_volume(),
-                      "[BatchInput]");*/
-  checkCUDA(cudaDeviceSynchronize());
-}
diff --git a/examples/cpp/inference/dataloader.h b/examples/cpp/inference/dataloader.h
deleted file mode 100644
index c77c70502a..0000000000
--- a/examples/cpp/inference/dataloader.h
+++ /dev/null
@@ -1,68 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-#pragma once
-
-#include "data_generator.h"
-#include "flexflow/batch_config.h"
-#include "flexflow/model.h"
-#include "inference_config.h"
-
-#include <cstdlib>
-#include <fstream>
-#include <iostream>
-#include <sstream>
-#include <string>
-#include <unistd.h>
-
-using namespace Legion;
-using namespace FlexFlow;
-
-class DataLoader {
-public:
-  DataLoader(FFModel &ff,
-             InferenceConfig const &inferenceConfig,
-             DataGenerator &data_generator,
-             std::vector<ParallelTensor> input);
-  static void load_input(Task const *task,
-                         std::vector<PhysicalRegion> const &regions,
-                         Context ctx,
-                         Runtime *runtime);
-  static void load_entire_dataset(Task const *task,
-                                  std::vector<PhysicalRegion> const &regions,
-                                  Context ctx,
-                                  Runtime *runtime);
-  void next_batch(FFModel &ff,
-                  int bid,
-                  BatchConfig *bc,
-                  std::map<size_t, int> &batch_predictions,
-                  MachineView const *mv = nullptr);
-  void store_outputs(BatchConfig *bc,
-                     InferenceResult const &ir,
-                     std::map<size_t, int> &batch_predictions);
-
-public:
-  size_t num_samples;
-  ParallelTensor full_input;
-  std::vector<ParallelTensor> batch_input;
-  std::map<size_t, std::vector<int>> outputs;
-  struct DataLoaderInput {
-    InferenceConfig const &_inferenceConfig;
-    DataGenerator &_data_generator;
-  };
-  struct DataLoaderNextBatchInput {
-    BatchConfig *bc;
-    std::map<size_t, int> const &prev_batch_preds;
-  };
-};
diff --git a/examples/cpp/inference/inference_config.h b/examples/cpp/inference/inference_config.h
deleted file mode 100644
index c6cdd5da6c..0000000000
--- a/examples/cpp/inference/inference_config.h
+++ /dev/null
@@ -1,79 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-#pragma once
-
-#include "flexflow/batch_config.h"
-#include <string>
-// #define MAX_SEQ_LEN 1024
-static int const MAX_SEQ_LEN = FlexFlow::BatchConfig::MAX_SEQ_LENGTH;
-#define BATCH_SIZE 16
-#define MNIST_DIMS 28 * 28
-#define DATA_DIM MNIST_DIMS
-// #define DATA_DIM 3
-
-struct InferenceConfig {
-  InferenceConfig(void) {
-    //----------------------- Input/output data ------------------------
-    token_dim = DATA_DIM;
-    sequence_length = MAX_SEQ_LEN;
-    batch_size = BATCH_SIZE;
-    out_dim = DATA_DIM;
-    num_labels = out_dim;
-    num_layers = 12;
-
-    vocab_size = 50257;
-    block_size = 1024;
-
-    //----------------------- Inference parameters ---------------------
-    // total number of requests processed as part of the simulation
-    total_requests = 2560;
-    poisson_distribution = true;
-    // average number of request arrivals per second
-    arrival_rate = 250;
-    num_inflight_batches = 4;
-    incremental_mode = true;
-    //----------------------- Rest of model parameters ------------------
-    hidden_size = DATA_DIM;
-    // Encoder layer
-    num_attention_heads = 16;
-    attention_kdim = attention_vdim = hidden_size / num_attention_heads;
-    num_encoder_layers = 12;
-  }
-
-  // Input/output data
-  int token_dim;
-  int sequence_length;
-  int batch_size;
-  int out_dim;
-  int num_labels;
-  int num_layers;
-
-  int vocab_size;
-  int block_size;
-
-  std::string dataset_path;
-  // Inference parameters
-  int total_requests;
-  bool poisson_distribution;
-  double arrival_rate;
-  int num_inflight_batches;
-  bool incremental_mode;
-  // Model parameters
-  int hidden_size;
-  int num_attention_heads;
-  int attention_kdim;
-  int attention_vdim;
-  int num_encoder_layers;
-};
diff --git a/examples/cpp/inference/mixture_of_experts/CMakeLists.txt b/examples/cpp/inference/mixture_of_experts/CMakeLists.txt
deleted file mode 100644
index b943623857..0000000000
--- a/examples/cpp/inference/mixture_of_experts/CMakeLists.txt
+++ /dev/null
@@ -1,23 +0,0 @@
-cmake_minimum_required(VERSION 3.10)
-
-project(FlexFlowExample_MoE)
-set(project_target inference_moe)
-
-set(CPU_SRC
-  ${FLEXFLOW_CPP_DRV_SRC}
-  moe.cc
-  ../dataloader.cc
-  ../data_generator.cc
-  ${FLEXFLOW_ROOT}/src/runtime/gpt_tokenizer.cc)
-
-set(GPU_SRC
-  ../dataloader.cu)
-
-cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
-target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
-target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/examples/cpp/inference)
-target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
-
-set(BIN_DEST "bin")
-install(TARGETS ${project_target} DESTINATION ${BIN_DEST})
-
diff --git a/examples/cpp/inference/mixture_of_experts/Makefile b/examples/cpp/inference/mixture_of_experts/Makefile
deleted file mode 100644
index 15fbf25b9a..0000000000
--- a/examples/cpp/inference/mixture_of_experts/Makefile
+++ /dev/null
@@ -1,35 +0,0 @@
-# Copyright 2020 Stanford University
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-#     http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-#
-
-# Flags for directing the runtime makefile what to include
-DEBUG           ?= 1		# Include debugging symbols
-MAX_DIM         ?= 4		# Maximum number of dimensions
-OUTPUT_LEVEL    ?= LEVEL_DEBUG	# Compile time logging level
-USE_CUDA        ?= 1		# Include CUDA support (requires CUDA)
-USE_GASNET      ?= 0		# Include GASNet support (requires GASNet)
-USE_HDF         ?= 0		# Include HDF5 support (requires HDF5)
-ALT_MAPPERS     ?= 0		# Include alternative mappers (not recommended)
-
-# Put the binary file name here
-OUTFILE		?= inference_moe
-# List all the application source files here
-GEN_SRC		= moe.cc dataloader.cc ../data_generator.cc
-GEN_GPU_SRC	= dataloader.cu
-
-ifndef FF_HOME
-$(error FF_HOME variable is not defined, aborting build)
-endif
-
-include $(FF_HOME)/FlexFlow.mk
diff --git a/examples/cpp/inference/mixture_of_experts/moe.cc b/examples/cpp/inference/mixture_of_experts/moe.cc
deleted file mode 100644
index 4a5c33c9b0..0000000000
--- a/examples/cpp/inference/mixture_of_experts/moe.cc
+++ /dev/null
@@ -1,257 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "moe.h"
-#include "flexflow/inference.h"
-#include "flexflow/request_manager.h"
-#include <cstdlib>
-#include <fstream>
-#include <iostream>
-#include <sstream>
-#include <string>
-#include <unistd.h>
-
-using namespace Legion;
-
-LegionRuntime::Logger::Category log_app("MoE");
-
-void parse_input_args(char **argv, int argc, MoeConfig &config) {
-  for (int i = 1; i < argc; i++) {
-    if (!strcmp(argv[i], "--dataset")) {
-      config.dataset_path = std::string(argv[++i]);
-      continue;
-    }
-  }
-}
-
-Tensor create_moe(FFModel *model,
-                  MoeConfig const *moeConfig,
-                  Tensor const &input) {
-  // MoE model
-  Tensor gate_preds = model->dense(input, moeConfig->num_exp, AC_MODE_RELU);
-  Tensor topK_output[2];
-  model->top_k(gate_preds, topK_output, moeConfig->num_select, false);
-
-  assert(moeConfig->num_exp % moeConfig->experts_per_block == 0);
-  int nblocks = moeConfig->num_exp / moeConfig->experts_per_block;
-  Tensor exp_preds;
-  Tensor expert_block_inputs[3] = {input, topK_output[1], topK_output[0]};
-  for (int i = 0; i < nblocks /*number of experts layers*/; i++) {
-    Tensor block_preds =
-        model->experts(expert_block_inputs,
-                       moeConfig->experts_per_block,     /*number of experts*/
-                       moeConfig->experts_per_block * i, /*expert start index*/
-                       moeConfig->hidden_size,           /*output_size*/
-                       moeConfig->alpha);
-    assert(block_preds != nullptr);
-    if (i == 0) {
-      exp_preds = block_preds;
-    } else {
-      assert(exp_preds != nullptr);
-      model->add(exp_preds, block_preds, /*inplace_a*/ true);
-    }
-  }
-
-  // model->get_metrics();
-  return exp_preds;
-}
-
-Tensor create_moe_encoder(FFModel *model,
-                          MoeConfig const *moeConfig,
-                          Tensor const &input) {
-  std::vector<int> axes = {0, 1, 2};
-  Tensor x = input;
-  for (int i = 0; i < moeConfig->num_encoder_layers; i++) {
-    Tensor t = moeConfig->incremental_mode
-                   ? model->inc_multihead_self_attention(
-                         x,
-                         moeConfig->hidden_size,
-                         moeConfig->num_attention_heads,
-                         moeConfig->attention_kdim,
-                         moeConfig->attention_vdim)
-                   : model->multihead_attention(x,
-                                                x,
-                                                x,
-                                                moeConfig->hidden_size,
-                                                moeConfig->num_attention_heads,
-                                                moeConfig->attention_kdim,
-                                                moeConfig->attention_vdim);
-    x = model->layer_norm(model->add(t, x), axes, true, 1e-05);
-    x = model->layer_norm(
-        model->add(create_moe(model, moeConfig, x), x), axes, true, 1e-05);
-  }
-  return x;
-}
-
-void FlexFlow::top_level_task(Task const *task,
-                              std::vector<PhysicalRegion> const &regions,
-                              Context ctx,
-                              Runtime *runtime) {
-  //----------------------- Initial configurations ------------------------
-  MoeConfig moeConfig;
-  FFConfig ffConfig;
-  ffConfig.batchSize = moeConfig.batch_size;
-  {
-    InputArgs const &command_args = HighLevelRuntime::get_input_args();
-    char **argv = command_args.argv;
-    int argc = command_args.argc;
-    parse_input_args(argv, argc, moeConfig);
-    log_app.print("batchSize(%d) workersPerNodes(%d) numNodes(%d)",
-                  ffConfig.batchSize,
-                  ffConfig.workersPerNode,
-                  ffConfig.numNodes);
-  }
-  FFModel ff(ffConfig);
-
-  //----------------------- Create inputs --------------------------------
-  Tensor input;
-  {
-    int const dims[] = {ffConfig.batchSize, moeConfig.sequence_length};
-    input = ff.create_tensor<2>(dims, DT_INT32);
-  }
-  Tensor t = input;
-  Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
-  t = ff.embedding(t,
-                   moeConfig.vocab_size,
-                   moeConfig.token_dim,
-                   AGGR_MODE_NONE,
-                   DT_FLOAT,
-                   NULL,
-                   embed_init);
-
-  //----------------------- Define the model ------------------------------
-  t = create_moe_encoder(&ff, &moeConfig, t);
-  // Tensor t = create_moe(&ff, &moeConfig, input);
-  t = ff.dense(t, moeConfig.out_dim, AC_MODE_RELU);
-  t = ff.softmax(t);
-  // select most likely next token
-  Tensor output = ff.arg_top_k(t, /*k=*/1, /*sorted=*/false);
-
-  //------------------- Initialize the inference manager ------------------
-  InferenceManager im(ff.config, moeConfig.batch_size);
-  im.compile_model_and_allocate_buffer(&ff);
-  im.init_operators_inference(&ff);
-
-  //------------ Initialize the data loader and data generator ------------
-  /*size_t min_input_tokens = 32, max_input_tokens = 512,
-         min_tokens_to_generate = 1, max_tokens_to_generate = 128;*/
-  size_t min_input_tokens = 5, max_input_tokens = 10,
-         min_tokens_to_generate = 1,
-         max_tokens_to_generate = MAX_SEQ_LEN - max_input_tokens;
-  DataGenerator data_generator(moeConfig.total_requests,
-                               moeConfig.vocab_size,
-                               min_input_tokens,
-                               max_input_tokens,
-                               min_tokens_to_generate,
-                               max_tokens_to_generate,
-                               moeConfig.poisson_distribution,
-                               moeConfig.arrival_rate);
-  ParallelTensor input_pt;
-  ff.get_parallel_tensor_from_tensor(input, input_pt);
-  assert(im.tensor_buffer.find(input_pt) != im.tensor_buffer.end());
-  assert(im.tensor_buffer[input_pt].size() == ffConfig.data_parallelism_degree);
-  DataLoader data_loader(
-      ff, moeConfig, data_generator, im.tensor_buffer[input_pt]);
-
-  //----------------------- Start timer -----------------------------------
-  {
-    runtime->issue_execution_fence(ctx);
-    TimingLauncher timer(MEASURE_MICRO_SECONDS);
-    Future future = runtime->issue_timing_measurement(ctx, timer);
-    future.get_void_result();
-  }
-  double ts_start = Realm::Clock::current_time_in_microseconds();
-
-  //----------------------- Begin inference! -------------------------------
-  int index = 0;
-  int processed_requests = 0;
-  int num_devices = ffConfig.workersPerNode * ffConfig.numNodes;
-  data_generator.start_timer();
-  std::map<int, Future> future_handlers;
-  std::map<int, BatchConfig *> batch_configs;
-  std::pair<size_t, size_t> new_prompts;
-  BatchConfig *bc = nullptr;
-  std::map<size_t, int> batch_predictions[ffConfig.data_parallelism_degree];
-
-  assert(im.max_num_tokens_per_batch == moeConfig.batch_size);
-
-  // simulation loop. For deployment, we will use a while(true)
-  while (processed_requests < moeConfig.total_requests) {
-    for (int bid = 0; bid < ffConfig.data_parallelism_degree; bid++) {
-      size_t max_reqs, max_tkns;
-      if (future_handlers.find(bid) == future_handlers.end()) {
-        max_reqs = moeConfig.incremental_mode ? bc->MAX_NUM_REQUESTS
-                                              : im.max_num_tokens_per_batch;
-        max_tkns = moeConfig.sequence_length * moeConfig.batch_size;
-        new_prompts = data_generator.get_requests(max_reqs, max_tkns);
-        bc = new BatchConfig();
-      } else {
-        Future future = future_handlers[bid];
-        if (!future.is_ready(true /*subscribe*/)) {
-          continue;
-        }
-        InferenceResult ir = future.get_result<InferenceResult>();
-        bc = batch_configs[bid];
-        data_loader.store_outputs(bc, ir, batch_predictions[bid]);
-        processed_requests += bc->update_results(&ir);
-        max_reqs = moeConfig.incremental_mode
-                       ? bc->MAX_NUM_REQUESTS - bc->num_active_requests()
-                       : im.max_num_tokens_per_batch;
-        max_tkns = moeConfig.sequence_length * moeConfig.batch_size -
-                   (moeConfig.incremental_mode ? bc->num_active_tokens() : 0);
-        new_prompts = data_generator.get_requests(max_reqs, max_tkns);
-      }
-      assert(new_prompts.second <= max_reqs);
-      if (bc->num_active_tokens() == 0 && new_prompts.second == 0) {
-        continue;
-      }
-      for (size_t i = 0; i < new_prompts.second; i++) {
-        size_t guid = new_prompts.first + i;
-        std::pair<size_t, size_t> seq_lens =
-            data_generator.get_request_length(guid);
-        assert(seq_lens.first >= min_input_tokens &&
-               seq_lens.first <= max_input_tokens &&
-               seq_lens.second >= min_tokens_to_generate &&
-               seq_lens.second <= max_tokens_to_generate);
-        assert(bc->register_new_request(guid, seq_lens.first, seq_lens.second));
-      }
-      bc->prepare_next_batch();
-      MachineView *view = im.get_machine_view(bid % im.num_devices);
-
-      // runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
-      data_loader.next_batch(ff, bid, bc, batch_predictions[bid], view);
-      FutureMap fm = im.inference(&ff, bid, *bc);
-      // runtime->end_trace(ctx, 111 + bid % num_devices /*trace_id*/);
-
-      assert(fm.get_future_map_domain().get_volume() == 1);
-      future_handlers[bid] = fm.get_future(0);
-      batch_configs[bid] = bc;
-    }
-  }
-  //----------------------- End of inference! ------------------------------
-
-  //----------------------- Stop timer -------------------------------------
-  {
-    runtime->issue_execution_fence(ctx);
-    TimingLauncher timer(MEASURE_MICRO_SECONDS);
-    Future future = runtime->issue_timing_measurement(ctx, timer);
-    future.get_void_result();
-  }
-  double ts_end = Realm::Clock::current_time_in_microseconds();
-  double run_time = 1e-6 * (ts_end - ts_start);
-  printf("ELAPSED TIME = %.4fs, THROUGHPUT = %.2f requests/s\n",
-         run_time,
-         moeConfig.total_requests / run_time);
-}
diff --git a/examples/cpp/inference/mixture_of_experts/moe.h b/examples/cpp/inference/mixture_of_experts/moe.h
deleted file mode 100644
index 183229bc07..0000000000
--- a/examples/cpp/inference/mixture_of_experts/moe.h
+++ /dev/null
@@ -1,43 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#pragma once
-
-#include "dataloader.h"
-#include "inference_config.h"
-
-struct MoeConfig : InferenceConfig {
-  MoeConfig(void) : InferenceConfig() {
-    //----------------------- MoE layer --------------------------------
-    // total number of experts
-    num_exp = 128;
-    // number of experts in each block of fused experts
-    experts_per_block = 32;
-    // number of experts to route each token to
-    num_select = 2;
-    // expert capacity parameters
-    alpha = 2.0f;   // factor overhead tensor size for imbalance
-    lambda = 0.04f; // multiplier for load balance term
-    // expert hidden size
-    hidden_size = DATA_DIM;
-  }
-
-  // MoE layer
-  int num_exp;
-  int experts_per_block;
-  int num_select;
-  float alpha;
-  float lambda;
-};
\ No newline at end of file
diff --git a/examples/cpp/inference/transformers/CMakeLists.txt b/examples/cpp/inference/transformers/CMakeLists.txt
deleted file mode 100644
index 0aa95f1058..0000000000
--- a/examples/cpp/inference/transformers/CMakeLists.txt
+++ /dev/null
@@ -1,23 +0,0 @@
-cmake_minimum_required(VERSION 3.10)
-
-project(FlexFlowExample_Transformers)
-set(project_target inference_transformers)
-
-set(CPU_SRC
-  ${FLEXFLOW_CPP_DRV_SRC}
-  transformers.cc
-  ../dataloader.cc
-  ../data_generator.cc
-  ${FLEXFLOW_ROOT}/src/runtime/gpt_tokenizer.cc)
-
-set(GPU_SRC
-  ../dataloader.cu)
-
-cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
-target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
-target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/examples/cpp/inference)
-target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
-
-set(BIN_DEST "bin")
-install(TARGETS ${project_target} DESTINATION ${BIN_DEST})
-
diff --git a/examples/cpp/inference/transformers/transformers.cc b/examples/cpp/inference/transformers/transformers.cc
deleted file mode 100644
index 0717ddc90f..0000000000
--- a/examples/cpp/inference/transformers/transformers.cc
+++ /dev/null
@@ -1,236 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "transformers.h"
-#include "flexflow/inference.h"
-#include "flexflow/request_manager.h"
-#include <cstdlib>
-#include <fstream>
-#include <iostream>
-#include <sstream>
-#include <string>
-#include <unistd.h>
-
-using namespace Legion;
-
-LegionRuntime::Logger::Category log_app("Transformers");
-
-void parse_input_args(char **argv, int argc, TransformerConfig &config) {
-  for (int i = 1; i < argc; i++) {
-    if (!strcmp(argv[i], "--dataset")) {
-      config.dataset_path = std::string(argv[++i]);
-      continue;
-    }
-  }
-}
-
-Tensor create_inc_multihead_attention_decoder(
-    FFModel *model,
-    TransformerConfig const *transformerConfig,
-    Tensor const &input) {
-  std::vector<int> axes{0};
-  Tensor t =
-      transformerConfig->incremental_mode
-          ? model->inc_multihead_self_attention(
-                input,
-                transformerConfig->hidden_size,
-                transformerConfig->num_attention_heads,
-                transformerConfig->attention_kdim,
-                transformerConfig->attention_vdim)
-          : model->multihead_attention(input,
-                                       input,
-                                       input,
-                                       transformerConfig->hidden_size,
-                                       transformerConfig->num_attention_heads,
-                                       transformerConfig->attention_kdim,
-                                       transformerConfig->attention_vdim);
-  t = model->layer_norm(model->add(t, input), axes, true, 1e-05);
-  Tensor x = model->dense(
-      model->dense(
-          t, transformerConfig->hidden_size, AC_MODE_RELU, false /*bias*/),
-      transformerConfig->hidden_size,
-      AC_MODE_NONE,
-      false /*bias*/);
-  t = model->layer_norm(model->add(x, t), axes, true, 1e-05);
-  return t;
-}
-
-void FlexFlow::top_level_task(Task const *task,
-                              std::vector<PhysicalRegion> const &regions,
-                              Context ctx,
-                              Runtime *runtime) {
-  //----------------------- Initial configurations ------------------------
-  TransformerConfig transformerConfig;
-  FFConfig ffConfig;
-  ffConfig.batchSize = transformerConfig.batch_size;
-  {
-    InputArgs const &command_args = HighLevelRuntime::get_input_args();
-    char **argv = command_args.argv;
-    int argc = command_args.argc;
-    parse_input_args(argv, argc, transformerConfig);
-    log_app.print("batchSize(%d) workersPerNodes(%d) numNodes(%d)",
-                  ffConfig.batchSize,
-                  ffConfig.workersPerNode,
-                  ffConfig.numNodes);
-  }
-  FFModel ff(ffConfig);
-
-  //----------------------- Create inputs --------------------------------
-  Tensor input;
-  {
-    int const dims[] = {ffConfig.batchSize, transformerConfig.sequence_length};
-    input = ff.create_tensor<2>(dims, DT_INT32);
-  }
-
-  //----------------------- Define the model ------------------------------
-  Tensor t = input;
-
-  Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
-  t = ff.embedding(t,
-                   transformerConfig.vocab_size,
-                   transformerConfig.token_dim,
-                   AGGR_MODE_NONE,
-                   DT_FLOAT,
-                   NULL,
-                   embed_init);
-
-  for (int i = 0; i < transformerConfig.num_layers; i++) {
-    t = create_inc_multihead_attention_decoder(&ff, &transformerConfig, t);
-  }
-  t = ff.dense(t, transformerConfig.out_dim, AC_MODE_RELU);
-  t = ff.softmax(t);
-  // select most likely next token
-  Tensor output = ff.arg_top_k(t, /*k=*/1, false);
-
-  //------------------- Initialize the inference manager ------------------
-  InferenceManager im(ff.config, transformerConfig.batch_size);
-  im.compile_model_and_allocate_buffer(&ff);
-  im.init_operators_inference(&ff);
-
-  //------------ Initialize the data loader and data generator ------------
-  /* size_t min_input_tokens = 32, max_input_tokens = 512,
-         min_tokens_to_generate = 1, max_tokens_to_generate = 128; */
-  size_t min_input_tokens = 5, max_input_tokens = 10,
-         min_tokens_to_generate = 1,
-         max_tokens_to_generate = MAX_SEQ_LEN - max_input_tokens;
-  DataGenerator data_generator(transformerConfig.total_requests,
-                               transformerConfig.vocab_size,
-                               min_input_tokens,
-                               max_input_tokens,
-                               min_tokens_to_generate,
-                               max_tokens_to_generate,
-                               transformerConfig.poisson_distribution,
-                               transformerConfig.arrival_rate);
-  ParallelTensor input_pt;
-  ff.get_parallel_tensor_from_tensor(input, input_pt);
-  assert(im.tensor_buffer.find(input_pt) != im.tensor_buffer.end());
-  assert(im.tensor_buffer[input_pt].size() == ffConfig.data_parallelism_degree);
-  DataLoader data_loader(
-      ff, transformerConfig, data_generator, im.tensor_buffer[input_pt]);
-
-  //----------------------- Start timer -----------------------------------
-  {
-    runtime->issue_execution_fence(ctx);
-    TimingLauncher timer(MEASURE_MICRO_SECONDS);
-    Future future = runtime->issue_timing_measurement(ctx, timer);
-    future.get_void_result();
-  }
-  double ts_start = Realm::Clock::current_time_in_microseconds();
-
-  //----------------------- Begin inference! -------------------------------
-  int index = 0;
-  int processed_requests = 0;
-  int num_devices = ffConfig.workersPerNode * ffConfig.numNodes;
-  data_generator.start_timer();
-  std::map<int, Future> future_handlers;
-  std::map<int, BatchConfig *> batch_configs;
-  std::pair<size_t, size_t> new_prompts;
-  BatchConfig *bc = nullptr;
-  std::map<size_t, int> batch_predictions[ffConfig.data_parallelism_degree];
-
-  assert(im.max_num_tokens_per_batch == transformerConfig.batch_size);
-  // assert(transformerConfig.batch_size <= BatchConfig::MAX_NUM_REQUESTS);
-
-  // simulation loop. For deployment, we will use a while(true)
-  while (processed_requests < transformerConfig.total_requests) {
-    for (int bid = 0; bid < ffConfig.data_parallelism_degree; bid++) {
-      size_t max_reqs, max_tkns;
-      if (future_handlers.find(bid) == future_handlers.end()) {
-        max_reqs = transformerConfig.incremental_mode
-                       ? bc->MAX_NUM_REQUESTS
-                       : im.max_num_tokens_per_batch;
-        max_tkns =
-            transformerConfig.sequence_length * transformerConfig.batch_size;
-        new_prompts = data_generator.get_requests(max_reqs, max_tkns);
-        bc = new BatchConfig();
-      } else {
-        Future future = future_handlers[bid];
-        if (!future.is_ready(true /*subscribe*/)) {
-          continue;
-        }
-        InferenceResult ir = future.get_result<InferenceResult>();
-        bc = batch_configs[bid];
-        data_loader.store_outputs(bc, ir, batch_predictions[bid]);
-        processed_requests += bc->update_results(&ir);
-        max_reqs = transformerConfig.incremental_mode
-                       ? bc->MAX_NUM_REQUESTS - bc->num_active_requests()
-                       : im.max_num_tokens_per_batch;
-        max_tkns =
-            transformerConfig.sequence_length * transformerConfig.batch_size -
-            (transformerConfig.incremental_mode ? bc->num_active_tokens() : 0);
-        new_prompts = data_generator.get_requests(max_reqs, max_tkns);
-      }
-      assert(new_prompts.second <= max_reqs);
-      if (bc->num_active_tokens() == 0 && new_prompts.second == 0) {
-        continue;
-      }
-      for (size_t i = 0; i < new_prompts.second; i++) {
-        size_t guid = new_prompts.first + i;
-        std::pair<size_t, size_t> seq_lens =
-            data_generator.get_request_length(guid);
-        assert(seq_lens.first >= min_input_tokens &&
-               seq_lens.first <= max_input_tokens &&
-               seq_lens.second >= min_tokens_to_generate &&
-               seq_lens.second <= max_tokens_to_generate);
-        assert(bc->register_new_request(guid, seq_lens.first, seq_lens.second));
-      }
-      bc->prepare_next_batch();
-      MachineView *view = im.get_machine_view(bid % im.num_devices);
-
-      // runtime->begin_trace(ctx, 111 + bid % num_devices /*trace_id*/);
-      data_loader.next_batch(ff, bid, bc, batch_predictions[bid], view);
-      FutureMap fm = im.inference(&ff, bid, *bc);
-      // runtime->end_trace(ctx, 111 + bid % num_devices /*trace_id*/);
-
-      assert(fm.get_future_map_domain().get_volume() == 1);
-      future_handlers[bid] = fm.get_future(0);
-      batch_configs[bid] = bc;
-    }
-  }
-  //----------------------- End of inference! ------------------------------
-
-  //----------------------- Stop timer -------------------------------------
-  {
-    runtime->issue_execution_fence(ctx);
-    TimingLauncher timer(MEASURE_MICRO_SECONDS);
-    Future future = runtime->issue_timing_measurement(ctx, timer);
-    future.get_void_result();
-  }
-  double ts_end = Realm::Clock::current_time_in_microseconds();
-  double run_time = 1e-6 * (ts_end - ts_start);
-  printf("ELAPSED TIME = %.4fs, THROUGHPUT = %.2f requests/s\n",
-         run_time,
-         transformerConfig.total_requests / run_time);
-}
diff --git a/examples/cpp/inference/transformers/transformers.h b/examples/cpp/inference/transformers/transformers.h
deleted file mode 100644
index fe474e7949..0000000000
--- a/examples/cpp/inference/transformers/transformers.h
+++ /dev/null
@@ -1,25 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#pragma once
-
-#include "dataloader.h"
-#include "inference_config.h"
-
-struct TransformerConfig : InferenceConfig {
-  TransformerConfig(void) : InferenceConfig() {
-    hidden_size = DATA_DIM;
-  }
-};
diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index bae847106a..ce331d3e41 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -41,12 +41,6 @@ class BatchConfig {
   using RequestGuid = size_t;
   using TokenId = int;
   BatchConfig();
-  bool register_new_request(size_t guid,
-                            int initial_len,
-                            int tokens_to_generate);
-  void prepare_next_batch();
-  int update_results(InferenceResult const *ir);
-  void update_num_active_requests_tokens();
   int num_active_requests() const;
   int num_active_tokens() const;
   void print() const;
@@ -74,7 +68,6 @@ class BatchConfig {
   PerRequestInfo requestsInfo[MAX_NUM_REQUESTS];
   PerTokenInfo tokensInfo[MAX_NUM_TOKENS];
 
-  // size_t max_sequence_length[MAX_NUM_REQUESTS];
   bool request_completed[MAX_NUM_REQUESTS];
 };
 
@@ -84,17 +77,12 @@ class TreeVerifyBatchConfig : public BatchConfig {
   ~TreeVerifyBatchConfig();
   InferenceMode get_mode() const;
   void print() const;
-  // struct PerTokenInfo : BatchConfig::PerTokenInfo {
-  //   int tree_branch_idx;
-  // };
   struct CommittedTokensInfo {
     int token_index;   // the index of the token in the previous batch
     int request_index; // request index in the batch
     int token_depth;   // position of the token in the request's sequence
   };
 
-  // void compute_tree_branch_indexes();
-
   int num_tokens_to_commit;
   CommittedTokensInfo committed_tokens[MAX_NUM_TOKENS];
 };
@@ -145,7 +133,6 @@ class BeamSearchBatchConfig : public BatchConfig {
   BeamSearchPerTokenInfo beamTokenInfo[MAX_NUM_TOKENS * MAX_BEAM_WIDTH];
   // why is this == MAX_NUM_REQUESTS * MAX_BEAM_WIDTH?
   int sub_requests[MAX_NUM_REQUESTS * MAX_BEAM_WIDTH];
-  // BeamSlot beam_slots[MAX_NUM_REQUESTS];
 
 private:
   size_t current_iteration;
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index 446f884eac..1d03aa72ec 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -34,7 +34,6 @@ class InferenceManager {
   static InferenceManager *get_inference_manager();
   void compile_model_and_allocate_buffer(FFModel *model);
   void init_operators_inference(FFModel *model);
-  MachineView *get_machine_view(int mv_id);
   Legion::FutureMap inference(FFModel *model, int index, BatchConfig const &bc);
   Legion::FutureMap
       inference(FFModel *model, int index, BatchConfigFuture const &bc);
@@ -55,7 +54,6 @@ class InferenceManager {
   std::unordered_map<ParallelTensor, std::vector<ParallelTensor>> tensor_buffer;
   int max_num_tokens_per_batch;
   int num_devices;
-  std::vector<MachineView> machine_views;
 };
 
 struct Request {
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index 52b1660e53..d658b6590f 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -58,109 +58,18 @@ InferenceMode BatchConfig::get_mode() const {
   return INC_DECODING_MODE;
 }
 
-// Deprecated API; should use RequestManager::update_batch
-int BatchConfig::update_results(InferenceResult const *ir) {
-  assert(false);
-  int completed = 0;
-  for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
-    if (request_completed[i]) {
-      continue;
-    }
-    assert(requestsInfo[i].num_tokens_in_batch > 0);
-    int processed_tokens = requestsInfo[i].token_start_offset +
-                           requestsInfo[i].num_tokens_in_batch;
-    if (processed_tokens >= requestsInfo[i].max_sequence_length
-        // || ir.results[t] == 0 TODO: replace this with <EOS>
-    ) {
-      log_bc.print("[Done] guid(%zu) final_length(%d)",
-                   requestsInfo[i].request_guid,
-                   processed_tokens);
-      request_completed[i] = true;
-      requestsInfo[i].num_tokens_in_batch = 0;
-      requestsInfo[i].token_start_offset = 0;
-      completed++;
-    } else {
-      requestsInfo[i].token_start_offset += requestsInfo[i].num_tokens_in_batch;
-      requestsInfo[i].num_tokens_in_batch = 1;
-    }
-  }
-  return completed;
-}
-
-// Deprecated API; RequestManager::new_batch and RequestManager::update_batch
-// automatically register new requests.
-bool BatchConfig::register_new_request(size_t guid,
-                                       int initial_len,
-                                       int tokens_to_generate) {
-  assert(false);
-  assert(initial_len > 0 && tokens_to_generate > 0);
-  for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
-    if (request_completed[i]) {
-      log_bc.print("[NewRequest] guid(%zu) length(%d)", guid, initial_len);
-      requestsInfo[i].token_start_offset = 0;
-      requestsInfo[i].num_tokens_in_batch = initial_len;
-      requestsInfo[i].request_guid = guid;
-      requestsInfo[i].max_sequence_length = initial_len + tokens_to_generate;
-      request_completed[i] = false;
-      update_num_active_requests_tokens();
-      return true;
-    }
-  }
-  update_num_active_requests_tokens();
-  return false;
-}
-
-// Deprecated API
-void BatchConfig::prepare_next_batch() {
-  assert(false);
-  assert(num_tokens > 0);
-  log_bc.print("[NextBatch] num_tokens(%d)", num_tokens);
-}
-
-// Deprecated API; cannot use this since we need to
-// add token_id, which is missing in this API
-void BatchConfig::update_num_active_requests_tokens() {
-  assert(false);
-  num_tokens = 0;
-  for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
-    if (!request_completed[i]) {
-      int start_idx = requestsInfo[i].token_start_offset;
-      for (int j = 0; j < requestsInfo[i].num_tokens_in_batch; j++) {
-        tokensInfo[num_tokens].abs_depth_in_request = start_idx + j;
-        tokensInfo[num_tokens].request_index = i;
-        num_tokens++;
-      }
-    }
-  }
-}
-
 int BatchConfig::num_active_requests() const {
   int num_requests = 0;
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
     if (!request_completed[i]) {
       num_requests++;
-      // } else {
-      //   std::cout << "request " << i << " is completed" << std::endl;
     }
   }
   return num_requests;
-  // if (cached_results) {
-  //   return num_requests;
-  // } else {
-  //   assert(false &&
-  //          "some BatchConfig functions updated requests but didn't call "
-  //          "() before exit");
-  // }
 }
 
 int BatchConfig::num_active_tokens() const {
-  // if (cached_results) {
   return num_tokens;
-  //} else {
-  //  assert(false &&
-  //         "some BatchConfig functions updated requests but didn't call "
-  //         "update_num_active_requests_tokens() before exit");
-  //}
 }
 
 void BatchConfig::print() const {
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index cfcc938204..39dee64ff1 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -54,33 +54,6 @@ InferenceManager::InferenceManager(FFConfig const &_config,
              num_devices &&
          "Product of data, tensor, and pipeline parallelism degrees does not "
          "match the number of available devices");
-  // Deprecated logic below
-  // populate array of valid single-device machine views
-  for (int i = 0; i < num_devices; i++) {
-    MachineView view;
-    view.device_type = MachineView::GPU;
-    view.ndims = 1;
-    view.dim[0] = 1;
-    view.stride[0] = 0;
-    view.start_device_id = i;
-    // std::cout << "Registering machine view: " << view << std::endl;
-    machine_views.push_back(view);
-  }
-  // multiple-device machine views
-  if (ff_config.tensor_parallelism_degree > 1) {
-    for (int i = 0; i < num_devices; i++) {
-      if (i + ff_config.tensor_parallelism_degree <= num_devices) {
-        MachineView view;
-        view.device_type = MachineView::GPU;
-        view.ndims = 1;
-        view.dim[0] = ff_config.tensor_parallelism_degree;
-        view.stride[0] = 1;
-        view.start_device_id = i;
-        // std::cout << "Registering machine view: " << view << std::endl;
-        machine_views.push_back(view);
-      }
-    }
-  }
 }
 
 InferenceManager *inference_manager_singleton = nullptr;
@@ -291,13 +264,6 @@ void InferenceManager::init_operators_inference(FFModel *model) {
   }
 }
 
-// Deprecated API
-MachineView *InferenceManager::get_machine_view(int mv_id) {
-  assert(false);
-  assert(mv_id >= 0 && mv_id < machine_views.size());
-  return &machine_views[mv_id];
-}
-
 FutureMap InferenceManager::inference(FFModel *model,
                                       int index,
                                       BatchConfig const &bc) {

From 654095e9e3e00fc78509c67bff9ef37e6a284e43 Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Mon, 7 Aug 2023 18:07:28 -0400
Subject: [PATCH 192/344] fix (#916)

---
 inference/models/configs/opt_30B.json        | 15 +++++++++++++
 src/ops/spec_inc_multihead_self_attention.cu | 22 ++++++++++----------
 2 files changed, 26 insertions(+), 11 deletions(-)
 create mode 100644 inference/models/configs/opt_30B.json

diff --git a/inference/models/configs/opt_30B.json b/inference/models/configs/opt_30B.json
new file mode 100644
index 0000000000..0618b81b77
--- /dev/null
+++ b/inference/models/configs/opt_30B.json
@@ -0,0 +1,15 @@
+{
+    "vocab_size": 50272,
+    "word_embed_proj_dim": 7168,
+    "hidden_size": 7168,
+    "num_attention_heads": 56,
+    "max_position_embeddings": 2048,
+    "layer_norm_elementwise_affine": true,
+    "num_hidden_layers": 48,
+    "dropout": 0.1,
+    "ffn_dim": 28672,
+    "max_beam_width": 1,
+    "batchSize": 8,
+    "sentence_len": 100,
+    "max_beam_depth": 4
+}
\ No newline at end of file
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 52a619a5d8..d1faba9c68 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -517,17 +517,17 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       tokens_previous_requests += num_new_tokens;
       tokens_prev_requests_squares += num_new_tokens * total_tokens;
     }
-    if (*m->bias && shard_id == 0) {
-      int parallelism = m->oProjSize * num_tokens;
-      int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
-                            m->kProjSize * m->global_num_kv_heads +
-                            m->vProjSize * m->global_num_kv_heads;
-      apply_proj_bias_w<<<GET_BLOCKS(parallelism),
-                          min(CUDA_NUM_THREADS, parallelism),
-                          0,
-                          stream>>>(
-          output_ptr, bias_ptr, num_tokens, qkv_weight_size, m->oProjSize);
-    }
+  }
+  if (*m->bias && shard_id == 0) {
+    int parallelism = m->oProjSize * num_tokens;
+    int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
+                          m->kProjSize * m->global_num_kv_heads +
+                          m->vProjSize * m->global_num_kv_heads;
+    apply_proj_bias_w<<<GET_BLOCKS(parallelism),
+                        min(CUDA_NUM_THREADS, parallelism),
+                        0,
+                        stream>>>(
+        output_ptr, bias_ptr, num_tokens, qkv_weight_size, m->oProjSize);
   }
 
   assert(tokens_previous_requests == num_tokens);

From 0bc2b01021c2d2458bc3e53912d197fa034bfd57 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 8 Aug 2023 16:36:25 -0400
Subject: [PATCH 193/344] [Inference] - Cleanup, C++/Python API update (#915)

* update python api slightly

* update

* fix

* update

* add function to save huggingface configs to file

* cleanup

* backup

* hf configs parsing update

* replace legacy configs

* update tests, delete old downloader scripts

* fix path

* fix

* fix

* fix

* fixes

* falcon fix

* remove legacy file

* fixes

* linting

* fix

* fix

* fix

* fix

* fix

* added falcon to c++ tests

* fix

* update

* fix

* clear cache

* fix

* add support for gelu in fusion

* replace c++ tests with python tests

* removed config

* shellcheck

* enable fusion by default in c++ tests

* enable all tests temporarily

* fix

* fix

* fix

* fix

* fix

* fix

* ready to merge

---------

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 .github/workflows/gpu-ci.yml                  |  15 +-
 .github/workflows/pip-deploy.yml              |   2 -
 conda/flexflow-cpu.yml                        |   4 +
 docker/flexflow-environment/Dockerfile        |   4 +-
 include/flexflow/flexflow_c.h                 |  13 +-
 include/flexflow/inference.h                  |   7 +
 include/flexflow/request_manager.h            |   7 -
 inference/.gitignore                          |   3 +-
 inference/file_loader.cc                      |  23 +-
 inference/file_loader.h                       |   4 +-
 inference/incr_decoding/incr_decoding.cc      | 111 +++---
 inference/models/configs/falcon_7B.json       |  12 -
 inference/models/configs/llama2_70B.json      |  11 -
 inference/models/configs/llama2_7B.json       |  11 -
 inference/models/configs/llama_160M.json      |  11 -
 inference/models/configs/llama_68M.json       |  11 -
 inference/models/configs/llama_7B.json        |  11 -
 inference/models/configs/opt_125M.json        |  15 -
 inference/models/configs/opt_13B.json         |  15 -
 inference/models/configs/opt_30B.json         |  15 -
 inference/models/configs/opt_6B.json          |  15 -
 inference/models/falcon.cc                    |  88 +++--
 inference/models/falcon.h                     | 107 +++---
 inference/models/llama.cc                     |  69 ++--
 inference/models/llama.h                      |  98 ++----
 inference/models/opt.cc                       |  15 +-
 inference/models/opt.h                        | 109 +++---
 inference/python/incr_decoding.py             |  18 +-
 inference/python/spec_infer.py                |  25 +-
 inference/spec_infer/spec_infer.cc            | 315 +++++++++++-------
 inference/utils/convert_llama_config.py       |  32 --
 inference/utils/download_falcon_weights.py    |  45 ---
 inference/utils/download_hf_model.py          |  63 ++++
 inference/utils/download_llama_weights.py     |  78 -----
 inference/utils/download_opt_weights.py       |  78 -----
 python/flexflow/core/__init__.py              | 148 ++++----
 python/flexflow/core/flexflow_cffi.py         | 245 +++++++++++++-
 python/flexflow/serve/__init__.py             |  18 +-
 python/flexflow/serve/models/falcon.py        |  97 +++++-
 python/flexflow/serve/models/llama.py         |  25 +-
 python/flexflow/serve/models/opt.py           |  25 +-
 python/flexflow/serve/serve.py                | 231 ++++++++-----
 src/c/flexflow_c.cc                           |  16 +-
 src/ops/fused.cu                              |   3 +
 src/runtime/inference_manager.cc              | 104 ++----
 src/runtime/request_manager.cc                |   4 +-
 tests/.gitignore                              |   1 +
 tests/inference/cpp_inference_tests.sh        |  96 ++----
 tests/inference/python_inference_tests.sh     | 191 +++++++++++
 .../python_test_configs/generate_configs.py   | 123 +++++++
 tests/inference_tests.sh                      |  38 ++-
 51 files changed, 1626 insertions(+), 1199 deletions(-)
 delete mode 100644 inference/models/configs/falcon_7B.json
 delete mode 100644 inference/models/configs/llama2_70B.json
 delete mode 100644 inference/models/configs/llama2_7B.json
 delete mode 100644 inference/models/configs/llama_160M.json
 delete mode 100644 inference/models/configs/llama_68M.json
 delete mode 100644 inference/models/configs/llama_7B.json
 delete mode 100644 inference/models/configs/opt_125M.json
 delete mode 100644 inference/models/configs/opt_13B.json
 delete mode 100644 inference/models/configs/opt_30B.json
 delete mode 100644 inference/models/configs/opt_6B.json
 delete mode 100644 inference/utils/convert_llama_config.py
 delete mode 100644 inference/utils/download_falcon_weights.py
 create mode 100644 inference/utils/download_hf_model.py
 delete mode 100644 inference/utils/download_llama_weights.py
 delete mode 100644 inference/utils/download_opt_weights.py
 create mode 100755 tests/inference/python_inference_tests.sh
 create mode 100644 tests/inference/python_test_configs/generate_configs.py

diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index 8064710d04..bdd2e4dbf5 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -183,17 +183,26 @@ jobs:
           ./tests/gpt_tokenizer_test.sh
 
           # Inference tests
-          export TENSOR_PARALLELISM_TESTS=ON
+          source ./build/set_python_envs.sh
           ./tests/inference_tests.sh
+      
+      - name: Save inference output as an artifact
+        if: always()
+        run: | 
           cd inference
           tar -zcvf output.tar.gz ./output
-          cd ..
 
-      - name: Save inference output as an artifact
+      - name: Upload artifact
         uses: actions/upload-artifact@v3
+        if: always()
         with:
           name: output
           path: inference/output.tar.gz
+      
+      # Github persists the .cache folder across different runs/containers
+      - name: Clear cache
+        if: always()
+        run: sudo rm -rf ~/.cache 
 
   gpu-ci-flexflow:
     name: Single Machine, Multiple GPUs Tests
diff --git a/.github/workflows/pip-deploy.yml b/.github/workflows/pip-deploy.yml
index c3840a6671..c542b86a5e 100644
--- a/.github/workflows/pip-deploy.yml
+++ b/.github/workflows/pip-deploy.yml
@@ -3,8 +3,6 @@ on:
   push:
     tags:
       - '*'
-    branches:
-      - inference # only trigger on push to inference branch for now
   workflow_dispatch:
 
 concurrency:
diff --git a/conda/flexflow-cpu.yml b/conda/flexflow-cpu.yml
index b8d1c5dcdf..6435b19343 100644
--- a/conda/flexflow-cpu.yml
+++ b/conda/flexflow-cpu.yml
@@ -19,3 +19,7 @@ dependencies:
     - torchaudio --index-url https://download.pytorch.org/whl/cpu
     - torchvision --index-url https://download.pytorch.org/whl/cpu
     - regex
+    - onnx
+    - transformers
+    - sentencepiece
+    - einops
diff --git a/docker/flexflow-environment/Dockerfile b/docker/flexflow-environment/Dockerfile
index a53102fa73..2f970f272d 100644
--- a/docker/flexflow-environment/Dockerfile
+++ b/docker/flexflow-environment/Dockerfile
@@ -5,7 +5,7 @@ LABEL org.opencontainers.image.source=https://github.com/flexflow/FlexFlow
 LABEL org.opencontainers.image.description="FlexFlow environment container"
 
 # Install basic dependencies
-RUN apt-get update && apt-get install -y --no-install-recommends wget sudo binutils git zlib1g-dev lsb-release nano libhdf5-dev && \
+RUN apt-get update && apt-get install -y --no-install-recommends wget sudo binutils git zlib1g-dev lsb-release nano gdb libhdf5-dev && \
     rm -rf /var/lib/apt/lists/* /etc/apt/sources.list.d/cuda.list /etc/apt/sources.list.d/nvidia-ml.list && \
 	apt-get update && DEBIAN_FRONTEND=noninteractive apt-get install -y --no-install-recommends software-properties-common && \
     apt-get update && DEBIAN_FRONTEND=noninteractive apt-get install -y --no-install-recommends build-essential apt-utils \
@@ -57,7 +57,7 @@ ENV CUDA_DIR /usr/local/cuda
 RUN conda install -c conda-forge cmake make pillow cmake-build-extension pybind11 numpy pandas keras-preprocessing
 # Install CPU-only Pytorch and related dependencies
 RUN conda install pytorch torchvision torchaudio cpuonly -c pytorch
-RUN conda install -c conda-forge onnx transformers sentencepiece
+RUN conda install -c conda-forge onnx transformers sentencepiece einops
 RUN pip3 install tensorflow
 
 # Install Rust
diff --git a/include/flexflow/flexflow_c.h b/include/flexflow/flexflow_c.h
index 7f1374415c..1aa192f4e3 100644
--- a/include/flexflow/flexflow_c.h
+++ b/include/flexflow/flexflow_c.h
@@ -396,7 +396,7 @@ flexflow_tensor_t flexflow_model_add_multihead_attention(
     flexflow_initializer_t kernel_initializer,
     char const *name);
 
-flexflow_tensor_t flexflow_model_add_inc_multihead_attention(
+flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention(
     flexflow_model_t handle_,
     const flexflow_tensor_t input_,
     int embed_dim,
@@ -415,7 +415,7 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_attention(
     bool qk_prod_scaling,
     char const *name);
 
-flexflow_tensor_t flexflow_model_add_spec_inc_multihead_attention(
+flexflow_tensor_t flexflow_model_add_spec_inc_multihead_self_attention(
     flexflow_model_t handle_,
     const flexflow_tensor_t input_,
     int embed_dim,
@@ -453,7 +453,7 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention_verify(
     bool qk_prod_scaling,
     char const *name);
 
-flexflow_tensor_t flexflow_model_add_inc_multiquery_attention(
+flexflow_tensor_t flexflow_model_add_inc_multiquery_self_attention(
     flexflow_model_t handle_,
     const flexflow_tensor_t input_,
     int embed_dim,
@@ -473,7 +473,7 @@ flexflow_tensor_t flexflow_model_add_inc_multiquery_attention(
     bool qk_prod_scaling,
     char const *name);
 
-flexflow_tensor_t flexflow_model_add_spec_inc_multiquery_attention(
+flexflow_tensor_t flexflow_model_add_spec_inc_multiquery_self_attention(
     flexflow_model_t handle_,
     const flexflow_tensor_t input_,
     int embed_dim,
@@ -944,10 +944,11 @@ void flexflow_inference_manager_init_operators_inference(
 
 flexflow_file_data_loader_t
     flexflow_file_data_loader_create(char const *weight_file_path,
-                                     int num_heads,
+                                     int num_q_heads,
+                                     int num_kv_heads,
                                      int hidden_dim,
                                      int qkv_inner_dim,
-                                     int tensor_partition_num);
+                                     int tensor_parallelism_degree);
 
 void flexflow_file_data_loader_destroy(flexflow_file_data_loader_t handle_);
 
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index c30b0c0be3..4e7d9ffcbc 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -15,6 +15,8 @@
 
 #pragma once
 #include "flexflow/batch_config.h"
+#include <string>
+#include <vector>
 
 namespace FlexFlow {
 
@@ -40,4 +42,9 @@ struct GenerationResult {
   std::vector<TokenId> output_tokens;
 };
 
+#include <string>
+#include <vector>
+
+std::string join_path(std::vector<std::string> const &paths);
+
 } // namespace FlexFlow
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index 1d03aa72ec..6aa69786ca 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -41,13 +41,6 @@ class InferenceManager {
                                            ParallelTensor const input);
   void load_positions(BatchConfigFuture const &bc,
                       ParallelTensor position_input);
-  void incr_decoding_loop(FFModel *model,
-                          RequestManager &rm,
-                          int total_num_requests);
-  void spec_inference_loop(FFModel *model,
-                           RequestManager &rm,
-                           int total_num_requests,
-                           std::vector<int> ssm_model_ids);
 
 public:
   FFConfig ff_config;
diff --git a/inference/.gitignore b/inference/.gitignore
index 05ccb57cd3..8ab99cb1eb 100644
--- a/inference/.gitignore
+++ b/inference/.gitignore
@@ -1,4 +1,5 @@
+configs
 weights
-tokenizer
+tokenizers
 prompt
 output
diff --git a/inference/file_loader.cc b/inference/file_loader.cc
index 94e604ac2d..c15a3c0f2b 100644
--- a/inference/file_loader.cc
+++ b/inference/file_loader.cc
@@ -28,11 +28,11 @@ FileDataLoader::FileDataLoader(std::string _input_path,
                                int _num_kv_heads,
                                size_t _hidden_dim,
                                size_t _qkv_inner_dim,
-                               int _tensor_partition_num)
+                               int _tensor_parallelism_degree)
     : input_path(_input_path), weight_file_path(_weight_file_path),
       num_heads(_num_heads), num_kv_heads(_num_kv_heads),
       hidden_dim(_hidden_dim), qkv_inner_dim(_qkv_inner_dim),
-      tensor_partition_num(_tensor_partition_num){};
+      tensor_parallelism_degree(_tensor_parallelism_degree){};
 
 BatchConfig::TokenId *FileDataLoader::generate_requests(int num, int length) {
 
@@ -185,7 +185,7 @@ void load_attention_weights_v2(DT *ptr,
                                std::string layer_name,
                                std::string weight_path,
                                size_t volume,
-                               int tensor_partition_num) {
+                               int tensor_parallelism_degree) {
   // layers_0_attention_wq_weight
   // layers_0_self_attn_q_proj_weight
   std::string q_file = weight_path +
@@ -216,13 +216,13 @@ void load_attention_weights_v2(DT *ptr,
 
   // stride for q, k, v, o
   size_t stride_size =
-      (q_size + v_size + k_size + o_size) / tensor_partition_num;
+      (q_size + v_size + k_size + o_size) / tensor_parallelism_degree;
   for (auto file : weight_files) {
     int data_index = 0;
     size_t partial_size = (file_index == 0 || file_index == 3)
                               ? one_weight_file_size
                               : single_proj_size * num_kv_heads;
-    size_t one_partition_size = partial_size / tensor_partition_num;
+    size_t one_partition_size = partial_size / tensor_parallelism_degree;
 
     std::ifstream in(file, std::ios::in | std::ios::binary);
     if (!in.good()) {
@@ -242,7 +242,7 @@ void load_attention_weights_v2(DT *ptr,
       assert(false && "data size mismatch");
     }
     // wq, wk, wo
-    for (int i = 0; i < tensor_partition_num; i++) {
+    for (int i = 0; i < tensor_parallelism_degree; i++) {
       for (int j = 0; j < one_partition_size; j++) {
         ptr[base_index + i * stride_size + j] = host_array.at(data_index++);
       }
@@ -251,7 +251,7 @@ void load_attention_weights_v2(DT *ptr,
     base_index += one_partition_size;
     file_index++;
   }
-  assert(base_index == (q_size + k_size + v_size) / tensor_partition_num);
+  assert(base_index == (q_size + k_size + v_size) / tensor_parallelism_degree);
 
   {
     std::ifstream in(o_file, std::ios::in | std::ios::binary);
@@ -273,11 +273,12 @@ void load_attention_weights_v2(DT *ptr,
     assert(one_weight_file_size == host_array.size());
     int data_index = 0;
 
-    int one_partition_size = qkv_inner_dim * (num_heads / tensor_partition_num);
+    int one_partition_size =
+        qkv_inner_dim * (num_heads / tensor_parallelism_degree);
     for (int i = 0; i < one_weight_file_size; i++) {
-      int part_idx = (i / one_partition_size) % tensor_partition_num;
+      int part_idx = (i / one_partition_size) % tensor_parallelism_degree;
       int block_num = (i / one_partition_size);
-      int offset = block_num / tensor_partition_num * one_partition_size +
+      int offset = block_num / tensor_parallelism_degree * one_partition_size +
                    (i % one_partition_size);
       ptr[base_index + part_idx * stride_size + offset] =
           host_array.at(data_index++);
@@ -687,7 +688,7 @@ void FileDataLoader::load_single_weight_tensor(FFModel *ff,
                                 file_path,
                                 weight_file_path,
                                 volume,
-                                tensor_partition_num);
+                                tensor_parallelism_degree);
     } else {
       load_attention_bias_v2(data,
                              num_heads,
diff --git a/inference/file_loader.h b/inference/file_loader.h
index 0c9dfa56cd..aaef861d09 100644
--- a/inference/file_loader.h
+++ b/inference/file_loader.h
@@ -30,7 +30,7 @@ class FileDataLoader {
                  int _num_kv_heads,
                  size_t _hidden_dim,
                  size_t _qkv_inner_dim,
-                 int _tensor_partition_num);
+                 int _tensor_parallelism_degree);
 
   BatchConfig::TokenId *generate_requests(int num, int length);
 
@@ -56,7 +56,7 @@ class FileDataLoader {
                       int offset);
 
 private:
-  int num_heads, num_kv_heads, tensor_partition_num;
+  int num_heads, num_kv_heads, tensor_parallelism_degree;
   size_t hidden_dim, qkv_inner_dim;
   std::string input_path;
   std::string weight_file_path;
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index 84217a22f1..cd84d6cb5c 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -18,25 +18,25 @@
 #include "models/falcon.h"
 #include "models/llama.h"
 #include "models/opt.h"
+#include <wordexp.h>
 
 #include <nlohmann/json.hpp>
 
 using namespace Legion;
+using json = nlohmann::json;
 
 LegionRuntime::Logger::Category log_app("llama");
 
 struct FilePaths {
-  std::string llm_weight_file_path;
-  std::string llm_config_file_path;
+  std::string cache_folder_path;
   std::string prompt_file_path;
-  std::string tokenizer_file_path;
   std::string output_file_path;
 };
 
 void parse_input_args(char **argv,
                       int argc,
                       FilePaths &paths,
-                      ModelType &llm_model_type,
+                      std::string &llm_model_name,
                       bool &use_full_precision,
                       bool &verbose,
                       bool &do_sample,
@@ -45,32 +45,15 @@ void parse_input_args(char **argv,
   for (int i = 1; i < argc; i++) {
     // llm model type
     if (!strcmp(argv[i], "-llm-model")) {
-      std::string model_type_str = std::string(argv[++i]);
-      std::transform(model_type_str.begin(),
-                     model_type_str.end(),
-                     model_type_str.begin(),
-                     [](unsigned char c) { return std::tolower(c); });
-      if (model_type_str == "llama") {
-        llm_model_type = ModelType::LLAMA;
-      } else if (model_type_str == "llama2") {
-        llm_model_type = ModelType::LLAMA2;
-      } else if (model_type_str == "opt") {
-        llm_model_type = ModelType::OPT;
-      } else if (model_type_str == "falcon") {
-        llm_model_type = ModelType::FALCON;
-      } else {
-        llm_model_type = ModelType::UNKNOWN;
+      llm_model_name = std::string(argv[++i]);
+      for (char &c : llm_model_name) {
+        c = std::tolower(c);
       }
       continue;
     }
-    // llm model weights
-    if (!strcmp(argv[i], "-llm-weight")) {
-      paths.llm_weight_file_path = std::string(argv[++i]);
-      continue;
-    }
-    // llm model configs
-    if (!strcmp(argv[i], "-llm-config")) {
-      paths.llm_config_file_path = std::string(argv[++i]);
+    // cache folder
+    if (!strcmp(argv[i], "-cache-folder")) {
+      paths.cache_folder_path = std::string(argv[++i]);
       continue;
     }
     // prompts
@@ -78,11 +61,6 @@ void parse_input_args(char **argv,
       paths.prompt_file_path = std::string(argv[++i]);
       continue;
     }
-    // tokenizer
-    if (!strcmp(argv[i], "-tokenizer")) {
-      paths.tokenizer_file_path = std::string(argv[++i]);
-      continue;
-    }
     // output file
     if (!strcmp(argv[i], "-output-file")) {
       paths.output_file_path = std::string(argv[++i]);
@@ -110,6 +88,14 @@ void parse_input_args(char **argv,
       continue;
     }
   }
+  if (paths.cache_folder_path.empty()) {
+    paths.cache_folder_path = "~/.cache/flexflow";
+  }
+  // Expand ~ to the home directory if needed
+  wordexp_t p;
+  wordexp(paths.cache_folder_path.c_str(), &p, 0);
+  paths.cache_folder_path = p.we_wordv[0];
+  wordfree(&p);
 }
 
 void FlexFlow::top_level_task(Task const *task,
@@ -121,13 +107,12 @@ void FlexFlow::top_level_task(Task const *task,
     assert(false && "Doesn't support quantization in non-offload mode");
   }
   FilePaths file_paths;
-  ModelType model_type;
+  std::string llm_model_name;
   bool use_full_precision = false;
   bool verbose = false;
   bool do_sample = false;
   float temperature = 0.0f;
   float topp = 0.0f;
-  size_t num_devices = ffconfig.workersPerNode * ffconfig.numNodes;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
   char **argv = command_args.argv;
@@ -135,7 +120,7 @@ void FlexFlow::top_level_task(Task const *task,
   parse_input_args(argv,
                    argc,
                    file_paths,
-                   model_type,
+                   llm_model_name,
                    use_full_precision,
                    verbose,
                    do_sample,
@@ -146,32 +131,74 @@ void FlexFlow::top_level_task(Task const *task,
              ffconfig.pipeline_parallelism_degree ==
          ffconfig.numNodes * ffconfig.workersPerNode);
 
+  std::string config_filepath = join_path(
+      {file_paths.cache_folder_path, "configs", llm_model_name, "config.json"});
+  std::string tokenizer_filepath =
+      join_path({file_paths.cache_folder_path, "tokenizers", llm_model_name});
+  std::string weights_filepath =
+      join_path({file_paths.cache_folder_path,
+                 "weights",
+                 llm_model_name,
+                 use_full_precision ? "full-precision" : "half-precision"});
+  std::ifstream config_file_handle(config_filepath);
+  if (!config_file_handle.good()) {
+    std::cout << "Model config file " << config_filepath << " not found."
+              << std::endl;
+    assert(false);
+  }
+  json model_config = json::parse(config_file_handle,
+                                  /*parser_callback_t */ nullptr,
+                                  /*allow_exceptions */ true,
+                                  /*ignore_comments */ true);
+
+  ModelType model_type = ModelType::UNKNOWN;
+  auto architectures = model_config["architectures"];
+  for (auto const &str : architectures) {
+    if (str == "LlamaForCausalLM" || str == "LLaMAForCausalLM") {
+      std::string nameOrPath = model_config["_name_or_path"];
+      // TODO: support LLAMA-2 models not from Meta
+      bool llama2 = nameOrPath.find("meta-llama/Llama-2") == 0;
+      if (llama2) {
+        model_type = ModelType::LLAMA2;
+      } else {
+        model_type = ModelType::LLAMA;
+      }
+      break;
+    } else if (str == "OPTForCausalLM") {
+      model_type = ModelType::OPT;
+      break;
+    } else if (str == "RWForCausalLM") {
+      model_type = ModelType::FALCON;
+      break;
+    }
+  }
+
   assert(model_type != ModelType::UNKNOWN &&
          "Invalid LLM model type passed (or no type was passed).");
 
   SamplingConfig samplingConfig(do_sample, temperature, topp);
   RequestManager *rm = RequestManager::get_request_manager();
-  rm->register_tokenizer(model_type, file_paths.tokenizer_file_path);
+  rm->register_tokenizer(model_type, tokenizer_filepath);
   rm->register_output_filepath(file_paths.output_file_path);
 
   FFModel model(ffconfig, ffconfig.cpu_offload);
   if (model_type == ModelType::LLAMA || model_type == ModelType::LLAMA2) {
     LLAMA::create_llama_model(model,
-                              file_paths.llm_config_file_path,
-                              file_paths.llm_weight_file_path,
+                              config_filepath,
+                              weights_filepath,
                               INC_DECODING_MODE,
                               samplingConfig,
                               use_full_precision);
   } else if (model_type == ModelType::OPT) {
     OPT::create_opt_model(model,
-                          file_paths.llm_config_file_path,
-                          file_paths.llm_weight_file_path,
+                          config_filepath,
+                          weights_filepath,
                           INC_DECODING_MODE,
                           use_full_precision);
   } else if (model_type == ModelType::FALCON) {
     FALCON::create_falcon_model(model,
-                                file_paths.llm_config_file_path,
-                                file_paths.llm_weight_file_path,
+                                config_filepath,
+                                weights_filepath,
                                 INC_DECODING_MODE,
                                 use_full_precision);
   } else {
diff --git a/inference/models/configs/falcon_7B.json b/inference/models/configs/falcon_7B.json
deleted file mode 100644
index d89564557a..0000000000
--- a/inference/models/configs/falcon_7B.json
+++ /dev/null
@@ -1,12 +0,0 @@
-{
-    "n_layers": 32,
-    "vocab_size": 65024,
-    "n_heads": 71,
-    "n_kv_heads" : 1,
-    "dim": 4544,
-    "multiple_of": 256,
-    "norm_eps": 1e-05,
-    "total_requests": 2560,
-    "hidden_dim": 11008,
-    "incremental_mode": true
-}
\ No newline at end of file
diff --git a/inference/models/configs/llama2_70B.json b/inference/models/configs/llama2_70B.json
deleted file mode 100644
index 017e71888d..0000000000
--- a/inference/models/configs/llama2_70B.json
+++ /dev/null
@@ -1,11 +0,0 @@
-{
-    "n_layers": 80,
-    "vocab_size": 32000,
-    "n_heads": 64,
-    "dim": 8192,
-    "multiple_of": 256,
-    "norm_eps": 1e-5,
-    "total_requests": 2560,
-    "hidden_dim": 28672,
-    "incremental_mode": true
-}
diff --git a/inference/models/configs/llama2_7B.json b/inference/models/configs/llama2_7B.json
deleted file mode 100644
index 46dd138e4f..0000000000
--- a/inference/models/configs/llama2_7B.json
+++ /dev/null
@@ -1,11 +0,0 @@
-{
-    "n_layers": 32,
-    "vocab_size": 32000,
-    "n_heads": 32,
-    "dim": 4096,
-    "multiple_of": 256,
-    "norm_eps": 1e-5,
-    "total_requests": 2560,
-    "hidden_dim": 11008,
-    "incremental_mode": true
-}
diff --git a/inference/models/configs/llama_160M.json b/inference/models/configs/llama_160M.json
deleted file mode 100644
index d912c64ab7..0000000000
--- a/inference/models/configs/llama_160M.json
+++ /dev/null
@@ -1,11 +0,0 @@
-{
-    "n_layers": 12,
-    "vocab_size": 32000,
-    "n_heads": 12,
-    "dim": 768,
-    "multiple_of": 256,
-    "norm_eps": 1e-6,
-    "total_requests": 2560,
-    "hidden_dim": 3072,
-    "incremental_mode": true
-}
diff --git a/inference/models/configs/llama_68M.json b/inference/models/configs/llama_68M.json
deleted file mode 100644
index 11e21531c4..0000000000
--- a/inference/models/configs/llama_68M.json
+++ /dev/null
@@ -1,11 +0,0 @@
-{
-    "n_layers": 2,
-    "vocab_size": 32000,
-    "n_heads": 12,
-    "dim": 768,
-    "multiple_of": 256,
-    "norm_eps": 1e-06,
-    "total_requests": 2560,
-    "hidden_dim": 3072,
-    "incremental_mode": true
-}
\ No newline at end of file
diff --git a/inference/models/configs/llama_7B.json b/inference/models/configs/llama_7B.json
deleted file mode 100644
index 0c32ed320d..0000000000
--- a/inference/models/configs/llama_7B.json
+++ /dev/null
@@ -1,11 +0,0 @@
-{
-    "n_layers": 32,
-    "vocab_size": 32000,
-    "n_heads": 32,
-    "dim": 4096,
-    "multiple_of": 256,
-    "norm_eps": 1e-6,
-    "total_requests": 2560,
-    "hidden_dim": 11008,
-    "incremental_mode": true
-}
diff --git a/inference/models/configs/opt_125M.json b/inference/models/configs/opt_125M.json
deleted file mode 100644
index 0b9feed922..0000000000
--- a/inference/models/configs/opt_125M.json
+++ /dev/null
@@ -1,15 +0,0 @@
-{
-    "vocab_size": 50272,
-    "word_embed_proj_dim": 768,
-    "hidden_size": 768,
-    "num_attention_heads": 12,
-    "max_position_embeddings": 2048,
-    "layer_norm_elementwise_affine": true,
-    "num_hidden_layers": 12,
-    "dropout": 0.1,
-    "ffn_dim": 3072,
-    "max_beam_width": 1,
-    "batchSize": 8,
-    "sentence_len": 100,
-    "max_beam_depth": 4
-}
diff --git a/inference/models/configs/opt_13B.json b/inference/models/configs/opt_13B.json
deleted file mode 100644
index 96cad5c99b..0000000000
--- a/inference/models/configs/opt_13B.json
+++ /dev/null
@@ -1,15 +0,0 @@
-{
-    "vocab_size": 50272,
-    "word_embed_proj_dim": 5120,
-    "hidden_size": 5120,
-    "num_attention_heads": 40,
-    "max_position_embeddings": 2048,
-    "layer_norm_elementwise_affine": true,
-    "num_hidden_layers": 40,
-    "dropout": 0.1,
-    "ffn_dim": 20480,
-    "max_beam_width": 1,
-    "batchSize": 8,
-    "sentence_len": 100,
-    "max_beam_depth": 4
-}
diff --git a/inference/models/configs/opt_30B.json b/inference/models/configs/opt_30B.json
deleted file mode 100644
index 0618b81b77..0000000000
--- a/inference/models/configs/opt_30B.json
+++ /dev/null
@@ -1,15 +0,0 @@
-{
-    "vocab_size": 50272,
-    "word_embed_proj_dim": 7168,
-    "hidden_size": 7168,
-    "num_attention_heads": 56,
-    "max_position_embeddings": 2048,
-    "layer_norm_elementwise_affine": true,
-    "num_hidden_layers": 48,
-    "dropout": 0.1,
-    "ffn_dim": 28672,
-    "max_beam_width": 1,
-    "batchSize": 8,
-    "sentence_len": 100,
-    "max_beam_depth": 4
-}
\ No newline at end of file
diff --git a/inference/models/configs/opt_6B.json b/inference/models/configs/opt_6B.json
deleted file mode 100644
index cc86ce0f8f..0000000000
--- a/inference/models/configs/opt_6B.json
+++ /dev/null
@@ -1,15 +0,0 @@
-{
-    "vocab_size": 50272,
-    "word_embed_proj_dim": 4096,
-    "hidden_size": 4096,
-    "num_attention_heads": 32,
-    "max_position_embeddings": 2048,
-    "layer_norm_elementwise_affine": true,
-    "num_hidden_layers": 32,
-    "dropout": 0.1,
-    "ffn_dim": 16384,
-    "max_beam_width": 1,
-    "batchSize": 8,
-    "sentence_len": 100,
-    "max_beam_depth": 4
-}
diff --git a/inference/models/falcon.cc b/inference/models/falcon.cc
index 00f7864e7f..d57504b8cf 100644
--- a/inference/models/falcon.cc
+++ b/inference/models/falcon.cc
@@ -18,29 +18,24 @@
 namespace FlexFlow {
 
 using namespace Legion;
+using json = nlohmann::json;
 
 void FALCON::create_falcon_model(FFModel &ff,
                                  std::string const &model_config_file_path,
                                  std::string const &weight_file_path,
                                  InferenceMode mode,
                                  bool use_full_precision) {
-  Config falcon_config(model_config_file_path);
-  falcon_config.printConfig();
-
-  if (ff.config.tensor_parallelism_degree > falcon_config.n_heads ||
-      ff.config.tensor_parallelism_degree > falcon_config.n_kv_heads) {
-    assert(false && "The degree of tensor parallelism should be greater than "
-                    "or equal to the number of heads");
+  FalconConfig falcon_config(model_config_file_path);
+  falcon_config.print();
+
+  if (ff.config.tensor_parallelism_degree > falcon_config.n_head ||
+      falcon_config.n_head % ff.config.tensor_parallelism_degree != 0 ||
+      ff.config.tensor_parallelism_degree > falcon_config.n_head_kv ||
+      falcon_config.n_head_kv % ff.config.tensor_parallelism_degree != 0) {
+    assert(false && "The number of attention heads is smaller, or it is not "
+                    "divisible by the tensor parallelism degree");
   }
 
-  int num_devices = ff.config.workersPerNode * ff.config.numNodes;
-  int num_transformer_layers = falcon_config.n_layers;
-  assert(num_transformer_layers % ff.config.pipeline_parallelism_degree == 0);
-  int num_layers_per_pp_block =
-      num_transformer_layers / ff.config.pipeline_parallelism_degree;
-  int num_devices_per_data_parallelism_line =
-      num_devices / ff.config.data_parallelism_degree;
-
   std::unordered_map<std::string, Layer *> weights_layers;
 
   Tensor input;
@@ -58,7 +53,7 @@ void FALCON::create_falcon_model(FFModel &ff,
   if (use_full_precision) {
     token = ff.embedding(input,
                          falcon_config.vocab_size,
-                         falcon_config.dim,
+                         falcon_config.hidden_size,
                          AGGR_MODE_NONE,
                          DT_FLOAT,
                          NULL,
@@ -66,7 +61,7 @@ void FALCON::create_falcon_model(FFModel &ff,
   } else {
     token = ff.embedding(input,
                          falcon_config.vocab_size,
-                         falcon_config.dim,
+                         falcon_config.hidden_size,
                          AGGR_MODE_NONE,
                          DT_HALF,
                          NULL,
@@ -74,13 +69,14 @@ void FALCON::create_falcon_model(FFModel &ff,
   }
 
   Layer *embedding = ff.layers.back();
-  weights_layers.emplace("tok_embeddings_weight", embedding);
+  weights_layers.emplace("word_embeddings_weight", embedding);
 
-  for (int i = 0; i < falcon_config.n_layers; i++) {
+  for (int i = 0; i < falcon_config.n_layer; i++) {
     // set transformer layer id
     ff.set_transformer_layer_id(i);
     // step 1: attention
-    Tensor att_norm = ff.layer_norm(token, axes, true, falcon_config.norm_eps);
+    Tensor att_norm =
+        ff.layer_norm(token, axes, true, falcon_config.layer_norm_epsilon);
     Layer *attention_norm = ff.layers.back();
 
     weights_layers.emplace("layers_" + std::to_string(i) +
@@ -91,11 +87,11 @@ void FALCON::create_falcon_model(FFModel &ff,
       case BEAM_SEARCH_MODE: {
         mha = ff.spec_inc_multiquery_self_attention(
             att_norm,
-            falcon_config.dim,
-            falcon_config.n_heads,
-            falcon_config.n_kv_heads,
-            falcon_config.dim / falcon_config.n_heads,
-            falcon_config.dim / falcon_config.n_heads,
+            falcon_config.hidden_size,
+            falcon_config.n_head,
+            falcon_config.n_head_kv,
+            falcon_config.hidden_size / falcon_config.n_head,
+            falcon_config.hidden_size / falcon_config.n_head,
             0.0f,
             false,
             false,
@@ -109,11 +105,11 @@ void FALCON::create_falcon_model(FFModel &ff,
       case TREE_VERIFY_MODE: {
         mha = ff.inc_multiquery_self_attention_verify(
             att_norm,
-            falcon_config.dim,
-            falcon_config.n_heads,
-            falcon_config.n_kv_heads,
-            falcon_config.dim / falcon_config.n_heads,
-            falcon_config.dim / falcon_config.n_heads,
+            falcon_config.hidden_size,
+            falcon_config.n_head,
+            falcon_config.n_head_kv,
+            falcon_config.hidden_size / falcon_config.n_head,
+            falcon_config.hidden_size / falcon_config.n_head,
             0.0f,    /*dropout*/
             false,   /*bias*/
             false,   /*add_bias_kv*/
@@ -128,11 +124,11 @@ void FALCON::create_falcon_model(FFModel &ff,
       case INC_DECODING_MODE: {
         mha = ff.inc_multiquery_self_attention(
             att_norm,
-            falcon_config.dim,
-            falcon_config.n_heads,
-            falcon_config.n_kv_heads,
-            falcon_config.dim / falcon_config.n_heads,
-            falcon_config.dim / falcon_config.n_heads,
+            falcon_config.hidden_size,
+            falcon_config.n_head,
+            falcon_config.n_head_kv,
+            falcon_config.hidden_size / falcon_config.n_head,
+            falcon_config.hidden_size / falcon_config.n_head,
             0.0f,    /*dropout*/
             false,   /*bias*/
             false,   /*add_bias_kv*/
@@ -157,24 +153,25 @@ void FALCON::create_falcon_model(FFModel &ff,
     weights_layers.emplace("layers_" + std::to_string(i) + "_attention_weight",
                            attention_layer);
     Tensor dense_h_to_4h =
-        ff.dense(att_norm, falcon_config.dim * 4, AC_MODE_NONE, false);
+        ff.dense(att_norm, falcon_config.hidden_size * 4, AC_MODE_NONE, false);
     Layer *dense_h_to_4h_layer = ff.layers.back();
     weights_layers.emplace("layers_" + std::to_string(i) +
-                               "_mlp_dense_h_to_4layers_weight",
+                               "_mlp_dense_h_to_4h_weight",
                            dense_h_to_4h_layer);
     dense_h_to_4h = ff.gelu(dense_h_to_4h);
     Tensor mlp_output =
-        ff.dense(dense_h_to_4h, falcon_config.dim, AC_MODE_NONE, false);
+        ff.dense(dense_h_to_4h, falcon_config.hidden_size, AC_MODE_NONE, false);
     Layer *dense_4h_to_h_layer = ff.layers.back();
     weights_layers.emplace("layers_" + std::to_string(i) +
-                               "_mlp_dense_4h_to_layers_weight",
+                               "_mlp_dense_4h_to_h_weight",
                            dense_4h_to_h_layer);
 
     token = ff.add(token, mha);
     token = ff.add(token, mlp_output);
   }
   // final normalization and linear
-  Tensor ln_f = ff.layer_norm(token, axes, true, falcon_config.norm_eps);
+  Tensor ln_f =
+      ff.layer_norm(token, axes, true, falcon_config.layer_norm_epsilon);
   Layer *ln_f_layer = ff.layers.back();
   weights_layers.emplace("ln_f_weight", ln_f_layer);
 
@@ -193,16 +190,15 @@ void FALCON::create_falcon_model(FFModel &ff,
 
   // Compile the model
   std::cout << "------start compile ----------" << std::endl;
-  int tensor_partition_num = ff.config.tensor_parallelism_degree;
   InferenceManager *im = InferenceManager::get_inference_manager();
   im->compile_model_and_allocate_buffer(&ff);
   FileDataLoader fileloader("",
                             weight_file_path,
-                            falcon_config.n_heads,
-                            falcon_config.n_kv_heads,
-                            falcon_config.dim,
-                            falcon_config.dim / falcon_config.n_heads,
-                            tensor_partition_num);
+                            falcon_config.n_head,
+                            falcon_config.n_head_kv,
+                            falcon_config.hidden_size,
+                            falcon_config.hidden_size / falcon_config.n_head,
+                            ff.config.tensor_parallelism_degree);
   std::cout << "------laod weights ----------" << std::endl;
   fileloader.load_weights(&ff, weights_layers, use_full_precision);
   std::cout << "------load weight finished----------" << std::endl;
diff --git a/inference/models/falcon.h b/inference/models/falcon.h
index d37ffbc713..a822f9be34 100644
--- a/inference/models/falcon.h
+++ b/inference/models/falcon.h
@@ -26,84 +26,63 @@ namespace FlexFlow {
 
 class FALCON {
 public:
-  struct Config {
-    Config(void) {
-      // todo read from config/param file
-      n_layers = 32;
-      vocab_size = 32000;
-      n_heads = 32;
-      n_kv_heads = 1;
-      dim = 4096;
-      multiple_of = 256;
-      norm_eps = 1e-6;
-      total_requests = 2560;
-      incremental_mode = true;
-      hidden_dim = 11008;
-      max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
-      max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
-      max_beam_width = BeamSearchBatchConfig::MAX_BEAM_WIDTH;
-      max_beam_depth = BeamSearchBatchConfig::MAX_BEAM_DEPTH;
-    }
-
-    Config(std::string config_filepath) {
-      std::ifstream config_file(config_filepath);
+  struct FalconConfig {
+    FalconConfig(std::string const &model_config_file_path) {
+      std::ifstream config_file(model_config_file_path);
       if (config_file.is_open()) {
         try {
-          json config_json;
-          config_file >> config_json;
-
-          n_layers = config_json["n_layers"];
-          vocab_size = config_json["vocab_size"];
-          n_heads = config_json["n_heads"];
-          n_kv_heads = config_json["n_kv_heads"];
-          dim = config_json["dim"];
-          multiple_of = config_json["multiple_of"];
-          norm_eps = config_json["norm_eps"];
-          total_requests = config_json["total_requests"];
-          incremental_mode = config_json["incremental_mode"];
-          hidden_dim = config_json["hidden_dim"];
-          head_dim = dim / n_heads;
-          // Override values below
-          /* max_seq_len = config_json["max_seq_len"];
-          max_num_tokens = config_json["max_num_tokens"];
-          max_beam_width = config_json["max_beam_width"];
-          max_beam_depth = config_json["max_beam_depth"];
-          hidden_dim = config_json["hidden_dim"]; */
-          max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
-          max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
-          max_beam_width = BeamSearchBatchConfig::MAX_BEAM_WIDTH;
-          max_beam_depth = BeamSearchBatchConfig::MAX_BEAM_DEPTH;
+          json model_config;
+          config_file >> model_config;
+          bias = model_config["bias"];
+          hidden_size = model_config["hidden_size"];
+          layer_norm_epsilon = model_config["layer_norm_epsilon"];
+          multi_query = model_config["multi_query"];
+          n_head = model_config["n_head"];
+          if (model_config.contains("n_head_kv")) {
+            n_head_kv = model_config["n_head_kv"];
+          } else {
+            n_head_kv = 1;
+          }
+          n_layer = model_config["n_layer"];
+          parallel_attn = model_config["parallel_attn"];
+          vocab_size = model_config["vocab_size"];
         } catch (json::exception const &e) {
           std::cerr << "Error parsing JSON file: " << e.what() << std::endl;
           assert(false);
         }
       } else {
-        std::cerr << "Error opening JSON file." << std::endl;
+        std::cerr << "Error opening JSON file " << model_config_file_path
+                  << std::endl;
         assert(false);
       }
+      max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
+      max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
+      max_beam_width = BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+      max_beam_depth = BeamSearchBatchConfig::MAX_BEAM_DEPTH;
     }
 
-    void printConfig() const {
+    void print() const {
       std::cout << "Falcon Config:" << std::endl;
-      std::cout << "n_layers: " << n_layers << std::endl;
-      std::cout << "vocab_size: " << vocab_size << std::endl;
-      std::cout << "n_heads: " << n_heads << std::endl;
-      std::cout << "dim: " << dim << std::endl;
-      std::cout << "multiple_of: " << multiple_of << std::endl;
-      std::cout << "norm_eps: " << norm_eps << std::endl;
-      std::cout << "total_requests: " << total_requests << std::endl;
-      std::cout << "incremental_mode: " << incremental_mode << std::endl;
-      std::cout << "max_seq_len: " << max_seq_len << std::endl;
-      std::cout << "max_num_tokens: " << max_num_tokens << std::endl;
-      std::cout << "max_beam_width: " << max_beam_width << std::endl;
-      std::cout << "max_beam_depth: " << max_beam_depth << std::endl;
-      std::cout << "hidden_dim: " << hidden_dim << std::endl;
+      std::cout << "\tbias: " << bias << std::endl;
+      std::cout << "\thidden_size: " << hidden_size << std::endl;
+      std::cout << "\tlayer_norm_epsilon: " << layer_norm_epsilon << std::endl;
+      std::cout << "\tmulti_query: " << multi_query << std::endl;
+      std::cout << "\tn_head: " << n_head << std::endl;
+      std::cout << "\tn_head_kv: " << n_head << std::endl;
+      std::cout << "\tn_layer: " << n_layer << std::endl;
+      std::cout << "\tparallel_attn: " << parallel_attn << std::endl;
+      std::cout << "\tvocab_size: " << vocab_size << std::endl;
+
+      std::cout << "\tmax_seq_len: " << max_seq_len << std::endl;
+      std::cout << "\tmax_num_tokens: " << max_num_tokens << std::endl;
+      std::cout << "\tmax_beam_width: " << max_beam_width << std::endl;
+      std::cout << "\tmax_beam_depth: " << max_beam_depth << std::endl;
     }
 
-    int n_heads, n_layers, vocab_size, dim, multiple_of, hidden_dim,
-        total_requests, incremental_mode, max_seq_len, max_num_tokens,
-        max_beam_width, max_beam_depth, head_dim, n_kv_heads;
-    float norm_eps;
+    bool bias, multi_query, parallel_attn;
+    int hidden_size, n_head, n_head_kv, n_layer, vocab_size;
+    float layer_norm_epsilon;
+    int max_seq_len, max_num_tokens, max_beam_width, max_beam_depth;
   };
 
   static void create_falcon_model(FFModel &ff,
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index 79b042b97c..5a607e4872 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -18,6 +18,7 @@
 namespace FlexFlow {
 
 using namespace Legion;
+using json = nlohmann::json;
 
 void LLAMA::create_llama_model(FFModel &ff,
                                std::string const &model_config_file_path,
@@ -26,8 +27,15 @@ void LLAMA::create_llama_model(FFModel &ff,
                                SamplingConfig samplingConfig,
                                bool use_full_precision) {
   // do not apply cpu offload in beam search model.
-  Config llama_config(model_config_file_path);
-  llama_config.printConfig();
+  LLAMAConfig llama_config(model_config_file_path);
+  llama_config.print();
+
+  if (ff.config.tensor_parallelism_degree > llama_config.num_attention_heads ||
+      llama_config.num_attention_heads % ff.config.tensor_parallelism_degree !=
+          0) {
+    assert(false && "The number of attention heads is smaller, or it is not "
+                    "divisible by the tensor parallelism degree");
+  }
 
   std::unordered_map<std::string, Layer *> weights_layers;
 
@@ -45,7 +53,7 @@ void LLAMA::create_llama_model(FFModel &ff,
   if (use_full_precision) {
     token = ff.embedding(input,
                          llama_config.vocab_size,
-                         llama_config.dim,
+                         llama_config.hidden_size,
                          AGGR_MODE_NONE,
                          DT_FLOAT,
                          NULL,
@@ -53,7 +61,7 @@ void LLAMA::create_llama_model(FFModel &ff,
   } else {
     token = ff.embedding(input,
                          llama_config.vocab_size,
-                         llama_config.dim,
+                         llama_config.hidden_size,
                          AGGR_MODE_NONE,
                          DT_HALF,
                          NULL,
@@ -63,12 +71,12 @@ void LLAMA::create_llama_model(FFModel &ff,
   Layer *embedding = ff.layers.back();
   weights_layers.emplace("tok_embeddings_weight", embedding);
 
-  for (int i = 0; i < llama_config.n_layers; i++) {
+  for (int i = 0; i < llama_config.num_hidden_layers; i++) {
     // set transformer layer id
     ff.set_transformer_layer_id(i);
     // step 1: attention
     Tensor att_norm =
-        ff.rms_norm(token, llama_config.norm_eps, llama_config.dim);
+        ff.rms_norm(token, llama_config.rms_norm_eps, llama_config.hidden_size);
     Layer *attention_norm = ff.layers.back();
     weights_layers.emplace("layers_" + std::to_string(i) +
                                "_attention_norm_weight",
@@ -79,10 +87,10 @@ void LLAMA::create_llama_model(FFModel &ff,
       case BEAM_SEARCH_MODE: {
         mha = ff.spec_inc_multihead_self_attention(
             att_norm,
-            llama_config.dim,
-            llama_config.n_heads,
-            llama_config.dim / llama_config.n_heads,
-            llama_config.dim / llama_config.n_heads,
+            llama_config.hidden_size,
+            llama_config.num_attention_heads,
+            llama_config.hidden_size / llama_config.num_attention_heads,
+            llama_config.hidden_size / llama_config.num_attention_heads,
             0.0f,
             false,
             false,
@@ -95,10 +103,10 @@ void LLAMA::create_llama_model(FFModel &ff,
       case TREE_VERIFY_MODE: {
         mha = ff.inc_multihead_self_attention_verify(
             att_norm,
-            llama_config.dim,
-            llama_config.n_heads,
-            llama_config.dim / llama_config.n_heads,
-            llama_config.dim / llama_config.n_heads,
+            llama_config.hidden_size,
+            llama_config.num_attention_heads,
+            llama_config.hidden_size / llama_config.num_attention_heads,
+            llama_config.hidden_size / llama_config.num_attention_heads,
             0.0f,    /*dropout*/
             false,   /*bias*/
             false,   /*add_bias_kv*/
@@ -112,10 +120,10 @@ void LLAMA::create_llama_model(FFModel &ff,
       case INC_DECODING_MODE: {
         mha = ff.inc_multihead_self_attention(
             att_norm,
-            llama_config.dim,
-            llama_config.n_heads,
-            llama_config.dim / llama_config.n_heads,
-            llama_config.dim / llama_config.n_heads,
+            llama_config.hidden_size,
+            llama_config.num_attention_heads,
+            llama_config.hidden_size / llama_config.num_attention_heads,
+            llama_config.hidden_size / llama_config.num_attention_heads,
             0.0f,    /*dropout*/
             false,   /*bias*/
             false,   /*add_bias_kv*/
@@ -137,17 +145,19 @@ void LLAMA::create_llama_model(FFModel &ff,
 
     // step 2: SILU activaion
     Tensor ff_norm =
-        ff.rms_norm(token, llama_config.norm_eps, llama_config.dim);
+        ff.rms_norm(token, llama_config.rms_norm_eps, llama_config.hidden_size);
     Layer *ffn_layer = ff.layers.back();
     weights_layers.emplace("layers_" + std::to_string(i) + "_ffn_norm_weight",
                            ffn_layer);
 
-    Tensor w1 = ff.dense(ff_norm, llama_config.hidden_dim, AC_MODE_NONE, false);
+    Tensor w1 =
+        ff.dense(ff_norm, llama_config.intermediate_size, AC_MODE_NONE, false);
     Layer *w1_layer = ff.layers.back();
     weights_layers.emplace(
         "layers_" + std::to_string(i) + "_feed_forward_w1_weight", w1_layer);
 
-    Tensor w3 = ff.dense(ff_norm, llama_config.hidden_dim, AC_MODE_NONE, false);
+    Tensor w3 =
+        ff.dense(ff_norm, llama_config.intermediate_size, AC_MODE_NONE, false);
     Layer *w3_layer = ff.layers.back();
     weights_layers.emplace(
         "layers_" + std::to_string(i) + "_feed_forward_w3_weight", w3_layer);
@@ -156,7 +166,7 @@ void LLAMA::create_llama_model(FFModel &ff,
     Tensor silu = ff.multiply(w1, sigmoid);
     Tensor multi = ff.multiply(silu, w3);
 
-    Tensor w2 = ff.dense(multi, llama_config.dim, AC_MODE_NONE, false);
+    Tensor w2 = ff.dense(multi, llama_config.hidden_size, AC_MODE_NONE, false);
     Layer *w2_layer = ff.layers.back();
     weights_layers.emplace(
         "layers_" + std::to_string(i) + "_feed_forward_w2_weight", w2_layer);
@@ -164,7 +174,8 @@ void LLAMA::create_llama_model(FFModel &ff,
   }
   // final normalization and linear
   std::vector<int> axes = {2};
-  token = ff.rms_norm(token, llama_config.norm_eps, llama_config.dim);
+  token =
+      ff.rms_norm(token, llama_config.rms_norm_eps, llama_config.hidden_size);
   Layer *final_norm = ff.layers.back();
   weights_layers.emplace("norm_weight", final_norm);
 
@@ -192,15 +203,15 @@ void LLAMA::create_llama_model(FFModel &ff,
   InferenceManager *im = InferenceManager::get_inference_manager();
   // Compile the model
   std::cout << "------start compile ----------" << std::endl;
-  int tensor_partition_num = ff.config.tensor_parallelism_degree;
   im->compile_model_and_allocate_buffer(&ff);
   FileDataLoader fileloader("",
                             weight_file_path,
-                            llama_config.n_heads,
-                            llama_config.n_heads,
-                            llama_config.dim,
-                            llama_config.dim / llama_config.n_heads,
-                            tensor_partition_num);
+                            llama_config.num_attention_heads,
+                            llama_config.num_attention_heads,
+                            llama_config.hidden_size,
+                            llama_config.hidden_size /
+                                llama_config.num_attention_heads,
+                            ff.config.tensor_parallelism_degree);
   fileloader.load_weights(&ff, weights_layers, use_full_precision);
   std::cout << "------load weight finished----------" << std::endl;
 
diff --git a/inference/models/llama.h b/inference/models/llama.h
index 61d8908d0c..311bdedbe6 100644
--- a/inference/models/llama.h
+++ b/inference/models/llama.h
@@ -26,81 +26,55 @@ namespace FlexFlow {
 
 class LLAMA {
 public:
-  struct Config {
-    Config(void) {
-      // todo read from config/param file
-      n_layers = 32;
-      vocab_size = 32000;
-      n_heads = 32;
-      dim = 4096;
-      multiple_of = 256;
-      norm_eps = 1e-6;
-      total_requests = 2560;
-      incremental_mode = true;
-      hidden_dim = 11008;
-      max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
-      max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
-      max_beam_width = BeamSearchBatchConfig::MAX_BEAM_WIDTH;
-      max_beam_depth = BeamSearchBatchConfig::MAX_BEAM_DEPTH;
-    }
-
-    Config(std::string config_filepath) {
-      std::ifstream config_file(config_filepath);
+  struct LLAMAConfig {
+    LLAMAConfig(std::string const &model_config_file_path) {
+      std::ifstream config_file(model_config_file_path);
       if (config_file.is_open()) {
         try {
-          json config_json;
-          config_file >> config_json;
-
-          n_layers = config_json["n_layers"];
-          vocab_size = config_json["vocab_size"];
-          n_heads = config_json["n_heads"];
-          dim = config_json["dim"];
-          multiple_of = config_json["multiple_of"];
-          norm_eps = config_json["norm_eps"];
-          total_requests = config_json["total_requests"];
-          incremental_mode = config_json["incremental_mode"];
-          hidden_dim = config_json["hidden_dim"];
-          // Override values below
-          /* max_seq_len = config_json["max_seq_len"];
-          max_num_tokens = config_json["max_num_tokens"];
-          max_beam_width = config_json["max_beam_width"];
-          max_beam_depth = config_json["max_beam_depth"];
-          hidden_dim = config_json["hidden_dim"]; */
-          max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
-          max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
-          max_beam_width = BeamSearchBatchConfig::MAX_BEAM_WIDTH;
-          max_beam_depth = BeamSearchBatchConfig::MAX_BEAM_DEPTH;
+          json model_config;
+          config_file >> model_config;
+          num_hidden_layers = model_config["num_hidden_layers"];
+          vocab_size = model_config["vocab_size"];
+          num_attention_heads = model_config["num_attention_heads"];
+          hidden_size = model_config["hidden_size"];
+          rms_norm_eps = model_config["rms_norm_eps"];
+          intermediate_size = model_config["intermediate_size"];
         } catch (json::exception const &e) {
-          std::cerr << "Error parsing JSON file: " << e.what() << std::endl;
+          std::cerr << "Error parsing LLAMA config from JSON file: " << e.what()
+                    << std::endl;
           assert(false);
         }
       } else {
-        std::cerr << "Error opening JSON file." << std::endl;
+        std::cerr << "Error opening JSON file " << model_config_file_path
+                  << std::endl;
         assert(false);
       }
+      max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
+      max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
+      max_beam_width = BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+      max_beam_depth = BeamSearchBatchConfig::MAX_BEAM_DEPTH;
     }
 
-    void printConfig() const {
+    void print() const {
       std::cout << "LLAMA Config:" << std::endl;
-      std::cout << "n_layers: " << n_layers << std::endl;
-      std::cout << "vocab_size: " << vocab_size << std::endl;
-      std::cout << "n_heads: " << n_heads << std::endl;
-      std::cout << "dim: " << dim << std::endl;
-      std::cout << "multiple_of: " << multiple_of << std::endl;
-      std::cout << "norm_eps: " << norm_eps << std::endl;
-      std::cout << "total_requests: " << total_requests << std::endl;
-      std::cout << "incremental_mode: " << incremental_mode << std::endl;
-      std::cout << "max_seq_len: " << max_seq_len << std::endl;
-      std::cout << "max_num_tokens: " << max_num_tokens << std::endl;
-      std::cout << "max_beam_width: " << max_beam_width << std::endl;
-      std::cout << "max_beam_depth: " << max_beam_depth << std::endl;
-      std::cout << "hidden_dim: " << hidden_dim << std::endl;
+      std::cout << "\tnum_hidden_layers: " << num_hidden_layers << std::endl;
+      std::cout << "\tvocab_size: " << vocab_size << std::endl;
+      std::cout << "\tnum_attention_heads: " << num_attention_heads
+                << std::endl;
+      std::cout << "\thidden_size: " << hidden_size << std::endl;
+      std::cout << "\trms_norm_eps: " << rms_norm_eps << std::endl;
+      std::cout << "\tintermediate_size: " << intermediate_size << std::endl;
+
+      std::cout << "\tmax_seq_len: " << max_seq_len << std::endl;
+      std::cout << "\tmax_num_tokens: " << max_num_tokens << std::endl;
+      std::cout << "\tmax_beam_width: " << max_beam_width << std::endl;
+      std::cout << "\tmax_beam_depth: " << max_beam_depth << std::endl;
     }
 
-    int n_heads, n_layers, vocab_size, dim, multiple_of, hidden_dim,
-        total_requests, incremental_mode, max_seq_len, max_num_tokens,
-        max_beam_width, max_beam_depth;
-    float norm_eps;
+    int max_seq_len, max_num_tokens, max_beam_width, max_beam_depth;
+    int num_hidden_layers, vocab_size, num_attention_heads, hidden_size,
+        intermediate_size;
+    float rms_norm_eps;
   };
 
   static void create_llama_model(FFModel &ff,
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index 8a1a17d3af..fc1d5512ba 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -18,14 +18,22 @@
 namespace FlexFlow {
 
 using namespace Legion;
+using json = nlohmann::json;
 
 void OPT::create_opt_model(FFModel &ff,
                            std::string const &model_config_file_path,
                            std::string const &weight_file_path,
                            InferenceMode mode,
                            bool use_full_precision) {
-  Config opt_config(model_config_file_path);
-  opt_config.printConfig();
+  OPTConfig opt_config(model_config_file_path);
+  opt_config.print();
+
+  if (ff.config.tensor_parallelism_degree > opt_config.num_attention_heads ||
+      opt_config.num_attention_heads % ff.config.tensor_parallelism_degree !=
+          0) {
+    assert(false && "The number of attention heads is smaller, or it is not "
+                    "divisible by the tensor parallelism degree");
+  }
 
   std::unordered_map<std::string, Layer *> weights_layers;
 
@@ -223,7 +231,6 @@ void OPT::create_opt_model(FFModel &ff,
 
   //------------------- compile the model --------------------------------
   std::cout << "------start compile ----------" << std::endl;
-  int tensor_partition_num = ff.config.tensor_parallelism_degree;
   InferenceManager *im = InferenceManager::get_inference_manager();
   im->compile_model_and_allocate_buffer(&ff);
   FileDataLoader fileloader("",
@@ -233,7 +240,7 @@ void OPT::create_opt_model(FFModel &ff,
                             opt_config.hidden_size,
                             opt_config.hidden_size /
                                 opt_config.num_attention_heads,
-                            tensor_partition_num);
+                            ff.config.tensor_parallelism_degree);
   fileloader.load_weights(&ff, weights_layers, use_full_precision);
   std::cout << "------finished loading weights----------" << std::endl;
   im->init_operators_inference(&ff);
diff --git a/inference/models/opt.h b/inference/models/opt.h
index 45ee6e6181..ab972ae10c 100644
--- a/inference/models/opt.h
+++ b/inference/models/opt.h
@@ -26,83 +26,70 @@ namespace FlexFlow {
 
 class OPT {
 public:
-  struct Config {
-    Config(void) {
-      vocab_size = 50272;
-      word_embed_proj_dim = 4096;
-      hidden_size = 4096;
-      num_attention_heads = 32;
-      max_position_embeddings = 2048;
-      layer_norm_elementwise_affine = true;
-      dropout = 0.1;
-      ffn_dim = 16384;
-      num_hidden_layers = 32;
-      max_beam_width = 1;
-      batchSize = 8;
-      sentence_len = 100;
-      max_beam_depth = 4;
-    }
-    Config(std::string config_filepath) {
-      std::ifstream config_file(config_filepath);
+  struct OPTConfig {
+    OPTConfig(std::string const &model_config_file_path) {
+      std::ifstream config_file(model_config_file_path);
       if (config_file.is_open()) {
         try {
-          json config_json;
-          config_file >> config_json;
-
-          vocab_size = config_json["vocab_size"];
-          word_embed_proj_dim = config_json["word_embed_proj_dim"];
-          hidden_size = config_json["hidden_size"];
-          num_attention_heads = config_json["num_attention_heads"];
-          max_position_embeddings = config_json["max_position_embeddings"];
+          json model_config;
+          config_file >> model_config;
+          do_layer_norm_before = model_config["do_layer_norm_before"];
+          dropout = model_config["dropout"];
+          enable_bias = model_config["enable_bias"];
+          ffn_dim = model_config["ffn_dim"];
+          hidden_size = model_config["hidden_size"];
           layer_norm_elementwise_affine =
-              config_json["layer_norm_elementwise_affine"];
-          dropout = config_json["dropout"];
-          ffn_dim = config_json["ffn_dim"];
-          num_hidden_layers = config_json["num_hidden_layers"];
-          max_beam_width = config_json["max_beam_width"];
-          batchSize = config_json["batchSize"];
-          sentence_len = config_json["sentence_len"];
-          max_beam_depth = config_json["max_beam_depth"];
+              model_config["layer_norm_elementwise_affine"];
+          max_position_embeddings = model_config["max_position_embeddings"];
+          num_attention_heads = model_config["num_attention_heads"];
+          num_hidden_layers = model_config["num_hidden_layers"];
+          vocab_size = model_config["vocab_size"];
+          word_embed_proj_dim = model_config["word_embed_proj_dim"];
         } catch (json::exception const &e) {
           std::cerr << "Error parsing JSON file: " << e.what() << std::endl;
           assert(false);
         }
       } else {
-        std::cerr << "Error opening JSON file." << std::endl;
+        std::cerr << "Error opening JSON file " << model_config_file_path
+                  << std::endl;
         assert(false);
       }
+      max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
+      max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
+      max_beam_width = BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+      max_beam_depth = BeamSearchBatchConfig::MAX_BEAM_DEPTH;
     }
-    void printConfig() const {
+
+    void print() const {
       std::cout << "OPT Config:" << std::endl;
-      std::cout << "vocab_size: " << vocab_size << std::endl;
-      std::cout << "word_embed_proj_dim: " << word_embed_proj_dim << std::endl;
-      std::cout << "hidden_size: " << hidden_size << std::endl;
-      std::cout << "num_attention_heads: " << num_attention_heads << std::endl;
-      std::cout << "max_position_embeddings: " << max_position_embeddings
+      std::cout << "\tdo_layer_norm_before: " << do_layer_norm_before
                 << std::endl;
-      std::cout << "layer_norm_elementwise_affine: " << std::boolalpha
+      std::cout << "\tdropout: " << dropout << std::endl;
+      std::cout << "\tenable_bias: " << enable_bias << std::endl;
+      std::cout << "\tffn_dim: " << ffn_dim << std::endl;
+      std::cout << "\thidden_size: " << hidden_size << std::endl;
+      std::cout << "\tlayer_norm_elementwise_affine: "
                 << layer_norm_elementwise_affine << std::endl;
-      std::cout << "dropout: " << dropout << std::endl;
-      std::cout << "ffn_dim: " << ffn_dim << std::endl;
-      std::cout << "num_hidden_layers: " << num_hidden_layers << std::endl;
-      std::cout << "max_beam_width: " << max_beam_width << std::endl;
-      std::cout << "batchSize: " << batchSize << std::endl;
-      std::cout << "sentence_len: " << sentence_len << std::endl;
-      std::cout << "max_beam_depth: " << max_beam_depth << std::endl;
+      std::cout << "\tmax_position_embeddings: " << max_position_embeddings
+                << std::endl;
+      std::cout << "\tnum_attention_heads: " << num_attention_heads
+                << std::endl;
+      std::cout << "\tnum_hidden_layers: " << num_hidden_layers << std::endl;
+      std::cout << "\tvocab_size: " << vocab_size << std::endl;
+      std::cout << "\tword_embed_proj_dim: " << word_embed_proj_dim
+                << std::endl;
+
+      std::cout << "\tmax_seq_len: " << max_seq_len << std::endl;
+      std::cout << "\tmax_num_tokens: " << max_num_tokens << std::endl;
+      std::cout << "\tmax_beam_width: " << max_beam_width << std::endl;
+      std::cout << "\tmax_beam_depth: " << max_beam_depth << std::endl;
     }
-    int vocab_size;
-    int word_embed_proj_dim;
-    int hidden_size;
-    int num_attention_heads;
-    int max_position_embeddings;
-    bool layer_norm_elementwise_affine;
+
+    int max_seq_len, max_num_tokens, max_beam_width, max_beam_depth;
+    bool do_layer_norm_before, enable_bias, layer_norm_elementwise_affine;
     float dropout;
-    int ffn_dim;
-    int num_hidden_layers;
-    int max_beam_width;
-    int batchSize;
-    int sentence_len;
-    int max_beam_depth;
+    int ffn_dim, hidden_size, max_position_embeddings, num_attention_heads,
+        num_hidden_layers, vocab_size, word_embed_proj_dim;
   };
 
   static void create_opt_model(FFModel &ff,
diff --git a/inference/python/incr_decoding.py b/inference/python/incr_decoding.py
index 6db7d09c56..b3cee48458 100644
--- a/inference/python/incr_decoding.py
+++ b/inference/python/incr_decoding.py
@@ -48,8 +48,8 @@ def get_configs():
             "num_cpus": 4,
             "legion_utility_processors": 4,
             "data_parallelism_degree": 1,
-            "tensor_parallelism_degree": 2,
-            "pipeline_parallelism_degree": 2,
+            "tensor_parallelism_degree": 1,
+            "pipeline_parallelism_degree": 4,
             "offload": False,
             "offload_reserve_space_size": 1024**2,
             "use_4bit_quantization": False,
@@ -59,12 +59,11 @@ def get_configs():
         }
         llm_configs = {
             # required parameters
-            "llm_model": "decapoda-research/llama-7b-hf",
+            "llm_model": "tiiuae/falcon-7b",
             # optional parameters
-            "llm_weight": "",
-            "llm_tokenizer": "",
-            "clean_model_cache": False,
-            "full_precision": False,
+            "cache_path": "",
+            "refresh_cache": False,
+            "full_precision": True,
             "prompt": "",
             "output_file": "",
         }
@@ -87,9 +86,8 @@ def main():
     llm = ff.LLM(
         configs.llm_model,
         data_type=ff_data_type,
-        tokenizer_path=configs.llm_tokenizer,
-        weights_path=configs.llm_weight,
-        clean_cache=configs.clean_model_cache,
+        cache_path=configs.cache_path,
+        refresh_cache=configs.refresh_cache,
         output_file=configs.output_file,
     )
 
diff --git a/inference/python/spec_infer.py b/inference/python/spec_infer.py
index 7a0cd1dc64..a19a930f2d 100644
--- a/inference/python/spec_infer.py
+++ b/inference/python/spec_infer.py
@@ -61,27 +61,24 @@ def get_configs():
             # required llm arguments
             "llm_model": "decapoda-research/llama-7b-hf",
             # optional llm parameters
-            "llm_weight": "",
-            "llm_tokenizer": "",
-            "clean_model_cache": False,
+            "cache_path": "",
+            "refresh_cache": False,
             "full_precision": False,
             "ssms": [
                 {
                     # required ssm parameter
                     "ssm_model": "JackFram/llama-160m",
                     # optional ssm parameters
-                    "ssm_weight": "",
-                    "ssm_tokenizer": "",
-                    "clean_model_cache": False,
+                    "cache_path": "",
+                    "refresh_cache": False,
                     "full_precision": False,
                 },
                 {
                     # required ssm parameter
                     "ssm_model": "facebook/opt-125m",
                     # optional ssm parameters
-                    "ssm_weight": "",
-                    "ssm_tokenizer": "",
-                    "clean_model_cache": False,
+                    "cache_path": "",
+                    "refresh_cache": False,
                     "full_precision": False,
                 },
             ],
@@ -107,9 +104,8 @@ def main():
     llm = ff.LLM(
         configs.llm_model,
         data_type=ff_data_type,
-        tokenizer_path=configs.llm_tokenizer,
-        weights_path=configs.llm_weight,
-        clean_cache=configs.clean_model_cache,
+        cache_path=configs.cache_path,
+        refresh_cache=configs.refresh_cache,
         output_file=configs.output_file,
     )
 
@@ -123,9 +119,8 @@ def main():
         ssm = ff.SSM(
             ssm_config.ssm_model,
             data_type=ff_data_type,
-            tokenizer_path=ssm_config.ssm_tokenizer,
-            weights_path=ssm_config.ssm_weight,
-            clean_cache=ssm_config.clean_model_cache,
+            cache_path=ssm_config.cache_path,
+            refresh_cache=ssm_config.refresh_cache,
             output_file=configs.output_file,
         )
         ssms.append(ssm)
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 6b218e107c..67faf98536 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -19,93 +19,64 @@
 #include "models/opt.h"
 #include <filesystem>
 #include <nlohmann/json.hpp>
+#include <wordexp.h>
 
 using namespace Legion;
+using json = nlohmann::json;
 
 LegionRuntime::Logger::Category log_app("llama");
 
 struct FilePaths {
-  std::string llm_weight_file_path;
-  std::string llm_config_file_path;
-  std::vector<std::string> ssm_weight_file_paths;
-  std::vector<std::string> ssm_config_file_paths;
+  std::string cache_folder_path;
   std::string prompt_file_path;
-  std::string tokenizer_file_path;
   std::string output_file_path;
 };
 
-struct ModelTypes {
+struct ModelNames {
+  std::string llm_model_name;
+  std::vector<std::string> ssm_model_names;
+};
+
+struct ModelMeta {
+  ModelNames model_names;
+
   ModelType llm_model_type;
+  std::string llm_tokenizer_path;
+  std::string llm_weights_path;
+  std::string llm_model_config_path;
+
   std::vector<ModelType> ssm_model_types;
+  std::vector<std::string> ssm_model_config_paths;
+  std::vector<std::string> ssm_model_weights_paths;
 };
 
 void parse_input_args(char **argv,
                       int argc,
                       FilePaths &paths,
-                      ModelTypes &model_types,
+                      ModelNames &model_names,
                       bool &use_full_precision,
                       bool &verbose) {
   for (int i = 1; i < argc; i++) {
-    // llm model type
+    // llm model name
     if (!strcmp(argv[i], "-llm-model")) {
-      std::string model_type_str = std::string(argv[++i]);
-      std::transform(model_type_str.begin(),
-                     model_type_str.end(),
-                     model_type_str.begin(),
-                     [](unsigned char c) { return std::tolower(c); });
-      if (model_type_str == "llama") {
-        model_types.llm_model_type = ModelType::LLAMA;
-      } else if (model_type_str == "llama2") {
-        model_types.llm_model_type = ModelType::LLAMA2;
-      } else if (model_type_str == "opt") {
-        model_types.llm_model_type = ModelType::OPT;
-      } else if (model_type_str == "falcon") {
-        model_types.llm_model_type = ModelType::FALCON;
-      } else {
-        model_types.llm_model_type = ModelType::UNKNOWN;
+      model_names.llm_model_name = std::string(argv[++i]);
+      for (char &c : model_names.llm_model_name) {
+        c = std::tolower(c);
       }
       continue;
     }
-    // llm model weights
-    if (!strcmp(argv[i], "-llm-weight")) {
-      paths.llm_weight_file_path = std::string(argv[++i]);
-      continue;
-    }
-    // llm model configs
-    if (!strcmp(argv[i], "-llm-config")) {
-      paths.llm_config_file_path = std::string(argv[++i]);
-      continue;
-    }
-    // ssm models types
+    // ssm models names
     if (!strcmp(argv[i], "-ssm-model")) {
-      std::string model_type_str = std::string(argv[++i]);
-      std::transform(model_type_str.begin(),
-                     model_type_str.end(),
-                     model_type_str.begin(),
-                     [](unsigned char c) { return std::tolower(c); });
-      if (model_type_str == "llama") {
-        model_types.ssm_model_types.push_back(ModelType::LLAMA);
-      } else if (model_type_str == "llama2") {
-        model_types.ssm_model_types.push_back(ModelType::LLAMA2);
-      } else if (model_type_str == "opt") {
-        model_types.ssm_model_types.push_back(ModelType::OPT);
-      } else if (model_type_str == "falcon") {
-        model_types.ssm_model_types.push_back(ModelType::FALCON);
-      } else {
-        model_types.ssm_model_types.push_back(ModelType::UNKNOWN);
+      std::string ssm_model_name = std::string(argv[++i]);
+      for (char &c : ssm_model_name) {
+        c = std::tolower(c);
       }
+      model_names.ssm_model_names.push_back(ssm_model_name);
       continue;
     }
-    // ssm model weights
-    if (!strcmp(argv[i], "-ssm-weight")) {
-      std::string file_path = std::string(argv[++i]);
-      paths.ssm_weight_file_paths.push_back(file_path);
-      continue;
-    }
-    // ssm model configs
-    if (!strcmp(argv[i], "-ssm-config")) {
-      std::string file_path = std::string(argv[++i]);
-      paths.ssm_config_file_paths.push_back(file_path);
+    // cache folder
+    if (!strcmp(argv[i], "-cache-folder")) {
+      paths.cache_folder_path = std::string(argv[++i]);
       continue;
     }
     // prompts
@@ -113,11 +84,6 @@ void parse_input_args(char **argv,
       paths.prompt_file_path = std::string(argv[++i]);
       continue;
     }
-    // tokenizer
-    if (!strcmp(argv[i], "-tokenizer")) {
-      paths.tokenizer_file_path = std::string(argv[++i]);
-      continue;
-    }
     // output file
     if (!strcmp(argv[i], "-output-file")) {
       paths.output_file_path = std::string(argv[++i]);
@@ -133,6 +99,131 @@ void parse_input_args(char **argv,
       continue;
     }
   }
+  if (paths.cache_folder_path.empty()) {
+    paths.cache_folder_path = "~/.cache/flexflow";
+  }
+  // Expand ~ to the home directory if needed
+  wordexp_t p;
+  wordexp(paths.cache_folder_path.c_str(), &p, 0);
+  paths.cache_folder_path = p.we_wordv[0];
+  wordfree(&p);
+}
+
+void get_model_meta(FilePaths &file_paths,
+                    ModelMeta &model_metadata,
+                    bool use_full_precision) {
+  if (model_metadata.model_names.llm_model_name.empty() ||
+      model_metadata.model_names.ssm_model_names.size() == 0) {
+    assert(false && "SpecInfer needs at least one LLM and one SSM for "
+                    "speculative inference");
+  }
+  model_metadata.llm_model_config_path =
+      join_path({file_paths.cache_folder_path,
+                 "configs",
+                 model_metadata.model_names.llm_model_name,
+                 "config.json"});
+  model_metadata.llm_tokenizer_path =
+      join_path({file_paths.cache_folder_path,
+                 "tokenizers",
+                 model_metadata.model_names.llm_model_name});
+  model_metadata.llm_weights_path =
+      join_path({file_paths.cache_folder_path,
+                 "weights",
+                 model_metadata.model_names.llm_model_name,
+                 use_full_precision ? "full-precision" : "half-precision"});
+
+  std::ifstream llm_config_file_handle(model_metadata.llm_model_config_path);
+  if (!llm_config_file_handle.good()) {
+    std::cout << "LLM Model config file "
+              << model_metadata.llm_model_config_path << " not found."
+              << std::endl;
+    assert(false);
+  }
+  json llm_model_config = json::parse(llm_config_file_handle,
+                                      /*parser_callback_t */ nullptr,
+                                      /*allow_exceptions */ true,
+                                      /*ignore_comments */ true);
+
+  model_metadata.llm_model_type = ModelType::UNKNOWN;
+  auto architectures = llm_model_config["architectures"];
+  for (auto const &str : architectures) {
+    if (str == "LlamaForCausalLM" || str == "LLaMAForCausalLM") {
+      std::string nameOrPath = llm_model_config["_name_or_path"];
+      // TODO: support LLAMA-2 models not from Meta
+      bool llama2 = nameOrPath.find("meta-llama/Llama-2") == 0;
+      if (llama2) {
+        model_metadata.llm_model_type = ModelType::LLAMA2;
+      } else {
+        model_metadata.llm_model_type = ModelType::LLAMA;
+      }
+      break;
+    } else if (str == "OPTForCausalLM") {
+      model_metadata.llm_model_type = ModelType::OPT;
+      break;
+    } else if (str == "RWForCausalLM") {
+      model_metadata.llm_model_type = ModelType::FALCON;
+      break;
+    }
+  }
+
+  for (auto ssm_model_name : model_metadata.model_names.ssm_model_names) {
+    std::string ssm_config_path = join_path({file_paths.cache_folder_path,
+                                             "configs",
+                                             ssm_model_name,
+                                             "config.json"});
+    std::string ssm_tokenizer_path =
+        join_path({file_paths.cache_folder_path, "tokenizers", ssm_model_name});
+    std::string ssm_weights_path =
+        join_path({file_paths.cache_folder_path,
+                   "weights",
+                   ssm_model_name,
+                   use_full_precision ? "full-precision" : "half-precision"});
+
+    std::ifstream ssm_config_file_handle(ssm_config_path);
+    if (!ssm_config_file_handle.good()) {
+      std::cout << "SSM Model config file " << ssm_config_path << " not found."
+                << std::endl;
+      assert(false);
+    }
+    json ssm_model_config = json::parse(ssm_config_file_handle,
+                                        /*parser_callback_t */ nullptr,
+                                        /*allow_exceptions */ true,
+                                        /*ignore_comments */ true);
+
+    ModelType ssm_model_type = ModelType::UNKNOWN;
+    auto architectures = ssm_model_config["architectures"];
+    for (auto const &str : architectures) {
+      if (str == "LlamaForCausalLM" || str == "LLaMAForCausalLM") {
+        std::string nameOrPath = ssm_model_config["_name_or_path"];
+        // TODO: support LLAMA-2 models not from Meta
+        bool llama2 = nameOrPath.find("meta-llama/Llama-2") == 0;
+        if (llama2) {
+          ssm_model_type = ModelType::LLAMA2;
+        } else {
+          ssm_model_type = ModelType::LLAMA;
+        }
+        break;
+      } else if (str == "OPTForCausalLM") {
+        ssm_model_type = ModelType::OPT;
+        break;
+      } else if (str == "RWForCausalLM") {
+        ssm_model_type = ModelType::FALCON;
+        break;
+      }
+    }
+    model_metadata.ssm_model_types.push_back(ssm_model_type);
+    model_metadata.ssm_model_config_paths.push_back(ssm_config_path);
+    model_metadata.ssm_model_weights_paths.push_back(ssm_weights_path);
+  }
+
+  assert(model_metadata.llm_model_type != ModelType::UNKNOWN &&
+         "Invalid LLM model type passed (or no type was passed).");
+
+  for (auto mt : model_metadata.ssm_model_types) {
+    if (mt == ModelType::UNKNOWN) {
+      assert(false && "One of the SSM model types passed is invalid.");
+    }
+  }
 }
 
 void FlexFlow::top_level_task(Task const *task,
@@ -141,77 +232,54 @@ void FlexFlow::top_level_task(Task const *task,
                               Runtime *runtime) {
   FFConfig ffconfig;
   FilePaths file_paths;
-  ModelTypes model_types;
+  ModelMeta model_metadata;
   bool use_full_precision = false;
   bool verbose = false;
-  size_t num_devices = ffconfig.workersPerNode * ffconfig.numNodes;
-  int data_parallelism_degree = 1, tensor_parallelism_degree = 1,
-      pipeline_parallelism_degree = 1;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
   char **argv = command_args.argv;
   int argc = command_args.argc;
-  parse_input_args(
-      argv, argc, file_paths, model_types, use_full_precision, verbose);
+  parse_input_args(argv,
+                   argc,
+                   file_paths,
+                   model_metadata.model_names,
+                   use_full_precision,
+                   verbose);
+
+  get_model_meta(file_paths, model_metadata, use_full_precision);
+
   assert(ffconfig.data_parallelism_degree * ffconfig.tensor_parallelism_degree *
              ffconfig.pipeline_parallelism_degree ==
          ffconfig.numNodes * ffconfig.workersPerNode);
 
-  if (file_paths.ssm_weight_file_paths.size() == 0) {
-    assert(false &&
-           "SpecInfer needs at least one SSM for speculative inference");
-  }
-  if (file_paths.ssm_config_file_paths.size() !=
-      file_paths.ssm_weight_file_paths.size()) {
-    assert(false && "Number of SSM config files passed does not match number "
-                    "of SSM weights");
-  }
-  assert(model_types.llm_model_type != ModelType::UNKNOWN &&
-         "Invalid LLM model type passed (or no type was passed).");
-  if (model_types.ssm_model_types.size() !=
-      file_paths.ssm_weight_file_paths.size()) {
-    assert(false && "Number of valid SSM model types passed does not match "
-                    "number of SSM weights");
-  }
-  for (auto mt : model_types.ssm_model_types) {
-    if (mt == ModelType::UNKNOWN) {
-      assert(false && "One of the SSM model types passed is invalid.");
-    }
-  }
-
   // Create SentencePiece tokenizer or OPT tokenizer
   SamplingConfig samplingConfig;
   InferenceManager *im = InferenceManager::get_inference_manager();
   RequestManager *rm = RequestManager::get_request_manager();
-  rm->register_tokenizer(model_types.llm_model_type,
-                         file_paths.tokenizer_file_path);
+  rm->register_tokenizer(model_metadata.llm_model_type,
+                         model_metadata.llm_tokenizer_path);
   rm->register_output_filepath(file_paths.output_file_path);
-  // InferenceManager im(ffconfig, BatchConfig::MAX_NUM_TOKENS);
-  // RequestManager rm(model_types.llm_model_type,
-  //                   file_paths.tokenizer_file_path,
-  //                   /*verbose*/ verbose,
-  //                   file_paths.output_file_path);
 
   // Create LLM model
   FFModel tree_model(ffconfig, ffconfig.cpu_offload);
-  if (model_types.llm_model_type == ModelType::LLAMA ||
-      model_types.llm_model_type == ModelType::LLAMA2) {
+  if (model_metadata.llm_model_type == ModelType::LLAMA ||
+      model_metadata.llm_model_type == ModelType::LLAMA2) {
     LLAMA::create_llama_model(tree_model,
-                              file_paths.llm_config_file_path,
-                              file_paths.llm_weight_file_path,
+                              model_metadata.llm_model_config_path,
+                              model_metadata.llm_weights_path,
                               TREE_VERIFY_MODE,
                               samplingConfig,
                               use_full_precision);
-  } else if (model_types.llm_model_type == ModelType::OPT) {
+  } else if (model_metadata.llm_model_type == ModelType::OPT) {
     OPT::create_opt_model(tree_model,
-                          file_paths.llm_config_file_path,
-                          file_paths.llm_weight_file_path,
+                          model_metadata.llm_model_config_path,
+                          model_metadata.llm_weights_path,
                           TREE_VERIFY_MODE,
                           use_full_precision);
-  } else if (model_types.llm_model_type == ModelType::FALCON) {
+  } else if (model_metadata.llm_model_type == ModelType::FALCON) {
     FALCON::create_falcon_model(tree_model,
-                                file_paths.llm_config_file_path,
-                                file_paths.llm_weight_file_path,
+                                model_metadata.llm_model_config_path,
+                                model_metadata.llm_weights_path,
                                 TREE_VERIFY_MODE,
                                 use_full_precision);
   } else {
@@ -219,7 +287,7 @@ void FlexFlow::top_level_task(Task const *task,
   }
 
   // Create SSM models
-  int num_ssms = model_types.ssm_model_types.size();
+  int num_ssms = model_metadata.ssm_model_types.size();
   std::vector<int> ssm_model_ids;
   std::vector<FFModel> ssm_models;
   FFConfig bm_config = ffconfig;
@@ -232,26 +300,27 @@ void FlexFlow::top_level_task(Task const *task,
 
   for (int ssm_id = 0; ssm_id < num_ssms; ssm_id++) {
     FFModel &beam_model = ssm_models[ssm_id];
-    if (model_types.ssm_model_types[ssm_id] == ModelType::LLAMA ||
-        model_types.ssm_model_types[ssm_id] == ModelType::LLAMA2) {
+    if (model_metadata.ssm_model_types[ssm_id] == ModelType::LLAMA ||
+        model_metadata.ssm_model_types[ssm_id] == ModelType::LLAMA2) {
       LLAMA::create_llama_model(beam_model,
-                                file_paths.ssm_config_file_paths[ssm_id],
-                                file_paths.ssm_weight_file_paths[ssm_id],
+                                model_metadata.ssm_model_config_paths[ssm_id],
+                                model_metadata.ssm_model_weights_paths[ssm_id],
                                 BEAM_SEARCH_MODE,
                                 samplingConfig,
                                 use_full_precision);
-    } else if (model_types.ssm_model_types[ssm_id] == ModelType::OPT) {
+    } else if (model_metadata.ssm_model_types[ssm_id] == ModelType::OPT) {
       OPT::create_opt_model(beam_model,
-                            file_paths.ssm_config_file_paths[ssm_id],
-                            file_paths.ssm_weight_file_paths[ssm_id],
+                            model_metadata.ssm_model_config_paths[ssm_id],
+                            model_metadata.ssm_model_weights_paths[ssm_id],
                             BEAM_SEARCH_MODE,
                             use_full_precision);
-    } else if (model_types.ssm_model_types[ssm_id] == ModelType::FALCON) {
-      FALCON::create_falcon_model(beam_model,
-                                  file_paths.ssm_config_file_paths[ssm_id],
-                                  file_paths.ssm_weight_file_paths[ssm_id],
-                                  BEAM_SEARCH_MODE,
-                                  use_full_precision);
+    } else if (model_metadata.ssm_model_types[ssm_id] == ModelType::FALCON) {
+      FALCON::create_falcon_model(
+          beam_model,
+          model_metadata.ssm_model_config_paths[ssm_id],
+          model_metadata.ssm_model_weights_paths[ssm_id],
+          BEAM_SEARCH_MODE,
+          use_full_precision);
     } else {
       assert(false && "Invalid SSM model type passed.");
     }
diff --git a/inference/utils/convert_llama_config.py b/inference/utils/convert_llama_config.py
deleted file mode 100644
index dfae42f841..0000000000
--- a/inference/utils/convert_llama_config.py
+++ /dev/null
@@ -1,32 +0,0 @@
-import argparse
-import json
-
-def convert_json(input_file, output_file):
-    # Load the input JSON data from the file
-    with open(input_file, 'r') as file:
-        input_data = json.load(file)
-
-    # Extract the required fields and create the output JSON object
-    output_data = {
-        "n_layers": input_data["num_hidden_layers"],
-        "vocab_size": input_data["vocab_size"],
-        "n_heads": input_data["num_attention_heads"],
-        "dim": input_data["hidden_size"],
-        "multiple_of": 256,
-        "norm_eps": input_data["rms_norm_eps"],
-        "total_requests": 2560,
-        "hidden_dim": input_data["intermediate_size"],
-        "incremental_mode": input_data["use_cache"]
-    }
-
-    # Save the output JSON data to the file
-    with open(output_file, 'w') as file:
-        json.dump(output_data, file, indent=4)
-
-if __name__ == "__main__":
-    parser = argparse.ArgumentParser(description="Convert JSON file to a different format.")
-    parser.add_argument("input_file", help="Path to the input JSON file.")
-    parser.add_argument("output_file", help="Path to the output JSON file.")
-    args = parser.parse_args()
-
-    convert_json(args.input_file, args.output_file)
diff --git a/inference/utils/download_falcon_weights.py b/inference/utils/download_falcon_weights.py
deleted file mode 100644
index a9a094f327..0000000000
--- a/inference/utils/download_falcon_weights.py
+++ /dev/null
@@ -1,45 +0,0 @@
-# from transformer import RWForCausalLM
-# from configuration_RW import RWConfig
-from transformers import AutoModel
-import torch
-from transformers import AutoModelForCausalLM
-model = AutoModelForCausalLM.from_pretrained("tiiuae/falcon-7b", trust_remote_code=True)
-# model = AutoModel.from_pretrained("tiiuae/falcon-7b", trust_remote_code=True)
-
-
-# model = RWForCausalLM.from_pretrained("tiiuae/falcon-7b")
-# print(model.config)
-
-#lm_head
-lm_head_weight = model.lm_head.weight
-lm_head_weight.detach().cpu().numpy().tofile('/home/ubuntu/FlexFlow/inference/weights/falcon_7B_weights_new/lm_head_weight')
-
-for name, params in model.named_parameters():
-    name = (
-        name.replace("h.", "layers_")
-        .replace(".", "_").replace("word_embeddings", "tok_embeddings")
-        .replace("self_attn", "attention").replace("transformer_", "").replace("self_attention_dense", "attention_wo"))
-    # name = (
-    #     name.replace("h.", "layers_")
-    #     .replace(".", "_").replace("word_embeddings", "tok_embeddings")
-    #     .replace("self_attn", "attention").replace("transformer_", ""))
-
-    print(name)
-    print(params.shape)
-    
-    #split q, k, v
-    if "self_attention_query_key_value" in name:
-        name_q = name.replace("self_attention_query_key_value", "attention_wq")
-        name_k = name.replace("self_attention_query_key_value", "attention_wk")
-        name_v = name.replace("self_attention_query_key_value", "attention_wv")
-        q, k, v = torch.split(params, [4544, 64, 64], 0)
-        print(q.shape)
-        print(k.shape)
-        print(v.shape)
-        q.detach().cpu().numpy().tofile('/home/ubuntu/FlexFlow/inference/weights/falcon_7B_weights_new/' + name_q)
-        k.detach().cpu().numpy().tofile('/home/ubuntu/FlexFlow/inference/weights/falcon_7B_weights_new/' + name_k)
-        v.detach().cpu().numpy().tofile('/home/ubuntu/FlexFlow/inference/weights/falcon_7B_weights_new/' + name_v)
-    
-    else:
-       params.detach().cpu().numpy().tofile('/home/ubuntu/FlexFlow/inference/weights/falcon_7B_weights_new/' + name)
-
diff --git a/inference/utils/download_hf_model.py b/inference/utils/download_hf_model.py
new file mode 100644
index 0000000000..689730f32b
--- /dev/null
+++ b/inference/utils/download_hf_model.py
@@ -0,0 +1,63 @@
+#!/usr/bin/env python
+import flexflow.serve as ff
+import argparse
+
+
+def parse_args():
+    parser = argparse.ArgumentParser()
+    parser.add_argument(
+        "model_names", type=str, nargs="+", help="Name of the model(s) to download"
+    )
+    parser.add_argument(
+        "--cache-folder",
+        type=str,
+        help="Folder to use to store the model(s) assets in FlexFlow format",
+        default="",
+    )
+    parser.add_argument(
+        "--refresh-cache",
+        action="store_true",
+        help="Use this flag to force the refresh of the model(s) weights/tokenizer cache",
+    )
+    group = parser.add_mutually_exclusive_group()
+    group.add_argument(
+        "--full-precision-only",
+        action="store_true",
+        help="Only download the full precision version of the weights",
+    )
+    group.add_argument(
+        "--half-precision-only",
+        action="store_true",
+        help="Only download the half precision version of the weights",
+    )
+    args = parser.parse_args()
+    return args
+
+
+def main(args):
+    # Initialize FF serve to gain access to its utils
+    ff.init_cpu()
+
+    if args.full_precision_only:
+        data_types = ff.DataType.DT_FLOAT
+    elif args.half_precision_only:
+        data_types = ff.DataType.DT_HALF
+    else:
+        data_types = (ff.DataType.DT_FLOAT, ff.DataType.DT_HALF)
+
+    for model_name in args.model_names:
+        for data_type in data_types:
+            llm = ff.LLM(
+                model_name,
+                data_type=data_type,
+                cache_path=args.cache_folder,
+                refresh_cache=args.refresh_cache,
+            )
+            llm.download_hf_weights_if_needed()
+            llm.download_hf_tokenizer_if_needed()
+            llm.download_hf_config()
+
+
+if __name__ == "__main__":
+    args = parse_args()
+    main(args)
diff --git a/inference/utils/download_llama_weights.py b/inference/utils/download_llama_weights.py
deleted file mode 100644
index d2b11453e6..0000000000
--- a/inference/utils/download_llama_weights.py
+++ /dev/null
@@ -1,78 +0,0 @@
-#!/usr/bin/env python
-
-import os
-import requests
-import argparse
-from transformers import AutoModelForCausalLM
-
-# You can pass the --use-full-precision flag to use the full-precision weight. By default, we use half precision.
-# and pass "--use_13B", "--use_30B", and "--use_65B" to use the corresponding "llama-13B/30B/65B" model weights
-parser = argparse.ArgumentParser()
-parser.add_argument("--use-full-precision", action="store_true", help="Use full precision")
-parser.add_argument("--use_13B", action="store_true", help="choose to use llama-13B")
-parser.add_argument("--use_30B", action="store_true", help="choose to use llama-30B")
-parser.add_argument("--use_65B", action="store_true", help="choose to use llama-65B")
-args = parser.parse_args()
-if not args.use_full_precision:
-    import torch
-    torch.set_default_tensor_type(torch.HalfTensor)
-
-# Change working dir to folder storing this script
-abspath = os.path.abspath(__file__)
-dname = os.path.dirname(abspath)
-os.chdir(dname)
-
-def convert_hf_model(model, dst_folder):
-    os.makedirs(dst_folder, exist_ok=True)
-    for name, params in model.named_parameters():
-        name = (
-            name.replace(".", "_")
-            .replace("self_attn", "attention")
-            .replace("q_proj", "wq")
-            .replace("k_proj", "wk")
-            .replace("v_proj", "wv")
-            .replace("o_proj", "wo")
-            .replace("mlp", "feed_forward")
-            .replace("gate_proj", "w1")
-            .replace("down_proj", "w2")
-            .replace("up_proj", "w3")
-            .replace("input_layernorm", "attention_norm")
-            .replace("post_attention_layernorm", "ffn_norm")
-            .replace("embed_tokens", "tok_embeddings")
-            .replace("lm_head", "output")
-            .replace("model_", "")
-        )
-        params.detach().cpu().numpy().tofile(f"{dst_folder}/{name}")
-
-# Download and convert big model weights
-model = AutoModelForCausalLM.from_pretrained("decapoda-research/llama-7b-hf")
-dst_folder="../weights/llama_7B_weights" if args.use_full_precision else "../weights/llama_7B_weights_half"
-convert_hf_model(model, dst_folder)
-
-# Download and convert model weights only for hf
-if args.use_13B:
-    model = AutoModelForCausalLM.from_pretrained("decapoda-research/llama-13b-hf")
-    dst_folder="../weights/llama_13B_weights_half"
-    convert_hf_model(model, dst_folder)
-
-if args.use_30B:
-    model = AutoModelForCausalLM.from_pretrained("decapoda-research/llama-30b-hf")
-    dst_folder="../weights/llama_30B_weights_half"
-    convert_hf_model(model, dst_folder)
-
-if args.use_65B:
-    model = AutoModelForCausalLM.from_pretrained("decapoda-research/llama-65b-hf")
-    dst_folder="../weights/llama_65B_weights_half"
-    convert_hf_model(model, dst_folder)
-
-# Download and convert small model weights
-model = AutoModelForCausalLM.from_pretrained("JackFram/llama-160m")
-dst_folder="../weights/llama_160M_weights" if args.use_full_precision else "../weights/llama_160M_weights_half"
-convert_hf_model(model, dst_folder)
-
-# Download tokenizer
-os.makedirs("../tokenizer", exist_ok=True)
-tokenizer_filepath = '../tokenizer/tokenizer.model'
-url = 'https://huggingface.co/JackFram/llama-160m/resolve/main/tokenizer.model'
-r = requests.get(url)
-open(tokenizer_filepath , 'wb').write(r.content)
diff --git a/inference/utils/download_opt_weights.py b/inference/utils/download_opt_weights.py
deleted file mode 100644
index c3707df304..0000000000
--- a/inference/utils/download_opt_weights.py
+++ /dev/null
@@ -1,78 +0,0 @@
-#!/usr/bin/env python
-
-import os
-import requests
-import argparse
-import shutil
-from transformers import AutoModelForCausalLM
-
-# You can pass the --use-full-precision flag to use the full-precision weight. By default, we use half precision.
-parser = argparse.ArgumentParser()
-parser.add_argument(
-    "--use-full-precision", action="store_true", help="Use full precision"
-)
-args = parser.parse_args()
-if not args.use_full_precision:
-    import torch
-
-    torch.set_default_tensor_type(torch.HalfTensor)
-
-# Change working dir to folder storing this script
-abspath = os.path.abspath(__file__)
-dname = os.path.dirname(abspath)
-os.chdir(dname)
-
-
-def convert_hf_model(model, dst_folder):
-    os.makedirs(dst_folder, exist_ok=True)
-    for name, params in model.named_parameters():
-        name = (
-            name.replace(".", "_")
-            .replace("decoder_", "")
-            .replace("model_", "")
-            .replace("self_attn", "attention")
-            .replace("q_proj", "wq")
-            .replace("k_proj", "wk")
-            .replace("v_proj", "wv")
-            .replace("out_proj", "wo")
-        )
-        params.detach().cpu().numpy().tofile(f"{dst_folder}/{name}")
-    # copy embedding weights
-    shutil.copy(
-        os.path.join(dst_folder, "embed_tokens_weight"),
-        os.path.join(dst_folder, "embed_tokens_weight_lm_head"),
-    )
-
-
-# Download and convert big model weights
-model = AutoModelForCausalLM.from_pretrained("facebook/opt-6.7b")
-dst_folder = (
-    "../weights/opt_6B_weights"
-    if args.use_full_precision
-    else "../weights/opt_6B_weights_half"
-)
-convert_hf_model(model, dst_folder)
-
-# Download and convert small model weights
-model = AutoModelForCausalLM.from_pretrained("facebook/opt-125m")
-dst_folder = (
-    "../weights/opt_125M_weights"
-    if args.use_full_precision
-    else "../weights/opt_125M_weights_half"
-)
-convert_hf_model(model, dst_folder)
-
-# Download tokenizer files
-os.makedirs("../tokenizer", exist_ok=True)
-tokenizer_filepath = "../tokenizer/vocab.json"
-url = "https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-vocab.json"
-r = requests.get(url)
-open(tokenizer_filepath, "wb").write(r.content)
-tokenizer_filepath = "../tokenizer/merges.txt"
-url = "https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-merges.txt"
-r = requests.get(url)
-open(tokenizer_filepath, "wb").write(r.content)
-tokenizer_filepath = "../tokenizer/special_tokens_map.json"
-url = "https://huggingface.co/truongpdd/vietnews-gpt2/raw/main/added_tokens.json"
-r = requests.get(url)
-open(tokenizer_filepath, "wb").write(r.content)
diff --git a/python/flexflow/core/__init__.py b/python/flexflow/core/__init__.py
index b0177be6fa..adb4fe1926 100644
--- a/python/flexflow/core/__init__.py
+++ b/python/flexflow/core/__init__.py
@@ -24,79 +24,89 @@
 from flexflow.config import *
 from flexflow.jupyter import *
 
+
 def rerun_if_needed():
-  def update_ld_library_path_if_needed(path):
-    ld_lib_path = os.environ.get("LD_LIBRARY_PATH") or ""
-    if path not in ld_lib_path.split(":"):
-      os.environ["LD_LIBRARY_PATH"] = path + ":" + ld_lib_path
-      return True
-    return False
-  from distutils import sysconfig
-  # When installing FlexFlow with pip, the library files are installed within
-  # the pip package folder, instead of at /usr/local/lib
-  packages_dir = sysconfig.get_python_lib(plat_specific=False, standard_lib=False)
-  ff_lib_path = os.path.join(packages_dir, "flexflow", "lib")
-  # If the library exists at the ff_lib_path, rerun with the ff_lib_path in the LD_LIBRARY_PATH
-  rerun=False
-  if os.path.isdir(ff_lib_path):
-    rerun = update_ld_library_path_if_needed(ff_lib_path)
-  if rerun:
-    run_from_python_c = ((sys.argv or [''])[0] == '-c')
-    # re-running with os.execv only works with 'python -c' for python >= 3.10
-    # (see https://bugs.python.org/issue23427)
-    if not run_from_python_c:
-      os.execv(sys.executable, ["python"] + sys.argv)
-    else:
-      if hasattr(sys, 'orig_argv'):
-        assert(len(sys.orig_argv) >= 3)
-        os.execv(sys.executable, ["python"] + sys.orig_argv[1:])
-      else:
-        print(f'Error: Please export LD_LIBRARY_PATH={os.environ.get("LD_LIBRARY_PATH")} and rerun')
-        sys.exit(1)
+    def update_ld_library_path_if_needed(path):
+        ld_lib_path = os.environ.get("LD_LIBRARY_PATH") or ""
+        if path not in ld_lib_path.split(":"):
+            os.environ["LD_LIBRARY_PATH"] = path + ":" + ld_lib_path
+            return True
+        return False
+
+    from distutils import sysconfig
+
+    # When installing FlexFlow with pip, the library files are installed within
+    # the pip package folder, instead of at /usr/local/lib
+    packages_dir = sysconfig.get_python_lib(plat_specific=False, standard_lib=False)
+    ff_lib_path = os.path.join(packages_dir, "flexflow", "lib")
+    # If the library exists at the ff_lib_path, rerun with the ff_lib_path in the LD_LIBRARY_PATH
+    rerun = False
+    if os.path.isdir(ff_lib_path):
+        rerun = update_ld_library_path_if_needed(ff_lib_path)
+    if rerun:
+        run_from_python_c = (sys.argv or [""])[0] == "-c"
+        # re-running with os.execv only works with 'python -c' for python >= 3.10
+        # (see https://bugs.python.org/issue23427)
+        if not run_from_python_c:
+            os.execv(sys.executable, ["python"] + sys.argv)
+        else:
+            if hasattr(sys, "orig_argv"):
+                assert len(sys.orig_argv) >= 3
+                os.execv(sys.executable, ["python"] + sys.orig_argv[1:])
+            else:
+                print(
+                    f'Error: Please export LD_LIBRARY_PATH={os.environ.get("LD_LIBRARY_PATH")} and rerun'
+                )
+                sys.exit(1)
+
 
 if flexflow_init_import():
-  os.environ["NCCL_LAUNCH_MODE"] = "PARALLEL"
-  from legion_cffi import ffi, is_legion_python
-  from .flexflowlib import flexflow_library
-  
-  # Default python mode
-  if is_legion_python == False:
-    os.environ["REALM_DEFAULT_ARGS"] = "-ll:gpu 1"
-    rerun_if_needed()
-    print("Using Default Python")
-    _FF_BUILD_DOCS = bool(os.environ.get('READTHEDOCS') or os.environ.get("FF_BUILD_DOCS"))
-    _CPU_ONLY = bool(os.environ.get('CPU_ONLY_TEST'))
-    if not _FF_BUILD_DOCS and not _CPU_ONLY:
-      from legion_top import (
-          legion_canonical_python_main,
-          legion_canonical_python_cleanup,
-      )
-      import atexit, sys, os
-      # run from jupyter
-      if "ipykernel_launcher.py" in sys.argv[0]:
-        sys_argv = ["python", "dummy.py"]
-        argv_dict = load_jupyter_config()
-        for key, value in argv_dict.items():
-          sys_argv.append(key)
-          sys_argv.append(str(value))
-      else:
-        sys_argv = [
-          "python",
-        ] + sys.argv
-      legion_canonical_python_main(sys_argv)
-      atexit.register(legion_canonical_python_cleanup)
-  else:
-    print("Using Legion Python")
+    os.environ["NCCL_LAUNCH_MODE"] = "PARALLEL"
+    from legion_cffi import ffi, is_legion_python
+    from .flexflowlib import flexflow_library
 
-  flexflow_library.initialize()
+    # Default python mode
+    if is_legion_python == False:
+        _FF_BUILD_DOCS = bool(
+            os.environ.get("READTHEDOCS") or os.environ.get("FF_BUILD_DOCS")
+        )
+        _CPU_ONLY = bool(os.environ.get("CPU_ONLY_TEST"))
+        if not _CPU_ONLY:
+            os.environ["REALM_DEFAULT_ARGS"] = "-ll:gpu 1"
+        rerun_if_needed()
+        print("Using Default Python")
+        if not _FF_BUILD_DOCS and not _CPU_ONLY:
+            from legion_top import (
+                legion_canonical_python_main,
+                legion_canonical_python_cleanup,
+            )
+            import atexit, sys, os
 
-  # check which python binding to use
-  if flexflow_python_binding() == 'pybind11':
-    print("Using pybind11 flexflow bindings.")
-    from .flexflow_pybind11 import *
-  else:
-    print("Using cffi flexflow bindings.")
-    from .flexflow_cffi import *
+            # run from jupyter
+            if "ipykernel_launcher.py" in sys.argv[0]:
+                sys_argv = ["python", "dummy.py"]
+                argv_dict = load_jupyter_config()
+                for key, value in argv_dict.items():
+                    sys_argv.append(key)
+                    sys_argv.append(str(value))
+            else:
+                sys_argv = [
+                    "python",
+                ] + sys.argv
+            legion_canonical_python_main(sys_argv)
+            atexit.register(legion_canonical_python_cleanup)
+    else:
+        print("Using Legion Python")
+
+    flexflow_library.initialize()
+
+    # check which python binding to use
+    if flexflow_python_binding() == "pybind11":
+        print("Using pybind11 flexflow bindings.")
+        from .flexflow_pybind11 import *
+    else:
+        print("Using cffi flexflow bindings.")
+        from .flexflow_cffi import *
 
 else:
-  pass
\ No newline at end of file
+    pass
diff --git a/python/flexflow/core/flexflow_cffi.py b/python/flexflow/core/flexflow_cffi.py
index 55ece74bc1..b02ac5bdb9 100644
--- a/python/flexflow/core/flexflow_cffi.py
+++ b/python/flexflow/core/flexflow_cffi.py
@@ -2097,16 +2097,16 @@ def multihead_attention(self, query, key, value,
     self.add_layer(OpType.MULTIHEAD_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.MULTIHEAD_ATTENTION)
   
-  def inc_multihead_attention(self, input, 
-                              embed_dim, num_heads, num_kv_heads,
+  def inc_multihead_self_attention(self, input, 
+                              embed_dim, num_heads,
                               kdim=0, vdim=0, dropout=0.0, 
                               bias=True, add_bias_kv=False, add_zero_attn=False, 
                               data_type=DataType.DT_NONE, kernel_initializer=None, 
                               apply_rotary_embedding=False, scaling_query=False, scaling_factor=1.0,
                               qk_prod_scaling=True, name=None):
     """Defines the MultiHead Attention operation as described in Attention Is All You Need 
-    which takes in the tensors :attr:`query`, :attr:`key`, and :attr:`value`, 
-    and returns the dot-product attention between them:.
+    which takes in the tensors :attr:`input`, and uses it for all three of query, key and values. 
+    In inference mode, the attention is computed using incremental decoding.
              
     :param input: the input Tensor.
     :type input: Tensor
@@ -2161,20 +2161,20 @@ def inc_multihead_attention(self, input,
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
     c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc.flexflow_model_add_inc_multihead_attention(self.handle, input.handle, embed_dim, num_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
+    handle = ffc.flexflow_model_add_inc_multihead_self_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
     self.add_layer(OpType.INC_MULTIHEAD_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.INC_MULTIHEAD_ATTENTION)
   
-  def spec_inc_multihead_attention(self, input, 
-                                   embed_dim, num_heads, num_kv_heads,
+  def spec_inc_multihead_self_attention(self, input, 
+                                   embed_dim, num_heads,
                                    kdim=0, vdim=0, dropout=0.0, 
                                    bias=True, add_bias_kv=False, add_zero_attn=False, 
                                    data_type=DataType.DT_NONE, kernel_initializer=None, 
                                    apply_rotary_embedding=False, scaling_query=False, scaling_factor=1.0,
                                    qk_prod_scaling=True, name=None):
     """Defines the MultiHead Attention operation as described in Attention Is All You Need 
-    which takes in the tensors :attr:`query`, :attr:`key`, and :attr:`value`, 
-    and returns the dot-product attention between them:.
+    which takes in the tensors :attr:`input`, and uses it for all three of query, key and values. 
+    This operator only supports computing the attention in inference (beam search) mode.
              
     :param input: the input Tensor.
     :type input: Tensor
@@ -2229,20 +2229,20 @@ def spec_inc_multihead_attention(self, input,
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
     c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc.flexflow_model_add_spec_inc_multihead_attention(self.handle, input.handle, embed_dim, num_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
+    handle = ffc.flexflow_model_add_spec_inc_multihead_self_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
     self.add_layer(OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION)
   
   def inc_multihead_self_attention_verify(self, input, 
-                                          embed_dim, num_heads, num_kv_heads,
+                                          embed_dim, num_heads,
                                           kdim=0, vdim=0, dropout=0.0, 
                                           bias=True, add_bias_kv=False, add_zero_attn=False, 
                                           data_type=DataType.DT_NONE, kernel_initializer=None, 
                                           apply_rotary_embedding=False, scaling_query=False, scaling_factor=1.0,
                                           qk_prod_scaling=True, name=None):
     """Defines the MultiHead Attention operation as described in Attention Is All You Need 
-    which takes in the tensors :attr:`query`, :attr:`key`, and :attr:`value`, 
-    and returns the dot-product attention between them:.
+    which takes in the tensors :attr:`input`, and uses it for all three of query, key and values. 
+    This operator only supports computing the attention in inference (tree verify) mode.
              
     :param input: the input Tensor.
     :type input: Tensor
@@ -2297,7 +2297,220 @@ def inc_multihead_self_attention_verify(self, input,
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
     c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc.flexflow_model_add_inc_multihead_self_attention_verify(self.handle, input.handle, embed_dim, num_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
+    handle = ffc.flexflow_model_add_inc_multihead_self_attention_verify(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
+    self.add_layer(OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION, name)
+    return Tensor(handle, owner_op_type=OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION)
+  
+  def inc_multiquery_self_attention(self, input, 
+                              embed_dim, num_q_heads, num_kv_heads,
+                              kdim=0, vdim=0, dropout=0.0, 
+                              bias=True, add_bias_kv=False, add_zero_attn=False, 
+                              data_type=DataType.DT_NONE, kernel_initializer=None, 
+                              apply_rotary_embedding=False, scaling_query=False, scaling_factor=1.0,
+                              qk_prod_scaling=True, name=None):
+    """Defines the multi-query head attention, which allows a different number of Q and KV heads,
+    and takes in the tensors :attr:`input`, and uses it for all three of query, key and values. 
+    In inference mode, the attention is computed using incremental decoding.
+             
+    :param input: the input Tensor.
+    :type input: Tensor
+
+    :param embed_dim: total dimension of the model
+    :type embed_dim: int
+                          
+    :param num_q_heads: Number of query attention heads.
+    :type num_q_heads: int
+
+    :param num_kv_heads: Number of key/value attention heads.
+    :type num_kv_heads: int
+                          
+    :param kdim: total number of features in key. Default is 0
+    :type kdim: int
+                          
+    :param vdim: total number of features in value. Default is 0
+    :type vdim: int
+                          
+    :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
+    :type dropout: float(0-1)
+                          
+    :param bias: Whether the dense layers use bias vectors. Default is True.
+    :type bias: bool
+                          
+    :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
+    :type add_bias_kv: bool
+                          
+    :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
+    :type add_zero_attn: bool
+
+    :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
+    :type data_type: DataType
+    
+    :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+    :type kernel_initializer: Initializer
+
+    :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
+    :type apply_rotary_embedding: bool
+
+    :param scaling_query: Whether to apply scaling query. Default is False.
+    :type scaling_query: bool
+
+    :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
+    :type scaling_factor: float
+
+    :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
+    :type qk_prod_scaling: bool
+             
+    :param name: the name of the layer. Default is None.
+    :type name: string
+
+    :returns:  Tensor -- the output tensor.
+    """     
+    c_name = get_c_name(name)                 
+    kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+    c_data_type = enum_to_int(DataType, data_type)
+    handle = ffc.flexflow_model_add_inc_multiquery_self_attention(self.handle, input.handle, embed_dim, num_q_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
+    self.add_layer(OpType.INC_MULTIHEAD_ATTENTION, name)
+    return Tensor(handle, owner_op_type=OpType.INC_MULTIHEAD_ATTENTION)
+  
+  def spec_inc_multiquery_self_attention(self, input, 
+                                   embed_dim, num_q_heads, num_kv_heads,
+                                   kdim=0, vdim=0, dropout=0.0, 
+                                   bias=True, add_bias_kv=False, add_zero_attn=False, 
+                                   data_type=DataType.DT_NONE, kernel_initializer=None, 
+                                   apply_rotary_embedding=False, scaling_query=False, scaling_factor=1.0,
+                                   qk_prod_scaling=True, name=None):
+    """Defines the multi-query head attention, which allows a different number of Q and KV heads,
+    and takes in the tensors :attr:`input`, and uses it for all three of query, key and values. 
+    This operator only supports computing the attention in inference (beam search) mode.
+             
+    :param input: the input Tensor.
+    :type input: Tensor
+
+    :param embed_dim: total dimension of the model
+    :type embed_dim: int
+                          
+    :param num_q_heads: Number of query attention heads.
+    :type num_q_heads: int
+
+    :param num_kv_heads: Number of key/value attention heads.
+    :type num_kv_heads: int
+                          
+    :param kdim: total number of features in key. Default is 0
+    :type kdim: int
+                          
+    :param vdim: total number of features in value. Default is 0
+    :type vdim: int
+                          
+    :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
+    :type dropout: float(0-1)
+                          
+    :param bias: Whether the dense layers use bias vectors. Default is True.
+    :type bias: bool
+                          
+    :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
+    :type add_bias_kv: bool
+                          
+    :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
+    :type add_zero_attn: bool
+
+    :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
+    :type data_type: DataType
+    
+    :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+    :type kernel_initializer: Initializer
+
+    :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
+    :type apply_rotary_embedding: bool
+
+    :param scaling_query: Whether to apply scaling query. Default is False.
+    :type scaling_query: bool
+
+    :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
+    :type scaling_factor: float
+
+    :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
+    :type qk_prod_scaling: bool
+             
+    :param name: the name of the layer. Default is None.
+    :type name: string
+
+    :returns:  Tensor -- the output tensor.
+    """     
+    c_name = get_c_name(name)                 
+    kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+    c_data_type = enum_to_int(DataType, data_type)
+    handle = ffc.flexflow_model_add_spec_inc_multiquery_self_attention(self.handle, input.handle, embed_dim, num_q_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
+    self.add_layer(OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION, name)
+    return Tensor(handle, owner_op_type=OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION)
+  
+  def inc_multiquery_self_attention_verify(self, input, 
+                                          embed_dim, num_q_heads, num_kv_heads,
+                                          kdim=0, vdim=0, dropout=0.0, 
+                                          bias=True, add_bias_kv=False, add_zero_attn=False, 
+                                          data_type=DataType.DT_NONE, kernel_initializer=None, 
+                                          apply_rotary_embedding=False, scaling_query=False, scaling_factor=1.0,
+                                          qk_prod_scaling=True, name=None):
+    """Defines the multi-query head attention, which allows a different number of Q and KV heads,
+    and takes in the tensors :attr:`input`, and uses it for all three of query, key and values. 
+    This operator only supports computing the attention in inference (tree verify) mode.
+             
+    :param input: the input Tensor.
+    :type input: Tensor
+
+    :param embed_dim: total dimension of the model
+    :type embed_dim: int
+                          
+    :param num_q_heads: Number of query attention heads.
+    :type num_q_heads: int
+
+    :param num_kv_heads: Number of key/value attention heads.
+    :type num_kv_heads: int
+                          
+    :param kdim: total number of features in key. Default is 0
+    :type kdim: int
+                          
+    :param vdim: total number of features in value. Default is 0
+    :type vdim: int
+                          
+    :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
+    :type dropout: float(0-1)
+                          
+    :param bias: Whether the dense layers use bias vectors. Default is True.
+    :type bias: bool
+                          
+    :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
+    :type add_bias_kv: bool
+                          
+    :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
+    :type add_zero_attn: bool
+
+    :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
+    :type data_type: DataType
+    
+    :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+    :type kernel_initializer: Initializer
+
+    :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
+    :type apply_rotary_embedding: bool
+
+    :param scaling_query: Whether to apply scaling query. Default is False.
+    :type scaling_query: bool
+
+    :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
+    :type scaling_factor: float
+
+    :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
+    :type qk_prod_scaling: bool
+             
+    :param name: the name of the layer. Default is None.
+    :type name: string
+
+    :returns:  Tensor -- the output tensor.
+    """     
+    c_name = get_c_name(name)                 
+    kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+    c_data_type = enum_to_int(DataType, data_type)
+    handle = ffc.flexflow_model_add_inc_multiquery_self_attention_verify(self.handle, input.handle, embed_dim, num_q_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
     self.add_layer(OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION)
   
@@ -3035,9 +3248,9 @@ def init_operators_inference(self, model):
 
 class FileDataLoader(object):
   __slots__ = ['handle', '_handle']
-  def __init__(self, weight_file_path, num_heads, hidden_dim, qkv_inner_dim):
+  def __init__(self, weight_file_path, num_q_heads, num_kv_heads, hidden_dim, qkv_inner_dim, tensor_parallelism_degree):
     c_weight_file_path = get_c_name(weight_file_path)
-    self.handle = ffc.flexflow_file_data_loader_create(c_weight_file_path, num_heads, hidden_dim, qkv_inner_dim)
+    self.handle = ffc.flexflow_file_data_loader_create(c_weight_file_path, num_q_heads, num_kv_heads, hidden_dim, qkv_inner_dim, tensor_parallelism_degree)
     self._handle = ffi.gc(self.handle, ffc.flexflow_file_data_loader_destroy)
   
   def load_weights(self, model, model_layers_with_weights, data_type):
diff --git a/python/flexflow/serve/__init__.py b/python/flexflow/serve/__init__.py
index 4c28146d82..8b054f0120 100644
--- a/python/flexflow/serve/__init__.py
+++ b/python/flexflow/serve/__init__.py
@@ -12,7 +12,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 
-import json, sys
+import json, sys, os
 from typing import Union
 from ..type import *
 
@@ -76,6 +76,9 @@ def init(configs: Union[str, dict]):
             "configs should be a dictionary or the path to a valid JSON file"
         )
 
+    # Remove the arguments to avoid interferences
+    sys.argv = [sys.argv[0]]
+
     # configs should contain the following mandatory keys with non-zero integer values:
     num_gpus = configs_dict.get("num_gpus")
     memory_per_gpu = configs_dict.get("memory_per_gpu")
@@ -140,3 +143,16 @@ def init(configs: Union[str, dict]):
 
     global LLM, SSM, SamplingConfig
     from .serve import LLM, SSM, SamplingConfig
+
+
+def init_cpu():
+    """Start the FlexFlow runtime and import the inference package without access to GPU functionalities.
+    This is useful to access the utilies from the flexflow package without using up GPU memory.
+    """
+    # Remove the arguments to avoid interferences
+    sys.argv = [sys.argv[0]]
+    # Ask the runtime to avoid using GPU/GPU memory
+    os.environ["CPU_ONLY_TEST"] = "1"
+
+    global LLM, SSM, SamplingConfig
+    from .serve import LLM, SSM, SamplingConfig
diff --git a/python/flexflow/serve/models/falcon.py b/python/flexflow/serve/models/falcon.py
index 81f80474dd..5cb5443f42 100644
--- a/python/flexflow/serve/models/falcon.py
+++ b/python/flexflow/serve/models/falcon.py
@@ -14,7 +14,7 @@
 
 from flexflow.core import *
 from .base import FlexFlowModel
-import random, shutil
+import random, torch
 
 
 class FalconConfig:
@@ -28,6 +28,7 @@ def __init__(self, hf_config):
         self.layer_norm_epsilon = hf_config.layer_norm_epsilon
         self.multi_query = hf_config.multi_query
         self.n_head = hf_config.n_head
+        self.n_head_kv = hf_config.n_head_kv if "n_head_kv" in hf_config.__dict__ else 1
         self.n_layer = hf_config.n_layer
         self.parallel_attn = hf_config.parallel_attn
         self.vocab_size = hf_config.vocab_size
@@ -59,6 +60,27 @@ def __init__(
         self.tokenizer_filepath = tokenizer_filepath
         self.maxint = 2**31 - 1
 
+        # Sanity checks
+        if self.falcon_config.hidden_size % self.falcon_config.n_head != 0:
+            raise ValueError(
+                f"Hidden size ({self.falcon_config.hidden_size}) is not divisible by n_head ({self.falcon_config.n_head})"
+            )
+        if (
+            self.falcon_config.n_head < self.ffconfig.tensor_parallelism_degree
+            or self.falcon_config.n_head % self.ffconfig.tensor_parallelism_degree != 0
+        ):
+            raise ValueError(
+                f"Number of q attention heads ({self.falcon_config.n_head}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
+            )
+        if (
+            self.falcon_config.n_head_kv < self.ffconfig.tensor_parallelism_degree
+            or self.falcon_config.n_head_kv % self.ffconfig.tensor_parallelism_degree
+            != 0
+        ):
+            raise ValueError(
+                f"Number of k/v attention heads ({self.falcon_config.n_head_kv}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
+            )
+
         self.build_model()
 
     def build_model(self):
@@ -93,12 +115,29 @@ def build_model(self):
                 name=f"layers_{i}_input_layernorm_weight",
             )
 
-            if self.mode == InferenceMode.INC_DECODING_MODE:
-                mha = ffmodel.inc_multihead_self_attention(
+            if self.mode == InferenceMode.BEAM_SEARCH_MODE:
+                mha = ffmodel.spec_inc_multiquery_self_attention(
+                    att_norm,
+                    self.falcon_config.hidden_size,
+                    self.falcon_config.n_head,
+                    self.falcon_config.n_head_kv,
+                    self.falcon_config.hidden_size // self.falcon_config.n_head,
+                    self.falcon_config.hidden_size // self.falcon_config.n_head,
+                    0.0,  # dropout
+                    False,  # bias
+                    False,  # add_bias_kv
+                    False,  # add_zero_attn
+                    DataType.DT_NONE,  # data_type
+                    None,  # kernel initializer
+                    True,  # apply_rotary_embedding
+                    name=f"layers_{i}_attention_weight",
+                )
+            elif self.mode == InferenceMode.TREE_VERIFY_MODE:
+                mha = ffmodel.inc_multiquery_self_attention_verify(
                     att_norm,
                     self.falcon_config.hidden_size,
                     self.falcon_config.n_head,
-                    1,
+                    self.falcon_config.n_head_kv,
                     self.falcon_config.hidden_size // self.falcon_config.n_head,
                     self.falcon_config.hidden_size // self.falcon_config.n_head,
                     0.0,  # dropout
@@ -107,7 +146,25 @@ def build_model(self):
                     False,  # add_zero_attn
                     DataType.DT_NONE,  # data_type
                     None,  # kernel initializer
-                    name=f"layers_{i}_self_attention_dense_weight",
+                    True,  # apply_rotary_embedding
+                    name=f"layers_{i}_attention_weight",
+                )
+            elif self.mode == InferenceMode.INC_DECODING_MODE:
+                mha = ffmodel.inc_multiquery_self_attention(
+                    att_norm,
+                    self.falcon_config.hidden_size,
+                    self.falcon_config.n_head,
+                    self.falcon_config.n_head_kv,
+                    self.falcon_config.hidden_size // self.falcon_config.n_head,
+                    self.falcon_config.hidden_size // self.falcon_config.n_head,
+                    0.0,  # dropout
+                    False,  # bias
+                    False,  # add_bias_kv
+                    False,  # add_zero_attn
+                    DataType.DT_NONE,  # data_type
+                    None,  # kernel initializer
+                    True,  # apply_rotary_embedding
+                    name=f"layers_{i}_attention_weight",
                 )
             else:
                 assert False
@@ -166,12 +223,30 @@ def convert_hf_model(model, dst_folder):
                 name.replace(".", "_")
                 .replace("transformer_h_", "layers_")
                 .replace("transformer_", "")
+                .replace("self_attention_dense", "attention_wo")
             )
-            params.detach().cpu().numpy().tofile(f"{dst_folder}/{name}")
-        # copy embedding weights
-        shutil.copy(
-            os.path.join(dst_folder, "word_embeddings_weight"),
-            os.path.join(dst_folder, "lm_head_weight"),
+            # Split Q,K,V attention weights
+            if "self_attention_query_key_value" in name:
+                name_q = name.replace("self_attention_query_key_value", "attention_wq")
+                name_k = name.replace("self_attention_query_key_value", "attention_wk")
+                name_v = name.replace("self_attention_query_key_value", "attention_wv")
+                q, k, v = torch.split(
+                    params,
+                    [
+                        model.config.hidden_size,
+                        model.config.hidden_size // model.config.n_head,
+                        model.config.hidden_size // model.config.n_head,
+                    ],
+                    0,
+                )
+                q.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_q))
+                k.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_k))
+                v.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_v))
+            else:
+                params.detach().cpu().numpy().tofile(os.path.join(dst_folder, name))
+        # LM head weight
+        model.lm_head.weight.detach().cpu().numpy().tofile(
+            os.path.join(dst_folder, "lm_head_weight")
         )
 
     def get_layers_with_weights(self):
@@ -184,7 +259,7 @@ def get_layers_with_weights(self):
             for i in range(self.falcon_config.n_layer)
             for expr in (
                 f"layers_{i}_input_layernorm_weight",
-                f"layers_{i}_self_attention_dense_weight",
+                f"layers_{i}_attention_weight",
                 f"layers_{i}_mlp_dense_h_to_4h_weight",
                 f"layers_{i}_mlp_dense_4h_to_h_weight",
             )
diff --git a/python/flexflow/serve/models/llama.py b/python/flexflow/serve/models/llama.py
index 3c83905d61..cb707f3e57 100644
--- a/python/flexflow/serve/models/llama.py
+++ b/python/flexflow/serve/models/llama.py
@@ -57,6 +57,24 @@ def __init__(
         self.tokenizer_filepath = tokenizer_filepath
         self.maxint = 2**31 - 1
 
+        # Sanity checks
+        if self.llama_config.hidden_size % self.llama_config.num_attention_heads != 0:
+            raise ValueError(
+                f"Hidden size ({self.llama_config.hidden_size}) is not divisible by number of attention heads ({self.llama_config.num_attention_heads})"
+            )
+
+        # Sanity checks
+        if (
+            self.llama_config.num_attention_heads
+            < self.ffconfig.tensor_parallelism_degree
+            or self.llama_config.num_attention_heads
+            % self.ffconfig.tensor_parallelism_degree
+            != 0
+        ):
+            raise ValueError(
+                f"Number of attention heads ({self.llama_config.num_attention_heads}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
+            )
+
         self.build_model()
 
     def build_model(self):
@@ -88,11 +106,10 @@ def build_model(self):
             )
 
             if self.mode == InferenceMode.BEAM_SEARCH_MODE:
-                mha = ffmodel.spec_inc_multihead_attention(
+                mha = ffmodel.spec_inc_multihead_self_attention(
                     attn_norm,
                     self.llama_config.hidden_size,
                     self.llama_config.num_attention_heads,
-                    self.llama_config.num_attention_heads,
                     self.llama_config.hidden_size
                     // self.llama_config.num_attention_heads,
                     self.llama_config.hidden_size
@@ -111,7 +128,6 @@ def build_model(self):
                     attn_norm,
                     self.llama_config.hidden_size,
                     self.llama_config.num_attention_heads,
-                    self.llama_config.num_attention_heads,
                     self.llama_config.hidden_size
                     // self.llama_config.num_attention_heads,
                     self.llama_config.hidden_size
@@ -126,11 +142,10 @@ def build_model(self):
                     name=f"layers_{i}_attention_weight",
                 )
             elif self.mode == InferenceMode.INC_DECODING_MODE:
-                mha = ffmodel.inc_multihead_attention(
+                mha = ffmodel.inc_multihead_self_attention(
                     attn_norm,
                     self.llama_config.hidden_size,
                     self.llama_config.num_attention_heads,
-                    self.llama_config.num_attention_heads,
                     self.llama_config.hidden_size
                     // self.llama_config.num_attention_heads,
                     self.llama_config.hidden_size
diff --git a/python/flexflow/serve/models/opt.py b/python/flexflow/serve/models/opt.py
index deb7a304ff..7e38b5de85 100644
--- a/python/flexflow/serve/models/opt.py
+++ b/python/flexflow/serve/models/opt.py
@@ -62,6 +62,24 @@ def __init__(
         self.tokenizer_filepath = tokenizer_filepath
         self.maxint = 2**31 - 1
 
+        # Sanity checks
+        if self.opt_config.hidden_size % self.opt_config.num_attention_heads != 0:
+            raise ValueError(
+                f"Hidden size ({self.opt_config.hidden_size}) is not divisible by n_head ({self.opt_config.num_attention_heads})"
+            )
+
+        # Sanity checks
+        if (
+            self.opt_config.num_attention_heads
+            < self.ffconfig.tensor_parallelism_degree
+            or self.opt_config.num_attention_heads
+            % self.ffconfig.tensor_parallelism_degree
+            != 0
+        ):
+            raise ValueError(
+                f"Number of attention heads ({self.opt_config.num_attention_heads}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
+            )
+
         self.build_model()
 
     def build_model(self):
@@ -114,11 +132,10 @@ def build_model(self):
                 hidden_states = residual
 
             if self.mode == InferenceMode.BEAM_SEARCH_MODE:
-                mha = ffmodel.spec_inc_multihead_attention(
+                mha = ffmodel.spec_inc_multihead_self_attention(
                     hidden_states,
                     self.opt_config.hidden_size,
                     self.opt_config.num_attention_heads,
-                    self.opt_config.num_attention_heads,
                     self.opt_config.hidden_size // self.opt_config.num_attention_heads,
                     self.opt_config.hidden_size // self.opt_config.num_attention_heads,
                     0.0,  # dropout
@@ -139,7 +156,6 @@ def build_model(self):
                     hidden_states,
                     self.opt_config.hidden_size,
                     self.opt_config.num_attention_heads,
-                    self.opt_config.num_attention_heads,
                     self.opt_config.hidden_size // self.opt_config.num_attention_heads,
                     self.opt_config.hidden_size // self.opt_config.num_attention_heads,
                     0.0,  # dropout
@@ -156,11 +172,10 @@ def build_model(self):
                     name=f"layers_{i}_attention_weight",
                 )
             elif self.mode == InferenceMode.INC_DECODING_MODE:
-                mha = ffmodel.inc_multihead_attention(
+                mha = ffmodel.inc_multihead_self_attention(
                     hidden_states,
                     self.opt_config.hidden_size,
                     self.opt_config.num_attention_heads,
-                    self.opt_config.num_attention_heads,
                     self.opt_config.hidden_size // self.opt_config.num_attention_heads,
                     self.opt_config.hidden_size // self.opt_config.num_attention_heads,
                     0.0,  # dropout
diff --git a/python/flexflow/serve/serve.py b/python/flexflow/serve/serve.py
index a6723b38a2..bf2dcc84de 100644
--- a/python/flexflow/serve/serve.py
+++ b/python/flexflow/serve/serve.py
@@ -54,9 +54,8 @@ def __init__(
         self,
         model_name: str,
         data_type: DataType = DataType.DT_HALF,
-        tokenizer_path: str = "",
-        weights_path: str = "",
-        clean_cache: bool = False,
+        cache_path: str = "",
+        refresh_cache: bool = False,
         output_file: str = "",
     ):
         """Create the LLM object
@@ -65,12 +64,10 @@ def __init__(
         :type model_name: str
         :param data_type: The data type to use for the tensors (e.g. DataType.DT_FLOAT for full precision, or DataType.DT_HALF for half precision), defaults to DataType.DT_HALF
         :type data_type: DataType, optional
-        :param tokenizer_path: Path to the tokenizer file or folder for the LLM. If left blank, FlexFlow will download (and cache) the relevant tokenizer from HuggingFace, defaults to ""
+        :param cache_path: Path to the folder (which will be created if it does not yet exist) to use for the FlexFlow weights/tokenizers cache, defaults to "~/.cache/flexflow"
         :type tokenizer_path: str, optional
-        :param weights_path: Path to the weights for the LLM. If left blank, FlexFlow will download (and cache) the weights from HuggingFace, defaults to ""
-        :type weights_path: str, optional
-        :param clean_cache: Use this flag to discard previous weights/tokenizer cache for this LLM, defaults to False
-        :type clean_cache: bool, optional
+        :param refresh_cache: Use this flag to force the refresh of the model's weights/tokenizer cache, defaults to False
+        :type refresh_cache: bool, optional
         :param output_file: Path to the output file. If left blank, the output will not be written to file, defaults to ""
         :type output_file: str, optional
         """
@@ -81,14 +78,13 @@ def __init__(
             "RWForCausalLM": (ModelType.FALCON, FlexFlowFalcon),
         }
         self.hf_config = AutoConfig.from_pretrained(model_name, trust_remote_code=True)
+        self.model_name = self.hf_config._name_or_path
         self.model_type, self.model_class = self.__get_ff_model_type()
         self.data_type = data_type
         assert self.data_type == DataType.DT_HALF or self.data_type == DataType.DT_FLOAT
-        self.tokenizer_path = tokenizer_path
-        self.weights_path = weights_path
-        self.clean_cache = clean_cache
+        self.cache_path = cache_path if len(cache_path) > 0 else "~/.cache/flexflow"
+        self.refresh_cache = refresh_cache
         self.output_file = output_file
-        self.ffconfig = FFConfig()
 
     def __get_ff_model_type(self):
         architectures = getattr(self.hf_config, "architectures", [])
@@ -102,14 +98,40 @@ def __get_ff_model_type(self):
             sys.exit(1)
         return ff_arch
 
-    def __download_hf_weights(self):
+    def download_hf_config(self):
+        """Save the HuggingFace model configs to a json file. Useful mainly to run the C++ inference code."""
+        self.config_dir = os.path.join(
+            os.path.expanduser(self.cache_path), "configs", self.model_name.lower()
+        )
+        self.config_path = os.path.join(self.config_dir, "config.json")
+        os.makedirs(self.config_dir, exist_ok=True)
+        print(f"Creating directory {self.config_dir} (if it doesn't exist)...")
+        print(f"Saving {self.model_name} configs to file {self.config_path}...")
+        self.hf_config.to_json_file(self.config_path)
+
+    def download_hf_weights_if_needed(self):
+        """Check in the folder specified by the cache_path whether the LLM's model weights are available and up to date.
+        If not, or if the refresh_cache parameter is set to True, download new weights.
+        """
+        if self.data_type == DataType.DT_HALF:
+            torch.set_default_tensor_type(torch.HalfTensor)
+        elif self.data_type == DataType.DT_FLOAT:
+            torch.set_default_tensor_type(torch.FloatTensor)
+        else:
+            assert False, "Data type not yet supported -- cannot download weights!"
+
         # Use local cache, or download new version
-        self.weights_path = os.path.expanduser(
-            f"~/.cache/flexflow/models/{self.hf_config._name_or_path}/{'full-precision' if self.data_type == DataType.DT_FLOAT else 'half-precision'}"
+        self.weights_path = os.path.join(
+            os.path.expanduser(self.cache_path),
+            "weights",
+            self.model_name.lower(),
+            "full-precision"
+            if self.data_type == DataType.DT_FLOAT
+            else "half-precision",
         )
-        if self.clean_cache:
+        if self.refresh_cache:
             print(
-                f"Discarding cached weights (if they exist) for model {self.hf_config._name_or_path}..."
+                f"Refreshing weights in cache for model {self.model_name} at path {self.weights_path} ..."
             )
             if os.path.exists(self.weights_path):
                 shutil.rmtree(self.weights_path)
@@ -122,15 +144,15 @@ def __download_hf_weights(self):
         if os.path.exists(local_revision_file):
             local_revision = "".join(open(local_revision_file).read().split())
         hf_api = HfApi()
-        latest_revision = hf_api.model_info(self.hf_config._name_or_path).sha
+        latest_revision = hf_api.model_info(self.model_name).sha
 
         # Download if needed
         if local_revision != latest_revision:
             print(
-                f"'{self.hf_config._name_or_path}' model weights not found in cache or outdated. Downloading from huggingface.co ..."
+                f"'{self.model_name}' model weights not found in cache or outdated. Downloading from huggingface.co ..."
             )
             hf_model = AutoModelForCausalLM.from_pretrained(
-                self.hf_config._name_or_path, trust_remote_code=True
+                self.model_name, trust_remote_code=True
             )
             print("Done downloading HF weights. Converting them now...")
             self.model_class.convert_hf_model(hf_model, self.weights_path)
@@ -138,33 +160,23 @@ def __download_hf_weights(self):
                 f.write(latest_revision)
             print("Done converting the weights...")
         else:
-            print(
-                f"Loading '{self.hf_config._name_or_path}' model weights from the cache..."
-            )
+            print(f"Loading '{self.model_name}' model weights from the cache...")
 
-    def __load_hf_tokenizer(self):
+    def download_hf_tokenizer_if_needed(self):
+        """Check in the folder specified by the cache_path whether the LLM's tokenizer files are available and up to date.
+        If not, or if the refresh_cache parameter is set to True, download new tokenizer files.
+        """
         print("Loading tokenizer...")
-        if len(self.tokenizer_path) > 0:
-            print(f"Using tokenizer from {self.tokenizer_path}")
-            # check that tokenizer exist
-            if not os.path.exists(self.tokenizer_path):
-                raise FileNotFoundError(f"Path {self.tokenizer_path} does not exist")
-            elif (
-                os.path.isdir(self.tokenizer_path)
-                and len(os.listdir(self.tokenizer_path)) == 0
-            ):
-                raise FileNotFoundError(f"Folder {self.tokenizer_path} is empty")
-            return
-
-        # Download tokenizer
 
         # Use local cache, or download new version
-        self.tokenizer_path = os.path.expanduser(
-            f"~/.cache/flexflow/tokenizers/{self.hf_config._name_or_path}/"
+        self.tokenizer_path = os.path.join(
+            os.path.expanduser(self.cache_path),
+            "tokenizers",
+            self.model_name.lower(),
         )
-        if self.clean_cache:
+        if self.refresh_cache:
             print(
-                f"Discarding cached tokenizer files (if they exist) for model {self.hf_config._name_or_path}..."
+                f"Discarding cached tokenizer files (if they exist) for model {self.model_name}..."
             )
             if os.path.exists(self.tokenizer_path):
                 shutil.rmtree(self.tokenizer_path)
@@ -178,58 +190,47 @@ def __load_hf_tokenizer(self):
         if os.path.exists(local_revision_file):
             local_revision = "".join(open(local_revision_file).read().split())
         hf_api = HfApi()
-        latest_revision = hf_api.model_info(self.hf_config._name_or_path).sha
+        latest_revision = hf_api.model_info(self.model_name).sha
 
         # Download if needed
         if local_revision != latest_revision:
             print(
-                f"'{self.hf_config._name_or_path}' tokenizer not found in cache or outdated. Downloading from huggingface.co ..."
+                f"'{self.model_name}' tokenizer not found in cache or outdated. Downloading from huggingface.co ..."
             )
             if self.model_type == ModelType.LLAMA:
                 hf_tokenizer = LlamaTokenizer.from_pretrained(
-                    self.hf_config._name_or_path, use_fast=True
+                    self.model_name, use_fast=True
                 )
             else:
-                hf_tokenizer = AutoTokenizer.from_pretrained(
-                    self.hf_config._name_or_path
-                )
+                hf_tokenizer = AutoTokenizer.from_pretrained(self.model_name)
             hf_tokenizer.save_pretrained(self.tokenizer_path)
             print("Done downloading HF tokenizer.")
             with open(local_revision_file, "w+") as f:
                 f.write(latest_revision)
             print("Loading the tokenizer...")
         else:
-            print(
-                f"Loading '{self.hf_config._name_or_path}' tokenizer from the cache..."
-            )
+            print(f"Loading '{self.model_name}' tokenizer from the cache...")
 
     def __load_hf_weights(self):
         print("Loading hf weights...")
 
-        if self.data_type == DataType.DT_HALF:
-            torch.set_default_tensor_type(torch.HalfTensor)
-
-        if len(self.weights_path) > 0:
-            print(f"Using weights from {self.weights_path}")
-            # check that weights exist
-            if not os.path.exists(self.weights_path) or not os.path.isdir(
-                self.weights_path
-            ):
-                raise FileNotFoundError(
-                    f"Path {self.weights_path} does not exist or is not a directory"
-                )
-            elif len(os.listdir(self.weights_path)) == 0:
-                raise FileNotFoundError(f"Folder {self.weights_path} is empty")
-        else:
-            self.__download_hf_weights()
+        self.download_hf_weights_if_needed()
 
         # Create file data loader, load weights into tensors
+        if self.model_type == ModelType.FALCON:
+            n_q_heads = self.hf_config.num_attention_heads
+            if "n_head_kv" in self.hf_config.__dict__:
+                n_kv_heads = self.hf_config.n_head_kv
+            else:
+                n_kv_heads = 1
+        else:
+            n_q_heads = n_kv_heads = self.hf_config.num_attention_heads
         self.fileloader = FileDataLoader(
             self.weights_path,
-            self.hf_config.num_attention_heads,
-            self.hf_config.num_attention_heads,
+            n_q_heads,
+            n_kv_heads,
             self.hf_config.hidden_size,
-            self.hf_config.hidden_size // self.hf_config.num_attention_heads,
+            self.hf_config.hidden_size // n_q_heads,
             self.ffconfig.tensor_parallelism_degree,
         )
 
@@ -245,6 +246,9 @@ def compile(
         max_batch_size: int = 1,
         max_seq_length: int = 256,
         max_tokens_per_batch: int = 64,
+        model_specific_data_parallelism_degree: int = None,
+        model_specific_tensor_parallelism_degree: int = None,
+        model_specific_pipeline_parallelism_degree: int = None,
         ssms: list = [],
     ):
         """Compile the LLM for inference and load the weights into memory
@@ -259,6 +263,12 @@ def compile(
         :type max_seq_length: int, optional
         :param max_tokens_per_batch: The maximum number of tokens (across requests) to allow per batch, defaults to 64
         :type max_tokens_per_batch: int, optional
+        :param model_specific_data_parallelism_degree: Use this parameter if you want to give the LLM a different data parallelism degree than the one used to initialize the runtime, defaults to None
+        :type model_specific_data_parallelism_degree: int, optional
+        :param model_specific_tensor_parallelism_degree: Use this parameter if you want to give the LLM a different tensor parallelism degree than the one used to initialize the runtime, defaults to None
+        :type model_specific_tensor_parallelism_degree: int, optional
+        :param model_specific_pipeline_parallelism_degree: Use this parameter if you want to give the LLM a different pipeline parallelism degree than the one used to initialize the runtime, defaults to None
+        :type model_specific_pipeline_parallelism_degree: int, optional
         :param ssms: The SSMs to use when operating in speculative inference mode, defaults to []
         :type ssms: list, optional
         """
@@ -267,11 +277,26 @@ def compile(
         self.max_tokens_per_batch = max_tokens_per_batch
         self.ssms = ssms
         self.sampling_config = SamplingConfig()
+        self.ffconfig = FFConfig()
         assert (
             mode == InferenceMode.INC_DECODING_MODE
             or mode == InferenceMode.BEAM_SEARCH_MODE
         ) == (len(ssms) == 0)
 
+        # Apply model-specific parallelism degrees, if needed
+        if model_specific_data_parallelism_degree:
+            self.ffconfig.data_parallelism_degree = (
+                model_specific_data_parallelism_degree
+            )
+        if model_specific_tensor_parallelism_degree:
+            self.ffconfig.tensor_parallelism_degree = (
+                model_specific_tensor_parallelism_degree
+            )
+        if model_specific_pipeline_parallelism_degree:
+            self.ffconfig.pipeline_parallelism_degree = (
+                model_specific_pipeline_parallelism_degree
+            )
+
         # Instantiate the relevant model
         self.model = self.model_class(
             mode,
@@ -290,7 +315,7 @@ def compile(
 
         # Download the weights and tokenizer from huggingface (if needed) and load them
         self.__load_hf_weights()
-        self.__load_hf_tokenizer()
+        self.download_hf_tokenizer_if_needed()
 
         # Create request manager
         self.rm = RequestManager()
@@ -329,9 +354,8 @@ def __init__(
         self,
         model_name: str,
         data_type: DataType = DataType.DT_HALF,
-        tokenizer_path: str = "",
-        weights_path: str = "",
-        clean_cache: bool = False,
+        cache_path: str = "~/.cache/flexflow",
+        refresh_cache: bool = False,
         output_file: str = "",
     ):
         """Create the SSM object
@@ -340,23 +364,62 @@ def __init__(
         :type model_name: str
         :param data_type: The data type to use for the tensors (e.g. DataType.DT_FLOAT for full precision, or DataType.DT_HALF for half precision), defaults to DataType.DT_HALF
         :type data_type: DataType, optional
-        :param tokenizer_path: Path to the tokenizer file or folder for the LLM. If left blank, FlexFlow will download (and cache) the relevant tokenizer from HuggingFace, defaults to ""
+        :param cache_path: Path to the folder (which will be created if it does not yet exist) to use for the FlexFlow weights/tokenizers cache, defaults to "~/.cache/flexflow"
         :type tokenizer_path: str, optional
-        :param weights_path: Path to the weights for the LLM. If left blank, FlexFlow will download (and cache) the weights from HuggingFace, defaults to ""
-        :type weights_path: str, optional
-        :param clean_cache: Use this flag to discard previous weights/tokenizer cache for this LLM, defaults to False
-        :type clean_cache: bool, optional
+        :param refresh_cache: Use this flag to force the refresh of the model's weights/tokenizer cache, defaults to False
+        :type refresh_cache: bool, optional
         :param output_file: Path to the output file. If left blank, the output will not be written to file, defaults to ""
         :type output_file: str, optional
         """
         super().__init__(
             model_name,
             data_type,
-            tokenizer_path,
-            weights_path,
-            clean_cache,
+            cache_path,
+            refresh_cache,
             output_file,
         )
-        self.ffconfig.data_parallelism_degree = 1
-        self.ffconfig.tensor_parallelism_degree = 1
-        self.ffconfig.pipeline_parallelism_degree = 1
+
+    def compile(
+        self,
+        mode: InferenceMode = InferenceMode.INC_DECODING_MODE,
+        sampling_config: SamplingConfig = SamplingConfig(),
+        max_batch_size: int = 1,
+        max_seq_length: int = 256,
+        max_tokens_per_batch: int = 64,
+        model_specific_data_parallelism_degree: int = 1,
+        model_specific_tensor_parallelism_degree: int = 1,
+        model_specific_pipeline_parallelism_degree: int = 1,
+        ssms: list = [],
+    ):
+        """Compile the SSM for inference and load the weights into memory
+
+        :param mode: The SSM inference mode (InferenceMode.INC_DECODING_MODE for incremental decoding, InferenceMode.BEAM_SEARCH_MODE for beam search, or InferenceMode.TREE_VERIFY_MODE for token tree verification), defaults to InferenceMode.INC_DECODING_MODE
+        :type mode: InferenceMode, optional
+        :param sampling_config: The SamplingConfig object with the configurations to use for sampling, defaults to SamplingConfig()
+        :type sampling_config: SamplingConfig, optional
+        :param max_batch_size: The maximum batch size to allow, defaults to 1
+        :type max_batch_size: int, optional
+        :param max_seq_length: The maximum sequence length to allow per batch, defaults to 256
+        :type max_seq_length: int, optional
+        :param max_tokens_per_batch: The maximum number of tokens (across requests) to allow per batch, defaults to 64
+        :type max_tokens_per_batch: int, optional
+        :param model_specific_data_parallelism_degree: Use this parameter if you want to give the SSM a different data parallelism degree than the default one, defaults to 1
+        :type model_specific_data_parallelism_degree: int, optional
+        :param model_specific_tensor_parallelism_degree: Use this parameter if you want to give the SSM a different tensor parallelism degree than the default one, defaults to 1
+        :type model_specific_tensor_parallelism_degree: int, optional
+        :param model_specific_pipeline_parallelism_degree: Use this parameter if you want to give the SSM a different pipeline parallelism degree than the default one, defaults to 1
+        :type model_specific_pipeline_parallelism_degree: int, optional
+        :param ssms: The SSMs to use when operating in speculative inference mode, defaults to []
+        :type ssms: list, optional
+        """
+        super().compile(
+            mode,
+            sampling_config,
+            max_batch_size,
+            max_seq_length,
+            max_tokens_per_batch,
+            model_specific_data_parallelism_degree,
+            model_specific_tensor_parallelism_degree,
+            model_specific_pipeline_parallelism_degree,
+            ssms,
+        )
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index 59f9046c57..e84cd5db67 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -1049,7 +1049,7 @@ flexflow_tensor_t flexflow_model_add_multihead_attention(
   return FFCObjectWrapper::wrap(tensor);
 }
 
-flexflow_tensor_t flexflow_model_add_inc_multihead_attention(
+flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention(
     flexflow_model_t handle_,
     const flexflow_tensor_t input_,
     int embed_dim,
@@ -1090,7 +1090,7 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_attention(
   return FFCObjectWrapper::wrap(tensor);
 }
 
-flexflow_tensor_t flexflow_model_add_spec_inc_multihead_attention(
+flexflow_tensor_t flexflow_model_add_spec_inc_multihead_self_attention(
     flexflow_model_t handle_,
     const flexflow_tensor_t input_,
     int embed_dim,
@@ -1174,7 +1174,7 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention_verify(
   return FFCObjectWrapper::wrap(tensor);
 }
 
-flexflow_tensor_t flexflow_model_add_inc_multiquery_attention(
+flexflow_tensor_t flexflow_model_add_inc_multiquery_self_attention(
     flexflow_model_t handle_,
     const flexflow_tensor_t input_,
     int embed_dim,
@@ -1217,7 +1217,7 @@ flexflow_tensor_t flexflow_model_add_inc_multiquery_attention(
   return FFCObjectWrapper::wrap(tensor);
 }
 
-flexflow_tensor_t flexflow_model_add_spec_inc_multiquery_attention(
+flexflow_tensor_t flexflow_model_add_spec_inc_multiquery_self_attention(
     flexflow_model_t handle_,
     const flexflow_tensor_t input_,
     int embed_dim,
@@ -2430,21 +2430,21 @@ void flexflow_inference_manager_init_operators_inference(
 
 flexflow_file_data_loader_t
     flexflow_file_data_loader_create(char const *weight_file_path,
-                                     int num_heads,
+                                     int num_q_heads,
                                      int num_kv_heads,
                                      int hidden_dim,
                                      int qkv_inner_dim,
-                                     int tensor_partition_num) {
+                                     int tensor_parallelism_degree) {
   assert(weight_file_path != nullptr &&
          "Cannot convert nullptr char * to std::string");
   std::string const weight_file_path_str(weight_file_path);
   FileDataLoader *handle = new FileDataLoader("",
                                               weight_file_path_str,
-                                              num_heads,
+                                              num_q_heads,
                                               num_kv_heads,
                                               hidden_dim,
                                               qkv_inner_dim,
-                                              tensor_partition_num);
+                                              tensor_parallelism_degree);
   DEBUG_PRINT("[FileDataLoader] new %p", handle);
   return FFCObjectWrapper::wrap(handle);
 }
diff --git a/src/ops/fused.cu b/src/ops/fused.cu
index 02853bbf09..b834073064 100644
--- a/src/ops/fused.cu
+++ b/src/ops/fused.cu
@@ -379,6 +379,7 @@ __host__ void FusedOp::forward_task(Task const *task,
                                                    effective_batch_size);
         break;
       }
+      case OP_GELU:
       case OP_RELU:
       case OP_SIGMOID:
       case OP_TANH:
@@ -778,6 +779,7 @@ __host__ void
                                                    effective_batch_size);
         break;
       }
+      case OP_GELU:
       case OP_RELU:
       case OP_SIGMOID:
       case OP_TANH:
@@ -1323,6 +1325,7 @@ __host__ void FusedOp::backward_task(Task const *task,
             batch_size);
         break;
       }
+      case OP_GELU:
       case OP_RELU:
       case OP_SIGMOID:
       case OP_TANH:
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 39dee64ff1..bd9079ec0c 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -349,90 +349,6 @@ FutureMap InferenceManager::inference(FFModel *model,
   return fm;
 };
 
-void InferenceManager::incr_decoding_loop(FFModel *model,
-                                          RequestManager &rm,
-                                          int total_num_requests) {
-  BatchConfig bc;
-  InferenceResult ir;
-  while (rm.get_num_processed_requests() < total_num_requests) {
-    bc = rm.prepare_next_batch(bc, ir);
-    if (rm.get_num_processed_requests() >= total_num_requests) {
-      break;
-    }
-    FutureMap fm = inference(model, 0, bc);
-    assert(fm.get_future_map_domain().get_volume() == 1);
-    Future future = fm.get_future(0);
-    ir = future.get_result<InferenceResult>();
-    // assert(false);
-  }
-}
-
-void InferenceManager::spec_inference_loop(FFModel *model,
-                                           RequestManager &rm,
-                                           int total_num_requests,
-                                           std::vector<int> ssm_model_ids) {
-  TreeVerifyBatchConfig tree_bc;
-  BeamSearchBatchConfig beam_bc;
-  std::vector<BeamSearchBatchConfig> beam_bc_vec;
-  int num_ssms = ssm_model_ids.size();
-  for (int ssm_id = 0; ssm_id < num_ssms; ssm_id++) {
-    beam_bc_vec.push_back(BeamSearchBatchConfig(ssm_model_ids[ssm_id]));
-  }
-
-  InferenceResult tree_ir;
-
-  while (rm.get_num_processed_requests() < total_num_requests) {
-    int depth = 0;
-    // Beam Search
-    beam_bc = rm.prepare_next_batch_init(tree_bc, tree_ir, 0);
-    for (int ssm_id = 0; ssm_id < num_ssms; ssm_id++) {
-      beam_bc_vec[ssm_id] = beam_bc;
-      beam_bc_vec[ssm_id].model_id = ssm_id;
-    }
-
-    if (rm.get_num_processed_requests() >= total_num_requests) {
-      break;
-    }
-
-    for (int i = 0; i < num_ssms; i++) {
-      while (true) {
-        beam_bc = beam_bc_vec[i];
-        depth = beam_bc.beamRequestsInfo[0].current_depth;
-
-        FutureMap fm = inference(rm.get_model(0), 0, beam_bc_vec[i]);
-        assert(fm.get_future_map_domain().get_volume() == 1);
-        Future future = fm.get_future(0);
-        BeamInferenceResult beam_ir = future.get_result<BeamInferenceResult>();
-
-        int iteration =
-            std::min(BeamSearchBatchConfig::MAX_BEAM_DEPTH,
-                     BatchConfig::MAX_SEQ_LENGTH - beam_bc.max_init_length);
-
-        if (depth - 1 >= iteration) {
-          break;
-        } else {
-          beam_bc_vec[i] = rm.prepare_next_batch_beam(beam_bc_vec[i], beam_ir);
-          if (beam_bc_vec[i].num_active_tokens() == 0 &&
-              beam_bc_vec[i].num_active_requests() != 0) {
-            break;
-          }
-        }
-      }
-      std::cout << "----------beam search finished for model "
-                << beam_bc_vec[i].model_id << "------------" << std::endl;
-    }
-    // Token Tree Verification
-    {
-      tree_bc = rm.prepare_next_batch_verify(beam_bc_vec);
-      FutureMap fm = inference(model, 0, tree_bc);
-
-      assert(fm.get_future_map_domain().get_volume() == 1);
-      Future future = fm.get_future(0);
-      tree_ir = future.get_result<InferenceResult>();
-    }
-  }
-}
-
 void InferenceManager::load_input_tokens_from_batch_config(
     BatchConfigFuture const &bc, ParallelTensor const input) {
   Context ctx = ff_config.lg_ctx;
@@ -761,4 +677,24 @@ void FFModel::compile_inference() {
   }
 #endif
 }
+
+std::string join_path(std::vector<std::string> const &paths) {
+  std::string joined;
+  for (auto const &path : paths) {
+    if (joined.empty()) {
+      joined = path;
+    } else {
+      if (path[0] == '/') {
+        joined = path;
+      } else if (joined.back() != '/') {
+        joined += '/';
+        joined += path;
+      } else {
+        joined += path;
+      }
+    }
+  }
+  return joined;
+}
+
 }; // namespace FlexFlow
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 2041bdd9a7..a49f827482 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -100,7 +100,9 @@ void RequestManager::register_tokenizer(ModelType type,
     this->tokenizer_ =
         Tokenizer::FromBlobByteLevelBPE(vocab, merges, added_tokens);
   } else if (model_type == ModelType::FALCON) {
-    this->tokenizer_ = Tokenizer::FromBlobJSON(LoadBytesFromFile(path));
+    std::string falcon_tokenizer_path = join_path({path, "tokenizer.json"});
+    this->tokenizer_ =
+        Tokenizer::FromBlobJSON(LoadBytesFromFile(falcon_tokenizer_path));
   }
 }
 
diff --git a/tests/.gitignore b/tests/.gitignore
index e69de29bb2..f3732d54f4 100644
--- a/tests/.gitignore
+++ b/tests/.gitignore
@@ -0,0 +1 @@
+inference/python_test_configs/*.json
diff --git a/tests/inference/cpp_inference_tests.sh b/tests/inference/cpp_inference_tests.sh
index dc8cc1f78a..fba42538ef 100755
--- a/tests/inference/cpp_inference_tests.sh
+++ b/tests/inference/cpp_inference_tests.sh
@@ -2,61 +2,34 @@
 set -x
 set -e
 
-cleanup() {
-    rm -rf ../../inference/prompt ../../inference/weights ../../inference/tokenizer ../../inference/output
-}
-
 # Cd into directory holding this script
 cd "${BASH_SOURCE[0]%/*}"
 
-# Enable model parallelism tests, if desired
-TENSOR_PARALLELISM_TESTS=${TENSOR_PARALLELISM_TESTS:-OFF}
-
-# Clean up before test (just in case)
-cleanup
-
-# Update the transformers library to support the LLAMA model
-
-pip3 install --upgrade transformers sentencepiece
-
-# Download the weights in both half and full precision
-python3 ../../inference/utils/download_llama_weights.py
-python3 ../../inference/utils/download_llama_weights.py --use-full-precision
-python3 ../../inference/utils/download_opt_weights.py
-python3 ../../inference/utils/download_opt_weights.py --use-full-precision
-
-# Create test prompt file
-mkdir -p ../../inference/prompt
-echo '["Give three tips for staying healthy."]' > ../../inference/prompt/test.json
-
-# Create output folder
-mkdir -p ../../inference/output
-
 ###############################################################################################
 ############################ Speculative inference tests ######################################
 ###############################################################################################
 
 # LLAMA
-../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../../inference/weights/llama_7B_weights/ -llm-config ../../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../../inference/weights/llama_160M_weights/ -ssm-config ../../inference/models/configs/llama_160M.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama.txt -pipeline-parallelism-degree 4
+../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model decapoda-research/llama-7b-hf -ssm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama.txt -pipeline-parallelism-degree 4
 # LLAMA (half precision)
-../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../../inference/weights/llama_7B_weights_half/ -llm-config ../../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../../inference/weights/llama_160M_weights_half/ -ssm-config ../../inference/models/configs/llama_160M.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_half.txt -pipeline-parallelism-degree 4
+../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model decapoda-research/llama-7b-hf -ssm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_half.txt -pipeline-parallelism-degree 4
 
 # OPT
-../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../../inference/weights/opt_6B_weights/ -llm-config ../../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../../inference/weights/opt_125M_weights/ -ssm-config ../../inference/models/configs/opt_125M.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt.txt -pipeline-parallelism-degree 4
+../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-6.7b -ssm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt.txt -pipeline-parallelism-degree 4
 # OPT (half precision)
-../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../../inference/weights/opt_6B_weights_half/ -llm-config ../../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../../inference/weights/opt_125M_weights_half/ -ssm-config ../../inference/models/configs/opt_125M.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt_half.txt -pipeline-parallelism-degree 4
+../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-6.7b -ssm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt_half.txt -pipeline-parallelism-degree 4
 
 # Tensor parallelism tests
 if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
     # LLAMA
-    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../../inference/weights/llama_7B_weights/ -llm-config ../../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../../inference/weights/llama_160M_weights/ -ssm-config ../../inference/models/configs/llama_160M.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model decapoda-research/llama-7b-hf -ssm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     # LLAMA (half precision)
-    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../../inference/weights/llama_7B_weights_half/ -llm-config ../../inference/models/configs/llama_7B.json -ssm-model llama -ssm-weight ../../inference/weights/llama_160M_weights_half/ -ssm-config ../../inference/models/configs/llama_160M.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model decapoda-research/llama-7b-hf -ssm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     
     # OPT
-    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../../inference/weights/opt_6B_weights/ -llm-config ../../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../../inference/weights/opt_125M_weights/ -ssm-config ../../inference/models/configs/opt_125M.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-6.7b -ssm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     # OPT (half precision)
-    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../../inference/weights/opt_6B_weights_half/ -llm-config ../../inference/models/configs/opt_6B.json -ssm-model opt -ssm-weight ../../inference/weights/opt_125M_weights_half/ -ssm-config ../../inference/models/configs/opt_125M.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-6.7b -ssm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
 fi
 
 ###############################################################################################
@@ -64,50 +37,55 @@ fi
 ###############################################################################################
 
 # LLAMA (small model)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../../inference/weights/llama_160M_weights/ -llm-config ../../inference/models/configs/llama_160M.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M.txt -pipeline-parallelism-degree 4
 # LLAMA (small model, half precision)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../../inference/weights/llama_160M_weights_half/ -llm-config ../../inference/models/configs/llama_160M.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half.txt -pipeline-parallelism-degree 4
 
 # LLAMA (big model)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../../inference/weights/llama_7B_weights/ -llm-config ../../inference/models/configs/llama_7B.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_7B.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model decapoda-research/llama-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_7B.txt -pipeline-parallelism-degree 4
 # LLAMA (big model, half precision)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../../inference/weights/llama_7B_weights_half/ -llm-config ../../inference/models/configs/llama_7B.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_7B_half.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model decapoda-research/llama-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_7B_half.txt -pipeline-parallelism-degree 4
 
 # OPT (small model)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../../inference/weights/opt_125M_weights/ -llm-config ../../inference/models/configs/opt_125M.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M.txt -pipeline-parallelism-degree 4
 # OPT (small model, half precision)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../../inference/weights/opt_125M_weights_half/ -llm-config ../../inference/models/configs/opt_125M.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_half.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_half.txt -pipeline-parallelism-degree 4
 
 # OPT (big model)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../../inference/weights/opt_6B_weights/ -llm-config ../../inference/models/configs/opt_6B.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_6B.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-6.7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_6B.txt -pipeline-parallelism-degree 4
 # OPT (big model, half precision)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../../inference/weights/opt_6B_weights_half/ -llm-config ../../inference/models/configs/opt_6B.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_6B_half.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-6.7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_6B_half.txt -pipeline-parallelism-degree 4
+
+# Falcon (full precision)
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model tiiuae/falcon-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_falcon_7B.txt -pipeline-parallelism-degree 4
+# Falcon (half precision)
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model tiiuae/falcon-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_falcon_7B_half.txt -pipeline-parallelism-degree 4
 
 # Tensor parallelism tests
 if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
     # LLAMA (small model)
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../../inference/weights/llama_160M_weights/ -llm-config ../../inference/models/configs/llama_160M.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../../inference/weights/llama_160M_weights/ -llm-config ../../inference/models/configs/llama_160M.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
     # LLAMA (small model, half precision)
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../../inference/weights/llama_160M_weights_half/ -llm-config ../../inference/models/configs/llama_160M.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../../inference/weights/llama_160M_weights_half/ -llm-config ../../inference/models/configs/llama_160M.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
 
     # LLAMA (big model)
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model llama -llm-weight ../../inference/weights/llama_7B_weights/ -llm-config ../../inference/models/configs/llama_7B.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_7B_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model decapoda-research/llama-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_7B_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     # LLAMA (big model, half precision)
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight ../../inference/weights/llama_7B_weights_half/ -llm-config ../../inference/models/configs/llama_7B.json -tokenizer ../../inference/tokenizer/tokenizer.model -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_7B_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model decapoda-research/llama-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_7B_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
 
     # OPT (small model)
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../../inference/weights/opt_125M_weights/ -llm-config ../../inference/models/configs/opt_125M.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../../inference/weights/opt_125M_weights/ -llm-config ../../inference/models/configs/opt_125M.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
     # OPT (small model, half precision)
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../../inference/weights/opt_125M_weights_half/ -llm-config ../../inference/models/configs/opt_125M.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../../inference/weights/opt_125M_weights_half/ -llm-config ../../inference/models/configs/opt_125M.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_half_tp.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_half_tp.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
 
     # OPT (big model)
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --use-full-precision -llm-model opt -llm-weight ../../inference/weights/opt_6B_weights/ -llm-config ../../inference/models/configs/opt_6B.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_6B_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-6.7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_6B_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     # OPT (big model, half precision)
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model opt -llm-weight ../../inference/weights/opt_6B_weights_half/ -llm-config ../../inference/models/configs/opt_6B.json -tokenizer ../../inference/tokenizer/ -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_6B_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-6.7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_6B_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
 fi
 
 ###############################################################################################
@@ -231,7 +209,6 @@ if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
 fi
 
 ######################### Alignment tests with HuggingFace ####################################
-pip3 install protobuf==3.20.3
 
 # LLAMA (small model, full precision)
 python3 ./huggingface_inference.py --model-name "JackFram/llama-160m" --tokenizer-model-name "JackFram/llama-160m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M.txt" --gpu
@@ -266,10 +243,3 @@ diff <(tail -n +2 "../../inference/output/huggingface_opt_125M.txt") <(tail -n +
 diff <(tail -n +2 "../../inference/output/huggingface_opt_125M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_decoding_opt_125M_half.txt" | tr -s '[:space:]' '\n' | head -n 20)
 #diff <(tail -n +2 "../../inference/output/huggingface_opt_6B.txt") <(tail -n +5 "../../inference/output/incr_decoding_opt_6B.txt")
 #diff <(tail -n +2 "../../inference/output/huggingface_opt_6B_half.txt") <(tail -n +5 "../../inference/output/incr_decoding_opt_6B_half.txt")
-
-###############################################################################################
-###################################### Cleanup ################################################
-###############################################################################################
-
-# Clean up after test
-# cleanup
diff --git a/tests/inference/python_inference_tests.sh b/tests/inference/python_inference_tests.sh
new file mode 100755
index 0000000000..800c0ad043
--- /dev/null
+++ b/tests/inference/python_inference_tests.sh
@@ -0,0 +1,191 @@
+#! /usr/bin/env bash
+set -x
+set -e
+
+# Cd into directory holding this script
+cd "${BASH_SOURCE[0]%/*}"
+
+# Generate test configs
+python python_test_configs/generate_configs.py
+
+# Run all tests
+# Loop through .json files in the ./python_test_configs dir 
+for file in ./python_test_configs/*.json; do
+    # Check filename prefix
+    if [[ $file == *"incr_dec"* ]]; then
+      script="../../inference/python/incr_decoding.py"
+    elif [[ $file == *"spec_infer"* ]]; then  
+      script="../../inference/python/spec_infer.py"
+    fi
+    # Run script
+    python "$script" -config-file "$file" 
+done
+
+
+###############################################################################################
+############################### Alignment and Speed tests #####################################
+###############################################################################################
+
+##################################### Helper functions #######################################
+function check_partial_token_match {
+    local file1="$1"
+    local file2="$2"
+    local num_tokens_to_match=30
+
+    # Read the second line of the first file
+    third_line=$(sed -n '3p' "$file1")
+    read -r line1 <<< "$third_line"
+    tokens1=${line1#*: }
+    IFS=',' read -ra arr1 <<< "$tokens1"
+
+    # Read the second line of the second file
+    third_line=$(sed -n '3p' "$file2")
+    read -r line2 <<< "$third_line"
+    tokens2=${line2#*: }
+    IFS=',' read -ra arr2 <<< "$tokens2"
+
+    # Compare the first few integers in the two lists
+    for ((i = 0; i < num_tokens_to_match; i++)); do
+        if [[ "${arr1[$i]}" != "${arr2[$i]}" ]]; then
+            echo "The first $num_tokens_to_match tokens in files $file1 and $file2 are not identical."
+            exit 1
+        fi
+    done
+    #echo "The first $num_tokens_to_match integers are identical."
+}
+
+function compare_speed_spec_infer_incr_decoding {
+    local incrDec_file="$1"
+    local specInf_file="$2"
+
+    # Read the float numbers from the first line of the files
+    incrDec=$(sed -n '1 s/end-to-end latency: \(.*\)/\1/p' "$incrDec_file")
+    specInf=$(sed -n '1 s/end-to-end latency: \(.*\)/\1/p' "$specInf_file")
+
+    if ! command -v bc &> /dev/null; then
+        echo "bc is not installed. Installing..."
+        sudo apt-get install -y bc
+    fi
+    
+    # Perform the comparison
+    threshold=$(bc <<< "$specInf * 1.5")
+    if (( $(echo "$incrDec >= $threshold" | bc -l) )); then
+        #echo "The latency in $specInf_file is at least 1.5x smaller than the latency from $incrDec_file."
+        :
+    else
+        echo "Error: The latency in $specInf_file is not at least 1.5x smaller than the latency in $incrDec_file!"
+        exit 1
+    fi
+}
+
+function compare_decoding_steps_spec_infer_incr_decoding {
+    local incrDec_file="$1"
+    local specInf_file="$2"
+
+    # Read the number of decoding steps from the second line of the files
+    second_line=$(sed -n '2p' "$incrDec_file")
+    read -r line <<< "$second_line"
+    incrDec=${line#*: }
+    second_line=$(sed -n '2p' "$specInf_file")
+    read -r line <<< "$second_line"
+    specInf=${line#*: }
+
+    if ! command -v bc &> /dev/null; then
+        echo "bc is not installed. Installing..."
+        sudo apt-get install -y bc
+    fi
+    
+    # Perform the comparison
+    threshold=$(bc <<< "$specInf * 1.5")
+    if (( $(echo "$incrDec >= $threshold" | bc -l) )); then
+        #echo "The decoding steps in $specInf_file are at least 1.5x less than those in $incrDec_file."
+        :
+    else
+        echo "Error: The decoding steps in $specInf_file are not at least 1.5x less than those in $incrDec_file!"
+        exit 1
+    fi
+}
+
+############ Alignment between speculative inference and incremental decoding #################
+# Full precision
+diff <(tail -n +3 "../../inference/output/incr_dec-python-llama-7b-hf-full_prec-1_tp_4_pp.txt") <(tail -n +3 "../../inference/output/spec_infer-python-llama-7b-hf-full_prec-1_tp_4_pp.txt")
+diff <(tail -n +3 "../../inference/output/incr_dec-python-opt-6.7b-full_prec-1_tp_4_pp.txt")   <(tail -n +3 "../../inference/output/spec_infer-python-opt-6.7b-full_prec-1_tp_4_pp.txt")
+# Half precision
+check_partial_token_match "../../inference/output/incr_dec-python-llama-7b-hf-half_prec-1_tp_4_pp.txt" "../../inference/output/spec_infer-python-llama-7b-hf-half_prec-1_tp_4_pp.txt"
+check_partial_token_match "../../inference/output/incr_dec-python-opt-6.7b-half_prec-1_tp_4_pp.txt" "../../inference/output/spec_infer-python-opt-6.7b-half_prec-1_tp_4_pp.txt"
+
+# Speed test: speculative inference should be at very least 1.5x faster than incremental decoding
+# Full precision
+compare_decoding_steps_spec_infer_incr_decoding "../../inference/output/incr_dec-python-llama-7b-hf-full_prec-1_tp_4_pp.txt" "../../inference/output/spec_infer-python-llama-7b-hf-full_prec-1_tp_4_pp.txt"
+compare_decoding_steps_spec_infer_incr_decoding "../../inference/output/incr_dec-python-opt-6.7b-full_prec-1_tp_4_pp.txt" "../../inference/output/spec_infer-python-opt-6.7b-full_prec-1_tp_4_pp.txt"
+# Half precision
+compare_decoding_steps_spec_infer_incr_decoding "../../inference/output/incr_dec-python-llama-7b-hf-half_prec-1_tp_4_pp.txt" "../../inference/output/spec_infer-python-llama-7b-hf-half_prec-1_tp_4_pp.txt"
+compare_decoding_steps_spec_infer_incr_decoding "../../inference/output/incr_dec-python-opt-6.7b-half_prec-1_tp_4_pp.txt" "../../inference/output/spec_infer-python-opt-6.7b-half_prec-1_tp_4_pp.txt"
+
+############ Alignment between tensor model parallelism and pipeline parallelism only #################
+## Specinfer
+# LLAMA
+diff <(tail -n +3 "../../inference/output/spec_infer-python-llama-7b-hf-full_prec-2_tp_2_pp.txt") <(tail -n +3 "../../inference/output/spec_infer-python-llama-7b-hf-full_prec-1_tp_4_pp.txt")
+check_partial_token_match "../../inference/output/spec_infer-python-llama-7b-hf-half_prec-2_tp_2_pp.txt" "../../inference/output/spec_infer-python-llama-7b-hf-half_prec-1_tp_4_pp.txt"
+# OPT
+diff <(tail -n +3 "../../inference/output/spec_infer-python-opt-6.7b-full_prec-2_tp_2_pp.txt")  <(tail -n +3 "../../inference/output/spec_infer-python-opt-6.7b-full_prec-1_tp_4_pp.txt")
+check_partial_token_match "../../inference/output/spec_infer-python-opt-6.7b-half_prec-2_tp_2_pp.txt" "../../inference/output/spec_infer-python-opt-6.7b-half_prec-1_tp_4_pp.txt"
+
+## Incremental decoding
+# Small LLAMA
+diff <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-full_prec-2_tp_2_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-full_prec-1_tp_4_pp.txt")
+check_partial_token_match "../../inference/output/incr_dec-python-llama-160m-half_prec-2_tp_2_pp.txt" "../../inference/output/incr_dec-python-llama-160m-half_prec-1_tp_4_pp.txt"
+diff <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-full_prec-4_tp_1_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-full_prec-1_tp_4_pp.txt")
+check_partial_token_match "../../inference/output/incr_dec-python-llama-160m-half_prec-4_tp_1_pp.txt" "../../inference/output/incr_dec-python-llama-160m-half_prec-1_tp_4_pp.txt"
+# Big LLAMA
+diff <(tail -n +3 "../../inference/output/incr_dec-python-llama-7b-hf-full_prec-2_tp_2_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-llama-7b-hf-full_prec-1_tp_4_pp.txt")
+check_partial_token_match "../../inference/output/incr_dec-python-llama-7b-hf-half_prec-2_tp_2_pp.txt" "../../inference/output/incr_dec-python-llama-7b-hf-half_prec-1_tp_4_pp.txt"
+#diff <(tail -n +3 "../../inference/output/incr_dec-python-llama-7b-hf-full_prec-4_tp_1_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-llama-7b-hf-full_prec-1_tp_4_pp.txt")
+#check_partial_token_match "../../inference/output/incr_dec-python-llama-7b-hf-half_prec-4_tp_1_pp.txt" "../../inference/output/incr_dec-python-llama-7b-hf-half_prec-1_tp_4_pp.txt"
+# Small OPT
+diff <(tail -n +3 "../../inference/output/incr_dec-python-opt-125m-full_prec-2_tp_2_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-opt-125m-full_prec-1_tp_4_pp.txt")
+check_partial_token_match "../../inference/output/incr_dec-python-opt-125m-half_prec-2_tp_2_pp.txt" "../../inference/output/incr_dec-python-opt-125m-half_prec-1_tp_4_pp.txt"
+diff <(tail -n +3 "../../inference/output/incr_dec-python-opt-125m-full_prec-4_tp_1_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-opt-125m-full_prec-1_tp_4_pp.txt")
+check_partial_token_match "../../inference/output/incr_dec-python-opt-125m-half_prec-4_tp_1_pp.txt" "../../inference/output/incr_dec-python-opt-125m-half_prec-1_tp_4_pp.txt"
+# Big OPT
+diff <(tail -n +3 "../../inference/output/incr_dec-python-opt-6.7b-full_prec-2_tp_2_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-opt-6.7b-full_prec-1_tp_4_pp.txt")
+check_partial_token_match "../../inference/output/incr_dec-python-opt-6.7b-half_prec-2_tp_2_pp.txt" "../../inference/output/incr_dec-python-opt-6.7b-half_prec-1_tp_4_pp.txt"
+#diff <(tail -n +3 "../../inference/output/incr_dec-python-opt-6.7b-full_prec-4_tp_1_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-opt-6.7b-full_prec-1_tp_4_pp.txt")
+#check_partial_token_match "../../inference/output/incr_dec-python-opt-6.7b-half_prec-4_tp_1_pp.txt" "../../inference/output/incr_dec-python-opt-6.7b-half_prec-1_tp_4_pp.txt"
+
+
+######################### Alignment tests with HuggingFace ####################################
+
+# LLAMA (small model, full precision)
+python3 ./huggingface_inference.py --model-name "JackFram/llama-160m" --tokenizer-model-name "JackFram/llama-160m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M.txt" --gpu
+
+# LLAMA (small model, half precision)
+python3 ./huggingface_inference.py --model-name "JackFram/llama-160m" --tokenizer-model-name "JackFram/llama-160m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M_half.txt" --gpu
+
+# LLAMA (big model, full precision)
+python3 ./huggingface_inference.py --model-name "decapoda-research/llama-7b-hf" --tokenizer-model-name "JackFram/llama-160m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B.txt"
+
+# LLAMA (big model, half precision)
+python3 ./huggingface_inference.py --model-name "decapoda-research/llama-7b-hf" --tokenizer-model-name "JackFram/llama-160m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B_half.txt" --gpu
+
+# OPT (small model, full precision)
+python3 ./huggingface_inference.py --model-name "facebook/opt-125m" --tokenizer-model-name "facebook/opt-125m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_125M.txt" --gpu --max-length 128
+
+# OPT (small model, half precision)
+python3 ./huggingface_inference.py --model-name "facebook/opt-125m" --tokenizer-model-name "facebook/opt-125m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_125M_half.txt" --gpu --max-length 128
+
+# OPT (big model, full precision)
+#python3 ./huggingface_inference.py --model-name "facebook/opt-6.7b" --tokenizer-model-name "facebook/opt-6.7b" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_6B.txt" --max-length 127
+
+# OPT (big model, half precision)
+#python3 ./huggingface_inference.py --model-name "facebook/opt-6.7b" --tokenizer-model-name "facebook/opt-6.7b" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_6B_half.txt" --gpu --max-length 127
+
+diff <(tail -n +2 "../../inference/output/huggingface_llama_160M.txt") <(tail -n +5 "../../inference/output/incr_dec-python-llama-160m-full_prec-1_tp_4_pp.txt")
+diff <(tail -n +2 "../../inference/output/huggingface_llama_160M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_dec-python-llama-160m-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
+diff <(tail -n +2 "../../inference/output/huggingface_llama_7B.txt") <(tail -n +5 "../../inference/output/incr_dec-python-llama-7b-hf-full_prec-1_tp_4_pp.txt")
+diff <(tail -n +2 "../../inference/output/huggingface_llama_7B_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_dec-python-llama-7b-hf-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
+
+diff <(tail -n +2 "../../inference/output/huggingface_opt_125M.txt") <(tail -n +5 "../../inference/output/incr_dec-python-opt-125m-full_prec-1_tp_4_pp.txt")
+diff <(tail -n +2 "../../inference/output/huggingface_opt_125M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_dec-python-opt-125m-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
+#diff <(tail -n +2 "../../inference/output/huggingface_opt_6B.txt") <(tail -n +5 "../../inference/output/incr_dec-python-opt-6.7b-full_prec-1_tp_4_pp.txt")
+#diff <(tail -n +2 "../../inference/output/huggingface_opt_6B_half.txt") <(tail -n +5 "../../inference/output/incr_dec-python-opt-6.7b-half_prec-1_tp_4_pp.txt")
diff --git a/tests/inference/python_test_configs/generate_configs.py b/tests/inference/python_test_configs/generate_configs.py
new file mode 100644
index 0000000000..b4c3dd8039
--- /dev/null
+++ b/tests/inference/python_test_configs/generate_configs.py
@@ -0,0 +1,123 @@
+#!/usr/bin/env python
+import os, json
+
+# Base configs dictionaries
+ff_init_configs = {
+    # required parameters
+    "num_gpus": 4,
+    "memory_per_gpu": 14000,
+    "zero_copy_memory_per_gpu": 30000,
+    # optional parameters
+    "num_cpus": 4,
+    "legion_utility_processors": 4,
+    "data_parallelism_degree": 1,
+    "tensor_parallelism_degree": 1,
+    "pipeline_parallelism_degree": 4,
+    "offload": False,
+    "offload_reserve_space_size": 1024**2,
+    "use_4bit_quantization": False,
+    "use_8bit_quantization": False,
+    "profiling": False,
+    "fusion": True,
+}
+llm_configs = {
+    # required parameters
+    "llm_model": "tiiuae/falcon-7b",
+    # optional parameters
+    "cache_path": "",
+    "refresh_cache": False,
+    "full_precision": True,
+    "prompt": "",
+    "output_file": "",
+}
+ssm_configs = {
+    "ssms": [
+        {
+            # required ssm parameter
+            "ssm_model": "JackFram/llama-160m",
+            # optional ssm parameters
+            "cache_path": "",
+            "refresh_cache": False,
+            "full_precision": False,
+        },
+    ]
+}
+# Merge dictionaries
+ff_init_configs.update(llm_configs)
+
+# Test parameters to fill in
+llama_models = ["decapoda-research/llama-7b-hf", "JackFram/llama-160m"]
+opt_models = ["facebook/opt-6.7b", "facebook/opt-125m"]
+falcon_models = ["tiiuae/falcon-7b",]
+parallelism_settings = [(1,4), (2,2), (4,1)]
+
+# The paths below should be with respect to the folder from which the tests are launched (FF_HOME/tests/inference)
+prompt_file = "../../inference/prompt/test.json"
+output_folder = "../../inference/output"
+
+# Change working dir to folder storing this script
+abspath = os.path.abspath(__file__)
+dname = os.path.dirname(abspath)
+os.chdir(dname)
+
+
+# Generate incremental decoding configs
+all_models = llama_models + opt_models + falcon_models
+for model_name in all_models:
+    for full_precision in (True, False):
+        for parallelism_degrees in parallelism_settings:
+            
+            tp, pp = parallelism_degrees
+
+            # Tensor parallelism not supported by small Falcon model atm
+            if tp > 1 and "falcon" in model_name:
+                continue
+            # skip tp=4 for big models
+            if tp > 2 and ("7b" in model_name or "6.7b" in model_name):
+                continue
+            
+            _, after_slash = model_name.rsplit("/", maxsplit=1)
+            filename = "incr_dec-" + "python-" + after_slash + ("-full_prec-" if full_precision else "-half_prec-") + f"{tp}_tp_{pp}_pp"
+            test_configs_file = "./" + filename + ".json"
+            output_file = os.path.join(output_folder, filename+".txt")
+            
+            ff_init_configs["tensor_parallelism_degree"] = tp
+            ff_init_configs["pipeline_parallelism_degree"] = pp
+            ff_init_configs["llm_model"] = model_name
+            ff_init_configs["full_precision"] = full_precision
+            ff_init_configs["output_file"] = output_file
+            ff_init_configs["prompt"] = prompt_file
+
+            with open(test_configs_file, "w+") as outfile:
+                json.dump(ff_init_configs, outfile, indent=4)
+
+# Generate speculative inference configs
+model_pairs = [llama_models, opt_models]
+for model_pair in model_pairs:
+    for full_precision in (True, False):
+        for parallelism_degrees in parallelism_settings:
+            big_model, small_model = model_pair
+            tp, pp = parallelism_degrees
+
+            # Skip fully tp tests
+            if tp > 2:
+                continue
+
+            _, after_slash = big_model.rsplit("/", maxsplit=1)
+            filename = "spec_infer-" + "python-" + after_slash + ("-full_prec-" if full_precision else "-half_prec-") + f"{tp}_tp_{pp}_pp"
+            test_configs_file = "./" + filename + ".json"
+            output_file = os.path.join(output_folder, filename+".txt")
+            
+            ff_init_configs["tensor_parallelism_degree"] = tp
+            ff_init_configs["pipeline_parallelism_degree"] = pp
+            ff_init_configs["llm_model"] = big_model
+            ff_init_configs["full_precision"] = full_precision
+            ff_init_configs["output_file"] = output_file
+            ff_init_configs["prompt"] = prompt_file
+            
+            ssm_configs["ssms"][0]["ssm_model"] = small_model
+            ssm_configs["ssms"][0]["full_precision"] = full_precision
+            ff_init_configs.update(ssm_configs)
+
+            with open(test_configs_file, "w+") as outfile:
+                json.dump(ff_init_configs, outfile, indent=4)
diff --git a/tests/inference_tests.sh b/tests/inference_tests.sh
index ca95acc785..b1d45853e2 100755
--- a/tests/inference_tests.sh
+++ b/tests/inference_tests.sh
@@ -2,8 +2,42 @@
 set -x
 set -e
 
+cleanup() {
+    rm -rf ../inference/prompt ../inference/output
+}
+
 # Cd into directory holding this script
 cd "${BASH_SOURCE[0]%/*}"
 
-# replace this with python tests
-./inference/cpp_inference_tests.sh
+# Enable Python tests (on by default)
+PYTHON_INFERENCE_TESTS=${PYTHON_INFERENCE_TESTS:-ON}
+# Enable C++ tests, (off by default)
+CPP_INFERENCE_TESTS=${CPP_INFERENCE_TESTS:-OFF}
+# Enable model parallelism tests in C++, if desired
+TENSOR_PARALLELISM_TESTS=${TENSOR_PARALLELISM_TESTS:-OFF}
+
+# Clean up before test (just in case)
+cleanup
+
+# Make sure supported version of protobuf is installed
+pip3 install protobuf==3.20.3
+
+# Download the weights in both half and full precision
+python3 ../inference/utils/download_hf_model.py "decapoda-research/llama-7b-hf" "JackFram/llama-160m" "facebook/opt-6.7b" "facebook/opt-125m" "tiiuae/falcon-7b"
+
+# Create test prompt file
+mkdir -p ../inference/prompt
+echo '["Give three tips for staying healthy."]' > ../inference/prompt/test.json
+
+# Create output folder
+mkdir -p ../inference/output
+
+if [[ "$PYTHON_INFERENCE_TESTS" == "ON" ]]; then
+    echo "Running Python inference tests..."
+    ./inference/python_inference_tests.sh
+fi
+if [[ "$CPP_INFERENCE_TESTS" == "ON" ]]; then
+    echo "Running C++ inference tests..."
+    ./inference/cpp_inference_tests.sh
+fi
+

From bcf14a731c3d29896cc80a6209063c02d2914700 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 13 Aug 2023 17:52:26 +0000
Subject: [PATCH 194/344] merge fix

---
 python/flexflow/core/__init__.py | 18 +++++++++---------
 1 file changed, 9 insertions(+), 9 deletions(-)

diff --git a/python/flexflow/core/__init__.py b/python/flexflow/core/__init__.py
index 25f4ec7575..5b421a74ed 100644
--- a/python/flexflow/core/__init__.py
+++ b/python/flexflow/core/__init__.py
@@ -59,15 +59,15 @@
   else:
     print("Using Legion Python")
 
-    flexflow_library.initialize()
+  flexflow_library.initialize()
 
-    # check which python binding to use
-    if flexflow_python_binding() == "pybind11":
-        print("Using pybind11 flexflow bindings.")
-        from .flexflow_pybind11 import *
-    else:
-        print("Using cffi flexflow bindings.")
-        from .flexflow_cffi import *
+  # check which python binding to use
+  if flexflow_python_binding() == "pybind11":
+      print("Using pybind11 flexflow bindings.")
+      from .flexflow_pybind11 import *
+  else:
+      print("Using cffi flexflow bindings.")
+      from .flexflow_cffi import *
 
 else:
-    pass
+  pass

From a78947c7864689b747eb634ee5f60e59e325bbf1 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 15 Aug 2023 17:18:51 -0400
Subject: [PATCH 195/344] update tokenizers-cpp  repo

---
 deps/tokenizers-cpp | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/deps/tokenizers-cpp b/deps/tokenizers-cpp
index c53bc0444d..4f42c9fa74 160000
--- a/deps/tokenizers-cpp
+++ b/deps/tokenizers-cpp
@@ -1 +1 @@
-Subproject commit c53bc0444dbe2ea1f66e364cd576a6c1e23539b4
+Subproject commit 4f42c9fa74946d70af86671a3804b6f2433e5dac

From 77e4841e9e8c0df06754780783ef6a8757751054 Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Wed, 16 Aug 2023 08:45:09 -0400
Subject: [PATCH 196/344] starcoder model. (#962)

* starcoder model.

* python inferface + add cpp test.

* fix

* .

* remove test starcoder

* remove

* fix python opt

* fix
---
 include/flexflow/ffconst.h                    |   3 +-
 include/flexflow/flexflow_c.h                 |   2 +
 include/flexflow/model.h                      |   3 +
 include/flexflow/request_manager.h            |   3 +-
 inference/file_loader.cc                      |   9 +-
 inference/incr_decoding/CMakeLists.txt        |   3 +-
 inference/incr_decoding/incr_decoding.cc      |  11 +
 inference/models/opt.cc                       |   1 +
 inference/models/starcoder.cc                 | 216 ++++++++++++++
 inference/models/starcoder.h                  |  76 +++++
 python/flexflow/core/flexflow_cffi.py         |   3 +
 python/flexflow/serve/models/__init__.py      |   1 +
 python/flexflow/serve/models/opt.py           |   2 +
 python/flexflow/serve/models/starcoder.py     | 277 ++++++++++++++++++
 python/flexflow/serve/serve.py                |  13 +-
 python/flexflow/type.py                       |   1 +
 src/c/flexflow_c.cc                           |   6 +
 src/ops/inc_multihead_self_attention.cu       |   6 -
 src/runtime/inference_manager.cc              |  12 +-
 src/runtime/request_manager.cc                |   3 +-
 src/runtime/request_manager.cu                |   4 +-
 tests/inference/cpp_inference_tests.sh        |   5 +
 .../python_test_configs/generate_configs.py   |   3 +-
 23 files changed, 642 insertions(+), 21 deletions(-)
 create mode 100644 inference/models/starcoder.cc
 create mode 100644 inference/models/starcoder.h
 create mode 100644 python/flexflow/serve/models/starcoder.py

diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index 1694041163..2f97d48997 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -184,7 +184,8 @@ enum ModelType {
   LLAMA = 3002,
   LLAMA2 = 3003,
   OPT = 3004,
-  FALCON = 3005
+  FALCON = 3005,
+  STARCODER = 3006
 };
 
 enum PMParameter {
diff --git a/include/flexflow/flexflow_c.h b/include/flexflow/flexflow_c.h
index 1aa192f4e3..f2deacd8d7 100644
--- a/include/flexflow/flexflow_c.h
+++ b/include/flexflow/flexflow_c.h
@@ -566,6 +566,8 @@ flexflow_generation_result_t flexflow_model_generate(flexflow_model_t handle_,
                                                      char const *text,
                                                      int max_seq_length);
 
+void flexflow_model_set_position_offset(flexflow_model_t handle, int offset);
+
 // -----------------------------------------------------------------------
 // Tensor
 // -----------------------------------------------------------------------
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 7bd13224df..bc3c7e6545 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -986,6 +986,7 @@ class FFModel {
                CompMode comp_mode = COMP_MODE_TRAINING);
   void compile_inference();
   void set_transformer_layer_id(int id);
+  void set_position_offset(int offset);
   void graph_optimize(size_t budget,
                       bool only_data_parallel,
                       std::unique_ptr<PCG::Graph> &best_graph,
@@ -1043,6 +1044,8 @@ class FFModel {
   size_t op_global_guid, layer_global_guid;
   size_t tensor_global_guid, parallel_tensor_global_guid, node_global_guid;
   size_t current_transformer_layer_id;
+  // positional embedding start offset
+  int position_offset;
   FFConfig config;
   FFIterationConfig iter_config;
   Optimizer *optimizer;
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index 6aa69786ca..d6c30c6b78 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -40,7 +40,8 @@ class InferenceManager {
   void load_input_tokens_from_batch_config(BatchConfigFuture const &bc,
                                            ParallelTensor const input);
   void load_positions(BatchConfigFuture const &bc,
-                      ParallelTensor position_input);
+                      ParallelTensor position_input,
+                      int offset);
 
 public:
   FFConfig ff_config;
diff --git a/inference/file_loader.cc b/inference/file_loader.cc
index c15a3c0f2b..78f190dad6 100644
--- a/inference/file_loader.cc
+++ b/inference/file_loader.cc
@@ -137,7 +137,8 @@ void load_attention_bias_v2(DT *ptr,
   int file_index = 0;
 
   // now only opt use this.
-  assert(num_heads == num_kv_heads);
+  // assert(num_heads == num_kv_heads);
+  int idx = 0;
 
   for (auto file : bias_files) {
     int n_heads = file_index == 0 ? num_heads : num_kv_heads;
@@ -166,11 +167,12 @@ void load_attention_bias_v2(DT *ptr,
     size_t data_index = 0;
 
     for (int i = 0; i < partial_size; i++) {
-      ptr[file_index * qkv_partial_size + i] = host_array.at(data_index);
+      ptr[idx + i] = host_array.at(data_index);
       data_index++;
     }
 
     file_index++;
+    idx += qkv_partial_size;
 
     in.close();
   }
@@ -238,7 +240,8 @@ void load_attention_weights_v2(DT *ptr,
 
     if (in_get_size != loaded_data_size) {
       std::cout << "load attention data error " << in_get_size << ", "
-                << loaded_data_size;
+                << loaded_data_size << ", " << file_index << ", " << file
+                << "\n";
       assert(false && "data size mismatch");
     }
     // wq, wk, wo
diff --git a/inference/incr_decoding/CMakeLists.txt b/inference/incr_decoding/CMakeLists.txt
index d1313d328b..4ed60abb87 100644
--- a/inference/incr_decoding/CMakeLists.txt
+++ b/inference/incr_decoding/CMakeLists.txt
@@ -10,7 +10,8 @@ set(CPU_SRC
   ../file_loader.cc
   ../models/llama.cc
   ../models/opt.cc
-  ../models/falcon.cc)
+  ../models/falcon.cc
+  ../models/starcoder.cc)
 
 cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
 target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index cd84d6cb5c..e94cb4a4e9 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -18,6 +18,7 @@
 #include "models/falcon.h"
 #include "models/llama.h"
 #include "models/opt.h"
+#include "models/starcoder.h"
 #include <wordexp.h>
 
 #include <nlohmann/json.hpp>
@@ -170,6 +171,9 @@ void FlexFlow::top_level_task(Task const *task,
     } else if (str == "RWForCausalLM") {
       model_type = ModelType::FALCON;
       break;
+    } else if (str == "GPTBigCodeForCausalLM") {
+      model_type = ModelType::STARCODER;
+      break;
     }
   }
 
@@ -201,6 +205,13 @@ void FlexFlow::top_level_task(Task const *task,
                                 weights_filepath,
                                 INC_DECODING_MODE,
                                 use_full_precision);
+  } else if (model_type == ModelType::STARCODER) {
+    STARCODER::create_starcoder_model(model,
+                                      config_filepath,
+                                      weights_filepath,
+                                      INC_DECODING_MODE,
+                                      samplingConfig,
+                                      use_full_precision);
   } else {
     assert(false && "unknow model type");
   }
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index fc1d5512ba..9b3670ed89 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -40,6 +40,7 @@ void OPT::create_opt_model(FFModel &ff,
   //------------------------------ build the model --------------------------
   Tensor input;
   Tensor position_input;
+  ff.set_position_offset(2);
   {
     int const token_dims[] = {BatchConfig::MAX_NUM_TOKENS, 1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
diff --git a/inference/models/starcoder.cc b/inference/models/starcoder.cc
new file mode 100644
index 0000000000..fcd41e21ea
--- /dev/null
+++ b/inference/models/starcoder.cc
@@ -0,0 +1,216 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "starcoder.h"
+
+namespace FlexFlow {
+
+using namespace Legion;
+using json = nlohmann::json;
+
+void STARCODER::create_starcoder_model(
+    FFModel &ff,
+    std::string const &model_config_file_path,
+    std::string const &weight_file_path,
+    InferenceMode mode,
+    SamplingConfig samplingConfig,
+    bool use_full_precision) {
+  // do not apply cpu offload in beam search model.
+  STARCODERConfig startcoder_config(model_config_file_path);
+  startcoder_config.print();
+
+  if (ff.config.tensor_parallelism_degree >
+          startcoder_config.num_attention_heads ||
+      startcoder_config.num_attention_heads %
+              ff.config.tensor_parallelism_degree !=
+          0) {
+    assert(false && "The number of attention heads is smaller, or it is not "
+                    "divisible by the tensor parallelism degree");
+  }
+
+  std::unordered_map<std::string, Layer *> weights_layers;
+  std::vector<int> axes = {0};
+
+  Tensor input;
+  Tensor position_input;
+  ff.set_position_offset(0);
+  {
+    assert(startcoder_config.max_num_tokens <= BatchConfig::MAX_NUM_TOKENS);
+    int const token_dims[] = {BatchConfig::MAX_NUM_TOKENS, 1};
+    input = ff.create_tensor<2>(token_dims, DT_INT32);
+    position_input = ff.create_tensor<2>(token_dims, DT_INT32);
+  }
+
+  Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
+
+  Tensor token;
+
+  if (use_full_precision) {
+    token = ff.embedding(input,
+                         startcoder_config.vocab_size,
+                         startcoder_config.hidden_size,
+                         AGGR_MODE_NONE,
+                         DT_FLOAT,
+                         NULL,
+                         embed_init);
+  } else {
+    token = ff.embedding(input,
+                         startcoder_config.vocab_size,
+                         startcoder_config.hidden_size,
+                         AGGR_MODE_NONE,
+                         DT_HALF,
+                         NULL,
+                         embed_init);
+  }
+
+  Layer *embedding = ff.layers.back();
+  weights_layers.emplace("transformer_wte_weight", embedding);
+
+  Tensor positional_embedding;
+  if (use_full_precision) {
+    positional_embedding =
+        ff.embedding(position_input,
+                     startcoder_config.max_position_embeddings,
+                     startcoder_config.hidden_size,
+                     AGGR_MODE_NONE,
+                     DT_FLOAT,
+                     NULL,
+                     embed_init);
+  } else {
+    positional_embedding =
+        ff.embedding(position_input,
+                     startcoder_config.max_position_embeddings,
+                     startcoder_config.hidden_size,
+                     AGGR_MODE_NONE,
+                     DT_HALF,
+                     NULL,
+                     embed_init);
+  }
+  Layer *pos_embedding = ff.layers.back();
+  weights_layers.emplace("transformer_wpe_weight", pos_embedding);
+
+  Tensor hidden_states = ff.add(token, positional_embedding);
+
+  for (int i = 0; i < startcoder_config.num_hidden_layers; i++) {
+    // set transformer layer id
+    ff.set_transformer_layer_id(i);
+    // step 1: attention
+    Tensor ln_1 = ff.layer_norm(
+        hidden_states, axes, true, startcoder_config.layer_norm_epsilon);
+    Layer *layer_norm = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) + "_ln_1_weight",
+                           layer_norm);
+
+    Tensor mha;
+    switch (mode) {
+      case INC_DECODING_MODE: {
+        mha = ff.inc_multiquery_self_attention(
+            ln_1,
+            startcoder_config.hidden_size,
+            startcoder_config.num_attention_heads,
+            1,
+            startcoder_config.hidden_size /
+                startcoder_config.num_attention_heads,
+            startcoder_config.hidden_size /
+                startcoder_config.num_attention_heads,
+            startcoder_config.dropout_p, /*dropout*/
+            true,                        /*bias*/
+            false,                       /*add_bias_kv*/
+            false,                       /*add_zero_attn*/
+            DT_NONE,                     /*data_type*/
+            nullptr,                     /*kernel_initializer*/
+            false                        /*apply_rotary_embedding*/
+        );
+        break;
+      }
+      default: {
+        assert(false);
+      }
+    }
+    Layer *attention_layer = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) + "_attention_weight",
+                           attention_layer);
+    Tensor residual = ff.add(hidden_states, mha);
+
+    Tensor l2_norm = ff.layer_norm(
+        residual, axes, true, startcoder_config.layer_norm_epsilon);
+    Layer *l2_layer = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) + "_ln_2_weight",
+                           l2_layer);
+
+    // mlp
+    std::cout << "intermediate_size: " << startcoder_config.intermediate_size
+              << "\n";
+    Tensor c_fc = ff.dense(
+        l2_norm, startcoder_config.intermediate_size, AC_MODE_NONE, true);
+    Layer *c_fc_layer = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) + "_mlp_c_fc_weight",
+                           c_fc_layer);
+    c_fc = ff.gelu(c_fc);
+
+    Tensor c_proj =
+        ff.dense(c_fc, startcoder_config.hidden_size, AC_MODE_NONE, true);
+    Layer *c_proj_layer = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) + "_mlp_c_proj_weight",
+                           c_proj_layer);
+
+    hidden_states = ff.add(residual, c_proj);
+  }
+  // final normalization and linear
+  Tensor ln_f = ff.layer_norm(
+      hidden_states, axes, true, startcoder_config.layer_norm_epsilon);
+  Layer *final_norm = ff.layers.back();
+  weights_layers.emplace("transformer_ln_f_weight", final_norm);
+
+  Tensor lm_head =
+      ff.dense(ln_f, startcoder_config.vocab_size, AC_MODE_NONE, false);
+  Layer *final_linear = ff.layers.back();
+  weights_layers.emplace("lm_head_weight", final_linear);
+
+  Tensor output;
+  if (mode == BEAM_SEARCH_MODE) {
+    Tensor softmax = ff.softmax(lm_head, -1);
+    output = ff.argmax(softmax, /*beam_Search*/ true);
+  } else {
+    // Tensor softmax = ff.softmax(dense, -1);
+    if (samplingConfig.do_sample) {
+      lm_head = ff.scalar_truediv(lm_head, samplingConfig.temperature, false);
+      Tensor softmax = ff.softmax(lm_head, -1);
+      output = ff.sampling(softmax, samplingConfig.topp);
+    } else {
+      output = ff.argmax(lm_head, /*beam_Search*/ false);
+    }
+  }
+
+  InferenceManager *im = InferenceManager::get_inference_manager();
+  // Compile the model
+  std::cout << "------start compile ----------" << std::endl;
+  im->compile_model_and_allocate_buffer(&ff);
+  FileDataLoader fileloader("",
+                            weight_file_path,
+                            startcoder_config.num_attention_heads,
+                            1,
+                            startcoder_config.hidden_size,
+                            startcoder_config.hidden_size /
+                                startcoder_config.num_attention_heads,
+                            ff.config.tensor_parallelism_degree);
+  fileloader.load_weights(&ff, weights_layers, use_full_precision);
+  std::cout << "------load weight finished----------" << std::endl;
+
+  // init operators
+  im->init_operators_inference(&ff);
+}
+
+}; // namespace FlexFlow
diff --git a/inference/models/starcoder.h b/inference/models/starcoder.h
new file mode 100644
index 0000000000..af0732f3c4
--- /dev/null
+++ b/inference/models/starcoder.h
@@ -0,0 +1,76 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+#pragma once
+
+#include "file_loader.h"
+#include "flexflow/batch_config.h"
+#include "flexflow/inference.h"
+#include "flexflow/request_manager.h"
+#include <nlohmann/json.hpp>
+#include <string>
+using json = nlohmann::json;
+
+namespace FlexFlow {
+
+class STARCODER {
+public:
+  struct STARCODERConfig {
+    STARCODERConfig(std::string const &model_config_file_path) {
+      std::ifstream config_file(model_config_file_path);
+      if (config_file.is_open()) {
+        try {
+          json model_config;
+          config_file >> model_config;
+          num_hidden_layers = model_config["n_layer"];
+          vocab_size = model_config["vocab_size"];
+          num_attention_heads = model_config["n_head"];
+          hidden_size = model_config["n_embd"];
+          layer_norm_epsilon = model_config["layer_norm_epsilon"];
+          intermediate_size = model_config["n_inner"];
+          dropout_p = model_config["attn_pdrop"];
+          max_position_embeddings = model_config["n_positions"];
+        } catch (json::exception const &e) {
+          std::cerr << "Error parsing STARCODER config from JSON file: "
+                    << e.what() << std::endl;
+          assert(false);
+        }
+      } else {
+        std::cerr << "Error opening JSON file " << model_config_file_path
+                  << std::endl;
+        assert(false);
+      }
+      max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
+      max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
+      max_beam_width = BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+      max_beam_depth = BeamSearchBatchConfig::MAX_BEAM_DEPTH;
+    }
+
+    void print() const {}
+
+    int max_seq_len, max_num_tokens, max_beam_width, max_beam_depth;
+    int num_hidden_layers, vocab_size, num_attention_heads, hidden_size,
+        intermediate_size, max_position_embeddings;
+    float layer_norm_epsilon, dropout_p;
+  };
+
+  static void create_starcoder_model(FFModel &ff,
+                                     std::string const &model_config_file_path,
+                                     std::string const &weight_file_path,
+                                     InferenceMode mode,
+                                     SamplingConfig samplingConfig,
+                                     bool use_full_precision = false);
+};
+
+}; // namespace FlexFlow
diff --git a/python/flexflow/core/flexflow_cffi.py b/python/flexflow/core/flexflow_cffi.py
index b02ac5bdb9..48193720eb 100644
--- a/python/flexflow/core/flexflow_cffi.py
+++ b/python/flexflow/core/flexflow_cffi.py
@@ -2961,6 +2961,9 @@ def get_output_tensor(self, ffmodel, data_type):
   def generate(self, text, max_sequence_length):
     c_text = get_c_name(text)
     return ffc.flexflow_model_generate(self.handle, c_text, max_sequence_length)
+  
+  def set_position_offset(self, offset):
+    ffc.flexflow_model_set_position_offset(self.handle, offset)
 
 # -----------------------------------------------------------------------
 # SGDOptimizer
diff --git a/python/flexflow/serve/models/__init__.py b/python/flexflow/serve/models/__init__.py
index 3b4087203b..6b405b2f99 100644
--- a/python/flexflow/serve/models/__init__.py
+++ b/python/flexflow/serve/models/__init__.py
@@ -15,3 +15,4 @@
 from .llama import FlexFlowLLAMA
 from .opt import FlexFlowOPT
 from .falcon import FlexFlowFalcon
+from .starcoder import FlexFlowSTARCODER
diff --git a/python/flexflow/serve/models/opt.py b/python/flexflow/serve/models/opt.py
index 7e38b5de85..a33b261cb7 100644
--- a/python/flexflow/serve/models/opt.py
+++ b/python/flexflow/serve/models/opt.py
@@ -89,6 +89,8 @@ def build_model(self):
         input_tensor = ffmodel.create_tensor(tokens_dims, DataType.DT_INT32)
         position_tensor = ffmodel.create_tensor(tokens_dims, DataType.DT_INT32)
 
+        # OPT model positional embedding start offset is 2
+        ffmodel.set_position_offset(2)
         embed_init = UniformInitializer(random.randint(0, self.maxint), 0, 0)
         token = ffmodel.embedding(
             input_tensor,
diff --git a/python/flexflow/serve/models/starcoder.py b/python/flexflow/serve/models/starcoder.py
new file mode 100644
index 0000000000..193f7c8e1a
--- /dev/null
+++ b/python/flexflow/serve/models/starcoder.py
@@ -0,0 +1,277 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+from flexflow.core import *
+from .base import FlexFlowModel
+import random, torch
+
+
+class STARCODERConfig:
+    def __init__(self, hf_config):
+        self.max_seq_len = 256
+        self.max_num_tokens = 64
+        self.max_beam_width = 1
+        self.max_beam_depth = 8
+        self.dropout_p = hf_config.dropout_p
+        self.hidden_size = hf_config.hidden_size
+        self.layer_norm_epsilon = hf_config.layer_norm_epsilon
+        self.max_position_embeddings = hf_config.max_position_embeddings
+        self.num_attention_heads = hf_config.num_attention_heads
+        self.num_hidden_layers = hf_config.num_hidden_layers
+        self.vocab_size = hf_config.vocab_size
+        self.intermediate_size = hf_config.intermediate_size
+
+
+class FlexFlowSTARCODER(FlexFlowModel):
+    def __init__(
+        self,
+        mode,
+        sampling_config,
+        ffconfig,
+        hf_config,
+        data_type,
+        max_batch_size=1,
+        max_seq_length=256,
+        max_tokens_per_batch=64,
+        weights_filepath="",
+        tokenizer_filepath="",
+    ):
+        self.mode = mode
+        self.sampling_config = sampling_config
+        self.ffconfig = ffconfig
+        self.max_batch_size = max_batch_size
+        self.data_type = data_type
+        self.starcoder_config = STARCODERConfig(hf_config)
+        self.starcoder_config.max_seq_length = max_seq_length
+        self.starcoder_config.max_num_tokens = max_tokens_per_batch
+        self.weights_filepath = weights_filepath
+        self.tokenizer_filepath = tokenizer_filepath
+        self.maxint = 2**31 - 1
+
+        # Sanity checks
+        if (
+            self.starcoder_config.hidden_size
+            % self.starcoder_config.num_attention_heads
+            != 0
+        ):
+            raise ValueError(
+                f"Hidden size ({self.starcoder_config.hidden_size}) is not divisible by n_head ({self.starcoder_config.num_attention_heads})"
+            )
+
+        # Sanity checks
+        if (
+            self.starcoder_config.num_attention_heads
+            < self.ffconfig.tensor_parallelism_degree
+            or self.starcoder_config.num_attention_heads
+            % self.ffconfig.tensor_parallelism_degree
+            != 0
+        ):
+            raise ValueError(
+                f"Number of attention heads ({self.starcoder_config.num_attention_heads}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
+            )
+
+        self.build_model()
+
+    def build_model(self):
+        ffmodel = FFModel(self.ffconfig)
+
+        tokens_dims = [self.starcoder_config.max_num_tokens, 1]
+        input_tensor = ffmodel.create_tensor(tokens_dims, DataType.DT_INT32)
+        position_tensor = ffmodel.create_tensor(tokens_dims, DataType.DT_INT32)
+
+        embed_init = UniformInitializer(random.randint(0, self.maxint), 0, 0)
+        ffmodel.set_position_offset(2)
+        token = ffmodel.embedding(
+            input_tensor,
+            self.starcoder_config.vocab_size,
+            self.starcoder_config.hidden_size,
+            AggrMode.AGGR_MODE_NONE,
+            self.data_type,
+            None,
+            embed_init,
+            name="transformer_wte_weight",
+        )
+        positional_embedding = ffmodel.embedding(
+            position_tensor,
+            self.starcoder_config.max_position_embeddings,
+            self.starcoder_config.hidden_size,
+            AggrMode.AGGR_MODE_NONE,
+            self.data_type,
+            None,
+            embed_init,
+            name="transformer_wpe_weight",
+        )
+
+        hidden_states = ffmodel.add(token, positional_embedding)
+
+        axes = [
+            0,
+        ]
+
+        for i in range(self.starcoder_config.num_hidden_layers):
+            ffmodel.set_transformer_layer_id(i)
+            ln_1 = ffmodel.layer_norm(
+                hidden_states,
+                axes,
+                True,
+                self.starcoder_config.layer_norm_epsilon,
+                name=f"layers_{i}_ln_1_weight",
+            )
+
+            assert self.mode == InferenceMode.INC_DECODING_MODE
+            mha = ffmodel.inc_multiquery_self_attention(
+                ln_1,
+                self.starcoder_config.hidden_size,
+                self.starcoder_config.num_attention_heads,
+                1,
+                self.starcoder_config.hidden_size
+                // self.starcoder_config.num_attention_heads,
+                self.starcoder_config.hidden_size
+                // self.starcoder_config.num_attention_heads,
+                0.0,  # dropout
+                True,  # bias
+                False,  # add_bias_kv
+                False,  # add_zero_attn
+                DataType.DT_NONE,  # data_type
+                None,  # kernel initializer
+                False,  # apply_rotary_embedding
+                name=f"layers_{i}_attention_weight",
+            )
+
+            residual = ffmodel.add(mha, hidden_states)
+
+            l2_norm = ffmodel.layer_norm(
+                residual,
+                axes,
+                True,
+                self.starcoder_config.layer_norm_epsilon,
+                name=f"layers_{i}_ln_2_weight",
+            )
+
+            # mlp
+
+            c_fc = ffmodel.dense(
+                l2_norm,
+                self.starcoder_config.intermediate_size,
+                ActiMode.AC_MODE_NONE,
+                True,
+                name=f"layers_{i}_mlp_c_fc_weight",
+            )
+            activation = ffmodel.gelu(c_fc, False)
+            c_proj = ffmodel.dense(
+                activation,
+                self.starcoder_config.hidden_size,
+                ActiMode.AC_MODE_NONE,
+                True,
+                name=f"layers_{i}_mlp_c_proj_weight",
+            )
+            hidden_states = ffmodel.add(residual, c_proj)
+
+        ln_f = ffmodel.layer_norm(
+            hidden_states,
+            axes,
+            True,
+            self.starcoder_config.layer_norm_epsilon,
+            name=f"transformer_ln_f_weight",
+        )
+        lm_head = ffmodel.dense(
+            ln_f,
+            self.starcoder_config.vocab_size,
+            ActiMode.AC_MODE_NONE,
+            False,
+            name="lm_head_weight",
+        )
+
+        if self.sampling_config.do_sample:
+            dense = ffmodel.scalar_true_divide(
+                lm_head, self.sampling_config.temperature, False
+            )
+            softmax = ffmodel.softmax(dense, -1)
+            output = ffmodel.sampling(softmax, self.sampling_config.topp)
+        else:
+            output = ffmodel.argmax(lm_head, False)
+
+        self.ffmodel = ffmodel
+
+    def convert_hf_model(model, dst_folder):
+        os.makedirs(dst_folder, exist_ok=True)
+        for name, params in model.named_parameters():
+            name = name.replace("transformer.h", "layers").replace(".", "_")
+            if "c_attn_weight" in name:
+                name_q = name.replace("attn_c_attn", "attention_wq")
+                name_k = name.replace("attn_c_attn", "attention_wk")
+                name_v = name.replace("attn_c_attn", "attention_wv")
+                q, k, v = torch.split(
+                    params,
+                    [
+                        model.config.hidden_size,
+                        model.config.hidden_size // model.config.num_attention_heads,
+                        model.config.hidden_size // model.config.num_attention_heads,
+                    ],
+                    0,
+                )
+                q.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_q))
+                k.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_k))
+                v.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_v))
+            elif "c_attn_bias" in name:
+                name_q = name.replace("attn_c_attn", "attention_wq")
+                name_k = name.replace("attn_c_attn", "attention_wk")
+                name_v = name.replace("attn_c_attn", "attention_wv")
+                q, k, v = torch.split(
+                    params,
+                    [
+                        model.config.hidden_size,
+                        model.config.hidden_size // model.config.num_attention_heads,
+                        model.config.hidden_size // model.config.num_attention_heads,
+                    ],
+                    0,
+                )
+                q.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_q))
+                k.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_k))
+                v.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_v))
+            elif "c_proj_bias" in name:
+                name = name.replace("attn_c_proj", "attention_wo")
+                params.detach().cpu().numpy().tofile(os.path.join(dst_folder, name))
+            elif "c_proj_weight" in name:
+                name = name.replace("attn_c_proj", "attention_wo")
+                params.detach().cpu().numpy().tofile(os.path.join(dst_folder, name))
+            else:
+                params.detach().cpu().numpy().tofile(os.path.join(dst_folder, name))
+        model.lm_head.weight.detach().cpu().numpy().tofile(
+            os.path.join(dst_folder, "lm_head_weight")
+        )
+
+    def get_layers_with_weights(self):
+        layer_names = [
+            "transformer_wte_weight",
+            "transformer_wpe_weight",
+            "transformer_ln_f_weight",
+            "lm_head_weight",
+        ] + [
+            expr
+            for i in range(self.starcoder_config.num_hidden_layers)
+            for expr in (
+                f"layers_{i}_ln_1_weight",
+                f"layers_{i}_attention_weight",
+                f"layers_{i}_ln_2_weight",
+                f"layers_{i}_mlp_c_fc_weight",
+                f"layers_{i}_mlp_c_proj_weight",
+            )
+        ]
+        layers_with_weights = {
+            layer_name: self.ffmodel.get_layer_by_name(layer_name)
+            for layer_name in layer_names
+        }
+
+        return layers_with_weights
diff --git a/python/flexflow/serve/serve.py b/python/flexflow/serve/serve.py
index bf2dcc84de..7abea56a7d 100644
--- a/python/flexflow/serve/serve.py
+++ b/python/flexflow/serve/serve.py
@@ -12,7 +12,12 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 
-from flexflow.serve.models import FlexFlowLLAMA, FlexFlowOPT, FlexFlowFalcon
+from flexflow.serve.models import (
+    FlexFlowLLAMA,
+    FlexFlowOPT,
+    FlexFlowFalcon,
+    FlexFlowSTARCODER,
+)
 from flexflow.core import *
 from transformers import AutoConfig, AutoModelForCausalLM, AutoTokenizer, LlamaTokenizer
 from huggingface_hub import HfApi
@@ -76,6 +81,7 @@ def __init__(
             "LLaMAForCausalLM": (ModelType.LLAMA, FlexFlowLLAMA),
             "OPTForCausalLM": (ModelType.OPT, FlexFlowOPT),
             "RWForCausalLM": (ModelType.FALCON, FlexFlowFalcon),
+            "GPTBigCodeForCausalLM": (ModelType.STARCODER, FlexFlowSTARCODER),
         }
         self.hf_config = AutoConfig.from_pretrained(model_name, trust_remote_code=True)
         self.model_name = self.hf_config._name_or_path
@@ -217,7 +223,10 @@ def __load_hf_weights(self):
         self.download_hf_weights_if_needed()
 
         # Create file data loader, load weights into tensors
-        if self.model_type == ModelType.FALCON:
+        if (
+            self.model_type == ModelType.FALCON
+            or self.model_type == ModelType.STARCODER
+        ):
             n_q_heads = self.hf_config.num_attention_heads
             if "n_head_kv" in self.hf_config.__dict__:
                 n_kv_heads = self.hf_config.n_head_kv
diff --git a/python/flexflow/type.py b/python/flexflow/type.py
index 137c8a872a..5232ddd431 100644
--- a/python/flexflow/type.py
+++ b/python/flexflow/type.py
@@ -78,6 +78,7 @@ class ModelType(Enum):
     LLAMA2 = 3003
     OPT = 3004
     FALCON = 3005
+    STARCODER = 3006
 
 
 class OpType(Enum):
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index e84cd5db67..b1363faacc 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -1421,6 +1421,12 @@ flexflow_generation_result_t flexflow_model_generate(flexflow_model_t handle_,
   return FFCObjectWrapper::wrap(&result);
 }
 
+void flexflow_model_set_position_offset(flexflow_model_t handle_,
+                                        int const offset) {
+  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
+  handle->set_position_offset(offset);
+}
+
 // -----------------------------------------------------------------------
 // Tensor
 // -----------------------------------------------------------------------
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index be6a4fd301..b694797830 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -630,7 +630,6 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                        CUBLAS_GEMM_DEFAULT_TENSOR_OP));
       }
     }
-
     // Fill all elements above diagonal in qk prods with -inf to force
     // causal attention.
     assert(num_new_tokens <= total_tokens);
@@ -792,7 +791,6 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
                            ldc,
                            compute_type,
                            CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-
     tokens_previous_requests += num_new_tokens;
   }
 
@@ -970,10 +968,6 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   global_num_kv_heads = _global_num_kv_heads;
   num_q_heads = _num_q_heads;
   num_kv_heads = _num_kv_heads;
-  // weights_params = (qSize * qProjSize + kSize * kProjSize + vSize * vProjSize
-  // +
-  //                   oProjSize * (vProjSize > 0 ? vProjSize : vSize));
-  // weightSize = weights_params * num_q_heads * size_of_dt;
 
   weightSize =
       ((qSize * qProjSize + oProjSize * (vProjSize > 0 ? vProjSize : vSize)) *
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index bd9079ec0c..62ab947f8f 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -315,7 +315,7 @@ FutureMap InferenceManager::inference(FFModel *model,
         // input.
         assert(op->numOutputs == 1);
         ParallelTensor pt = tensor_buffer[op->outputs[0]][batch_index];
-        load_positions(bc, pt);
+        load_positions(bc, pt, model->position_offset);
       } else {
         found_input_operator = true;
         assert(op->numOutputs == 1);
@@ -371,14 +371,15 @@ void InferenceManager::load_input_tokens_from_batch_config(
 }
 
 void InferenceManager::load_positions(BatchConfigFuture const &bc,
-                                      ParallelTensor position_input) {
+                                      ParallelTensor position_input,
+                                      int offset) {
   Context ctx = ff_config.lg_ctx;
   Runtime *runtime = ff_config.lg_hlr;
   size_t machine_view_hash = position_input->machine_view.hash();
   ArgumentMap argmap;
   IndexLauncher launcher(RM_LOAD_POSITION_TASK_ID,
                          position_input->parallel_is,
-                         TaskArgument(nullptr, 0),
+                         TaskArgument(&offset, sizeof(int)),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
@@ -403,6 +404,11 @@ void FFModel::set_transformer_layer_id(int id) {
   assert(id < MAX_NUM_TRANSFORMER_LAYERS);
 }
 
+void FFModel::set_position_offset(int offset) {
+  assert(offset == 0 || offset == 2);
+  position_offset = offset;
+}
+
 void FFModel::compile_inference() {
   Context ctx = config.lg_ctx;
   Runtime *runtime = config.lg_hlr;
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index a49f827482..0c32da3291 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -99,7 +99,8 @@ void RequestManager::register_tokenizer(ModelType type,
 
     this->tokenizer_ =
         Tokenizer::FromBlobByteLevelBPE(vocab, merges, added_tokens);
-  } else if (model_type == ModelType::FALCON) {
+  } else if (model_type == ModelType::FALCON ||
+             model_type == ModelType::STARCODER) {
     std::string falcon_tokenizer_path = join_path({path, "tokenizer.json"});
     this->tokenizer_ =
         Tokenizer::FromBlobJSON(LoadBytesFromFile(falcon_tokenizer_path));
diff --git a/src/runtime/request_manager.cu b/src/runtime/request_manager.cu
index abfcd72a38..7363e14cf0 100644
--- a/src/runtime/request_manager.cu
+++ b/src/runtime/request_manager.cu
@@ -68,8 +68,8 @@ void RequestManager::load_positions_task(
 
   // BatchConfig const batch_config = *((BatchConfig *)task->args);
   BatchConfig const *batch_config = BatchConfig::from_future(task->futures[0]);
-
-  int offset = 2;
+  
+  const int offset = *((const int*)task->args);
   int *pos_ptr = helperGetTensorPointerWO<int>(
       regions[0], task->regions[0], FID_DATA, ctx, runtime);
   Domain domain = runtime->get_index_space_domain(
diff --git a/tests/inference/cpp_inference_tests.sh b/tests/inference/cpp_inference_tests.sh
index fba42538ef..6a108303d6 100755
--- a/tests/inference/cpp_inference_tests.sh
+++ b/tests/inference/cpp_inference_tests.sh
@@ -61,6 +61,11 @@ fi
 # Falcon (half precision)
 ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model tiiuae/falcon-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_falcon_7B_half.txt -pipeline-parallelism-degree 4
 
+# # StarCoder (full precision)
+# ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model bigcode/starcoderbase-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_starcoder_7B.txt -pipeline-parallelism-degree 4
+# # StarCoder (half precision)
+# ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model bigcode/starcoderbase-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_starcoder_7B_half.txt -pipeline-parallelism-degree 4
+
 # Tensor parallelism tests
 if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
     # LLAMA (small model)
diff --git a/tests/inference/python_test_configs/generate_configs.py b/tests/inference/python_test_configs/generate_configs.py
index b4c3dd8039..91cf317db4 100644
--- a/tests/inference/python_test_configs/generate_configs.py
+++ b/tests/inference/python_test_configs/generate_configs.py
@@ -49,6 +49,7 @@
 llama_models = ["decapoda-research/llama-7b-hf", "JackFram/llama-160m"]
 opt_models = ["facebook/opt-6.7b", "facebook/opt-125m"]
 falcon_models = ["tiiuae/falcon-7b",]
+# starcoder_models = ["bigcode/starcoderbase-7b",]
 parallelism_settings = [(1,4), (2,2), (4,1)]
 
 # The paths below should be with respect to the folder from which the tests are launched (FF_HOME/tests/inference)
@@ -70,7 +71,7 @@
             tp, pp = parallelism_degrees
 
             # Tensor parallelism not supported by small Falcon model atm
-            if tp > 1 and "falcon" in model_name:
+            if tp > 1 and ("falcon" in model_name or "starcoder" in model_name):
                 continue
             # skip tp=4 for big models
             if tp > 2 and ("7b" in model_name or "6.7b" in model_name):

From 1f0432831241c7ffb9035495619ceb80813fe065 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Wed, 16 Aug 2023 07:58:27 -0500
Subject: [PATCH 197/344] New README.md for FlexFlow Serve (#960)

* New README.md for FlexFlow Serve

* Update README.md

* update performance.png

* Update README.md

* Update README.md

* update install instructions

* update cpp specinfer instructions

* Update README.md

* update readme

* Update README.md

* Update README.md

* Update README.md

* Update README.md

* Update README.md

* update requirements.txt, renamed conda env, updated readme

* fix

* Update README.md

* Update README.md

---------

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
---
 .github/README.md                        | 262 ++++++++++++++++-------
 .github/workflows/gpu-ci.yml             |   6 +-
 conda/{flexflow-cpu.yml => flexflow.yml} |   0
 img/performance.png                      | Bin 18951 -> 58476 bytes
 requirements.txt                         |  10 +
 5 files changed, 192 insertions(+), 86 deletions(-)
 rename conda/{flexflow-cpu.yml => flexflow.yml} (100%)

diff --git a/.github/README.md b/.github/README.md
index c4f220e222..e61c1648ba 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -1,129 +1,225 @@
-# SpecInfer: Accelerating Generative LLM Serving with Speculative Inference and Token Tree Verification
-![build](https://github.com/flexflow/flexflow/workflows/build/badge.svg?branch=master) ![gpu tests](https://github.com/flexflow/flexflow/workflows/gpu-ci/badge.svg?branch=master) ![multinode gpu tests](https://github.com/flexflow/flexflow/workflows/multinode-test/badge.svg?branch=master) ![docker](https://github.com/flexflow/flexflow/workflows/docker-build/badge.svg?branch=master) ![pip](https://github.com/flexflow/flexflow/workflows/pip-install/badge.svg?branch=master) ![shell-check](https://github.com/flexflow/flexflow/workflows/Shell%20Check/badge.svg?branch=master) ![clang-format](https://github.com/flexflow/flexflow/workflows/clang-format%20Check/badge.svg?branch=master) [![Documentation Status](https://readthedocs.org/projects/flexflow/badge/?version=latest)](https://flexflow.readthedocs.io/en/latest/?badge=latest)
+# FlexFlow Serve: Low-Latency, High-Performance LLM Serving
+![build](https://github.com/flexflow/flexflow/workflows/build/badge.svg?branch=inference) ![gpu tests](https://github.com/flexflow/flexflow/workflows/gpu-ci/badge.svg?branch=inference) ![multinode gpu tests](https://github.com/flexflow/flexflow/workflows/multinode-test/badge.svg?branch=master) ![docker](https://github.com/flexflow/flexflow/workflows/docker-build/badge.svg?branch=inference) ![pip](https://github.com/flexflow/flexflow/workflows/pip-install/badge.svg?branch=inference) ![shell-check](https://github.com/flexflow/flexflow/workflows/Shell%20Check/badge.svg?branch=inference) ![clang-format](https://github.com/flexflow/flexflow/workflows/clang-format%20Check/badge.svg?branch=inference) [![Documentation Status](https://readthedocs.org/projects/flexflow/badge/?version=latest)](https://flexflow.readthedocs.io/en/latest/?badge=latest)
 
-<p align="center">
-<img src="../img/spec_infer_demo.gif" alt="A SpecInfer Demo" width="630"/>
-</p>
 
-## What is SpecInfer
+---
 
-<p align="center">
-<img src="../img/overview.png" alt="An overview of SpecInfer" width="620"/>
-</p>
+## News:
+
+* [08/14/2023] Released Dockerfile for different CUDA versions
+
+## What is FlexFlow Serve
   
 The high computational and memory requirements of generative large language
 models (LLMs) make it challenging to serve them quickly and cheaply. 
-SpecInfer is an open-source distributed multi-GPU system that accelerates generative LLM
-inference with __speculative inference__ and __token tree verification__. A key insight
-behind SpecInfer is to combine various collectively boost-tuned small speculative
-models (SSMs) to jointly predict the LLM’s outputs; the predictions are organized as a
-token tree, whose nodes each represent a candidate token sequence. The correctness
-of all candidate token sequences represented by a token tree is verified against the
-LLM’s output in parallel using a novel tree-based parallel decoding mechanism.
-SpecInfer uses an LLM as a token tree verifier instead of an incremental decoder,
-which largely reduces the end-to-end inference latency and computational requirement
-for serving generative LLMs while provably preserving model quality.
+FlexFlow Serve is an open-source compiler and distributed system for 
+__low latency__, __high performance__ LLM serving. FlexFlow Serve outperforms 
+existing systems by 1.3-2.0x for single-node, multi-GPU inference and by 
+1.4-2.4x for multi-node, multi-GPU inference.
 
 <p align="center">
 <img src="../img/performance.png" alt="Performance comparison" height="320"/>
 </p>
 
-## Build/Install SpecInfer
-SpecInfer is built on top of FlexFlow. You can build/install SpecInfer by building the inference branch of FlexFlow. Please read the [instructions](../INSTALL.md) for building/installing FlexFlow from source code. If you would like to quickly try SpecInfer, we also provide pre-built Docker packages ([specinfer-cuda](https://github.com/flexflow/FlexFlow/pkgs/container/specinfer-cuda) with a CUDA backend, [specinfer-hip_rocm](https://github.com/flexflow/FlexFlow/pkgs/container/specinfer-hip_rocm) with a HIP-ROCM backend) with all dependencies pre-installed (N.B.: currently, the CUDA pre-built containers are only fully compatible with host machines that have CUDA 11.7 installed), together with [Dockerfiles](./docker) if you wish to build the containers manually. 
+## Install FlexFlow Serve
 
-## Run SpecInfer
-The source code of the SpecInfer pipeline is available at [this folder](../inference/spec_infer/). The SpecInfer executable will be available at `/build_dir/inference/spec_infer/spec_infer` at compilation. You can use the following command-line arguments to run SpecInfer:
 
-* `-ll:gpu`: number of GPU processors to use on each node for serving an LLM (default: 0)
-* `-ll:fsize`: size of device memory on each GPU in MB
-* `-ll:zsize`: size of zero-copy memory (pinned DRAM with direct GPU access) in MB. SpecInfer keeps a replica of the LLM parameters on zero-copy memory, and therefore requires that the zero-copy memory is sufficient for storing the LLM parameters.
-* `-llm-model`: the LLM model type as a case-insensitive string (e.g. "opt" or "llama")
-* `-llm-weight`: path to the folder that stores the LLM weights
-* `-llm-config`: path to the json file that stores the LLM model configs
-* `-ssm-model`: the LLM model type as a case-insensitive string (e.g. "opt" or "llama"). You can use multiple `-ssm-model`s in the command line to launch multiple SSMs.
-* `-ssm-weight`: path to the folder that stores the small speculative models' weights. The number of `-ssm-weight`s must match the number of `-ssm-model`s and `-ssm-config`s.
-* `-ssm-config`: path to the json file that stores the SSM model configs. The number of `-ssm-config`s must match the number of `-ssm-model`s and `-ssm-weight`s.
-* `-tokenizer`: path to the tokenizer file (see [Tokenizers](#tokenizers) for preparing a tokenizer for SpecInfer).
-* `-data-parallelism-degree`, `-tensor-parallelism-degree` and `-pipeline-parallelism-degree`: parallelization degrees in the data, tensor, and pipeline dimensions. Their product must equal the number of GPUs available on the machine. When any of the three parallelism degree arguments is omitted, a default value of 1 will be used. 
-* `-prompt`: (optional) path to the prompt file. SpecInfer expects a json format file for prompts, all of which will be served by SpecInfer. In addition, users can also use the following API for registering requests:
-* `-output-file`: (optional) filepath to use to save the output of the model, together with the generation latency
+### Requirements
+* OS: Linux
+* GPU backend: Hip-ROCm or CUDA
+	* CUDA version: 10.2 – 12.0
+	* NVIDIA compute capability: 6.0 or higher
+* Python: 3.6 or higher
+* Package dependencies: [see here](https://github.com/flexflow/FlexFlow/blob/inference/requirements.txt)
 
+### Install with pip
+You can install FlexFlow Serve using pip:
 
-```c++
-class RequestManager {
-  RequestGuid register_new_request(std::string const &prompt, int max_sequence_length);
-}
+```bash
+pip install flexflow
 ```
-For example, you can use the following command line to serve a LLaMA-7B or LLaMA-13B model on 4 GPUs and use two collectively boost-tuned LLaMA-190M models for speculative inference.
+
+### Try it in Docker
+If you run into any issue during the install, or if you would like to use the C++ API without needing to install from source, you can also use our pre-built Docker package for different CUDA versions and the `hip_rocm` backend. To download and run our pre-built Docker container:
 
 ```bash
-./inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight /path/to/llm/weights -llm-config /path/to/llm/config.json -ssm-model llama -ssm-weight /path/to/ssm1/weights -ssm-config /path/to/ssm/config.json -ssm-model llama -smm-weight /path/to/ssm2/weights -ssm-config /path/to/ssm2/config.json -tokenizer /path/to/tokenizer.model -prompt /path/to/prompt.json --use-full-precision -tensor-parallelism-degree 2 -pipeline-parallelism-degree 2
+docker run --gpus all -it --rm --shm-size=8g ghcr.io/flexflow/flexflow-cuda-11.8:latest
 ```
 
-### Tokenizers
-SpecInfer supports two tokenizers:
+To download a Docker container for a backend other than CUDA v11.8, you can replace the `cuda-11.8` suffix with any of the following backends: `cuda-11.1`, `cuda-11.2`, `cuda-11.3`, `cuda-11.5`, `cuda-11.6`, `cuda-11.7`, `cuda-11.8`, and `hip_rocm`). More info on the Docker images, with instructions to build a new image from source, or run with additional configurations, can be found [here](../docker/README.md).
 
-* The SentencePiece tokenizer is used to support the LLaMA model family (e.g., LLaMA-6B, LLaMA-13B, and LLaMA-190M in our demo). We used the pretrained sentencepiece tokenizer from LLAMA, which is also available on Hugging Face (model id: `decapoda-research/llama-7b-hf`). If you  are using our LLAMA-160M weights for the demo, however, you should use the tokenizer from the [JackFram/llama-160m](https://huggingface.co/JackFram/llama-160m/resolve/main/tokenizer.model) HuggingFace repo.
-* The GPT2 tokenizer is used to support the Open Pre-trained Transformer model family (e.g., OPT-13B and OPT-125M). To use it, download the [vocab](https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-vocab.json) and [merges](https://raw.githubusercontent.com/facebookresearch/metaseq/main/projects/OPT/assets/gpt2-merges.txt) files and pass the folder containing them as a parameter. 
+### Build from source
 
-### Mixed-precision Support
-SpecInfer now supports single-precision floating points and half-precision floating points. By default we use half-precision. Add `--use-full-precision` to the command line to run the demo with single-precision, please make sure to use the correct weight files in the form below.
+You can install FlexFlow Serve from source code by building the inference branch of FlexFlow. Please follow these [instructions](https://flexflow.readthedocs.io/en/latest/installation.html).
 
-### CPU Offloading
-SpecInfer offers offloading-based inference for running large models (e.g., llama-7B) on a single GPU. CPU offloading is a choice to save tensors in CPU memory, and only copy the tensor to GPU when doing calculation. Notice that now we selectively offload the largest weight tensors (weights tensor in Linear, Attention). Besides, since the small model occupies considerably less space, it it does not pose a bottleneck for GPU memory, the offloading will bring more runtime space and computational cost, so we only do the offloading for the large model. You can run the offloading example by adding `-offload` and `-offload-reserve-space-size` flags.
-#### Quantization
-To reduce data transferred between the CPU and GPU, SpecInfer provides int4 and int8 quantization. The compressed tensors are stored on the CPU side. Once copied to the GPU, these tensors undergo decompression and conversion back to their original precision. Please find the compressed weight files in our s3 bucket, or use [this script](../inference/utils/compress_llama_weights.py) from [FlexGen](https://github.com/FMInference/FlexGen) project to do the compression manually. The quantization method can be selected using the `--4bit-quantization` and `--8bit-quantization` flags.
+## Quickstart
+The following example shows how to deploy an LLM using FlexFlow Serve and accelerate its serving using [speculative inference](#speculative-inference). First, we import `flexflow.serve` and initialize the FlexFlow Serve runtime. Note that `memory_per_gpu` and `zero_copy_memory_per_node` specify the size of device memory on each GPU (in MB) and zero-copy memory on each node (in MB), respectively. FlexFlow Serve combines tensor and pipeline model parallelism for LLM serving.
+```python
+import flexflow.serve as ff
 
-Below is an example command line to use offloading and quantization in SpecInfer.
+ff.init(
+    {
+        "num_gpus": 4,
+        "memory_per_gpu": 14000,
+        "zero_copy_memory_per_node": 30000,
+        "tensor_parallelism_degree": 4,
+        "pipeline_parallelism_degree": 1,
+    }
+)
+```
+Second, we specify the LLM to serve and the SSM(s) used to accelerate LLM serving. The list of supported LLMs and SSMs is available at [supported models](#supported-llms-and-ssms).
+```python
+# Specify the LLM
+llm = ff.LLM("decapoda-research/llama-7b-hf")
+
+# Specify a list of SSMs (just one in this case)
+ssms=[]
+ssm = ff.SSM("JackFram/llama-68m")
+ssms.append(ssm)
+```
+Next, we declare the generation configuration and compile both the LLM and SSMs. Note that all SSMs should run in the **beam search** mode, and the LLM should run in the **tree verification** mode to verify the speculated tokens from SSMs.
+```python
+# Create the sampling configs
+generation_config = ff.GenerationConfig(
+    do_sample=False, temperature=0.9, topp=0.8, topk=1
+)
+
+# Compile the SSMs for inference and load the weights into memory
+for ssm in ssms:
+    ssm.compile(generation_config)
+
+# Compile the LLM for inference and load the weights into memory
+llm.compile(generation_config, ssms=ssms)
+```
+Finally, we call `llm.generate` to generate the output, which is organized as a list of `GenerationResult`, which include the output tokens and text.
+```python
+result = llm.generate("Here are some travel tips for Tokyo:\n")
+```
+
+### Incremental decoding
+<details>
+<summary>Expand here</summary>
+<br>
+
+```python
+import flexflow.serve as ff
+
+# Initialize the FlexFlow runtime. ff.init() takes a dictionary or the path to a JSON file with the configs
+ff.init(
+    {
+        "num_gpus": 4,
+        "memory_per_gpu": 14000,
+        "zero_copy_memory_per_gpu": 30000,
+        "tensor_parallelism_degree": 4,
+        "pipeline_parallelism_degree": 1,
+    }
+)
+
+# Create the FlexFlow LLM
+llm = ff.LLM("decapoda-research/llama-7b-hf")
+
+# Create the sampling configs
+generation_config = ff.GenerationConfig(
+    do_sample=True, temperature=0.9, topp=0.8, topk=1
+)
+
+# Compile the LLM for inference and load the weights into memory
+llm.compile(generation_config)
+
+# Generation begins!
+result = llm.generate("Here are some travel tips for Tokyo:\n")
+```
+
+</details>
+
+### C++ interface
+If you'd like to use the C++ interface (mostly used for development and benchmarking purposes), you should install from source, and follow the instructions below. 
+
+<details>
+<summary>Expand here</summary>
+<br>
+
+#### Downloading models
+Before running FlexFlow Serve, you should manually download the LLM and SSM(s) model of interest using the [inference/utils/download_hf_model.py](https://github.com/flexflow/FlexFlow/blob/inference/inference/utils/download_hf_model.py) script (see example below). By default, the script will download all of a model's assets (weights, configs, tokenizer files, etc...) into the cache folder `~/.cache/flexflow`. If you would like to use a different folder, you can request that via the parameter `--cache-folder`.
 
 ```bash
-./inference/spec_infer/spec_infer -ll:gpu 1 -ll:fsize 14000 -ll:zsize 30000 -llm-model llama -llm-weight /path/to/llm/weights -llm-config /path/to/llm/config.json -ssm-model llama -ssm-weight /path/to/ssm1/weights -ssm-config /path/to/ssm/config.json -ssm-model llama -smm-weight /path/to/ssm2/weights -ssm-config /path/to/ssm2/config.json -tokenizer /path/to/tokenizer.model -prompt /path/to/prompt.json --use-full-precision -offload -offload-reserve-space-size 6000 --8bit-quantization
+python3 ./inference/utils/download_hf_model.py <HF model 1> <HF model 2> ...
 ```
 
+#### Running the C++ examples
+A C++ example is available at [this folder](../inference/spec_infer/). After building FlexFlow Serve, the executable will be available at `/build_dir/inference/spec_infer/spec_infer`. You can use the following command-line arguments to run FlexFlow Serve:
 
+* `-ll:gpu`: number of GPU processors to use on each node for serving an LLM (default: 0)
+* `-ll:fsize`: size of device memory on each GPU in MB
+* `-ll:zsize`: size of zero-copy memory (pinned DRAM with direct GPU access) in MB. FlexFlow Serve keeps a replica of the LLM parameters on zero-copy memory, and therefore requires that the zero-copy memory is sufficient for storing the LLM parameters.
+* `-llm-model`: the LLM model ID from HuggingFace (e.g. "decapoda-research/llama-7b-hf")
+* `-ssm-model`: the SSM model ID from HuggingFace (e.g. "JackFram/llama-160m"). You can use multiple `-ssm-model`s in the command line to launch multiple SSMs.
+* `-cache-folder`: the folder
+* `-data-parallelism-degree`, `-tensor-parallelism-degree` and `-pipeline-parallelism-degree`: parallelization degrees in the data, tensor, and pipeline dimensions. Their product must equal the number of GPUs available on the machine. When any of the three parallelism degree arguments is omitted, a default value of 1 will be used. 
+* `-prompt`: (optional) path to the prompt file. FlexFlow Serve expects a json format file for prompts. In addition, users can also use the following API for registering requests:
+* `-output-file`: (optional) filepath to use to save the output of the model, together with the generation latency
 
-### LLM Weights
-The weight files used in our demo are extracted from HuggingFace, and stored in our AWS S3 bucket.
+For example, you can use the following command line to serve a LLaMA-7B or LLaMA-13B model on 4 GPUs and use two collectively boost-tuned LLaMA-68M models for speculative inference.
 
-|  Model   | Model id on Hugging Face  | Storage Location (single precision) | Storage Location (half precision) |
-|  :----  | :----  | :----  | :----  |
-| LLaMA-7B | decapoda-research/llama-7b-hf | s3://specinfer/weights/llama_7B_weights.tar.gz | s3://specinfer/half_weights/llama_7B_weights.tar.gz
-| LLaMA-190M  | JackFram/llama-160m | s3://specinfer/weights/llama_160M_weights.tar.gz | s3://specinfer/half_weights/llama_160M_weights.tar.gz
-| OPT-6.7B  | facebook/opt-6.7b | s3://specinfer/weights/opt_6B_weights.tar.gz | s3://specinfer/half_weights/opt_6B_weights.tar.gz
-| OPT-125M  | facebook/opt-125m | s3://specinfer/weights/opt_125M_weights.tar.gz | s3://specinfer/half_weights/opt_125M_weights.tar.gz
+```bash
+./inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model decapoda-research/llama-7b-hf -ssm-model JackFram/llama-68m -prompt /path/to/prompt.json -tensor-parallelism-degree 4 --fusion
+```
+</details>
 
-You can use [this script](../inference/utils/download_llama_weights.py) to automatically download and convert the weights of a HuggingFace LLAMA LLM and a LLAMA SSM to the SpecInfer weight format. The script also downloads the LLAMA tokenizer. If you would like to try the OPT model instead, use [this script](../inference/utils/download_opt_weights.py) to download (and convert) the OPT weights and tokenizer.
+## Speculative Inference
+A key technique that enables FlexFlow Serve to accelerate LLM serving is speculative
+inference, which combines various collectively boost-tuned small speculative
+models (SSMs) to jointly predict the LLM’s outputs; the predictions are organized as a
+token tree, whose nodes each represent a candidate token sequence. The correctness
+of all candidate token sequences represented by a token tree is verified against the
+LLM’s output in parallel using a novel tree-based parallel decoding mechanism.
+FlexFlow Serve uses an LLM as a token tree verifier instead of an incremental decoder,
+which largely reduces the end-to-end inference latency and computational requirement
+for serving generative LLMs while provably preserving model quality.
 
-### Prompt Datasets
-We have evaluated SpecInfer on the following prompts datasets: [Chatbot instruction prompts](https://specinfer.s3.us-east-2.amazonaws.com/prompts/chatbot.json), [ChatGPT Prompts](https://specinfer.s3.us-east-2.amazonaws.com/prompts/chatgpt.json), [WebQA](https://specinfer.s3.us-east-2.amazonaws.com/prompts/webqa.json), [Alpaca](https://specinfer.s3.us-east-2.amazonaws.com/prompts/alpaca.json), and [PIQA](https://specinfer.s3.us-east-2.amazonaws.com/prompts/piqa.json).
+<p align="center">
+<img src="../img/spec_infer_demo.gif" alt="A Speculative Inference Demo" width="630"/>
+</p>
 
-### Script to run the demo
-You can take a look at [this script](../tests/inference_tests.sh), which is run in CI for each new commit, for an example of how to run the demo.
+### Supported LLMs and SSMs
 
-## Difference between SpecInfer and HuggingFace Assistant Model
+FlexFlow Serve supports a variety of HuggingFace models:
 
-There are two major differences between the two systems.
+| Model | Model id on HuggingFace | Boost-tuned SSMs |
+| :---- | :---- | :---- |
+| LLaMA-7B | decapoda-research/llama-7b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-13B | decapoda-research/llama-13b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-30B | decapoda-research/llama-30b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-65B | decapoda-research/llama-65b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-2-7B | meta-llama/Llama-2-7b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-2-13B | meta-llama/Llama-2-13b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-2-70B | meta-llama/Llama-2-70b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| OPT-6.7B | facebook/opt-6.7b | [OPT-125M](https://huggingface.co/facebook/opt-125m) |
+| OPT-13B | facebook/opt-13b | [OPT-125M](https://huggingface.co/facebook/opt-125m) |
+| OPT-30B | facebook/opt-30b | [OPT-125M](https://huggingface.co/facebook/opt-125m) |
+| OPT-66B | facebook/opt-66b | [OPT-125M](https://huggingface.co/facebook/opt-125m) |
+| Falcon-7B | tiiuae/falcon-7b | |
+| Falcon-40B | tiiuae/falcon-40b | |
+| StarCoder-15.5B | bigcode/starcoder | |
 
-* First, the HuggingFace assistant model produces a single candidate token sequence during speculation, while SpecInfer generates and verifies a speculated token tree, whose tokens each represent a candidate token sequence. To deal with the more complex verification task, SpecInfer includes a number of systems and algorithmic optimizations to quickly and efficiently verify all tokens of a token tree in parallel.
- 
-* Second, instead of considering a single assistant model, SpecInfer combines a variety of collectively boost-tuned small speculative models (SSMs) to jointly predict the LLM's outputs. We observe that using multiple boost-tuned SSMs is critical for improving speculative performance.
 
-## TODOs
+### CPU Offloading
+FlexFlow Serve also offers offloading-based inference for running large models (e.g., llama-7B) on a single GPU. CPU offloading is a choice to save tensors in CPU memory, and only copy the tensor to GPU when doing calculation. Notice that now we selectively offload the largest weight tensors (weights tensor in Linear, Attention). Besides, since the small model occupies considerably less space, it it does not pose a bottleneck for GPU memory, the offloading will bring more runtime space and computational cost, so we only do the offloading for the large model. [TODO: update instructions] You can run the offloading example by enabling the `-offload` and `-offload-reserve-space-size` flags.
 
-SpecInfer is under active development. We currently focus on the following tasks and strongly welcome all contributions to SpecInfer from bug fixes to new features and extensions.
+### Quantization
+FlexFlow Serve supports int4 and int8 quantization. The compressed tensors are stored on the CPU side. Once copied to the GPU, these tensors undergo decompression and conversion back to their original precision. Please find the compressed weight files in our s3 bucket, or use [this script](../inference/utils/compress_llama_weights.py) from [FlexGen](https://github.com/FMInference/FlexGen) project to do the compression manually. [TODO: update instructions for quantization].
 
-* Low-precision and mixed-precision support. The current version uses single-precision floating points for computing tree attention. We are actively working on support half-precision floating points, and int4 and int8 quantizations.
-* Offloading-based generative LLM inference. Another promising avenue for future work is using speculative inference and token tree verification to reduce the end-to-end inference for offloading-based generative LLM inference. A potential application of this technique is enabling a single commodity GPU to serve LLMs for latency critical tasks. 
+### Prompt Datasets
+We provide five prompt datasets for evaluating FlexFlow Serve: [Chatbot instruction prompts](https://specinfer.s3.us-east-2.amazonaws.com/prompts/chatbot.json), [ChatGPT Prompts](https://specinfer.s3.us-east-2.amazonaws.com/prompts/chatgpt.json), [WebQA](https://specinfer.s3.us-east-2.amazonaws.com/prompts/webqa.json), [Alpaca](https://specinfer.s3.us-east-2.amazonaws.com/prompts/alpaca.json), and [PIQA](https://specinfer.s3.us-east-2.amazonaws.com/prompts/piqa.json).
 
-## Acknowledgements
-This project is initiated by members from CMU, Stanford, and UCSD. We will be continuing developing and supporting SpecInfer and the underlying FlexFlow runtime system. The following paper describes design, implementation, and key optimizations of SpecInfer.
+## TODOs
 
-* Xupeng Miao*, Gabriele Oliaro*, Zhihao Zhang*, Xinhao Cheng, Zeyu Wang, Rae Ying Yee Wong, Zhuoming Chen, Daiyaan Arfeen, Reyna Abhyankar, and Zhihao Jia. [SpecInfer: Accelerating Generative LLM Serving with Speculative Inference and Token Tree Verification](https://arxiv.org/abs/2305.09781).
+FlexFlow Serve and FlexFlow are under active development. We currently focus on the following tasks and strongly welcome all contributions from bug fixes to new features and extensions.
 
-\* Denotes equal contribution
+* AMD support. We are actively working on supporting FlexFlow Serve on AMD GPUs and welcome any contributions to this effort. 
 
-### Citation
-Please cite as:
+## Acknowledgements
+This project is initiated by members from CMU, Stanford, and UCSD. We will be continuing developing and supporting FlexFlow Serve. Please cite FlexFlow Serve as:
 
 ``` bibtex
 @misc{miao2023specinfer,
@@ -137,4 +233,4 @@ Please cite as:
 ```
 
 ## License
-Both SpecInfer and FlexFlow use Apache License 2.0.
+FlexFlow uses Apache License 2.0.
diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index bdd2e4dbf5..a6ea492bcf 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -83,7 +83,7 @@ jobs:
         with:
           miniconda-version: "latest"
           activate-environment: flexflow
-          environment-file: conda/flexflow-cpu.yml
+          environment-file: conda/flexflow.yml
           auto-activate-base: false
           auto-update-conda: false
 
@@ -157,7 +157,7 @@ jobs:
         with:
           miniconda-version: "latest"
           activate-environment: flexflow
-          environment-file: conda/flexflow-cpu.yml
+          environment-file: conda/flexflow.yml
           auto-activate-base: false
 
       - name: Build FlexFlow
@@ -232,7 +232,7 @@ jobs:
         with:
           miniconda-version: "latest"
           activate-environment: flexflow
-          environment-file: conda/flexflow-cpu.yml
+          environment-file: conda/flexflow.yml
           auto-activate-base: false
 
       - name: Build and Install FlexFlow
diff --git a/conda/flexflow-cpu.yml b/conda/flexflow.yml
similarity index 100%
rename from conda/flexflow-cpu.yml
rename to conda/flexflow.yml
diff --git a/img/performance.png b/img/performance.png
index a27d26dc198c351fdd0c9370f129465948f50daf..668e579197c42fc18211940941d6f5d757bbc0bf 100644
GIT binary patch
literal 58476
zcmb@u2{e}NyEd+Qpd>^kN-{-;RHkS!W=bM+#taD|vna|`gfb+A3L!HIA%skYGG-pj
z5He-@j+@@!{_VZj-s`{q-}kIlZ*O^?=f1D&yw3ADj`KKg?~C%1JGSrJPC`PmLt0Ag
z5(&x177~(mU0XNfZ$b_8j^IB6HsY!_N*32_>~yURN#t~GEX^!z%uMtS+8SC}n^>41
zKX&REFULV+8yib&K`yQv|N4Pr7FI@FY+C)U_>gUuQfk&DB;>lpuXXXFaV8`ry)DvW
zXD{178~JYM{BU-me4?pRP+IC-b+h{8nC#cP8<Uc=pPqP~tSIPpDK^X0`KQKJacWLe
zs+Tjb<6{~*US{ok;`LOGQKoj>f2yimit)Ua{D*~k`*w1HsD*dq3xbkXA8(12=<tTg
zdj0c~dMD5<w2tEMD_}%k{N%s>r~CzD_&+~ap?@hrPVDcik0+smnep#yGW4<m<v;In
zkY!Kz{^vcy%+xLayhV&YD5!vPS0!s&T3UOaU0sLC+D}RC;};a{85uDf=M$q3_c03`
zy?5{4&EAhYVq#-QBYf6==!N?iV<wA^e0xX7Rw3#D8>Ilb^sLlW?z?yIR)igAahMt?
zYiZf*UaT{ox%Pcb)UwQ!_$H70_jglKZG3(%+(2V<P^Ce--EPL=TN6Fv&mtn&F1_&b
zxxRK2EsrY=7`eG0H8-n9It=V}iaQ*5OnvT5dNTe37cwz9dFjsD-81b!PD^I*;6QQU
zfSj3GQb7ZSG!1nNQ`-gAzB7~tYu9Vwx-Dun^Ld2974~%L>^N<+zh4q1(k5*i_utku
zy`ZDONuQf`>(;HQcI=FdCvQ&wP<EXDA^s&s{HBdfsSfw9-MjU0Ye|n;74Pmoa-mu1
zp}}6V%|Dt_EU;>Q+hQ2QE0h?cw@&;_DSSn%QFz;hZ1aXIDcW*8*<#+iX~{O@f8*pM
zF7OWEi>QuiHt&u*=e4wH<3=5BTH|j?YUw=7%ggw&%{%FgORCdDu>5MbQ-WGsvu|7<
zr&9VIzZld?Z@V~m6F*QfRVV5n7sqn!*fA;&)khy6?mw>ok?hUY!pOc8Rl%Isee+n@
zr0kE`HwLTS3-@SxS{-Z|(P)m(4~tZi82X-fN+y`2xTz`RORVH^+YwbwEv?arVBzkO
z`DX$9wvB5AwpsOmGR$eO?;WTKe?TV?IN4v-J2vK*mnT%_OB1JCa{mE?Xr$}PQd0+;
zPsRCXBN1*=*L+Tu_3BhS&FV{frlBstA39$C;T~z2fc3SQC5>#e?oUsS@(T!1(9jtD
z{9RvTz-w6Pa46kWdxp<p(m=wGPP+TUy-};Bnb9_-=yUhPMq8pE@!5_vi`|HFT^5Lr
zj+P#i*~P$6=gDxp;=$hIme>$nKC|4@M~5YMzR}A2cxS^F`<12Hy+XDeu1nJ)-<K`u
zuc$0LRaLY{y3DA(vm1}>dq1N6cKCaqT}&kV&u_`SrQVdke|$Zv$Q7Q{{*(EvtSp(3
z?Z|V*SP2e|?COr;3iqDzJMOUs8B*$-2ZFyw9e=HyD1o)5%rd&ye(5N}v^DFx_57qE
z`;|AcQ6erCPma<Q7Z;Co7Di#`CMK)6l%Ahi=M=}zNPaOuF4B1C<}J2bol;UGa!zr2
zM?$RW_YKG_eu&Z%5EAPB`LnA2rA(OMEz=n4t2D<ny+T50p0F$T3`V(TD+QYvansI?
zYO;3QWytG(E~)X}_p)FlLL#`gx7Xd@-~aoY&gk=7-q{T6<@^-&!*?Gs)yTK!SzEJT
zUnCiL5E`#ll0RVw*py#ijtPyG^yk$p-8$A$5PoNGTX3;XS9QP{#uELJ2p?)Ya+*)d
zM+0>Sk1D@zJiJnvk%4GsF(uu)wF?U-y{9YPJ@HD)ZUzPgY!lufTwP4@?YH}WqtOWO
ztbD`gOLxhHv{YPc<FyMMgKN1?eDpg|)n647#;v<v|KkJc%$2^%pq4jAkrfSHl|vGT
zC$}C-JC#de%_(zZuj22vJUgz<?srag*dMN3YI>tp($W$Za`pCnTFR4s7WosKn^LYC
zmE7N<GD`fR_v1sG(N^kHr%r|U1qOT=|46Yf>{fQt#a~X1i|my<R^Hw0-MnEl*+JLk
z#kYBRO0g0<ZqIdZ*~6v%pjby|qNmK;FYJ^BJ+7_%>(?hS;=YsJo(#LGsh{*MvPsue
z26G!2w7<PcC*mB6)79JEeFu9o+L|R}+dPSlPtYz9G&eV=V!i0LytH7wFf&^I^vX5F
zaHdJaeI$pjA3uC@a!$#GpER5u`(8;ug#+7=eM4hA6|379;}^zXV)AENuP-7>RBkc{
zdEX<YnZ%!ahljm!#=a(AF~Ua;e>!oZHu7{8KC&W&i$NpDTrRz6^TjMvWgLtEPRGrs
zFBsU9QA8`MnPwP%8LtR9Otz2DYdbZ2SAYM#@bLZAM^y|yJ!UKY_>tL1)NYK<<<IYE
zgUUeKhZ6Y(1qqiEc8|YbIK~{bjhlvRcBDmrUO?CB?ZKIa@xq3eGBnQ4&XzZCM%z#H
zkkJc=hM!8lDoJ@ib$aZ3_;I7!&u_GZCb5wNY}<D)*PcIjj+W1Om$>hqvdYTJNxCQB
z${D+zQH#h92tGb{Z@VtvK8NmmG^z!Tw_@f#f4(TPJf|P&y6j*zQ0<Kz_VU7$7^F$f
zcQ)I&MeDFXbZ!>!=b0<Z$7&;l9vlz~PB*MlkF-|LG%kMcvann0xNdV^VWFrm4c9Bv
zudlJS8j(hnkxj9&v3pOLQkD5om(<ie#J{9j56a7QjOS17ytkeD1NJyX+tK^H=guSZ
zv{&<NA0mk<zP`-%K;ke8*Grd$8EJWefch25;9I>M8>1@JHTE3+^KvHZIzA9d`ROSO
zbBATAn)l_mP!&5|X0@uORF@a$hZ_@=VmcetGOp=z)9zk6UAQoohadmZn4teP@|Wh<
zIE5%GYktcv5)$_<<nmUo_%t@$Nz6>)%5wPar9X;Esyw&^5fPE!W8d2*=_a3h%w9fw
z_U!MGmY}<vNPD`v+;Fd0q7Nk{?iCdkOevl3Ze2$uF{)EvF;7OqzrSODppcz8Qh36}
z==BY83WGSXY#l}cEO#8!y$zIZ{b-Cv{Yg^GxG!Km!1QDJz4N?PPfyR#msn4^Nt32G
z2Xd_kuc62h0U11VL?(FG{{2<^E%F2Uax5qNe7(G$<0wB9ae0ccN2Zd|(K)E~&L-NV
z;gvM~)I>SMR3%H4s*h%EZEcczmXGMl;_;fMmC>Bexsi-I<Im665t~`=cR>I9yIaqM
z9Rii&<kgl&IW*rs!fy5q4@=iYo<?QYn;NL$Gj9)VZf+JU;8Xe;Vb>9T>E#7J(?&1n
z`AG^Ys?vA2ei}E%Q(SL)^Ag8OWg_ERjb3xA?%UklF9=5;>Z1}DFYYQ_oFqkl%FZ`A
z6(*a%{O2df)%VYkTN{!!PHAdtHmB)t!B+SG9&SL+KCLAn`sq}sb4h{Ito>BYsmc(p
zt3DI*@{V}{5iZkTub4HbuDg2mD)wI9z<>$Wb8dcqqRpZ(?OM$~nUN<)uf(fmFx!o_
zM<euY#@fS#?8Yp|+64xx!%FZ4H?6GnMw-(&wDUt{LXN5Jka?q-o8CXj;JO$fA0gP?
z)paKP<PBE!Ojg9mwV9C?v$pJq2ohp56E*9iL=}?Nv*K0L7;$j}D8p~xzI`#gEFmd5
z_33EJE((gXsA2eubh7dbRr&!3Po4}$HMCrqxzU<qp@7Rhs*>~^Yi;)Z-4px+$w1-Y
zE4gs1UtMRlZ_gV(J#qcMyZeTaV_H4s46ZLE{pqQ=w4Whxlya>Muhl#iN5pYhi!uw_
zDk>`GPkuT|Curk^0ysIAH$FLDxRP$we<Axu+ehGnVXSG4aGYHD$Fc8u2#OtYPx*?!
zd~sCO9juKIaF}FD*2o#aKcT8V2<FsCx9AkvOh$VK<@SJ(ZQq~ipGlgzf%wXa*-qEq
z{#%8!(@2K#R|`e%+_}SNQtyGUu^MeX0f1D3KQ?Dwr{Q`(r}uhAl*#Er)%7d5h30p+
zj&?dv?La{Ee7Eb|R9*HOXy6j6ZxxO0-hO;V{_lF3;LfIFTJL`0TQVG{O;6rvEyc%i
zq?GK~$48=r9Bni7x!B6jgX_!A1A?UyLUu@}p2|)iZu$qZD9{%zmZ{V{J)!huq1b(k
zNoyt>vFnCa!H<t=J#}*<!F_$iFXEin2~R!v%5%!1qwi&i_J_8%aD3@5YU+DPbbua4
zi*pl68aaOE-`}Ynutp}yHvj&~m+QS$7_TA6=<VCLWy5&y0X9vwUQg-n?=QoS%y+qy
z^V|PA*y+0B@_Niu%J!9A0b|SKVx8wsvt!PGhU0?C8Ohbt4YmObdbb|;{bJlV-E`Gx
ztUXt=!0`!k$ohd8aipCD#n}6DlaDe5T$i2GOW1f#@AxDr#aaFNZG!D6%6FLJ7)7ML
z0{-#t!I7+bAsxi3`IZ}@aRe2VgaCZ%S*9=N|Ae2ixQ5R|z_-+Y%P>+1=1}{9v&m5+
zOcVk^8&(0UzOG;0C0Lt%Zqh-_UouUU{OAPqhEGqXqO!55k<bZPF}->7hR7*_M`YAT
zNq6pi1*Gl#t9Xlwcs3=AJh$_lB??e;jzyF*7k5yln5AWE{|xR$^}VwI%9w6PzC$ph
z4iQ6wHaZ_4>;({bf|UPqLeVMH!=g!P>d@JA&%Q`f#QDc~#n`#dm1QGk8=f%P-#?rD
z5nn_U%A^dRxc&{G{sUlE?dRz8$+fqBe&duWzJ<C!x3FM6T>p|O#c66l&hhuqS$ty)
zF6V1!2Qtl2Yt~VmW1g$d6ZgK}MDg$K^%uQ{y&ZO8ed{>Q4(z7a`QF9bQ75iHP0F(W
z6SZk${GGzW!k1l5NJRTin3h(D9p@C!#sR&FBMFFKMJ~FibIWgN$XG@p7u!y`YgZ9+
zcD!b;RZRJKMx976u5dM>sil`*a;D`q*qUYfRj<fx9pCkDWaQ-JiM_}nB?!+1)ik|8
z|EiksQ}au+ot$NNaqjDLt&Q-lV!%xEIKmt&g~(plO1&tYm!_M@7)08w{31^~?WUuv
z{+6tf{N7;iX-7WnRh;X}^5XKsc*63^t_6oiYl#afUrk&_pPqI)iJR8%s|aXJxf+E9
znf&uJg>uiHkARq*<COF^bHBQorhX#t`b@p_qvg3vN^`7haIhRP#W9Nbd4+_D4Cz_8
z{D*YQmM!cmNm7x*4oQx$I`bWZf>;#lQ+3bVj<%MeLU6bany{s#h<O7C-cw0d=dtWM
zvyadC%-7e-6Tg4U@`@ny5oZkKAo{##{H2#ZhMio6i|3a9Oz#!6F^*AW0qKfSh!Sx|
zMpvo35g8dt#PUm-5N7uDWYx60AeV_;Q+6ZG#gEyPjB&QFe@jXez7i_S+;My1#z1XE
z6{5%(+vzi_#UupM%e4RJm)I>)xBsvquV=BpiV(2Ae^}D*GvFP7)s5gf6wl(3mW=s<
za0^-<y^UMQ>HGXem%Bt)=KX7|9%bfQc7M=!p_O}xYd|6X;IWM|sdfKJGpQhEx#ssS
zdCCh&tGRaL^y3Aykze;4VRI$?=_7_7YF}`6aY^28rn9W2g#%x>G!y=^BK!7|BbY4$
z!s}(x<^gS0;=;17H_6ZJ!;MI%Z>h=~fA5=^cs*wQ{?NgI>z(gUBWyPzZ>CdGpsq+d
zI}772CNa9fo85~|cfM-LFbV>xTAnRjQJYS;zIju(r_>vz@D8A|k$nKCZh!ZS0r$z-
zS%pkNeXMdufBqGPARIP=GY$((9&|4*5*p7hK^kj8*u{LfbgAr7W<I^k!f1}iy?Z=P
zGb3VUqu4U;8?AgQNvZ+y6)LGZXGQ)D#a_P3A`k_-7C0M?Aogy(<j6s?JQcN~Ivsz#
zIrR{@=U`6fZ5gWY##;|14ok%HDCfGOZu1KX9XI?$mDq6_^d=fulGtjb*<*?dv+Fi&
zX425v5XyfurvLo$(7_lRTU%x(rqcTJJZHf$_F{in<e#Nxq8L3`T9}>sxZi^5N15g;
z*}Z>e$LnxP1#bPg9CObgaN(aLAfBE1-nPFwEC}nNlxKV6o$cra@WPftS5a^inQY0$
zfWwmfR((=2GdK>S=@ok@DNC@Ul|d}zU|!j+P5BPi`%alx`yCKMhGRg|$s)_q%((Wj
zU*?*tt1C1U{MZ0^Pj_6@?R56^(^J*QrFTv_H$Ok?{?>V(mjFHp8re|pb?(Jya;^G}
zzrLmhu+4hvZ;J!IapOjA-47cRvE7nI1RcQ_Q0&=rO*tNW*^Nvh)993SIpGpf6oF6N
z0jSgpSTqn&fN(0~Dc9;EcN8toPbEhl1<q7@B}-&mz$i`elMX#loB|&{VN<$~Gm(Dl
zr;2&|TOu{CvsT=Y+H&#BMq&dH2OR2|UKEEVQZ2jB0d)mxxm*}Y0X6^_IZ^2XAm#sE
ziH(Ef0ZJ!`z&w-ZY(A)vw~yI2hEMd7<xGb}k^|YfsoC@*xkZ?mn3S7bCdz0S1p02y
zPxkw3&UN*a`N~ELhaqgepFckcX()N-YOYn;B`K-Ua@Ou04pxkZ4-?P>z+Vqg+<S)Q
zx1)63uD0^-@$sm>EnL(s>DiK}X-Z2=xt(Ur5QD`~8KlL;JiabUUU{RLw%Gn!`RL-}
zqWxfm9f3Gd`eOltz3;QU>}$H}x~ckn)G+{9W7o@<sZN=<r#g;qh{uXP_4E{}{`&Pq
zi=L7?z3)cs%!TyN+ApLiWKu4=VO1tRkaDF0eXrlJ!K5vlbNXjf9R4;~IbUfvawnpj
z?aG^H{SISifl0a&Q{MN?P4s$q9Dcz^H(DH>ucNIdj7lsfA;HWp!tDIZ_1A>doG4Pf
zYtV@9<6oN7C}Zl>E%ehXhi0bY2OmgEk6*ts{p0I=UyuSVDlQh9g~<A#gq7NZHK#fa
zfDue;$LmB_nAq8UHt*QiH8vJ$?CQRG2LY4I{Tbo_Q-ZTmBvYMc%@O9G0OKZp{dx}g
z+W1<zs@`c7VX|@a=K36q&ddFJP$>ZU=YExtx8yq<M{YmrNzO0;97Pm*kSw+PW*?Rc
z(};hlEKKv*qy%y+gA3#w1?k9iq<6XKPk)-gP*ovZIltvaKv_L^9*9v+R8c8kLV-cK
zIou+k`@Oy0Y&lY_lpca-<p64PG4j4@uGJBO>VZoGmIVMqgJtPXId|Ci?zm63_XDV;
zTAH4C42_P%J0ziXOahNLNTvUpiPx_`POfmNgnjq+Yvhn=<9`bB^S@Y_ox`0qCaDEM
z-Xw}mqDu0w-@h|uIr5F_=o4c!jEz}0yB{k1ddZ^m{X>YBtgJ%;1r+1$xj}F88D5^b
zv;G-s!qF>ln0`=jo44~<g)eyMx&#*78v1-^$NrNSkzEAs#$>@CIZuZI`x;I!XvBzZ
zyS+4h1!6-vva(v1DK!c1#1IEvx^`3WW3c~qzY15D#sh8wd#3$qtM<x$H#t}rHL@sg
z;=r+6n4hJ^{n@i;UjF_$@0J=AM0xPN1ZZ{|FW7PhoR6UB3@*PFV<MT!W$fu?#%@a4
zYfF1MUA*A0WmWgm-_g&-lE=$qr2*tB4QJILW$Kspx7cM-rUi#*O>Y30xlJ2cdwP5K
za_bc7(=-MJMixeI88nn(O`resr>Cz^41qI;SldcUD${WB%a;C{@DPBCdO*Y?O^*He
zdekFb0G42`ZIsIdUY@C#I=$E|^24IgdayPh%$Y;$UE?JKA{9NFt6Ib@6LR6yEEA*J
zLlqk8$^nR6cQZ0FUe2~6Xsb~^hd{qydj=c4z^ObC`$cNJqhK4pemdt?pbI}g|1O%4
z-|TTv!c=l7MVz(rY&k3Epjw_%Y>V}iW*3PS{_$>NVghjQu-4#Go$GSRXj_gNv@-~S
zT@Y-Hu=o%5pE_1~=qPcP`DR;VCzDl@_b~^twTvnr4SjXx!{?T2{u~2Nl;ZuU;Lovc
zM6jp4|KsCL$-;~5Xy9a_5`Xayz?3z><xV>OA`q@>{O@pku61Cd2J?~b*#$@`{)<bu
z?O9DEsPqGcBpvB}Ge4nR5QQ3IK(IJHfCV9K62;M{oJH8Y^7IvEvT6C(+`%pPl02^8
zMt<~P6dnDV7$P^dyX^u_K4fu212J$;T3|VFsj%Ry>dW_cJO0EPg(K(R1oD?Tlzi5G
zGa3Q@fd1;QF4?y$uHQtu2O`lCs6@9{mh7rbtF{T;Xin`8@V`;uIGt2G8(+v{VPOGI
zT-#mZIS;LyWXfwV7Z(@Efg$xz@OdCPdWTWy8w+V;c~Z8|8N;PchMcm{Ca`!);qs^X
zsX@-NlTJIn{GOS4b)zkN<EBlDZ!NnG20uL-If~fU#5O5LbLws?-s0fscnRmCHcB+g
zV8V1|dC9w#UHSFKM}3|XFM5uDihbiW^f}sq)R#?~_Q%Yx?J?Mx%IinSS{&_ZM@xi-
zg;}q>p);y|mbP!kloVJ0p}6=CzCA8)j<x0dhj9zvJ)FCzV_Ng<#t-}7vbB8$bV)$N
z6+j=Lzmw+e#w}5n@3%NTW|pE|{@rDH!O7`aIb-tf0WC+OFd#|lXx}(-1c*`?CHk4D
zYvl9i&&3ufMfyaAe>dz&?^#J`)^@y_C-HD!8887Y<SFRx-GJD?hrX1&K4mPys*%kB
zCbT%yW<lij)~NQ*i-1(%X!$QgnvSOAuRjA7z|z{f7f?VCEES|muyS6u;gc~Rv-*T^
z#`4GAj!B$a?;b<dAQ*H5q~OG_EtGFup{IzAZxW9@iB^#Cy4~7~dpJ~!@DmEy+=df&
z$`YWQ+eH_DZGes-GcC*;=+YRk=uUv)?yV37MMVplJl7F~gQ$||5hU6In}9M0v%UxH
z#o^+Htem(WiPa9^N^f%q<@Fn_nTN341gB83K2ug!#&fMY)F$dwbX*M(x!zY1fHc&O
zC#<)-iteD{#OwIm7&y=%tImK|t>z}5LB%c<?%~ct*FgUz@ZAXA#8Q!XP-5q~Zcl{8
z!z))^o=gqavFtVa*%M`u-*?+}Wv-W;St0Tn>oSUi^iFZvA?nF4&vcJ_yN*HlVSNwW
zZ*Ol;sNhhlT$x%K_U<(abFEOR|D*as`OKL!fvzdir)~Y~6R&XT>FZBSO=Udg8pA3X
zK_Etd=?iYSy!KSG>9?dx(DVwxI5j9FF-u4rK=|bY4&I|Lr?aj@->MGfamN|p!BVMb
zn^gh<yB8L&97cj9r=g)Cs^`P~r*<!CSwN6M)I)nr5F5{+bc~aW5TwS5s-m$2gC}qh
zhg!NvS63I`v|c!mzC^lpXiem4bO5)03g(o-;Ubw@2-Pd|;jtc&y}dj?C{|7gypGEk
z9`4~(e}uwEh!H@^q)eyBryd<TPcqfWv#sDKy$#w~wa)~C27dY)oO&80*SGC6Ku&&s
zeyD&oGn#Z{dwH2!-gHJePi_OslCkQ<f+pWj*>OOSujOn0D}|`Y5jy1~7amJxvd0Ju
z04<b4GaqV7VL-Axc=f&W$oIUEM~`;ld>Ujur7HsbQ_Z-x1BtyKIl3`fBc!P43=Wt$
zN-0!3cV(WL+`&kKLdrhn^9F^iPf%h({Zhs0hj878H-%lwuR&7<db0tl#^pqnhX@vE
z+hwSaJo_F}v0rA@YC6Dgc@XC~2JvqLk|^vj`3pJ8>i3W$06>7Tc?`i$=Le&XBe*_=
za4EE9-(b_u=LbpX2VNqGs52JP%|UPQs_W7dXqETzNnhd>4?{;UMG~t5GOPrvCTKHn
z|M*RCA>u$_@v$AgDJfjw`X9c3k3dG9fOKv>^!X5UZIck~<AFSg8fidBqL!mG1jytI
z4CYA)fY_>3s8ES>Kt9|S9m3#s4l^xAAhdnp#bzD(dl3<Teh=$=yYxS~0_FS!D%0TC
zD_6^)V_$f}{smiySS-gc=x>K{4Ka|QA9HF1LqJ%+etmO>5jnvDn@WFXJ95<j0FWf)
zT>{bIt|OtOpdo88|G^Ynks!F*Rf9^Pio%QY8x3ikIBfunyJ=|3ap>-OdY0?=Kh*{>
zi$lS%8Lq#F0{jeuV9&t7M@YUU5ZvD0UJ`^_Xj>^~#=@DR1zh|bt4y3eh;nKJ3*jOz
zg5Z9-;2eBr&7bRij~<pqGC1ut^J_RRD&2MEwzl(xI4*t;io;DiJ0ob)-W}vjRCVZU
z%IDdRCe55O{_KW)qh9v%BZMQO-v_aS5qcma(mD%R-6Z`7i2q17^}8+j_NigrP>R`s
zF?*j}(T>Kcfi{mIDuuuTI;QZHhJkzELn3YfPt%OQF#6DN`K6>-#JmM4L-L{(neU^-
za*Km<u_9^+Sr5RF2z3R~rN;p8FNgmywmkGPV^koya^;Gk?MMaI)=iR}`a4Ko`hw%^
z*bQX^nb1^0HZZe>yPFjf5Lc-nPGA?rwnCDBf$xSG9f8bv#Ao)`uP*G+$GSRy&;#qa
zU%Cj|I&5>U{RAVS5%7tAMjsAc^Q{Cp!0{r~IbuTqf|>V5DT1{s0N01{nFPKpmqczy
zSCO3{&Mih!a#I3{mlHmq$4clsh}g0(Ujm@&XFv_Ry*N?M#6rRVm`2Thnb6eCTGH<!
z>i}ccA@vzg)9xqRjP8sq3d{VD#FXZ@H)D@v<C}?VM}<56O+WCNN5_3a<-`RnE>6|0
zmNiMq-qBGxq?E9eH}+w(Wo^4jEC0|PIM4#v1=+*^*GT+eaAz_i?S!Ik0xnEUTs#dI
z1u0g{#)ePahpIa{r=!Q6TqITf9wKEK95+?3Z2K#;(=|2eP}<Y0ry63!NkOSUg7P-!
zTC)&oNz#vwitUnzh|8a5XLXNEkv%5LXhKOmpoJDE3iX|liOB=|RgdE?GS{^M3gVO3
zQ*YnBn<Vfvc)!XU%}UqhDTem%-xIE+(8o$VykND-P=ie^or&mZK<FpLT;!1Mp&<Zo
z^7rrG6Ed=SuJ`DR{;Wh4pN(6#WY`Q}N>p~#($Z3cdU?XM@i~Ako#<`h5}$G`OK(@P
zyYplvOA>lH1PXI>!%ciMoo?G`_~~&pq$1!WwfjEI_Nl4C!B4VjIMqwh@|nYtY0kc}
zA1I5<&(Dug?{hjFeTk;lI~$WkedvwFK%k*mb3(6$dIdnYo#vP<@?S#%ts<CKD7v4>
z`!;~3EnHJ9vY~FsW*``@EnvKd4jlq0^~5Oyh~?KtOWj86Dw7aTDE)}!vA~De9|CPC
zr5jXA?u>4}<#PB?ns**Yo6@mCVZQ37`VJE*_C?!ckALM2hx;BqZvR$5G1jL3=vPBY
zB0O5s4S|vcl{?K4C_!L6Q)s>NV!ihp7~3u{I$Q`jCI`_jkZyoUA^W)GdT%oSG`oE&
z?WZ+auOxdFH0%m^ku<#JRBfve>2-&yGYgw$YR@r=CoDZ+2~<vC2^ap-BR8Rz9ZGHC
zQ(pXh{!=<{Q03zzr0PJ2ZOPet=;+MUW<-iXO`tJtsyjWa8MD3(hizhJCi|(TFcZ^8
zQBhGh*>Hs+92BCxm|P8|U8{<l)2UjYX~vK@EZvOfsE`Pam+(Z-xZ!s_mBrJRma+o!
zVq*1j&`4qo`x#YKYUQfae|R<}J#C8Rv*@5hmzwYiKnLe{`NM|*AdVi9xD*%B-VDWR
zq~uR-hhD+R&mW483DNRE@~DyFDtOH1FxHac2`#k#g)}9~85ZmmvHx(YbP;I{Ng&Kh
ztMXm?WTytcw=dzz6JJ#|fm0L#EFQ>AjDf=t*URuV#Qk=6clUjI;)_b$JvbQBXHbSR
z@d~(Q1UrGtLLf_l>(Cy*MrKjCWc#WgG3!8xRrq?<9P<MtXbklPDTs7KcW5%rUA5E%
za@15Zw*-IuiC!UI!UDhdDx?d!9N}6s+%Pi!@7^S)wua2RYd_lZk2l9a!_RNPutHy7
zfAra3Ba`qOk2>3JQPX1S`w6Fym96bZW4_({_Pw?c7F&I#^Po`xVlEL&VPs^qY987g
z^qMm8A*@X3ABq9|pwIZ>f3_&0r-rUOYH+5VI^!_xJO)m>y1HP8?kK8Gaewb-Sch+4
zW%#L-?Ph_=P{R}+05U@tF@gtZ^~JOUx$T75<;bo7$%Dn|eDMF<a;$v{ey0y2Ht+At
zU;6*n5hgz)e`d_r-+vIIB#JUjM<Wq_US3*Zvdri$vt5qgwR5M!pxrq~tz8tk<0h_J
zpReEbs&G-8K5<q&n*%X(l!{ZmkuZ!Iu%S=-N-BVHM!w|O?{^0o1DhNEynEiXks_cp
zz4iKCA2T&CPtPqn%SVW{v_8qmI77W>j|9p&XWc`E!v)8@yxM0o3y%$*I4jooKIzZX
z=ZqSA0zZ$oH8d!3J!52C88@Nd9ow`C9~b$pX;T5Smlsp;S8dAl+9KtD9Bu(-7yjFV
zNU;MO_@TUCgye>l%?5Hs$t-)2m$#nX9OMy@a*Lgv-S#~k6~M)a)KsN!tIMlL3Op<(
z#zYOyAPc}ow4*;iKWp#gWZhM?j&QJmy{Q)7K21W1V#u+Nk6!T$J8ra_mbL<LO#ng_
z98PId1!&7sPy|#XbiBNz*a;jDM0|U`p9V#o92j;3io_rq$o<GHeYFwcXtohj)#B0;
zC#6ydY-RA0WVkHYKIJpftIIpIdU0W5CF0^@VwVnaaFDsJ-?UvdYhi8<^uW#6mlWYi
zD7XkejpRk57YFEB2~=kGG-LHBHv6rHP{Ku+(MbNxj8;wbmgho2hBDPx#Z_p4bpQZ&
z2ND9%lLSmk_PYhs2XGCYkZtwOu(botY5X>xxF0l{9w>;+d!VN`fqs{ItLUGh!y-$+
zl}PToyRWkz&-R?3n@hDD?~v3!EGYOCho)-Oqr-ajE&``ly^4Vsz#xj?+`<CjTj_~5
zEYWCGO+5(ps0TMfLi_NeSoynm@6=~ljNmZ=As11yqFGzmmum}~gsu&Aeao2<H6JRr
z^+nfH3MA0QI4tqtIj{o^0qaz!C1lWbHEfBZLo&Zl&S0K<U@ZiX|I%Jv8mVhvo)O0@
zf!nB-4qQx+E%k^o<mrHb0OH<xW%+cQhum>vI2oT0r@+HP1as@!5qE;4i-?!yrP-^v
z=8*W)Cr|Eid;6B3{c^lpP!J__&ukxWZ|`p4?#pj9TlOTZSrQM#6Nb&e?WpYCkPn`n
zcKY_(1sDKq`WLiea2s)84AplwY)I3=p@bI$NeNKnMnv}7hI$Ra<>|1#G`!~~_lsqx
zpv;e?MB9|WYUsi88h<{BH7h}dK#e6OnlogZBKU7I5=kBcHW@9q8)z6<`C0UuU^)zo
z7{BKw%t;(##%w*_Fm771usu-`#AQxywB+Vb{rN}YoSwxi+VCm?@*PuInP*iL_P`P`
zGu~PE_GWMBaig8U#4jKi$v)!`KnwHp?kj{pX{@~x1d#Tm87)0M{qNDX5TNZg9w!Qi
z)}dQx#l+0Ybhs@Cqz(pj^RRt<=k)gC8}$IH-t?n{Q8jYcnj@^H!$kNC!MnlslpZ81
z#qC7PG2^TRBV%R5&%0h;&40~LNJ3+cESmqM&HsO<*#D=QR>3fUlacXmntpkGlG<@7
zcRaLYaDnhwHWSt<{1st*f;sH8<L@q*6TEvMs?I|>X9cW;7?h7tK)XdaX#8*GL&n{N
z&m6_BqUUo5A969_(o2J0v=Jtzr~5%j2nr2276s|{%iEj!dU|?Edc@%b(mhMGe0zMk
zSXGi};lR;H=RVBE?w{2vttGshr|0J8cG1zv7T?_@;5^3-h$_Wv4zK}*(h~^%B0NeY
z1ee7}5$Y&RbtDH_S-tiizxJzEXq;%Fkl;Qf0mJ8DRu}>y1tiVRT|4<WV|vyKh6*Pk
z&*BS|9%w)o;MB;@q-rK1TGEiARI^N<yu5*Eg_1D|DxlGd#*;<C^d88Tbl~^;<8G_b
zkKYW~h}As-%kf*=(S49n6*5!6)rcc&wSXf<q%)+iBR(?CtMFs;1$UTi*gpI@@WAOO
zCE`kl`T1$N$vIs@0oQZPzcUI7?!$#yT5@mNPF1AC&E&J;Eu`MSCNDofW<kMLD<KXJ
zj@bIu{8PyXZ{ivpmFD^Oz2u(NSD)sCN0FKqE-7Riv==zhtbTH0Vxn?2aIO;dY%1cu
zx4+-8#b*!a(?hwd`P3l0;ukIBx!6nXmz2D!E?|9Vq3ojUl(e<&NADEPEy}XJWcLkn
zu;Cg#AjE+W8yHO(85Q<S8_3*;vCmCeA!8$`wh9j{hzUMUp;1u`C7$Ft?K??Hm7<ZE
z#KcPdpgk9(vrOzeAyIU8idMcwLSZr$!WM(i#vqM*&)kA>0tZYZs{q}=y@4nj20Pf(
zj~v#GH~NtJWy_{5Tfp9K3>OUa_Ld;i!9k&NUV_q(^K$&fz$S2K=^3{**ZIP)iHSqN
zuAoy^V6EUE0S1~7EGe_*7ZzZvhGpV<j0<`>a+9<a6b@F#Z;g2gK7!5!KinQME<~$`
z=!UgHc3|e^4Mdo$mK_kb|D1kxHCod})&i)(Sre2Ht%PVKG%B{h-*h$*jSn$1JMD;~
zrU+<M3K*q;1*#5<hf<gR@&>xRNVLIVRqCy+nI`TT8ON;$s?#z7e9+vN0pv^2%FC9U
z+C$VBindntuE2f><x_f$0W=L1y%eeoVl@?|dA|`WBV*WT!hvHDGtADNJI8U<)f~-n
zq*ap5<n#~V5=9E{ffPh2C4>VK92(k+1P<PCL!5uVCc$Q*h#2Bp5bu}ZONAg@4n;yO
z+iWimj%}_#VgjdTKf1~##(edJq-zVC1W>^_$RLC(hlWer0PHjW&yU2#xnBQFNEek;
z;*ydYH4Aim_5>%)`+8OMI+^;K5q?0}FoN4q7!6@xb#u6V&*Q5I{GKJS=<G#X5TYaA
zeiw(C>8Z>OGzSS_LdYTZ6M7(GHF)>%x8!iS@sPC&q@t=y3+fz$9|0(=GQFCnR|X~;
zuB-u0X%8*U0k(xe&U866XaP5jR6gPCZHsJW)PUUjx(7%oYDk=iZRgINaMOW<%!Y=o
z<~b?bblB=*VqyXhu>av+lfO#f$k<9oCTq3x)PF7G97YrrmG%lZ{*FU19frS*jA%n-
zn}z+*M>h|L`$BrfHNJh64<iA}lH^Dk){@8zC7gC>{;wePnXvn4<=a!Z!D48rVv04_
zCqTQfVLP2Q<}>PTWYv44E`ybSL}tj_1R}0CJKm`fA$ZHu&Mr=;_%1|K5A3hdH6)lY
zU2Jh_c{z*F<=;eFZ$*+)eQSA$EC1Je_&dWQVo<ca?)&=S^B?S#K#D7jAU(2ZuIV#D
zZ!X`+I%?=%o&Fwn#2~0CYFP+R82zQZcOM}({C`KDl0UG<n=_2+;B4>!xFbo`E!m9n
zu#Q&Po?Bac_9{&Xr-lR!+wj%h4jlZ07A;ID>(PpQaWVQFVHki02`*j&#}V(+d#uyw
zDg=1Ey>P#zvB4+tley!tv-RLty6HlH$W^Zg4>Erg6AeMD!P<uqQ_uq;A?70f4Zt?!
zi;FScfN)%kMjb~Ej$svYz`CK1g1na%Gicb|?5m&vH1l&mU+?aL;QoMmGvB$gTn??X
z62dRkln3;up90TbTaLid3|AyJyN}0t_PZT)Jm8(pp;uhn(1wBUA_L{bab~0vcTSWO
z6!gHCOtObpY0iaUie0-Ny?#3w>2$1&jhZlQ;A)N&sk`#W>e!5Q99SHoPUDEMDaLFh
zVNr<0$?*H}HBqDN-P^YpA^IbMT=SF_7YhveX0ma6pH;Lo5BYur0?!q!!8&<pE5yKr
z%6V~j0OG)B6|Lpvo`@c1r}qHEuqklnlzjNW%dJ5XASpA-w_e~o-Hk^N0j+0ZzY-X~
zei&9A!t)L(P^}gAd{TJDWvRx0{4i~adi?LDWI}qilt{f=1EL3zE(m^t`hP?rQaIQa
zasx>sy~#ElCys@np20y$W8-+kJa`X2vK%9l3uD;1Ra#N63sB&#LVa(cM2zzOLlIV_
za9FmFILXI;2{j<+U(Jb?e;QZ$(E+p;BtWB0zQ4;-c7j-8X=T-eG@>%f!@~nb>lsL5
z8@J5rd(x;^r;h4}a1;n_0d}tLu`%<kx~eK)#CIA*G0;xVQ8dKBbM9hsTLrb&-nniE
z4K)RYbnKe`9AX@Ad>2yIC0K2+9pzwANC^fIC<%8cYJUsA#@hQfO%oGP(y@dAK-Bd%
z687W1WkgRpjNt9<?F1S{^C%82`y}mx){kLpm^`^TpG5;sLc*2+ou?nRCC$Ry2Z)p~
zQGLAbVve~M;VkryLNr$i!hGffWw22firUEviM7hKKAgJ6k3qB+CQ29-bHCD^kgmi)
z6jnACTIJ<r^{*0p|ISc(dA(40MNYGX?y|#ZR#QB>$wWg7+%Bl{cLk@g@G~gc#H@n0
z)94AJUDIOnAMez7HEWP~G5YRH`{09^!@8WJ9l<E>^9Vc&o+0GB9_YmIR(k9|Wv<$T
z5ecFOf`wF$Tt;xMz3PuN_?n@4MM9uVLN<oPdJ*(TlHMA^n@Wmy4Fsk+h&%9~X<v(D
zTa6X`7HA$OqM3=DKZ5RYZ@K?*tG)^<QZqsh(gWrqHlJ|g5DIQa1J&w&;5X?U+40J3
zjHHwczK7WzW<gQ?z<>UcqH<$c2N73muRiIJ;nOXbeui7T?}j&>5UB`%e5SFYQykO3
zE`$9fSGvo5e+Z$NA_ss*N+LrJ)xRV~zpy~L8a-(?m88(*hJVe%Ngod<r}>V42$~T@
z_XNWk5LGwfuy1m!H27e^dlL>%WGVBXjsIMVSbf=mcsA}5xFsIMg9O!Lb5UibHwtxc
zU!O;%fgbWlw*0@Yok`0~+W@6`pPONAmgw@_1~(AfRP*nG$Vl6Y&>zwNuOE)0L4qY*
zR|NAtNY~{gRSGxQ-Pgf;fBnDw>`7F$BH>eQ;BbTwm;~8$a~H0J1OjdOw}gL@gcrUw
zzGl$wNpwIMf#@x9Uj%I5b_Tw95}01IZ=u5deGThPF>0h}7XTfT1iN1U`nv3Rov=G@
z43G`$3izh`pDv^F8x6W1r`D}oR~;b~5+Bd{<6CkSENa_|ke0xVOL44WGjA3=@z3@K
z*rYiG?9hRHMp!5m7f8ACi_l9mS@8JRGSj=)c%mHseF>Y4)CcY8g3Xm^2eiL;3CB$^
z>5E`mWWUjo)$3LOJ|)1^M>OOFY=(BhcSKAs5Tg_9Zy-E4!wl%{=Q@@<xcgzPx4*v;
zT4>IQ7O3#>vF%0Ag@B>gI*?w{c*1E~0N;!;0D%p%_DTCkuH*a;#cvxWGeLXM&GaZN
zbWKl_hz)=-LN&|5!QqI{!ceS#D7xqH3&tUr5z0NBQWyY19Lh*^Zo;Qi;?q0e*oG%}
zgIlpqY7+M!ZcIj2{hf^b?_k+13AzDDgKOVBa6>4M{$|3?gp$7bIcj!e;uU{#kvXC@
z&@(g?8a)dVJyL=oMKkfsB~5E9D@L?|_yt;SG`?P2&U=_L0zgUdD}<300J*rK;dtfJ
z&!!X>_+`-^ZmYk>O>6%%IcMlw^8PJ5=?GJoe?$%-N>ojv2Hvoa7==sH$_s{-sZ|j7
zgjbs9(AMUat6PQ1&PpC+-`HAxhdm|EK3=~oC271zqIUj7_ZX+;^xeDE(H))_lT-!<
zBRwiAq=ZkO_I~hy37<*Wv|&0|cljt_I|5Hy-*ecTRmx#gYDm8dJuiU89We}&U`WVy
z@rvg+;qT0fhDLBwFEns3XMO~(RbrfE9tqp7Enc%J-K`)&q_KOZvo!qRt4ns8Q&jGG
zhkh-vtNv!US)jjg>QjDxP#2gBrUs?p7bYSC-6ohiJz+BM8XvdVn@kDbduRQo-37<~
z%*~O&s{Mqijsa7pHa404wyLVC%-@koDp`?spt}1Z_R@ii1#O1TfK-`9K!<p7CnE?x
z%%ZTvcf{_Ozn~o->pqujDsJ{D3|vZxep7crMwcSVUB3@kc3g5XHY<CRsUh&_^Za>B
zIohXcu?*F(Hx}07q}+gRqmq+nGkgw&cn$%E?qHVTS$Cu!Jz&@aYapO~9tvbsv6`=!
z)HSQr=}qVeR)8;VTQkr<W>?-0aYoyrpE@xaGUaN9qCdndeBbMHJXKC3RS)13TfYGx
zO*5~LuTWnFsbchOn;+-Bo7$E(-nT~T8fr$3a*W!i8F<Z_x#{TW&_|1VS%cSWN%gxp
z^i|6*0NN?`?K5p5>=gn)AyW5o@jy-2AplWule4@-pOWx~V}u~Mrn7S;K*kVIrMU`|
zrhpA6IyySgQo)Glrsajs74<S=TvG7X4>%9yAr9<?s~urx`$-k^w3G*S+L?ct&PcTu
z))d-N*NCC73wEpxWZ5noqwfr4yRLAPD<#)&_{3M4*@*I90lyS#V0tD*NK1GfWSN7M
z&4BbtfKx6^YN9KkprDW_Czc-Ux$@??pmsU~>cRnF0%Ba$P=0+-<%_F)*y=sm7M=1i
zDZoj-9TSU$p+)npCBg4xs=;SW;6p}`5WPP*A9-E=*uVi(4q!AATHwVbZY_UJbZmd;
zT^Xn9Q*>I-)fs**eHM)W>Z)7on|gbfjm9QXGLL7Qo)5o}ts#m%D)l3-t0FQQ_(-)>
zopt!KZkQEvG8xv0Z#s)y0wZ|_!UJ)Oyo@@J+lj$c9>#&11$Thh@WJpFYg89WkT~ce
zy<LxNjDG!_uw1b7!eiF6I8QC_U4-PG8fcSmr;rvxz*-ER+g7+gL@&uRobtp4r<Q|9
z9UjNOyWRKOh31@lSE<!o8qx{!r4<J%w}A#-xvQ#;WN#upB7YX0(06nf7Z<14zu(u>
z(^GkYCCd43r2*kT2+k&4f(RXA0t)t+b=GN60&_9z9Et!jl9FfCW7wwj+RN>Lj~VLB
zhUfa_ewhBL{}uv$MLGoIh<<SAg#hgJbafR$%!lzQgFPGl8)#`e(e=D`A}J2HO1A&x
z10)H;i@fPx=flH%y!~j_?3kFZI{(3Xgfv1ok}JuHR8W*}i$>Ybfv=KvH{4ANy2Jh?
zy#I)++O}<5TGC=J7?Mm%KMDzkH*Wv|okK|{ItC;_@%qFt8q{vwj%uwkx(UR<A3@^H
z%s8Nq=>XXg9smGM^vgoW%Fl_3rSA!^tNix-j>D#CqezF3-$LX=(3ksyNlHl6cQMrY
z*USl<mwK7W@&V+!Hbf3eCljPJFcUxIS&YL~YFHE)g4m<DmzI?&qFtS+ucfIOubIn>
zvYr8^r|`sHDZfBzmxh(qok8t;$M+wciB=XoY*GAV#kHegnWi*u*-jsY4`b5z;e^=j
z2H?O8F9Q%W;cq0E734Pq0wiFZ4V_o3;rb(}-KCgO2#wE~0_P6pGucg$84TeaI(X0x
zh@&1o$?|s#0D@V-%WXzcE*}XCCRiLe$BlU9#NcElsVw+IlrpZ#!Bj-JO>x$t-nn7#
zfOIInrCcR9Chj|~7?{V)*EbgL{3{Ljj*r*TTy;JxCAF3C{>tiMpeAU@o`Hd3X6*Yy
z#dR?#8_8#Aplqbso$F)k(y`QOnttd}+9Au69j_s6Ixv%URwXc@Cx(PlOww&?!_iyj
zj^uib&%0HdPtf0v*pRj5<&Vd}E^HsslVK_g-S{u{A>@ZXg!}~}hrtoe1oQVIz%Sv#
zBG@dLP&XcmK#c)x*uX=Q8#2)F-VM|+2M){%jh2KMFcuMsM6WcsEyp4V&77LT!;F(u
zD8lGF1;Q4iu0rVor0?bJP59^u0XNUCrhxT<gnmpfJOP{wLB}xx{}E|@qS9B`5Nf;C
z;Q@7@o4L;lKn`EX%qe?q-!LB7WxV`M$16X8f6RRAvt<fl-!rufzB_)E3(o0t=KtB7
zKgYc2wEgy<#{3_~9hXk#lA`PS8+U~i%mCb>w%CQKJ^9~qiYjVZY|&fJqU0sDx?slF
z(z2+mOnhn_ecL1L?bQW`!H!M8c3?^gOtu`?52a&E>W_!P2ie&_S^4!LW_Y02RgJ<K
z4N>#Y+XP=P1I{gj=P$E*ggdQR*^+vM4T|)Zt?T-+NvOQUdt7H|{81i1$=G$L^fwv%
zk8LR=8E4$JZ)<r-SY3nem!&C5O;5R!XfdsLfui<r&Vq{tO~Q6<``ZqNm0br=r1#X)
z)<V`p@BYiEXWM8pH~|R}H9+UY@IB$s01T}}Ll1s6&w);8ix=Pw+bXqKCIf%<y0<P1
z*@mIUf5l9V+5o!PFJ5tRabMBlC~aBUG_p*!)Ah!Cmuv3xGh+%hryBw(l%gp+%r|TL
z9pk3?vXjf>F4viHxr^^dmx|;{4j$XwT6@QXYwUYL^jD6p!W$P>!cFYJ1L_Y7uD4aV
zdnBd!aSwMbsUN3IXYOq}Gm+bBaSv*E9-4IoC4+xtzc+XXJ3Y}wE9Jdoa@Swvj~9$Y
zR9$HUonP987#Uk6G1LVa+taYyedD&Hbr>=6CkDFv`bxoUh8u^MNu9w}0RnPN(FZc!
zArxjMo5xktwn6Xc>_@wai|5WO2>+4ss+9>c=W3(-c<<FAMbxy*0jG59F8^ZRzUk<>
zqS!$$d6mzK{L2UUbFZ1*9@d#+Y=f2W(#}ukP$}-f1cEF9{X^KSHPag+u_A_ZVE6m2
zIyG)QhVwfTi>WnYP7!9_r&qKc%Ie?i6t9PMj~Lq2*48FQc9AiNlmiPc$rN1_O1jNR
z^B3*mHT|3OFDNR~WL<cDwzW=|w>X&MVgjk=qCl^;>|r41^dMLOVKXNoCIkW)#Yv`^
znm}3~V3G{adQcx|lCE16dg>&JlS`Co;?V$@Fe3yTI2|zKQHN%Te^gYIA?py#Qjm8~
zqPMA!1}sssVOu4XR7l_>&RnZpBz-GOY;MsE?X$Y1JJ*e>3qrY0UZ6{L+C4H)=J>|l
z=trl;%1y7_**3TD1KKuwnHmNSWM0o1_*=gyN6scD&R!M;KgW~}a=R7!vE@%)C9QFw
z47gAM3_*bCgzX>Mb-IM0+)YHSEP7&5)%1ubGN1t5w6@lV39lL!XIL!KVG0zwwyMxf
z8dMIi|5y+dJ@%{5_ttxcP+#MpTh80O%^h8o=l`>#aeqMcrjw~>12Dp-M~s2CL$|Ie
z?*MHg#FBjb3E2t`z~}`oR9cxv`u+P!&uD5s`?@GZej(JAm^;aqQbs4P2yzoL^zL1|
zh>={3?Dj&NmZQ27Cw~Csx*Uuo7rYicB%AC2HTrk_`wtuvnQ;0cdEt6Ka>gx@H%5GQ
zB{TIxm0JV^&*wSpx=Ee=ke4ep<2E<d>-D$p8`{f5IUod4Vw9g~AES=fzjtvmZF(aI
zr%B)gQKuOW5D*<~5f-oH(&uzfUc*m>)=upH>R>F2LOHzKG}`uOiA;r;@ZF#cv~oT?
zy=~cR_GwEW=Y~-lgWGzjPd5bG-&cI5(eiq|KrtroJy?-*smmdLd`sTPl0w%|8qJ}J
z4gA-fr8%I3z_`^9$pk8V`i-`eu=;L31A`7LtPm(&Zn;hBAkJVdX>`|l!$?NH1&zXh
zrUOx)aI-?(4<H)Y=Is>#fAGOZ5xEC1>E!)JhvqyAGIpWFyZszXTeO;|SFYky_`Z&d
z{GQVFLql8n7HKC#Y98nFy1X4iEhNYun!qJ6L8HsNmB5n(zXjI^)&cSTzz&DAFk!PJ
zG^&gS*+87ph1u~q*mejmLxdK>pZjKy*!#uF<-i`q-(QYhy7|~xF<ViT+7^9o5AFMH
zA=Mhrbfw=<tk6+kbEzIBd3&pPajG!xIA<1wngPrrLOvyio(O9q9<VR~D<U&9^T&Fn
z(X$v1YkZ>>j%RbY6D;({kEbncBA3v%!my9E&&_RrHwJqn#k_6D#xBp=v0t}t{B-HQ
zqVtXPvkh<l@9bPo5&CZhn<U8Nr}vCRtgFkpGpJ!?ZyKg;Ak)>;a}Ma8AfsQtd?BXI
zaYvR*e{PXX4%AdZn>dee!db~sR{uxB2vojz^~9{~)G-t7isvu50+I`3G;*5Y(=~jX
zmmA)DlI)(Qc=Xu9fJ5_cy3idV<mZ~GFTP{jxVS$2{`rZJLz0nXa$m2BXK&g2Py%9x
z3^3j3O^4Mj#BXUi?o)@@sXn;Z<kXqpNj*9cb(N0fjW)Q*v$>u3mv`p+o_`Zl`eagX
z>FUkWC#IVtBM0V^Z$COL`uMuT%3{;X-S3pqlRtm8Ck|w1U;WT7IB-rQ&Vu*%So6#O
zcx018?$XsWL!z@5Q7t+hB-%p;$I@S3Sv)<bd+_bxoohkkIfD*+_W9jQK3wg4=(0WM
zQj@*cfAp#KoJ!<h(KU?8Oa*_l7U2Kj_FcOC+dktCUe#AA$JqZ_qsbSTS0!SBiTXk9
z&QRG`m&@ahsNnz8MOQ^ugzF|FmJR>vYdRPt<$03!zot%8yoS#Rq+V6F@rTW5)r)yZ
zv<MND!>qhz$XNSPQ8CZ-mX{|w{Ql#~QvtGreIv%lLX!!5-Ye%b9lW1!pB-QcJ_~)!
z32`;lmcs?)o;CgQA4RgX!~EI3F3Oo&#*!B2Zg&9IKnS;l8-n}#Hx4v0b$?R*4Q4Sh
z-pAinXqMnTp%roFM;|R3EgZA<w*hl=_D(Mk|8vuU=3wjimK}K1R113Hgl`R_3DIyY
z5zjJ$+SBmO<UeGya7Yfs{0`Am!>}NH<~xcmS>|DkyWy2wEM#CJ>>>W_!sx(Hs(-Fq
ztiJSEiMY&T*5WM;&N^&w<-&N6C>D>x%$bk5Us$CcLo97MEcZ8{9K0$GJ~i40jC>kM
z^c6|M138E!f=dZPF{PlS)Ne834Fgs=2_$(EViVedZCr|f-(39P+!7S~4UXu!+G@-Z
zLLgyaM?dxsc=RuT*j@Ov;mR2p3hFU=k2Vu#;$T*4J*te43*g}Fc${4pTfdKMk`HU3
zL%6XqK#qPJeiBC>z7?n>n10AK|Na!PAP}R#aJ3X+{^Y{t%a>!U_mSOa%3)J_)jXu_
zZIJ(Ot!zq%O9VAQ`XZPtl%|~D>M}!urg*v)hN|&oi&t0?62d2f2NGFAZPviEkq}y(
z{Iqmy4$@Of4{G|KdETE_Z#{T4U}PBbHG!95+g41tbObIb$}*JL`Zxs!DDq`RcQ#Z;
ziHZ`X12-|!n&k@xdK<v*Em;^9hFdb?lr<pI@J_u!PI}mqU-1q0NtyA?jf5oy&#^%U
zU-in);khu|+|Zy2A0XuJzzFb)K8flRPH~3<M<FKs7iR=jFVZARbv&BJFOywYmO&Ig
zTr$3nhWA$<!m^7dLRe%WG!K8R`@YOn&1k8XxUMW*C1kx5*HtiveTI0r54d`ah0E&M
z97Vg)_=9PHBpT{?oY$`a9yDcDHf3*wuCk#EDPEf14pp4VGswrQBB*%abPKc@d(1fR
zMSBmA+mPm2CT1z1gr2OB#V7Vv8rg6Y<Cv=tjq1JhVAj$)M#6*(-KxMPtpZ1CH*_kP
zTXUdffvH3Fje!hDwA!Fzwg`#?FpA*>MWAWEMr9$FQUq-A_=jnGz32e{yN@SYz+C@Y
z*$G#P$KX)HTtK)47sp*!dhrAb7Cyemup}R?v?lt}a$$HpKyU&a5EZ?UGYHTUOyh-S
zMHd#n1=8(l2n8G5z?0?WPbw&^o_MAjf|Vkk5WPDA71Ghx?-WUFBj6s?Jbeg+*vI{+
zPUVOVh6_9Jf)dnKKSrCzy~SBR8{@~sGz{E+#>4UvT@WCMC#9jqcpQ(u(ugDab{v>!
zBHMgEunkDolsXR+2sr=lxCUYd4&FFiMKhZ<mctA^RRhdyfq0y1i8LX%!caU6f*u|o
zmS}!3=|foFx?@L{8GMnoLz$~rke}GR=9eIJ8T6DiMyDnwqA~bGnAb3g*g`1f0aQCM
zb@SzdHQFfYi_Unq+df$QajV2k4$Ln^%?E}|GpyR95w}q4OFUssYRT@t$wL|n=}MI0
zp_U95PW4P3EM9`h8$4Btq#X}Ksa%5Eh5p?k0f_52n)54c!SHds!6p=}R;=qz8+j9=
zrYTYOV7mzXF8V(;a%V1c{yCg5_-}ms<m!{luA8_giS?PRKD#38I^i6|kc;xuS9!#k
z0tvuORnl*mP(GS1E1Q3Kc763(WaQhnt*frm00%G-hrO+|><Fg2F$9ju`_BbVb~1N%
zJO|$C!(csfcMES#oCKbgW?rf(b5lm{kh~aE7TRIwG3vvL{w#DeSu5=mZiJp~N=i;X
zh<+Li(Gp8k;mlA%yzWnPP{>A<1Lsl`kNsknf992!muJ`sK&wXhm>nkj(pLK+Y(E;}
z$PwU}N4tbxAEEN#cGmG@eEjCko55|{Fu?v-eW^+n=99f7#xzxpfh;&XF<iO62yhnt
z$c;L`x{6`r`;3%p-ub=;MWF~EmE`A&u^xxvmmws?Gf2vbXBc5vA4UOy*HGfAUr<p}
zp()@?%$x>MryH<c=uMr#XMezc!Qf?x5PQs_7FdWUMiJuq{UDLWbtprnk$4lHOK}=c
z`XKI|7(9i;L<u(md!7PP-`1TwH&<If5UE~kLyJuA1GXZx6myoOj}cTmf~Y7eh2ap%
zdHVhu4l%_3J#Glv4XS$>A<i4b^g2!dFl0+FfEq&Rv^W(+PYGhqS%5J$SR3G3zi_P+
z%bj)ztc@7O#%hr8JN{;ccqh;M2K$*UD}#g-K%jkm1!oRC=5mNRdpr>A*VL3gWX<4&
zoq<o|TQN6Zmaq#*w;HBNr3j@D+|r0q)m7Do04@=U=p*6@QFA=UcY}l$4fIM7GCY(z
zn37hd(I7*a&%mO{5*DkytNIt1$tNCwfIYWHhN*HECZAdLg+3W^KE3UqL%XejX)WFS
z%&6+)fU$^}HTi&*di@<9eY8r#k*eDcbK<!29mV6C(CbDPDgQ4H(K^Hb><~?r38*pV
zo5aMnKdd)t4pZ0gl#)--RQ}Q_d8<&O^RHrq$6(^wT|~bay*r}G2q%|D8D`8Zkq$63
zU>3!+iaD4Xh^)2+La{H=^gfP`Ou*$_%v|BLWta-x?AeIM<6&al3E~zpx`?3`;w!-}
ze*OAIqJyzd+~(&reMzSmYZic$IysCQ7@vUvPJ_(K43kPFE&2zm-L}9?B;MYE0SW9H
zQD%vUR6$RHcuzcPL#F+I;?*%+!K<qosbkBw+A@JIjHgcoo8hT@2ag@Ay{`t;!IXkT
zNIVdVFj2#o3lo?<G%~^mM`XfM<z)3Ih#=x2g$StoFp~r58KOgCTdlqN>AVDJgMs)O
zCbTQZ6jX0s#?d)Sv=7eTCzD2FM(`FMt#OsvXsvUs=8YdG-NQi=$n`3ri14<0`?)Qx
z+$$>CWwSBn-18c`_({jsy6IjW{y&_L&9|qdeERjbXHM^lw;~lI!U!gU26q_}sOJ}B
zJP@>55RCY*7x#8_U*^XueV_boPOt7>QDjx6SU>Y>T==YH_nci<-_x}DHNa`G3kL;{
zHX@$m0mEY~RD<mI`Ch`hbYwe6-n|ca)Ev(Caloqfe2FvXjYm&Z?WsIwYwt>~vyL7~
z+-xH1S-DX|;>^oqmJ@>y>J-<)c0+T%kR;Sx90T+@+y2xuPI_$jE~tDMdY#QYfvr?}
zvo-HiQZxVJ`RaXdZ8vMr^AEdy57N;*_IAkP`*QED&_^_HBAt^~r#G0Ss(wp6-7eiX
ztUncLhW3Xp&KKchhmC?4dJK`KBJLxDZxGNbdTYnqcp%a_t#)?9+;!3<1~QBBEwNjk
zb#9X^yt6sBret*mdC~p+`*=zEy@P*yV~?MB8Bh}-{f#ENWLuGQ%F*`S3s6tEFk4z$
z*lPiK(WTdjV_{@et0<p-02-(5$TELW(#ZG}`9PEVjo9ZCECY8nqS-GRg^mUy2L;5P
zTYDVhjQn}A^n+MuSSQh25B@3+$hLL+_Vf`2<EC?4VWd3e*+#SXPYkKzEzu9(E9Zu~
z*4LeP5rtN~yi}6kb<Urm=*s}tntgThaeCEmCt~7%Vt8K;4i3qiyz=yw$<sZb{!;q&
z)S&c@4D05ru9@Fm;~?az^H&z3_GC>T0T{^3eY+)&#P!;N2i<L-t1P+Va!-rw>>2wo
zD$^CbU-R@hgS8Ne`O*sChLy-{hfjgixdH=H))o%aZwS|EKqK+Q-#&`pciQF8ZCE!K
zogw6`)#iA0jyiODJzoSFSHTT)Uw_YA7GX4}|BY6+@!zcc^gp@G`n+iltXo(iz2jL^
za3l6__<t(jJmS7|wdiYSckK?#X<n|OOXKHRRgN|&;W7dm8w^e)SYoOcn7kY$?Hrzb
zf=8W^LI2hPQVI?wo}EMV67VDF_Y!yz4s%BIvuvw1#poYLYI7uLo!y@4)2P3#aJ!;z
zmsWlLqqEXi88uwRbIenwzS~t<+F73}zd^e_*XP{#*_x@;BmCU^k1=?>Ir`j2Y3tmk
zlRG?nxX$|t&*Ulu8vd*6BX!^V?}@X%!=YpG!@t0Ro^0pE0`fi%61($Vv&yMM%0n}!
zADcfmF#+<BYHd!g*n>xFp$|knum>g?Ba~NS@*U`L!)M6e&z_B3-2nH25C-pKF#Acg
zQ6TeKAsXSR<K+2YM?myv7$=`+&gii{s=D`oczf?~tlR&8oRl4@tTIYM!-%pYqA2T5
zQpn1v5HhkUA#IeB(H<&gg|f-sO?!k(vMD>hk5l!&@AvyNexJX7*Kyp(akpI8^?IGJ
z^L#!Z>p5Dan0n?zr@SoxJ=L{}^*%HG9Q2u%b5ljs6jSbhK;vB-_n2%D|1{6O+a%tm
zeQLf?HGNv;@~qyA?w@03^Gxo#XUks}y1cyA)ab|H(sz@|AvPze#h2Z45qB)_hi4Pc
zp1-#UdU-~(Z5lt5K6*u^(|!C(m$EVcrOQHVUZ&c=ugD0H4iwq~fbmC#HlsKPp9_cC
zC2Y%JJyK6Nv{@*@PeOtxf4h@;c*0GEEpct22wja*S#f?o(444k+H#dac02}*nWkl|
zw(n}A>E;C~Ta~`~Jm<3Mnx9R!(l=!SIOU@**!Qygv-)w-4|?8d=$aYuj0*}rV$nx0
z`-)>@R^*)BImPanSmtjZXEI_gQWhESa&`{k@vJg47nDs~`6-ts!FK0IzDUZ(+<Dci
z`*ZduJ_J>$@3A&vA#K_@?8`Wm9wDF(C5>>SA&4hpjziJZka{el<$`^i?*uOaK*9CD
z1$u~d#&!zD#=xG5i3!gpFIdFNedaWzgob|b2s#QVKuX^`)R$d5(&&4v^_`a(-EOW#
zh2DB2nyTn?R`fr<y-Il^k-=%l=jCN72Tt0pZGn>><K${mI%B&!z>rPR@$lWok?fca
zhYvxzfHG9$joksETX12bp1=`;q_dkx{c#(hy8*~m`YC=rQK#XFVPItZf+lVqo)`}=
zuhCD&j%@7Kei0~BHIWg9G~G8Jlh75yO%jC<->}XNKb_4p+^22zqwO^F&n)6Xl7ErS
zk3Rb6=Tm=TJ(I!pbjWni17jAJ4@d29pf6I3lg6I=^ZR>Ud=eC7u~yXI;0j(ss3B;B
zLSx{bf`<jV<efl1aBeRpofi6!hcL2IEvAd^;Tjzo(R9s%bRJ7ab9@$G3Sl~j92R!H
z(5<WJw);u2(uwXXY<?y>cQ>9@k#WaZuamRP=Ht6wM62|BzGhDn+m-oXGsvmbq$#I5
zBy}!A#r$5dM|SVg3(%AvGu6a7`I|W#Ma9e+@Y&S+(#@M(gpGonJ;QrKjB3}BFEZkA
zN<{wDjQZX8#dMJ(sjIAGtl;Nuv#-o!J{B#;wVt7FCchcr&Y|R23>){qOY=leq*w$(
z2C{~w0a(YvujgUnqB<}Z-LO{`^n&}V<3oTUsQ@e_z7^b7VzPh#HEaKUf67JD<30JH
zuGU|?0D`R%1(b5^3*{yaOs0>H;1>eYU0s%@+EbOZ=X}31wUin=6)76MmFn8~)$tIj
zb{oP4!LLIwPH@5_#P2WwvUN4eMA%~VUYN)kKaSLZSQo->Wf8qRuWe6Y@t~ooS`-X_
zI%{#Cl@V$W$ac%(+7JTLK!esu!R4g;R&kBQNBqsQ(WBH0p4h0{_4<`x%~7TdH@(&?
z7<!bI{9=LWS1x|~QXqWlUu3D-w?Aa*=-?{dqW5%ihjJoY-a*9Yc?-?Rr$^eWNhBs5
zvI&gGh$3R+M#hM;vk0I>5tpVT8U`?i@beV~bPUTWhk(`d|6R$xN2<eKt$$EfPn%_#
z@`d|jgA~`yp5VC~wt=%j?X6D1%UgzQKg1X=S5wl?^<9;^?bh6~O!ntG500ePiGOgM
zH)y2wI-e-duiT*h#E{Rpg^3*dkx-GbAo&<V7@B3AoFVz<RP87!BJXa1*~}bKBjiJ#
zUDN=w+Tr7W%T+Ds<2w<02<ZoSrU+B@NRBX78XT@pO8rr^C6TurZ?{<HWZSM%3%b?h
zep%)v->UJvf<qOJg`+Qq$6RGcm(Ffw%Xz-E!|+b;+ZkuJ&lc~UME>GD&O+5bS-~6X
zCcSU|#?n>NfV(Vdqye;dbmW6vA=$gw!F0Cv>_y8@P)aDG67e9SZ3!YcJNiT7%fogt
zJTcJ&OF>CZO^xJAS7cBSOcGqz7Sv=om7>5P00+8@XVyK3lRS-<r)F{kYW)Y>lv47u
zsIzJrOd`1N9ezj`V?>i%y@j*W#3jm*(;=7Y{O270^kZCai*_{04bPidmSj-cdm2TL
zj=$fyF;+e=^!%%c9MpT*{ZLO)5kCMni)wVXB)JZNJxMqPv_ic1u)Pk19SA3$3RnUT
zrXFP@=`tjG0Ktc>5O=&-PXe2X7#P?Lk%@pFB!DpL_%yRG<Wq;cG5;Yn1CNi(IBw|8
z+FC~0TU0Lba^mZLK@kT09b#!GiHax~iAE3{P8~E-YDw5QEkLB9R~3ggrWPN_raDG5
z$LG^d9|WaG!C{R6$@R$LfWCni={9Oi&#es@^rx*3WC2tw5L1_?g2w`s3P~vGzpna}
zqzWR;1@_OG(hOj$i2$EgTmKRwMs@rbY%<~^6EibH={X_S1a5`hXfZKgK*xb6ogNV|
zd;53u`@Y4ylk=0PNKpU7e7_VKeh6c<cddC>^WWmU0^vXK7*gQ)L}Kr4-*Ij<h`Oo%
z;42WKybMAfaBB{+akxojV?%F&w*L{Ne>{jT2b3<zEpzOhAQAV&#7f*iRA8VVpqD1W
z#MCsEE}if-0Fh;G_3Ys#*?&87{eC_{+5x}MFg385%6;oR!&h+g?NmE@4c2?MvUm15
z!_-%g@}<!ohAs-KxMb(fU8`+=by|ynUBd$Oh$|gt4tOz+ZAhdhgfL<Bj(^;^w~06-
zE?w$IK6F|trYE#|^@(Bu%RyIN+=>AhNvktgHt==lv&%0uy~*or@2`8?wzo+IkXI%-
zBeB?^d){7`gE%RWty?Mva2(>Bu>g9!AtGi0;8l^^Ued%BondGr(Q+Zy&%oHqN)X_-
zv@pdgy%#DtwSCrjhzR5fsLJKrhYinsL8$c<vMP5$dyE5^q|uPO2+V2VTEe;d@c*D2
zkC<-RpB&WQZl0%@`rQJZGjO*HfHINgjU|Ry_%(H^R177ih@~qd@|6|5ybi>I8u=GU
za1Eg(&GmL5h7X8u1UQe2oQN+W*twK8&>-CoTiSCWj2A$8h3|D)Z3fbE9aJa?2jqb%
zN)Uepn8yV{(`oh%mLc})Z%_QDP*f%B0d-K1)xHaP4Fj#^#a;Ki+jbYNC!I6#(ca$&
zkJIYJW2chndMv#^WZ6?8kE62R71!h40Aw$Z0X&f~FraG(2Ua7k3gl!l1SAm7QT>~U
zY-`f)ay+dnklj%|_qw(I-1+m#=fTeHHE1rxIr*I9JZh}_fFrNm$iUvQF?wYKN;8|@
zvfn@?0dswZHQM|8wE%?^Av_@+?Za+qq%DLtT%A6~{vIc3*$l*RB*g{g+7SS32WAQi
z3P|o2E=P)2Y~R0?Zs)9A7<O*|ZDQa8p|N*p8x%zDL#;^YOJ3Cy;bf0PH9RXAo{D6;
z7<{h7(i@U7f8(H^yOV@}={!W2&vT;K!cv|8TjQ&MZVsUREgr+>Si`#k;jI`@{sj_-
z3KhElvQ6J=H-d6eFT=?K>#78jjTHk5&?&>okk$-DPZAge!Sfa8XU8JPL5UcR0}uzI
z-(m!%I7vcBhWnWWanaGY41YTKx{<#&u+;e-H0o53<3KUi4UI8TziSTa9+T|v63U<*
zOS}&;&NJ=)lCS-DdUV({4?uuP(p6BZq@@DCxd8h99e|&`#?Wdxxw~Uyl#7&(D0>SW
zYXi(h5QwE6YsC%qw9h$fTk!3!fThANx^-X$+p2?>`^ktEd9ca|AHO!9tYRb3u#hZ_
z+60a<W?)ZyC50ZAB}PQIui9GXcA&H03NFfjd3!S#yuDzngao1-poIovelUltA<=>c
zkO~zh3vgk#goL^Xf(>0bz)5^G&S0%*=}TBJgz2ex4gFjJd@*DU!nsSA9umPdLRVm`
zNw#m0B!|vPel*#gAb284>@<l{&&$gb6kfEAi<v}`xtD5nm9hKDT&^v>b^*4aR7g=_
zYK$d2*u$;d?k8861PZ;beu@DY=jbmbpIRkgxs&YN|Fq3fxem4R;-f<GRF2>fLO<fs
zgg`F{y%K`ZE~=TO5=jg$s1&SJBqj&x(T8B<#x|YO`xA&|rS%N~W4K268}5r*?9(Ie
z7{O<<hz@}NgTUA6t46um+0~&i1muYw=#lK7kH*1PwvjJJfBG*H1q7ACzKbqUZPnDU
z;uI^X)KZJ1uVYJ`&t2xhb>{Mp{q(6(GzO-+Q}ybi?eD}jhg_V_T+xq9F_yf7h6%}S
z)}V<r2Qfb9R)yNW2L{{J-|~T(LNI|X`gjroRyRjdUtGWHL6dgnmzn($NXp2czf3;O
zPZtQ~IMsh@idsML_s#IBeNR1cA)97(NPfyoEBm-`8?+lF^*7-49b_P`#oG|816(U4
z+YL26Brtoh6dhu3S*<WK&{yln^T{|1b6RL4x;kwS4_SzGzMw@Z`r9-F6=NXqK&oH9
zp@QR*_6v;=<9~L+n(Xg%o^PEu{>zNgxWMqv&naL*gD%B);U#H5d0A(FAoHsTK?o>N
zwZi$W)RqfAf4V`yaubNkhbV4C8$r;zP(AZS2l)U7CZfVe?!Yp{J^&Rs`tAV(aPSoE
zf`!s$n;du5lC+B_N4=e@sjZ{i9GkW?jQh}T|C}%NV<>%IcJXC@IvV$A?>f!k<SDK<
zXgp~29`0dhrVV`9VkJ4!>{2s=>|rOIMOB8wS3UH79zpD`Q5<jdY9l(=w}`cZqI(O%
z+ewZCj8FryMo+n7dEY7e20rp8!4pY=3Nr0qPKY!uGCA4oIPo*jM9o;4>t11%L(i##
zI>$S$^z8MLp;g|=5ImrzbaHcp9p>Y^IWQ1<Ssu<YF)?ULiJO!-Cen1oE8Z>B#8Fg6
zoWtY4>z^i}2o*H!=pU<j7z8C1g^E0W4UDl2ti&mz_O?9!)iQoMamB6sKh$wIRs~M|
zFmDn$Ive`B{lF8(58O7lO>Qs3s^~_x5WW?{*HvL<-#kE^6sY8&g5nQ|mU$&mT)0(j
zAJj=37PRXkpkm22E|Z(up3xIz8-DY1Lf)8O8>{=J5XivAGip2OoKihEe2upl+YP?u
zb~lVB9k@ooE(+h}*nJkm%?pCr2klj|mF5EZM}D3_`1a=M)r(kFs;J92t4;Zi4-Rm+
zE?(uwJXO&sT>{}=kJU3=ejL$AS0+v*q+Z5#DT<M-<-ff&4TWX%w}&SFdUn2*CBT@o
zQhDB6{=L3eBQ_)oGSA_UnL?l$^&}cSqJU>%p=d_Bbe9*QGUS$Zx|5*)$EsAur{l-^
zdar8TD$SuQ1kyWQNAoR*?(u=bUVew@PW@s^p*ju#ZPaq2>Dk%YgvUZ$1*U6-!|sNi
z&>=SRoZ=b_>wG#xDjiK6803}!J1lsqx}VGA##V8w;XCasoI1sae@aYsvQ`FH(B180
z6lqzx$nP{Xn3EM(*XdFybJxlxQ(9hUW@6&g38dOAPS`B+>uSZbREIp#qi2<FQ_5UY
z@ZzSwpEFg4SAO+~(-#G<X@xGa6TY)U&noAYvYsA2)90T*7^*kr<}qmCV%#Kdae~+7
zZo+#RZvWeYW58w*t^Vf90J6quZ3J}J$&~PX3;V&9ntTW4TjXz(iG7@t+#i$4PZMR9
z;QMX2azp)n4T6bqz*7Go9nR_3PLyxgXOl)oC`HUZ8&z80Y4+#RDKjsgP^`5d{W-2!
zqgt4h=yrB$lJTW=r7znBE%9W`vQcPR!o=Rt<;=}{5lh-nfpgDfOUBC1?aeVy{+edf
zU68<d{o6kGJy!Uu2+urAjER)AG9Ef_Zg<J<o9<?}(nI8A^So`tm8<jFX!~`%%o0vh
zv?bLexy7c}{16Pk$nmcO2+QuYB4dHKZT|g$*LvdyfvL9(t<H$9yR(loW74I#hg|G%
z75n5jPl)LSJT(Aoss(|ftj_ZQJKOf_S0Y+-y_a9CSi<=;;g;`&<Gr@@h~b<cL!F0-
zRbKGAWOgYBKmY9)15lAf#oi)~ft7V#N21H-KY0C^-iIH7RU<o2SJ;Z28t2-*@nd)7
z#1W1uvR?L;32n#Wgx5R!n*C#n_Tt$QJ{RvxrAE`S8Co=nWUN;GcssY#h>!oWp-+SR
zYl5eoNvW&LTBBn0V4G>b*xu^0U!VH*>Yk3zuWLK(#uDG}-Y~5AVIuHwXGfc|#I6>L
zot<JgdA|E5<D)IrslH5E!muz!N?&P>BlpqVHDfCxm>1Gs@aNl&ckig<?3j{{zu@mF
z5@W=qvRhXF{`$4AN3Boz;p+4{lZicvr#Qkje<_i|o_BxYlg(WrFCNr%V=%p>M5Xz#
zOSJI`ryp6lL++r+sRDWu%<m+NN)gZhf~y#csGGGr#&S1h3b%6lEwRa_(iSe<>loei
zr4vAs`S$=L$G_}{nD=mODr+mMXcU9{oXzvwLZ%IgH}Ye@SCE(az;kV2cuuY7p)VOr
zcdj-3>&Z-xCtuoPI-A1oz*@H@*G`mQO0kP~F=xtOa-OaG+lkB>vaRWETX4#PR_2Le
z{p;>BKKmSBsHhKbnV<ba1vgb}XUE%965mgi9&R?#s4&<%@;dDgKAiTChm7j-2me^Z
zPg)PFUmDjR%Jmg$Q^99sllt?+`{x&_&cF7bsiYmF9aa@~2@}o!GL+9slfRvHYqb5b
z%fsb0cb_ixn5uOboAbSOVf}6Yw@5^X<|_E`1$(F<JAhaacl+yHXg8#*zm~NxU|zt1
zG=6L$f&^&Eu3HG}Up_YR&~tC!YaSkpyg|X8y4%en^lLtAsh`1D72qxuQ%?gVFosQf
z1bEE))v#E?3y@-QK$qoyAln~XO7!TFuN@S%OYg3Xh>os!`?de-qciu<N01+Z*CKb3
zWYL3(0r1MNkl+*%99xj4><cPSb#j-4<6G86@M`Js&E3DFW!P3*FRVxW%R^Bpg3v_m
zAL1_?{kz~>_^ATn+C(Y=J{D351Z$8`75Fk(?$<rJM+PvKuE_hR?9Eh=i44-i;2G`Y
z85$ZIQb+?M1LeIvbX>-v@fsWxHa6!;rT`8+PjBxrASVRZ-GU@iW3vSwQ!*?f<^F5)
zw13C#Zfeka!^n6HiXww(STccN5i<f2ku+XFF^q#F!IFu6qg8~Wy4qWJNbBqxlGl^g
z0;pG7PAYlc9n^N`&CRQ}ThPld`fF{i4a<Jd?E^j2&JsL7Irhi|eKxfAcp611K18o%
zF|=7tlH|<2#eY^G$59SJ=~mYF(s(|>8#FSc8OD#m!nqTjI1t$S)MG11;3}}DRC`Q-
z*?=cBr(`N1`^gfM>Gi$7EIPv@Rm|E3YLY5l+VxWGS?5*r&o4`q@$F%dXDrF35&nF!
zN>@#?2&z>ebtDThbR1E^Y^Z%nvwby6gJUGaO!e?2!|dZ*xo@3Mo(}(Ur|j|7Opiy8
zM8l0((sIm!JHeIEgKtaNeWG25=HVZ%w}E(TS9guEJui*84+t({;7@dn+2)_8!_+o$
zr^Tl)q1(T5CeC+#r_1&IQ-D}WUJaqL1_uYbs-ihTfJ@ugUlkcgpGG`D#Fm2qON3h>
z;Pee|GDqf!2>noOkj3LWBWJ(I{@J=q!<3JVtq5c0#PBSTrBH`S1AR<vJcW=dC?-y$
zW+kd3qy$55+$j7Po3~fYM5(_+(8GZa)2)Ec#g_)}oiVqN%5Yhy|BhXAQ}l$@*u+GM
zxdaw83NxfYIz!9yj4MIuxN)@(W&X;aB%0PgNi<Sn_M1Cs(m)pLUVFLf!Cd_V#$&<<
zZp|muZ#Xg<u@&CJ<<Q+==HUgD*=)GSfKW)}6)0Y!jSuj=XNNCO5`kg=!Q)KSN5JMz
zBGMMTZ@-W3TOqJCx$`B?mP<?&Xku>^6zvL~7>Zl$trQs7*B&(;Y18&ITEt~;v7PZa
zIZr5S1me-JNS|oUiaPq_D;Yh39`6YvTd|*5KxIR8>m-|nM85ocMuO-mwrEdWAcYdu
z!R5on?k?ie0X?_!70o8Qm1|usA3fL{&H*HqmLkv?xc%<(6UxnTABh7IU>Xc^%Lkf3
z?!l&?k7QoJQIaHCT0o%xs`a#baLF>ZRoA~n-cpSz)fZo<WUl<RYoa}drd&F=E$z>#
zs`~e->R5c(>}YG292TlIbcWxD+HT+78Ip{N2rvgPjPY>>)A<EziCHi!BoGAVyCh&;
zIx({OfTRab(FuBovdH+~e4?N@)w8^fwKALP6RUIyjrtiey}|x1m-jz?wkZ1CC11o^
z0CRjFAMu0J5{=0=U_#xmKAU0~2p_Q+lV}b6SPTjHY*ixz&k*j^W@B`7QZr(B1i$C(
zzMQq>^ZeOl(IL+Iyjl616LPYzD1OG0Lt#_S^jf7%hPsci?e8bbC`9KpOowxmVXOaV
zn5irDWDl)L^U`iJnj3U+fj-IsxoJ0*&2zK)Gv=vh^sakN2RP7>EK+D+QQlR(OZx=@
zY61=3>~Lw-wtMK1F(R(~U8i<e*tpiVU$%h~Sz;TI$mO$N9pqBf6QAz5?(^uRQ`VP?
zv<d??Y-I!|-HQDb(asOJ=3BjoMv#L{hWi0bzHW8#-?NY6Oef}Y?}wxqfAOt8;q;UF
z?7W>=`}SGBhOgAWx}f~8sjT|!nlym3(Yjmp?X@{alCyyOIzu9aSsr{t+y5su+(Itj
zm22u<n$E{X-<ISvu`Xr*NN1m!;nKqb3FCT@swCVQ?z&nGzM(?D`zNHz)#R5@J|*G(
z_5QELo|A53u9J<km*(%U^x*q8lmBAm!)p_s&rdX@xAg{><%<QftHl{X8@2bOL0y;N
z$_fZGuiIaQ=;WwYhun^?V`1x*QFtq}{+PQ+?z!YVk6)3AmG{@}l9!aXa5gg<oR%-N
zzn!UQ@SSBdJ5s`JNwNb;em-i3_#QIn6i`+ql&CnZi1Y}Mce2GJfl)R2KOI(zKnKlu
zonw5;)LxVO0u6`LUn!Z}-kWIkMteB=7X~L1cRRq?65{hDLbE*726fKAkkE?bez75t
zeM0kT^Quh$Xdk`Ew18rpklP3>5R2GHa{NNqUH4@uyDsj6JyY%PSP{3UU&Kwb=rONi
z+M8XIosRCwC%U;-8W<v~n4G$~eA@c_#MA4a%#5&R?Y8N)qb%WUtX{G^dO|Av@x>Ou
zLL`cip-c6@nSE?(B=H)c2X%X2pWVw3&k4E-Z^e5AQEWV*)tvDCm(6nhw^zh~0Bsd~
z={FPhv4;uQCFHIhUiN|K>TL9x8zBYpuRP|x!vhUgf2DC3^2U?eTYHxVB&Y>wWAa09
za*ai2f`?cn*f5rdwt9JlNzGZbeo}t3lUn5_$w3#qD|Z_Gmx45VzKAcKrv1|rsw_vd
z6o(vv0+bM#nj{PwvZ$q{<v4EF!Fzni(1H@5SOAEZ#;t~7_6hmBDV7a6hbTcTd0FNM
zKk_+w-2IWd(cJTjRxR7n$t_*tb~7>E@kee5G(oCNM1oK{q^D*hFAAxa?~xIQ8i!1|
zxNaDJ(4wZ8Ou2$*s~*cXd`AD<E0W@9Rg=ITs3xc`Y#2T7`{C(5Jl^^sEFan*8jDUP
zgFPUp#$!{2>*?$wRkI>|zvHVXB4g>#7`ABE%_^uKy))Hzy=BD^Q|_V^(||`29S_s1
z97aYG2Sp{khHa<huWiqX&E0#gbLh+TnzfdjAh9J`RAqPXVZVC_GL(b`AQHnF*}Fu+
zN!&=tetBZ_>M5@zN7<tolRH)RF8Tcw&#`6ivL2ednMue7Oh|nqOM}w(URu{MP6vh8
z;T)eRtS<z`9zO=qiwe=>S3#$`z*+)Fs^f$}6B(5D3(nL^KKvSA{%WG~hHpu01UBGd
z=n`X4w-d}Z<4+uTfwrG$`*C1>8V%Z8fUq|(vBgbIGht(WN9ST6>;1NBQsk`mOsn=-
zhyLwBSu4T7^1I!hEA_l?VyL6vlgDv}Y2~`|kK0E))dUN%X<WqTdXH&!YBPu-*8y-i
z1wjoNCkH_vNgM?le|#-Z*!S|Nwk+zmZGi!1cbwcLC|UetdEQpXvzK_=-h6D~q2#vn
zjrzL^WJ5qKim!bh0uQJ|4`eq`VUkTAXcCYu0SWqhiJ%#aLCRye-Rj7`Z?Ep~F$s)n
zu=?lu=?ybvjBrl+-JBi4O+Uq8_6QimC=jYJc-2|>m10B&!M>4T%i@O6!@LV!%iO&B
z=M>{L{pY88IO%Q*JGIL3>G;s?^bct+stQUq(ahqk|7JT^oMTck<M0oAj8pe&_s_?)
zL-=#={q9>RZM)e#yLuu4LLR?t6ZYNXgLfC*z`VGcNf71sp>*Y8zNmNFRY4iQ0gG<-
zfM4GhcpbGK!ivcd9g@KRY94Y5ns!vpX*yNq#Ac=JuLN934o_`T>h1*t``#TpsE}N>
zVcZC&FTLc?dRLZ&37dG4nqXqyUw>}+={<(;)J>0|3fKklV?rZlL`(t40oBnt)l-#y
z0b0`<GC&lf6H&7m;z0n^E@^-BK&sc%e>Pl{Tsy;;-)}3-@y$vsYaZK?QWi;(&~;=n
zaLB6&Npl$)dT+9MYIdCtiWEz_Uf(M|mg{4t*v@~JuE}+;<DZ+Pemb6Ny7_CzL@AX+
z?%CIFl|gAbZT0;x%HNmZMkAX5k29~ltH#zXBF+5n+@Q1jK0HUs$cCwSu*PCIoW{MM
z5a?TBUJ95XK4D>D+()g)IupwDCBLMm&!pKr%N48X`X@cc)Do1guW{@Z9Pgt^OUTBW
zhsvV^qhCSRyvBNj1+EjQA<1Bh6u<Pp!uJYoOsmgbmhgYZ<590z=kyDmUS4Bx?Kx9s
zRiXSD-GB{zql$KMSsAL*n|N4%v%khhHQnv>H15LOUf-r}#dzh|Y+MdKLQ)`#oN9f>
z!PemIw^dA5c5PTHI)B8}ZL11uoU*aaTY2nE^JhL7JsCDCZWCwg*RyiLus8VEB&oj_
zVu%bYvG;{HJ8ptLp`B!cd{Dv!5*!*)+w3@Mlx8;nSNAFziGWg=hyp&vU(h%(BFmr1
z%hR4MRmT6AwO;x&Hq4y4X*>At_M*xSMU_vS39u2Qp78beyMo>%855(Ba#js{GW6tR
zR4jUc&fc%tJf17YwU)fRr<W+OSTL7LFC0M}KLXnuXeptWma<UFF6|7I6gI<~Cnex(
zi|t!FZSVKp`HIICEdnhGt^mGBOg<;Syk#IR=n#IR8Yzr2*pM?n=Z)p?aIbKkOJOiX
zt9zj?S@8;^Cwiz3%s>dQ0ZNF(*%R+N3PA8Uwb;th4A?}U1(TxhhFB=1C_mVkhNC{R
zmn}~I-&0Kd`v>+W_WF8^XnVLFr*toXgW(K3_P+UsX4|fWve47tfr24&9OB-6P_ko9
zQ=x!<jV&kre@x?QB{@d*kr8z!=6kOcGUdCnuDU4McKI?@#0KZ)K}`v<8=hj3bd!T^
zYPpWW9lm{S-xshhq`?u-5ut}r=4ZgwLNp2H5>yoRMOyRoyX3L+VJJ3qRu9i3$0vN?
zcXU^pHln+_G*8y?k4Bz$Q81t3qR(CQ;`JRH|0l}jiWgVqEl65t&Acag`P5&{JI`jv
zFV^_Vt2&guda)|!0~xl58&5jqEm_I5QTwlDdM}#o9y6Q^pa&tKvEl*azD4vJj;GIF
zRV|;LyJ;r9Ig=qilflQdCPlY2N=m9t&YqI#Z9|Fa-r3&GOSLlB>3q4$Ov7P?tL<6w
z{at(4={lZr*~}#~(e?7$yJ><<gdda3jz|Ebk5t$g+!!Zh!`qb@W#PC;0R@Hu4MY94
zK<m`Z64l>{Ogg$Sr&)_fui#zz!iMGSY*WcHPMU<`TR)n&-|f3GY_R6J@9LUw2K3E2
z;m@YdJKdS?6k}>DeBUzbJ?Fg4gw<=9aca|!2}emK2`oL%ceYlZ*JQIJmaah#1e!rf
z?{RxVsv}s1kR)hzkSR=sa7KJigc>=kdmvKzo_M{$F;|(&812-L2ahT?Z+`Z!Ax5)*
zLi|pd#;~+7*F8P<qvIU*Ji9wx)|YW`S3i}mG0%|m6=e4Q99S9k7lEyBhjoX2`L2@&
zfLIC|7tBZbE$&WwwgRL9AvlpanNqj{Sth>u9GbkW{O59LK6=$h8un2O%j7*&zWZVO
zsi)hOm|4Wv4_)8c|MY!~@oOeo8B=^KO(ox5k-G!li%;ahXt+Q)i9z%rj~e|59MC!!
z_uvzlRHr9SN!hAkDEEAuCx>T6+AM{eUTMjW)@Vbitw@RiPfzFUC2S1Fj;PZSxa?km
zsen76os;v>%WlFIxe{~lRpsrwoDLO^W|ICkxwcuKGGq^qFZY-^`TW4@^4oJ4-q~J}
zTdzfa7~5_WNheJxrBLXRc+;fFSQt8>K_ET=s^*q$rFVfr?d%)3&fr*_RL5X#kQt>s
z;eSJqgOiSq5~v$@R!24<R;s;O?5k{S?l<MK?lVQlvRsxn2o%OHCy|clN`J<*mPv!y
zqe8UcUKq*<M@)(>w16mTI0_|TWnK+p&Ds4ZS$2HxzDtaif`5)xwgrB=nd>;kC9tzH
zd1+^R?hl6{qh}xZ_Rtl4I+ke3)jzk2;uh%du3E9By~E*CraO<cFV(BKpz{NHUy2_U
z#|~e7y|=UN^Fjdr7e<}ilkJ$VK{!3w2$9mQj%yBgKatc>L24R}Lplooub@CKvL>s7
zQs7np<$lU<3Vf(PcrYe+pUjFYTBIu;VAd9r8(DCA$<>#Nt}~4$tZT$L{Jhwbdjiw=
zjSQFmsHhl}uk!Snke^fXJ)67Nu<TCY0@LDL*&Az5g|&>*Et-UC4G%jN6jtpfBgBh|
zv>7}2VYWzIum>R>A$%r}`+6vSeywtMTXs__*kn#|WtDZ@D>PW;l(8pp<zg@qxKw^7
zl0vKVfR5diuvkRJaUlq0Rtj2Fx5Qtve~8H<BRWncZ$G+-=0ee;Jm}?+_WVHG6U1Y1
z@gH;&ms~O{qDq2!GY3<!g{%o*TN#I$Apv2rS>1KE5a*fXtF{j^o)6G96)|Ns%3_+T
zSf4!@H9$G|_{RKMh0j&a+DwKad4ILf-*oxH8D`~De$!slEiV3ucGub!?6eAVG>BW}
z7ZGq&>6up<u#HHcEBcw(yK}6kMd9k>l^=TPmYPbGSS}CKDtX`35_5IUdjI<y5=eHk
zfy2zo>VY#G58u%<pwDE?%snF>U2tcqo=9k!*NK?L7gm2*O)tl!@>X=xg{|^9UCrj;
z(S#V+Wdh+m+*op0%@<pP&RGd{$e33MmKqdfmAl*6jegF~;LmZO@vKno^bdT@8dFb|
zn?)_7yE9Xhn<MSqgSe2#nGF`>ooh1qzPGcF8U_ruS^1dbYDcN$J*)j`JUqNd<k_dC
zbDUI7N~Z_SgmX@`%u)JGf6(QBzcoBF|DjAMyv)i&*cj1A{3e=ee0(`U7FNq9QFYI>
z_fg8sPSwnxDrYrW+Awx&{>21OrPp$n&3eMo8aAi4(~I%Cx~(K{b-{n<OtO#lUGw!B
zeu~{qW92MzqdToMR2$|z6KC1KZl(G5U0Y<{fpJzoKdUc6HTv4nUbTI1ty3-(L(bX-
z5eN*cZ{$~E8S}N;&>0_BYoWbje^oTy!LwS`#xqNMg@yfzN$(WxSC149Y&klpHcD%z
z*)q34+{NTetm$86RdXY2I_$0!pckeyc=o=riLAJpnB~s@q?Y5;<>0GhHVxNvD}}X=
zPZ-cepNq(N9^rtP8H_pz0dTnw5q7ABHPK5%Df{O<Q(ewxxalL;JynZti46B<9<K2#
zjvZeak4g&MHGTiNYWH6^Shpxp0={tS{3Ul(+1pNft*qllg#}hfEvBPJ-DyT(|3GBc
z^aZ-S5^HP&7Cp>Q6qen(oSg7}M7f<pTVWP-GjsU;1xnF3VWCIflLB9E>I*4lv>^-r
zCIom_B}PtLa1kpRQe2V{Fo|}Sa=upW?e%Xg0d^&oCA%i7wpDCK;6;hv{M1>m!MNHV
zdnY$8`;>FZ_Q%G>C(Oz|`l!q5{dB%@cEQ0EzWMVR^B;D4S=1lAggpCFS20~O4Z6zY
zH0*uuQg8-WlYCB4d)bEJ&M}E+q9#g<e@3cE=YCgO#HM-n{g71?L?|!}#}`_2Tv$>l
zK|UXJPp&7-1-^Kl7`*y;>oq%u!#M$bDR(Rt4oWdzevz7B{Dg6<H`934!;x<_<lK5B
z6f4neGPe>z7<e5?f0=hCu6=+`w@Q0Xt4aO%js^~jhn??@{GjZ_{`E6nAH8=>30HQz
z&FqY_>E+Horx<{bF@rft3G?I7cg8=Cy9Ze>thhla5}kn?+hwD3l~+(?bAFic-uyGC
zgcZL>&(?~kZh;NFmCt<H8_&#af1FSflHc*LEBoZR!)~`+Hl3pW{1)l+P*|@CTPu;9
zIpxwW-fk%9)-*CKDX!)?v-sY+y!XNuhdd-qnjPn68lBHwkm6s<&i2^JOSlPrPU6AM
zWYQY&2jEx*<`jUC4<S4tVnV1kS{m+#o_qFl1SY9lwfP(`acO3xo8|4Q->w|`*XbC`
z`IuY}jXi3+3(h?5DBkcjy*cL4R#8g<YMOfm_6iLLE}hM^s6EMS&qJ3xU*l7`UoEDf
z_i!TuxM=PGtdZumrvi?Ibkd?napx3O2Tg)94$h3$A06w-uK4n$(zq+zSMI>GrQN#o
z>b)r?F)Mz(-N~Y&g7DK$elp)<Xx6WieQ|0gS<cjW*49kIc1^a~TT$6jsY&*bm<h$Q
zk<XHocJXq4#u03K2@12*N+!xtm+96CXgW{F+7ko|x>Bfe6iobJ`k=~Wk!ABNZO*aR
zQIAVcl?$WZk#ll*LTF5SqTjPBIpg4DpYZVLw!Y#fIT~z{txQv!daO^HDXMnH+GXr7
zy<KYG5bLi<?ufwU=e$cx40i^(FLPeOGH0HdWg|Y;6YT8dM9n<2V)WY93d$+ETuZ&@
zVqGFsYkNBKd@_8?cyeV;>$e@;wrJ0`)3kwA$-<BGdJ`x?y*;14CH=)F>@;n52qLU4
z%z-35jm#Y-$)b3#N$6ms6i$iZEJA>gEY4C*@ywhvqWpz(o|GXKyUMn7AN$KH)Rd5O
z^PfU$FEI3N<2&IuJo#pc{me>tUk0hBf`>G<9tTxzn_qP%_R>80@q9`ozUY$nC4~-d
zmm9^oFP$l2c(c-V$H5;Q+{_X3awa6F0opt$LWMBrjikN-D2Kg|a<8<gSBziMpElw2
zZQ7>X@O_ytr=}(+=A&YddfTXWtdcNi-#-wp=lId-+-s)8b95XR4n=Mkca1sGs*>KR
z%zg5xfMrGRsbshQ`Y_18mV;sWO;-_lW`bt%!hs3P-$~Rh@to{7LNCU=E2Dh=am>Y=
zS&Rv0xYqKNrn;_4^;GU)Ja8bTQ;L2{xMSk}rb^BommaS%7Axud=uti^k@#ap%J%yw
zcIJ%McC2_Z5pziR|5R9LN}#m*_W7lwKH4$4zFbxw*&XPV<01P)N!W>MohZa0B}%lZ
z+UeswTwp3YygjCYF@28uc9vciU#bV^=ne1T>4|Ai`u=FU>RVI&_b!IYtXpbwJ<IE`
zvW(fp@!>O5URO=Wcy1VaEiVohbetCmx6v80S`F14Aq+UhZ=HI{6`YU!ChEjl|0~{z
zaX{I8E@kHm&FtaTiPp=zHc|&Yi{=*!@0%1)Oq5v}f9&$@Wp1n8eNVLJ|M+qMBvxTT
zwL~H7_KeH-S=p$%jiO$@&3IkduFb;9`{G?dp}}(QPF2B6bC|kGGXAiC%eqjA3a~S&
zgs&44()7%kX((u!0TKa_>A*k}l<HBCY%gIvN^8Ov7NQNZ1b<=oy$T`$A;U`G?7-Yj
z8qzb8P+}tPL++mJru{vQ<MDE-yRVDsJ=u8na8Qd`{ta!5T3V57l}z_I$Ma7wX}{ZX
z7PPs`bmu+bJ2p7wK9%emvgV>idXyEKTojW{*svbNIa+XWFD_)=**CJm_*5ZRsXk+z
zG2NAH`qM9?rC5RvOF!=B2-C6vpt%sHZ{H9Ofh}+`bHAAZ8T9gn5OOB`0Dz!NYI|rt
zaTB}1%n;8IiOB%&`(~IP%8UDC=YX&+bF{Wr5AY&<GrrHUn}NX~#-7ba*Om;G?|Bhm
z*wGf!QC6mxo;$@o@!D*Sn9$U1=cP2CvZ%M+4(3@RC2h(U=Gy*Up@9kp;7TG=Lp@1g
zVQ7oNQQiRLQkUcFjTuKMR5iYNdIUP&z4nrmkNNXumHT%oNA8U<8ivfWcMM+{eoJT5
z@F+CVTJpOwt@W)#&!k(D&NB+LCZ`sTE$-1)XGRJF#)P1`T;k!mel}qo>>z|wV;Gpa
z#W8N`W-)xexV9{y3yPow4nPoC?He~c=)|kq^I5sPQK=+fLrNST^I!xgz=Y5NN|nr-
zp&|wsT#LS;5fD{K2;_jm`jmQUbw^um&StYiA_o~>@awipvxuF2w!3Qg+Ijck2Rj9B
zUzzfJ;yKaOu1)DV&c-I}tSP*jq(Z<A{0Q2o7mO-ze^}1Xzu?g2pRtZpavBh6&arfF
z-{#AE`Q_<_j=Ftd?_HPO@jR)wTVBz8%ohsJhX~%v@BpAe61jz?mtakt(tyhn-4m%(
zkAFN*Mlxc8f*Xnc7sQ7}M7;u%sss_m-2>Q$Jhte=pwVW5YpM!3IhDx12j^O*kw9b7
z_vvj2SLpfk#8)@%ee~$jY5ub*+`)28Hu-y4U#xa(^7(SV?A%*%8-+=q%Ce=2jx1aK
zOCIvt$F&Yp4i=o)ka1e@;SY7e_vj>}G1`OZ4lp<Y28nu6Gt7g4R^hE>5*ZqA8zTJ0
zM2_)R1l8;j1)A%gAx-mU9hts$v*sOx42N^izFcH6&{XTS$j#3<?{}HhQz9mS?Evg5
zQ1gvcoMI;JxVP@7HV1ghG~xeZc`=f}>MB-KgGm6fY+@qK9sDZm$0uXrqd?n1)sFEW
z>3&d}Kd<1Of;5v`=7h;K-QXU7F-henY5$pgw{$JZ5(_4e^&|2uO8hB4^eYn_s*Q$J
z`Qip`LK?0FwtLkE8kU+-zwwV4IUTAIe6lRoe&R}z`%CCBlQ3$fPmo@Kb(@R~3duBo
z#?{5Q^j&uc6--YoA3S;Cvepx`g_=wHa^NQa4qnd?_JrHTPA=2K=cQdA>hKv5?JN-9
zi~Nq4ize?Va9~~&?#0PTYbL&TnH-1@Bw4NZv2ZY1{2C(ueS9h(vkz`hFCk_#u~S`e
z`X|5MuolD}V!<Ey*H)htr9Y5MTeNydf^GN<@1KIRb4$KYe&UH-zhS~xNobb#`%i}E
z!{fD)34JO~y?377U&ba}CTJVCctq;bc}2-vSEQAh?Qh3P(Azg~=sgzik76*Dv+q+T
zC`1sGx13QfP5Q}9zckgu@e#Z0&;)v5x+})`-9d~D6>HX!wK+PLvG%OphY{a+<t9lg
z2l)ZH-;wOE%l+9Xrtpc}gQ`CCL`hSVLY+@ocXQ4nCa*K;{EFKq@;QzCJ!$rAJ-e}t
z$LMQZO-ZVcxaXDo=g(PDJ$6klGV93wjPwZ%XHVIHzzkc6v2D!xqF&7F3Lf$BQ0d{O
z(4AQ=T(w(c>_*`Fn!uu^qmfAo{$tFGZ!gLdpIok2(ZD9GWB9F$%^9hSfW37gX9qYM
z>Q)d(*OKJq$h({G&B7H|Ap_O{hL8=9WGS(-vf{l8^>w#fC%EA2U<A6k{&?+q=F?Lx
zRkvyUsg-9kvmIu$i+BtZJ}YK;O5ar!qqP*Ml)SBYRn#KwleaRzOSi@w{xjz^PRczL
zwgU$*eZ_xOa6VM{hjRV03#U0Q6xrk*Eqfr=A4Jnu7?t4E$3I-gRMe+(;Z&8*J-W~g
zYb6d(`}JzOcO<>3rTB^%ZMwg%Cgvo^Rx@*@J)SnJS3aX_m0R)cZBc&mjY^fn{N4=n
z3Hlob%x=A3@AgXP?IGlSl9X^Di<Y2drBAI@{CYWvB<Oe=7VLEUj463L2T8n)i200K
zKG?7+m==h)3(qo1v4^Q*3pC**LKZL<^&|!f<1UcM-WT*Op7+*S<iB_7T>0HNE=!?O
zwK`ha|Lc+5{&Dr2rZjPr%NChRR}9YhRDO!5@H!dDKWuYGdP0Q0BWLER&1nyct!a=v
zXSOS3-LY2#`m*UvPhC%|8m#T#*gwaZW6u~UeY10&ppX~~hvJeOtc9IB*Lo{WcCNnJ
zLOu7YD5iDB!gWScEm*bn9c4#CXu}9UeI~Q6PMT<&T%r9~E7RTC6(+1kd;TtCrKH{2
z)*{ptxigp^Os0@N*;h2KXox10aivHeD8c?uE!o~Oh_F1l?*UMQIylsVU=}6ZKQSa>
zGy$nl!5EYC<xrn5CYKR&5cms>&Z)$98--!DB&rLwgP7tOW)4oKy|e{WEyLd@^zNPR
z^qTNj5^GuMRh9lS-IA+Ij9S|?<!798ThEbd`#^(rce*;St}`p<i9V+x5c95#f_(4n
zhylDCs#7wi1c8v++u>ya&a(?Q6VINYO;}jv+IEAla|u%!N3xE$wEI(2>MdJxb$nXZ
zRa9ElyRhsZu#7YqV7&eDwDyWB6`hn@hs~nW^V{a;6%L;HwBxJ#Sld#%=#+COxajCO
z^AeTU>T0?)<ny<Gt<g&klbdU7i|%-N`;Lxsle5SR-Vkkm>??OI6{yCgy(2l4b?%J}
z+11xR&m6mK(8acL_3FJy<Oc^U3=gI7nl*VA*^oHl1mJ<V#MbwN3u3Ln>1^@Iu(Oq4
z!4~%YJ<^3KHMeV^f<pYz!yTs=!B2JxUM`qO3-oyj)(xXf7IfvP$9SOaiSwWHRGJ;$
z$+>H2vEA;%k&k+JdDWV?Dvz~3Bdy5K+gDs}NSIB`bc?ziyk5?`yqw2J=}|?`u=<gd
z`vdWE+%A}y7wWV}xCzky^Lh7~`9sTqA38`4UbIq~TRKoNdVQNCO|G9}uiKT)^Yen9
zH4e>kqtUz${$gitins{f1>8|#^);Qjd~3>qgs~>o*+4(rV<9~Z)y5)+S%j<HeQ4Lt
z3(oqv22Cw`GIFh<jG~cql0tVyG-9pL^3m%dEVpl_TrR$FA?UX0)}cwe=;70wHyf&e
zKdkP|{5&$zyKeTdd}t<}x}f&1%RFUZsI=f4LN>Y$5E1E$neSWp?L1*eAT!KB`r5)R
z2wrOhgW>fNvy5RoUyr`Ws$GJS=hx7=2t7N23*LY_i+1<5G7}}MIcB3HIfI;SWsydq
zK1xDnhmOh>$0&9T?;8`MBBjc7{~{E6g_cQrU_ESyj1~Z##=sKej9KB8@eK2Ay~hon
zi}lAk=un}e-THUQLOIAJETcDF&*J`>rBV^~A}PRiKG#%z&OZM+==8G))0!$?TE~+a
zU!AVg^1KKy9hksC4s4`Ud05MkV+OU1PU@uLyhub+6o$U#V~9p5CQ+dgutoj4$`O_g
zK3*Eb^)KV@*OXjto<F1zT2rDpes5|yo3rHOQ^`d&e5=Hf#RNkemA3n^#H34@+?r!!
z=@ICn&rf-D{XEGrH{X4uQb+of?$_z{KJ4^%ZNZ;bm`^P`!!+pv4xyJn7f+qEV{1(R
z8^kw}QB&NU7YPh-&Px6S>x=LtLXnZdz6kU*;XVK0<Eu3Xf38~T2%K2+%?Yi=844Nq
z3p?j4?yXx<4*80WV}8zSiI=O-wwddu*lrojWrB}y;q_KsQe8aAf{QiAVZY?-CPQ--
z-Qn@T$CO)eau*fSS>ErjI5L-8DHZK7)meB)&n+X7^Hz5LfTH?4;S&ouJ8*l~s~hAS
z1TS3pbq4wREzY%a4VdDPRG<uUx=+pDXiL8oZM$aj+SJgd-S1YO@EZB<E<<Oc9eV8(
zk-4&!seb1^q{e5h!ylo|Cs`Mk*nTX-nQ>awfA}mNsk~DZ){0fTj|Pr;=SgMCb=qVR
z&_7(RH~)xu{-^krqTv_%icGv^q5*JvmbCt7iA1hh#yO>R7fSDI#oC8^IVUArt%+${
zs_W0XetA^K=(zPc=Af*HRiVsOPhEr8Rdisld3E8Cdk-zoAzJoEp^H_ti7vD;O-r&l
zRi}j8E2WP+8msB`aGtA-+`jILgy##o{D*-rE+exX9m`m)treT+;@4RbqTt0RXJ$Gd
zsr0ABy}I8qdHhK&i@=G3e17{IpZl%nnk86R!~!h*RpIM7gr02H<=`Bni2_T*SOI_A
zty2jt3R1nlk%G<p?QJ97rg*N@@ZbNn!+8huKO)}?uhKx-R|MlmO4d?R*~9Z}jx068
z(nVQlc)j*1o#jp~_GuB%iKqhF?%}@Wxi_b~FZGr%y;K(0DgG{T$4{YT3pm?9b!Q-i
zp^vhuqJx$<{#EDh-$1`+?hztiBrnY+kKL2eqmU#xfa-_exOSBA`@2#G*JuCTR*#j@
z#M<5z-`(77F)S2vLC1i}$}p(Bj2W3i3opSVazD7MaE^5L^w90V%8q^Ax1by)5q$Be
ztnn4{+S+bEj`KQyXUz<?BDA7=z_}7(6(PwmaL6Rny=uu{3-QO~8l=eiYNg?DOgi>n
z2$WHK|KZ2=7=v1$<EsEi<^z=ACXlUwnAL+<$#4GWDe$JWc{m@BAxRPDNlTblv2`JC
za3!(k<CMV2+LI$;<Y$wY#;%h<^Dv;Z9#cR8&vX`Xnms^jR5i=m2C_YXE47y|!v|1@
z2y+U)M=}eXigdL&X^?EsiL?)*7TJM%Cu+O5G@Od=nzIDLBCjtzz#Q<?*DYPO)g0Un
z#`@fb!G>fsLg{K@IFUWk>f-Jp{eSGc?uERFs3LsBwY;kBQ=1;9E|68^TW}Bt5LL2e
z(m}wIh{Q@nzW{KhH}S<Yg$5pgUJwoGA$X1o7cmbhU0}824!593O+=2eZOF|IMa7mX
zmK1)ve7BjA-u|waR4ut>lX<`ItD4DMFhLW^2R8>aIA5<%t|S3hWYz=5JkU5HGLH(@
zLrcSS<c1<xX$3obP<ncL%P4YFFjnh%Zb)#jjot_DF0W-K@?XD+{OgBS<A=`8%|)fr
z45*+~D&F)mOBFg3Se)p<fGx_i5QZ<h;kg@+==|?~igp(gF@C+O+wqlg<jZ>B=q2Nv
zQXSjkfCwicBCffmYJ}Lksq6<eE^s1@RKLfM49P_Mo;b(1YSkV@v%FJq{k8D1NtuiJ
znrwYW&%kgOU@oyILy*1?CZ@jR$r80r{?*x^(aDx#l67HbeO}g#Xp;4x4-xK`ks2`o
zFC}X2Kq#^5lCAghdG~KI4DQr}ks5wwGP3~F<A{MRx*Jy5`=~wefRvnQfdN?`A$-E>
z3&a@ti7&o{>!cy+;~hkIL~<pHAjA&93WPYmP*ec$08_ATZ7N7P4|gX*(n&x7^fW7$
zEo)CS1xtxqg9WQBMQQLgjOGwk!hM+`we#1wMtoaNAlJt53L*!w9mrCET*}c|HF`Wp
zT^Lt~_df&OOGZ|N19E<50k%WR5r$(9sFQ6<76~@V`Z?Z2yzuxPDTEThVLS;rSiEVr
zJPjR-tNPbJSLKTumVGp6g58&S@-36hxq_?UKuxa0Kv$x!L~tvmzqTI}52ylwKP6fg
zF=lp;#M+Y#3c!FQyPWtHU?L@=ArLg%C=1RUEcDWKc~~>>r_-*%6dy=r&tnPKZ$>dF
zkLyN(;klZnsv4g!;&3`dugK|>?mYA7K8I;lR5d6lBL59gFEqmXaK~qMW0P3a4idGR
zWx=gU7N?*A=wA-xfCs#M`LeJZ+dXw&MMcH2Eq^G=a}R>vE09U0jP1j9<**bZK8|q*
zFvQqZzh*y@XYx3-2%-`a%L*k(p-SesMv6n0fY$OP9O>9&L87}X@W;QdTReG&QHFMO
zSb$JR3?BXp8L`m`<s}v7kV`<CZ5#570YxC^><Ar+utN#49+w&C(bxxlT}*Gc(szWK
z6NP-HArj(DR=!4EvGQ?^m=Q*$kr9IsIT0I)dondw@aZB;3(UU&o>)Za3i1-H`2X5o
zZ4&wh$Os6ZBPo8fXC1+x3}aob&I8h{hOa~#6Ot8!)JAlE?~tuWN=!gqgXa@*ZNpb`
za1`TYsRV;kj}{0+k*zS*2unQg#ULOj5^aVrT?oz_Iz}mn#;xd>+Gq11w`sYAl>uu&
zy;l9FXNKZW4PRE1oCv(j^KOz<+xxzR-2y=Siq{V!mXeuF=$J|kGEs<VCL#V30#gqp
z<HjFK5sH>^bU!!*oSCSlv1x2UAUIYtnN)?uMKamzmWr`j*V^{4nOcBs$;pN4{gpA+
zL<R6Q#4)<;f_&r4BAo%N3zsk30J$Z{5bzbK64&|GA<%sDeQbs%Z(Kw1n^3y(0q!13
zZ2jLb!oXN=gqq8ST5u6!3+GtlHB61cNxB=4EYgkcLTO5zHef5?i0s3*MX%FmHG}-v
zUL=DM1A8RITIT>kzI$r0$u<avsqo{it*u}eCQtwHn;qGW5J>X@a~cw>iN9$MJ^VK^
zB3q*hiTWfJ9oNV15M~H)A<qCE(OL`%KoCgK{LdkOlFN@qz*sma(+qiLn5g@yZRgIN
zQi^`KxT}Gh5CsP2VzEI_r|$>cL;loYB{~BU{YMw2RPg|o>HWsk;0&%gaR}xHGPQ~6
z9_-#1-4RYfJShmFL*Pg5t679gq{dIcBS5Af?YhEO1%;yr3=q60hVVyLh=br>h52R=
z#AR&zyCQUz)+#DC+X&Tpz~V`K64mrO@eCKDgkg{vGRZK*SAy(1?X^^gDLyy^nvGec
zp2LhsNix3yk2iAr7N0sbA=t-??hg|oiLK>mEHZg7AiK1$4_@_NUfi1pQuwA0%^7vm
zLx}Z_MAb2jxreeQpjgANqjsXA+<!QM9V}WqcE)$IBLtX6#q`F%?x__o!5-f$fRUp(
z{hj+hiIPe8WF|<S8;+?`<NyJ#4*fJTK3<I68VZtAqN4TrIDbNij^o_*Ywc-pRxAM+
z-w}mJD+L=S0{{CiO5k~ti~(#AP?-5qVBI>0Z_Pu%=`7!#V_UdAAM1n!!b8;&1dT`o
z90zFQXbhh2*Zky#5K9VBA(FlkxDI+j+mq$7#JWZe@lxKSSx^)-%X9A$J;TSh%0jE=
z>%V40PNjzKkhis)_KlqiG9(dB^5+nOPp!%KGj+;}K|HhW-7AE&@+6oW(;WIP>cMxV
z86%x35^&>&VR$Zyv~~OEDcFFDEFLp)#saYtTxCvnX%G#*yn8<xG>v*J<xnf44KPAW
z3)N&VTx1AqU1W~`$6(4^aLl}etk95f+}v;DW9>nvSpWo-&MnDIS2TrCDP}qLV-2rw
zfT=ObxC1xxQ^|Ij6U`c!SAcMsQ_imVihTdxA1e7ylOh;T3(1QiXKGSX5>XXnTEu9h
z-OCON<r>`uIJh-q8q3D9AW@qr*I!>9oR6ICf%1>U(iv3++k1vv9|xk+7gvfK_SD>_
zBk6wx<svz$xM1%QzzSe!7hDFgLTo`zcIxI3)@2{21dP%25k^K{=oK8Jvv?a?n-C+#
z3q@y&ER!~*AKc6pY$1wmtxW5YR+OcbMGXQNNP>cS>#JqTo4$ey=h|Yq*fD2H2r^Al
z7eU`FB+o~zdAR-#*fuiLT|^&}DkiE3UohO@<?qAtNZ`U@8KzaZA=Vxd7$=KQkOOhy
zWm16OLl{MMJ>pn@zxE!LU;VG+b?ZLiUvGgw)L0e&_rOZQOOTlSDGtJSkzMEaOLHBe
z5`MoPgvtMM(~`G)rx6PX<@f8@109kPx9|%4|NCt;IB=;|aF#yVA5XfaPopS`Q17Z@
zdNpD;wB3F_R~<0lry!_jeDecK_1)heHEeS=!h|sr+X=yR*u)$}{RxE4z+eH8HzPCi
z@f*Jbciko8d6z#C)jCesGwkF>*l4`M-BB=F!I4jPdmNJ_nVCb(q?829gQ9+CqWnxx
z0dK|dfkWuk&SL%FSG{znC92TpCa=R$+rUq<%iMeog!tO&(}#i@^B=ft+)2Z`Nk;OK
znX!0zY9RY|iwi|d=eAN6HbNrp<+!lE<(n=0ak_}cwWk{k9=Mkt{ByTF&n=`LV@e_H
zT494fQW#$aY7Si8;b5^(!HVb4ZB!JTn;p|d9!3ow1~N_tJ3aP2!T<56(j)SR=oU#{
z2u^U)Lt#U<m>llt-S?m0(^wvq#g|Jmt#<(JW8`IRqQy?s$wS{zSiDug#)+pVF6Cqa
z;=gK8E8j#iI0hr*ItCIm4qTW?=;OA2uG#p31=nrSs~~**kq>2&I<(AOc|Zm|5Qsq1
zuV8Ofoa%}|JWAC^QWY_Yh+{!3+IF3VdXbb0roKN65O8op)F0;4c+B!4gR6m)?)i_U
z(9!XYijNkYrw!!bKC>ewS>ug%RNwnPU%}(H1>Px~d>votu|-Dx`S7YB=g(cfoVMxI
zsZ+M7Lyo<;ZSaIw>v+iG<4h5a`Estp#_~jIjn9Zon0g~T>(T_P#Pql_9Q`I-u_z&;
zM=@>jt-j7OHc!_l5u&_AM?_{L_4L^4x86~qp~8mOe&z`-n!&I4Jqcv~{?02G9tA>F
z@)xGKWsXiJqso>y5#PA+JlZ%=lkeMugM;Ot4{`VI96#DdS9~PNV;MXX>!o?FWYp7r
zk{K*sw(8rinDvZ`{f>0mW?Ci>xQ~qQyQ)Ar{iDp3ak<>159Q1bcilDGzolXI@};?-
zQ|4S1Jksu9C0WkIdS@a>bHLn7W9)w8+Wh-*oH5r|NE#iGr?X0Zev+m1sFyC*yHNMy
z2>FJ080fheb&Y#BsFM^hQ@=|B_ipqL8f{dEPY4gkJ_{^e{QCh3+|cVz#zmmcKWQr4
zyTh|X<$J44JgzBO<oSiyIj^nYQycRAv*IPJ6JqY@q`6`m<`I|c8%(XN9=N?;_jmh<
zm^mCxs0smJT4^P2z(pYaB=TuuS_THLEdRZ-%*(&JOE3rGxYkFmy=$BME`3vvj6ZLC
zdi2bZat2nJKY!V4zsni&)ljNrICY#kJVmI}<v(>N#>dk#pI%1*i0c*c1O!I$^+xPe
z{PVBMOOe=P_;8=9XGh%~vXzi^QqGiyFSPW}iuwMed$G39RTiu`bv?bSEtB+^zMCw@
ziNV?-|FKNqatQ?UmoxoslieXyd5Dy`hkk^$BLiu2;VZk5qaFG<W{tq;*V@i|y?5|O
zBm$LGN$9=yLCHac4meIoe#c>6)2DE9OJTHC2+b>{J%4Tn9y!_Wppa;?A^qC>c=UD1
zb@{amzQ5nd!m%!;>eMZDlr5tmfFwZ(!7rc*W`rn4brna>KHG`&gHz8GRklYtKH3%9
zKf4bOk_TbM|I6{hCxBYK*fOa;3)2oXP+wqIxTM_z7(oKLYUPoldjU9*De{=OXASp3
z@A3-tYaTEJ#AE(69y$yT-FP@HnkVWZFR{>Jg2P@MlOVb2$yS4?L15`I_4V~z9p_af
z_bN0aAJZ7q6qccVM-ltZcjmIyqcrqiofpJ&?tt$iA^z|f*S$Clk6C?~SksjoQJ3W&
z_5_0ST^Op3kzyzj$pk&PTXk+6<XeAeYWvkz$-TxR;<A+ftgBItDsn1v`BBNEGi$b6
zN4o3jIBB)9U*k;nGOg{u$9fkKjs6?gW6Xu^P)3kAeoUbZN81fw5}i(*q9%ZNA}NLi
z=sx;D(y@?T4ncV6iEmK2I5r>5V^yBrfqhBDDD|j3k3sqCH@tImGmgQ`+^Q&cxlwBP
z`T5~+h$QtX2`s{)_uze)P}Ro)r(Cl2B30eB#pa}SaGD1!xkTgQJN>-_g8?aICJUK5
zOiPRSBX{6vS6O!7S|i2dvZtDkjM~NRS-I)JMWnlh!%&6Wzz^8%21S<7;LyPKt6?TB
z9OX=xUvCt*3dZ-wHxGI~u2d@W;sjmy;*#%&RXo>jI3ys>HCl^tB9YWw=$S*bJ)N8q
zJ9>MMDUMZ21zT_x!^Llp?wSiEY*JG(6aeqmN1_|zLbtVzxljTSgd=7ONdCU*IF4<g
z@T-5}gRB8s^B7rYfvOpeJvPTeydje)#W$6};pa$I3_tUGx0%qg%?@mco55kl1<63-
zhIt%LOY;!kb@bK*n|KOOiiP034;f_*0=VjEed1koP;p{2e%GvvCU)$?zrLGgUc>IW
zHYGLi<e8IaQt;a<yGl0?+=(&QC3l%GIO|S{IzKh`{^F7nI#$-P;vy`azYtTjCvx*K
z!*sBTy~#Cj*I;61lvvXq@#+&HXngg71!j)o+blv<b=}sXb=yov{LaY$)xlK5Jy0IK
zbIXkH?oY#6gvyPKcWiKILJTazQnn6tsz{Dak<p$+>j)AJTjfp<j|_dj8y+95C=&rG
z8^mv3<J2l=i0bpX6Vt93HRaomUkP=e#qNaPyJ|3chL6*iJ_u7m;4Z|{gv7!Jr!SD&
zI+XiV_~>P*jVICE9z&ZN-o(hnv`$iT^z_VkOaVoG(7W8<tL*uJ6FSX2t>@KO4>ei<
zeIXzmo)YMIqxSRb8fCl@#iN6Zx)u+;5L_9=B7o*gNbBZ~I7Lq`MGvP&)={MwN|bA)
zGor$wLUOAhocjVb7BrSqZS!-x(evnMX_pxdoxT`(s7ci`f179iM_m7_Tf5I*jJV!P
z$GssX4L2ue6CTJ&>(MhzgK-he%l#{Qeu^Vn?+B{BPhKIc{L=U=%z0$~=N4S$BRIT@
z0VVXOAza%(q$z8jor~+{QIi*MmMEsY3bf$bg)H5_02<zhxO11QtE(6Pn@g1+SP)AP
zoSU0Ff^-aStX@*0mx;DV-4#VqW&x<I<dF_&ql?g@Zci=odHJB44iBy*)jG2rpJJp6
z*rC&X>j6_P5gXhGM6wHc1xC@`Vd3m;G~DY`(t<2R#4`lMtseb)o*q4)R4S#9dd17U
zQ%>d2dQ)iNQzf7P68IKTkzx&(2&4o(Xj5#KyCC&~Z;}d4pgANZWUeVRVi8idI?%us
zW45_@%O_YjpJ&%=!u6{g%&U9cy4al%1Rw|KiM_h@Omv;(P6eOub-Pg<j^Q+UJe2=X
z&*mr--hm{c0V4*SMl|E(@8ALj0kC~EV^C4)R9VK(!9lwNn_3hB>VdHeqbVdZ9Wwn2
z8}7s7O;?hif9ESb8kHn^jnm`?C*Dd#SWri9ZKu^kJY3}$adYnsF_trhR!HJjXZwWv
zEnl4_AuUZlb}*@q)<MB!b4W|;;s_e_RsXNIGmq+d@B02PIl>hkb5X_&9aG9lqc}(z
zLLD+iRK|)*QAmzsXdo(MWfqPMB?=`psT4w_Ln@h~$q-4N*LGd!Uh8?DwVt(}KknPT
z)_pmse!t)M^V$2o-|zR{8!=!gqPeRggL3iSuV-%Q?Kyd>XdZ^WW)3W6>S3P{vFBEP
zYv$L=5s*a=GjnEpd1XKN5gFv(%bR!2-tfmCs%Y-AtY`7##$>&mA;p7Fz8?v<)au$E
z{e{~mexb#O*nzF+az^dBoIp-w=zmV+{}CTz{&@>(W9Qt7atTquX#iOB0N6(ErGMrs
zB1mO2UXFVQdn~I##Pxnb#Sn^uB&t#g|JMJ#sd7|vyNj})*r#mkuvInboqQNRnO}9#
z=6d0~YUT?}!O$Sxa9VSF_{9Xkf4jf9r2)rA*Jq>YfIPP#oQqqjvxUZsFovp@ZHg}R
zSZjsk#ok&oe9M8jqPq@f6_9`vY7ElnEbvnk@M`6A{b=O&OL;2UE%L(l7OUhPjdZZF
zwmg_5e>S7{;1gl*+OP>sS^Mw#uPvGRt4Lh&I`o1ImzYT;FV`2Tsj52hmKOgjzs2mk
zt+5C!L^cz_|9fLy%E>Lp-;B;{NiLD}$8CB0M)tP&`}}r`3+a(M$u7?&2)RUI82M9Q
zW8=r2$6MsYyxhRit|cCMVswtE1sgY+d~n42_RDNFb7HEL>?Y6Am7v#7(9CD&g1YtR
zb^7w3ZHWodN!ty*;>?;HK5|6nkWrG$XmU<$?IXvK!iiz*Pg|m3-1(w`IoV|c{=VJe
zU3Jm2lp5%-d#uR8wNMq>U$@TF+a!q*?Xy$-o-Fu+%hHEStN~HS2t?@mUIRCWFX8k4
zT+^CL(GmjnbU6p7j0G_odX9I#5w8#8?UHrSq*R%OTv40@g{v&OmF)%l*qwWemGh#L
z9Bg<WeVxv{U+?k9dqVko{eRvDe>QSj*1z63t!{pL#`#SI7$w;qF7N<eWEF)F)>KD~
zp|b9oAq>QpR@WL*`9uey?3EKq6TD_YJ{@9FfX=oOVA69gPqSx`+l;!bX6~EvWaiSt
z{Orj%vPRb~A(hiEPCK~zu4caH*uWK0&Me?_mBV@gKspa|bFu5VuJ>Q`M-TvdPtDxf
z`HWi-4=EqhB?(~EqDB4i$CStnP%;Y%_>qfwa$^0S9$#K=fRojypOq7A21`ZFV{ga~
zNihZ!{G<7nix&ruoi@!^&1tAz!p7P^bk0Bj$u8kX20ry8NO*V=Gxq3>w^lsl?{AC>
z?KIo0U*yqlWA9Zj$k~-EQN9Lm)2!q1Pp+=LQj^{PtU6&)pVRNmz{<{uUKw=g2a~Ct
zrw^z(OTm6TXShw=GQ0Ru4gOI9$@B|{y;!T=o3!6+@4T6Ab{EEwV28la9^v!b6cQ4$
zqrcstBb4_UeC<8wuQhu2h8%yshN0dI<?UL)6G$*Q!uq@nld2@gzoFXg=lg^^JpfkR
z6j-s{&~Cz-?Hd1}$2VWQC;vc?mXVUloXV3NhNz~F_&4>#|F_BgsJ8aMWLYQoe`o=S
zg#Sqr=jaBox<l;rMI7<akGLp;)906<*-ofaXZ&<f`h4`JYDl`?GppbU&J}bq@pd`<
zQQXN(lOf%X{}Rni=W3yrMT2ETAnExeybkBlbmYj90cR4t-_2yqGTWrmZ{H3<Nji^|
zw%M!9F{!Q`m;-mIVdS9=I2b?mEs9+ny0oanRDji=KJ}rAmc>hZWO*w@$(4Hakn=_=
zmoHtC4XEtWy+JG;qN==n&D9BSc7`KU-@CBXj<O?&J*9%0snWy{4*t}>GzaR0o2??$
zKM(qCQNryrbJomB{=SnL&P(o}xQ=R#J#PHGoWL!Ko38fPen&KyuO=^sK@0FdW66~C
z2wt*(a<sO91NZh#@qu0gJN}DKewmZS&bm!}=VLnFJHGlP8Y|jZ%|%DK6)`M?b<54w
z)QZe&WS>A@6zl6%m}zR|_L9i-)2-14uttpG-CH_c^gP*@jeAOre0*a~Gv9FDiZ1gv
z`OAq6z;Y>&TufCVzN>=KUntnc8O>0c(dhqgKZOD9g;J@gf|+$7aLZ6zlErz(h*R>~
zXfml<pFL02T%&3x+Q<xRT!dq(=!H%Lhl*r4`0D3B5W}WWhhF)JB4$O$gUrw7)h%Gc
ztPH#5a@R6WZ3so_6|dpnKG@<{)EqQEn{Yr{Y#L(rNgbo|bzN2Xk!$}Uqc~?rcq#@J
zYp~!Yz0Wg|1!HVr-yuZ&@{-?>?$fB0d|-FpeX_miG6OwL*&hw(iuYEInl5wEh3to_
z#`V2AaDJyYKH<*MRV`&{!a=G`mJx?Rn%_GzRt*J87J~Jk7V``}Hg48&r>xM{CinU2
zJ74*gdTNh=DwZ9NkV&!;N^&bl@7OPXZA><8Ia&zHYISW@X+Yo5m;_FxvTozYv+Itn
zR%Pby5XBJ!b~6W=yX5VK4C$t@IBp%KdQDw_L2#-oI9#1*JB&j$510Pq<({7U<i`W;
zGm!>L&aL6$Hggc+Cfd}{@X^gElY|}S>-@@uO|K=ZXmE~)(ObPtq?H(Db&AXQqOq({
z7U#XP?p0Ld_V}wyUCt(d+NY$>+?HW<2rN54fO!L}s*>weul1XCF{Vx1w)5>fs;e(j
zWI%qn6ntUQFXcuzXcl#hvI(hccMX`4Z<(8UJuR<_S#n#I{#{Y2wQQ+pYHAt`!KDrd
z7q_dbIHj1oXdoNGm>@PYCoKCE%8;z*YIW@q16=|gJGF5)SZlX@fVOrT`vQicFgl=c
z-Es3-u_E4H!+~<N&+2Xg<(8?s!C=%b{&&$!+NTc;ZErT{mryJFq*bz*vzqiR8^4p1
zlXa&4)t-J>Jv8}=E0W26I}i|<9lbcgg;Yd}+f1d^=Ta4CaX&q@;KZ?r6VL!s9q0_-
zgg9<AU>T$7xa%eSbAxgKh7`v#B#TONRu2E2ck1lbY(Bg%ua6%Hy|4^Mq1_}?rEC0&
zt>zVOhzzF(XUXm@yl%{|-;?VBi^$>3WGiqg8UXrcwsHbf!o7%actXTMvot9ns<^Dm
zDe-&5aMsAO1eT9=C|4_P*TcW21~C`YlSM@w-(4|lS2GX?)ndfUl@N<&s>L0EQ{QU{
zoz<9BCE;HwuPa`>`)O&n;;Dmne1NpyG2snzhfH~3)BF~`nLZ*m@h*qlZ%uIO(W6J}
zhmZ(exSF_bent6ApXmqR4N@Od^)$KNH;?vJ#2hC4M2X}kA1##x|I}IQVc*ljdLm20
z&Fq`_g;=e$=w9^JC&o2e3uaw(vHIi(Ijknkg^k9^En7SRhno`<4KdJ8V0?1h({<2G
zO$-}6!oyXz#_pQKkNj!-p_g^=wKFpZj(c;rJ54x+snzz(mhrnbKUP*RGGIQB*O9?9
z67TXQW}6+ZAOHo4TUYcUu@CvqzQD3FrTR17UypZ;3vjX#zXj2_AXd3F7y5#Xt<M$#
zG=X=^pYTEK7tV+RzP6rGf)9fN0(_nwRYr#{4KZ(g7SMP9LH2w3`=l>L*=pdQFiTJ`
zJu}Yj30UdTNO-!w){#<aJ->b60Es6p`YA6&0b`W(#Go{%wBqjy&YOYqd8)K9J}l4Y
zH`|ErM5Se;iHfTK?oq7rv-K|@0W4&4uNZ`QG3<^Uec0=JeZ^oHF?6S_bFmAE*l7e`
zGQ&&ufX?Sag%7gd2f<WyU$*KI_2XacT;1Etk7@5mKQ_3jH<PVV{4=o%agmU7H-0eh
zhdAE-)H*v^P{X@CEJ?wA6pP1Va&lMz8|R!OJA9s8memz=zt``cID;50G91$Xio_H;
z;inh9ks)$C05Jc0DDXZ;ZT_?zhvK9iHg3R3c8~7vF=`VFx;Kq(w~(iEa>|irkeP9P
z@&Lb6K$)D!FsIVsZfWszQ~V0z0DMDMR?e0{_4~@WiBZN6>Q{3Ern9$^2YKOSr*-M?
zo{kMDO`kOT*{i?)rfrWREYjXbmgj;m1Is$Jalc5Jp{!lFxZ_zM*K8sLsIu^W$oD2~
z@C*=|MV|vJsp6PrRFkvi-z3ITd=T-CbFiTZXy;qGz9AHA?|T?(oN~a}E4$=NGU@rU
zKNM$tOrw1dEEVvxY<j*9u9tm2<ka5A#`_38p)#5c50xx>h%l+Za$$vfAQd|GhR`%E
z+V!EEuCu6`e0EyaTRf{)?pTGYbr_;c%xp7;1Zi(ZfYXa5{MJIw#gTr6d3AA#@hSv6
zh0U&mBrF5T4}*_xDh?v%9-3u&;qekz90aI=<B*{kTd~(xGq=E<6_`}P%GY?LhD=h*
zHK10s;6b=#qg&o!zX$N842Z*=o&9_ikv!yD1a;FB8eLDY%2<<?8uec(lw^Yn-mQbA
zckD->*E^0E8M$U|cN{WMk3!mTjh?;;n(UDa!3jcq6wYXt^varBIGPkMd{)xgE-Nf3
z58_t5wz*Px#I}r!^$fx?w$ZOFqZNZX@?@bqS^SHTPLz`S>Uy!&+qt}|WzEXd=@}Wd
zZ%&=nL!Vw6#ew%^(uCXwINg}@6O_FjLz^{iDxNzi((4?^=~venaq!LuedBx-m{g(a
zVd2nbbDET**!$Dw^^LS#azak*J`6KtM*9BR3m|Aec#bA%Pa*h(Pd0RR3f8OO&c9|G
zyM<s>X84XvXoci|da#AGuDGgTxrAs}Vo#jTLTPr523}~yCi3>8=eoYLlK5Rdst+&A
zf?^rkOIPR;uHA?mS}sK3=Q+D?FL**9UWBn#R+Pyw!j<g63?DpqKS5n|T)hiGBu|bO
z=S227gvG4J!t}%RXX{thX-oV*v(*=$s4wO?ja#7_4=|8CA-IRS){<0bxVC;M*wEjn
z(%NOs!SKl9_kdFn$j$v`CcKyzQ7fOuZcEYWS=%q`O)+gpFIT>~pLNEXe=(iyI50S|
zubn()vU{gFtJcH)oP#aij3bdPTZh0v0~m2jGSgjKzhYBst#Q2gu-TKejbyMv3xK2U
zyc<nrHv*!di<`<Y)eXcV^W|O8aHQc$rkeQssNDFbWmgxJ@@+M4q+9!b?SI#}Ccsmw
zgMC&vQ&TsPT|BFwjpPqTA)qKcXVb*-X*m;xu1pW>e0Jav0&p+Tf265TDDy90Pg~w5
zD_*c6U&rte$Iy_GT}`}$N#jf!h;=fXxo>7oyADUgnaL=ylN2a6FNgsR-P=#NUP5kp
zYpp+Nl#*GT{E5qP^cQPJ%)g!Y`OJ3UuMFT|=aHtLMaW=^vQ^Jw6@>q8x|y@a52Eao
zPE0Nn)BRF#Z`;c;Yj>HkEj(<QMC+Eckr%IRQfONDw<kC1QGM0XNQR3N*lgH7K#X{H
zE{_PGO{RjLG-vCD^)%IhfRv49je}JDX+n|7Nx+j##}Kmxw(E%S1;$w&+O<nXMpklZ
zX48R1&?KEqv1c*6IG3pgF)Kemt=gbAT+wxn^~z&FINqcaSHwHyZ1jr;KSITbm)>oB
zhMEm1?jV<lp|_djnzsu+n?ehYh|6sMgi<N+O{VSe9Uor2c%vAdHV1bu(#1ShMf|yW
z^Q;^`{w&;Wp~+En#hxQe%87^H2#YZR*)Yie^TU+JbXbqF>W|DmY|_FmwyP6k9b4y6
z&gC#nW;7YLMf2w8cA0;?Z!1;}E?Y2-bF*@8A27d-qvPfQ^L2q;zech|iiK{!vwKyV
zn^v1)pgF~?R&X*Yp^Nw?CHfBt0pPJ*M+z!J;N=y4;wc&=bZpK69A;sC(LvYY<ec9{
z3-r%Wva)R<BGZEZx+Z%*_^ZXZo#Gs2m6L+tFtL0Jq0e3|XXQp}kT(9*X<ImMGjebi
z-lAfGcsoJ^YC$b|Lv)9PC@iSDh&i%p5{Mu7snv@ocle6*d-v|WFbS}n`3jJ>0*6r#
zMDS<JXK;gKRxX4%(Yfo(aacgKN`f4l5M{iR;4MC)-$sohi?$-L9z})E3e4nI5*EzQ
z&0#?<!TrYkSnbZ8MqtVO3_8q3Yk*=4%$;DqP2A5EGXfMD+vgTF$Yl85+(@G^!r}Ca
zmw;rMuf;A}PVXqbT!DkC8#Qh-S&l_=@%}11e5qqDG<I#<Ru;>DW;YT@{{_VMYKJcL
z0zBppwV)&fbW8N2u9AvOUNOWQFzFy;x-bqsHtu!2KcDLc6frS@GM;ucqgNAomSU@f
zI7`Kb<)*rynnDUV+4r=hAVxCkC6r{U^QO-#&ZcDK<~BaAB9^%3RpH-)*Nh?|OQny{
z5Pm50m!6^fKiFTNhEGKNICMnwyUubtSbszjmWStOF9H%~ymJNQ`(J=$hgmm8Y2JiO
z+z9sKj%|kEU^nt$21<G*p8c$msD#r?%2n#b?tS`f0_;8B>iJ9Pl7DKz?pbyY4hJ#J
zN2?T6;HR6XzDXuSmT~!X*^9D_Nrqj7fFkj3<ve!bNe&gQs9h>rj_S3~P;uSVt2lnB
zSn?+nK?H!Aj%&7qd<zu8RD0&<DseJy<<)f|8|c#r983wL!5h&9UAyo=weNl;jyeuq
zoS(+e*({*Fm#*%e>C%RHdE4VV96zbN*wC>Qbn<z<JKdLkFli2hR#?nj-22rZKKx+S
zn>KB#4o&teYU{f<D$Sa8_IC#;wXZrwacnV;RR<e4YEVP&zYAA-1faa>`0?XH5J=IU
zfiZh45x)23O73Yei9&;!6&Cbk1|x#zKf1E=tbKA??O&MHr*KZnsJitq)<u*Gp!;d9
zo#o@08Rvg|nN-K(*oWMCH2w05llIAgq|T6=1~lr3UpiG@FPop{eW-j=^ytFU-Knmb
zFK@1%OJ}3S`X)aG<NMQqQ=Z@**)wY%#F}NwAQLg+$gdq^L;hcy^?y-t{~wm9$ZTCz
z*;$W1BrQZESsl`E>R;ifQg4R-n=_k-R(A3!!qQOZ?C=r>s*FpyHhT65qmmMoE#K@G
zwf$^cuQKeXa&(UGbN_Hz;DRS<MfTOM&Jcgc_rdCNOB@?M*H{%?;o5KtsMGIICjS1e
z0vSpO877{}T_E!4Og<>V%b9;pnkjIL0s+s9ogOoo@)X`+60Z`#bZO!fK4$akqkAHa
zv)F6>D|FWG7w?>$VT8&k1Uk`yky=#Lg~AsW&0cHQJs)3RJ!o8Z2;HKxu6(n6w9Q1L
z9v{Qog|{o!>1#RdnC5oh5Z~4~Dw;6AMu(_&oz8rG<t;l6n!sf)<T;&6&54IO%pn-F
zr~S~WQ9dU?Jdu4cztT?upWO~Wf2?)|u830*)kl5j%01={$Yv?=AfZ=stH;1(A)Gky
zu}b8jZ9dh_UaIe44Y^jU&`%Z-R8t!3`{PTUM~FMQO=lpE*>qUvF%ZzR<G$Z21qPK+
z<(KmQ+UwY)Jt#^19ptJr{aknapJz^uYGc)*{LlNg)^PONldZSMSQvHx7_R(`_~(dW
zs)4BzGUlD*pAY09!dMe<B#O?~njd|i)&#)?yc%8A)CVP|@usu2{7sFyrh*ly`d5Vh
zun7yLPp%VD$~NhM)E0b08!Q9>-sjc7Ou{<Jh3k6g&>`;}Q&ZEoX9P}e<I&f`r`P0<
zAG`x_(LQr$#~QmFY`|~te_LPxU(-tDA1<v(cB03fX`SWFmy56W3&R-&9+U1oy)1j`
z9R6_xf5^oxLLYDl_j@RYF1q7S_1X@C$o8sN#WXrYvcz%DM@I_qp7Q5jJ4Q%IoR!ZQ
zh`7SbP_6fqtUlKIB!3D8q`*n>c|@{RuaE7PWr|>xNi|a8WTETvJ%oP<cxqvf=a_PA
z(aQPO@Q|)2$m@u%4O9g>+baAx^(f3;rTvRh_uT9g*uU8Sw?4I=0`NFe1hSgexwU@l
z02Xj*osleI{Y6ctJPuBMCs~5L6gF(x958_e`4$dNm7fq$nLr)NiJA-qo3pCqCtlg!
zSMIb4?<SN_p}k3l<HHln<OrcpW+?YQOhp7Ash3-%q3a;S)Y!)L{=oN!&D8QGygq=i
z#xOTcrfGUt&=jN#JwzT0z%fjDdl+2?EPA74IMs;=I66}fH$|2{!o`(sU{)Dk^&b|~
zU*WWNE~oKN_Bk1@`BUi`!QzIlDk(Os*5YUPAtLIxIC&(}VZ71ExVGi~O|zAB9<m*J
z^Y^*3Xp<iz6eoD3_tIHvqgq>Ltv*3Rw<6?ub<4cN)&}k^>5pJh0;Hk#r2VD=1*?%6
z-7&wxqn><xn*vK3cKM3mW2V=v|7d1v<EMW-eZJMiMbm^q1xyg5H-WnJ=chII{qRZ<
z`WH&Iw{Ixzqj<(9Ni#o!pIM%3OP-1;%a_^-u7|Pyi)~lp8W8gd-4>TuyuLx6UB(pB
zJj!c)2OI6bL4;7ib;3I>Cx*tPg&Y7GgaJwPIK6F$4(V`k*U50OX~N{-9bV2jDsjJa
zh4SyaX_Rnq76JmvW7VZWgPXjV{!^W~o1=O&>>vyK;f3a?GwyPW!h?NMpurunw!
z1R%nL7;$9uixj7CV>4;!S#>z1<6Fk(!hlogY7*sh_)Ce<Al2g|H#Czl;9YV5^sG*R
z2m{mz>wz?)Ww&S%-cC=gylI=4lUrLJ)ZE@kU|t{oecgfwn%nd1Ci6k?{QvYAW1%-X
z@)_V?Pf-R}J~2KIB)(9Q!C@67zya&xUz65ulJ;tIntp~V%3$XvPK^{00TKEx8w-g8
z%_r=9)3iXc0(=bN{weE<qV?*N<^$|Pf9ASB6;3L^&5_Vv5Jzgz@K;g?R>hwz2LC}B
zQ(i2cVQINVR4!tE5%S!@3#Lf$ugD2X>eSH*C#$eCO6E26Ye>A%K>W5KGPk<ck7<Fq
zeljvgSyv_r^cplMZzfG&ON79#uC3LB;M%@u*0KArdT`C09-AaLqAXu&e>vWrr6x<i
z5G8^sV!MDk#fNcW4O&7op@koZA0UBI2BdIf=S9NN%<TGoUBN}yS-l{$XEt&MIzza4
zR|RlDI&-=87-X;&R9Kh>_b@G$LFLR9-jM2uHTI&oka+yjiCUv)k1^_TXq(4x^^+yG
zTTbKoOdf00eQgv!O}K1nuk*Y*aon`qN;+%RaDFiI`+*`jg;i}D1GROInG~k!{21E{
z!=^bXWmQd2F5EGgoyDE!3iYTENaa>Y0nAAIm|V7?ID3DD>y61Fn90Tt^t6GS=1HN9
zN5Mv`I9b!RFP;%^XKAqKHv)XzX7B;O<^fDB^t^4R;-J5(f^QAp{$U;?2^M(ZGw3sE
ze=vP3xdT%vYI`v+gv~J90MgTQ%*@QRo_cF`>Xa$ri<dxbip-sAMu-$8mQkBITsEy=
zH|8XLt;9L(jBEY?rG@9$Pp%NJZUaNseOSO{z_vUi=i9e$(kg^1#VWMonZx1l6jD7g
z>F0Dg!1_47q~7l0hUS)3Lz~)O@pg@HrlyhUI8p?ZOz(k8+7tc^`(pHm>M^q|jIQtZ
z_@hFn?-s+&9{y(K{_#QEwng)eMvoaI7ct_!tB2D^&Fz2J{jA;aF8%w!arOCWDy8j_
ztrXqqo@l*W4I7L=cY?6fbX5^+C^HP42^<L#d;4;JXWph<Vn2gy-Ibmf?tAzP!~MQ*
zbcF8_?-iAgtQz4`9HU>|+pAa4p0e<maIt((KW_U{yJ?ua6foh=17&xILNvxxRaI4!
zsI!{0_m%AOxxU_mU~*0K;WIxB0^SL8yP5k%()A==jaLksc}{5MPa#z}(DPV${9GdD
z;yVY|+kb<rP=4{X|5GM&WFb7#0~C9z7z6|{Ix8X$XP=gC(cQc8l{6a(K00`?`<0r}
z=nenc6QV}Za^w1xK&RpVSD+bA<*iP7O8NGw3r6WbQu9u!Wc_8-y?522Rdp{~TCEdA
zxut4G%J(mRx@Vh7I2X3jd|l(vcYUwgHKKob=ZHlc0aNk*c?Y^3mv?#k^l9s|qyrHV
zKD|yHxvpE5J~-&?zr+s?yuC$jG6NorVzkLYaw<0ZEMJdi)E;J%XXm89fB*h`|DZ`L
z=<6tm``lkEz<$U89GvLCC|ITJKZxp+jBn1{i|hLCOdu_-%GI)h$w=`Q$luofMN6H<
zDQQ<@(&pA&u3KVbX=!=*qt>@>X$i&2cFCIV_i2i1qp&_uI8J+@V9^mqO5yFE-#w~%
zP*d@Gw=y5cs>(|*g{c!8Bt}rn2i|c@Bs2Eg?=dDLzwB^nd&odVTkFnsfhqg)&o7)b
zpkvU-sX#DA!5Mo*?nC4+wZA8U?iA!sTjMeN6H!i-TG*9o2BaAOJa^a}9DLKM(xtnO
zODk}kfFOEY#QFg|K5IyQkqYzMFI|(L=usY+T3(ZIFY{qg$ius3efV6wGc{ABrF4jD
zue){)R_3R0cZ~mVH{xqi>sz0KQpT+`ANyUUrs53fDC?8w&>)+J;@=yJ_Yk=v<^Qnj
zY#+PB!{1|sZ@Ir{F0D0hLPNfyfd?<%#n)-Kn(rN=qFra!e$u6$jsmz3Q?Dgnx>RU-
zyX#=AdPIn)l^x8ZrK!>fE%J52=_2JiQAr7?GM0jB-m<PN(XJuB5GH9tymdp|>P(Zw
z-C!FogeXqZtxD~5&hMM=wF#XmzK(*HNEp2)#%7q`P9f!Aai&|gjB*7kx*1VO0XS-L
zjjC3wt1a%Xi8BDC;%WiPVMIHwQ*i49bsSvNd32vE&NZ&SRhyHcMeq@5aqAY^6;Fwv
zb?j%$`sDCE<S1M0Q5CMmJ!jyi@%U|8bY%BXgKVX2rPn>KZg7Qbk_AHm`$6et=Z;w{
z$WyXP-dyPgJw#^4lVB5A*8@K5p3WA-$@B@QK79C4+D)c?yML>vllmrL(p+_asaxgs
zwXWdaWGI4R?25ws8U#(Ak3%N%mCFLDsfmeOsaQ1NtO{x&gw#2o-XG@@ew1~YPv%NH
zku*Cff=T<2&$u-V_-)$)-N0oDt3w9*bvz`MJ^sauyE4<$HPGoUMvQsIXB3dvv%R|d
ztK}UJv4A~Q5sXKnGYRKHPzBCn@zK65O<HG?wX>^!7R`Z=-3ouO3mn(53j_GB6cdj$
zi`W|KNE6yMw~mLXL82FRJcMl`wYa#L`N|QojOe(shqSQN<;mp-XBw!AnmJHkn`|7|
zy_6c2et;swom{ZzcMobh*t9;kRsWJvcY>^MWo6;{;}avIe<xpNtyN183JlZ(oow~@
z_t!2OV>1a=?w%~o5EU0g?kw2<=HKfdridOP?IjFl1FubHR~G&Qp`e(KQihP33T@$g
ztowzlUtV<CXW*JmkBc;{(A|Fxfs!{9CJmFk&i7AN78j~EHzsMoMULhQ>eyc%O3HJD
ztQ03AO6(o@%xjTZ!k;1BMC(}SE;E7iIV)Xm6x&A;llf@;`7Jv}=Ez10I48H$2Y^J9
zUvx2X(NuaHp=F{>m|}l6<c5KMRT{#8CNQ;3mdOjHMEQUPeLMJSIXqwMuBJChs;A40
z(n7|&e|I=(^<xptMb|D0)VR1^>2rTw@^|78%qQcfcIho68Dt_D#hWd>oybRoK&dHd
zsa(J<<LYG0Oj-B6Q8;*c_u$fdxY?O6Cd)ke*{!&G@r73t5{5A_TRQB)QTe1l`gga%
zZSiUGcz43g6}I}h%R1*bjU#=>#5JMULk!Ozf0zb_D^JK)I+>#+>IpzhEc4(Av5XZx
z5dAH#Yk%vLw{|Iqe(f5V0Lnr&3Gc5LdTRBT=Xc$)>!tEbioVdP<`?W@N}~+jZwNK%
zDmzcB-@n(V3JvDRYk&<5fT@lIstmWN@Hw%1s;P;qY7P&fvXF{jY*$oOuJV>qQO>yw
z`(K~ZP#biYhW#TbR-5P-7phB4S{VRiSD9up^DN)of>^Ctseg>0Pgq)Jfrjt{VFDJ#
zs}&5$e#q(bOgsQnk#%BL!WsEVJhnUPnBv=LYPwM8<(KS?#*kBnWqoMZbq(&qQVKf6
zak-WHyR%q*a{YeTJ2Ft`v?_~seC|InAX!t()27I(vO|9WJk+COcDRlOWJ)XS$r4qX
ztEvv=iz=6Q1H%jf$2sG<za`)JuisD3Ujq+d)mR*5zV4~Ify<sLOa~N1E+3pYEMyu9
zrivr>->9E8M50}_akBRL9~=b+$c#s)k3@D?(=S(qdHCxbGkP}i<vN??3qAjHF}vtG
z_%r&_c{ZENXT0mBvk+?R=D|jjHYQ+ZXDoBV7u83mJTk!;gL_aWPl^`ypu}m*!#S(B
zigHduiT3$)V(eX*P^s1dHsvx`!^@EQ`jOjBA+x$?w+QW^qoN(+;eT|uz#w+pQY&7^
z5n!*CH)?#lZd+`VaaWQqswsLd8HZ1BMIBNESl|7o`{=S)f59zn7yq&qp|a<gKwV@&
zyUny$XSc|bcXv3l`-~kPBWnApSo%tL1Njr<@AU_VOz*Gg8)5ha_dPkb<)}@n?q2<R
z&ai=XBR}^f&7n|SHrCuRbc*%QR$a=QW@U#fkB)pvOEW~(0ZN)H#^Iay{cl~7AwhJw
j|NGZ}W548)@5(O&LrOm?e_EyBm(>{S(Pw^h_~U;87ZTBE

literal 18951
zcmeIaWmJ_>+wV(CcQ;5#rzqXhjnZ8LBHi6cNViBREl5arBcVu3cXv1Lxdfm6p7DM-
z=fnB1$Jp-}Fb4Nxtvlwt<`uvHHCLFjq7)i3F)|bs6q<~*genvi^Z@wPLVN^X!Ly@q
z0S8Yk#l@B1h)apvTH89P*%_IbiJICPo2g2Paq#l;Kta*Rniv|YN;A`cH^MeF{QiT9
z0olP-_1(KjRYTvOt$nS7l;5*@vf@&7br%RR7doKe*opDH8oFB%Ke25G474Zopwz0W
zM#TG{P*DC<WTj^`GBg~3sz~gYLl)T~r_`ZgAQ{kyGA4i~Lo~I8E+3)V!7=2<JR>Vh
zi=li?c?}!$BN@(|%YSD{F0>3@#JZq~l5!&@E;FGB>ZmCsJ2y9&F3g7#QC5{nR;1F=
zN7PKk+(R-ffSNr=6;I$e?$il45;ZcCh)`q^UFDV+lQbjJ_%)_6q95i5>bBN}mIQzQ
zRSdC#oMe9^e{@*bKQDt)(x_kq{e)mUnt6M3UzjPI5T^RMU@yT!X|c;X27a)!2P4O0
zrYU2tpa8`P{zim?4z+}W1Ajq-Ut;hJ1qG7@^Y0btfh^en{H+D~C+x9W5EPUMl#GPv
zOE>7<j|g74FRptsgMxnLoX_PTKMu%3{6yJ=_|6YrRHaQgJXoVM06yX96YggCums$T
z!&miwl%KK?5s`<nHb4G~pYip9_0(l`O>SCwHu>W=Ly5KFIY0kugXi^*0N1g6kX)Fu
zv>)944-ED@RJQ~KnSaMmp&8}p5NSkUAU}oyP<VMr(vf0+k3?WzrZgfve6ke|yb&jc
zF!<p-1?=t^F;Ga5A3r4UMmkCk<iAHyNXkY><do3Ze}8b`3fL7yjB)Reu(R4%1n(~;
z0z-$WY?S8LN&j$dk>Fm>e>WwMnbrOjI!xu?T_eYz-(Ly}DTPub*b)Z&^TV~F@aXm*
zE``l5>W4f6M<Yq~@B(-+*#CL3|1UEp5eyp;MaD0Cd9>P*T~tgBnaJN6t!qC%nC<*7
zSFJFWnNA-2=4X`6Zf~FAbtE(B;h6c?4k$k&7He0@vg$XcDAwf*OqVIAOn!Tv?783c
zd^N$1?yo_Jd`FC=5Z13S?ZvJ*8D^w9Gs?rWToeCmVha|)bfTKQm<8_Ns*RP^F3&VP
z5c>D*twV6_pD;#PHR!3RM59P~A0HkbVq;+$B^#HMf{8T}q2%OLby)4A)%s?R7C5D?
z_JUFVO)Z@aUZ2Bs_1m~7O5|;nG=Hr!2M@Y2%b?ETh0FdNORijUlJ#Uo?yGSkMheD(
zr}gQtf2I$GSJ*AKTP9F{gP4zhC)}scpH~kSJ5=-JQ#%nZe&9l%8Kt!+TuHNcba!^<
z2vOzzwPOaF7+yzn7lhmxGR1GNP>yHn9FMk3Tl(gG|FEDDKaB~;W4bDy3PvF??T#dJ
zSn5Qo+i$+U={|OM;CocB`_*aSqgFf=QV>71P@t+S!tbKs%hhCqzJ<2H)%VZmV#dB`
zT$gBpXMwlJAmgKPo%gP>o^PJD)g`C&PryzQ^sFWoaAVKS&!2Rse==YlW8ic7!grYY
z7&UHawLjTxFhejP*`B}8w&gaD1SwzfV};3Kd!Br?YKmTiOCq=_*&k`#xB5_(B7ZKH
zF|^7I{UZrE#K^r4M0ewV?IS%C!X(Jdl5?eH6)nDiQ#&QlcN4AI3gqpvw5Racpz_{N
zVR=5oU^7+O``YQCT?E<7(5h59JHVx-)^%S$^RNWfYp1*iZjXYB!uurF>tZof-8^}#
z5@(5Z`zbbS1{RZ08?N2NS3QS6x94(qH<!7(bq;aVQs}pWDNh65H<<q*_MT7iCVDg9
z+{8N4=zbi8%%wS%{oa--zBsjLccxBFI6cymh<)1U_{Vb@#kb?dsicA)FGD}mreTL^
zAhW3DNy|t}H!+Nrb$g^qU{)JlGhCjhaNAbZs1HyFAE!AA2RpbY{UBf?ML1tsy5xJ#
zZPZ<*s6fm^fRVm8+aOnEHKzI@!Cd)^I?LtOm(mk)>+SIpPSfw0g({yz)b(FP;43(j
z&mj@+z#jSq)0LD)t0<0K)?=@%+|;bju#H5jiP!&_T_fwYfAd7mviV{u0w(wJcu-g_
zS2oeKCyERv7$5ntrvtHP{P%e>MSWrO?U~NyW`5?%xQ^}E(9K7jjpl=7p^iXm!!P)G
zsh<q$on#D!IN-!{1zSiKEehKs{gq-LzldDOs@Bfl<)Mw3AX7YDkJigyZO?V%brkw}
z8y2C|^ccNJjE<U3r&@k%qLgjF@i=OsEgG1-PmCkM(#r3`<Kgq%JJot8qS^W)4>fMB
znmY`=(ho(il3gGD(I|S=qD3JNEN+^XMY}o)SoW8b@LoB#7RG#Iw(Se=3{RB|?>%_S
zsp8<3fmF3UE4P}R8Ap-3{Zt{<GG!{uncDJVotmF|N8Z<GG9RA3b<*w%$BUmZ@YQSj
zrTez<&${p*EHA?fDgBRp&T%bwS8|!tB|6V}eeW8xxYcuI@lx510&c*FP31(_S>}!@
zU*FwcBbWue=;zd!6I1;p|DvwOT_^Q?7JHR~>r3O&7L;Diaz2}dBCTA~u=AU_Pl?vk
zb%Wlwe=gpHR$7lq9<BXgdOl+pSZO(}NWt%RQt7lkCytEETp%3n;;D;H%1gV>*1cKZ
zS`n}vFqkD8IAdLQ+=f80fpG?_Cq*jkew5?1@k?}FugSyN{e0GS^=#U<CmT0n{dU)u
zVjQ;tky-u6hvyULaBB?hss|gNqw6COSlzISw5y6TIuMx%_o&6Q1`gtaEQ#H)bQ;~t
z?WI4sdF#zP5-dBXf7_~olf3wWN_5tI_XAh;^M=9AV86qPM6va3xkl(B(Zr#@qH0T<
z9$$0I{KzU3($(GmbWLfc&8)V;M4jV$eSgQtQ5?JU_RdPw#vddB2*y;WhE?(jiV+$t
z1EW5_WXHC!{zOKb1uN>cr@$O9M++mX<6fMMDCMermOSdjQIgixO=rDYaGgtvexelD
zlexk0#^+K`f9pKlH0o#Z_UU<b38zD+@2eaA3cEw(u;_?ngsGY_CLAxmZ8`VjUDuV4
zu;rB}i9*<cT2=!av8oL&WT}Uf1XtH&&Q^Vk;-O|!k%K3Jh_YA#vE3{>)uWc)x2F?V
zqR-3+2=x?6h3yvnP$`6Tg<B1sFV5$E&3=~|@z4ODRjt0TK_T_$d6Jj7$47qGapcQ*
zC7~hYN61es>RbdJO$Vud=v2okkUZb0M<Y3k^5XL@YJ9f9a_NOWVEJUV$w>U9oGE!s
zyv&>A)jaG`+i#hQn^109_vhn1La8^|%(@33QAwXlJZj>4iO-VGR@yS9M1TUj^ouc|
zju3Xf`Ff9El&KSwy%hm_gKz1gK;`oaxVhv)wfwE8z`J`3Y7q9Q(sqOC|4`H^?#Ve&
zu4%qin4dAs!n-ddFYv}rsp;mZpVMZBN2|g#Og`<Y41w`-_xr2W;#XhPD;!p3n_6KL
zSo9aNR<tWE7LTv=y)g@Dz8<#OnvcF)JhILtSZV2y>XnM`?(f6v&o%TH<FvVv;w#0X
z?)kofK?ipuxQG<^=FgnxzGYX7*QG<<aumN93iE)PW2B5rUjoDMS3Ukhotm#UDodeJ
z&-nyKhcYFQ1fl7pNo*TcY#Mf-5%D_Ys56h*)+yvErWRjCQD9Y~Q?1$-$Iv@gM%4?B
zi-(rn*(X}9zK!KrrYo#7Fw3<{{IGJJE4T8&-EsBj6`E7}2ixWsHGGG;yWYEIE7yM#
z&!xO5FOSv}3*NyAViRLfru6;Nc<z2=Iy)b<-C{BHxCCmyew+0p{@mHT$2LpT{1**2
z_s!ho6QS|h{se~j1jbjgj2d5yJC0WS^C=SC=-aKM9kVTlhGh$J88tP}ZXK&AaKiT&
zrN|TM6w<a=JOpne8*hdqj^@uL8E_Vq0uWZ0a+y}E`J7J=k@1)|cW?HaW53Rl$0JZ|
z6}9ZoHOY0qC!#g!j*P!NUhn_$e4g31`7%!^q+-r-P|#z3Uf5s)i$#WBhh2<<$n^H=
zl+*jl$+y?^yWI?v#q4r0QaC2tiba+1-No|WRXgM1ck1Yk{n|fvXc?Y+yt5jS_zW4s
z?D1#Y6H57k&=GD#9p0<kSM@k&zuk`t^K;eKL!G|w48HC=GLy@d8Cg@^o8oIW>rd1;
zx3NSz@wA$$%@(3)(V|z7-9Y*+Yt-K8FDk(9&a7AeGQ;=Io!9%S@~d++xnO05gfJ}m
zoaR>)a>s)Mzs>j9+AxH0{uJbJ=_t7LSvtO}jOp<>J<&|Z%HrMw6D=O6TMdEdJCnKR
z{FSz==xRy?h5Ah)*Pbl7F=z}bjXCPAb%|0mh`3~Xq2FE)ZZ*>dwFQ|YlE18(afmqN
z9wOnUdyTNwA~}yIKUhGr6%LK(dv}@7Uy`ts)umahj5WK(@3K=MpU$qHS3rQuQg$dM
zL9ccoG}-XFMt`nAeRtbgiqwhsrg80w``+arT|ueamfh-lPUbVRTOE)PP`rH8SbePt
z0>I35v&)U1)Cw#-lH+Hp1wtESoLQ(cp#@ka-O}c(qLaN@9UV$L)BplW@yKMU8P|if
zKp~}N*8rXksm^|Z1oouTqvmEwzPah?E&b=g;vB@EGn$rDF9nTc$-9VQK*q!Vwl#7^
z&Jg`6+?wbKZD)5kvNlq}FB}oyC^rA2PU-gdBt8Tuy_az*Dci8`k@4!cCM_<*Gjrr8
z9hyJMnMy1*HnxyFS=^<-$f<fWv4x+9wO4nlVMC2RcZ23%;V1U&k^4dkDVr4oUgM1S
z^{#;B?3&PR9JHeMpAmx$&&B#9u3=W)+IP=bZ2x$Ecv<XJ)fHi~K~SPwS7ep=r%;Cw
zu|uf+5K4-P&^tbaCV%1fP{czT1;aIEhKl4Fy_y3d$|Fp4QXXX;=2k+-Mk+~Rp0gn<
zi59v&aVPl2V6xk+xd0AaP0GpZD~}$o=Ie&__siYm1N&jk#%S8v^K?F{!9w2ss+|}a
zeZ!oM&^R_@S3;?$lc-wdOIv}S6F<p{XxBZPm)<(tBnQBw^y=6)vw9|2VpVufC|+8g
zMnfMTIAh*&xJfr1^)c;@(@83HFxyK0nraWk3`b)#ltzK=K3EFAD~J}p`z_D8$KytM
zcfId3#yHDt@Z%%(j}J2?S1C&`GxxsmDQ-X8U5SqtPN2{z8NJoEp!K~SBe){0#idtP
ze$;YZy`xg1P^tN=BB;`0OxyfNI+afKP4>v$&dBC)fj!P`j3fo?ns&RBmu}UGnu&+F
zHsKB2$WF1=xAw2jNaJP3{!irZHk3jyiIIC8tw^p8jlyRu%p&$i5S}AGk~dPOB3zpK
zw10HH-!gIgu2uu3NK~i!YpD=#@E@^DPgx_Z_N%8lRqP%6vb8H~M|C+8*~NQBQX5TQ
z{>=I_%=CWX`nJh+*uBGWr%m_n_-8{$&bnH3uXo9Z%_LlM++zY(wOe5gDQeHWVD+KM
zRL7M~eZd^bQ`vfFWV6$1;$IF@P5f2Z2LsO^bBf)pzOQ88!cY@ue~oU=mJ{qR$X?>H
z7V-3OmW!p5oc$MkAkQz?U>`;&*o7{XL&K?a>+(gf{ip9M9+P5#aL~8qkU*~@yEUt2
z5N-FA2bG*t_ex+|PP@vYn76HR=3r0K!Jy&V`HlV7iPq65&g=?)7yMd-YHr{6!R=?#
z=RFxQX7g;Z9?qqT)U~;5C7dTM)K24s<ukc*1cJY57#U@20uGKW5c}X)-@JQ$`<~q-
z!iQ(TQnJaYx%<1Uz(EOqGLzU*B_XBOmuhKe^`d$inmp4I8lyWH_ATPu`P%4K^tHV(
zoF`WOf%fRyu_<Cf$xM~3LxOPrOPwevlDPr2wH=Mo{-T6!0<V9Px?e0x#pxPQ>kYnH
z-WTFpBJP2`&Dg8U_n*HWlMbC8#d@bqaCueA<ZL;4W<9ghJV4ir$D@emJKuOMFTEyX
z9>&9F7H+D7u^tds@xIULmLQtKcRWSDx@pt?i=njFP1PnldnN_HheS9&(^ra%Fvhjz
zeib|dYCeuCI3bq!c=>RJGv;P@!_=oa!G*Nu!^jB}AklPwgA-L4h;{Jpl^X2mwU~(i
zCjqww1MU|&G3p6(u|u*iw7YPnmfPO(NJWv3s|<;SN=Ut^-N&e8r7A41pi~;XVJAb7
zSF=iz^hlvwB!@4O+qlkL_ul81JjzxHms%_MF5xVFSDeF<g~;)Vm^nK}0R9}`Eo&e9
zoK*f|4u(q@mrXmbOq)=iJKE8H3VCt+$|E0V$8~>REh$AhEbJ#PJJC!;fz;-3E^PO=
zE6PV{M$F-C8S3jF(@rMa<<Xij)3<pEM!qny!4>L!fFoy}!$=X~ZHFt=Zxw&c?iwr`
zPQXT9l;f2b$m_A%XFw*h$^?U(%f^A5TWV6Mk|60pXcReAz0t2*ZXC>swm-C{wOpI1
zGk7hOdnv*AMuHwr7K>#^1O~;gC6r&%0D*6Q{uC`CGu0&fMliKE+TME2>mxxBoHXSw
z;^-F*rK^)oYP<E&W&zYY2H&^D;!}z3bG$}#HXb$II|}rTvOW0bZhE%kNpLf8zYrqt
zl*4^tQq0AupacC(q<V?*>_(q;oa6IvS(TO1V7kCX-i?)gaeK!oA58Q(rk8d(PMRC~
zkFLXzTRMapFjGT?;%zwQ=0rj%R4^>#pJ*lPayZ<zYw<c<_#H*32@d`8rRG4r3TxQ#
zd|80?M6iZ%(^ZAnO;MUU|1j1nVP_SkkOJNkkL$;>gIC38Q}IM$$t3;A>gUnNR{qdj
z;Dt6C?e{TFS(1HIRbxTd%QxIo+t~%S4wkyA=Z{h@u-V%!7EF4g%9X|mDC3O)7Zc4D
z(heeRNLMnB&PXnhpU}`blz*-*h$)BPm$wENVt$hOdMf*ODD0JZ4_mkoeaPcB)8X$$
zA-x2>$*(vk6A(zZ{y45Q>PE?t=y*n1tEjTOM!t3TYv1!V8S6LXBzPtfdc5*3$*ayd
zp&eBvfJ*Vv$a@#EcWCxSckxVFd+%q$!-Pfqv2AVwJ_@a}HQAx&x65~YLI1V`uYo=m
zdGgUx-C3M~G2MXS<-BcJ^Pp^lGIM{WK}oIs*%VBx`Z{SMxAu=W{oCgylUq0Oauml-
zH59yb>!ab!mQ=i-zR{D{S@%<mTK2uaM$grX;P)Nh>C@^)JM(UPnUsPSE~PCKM#?*;
z8ZtS;*ibgmlcBU$)`(mD^e^o3`v^$k)a6#0^*yAkrUGQ|gIrs{J=*)73RvXFQuKbw
zdo)P`NKthiE;Hi)eE9#o0TW4>MXs@#<<kO{Z33&FcD>W)<Jedk=d0fMCuVH{@D3Zl
zs4V9i>t24<owOM<biW6?oP_>4Q}kp^wZ>h@mLqxZK~~lW>Z}~s{W%#~$IBzLLcNA+
zND2&6C(6_9iR45k4Z5%%s0WygNDB?Zbtnb}E9@iG82u)XUQnFn0E)+Hw;<A+%$C{k
zQ!1J~QPA`3`_<_-Er5J~(cGZ$A7+5&?0VXMLMWZaSKT3_?q@1+J`dd3pAr!y;Clct
zF}^CwiOA%4wJD*`CKbdpFE{SWv7K*rxZbUio2)RaIwIwFv5sS;MwKOS08Wmkhv*;M
zZo@1~Y;SbhjB8!7Levh)n8%9ZIbQn_|G}nShG_r-JF+Yy@L8<V^J>^PiB$n(GD+5X
zcr0lwXdMRm6hkncj0zu~B`)_wqYRV=Bjd@wEH~><+HCIUbzIvxC@7$Z5R$!qdE8io
z2T)EK1ZT~?kq^pxm|#S$X0JLM(If^nN#9IPv+!pnNo)rCOd~i?6yNo)#*y*6NCW8R
zOnOKCfXlxi0{l3cuS8)v^eI?`A%oXZGEd<H9TpZ={hpx5Nld--_Lk7k9&%6lqE}z&
zQaR1A=|{80L$$j?H{%|J06Iga;IO2nsj4>+bXq@#7;FJy3*}$((;Ls{JUy<E9wGdL
z`mI)wv|Q4x>6+!e-5|>qYaz2>nB6^AZk2_p-s-5V_$2?~L2ghL_e195K5=8c=fuB(
zK!Ex|?nn6jm2*P;XpwRBUGkJNzpl&W<=F`&KYVUStQ9*rEcPn|cs_m+E)9_A>35BW
zmno|c3Wa|HW|@T1ocH;xhYyWctztTl%GPM%=XHfBfI<NiPl|ImBK<cr8Zb%p12(hu
zz2JOK{YPB{2BUks&ur(I*%}W5KuRX|2!otC<Ct+I5sK@{!?5DOF{`9VHrr*OXO_Jl
z%-{}KS?Y=ad35RbNFuHoqnQV*gKoe9_wn;1zeXvYYN@`UKZYjr$xNfWBLvIt%r)s4
z8yi=aYBqEjT|P{9E2UvrJ_U12m03T2-C_tyj_3K_aD%ID-C;M$dx5H>&ibT(vWp!u
zv>dKEFd@^EjiG>Md3ps~2-9o~y!iMqPSy&o*zwkYPn@<7UZ3x~YWUn-9C89cbMCtL
zAhr0#BWiwPFOQS{b9W1mB1TeSzbxs#mil@n)Ax=epqBRGd3zw^3G)AzIDmR2)-+Av
zu}S}_HGU(IQw&u+O~*HErj_jena->B?a<np4-LOx?ysB2Y=#Wi!3k{J#%}@lBWbYA
z%m6J_{i@5$065CUu=$UB>55biOzh>TniA5ZI}u|OlhbElAx|mjo957JZ3$dNKRj3Q
zW5eFcxQz`9h-ZShk_GHi5r3HB0u}1r$l0QBcD;wWEsKMg5bNPWW9z|AAhOrZVNX5z
zyw~yjmG7|~eS92m|2Z9AFqCUMliyZB`Ff_MNw4-#_TqUD&M;zEJXifzrx0L2i5Gf<
zbZ^Fs6-_#i{w)yQ2~(;df7-^!j~}l<U>3+HQl7>?z8^Y&Co03<m@!}jD3TrR%qYh@
zeThu7nHLuqPKESb598}UidmKu%<H`M(%(2;*thx44ga7s49D8p17=a^J~UGQ9pw5I
zFF7e)U;MbgBhg9&Ehk^G(I9~`GJ%lc`%iRRcnXtL$qv2vyWE7+Wk(YNsB?kOtgxLI
zYWp+<)B#6g>ZE^bshEh?^I$;~!oNv*9VDo2fQBNUA)s{~FX*&^`J<}w@ZK^>rGPE%
z{K^)uswmd2t04J)dp^(h;E8KHYVVaF5g0`(!?5;F;~_xO69E#d<6RldG}srnRQ+e)
zmT=6Q9i4qNPn0qe0Ctc%t_2SDj46T*9tGd&zuwnohxM;4f0t(cZ{`Z`Yr!Imi;1Cx
zs648<vRM3o2L%d=C(4hOPK%jzw#-P}zD}1IF~JO&UmbbgvJD1)%KadL6(#e`ac!W&
zdXf`D?SM-3;+JpODf>{V%)fQ|1RL15Vk+m0@nS7%96I?Jz@jWz0Tue}bvmX2!KsM2
zjQ>>9bP32%0G?$woFfy)<8?Oq8b)mwFk9^4W0Ze4<}V_xlhSf?6k(&)-hg2W49+99
zw6>N<P!|8rY_i^|{cRiPy#cx5AQrakR$9b1f;GM;pzpQ_e=g**HD1C5R5vBuZng)x
za{&&9>QxHisN;4?O&<_5;QQT-C<2mb&l+6!_u%N5{|bCyS<_Hqss<xH*}gd0pEqc}
zyLzKlWApJ@FI{gU^uIH)L(U{QivS#(ZPRIz_3tv#1#7Znb~MYW%0h`3mxK7SE{989
zQ@x_eta>+mR)4^<FkS6Soa(&(C5|DJEfyTf{LeS|$KV{4)~UvhfdXq4P_x+G>6#}p
z@Oj$4Z;ZccmWyT4G&pb5eU^M52ZXQwTKna=91bA3w55Hp+wi%&ao_#*5t$2#?$NzN
z3W@>i?HJhBc_A~GSs(5%34X5&J0f;Nzmu&oImM5Bv_RoX@`pu`ZT7mHc@^TTO+V1`
z=T3)BSuaN#>zw01e(lv?m$L_};buW=oP{w^T-tP&CLtvy2XcVhakKTGA5{xgX}w7g
zv*^o7Q}Wv-ra(+o1v<dntuFkMAK0|AG_tP1v0{^ueCbfk6#BS9*z({rMatlq?RBAE
zyec<-!JzRqopmsk>vax@>PNdZ^L=wop0`O@U($4&y(YbHz+w+;UWOW$+&=ysEffcf
zfR3mxnaW`ja!qQo-c4eQTig?dfy@2Rv{c0*kqv*b+@vQ*v)s7e`t5XeB7uRI%03DD
zq&FTh-R}~enl163Xo?9GMbC4Eb~uy~R^2_L17+al;k`5GhCy(#ocQ|j&a^-2$2EHk
z&><mrEust=4gk5vSr6Fx@Watc+9L?qw(#W3I+KO{16_FDhPF281HYUrpUQc~e>2iv
z8Ge~=@oI@@xCb9L@}Flhq=ooNAceAm1T6`y0F=f*hGTKS^taw-^_^^vNTHJp6byP^
zZRSHX<~>odl=(0du;^kBmwUFcDu9YJ`q{L>WtW&<i~J!)@qdX^X8J4Iwb1a{M_$J~
zh*+87eWn!_7Iql*sl|k-4BWMqS%i0rKAOL<wm7-l0<<Mi53_8a+Rimfve!J=v>_3+
zoOVjHEI$Zu5dQ2G@oU0<ko`o*gHdkKq+95Utq>%LGxtkQQ-SgaZr&K4(bd0C(}G3_
zrcKWKfZ&fRPMPDK0+OoHW)trr|4?#dq#Rmk`L_X<^O;QDmB5Pw?`|jLAHyhr;XPYv
z8Gl?@_NbZ~iXaSx&AN>I>1=U?rv1_wyNhU1BM>cyJ{NQ7S)T1o+H?`gYu_Ci@_;G1
zzyj-@S+gw5P+>qMpo)Wm29p`OR(5B$p=KbBn`u(bXwxtL573{s$853;uTQt1#M3DZ
zuRn@cuSn&90Vnv42~N=IC5McpDY}sQI%BB!E0FC4@(C~d-hj+Cpso&h;IYv1o9TxA
z<}d5}?GhyN+RekS3BhOGunisA1WG+azH;Z0w9S`M{qEtkv&$2OI7FaABU++x<pwXf
z(_qTN0F@>Qq=XPz*_mRkhr+iwJ~Z`N9c!R+QlMol6p|@3DB_5=Ju04sw*nc8mE@Uq
z%zB2WA{$p|qQgQ&N?%+J0=S|T;xC#H#2x|@NpK74zEhQ!9$o1mf!j1&1KdJ!P`SEM
zn;930C)Cdj8OL#94rmFRqlNJ<^+G^v(5kh|cKlwJQ~lU)buR1XXNKSx;om)ikJ`#Z
zDSR~VZjP01y@8+}(Dl7MV++8}m8SE#5gVe@wl{~jxn`Y<Nsvg;h@@#8*H!eG+iEn1
zS}JPeM!VXYK{*Am?q5-8JXM|7oClr`aC2_UXiXmPu`nXyg-=J-IE~ujni6L6Gkq8}
zhw@|-87n|R<bE<Fb$VnA8Wa+ny|1?z7`p5HhdGz*{$@LKaLkrQ#;x!PX24<2Ue5ad
zx%Cj;0QJh>C~1z=>Mo2=aegDBB~~^-(hdfzpyhK_7_`uIjqL=}RO9X0^q$!gCY7=_
zAM|||PXRfh%}lKdMp<h*FY^dIM>UAMV<_U+^eBPSlvw@)DzVrlLSKWn<r-+iF&E^1
zl2o7w#TfpKepk8j1S=~?Kmvwl0T(7ofQ)@(X{9&b_#(Oq1l>J37+g2lPceQ(FdV7W
zt9`L#4sOOeTtnj6`3uY6XdH*EsAM9-fcF3s3^L?LXvE)vV1FXOv#>S!Eq_mmQLnxd
zs5^`%Sf+28X|p2B9@{4~|LEYd*YG+h(HcCiQ-Yz1u}9Jz4n@k$+)xs0!KMKnAA_NR
z(MsqSy|vGA-u#6CM5%tXECU0nT>TYh{U=V41asp~u9&bbY?<g%-FOy~I8d5E^60yx
zezqfEVX~me%8`kuOIx@&T&5Kg5*j+Vi+rC{b?;EVOT#g9^csJ10~u{Ds2gq633(%4
zJ&yDj*@OL0UXJiz^4VvQJbMNa8ILjN-2OjZQi{|dk&);>0!}SJR7kVI?tE{S({WAy
zNB6g}&8M2oZ1;Zk0+KjD3XL>+$^Nz8cqx8HKOKQuu0Rd^|3?amBP2xf+@@FyRKr^=
z=|pzgVIwve4@nrv`FrUn|4TXxDL&wlaWUnY7*uoK#j^eLaSQZdBIGgOy?Yk}nsGFI
zNnZp7gACG+#=j#JLoSI~3vRr41#XY8ya>Dd<pQa#zu68L*L40pG`fKn9bo)?K?Yuj
z!TOhXAWmZqMjL%XbKENi38u(9#G8HJKO-j8SvO_hVf9Co*$nocpHhj3Y+&7(^(72N
zgqt*909$wRDlXTqvC-R2Ee7GqqpsGdBji#c0--$ugl$LQ;D*ahq%JR(qfg&Qe3-Zp
zN&TDmQNDybkaq_i9q=pzAbweG<7Wul^=`_gJ$uUt764`?C&&a}3x@k1EVS`4rhi$0
zr-+C(fktA+n<zC9z65oLH*HrLJD3p}7tnD-Yy#GLuGLr(HlDK}3G;^BU#F#vWdXth
zKSOcI2~ff1K#*Ah=HYP@biGjZQOBmPi|i$c?hr-QbR<uK5B0cf-uqnd+@8K4WD`~|
zBJBwi4(ROk;)7$v!?0;jbmpF9dVR`I3}UyWdjY9pppgbLg$)dCx(vmAD?l%dXd?g(
zdWKjZo?6BY7950mA1=KBs3K}`85NZcvS2{U|HhGdfGAq%%HlDB`{~wLJP5AA1ZDt=
zN>eHzdfi>Fa{}jf37QUI*ASvjloMKR&p!AF8Aa9B?98_qfZ9B-$9S~pRX+&ip;VC2
zJ6fn#_1U?xZE>05iDJ6pmk}Jqb5J^oi5UVOGhFpXgGkV$5(Gv8!!-5|V_o<wVG7Xr
zvpMuRbecH=Cz_P^69PuI9O&Y(haOpKI{>9g7Dci9=01*)g_aud{FRTPRwqF4atAr)
z%AdRaKk~05c$YO*Hh~Hh1JM$X*?%J#5!zp$P8gshG3CTS{Vhve!-mY8h3pcg9%iD|
zApp!XJ}Rfzf<J;OXa~B26&}Z|6yU)8j)^KOL9qrJnNB%_08$-8#*TQA&hM(2#{DJ_
z0W~|<13;yZ_zCpEkc6c*{8HX+dK<(6eQDxbWE28c8hc2|hRERWe!OP+;`y6#=G{`_
z+t>^1>1u`bK!(Q~rBC62oSmGMl0pdS%E|$qWJi#Wj}G8plR+whe8mO=@}{EgXn{)i
z=1d3&wA>Z@qA18uiR&q#taYlb3;CB8{m5*s*(X%vo`~2|_i`DdVz)lU94w@qlhF4%
ze9_hu12kqykc{T)#1blOUkbE4_OCh+snpT>OTaM?>57M<kM&{O+Jwvi=kIW`p#l>5
zXspf>3YazzlD2okwU1A3{A#E`5R!L7Jv?}(NCo`_N4ch4dgg^pt(VY-(ogHuTzRC`
zX};gbrMga>oJoR-|AN4^p>CB`;vSC_(U3p7|1h&ob@AM~@H`x<Ewx&n{E+w@hb#t8
z0m$mrcRT0KwH`BRe8sIj4lo_em?cBA9dL7mc+puS-Q>~t0sQE+G3y}%4))g$b+sn1
z(#9xlr?(Z+hM7lj&2b}b^-TTOe+vJ(`J6e%>#!o7@TSa?mX8<KyIjJk{gQ*P7n%Zw
z;N^x}Xe$l^ExUgLcr@+LcEpR8#+(jfzGzWKFDZlJIFbE>ew#S>+@9XaeA!NH=-S36
zdTVQIc2E)#+wOMP-ml#eg0`Bdp^s(q(b!hfj_TrSyA*|4WqmMn;&_E46Yq0Wph7?Y
zZsgf4KpBCL&{o=mQR+uXTRqNp7!15m6BE?Qc0u=5p9LyQX|$FtHLxs#TJmCpmgcO)
zeFj3AcZ-L>R1(2rR^5P`k4Hb3p<Kp99Ix2}EbCOe3!D*qAigIqvP@buK!Isl`9u!~
z<dIFD=i|0?OzOqI>Xy*x0A$n^nL6i2B(&<DMhxjNvEQ4vZP8<ry@6sMAdf2eX4aoK
z>#?X%?sm9TpBoL0Z4s=P!cJv4Cm;<XuK-Nj#dy~@qA%r*XH##60gDq{=ylvOV7KIr
zetAG!4My{H_S1_9IAq8EB$g>U^qwwAA6j(~XiXc5Q2NY01th%8wHMS_%&PCXw*?St
z341u($BS#Q8Y8pD5DV2y($-MtwkJxH`S%;u_>-TxE&RZ8{Kbx&i9C|k&VppB3*+y#
zZQM$kK5D{<=C$8WGhOtG>GGfh!}}`}F?~s-+=0grX0F~(gQzTN>zTg#<nAk2YJJ$q
z)u5!A(tYQyWKnp9lY+*sLd1k*Dk1Z}2FnCm&t$3kIR&W{f^gR)oS{0T-RB!q+pvyo
z>p=<1I%+eV8Wa^FJ7Opo@U<goWVO#vlU9b0qB5~sbUv{!`eH%QYF0{H0*_%URNIu3
zg`lyZLgTF)3a%)Kv$=rB&V_Pzp06~%_d_C`HW7Qa0x~e{6P0#Hq;#3jffQ;Ud!XsW
z`{vuA&`62w2~)=yfe+z^MjlVRNZCjf`|l3NKCH8$%(uk^VenXu(Ih?TGVgL9L31@b
zAA>d&qqbz$dV9l?z#5u;%hy01MA!mxHAQu(J&2$2q-1fo>jKVda_0dS*MVA5$ByIt
zBBdrwi05RYZDvEMEd1(i&1{}<w@yM!tqY3M&uK*5EpUrlE~x%hH?1%O9194yNt#~~
zF+>sb@>@IK+f_~-2D$-Ku&e$ysfPyIWGZ&@MHDbBhKsjE6vYTguOD|?SjqEm&9}5%
z^DGhd$m53%SxdGS+v>@ScQ|%95+j`*MsjpoYfIilHdf_e;9ywD)3z0@&9S74d`Vm&
zt&Br$Lu47;N0dr)gUX^k1$h#&O1yOo=y<B>i30HU39rq%9~e->t9SX&vDv#htu~@X
zggJ0O=Vu8Mm8iNsZzI(dkM-zYY<5J1<KHci#^M(JlLmp5e?sQGjuoh-Z4Vv#ETzI?
zc+Mi&=IaYkGe}a*1I8aef;RSX1<6MaaOaTjn%S=4D&a-GUv4%}l9NoRa?2I~jXHGM
z+Q%tKPmzy~{fH^Bu($$+fuQ8ii)AaU*^IFFb-@Os|JV&BAwcC(KK(oCG0Mo=PmM{s
zJUAy$B)>{e8pG4dNu&=t9-BraalSx#x4ksk*~4aVAlb8zPHpHig;f;X%rFof0^hB+
zKnTl%RvR8T|2o_e32s~G9I%9mZ-k8M#q@wb5HuQQ_oKw=YX8hlsEE@UZVyuJc%s?%
zUGe6EqmjrQsxssNHY96o3iMgI@71kW%3v9}UAO6|N^bTKkdhT@`}W!24peR%42+n^
zNUX7;q~juBvvci!FTgLxz92KgB-bVmfq)9o!6o<>FQ7ug7hnG3LQpkbic)jFo{$Ws
z)Y>8|Yk%rnEaV<O$Jb*U{29w({YdlL#1KZ(JUbI!xD|9(TGqVP<m<^4QCa#yfOEj1
z2S;5UIZicP09wEHmY*ijOCq(yld9u=r(X(JGv8=>Gg8c_fo>CP0s5Yo$@(G(6!|%i
zI{WGKaEVF~s7aAWF;Stk0r_eb<;BYrr4^`FPETls#8(Er61Y2a4hlpcl=A4y^pK0R
z$3vBtYHgunFpH9uv?Ec5r)?s&Kry-K3Ql^WFUFDKx5Nxn_tkx;;bd^%Qq9f`J%Yh!
zj9PihH07=iP+&m~rb~baoLD$?iM*pcM++ua(n~$l;D#x%<V0Z39xw3jBFbXQt%)vV
z!&996>Cg_`d=cW%iCYQ~0`k=t0r<d!U!OWtpmHLRwl)1GGv`$X9qVk_U{XgZ->F4B
zlG{<T97Q0*qwdn5rN@d*D!}q=Yf>kcdvxpeRo!@W%CQQYIub}O{tHOJgb{f`_A3=#
z+?~LtBwEw0rX-l#RBssGRx|JO<(jMffFDp7N)Z3`(Q372jKAMV!erB6?o?8*yyt+r
za6`!>&PohpkkRZ7>2G$&S#rg$RfNEqF<ExfNy5lLUO__d;8<7Pk`+F$y;#769_!hE
zx)WoxGOWgBb8x;&V%obBu=p6Zl^^~cmu&bZg%F7+5oF2nUlMsvT@34X<tde-EW-FJ
zUa{UBwmfAr-!m`G)6yS!2e+e0X$op!w}opwN7}{1yI=zSUwhR7dL^BEt(rpE(n>H$
z>x!~FX$$K-`IQ5_TQ123Grgsp3BxDu<VZYWBHwZ8)D_%7&w14(o?NRTI_*H2LfTV%
zY>cGDzeLmz&I=ncwSC~j^U|MC9pmMUkKmZ138N64{H{W?_YMrC|3gKwz}teB*Fb4x
z(F6O)Pc-lmQNtd~cu!8d)A9oP-wMc295G1V=u<PKu*kTG<TXf<p9PSQhD9D#FaH6U
z0fivwrIGp<bp^?2@)8ZexHvW8rlx7OpNc%xQBX*JezX}r`kuSoT1_6@iM0D1f6@G3
z62l@Nh>Y(OvJ6wnS#DU8Z-@ssIMyT>ZGSH-`N8eTLgodpfx_p)DAPHFGxvXA7MSGg
zfs}0C%D2<%MIcaGlus3Fm6nJuKUMu#!D&KDOXF~)N7sg%RLsvM{yls?1WPFa-%ktn
zBYZG3%FwHG$i2p)pxAdZXBNJ%{s^)EgYAPN1iS>`<&et9Hf4gY@3E31K+o+G+t?KU
zN<mXlg<Ei+=zR*_-0m1RldN;r#Q2-fvcXWjHG;@g4V@@KWd<!iC$uDpn9+c)fM@v~
zCnAlv1_l*UxIi;q?R*<lHF`wT8F+sc7aG8OfuJPHp#Ai~_}k8O<?`EB&ijwjNKxh>
zJNCxW_OA9U-@lz^K^i6r^~#<G2|w+@9AF^A8&qiMKSmGPjT5u*7n*>V{xA41CZLsO
z4gXE*4s*T&rNqf0P^smB&XxnxvN$FU)&|_n2chwM7994Q&rV-gz>W|I00yv_2|~I7
z1Af9V1W`;oFoY9;s9VC5{S+(n-wrHw?6OxVju!`uoFMzz9Q%@-&gU$POu)(v@Nk0H
z<xw5cXsLn00Y?smH-Q%0&0pDpSUEKi=6Z4A)?{mq^J0PEpL7-ASAx3+YRz1ri_~8L
zKRO=n00hx6+`QMbAnn$eZ1HUwEzz0a(%e4>ZLGk^vd^O_gfmunU?1k2k`N-=Ze%uk
zT~;*Q0L4w_WY$|`mz2j&gwJJ%9wg}T#$Dm=<ippX!mtk=0|jZ*Albw9rIDa@P5~qX
zkY8O7qY@dkvob<tZPn8FCrYy4%zvz8hmyx-2zt`-{``-|&ke-z0Z?)E0_5XF24Dj#
z(7+Qp&H6U>EjTiSytRL33bO$almI$idqLa2*pI-?dxMVgQ-a*A_ti;kAOZ$tZ__H+
zUy%fOxvYdl5UU%w{7E^G2>L)hX$l}?9M@~b+qMF&e=AT^rd8cL1+)qi$dj}oYV5r3
zOX$@*2f9pCw5TX+azEM6|2!DVUnx7-`&5Ux=Rab{38f)ZytN0EVaCI1G7JG7Ekv@B
z_W~H^8Q2=vafeU&@Tgqi@Q1STz1Hks_CzF@=&S|``rbjMKzd_Bu$S+Tf&`%%2g+LD
z5%2fQwW0zd&6PlSziEnc2ej3M+_H#3-Cx!mvdu2Lljr`(ND1iZJGRg;_wqM8kkv;}
zX}j+|8KNh^vqrusm=AJ35jZrb=eYOYBENCK(!bX6gSxkc0mvRb@i6=QqxK9aJoDf4
zFmU%B5dZV2|Nqab#N_){z<Er8+6K1lSc2Za2nk8Lu}uP2-54S+^Y5VJas}*KhzAa4
zs)U#s<38>@qK<h<l4}C5QLIVzcB(S=_is%iZmR^)P(A(Ha;o|*6WBABOUmaYz1Mtg
zGuiCjFzAL#^Pop7WBtE4pY3bNUN;Kg8!7~J(wKMe5PLxze<T^dx?~jTW>m+&^?~?z
z5d(2R7L?ykWRB}UOYl~~I>%;^?<@p6#?+JEAv*3npZAIn>Ic|r6>K%)Bkgkr=t*XY
zh5$1&hSL6!m6yzuwyuDRmmG(Tp~dWdLjP;4U>ZTLFw;w;Qi)>D9y+Qvu!E<o_cG$p
zJWkO$y`@637h?#^fq}(+K!*h@_Kkev?5gT{cO8?%rEEaqMdABOL8(d!h7ZbVM=2Z{
zhwQK4!9;@%L}B#`!xApHX<C8^x|aPWODkD!q=L>23YwJhvn}S>GVf%#$gxsC(U{-B
zIin5CQe;rN>`txv2ziD~d(W#Q9}nlsIe^xs=iit#MmxSQ^P{JP1-fx?a9~sTp0@ey
zH=WCZ0thqxaj&y@xFX6`4sa+$&#Y4#K}(2e<_GmBK#f!94TEfD%kw!4uI9<n``Wge
z!2M=?K~eg}4n)B8x!!#~Tay`X$}CvrMtpPub_}inRzF;<#U;0$kk%=eM->g?4-zr4
z^VU-th1ii5U4eK(mQc$$OGM7{#P%R07r+aKLH5q;b5rYMh|l<vUWNNTkK}@Z?=9_|
zy<IVwAxT_!uzPRj+GVb-A6mOxk)d>q`4Ar&UX)xzrW9yLE$neUugE7yr>B9K>+Y+2
zO|`U|4M1;LhPV13$qts=h3R2@Y^%|NSiqg+*UP{b6$SvH68^O#r32RugzGOlAHgFv
zWW5Lpl?J*b3o~9k-9sY@7HICe2Cbtk+LbXtKkNs}Da1|hHTRJVdRUl+2`Qo;h{g+f
zp6xgQUMvT;H*$7XMTUpR0f56PK1z$5`2E9kw)rGM5n~XBl2`=A+C6JPl-MKKI-s+!
zI&+<K&!4dqCqAVJW;j3`Q^}OnJ6S`b5c1MIS|2QxYQ5q|@lH+gS(4zdZQ<ki+g&Q%
z+6-r1$i5p9L3^(tAZkDwl~5-lT0QRN)8CoE5Ax}KhU4yW1UpWm(j!c1D~{I(->`Nk
zP%<4ms7`&+D8=X5Wv3?OMLv&JOa#2Izbz2qqxOvx%X89ZLq2@4U*ToSxZUXoMjLZ^
z_clM;NT{E&)S=`9rUIyP3G`F|)A|ef0*TGzSN!5ofzRy~r{yqBizWXh6t38NV(zCH
zc5Mm%pi2n}w*ZG%;Cknqm5?skIc=M=KMXwbcK{=j=!*da<}~g^bWLd?<C$wsp!N+Q
zKy~Zti+>WmK;FI(4HTRUCz3F?+I-Mbwa3QW-@)OHYGyH8?;O|2e()9~mon`g43xhF
zZAp*43R`zzc<kFmcxTjV5e}9XS^R4~dsfeLKtPM<EN6xrF<iKI0UREtrH-%`PDzsR
z5G5G8EpW_}6rXe$D6?8yV_%*C)eF~+zfZct=hmZc`)k8VL<bNNAiYv)2ww0eP$^W3
zOMb~DqbRT=l#o3rF6Zwyl|ie=m{E#&BmsS=LP_J*))$zGIFQ<BuZ4QTv60oj{<Xyp
zcaEQDVWd0@jKUZ$|8ktZ15iO6z2&ED?|yJSbsVHd&!9>%vfKI1A=vR(8D(1otHAja
zah&I4(l%ceVM<wIEM*KX4JW5cIl+OOwE{ZwhJ<Bz?;F5y+7Zo@9d`3un1Z+aQn~WC
zfvA7x*^Gnn)N;5pcWvT|xt>$6A^p23gQxdy!a1HE+nAUWLn!H2AoVvS#Qib?t$h;{
zlg?z#;41{=Am0UmGlBO>{)BaG39#tI{#TV2Did!?o7PlWq`Y?kns#F74^kA@q6J)c
z%%M;{MJP|7Q5UQWm%=XO6W8T=(CXn#l;CSl{rwbVleMEKv=cz$)GZ2L7fY|iA0;^b
z06GT0fPJ>Cxf?im(5KG{Pj{y$PQfnA>*5-ZItOm+-^yIfuZj}3flqPyqaKsxLFLR)
zs>RApCUso5nfF0=tE($<#yt!<UeN$%_IR!*p#nS*E9;HAKrV2DtlVgWWC^6Mt`d6}
zw5|B&2m6E!La^o<DP)T=RJ0(2!@oT%Am?P@ovmK?le<3K^-jVt=eM<oL2%1#PdCcV
zayl#z4#O>x8Dt;$*Z~8>UT7Ret36?Xhf2gL0py&|WR8TVncQ!Z4EGknX6Sr{uVv3f
z$_SwwCAe+pX5JOm$f|5`60Z5ceR_qYq;2;kKcOaLJAEVP=|#Zm^+NBqKLUA-6uG-Z
zjoYmmitsOXt?Q!aDcPQ|EX<=Q<}#o8VK<vD*FJnos1Ue48A%(0bT4dmiG4$N%4n&`
zdF__vNj^a^F>+lKz@B1=mO0gCr!-hU#b?`6lz<?nm<1$sRxg;aQv5v5<@yB6AGzek
zUm<EzE_sxHoZTqLm{g&TXrD~*yaS2tsN!-KZd$WVfhO3+tJ}wvD0fOyzgN4AuBTC1
z5rR%ubUt*XhJl=X6uqTt&VB2?ksYerSD6?6IXFx`fvRuj%RWNqEAJ0iGe8+244s{Z
zh}-jAh{|h51lswshg-|C3=O0GI&n#1*QOCJAUEIG0+oTHH|V9S-;v#{b3C>-dQ?<n
zAHeyx!Te|XrmA=5SJ2i;+{S9=GG3zQ>NgS9a@_bSw|_$9ywM&t>B;i>XZ^2n3667(
z?rAK9;&ICvG|-P|sK6u>H~-9{p8NKB&U*ZO#xYvpYU6W&5Zg%v!?&-KYHukpe)cbV
zwWAW`+l#a?YYPKub5yY%FwYYCAR}cIZKb}Pf>NxTHL+i^omK)D5aH}s1$(C>CYFG%
zk-hVYHvyZzu9QEQgRLmxlGxfn>gVg1LrRh3OkUBC=RrTPN2d9tEAv&<Sn$FavYB$8
z(QIaTGq>+j=^TB-BEK_e;i+fcU<%246?`WUNpz4TvhLoau)p6sd)&R>Gf`#G;8Id8
zVTh?GTbu7XyPG16XHKk-H@2Tck<pCb7~<ZWDFF8SLAtuWgAMr`Y~i0fUKvFAq<CtG
zHO<i?I}jrP8Z7&YNi{kpn77QdH|~@6hpCnD*kTZ{N1Z!A0TW)NLU5!Na{KNL_PN_U
z3gHxiBEQo7fzVf`U1jCrOioXsBuYB-rs&0&!0ZIWp9TQFscXAk2DBsP6bp=?blttq
z^v*N5h(zE?c#=X%8o1yU*5c7&{oe7p_3x~GiWJKCo{v8NY9nwy`S)z*d+q`nWvXE+
zuAc`8mEq^7-O6Q=T&c-y1QBU09XVS$VYZ;xi&S&N<pdWhH__%fprB!KBK<L%<tw_g
zDEg6;ej;@=7Wj;^p4!<J@&>WmseDPO9i6U{6FiAWy^>j9dXxxyt%uAx#(dX=F!Iz-
zahwVf8u{f}n6nUU3Va05v)EIHUv4Y)_*-HJI*kSn=4ywquIfw%i!z6tfV%R74j8Ww
zI~;z}EV5b41+le!3hAX+<&kP9E=Mc9R|4D)&sAz)8L(^0G~Lk3>Nk;YwAon^2ce%o
z>kUXO^#J0h$D&>Kj;!U@JpK|fM9O^YpkMD)h_1?p;i0VTuuim|zdk;)v!#c=Z?Z)z
zH&4Po|AheS$MUS}ymKKfnjU+<*nr*n&(QgJ>{=gJTET8i6hy-lnk!rOA}m=LVLP)T
zM<Q>YzQ#3TAd&u@yf9iwk7V8G5dVWizO@iA)akacXtZI9u8dyWUG!?bIf#%fybQ$f
zhK{m8kD@xKs}w7;x`etPxsS>>c$6zPI=WEst}5(reE(c$UVBCQby{c!E%OYAiUm6a
z7eKSKa%1+IMSka2e5t0WYqhI6i(wU{RrPAkOpmn+TP2QJ;QD+lEsE8|i9;XvW{iZ|
zYmAcbRwuwgc^03~o7%pSzMv4F57oQID((H<M_Shmdmj%Q*xBResKpnEw?p0g2rX3H
z&I%fB%;zV?rD{icY+9$LG8iftth+;x;v<dtKIzi>@rI{-cy~7!IjTW2aQZ6H)ro?1
zAeVjFBiy5G<N8sL*I}Fez;4%u@(EVac;XC5Kr>``tPGmyH+nC&Xoqc^7AFxu$9W%$
zn3W%4rF<%#aHP6i`RRyT@Fw_0%PwfRFV?VA9kDn4l_jcJ9P+kbKG<?vt|K5;WDC)d
zNTBxn_I!))7Pf59H?-hQUOgJJh~<=Gj;=@EQ<|JZgt%)d?bEecFH@d1^Dq-bzAIxu
z<`vyCjiY?WN0jYMA&_Q_gz`Jy_s7~1LMt-a|AsfQzi$&B4h8wxmEG&F_vJ4-wMg)0
z8A|ukeREe11}LOY7JuqK^b|{iYS@S%vg`g_(i9*O+wAyQcmHOdNKn3auo6bxcPhvH
zw+l1Mhw8E8-*?MWdV{h%55sj$_WpZL*ukmL8w{Br`q!^O@hnfVH*il`TaCaokh!#J
z>fV#g6Hx7^3eBW4-DA@Za4No?fb!b=XV`?a!h6?pY20I#Q1F#0PXG0RTmQh;-gF6b
Ub4Tw%zG_J3g`&h)F~flW1=?|Ev;Y7A

diff --git a/requirements.txt b/requirements.txt
index 4ac0a8a047..2e23b0a981 100644
--- a/requirements.txt
+++ b/requirements.txt
@@ -7,3 +7,13 @@ pybind11
 cmake-build-extension
 ninja
 requests
+qualname
+regex
+requests
+--index-url https://download.pytorch.org/whl/cpu torch
+--index-url https://download.pytorch.org/whl/cpu torchaudio
+--index-url https://download.pytorch.org/whl/cpu torchvision
+onnx
+transformers
+sentencepiece
+einops

From 4fd369ae121131a98896562b10c30374fd592b28 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Wed, 16 Aug 2023 15:22:41 -0500
Subject: [PATCH 198/344] Fix CUDA Error in the sampling operator (#966)

* fix sampling issue

* rename SamplingConfig as GenerationConfig to be consistent with HuggingFace

* no longer need to pass mode to compile

* .

* prettier print

* sampling_config -> generation_config

* fix  python interface

---------

Co-authored-by: xinhaoc <chengxh_98@163.com>
---
 include/flexflow/flexflow_c.h                 |  5 +-
 include/flexflow/inference.h                  |  6 +-
 inference/incr_decoding/incr_decoding.cc      |  6 +-
 inference/models/llama.cc                     |  8 +-
 inference/models/llama.h                      |  2 +-
 inference/models/starcoder.cc                 | 10 +--
 inference/models/starcoder.h                  |  2 +-
 inference/python/incr_decoding.py             |  7 +-
 inference/python/spec_infer.py                | 10 +--
 inference/spec_infer/spec_infer.cc            |  6 +-
 python/flexflow/core/flexflow_cffi.py         |  6 +-
 python/flexflow/serve/__init__.py             | 20 ++---
 python/flexflow/serve/models/base.py          |  2 +-
 python/flexflow/serve/models/falcon.py        | 10 +--
 python/flexflow/serve/models/llama.py         | 10 +--
 python/flexflow/serve/models/opt.py           | 10 +--
 python/flexflow/serve/models/starcoder.py     | 24 +++---
 python/flexflow/serve/serve.py                | 41 ++++-----
 src/c/flexflow_c.cc                           |  9 +-
 src/ops/linear.cc                             |  8 +-
 src/ops/sampling.cc                           | 13 ++-
 src/runtime/request_manager.cc                | 86 ++++++++++++-------
 .../python_test_configs/generate_configs.py   |  2 +-
 23 files changed, 170 insertions(+), 133 deletions(-)

diff --git a/include/flexflow/flexflow_c.h b/include/flexflow/flexflow_c.h
index f2deacd8d7..76cfd16ee1 100644
--- a/include/flexflow/flexflow_c.h
+++ b/include/flexflow/flexflow_c.h
@@ -97,11 +97,14 @@ void flexflow_config_set_pipeline_parallelism_degree(flexflow_config_t handle_,
 
 int flexflow_config_get_python_data_loader_type(flexflow_config_t handle);
 
+bool flexflow_config_get_offload(flexflow_config_t handle);
+
 // -----------------------------------------------------------------------
 // FFModel
 // -----------------------------------------------------------------------
 
-flexflow_model_t flexflow_model_create(flexflow_config_t config);
+flexflow_model_t flexflow_model_create(flexflow_config_t config,
+                                       bool cpu_offload);
 
 void flexflow_model_destroy(flexflow_model_t handle);
 
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index 4e7d9ffcbc..f24a797ffd 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -20,16 +20,16 @@
 
 namespace FlexFlow {
 
-struct SamplingConfig {
+struct GenerationConfig {
   bool do_sample = false;
   float temperature = 0.8;
   float topp = 0.6;
-  SamplingConfig(bool _do_sample, float _temperature, float _topp) {
+  GenerationConfig(bool _do_sample, float _temperature, float _topp) {
     temperature = _temperature > 0 ? _temperature : temperature;
     topp = _topp > 0 ? _topp : topp;
     do_sample = _do_sample;
   }
-  SamplingConfig() {}
+  GenerationConfig() {}
 };
 
 struct GenerationResult {
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index e94cb4a4e9..e60e6a5283 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -180,7 +180,7 @@ void FlexFlow::top_level_task(Task const *task,
   assert(model_type != ModelType::UNKNOWN &&
          "Invalid LLM model type passed (or no type was passed).");
 
-  SamplingConfig samplingConfig(do_sample, temperature, topp);
+  GenerationConfig generationConfig(do_sample, temperature, topp);
   RequestManager *rm = RequestManager::get_request_manager();
   rm->register_tokenizer(model_type, tokenizer_filepath);
   rm->register_output_filepath(file_paths.output_file_path);
@@ -191,7 +191,7 @@ void FlexFlow::top_level_task(Task const *task,
                               config_filepath,
                               weights_filepath,
                               INC_DECODING_MODE,
-                              samplingConfig,
+                              generationConfig,
                               use_full_precision);
   } else if (model_type == ModelType::OPT) {
     OPT::create_opt_model(model,
@@ -210,7 +210,7 @@ void FlexFlow::top_level_task(Task const *task,
                                       config_filepath,
                                       weights_filepath,
                                       INC_DECODING_MODE,
-                                      samplingConfig,
+                                      generationConfig,
                                       use_full_precision);
   } else {
     assert(false && "unknow model type");
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index 5a607e4872..e2eabec341 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -24,7 +24,7 @@ void LLAMA::create_llama_model(FFModel &ff,
                                std::string const &model_config_file_path,
                                std::string const &weight_file_path,
                                InferenceMode mode,
-                               SamplingConfig samplingConfig,
+                               GenerationConfig generation_config,
                                bool use_full_precision) {
   // do not apply cpu offload in beam search model.
   LLAMAConfig llama_config(model_config_file_path);
@@ -190,10 +190,10 @@ void LLAMA::create_llama_model(FFModel &ff,
     output = ff.argmax(softmax, /*beam_Search*/ true);
   } else {
     // Tensor softmax = ff.softmax(dense, -1);
-    if (samplingConfig.do_sample) {
-      dense = ff.scalar_truediv(dense, samplingConfig.temperature, false);
+    if (generation_config.do_sample) {
+      dense = ff.scalar_truediv(dense, generation_config.temperature, false);
       Tensor softmax = ff.softmax(dense, -1);
-      output = ff.sampling(softmax, samplingConfig.topp);
+      output = ff.sampling(softmax, generation_config.topp);
     } else {
       // output = ff.arg_top_k(dense, /*k=*/1, false);
       output = ff.argmax(dense, /*beam_Search*/ false);
diff --git a/inference/models/llama.h b/inference/models/llama.h
index 311bdedbe6..f01a7dbd52 100644
--- a/inference/models/llama.h
+++ b/inference/models/llama.h
@@ -81,7 +81,7 @@ class LLAMA {
                                  std::string const &model_config_file_path,
                                  std::string const &weight_file_path,
                                  InferenceMode mode,
-                                 SamplingConfig samplingConfig,
+                                 GenerationConfig generation_config,
                                  bool use_full_precision = false);
 };
 
diff --git a/inference/models/starcoder.cc b/inference/models/starcoder.cc
index fcd41e21ea..4b27498cfd 100644
--- a/inference/models/starcoder.cc
+++ b/inference/models/starcoder.cc
@@ -25,7 +25,7 @@ void STARCODER::create_starcoder_model(
     std::string const &model_config_file_path,
     std::string const &weight_file_path,
     InferenceMode mode,
-    SamplingConfig samplingConfig,
+    GenerationConfig generationConfig,
     bool use_full_precision) {
   // do not apply cpu offload in beam search model.
   STARCODERConfig startcoder_config(model_config_file_path);
@@ -151,8 +151,6 @@ void STARCODER::create_starcoder_model(
                            l2_layer);
 
     // mlp
-    std::cout << "intermediate_size: " << startcoder_config.intermediate_size
-              << "\n";
     Tensor c_fc = ff.dense(
         l2_norm, startcoder_config.intermediate_size, AC_MODE_NONE, true);
     Layer *c_fc_layer = ff.layers.back();
@@ -185,10 +183,10 @@ void STARCODER::create_starcoder_model(
     output = ff.argmax(softmax, /*beam_Search*/ true);
   } else {
     // Tensor softmax = ff.softmax(dense, -1);
-    if (samplingConfig.do_sample) {
-      lm_head = ff.scalar_truediv(lm_head, samplingConfig.temperature, false);
+    if (generationConfig.do_sample) {
+      lm_head = ff.scalar_truediv(lm_head, generationConfig.temperature, false);
       Tensor softmax = ff.softmax(lm_head, -1);
-      output = ff.sampling(softmax, samplingConfig.topp);
+      output = ff.sampling(softmax, generationConfig.topp);
     } else {
       output = ff.argmax(lm_head, /*beam_Search*/ false);
     }
diff --git a/inference/models/starcoder.h b/inference/models/starcoder.h
index af0732f3c4..9789a1c36e 100644
--- a/inference/models/starcoder.h
+++ b/inference/models/starcoder.h
@@ -69,7 +69,7 @@ class STARCODER {
                                      std::string const &model_config_file_path,
                                      std::string const &weight_file_path,
                                      InferenceMode mode,
-                                     SamplingConfig samplingConfig,
+                                     GenerationConfig generationConfig,
                                      bool use_full_precision = false);
 };
 
diff --git a/inference/python/incr_decoding.py b/inference/python/incr_decoding.py
index b3cee48458..1ed7791143 100644
--- a/inference/python/incr_decoding.py
+++ b/inference/python/incr_decoding.py
@@ -43,7 +43,7 @@ def get_configs():
             # required parameters
             "num_gpus": 4,
             "memory_per_gpu": 14000,
-            "zero_copy_memory_per_gpu": 30000,
+            "zero_copy_memory_per_node": 30000,
             # optional parameters
             "num_cpus": 4,
             "legion_utility_processors": 4,
@@ -92,12 +92,11 @@ def main():
     )
 
     # Compile the LLM for inference and load the weights into memory
-    sampling_config = ff.SamplingConfig(
+    generation_config = ff.GenerationConfig(
         do_sample=False, temperature=0.9, topp=0.8, topk=1
     )
     llm.compile(
-        ff.InferenceMode.INC_DECODING_MODE,
-        sampling_config,
+        generation_config,
         max_batch_size=1,
         max_seq_length=256,
         max_tokens_per_batch=64,
diff --git a/inference/python/spec_infer.py b/inference/python/spec_infer.py
index a19a930f2d..192960b533 100644
--- a/inference/python/spec_infer.py
+++ b/inference/python/spec_infer.py
@@ -43,7 +43,7 @@ def get_configs():
             # required parameters
             "num_gpus": 4,
             "memory_per_gpu": 14000,
-            "zero_copy_memory_per_gpu": 30000,
+            "zero_copy_memory_per_node": 30000,
             # optional parameters
             "num_cpus": 4,
             "legion_utility_processors": 4,
@@ -126,15 +126,14 @@ def main():
         ssms.append(ssm)
 
     # Create the sampling configs
-    sampling_config = ff.SamplingConfig(
+    generation_config = ff.GenerationConfig(
         do_sample=False, temperature=0.9, topp=0.8, topk=1
     )
 
     # Compile the SSMs for inference and load the weights into memory
     for ssm in ssms:
         ssm.compile(
-            ff.InferenceMode.BEAM_SEARCH_MODE,
-            sampling_config,
+            generation_config,
             max_batch_size=1,
             max_seq_length=256,
             max_tokens_per_batch=64,
@@ -142,8 +141,7 @@ def main():
 
     # Compile the LLM for inference and load the weights into memory
     llm.compile(
-        ff.InferenceMode.TREE_VERIFY_MODE,
-        sampling_config,
+        generation_config,
         max_batch_size=1,
         max_seq_length=256,
         max_tokens_per_batch=64,
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 67faf98536..975b66c82e 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -253,7 +253,7 @@ void FlexFlow::top_level_task(Task const *task,
          ffconfig.numNodes * ffconfig.workersPerNode);
 
   // Create SentencePiece tokenizer or OPT tokenizer
-  SamplingConfig samplingConfig;
+  GenerationConfig generationConfig;
   InferenceManager *im = InferenceManager::get_inference_manager();
   RequestManager *rm = RequestManager::get_request_manager();
   rm->register_tokenizer(model_metadata.llm_model_type,
@@ -268,7 +268,7 @@ void FlexFlow::top_level_task(Task const *task,
                               model_metadata.llm_model_config_path,
                               model_metadata.llm_weights_path,
                               TREE_VERIFY_MODE,
-                              samplingConfig,
+                              generationConfig,
                               use_full_precision);
   } else if (model_metadata.llm_model_type == ModelType::OPT) {
     OPT::create_opt_model(tree_model,
@@ -306,7 +306,7 @@ void FlexFlow::top_level_task(Task const *task,
                                 model_metadata.ssm_model_config_paths[ssm_id],
                                 model_metadata.ssm_model_weights_paths[ssm_id],
                                 BEAM_SEARCH_MODE,
-                                samplingConfig,
+                                generationConfig,
                                 use_full_precision);
     } else if (model_metadata.ssm_model_types[ssm_id] == ModelType::OPT) {
       OPT::create_opt_model(beam_model,
diff --git a/python/flexflow/core/flexflow_cffi.py b/python/flexflow/core/flexflow_cffi.py
index 48193720eb..9fa3ab3aad 100644
--- a/python/flexflow/core/flexflow_cffi.py
+++ b/python/flexflow/core/flexflow_cffi.py
@@ -667,6 +667,10 @@ def pipeline_parallelism_degree(self, value):
   @property
   def python_data_loader_type(self):
     return ffc.flexflow_config_get_python_data_loader_type(self.handle)
+  
+  @property
+  def cpu_offload(self):
+    return ffc.flexflow_config_get_offload(self.handle)
 
   def get_current_time(self):
     return ffc.flexflow_get_current_time(self.handle)
@@ -1020,7 +1024,7 @@ def __init__(self, ffconfig):
 
     :returns:  FFModel -- the model.
     """
-    self.handle = ffc.flexflow_model_create(ffconfig.handle)
+    self.handle = ffc.flexflow_model_create(ffconfig.handle, ffconfig.cpu_offload)
     self._handle = ffi.gc(self.handle, ffc.flexflow_model_destroy)
     self._layers = dict()
     self._nb_layers = 0
diff --git a/python/flexflow/serve/__init__.py b/python/flexflow/serve/__init__.py
index 8b054f0120..315a1e4317 100644
--- a/python/flexflow/serve/__init__.py
+++ b/python/flexflow/serve/__init__.py
@@ -41,7 +41,7 @@ def init(configs: Union[str, dict]):
     The init function takes three mandatory parameters, which cannot be changed after starting the runtime. These are:
     - num_gpus: the number of GPUs to reserve for the runtime
     - memory_per_gpu: the amount of memory (in MB) to pre-allocate on each GPU
-    - zero_copy_memory_per_gpu: the amount of zero-copy memory (in MB) to pre-allocate for each GPU
+    - zero_copy_memory_per_node: the amount of zero-copy memory (in MB) to pre-allocate for each node
 
     In addition, the following optional parameters can be passed:
     - num_cpus: the number of CPU processors to reserve for the runtime, defaults to 4
@@ -59,7 +59,7 @@ def init(configs: Union[str, dict]):
     :param configs: The runtime configs, in the form of a dictionary or the path to a JSON file
     :type configs: Union[str, dict]
     :raises ValueError: This function will raise an exception if the JSON file pointed to by the input string is not in the right format
-    :raises ValueError: This function will raise an exception if the mandatory FlexFlow initialization parameters are missing, or are not positive integers: num_gpus, memory_per_gpu, zero_copy_memory_per_gpu
+    :raises ValueError: This function will raise an exception if the mandatory FlexFlow initialization parameters are missing, or are not positive integers: num_gpus, memory_per_gpu, zero_copy_memory_per_node
     """
     configs_dict = {}
     if type(configs) == str:
@@ -82,15 +82,15 @@ def init(configs: Union[str, dict]):
     # configs should contain the following mandatory keys with non-zero integer values:
     num_gpus = configs_dict.get("num_gpus")
     memory_per_gpu = configs_dict.get("memory_per_gpu")
-    zero_copy_memory_per_gpu = configs_dict.get("zero_copy_memory_per_gpu")
-    if not num_gpus or not memory_per_gpu or not zero_copy_memory_per_gpu:
+    zero_copy_memory_per_node = configs_dict.get("zero_copy_memory_per_node")
+    if not num_gpus or not memory_per_gpu or not zero_copy_memory_per_node:
         raise ValueError(
-            "Missing one of the following configs: num_gpus, memory_per_gpu, zero_copy_memory_per_gpu"
+            "Missing one of the following configs: num_gpus, memory_per_gpu, zero_copy_memory_per_node"
         )
     _parse_positive_int_config("num_gpus", num_gpus, "-ll:gpu")
     _parse_positive_int_config("memory_per_gpu", memory_per_gpu, "-ll:fsize")
     _parse_positive_int_config(
-        "zero_copy_memory_per_gpu", zero_copy_memory_per_gpu, "-ll:zsize"
+        "zero_copy_memory_per_node", zero_copy_memory_per_node, "-ll:zsize"
     )
 
     # parse optional arguments
@@ -141,8 +141,8 @@ def init(configs: Union[str, dict]):
     if fusion:
         sys.argv += ["--fusion"]
 
-    global LLM, SSM, SamplingConfig
-    from .serve import LLM, SSM, SamplingConfig
+    global LLM, SSM, GenerationConfig
+    from .serve import LLM, SSM, GenerationConfig
 
 
 def init_cpu():
@@ -154,5 +154,5 @@ def init_cpu():
     # Ask the runtime to avoid using GPU/GPU memory
     os.environ["CPU_ONLY_TEST"] = "1"
 
-    global LLM, SSM, SamplingConfig
-    from .serve import LLM, SSM, SamplingConfig
+    global LLM, SSM, GenerationConfig
+    from .serve import LLM, SSM, GenerationConfig
diff --git a/python/flexflow/serve/models/base.py b/python/flexflow/serve/models/base.py
index 7538ed1676..b7f4e54fc1 100644
--- a/python/flexflow/serve/models/base.py
+++ b/python/flexflow/serve/models/base.py
@@ -17,7 +17,7 @@ class FlexFlowModel:
     def __init__(
         self,
         mode,
-        sampling_config,
+        generation_config,
         ffconfig,
         hf_config,
         data_type,
diff --git a/python/flexflow/serve/models/falcon.py b/python/flexflow/serve/models/falcon.py
index 5cb5443f42..4fcaca6c33 100644
--- a/python/flexflow/serve/models/falcon.py
+++ b/python/flexflow/serve/models/falcon.py
@@ -38,7 +38,7 @@ class FlexFlowFalcon(FlexFlowModel):
     def __init__(
         self,
         mode,
-        sampling_config,
+        generation_config,
         ffconfig,
         hf_config,
         data_type,
@@ -49,7 +49,7 @@ def __init__(
         tokenizer_filepath="",
     ):
         self.mode = mode
-        self.sampling_config = sampling_config
+        self.generation_config = generation_config
         self.ffconfig = ffconfig
         self.max_batch_size = max_batch_size
         self.data_type = data_type
@@ -204,12 +204,12 @@ def build_model(self):
             # output = ffmodel.beam_top_k(softmax, self.falcon_config.max_beam_width, False)
             output = ffmodel.argmax(softmax, True)
         else:
-            if self.sampling_config.do_sample:
+            if self.generation_config.do_sample:
                 dense = ffmodel.scalar_true_divide(
-                    lm_head, self.sampling_config.temperature, False
+                    lm_head, self.generation_config.temperature, False
                 )
                 softmax = ffmodel.softmax(dense, -1)
-                output = ffmodel.sampling(softmax, self.sampling_config.topp)
+                output = ffmodel.sampling(softmax, self.generation_config.topp)
             else:
                 # output = ffmodel.arg_top_k(lm_head, 1, False)
                 output = ffmodel.argmax(lm_head, False)
diff --git a/python/flexflow/serve/models/llama.py b/python/flexflow/serve/models/llama.py
index cb707f3e57..c716bff34d 100644
--- a/python/flexflow/serve/models/llama.py
+++ b/python/flexflow/serve/models/llama.py
@@ -35,7 +35,7 @@ class FlexFlowLLAMA(FlexFlowModel):
     def __init__(
         self,
         mode,
-        sampling_config,
+        generation_config,
         ffconfig,
         hf_config,
         data_type,
@@ -46,7 +46,7 @@ def __init__(
         tokenizer_filepath="",
     ):
         self.mode = mode
-        self.sampling_config = sampling_config
+        self.generation_config = generation_config
         self.ffconfig = ffconfig
         self.max_batch_size = max_batch_size
         self.data_type = data_type
@@ -214,12 +214,12 @@ def build_model(self):
             # output = ffmodel.beam_top_k(softmax, self.llama_config.max_beam_width, False)
             output = ffmodel.argmax(softmax, True)
         else:
-            if self.sampling_config.do_sample:
+            if self.generation_config.do_sample:
                 dense = ffmodel.scalar_true_divide(
-                    dense, self.sampling_config.temperature, False
+                    dense, self.generation_config.temperature, False
                 )
                 softmax = ffmodel.softmax(dense, -1)
-                output = ffmodel.sampling(softmax, self.sampling_config.topp)
+                output = ffmodel.sampling(softmax, self.generation_config.topp)
             else:
                 # output = ffmodel.arg_top_k(dense, 1, False)
                 output = ffmodel.argmax(dense, False)
diff --git a/python/flexflow/serve/models/opt.py b/python/flexflow/serve/models/opt.py
index a33b261cb7..d18c0d4cc9 100644
--- a/python/flexflow/serve/models/opt.py
+++ b/python/flexflow/serve/models/opt.py
@@ -40,7 +40,7 @@ class FlexFlowOPT(FlexFlowModel):
     def __init__(
         self,
         mode,
-        sampling_config,
+        generation_config,
         ffconfig,
         hf_config,
         data_type,
@@ -51,7 +51,7 @@ def __init__(
         tokenizer_filepath="",
     ):
         self.mode = mode
-        self.sampling_config = sampling_config
+        self.generation_config = generation_config
         self.ffconfig = ffconfig
         self.max_batch_size = max_batch_size
         self.data_type = data_type
@@ -261,12 +261,12 @@ def build_model(self):
             # output = ffmodel.beam_top_k(softmax, self.opt_config.max_beam_width, False)
             output = ffmodel.argmax(softmax, True)
         else:
-            if self.sampling_config.do_sample:
+            if self.generation_config.do_sample:
                 dense = ffmodel.scalar_true_divide(
-                    lm_head, self.sampling_config.temperature, False
+                    lm_head, self.generation_config.temperature, False
                 )
                 softmax = ffmodel.softmax(dense, -1)
-                output = ffmodel.sampling(softmax, self.sampling_config.topp)
+                output = ffmodel.sampling(softmax, self.generation_config.topp)
             else:
                 # output = ffmodel.arg_top_k(lm_head, 1, False)
                 output = ffmodel.argmax(lm_head, False)
diff --git a/python/flexflow/serve/models/starcoder.py b/python/flexflow/serve/models/starcoder.py
index 193f7c8e1a..ec02249841 100644
--- a/python/flexflow/serve/models/starcoder.py
+++ b/python/flexflow/serve/models/starcoder.py
@@ -23,21 +23,21 @@ def __init__(self, hf_config):
         self.max_num_tokens = 64
         self.max_beam_width = 1
         self.max_beam_depth = 8
-        self.dropout_p = hf_config.dropout_p
-        self.hidden_size = hf_config.hidden_size
+        self.dropout_p = hf_config.attn_pdrop
+        self.hidden_size = hf_config.n_embd
         self.layer_norm_epsilon = hf_config.layer_norm_epsilon
-        self.max_position_embeddings = hf_config.max_position_embeddings
-        self.num_attention_heads = hf_config.num_attention_heads
-        self.num_hidden_layers = hf_config.num_hidden_layers
+        self.max_position_embeddings = hf_config.n_positions
+        self.num_attention_heads = hf_config.n_head
+        self.num_hidden_layers = hf_config.n_layer
         self.vocab_size = hf_config.vocab_size
-        self.intermediate_size = hf_config.intermediate_size
+        self.intermediate_size = hf_config.n_inner
 
 
 class FlexFlowSTARCODER(FlexFlowModel):
     def __init__(
         self,
         mode,
-        sampling_config,
+        generation_config,
         ffconfig,
         hf_config,
         data_type,
@@ -48,7 +48,7 @@ def __init__(
         tokenizer_filepath="",
     ):
         self.mode = mode
-        self.sampling_config = sampling_config
+        self.generation_config = generation_config
         self.ffconfig = ffconfig
         self.max_batch_size = max_batch_size
         self.data_type = data_type
@@ -91,7 +91,7 @@ def build_model(self):
         position_tensor = ffmodel.create_tensor(tokens_dims, DataType.DT_INT32)
 
         embed_init = UniformInitializer(random.randint(0, self.maxint), 0, 0)
-        ffmodel.set_position_offset(2)
+        ffmodel.set_position_offset(0)
         token = ffmodel.embedding(
             input_tensor,
             self.starcoder_config.vocab_size,
@@ -193,12 +193,12 @@ def build_model(self):
             name="lm_head_weight",
         )
 
-        if self.sampling_config.do_sample:
+        if self.generation_config.do_sample:
             dense = ffmodel.scalar_true_divide(
-                lm_head, self.sampling_config.temperature, False
+                lm_head, self.generation_config.temperature, False
             )
             softmax = ffmodel.softmax(dense, -1)
-            output = ffmodel.sampling(softmax, self.sampling_config.topp)
+            output = ffmodel.sampling(softmax, self.generation_config.topp)
         else:
             output = ffmodel.argmax(lm_head, False)
 
diff --git a/python/flexflow/serve/serve.py b/python/flexflow/serve/serve.py
index 7abea56a7d..ad4e8f594b 100644
--- a/python/flexflow/serve/serve.py
+++ b/python/flexflow/serve/serve.py
@@ -25,7 +25,7 @@
 from typing import Union, List
 
 
-class SamplingConfig:
+class GenerationConfig:
     """A class to store the sampling configs."""
 
     def __init__(
@@ -250,8 +250,7 @@ def __load_hf_weights(self):
 
     def compile(
         self,
-        mode: InferenceMode = InferenceMode.INC_DECODING_MODE,
-        sampling_config: SamplingConfig = SamplingConfig(),
+        generation_config: GenerationConfig = GenerationConfig(),
         max_batch_size: int = 1,
         max_seq_length: int = 256,
         max_tokens_per_batch: int = 64,
@@ -264,8 +263,8 @@ def compile(
 
         :param mode: The LLM inference mode (InferenceMode.INC_DECODING_MODE for incremental decoding, InferenceMode.BEAM_SEARCH_MODE for beam search, or InferenceMode.TREE_VERIFY_MODE for token tree verification), defaults to InferenceMode.INC_DECODING_MODE
         :type mode: InferenceMode, optional
-        :param sampling_config: The SamplingConfig object with the configurations to use for sampling, defaults to SamplingConfig()
-        :type sampling_config: SamplingConfig, optional
+        :param generation_config: The GenerationConfig object with the configurations to use for sampling, defaults to GenerationConfig()
+        :type generation_config: GenerationConfig, optional
         :param max_batch_size: The maximum batch size to allow, defaults to 1
         :type max_batch_size: int, optional
         :param max_seq_length: The maximum sequence length to allow per batch, defaults to 256
@@ -285,12 +284,16 @@ def compile(
         self.max_seq_length = max_seq_length
         self.max_tokens_per_batch = max_tokens_per_batch
         self.ssms = ssms
-        self.sampling_config = SamplingConfig()
+        self.generation_config = GenerationConfig()
         self.ffconfig = FFConfig()
-        assert (
-            mode == InferenceMode.INC_DECODING_MODE
-            or mode == InferenceMode.BEAM_SEARCH_MODE
-        ) == (len(ssms) == 0)
+        if len(ssms) > 0:
+            assert type(self) == LLM
+            mode = InferenceMode.TREE_VERIFY_MODE
+        elif type(self) == SSM:
+            mode = InferenceMode.BEAM_SEARCH_MODE
+        else:
+            assert type(self) == LLM
+            mode = InferenceMode.INC_DECODING_MODE
 
         # Apply model-specific parallelism degrees, if needed
         if model_specific_data_parallelism_degree:
@@ -309,7 +312,7 @@ def compile(
         # Instantiate the relevant model
         self.model = self.model_class(
             mode,
-            sampling_config,
+            generation_config,
             self.ffconfig,
             self.hf_config,
             self.data_type,
@@ -336,7 +339,7 @@ def compile(
         for ssm in self.ssms:
             self.rm.register_ssm_model(ssm.model.ffmodel)
 
-    def generate(self, prompts: Union[str, List[str]]):
+    def generate(self, prompts: Union[str, List[str]], max_length: int = 128):
         """Generate tokens based on the input prompt(s)
 
         :param prompts: The generation prompt(s) in the form of a string, or list of strings
@@ -347,11 +350,11 @@ def generate(self, prompts: Union[str, List[str]]):
         if type(prompts) == str:
             if len(prompts) == 0:
                 return None
-            return self.model.ffmodel.generate(prompts, 128)
+            return self.model.ffmodel.generate(prompts, max_length)
         elif type(prompts) == list:
             if len(prompts) == 0:
                 return []
-            return [self.model.ffmodel.generate(prompt, 128) for prompt in prompts]
+            return [self.model.ffmodel.generate(prompt, max_length) for prompt in prompts]
         else:
             assert False, "Please pass a non-empty string or list of strings"
 
@@ -390,8 +393,7 @@ def __init__(
 
     def compile(
         self,
-        mode: InferenceMode = InferenceMode.INC_DECODING_MODE,
-        sampling_config: SamplingConfig = SamplingConfig(),
+        generation_config: GenerationConfig = GenerationConfig(),
         max_batch_size: int = 1,
         max_seq_length: int = 256,
         max_tokens_per_batch: int = 64,
@@ -404,8 +406,8 @@ def compile(
 
         :param mode: The SSM inference mode (InferenceMode.INC_DECODING_MODE for incremental decoding, InferenceMode.BEAM_SEARCH_MODE for beam search, or InferenceMode.TREE_VERIFY_MODE for token tree verification), defaults to InferenceMode.INC_DECODING_MODE
         :type mode: InferenceMode, optional
-        :param sampling_config: The SamplingConfig object with the configurations to use for sampling, defaults to SamplingConfig()
-        :type sampling_config: SamplingConfig, optional
+        :param generation_config: The GenerationConfig object with the configurations to use for sampling, defaults to GenerationConfig()
+        :type generation_config: GenerationConfig, optional
         :param max_batch_size: The maximum batch size to allow, defaults to 1
         :type max_batch_size: int, optional
         :param max_seq_length: The maximum sequence length to allow per batch, defaults to 256
@@ -422,8 +424,7 @@ def compile(
         :type ssms: list, optional
         """
         super().compile(
-            mode,
-            sampling_config,
+            generation_config,
             max_batch_size,
             max_seq_length,
             max_tokens_per_batch,
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index b1363faacc..47c5d59f66 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -170,14 +170,19 @@ int flexflow_config_get_python_data_loader_type(flexflow_config_t handle_) {
   FFConfig *handle = FFCObjectWrapper::unwrap(handle_);
   return handle->python_data_loader_type;
 }
+bool flexflow_config_get_offload(flexflow_config_t handle_) {
+  FFConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  return handle->cpu_offload;
+}
 
 // -----------------------------------------------------------------------
 // FFModel
 // -----------------------------------------------------------------------
 
-flexflow_model_t flexflow_model_create(flexflow_config_t config_) {
+flexflow_model_t flexflow_model_create(flexflow_config_t config_,
+                                       bool cpu_offload) {
   FFConfig *config = FFCObjectWrapper::unwrap(config_);
-  FFModel *model = new FFModel(*config);
+  FFModel *model = new FFModel(*config, cpu_offload);
   DEBUG_PRINT("[FFModel] new %p", model);
   return FFCObjectWrapper::wrap(model);
 }
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index 2376f80bec..21436d24d6 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -480,10 +480,10 @@ OpMeta *Linear::init_task_with_dim(Task const *task,
   // int in_dim = acc_kernel.rect.hi[0] - acc_kernel.rect.lo[0] + 1;
   int out_dim = acc_output.rect.hi[0] - acc_output.rect.lo[0] + 1;
   int batch_size = acc_output.rect.volume() / out_dim;
-  printf("init linear (input): in_dim(%d) out_dim(%d) batch_size(%d)\n",
-         in_dim,
-         out_dim,
-         batch_size);
+  // printf("init linear (input): in_dim(%d) out_dim(%d) batch_size(%d)\n",
+  //        in_dim,
+  //        out_dim,
+  //        batch_size);
   Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
                        .only_kind(Memory::GPU_FB_MEM)
                        .best_affinity_to(task->target_proc)
diff --git a/src/ops/sampling.cc b/src/ops/sampling.cc
index 79e6027b7c..6eb62b2933 100644
--- a/src/ops/sampling.cc
+++ b/src/ops/sampling.cc
@@ -256,12 +256,13 @@ FutureMap Sampling::inference(FFModel const &ff,
             << std::endl; */
   IndexLauncher launcher(SAMPLING_INF_TASK_ID,
                          parallel_is,
-                         TaskArgument(&bc, sizeof(BatchConfig)),
+                         TaskArgument(nullptr, 0),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
                          machine_view_hash);
+  launcher.add_future(bc);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
                                                     READ_WRITE,
@@ -284,8 +285,14 @@ InferenceResult
                              Runtime *runtime) {
   assert(regions.size() == 2);
   assert(task->regions.size() == 2);
-  BatchConfig const *bc = (BatchConfig *)task->args;
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  // BatchConfig const *bc = (BatchConfig *)task->args;
   SamplingMeta const *m = *((SamplingMeta **)task->local_args);
+  if (bc->num_tokens == 0) {
+    // Directly return for empty batch config
+    InferenceResult ir;
+    return ir;
+  }
 
   GenericTensorAccessorW input = helperGetGenericTensorAccessorRW(
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
@@ -344,4 +351,4 @@ size_t hash<FlexFlow::SamplingParams>::operator()(
   hash_combine(key, params.top_p);
   return key;
 }
-}; // namespace std
\ No newline at end of file
+}; // namespace std
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 0c32da3291..348272a69b 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -311,8 +311,8 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
       // This is a decoding token
       log_req_mgr.print("Output token is: %d", result.token_ids[i]);
       request.tokens.push_back(result.token_ids[i]);
-      std::string output = this->tokenizer_->Decode(request.tokens);
-      log_req_mgr.print("Output: %s", output.c_str());
+      // std::string output = this->tokenizer_->Decode(request.tokens);
+      // log_req_mgr.print("Output: %s", output.c_str());
     }
   }
   // Step 2: prepare the next batch for existing requests
@@ -334,9 +334,9 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
                         request.tokens.size());
       std::string output = this->tokenizer_->Decode(request.tokens);
 
-      for (int i = 0; i < request.tokens.size(); i++) {
-        std::cout << request.tokens.at(i) << "\n";
-      }
+      // for (int i = 0; i < request.tokens.size(); i++) {
+      //   std::cout << request.tokens.at(i) << "\n";
+      // }
       {
         // update generation result and trigger future
         GenerationResult &gr = request_generation_results[request.guid];
@@ -560,7 +560,7 @@ BeamSearchBatchConfig
           old_bc.beamRequestsInfo[i].max_depth;
 
       // do the slot exchange to minimize the cache exchange in kernel.
-      std::cout << "update metadata" << std::endl;
+      // std::cout << "update metadata" << std::endl;
       update_beam_metadata(new_bc, request.beam_trees.at(old_bc.model_id), i);
 
       if (new_bc.requestsInfo[i].token_start_offset + 1 >=
@@ -1368,26 +1368,39 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
   std::vector<std::pair<int, int>> new_committed_tokens =
       std::vector<std::pair<int, int>>();
 
-  log_req_mgr.print("Input size (%zu) Output size (%zu)",
+  log_req_mgr.print("Input tree size (%zu) Output tree size (%zu)",
                     inputSerializedTree.size(),
                     outputSerializedTree.size());
-
-  log_req_mgr.print("========Input============");
-  // inputSerializedTree is the dfs_tree_inputs_map[guid] array og (token id,
-  // depth) pairs
-  for (auto const &pair : inputSerializedTree) {
-    log_req_mgr.print("(%d, %d)", pair.first, pair.second);
+  { // Input tree
+    std::ostringstream oss;
+    // inputSerializedTree is the dfs_tree_inputs_map[guid] array og (token id,
+    // depth) pairs
+    for (auto const &pair : inputSerializedTree) {
+      oss << " " << pair.second << ":" << pair.first;
+      // log_req_mgr.print("(%d, %d)", pair.first, pair.second);
+    }
+    log_req_mgr.print("Input tree:%s", oss.str().c_str());
   }
-  log_req_mgr.print("========Output============");
-  // outputSerializedTree is an array of (token id, depth + 1) pairs
-  for (auto const &pair : outputSerializedTree) {
-    log_req_mgr.print("(%d, %d)", pair.first, pair.second);
+  { // Output tree
+    // log_req_mgr.print("========Output============");
+    // outputSerializedTree is an array of (token id, depth + 1) pairs
+    std::ostringstream oss;
+    for (auto const &pair : outputSerializedTree) {
+      // log_req_mgr.print("(%d, %d)", pair.first, pair.second);
+      oss << " " << pair.second << ":" << pair.first;
+    }
+    log_req_mgr.print("Output tree:%s", oss.str().c_str());
   }
-  log_req_mgr.print("========Committed============");
-  // committed_tokens[guid] is an array of (depth, result_index) pairs for the
-  // given request
-  for (auto const &pair : committed_tokens.at(guid)) {
-    log_req_mgr.print("(%d, %d)", pair.first, pair.second);
+  {
+    // log_req_mgr.print("========Committed============");
+    //  committed_tokens[guid] is an array of (depth, result_index) pairs for
+    //  the given request
+    std::ostringstream oss;
+    for (auto const &pair : committed_tokens.at(guid)) {
+      // log_req_mgr.print("(%d, %d)", pair.first, pair.second);
+      oss << " " << pair.second << ":" << pair.first;
+    }
+    log_req_mgr.print("Committed tokens:%s", oss.str().c_str());
   }
 
   // It's safe to have inputSerializedTree.size() > outputSerializedTree.size()
@@ -1423,14 +1436,23 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
     }
   }
   committed_tokens[guid] = new_committed_tokens;
-  log_req_mgr.print("========Verified============");
-  for (auto const &pair : verifiedTree) {
-    log_req_mgr.print("(%d, %d)", pair.first, pair.second);
+  {
+    // log_req_mgr.print("========Verified============");
+    std::ostringstream oss;
+    for (auto const &pair : verifiedTree) {
+      // log_req_mgr.print("(%d, %d)", pair.first, pair.second);
+      oss << " " << pair.second << ":" << pair.first;
+    }
+    log_req_mgr.print("Verified:%s", oss.str().c_str());
   }
-
-  log_req_mgr.print("========New Committed============");
-  for (auto const &pair : committed_tokens.at(guid)) {
-    log_req_mgr.print("(%d, %d)", pair.first, pair.second);
+  {
+    // log_req_mgr.print("========New Committed============");
+    std::ostringstream oss;
+    for (auto const &pair : committed_tokens.at(guid)) {
+      // log_req_mgr.print("(%d, %d)", pair.first, pair.second);
+      oss << " " << pair.second << ":" << pair.first;
+    }
+    log_req_mgr.print("New committed:%s", oss.str().c_str());
   }
 
   return verifiedTree;
@@ -1453,10 +1475,10 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
 
   auto guid = old_bc.requestsInfo[request_index].request_guid;
   Request &request = all_requests[guid];
-  std::cout << "request.beam_trees.size(): " << request.beam_trees.size()
-            << std::endl;
+  // std::cout << "request.beam_trees.size(): " << request.beam_trees.size()
+  //           << std::endl;
   BeamTree tree = request.beam_trees.at(old_bc.model_id);
-  std::cout << "\n\n";
+  // std::cout << "\n\n";
 
   // token, index
   // todo make this one global for different stages
diff --git a/tests/inference/python_test_configs/generate_configs.py b/tests/inference/python_test_configs/generate_configs.py
index 91cf317db4..9c4c37b2e7 100644
--- a/tests/inference/python_test_configs/generate_configs.py
+++ b/tests/inference/python_test_configs/generate_configs.py
@@ -6,7 +6,7 @@
     # required parameters
     "num_gpus": 4,
     "memory_per_gpu": 14000,
-    "zero_copy_memory_per_gpu": 30000,
+    "zero_copy_memory_per_node": 30000,
     # optional parameters
     "num_cpus": 4,
     "legion_utility_processors": 4,

From 1179a8e70ee01c74f8f08420aed1c0355ab46b4d Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 17 Aug 2023 09:44:16 -0400
Subject: [PATCH 199/344] Fix `requirements.txt` (#969)

* fix

* update workflow
---
 .github/workflows/gpu-ci-skip.yml      | 1 +
 .github/workflows/gpu-ci.yml           | 2 ++
 .github/workflows/pip-install-skip.yml | 1 +
 .github/workflows/pip-install.yml      | 2 ++
 conda/flexflow.yml                     | 8 ++++----
 docker/flexflow-environment/Dockerfile | 2 +-
 requirements.txt                       | 8 ++++----
 7 files changed, 15 insertions(+), 9 deletions(-)

diff --git a/.github/workflows/gpu-ci-skip.yml b/.github/workflows/gpu-ci-skip.yml
index 01ceba65dd..6a18e56bd1 100644
--- a/.github/workflows/gpu-ci-skip.yml
+++ b/.github/workflows/gpu-ci-skip.yml
@@ -11,6 +11,7 @@ on:
       - "inference/**"
       - "src/**"
       - "tests/inference/**"
+      - "conda/flexflow.yml"
       - ".github/workflows/gpu-ci.yml"
       - "tests/cpp_gpu_tests.sh"
       - "tests/inference_tests.sh"
diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index a6ea492bcf..f732513e0d 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -11,6 +11,7 @@ on:
       - "inference/**"
       - "src/**"
       - "tests/inference/**"
+      - "conda/flexflow.yml"
       - ".github/workflows/gpu-ci.yml"
       - "tests/cpp_gpu_tests.sh"
       - "tests/inference_tests.sh"
@@ -29,6 +30,7 @@ on:
       - "inference/**"
       - "src/**"
       - "tests/inference/**"
+      - "conda/flexflow.yml"
       - ".github/workflows/gpu-ci.yml"
       - "tests/cpp_gpu_tests.sh"
       - "tests/inference_tests.sh"
diff --git a/.github/workflows/pip-install-skip.yml b/.github/workflows/pip-install-skip.yml
index f2606b94d8..92c3223e32 100644
--- a/.github/workflows/pip-install-skip.yml
+++ b/.github/workflows/pip-install-skip.yml
@@ -7,6 +7,7 @@ on:
       - "deps/**"
       - "python/**"
       - "setup.py"
+      - "requirements.txt"
       - ".github/workflows/helpers/install_dependencies.sh"
       - ".github/workflows/pip-install.yml"
   workflow_dispatch:
diff --git a/.github/workflows/pip-install.yml b/.github/workflows/pip-install.yml
index 7d60d3bf52..d79834e31d 100644
--- a/.github/workflows/pip-install.yml
+++ b/.github/workflows/pip-install.yml
@@ -7,6 +7,7 @@ on:
       - "deps/**"
       - "python/**"
       - "setup.py"
+      - "requirements.txt"
       - ".github/workflows/helpers/install_dependencies.sh"
       - ".github/workflows/pip-install.yml"
   push:
@@ -18,6 +19,7 @@ on:
       - "deps/**"
       - "python/**"
       - "setup.py"
+      - "requirements.txt"
       - ".github/workflows/helpers/install_dependencies.sh"
       - ".github/workflows/pip-install.yml"
   workflow_dispatch:
diff --git a/conda/flexflow.yml b/conda/flexflow.yml
index 5987cae0a3..57101ac4ff 100644
--- a/conda/flexflow.yml
+++ b/conda/flexflow.yml
@@ -15,12 +15,12 @@ dependencies:
     - qualname>=0.1.0
     - keras_preprocessing>=1.1.2
     - numpy>=1.16.0
-    - torch --index-url https://download.pytorch.org/whl/cpu
-    - torchaudio --index-url https://download.pytorch.org/whl/cpu
-    - torchvision --index-url https://download.pytorch.org/whl/cpu
+    - torch==2.0.1 --index-url https://download.pytorch.org/whl/cpu
+    - torchaudio==2.0.2 --index-url https://download.pytorch.org/whl/cpu
+    - torchvision==0.15.2 --index-url https://download.pytorch.org/whl/cpu
     - regex
     - onnx
-    - transformers
+    - transformers>=4.31.0
     - sentencepiece
     - einops
     - requests
diff --git a/docker/flexflow-environment/Dockerfile b/docker/flexflow-environment/Dockerfile
index 2f970f272d..09f8be51dc 100644
--- a/docker/flexflow-environment/Dockerfile
+++ b/docker/flexflow-environment/Dockerfile
@@ -57,7 +57,7 @@ ENV CUDA_DIR /usr/local/cuda
 RUN conda install -c conda-forge cmake make pillow cmake-build-extension pybind11 numpy pandas keras-preprocessing
 # Install CPU-only Pytorch and related dependencies
 RUN conda install pytorch torchvision torchaudio cpuonly -c pytorch
-RUN conda install -c conda-forge onnx transformers sentencepiece einops
+RUN conda install -c conda-forge onnx transformers>=4.31.0 sentencepiece einops
 RUN pip3 install tensorflow
 
 # Install Rust
diff --git a/requirements.txt b/requirements.txt
index 2e23b0a981..2e8d4ad962 100644
--- a/requirements.txt
+++ b/requirements.txt
@@ -10,10 +10,10 @@ requests
 qualname
 regex
 requests
---index-url https://download.pytorch.org/whl/cpu torch
---index-url https://download.pytorch.org/whl/cpu torchaudio
---index-url https://download.pytorch.org/whl/cpu torchvision
+torch==2.0.1
+torchaudio==2.0.2
+torchvision==0.15.2
 onnx
-transformers
+transformers>=4.31.0
 sentencepiece
 einops

From 534adaf58663f7fa937aa026cccf537e479e6642 Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Thu, 17 Aug 2023 11:55:54 -0400
Subject: [PATCH 200/344] check starcoder not run with tp (#971)

* check starcoder

* num_kv_head

* fix

---------

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 python/flexflow/serve/models/starcoder.py | 13 +++++++++++--
 1 file changed, 11 insertions(+), 2 deletions(-)

diff --git a/python/flexflow/serve/models/starcoder.py b/python/flexflow/serve/models/starcoder.py
index ec02249841..922d0e4746 100644
--- a/python/flexflow/serve/models/starcoder.py
+++ b/python/flexflow/serve/models/starcoder.py
@@ -31,6 +31,7 @@ def __init__(self, hf_config):
         self.num_hidden_layers = hf_config.n_layer
         self.vocab_size = hf_config.vocab_size
         self.intermediate_size = hf_config.n_inner
+        self.n_head_kv = 1 if hf_config.multi_query else hf_config.n_head
 
 
 class FlexFlowSTARCODER(FlexFlowModel):
@@ -80,7 +81,15 @@ def __init__(
             raise ValueError(
                 f"Number of attention heads ({self.starcoder_config.num_attention_heads}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
             )
-
+        if (
+            self.starcoder_config.n_head_kv < self.ffconfig.tensor_parallelism_degree
+            or self.starcoder_config.n_head_kv % self.ffconfig.tensor_parallelism_degree
+            != 0
+        ):
+            raise ValueError(
+                f"Number of k/v attention heads ({self.starcoder_config.n_head_kv}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
+            )
+            
         self.build_model()
 
     def build_model(self):
@@ -134,7 +143,7 @@ def build_model(self):
                 ln_1,
                 self.starcoder_config.hidden_size,
                 self.starcoder_config.num_attention_heads,
-                1,
+                self.starcoder_config.n_head_kv,
                 self.starcoder_config.hidden_size
                 // self.starcoder_config.num_attention_heads,
                 self.starcoder_config.hidden_size

From d5a1dccd148bdc633e4b998545496abaf328df80 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 17 Aug 2023 14:46:28 -0400
Subject: [PATCH 201/344] Docs update (#970)

* update

* group together training docs

* C++ docs (#972)

* added stub

* cleanup doxyfile

* added internals stub

* cuda first

* updated docs copyright

* add comments

* sphinx update

* updated sphinx pages

* small update

* more docs

* update makefile

* more docs

* integrating doxygen in rtd

* formatting

* added docs

* more docs

* update

* updates

* fix

* add missing file

* updated readmes

* maybe fix

* Revert "maybe fix"

This reverts commit a73ec2ffb2267bf46b242440a00b705e020a24fb.

* fix

* fix

* fix

* fixed everything (for now)

* Create github/README.md

* Update README.md

* update

---------

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 .github/README.md                             |  37 ++-
 .gitignore                                    |   5 +-
 CONTRIBUTING.md                               |  25 +-
 INSTALL.md                                    |   2 +-
 README.md                                     |  94 ++++---
 SERVE.md                                      | 209 ++++++++++++++++
 TRAIN.md                                      |  65 +++++
 docs/Makefile                                 |   2 +-
 docs/doxygen/Doxyfile                         |  17 +-
 docs/source/conf.py                           |  94 ++++---
 docs/source/cpp_api.rst                       |  10 +
 .../developers_guide.rst                      |   2 +-
 docs/source/developers_guide/ff_internals.rst |   6 +
 docs/source/developers_guide/internals.md     |  15 ++
 docs/source/docker.rst                        |   1 +
 docs/source/index.rst                         |  34 +--
 docs/source/installation.rst                  |   3 +-
 docs/source/keras.rst                         |   7 +-
 docs/source/mt5.rst                           |   6 +-
 docs/source/onnx.rst                          |   1 +
 docs/source/pytorch.rst                       |   7 +-
 docs/source/serve_overview.rst                |   7 +
 docs/source/train_examples.rst                |   6 +
 docs/source/train_interface.rst               |   8 +
 docs/source/train_overview.rst                |   7 +
 docs/source/train_python_api.rst              |  11 +
 docs/source/welcome.rst                       |   1 +
 include/flexflow/operator.h                   |  22 ++
 src/ops/linear.cc                             |  94 +++++++
 src/runtime/model.cc                          | 230 +++++++++++++++++-
 30 files changed, 873 insertions(+), 155 deletions(-)
 create mode 100644 SERVE.md
 create mode 100644 TRAIN.md
 create mode 100644 docs/source/cpp_api.rst
 rename docs/source/{ => developers_guide}/developers_guide.rst (64%)
 create mode 100644 docs/source/developers_guide/ff_internals.rst
 create mode 100644 docs/source/developers_guide/internals.md
 create mode 100644 docs/source/serve_overview.rst
 create mode 100644 docs/source/train_examples.rst
 create mode 100644 docs/source/train_interface.rst
 create mode 100644 docs/source/train_overview.rst
 create mode 100644 docs/source/train_python_api.rst

diff --git a/.github/README.md b/.github/README.md
index e61c1648ba..99e0f82b62 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -4,8 +4,9 @@
 
 ---
 
-## News:
+## News🔥:
 
+* [08/16/2023] Adding Starcoder model support
 * [08/14/2023] Released Dockerfile for different CUDA versions
 
 ## What is FlexFlow Serve
@@ -18,9 +19,10 @@ existing systems by 1.3-2.0x for single-node, multi-GPU inference and by
 1.4-2.4x for multi-node, multi-GPU inference.
 
 <p align="center">
-<img src="../img/performance.png" alt="Performance comparison" height="320"/>
+<img src="https://github.com/flexflow/FlexFlow/blob/inference/img/performance.png?raw=true" alt="Performance comparison" height="320"/>
 </p>
 
+
 ## Install FlexFlow Serve
 
 
@@ -178,12 +180,18 @@ which largely reduces the end-to-end inference latency and computational require
 for serving generative LLMs while provably preserving model quality.
 
 <p align="center">
-<img src="../img/spec_infer_demo.gif" alt="A Speculative Inference Demo" width="630"/>
+<img src="https://github.com/flexflow/FlexFlow/blob/inference/img/spec_infer_demo.gif?raw=true" alt="A Speculative Inference Demo" width="630"/>
 </p>
 
 ### Supported LLMs and SSMs
 
-FlexFlow Serve supports a variety of HuggingFace models:
+FlexFlow Serve currently supports all HuggingFace models with the following architectures:
+* `LlamaForCausalLM` / `LLaMAForCausalLM` (e.g. LLaMA/LLaMA-2, Guanaco, Vicuna, Alpaca, ...)
+* `OPTForCausalLM` (models from the OPT family)
+* `RWForCausalLM` (models from the Falcon family)
+* `GPTBigCodeForCausalLM` (models from the Starcoder family)
+
+Below is a list of models that we have explicitly tested and for which a SSM may be available:
 
 | Model | Model id on HuggingFace | Boost-tuned SSMs |
 | :---- | :---- | :---- |
@@ -200,37 +208,26 @@ FlexFlow Serve supports a variety of HuggingFace models:
 | OPT-66B | facebook/opt-66b | [OPT-125M](https://huggingface.co/facebook/opt-125m) |
 | Falcon-7B | tiiuae/falcon-7b | |
 | Falcon-40B | tiiuae/falcon-40b | |
+| StarCoder-7B | bigcode/starcoderbase-7b | |
 | StarCoder-15.5B | bigcode/starcoder | |
 
-
 ### CPU Offloading
-FlexFlow Serve also offers offloading-based inference for running large models (e.g., llama-7B) on a single GPU. CPU offloading is a choice to save tensors in CPU memory, and only copy the tensor to GPU when doing calculation. Notice that now we selectively offload the largest weight tensors (weights tensor in Linear, Attention). Besides, since the small model occupies considerably less space, it it does not pose a bottleneck for GPU memory, the offloading will bring more runtime space and computational cost, so we only do the offloading for the large model. [TODO: update instructions] You can run the offloading example by enabling the `-offload` and `-offload-reserve-space-size` flags.
+FlexFlow Serve also offers offloading-based inference for running large models (e.g., llama-7B) on a single GPU. CPU offloading is a choice to save tensors in CPU memory, and only copy the tensor to GPU when doing calculation. Notice that now we selectively offload the largest weight tensors (weights tensor in Linear, Attention). Besides, since the small model occupies considerably less space, it it does not pose a bottleneck for GPU memory, the offloading will bring more runtime space and computational cost, so we only do the offloading for the large model. You can run the offloading example by enabling the `-offload` and `-offload-reserve-space-size` flags.
 
 ### Quantization
-FlexFlow Serve supports int4 and int8 quantization. The compressed tensors are stored on the CPU side. Once copied to the GPU, these tensors undergo decompression and conversion back to their original precision. Please find the compressed weight files in our s3 bucket, or use [this script](../inference/utils/compress_llama_weights.py) from [FlexGen](https://github.com/FMInference/FlexGen) project to do the compression manually. [TODO: update instructions for quantization].
+FlexFlow Serve supports int4 and int8 quantization. The compressed tensors are stored on the CPU side. Once copied to the GPU, these tensors undergo decompression and conversion back to their original precision. Please find the compressed weight files in our s3 bucket, or use [this script](../inference/utils/compress_llama_weights.py) from [FlexGen](https://github.com/FMInference/FlexGen) project to do the compression manually.
 
 ### Prompt Datasets
 We provide five prompt datasets for evaluating FlexFlow Serve: [Chatbot instruction prompts](https://specinfer.s3.us-east-2.amazonaws.com/prompts/chatbot.json), [ChatGPT Prompts](https://specinfer.s3.us-east-2.amazonaws.com/prompts/chatgpt.json), [WebQA](https://specinfer.s3.us-east-2.amazonaws.com/prompts/webqa.json), [Alpaca](https://specinfer.s3.us-east-2.amazonaws.com/prompts/alpaca.json), and [PIQA](https://specinfer.s3.us-east-2.amazonaws.com/prompts/piqa.json).
 
 ## TODOs
 
-FlexFlow Serve and FlexFlow are under active development. We currently focus on the following tasks and strongly welcome all contributions from bug fixes to new features and extensions.
+FlexFlow Serve is under active development. We currently focus on the following tasks and strongly welcome all contributions from bug fixes to new features and extensions.
 
 * AMD support. We are actively working on supporting FlexFlow Serve on AMD GPUs and welcome any contributions to this effort. 
 
 ## Acknowledgements
-This project is initiated by members from CMU, Stanford, and UCSD. We will be continuing developing and supporting FlexFlow Serve. Please cite FlexFlow Serve as:
-
-``` bibtex
-@misc{miao2023specinfer,
-      title={SpecInfer: Accelerating Generative LLM Serving with Speculative Inference and Token Tree Verification}, 
-      author={Xupeng Miao and Gabriele Oliaro and Zhihao Zhang and Xinhao Cheng and Zeyu Wang and Rae Ying Yee Wong and Zhuoming Chen and Daiyaan Arfeen and Reyna Abhyankar and Zhihao Jia},
-      year={2023},
-      eprint={2305.09781},
-      archivePrefix={arXiv},
-      primaryClass={cs.CL}
-}
-```
+This project is initiated by members from CMU, Stanford, and UCSD. We will be continuing developing and supporting FlexFlow Serve. 
 
 ## License
 FlexFlow uses Apache License 2.0.
diff --git a/.gitignore b/.gitignore
index 4aecfb11ff..be0266c9b5 100644
--- a/.gitignore
+++ b/.gitignore
@@ -88,10 +88,7 @@ docs/build/
 
 # Doxygen documentation
 docs/doxygen/output/
-
-# Exhale documentation
-docs/source/_doxygen/
-docs/source/c++_api/
+docs/doxygen/cpp_api/
 
 # PyBuilder
 .pybuilder/
diff --git a/CONTRIBUTING.md b/CONTRIBUTING.md
index e607fddb1a..c3c0b5173f 100644
--- a/CONTRIBUTING.md
+++ b/CONTRIBUTING.md
@@ -119,7 +119,26 @@ After adding the DNN layers, the next step before compiling the model for traini
 
 #### Model compilation
 
-TODO
+Model compilation consists of the following steps:
+
+1. We initialize an operator for each layer in the model, via the function `create_operators_from_layers()`. Layers work with `Tensor` input/weights/outputs, and are created directly by the user when writing a FlexFlow program. Operators work with `ParallelTensor` objects and they are responsible for running computations by launching kernels on GPUs.  
+2. Launch the graph optimize task (`GRAPH_OPTIMIZE_TASK_ID`), implemented by`PCG::Graph::graph_optimize_task`, which returns `PCG::GraphOptimalViewSerialized`
+	1. call `deserialize_graph_optimal_view(...)` to get `PCG::Graph *best_graph` and `std::unordered_map<PCG::Node, MachineView> optimal_views` from deserialized `PCG::GraphOptimalViewSerialized`
+	2. `convert_graph_to_operators()`
+	3. print the dot of the best graph obtained
+	4. map inputs to parallel tensor and weights to parallel tensor? -> strange for loop to understand better
+3. Init performance metrics via the `FFModel::update_metrics_task` 
+4. Perform inplace optimizations (if enabled)
+5. Loop through the operators to do the following (to be understood better):
+	1. `parameters.push_back(op->weights[i]);` for each weight in each operator
+	2. `op->map_output_tensors(*this);`
+	3. `((ParallelOp *)op)->create_input_partition(*this);` if the operator is a parallel operator
+6. Check correctness of the operator's input and output tensors' settings
+7. Perform fusion optimizations, if enabled
+8. Print all operators and their input and output regions
+9. Create the tensor for the label
+10. Initialize the optimizer
+11. In training mode, if NCCL is enabled, initialize all the communicators and other objects
 
 
 ## Continuous Integration
@@ -281,6 +300,10 @@ We want to make contributing to this project as easy and transparent as possible
 ### Formatting
 We use `clang-format` to format our C++ code. If you make changes to the code and the Clang format CI test is failing, you can lint your code by running: `./scripts/format.sh` from the main folder of this repo.
 
+### Documenting the code
+We follow the Python Docstring conventions for documenting the Python code. We document the C++ code using comments in any of the conventioned supported by Doxygen [see here](https://doxygen.nl/manual/docblocks.html).
+
+
 ### Pull Requests
 We actively welcome your pull requests.
 
diff --git a/INSTALL.md b/INSTALL.md
index cdc2a2abbd..8d33770c92 100644
--- a/INSTALL.md
+++ b/INSTALL.md
@@ -1,4 +1,4 @@
-# Installing FlexFlow
+# Building from source
 To build and install FlexFlow, follow the instructions below.
 
 ## 1. Download the source code
diff --git a/README.md b/README.md
index 9ad900fb3c..e84bf20605 100644
--- a/README.md
+++ b/README.md
@@ -1,72 +1,53 @@
-# FlexFlow
-![build](https://github.com/flexflow/flexflow/workflows/build/badge.svg?branch=master) ![gpu tests](https://github.com/flexflow/flexflow/workflows/gpu-ci/badge.svg?branch=master) ![multinode gpu tests](https://github.com/flexflow/flexflow/workflows/multinode-test/badge.svg?branch=master) ![docker](https://github.com/flexflow/flexflow/workflows/docker-build/badge.svg?branch=master) ![pip](https://github.com/flexflow/flexflow/workflows/pip-install/badge.svg?branch=master) ![shell-check](https://github.com/flexflow/flexflow/workflows/Shell%20Check/badge.svg?branch=master) ![clang-format](https://github.com/flexflow/flexflow/workflows/clang-format%20Check/badge.svg?branch=master) [![Documentation Status](https://readthedocs.org/projects/flexflow/badge/?version=latest)](https://flexflow.readthedocs.io/en/latest/?badge=latest)
+# FlexFlow: Low-Latency, High-Performance Training and Serving
+![build](https://github.com/flexflow/flexflow/workflows/build/badge.svg?branch=inference) ![gpu tests](https://github.com/flexflow/flexflow/workflows/gpu-ci/badge.svg?branch=inference) ![multinode gpu tests](https://github.com/flexflow/flexflow/workflows/multinode-test/badge.svg?branch=master) ![docker](https://github.com/flexflow/flexflow/workflows/docker-build/badge.svg?branch=inference) ![pip](https://github.com/flexflow/flexflow/workflows/pip-install/badge.svg?branch=inference) ![shell-check](https://github.com/flexflow/flexflow/workflows/Shell%20Check/badge.svg?branch=inference) ![clang-format](https://github.com/flexflow/flexflow/workflows/clang-format%20Check/badge.svg?branch=inference) [![Documentation Status](https://readthedocs.org/projects/flexflow/badge/?version=latest)](https://flexflow.readthedocs.io/en/latest/?badge=latest)
 
-FlexFlow is a deep learning framework that accelerates distributed DNN training by automatically searching for efficient parallelization strategies. FlexFlow provides a drop-in replacement for PyTorch and TensorFlow Keras. Running existing PyTorch and Keras programs in FlexFlow only requires [a few lines of changes to the program](https://flexflow.ai/keras).
 
-## Install FlexFlow
-To install FlexFlow from source code, please read the [instructions](https://flexflow.readthedocs.io/en/latest/installation.html). If you would like to quickly try FlexFlow, we also provide pre-built Docker packages for several versions of CUDA and for the `hip_rocm` backend, together with [Dockerfiles](./docker) if you wish to build the containers manually. More info on the Docker images can be found [here](./docker/README.md). You can also use `conda` to install the FlexFlow Python package (coming soon).
+---
 
-## PyTorch Support
-Users can also use FlexFlow to optimize the parallelization performance of existing PyTorch models in two steps. First, a PyTorch model can be exported to the FlexFlow model format using `flexflow.torch.fx.torch_to_flexflow`.
-```python
-import torch
-import flexflow.torch.fx as fx
+## News 🔥:
 
-model = MyPyTorchModule()
-fx.torch_to_flexflow(model, "mymodel.ff")
-```
+* [08/16/2023] Adding Starcoder model support
+* [08/14/2023] Released Dockerfile for different CUDA versions
+
+## Install FlexFlow
 
-Second, a FlexFlow program can directly import a previously saved PyTorch model and [autotune](https://www.usenix.org/conference/osdi22/presentation/unger) the parallelization performance for a given parallel machine.
 
-```python
-from flexflow.pytorch.model import PyTorchModel
+### Requirements
+* OS: Linux
+* GPU backend: Hip-ROCm or CUDA
+  * CUDA version: 10.2 – 12.0
+  * NVIDIA compute capability: 6.0 or higher
+* Python: 3.6 or higher
+* Package dependencies: [see here](https://github.com/flexflow/FlexFlow/blob/inference/requirements.txt)
 
-def top_level_task():
-  torch_model = PyTorchModel("mymodel.ff")
-  output_tensor = torch_model.apply(ffmodel, input_tensor)
-  ## Model compilation
-  ffmodel.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
-  ## Model training
-  (x_train, y_train) = cifar10.load_data()
-  ffmodel.fit(x_train, y_train, epochs=30)
+### Install with pip
+You can install FlexFlow using pip:
+
+```bash
+pip install flexflow
 ```
 
-**More FlexFlow PyTorch examples**: see the [pytorch examples folder](https://github.com/flexflow/FlexFlow/tree/master/examples/python/pytorch).
+### Try it in Docker
+If you run into any issue during the install, or if you would like to use the C++ API without needing to install from source, you can also use our pre-built Docker package for different CUDA versions and the `hip_rocm` backend. To download and run our pre-built Docker container:
+
+```bash
+docker run --gpus all -it --rm --shm-size=8g ghcr.io/flexflow/flexflow-cuda-11.8:latest
+```
 
-## TensorFlow Keras and ONNX Support
-FlexFlow prioritizes PyTorch compatibility, but also includes frontends for [Tensorflow Keras](./docs/source/keras.rst) and [ONNX](./docs/source/onnx.rst) models.
+To download a Docker container for a backend other than CUDA v11.8, you can replace the `cuda-11.8` suffix with any of the following backends: `cuda-11.1`, `cuda-11.2`, `cuda-11.3`, `cuda-11.5`, `cuda-11.6`, `cuda-11.7`, `cuda-11.8`, and `hip_rocm`). More info on the Docker images, with instructions to build a new image from source, or run with additional configurations, can be found [here](../docker/README.md).
 
-## C++ Interface
-For users that prefer to program in C/C++. FlexFlow supports a C++ program inference that is equivalent to its Python APIs.
+### Build from source
 
-**More FlexFlow C++ examples**: see the [C++ examples folder](https://github.com/flexflow/FlexFlow/tree/master/examples/cpp).
+You can install FlexFlow Serve from source code by building the inference branch of FlexFlow. Please follow these [instructions](https://flexflow.readthedocs.io/en/latest/installation.html).
 
 
-## Command-Line Flags
-In addition to setting runtime configurations in a FlexFlow Python/C++ program, the FlexFlow runtime also accepts command-line arguments for various runtime parameters: 
+## Get Started!
 
-FlexFlow training flags:
-* `-e` or `--epochs`: number of total epochs to run (default: 1)
-* `-b` or `--batch-size`: global batch size in each iteration (default: 64)
-* `-p` or `--print-freq`: print frequency (default: 10)
-* `-d` or `--dataset`: path to the training dataset. If not set, synthetic data is used to conduct training.
+To get started, check out the quickstart guides below for the FlexFlow training and serving libraries.
 
-Legion runtime flags:
-* `-ll:gpu`: number of GPU processors to use on each node (default: 0)
-* `-ll:fsize`: size of device memory on each GPU (in MB)
-* `-ll:zsize`: size of zero-copy memory (pinned DRAM with direct GPU access) on each node (in MB). This is used for prefecthing training images from disk.
-* `-ll:cpu`: number of data loading workers (default: 4)
-* `-ll:util`: number of utility threads to create per process (default: 1)
-* `-ll:bgwork`: number of background worker threads to create per process (default: 1)
+* [FlexFlow Train](./TRAIN.md)
+* [FlexFlow Serve](./SERVE.md)
 
-Performance auto-tuning flags:
-* `--search-budget` or `--budget`: the number of iterations for the MCMC search (default: 0)
-* `--search-alpha` or `--alpha`: a hyper-parameter for the search procedure (default: 0.05)
-* `--export-strategy` or `--export`: path to export the best discovered strategy (default: None)
-* `--import-strategy` or `--import`: path to import a previous saved strategy (default: None)
-* `--enable-parameter-parallel`: allow FlexFlow to explore parameter parallelism for performance auto-tuning. (By default FlexFlow only considers data and model parallelism.)
-* `--enable-attribute-parallel`: allow FlexFlow to explore attribute parallelism for performance auto-tuning. (By default FlexFlow only considers data and model parallelism.)
-For performance tuning related flags: see [performance autotuning](https://flexflow.ai/search).
 
 ## Contributing
 
@@ -75,6 +56,14 @@ Please let us know if you encounter any bugs or have any suggestions by [submitt
 We welcome all contributions to FlexFlow from bug fixes to new features and extensions.
 
 ## Citations
+
+**FlexFlow Serve:**
+
+* Xupeng Miao, Gabriele Oliaro, Zhihao Zhang, Xinhao Cheng, Zeyu Wang, Rae Ying Yee Wong, Alan Zhu, Lijie Yang, Xiaoxiang Shi, Chunan Shi, Zhuoming Chen, Daiyaan Arfeen, Reyna Abhyankar, Zhihao Jia. [SpecInfer: Accelerating Generative Large Language Model Serving with Speculative Inference and Token Tree Verification](https://arxiv.org/abs/2305.09781). In ArXiV, May 2023.
+
+
+**FlexFlow Train:**
+
 * Colin Unger, Zhihao Jia, Wei Wu, Sina Lin, Mandeep Baines, Carlos Efrain Quintero Narvaez, Vinay Ramakrishnaiah, Nirmal Prajapati, Pat McCormick, Jamaludin Mohd-Yusof, Xi Luo, Dheevatsa Mudigere, Jongsoo Park, Misha Smelyanskiy, and Alex Aiken. [Unity: Accelerating DNN Training Through Joint Optimization of Algebraic Transformations and Parallelization](https://www.usenix.org/conference/osdi22/presentation/unger). In Proceedings of the Symposium on Operating Systems Design and Implementation (OSDI), July 2022. 
 
 * Zhihao Jia, Matei Zaharia, and Alex Aiken. [Beyond Data and Model Parallelism for Deep Neural Networks](https://cs.stanford.edu/~zhihao/papers/sysml19a.pdf). In Proceedings of the 2nd Conference on Machine Learning and Systems (MLSys), April 2019.
@@ -86,3 +75,4 @@ FlexFlow is developed and maintained by teams at CMU, Facebook, Los Alamos Natio
 
 ## License
 FlexFlow uses Apache License 2.0.
+
diff --git a/SERVE.md b/SERVE.md
new file mode 100644
index 0000000000..e716392b32
--- /dev/null
+++ b/SERVE.md
@@ -0,0 +1,209 @@
+# FlexFlow Serve: Low-Latency, High-Performance LLM Serving
+
+
+## What is FlexFlow Serve
+  
+The high computational and memory requirements of generative large language
+models (LLMs) make it challenging to serve them quickly and cheaply. 
+FlexFlow Serve is an open-source compiler and distributed system for 
+__low latency__, __high performance__ LLM serving. FlexFlow Serve outperforms 
+existing systems by 1.3-2.0x for single-node, multi-GPU inference and by 
+1.4-2.4x for multi-node, multi-GPU inference.
+
+<p align="center">
+<img src="https://github.com/flexflow/FlexFlow/blob/inference/img/performance.png?raw=true" alt="Performance comparison" height="320"/>
+</p>
+
+
+## Quickstart
+The following example shows how to deploy an LLM using FlexFlow Serve and accelerate its serving using [speculative inference](#speculative-inference). First, we import `flexflow.serve` and initialize the FlexFlow Serve runtime. Note that `memory_per_gpu` and `zero_copy_memory_per_node` specify the size of device memory on each GPU (in MB) and zero-copy memory on each node (in MB), respectively. FlexFlow Serve combines tensor and pipeline model parallelism for LLM serving.
+```python
+import flexflow.serve as ff
+
+ff.init(
+    {
+        "num_gpus": 4,
+        "memory_per_gpu": 14000,
+        "zero_copy_memory_per_node": 30000,
+        "tensor_parallelism_degree": 4,
+        "pipeline_parallelism_degree": 1,
+    }
+)
+```
+Second, we specify the LLM to serve and the SSM(s) used to accelerate LLM serving. The list of supported LLMs and SSMs is available at [supported models](#supported-llms-and-ssms).
+```python
+# Specify the LLM
+llm = ff.LLM("decapoda-research/llama-7b-hf")
+
+# Specify a list of SSMs (just one in this case)
+ssms=[]
+ssm = ff.SSM("JackFram/llama-68m")
+ssms.append(ssm)
+```
+Next, we declare the generation configuration and compile both the LLM and SSMs. Note that all SSMs should run in the **beam search** mode, and the LLM should run in the **tree verification** mode to verify the speculated tokens from SSMs.
+```python
+# Create the sampling configs
+generation_config = ff.GenerationConfig(
+    do_sample=False, temperature=0.9, topp=0.8, topk=1
+)
+
+# Compile the SSMs for inference and load the weights into memory
+for ssm in ssms:
+    ssm.compile(generation_config)
+
+# Compile the LLM for inference and load the weights into memory
+llm.compile(generation_config, ssms=ssms)
+```
+Finally, we call `llm.generate` to generate the output, which is organized as a list of `GenerationResult`, which include the output tokens and text.
+```python
+result = llm.generate("Here are some travel tips for Tokyo:\n")
+```
+
+### Incremental decoding
+
+<details>
+<summary>Expand here</summary>
+<br>
+
+```python
+
+import flexflow.serve as ff
+
+# Initialize the FlexFlow runtime. ff.init() takes a dictionary or the path to a JSON file with the configs
+ff.init(
+    {
+        "num_gpus": 4,
+        "memory_per_gpu": 14000,
+        "zero_copy_memory_per_gpu": 30000,
+        "tensor_parallelism_degree": 4,
+        "pipeline_parallelism_degree": 1,
+    }
+)
+
+# Create the FlexFlow LLM
+llm = ff.LLM("decapoda-research/llama-7b-hf")
+
+# Create the sampling configs
+generation_config = ff.GenerationConfig(
+    do_sample=True, temperature=0.9, topp=0.8, topk=1
+)
+
+# Compile the LLM for inference and load the weights into memory
+llm.compile(generation_config)
+
+# Generation begins!
+result = llm.generate("Here are some travel tips for Tokyo:\n")
+
+```
+
+</details>
+
+### C++ interface
+If you'd like to use the C++ interface (mostly used for development and benchmarking purposes), you should install from source, and follow the instructions below. 
+
+<details>
+<summary>Expand here</summary>
+<br>
+
+#### Downloading models
+
+Before running FlexFlow Serve, you should manually download the LLM and SSM(s) model of interest using the [inference/utils/download_hf_model.py](https://github.com/flexflow/FlexFlow/blob/inference/inference/utils/download_hf_model.py) script (see example below). By default, the script will download all of a model's assets (weights, configs, tokenizer files, etc...) into the cache folder `~/.cache/flexflow`. If you would like to use a different folder, you can request that via the parameter `--cache-folder`.
+
+```bash
+python3 ./inference/utils/download_hf_model.py <HF model 1> <HF model 2> ...
+```
+
+#### Running the C++ examples
+A C++ example is available at [this folder](../inference/spec_infer/). After building FlexFlow Serve, the executable will be available at `/build_dir/inference/spec_infer/spec_infer`. You can use the following command-line arguments to run FlexFlow Serve:
+
+* `-ll:gpu`: number of GPU processors to use on each node for serving an LLM (default: 0)
+* `-ll:fsize`: size of device memory on each GPU in MB
+* `-ll:zsize`: size of zero-copy memory (pinned DRAM with direct GPU access) in MB. FlexFlow Serve keeps a replica of the LLM parameters on zero-copy memory, and therefore requires that the zero-copy memory is sufficient for storing the LLM parameters.
+* `-llm-model`: the LLM model ID from HuggingFace (e.g. "decapoda-research/llama-7b-hf")
+* `-ssm-model`: the SSM model ID from HuggingFace (e.g. "JackFram/llama-160m"). You can use multiple `-ssm-model`s in the command line to launch multiple SSMs.
+* `-cache-folder`: the folder
+* `-data-parallelism-degree`, `-tensor-parallelism-degree` and `-pipeline-parallelism-degree`: parallelization degrees in the data, tensor, and pipeline dimensions. Their product must equal the number of GPUs available on the machine. When any of the three parallelism degree arguments is omitted, a default value of 1 will be used. 
+* `-prompt`: (optional) path to the prompt file. FlexFlow Serve expects a json format file for prompts. In addition, users can also use the following API for registering requests:
+* `-output-file`: (optional) filepath to use to save the output of the model, together with the generation latency
+
+For example, you can use the following command line to serve a LLaMA-7B or LLaMA-13B model on 4 GPUs and use two collectively boost-tuned LLaMA-68M models for speculative inference.
+
+```bash
+./inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model decapoda-research/llama-7b-hf -ssm-model JackFram/llama-68m -prompt /path/to/prompt.json -tensor-parallelism-degree 4 --fusion
+```
+</details>
+
+## Speculative Inference
+A key technique that enables FlexFlow Serve to accelerate LLM serving is speculative
+inference, which combines various collectively boost-tuned small speculative
+models (SSMs) to jointly predict the LLM’s outputs; the predictions are organized as a
+token tree, whose nodes each represent a candidate token sequence. The correctness
+of all candidate token sequences represented by a token tree is verified against the
+LLM’s output in parallel using a novel tree-based parallel decoding mechanism.
+FlexFlow Serve uses an LLM as a token tree verifier instead of an incremental decoder,
+which largely reduces the end-to-end inference latency and computational requirement
+for serving generative LLMs while provably preserving model quality.
+
+<p align="center">
+<img src="https://github.com/flexflow/FlexFlow/blob/inference/img/spec_infer_demo.gif?raw=true" alt="A Speculative Inference Demo" width="630"/>
+</p>
+
+### Supported LLMs and SSMs
+
+FlexFlow Serve currently supports all HuggingFace models with the following architectures:
+* `LlamaForCausalLM` / `LLaMAForCausalLM` (e.g. LLaMA/LLaMA-2, Guanaco, Vicuna, Alpaca, ...)
+* `OPTForCausalLM` (models from the OPT family)
+* `RWForCausalLM` (models from the Falcon family)
+* `GPTBigCodeForCausalLM` (models from the Starcoder family)
+
+Below is a list of models that we have explicitly tested and for which a SSM may be available:
+
+| Model | Model id on HuggingFace | Boost-tuned SSMs |
+| :---- | :---- | :---- |
+| LLaMA-7B | decapoda-research/llama-7b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-13B | decapoda-research/llama-13b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-30B | decapoda-research/llama-30b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-65B | decapoda-research/llama-65b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-2-7B | meta-llama/Llama-2-7b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-2-13B | meta-llama/Llama-2-13b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-2-70B | meta-llama/Llama-2-70b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| OPT-6.7B | facebook/opt-6.7b | [OPT-125M](https://huggingface.co/facebook/opt-125m) |
+| OPT-13B | facebook/opt-13b | [OPT-125M](https://huggingface.co/facebook/opt-125m) |
+| OPT-30B | facebook/opt-30b | [OPT-125M](https://huggingface.co/facebook/opt-125m) |
+| OPT-66B | facebook/opt-66b | [OPT-125M](https://huggingface.co/facebook/opt-125m) |
+| Falcon-7B | tiiuae/falcon-7b | |
+| Falcon-40B | tiiuae/falcon-40b | |
+| StarCoder-15.5B | bigcode/starcoder | |
+
+
+### CPU Offloading
+FlexFlow Serve also offers offloading-based inference for running large models (e.g., llama-7B) on a single GPU. CPU offloading is a choice to save tensors in CPU memory, and only copy the tensor to GPU when doing calculation. Notice that now we selectively offload the largest weight tensors (weights tensor in Linear, Attention). Besides, since the small model occupies considerably less space, it it does not pose a bottleneck for GPU memory, the offloading will bring more runtime space and computational cost, so we only do the offloading for the large model. [TODO: update instructions] You can run the offloading example by enabling the `-offload` and `-offload-reserve-space-size` flags.
+
+### Quantization
+FlexFlow Serve supports int4 and int8 quantization. The compressed tensors are stored on the CPU side. Once copied to the GPU, these tensors undergo decompression and conversion back to their original precision. Please find the compressed weight files in our s3 bucket, or use [this script](../inference/utils/compress_llama_weights.py) from [FlexGen](https://github.com/FMInference/FlexGen) project to do the compression manually. [TODO: update instructions for quantization].
+
+### Prompt Datasets
+We provide five prompt datasets for evaluating FlexFlow Serve: [Chatbot instruction prompts](https://specinfer.s3.us-east-2.amazonaws.com/prompts/chatbot.json), [ChatGPT Prompts](https://specinfer.s3.us-east-2.amazonaws.com/prompts/chatgpt.json), [WebQA](https://specinfer.s3.us-east-2.amazonaws.com/prompts/webqa.json), [Alpaca](https://specinfer.s3.us-east-2.amazonaws.com/prompts/alpaca.json), and [PIQA](https://specinfer.s3.us-east-2.amazonaws.com/prompts/piqa.json).
+
+## TODOs
+
+FlexFlow Serve is still under active development. We currently focus on the following tasks and strongly welcome all contributions from bug fixes to new features and extensions.
+
+* AMD support. We are actively working on supporting FlexFlow Serve on AMD GPUs and welcome any contributions to this effort. 
+
+## Acknowledgements
+This project is initiated by members from CMU, Stanford, and UCSD. We will be continuing developing and supporting FlexFlow Serve. Please cite FlexFlow Serve as:
+
+``` bibtex
+@misc{miao2023specinfer,
+      title={SpecInfer: Accelerating Generative Large Language Model Serving with Speculative Inference and Token Tree Verification}, 
+      author={Xupeng Miao and Gabriele Oliaro and Zhihao Zhang and Xinhao Cheng and Zeyu Wang and Rae Ying Yee Wong and Alan Zhu and Lijie Yang and Xiaoxiang Shi and Chunan Shi and Zhuoming Chen and Daiyaan Arfeen and Reyna Abhyankar and Zhihao Jia},
+      year={2023},
+      eprint={2305.09781},
+      archivePrefix={arXiv},
+      primaryClass={cs.CL}
+}
+```
+
+## License
+FlexFlow uses Apache License 2.0.
diff --git a/TRAIN.md b/TRAIN.md
new file mode 100644
index 0000000000..1595274a4c
--- /dev/null
+++ b/TRAIN.md
@@ -0,0 +1,65 @@
+# FlexFlow Train: Distributed DNN Training with Flexible Parallelization Strategies.
+FlexFlow Train is a deep learning framework that accelerates distributed DNN training by automatically searching for efficient parallelization strategies. FlexFlow Train provides a drop-in replacement for PyTorch and TensorFlow Keras. Running existing PyTorch and Keras programs in FlexFlow oTrain nly requires [a few lines of changes to the program](https://flexflow.ai/keras).
+
+
+## PyTorch Support
+Users can also use FlexFlow Train to optimize the parallelization performance of existing PyTorch models in two steps. First, a PyTorch model can be exported to the FlexFlow model format using `flexflow.torch.fx.torch_to_flexflow`.
+```python
+import torch
+import flexflow.torch.fx as fx
+
+model = MyPyTorchModule()
+fx.torch_to_flexflow(model, "mymodel.ff")
+```
+
+Second, a FlexFlow Train program can directly import a previously saved PyTorch model and [autotune](https://www.usenix.org/conference/osdi22/presentation/unger) the parallelization performance for a given parallel machine.
+
+```python
+from flexflow.pytorch.model import PyTorchModel
+
+def top_level_task():
+  torch_model = PyTorchModel("mymodel.ff")
+  output_tensor = torch_model.apply(ffmodel, input_tensor)
+  ## Model compilation
+  ffmodel.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
+  ## Model training
+  (x_train, y_train) = cifar10.load_data()
+  ffmodel.fit(x_train, y_train, epochs=30)
+```
+
+**More FlexFlow PyTorch examples**: see the [pytorch examples folder](https://github.com/flexflow/FlexFlow/tree/master/examples/python/pytorch).
+
+## TensorFlow Keras and ONNX Support
+FlexFlow Train prioritizes PyTorch compatibility, but also includes frontends for [Tensorflow Keras](./docs/source/keras.rst) and [ONNX](./docs/source/onnx.rst) models.
+
+## C++ Interface
+For users that prefer to program in C/C++. FlexFlow Train supports a C++ program inference that is equivalent to its Python APIs.
+
+**More FlexFlow C++ examples**: see the [C++ examples folder](https://github.com/flexflow/FlexFlow/tree/master/examples/cpp).
+
+
+## Command-Line Flags
+In addition to setting runtime configurations in a FlexFlow Train Python/C++ program, the FlexFlow Train runtime also accepts command-line arguments for various runtime parameters: 
+
+FlexFlow training flags:
+* `-e` or `--epochs`: number of total epochs to run (default: 1)
+* `-b` or `--batch-size`: global batch size in each iteration (default: 64)
+* `-p` or `--print-freq`: print frequency (default: 10)
+* `-d` or `--dataset`: path to the training dataset. If not set, synthetic data is used to conduct training.
+
+Legion runtime flags:
+* `-ll:gpu`: number of GPU processors to use on each node (default: 0)
+* `-ll:fsize`: size of device memory on each GPU (in MB)
+* `-ll:zsize`: size of zero-copy memory (pinned DRAM with direct GPU access) on each node (in MB). This is used for prefecthing training images from disk.
+* `-ll:cpu`: number of data loading workers (default: 4)
+* `-ll:util`: number of utility threads to create per process (default: 1)
+* `-ll:bgwork`: number of background worker threads to create per process (default: 1)
+
+Performance auto-tuning flags:
+* `--search-budget` or `--budget`: the number of iterations for the MCMC search (default: 0)
+* `--search-alpha` or `--alpha`: a hyper-parameter for the search procedure (default: 0.05)
+* `--export-strategy` or `--export`: path to export the best discovered strategy (default: None)
+* `--import-strategy` or `--import`: path to import a previous saved strategy (default: None)
+* `--enable-parameter-parallel`: allow FlexFlow Train to explore parameter parallelism for performance auto-tuning. (By default FlexFlow Train only considers data and model parallelism.)
+* `--enable-attribute-parallel`: allow FlexFlow Train to explore attribute parallelism for performance auto-tuning. (By default FlexFlow Train only considers data and model parallelism.)
+For performance tuning related flags: see [performance autotuning](https://flexflow.ai/search).
diff --git a/docs/Makefile b/docs/Makefile
index 5424c5bc9f..d14c2ef91f 100644
--- a/docs/Makefile
+++ b/docs/Makefile
@@ -15,7 +15,7 @@ help:
 .PHONY: help Makefile clean
 
 clean:
-	rm -rf build source/_doxygen/ source/c++_api/ doxygen/output
+	rm -rf build doxygen/output doxygen/cpp_api
 	@$(SPHINXBUILD) -M clean "$(SOURCEDIR)" "$(BUILDDIR)" $(SPHINXOPTS) $(O)
 
 # Catch-all target: route all unknown targets to Sphinx using the new
diff --git a/docs/doxygen/Doxyfile b/docs/doxygen/Doxyfile
index b38bfc12b5..aafa65d79b 100644
--- a/docs/doxygen/Doxyfile
+++ b/docs/doxygen/Doxyfile
@@ -44,7 +44,7 @@ PROJECT_NUMBER         =
 # for a project that appears at the top of each page and should give viewer a
 # quick idea about the purpose of the project. Keep the description short.
 
-PROJECT_BRIEF          = A distributed deep learning framework that supports flexible parallelization strategies.
+PROJECT_BRIEF          = "A distributed deep learning framework that supports flexible parallelization strategies."
 
 # With the PROJECT_LOGO tag one can specify a logo or an icon that is included
 # in the documentation. The maximum height of the logo should not exceed 55
@@ -150,7 +150,7 @@ INLINE_INHERITED_MEMB  = NO
 # shortest path that makes the file name unique will be used
 # The default value is: YES.
 
-FULL_PATH_NAMES        = YES
+FULL_PATH_NAMES        = NO
 
 # The STRIP_FROM_PATH tag can be used to strip a user-defined part of the path.
 # Stripping is only done if one of the specified strings matches the left-hand
@@ -874,12 +874,7 @@ WARN_LOGFILE           =
 # spaces. See also FILE_PATTERNS and EXTENSION_MAPPING
 # Note: If this tag is empty the current directory is searched.
 
-INPUT                  = $(FF_HOME)/align
-INPUT                 += $(FF_HOME)/bootcamp_demo
-INPUT                 += $(FF_HOME)/examples
 INPUT                 += $(FF_HOME)/include
-INPUT                 += $(FF_HOME)/nmt
-INPUT                 += $(FF_HOME)/python
 INPUT                 += $(FF_HOME)/src
 
 # This tag can be used to specify the character encoding of the source files
@@ -911,12 +906,10 @@ INPUT_ENCODING         = UTF-8
 
 FILE_PATTERNS          = *.c \
                          *.cc \
-                         *.cpp \
                          *.cu \
+                         *.cpp \
                          *.h \
-                         *.hpp \
-                         *.md \
-                         *.py
+                         *.hpp
 
 # The RECURSIVE tag can be used to specify whether or not subdirectories should
 # be searched for input files as well.
@@ -2110,7 +2103,7 @@ MAN_LINKS              = NO
 # captures the structure of the code including all documentation.
 # The default value is: NO.
 
-GENERATE_XML           = YES
+GENERATE_XML           = NO
 
 # The XML_OUTPUT tag is used to specify where the XML pages will be put. If a
 # relative path is entered the value of OUTPUT_DIRECTORY will be put in front of
diff --git a/docs/source/conf.py b/docs/source/conf.py
index 0e614f37c2..f67c0dae01 100644
--- a/docs/source/conf.py
+++ b/docs/source/conf.py
@@ -13,28 +13,42 @@
 import os
 import sys
 import subprocess
+import shutil
+import sphinx # only needed for the manual post processing
+from pathlib import Path
+from m2r2 import convert
+from docutils.core import publish_string
+import re
 
 def get_parent_dir_path(path):
     return os.path.abspath(os.path.join(path, ".."))
 
 docs_path = get_parent_dir_path(os.path.dirname(os.path.abspath(__file__)))
 doxygen_path = os.path.join(docs_path, "doxygen")
+doxygen_output = os.path.join(doxygen_path, "output")
+doxygen_cpp_api_out = os.path.join(doxygen_path, "cpp_api")
 FF_HOME = get_parent_dir_path(docs_path)
 python_package_path = os.path.join(FF_HOME, "python")
 
 sys.path.insert(0, os.path.abspath(python_package_path))
 
 # Build the Doxygen docs
-#subprocess.call(f'cd {doxygen_path}; FF_HOME={FF_HOME} doxygen', shell=True)
+shutil.rmtree(doxygen_cpp_api_out, ignore_errors=True)
+for gpu_backend in ("cuda", "hip"):
+    doxygen_dest = os.path.join(doxygen_cpp_api_out, f"{gpu_backend}_api")
+    os.makedirs(doxygen_dest, exist_ok=True)
+    exclude_extension = ".cu" if gpu_backend == "hip" else ".cpp"
+    doxygen_cmd = f'export FF_HOME={FF_HOME}; ( cat Doxyfile ; echo "EXCLUDE_PATTERNS+=*{exclude_extension}" ) | doxygen -'
+    subprocess.check_call(doxygen_cmd, cwd=doxygen_path, shell=True)
+    subprocess.check_call(f'mv {os.path.join(doxygen_output, "html")}/* {doxygen_dest}/', shell=True)
 
 import sphinx_rtd_theme
 
 # -- Project information -----------------------------------------------------
 
 project = 'FlexFlow'
-copyright = '2020, Stanford, LANL, CMU, Facebook'
-author = 'Stanford, LANL, CMU, Facebook'
-
+copyright = '2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)'
+author = 'CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)'
 
 # -- General configuration ---------------------------------------------------
 
@@ -45,8 +59,6 @@ def get_parent_dir_path(path):
     'sphinx_rtd_theme',
     'sphinx.ext.autodoc',
     'm2r2',
-    'breathe',
-    'exhale',
 ]
 
 # Theme options are theme-specific and customize the look and feel of a theme
@@ -55,6 +67,7 @@ def get_parent_dir_path(path):
 html_theme_options = {
     "collapse_navigation" : False
 }
+html_extra_path = [doxygen_cpp_api_out]
 
 # Add any paths that contain templates here, relative to this directory.
 # templates_path = ['_templates']
@@ -86,27 +99,50 @@ def get_parent_dir_path(path):
 # so a file named "default.css" will overwrite the builtin "default.css".
 # html_static_path = ['_static']
 
-# Breathe + Exhale configuration
 
-# Setup the breathe extension
-breathe_projects = {
-    "FlexFlow": "./_doxygen/xml"
-}
-breathe_default_project = "FlexFlow"
-
-c_plus_plus_src_dirs = " ".join([f"\"{os.path.join(FF_HOME, 'src', dirname)}\"" for dirname in ("loss_functions", "mapper", "metrics_functions", "ops", "parallel_ops", "recompile", "runtime", "utils")])
-# Setup the exhale extension
-exhale_args = {
-    # These arguments are required
-    "containmentFolder":     "./c++_api",
-    "rootFileName":          "c++_api_root.rst",
-    "doxygenStripFromPath":  "..",
-    # Heavily encouraged optional argument (see docs)
-    #"rootFileTitle":         "Library API",
-    # Suggested optional arguments
-    "createTreeView":        True,
-    # TIP: if using the sphinx-bootstrap-theme, you need
-    # "treeViewIsBootstrap": True,
-    "exhaleExecutesDoxygen": True,
-    "exhaleDoxygenStdin":    f'INPUT = {c_plus_plus_src_dirs}'
-}
+def manual_post_processing(app, exception):
+    if exception is None and app.builder.name == 'html':  # build succeeded
+        print(f'Post-processing HTML docs at path {app.outdir}')
+        build_dir = Path(app.outdir)
+
+        # List of subfolders to search
+        folder_paths = [build_dir, build_dir / 'developers_guide'] 
+
+        for folder_path in folder_paths:
+
+            # Only get HTML files in build dir, not subfolders
+            html_files = folder_path.glob('*.html') 
+
+            for html_file in html_files:
+                content = html_file.read_text()
+
+                # Find dropdown menus, and manually convert their contents
+                pattern = r'<details>\n<summary>Expand here</summary>\n<br>(.*?)</details>'
+                blocks = re.findall(pattern, content, re.DOTALL)
+
+                for block in blocks:
+                    # Convert Markdown to HTML
+                    rst = convert(block, github_markdown=True)
+                    html = publish_string(rst, writer_name='html')
+                    html_str = html.decode('utf-8') 
+
+                    # Replace block with converted HTML
+                    content = content.replace(block, html_str)
+
+                # Add space after dropdown menu block
+                content = content.replace('</details></section>', 
+                                  '</details></section>\n<p></p>')
+
+                # Replace incorrect links
+                content = content.replace('href="../docker/README.md"', 'href="docker.html"')
+                content = content.replace('href="./TRAIN.md"', 'href="train_overview.html"')
+                content = content.replace('href="./SERVE.md"', 'href="serve_overview.html"')
+                content = content.replace('href="./docs/source/keras.rst"', 'href="keras.html"')
+                content = content.replace('href="./docs/source/onnx.rst"', 'href="onnx.html"')
+                
+
+                html_file.write_text(content)
+
+
+def setup(app):
+   app.connect('build-finished', manual_post_processing)
diff --git a/docs/source/cpp_api.rst b/docs/source/cpp_api.rst
new file mode 100644
index 0000000000..b5d39be62e
--- /dev/null
+++ b/docs/source/cpp_api.rst
@@ -0,0 +1,10 @@
+*************
+C++ API
+*************
+
+The FlexFlow backend is at the core of FlexFlow Train and FlexFlow Serve. It is written entirely in C/C++ and CUDA/HIP. This section documents the API, which is generated by Doxygen and it is available at the following links:
+
+* `CUDA version <./cuda_api/index.html>`_ (default version)
+* `HIP version <./hip_api/index.html>`_
+
+The two versions only differ when it comes to the GPU kernels, so the great majority of the entries are identical. If you are unsure which version to use, take a look at the CUDA version.
diff --git a/docs/source/developers_guide.rst b/docs/source/developers_guide/developers_guide.rst
similarity index 64%
rename from docs/source/developers_guide.rst
rename to docs/source/developers_guide/developers_guide.rst
index 107135fae4..a125e60460 100644
--- a/docs/source/developers_guide.rst
+++ b/docs/source/developers_guide/developers_guide.rst
@@ -2,5 +2,5 @@
 Developers Guide
 ******************
 
-.. mdinclude:: ../../CONTRIBUTING.md
+.. mdinclude:: ../../../CONTRIBUTING.md
    :start-line: 2
diff --git a/docs/source/developers_guide/ff_internals.rst b/docs/source/developers_guide/ff_internals.rst
new file mode 100644
index 0000000000..15c0804255
--- /dev/null
+++ b/docs/source/developers_guide/ff_internals.rst
@@ -0,0 +1,6 @@
+*******************
+FlexFlow Internals
+*******************
+
+.. mdinclude:: internals.md
+   :start-line: 2
diff --git a/docs/source/developers_guide/internals.md b/docs/source/developers_guide/internals.md
new file mode 100644
index 0000000000..243b14a174
--- /dev/null
+++ b/docs/source/developers_guide/internals.md
@@ -0,0 +1,15 @@
+# FlexFlow Internals
+
+## The Parallel Computation Graph (PCG)
+
+FlexFlow uses a _Parallel Computation Graph (PCG)_ to simultaneously represent tensor operations, as well as parallelism choices and data movement across nodes. 
+
+### Tensor representations
+
+There are two types of tensor representations in FlexFlow: a [Tensor](./cuda_api/de/da9/structFlexFlow_1_1TensorBase.html) and a [ParallelTensor](./cuda_api/d3/dfc/structFlexFlow_1_1ParallelTensorBase.html). The first variant is used when writing a FlexFlow DNN program, whereas the second is used by the runtime to run all the computations in a distributed fashion. `Tensor` and `ParallelTensor` are implemented as typedef-ed pointers to, respectively, the `TensorBase` (defined in `include/flexflow/tensor.h`) and `ParallelTensorBase` (defined in `include/flexflow/parallel_tensor.h`) structs. 
+
+The `ParallelTensor` struct contains all the information that a `Tensor` also stores, but in addition, it also codifies how the tensor should be parallelized. For instance, a ParallelTensor records how each dimension is *partitioned*, how many *replicas* of the tensors have been created, and the *mapping* between the partitions of the tensors and the physical machines that will store them. 
+
+## Transformation generation
+
+## Joint optimization
diff --git a/docs/source/docker.rst b/docs/source/docker.rst
index 4a457a8dcc..63f84e460c 100644
--- a/docs/source/docker.rst
+++ b/docs/source/docker.rst
@@ -1,3 +1,4 @@
+:tocdepth: 1
 *************
 Docker
 *************
diff --git a/docs/source/index.rst b/docs/source/index.rst
index 7af62e417e..2b369ac8e6 100644
--- a/docs/source/index.rst
+++ b/docs/source/index.rst
@@ -7,47 +7,37 @@ Welcome to FlexFlow's documentation!
 ====================================
 
 .. toctree::
-   :maxdepth: 2
    :caption: Getting Started
    
    welcome
    installation
    docker
-   jupyter
 
 .. toctree::
-   :maxdepth: 2
-   :caption: Interoperability
+   :caption: FlexFlow Serve
    
-   keras
-   pytorch
-   onnx
+   serve_overview
 
 .. toctree::
-   :maxdepth: 2
-   :caption: Examples
-
-   mt5
+   :caption: FlexFlow Train
    
-.. toctree::
-   :maxdepth: 3
-   :caption: Python API
+   train_overview
+   train_interface
+   train_examples
    
-   python/models
-   python/layers
-   python/dataloader
+   train_python_api
 
 .. toctree::
-   :maxdepth: 2
-   :caption: C++ API
+   :caption: FlexFlow Backend
 
-   c++_api/c++_api_root
+   cpp_api
 
 .. toctree::
-   :maxdepth: 2
+   :maxdepth: 3
    :caption: Developers Guide
 
-   developers_guide
+   developers_guide/developers_guide.rst
+..   developers_guide/ff_internals.rst
 
 
 .. Indices and tables
diff --git a/docs/source/installation.rst b/docs/source/installation.rst
index 109b546834..95ec8596e6 100644
--- a/docs/source/installation.rst
+++ b/docs/source/installation.rst
@@ -1,5 +1,6 @@
+:tocdepth: 1
 *************
-Installing FlexFlow
+Building from source
 *************
 
 .. mdinclude:: ../../INSTALL.md
diff --git a/docs/source/keras.rst b/docs/source/keras.rst
index eb4f2d7fa7..f1c0743c70 100644
--- a/docs/source/keras.rst
+++ b/docs/source/keras.rst
@@ -1,6 +1,7 @@
-*************
-Keras Support
-*************
+:tocdepth: 1
+****************
+Keras Interface
+****************
 
 FlexFlow provides a drop-in replacement for TensorFlow Keras. Running an existing Keras program on the FlexFlow backend only requires a few lines of changes to the program. The detailed instructions are as follows:
 
diff --git a/docs/source/mt5.rst b/docs/source/mt5.rst
index c9c3af080a..8a632b90d6 100644
--- a/docs/source/mt5.rst
+++ b/docs/source/mt5.rst
@@ -1,6 +1,6 @@
-****************
-HuggingFace mT5 
-****************
+************************
+mT5 Model
+************************
 
 .. mdinclude:: ../../examples/python/pytorch/mt5/README.md
    :start-line: 2
diff --git a/docs/source/onnx.rst b/docs/source/onnx.rst
index 91b314ac96..b6bc49b146 100644
--- a/docs/source/onnx.rst
+++ b/docs/source/onnx.rst
@@ -1,3 +1,4 @@
+:tocdepth: 1
 *************
 ONNX Support
 *************
diff --git a/docs/source/pytorch.rst b/docs/source/pytorch.rst
index a6d4e23311..3dbe337d55 100644
--- a/docs/source/pytorch.rst
+++ b/docs/source/pytorch.rst
@@ -1,6 +1,7 @@
-***************
-PyTorch Support
-***************
+:tocdepth: 1
+******************
+PyTorch Interface
+******************
 
 Users can use FlexFlow to optimize the parallelization performance of existing PyTorch models in two steps.
 The PyTorch support requires the `PyTorch FX module <https://github.com/pytorch/pytorch/pull/42741>`_, so make sure your PyTorch is up to date. 
diff --git a/docs/source/serve_overview.rst b/docs/source/serve_overview.rst
new file mode 100644
index 0000000000..35c992a853
--- /dev/null
+++ b/docs/source/serve_overview.rst
@@ -0,0 +1,7 @@
+:tocdepth: 1
+*************
+Serving Overview
+*************
+
+.. mdinclude:: ../../SERVE.md
+   :start-line: 3
diff --git a/docs/source/train_examples.rst b/docs/source/train_examples.rst
new file mode 100644
index 0000000000..84d58c3465
--- /dev/null
+++ b/docs/source/train_examples.rst
@@ -0,0 +1,6 @@
+*************
+Training Examples
+*************
+
+.. toctree::
+   mt5
\ No newline at end of file
diff --git a/docs/source/train_interface.rst b/docs/source/train_interface.rst
new file mode 100644
index 0000000000..ce81fc1f3c
--- /dev/null
+++ b/docs/source/train_interface.rst
@@ -0,0 +1,8 @@
+*******************
+Training Interface
+*******************
+
+.. toctree::
+   keras
+   pytorch
+   onnx
\ No newline at end of file
diff --git a/docs/source/train_overview.rst b/docs/source/train_overview.rst
new file mode 100644
index 0000000000..58898ad35c
--- /dev/null
+++ b/docs/source/train_overview.rst
@@ -0,0 +1,7 @@
+:tocdepth: 1
+*************
+Training Overview
+*************
+
+.. mdinclude:: ../../TRAIN.md
+   :start-line: 3
diff --git a/docs/source/train_python_api.rst b/docs/source/train_python_api.rst
new file mode 100644
index 0000000000..40451dedf9
--- /dev/null
+++ b/docs/source/train_python_api.rst
@@ -0,0 +1,11 @@
+*******************
+Python API
+*******************
+This section documents the Python API for FlexFlow Train.
+
+.. toctree::
+   :maxdepth: 3
+   
+   python/models
+   python/layers
+   python/dataloader
\ No newline at end of file
diff --git a/docs/source/welcome.rst b/docs/source/welcome.rst
index 8108b1dd67..7f73f15563 100644
--- a/docs/source/welcome.rst
+++ b/docs/source/welcome.rst
@@ -1,3 +1,4 @@
+:tocdepth: 1
 *************
 Overview
 *************
diff --git a/include/flexflow/operator.h b/include/flexflow/operator.h
index 0ef7f6cbac..1b2fc7bbfc 100644
--- a/include/flexflow/operator.h
+++ b/include/flexflow/operator.h
@@ -20,11 +20,33 @@ enum class MappingRecordType { INPUT_OUTPUT, INPUT_WEIGHT };
 
 enum class MappingOperation { PARTITION, REPLICATE };
 
+/** @brief  A class to keep track of a dimension relation between two tensors
+ * used by an operator.
+ *
+ * Dimension relations are one-to-one mappings between the dimensions of the
+ * input, weights, and output tensors of an operator. Introduced in the Unity
+ * paper, dimension relations allow FlexFlow to keep track of an operator's
+ * parallelization plans as part of the Parallel Computation Graph (PCG).
+ *
+ * Each ParallelDimMappingRecord only keeps track of a single dimension
+ * relation.
+ *
+ * ParallelDimMappingRecord objects must be initialized with a
+ * MappingRecordType, which can be INPUT_OUTPUT, if the ParallelDimMappingRecord
+ * is tracking a dimension relation between the input and the output tensor, or
+ * INPUT_WEIGHT, if the ParallelDimMappingRecord is tracking a dimension
+ * relation between the input tensor and the weights tensor.
+ *
+ */
 class ParallelDimMappingRecord {
 private:
   ParallelDimMappingRecord(MappingRecordType);
 
 public:
+  /**
+   * @brief We disable this constructor because ParallelDimMappingRecord objects
+   * must specify the MappingRecordType upon creation.
+   */
   ParallelDimMappingRecord() = delete;
 
   static ParallelDimMappingRecord input_output_record(
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index 21436d24d6..9e353fb374 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -1317,6 +1317,11 @@ bool LinearParams::is_valid(ParallelTensorShape const &input_shape) const {
   return is_valid;
 }
 
+/** @brief  A wrapper around the main version of the solve_dims function.
+ *
+ * It takes a the input tensor as a parameter, instead of the input's
+ * ParallelTensorShape.
+ */
 void LinearParams::solve_dims(const ParallelTensor input,
                               ParallelDim output_dims[MAX_TENSOR_DIM],
                               int *output_ndims,
@@ -1333,6 +1338,13 @@ void LinearParams::solve_dims(const ParallelTensor input,
                    bias_ndims);
 }
 
+/** @brief  A wrapper around the main version of the solve_dims function.
+ *
+ * For each of the output, weights, and bias tensors, it takes a
+ * ParallelTensorShape argument, instead of a pointer to an integer variable to
+ * record the number of dimensions, plus a ParallelDim array to record all the
+ * information regarding each dimension.
+ */
 void LinearParams::solve_dims(ParallelTensorShape const &input_shape,
                               ParallelTensorShape &output_shape,
                               ParallelTensorShape &kernel_shape,
@@ -1359,11 +1371,14 @@ void LinearParams::solve_dims(ParallelTensorShape const &input_shape,
 
   std::vector<ParallelDimMappingRecord> mapping;
   this->construct_mappings(mapping, input_shape);
+  // sets the is_replica_dim field to true for the dimensions that are used to
+  // record the number of replicas
   this->mark_replica_dims(input_shape, output_dims, kernel_dims, bias_dims);
 
   solve_parallel_dim_mappings(
       mapping, {input_shape.dims}, {kernel_dims, bias_dims}, {output_dims});
 
+  // sets the dimension sizes of the output, weights, and bias tensors
   this->calculate_nonreplica_dim_sizes(input_shape,
                                        output_dims,
                                        output_ndims,
@@ -1373,6 +1388,34 @@ void LinearParams::solve_dims(ParallelTensorShape const &input_shape,
                                        bias_ndims);
 }
 
+/** @brief  Create a map between each of a tensor's dimension name and its
+ * corresponding index
+ *
+ * The tensor dimension names are defined as follows. For the input tensor, the
+ * first dimension is called INPUT_CHANNEL, and generally corresponds to number
+ * of floats needed to store a single element from the input dataset. For
+ * example, when each element in the dataset is a flattened MNIST image, the
+ * INPUT_CHANNEL dimension will have a size of 28x28=784. The second to last and
+ * last dimensions in the input tensor are, respectively, the INPUT_SAMPLE and
+ * INPUT_REPLICA dimensions. The size of the INPUT_SAMPLE dimension generally
+ * corresponds to the batch size used for training. The size of the
+ * INPUT_REPLICA tells us how many replicas of the tensors have been created.
+ * The dimensions of the output tensor are named analogously: the first
+ * dimension is OUTPUT_CHANNEL, the second to last is OUTPUT_SAMPLE, and the
+ * last one is OUTPUT_REPLICA. Both the input and output tensor may have
+ * additional dimensions, without a name, between {INPUT,OUTPUT}_CHANNEL and
+ * {INPUT,OUTPUT}_SAMPLE. For instance, when the input data comes in textual
+ * form, it is common to have an additional dimension representing the sequence
+ * length. When it comes to the weights, the dimensions are named simply as
+ * KERNEL_CHANNEL_IN (first dimension of a weight's tensor), KERNEL_CHANNEL_OUT
+ * (second dimension) and BIAS_CHANNEL_OUT (first dimension of the bias tensor)
+ *
+ * @param[in] input_shape   A ParallelTensorShape object representing the shape
+ * of the ParallelTensor used for the input to the operator
+ * @return dimension_names  A map from each LinearParams::NamedDimensions to the
+ * index corresponding to that dimension in the input, weight, (bias), or output
+ * tensor.
+ */
 std::unordered_map<LinearParams::NamedDimensions, int>
     LinearParams::get_dimension_names(
         ParallelTensorShape const &input_shape) const {
@@ -1389,6 +1432,43 @@ std::unordered_map<LinearParams::NamedDimensions, int>
           {BIAS_CHANNEL_OUT, 0}};
 }
 
+/** @brief  Sets the size field of ParallelDim objects passed as arguments to
+ * the expected (non-replica) dimensions of the output, weights, and bias
+ * tensors. In addition, it sets the output_ndims, kernel_ndims and bias_ndims
+ * variables to the number of dimensions (including the replica dimensions) of,
+ * respectively, the ouput, weights, and bias tensors.
+ *
+ * The number of dimensions, and dimension sizes of the output, weights, and
+ * bias dimensions are set as follows. The number of dimensions of all three
+ * tensors are copied from the dimensions of the input tensor. The replica
+ * dimensions are not subtracted or otherwise excluded. The size of the output
+ * tensor dimensions are also copied from the input tensor, with the exception
+ * of the last dimension (replica dimension), which is not set, and the first
+ * dimension, whose size is set equal to the out_channels member of the
+ * LinearParams struct, which in turn is set by the outDim parameter of the
+ * FModel::dense function. When it comes to the size of the weights dimensions,
+ * the first dimension is set to have size equal to the quotient of the size of
+ * the INPUT_CHANNEL dimension of the input (first dimension) and the degree
+ * (number of partitions) of the same input dimension. The second dimension of
+ * the the weights tensor is set equal to out_channels, just like the first
+ * dimension of the output tensor. Finally, the size of the first dimension of
+ * the bias tensor is also set equal to the value of out_channels.
+ *
+ * @param[in]   input_shape   A required argument recording the dimensions of
+ * the input tensor
+ * @param[out]  output_dims   An array of ParallelDim objects representing the
+ * dimensions of the output tensor
+ * @param[out]  output_ndims  The number of dimensions (including the replica
+ * dimension(s)) of the output tensor
+ * @param[out]  kernel_dims   An array of ParallelDim objects representing the
+ * dimensions of the weights tensor
+ * @param[out]  kernel_ndims  The number of dimensions (including the replica
+ * dimension(s)) of the weights tensor
+ * @param[out]  bias_dims     An array of ParallelDim objects representing the
+ * dimensions of the bias tensor
+ * @param[out]  bias_ndims    The number of dimensions (including the replica
+ * dimension(s)) of the bias tensor
+ */
 void LinearParams::calculate_nonreplica_dim_sizes(
     ParallelTensorShape const &input_shape,
     ParallelDim output_dims[MAX_TENSOR_DIM],
@@ -1421,6 +1501,20 @@ void LinearParams::calculate_nonreplica_dim_sizes(
   }
 }
 
+/** @brief Switch the is_replica_dim field to true in each ParallelDim of
+ *         the output, weight and bias tensor, if the corresponding dimension
+ *         is used to keep track of the number of replicas
+ *
+ * @param[in]   input_shape   A required argument recording the dimensions of
+ * the input tensor
+ * @param[out]  output_dims   An array of ParallelDim objects representing the
+ * dimensions of the output tensor
+ * @param[out]  kernel_dims   An array of ParallelDim objects representing the
+ * dimensions of the weights tensor
+ * @param[out]  bias_dims     An array of ParallelDim objects representing the
+ * dimensions of the bias tensor
+ *
+ */
 void LinearParams::mark_replica_dims(
     ParallelTensorShape const &input_shape,
     ParallelDim output_dims[MAX_TENSOR_DIM],
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index b54a58448e..43b5df1f39 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -602,11 +602,35 @@ ncclComm_t Op::init_nccl_comms_task(Task const *task,
 }
 #endif
 
+/**
+ * @brief The ParallelDimMappingRecord class's constructor. It sets the object's
+ * type field equal to the value passed as the constructor's argument, and
+ * initializes all other fields to -1.
+ *
+ * @param[in]   type  The MappingRecordType to use to initialize the
+ * ParallelDimMappingRecord.
+ */
 ParallelDimMappingRecord::ParallelDimMappingRecord(MappingRecordType type)
     : type(type), output_dim(-1), input_dim(-1), weight_dim(-1), output_idx(-1),
       input_idx(-1), weight_idx(-1) {}
 
 /*static*/
+/**
+ * @brief Builds and initializes a ParallelDimMappingRecord object of
+ * INPUT_OUTPUT MappingRecordType.
+ *
+ * This function should be used to create a ParallelDimMappingRecord to track an
+ * operator's dimension relation between the input and the output tensor
+ *
+ * @param[in]   input_idx   The index of the input tensor (nonzero if there are
+ * multiple inputs)
+ * @param[in]   input_dim   The index of the input dimension part of the
+ * dimension relation
+ * @param[in]   output_idx  The index of the output tensor (nonzero if there are
+ * multiple outputs)
+ * @param[in]   output_dim  The index of the output dimension part of the
+ * dimension relation
+ */
 ParallelDimMappingRecord ParallelDimMappingRecord::input_output_record(
     int input_idx,
     int input_dim,
@@ -630,6 +654,22 @@ ParallelDimMappingRecord ParallelDimMappingRecord::input_output_record(
 }
 
 /*static*/
+/**
+ * @brief Builds and initializes a ParallelDimMappingRecord object of
+ * INPUT_WEIGHT MappingRecordType.
+ *
+ * This function should be used to create a ParallelDimMappingRecord to track an
+ * operator's dimension relation between the input and the weights tensor
+ *
+ * @param[in]   input_idx   The index of the input tensor (nonzero if there are
+ * multiple inputs)
+ * @param[in]   input_dim   The index of the input dimension part of the
+ * dimension relation
+ * @param[in]   weight_idx  The index of the weight tensor (nonzero if there are
+ * multiple weights)
+ * @param[in]   weight_dim  The index of the weight dimension part of the
+ * dimension relation
+ */
 ParallelDimMappingRecord ParallelDimMappingRecord::input_weight_record(
     int input_idx,
     int input_dim,
@@ -657,6 +697,39 @@ MappingRecordType ParallelDimMappingRecord::get_type() const {
 }
 
 /*static*/
+/** @brief A wrapper around the main version of the
+ * construct_weight_parallel_dims function.
+ *
+ * This wrapper allows you to append multiple dimension relations at once to a
+ * vector of ParallelDimMappingRecord entries. The relations must be between
+ * dimensions of the same pair of input and weight tensors. Unlike the other
+ * construct_weight_parallel_dims wrapper below, this function allows you to
+ * specify the MappingOperation for each pair of dimensions for which you will
+ * be creating a new ParallelDimMappingRecord.
+ *
+ * The function takes a vector of (int, MappingOperation, int) tuples, where the
+ * int members represent the indexes of the two dimensions in a relation, and
+ * the MappingOperation member specifies the type of mapping operation. Just
+ * like the other wrapper, this function simply calls the main version of
+ * construct_weight_parallel_dims for each pair, using the same values across
+ * all calls for all other parameters.
+ *
+ * This function should NOT be used to track dimension relations between the
+ * input and weights tensors; construct_weight_parallel_dims should be used
+ * instead.
+ *
+ * @param[out]  records     The (potentially empty) vector of existing
+ * ParallelDimMappingRecord entries
+ * @param[in]   mappings    A vector of tuples, each including a pair of
+ * integers (representing the indexes of the input and weight dimensions in a
+ * relation), and a MappingOperation, specifying the mapping operation for the
+ * pair of dimensions.
+ * @param[in]   input_idx   The index of the input tensor (nonzero if there are
+ * multiple inputs)
+ * @param[in]   weight_idx  The index of the weight tensor (nonzero if there are
+ * multiple weights)
+ *
+ */
 void Op::construct_weight_parallel_dims(
     std::vector<ParallelDimMappingRecord> &records,
     std::vector<std::tuple<int, MappingOperation, int>> mappings,
@@ -673,6 +746,30 @@ void Op::construct_weight_parallel_dims(
 }
 
 /*static*/
+/** @brief A wrapper around the main version of the
+ * construct_weight_parallel_dims function.
+ *
+ * This wrapper allows you to append multiple dimension relations at once to a
+ * vector of ParallelDimMappingRecord entries. The relations must be between
+ * dimensions of the same pair of input and weight tensors. The function takes a
+ * vector of (input, weight) dimension index pairs and simply calls the main
+ * version of construct_weight_parallel_dims for each such pair, using the same
+ * values across all calls for all other parameters.
+ *
+ * This function should NOT be used to track dimension relations between the
+ * input and weights tensors; construct_weight_parallel_dims should be used
+ * instead.
+ *
+ * @param[out]  records     The (potentially empty) vector of existing
+ * ParallelDimMappingRecord entries
+ * @param[in]   mappings    A vector of integer pairs, each representing the
+ * indexes of the input and weight dimensions in a relation.
+ * @param[in]   input_idx   The index of the input tensor (nonzero if there are
+ * multiple inputs)
+ * @param[in]   weight_idx  The index of the weight tensor (nonzero if there are
+ * multiple weights)
+ *
+ */
 void Op::construct_weight_parallel_dims(
     std::vector<ParallelDimMappingRecord> &records,
     std::vector<std::pair<int, int>> mappings,
@@ -685,6 +782,30 @@ void Op::construct_weight_parallel_dims(
 }
 
 /*static*/
+/**
+ * @brief Creates a new ParallelDimMappingRecord (of the INPUT_WEIGHT
+ * MappingRecordType flavor) and appends it to an existing vector of
+ * ParallelDimMappingRecord entries.
+ *
+ * This function creates a new ParallelDimMappingRecord to track a dimension
+ * relation between a dimension from the input tensor and a dimension from the
+ * weight tensor. This function should NOT be used to track dimension relations
+ * between the input and output tensors; construct_output_parallel_dims should
+ * be used instead.
+ *
+ * @param[out]  records     The (potentially empty) vector of existing
+ * ParallelDimMappingRecord entries
+ * @param[in]   input_dim   The index of the input dimension part of the
+ * dimension relation
+ * @param[in]   weight_dim  The index of the weight dimension part of the
+ * dimension relation
+ * @param[in]   input_idx   The index of the input tensor (nonzero if there are
+ * multiple inputs)
+ * @param[in]   weight_idx  The index of the weight tensor (nonzero if there are
+ * multiple weights)
+ * @param[in]   operation   The parallelization operation (partition or
+ * replication) associated with the dimension relation
+ */
 void Op::construct_weight_parallel_dims(
     std::vector<ParallelDimMappingRecord> &records,
     int input_dim,
@@ -696,12 +817,20 @@ void Op::construct_weight_parallel_dims(
       input_idx, input_dim, weight_idx, weight_dim, operation));
 }
 
+/** @brief  Calls the corresponding version of construct_weight_parallel_dims,
+ * and passes the Op class's parallel_dims_mapping vector, so that the resulting
+ * ParallelDimMappingRecord are appended to it
+ */
 void Op::register_weight_parallel_dims(
     std::vector<std::pair<int, int>> mappings, int input_idx, int weight_idx) {
   Op::construct_weight_parallel_dims(
       *this->parallel_dims_mapping, mappings, input_idx, weight_idx);
 }
 
+/** @brief  Calls the corresponding version of construct_weight_parallel_dims,
+ * and passes the Op class's parallel_dims_mapping vector, so that the resulting
+ * ParallelDimMappingRecord are appended to it
+ */
 void Op::register_weight_parallel_dims(
     std::vector<std::tuple<int, MappingOperation, int>> mappings,
     int input_idx,
@@ -710,6 +839,10 @@ void Op::register_weight_parallel_dims(
       *this->parallel_dims_mapping, mappings, input_idx, weight_idx);
 }
 
+/** @brief  Calls the corresponding version of construct_weight_parallel_dims,
+ * and passes the Op class's parallel_dims_mapping vector, so that the resulting
+ * ParallelDimMappingRecord are appended to it
+ */
 void Op::register_weight_parallel_dims(
     int input_dim,
     int weight_dim,
@@ -725,6 +858,39 @@ void Op::register_weight_parallel_dims(
 }
 
 /*static*/
+/** @brief A wrapper around the main version of the
+ * construct_output_parallel_dims function.
+ *
+ * This wrapper allows you to append multiple dimension relations at once to a
+ * vector of ParallelDimMappingRecord entries. The relations must be between
+ * dimensions of the same pair of input and output tensors. Unlike the other
+ * construct_output_parallel_dims wrapper below, this function allows you to
+ * specify the MappingOperation for each pair of dimensions for which you will
+ * be creating a new ParallelDimMappingRecord.
+ *
+ * The function takes a vector of (int, MappingOperation, int) tuples, where the
+ * int members represent the indexes of the two dimensions in a relation, and
+ * the MappingOperation member specifies the type of mapping operation. Just
+ * like the other wrapper, this function simply calls the main version of
+ * construct_output_parallel_dims for each pair, using the same values across
+ * all calls for all other parameters.
+ *
+ * This function should NOT be used to track dimension relations between the
+ * input and weights tensors; construct_weight_parallel_dims should be used
+ * instead.
+ *
+ * @param[out]  records     The (potentially empty) vector of existing
+ * ParallelDimMappingRecord entries
+ * @param[in]   mappings    A vector of tuples, each including a pair of
+ * integers (representing the indexes of the input and output dimensions in a
+ * relation), and a MappingOperation, specifying the mapping operation for the
+ * pair of dimensions.
+ * @param[in]   input_idx   The index of the input tensor (nonzero if there are
+ * multiple inputs)
+ * @param[in]   output_idx  The index of the output tensor (nonzero if there are
+ * multiple outputs)
+ *
+ */
 void Op::construct_output_parallel_dims(
     std::vector<ParallelDimMappingRecord> &records,
     std::vector<std::tuple<int, MappingOperation, int>> mappings,
@@ -741,6 +907,30 @@ void Op::construct_output_parallel_dims(
 }
 
 /*static*/
+/** @brief A wrapper around the main version of the
+ * construct_output_parallel_dims function.
+ *
+ * This wrapper allows you to append multiple dimension relations at once to a
+ * vector of ParallelDimMappingRecord entries. The relations must be between
+ * dimensions of the same pair of input and output tensors. The function takes a
+ * vector of (input, output) dimension index pairs and simply calls the main
+ * version of construct_output_parallel_dims for each such pair, using the same
+ * values across all calls for all other parameters.
+ *
+ * This function should NOT be used to track dimension relations between the
+ * input and weights tensors; construct_weight_parallel_dims should be used
+ * instead.
+ *
+ * @param[out]  records     The (potentially empty) vector of existing
+ * ParallelDimMappingRecord entries
+ * @param[in]   mappings    A vector of integer pairs, each representing the
+ * indexes of the input and output dimensions in a relation.
+ * @param[in]   input_idx   The index of the input tensor (nonzero if there are
+ * multiple inputs)
+ * @param[in]   output_idx  The index of the output tensor (nonzero if there are
+ * multiple outputs)
+ *
+ */
 void Op::construct_output_parallel_dims(
     std::vector<ParallelDimMappingRecord> &records,
     std::vector<std::pair<int, int>> mappings,
@@ -753,6 +943,30 @@ void Op::construct_output_parallel_dims(
 }
 
 /*static*/
+/**
+ * @brief Creates a new ParallelDimMappingRecord (of the INPUT_OUTPUT
+ * MappingRecordType flavor) and appends it to an existing vector of
+ * ParallelDimMappingRecord entries.
+ *
+ * This function creates a new ParallelDimMappingRecord to track a dimension
+ * relation between a dimension from the input tensor and a dimension from the
+ * output tensor. This function should NOT be used to track dimension relations
+ * between the input and weights tensors; construct_weight_parallel_dims should
+ * be used instead.
+ *
+ * @param[out]  records     The (potentially empty) vector of existing
+ * ParallelDimMappingRecord entries
+ * @param[in]   input_dim   The index of the input dimension part of the
+ * dimension relation
+ * @param[in]   output_dim  The index of the output dimension part of the
+ * dimension relation
+ * @param[in]   input_idx   The index of the input tensor (nonzero if there are
+ * multiple inputs)
+ * @param[in]   output_idx  The index of the output tensor (nonzero if there are
+ * multiple outputs)
+ * @param[in]   operation   The parallelization operation (partition or
+ * replication) associated with the dimension relation
+ */
 void Op::construct_output_parallel_dims(
     std::vector<ParallelDimMappingRecord> &records,
     int input_dim,
@@ -764,12 +978,20 @@ void Op::construct_output_parallel_dims(
       input_idx, input_dim, output_idx, output_dim, operation));
 }
 
+/** @brief  Calls the corresponding version of construct_output_parallel_dims,
+ * and passes the Op class's parallel_dims_mapping vector, so that the resulting
+ * ParallelDimMappingRecord are appended to it
+ */
 void Op::register_output_parallel_dims(
     std::vector<std::pair<int, int>> mappings, int input_idx, int output_idx) {
   Op::construct_output_parallel_dims(
       *this->parallel_dims_mapping, mappings, input_idx, output_idx);
 }
 
+/** @brief  Calls the corresponding version of construct_output_parallel_dims,
+ * and passes the Op class's parallel_dims_mapping vector, so that the resulting
+ * ParallelDimMappingRecord are appended to it
+ */
 void Op::register_output_parallel_dims(
     std::vector<std::tuple<int, MappingOperation, int>> mappings,
     int input_idx,
@@ -778,6 +1000,10 @@ void Op::register_output_parallel_dims(
       *this->parallel_dims_mapping, mappings, input_idx, output_idx);
 }
 
+/** @brief  Calls the corresponding version of construct_output_parallel_dims,
+ * and passes the Op class's parallel_dims_mapping vector, so that the resulting
+ * ParallelDimMappingRecord are appended to it
+ */
 void Op::register_output_parallel_dims(
     int input_dim,
     int output_dim,
@@ -6334,12 +6560,12 @@ void register_flexflow_internal_tasks(Runtime *runtime,
 #endif
   // Search
   {
-    TaskVariantRegistrar registrar(STRATEGY_SEARCH_TASK_ID, "Stretegy Search");
+    TaskVariantRegistrar registrar(STRATEGY_SEARCH_TASK_ID, "Strategy Search");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
     if (pre_register) {
       Runtime::preregister_task_variant<Simulator::strategy_search_task>(
-          registrar, "Stretegy Search Task");
+          registrar, "Strategy Search Task");
     } else {
       if (enable_control_replication) {
         registrar.global_registration = false;

From 88f70e3946bdd518fb632fb57de0a259eccbb2d2 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 17 Aug 2023 15:23:54 -0400
Subject: [PATCH 202/344] Fix conda in CI (#974)

* maybe fix

* fix
---
 conda/flexflow.yml | 6 +++---
 requirements.txt   | 6 +++---
 2 files changed, 6 insertions(+), 6 deletions(-)

diff --git a/conda/flexflow.yml b/conda/flexflow.yml
index 57101ac4ff..9ff7f3957a 100644
--- a/conda/flexflow.yml
+++ b/conda/flexflow.yml
@@ -15,9 +15,9 @@ dependencies:
     - qualname>=0.1.0
     - keras_preprocessing>=1.1.2
     - numpy>=1.16.0
-    - torch==2.0.1 --index-url https://download.pytorch.org/whl/cpu
-    - torchaudio==2.0.2 --index-url https://download.pytorch.org/whl/cpu
-    - torchvision==0.15.2 --index-url https://download.pytorch.org/whl/cpu
+    - torch>=1.13.1 --index-url https://download.pytorch.org/whl/cpu
+    - torchaudio>=0.13.1 --index-url https://download.pytorch.org/whl/cpu
+    - torchvision>=0.14.1 --index-url https://download.pytorch.org/whl/cpu
     - regex
     - onnx
     - transformers>=4.31.0
diff --git a/requirements.txt b/requirements.txt
index 2e8d4ad962..c6337dccfa 100644
--- a/requirements.txt
+++ b/requirements.txt
@@ -10,9 +10,9 @@ requests
 qualname
 regex
 requests
-torch==2.0.1
-torchaudio==2.0.2
-torchvision==0.15.2
+torch>=1.13.1
+torchaudio>=0.13.1
+torchvision>=0.14.1
 onnx
 transformers>=4.31.0
 sentencepiece

From 97c62b1b92ffd87bae82e55375f71950c2fb9f40 Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Thu, 17 Aug 2023 17:53:57 -0400
Subject: [PATCH 203/344] change ff.init interface to accept parameters (#973)

* change init interface

* fix.

* update method signature

* update defaults

* update

* fix

* update docs

---------

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
---
 python/flexflow/serve/__init__.py | 171 +++++++++++++++++++++---------
 1 file changed, 121 insertions(+), 50 deletions(-)

diff --git a/python/flexflow/serve/__init__.py b/python/flexflow/serve/__init__.py
index 315a1e4317..19a2774a54 100644
--- a/python/flexflow/serve/__init__.py
+++ b/python/flexflow/serve/__init__.py
@@ -12,8 +12,8 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 
-import json, sys, os
-from typing import Union
+import sys, os
+from typing import Union, Optional
 from ..type import *
 
 
@@ -33,17 +33,36 @@ def _parse_positive_int_config(name: str, variable: str, ff_cli_name: str = None
             sys.argv += [f"{ff_cli_name}", str(variable)]
 
 
-def init(configs: Union[str, dict]):
-    """Configure FlexFlow for inference and start the FlexFlow runtime by importing the flexflow.core package.
-
-    The configurations are passed down to the FlexFlow runtime (implemented in C++) via command line arguments.
-
-    The init function takes three mandatory parameters, which cannot be changed after starting the runtime. These are:
+def init(configs_dict: Optional[dict] = None, 
+        *, 
+        num_gpus: Optional[int] = None,
+        memory_per_gpu: Optional[int] = None,
+        zero_copy_memory_per_node: Optional[int] = None,
+        num_cpus: Optional[int] = None,
+        legion_utility_processors: Optional[int] = None,
+        data_parallelism_degree: Optional[int] = None,
+        tensor_parallelism_degree: Optional[int] = None,
+        pipeline_parallelism_degree: Optional[int] = None,
+        offload: Optional[bool] = None,
+        offload_reserve_space_size: Optional[int] = None,
+        use_4bit_quantization: Optional[bool] = None,
+        use_8bit_quantization: Optional[bool] = None,
+        profiling: Optional[bool] = None,
+        fusion: Optional[bool] = None):
+    """
+    Configure FlexFlow Serve and start the runtime. 
+    
+    The function takes, alternatively, configs_dict (a positional argument of type dictionary),
+    or three mandatory named parameters, plus some additional optional named parameters. When passing
+    a configs_dict, no named parameter should be specified, and the dictionary should have keys matching
+    at least the mandatory named parameters.
+    
+    The three mandatory parameters, which cannot be changed after starting the runtime, are:
     - num_gpus: the number of GPUs to reserve for the runtime
     - memory_per_gpu: the amount of memory (in MB) to pre-allocate on each GPU
     - zero_copy_memory_per_node: the amount of zero-copy memory (in MB) to pre-allocate for each node
-
-    In addition, the following optional parameters can be passed:
+    
+    The optional parameters are: 
     - num_cpus: the number of CPU processors to reserve for the runtime, defaults to 4
     - legion_utility_processors: number of Legion utility threads to create per process, defaults to 1
     - data_parallelism_degree: the degree of parallelization in the data parallel dimension, defaults to 1
@@ -55,38 +74,104 @@ def init(configs: Union[str, dict]):
     - use_8bit_quantization: whether to use 8-bit quantization, defaults to False
     - profiling: whether to enable the FlexFlow profiling mode, defaults to False
     - fusion: whether to enable the FlexFlow operator fusion optimization, defaults to True
+    
+    The configurations are passed down to the FlexFlow runtime (implemented in C++) via command line arguments.
 
-    :param configs: The runtime configs, in the form of a dictionary or the path to a JSON file
-    :type configs: Union[str, dict]
-    :raises ValueError: This function will raise an exception if the JSON file pointed to by the input string is not in the right format
-    :raises ValueError: This function will raise an exception if the mandatory FlexFlow initialization parameters are missing, or are not positive integers: num_gpus, memory_per_gpu, zero_copy_memory_per_node
+
+    :param configs_dict: A Python dictionary to pass all configurations as a single object
+    :type configs_dict: dict
+    :param num_gpus: the number of GPUs to reserve for the runtime
+    :type num_gpus: int
+    :param memory_per_gpu: memory_per_gpu: the amount of memory (in MB) to pre-allocate on each GPU
+    :type memory_per_gpu: int
+    :param zero_copy_memory_per_node: zero_copy_memory_per_node: the amount of zero-copy memory (in MB) to pre-allocate for each node
+    :type zero_copy_memory_per_node: int
+    :param num_cpus: the number of CPU processors to reserve for the runtime, defaults to 4
+    :type num_cpus: Optional[int], optional
+    :param legion_utility_processors: number of Legion utility threads to create per process, defaults to 1
+    :type legion_utility_processors: Optional[int], optional
+    :param data_parallelism_degree: the degree of parallelization in the data parallel dimension, defaults to 1
+    :type data_parallelism_degree: Optional[int], optional
+    :param tensor_parallelism_degree: the degree of parallelization in the tensor parallel dimension (using the Megatron technique), defaults to 1
+    :type tensor_parallelism_degree: Optional[int], optional
+    :param pipeline_parallelism_degree: the degree of parallelization in the pipeline parallel dimension, defaults to 1
+    :type pipeline_parallelism_degree: Optional[int], optional
+    :param offload: whether to enable offloading of the weights to CPU, defaults to False
+    :type offload: Optional[bool], optional
+    :param offload_reserve_space_size: the space (in MB) to reserve on CPU for offloading, default to 1024^2
+    :type offload_reserve_space_size: Optional[int], optional
+    :param use_4bit_quantization: whether to use 4-bit quantization, defaults to False
+    :type use_4bit_quantization: Optional[bool], optional
+    :param use_8bit_quantization: whether to use 8-bit quantization, defaults to False
+    :type use_8bit_quantization: Optional[bool], optional
+    :param profiling: whether to enable the FlexFlow profiling mode, defaults to False
+    :type profiling: Optional[bool], optional
+    :param fusion: whether to enable the FlexFlow operator fusion optimization, defaults to True
+    :type fusion: Optional[bool], optional
+    
+    :raises ValueError: this function will raise an exception if the user passes both a configs_dict and some named parameters
+    :raises TypeError: this function will raise an exception if the configs_dict is not a dictionary
+    :raises ValueError: this function will raise an exception if the mandatory FlexFlow initialization parameters are missing, or are not positive integers: num_gpus, memory_per_gpu, zero_copy_memory_per_node
     """
-    configs_dict = {}
-    if type(configs) == str:
-        try:
-            with open(configs) as f:
-                configs_dict = json.load(f)
-        except json.JSONDecodeError as e:
-            print("JSON format error:")
-            print(e)
-    elif type(configs) == dict:
-        configs_dict = configs
+    
+    # Check that either configs_dict or any of individual, non-positional arguments (after the *) is passed, but not both
+    if configs_dict is not None and any([
+        num_gpus is not None,
+        memory_per_gpu is not None,
+        zero_copy_memory_per_node is not None,
+        num_cpus is not None,
+        legion_utility_processors is not None,
+        data_parallelism_degree is not None,
+        tensor_parallelism_degree is not None,
+        pipeline_parallelism_degree is not None,
+        offload is not None,
+        offload_reserve_space_size is not None,
+        use_4bit_quantization is not None,
+        use_8bit_quantization is not None,
+        profiling is not None,
+        fusion is not None,
+    ]):
+        raise ValueError("Cannot pass both configs_dict and individual args")
+
+    if configs_dict is not None:
+        # If configs_dict is passed, check that the type is dictionary and that the mandatory key-value pairs are present (num_gpus, memory_per_gpu, zero_copy_memory_per_node)
+        if type(configs_dict) != dict:
+            raise TypeError("configs_dict is not a dictionary")
+        # configs should contain the following mandatory keys with non-zero integer values:
+        num_gpus = configs_dict.get("num_gpus")
+        memory_per_gpu = configs_dict.get("memory_per_gpu")
+        zero_copy_memory_per_node = configs_dict.get("zero_copy_memory_per_node")
+        if not num_gpus or not memory_per_gpu or not zero_copy_memory_per_node:
+            raise ValueError(
+                "Missing one of the following configs in config dict: num_gpus, memory_per_gpu, zero_copy_memory_per_node"
+            )
+        num_cpus = configs_dict.get("num_cpus")
+        legion_utility_processors = configs_dict.get("legion_utility_processors", 8)
+        data_parallelism_degree = configs_dict.get("data_parallelism_degree")
+        tensor_parallelism_degree = configs_dict.get("tensor_parallelism_degree")
+        pipeline_parallelism_degree = configs_dict.get("pipeline_parallelism_degree")
+        offload = configs_dict.get("offload", False)
+        offload_reserve_space_size = configs_dict.get("offload_reserve_space_size")
+        use_4bit_quantization = configs_dict.get("use_4bit_quantization", False)
+        use_8bit_quantization = configs_dict.get("use_8bit_quantization", False)
+        profiling = configs_dict.get("profiling", False)
+        fusion = configs_dict.get("fusion", True)
     else:
-        raise ValueError(
-            "configs should be a dictionary or the path to a valid JSON file"
+        # If configs_dict is not passed, check that the mandatory parameters are passed directly as arguments
+        if not num_gpus or not memory_per_gpu or not zero_copy_memory_per_node:
+            raise ValueError(
+            "Missing one of the following configs in input params: num_gpus, memory_per_gpu, zero_copy_memory_per_node"
         )
-
+        offload = False if offload is None else offload
+        use_4bit_quantization = False if use_4bit_quantization is None else use_4bit_quantization
+        use_8bit_quantization = False if use_8bit_quantization is None else use_8bit_quantization
+        profiling = False if profiling is None else profiling
+        fusion = True if fusion is None else fusion
+        
     # Remove the arguments to avoid interferences
     sys.argv = [sys.argv[0]]
-
-    # configs should contain the following mandatory keys with non-zero integer values:
-    num_gpus = configs_dict.get("num_gpus")
-    memory_per_gpu = configs_dict.get("memory_per_gpu")
-    zero_copy_memory_per_node = configs_dict.get("zero_copy_memory_per_node")
-    if not num_gpus or not memory_per_gpu or not zero_copy_memory_per_node:
-        raise ValueError(
-            "Missing one of the following configs: num_gpus, memory_per_gpu, zero_copy_memory_per_node"
-        )
+               
+    # parse arguments     
     _parse_positive_int_config("num_gpus", num_gpus, "-ll:gpu")
     _parse_positive_int_config("memory_per_gpu", memory_per_gpu, "-ll:fsize")
     _parse_positive_int_config(
@@ -94,16 +179,10 @@ def init(configs: Union[str, dict]):
     )
 
     # parse optional arguments
-    num_cpus = configs_dict.get("num_cpus")
     _parse_positive_int_config("num_cpus", num_cpus, "-ll:cpu")
-    legion_utility_processors = configs_dict.get("legion_utility_processors")
     _parse_positive_int_config(
         "legion_utility_processors", legion_utility_processors, "-ll:util"
     )
-
-    data_parallelism_degree = configs_dict.get("data_parallelism_degree")
-    tensor_parallelism_degree = configs_dict.get("tensor_parallelism_degree")
-    pipeline_parallelism_degree = configs_dict.get("pipeline_parallelism_degree")
     _parse_positive_int_config(
         "data_parallelism_degree", data_parallelism_degree, "-data-parallelism-degree"
     )
@@ -117,27 +196,19 @@ def init(configs: Union[str, dict]):
         pipeline_parallelism_degree,
         "-pipeline-parallelism-degree",
     )
-
-    offload = configs_dict.get("offload", False)
     if offload:
         sys.argv += ["-offload"]
-    offload_reserve_space_size = configs_dict.get("offload_reserve_space_size")
     _parse_positive_int_config(
         "offload_reserve_space_size",
         offload_reserve_space_size,
         "-offload-reserve-space-size",
     )
-    use_4bit_quantization = configs_dict.get("use_4bit_quantization", False)
     if use_4bit_quantization:
         sys.argv += ["--4bit-quantization"]
-    use_8bit_quantization = configs_dict.get("use_8bit_quantization", False)
     if use_8bit_quantization:
         sys.argv += ["--8bit-quantization"]
-
-    profiling = configs_dict.get("profiling", False)
     if profiling:
         sys.argv += ["--profiling"]
-    fusion = configs_dict.get("fusion", True)
     if fusion:
         sys.argv += ["--fusion"]
 

From d2a0629c6ffdd946baa2b5b625588b51ea6fc20c Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Thu, 17 Aug 2023 18:21:06 -0400
Subject: [PATCH 204/344] Update README.md (#975)

---
 .github/README.md | 28 ++++++++++++----------------
 1 file changed, 12 insertions(+), 16 deletions(-)

diff --git a/.github/README.md b/.github/README.md
index 99e0f82b62..b8039463a5 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -60,14 +60,12 @@ The following example shows how to deploy an LLM using FlexFlow Serve and accele
 import flexflow.serve as ff
 
 ff.init(
-    {
-        "num_gpus": 4,
-        "memory_per_gpu": 14000,
-        "zero_copy_memory_per_node": 30000,
-        "tensor_parallelism_degree": 4,
-        "pipeline_parallelism_degree": 1,
-    }
-)
+        num_gpus=4,
+        memory_per_gpu=14000,
+        zero_copy_memory_per_node=30000,
+        tensor_parallelism_degree=4,
+        pipeline_parallelism_degree=1
+    )
 ```
 Second, we specify the LLM to serve and the SSM(s) used to accelerate LLM serving. The list of supported LLMs and SSMs is available at [supported models](#supported-llms-and-ssms).
 ```python
@@ -108,14 +106,12 @@ import flexflow.serve as ff
 
 # Initialize the FlexFlow runtime. ff.init() takes a dictionary or the path to a JSON file with the configs
 ff.init(
-    {
-        "num_gpus": 4,
-        "memory_per_gpu": 14000,
-        "zero_copy_memory_per_gpu": 30000,
-        "tensor_parallelism_degree": 4,
-        "pipeline_parallelism_degree": 1,
-    }
-)
+        num_gpus=4,
+        memory_per_gpu=14000,
+        zero_copy_memory_per_node=30000,
+        tensor_parallelism_degree=4,
+        pipeline_parallelism_degree=1
+    )
 
 # Create the FlexFlow LLM
 llm = ff.LLM("decapoda-research/llama-7b-hf")

From 66570c51e29e83194c349c986f60e6c98e49d119 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Thu, 17 Aug 2023 18:54:57 -0700
Subject: [PATCH 205/344] Update README.md

---
 .github/README.md | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/.github/README.md b/.github/README.md
index b8039463a5..56434f6bf9 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -55,7 +55,8 @@ To download a Docker container for a backend other than CUDA v11.8, you can repl
 You can install FlexFlow Serve from source code by building the inference branch of FlexFlow. Please follow these [instructions](https://flexflow.readthedocs.io/en/latest/installation.html).
 
 ## Quickstart
-The following example shows how to deploy an LLM using FlexFlow Serve and accelerate its serving using [speculative inference](#speculative-inference). First, we import `flexflow.serve` and initialize the FlexFlow Serve runtime. Note that `memory_per_gpu` and `zero_copy_memory_per_node` specify the size of device memory on each GPU (in MB) and zero-copy memory on each node (in MB), respectively. FlexFlow Serve combines tensor and pipeline model parallelism for LLM serving.
+The following example shows how to deploy an LLM using FlexFlow Serve and accelerate its serving using [speculative inference](#speculative-inference). First, we import `flexflow.serve` and initialize the FlexFlow Serve runtime. Note that `memory_per_gpu` and `zero_copy_memory_per_node` specify the size of device memory on each GPU (in MB) and zero-copy memory on each node (in MB), respectively. 
+We need to make sure the aggregated GPU memory and zero-copy memory are **both** sufficient to store LLM parameters in non-offloading serving. FlexFlow Serve combines tensor and pipeline model parallelism for LLM serving.
 ```python
 import flexflow.serve as ff
 

From 18946bac9549b1ddd1e9db32042d30aa5d3e25d2 Mon Sep 17 00:00:00 2001
From: Brian Yu <138826504+brianyu-nexusflowai@users.noreply.github.com>
Date: Sat, 19 Aug 2023 08:13:26 -0700
Subject: [PATCH 206/344] adding f for fstring (#990)

---
 python/flexflow/serve/serve.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/python/flexflow/serve/serve.py b/python/flexflow/serve/serve.py
index ad4e8f594b..3c26f7ab18 100644
--- a/python/flexflow/serve/serve.py
+++ b/python/flexflow/serve/serve.py
@@ -99,7 +99,7 @@ def __get_ff_model_type(self):
             ff_arch = self.supported_models.get(architectures[0])
         if ff_arch is None:
             print(
-                "Huggingface model of type {architectures} is not yet supported by FlexFlow"
+                f"Huggingface model of type {architectures} is not yet supported by FlexFlow"
             )
             sys.exit(1)
         return ff_arch

From 68a5a541051cba114a6d8fa155842987c90ab9ae Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Sat, 19 Aug 2023 10:23:29 -0500
Subject: [PATCH 207/344] link to stdc++fs (#985)

---
 CMakeLists.txt | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index 9fced69cf8..71077d22ef 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -307,7 +307,8 @@ list(APPEND FF_NVCC_FLAGS
 list(APPEND FF_LD_FLAGS
   -lrt
   -ldl
-  -rdynamic)
+  -rdynamic
+  -lstdc++fs)
 
 # Set FF FLAGS
 add_compile_options(${FF_CC_FLAGS})

From 0ec418985c78ce7b1f045fa45a74bf510c26219b Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Mon, 21 Aug 2023 07:46:33 -0500
Subject: [PATCH 208/344] add GenerationResult to the Python interface (#1000)

---
 include/flexflow/flexflow_c.h         | 10 +++++++---
 python/flexflow/core/flexflow_cffi.py | 16 +++++++++++++---
 python/flexflow/serve/__init__.py     |  8 ++++----
 python/flexflow/serve/serve.py        |  5 +++++
 src/c/flexflow_c.cc                   | 21 ++++++++++++++++-----
 src/runtime/request_manager.cu        |  4 ++--
 6 files changed, 47 insertions(+), 17 deletions(-)

diff --git a/include/flexflow/flexflow_c.h b/include/flexflow/flexflow_c.h
index 76cfd16ee1..a0481ac702 100644
--- a/include/flexflow/flexflow_c.h
+++ b/include/flexflow/flexflow_c.h
@@ -565,9 +565,13 @@ flexflow_perf_metrics_t
 
 void flexflow_model_set_transformer_layer_id(flexflow_model_t handle, int id);
 
-flexflow_generation_result_t flexflow_model_generate(flexflow_model_t handle_,
-                                                     char const *text,
-                                                     int max_seq_length);
+flexflow_generation_result_t
+    flexflow_model_generate(flexflow_model_t handle_,
+                            char const *input_text,
+                            int max_num_chars,
+                            char *output_text,
+                            int max_seq_length,
+                            int *output_length_and_tokens);
 
 void flexflow_model_set_position_offset(flexflow_model_t handle, int offset);
 
diff --git a/python/flexflow/core/flexflow_cffi.py b/python/flexflow/core/flexflow_cffi.py
index 9fa3ab3aad..a1d8e1434e 100644
--- a/python/flexflow/core/flexflow_cffi.py
+++ b/python/flexflow/core/flexflow_cffi.py
@@ -23,6 +23,7 @@
 import numpy as np
 from .flexflow_logger import fflogger
 from flexflow.type import ActiMode, RegularizerMode, AggrMode, PoolType, DataType, LossType, CompMode, MetricsType, InferenceMode, ModelType, OpType, ParameterSyncType, enum_to_int, int_to_enum
+
 _FF_BUILD_DOCS = bool(os.environ.get('READTHEDOCS') or os.environ.get("FF_BUILD_DOCS"))
 if not _FF_BUILD_DOCS:
   from .flexflowlib import ffi, flexflow_library
@@ -2962,9 +2963,18 @@ def get_output_tensor(self, ffmodel, data_type):
     assert ret_val == True
     return np_array   
   
-  def generate(self, text, max_sequence_length):
-    c_text = get_c_name(text)
-    return ffc.flexflow_model_generate(self.handle, c_text, max_sequence_length)
+  def generate(self, prompt, max_sequence_length):
+    c_input_text = get_c_name(prompt)
+    max_num_chars = 36000
+    c_output_text = ffi.new("char[]", max_num_chars)
+    c_output_length_and_tokens = ffi.new("int[]", max_sequence_length + 100)
+    ffc.flexflow_model_generate(self.handle, c_input_text, max_num_chars, c_output_text, max_sequence_length, c_output_length_and_tokens)
+    output_length = c_output_length_and_tokens[0]
+    output_tokens = []
+    for i in range(output_length):
+      output_tokens.append(c_output_length_and_tokens[i+1])
+    from flexflow.serve import GenerationResult
+    return GenerationResult(ffi.string(c_output_text), output_tokens)
   
   def set_position_offset(self, offset):
     ffc.flexflow_model_set_position_offset(self.handle, offset)
diff --git a/python/flexflow/serve/__init__.py b/python/flexflow/serve/__init__.py
index 19a2774a54..e45b9759a0 100644
--- a/python/flexflow/serve/__init__.py
+++ b/python/flexflow/serve/__init__.py
@@ -212,8 +212,8 @@ def init(configs_dict: Optional[dict] = None,
     if fusion:
         sys.argv += ["--fusion"]
 
-    global LLM, SSM, GenerationConfig
-    from .serve import LLM, SSM, GenerationConfig
+    global LLM, SSM, GenerationConfig, GenerationResult
+    from .serve import LLM, SSM, GenerationConfig, GenerationResult
 
 
 def init_cpu():
@@ -225,5 +225,5 @@ def init_cpu():
     # Ask the runtime to avoid using GPU/GPU memory
     os.environ["CPU_ONLY_TEST"] = "1"
 
-    global LLM, SSM, GenerationConfig
-    from .serve import LLM, SSM, GenerationConfig
+    global LLM, SSM, GenerationConfig, GenerationResult
+    from .serve import LLM, SSM, GenerationConfig, GenerationResult
diff --git a/python/flexflow/serve/serve.py b/python/flexflow/serve/serve.py
index 3c26f7ab18..17bb953c9e 100644
--- a/python/flexflow/serve/serve.py
+++ b/python/flexflow/serve/serve.py
@@ -51,6 +51,11 @@ def __init__(
         self.topp = topp
         self.topk = topk
 
+class GenerationResult:
+    """A class to store the output of a generation request."""
+    def __init__(self, text: str = None, tokens: list = None):
+        self.output_text = text
+        self.output_tokens = tokens
 
 class LLM:
     """This class creates a LLM (Large-Language Model) object based on a model from HuggingFace"""
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index 47c5d59f66..35c76b025d 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -1416,13 +1416,24 @@ void flexflow_model_set_transformer_layer_id(flexflow_model_t handle_, int id) {
   handle->set_transformer_layer_id(id);
 }
 
-flexflow_generation_result_t flexflow_model_generate(flexflow_model_t handle_,
-                                                     char const *text,
-                                                     int max_seq_length) {
-  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
-  std::string const text_str(text);
+flexflow_generation_result_t
+    flexflow_model_generate(flexflow_model_t handle_,
+                            char const *input_text,
+                            int max_num_chars,
+                            char *output_text,
+                            int max_seq_length,
+                            int *output_length_and_tokens) {
+  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
+  std::string const text_str(input_text);
   GenerationResult result = handle->generate(text_str, max_seq_length);
   DEBUG_PRINT("[Model] generate %p %s %i", handle, text, max_seq_length);
+  assert(result.output_tokens.size() <= max_seq_length);
+  output_length_and_tokens[0] = result.output_tokens.size();
+  std::copy(result.output_tokens.begin(),
+            result.output_tokens.end(),
+            output_length_and_tokens + 1);
+  std::memcpy(
+      output_text, result.output_text.c_str(), result.output_text.length());
   return FFCObjectWrapper::wrap(&result);
 }
 
diff --git a/src/runtime/request_manager.cu b/src/runtime/request_manager.cu
index 7363e14cf0..58e996629e 100644
--- a/src/runtime/request_manager.cu
+++ b/src/runtime/request_manager.cu
@@ -68,8 +68,8 @@ void RequestManager::load_positions_task(
 
   // BatchConfig const batch_config = *((BatchConfig *)task->args);
   BatchConfig const *batch_config = BatchConfig::from_future(task->futures[0]);
-  
-  const int offset = *((const int*)task->args);
+
+  int const offset = *((int const *)task->args);
   int *pos_ptr = helperGetTensorPointerWO<int>(
       regions[0], task->regions[0], FID_DATA, ctx, runtime);
   Domain domain = runtime->get_index_space_domain(

From 2f6f864037f5a52d42326360ecae9e149a3ee1d1 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 21 Aug 2023 12:08:42 -0400
Subject: [PATCH 209/344] update pr template

---
 .github/PULL_REQUEST_TEMPLATE.md | 3 ---
 1 file changed, 3 deletions(-)

diff --git a/.github/PULL_REQUEST_TEMPLATE.md b/.github/PULL_REQUEST_TEMPLATE.md
index 183028b022..e8177cd9b7 100644
--- a/.github/PULL_REQUEST_TEMPLATE.md
+++ b/.github/PULL_REQUEST_TEMPLATE.md
@@ -10,6 +10,3 @@ Linked Issues:
 Issues closed by this PR:
 - Closes #
 
-**Before merging:**
-
-- [ ] Did you update the [flexflow-third-party](https://github.com/flexflow/flexflow-third-party) repo, if modifying any of the Cmake files, the build configs, or the submodules?

From a5ffc62e44f9da46f3f5400a43c0a7bfa41ed6b6 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 21 Aug 2023 15:55:53 -0400
Subject: [PATCH 210/344] support loading local model (#1004)

---
 python/flexflow/serve/serve.py | 84 +++++++++++++++++++++-------------
 1 file changed, 53 insertions(+), 31 deletions(-)

diff --git a/python/flexflow/serve/serve.py b/python/flexflow/serve/serve.py
index 17bb953c9e..cc4886d1e2 100644
--- a/python/flexflow/serve/serve.py
+++ b/python/flexflow/serve/serve.py
@@ -21,7 +21,7 @@
 from flexflow.core import *
 from transformers import AutoConfig, AutoModelForCausalLM, AutoTokenizer, LlamaTokenizer
 from huggingface_hub import HfApi
-import sys, torch, shutil
+import sys, torch, shutil, hashlib
 from typing import Union, List
 
 
@@ -120,6 +120,23 @@ def download_hf_config(self):
         print(f"Saving {self.model_name} configs to file {self.config_path}...")
         self.hf_config.to_json_file(self.config_path)
 
+    def __get_revision_hashes(self, model_name: str, weights: bool):
+        ff_revision = None
+        ff_revision_file = os.path.join(self.weights_path, "rev_sha.txt") if weights else os.path.join(self.tokenizer_path, "rev_sha.txt")
+        if os.path.exists(ff_revision_file):
+            ff_revision = "".join(open(ff_revision_file).read().split())
+        
+        if os.path.exists(model_name) and os.path.isdir(model_name):
+            # Local model
+            files = os.listdir(model_name)
+            state = files + [os.path.getmtime(os.path.join(model_name, f)) for f in files]
+            latest_revision = hashlib.md5(str(state).encode('utf-8')).hexdigest() 
+        else:
+            # Remote HuggingFace model
+            hf_api = HfApi()
+            latest_revision = hf_api.model_info(self.model_name).sha
+        return ff_revision, ff_revision_file, latest_revision
+    
     def download_hf_weights_if_needed(self):
         """Check in the folder specified by the cache_path whether the LLM's model weights are available and up to date.
         If not, or if the refresh_cache parameter is set to True, download new weights.
@@ -149,25 +166,27 @@ def download_hf_weights_if_needed(self):
         os.makedirs(self.weights_path, exist_ok=True)
         print(f"Creating directory {self.weights_path} (if it doesn't exist)...")
 
-        # Get local revision SHA, check if it matches latest one on huggingface
-        local_revision = None
-        local_revision_file = os.path.join(self.weights_path, "rev_sha.txt")
-        if os.path.exists(local_revision_file):
-            local_revision = "".join(open(local_revision_file).read().split())
-        hf_api = HfApi()
-        latest_revision = hf_api.model_info(self.model_name).sha
+        ff_revision, ff_revision_file, latest_revision = self.__get_revision_hashes(self.model_name, weights=True)
 
         # Download if needed
-        if local_revision != latest_revision:
-            print(
-                f"'{self.model_name}' model weights not found in cache or outdated. Downloading from huggingface.co ..."
-            )
-            hf_model = AutoModelForCausalLM.from_pretrained(
-                self.model_name, trust_remote_code=True
-            )
-            print("Done downloading HF weights. Converting them now...")
+        if ff_revision != latest_revision:
+            if not os.path.exists(self.model_name) or os.path.isdir(self.model_name):
+                # Local model
+                print(
+                    f"'{self.model_name}' model weights not found in cache or outdated. Downloading from huggingface.co ..."
+                )
+            else:
+                # Remote model
+                print(f"'{self.model_name}' local model weights were updated! Converting new weights now...")
+            # Download model from HuggingFace, or load it from the local folder
+            hf_model = AutoModelForCausalLM.from_pretrained(self.model_name, trust_remote_code=True)
+            # Print log message to notify user download of model has finished
+            if not os.path.exists(self.model_name) or os.path.isdir(self.model_name):
+                print("Done downloading HF weights. Converting them now...")
+            # Convert the model to FlexFlow format
             self.model_class.convert_hf_model(hf_model, self.weights_path)
-            with open(local_revision_file, "w+") as f:
+            # Save new revision hash to file
+            with open(ff_revision_file, "w+") as f:
                 f.write(latest_revision)
             print("Done converting the weights...")
         else:
@@ -196,29 +215,32 @@ def download_hf_tokenizer_if_needed(self):
         os.makedirs(self.tokenizer_path, exist_ok=True)
 
         # Get local revision SHA, check if it matches latest one on huggingface
-        local_revision = None
-        local_revision_file = os.path.join(self.tokenizer_path, "rev_sha.txt")
-        if os.path.exists(local_revision_file):
-            local_revision = "".join(open(local_revision_file).read().split())
-        hf_api = HfApi()
-        latest_revision = hf_api.model_info(self.model_name).sha
+        ff_revision, ff_revision_file, latest_revision = self.__get_revision_hashes(self.model_name, weights=False)
 
-        # Download if needed
-        if local_revision != latest_revision:
-            print(
-                f"'{self.model_name}' tokenizer not found in cache or outdated. Downloading from huggingface.co ..."
-            )
+        if ff_revision != latest_revision:
+            if not os.path.exists(self.model_name) or os.path.isdir(self.model_name):
+                # Local model
+                print(f"'{self.model_name}' tokenizer not found in cache or outdated. Downloading from huggingface.co ...")
+            else:
+                # Remote model
+                print(f"'{self.model_name}' local tokenizer was updated! Saving new tokenizer now...")
+            # Download tokenizer from HuggingFace, or load it from the local folder
             if self.model_type == ModelType.LLAMA:
                 hf_tokenizer = LlamaTokenizer.from_pretrained(
                     self.model_name, use_fast=True
                 )
             else:
                 hf_tokenizer = AutoTokenizer.from_pretrained(self.model_name)
+            # Print log message to notify user download of tokenizer has finished
+            if not os.path.exists(self.model_name) or os.path.isdir(self.model_name):
+                print("Done downloading tokenizer. Saving it now...")
+            # Save tokenizer
             hf_tokenizer.save_pretrained(self.tokenizer_path)
-            print("Done downloading HF tokenizer.")
-            with open(local_revision_file, "w+") as f:
+            print("Done saving HF tokenizer.")
+            # Save new revision hash to file
+            with open(ff_revision_file, "w+") as f:
                 f.write(latest_revision)
-            print("Loading the tokenizer...")
+            
         else:
             print(f"Loading '{self.model_name}' tokenizer from the cache...")
 

From cf13ee7dcdeff3ea10ee0e0cb8b333e5c7a09661 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 22 Aug 2023 21:37:22 -0400
Subject: [PATCH 211/344] Add multinode tutorial to readthedocs (#1019)

* add multinode tutorial to readtheocs

* add missing file

* add missing extension

* fix
---
 MULTI-NODE.md             | 2 +-
 docs/source/index.rst     | 1 +
 docs/source/multinode.rst | 8 ++++++++
 3 files changed, 10 insertions(+), 1 deletion(-)
 create mode 100644 docs/source/multinode.rst

diff --git a/MULTI-NODE.md b/MULTI-NODE.md
index a8fd2fb705..4bae47cfa6 100644
--- a/MULTI-NODE.md
+++ b/MULTI-NODE.md
@@ -68,4 +68,4 @@ ssh-ed25519 AAAAC3NzaC1lZDI1NTE5AAAAIOy5NKYdE8Cwgid59rx6xMqyj9vLaWuXIwy/BSRiK4su
 
 Follow step 6 in [INSTALL.md](INSTALL.md) to set environment variables.
 
-A script to run a Python example on multiple nodes is available at `scripts/mnist_mlp_run.sh`. You can run the script using [`mpirun`](https://www.open-mpi.org/doc/current/man1/mpirun.1.php) (if you configured it in step 3) or [`srun`](https://slurm.schedmd.com/srun.html).
\ No newline at end of file
+A script to run a Python example on multiple nodes is available at `scripts/mnist_mlp_run.sh`. You can run the script using [`mpirun`](https://www.open-mpi.org/doc/current/man1/mpirun.1.php) (if you configured it in step 3) or [`srun`](https://slurm.schedmd.com/srun.html).
diff --git a/docs/source/index.rst b/docs/source/index.rst
index 2b369ac8e6..a7ea2ff3ac 100644
--- a/docs/source/index.rst
+++ b/docs/source/index.rst
@@ -12,6 +12,7 @@ Welcome to FlexFlow's documentation!
    welcome
    installation
    docker
+   multinode
 
 .. toctree::
    :caption: FlexFlow Serve
diff --git a/docs/source/multinode.rst b/docs/source/multinode.rst
new file mode 100644
index 0000000000..8827200582
--- /dev/null
+++ b/docs/source/multinode.rst
@@ -0,0 +1,8 @@
+:tocdepth: 1
+******************
+Multinode tutorial
+******************
+
+
+.. mdinclude:: ../../MULTI-NODE.md
+   :start-line: 3

From 9d0bc56a7b53ee89cec9de3921b8e6da23d92b20 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Fri, 25 Aug 2023 16:58:42 -0500
Subject: [PATCH 212/344] Allow FlexFlow Serve to stop when EOS token is
 generated (#1026)

* enable early stop

* fix EOS token id
---
 include/flexflow/request_manager.h | 18 +++++++++++--
 src/runtime/request_manager.cc     | 41 ++++++++++++++++++++----------
 2 files changed, 44 insertions(+), 15 deletions(-)

diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index d6c30c6b78..1eb5643483 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -51,9 +51,15 @@ class InferenceManager {
 };
 
 struct Request {
+  enum Status {
+    PENDING = 101,
+    RUNNING = 102,
+    COMPLETED = 103,
+  };
   BatchConfig::RequestGuid guid;
   int max_sequence_length;
   int initial_len;
+  Status status = PENDING;
   std::vector<BatchConfig::TokenId> tokens;
 
   std::vector<struct BeamTree> beam_trees;
@@ -206,8 +212,16 @@ class RequestManager {
   InferenceResultFuture last_irf;
   TreeVerifyBatchConfigFuture last_tree_bcf;
   InferenceResultFuture last_tree_irf;
-  const std::map<ModelType, int> model_bos_map = {
-      {ModelType::LLAMA, 0}, {ModelType::OPT, 2}, {ModelType::LLAMA2, 1}};
+  const std::map<ModelType, int> model_bos_map = {{ModelType::LLAMA, 0},
+                                                  {ModelType::OPT, 2},
+                                                  {ModelType::LLAMA2, 1},
+                                                  {ModelType::FALCON, 11},
+                                                  {ModelType::STARCODER, 0}};
+  const std::map<ModelType, int> model_eos_map = {{ModelType::LLAMA, 1},
+                                                  {ModelType::OPT, 2},
+                                                  {ModelType::LLAMA2, 2},
+                                                  {ModelType::FALCON, 11},
+                                                  {ModelType::STARCODER, 0}};
 
   // TODO: Move this two vector to request struct
   std::unordered_map<RequestGuid,
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 348272a69b..5b4eae13cc 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -135,6 +135,7 @@ RequestManager::RequestGuid
 
   // Add a new request
   Request request;
+  request.status = Request::PENDING;
   request.guid = next_available_guid++;
   request.max_sequence_length = max_sequence_length;
 
@@ -194,6 +195,7 @@ RequestManager::RequestGuid
   const std::lock_guard<std::mutex> lock(request_queue_mutex);
   // Add a new request
   Request request;
+  request.status = Request::PENDING;
   request.guid = next_available_guid++;
   request.max_sequence_length = max_sequence_length;
   if (this->model_bos_map.find(this->model_type) != this->model_bos_map.end()) {
@@ -253,7 +255,8 @@ bool RequestManager::is_request_completed(RequestGuid const &guid) {
   const std::lock_guard<std::mutex> lock(request_queue_mutex);
   assert(all_requests.find(guid) != all_requests.end());
   Request const &request = all_requests[guid];
-  return request.tokens.size() >= request.max_sequence_length;
+  // return request.tokens.size() >= request.max_sequence_length;
+  return request.status == Request::COMPLETED;
 }
 
 GenerationResult
@@ -326,9 +329,23 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
     int processed_tokens = old_bc.requestsInfo[i].token_start_offset +
                            old_bc.requestsInfo[i].num_tokens_in_batch;
     assert(processed_tokens < request.tokens.size());
-    if (request.tokens.size() >= old_bc.requestsInfo[i].max_sequence_length
-        // || ir.results[t] == 0 TODO: replace this with <EOS>
-    ) {
+    bool request_completed = false;
+    printf("model_type = %d\n", this->model_type);
+    if (request.tokens.size() >= old_bc.requestsInfo[i].max_sequence_length) {
+      request_completed = true;
+    } else if (this->model_eos_map.find(this->model_type) !=
+               this->model_eos_map.end()) {
+      TokenId eos_token_id = this->model_eos_map.at(this->model_type);
+      printf("request_tokens.back() == %d eos_token_id = %d\n",
+             request.tokens.back(),
+             eos_token_id);
+      // Encounter EOS token id
+      if (request.tokens.back() == eos_token_id) {
+        request_completed = true;
+      }
+    }
+    if (request_completed) {
+      request.status = Request::COMPLETED;
       log_req_mgr.print("[Done] guid(%zu) final_length(%zu)",
                         old_bc.requestsInfo[i].request_guid,
                         request.tokens.size());
@@ -352,13 +369,12 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
           profile_info.finish_time - profile_info.start_time;
       profiling_requests[request.guid] = profile_info;
       log_req_mgr.print("[Profile] guid(%zu) decoding_steps(%d) start(%.1lf) "
-                        "finish(%.1lf) latency(%.1lf) acc_latency(%.1lf)",
+                        "finish(%.1lf) latency(%.1lf)",
                         request.guid,
                         profile_info.decoding_steps,
                         profile_info.start_time,
                         profile_info.finish_time,
-                        profile_info.finish_time - profile_info.start_time,
-                        total_request_run_time);
+                        profile_info.finish_time - profile_info.start_time);
       // Write output to file if needed:
       if (!output_filepath.empty()) {
         std::ofstream outputFile(output_filepath);
@@ -715,7 +731,7 @@ BeamSearchBatchConfig
           request.tokens.push_back(verified_tokens[j].first);
         }
       }
-
+      request.status = Request::COMPLETED;
       log_req_mgr.print("[Done] guid(%zu) with final length(%zu)",
                         request.guid,
                         request.tokens.size());
@@ -736,13 +752,12 @@ BeamSearchBatchConfig
           profile_info.finish_time - profile_info.start_time;
       profiling_requests[request.guid] = profile_info;
       log_req_mgr.print("[Profile] guid(%zu) decoding_steps(%d) start(%.1lf) "
-                        "finish(%.1lf) latency(%.1lf) acc_latency(%.1lf)",
+                        "finish(%.1lf) latency(%.1lf)",
                         request.guid,
                         profile_info.decoding_steps,
                         profile_info.start_time,
                         profile_info.finish_time,
-                        profile_info.finish_time - profile_info.start_time,
-                        total_request_run_time);
+                        profile_info.finish_time - profile_info.start_time);
 
       // Write output to file if needed:
       if (!output_filepath.empty()) {
@@ -1639,7 +1654,7 @@ GenerationResult RequestManager::generate_incr_decoding(FFModel *llm,
     runtime->end_trace(ctx, 12346 /*trace_id*/);
   }
   GenerationResult gr = get_generation_result(guid);
-  assert(gr.output_tokens.size() >= max_seq_length);
+  // assert(gr.output_tokens.size() >= max_seq_length);
   return gr;
 }
 
@@ -1714,7 +1729,7 @@ GenerationResult RequestManager::generate_spec_infer(FFModel *llm,
   }
 
   GenerationResult gr = get_generation_result(guid);
-  assert(gr.output_tokens.size() >= max_seq_length);
+  // assert(gr.output_tokens.size() >= max_seq_length);
   return gr;
 }
 

From dfbe55494801a6ed6ef426b6ecd2e8d7b64b6e17 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 27 Aug 2023 02:21:05 -0400
Subject: [PATCH 213/344]  Build docker images in more cuda versions (#1030)

---
 .github/workflows/docker-build.yml         | 6 +++++-
 .github/workflows/helpers/install_cudnn.sh | 3 +++
 docker/build.sh                            | 8 +++++---
 docker/publish.sh                          | 4 ++--
 docker/pull.sh                             | 4 ++--
 docker/run.sh                              | 4 ++--
 6 files changed, 19 insertions(+), 10 deletions(-)

diff --git a/.github/workflows/docker-build.yml b/.github/workflows/docker-build.yml
index 748d3365da..304b63d65c 100644
--- a/.github/workflows/docker-build.yml
+++ b/.github/workflows/docker-build.yml
@@ -26,7 +26,7 @@ jobs:
     strategy:
       matrix:
         gpu_backend: ["cuda", "hip_rocm"]
-        cuda_version: ["11.1", "11.2", "11.3", "11.5", "11.6", "11.7", "11.8"]
+        cuda_version: ["11.1", "11.2", "11.3", "11.4", "11.5", "11.6", "11.7", "11.8", "12.0"]
         # The CUDA version doesn't matter when building for hip_rocm, so we just pick one arbitrarily (11.8) to avoid building for hip_rocm once per number of CUDA version supported
         exclude:
           - gpu_backend: "hip_rocm"
@@ -35,12 +35,16 @@ jobs:
             cuda_version: "11.2"
           - gpu_backend: "hip_rocm"
             cuda_version: "11.3"
+          - gpu_backend: "hip_rocm"
+            cuda_version: "11.4"
           - gpu_backend: "hip_rocm"
             cuda_version: "11.5"
           - gpu_backend: "hip_rocm"
             cuda_version: "11.6"
           - gpu_backend: "hip_rocm"
             cuda_version: "11.7"
+          - gpu_backend: "hip_rocm"
+            cuda_version: "12.0"
       fail-fast: false
     env:
       FF_GPU_BACKEND: ${{ matrix.gpu_backend }}
diff --git a/.github/workflows/helpers/install_cudnn.sh b/.github/workflows/helpers/install_cudnn.sh
index 318134e331..75e59109eb 100755
--- a/.github/workflows/helpers/install_cudnn.sh
+++ b/.github/workflows/helpers/install_cudnn.sh
@@ -44,6 +44,9 @@ elif [[ "$cuda_version" == "11.7" ]]; then
 elif [[ "$cuda_version" == "11.8" ]]; then
     CUDNN_LINK=https://developer.download.nvidia.com/compute/redist/cudnn/v8.7.0/local_installers/11.8/cudnn-linux-x86_64-8.7.0.84_cuda11-archive.tar.xz
     CUDNN_TARBALL_NAME=cudnn-linux-x86_64-8.7.0.84_cuda11-archive.tar.xz
+elif [[ "$cuda_version" == "11.8" ]]; then
+    echo "CUDNN support for CUDA version 12.0 not yet added"
+    exit 1
 fi
 wget -c -q $CUDNN_LINK
 if [[ "$cuda_version" == "11.6" || "$cuda_version" == "11.7" || "$cuda_version" == "11.8" ]]; then
diff --git a/docker/build.sh b/docker/build.sh
index 6ed5cbe00e..f0f2610b04 100755
--- a/docker/build.sh
+++ b/docker/build.sh
@@ -36,14 +36,16 @@ if [[ "${FF_GPU_BACKEND}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; the
     cuda_version=${cuda_version:1:4}
   fi
   # Check that CUDA version is supported, and modify cuda version to include default subsubversion
-  if [[ "$cuda_version" == @(11.1|11.3|11.7) ]]; then
+  if [[ "$cuda_version" == @(11.1|11.3|11.7|12.0|12.1) ]]; then
     cuda_version_input=${cuda_version}.1
   elif [[ "$cuda_version" == @(11.2|11.5|11.6) ]]; then 
     cuda_version_input=${cuda_version}.2
-  elif [[ "$cuda_version" == @(11.8) ]]; then 
+  elif [[ "$cuda_version" == @(11.4) ]]; then 
+    cuda_version_input=${cuda_version}.3
+  elif [[ "$cuda_version" == @(11.8|12.2) ]]; then 
     cuda_version_input=${cuda_version}.0
   else
-    echo "cuda_version is not supported, please choose among {11.1|11.2|11.3|11.5|11.6|11.7|11.8}"
+    echo "cuda_version is not supported, please choose among {11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0|12.1|12.2}"
     exit 1
   fi
   # Set cuda version suffix to docker image name
diff --git a/docker/publish.sh b/docker/publish.sh
index b8668d3c0e..8073abdd72 100755
--- a/docker/publish.sh
+++ b/docker/publish.sh
@@ -36,8 +36,8 @@ if [[ "${FF_GPU_BACKEND}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; the
     cuda_version=${cuda_version:1:4}
   fi
   # Check that CUDA version is supported
-  if [[ "$cuda_version" != @(11.1|11.3|11.7|11.2|11.5|11.6|11.8) ]]; then
-    echo "cuda_version is not supported, please choose among {11.1|11.2|11.3|11.5|11.6|11.7|11.8}"
+  if [[ "$cuda_version" != @(11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0|12.1|12.2) ]]; then
+    echo "cuda_version is not supported, please choose among {11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0|12.1|12.2}"
     exit 1
   fi
   # Set cuda version suffix to docker image name
diff --git a/docker/pull.sh b/docker/pull.sh
index f8624a1072..fb56a26902 100755
--- a/docker/pull.sh
+++ b/docker/pull.sh
@@ -36,8 +36,8 @@ if [[ "${FF_GPU_BACKEND}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; the
     cuda_version=${cuda_version:1:4}
   fi
   # Check that CUDA version is supported
-  if [[ "$cuda_version" != @(11.1|11.3|11.7|11.2|11.5|11.6|11.8) ]]; then
-    echo "cuda_version is not supported, please choose among {11.1|11.2|11.3|11.5|11.6|11.7|11.8}"
+  if [[ "$cuda_version" != @(11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0|12.1|12.2) ]]; then
+    echo "cuda_version is not supported, please choose among {11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0|12.1|12.2}"
     exit 1
   fi
   # Set cuda version suffix to docker image name
diff --git a/docker/run.sh b/docker/run.sh
index f326db0a6c..2ebc19d834 100755
--- a/docker/run.sh
+++ b/docker/run.sh
@@ -49,8 +49,8 @@ if [[ "${FF_GPU_BACKEND}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; the
     cuda_version=${cuda_version:1:4}
   fi
   # Check that CUDA version is supported
-  if [[ "$cuda_version" != @(11.1|11.3|11.7|11.2|11.5|11.6|11.8) ]]; then
-    echo "cuda_version is not supported, please choose among {11.1|11.2|11.3|11.5|11.6|11.7|11.8}"
+  if [[ "$cuda_version" != @(11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0|12.1|12.2) ]]; then
+    echo "cuda_version is not supported, please choose among {11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0|12.1|12.2}"
     exit 1
   fi
   # Set cuda version suffix to docker image name

From 00be68d19fb8410aca13f5656dc074c8c2943489 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 28 Aug 2023 03:59:00 -0400
Subject: [PATCH 214/344] Automatic bos/eos token determination, plus docker
 fix (#1031)

* automatic bos/eos token determination, plus docker fix

* fix
---
 .github/workflows/gpu-ci.yml             |  2 ++
 docker/build.sh                          |  5 ++++
 docker/pull.sh                           |  4 ++++
 docker/run.sh                            |  4 ++++
 include/flexflow/flexflow_c.h            |  2 ++
 include/flexflow/request_manager.h       | 23 ++++++-------------
 inference/incr_decoding/incr_decoding.cc |  5 +++-
 inference/spec_infer/spec_infer.cc       | 11 +++++++++
 python/flexflow/core/flexflow_cffi.py    |  4 ++--
 python/flexflow/serve/serve.py           |  4 ++--
 src/c/flexflow_c.cc                      |  5 +++-
 src/runtime/request_manager.cc           | 29 ++++++++----------------
 12 files changed, 57 insertions(+), 41 deletions(-)

diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index f732513e0d..d604a7cea9 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -174,6 +174,8 @@ jobs:
           make -j
 
       - name: Run inference tests
+        env:
+          CPP_INFERENCE_TESTS: ${{ vars.CPP_INFERENCE_TESTS }}
         run: |
           export PATH=$CONDA_PREFIX/bin:$PATH
           export FF_HOME=$(pwd)
diff --git a/docker/build.sh b/docker/build.sh
index f0f2610b04..e4f06a0ec1 100755
--- a/docker/build.sh
+++ b/docker/build.sh
@@ -48,6 +48,11 @@ if [[ "${FF_GPU_BACKEND}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; the
     echo "cuda_version is not supported, please choose among {11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0|12.1|12.2}"
     exit 1
   fi
+  # Use CUDA 12.0 for all versions greater or equal to 12.0 for now
+  if [[ "$cuda_version" == @(12.1|12.2|12.3|12.4|12.5|12.6|12.7|12.8|12.9) ]]; then
+    cuda_version=12.0
+    cuda_version_input=${cuda_version}.1
+  fi
   # Set cuda version suffix to docker image name
   echo "Building $image docker image with CUDA $cuda_version"
   cuda_version="-${cuda_version}"
diff --git a/docker/pull.sh b/docker/pull.sh
index fb56a26902..989fc89ccb 100755
--- a/docker/pull.sh
+++ b/docker/pull.sh
@@ -40,6 +40,10 @@ if [[ "${FF_GPU_BACKEND}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; the
     echo "cuda_version is not supported, please choose among {11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0|12.1|12.2}"
     exit 1
   fi
+  # Use CUDA 12.0 for all versions greater or equal to 12.0 for now
+  if [[ "$cuda_version" == @(12.1|12.2|12.3|12.4|12.5|12.6|12.7|12.8|12.9) ]]; then
+    cuda_version=12.0
+  fi
   # Set cuda version suffix to docker image name
   echo "Downloading $image docker image with CUDA $cuda_version"
   cuda_version="-${cuda_version}"
diff --git a/docker/run.sh b/docker/run.sh
index 2ebc19d834..bb948d6b78 100755
--- a/docker/run.sh
+++ b/docker/run.sh
@@ -53,6 +53,10 @@ if [[ "${FF_GPU_BACKEND}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; the
     echo "cuda_version is not supported, please choose among {11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0|12.1|12.2}"
     exit 1
   fi
+  # Use CUDA 12.0 for all versions greater or equal to 12.0 for now
+  if [[ "$cuda_version" == @(12.1|12.2|12.3|12.4|12.5|12.6|12.7|12.8|12.9) ]]; then
+    cuda_version=12.0
+  fi
   # Set cuda version suffix to docker image name
   echo "Running $image docker image with CUDA $cuda_version"
   cuda_version_hyphen="-${cuda_version}"
diff --git a/include/flexflow/flexflow_c.h b/include/flexflow/flexflow_c.h
index a0481ac702..003533bb80 100644
--- a/include/flexflow/flexflow_c.h
+++ b/include/flexflow/flexflow_c.h
@@ -923,6 +923,8 @@ flexflow_request_manager_t flexflow_request_manager_get_request_manager(void);
 void flexflow_request_manager_register_tokenizer(
     flexflow_request_manager_t handle_,
     enum ModelType model_type,
+    int bos_token_id,
+    int eos_token_id,
     char const *tokenizer_filepath);
 
 void flexflow_request_manager_register_output_filepath(
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index 1eb5643483..e444402dd0 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -86,21 +86,20 @@ class RequestManager {
 public:
   using RequestGuid = BatchConfig::RequestGuid;
   using TokenId = BatchConfig::TokenId;
-  // RequestManager(ModelType model_type,
-  //                std::string const &path,
-  //                bool verbose = false,
-  //                std::string output_filepath = "");
+
   RequestManager();
   static RequestManager *get_request_manager();
   size_t get_num_processed_requests();
   size_t get_num_ssms();
 
   int register_ssm_model(FFModel *model);
-  void register_tokenizer(ModelType model_type, std::string const &path);
+  void register_tokenizer(ModelType model_type,
+                          int bos_token_id,
+                          int eos_token_id,
+                          std::string const &path);
   void register_output_filepath(std::string const &);
 
   FFModel *get_model(int model_id);
-  static void serve(FFModel *model);
 
   GenerationResult generate_incr_decoding(FFModel *model,
                                           std::string const &text,
@@ -201,6 +200,8 @@ class RequestManager {
   std::unique_ptr<Tokenizer> tokenizer_;
   bool verbose;
   ModelType model_type;
+  int bos_token_id;
+  int eos_token_id;
   std::string output_filepath;
   std::queue<Request> pending_request_queue;
   std::unordered_map<RequestGuid, Request> all_requests;
@@ -212,16 +213,6 @@ class RequestManager {
   InferenceResultFuture last_irf;
   TreeVerifyBatchConfigFuture last_tree_bcf;
   InferenceResultFuture last_tree_irf;
-  const std::map<ModelType, int> model_bos_map = {{ModelType::LLAMA, 0},
-                                                  {ModelType::OPT, 2},
-                                                  {ModelType::LLAMA2, 1},
-                                                  {ModelType::FALCON, 11},
-                                                  {ModelType::STARCODER, 0}};
-  const std::map<ModelType, int> model_eos_map = {{ModelType::LLAMA, 1},
-                                                  {ModelType::OPT, 2},
-                                                  {ModelType::LLAMA2, 2},
-                                                  {ModelType::FALCON, 11},
-                                                  {ModelType::STARCODER, 0}};
 
   // TODO: Move this two vector to request struct
   std::unordered_map<RequestGuid,
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index e60e6a5283..10b4744195 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -176,13 +176,16 @@ void FlexFlow::top_level_task(Task const *task,
       break;
     }
   }
+  int bos_token_id = model_config["bos_token_id"];
+  int eos_token_id = model_config["eos_token_id"];
 
   assert(model_type != ModelType::UNKNOWN &&
          "Invalid LLM model type passed (or no type was passed).");
 
   GenerationConfig generationConfig(do_sample, temperature, topp);
   RequestManager *rm = RequestManager::get_request_manager();
-  rm->register_tokenizer(model_type, tokenizer_filepath);
+  rm->register_tokenizer(
+      model_type, bos_token_id, eos_token_id, tokenizer_filepath);
   rm->register_output_filepath(file_paths.output_file_path);
 
   FFModel model(ffconfig, ffconfig.cpu_offload);
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 975b66c82e..16eab8d077 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -45,6 +45,8 @@ struct ModelMeta {
   std::string llm_weights_path;
   std::string llm_model_config_path;
 
+  int bos_token_id, eos_token_id;
+
   std::vector<ModelType> ssm_model_types;
   std::vector<std::string> ssm_model_config_paths;
   std::vector<std::string> ssm_model_weights_paths;
@@ -165,6 +167,8 @@ void get_model_meta(FilePaths &file_paths,
       break;
     }
   }
+  model_metadata.bos_token_id = llm_model_config["bos_token_id"];
+  model_metadata.eos_token_id = llm_model_config["eos_token_id"];
 
   for (auto ssm_model_name : model_metadata.model_names.ssm_model_names) {
     std::string ssm_config_path = join_path({file_paths.cache_folder_path,
@@ -211,6 +215,11 @@ void get_model_meta(FilePaths &file_paths,
         break;
       }
     }
+    if (ssm_model_config["bos_token_id"] != model_metadata.bos_token_id ||
+        ssm_model_config["eos_token_id"] != model_metadata.eos_token_id) {
+      printf("Warning: bos/eos token id mismatch between LLM and one of the "
+             "SSMs!\n");
+    }
     model_metadata.ssm_model_types.push_back(ssm_model_type);
     model_metadata.ssm_model_config_paths.push_back(ssm_config_path);
     model_metadata.ssm_model_weights_paths.push_back(ssm_weights_path);
@@ -257,6 +266,8 @@ void FlexFlow::top_level_task(Task const *task,
   InferenceManager *im = InferenceManager::get_inference_manager();
   RequestManager *rm = RequestManager::get_request_manager();
   rm->register_tokenizer(model_metadata.llm_model_type,
+                         model_metadata.bos_token_id,
+                         model_metadata.eos_token_id,
                          model_metadata.llm_tokenizer_path);
   rm->register_output_filepath(file_paths.output_file_path);
 
diff --git a/python/flexflow/core/flexflow_cffi.py b/python/flexflow/core/flexflow_cffi.py
index a1d8e1434e..1508371ae7 100644
--- a/python/flexflow/core/flexflow_cffi.py
+++ b/python/flexflow/core/flexflow_cffi.py
@@ -3231,10 +3231,10 @@ def __init__(self):
     self.handle = ffc.flexflow_request_manager_get_request_manager()
     #self._handle = ffi.gc(self.handle, ffc.flexflow_request_manager_destroy)
 
-  def register_tokenizer(self, model_type, tokenizer_filepath):
+  def register_tokenizer(self, model_type, bos_token_id, eos_token_id, tokenizer_filepath):
     c_model_type = enum_to_int(ModelType, model_type)
     c_tokenizer_filepath = get_c_name(tokenizer_filepath)
-    return ffc.flexflow_request_manager_register_tokenizer(self.handle, c_model_type, c_tokenizer_filepath)
+    return ffc.flexflow_request_manager_register_tokenizer(self.handle, c_model_type, bos_token_id, eos_token_id, c_tokenizer_filepath)
   
   def register_output_filepath(self, output_filepath):
     c_output_filepath = get_c_name(output_filepath)
diff --git a/python/flexflow/serve/serve.py b/python/flexflow/serve/serve.py
index cc4886d1e2..dea21389d1 100644
--- a/python/flexflow/serve/serve.py
+++ b/python/flexflow/serve/serve.py
@@ -212,7 +212,7 @@ def download_hf_tokenizer_if_needed(self):
                 shutil.rmtree(self.tokenizer_path)
         if not os.path.exists(self.tokenizer_path):
             print(f"Creating directory {self.tokenizer_path} (if it doesn't exist)...")
-        os.makedirs(self.tokenizer_path, exist_ok=True)
+            os.makedirs(self.tokenizer_path, exist_ok=True)
 
         # Get local revision SHA, check if it matches latest one on huggingface
         ff_revision, ff_revision_file, latest_revision = self.__get_revision_hashes(self.model_name, weights=False)
@@ -358,7 +358,7 @@ def compile(
 
         # Create request manager
         self.rm = RequestManager()
-        self.rm.register_tokenizer(self.model_type, self.tokenizer_path)
+        self.rm.register_tokenizer(self.model_type, self.hf_config.bos_token_id, self.hf_config.eos_token_id, self.tokenizer_path)
         self.rm.register_output_filepath(self.output_file)
 
         self.im.init_operators_inference(self.model.ffmodel)
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index 35c76b025d..96ff84c85f 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -2388,12 +2388,15 @@ flexflow_request_manager_t flexflow_request_manager_get_request_manager(void) {
 void flexflow_request_manager_register_tokenizer(
     flexflow_request_manager_t handle_,
     enum ModelType model_type,
+    int bos_token_id,
+    int eos_token_id,
     char const *tokenizer_filepath) {
   RequestManager *handle = FFCObjectWrapper::unwrap(handle_);
   assert(tokenizer_filepath != nullptr &&
          "Cannot convert nullptr char * to std::string");
   std::string const tokenizer_filepath_str(tokenizer_filepath);
-  handle->register_tokenizer(model_type, tokenizer_filepath_str);
+  handle->register_tokenizer(
+      model_type, bos_token_id, eos_token_id, tokenizer_filepath_str);
   DEBUG_PRINT(
       "[RequestManager] register tokenizer %p %s", handle, tokenizer_filepath);
 }
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 5b4eae13cc..d75b0fbe0b 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -66,9 +66,12 @@ RequestManager::RequestManager()
 }
 
 void RequestManager::register_tokenizer(ModelType type,
+                                        int bos_token_id,
+                                        int eos_token_id,
                                         std::string const &path) {
-  // bos id
   this->model_type = type;
+  this->bos_token_id = bos_token_id;
+  this->eos_token_id = eos_token_id;
   std::string tokenizer_folder =
       (!path.empty() && path.back() != '/') ? path + '/' : path;
   if (model_type == ModelType::LLAMA || model_type == ModelType::LLAMA2) {
@@ -157,7 +160,7 @@ RequestManager::RequestGuid
   }
 
   if (get_num_ssms() == 0) {
-    std::cout << "No small speculative model registered yet, using incremental "
+    std::cout << "No small speculative model registered, using incremental "
                  "decoding."
               << std::endl;
   } else {
@@ -198,9 +201,7 @@ RequestManager::RequestGuid
   request.status = Request::PENDING;
   request.guid = next_available_guid++;
   request.max_sequence_length = max_sequence_length;
-  if (this->model_bos_map.find(this->model_type) != this->model_bos_map.end()) {
-    request.tokens.push_back(this->model_bos_map.at(this->model_type));
-  }
+  request.tokens.push_back(bos_token_id);
 
   std::vector<int32_t> tokens = this->tokenizer_->Encode(prompt);
   if (tokens.size() > BatchConfig::MAX_PROMPT_LENGTH) {
@@ -220,7 +221,7 @@ RequestManager::RequestGuid
   request.initial_len = request.tokens.size();
 
   if (get_num_ssms() == 0) {
-    std::cout << "No small speculative model registered yet, using incremental "
+    std::cout << "No small speculative model registered, using incremental "
                  "decoding."
               << std::endl;
   } else {
@@ -330,19 +331,12 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
                            old_bc.requestsInfo[i].num_tokens_in_batch;
     assert(processed_tokens < request.tokens.size());
     bool request_completed = false;
-    printf("model_type = %d\n", this->model_type);
+    // printf("model_type = %d\n", this->model_type);
     if (request.tokens.size() >= old_bc.requestsInfo[i].max_sequence_length) {
       request_completed = true;
-    } else if (this->model_eos_map.find(this->model_type) !=
-               this->model_eos_map.end()) {
-      TokenId eos_token_id = this->model_eos_map.at(this->model_type);
-      printf("request_tokens.back() == %d eos_token_id = %d\n",
-             request.tokens.back(),
-             eos_token_id);
+    } else if (request.tokens.back() == eos_token_id) {
       // Encounter EOS token id
-      if (request.tokens.back() == eos_token_id) {
-        request_completed = true;
-      }
+      request_completed = true;
     }
     if (request_completed) {
       request.status = Request::COMPLETED;
@@ -351,9 +345,6 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
                         request.tokens.size());
       std::string output = this->tokenizer_->Decode(request.tokens);
 
-      // for (int i = 0; i < request.tokens.size(); i++) {
-      //   std::cout << request.tokens.at(i) << "\n";
-      // }
       {
         // update generation result and trigger future
         GenerationResult &gr = request_generation_results[request.guid];

From 5bf476c062e4808d2138889cee1b66ec6d75a338 Mon Sep 17 00:00:00 2001
From: raphaelauv <raphaelauv@users.noreply.github.com>
Date: Mon, 28 Aug 2023 16:02:32 +0200
Subject: [PATCH 215/344] clean: duplicate in requirements.txt (#1034)

---
 requirements.txt | 2 --
 1 file changed, 2 deletions(-)

diff --git a/requirements.txt b/requirements.txt
index c6337dccfa..1037661337 100644
--- a/requirements.txt
+++ b/requirements.txt
@@ -7,9 +7,7 @@ pybind11
 cmake-build-extension
 ninja
 requests
-qualname
 regex
-requests
 torch>=1.13.1
 torchaudio>=0.13.1
 torchvision>=0.14.1

From e6763fa2aadcbb7ac98d800cf367b64498d93557 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 30 Aug 2023 22:47:24 -0400
Subject: [PATCH 216/344] Build Docker images for AMD gpus (#1041)

* enable building docker images for different hip versions

* ignore shellcheck error code

* support hip compilation in inference cmake files

* fix

* fix

* cmake fix

* cmake fixes

* cmake fixes

* nested if condition fix

* update docker workflow and config scripts

* update scripts

* fix

* fix

* cleanup

* rocm 5.6 by default in workflow

* update workflow

* fix

* fix

* fix

* fix permissions

* fix workflow

* fix

* fix
---
 .github/workflows/build.yml                   |  53 ++++----
 .github/workflows/docker-build.yml            |  60 ++++++----
 .../workflows/helpers/install_dependencies.sh |  38 ++++--
 .github/workflows/pip-install.yml             |   2 +
 CMakeLists.txt                                |  24 +++-
 cmake/hip.cmake                               |  11 ++
 cmake/legion.cmake                            |   3 +
 config/config.inc                             |   7 +-
 config/config.linux                           |   5 +-
 docker/build.sh                               | 113 ++++++++++++------
 docker/flexflow-environment/Dockerfile        |  33 ++++-
 docker/flexflow/Dockerfile                    |   4 +-
 docker/publish.sh                             |  47 ++++++--
 docker/pull.sh                                |  47 ++++++--
 docker/run.sh                                 |  71 ++++++++---
 inference/incr_decoding/CMakeLists.txt        |  17 ++-
 inference/spec_infer/CMakeLists.txt           |  17 ++-
 17 files changed, 412 insertions(+), 140 deletions(-)
 create mode 100644 cmake/hip.cmake

diff --git a/.github/workflows/build.yml b/.github/workflows/build.yml
index 1a9ad7186c..1c6eff4a12 100644
--- a/.github/workflows/build.yml
+++ b/.github/workflows/build.yml
@@ -40,6 +40,8 @@ jobs:
       matrix:
         gpu_backend: ["cuda", "hip_rocm"]
       fail-fast: false
+    env:
+      FF_GPU_BACKEND: ${{ matrix.gpu_backend }}
     steps:
       - name: Checkout Git Repository
         uses: actions/checkout@v3
@@ -51,6 +53,7 @@ jobs:
 
       - name: Install CUDA
         uses: Jimver/cuda-toolkit@v0.2.11
+        if: ${{ matrix.gpu_backend == 'cuda' }}
         id: cuda-toolkit
         with:
           cuda: "11.8.0"
@@ -58,7 +61,7 @@ jobs:
           use-github-cache: "false"
 
       - name: Install system dependencies
-        run: FF_GPU_BACKEND=${{ matrix.gpu_backend }} .github/workflows/helpers/install_dependencies.sh
+        run: .github/workflows/helpers/install_dependencies.sh
 
       - name: Install conda and FlexFlow dependencies
         uses: conda-incubator/setup-miniconda@v2
@@ -72,22 +75,25 @@ jobs:
           export CUDNN_DIR="$CUDA_PATH"
           export CUDA_DIR="$CUDA_PATH"
           export FF_HOME=$(pwd)
-          export FF_GPU_BACKEND=${{ matrix.gpu_backend }}
           export FF_CUDA_ARCH=70
-          cores_available=$(nproc --all)
-          n_build_cores=$(( cores_available -1 ))
-          if (( $n_build_cores < 1 )) ; then n_build_cores=1 ; fi
-          mkdir build
-          cd build
+          export FF_HIP_ARCH=gfx1100,gfx1036
+          export hip_version=5.6
+          export FF_BUILD_ALL_INFERENCE_EXAMPLES=ON
+
           if [[ "${FF_GPU_BACKEND}" == "cuda" ]]; then
             export FF_BUILD_ALL_EXAMPLES=ON
-            export FF_BUILD_ALL_INFERENCE_EXAMPLES=ON
             export FF_BUILD_UNIT_TESTS=ON
           else 
             export FF_BUILD_ALL_EXAMPLES=OFF
-            export FF_BUILD_ALL_INFERENCE_EXAMPLES=OFF
             export FF_BUILD_UNIT_TESTS=OFF
           fi
+
+          cores_available=$(nproc --all)
+          n_build_cores=$(( cores_available -1 ))
+          if (( $n_build_cores < 1 )) ; then n_build_cores=1 ; fi
+          mkdir build
+          cd build
+          
           ../config/config.linux
           make -j $n_build_cores
 
@@ -96,30 +102,24 @@ jobs:
           export CUDNN_DIR="$CUDA_PATH"
           export CUDA_DIR="$CUDA_PATH"
           export FF_HOME=$(pwd)
-          export FF_GPU_BACKEND=${{ matrix.gpu_backend }}
           export FF_CUDA_ARCH=70
-          cd build
+          export FF_HIP_ARCH=gfx1100,gfx1036
+          export hip_version=5.6
+          export FF_BUILD_ALL_INFERENCE_EXAMPLES=ON
+          
           if [[ "${FF_GPU_BACKEND}" == "cuda" ]]; then
             export FF_BUILD_ALL_EXAMPLES=ON
-            export FF_BUILD_ALL_INFERENCE_EXAMPLES=ON
             export FF_BUILD_UNIT_TESTS=ON
           else 
             export FF_BUILD_ALL_EXAMPLES=OFF
-            export FF_BUILD_ALL_INFERENCE_EXAMPLES=OFF
             export FF_BUILD_UNIT_TESTS=OFF
           fi
+
+          cd build
           ../config/config.linux
           sudo make install
           sudo ldconfig
 
-      - name: Check availability of Python flexflow.core module
-        if: ${{ matrix.gpu_backend == 'cuda' }}
-        run: |
-          export LD_LIBRARY_PATH="$CUDA_PATH/lib64/stubs:$LD_LIBRARY_PATH"
-          sudo ln -s "$CUDA_PATH/lib64/stubs/libcuda.so" "$CUDA_PATH/lib64/stubs/libcuda.so.1"
-          export CPU_ONLY_TEST=1
-          python -c "import flexflow.core; exit()"
-
       - name: Run C++ unit tests
         if: ${{ matrix.gpu_backend == 'cuda' }}
         run: |
@@ -127,9 +127,20 @@ jobs:
           export CUDA_DIR="$CUDA_PATH"
           export LD_LIBRARY_PATH="$CUDA_PATH/lib64/stubs:$LD_LIBRARY_PATH"
           export FF_HOME=$(pwd)
+          sudo ln -s "$CUDA_PATH/lib64/stubs/libcuda.so" "$CUDA_PATH/lib64/stubs/libcuda.so.1"
           cd build
           ./tests/unit/unit-test
 
+      - name: Check availability of Python flexflow.core module
+        run: |
+          if [[ "${FF_GPU_BACKEND}" == "cuda" ]]; then
+            export LD_LIBRARY_PATH="$CUDA_PATH/lib64/stubs:$LD_LIBRARY_PATH"
+          fi
+          # Remove build folder to check that the installed version can run independently of the build files
+          rm -rf build
+          export CPU_ONLY_TEST=1
+          python -c "import flexflow.core; exit()"
+
   makefile-build:
     name: Build FlexFlow with the Makefile
     runs-on: ubuntu-20.04
diff --git a/.github/workflows/docker-build.yml b/.github/workflows/docker-build.yml
index 304b63d65c..b0ca251510 100644
--- a/.github/workflows/docker-build.yml
+++ b/.github/workflows/docker-build.yml
@@ -26,29 +26,42 @@ jobs:
     strategy:
       matrix:
         gpu_backend: ["cuda", "hip_rocm"]
-        cuda_version: ["11.1", "11.2", "11.3", "11.4", "11.5", "11.6", "11.7", "11.8", "12.0"]
+        gpu_backend_version: ["11.1", "11.2", "11.3", "11.4", "11.5", "11.6", "11.7", "11.8", "12.0", "5.3", "5.4", "5.5", "5.6"]
         # The CUDA version doesn't matter when building for hip_rocm, so we just pick one arbitrarily (11.8) to avoid building for hip_rocm once per number of CUDA version supported
         exclude:
+          - gpu_backend: "cuda"
+            gpu_backend_version: "5.3"
+          - gpu_backend: "cuda"
+            gpu_backend_version: "5.4"
+          - gpu_backend: "cuda"
+            gpu_backend_version: "5.5"
+          - gpu_backend: "cuda"
+            gpu_backend_version: "5.6"
           - gpu_backend: "hip_rocm"
-            cuda_version: "11.1"
+            gpu_backend_version: "11.1"
           - gpu_backend: "hip_rocm"
-            cuda_version: "11.2"
+            gpu_backend_version: "11.2"
           - gpu_backend: "hip_rocm"
-            cuda_version: "11.3"
+            gpu_backend_version: "11.3"
           - gpu_backend: "hip_rocm"
-            cuda_version: "11.4"
+            gpu_backend_version: "11.4"
           - gpu_backend: "hip_rocm"
-            cuda_version: "11.5"
+            gpu_backend_version: "11.5"
           - gpu_backend: "hip_rocm"
-            cuda_version: "11.6"
+            gpu_backend_version: "11.6"
           - gpu_backend: "hip_rocm"
-            cuda_version: "11.7"
+            gpu_backend_version: "11.7"
           - gpu_backend: "hip_rocm"
-            cuda_version: "12.0"
+            gpu_backend_version: "11.8"
+          - gpu_backend: "hip_rocm"
+            gpu_backend_version: "12.0"
       fail-fast: false
     env:
       FF_GPU_BACKEND: ${{ matrix.gpu_backend }}
-      cuda_version: ${{ matrix.cuda_version }}
+      gpu_backend_version: ${{ matrix.gpu_backend_version }}
+      # one of the two variables below will be unused
+      cuda_version: ${{ matrix.gpu_backend_version }}
+      hip_version: ${{ matrix.gpu_backend_version }}
       branch_name: ${{ github.head_ref || github.ref_name }}
     steps:
       - name: Checkout Git Repository
@@ -58,8 +71,8 @@ jobs:
 
       - name: Free additional space on runner
         env:
-          deploy_needed: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' ) && env.branch_name == 'inference' }}
-          build_needed: ${{ matrix.gpu_backend == 'hip_rocm' || ( matrix.gpu_backend == 'cuda' && matrix.cuda_version == '11.8' ) }}
+          deploy_needed: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && env.branch_name == 'inference' }}
+          build_needed: ${{ ( matrix.gpu_backend == 'hip_rocm' && matrix.gpu_backend_version == '5.6' ) || ( matrix.gpu_backend == 'cuda' && matrix.gpu_backend_version == '11.8' ) }}
         run: |
           if [[ $deploy_needed == "true" || $build_needed == "true" ]]; then
             .github/workflows/helpers/free_space_on_runner.sh
@@ -69,22 +82,19 @@ jobs:
 
       - name: Build Docker container
         env:
-          deploy_needed: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' ) && env.branch_name == 'inference' }}
-          build_needed: ${{ matrix.gpu_backend == 'hip_rocm' || ( matrix.gpu_backend == 'cuda' && matrix.cuda_version == '11.8' ) }}
+          deploy_needed: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && env.branch_name == 'inference' }}
+          build_needed: ${{ ( matrix.gpu_backend == 'hip_rocm' && matrix.gpu_backend_version == '5.6' ) || ( matrix.gpu_backend == 'cuda' && matrix.gpu_backend_version == '11.8' ) }}
         run: |
-          if [[ "${FF_GPU_BACKEND}" == "cuda" ]]; then
-            export FF_BUILD_ALL_INFERENCE_EXAMPLES=ON
-          else
-            export FF_BUILD_ALL_INFERENCE_EXAMPLES=OFF
-          fi
           # On push to inference, build for all compatible architectures, so that we can publish 
           # a pre-built general-purpose image. On all other cases, only build for one architecture
           # to save time.
           if [[ $deploy_needed == "true" ]] ; then
             export FF_CUDA_ARCH=all
+            export FF_HIP_ARCH=all
             ./docker/build.sh flexflow
           elif [[ $build_needed == "true" ]]; then
             export FF_CUDA_ARCH=70
+            export FF_HIP_ARCH=gfx1100,gfx1036
             ./docker/build.sh flexflow
           else
             echo "Skipping build to save time"
@@ -93,11 +103,15 @@ jobs:
       - name: Check availability of Python flexflow.core module
         if: ${{ matrix.gpu_backend == 'cuda' }}
         env:
-          deploy_needed: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' ) && env.branch_name == 'inference' }}
-          build_needed: ${{ matrix.gpu_backend == 'hip_rocm' || ( matrix.gpu_backend == 'cuda' && matrix.cuda_version == '11.8' ) }}
+          deploy_needed: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && env.branch_name == 'inference' }}
+          build_needed: ${{ ( matrix.gpu_backend == 'hip_rocm' && matrix.gpu_backend_version == '5.6' ) || ( matrix.gpu_backend == 'cuda' && matrix.gpu_backend_version == '11.8' ) }}
         run: |
           if [[ $deploy_needed == "true" || $build_needed == "true" ]]; then
-            docker run --env CPU_ONLY_TEST=1 --entrypoint /bin/bash flexflow-cuda-${cuda_version}:latest -c "export LD_LIBRARY_PATH=/usr/local/cuda/lib64/stubs:$LD_LIBRARY_PATH; sudo ln -s /usr/local/cuda/lib64/stubs/libcuda.so /usr/local/cuda/lib64/stubs/libcuda.so.1; python -c 'import flexflow.core; exit()'"
+            if [[ $FF_GPU_BACKEND == "cuda" ]]; then
+              docker run --env CPU_ONLY_TEST=1 --entrypoint /bin/bash flexflow-${FF_GPU_BACKEND}-${gpu_backend_version}:latest -c "export LD_LIBRARY_PATH=/usr/local/cuda/lib64/stubs:$LD_LIBRARY_PATH; sudo ln -s /usr/local/cuda/lib64/stubs/libcuda.so /usr/local/cuda/lib64/stubs/libcuda.so.1; python -c 'import flexflow.core; exit()'"
+            else
+              docker run --env CPU_ONLY_TEST=1 --entrypoint /bin/bash flexflow-${FF_GPU_BACKEND}-${gpu_backend_version}:latest -c "python -c 'import flexflow.core; exit()'"
+            fi
           else
             echo "Skipping test to save time"
           fi
@@ -106,7 +120,7 @@ jobs:
         if: github.repository_owner == 'flexflow'
         env:
           FLEXFLOW_CONTAINER_TOKEN: ${{ secrets.FLEXFLOW_CONTAINER_TOKEN }}
-          deploy_needed: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' ) && env.branch_name == 'inference' }}
+          deploy_needed: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && env.branch_name == 'inference' }}
         run: |
           if [[ $deploy_needed == "true" ]]; then
             ./docker/publish.sh flexflow-environment
diff --git a/.github/workflows/helpers/install_dependencies.sh b/.github/workflows/helpers/install_dependencies.sh
index cf37f3b820..1357882b5d 100755
--- a/.github/workflows/helpers/install_dependencies.sh
+++ b/.github/workflows/helpers/install_dependencies.sh
@@ -10,21 +10,41 @@ echo "Installing apt dependencies..."
 sudo apt-get update && sudo apt-get install -y --no-install-recommends wget binutils git zlib1g-dev libhdf5-dev && \
     sudo rm -rf /var/lib/apt/lists/*
 
-# Install CUDNN
-./install_cudnn.sh
-
-# Install HIP dependencies if needed
 FF_GPU_BACKEND=${FF_GPU_BACKEND:-"cuda"}
+hip_version=${hip_version:-"5.6"}
 if [[ "${FF_GPU_BACKEND}" != @(cuda|hip_cuda|hip_rocm|intel) ]]; then
   echo "Error, value of FF_GPU_BACKEND (${FF_GPU_BACKEND}) is invalid."
   exit 1
-elif [[ "$FF_GPU_BACKEND" == "hip_cuda" || "$FF_GPU_BACKEND" = "hip_rocm" ]]; then
+fi
+# Install CUDNN if needed
+if [[ "$FF_GPU_BACKEND" == "cuda" || "$FF_GPU_BACKEND" = "hip_cuda" ]]; then
+    # Install CUDNN
+    ./install_cudnn.sh
+fi
+# Install HIP dependencies if needed
+if [[ "$FF_GPU_BACKEND" == "hip_cuda" || "$FF_GPU_BACKEND" = "hip_rocm" ]]; then
     echo "FF_GPU_BACKEND: ${FF_GPU_BACKEND}. Installing HIP dependencies"
-    wget https://repo.radeon.com/amdgpu-install/22.20.5/ubuntu/focal/amdgpu-install_22.20.50205-1_all.deb
-    sudo apt-get install -y ./amdgpu-install_22.20.50205-1_all.deb
-    rm ./amdgpu-install_22.20.50205-1_all.deb
+    # Check that hip_version is one of 5.3,5.4,5.5,5.6
+    if [[ "$hip_version" != "5.3" && "$hip_version" != "5.4" && "$hip_version" != "5.5" && "$hip_version" != "5.6" ]]; then
+        echo "hip_version '${hip_version}' is not supported, please choose among {5.3, 5.4, 5.5, 5.6}"
+        exit 1
+    fi
+    # Compute script name and url given the version
+    AMD_GPU_SCRIPT_NAME=amdgpu-install_5.6.50600-1_all.deb
+    if [ "$hip_version" = "5.3" ]; then
+        AMD_GPU_SCRIPT_NAME=amdgpu-install_5.3.50300-1_all.deb
+    elif [ "$hip_version" = "5.4" ]; then
+        AMD_GPU_SCRIPT_NAME=amdgpu-install_5.4.50400-1_all.deb
+    elif [ "$hip_version" = "5.5" ]; then
+        AMD_GPU_SCRIPT_NAME=amdgpu-install_5.5.50500-1_all.deb
+    fi
+    AMD_GPU_SCRIPT_URL="https://repo.radeon.com/amdgpu-install/${hip_version}/ubuntu/focal/${AMD_GPU_SCRIPT_NAME}"
+    # Download and install AMD GPU software with ROCM and HIP support
+    wget "$AMD_GPU_SCRIPT_URL"
+    sudo apt-get install -y ./${AMD_GPU_SCRIPT_NAME}
+    sudo rm ./${AMD_GPU_SCRIPT_NAME}
     sudo amdgpu-install -y --usecase=hip,rocm --no-dkms
-    sudo apt-get install -y hip-dev hipblas miopen-hip rocm-hip-sdk
+    sudo apt-get install -y hip-dev hipblas miopen-hip rocm-hip-sdk rocm-device-libs
 
     # Install protobuf v3.20.x manually
     sudo apt-get update -y && sudo apt-get install -y pkg-config zip g++ zlib1g-dev unzip python autoconf automake libtool curl make
diff --git a/.github/workflows/pip-install.yml b/.github/workflows/pip-install.yml
index d79834e31d..695ed9857b 100644
--- a/.github/workflows/pip-install.yml
+++ b/.github/workflows/pip-install.yml
@@ -66,6 +66,8 @@ jobs:
           export FF_HOME=$(pwd)
           export FF_CUDA_ARCH=70
           pip install . --verbose
+          # Remove build folder to check that the installed version can run independently of the build files
+          rm -rf build
 
       - name: Check availability of Python flexflow.core module
         run: |
diff --git a/CMakeLists.txt b/CMakeLists.txt
index 71077d22ef..2985732a8c 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -160,9 +160,14 @@ set_property(CACHE FF_GPU_BACKEND PROPERTY STRINGS ${FF_GPU_BACKENDS})
 
 # option for cuda arch
 set(FF_CUDA_ARCH "autodetect" CACHE STRING "Target CUDA Arch")
-if (FF_CUDA_ARCH STREQUAL "")
+if ((FF_GPU_BACKEND STREQUAL "cuda" OR FF_GPU_BACKEND STREQUAL "hip_cuda") AND FF_CUDA_ARCH STREQUAL "")
   message(FATAL_ERROR "FF_CUDA_ARCH cannot be an empty string. Set it to `autodetect`, `all`, or pass one or multiple valid CUDA archs.")
 endif()
+# option for hip arch
+set(FF_HIP_ARCH "all" CACHE STRING "Target HIP Arch")
+if (FF_GPU_BACKEND STREQUAL "hip_rocm" AND FF_CUDA_ARCH STREQUAL "")
+  message(FATAL_ERROR "FF_HIP_ARCH cannot be an empty string. Set it to `all`, or pass one or multiple valid HIP archs.")
+endif()
 
 # option for nccl
 option(FF_USE_NCCL "Run FlexFlow with NCCL" OFF)
@@ -226,6 +231,11 @@ if (FF_GPU_BACKEND STREQUAL "cuda" OR FF_GPU_BACKEND STREQUAL "hip_cuda")
   include(cuda)
 endif()
 
+# HIP
+if (FF_GPU_BACKEND STREQUAL "hip_rocm" OR FF_GPU_BACKEND STREQUAL "hip_cuda")
+  include(hip)
+endif()
+
 # CUDNN
 if (FF_GPU_BACKEND STREQUAL "cuda" OR FF_GPU_BACKEND STREQUAL "hip_cuda")
   include(cudnn)
@@ -397,6 +407,18 @@ elseif(FF_GPU_BACKEND STREQUAL "hip_cuda" OR FF_GPU_BACKEND STREQUAL "hip_rocm")
 
     add_compile_definitions(FF_USE_HIP_ROCM)
 
+    if (FF_HIP_ARCH STREQUAL "")
+      message(FATAL_ERROR "FF_HIP_ARCH is undefined")
+    endif()
+    set_property(TARGET flexflow PROPERTY HIP_ARCHITECTURES "${HIP_ARCH_LIST}")
+
+    message(STATUS "FF_GPU_BACKEND: ${FF_GPU_BACKEND}")
+    message(STATUS "FF_HIP_ARCH: ${FF_HIP_ARCH}")
+    message(STATUS "HIP_ARCH_LIST: ${HIP_ARCH_LIST}")
+    get_property(CHECK_HIP_ARCHS TARGET flexflow PROPERTY HIP_ARCHITECTURES)
+    message(STATUS "CHECK_HIP_ARCHS: ${CHECK_HIP_ARCHS}")
+    message(STATUS "HIP_CLANG_PATH: ${HIP_CLANG_PATH}")
+
     # The hip cmake config module defines three targets, 
     # hip::amdhip64, hip::host, and hip::device.
     #
diff --git a/cmake/hip.cmake b/cmake/hip.cmake
new file mode 100644
index 0000000000..b32d68d608
--- /dev/null
+++ b/cmake/hip.cmake
@@ -0,0 +1,11 @@
+if (NOT FF_HIP_ARCH STREQUAL "")
+    if (FF_HIP_ARCH STREQUAL "all")
+        set(FF_HIP_ARCH "gfx900,gfx902,gfx904,gfx906,gfx908,gfx909,gfx90a,gfx90c,gfx940,gfx1010,gfx1011,gfx1012,gfx1013,gfx1030,gfx1031,gfx1032,gfx1033,gfx1034,gfx1035,gfx1036,gfx1100,gfx1101,gfx1102,gfx1103")
+    endif()
+    string(REPLACE "," " " HIP_ARCH_LIST "${FF_HIP_ARCH}")
+endif()
+
+message(STATUS "FF_HIP_ARCH: ${FF_HIP_ARCH}")
+if(FF_GPU_BACKEND STREQUAL "hip_rocm")
+    set(HIP_CLANG_PATH ${ROCM_PATH}/llvm/bin CACHE STRING "Path to the clang compiler by ROCM" FORCE)
+endif()
diff --git a/cmake/legion.cmake b/cmake/legion.cmake
index b4cfad20e2..b83cbc52f2 100644
--- a/cmake/legion.cmake
+++ b/cmake/legion.cmake
@@ -142,8 +142,11 @@ else()
 			set(Legion_USE_HIP ON CACHE BOOL "enable Legion_USE_HIP" FORCE)
 			if (FF_GPU_BACKEND STREQUAL "hip_cuda")
 				set(Legion_HIP_TARGET "CUDA" CACHE STRING "Legion_HIP_TARGET CUDA" FORCE)
+				set(Legion_CUDA_ARCH ${FF_CUDA_ARCH} CACHE STRING "Legion CUDA ARCH" FORCE)
 			elseif(FF_GPU_BACKEND STREQUAL "hip_rocm")
 				set(Legion_HIP_TARGET "ROCM" CACHE STRING "Legion HIP_TARGET ROCM" FORCE)
+				set(Legion_HIP_ARCH ${FF_HIP_ARCH} CACHE STRING "Legion HIP ARCH" FORCE)
+				message(STATUS "Legion_HIP_ARCH: ${Legion_HIP_ARCH}")
 			endif()
 		endif()
 		set(Legion_REDOP_COMPLEX OFF CACHE BOOL "disable complex")
diff --git a/config/config.inc b/config/config.inc
index 804757af78..eb1ad21fc0 100644
--- a/config/config.inc
+++ b/config/config.inc
@@ -50,6 +50,11 @@ if [ -n "$FF_CUDA_ARCH" ]; then
   SET_CUDA_ARCH="-DFF_CUDA_ARCH=${FF_CUDA_ARCH}"
 fi
 
+# set HIP Arch
+if [ -n "$FF_HIP_ARCH" ]; then
+  SET_HIP_ARCH="-DFF_HIP_ARCH=${FF_HIP_ARCH}"
+fi
+
 # set CUDA dir
 if [ -n "$CUDA_DIR" ]; then
   SET_CUDA="-DCUDA_PATH=${CUDA_DIR}"
@@ -213,7 +218,7 @@ if [ -n "$FF_GPU_BACKEND" ]; then
   fi
 fi
 
-CMAKE_FLAGS="-DCUDA_USE_STATIC_CUDA_RUNTIME=OFF -DLegion_HIJACK_CUDART=OFF ${SET_CC} ${SET_CXX} ${SET_INSTALL_DIR} ${SET_INFERENCE_TESTS} ${SET_LIBTORCH_PATH} ${SET_BUILD} ${SET_CUDA_ARCH} ${SET_CUDA} ${SET_CUDNN} ${SET_PYTHON} ${SET_NCCL} ${SET_NCCL_DIR} ${SET_LEGION_NETWORKS} ${SET_EXAMPLES} ${SET_INFERENCE_EXAMPLES} ${SET_USE_PREBUILT_LEGION} ${SET_USE_PREBUILT_NCCL} ${SET_USE_ALL_PREBUILT_LIBRARIES} ${SET_BUILD_UNIT_TESTS} ${SET_AVX2} ${SET_MAX_DIM} ${SET_LEGION_MAX_RETURN_SIZE} ${SET_ROCM_PATH} ${SET_FF_GPU_BACKEND}"
+CMAKE_FLAGS="-DCUDA_USE_STATIC_CUDA_RUNTIME=OFF -DLegion_HIJACK_CUDART=OFF ${SET_CC} ${SET_CXX} ${SET_INSTALL_DIR} ${SET_INFERENCE_TESTS} ${SET_LIBTORCH_PATH} ${SET_BUILD} ${SET_CUDA_ARCH} ${SET_CUDA} ${SET_CUDNN} ${SET_HIP_ARCH} ${SET_PYTHON} ${SET_NCCL} ${SET_NCCL_DIR} ${SET_LEGION_NETWORKS} ${SET_EXAMPLES} ${SET_INFERENCE_EXAMPLES} ${SET_USE_PREBUILT_LEGION} ${SET_USE_PREBUILT_NCCL} ${SET_USE_ALL_PREBUILT_LIBRARIES} ${SET_BUILD_UNIT_TESTS} ${SET_AVX2} ${SET_MAX_DIM} ${SET_LEGION_MAX_RETURN_SIZE} ${SET_ROCM_PATH} ${SET_FF_GPU_BACKEND}"
 
 function run_cmake() {
 SRC_LOCATION=${SRC_LOCATION:=`dirname $0`/../}
diff --git a/config/config.linux b/config/config.linux
index 023ae1a183..e9c580220b 100755
--- a/config/config.linux
+++ b/config/config.linux
@@ -32,6 +32,9 @@ fi
 # Alternatively, set "FF_CUDA_ARCH=autodetect" to build FlexFlow for all architectures detected on the machine,
 # or set "FF_CUDA_ARCH=all" to build FlexFlow for all supported GPU architectures
 FF_CUDA_ARCH=${FF_CUDA_ARCH:-"autodetect"}
+# FF_HIP_ARCH only supports building for a specific AMD architecture, a list of architectures separated by a comma
+# or all available architectures. TODO: support autodetect
+FF_HIP_ARCH=${FF_HIP_ARCH:-"all"}
 
 # set CUDNN dir in case cmake cannot autodetect a path
 CUDNN_DIR=${CUDNN_DIR:-"/usr/local/cuda"}
@@ -94,7 +97,7 @@ fi
 
 function get_build_configs() {
     # Create a string with the values of the variables set in this script
-    BUILD_CONFIGS="FF_CUDA_ARCH=${FF_CUDA_ARCH} CUDNN_DIR=${CUDNN_DIR} CUDA_DIR=${CUDA_DIR} NCCL_DIR=${NCCL_DIR} FF_USE_PYTHON=${FF_USE_PYTHON} FF_GASNET_CONDUIT=${FF_GASNET_CONDUIT} FF_UCX_URL=${FF_UCX_URL} FF_LEGION_NETWORKS=${FF_LEGION_NETWORKS} FF_BUILD_ALL_EXAMPLES=${FF_BUILD_ALL_EXAMPLES} FF_BUILD_ALL_INFERENCE_EXAMPLES=${FF_BUILD_ALL_INFERENCE_EXAMPLES} FF_BUILD_UNIT_TESTS=${FF_BUILD_UNIT_TESTS} FF_USE_PREBUILT_NCCL=${FF_USE_PREBUILT_NCCL} FF_USE_PREBUILT_LEGION=${FF_USE_PREBUILT_LEGION} FF_USE_ALL_PREBUILT_LIBRARIES=${FF_USE_ALL_PREBUILT_LIBRARIES} FF_USE_AVX2=${FF_USE_AVX2} FF_MAX_DIM=${FF_MAX_DIM} ROCM_PATH=${ROCM_PATH} FF_GPU_BACKEND=${FF_GPU_BACKEND}"
+    BUILD_CONFIGS="FF_CUDA_ARCH=${FF_CUDA_ARCH} FF_HIP_ARCH=${FF_HIP_ARCH} CUDNN_DIR=${CUDNN_DIR} CUDA_DIR=${CUDA_DIR} NCCL_DIR=${NCCL_DIR} FF_USE_PYTHON=${FF_USE_PYTHON} FF_GASNET_CONDUIT=${FF_GASNET_CONDUIT} FF_UCX_URL=${FF_UCX_URL} FF_LEGION_NETWORKS=${FF_LEGION_NETWORKS} FF_BUILD_ALL_EXAMPLES=${FF_BUILD_ALL_EXAMPLES} FF_BUILD_ALL_INFERENCE_EXAMPLES=${FF_BUILD_ALL_INFERENCE_EXAMPLES} FF_BUILD_UNIT_TESTS=${FF_BUILD_UNIT_TESTS} FF_USE_PREBUILT_NCCL=${FF_USE_PREBUILT_NCCL} FF_USE_PREBUILT_LEGION=${FF_USE_PREBUILT_LEGION} FF_USE_ALL_PREBUILT_LIBRARIES=${FF_USE_ALL_PREBUILT_LIBRARIES} FF_USE_AVX2=${FF_USE_AVX2} FF_MAX_DIM=${FF_MAX_DIM} ROCM_PATH=${ROCM_PATH} FF_GPU_BACKEND=${FF_GPU_BACKEND}"
 }
 
 if [[ -n "$1" && ( "$1" == "CMAKE_FLAGS" || "$1" == "CUDA_PATH" ) ]]; then
diff --git a/docker/build.sh b/docker/build.sh
index e4f06a0ec1..e72c23fcd8 100755
--- a/docker/build.sh
+++ b/docker/build.sh
@@ -2,7 +2,7 @@
 set -euo pipefail
 
 # Usage: ./build.sh <docker_image_name>
-# Optional environment variables: FF_GPU_BACKEND, cuda_version
+# Optional environment variables: FF_GPU_BACKEND, cuda_version, hip_version
 
 # Cd into $FF_HOME. Assumes this script is in $FF_HOME/docker
 cd "${BASH_SOURCE[0]%/*}/.."
@@ -11,6 +11,7 @@ cd "${BASH_SOURCE[0]%/*}/.."
 image=${1:-flexflow}
 FF_GPU_BACKEND=${FF_GPU_BACKEND:-cuda}
 cuda_version=${cuda_version:-"empty"}
+hip_version=${hip_version:-"empty"}
 
 # Check docker image name
 if [[ "$image" != @(flexflow-environment|flexflow) ]]; then
@@ -28,12 +29,22 @@ else
   echo "Building $image docker image with default GPU backend: cuda"
 fi
 
+# base image to use when building the flexflow environment docker image.
+ff_environment_base_image="ubuntu:20.04"
+# gpu backend version suffix for the docker image.
+gpu_backend_version=""
+
 if [[ "${FF_GPU_BACKEND}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; then
   # Autodetect cuda version if not specified
   if [[ $cuda_version == "empty" ]]; then
-    cuda_version=$(command -v nvcc >/dev/null 2>&1 && nvcc --version | grep "release" | awk '{print $NF}')
+    # shellcheck disable=SC2015
+    cuda_version=$(command -v nvcc >/dev/null 2>&1 && nvcc --version | grep "release" | awk '{print $NF}' || true)
     # Change cuda_version eg. V11.7.99 to 11.7
     cuda_version=${cuda_version:1:4}
+    if [[ -z "$cuda_version" ]]; then
+      echo "Could not detect CUDA version. Please specify one manually by setting the 'cuda_version' env."
+      exit 1
+    fi
   fi
   # Check that CUDA version is supported, and modify cuda version to include default subsubversion
   if [[ "$cuda_version" == @(11.1|11.3|11.7|12.0|12.1) ]]; then
@@ -53,34 +64,57 @@ if [[ "${FF_GPU_BACKEND}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; the
     cuda_version=12.0
     cuda_version_input=${cuda_version}.1
   fi
-  # Set cuda version suffix to docker image name
   echo "Building $image docker image with CUDA $cuda_version"
-  cuda_version="-${cuda_version}"
-else
-  # Empty cuda version suffix for non-CUDA images
-  cuda_version=""
-  # Pick a default CUDA version for the base docker image from NVIDIA
-  cuda_version_input="11.8.0"
+  ff_environment_base_image="nvidia/cuda:${cuda_version_input}-cudnn8-devel-ubuntu20.04"
+  gpu_backend_version="-${cuda_version}"
 fi
 
-docker build --build-arg "FF_GPU_BACKEND=${FF_GPU_BACKEND}" --build-arg "cuda_version=${cuda_version_input}" -t "flexflow-environment-${FF_GPU_BACKEND}${cuda_version}" -f docker/flexflow-environment/Dockerfile .
+if [[ "${FF_GPU_BACKEND}" == "hip_rocm" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; then
+  # Autodetect HIP version if not specified
+  if [[ $hip_version == "empty" ]]; then
+    # shellcheck disable=SC2015
+    hip_version=$(command -v hipcc >/dev/null 2>&1 && hipcc --version | grep "HIP version:" | awk '{print $NF}' || true)
+    # Change hip_version eg. 5.6.31061-8c743ae5d to 5.6
+    hip_version=${hip_version:0:3}
+    if [[ -z "$hip_version" ]]; then
+      echo "Could not detect HIP version. Please specify one manually by setting the 'hip_version' env."
+      exit 1
+    fi
+  fi
+  # Check that HIP version is supported
+  if [[ "$hip_version" != @(5.3|5.4|5.5|5.6) ]]; then
+    echo "hip_version is not supported, please choose among {5.3, 5.4, 5.5, 5.6}"
+    exit 1
+  fi
+  echo "Building $image docker image with HIP $hip_version"
+  if [[ "${FF_GPU_BACKEND}" == "hip_rocm" ]]; then
+    gpu_backend_version="-${hip_version}"
+  fi
+fi
+
+# Get number of cores available on the machine. Build with all cores but one, to prevent RAM choking
+cores_available=$(nproc --all)
+n_build_cores=$(( cores_available -1 ))
+
+docker build --build-arg "ff_environment_base_image=${ff_environment_base_image}" --build-arg "N_BUILD_CORES=${n_build_cores}" --build-arg "FF_GPU_BACKEND=${FF_GPU_BACKEND}" --build-arg "hip_version=${hip_version}" -t "flexflow-environment-${FF_GPU_BACKEND}${gpu_backend_version}" -f docker/flexflow-environment/Dockerfile .
 
 # If the user only wants to build the environment image, we are done
 if [[ "$image" == "flexflow-environment" ]]; then
   exit 0
 fi
 
-# Gather arguments needed to build the FlexFlow image
-# Get number of cores available on the machine. Build with all cores but one, to prevent RAM choking
-cores_available=$(nproc --all)
-n_build_cores=$(( cores_available -1 ))
+# Done with flexflow-environment image
+
+###########################################################################################
 
-# If FF_CUDA_ARCH is set to autodetect, we need to perform the autodetection here because the Docker
-# image will not have access to GPUs during the build phase (due to a Docker restriction). In all other
-# cases, we pass the value of FF_CUDA_ARCH directly to Cmake.
-if [[ "${FF_CUDA_ARCH:-autodetect}" == "autodetect" ]]; then
-  # Get CUDA architecture(s), if GPUs are available
-  cat << EOF > ./get_gpu_arch.cu
+# Build flexflow image if requested 
+if [[ "${FF_GPU_BACKEND}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; then
+  # If FF_CUDA_ARCH is set to autodetect, we need to perform the autodetection here because the Docker
+  # image will not have access to GPUs during the build phase (due to a Docker restriction). In all other
+  # cases, we pass the value of FF_CUDA_ARCH directly to Cmake.
+  if [[ "${FF_CUDA_ARCH:-autodetect}" == "autodetect" ]]; then
+    # Get CUDA architecture(s), if GPUs are available
+    cat << EOF > ./get_gpu_arch.cu
 #include <stdio.h>
 int main() {
   int count = 0;
@@ -94,24 +128,25 @@ int main() {
   return 0;
 }
 EOF
-  gpu_arch_codes=""
-  if command -v nvcc &> /dev/null
-  then
-    nvcc ./get_gpu_arch.cu -o ./get_gpu_arch
-    gpu_arch_codes="$(./get_gpu_arch)"
-  fi
-  gpu_arch_codes="$(echo "$gpu_arch_codes" | xargs -n1 | sort -u | xargs)"
-  gpu_arch_codes="${gpu_arch_codes// /,}"
-  rm -f ./get_gpu_arch.cu ./get_gpu_arch
-
-  if [[ -n "$gpu_arch_codes" ]]; then
-  echo "Host machine has GPUs with architecture codes: $gpu_arch_codes"
-  echo "Configuring FlexFlow to build for the $gpu_arch_codes code(s)."
-  FF_CUDA_ARCH="${gpu_arch_codes}"
-  export FF_CUDA_ARCH
-  else
-    echo "FF_CUDA_ARCH is set to 'autodetect', but the host machine does not have any compatible GPUs."
-    exit 1
+    gpu_arch_codes=""
+    if command -v nvcc &> /dev/null
+    then
+      nvcc ./get_gpu_arch.cu -o ./get_gpu_arch
+      gpu_arch_codes="$(./get_gpu_arch)"
+    fi
+    gpu_arch_codes="$(echo "$gpu_arch_codes" | xargs -n1 | sort -u | xargs)"
+    gpu_arch_codes="${gpu_arch_codes// /,}"
+    rm -f ./get_gpu_arch.cu ./get_gpu_arch
+
+    if [[ -n "$gpu_arch_codes" ]]; then
+    echo "Host machine has GPUs with architecture codes: $gpu_arch_codes"
+    echo "Configuring FlexFlow to build for the $gpu_arch_codes code(s)."
+    FF_CUDA_ARCH="${gpu_arch_codes}"
+    export FF_CUDA_ARCH
+    else
+      echo "FF_CUDA_ARCH is set to 'autodetect', but the host machine does not have any compatible GPUs."
+      exit 1
+    fi
   fi
 fi
 
@@ -121,4 +156,4 @@ fi
 # Set value of BUILD_CONFIGS
 get_build_configs
 
-docker build --build-arg "N_BUILD_CORES=${n_build_cores}" --build-arg "FF_GPU_BACKEND=${FF_GPU_BACKEND}" --build-arg "BUILD_CONFIGS=${BUILD_CONFIGS}" --build-arg "cuda_version=${cuda_version}" -t "flexflow-${FF_GPU_BACKEND}${cuda_version}" -f docker/flexflow/Dockerfile .
+docker build --build-arg "N_BUILD_CORES=${n_build_cores}" --build-arg "FF_GPU_BACKEND=${FF_GPU_BACKEND}" --build-arg "BUILD_CONFIGS=${BUILD_CONFIGS}" --build-arg "gpu_backend_version=${gpu_backend_version}" -t "flexflow-${FF_GPU_BACKEND}${gpu_backend_version}" -f docker/flexflow/Dockerfile .
diff --git a/docker/flexflow-environment/Dockerfile b/docker/flexflow-environment/Dockerfile
index 09f8be51dc..f1ebdcc28a 100644
--- a/docker/flexflow-environment/Dockerfile
+++ b/docker/flexflow-environment/Dockerfile
@@ -1,5 +1,5 @@
-ARG cuda_version
-FROM nvidia/cuda:${cuda_version}-cudnn8-devel-ubuntu20.04
+ARG ff_environment_base_image
+FROM ${ff_environment_base_image}
 
 LABEL org.opencontainers.image.source=https://github.com/flexflow/FlexFlow
 LABEL org.opencontainers.image.description="FlexFlow environment container"
@@ -31,13 +31,34 @@ RUN wget -c -q https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_6
 # in the container. It also attempts to install packages for a graphical install.
 # For our container, we don't need `hip-runtime-nvidia`
 ARG FF_GPU_BACKEND "cuda"
+ARG hip_version "5.6"
+ARG N_BUILD_CORES
+# set MAKEFLAGS to speedup any dependency that uses make
+ENV MAKEFLAGS "${MAKEFLAGS} -j${N_BUILD_CORES}"
+
 RUN  if [ "$FF_GPU_BACKEND" = "hip_cuda" ] || [ "$FF_GPU_BACKEND" = "hip_rocm" ]; then \
         echo "FF_GPU_BACKEND: ${FF_GPU_BACKEND}. Installing HIP dependencies"; \
-        wget https://repo.radeon.com/amdgpu-install/22.20.5/ubuntu/bionic/amdgpu-install_22.20.50205-1_all.deb; \
-        apt-get install -y ./amdgpu-install_22.20.50205-1_all.deb; \
-        rm ./amdgpu-install_22.20.50205-1_all.deb; \
+        # Check that hip_version is one of 5.3,5.4,5.5,5.6
+        if [ "$hip_version" != "5.3" ] && [ "$hip_version" != "5.4" ] && [ "$hip_version" != "5.5" ] && [ "$hip_version" != "5.6" ]; then \
+            echo "hip_version '${hip_version}' is not supported, please choose among {5.3, 5.4, 5.5, 5.6}"; \
+            exit 1; \
+        fi; \
+        # Compute script name and url given the version
+        AMD_GPU_SCRIPT_NAME=amdgpu-install_5.6.50600-1_all.deb; \
+        if [ "$hip_version" = "5.3" ]; then \
+            AMD_GPU_SCRIPT_NAME=amdgpu-install_5.3.50300-1_all.deb; \
+        elif [ "$hip_version" = "5.4" ]; then \
+            AMD_GPU_SCRIPT_NAME=amdgpu-install_5.4.50400-1_all.deb; \
+        elif [ "$hip_version" = "5.5" ]; then \
+            AMD_GPU_SCRIPT_NAME=amdgpu-install_5.5.50500-1_all.deb; \
+        fi; \
+        AMD_GPU_SCRIPT_URL="https://repo.radeon.com/amdgpu-install/${hip_version}/ubuntu/focal/${AMD_GPU_SCRIPT_NAME}"; \
+        # Download and install AMD GPU software with ROCM and HIP support
+        wget $AMD_GPU_SCRIPT_URL; \
+        apt-get install -y ./${AMD_GPU_SCRIPT_NAME}; \
+        rm ./${AMD_GPU_SCRIPT_NAME}; \
         amdgpu-install -y --usecase=hip,rocm --no-dkms; \
-        apt-get install -y hip-dev hipblas miopen-hip rocm-hip-sdk; \
+        apt-get install -y hip-dev hipblas miopen-hip rocm-hip-sdk rocm-device-libs; \
         # Install protobuf v3.20.x manually
         apt-get update -y && sudo apt-get install -y pkg-config zip g++ zlib1g-dev autoconf automake libtool make; \
         git clone -b 3.20.x https://github.com/protocolbuffers/protobuf.git; cd protobuf/ ; git submodule update --init --recursive; \
diff --git a/docker/flexflow/Dockerfile b/docker/flexflow/Dockerfile
index 0cda5cbc18..a7d540bc71 100644
--- a/docker/flexflow/Dockerfile
+++ b/docker/flexflow/Dockerfile
@@ -1,6 +1,6 @@
 ARG FF_GPU_BACKEND "cuda"
-ARG cuda_version ""
-FROM flexflow-environment-$FF_GPU_BACKEND$cuda_version:latest
+ARG gpu_backend_version ""
+FROM flexflow-environment-$FF_GPU_BACKEND$gpu_backend_version:latest
 
 LABEL org.opencontainers.image.source=https://github.com/flexflow/FlexFlow
 LABEL org.opencontainers.image.description="FlexFlow container"
diff --git a/docker/publish.sh b/docker/publish.sh
index 8073abdd72..c70419a9cc 100755
--- a/docker/publish.sh
+++ b/docker/publish.sh
@@ -2,7 +2,7 @@
 set -euo pipefail
 
 # Usage: ./publish.sh <docker_image_name>
-# Optional environment variables: FF_GPU_BACKEND, cuda_version
+# Optional environment variables: FF_GPU_BACKEND, cuda_version, hip_version
 
 # Cd into directory holding this script
 cd "${BASH_SOURCE[0]%/*}"
@@ -11,6 +11,7 @@ cd "${BASH_SOURCE[0]%/*}"
 image=${1:-flexflow}
 FF_GPU_BACKEND=${FF_GPU_BACKEND:-cuda}
 cuda_version=${cuda_version:-"empty"}
+hip_version=${hip_version:-"empty"}
 
 # Check docker image name
 if [[ "${image}" != @(flexflow-environment|flexflow) ]]; then
@@ -18,6 +19,9 @@ if [[ "${image}" != @(flexflow-environment|flexflow) ]]; then
   exit 1
 fi
 
+# gpu backend version suffix for the docker image.
+gpu_backend_version=""
+
 # Check GPU backend
 if [[ "${FF_GPU_BACKEND}" != @(cuda|hip_cuda|hip_rocm|intel) ]]; then
   echo "Error, value of FF_GPU_BACKEND (${FF_GPU_BACKEND}) is invalid. Pick between 'cuda', 'hip_cuda', 'hip_rocm' or 'intel'."
@@ -31,9 +35,14 @@ fi
 if [[ "${FF_GPU_BACKEND}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; then
   # Autodetect cuda version if not specified
   if [[ $cuda_version == "empty" ]]; then
-    cuda_version=$(command -v nvcc >/dev/null 2>&1 && nvcc --version | grep "release" | awk '{print $NF}')
+    # shellcheck disable=SC2015
+    cuda_version=$(command -v nvcc >/dev/null 2>&1 && nvcc --version | grep "release" | awk '{print $NF}' || true)
     # Change cuda_version eg. V11.7.99 to 11.7
     cuda_version=${cuda_version:1:4}
+    if [[ -z "$cuda_version" ]]; then
+      echo "Could not detect CUDA version. Please specify one manually by setting the 'cuda_version' env."
+      exit 1
+    fi
   fi
   # Check that CUDA version is supported
   if [[ "$cuda_version" != @(11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0|12.1|12.2) ]]; then
@@ -42,14 +51,34 @@ if [[ "${FF_GPU_BACKEND}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; the
   fi
   # Set cuda version suffix to docker image name
   echo "Publishing $image docker image with CUDA $cuda_version"
-  cuda_version="-${cuda_version}"
-else
-  # Empty cuda version suffix for non-CUDA images
-  cuda_version=""
+  gpu_backend_version="-${cuda_version}"
+fi
+
+if [[ "${FF_GPU_BACKEND}" == "hip_rocm" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; then
+  # Autodetect HIP version if not specified
+  if [[ $hip_version == "empty" ]]; then
+    # shellcheck disable=SC2015
+    hip_version=$(command -v hipcc >/dev/null 2>&1 && hipcc --version | grep "HIP version:" | awk '{print $NF}' || true)
+    # Change hip_version eg. 5.6.31061-8c743ae5d to 5.6
+    hip_version=${hip_version:0:3}
+    if [[ -z "$hip_version" ]]; then
+      echo "Could not detect HIP version. Please specify one manually by setting the 'hip_version' env."
+      exit 1
+    fi
+  fi
+  # Check that HIP version is supported
+  if [[ "$hip_version" != @(5.3|5.4|5.5|5.6) ]]; then
+    echo "hip_version is not supported, please choose among {5.3, 5.4, 5.5, 5.6}"
+    exit 1
+  fi
+  echo "Pubilishing $image docker image with HIP $hip_version"
+  if [[ "${FF_GPU_BACKEND}" == "hip_rocm" ]]; then
+    gpu_backend_version="-${hip_version}"
+  fi
 fi
 
 # Check that image exists
-docker image inspect "${image}-${FF_GPU_BACKEND}${cuda_version}":latest > /dev/null
+docker image inspect "${image}-${FF_GPU_BACKEND}${gpu_backend_version}":latest > /dev/null
 
 # Log into container registry
 FLEXFLOW_CONTAINER_TOKEN=${FLEXFLOW_CONTAINER_TOKEN:-}
@@ -59,8 +88,8 @@ echo "$FLEXFLOW_CONTAINER_TOKEN" | docker login ghcr.io -u flexflow --password-s
 # Tag image to be uploaded
 git_sha=${GITHUB_SHA:-$(git rev-parse HEAD)}
 if [ -z "$git_sha" ]; then echo "Commit hash cannot be detected, cannot publish the docker image to ghrc.io"; exit; fi
-docker tag "${image}-${FF_GPU_BACKEND}${cuda_version}":latest ghcr.io/flexflow/"${image}-${FF_GPU_BACKEND}${cuda_version}":latest
+docker tag "${image}-${FF_GPU_BACKEND}${gpu_backend_version}":latest ghcr.io/flexflow/"${image}-${FF_GPU_BACKEND}${gpu_backend_version}":latest
 
 # Upload image
-docker push ghcr.io/flexflow/"${image}-${FF_GPU_BACKEND}${cuda_version}":latest
+docker push ghcr.io/flexflow/"${image}-${FF_GPU_BACKEND}${gpu_backend_version}":latest
 
diff --git a/docker/pull.sh b/docker/pull.sh
index 989fc89ccb..e5b6f26f3c 100755
--- a/docker/pull.sh
+++ b/docker/pull.sh
@@ -2,7 +2,7 @@
 set -euo pipefail
 
 # Usage: ./pull.sh <docker_image_name>
-# Optional environment variables: FF_GPU_BACKEND, cuda_version
+# Optional environment variables: FF_GPU_BACKEND, cuda_version, hip_version
 
 # Cd into directory holding this script
 cd "${BASH_SOURCE[0]%/*}"
@@ -11,6 +11,7 @@ cd "${BASH_SOURCE[0]%/*}"
 image=${1:-flexflow}
 FF_GPU_BACKEND=${FF_GPU_BACKEND:-cuda}
 cuda_version=${cuda_version:-"empty"}
+hip_version=${hip_version:-"empty"}
 
 # Check docker image name
 if [[ "${image}" != @(flexflow-environment|flexflow) ]]; then
@@ -28,12 +29,20 @@ else
   echo "Downloading $image docker image with default GPU backend: cuda"
 fi
 
+# gpu backend version suffix for the docker image.
+gpu_backend_version=""
+
 if [[ "${FF_GPU_BACKEND}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; then
   # Autodetect cuda version if not specified
   if [[ $cuda_version == "empty" ]]; then
-    cuda_version=$(command -v nvcc >/dev/null 2>&1 && nvcc --version | grep "release" | awk '{print $NF}')
+    # shellcheck disable=SC2015
+    cuda_version=$(command -v nvcc >/dev/null 2>&1 && nvcc --version | grep "release" | awk '{print $NF}' || true)
     # Change cuda_version eg. V11.7.99 to 11.7
     cuda_version=${cuda_version:1:4}
+    if [[ -z "$cuda_version" ]]; then
+      echo "Could not detect CUDA version. Please specify one manually by setting the 'cuda_version' env."
+      exit 1
+    fi
   fi
   # Check that CUDA version is supported
   if [[ "$cuda_version" != @(11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0|12.1|12.2) ]]; then
@@ -46,17 +55,37 @@ if [[ "${FF_GPU_BACKEND}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; the
   fi
   # Set cuda version suffix to docker image name
   echo "Downloading $image docker image with CUDA $cuda_version"
-  cuda_version="-${cuda_version}"
-else
-  # Empty cuda version suffix for non-CUDA images
-  cuda_version=""
+  gpu_backend_version="-${cuda_version}"
+fi
+
+if [[ "${FF_GPU_BACKEND}" == "hip_rocm" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; then
+  # Autodetect HIP version if not specified
+  if [[ $hip_version == "empty" ]]; then
+    # shellcheck disable=SC2015
+    hip_version=$(command -v hipcc >/dev/null 2>&1 && hipcc --version | grep "HIP version:" | awk '{print $NF}' || true)
+    # Change hip_version eg. 5.6.31061-8c743ae5d to 5.6
+    hip_version=${hip_version:0:3}
+    if [[ -z "$hip_version" ]]; then
+      echo "Could not detect HIP version. Please specify one manually by setting the 'hip_version' env."
+      exit 1
+    fi
+  fi
+  # Check that HIP version is supported
+  if [[ "$hip_version" != @(5.3|5.4|5.5|5.6) ]]; then
+    echo "hip_version is not supported, please choose among {5.3, 5.4, 5.5, 5.6}"
+    exit 1
+  fi
+  echo "Downloading $image docker image with HIP $hip_version"
+  if [[ "${FF_GPU_BACKEND}" == "hip_rocm" ]]; then
+    gpu_backend_version="-${hip_version}"
+  fi
 fi
 
 # Download image
-docker pull ghcr.io/flexflow/"$image-${FF_GPU_BACKEND}${cuda_version}"
+docker pull ghcr.io/flexflow/"$image-${FF_GPU_BACKEND}${gpu_backend_version}"
 
 # Tag downloaded image
-docker tag ghcr.io/flexflow/"$image-${FF_GPU_BACKEND}${cuda_version}":latest "$image-${FF_GPU_BACKEND}${cuda_version}":latest 
+docker tag ghcr.io/flexflow/"$image-${FF_GPU_BACKEND}${gpu_backend_version}":latest "$image-${FF_GPU_BACKEND}${gpu_backend_version}":latest 
 
 # Check that image exists
-docker image inspect "${image}-${FF_GPU_BACKEND}${cuda_version}":latest > /dev/null
+docker image inspect "${image}-${FF_GPU_BACKEND}${gpu_backend_version}":latest > /dev/null
diff --git a/docker/run.sh b/docker/run.sh
index bb948d6b78..76ec1e1ceb 100755
--- a/docker/run.sh
+++ b/docker/run.sh
@@ -2,7 +2,7 @@
 set -euo pipefail
 
 # Usage: ./run.sh <docker_image_name>
-# Optional environment variables: FF_GPU_BACKEND, cuda_version, ATTACH_GPUS, SHM_SIZE
+# Optional environment variables: FF_GPU_BACKEND, cuda_version, hip_version, ATTACH_GPUS, SHM_SIZE
 
 # Cd into directory holding this script
 cd "${BASH_SOURCE[0]%/*}"
@@ -11,6 +11,7 @@ cd "${BASH_SOURCE[0]%/*}"
 image=${1:-flexflow}
 FF_GPU_BACKEND=${FF_GPU_BACKEND:-cuda}
 cuda_version=${cuda_version:-"empty"}
+hip_version=${hip_version:-"empty"}
 
 # Parameter controlling whether to attach GPUs to the Docker container
 ATTACH_GPUS=${ATTACH_GPUS:-true}
@@ -41,12 +42,20 @@ else
   echo "Running $image docker image with default GPU backend: cuda"
 fi
 
+# gpu backend version suffix for the docker image.
+gpu_backend_version=""
+
 if [[ "${FF_GPU_BACKEND}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; then
   # Autodetect cuda version if not specified
   if [[ $cuda_version == "empty" ]]; then
-    cuda_version=$(command -v nvcc >/dev/null 2>&1 && nvcc --version | grep "release" | awk '{print $NF}')
+    # shellcheck disable=SC2015
+    cuda_version=$(command -v nvcc >/dev/null 2>&1 && nvcc --version | grep "release" | awk '{print $NF}' || true)
     # Change cuda_version eg. V11.7.99 to 11.7
     cuda_version=${cuda_version:1:4}
+    if [[ -z "$cuda_version" ]]; then
+      echo "Could not detect CUDA version. Please specify one manually by setting the 'cuda_version' env."
+      exit 1
+    fi
   fi
   # Check that CUDA version is supported
   if [[ "$cuda_version" != @(11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0|12.1|12.2) ]]; then
@@ -59,28 +68,56 @@ if [[ "${FF_GPU_BACKEND}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; the
   fi
   # Set cuda version suffix to docker image name
   echo "Running $image docker image with CUDA $cuda_version"
-  cuda_version_hyphen="-${cuda_version}"
-else
-  # Empty cuda version suffix for non-CUDA images
-  cuda_version_hyphen=""
+  gpu_backend_version="-${cuda_version}"
+fi
+
+if [[ "${FF_GPU_BACKEND}" == "hip_rocm" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; then
+  # Autodetect HIP version if not specified
+  if [[ $hip_version == "empty" ]]; then
+    # shellcheck disable=SC2015
+    hip_version=$(command -v hipcc >/dev/null 2>&1 && hipcc --version | grep "HIP version:" | awk '{print $NF}' || true)
+    # Change hip_version eg. 5.6.31061-8c743ae5d to 5.6
+    hip_version=${hip_version:0:3}
+    if [[ -z "$hip_version" ]]; then
+      echo "Could not detect HIP version. Please specify one manually by setting the 'hip_version' env."
+      exit 1
+    fi
+  fi
+  # Check that HIP version is supported
+  if [[ "$hip_version" != @(5.3|5.4|5.5|5.6) ]]; then
+    echo "hip_version is not supported, please choose among {5.3, 5.4, 5.5, 5.6}"
+    exit 1
+  fi
+  echo "Running $image docker image with HIP $hip_version"
+  if [[ "${FF_GPU_BACKEND}" == "hip_rocm" ]]; then
+    gpu_backend_version="-${hip_version}"
+  fi
 fi
 
 # Check that image exists, if fails, print the default error message.
-if [[ "$(docker images -q "$image"-"$FF_GPU_BACKEND""$cuda_version_hyphen":latest 2> /dev/null)" == "" ]]; then
-  echo ""
-  echo "To download the docker image, run:"
-  echo "    FF_GPU_BACKEND=${FF_GPU_BACKEND} cuda_version=${cuda_version} $(pwd)/pull.sh $image"
-  echo "To build the docker image from source, run:"
-  echo "    FF_GPU_BACKEND=${FF_GPU_BACKEND} cuda_version=${cuda_version} $(pwd)/build.sh $image"
-  echo ""
+if [[ "$(docker images -q "${image}-${FF_GPU_BACKEND}${gpu_backend_version}":latest 2> /dev/null)" == "" ]]; then
+  echo "Error, ${image}-${FF_GPU_BACKEND}${gpu_backend_version}:latest does not exist!"
+  if [[ "${FF_GPU_BACKEND}" == "cuda" ]]; then
+    echo ""
+    echo "To download the docker image, run:"
+    echo "    FF_GPU_BACKEND=${FF_GPU_BACKEND} cuda_version=${cuda_version} $(pwd)/pull.sh $image"
+    echo "To build the docker image from source, run:"
+    echo "    FF_GPU_BACKEND=${FF_GPU_BACKEND} cuda_version=${cuda_version} $(pwd)/build.sh $image"
+    echo ""
+  elif [[ "${FF_GPU_BACKEND}" == "hip_rocm" ]]; then
+    echo ""
+    echo "To download the docker image, run:"
+    echo "    FF_GPU_BACKEND=${FF_GPU_BACKEND} hip_version=${hip_version} $(pwd)/pull.sh $image"
+    echo "To build the docker image from source, run:"
+    echo "    FF_GPU_BACKEND=${FF_GPU_BACKEND} hip_version=${hip_version} $(pwd)/build.sh $image"
+    echo ""
+  fi
   exit 1
 fi
 
 inference_volumes=""
 if $ATTACH_INFERENCE_FILES ; then 
-  inference_volumes="-v $(pwd)/../inference/weights:/usr/FlexFlow/inference/weights \
-    -v $(pwd)/../inference/prompt:/usr/FlexFlow/inference/prompt \
-    -v $(pwd)/../inference/tokenizer:/usr/FlexFlow/inference/tokenizer"; 
+  inference_volumes="-v ~/.cache/flexflow:/usr/FlexFlow/inference";
 fi
 
-eval docker run -it "$gpu_arg" "--shm-size=${SHM_SIZE}" "${inference_volumes}" "${image}-${FF_GPU_BACKEND}${cuda_version_hyphen}:latest"
+eval docker run -it "$gpu_arg" "--shm-size=${SHM_SIZE}" "${inference_volumes}" "${image}-${FF_GPU_BACKEND}${gpu_backend_version}:latest"
diff --git a/inference/incr_decoding/CMakeLists.txt b/inference/incr_decoding/CMakeLists.txt
index 4ed60abb87..c3b97d094a 100644
--- a/inference/incr_decoding/CMakeLists.txt
+++ b/inference/incr_decoding/CMakeLists.txt
@@ -13,7 +13,22 @@ set(CPU_SRC
   ../models/falcon.cc
   ../models/starcoder.cc)
 
-cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
+if (FF_GPU_BACKEND STREQUAL "cuda" OR FF_GPU_BACKEND STREQUAL "hip_cuda")
+  cuda_add_executable(${project_target} ${CPU_SRC})
+  if (FF_GPU_BACKEND STREQUAL "hip_cuda")
+    target_compile_definitions(${project_target} PRIVATE __HIP_PLATFORM_NVIDIA__)
+  endif()
+elseif(FF_GPU_BACKEND STREQUAL "hip_rocm")
+  hip_add_executable(${project_target} ${CPU_SRC})
+  if (FF_HIP_ARCH STREQUAL "")
+    message(FATAL_ERROR "FF_HIP_ARCH is empty!")
+  endif()
+  set_property(TARGET ${project_target} PROPERTY HIP_ARCHITECTURES "${FF_HIP_ARCH}")
+  target_compile_definitions(${project_target} PRIVATE __HIP_PLATFORM_AMD__)
+else()
+  message(FATAL_ERROR "Compilation of ${project_target} for ${FF_GPU_BACKEND} backend not yet supported")
+endif()
+
 target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
 target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/inference)
 target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
diff --git a/inference/spec_infer/CMakeLists.txt b/inference/spec_infer/CMakeLists.txt
index 9697bd8256..3d6b48b802 100644
--- a/inference/spec_infer/CMakeLists.txt
+++ b/inference/spec_infer/CMakeLists.txt
@@ -12,7 +12,22 @@ set(CPU_SRC
   ../models/opt.cc
   ../models/falcon.cc)
 
-cuda_add_executable(${project_target} ${CPU_SRC} ${GPU_SRC})
+if (FF_GPU_BACKEND STREQUAL "cuda" OR FF_GPU_BACKEND STREQUAL "hip_cuda")
+  cuda_add_executable(${project_target} ${CPU_SRC})
+  if (FF_GPU_BACKEND STREQUAL "hip_cuda")
+    target_compile_definitions(${project_target} PRIVATE __HIP_PLATFORM_NVIDIA__)
+  endif()
+elseif(FF_GPU_BACKEND STREQUAL "hip_rocm")
+  hip_add_executable(${project_target} ${CPU_SRC})
+  if (FF_HIP_ARCH STREQUAL "")
+    message(FATAL_ERROR "FF_HIP_ARCH is empty!")
+  endif()
+  set_property(TARGET ${project_target} PROPERTY HIP_ARCHITECTURES "${FF_HIP_ARCH}")
+  target_compile_definitions(${project_target} PRIVATE __HIP_PLATFORM_AMD__)
+else()
+  message(FATAL_ERROR "Compilation of ${project_target} for ${FF_GPU_BACKEND} backend not yet supported")
+endif()
+
 target_include_directories(${project_target} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
 target_include_directories(${project_target} PRIVATE ${CMAKE_SOURCE_DIR}/inference)
 target_link_libraries(${project_target} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})

From 85acb4108d99f9329eea70149e7f4472062e3076 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 1 Sep 2023 23:40:55 -0400
Subject: [PATCH 217/344] Remove zlib (#1086)

---
 CMakeLists.txt                                |  3 ---
 cmake/zlib.cmake                              |  8 ------
 include/flexflow/config.h                     |  2 +-
 include/flexflow/ops/cast.h                   | 10 +++----
 include/flexflow/ops/layer_norm.h             | 10 +++----
 include/flexflow/ops/mean.h                   | 10 +++----
 include/flexflow/ops/rms_norm.h               | 10 +++----
 include/flexflow/utils/hip_helper.h           |  2 +-
 src/ops/aggregate.cpp                         | 12 ++++-----
 src/ops/aggregate_spec.cpp                    | 16 ++++++------
 src/ops/arg_topk.cpp                          | 12 ++++-----
 src/ops/argmax.cpp                            | 12 ++++-----
 src/ops/attention.cpp                         | 24 ++++++++---------
 src/ops/batch_norm.cpp                        | 24 ++++++++---------
 src/ops/beam_topk.cpp                         | 12 ++++-----
 src/ops/cache.cpp                             | 16 ++++++------
 src/ops/element_unary.cc                      |  2 +-
 src/ops/group_by.cpp                          | 12 ++++-----
 src/ops/inc_multihead_self_attention.cpp      | 12 ++++-----
 src/ops/kernels/batch_matmul.cpp              | 24 ++++++++---------
 src/ops/kernels/cast_kernels.cpp              | 12 ++++-----
 src/ops/kernels/concat_kernels.cpp            | 24 ++++++++---------
 src/ops/kernels/conv_2d_kernels.cpp           | 24 ++++++++---------
 src/ops/kernels/element_binary_kernels.cpp    | 24 ++++++++---------
 src/ops/kernels/linear_kernels.cpp            | 26 +++++++++----------
 src/ops/kernels/pool_2d_kernels.cpp           | 24 ++++++++---------
 src/ops/kernels/rms_norm_kernels.cpp          | 12 ++++-----
 src/ops/kernels/softmax.cpp                   | 24 ++++++++---------
 src/ops/layer_norm.cpp                        |  6 ++---
 src/ops/rms_norm.cc                           |  2 +-
 src/ops/sampling.cpp                          | 12 ++++-----
 src/ops/softmax.cc                            |  2 +-
 src/ops/spec_inc_multihead_self_attention.cpp | 12 ++++-----
 src/ops/topk.cpp                              | 18 ++++++-------
 src/ops/tree_inc_multihead_self_attention.cc  |  4 +--
 src/ops/tree_inc_multihead_self_attention.cpp | 12 ++++-----
 src/runtime/inference_manager.cc              |  2 +-
 src/runtime/initializer_kernel.cpp            |  2 +-
 src/runtime/model.cpp                         |  6 +++--
 src/runtime/simulator.cpp                     |  4 +--
 src/runtime/substitution.cc                   |  4 +++
 41 files changed, 241 insertions(+), 248 deletions(-)
 delete mode 100644 cmake/zlib.cmake

diff --git a/CMakeLists.txt b/CMakeLists.txt
index 2985732a8c..59eb27df2d 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -223,9 +223,6 @@ if(FF_GPU_BACKEND STREQUAL "hip_cuda" OR FF_GPU_BACKEND STREQUAL "hip_rocm")
   set(ROCM_PATH "/opt/rocm" CACHE STRING "Default ROCM installation directory.")
 endif()
 
-# ZLIB
-include(zlib)
-
 # CUDA
 if (FF_GPU_BACKEND STREQUAL "cuda" OR FF_GPU_BACKEND STREQUAL "hip_cuda")
   include(cuda)
diff --git a/cmake/zlib.cmake b/cmake/zlib.cmake
deleted file mode 100644
index 0281e02b88..0000000000
--- a/cmake/zlib.cmake
+++ /dev/null
@@ -1,8 +0,0 @@
-find_package(ZLIB REQUIRED)
-if(ZLIB_FOUND)
-  list(APPEND FLEXFLOW_EXT_LIBRARIES 
-    ${ZLIB_LIBRARIES})
-  message( STATUS "ZLIB libraries : ${ZLIB_LIBRARIES}" )
-else()
-  message( FATAL_ERROR "ZLIB package not found")
-endif()
\ No newline at end of file
diff --git a/include/flexflow/config.h b/include/flexflow/config.h
index be6c0d21da..a55b13ad6d 100644
--- a/include/flexflow/config.h
+++ b/include/flexflow/config.h
@@ -22,7 +22,7 @@
 #include <cublas_v2.h>
 #include <cudnn.h>
 #elif defined(FF_USE_HIP_ROCM)
-#include <hipblas.h>
+#include <hipblas/hipblas.h>
 #include <miopen/miopen.h>
 #else
 #error "Unknown device"
diff --git a/include/flexflow/ops/cast.h b/include/flexflow/ops/cast.h
index a06f87b3c8..a88e7d6bb0 100644
--- a/include/flexflow/ops/cast.h
+++ b/include/flexflow/ops/cast.h
@@ -34,19 +34,19 @@ class Cast : public Op {
        Params const &params,
        Input const &input,
        char const *name = nullptr);
-  void init(FFModel const &);
+  void init(FFModel const &) override;
   void init_inference(FFModel const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
-  void forward(FFModel const &);
-  void backward(FFModel const &);
+  void forward(FFModel const &) override;
+  void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
                               BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
-  void print_layer(FFModel const &model) {
+  void print_layer(FFModel const &model) override {
     assert(0);
   }
   static Op *
@@ -92,7 +92,7 @@ class Cast : public Op {
 
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
-                             CostMetrics &cost_metrics) const;
+                             CostMetrics &cost_metrics) const override;
   void serialize(Legion::Serializer &s) const override;
   static PCG::Node deserialize(FFModel &ff,
                                Legion::Deserializer &d,
diff --git a/include/flexflow/ops/layer_norm.h b/include/flexflow/ops/layer_norm.h
index cb977fc6a6..a36e41a19f 100644
--- a/include/flexflow/ops/layer_norm.h
+++ b/include/flexflow/ops/layer_norm.h
@@ -24,19 +24,19 @@ class LayerNorm : public Op {
             float _eps,
             bool allocate_weights,
             char const *name);
-  void init(FFModel const &);
+  void init(FFModel const &) override;
   void init_inference(FFModel const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
-  void forward(FFModel const &);
-  void backward(FFModel const &);
+  void forward(FFModel const &) override;
+  void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
                               BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
-  void print_layer(FFModel const &model) {
+  void print_layer(FFModel const &model) override {
     assert(0);
   }
   static Op *
@@ -68,7 +68,7 @@ class LayerNorm : public Op {
                             Legion::Runtime *runtime);
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
-                             CostMetrics &cost_metrics) const;
+                             CostMetrics &cost_metrics) const override;
   template <typename T>
   static void forward_kernel(LayerNormMeta const *m,
                              T const *input_ptr,
diff --git a/include/flexflow/ops/mean.h b/include/flexflow/ops/mean.h
index 3dc0ac9aa5..33d041031c 100644
--- a/include/flexflow/ops/mean.h
+++ b/include/flexflow/ops/mean.h
@@ -11,10 +11,10 @@ class Mean : public Op {
        std::vector<int> const &dims,
        bool keepdims,
        char const *name);
-  void init(FFModel const &);
-  void forward(FFModel const &);
-  void backward(FFModel const &);
-  void print_layer(FFModel const &model) {
+  void init(FFModel const &) override;
+  void forward(FFModel const &) override;
+  void backward(FFModel const &) override;
+  void print_layer(FFModel const &model) override {
     assert(0);
   }
 
@@ -32,7 +32,7 @@ class Mean : public Op {
                             Legion::Runtime *runtime);
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
-                             CostMetrics &cost_metrics) const;
+                             CostMetrics &cost_metrics) const override;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/ops/rms_norm.h b/include/flexflow/ops/rms_norm.h
index 979a20976c..36dde15b90 100644
--- a/include/flexflow/ops/rms_norm.h
+++ b/include/flexflow/ops/rms_norm.h
@@ -31,9 +31,9 @@ class RMSNorm : public Op {
           RMSNorm const &other,
           const ParallelTensor input,
           bool allocate_weights);
-  void init(FFModel const &);
-  void forward(FFModel const &);
-  void backward(FFModel const &);
+  void init(FFModel const &) override;
+  void forward(FFModel const &) override;
+  void backward(FFModel const &) override;
   void init_inference(FFModel const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
@@ -43,7 +43,7 @@ class RMSNorm : public Op {
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
-  void print_layer(FFModel const &model) {
+  void print_layer(FFModel const &model) override {
     assert(0);
   }
 
@@ -71,7 +71,7 @@ class RMSNorm : public Op {
                            Legion::Runtime *runtime);
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
-                             CostMetrics &cost_metrics) const;
+                             CostMetrics &cost_metrics) const override;
 
 public:
   float eps;
diff --git a/include/flexflow/utils/hip_helper.h b/include/flexflow/utils/hip_helper.h
index d16f353ade..374ea30064 100644
--- a/include/flexflow/utils/hip_helper.h
+++ b/include/flexflow/utils/hip_helper.h
@@ -3,7 +3,7 @@
 #include "flexflow/accessor.h"
 #include "flexflow/ffconst.h"
 #include "legion.h"
-#include <hipblas.h>
+#include <hipblas/hipblas.h>
 #include <miopen/miopen.h>
 
 #define FatalError(s)                                                          \
diff --git a/src/ops/aggregate.cpp b/src/ops/aggregate.cpp
index bc4391c426..d5ebdb0c22 100644
--- a/src/ops/aggregate.cpp
+++ b/src/ops/aggregate.cpp
@@ -216,8 +216,8 @@ void Aggregate::forward_kernel_wrapper(AggregateMeta const *m,
   checkCUDNN(miopenSetStream(m->handle.dnn, stream));
 
   // call forward_kernel
-  hipMemcpy(
-      m->dev_exp_preds, exp_preds, n * sizeof(float *), hipMemcpyHostToDevice);
+  checkCUDA(hipMemcpy(
+      m->dev_exp_preds, exp_preds, n * sizeof(float *), hipMemcpyHostToDevice));
 
   hipLaunchKernelGGL(agg_forward_kernel,
                      GET_BLOCKS(batch_size * k * out_dim),
@@ -256,10 +256,10 @@ void Aggregate::backward_kernel_wrapper(AggregateMeta const *m,
   checkCUDNN(miopenSetStream(m->handle.dnn, stream));
 
   // call backward kernel
-  hipMemcpy(
-      m->dev_exp_preds, exp_preds, n * sizeof(float *), hipMemcpyHostToDevice);
-  hipMemcpy(
-      m->dev_exp_grads, exp_grads, n * sizeof(float *), hipMemcpyHostToDevice);
+  checkCUDA(hipMemcpy(
+      m->dev_exp_preds, exp_preds, n * sizeof(float *), hipMemcpyHostToDevice));
+  checkCUDA(hipMemcpy(
+      m->dev_exp_grads, exp_grads, n * sizeof(float *), hipMemcpyHostToDevice));
 
   hipLaunchKernelGGL(agg_backward_kernel,
                      GET_BLOCKS(batch_size * k * out_dim),
diff --git a/src/ops/aggregate_spec.cpp b/src/ops/aggregate_spec.cpp
index e961c3ae7b..314e20a59c 100644
--- a/src/ops/aggregate_spec.cpp
+++ b/src/ops/aggregate_spec.cpp
@@ -226,10 +226,10 @@ void AggregateSpec::forward_kernel_wrapper(AggregateSpecMeta const *m,
   checkCUDNN(miopenSetStream(m->handle.dnn, stream));
 
   // call forward kernel
-  hipMemcpy(m->dev_region_ptrs,
-            exp_preds,
-            n * sizeof(float *),
-            hipMemcpyHostToDevice);
+  checkCUDA(hipMemcpy(m->dev_region_ptrs,
+                      exp_preds,
+                      n * sizeof(float *),
+                      hipMemcpyHostToDevice));
 
   hipLaunchKernelGGL(aggspec_forward_kernel,
                      GET_BLOCKS(batch_size * k * out_dim),
@@ -266,10 +266,10 @@ void AggregateSpec::backward_kernel_wrapper(AggregateSpecMeta const *m,
   checkCUDNN(miopenSetStream(m->handle.dnn, stream));
 
   // call backward kernel
-  hipMemcpy(m->dev_region_ptrs,
-            exp_grads,
-            n * sizeof(float *),
-            hipMemcpyHostToDevice);
+  checkCUDA(hipMemcpy(m->dev_region_ptrs,
+                      exp_grads,
+                      n * sizeof(float *),
+                      hipMemcpyHostToDevice));
 
   hipLaunchKernelGGL(aggspec_backward_kernel,
                      GET_BLOCKS(batch_size * k * out_dim),
diff --git a/src/ops/arg_topk.cpp b/src/ops/arg_topk.cpp
index 4937166b66..6db8abb8c4 100644
--- a/src/ops/arg_topk.cpp
+++ b/src/ops/arg_topk.cpp
@@ -448,9 +448,9 @@ void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA((&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
 
   if (input.data_type == DT_HALF) {
@@ -477,12 +477,12 @@ void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
     assert(false && "Unsupported data type");
   }
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
   }
 }
 
diff --git a/src/ops/argmax.cpp b/src/ops/argmax.cpp
index 778ddf3c9d..17b8c9ad16 100644
--- a/src/ops/argmax.cpp
+++ b/src/ops/argmax.cpp
@@ -42,20 +42,20 @@ void ArgMax::forward_kernel_wrapper(ArgMaxMeta const *m,
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
 
   handle_unimplemented_hip_kernel(OP_RMS_NORM);
 
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
   }
 }
 
diff --git a/src/ops/attention.cpp b/src/ops/attention.cpp
index 9b6ad6cb46..ee7f87a7fb 100644
--- a/src/ops/attention.cpp
+++ b/src/ops/attention.cpp
@@ -56,19 +56,19 @@ void MultiHeadAttention::forward_kernel_wrapper(MultiHeadAttentionMeta const *m,
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
   MultiHeadAttention::forward_kernel(
       m, query_ptr, key_ptr, value_ptr, weight_ptr, output_ptr, stream);
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
     printf("MultiHeadAttention forward time = %.2fms\n", elapsed);
     // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
     // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
@@ -124,9 +124,9 @@ void MultiHeadAttention::backward_kernel_wrapper(
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
 
   MultiHeadAttention::backward_kernel(m,
@@ -141,12 +141,12 @@ void MultiHeadAttention::backward_kernel_wrapper(
                                       output_grad_ptr,
                                       stream);
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
     printf("MultiHeadAttention backward time = %.2fms\n", elapsed);
   }
 }
diff --git a/src/ops/batch_norm.cpp b/src/ops/batch_norm.cpp
index a0a2d47e24..34a7fcbe72 100644
--- a/src/ops/batch_norm.cpp
+++ b/src/ops/batch_norm.cpp
@@ -133,9 +133,9 @@ __host__ void
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
   forward_kernel(m,
                  acc_input.ptr,
@@ -143,12 +143,12 @@ __host__ void
                  acc_scale.ptr,
                  acc_bias.ptr /*, stream*/);
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
     printf("BatchNorm forward time (BF) = %.2fms\n", elapsed);
   }
 }
@@ -256,9 +256,9 @@ __host__ void
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
   backward_kernel(m,
                   acc_input.ptr,
@@ -270,12 +270,12 @@ __host__ void
                   acc_bias_grad.ptr,
                   acc_output.rect.volume() /*, stream*/);
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
     printf("BatchNorm backward time = %.2fms\n", elapsed);
   }
 }
diff --git a/src/ops/beam_topk.cpp b/src/ops/beam_topk.cpp
index 293feecff0..134b0c6abe 100644
--- a/src/ops/beam_topk.cpp
+++ b/src/ops/beam_topk.cpp
@@ -638,9 +638,9 @@ void BeamTopK::forward_kernel_wrapper(BeamTopKMeta const *m,
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
 
   if (input.data_type == DT_HALF) {
@@ -668,12 +668,12 @@ void BeamTopK::forward_kernel_wrapper(BeamTopKMeta const *m,
   }
 
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
     printf("[BeamTopK] forward time = %.2lfms\n", elapsed);
   }
 }
diff --git a/src/ops/cache.cpp b/src/ops/cache.cpp
index 8dd1e098c2..95c5995f9e 100644
--- a/src/ops/cache.cpp
+++ b/src/ops/cache.cpp
@@ -43,10 +43,10 @@ void Cache::cache_forward(Task const *task,
   checkCUDA(hipblasSetStream(m->handle.blas, stream));
   checkCUDNN(miopenSetStream(m->handle.dnn, stream));
 
-  hipMemcpy(output_ptr,
-            batch_ptrs[batch_ctr],
-            c->inputs[0]->get_volume() * sizeof(T),
-            hipMemcpyHostToDevice);
+  checkCUDA(hipMemcpy(output_ptr,
+                      batch_ptrs[batch_ctr],
+                      c->inputs[0]->get_volume() * sizeof(T),
+                      hipMemcpyHostToDevice));
 }
 
 template <typename T>
@@ -61,10 +61,10 @@ float Cache::cache_update(Task const *task,
   T const *input_ptr = helperGetTensorPointerRW<T>(
       regions[0], task->regions[0], FID_DATA, ctx, runtime);
   T *host_input = (T *)c->batch_cmp;
-  hipMemcpy(host_input,
-            input_ptr,
-            c->inputs[0]->get_volume() * sizeof(T),
-            hipMemcpyDeviceToHost);
+  checkCUDA(hipMemcpy(host_input,
+                      input_ptr,
+                      c->inputs[0]->get_volume() * sizeof(T),
+                      hipMemcpyDeviceToHost));
   float cache_score = c->score_f(&m->cache_score,
                                  host_input,
                                  c->batch_ptrs[batch_ctr],
diff --git a/src/ops/element_unary.cc b/src/ops/element_unary.cc
index 5ecb812b68..c82c1196a2 100644
--- a/src/ops/element_unary.cc
+++ b/src/ops/element_unary.cc
@@ -31,7 +31,7 @@ Tensor FFModel::unary(OperatorType op,
   // if (x->data_type < DT_FLOAT) {
   if (false) {
     dtype = DT_FLOAT;
-    std::string str = nullptr ? "" : std::string(name);
+    std::string str = (name == nullptr) ? "" : std::string(name);
     Tensor new_x = cast(x, dtype, (str + "input_pre_cast").c_str());
     ele = new Layer(this,
                     op,
diff --git a/src/ops/group_by.cpp b/src/ops/group_by.cpp
index 51bcd7d7b4..761c35f182 100644
--- a/src/ops/group_by.cpp
+++ b/src/ops/group_by.cpp
@@ -134,8 +134,8 @@ void Group_by::forward_kernel_wrapper(GroupByMeta const *m,
   checkCUDA(get_legion_stream(&stream));
 
   // call forward kernel
-  hipMemcpy(
-      m->dev_region_ptrs, outputs, n * sizeof(float *), hipMemcpyHostToDevice);
+  checkCUDA(hipMemcpy(
+      m->dev_region_ptrs, outputs, n * sizeof(float *), hipMemcpyHostToDevice));
 
   hipLaunchKernelGGL(gb_forward_kernel,
                      GET_BLOCKS(batch_size * k * data_dim),
@@ -168,10 +168,10 @@ void Group_by::backward_kernel_wrapper(GroupByMeta const *m,
   checkCUDA(get_legion_stream(&stream));
 
   // call forward kernel
-  hipMemcpy(m->dev_region_ptrs,
-            output_grads,
-            n * sizeof(float *),
-            hipMemcpyHostToDevice);
+  checkCUDA(hipMemcpy(m->dev_region_ptrs,
+                      output_grads,
+                      n * sizeof(float *),
+                      hipMemcpyHostToDevice));
 
   hipLaunchKernelGGL(gb_backward_kernel,
                      GET_BLOCKS(batch_size * k * data_dim),
diff --git a/src/ops/inc_multihead_self_attention.cpp b/src/ops/inc_multihead_self_attention.cpp
index b7ed189040..99f8f49abd 100644
--- a/src/ops/inc_multihead_self_attention.cpp
+++ b/src/ops/inc_multihead_self_attention.cpp
@@ -37,20 +37,20 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
 
   handle_unimplemented_hip_kernel(OP_INC_MULTIHEAD_SELF_ATTENTION);
 
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
     printf("IncMultiHeadSelfAttention forward time = %.2fms\n", elapsed);
     // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
     // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
diff --git a/src/ops/kernels/batch_matmul.cpp b/src/ops/kernels/batch_matmul.cpp
index 34468d28a1..7145af2108 100644
--- a/src/ops/kernels/batch_matmul.cpp
+++ b/src/ops/kernels/batch_matmul.cpp
@@ -41,9 +41,9 @@ void forward_kernel_wrapper(BatchMatmulMeta const *meta,
 
   hipEvent_t t_start, t_end;
   if (meta->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
   Internal::forward_kernel(meta,
                            o_ptr,
@@ -59,12 +59,12 @@ void forward_kernel_wrapper(BatchMatmulMeta const *meta,
                            b_seq_length_dim,
                            seq_length);
   if (meta->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
     printf("BatchMatmul forward time = %.2lfms\n", elapsed);
   }
 }
@@ -86,9 +86,9 @@ void backward_kernel_wrapper(BatchMatmulMeta const *meta,
 
   hipEvent_t t_start, t_end;
   if (meta->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
   Internal::backward_kernel(meta,
                             o_ptr,
@@ -104,12 +104,12 @@ void backward_kernel_wrapper(BatchMatmulMeta const *meta,
                             batch,
                             stream);
   if (meta->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
     printf("BatchMatmul backward time = %.2lfms\n", elapsed);
   }
 }
diff --git a/src/ops/kernels/cast_kernels.cpp b/src/ops/kernels/cast_kernels.cpp
index f47bd0ed92..16b9b4cec0 100644
--- a/src/ops/kernels/cast_kernels.cpp
+++ b/src/ops/kernels/cast_kernels.cpp
@@ -34,19 +34,19 @@ void forward_kernel_wrapper(CastMeta const *m,
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
 
   Internal::forward_kernel<IDT, ODT>(input_ptr, output_ptr, volume, stream);
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
     printf("[%s] forward time (CF) = %.2fms\n", "Cast", elapsed);
     // print_tensor<IDT>(input_ptr, 32, "[Cast:forward:input]");
     // print_tensor<ODT>(output_ptr, 32, "[Cast:forward:output]");
diff --git a/src/ops/kernels/concat_kernels.cpp b/src/ops/kernels/concat_kernels.cpp
index 5f6e04abc9..bf5d46b9cc 100644
--- a/src/ops/kernels/concat_kernels.cpp
+++ b/src/ops/kernels/concat_kernels.cpp
@@ -40,13 +40,13 @@ void forward_kernel_wrapper(ConcatMeta const *m,
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
   Internal::forward_kernel(output, inputs, num_inputs, axis, stream);
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     // print_tensor<4, float>(output - output_blk_size, output_rect,
     // "[Concat:forward:output]"); printf("output_blk_size=%zu\n",
@@ -56,8 +56,8 @@ void forward_kernel_wrapper(ConcatMeta const *m,
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
     printf("[%s] forward time = %.4f ms\n", m->op_name, elapsed);
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
   }
 }
 
@@ -71,19 +71,19 @@ void backward_kernel_wrapper(ConcatMeta const *m,
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
   Internal::backward_kernel(output_grad, input_grads, num_inputs, axis, stream);
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
     printf("[%s] forward time = %.4f ms\n", m->op_name, elapsed);
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
   }
 }
 
diff --git a/src/ops/kernels/conv_2d_kernels.cpp b/src/ops/kernels/conv_2d_kernels.cpp
index b4ec1545c3..7d2fa20c49 100644
--- a/src/ops/kernels/conv_2d_kernels.cpp
+++ b/src/ops/kernels/conv_2d_kernels.cpp
@@ -174,15 +174,15 @@ void forward_kernel_wrapper(Conv2DMeta const *m,
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
 
   Internal::forward_kernel(
       m, input_ptr, output_ptr, filter_ptr, bias_ptr, stream);
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     print_tensor<float>(input_ptr, 16, "[Conv2D:forward:input]");
     print_tensor<float>(filter_ptr, 16, "[Conv2D:forward:kernel]");
@@ -190,8 +190,8 @@ void forward_kernel_wrapper(Conv2DMeta const *m,
     print_tensor<float>(output_ptr, 16, "[Conv2D:forward:output]");
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
     printf("%s [Conv2D] forward time (CF) = %.2fms\n", m->op_name, elapsed);
   }
 }
@@ -209,9 +209,9 @@ void backward_kernel_wrapper(Conv2DMeta const *m,
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
 
   Internal::backward_kernel(m,
@@ -224,12 +224,12 @@ void backward_kernel_wrapper(Conv2DMeta const *m,
                             bias_grad_ptr,
                             stream);
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
     printf("%s [Conv2D] backward time = %.2fms\n", m->op_name, elapsed);
     // print_tensor<4, float>(acc_output_grad.ptr, acc_output_grad.rect,
     // "[Conv2D:backward:output_grad]"); print_tensor<4,
diff --git a/src/ops/kernels/element_binary_kernels.cpp b/src/ops/kernels/element_binary_kernels.cpp
index 3aef875d1f..a65372de85 100644
--- a/src/ops/kernels/element_binary_kernels.cpp
+++ b/src/ops/kernels/element_binary_kernels.cpp
@@ -76,9 +76,9 @@ void forward_kernel_wrapper(ElementBinaryMeta const *m,
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
   // print_tensor<float>(in1_ptr, in1_domain.get_volume(), "input1:");
   // print_tensor<float>(in2_ptr, in2_domain.get_volume(), "input2:");
@@ -86,12 +86,12 @@ void forward_kernel_wrapper(ElementBinaryMeta const *m,
       m, in1.get_float_ptr(), in2.get_float_ptr(), out.get_float_ptr(), stream);
   // print_tensor<float>(out_ptr, in1_domain.get_volume(), "output:");
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
     char const *opName;
     switch (m->op_type) {
       case OP_EW_ADD:
@@ -124,9 +124,9 @@ void backward_kernel_wrapper(ElementBinaryMeta const *m,
   checkCUDA(get_legion_stream(&stream));
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
 
   Internal::backward_kernel(
@@ -135,12 +135,12 @@ void backward_kernel_wrapper(ElementBinaryMeta const *m,
   // CUDA_NUM_THREADS>>>( out_grad_domain.get_volume(), alpha, alpha,
   // ele->op_type, out_grad_ptr, in1_ptr, in2_ptr, in1_grad_ptr, in2_grad_ptr);
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
     char const *opName;
     switch (m->op_type) {
       case OP_EW_ADD:
diff --git a/src/ops/kernels/linear_kernels.cpp b/src/ops/kernels/linear_kernels.cpp
index 0d70e91d47..231ca0f3d7 100644
--- a/src/ops/kernels/linear_kernels.cpp
+++ b/src/ops/kernels/linear_kernels.cpp
@@ -61,7 +61,7 @@ bool use_activation(ActiMode mode) {
   return false;
 }
 
-void Linear::init_kernel(LinearMeta *m, int batch_size, int channel) {
+void init_kernel(LinearMeta *m, int batch_size, int channel) {
   if (use_activation(m->activation)) {
     miopenActivationMode_t mode;
     switch (m->activation) {
@@ -99,9 +99,9 @@ void forward_kernel_wrapper(LinearMeta const *m,
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
 
   if (m->input_type[0] == DT_FLOAT) {
@@ -127,12 +127,12 @@ void forward_kernel_wrapper(LinearMeta const *m,
   }
 
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
     printf("%s [Linear] forward time = %.2lfms\n", m->op_name, elapsed);
     // print_tensor<float>(acc_input.ptr, acc_input.rect.volume(),
     // "[Linear:forward:input]"); print_tensor<float>(acc_kernel.ptr,
@@ -159,9 +159,9 @@ void backward_kernel_wrapper(LinearMeta const *m,
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
   if (m->input_type[0] == DT_FLOAT) {
     Internal::backward_kernel<float>(m,
@@ -192,12 +192,12 @@ void backward_kernel_wrapper(LinearMeta const *m,
   }
 
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
     printf("%s Linear backward time = %.2lfms\n", m->op_name, elapsed);
     // print_tensor<float>(acc_output_grad.ptr, acc_output_grad.rect.volume(),
     // "[Linear:backward:output_grad]");
diff --git a/src/ops/kernels/pool_2d_kernels.cpp b/src/ops/kernels/pool_2d_kernels.cpp
index f302969559..8af85612ca 100644
--- a/src/ops/kernels/pool_2d_kernels.cpp
+++ b/src/ops/kernels/pool_2d_kernels.cpp
@@ -75,21 +75,21 @@ void forward_kernel_wrapper(Pool2DMeta const *m,
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
   Internal::forward_kernel(m, input_ptr, output_ptr, stream);
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     // print_tensor<4, float>(acc_input.ptr, acc_input.rect,
     // "[Pool2D:forward:input]"); print_tensor<4, float>(acc_output.ptr,
     // acc_output.rect, "[Pool2D:forward:output]");
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
     printf("%s [Pool2D] forward time = %.2fms\n", m->op_name, elapsed);
   }
 }
@@ -104,19 +104,19 @@ void backward_kernel_wrapper(Pool2DMeta const *m,
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
   Internal::backward_kernel(
       m, input_ptr, input_grad_ptr, output_ptr, output_grad_ptr, stream);
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
     printf("Pool2D backward time = %.2fms\n", elapsed);
   }
 }
diff --git a/src/ops/kernels/rms_norm_kernels.cpp b/src/ops/kernels/rms_norm_kernels.cpp
index b2e2648785..03f49774c5 100644
--- a/src/ops/kernels/rms_norm_kernels.cpp
+++ b/src/ops/kernels/rms_norm_kernels.cpp
@@ -39,20 +39,20 @@ void forward_kernel_wrapper(RMSNormMeta const *m,
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
 
   handle_unimplemented_hip_kernel(OP_RMS_NORM);
 
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
   }
 }
 
diff --git a/src/ops/kernels/softmax.cpp b/src/ops/kernels/softmax.cpp
index d09a5aaf6d..8599f09244 100644
--- a/src/ops/kernels/softmax.cpp
+++ b/src/ops/kernels/softmax.cpp
@@ -45,21 +45,21 @@ void forward_kernel_wrapper(SoftmaxMeta const *m,
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
   Internal::forward_kernel(m, input_ptr, output_ptr, stream);
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     // print_tensor<float>(acc_input.ptr, acc_input.rect.volume(),
     // "[Softmax:forward:input]"); print_tensor<float>(acc_output.ptr,
     // acc_output.rect.volume(), "[Softmax:forward:output]");
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
     log_measure.debug(
         "%s [Softmax] forward time = %.2fms\n", m->op_name, elapsed);
   }
@@ -75,14 +75,14 @@ void backward_kernel_wrapper(SoftmaxMeta const *m,
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
   Internal::backward_kernel(
       input_grad_ptr, output_grad_ptr, num_elements, stream);
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     // print_tensor<float>(acc_output_grad.ptr, acc_output_grad.rect.volume(),
     // "[Softmax:backward:output_grad]");
@@ -90,8 +90,8 @@ void backward_kernel_wrapper(SoftmaxMeta const *m,
     // "[Softmax:backward:input_grad]");
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
     log_measure.debug("Softmax backward time = %.2fms\n", elapsed);
   }
 }
diff --git a/src/ops/layer_norm.cpp b/src/ops/layer_norm.cpp
index 855f7296e8..ddbf96a493 100644
--- a/src/ops/layer_norm.cpp
+++ b/src/ops/layer_norm.cpp
@@ -47,12 +47,10 @@ __device__ __forceinline__ T WARP_SHFL_DOWN(T value,
                                             unsigned int delta,
                                             int width = warpSize,
                                             unsigned int mask = 0xffffffff) {
-#if 0
 #ifndef __HIP_PLATFORM_HCC__
-    return __shfl_down_sync(mask, value, delta, width);
+  return __shfl_down_sync(mask, value, delta, width);
 #else
-    return __shfl_down(value, delta, width);
-#endif
+  return __shfl_down(value, delta, width);
 #endif
 }
 
diff --git a/src/ops/rms_norm.cc b/src/ops/rms_norm.cc
index 1f21591130..8fdfc7bc1e 100644
--- a/src/ops/rms_norm.cc
+++ b/src/ops/rms_norm.cc
@@ -431,7 +431,7 @@ Op *RMSNorm::materialize(FFModel &ff,
                          ParallelTensor inputs[],
                          int num_inputs) const {
   RMSNormParams params = get_params();
-  return new RMSNorm(ff, params, inputs[0], this->name);
+  return new RMSNorm(ff, params, inputs[0], true, this->name);
 }
 
 void RMSNorm::backward(FFModel const &ff) {}
diff --git a/src/ops/sampling.cpp b/src/ops/sampling.cpp
index 56f3f604d5..c4aa3a804a 100644
--- a/src/ops/sampling.cpp
+++ b/src/ops/sampling.cpp
@@ -40,20 +40,20 @@ void Sampling::forward_kernel_wrapper(SamplingMeta const *m,
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
 
   handle_unimplemented_hip_kernel(OP_RMS_NORM);
 
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
   }
 }
 
diff --git a/src/ops/softmax.cc b/src/ops/softmax.cc
index 450f7c009a..2d72151035 100644
--- a/src/ops/softmax.cc
+++ b/src/ops/softmax.cc
@@ -56,7 +56,7 @@ Tensor FFModel::softmax(const Tensor _input,
                         int dim,
                         DataType data_type,
                         char const *name) {
-  if (data_type = DT_NONE) {
+  if (data_type == DT_NONE) {
     data_type = _input->data_type;
   }
   Layer *sm = new Layer(this,
diff --git a/src/ops/spec_inc_multihead_self_attention.cpp b/src/ops/spec_inc_multihead_self_attention.cpp
index 09198c5751..8092ed8bd7 100644
--- a/src/ops/spec_inc_multihead_self_attention.cpp
+++ b/src/ops/spec_inc_multihead_self_attention.cpp
@@ -37,20 +37,20 @@ void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
 
   handle_unimplemented_hip_kernel(OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION);
 
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
     printf("SpecIncMultiHeadSelfAttention forward time = %.2fms\n", elapsed);
     // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
     // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
diff --git a/src/ops/topk.cpp b/src/ops/topk.cpp
index 4bb32192ef..b6e898b654 100644
--- a/src/ops/topk.cpp
+++ b/src/ops/topk.cpp
@@ -421,9 +421,9 @@ void TopK::forward_kernel_wrapper(TopKMeta const *m,
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
 
   TopK::forward_kernel(m,
@@ -437,12 +437,12 @@ void TopK::forward_kernel_wrapper(TopKMeta const *m,
                        stream);
 
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
   }
 }
 
@@ -496,9 +496,9 @@ void TopK::backward_kernel_wrapper(TopKMeta const *m,
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
 
   TopK::backward_kernel(m,
diff --git a/src/ops/tree_inc_multihead_self_attention.cc b/src/ops/tree_inc_multihead_self_attention.cc
index 875f38c77a..f10c9a8f0f 100644
--- a/src/ops/tree_inc_multihead_self_attention.cc
+++ b/src/ops/tree_inc_multihead_self_attention.cc
@@ -343,7 +343,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     // dims[2].size = qParas + kParas + vParas + oParas;
     if (quantization_type != DT_NONE) {
       dims[1].size = get_quantization_to_byte_size(
-          data_type, quantization_type, dims[2].size);
+          data_type, quantization_type, dims[1].size);
     }
     // dims[2].degree = 1;
     // dims[2].parallel_idx = -1;
@@ -454,7 +454,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     // dims[2].size = qParas + kParas + vParas + oParas;
     if (quantization_type != DT_NONE) {
       dims[1].size = get_quantization_to_byte_size(
-          data_type, quantization_type, dims[2].size);
+          data_type, quantization_type, dims[1].size);
     }
     int seed = std::rand();
     Initializer *initializer = new GlorotUniform(seed);
diff --git a/src/ops/tree_inc_multihead_self_attention.cpp b/src/ops/tree_inc_multihead_self_attention.cpp
index a20077efb4..dc68a54bf2 100644
--- a/src/ops/tree_inc_multihead_self_attention.cpp
+++ b/src/ops/tree_inc_multihead_self_attention.cpp
@@ -37,20 +37,20 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
-    hipEventCreate(&t_start);
-    hipEventCreate(&t_end);
-    hipEventRecord(t_start, stream);
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
   }
 
   handle_unimplemented_hip_kernel(OP_TREE_INC_MULTIHEAD_SELF_ATTENTION);
 
   if (m->profiling) {
-    hipEventRecord(t_end, stream);
+    checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
     float elapsed = 0;
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
-    hipEventDestroy(t_start);
-    hipEventDestroy(t_end);
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
     printf("TreeIncMultiHeadSelfAttention forward time = %.2fms\n", elapsed);
     // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
     // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 62ab947f8f..f36dcb2922 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -107,7 +107,7 @@ void InferenceManager::compile_model_and_allocate_buffer(FFModel *model) {
     std::vector<MachineView> machine_views;
     for (int j = 0; j < model->config.data_parallelism_degree; j++) {
       MachineView mv;
-      mv.device_type == MachineView::GPU;
+      mv.device_type = MachineView::GPU;
       mv.ndims = 1;
       // mv.start_device_id = 0;
       mv.stride[0] = 1;
diff --git a/src/runtime/initializer_kernel.cpp b/src/runtime/initializer_kernel.cpp
index 6a0ebe3ba9..1005d93cec 100644
--- a/src/runtime/initializer_kernel.cpp
+++ b/src/runtime/initializer_kernel.cpp
@@ -19,7 +19,7 @@
 #include "flexflow/utils/hip_helper.h"
 #include <ctime>
 #include <hip/hip_runtime.h>
-#include <hiprand.h>
+#include <hiprand/hiprand.h>
 #include <random>
 
 namespace FlexFlow {
diff --git a/src/runtime/model.cpp b/src/runtime/model.cpp
index d6ae0ec948..6c482426eb 100644
--- a/src/runtime/model.cpp
+++ b/src/runtime/model.cpp
@@ -54,7 +54,8 @@ void Op::inner_measure_operator_cost(Simulator *sim,
   checkCUDA(hipEventRecord(sim->end_event, stream));
   checkCUDA(hipEventSynchronize(sim->end_event));
   float milliseconds;
-  hipEventElapsedTime(&milliseconds, sim->start_event, sim->end_event);
+  checkCUDA(
+      hipEventElapsedTime(&milliseconds, sim->start_event, sim->end_event));
   cost_metrics.forward_time = milliseconds / sim->repeat_times;
 
   // measure backward time
@@ -68,7 +69,8 @@ void Op::inner_measure_operator_cost(Simulator *sim,
     }
     checkCUDA(hipEventRecord(sim->end_event, stream));
     checkCUDA(hipEventSynchronize(sim->end_event));
-    hipEventElapsedTime(&milliseconds, sim->start_event, sim->end_event);
+    checkCUDA(
+        hipEventElapsedTime(&milliseconds, sim->start_event, sim->end_event));
     cost_metrics.backward_time = milliseconds / sim->repeat_times;
   } else {
     cost_metrics.backward_time = 0.0f;
diff --git a/src/runtime/simulator.cpp b/src/runtime/simulator.cpp
index e10923cd8d..0daf151d2c 100644
--- a/src/runtime/simulator.cpp
+++ b/src/runtime/simulator.cpp
@@ -80,8 +80,8 @@ Simulator::Simulator(FFModel const *model,
 
   size_t max_num_tasks = 1024 * 1024;
 
-  hipEventCreate(&start_event);
-  hipEventCreate(&end_event);
+  checkCUDA(hipEventCreate(&start_event));
+  checkCUDA(hipEventCreate(&end_event));
   conv2d_meta = new Conv2DMeta(handler);
   // linear_meta = new LinearMeta(handler, 4096);
   pool2d_meta = new Pool2DMeta(handler);
diff --git a/src/runtime/substitution.cc b/src/runtime/substitution.cc
index 3a25d99b6f..5071b5dd66 100644
--- a/src/runtime/substitution.cc
+++ b/src/runtime/substitution.cc
@@ -1488,6 +1488,8 @@ OpX *create_opx(sl::Operator const &op,
         case OP_REPLICATE:
           degree_key = PM_REPLICATE_DEGREE;
           break;
+        default:
+          break;
       }
 
       if (degree_key.has_value()) {
@@ -1510,6 +1512,8 @@ OpX *create_opx(sl::Operator const &op,
         case OP_REPLICATE:
           dim_key = PM_REPLICATE_DIM;
           break;
+        default:
+          break;
       }
 
       if (dim_key.has_value()) {

From 3af422dee4fe47767fc601084883b818740d7182 Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Sat, 2 Sep 2023 19:03:02 -0400
Subject: [PATCH 218/344] support AMD in inference branch  (#996)

* init

* fix build issue.

* fix

* fix

* rccl

* fix fuse

* fix fuse

* fix specinfer

* argmax

* .

* format

* fix

* remove print

* minor fix

* fix

* fix

---------

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
---
 CMakeLists.txt                                |   17 +-
 cmake/hip.cmake                               |    1 +
 config/config.linux                           |    2 +-
 include/flexflow/config.h                     |    4 +
 include/flexflow/machine_view.h               |    4 +
 .../ops/inc_multihead_self_attention.h        |    7 +
 .../inc_multihead_self_attention_kernels.h    |   21 +-
 include/flexflow/ops/sampling.h               |    5 +
 include/flexflow/utils/hip_helper.h           |   10 +
 inference/models/falcon.cc                    |    4 +-
 inference/models/starcoder.cc                 |    2 +
 src/ops/argmax.cpp                            |  448 ++++++-
 src/ops/beam_topk.cpp                         |   53 +-
 src/ops/fused.cpp                             |  104 +-
 src/ops/inc_multihead_self_attention.cpp      | 1043 ++++++++++++++++-
 src/ops/inc_multihead_self_attention.cu       |   10 -
 src/ops/kernels/decompress_kernels.cpp        |   90 ++
 src/ops/kernels/rms_norm_kernels.cpp          |  163 ++-
 src/ops/kernels/softmax.cpp                   |    3 +-
 src/ops/sampling.cpp                          |  206 +++-
 src/ops/spec_inc_multihead_self_attention.cpp |  631 +++++++++-
 src/ops/tree_inc_multihead_self_attention.cpp |  633 +++++++++-
 .../kernels/allreduce_kernels.cpp             |   29 +-
 src/runtime/hip_helper.cpp                    |   80 +-
 src/runtime/optimizer_kernel.cpp              |    2 +
 src/runtime/request_manager.cpp               |   31 +-
 26 files changed, 3501 insertions(+), 102 deletions(-)
 create mode 100644 src/ops/kernels/decompress_kernels.cpp

diff --git a/CMakeLists.txt b/CMakeLists.txt
index 59eb27df2d..ef571dc59c 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -1,6 +1,7 @@
 cmake_minimum_required(VERSION 3.10)
 project(FlexFlow)
 
+
 include(ExternalProject)
 
 # Set policy CMP0074 to eliminate cmake warnings
@@ -172,10 +173,6 @@ endif()
 # option for nccl
 option(FF_USE_NCCL "Run FlexFlow with NCCL" OFF)
 
-if (FF_GPU_BACKEND STREQUAL "hip_rocm" AND FF_USE_NCCL STREQUAL "ON")
-  message(FATAL_ERROR "NCCL: ON for FF_GPU_BACKEND: hip_rocm. hip_rocm backend must have NCCL disabled.")
-endif()
-
 # option for avx2
 option(FF_USE_AVX2 "Run FlexFlow with AVX2" OFF)
 
@@ -240,7 +237,9 @@ endif()
 
 # NCCL
 if(FF_USE_NCCL)
-  include(nccl)
+  if(FF_GPU_BACKEND STREQUAL "hip_cuda" OR FF_GPU_BACKEND STREQUAL "cuda")
+    include(nccl)
+  endif() 
   list(APPEND FF_CC_FLAGS
     -DFF_USE_NCCL)
   list(APPEND FF_NVCC_FLAGS
@@ -399,6 +398,9 @@ elseif(FF_GPU_BACKEND STREQUAL "hip_cuda" OR FF_GPU_BACKEND STREQUAL "hip_rocm")
   elseif(FF_GPU_BACKEND STREQUAL "hip_rocm")
     find_package(hipblas REQUIRED)
     find_package(miopen REQUIRED)
+    if(FF_USE_NCCL)
+      find_package(rccl REQUIRED)
+    endif()
     # find_package(rocrand REQUIRED)
     find_library(HIP_RAND_LIBRARY hiprand REQUIRED)
 
@@ -429,12 +431,15 @@ elseif(FF_GPU_BACKEND STREQUAL "hip_cuda" OR FF_GPU_BACKEND STREQUAL "hip_rocm")
     # Docs (outdated):
     # https://rocmdocs.amd.com/en/latest/Installation_Guide/Using-CMake-with-AMD-ROCm.html
     target_link_libraries(flexflow hip::device roc::hipblas MIOpen ${HIP_RAND_LIBRARY})
+    if(FF_USE_NCCL)
+        target_link_libraries(flexflow rccl)
+    endif()
   endif()
 else()
   message(FATAL_ERROR "Unsupported FF_GPU_BACKEND for cmake: ${FF_GPU_BACKEND}")
 endif()
 
-if(FF_USE_NCCL)
+if(FF_USE_NCCL AND (FF_GPU_BACKEND STREQUAL "hip_cuda" OR FF_GPU_BACKEND STREQUAL "cuda"))
   add_dependencies(flexflow ${NCCL_NAME})
 endif()
 
diff --git a/cmake/hip.cmake b/cmake/hip.cmake
index b32d68d608..abcc82b03a 100644
--- a/cmake/hip.cmake
+++ b/cmake/hip.cmake
@@ -8,4 +8,5 @@ endif()
 message(STATUS "FF_HIP_ARCH: ${FF_HIP_ARCH}")
 if(FF_GPU_BACKEND STREQUAL "hip_rocm")
     set(HIP_CLANG_PATH ${ROCM_PATH}/llvm/bin CACHE STRING "Path to the clang compiler by ROCM" FORCE)
+    set(GPU_TARGETS "${FF_HIP_ARCH}" CACHE STRING "The GPU TARGETs")
 endif()
diff --git a/config/config.linux b/config/config.linux
index e9c580220b..3686237538 100755
--- a/config/config.linux
+++ b/config/config.linux
@@ -88,7 +88,7 @@ FF_GPU_BACKEND=${FF_GPU_BACKEND:-cuda}
 if [[ "${FF_GPU_BACKEND}" != @(cuda|hip_cuda|hip_rocm|intel) ]]; then
   echo "Error, value of FF_GPU_BACKEND (${FF_GPU_BACKEND}) is invalid."
   exit 1
-elif [[ "$FF_GPU_BACKEND" == "cuda" || "$FF_GPU_BACKEND" = "hip_cuda" ]]; then
+elif [[ "$FF_GPU_BACKEND" == "cuda" || "$FF_GPU_BACKEND" = "hip_cuda" || "$FF_GPU_BACKEND" == "hip_rocm" ]]; then
     # enable NCCL
     FF_USE_NCCL=${FF_USE_NCCL:-ON}
 else
diff --git a/include/flexflow/config.h b/include/flexflow/config.h
index a55b13ad6d..2479358bfb 100644
--- a/include/flexflow/config.h
+++ b/include/flexflow/config.h
@@ -29,7 +29,11 @@
 #endif
 #include "tl/optional.hpp"
 #ifdef FF_USE_NCCL
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
 #include <nccl.h>
+#else
+#include <rccl.h>
+#endif
 #endif
 
 namespace FlexFlow {
diff --git a/include/flexflow/machine_view.h b/include/flexflow/machine_view.h
index 8843dc4d6a..719792c10c 100644
--- a/include/flexflow/machine_view.h
+++ b/include/flexflow/machine_view.h
@@ -4,7 +4,11 @@
 #include "legion.h"
 #include <vector>
 #ifdef FF_USE_NCCL
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
 #include <nccl.h>
+#else
+#include <rccl.h>
+#endif
 #endif
 #include "flexflow/config.h"
 
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index 91621074b3..e48a8d4240 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -14,6 +14,9 @@
 #include "math.h"
 #include <cfloat>
 #include <complex>
+#if defined(FF_USE_HIP_ROCM)
+#include <hip/hip_complex.h>
+#endif
 
 namespace FlexFlow {
 
@@ -191,6 +194,10 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
   cudnnTensorDescriptor_t qk_tensor;
   cuFloatComplex *complex_input;
+#elif defined(FF_USE_HIP_ROCM)
+  miopenTensorDescriptor_t qk_tensor;
+  //  typedef hipFloatComplex attFloatComplex;
+  hipFloatComplex *complex_input;
 #endif
 };
 
diff --git a/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h b/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
index 6b294bc211..f578249045 100644
--- a/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
+++ b/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
@@ -31,6 +31,7 @@ __global__ void apply_proj_bias_qkv(DT *input_ptr,
                                     bool scaling_query,
                                     float scaling_factor);
 
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
 template <typename DT>
 __global__ void
     apply_rotary_embedding(DT *input_ptr,
@@ -45,6 +46,22 @@ __global__ void
                            int k_block_size,
                            int q_array_size,
                            bool q_tensor);
+#elif defined(FF_USE_HIP_ROCM)
+template <typename DT>
+__global__ void
+    apply_rotary_embedding(DT *input_ptr,
+                           hipFloatComplex *complex_input,
+                           BatchConfig::PerTokenInfo const *tokenInfos,
+                           int qProjSize,
+                           int kProjSize,
+                           int num_heads,
+                           int num_tokens,
+                           int num_kv_heads,
+                           int q_block_size,
+                           int k_block_size,
+                           int q_array_size,
+                           bool q_tensor);
+#endif
 
 template <typename DT>
 void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
@@ -54,13 +71,13 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                         DT const *weight_ptr,
                         DT *output_ptr,
                         DT const *bias_ptr,
-                        cudaStream_t stream);
+                        ffStream_t stream);
 
 template <typename DT>
 void pre_build_weight_kernel(IncMultiHeadSelfAttentionMeta const *m,
                              GenericTensorAccessorR const weight,
                              DataType data_type,
-                             cudaStream_t stream);
+                             ffStream_t stream);
 } // namespace IncMultiHeadAttention
 } // namespace Kernels
 } // namespace FlexFlow
diff --git a/include/flexflow/ops/sampling.h b/include/flexflow/ops/sampling.h
index 789904df32..d690888a39 100644
--- a/include/flexflow/ops/sampling.h
+++ b/include/flexflow/ops/sampling.h
@@ -8,6 +8,9 @@
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
 #include <curand.h>
 #include <curand_kernel.h>
+#elif defined(FF_USE_HIP_ROCM)
+#include <hiprand.h>
+#include <hiprand/hiprand_kernel.h>
 #endif
 #include "flexflow/utils/memory_allocator.h"
 
@@ -26,6 +29,8 @@ class SamplingMeta : public OpMeta {
   Realm::RegionInstance reserveInst;
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
   curandState *state;
+#elif defined(FF_USE_HIP_ROCM)
+  hiprandState *state;
 #endif
   SamplingMeta(FFHandler handle,
                Op const *op,
diff --git a/include/flexflow/utils/hip_helper.h b/include/flexflow/utils/hip_helper.h
index 374ea30064..7f6403c767 100644
--- a/include/flexflow/utils/hip_helper.h
+++ b/include/flexflow/utils/hip_helper.h
@@ -5,6 +5,9 @@
 #include "legion.h"
 #include <hipblas/hipblas.h>
 #include <miopen/miopen.h>
+#ifdef FF_USE_NCCL
+#include <rccl.h>
+#endif
 
 #define FatalError(s)                                                          \
   do {                                                                         \
@@ -145,9 +148,16 @@ miopenStatus_t
                                        Legion::Domain domain,
                                        DataType data_type = DT_FLOAT);
 
+miopenStatus_t
+    cudnnSetTensorDescriptorFromDomain4SoftMax(miopenTensorDescriptor_t tensor,
+                                               Legion::Domain domain);
+
 hipblasDatatype_t ff_to_cuda_datatype(DataType type);
 
 miopenDataType_t ff_to_cudnn_datatype(DataType type);
+#ifdef FF_USE_NCCL
+ncclDataType_t ff_to_nccl_datatype(DataType type);
+#endif
 
 void handle_unimplemented_hip_kernel(OperatorType op_type);
 #endif
diff --git a/inference/models/falcon.cc b/inference/models/falcon.cc
index d57504b8cf..a26a6eaf4b 100644
--- a/inference/models/falcon.cc
+++ b/inference/models/falcon.cc
@@ -183,9 +183,9 @@ void FALCON::create_falcon_model(FFModel &ff,
   Tensor output;
   if (mode == BEAM_SEARCH_MODE) {
     Tensor softmax = ff.softmax(lm_head, -1);
-    output = ff.beam_top_k(softmax, falcon_config.max_beam_width, false);
+    output = ff.argmax(softmax, /*beam_Search*/ true);
   } else {
-    output = ff.arg_top_k(lm_head, /*k=*/1, false);
+    output = ff.argmax(lm_head, /*beam_Search*/ false);
   }
 
   // Compile the model
diff --git a/inference/models/starcoder.cc b/inference/models/starcoder.cc
index 4b27498cfd..d32f5e9430 100644
--- a/inference/models/starcoder.cc
+++ b/inference/models/starcoder.cc
@@ -180,6 +180,7 @@ void STARCODER::create_starcoder_model(
   Tensor output;
   if (mode == BEAM_SEARCH_MODE) {
     Tensor softmax = ff.softmax(lm_head, -1);
+    // output = ff.beam_top_k(softmax, startcoder_config.max_beam_width, false);
     output = ff.argmax(softmax, /*beam_Search*/ true);
   } else {
     // Tensor softmax = ff.softmax(dense, -1);
@@ -188,6 +189,7 @@ void STARCODER::create_starcoder_model(
       Tensor softmax = ff.softmax(lm_head, -1);
       output = ff.sampling(softmax, generationConfig.topp);
     } else {
+      // output = ff.arg_top_k(lm_head, /*k=*/1, false);
       output = ff.argmax(lm_head, /*beam_Search*/ false);
     }
   }
diff --git a/src/ops/argmax.cpp b/src/ops/argmax.cpp
index 17b8c9ad16..ec5ea6c36a 100644
--- a/src/ops/argmax.cpp
+++ b/src/ops/argmax.cpp
@@ -17,19 +17,415 @@
 #include "flexflow/ffconst_utils.h"
 #include "flexflow/utils/hip_helper.h"
 #include <hip/hip_runtime.h>
+#include <hipcub/hipcub.hpp>
 
 namespace FlexFlow {
 
+using Legion::coord_t;
+
+enum class HeapType { kMinHeap, kMaxHeap };
+enum class PreferIndices { kLower, kHigher };
+
+template <typename T>
+struct Entry {
+  int index;
+  T value;
+};
+
+template <typename T>
+struct LinearData {
+  typedef Entry<T> Entry;
+
+  __device__ Entry &operator[](std::size_t index) const {
+    return data[index];
+  }
+
+  __device__ int get_index(int i) const {
+    return data[i].index;
+  }
+  __device__ T get_value(int i) const {
+    return data[i].value;
+  }
+
+  Entry *const data;
+};
+
+template <typename T>
+struct IndirectLinearData {
+  typedef Entry<T> Entry;
+
+  __device__ Entry &operator[](std::size_t index) const {
+    return data[index];
+  }
+
+  __device__ int get_index(int i) const {
+    return backing_data[data[i].index].index;
+  }
+  __device__ T get_value(int i) const {
+    return data[i].value;
+  }
+
+  Entry *const data;
+  Entry *const backing_data;
+};
+
+template <typename T>
+struct StridedData {
+  typedef Entry<T> Entry;
+
+  __device__ Entry &operator[](std::size_t index) const {
+    return data[index * blockDim.x + threadIdx.x];
+  }
+
+  __device__ int get_index(int i) const {
+    return (*this)[i].index;
+  }
+  __device__ T get_value(int i) const {
+    return (*this)[i].value;
+  }
+
+  Entry *const data;
+};
+
+// A heap of Entry<T> that can either work as a min-heap or as a max-heap.
+template <HeapType heapType,
+          PreferIndices preferIndices,
+          template <typename>
+          class Data,
+          typename T>
+struct IndexedHeap {
+  typedef typename Data<T>::Entry Entry;
+  Data<T> const data;
+  __device__ IndexedHeap(Data<T> const &d) : data(d) {}
+
+  __device__ bool is_above(int left, int right) {
+    T left_value = data.get_value(left);
+    T right_value = data.get_value(right);
+    if (left_value == right_value) {
+      if (preferIndices == PreferIndices::kLower) {
+        return data.get_index(left) < data.get_index(right);
+      } else {
+        return data.get_index(left) > data.get_index(right);
+      }
+    }
+    if (heapType == HeapType::kMinHeap) {
+      return left_value < right_value;
+    } else {
+      return left_value > right_value;
+    }
+  }
+
+  __device__ void assign(int i, Entry const &entry) {
+    data[i] = entry;
+  }
+
+  __device__ void push_up(int i) {
+    int child = i;
+    int parent;
+    for (; child > 0; child = parent) {
+      parent = (child - 1) / 2;
+      if (!is_above(child, parent)) {
+        // Heap property satisfied.
+        break;
+      }
+      swap(child, parent);
+    }
+  }
+
+  __device__ void swap(int a, int b) {
+    auto tmp = data[b];
+    data[b] = data[a];
+    data[a] = tmp;
+  }
+
+  __device__ void push_root_down(int k) {
+    push_down(0, k);
+  }
+
+  // MAX-HEAPIFY in Cormen
+  __device__ void push_down(int node, int k) {
+    while (true) {
+      int const left = 2 * node + 1;
+      int const right = left + 1;
+      int smallest = node;
+      if (left < k && is_above(left, smallest)) {
+        smallest = left;
+      }
+      if (right < k && is_above(right, smallest)) {
+        smallest = right;
+      }
+      if (smallest == node) {
+        break;
+      }
+      swap(smallest, node);
+      node = smallest;
+    }
+  }
+
+  // BUILD-MAX-HEAPIFY in Cormen
+  __device__ void build(int k) {
+    for (int node = (k - 1) / 2; node >= 0; node--) {
+      push_down(node, k);
+    }
+  }
+
+  // HEAP-EXTRACT-MAX in Cormen
+  __device__ void remove_root(int k) {
+    data[0] = data[k - 1];
+    push_root_down(k - 1);
+  }
+
+  // in-place HEAPSORT in Cormen
+  // This method destroys the heap property.
+  __device__ void sort(int k) {
+    for (int slot = k - 1; slot > 0; slot--) {
+      // This is like remove_root but we insert the element at the end.
+      swap(slot, 0);
+      // Heap is now an element smaller.
+      push_root_down(/*k=*/slot);
+    }
+  }
+
+  __device__ void replace_root(Entry const &entry, int k) {
+    data[0] = entry;
+    push_root_down(k);
+  }
+
+  __device__ Entry const &root() {
+    return data[0];
+  }
+};
+
+template <HeapType heapType,
+          PreferIndices preferIndices,
+          template <typename>
+          class Data,
+          typename T>
+__device__ IndexedHeap<heapType, preferIndices, Data, T>
+    make_indexed_heap(typename Data<T>::Entry *data) {
+  return IndexedHeap<heapType, preferIndices, Data, T>{Data<T>{data}};
+}
+
+// heapArgTopK walks over [input, input+length) with `step_size` stride starting
+// at `start_index`. It builds a top-`k` heap that is stored in `heap_entries`
+// using `Accessor` to access elements in `heap_entries`. If sorted=true, the
+// elements will be sorted at the end.
+template <typename T, template <typename> class Data = LinearData>
+__device__ void heapArgTopK(T const *__restrict__ input,
+                            int length,
+                            int k,
+                            Entry<T> *__restrict__ heap_entries,
+                            bool sorted = false,
+                            int start_index = 0,
+                            int step_size = 1) {
+  assert(k <= length);
+
+  auto heap =
+      make_indexed_heap<HeapType::kMinHeap, PreferIndices::kHigher, Data, T>(
+          heap_entries);
+
+  int heap_end_index = start_index + k * step_size;
+  if (heap_end_index > length) {
+    heap_end_index = length;
+  }
+  // Initialize the min-heap.
+  for (int index = start_index, slot = 0; index < heap_end_index;
+       index += step_size, slot++) {
+    heap.assign(slot, {index, input[index]});
+  }
+
+  heap.build(k);
+
+  // Now iterate over the remaining items.
+  // If an item is smaller than the min element, it is not amongst the top k.
+  // Otherwise, replace the min element with it and push upwards.
+  for (int index = heap_end_index; index < length; index += step_size) {
+    // We prefer elements with lower indices. This is given here.
+    // Later elements automatically have higher indices, so can be discarded.
+    if (input[index] > heap.root().value) {
+      // This element should replace the min.
+      heap.replace_root({index, input[index]}, k);
+    }
+  }
+
+  // Sort if wanted.
+  if (sorted) {
+    heap.sort(k);
+  }
+}
+
+// mergeShards performs a top-k merge on `num_shards` many sorted streams that
+// are sorted and stored in `entries` in a strided way:
+// |s_1 1st|s_2 1st|...s_{num_shards} 1st|s_1 2nd|s_2 2nd|...
+// The overall top k elements are written to `top_k_values` and their indices
+// to top_k_indices.
+// `top_k_heap` is used as temporary storage for the merge heap.
+template <typename T>
+__device__ void mergeShards(int num_shards,
+                            int k,
+                            Entry<T> *__restrict__ entries,
+                            Entry<T> *__restrict__ top_k_heap,
+                            float *top_k_values,
+                            int *top_k_indices) {
+  // If k < num_shards, we can use a min-heap with k elements to get the top k
+  // of the sorted blocks.
+  // If k > num_shards, we can initialize a min-heap with the top element from
+  // each sorted block.
+  int const heap_size = k < num_shards ? k : num_shards;
+
+  // Min-heap part.
+  {
+    auto min_heap = IndexedHeap<HeapType::kMinHeap,
+                                PreferIndices::kHigher,
+                                IndirectLinearData,
+                                T>{IndirectLinearData<T>{top_k_heap, entries}};
+    // Initialize the heap as a min-heap.
+    for (int slot = 0; slot < heap_size; slot++) {
+      min_heap.assign(slot, {slot, entries[slot].value});
+    }
+    min_heap.build(heap_size);
+
+    // Now perform top k with the remaining shards (if num_shards > heap_size).
+    for (int shard = heap_size; shard < num_shards; shard++) {
+      auto const entry = entries[shard];
+      auto const root = min_heap.root();
+      if (entry.value < root.value) {
+        continue;
+      }
+      if (entry.value == root.value &&
+          entry.index > entries[root.index].index) {
+        continue;
+      }
+      // This element should replace the min.
+      min_heap.replace_root({shard, entry.value}, heap_size);
+    }
+  }
+
+  // Max-part.
+  {
+    // Turn the min-heap into a max-heap in-place.
+    auto max_heap = IndexedHeap<HeapType::kMaxHeap,
+                                PreferIndices::kLower,
+                                IndirectLinearData,
+                                T>{IndirectLinearData<T>{top_k_heap, entries}};
+    // Heapify into a max heap.
+    max_heap.build(heap_size);
+
+    // Now extract the minimum k-1 times.
+    // k is treated specially.
+    int const last_k = k - 1;
+    for (int rank = 0; rank < last_k; rank++) {
+      Entry<T> const &max_element = max_heap.root();
+      top_k_values[rank] = __half2float(max_element.value);
+      int shard_index = max_element.index;
+      top_k_indices[rank] = entries[shard_index].index;
+      int next_shard_index = shard_index + num_shards;
+      // For rank < k-1, each top k heap still contains at least 1 element,
+      // so we can draw a replacement.
+      max_heap.replace_root({next_shard_index, entries[next_shard_index].value},
+                            heap_size);
+    }
+
+    // rank == last_k.
+    Entry<T> const &max_element = max_heap.root();
+    top_k_values[last_k] = __half2float(max_element.value);
+    int shard_index = max_element.index;
+    top_k_indices[last_k] = entries[shard_index].index;
+  }
+}
+
+template <typename T>
+__global__ void argmax_forward_kernel(T const *__restrict__ input,
+                                      size_t shared_memory_size,
+                                      int length,
+                                      int k,
+                                      float *__restrict__ output,
+                                      int *__restrict__ indices) {
+  __shared__ char shared_memory[48 << 10];
+  int const batch_index = blockIdx.x;
+  T const *batch_input = input + batch_index * length;
+  int const thread_index = threadIdx.x;
+  int const thread_count = blockDim.x;
+  Entry<T> *shared_entries = (Entry<T> *)shared_memory;
+  heapArgTopK<T, StridedData>(
+      batch_input, length, k, shared_entries, true, thread_index, thread_count);
+  __syncthreads();
+  if (thread_index == 0) {
+    int const offset = batch_index * k;
+    auto batch_output = output + offset;
+    auto batch_indices = indices + offset;
+    Entry<T> *top_k_heap = shared_entries + thread_count * k;
+    mergeShards(thread_count,
+                k,
+                shared_entries,
+                top_k_heap,
+                batch_output,
+                batch_indices);
+  }
+}
+
+template <typename DT>
+__global__ void copy_result(hipcub::KeyValuePair<int, DT> *d_out,
+                            int *indices,
+                            float *prob_ptr,
+                            int batch_size,
+                            bool beam_search) {
+  CUDA_KERNEL_LOOP(i, batch_size) {
+    indices[i] = d_out[i].key;
+    if (beam_search) {
+      prob_ptr[i] = static_cast<float>(d_out[i].value);
+    }
+  }
+}
+
 /*static*/
 template <typename DT>
 void ArgMax::forward_kernel(ArgMaxMeta const *m,
                             DT *input_ptr,
                             int *indices_ptr,
                             float *prob_ptr,
-                            int *parent_ptr,
-                            int length,
-                            int batch_size,
-                            ffStream_t stream) {}
+                            int *parent,
+                            int const length,
+                            int const batch_size,
+                            hipStream_t stream) {
+  checkCUDA(get_legion_stream(&stream));
+  checkCUDNN(miopenSetStream(m->handle.dnn, stream));
+
+  if (m->beam_search) {
+    // set all parents id zero in arg top1 case.
+    checkCUDA(hipMemset(parent, 0, batch_size * sizeof(int)));
+  }
+  int num_shards = 0;
+  int k = 1;
+  {
+    constexpr auto shared_memory_size = 48 << 10;
+    auto const heap_size = k * sizeof(Entry<DT>);
+    // shared_memory_size = (num_shards + 1) * heap_size <=>
+    num_shards = shared_memory_size / heap_size - 1;
+    assert(num_shards > 0);
+    if (num_shards > CUDA_NUM_THREADS) {
+      num_shards = CUDA_NUM_THREADS;
+    }
+  }
+  // We are limited by the amount of shared memory we have per block.
+  size_t shared_memory_size = (num_shards + 1) * k * sizeof(Entry<DT>);
+  // size_t num_blocks = (batch_size + num_shards - 1) / num_shards;
+  size_t num_blocks = batch_size;
+  assert(num_shards >= (size_t)k);
+  num_shards = k;
+
+  hipLaunchKernelGGL(argmax_forward_kernel,
+                     num_blocks,
+                     num_shards,
+                     0,
+                     stream,
+                     input_ptr,
+                     shared_memory_size,
+                     length,
+                     k,
+                     prob_ptr,
+                     indices_ptr);
+}
 
 /*static*/
 void ArgMax::forward_kernel_wrapper(ArgMaxMeta const *m,
@@ -47,7 +443,32 @@ void ArgMax::forward_kernel_wrapper(ArgMaxMeta const *m,
     checkCUDA(hipEventRecord(t_start, stream));
   }
 
-  handle_unimplemented_hip_kernel(OP_RMS_NORM);
+  int length = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+
+  if (input.data_type == DT_HALF) {
+    ArgMax::forward_kernel<half>(m,
+                                 input.get_half_ptr(),
+                                 indices.get_int32_ptr(),
+                                 m->probs,
+                                 m->beam_search ? parent.get_int32_ptr()
+                                                : nullptr,
+                                 length,
+                                 batch_size,
+                                 stream);
+
+  } else if (input.data_type == DT_FLOAT) {
+    ArgMax::forward_kernel<float>(m,
+                                  input.get_float_ptr(),
+                                  indices.get_int32_ptr(),
+                                  m->probs,
+                                  m->beam_search ? parent.get_int32_ptr()
+                                                 : nullptr,
+                                  length,
+                                  batch_size,
+                                  stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
 
   if (m->profiling) {
     checkCUDA(hipEventRecord(t_end, stream));
@@ -67,8 +488,17 @@ ArgMaxMeta::ArgMaxMeta(FFHandler handler,
                        int batch_size,
                        int total_ele,
                        MemoryAllocator &gpu_mem_allocator)
-    : OpMeta(handler, op) {}
-
-ArgMaxMeta::~ArgMaxMeta(void) {}
-
+    : OpMeta(handler, op) {
+  DataType data_type = op->data_type;
+  size_t prob_size = batch_size;
+  assert(data_type == DT_FLOAT || data_type == DT_HALF);
+  size_t total_size = prob_size * sizeof(float);
+  gpu_mem_allocator.create_legion_instance(reserveInst, total_size);
+  probs = gpu_mem_allocator.allocate_instance<float>(prob_size);
+}
+ArgMaxMeta::~ArgMaxMeta(void) {
+  if (reserveInst != Realm::RegionInstance::NO_INST) {
+    reserveInst.destroy();
+  }
+}
 }; // namespace FlexFlow
\ No newline at end of file
diff --git a/src/ops/beam_topk.cpp b/src/ops/beam_topk.cpp
index 134b0c6abe..5ee260714d 100644
--- a/src/ops/beam_topk.cpp
+++ b/src/ops/beam_topk.cpp
@@ -683,23 +683,42 @@ BeamTopKMeta::BeamTopKMeta(FFHandler handler,
                            MemoryAllocator &gpu_mem_allocator)
     : OpMeta(handler) {
   DataType data_type = op->inputs[0]->data_type;
-  checkCUDA(hipMalloc(&parent_ids,
-                      sizeof(int) * BeamSearchBatchConfig::MAX_BEAM_WIDTH *
-                          BeamSearchBatchConfig::MAX_NUM_REQUESTS));
-  checkCUDA(hipMalloc(&acc_probs,
-                      sizeof(data_type_size(data_type)) *
-                          BeamSearchBatchConfig::MAX_BEAM_WIDTH *
-                          BeamSearchBatchConfig::MAX_NUM_REQUESTS));
-  checkCUDA(hipMalloc(&block_start_index,
-                      sizeof(int) * BeamSearchBatchConfig::MAX_NUM_TOKENS *
-                          BeamSearchBatchConfig::MAX_NUM_REQUESTS));
-  checkCUDA(hipMalloc(&request_id,
-                      sizeof(int) * BeamSearchBatchConfig::MAX_NUM_TOKENS *
-                          BeamSearchBatchConfig::MAX_NUM_REQUESTS));
-  checkCUDA(hipMalloc(&tokens_per_request,
-                      sizeof(int) * BeamSearchBatchConfig::MAX_NUM_TOKENS *
-                          BeamSearchBatchConfig::MAX_NUM_REQUESTS));
+  size_t parent_id_size = BeamSearchBatchConfig::MAX_BEAM_WIDTH *
+                          BeamSearchBatchConfig::MAX_NUM_REQUESTS;
+  size_t acc_probs_size = BeamSearchBatchConfig::MAX_BEAM_WIDTH *
+                          BeamSearchBatchConfig::MAX_NUM_REQUESTS;
+  size_t block_start_index_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
+                                  BeamSearchBatchConfig::MAX_NUM_REQUESTS;
+  size_t request_id_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
+                           BeamSearchBatchConfig::MAX_NUM_REQUESTS;
+  size_t tokens_per_request_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
+                                   BeamSearchBatchConfig::MAX_NUM_REQUESTS;
+  size_t totalSize = sizeof(int) * parent_id_size +
+                     data_type_size(data_type) * acc_probs_size +
+                     sizeof(int) * block_start_index_size +
+                     sizeof(int) * request_id_size +
+                     sizeof(int) * tokens_per_request_size;
+
+  gpu_mem_allocator.create_legion_instance(reserveInst, totalSize);
+  parent_ids = gpu_mem_allocator.allocate_instance<int>(parent_id_size);
+  if (data_type == DT_FLOAT) {
+    acc_probs = gpu_mem_allocator.allocate_instance<float>(acc_probs_size);
+  } else if (data_type == DT_HALF) {
+    acc_probs = gpu_mem_allocator.allocate_instance<half>(acc_probs_size);
+  } else {
+    assert(false);
+  }
+
+  block_start_index =
+      gpu_mem_allocator.allocate_instance<int>(block_start_index_size);
+  request_id = gpu_mem_allocator.allocate_instance<int>(request_id_size);
+  tokens_per_request =
+      gpu_mem_allocator.allocate_instance<int>(tokens_per_request_size);
 }
 
-BeamTopKMeta::~BeamTopKMeta(void) {}
+BeamTopKMeta::~BeamTopKMeta(void) {
+  if (reserveInst != Realm::RegionInstance::NO_INST) {
+    reserveInst.destroy();
+  }
+}
 }; // namespace FlexFlow
diff --git a/src/ops/fused.cpp b/src/ops/fused.cpp
index c717881e66..99c5bc2631 100644
--- a/src/ops/fused.cpp
+++ b/src/ops/fused.cpp
@@ -31,6 +31,7 @@
 #include "flexflow/ops/kernels/pool_2d_kernels.h"
 #include "flexflow/ops/kernels/reshape_kernels.h"
 #include "flexflow/ops/kernels/rms_norm_kernels.h"
+#include "flexflow/ops/kernels/softmax_kernels.h"
 #include "flexflow/ops/kernels/transpose_kernels.h"
 #include "flexflow/ops/layer_norm.h"
 #include "flexflow/ops/linear.h"
@@ -45,6 +46,7 @@ namespace FlexFlow {
 using Legion::Context;
 using Legion::coord_t;
 using Legion::Domain;
+using Legion::Future;
 using Legion::LogicalPartition;
 using Legion::LogicalRegion;
 using Legion::PhysicalRegion;
@@ -225,13 +227,16 @@ __host__ void FusedOp::forward_task(Task const *task,
                out_dim * batch_size);
         assert(my_input_accessor[0].domain.get_volume() == in_dim * batch_size);
         float const *bias_ptr = nullptr;
+        LinearMeta *m = (LinearMeta *)metas->meta[op];
         if (fused->op_num_weights[op] == 2) {
           assert(my_weight_accessor[1].domain.get_volume() == out_dim);
+          if (!m->add_bias_only_once || task->index_point.point_data[0] == 0) {
+            bias_ptr = my_weight_accessor[1].get_float_ptr();
+          }
           bias_ptr = my_weight_accessor[1].get_float_ptr();
         } else {
           assert(fused->op_num_weights[op] == 1);
         }
-        LinearMeta *m = (LinearMeta *)metas->meta[op];
         Kernels::Linear::forward_kernel_wrapper(
             m,
             my_input_accessor[0].get_float_ptr(),
@@ -298,8 +303,8 @@ __host__ void FusedOp::forward_task(Task const *task,
                                                        my_input_accessor[1],
                                                        my_output_accessor[0]);
         break;
-        break;
       }
+      case OP_GELU:
       case OP_RELU:
       case OP_SIGMOID:
       case OP_TANH:
@@ -339,6 +344,26 @@ __host__ void FusedOp::forward_task(Task const *task,
             my_input_accessor[0].domain.get_volume());
         break;
       }
+      case OP_SOFTMAX: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_accessor[0].domain.get_volume() ==
+               my_output_accessor[0].domain.get_volume());
+        SoftmaxMeta *m = (SoftmaxMeta *)metas->meta[op];
+        if (m->input_type == DT_HALF) {
+          Kernels::Softmax::forward_kernel_wrapper(
+              m,
+              my_input_accessor[0].get_half_ptr(),
+              my_output_accessor[0].get_half_ptr());
+        } else if (m->input_type == DT_FLOAT) {
+          Kernels::Softmax::forward_kernel_wrapper(
+              m,
+              my_input_accessor[0].get_float_ptr(),
+              my_output_accessor[0].get_float_ptr());
+        }
+        break;
+      }
       case OP_RESHAPE: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_weights[op] == 0);
@@ -395,7 +420,10 @@ __host__ void
   // const FusedOp* fused = (FusedOp*) task->args;
   FusedOpMeta const *metas = *((FusedOpMeta **)task->local_args);
   FusedOp const *fused = metas->fused_op;
-  BatchConfig const *bc = (BatchConfig *)task->args;
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_tokens == 0) {
+    return;
+  }
   assert(metas->numOperators == fused->numOperators);
   assert(regions.size() == task->regions.size());
   assert((int)regions.size() ==
@@ -516,13 +544,15 @@ __host__ void
                out_dim * batch_size);
         assert(my_input_accessor[0].domain.get_volume() == in_dim * batch_size);
         void const *bias_ptr = nullptr;
+        LinearMeta *m = (LinearMeta *)metas->meta[op];
         if (fused->op_num_weights[op] == 2) {
           assert(my_weight_accessor[1].domain.get_volume() == out_dim);
-          bias_ptr = my_weight_accessor[1].ptr;
+          if (!m->add_bias_only_once || task->index_point.point_data[0] == 0) {
+            bias_ptr = my_weight_accessor[1].ptr;
+          }
         } else {
           assert(fused->op_num_weights[op] == 1);
         }
-        LinearMeta *m = (LinearMeta *)metas->meta[op];
         assert(m->input_type[0] == my_input_accessor[0].data_type);
         assert(m->input_type[0] == my_output_accessor[0].data_type);
         batch_size = bc->num_active_tokens();
@@ -591,7 +621,6 @@ __host__ void
                                                        my_input_accessor[1],
                                                        my_output_accessor[0]);
         break;
-        break;
       }
       case OP_EMBEDDING: {
         assert(fused->op_num_inputs[op] == 1);
@@ -658,20 +687,32 @@ __host__ void
                                                    effective_batch_size);
         break;
       }
+      case OP_GELU:
       case OP_RELU:
       case OP_SIGMOID:
       case OP_TANH:
-      case OP_ELU: {
+      case OP_ELU:
+      case OP_SCALAR_TRUE_DIV: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_weights[op] == 0);
         assert(fused->op_num_outputs[op] == 1);
         assert(my_input_accessor[0].domain == my_output_accessor[0].domain);
         ElementUnaryMeta *m = (ElementUnaryMeta *)metas->meta[op];
-        ElementUnary::forward_kernel_wrapper(
-            m,
-            my_input_accessor[0].get_float_ptr(),
-            my_output_accessor[0].get_float_ptr(),
-            my_input_accessor[0].domain.get_volume());
+        if (m->data_type == DT_HALF) {
+          ElementUnary::forward_kernel_wrapper(
+              m,
+              my_input_accessor[0].get_half_ptr(),
+              my_output_accessor[0].get_half_ptr(),
+              my_input_accessor[0].domain.get_volume());
+        } else if (m->data_type == DT_FLOAT) {
+          ElementUnary::forward_kernel_wrapper(
+              m,
+              my_input_accessor[0].get_float_ptr(),
+              my_output_accessor[0].get_float_ptr(),
+              my_input_accessor[0].domain.get_volume());
+        } else {
+          assert(false && "Unsupported data type in ElementUnary forward");
+        }
         break;
       }
       case OP_RMS_NORM: {
@@ -711,8 +752,8 @@ __host__ void
         assert(fused->op_num_outputs[op] == 1);
         TreeIncMultiHeadSelfAttentionMeta *m =
             (TreeIncMultiHeadSelfAttentionMeta *)metas->meta[op];
-        TreeVerifyBatchConfig const *tree_bc =
-            (TreeVerifyBatchConfig *)task->args;
+        TreeVerifyBatchConfig const &tree_bc =
+            Future(task->futures[0]).get_result<TreeVerifyBatchConfig>();
         assert(fused->op_num_weights[op] == (1 + (int)(*m->bias)));
         GenericTensorAccessorR biases;
         if (*m->bias) {
@@ -721,7 +762,7 @@ __host__ void
         }
         TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
             m,
-            tree_bc,
+            &tree_bc,
             task->index_point.point_data[0],
             my_input_accessor[0],
             my_weight_accessor[0],
@@ -734,8 +775,10 @@ __host__ void
         assert(fused->op_num_outputs[op] == 1);
         SpecIncMultiHeadSelfAttentionMeta const *m =
             (SpecIncMultiHeadSelfAttentionMeta *)metas->meta[op];
-        BeamSearchBatchConfig const *beam_bc =
-            (BeamSearchBatchConfig *)task->args;
+        // BeamSearchBatchConfig const *beam_bc =
+        //     (BeamSearchBatchConfig *)task->args;
+        BeamSearchBatchConfig const &beam_bc =
+            Future(task->futures[0]).get_result<BeamSearchBatchConfig>();
         assert(fused->op_num_weights[op] == (1 + (int)(*m->bias)));
         GenericTensorAccessorR biases;
         if (*m->bias) {
@@ -744,7 +787,7 @@ __host__ void
         }
         SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
             m,
-            beam_bc,
+            &beam_bc,
             task->index_point.point_data[0],
             my_input_accessor[0],
             my_weight_accessor[0],
@@ -766,12 +809,32 @@ __host__ void
             m, my_input_accessor[0], my_output_accessor[0], gamma, beta);
         break;
       }
+      case OP_SOFTMAX: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_accessor[0].domain.get_volume() ==
+               my_output_accessor[0].domain.get_volume());
+        SoftmaxMeta *m = (SoftmaxMeta *)metas->meta[op];
+        if (m->input_type == DT_HALF) {
+          Kernels::Softmax::forward_kernel_wrapper(
+              m,
+              my_input_accessor[0].get_half_ptr(),
+              my_output_accessor[0].get_half_ptr());
+        } else if (m->input_type == DT_FLOAT) {
+          Kernels::Softmax::forward_kernel_wrapper(
+              m,
+              my_input_accessor[0].get_float_ptr(),
+              my_output_accessor[0].get_float_ptr());
+        }
+        break;
+      }
       case OP_ALLREDUCE: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
         AllReduceMeta const *m = (AllReduceMeta *)metas->meta[op];
-        Kernels::AllReduce::forward_kernel_wrapper(
-            m, my_input_accessor[0], my_output_accessor[0]);
+        Kernels::AllReduce::inference_kernel_wrapper(
+            m, bc, my_input_accessor[0], my_output_accessor[0]);
         break;
       }
       default: {
@@ -1103,6 +1166,7 @@ __host__ void FusedOp::backward_task(Task const *task,
             my_input_grad_accessor[1].get_float_ptr());
         break;
       }
+      case OP_GELU:
       case OP_RELU:
       case OP_SIGMOID:
       case OP_TANH:
diff --git a/src/ops/inc_multihead_self_attention.cpp b/src/ops/inc_multihead_self_attention.cpp
index 99f8f49abd..b4102a7dba 100644
--- a/src/ops/inc_multihead_self_attention.cpp
+++ b/src/ops/inc_multihead_self_attention.cpp
@@ -14,7 +14,11 @@
  */
 
 #include "flexflow/ops/inc_multihead_self_attention.h"
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/ops/kernels/decompress_kernels.h"
+#include "flexflow/ops/kernels/inc_multihead_self_attention_kernels.h"
 #include "flexflow/utils/hip_helper.h"
+#include <hip/hip_complex.h>
 #include <hip/hip_runtime.h>
 
 namespace FlexFlow {
@@ -23,6 +27,784 @@ namespace FlexFlow {
 using Legion::coord_t;
 using Legion::Memory;
 
+namespace Kernels {
+namespace IncMultiHeadAttention {
+
+template <typename DT>
+__global__ void apply_proj_bias_w(DT *input_ptr,
+                                  DT const *bias_ptr,
+                                  int num_tokens,
+                                  int qkv_weight_size,
+                                  int oProjSize) {
+  CUDA_KERNEL_LOOP(i, num_tokens * oProjSize) {
+    int bias_idx = qkv_weight_size + i % oProjSize;
+    input_ptr[i] += bias_ptr[bias_idx];
+  }
+}
+
+template <typename DT>
+__global__ void apply_proj_bias_qkv(DT *input_ptr,
+                                    DT const *bias_ptr,
+                                    int shard_id,
+                                    int num_tokens,
+                                    int qProjSize,
+                                    int kProjSize,
+                                    int vProjSize,
+                                    int global_num_q_heads,
+                                    int global_num_kv_heads,
+                                    int num_q_heads,
+                                    int num_kv_heads,
+                                    bool scaling_query,
+                                    float scaling_factor) {
+  CUDA_KERNEL_LOOP(i,
+                   num_tokens *
+                       (qProjSize * num_q_heads + kProjSize * num_kv_heads +
+                        vProjSize * num_kv_heads)) {
+    // for simplicity, assume q, k, v is in same shape
+    // 0->q, 1->k, 2->v
+    // int qkv_index = i / (num_tokens * qProjSize) % 3;
+
+    int qkv_index = i < num_tokens * qProjSize * num_q_heads
+                        ? 0
+                        : (i < num_tokens * (qProjSize * num_q_heads +
+                                             kProjSize * num_kv_heads)
+                               ? 1
+                               : 2);
+
+    int q_block_size = qProjSize * num_tokens * num_q_heads;
+    int k_block_size = kProjSize * num_tokens * num_kv_heads;
+
+    int bias_idx = 0;
+    if (qkv_index == 0) {
+      int head_idx = i / (num_tokens * qProjSize);
+      int global_head_idx = head_idx + shard_id * num_q_heads;
+      int global_i = i + shard_id * num_q_heads * num_tokens * qProjSize;
+      bias_idx = global_head_idx * qProjSize +
+                 (global_i % (num_tokens * (qProjSize)) % qProjSize);
+    } else {
+
+      int idx =
+          qkv_index == 1 ? i - q_block_size : i - q_block_size - k_block_size;
+      int pre_length = qkv_index == 1 ? qProjSize * global_num_q_heads
+                                      : qProjSize * global_num_q_heads +
+                                            kProjSize * global_num_kv_heads;
+
+      int head_idx = idx / (num_tokens * kProjSize);
+      int global_head_idx = head_idx + shard_id * num_kv_heads;
+      int global_idx = idx + shard_id * num_tokens * num_kv_heads * kProjSize;
+
+      bias_idx = pre_length + global_head_idx * kProjSize +
+                 (global_idx % (num_tokens * (qProjSize)) % qProjSize);
+    }
+
+    input_ptr[i] += bias_ptr[bias_idx];
+
+    if (scaling_query && qkv_index == 0) {
+      input_ptr[i] *= scaling_factor;
+    }
+  }
+}
+
+template <typename DT>
+__global__ void
+    apply_rotary_embedding_native(DT *input_ptr,
+                                  hipFloatComplex *complex_input,
+                                  BatchConfig::PerTokenInfo const *tokenInfos,
+                                  int qProjSize,
+                                  int kProjSize,
+                                  int num_q_heads,
+                                  int num_tokens,
+                                  int num_kv_heads,
+                                  int q_block_size,
+                                  int k_block_size,
+                                  int q_array_size) {
+  CUDA_KERNEL_LOOP(
+      i,
+      num_tokens * (qProjSize * num_q_heads + kProjSize * num_kv_heads) / 2) {
+    // create complex number
+    bool q_tensor = i < (q_array_size / 2);
+    int proj_size = q_tensor ? qProjSize : kProjSize;
+    int real_i = q_tensor ? i : i - q_array_size / 2;
+
+    int head_idx = real_i / (num_tokens * proj_size / 2);
+    int idx = real_i % (num_tokens * proj_size / 2);
+    int real_part_index = idx * 2 +
+                          head_idx * (q_tensor ? q_block_size : k_block_size) +
+                          (q_tensor ? 0 : q_array_size);
+
+    int complex_part_index = real_part_index + 1;
+
+    complex_input[i] = {input_ptr[real_part_index],
+                        input_ptr[complex_part_index]};
+
+    int token_idx =
+        (real_i - head_idx * (num_tokens * proj_size / 2)) / (proj_size / 2);
+    size_t pos = tokenInfos[token_idx].abs_depth_in_request;
+    int pos_i = real_i % (proj_size / 2);
+    float freq = pos * (1.0 / pow(10000.0, (float)2 * pos_i / proj_size));
+    hipFloatComplex complex_pos = {cos(freq), sin(freq)};
+
+    complex_input[i] = hipCmulf(complex_input[i], complex_pos);
+    input_ptr[real_part_index] = complex_input[i].x;
+    input_ptr[complex_part_index] = complex_input[i].y;
+  }
+}
+
+template <typename DT>
+__global__ void
+    apply_rotary_embedding_hf(DT *input_ptr,
+                              hipFloatComplex *complex_input,
+                              BatchConfig::PerTokenInfo const *tokenInfos,
+                              int qProjSize,
+                              int kProjSize,
+                              int num_q_heads,
+                              int num_tokens,
+                              int num_kv_heads,
+                              int q_block_size,
+                              int k_block_size,
+                              int q_array_size) {
+  CUDA_KERNEL_LOOP(
+      i,
+      num_tokens * (qProjSize * num_q_heads + kProjSize * num_kv_heads) / 2) {
+    // create complex number
+    bool q_tensor = i < (q_array_size / 2);
+    int proj_size = q_tensor ? qProjSize : kProjSize;
+    int real_i = q_tensor ? i : i - q_array_size / 2;
+
+    int head_idx = real_i / (num_tokens * proj_size / 2);
+    int idx = real_i % (num_tokens * proj_size / 2);
+    int token_idx =
+        (real_i - head_idx * (num_tokens * proj_size / 2)) / (proj_size / 2);
+
+    int real_part_index = idx + token_idx * (proj_size / 2) +
+                          head_idx * (q_tensor ? q_block_size : k_block_size) +
+                          (q_tensor ? 0 : q_array_size);
+    int complex_part_index = real_part_index + (proj_size / 2);
+
+    complex_input[i] = {input_ptr[real_part_index],
+                        input_ptr[complex_part_index]};
+
+    // get the freq_cis: shape 1 * (qProjSize/2) = 1 * 64
+    // apply a Cartesian coordinate transformation
+    // multiple with input & /copy back to q/k
+
+    // get position of token
+
+    // size_t pos = id_map[token_idx].token_position;
+    size_t pos = tokenInfos[token_idx].abs_depth_in_request;
+
+    // float before_real = complex_input[i].x, before_complex =
+    int pos_i = real_i % (proj_size / 2);
+    float freq = pos * (1.0 / pow(10000.0, (float)2 * pos_i / proj_size));
+    hipFloatComplex complex_pos = {cos(freq), sin(freq)};
+
+    complex_input[i] = hipCmulf(complex_input[i], complex_pos);
+    input_ptr[real_part_index] = complex_input[i].x;
+    input_ptr[complex_part_index] = complex_input[i].y;
+  }
+}
+
+template <typename DT>
+__global__ void store_kv_cache(DT const *devQKVProjArray,
+                               DT *kCache_ptr,
+                               DT *vCache_ptr,
+                               BatchConfig::PerTokenInfo const *tokenInfos,
+                               int qProjSize,
+                               int kProjSize,
+                               int vProjSize,
+                               int num_tokens,
+                               int num_q_heads,
+                               int num_kv_heads,
+                               int max_seq_len) {
+  CUDA_KERNEL_LOOP(i, num_tokens * (kProjSize + vProjSize) * num_kv_heads) {
+    int q_array_size = qProjSize * num_tokens * num_q_heads;
+    int k_array_size = kProjSize * num_tokens * num_kv_heads;
+
+    bool k_cache = i < k_array_size;
+    int real_i = k_cache ? i : i - k_array_size;
+
+    int proj_size = k_cache ? kProjSize : vProjSize;
+    int head_idx = real_i / (num_tokens * proj_size);
+    int token_idx = (real_i - head_idx * (num_tokens * proj_size)) / proj_size;
+    int data_idx = real_i % proj_size;
+
+    DT val = devQKVProjArray[q_array_size + (k_cache ? 0 : k_array_size) +
+                             head_idx * proj_size * num_tokens +
+                             token_idx * proj_size + data_idx];
+    int const req_id = tokenInfos[token_idx].request_index;
+    int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
+
+    DT *cache_ptr = k_cache ? kCache_ptr : vCache_ptr;
+    cache_ptr[req_id * (num_kv_heads * max_seq_len * proj_size) +
+              head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
+              data_idx] = val;
+  }
+}
+
+template <typename DT>
+void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
+                        BatchConfig const *bc,
+                        int shard_id,
+                        DT const *input_ptr,
+                        DT const *weight_ptr,
+                        DT *output_ptr,
+                        DT const *bias_ptr,
+                        hipStream_t stream) {
+
+  checkCUDA(hipblasSetStream(m->handle.blas, stream));
+  checkCUDNN(miopenSetStream(m->handle.dnn, stream));
+  DT alpha = 1.0f, beta = 0.0f;
+  assert(m->qSize == m->vSize && m->qSize == m->kSize);
+  hipblasDatatype_t hipblas_data_type = ff_to_cuda_datatype(m->output_type[0]);
+#if CUDA_VERSION >= 11000
+  // TODO: currently set the default to HIPBLAS_COMPUTE_16F for best performance
+  cublasComputeType_t compute_type = HIPBLAS_COMPUTE_16F;
+#else
+  hipblasDatatype_t compute_type = hipblas_data_type;
+#endif
+  // Compute (W^T)x matmul: einsum(ijkl,im->jmkl)
+  // Weights: qSize x qProjSize x 3 x num_q_heads
+  // Input: qSize x num_tokens
+  // Output >>> qProjSize x num_tokens x 3 x num_q_heads
+  int m_q = m->qProjSize;
+  int m_k = m->kProjSize;
+  int m_v = m->vProjSize;
+  assert(m_q == m_k && m_k == m_v); // keep things simple for now
+  int n = bc->num_active_tokens();
+  int k = m->qSize;
+  int m_ = m_q;
+  int lda = k, ldb = k, ldc = m_q;
+
+  size_t strideA = m_q * k; // query weight head size
+  size_t strideB = 0;       // input stays the same for all heads.
+  size_t strideC = m_q * n; // size of the output block for each head.
+
+  // compute QKV
+  checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
+                                        HIPBLAS_OP_T,
+                                        HIPBLAS_OP_N,
+                                        m_,
+                                        n,
+                                        k,
+                                        &alpha,
+                                        weight_ptr,
+                                        hipblas_data_type,
+                                        lda,
+                                        strideA,
+                                        input_ptr,
+                                        hipblas_data_type,
+                                        ldb,
+                                        strideB,
+                                        &beta,
+                                        output_ptr,
+                                        hipblas_data_type,
+                                        ldc,
+                                        strideC,
+                                        m->num_q_heads + m->num_kv_heads +
+                                            m->num_kv_heads,
+                                        compute_type,
+                                        HIPBLAS_GEMM_DEFAULT));
+
+  // apply rotary emmmbedding for q and k
+  // step1 change the k, v to complex tensor
+  int num_tokens = bc->num_active_tokens();
+  int parallelism = m->kProjSize * num_tokens * m->num_q_heads;
+  int q_block_size = m->qProjSize * num_tokens;
+  int k_block_size = m->kProjSize * num_tokens;
+  int q_array_size = m->qProjSize * num_tokens * m->num_q_heads;
+  // apply bias for q, k, v
+  if (*m->bias) {
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_proj_bias_qkv<DT>),
+                       GET_BLOCKS(parallelism),
+                       min(CUDA_NUM_THREADS, parallelism),
+                       0,
+                       stream,
+                       output_ptr,
+                       bias_ptr,
+                       shard_id,
+                       num_tokens,
+                       m->qProjSize,
+                       m->kProjSize,
+                       m->vProjSize,
+                       m->global_num_q_heads,
+                       m->global_num_kv_heads,
+                       m->num_q_heads,
+                       m->num_kv_heads,
+                       *m->scaling_query,
+                       m->scaling_factor);
+  }
+  if (*m->apply_rotary_embedding) {
+    /*q&k*/
+    parallelism =
+        num_tokens *
+        (m->qProjSize * m->num_q_heads + m->kProjSize * m->num_kv_heads) / 2;
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_rotary_embedding_hf<DT>),
+                       GET_BLOCKS(parallelism),
+                       min(CUDA_NUM_THREADS, parallelism),
+                       0,
+                       stream,
+                       output_ptr,
+                       m->complex_input,
+                       m->token_infos,
+                       m->qProjSize,
+                       m->kProjSize,
+                       m->num_q_heads,
+                       num_tokens,
+                       m->num_kv_heads,
+                       q_block_size,
+                       k_block_size,
+                       q_array_size);
+  }
+}
+
+template <typename DT>
+void update_kv_cache_kernel(IncMultiHeadSelfAttentionMeta const *m,
+                            BatchConfig const *bc,
+                            hipStream_t stream) {
+  int num_tokens = bc->num_active_tokens();
+  if (num_tokens > 0) {
+    int parallelism =
+        (m->kProjSize + m->vProjSize) * num_tokens * m->num_kv_heads;
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(store_kv_cache<DT>),
+                       GET_BLOCKS(parallelism),
+                       min(CUDA_NUM_THREADS, parallelism),
+                       0,
+                       stream,
+                       static_cast<DT *>(m->devQKVProjArray),
+                       static_cast<DT *>(m->keyCache),
+                       static_cast<DT *>(m->valueCache),
+                       m->token_infos,
+                       m->qProjSize,
+                       m->kProjSize,
+                       m->vProjSize,
+                       num_tokens,
+                       m->num_q_heads,
+                       m->num_kv_heads,
+                       BatchConfig::MAX_SEQ_LENGTH);
+  }
+}
+
+template <typename DT>
+void pre_build_weight_kernel(IncMultiHeadSelfAttentionMeta const *m,
+                             GenericTensorAccessorR const weight,
+                             DataType data_type,
+                             hipStream_t stream) {
+  // additional processing for weight uploading
+  // Note that we update weight_ptr and bias_ptr when uploading weight and
+  // bias
+  if (m->quantization_type != DT_NONE) {
+    // copy weight_ptr to quantized_weight_ptr, do compression and store in
+    // m->weight_ptr
+    hipMemcpyAsync(m->quantized_weight_ptr,
+                   weight.get_byte_ptr(),
+                   m->quantized_weightSize,
+                   hipMemcpyHostToDevice,
+                   stream);
+
+    if (m->quantization_type == DT_INT4) {
+      int parallelism = m->qProjSize * m->qSize * m->num_q_heads / 2;
+      decompress_int4_attention_weights<<<GET_BLOCKS(parallelism),
+                                          min(CUDA_NUM_THREADS, parallelism),
+                                          0,
+                                          stream>>>(
+          m->quantized_weight_ptr,
+          static_cast<DT *>(m->weight_ptr),
+          m->qProjSize,
+          m->qSize,
+          m->num_q_heads);
+    } else {
+      assert(m->quantization_type == DT_INT8);
+      int parallelism = m->qProjSize * m->qSize * m->num_q_heads;
+      decompress_int8_attention_weights<<<GET_BLOCKS(parallelism),
+                                          min(CUDA_NUM_THREADS, parallelism),
+                                          0,
+                                          stream>>>(
+          m->quantized_weight_ptr,
+          static_cast<DT *>(m->weight_ptr),
+          m->qProjSize,
+          m->qSize,
+          m->num_q_heads);
+    }
+  } else {
+    if (data_type == DT_FLOAT) {
+      hipMemcpyAsync(m->weight_ptr,
+                     weight.get_float_ptr(),
+                     m->weightSize,
+                     hipMemcpyHostToDevice,
+                     stream);
+    } else if (data_type == DT_HALF) {
+      hipMemcpyAsync(m->weight_ptr,
+                     weight.get_half_ptr(),
+                     m->weightSize,
+                     hipMemcpyHostToDevice,
+                     stream);
+    } else {
+      assert(false);
+    }
+  }
+}
+
+template <typename DT>
+void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
+                      BatchConfig const *bc,
+                      int shard_id,
+                      DT const *input_ptr,
+                      DT const *weight_ptr,
+                      DT *output_ptr,
+                      DT const *bias_ptr,
+                      hipStream_t stream) {
+  // here because we need postion info in infernece 1
+
+  if (m->offload && m->biasSize > 0) {
+    hipMemcpyAsync(
+        m->bias_ptr, bias_ptr, m->biasSize, hipMemcpyHostToDevice, stream);
+    bias_ptr = static_cast<DT *>(m->bias_ptr);
+  }
+  hipMemcpyAsync(m->token_infos,
+                 &(bc->tokensInfo),
+                 bc->num_active_tokens() * sizeof(BatchConfig::PerTokenInfo),
+                 hipMemcpyHostToDevice,
+                 stream);
+  // phase 1: Implement kernel to compute KQV for input tokens
+  compute_qkv_kernel(m,
+                     bc,
+                     shard_id,
+                     input_ptr,
+                     weight_ptr,
+                     static_cast<DT *>(m->devQKVProjArray),
+                     bias_ptr,
+                     stream);
+
+  // phase 2: Update key/val cache
+  update_kv_cache_kernel<DT>(m, bc, stream);
+
+  // phase 3: Compute attention score
+  // 3 kernels for pahse 3: matmul1 - softmax - matmal2
+  compute_attention_kernel(
+      m, bc, shard_id, output_ptr, bias_ptr, weight_ptr, stream);
+}
+
+} // namespace IncMultiHeadAttention
+} // namespace Kernels
+
+using namespace Kernels::IncMultiHeadAttention;
+
+template <typename DT>
+__global__ void fill_entries_above_diagonal(DT *matrix,
+                                            size_t num_rows,
+                                            size_t num_cols,
+                                            size_t num_q_heads,
+                                            size_t entries_above_diagonal,
+                                            DT value) {
+  CUDA_KERNEL_LOOP(i, entries_above_diagonal * num_q_heads) {
+    size_t head_idx = i / entries_above_diagonal;
+    size_t entry_idx = i % entries_above_diagonal;
+    size_t y = (-1 + sqrt(8 * (float)entry_idx + 1)) / 2;
+    size_t x = entry_idx - y * (y + 1) / 2;
+    y += (num_cols - num_rows) + 1;
+    matrix[head_idx * num_rows * num_cols + num_cols * y + x] = value;
+  }
+}
+
+template <typename DT>
+void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
+                              BatchConfig const *bc,
+                              int shard_id,
+                              DT *output_ptr,
+                              DT const *bias_ptr,
+                              DT const *weight_ptr,
+                              hipStream_t stream) {
+  checkCUDA(hipblasSetStream(m->handle.blas, stream));
+  checkCUDNN(miopenSetStream(m->handle.dnn, stream));
+  hipblasDatatype_t hipblas_data_type = ff_to_cuda_datatype(m->output_type[0]);
+  miopenDataType_t miopen_data_type = ff_to_cudnn_datatype(m->output_type[0]);
+  assert(data_type_size(m->output_type[0]) == sizeof(DT));
+#if CUDA_VERSION >= 11000
+  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
+  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+#else
+  hipblasDatatype_t compute_type = hipblas_data_type;
+#endif
+  // int num_requests = bc->num_active_requests();
+  int num_tokens = bc->num_active_tokens();
+  int tokens_previous_requests = 0;
+  int q_block_size = m->qProjSize * num_tokens;
+  int kt_block_size = m->kProjSize * BatchConfig::MAX_SEQ_LENGTH;
+  int kt_req_block_size = kt_block_size * m->num_kv_heads;
+  int vt_block_size = m->vProjSize * BatchConfig::MAX_SEQ_LENGTH;
+  int vt_req_block_size = vt_block_size * m->num_kv_heads;
+  assert(m->qProjSize == m->kProjSize);
+
+  for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+    int total_tokens = bc->requestsInfo[i].token_start_offset +
+                       bc->requestsInfo[i].num_tokens_in_batch;
+    // bc->token_last_available_idx[i] + 1;
+    // Compute (QK^T/sqrt(d_k))
+    // a flag of using this scaling alpha
+    int m_ = num_new_tokens;
+    int n = total_tokens;
+    int k = m->qProjSize;
+    int lda = k, ldb = k, ldc = m_;
+    int strideA = q_block_size;
+    int strideB = kt_block_size;
+    int strideC = num_new_tokens * total_tokens;
+    DT alpha = 1.0f, beta = 0.0f;
+    if (*m->qk_prod_scaling) {
+      alpha = static_cast<DT>(1.0f / sqrt(m->kProjSize));
+    }
+    // To get A, skip over Q entries from previous requests (same head)
+    DT const *A = static_cast<DT *>(m->devQKVProjArray) +
+                  tokens_previous_requests * m->qProjSize;
+    // To get B, skip over K entries from previous requests (all heads +
+    // padding)
+    DT const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
+    // To get C, skip over QK^T products from previous requests
+    DT *C = static_cast<DT *>(m->qk_prods);
+    if (m->num_kv_heads == m->num_q_heads) {
+      checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
+                                            HIPBLAS_OP_T,
+                                            HIPBLAS_OP_N,
+                                            m_,
+                                            n,
+                                            k,
+                                            &alpha,
+                                            A,
+                                            hipblas_data_type,
+                                            lda,
+                                            strideA,
+                                            B,
+                                            hipblas_data_type,
+                                            ldb,
+                                            strideB,
+                                            &beta,
+                                            C,
+                                            hipblas_data_type,
+                                            ldc,
+                                            strideC,
+                                            m->num_q_heads,
+                                            compute_type,
+                                            HIPBLAS_GEMM_DEFAULT));
+
+    } else {
+      strideB = 0;
+      // use hipblasGemmStridedBatchedEx
+      int one_step_heads = m->num_q_heads / m->num_kv_heads;
+      m_ = num_new_tokens;
+      n = total_tokens;
+      k = m->qProjSize;
+      lda = k, ldb = k, ldc = m_;
+      for (int step = 0; step < m->num_kv_heads; step++) {
+        checkCUDA(
+            hipblasGemmStridedBatchedEx(m->handle.blas,
+                                        HIPBLAS_OP_T,
+                                        HIPBLAS_OP_N,
+                                        m_,
+                                        n,
+                                        k,
+                                        &alpha,
+                                        A + step * strideA * one_step_heads,
+                                        hipblas_data_type,
+                                        lda,
+                                        strideA,
+                                        B + step * kt_block_size,
+                                        hipblas_data_type,
+                                        ldb,
+                                        strideB,
+                                        &beta,
+                                        C + step * strideC * one_step_heads,
+                                        hipblas_data_type,
+                                        ldc,
+                                        strideC,
+                                        one_step_heads,
+                                        compute_type,
+                                        HIPBLAS_GEMM_DEFAULT));
+      }
+    }
+    // Fill all elements above diagonal in qk prods with -inf to force
+    // causal attention.
+    assert(num_new_tokens <= total_tokens);
+    size_t entries_above_diagonal = num_new_tokens * (num_new_tokens - 1) / 2;
+    if (entries_above_diagonal > 0) {
+      size_t parallelism = m->num_q_heads * entries_above_diagonal;
+      hipLaunchKernelGGL(HIP_KERNEL_NAME(fill_entries_above_diagonal<DT>),
+                         GET_BLOCKS(parallelism),
+                         min((size_t)CUDA_NUM_THREADS, parallelism),
+                         0,
+                         stream,
+                         C,
+                         num_new_tokens,
+                         total_tokens,
+                         m->num_q_heads,
+                         entries_above_diagonal,
+                         static_cast<DT>(-INFINITY));
+    }
+    // Compute Softmax(QK^T/sqrt(d_k))
+    // Before modifying the parameters below, make sure to read the following
+    // description of the CUDNN_TENSOR_NCHW tensor layout, from
+    // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#cudnnTensorFormat_t:
+    // This tensor format specifies that the data is laid out in the following
+    // order: batch size, feature maps, rows, columns. The strides are
+    // implicitly defined in such a way that the data are contiguous in memory
+    // with no padding between images, feature maps, rows, and columns; the
+    // columns are the inner dimension and the images are the outermost
+    // dimension.
+    int n_param = m->num_q_heads;
+    int c_param = total_tokens;
+    int h_param = 1;
+    int w_param = num_new_tokens;
+    checkCUDNN(miopenSet4dTensorDescriptor(
+        m->qk_tensor, miopen_data_type, n_param, c_param, h_param, w_param));
+    float softmax_alpha = 1.0f, softmax_beta = 0.0f;
+    DT *C_softmax = static_cast<DT *>(m->qk_prods_softmax);
+    // The softmax operation below is executed according to the
+    // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
+    // softmax operation is computed per spatial location (H,W) per image (N)
+    // across dimension C.
+    checkCUDNN(miopenSoftmaxForward_V2(m->handle.dnn,
+                                       &softmax_alpha,
+                                       m->qk_tensor,
+                                       C,
+                                       &softmax_beta,
+                                       m->qk_tensor,
+                                       C_softmax,
+                                       MIOPEN_SOFTMAX_ACCURATE,
+                                       MIOPEN_SOFTMAX_MODE_CHANNEL));
+    // Matmul softmax(QK^T/sqrt(d_k)) by V
+    alpha = 1.0f, beta = 0.0f;
+    m_ = num_new_tokens;
+    n = m->vProjSize;
+    k = total_tokens;
+    lda = m_, ldb = n, ldc = m_;
+    strideA = num_new_tokens * total_tokens;
+    strideB = vt_block_size;
+    strideC = num_new_tokens * m->vProjSize;
+    // To get A, skip over softmax(QK^T/sqrt(d_k)) entries from previous
+    // requests (all heads)
+    A = C_softmax;
+    // To get B, skip over V^T entries from previous requests (all heads +
+    // padding)
+    B = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
+    // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
+    // requests
+    C = static_cast<DT *>(m->attn_heads) +
+        tokens_previous_requests * m->num_q_heads * m->vProjSize;
+
+    if (m->num_q_heads == m->num_kv_heads) {
+      checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
+                                            HIPBLAS_OP_N,
+                                            HIPBLAS_OP_T,
+                                            m_,
+                                            n,
+                                            k,
+                                            &alpha,
+                                            A,
+                                            hipblas_data_type,
+                                            lda,
+                                            strideA,
+                                            B,
+                                            hipblas_data_type,
+                                            ldb,
+                                            strideB,
+                                            &beta,
+                                            C,
+                                            hipblas_data_type,
+                                            ldc,
+                                            strideC,
+                                            m->num_q_heads,
+                                            compute_type,
+                                            HIPBLAS_GEMM_DEFAULT));
+    } else {
+      int one_step_heads = m->num_q_heads / m->num_kv_heads;
+      n = m->vProjSize;
+      lda = m_, ldb = n, ldc = m_;
+      strideA = num_new_tokens * total_tokens;
+      strideB = 0;
+      strideC = num_new_tokens * m->vProjSize;
+      for (int step = 0; step < m->num_kv_heads; step++) {
+        checkCUDA(
+            hipblasGemmStridedBatchedEx(m->handle.blas,
+                                        HIPBLAS_OP_N,
+                                        HIPBLAS_OP_T,
+                                        m_,
+                                        n,
+                                        k,
+                                        &alpha,
+                                        A + step * one_step_heads * strideA,
+                                        hipblas_data_type,
+                                        lda,
+                                        strideA,
+                                        B + step * vt_block_size,
+                                        hipblas_data_type,
+                                        ldb,
+                                        strideB,
+                                        &beta,
+                                        C + step * one_step_heads * strideC,
+                                        hipblas_data_type,
+                                        ldc,
+                                        strideC,
+                                        one_step_heads,
+                                        compute_type,
+                                        HIPBLAS_GEMM_DEFAULT));
+      }
+    }
+    // Project to output, save result directly on output tensor
+    alpha = 1.0f, beta = 0.0f;
+    m_ = m->oProjSize;
+    k = m->vProjSize * m->num_q_heads;
+    n = num_new_tokens;
+    lda = k, ldb = n, ldc = m_;
+    A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
+                                 m->kProjSize * m->num_kv_heads +
+                                 m->vProjSize * m->num_kv_heads);
+    B = C;
+    C = static_cast<DT *>(output_ptr) + tokens_previous_requests * m->oProjSize;
+
+    checkCUDA(hipblasGemmEx(m->handle.blas,
+                            HIPBLAS_OP_T,
+                            HIPBLAS_OP_T,
+                            m_,
+                            n,
+                            k,
+                            &alpha,
+                            A,
+                            hipblas_data_type,
+                            lda,
+                            B,
+                            hipblas_data_type,
+                            ldb,
+                            &beta,
+                            C,
+                            hipblas_data_type,
+                            ldc,
+                            compute_type,
+                            HIPBLAS_GEMM_DEFAULT));
+    tokens_previous_requests += num_new_tokens;
+  }
+
+  if (*m->bias && shard_id == 0) {
+    int parallelism = m->oProjSize * num_tokens;
+    int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
+                          m->kProjSize * m->global_num_kv_heads +
+                          m->vProjSize * m->global_num_kv_heads;
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_proj_bias_w<DT>),
+                       GET_BLOCKS(parallelism),
+                       min(CUDA_NUM_THREADS, parallelism),
+                       0,
+                       stream,
+                       output_ptr,
+                       bias_ptr,
+                       num_tokens,
+                       qkv_weight_size,
+                       m->oProjSize);
+  }
+
+  assert(tokens_previous_requests == num_tokens);
+}
+
 /*static*/
 void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     IncMultiHeadSelfAttentionMeta const *m,
@@ -34,6 +816,7 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     GenericTensorAccessorR const &bias) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
+  bool use_bias = *m->bias;
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
@@ -42,7 +825,46 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     checkCUDA(hipEventRecord(t_start, stream));
   }
 
-  handle_unimplemented_hip_kernel(OP_INC_MULTIHEAD_SELF_ATTENTION);
+  // assert(input.data_type == weight.data_type);
+  assert(input.data_type == output.data_type);
+  if (use_bias) {
+    assert(input.data_type == bias.data_type);
+  }
+
+  if (input.data_type == DT_HALF) {
+    if (m->offload) {
+      pre_build_weight_kernel<half>(m, weight, input.data_type, stream);
+    }
+    half const *bias_ptr =
+        use_bias ? bias.get_half_ptr() : static_cast<half const *>(nullptr);
+    Kernels::IncMultiHeadAttention::inference_kernel(
+        m,
+        bc,
+        shard_id,
+        input.get_half_ptr(),
+        m->offload ? static_cast<half *>(m->weight_ptr) : weight.get_half_ptr(),
+        output.get_half_ptr(),
+        bias_ptr,
+        stream);
+  } else if (input.data_type == DT_FLOAT) {
+    if (m->offload) {
+      pre_build_weight_kernel<float>(m, weight, input.data_type, stream);
+    }
+    float const *bias_ptr =
+        use_bias ? bias.get_float_ptr() : static_cast<float const *>(nullptr);
+    Kernels::IncMultiHeadAttention::inference_kernel(
+        m,
+        bc,
+        shard_id,
+        input.get_float_ptr(),
+        m->offload ? static_cast<float *>(m->weight_ptr)
+                   : weight.get_float_ptr(),
+        output.get_float_ptr(),
+        bias_ptr,
+        stream);
+  } else {
+    assert(false && "Unspported data type");
+  }
 
   if (m->profiling) {
     checkCUDA(hipEventRecord(t_end, stream));
@@ -66,11 +888,31 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     int num_samples,
     int _num_q_heads,
     int _num_kv_heads)
-    : OpMeta(handler, attn) {
-  hipStream_t stream;
-  checkCUDA(get_legion_stream(&stream));
-  checkCUDNN(miopenSetStream(handler.dnn, stream));
-}
+    : IncMultiHeadSelfAttentionMeta(handler,
+                                    INC_DECODING_MODE,
+                                    attn,
+                                    attn->qSize,
+                                    attn->kSize,
+                                    attn->vSize,
+                                    attn->qProjSize,
+                                    attn->kProjSize,
+                                    attn->vProjSize,
+                                    attn->oProjSize,
+                                    attn->apply_rotary_embedding,
+                                    attn->bias,
+                                    attn->scaling_query,
+                                    attn->qk_prod_scaling,
+                                    attn->add_bias_kv,
+                                    attn->scaling_factor,
+                                    weight,
+                                    gpu_mem_allocator,
+                                    num_samples,
+                                    attn->num_q_heads,
+                                    attn->num_kv_heads,
+                                    _num_q_heads,
+                                    _num_kv_heads,
+                                    attn->quantization_type,
+                                    attn->offload) {}
 
 IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     FFHandler handler,
@@ -102,6 +944,195 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDNN(miopenSetStream(handler.dnn, stream));
+  checkCUDNN(miopenCreateTensorDescriptor(&qk_tensor));
+  qSize = _qSize;
+  kSize = _kSize;
+  vSize = _vSize;
+  // assume dimensions match for now
+  assert(qSize == kSize);
+  assert(kSize == vSize);
+  qProjSize = _qProjSize;
+  kProjSize = _kProjSize;
+  assert(qProjSize == kProjSize); // required for attention QK^T matmul
+  vProjSize = _vProjSize;
+  oProjSize = _oProjSize;
+  size_t size_of_dt = data_type_size(attn->data_type);
+  quantization_type = _quantization_type;
+  offload = _offload;
+
+  global_num_q_heads = _global_num_q_heads;
+  global_num_kv_heads = _global_num_kv_heads;
+  num_q_heads = _num_q_heads;
+  num_kv_heads = _num_kv_heads;
+
+  weightSize =
+      ((qSize * qProjSize + oProjSize * (vProjSize > 0 ? vProjSize : vSize)) *
+           num_q_heads +
+       (kSize * kProjSize + vSize * vProjSize) * num_kv_heads) *
+      size_of_dt;
+  if (quantization_type != DT_NONE) {
+    quantized_weightSize = get_quantization_to_byte_size(
+        attn->data_type, quantization_type, weightSize);
+  }
+  biasSize = _bias ? oProjSize * size_of_dt * 4 : 0;
+  // has_load_weights = (bool *)calloc(1, sizeof(bool));
+  //*has_load_weights = false;
+  apply_rotary_embedding = (bool *)calloc(1, sizeof(bool));
+  *apply_rotary_embedding = _apply_rotary_embedding;
+  bias = (bool *)calloc(1, sizeof(bool));
+  *bias = _bias;
+  scaling_query = (bool *)calloc(1, sizeof(bool));
+  *scaling_query = _scaling_query;
+  scaling_factor = _scaling_factor;
+  qk_prod_scaling = (bool *)calloc(1, sizeof(bool));
+  *qk_prod_scaling = _qk_prod_scaling;
+  // Currently do not support adding bias to key/value projection
+  assert(!_add_bias_kv);
+
+  // allocate weight and bias in the reserve space for cpu offloading
+  if (offload) {
+    weight_ptr = gpu_mem_allocator.allocate_reserved_untyped(weightSize);
+    bias_ptr = gpu_mem_allocator.allocate_reserved_untyped(biasSize);
+  }
+
+  // allocate memory for the seqArray and reserve space
+  {
+    size_t qkv_max_proj_size =
+        BatchConfig::MAX_NUM_TOKENS *
+        (qProjSize * num_q_heads + kProjSize * num_kv_heads +
+         vProjSize * num_kv_heads);
+    size_t key_cache_size = 0, value_cache_size = 0;
+    switch (infer_mode) {
+      case INC_DECODING_MODE:
+      case TREE_VERIFY_MODE: {
+        key_cache_size = num_kv_heads * kProjSize *
+                         BatchConfig::MAX_NUM_REQUESTS *
+                         BatchConfig::MAX_SEQ_LENGTH;
+        value_cache_size = num_kv_heads * vProjSize *
+                           BatchConfig::MAX_NUM_REQUESTS *
+                           BatchConfig::MAX_SEQ_LENGTH;
+        break;
+      }
+      case BEAM_SEARCH_MODE: {
+        key_cache_size =
+            num_kv_heads * kProjSize * BeamSearchBatchConfig::MAX_NUM_REQUESTS *
+            BatchConfig::MAX_SEQ_LENGTH * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+        value_cache_size =
+            num_kv_heads * vProjSize * BeamSearchBatchConfig::MAX_NUM_REQUESTS *
+            BatchConfig::MAX_SEQ_LENGTH * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+        break;
+      }
+      default:
+        assert(false && "Unkown inference mode");
+    }
+    size_t tokeninfo_size = BatchConfig::MAX_NUM_TOKENS;
+    size_t qk_prod_size =
+        BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_SEQ_LENGTH * num_q_heads;
+    size_t attn_heads_size =
+        BatchConfig::MAX_NUM_TOKENS * num_q_heads * vProjSize;
+    size_t W_out_block_size = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
+    size_t W_out_contiguous_size = W_out_block_size * num_q_heads;
+    size_t complex_size =
+        (BatchConfig::MAX_NUM_TOKENS *
+         (qProjSize * num_q_heads + kProjSize * num_kv_heads)) /
+        2;
+    size_t totalSize =
+        (qkv_max_proj_size + key_cache_size + value_cache_size +
+         2 * qk_prod_size + attn_heads_size + W_out_contiguous_size) *
+            size_of_dt +
+        tokeninfo_size * sizeof(BatchConfig::PerTokenInfo) +
+        complex_size * sizeof(hipFloatComplex); // more components will
+                                                // be added here later
+    if (offload) {
+      // assert that we have enough reserved work space left
+      size_t totalSharedSize =
+          infer_mode == TREE_VERIFY_MODE
+              ? totalSize -
+                    (key_cache_size + value_cache_size + qkv_max_proj_size) *
+                        size_of_dt
+              : totalSize - (key_cache_size + value_cache_size) * size_of_dt;
+
+      size_t instance_size =
+          size_of_dt *
+          (infer_mode == TREE_VERIFY_MODE
+               ? key_cache_size + value_cache_size + qkv_max_proj_size
+               : key_cache_size + value_cache_size);
+
+      if (quantization_type != DT_NONE) {
+        totalSharedSize += quantized_weightSize;
+      }
+      assert(gpu_mem_allocator.reserved_total_size -
+                 gpu_mem_allocator.reserved_allocated_size >=
+             totalSharedSize);
+      gpu_mem_allocator.create_legion_instance(reserveInst, instance_size);
+    } else {
+      gpu_mem_allocator.create_legion_instance(reserveInst, totalSize);
+    }
+
+    // in tree_verify, enable devQKVProjArray;
+    if (!offload || infer_mode == TREE_VERIFY_MODE) {
+      devQKVProjArray = gpu_mem_allocator.allocate_instance_untyped(
+          qkv_max_proj_size * size_of_dt);
+    } else {
+      devQKVProjArray = gpu_mem_allocator.allocate_reserved_untyped(
+          qkv_max_proj_size * size_of_dt);
+      // offset += qkv_max_proj_size * size_of_dt;
+    }
+
+    // use key value cache in all mode.
+    keyCache = gpu_mem_allocator.allocate_instance_untyped(key_cache_size *
+                                                           size_of_dt);
+    valueCache = gpu_mem_allocator.allocate_instance_untyped(value_cache_size *
+                                                             size_of_dt);
+
+    if (offload) {
+      token_infos =
+          gpu_mem_allocator.allocate_reserved<BatchConfig::PerTokenInfo>(
+              tokeninfo_size);
+      // offset += sizeof(BatchConfig::PerTokenInfo) * tokeninfo_size;
+      qk_prods = gpu_mem_allocator.allocate_reserved_untyped(qk_prod_size *
+                                                             size_of_dt);
+      // offset += qk_prod_size * size_of_dt;
+      qk_prods_softmax = gpu_mem_allocator.allocate_reserved_untyped(
+          qk_prod_size * size_of_dt);
+      // offset += qk_prod_size * size_of_dt;
+      attn_heads = gpu_mem_allocator.allocate_reserved_untyped(attn_heads_size *
+                                                               size_of_dt);
+      // offset += attn_heads_size * size_of_dt;
+      W_out_contiguous = gpu_mem_allocator.allocate_reserved_untyped(
+          W_out_contiguous_size * size_of_dt);
+      // offset += W_out_contiguous_size * size_of_dt;
+      complex_input =
+          gpu_mem_allocator.allocate_reserved<hipFloatComplex>(complex_size);
+      // offset += complex_size * sizeof(hipFloatComplex);
+    } else {
+      token_infos =
+          gpu_mem_allocator.allocate_instance<BatchConfig::PerTokenInfo>(
+              tokeninfo_size);
+      qk_prods = gpu_mem_allocator.allocate_instance_untyped(qk_prod_size *
+                                                             size_of_dt);
+      qk_prods_softmax = gpu_mem_allocator.allocate_instance_untyped(
+          qk_prod_size * size_of_dt);
+      attn_heads = gpu_mem_allocator.allocate_instance_untyped(attn_heads_size *
+                                                               size_of_dt);
+      W_out_contiguous = gpu_mem_allocator.allocate_instance_untyped(
+          W_out_contiguous_size * size_of_dt);
+      complex_input =
+          gpu_mem_allocator.allocate_instance<hipFloatComplex>(complex_size);
+    }
+
+    // allocate more size for quantization data
+    if (quantization_type != DT_NONE) {
+      assert(offload);
+      quantized_weight_ptr =
+          gpu_mem_allocator.allocate_reserved<char>(quantized_weightSize);
+    }
+    if (!offload) {
+      assert(gpu_mem_allocator.reserved_total_size ==
+             gpu_mem_allocator.reserved_allocated_size);
+    }
+  }
+  hipStreamSynchronize(stream);
 }
 
 IncMultiHeadSelfAttentionMeta::~IncMultiHeadSelfAttentionMeta(void) {}
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index b694797830..37223e11c9 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -1010,20 +1010,10 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
 
   // allocate memory for the seqArray and reserve space
   {
-    // size_t qkv_proj_dim = qProjSize + kProjSize + vProjSize;
-    // size_t qkv_max_proj_size =
-    //     BatchConfig::MAX_NUM_TOKENS * qkv_proj_dim * num_q_heads;
-
     size_t qkv_max_proj_size =
         BatchConfig::MAX_NUM_TOKENS *
         (qProjSize * num_q_heads + kProjSize * num_kv_heads +
          vProjSize * num_kv_heads);
-    // std::cout << "num_kv_heads: " << BatchConfig::MAX_NUM_TOKENS << ", "
-    //           << qProjSize << ", " << kProjSize << ", " << vProjSize << ", "
-    //           << num_q_heads << ", " << num_kv_heads << ", " <<
-    //           qkv_max_proj_size
-    //           << std::endl;
-    // assert(false);
     size_t key_cache_size = 0, value_cache_size = 0;
     switch (infer_mode) {
       case INC_DECODING_MODE:
diff --git a/src/ops/kernels/decompress_kernels.cpp b/src/ops/kernels/decompress_kernels.cpp
new file mode 100644
index 0000000000..22bf93d449
--- /dev/null
+++ b/src/ops/kernels/decompress_kernels.cpp
@@ -0,0 +1,90 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+#include "flexflow/ops/kernels/decompress_kernels.h"
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/utils/hip_helper.h"
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::coord_t;
+using Legion::Memory;
+
+namespace Kernels {
+
+template <typename DT>
+__global__ void decompress_int4_general_weights(char const *input_weight_ptr,
+                                                DT *weight_ptr,
+                                                int in_dim,
+                                                int valueSize) {}
+
+template <typename DT>
+__global__ void decompress_int8_general_weights(char const *input_weight_ptr,
+                                                DT *weight_ptr,
+                                                int in_dim,
+                                                int valueSize) {}
+
+template <typename DT>
+__global__ void decompress_int4_attention_weights(char *input_weight_ptr,
+                                                  DT *weight_ptr,
+                                                  int qProjSize,
+                                                  int qSize,
+                                                  int num_heads) {}
+
+template <typename DT>
+__global__ void decompress_int8_attention_weights(char *input_weight_ptr,
+                                                  DT *weight_ptr,
+                                                  int qProjSize,
+                                                  int qSize,
+                                                  int num_heads) {}
+
+template __global__ void decompress_int4_general_weights<float>(
+    char const *input_weight_ptr, float *weight_ptr, int in_dim, int valueSize);
+template __global__ void decompress_int4_general_weights<half>(
+    char const *input_weight_ptr, half *weight_ptr, int in_dim, int valueSize);
+template __global__ void decompress_int8_general_weights<float>(
+    char const *input_weight_ptr, float *weight_ptr, int in_dim, int valueSize);
+template __global__ void decompress_int8_general_weights<half>(
+    char const *input_weight_ptr, half *weight_ptr, int in_dim, int valueSize);
+template __global__ void
+    decompress_int4_attention_weights<float>(char *input_weight_ptr,
+                                             float *weight_ptr,
+                                             int qProjSize,
+                                             int qSize,
+                                             int num_heads);
+
+template __global__ void
+    decompress_int4_attention_weights<half>(char *input_weight_ptr,
+                                            half *weight_ptr,
+                                            int qProjSize,
+                                            int qSize,
+                                            int num_heads);
+
+template __global__ void
+    decompress_int8_attention_weights<float>(char *input_weight_ptr,
+                                             float *weight_ptr,
+                                             int qProjSize,
+                                             int qSize,
+                                             int num_heads);
+
+template __global__ void
+    decompress_int8_attention_weights<half>(char *input_weight_ptr,
+                                            half *weight_ptr,
+                                            int qProjSize,
+                                            int qSize,
+                                            int num_heads);
+
+} // namespace Kernels
+}; // namespace FlexFlow
\ No newline at end of file
diff --git a/src/ops/kernels/rms_norm_kernels.cpp b/src/ops/kernels/rms_norm_kernels.cpp
index 03f49774c5..3f4952b4a6 100644
--- a/src/ops/kernels/rms_norm_kernels.cpp
+++ b/src/ops/kernels/rms_norm_kernels.cpp
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/ops/kernels/rms_norm_kernels.h"
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/ops/rms_norm.h"
 #include "flexflow/utils/hip_helper.h"
 #include <hip/hip_runtime.h>
@@ -21,15 +22,155 @@
 namespace FlexFlow {
 // declare Legion names
 using Legion::coord_t;
+#define C10_WARP_SIZE 32
+constexpr int kCUDABlockReduceNumThreads = 512;
+constexpr int kCUDANumThreads = 256;
 
 RMSNormMeta::RMSNormMeta(FFHandler handler,
                          RMSNorm const *rms,
                          MemoryAllocator &gpu_mem_allocator)
-    : OpMeta(handler, rms) {}
-RMSNormMeta::~RMSNormMeta(void) {}
+    : OpMeta(handler, rms) {
+  eps = rms->eps;
+  alpha = 1.0f;
+  beta = 0.0f;
+
+  in_dim = rms->data_dim;
+  batch_size = rms->effective_batch_size;
+  num_elements = in_dim * batch_size;
+
+  DataType data_type = rms->weights[0]->data_type;
+  size_t rms_ptr_size = batch_size;
+  size_t norm_ptr_size = num_elements;
+  size_t totalSize = (rms_ptr_size + norm_ptr_size) * data_type_size(data_type);
+  gpu_mem_allocator.create_legion_instance(reserveInst, totalSize);
+  rms_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      rms_ptr_size * data_type_size(data_type));
+  norm_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      norm_ptr_size * data_type_size(data_type));
+}
+RMSNormMeta::~RMSNormMeta(void) {
+  if (reserveInst != Realm::RegionInstance::NO_INST) {
+    reserveInst.destroy();
+  }
+}
 namespace Kernels {
 namespace RMSNorm {
 
+template <typename T>
+__device__ __forceinline__ T WARP_SHFL_DOWN(T value,
+                                            unsigned int delta,
+                                            int width = warpSize,
+                                            unsigned int mask = 0xffffffff) {
+#ifndef __HIP_PLATFORM_HCC__
+  return __shfl_down_sync(mask, value, delta, width);
+#else
+  return __shfl_down(value, delta, width);
+#endif
+}
+
+template <typename T>
+__inline__ __device__ T WarpReduceSum(T val) {
+#pragma unroll
+  for (int offset = (C10_WARP_SIZE >> 1); offset > 0; offset >>= 1) {
+    val += WARP_SHFL_DOWN(val, offset);
+  }
+  return val;
+}
+
+template <typename T>
+__inline__ __device__ T BlockReduceSum(T val, T *shared) {
+  int const lid = threadIdx.x % C10_WARP_SIZE;
+  int const wid = threadIdx.x / C10_WARP_SIZE;
+  val = WarpReduceSum(val);
+  __syncthreads();
+  if (lid == 0) {
+    shared[wid] = val;
+  }
+  __syncthreads();
+  val = (threadIdx.x < (blockDim.x / C10_WARP_SIZE)) ? shared[lid] : T(0);
+  if (wid == 0) {
+    val = WarpReduceSum(val);
+  }
+  return val;
+}
+
+template <typename T>
+__global__ void
+    RowwiseRootMeanSquareKernel(long long N, float eps, T const *X, T *rms) {
+  __shared__ float v_shared[C10_WARP_SIZE];
+  long long const i = blockIdx.x;
+  float sum = 0.0f;
+  for (long long j = threadIdx.x; j < N; j += blockDim.x) {
+    long long const index = i * N + j;
+    sum += (static_cast<float>(X[index]) * static_cast<float>(X[index]));
+  }
+  sum = BlockReduceSum<float>(sum,
+                              v_shared); // use BlockReduceSum() to sum X_ij^2
+
+  if (threadIdx.x == 0) {
+    rms[i] = static_cast<T>(rsqrt((sum / static_cast<float>(N)) + eps));
+  }
+}
+
+template <typename T>
+__global__ void NormKernel(int64_t N, T const *X, T const *rstd, T *Y) {
+  using T_ACC = T;
+  const int64_t i = blockIdx.x;
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
+    const int64_t index = i * N + j;
+    Y[index] = static_cast<T_ACC>(X[index]) * static_cast<T_ACC>(rstd[i]);
+  }
+}
+
+template <typename T>
+__global__ void elewise_apply_weights(int64_t batch_size,
+                                      int64_t in_dim,
+                                      T const *norm,
+                                      T const *weights,
+                                      T *output) {
+  CUDA_KERNEL_LOOP(i, batch_size * in_dim) {
+    output[i] = norm[i] * weights[i % in_dim];
+  }
+}
+
+template <typename T>
+void forward_kernel(RMSNormMeta const *m,
+                    T const *input_ptr,
+                    T const *weight_ptr,
+                    T *output_ptr,
+                    hipStream_t stream) {
+  int parallelism = m->batch_size * m->in_dim;
+  hipLaunchKernelGGL(HIP_KERNEL_NAME(RowwiseRootMeanSquareKernel<T>),
+                     m->batch_size,
+                     kCUDABlockReduceNumThreads,
+                     0,
+                     stream,
+                     m->in_dim,
+                     m->eps,
+                     input_ptr,
+                     static_cast<T *>(m->rms_ptr));
+
+  hipLaunchKernelGGL(HIP_KERNEL_NAME(NormKernel<T>),
+                     m->batch_size,
+                     kCUDANumThreads,
+                     0,
+                     stream,
+                     m->in_dim,
+                     input_ptr,
+                     static_cast<T *>(m->rms_ptr),
+                     static_cast<T *>(m->norm_ptr));
+  hipLaunchKernelGGL(HIP_KERNEL_NAME(elewise_apply_weights),
+                     GET_BLOCKS(parallelism),
+                     min(CUDA_NUM_THREADS, parallelism),
+                     0,
+                     stream,
+                     m->batch_size,
+                     m->in_dim,
+                     static_cast<T *>(m->norm_ptr),
+                     weight_ptr,
+                     output_ptr);
+}
+
 void forward_kernel_wrapper(RMSNormMeta const *m,
                             GenericTensorAccessorR const &input,
                             GenericTensorAccessorR const &weight,
@@ -44,7 +185,23 @@ void forward_kernel_wrapper(RMSNormMeta const *m,
     checkCUDA(hipEventRecord(t_start, stream));
   }
 
-  handle_unimplemented_hip_kernel(OP_RMS_NORM);
+  assert(output.data_type == input.data_type);
+  assert(weight.data_type == output.data_type);
+  if (output.data_type == DT_HALF) {
+    forward_kernel(m,
+                   input.get_half_ptr(),
+                   weight.get_half_ptr(),
+                   output.get_half_ptr(),
+                   stream);
+  } else if (output.data_type == DT_FLOAT) {
+    forward_kernel(m,
+                   input.get_float_ptr(),
+                   weight.get_float_ptr(),
+                   output.get_float_ptr(),
+                   stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
 
   if (m->profiling) {
     checkCUDA(hipEventRecord(t_end, stream));
diff --git a/src/ops/kernels/softmax.cpp b/src/ops/kernels/softmax.cpp
index 8599f09244..bd8b46116d 100644
--- a/src/ops/kernels/softmax.cpp
+++ b/src/ops/kernels/softmax.cpp
@@ -27,7 +27,8 @@ SoftmaxMeta::SoftmaxMeta(FFHandler handler,
                          Domain const &input_domain)
     : OpMeta(handler) {
   checkCUDNN(miopenCreateTensorDescriptor(&inputTensor));
-  checkCUDNN(cudnnSetTensorDescriptorFromDomain(inputTensor, input_domain));
+  checkCUDNN(
+      cudnnSetTensorDescriptorFromDomain4SoftMax(inputTensor, input_domain));
   dim = softmax->dim;
   profiling = softmax->profiling;
   std::strcpy(op_name, softmax->name);
diff --git a/src/ops/sampling.cpp b/src/ops/sampling.cpp
index c4aa3a804a..f76acc8e71 100644
--- a/src/ops/sampling.cpp
+++ b/src/ops/sampling.cpp
@@ -17,9 +17,96 @@
 #include "flexflow/ffconst_utils.h"
 #include "flexflow/utils/hip_helper.h"
 #include <hip/hip_runtime.h>
+#include <hipcub/hipcub.hpp>
 
 namespace FlexFlow {
 
+constexpr int SamplingNumThreads = 1024;
+struct BlockPrefixCallbackOp {
+  // Running prefix
+  float running_total;
+  // Constructor
+  __device__ BlockPrefixCallbackOp(float running_total)
+      : running_total(running_total) {}
+  // Callback operator to be entered by the first warp of threads in the block.
+  // Thread-0 is responsible for returning a value for seeding the block-wide
+  // scan.
+  __device__ float operator()(float block_aggregate) {
+    float old_prefix = running_total;
+    running_total += block_aggregate;
+    return old_prefix;
+  }
+};
+
+__global__ void init_idxs(int batch_size,
+                          int vocab_size,
+                          int total_eles,
+                          int *idx,
+                          int *begin_offset,
+                          int *end_offset) {
+  CUDA_KERNEL_LOOP(i, total_eles) {
+    idx[i] = i % vocab_size;
+    if (i % vocab_size == 0) {
+      begin_offset[i / vocab_size] = i;
+      end_offset[i / vocab_size] = i;
+    }
+  }
+}
+
+__global__ void
+    init_random_kernel(hiprandState *state, int batch_size, long rand) {
+  CUDA_KERNEL_LOOP(i, batch_size) {
+    hiprand_init(rand, i, 0, &state[i]);
+  }
+}
+
+// multinominal and gather
+template <typename DT, int BLOCK_SIZE>
+__global__ void sampling_topp_kernel(int batch_size,
+                                     int const vocab_size,
+                                     hiprandState *state,
+                                     DT *sorted_logits,
+                                     int *sorted_idx,
+                                     int *indices_ptr,
+                                     float topp) {
+  // int const vocab_id = threadIdx.x;
+  int const batch_idx = blockIdx.x;
+  __shared__ float random_n;
+  __shared__ unsigned long long result_idx;
+
+  // random num
+  if (threadIdx.x == 0) {
+    // number must < topp
+    random_n = hiprand_uniform(state + batch_idx) * topp;
+    // printf("batch idx: %d, random num%f\n", batch_idx, random_n);
+  }
+
+  __syncthreads();
+
+  // cumsum;
+  typedef hipcub::BlockScan<float, BLOCK_SIZE> BlockScan;
+  __shared__ typename BlockScan::TempStorage temp_storage;
+
+  int offset = batch_idx * vocab_size;
+  float prefix_sum = 0.0f;
+  BlockPrefixCallbackOp prefix_op(0);
+  result_idx = vocab_size - 1;
+
+  for (unsigned long long j = threadIdx.x; j < vocab_size; j += blockDim.x) {
+    float logit = (float)(sorted_logits[offset + j]);
+    BlockScan(temp_storage).InclusiveSum(logit, prefix_sum, prefix_op);
+    prefix_sum /= topp;
+    if (prefix_sum >= random_n) {
+      atomicMin(&result_idx, j);
+    }
+  }
+  indices_ptr[batch_idx] = sorted_idx[offset + result_idx];
+
+  // if (threadIdx.x == 0) {
+  //   printf("selected idx: %d, %d\n", blockIdx.x, result_idx);
+  // }
+}
+
 /*static*/
 template <typename DT>
 void Sampling::forward_kernel(SamplingMeta const *m,
@@ -28,7 +115,48 @@ void Sampling::forward_kernel(SamplingMeta const *m,
                               float const top_p,
                               int const length,
                               int const batch_size,
-                              hipStream_t stream) {}
+                              hipStream_t stream) {
+
+  size_t temp_storage_bytes = m->temp_storage_bytes;
+  // checkCUDA(hipcub::DeviceSegmentedRadixSort::SortPairsDescending(
+  //     m->d_temp_storage,
+  //     temp_storage_bytes,
+  //     input_ptr,
+  //     static_cast<DT *>(m->sorted_logits),
+  //     m->idx,
+  //     m->sorted_idx,
+  //     length * batch_size,
+  //     batch_size,
+  //     m->begin_offset,
+  //     m->end_offset + 1,
+  //     0,              // begin_bit
+  //     sizeof(DT) * 8, // end_bit = sizeof(KeyT) * 8
+  //     stream));
+  return;
+  int parallelism = batch_size;
+  hipLaunchKernelGGL(init_random_kernel,
+                     GET_BLOCKS(parallelism),
+                     min(CUDA_NUM_THREADS, parallelism),
+                     0,
+                     stream,
+                     m->state,
+                     batch_size,
+                     rand());
+  // sampling
+  hipLaunchKernelGGL(
+      HIP_KERNEL_NAME(sampling_topp_kernel<DT, SamplingNumThreads>),
+      batch_size,
+      SamplingNumThreads,
+      0,
+      stream,
+      batch_size,
+      length,
+      m->state,
+      static_cast<DT *>(m->sorted_logits),
+      m->sorted_idx,
+      indices_ptr,
+      top_p);
+}
 
 /*static*/
 void Sampling::forward_kernel_wrapper(SamplingMeta const *m,
@@ -63,7 +191,81 @@ SamplingMeta::SamplingMeta(FFHandler handler,
                            int total_ele,
                            GenericTensorAccessorW input,
                            MemoryAllocator &gpu_mem_allocator)
-    : OpMeta(handler, op) {}
+    : OpMeta(handler, op) {
+  DataType data_type = op->data_type;
+
+  size_t begin_offset_size, end_offset_size;
+  begin_offset_size = end_offset_size = batch_size + 1;
+  size_t idx_size, sorted_idx_size, sorted_logits_size;
+  idx_size = sorted_idx_size = sorted_logits_size = total_ele;
+  size_t state_size = batch_size;
+
+  size_t totalSize = sizeof(int) * (begin_offset_size + end_offset_size +
+                                    idx_size + sorted_idx_size) +
+                     data_type_size(data_type) * sorted_logits_size +
+                     sizeof(hiprandState) * state_size;
+  gpu_mem_allocator.create_legion_instance(reserveInst, totalSize);
+  begin_offset = gpu_mem_allocator.allocate_instance<int>(begin_offset_size);
+  end_offset = gpu_mem_allocator.allocate_instance<int>(end_offset_size);
+  idx = gpu_mem_allocator.allocate_instance<int>(idx_size);
+  sorted_idx = gpu_mem_allocator.allocate_instance<int>(sorted_idx_size);
+  sorted_logits = gpu_mem_allocator.allocate_instance_untyped(
+      sorted_logits_size * data_type_size(data_type));
+  state = gpu_mem_allocator.allocate_instance<hiprandState>(state_size);
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  // init offset
+  int parallelism = total_ele;
+  init_idxs<<<GET_BLOCKS(parallelism),
+              min(CUDA_NUM_THREADS, parallelism),
+              0,
+              stream>>>(batch_size,
+                        total_ele / batch_size,
+                        total_ele,
+                        idx,
+                        begin_offset,
+                        end_offset);
+
+  // init sort function
+  // if (data_type == DT_FLOAT) {
+  //   checkCUDA(hipcub::DeviceSegmentedRadixSort::SortPairsDescending(
+  //       d_temp_storage,
+  //       temp_storage_bytes,
+  //       input.get_float_ptr(),
+  //       input.get_float_ptr(),
+  //       idx,
+  //       idx,
+  //       total_ele,
+  //       batch_size,
+  //       begin_offset,
+  //       end_offset + 1,
+  //       0,                             // begin_bit
+  //       data_type_size(data_type) * 8, // end_bit = sizeof(KeyT) * 8
+  //       stream));
+  // } else if (data_type == DT_HALF) {
+  //   checkCUDA(hipcub::DeviceSegmentedRadixSort::SortPairsDescending(
+  //       d_temp_storage,
+  //       temp_storage_bytes,
+  //       input.get_half_ptr(),
+  //       input.get_half_ptr(),
+  //       idx,
+  //       idx,
+  //       total_ele,
+  //       batch_size,
+  //       begin_offset,
+  //       end_offset + 1,
+  //       0,                             // begin_bit
+  //       data_type_size(data_type) * 8, // end_bit = sizeof(KeyT) * 8
+  //       stream));
+  // } else {
+  //   assert(false && "input type in float and half");
+  // }
+
+  gpu_mem_allocator.create_legion_instance(reserveInst, temp_storage_bytes);
+  d_temp_storage =
+      gpu_mem_allocator.allocate_instance_untyped(temp_storage_bytes);
+}
 
 SamplingMeta::~SamplingMeta(void) {}
 }; // namespace FlexFlow
\ No newline at end of file
diff --git a/src/ops/spec_inc_multihead_self_attention.cpp b/src/ops/spec_inc_multihead_self_attention.cpp
index 8092ed8bd7..c9ef952d3b 100644
--- a/src/ops/spec_inc_multihead_self_attention.cpp
+++ b/src/ops/spec_inc_multihead_self_attention.cpp
@@ -14,7 +14,10 @@
  */
 
 #include "flexflow/ops/spec_inc_multihead_self_attention.h"
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/ops/kernels/inc_multihead_self_attention_kernels.h"
 #include "flexflow/utils/hip_helper.h"
+#include <hip/hip_complex.h>
 #include <hip/hip_runtime.h>
 
 namespace FlexFlow {
@@ -23,6 +26,551 @@ namespace FlexFlow {
 using Legion::coord_t;
 using Legion::Memory;
 
+using namespace Kernels::IncMultiHeadAttention;
+
+namespace Kernels {
+namespace SpecIncMultiHeadAttention {
+
+template <typename DT>
+__global__ void spec_store_kv_cache(
+    DT const *devQKVProjArray,
+    DT *kCache_ptr,
+    DT *vCache_ptr,
+    BatchConfig::PerTokenInfo *tokenInfos,
+    BatchConfig::PerRequestInfo *requestInfo,
+    BeamSearchBatchConfig::BeamSearchPerTokenInfo *beamTokenInfos,
+    BeamSearchBatchConfig::BeamSearchPerRequestInfo *beamRequestInfos,
+    int qProjSize,
+    int kProjSize,
+    int vProjSize,
+    int num_tokens,
+    int num_q_heads,
+    int num_kv_heads,
+    int max_seq_len,
+    int max_beam_width,
+    bool is_root) {
+  CUDA_KERNEL_LOOP(i, num_tokens * (kProjSize + vProjSize) * num_kv_heads) {
+    int q_array_size = qProjSize * num_tokens * num_q_heads;
+    int k_array_size = kProjSize * num_tokens * num_kv_heads;
+
+    bool k_cache = i < k_array_size;
+    int real_i = k_cache ? i : i - k_array_size;
+
+    int proj_size = k_cache ? kProjSize : vProjSize;
+    int head_idx = real_i / (num_tokens * proj_size);
+    int token_idx = (real_i - head_idx * (num_tokens * proj_size)) / proj_size;
+    int data_idx = real_i % proj_size;
+
+    // above no need to be changed
+    // int const req_id = id_map[token_idx].request_index;
+    // int const tok_id = id_map[token_idx].token_position;
+    // int const sub_req_id = id_map[token_idx].sub_request_index;
+    // int const parent_id = id_map[token_idx].parent_id;
+    // int const beam_depth = id_map[token_idx].beam_depth;
+    // int const beam_width = id_map[token_idx].beam_width;
+
+    DT val = devQKVProjArray[q_array_size + (k_cache ? 0 : k_array_size) +
+                             head_idx * proj_size * num_tokens +
+                             token_idx * proj_size + data_idx];
+
+    int const req_id = tokenInfos[token_idx].request_index;
+    int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
+    int const sub_req_id = beamTokenInfos[token_idx].sub_request_index;
+    int const parent_id = beamRequestInfos[req_id].parent_id[sub_req_id];
+    int const beam_depth = beamRequestInfos[req_id].current_depth;
+    int const beam_width = beamRequestInfos[req_id].beam_size;
+
+    // new token
+    int new_token_cache_idx = (req_id * max_beam_width + sub_req_id) *
+                                  (num_kv_heads * max_seq_len * proj_size) +
+                              head_idx * (max_seq_len * proj_size) +
+                              tok_id * proj_size + data_idx;
+
+    DT *cache_ptr = k_cache ? kCache_ptr : vCache_ptr;
+    cache_ptr[new_token_cache_idx] = val;
+
+    // replica in the root iteration
+    if (beam_depth == 1) {
+      for (int i = 1; i < beam_width; i++) {
+        cache_ptr[(req_id * max_beam_width + i) *
+                      (num_kv_heads * max_seq_len * proj_size) +
+                  head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
+                  data_idx] = val;
+      }
+    }
+
+    // naive cache stealing
+    if (sub_req_id != parent_id) {
+      if (data_idx == 0 && head_idx == 0 && k_cache) {
+        printf("cache stealing!, depth %d req_id %d sub_req_id %d, parentid "
+               "%d, tok_id %d\n",
+               beam_depth,
+               req_id,
+               sub_req_id,
+               parent_id,
+               tok_id);
+      }
+
+      for (int depth = 0; depth < beam_depth; depth++) {
+        int steal_token_idx = tok_id - beam_depth + depth;
+        int steal_from_idx = (req_id * max_beam_width + parent_id) *
+                                 (num_kv_heads * max_seq_len * proj_size) +
+                             head_idx * (max_seq_len * proj_size) +
+                             steal_token_idx * proj_size + data_idx;
+        int steal_to_idx = (req_id * max_beam_width + sub_req_id) *
+                               (num_kv_heads * max_seq_len * proj_size) +
+                           head_idx * (max_seq_len * proj_size) +
+                           steal_token_idx * proj_size + data_idx;
+        cache_ptr[steal_to_idx] = cache_ptr[steal_from_idx];
+
+        //   if(data_idx == 0 && head_idx == 0 && k_cache && req_id == 1){
+        //     printf("cache stealing kernel!, steal_token_idx %d\n",
+        //     steal_token_idx);
+        // }
+      }
+    }
+
+    // parallel cache stealing not yet implemented
+    // logic shld be
+    // launch spec_store_kv_cache with parallelism * current depth
+    // from the i here, get depth index
+    // if depth index not the current one, check if we need to steal
+    // steal if needed
+
+    // cache stealing theory
+    // identify which sub request does this token come from
+    // for initial token, 0
+    // for other, may 0,0,1/ 0,1,2/ 1,1,1 to get which cache to be reuse and
+    // which to be delete copy beam_size bunch of blocks when sub_req_id ==
+    // parent_id : like 0 -> 0, 1->1, 2->2, do nothing, just append the new k/v
+  }
+}
+
+template <typename DT>
+void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
+                            BeamSearchBatchConfig const *bc,
+                            hipStream_t stream) {
+  int num_tokens = bc->num_active_tokens();
+  int curr_depth = bc->beamRequestsInfo[0].current_depth;
+  // printf("curr depth: %d\n", curr_depth);
+  // assert(curr_depth < 3);
+  if (num_tokens > 0) {
+    int parallelism =
+        (m->kProjSize + m->vProjSize) * num_tokens * m->num_kv_heads;
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(spec_store_kv_cache<DT>),
+                       GET_BLOCKS(parallelism),
+                       min(CUDA_NUM_THREADS, parallelism),
+                       0,
+                       stream,
+                       static_cast<DT *>(m->devQKVProjArray),
+                       static_cast<DT *>(m->keyCache),
+                       static_cast<DT *>(m->valueCache),
+                       m->token_infos,
+                       m->request_infos,
+                       m->beam_token_infos,
+                       m->beam_request_infos,
+                       m->qProjSize,
+                       m->kProjSize,
+                       m->vProjSize,
+                       num_tokens,
+                       m->num_q_heads,
+                       m->num_kv_heads,
+                       BatchConfig::MAX_SEQ_LENGTH,
+                       BeamSearchBatchConfig::MAX_BEAM_WIDTH,
+                       /*root*/ curr_depth == 0);
+  }
+}
+
+template <typename DT>
+__global__ void spec_fill_entries_above_diagonal(DT *matrix,
+                                                 size_t new_tokens,
+                                                 size_t total_tokens_in_request,
+                                                 size_t num_q_heads,
+                                                 DT value) {
+  CUDA_KERNEL_LOOP(i, new_tokens * total_tokens_in_request * num_q_heads) {
+    // size_t head_idx = i / (new_tokens * total_tokens_in_request);
+    size_t src_idx = (i / new_tokens) % total_tokens_in_request;
+    size_t dst_idx = i % new_tokens + total_tokens_in_request - new_tokens;
+    // Casual Mask
+    if (src_idx > dst_idx) {
+      matrix[i] = value;
+    }
+  }
+}
+
+template <typename DT>
+void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
+                              BeamSearchBatchConfig const *bc,
+                              int shard_id,
+                              DT *output_ptr,
+                              DT const *bias_ptr,
+                              DT const *weight_ptr,
+                              hipStream_t stream) {
+  checkCUDA(hipblasSetStream(m->handle.blas, stream));
+  checkCUDNN(miopenSetStream(m->handle.dnn, stream));
+  hipblasDatatype_t hipblas_data_type = ff_to_cuda_datatype(m->output_type[0]);
+  miopenDataType_t miopen_data_type = ff_to_cudnn_datatype(m->output_type[0]);
+  assert(data_type_size(m->output_type[0]) == sizeof(DT));
+#if CUDA_VERSION >= 11000
+  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
+  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+#else
+  hipblasDatatype_t compute_type = hipblas_data_type;
+#endif
+  // int num_requests = bc->num_active_requests();
+  int num_tokens = bc->num_active_tokens();
+  int tokens_previous_requests = 0;
+  int tokens_prev_requests_squares = 0;
+  // int qkv_block_size =
+  //     (m->qProjSize + m->kProjSize + m->vProjSize) * num_tokens;
+  int q_block_size = m->qProjSize * num_tokens;
+
+  int kt_block_size = m->kProjSize * BatchConfig::MAX_SEQ_LENGTH;
+  int kt_req_block_size = kt_block_size * m->num_kv_heads;
+  int vt_block_size = m->vProjSize * BatchConfig::MAX_SEQ_LENGTH;
+  int vt_req_block_size = vt_block_size * m->num_kv_heads;
+  assert(m->qProjSize == m->kProjSize);
+
+  for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    for (int sub_req_id = 0; sub_req_id < bc->sub_requests[i]; sub_req_id++) {
+
+      // int num_new_tokens = bc->num_processing_tokens[i];
+      // int total_tokens = bc->token_last_available_idx[i] + 1;
+
+      int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+      int total_tokens = bc->requestsInfo[i].token_start_offset +
+                         bc->requestsInfo[i].num_tokens_in_batch;
+      // Compute (QK^T/sqrt(d_k))
+      int m_ = num_new_tokens;
+      int n = total_tokens;
+      int k = m->qProjSize;
+      int lda = k, ldb = k, ldc = m_;
+      int strideA = q_block_size;
+      int strideB = kt_block_size;
+      int strideC = num_new_tokens * total_tokens;
+
+      // a flag of using this scaling alpha
+      DT alpha = 1.0f, beta = 0.0f;
+      if (*m->qk_prod_scaling) {
+        alpha = static_cast<DT>(1.0f / sqrt(m->kProjSize));
+      }
+      // To get A, skip over Q entries from previous requests (same head)
+      DT const *A = static_cast<DT *>(m->devQKVProjArray) +
+                    tokens_previous_requests * m->qProjSize;
+      // To get B, skip over K entries from previous requests (all heads +
+      // padding)
+      DT const *B = static_cast<DT *>(m->keyCache) +
+                    (i * bc->MAX_BEAM_WIDTH + sub_req_id) * kt_req_block_size;
+
+      // if (i == 0 && sub_req_id == 0 &&
+      //     bc->beam_slots.at(0).current_depth == 1) {
+      //   int offset = (float *)B - m->keyCache;
+      //   printf("key cache offset %d\n", kt_req_block_size);
+      // }
+      // To get C, skip over QK^T products from previous requests
+      DT *C = static_cast<DT *>(m->qk_prods) +
+              m->num_q_heads * tokens_prev_requests_squares;
+
+      if (m->num_q_heads == m->num_kv_heads) {
+        checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
+                                              HIPBLAS_OP_T,
+                                              HIPBLAS_OP_N,
+                                              m_,
+                                              n,
+                                              k,
+                                              &alpha,
+                                              A,
+                                              hipblas_data_type,
+                                              lda,
+                                              strideA,
+                                              B,
+                                              hipblas_data_type,
+                                              ldb,
+                                              strideB,
+                                              &beta,
+                                              C,
+                                              hipblas_data_type,
+                                              ldc,
+                                              strideC,
+                                              m->num_q_heads,
+                                              compute_type,
+                                              HIPBLAS_GEMM_DEFAULT));
+      } else {
+        strideB = 0;
+        int one_step_heads = m->num_q_heads / m->num_kv_heads;
+        m_ = num_new_tokens;
+        n = total_tokens;
+        k = m->qProjSize;
+        lda = k, ldb = k, ldc = m_;
+        for (int step = 0; step < m->num_kv_heads; step++) {
+          checkCUDA(
+              hipblasGemmStridedBatchedEx(m->handle.blas,
+                                          HIPBLAS_OP_T,
+                                          HIPBLAS_OP_N,
+                                          m_,
+                                          n,
+                                          k,
+                                          &alpha,
+                                          A + step * strideA * one_step_heads,
+                                          hipblas_data_type,
+                                          lda,
+                                          strideA,
+                                          B + step * kt_block_size,
+                                          hipblas_data_type,
+                                          ldb,
+                                          strideB,
+                                          &beta,
+                                          C + step * strideC * one_step_heads,
+                                          hipblas_data_type,
+                                          ldc,
+                                          strideC,
+                                          one_step_heads,
+                                          compute_type,
+                                          HIPBLAS_GEMM_DEFAULT));
+        }
+      }
+
+      // Fill all elements above diagonal in qk prods with -inf to force
+      // causal attention.
+      assert(num_new_tokens <= total_tokens);
+      if (num_new_tokens > 1) {
+        size_t parallelism = m->num_q_heads * num_new_tokens * total_tokens;
+        hipLaunchKernelGGL(
+            HIP_KERNEL_NAME(spec_fill_entries_above_diagonal<DT>),
+            GET_BLOCKS(parallelism),
+            min((size_t)CUDA_NUM_THREADS, parallelism),
+            0,
+            stream,
+            C,
+            num_new_tokens,
+            total_tokens,
+            m->num_q_heads,
+            static_cast<DT>(-INFINITY));
+      }
+      // Compute Softmax(QK^T/sqrt(d_k))
+      // Before modifying the parameters below, make sure to read the following
+      // description of the CUDNN_TENSOR_NCHW tensor layout, from
+      // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#cudnnTensorFormat_t:
+      // This tensor format specifies that the data is laid out in the following
+      // order: batch size, feature maps, rows, columns. The strides are
+      // implicitly defined in such a way that the data are contiguous in memory
+      // with no padding between images, feature maps, rows, and columns; the
+      // columns are the inner dimension and the images are the outermost
+      // dimension.
+      int n_param = m->num_q_heads;
+      int c_param = total_tokens;
+      int h_param = 1;
+      int w_param = num_new_tokens;
+      checkCUDNN(miopenSet4dTensorDescriptor(
+          m->qk_tensor, miopen_data_type, n_param, c_param, h_param, w_param));
+      float softmax_alpha = 1.0f, softmax_beta = 0.0f;
+      DT *C_softmax = static_cast<DT *>(m->qk_prods_softmax) +
+                      m->num_q_heads * tokens_prev_requests_squares;
+      // The softmax operation below is executed according to the
+      // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
+      // softmax operation is computed per spatial location (H,W) per image (N)
+      // across dimension C.
+      checkCUDNN(miopenSoftmaxForward_V2(m->handle.dnn,
+                                         &softmax_alpha,
+                                         m->qk_tensor,
+                                         C,
+                                         &softmax_beta,
+                                         m->qk_tensor,
+                                         C_softmax,
+                                         MIOPEN_SOFTMAX_ACCURATE,
+                                         MIOPEN_SOFTMAX_MODE_CHANNEL));
+      // Matmul softmax(QK^T/sqrt(d_k)) by V
+      alpha = 1.0f, beta = 0.0f;
+      m_ = num_new_tokens;
+      n = m->vProjSize;
+      k = total_tokens;
+      lda = m_, ldb = n, ldc = m_;
+      strideA = num_new_tokens * total_tokens;
+      strideB = vt_block_size;
+      strideC = num_new_tokens * m->vProjSize;
+      // To get A, skip over softmax(QK^T/sqrt(d_k)) entries from previous
+      // requests (all heads)
+      A = C_softmax;
+      // To get B, skip over V^T entries from previous requests (all heads +
+      // padding)
+      B = static_cast<DT *>(m->valueCache) +
+          (i * bc->MAX_BEAM_WIDTH + sub_req_id) * vt_req_block_size;
+      // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
+      // requests
+      C = static_cast<DT *>(m->attn_heads) +
+          tokens_previous_requests * m->num_q_heads * m->vProjSize;
+
+      if (m->num_q_heads == m->num_kv_heads) {
+        checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
+                                              HIPBLAS_OP_N,
+                                              HIPBLAS_OP_T,
+                                              m_,
+                                              n,
+                                              k,
+                                              &alpha,
+                                              A,
+                                              hipblas_data_type,
+                                              lda,
+                                              strideA,
+                                              B,
+                                              hipblas_data_type,
+                                              ldb,
+                                              strideB,
+                                              &beta,
+                                              C,
+                                              hipblas_data_type,
+                                              ldc,
+                                              strideC,
+                                              m->num_q_heads,
+                                              compute_type,
+                                              HIPBLAS_GEMM_DEFAULT));
+      } else {
+        int one_step_heads = m->num_q_heads / m->num_kv_heads;
+        n = m->vProjSize;
+        lda = m_, ldb = n, ldc = m_;
+        strideA = num_new_tokens * total_tokens;
+        strideB = 0;
+        strideC = num_new_tokens * m->vProjSize;
+        for (int step = 0; step < m->num_kv_heads; step++) {
+          checkCUDA(
+              hipblasGemmStridedBatchedEx(m->handle.blas,
+                                          HIPBLAS_OP_N,
+                                          HIPBLAS_OP_T,
+                                          m_,
+                                          n,
+                                          k,
+                                          &alpha,
+                                          A + step * one_step_heads * strideA,
+                                          hipblas_data_type,
+                                          lda,
+                                          strideA,
+                                          B + step * vt_block_size,
+                                          hipblas_data_type,
+                                          ldb,
+                                          strideB,
+                                          &beta,
+                                          C + step * one_step_heads,
+                                          hipblas_data_type,
+                                          ldc,
+                                          strideC,
+                                          one_step_heads,
+                                          compute_type,
+                                          HIPBLAS_GEMM_DEFAULT));
+        }
+      }
+
+      // Project to output, save result directly on output tensor
+      alpha = 1.0f, beta = 0.0f;
+      m_ = m->oProjSize;
+      k = m->vProjSize * m->num_q_heads;
+      n = num_new_tokens;
+      lda = k, ldb = n, ldc = m_;
+      A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
+                                   m->kProjSize * m->num_kv_heads +
+                                   m->vProjSize * m->num_kv_heads);
+      B = C;
+      C = static_cast<DT *>(output_ptr) +
+          tokens_previous_requests * m->oProjSize;
+
+      checkCUDA(hipblasGemmEx(m->handle.blas,
+                              HIPBLAS_OP_T,
+                              HIPBLAS_OP_T,
+                              m_,
+                              n,
+                              k,
+                              &alpha,
+                              A,
+                              hipblas_data_type,
+                              lda,
+                              B,
+                              hipblas_data_type,
+                              ldb,
+                              &beta,
+                              C,
+                              hipblas_data_type,
+                              ldc,
+                              compute_type,
+                              HIPBLAS_GEMM_DEFAULT));
+      tokens_previous_requests += num_new_tokens;
+      tokens_prev_requests_squares += num_new_tokens * total_tokens;
+    }
+  }
+  if (*m->bias && shard_id == 0) {
+    int parallelism = m->oProjSize * num_tokens;
+    int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
+                          m->kProjSize * m->global_num_kv_heads +
+                          m->vProjSize * m->global_num_kv_heads;
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_proj_bias_w<DT>),
+                       GET_BLOCKS(parallelism),
+                       min(CUDA_NUM_THREADS, parallelism),
+                       0,
+                       stream,
+                       output_ptr,
+                       bias_ptr,
+                       num_tokens,
+                       qkv_weight_size,
+                       m->oProjSize);
+  }
+
+  assert(tokens_previous_requests == num_tokens);
+}
+
+template <typename DT>
+void inference_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
+                      BeamSearchBatchConfig const *bc,
+                      int shard_id,
+                      DT const *input_ptr,
+                      DT const *weight_ptr,
+                      DT *output_ptr,
+                      DT const *bias_ptr,
+                      hipStream_t stream) {
+  // here because we need postion info in infernece 1
+  hipMemcpyAsync(m->token_infos,
+                 &(bc->tokensInfo),
+                 bc->MAX_NUM_TOKENS * sizeof(BatchConfig::PerTokenInfo),
+                 hipMemcpyHostToDevice,
+                 stream);
+  hipMemcpyAsync(m->request_infos,
+                 &(bc->requestsInfo),
+                 bc->MAX_NUM_REQUESTS * sizeof(BatchConfig::PerRequestInfo),
+                 hipMemcpyHostToDevice,
+                 stream);
+  hipMemcpyAsync(m->beam_token_infos,
+                 &(bc->beamTokenInfo),
+                 bc->MAX_NUM_TOKENS * bc->MAX_BEAM_WIDTH *
+                     sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo),
+                 hipMemcpyHostToDevice,
+                 stream);
+  hipMemcpyAsync(m->beam_request_infos,
+                 &(bc->beamRequestsInfo),
+                 bc->MAX_NUM_REQUESTS *
+                     sizeof(BeamSearchBatchConfig::BeamSearchPerRequestInfo),
+                 hipMemcpyHostToDevice,
+                 stream);
+  // phase 1: Implement kernel to compute KQV for input tokens
+  compute_qkv_kernel(m,
+                     bc,
+                     shard_id,
+                     input_ptr,
+                     weight_ptr,
+                     static_cast<DT *>(m->devQKVProjArray),
+                     bias_ptr,
+                     stream);
+  // phase 2: Update key/val cache
+  update_kv_cache_kernel<DT>(m, bc, stream);
+
+  // phase 3: Compute attention score
+  // 3 kernels for pahse 3: matmul1 - softmax - matmal2
+  compute_attention_kernel(
+      m, bc, shard_id, output_ptr, bias_ptr, weight_ptr, stream);
+}
+
+} // namespace SpecIncMultiHeadAttention
+} // namespace Kernels
+
 /*static*/
 void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
     SpecIncMultiHeadSelfAttentionMeta const *m,
@@ -34,6 +582,7 @@ void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
     GenericTensorAccessorR const &bias) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
+  bool use_bias = *m->bias;
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
@@ -42,7 +591,37 @@ void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
     checkCUDA(hipEventRecord(t_start, stream));
   }
 
-  handle_unimplemented_hip_kernel(OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION);
+  assert(input.data_type == weight.data_type);
+  assert(input.data_type == output.data_type);
+  if (use_bias) {
+    assert(input.data_type == bias.data_type);
+  }
+
+  if (input.data_type == DT_HALF) {
+    half const *bias_ptr =
+        use_bias ? bias.get_half_ptr() : static_cast<half const *>(nullptr);
+    Kernels::SpecIncMultiHeadAttention::inference_kernel(m,
+                                                         bc,
+                                                         shard_id,
+                                                         input.get_half_ptr(),
+                                                         weight.get_half_ptr(),
+                                                         output.get_half_ptr(),
+                                                         bias_ptr,
+                                                         stream);
+  } else if (input.data_type == DT_FLOAT) {
+    float const *bias_ptr =
+        use_bias ? bias.get_float_ptr() : static_cast<float const *>(nullptr);
+    Kernels::SpecIncMultiHeadAttention::inference_kernel(m,
+                                                         bc,
+                                                         shard_id,
+                                                         input.get_float_ptr(),
+                                                         weight.get_float_ptr(),
+                                                         output.get_float_ptr(),
+                                                         bias_ptr,
+                                                         stream);
+  } else {
+    assert(false && "Unspported data type");
+  }
 
   if (m->profiling) {
     checkCUDA(hipEventRecord(t_end, stream));
@@ -52,9 +631,6 @@ void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
     checkCUDA(hipEventDestroy(t_start));
     checkCUDA(hipEventDestroy(t_end));
     printf("SpecIncMultiHeadSelfAttention forward time = %.2fms\n", elapsed);
-    // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
-    // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
-    // acc_output.rect, "[Attention:forward:output]");
   }
 }
 
@@ -94,8 +670,53 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDNN(miopenSetStream(handler.dnn, stream));
+
+  // allocate memory for the seqArray and reserve space
+  {
+    size_t beam_tokeninfo_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
+                                 BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+    size_t requestinfo_size = BeamSearchBatchConfig::MAX_NUM_REQUESTS;
+    size_t beam_requestinfo_size = BeamSearchBatchConfig::MAX_NUM_REQUESTS;
+    size_t total_size =
+        requestinfo_size * sizeof(BatchConfig::PerRequestInfo) +
+        beam_tokeninfo_size *
+            sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo) +
+        beam_requestinfo_size *
+            sizeof(BeamSearchBatchConfig::
+                       BeamSearchPerRequestInfo); // more components will
+                                                  // be added here later
+
+    // We always directly allocate memory for small speculative models
+    gpu_mem_allocator.create_legion_instance(beam_search_reserve_inst,
+                                             total_size);
+    beam_token_infos =
+        gpu_mem_allocator
+            .allocate_instance<BeamSearchBatchConfig::BeamSearchPerTokenInfo>(
+                beam_tokeninfo_size);
+    // offset += beam_tokeninfo_size *
+    //           sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo);
+    request_infos =
+        gpu_mem_allocator.allocate_instance<BatchConfig::PerRequestInfo>(
+            requestinfo_size);
+    // offset += requestinfo_size * sizeof(BatchConfig::PerRequestInfo);
+    beam_request_infos =
+        gpu_mem_allocator
+            .allocate_instance<BeamSearchBatchConfig::BeamSearchPerRequestInfo>(
+                beam_requestinfo_size);
+    // offset += beam_requestinfo_size *
+    //           sizeof(BeamSearchBatchConfig::BeamSearchPerRequestInfo);
+    // assert(offset == total_size);
+    assert(gpu_mem_allocator.instance_total_size ==
+           gpu_mem_allocator.instance_allocated_size);
+  }
+
+  hipStreamSynchronize(stream);
 }
 
-SpecIncMultiHeadSelfAttentionMeta::~SpecIncMultiHeadSelfAttentionMeta(void) {}
+SpecIncMultiHeadSelfAttentionMeta::~SpecIncMultiHeadSelfAttentionMeta(void) {
+  if (beam_search_reserve_inst != Realm::RegionInstance::NO_INST) {
+    beam_search_reserve_inst.destroy();
+  }
+}
 
 }; // namespace FlexFlow
diff --git a/src/ops/tree_inc_multihead_self_attention.cpp b/src/ops/tree_inc_multihead_self_attention.cpp
index dc68a54bf2..fbd6d1cc48 100644
--- a/src/ops/tree_inc_multihead_self_attention.cpp
+++ b/src/ops/tree_inc_multihead_self_attention.cpp
@@ -14,7 +14,10 @@
  */
 
 #include "flexflow/ops/tree_inc_multihead_self_attention.h"
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/ops/kernels/inc_multihead_self_attention_kernels.h"
 #include "flexflow/utils/hip_helper.h"
+#include <hip/hip_complex.h>
 #include <hip/hip_runtime.h>
 
 namespace FlexFlow {
@@ -23,6 +26,561 @@ namespace FlexFlow {
 using Legion::coord_t;
 using Legion::Memory;
 
+using namespace Kernels::IncMultiHeadAttention;
+
+namespace Kernels {
+namespace TreeIncMultiHeadAttention {
+
+template <typename DT>
+__global__ void commit_tokens_kernel(
+    DT const *devQKVProjArray,
+    DT *kCache_ptr,
+    DT *vCache_ptr,
+    TreeVerifyBatchConfig::CommittedTokensInfo const *committedTokenInfos,
+    int qProjSize,
+    int kProjSize,
+    int vProjSize,
+    int num_tokens_to_commit,
+    int num_active_tokens_in_last_batch,
+    int num_q_heads,
+    int num_kv_heads,
+    int max_seq_len) {
+
+  CUDA_KERNEL_LOOP(
+      i, num_tokens_to_commit * (kProjSize + vProjSize) * num_kv_heads) {
+    bool k_cache = i < (num_tokens_to_commit * kProjSize * num_kv_heads);
+    int real_i =
+        k_cache ? i : i - (num_tokens_to_commit * kProjSize * num_kv_heads);
+
+    int proj_size = k_cache ? kProjSize : vProjSize;
+    int data_idx = real_i % proj_size;
+    int head_idx = real_i / (num_tokens_to_commit * proj_size);
+    int token_pos =
+        (real_i - head_idx * (num_tokens_to_commit * proj_size)) / proj_size;
+    int token_idx_in_last_batch = committedTokenInfos[token_pos].token_index;
+    assert(token_idx_in_last_batch < num_active_tokens_in_last_batch);
+
+    int q_array_size =
+        qProjSize * num_active_tokens_in_last_batch * num_q_heads;
+    int k_array_size =
+        kProjSize * num_active_tokens_in_last_batch * num_kv_heads;
+
+    DT val =
+        devQKVProjArray[q_array_size + (k_cache ? 0 : k_array_size) +
+                        head_idx * proj_size * num_active_tokens_in_last_batch +
+                        token_idx_in_last_batch * proj_size + data_idx];
+    int const req_id = committedTokenInfos[token_pos].request_index;
+    int const tok_id = committedTokenInfos[token_pos].token_depth;
+
+    DT *cache_ptr = k_cache ? kCache_ptr : vCache_ptr;
+    cache_ptr[req_id * (num_kv_heads * max_seq_len * proj_size) +
+              head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
+              data_idx] = val;
+  }
+}
+
+template <typename DT>
+void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
+                   TreeVerifyBatchConfig const *bc,
+                   hipStream_t stream) {
+  int num_tokens_to_commit = bc->num_tokens_to_commit;
+  if (num_tokens_to_commit > 0) {
+    int parallelism =
+        (m->kProjSize + m->vProjSize) * num_tokens_to_commit * m->num_kv_heads;
+    hipLaunchKernelGGL(
+        HIP_KERNEL_NAME(commit_tokens_kernel<DT>),
+        GET_BLOCKS(parallelism),
+        min(CUDA_NUM_THREADS, parallelism),
+        0,
+        stream,
+        static_cast<DT *>(m->devQKVProjArray),
+        static_cast<DT *>(m->keyCache),
+        static_cast<DT *>(m->valueCache),
+        m->committed_token_infos,
+        m->qProjSize,
+        m->kProjSize,
+        m->vProjSize,
+        num_tokens_to_commit,
+        m->num_active_tokens, // number of active tokens in previous batch
+        m->num_q_heads,
+        m->num_kv_heads,
+        BatchConfig::MAX_SEQ_LENGTH);
+  }
+}
+
+template <typename DT>
+__global__ void update_tree_branch_kv_cache(
+    DT const *devQKVProjArray,
+    DT *kCache_ptr,
+    DT *vCache_ptr,
+    TreeVerifyBatchConfig::PerTokenInfo const *tokenInfos,
+    int qProjSize,
+    int kProjSize,
+    int vProjSize,
+    int num_tokens_in_branch,
+    int processed_tokens_in_batch,
+    int total_tokens_in_batch,
+    int num_q_heads,
+    int num_kv_heads,
+    int max_seq_len) {
+  CUDA_KERNEL_LOOP(
+      i, num_tokens_in_branch * (kProjSize + vProjSize) * num_kv_heads) {
+
+    int q_array_size = qProjSize * total_tokens_in_batch * num_q_heads;
+    int k_array_size = kProjSize * total_tokens_in_batch * num_kv_heads;
+
+    bool k_cache = i < (num_tokens_in_branch * kProjSize * num_kv_heads);
+    int real_i =
+        k_cache ? i : i - (num_tokens_in_branch * kProjSize * num_kv_heads);
+
+    int proj_size = k_cache ? kProjSize : vProjSize;
+    int data_idx = real_i % proj_size;
+    int token_idx =
+        (real_i / proj_size) % num_tokens_in_branch; // index in the tree branch
+    int head_idx = real_i / (proj_size * num_tokens_in_branch);
+
+    token_idx += processed_tokens_in_batch; // get index in the whole batch
+    DT val = devQKVProjArray[q_array_size + (k_cache ? 0 : k_array_size) +
+                             head_idx * proj_size * total_tokens_in_batch +
+                             token_idx * proj_size + data_idx];
+
+    int const req_id = tokenInfos[token_idx].request_index;
+    int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
+    DT *cache_ptr = k_cache ? kCache_ptr : vCache_ptr;
+
+    cache_ptr[req_id * (num_kv_heads * max_seq_len * proj_size) +
+              head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
+              data_idx] = val;
+  }
+}
+
+template <typename DT>
+__global__ void tree_fill_entries_above_diagonal(DT *matrix,
+                                                 size_t new_tokens,
+                                                 size_t total_tokens_in_request,
+                                                 size_t num_q_heads,
+                                                 DT value) {
+  CUDA_KERNEL_LOOP(i, new_tokens * total_tokens_in_request * num_q_heads) {
+    // size_t head_idx = i / (new_tokens * total_tokens_in_request);
+    size_t src_idx = (i / new_tokens) % total_tokens_in_request;
+    size_t dst_idx = i % new_tokens + total_tokens_in_request - new_tokens;
+    // Casual Mask
+    if (src_idx > dst_idx) {
+      matrix[i] = value;
+    }
+  }
+}
+
+template <typename DT>
+void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
+                              TreeVerifyBatchConfig const *bc,
+                              int shard_id,
+                              DT *output_ptr,
+                              DT const *bias_ptr,
+                              DT const *weight_ptr,
+                              hipStream_t stream) {
+  checkCUDA(hipblasSetStream(m->handle.blas, stream));
+  checkCUDNN(miopenSetStream(m->handle.dnn, stream));
+  hipblasDatatype_t hipblas_data_type = ff_to_cuda_datatype(m->output_type[0]);
+  miopenDataType_t miopen_data_type = ff_to_cudnn_datatype(m->output_type[0]);
+  assert(data_type_size(m->output_type[0]) == sizeof(DT));
+#if CUDA_VERSION >= 11000
+  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
+  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+#else
+  hipblasDatatype_t compute_type = hipblas_data_type;
+#endif
+  // int num_requests = bc->num_active_requests();
+  int processed_tokens_in_batch = 0;
+  // int qkv_block_size =
+  //     (m->qProjSize + m->kProjSize + m->vProjSize) * bc->num_active_tokens();
+  int q_block_size = m->qProjSize * bc->num_active_tokens();
+  int kt_block_size = m->kProjSize * BatchConfig::MAX_SEQ_LENGTH;
+  int kt_req_block_size = kt_block_size * m->num_kv_heads;
+  int vt_block_size = m->vProjSize * BatchConfig::MAX_SEQ_LENGTH;
+  int vt_req_block_size = vt_block_size * m->num_kv_heads;
+  assert(m->qProjSize == m->kProjSize);
+
+  for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    int last_token_idx_of_the_request =
+        processed_tokens_in_batch + bc->requestsInfo[i].num_tokens_in_batch - 1;
+    while (processed_tokens_in_batch <= last_token_idx_of_the_request) {
+      int num_new_tokens = 1;
+      int j = processed_tokens_in_batch;
+      while ((j + 1 <= last_token_idx_of_the_request) &&
+             (bc->tokensInfo[j].abs_depth_in_request + 1 ==
+              bc->tokensInfo[j + 1].abs_depth_in_request)) {
+        j++;
+        num_new_tokens++;
+      }
+
+      int total_tokens_in_request = bc->tokensInfo[j].abs_depth_in_request + 1;
+      assert(num_new_tokens >= 1 && total_tokens_in_request >= num_new_tokens);
+      {
+        // update K-V cache
+        int parallelism =
+            (m->kProjSize + m->vProjSize) * num_new_tokens * m->num_kv_heads;
+        hipLaunchKernelGGL(
+            HIP_KERNEL_NAME(update_tree_branch_kv_cache<DT>),
+            GET_BLOCKS(parallelism),
+            min(CUDA_NUM_THREADS, parallelism),
+            0,
+            stream,
+            static_cast<DT *>(m->devQKVProjArray),
+            static_cast<DT *>(m->keyCache),
+            static_cast<DT *>(m->valueCache),
+            m->token_infos,
+            m->qProjSize,
+            m->kProjSize,
+            m->vProjSize,
+            num_new_tokens,            // num_tokens_in_branch
+            processed_tokens_in_batch, // num_processed_tokens_in_batch
+            m->num_active_tokens,      // total_tokens_in_batch
+            m->num_q_heads,
+            m->num_kv_heads,
+            BatchConfig::MAX_SEQ_LENGTH);
+      }
+
+      // bc->token_last_available_idx[i] + 1;
+      // Compute (QK^T/sqrt(d_k))
+      int m_ = num_new_tokens;
+      int n = total_tokens_in_request;
+      int k = m->qProjSize;
+      int lda = k, ldb = k, ldc = m_;
+      int strideA = q_block_size;
+      int strideB = kt_block_size;
+      int strideC = num_new_tokens * total_tokens_in_request;
+
+      // a flag of using this scaling alpha
+      DT alpha = 1.0f, beta = 0.0f;
+      if (*m->qk_prod_scaling) {
+        alpha = static_cast<DT>(1.0f / sqrt(m->kProjSize));
+      }
+      // To get A, skip over Q entries from previous requests (same head)
+      DT const *A = static_cast<DT *>(m->devQKVProjArray) +
+                    processed_tokens_in_batch * m->qProjSize;
+      // To get B, skip over K entries from previous requests (all heads +
+      // padding)
+      DT const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
+      // To get C, skip over QK^T products from previous requests
+      DT *C = static_cast<DT *>(m->qk_prods);
+
+      if (m->num_q_heads == m->num_kv_heads) {
+        checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
+                                              HIPBLAS_OP_T,
+                                              HIPBLAS_OP_N,
+                                              m_,
+                                              n,
+                                              k,
+                                              &alpha,
+                                              A,
+                                              hipblas_data_type,
+                                              lda,
+                                              strideA,
+                                              B,
+                                              hipblas_data_type,
+                                              ldb,
+                                              strideB,
+                                              &beta,
+                                              C,
+                                              hipblas_data_type,
+                                              ldc,
+                                              strideC,
+                                              m->num_q_heads,
+                                              compute_type,
+                                              HIPBLAS_GEMM_DEFAULT));
+      } else {
+        strideB = 0;
+        int one_step_heads = m->num_q_heads / m->num_kv_heads;
+        for (int step = 0; step < m->num_kv_heads; step++) {
+          checkCUDA(
+              hipblasGemmStridedBatchedEx(m->handle.blas,
+                                          HIPBLAS_OP_T,
+                                          HIPBLAS_OP_N,
+                                          m_,
+                                          n,
+                                          k,
+                                          &alpha,
+                                          A + step * strideA * one_step_heads,
+                                          hipblas_data_type,
+                                          lda,
+                                          strideA,
+                                          B + step * kt_block_size,
+                                          hipblas_data_type,
+                                          ldb,
+                                          strideB,
+                                          &beta,
+                                          C + step * strideC * one_step_heads,
+                                          hipblas_data_type,
+                                          ldc,
+                                          strideC,
+                                          one_step_heads,
+                                          compute_type,
+                                          HIPBLAS_GEMM_DEFAULT));
+        }
+      }
+
+      // Fill all elements above diagonal in qk prods with -inf to force
+      // causal attention.
+      assert(num_new_tokens <= total_tokens_in_request);
+      if (num_new_tokens > 1) {
+        size_t parallelism =
+            m->num_q_heads * num_new_tokens * total_tokens_in_request;
+        hipLaunchKernelGGL(
+            HIP_KERNEL_NAME(tree_fill_entries_above_diagonal<DT>),
+            GET_BLOCKS(parallelism),
+            min((size_t)CUDA_NUM_THREADS, parallelism),
+            0,
+            stream,
+            C,
+            num_new_tokens,
+            total_tokens_in_request,
+            m->num_q_heads,
+            static_cast<DT>(-INFINITY));
+      }
+      // Compute Softmax(QK^T/sqrt(d_k))
+      // Before modifying the parameters below, make sure to read the following
+      // description of the CUDNN_TENSOR_NCHW tensor layout, from
+      // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#cudnnTensorFormat_t:
+      // This tensor format specifies that the data is laid out in the following
+      // order: batch size, feature maps, rows, columns. The strides are
+      // implicitly defined in such a way that the data are contiguous in memory
+      // with no padding between images, feature maps, rows, and columns; the
+      // columns are the inner dimension and the images are the outermost
+      // dimension.
+      int n_param = m->num_q_heads;
+      int c_param = total_tokens_in_request;
+      int h_param = 1;
+      int w_param = num_new_tokens;
+      checkCUDNN(miopenSet4dTensorDescriptor(
+          m->qk_tensor, miopen_data_type, n_param, c_param, h_param, w_param));
+      float softmax_alpha = 1.0f, softmax_beta = 0.0f;
+      DT *C_softmax = static_cast<DT *>(m->qk_prods_softmax);
+      // The softmax operation below is executed according to the
+      // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
+      // softmax operation is computed per spatial location (H,W) per image (N)
+      // across dimension C.
+      checkCUDNN(miopenSoftmaxForward_V2(m->handle.dnn,
+                                         &softmax_alpha,
+                                         m->qk_tensor,
+                                         C,
+                                         &softmax_beta,
+                                         m->qk_tensor,
+                                         C_softmax,
+                                         MIOPEN_SOFTMAX_ACCURATE,
+                                         MIOPEN_SOFTMAX_MODE_CHANNEL));
+      // Matmul softmax(QK^T/sqrt(d_k)) by V
+      alpha = 1.0f, beta = 0.0f;
+      m_ = num_new_tokens;
+      n = m->vProjSize;
+      k = total_tokens_in_request;
+      lda = m_, ldb = n, ldc = m_;
+      strideA = num_new_tokens * total_tokens_in_request;
+      strideB = vt_block_size;
+      strideC = num_new_tokens * m->vProjSize;
+      // To get A, skip over softmax(QK^T/sqrt(d_k)) entries from previous
+      // requests (all heads)
+      A = C_softmax;
+      // To get B, skip over V^T entries from previous requests (all heads +
+      // padding)
+      B = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
+      // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
+      // requests
+      C = static_cast<DT *>(m->attn_heads) +
+          processed_tokens_in_batch * m->num_q_heads * m->vProjSize;
+
+      if (m->num_q_heads == m->num_kv_heads) {
+        checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
+                                              HIPBLAS_OP_N,
+                                              HIPBLAS_OP_T,
+                                              m_,
+                                              n,
+                                              k,
+                                              &alpha,
+                                              A,
+                                              hipblas_data_type,
+                                              lda,
+                                              strideA,
+                                              B,
+                                              hipblas_data_type,
+                                              ldb,
+                                              strideB,
+                                              &beta,
+                                              C,
+                                              hipblas_data_type,
+                                              ldc,
+                                              strideC,
+                                              m->num_q_heads,
+                                              compute_type,
+                                              HIPBLAS_GEMM_DEFAULT));
+      } else {
+        int one_step_heads = m->num_q_heads / m->num_kv_heads;
+        strideB = 0;
+        for (int step = 0; step < m->num_kv_heads; step++) {
+          checkCUDA(
+              hipblasGemmStridedBatchedEx(m->handle.blas,
+                                          HIPBLAS_OP_N,
+                                          HIPBLAS_OP_T,
+                                          m_,
+                                          n,
+                                          k,
+                                          &alpha,
+                                          A + step * one_step_heads * strideA,
+                                          hipblas_data_type,
+                                          lda,
+                                          strideA,
+                                          B + step * vt_block_size,
+                                          hipblas_data_type,
+                                          ldb,
+                                          strideB,
+                                          &beta,
+                                          C + step * one_step_heads * strideC,
+                                          hipblas_data_type,
+                                          ldc,
+                                          strideC,
+                                          one_step_heads,
+                                          compute_type,
+                                          HIPBLAS_GEMM_DEFAULT));
+        }
+      }
+
+      // Project to output, save result directly on output tensor
+      alpha = 1.0f, beta = 0.0f;
+      m_ = m->oProjSize;
+      k = m->vProjSize * m->num_q_heads;
+      n = num_new_tokens;
+      lda = k, ldb = n, ldc = m_;
+      A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
+                                   m->kProjSize * m->num_kv_heads +
+                                   m->vProjSize * m->num_kv_heads);
+      B = C;
+      C = static_cast<DT *>(output_ptr) +
+          processed_tokens_in_batch * m->oProjSize;
+
+      checkCUDA(hipblasGemmEx(m->handle.blas,
+                              HIPBLAS_OP_T,
+                              HIPBLAS_OP_T,
+                              m_,
+                              n,
+                              k,
+                              &alpha,
+                              A,
+                              hipblas_data_type,
+                              lda,
+                              B,
+                              hipblas_data_type,
+                              ldb,
+                              &beta,
+                              C,
+                              hipblas_data_type,
+                              ldc,
+                              compute_type,
+                              HIPBLAS_GEMM_DEFAULT));
+      processed_tokens_in_batch += num_new_tokens;
+    }
+    // Before moving to the next request
+    // check that we have finished all tokens of the request
+    assert(last_token_idx_of_the_request + 1 == processed_tokens_in_batch);
+  }
+  if (*m->bias && shard_id == 0) {
+    int parallelism = m->oProjSize * processed_tokens_in_batch;
+    int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
+                          m->kProjSize * m->global_num_kv_heads +
+                          m->vProjSize * m->global_num_kv_heads;
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_proj_bias_w<DT>),
+                       GET_BLOCKS(parallelism),
+                       min(CUDA_NUM_THREADS, parallelism),
+                       0,
+                       stream,
+                       output_ptr,
+                       bias_ptr,
+                       processed_tokens_in_batch,
+                       qkv_weight_size,
+                       m->oProjSize);
+  }
+
+  assert(processed_tokens_in_batch == bc->num_active_tokens());
+}
+
+template <typename DT>
+void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
+                      TreeVerifyBatchConfig const *bc,
+                      int shard_id,
+                      DT const *input_ptr,
+                      DT const *weight_ptr,
+                      DT *output_ptr,
+                      DT const *bias_ptr,
+                      hipStream_t stream) {
+  // additional processing for weight uploading
+  if (m->handle.offload_reserve_space != nullptr) {
+    // Note that we update weight_ptr and bias_ptr when uploading weight and
+    // bias
+    hipMemcpyAsync(m->weight_ptr,
+                   weight_ptr,
+                   m->weightSize,
+                   hipMemcpyHostToDevice,
+                   stream);
+    weight_ptr = static_cast<DT *>(m->weight_ptr);
+    if (m->biasSize > 0) {
+      hipMemcpyAsync(
+          m->bias_ptr, bias_ptr, m->biasSize, hipMemcpyHostToDevice, stream);
+      bias_ptr = static_cast<DT *>(m->bias_ptr);
+    }
+  }
+  // copy committed tokens info to GPU for the commit_tokens kernel
+  // Note that m->num_active_tokens stores the number of active
+  // tokens in the previous batch, which is needed for committing
+  // keys/values to the key-value cache
+  hipMemcpyAsync(m->committed_token_infos,
+                 &(bc->committed_tokens),
+                 bc->num_tokens_to_commit *
+                     sizeof(TreeVerifyBatchConfig::CommittedTokensInfo),
+                 hipMemcpyHostToDevice,
+                 stream);
+  commit_tokens<DT>(m, bc, stream);
+
+  // After commit we update m->num_active_tokens to be the number of active
+  // tokens for the current batch
+  m->num_active_tokens = bc->num_active_tokens();
+
+  // here because we need postion info in infernece 1
+  if (m->offload && m->biasSize > 0) {
+    hipMemcpyAsync(
+        m->bias_ptr, bias_ptr, m->biasSize, hipMemcpyHostToDevice, stream);
+    bias_ptr = static_cast<DT *>(m->bias_ptr);
+  }
+  hipMemcpyAsync(m->token_infos,
+                 &(bc->tokensInfo),
+                 bc->MAX_NUM_TOKENS *
+                     sizeof(TreeVerifyBatchConfig::PerTokenInfo),
+                 hipMemcpyHostToDevice,
+                 stream);
+  // phase 1: Implement kernel to compute KQV for input tokens
+  compute_qkv_kernel(m,
+                     bc,
+                     shard_id,
+                     input_ptr,
+                     weight_ptr,
+                     static_cast<DT *>(m->devQKVProjArray),
+                     bias_ptr,
+                     stream);
+
+  // phase 2: No need to update key/val cache
+  // IncMultiHeadSelfAttention::update_kv_cache_kernel(
+  //    m, bc, stream);
+
+  // phase 3: Compute attention score
+  // 3 kernels for pahse 3: matmul1 - softmax - matmal2
+  compute_attention_kernel(
+      m, bc, shard_id, output_ptr, bias_ptr, weight_ptr, stream);
+}
+
+} // namespace TreeIncMultiHeadAttention
+} // namespace Kernels
+
 /*static*/
 void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
     TreeIncMultiHeadSelfAttentionMeta *m,
@@ -34,6 +592,7 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
     GenericTensorAccessorR const &bias) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
+  bool use_bias = *m->bias;
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
@@ -42,7 +601,47 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
     checkCUDA(hipEventRecord(t_start, stream));
   }
 
-  handle_unimplemented_hip_kernel(OP_TREE_INC_MULTIHEAD_SELF_ATTENTION);
+  // assert(input.data_type == weight.data_type);
+  assert(input.data_type == output.data_type);
+  if (use_bias) {
+    assert(input.data_type == bias.data_type);
+  }
+
+  if (input.data_type == DT_HALF) {
+    if (m->offload) {
+      pre_build_weight_kernel<half>(m, weight, input.data_type, stream);
+    }
+
+    half const *bias_ptr =
+        use_bias ? bias.get_half_ptr() : static_cast<half const *>(nullptr);
+    Kernels::TreeIncMultiHeadAttention::inference_kernel(
+        m,
+        bc,
+        shard_id,
+        input.get_half_ptr(),
+        m->offload ? static_cast<half *>(m->weight_ptr) : weight.get_half_ptr(),
+        output.get_half_ptr(),
+        bias_ptr,
+        stream);
+  } else if (input.data_type == DT_FLOAT) {
+    if (m->offload) {
+      pre_build_weight_kernel<float>(m, weight, input.data_type, stream);
+    }
+    float const *bias_ptr =
+        use_bias ? bias.get_float_ptr() : static_cast<float const *>(nullptr);
+    Kernels::TreeIncMultiHeadAttention::inference_kernel(
+        m,
+        bc,
+        shard_id,
+        input.get_float_ptr(),
+        m->offload ? static_cast<float *>(m->weight_ptr)
+                   : weight.get_float_ptr(),
+        output.get_float_ptr(),
+        bias_ptr,
+        stream);
+  } else {
+    assert(false && "Unspported data type");
+  }
 
   if (m->profiling) {
     checkCUDA(hipEventRecord(t_end, stream));
@@ -95,8 +694,38 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDNN(miopenSetStream(handler.dnn, stream));
+
+  // allocate memory for the seqArray and reserve space
+  {
+    size_t committed_tokeninfo_size = TreeVerifyBatchConfig::MAX_NUM_TOKENS;
+    size_t total_size = committed_tokeninfo_size *
+                        sizeof(TreeVerifyBatchConfig::CommittedTokensInfo);
+    if (offload) {
+      // assert that we have enough reserved work space left
+      assert(gpu_mem_allocator.reserved_total_size -
+                 gpu_mem_allocator.reserved_allocated_size >=
+             total_size);
+      committed_token_infos =
+          gpu_mem_allocator
+              .allocate_reserved<TreeVerifyBatchConfig::CommittedTokensInfo>(
+                  committed_tokeninfo_size);
+    } else {
+      gpu_mem_allocator.create_legion_instance(committed_token_reserve_inst,
+                                               total_size);
+      committed_token_infos =
+          gpu_mem_allocator
+              .allocate_instance<TreeVerifyBatchConfig::CommittedTokensInfo>(
+                  committed_tokeninfo_size);
+    }
+  }
+
+  hipStreamSynchronize(stream);
 }
 
-TreeIncMultiHeadSelfAttentionMeta::~TreeIncMultiHeadSelfAttentionMeta(void) {}
+TreeIncMultiHeadSelfAttentionMeta::~TreeIncMultiHeadSelfAttentionMeta(void) {
+  if (committed_token_reserve_inst != Realm::RegionInstance::NO_INST) {
+    committed_token_reserve_inst.destroy();
+  }
+}
 
 }; // namespace FlexFlow
diff --git a/src/parallel_ops/kernels/allreduce_kernels.cpp b/src/parallel_ops/kernels/allreduce_kernels.cpp
index 8d0d5e97c5..8d7e20e395 100644
--- a/src/parallel_ops/kernels/allreduce_kernels.cpp
+++ b/src/parallel_ops/kernels/allreduce_kernels.cpp
@@ -33,7 +33,20 @@ void inference_kernel_wrapper(AllReduceMeta const *m,
   checkCUDA(get_legion_stream(&stream));
   assert(input.data_type == output.data_type);
   assert(input.domain == output.domain);
-  assert(false && "To be implemented");
+  size_t hidden_dim_size = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+  size_t num_elements = bc->num_tokens * hidden_dim_size;
+#ifdef FF_USE_NCCL
+  ncclDataType_t nccl_data_type = ff_to_nccl_datatype(input.data_type);
+  checkNCCL(ncclAllReduce(input.ptr,
+                          output.ptr,
+                          num_elements,
+                          nccl_data_type,
+                          ncclSum,
+                          m->handle.ncclComm,
+                          stream));
+#else
+  assert(false && "Must enable FF_USE_NCCL to use AllReduce operators");
+#endif
 }
 
 void forward_kernel_wrapper(AllReduceMeta const *m,
@@ -43,7 +56,19 @@ void forward_kernel_wrapper(AllReduceMeta const *m,
   checkCUDA(get_legion_stream(&stream));
   assert(input.data_type == output.data_type);
   assert(input.domain == output.domain);
-  assert(false && "To be implemented");
+  size_t hidden_dim_size = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+#ifdef FF_USE_NCCL
+  ncclDataType_t nccl_data_type = ff_to_nccl_datatype(input.data_type);
+  checkNCCL(ncclAllReduce(input.ptr,
+                          output.ptr,
+                          input.domain.get_volume(),
+                          nccl_data_type,
+                          ncclSum,
+                          m->handle.ncclComm,
+                          stream));
+#else
+  assert(false && "Must enable FF_USE_NCCL to use AllReduce operators");
+#endif
 }
 
 void backward_kernel_wrapper(AllReduceMeta const *m,
diff --git a/src/runtime/hip_helper.cpp b/src/runtime/hip_helper.cpp
index fb570a33f5..1f27dc15e7 100644
--- a/src/runtime/hip_helper.cpp
+++ b/src/runtime/hip_helper.cpp
@@ -251,12 +251,14 @@ template <typename T>
 __host__ T *download_tensor(T const *ptr, size_t num_elements) {
   // device synchronize to make sure the data are ready
   // checkCUDA(hipDeviceSynchronize());
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
   T *host_ptr;
   checkCUDA(hipHostMalloc(&host_ptr,
                           sizeof(T) * num_elements,
                           hipHostMallocPortable | hipHostMallocMapped));
-  checkCUDA(hipMemcpy(
-      host_ptr, ptr, sizeof(T) * num_elements, hipMemcpyDeviceToHost));
+  checkCUDA(hipMemcpyAsync(
+      host_ptr, ptr, sizeof(T) * num_elements, hipMemcpyDeviceToHost, stream));
   // checkCUDA(hipDeviceSynchronize());
   return host_ptr;
 }
@@ -265,9 +267,11 @@ template <typename T>
 __host__ bool download_tensor(T const *ptr, T *dst, size_t num_elements) {
   // device synchronize to make sure the data are ready
   // checkCUDA(hipDeviceSynchronize());
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
   assert(dst != nullptr);
-  checkCUDA(
-      hipMemcpy(dst, ptr, sizeof(T) * num_elements, hipMemcpyDeviceToHost));
+  checkCUDA(hipMemcpyAsync(
+      dst, ptr, sizeof(T) * num_elements, hipMemcpyDeviceToHost, stream));
   // checkCUDA(hipDeviceSynchronize());
   return true;
 }
@@ -324,6 +328,57 @@ miopenStatus_t cudnnSetTensorDescriptorFromDomain(
   return miopenStatusBadParm;
 }
 
+miopenStatus_t
+    cudnnSetTensorDescriptorFromDomain4SoftMax(miopenTensorDescriptor_t tensor,
+                                               Domain domain) {
+  int dims[MAX_TENSOR_DIM];
+  switch (domain.get_dim()) {
+    case 1: {
+      Rect<1> rect = domain;
+      dims[0] = rect.hi[0] - rect.lo[0] + 1;
+      return miopenSet4dTensorDescriptor(tensor, miopenFloat, dims[0], 1, 1, 1);
+    }
+    case 2: {
+      Rect<2> rect = domain;
+      dims[0] = rect.hi[0] - rect.lo[0] + 1;
+      dims[1] = rect.hi[1] - rect.lo[1] + 1;
+      return miopenSet4dTensorDescriptor(
+          tensor, miopenFloat, dims[1], dims[0], 1, 1);
+    }
+    case 3: {
+      Rect<3> rect = domain;
+      dims[0] = rect.hi[0] - rect.lo[0] + 1;
+      dims[1] = rect.hi[1] - rect.lo[1] + 1;
+      dims[2] = rect.hi[2] - rect.lo[2] + 1;
+      return miopenSet4dTensorDescriptor(
+          tensor, miopenFloat, dims[2] * dims[1], dims[0], 1, 1);
+    }
+    case 4: {
+      Rect<4> rect = domain;
+      dims[0] = rect.hi[0] - rect.lo[0] + 1;
+      dims[1] = rect.hi[1] - rect.lo[1] + 1;
+      dims[2] = rect.hi[2] - rect.lo[2] + 1;
+      dims[3] = rect.hi[3] - rect.lo[3] + 1;
+      return miopenSet4dTensorDescriptor(
+          tensor, miopenFloat, dims[3] * dims[2] * dims[1], dims[0], 1, 1);
+    }
+    case 5: {
+      Rect<5> rect = domain;
+      int leading_dim_size = rect.hi[4] - rect.lo[4] + 1;
+      assert(leading_dim_size == 1);
+      dims[0] = rect.hi[0] - rect.lo[0] + 1;
+      dims[1] = rect.hi[1] - rect.lo[1] + 1;
+      dims[2] = rect.hi[2] - rect.lo[2] + 1;
+      dims[3] = rect.hi[3] - rect.lo[3] + 1;
+      return miopenSet4dTensorDescriptor(
+          tensor, miopenFloat, dims[3], dims[2], dims[1], dims[0]);
+    }
+    default:
+      assert(false && "Unsupported dim number");
+  }
+  return miopenStatusBadParm;
+}
+
 miopenDataType_t ff_to_cudnn_datatype(DataType type) {
   switch (type) {
     case DT_HALF:
@@ -354,6 +409,23 @@ hipblasDatatype_t ff_to_cuda_datatype(DataType type) {
   }
   return HIPBLAS_R_32F;
 }
+#ifdef FF_USE_NCCL
+ncclDataType_t ff_to_nccl_datatype(DataType type) {
+  switch (type) {
+    case DT_HALF:
+      return ncclHalf;
+    case DT_FLOAT:
+      return ncclFloat;
+    case DT_DOUBLE:
+      return ncclDouble;
+    case DT_INT32:
+      return ncclInt;
+    default:
+      assert(false && "Unspoorted nccl data type");
+  }
+  return ncclFloat;
+}
+#endif
 
 void handle_unimplemented_hip_kernel(OperatorType op_type) {
   throw std::runtime_error("Unimplemented hip kernel for Operator: " +
diff --git a/src/runtime/optimizer_kernel.cpp b/src/runtime/optimizer_kernel.cpp
index 232799e027..e71adc87a8 100644
--- a/src/runtime/optimizer_kernel.cpp
+++ b/src/runtime/optimizer_kernel.cpp
@@ -87,6 +87,7 @@ __host__ void SGDOptimizer::ps_update_task_gpu(SGDOptimizer const *op,
 
 #ifdef FF_USE_NCCL
 __host__ void SGDOptimizer::nccl_update_task_gpu(SGDOptimizer const *op,
+                                                 OpMeta const *meta,
                                                  float const *w_grad_ptr,
                                                  size_t size,
                                                  float *w_ptr,
@@ -208,6 +209,7 @@ __host__ void AdamOptimizer::ps_update_task_gpu(AdamOptimizer const *op,
 
 #ifdef FF_USE_NCCL
 __host__ void AdamOptimizer::nccl_update_task_gpu(AdamOptimizer const *op,
+                                                  OpMeta const *meta,
                                                   float const *w_grad_ptr,
                                                   size_t size,
                                                   float *w_ptr,
diff --git a/src/runtime/request_manager.cpp b/src/runtime/request_manager.cpp
index 80554c2add..f323f262f2 100644
--- a/src/runtime/request_manager.cpp
+++ b/src/runtime/request_manager.cpp
@@ -29,21 +29,31 @@ void RequestManager::load_tokens_task(
   assert(regions.size() == 1);
   assert(task->regions.size() == 1);
 
-  BatchConfig const batch_config = *((BatchConfig *)task->args);
+  // BatchConfig const batch_config = *((BatchConfig *)task->args);
+  BatchConfig const *batch_config = BatchConfig::from_future(task->futures[0]);
   BatchConfig::TokenId dram_copy[BatchConfig::MAX_NUM_TOKENS];
-  for (int i = 0; i < batch_config.num_tokens; i++) {
-    dram_copy[i] = batch_config.tokensInfo[i].token_id;
+
+  // Extreme long prompts are not supported, only load up to MAX_NUM_TOKENS as
+  // prompt
+  if (batch_config->num_tokens > BatchConfig::MAX_NUM_TOKENS) {
+    printf("Warning: too many tokens in prompt, only load up to %d tokens\n",
+           BatchConfig::MAX_NUM_TOKENS);
+    printf("Got: %d tokens\n", batch_config->num_tokens);
+  }
+
+  for (int i = 0; i < batch_config->num_tokens; i++) {
+    dram_copy[i] = batch_config->tokensInfo[i].token_id;
   }
   TokenId *fb_ptr = helperGetTensorPointerWO<TokenId>(
       regions[0], task->regions[0], FID_DATA, ctx, runtime);
   Domain domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
-  assert(batch_config.num_tokens <= domain.get_volume());
+  assert(batch_config->num_tokens <= domain.get_volume());
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDA(hipMemcpyAsync(fb_ptr,
                            dram_copy,
-                           sizeof(TokenId) * batch_config.num_tokens,
+                           sizeof(TokenId) * batch_config->num_tokens,
                            hipMemcpyHostToDevice,
                            stream));
 }
@@ -55,22 +65,23 @@ void RequestManager::load_positions_task(
     Runtime *runtime) {
   assert(regions.size() == 1);
   assert(task->regions.size() == 1);
-  BatchConfig const batch_config = *((BatchConfig *)task->args);
-  int offset = 2;
+  BatchConfig const *batch_config = BatchConfig::from_future(task->futures[0]);
+
+  int const offset = *((int const *)task->args);
   int *pos_ptr = helperGetTensorPointerWO<int>(
       regions[0], task->regions[0], FID_DATA, ctx, runtime);
   Domain domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
   int dram_copy[BatchConfig::MAX_NUM_TOKENS];
 
-  for (int i = 0; i < batch_config.num_tokens; i++) {
-    dram_copy[i] = batch_config.tokensInfo[i].abs_depth_in_request + offset;
+  for (int i = 0; i < batch_config->num_tokens; i++) {
+    dram_copy[i] = batch_config->tokensInfo[i].abs_depth_in_request + offset;
   }
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDA(hipMemcpyAsync(pos_ptr,
                            dram_copy,
-                           sizeof(int) * batch_config.num_tokens,
+                           sizeof(int) * batch_config->num_tokens,
                            hipMemcpyHostToDevice,
                            stream));
 }

From 7aa18625831975297ac2285f8cbb1b18e30355f7 Mon Sep 17 00:00:00 2001
From: vincent163 <vincent.163@outlook.com>
Date: Sat, 2 Sep 2023 19:07:37 -0400
Subject: [PATCH 219/344] Fix compile error in debug mode (#1088)

Co-authored-by: vincent-163 <wenyangh@andrew.cmu.edu>
Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 src/c/flexflow_c.cc | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index 96ff84c85f..2ddb65fc9d 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -1426,7 +1426,7 @@ flexflow_generation_result_t
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
   std::string const text_str(input_text);
   GenerationResult result = handle->generate(text_str, max_seq_length);
-  DEBUG_PRINT("[Model] generate %p %s %i", handle, text, max_seq_length);
+  DEBUG_PRINT("[Model] generate %p %s %i", handle, text_str, max_seq_length);
   assert(result.output_tokens.size() <= max_seq_length);
   output_length_and_tokens[0] = result.output_tokens.size();
   std::copy(result.output_tokens.begin(),

From 7adf106e64dc92a69d303338692cd943ed105645 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sat, 2 Sep 2023 19:42:56 -0400
Subject: [PATCH 220/344] Update docs (#1091)

* update docs

* fix
---
 .github/README.md          | 29 ++++++++++++++++++++++-------
 INSTALL.md                 |  2 +-
 MULTI-NODE.md              |  4 ++--
 README.md                  |  7 ++++---
 SERVE.md                   | 38 +++++++++++++++++++-------------------
 docker/README.md           | 33 ++++++++++++++++++++++-----------
 docs/source/jupyter.rst    |  6 ------
 jupyter_notebook/README.md |  2 +-
 8 files changed, 71 insertions(+), 50 deletions(-)
 delete mode 100644 docs/source/jupyter.rst

diff --git a/.github/README.md b/.github/README.md
index 56434f6bf9..a8846260c8 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -6,8 +6,9 @@
 
 ## News🔥:
 
+* [09/02/2023] Adding AMD GPU support, released Docker images for ROCM 5.3->5.6
 * [08/16/2023] Adding Starcoder model support
-* [08/14/2023] Released Dockerfile for different CUDA versions
+* [08/14/2023] Released Docker images for different CUDA versions
 
 ## What is FlexFlow Serve
   
@@ -42,13 +43,13 @@ pip install flexflow
 ```
 
 ### Try it in Docker
-If you run into any issue during the install, or if you would like to use the C++ API without needing to install from source, you can also use our pre-built Docker package for different CUDA versions and the `hip_rocm` backend. To download and run our pre-built Docker container:
+If you run into any issue during the install, or if you would like to use the C++ API without needing to install from source, you can also use our pre-built Docker package for different CUDA versions (NVIDIA backend) and multiple ROCM versions (AMD backend). To download and run our pre-built Docker container:
 
 ```bash
-docker run --gpus all -it --rm --shm-size=8g ghcr.io/flexflow/flexflow-cuda-11.8:latest
+docker run --gpus all -it --rm --shm-size=8g ghcr.io/flexflow/flexflow-cuda-12.0:latest
 ```
 
-To download a Docker container for a backend other than CUDA v11.8, you can replace the `cuda-11.8` suffix with any of the following backends: `cuda-11.1`, `cuda-11.2`, `cuda-11.3`, `cuda-11.5`, `cuda-11.6`, `cuda-11.7`, `cuda-11.8`, and `hip_rocm`). More info on the Docker images, with instructions to build a new image from source, or run with additional configurations, can be found [here](../docker/README.md).
+To download a Docker container for a backend other than CUDA v12.0, you can replace the `cuda-12.0` suffix with any of the following backends: `cuda-11.1`, `cuda-11.2`, `cuda-11.3`, `cuda-11.4`, `cuda-11.5`, `cuda-11.6`, `cuda-11.7`, `cuda-11.8`, and `hip_rocm-5.3`, `hip_rocm-5.4`, `hip_rocm-5.5`, `hip_rocm-5.6`). More info on the Docker images, with instructions to build a new image from source, or run with additional configurations, can be found [here](../docker/README.md).
 
 ### Build from source
 
@@ -209,7 +210,7 @@ Below is a list of models that we have explicitly tested and for which a SSM may
 | StarCoder-15.5B | bigcode/starcoder | |
 
 ### CPU Offloading
-FlexFlow Serve also offers offloading-based inference for running large models (e.g., llama-7B) on a single GPU. CPU offloading is a choice to save tensors in CPU memory, and only copy the tensor to GPU when doing calculation. Notice that now we selectively offload the largest weight tensors (weights tensor in Linear, Attention). Besides, since the small model occupies considerably less space, it it does not pose a bottleneck for GPU memory, the offloading will bring more runtime space and computational cost, so we only do the offloading for the large model. You can run the offloading example by enabling the `-offload` and `-offload-reserve-space-size` flags.
+FlexFlow Serve also offers offloading-based inference for running large models (e.g., llama-7B) on a single GPU. CPU offloading is a choice to save tensors in CPU memory, and only copy the tensor to GPU when doing calculation. Notice that now we selectively offload the largest weight tensors (weights tensor in Linear, Attention). Besides, since the small model occupies considerably less space, it it does not pose a bottleneck for GPU memory, the offloading will bring more runtime space and computational cost, so we only do the offloading for the large model. [TODO: update instructions] You can run the offloading example by enabling the `-offload` and `-offload-reserve-space-size` flags.
 
 ### Quantization
 FlexFlow Serve supports int4 and int8 quantization. The compressed tensors are stored on the CPU side. Once copied to the GPU, these tensors undergo decompression and conversion back to their original precision. Please find the compressed weight files in our s3 bucket, or use [this script](../inference/utils/compress_llama_weights.py) from [FlexGen](https://github.com/FMInference/FlexGen) project to do the compression manually.
@@ -221,10 +222,24 @@ We provide five prompt datasets for evaluating FlexFlow Serve: [Chatbot instruct
 
 FlexFlow Serve is under active development. We currently focus on the following tasks and strongly welcome all contributions from bug fixes to new features and extensions.
 
-* AMD support. We are actively working on supporting FlexFlow Serve on AMD GPUs and welcome any contributions to this effort. 
+* AMD benchmarking. We are actively working on benchmarking FlexFlow Serve on AMD GPUs and comparing it with the performance on NVIDIA GPUs.
+* Chatbot prompt templates and Multi-round conversations
+* Support for FastAPI server
+* Integration with LangChain for document question answering
 
 ## Acknowledgements
-This project is initiated by members from CMU, Stanford, and UCSD. We will be continuing developing and supporting FlexFlow Serve. 
+This project is initiated by members from CMU, Stanford, and UCSD. We will be continuing developing and supporting FlexFlow Serve. Please cite FlexFlow Serve as:
+
+``` bibtex
+@misc{miao2023specinfer,
+      title={SpecInfer: Accelerating Generative Large Language Model Serving with Speculative Inference and Token Tree Verification}, 
+      author={Xupeng Miao and Gabriele Oliaro and Zhihao Zhang and Xinhao Cheng and Zeyu Wang and Rae Ying Yee Wong and Alan Zhu and Lijie Yang and Xiaoxiang Shi and Chunan Shi and Zhuoming Chen and Daiyaan Arfeen and Reyna Abhyankar and Zhihao Jia},
+      year={2023},
+      eprint={2305.09781},
+      archivePrefix={arXiv},
+      primaryClass={cs.CL}
+}
+```
 
 ## License
 FlexFlow uses Apache License 2.0.
diff --git a/INSTALL.md b/INSTALL.md
index 8d33770c92..72993f3330 100644
--- a/INSTALL.md
+++ b/INSTALL.md
@@ -42,7 +42,7 @@ You can configure a FlexFlow build by running the `config/config.linux` file in
 3. `FF_CUDA_ARCH` is used to set the architecture of targeted GPUs, for example, the value can be 60 if the GPU architecture is Pascal. To build for more than one architecture, pass a list of comma separated values (e.g. `FF_CUDA_ARCH=70,75`). To compile FlexFlow for all GPU architectures that are detected on the machine, pass `FF_CUDA_ARCH=autodetect` (this is the default value, so you can also leave `FF_CUDA_ARCH` unset. If you want to build for all GPU architectures compatible with FlexFlow, pass `FF_CUDA_ARCH=all`. **If your machine does not have any GPU, you have to set FF_CUDA_ARCH to at least one valid architecture code (or `all`)**, since the compiler won't be able to detect the architecture(s) automatically.
 4. `FF_USE_PYTHON` controls whether to build the FlexFlow Python interface.
 5. `FF_USE_NCCL` controls whether to build FlexFlow with NCCL support. By default, it is set to ON.
-6. `FF_LEGION_NETWORKS` is used to enable distributed run of FlexFlow. If you want to run FlexFlow on multiple nodes, follow instructions in [MULTI-NODE.md](MULTI-NODE.md) and set the corresponding parameters as follows:
+6. `FF_LEGION_NETWORKS` is used to enable distributed run of FlexFlow. If you want to run FlexFlow on multiple nodes, follow instructions in the [Multinode tutorial](https://flexflow.readthedocs.io/en/latest/multinode.html) and set the corresponding parameters as follows:
 * To build FlexFlow with GASNet, set `FF_LEGION_NETWORKS=gasnet` and `FF_GASNET_CONDUIT` as a specific conduit (e.g. `ibv`, `mpi`, `udp`, `ucx`) in `config/config.linux` when configuring the FlexFlow build. Set `FF_UCX_URL` when you want to customize the URL to download UCX.
 * To build FlexFlow with native UCX, set `FF_LEGION_NETWORKS=ucx` in `config/config.linux` when configuring the FlexFlow build. Set `FF_UCX_URL` when you want to customize the URL to download UCX.
 8. `FF_BUILD_EXAMPLES` controls whether to build all C++ example programs.
diff --git a/MULTI-NODE.md b/MULTI-NODE.md
index 4bae47cfa6..9cf95976ac 100644
--- a/MULTI-NODE.md
+++ b/MULTI-NODE.md
@@ -19,7 +19,7 @@ You can also use your own GPU cluster, as long as all machines are interconnecte
 
 ## 2. Configure and build FlexFlow
 
-Follow steps 1 to 5 in [INSTALL.md](INSTALL.md) to download the source code, install system dependencies, install the Python dependencies, configure the FlexFlow build, and build FlexFlow **on each instance at the same path**. 
+Follow steps 1 to 5 in the [Build from source guide](https://flexflow.readthedocs.io/en/latest/installation.html) to download the source code, install system dependencies, install the Python dependencies, configure the FlexFlow build, and build FlexFlow **on each instance at the same path**. 
 
 You can skip step 2 (Install system dependencies) if you have spun up instances with Deep Learning AMI, which comes preconfigured with CUDA. Otherwise, you need to install system dependencies on each instance.
 
@@ -66,6 +66,6 @@ ssh-ed25519 AAAAC3NzaC1lZDI1NTE5AAAAIOy5NKYdE8Cwgid59rx6xMqyj9vLaWuXIwy/BSRiK4su
 
 ## 4. Test FlexFlow
 
-Follow step 6 in [INSTALL.md](INSTALL.md) to set environment variables.
+Follow step 6 in the [Build from source guide](https://flexflow.readthedocs.io/en/latest/installation.html) to set environment variables.
 
 A script to run a Python example on multiple nodes is available at `scripts/mnist_mlp_run.sh`. You can run the script using [`mpirun`](https://www.open-mpi.org/doc/current/man1/mpirun.1.php) (if you configured it in step 3) or [`srun`](https://slurm.schedmd.com/srun.html).
diff --git a/README.md b/README.md
index e84bf20605..318d2e38da 100644
--- a/README.md
+++ b/README.md
@@ -6,8 +6,9 @@
 
 ## News 🔥:
 
+* [09/02/2023] Adding AMD GPU support, released Docker images for ROCM 5.3->5.6
 * [08/16/2023] Adding Starcoder model support
-* [08/14/2023] Released Dockerfile for different CUDA versions
+* [08/14/2023] Released Docker image for different CUDA versions
 
 ## Install FlexFlow
 
@@ -31,10 +32,10 @@ pip install flexflow
 If you run into any issue during the install, or if you would like to use the C++ API without needing to install from source, you can also use our pre-built Docker package for different CUDA versions and the `hip_rocm` backend. To download and run our pre-built Docker container:
 
 ```bash
-docker run --gpus all -it --rm --shm-size=8g ghcr.io/flexflow/flexflow-cuda-11.8:latest
+docker run --gpus all -it --rm --shm-size=8g ghcr.io/flexflow/flexflow-cuda-12.0:latest
 ```
 
-To download a Docker container for a backend other than CUDA v11.8, you can replace the `cuda-11.8` suffix with any of the following backends: `cuda-11.1`, `cuda-11.2`, `cuda-11.3`, `cuda-11.5`, `cuda-11.6`, `cuda-11.7`, `cuda-11.8`, and `hip_rocm`). More info on the Docker images, with instructions to build a new image from source, or run with additional configurations, can be found [here](../docker/README.md).
+To download a Docker container for a backend other than CUDA v12.0, you can replace the `cuda-12.0` suffix with any of the following backends: `cuda-11.1`, `cuda-11.2`, `cuda-11.3`, `cuda-11.4`, `cuda-11.5`, `cuda-11.6`, `cuda-11.7`, `cuda-11.8`, and `hip_rocm-5.3`, `hip_rocm-5.4`, `hip_rocm-5.5`, `hip_rocm-5.6`). More info on the Docker images, with instructions to build a new image from source, or run with additional configurations, can be found [here](./docker/README.md).
 
 ### Build from source
 
diff --git a/SERVE.md b/SERVE.md
index e716392b32..60d0b566f0 100644
--- a/SERVE.md
+++ b/SERVE.md
@@ -16,19 +16,18 @@ existing systems by 1.3-2.0x for single-node, multi-GPU inference and by
 
 
 ## Quickstart
-The following example shows how to deploy an LLM using FlexFlow Serve and accelerate its serving using [speculative inference](#speculative-inference). First, we import `flexflow.serve` and initialize the FlexFlow Serve runtime. Note that `memory_per_gpu` and `zero_copy_memory_per_node` specify the size of device memory on each GPU (in MB) and zero-copy memory on each node (in MB), respectively. FlexFlow Serve combines tensor and pipeline model parallelism for LLM serving.
+The following example shows how to deploy an LLM using FlexFlow Serve and accelerate its serving using [speculative inference](#speculative-inference). First, we import `flexflow.serve` and initialize the FlexFlow Serve runtime. Note that `memory_per_gpu` and `zero_copy_memory_per_node` specify the size of device memory on each GPU (in MB) and zero-copy memory on each node (in MB), respectively. 
+We need to make sure the aggregated GPU memory and zero-copy memory are **both** sufficient to store LLM parameters in non-offloading serving. FlexFlow Serve combines tensor and pipeline model parallelism for LLM serving.
 ```python
 import flexflow.serve as ff
 
 ff.init(
-    {
-        "num_gpus": 4,
-        "memory_per_gpu": 14000,
-        "zero_copy_memory_per_node": 30000,
-        "tensor_parallelism_degree": 4,
-        "pipeline_parallelism_degree": 1,
-    }
-)
+        num_gpus=4,
+        memory_per_gpu=14000,
+        zero_copy_memory_per_node=30000,
+        tensor_parallelism_degree=4,
+        pipeline_parallelism_degree=1
+    )
 ```
 Second, we specify the LLM to serve and the SSM(s) used to accelerate LLM serving. The list of supported LLMs and SSMs is available at [supported models](#supported-llms-and-ssms).
 ```python
@@ -69,16 +68,14 @@ result = llm.generate("Here are some travel tips for Tokyo:\n")
 
 import flexflow.serve as ff
 
-# Initialize the FlexFlow runtime. ff.init() takes a dictionary or the path to a JSON file with the configs
+# Initialize the FlexFlow runtime. ff.init() takes a dictionary (as a positional argument) or named key-value parameters
 ff.init(
-    {
-        "num_gpus": 4,
-        "memory_per_gpu": 14000,
-        "zero_copy_memory_per_gpu": 30000,
-        "tensor_parallelism_degree": 4,
-        "pipeline_parallelism_degree": 1,
-    }
-)
+        num_gpus=4,
+        memory_per_gpu=14000,
+        zero_copy_memory_per_node=30000,
+        tensor_parallelism_degree=4,
+        pipeline_parallelism_degree=1
+    )
 
 # Create the FlexFlow LLM
 llm = ff.LLM("decapoda-research/llama-7b-hf")
@@ -189,7 +186,10 @@ We provide five prompt datasets for evaluating FlexFlow Serve: [Chatbot instruct
 
 FlexFlow Serve is still under active development. We currently focus on the following tasks and strongly welcome all contributions from bug fixes to new features and extensions.
 
-* AMD support. We are actively working on supporting FlexFlow Serve on AMD GPUs and welcome any contributions to this effort. 
+* AMD benchmarking. We are actively working on benchmarking FlexFlow Serve on AMD GPUs and comparing it with the performance on NVIDIA GPUs.
+* Chatbot prompt templates and Multi-round conversations
+* Support for FastAPI server
+* Integration with LangChain for document question answering
 
 ## Acknowledgements
 This project is initiated by members from CMU, Stanford, and UCSD. We will be continuing developing and supporting FlexFlow Serve. Please cite FlexFlow Serve as:
diff --git a/docker/README.md b/docker/README.md
index 916b78acf6..b7ec7c3631 100644
--- a/docker/README.md
+++ b/docker/README.md
@@ -2,50 +2,61 @@
 This folder contains the Dockerfiles and scripts that you can use to quickly run FlexFlow with no manual installation required. To use the containers, follow the steps below.
 
 ## Prerequisites
-You will need a machine with a NVIDIA GPU, with drivers installed. You will also need to have Docker and the [Nvidia Container Toolkit](https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/install-guide.html#getting-started) installed on the host machine.
+You can build and run the FlexFlow Docker images on any machine, but if you want to train or serve a model, you will need a machine with a NVIDIA or AMD GPU, with drivers installed. You will also need to have Docker and the [Nvidia Container Toolkit](https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/install-guide.html#getting-started) installed on the host machine. If using an AMD GPU, follow the [Deploy ROCm Docker containers](https://rocm.docs.amd.com/en/latest/deploy/docker.html) instructions.
 
 ## Downloading a pre-built package
 The fastest way to run FlexFlow is to use one of the pre-built containers, which we update for each commit to the `inference` branch (the `inference` branch is currently ahead of the `master` branch). The available containers are the following, and can be found [at this link](https://github.com/orgs/flexflow/packages?repo_name=FlexFlow):
 
-* `flexflow`: the pre-built version of FlexFlow. We currently publish one version targeting GPUs with a `hip_rocm` backend (`flexflow-hip_rocm`), and several versions for CUDA GPUs (one for each of the following CUDA versions 11.1, 11.2, 11.3, 11.5, 11.6, 11.7, and 11.8). The CUDA images are named `flexflow-cuda-<CUDA version>`, e.g. [flexflow-cuda-11.8](https://github.com/orgs/flexflow/packages/container/package/flexflow-cuda-11.8)
-* `flexflow-environment`: this is the base layer for `flexflow`. The packages are used in CI or for internal use, and contain all the dependencies needed to build/run Flexflow. You may find them useful if you want to build FlexFlow yourself. We also publish one version of `flexflow-environment` for `hip_rocm` and one for each CUDA version in the list above. The naming convention is similar, too. For example, the `flexflow-environment` image for CUDA 11.8 is tagged [flexflow-environment-cuda-11.8](https://github.com/orgs/flexflow/packages/container/package/flexflow-environment-cuda-11.8).
+* `flexflow`: the pre-built version of FlexFlow. We currently publish four version targeting AMD GPUs (ROCm versions: 5.3, 5.4, 5.5 and 5.6 ), and several versions for CUDA GPUs (CUDA versions: 11.1, 11.2, 11.3, 11.4, 11.5, 11.6, 11.7, 11.8 and 12.0). The CUDA images are named `flexflow-<GPU backend>-<GPU software version>`, e.g. [flexflow-hip_rocm-5.6](https://github.com/flexflow/FlexFlow/pkgs/container/flexflow-hip_rocm-5.6) or [flexflow-cuda-12.0](https://github.com/orgs/flexflow/packages/container/package/flexflow-cuda-12.0) or 
+* `flexflow-environment`: this is the base layer for `flexflow`. The packages are used in CI or for internal use, and contain all the dependencies needed to build/run Flexflow. You may find them useful if you want to build FlexFlow yourself. We also publish four version of `flexflow-environment` for AMD GPUs and, for NVIDIA GPUs, one for each CUDA version in the list above. The naming convention is similar, too. For example, the `flexflow-environment` image for CUDA 12.0 is tagged [flexflow-environment-cuda-12.0](https://github.com/orgs/flexflow/packages/container/package/flexflow-environment-cuda-12.0).
 
 The easiest way to download any of the Docker containers above is to call:
 
 ```
-FF_GPU_BACKEND=<YOUR_GPU_BACKEND> cuda_version=<DESIRED_CUDA_VERSION> ./docker/pull.sh <CONTAINER_NAME>
+./docker/pull.sh <CONTAINER_NAME>
 ```
 
-where `CONTAINER_NAME` is `flexflow` (or `flexflow-environment`), and `FF_GPU_BACKEND`/`cuda_version` are optional environment variables you can use if you wish to download the docker image for a GPU backend and/or cuda version other than those installed on your machine (leaving these variables unset will let the script autodetect which version to download depending on your setup).
+where `CONTAINER_NAME` is `flexflow` (or `flexflow-environment`). By default, the script will assume a NVIDIA backend and attempt to detect the CUDA version on your machine, to download the relevant container. If your machine has AMD GPUs, or no GPUs, or if you want to specify  the CUDA/ROCM version to download, set the environment variables below:
+
+* `FF_GPU_BACKEND` (supported options: `cuda`, `hip_rocm`) to specify the GPU backend of the Docker container to be downloaded.
+* `cuda_version` (supported options: 11.1, 11.2, 11.3, 11.4, 11.5, 11.6, 11.7, 11.8 and 12.0) to specify the CUDA version, when using a `cuda` backend. If `FF_GPU_BACKEND` is set to `hip_rocm`, the `cuda_version` env will be ignored
+* `hip_version` (supported options: 5.3, 5.4, 5.5, 5.6) to specify the ROCm version, when using a HIP backend. If `FF_GPU_BACKEND` is set to `cuda`, the `hip_version` env will be ignored.
+
 
 After downloading a container you can use the `run.sh` script to run it by following the instructions in the section below.
 
 ## Building a Docker container from scratch
-If you prefer to build one of the Docker containers from scratch, you can do so with the help of the `build.sh` script. You can configure the build via the same environment variables that you'd use to configure a CMake build (refer to the [Installation guide](../INSTALL.md) and to the `config/config.linux` file). For example, to build for a CUDA backend, you can export `FF_GPU_BACKEND=cuda` (you can also omit this since `cuda` is the default value for `FF_GPU_BACKEND`). When building for the `cuda` backend, you can pick the CUDA version by setting the optional environment variable `cuda_version`, e.g.: `export cuda_version=11.8`. Leaving the `cuda_version` variable blank will let the script autodetect the CUDA version installed on the host machine, and build for that version. Setting the `cuda_version` env will have no effect when building for a GPU backend other than CUDA.
+If you prefer to build one of the Docker containers from scratch, you can do so with the help of the `build.sh` script. You can configure the build via the same environment variables that you'd use to configure a CMake build (refer to the [Installation guide](https://flexflow.readthedocs.io/en/latest/installation.html) and to the `config/config.linux` file). For example, to build for a CUDA backend, you can export `FF_GPU_BACKEND=cuda` (you can also omit this since `cuda` is the default value for `FF_GPU_BACKEND`). When building for the `cuda` backend, you can pick the CUDA version by setting the optional environment variable `cuda_version`, e.g.: `export cuda_version=12.0`. Leaving the `cuda_version` variable blank will let the script autodetect the CUDA version installed on the host machine, and build for that version. Setting the `cuda_version` env will have no effect when building for a GPU backend other than CUDA. Similarly, you can pick the ROCm version by setting `hip_version` when the backend is `FF_GPU_BACKEND=hip_rocm`, whereas the env will be ignored for non-HIP backends.
 
 To build the FlexFlow container, run (the `flexflow` argument of the build script can be omitted):
 
 ```
-FF_GPU_BACKEND=<YOUR_GPU_BACKEND> cuda_version=<DESIRED_CUDA_VERSION> ./docker/build.sh flexflow
+./docker/build.sh flexflow
 ```
 
 If you only want to build the `flexflow-environment` image (the base layers of the `flexflow` container, used in CI and for other internal purposes), run:
 
 ```
-FF_GPU_BACKEND=<YOUR_GPU_BACKEND> cuda_version=<DESIRED_CUDA_VERSION> ./docker/build.sh flexflow-environment
+./docker/build.sh flexflow-environment
 ``` 
 
 ## Running a Docker container
-After having either built or downloaded a Docker container by following the instructions above, you can run it with the following command (image name argument of the run script can be omitted). Once again, you can set the `FF_GPU_BACKEND` and `cuda_version` optional environment variables to run the docker image with the desired GPU backend and CUDA version. Leaving these variables unset will instruct the script to autodetect the GPU backend and CUDA version installed on the current machine and run the Docker container with it if available.
+After having either built or downloaded a Docker container by following the instructions above, you can run it with the following command (image name argument of the run script can be omitted). Once again, you can set the `FF_GPU_BACKEND`, `cuda_version` and `hip_version` optional environment variables to run the docker image with the desired GPU backend and CUDA/HIP version:
+
+* `FF_GPU_BACKEND` (supported options: `cuda`, `hip_rocm`) to specify the GPU backend of the Docker container to be run.
+* `cuda_version` (supported options: 11.1, 11.2, 11.3, 11.4, 11.5, 11.6, 11.7, 11.8 and 12.0) to specify the CUDA version, when using a `cuda` backend. If `FF_GPU_BACKEND` is set to `hip_rocm`, the `cuda_version` env will be ignored
+* `hip_version` (supported options: 5.3, 5.4, 5.5, 5.6) to specify the ROCm version, when using a HIP backend. If `FF_GPU_BACKEND` is set to `cuda`, the `hip_version` env will be ignored.
+
+Leaving these variables unset will assume a GPU backend, and instruct the script to autodetect the CUDA version installed on the current machine and run the Docker container with it if available.
 
 ```
-FF_GPU_BACKEND=<YOUR_GPU_BACKEND> cuda_version=<DESIRED_CUDA_VERSION> ./docker/run.sh --image_name flexflow
+./docker/run.sh --image_name flexflow
 ```
 
 If you wish to run the `flexflow-environment` container, run:
 
 ```
-FF_GPU_BACKEND=<YOUR_GPU_BACKEND> cuda_version=<DESIRED_CUDA_VERSION> ./docker/run.sh --image_name flexflow-environment
+./docker/run.sh --image_name flexflow-environment
 ```
 
 N.B.: If you don't have GPUs available on the machine, or you wish to run the docker image without attaching GPUs, you can set the environment variable `ATTACH_GPUS=false` before running the script.
diff --git a/docs/source/jupyter.rst b/docs/source/jupyter.rst
deleted file mode 100644
index 2e37bfb183..0000000000
--- a/docs/source/jupyter.rst
+++ /dev/null
@@ -1,6 +0,0 @@
-*****************
-Jupyter Notebook
-*****************
-
-.. mdinclude:: ../../jupyter_notebook/README.md
-   :start-line: 2
diff --git a/jupyter_notebook/README.md b/jupyter_notebook/README.md
index 70d94f0f16..fe25df6dbf 100644
--- a/jupyter_notebook/README.md
+++ b/jupyter_notebook/README.md
@@ -9,7 +9,7 @@ the in-browser jupyter notebook UI.
 ## Quick Start
 ### Pre-requisite
 * Python >= 3.6
-* FlexFlow Python binding needs to be installed, please check the [installation guide](https://github.com/flexflow/FlexFlow/blob/master/INSTALL.md)
+* FlexFlow Python binding needs to be installed, please check the [installation guide](https://flexflow.readthedocs.io/en/latest/installation.html)
 * Install Jupyter notebook
 
         pip install notebook

From b2ec6cb5d2b898db1ad4df32adf5699bc48aaac7 Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Sun, 3 Sep 2023 10:15:07 -0400
Subject: [PATCH 221/344] fix group attention issue (#1062)

* fix

* tp degree > num_kv_heads

---------

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 python/flexflow/serve/models/llama.py        | 10 +++++++---
 src/ops/inc_multihead_self_attention.cc      |  4 +++-
 src/ops/tree_inc_multihead_self_attention.cc |  4 +++-
 3 files changed, 13 insertions(+), 5 deletions(-)

diff --git a/python/flexflow/serve/models/llama.py b/python/flexflow/serve/models/llama.py
index c716bff34d..9eacccfda6 100644
--- a/python/flexflow/serve/models/llama.py
+++ b/python/flexflow/serve/models/llama.py
@@ -26,6 +26,7 @@ def __init__(self, hf_config):
         self.num_hidden_layers = hf_config.num_hidden_layers
         self.vocab_size = hf_config.vocab_size
         self.num_attention_heads = hf_config.num_attention_heads
+        self.num_key_value_heads = hf_config.num_attention_heads if hf_config.num_key_value_heads is None else hf_config.num_key_value_heads
         self.hidden_size = hf_config.hidden_size
         self.rms_norm_eps = hf_config.rms_norm_eps
         self.intermediate_size = hf_config.intermediate_size
@@ -106,10 +107,11 @@ def build_model(self):
             )
 
             if self.mode == InferenceMode.BEAM_SEARCH_MODE:
-                mha = ffmodel.spec_inc_multihead_self_attention(
+                mha = ffmodel.spec_inc_multiquery_self_attention(
                     attn_norm,
                     self.llama_config.hidden_size,
                     self.llama_config.num_attention_heads,
+                    self.llama_config.num_key_value_heads,
                     self.llama_config.hidden_size
                     // self.llama_config.num_attention_heads,
                     self.llama_config.hidden_size
@@ -124,10 +126,11 @@ def build_model(self):
                     name=f"layers_{i}_attention_weight",
                 )
             elif self.mode == InferenceMode.TREE_VERIFY_MODE:
-                mha = ffmodel.inc_multihead_self_attention_verify(
+                mha = ffmodel.inc_multiquery_self_attention_verify(
                     attn_norm,
                     self.llama_config.hidden_size,
                     self.llama_config.num_attention_heads,
+                    self.llama_config.num_key_value_heads,
                     self.llama_config.hidden_size
                     // self.llama_config.num_attention_heads,
                     self.llama_config.hidden_size
@@ -142,10 +145,11 @@ def build_model(self):
                     name=f"layers_{i}_attention_weight",
                 )
             elif self.mode == InferenceMode.INC_DECODING_MODE:
-                mha = ffmodel.inc_multihead_self_attention(
+                mha = ffmodel.inc_multiquery_self_attention(
                     attn_norm,
                     self.llama_config.hidden_size,
                     self.llama_config.num_attention_heads,
+                    self.llama_config.num_key_value_heads,
                     self.llama_config.hidden_size
                     // self.llama_config.num_attention_heads,
                     self.llama_config.hidden_size
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index f4f64aee8a..ec8bc8839e 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -674,7 +674,9 @@ OpMeta *IncMultiHeadSelfAttention::init_task(
   assert(attn->qoSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
   assert(attn->kvSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
   int num_q_heads = attn->num_q_heads / attn->tensor_parallelism_degree;
-  int num_kv_heads = attn->num_kv_heads / attn->tensor_parallelism_degree;
+  int num_kv_heads =
+      attn->num_kv_heads / attn->tensor_parallelism_degree +
+      (attn->num_kv_heads % attn->tensor_parallelism_degree != 0);
 
   assert(attn->oProjSize == output.domain.hi()[0] - output.domain.lo()[0] + 1);
 
diff --git a/src/ops/tree_inc_multihead_self_attention.cc b/src/ops/tree_inc_multihead_self_attention.cc
index f10c9a8f0f..e26c306cf1 100644
--- a/src/ops/tree_inc_multihead_self_attention.cc
+++ b/src/ops/tree_inc_multihead_self_attention.cc
@@ -676,7 +676,9 @@ OpMeta *TreeIncMultiHeadSelfAttention::init_task(
   assert(attn->kvSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
   // int num_q_heads = weight.domain.hi()[1] - weight.domain.lo()[1] + 1;
   int num_q_heads = attn->num_q_heads / attn->tensor_parallelism_degree;
-  int num_kv_heads = attn->num_kv_heads / attn->tensor_parallelism_degree;
+  int num_kv_heads =
+      attn->num_kv_heads / attn->tensor_parallelism_degree +
+      (attn->num_kv_heads % attn->tensor_parallelism_degree != 0);
 
   assert(attn->oProjSize == output.domain.hi()[0] - output.domain.lo()[0] + 1);
 

From 1f5fe029fafa649d1bb2bc18266d307596876f7a Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 5 Sep 2023 21:09:21 -0400
Subject: [PATCH 222/344] Add method to initialize FlexFlow runtime (#1089)

* added init to flexflow core, native support of jupyter

* cleanup

* update workflows

* fix

* fixed warnings

* fix

* fix

* update build

* install nccl in ci for faster workflows

* add jq to dependencies

* cleanup

* fix python tests

* fix

* fix legion python issue

* fix

* fix

* fix

* fix

* fix

* fix

* fix

* remove more warnings

* remove redundant function

* fix

* fix

* remove debug prints

* install jupyter notebook in docker

---------

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 .github/workflows/build.yml                   |   8 +-
 .github/workflows/docker-build.yml            |   6 +-
 .github/workflows/helpers/install_cudnn.sh    |   2 +-
 .../workflows/helpers/install_dependencies.sh |   4 +-
 .github/workflows/helpers/install_nccl.sh     |  51 +++
 .github/workflows/pip-install.yml             |   5 +-
 INSTALL.md                                    |   2 +-
 conda/environment.yml                         |   1 +
 conda/flexflow.yml                            |   1 +
 docker/flexflow-environment/Dockerfile        |   4 +-
 examples/python/keras/callback.py             |   3 +
 examples/python/keras/elementwise_max_min.py  |   4 +-
 .../python/keras/elementwise_mul_broadcast.py |   5 +-
 examples/python/keras/func_cifar10_alexnet.py |   2 +
 examples/python/keras/func_cifar10_cnn.py     |   3 +
 .../python/keras/func_cifar10_cnn_concat.py   |   2 +
 .../keras/func_cifar10_cnn_concat_model.py    |   3 +
 .../func_cifar10_cnn_concat_seq_model.py      |   3 +
 .../python/keras/func_cifar10_cnn_nested.py   |   3 +
 .../python/keras/func_cifar10_cnn_net2net.py  |   2 +
 examples/python/keras/func_mnist_cnn.py       |   3 +
 .../python/keras/func_mnist_cnn_concat.py     |   3 +
 examples/python/keras/func_mnist_mlp.py       |   3 +
 .../python/keras/func_mnist_mlp_concat.py     |   3 +
 .../python/keras/func_mnist_mlp_concat2.py    |   3 +
 .../python/keras/func_mnist_mlp_net2net.py    |   5 +-
 examples/python/keras/gather.py               |   4 +-
 examples/python/keras/identity_loss.py        |   4 +-
 examples/python/keras/reduce_sum.py           |   4 +-
 examples/python/keras/regularizer.py          |   4 +-
 examples/python/keras/reshape.py              |   3 +
 examples/python/keras/rsqrt.py                |   4 +-
 examples/python/keras/seq_cifar10_cnn.py      |   3 +
 examples/python/keras/seq_mnist_cnn.py        |   3 +
 examples/python/keras/seq_mnist_cnn_nested.py |   3 +
 .../python/keras/seq_mnist_cnn_net2net.py     |   3 +
 examples/python/keras/seq_mnist_mlp.py        |   3 +
 .../python/keras/seq_mnist_mlp_net2net.py     |   3 +
 examples/python/keras/seq_reuters_mlp.py      |   4 +
 examples/python/keras/unary.py                |   4 +-
 examples/python/native/alexnet.py             |  13 +-
 examples/python/native/cifar10_cnn.py         |  13 +-
 examples/python/native/cifar10_cnn_attach.py  |   2 +
 examples/python/native/cifar10_cnn_concat.py  |   4 +
 examples/python/native/mnist_cnn.py           |  13 +-
 examples/python/native/mnist_mlp.py           |  13 +-
 examples/python/native/mnist_mlp_attach.py    |   2 +
 examples/python/native/print_layers.py        |   3 +
 examples/python/native/split.py               |   3 +
 include/flexflow/config.h                     |   2 +-
 include/flexflow/machine_view.h               |   2 +-
 include/flexflow/ops/sampling.h               |   2 +-
 include/flexflow/utils/hip_helper.h           |   2 +-
 inference/utils/download_hf_model.py          |   3 -
 python/flexflow/config.py                     |  69 ++-
 python/flexflow/core/__init__.py              | 162 +++++--
 python/flexflow/core/flexflow_cffi.py         | 401 +++++++++---------
 python/flexflow/flexflow_python               |   3 +-
 python/flexflow/jupyter.py                    |  37 --
 python/flexflow/serve/__init__.py             | 229 +++++-----
 python/flexflow_python_build.py               |   8 +-
 src/ops/inc_multihead_self_attention.cpp      |  47 +-
 src/ops/spec_inc_multihead_self_attention.cpp |  50 ++-
 src/ops/tree_inc_multihead_self_attention.cpp |  45 +-
 tests/align/align_create_tensor_ff.py         |  12 +-
 tests/align/align_utils.py                    |   7 +-
 tests/align/test_all_operators.sh             |   2 +-
 tests/cpp_gpu_tests.sh                        |  10 -
 tests/multi_gpu_tests.sh                      | 101 +++--
 tests/multinode_helpers/mpi_wrapper1.sh       |   1 -
 tests/multinode_helpers/mpi_wrapper2.sh       |  11 +-
 tests/python_interface_test.sh                |  19 +-
 72 files changed, 853 insertions(+), 621 deletions(-)
 create mode 100755 .github/workflows/helpers/install_nccl.sh
 delete mode 100644 python/flexflow/jupyter.py

diff --git a/.github/workflows/build.yml b/.github/workflows/build.yml
index 1c6eff4a12..d05856f1a9 100644
--- a/.github/workflows/build.yml
+++ b/.github/workflows/build.yml
@@ -67,7 +67,7 @@ jobs:
         uses: conda-incubator/setup-miniconda@v2
         with:
           activate-environment: flexflow
-          environment-file: conda/environment.yml
+          environment-file: conda/flexflow.yml
           auto-activate-base: false
 
       - name: Build FlexFlow
@@ -131,15 +131,14 @@ jobs:
           cd build
           ./tests/unit/unit-test
 
-      - name: Check availability of Python flexflow.core module
+      - name: Check availability of flexflow modules in Python
         run: |
           if [[ "${FF_GPU_BACKEND}" == "cuda" ]]; then
             export LD_LIBRARY_PATH="$CUDA_PATH/lib64/stubs:$LD_LIBRARY_PATH"
           fi
           # Remove build folder to check that the installed version can run independently of the build files
           rm -rf build
-          export CPU_ONLY_TEST=1
-          python -c "import flexflow.core; exit()"
+          python -c "import flexflow.core; import flexflow.serve as ff; exit()"
 
   makefile-build:
     name: Build FlexFlow with the Makefile
@@ -186,5 +185,4 @@ jobs:
 
           cd python
           make -j $n_build_cores
-          export CPU_ONLY_TEST=1
           python -c 'import flexflow.core'
diff --git a/.github/workflows/docker-build.yml b/.github/workflows/docker-build.yml
index b0ca251510..2234ec60aa 100644
--- a/.github/workflows/docker-build.yml
+++ b/.github/workflows/docker-build.yml
@@ -100,7 +100,7 @@ jobs:
             echo "Skipping build to save time"
           fi
 
-      - name: Check availability of Python flexflow.core module
+      - name: Check availability of flexflow modules in Python
         if: ${{ matrix.gpu_backend == 'cuda' }}
         env:
           deploy_needed: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && env.branch_name == 'inference' }}
@@ -108,9 +108,9 @@ jobs:
         run: |
           if [[ $deploy_needed == "true" || $build_needed == "true" ]]; then
             if [[ $FF_GPU_BACKEND == "cuda" ]]; then
-              docker run --env CPU_ONLY_TEST=1 --entrypoint /bin/bash flexflow-${FF_GPU_BACKEND}-${gpu_backend_version}:latest -c "export LD_LIBRARY_PATH=/usr/local/cuda/lib64/stubs:$LD_LIBRARY_PATH; sudo ln -s /usr/local/cuda/lib64/stubs/libcuda.so /usr/local/cuda/lib64/stubs/libcuda.so.1; python -c 'import flexflow.core; exit()'"
+              docker run --entrypoint /bin/bash flexflow-${FF_GPU_BACKEND}-${gpu_backend_version}:latest -c "export LD_LIBRARY_PATH=/usr/local/cuda/lib64/stubs:$LD_LIBRARY_PATH; sudo ln -s /usr/local/cuda/lib64/stubs/libcuda.so /usr/local/cuda/lib64/stubs/libcuda.so.1; python -c 'import flexflow.core; import flexflow.serve as ff; exit()'"
             else
-              docker run --env CPU_ONLY_TEST=1 --entrypoint /bin/bash flexflow-${FF_GPU_BACKEND}-${gpu_backend_version}:latest -c "python -c 'import flexflow.core; exit()'"
+              docker run --entrypoint /bin/bash flexflow-${FF_GPU_BACKEND}-${gpu_backend_version}:latest -c "python -c 'import flexflow.core; import flexflow.serve as ff; exit()'"
             fi
           else
             echo "Skipping test to save time"
diff --git a/.github/workflows/helpers/install_cudnn.sh b/.github/workflows/helpers/install_cudnn.sh
index 75e59109eb..7c11a4a420 100755
--- a/.github/workflows/helpers/install_cudnn.sh
+++ b/.github/workflows/helpers/install_cudnn.sh
@@ -44,7 +44,7 @@ elif [[ "$cuda_version" == "11.7" ]]; then
 elif [[ "$cuda_version" == "11.8" ]]; then
     CUDNN_LINK=https://developer.download.nvidia.com/compute/redist/cudnn/v8.7.0/local_installers/11.8/cudnn-linux-x86_64-8.7.0.84_cuda11-archive.tar.xz
     CUDNN_TARBALL_NAME=cudnn-linux-x86_64-8.7.0.84_cuda11-archive.tar.xz
-elif [[ "$cuda_version" == "11.8" ]]; then
+elif [[ "$cuda_version" == "12.0" ]]; then
     echo "CUDNN support for CUDA version 12.0 not yet added"
     exit 1
 fi
diff --git a/.github/workflows/helpers/install_dependencies.sh b/.github/workflows/helpers/install_dependencies.sh
index 1357882b5d..6435a37eea 100755
--- a/.github/workflows/helpers/install_dependencies.sh
+++ b/.github/workflows/helpers/install_dependencies.sh
@@ -7,7 +7,7 @@ cd "${BASH_SOURCE[0]%/*}"
 
 # General dependencies
 echo "Installing apt dependencies..."
-sudo apt-get update && sudo apt-get install -y --no-install-recommends wget binutils git zlib1g-dev libhdf5-dev && \
+sudo apt-get update && sudo apt-get install -y --no-install-recommends wget binutils git zlib1g-dev libhdf5-dev jq && \
     sudo rm -rf /var/lib/apt/lists/*
 
 FF_GPU_BACKEND=${FF_GPU_BACKEND:-"cuda"}
@@ -20,6 +20,8 @@ fi
 if [[ "$FF_GPU_BACKEND" == "cuda" || "$FF_GPU_BACKEND" = "hip_cuda" ]]; then
     # Install CUDNN
     ./install_cudnn.sh
+    # Install NCCL
+    ./install_nccl.sh
 fi
 # Install HIP dependencies if needed
 if [[ "$FF_GPU_BACKEND" == "hip_cuda" || "$FF_GPU_BACKEND" = "hip_rocm" ]]; then
diff --git a/.github/workflows/helpers/install_nccl.sh b/.github/workflows/helpers/install_nccl.sh
new file mode 100755
index 0000000000..ca88668d84
--- /dev/null
+++ b/.github/workflows/helpers/install_nccl.sh
@@ -0,0 +1,51 @@
+#!/bin/bash
+set -euo pipefail
+set -x
+
+# Cd into directory holding this script
+cd "${BASH_SOURCE[0]%/*}"
+
+# Add NCCL key ring
+ubuntu_version=$(lsb_release -rs)
+ubuntu_version=${ubuntu_version//./}
+wget "https://developer.download.nvidia.com/compute/cuda/repos/ubuntu${ubuntu_version}/x86_64/cuda-keyring_1.0-1_all.deb"
+sudo dpkg -i cuda-keyring_1.0-1_all.deb
+sudo apt update -y
+rm -f cuda-keyring_1.0-1_all.deb
+
+# Install NCCL
+cuda_version=${1:-11.8.0}
+cuda_version=$(echo "${cuda_version}" | cut -f1,2 -d'.')
+echo "Installing NCCL for CUDA version: ${cuda_version} ..."
+
+# We need to run a different install command based on the CUDA version, otherwise running `sudo apt install libnccl2 libnccl-dev`
+# will automatically upgrade CUDA to the latest version.
+
+if [[ "$cuda_version" == "11.0" ]]; then
+    sudo apt install libnccl2=2.15.5-1+cuda11.0 libnccl-dev=2.15.5-1+cuda11.0
+elif [[ "$cuda_version" == "11.1" ]]; then
+    sudo apt install libnccl2=2.8.4-1+cuda11.1 libnccl-dev=2.8.4-1+cuda11.1
+elif [[ "$cuda_version" == "11.2" ]]; then
+    sudo apt install libnccl2=2.8.4-1+cuda11.2 libnccl-dev=2.8.4-1+cuda11.2
+elif [[ "$cuda_version" == "11.3" ]]; then
+    sudo apt install libnccl2=2.9.9-1+cuda11.3 libnccl-dev=2.9.9-1+cuda11.3
+elif [[ "$cuda_version" == "11.4" ]]; then
+    sudo apt install libnccl2=2.11.4-1+cuda11.4 libnccl-dev=2.11.4-1+cuda11.4
+elif [[ "$cuda_version" == "11.5" ]]; then
+    sudo apt install libnccl2=2.11.4-1+cuda11.5 libnccl-dev=2.11.4-1+cuda11.5
+elif [[ "$cuda_version" == "11.6" ]]; then
+    sudo apt install libnccl2=2.12.12-1+cuda11.6 libnccl-dev=2.12.12-1+cuda11.6
+elif [[ "$cuda_version" == "11.7" ]]; then
+    sudo apt install libnccl2=2.14.3-1+cuda11.7 libnccl-dev=2.14.3-1+cuda11.7
+elif [[ "$cuda_version" == "11.8" ]]; then
+    sudo apt install libnccl2=2.16.5-1+cuda11.8 libnccl-dev=2.16.5-1+cuda11.8
+elif [[ "$cuda_version" == "12.0" ]]; then
+    sudo apt install libnccl2=2.18.3-1+cuda12.0 libnccl-dev=2.18.3-1+cuda12.0
+elif [[ "$cuda_version" == "12.1" ]]; then
+    sudo apt install libnccl2=2.18.3-1+cuda12.1 libnccl-dev=2.18.3-1+cuda12.1
+elif [[ "$cuda_version" == "12.2" ]]; then
+    sudo apt install libnccl2=2.18.3-1+cuda12.2 libnccl-dev=2.18.3-1+cuda12.2
+else
+    echo "Installing NCCL for CUDA version ${cuda_version} is not supported"
+    exit 1
+fi
diff --git a/.github/workflows/pip-install.yml b/.github/workflows/pip-install.yml
index 695ed9857b..3562134987 100644
--- a/.github/workflows/pip-install.yml
+++ b/.github/workflows/pip-install.yml
@@ -69,9 +69,8 @@ jobs:
           # Remove build folder to check that the installed version can run independently of the build files
           rm -rf build
 
-      - name: Check availability of Python flexflow.core module
+      - name: Check availability of flexflow modules in Python
         run: |
           export LD_LIBRARY_PATH="$CUDA_PATH/lib64/stubs:$LD_LIBRARY_PATH"
           sudo ln -s "$CUDA_PATH/lib64/stubs/libcuda.so" "$CUDA_PATH/lib64/stubs/libcuda.so.1"
-          export CPU_ONLY_TEST=1
-          python -c "import flexflow.core; exit()"
+          python -c 'import flexflow.core; import flexflow.serve as ff; exit()'
diff --git a/INSTALL.md b/INSTALL.md
index 72993f3330..a197df24ed 100644
--- a/INSTALL.md
+++ b/INSTALL.md
@@ -30,7 +30,7 @@ If you are planning to build the Python interface, you will need to install seve
 
 The `conda` environment can be created and activated as:
 ```
-conda env create -f conda/environment.yml
+conda env create -f conda/flexflow.yml
 conda activate flexflow
 ```
 
diff --git a/conda/environment.yml b/conda/environment.yml
index c1acd7b3da..9ae0dc9c7a 100644
--- a/conda/environment.yml
+++ b/conda/environment.yml
@@ -9,6 +9,7 @@ dependencies:
   - pybind11
   - rust
   - cmake-build-extension
+  - jq
   - pip
   - pip:
     - qualname>=0.1.0
diff --git a/conda/flexflow.yml b/conda/flexflow.yml
index 9ff7f3957a..c9226269f2 100644
--- a/conda/flexflow.yml
+++ b/conda/flexflow.yml
@@ -9,6 +9,7 @@ dependencies:
   - pybind11
   - rust
   - cmake-build-extension
+  - jq
   - pytest
   - pip
   - pip:
diff --git a/docker/flexflow-environment/Dockerfile b/docker/flexflow-environment/Dockerfile
index f1ebdcc28a..774c585b44 100644
--- a/docker/flexflow-environment/Dockerfile
+++ b/docker/flexflow-environment/Dockerfile
@@ -5,7 +5,7 @@ LABEL org.opencontainers.image.source=https://github.com/flexflow/FlexFlow
 LABEL org.opencontainers.image.description="FlexFlow environment container"
 
 # Install basic dependencies
-RUN apt-get update && apt-get install -y --no-install-recommends wget sudo binutils git zlib1g-dev lsb-release nano gdb libhdf5-dev && \
+RUN apt-get update && apt-get install -y --no-install-recommends wget sudo binutils git zlib1g-dev lsb-release nano gdb libhdf5-dev jq && \
     rm -rf /var/lib/apt/lists/* /etc/apt/sources.list.d/cuda.list /etc/apt/sources.list.d/nvidia-ml.list && \
 	apt-get update && DEBIAN_FRONTEND=noninteractive apt-get install -y --no-install-recommends software-properties-common && \
     apt-get update && DEBIAN_FRONTEND=noninteractive apt-get install -y --no-install-recommends build-essential apt-utils \
@@ -79,7 +79,7 @@ RUN conda install -c conda-forge cmake make pillow cmake-build-extension pybind1
 # Install CPU-only Pytorch and related dependencies
 RUN conda install pytorch torchvision torchaudio cpuonly -c pytorch
 RUN conda install -c conda-forge onnx transformers>=4.31.0 sentencepiece einops
-RUN pip3 install tensorflow
+RUN pip3 install tensorflow notebook
 
 # Install Rust
 RUN curl https://sh.rustup.rs -sSf | sh -s -- -y
diff --git a/examples/python/keras/callback.py b/examples/python/keras/callback.py
index f4ebc03d17..c647822957 100644
--- a/examples/python/keras/callback.py
+++ b/examples/python/keras/callback.py
@@ -20,6 +20,7 @@
 from flexflow.keras.datasets import cifar10
 from flexflow.keras import backend as K
 from accuracy import ModelAccuracy
+import flexflow.core as ff
 
 import numpy as np
 
@@ -68,4 +69,6 @@ def top_level_task():
 
 if __name__ == "__main__":
   print("Functional API, cifar10 cnn callback")
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   top_level_task()
diff --git a/examples/python/keras/elementwise_max_min.py b/examples/python/keras/elementwise_max_min.py
index 95291f1273..52a80b431b 100644
--- a/examples/python/keras/elementwise_max_min.py
+++ b/examples/python/keras/elementwise_max_min.py
@@ -1,5 +1,6 @@
 from flexflow.keras.layers import Dense, Input, Maximum, Minimum
 import flexflow.keras.optimizers
+import flexflow.core as ff
 
 import numpy as np
 
@@ -54,7 +55,8 @@ def elementwise_min():
     epochs = 2
   )
 
-
 if __name__ == '__main__':
+    configs = ff.get_configs()
+    ff.init_flexflow_runtime(configs)
     elementwise_max()
     elementwise_min()
diff --git a/examples/python/keras/elementwise_mul_broadcast.py b/examples/python/keras/elementwise_mul_broadcast.py
index d68476a6cb..1405871a7a 100644
--- a/examples/python/keras/elementwise_mul_broadcast.py
+++ b/examples/python/keras/elementwise_mul_broadcast.py
@@ -1,6 +1,6 @@
 from flexflow.keras.layers import Dense, Input, Reshape, Multiply
 import flexflow.keras.optimizers
-
+import flexflow.core as ff
 import numpy as np
 
 def broadcast1():
@@ -92,8 +92,9 @@ def broadcast_both():
     epochs = 2
   )
 
-
 if __name__ == '__main__':
+    configs = ff.get_configs()
+    ff.init_flexflow_runtime(configs)
     broadcast1()
     broadcast2()
     broadcast_both()
diff --git a/examples/python/keras/func_cifar10_alexnet.py b/examples/python/keras/func_cifar10_alexnet.py
index c0ade0b722..a4f8dc61ac 100644
--- a/examples/python/keras/func_cifar10_alexnet.py
+++ b/examples/python/keras/func_cifar10_alexnet.py
@@ -77,5 +77,7 @@ def top_level_task():
 
 if __name__ == "__main__":
   print("Functional API, cifar10 alexnet")
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   top_level_task()
   gc.collect()
diff --git a/examples/python/keras/func_cifar10_cnn.py b/examples/python/keras/func_cifar10_cnn.py
index 423541386f..ce0358da53 100644
--- a/examples/python/keras/func_cifar10_cnn.py
+++ b/examples/python/keras/func_cifar10_cnn.py
@@ -61,7 +61,10 @@ def top_level_task():
 
   model.fit(x_train, y_train, epochs=160, callbacks=[VerifyMetrics(ModelAccuracy.CIFAR10_CNN), EpochVerifyMetrics(ModelAccuracy.CIFAR10_CNN)])
 
+
 if __name__ == "__main__":
   print("Functional API, cifar10 cnn")
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   top_level_task()
   gc.collect()
diff --git a/examples/python/keras/func_cifar10_cnn_concat.py b/examples/python/keras/func_cifar10_cnn_concat.py
index 72dfdeffaf..4fe0f5ce18 100644
--- a/examples/python/keras/func_cifar10_cnn_concat.py
+++ b/examples/python/keras/func_cifar10_cnn_concat.py
@@ -75,5 +75,7 @@ def top_level_task():
 
 if __name__ == "__main__":
   print("Functional API, cifar10 cnn concat")
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   top_level_task()
   gc.collect()
diff --git a/examples/python/keras/func_cifar10_cnn_concat_model.py b/examples/python/keras/func_cifar10_cnn_concat_model.py
index 39885bac8c..c8838de1eb 100644
--- a/examples/python/keras/func_cifar10_cnn_concat_model.py
+++ b/examples/python/keras/func_cifar10_cnn_concat_model.py
@@ -75,7 +75,10 @@ def top_level_task():
 
   model.fit([x_train, x_train], y_train, epochs=160, callbacks=[VerifyMetrics(ModelAccuracy.CIFAR10_CNN), EpochVerifyMetrics(ModelAccuracy.CIFAR10_CNN)])
 
+
 if __name__ == "__main__":
   print("Functional API, cifar10 cnn concat model")
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   top_level_task()
   gc.collect()
diff --git a/examples/python/keras/func_cifar10_cnn_concat_seq_model.py b/examples/python/keras/func_cifar10_cnn_concat_seq_model.py
index cda95beb49..3e4f939283 100644
--- a/examples/python/keras/func_cifar10_cnn_concat_seq_model.py
+++ b/examples/python/keras/func_cifar10_cnn_concat_seq_model.py
@@ -68,7 +68,10 @@ def top_level_task():
 
   model.fit([x_train, x_train], y_train, epochs=160, callbacks=[VerifyMetrics(ModelAccuracy.CIFAR10_CNN), EpochVerifyMetrics(ModelAccuracy.CIFAR10_CNN)])
 
+
 if __name__ == "__main__":
   print("Functional API, cifar10 cnn concat sequential model")
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   top_level_task()
   gc.collect()
diff --git a/examples/python/keras/func_cifar10_cnn_nested.py b/examples/python/keras/func_cifar10_cnn_nested.py
index def8a6bcf4..7391ba5a2b 100644
--- a/examples/python/keras/func_cifar10_cnn_nested.py
+++ b/examples/python/keras/func_cifar10_cnn_nested.py
@@ -67,7 +67,10 @@ def top_level_task():
 
   model.fit(x_train, y_train, epochs=160, callbacks=[VerifyMetrics(ModelAccuracy.CIFAR10_CNN), EpochVerifyMetrics(ModelAccuracy.CIFAR10_CNN)])
 
+
 if __name__ == "__main__":
   print("Functional API, cifar10 cnn nested")
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   top_level_task()
   gc.collect()
diff --git a/examples/python/keras/func_cifar10_cnn_net2net.py b/examples/python/keras/func_cifar10_cnn_net2net.py
index 5434e28aca..695a1157dd 100644
--- a/examples/python/keras/func_cifar10_cnn_net2net.py
+++ b/examples/python/keras/func_cifar10_cnn_net2net.py
@@ -120,5 +120,7 @@ def top_level_task():
 
 if __name__ == "__main__":
   print("Functional API, cifarf10 cnn teach student")
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   top_level_task()
   gc.collect()
diff --git a/examples/python/keras/func_mnist_cnn.py b/examples/python/keras/func_mnist_cnn.py
index a81ddd0f94..8f2041dfe2 100644
--- a/examples/python/keras/func_mnist_cnn.py
+++ b/examples/python/keras/func_mnist_cnn.py
@@ -70,7 +70,10 @@ def top_level_task():
   
   model.fit(x_train, y_train, epochs=5, callbacks=[VerifyMetrics(ModelAccuracy.MNIST_CNN), EpochVerifyMetrics(ModelAccuracy.MNIST_CNN)])
 
+
 if __name__ == "__main__":
   print("Functional API, mnist cnn")
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   top_level_task()
   gc.collect()
diff --git a/examples/python/keras/func_mnist_cnn_concat.py b/examples/python/keras/func_mnist_cnn_concat.py
index 54c1f32d36..64bb2cdbb0 100644
--- a/examples/python/keras/func_mnist_cnn_concat.py
+++ b/examples/python/keras/func_mnist_cnn_concat.py
@@ -61,7 +61,10 @@ def top_level_task():
   
   model.fit(x_train, y_train, epochs=5, callbacks=[VerifyMetrics(ModelAccuracy.MNIST_CNN), EpochVerifyMetrics(ModelAccuracy.MNIST_CNN)])
 
+
 if __name__ == "__main__":
   print("Functional API, mnist cnn concat")
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   top_level_task()
   gc.collect()
diff --git a/examples/python/keras/func_mnist_mlp.py b/examples/python/keras/func_mnist_mlp.py
index 5521f193c1..ddf2022366 100644
--- a/examples/python/keras/func_mnist_mlp.py
+++ b/examples/python/keras/func_mnist_mlp.py
@@ -54,7 +54,10 @@ def top_level_task():
 
   model.fit(x_train, y_train, epochs=10, callbacks=[VerifyMetrics(ModelAccuracy.MNIST_MLP), EpochVerifyMetrics(ModelAccuracy.MNIST_MLP)])
 
+
 if __name__ == "__main__":
   print("Functional API, mnist mlp")
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   top_level_task()
   gc.collect()
diff --git a/examples/python/keras/func_mnist_mlp_concat.py b/examples/python/keras/func_mnist_mlp_concat.py
index 29b982cea8..6b282f65e6 100644
--- a/examples/python/keras/func_mnist_mlp_concat.py
+++ b/examples/python/keras/func_mnist_mlp_concat.py
@@ -76,7 +76,10 @@ def top_level_task():
 
   model.fit(x_train, y_train, epochs=5, callbacks=[VerifyMetrics(ModelAccuracy.MNIST_MLP), EpochVerifyMetrics(ModelAccuracy.MNIST_MLP)])
 
+
 if __name__ == "__main__":
   print("Functional API, mnist mlp concat")
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   top_level_task()
   gc.collect()
diff --git a/examples/python/keras/func_mnist_mlp_concat2.py b/examples/python/keras/func_mnist_mlp_concat2.py
index 5a35bd9f8b..b309a00187 100644
--- a/examples/python/keras/func_mnist_mlp_concat2.py
+++ b/examples/python/keras/func_mnist_mlp_concat2.py
@@ -87,7 +87,10 @@ def top_level_task():
 
   model.fit([x_train, x_train, x_train], y_train, epochs=10, callbacks=[VerifyMetrics(ModelAccuracy.MNIST_MLP), EpochVerifyMetrics(ModelAccuracy.MNIST_MLP)])
 
+
 if __name__ == "__main__":
   print("Functional API, mnist mlp concat with input")
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   top_level_task()
   gc.collect()
diff --git a/examples/python/keras/func_mnist_mlp_net2net.py b/examples/python/keras/func_mnist_mlp_net2net.py
index ed8589e22e..0b44029938 100644
--- a/examples/python/keras/func_mnist_mlp_net2net.py
+++ b/examples/python/keras/func_mnist_mlp_net2net.py
@@ -88,7 +88,10 @@ def top_level_task():
 
   student_model.fit(x_train, y_train, epochs=160, callbacks=[VerifyMetrics(ModelAccuracy.MNIST_MLP), EpochVerifyMetrics(ModelAccuracy.MNIST_MLP)])
 
+
 if __name__ == "__main__":
   print("Functional API, mnist mlp teach student")
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   top_level_task()
-  gc.collect()
\ No newline at end of file
+  gc.collect()
diff --git a/examples/python/keras/gather.py b/examples/python/keras/gather.py
index 15ccd61579..f14d737d17 100644
--- a/examples/python/keras/gather.py
+++ b/examples/python/keras/gather.py
@@ -1,7 +1,7 @@
 from flexflow.keras.layers import Dense, Input, Reshape
 from flexflow.keras.backend.internal import gather
 import flexflow.keras.optimizers
-
+import flexflow.core as ff
 import numpy as np
 
 
@@ -42,4 +42,6 @@ def gather_example():
 
 
 if __name__ == '__main__':
+    configs = ff.get_configs()
+    ff.init_flexflow_runtime(configs)
     gather_example()
diff --git a/examples/python/keras/identity_loss.py b/examples/python/keras/identity_loss.py
index d0396c6d46..8e26fc246b 100644
--- a/examples/python/keras/identity_loss.py
+++ b/examples/python/keras/identity_loss.py
@@ -15,7 +15,7 @@
 
 from flexflow.keras.layers import Dense, Input, Reshape, Multiply
 import flexflow.keras.optimizers
-
+import flexflow.core as ff
 import numpy as np
 
 def test_identity_loss():
@@ -36,4 +36,6 @@ def test_identity_loss():
 
 
 if __name__ == "__main__":
+    configs = ff.get_configs()
+    ff.init_flexflow_runtime(configs)
     test_identity_loss()
diff --git a/examples/python/keras/reduce_sum.py b/examples/python/keras/reduce_sum.py
index 3857738d4b..33030e2cec 100644
--- a/examples/python/keras/reduce_sum.py
+++ b/examples/python/keras/reduce_sum.py
@@ -15,7 +15,7 @@
 
 from flexflow.keras.layers import Dense, Input, Reshape, Multiply
 import flexflow.keras.optimizers
-
+import flexflow.core as ff
 import numpy as np
 
 def test_reduce_sum1():
@@ -74,6 +74,8 @@ def test_reduce_sum3():
 
 
 if __name__ == "__main__":
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   test_reduce_sum1()
   test_reduce_sum2()
   test_reduce_sum3()
diff --git a/examples/python/keras/regularizer.py b/examples/python/keras/regularizer.py
index 3b1e30d04d..3a24129db2 100644
--- a/examples/python/keras/regularizer.py
+++ b/examples/python/keras/regularizer.py
@@ -2,7 +2,7 @@
 from flexflow.keras.layers import Dense, Input, Reshape
 from flexflow.keras.backend.internal import gather
 import flexflow.keras.optimizers
-
+import flexflow.core as ff
 import numpy as np
 
 
@@ -26,4 +26,6 @@ def regularizer_example():
 
 
 if __name__ == '__main__':
+    configs = ff.get_configs()
+    ff.init_flexflow_runtime(configs)
     regularizer_example()
diff --git a/examples/python/keras/reshape.py b/examples/python/keras/reshape.py
index 1acce1b2b6..ae756a8f70 100644
--- a/examples/python/keras/reshape.py
+++ b/examples/python/keras/reshape.py
@@ -55,7 +55,10 @@ def top_level_task():
   print(model.summary())
   model.fit(x_train, y_train, epochs=10, callbacks=[VerifyMetrics(ModelAccuracy.MNIST_MLP), EpochVerifyMetrics(ModelAccuracy.MNIST_MLP)])
 
+
 if __name__ == "__main__":
   print("Functional API, mnist mlp")
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   top_level_task()
   gc.collect()
diff --git a/examples/python/keras/rsqrt.py b/examples/python/keras/rsqrt.py
index be55c8a1fd..e33873ecd5 100644
--- a/examples/python/keras/rsqrt.py
+++ b/examples/python/keras/rsqrt.py
@@ -16,7 +16,7 @@
 from flexflow.keras.layers import Dense, Input
 from flexflow.keras.backend.internal import rsqrt
 import flexflow.keras.optimizers
-
+import flexflow.core as ff
 import numpy as np
 
 def test_rsqrt():
@@ -40,4 +40,6 @@ def test_rsqrt():
 
 
 if __name__ == "__main__":
+    configs = ff.get_configs()
+    ff.init_flexflow_runtime(configs)
     test_rsqrt()
diff --git a/examples/python/keras/seq_cifar10_cnn.py b/examples/python/keras/seq_cifar10_cnn.py
index 80f4390d4c..281a09ed70 100644
--- a/examples/python/keras/seq_cifar10_cnn.py
+++ b/examples/python/keras/seq_cifar10_cnn.py
@@ -54,6 +54,9 @@ def top_level_task():
 
   model.fit(x_train, y_train, epochs=80, callbacks=[VerifyMetrics(ModelAccuracy.CIFAR10_CNN), EpochVerifyMetrics(ModelAccuracy.CIFAR10_CNN)])
 
+
 if __name__ == "__main__":
   print("Sequantial model, cifar10 cnn")
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   top_level_task()
diff --git a/examples/python/keras/seq_mnist_cnn.py b/examples/python/keras/seq_mnist_cnn.py
index eaf0fdfc16..09ad4ea4cf 100644
--- a/examples/python/keras/seq_mnist_cnn.py
+++ b/examples/python/keras/seq_mnist_cnn.py
@@ -55,6 +55,9 @@ def top_level_task():
 
   model.fit(x_train, y_train, epochs=5, callbacks=[VerifyMetrics(ModelAccuracy.MNIST_CNN), EpochVerifyMetrics(ModelAccuracy.MNIST_CNN)])
 
+
 if __name__ == "__main__":
   print("Sequential model, mnist cnn")
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   top_level_task()
diff --git a/examples/python/keras/seq_mnist_cnn_nested.py b/examples/python/keras/seq_mnist_cnn_nested.py
index 2c92349cd6..628129ddb9 100644
--- a/examples/python/keras/seq_mnist_cnn_nested.py
+++ b/examples/python/keras/seq_mnist_cnn_nested.py
@@ -65,6 +65,9 @@ def top_level_task():
 
   model.fit(x_train, y_train, epochs=5, callbacks=[VerifyMetrics(ModelAccuracy.MNIST_CNN), EpochVerifyMetrics(ModelAccuracy.MNIST_CNN)])
 
+
 if __name__ == "__main__":
   print("Sequential model, mnist cnn nested model")
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   top_level_task()
diff --git a/examples/python/keras/seq_mnist_cnn_net2net.py b/examples/python/keras/seq_mnist_cnn_net2net.py
index 4b9c9c16ba..e2a04ba686 100644
--- a/examples/python/keras/seq_mnist_cnn_net2net.py
+++ b/examples/python/keras/seq_mnist_cnn_net2net.py
@@ -98,6 +98,9 @@ def top_level_task():
 
   create_student_model_cnn(teacher_model, num_classes, x_train, y_train)
 
+
 if __name__ == "__main__":
   print("Sequential model, mnist mlp teacher student")
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   top_level_task()
diff --git a/examples/python/keras/seq_mnist_mlp.py b/examples/python/keras/seq_mnist_mlp.py
index 21c7435eb7..46b774a2e1 100644
--- a/examples/python/keras/seq_mnist_mlp.py
+++ b/examples/python/keras/seq_mnist_mlp.py
@@ -55,6 +55,9 @@ def top_level_task():
   model.fit(x_train, y_train, epochs=20, callbacks=[VerifyMetrics(ModelAccuracy.MNIST_MLP), EpochVerifyMetrics(ModelAccuracy.MNIST_MLP)])
   model.evaluate(x=x_train, y=y_train)
 
+
 if __name__ == "__main__":
   print("Sequential model, mnist mlp")
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   top_level_task()
diff --git a/examples/python/keras/seq_mnist_mlp_net2net.py b/examples/python/keras/seq_mnist_mlp_net2net.py
index 628f76db3a..c7a7d7a6f8 100644
--- a/examples/python/keras/seq_mnist_mlp_net2net.py
+++ b/examples/python/keras/seq_mnist_mlp_net2net.py
@@ -91,6 +91,9 @@ def top_level_task():
 
   create_student_model_mlp(teacher_model, num_classes, x_train, y_train)
 
+
 if __name__ == "__main__":
   print("Sequential model, mnist mlp teacher student")
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   top_level_task()
diff --git a/examples/python/keras/seq_reuters_mlp.py b/examples/python/keras/seq_reuters_mlp.py
index 5412ad0599..ed748f67d8 100644
--- a/examples/python/keras/seq_reuters_mlp.py
+++ b/examples/python/keras/seq_reuters_mlp.py
@@ -19,6 +19,7 @@
 from flexflow.keras.datasets import reuters
 from flexflow.keras.preprocessing.text import Tokenizer
 from flexflow.keras.callbacks import Callback, VerifyMetrics
+import flexflow.core as ff
 
 import numpy as np
 from accuracy import ModelAccuracy
@@ -61,6 +62,9 @@ def top_level_task():
 
   model.fit(x_train, y_train, epochs=epochs, callbacks=[VerifyMetrics(ModelAccuracy.REUTERS_MLP)])
 
+
 if __name__ == "__main__":
   print("Sequential model, reuters mlp")
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
   top_level_task()
diff --git a/examples/python/keras/unary.py b/examples/python/keras/unary.py
index 622e15dc2d..63c83b9af2 100644
--- a/examples/python/keras/unary.py
+++ b/examples/python/keras/unary.py
@@ -62,4 +62,6 @@ def top_level_task():
 
 if __name__ == "__main__":
   print("alexnet keras")
-  top_level_task()
\ No newline at end of file
+  configs = ff.get_configs()
+  ff.init_flexflow_runtime(configs)
+  top_level_task()
diff --git a/examples/python/native/alexnet.py b/examples/python/native/alexnet.py
index 61397cefc1..6d6e58a7f2 100644
--- a/examples/python/native/alexnet.py
+++ b/examples/python/native/alexnet.py
@@ -3,7 +3,7 @@
 
 from accuracy import ModelAccuracy
 from PIL import Image
-import argparse
+import argparse, json
 import numpy as np
 
 
@@ -133,7 +133,18 @@ def test_accuracy():
     parser = argparse.ArgumentParser()
     parser.add_argument("-a", "--test_acc",
                         action="store_true", help="Test accuracy flag")
+    parser.add_argument(
+        "-config-file",
+        help="The path to a JSON file with the configs. If omitted, a sample model and configs will be used instead.",
+        type=str,
+        default=None,
+    )
     args, unknown = parser.parse_known_args()
+    configs_dict = None
+    if args.config_file is not None:
+        with open(args.config_file) as f:
+            configs_dict = json.load(f)
+    init_flexflow_runtime(configs_dict)
     if args.test_acc:
         print("Testing cifar10 alexnet training accuracy")
         test_accuracy()
diff --git a/examples/python/native/cifar10_cnn.py b/examples/python/native/cifar10_cnn.py
index 44bdce4519..11bc936617 100644
--- a/examples/python/native/cifar10_cnn.py
+++ b/examples/python/native/cifar10_cnn.py
@@ -2,7 +2,7 @@
 from flexflow.keras.datasets import cifar10
 
 from accuracy import ModelAccuracy
-import argparse
+import argparse, json
 
 
 def top_level_task():
@@ -90,7 +90,18 @@ def test_accuracy():
     parser = argparse.ArgumentParser()
     parser.add_argument("-a", "--test_acc",
                         action="store_true", help="Test accuracy flag")
+    parser.add_argument(
+        "-config-file",
+        help="The path to a JSON file with the configs. If omitted, a sample model and configs will be used instead.",
+        type=str,
+        default=None,
+    )
     args, unknown = parser.parse_known_args()
+    configs_dict = None
+    if args.config_file is not None:
+        with open(args.config_file) as f:
+            configs_dict = json.load(f)
+    init_flexflow_runtime(configs_dict)
     if args.test_acc:
         print("Testing cifar10 cnn training accuracy")
         test_accuracy()
diff --git a/examples/python/native/cifar10_cnn_attach.py b/examples/python/native/cifar10_cnn_attach.py
index ba4288c8cd..e200cc03cf 100644
--- a/examples/python/native/cifar10_cnn_attach.py
+++ b/examples/python/native/cifar10_cnn_attach.py
@@ -144,4 +144,6 @@ def top_level_task():
 
 if __name__ == "__main__":
   print("cifar10 cnn attach")
+  configs = get_configs()
+  init_flexflow_runtime(configs)
   top_level_task()
diff --git a/examples/python/native/cifar10_cnn_concat.py b/examples/python/native/cifar10_cnn_concat.py
index b177295ad6..7234116b3c 100644
--- a/examples/python/native/cifar10_cnn_concat.py
+++ b/examples/python/native/cifar10_cnn_concat.py
@@ -70,6 +70,10 @@ def top_level_task():
   if accuracy < ModelAccuracy.CIFAR10_CNN.value:
     assert 0, 'Check Accuracy'
 
+
+
 if __name__ == "__main__":
   print("cifar10 cnn concat")
+  configs = get_configs()
+  init_flexflow_runtime(configs)
   top_level_task()
diff --git a/examples/python/native/mnist_cnn.py b/examples/python/native/mnist_cnn.py
index 6eabbe57db..f6787a4827 100644
--- a/examples/python/native/mnist_cnn.py
+++ b/examples/python/native/mnist_cnn.py
@@ -18,7 +18,7 @@
 from flexflow.keras.datasets import mnist
 
 from accuracy import ModelAccuracy
-import argparse
+import argparse, json
 
 
 def top_level_task():
@@ -89,7 +89,18 @@ def test_accuracy():
     parser = argparse.ArgumentParser()
     parser.add_argument("-a", "--test_acc",
                         action="store_true", help="Test accuracy flag")
+    parser.add_argument(
+        "-config-file",
+        help="The path to a JSON file with the configs. If omitted, a sample model and configs will be used instead.",
+        type=str,
+        default=None,
+    )
     args, unknown = parser.parse_known_args()
+    configs_dict = None
+    if args.config_file is not None:
+        with open(args.config_file) as f:
+            configs_dict = json.load(f)
+    init_flexflow_runtime(configs_dict)
     if args.test_acc:
         print("Testing mnist cnn training accuracy")
         test_accuracy()
diff --git a/examples/python/native/mnist_mlp.py b/examples/python/native/mnist_mlp.py
index aefe7cfd57..8763eba40c 100644
--- a/examples/python/native/mnist_mlp.py
+++ b/examples/python/native/mnist_mlp.py
@@ -3,7 +3,7 @@
 from flexflow.keras.datasets import mnist
 
 from accuracy import ModelAccuracy
-import argparse
+import argparse, json
 
 
 def top_level_task():
@@ -75,7 +75,18 @@ def test_accuracy():
     parser = argparse.ArgumentParser()
     parser.add_argument("-a", "--test_acc",
                         action="store_true", help="Test accuracy flag")
+    parser.add_argument(
+        "-config-file",
+        help="The path to a JSON file with the configs. If omitted, a sample model and configs will be used instead.",
+        type=str,
+        default=None,
+    )
     args, unknown = parser.parse_known_args()
+    configs_dict = None
+    if args.config_file is not None:
+        with open(args.config_file) as f:
+            configs_dict = json.load(f)
+    init_flexflow_runtime(configs_dict)
     if args.test_acc:
         print("Testing mnist mlp training accuracy")
         test_accuracy()
diff --git a/examples/python/native/mnist_mlp_attach.py b/examples/python/native/mnist_mlp_attach.py
index 6e7c8f8405..1294432ec5 100644
--- a/examples/python/native/mnist_mlp_attach.py
+++ b/examples/python/native/mnist_mlp_attach.py
@@ -134,4 +134,6 @@ def top_level_task():
 
 if __name__ == "__main__":
   print("mnist mlp attach")
+  configs = get_configs()
+  init_flexflow_runtime(configs)
   top_level_task()
diff --git a/examples/python/native/print_layers.py b/examples/python/native/print_layers.py
index 22b87e0b86..481ecc3477 100644
--- a/examples/python/native/print_layers.py
+++ b/examples/python/native/print_layers.py
@@ -119,6 +119,9 @@ def top_level_task():
 
   # ffmodel.print_layers(0)
 
+
 if __name__ == "__main__":
   print("alexnet")
+  configs = get_configs()
+  init_flexflow_runtime(configs)
   top_level_task()
diff --git a/examples/python/native/split.py b/examples/python/native/split.py
index dfd8b0e572..f79ff04e14 100644
--- a/examples/python/native/split.py
+++ b/examples/python/native/split.py
@@ -77,6 +77,9 @@ def top_level_task():
   # if accuracy < ModelAccuracy.CIFAR10_CNN.value:
   #   assert 0, 'Check Accuracy'
 
+
 if __name__ == "__main__":
   print("cifar10 cnn split")
+  configs = get_configs()
+  init_flexflow_runtime(configs)
   top_level_task()
diff --git a/include/flexflow/config.h b/include/flexflow/config.h
index 2479358bfb..9716060173 100644
--- a/include/flexflow/config.h
+++ b/include/flexflow/config.h
@@ -32,7 +32,7 @@
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
 #include <nccl.h>
 #else
-#include <rccl.h>
+#include <rccl/rccl.h>
 #endif
 #endif
 
diff --git a/include/flexflow/machine_view.h b/include/flexflow/machine_view.h
index 719792c10c..807b0c9c0d 100644
--- a/include/flexflow/machine_view.h
+++ b/include/flexflow/machine_view.h
@@ -7,7 +7,7 @@
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
 #include <nccl.h>
 #else
-#include <rccl.h>
+#include <rccl/rccl.h>
 #endif
 #endif
 #include "flexflow/config.h"
diff --git a/include/flexflow/ops/sampling.h b/include/flexflow/ops/sampling.h
index d690888a39..1696582cc1 100644
--- a/include/flexflow/ops/sampling.h
+++ b/include/flexflow/ops/sampling.h
@@ -9,7 +9,7 @@
 #include <curand.h>
 #include <curand_kernel.h>
 #elif defined(FF_USE_HIP_ROCM)
-#include <hiprand.h>
+#include <hiprand/hiprand.h>
 #include <hiprand/hiprand_kernel.h>
 #endif
 #include "flexflow/utils/memory_allocator.h"
diff --git a/include/flexflow/utils/hip_helper.h b/include/flexflow/utils/hip_helper.h
index 7f6403c767..be6f4a713d 100644
--- a/include/flexflow/utils/hip_helper.h
+++ b/include/flexflow/utils/hip_helper.h
@@ -6,7 +6,7 @@
 #include <hipblas/hipblas.h>
 #include <miopen/miopen.h>
 #ifdef FF_USE_NCCL
-#include <rccl.h>
+#include <rccl/rccl.h>
 #endif
 
 #define FatalError(s)                                                          \
diff --git a/inference/utils/download_hf_model.py b/inference/utils/download_hf_model.py
index 689730f32b..03fc8e1633 100644
--- a/inference/utils/download_hf_model.py
+++ b/inference/utils/download_hf_model.py
@@ -35,9 +35,6 @@ def parse_args():
 
 
 def main(args):
-    # Initialize FF serve to gain access to its utils
-    ff.init_cpu()
-
     if args.full_precision_only:
         data_types = ff.DataType.DT_FLOAT
     elif args.half_precision_only:
diff --git a/python/flexflow/config.py b/python/flexflow/config.py
index 44d460d832..d5f2131ae8 100644
--- a/python/flexflow/config.py
+++ b/python/flexflow/config.py
@@ -16,35 +16,60 @@
 import os
 
 # python binding
-_FF_PYTHON_BINDING = 'cffi'
+_FF_PYTHON_BINDING = "cffi"
 
-if 'FF_USE_CFFI' in os.environ:
-  use_pybind = not int(os.environ['FF_USE_CFFI'])
+if "FF_USE_CFFI" in os.environ:
+    use_pybind = not int(os.environ["FF_USE_CFFI"])
 else:
-  use_pybind = False
+    use_pybind = False
 
 if use_pybind:
-  _FF_PYTHON_BINDING = 'pybind11'
+    _FF_PYTHON_BINDING = "pybind11"
 else:
-  _FF_PYTHON_BINDING = 'cffi'
-  
+    _FF_PYTHON_BINDING = "cffi"
+
+
 def flexflow_python_binding():
-  return _FF_PYTHON_BINDING
-
-# build docs
-_FF_BUILD_DOCS = bool(os.environ.get('READTHEDOCS') or os.environ.get("FF_BUILD_DOCS"))
-  
-# init import
-# It is used to run __init__.py in flexflow/core
-# The following cases __init__.py is not needed:
-# 1. build docs = True
-_FF_INIT_IMPORT = _FF_BUILD_DOCS == False
-
-def flexflow_init_import():
-  return _FF_INIT_IMPORT
-  
+    return _FF_PYTHON_BINDING
+
+
+_FF_ALREADY_INITIALIZED = False
+
+
+def flexflow_already_initialized():
+    global _FF_ALREADY_INITIALIZED
+    return _FF_ALREADY_INITIALIZED
+
+
+def set_flexflow_initialized():
+    global _FF_ALREADY_INITIALIZED
+    if _FF_ALREADY_INITIALIZED == True:
+        raise RuntimeError(
+            "Attempting to set _FF_ALREADY_INITIALIZED=True, but _FF_ALREADY_INITIALIZED is already True"
+        )
+    _FF_ALREADY_INITIALIZED = True
+
+
 # FlexFlow dir
 _FF_DIR = os.path.dirname(os.path.realpath(__file__))
 
+
 def flexflow_dir():
-  return _FF_DIR
+    return _FF_DIR
+
+# Get runtime configs from the command line 
+def get_configs():
+  import argparse,json
+  parser = argparse.ArgumentParser()
+  parser.add_argument(
+    "-config-file",
+    help="The path to a JSON file with the configs. If omitted, a sample model and configs will be used instead.",
+    type=str,
+    default=None,
+  )
+  args, unknown = parser.parse_known_args()
+  if args.config_file is not None:
+    with open(args.config_file) as f:
+      return json.load(f)
+  else:
+    return None
diff --git a/python/flexflow/core/__init__.py b/python/flexflow/core/__init__.py
index 5b421a74ed..5e8e4ece81 100644
--- a/python/flexflow/core/__init__.py
+++ b/python/flexflow/core/__init__.py
@@ -20,54 +20,128 @@
 import atexit
 import os
 import sys
+import warnings
+from typing import Optional
 
 from flexflow.config import *
-from flexflow.jupyter import *
 
+# check which python binding to use
+if flexflow_python_binding() == "pybind11":
+    # print("Using pybind11 flexflow bindings.")
+    from .flexflow_pybind11 import *
+else:
+    # print("Using cffi flexflow bindings.")
+    from .flexflow_cffi import *
 
-if flexflow_init_import():
-  os.environ["NCCL_LAUNCH_MODE"] = "PARALLEL"
-  from legion_cffi import ffi, is_legion_python
-  from .flexflowlib import flexflow_library
-  
-  # Default python mode
-  if is_legion_python == False:
-    print("Using Default Python")
-    _FF_BUILD_DOCS = bool(os.environ.get('READTHEDOCS') or os.environ.get("FF_BUILD_DOCS"))
-    _CPU_ONLY = bool(os.environ.get('CPU_ONLY_TEST'))
-    if not _CPU_ONLY and not "-ll:gpu" in sys.argv:
-      os.environ["REALM_DEFAULT_ARGS"] = "-ll:gpu 1"
-    if not _FF_BUILD_DOCS and not _CPU_ONLY:
-      from legion_top import (
-          legion_canonical_python_main,
-          legion_canonical_python_cleanup,
-      )
-      import atexit, sys, os
-      # run from jupyter
-      if "ipykernel_launcher.py" in sys.argv[0]:
-        sys_argv = ["python", "dummy.py"]
-        argv_dict = load_jupyter_config()
-        for key, value in argv_dict.items():
-          sys_argv.append(key)
-          sys_argv.append(str(value))
-      else:
-        sys_argv = [
-          "python",
-        ] + sys.argv
-      legion_canonical_python_main(sys_argv)
-      atexit.register(legion_canonical_python_cleanup)
-  else:
-    print("Using Legion Python")
+ff_arg_to_sysarg = {
+    # General args
+    "num_gpus": "-ll:gpu",
+    "memory_per_gpu": "-ll:fsize",
+    "zero_copy_memory_per_node": "-ll:zsize",
+    "num_cpus": "-ll:cpu",
+    "legion_utility_processors": "-ll:util",
+    "profiling": "--profiling",
+    "fusion": "--fusion",
+    "disable_control_replication": "--disable-control-replication",
+    # Training args
+    "epochs": "--epochs",
+    "batch_size": "--batch-size",
+    "learning_rate": "--learning-rate",
+    "weight_decay": "--weight-decay",
+    "print_frequency": "--print-freq",
+    "dataset": "--dataset",
+    "budget": "--budget",
+    "search_budget": "--search-budget",
+    "alpha": "--alpha",
+    "search_alpha": "--search-alpha",
+    "simulator_workspace_size": "--simulator-workspace-size",
+    "import": "--import",
+    "import_strategy": "--import-strategy",
+    "export": "--export",
+    "export_strategy": "--export-strategy",
+    "only_data_parallel": "--only-data-parallel",
+    "enable_parameter_parallel": "--enable-parameter-parallel",
+    "enable_attribute_parallel": "--enable-attribute-parallel",
+    "allow_tensor_op_math_conversion": "--allow-tensor-op-math-conversion",
+    "search_overlap_backward_update": "--overlap",
+    "export_strategy_task_graph_file": "--taskgraph",
+    "include_costs_dot_graph": "--include-costs-dot-graph",
+    "export_strategy_computation_graph_file": "--compgraph",
+    "machine_model_version": "--machine-model-version",
+    "machine_model_file": "--machine-model-file",
+    "simulator_segment_size": "--simulator-segment-size",
+    "simulator_max_num_segments": "--simulator-max-num-segments",
+    "enable_propagation": "--enable-propagation",
+    "enable_inplace_optimizations": "--enable-inplace-optimization",
+    "search_num_nodes": "--search-num-nodes",
+    "search_num_workers": "--search-num-workers",
+    "base_optimize_threshold": "--base-optimize-threshold",
+    "python_data_loader_type": "--python-data-loader-type",
+    "substitution_json_path": "--substitution-json",
+    "perform_memory_search": "--memory-search",
+    # Inference args
+    "data_parallelism_degree": "-data-parallelism-degree",
+    "tensor_parallelism_degree": "-tensor-parallelism-degree",
+    "pipeline_parallelism_degree": "-pipeline-parallelism-degree",
+    "offload": "-offload",
+    "offload_reserve_space_size": "-offload-reserve-space-size",
+    "use_4bit_quantization": "--4bit-quantization",
+    "use_8bit_quantization": "--8bit-quantization"
+}
 
-  flexflow_library.initialize()
 
-  # check which python binding to use
-  if flexflow_python_binding() == "pybind11":
-      print("Using pybind11 flexflow bindings.")
-      from .flexflow_pybind11 import *
-  else:
-      print("Using cffi flexflow bindings.")
-      from .flexflow_cffi import *
+def init_flexflow_runtime(configs_dict: Optional[dict] = None, **kwargs):
+    if not flexflow_already_initialized():
+        os.environ["NCCL_LAUNCH_MODE"] = "PARALLEL"
+        from legion_cffi import is_legion_python
+        from .flexflowlib import flexflow_library
 
-else:
-  pass
+        # Default python mode
+        if is_legion_python == False:
+            # print("Using Default Python")
+            from legion_top import (
+                legion_canonical_python_main,
+                legion_canonical_python_cleanup,
+            )
+
+            # Either a configs_dict dictionary, or individual key-value parameters should be passed. Not both.
+            if configs_dict is not None and len(kwargs.items()) > 0:
+                raise ValueError("Cannot pass both configs_dict and individual args")
+            ff_args = configs_dict if configs_dict is not None else dict(kwargs.items())
+            # Check presence of mandatory parameters
+            if (
+                "num_gpus" not in ff_args
+                or "memory_per_gpu" not in ff_args
+                or "zero_copy_memory_per_node" not in ff_args
+            ):
+                raise ValueError(
+                    "Missing one of the following required configs: num_gpus, memory_per_gpu, zero_copy_memory_per_node"
+                )
+
+            # Remove any existing arguments to avoid interferences
+            sys.argv = [sys.argv[0]]
+
+            # Pass parameters to the FlexFlow C++ runtime via command line arguments
+            for arg in ff_args:
+                if arg not in ff_arg_to_sysarg:
+                    warnings.warn(f"Ignoring parameter {arg}: not recognized.")
+                else:
+                    sys_arg = [ff_arg_to_sysarg[arg]]
+                    if type(ff_args[arg]) == bool:
+                        if ff_args[arg] is not True:
+                            continue
+                    else:
+                        sys_arg += [str(ff_args[arg])]
+                    sys.argv += sys_arg
+
+            legion_canonical_python_main(sys.argv)
+            atexit.register(legion_canonical_python_cleanup)
+        else:
+            # print("Using FlexFlow Python")
+            if configs_dict is not None or len(kwargs.items()) > 0:
+                warnings.warn("init_flexflow_runtime are ignored when using the FlexFlow Python interpreter")
+
+        flexflow_library.initialize()
+        set_flexflow_initialized()
+    else:
+        warnings.warn("Attempting to initialize FlexFlow more than once")
diff --git a/python/flexflow/core/flexflow_cffi.py b/python/flexflow/core/flexflow_cffi.py
index 1508371ae7..2d71dd18b3 100644
--- a/python/flexflow/core/flexflow_cffi.py
+++ b/python/flexflow/core/flexflow_cffi.py
@@ -15,19 +15,20 @@
 
 from __future__ import absolute_import, division, print_function, unicode_literals
 
-import cffi
-import os
-import subprocess
-import logging
 import warnings
 import numpy as np
 from .flexflow_logger import fflogger
 from flexflow.type import ActiMode, RegularizerMode, AggrMode, PoolType, DataType, LossType, CompMode, MetricsType, InferenceMode, ModelType, OpType, ParameterSyncType, enum_to_int, int_to_enum
+from flexflow.config import *
+from .flexflowlib import ffi, flexflow_library
 
-_FF_BUILD_DOCS = bool(os.environ.get('READTHEDOCS') or os.environ.get("FF_BUILD_DOCS"))
-if not _FF_BUILD_DOCS:
-  from .flexflowlib import ffi, flexflow_library
+def ffc():
+  if not flexflow_already_initialized():
+    raise RuntimeError("Cannot use FlexFlow library before initializing FlexFlow")
   ffc = flexflow_library.lib
+  if ffc is None:
+    raise RuntimeError("FlexFlow library is None")
+  return ffc
 
 ff_tracing_id = 200
 
@@ -66,35 +67,35 @@ def __init__(self, handle, idx=None, name=None):
     self.name = name
 
   def get_number_parameters(self):
-    return ffc.flexflow_op_get_num_parameters(self.handle)
+    return ffc().flexflow_op_get_num_parameters(self.handle)
 
   def get_parameter_by_id(self, id):
-    handle = ffc.flexflow_op_get_parameter_by_id(self.handle, id)
+    handle = ffc().flexflow_op_get_parameter_by_id(self.handle, id)
     return Parameter(handle)
 
   def get_number_inputs(self):
-    return ffc.flexflow_op_get_num_inputs(self.handle)
+    return ffc().flexflow_op_get_num_inputs(self.handle)
 
   def get_input_by_id(self, id):
-    handle = ffc.flexflow_op_get_input_by_id(self.handle, id)
+    handle = ffc().flexflow_op_get_input_by_id(self.handle, id)
     return Tensor(handle, False)
 
   def get_number_outputs(self):
-    return ffc.flexflow_op_get_num_outputs(self.handle)
+    return ffc().flexflow_op_get_num_outputs(self.handle)
 
   def get_output_by_id(self, id):
-    handle = ffc.flexflow_op_get_output_by_id(self.handle, id)
+    handle = ffc().flexflow_op_get_output_by_id(self.handle, id)
     return Tensor(handle, False)
 
   def init(self, model):
-    ffc.flexflow_op_init(self.handle, model.handle)
+    ffc().flexflow_op_init(self.handle, model.handle)
 
   def forward(self, model):
-    ffc.flexflow_op_forward(self.handle, model.handle)
+    ffc().flexflow_op_forward(self.handle, model.handle)
     #return Tensor(handle)
 
   def _add_to_model(self, model):
-    ffc.flexflow_op_add_to_model(self.handle, model.handle)
+    ffc().flexflow_op_add_to_model(self.handle, model.handle)
 
   def get_output_tensor(self):
     return self.get_output_by_id(0)
@@ -602,36 +603,36 @@ def convert_op_handle_to_op(op_type, handle, idx=None, name=None):
 class FFConfig(object):
   __slots__ = ['handle', '_handle', 'enable_tracing']
   def __init__(self):
-    self.handle = ffc.flexflow_config_create()
-    self._handle = ffi.gc(self.handle, ffc.flexflow_config_destroy)
+    self.handle = ffc().flexflow_config_create()
+    self._handle = ffi.gc(self.handle, ffc().flexflow_config_destroy)
     self.enable_tracing = False
 
   def parse_args(self):
-    ffc.flexflow_config_parse_args_default(self.handle)
+    ffc().flexflow_config_parse_args_default(self.handle)
 
   @property
   def batch_size(self):
-    return ffc.flexflow_config_get_batch_size(self.handle)
+    return ffc().flexflow_config_get_batch_size(self.handle)
 
   @property
   def workers_per_node(self):
-    return ffc.flexflow_config_get_workers_per_node(self.handle)
+    return ffc().flexflow_config_get_workers_per_node(self.handle)
 
   @property
   def num_nodes(self):
-    return ffc.flexflow_config_get_num_nodes(self.handle)
+    return ffc().flexflow_config_get_num_nodes(self.handle)
 
   @property
   def epochs(self):
-    return ffc.flexflow_config_get_epochs(self.handle)
+    return ffc().flexflow_config_get_epochs(self.handle)
     
   @property
   def enable_control_replication(self):
-    return ffc.flexflow_config_get_enable_control_replication(self.handle)
+    return ffc().flexflow_config_get_enable_control_replication(self.handle)
   
   @property
   def data_parallelism_degree(self):
-    return ffc.flexflow_config_get_data_parallelism_degree(self.handle)
+    return ffc().flexflow_config_get_data_parallelism_degree(self.handle)
   
   @data_parallelism_degree.setter
   def data_parallelism_degree(self, value):
@@ -639,11 +640,11 @@ def data_parallelism_degree(self, value):
       raise ValueError("The data parallelism degree must be specified as an integer number")
     elif value < 1:
       raise ValueError("The data parallelism degree cannot be lower than 1")
-    ffc.flexflow_config_set_data_parallelism_degree(self.handle, value)
+    ffc().flexflow_config_set_data_parallelism_degree(self.handle, value)
   
   @property
   def tensor_parallelism_degree(self):
-    return ffc.flexflow_config_get_tensor_parallelism_degree(self.handle)
+    return ffc().flexflow_config_get_tensor_parallelism_degree(self.handle)
   
   @tensor_parallelism_degree.setter
   def tensor_parallelism_degree(self, value):
@@ -651,11 +652,11 @@ def tensor_parallelism_degree(self, value):
       raise ValueError("The tensor parallelism degree must be specified as an integer number")
     elif value < 1:
       raise ValueError("The tensor parallelism degree cannot be lower than 1")
-    ffc.flexflow_config_set_tensor_parallelism_degree(self.handle, value)
+    ffc().flexflow_config_set_tensor_parallelism_degree(self.handle, value)
   
   @property
   def pipeline_parallelism_degree(self):
-    return ffc.flexflow_config_get_pipeline_parallelism_degree(self.handle)
+    return ffc().flexflow_config_get_pipeline_parallelism_degree(self.handle)
   
   @pipeline_parallelism_degree.setter
   def pipeline_parallelism_degree(self, value):
@@ -663,26 +664,26 @@ def pipeline_parallelism_degree(self, value):
       raise ValueError("The pipeline parallelism degree must be specified as an integer number")
     elif value < 1:
       raise ValueError("The pipeline parallelism degree cannot be lower than 1")
-    ffc.flexflow_config_set_pipeline_parallelism_degree(self.handle, value)
+    ffc().flexflow_config_set_pipeline_parallelism_degree(self.handle, value)
     
   @property
   def python_data_loader_type(self):
-    return ffc.flexflow_config_get_python_data_loader_type(self.handle)
+    return ffc().flexflow_config_get_python_data_loader_type(self.handle)
   
   @property
   def cpu_offload(self):
-    return ffc.flexflow_config_get_offload(self.handle)
+    return ffc().flexflow_config_get_offload(self.handle)
 
   def get_current_time(self):
-    return ffc.flexflow_get_current_time(self.handle)
+    return ffc().flexflow_get_current_time(self.handle)
 
   def begin_trace(self, trace_id):
     if self.enable_tracing:
-      ffc.flexflow_begin_trace(self.handle, trace_id)
+      ffc().flexflow_begin_trace(self.handle, trace_id)
 
   def end_trace(self, trace_id):
     if self.enable_tracing:
-      ffc.flexflow_end_trace(self.handle, trace_id)
+      ffc().flexflow_end_trace(self.handle, trace_id)
 
 # -----------------------------------------------------------------------
 # Tensor
@@ -709,7 +710,7 @@ def __init__(self, handle, deallocate=True, owner_op_type=None, p_handle=None):
     self.__get_dims()
     self.__get_data_type()
     # if (deallocate == True):
-    #   self._handle = ffi.gc(self.handle, ffc.flexflow_tensor_destroy)
+    #   self._handle = ffi.gc(self.handle, ffc().flexflow_tensor_destroy)
     # if (self.is_mapped() == True):
     #   self.mapped = True
 
@@ -719,13 +720,13 @@ def __init__(self, handle, deallocate=True, owner_op_type=None, p_handle=None):
 
   def inline_map(self, ffmodel, ffconfig):
     assert self.mapped == False, "Tensor is already mapped."
-    ffc.flexflow_tensor_inline_map(self.handle, ffmodel.handle, ffconfig.handle);
+    ffc().flexflow_tensor_inline_map(self.handle, ffmodel.handle, ffconfig.handle);
     self.mapped = True
     assert self.num_dims > 0, "check dims"
 
   def inline_unmap(self, ffmodel, ffconfig):
     assert self.mapped == True, "Tensor is not inline mapped."
-    ffc.flexflow_tensor_inline_unmap(self.handle, ffmodel.handle, ffconfig.handle);
+    ffc().flexflow_tensor_inline_unmap(self.handle, ffmodel.handle, ffconfig.handle);
     self.mapped = False
 
   def get_array(self, ffmodel, ffconfig):
@@ -774,7 +775,7 @@ def detach_numpy_array(self, ffconfig):
     self.__detach_raw_ptr(ffconfig)
 
   def is_mapped(self):
-    return ffc.flexflow_tensor_is_mapped(self.handle)
+    return ffc().flexflow_tensor_is_mapped(self.handle)
     
   def set_tensor(self, ffmodel, np_array):
     assert np_array.__array_interface__['strides'] == None, "Parameter set_weights, numpy array strides is not None"
@@ -788,15 +789,15 @@ def set_tensor(self, ffmodel, np_array):
     if np_array.dtype == np.float16:
       assert self.data_type == DataType.DT_HALF, "Wrong datatype"
       raw_ptr = ffi.cast("half*", np_raw_ptr[0])
-      ret_val = ffc.flexflow_tensor_set_tensor_float(self.handle, ffmodel.handle, num_dims, c_dims, raw_ptr)
+      ret_val = ffc().flexflow_tensor_set_tensor_float(self.handle, ffmodel.handle, num_dims, c_dims, raw_ptr)
     elif np_array.dtype == np.float32:
       assert self.data_type == DataType.DT_FLOAT, "Wrong datatype"
       raw_ptr = ffi.cast("float*", np_raw_ptr[0])
-      ret_val = ffc.flexflow_tensor_set_tensor_float(self.handle, ffmodel.handle, num_dims, c_dims, raw_ptr)
+      ret_val = ffc().flexflow_tensor_set_tensor_float(self.handle, ffmodel.handle, num_dims, c_dims, raw_ptr)
     elif np_array.dtype == np.int32:
       assert self.data_type == DataType.DT_INT32, "Wrong datatype"
       raw_ptr = ffi.cast("int*", np_raw_ptr[0])
-      ret_val = ffc.flexflow_tensor_set_tensor_int(self.handle, ffmodel.handle, num_dims, c_dims, raw_ptr)
+      ret_val = ffc().flexflow_tensor_set_tensor_int(self.handle, ffmodel.handle, num_dims, c_dims, raw_ptr)
     else:
       assert 0, "Unsupported datatype"
     fflogger.debug("set tensor raw_ptr: %s, %s, %s, %s" %( str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(np_shape)))
@@ -817,13 +818,13 @@ def get_tensor(self, ffmodel):
     np_raw_ptr = np_array.__array_interface__['data']
     if np_array.dtype == np.float32:
       raw_ptr = ffi.cast("float*", np_raw_ptr[0])
-      ret_val = ffc.flexflow_tensor_get_tensor_float(self.handle, ffmodel.handle, raw_ptr, False)
+      ret_val = ffc().flexflow_tensor_get_tensor_float(self.handle, ffmodel.handle, raw_ptr, False)
     elif np_array.dtype == np.int32:
       raw_ptr = ffi.cast("int*", np_raw_ptr[0])
-      ret_val = ffc.flexflow_tensor_get_tensor_int(self.handle, ffmodel.handle, raw_ptr, False)
+      ret_val = ffc().flexflow_tensor_get_tensor_int(self.handle, ffmodel.handle, raw_ptr, False)
     elif np_array.dtype == np.int64:
       raw_ptr = ffi.cast("int64_t*", np_raw_ptr[0])
-      ret_val = ffc.flexflow_tensor_get_tensor_int64(self.handle, ffmodel.handle, raw_ptr, False)
+      ret_val = ffc().flexflow_tensor_get_tensor_int64(self.handle, ffmodel.handle, raw_ptr, False)
     fflogger.debug("get weights raw_ptr: %s, %s, %s, %s" %( str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(shape)))
     assert ret_val == True
     return np_array
@@ -844,13 +845,13 @@ def get_gradients(self, ffmodel, comm_type):
     c_comm_type = enum_to_int(ParameterSyncType, comm_type)
     if np_array.dtype == np.float32:
       raw_ptr = ffi.cast("float*", np_raw_ptr[0])
-      ret_val = ffc.flexflow_tensor_get_tensor_float(self.handle, ffmodel.handle, raw_ptr, True)
+      ret_val = ffc().flexflow_tensor_get_tensor_float(self.handle, ffmodel.handle, raw_ptr, True)
     elif np_array.dtype == np.int32:
       raw_ptr = ffi.cast("int*", np_raw_ptr[0])
-      ret_val = ffc.flexflow_tensor_get_tensor_int(self.handle, ffmodel.handle, raw_ptr, True)
+      ret_val = ffc().flexflow_tensor_get_tensor_int(self.handle, ffmodel.handle, raw_ptr, True)
     elif np_array.dtype == np.int64:
       raw_ptr = ffi.cast("int64_t*", np_raw_ptr[0])
-      ret_val = ffc.flexflow_tensor_get_tensor_int64(self.handle, ffmodel.handle, raw_ptr, True)
+      ret_val = ffc().flexflow_tensor_get_tensor_int64(self.handle, ffmodel.handle, raw_ptr, True)
     fflogger.debug("get weights raw_ptr: %s, %s, %s, %s" %( str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(shape)))
     assert ret_val == True
     return np_array
@@ -871,7 +872,7 @@ def get_model_output_gradients(self, ffmodel, comm_type):
     c_comm_type = enum_to_int(ParameterSyncType, comm_type)
     if np_array.dtype == np.float32:
       raw_ptr = ffi.cast("float*", np_raw_ptr[0])
-      ret_val = ffc.flexflow_model_get_output_tensor_float(ffmodel.handle, self.handle, raw_ptr, True)
+      ret_val = ffc().flexflow_model_get_output_tensor_float(ffmodel.handle, self.handle, raw_ptr, True)
     else:
       assert 0, "unknown data type"
     fflogger.debug("get weights raw_ptr: %s, %s, %s, %s" %( str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(shape)))
@@ -893,7 +894,7 @@ def get_model_output_tensor(self, ffmodel):
     np_raw_ptr = np_array.__array_interface__['data']
     if np_array.dtype == np.float32:
       raw_ptr = ffi.cast("float*", np_raw_ptr[0])
-      ret_val = ffc.flexflow_model_get_output_tensor_float(ffmodel.handle, self.handle, raw_ptr, False)
+      ret_val = ffc().flexflow_model_get_output_tensor_float(ffmodel.handle, self.handle, raw_ptr, False)
     else:
       assert 0, "unknown data type"
     fflogger.debug("get weights raw_ptr: %s, %s, %s, %s" %( str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(shape)))
@@ -903,29 +904,29 @@ def get_model_output_tensor(self, ffmodel):
   def __get_raw_ptr(self, ffmodel, ffconfig, data_type):
     assert data_type == self.data_type, "Tensor check data type"
     if (data_type == DataType.DT_HALF):
-      return ffc.flexflow_tensor_get_raw_ptr_float(self.handle, ffmodel.handle, ffconfig.handle)
+      return ffc().flexflow_tensor_get_raw_ptr_float(self.handle, ffmodel.handle, ffconfig.handle)
     elif (data_type == DataType.DT_FLOAT):
-      return ffc.flexflow_tensor_get_raw_ptr_float(self.handle, ffmodel.handle, ffconfig.handle)
+      return ffc().flexflow_tensor_get_raw_ptr_float(self.handle, ffmodel.handle, ffconfig.handle)
     elif (data_type == DataType.DT_INT32):
-      return ffc.flexflow_tensor_get_raw_ptr_int32(self.handle, ffmodel.handle, ffconfig.handle)
+      return ffc().flexflow_tensor_get_raw_ptr_int32(self.handle, ffmodel.handle, ffconfig.handle)
     else:
       assert 0, "unknown data type"
 
   def __get_dims(self):
-    self.num_dims = ffc.flexflow_tensor_get_num_dims(self.handle)
+    self.num_dims = ffc().flexflow_tensor_get_num_dims(self.handle)
     # if (self.num_dims == 1):
-    #   self.dims = (ffc.flexflow_tensor_get_dim(self.handle, 0),)
+    #   self.dims = (ffc().flexflow_tensor_get_dim(self.handle, 0),)
     # elif (self.num_dims == 2):
-    #   self.dims = (ffc.flexflow_tensor_get_dim(self.handle, 1), ffc.flexflow_tensor_get_dim(self.handle, 0))
+    #   self.dims = (ffc().flexflow_tensor_get_dim(self.handle, 1), ffc().flexflow_tensor_get_dim(self.handle, 0))
     # elif (self.num_dims == 3):
-    #   self.dims = (ffc.flexflow_tensor_get_dim(self.handle, 2), ffc.flexflow_tensor_get_dim(self.handle, 1), ffc.flexflow_tensor_get_dim(self.handle, 0))
+    #   self.dims = (ffc().flexflow_tensor_get_dim(self.handle, 2), ffc().flexflow_tensor_get_dim(self.handle, 1), ffc().flexflow_tensor_get_dim(self.handle, 0))
     # elif (self.num_dims == 4):
-    #   self.dims = (ffc.flexflow_tensor_get_dim(self.handle, 3), ffc.flexflow_tensor_get_dim(self.handle, 2), ffc.flexflow_tensor_get_dim(self.handle, 1), ffc.flexflow_tensor_get_dim(self.handle, 0))
+    #   self.dims = (ffc().flexflow_tensor_get_dim(self.handle, 3), ffc().flexflow_tensor_get_dim(self.handle, 2), ffc().flexflow_tensor_get_dim(self.handle, 1), ffc().flexflow_tensor_get_dim(self.handle, 0))
     # elif (self.num_dims == 5):
-    #   self.dims = (ffc.flexflow_tensor_get_dim(self.handle, 4), ffc.flexflow_tensor_get_dim(self.handle, 3), ffc.flexflow_tensor_get_dim(self.handle, 2), ffc.flexflow_tensor_get_dim(self.handle, 1), ffc.flexflow_tensor_get_dim(self.handle, 0))
+    #   self.dims = (ffc().flexflow_tensor_get_dim(self.handle, 4), ffc().flexflow_tensor_get_dim(self.handle, 3), ffc().flexflow_tensor_get_dim(self.handle, 2), ffc().flexflow_tensor_get_dim(self.handle, 1), ffc().flexflow_tensor_get_dim(self.handle, 0))
     # else:
     #   assert 0, "unknown num_dims"
-    d = ffc.flexflow_tensor_get_dims(self.handle)
+    d = ffc().flexflow_tensor_get_dims(self.handle)
     if (self.num_dims == 1):
       self.dims = (d[0],)
     elif (self.num_dims == 2):
@@ -940,7 +941,7 @@ def __get_dims(self):
       assert 0, "unknown num_dims"
 
   def __get_data_type(self):
-    dtype = ffc.flexflow_tensor_get_data_type(self.handle)
+    dtype = ffc().flexflow_tensor_get_data_type(self.handle)
     if (dtype == 40):
       self.data_type = DataType.DT_BOOLEAN
     elif (dtype == 41):
@@ -957,7 +958,7 @@ def __get_data_type(self):
       assert 0, "unknown data type {}".format(dtype)
 
   def __get_owner_op(self, op_type):
-    op_handle = ffc.flexflow_tensor_get_owner_op(self.handle)
+    op_handle = ffc().flexflow_tensor_get_owner_op(self.handle)
     if op_handle.impl == ffi.NULL:
       self.owner_op = None
     else:
@@ -965,12 +966,12 @@ def __get_owner_op(self, op_type):
 
   def __attach_raw_ptr(self, ffmodel, ffconfig, raw_ptr, column_major=True):
     assert self.mapped == False, "Tensor is already mapped."
-    ffc.flexflow_tensor_attach_raw_ptr(self.handle, ffmodel.handle, ffconfig.handle, raw_ptr, column_major)
+    ffc().flexflow_tensor_attach_raw_ptr(self.handle, ffmodel.handle, ffconfig.handle, raw_ptr, column_major)
     self.mapped = True
 
   def __detach_raw_ptr(self, ffconfig):
     assert self.mapped == True, "Tensor is not mapped."
-    ffc.flexflow_tensor_detach_raw_ptr(self.handle, ffconfig.handle)
+    ffc().flexflow_tensor_detach_raw_ptr(self.handle, ffconfig.handle)
     self.mapped = False
 
 # -----------------------------------------------------------------------
@@ -996,7 +997,7 @@ def set_weights(self, ffmodel, np_array):
     np_raw_ptr = np_array.__array_interface__['data']
     raw_ptr = ffi.cast("float*", np_raw_ptr[0])
     fflogger.debug("set weights raw_ptr: %s, %s, %s, %s" %( str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(np_shape)))
-    ret_val = ffc.flexflow_tensor_set_tensor_float(self.parameter_handle, ffmodel.handle, num_dims, c_dims, raw_ptr)
+    ret_val = ffc().flexflow_tensor_set_tensor_float(self.parameter_handle, ffmodel.handle, num_dims, c_dims, raw_ptr)
     assert ret_val == True, ret_val
 
   def get_weights(self, ffmodel):
@@ -1005,7 +1006,7 @@ def get_weights(self, ffmodel):
     np_raw_ptr = np_array.__array_interface__['data']
     raw_ptr = ffi.cast("float*", np_raw_ptr[0])
     fflogger.debug("get weights raw_ptr: %s, %s, %s, %s" %( str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(shape)))
-    ret_val = ffc.flexflow_tensor_get_tensor_float(self.parameter_handle, ffmodel.handle, raw_ptr, False)
+    ret_val = ffc().flexflow_tensor_get_tensor_float(self.parameter_handle, ffmodel.handle, raw_ptr, False)
     assert ret_val == True
     return np_array
 
@@ -1025,8 +1026,8 @@ def __init__(self, ffconfig):
 
     :returns:  FFModel -- the model.
     """
-    self.handle = ffc.flexflow_model_create(ffconfig.handle, ffconfig.cpu_offload)
-    self._handle = ffi.gc(self.handle, ffc.flexflow_model_destroy)
+    self.handle = ffc().flexflow_model_create(ffconfig.handle, ffconfig.cpu_offload)
+    self._handle = ffi.gc(self.handle, ffc().flexflow_model_destroy)
     self._layers = dict()
     self._nb_layers = 0
     self._ffconfig = ffconfig
@@ -1041,7 +1042,7 @@ def get_layers(self):
 
   def add_layer(self, op_type, name):
     layer_id = self._nb_layers
-    op_handle = ffc.flexflow_model_get_last_layer(self.handle)
+    op_handle = ffc().flexflow_model_get_last_layer(self.handle)
     self._layers[self._nb_layers] = convert_op_handle_to_op(op_type, op_handle, idx=layer_id, name=name)
     self._nb_layers += 1
 
@@ -1064,18 +1065,18 @@ def create_tensor(self, dims, data_type, create_grad=True):
     c_dims = ffi.new("int[]", dims)
     c_data_type = enum_to_int(DataType, data_type)
     num_dims = len(dims)
-    handle = ffc.flexflow_tensor_create(self.handle, num_dims, c_dims, c_data_type, create_grad);
+    handle = ffc().flexflow_tensor_create(self.handle, num_dims, c_dims, c_data_type, create_grad);
     return Tensor(handle)
 
   def map_tensor(self, tensor, parallel_op = None):
     op_handle = self.__get_op_handle(parallel_op)
-    ffc.flexflow_tensor_map(self.handle, tensor.handle, op_handle)
+    ffc().flexflow_tensor_map(self.handle, tensor.handle, op_handle)
 
   def create_constant(self, dims, value, data_type):
     c_dims = ffi.new("int[]", dims)
     c_data_type = enum_to_int(DataType, data_type)
     num_dims = len(dims)
-    handle = ffc.flexflow_constant_create(self.handle, num_dims, c_dims, value, c_data_type);
+    handle = ffc().flexflow_constant_create(self.handle, num_dims, c_dims, value, c_data_type);
     return Tensor(handle)
 
   def exp(self, x, name=None):
@@ -1090,7 +1091,7 @@ def exp(self, x, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_exp(self.handle, x.handle, c_name)
+    handle = ffc().flexflow_model_add_exp(self.handle, x.handle, c_name)
     self.add_layer(OpType.EXP, name)
     return Tensor(handle, owner_op_type=OpType.EXP)
 
@@ -1106,7 +1107,7 @@ def sin(self, x, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_sin(self.handle, x.handle, c_name)
+    handle = ffc().flexflow_model_add_sin(self.handle, x.handle, c_name)
     self.add_layer(OpType.SIN, name)
     return Tensor(handle, owner_op_type=OpType.SIN)
 
@@ -1122,7 +1123,7 @@ def cos(self, x, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_cos(self.handle, x.handle, c_name)
+    handle = ffc().flexflow_model_add_cos(self.handle, x.handle, c_name)
     self.add_layer(OpType.COS, name)
     return Tensor(handle, owner_op_type=OpType.COS)
 
@@ -1142,7 +1143,7 @@ def add(self, x, y, inplace_a=False, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_add(self.handle, x.handle, y.handle, inplace_a, c_name)
+    handle = ffc().flexflow_model_add_add(self.handle, x.handle, y.handle, inplace_a, c_name)
     self.add_layer(OpType.ADD, name)
     return Tensor(handle, owner_op_type=OpType.ADD)
 
@@ -1161,7 +1162,7 @@ def subtract(self, x, y, inplace_a=False, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_subtract(self.handle, x.handle, y.handle, inplace_a, c_name)
+    handle = ffc().flexflow_model_add_subtract(self.handle, x.handle, y.handle, inplace_a, c_name)
     self.add_layer(OpType.SUBTRACT, name)
     return Tensor(handle, owner_op_type=OpType.SUBTRACT)
 
@@ -1180,7 +1181,7 @@ def multiply(self, x, y, inplace_a=False, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_multiply(self.handle, x.handle, y.handle, inplace_a, c_name)
+    handle = ffc().flexflow_model_add_multiply(self.handle, x.handle, y.handle, inplace_a, c_name)
     self.add_layer(OpType.MULTIPLY, name)
     return Tensor(handle, owner_op_type=OpType.MULTIPLY)
 
@@ -1199,7 +1200,7 @@ def divide(self, x, y, inplace_a=False, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_divide(self.handle, x.handle, y.handle, inplace_a, c_name)
+    handle = ffc().flexflow_model_add_divide(self.handle, x.handle, y.handle, inplace_a, c_name)
     self.add_layer(OpType.DIVIDE, name)
     return Tensor(handle, owner_op_type=OpType.DIVIDE)
 
@@ -1218,7 +1219,7 @@ def max(self, x, y, inplace_a=False, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_max(self.handle, x.handle, y.handle, inplace_a, c_name)
+    handle = ffc().flexflow_model_add_max(self.handle, x.handle, y.handle, inplace_a, c_name)
     self.add_layer(OpType.MAX, name)
     return Tensor(handle, owner_op_type=OpType.MAX)
 
@@ -1237,7 +1238,7 @@ def min(self, x, y, inplace_a=False, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_min(self.handle, x.handle, y.handle, inplace_a, c_name)
+    handle = ffc().flexflow_model_add_min(self.handle, x.handle, y.handle, inplace_a, c_name)
     self.add_layer(OpType.MIN, name)
     return Tensor(handle, owner_op_type=OpType.MIN)
 
@@ -1257,7 +1258,7 @@ def reduce_sum(self, input, axes, keepdims=False, name=None):
     """
     c_name = get_c_name(name)
     c_axes = ffi.new("int[]", axes)
-    handle = ffc.flexflow_model_add_reduce_sum(self.handle, input.handle, c_axes, len(axes), keepdims, c_name)
+    handle = ffc().flexflow_model_add_reduce_sum(self.handle, input.handle, c_axes, len(axes), keepdims, c_name)
     self.add_layer(OpType.REDUCE_SUM, name)
     return Tensor(handle, owner_op_type=OpType.REDUCE_SUM)
 
@@ -1273,7 +1274,7 @@ def rsqrt(self, input, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_rsqrt(self.handle, input.handle, c_name)
+    handle = ffc().flexflow_model_add_rsqrt(self.handle, input.handle, c_name)
     self.add_layer(OpType.RSQRT, name)
     return Tensor(handle, owner_op_type=OpType.RSQRT)
 
@@ -1292,7 +1293,7 @@ def pow(self, input, exponent, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_pow(self.handle, input.handle, exponent, c_name)
+    handle = ffc().flexflow_model_add_pow(self.handle, input.handle, exponent, c_name)
     self.add_layer(OpType.POW, name)
     return Tensor(handle, owner_op_type=OpType.POW)
 
@@ -1318,7 +1319,7 @@ def mean(self, input, dims, keepdims=False, name=None):
     dims = list(dims)
     c_dims = ffi.new("int[]", dims)
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_mean(self.handle, input.handle, c_dims, len(dims), keepdims, c_name)
+    handle = ffc().flexflow_model_add_mean(self.handle, input.handle, c_dims, len(dims), keepdims, c_name)
     self.add_layer(OpType.MEAN, name)
     return Tensor(handle, owner_op_type=OpType.MEAN)
 
@@ -1414,7 +1415,7 @@ def conv2d(self, input, out_channels,
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
     bias_init_handle = self.__get_initializer_handle(bias_initializer)
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_conv2d(self.handle, input.handle, out_channels, kernel_h, kernel_w, stride_h, stride_w, padding_h, padding_w, c_activation, groups, use_bias, shared_op_handle, kernel_init_handle, bias_init_handle, c_name)
+    handle = ffc().flexflow_model_add_conv2d(self.handle, input.handle, out_channels, kernel_h, kernel_w, stride_h, stride_w, padding_h, padding_w, c_activation, groups, use_bias, shared_op_handle, kernel_init_handle, bias_init_handle, c_name)
     self.add_layer(OpType.CONV2D, name)
     return Tensor(handle, owner_op_type=OpType.CONV2D)
 
@@ -1459,7 +1460,7 @@ def embedding(self, input, num_embeddings, embedding_dim,
       (type(kernel_initializer) is UniformInitializer) or \
       (type(kernel_initializer) is NormInitializer), \
       f"Unknown initializer type: {kernel_initializer}"
-    handle = ffc.flexflow_model_add_embedding(
+    handle = ffc().flexflow_model_add_embedding(
       self.handle, input.handle, num_embeddings, embedding_dim, c_aggr, c_dtype,
       shared_op_handle, kernel_initializer.handle, c_name,
     )
@@ -1541,7 +1542,7 @@ def pool2d(self, input, kernel_h, kernel_w,
     c_name = get_c_name(name)
     c_pool_type = enum_to_int(PoolType, pool_type)
     c_activation = enum_to_int(ActiMode, activation)
-    handle = ffc.flexflow_model_add_pool2d(self.handle, input.handle, kernel_h, kernel_w, stride_h, stride_w, padding_h, padding_w, c_pool_type, c_activation, c_name)
+    handle = ffc().flexflow_model_add_pool2d(self.handle, input.handle, kernel_h, kernel_w, stride_h, stride_w, padding_h, padding_w, c_pool_type, c_activation, c_name)
     self.add_layer(OpType.POOL2D, name)
     return Tensor(handle, owner_op_type=OpType.POOL2D)
 
@@ -1562,14 +1563,14 @@ def batch_norm(self, input, relu=True, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_batch_norm(self.handle, input.handle, relu, c_name)
+    handle = ffc().flexflow_model_add_batch_norm(self.handle, input.handle, relu, c_name)
     self.add_layer(OpType.BATCH_NORM, name)
     return Tensor(handle, owner_op_type=OpType.BATCH_NORM)
     
   def layer_norm(self, input, axes, elementwise_affine=True, eps=1e-5, name=None):
     c_name = get_c_name(name)
     c_axes = ffi.new("int[]", axes)
-    handle = ffc.flexflow_model_add_layer_norm(self.handle, input.handle, len(axes), c_axes, elementwise_affine, eps, c_name)
+    handle = ffc().flexflow_model_add_layer_norm(self.handle, input.handle, len(axes), c_axes, elementwise_affine, eps, c_name)
     self.add_layer(OpType.LAYER_NORM, name)
     return Tensor(handle, owner_op_type=OpType.LAYER_NORM)
 
@@ -1597,7 +1598,7 @@ def batch_matmul(self, A, B, a_seq_length_dim=None, b_seq_length_dim=None, name=
       a_seq_length_dim = -1
     if b_seq_length_dim is None:
       b_seq_length_dim = -1
-    handle = ffc.flexflow_model_add_batch_matmul(self.handle, A.handle, B.handle, a_seq_length_dim, b_seq_length_dim)
+    handle = ffc().flexflow_model_add_batch_matmul(self.handle, A.handle, B.handle, a_seq_length_dim, b_seq_length_dim)
     self.add_layer(OpType.BATCH_MATMUL, name)
     return Tensor(handle, owner_op_type=OpType.BATCH_MATMUL)
 
@@ -1658,7 +1659,7 @@ def dense(self, input, out_dim,
       c_kernel_reg_type = enum_to_int(
         RegularizerMode, RegularizerMode.REG_MODE_NONE)
       kernel_reg_lambda = 0.0
-    handle = ffc.flexflow_model_add_dense(
+    handle = ffc().flexflow_model_add_dense(
       self.handle, input.handle, out_dim, c_activation, use_bias, c_datatype,
       shared_op_handle, kernel_init_handle, bias_init_handle,
       c_kernel_reg_type, kernel_reg_lambda, c_name)
@@ -1689,7 +1690,7 @@ def concat(self, tensors, axis, name=None):
       tensor_handle_list.append(tensor.handle)
     c_tensor_handle_list = ffi.new("flexflow_tensor_t[]", tensor_handle_list)
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_concat(self.handle, n, c_tensor_handle_list, axis, c_name)
+    handle = ffc().flexflow_model_add_concat(self.handle, n, c_tensor_handle_list, axis, c_name)
     self.add_layer(OpType.CONCAT, name)
     return Tensor(handle, owner_op_type=OpType.CONCAT)
 
@@ -1720,7 +1721,7 @@ def split(self, input, sizes, axis, name=None):
     c_split = ffi.new("int[]", split)
     c_outputs_handle_list = ffi.new("flexflow_tensor_t[256]")
     c_name = get_c_name(name)
-    ffc.flexflow_model_add_split(self.handle, input.handle, n, c_outputs_handle_list, c_split, axis, c_name)
+    ffc().flexflow_model_add_split(self.handle, input.handle, n, c_outputs_handle_list, c_split, axis, c_name)
     output_tensor_list = []
     for i in range(n):
       tensor_p_handle = ffi.new("flexflow_tensor_t*")
@@ -1742,7 +1743,7 @@ def flat(self, input, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_flat(self.handle, input.handle, c_name)
+    handle = ffc().flexflow_model_add_flat(self.handle, input.handle, c_name)
     self.add_layer(OpType.FLAT, name)
     return Tensor(handle, owner_op_type=OpType.FLAT)
 
@@ -1758,7 +1759,7 @@ def softmax(self, input, axis=-1, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_softmax(self.handle, input.handle, axis, c_name)
+    handle = ffc().flexflow_model_add_softmax(self.handle, input.handle, axis, c_name)
     self.add_layer(OpType.SOFTMAX, name)
     return Tensor(handle, owner_op_type=OpType.SOFTMAX)
 
@@ -1781,7 +1782,7 @@ def reshape(self, input, shape, name=None):
     """
     c_name = get_c_name(name)
     c_shape = ffi.new("int[]", shape)
-    handle = ffc.flexflow_model_add_reshape(self.handle, input.handle, len(shape), c_shape, c_name)
+    handle = ffc().flexflow_model_add_reshape(self.handle, input.handle, len(shape), c_shape, c_name)
     self.add_layer(OpType.RESHAPE, name)
     return Tensor(handle, owner_op_type=OpType.RESHAPE)
 
@@ -1803,7 +1804,7 @@ def gather(self, input, index, dim, name=None):
     :returns: Tensor -- the output tensor
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_gather(self.handle, input.handle, index.handle, dim, c_name)
+    handle = ffc().flexflow_model_add_gather(self.handle, input.handle, index.handle, dim, c_name)
     self.add_layer(OpType.GATHER, name)
     return Tensor(handle, owner_op_type=OpType.GATHER)
 
@@ -1823,7 +1824,7 @@ def transpose(self, input, perm, name=None):
     """
     c_name = get_c_name(name)
     c_perm = ffi.new("int[]", perm)
-    handle = ffc.flexflow_model_add_transpose(self.handle, input.handle, len(perm), c_perm, c_name)
+    handle = ffc().flexflow_model_add_transpose(self.handle, input.handle, len(perm), c_perm, c_name)
     self.add_layer(OpType.TRANSPOSE, name)
     return Tensor(handle, owner_op_type=OpType.TRANSPOSE)
 
@@ -1844,7 +1845,7 @@ def reverse(self, input, axis, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_reverse(self.handle, input.handle, axis, c_name)
+    handle = ffc().flexflow_model_add_reverse(self.handle, input.handle, axis, c_name)
     self.add_layer(OpType.REVERSE, name)
     return Tensor(handle, owner_op_type=OpType.REVERSE)
 
@@ -1863,7 +1864,7 @@ def scalar_multiply(self, input, scalar, inplace=True, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_scalar_multiply(self.handle, input.handle, scalar, inplace, c_name)
+    handle = ffc().flexflow_model_add_scalar_multiply(self.handle, input.handle, scalar, inplace, c_name)
     self.add_layer(OpType.SCALAR_MULTIPLY, name)
     return Tensor(handle, owner_op_type=OpType.SCALAR_MULTIPLY)
 
@@ -1882,7 +1883,7 @@ def scalar_add(self, input, scalar, inplace=True, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_scalar_add(self.handle, input.handle, scalar, inplace, c_name)
+    handle = ffc().flexflow_model_add_scalar_add(self.handle, input.handle, scalar, inplace, c_name)
     self.add_layer(OpType.SCALAR_ADD, name)
     return Tensor(handle, owner_op_type=OpType.SCALAR_ADD)
 
@@ -1901,7 +1902,7 @@ def scalar_sub(self, input, scalar, inplace=True, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_scalar_sub(self.handle, input.handle, scalar, inplace, c_name)
+    handle = ffc().flexflow_model_add_scalar_sub(self.handle, input.handle, scalar, inplace, c_name)
     self.add_layer(OpType.SCALAR_SUB, name)
     return Tensor(handle, owner_op_type=OpType.SCALAR_SUB)
 
@@ -1920,7 +1921,7 @@ def scalar_true_divide(self, input, scalar, inplace=True, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_scalar_truediv(self.handle, input.handle, scalar, inplace, c_name)
+    handle = ffc().flexflow_model_add_scalar_truediv(self.handle, input.handle, scalar, inplace, c_name)
     self.add_layer(OpType.SCALAR_TRUEDIV, name)
     return Tensor(handle, owner_op_type=OpType.SCALAR_TRUEDIV)
 
@@ -1936,7 +1937,7 @@ def gelu(self, input, inplace=True, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_gelu(self.handle, input.handle, c_name)
+    handle = ffc().flexflow_model_add_gelu(self.handle, input.handle, c_name)
     self.add_layer(OpType.GELU, name)
     return Tensor(handle, owner_op_type=OpType.GELU)
   
@@ -1952,7 +1953,7 @@ def relu(self, input, inplace=True, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_relu(self.handle, input.handle, inplace, c_name)
+    handle = ffc().flexflow_model_add_relu(self.handle, input.handle, inplace, c_name)
     self.add_layer(OpType.RELU, name)
     return Tensor(handle, owner_op_type=OpType.RELU)
 
@@ -1968,7 +1969,7 @@ def identity(self, input, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_identity(self.handle, input.handle, c_name)
+    handle = ffc().flexflow_model_add_identity(self.handle, input.handle, c_name)
     self.add_layer(OpType.IDENTITY, name)
     return Tensor(handle, owner_op_type=OpType.IDENTITY)
   
@@ -1984,7 +1985,7 @@ def sigmoid(self, input, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_sigmoid(self.handle, input.handle, c_name)
+    handle = ffc().flexflow_model_add_sigmoid(self.handle, input.handle, c_name)
     self.add_layer(OpType.SIGMOID, name)
     return Tensor(handle, owner_op_type=OpType.SIGMOID)
 
@@ -2000,7 +2001,7 @@ def tanh(self, input, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_tanh(self.handle, input.handle, c_name)
+    handle = ffc().flexflow_model_add_tanh(self.handle, input.handle, c_name)
     self.add_layer(OpType.TANH, name)
     return Tensor(handle, owner_op_type=OpType.TANH)
 
@@ -2016,7 +2017,7 @@ def elu(self, input, inplace=True, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_elu(self.handle, input.handle, inplace, c_name)
+    handle = ffc().flexflow_model_add_elu(self.handle, input.handle, inplace, c_name)
     self.add_layer(OpType.ELU, name)
     return Tensor(handle, owner_op_type=OpType.ELU)
 
@@ -2042,7 +2043,7 @@ def dropout(self, input, rate, seed, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_dropout(self.handle, input.handle, rate, seed, c_name)
+    handle = ffc().flexflow_model_add_dropout(self.handle, input.handle, rate, seed, c_name)
     self.add_layer(OpType.DROPOUT, name)
     return Tensor(handle, owner_op_type=OpType.DROPOUT)
     
@@ -2098,7 +2099,7 @@ def multihead_attention(self, query, key, value,
     """     
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-    handle = ffc.flexflow_model_add_multihead_attention(self.handle, query.handle, key.handle, value.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, kernel_init_handle, c_name)
+    handle = ffc().flexflow_model_add_multihead_attention(self.handle, query.handle, key.handle, value.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, kernel_init_handle, c_name)
     self.add_layer(OpType.MULTIHEAD_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.MULTIHEAD_ATTENTION)
   
@@ -2166,7 +2167,7 @@ def inc_multihead_self_attention(self, input,
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
     c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc.flexflow_model_add_inc_multihead_self_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
+    handle = ffc().flexflow_model_add_inc_multihead_self_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
     self.add_layer(OpType.INC_MULTIHEAD_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.INC_MULTIHEAD_ATTENTION)
   
@@ -2234,7 +2235,7 @@ def spec_inc_multihead_self_attention(self, input,
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
     c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc.flexflow_model_add_spec_inc_multihead_self_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
+    handle = ffc().flexflow_model_add_spec_inc_multihead_self_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
     self.add_layer(OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION)
   
@@ -2302,7 +2303,7 @@ def inc_multihead_self_attention_verify(self, input,
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
     c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc.flexflow_model_add_inc_multihead_self_attention_verify(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
+    handle = ffc().flexflow_model_add_inc_multihead_self_attention_verify(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
     self.add_layer(OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION)
   
@@ -2373,7 +2374,7 @@ def inc_multiquery_self_attention(self, input,
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
     c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc.flexflow_model_add_inc_multiquery_self_attention(self.handle, input.handle, embed_dim, num_q_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
+    handle = ffc().flexflow_model_add_inc_multiquery_self_attention(self.handle, input.handle, embed_dim, num_q_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
     self.add_layer(OpType.INC_MULTIHEAD_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.INC_MULTIHEAD_ATTENTION)
   
@@ -2444,7 +2445,7 @@ def spec_inc_multiquery_self_attention(self, input,
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
     c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc.flexflow_model_add_spec_inc_multiquery_self_attention(self.handle, input.handle, embed_dim, num_q_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
+    handle = ffc().flexflow_model_add_spec_inc_multiquery_self_attention(self.handle, input.handle, embed_dim, num_q_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
     self.add_layer(OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION)
   
@@ -2515,7 +2516,7 @@ def inc_multiquery_self_attention_verify(self, input,
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
     c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc.flexflow_model_add_inc_multiquery_self_attention_verify(self.handle, input.handle, embed_dim, num_q_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
+    handle = ffc().flexflow_model_add_inc_multiquery_self_attention_verify(self.handle, input.handle, embed_dim, num_q_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
     self.add_layer(OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION)
   
@@ -2537,7 +2538,7 @@ def rms_norm(self, input, eps, dim, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_rms_norm(self.handle, input.handle, eps, dim, c_name)
+    handle = ffc().flexflow_model_add_rms_norm(self.handle, input.handle, eps, dim, c_name)
     self.add_layer(OpType.RMS_NORM, name)
     return Tensor(handle, owner_op_type=OpType.RMS_NORM)
   
@@ -2559,7 +2560,7 @@ def arg_top_k(self, input, k, sorted, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_arg_top_k(self.handle, input.handle, k, sorted, c_name)
+    handle = ffc().flexflow_model_add_arg_top_k(self.handle, input.handle, k, sorted, c_name)
     self.add_layer(OpType.ARG_TOPK, name)
     return Tensor(handle, owner_op_type=OpType.ARG_TOPK)
 
@@ -2581,7 +2582,7 @@ def beam_top_k(self, input, max_beam_size, sorted, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_beam_top_k(self.handle, input.handle, max_beam_size, sorted, c_name)
+    handle = ffc().flexflow_model_add_beam_top_k(self.handle, input.handle, max_beam_size, sorted, c_name)
     self.add_layer(OpType.BEAM_TOPK, name)
     return Tensor(handle, owner_op_type=OpType.BEAM_TOPK)
   
@@ -2600,7 +2601,7 @@ def sampling(self, input, top_p, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_sampling(self.handle, input.handle, top_p, c_name)
+    handle = ffc().flexflow_model_add_sampling(self.handle, input.handle, top_p, c_name)
     self.add_layer(OpType.SAMPLING, name)
     return Tensor(handle, owner_op_type=OpType.SAMPLING)
   
@@ -2619,7 +2620,7 @@ def argmax(self, input, beam_search, name=None):
     :returns:  Tensor -- the output tensor.
     """
     c_name = get_c_name(name)
-    handle = ffc.flexflow_model_add_argmax(self.handle, input.handle, beam_search, c_name)
+    handle = ffc().flexflow_model_add_argmax(self.handle, input.handle, beam_search, c_name)
     self.add_layer(OpType.ARGMAX, name)
     return Tensor(handle, owner_op_type=OpType.ARGMAX)
 
@@ -2628,17 +2629,17 @@ def reset_metrics(self):
              
     :returns:  None -- no returns.
     """
-    ffc.flexflow_model_reset_metrics(self.handle)
+    ffc().flexflow_model_reset_metrics(self.handle)
 
   def init_layers(self):
     """Initialize layers.
              
     :returns:  None -- no returns.
     """
-    ffc.flexflow_model_init_layers(self.handle)
+    ffc().flexflow_model_init_layers(self.handle)
 
   def prefetch(self):
-    ffc.flexflow_model_prefetch(self.handle)
+    ffc().flexflow_model_prefetch(self.handle)
 
   def forward(self, seq_length=None):
     """Forward propagation of all layers.
@@ -2647,7 +2648,7 @@ def forward(self, seq_length=None):
     """
     if seq_length is None:
       seq_length = -1
-    ffc.flexflow_model_forward(self.handle, seq_length)
+    ffc().flexflow_model_forward(self.handle, seq_length)
 
   #TODO: seperate compute_metrics from backward
   def backward(self, seq_length=None):
@@ -2657,21 +2658,21 @@ def backward(self, seq_length=None):
     """
     if seq_length is None:
       seq_length = -1
-    ffc.flexflow_model_backward(self.handle, seq_length)
+    ffc().flexflow_model_backward(self.handle, seq_length)
 
   def compute_metrics(self):
     """Compute performance metrics.
              
     :returns:  None -- no returns.
     """
-    ffc.flexflow_model_compute_metrics(self.handle)
+    ffc().flexflow_model_compute_metrics(self.handle)
 
   def update(self):
     """Update weights and biases of all layers.
              
     :returns:  None -- no returns.
     """
-    ffc.flexflow_model_update(self.handle)
+    ffc().flexflow_model_update(self.handle)
 
   def compile(self, optimizer=None, loss_type=None, metrics=None, comp_mode=None):
     """Configure the model for trainting. FlexFlow uses lazy initialization,
@@ -2708,7 +2709,7 @@ def compile(self, optimizer=None, loss_type=None, metrics=None, comp_mode=None):
     if comp_mode == None:
       comp_mode = CompMode.TRAINING
     c_comp_mode = enum_to_int(CompMode, comp_mode)
-    ffc.flexflow_model_compile(self.handle, c_loss_type, c_metrics, len(metrics), c_comp_mode)
+    ffc().flexflow_model_compile(self.handle, c_loss_type, c_metrics, len(metrics), c_comp_mode)
     for (ff_tensor, np_tensor) in self.attr_tensors.items():
       ff_tensor.set_tensor(self, np_tensor)
     print("Compiled ffmodel!")
@@ -2803,13 +2804,13 @@ def zero_gradients(self):
              
     :returns:  None -- no returns.
     """
-    ffc.flexflow_model_zero_gradients(self.handle)
+    ffc().flexflow_model_zero_gradients(self.handle)
 
   def set_optimizer(self, optimizer):
     if isinstance(optimizer, SGDOptimizer) == True:
-      ffc.flexflow_model_set_sgd_optimizer(self.handle, optimizer.handle)
+      ffc().flexflow_model_set_sgd_optimizer(self.handle, optimizer.handle)
     elif isinstance(optimizer, AdamOptimizer) == True:
-      ffc.flexflow_model_set_adam_optimizer(self.handle, optimizer.handle)
+      ffc().flexflow_model_set_adam_optimizer(self.handle, optimizer.handle)
     elif optimizer == None:
       pass
     else:
@@ -2818,7 +2819,7 @@ def set_optimizer(self, optimizer):
   optimizer = property(fset=set_optimizer)
 
   def print_layers(self, id=-1):
-    ffc.flexflow_model_print_layers(self.handle, id)
+    ffc().flexflow_model_print_layers(self.handle, id)
 
   def get_layer_by_id(self, layer_id):
     return self._layers[layer_id]
@@ -2835,20 +2836,20 @@ def get_layer_by_name(self, layer_name):
     return None
 
   def get_tensor_by_id(self, id):
-    handle = ffc.flexflow_model_get_parameter_by_id(self.handle, id)
+    handle = ffc().flexflow_model_get_parameter_by_id(self.handle, id)
     return Parameter(handle)
 
   @property
   def label_tensor(self):
-    handle = ffc.flexflow_model_get_label_tensor(self.handle)
+    handle = ffc().flexflow_model_get_label_tensor(self.handle)
     return Tensor(handle, deallocate=False)
 
   def get_perf_metrics(self):
-    handle = ffc.flexflow_model_get_perf_metrics(self.handle)
+    handle = ffc().flexflow_model_get_perf_metrics(self.handle)
     return PerfMetrics(handle)
   
   def set_transformer_layer_id(self, id):
-    ffc.flexflow_model_set_transformer_layer_id(self.handle, id)
+    ffc().flexflow_model_set_transformer_layer_id(self.handle, id)
     
   def create_data_loader(self, batch_tensor, full_array):
     """Create a SingleDataloader instance. 
@@ -2952,13 +2953,13 @@ def get_output_tensor(self, ffmodel, data_type):
     np_raw_ptr = np_array.__array_interface__['data']
     if np_array.dtype == np.float32:
       raw_ptr = ffi.cast("float*", np_raw_ptr[0])
-      ret_val = ffc.flexflow_tensor_get_tensor_float(self.handle, ffmodel.handle, raw_ptr, False)
+      ret_val = ffc().flexflow_tensor_get_tensor_float(self.handle, ffmodel.handle, raw_ptr, False)
     elif np_array.dtype == np.int32:
       raw_ptr = ffi.cast("int*", np_raw_ptr[0])
-      ret_val = ffc.flexflow_tensor_get_tensor_int(self.handle, ffmodel.handle, raw_ptr, False)
+      ret_val = ffc().flexflow_tensor_get_tensor_int(self.handle, ffmodel.handle, raw_ptr, False)
     elif np_array.dtype == np.int64:
       raw_ptr = ffi.cast("int64_t*", np_raw_ptr[0])
-      ret_val = ffc.flexflow_tensor_get_tensor_int64(self.handle, ffmodel.handle, raw_ptr, False)
+      ret_val = ffc().flexflow_tensor_get_tensor_int64(self.handle, ffmodel.handle, raw_ptr, False)
     fflogger.debug("get weights raw_ptr: %s, %s, %s, %s" %( str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(shape)))
     assert ret_val == True
     return np_array   
@@ -2968,7 +2969,7 @@ def generate(self, prompt, max_sequence_length):
     max_num_chars = 36000
     c_output_text = ffi.new("char[]", max_num_chars)
     c_output_length_and_tokens = ffi.new("int[]", max_sequence_length + 100)
-    ffc.flexflow_model_generate(self.handle, c_input_text, max_num_chars, c_output_text, max_sequence_length, c_output_length_and_tokens)
+    ffc().flexflow_model_generate(self.handle, c_input_text, max_num_chars, c_output_text, max_sequence_length, c_output_length_and_tokens)
     output_length = c_output_length_and_tokens[0]
     output_tokens = []
     for i in range(output_length):
@@ -2977,7 +2978,7 @@ def generate(self, prompt, max_sequence_length):
     return GenerationResult(ffi.string(c_output_text), output_tokens)
   
   def set_position_offset(self, offset):
-    ffc.flexflow_model_set_position_offset(self.handle, offset)
+    ffc().flexflow_model_set_position_offset(self.handle, offset)
 
 # -----------------------------------------------------------------------
 # SGDOptimizer
@@ -2986,11 +2987,11 @@ def set_position_offset(self, offset):
 class SGDOptimizer(object):
   __slots__ = ['handle', '_handle']
   def __init__(self, ffmodel, lr=0.01, momentum=0.0, nesterov=False, weight_decay=0.0):
-    self.handle = ffc.flexflow_sgd_optimizer_create(ffmodel.handle, lr, momentum, nesterov, weight_decay)
-    self._handle = ffi.gc(self.handle, ffc.flexflow_sgd_optimizer_destroy)
+    self.handle = ffc().flexflow_sgd_optimizer_create(ffmodel.handle, lr, momentum, nesterov, weight_decay)
+    self._handle = ffi.gc(self.handle, ffc().flexflow_sgd_optimizer_destroy)
 
   def set_learning_rate(self, learning_rate):
-    ffc.flexflow_sgd_optimizer_set_lr(self.handle, learning_rate)
+    ffc().flexflow_sgd_optimizer_set_lr(self.handle, learning_rate)
 
 # -----------------------------------------------------------------------
 # AdamOptimizer
@@ -2999,11 +3000,11 @@ def set_learning_rate(self, learning_rate):
 class AdamOptimizer(object):
   __slots__ = ['handle', '_handle']
   def __init__(self, ffmodel, alpha=0.001, beta1=0.9, beta2=0.999, weight_decay=0.0, epsilon=1e-8):
-    self.handle = ffc.flexflow_adam_optimizer_create(ffmodel.handle, alpha, beta1, beta2, weight_decay, epsilon)
-    self._handle = ffi.gc(self.handle, ffc.flexflow_adam_optimizer_destroy)
+    self.handle = ffc().flexflow_adam_optimizer_create(ffmodel.handle, alpha, beta1, beta2, weight_decay, epsilon)
+    self._handle = ffi.gc(self.handle, ffc().flexflow_adam_optimizer_destroy)
 
   def set_learning_rate(self, learning_rate):
-    ffc.flexflow_adam_optimizer_set_lr(self.handle, learning_rate)
+    ffc().flexflow_adam_optimizer_set_lr(self.handle, learning_rate)
 
 # -----------------------------------------------------------------------
 # Initializer
@@ -3026,8 +3027,8 @@ def __init__(self, handle, p_handle=0):
 class GlorotUniformInitializer(Initializer):
   __slots__ = ['glorot_handle', '_glorot_handle']
   def __init__(self, seed):
-    self.glorot_handle = ffc.flexflow_glorot_uniform_initializer_create(seed)
-    self._glorot_handle = ffi.gc(self.glorot_handle, ffc.flexflow_glorot_uniform_initializer_destroy)
+    self.glorot_handle = ffc().flexflow_glorot_uniform_initializer_create(seed)
+    self._glorot_handle = ffi.gc(self.glorot_handle, ffc().flexflow_glorot_uniform_initializer_destroy)
     super(GlorotUniformInitializer, self).__init__(self.glorot_handle)
 
 # -----------------------------------------------------------------------
@@ -3037,8 +3038,8 @@ def __init__(self, seed):
 class ZeroInitializer(Initializer):
   __slots__ = ['zero_handle', '_zero_handle']
   def __init__(self):
-    self.zero_handle = ffc.flexflow_zero_initializer_create()
-    self._zero_handle = ffi.gc(self.zero_handle, ffc.flexflow_zero_initializer_destroy)
+    self.zero_handle = ffc().flexflow_zero_initializer_create()
+    self._zero_handle = ffi.gc(self.zero_handle, ffc().flexflow_zero_initializer_destroy)
     super(ZeroInitializer, self).__init__(self.zero_handle)
 
 # -----------------------------------------------------------------------
@@ -3048,8 +3049,8 @@ def __init__(self):
 class UniformInitializer(Initializer):
   __slots__ = ['uniform_handle', '_uniform_handle']
   def __init__(self, seed, minv, maxv):
-    self.uniform_handle = ffc.flexflow_uniform_initializer_create(seed, minv, maxv)
-    self._uniform_handle = ffi.gc(self.uniform_handle, ffc.flexflow_uniform_initializer_destroy)
+    self.uniform_handle = ffc().flexflow_uniform_initializer_create(seed, minv, maxv)
+    self._uniform_handle = ffi.gc(self.uniform_handle, ffc().flexflow_uniform_initializer_destroy)
     super(UniformInitializer, self).__init__(self.uniform_handle)
 
 # -----------------------------------------------------------------------
@@ -3059,8 +3060,8 @@ def __init__(self, seed, minv, maxv):
 class NormInitializer(Initializer):
   __slots__ = ['norm_handle', '_norm_handle']
   def __init__(self, seed, mean, stddev):
-    self.norm_handle = ffc.flexflow_norm_initializer_create(seed, mean, stddev)
-    self._norm_handle = ffi.gc(self.norm_handle, ffc.flexflow_norm_initializer_destroy)
+    self.norm_handle = ffc().flexflow_norm_initializer_create(seed, mean, stddev)
+    self._norm_handle = ffi.gc(self.norm_handle, ffc().flexflow_norm_initializer_destroy)
     super(NormInitializer, self).__init__(self.norm_handle)
 
 # -----------------------------------------------------------------------
@@ -3071,10 +3072,10 @@ class PerfMetrics(object):
   __slots__= ['handle', '_handle']
   def __init__(self, handle):
     self.handle = handle
-    self._handle = ffi.gc(self.handle, ffc.flexflow_per_metrics_destroy)
+    self._handle = ffi.gc(self.handle, ffc().flexflow_per_metrics_destroy)
 
   def get_accuracy(self):
-    return ffc.flexflow_per_metrics_get_accuracy(self.handle)
+    return ffc().flexflow_per_metrics_get_accuracy(self.handle)
 
 # -----------------------------------------------------------------------
 # NetConfig
@@ -3082,9 +3083,9 @@ def get_accuracy(self):
 
 class NetConfig(object):
   def __init__(self):
-    self.handle = ffc.flexflow_net_config_create()
-    self._handle = ffi.gc(self.handle, ffc.flexflow_net_config_destroy)
-    cpath = ffc.flexflow_net_config_get_dataset_path(self.handle)
+    self.handle = ffc().flexflow_net_config_create()
+    self._handle = ffi.gc(self.handle, ffc().flexflow_net_config_destroy)
+    cpath = ffc().flexflow_net_config_get_dataset_path(self.handle)
     self.dataset_path = ffi.string(cpath)
 
 # -----------------------------------------------------------------------
@@ -3093,32 +3094,32 @@ def __init__(self):
 
 class DLRMConfig(object):
   def __init__(self):
-    self.handle = ffc.flexflow_dlrm_config_create()
-    self._handle = ffi.gc(self.handle, ffc.flexflow_dlrm_config_destroy)
+    self.handle = ffc().flexflow_dlrm_config_create()
+    self._handle = ffi.gc(self.handle, ffc().flexflow_dlrm_config_destroy)
 
-    cstr = ffc.flexflow_dlrm_config_get_dataset_path(self.handle)
+    cstr = ffc().flexflow_dlrm_config_get_dataset_path(self.handle)
     self.dataset_path = ffi.string(cstr)
 
-    cstr = ffc.flexflow_dlrm_config_get_arch_interaction_op(self.handle)
+    cstr = ffc().flexflow_dlrm_config_get_arch_interaction_op(self.handle)
     self.arch_interaction_op = ffi.string(cstr)
 
-    self.sparse_feature_size = ffc.flexflow_dlrm_config_get_sparse_feature_size(self.handle)
-    self.sigmoid_bot = ffc.flexflow_dlrm_config_get_sigmoid_bot(self.handle)
-    self.sigmoid_top = ffc.flexflow_dlrm_config_get_sigmoid_top(self.handle)
-    self.embedding_bag_size = ffc.flexflow_dlrm_config_get_embedding_bag_size(self.handle)
-    self.loss_threshold = ffc.flexflow_dlrm_config_get_loss_threshold(self.handle)
+    self.sparse_feature_size = ffc().flexflow_dlrm_config_get_sparse_feature_size(self.handle)
+    self.sigmoid_bot = ffc().flexflow_dlrm_config_get_sigmoid_bot(self.handle)
+    self.sigmoid_top = ffc().flexflow_dlrm_config_get_sigmoid_top(self.handle)
+    self.embedding_bag_size = ffc().flexflow_dlrm_config_get_embedding_bag_size(self.handle)
+    self.loss_threshold = ffc().flexflow_dlrm_config_get_loss_threshold(self.handle)
 
-    mlp_bot_c = ffc.flexflow_dlrm_config_get_mlp_bot(self.handle)
+    mlp_bot_c = ffc().flexflow_dlrm_config_get_mlp_bot(self.handle)
     self.mlp_bot = []
     for i in range(0, mlp_bot_c[0]):
       self.mlp_bot.append(mlp_bot_c[i+1])
 
-    mlp_top_c = ffc.flexflow_dlrm_config_get_mlp_top(self.handle)
+    mlp_top_c = ffc().flexflow_dlrm_config_get_mlp_top(self.handle)
     self.mlp_top = []
     for i in range(0, mlp_top_c[0]):
       self.mlp_top.append(mlp_top_c[i+1])
 
-    embedding_size_c = ffc.flexflow_dlrm_config_get_embedding_size(self.handle)
+    embedding_size_c = ffc().flexflow_dlrm_config_get_embedding_size(self.handle)
     self.embedding_size = []
     for i in range(0, embedding_size_c[0]):
       self.embedding_size.append(embedding_size_c[i+1])
@@ -3136,39 +3137,39 @@ def __init__(self, ffmodel, input, full_input, num_samples, data_type):
       self.init_from_tensor(ffmodel, input, full_input, num_samples, data_type)
     else:
       self.init_from_ptr(ffmodel, input, full_input, num_samples, data_type)
-    self._handle = ffi.gc(self.handle, ffc.flexflow_single_dataloader_destroy)
+    self._handle = ffi.gc(self.handle, ffc().flexflow_single_dataloader_destroy)
     
   def init_from_tensor(self, ffmodel, input, full_input, num_samples, data_type):
     assert type(full_input) is Tensor, "SingleDataLoader full_input is wrong"
     c_data_type = enum_to_int(DataType, data_type)
-    self.handle = ffc.flexflow_single_dataloader_create(ffmodel.handle, input.handle, full_input.handle, num_samples, c_data_type)
+    self.handle = ffc().flexflow_single_dataloader_create(ffmodel.handle, input.handle, full_input.handle, num_samples, c_data_type)
     
   def init_from_ptr(self, ffmodel, input, full_input, num_samples, data_type):
     # assert type(full_input) is Tensor, "SingleDataLoader full_input is wrong"
     c_data_type = enum_to_int(DataType, data_type)
-    self.handle = ffc.flexflow_single_dataloader_create2(ffmodel.handle, input.handle, full_input, num_samples, c_data_type)
+    self.handle = ffc().flexflow_single_dataloader_create2(ffmodel.handle, input.handle, full_input, num_samples, c_data_type)
 
   @property
   def num_samples(self):
-    return ffc.flexflow_single_dataloader_get_num_samples(self.handle)
+    return ffc().flexflow_single_dataloader_get_num_samples(self.handle)
 
   @num_samples.setter
   def num_samples(self, samples):
-    ffc.flexflow_single_dataloader_set_num_samples(self.handle, samples)
+    ffc().flexflow_single_dataloader_set_num_samples(self.handle, samples)
 
   def next_batch(self, ffmodel):
     """Ask the dataloder to load the next batch to the :attr:`batch_tensor`. 
              
     :returns:  None -- no returns.
     """
-    ffc.flowflow_single_dataloader_next_batch(self.handle, ffmodel.handle)
+    ffc().flowflow_single_dataloader_next_batch(self.handle, ffmodel.handle)
 
   def reset(self):
     """Reset the current position of the dataloder to 0. 
              
     :returns:  None -- no returns.
     """
-    ffc.flexflow_single_dataloader_reset(self.handle)
+    ffc().flexflow_single_dataloader_reset(self.handle)
 
 class RegionNdarray(object):
   __slots__ = ['__array_interface__']
@@ -3198,8 +3199,8 @@ def __init__(self, shape, data_type, base_ptr, strides, read_only):
 class BatchConfig(object):
   __slots__ = ['handle', '_handle']
   def __init__(self):
-    self.handle = ffc.flexflow_batch_config_create()
-    self._handle = ffi.gc(self.handle, ffc.flexflow_batch_config_destroy)
+    self.handle = ffc().flexflow_batch_config_create()
+    self._handle = ffi.gc(self.handle, ffc().flexflow_batch_config_destroy)
 
 # -----------------------------------------------------------------------
 # TreeVerifyBatchConfig
@@ -3208,8 +3209,8 @@ def __init__(self):
 class TreeVerifyBatchConfig(object):
   __slots__ = ['handle', '_handle']
   def __init__(self):
-    self.handle = ffc.flexflow_tree_verify_batch_config_create()
-    self._handle = ffi.gc(self.handle, ffc.flexflow_tree_verify_batch_config_destroy)
+    self.handle = ffc().flexflow_tree_verify_batch_config_create()
+    self._handle = ffi.gc(self.handle, ffc().flexflow_tree_verify_batch_config_destroy)
 
 # -----------------------------------------------------------------------
 # BeamSearchBatchConfig
@@ -3218,8 +3219,8 @@ def __init__(self):
 class BatchConfig(object):
   __slots__ = ['handle', '_handle']
   def __init__(self):
-    self.handle = ffc.flexflow_beam_search_batch_config_create()
-    self._handle = ffi.gc(self.handle, ffc.flexflow_beam_search_batch_config_destroy)
+    self.handle = ffc().flexflow_beam_search_batch_config_create()
+    self._handle = ffi.gc(self.handle, ffc().flexflow_beam_search_batch_config_destroy)
 
 # -----------------------------------------------------------------------
 # RequestManager
@@ -3228,20 +3229,20 @@ def __init__(self):
 class RequestManager(object):
   __slots__ = ['handle']
   def __init__(self):
-    self.handle = ffc.flexflow_request_manager_get_request_manager()
-    #self._handle = ffi.gc(self.handle, ffc.flexflow_request_manager_destroy)
+    self.handle = ffc().flexflow_request_manager_get_request_manager()
+    #self._handle = ffi.gc(self.handle, ffc().flexflow_request_manager_destroy)
 
   def register_tokenizer(self, model_type, bos_token_id, eos_token_id, tokenizer_filepath):
     c_model_type = enum_to_int(ModelType, model_type)
     c_tokenizer_filepath = get_c_name(tokenizer_filepath)
-    return ffc.flexflow_request_manager_register_tokenizer(self.handle, c_model_type, bos_token_id, eos_token_id, c_tokenizer_filepath)
+    return ffc().flexflow_request_manager_register_tokenizer(self.handle, c_model_type, bos_token_id, eos_token_id, c_tokenizer_filepath)
   
   def register_output_filepath(self, output_filepath):
     c_output_filepath = get_c_name(output_filepath)
-    return ffc.flexflow_request_manager_register_output_filepath(self.handle, c_output_filepath)
+    return ffc().flexflow_request_manager_register_output_filepath(self.handle, c_output_filepath)
 
   def register_ssm_model(self, model):
-    return ffc.flexflow_request_manager_register_ssm_model(self.handle, model.handle)
+    return ffc().flexflow_request_manager_register_ssm_model(self.handle, model.handle)
   
 # -----------------------------------------------------------------------
 # InferenceManager
@@ -3250,14 +3251,14 @@ def register_ssm_model(self, model):
 class InferenceManager(object):
   __slots__ = ['handle']
   def __init__(self):
-    self.handle = ffc.flexflow_inference_manager_get_inference_manager()
-    #self._handle = ffi.gc(self.handle, ffc.flexflow_inference_manager_destroy)
+    self.handle = ffc().flexflow_inference_manager_get_inference_manager()
+    #self._handle = ffi.gc(self.handle, ffc().flexflow_inference_manager_destroy)
 
   def compile_model_and_allocate_buffer(self, model):
-    ffc.flexflow_inference_manager_compile_model_and_allocate_buffer(self.handle, model.handle)
+    ffc().flexflow_inference_manager_compile_model_and_allocate_buffer(self.handle, model.handle)
 
   def init_operators_inference(self, model):
-    ffc.flexflow_inference_manager_init_operators_inference(self.handle, model.handle)
+    ffc().flexflow_inference_manager_init_operators_inference(self.handle, model.handle)
 
 # -----------------------------------------------------------------------
 # FileDataLoader
@@ -3267,8 +3268,8 @@ class FileDataLoader(object):
   __slots__ = ['handle', '_handle']
   def __init__(self, weight_file_path, num_q_heads, num_kv_heads, hidden_dim, qkv_inner_dim, tensor_parallelism_degree):
     c_weight_file_path = get_c_name(weight_file_path)
-    self.handle = ffc.flexflow_file_data_loader_create(c_weight_file_path, num_q_heads, num_kv_heads, hidden_dim, qkv_inner_dim, tensor_parallelism_degree)
-    self._handle = ffi.gc(self.handle, ffc.flexflow_file_data_loader_destroy)
+    self.handle = ffc().flexflow_file_data_loader_create(c_weight_file_path, num_q_heads, num_kv_heads, hidden_dim, qkv_inner_dim, tensor_parallelism_degree)
+    self._handle = ffi.gc(self.handle, ffc().flexflow_file_data_loader_destroy)
   
   def load_weights(self, model, model_layers_with_weights, data_type):
     # Extract keys and values into arrays
@@ -3287,4 +3288,4 @@ def load_weights(self, model, model_layers_with_weights, data_type):
     # Check data type and create use_full_precision boolean
     assert(data_type == DataType.DT_FLOAT or data_type == DataType.DT_HALF)
     use_full_precision = data_type == DataType.DT_FLOAT
-    ffc.flexflow_file_data_loader_load_weights(self.handle, model.handle, num_layers, layer_names_c, layer_handles_c, use_full_precision)
+    ffc().flexflow_file_data_loader_load_weights(self.handle, model.handle, num_layers, layer_names_c, layer_handles_c, use_full_precision)
diff --git a/python/flexflow/flexflow_python b/python/flexflow/flexflow_python
index 7fed992c6d..cf247b9ede 100644
--- a/python/flexflow/flexflow_python
+++ b/python/flexflow/flexflow_python
@@ -7,5 +7,6 @@ pylib_path="$(python "$python_packages"/flexflow/findpylib.py)"
 pylib_dir="$(dirname "$pylib_path")"
 export PATH="${python_packages}/flexflow/bin:${PATH}"
 export LD_LIBRARY_PATH="${python_packages}/flexflow/lib:${pylib_dir}:${PATH}"
+legion_python_args=("$@" "-ll:py" "1")
 
-legion_python "$@"
\ No newline at end of file
+legion_python "${legion_python_args[@]}"
diff --git a/python/flexflow/jupyter.py b/python/flexflow/jupyter.py
deleted file mode 100644
index e2ed529c85..0000000000
--- a/python/flexflow/jupyter.py
+++ /dev/null
@@ -1,37 +0,0 @@
-# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-#     http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-#
-
-import json
-from flexflow.config import flexflow_dir
-
-_CONFIG_FILENAME = None
-
-def set_jupyter_config(filename):
-    global _CONFIG_FILENAME
-    _CONFIG_FILENAME = filename
-    print("config file is set to:", _CONFIG_FILENAME)
-
-def load_jupyter_config():
-  cmd_dict_key = ["cpus", "gpus", "utility", "sysmem", "fbmem", "zcmem"]
-  argv_dict = {}
-  global _CONFIG_FILENAME
-  if _CONFIG_FILENAME is None:
-      raise Exception("Sorry, jupyter configuration file is not set, please call set_jupyter_config to set the path to the configuration json file.")
-  with open(_CONFIG_FILENAME) as json_file:
-        cmd_dict = json.load(json_file)
-        for key in cmd_dict_key:
-            if key in cmd_dict and cmd_dict[key]["value"] is not None:
-               argv_dict[cmd_dict[key]["cmd"]] = cmd_dict[key]["value"]
-  return argv_dict
diff --git a/python/flexflow/serve/__init__.py b/python/flexflow/serve/__init__.py
index e45b9759a0..a8d0a0294c 100644
--- a/python/flexflow/serve/__init__.py
+++ b/python/flexflow/serve/__init__.py
@@ -12,43 +12,41 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 
-import sys, os
-from typing import Union, Optional
+from typing import Optional
 from ..type import *
+from flexflow.core import *
+from .serve import LLM, SSM, GenerationConfig, GenerationResult
 
 
-def _parse_positive_int_config(name: str, variable: str, ff_cli_name: str = None):
-    if variable is not None:
-        if type(variable) is not int:
+def __check_positive_int(configs_dict: dict, key: str):
+    value = configs_dict.get(key, None)
+    if value is not None:
+        if type(value) is not int:
+            raise TypeError(f"Parameter {key} has value {value}, which is not an int!")
+        elif value <= 0:
             raise ValueError(
-                f"The following configs take positive integers only: {name}"
+                f"Parameter {key} has value {value}, which is not a positive number!"
             )
-        elif variable <= 0:
-            raise ValueError(
-                f"The following configs take positive integers only: {name}"
-            )
-        if not ff_cli_name:
-            sys.argv += ["-{name}", str(variable)]
-        else:
-            sys.argv += [f"{ff_cli_name}", str(variable)]
 
 
-def init(configs_dict: Optional[dict] = None, 
-        *, 
-        num_gpus: Optional[int] = None,
-        memory_per_gpu: Optional[int] = None,
-        zero_copy_memory_per_node: Optional[int] = None,
-        num_cpus: Optional[int] = None,
-        legion_utility_processors: Optional[int] = None,
-        data_parallelism_degree: Optional[int] = None,
-        tensor_parallelism_degree: Optional[int] = None,
-        pipeline_parallelism_degree: Optional[int] = None,
-        offload: Optional[bool] = None,
-        offload_reserve_space_size: Optional[int] = None,
-        use_4bit_quantization: Optional[bool] = None,
-        use_8bit_quantization: Optional[bool] = None,
-        profiling: Optional[bool] = None,
-        fusion: Optional[bool] = None):
+def init(
+    configs_dict: Optional[dict] = None,
+    *,
+    num_gpus: Optional[int] = None,
+    memory_per_gpu: Optional[int] = None,
+    zero_copy_memory_per_node: Optional[int] = None,
+    num_cpus: Optional[int] = None,
+    legion_utility_processors: Optional[int] = None,
+    data_parallelism_degree: Optional[int] = None,
+    tensor_parallelism_degree: Optional[int] = None,
+    pipeline_parallelism_degree: Optional[int] = None,
+    offload: Optional[bool] = None,
+    offload_reserve_space_size: Optional[int] = None,
+    use_4bit_quantization: Optional[bool] = None,
+    use_8bit_quantization: Optional[bool] = None,
+    profiling: Optional[bool] = None,
+    fusion: Optional[bool] = None,
+):
     """
     Configure FlexFlow Serve and start the runtime. 
     
@@ -113,117 +111,86 @@ def init(configs_dict: Optional[dict] = None,
     :raises TypeError: this function will raise an exception if the configs_dict is not a dictionary
     :raises ValueError: this function will raise an exception if the mandatory FlexFlow initialization parameters are missing, or are not positive integers: num_gpus, memory_per_gpu, zero_copy_memory_per_node
     """
-    
-    # Check that either configs_dict or any of individual, non-positional arguments (after the *) is passed, but not both
-    if configs_dict is not None and any([
-        num_gpus is not None,
-        memory_per_gpu is not None,
-        zero_copy_memory_per_node is not None,
-        num_cpus is not None,
-        legion_utility_processors is not None,
-        data_parallelism_degree is not None,
-        tensor_parallelism_degree is not None,
-        pipeline_parallelism_degree is not None,
-        offload is not None,
-        offload_reserve_space_size is not None,
-        use_4bit_quantization is not None,
-        use_8bit_quantization is not None,
-        profiling is not None,
-        fusion is not None,
-    ]):
+
+    # Check that if configs_dict is passed, no other key-value argument (after the *) is passed.
+    if configs_dict is not None and any(
+        [
+            num_gpus is not None,
+            memory_per_gpu is not None,
+            zero_copy_memory_per_node is not None,
+            num_cpus is not None,
+            legion_utility_processors is not None,
+            data_parallelism_degree is not None,
+            tensor_parallelism_degree is not None,
+            pipeline_parallelism_degree is not None,
+            offload is not None,
+            offload_reserve_space_size is not None,
+            use_4bit_quantization is not None,
+            use_8bit_quantization is not None,
+            profiling is not None,
+            fusion is not None,
+        ]
+    ):
         raise ValueError("Cannot pass both configs_dict and individual args")
 
     if configs_dict is not None:
-        # If configs_dict is passed, check that the type is dictionary and that the mandatory key-value pairs are present (num_gpus, memory_per_gpu, zero_copy_memory_per_node)
         if type(configs_dict) != dict:
             raise TypeError("configs_dict is not a dictionary")
-        # configs should contain the following mandatory keys with non-zero integer values:
-        num_gpus = configs_dict.get("num_gpus")
-        memory_per_gpu = configs_dict.get("memory_per_gpu")
-        zero_copy_memory_per_node = configs_dict.get("zero_copy_memory_per_node")
-        if not num_gpus or not memory_per_gpu or not zero_copy_memory_per_node:
-            raise ValueError(
-                "Missing one of the following configs in config dict: num_gpus, memory_per_gpu, zero_copy_memory_per_node"
-            )
-        num_cpus = configs_dict.get("num_cpus")
-        legion_utility_processors = configs_dict.get("legion_utility_processors", 8)
-        data_parallelism_degree = configs_dict.get("data_parallelism_degree")
-        tensor_parallelism_degree = configs_dict.get("tensor_parallelism_degree")
-        pipeline_parallelism_degree = configs_dict.get("pipeline_parallelism_degree")
-        offload = configs_dict.get("offload", False)
-        offload_reserve_space_size = configs_dict.get("offload_reserve_space_size")
-        use_4bit_quantization = configs_dict.get("use_4bit_quantization", False)
-        use_8bit_quantization = configs_dict.get("use_8bit_quantization", False)
-        profiling = configs_dict.get("profiling", False)
-        fusion = configs_dict.get("fusion", True)
     else:
-        # If configs_dict is not passed, check that the mandatory parameters are passed directly as arguments
-        if not num_gpus or not memory_per_gpu or not zero_copy_memory_per_node:
+        # Add named key-value arguments into dictionary
+        configs_dict["num_gpus"] = num_gpus
+        configs_dict["memory_per_gpu"] = memory_per_gpu
+        configs_dict["zero_copy_memory_per_node"] = zero_copy_memory_per_node
+        configs_dict["legion_utility_processors"] = legion_utility_processors
+        configs_dict["data_parallelism_degree"] = data_parallelism_degree
+        configs_dict["tensor_parallelism_degree"] = tensor_parallelism_degree
+        configs_dict["pipeline_parallelism_degree"] = pipeline_parallelism_degree
+        configs_dict["offload"] = offload
+        configs_dict["offload_reserve_space_size"] = offload_reserve_space_size
+        configs_dict["use_4bit_quantization"] = use_4bit_quantization
+        configs_dict["use_8bit_quantization"] = use_8bit_quantization
+        configs_dict["profiling"] = profiling
+        configs_dict["fusion"] = fusion
+
+    # Check that mandatory configs are present
+    required_keys = ["num_gpus", "memory_per_gpu", "zero_copy_memory_per_node"]
+    for required_key in required_keys:
+        if configs_dict.get(required_key, None) is None:
             raise ValueError(
-            "Missing one of the following configs in input params: num_gpus, memory_per_gpu, zero_copy_memory_per_node"
-        )
-        offload = False if offload is None else offload
-        use_4bit_quantization = False if use_4bit_quantization is None else use_4bit_quantization
-        use_8bit_quantization = False if use_8bit_quantization is None else use_8bit_quantization
-        profiling = False if profiling is None else profiling
-        fusion = True if fusion is None else fusion
-        
-    # Remove the arguments to avoid interferences
-    sys.argv = [sys.argv[0]]
-               
-    # parse arguments     
-    _parse_positive_int_config("num_gpus", num_gpus, "-ll:gpu")
-    _parse_positive_int_config("memory_per_gpu", memory_per_gpu, "-ll:fsize")
-    _parse_positive_int_config(
-        "zero_copy_memory_per_node", zero_copy_memory_per_node, "-ll:zsize"
-    )
+                "Missing one of the following required configs: num_gpus, memory_per_gpu, zero_copy_memory_per_node"
+            )
 
-    # parse optional arguments
-    _parse_positive_int_config("num_cpus", num_cpus, "-ll:cpu")
-    _parse_positive_int_config(
-        "legion_utility_processors", legion_utility_processors, "-ll:util"
-    )
-    _parse_positive_int_config(
-        "data_parallelism_degree", data_parallelism_degree, "-data-parallelism-degree"
-    )
-    _parse_positive_int_config(
+    # Sanity check parameters
+    positive_int_params = required_keys + [
+        "legion_utility_processors",
+        "data_parallelism_degree",
         "tensor_parallelism_degree",
-        tensor_parallelism_degree,
-        "-tensor-parallelism-degree",
-    )
-    _parse_positive_int_config(
         "pipeline_parallelism_degree",
-        pipeline_parallelism_degree,
-        "-pipeline-parallelism-degree",
-    )
-    if offload:
-        sys.argv += ["-offload"]
-    _parse_positive_int_config(
         "offload_reserve_space_size",
-        offload_reserve_space_size,
-        "-offload-reserve-space-size",
-    )
-    if use_4bit_quantization:
-        sys.argv += ["--4bit-quantization"]
-    if use_8bit_quantization:
-        sys.argv += ["--8bit-quantization"]
-    if profiling:
-        sys.argv += ["--profiling"]
-    if fusion:
-        sys.argv += ["--fusion"]
-
-    global LLM, SSM, GenerationConfig, GenerationResult
-    from .serve import LLM, SSM, GenerationConfig, GenerationResult
+    ]
+    for param in positive_int_params:
+        __check_positive_int(configs_dict, param)
 
+    # Set default values
+    if configs_dict.get("legion_utility_processors", None) is None:
+        configs_dict["legion_utility_processors"] = 8
+    if configs_dict.get("data_parallelism_degree", None) is None:
+        configs_dict["data_parallelism_degree"] = 1
+    if configs_dict.get("tensor_parallelism_degree", None) is None:
+        configs_dict["tensor_parallelism_degree"] = 1
+    if configs_dict.get("pipeline_parallelism_degree", None) is None:
+        configs_dict["pipeline_parallelism_degree"] = 1
+    if configs_dict.get("offload", None) is None:
+        configs_dict["offload"] = False
+    if configs_dict.get("offload_reserve_space_size", None) is None:
+        configs_dict["offload_reserve_space_size"] = 1024 ** 2
+    if configs_dict.get("use_4bit_quantization", None) is None:
+        configs_dict["use_4bit_quantization"] = False
+    if configs_dict.get("use_8bit_quantization", None) is None:
+        configs_dict["use_8bit_quantization"] = False
+    if configs_dict.get("profiling", None) is None:
+        configs_dict["profiling"] = False
+    if configs_dict.get("fusion", None) is None:
+        configs_dict["fusion"] = True
 
-def init_cpu():
-    """Start the FlexFlow runtime and import the inference package without access to GPU functionalities.
-    This is useful to access the utilies from the flexflow package without using up GPU memory.
-    """
-    # Remove the arguments to avoid interferences
-    sys.argv = [sys.argv[0]]
-    # Ask the runtime to avoid using GPU/GPU memory
-    os.environ["CPU_ONLY_TEST"] = "1"
-
-    global LLM, SSM, GenerationConfig, GenerationResult
-    from .serve import LLM, SSM, GenerationConfig, GenerationResult
+    init_flexflow_runtime(configs_dict)
diff --git a/python/flexflow_python_build.py b/python/flexflow_python_build.py
index a9d8e8983e..65aff5af56 100755
--- a/python/flexflow_python_build.py
+++ b/python/flexflow_python_build.py
@@ -42,15 +42,19 @@
     '#! /usr/bin/env bash',
     f'BUILD_FOLDER="{build_dir}"',
     'SCRIPT_DIR="$(realpath "${BASH_SOURCE[0]%/*}")"',
+    'legion_python_args=("$@" "-ll:py" "1")',
     'if [[ "$SCRIPT_DIR" == "$BUILD_FOLDER" ]]; then',
     f'\tPYTHON_FOLDER="{script_dir}"',
     '\tPYLIB_PATH="$("$PYTHON_FOLDER"/flexflow/findpylib.py)"',
     '\tPYLIB_DIR="$(dirname "$PYLIB_PATH")"',
     '\texport LD_LIBRARY_PATH="$BUILD_FOLDER:$BUILD_FOLDER/deps/legion/lib:$PYLIB_DIR:$LD_LIBRARY_PATH"',
     '\texport PYTHONPATH="$PYTHON_FOLDER:$BUILD_FOLDER/deps/legion/bindings/python:$PYTHONPATH"',
-    '\t$BUILD_FOLDER/deps/legion/bin/legion_python "$@"',
+    '\t$BUILD_FOLDER/deps/legion/bin/legion_python "${legion_python_args[@]}"',
     'else',
-    '\tlegion_python "$@"',
+    '\tPYLIB_PATH="$(python3 -m flexflow.findpylib)"',
+    '\tPYLIB_DIR="$(dirname "$PYLIB_PATH")"',
+    '\texport LD_LIBRARY_PATH="$PYLIB_DIR:$LD_LIBRARY_PATH"',
+    '\tlegion_python "${legion_python_args[@]}"',
     'fi'
 ]
 with open(flexflow_python_path, "w+") as flexflow_python_file:
diff --git a/src/ops/inc_multihead_self_attention.cpp b/src/ops/inc_multihead_self_attention.cpp
index b4102a7dba..75e68a7332 100644
--- a/src/ops/inc_multihead_self_attention.cpp
+++ b/src/ops/inc_multihead_self_attention.cpp
@@ -395,11 +395,11 @@ void pre_build_weight_kernel(IncMultiHeadSelfAttentionMeta const *m,
   if (m->quantization_type != DT_NONE) {
     // copy weight_ptr to quantized_weight_ptr, do compression and store in
     // m->weight_ptr
-    hipMemcpyAsync(m->quantized_weight_ptr,
-                   weight.get_byte_ptr(),
-                   m->quantized_weightSize,
-                   hipMemcpyHostToDevice,
-                   stream);
+    checkCUDA(hipMemcpyAsync(m->quantized_weight_ptr,
+                             weight.get_byte_ptr(),
+                             m->quantized_weightSize,
+                             hipMemcpyHostToDevice,
+                             stream));
 
     if (m->quantization_type == DT_INT4) {
       int parallelism = m->qProjSize * m->qSize * m->num_q_heads / 2;
@@ -427,17 +427,17 @@ void pre_build_weight_kernel(IncMultiHeadSelfAttentionMeta const *m,
     }
   } else {
     if (data_type == DT_FLOAT) {
-      hipMemcpyAsync(m->weight_ptr,
-                     weight.get_float_ptr(),
-                     m->weightSize,
-                     hipMemcpyHostToDevice,
-                     stream);
+      checkCUDA(hipMemcpyAsync(m->weight_ptr,
+                               weight.get_float_ptr(),
+                               m->weightSize,
+                               hipMemcpyHostToDevice,
+                               stream));
     } else if (data_type == DT_HALF) {
-      hipMemcpyAsync(m->weight_ptr,
-                     weight.get_half_ptr(),
-                     m->weightSize,
-                     hipMemcpyHostToDevice,
-                     stream);
+      checkCUDA(hipMemcpyAsync(m->weight_ptr,
+                               weight.get_half_ptr(),
+                               m->weightSize,
+                               hipMemcpyHostToDevice,
+                               stream));
     } else {
       assert(false);
     }
@@ -456,15 +456,16 @@ void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
   // here because we need postion info in infernece 1
 
   if (m->offload && m->biasSize > 0) {
-    hipMemcpyAsync(
-        m->bias_ptr, bias_ptr, m->biasSize, hipMemcpyHostToDevice, stream);
+    checkCUDA(hipMemcpyAsync(
+        m->bias_ptr, bias_ptr, m->biasSize, hipMemcpyHostToDevice, stream));
     bias_ptr = static_cast<DT *>(m->bias_ptr);
   }
-  hipMemcpyAsync(m->token_infos,
-                 &(bc->tokensInfo),
-                 bc->num_active_tokens() * sizeof(BatchConfig::PerTokenInfo),
-                 hipMemcpyHostToDevice,
-                 stream);
+  checkCUDA(hipMemcpyAsync(m->token_infos,
+                           &(bc->tokensInfo),
+                           bc->num_active_tokens() *
+                               sizeof(BatchConfig::PerTokenInfo),
+                           hipMemcpyHostToDevice,
+                           stream));
   // phase 1: Implement kernel to compute KQV for input tokens
   compute_qkv_kernel(m,
                      bc,
@@ -1132,7 +1133,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
              gpu_mem_allocator.reserved_allocated_size);
     }
   }
-  hipStreamSynchronize(stream);
+  checkCUDA(hipStreamSynchronize(stream));
 }
 
 IncMultiHeadSelfAttentionMeta::~IncMultiHeadSelfAttentionMeta(void) {}
diff --git a/src/ops/spec_inc_multihead_self_attention.cpp b/src/ops/spec_inc_multihead_self_attention.cpp
index c9ef952d3b..e5e35a4c90 100644
--- a/src/ops/spec_inc_multihead_self_attention.cpp
+++ b/src/ops/spec_inc_multihead_self_attention.cpp
@@ -528,28 +528,32 @@ void inference_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                       DT const *bias_ptr,
                       hipStream_t stream) {
   // here because we need postion info in infernece 1
-  hipMemcpyAsync(m->token_infos,
-                 &(bc->tokensInfo),
-                 bc->MAX_NUM_TOKENS * sizeof(BatchConfig::PerTokenInfo),
-                 hipMemcpyHostToDevice,
-                 stream);
-  hipMemcpyAsync(m->request_infos,
-                 &(bc->requestsInfo),
-                 bc->MAX_NUM_REQUESTS * sizeof(BatchConfig::PerRequestInfo),
-                 hipMemcpyHostToDevice,
-                 stream);
-  hipMemcpyAsync(m->beam_token_infos,
-                 &(bc->beamTokenInfo),
-                 bc->MAX_NUM_TOKENS * bc->MAX_BEAM_WIDTH *
-                     sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo),
-                 hipMemcpyHostToDevice,
-                 stream);
-  hipMemcpyAsync(m->beam_request_infos,
-                 &(bc->beamRequestsInfo),
-                 bc->MAX_NUM_REQUESTS *
-                     sizeof(BeamSearchBatchConfig::BeamSearchPerRequestInfo),
-                 hipMemcpyHostToDevice,
-                 stream);
+  checkCUDA(
+      hipMemcpyAsync(m->token_infos,
+                     &(bc->tokensInfo),
+                     bc->MAX_NUM_TOKENS * sizeof(BatchConfig::PerTokenInfo),
+                     hipMemcpyHostToDevice,
+                     stream));
+  checkCUDA(
+      hipMemcpyAsync(m->request_infos,
+                     &(bc->requestsInfo),
+                     bc->MAX_NUM_REQUESTS * sizeof(BatchConfig::PerRequestInfo),
+                     hipMemcpyHostToDevice,
+                     stream));
+  checkCUDA(
+      hipMemcpyAsync(m->beam_token_infos,
+                     &(bc->beamTokenInfo),
+                     bc->MAX_NUM_TOKENS * bc->MAX_BEAM_WIDTH *
+                         sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo),
+                     hipMemcpyHostToDevice,
+                     stream));
+  checkCUDA(hipMemcpyAsync(
+      m->beam_request_infos,
+      &(bc->beamRequestsInfo),
+      bc->MAX_NUM_REQUESTS *
+          sizeof(BeamSearchBatchConfig::BeamSearchPerRequestInfo),
+      hipMemcpyHostToDevice,
+      stream));
   // phase 1: Implement kernel to compute KQV for input tokens
   compute_qkv_kernel(m,
                      bc,
@@ -710,7 +714,7 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
            gpu_mem_allocator.instance_allocated_size);
   }
 
-  hipStreamSynchronize(stream);
+  checkCUDA(hipStreamSynchronize(stream));
 }
 
 SpecIncMultiHeadSelfAttentionMeta::~SpecIncMultiHeadSelfAttentionMeta(void) {
diff --git a/src/ops/tree_inc_multihead_self_attention.cpp b/src/ops/tree_inc_multihead_self_attention.cpp
index fbd6d1cc48..b3a56f650a 100644
--- a/src/ops/tree_inc_multihead_self_attention.cpp
+++ b/src/ops/tree_inc_multihead_self_attention.cpp
@@ -518,15 +518,15 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
   if (m->handle.offload_reserve_space != nullptr) {
     // Note that we update weight_ptr and bias_ptr when uploading weight and
     // bias
-    hipMemcpyAsync(m->weight_ptr,
-                   weight_ptr,
-                   m->weightSize,
-                   hipMemcpyHostToDevice,
-                   stream);
+    checkCUDA(hipMemcpyAsync(m->weight_ptr,
+                             weight_ptr,
+                             m->weightSize,
+                             hipMemcpyHostToDevice,
+                             stream));
     weight_ptr = static_cast<DT *>(m->weight_ptr);
     if (m->biasSize > 0) {
-      hipMemcpyAsync(
-          m->bias_ptr, bias_ptr, m->biasSize, hipMemcpyHostToDevice, stream);
+      checkCUDA(hipMemcpyAsync(
+          m->bias_ptr, bias_ptr, m->biasSize, hipMemcpyHostToDevice, stream));
       bias_ptr = static_cast<DT *>(m->bias_ptr);
     }
   }
@@ -534,12 +534,13 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
   // Note that m->num_active_tokens stores the number of active
   // tokens in the previous batch, which is needed for committing
   // keys/values to the key-value cache
-  hipMemcpyAsync(m->committed_token_infos,
-                 &(bc->committed_tokens),
-                 bc->num_tokens_to_commit *
-                     sizeof(TreeVerifyBatchConfig::CommittedTokensInfo),
-                 hipMemcpyHostToDevice,
-                 stream);
+  checkCUDA(
+      hipMemcpyAsync(m->committed_token_infos,
+                     &(bc->committed_tokens),
+                     bc->num_tokens_to_commit *
+                         sizeof(TreeVerifyBatchConfig::CommittedTokensInfo),
+                     hipMemcpyHostToDevice,
+                     stream));
   commit_tokens<DT>(m, bc, stream);
 
   // After commit we update m->num_active_tokens to be the number of active
@@ -548,16 +549,16 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
 
   // here because we need postion info in infernece 1
   if (m->offload && m->biasSize > 0) {
-    hipMemcpyAsync(
-        m->bias_ptr, bias_ptr, m->biasSize, hipMemcpyHostToDevice, stream);
+    checkCUDA(hipMemcpyAsync(
+        m->bias_ptr, bias_ptr, m->biasSize, hipMemcpyHostToDevice, stream));
     bias_ptr = static_cast<DT *>(m->bias_ptr);
   }
-  hipMemcpyAsync(m->token_infos,
-                 &(bc->tokensInfo),
-                 bc->MAX_NUM_TOKENS *
-                     sizeof(TreeVerifyBatchConfig::PerTokenInfo),
-                 hipMemcpyHostToDevice,
-                 stream);
+  checkCUDA(hipMemcpyAsync(m->token_infos,
+                           &(bc->tokensInfo),
+                           bc->MAX_NUM_TOKENS *
+                               sizeof(TreeVerifyBatchConfig::PerTokenInfo),
+                           hipMemcpyHostToDevice,
+                           stream));
   // phase 1: Implement kernel to compute KQV for input tokens
   compute_qkv_kernel(m,
                      bc,
@@ -719,7 +720,7 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
     }
   }
 
-  hipStreamSynchronize(stream);
+  checkCUDA(hipStreamSynchronize(stream));
 }
 
 TreeIncMultiHeadSelfAttentionMeta::~TreeIncMultiHeadSelfAttentionMeta(void) {
diff --git a/tests/align/align_create_tensor_ff.py b/tests/align/align_create_tensor_ff.py
index 2dbcb942d3..6c8774a33e 100644
--- a/tests/align/align_create_tensor_ff.py
+++ b/tests/align/align_create_tensor_ff.py
@@ -1,7 +1,7 @@
 import os
 import sys
 import torch
-import argparse
+import json
 from flexflow.core import *
 from flexflow.core.flexflow_cffi import Linear, Op, Parameter
 from flexflow.type import AggrMode
@@ -20,8 +20,14 @@
 param_bias_op = {'conv2d': Conv2D, 'layernorm': LayerNorm, 'linear': Linear}
 
 
-def create_single_operator_ff():
+def top_level_task():
     args = parse_create_tensor_args()
+    configs_dict = None
+    if args.config_file is not None:
+        with open(args.config_file) as f:
+            configs_dict = json.load(f)
+    init_flexflow_runtime(configs_dict)
+
     operator_name = args.operator
     OUT_DIR = os.path.join("tests", "align", "out", operator_name)
 
@@ -669,4 +675,4 @@ def create_tensors_for_gather_ff(ffmodel):
 
 
 if __name__ == "__main__":
-    create_single_operator_ff()
+    top_level_task()
diff --git a/tests/align/align_utils.py b/tests/align/align_utils.py
index 368893c5eb..d53e5cbba9 100644
--- a/tests/align/align_utils.py
+++ b/tests/align/align_utils.py
@@ -112,7 +112,12 @@ def parse_create_tensor_args():
     parser = ArgumentParser(description='Pytorch Aligment Test Suite')
     parser.add_argument("-o", "--operator", dest="operator",
                         required=False, metavar="", help="operator needs to be test")
-
+    parser.add_argument(
+        "-config-file",
+        help="The path to a JSON file with the configs. If omitted, a sample model and configs will be used instead.",
+        type=str,
+        default=None,
+    )
     args, unknown = parser.parse_known_args()
     return args
 
diff --git a/tests/align/test_all_operators.sh b/tests/align/test_all_operators.sh
index 484e121eee..3fb361f25c 100755
--- a/tests/align/test_all_operators.sh
+++ b/tests/align/test_all_operators.sh
@@ -4,7 +4,7 @@ eval "$(conda shell.bash hook)"
 rm -rf align/out
 
 function generate_ff_tensor(){
-    ./build/flexflow_python tests/align/align_create_tensor_ff.py -ll:py 1 -ll:gpu 1 -ll:fsize 5000 -ll:zsize 4096 -b 16 -o "$1"
+    ./build/flexflow_python tests/align/align_create_tensor_ff.py -ll:gpu 1 -ll:fsize 5000 -ll:zsize 4096 -b 16 -o "$1"
 }
 
 function generate_torch_tensor(){
diff --git a/tests/cpp_gpu_tests.sh b/tests/cpp_gpu_tests.sh
index 29e377e5bc..1e8dd4298f 100755
--- a/tests/cpp_gpu_tests.sh
+++ b/tests/cpp_gpu_tests.sh
@@ -51,11 +51,6 @@ if [[ -f "$FF_HOME/build/examples/cpp/AlexNet/alexnet" ]]; then
 	# TODO: fix split tests
 	# "$FF_HOME"/build/examples/cpp/split_test/split_test -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
 	# "$FF_HOME"/build/examples/cpp/split_test_2/split_test_2 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-	# Inference examples
-	# if [ $(( GPU_AVAILABLE )) -lt $(( 4 )) ]; then echo "Skipping LLAMA test because it requires 4 GPUs, but only $GPU_AVAILABLE are available. " ; exit 1; fi
-	# "$FF_HOME"/build/examples/cpp/inference/LLAMA/LLAMA -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize 30000 --only-data-parallel
-	#"$FF_HOME"/build/examples/cpp/inference/mixture_of_experts/inference_moe -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
-	#"$FF_HOME"/build/examples/cpp/inference/transformers/inference_transformers -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
 else
 	python_packages=$(python -c "from distutils import sysconfig; print(sysconfig.get_python_lib(plat_specific=False,standard_lib=False))")
 	OLD_PATH="$PATH"
@@ -84,11 +79,6 @@ else
 			# TODO: fix split tests 
 			# split_test -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
 			# split_test_2 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-			# Inference examples
-			# if [ $(( GPU_AVAILABLE )) -lt $(( 4 )) ]; then echo "Skipping LLAMA test because it requires 4 GPUs, but only $GPU_AVAILABLE are available. " ; exit 1; fi
-			# LLAMA -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize 30000 --only-data-parallel
-			#inference_moe -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
-			#inference_transformers -ll:gpu "$GPUS" -ll:util 8 -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --only-data-parallel
 		fi
 	done
 	export PATH="$OLD_PATH"
diff --git a/tests/multi_gpu_tests.sh b/tests/multi_gpu_tests.sh
index 0321068641..3a6f6467df 100755
--- a/tests/multi_gpu_tests.sh
+++ b/tests/multi_gpu_tests.sh
@@ -8,75 +8,82 @@ NUM_NODES=${2:-1} # number of nodes
 BATCHSIZE=$(( NUM_NODES * GPUS * 64))
 FSIZE=13800
 ZSIZE=12192
+ONLY_DATA_PARALLEL=true
 
 FF_HOME="$(realpath "${BASH_SOURCE[0]%/*}/..")"
 export FF_HOME
-# Edit the folder below if you did not build FlexFlow in $FF_HOME/build
-BUILD_FOLDER="${FF_HOME}/build"
-export BUILD_FOLDER
 
 if [[ $NUM_NODES -gt 1 ]]; then
     export GPUS
     export NUM_NODES
     EXE="$FF_HOME"/tests/multinode_helpers/mpi_wrapper1.sh
 else
-    if [[ -f "$BUILD_FOLDER/flexflow_python" ]]; then
-        EXE="$BUILD_FOLDER"/flexflow_python
-    else
-        EXE="flexflow_python"
-    fi
+    EXE="python"
 fi
 
+# Check that number of GPUs requested is available
 echo "Running GPU tests with $NUM_NODES node(s) and $GPUS gpu(s)/node"
 GPU_AVAILABLE=$(nvidia-smi --query-gpu=name --format=csv,noheader | wc -l)
 GPU_REQUESTED=$(( GPUS * NUM_NODES))
 if [ $GPU_REQUESTED -gt $(( GPU_AVAILABLE )) ]; then echo "The test requires $GPU_REQUESTED GPUs, but only $GPU_AVAILABLE are available. Try reducing the number of nodes, or the number of gpus/node." ; exit; fi
 
+# Generate configs JSON files
+test_params=$(jq -n --arg num_gpus "$GPUS" --arg memory_per_gpu "$FSIZE" --arg zero_copy_memory_per_node "$ZSIZE" --arg batch_size "$BATCHSIZE" --arg only_data_parallel "$ONLY_DATA_PARALLEL" '{"num_gpus":$num_gpus,"memory_per_gpu":$memory_per_gpu,"zero_copy_memory_per_node":$zero_copy_memory_per_node,"batch_size":$batch_size,"only_data_parallel":$only_data_parallel}')
+test_params_5_epochs=$(echo "$test_params" | jq '. + {"epochs": 5}')
+test_params_40_epochs=$(echo "$test_params" | jq '. + {"epochs": 40}')
+test_params_5_epochs_no_batch_size=$(echo "$test_params_5_epochs" | jq 'del(.batch_size)')
+test_params_40_epochs_no_batch_size=$(echo "$test_params_40_epochs" | jq 'del(.batch_size)')
+mkdir -p /tmp/flexflow/multi_gpu_tests
+echo "$test_params" > /tmp/flexflow/multi_gpu_tests/test_params.json
+echo "$test_params_5_epochs" > /tmp/flexflow/multi_gpu_tests/test_params_5_epochs.json
+echo "$test_params_5_epochs_no_batch_size" > /tmp/flexflow/multi_gpu_tests/test_params_5_epochs_no_batch_size.json
+echo "$test_params_40_epochs_no_batch_size" > /tmp/flexflow/multi_gpu_tests/test_params_40_epochs_no_batch_size.json
+
 #Sequential model tests
-$EXE "$FF_HOME"/examples/python/keras/seq_mnist_mlp.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/seq_mnist_cnn.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-#$EXE "$FF_HOME"/examples/python/keras/seq_reuters_mlp.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/seq_cifar10_cnn.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/seq_mnist_mlp_net2net.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/seq_mnist_cnn_net2net.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/seq_mnist_cnn_nested.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
+$EXE "$FF_HOME"/examples/python/keras/seq_mnist_mlp.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/seq_mnist_cnn.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+#$EXE "$FF_HOME"/examples/python/keras/seq_reuters_mlp.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/seq_cifar10_cnn.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/seq_mnist_mlp_net2net.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/seq_mnist_cnn_net2net.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/seq_mnist_cnn_nested.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
 
 #Keras other
-$EXE "$FF_HOME"/examples/python/keras/callback.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/unary.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/reshape.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/elementwise_mul_broadcast.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/reduce_sum.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/identity_loss.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel 
-$EXE "$FF_HOME"/examples/python/keras/elementwise_max_min.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel 
-$EXE "$FF_HOME"/examples/python/keras/rsqrt.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/gather.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/regularizer.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
+$EXE "$FF_HOME"/examples/python/keras/callback.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/unary.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/reshape.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/elementwise_mul_broadcast.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/reduce_sum.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/identity_loss.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/elementwise_max_min.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/rsqrt.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/gather.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/regularizer.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
 
 #Functional API
-$EXE "$FF_HOME"/examples/python/keras/func_mnist_mlp.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/func_mnist_mlp_concat.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/func_mnist_mlp_concat2.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/func_mnist_cnn.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/func_mnist_cnn_concat.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_nested.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/func_cifar10_alexnet.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/func_mnist_mlp_net2net.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_net2net.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
+$EXE "$FF_HOME"/examples/python/keras/func_mnist_mlp.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_mnist_mlp_concat.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_mnist_mlp_concat2.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_mnist_cnn.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_mnist_cnn_concat.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_nested.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_cifar10_alexnet.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_mnist_mlp_net2net.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_net2net.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
 
 #Python
-$EXE "$FF_HOME"/examples/python/native/print_layers.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --epochs 5 -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/native/split.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/native/alexnet.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --epochs 40 --only-data-parallel
-$EXE "$FF_HOME"/examples/python/native/mnist_mlp.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --epochs 5 -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/native/mnist_cnn.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --epochs 5 -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/native/cifar10_cnn.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --epochs 40 --only-data-parallel
-$EXE "$FF_HOME"/examples/python/native/cifar10_cnn_attach.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --epochs 5 --only-data-parallel
-$EXE "$FF_HOME"/examples/python/native/mnist_mlp_attach.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --epochs 5 --only-data-parallel
+$EXE "$FF_HOME"/examples/python/native/print_layers.py -config-file /tmp/flexflow/multi_gpu_tests/test_params_5_epochs.json
+$EXE "$FF_HOME"/examples/python/native/split.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/native/alexnet.py -config-file /tmp/flexflow/multi_gpu_tests/test_params_40_epochs_no_batch_size.json
+$EXE "$FF_HOME"/examples/python/native/mnist_mlp.py -config-file /tmp/flexflow/multi_gpu_tests/test_params_5_epochs.json
+$EXE "$FF_HOME"/examples/python/native/mnist_cnn.py -config-file /tmp/flexflow/multi_gpu_tests/test_params_5_epochs.json
+$EXE "$FF_HOME"/examples/python/native/cifar10_cnn.py -config-file /tmp/flexflow/multi_gpu_tests/test_params_40_epochs_no_batch_size.json
+$EXE "$FF_HOME"/examples/python/native/cifar10_cnn_attach.py -config-file /tmp/flexflow/multi_gpu_tests/test_params_5_epochs_no_batch_size.json
+$EXE "$FF_HOME"/examples/python/native/mnist_mlp_attach.py -config-file /tmp/flexflow/multi_gpu_tests/test_params_5_epochs_no_batch_size.json
 
 #Possible crash
-$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_concat.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_concat_model.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_concat_seq_model.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
-$EXE "$FF_HOME"/examples/python/native/cifar10_cnn_concat.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" --epochs 40 --only-data-parallel
+$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_concat.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_concat_model.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_concat_seq_model.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/native/cifar10_cnn_concat.py -config-file /tmp/flexflow/multi_gpu_tests/test_params_40_epochs_no_batch_size.json
diff --git a/tests/multinode_helpers/mpi_wrapper1.sh b/tests/multinode_helpers/mpi_wrapper1.sh
index 2e493f63e7..87d17d11a3 100755
--- a/tests/multinode_helpers/mpi_wrapper1.sh
+++ b/tests/multinode_helpers/mpi_wrapper1.sh
@@ -3,7 +3,6 @@ set -x
 set -e
 
 if [ -z "$FF_HOME" ]; then echo "FF_HOME variable is not defined, aborting tests"; exit; fi
-if [ -z "$BUILD_FOLDER" ]; then echo "BUILD_FOLDER variable is not defined, aborting tests"; exit; fi
 if [ -z "$NUM_NODES" ]; then echo "NUM_NODES variable is not defined, aborting tests"; exit; fi
 if [ -z "$GPUS" ]; then echo "GPUS variable is not defined, aborting tests"; exit; fi
 
diff --git a/tests/multinode_helpers/mpi_wrapper2.sh b/tests/multinode_helpers/mpi_wrapper2.sh
index a4e871d700..57812884dc 100755
--- a/tests/multinode_helpers/mpi_wrapper2.sh
+++ b/tests/multinode_helpers/mpi_wrapper2.sh
@@ -2,8 +2,6 @@
 set -x
 set -e
 
-if [ -z "$FF_HOME" ]; then echo "FF_HOME variable is not defined, aborting tests"; exit; fi
-if [ -z "$BUILD_FOLDER" ]; then echo "BUILD_FOLDER variable is not defined, aborting tests"; exit; fi
 if [ -z "$NUM_NODES" ]; then echo "NUM_NODES variable is not defined, aborting tests"; exit; fi
 if [ -z "$GPUS" ]; then echo "GPUS variable is not defined, aborting tests"; exit; fi
 
@@ -13,11 +11,4 @@ if [ -z "$GPUS" ]; then echo "GPUS variable is not defined, aborting tests"; exi
 CUDA_VISIBLE_DEVICES=$(seq -s, $((OMPI_COMM_WORLD_RANK * GPUS ))  $(( OMPI_COMM_WORLD_RANK * GPUS +1 )) )
 export CUDA_VISIBLE_DEVICES
 
-if [[ -f "$BUILD_FOLDER/flexflow_python" ]]; then
-    EXE="$BUILD_FOLDER"/flexflow_python
-else
-    EXE="flexflow_python"
-fi
-
-$EXE "$@"
-
+python "$@"
diff --git a/tests/python_interface_test.sh b/tests/python_interface_test.sh
index 6c452bd10f..4f83918a49 100755
--- a/tests/python_interface_test.sh
+++ b/tests/python_interface_test.sh
@@ -8,12 +8,19 @@ check_python_interface() {
 	BATCHSIZE=$((GPUS * 64))
 	FSIZE=14048
 	ZSIZE=12192
+	ONLY_DATA_PARALLEL=true
 	interpreter=${1:-python}
 	installation_status=${2:-"before-installation"}
+	
+	# Generate configs JSON files
+	test_params=$(jq -n --arg num_gpus "$GPUS" --arg memory_per_gpu "$FSIZE" --arg zero_copy_memory_per_node "$ZSIZE" --arg batch_size "$BATCHSIZE" --arg only_data_parallel "$ONLY_DATA_PARALLEL" '{"num_gpus":$num_gpus,"memory_per_gpu":$memory_per_gpu,"zero_copy_memory_per_node":$zero_copy_memory_per_node,"batch_size":$batch_size,"only_data_parallel":$only_data_parallel}')
+	mkdir -p /tmp/flexflow/multi_gpu_tests
+	echo "$test_params" > /tmp/flexflow/multi_gpu_tests/test_params.json
+	
 	if [[ "$interpreter" == "python" ]]; then
 		EXE="python"
 		echo "Running a single-GPU Python test to check the Python interface (native python interpreter)"
-		$EXE "$FF_HOME"/examples/python/keras/seq_mnist_mlp.py -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
+		$EXE "$FF_HOME"/examples/python/keras/seq_mnist_mlp.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
 	elif [[ "$interpreter" == "flexflow_python" ]]; then
 		if [[ "$installation_status" == "before-installation" ]]; then
 			EXE="$BUILD_FOLDER"/flexflow_python
@@ -21,7 +28,7 @@ check_python_interface() {
 			EXE="flexflow_python"
 		fi
 		echo "Running a single-GPU Python test to check the Python interface (flexflow_python interpreter)"
-		$EXE "$FF_HOME"/examples/python/keras/seq_mnist_mlp.py -ll:py 1 -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
+		$EXE "$FF_HOME"/examples/python/keras/seq_mnist_mlp.py -ll:gpu "$GPUS" -ll:fsize "$FSIZE" -ll:zsize "$ZSIZE" -b ${BATCHSIZE} --only-data-parallel
 	else
 		echo "Invalid Python interpreter"
 		exit 1
@@ -38,10 +45,10 @@ export BUILD_FOLDER
 installation_status=${1:-"before-installation"}
 echo "Running Python interface tests (installation status: ${installation_status})"
 if [[ "$installation_status" == "before-installation" ]]; then
-	# Import flexflow.core module in Python
+	# Check availability of flexflow modules in Python
 	export PYTHONPATH="${FF_HOME}/python:${BUILD_FOLDER}/deps/legion/bindings/python:${PYTHONPATH}"
 	export LD_LIBRARY_PATH="${BUILD_FOLDER}:${LD_LIBRARY_PATH}"
-	python -c "import flexflow.core; exit()"
+	python -c "import flexflow.core; import flexflow.serve as ff; exit()"
 	unset PYTHONPATH
 	unset LD_LIBRARY_PATH
 	# Run a single-gpu test using the flexflow_python interpreter
@@ -53,8 +60,8 @@ if [[ "$installation_status" == "before-installation" ]]; then
 	unset PYTHONPATH
 	unset LD_LIBRARY_PATH
 elif [[ "$installation_status" == "after-installation" ]]; then
-	# Import flexflow.core module in Python
-	python -c "import flexflow.core; exit()"
+	# Check availability of flexflow modules in Python
+	python -c "import flexflow.core; import flexflow.serve as ff; exit()"
 	# Run a single-gpu test using the flexflow_python interpreter
 	check_python_interface flexflow_python after-installation
 	# Run a single-gpu test using the native python interpreter

From 1d5b4c6ce89806bddb857cf7bcc1729fd5764d34 Mon Sep 17 00:00:00 2001
From: xinhaoc <99570243+xinhaoc@users.noreply.github.com>
Date: Wed, 6 Sep 2023 03:34:57 -0400
Subject: [PATCH 223/344] support MPT model  (#1093)

* init.

* layernorm add option not use bias

* add alibi kernel

* finish cpp interface.

* python interface

* fix tensor parallelism issue

* fix

* clean up

* fix

* hip

---------

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 include/flexflow/ffconst.h                    |   3 +-
 include/flexflow/flexflow_c.h                 |   7 +
 include/flexflow/model.h                      |   7 +
 .../ops/inc_multihead_self_attention.h        |   6 +-
 .../ops/inc_multihead_self_attention_params.h |   2 +-
 .../inc_multihead_self_attention_kernels.h    |   8 +
 include/flexflow/ops/layer_norm.h             |   5 +-
 include/flexflow/ops/layer_norm_params.h      |   1 +
 .../ops/spec_inc_multihead_self_attention.h   |   4 +-
 ...spec_inc_multihead_self_attention_params.h |   2 +-
 .../ops/tree_inc_multihead_self_attention.h   |   4 +-
 ...tree_inc_multihead_self_attention_params.h |   2 +-
 inference/incr_decoding/CMakeLists.txt        |   3 +-
 inference/incr_decoding/incr_decoding.cc      |  20 +-
 inference/models/mpt.cc                       | 215 +++++++++++++
 inference/models/mpt.h                        |  75 +++++
 inference/spec_infer/CMakeLists.txt           |   3 +-
 inference/spec_infer/spec_infer.cc            |  43 ++-
 python/flexflow/core/flexflow_cffi.py         |  49 ++-
 python/flexflow/serve/models/__init__.py      |   1 +
 python/flexflow/serve/models/mpt.py           | 290 ++++++++++++++++++
 python/flexflow/serve/serve.py                |   6 +-
 python/flexflow/type.py                       |   1 +
 src/c/flexflow_c.cc                           |  22 +-
 src/ops/fused.cpp                             |   8 +-
 src/ops/fused.cu                              |   8 +-
 src/ops/inc_multihead_self_attention.cc       |  27 +-
 src/ops/inc_multihead_self_attention.cpp      |  65 ++++
 src/ops/inc_multihead_self_attention.cu       |  64 +++-
 src/ops/layer_norm.cc                         | 156 ++++++----
 src/ops/layer_norm.cpp                        |   6 +-
 src/ops/layer_norm.cu                         |   6 +-
 src/ops/spec_inc_multihead_self_attention.cc  |  21 +-
 src/ops/spec_inc_multihead_self_attention.cpp |  15 +
 src/ops/spec_inc_multihead_self_attention.cu  |  16 +-
 src/ops/tree_inc_multihead_self_attention.cc  |  26 +-
 src/ops/tree_inc_multihead_self_attention.cpp |  16 +
 src/ops/tree_inc_multihead_self_attention.cu  |  16 +
 src/runtime/graph.cc                          |  15 +-
 src/runtime/model.cc                          |   3 +
 src/runtime/request_manager.cc                |   8 +-
 .../python_test_configs/generate_configs.py   |   3 +-
 42 files changed, 1134 insertions(+), 124 deletions(-)
 create mode 100644 inference/models/mpt.cc
 create mode 100644 inference/models/mpt.h
 create mode 100644 python/flexflow/serve/models/mpt.py

diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index 2f97d48997..78d98284a4 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -185,7 +185,8 @@ enum ModelType {
   LLAMA2 = 3003,
   OPT = 3004,
   FALCON = 3005,
-  STARCODER = 3006
+  STARCODER = 3006,
+  MPT = 3007
 };
 
 enum PMParameter {
diff --git a/include/flexflow/flexflow_c.h b/include/flexflow/flexflow_c.h
index 003533bb80..7977a083cc 100644
--- a/include/flexflow/flexflow_c.h
+++ b/include/flexflow/flexflow_c.h
@@ -256,6 +256,7 @@ flexflow_tensor_t flexflow_model_add_layer_norm(flexflow_model_t handle,
                                                 int *axes,
                                                 bool elementwise_affine,
                                                 float eps,
+                                                bool use_bias,
                                                 char const *name);
 
 flexflow_tensor_t
@@ -416,6 +417,7 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention(
     bool scaling_query,
     float scaling_factor,
     bool qk_prod_scaling,
+    bool position_bias,
     char const *name);
 
 flexflow_tensor_t flexflow_model_add_spec_inc_multihead_self_attention(
@@ -435,6 +437,7 @@ flexflow_tensor_t flexflow_model_add_spec_inc_multihead_self_attention(
     bool scaling_query,
     float scaling_factor,
     bool qk_prod_scaling,
+    bool position_bias,
     char const *name);
 
 flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention_verify(
@@ -454,6 +457,7 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention_verify(
     bool scaling_query,
     float scaling_factor,
     bool qk_prod_scaling,
+    bool position_bias,
     char const *name);
 
 flexflow_tensor_t flexflow_model_add_inc_multiquery_self_attention(
@@ -474,6 +478,7 @@ flexflow_tensor_t flexflow_model_add_inc_multiquery_self_attention(
     bool scaling_query,
     float scaling_factor,
     bool qk_prod_scaling,
+    bool position_bias,
     char const *name);
 
 flexflow_tensor_t flexflow_model_add_spec_inc_multiquery_self_attention(
@@ -494,6 +499,7 @@ flexflow_tensor_t flexflow_model_add_spec_inc_multiquery_self_attention(
     bool scaling_query,
     float scaling_factor,
     bool qk_prod_scaling,
+    bool position_bias,
     char const *name);
 
 flexflow_tensor_t flexflow_model_add_inc_multiquery_self_attention_verify(
@@ -514,6 +520,7 @@ flexflow_tensor_t flexflow_model_add_inc_multiquery_self_attention_verify(
     bool scaling_query,
     float scaling_factor,
     bool qk_prod_scaling,
+    bool position_bias,
     char const *name);
 
 flexflow_tensor_t flexflow_model_add_rms_norm(flexflow_model_t handle_,
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index bc3c7e6545..d4d829b019 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -525,6 +525,7 @@ class FFModel {
                     std::vector<int> const &axes,
                     bool elementwise_affine,
                     float eps,
+                    bool use_bias = true,
                     DataType data_type = DT_NONE,
                     char const *name = NULL);
   // Add a batch_norm layer
@@ -653,6 +654,7 @@ class FFModel {
                                       bool scaling_query = false,
                                       float scaling_factor = 1.0f,
                                       bool qk_prod_scaling = true,
+                                      bool position_bias = false,
                                       char const *name = NULL);
   Tensor
       spec_inc_multihead_self_attention(const Tensor input,
@@ -670,6 +672,7 @@ class FFModel {
                                         bool scaling_query = false,
                                         float scaling_factor = 1.0f,
                                         bool qk_prod_scaling = true,
+                                        bool position_bias = false,
                                         char const *name = NULL);
   Tensor inc_multihead_self_attention_verify(
       const Tensor input,
@@ -687,6 +690,7 @@ class FFModel {
       bool scaling_query = false,
       float scaling_factor = 1.0f,
       bool qk_prod_scaling = true,
+      bool position_bias = false,
       char const *name = NULL);
   Tensor inc_multiquery_self_attention(const Tensor input,
                                        int embed_dim,
@@ -704,6 +708,7 @@ class FFModel {
                                        bool scaling_query = false,
                                        float scaling_factor = 1.0f,
                                        bool qk_prod_scaling = true,
+                                       bool position_bias = false,
                                        char const *name = NULL);
   Tensor
       spec_inc_multiquery_self_attention(const Tensor input,
@@ -722,6 +727,7 @@ class FFModel {
                                          bool scaling_query = false,
                                          float scaling_factor = 1.0f,
                                          bool qk_prod_scaling = true,
+                                         bool position_bias = false,
                                          char const *name = NULL);
   Tensor inc_multiquery_self_attention_verify(
       const Tensor input,
@@ -740,6 +746,7 @@ class FFModel {
       bool scaling_query = false,
       float scaling_factor = 1.0f,
       bool qk_prod_scaling = true,
+      bool position_bias = false,
       char const *name = NULL);
   // ========================================
   // Inference APIs
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index e48a8d4240..010c3f6085 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -43,6 +43,7 @@ class IncMultiHeadSelfAttention : public Op {
                             bool _scaling_query,
                             float _scaling_factor,
                             bool _qk_prod_scaling,
+                            bool _position_bias,
                             bool allocate_weights,
                             DataType _quantization_type,
                             bool _offload,
@@ -64,6 +65,7 @@ class IncMultiHeadSelfAttention : public Op {
                             bool _scaling_query,
                             float _scaling_factor,
                             bool _qk_prod_scaling,
+                            bool _position_bias,
                             bool allocate_weights,
                             DataType _quantization_type,
                             bool _offload,
@@ -125,7 +127,7 @@ class IncMultiHeadSelfAttention : public Op {
   float dropout, scaling_factor;
   bool bias;
   bool add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
-      qk_prod_scaling;
+      qk_prod_scaling, position_bias;
   int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
   int qoSeqLength, kvSeqLength;
   DataType quantization_type;
@@ -155,6 +157,7 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
                                 bool _bias,
                                 bool _scaling_query,
                                 bool _qk_prod_scaling,
+                                bool _position_bias,
                                 bool _add_bias_kv,
                                 float _scaling_factor,
                                 GenericTensorAccessorR const &weight,
@@ -179,6 +182,7 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
   bool *bias;
   bool *scaling_query;
   bool *qk_prod_scaling;
+  bool *position_bias;
   float scaling_factor;
 #ifdef INFERENCE_TESTS
   float *kcache, *vcache;
diff --git a/include/flexflow/ops/inc_multihead_self_attention_params.h b/include/flexflow/ops/inc_multihead_self_attention_params.h
index be38b9ab1b..202ff70bc9 100644
--- a/include/flexflow/ops/inc_multihead_self_attention_params.h
+++ b/include/flexflow/ops/inc_multihead_self_attention_params.h
@@ -12,7 +12,7 @@ struct IncMultiHeadSelfAttentionParams {
       tensor_parallelism_degree;
   float dropout, scaling_factor;
   bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
-      qk_prod_scaling;
+      qk_prod_scaling, position_bias;
   DataType quantization_type;
   bool offload;
   bool is_valid(ParallelTensorShape const &) const;
diff --git a/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h b/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
index f578249045..4d2002d10b 100644
--- a/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
+++ b/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
@@ -11,6 +11,14 @@ namespace FlexFlow {
 namespace Kernels {
 namespace IncMultiHeadAttention {
 
+template <typename DT>
+__global__ void apply_position_bias_qkprd(DT *input_ptr,
+                                          int num_tokens,
+                                          int num_total_tokens,
+                                          int num_heads,
+                                          int global_num_q_heads,
+                                          int shard_id);
+
 template <typename DT>
 __global__ void apply_proj_bias_w(DT *input_ptr,
                                   DT const *bias_ptr,
diff --git a/include/flexflow/ops/layer_norm.h b/include/flexflow/ops/layer_norm.h
index a36e41a19f..8e0b4f61ff 100644
--- a/include/flexflow/ops/layer_norm.h
+++ b/include/flexflow/ops/layer_norm.h
@@ -21,6 +21,7 @@ class LayerNorm : public Op {
             const ParallelTensor _input,
             std::vector<int> const &axes,
             bool _elementwise_affine,
+            bool _use_bias,
             float _eps,
             bool allocate_weights,
             char const *name);
@@ -100,7 +101,7 @@ class LayerNorm : public Op {
                                       T *beta_grad_ptr);
 
 public:
-  bool elementwise_affine;
+  bool elementwise_affine, use_bias;
   int64_t effective_batch_size, effective_num_elements;
   float eps;
   std::vector<int> axes;
@@ -114,7 +115,7 @@ class LayerNormMeta : public OpMeta {
   ~LayerNormMeta(void);
 
 public:
-  bool elementwise_affine;
+  bool elementwise_affine, use_bias;
   int64_t effective_batch_size, effective_num_elements;
   float eps;
   void *mean_ptr, *rstd_ptr, *ds_ptr, *db_ptr, *scale_ptr, *bias_ptr;
diff --git a/include/flexflow/ops/layer_norm_params.h b/include/flexflow/ops/layer_norm_params.h
index 5d06428f4f..509593c285 100644
--- a/include/flexflow/ops/layer_norm_params.h
+++ b/include/flexflow/ops/layer_norm_params.h
@@ -9,6 +9,7 @@ struct LayerNormParams {
   std::vector<int> axes;
   bool elementwise_affine;
   float eps;
+  bool use_bias;
   bool is_valid(ParallelTensorShape const &) const;
 };
 
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention.h b/include/flexflow/ops/spec_inc_multihead_self_attention.h
index c6364805e3..fa9251c871 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention.h
@@ -40,6 +40,7 @@ class SpecIncMultiHeadSelfAttention : public Op {
                                 bool _scaling_query,
                                 float _scaling_factor,
                                 bool _qk_prod_scaling,
+                                bool _position_bias,
                                 bool allocate_weights,
                                 char const *name);
   SpecIncMultiHeadSelfAttention(FFModel &model,
@@ -58,6 +59,7 @@ class SpecIncMultiHeadSelfAttention : public Op {
                                 bool _scaling_query,
                                 float _scaling_factor,
                                 bool _qk_prod_scaling,
+                                bool _position_bias,
                                 bool allocate_weights,
                                 char const *name);
   SpecIncMultiHeadSelfAttention(FFModel &model,
@@ -120,7 +122,7 @@ class SpecIncMultiHeadSelfAttention : public Op {
   float dropout, scaling_factor;
   bool bias;
   bool add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
-      qk_prod_scaling;
+      qk_prod_scaling, position_bias;
   int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
   int qoSeqLength, kvSeqLength;
 };
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention_params.h b/include/flexflow/ops/spec_inc_multihead_self_attention_params.h
index d6f08dd9e6..b59a237e20 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention_params.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention_params.h
@@ -11,7 +11,7 @@ struct SpecIncMultiHeadSelfAttentionParams {
   int embed_dim, num_q_heads, num_kv_heads, kdim, vdim;
   float dropout, scaling_factor;
   bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
-      qk_prod_scaling;
+      qk_prod_scaling, position_bias;
 
   bool is_valid(ParallelTensorShape const &) const;
 };
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention.h b/include/flexflow/ops/tree_inc_multihead_self_attention.h
index d5be344cca..c4d7ae17e9 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention.h
@@ -40,6 +40,7 @@ class TreeIncMultiHeadSelfAttention : public Op {
                                 bool _scaling_query,
                                 float _scaling_factor,
                                 bool _qk_prod_scaling,
+                                bool _position_bias,
                                 bool allocate_weights,
                                 DataType _quantization_type,
                                 bool _offload,
@@ -61,6 +62,7 @@ class TreeIncMultiHeadSelfAttention : public Op {
                                 bool _scaling_query,
                                 float _scaling_factor,
                                 bool _qk_prod_scaling,
+                                bool _position_bias,
                                 bool allocate_weights,
                                 DataType _quantization_type,
                                 bool _offload,
@@ -123,7 +125,7 @@ class TreeIncMultiHeadSelfAttention : public Op {
   float dropout, scaling_factor;
   bool bias;
   bool add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
-      qk_prod_scaling;
+      qk_prod_scaling, position_bias;
   int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
   int qoSeqLength, kvSeqLength;
   DataType quantization_type;
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention_params.h b/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
index 3ba49dcbad..a897c76162 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
@@ -12,7 +12,7 @@ struct TreeIncMultiHeadSelfAttentionParams {
       tensor_parallelism_degree;
   float dropout, scaling_factor;
   bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
-      qk_prod_scaling;
+      qk_prod_scaling, position_bias;
   DataType quantization_type;
   bool offload;
   bool is_valid(ParallelTensorShape const &) const;
diff --git a/inference/incr_decoding/CMakeLists.txt b/inference/incr_decoding/CMakeLists.txt
index c3b97d094a..e415835a79 100644
--- a/inference/incr_decoding/CMakeLists.txt
+++ b/inference/incr_decoding/CMakeLists.txt
@@ -11,7 +11,8 @@ set(CPU_SRC
   ../models/llama.cc
   ../models/opt.cc
   ../models/falcon.cc
-  ../models/starcoder.cc)
+  ../models/starcoder.cc
+  ../models/mpt.cc)
 
 if (FF_GPU_BACKEND STREQUAL "cuda" OR FF_GPU_BACKEND STREQUAL "hip_cuda")
   cuda_add_executable(${project_target} ${CPU_SRC})
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index 10b4744195..19cd8726e2 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -17,6 +17,7 @@
 #include "flexflow/request_manager.h"
 #include "models/falcon.h"
 #include "models/llama.h"
+#include "models/mpt.h"
 #include "models/opt.h"
 #include "models/starcoder.h"
 #include <wordexp.h>
@@ -151,7 +152,6 @@ void FlexFlow::top_level_task(Task const *task,
                                   /*parser_callback_t */ nullptr,
                                   /*allow_exceptions */ true,
                                   /*ignore_comments */ true);
-
   ModelType model_type = ModelType::UNKNOWN;
   auto architectures = model_config["architectures"];
   for (auto const &str : architectures) {
@@ -174,10 +174,17 @@ void FlexFlow::top_level_task(Task const *task,
     } else if (str == "GPTBigCodeForCausalLM") {
       model_type = ModelType::STARCODER;
       break;
+    } else if (str == "MPTForCausalLM") {
+      model_type = ModelType::MPT;
+      break;
     }
   }
-  int bos_token_id = model_config["bos_token_id"];
-  int eos_token_id = model_config["eos_token_id"];
+  int bos_token_id = model_config.find("bos_token_id") == model_config.end()
+                         ? -1
+                         : (int)model_config.at("bos_token_id");
+  int eos_token_id = model_config.find("eos_token_id") == model_config.end()
+                         ? -1
+                         : (int)model_config.at("eos_token_id");
 
   assert(model_type != ModelType::UNKNOWN &&
          "Invalid LLM model type passed (or no type was passed).");
@@ -215,6 +222,13 @@ void FlexFlow::top_level_task(Task const *task,
                                       INC_DECODING_MODE,
                                       generationConfig,
                                       use_full_precision);
+  } else if (model_type == ModelType::MPT) {
+    MPT::create_mpt_model(model,
+                          config_filepath,
+                          weights_filepath,
+                          INC_DECODING_MODE,
+                          generationConfig,
+                          use_full_precision);
   } else {
     assert(false && "unknow model type");
   }
diff --git a/inference/models/mpt.cc b/inference/models/mpt.cc
new file mode 100644
index 0000000000..d1ca03a335
--- /dev/null
+++ b/inference/models/mpt.cc
@@ -0,0 +1,215 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "mpt.h"
+
+namespace FlexFlow {
+
+using namespace Legion;
+using json = nlohmann::json;
+
+void MPT::create_mpt_model(FFModel &ff,
+                           std::string const &model_config_file_path,
+                           std::string const &weight_file_path,
+                           InferenceMode mode,
+                           GenerationConfig generationConfig,
+                           bool use_full_precision) {
+  MPTConfig mpt_config(model_config_file_path);
+  mpt_config.print();
+
+  if (ff.config.tensor_parallelism_degree > mpt_config.n_heads ||
+      mpt_config.n_heads % ff.config.tensor_parallelism_degree != 0) {
+    assert(false && "The number of attention heads is smaller, or it is not "
+                    "divisible by the tensor parallelism degree");
+  }
+
+  std::unordered_map<std::string, Layer *> weights_layers;
+
+  //------------------------------ build the model --------------------------
+  Tensor input;
+  {
+    int const token_dims[] = {BatchConfig::MAX_NUM_TOKENS, 1};
+    input = ff.create_tensor<2>(token_dims, DT_INT32);
+  }
+
+  Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
+  std::vector<int> axes = {0};
+
+  Tensor hidden_states;
+  if (use_full_precision) {
+    hidden_states = ff.embedding(input,
+                                 mpt_config.vocab_size,
+                                 mpt_config.hidden_size,
+                                 AGGR_MODE_NONE,
+                                 DT_FLOAT,
+                                 NULL,
+                                 embed_init);
+  } else {
+    hidden_states = ff.embedding(input,
+                                 mpt_config.vocab_size,
+                                 mpt_config.hidden_size,
+                                 AGGR_MODE_NONE,
+                                 DT_HALF,
+                                 NULL,
+                                 embed_init);
+  }
+
+  Layer *embedding = ff.layers.back();
+  weights_layers.emplace("transformer_wte_weight", embedding);
+
+  for (int i = 0; i < mpt_config.n_layers; i++) {
+    ff.set_transformer_layer_id(i);
+
+    Tensor residual = hidden_states;
+
+    Tensor layernorm_output =
+        ff.layer_norm(hidden_states, axes, true, 1e-05, false);
+    Layer *norm_1 = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) + "_norm_1_weight",
+                           norm_1);
+
+    Tensor attn_outputs;
+    switch (mode) {
+      case BEAM_SEARCH_MODE: {
+        attn_outputs = ff.spec_inc_multihead_self_attention(
+            layernorm_output,
+            mpt_config.hidden_size,
+            mpt_config.n_heads,
+            mpt_config.hidden_size / mpt_config.n_heads,
+            mpt_config.hidden_size / mpt_config.n_heads,
+            0.0f,
+            false,
+            false,
+            false,
+            DT_NONE, /*data_type*/
+            NULL,
+            false,
+            /*scaling query*/ true,
+            /*scaling factor*/
+            pow((mpt_config.hidden_size / mpt_config.n_heads), -0.5),
+            /*qk_prod_scaling*/ false,
+            /*position_bias*/ true);
+        break;
+      }
+      case TREE_VERIFY_MODE: {
+        attn_outputs = ff.inc_multihead_self_attention_verify(
+            layernorm_output,
+            mpt_config.hidden_size,
+            mpt_config.n_heads,
+            mpt_config.hidden_size / mpt_config.n_heads,
+            mpt_config.hidden_size / mpt_config.n_heads,
+            0.0f,
+            false,
+            false,
+            false,
+            DT_NONE, /*data_type*/
+            NULL,
+            false,
+            /*scaling query*/ true,
+            /*scaling factor*/
+            pow((mpt_config.hidden_size / mpt_config.n_heads), -0.5),
+            /*qk_prod_scaling*/ false,
+            /*position_bias*/ true);
+        break;
+      }
+      case INC_DECODING_MODE: {
+        attn_outputs = ff.inc_multihead_self_attention(
+            layernorm_output,
+            mpt_config.hidden_size,
+            mpt_config.n_heads,
+            mpt_config.hidden_size / mpt_config.n_heads,
+            mpt_config.hidden_size / mpt_config.n_heads,
+            0.0f,
+            false,
+            false,
+            false,
+            DT_NONE, /*data_type*/
+            NULL,
+            false,
+            /*scaling query*/ true,
+            /*scaling factor*/
+            pow((mpt_config.hidden_size / mpt_config.n_heads), -0.5),
+            /*qk_prod_scaling*/ false,
+            /*position_bias*/ true);
+        break;
+      }
+      default: {
+        assert(false);
+      }
+    }
+
+    Layer *attention_layer = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) + "_attention_weight",
+                           attention_layer);
+
+    hidden_states = ff.add(attn_outputs, residual);
+    layernorm_output = ff.layer_norm(hidden_states, axes, true, 1e-05, false);
+    Layer *norm_2 = ff.layers.back();
+    weights_layers.emplace("layers_" + std::to_string(i) + "_norm_2_weight",
+                           norm_2);
+
+    residual = hidden_states;
+
+    // MLP
+    //  output = self.ffn(layernorm_output, residual)
+    layernorm_output = ff.dense(
+        layernorm_output, 4 * mpt_config.hidden_size, AC_MODE_NONE, false);
+    Layer *up_proj = ff.layers.back();
+    weights_layers.emplace(
+        "layers_" + std::to_string(i) + "_ffn_up_proj_weight", up_proj);
+    layernorm_output = ff.gelu(layernorm_output);
+    Tensor intermediate_output =
+        ff.dense(layernorm_output, mpt_config.hidden_size, AC_MODE_NONE, false);
+    Layer *down_proj = ff.layers.back();
+    weights_layers.emplace(
+        "layers_" + std::to_string(i) + "_ffn_down_proj_weight", down_proj);
+
+    hidden_states = ff.add(intermediate_output, residual);
+  }
+
+  // final
+  Tensor all_final_norm =
+      ff.layer_norm(hidden_states, axes, true, 1e-05, false);
+  Layer *norm_f = ff.layers.back();
+  weights_layers.emplace("transformer_norm_f_weight", norm_f);
+
+  Tensor lm_head =
+      ff.dense(all_final_norm, mpt_config.vocab_size, AC_MODE_NONE, false);
+  Layer *lm_head_layer = ff.layers.back();
+  weights_layers.emplace("lm_head_weight", lm_head_layer);
+
+  Tensor output;
+  if (mode == BEAM_SEARCH_MODE) {
+    Tensor softmax = ff.softmax(lm_head, -1);
+    output = ff.argmax(softmax, /*beam_Search*/ true);
+  } else {
+    output = ff.argmax(lm_head, /*beam_Search*/ false);
+  }
+
+  //------------------- compile the model --------------------------------
+  InferenceManager *im = InferenceManager::get_inference_manager();
+  im->compile_model_and_allocate_buffer(&ff);
+  FileDataLoader fileloader("",
+                            weight_file_path,
+                            mpt_config.n_heads,
+                            mpt_config.n_heads,
+                            mpt_config.hidden_size,
+                            mpt_config.hidden_size / mpt_config.n_heads,
+                            ff.config.tensor_parallelism_degree);
+  fileloader.load_weights(&ff, weights_layers, use_full_precision);
+  im->init_operators_inference(&ff);
+}
+
+}; // namespace FlexFlow
diff --git a/inference/models/mpt.h b/inference/models/mpt.h
new file mode 100644
index 0000000000..437e0cb247
--- /dev/null
+++ b/inference/models/mpt.h
@@ -0,0 +1,75 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+#pragma once
+
+#include "file_loader.h"
+#include "flexflow/batch_config.h"
+#include "flexflow/inference.h"
+#include "flexflow/request_manager.h"
+#include <nlohmann/json.hpp>
+#include <string>
+using json = nlohmann::json;
+
+namespace FlexFlow {
+
+class MPT {
+public:
+  struct MPTConfig {
+    MPTConfig(std::string const &model_config_file_path) {
+      std::ifstream config_file(model_config_file_path);
+      if (config_file.is_open()) {
+        try {
+          json model_config;
+          config_file >> model_config;
+          hidden_size = model_config["d_model"];
+          n_heads = model_config["n_heads"];
+          n_layers = model_config["n_layers"];
+          vocab_size = model_config["vocab_size"];
+        } catch (json::exception const &e) {
+          std::cerr << "Error parsing JSON file: " << e.what() << std::endl;
+          assert(false);
+        }
+      } else {
+        std::cerr << "Error opening JSON file " << model_config_file_path
+                  << std::endl;
+        assert(false);
+      }
+      max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
+      max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
+      max_beam_width = BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+      max_beam_depth = BeamSearchBatchConfig::MAX_BEAM_DEPTH;
+    }
+
+    void print() const {
+      std::cout << "MPT Config:" << std::endl;
+      std::cout << "\thidden_size: " << hidden_size << std::endl;
+      std::cout << "\tn_heads: " << n_heads << std::endl;
+      std::cout << "\tn_layers: " << n_layers << std::endl;
+      std::cout << "\tvocab_size: " << vocab_size << std::endl;
+    }
+
+    int max_seq_len, max_num_tokens, max_beam_width, max_beam_depth;
+    int hidden_size, n_heads, n_layers, vocab_size;
+  };
+
+  static void create_mpt_model(FFModel &ff,
+                               std::string const &model_config_file_path,
+                               std::string const &weight_file_path,
+                               InferenceMode mode,
+                               GenerationConfig generationConfig,
+                               bool use_full_precision = false);
+};
+
+}; // namespace FlexFlow
diff --git a/inference/spec_infer/CMakeLists.txt b/inference/spec_infer/CMakeLists.txt
index 3d6b48b802..26d5bd1894 100644
--- a/inference/spec_infer/CMakeLists.txt
+++ b/inference/spec_infer/CMakeLists.txt
@@ -10,7 +10,8 @@ set(CPU_SRC
   ../file_loader.cc
   ../models/llama.cc
   ../models/opt.cc
-  ../models/falcon.cc)
+  ../models/falcon.cc
+  ../models/mpt.cc)
 
 if (FF_GPU_BACKEND STREQUAL "cuda" OR FF_GPU_BACKEND STREQUAL "hip_cuda")
   cuda_add_executable(${project_target} ${CPU_SRC})
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 16eab8d077..9d139997f7 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -16,6 +16,7 @@
 #include "flexflow/inference.h"
 #include "models/falcon.h"
 #include "models/llama.h"
+#include "models/mpt.h"
 #include "models/opt.h"
 #include <filesystem>
 #include <nlohmann/json.hpp>
@@ -165,10 +166,19 @@ void get_model_meta(FilePaths &file_paths,
     } else if (str == "RWForCausalLM") {
       model_metadata.llm_model_type = ModelType::FALCON;
       break;
+    } else if (str == "MPTForCausalLM") {
+      model_metadata.llm_model_type = ModelType::MPT;
+      break;
     }
   }
-  model_metadata.bos_token_id = llm_model_config["bos_token_id"];
-  model_metadata.eos_token_id = llm_model_config["eos_token_id"];
+  model_metadata.bos_token_id =
+      llm_model_config.find("bos_token_id") == llm_model_config.end()
+          ? -1
+          : (int)llm_model_config.at("bos_token_id");
+  model_metadata.eos_token_id =
+      llm_model_config.find("eos_token_id") == llm_model_config.end()
+          ? -1
+          : (int)llm_model_config.at("eos_token_id");
 
   for (auto ssm_model_name : model_metadata.model_names.ssm_model_names) {
     std::string ssm_config_path = join_path({file_paths.cache_folder_path,
@@ -213,10 +223,21 @@ void get_model_meta(FilePaths &file_paths,
       } else if (str == "RWForCausalLM") {
         ssm_model_type = ModelType::FALCON;
         break;
+      } else if (str == "MPTForCausalLM") {
+        ssm_model_type = ModelType::MPT;
+        break;
       }
     }
-    if (ssm_model_config["bos_token_id"] != model_metadata.bos_token_id ||
-        ssm_model_config["eos_token_id"] != model_metadata.eos_token_id) {
+    int ssm_bos_id =
+        ssm_model_config.find("bos_token_id") == ssm_model_config.end()
+            ? -1
+            : (int)ssm_model_config.at("bos_token_id");
+    int ssm_eos_id =
+        ssm_model_config.find("eos_token_id") == ssm_model_config.end()
+            ? -1
+            : (int)ssm_model_config.at("eos_token_id");
+    if (ssm_bos_id != model_metadata.bos_token_id ||
+        ssm_eos_id != model_metadata.eos_token_id) {
       printf("Warning: bos/eos token id mismatch between LLM and one of the "
              "SSMs!\n");
     }
@@ -293,6 +314,13 @@ void FlexFlow::top_level_task(Task const *task,
                                 model_metadata.llm_weights_path,
                                 TREE_VERIFY_MODE,
                                 use_full_precision);
+  } else if (model_metadata.llm_model_type == ModelType::MPT) {
+    MPT::create_mpt_model(tree_model,
+                          model_metadata.llm_model_config_path,
+                          model_metadata.llm_weights_path,
+                          TREE_VERIFY_MODE,
+                          generationConfig,
+                          use_full_precision);
   } else {
     assert(false && "Invalid LLM model type passed (or no type was passed).");
   }
@@ -332,6 +360,13 @@ void FlexFlow::top_level_task(Task const *task,
           model_metadata.ssm_model_weights_paths[ssm_id],
           BEAM_SEARCH_MODE,
           use_full_precision);
+    } else if (model_metadata.ssm_model_types[ssm_id] == ModelType::MPT) {
+      MPT::create_mpt_model(beam_model,
+                            model_metadata.ssm_model_config_paths[ssm_id],
+                            model_metadata.ssm_model_weights_paths[ssm_id],
+                            BEAM_SEARCH_MODE,
+                            generationConfig,
+                            use_full_precision);
     } else {
       assert(false && "Invalid SSM model type passed.");
     }
diff --git a/python/flexflow/core/flexflow_cffi.py b/python/flexflow/core/flexflow_cffi.py
index 2d71dd18b3..5d9480280e 100644
--- a/python/flexflow/core/flexflow_cffi.py
+++ b/python/flexflow/core/flexflow_cffi.py
@@ -1567,10 +1567,10 @@ def batch_norm(self, input, relu=True, name=None):
     self.add_layer(OpType.BATCH_NORM, name)
     return Tensor(handle, owner_op_type=OpType.BATCH_NORM)
     
-  def layer_norm(self, input, axes, elementwise_affine=True, eps=1e-5, name=None):
+  def layer_norm(self, input, axes, elementwise_affine=True, eps=1e-5, use_bias = True, name=None):
     c_name = get_c_name(name)
     c_axes = ffi.new("int[]", axes)
-    handle = ffc().flexflow_model_add_layer_norm(self.handle, input.handle, len(axes), c_axes, elementwise_affine, eps, c_name)
+    handle = ffc().flexflow_model_add_layer_norm(self.handle, input.handle, len(axes), c_axes, elementwise_affine, eps, use_bias, c_name)
     self.add_layer(OpType.LAYER_NORM, name)
     return Tensor(handle, owner_op_type=OpType.LAYER_NORM)
 
@@ -1592,6 +1592,9 @@ def batch_matmul(self, A, B, a_seq_length_dim=None, b_seq_length_dim=None, name=
     :param name: the name of the layer. Default is None.
     :type name: string
 
+    :param name:  Whether to add use bias in layer normalization
+    :type name: bool
+
     :returns:  Tensor -- the output tensor.
     """
     if a_seq_length_dim is None:
@@ -2109,7 +2112,7 @@ def inc_multihead_self_attention(self, input,
                               bias=True, add_bias_kv=False, add_zero_attn=False, 
                               data_type=DataType.DT_NONE, kernel_initializer=None, 
                               apply_rotary_embedding=False, scaling_query=False, scaling_factor=1.0,
-                              qk_prod_scaling=True, name=None):
+                              qk_prod_scaling=True, position_bias=False, name=None):
     """Defines the MultiHead Attention operation as described in Attention Is All You Need 
     which takes in the tensors :attr:`input`, and uses it for all three of query, key and values. 
     In inference mode, the attention is computed using incremental decoding.
@@ -2158,6 +2161,9 @@ def inc_multihead_self_attention(self, input,
 
     :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
     :type qk_prod_scaling: bool
+
+    :param position_bias: Whether to add position bias to the QK product. Default is False.
+    :type position_bias: bool
              
     :param name: the name of the layer. Default is None.
     :type name: string
@@ -2167,7 +2173,7 @@ def inc_multihead_self_attention(self, input,
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
     c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc().flexflow_model_add_inc_multihead_self_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
+    handle = ffc().flexflow_model_add_inc_multihead_self_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, position_bias, c_name)
     self.add_layer(OpType.INC_MULTIHEAD_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.INC_MULTIHEAD_ATTENTION)
   
@@ -2177,7 +2183,7 @@ def spec_inc_multihead_self_attention(self, input,
                                    bias=True, add_bias_kv=False, add_zero_attn=False, 
                                    data_type=DataType.DT_NONE, kernel_initializer=None, 
                                    apply_rotary_embedding=False, scaling_query=False, scaling_factor=1.0,
-                                   qk_prod_scaling=True, name=None):
+                                   qk_prod_scaling=True, position_bias=False, name=None):
     """Defines the MultiHead Attention operation as described in Attention Is All You Need 
     which takes in the tensors :attr:`input`, and uses it for all three of query, key and values. 
     This operator only supports computing the attention in inference (beam search) mode.
@@ -2226,6 +2232,9 @@ def spec_inc_multihead_self_attention(self, input,
 
     :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
     :type qk_prod_scaling: bool
+
+    :param position_bias: Whether to add position bias to the QK product. Default is False.
+    :type position_bias: bool
              
     :param name: the name of the layer. Default is None.
     :type name: string
@@ -2235,7 +2244,7 @@ def spec_inc_multihead_self_attention(self, input,
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
     c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc().flexflow_model_add_spec_inc_multihead_self_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
+    handle = ffc().flexflow_model_add_spec_inc_multihead_self_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, position_bias, c_name)
     self.add_layer(OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION)
   
@@ -2245,7 +2254,7 @@ def inc_multihead_self_attention_verify(self, input,
                                           bias=True, add_bias_kv=False, add_zero_attn=False, 
                                           data_type=DataType.DT_NONE, kernel_initializer=None, 
                                           apply_rotary_embedding=False, scaling_query=False, scaling_factor=1.0,
-                                          qk_prod_scaling=True, name=None):
+                                          qk_prod_scaling=True, position_bias=False, name=None):
     """Defines the MultiHead Attention operation as described in Attention Is All You Need 
     which takes in the tensors :attr:`input`, and uses it for all three of query, key and values. 
     This operator only supports computing the attention in inference (tree verify) mode.
@@ -2294,6 +2303,9 @@ def inc_multihead_self_attention_verify(self, input,
 
     :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
     :type qk_prod_scaling: bool
+
+    :param position_bias: Whether to add position bias to the QK product. Default is False.
+    :type position_bias: bool
              
     :param name: the name of the layer. Default is None.
     :type name: string
@@ -2303,7 +2315,7 @@ def inc_multihead_self_attention_verify(self, input,
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
     c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc().flexflow_model_add_inc_multihead_self_attention_verify(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
+    handle = ffc().flexflow_model_add_inc_multihead_self_attention_verify(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, position_bias, c_name)
     self.add_layer(OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION)
   
@@ -2313,7 +2325,7 @@ def inc_multiquery_self_attention(self, input,
                               bias=True, add_bias_kv=False, add_zero_attn=False, 
                               data_type=DataType.DT_NONE, kernel_initializer=None, 
                               apply_rotary_embedding=False, scaling_query=False, scaling_factor=1.0,
-                              qk_prod_scaling=True, name=None):
+                              qk_prod_scaling=True, position_bias=False, name=None):
     """Defines the multi-query head attention, which allows a different number of Q and KV heads,
     and takes in the tensors :attr:`input`, and uses it for all three of query, key and values. 
     In inference mode, the attention is computed using incremental decoding.
@@ -2365,6 +2377,9 @@ def inc_multiquery_self_attention(self, input,
 
     :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
     :type qk_prod_scaling: bool
+
+    :param position_bias: Whether to add position bias to the QK product. Default is False.
+    :type position_bias: bool
              
     :param name: the name of the layer. Default is None.
     :type name: string
@@ -2374,7 +2389,7 @@ def inc_multiquery_self_attention(self, input,
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
     c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc().flexflow_model_add_inc_multiquery_self_attention(self.handle, input.handle, embed_dim, num_q_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
+    handle = ffc().flexflow_model_add_inc_multiquery_self_attention(self.handle, input.handle, embed_dim, num_q_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, position_bias, c_name)
     self.add_layer(OpType.INC_MULTIHEAD_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.INC_MULTIHEAD_ATTENTION)
   
@@ -2384,7 +2399,7 @@ def spec_inc_multiquery_self_attention(self, input,
                                    bias=True, add_bias_kv=False, add_zero_attn=False, 
                                    data_type=DataType.DT_NONE, kernel_initializer=None, 
                                    apply_rotary_embedding=False, scaling_query=False, scaling_factor=1.0,
-                                   qk_prod_scaling=True, name=None):
+                                   qk_prod_scaling=True, position_bias=False, name=None):
     """Defines the multi-query head attention, which allows a different number of Q and KV heads,
     and takes in the tensors :attr:`input`, and uses it for all three of query, key and values. 
     This operator only supports computing the attention in inference (beam search) mode.
@@ -2436,6 +2451,9 @@ def spec_inc_multiquery_self_attention(self, input,
 
     :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
     :type qk_prod_scaling: bool
+
+    :param position_bias: Whether to add position bias to the QK product. Default is False.
+    :type position_bias: bool
              
     :param name: the name of the layer. Default is None.
     :type name: string
@@ -2445,7 +2463,7 @@ def spec_inc_multiquery_self_attention(self, input,
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
     c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc().flexflow_model_add_spec_inc_multiquery_self_attention(self.handle, input.handle, embed_dim, num_q_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
+    handle = ffc().flexflow_model_add_spec_inc_multiquery_self_attention(self.handle, input.handle, embed_dim, num_q_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, position_bias, c_name)
     self.add_layer(OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION)
   
@@ -2455,7 +2473,7 @@ def inc_multiquery_self_attention_verify(self, input,
                                           bias=True, add_bias_kv=False, add_zero_attn=False, 
                                           data_type=DataType.DT_NONE, kernel_initializer=None, 
                                           apply_rotary_embedding=False, scaling_query=False, scaling_factor=1.0,
-                                          qk_prod_scaling=True, name=None):
+                                          qk_prod_scaling=True, position_bias=False, name=None):
     """Defines the multi-query head attention, which allows a different number of Q and KV heads,
     and takes in the tensors :attr:`input`, and uses it for all three of query, key and values. 
     This operator only supports computing the attention in inference (tree verify) mode.
@@ -2507,6 +2525,9 @@ def inc_multiquery_self_attention_verify(self, input,
 
     :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
     :type qk_prod_scaling: bool
+
+    :param position_bias: Whether to add position bias to the QK product. Default is False.
+    :type position_bias: bool
              
     :param name: the name of the layer. Default is None.
     :type name: string
@@ -2516,7 +2537,7 @@ def inc_multiquery_self_attention_verify(self, input,
     c_name = get_c_name(name)                 
     kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
     c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc().flexflow_model_add_inc_multiquery_self_attention_verify(self.handle, input.handle, embed_dim, num_q_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, c_name)
+    handle = ffc().flexflow_model_add_inc_multiquery_self_attention_verify(self.handle, input.handle, embed_dim, num_q_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, position_bias, c_name)
     self.add_layer(OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION, name)
     return Tensor(handle, owner_op_type=OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION)
   
diff --git a/python/flexflow/serve/models/__init__.py b/python/flexflow/serve/models/__init__.py
index 6b405b2f99..a1ca9152ce 100644
--- a/python/flexflow/serve/models/__init__.py
+++ b/python/flexflow/serve/models/__init__.py
@@ -16,3 +16,4 @@
 from .opt import FlexFlowOPT
 from .falcon import FlexFlowFalcon
 from .starcoder import FlexFlowSTARCODER
+from .mpt import FlexFlowMPT
diff --git a/python/flexflow/serve/models/mpt.py b/python/flexflow/serve/models/mpt.py
new file mode 100644
index 0000000000..a5a0c7da18
--- /dev/null
+++ b/python/flexflow/serve/models/mpt.py
@@ -0,0 +1,290 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+from flexflow.core import *
+from .base import FlexFlowModel
+import random, torch, shutil
+
+
+class MPTConfig:
+    def __init__(self, hf_config):
+        self.max_seq_len = 256
+        self.max_num_tokens = 64
+        self.max_beam_width = 1
+        self.max_beam_depth = 8
+        self.hidden_size = hf_config.d_model
+        self.n_heads = hf_config.n_heads
+        self.n_layers = hf_config.n_layers
+        self.vocab_size = hf_config.vocab_size
+        hf_config.num_attention_heads = hf_config.n_heads
+        hf_config.hidden_size = hf_config.d_model
+
+class FlexFlowMPT(FlexFlowModel):
+    def __init__(
+        self,
+        mode,
+        generation_config,
+        ffconfig,
+        hf_config,
+        data_type,
+        max_batch_size=1,
+        max_seq_length=256,
+        max_tokens_per_batch=64,
+        weights_filepath="",
+        tokenizer_filepath="",
+    ):
+        self.mode = mode
+        self.generation_config = generation_config
+        self.ffconfig = ffconfig
+        self.max_batch_size = max_batch_size
+        self.data_type = data_type
+        self.mpt_config = MPTConfig(hf_config)
+        self.mpt_config.max_seq_length = max_seq_length
+        self.mpt_config.max_num_tokens = max_tokens_per_batch
+        self.weights_filepath = weights_filepath
+        self.tokenizer_filepath = tokenizer_filepath
+        self.maxint = 2**31 - 1
+
+        # Sanity checks
+        if (
+            self.mpt_config.hidden_size
+            % self.mpt_config.n_heads
+            != 0
+        ):
+            raise ValueError(
+                f"Hidden size ({self.mpt_config.hidden_size}) is not divisible by n_head ({self.mpt_config.n_heads})"
+            )
+
+        # Sanity checks
+        if (
+            self.mpt_config.n_heads
+            < self.ffconfig.tensor_parallelism_degree
+            or self.mpt_config.n_heads
+            % self.ffconfig.tensor_parallelism_degree
+            != 0
+        ):
+            raise ValueError(
+                f"Number of attention heads ({self.mpt_config.n_heads}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
+            )
+        self.build_model()
+
+    def build_model(self):
+        ffmodel = FFModel(self.ffconfig)
+
+        tokens_dims = [self.mpt_config.max_num_tokens, 1]
+        input = ffmodel.create_tensor(tokens_dims, DataType.DT_INT32)
+
+        embed_init = UniformInitializer(random.randint(0, self.maxint), 0, 0)
+        hidden_states = ffmodel.embedding(
+            input,
+            self.mpt_config.vocab_size,
+            self.mpt_config.hidden_size,
+            AggrMode.AGGR_MODE_NONE,
+            self.data_type,
+            None,
+            embed_init,
+            name="transformer_wte_weight",
+        )
+
+        axes = [
+            0,
+        ]
+
+        for i in range(self.mpt_config.n_layers):
+            ffmodel.set_transformer_layer_id(i)
+            residual = hidden_states
+            layernorm_output = ffmodel.layer_norm(
+                hidden_states,
+                axes,
+                True,
+                1e-05,
+                False,
+                name=f"layers_{i}_norm_1_weight",
+            )
+
+            if self.mode == InferenceMode.BEAM_SEARCH_MODE:
+                attn_outputs = ffmodel.spec_inc_multihead_self_attention(
+                    layernorm_output,
+                    self.mpt_config.hidden_size,
+                    self.mpt_config.n_heads,
+                    self.mpt_config.hidden_size // self.mpt_config.n_heads,
+                    self.mpt_config.hidden_size // self.mpt_config.n_heads,
+                    0.0,  # dropout
+                    False,  # bias
+                    False,  # add_bias_kv
+                    False,  # add_zero_attn
+                    DataType.DT_NONE,  # data_type
+                    None,  # kernel initializer
+                    False,  # apply_rotary_embedding
+                    True,  # scaling_query
+                    (self.mpt_config.hidden_size / self.mpt_config.n_heads)
+                    ** (-0.5),  # scaling_factor
+                    False,  # qk_prod_scaling
+                    True, # qk_prod_scaling
+                    name=f"layers_{i}_attention_weight",
+                )
+            elif self.mode == InferenceMode.TREE_VERIFY_MODE:
+                attn_outputs = ffmodel.inc_multihead_self_attention_verify(
+                    layernorm_output,
+                    self.mpt_config.hidden_size,
+                    self.mpt_config.n_heads,
+                    self.mpt_config.hidden_size // self.mpt_config.n_heads,
+                    self.mpt_config.hidden_size // self.mpt_config.n_heads,
+                    0.0,  # dropout
+                    False,  # bias
+                    False,  # add_bias_kv
+                    False,  # add_zero_attn
+                    DataType.DT_NONE,  # data_type
+                    None,  # kernel initializer
+                    False,  # apply_rotary_embedding
+                    True,  # scaling_query
+                    (self.mpt_config.hidden_size / self.mpt_config.n_heads)
+                    ** (-0.5),  # scaling_factor
+                    False,  # qk_prod_scaling
+                    True, # qk_prod_scaling
+                    name=f"layers_{i}_attention_weight",
+                )
+            elif self.mode == InferenceMode.INC_DECODING_MODE:
+                attn_outputs = ffmodel.inc_multihead_self_attention(
+                    layernorm_output,
+                    self.mpt_config.hidden_size,
+                    self.mpt_config.n_heads,
+                    self.mpt_config.hidden_size // self.mpt_config.n_heads,
+                    self.mpt_config.hidden_size // self.mpt_config.n_heads,
+                    0.0,  # dropout
+                    False,  # bias
+                    False,  # add_bias_kv
+                    False,  # add_zero_attn
+                    DataType.DT_NONE,  # data_type
+                    None,  # kernel initializer
+                    False,  # apply_rotary_embedding
+                    True,  # scaling_query
+                    (self.mpt_config.hidden_size / self.mpt_config.n_heads)
+                    ** (-0.5),  # scaling_factor
+                    False,  # qk_prod_scaling
+                    True, # qk_prod_scaling
+                    name=f"layers_{i}_attention_weight",
+                )
+            else:
+                assert False
+
+            hidden_states = ffmodel.add(attn_outputs, residual)
+
+            layernorm_output = ffmodel.layer_norm(
+                hidden_states,
+                axes,
+                True,
+                1e-05,
+                False,
+                name=f"layers_{i}_norm_2_weight",
+            )
+            residual = hidden_states
+            # mlp
+
+            layernorm_output = ffmodel.dense(
+                layernorm_output,
+                4 * self.mpt_config.hidden_size,
+                ActiMode.AC_MODE_NONE,
+                False,
+                name=f"layers_{i}_ffn_up_proj_weight",
+            )
+            layernorm_output = ffmodel.gelu(layernorm_output)
+            intermediate_output = ffmodel.dense(
+                layernorm_output,
+                self.mpt_config.hidden_size,
+                ActiMode.AC_MODE_NONE,
+                False,
+                name=f"layers_{i}_ffn_down_proj_weight",
+            )
+            hidden_states = ffmodel.add(intermediate_output, residual)
+
+        all_final_norm = ffmodel.layer_norm(
+            hidden_states,
+            axes,
+            True,
+            1e-05,
+            False,
+            name=f"transformer_norm_f_weight",
+        )
+        lm_head = ffmodel.dense(
+            all_final_norm,
+            self.mpt_config.vocab_size,
+            ActiMode.AC_MODE_NONE,
+            False,
+            name="lm_head_weight",
+        )
+
+        if self.generation_config.do_sample:
+            dense = ffmodel.scalar_true_divide(
+                lm_head, self.generation_config.temperature, False
+            )
+            softmax = ffmodel.softmax(dense, -1)
+            output = ffmodel.sampling(softmax, self.generation_config.topp)
+        else:
+            output = ffmodel.argmax(lm_head, False)
+
+        self.ffmodel = ffmodel
+
+    def convert_hf_model(model, dst_folder):
+        os.makedirs(dst_folder, exist_ok=True)
+        for name, params in model.named_parameters():
+            name = name.replace("transformer.blocks.", "layers.").replace(".", "_")
+            if 'Wqkv' in name:
+                name_q = name.replace("attn_Wqkv", "attention_wq")
+                name_k = name.replace("attn_Wqkv", "attention_wk")
+                name_v = name.replace("attn_Wqkv", "attention_wv")
+                q, k, v = torch.split(
+                    params,
+                    [
+                        model.config.d_model,
+                        model.config.d_model,
+                        model.config.d_model,
+                    ],
+                    0,
+                )
+                q.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_q))
+                k.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_k))
+                v.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_v))
+            elif 'out_proj' in name:
+                name = name.replace("attn_out_proj", "attention_wo")
+                params.detach().cpu().numpy().tofile(os.path.join(dst_folder, name))
+            else:
+                params.detach().cpu().numpy().tofile(os.path.join(dst_folder, name))
+
+        shutil.copy(
+            os.path.join(dst_folder, "transformer_wte_weight"),
+            os.path.join(dst_folder, "lm_head_weight"),
+        )
+    def get_layers_with_weights(self):
+        layer_names = [
+            "transformer_wte_weight",
+            "transformer_norm_f_weight",
+            "lm_head_weight",
+        ] + [
+            expr
+            for i in range(self.mpt_config.n_layers)
+            for expr in (
+                f"layers_{i}_norm_1_weight",
+                f"layers_{i}_attention_weight",
+                f"layers_{i}_norm_2_weight",
+                f"layers_{i}_ffn_up_proj_weight",
+                f"layers_{i}_ffn_down_proj_weight",
+            )
+        ]
+        layers_with_weights = {
+            layer_name: self.ffmodel.get_layer_by_name(layer_name)
+            for layer_name in layer_names
+        }
+
+        return layers_with_weights
diff --git a/python/flexflow/serve/serve.py b/python/flexflow/serve/serve.py
index dea21389d1..58f7221082 100644
--- a/python/flexflow/serve/serve.py
+++ b/python/flexflow/serve/serve.py
@@ -17,6 +17,7 @@
     FlexFlowOPT,
     FlexFlowFalcon,
     FlexFlowSTARCODER,
+    FlexFlowMPT,
 )
 from flexflow.core import *
 from transformers import AutoConfig, AutoModelForCausalLM, AutoTokenizer, LlamaTokenizer
@@ -87,6 +88,7 @@ def __init__(
             "OPTForCausalLM": (ModelType.OPT, FlexFlowOPT),
             "RWForCausalLM": (ModelType.FALCON, FlexFlowFalcon),
             "GPTBigCodeForCausalLM": (ModelType.STARCODER, FlexFlowSTARCODER),
+            "MPTForCausalLM": (ModelType.MPT, FlexFlowMPT),
         }
         self.hf_config = AutoConfig.from_pretrained(model_name, trust_remote_code=True)
         self.model_name = self.hf_config._name_or_path
@@ -358,7 +360,9 @@ def compile(
 
         # Create request manager
         self.rm = RequestManager()
-        self.rm.register_tokenizer(self.model_type, self.hf_config.bos_token_id, self.hf_config.eos_token_id, self.tokenizer_path)
+        bos_token_id = -1 if self.hf_config.bos_token_id is None else self.hf_config.bos_token_id
+        eos_token_id = -1 if self.hf_config.eos_token_id is None else self.hf_config.eos_token_id
+        self.rm.register_tokenizer(self.model_type, bos_token_id, eos_token_id, self.tokenizer_path)
         self.rm.register_output_filepath(self.output_file)
 
         self.im.init_operators_inference(self.model.ffmodel)
diff --git a/python/flexflow/type.py b/python/flexflow/type.py
index 5232ddd431..d7cc145fde 100644
--- a/python/flexflow/type.py
+++ b/python/flexflow/type.py
@@ -79,6 +79,7 @@ class ModelType(Enum):
     OPT = 3004
     FALCON = 3005
     STARCODER = 3006
+    MPT = 3007
 
 
 class OpType(Enum):
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index 2ddb65fc9d..0c1fad17df 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -613,6 +613,7 @@ flexflow_tensor_t flexflow_model_add_layer_norm(flexflow_model_t handle_,
                                                 int *axes,
                                                 bool elementwise_affine,
                                                 float eps,
+                                                bool use_bias,
                                                 char const *name) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
   const Tensor input = FFCObjectWrapper::unwrap(input_);
@@ -620,8 +621,13 @@ flexflow_tensor_t flexflow_model_add_layer_norm(flexflow_model_t handle_,
   for (int i = 0; i < n; i++) {
     axes_vec.push_back(axes[i]);
   }
-  Tensor tensor = handle->layer_norm(
-      input, axes_vec, elementwise_affine, eps, input->data_type, name);
+  Tensor tensor = handle->layer_norm(input,
+                                     axes_vec,
+                                     elementwise_affine,
+                                     eps,
+                                     use_bias,
+                                     input->data_type,
+                                     name);
   DEBUG_PRINT("[LayerNorm] new Tensor %p, input %p, elementwise_affine %d, eps "
               "%f, name %s",
               tensor,
@@ -1071,6 +1077,7 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention(
     bool scaling_query,
     float scaling_factor,
     bool qk_prod_scaling,
+    bool position_bias,
     char const *name) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
   Tensor input = FFCObjectWrapper::unwrap(input_);
@@ -1091,6 +1098,7 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention(
                                                        scaling_query,
                                                        scaling_factor,
                                                        qk_prod_scaling,
+                                                       position_bias,
                                                        name);
   return FFCObjectWrapper::wrap(tensor);
 }
@@ -1112,6 +1120,7 @@ flexflow_tensor_t flexflow_model_add_spec_inc_multihead_self_attention(
     bool scaling_query,
     float scaling_factor,
     bool qk_prod_scaling,
+    bool position_bias,
     char const *name) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
   Tensor input = FFCObjectWrapper::unwrap(input_);
@@ -1133,6 +1142,7 @@ flexflow_tensor_t flexflow_model_add_spec_inc_multihead_self_attention(
                                                 scaling_query,
                                                 scaling_factor,
                                                 qk_prod_scaling,
+                                                position_bias,
                                                 name);
   return FFCObjectWrapper::wrap(tensor);
 }
@@ -1154,6 +1164,7 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention_verify(
     bool scaling_query,
     float scaling_factor,
     bool qk_prod_scaling,
+    bool position_bias,
     char const *name) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
   Tensor input = FFCObjectWrapper::unwrap(input_);
@@ -1175,6 +1186,7 @@ flexflow_tensor_t flexflow_model_add_inc_multihead_self_attention_verify(
                                                   scaling_query,
                                                   scaling_factor,
                                                   qk_prod_scaling,
+                                                  position_bias,
                                                   name);
   return FFCObjectWrapper::wrap(tensor);
 }
@@ -1197,6 +1209,7 @@ flexflow_tensor_t flexflow_model_add_inc_multiquery_self_attention(
     bool scaling_query,
     float scaling_factor,
     bool qk_prod_scaling,
+    bool position_bias,
     char const *name) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
   Tensor input = FFCObjectWrapper::unwrap(input_);
@@ -1218,6 +1231,7 @@ flexflow_tensor_t flexflow_model_add_inc_multiquery_self_attention(
                                                         scaling_query,
                                                         scaling_factor,
                                                         qk_prod_scaling,
+                                                        position_bias,
                                                         name);
   return FFCObjectWrapper::wrap(tensor);
 }
@@ -1240,6 +1254,7 @@ flexflow_tensor_t flexflow_model_add_spec_inc_multiquery_self_attention(
     bool scaling_query,
     float scaling_factor,
     bool qk_prod_scaling,
+    bool position_bias,
     char const *name) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
   Tensor input = FFCObjectWrapper::unwrap(input_);
@@ -1262,6 +1277,7 @@ flexflow_tensor_t flexflow_model_add_spec_inc_multiquery_self_attention(
                                                  scaling_query,
                                                  scaling_factor,
                                                  qk_prod_scaling,
+                                                 position_bias,
                                                  name);
   return FFCObjectWrapper::wrap(tensor);
 }
@@ -1284,6 +1300,7 @@ flexflow_tensor_t flexflow_model_add_inc_multiquery_self_attention_verify(
     bool scaling_query,
     float scaling_factor,
     bool qk_prod_scaling,
+    bool position_bias,
     char const *name) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
   Tensor input = FFCObjectWrapper::unwrap(input_);
@@ -1306,6 +1323,7 @@ flexflow_tensor_t flexflow_model_add_inc_multiquery_self_attention_verify(
                                                    scaling_query,
                                                    scaling_factor,
                                                    qk_prod_scaling,
+                                                   position_bias,
                                                    name);
   return FFCObjectWrapper::wrap(tensor);
 }
diff --git a/src/ops/fused.cpp b/src/ops/fused.cpp
index 99c5bc2631..9824e8469d 100644
--- a/src/ops/fused.cpp
+++ b/src/ops/fused.cpp
@@ -799,11 +799,15 @@ __host__ void
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
         LayerNormMeta const *m = (LayerNormMeta *)metas->meta[op];
-        assert(fused->op_num_weights[op] == 2 * (int)(m->elementwise_affine));
+        if (m->elementwise_affine) {
+          assert(fused->op_num_weights[op] == 1 + (int)(m->use_bias));
+        }
         GenericTensorAccessorR gamma, beta;
         if (m->elementwise_affine) {
           gamma = my_weight_accessor[0];
-          beta = my_weight_accessor[1];
+          if (m->use_bias) {
+            beta = my_weight_accessor[1];
+          }
         }
         LayerNorm::forward_kernel_wrapper(
             m, my_input_accessor[0], my_output_accessor[0], gamma, beta);
diff --git a/src/ops/fused.cu b/src/ops/fused.cu
index b834073064..5cecbd168e 100644
--- a/src/ops/fused.cu
+++ b/src/ops/fused.cu
@@ -893,11 +893,15 @@ __host__ void
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
         LayerNormMeta const *m = (LayerNormMeta *)metas->meta[op];
-        assert(fused->op_num_weights[op] == 2 * (int)(m->elementwise_affine));
+        if (m->elementwise_affine) {
+          assert(fused->op_num_weights[op] == 1 + (int)(m->use_bias));
+        }
         GenericTensorAccessorR gamma, beta;
         if (m->elementwise_affine) {
           gamma = my_weight_accessor[0];
-          beta = my_weight_accessor[1];
+          if (m->use_bias) {
+            beta = my_weight_accessor[1];
+          }
         }
         LayerNorm::forward_kernel_wrapper(
             m, my_input_accessor[0], my_output_accessor[0], gamma, beta);
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index ec8bc8839e..2c7518bae9 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -73,6 +73,7 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
                                              bool scaling_query,
                                              float scaling_factor,
                                              bool qk_prod_scaling,
+                                             bool position_bias,
                                              char const *name) {
   return inc_multiquery_self_attention(input,
                                        embed_dim,
@@ -90,6 +91,7 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
                                        scaling_query,
                                        scaling_factor,
                                        qk_prod_scaling,
+                                       position_bias,
                                        name);
 }
 
@@ -109,6 +111,7 @@ Tensor FFModel::inc_multiquery_self_attention(const Tensor input,
                                               bool scaling_query,
                                               float scaling_factor,
                                               bool qk_prod_scaling,
+                                              bool position_bias,
                                               char const *name) {
   if (data_type == DT_NONE) {
     data_type = input->data_type;
@@ -201,6 +204,7 @@ Tensor FFModel::inc_multiquery_self_attention(const Tensor input,
   li->add_int_property("scaling_query", scaling_query);
   li->add_float_property("scaling_factor", scaling_factor);
   li->add_int_property("qk_prod_scaling", qk_prod_scaling);
+  li->add_int_property("position_bias", position_bias);
   li->add_int_property("quantization_type", quantization_type);
   li->add_int_property("offload", offload);
   li->add_int_property("tensor_parallelism_degree",
@@ -241,6 +245,9 @@ Op *IncMultiHeadSelfAttention::create_operator_from_layer(
   layer->get_float_property("scaling_factor", scaling_factor);
   layer->get_int_property("qk_prod_scaling", value);
   bool qk_prod_scaling = (bool)value;
+  layer->get_int_property("position_bias", value);
+  bool position_bias = (bool)value;
+
   layer->get_int_property("quantization_type", value);
   DataType quantization_type = (DataType)value;
   layer->get_int_property("offload", value);
@@ -264,6 +271,7 @@ Op *IncMultiHeadSelfAttention::create_operator_from_layer(
                                        scaling_query,
                                        scaling_factor,
                                        qk_prod_scaling,
+                                       position_bias,
                                        false /*allocate_weights*/,
                                        quantization_type,
                                        offload,
@@ -288,6 +296,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     bool _scaling_query,
     float _scaling_factor,
     bool _qk_prod_scaling,
+    bool _position_bias,
     bool allocate_weights,
     DataType _quantization_type,
     bool _offload,
@@ -310,8 +319,9 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
       vProjSize(_vdim), oProjSize(_embed_dim),
       qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
       scaling_query(_scaling_query), scaling_factor(_scaling_factor),
-      qk_prod_scaling(_qk_prod_scaling), quantization_type(_quantization_type),
-      offload(_offload), tensor_parallelism_degree(_tensor_parallelism_degree) {
+      qk_prod_scaling(_qk_prod_scaling), position_bias(_position_bias),
+      quantization_type(_quantization_type), offload(_offload),
+      tensor_parallelism_degree(_tensor_parallelism_degree) {
   // overwrite layer_guid
   layer_guid = _layer_guid;
   numOutputs = 1;
@@ -398,6 +408,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     bool _scaling_query,
     float _scaling_factor,
     bool _qk_prod_scaling,
+    bool _position_bias,
     bool allocate_weights,
     DataType _quantization_type,
     bool _offload,
@@ -421,8 +432,9 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
       vProjSize(_vdim), oProjSize(_embed_dim),
       qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
       scaling_query(_scaling_query), scaling_factor(_scaling_factor),
-      qk_prod_scaling(_qk_prod_scaling), quantization_type(_quantization_type),
-      offload(_offload), tensor_parallelism_degree(_tensor_parallelism_degree)
+      qk_prod_scaling(_qk_prod_scaling), position_bias(_position_bias),
+      quantization_type(_quantization_type), offload(_offload),
+      tensor_parallelism_degree(_tensor_parallelism_degree)
 // bias_initializer(_bias_initializer)
 {
   numOutputs = 1;
@@ -515,6 +527,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
                                 other.scaling_query,
                                 other.scaling_factor,
                                 other.qk_prod_scaling,
+                                other.position_bias,
                                 allocate_weights,
                                 other.quantization_type,
                                 other.offload,
@@ -543,6 +556,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
                                 params.scaling_query,
                                 params.scaling_factor,
                                 params.qk_prod_scaling,
+                                params.position_bias,
                                 allocate_weights,
                                 params.quantization_type,
                                 params.offload,
@@ -1634,7 +1648,8 @@ bool operator==(IncMultiHeadSelfAttentionParams const &lhs,
          lhs.apply_rotary_embedding == rhs.apply_rotary_embedding &&
          lhs.scaling_query == rhs.scaling_query &&
          lhs.scaling_factor == rhs.scaling_factor &&
-         lhs.qk_prod_scaling == rhs.qk_prod_scaling;
+         lhs.qk_prod_scaling == rhs.qk_prod_scaling &&
+         lhs.position_bias == rhs.position_bias;
 }
 
 IncMultiHeadSelfAttentionParams IncMultiHeadSelfAttention::get_params() const {
@@ -1652,6 +1667,7 @@ IncMultiHeadSelfAttentionParams IncMultiHeadSelfAttention::get_params() const {
   params.scaling_query = this->scaling_query;
   params.scaling_factor = this->scaling_factor;
   params.qk_prod_scaling = this->qk_prod_scaling;
+  params.position_bias = this->position_bias,
   params.tensor_parallelism_degree = this->tensor_parallelism_degree,
   params.quantization_type = this->quantization_type;
   params.offload = this->offload;
@@ -1680,6 +1696,7 @@ size_t hash<FlexFlow::IncMultiHeadSelfAttentionParams>::operator()(
   hash_combine(key, params.scaling_query);
   hash_combine(key, params.scaling_factor);
   hash_combine(key, params.qk_prod_scaling);
+  hash_combine(key, params.position_bias);
   hash_combine(key, params.quantization_type);
   hash_combine(key, params.offload);
   hash_combine(key, params.tensor_parallelism_degree);
diff --git a/src/ops/inc_multihead_self_attention.cpp b/src/ops/inc_multihead_self_attention.cpp
index 75e68a7332..a08114fec9 100644
--- a/src/ops/inc_multihead_self_attention.cpp
+++ b/src/ops/inc_multihead_self_attention.cpp
@@ -30,6 +30,31 @@ using Legion::Memory;
 namespace Kernels {
 namespace IncMultiHeadAttention {
 
+// only used by MPT model. https://arxiv.org/abs/2108.12409
+template <typename DT>
+__global__ void apply_position_bias_qkprd(DT *input_ptr,
+                                          int num_tokens,
+                                          int num_total_tokens,
+                                          int num_heads,
+                                          int global_num_q_heads,
+                                          int shard_id) {
+  CUDA_KERNEL_LOOP(i, num_tokens * num_total_tokens * num_heads) {
+    // get head_idx,
+    int head_idx = i / (num_tokens * num_total_tokens) + (num_heads * shard_id);
+    int position_idx = (i / num_tokens) % num_total_tokens;
+    position_idx = position_idx + 1 - num_total_tokens;
+    // 8 is alibi_bias_max in
+    // https://huggingface.co/mosaicml/mpt-30b/blob/main/config.json
+    float base = (float)(head_idx + 1) * 8 / global_num_q_heads;
+    float slopes = 1.0 / pow(2, base);
+    // if(i == 0){
+    //   printf("see position: %d, %f, %f, %f\n", position_idx, base, slopes,
+    //   position_idx * slopes);
+    // }
+    input_ptr[i] += static_cast<DT>(position_idx * slopes);
+  }
+}
+
 template <typename DT>
 __global__ void apply_proj_bias_w(DT *input_ptr,
                                   DT const *bias_ptr,
@@ -104,6 +129,16 @@ __global__ void apply_proj_bias_qkv(DT *input_ptr,
     }
   }
 }
+template <typename DT>
+__global__ void scaling_query_kernel(DT *input_ptr,
+                                     int qProjSize,
+                                     int num_tokens,
+                                     int num_q_heads,
+                                     float scaling_factor) {
+  CUDA_KERNEL_LOOP(i, num_tokens * (qProjSize * num_q_heads)) {
+    input_ptr[i] *= scaling_factor;
+  }
+}
 
 template <typename DT>
 __global__ void
@@ -332,6 +367,17 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                        m->num_kv_heads,
                        *m->scaling_query,
                        m->scaling_factor);
+  } else if (m->scaling_query) {
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(scaling_query_kernel<DT>),
+                       GET_BLOCKS(parallelism),
+                       min(CUDA_NUM_THREADS, parallelism),
+                       0,
+                       stream,
+                       output_ptr,
+                       num_tokens,
+                       m->num_q_heads,
+                       m->qProjSize,
+                       m->scaling_factor);
   }
   if (*m->apply_rotary_embedding) {
     /*q&k*/
@@ -625,6 +671,21 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                         HIPBLAS_GEMM_DEFAULT));
       }
     }
+    // add alibi position bias to qk production
+    if (*m->position_bias) {
+      size_t parallelism = m->num_q_heads * total_tokens * num_new_tokens;
+      hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_position_bias_qkprd<DT>),
+                         GET_BLOCKS(parallelism),
+                         min((size_t)CUDA_NUM_THREADS, parallelism),
+                         0,
+                         stream,
+                         C,
+                         num_new_tokens,
+                         total_tokens,
+                         m->num_q_heads,
+                         m->global_num_q_heads,
+                         shard_id);
+    }
     // Fill all elements above diagonal in qk prods with -inf to force
     // causal attention.
     assert(num_new_tokens <= total_tokens);
@@ -903,6 +964,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
                                     attn->bias,
                                     attn->scaling_query,
                                     attn->qk_prod_scaling,
+                                    attn->position_bias,
                                     attn->add_bias_kv,
                                     attn->scaling_factor,
                                     weight,
@@ -930,6 +992,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     bool _bias,
     bool _scaling_query,
     bool _qk_prod_scaling,
+    bool _position_bias,
     bool _add_bias_kv,
     float _scaling_factor,
     GenericTensorAccessorR const &weight,
@@ -987,6 +1050,8 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   scaling_factor = _scaling_factor;
   qk_prod_scaling = (bool *)calloc(1, sizeof(bool));
   *qk_prod_scaling = _qk_prod_scaling;
+  position_bias = (bool *)calloc(1, sizeof(bool));
+  *position_bias = _position_bias;
   // Currently do not support adding bias to key/value projection
   assert(!_add_bias_kv);
 
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 37223e11c9..f0e6d9df1d 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -30,6 +30,31 @@ using Legion::Memory;
 namespace Kernels {
 namespace IncMultiHeadAttention {
 
+// only used by MPT model. https://arxiv.org/abs/2108.12409
+template <typename DT>
+__global__ void apply_position_bias_qkprd(DT *input_ptr,
+                                          int num_tokens,
+                                          int num_total_tokens,
+                                          int num_heads,
+                                          int global_num_q_heads,
+                                          int shard_id) {
+  CUDA_KERNEL_LOOP(i, num_tokens * num_total_tokens * num_heads) {
+    // get head_idx,
+    int head_idx = i / (num_tokens * num_total_tokens) + (num_heads * shard_id);
+    int position_idx = (i / num_tokens) % num_total_tokens;
+    position_idx = position_idx + 1 - num_total_tokens;
+    // 8 is alibi_bias_max in
+    // https://huggingface.co/mosaicml/mpt-30b/blob/main/config.json
+    float base = (float)(head_idx + 1) * 8 / global_num_q_heads;
+    float slopes = 1.0 / pow(2, base);
+    // if(i == 0){
+    //   printf("see position: %d, %f, %f, %f\n", position_idx, base, slopes,
+    //   position_idx * slopes);
+    // }
+    input_ptr[i] += static_cast<DT>(position_idx * slopes);
+  }
+}
+
 template <typename DT>
 __global__ void apply_proj_bias_w(DT *input_ptr,
                                   DT const *bias_ptr,
@@ -113,6 +138,17 @@ __global__ void apply_proj_bias_qkv(DT *input_ptr,
   }
 }
 
+template <typename DT>
+__global__ void scaling_query_kernel(DT *input_ptr,
+                                     int qProjSize,
+                                     int num_tokens,
+                                     int num_q_heads,
+                                     float scaling_factor) {
+  CUDA_KERNEL_LOOP(i, num_tokens * (qProjSize * num_q_heads)) {
+    input_ptr[i] *= scaling_factor;
+  }
+}
+
 template <typename DT>
 __global__ void
     apply_rotary_embedding_native(DT *input_ptr,
@@ -279,7 +315,6 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                            m->num_kv_heads,
                                        compute_type,
                                        CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-
   // apply rotary emmmbedding for q and k
   // step1 change the k, v to complex tensor
   int num_tokens = bc->num_active_tokens();
@@ -305,6 +340,15 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                     m->num_kv_heads,
                                     *m->scaling_query,
                                     m->scaling_factor);
+  } else if (m->scaling_query) {
+    scaling_query_kernel<<<GET_BLOCKS(parallelism),
+                           min(CUDA_NUM_THREADS, parallelism),
+                           0,
+                           stream>>>(output_ptr,
+                                     num_tokens,
+                                     m->num_q_heads,
+                                     m->qProjSize,
+                                     m->scaling_factor);
   }
   if (*m->apply_rotary_embedding) {
     /*q&k*/
@@ -630,6 +674,20 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                        CUBLAS_GEMM_DEFAULT_TENSOR_OP));
       }
     }
+    // add alibi position bias to qk production
+    if (*m->position_bias) {
+      size_t parallelism = m->num_q_heads * total_tokens * num_new_tokens;
+      apply_position_bias_qkprd<<<GET_BLOCKS(parallelism),
+                                  min((size_t)CUDA_NUM_THREADS, parallelism),
+                                  0,
+                                  stream>>>(C,
+                                            num_new_tokens,
+                                            total_tokens,
+                                            m->num_q_heads,
+                                            m->global_num_q_heads,
+                                            shard_id);
+    }
+
     // Fill all elements above diagonal in qk prods with -inf to force
     // causal attention.
     assert(num_new_tokens <= total_tokens);
@@ -906,6 +964,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
                                     attn->bias,
                                     attn->scaling_query,
                                     attn->qk_prod_scaling,
+                                    attn->position_bias,
                                     attn->add_bias_kv,
                                     attn->scaling_factor,
                                     weight,
@@ -933,6 +992,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     bool _bias,
     bool _scaling_query,
     bool _qk_prod_scaling,
+    bool _position_bias,
     bool _add_bias_kv,
     float _scaling_factor,
     GenericTensorAccessorR const &weight,
@@ -990,6 +1050,8 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   scaling_factor = _scaling_factor;
   qk_prod_scaling = (bool *)calloc(1, sizeof(bool));
   *qk_prod_scaling = _qk_prod_scaling;
+  position_bias = (bool *)calloc(1, sizeof(bool));
+  *position_bias = _position_bias;
   // Currently do not support adding bias to key/value projection
   assert(!_add_bias_kv);
 
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index 2dca38578f..09a5e40851 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -41,7 +41,8 @@ using Legion::TaskLauncher;
 
 bool operator==(LayerNormParams const &lhs, LayerNormParams const &rhs) {
   return lhs.layer_guid == rhs.layer_guid && lhs.axes == rhs.axes &&
-         lhs.elementwise_affine == rhs.elementwise_affine;
+         lhs.elementwise_affine == rhs.elementwise_affine &&
+         lhs.use_bias == rhs.use_bias;
 }
 
 bool LayerNormParams::is_valid(ParallelTensorShape const &input) const {
@@ -54,6 +55,7 @@ LayerNormParams LayerNorm::get_params() const {
   params.axes = this->axes;
   params.elementwise_affine = this->elementwise_affine;
   params.eps = this->eps;
+  params.use_bias = this->use_bias;
   return params;
 }
 
@@ -61,6 +63,7 @@ Tensor FFModel::layer_norm(const Tensor input,
                            std::vector<int> const &axes,
                            bool elementwise_affine,
                            float eps,
+                           bool use_bias,
                            DataType data_type,
                            char const *name) {
   // In PyTorch, axes must be the sizes of the last axes.size() dimensions of
@@ -97,7 +100,7 @@ Tensor FFModel::layer_norm(const Tensor input,
   if (data_type == DT_NONE) {
     data_type = input->data_type;
   }
-  int num_weights = elementwise_affine ? 2 : 0;
+  int num_weights = elementwise_affine ? (use_bias ? 2 : 1) : 0;
   Layer *ln = nullptr;
   if (data_type != input->data_type) {
     Tensor casted_input = cast(input, data_type, "type cast for layer_norm");
@@ -126,7 +129,7 @@ Tensor FFModel::layer_norm(const Tensor input,
                                                  ln,
                                                  0,
                                                  true /*create_grad*/);
-  if (num_weights == 2) {
+  if (num_weights > 0) {
     int numdims = axes.size();
     int dims[numdims];
     for (int i = 0; i < numdims; i++) {
@@ -139,15 +142,18 @@ Tensor FFModel::layer_norm(const Tensor input,
                                                    true /*create_grad*/,
                                                    nullptr,
                                                    CHOSEN_SYNC_TYPE);
-    ln->weights[1] = create_weight_legion_ordering(numdims,
-                                                   dims,
-                                                   input->data_type,
-                                                   ln,
-                                                   true /*create_grad*/,
-                                                   nullptr,
-                                                   CHOSEN_SYNC_TYPE);
+    if (num_weights == 2) {
+      ln->weights[1] = create_weight_legion_ordering(numdims,
+                                                     dims,
+                                                     input->data_type,
+                                                     ln,
+                                                     true /*create_grad*/,
+                                                     nullptr,
+                                                     CHOSEN_SYNC_TYPE);
+    }
   }
   ln->add_int_property("elementwise_affine", elementwise_affine);
+  ln->add_int_property("use_bias", use_bias);
   ln->add_int_vector_property("axes", axes);
   ln->add_float_property("eps", eps);
   layers.push_back(ln);
@@ -161,6 +167,8 @@ Op *LayerNorm::create_operator_from_layer(
   long long value;
   layer->get_int_property("elementwise_affine", value);
   bool elementwise_affine = (bool)value;
+  layer->get_int_property("use_bias", value);
+  bool use_bias = (bool)value;
   std::vector<int> axes;
   layer->get_int_vector_property("axes", axes);
   float eps;
@@ -170,6 +178,7 @@ Op *LayerNorm::create_operator_from_layer(
                        inputs[0],
                        axes,
                        elementwise_affine,
+                       use_bias,
                        eps,
                        false, // allocate_weights
                        layer->name);
@@ -185,6 +194,7 @@ LayerNorm::LayerNorm(FFModel &model,
                 input,
                 params.axes,
                 params.elementwise_affine,
+                params.use_bias,
                 params.eps,
                 allocate_weights,
                 name) {}
@@ -194,6 +204,7 @@ LayerNorm::LayerNorm(FFModel &model,
                      const ParallelTensor _input,
                      std::vector<int> const &_axes,
                      bool _elementwise_affine,
+                     bool _use_bias,
                      float _eps,
                      bool allocate_weights,
                      char const *name)
@@ -202,10 +213,11 @@ LayerNorm::LayerNorm(FFModel &model,
          _input->data_type,
          name,
          1 /*inputs*/,
-         _elementwise_affine ? 2 : 0 /*weights*/,
+         _elementwise_affine ? (_use_bias ? 2 : 1) : 0 /*weights*/,
          1 /*outputs*/,
          _input),
-      elementwise_affine(_elementwise_affine), eps(_eps), axes(_axes) {
+      elementwise_affine(_elementwise_affine), eps(_eps), axes(_axes),
+      use_bias(_use_bias) {
   // overwrite layer_guid
   layer_guid = _layer_guid;
   outputs[0] = model.create_parallel_tensor_legion_ordering(
@@ -224,7 +236,7 @@ LayerNorm::LayerNorm(FFModel &model,
   }
   effective_num_elements = M;
   effective_batch_size = (inputs[0]->get_volume() / num_replicas) / M;
-  assert(elementwise_affine == (numWeights == 2));
+  assert(use_bias == (numWeights == 2));
   if (numWeights > 0 && allocate_weights) {
     ParallelTensorShape beta_gamma_shape = _input->get_shape();
     for (int i = axes.size(); i < beta_gamma_shape.num_dims - 1; i++) {
@@ -291,12 +303,15 @@ void LayerNorm::init_inference(FFModel const &ff,
                                                       EXCLUSIVE,
                                                       weights[0]->region));
     launcher.add_field(2, FID_DATA);
-    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
-                                                      0 /*projection id*/,
-                                                      READ_ONLY,
-                                                      EXCLUSIVE,
-                                                      weights[1]->region));
-    launcher.add_field(3, FID_DATA);
+
+    if (use_bias) {
+      launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                        0 /*projection id*/,
+                                                        READ_ONLY,
+                                                        EXCLUSIVE,
+                                                        weights[1]->region));
+      launcher.add_field(3, FID_DATA);
+    }
   }
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
@@ -337,12 +352,14 @@ void LayerNorm::init(FFModel const &ff) {
                                                       EXCLUSIVE,
                                                       weights[0]->region));
     launcher.add_field(2, FID_DATA);
-    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
-                                                      0 /*projection id*/,
-                                                      READ_ONLY,
-                                                      EXCLUSIVE,
-                                                      weights[1]->region));
-    launcher.add_field(3, FID_DATA);
+    if (use_bias) {
+      launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                        0 /*projection id*/,
+                                                        READ_ONLY,
+                                                        EXCLUSIVE,
+                                                        weights[1]->region));
+      launcher.add_field(3, FID_DATA);
+    }
   }
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
@@ -397,12 +414,15 @@ void LayerNorm::forward(FFModel const &ff) {
                                                       READ_ONLY,
                                                       EXCLUSIVE,
                                                       weights[0]->region));
-    launcher.add_field(2, FID_DATA);
-    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
-                                                      0 /*projection id*/,
-                                                      READ_ONLY,
-                                                      EXCLUSIVE,
-                                                      weights[1]->region));
+    if (use_bias) {
+      launcher.add_field(2, FID_DATA);
+      launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                        0 /*projection id*/,
+                                                        READ_ONLY,
+                                                        EXCLUSIVE,
+                                                        weights[1]->region));
+    }
+
     launcher.add_field(3, FID_DATA);
   }
   runtime->execute_index_space(ctx, launcher);
@@ -449,12 +469,15 @@ FutureMap LayerNorm::inference(FFModel const &ff,
                                                       EXCLUSIVE,
                                                       weights[0]->region));
     launcher.add_field(2, FID_DATA);
-    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
-                                                      0 /*projection id*/,
-                                                      READ_ONLY,
-                                                      EXCLUSIVE,
-                                                      weights[1]->region));
-    launcher.add_field(3, FID_DATA);
+
+    if (use_bias) {
+      launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                        0 /*projection id*/,
+                                                        READ_ONLY,
+                                                        EXCLUSIVE,
+                                                        weights[1]->region));
+      launcher.add_field(3, FID_DATA);
+    }
   }
   return runtime->execute_index_space(ctx, launcher);
 }
@@ -492,20 +515,23 @@ void LayerNorm::forward_task(Task const *task,
   assert(in_domain.get_volume() ==
          m->effective_num_elements * m->effective_batch_size);
   if (m->elementwise_affine) {
-    assert(regions.size() == 4);
+    assert(m->use_bias == (regions.size() == 4));
     Domain gamma_domain = runtime->get_index_space_domain(
         ctx, task->regions[2].region.get_index_space());
-    // gamma_ptr = helperGetTensorPointerRW<float>(
-    //     regions[2], task->regions[2], FID_DATA, ctx, runtime);
     gamma = helperGetGenericTensorAccessorRO(
         m->input_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
-    Domain beta_domain = runtime->get_index_space_domain(
-        ctx, task->regions[3].region.get_index_space());
-    // beta_ptr = helperGetTensorPointerRW<float>(
-    //     regions[3], task->regions[3], FID_DATA, ctx, runtime);
-    beta = helperGetGenericTensorAccessorRO(
-        m->input_type[0], regions[3], task->regions[3], FID_DATA, ctx, runtime);
-    assert(gamma_domain == beta_domain);
+    if (m->use_bias) {
+      Domain beta_domain = runtime->get_index_space_domain(
+          ctx, task->regions[3].region.get_index_space());
+      beta = helperGetGenericTensorAccessorRO(m->input_type[0],
+                                              regions[3],
+                                              task->regions[3],
+                                              FID_DATA,
+                                              ctx,
+                                              runtime);
+      assert(gamma_domain == beta_domain);
+    }
+
     assert(gamma_domain.get_volume() == m->effective_num_elements);
     int numdims = gamma_domain.get_dim();
     size_t vol = 1;
@@ -573,12 +599,15 @@ void LayerNorm::backward(FFModel const &ff) {
                                                       weights[0]->region_grad));
     launcher.add_field(4, FID_DATA);
     // regions[5](I/O): beta_grad
-    launcher.add_region_requirement(RegionRequirement(weights[1]->part_grad,
-                                                      0 /*projection id*/,
-                                                      READ_WRITE,
-                                                      EXCLUSIVE,
-                                                      weights[1]->region_grad));
-    launcher.add_field(5, FID_DATA);
+    if (use_bias) {
+      launcher.add_region_requirement(
+          RegionRequirement(weights[1]->part_grad,
+                            0 /*projection id*/,
+                            READ_WRITE,
+                            EXCLUSIVE,
+                            weights[1]->region_grad));
+      launcher.add_field(5, FID_DATA);
+    }
   }
   runtime->execute_index_space(ctx, launcher);
 }
@@ -615,7 +644,7 @@ void LayerNorm::backward_task(Task const *task,
   assert(in_domain.get_volume() ==
          m->effective_num_elements * m->effective_batch_size);
   if (m->elementwise_affine) {
-    assert(regions.size() == 6);
+    assert(m->use_bias == (regions.size() == 6));
     Domain gamma_domain = runtime->get_index_space_domain(
         ctx, task->regions[3].region.get_index_space());
     gamma_ptr = helperGetTensorPointerRO<float>(
@@ -624,12 +653,16 @@ void LayerNorm::backward_task(Task const *task,
         ctx, task->regions[4].region.get_index_space());
     gamma_grad_ptr = helperGetTensorPointerRW<float>(
         regions[4], task->regions[4], FID_DATA, ctx, runtime);
-    Domain beta_grad_domain = runtime->get_index_space_domain(
-        ctx, task->regions[5].region.get_index_space());
-    beta_grad_ptr = helperGetTensorPointerRW<float>(
-        regions[5], task->regions[5], FID_DATA, ctx, runtime);
+    if (m->use_bias) {
+      Domain beta_grad_domain = runtime->get_index_space_domain(
+          ctx, task->regions[5].region.get_index_space());
+      beta_grad_ptr = helperGetTensorPointerRW<float>(
+          regions[5], task->regions[5], FID_DATA, ctx, runtime);
+      assert(gamma_domain == beta_grad_domain);
+    }
+
     assert(gamma_domain == gamma_grad_domain);
-    assert(gamma_domain == beta_grad_domain);
+
     assert(gamma_domain.get_volume() == m->effective_num_elements);
   } else {
     assert(regions.size() == 3);
@@ -752,6 +785,7 @@ void LayerNorm::serialize(Legion::Serializer &sez) const {
   }
   sez.serialize(this->elementwise_affine);
   sez.serialize(this->eps);
+  sez.serialize(this->use_bias);
 }
 
 using PCG::Node;
@@ -764,6 +798,7 @@ Node LayerNorm::deserialize(FFModel &ff,
   size_t num_axes;
   std::vector<int> axes;
   bool elementwise_affine;
+  bool use_bias;
   float eps;
   size_t id, transformer_layer_id;
   dez.deserialize(id);
@@ -777,12 +812,14 @@ Node LayerNorm::deserialize(FFModel &ff,
   }
   dez.deserialize(elementwise_affine);
   dez.deserialize(eps);
+  dez.deserialize(use_bias);
 
   LayerNormParams params;
   params.layer_guid = layer_guid;
   params.axes = axes;
   params.elementwise_affine = elementwise_affine;
   params.eps = eps;
+  params.use_bias = use_bias;
   return ff.get_or_create_node<LayerNorm>(inputs[0], params);
 }
 
@@ -805,6 +842,7 @@ size_t hash<FlexFlow::LayerNormParams>::operator()(
     hash_combine(key, n);
   }
   hash_combine(key, params.elementwise_affine);
+  hash_combine(key, params.use_bias);
   return key;
 }
 }; // namespace std
diff --git a/src/ops/layer_norm.cpp b/src/ops/layer_norm.cpp
index ddbf96a493..d97c2f62ff 100644
--- a/src/ops/layer_norm.cpp
+++ b/src/ops/layer_norm.cpp
@@ -31,6 +31,7 @@ LayerNormMeta::LayerNormMeta(FFHandler handle,
   elementwise_affine = ln->elementwise_affine;
   effective_batch_size = ln->effective_batch_size;
   effective_num_elements = ln->effective_num_elements;
+  use_bias = ln->use_bias;
   eps = ln->eps;
   checkCUDA(hipMalloc(&mean_ptr, sizeof(float) * effective_batch_size));
   checkCUDA(hipMalloc(&rstd_ptr, sizeof(float) * effective_batch_size));
@@ -171,14 +172,15 @@ void LayerNorm::forward_kernel_wrapper(LayerNormMeta const *m,
                                      input.get_float_ptr(),
                                      output.get_float_ptr(),
                                      gamma.get_float_ptr(),
-                                     beta.get_float_ptr(),
+                                     m->use_bias ? beta.get_float_ptr()
+                                                 : nullptr,
                                      stream);
   } else if (m->input_type[0] == DT_HALF) {
     LayerNorm::forward_kernel<half>(m,
                                     input.get_half_ptr(),
                                     output.get_half_ptr(),
                                     gamma.get_half_ptr(),
-                                    beta.get_half_ptr(),
+                                    m->use_bias ? beta.get_half_ptr() : nullptr,
                                     stream);
   } else {
     assert(false && "unsupport datatype in layernorm");
diff --git a/src/ops/layer_norm.cu b/src/ops/layer_norm.cu
index f594f8f7a8..97b5094a21 100644
--- a/src/ops/layer_norm.cu
+++ b/src/ops/layer_norm.cu
@@ -29,6 +29,7 @@ LayerNormMeta::LayerNormMeta(FFHandler handle,
                              MemoryAllocator &gpu_mem_allocator)
     : OpMeta(handle) {
   elementwise_affine = ln->elementwise_affine;
+  use_bias = ln->use_bias;
   effective_batch_size = ln->effective_batch_size;
   effective_num_elements = ln->effective_num_elements;
   profiling = ln->profiling;
@@ -186,14 +187,15 @@ void LayerNorm::forward_kernel_wrapper(LayerNormMeta const *m,
                                      input.get_float_ptr(),
                                      output.get_float_ptr(),
                                      gamma.get_float_ptr(),
-                                     beta.get_float_ptr(),
+                                     m->use_bias ? beta.get_float_ptr()
+                                                 : nullptr,
                                      stream);
   } else if (m->input_type[0] == DT_HALF) {
     LayerNorm::forward_kernel<half>(m,
                                     input.get_half_ptr(),
                                     output.get_half_ptr(),
                                     gamma.get_half_ptr(),
-                                    beta.get_half_ptr(),
+                                    m->use_bias ? beta.get_half_ptr() : nullptr,
                                     stream);
   } else {
     assert(false && "unsupport datatype in layernorm");
diff --git a/src/ops/spec_inc_multihead_self_attention.cc b/src/ops/spec_inc_multihead_self_attention.cc
index 9395c9aab4..01275c9875 100644
--- a/src/ops/spec_inc_multihead_self_attention.cc
+++ b/src/ops/spec_inc_multihead_self_attention.cc
@@ -72,6 +72,7 @@ Tensor
                                                bool scaling_query,
                                                float scaling_factor,
                                                bool qk_prod_scaling,
+                                               bool position_bias,
                                                char const *name) {
   return spec_inc_multiquery_self_attention(input,
                                             embed_dim,
@@ -89,6 +90,7 @@ Tensor
                                             scaling_query,
                                             scaling_factor,
                                             qk_prod_scaling,
+                                            position_bias,
                                             name);
 }
 
@@ -109,6 +111,7 @@ Tensor
                                                 bool scaling_query,
                                                 float scaling_factor,
                                                 bool qk_prod_scaling,
+                                                bool position_bias,
                                                 char const *name) {
   if (data_type == DT_NONE) {
     data_type = input->data_type;
@@ -191,6 +194,7 @@ Tensor
   li->add_int_property("scaling_query", scaling_query);
   li->add_float_property("scaling_factor", scaling_factor);
   li->add_int_property("qk_prod_scaling", qk_prod_scaling);
+  li->add_int_property("position_bias", position_bias);
   layers.push_back(li);
   return li->outputs[0];
 }
@@ -228,6 +232,9 @@ Op *SpecIncMultiHeadSelfAttention::create_operator_from_layer(
   layer->get_float_property("scaling_factor", scaling_factor);
   layer->get_int_property("qk_prod_scaling", value);
   bool qk_prod_scaling = (bool)value;
+  layer->get_int_property("position_bias", value);
+  bool position_bias = (bool)value;
+
   return new SpecIncMultiHeadSelfAttention(model,
                                            layer->layer_guid,
                                            inputs[0],
@@ -244,6 +251,7 @@ Op *SpecIncMultiHeadSelfAttention::create_operator_from_layer(
                                            scaling_query,
                                            scaling_factor,
                                            qk_prod_scaling,
+                                           position_bias,
                                            false /*allocate_weights*/,
                                            layer->name);
 }
@@ -265,6 +273,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     bool _scaling_query,
     float _scaling_factor,
     bool _qk_prod_scaling,
+    bool _position_bias,
     bool allocate_weights,
     char const *name)
     // Initializer* _bias_initializer)
@@ -284,7 +293,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
       vProjSize(_vdim), oProjSize(_embed_dim),
       qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
       scaling_query(_scaling_query), scaling_factor(_scaling_factor),
-      qk_prod_scaling(_qk_prod_scaling) {
+      qk_prod_scaling(_qk_prod_scaling), position_bias(_position_bias) {
   // overwrite layer_guid
   layer_guid = _layer_guid;
 
@@ -364,6 +373,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     bool _scaling_query,
     float _scaling_factor,
     bool _qk_prod_scaling,
+    bool _position_bias,
     bool allocate_weights,
     char const *name)
     // Initializer* _bias_initializer)
@@ -384,7 +394,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
       vProjSize(_vdim), oProjSize(_embed_dim),
       qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
       scaling_query(_scaling_query), scaling_factor(_scaling_factor),
-      qk_prod_scaling(_qk_prod_scaling)
+      qk_prod_scaling(_qk_prod_scaling), position_bias(_position_bias)
 // bias_initializer(_bias_initializer)
 {
   numOutputs = 1;
@@ -471,6 +481,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
                                     other.scaling_query,
                                     other.scaling_factor,
                                     other.qk_prod_scaling,
+                                    other.position_bias,
                                     allocate_weights,
                                     other.name) {}
 
@@ -496,6 +507,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
                                     params.scaling_query,
                                     params.scaling_factor,
                                     params.qk_prod_scaling,
+                                    params.position_bias,
                                     allocate_weights,
                                     name) {}
 
@@ -811,7 +823,8 @@ bool operator==(SpecIncMultiHeadSelfAttentionParams const &lhs,
          lhs.apply_rotary_embedding == rhs.apply_rotary_embedding &&
          lhs.scaling_query == rhs.scaling_query &&
          lhs.scaling_factor == rhs.scaling_factor &&
-         lhs.qk_prod_scaling == rhs.qk_prod_scaling;
+         lhs.qk_prod_scaling == rhs.qk_prod_scaling &&
+         lhs.position_bias == rhs.position_bias;
 }
 
 SpecIncMultiHeadSelfAttentionParams
@@ -831,6 +844,7 @@ SpecIncMultiHeadSelfAttentionParams
   params.scaling_query = this->scaling_query;
   params.scaling_factor = this->scaling_factor;
   params.qk_prod_scaling = this->qk_prod_scaling;
+  params.position_bias = this->position_bias;
 
   return params;
 }
@@ -855,6 +869,7 @@ size_t hash<FlexFlow::SpecIncMultiHeadSelfAttentionParams>::operator()(
   hash_combine(key, params.scaling_query);
   hash_combine(key, params.scaling_factor);
   hash_combine(key, params.qk_prod_scaling);
+  hash_combine(key, params.position_bias);
   return key;
 }
 }; // namespace std
diff --git a/src/ops/spec_inc_multihead_self_attention.cpp b/src/ops/spec_inc_multihead_self_attention.cpp
index e5e35a4c90..7e85a65e05 100644
--- a/src/ops/spec_inc_multihead_self_attention.cpp
+++ b/src/ops/spec_inc_multihead_self_attention.cpp
@@ -332,6 +332,20 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                                           HIPBLAS_GEMM_DEFAULT));
         }
       }
+      if (*m->position_bias) {
+        size_t parallelism = m->num_q_heads * total_tokens * num_new_tokens;
+        hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_position_bias_qkprd<DT>),
+                           GET_BLOCKS(parallelism),
+                           min((size_t)CUDA_NUM_THREADS, parallelism),
+                           0,
+                           stream,
+                           C,
+                           num_new_tokens,
+                           total_tokens,
+                           m->num_q_heads,
+                           m->global_num_q_heads,
+                           shard_id);
+      }
 
       // Fill all elements above diagonal in qk prods with -inf to force
       // causal attention.
@@ -660,6 +674,7 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
                                     attn->bias,
                                     attn->scaling_query,
                                     attn->qk_prod_scaling,
+                                    attn->position_bias,
                                     attn->add_bias_kv,
                                     attn->scaling_factor,
                                     weight,
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index d1faba9c68..af70a07e83 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -348,7 +348,20 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                                          CUBLAS_GEMM_DEFAULT_TENSOR_OP));
         }
       }
-
+      // add alibi position bias to qk production
+      // add alibi position bias to qk production
+    if (*m->position_bias) {
+      size_t parallelism = m->num_q_heads * total_tokens * num_new_tokens;
+      apply_position_bias_qkprd<<<GET_BLOCKS(parallelism),
+                                  min((size_t)CUDA_NUM_THREADS, parallelism),
+                                  0,
+                                  stream>>>(C,
+                                            num_new_tokens,
+                                            total_tokens,
+                                            m->num_q_heads,
+                                            m->global_num_q_heads,
+                                            shard_id);
+    }
       // Fill all elements above diagonal in qk prods with -inf to force
       // causal attention.
       assert(num_new_tokens <= total_tokens);
@@ -674,6 +687,7 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
                                     attn->bias,
                                     attn->scaling_query,
                                     attn->qk_prod_scaling,
+                                    attn->position_bias,
                                     attn->add_bias_kv,
                                     attn->scaling_factor,
                                     weight,
diff --git a/src/ops/tree_inc_multihead_self_attention.cc b/src/ops/tree_inc_multihead_self_attention.cc
index e26c306cf1..9597482ad2 100644
--- a/src/ops/tree_inc_multihead_self_attention.cc
+++ b/src/ops/tree_inc_multihead_self_attention.cc
@@ -74,6 +74,7 @@ Tensor FFModel::inc_multihead_self_attention_verify(
     bool scaling_query,
     float scaling_factor,
     bool qk_prod_scaling,
+    bool position_bias,
     char const *name) {
   return inc_multiquery_self_attention_verify(input,
                                               embed_dim,
@@ -91,6 +92,7 @@ Tensor FFModel::inc_multihead_self_attention_verify(
                                               scaling_query,
                                               scaling_factor,
                                               qk_prod_scaling,
+                                              position_bias,
                                               name);
 }
 
@@ -111,6 +113,7 @@ Tensor FFModel::inc_multiquery_self_attention_verify(
     bool scaling_query,
     float scaling_factor,
     bool qk_prod_scaling,
+    bool position_bias,
     char const *name) {
   if (data_type == DT_NONE) {
     data_type = input->data_type;
@@ -203,6 +206,7 @@ Tensor FFModel::inc_multiquery_self_attention_verify(
   li->add_int_property("scaling_query", scaling_query);
   li->add_float_property("scaling_factor", scaling_factor);
   li->add_int_property("qk_prod_scaling", qk_prod_scaling);
+  li->add_int_property("position_bias", position_bias);
   li->add_int_property("quantization_type", quantization_type);
   li->add_int_property("offload", offload);
   li->add_int_property("tensor_parallelism_degree",
@@ -242,6 +246,8 @@ Op *TreeIncMultiHeadSelfAttention::create_operator_from_layer(
   layer->get_float_property("scaling_factor", scaling_factor);
   layer->get_int_property("qk_prod_scaling", value);
   bool qk_prod_scaling = (bool)value;
+  layer->get_int_property("position_bias", value);
+  bool position_bias = (bool)value;
   layer->get_int_property("quantization_type", value);
   DataType quantization_type = (DataType)value;
   layer->get_int_property("offload", value);
@@ -264,6 +270,7 @@ Op *TreeIncMultiHeadSelfAttention::create_operator_from_layer(
                                            scaling_query,
                                            scaling_factor,
                                            qk_prod_scaling,
+                                           position_bias,
                                            false /*allocate_weights*/,
                                            quantization_type,
                                            offload,
@@ -288,6 +295,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     bool _scaling_query,
     float _scaling_factor,
     bool _qk_prod_scaling,
+    bool _position_bias,
     bool allocate_weights,
     DataType _quantization_type,
     bool _offload,
@@ -310,8 +318,9 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
       vProjSize(_vdim), oProjSize(_embed_dim),
       qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
       scaling_query(_scaling_query), scaling_factor(_scaling_factor),
-      qk_prod_scaling(_qk_prod_scaling), quantization_type(_quantization_type),
-      offload(_offload), tensor_parallelism_degree(_tensor_parallelism_degree) {
+      qk_prod_scaling(_qk_prod_scaling), position_bias(_position_bias),
+      quantization_type(_quantization_type), offload(_offload),
+      tensor_parallelism_degree(_tensor_parallelism_degree) {
   // overwrite layer_guid
   layer_guid = _layer_guid;
 
@@ -399,6 +408,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     bool _scaling_query,
     float _scaling_factor,
     bool _qk_prod_scaling,
+    bool _position_bias,
     bool allocate_weights,
     DataType _quantization_type,
     bool _offload,
@@ -422,8 +432,9 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
       vProjSize(_vdim), oProjSize(_embed_dim),
       qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
       scaling_query(_scaling_query), scaling_factor(_scaling_factor),
-      qk_prod_scaling(_qk_prod_scaling), quantization_type(_quantization_type),
-      offload(_offload), tensor_parallelism_degree(_tensor_parallelism_degree)
+      qk_prod_scaling(_qk_prod_scaling), position_bias(_position_bias),
+      quantization_type(_quantization_type), offload(_offload),
+      tensor_parallelism_degree(_tensor_parallelism_degree)
 // bias_initializer(_bias_initializer)
 {
   numOutputs = 1;
@@ -515,6 +526,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
                                     other.scaling_query,
                                     other.scaling_factor,
                                     other.qk_prod_scaling,
+                                    other.position_bias,
                                     allocate_weights,
                                     other.quantization_type,
                                     other.offload,
@@ -543,6 +555,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
                                     params.scaling_query,
                                     params.scaling_factor,
                                     params.qk_prod_scaling,
+                                    params.position_bias,
                                     allocate_weights,
                                     params.quantization_type,
                                     params.offload,
@@ -1656,7 +1669,8 @@ bool operator==(TreeIncMultiHeadSelfAttentionParams const &lhs,
          lhs.apply_rotary_embedding == rhs.apply_rotary_embedding &&
          lhs.scaling_query == rhs.scaling_query &&
          lhs.scaling_factor == rhs.scaling_factor &&
-         lhs.qk_prod_scaling == rhs.qk_prod_scaling;
+         lhs.qk_prod_scaling == rhs.qk_prod_scaling &&
+         lhs.position_bias == lhs.position_bias;
 }
 
 TreeIncMultiHeadSelfAttentionParams
@@ -1676,6 +1690,7 @@ TreeIncMultiHeadSelfAttentionParams
   params.scaling_query = this->scaling_query;
   params.scaling_factor = this->scaling_factor;
   params.qk_prod_scaling = this->qk_prod_scaling;
+  params.position_bias = this->position_bias;
   params.tensor_parallelism_degree = this->tensor_parallelism_degree;
   return params;
 }
@@ -1700,6 +1715,7 @@ size_t hash<FlexFlow::TreeIncMultiHeadSelfAttentionParams>::operator()(
   hash_combine(key, params.scaling_query);
   hash_combine(key, params.scaling_factor);
   hash_combine(key, params.qk_prod_scaling);
+  hash_combine(key, params.position_bias);
   hash_combine(key, params.quantization_type);
   hash_combine(key, params.offload);
   hash_combine(key, params.tensor_parallelism_degree);
diff --git a/src/ops/tree_inc_multihead_self_attention.cpp b/src/ops/tree_inc_multihead_self_attention.cpp
index b3a56f650a..1a9d1b6968 100644
--- a/src/ops/tree_inc_multihead_self_attention.cpp
+++ b/src/ops/tree_inc_multihead_self_attention.cpp
@@ -322,6 +322,21 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                                           HIPBLAS_GEMM_DEFAULT));
         }
       }
+      if (*m->position_bias) {
+        size_t parallelism =
+            m->num_q_heads * total_tokens_in_request * num_new_tokens;
+        hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_position_bias_qkprd<DT>),
+                           GET_BLOCKS(parallelism),
+                           min((size_t)CUDA_NUM_THREADS, parallelism),
+                           0,
+                           stream,
+                           C,
+                           num_new_tokens,
+                           total_tokens_in_request,
+                           m->num_q_heads,
+                           m->global_num_q_heads,
+                           shard_id);
+      }
 
       // Fill all elements above diagonal in qk prods with -inf to force
       // causal attention.
@@ -680,6 +695,7 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
                                     attn->bias,
                                     attn->scaling_query,
                                     attn->qk_prod_scaling,
+                                    attn->position_bias,
                                     attn->add_bias_kv,
                                     attn->scaling_factor,
                                     weight,
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index 69f085d3eb..f916bdb925 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -318,6 +318,21 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                                          CUBLAS_GEMM_DEFAULT_TENSOR_OP));
         }
       }
+      // add alibi position bias to qk production
+      // add alibi position bias to qk production
+      if (*m->position_bias) {
+        size_t parallelism =
+            m->num_q_heads * total_tokens_in_request * num_new_tokens;
+        apply_position_bias_qkprd<<<GET_BLOCKS(parallelism),
+                                    min((size_t)CUDA_NUM_THREADS, parallelism),
+                                    0,
+                                    stream>>>(C,
+                                              num_new_tokens,
+                                              total_tokens_in_request,
+                                              m->num_q_heads,
+                                              m->global_num_q_heads,
+                                              shard_id);
+      }
 
       // Fill all elements above diagonal in qk prods with -inf to force
       // causal attention.
@@ -677,6 +692,7 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
                                     attn->bias,
                                     attn->scaling_query,
                                     attn->qk_prod_scaling,
+                                    attn->position_bias,
                                     attn->add_bias_kv,
                                     attn->scaling_factor,
                                     weight,
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index f348ca9016..0e957f0702 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -2323,6 +2323,7 @@ GraphOptimalViewSerialized
         sez.serialize(attn->scaling_query);
         sez.serialize(attn->scaling_factor);
         sez.serialize(attn->qk_prod_scaling);
+        sez.serialize(attn->position_bias);
         sez.serialize(attn->quantization_type);
         sez.serialize(attn->offload);
         sez.serialize(attn->num_kv_heads);
@@ -2346,6 +2347,7 @@ GraphOptimalViewSerialized
         sez.serialize(attn->scaling_query);
         sez.serialize(attn->scaling_factor);
         sez.serialize(attn->qk_prod_scaling);
+        sez.serialize(attn->position_bias);
         sez.serialize(attn->num_kv_heads);
         break;
       }
@@ -2366,6 +2368,7 @@ GraphOptimalViewSerialized
         sez.serialize(attn->scaling_query);
         sez.serialize(attn->scaling_factor);
         sez.serialize(attn->qk_prod_scaling);
+        sez.serialize(attn->position_bias);
         sez.serialize(attn->quantization_type);
         sez.serialize(attn->offload);
         sez.serialize(attn->num_kv_heads);
@@ -2740,7 +2743,7 @@ void FFModel::deserialize_graph_optimal_view(
             tensor_parallelism_degree;
         float dropout, scaling_factor;
         bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
-            scaling_query, qk_prod_scaling, offload;
+            scaling_query, qk_prod_scaling, offload, position_bias;
         DataType quantization_type;
         size_t id, transformer_layer_id;
         dez.deserialize(id);
@@ -2758,6 +2761,7 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(scaling_query);
         dez.deserialize(scaling_factor);
         dez.deserialize(qk_prod_scaling);
+        dez.deserialize(position_bias);
         dez.deserialize(quantization_type);
         dez.deserialize(offload);
         dez.deserialize(num_kv_heads);
@@ -2777,6 +2781,7 @@ void FFModel::deserialize_graph_optimal_view(
         params.scaling_query = scaling_query;
         params.scaling_factor = scaling_factor;
         params.qk_prod_scaling = qk_prod_scaling;
+        params.position_bias = position_bias;
         params.quantization_type = quantization_type;
         params.offload = offload;
         params.num_kv_heads = num_kv_heads;
@@ -2789,7 +2794,7 @@ void FFModel::deserialize_graph_optimal_view(
         int embed_dim, num_q_heads, k_dim, v_dim, num_kv_heads;
         float dropout, scaling_factor;
         bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
-            scaling_query, qk_prod_scaling;
+            scaling_query, qk_prod_scaling, position_bias;
         size_t id, transformer_layer_id;
         dez.deserialize(id);
         dez.deserialize(transformer_layer_id);
@@ -2806,6 +2811,7 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(scaling_query);
         dez.deserialize(scaling_factor);
         dez.deserialize(qk_prod_scaling);
+        dez.deserialize(position_bias);
         dez.deserialize(num_kv_heads);
 
         SpecIncMultiHeadSelfAttentionParams params;
@@ -2822,6 +2828,7 @@ void FFModel::deserialize_graph_optimal_view(
         params.scaling_query = scaling_query;
         params.scaling_factor = scaling_factor;
         params.qk_prod_scaling = qk_prod_scaling;
+        params.position_bias = position_bias;
         params.num_kv_heads = num_kv_heads;
         node = get_or_create_node<SpecIncMultiHeadSelfAttention>(inputs[0],
                                                                  params);
@@ -2833,7 +2840,7 @@ void FFModel::deserialize_graph_optimal_view(
             tensor_parallelism_degree;
         float dropout, scaling_factor;
         bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
-            scaling_query, qk_prod_scaling, offload;
+            scaling_query, qk_prod_scaling, offload, position_bias;
         DataType quantization_type;
         size_t id, transformer_layer_id;
         dez.deserialize(id);
@@ -2851,6 +2858,7 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(scaling_query);
         dez.deserialize(scaling_factor);
         dez.deserialize(qk_prod_scaling);
+        dez.deserialize(position_bias);
         dez.deserialize(quantization_type);
         dez.deserialize(offload);
         dez.deserialize(num_kv_heads);
@@ -2870,6 +2878,7 @@ void FFModel::deserialize_graph_optimal_view(
         params.scaling_query = scaling_query;
         params.scaling_factor = scaling_factor;
         params.qk_prod_scaling = qk_prod_scaling;
+        params.position_bias = position_bias;
         params.quantization_type = quantization_type;
         params.offload = offload;
         params.num_kv_heads = num_kv_heads;
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 43b5df1f39..8c72cc51d1 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -3237,6 +3237,9 @@ void FFModel::create_operators_from_layers() {
                 (l->op_type == OP_LINEAR && layer_idx >= 2 &&
                  layers[layer_idx - 1]->op_type == OP_RELU &&
                  layers[layer_idx - 2]->op_type == OP_LINEAR) ||
+                (l->op_type == OP_LINEAR && layer_idx >= 2 &&
+                 layers[layer_idx - 1]->op_type == OP_GELU &&
+                 layers[layer_idx - 2]->op_type == OP_LINEAR) ||
                 (l->op_type == OP_LINEAR && layer_idx >= 5 &&
                  layers[layer_idx - 1]->op_type == OP_EW_MUL &&
                  layers[layer_idx - 2]->op_type == OP_EW_MUL &&
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index d75b0fbe0b..d915a0e4aa 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -103,7 +103,8 @@ void RequestManager::register_tokenizer(ModelType type,
     this->tokenizer_ =
         Tokenizer::FromBlobByteLevelBPE(vocab, merges, added_tokens);
   } else if (model_type == ModelType::FALCON ||
-             model_type == ModelType::STARCODER) {
+             model_type == ModelType::STARCODER ||
+             model_type == ModelType::MPT) {
     std::string falcon_tokenizer_path = join_path({path, "tokenizer.json"});
     this->tokenizer_ =
         Tokenizer::FromBlobJSON(LoadBytesFromFile(falcon_tokenizer_path));
@@ -201,8 +202,9 @@ RequestManager::RequestGuid
   request.status = Request::PENDING;
   request.guid = next_available_guid++;
   request.max_sequence_length = max_sequence_length;
-  request.tokens.push_back(bos_token_id);
-
+  if (bos_token_id >= 0) {
+    request.tokens.push_back(bos_token_id);
+  }
   std::vector<int32_t> tokens = this->tokenizer_->Encode(prompt);
   if (tokens.size() > BatchConfig::MAX_PROMPT_LENGTH) {
     std::cout << "Warning: too many tokens in prompt, only load up to "
diff --git a/tests/inference/python_test_configs/generate_configs.py b/tests/inference/python_test_configs/generate_configs.py
index 9c4c37b2e7..e780bc17b0 100644
--- a/tests/inference/python_test_configs/generate_configs.py
+++ b/tests/inference/python_test_configs/generate_configs.py
@@ -49,6 +49,7 @@
 llama_models = ["decapoda-research/llama-7b-hf", "JackFram/llama-160m"]
 opt_models = ["facebook/opt-6.7b", "facebook/opt-125m"]
 falcon_models = ["tiiuae/falcon-7b",]
+mpt_models = ["mosaicml/mpt-7b", ]
 # starcoder_models = ["bigcode/starcoderbase-7b",]
 parallelism_settings = [(1,4), (2,2), (4,1)]
 
@@ -63,7 +64,7 @@
 
 
 # Generate incremental decoding configs
-all_models = llama_models + opt_models + falcon_models
+all_models = llama_models + opt_models + falcon_models + mpt_models
 for model_name in all_models:
     for full_precision in (True, False):
         for parallelism_degrees in parallelism_settings:

From 4adad7d21da363c0fefb724a642e17c2a00925f8 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 6 Sep 2023 11:45:58 -0400
Subject: [PATCH 224/344] Update docker-build.yml

---
 .github/workflows/docker-build.yml | 1 +
 1 file changed, 1 insertion(+)

diff --git a/.github/workflows/docker-build.yml b/.github/workflows/docker-build.yml
index 2234ec60aa..899de4664e 100644
--- a/.github/workflows/docker-build.yml
+++ b/.github/workflows/docker-build.yml
@@ -63,6 +63,7 @@ jobs:
       cuda_version: ${{ matrix.gpu_backend_version }}
       hip_version: ${{ matrix.gpu_backend_version }}
       branch_name: ${{ github.head_ref || github.ref_name }}
+    timeout-minutes: 480
     steps:
       - name: Checkout Git Repository
         uses: actions/checkout@v3

From 8f04bea0ca3abe521548b0e70695323284483f29 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 11 Sep 2023 11:10:52 -0400
Subject: [PATCH 225/344] bug fix

---
 python/flexflow/serve/__init__.py | 28 +++++++++++++++-------------
 1 file changed, 15 insertions(+), 13 deletions(-)

diff --git a/python/flexflow/serve/__init__.py b/python/flexflow/serve/__init__.py
index a8d0a0294c..7531c006a8 100644
--- a/python/flexflow/serve/__init__.py
+++ b/python/flexflow/serve/__init__.py
@@ -138,19 +138,21 @@ def init(
             raise TypeError("configs_dict is not a dictionary")
     else:
         # Add named key-value arguments into dictionary
-        configs_dict["num_gpus"] = num_gpus
-        configs_dict["memory_per_gpu"] = memory_per_gpu
-        configs_dict["zero_copy_memory_per_node"] = zero_copy_memory_per_node
-        configs_dict["legion_utility_processors"] = legion_utility_processors
-        configs_dict["data_parallelism_degree"] = data_parallelism_degree
-        configs_dict["tensor_parallelism_degree"] = tensor_parallelism_degree
-        configs_dict["pipeline_parallelism_degree"] = pipeline_parallelism_degree
-        configs_dict["offload"] = offload
-        configs_dict["offload_reserve_space_size"] = offload_reserve_space_size
-        configs_dict["use_4bit_quantization"] = use_4bit_quantization
-        configs_dict["use_8bit_quantization"] = use_8bit_quantization
-        configs_dict["profiling"] = profiling
-        configs_dict["fusion"] = fusion
+        configs_dict = {
+            "num_gpus": num_gpus,
+            "memory_per_gpu": memory_per_gpu,
+            "zero_copy_memory_per_node": zero_copy_memory_per_node,
+            "legion_utility_processors": legion_utility_processors,
+            "data_parallelism_degree": data_parallelism_degree,
+            "tensor_parallelism_degree": tensor_parallelism_degree,
+            "pipeline_parallelism_degree": pipeline_parallelism_degree,
+            "offload": offload,
+            "offload_reserve_space_size": offload_reserve_space_size,
+            "use_4bit_quantization": use_4bit_quantization,
+            "use_8bit_quantization": use_8bit_quantization,
+            "profiling": profiling,
+            "fusion": fusion
+        }
 
     # Check that mandatory configs are present
     required_keys = ["num_gpus", "memory_per_gpu", "zero_copy_memory_per_node"]

From c7cc6b4b906788126b5b833c1acad20454888520 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 17 Sep 2023 19:09:37 -0400
Subject: [PATCH 226/344] Fix Falcon model, inference test in CI (#1138)

* .

* gpu torch in docker

* fix

* add falcon to ci

* re-enabled opt tests, linting
---
 docker/flexflow-environment/Dockerfile        |  2 +-
 inference/python/spec_infer.py                |  2 +-
 src/ops/spec_inc_multihead_self_attention.cu  | 24 +++++-----
 src/runtime/request_manager.cc                |  2 +-
 tests/inference/cpp_inference_tests.sh        | 46 +++++++++++--------
 tests/inference/huggingface_inference.py      | 16 ++++---
 tests/inference/python_inference_tests.sh     | 22 +++++----
 .../python_test_configs/generate_configs.py   |  4 +-
 tests/inference_tests.sh                      |  2 +-
 9 files changed, 67 insertions(+), 53 deletions(-)

diff --git a/docker/flexflow-environment/Dockerfile b/docker/flexflow-environment/Dockerfile
index 774c585b44..a12f31c738 100644
--- a/docker/flexflow-environment/Dockerfile
+++ b/docker/flexflow-environment/Dockerfile
@@ -77,7 +77,7 @@ ENV CUDA_DIR /usr/local/cuda
 # Install python packages and other dependencies
 RUN conda install -c conda-forge cmake make pillow cmake-build-extension pybind11 numpy pandas keras-preprocessing
 # Install CPU-only Pytorch and related dependencies
-RUN conda install pytorch torchvision torchaudio cpuonly -c pytorch
+RUN conda install pytorch torchvision torchaudio -c pytorch
 RUN conda install -c conda-forge onnx transformers>=4.31.0 sentencepiece einops
 RUN pip3 install tensorflow notebook
 
diff --git a/inference/python/spec_infer.py b/inference/python/spec_infer.py
index 192960b533..7dc6635819 100644
--- a/inference/python/spec_infer.py
+++ b/inference/python/spec_infer.py
@@ -67,7 +67,7 @@ def get_configs():
             "ssms": [
                 {
                     # required ssm parameter
-                    "ssm_model": "JackFram/llama-160m",
+                    "ssm_model": "JackFram/llama-160m-base",
                     # optional ssm parameters
                     "cache_path": "",
                     "refresh_cache": False,
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index af70a07e83..47e9941e1d 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -350,18 +350,18 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       }
       // add alibi position bias to qk production
       // add alibi position bias to qk production
-    if (*m->position_bias) {
-      size_t parallelism = m->num_q_heads * total_tokens * num_new_tokens;
-      apply_position_bias_qkprd<<<GET_BLOCKS(parallelism),
-                                  min((size_t)CUDA_NUM_THREADS, parallelism),
-                                  0,
-                                  stream>>>(C,
-                                            num_new_tokens,
-                                            total_tokens,
-                                            m->num_q_heads,
-                                            m->global_num_q_heads,
-                                            shard_id);
-    }
+      if (*m->position_bias) {
+        size_t parallelism = m->num_q_heads * total_tokens * num_new_tokens;
+        apply_position_bias_qkprd<<<GET_BLOCKS(parallelism),
+                                    min((size_t)CUDA_NUM_THREADS, parallelism),
+                                    0,
+                                    stream>>>(C,
+                                              num_new_tokens,
+                                              total_tokens,
+                                              m->num_q_heads,
+                                              m->global_num_q_heads,
+                                              shard_id);
+      }
       // Fill all elements above diagonal in qk prods with -inf to force
       // causal attention.
       assert(num_new_tokens <= total_tokens);
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index d915a0e4aa..5eb3192e25 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -202,7 +202,7 @@ RequestManager::RequestGuid
   request.status = Request::PENDING;
   request.guid = next_available_guid++;
   request.max_sequence_length = max_sequence_length;
-  if (bos_token_id >= 0) {
+  if (bos_token_id >= 0 && model_type != ModelType::FALCON) {
     request.tokens.push_back(bos_token_id);
   }
   std::vector<int32_t> tokens = this->tokenizer_->Encode(prompt);
diff --git a/tests/inference/cpp_inference_tests.sh b/tests/inference/cpp_inference_tests.sh
index 6a108303d6..8c8de22364 100755
--- a/tests/inference/cpp_inference_tests.sh
+++ b/tests/inference/cpp_inference_tests.sh
@@ -10,9 +10,9 @@ cd "${BASH_SOURCE[0]%/*}"
 ###############################################################################################
 
 # LLAMA
-../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model decapoda-research/llama-7b-hf -ssm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama.txt -pipeline-parallelism-degree 4
+../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model decapoda-research/llama-7b-hf -ssm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama.txt -pipeline-parallelism-degree 4
 # LLAMA (half precision)
-../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model decapoda-research/llama-7b-hf -ssm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_half.txt -pipeline-parallelism-degree 4
+../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model decapoda-research/llama-7b-hf -ssm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_half.txt -pipeline-parallelism-degree 4
 
 # OPT
 ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-6.7b -ssm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt.txt -pipeline-parallelism-degree 4
@@ -22,9 +22,9 @@ cd "${BASH_SOURCE[0]%/*}"
 # Tensor parallelism tests
 if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
     # LLAMA
-    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model decapoda-research/llama-7b-hf -ssm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model decapoda-research/llama-7b-hf -ssm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     # LLAMA (half precision)
-    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model decapoda-research/llama-7b-hf -ssm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model decapoda-research/llama-7b-hf -ssm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     
     # OPT
     ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-6.7b -ssm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
@@ -37,9 +37,9 @@ fi
 ###############################################################################################
 
 # LLAMA (small model)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M.txt -pipeline-parallelism-degree 4
 # LLAMA (small model, half precision)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half.txt -pipeline-parallelism-degree 4
 
 # LLAMA (big model)
 ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model decapoda-research/llama-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_7B.txt -pipeline-parallelism-degree 4
@@ -69,11 +69,11 @@ fi
 # Tensor parallelism tests
 if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
     # LLAMA (small model)
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
     # LLAMA (small model, half precision)
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
 
     # LLAMA (big model)
     ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model decapoda-research/llama-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_7B_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
@@ -216,28 +216,32 @@ fi
 ######################### Alignment tests with HuggingFace ####################################
 
 # LLAMA (small model, full precision)
-python3 ./huggingface_inference.py --model-name "JackFram/llama-160m" --tokenizer-model-name "JackFram/llama-160m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M.txt" --gpu
+python3 ./huggingface_inference.py --model-name "JackFram/llama-160m-base" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M.txt" --gpu
 
 # LLAMA (small model, half precision)
-python3 ./huggingface_inference.py --model-name "JackFram/llama-160m" --tokenizer-model-name "JackFram/llama-160m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M_half.txt" --gpu
+python3 ./huggingface_inference.py --model-name "JackFram/llama-160m-base" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M_half.txt" --gpu
 
 # LLAMA (big model, full precision)
-python3 ./huggingface_inference.py --model-name "decapoda-research/llama-7b-hf" --tokenizer-model-name "JackFram/llama-160m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B.txt"
+python3 ./huggingface_inference.py --model-name "decapoda-research/llama-7b-hf" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B.txt"
 
 # LLAMA (big model, half precision)
-python3 ./huggingface_inference.py --model-name "decapoda-research/llama-7b-hf" --tokenizer-model-name "JackFram/llama-160m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B_half.txt" --gpu
+python3 ./huggingface_inference.py --model-name "decapoda-research/llama-7b-hf" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B_half.txt" --gpu
 
 # OPT (small model, full precision)
-python3 ./huggingface_inference.py --model-name "facebook/opt-125m" --tokenizer-model-name "facebook/opt-125m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_125M.txt" --gpu --max-length 128
+python3 ./huggingface_inference.py --model-name "facebook/opt-125m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_125M.txt" --gpu --max-length 128
 
 # OPT (small model, half precision)
-python3 ./huggingface_inference.py --model-name "facebook/opt-125m" --tokenizer-model-name "facebook/opt-125m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_125M_half.txt" --gpu --max-length 128
+python3 ./huggingface_inference.py --model-name "facebook/opt-125m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_125M_half.txt" --gpu --max-length 128
 
 # OPT (big model, full precision)
-#python3 ./huggingface_inference.py --model-name "facebook/opt-6.7b" --tokenizer-model-name "facebook/opt-6.7b" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_6B.txt" --max-length 127
+python3 ./huggingface_inference.py --model-name "facebook/opt-6.7b" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_6B.txt" --max-length 128
 
 # OPT (big model, half precision)
-#python3 ./huggingface_inference.py --model-name "facebook/opt-6.7b" --tokenizer-model-name "facebook/opt-6.7b" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_6B_half.txt" --gpu --max-length 127
+# python3 ./huggingface_inference.py --model-name "facebook/opt-6.7b" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_6B_half.txt" --gpu --max-length 128
+
+# Falcon (full precision)
+python3 ./huggingface_inference.py --model-name "tiiuae/falcon-7b" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_falcon_7B.txt" --max-length 128
+
 
 diff <(tail -n +2 "../../inference/output/huggingface_llama_160M.txt") <(tail -n +5 "../../inference/output/incr_decoding_llama_160M.txt")
 diff <(tail -n +2 "../../inference/output/huggingface_llama_160M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_decoding_llama_160M_half.txt" | tr -s '[:space:]' '\n' | head -n 20)
@@ -246,5 +250,7 @@ diff <(tail -n +2 "../../inference/output/huggingface_llama_7B_half.txt" | tr -s
 
 diff <(tail -n +2 "../../inference/output/huggingface_opt_125M.txt") <(tail -n +5 "../../inference/output/incr_decoding_opt_125M.txt")
 diff <(tail -n +2 "../../inference/output/huggingface_opt_125M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_decoding_opt_125M_half.txt" | tr -s '[:space:]' '\n' | head -n 20)
-#diff <(tail -n +2 "../../inference/output/huggingface_opt_6B.txt") <(tail -n +5 "../../inference/output/incr_decoding_opt_6B.txt")
-#diff <(tail -n +2 "../../inference/output/huggingface_opt_6B_half.txt") <(tail -n +5 "../../inference/output/incr_decoding_opt_6B_half.txt")
+diff <(tail -n +2 "../../inference/output/huggingface_opt_6B.txt") <(tail -n +5 "../../inference/output/incr_decoding_opt_6B.txt")
+# diff <(tail -n +2 "../../inference/output/huggingface_opt_6B_half.txt") <(tail -n +5 "../../inference/output/incr_decoding_opt_6B_half.txt")
+diff <(tail -n +2 "../../inference/output/huggingface_falcon_7B.txt") <(tail -n +5 "../../inference/output/incr_decoding_falcon_7B.txt")
+
diff --git a/tests/inference/huggingface_inference.py b/tests/inference/huggingface_inference.py
index 788d001dd8..072e8f2bdb 100644
--- a/tests/inference/huggingface_inference.py
+++ b/tests/inference/huggingface_inference.py
@@ -1,7 +1,7 @@
 import argparse
 import json
 import os
-from transformers import AutoModelForCausalLM, AutoTokenizer, LlamaTokenizer
+from transformers import AutoModelForCausalLM, AutoTokenizer, AutoConfig, LlamaTokenizer
 
 def main():
     # Change working dir to folder storing this script
@@ -12,7 +12,6 @@ def main():
     # Parse command line arguments
     parser = argparse.ArgumentParser()
     parser.add_argument("--model-name", type=str, required=True)
-    parser.add_argument("--tokenizer-model-name", type=str, required=True)
     parser.add_argument("--max-length", type=int, default=128)
     parser.add_argument("--prompt-file", type=str, required=True)
     parser.add_argument("--output-file", type=str, required=True)
@@ -46,15 +45,20 @@ def main():
 
     # Run huggingface model
     device = "cuda" if args.gpu else "cpu"
+    # Get Model
     model = AutoModelForCausalLM.from_pretrained(args.model_name).to(device)
-    if args.tokenizer_model_name == "JackFram/llama-160m":
-        tokenizer = LlamaTokenizer.from_pretrained("JackFram/llama-160m", use_fast=True)
+    # Get Tokenizer
+    hf_config = AutoConfig.from_pretrained(args.model_name, trust_remote_code=True)
+    hf_arch = getattr(hf_config, "architectures")[0]
+    if hf_arch == "LLaMAForCausalLM" or hf_arch == "LlamaForCausalLM":
+        tokenizer = LlamaTokenizer.from_pretrained(args.model_name, use_fast=True)
     else:
-        tokenizer = AutoTokenizer.from_pretrained(args.tokenizer_model_name)
+        tokenizer = AutoTokenizer.from_pretrained(args.model_name)
+    # Generate output
     with open(args.output_file, "w") as f:
         for i, prompt in enumerate(prompt_list):
             batch = tokenizer(
-                prompt_list, return_tensors="pt", add_special_tokens=True
+                prompt, return_tensors="pt", add_special_tokens=True
             ).to(device)
             generated = model.generate(batch["input_ids"], max_length=args.max_length)
             out = tokenizer.decode(generated[0])
diff --git a/tests/inference/python_inference_tests.sh b/tests/inference/python_inference_tests.sh
index 800c0ad043..3618401c9d 100755
--- a/tests/inference/python_inference_tests.sh
+++ b/tests/inference/python_inference_tests.sh
@@ -157,28 +157,31 @@ check_partial_token_match "../../inference/output/incr_dec-python-opt-6.7b-half_
 ######################### Alignment tests with HuggingFace ####################################
 
 # LLAMA (small model, full precision)
-python3 ./huggingface_inference.py --model-name "JackFram/llama-160m" --tokenizer-model-name "JackFram/llama-160m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M.txt" --gpu
+python3 ./huggingface_inference.py --model-name "JackFram/llama-160m-base" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M.txt" --gpu
 
 # LLAMA (small model, half precision)
-python3 ./huggingface_inference.py --model-name "JackFram/llama-160m" --tokenizer-model-name "JackFram/llama-160m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M_half.txt" --gpu
+python3 ./huggingface_inference.py --model-name "JackFram/llama-160m-base" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M_half.txt" --gpu
 
 # LLAMA (big model, full precision)
-python3 ./huggingface_inference.py --model-name "decapoda-research/llama-7b-hf" --tokenizer-model-name "JackFram/llama-160m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B.txt"
+python3 ./huggingface_inference.py --model-name "decapoda-research/llama-7b-hf" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B.txt"
 
 # LLAMA (big model, half precision)
-python3 ./huggingface_inference.py --model-name "decapoda-research/llama-7b-hf" --tokenizer-model-name "JackFram/llama-160m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B_half.txt" --gpu
+python3 ./huggingface_inference.py --model-name "decapoda-research/llama-7b-hf" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B_half.txt" --gpu
 
 # OPT (small model, full precision)
-python3 ./huggingface_inference.py --model-name "facebook/opt-125m" --tokenizer-model-name "facebook/opt-125m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_125M.txt" --gpu --max-length 128
+python3 ./huggingface_inference.py --model-name "facebook/opt-125m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_125M.txt" --gpu --max-length 128
 
 # OPT (small model, half precision)
-python3 ./huggingface_inference.py --model-name "facebook/opt-125m" --tokenizer-model-name "facebook/opt-125m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_125M_half.txt" --gpu --max-length 128
+python3 ./huggingface_inference.py --model-name "facebook/opt-125m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_125M_half.txt" --gpu --max-length 128
 
 # OPT (big model, full precision)
-#python3 ./huggingface_inference.py --model-name "facebook/opt-6.7b" --tokenizer-model-name "facebook/opt-6.7b" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_6B.txt" --max-length 127
+python3 ./huggingface_inference.py --model-name "facebook/opt-6.7b" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_6B.txt" --max-length 128
 
 # OPT (big model, half precision)
-#python3 ./huggingface_inference.py --model-name "facebook/opt-6.7b" --tokenizer-model-name "facebook/opt-6.7b" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_6B_half.txt" --gpu --max-length 127
+#python3 ./huggingface_inference.py --model-name "facebook/opt-6.7b" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_6B_half.txt" --gpu --max-length 128
+
+# Falcon (full precision)
+python3 ./huggingface_inference.py --model-name "tiiuae/falcon-7b" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_falcon_7B.txt" --max-length 128
 
 diff <(tail -n +2 "../../inference/output/huggingface_llama_160M.txt") <(tail -n +5 "../../inference/output/incr_dec-python-llama-160m-full_prec-1_tp_4_pp.txt")
 diff <(tail -n +2 "../../inference/output/huggingface_llama_160M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_dec-python-llama-160m-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
@@ -187,5 +190,6 @@ diff <(tail -n +2 "../../inference/output/huggingface_llama_7B_half.txt" | tr -s
 
 diff <(tail -n +2 "../../inference/output/huggingface_opt_125M.txt") <(tail -n +5 "../../inference/output/incr_dec-python-opt-125m-full_prec-1_tp_4_pp.txt")
 diff <(tail -n +2 "../../inference/output/huggingface_opt_125M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_dec-python-opt-125m-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
-#diff <(tail -n +2 "../../inference/output/huggingface_opt_6B.txt") <(tail -n +5 "../../inference/output/incr_dec-python-opt-6.7b-full_prec-1_tp_4_pp.txt")
+diff <(tail -n +2 "../../inference/output/huggingface_opt_6B.txt") <(tail -n +5 "../../inference/output/incr_dec-python-opt-6.7b-full_prec-1_tp_4_pp.txt")
 #diff <(tail -n +2 "../../inference/output/huggingface_opt_6B_half.txt") <(tail -n +5 "../../inference/output/incr_dec-python-opt-6.7b-half_prec-1_tp_4_pp.txt")
+diff <(tail -n +2 "../../inference/output/huggingface_falcon_7B.txt") <(tail -n +5 "../../inference/output/incr_dec-python-falcon-7b-full_prec-1_tp_4_pp.txt")
diff --git a/tests/inference/python_test_configs/generate_configs.py b/tests/inference/python_test_configs/generate_configs.py
index e780bc17b0..e683faa469 100644
--- a/tests/inference/python_test_configs/generate_configs.py
+++ b/tests/inference/python_test_configs/generate_configs.py
@@ -34,7 +34,7 @@
     "ssms": [
         {
             # required ssm parameter
-            "ssm_model": "JackFram/llama-160m",
+            "ssm_model": "JackFram/llama-160m-base",
             # optional ssm parameters
             "cache_path": "",
             "refresh_cache": False,
@@ -46,7 +46,7 @@
 ff_init_configs.update(llm_configs)
 
 # Test parameters to fill in
-llama_models = ["decapoda-research/llama-7b-hf", "JackFram/llama-160m"]
+llama_models = ["decapoda-research/llama-7b-hf", "JackFram/llama-160m-base"]
 opt_models = ["facebook/opt-6.7b", "facebook/opt-125m"]
 falcon_models = ["tiiuae/falcon-7b",]
 mpt_models = ["mosaicml/mpt-7b", ]
diff --git a/tests/inference_tests.sh b/tests/inference_tests.sh
index b1d45853e2..c01b0730b6 100755
--- a/tests/inference_tests.sh
+++ b/tests/inference_tests.sh
@@ -23,7 +23,7 @@ cleanup
 pip3 install protobuf==3.20.3
 
 # Download the weights in both half and full precision
-python3 ../inference/utils/download_hf_model.py "decapoda-research/llama-7b-hf" "JackFram/llama-160m" "facebook/opt-6.7b" "facebook/opt-125m" "tiiuae/falcon-7b"
+python3 ../inference/utils/download_hf_model.py "decapoda-research/llama-7b-hf" "JackFram/llama-160m-base" "facebook/opt-6.7b" "facebook/opt-125m" "tiiuae/falcon-7b"
 
 # Create test prompt file
 mkdir -p ../inference/prompt

From b1b44610b570aafb1fc1dc6e61864e5751b269f7 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 19 Sep 2023 16:22:34 -0400
Subject: [PATCH 227/344] fix ci

---
 tests/inference/python_inference_tests.sh | 12 ++++++------
 tests/inference_tests.sh                  |  8 +++++---
 2 files changed, 11 insertions(+), 9 deletions(-)

diff --git a/tests/inference/python_inference_tests.sh b/tests/inference/python_inference_tests.sh
index 3618401c9d..5cbcbc31f9 100755
--- a/tests/inference/python_inference_tests.sh
+++ b/tests/inference/python_inference_tests.sh
@@ -133,10 +133,10 @@ check_partial_token_match "../../inference/output/spec_infer-python-opt-6.7b-hal
 
 ## Incremental decoding
 # Small LLAMA
-diff <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-full_prec-2_tp_2_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-full_prec-1_tp_4_pp.txt")
-check_partial_token_match "../../inference/output/incr_dec-python-llama-160m-half_prec-2_tp_2_pp.txt" "../../inference/output/incr_dec-python-llama-160m-half_prec-1_tp_4_pp.txt"
-diff <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-full_prec-4_tp_1_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-full_prec-1_tp_4_pp.txt")
-check_partial_token_match "../../inference/output/incr_dec-python-llama-160m-half_prec-4_tp_1_pp.txt" "../../inference/output/incr_dec-python-llama-160m-half_prec-1_tp_4_pp.txt"
+diff <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-base-full_prec-2_tp_2_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-base-full_prec-1_tp_4_pp.txt")
+check_partial_token_match "../../inference/output/incr_dec-python-llama-160m-base-half_prec-2_tp_2_pp.txt" "../../inference/output/incr_dec-python-llama-160m-base-half_prec-1_tp_4_pp.txt"
+diff <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-base-full_prec-4_tp_1_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-base-full_prec-1_tp_4_pp.txt")
+check_partial_token_match "../../inference/output/incr_dec-python-llama-160m-base-half_prec-4_tp_1_pp.txt" "../../inference/output/incr_dec-python-llama-160m-base-half_prec-1_tp_4_pp.txt"
 # Big LLAMA
 diff <(tail -n +3 "../../inference/output/incr_dec-python-llama-7b-hf-full_prec-2_tp_2_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-llama-7b-hf-full_prec-1_tp_4_pp.txt")
 check_partial_token_match "../../inference/output/incr_dec-python-llama-7b-hf-half_prec-2_tp_2_pp.txt" "../../inference/output/incr_dec-python-llama-7b-hf-half_prec-1_tp_4_pp.txt"
@@ -183,8 +183,8 @@ python3 ./huggingface_inference.py --model-name "facebook/opt-6.7b" --use-full-p
 # Falcon (full precision)
 python3 ./huggingface_inference.py --model-name "tiiuae/falcon-7b" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_falcon_7B.txt" --max-length 128
 
-diff <(tail -n +2 "../../inference/output/huggingface_llama_160M.txt") <(tail -n +5 "../../inference/output/incr_dec-python-llama-160m-full_prec-1_tp_4_pp.txt")
-diff <(tail -n +2 "../../inference/output/huggingface_llama_160M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_dec-python-llama-160m-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
+diff <(tail -n +2 "../../inference/output/huggingface_llama_160M.txt") <(tail -n +5 "../../inference/output/incr_dec-python-llama-160m-base-full_prec-1_tp_4_pp.txt")
+diff <(tail -n +2 "../../inference/output/huggingface_llama_160M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_dec-python-llama-160m-base-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
 diff <(tail -n +2 "../../inference/output/huggingface_llama_7B.txt") <(tail -n +5 "../../inference/output/incr_dec-python-llama-7b-hf-full_prec-1_tp_4_pp.txt")
 diff <(tail -n +2 "../../inference/output/huggingface_llama_7B_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_dec-python-llama-7b-hf-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
 
diff --git a/tests/inference_tests.sh b/tests/inference_tests.sh
index c01b0730b6..c757dd5ee6 100755
--- a/tests/inference_tests.sh
+++ b/tests/inference_tests.sh
@@ -22,9 +22,6 @@ cleanup
 # Make sure supported version of protobuf is installed
 pip3 install protobuf==3.20.3
 
-# Download the weights in both half and full precision
-python3 ../inference/utils/download_hf_model.py "decapoda-research/llama-7b-hf" "JackFram/llama-160m-base" "facebook/opt-6.7b" "facebook/opt-125m" "tiiuae/falcon-7b"
-
 # Create test prompt file
 mkdir -p ../inference/prompt
 echo '["Give three tips for staying healthy."]' > ../inference/prompt/test.json
@@ -32,11 +29,16 @@ echo '["Give three tips for staying healthy."]' > ../inference/prompt/test.json
 # Create output folder
 mkdir -p ../inference/output
 
+# Enable backtrace in case we run into a segfault or assertion failure
+export LEGION_BACKTRACE=1
+
 if [[ "$PYTHON_INFERENCE_TESTS" == "ON" ]]; then
     echo "Running Python inference tests..."
     ./inference/python_inference_tests.sh
 fi
 if [[ "$CPP_INFERENCE_TESTS" == "ON" ]]; then
+    # Manually download the weights in both half and full precision
+    python3 ../inference/utils/download_hf_model.py "decapoda-research/llama-7b-hf" "JackFram/llama-160m-base" "facebook/opt-6.7b" "facebook/opt-125m" "tiiuae/falcon-7b"
     echo "Running C++ inference tests..."
     ./inference/cpp_inference_tests.sh
 fi

From 2ef52f881571808bdc3ada371aeefa64894e60cc Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 20 Sep 2023 16:24:55 -0400
Subject: [PATCH 228/344] Do not run empty kernels (`num_tokens=0`) (#1141)

* .

* fix
---
 include/flexflow/model.h              |   4 +
 include/flexflow/ops/element_binary.h |   4 +
 include/flexflow/ops/element_unary.h  |   4 +
 include/flexflow/ops/layer_norm.h     |   4 +
 include/flexflow/ops/rms_norm.h       |   4 +
 include/flexflow/ops/softmax.h        |   9 +--
 src/ops/element_binary.cc             | 108 +++++++++++++++++++++++++-
 src/ops/element_unary.cc              |  28 ++++++-
 src/ops/layer_norm.cc                 |  76 +++++++++++++++++-
 src/ops/linear.cc                     |   3 +
 src/ops/rms_norm.cc                   |  28 ++++++-
 src/ops/softmax.cc                    |  18 +++--
 src/runtime/model.cc                  |  69 ++++++++++++++--
 13 files changed, 336 insertions(+), 23 deletions(-)

diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index d4d829b019..6a2bfdb666 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -52,10 +52,12 @@ enum TaskIDs {
   LOAD_IMAGES_TASK_ID,
   NORMALIZE_IMAGES_TASK_ID,
   ELEMENTBINARY_INIT_TASK_ID,
+  ELEMENTBINARY_INF_TASK_ID,
   ELEMENTBINARY_FWD_TASK_ID,
   ELEMENTBINARY_BWD_TASK_ID,
   ELEMENTUNARY_INIT_TASK_ID,
   ELEMENTUNARY_FWD_TASK_ID,
+  ELEMENTUNARY_INF_TASK_ID,
   ELEMENTUNARY_BWD_TASK_ID,
   EXPERTS_INIT_TASK_ID,
   EXPERTS_FWD_TASK_ID,
@@ -102,6 +104,7 @@ enum TaskIDs {
   BATCHMATMUL_BWD_TASK_ID,
   LAYERNORM_INIT_TASK_ID,
   LAYERNORM_FWD_TASK_ID,
+  LAYERNORM_INF_TASK_ID,
   LAYERNORM_BWD_TASK_ID,
   LINEAR_INIT_TASK_ID,
   LINEAR_INIT_PARA_TASK_ID,
@@ -150,6 +153,7 @@ enum TaskIDs {
   ATTENTION_BWD_TASK_ID,
   RMSNROM_INIT_TASK_ID,
   RMSNROM_FWD_TASK_ID,
+  RMSNROM_INF_TASK_ID,
   BEAM_TOPK_INIT_TASK_ID,
   BEAM_TOPK_INF_TASK_ID,
   INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
diff --git a/include/flexflow/ops/element_binary.h b/include/flexflow/ops/element_binary.h
index 4aa41ed9e4..08747bb9a4 100644
--- a/include/flexflow/ops/element_binary.h
+++ b/include/flexflow/ops/element_binary.h
@@ -56,6 +56,10 @@ class ElementBinary : public Op {
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
                            Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
   static void backward_task(Legion::Task const *task,
                             std::vector<Legion::PhysicalRegion> const &regions,
                             Legion::Context ctx,
diff --git a/include/flexflow/ops/element_unary.h b/include/flexflow/ops/element_unary.h
index 2df9ea61bc..f82db5f910 100644
--- a/include/flexflow/ops/element_unary.h
+++ b/include/flexflow/ops/element_unary.h
@@ -77,6 +77,10 @@ class ElementUnary : public Op {
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
                            Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
   static void backward_task(Legion::Task const *task,
                             std::vector<Legion::PhysicalRegion> const &regions,
                             Legion::Context ctx,
diff --git a/include/flexflow/ops/layer_norm.h b/include/flexflow/ops/layer_norm.h
index 8e0b4f61ff..c65370e0fd 100644
--- a/include/flexflow/ops/layer_norm.h
+++ b/include/flexflow/ops/layer_norm.h
@@ -63,6 +63,10 @@ class LayerNorm : public Op {
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
                            Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
   static void backward_task(Legion::Task const *task,
                             std::vector<Legion::PhysicalRegion> const &regions,
                             Legion::Context ctx,
diff --git a/include/flexflow/ops/rms_norm.h b/include/flexflow/ops/rms_norm.h
index 36dde15b90..a3074de015 100644
--- a/include/flexflow/ops/rms_norm.h
+++ b/include/flexflow/ops/rms_norm.h
@@ -69,6 +69,10 @@ class RMSNorm : public Op {
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
                            Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
                              CostMetrics &cost_metrics) const override;
diff --git a/include/flexflow/ops/softmax.h b/include/flexflow/ops/softmax.h
index 1d5191d7ee..6fd1a434d4 100644
--- a/include/flexflow/ops/softmax.h
+++ b/include/flexflow/ops/softmax.h
@@ -53,11 +53,10 @@ class Softmax : public Op {
                             std::vector<Legion::PhysicalRegion> const &regions,
                             Legion::Context ctx,
                             Legion::Runtime *runtime);
-  static InferenceResult
-      inference_task(Legion::Task const *task,
-                     std::vector<Legion::PhysicalRegion> const &regions,
-                     Legion::Context ctx,
-                     Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
                              CostMetrics &cost_metrics) const override;
diff --git a/src/ops/element_binary.cc b/src/ops/element_binary.cc
index 2cd5ba100e..21edad11e3 100644
--- a/src/ops/element_binary.cc
+++ b/src/ops/element_binary.cc
@@ -540,7 +540,7 @@ FutureMap
   size_t machine_view_hash = view->hash();
   /* std::cout << "ElementBinary op machine_view: " << *(MachineView const *)mv
             << std::endl; */
-  IndexLauncher launcher(ELEMENTBINARY_FWD_TASK_ID,
+  IndexLauncher launcher(ELEMENTBINARY_INF_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
                          argmap,
@@ -548,6 +548,7 @@ FutureMap
                          false /*must*/,
                          0 /*mapper_id*/,
                          machine_view_hash);
+  launcher.add_future(bc);
   if (inplace_a) {
     assert(batch_outputs[0]->part == batch_inputs[0]->part);
     assert(batch_outputs[0]->region == batch_inputs[0]->region);
@@ -603,6 +604,111 @@ FutureMap
   return runtime->execute_index_space(ctx, launcher);
 }
 
+/*
+  regions[0](I): in1
+  regions[1](I): in2
+  regions[2](O): output
+*/
+__host__ void
+    ElementBinary::inference_task(Task const *task,
+                                  std::vector<PhysicalRegion> const &regions,
+                                  Context ctx,
+                                  Runtime *runtime) {
+  assert(task->regions.size() == regions.size());
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_tokens == 0) {
+    return;
+  }
+  // const ElementBinary* ele = (const ElementBinary*) task->args;
+  ElementBinaryMeta const *m = *((ElementBinaryMeta **)task->local_args);
+  GenericTensorAccessorR in1, in2;
+  GenericTensorAccessorW out;
+  Domain in1_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+
+  if (!m->has_same_operands) {
+    Domain in2_domain = runtime->get_index_space_domain(
+        ctx, task->regions[1].region.get_index_space());
+    // Currently only support broadcast for add and sub
+    if (in1_domain != in2_domain) {
+      assert(m->op_type == OP_EW_SUB || m->op_type == OP_EW_ADD ||
+             m->op_type == OP_EW_MUL);
+    }
+  }
+
+  if (m->inplace_a) {
+    if (m->has_same_operands) {
+      assert(regions.size() == 1);
+      assert(task->regions.size() == 1);
+      out = helperGetGenericTensorAccessorRW(m->output_type[0],
+                                             regions[0],
+                                             task->regions[0],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
+      in2 = out;
+      in1 = out;
+    } else {
+      assert(regions.size() == 2);
+      assert(task->regions.size() == 2);
+      out = helperGetGenericTensorAccessorRW(m->output_type[0],
+                                             regions[0],
+                                             task->regions[0],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
+      in2 = helperGetGenericTensorAccessorRO(m->input_type[1],
+                                             regions[1],
+                                             task->regions[1],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
+      in1 = out;
+    }
+  } else {
+    if (m->has_same_operands) {
+      assert(regions.size() == 2);
+      assert(task->regions.size() == 2);
+      in1 = helperGetGenericTensorAccessorRO(m->input_type[0],
+                                             regions[0],
+                                             task->regions[0],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
+      in2 = in1;
+      out = helperGetGenericTensorAccessorWO(m->output_type[0],
+                                             regions[1],
+                                             task->regions[1],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
+    } else {
+      assert(regions.size() == 3);
+      assert(task->regions.size() == 3);
+      in1 = helperGetGenericTensorAccessorRO(m->input_type[0],
+                                             regions[0],
+                                             task->regions[0],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
+      in2 = helperGetGenericTensorAccessorRO(m->input_type[1],
+                                             regions[1],
+                                             task->regions[1],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
+      out = helperGetGenericTensorAccessorWO(m->output_type[0],
+                                             regions[2],
+                                             task->regions[2],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
+    }
+  }
+
+  forward_kernel_wrapper(m, in1, in2, out);
+}
+
 /*
   regions[0](I): in1
   regions[1](I): in2
diff --git a/src/ops/element_unary.cc b/src/ops/element_unary.cc
index c82c1196a2..bdb594b0f6 100644
--- a/src/ops/element_unary.cc
+++ b/src/ops/element_unary.cc
@@ -432,7 +432,7 @@ FutureMap
   set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
 
-  IndexLauncher launcher(ELEMENTUNARY_FWD_TASK_ID,
+  IndexLauncher launcher(ELEMENTUNARY_INF_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
                          argmap,
@@ -440,6 +440,7 @@ FutureMap
                          false /*must*/,
                          0 /*mapper_id*/,
                          machine_view_hash);
+  launcher.add_future(bc);
   if (inplace) {
     assert(batch_outputs[0]->part == batch_inputs[0]->part);
     assert(batch_outputs[0]->region == batch_inputs[0]->region);
@@ -468,6 +469,31 @@ FutureMap
   return runtime->execute_index_space(ctx, launcher);
 }
 
+void ElementUnary::inference_task(Task const *task,
+                                  std::vector<PhysicalRegion> const &regions,
+                                  Context ctx,
+                                  Runtime *runtime) {
+  assert(task->regions.size() == regions.size());
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_tokens == 0) {
+    return;
+  }
+  ElementUnaryMeta const *m = *((ElementUnaryMeta **)task->local_args);
+  if (m->data_type == DT_HALF) {
+    forward_task_with_type<half>(task, regions, ctx, runtime);
+  } else if (m->data_type == DT_FLOAT) {
+    forward_task_with_type<float>(task, regions, ctx, runtime);
+  } else if (m->data_type == DT_DOUBLE) {
+    forward_task_with_type<double>(task, regions, ctx, runtime);
+  } else if (m->data_type == DT_INT32) {
+    forward_task_with_type<int32_t>(task, regions, ctx, runtime);
+  } else if (m->data_type == DT_INT64) {
+    forward_task_with_type<int64_t>(task, regions, ctx, runtime);
+  } else {
+    assert(false && "Unsupported data type in Embedding forward");
+  }
+}
+
 void ElementUnary::forward_task(Task const *task,
                                 std::vector<PhysicalRegion> const &regions,
                                 Context ctx,
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index 09a5e40851..758d7cfcce 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -442,7 +442,7 @@ FutureMap LayerNorm::inference(FFModel const &ff,
   size_t machine_view_hash = view->hash();
   /* std::cout << "LayerNorm op machine_view: " << *(MachineView const *)mv
             << std::endl; */
-  IndexLauncher launcher(LAYERNORM_FWD_TASK_ID,
+  IndexLauncher launcher(LAYERNORM_INF_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
                          argmap,
@@ -450,6 +450,7 @@ FutureMap LayerNorm::inference(FFModel const &ff,
                          false /*must*/,
                          0 /*mapper_id*/,
                          machine_view_hash);
+  launcher.add_future(bc);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
@@ -482,6 +483,79 @@ FutureMap LayerNorm::inference(FFModel const &ff,
   return runtime->execute_index_space(ctx, launcher);
 }
 
+/*
+  regions[0](I): input
+  regions[1](O): output
+  regions[2](I/O): gamma
+  regions[3](I/O): beta
+*/
+void LayerNorm::inference_task(Task const *task,
+                               std::vector<PhysicalRegion> const &regions,
+                               Context ctx,
+                               Runtime *runtime) {
+  assert(task->regions.size() == regions.size());
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_tokens == 0) {
+    return;
+  }
+
+  LayerNormMeta const *m = *((LayerNormMeta **)task->local_args);
+  assert(task->regions.size() == regions.size());
+  float const *in_ptr = NULL;
+  float *out_ptr = NULL, *gamma_ptr = NULL, *beta_ptr = NULL;
+  GenericTensorAccessorR in, gamma, beta;
+  GenericTensorAccessorW out;
+
+  Domain in_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  // in_ptr = helperGetTensorPointerRO<float>(
+  //     regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  in = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  Domain out_domain = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+  // out_ptr = helperGetTensorPointerWO<float>(
+  //     regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  out = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  assert(in_domain == out_domain);
+  assert(in_domain.get_volume() ==
+         m->effective_num_elements * m->effective_batch_size);
+  if (m->elementwise_affine) {
+    assert(m->use_bias == (regions.size() == 4));
+    Domain gamma_domain = runtime->get_index_space_domain(
+        ctx, task->regions[2].region.get_index_space());
+    gamma = helperGetGenericTensorAccessorRO(
+        m->input_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+    if (m->use_bias) {
+      Domain beta_domain = runtime->get_index_space_domain(
+          ctx, task->regions[3].region.get_index_space());
+      beta = helperGetGenericTensorAccessorRO(m->input_type[0],
+                                              regions[3],
+                                              task->regions[3],
+                                              FID_DATA,
+                                              ctx,
+                                              runtime);
+      assert(gamma_domain == beta_domain);
+    }
+
+    assert(gamma_domain.get_volume() == m->effective_num_elements);
+    int numdims = gamma_domain.get_dim();
+    size_t vol = 1;
+    int i = 0;
+    while (vol < gamma_domain.get_volume()) {
+      int g_d = gamma_domain.hi()[i] - gamma_domain.lo()[i] + 1;
+      int in_d = in_domain.hi()[i] - in_domain.lo()[i] + 1;
+      assert(g_d == in_d);
+      vol *= g_d;
+      i++;
+    }
+  } else {
+    assert(regions.size() == 2);
+  }
+  LayerNorm::forward_kernel_wrapper(m, in, out, gamma, beta);
+}
+
 /*
   regions[0](I): input
   regions[1](O): output
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index 8eb3db2869..a751ebcc57 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -619,6 +619,9 @@ void Linear::inference_task(Task const *task,
       ctx, task->regions[0].region.get_index_space());
   LinearMeta const *m = *((LinearMeta **)task->local_args);
   BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_tokens == 0) {
+    return;
+  }
   assert(regions.size() == (3 + static_cast<size_t>(m->use_bias)));
   assert(task->regions.size() == (3 + static_cast<size_t>(m->use_bias)));
   if (m->quantization_type == DT_NONE) {
diff --git a/src/ops/rms_norm.cc b/src/ops/rms_norm.cc
index 8fdfc7bc1e..c3a4e9b58c 100644
--- a/src/ops/rms_norm.cc
+++ b/src/ops/rms_norm.cc
@@ -347,7 +347,7 @@ FutureMap RMSNorm::inference(FFModel const &ff,
   set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
 
-  IndexLauncher launcher(RMSNROM_FWD_TASK_ID,
+  IndexLauncher launcher(RMSNROM_INF_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
                          argmap,
@@ -355,6 +355,7 @@ FutureMap RMSNorm::inference(FFModel const &ff,
                          false /*must*/,
                          0 /*mapper_id*/,
                          machine_view_hash);
+  launcher.add_future(bc);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
@@ -397,6 +398,31 @@ void RMSNorm::forward_task(Task const *task,
   forward_kernel_wrapper(m, input, weight, output);
 }
 
+/*
+  regions[0](I): input
+  regions[1](O): output
+  regions[2](I/O): weight
+*/
+void RMSNorm::inference_task(Task const *task,
+                             std::vector<PhysicalRegion> const &regions,
+                             Context ctx,
+                             Runtime *runtime) {
+  assert(task->regions.size() == 3);
+  assert(regions.size() == 3);
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_tokens == 0) {
+    return;
+  }
+  RMSNormMeta const *m = *((RMSNormMeta **)task->local_args);
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
+      m->weight_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  forward_kernel_wrapper(m, input, weight, output);
+}
+
 void RMSNorm::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->layer_guid.transformer_layer_id);
diff --git a/src/ops/softmax.cc b/src/ops/softmax.cc
index 2d72151035..28c9ecea67 100644
--- a/src/ops/softmax.cc
+++ b/src/ops/softmax.cc
@@ -255,6 +255,7 @@ FutureMap Softmax::inference(FFModel const &ff,
                          false /*must*/,
                          0 /*mapper_id*/,
                          machine_view_hash);
+  launcher.add_future(bc);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
@@ -429,11 +430,15 @@ void Softmax::backward_task_with_dim(Task const *task,
       m, acc_input_grad.ptr, acc_output_grad.ptr, acc_input_grad.rect.volume());
 }
 
-InferenceResult
-    Softmax::inference_task(Task const *task,
-                            std::vector<PhysicalRegion> const &regions,
-                            Context ctx,
-                            Runtime *runtime) {
+void Softmax::inference_task(Task const *task,
+                             std::vector<PhysicalRegion> const &regions,
+                             Context ctx,
+                             Runtime *runtime) {
+  assert(task->regions.size() == regions.size());
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_tokens == 0) {
+    return;
+  }
   Domain in_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
   SoftmaxMeta const *m = *((SoftmaxMeta **)task->local_args);
@@ -454,9 +459,6 @@ InferenceResult
     default:
       assert(false);
   }
-  // FIXME: replace this with actual result
-  InferenceResult ir;
-  return ir;
 }
 
 bool Softmax::get_int_parameter(PMParameter para, int *value) const {
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 8c72cc51d1..2768439117 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -4446,6 +4446,21 @@ void register_flexflow_internal_tasks(Runtime *runtime,
           registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(ELEMENTUNARY_INF_TASK_ID,
+                                   "ElementWiseUnary Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<ElementUnary::inference_task>(
+          registrar, "ElementWiseUnary Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<ElementUnary::inference_task>(registrar);
+    }
+  }
   {
     TaskVariantRegistrar registrar(ELEMENTUNARY_FWD_TASK_ID,
                                    "ElementWiseUnary Forward");
@@ -4493,6 +4508,21 @@ void register_flexflow_internal_tasks(Runtime *runtime,
           registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(ELEMENTBINARY_INF_TASK_ID,
+                                   "ElementWiseBinary Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<ElementBinary::inference_task>(
+          registrar, "ElementWiseBinary Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<ElementBinary::inference_task>(registrar);
+    }
+  }
   {
     TaskVariantRegistrar registrar(ELEMENTBINARY_FWD_TASK_ID,
                                    "ElementWiseBinary Forward");
@@ -5146,6 +5176,21 @@ void register_flexflow_internal_tasks(Runtime *runtime,
       runtime->register_task_variant<OpMeta *, LayerNorm::init_task>(registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(LAYERNORM_INF_TASK_ID,
+                                   "LayerNorm Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<LayerNorm::inference_task>(
+          registrar, "LayerNorm Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<LayerNorm::inference_task>(registrar);
+    }
+  }
   {
     TaskVariantRegistrar registrar(LAYERNORM_FWD_TASK_ID, "layernorm_fwd_task");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
@@ -5189,6 +5234,20 @@ void register_flexflow_internal_tasks(Runtime *runtime,
       runtime->register_task_variant<RMSNorm::forward_task>(registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(RMSNROM_INF_TASK_ID, "RMS Norm Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<RMSNorm::inference_task>(
+          registrar, "RMS Norm Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<RMSNorm::inference_task>(registrar);
+    }
+  }
   {
     TaskVariantRegistrar registrar(LAYERNORM_BWD_TASK_ID, "layernorm_bwd_task");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
@@ -5347,19 +5406,17 @@ void register_flexflow_internal_tasks(Runtime *runtime,
     }
   }
   {
-    TaskVariantRegistrar registrar(SOFTMAX_INF_TASK_ID, "softmax_inf_task");
+    TaskVariantRegistrar registrar(SOFTMAX_INF_TASK_ID, "Softmax Inference");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
     if (pre_register) {
-      Runtime::preregister_task_variant<InferenceResult,
-                                        Softmax::inference_task>(
-          registrar, "softmax_inf_task");
+      Runtime::preregister_task_variant<Softmax::inference_task>(
+          registrar, "Softmax Inference Task");
     } else {
       if (enable_control_replication) {
         registrar.global_registration = false;
       }
-      runtime->register_task_variant<InferenceResult, Softmax::inference_task>(
-          registrar);
+      runtime->register_task_variant<Softmax::inference_task>(registrar);
     }
   }
   // compute Loss

From a4f2588b37fc2476ed90bf8370e9843d0c5e3a47 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 21 Sep 2023 15:24:57 -0400
Subject: [PATCH 229/344] Fuse inference kernels to reduce kernel launch
 overhead (part 1) (#1128)

* add add_bias_residual_layer_norm layer

* progress

* make it compile

* fix bias param

* .

* .

* .

* file loader update

* .

* .

* .

* .

* fixes

* fix

* fix

* backup

* finished debugging

* .

* gpu torch in docker

* fix

* add falcon to ci

* re-enabled opt tests, linting

* fix

* cpu

* temporary ci fix

* .

* fix

* fix

* fix

* linting

* Revert "linting"

This reverts commit 5bbe29e4b059d759eb71392858350fd52c700167.

* fix

* fix

* fix

* fix

* turn on backtrace

* fix

* fix rocm kernel

* fix

* .

* fix

* do not run empty AddBiasResidualLayerNorm

* fix

* fix rocm compilation

* remove clutter
---
 include/flexflow/ffconst.h                    |   1 +
 include/flexflow/flexflow_c.h                 |  14 +-
 include/flexflow/model.h                      |  17 +
 include/flexflow/operator_params.h            |   2 +
 .../ops/add_bias_residual_layer_norm.h        | 113 +++
 .../ops/add_bias_residual_layer_norm_params.h |  29 +
 include/flexflow/ops/beam_topk_params.h       |   1 +
 include/flexflow/ops/element_binary_params.h  |   1 +
 include/flexflow/ops/element_unary_params.h   |   1 +
 include/flexflow/ops/experts_params.h         |   2 +
 include/flexflow/ops/gather_params.h          |   2 +
 .../ops/inc_multihead_self_attention.h        |  19 +-
 .../ops/inc_multihead_self_attention_params.h |   5 +-
 include/flexflow/ops/layer_norm_params.h      |   2 +
 include/flexflow/ops/reduce_params.h          |   2 +
 include/flexflow/ops/reshape_params.h         |   2 +
 include/flexflow/ops/rms_norm_params.h        |   2 +
 .../ops/spec_inc_multihead_self_attention.h   |  12 +-
 ...spec_inc_multihead_self_attention_params.h |   5 +-
 .../ops/tree_inc_multihead_self_attention.h   |  12 +-
 ...tree_inc_multihead_self_attention_params.h |   5 +-
 include/flexflow/substitution_loader.h        |   1 +
 inference/file_loader.cc                      | 298 +++---
 inference/file_loader.h                       |  20 +-
 inference/models/falcon.cc                    |  25 +-
 inference/models/llama.cc                     |  25 +-
 inference/models/mpt.cc                       |   2 +-
 inference/models/opt.cc                       | 191 ++--
 inference/models/starcoder.cc                 |   2 +-
 python/flexflow/core/flexflow_cffi.py         |  42 +-
 python/flexflow/serve/models/falcon.py        |  30 +-
 python/flexflow/serve/models/llama.py         |  34 +-
 python/flexflow/serve/models/mpt.py           |  32 +-
 python/flexflow/serve/models/opt.py           |  59 +-
 python/flexflow/serve/models/starcoder.py     |   4 +-
 python/flexflow/serve/serve.py                |   5 +-
 python/flexflow/type.py                       |   1 +
 src/c/flexflow_c.cc                           |  58 +-
 src/ops/add_bias_residual_layer_norm.cc       | 829 ++++++++++++++++
 src/ops/add_bias_residual_layer_norm.cpp      | 262 ++++++
 src/ops/add_bias_residual_layer_norm.cu       | 299 ++++++
 src/ops/fused.cpp                             | 348 +++++--
 src/ops/fused.cu                              |  78 +-
 src/ops/inc_multihead_self_attention.cc       |  99 +-
 src/ops/inc_multihead_self_attention.cpp      |  51 +-
 src/ops/inc_multihead_self_attention.cu       |  64 +-
 src/ops/kernels/element_binary_kernels.cu     |   2 +-
 src/ops/layer_norm.cc                         |  23 +-
 src/ops/layer_norm.cu                         | 108 ++-
 src/ops/spec_inc_multihead_self_attention.cc  | 103 +-
 src/ops/spec_inc_multihead_self_attention.cpp |   8 +-
 src/ops/spec_inc_multihead_self_attention.cu  |   8 +-
 src/ops/tree_inc_multihead_self_attention.cc  | 887 ++----------------
 src/ops/tree_inc_multihead_self_attention.cpp |   8 +-
 src/ops/tree_inc_multihead_self_attention.cu  |   8 +-
 src/runtime/ffconst_utils.cc                  |   2 +
 src/runtime/graph.cc                          |  48 +-
 src/runtime/model.cc                          |  43 +
 src/runtime/operator_params.cc                |   3 +
 src/runtime/substitution.cc                   |  17 +
 tests/inference/huggingface_inference.py      |   6 +-
 61 files changed, 2875 insertions(+), 1507 deletions(-)
 create mode 100644 include/flexflow/ops/add_bias_residual_layer_norm.h
 create mode 100644 include/flexflow/ops/add_bias_residual_layer_norm_params.h
 create mode 100644 src/ops/add_bias_residual_layer_norm.cc
 create mode 100644 src/ops/add_bias_residual_layer_norm.cpp
 create mode 100644 src/ops/add_bias_residual_layer_norm.cu

diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index 78d98284a4..f86cbff399 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -159,6 +159,7 @@ enum OperatorType {
   OP_POW,   // https://pytorch.org/docs/stable/generated/torch.pow.html
   OP_MEAN,  // https://pytorch.org/docs/stable/generated/torch.mean.html
   OP_LAYERNORM,
+  OP_ADD_BIAS_RESIDUAL_LAYERNORM,
   OP_EXPERTS,
   OP_GATHER, // https://pytorch.org/docs/stable/generated/torch.gather.html
   OP_RMS_NORM,
diff --git a/include/flexflow/flexflow_c.h b/include/flexflow/flexflow_c.h
index 7977a083cc..e363ccf888 100644
--- a/include/flexflow/flexflow_c.h
+++ b/include/flexflow/flexflow_c.h
@@ -259,6 +259,17 @@ flexflow_tensor_t flexflow_model_add_layer_norm(flexflow_model_t handle,
                                                 bool use_bias,
                                                 char const *name);
 
+flexflow_tensor_t *flexflow_model_add_add_bias_residual_layer_norm(
+    flexflow_model_t handle,
+    const flexflow_tensor_t input,
+    const flexflow_tensor_t residual,
+    int n,
+    int *axes,
+    bool elementwise_affine,
+    float eps,
+    bool use_bias,
+    char const *name);
+
 flexflow_tensor_t
     flexflow_model_add_batch_matmul(flexflow_model_t handle,
                                     const flexflow_tensor_t a,
@@ -972,9 +983,6 @@ void flexflow_file_data_loader_destroy(flexflow_file_data_loader_t handle_);
 
 void flexflow_file_data_loader_load_weights(flexflow_file_data_loader_t handle_,
                                             flexflow_model_t model_handle_,
-                                            int num_layers,
-                                            char const **layer_names,
-                                            flexflow_op_t *layers,
                                             bool use_full_precision);
 
 #ifdef __cplusplus
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 6a2bfdb666..05a12bee31 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -106,6 +106,8 @@ enum TaskIDs {
   LAYERNORM_FWD_TASK_ID,
   LAYERNORM_INF_TASK_ID,
   LAYERNORM_BWD_TASK_ID,
+  ADD_BIAS_RESIDUAL_LAYERNORM_INIT_TASK_ID,
+  ADD_BIAS_RESIDUAL_LAYERNORM_INF_TASK_ID,
   LINEAR_INIT_TASK_ID,
   LINEAR_INIT_PARA_TASK_ID,
   LINEAR_INF_TASK_ID,
@@ -309,6 +311,7 @@ class Flat;
 class Gather;
 class Group_by;
 class LayerNorm;
+class AddBiasResidualLayerNorm;
 class Linear;
 class MultiHeadAttention;
 class IncMultiHeadSelfAttention;
@@ -532,6 +535,16 @@ class FFModel {
                     bool use_bias = true,
                     DataType data_type = DT_NONE,
                     char const *name = NULL);
+  // Add a add_bias_residual_layer_norm layer
+  void add_bias_residual_layer_norm(const Tensor input,
+                                    const Tensor residual,
+                                    Tensor *outputs,
+                                    std::vector<int> const &axes,
+                                    bool elementwise_affine,
+                                    float eps,
+                                    bool use_bias = true,
+                                    DataType data_type = DT_NONE,
+                                    char const *name = NULL);
   // Add a batch_norm layer
   Tensor
       batch_norm(const Tensor input, bool relu = true, char const *name = NULL);
@@ -1115,6 +1128,10 @@ class FFModel {
           Group_by *>,
       std::unordered_map<std::pair<ParallelTensorShape, LayerNormParams>,
                          LayerNorm *>,
+      std::unordered_map<
+          std::pair<std::pair<ParallelTensorShape, ParallelTensorShape>,
+                    AddBiasResidualLayerNormParams>,
+          AddBiasResidualLayerNorm *>,
       std::unordered_map<std::pair<ParallelTensorShape, LinearParams>,
                          Linear *>,
       std::unordered_map<std::pair<ParallelTensorShape, Pool2DParams>,
diff --git a/include/flexflow/operator_params.h b/include/flexflow/operator_params.h
index 4f0432cb93..514c70f2ec 100644
--- a/include/flexflow/operator_params.h
+++ b/include/flexflow/operator_params.h
@@ -1,6 +1,7 @@
 #ifndef _OPERATOR_PARAMS_H
 #define _OPERATOR_PARAMS_H
 
+#include "flexflow/ops/add_bias_residual_layer_norm_params.h"
 #include "flexflow/ops/aggregate_params.h"
 #include "flexflow/ops/aggregate_spec_params.h"
 #include "flexflow/ops/arg_topk_params.h"
@@ -59,6 +60,7 @@ using OperatorParameters = mp::variant<AggregateParams,
                                        GatherParams,
                                        Group_byParams,
                                        LayerNormParams,
+                                       AddBiasResidualLayerNormParams,
                                        LinearParams,
                                        MultiHeadAttentionParams,
                                        IncMultiHeadSelfAttentionParams,
diff --git a/include/flexflow/ops/add_bias_residual_layer_norm.h b/include/flexflow/ops/add_bias_residual_layer_norm.h
new file mode 100644
index 0000000000..523f4d3b7c
--- /dev/null
+++ b/include/flexflow/ops/add_bias_residual_layer_norm.h
@@ -0,0 +1,113 @@
+#pragma once
+
+#include "flexflow/inference.h"
+#include "flexflow/model.h"
+#include "flexflow/utils/memory_allocator.h"
+namespace FlexFlow {
+
+class AddBiasResidualLayerNormMeta;
+
+class AddBiasResidualLayerNorm : public Op {
+public:
+  using Params = AddBiasResidualLayerNormParams;
+  using Input = std::pair<ParallelTensor, ParallelTensor>;
+  AddBiasResidualLayerNorm(FFModel &model,
+                           Params const &params,
+                           Input const &inputs,
+                           char const *name = nullptr,
+                           bool allocate_weights = false);
+  AddBiasResidualLayerNorm(FFModel &model,
+                           LayerID const &_layer_guid,
+                           const ParallelTensor _input,
+                           const ParallelTensor _residual,
+                           std::vector<int> const &axes,
+                           bool _elementwise_affine,
+                           bool _use_bias,
+                           float _eps,
+                           bool allocate_weights,
+                           char const *name);
+  void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
+  void forward(FFModel const &) override;
+  void backward(FFModel const &) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfigFuture const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
+  void print_layer(FFModel const &model) override {
+    assert(0);
+  }
+  static Op *
+      create_operator_from_layer(FFModel &model,
+                                 Layer const *layer,
+                                 std::vector<ParallelTensor> const &inputs);
+  void serialize(Legion::Serializer &) const override;
+  static PCG::Node deserialize(FFModel &ff,
+                               Legion::Deserializer &d,
+                               ParallelTensor inputs[],
+                               int num_inputs);
+
+  AddBiasResidualLayerNormParams get_params() const;
+
+  static OpMeta *init_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
+  bool measure_operator_cost(Simulator *sim,
+                             MachineView const &pc,
+                             CostMetrics &cost_metrics) const override;
+  template <typename T>
+  static void inference_kernel(AddBiasResidualLayerNormMeta const *m,
+                               int attn_bias_dim,
+                               int residual_volume,
+                               T const *input_ptr,
+                               T const *attn_bias_ptr,
+                               T const *residual_ptr,
+                               T *added_output_ptr,
+                               T *output_ptr,
+                               T const *gamma_ptr,
+                               T const *beta_ptr,
+                               ffStream_t stream);
+  static void inference_kernel_wrapper(AddBiasResidualLayerNormMeta const *m,
+                                       int attn_bias_dim,
+                                       int residual_volume,
+                                       GenericTensorAccessorR const &input,
+                                       GenericTensorAccessorW &added_output,
+                                       GenericTensorAccessorW &output,
+                                       GenericTensorAccessorR const &residual,
+                                       GenericTensorAccessorR const &attn_bias,
+                                       GenericTensorAccessorR const &gamma,
+                                       GenericTensorAccessorR const &beta);
+
+public:
+  bool elementwise_affine, use_bias;
+  int64_t effective_batch_size, effective_num_elements;
+  float eps;
+  std::vector<int> axes;
+};
+
+class AddBiasResidualLayerNormMeta : public OpMeta {
+public:
+  AddBiasResidualLayerNormMeta(FFHandler handle,
+                               AddBiasResidualLayerNorm const *ln,
+                               MemoryAllocator &gpu_mem_allocator);
+  ~AddBiasResidualLayerNormMeta(void);
+
+public:
+  bool elementwise_affine, use_bias;
+  int64_t effective_batch_size, effective_num_elements;
+  float eps;
+  void *mean_ptr, *rstd_ptr, *ds_ptr, *db_ptr, *scale_ptr, *bias_ptr;
+  char op_name[MAX_OPNAME];
+  Realm::RegionInstance reserveInst;
+};
+
+}; // namespace FlexFlow
diff --git a/include/flexflow/ops/add_bias_residual_layer_norm_params.h b/include/flexflow/ops/add_bias_residual_layer_norm_params.h
new file mode 100644
index 0000000000..6f49983467
--- /dev/null
+++ b/include/flexflow/ops/add_bias_residual_layer_norm_params.h
@@ -0,0 +1,29 @@
+#pragma once
+
+#include "flexflow/ffconst.h"
+#include "flexflow/fftype.h"
+#include "flexflow/parallel_tensor.h"
+
+namespace FlexFlow {
+
+struct AddBiasResidualLayerNormParams {
+  LayerID layer_guid;
+  std::vector<int> axes;
+  bool elementwise_affine;
+  float eps;
+  bool use_bias;
+  bool is_valid(
+      std::pair<ParallelTensorShape, ParallelTensorShape> const &) const;
+};
+
+bool operator==(AddBiasResidualLayerNormParams const &,
+                AddBiasResidualLayerNormParams const &);
+
+} // namespace FlexFlow
+
+namespace std {
+template <>
+struct hash<FlexFlow::AddBiasResidualLayerNormParams> {
+  size_t operator()(FlexFlow::AddBiasResidualLayerNormParams const &) const;
+};
+} // namespace std
diff --git a/include/flexflow/ops/beam_topk_params.h b/include/flexflow/ops/beam_topk_params.h
index c217b0f671..430f16e249 100644
--- a/include/flexflow/ops/beam_topk_params.h
+++ b/include/flexflow/ops/beam_topk_params.h
@@ -2,6 +2,7 @@
 #define _FLEXFLOW_BEAM_TOPK_PARAMS_H
 
 #include "flexflow/ffconst.h"
+#include "flexflow/fftype.h"
 #include "flexflow/parallel_tensor.h"
 
 namespace FlexFlow {
diff --git a/include/flexflow/ops/element_binary_params.h b/include/flexflow/ops/element_binary_params.h
index 8b26877af2..9489b793a7 100644
--- a/include/flexflow/ops/element_binary_params.h
+++ b/include/flexflow/ops/element_binary_params.h
@@ -2,6 +2,7 @@
 #define _FLEXFLOW_ELEMENT_BINARY_PARAMS_H
 
 #include "flexflow/ffconst.h"
+#include "flexflow/fftype.h"
 #include "flexflow/parallel_tensor.h"
 
 namespace FlexFlow {
diff --git a/include/flexflow/ops/element_unary_params.h b/include/flexflow/ops/element_unary_params.h
index 00683c89a0..1aac85c43e 100644
--- a/include/flexflow/ops/element_unary_params.h
+++ b/include/flexflow/ops/element_unary_params.h
@@ -2,6 +2,7 @@
 #define _FLEXFLOW_ELEMENTARY_UNARY_PARAMS_H
 
 #include "flexflow/ffconst.h"
+#include "flexflow/fftype.h"
 #include "flexflow/parallel_tensor.h"
 
 namespace FlexFlow {
diff --git a/include/flexflow/ops/experts_params.h b/include/flexflow/ops/experts_params.h
index b6ba88a96e..7adced3c8c 100644
--- a/include/flexflow/ops/experts_params.h
+++ b/include/flexflow/ops/experts_params.h
@@ -1,5 +1,7 @@
 #pragma once
 
+#include "flexflow/ffconst.h"
+#include "flexflow/fftype.h"
 #include "flexflow/operator.h"
 #include "flexflow/parallel_tensor.h"
 
diff --git a/include/flexflow/ops/gather_params.h b/include/flexflow/ops/gather_params.h
index 768d135e88..51f1184a72 100644
--- a/include/flexflow/ops/gather_params.h
+++ b/include/flexflow/ops/gather_params.h
@@ -1,6 +1,8 @@
 #ifndef _FLEXFLOW_GATHER_PARAMS_H
 #define _FLEXFLOW_GATHER_PARAMS_H
 
+#include "flexflow/ffconst.h"
+#include "flexflow/fftype.h"
 #include "flexflow/parallel_tensor.h"
 
 namespace FlexFlow {
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index 010c3f6085..8290998f02 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -36,8 +36,8 @@ class IncMultiHeadSelfAttention : public Op {
                             int _kdim,
                             int _vdim,
                             float _dropout,
-                            bool _bias,
-                            bool _add_bias_kv,
+                            bool _qkv_bias,
+                            bool _final_bias,
                             bool _add_zero_attn,
                             bool _apply_rotary_embedding,
                             bool _scaling_query,
@@ -58,8 +58,8 @@ class IncMultiHeadSelfAttention : public Op {
                             int _kdim,
                             int _vdim,
                             float _dropout,
-                            bool _bias,
-                            bool _add_bias_kv,
+                            bool _qkv_bias,
+                            bool _final_bias,
                             bool _add_zero_attn,
                             bool _apply_rotary_embedding,
                             bool _scaling_query,
@@ -125,8 +125,8 @@ class IncMultiHeadSelfAttention : public Op {
 public:
   int num_q_heads, num_kv_heads, tensor_parallelism_degree;
   float dropout, scaling_factor;
-  bool bias;
-  bool add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
+  bool qkv_bias;
+  bool final_bias, add_zero_attn, apply_rotary_embedding, scaling_query,
       qk_prod_scaling, position_bias;
   int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
   int qoSeqLength, kvSeqLength;
@@ -154,11 +154,11 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
                                 int _vProjSize,
                                 int _oProjSize,
                                 bool _apply_rotary_embedding,
-                                bool _bias,
+                                bool _qkv_bias,
                                 bool _scaling_query,
                                 bool _qk_prod_scaling,
                                 bool _position_bias,
-                                bool _add_bias_kv,
+                                bool _final_bias,
                                 float _scaling_factor,
                                 GenericTensorAccessorR const &weight,
                                 MemoryAllocator &gpu_mem_allocator,
@@ -179,7 +179,8 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
   int global_num_q_heads, global_num_kv_heads, num_q_heads, num_kv_heads;
   bool *has_load_weights;
   bool *apply_rotary_embedding;
-  bool *bias;
+  bool *qkv_bias;
+  bool *final_bias;
   bool *scaling_query;
   bool *qk_prod_scaling;
   bool *position_bias;
diff --git a/include/flexflow/ops/inc_multihead_self_attention_params.h b/include/flexflow/ops/inc_multihead_self_attention_params.h
index 202ff70bc9..7ae39f1cfe 100644
--- a/include/flexflow/ops/inc_multihead_self_attention_params.h
+++ b/include/flexflow/ops/inc_multihead_self_attention_params.h
@@ -1,6 +1,7 @@
 #ifndef _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_PARAMS_H
 #define _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_PARAMS_H
 
+#include "flexflow/ffconst.h"
 #include "flexflow/fftype.h"
 #include "flexflow/parallel_tensor.h"
 
@@ -11,8 +12,8 @@ struct IncMultiHeadSelfAttentionParams {
   int embed_dim, num_q_heads, kdim, vdim, num_kv_heads,
       tensor_parallelism_degree;
   float dropout, scaling_factor;
-  bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
-      qk_prod_scaling, position_bias;
+  bool qkv_bias, final_bias, add_zero_attn, apply_rotary_embedding,
+      scaling_query, qk_prod_scaling, position_bias;
   DataType quantization_type;
   bool offload;
   bool is_valid(ParallelTensorShape const &) const;
diff --git a/include/flexflow/ops/layer_norm_params.h b/include/flexflow/ops/layer_norm_params.h
index 509593c285..c9aa40048d 100644
--- a/include/flexflow/ops/layer_norm_params.h
+++ b/include/flexflow/ops/layer_norm_params.h
@@ -1,5 +1,7 @@
 #pragma once
 
+#include "flexflow/ffconst.h"
+#include "flexflow/fftype.h"
 #include "flexflow/parallel_tensor.h"
 
 namespace FlexFlow {
diff --git a/include/flexflow/ops/reduce_params.h b/include/flexflow/ops/reduce_params.h
index a4777f2be9..b79ba9157a 100644
--- a/include/flexflow/ops/reduce_params.h
+++ b/include/flexflow/ops/reduce_params.h
@@ -1,5 +1,7 @@
 #pragma once
 
+#include "flexflow/ffconst.h"
+#include "flexflow/fftype.h"
 #include "flexflow/parallel_tensor.h"
 
 namespace FlexFlow {
diff --git a/include/flexflow/ops/reshape_params.h b/include/flexflow/ops/reshape_params.h
index f6aa4f8c51..ffd88948ea 100644
--- a/include/flexflow/ops/reshape_params.h
+++ b/include/flexflow/ops/reshape_params.h
@@ -1,6 +1,8 @@
 #ifndef _FLEXFLOW_RESHAPE_PARAMS_H
 #define _FLEXFLOW_RESHAPE_PARAMS_H
 
+#include "flexflow/ffconst.h"
+#include "flexflow/fftype.h"
 #include "flexflow/parallel_tensor.h"
 
 namespace FlexFlow {
diff --git a/include/flexflow/ops/rms_norm_params.h b/include/flexflow/ops/rms_norm_params.h
index 82a459009a..81295322f0 100644
--- a/include/flexflow/ops/rms_norm_params.h
+++ b/include/flexflow/ops/rms_norm_params.h
@@ -1,6 +1,8 @@
 #ifndef _FLEXFLOW_RMSNORM_PARAMS_H
 #define _FLEXFLOW_RMSNORM_PARAMS_H
 
+#include "flexflow/ffconst.h"
+#include "flexflow/fftype.h"
 #include "flexflow/parallel_tensor.h"
 
 namespace FlexFlow {
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention.h b/include/flexflow/ops/spec_inc_multihead_self_attention.h
index fa9251c871..363776cdb0 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention.h
@@ -33,8 +33,8 @@ class SpecIncMultiHeadSelfAttention : public Op {
                                 int _kdim,
                                 int _vdim,
                                 float _dropout,
-                                bool _bias,
-                                bool _add_bias_kv,
+                                bool _qkv_bias,
+                                bool _final_bias,
                                 bool _add_zero_attn,
                                 bool _apply_rotary_embedding,
                                 bool _scaling_query,
@@ -52,8 +52,8 @@ class SpecIncMultiHeadSelfAttention : public Op {
                                 int _kdim,
                                 int _vdim,
                                 float _dropout,
-                                bool _bias,
-                                bool _add_bias_kv,
+                                bool _qkv_bias,
+                                bool _final_bias,
                                 bool _add_zero_attn,
                                 bool _apply_rotary_embedding,
                                 bool _scaling_query,
@@ -120,8 +120,8 @@ class SpecIncMultiHeadSelfAttention : public Op {
 public:
   int num_q_heads, num_kv_heads, tensor_parallelism_degree;
   float dropout, scaling_factor;
-  bool bias;
-  bool add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
+  bool qkv_bias;
+  bool final_bias, add_zero_attn, apply_rotary_embedding, scaling_query,
       qk_prod_scaling, position_bias;
   int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
   int qoSeqLength, kvSeqLength;
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention_params.h b/include/flexflow/ops/spec_inc_multihead_self_attention_params.h
index b59a237e20..2f7a706bf1 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention_params.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention_params.h
@@ -1,6 +1,7 @@
 #ifndef _FLEXFLOW_SPEC_INC_MULTIHEAD_SELF_ATTENTION_PARAMS_H
 #define _FLEXFLOW_SPEC_INC_MULTIHEAD_SELF_ATTENTION_PARAMS_H
 
+#include "flexflow/ffconst.h"
 #include "flexflow/fftype.h"
 #include "flexflow/parallel_tensor.h"
 
@@ -10,8 +11,8 @@ struct SpecIncMultiHeadSelfAttentionParams {
   LayerID layer_guid;
   int embed_dim, num_q_heads, num_kv_heads, kdim, vdim;
   float dropout, scaling_factor;
-  bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
-      qk_prod_scaling, position_bias;
+  bool qkv_bias, final_bias, add_zero_attn, apply_rotary_embedding,
+      scaling_query, qk_prod_scaling, position_bias;
 
   bool is_valid(ParallelTensorShape const &) const;
 };
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention.h b/include/flexflow/ops/tree_inc_multihead_self_attention.h
index c4d7ae17e9..6e2da19ce9 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention.h
@@ -33,8 +33,8 @@ class TreeIncMultiHeadSelfAttention : public Op {
                                 int _kdim,
                                 int _vdim,
                                 float _dropout,
-                                bool _bias,
-                                bool _add_bias_kv,
+                                bool _qkv_bias,
+                                bool _final_bias,
                                 bool _add_zero_attn,
                                 bool _apply_rotary_embedding,
                                 bool _scaling_query,
@@ -55,8 +55,8 @@ class TreeIncMultiHeadSelfAttention : public Op {
                                 int _kdim,
                                 int _vdim,
                                 float _dropout,
-                                bool _bias,
-                                bool _add_bias_kv,
+                                bool _qkv_bias,
+                                bool _final_bias,
                                 bool _add_zero_attn,
                                 bool _apply_rotary_embedding,
                                 bool _scaling_query,
@@ -123,8 +123,8 @@ class TreeIncMultiHeadSelfAttention : public Op {
 public:
   int num_q_heads, num_kv_heads, tensor_parallelism_degree;
   float dropout, scaling_factor;
-  bool bias;
-  bool add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
+  bool qkv_bias;
+  bool final_bias, add_zero_attn, apply_rotary_embedding, scaling_query,
       qk_prod_scaling, position_bias;
   int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
   int qoSeqLength, kvSeqLength;
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention_params.h b/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
index a897c76162..14fcde74ba 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
@@ -1,6 +1,7 @@
 #ifndef _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_VERIFY_PARAMS_H
 #define _FLEXFLOW_INC_MULTIHEAD_SELF_ATTENTION_VERIFY_PARAMS_H
 
+#include "flexflow/ffconst.h"
 #include "flexflow/fftype.h"
 #include "flexflow/parallel_tensor.h"
 
@@ -11,8 +12,8 @@ struct TreeIncMultiHeadSelfAttentionParams {
   int embed_dim, num_q_heads, kdim, vdim, num_kv_heads,
       tensor_parallelism_degree;
   float dropout, scaling_factor;
-  bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding, scaling_query,
-      qk_prod_scaling, position_bias;
+  bool qkv_bias, final_bias, add_zero_attn, apply_rotary_embedding,
+      scaling_query, qk_prod_scaling, position_bias;
   DataType quantization_type;
   bool offload;
   bool is_valid(ParallelTensorShape const &) const;
diff --git a/include/flexflow/substitution_loader.h b/include/flexflow/substitution_loader.h
index 776fe2c78e..6dbb12e28b 100644
--- a/include/flexflow/substitution_loader.h
+++ b/include/flexflow/substitution_loader.h
@@ -125,6 +125,7 @@ NLOHMANN_JSON_SERIALIZE_ENUM(
      {OP_POW, "OP_POW"},
      {OP_MEAN, "OP_MEAN"},
      {OP_LAYERNORM, "OP_LAYERNORM"},
+     {OP_ADD_BIAS_RESIDUAL_LAYERNORM, "OP_ADD_BIAS_RESIDUAL_LAYERNORM"},
      {OP_RMS_NORM, "OP_RMS_NORM"},
      {OP_REPARTITION, "OP_PARTITION"},
      {OP_COMBINE, "OP_COMBINE"},
diff --git a/inference/file_loader.cc b/inference/file_loader.cc
index 78f190dad6..5b92f31552 100644
--- a/inference/file_loader.cc
+++ b/inference/file_loader.cc
@@ -22,14 +22,14 @@ using namespace std;
 
 using namespace Legion;
 
-FileDataLoader::FileDataLoader(std::string _input_path,
-                               std::string _weight_file_path,
+FileDataLoader::FileDataLoader(std::string _prompts_filepath,
+                               std::string _weights_folder,
                                int _num_heads,
                                int _num_kv_heads,
                                size_t _hidden_dim,
                                size_t _qkv_inner_dim,
                                int _tensor_parallelism_degree)
-    : input_path(_input_path), weight_file_path(_weight_file_path),
+    : prompts_filepath(_prompts_filepath), weights_folder(_weights_folder),
       num_heads(_num_heads), num_kv_heads(_num_kv_heads),
       hidden_dim(_hidden_dim), qkv_inner_dim(_qkv_inner_dim),
       tensor_parallelism_degree(_tensor_parallelism_degree){};
@@ -38,7 +38,7 @@ BatchConfig::TokenId *FileDataLoader::generate_requests(int num, int length) {
 
   BatchConfig::TokenId *prompts =
       (BatchConfig::TokenId *)malloc(sizeof(BatchConfig::TokenId) * 40);
-  std::ifstream in(input_path, std::ios::in | std::ios::binary);
+  std::ifstream in(prompts_filepath, std::ios::in | std::ios::binary);
   int size = num * length;
   std::vector<long> host_array(size);
   size_t loaded_data_size = sizeof(long) * size;
@@ -64,33 +64,46 @@ BatchConfig::TokenId *FileDataLoader::generate_requests(int num, int length) {
   return prompts;
 };
 
+std::string removeGuidOperatorName(std::string const &input) {
+  // Find the last underscore in the string
+  size_t underscorePos = input.find_last_of('_');
+
+  if (underscorePos != std::string::npos) {
+    // Remove the underscore and the characters after it
+    return input.substr(0, underscorePos);
+  } else {
+    // No underscore found, return the original string
+    return input;
+  }
+}
+
 template <typename DT>
 void load_attention_weights_multi_query(DT *ptr,
                                         std::string layer_name,
-                                        std::string weight_path,
+                                        std::string weights_folder,
                                         size_t hidden_dim,
                                         int num_heads) {
 
-  std::string qkv_file = weight_path +
-                         layer_name.substr(0, layer_name.find("attention")) +
+  std::string qkv_file = layer_name.substr(0, layer_name.find("attention")) +
                          "attention_query_key_value_weight";
-  std::string o_file = weight_path +
-                       layer_name.substr(0, layer_name.find("attention")) +
+  std::string o_file = layer_name.substr(0, layer_name.find("attention")) +
                        "attention_dense_weight";
 
   // q has n_heads heads, k and v only have one head, o have n_head heads
-  std::vector<std::string> weight_files = {qkv_file, o_file};
+  std::vector<std::string> weight_filenames = {qkv_file, o_file};
   int file_index = 0;
   int data_index = 0;
-  for (auto file : weight_files) {
+  for (auto filename : weight_filenames) {
+    std::cout << "Loading weight file " << filename << std::endl;
+    std::string weight_filepath = join_path({weights_folder, filename});
     size_t partial_size =
         file_index == 0 ? (hidden_dim + 2 * hidden_dim / num_heads) * hidden_dim
                         : hidden_dim * hidden_dim;
 
-    std::ifstream in(file, std::ios::in | std::ios::binary);
-    // std::cout << "Loading filename: " << file << std::endl;
+    std::ifstream in(weight_filepath, std::ios::in | std::ios::binary);
+    // std::cout << "Loading filename: " << weight_filepath << std::endl;
     if (!in.good()) {
-      std::cout << "Could not open file: " << file << std::endl;
+      std::cout << "Could not open file: " << weight_filepath << std::endl;
     }
     assert(in.good() && "incorrect weight file path");
     std::vector<DT> host_array(partial_size);
@@ -118,21 +131,17 @@ void load_attention_bias_v2(DT *ptr,
                             int num_kv_heads,
                             size_t hidden_dim,
                             size_t qkv_inner_dim,
+                            bool final_bias,
                             std::string layer_name,
-                            std::string weight_path) {
-  std::string q_file = weight_path +
-                       layer_name.substr(0, layer_name.find("attention")) +
-                       "attention_wq_bias";
-  std::string k_file = weight_path +
-                       layer_name.substr(0, layer_name.find("attention")) +
-                       "attention_wk_bias";
-  std::string v_file = weight_path +
-                       layer_name.substr(0, layer_name.find("attention")) +
-                       "attention_wv_bias";
-  std::string o_file = weight_path +
-                       layer_name.substr(0, layer_name.find("attention")) +
-                       "attention_wo_bias";
-  std::vector<std::string> bias_files = {q_file, k_file, v_file, o_file};
+                            std::string weights_folder) {
+  std::string q_file = layer_name + "_wq_bias";
+  std::string k_file = layer_name + "_wk_bias";
+  std::string v_file = layer_name + "_wv_bias";
+  std::vector<std::string> bias_files = {q_file, k_file, v_file};
+  if (final_bias) {
+    std::string o_file = layer_name + "_wo_bias";
+    bias_files.push_back(o_file);
+  }
 
   int file_index = 0;
 
@@ -140,13 +149,16 @@ void load_attention_bias_v2(DT *ptr,
   // assert(num_heads == num_kv_heads);
   int idx = 0;
 
-  for (auto file : bias_files) {
+  for (auto filename : bias_files) {
+    std::cout << "Loading weight file " << filename << std::endl;
+    std::string weight_filepath = join_path({weights_folder, filename});
+
     int n_heads = file_index == 0 ? num_heads : num_kv_heads;
     size_t qkv_partial_size = qkv_inner_dim * n_heads;
     size_t out_partial_size = hidden_dim;
     size_t partial_size =
         (file_index < 3) ? qkv_partial_size : out_partial_size;
-    std::ifstream in(file, std::ios::in | std::ios::binary);
+    std::ifstream in(weight_filepath, std::ios::in | std::ios::binary);
     assert(in.good() && "incorrect bias file path");
     std::vector<DT> host_array(partial_size);
     size_t loaded_data_size = sizeof(DT) * partial_size;
@@ -185,24 +197,16 @@ void load_attention_weights_v2(DT *ptr,
                                size_t hidden_dim,
                                size_t qkv_inner_dim,
                                std::string layer_name,
-                               std::string weight_path,
+                               std::string weights_folder,
                                size_t volume,
                                int tensor_parallelism_degree) {
   // layers_0_attention_wq_weight
   // layers_0_self_attn_q_proj_weight
-  std::string q_file = weight_path +
-                       layer_name.substr(0, layer_name.find("attention")) +
-                       "attention_wq_weight";
-  std::string k_file = weight_path +
-                       layer_name.substr(0, layer_name.find("attention")) +
-                       "attention_wk_weight";
-  std::string v_file = weight_path +
-                       layer_name.substr(0, layer_name.find("attention")) +
-                       "attention_wv_weight";
-  std::string o_file = weight_path +
-                       layer_name.substr(0, layer_name.find("attention")) +
-                       "attention_wo_weight";
-  std::vector<std::string> weight_files = {q_file, k_file, v_file};
+  std::string q_file = layer_name + "_wq_weight";
+  std::string k_file = layer_name + "_wk_weight";
+  std::string v_file = layer_name + "_wv_weight";
+  std::string o_file = layer_name + "_wo_weight";
+  std::vector<std::string> weight_filenames = {q_file, k_file, v_file};
   int file_index = 0;
 
   int base_index = 0;
@@ -219,16 +223,19 @@ void load_attention_weights_v2(DT *ptr,
   // stride for q, k, v, o
   size_t stride_size =
       (q_size + v_size + k_size + o_size) / tensor_parallelism_degree;
-  for (auto file : weight_files) {
+  for (auto filename : weight_filenames) {
+    std::cout << "Loading weight file " << filename << std::endl;
+    std::string weight_filepath = join_path({weights_folder, filename});
+
     int data_index = 0;
     size_t partial_size = (file_index == 0 || file_index == 3)
                               ? one_weight_file_size
                               : single_proj_size * num_kv_heads;
     size_t one_partition_size = partial_size / tensor_parallelism_degree;
 
-    std::ifstream in(file, std::ios::in | std::ios::binary);
+    std::ifstream in(weight_filepath, std::ios::in | std::ios::binary);
     if (!in.good()) {
-      std::cout << "Could not open file: " << file << std::endl;
+      std::cout << "Could not open file: " << weight_filepath << std::endl;
     }
     assert(in.good() && "incorrect weight file path");
     std::vector<DT> host_array(partial_size);
@@ -240,8 +247,8 @@ void load_attention_weights_v2(DT *ptr,
 
     if (in_get_size != loaded_data_size) {
       std::cout << "load attention data error " << in_get_size << ", "
-                << loaded_data_size << ", " << file_index << ", " << file
-                << "\n";
+                << loaded_data_size << ", " << file_index << ", "
+                << weight_filepath << "\n";
       assert(false && "data size mismatch");
     }
     // wq, wk, wo
@@ -257,9 +264,12 @@ void load_attention_weights_v2(DT *ptr,
   assert(base_index == (q_size + k_size + v_size) / tensor_parallelism_degree);
 
   {
-    std::ifstream in(o_file, std::ios::in | std::ios::binary);
+    std::cout << "Loading weight file " << o_file << std::endl;
+    std::string weight_filepath = join_path({weights_folder, o_file});
+
+    std::ifstream in(weight_filepath, std::ios::in | std::ios::binary);
     if (!in.good()) {
-      std::cout << "Could not open file: " << o_file << std::endl;
+      std::cout << "Could not open file: " << weight_filepath << std::endl;
     }
     assert(in.good() && "incorrect weight file path");
     std::vector<DT> host_array(one_weight_file_size);
@@ -294,10 +304,10 @@ void load_attention_weights_v2(DT *ptr,
 }
 
 template <typename DT>
-void load_from_file(DT *ptr, size_t size, std::string filename) {
-  std::ifstream in(filename, std::ios::in | std::ios::binary);
+void load_from_file(DT *ptr, size_t size, std::string filepath) {
+  std::ifstream in(filepath, std::ios::in | std::ios::binary);
   if (!in.good()) {
-    std::cout << "Could not open file: " << filename << std::endl;
+    std::cout << "Could not open file: " << filepath << std::endl;
   }
   assert(in.good() && "incorrect weight file path");
   std::vector<DT> host_array(size);
@@ -357,24 +367,16 @@ void load_attention_weights_quantized(char *ptr,
                                       size_t hidden_dim,
                                       size_t qkv_inner_dim,
                                       std::string layer_name,
-                                      std::string weight_path,
+                                      std::string weights_folder,
                                       DataType data_type,
                                       bool use_full_precision) {
   // layers_0_attention_wq_weight
   // layers_0_self_attn_q_proj_weight
-  std::string q_file = weight_path +
-                       layer_name.substr(0, layer_name.find("attention")) +
-                       "attention_wq_weight";
-  std::string k_file = weight_path +
-                       layer_name.substr(0, layer_name.find("attention")) +
-                       "attention_wk_weight";
-  std::string v_file = weight_path +
-                       layer_name.substr(0, layer_name.find("attention")) +
-                       "attention_wv_weight";
-  std::string o_file = weight_path +
-                       layer_name.substr(0, layer_name.find("attention")) +
-                       "attention_wo_weight";
-  std::vector<std::string> weight_files = {q_file, k_file, v_file, o_file};
+  std::string q_file = layer_name + "_wq_weight";
+  std::string k_file = layer_name + "_wk_weight";
+  std::string v_file = layer_name + "_wv_weight";
+  std::string o_file = layer_name + "_wo_weight";
+  std::vector<std::string> weight_filenames = {q_file, k_file, v_file, o_file};
 
   int file_index = 0;
 
@@ -385,11 +387,14 @@ void load_attention_weights_quantized(char *ptr,
       num_heads * single_proj_size; // size of each of Q/K/V/O for all heads
 
   // q, k, v, o -> 0, 1, 2, 3
-  for (auto file : weight_files) {
+  for (auto filename : weight_filenames) {
+    std::cout << "Loading weight file " << filename << std::endl;
+    std::string weight_filepath = join_path({weights_folder, filename});
+
     size_t partial_size = one_weight_file_size;
-    std::ifstream in(file, std::ios::in | std::ios::binary);
+    std::ifstream in(weight_filepath, std::ios::in | std::ios::binary);
     if (!in.good()) {
-      std::cout << "Could not open file: " << file << std::endl;
+      std::cout << "Could not open file: " << weight_filepath << std::endl;
     }
     assert(in.good() && "incorrect weight file path");
     std::vector<char> host_array(partial_size);
@@ -432,9 +437,13 @@ void load_attention_weights_quantized(char *ptr,
   // the layout is like |values * 32 heads|offset|scale|
   size_t offset = data_type == DT_INT8 ? one_weight_file_size * 4
                                        : (one_weight_file_size * 4) / 2;
-  for (auto file : weight_files) {
+  for (auto filename : weight_filenames) {
+    std::cout << "Loading weight file " << filename << std::endl;
+    std::string weight_filepath = join_path({weights_folder, filename});
+
     for (int i = 0; i < 2; i++) {
-      std::string meta_file = i == 0 ? (file + "_offset") : (file + "_scale");
+      std::string meta_file =
+          i == 0 ? (weight_filepath + "_offset") : (weight_filepath + "_scale");
       size_t partial_size =
           one_weight_file_size / INT4_NUM_OF_ELEMENTS_PER_GROUP;
       std::ifstream in(meta_file, std::ios::in | std::ios::binary);
@@ -605,30 +614,30 @@ void load_from_quantized_file(char *ptr,
 }
 
 void FileDataLoader::load_quantization_weight(FFModel *ff,
-                                              Tensor weight,
+                                              Layer *l,
                                               int weight_idx,
-                                              std::string const &layername,
                                               bool use_full_precision) {
+  Tensor weight = l->weights[weight_idx];
   size_t volume = 1;
   std::vector<int> dims_vec;
   for (int i = 0; i < weight->num_dims; i++) {
     dims_vec.push_back(weight->dims[i]);
     volume *= weight->dims[i];
   }
-
   char *data = (char *)malloc(sizeof(char) * volume);
 
-  std::string file_path =
-      (layername.back() == '/') ? layername : "/" + layername;
+  std::string weight_filename = removeGuidOperatorName(std::string(l->name));
 
-  if (file_path.find("attention_w") != std::string::npos) {
+  if (weight_filename.find("attention") != std::string::npos &&
+      weight_filename.rfind("attention") ==
+          weight_filename.length() - strlen("attention")) {
     if (weight_idx == 0) {
       load_attention_weights_quantized(data,
                                        num_heads,
                                        hidden_dim,
                                        qkv_inner_dim,
-                                       file_path,
-                                       weight_file_path,
+                                       weight_filename,
+                                       weights_folder,
                                        weight->data_type,
                                        use_full_precision);
     }
@@ -637,19 +646,20 @@ void FileDataLoader::load_quantization_weight(FFModel *ff,
     //                                 num_heads,
     //                                 hidden_dim,
     //                                 qkv_inner_dim,
-    //                                 file_path,
-    //                                 weight_file_path);
+    //                                 weight_filename,
+    //                                 weights_folder);
     // }
 
   } else {
     if (weight_idx > 0) {
-      int index = file_path.find("_weight");
-      assert(index != std::string::npos);
-      file_path = file_path.substr(0, index) + "_bias";
+      assert(weight_idx == 0 || weight_idx == 1);
+      if (weight_filename != "embed_tokens_weight_lm_head") {
+        weight_filename += weight_idx == 0 ? "_weight" : "_bias";
+      }
     }
     load_from_quantized_file(data,
                              volume,
-                             weight_file_path + file_path,
+                             join_path({weights_folder, weight_filename}),
                              weight->data_type,
                              use_full_precision);
   }
@@ -663,86 +673,108 @@ void FileDataLoader::load_quantization_weight(FFModel *ff,
 
 template <typename DT>
 void FileDataLoader::load_single_weight_tensor(FFModel *ff,
-                                               Tensor weight,
-                                               int weight_idx,
-                                               std::string const &layername) {
+                                               Layer *l,
+                                               int weight_idx) {
+  Tensor weight = l->weights[weight_idx];
+
+  // Create a buffer to store weight data from the file
   size_t volume = 1;
   std::vector<int> dims_vec;
   for (int i = 0; i < weight->num_dims; i++) {
     dims_vec.push_back(weight->dims[i]);
     volume *= weight->dims[i];
   }
-
-  std::cout << "load weights: " << layername << "\n";
-
   assert(data_type_size(weight->data_type) == sizeof(DT));
   DT *data = (DT *)malloc(sizeof(DT) * volume);
 
-  std::string file_path =
-      (layername.back() == '/') ? layername : "/" + layername;
+  std::string weight_filename = removeGuidOperatorName(std::string(l->name));
+
+  if (l->op_type == OP_INC_MULTIHEAD_SELF_ATTENTION ||
+      l->op_type == OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION ||
+      l->op_type == OP_TREE_INC_MULTIHEAD_SELF_ATTENTION) {
+    if (weight_filename.find("self_attention") != std::string::npos) {
+      load_attention_weights_multi_query(
+          data, weight_filename, weights_folder, hidden_dim, num_heads);
+    } else if (weight_filename.find("attention") != std::string::npos &&
+               weight_filename.rfind("attention") ==
+                   weight_filename.length() - strlen("attention")) {
+      if (weight_idx == 0) {
+        load_attention_weights_v2(data,
+                                  num_heads,
+                                  num_kv_heads,
+                                  hidden_dim,
+                                  qkv_inner_dim,
+                                  weight_filename,
+                                  weights_folder,
+                                  volume,
+                                  tensor_parallelism_degree);
+      } else {
+        long long value;
+        l->get_int_property("final_bias", value);
+        bool final_bias = (bool)value;
+        load_attention_bias_v2(data,
+                               num_heads,
+                               num_kv_heads,
+                               hidden_dim,
+                               qkv_inner_dim,
+                               final_bias,
+                               weight_filename,
+                               weights_folder);
+      }
 
-  if (file_path.find("attention_w") != std::string::npos) {
-    if (weight_idx == 0) {
-      load_attention_weights_v2(data,
-                                num_heads,
-                                num_kv_heads,
-                                hidden_dim,
-                                qkv_inner_dim,
-                                file_path,
-                                weight_file_path,
-                                volume,
-                                tensor_parallelism_degree);
     } else {
-      load_attention_bias_v2(data,
-                             num_heads,
-                             num_kv_heads,
-                             hidden_dim,
-                             qkv_inner_dim,
-                             file_path,
-                             weight_file_path);
+      assert(false);
     }
-
-  } else if (file_path.find("self_attention") != std::string::npos) {
-    load_attention_weights_multi_query(
-        data, file_path, weight_file_path, hidden_dim, num_heads);
+  } else if (l->op_type == OP_ADD_BIAS_RESIDUAL_LAYERNORM) {
+    assert(weight_idx >= 0 || weight_idx <= 2);
+    weight_filename += (weight_idx == 0)
+                           ? "_attn_bias"
+                           : ((weight_idx == 1) ? "_weight" : "_bias");
+    std::cout << "Loading weight file " << weight_filename << std::endl;
+    std::string weight_filepath = join_path({weights_folder, weight_filename});
+    load_from_file(data, volume, weight_filepath);
   } else {
-    if (weight_idx > 0) {
-      int index = file_path.find("_weight");
-      assert(index != std::string::npos);
-      file_path = file_path.substr(0, index) + "_bias";
+    // default op
+    assert(weight_idx == 0 || weight_idx == 1);
+    // handle exception
+    if (weight_filename != "embed_tokens_weight_lm_head") {
+      weight_filename += weight_idx == 0 ? "_weight" : "_bias";
     }
-    load_from_file(data, volume, weight_file_path + file_path);
+    std::cout << "Loading weight file " << weight_filename << std::endl;
+    std::string weight_filepath = join_path({weights_folder, weight_filename});
+    load_from_file(data, volume, weight_filepath);
   }
 
+  // Copy the weight data from the buffer to the weight's ParallelTensor
   ParallelTensor weight_pt;
   ff->get_parallel_tensor_from_tensor(weight, weight_pt);
   weight_pt->set_tensor<DT>(ff, dims_vec, data);
 
+  // Free buffer memory
   delete data;
 }
 
-void FileDataLoader::load_weights(
-    FFModel *ff,
-    std::unordered_map<std::string, Layer *> weights_layers,
-    bool use_full_precision) {
-  for (auto &v : weights_layers) {
-    int weights_num = v.second->numWeights;
-    for (int i = 0; i < weights_num; i++) {
-      Tensor weight = v.second->weights[i];
+void FileDataLoader::load_weights(FFModel *ff, bool use_full_precision) {
+  for (Layer *l : ff->layers) {
+    if (l->numWeights < 1 || !l->name || strlen(l->name) < 1) {
+      continue;
+    }
+    for (int i = 0; i < l->numWeights; i++) {
+      Tensor weight = l->weights[i];
       if (weight == NULL) {
         continue;
       }
       switch (weight->data_type) {
         case DT_HALF:
-          load_single_weight_tensor<half>(ff, weight, i, v.first);
+          load_single_weight_tensor<half>(ff, l, i);
           break;
         case DT_FLOAT:
-          load_single_weight_tensor<float>(ff, weight, i, v.first);
+          load_single_weight_tensor<float>(ff, l, i);
           break;
         case DT_INT4:
         case DT_INT8:
           // load weights in quantization
-          load_quantization_weight(ff, weight, i, v.first, use_full_precision);
+          load_quantization_weight(ff, l, i, use_full_precision);
           break;
         default:
           assert(false && "Unsupported data type");
diff --git a/inference/file_loader.h b/inference/file_loader.h
index aaef861d09..6f01a79b80 100644
--- a/inference/file_loader.h
+++ b/inference/file_loader.h
@@ -24,8 +24,8 @@ using namespace FlexFlow;
 
 class FileDataLoader {
 public:
-  FileDataLoader(std::string _input_path,
-                 std::string _weight_file_path,
+  FileDataLoader(std::string _prompts_filepath,
+                 std::string _weights_folder,
                  int _num_heads,
                  int _num_kv_heads,
                  size_t _hidden_dim,
@@ -35,19 +35,13 @@ class FileDataLoader {
   BatchConfig::TokenId *generate_requests(int num, int length);
 
   template <typename DT>
-  void load_single_weight_tensor(FFModel *ff,
-                                 Tensor weight,
-                                 int weight_idx,
-                                 std::string const &layername);
+  void load_single_weight_tensor(FFModel *ff, Layer *l, int weight_idx);
 
   void load_quantization_weight(FFModel *ff,
-                                Tensor weight,
+                                Layer *l,
                                 int weight_idx,
-                                std::string const &layername,
                                 bool use_full_precision);
-  void load_weights(FFModel *ff,
-                    std::unordered_map<std::string, Layer *> weights_layers,
-                    bool use_full_precision);
+  void load_weights(FFModel *ff, bool use_full_precision);
 
   void load_positions(FFModel *ff,
                       Tensor pt,
@@ -58,6 +52,6 @@ class FileDataLoader {
 private:
   int num_heads, num_kv_heads, tensor_parallelism_degree;
   size_t hidden_dim, qkv_inner_dim;
-  std::string input_path;
-  std::string weight_file_path;
+  std::string prompts_filepath;
+  std::string weights_folder;
 };
diff --git a/inference/models/falcon.cc b/inference/models/falcon.cc
index a26a6eaf4b..72cbd8d551 100644
--- a/inference/models/falcon.cc
+++ b/inference/models/falcon.cc
@@ -92,13 +92,14 @@ void FALCON::create_falcon_model(FFModel &ff,
             falcon_config.n_head_kv,
             falcon_config.hidden_size / falcon_config.n_head,
             falcon_config.hidden_size / falcon_config.n_head,
-            0.0f,
-            false,
-            false,
-            false,
-            DT_NONE,
-            NULL,
-            true);
+            0.0f,    /*dropout*/
+            false,   /*qkv_bias*/
+            false,   /*final_bias*/
+            false,   /*add_zero_attn*/
+            DT_NONE, /*data_type*/
+            NULL,    /*kernel_initializer*/
+            true     /*apply_rotary_embedding*/
+        );
         break;
       }
 
@@ -111,8 +112,8 @@ void FALCON::create_falcon_model(FFModel &ff,
             falcon_config.hidden_size / falcon_config.n_head,
             falcon_config.hidden_size / falcon_config.n_head,
             0.0f,    /*dropout*/
-            false,   /*bias*/
-            false,   /*add_bias_kv*/
+            false,   /*qkv_bias*/
+            false,   /*final_bias*/
             false,   /*add_zero_attn*/
             DT_NONE, /*data_type*/
             nullptr, /*kernel_initializer*/
@@ -130,8 +131,8 @@ void FALCON::create_falcon_model(FFModel &ff,
             falcon_config.hidden_size / falcon_config.n_head,
             falcon_config.hidden_size / falcon_config.n_head,
             0.0f,    /*dropout*/
-            false,   /*bias*/
-            false,   /*add_bias_kv*/
+            false,   /*qkv_bias*/
+            false,   /*final_bias*/
             false,   /*add_zero_attn*/
             DT_NONE, /*data_type*/
             nullptr, /*kernel_initializer*/
@@ -200,7 +201,7 @@ void FALCON::create_falcon_model(FFModel &ff,
                             falcon_config.hidden_size / falcon_config.n_head,
                             ff.config.tensor_parallelism_degree);
   std::cout << "------laod weights ----------" << std::endl;
-  fileloader.load_weights(&ff, weights_layers, use_full_precision);
+  fileloader.load_weights(&ff, use_full_precision);
   std::cout << "------load weight finished----------" << std::endl;
 
   // init operators
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index e2eabec341..463c96527b 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -91,13 +91,14 @@ void LLAMA::create_llama_model(FFModel &ff,
             llama_config.num_attention_heads,
             llama_config.hidden_size / llama_config.num_attention_heads,
             llama_config.hidden_size / llama_config.num_attention_heads,
-            0.0f,
-            false,
-            false,
-            false,
-            DT_NONE,
-            NULL,
-            true);
+            0.0f,    /*dropout*/
+            false,   /*qkv_bias*/
+            false,   /*final_bias*/
+            false,   /*add_zero_attn*/
+            DT_NONE, /*data_type*/
+            NULL,    /*kernel_initializer*/
+            true     /*apply_rotary_embedding*/
+        );
         break;
       }
       case TREE_VERIFY_MODE: {
@@ -108,8 +109,8 @@ void LLAMA::create_llama_model(FFModel &ff,
             llama_config.hidden_size / llama_config.num_attention_heads,
             llama_config.hidden_size / llama_config.num_attention_heads,
             0.0f,    /*dropout*/
-            false,   /*bias*/
-            false,   /*add_bias_kv*/
+            false,   /*qkv_bias*/
+            false,   /*final_bias*/
             false,   /*add_zero_attn*/
             DT_NONE, /*data_type*/
             nullptr, /*kernel_initializer*/
@@ -125,8 +126,8 @@ void LLAMA::create_llama_model(FFModel &ff,
             llama_config.hidden_size / llama_config.num_attention_heads,
             llama_config.hidden_size / llama_config.num_attention_heads,
             0.0f,    /*dropout*/
-            false,   /*bias*/
-            false,   /*add_bias_kv*/
+            false,   /*qkv_bias*/
+            false,   /*final_bias*/
             false,   /*add_zero_attn*/
             DT_NONE, /*data_type*/
             nullptr, /*kernel_initializer*/
@@ -212,7 +213,7 @@ void LLAMA::create_llama_model(FFModel &ff,
                             llama_config.hidden_size /
                                 llama_config.num_attention_heads,
                             ff.config.tensor_parallelism_degree);
-  fileloader.load_weights(&ff, weights_layers, use_full_precision);
+  fileloader.load_weights(&ff, use_full_precision);
   std::cout << "------load weight finished----------" << std::endl;
 
   // init operators
diff --git a/inference/models/mpt.cc b/inference/models/mpt.cc
index d1ca03a335..1ef15654b3 100644
--- a/inference/models/mpt.cc
+++ b/inference/models/mpt.cc
@@ -208,7 +208,7 @@ void MPT::create_mpt_model(FFModel &ff,
                             mpt_config.hidden_size,
                             mpt_config.hidden_size / mpt_config.n_heads,
                             ff.config.tensor_parallelism_degree);
-  fileloader.load_weights(&ff, weights_layers, use_full_precision);
+  fileloader.load_weights(&ff, use_full_precision);
   im->init_operators_inference(&ff);
 }
 
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index 9b3670ed89..5afef5e3a6 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -58,7 +58,8 @@ void OPT::create_opt_model(FFModel &ff,
                          AGGR_MODE_NONE,
                          DT_FLOAT,
                          NULL,
-                         embed_init);
+                         embed_init,
+                         "embed_tokens");
   } else {
     token = ff.embedding(input,
                          opt_config.vocab_size,
@@ -66,12 +67,10 @@ void OPT::create_opt_model(FFModel &ff,
                          AGGR_MODE_NONE,
                          DT_HALF,
                          NULL,
-                         embed_init);
+                         embed_init,
+                         "embed_tokens");
   }
 
-  Layer *embedding = ff.layers.back();
-  weights_layers.emplace("embed_tokens_weight", embedding);
-
   Tensor positional_embedding;
   if (use_full_precision) {
     positional_embedding = ff.embedding(position_input,
@@ -80,7 +79,8 @@ void OPT::create_opt_model(FFModel &ff,
                                         AGGR_MODE_NONE,
                                         DT_FLOAT,
                                         NULL,
-                                        embed_init);
+                                        embed_init,
+                                        "embed_positions");
   } else {
     positional_embedding = ff.embedding(position_input,
                                         opt_config.max_position_embeddings,
@@ -88,10 +88,9 @@ void OPT::create_opt_model(FFModel &ff,
                                         AGGR_MODE_NONE,
                                         DT_HALF,
                                         NULL,
-                                        embed_init);
+                                        embed_init,
+                                        "embed_positions");
   }
-  Layer *pos_embedding = ff.layers.back();
-  weights_layers.emplace("embed_positions_weight", pos_embedding);
 
   Tensor residual = ff.add(token, positional_embedding);
 
@@ -104,14 +103,19 @@ void OPT::create_opt_model(FFModel &ff,
     // https://github.com/huggingface/transformers/blob/main/src/transformers/models/opt/modeling_opt.py#LL324C1-L325C1
     // this version is before normalization
 
-    Tensor hidden_states = ff.layer_norm(
-        residual, axes, opt_config.layer_norm_elementwise_affine, 1e-05);
-    Layer *self_attn_layer_norm = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) +
-                               "_attention_layer_norm_weight",
-                           self_attn_layer_norm);
+    std::string layer_name =
+        "layers_" + std::to_string(i) + "_attention_layer_norm";
+    Tensor hidden_states =
+        ff.layer_norm(residual,
+                      axes,
+                      opt_config.layer_norm_elementwise_affine,
+                      1e-05,
+                      true,
+                      DT_NONE,
+                      layer_name.c_str());
 
     Tensor mha;
+    layer_name = "layers_" + std::to_string(i) + "_attention";
     switch (mode) {
       case BEAM_SEARCH_MODE: {
         mha = ff.spec_inc_multihead_self_attention(
@@ -120,18 +124,20 @@ void OPT::create_opt_model(FFModel &ff,
             opt_config.num_attention_heads,
             opt_config.hidden_size / opt_config.num_attention_heads,
             opt_config.hidden_size / opt_config.num_attention_heads,
-            0.0f,
-            true,
-            false,
-            false,
+            0.0f,    /*dropout*/
+            true,    /*qkv_bias*/
+            false,   /*final_bias*/
+            false,   /*add_zero_attn*/
             DT_NONE, /*data_type*/
-            NULL,
-            false,
-            /*scaling query*/ true,
-            /*scaling factor*/
+            NULL,    /*kernel_initializer*/
+            false,   /*apply_rotary_embedding*/
+            true,    /*scaling query*/
             pow((opt_config.hidden_size / opt_config.num_attention_heads),
-                -0.5),
-            /*qk_prod_scaling*/ false);
+                -0.5),         /*scaling factor*/
+            false,             /*qk_prod_scaling*/
+            false,             /*position_bias*/
+            layer_name.c_str() /*name*/
+        );
         break;
       }
       case TREE_VERIFY_MODE: {
@@ -141,18 +147,20 @@ void OPT::create_opt_model(FFModel &ff,
             opt_config.num_attention_heads,
             opt_config.hidden_size / opt_config.num_attention_heads,
             opt_config.hidden_size / opt_config.num_attention_heads,
-            0.0f,
-            true,
-            false,
-            false,
+            0.0f,    /*dropout*/
+            true,    /*qkv_bias*/
+            false,   /*final_bias*/
+            false,   /*add_zero_attn*/
             DT_NONE, /*data_type*/
-            NULL,
-            false,
-            /*scaling query*/ true,
-            /*scaling factor*/
+            NULL,    /*kernel_initializer*/
+            false,   /*apply_rotary_embedding*/
+            true,    /*scaling query*/
             pow((opt_config.hidden_size / opt_config.num_attention_heads),
-                -0.5),
-            /*qk_prod_scaling*/ false);
+                -0.5),         /*scaling factor*/
+            false,             /*qk_prod_scaling*/
+            false,             /*position_bias*/
+            layer_name.c_str() /*name*/
+        );
         break;
       }
       case INC_DECODING_MODE: {
@@ -162,18 +170,20 @@ void OPT::create_opt_model(FFModel &ff,
             opt_config.num_attention_heads,
             opt_config.hidden_size / opt_config.num_attention_heads,
             opt_config.hidden_size / opt_config.num_attention_heads,
-            0.0f,
-            true,
-            false,
-            false,
+            0.0f,    /*dropout*/
+            true,    /*qkv_bias*/
+            false,   /*final_bias*/
+            false,   /*add_zero_attn*/
             DT_NONE, /*data_type*/
-            NULL,
-            false,
-            /*scaling query*/ true,
-            /*scaling factor*/
+            NULL,    /*kernel_initializer*/
+            false,   /*apply_rotary_embedding*/
+            true,    /*scaling query*/
             pow((opt_config.hidden_size / opt_config.num_attention_heads),
-                -0.5),
-            /*qk_prod_scaling*/ false);
+                -0.5),         /*scaling factor*/
+            false,             /*qk_prod_scaling*/
+            false,             /*position_bias*/
+            layer_name.c_str() /*name*/
+        );
         break;
       }
       default: {
@@ -181,44 +191,75 @@ void OPT::create_opt_model(FFModel &ff,
       }
     }
 
-    Layer *attention_layer = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) + "_attention_weight",
-                           attention_layer);
-
-    Tensor added = ff.add(mha, residual);
+    // Tensor added = ff.add(mha, residual);
+    // Tensor final_norm = ff.layer_norm(
+    //     added, axes, opt_config.layer_norm_elementwise_affine, 1e-05);
 
-    Tensor final_norm = ff.layer_norm(
-        added, axes, opt_config.layer_norm_elementwise_affine, 1e-05);
-    Layer *final_layer_norm = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) +
-                               "_final_layer_norm_weight",
-                           final_layer_norm);
+    layer_name =
+        "layers_" + std::to_string(i) + "_add_bias_residual_layer_norm";
+    Tensor added_final_norm[2];
+    ff.add_bias_residual_layer_norm(mha,
+                                    residual,
+                                    added_final_norm,
+                                    axes,
+                                    opt_config.layer_norm_elementwise_affine,
+                                    1e-05,
+                                    true,
+                                    DT_NONE,
+                                    layer_name.c_str());
+    Tensor added = added_final_norm[0];
+    Tensor final_norm = added_final_norm[1];
 
     //--------linear fc1 fc2 ----------
-    Tensor fc1 = ff.dense(final_norm, opt_config.ffn_dim, AC_MODE_NONE, true);
-    Layer *fc1_linear = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) + "_fc1_weight",
-                           fc1_linear);
+    layer_name = "layers_" + std::to_string(i) + "_fc1";
+    Tensor fc1 = ff.dense(final_norm,
+                          opt_config.ffn_dim,
+                          AC_MODE_NONE,
+                          true,
+                          DT_NONE,
+                          nullptr,
+                          nullptr,
+                          nullptr,
+                          REG_MODE_NONE,
+                          0.0f,
+                          layer_name.c_str());
     Tensor activation = ff.relu(fc1, false);
-
-    Tensor fc2 =
-        ff.dense(activation, opt_config.hidden_size, AC_MODE_NONE, true);
-    Layer *fc2_linear = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) + "_fc2_weight",
-                           fc2_linear);
+    layer_name = "layers_" + std::to_string(i) + "_fc2";
+    Tensor fc2 = ff.dense(activation,
+                          opt_config.hidden_size,
+                          AC_MODE_NONE,
+                          true,
+                          DT_NONE,
+                          nullptr,
+                          nullptr,
+                          nullptr,
+                          REG_MODE_NONE,
+                          0.0f,
+                          layer_name.c_str());
     residual = ff.add(added, fc2);
   }
 
   // final
-  Tensor all_final_norm = ff.layer_norm(
-      residual, axes, opt_config.layer_norm_elementwise_affine, 1e-05);
-  Layer *all_final_norm_layer = ff.layers.back();
-  weights_layers.emplace("final_layer_norm_weight", all_final_norm_layer);
+  Tensor all_final_norm =
+      ff.layer_norm(residual,
+                    axes,
+                    opt_config.layer_norm_elementwise_affine,
+                    1e-05,
+                    true,
+                    DT_NONE,
+                    "final_layer_norm");
 
-  Tensor lm_head =
-      ff.dense(all_final_norm, opt_config.vocab_size, AC_MODE_NONE, false);
-  Layer *lm_head_layer = ff.layers.back();
-  weights_layers.emplace("embed_tokens_weight_lm_head", lm_head_layer);
+  Tensor lm_head = ff.dense(all_final_norm,
+                            opt_config.vocab_size,
+                            AC_MODE_NONE,
+                            false,
+                            DT_NONE,
+                            nullptr,
+                            nullptr,
+                            nullptr,
+                            REG_MODE_NONE,
+                            0.0f,
+                            "embed_tokens_weight_lm_head");
 
   Tensor output;
   if (mode == BEAM_SEARCH_MODE) {
@@ -242,7 +283,7 @@ void OPT::create_opt_model(FFModel &ff,
                             opt_config.hidden_size /
                                 opt_config.num_attention_heads,
                             ff.config.tensor_parallelism_degree);
-  fileloader.load_weights(&ff, weights_layers, use_full_precision);
+  fileloader.load_weights(&ff, use_full_precision);
   std::cout << "------finished loading weights----------" << std::endl;
   im->init_operators_inference(&ff);
 }
diff --git a/inference/models/starcoder.cc b/inference/models/starcoder.cc
index d32f5e9430..982d58654b 100644
--- a/inference/models/starcoder.cc
+++ b/inference/models/starcoder.cc
@@ -206,7 +206,7 @@ void STARCODER::create_starcoder_model(
                             startcoder_config.hidden_size /
                                 startcoder_config.num_attention_heads,
                             ff.config.tensor_parallelism_degree);
-  fileloader.load_weights(&ff, weights_layers, use_full_precision);
+  fileloader.load_weights(&ff, use_full_precision);
   std::cout << "------load weight finished----------" << std::endl;
 
   // init operators
diff --git a/python/flexflow/core/flexflow_cffi.py b/python/flexflow/core/flexflow_cffi.py
index 5d9480280e..08b87856de 100644
--- a/python/flexflow/core/flexflow_cffi.py
+++ b/python/flexflow/core/flexflow_cffi.py
@@ -278,6 +278,22 @@ def get_weight_tensor(self):
   def get_bias_tensor(self):
     return self.get_parameter_by_id(1)
 
+# -----------------------------------------------------------------------
+# AddBiasResidualLayerNorm
+# -----------------------------------------------------------------------
+class AddBiasResidualLayerNorm(Op):
+  def __init__(self, handle, idx=None, name=None):
+    super(AddBiasResidualLayerNorm, self).__init__(handle, idx, name)
+
+  def get_attn_bias_tensor(self):
+    return self.get_parameter_by_id(0)
+  
+  def get_weight_tensor(self):
+    return self.get_parameter_by_id(1)
+
+  def get_bias_tensor(self):
+    return self.get_parameter_by_id(2)
+
 # -----------------------------------------------------------------------
 # Dropout
 # -----------------------------------------------------------------------
@@ -554,6 +570,8 @@ def convert_op_handle_to_op(op_type, handle, idx=None, name=None):
     return BatchNorm(handle, idx, name)
   elif op_type == OpType.LAYER_NORM:
     return LayerNorm(handle, idx, name)
+  elif op_type == OpType.ADD_BIAS_RESIDUAL_LAYERNORM:
+    return AddBiasResidualLayerNorm(handle, idx, name)
   elif op_type == OpType.BATCH_MATMUL:
     return Batch_Matmul(handle, idx, name)
   elif op_type == OpType.SPLIT:
@@ -1573,6 +1591,13 @@ def layer_norm(self, input, axes, elementwise_affine=True, eps=1e-5, use_bias =
     handle = ffc().flexflow_model_add_layer_norm(self.handle, input.handle, len(axes), c_axes, elementwise_affine, eps, use_bias, c_name)
     self.add_layer(OpType.LAYER_NORM, name)
     return Tensor(handle, owner_op_type=OpType.LAYER_NORM)
+  
+  def add_bias_residual_layer_norm(self, input, residual, axes, elementwise_affine=True, eps=1e-5, use_bias = True, name=None):
+    c_name = get_c_name(name)
+    c_axes = ffi.new("int[]", axes)
+    handles_array = ffc().flexflow_model_add_add_bias_residual_layer_norm(self.handle, input.handle, residual.handle, len(axes), c_axes, elementwise_affine, eps, use_bias, c_name)
+    self.add_layer(OpType.ADD_BIAS_RESIDUAL_LAYERNORM, name)
+    return Tensor(handles_array[0], owner_op_type=OpType.ADD_BIAS_RESIDUAL_LAYERNORM), Tensor(handles_array[1], owner_op_type=OpType.ADD_BIAS_RESIDUAL_LAYERNORM)
 
   def batch_matmul(self, A, B, a_seq_length_dim=None, b_seq_length_dim=None, name=None):
     """Layer that applied batched matrix multiplication onto two input Tensors, :attr:`output = x * y`.
@@ -3292,21 +3317,8 @@ def __init__(self, weight_file_path, num_q_heads, num_kv_heads, hidden_dim, qkv_
     self.handle = ffc().flexflow_file_data_loader_create(c_weight_file_path, num_q_heads, num_kv_heads, hidden_dim, qkv_inner_dim, tensor_parallelism_degree)
     self._handle = ffi.gc(self.handle, ffc().flexflow_file_data_loader_destroy)
   
-  def load_weights(self, model, model_layers_with_weights, data_type):
-    # Extract keys and values into arrays
-    layer_names = list(model_layers_with_weights.keys()) 
-    layers = list(model_layers_with_weights.values())
-    
-    # Convert to char** and flexflow_op_t* for CFFI
-    layer_names_c = [ffi.new("char[]", x.encode('ascii')) for x in layer_names]
-    layer_handles_list = [layer.handle for layer in layers]
-    layer_handles_c = ffi.new("flexflow_op_t[]", layer_handles_list)
-    
-    # Compute number of layers (key-value pairs)
-    num_layers = len(layer_names)
-    assert(len(layer_names) == len(layers))
-
+  def load_weights(self, model, data_type):
     # Check data type and create use_full_precision boolean
     assert(data_type == DataType.DT_FLOAT or data_type == DataType.DT_HALF)
     use_full_precision = data_type == DataType.DT_FLOAT
-    ffc().flexflow_file_data_loader_load_weights(self.handle, model.handle, num_layers, layer_names_c, layer_handles_c, use_full_precision)
+    ffc().flexflow_file_data_loader_load_weights(self.handle, model.handle, use_full_precision)
diff --git a/python/flexflow/serve/models/falcon.py b/python/flexflow/serve/models/falcon.py
index 4fcaca6c33..6e161f8bf7 100644
--- a/python/flexflow/serve/models/falcon.py
+++ b/python/flexflow/serve/models/falcon.py
@@ -98,7 +98,7 @@ def build_model(self):
             self.data_type,
             None,
             embed_init,
-            name="word_embeddings_weight",
+            name="word_embeddings",
         )
         axes = [
             0,
@@ -112,7 +112,7 @@ def build_model(self):
                 axes,
                 True,
                 self.falcon_config.layer_norm_epsilon,
-                name=f"layers_{i}_input_layernorm_weight",
+                name=f"layers_{i}_input_layernorm",
             )
 
             if self.mode == InferenceMode.BEAM_SEARCH_MODE:
@@ -124,13 +124,13 @@ def build_model(self):
                     self.falcon_config.hidden_size // self.falcon_config.n_head,
                     self.falcon_config.hidden_size // self.falcon_config.n_head,
                     0.0,  # dropout
-                    False,  # bias
-                    False,  # add_bias_kv
+                    False,  # qkv_bias
+                    False,  # final_bias
                     False,  # add_zero_attn
                     DataType.DT_NONE,  # data_type
                     None,  # kernel initializer
                     True,  # apply_rotary_embedding
-                    name=f"layers_{i}_attention_weight",
+                    name=f"layers_{i}_attention",
                 )
             elif self.mode == InferenceMode.TREE_VERIFY_MODE:
                 mha = ffmodel.inc_multiquery_self_attention_verify(
@@ -141,13 +141,13 @@ def build_model(self):
                     self.falcon_config.hidden_size // self.falcon_config.n_head,
                     self.falcon_config.hidden_size // self.falcon_config.n_head,
                     0.0,  # dropout
-                    False,  # bias
-                    False,  # add_bias_kv
+                    False,  # qkv_bias
+                    False,  # final_bias
                     False,  # add_zero_attn
                     DataType.DT_NONE,  # data_type
                     None,  # kernel initializer
                     True,  # apply_rotary_embedding
-                    name=f"layers_{i}_attention_weight",
+                    name=f"layers_{i}_attention",
                 )
             elif self.mode == InferenceMode.INC_DECODING_MODE:
                 mha = ffmodel.inc_multiquery_self_attention(
@@ -158,13 +158,13 @@ def build_model(self):
                     self.falcon_config.hidden_size // self.falcon_config.n_head,
                     self.falcon_config.hidden_size // self.falcon_config.n_head,
                     0.0,  # dropout
-                    False,  # bias
-                    False,  # add_bias_kv
+                    False,  # qkv_bias
+                    False,  # final_bias
                     False,  # add_zero_attn
                     DataType.DT_NONE,  # data_type
                     None,  # kernel initializer
                     True,  # apply_rotary_embedding
-                    name=f"layers_{i}_attention_weight",
+                    name=f"layers_{i}_attention",
                 )
             else:
                 assert False
@@ -174,7 +174,7 @@ def build_model(self):
                 self.falcon_config.hidden_size * 4,
                 ActiMode.AC_MODE_NONE,
                 False,
-                name=f"layers_{i}_mlp_dense_h_to_4h_weight",
+                name=f"layers_{i}_mlp_dense_h_to_4h",
             )
             dense_h_to_4h = ffmodel.gelu(dense_h_to_4h)
             mlp_output = ffmodel.dense(
@@ -182,21 +182,21 @@ def build_model(self):
                 self.falcon_config.hidden_size,
                 ActiMode.AC_MODE_NONE,
                 False,
-                name=f"layers_{i}_mlp_dense_4h_to_h_weight",
+                name=f"layers_{i}_mlp_dense_4h_to_h",
             )
 
             token = ffmodel.add(token, mha)
             token = ffmodel.add(token, mlp_output)
 
         ln_f = ffmodel.layer_norm(
-            token, axes, True, self.falcon_config.layer_norm_epsilon, name="ln_f_weight"
+            token, axes, True, self.falcon_config.layer_norm_epsilon, name="ln_f"
         )
         lm_head = ffmodel.dense(
             ln_f,
             self.falcon_config.vocab_size,
             ActiMode.AC_MODE_NONE,
             False,
-            name="lm_head_weight",
+            name="lm_head",
         )
 
         if self.mode == InferenceMode.BEAM_SEARCH_MODE:
diff --git a/python/flexflow/serve/models/llama.py b/python/flexflow/serve/models/llama.py
index 9eacccfda6..d1171cc3d3 100644
--- a/python/flexflow/serve/models/llama.py
+++ b/python/flexflow/serve/models/llama.py
@@ -93,7 +93,7 @@ def build_model(self):
             self.data_type,
             None,
             embed_init,
-            name="tok_embeddings_weight",
+            name="tok_embeddings",
         )
 
         for i in range(self.llama_config.num_hidden_layers):
@@ -103,7 +103,7 @@ def build_model(self):
                 token,
                 self.llama_config.rms_norm_eps,
                 self.llama_config.hidden_size,
-                name=f"layers_{i}_attention_norm_weight",
+                name=f"layers_{i}_attention_norm",
             )
 
             if self.mode == InferenceMode.BEAM_SEARCH_MODE:
@@ -117,13 +117,13 @@ def build_model(self):
                     self.llama_config.hidden_size
                     // self.llama_config.num_attention_heads,
                     0.0,  # dropout
-                    False,  # bias
-                    False,  # add_bias_kv
+                    False,  # qkv_bias
+                    False,  # final_bias
                     False,  # add_zero_attn
                     DataType.DT_NONE,  # data_type
                     None,  # kernel initializer
                     True,  # apply_rotary_embedding
-                    name=f"layers_{i}_attention_weight",
+                    name=f"layers_{i}_attention",
                 )
             elif self.mode == InferenceMode.TREE_VERIFY_MODE:
                 mha = ffmodel.inc_multiquery_self_attention_verify(
@@ -136,13 +136,13 @@ def build_model(self):
                     self.llama_config.hidden_size
                     // self.llama_config.num_attention_heads,
                     0.0,  # dropout
-                    False,  # bias
-                    False,  # add_bias_kv
+                    False,  # qkv_bias
+                    False,  # final_bias
                     False,  # add_zero_attn
                     DataType.DT_NONE,  # data_type
                     None,  # kernel initializer
                     True,  # apply_rotary_embedding
-                    name=f"layers_{i}_attention_weight",
+                    name=f"layers_{i}_attention",
                 )
             elif self.mode == InferenceMode.INC_DECODING_MODE:
                 mha = ffmodel.inc_multiquery_self_attention(
@@ -155,13 +155,13 @@ def build_model(self):
                     self.llama_config.hidden_size
                     // self.llama_config.num_attention_heads,
                     0.0,  # dropout
-                    False,  # bias
-                    False,  # add_bias_kv
+                    False,  # qkv_bias
+                    False,  # final_bias
                     False,  # add_zero_attn
                     DataType.DT_NONE,  # data_type
                     None,  # kernel initializer
                     True,  # apply_rotary_embedding
-                    name=f"layers_{i}_attention_weight",
+                    name=f"layers_{i}_attention",
                 )
             else:
                 assert False
@@ -171,21 +171,21 @@ def build_model(self):
                 token,
                 self.llama_config.rms_norm_eps,
                 self.llama_config.hidden_size,
-                name=f"layers_{i}_ffn_norm_weight",
+                name=f"layers_{i}_ffn_norm",
             )
             w1 = ffmodel.dense(
                 ff_norm,
                 self.llama_config.intermediate_size,
                 ActiMode.AC_MODE_NONE,
                 False,
-                name=f"layers_{i}_feed_forward_w1_weight",
+                name=f"layers_{i}_feed_forward_w1",
             )
             w3 = ffmodel.dense(
                 ff_norm,
                 self.llama_config.intermediate_size,
                 ActiMode.AC_MODE_NONE,
                 False,
-                name=f"layers_{i}_feed_forward_w3_weight",
+                name=f"layers_{i}_feed_forward_w3",
             )
             sigmoid = ffmodel.sigmoid(w1)
             silu = ffmodel.multiply(w1, sigmoid)
@@ -195,7 +195,7 @@ def build_model(self):
                 self.llama_config.hidden_size,
                 ActiMode.AC_MODE_NONE,
                 False,
-                name=f"layers_{i}_feed_forward_w2_weight",
+                name=f"layers_{i}_feed_forward_w2",
             )
             token = ffmodel.add(token, w2)
 
@@ -203,14 +203,14 @@ def build_model(self):
             token,
             self.llama_config.rms_norm_eps,
             self.llama_config.hidden_size,
-            name="norm_weight",
+            name="norm",
         )
         dense = ffmodel.dense(
             token,
             self.llama_config.vocab_size,
             ActiMode.AC_MODE_NONE,
             False,
-            name="output_weight",
+            name="output",
         )
 
         if self.mode == InferenceMode.BEAM_SEARCH_MODE:
diff --git a/python/flexflow/serve/models/mpt.py b/python/flexflow/serve/models/mpt.py
index a5a0c7da18..10353c5a96 100644
--- a/python/flexflow/serve/models/mpt.py
+++ b/python/flexflow/serve/models/mpt.py
@@ -94,7 +94,7 @@ def build_model(self):
             self.data_type,
             None,
             embed_init,
-            name="transformer_wte_weight",
+            name="transformer_wte",
         )
 
         axes = [
@@ -110,7 +110,7 @@ def build_model(self):
                 True,
                 1e-05,
                 False,
-                name=f"layers_{i}_norm_1_weight",
+                name=f"layers_{i}_norm_1",
             )
 
             if self.mode == InferenceMode.BEAM_SEARCH_MODE:
@@ -121,8 +121,8 @@ def build_model(self):
                     self.mpt_config.hidden_size // self.mpt_config.n_heads,
                     self.mpt_config.hidden_size // self.mpt_config.n_heads,
                     0.0,  # dropout
-                    False,  # bias
-                    False,  # add_bias_kv
+                    False,  # qkv_bias
+                    False,  # final_bias
                     False,  # add_zero_attn
                     DataType.DT_NONE,  # data_type
                     None,  # kernel initializer
@@ -132,7 +132,7 @@ def build_model(self):
                     ** (-0.5),  # scaling_factor
                     False,  # qk_prod_scaling
                     True, # qk_prod_scaling
-                    name=f"layers_{i}_attention_weight",
+                    name=f"layers_{i}_attention",
                 )
             elif self.mode == InferenceMode.TREE_VERIFY_MODE:
                 attn_outputs = ffmodel.inc_multihead_self_attention_verify(
@@ -142,8 +142,8 @@ def build_model(self):
                     self.mpt_config.hidden_size // self.mpt_config.n_heads,
                     self.mpt_config.hidden_size // self.mpt_config.n_heads,
                     0.0,  # dropout
-                    False,  # bias
-                    False,  # add_bias_kv
+                    False,  # qkv_bias
+                    False,  # final_bias
                     False,  # add_zero_attn
                     DataType.DT_NONE,  # data_type
                     None,  # kernel initializer
@@ -153,7 +153,7 @@ def build_model(self):
                     ** (-0.5),  # scaling_factor
                     False,  # qk_prod_scaling
                     True, # qk_prod_scaling
-                    name=f"layers_{i}_attention_weight",
+                    name=f"layers_{i}_attention",
                 )
             elif self.mode == InferenceMode.INC_DECODING_MODE:
                 attn_outputs = ffmodel.inc_multihead_self_attention(
@@ -163,8 +163,8 @@ def build_model(self):
                     self.mpt_config.hidden_size // self.mpt_config.n_heads,
                     self.mpt_config.hidden_size // self.mpt_config.n_heads,
                     0.0,  # dropout
-                    False,  # bias
-                    False,  # add_bias_kv
+                    False,  # qkv_bias
+                    False,  # final_bias
                     False,  # add_zero_attn
                     DataType.DT_NONE,  # data_type
                     None,  # kernel initializer
@@ -174,7 +174,7 @@ def build_model(self):
                     ** (-0.5),  # scaling_factor
                     False,  # qk_prod_scaling
                     True, # qk_prod_scaling
-                    name=f"layers_{i}_attention_weight",
+                    name=f"layers_{i}_attention",
                 )
             else:
                 assert False
@@ -187,7 +187,7 @@ def build_model(self):
                 True,
                 1e-05,
                 False,
-                name=f"layers_{i}_norm_2_weight",
+                name=f"layers_{i}_norm_2",
             )
             residual = hidden_states
             # mlp
@@ -197,7 +197,7 @@ def build_model(self):
                 4 * self.mpt_config.hidden_size,
                 ActiMode.AC_MODE_NONE,
                 False,
-                name=f"layers_{i}_ffn_up_proj_weight",
+                name=f"layers_{i}_ffn_up_proj",
             )
             layernorm_output = ffmodel.gelu(layernorm_output)
             intermediate_output = ffmodel.dense(
@@ -205,7 +205,7 @@ def build_model(self):
                 self.mpt_config.hidden_size,
                 ActiMode.AC_MODE_NONE,
                 False,
-                name=f"layers_{i}_ffn_down_proj_weight",
+                name=f"layers_{i}_ffn_down_proj",
             )
             hidden_states = ffmodel.add(intermediate_output, residual)
 
@@ -215,14 +215,14 @@ def build_model(self):
             True,
             1e-05,
             False,
-            name=f"transformer_norm_f_weight",
+            name=f"transformer_norm_f",
         )
         lm_head = ffmodel.dense(
             all_final_norm,
             self.mpt_config.vocab_size,
             ActiMode.AC_MODE_NONE,
             False,
-            name="lm_head_weight",
+            name="lm_head",
         )
 
         if self.generation_config.do_sample:
diff --git a/python/flexflow/serve/models/opt.py b/python/flexflow/serve/models/opt.py
index d18c0d4cc9..d90dabad1d 100644
--- a/python/flexflow/serve/models/opt.py
+++ b/python/flexflow/serve/models/opt.py
@@ -100,7 +100,7 @@ def build_model(self):
             self.data_type,
             None,
             embed_init,
-            name="embed_tokens_weight",
+            name="embed_tokens",
         )
         positional_embedding = ffmodel.embedding(
             position_tensor,
@@ -110,7 +110,7 @@ def build_model(self):
             self.data_type,
             None,
             embed_init,
-            name="embed_positions_weight",
+            name="embed_positions",
         )
 
         residual = ffmodel.add(token, positional_embedding)
@@ -128,7 +128,7 @@ def build_model(self):
                     axes,
                     self.opt_config.layer_norm_elementwise_affine,
                     1e-05,
-                    name=f"layers_{i}_attention_layer_norm_weight",
+                    name=f"layers_{i}_attention_layer_norm",
                 )
             else:
                 hidden_states = residual
@@ -141,8 +141,8 @@ def build_model(self):
                     self.opt_config.hidden_size // self.opt_config.num_attention_heads,
                     self.opt_config.hidden_size // self.opt_config.num_attention_heads,
                     0.0,  # dropout
-                    True,  # bias
-                    False,  # add_bias_kv
+                    True,  # qkv_bias
+                    False,  # final_bias
                     False,  # add_zero_attn
                     DataType.DT_NONE,  # data_type
                     None,  # kernel initializer
@@ -151,7 +151,7 @@ def build_model(self):
                     (self.opt_config.hidden_size / self.opt_config.num_attention_heads)
                     ** (-0.5),  # scaling_factor
                     False,  # qk_prod_scaling
-                    name=f"layers_{i}_attention_weight",
+                    name=f"layers_{i}_attention",
                 )
             elif self.mode == InferenceMode.TREE_VERIFY_MODE:
                 mha = ffmodel.inc_multihead_self_attention_verify(
@@ -161,8 +161,8 @@ def build_model(self):
                     self.opt_config.hidden_size // self.opt_config.num_attention_heads,
                     self.opt_config.hidden_size // self.opt_config.num_attention_heads,
                     0.0,  # dropout
-                    True,  # bias
-                    False,  # add_bias_kv
+                    True,  # qkv_bias
+                    False,  # final_bias
                     False,  # add_zero_attn
                     DataType.DT_NONE,  # data_type
                     None,  # kernel initializer
@@ -171,7 +171,7 @@ def build_model(self):
                     (self.opt_config.hidden_size / self.opt_config.num_attention_heads)
                     ** (-0.5),  # scaling_factor
                     False,  # qk_prod_scaling
-                    name=f"layers_{i}_attention_weight",
+                    name=f"layers_{i}_attention",
                 )
             elif self.mode == InferenceMode.INC_DECODING_MODE:
                 mha = ffmodel.inc_multihead_self_attention(
@@ -181,8 +181,8 @@ def build_model(self):
                     self.opt_config.hidden_size // self.opt_config.num_attention_heads,
                     self.opt_config.hidden_size // self.opt_config.num_attention_heads,
                     0.0,  # dropout
-                    True,  # bias
-                    False,  # add_bias_kv
+                    True,  # qkv_bias
+                    False,  # final_bias
                     False,  # add_zero_attn
                     DataType.DT_NONE,  # data_type
                     None,  # kernel initializer
@@ -191,26 +191,27 @@ def build_model(self):
                     (self.opt_config.hidden_size / self.opt_config.num_attention_heads)
                     ** (-0.5),  # scaling_factor
                     False,  # qk_prod_scaling
-                    name=f"layers_{i}_attention_weight",
+                    name=f"layers_{i}_attention",
                 )
             else:
                 assert False
 
-            residual = ffmodel.add(mha, residual)
+            # residual = ffmodel.add(mha, residual)
 
             # This is either a before or after attention LayerNorm. In both cases, we need to compute the LN here.
-            norm_name = (
-                f"layers_{i}_final_layer_norm_weight"
+            """ norm_name = (
+                f"layers_{i}_final_layer_norm"
                 if self.opt_config.do_layer_norm_before
-                else f"layers_{i}_attention_layer_norm_weight"
-            )
-            ff_norm = ffmodel.layer_norm(
-                residual,
-                axes,
-                self.opt_config.layer_norm_elementwise_affine,
-                1e-05,
-                name=norm_name,
-            )
+                else f"layers_{i}_attention_layer_norm"
+            ) """
+            # ff_norm = ffmodel.layer_norm(
+            #     residual,
+            #     axes,
+            #     self.opt_config.layer_norm_elementwise_affine,
+            #     1e-05,
+            #     name=norm_name,
+            # )
+            residual, ff_norm = ffmodel.add_bias_residual_layer_norm(mha, residual, axes, self.opt_config.layer_norm_elementwise_affine, 1e-05, name=f"layers_{i}_add_bias_residual_layer_norm")
 
             if not self.opt_config.do_layer_norm_before:
                 residual = ff_norm
@@ -220,7 +221,7 @@ def build_model(self):
                 self.opt_config.ffn_dim,
                 ActiMode.AC_MODE_NONE,
                 True,
-                name=f"layers_{i}_fc1_weight",
+                name=f"layers_{i}_fc1",
             )
             activation = ffmodel.relu(fc1, False)
             fc2 = ffmodel.dense(
@@ -228,7 +229,7 @@ def build_model(self):
                 self.opt_config.hidden_size,
                 ActiMode.AC_MODE_NONE,
                 True,
-                name=f"layers_{i}_fc2_weight",
+                name=f"layers_{i}_fc2",
             )
             residual = ffmodel.add(residual, fc2)
 
@@ -238,7 +239,7 @@ def build_model(self):
                     axes,
                     self.opt_config.layer_norm_elementwise_affine,
                     1e-05,
-                    name=f"layers_{i}_final_layer_norm_weight",
+                    name=f"layers_{i}_final_layer_norm",
                 )
 
         all_final_norm = ffmodel.layer_norm(
@@ -246,7 +247,7 @@ def build_model(self):
             axes,
             self.opt_config.layer_norm_elementwise_affine,
             1e-05,
-            name=f"final_layer_norm_weight",
+            name=f"final_layer_norm",
         )
         lm_head = ffmodel.dense(
             all_final_norm,
@@ -285,6 +286,8 @@ def convert_hf_model(model, dst_folder):
                 .replace("k_proj", "wk")
                 .replace("v_proj", "wv")
                 .replace("out_proj", "wo")
+                .replace("attention_wo_bias", "add_bias_residual_layer_norm_attn_bias")
+                .replace("_final_layer_norm", "_add_bias_residual_layer_norm") # important to use the leading "_" to avoid matching the last LayerNorm
             )
             params.detach().cpu().numpy().tofile(f"{dst_folder}/{name}")
         # copy embedding weights
diff --git a/python/flexflow/serve/models/starcoder.py b/python/flexflow/serve/models/starcoder.py
index 922d0e4746..05594f81e5 100644
--- a/python/flexflow/serve/models/starcoder.py
+++ b/python/flexflow/serve/models/starcoder.py
@@ -149,8 +149,8 @@ def build_model(self):
                 self.starcoder_config.hidden_size
                 // self.starcoder_config.num_attention_heads,
                 0.0,  # dropout
-                True,  # bias
-                False,  # add_bias_kv
+                True,  # qkv_bias
+                False,  # final_bias
                 False,  # add_zero_attn
                 DataType.DT_NONE,  # data_type
                 None,  # kernel initializer
diff --git a/python/flexflow/serve/serve.py b/python/flexflow/serve/serve.py
index 58f7221082..5cbe16b064 100644
--- a/python/flexflow/serve/serve.py
+++ b/python/flexflow/serve/serve.py
@@ -272,10 +272,7 @@ def __load_hf_weights(self):
             self.ffconfig.tensor_parallelism_degree,
         )
 
-        model_layers_with_weights = self.model.get_layers_with_weights()
-        self.fileloader.load_weights(
-            self.model.ffmodel, model_layers_with_weights, self.data_type
-        )
+        self.fileloader.load_weights(self.model.ffmodel, self.data_type)
 
     def compile(
         self,
diff --git a/python/flexflow/type.py b/python/flexflow/type.py
index d7cc145fde..a4785dba51 100644
--- a/python/flexflow/type.py
+++ b/python/flexflow/type.py
@@ -148,6 +148,7 @@ class OpType(Enum):
     RMS_NORM = 2300
     ARG_TOPK = 2301
     BEAM_TOPK = 2302
+    ADD_BIAS_RESIDUAL_LAYERNORM = 2303
 
 
 def enum_to_int(enum, enum_item):
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index 0c1fad17df..dee030abee 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -638,6 +638,53 @@ flexflow_tensor_t flexflow_model_add_layer_norm(flexflow_model_t handle_,
   return FFCObjectWrapper::wrap(tensor);
 }
 
+flexflow_tensor_t *flexflow_model_add_add_bias_residual_layer_norm(
+    flexflow_model_t handle_,
+    const flexflow_tensor_t input_,
+    const flexflow_tensor_t residual_,
+    int n,
+    int *axes,
+    bool elementwise_affine,
+    float eps,
+    bool use_bias,
+    char const *name) {
+  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
+  const Tensor input = FFCObjectWrapper::unwrap(input_);
+  const Tensor residual = FFCObjectWrapper::unwrap(residual_);
+  Tensor tensor_outputs[2];
+  std::vector<int> axes_vec;
+  for (int i = 0; i < n; i++) {
+    axes_vec.push_back(axes[i]);
+  }
+  handle->add_bias_residual_layer_norm(input,
+                                       residual,
+                                       tensor_outputs,
+                                       axes_vec,
+                                       elementwise_affine,
+                                       eps,
+                                       use_bias,
+                                       input->data_type,
+                                       name);
+  assert(tensor_outputs[0] != nullptr);
+  assert(tensor_outputs[1] != nullptr);
+  DEBUG_PRINT("[LayerNorm] new Tensor %p, input %p, residual %p, output0: %p, "
+              "output1: %p, elementwise_affine %d, eps "
+              "%f, name %s",
+              tensor,
+              input,
+              residual,
+              tensor_outputs[0],
+              tensor_outputs[1],
+              elementwise_affine,
+              eps,
+              name);
+  flexflow_tensor_t *tensor_outputs_wrapped =
+      (flexflow_tensor_t *)calloc(2, sizeof(flexflow_tensor_t));
+  tensor_outputs_wrapped[0] = FFCObjectWrapper::wrap(tensor_outputs[0]);
+  tensor_outputs_wrapped[1] = FFCObjectWrapper::wrap(tensor_outputs[1]);
+  return tensor_outputs_wrapped;
+}
+
 flexflow_tensor_t flexflow_model_add_batch_matmul(flexflow_model_t handle_,
                                                   const flexflow_tensor_t a_,
                                                   const flexflow_tensor_t b_,
@@ -2500,17 +2547,8 @@ void flexflow_file_data_loader_destroy(flexflow_file_data_loader_t handle_) {
 
 void flexflow_file_data_loader_load_weights(flexflow_file_data_loader_t handle_,
                                             flexflow_model_t model_handle_,
-                                            int num_layers,
-                                            char const **layer_names,
-                                            flexflow_op_t *layers,
                                             bool use_full_precision) {
   FileDataLoader *handle = FFCObjectWrapper::unwrap(handle_);
   FFModel *model = FFCObjectWrapper::unwrap(model_handle_);
-  std::unordered_map<std::string, Layer *> weights_layers;
-  for (int i = 0; i < num_layers; i++) {
-    std::string const layer_name(layer_names[i]);
-    Layer *layer_ptr = FFCObjectWrapper::unwrap(layers[i]);
-    weights_layers.emplace(layer_name, layer_ptr);
-  }
-  handle->load_weights(model, weights_layers, use_full_precision);
+  handle->load_weights(model, use_full_precision);
 }
diff --git a/src/ops/add_bias_residual_layer_norm.cc b/src/ops/add_bias_residual_layer_norm.cc
new file mode 100644
index 0000000000..ea770f2ac7
--- /dev/null
+++ b/src/ops/add_bias_residual_layer_norm.cc
@@ -0,0 +1,829 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/add_bias_residual_layer_norm.h"
+#include "flexflow/model.h"
+#include "flexflow/utils/hash_utils.h"
+#include "legion/legion_utilities.h"
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::ArgumentMap;
+using Legion::Context;
+using Legion::coord_t;
+using Legion::Domain;
+using Legion::FutureMap;
+using Legion::IndexLauncher;
+using Legion::InlineLauncher;
+using Legion::Machine;
+using Legion::Memory;
+using Legion::PhysicalRegion;
+using Legion::Predicate;
+using Legion::Rect;
+using Legion::RegionRequirement;
+using Legion::Runtime;
+using Legion::Task;
+using Legion::TaskArgument;
+using Legion::TaskLauncher;
+
+bool operator==(AddBiasResidualLayerNormParams const &lhs,
+                AddBiasResidualLayerNormParams const &rhs) {
+  return lhs.layer_guid == rhs.layer_guid && lhs.axes == rhs.axes &&
+         lhs.elementwise_affine == rhs.elementwise_affine &&
+         lhs.use_bias == rhs.use_bias;
+}
+
+bool AddBiasResidualLayerNormParams::is_valid(
+    std::pair<ParallelTensorShape, ParallelTensorShape> const &input) const {
+  return input.first.is_valid() && input.second.is_valid();
+}
+
+AddBiasResidualLayerNormParams AddBiasResidualLayerNorm::get_params() const {
+  AddBiasResidualLayerNormParams params;
+  params.layer_guid = this->layer_guid;
+  params.axes = this->axes;
+  params.elementwise_affine = this->elementwise_affine;
+  params.eps = this->eps;
+  params.use_bias = this->use_bias;
+  return params;
+}
+
+void FFModel::add_bias_residual_layer_norm(const Tensor input,
+                                           const Tensor residual,
+                                           Tensor *outputs,
+                                           std::vector<int> const &axes,
+                                           bool elementwise_affine,
+                                           float eps,
+                                           bool use_bias,
+                                           DataType data_type,
+                                           char const *name) {
+  // In PyTorch, axes must be the sizes of the last axes.size() dimensions of
+  // the input tensor. However, since the tensor dimensions are reversed in
+  // FlexFlow (batch size is the last dimension), we require that axes must be
+  // the sizes of the FIRST axes.size() dimensions of the input tensor.
+
+  // Another difference is that in PyTorch, the axes vector should contain the
+  // sizes of the dimensions with respect to which you want to compute the
+  // layernorm. In FlexFlow, instead, axes should contain the INDICES of the
+  // dimensions in question. We do this because the size of a dimension might be
+  // different when splitting a tensor in model parallelism.
+  assert(
+      axes.size() <= input->num_dims &&
+      "number of axes must be less than tensor dimensions"); // input does not
+                                                             // have replica
+                                                             // dimension here
+  for (int i = 0; i < axes.size(); i++) {
+    assert(axes[i] == i && "axes must be the first axes.size() dimensions");
+  }
+
+  // Check dims
+  assert(input->num_dims == residual->num_dims);
+  for (int i = 0; i < input->num_dims; i++) {
+    assert(input->dims[i] == residual->dims[i]);
+  }
+
+  if (data_type == DT_NONE) {
+    data_type = input->data_type;
+  }
+  int num_weights =
+      1 + (elementwise_affine ? (use_bias ? 2 : 1)
+                              : 0); // attention bias + layernorm weights
+  Layer *ln = nullptr;
+  Tensor casted_input =
+      (data_type != input->data_type)
+          ? cast(input, data_type, "type cast for add_bias_residual_layer_norm")
+          : input;
+  Tensor casted_residual =
+      (data_type != residual->data_type)
+          ? cast(residual,
+                 data_type,
+                 "type cast for add_bias_residual_layer_norm")
+          : residual;
+  ln = new Layer(this,
+                 OP_ADD_BIAS_RESIDUAL_LAYERNORM,
+                 data_type,
+                 name,
+                 2 /*inputs*/,
+                 num_weights,
+                 2 /*outputs*/,
+                 casted_input,
+                 residual);
+  // added: attn_output + final attention bias + residual. To be added to the
+  // output of FC2
+  ln->outputs[0] = create_tensor_legion_ordering(input->num_dims,
+                                                 input->dims,
+                                                 input->data_type,
+                                                 ln,
+                                                 0,
+                                                 false /*create_grad*/);
+  // layer_norm(added)
+  ln->outputs[1] = create_tensor_legion_ordering(input->num_dims,
+                                                 input->dims,
+                                                 input->data_type,
+                                                 ln,
+                                                 0,
+                                                 false /*create_grad*/);
+  {
+    int numdims = axes.size();
+    int dims[numdims];
+    for (int i = 0; i < numdims; i++) {
+      dims[i] = input->dims[axes[i]];
+    }
+    // Attention bias
+    int attn_bias_dims[1] = {dims[0]};
+    ln->weights[0] = create_weight_legion_ordering(1,
+                                                   attn_bias_dims,
+                                                   input->data_type,
+                                                   ln,
+                                                   false /*create_grad*/,
+                                                   nullptr,
+                                                   CHOSEN_SYNC_TYPE);
+    if (num_weights > 1) {
+      assert(elementwise_affine);
+      ln->weights[1] = create_weight_legion_ordering(numdims,
+                                                     dims,
+                                                     input->data_type,
+                                                     ln,
+                                                     false /*create_grad*/,
+                                                     nullptr,
+                                                     CHOSEN_SYNC_TYPE);
+      if (num_weights == 3) {
+        assert(use_bias);
+        ln->weights[2] = create_weight_legion_ordering(numdims,
+                                                       dims,
+                                                       input->data_type,
+                                                       ln,
+                                                       false /*create_grad*/,
+                                                       nullptr,
+                                                       CHOSEN_SYNC_TYPE);
+      }
+    }
+  }
+  ln->add_int_property("elementwise_affine", elementwise_affine);
+  ln->add_int_property("use_bias", use_bias);
+  ln->add_int_vector_property("axes", axes);
+  ln->add_float_property("eps", eps);
+  layers.push_back(ln);
+  outputs[0] = ln->outputs[0];
+  outputs[1] = ln->outputs[1];
+}
+
+Op *AddBiasResidualLayerNorm::create_operator_from_layer(
+    FFModel &model,
+    Layer const *layer,
+    std::vector<ParallelTensor> const &inputs) {
+  long long value;
+  layer->get_int_property("elementwise_affine", value);
+  bool elementwise_affine = (bool)value;
+  layer->get_int_property("use_bias", value);
+  bool use_bias = (bool)value;
+  std::vector<int> axes;
+  layer->get_int_vector_property("axes", axes);
+  float eps;
+  layer->get_float_property("eps", eps);
+  return new AddBiasResidualLayerNorm(model,
+                                      layer->layer_guid,
+                                      inputs[0],
+                                      inputs[1],
+                                      axes,
+                                      elementwise_affine,
+                                      use_bias,
+                                      eps,
+                                      false, // allocate_weights
+                                      layer->name);
+}
+
+AddBiasResidualLayerNorm::AddBiasResidualLayerNorm(
+    FFModel &model,
+    AddBiasResidualLayerNormParams const &params,
+    std::pair<ParallelTensor, ParallelTensor> const &inputs,
+    char const *name,
+    bool allocate_weights)
+    : AddBiasResidualLayerNorm(model,
+                               params.layer_guid,
+                               inputs.first,
+                               inputs.second,
+                               params.axes,
+                               params.elementwise_affine,
+                               params.use_bias,
+                               params.eps,
+                               allocate_weights,
+                               name) {}
+
+AddBiasResidualLayerNorm::AddBiasResidualLayerNorm(
+    FFModel &model,
+    LayerID const &_layer_guid,
+    const ParallelTensor _input,
+    const ParallelTensor _residual,
+    std::vector<int> const &_axes,
+    bool _elementwise_affine,
+    bool _use_bias,
+    float _eps,
+    bool allocate_weights,
+    char const *name)
+    : Op(model,
+         OP_ADD_BIAS_RESIDUAL_LAYERNORM,
+         _input->data_type,
+         name,
+         2 /*inputs*/,
+         1 + (_elementwise_affine ? (_use_bias ? 2 : 1) : 0) /*weights*/,
+         2 /*outputs*/,
+         _input,
+         _residual),
+      elementwise_affine(_elementwise_affine), eps(_eps), axes(_axes),
+      use_bias(_use_bias) {
+  // overwrite layer_guid
+  layer_guid = _layer_guid;
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      _input->num_dims, _input->dims, _input->data_type, this, 0 /*owner_idx*/);
+  outputs[1] = model.create_parallel_tensor_legion_ordering(
+      _input->num_dims, _input->dims, _input->data_type, this, 1 /*owner_idx*/);
+  assert(check_output_input_weight_parallel_dims(allocate_weights));
+
+  int M = 1;
+  for (int i = 0; i < axes.size(); i++) {
+    M *= inputs[0]->dims[axes[i]].size;
+  }
+  int num_replicas = 1;
+  for (int i = 0; i < inputs[0]->num_dims; i++) {
+    if (inputs[0]->dims[i].is_replica_dim) {
+      num_replicas *= inputs[0]->dims[i].size;
+    }
+  }
+  effective_num_elements = M;
+  effective_batch_size = (inputs[0]->get_volume() / num_replicas) / M;
+  if (!elementwise_affine) {
+    assert(numWeights == 1); // attn bias
+  } else {
+    if (!use_bias) {
+      assert(numWeights == 2); // attn bias + weight
+    } else {
+      assert(numWeights == 3); // attn bias + weight + bias
+    }
+  }
+
+  if (allocate_weights) {
+    // always need to allocate attn bias
+    ParallelTensorShape attention_bias_shape = _input->get_shape();
+    for (int i = 1; i < attention_bias_shape.num_dims - 1; i++) {
+      attention_bias_shape.dims[i].size = 1;
+    }
+
+    int seed = std::rand();
+    Initializer *attn_bias_initializer =
+        new UniformInitializer(seed, 1.0f, 1.0f);
+
+    weights[0] = model.create_parallel_weight_legion_ordering(
+        attention_bias_shape.num_dims,
+        attention_bias_shape.dims,
+        _input->data_type,
+        NULL /*owner_op*/,
+        false /*create_grad*/,
+        attn_bias_initializer,
+        CHOSEN_SYNC_TYPE);
+
+    if (numWeights > 1) {
+      assert(elementwise_affine);
+
+      ParallelTensorShape beta_gamma_shape = _input->get_shape();
+      for (int i = axes.size(); i < beta_gamma_shape.num_dims - 1; i++) {
+        beta_gamma_shape.dims[i].size = 1;
+      }
+
+      // weight
+      Initializer *gamma_initializer = new UniformInitializer(seed, 1.0f, 1.0f);
+      weights[1] = model.create_parallel_weight_legion_ordering(
+          beta_gamma_shape.num_dims, // axes.size(),
+          beta_gamma_shape.dims,
+          _input->data_type,
+          NULL /*owner_op*/,
+          false /*create_grad*/,
+          gamma_initializer,
+          CHOSEN_SYNC_TYPE);
+
+      // bias
+      if (numWeights == 3) {
+        assert(use_bias);
+        Initializer *beta_initializer =
+            new UniformInitializer(seed, 0.0f, 0.0f);
+        weights[2] = model.create_parallel_weight_legion_ordering(
+            beta_gamma_shape.num_dims, //.size(),
+            beta_gamma_shape.dims,
+            _input->data_type,
+            NULL /*owner_op*/,
+            false /*create_grad*/,
+            beta_initializer,
+            CHOSEN_SYNC_TYPE);
+      }
+    }
+  }
+}
+
+void AddBiasResidualLayerNorm::init_inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher launcher(ADD_BIAS_RESIDUAL_LAYERNORM_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(AddBiasResidualLayerNorm)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  // attn output
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  // residual
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[1]->region));
+  launcher.add_field(1, FID_DATA);
+  // added: attn_output + attn final bias + residual
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  // layer norm output
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[1]->region));
+  launcher.add_field(3, FID_DATA);
+  // attn final bias
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(4, FID_DATA);
+  if (elementwise_affine) {
+    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[1]->region));
+    launcher.add_field(5, FID_DATA);
+
+    if (use_bias) {
+      launcher.add_region_requirement(RegionRequirement(weights[2]->part,
+                                                        0 /*projection id*/,
+                                                        READ_ONLY,
+                                                        EXCLUSIVE,
+                                                        weights[2]->region));
+      launcher.add_field(6, FID_DATA);
+    }
+  }
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
+}
+
+void AddBiasResidualLayerNorm::init(FFModel const &ff) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(ADD_BIAS_RESIDUAL_LAYERNORM_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(AddBiasResidualLayerNorm)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  // attn output
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  // residual
+  launcher.add_region_requirement(RegionRequirement(inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[1]->region));
+  launcher.add_field(1, FID_DATA);
+  // added: attn_output + attn final bias + residual
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  // layer norm output
+  launcher.add_region_requirement(RegionRequirement(outputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[1]->region));
+  launcher.add_field(3, FID_DATA);
+  // attn final bias
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(4, FID_DATA);
+  if (elementwise_affine) {
+    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[1]->region));
+    launcher.add_field(5, FID_DATA);
+
+    if (use_bias) {
+      launcher.add_region_requirement(RegionRequirement(weights[2]->part,
+                                                        0 /*projection id*/,
+                                                        READ_ONLY,
+                                                        EXCLUSIVE,
+                                                        weights[2]->region));
+      launcher.add_field(6, FID_DATA);
+    }
+  }
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
+/*
+  regions[0](I): attn output
+  regions[1](I): residual
+  regions[2](O): added output (attn output + final attn bias + residual)
+  regions[3](O): layer norm output
+  regions[4](I): final attn bias
+  regions[5](I): gamma
+  regions[6](I): beta
+*/
+OpMeta *AddBiasResidualLayerNorm::init_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  AddBiasResidualLayerNorm *ln = (AddBiasResidualLayerNorm *)task->args;
+  FFHandler handle = *((FFHandler const *)task->local_args);
+  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                       .only_kind(Memory::GPU_FB_MEM)
+                       .best_affinity_to(task->target_proc)
+                       .first();
+  MemoryAllocator gpu_mem_allocator(gpu_mem);
+  AddBiasResidualLayerNormMeta *meta =
+      new AddBiasResidualLayerNormMeta(handle, ln, gpu_mem_allocator);
+  meta->input_type[0] = ln->inputs[0]->data_type;
+  meta->input_type[1] = ln->inputs[1]->data_type;
+  meta->weight_type[0] = ln->weights[0]->data_type;
+  if (ln->elementwise_affine) {
+    meta->weight_type[1] = ln->weights[1]->data_type;
+    if (ln->use_bias) {
+      meta->weight_type[2] = ln->weights[2]->data_type;
+    }
+  }
+  meta->output_type[0] = ln->outputs[0]->data_type;
+  meta->output_type[1] = ln->outputs[1]->data_type;
+  return meta;
+}
+
+void AddBiasResidualLayerNorm::forward(FFModel const &ff) {
+  assert(false);
+}
+
+void AddBiasResidualLayerNorm::backward(FFModel const &ff) {
+  assert(false);
+}
+
+FutureMap AddBiasResidualLayerNorm::inference(
+    FFModel const &ff,
+    BatchConfigFuture const &bc,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+  /* std::cout << "AddBiasResidualLayerNorm op machine_view: " << *(MachineView
+     const *)mv
+            << std::endl; */
+  IndexLauncher launcher(ADD_BIAS_RESIDUAL_LAYERNORM_INF_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
+  // attn output
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  // residual
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[1]->region));
+  launcher.add_field(1, FID_DATA);
+  // added: attn_output + attn final bias + residual
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  // layer norm output
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[1]->region));
+  launcher.add_field(3, FID_DATA);
+  // attn final bias
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(4, FID_DATA);
+  if (elementwise_affine) {
+    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[1]->region));
+    launcher.add_field(5, FID_DATA);
+
+    if (use_bias) {
+      launcher.add_region_requirement(RegionRequirement(weights[2]->part,
+                                                        0 /*projection id*/,
+                                                        READ_ONLY,
+                                                        EXCLUSIVE,
+                                                        weights[2]->region));
+      launcher.add_field(6, FID_DATA);
+    }
+  }
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+/*
+  regions[0](I): attn output
+  regions[1](I): residual
+  regions[2](O): added output (attn output + final attn bias + residual)
+  regions[3](O): layer norm output
+  regions[4](I): final attn bias
+  regions[5](I): gamma
+  regions[6](I): beta
+*/
+void AddBiasResidualLayerNorm::inference_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+
+  assert(task->regions.size() == regions.size());
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_tokens == 0) {
+    return;
+  }
+
+  AddBiasResidualLayerNormMeta const *m =
+      *((AddBiasResidualLayerNormMeta **)task->local_args);
+
+  assert(regions.size() ==
+         5 + (m->elementwise_affine ? (m->use_bias ? 2 : 1) : 0));
+
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR residual = helperGetGenericTensorAccessorRO(
+      m->input_type[1], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW added_output = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type[1], regions[3], task->regions[3], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR attn_bias = helperGetGenericTensorAccessorRO(
+      m->weight_type[0], regions[4], task->regions[4], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR gamma, beta;
+
+  Domain in_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  Domain residual_domain = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+  Domain added_out_domain = runtime->get_index_space_domain(
+      ctx, task->regions[2].region.get_index_space());
+  Domain out_domain = runtime->get_index_space_domain(
+      ctx, task->regions[3].region.get_index_space());
+  Domain attn_bias_domain = runtime->get_index_space_domain(
+      ctx, task->regions[4].region.get_index_space());
+  Domain gamma_domain, beta_domain;
+
+  assert(in_domain.get_volume() == out_domain.get_volume());
+  assert(out_domain.get_volume() == added_out_domain.get_volume());
+  assert(in_domain.get_volume() == residual_domain.get_volume());
+  assert(in_domain == out_domain);
+  assert(added_out_domain == out_domain);
+  assert(residual_domain == in_domain);
+
+  coord_t attn_bias_dim =
+      attn_bias_domain.hi()[0] - attn_bias_domain.lo()[0] + 1;
+  assert((in_domain.hi()[0] - in_domain.lo()[0] + 1) == attn_bias_dim);
+  assert((residual_domain.hi()[0] - residual_domain.lo()[0] + 1) ==
+         attn_bias_dim);
+  assert((out_domain.hi()[0] - out_domain.lo()[0] + 1) == attn_bias_dim);
+  assert((added_out_domain.hi()[0] - added_out_domain.lo()[0] + 1) ==
+         attn_bias_dim);
+
+  assert(in_domain.get_volume() ==
+         m->effective_num_elements * m->effective_batch_size);
+
+  // std::cout << std::endl << "INFERENCE task tensor dims:" << std::endl;
+  // std::cout << "input: ";
+  // for (int i=0; i<in_domain.get_dim(); i++) {
+  //   std::cout << in_domain.hi()[i] - in_domain.lo()[i] + 1 << " ";
+  // }
+  // std::cout << std::endl;
+  // std::cout << "residual: ";
+  // for (int i=0; i<residual_domain.get_dim(); i++) {
+  //   std::cout << residual_domain.hi()[i] - residual_domain.lo()[i] + 1 << "
+  //   ";
+  // }
+  // std::cout << std::endl;
+  // std::cout << "added_output: ";
+  // for (int i=0; i<added_out_domain.get_dim(); i++) {
+  //   std::cout << added_out_domain.hi()[i] - added_out_domain.lo()[i] + 1 << "
+  //   ";
+  // }
+  // std::cout << std::endl;
+  // std::cout << "output: ";
+  // for (int i=0; i<out_domain.get_dim(); i++) {
+  //   std::cout << out_domain.hi()[i] - out_domain.lo()[i] + 1 << " ";
+  // }
+  // std::cout << std::endl;
+  // std::cout << "attn_bias: ";
+  // for (int i=0; i<attn_bias_domain.get_dim(); i++) {
+  //   std::cout << attn_bias_domain.hi()[i] - attn_bias_domain.lo()[i] + 1 << "
+  //   ";
+  // }
+  // std::cout << std::endl;
+
+  // std::cout << "in_domain.get_volume(): " << in_domain.get_volume() <<
+  // std::endl; std::cout << "(int)attn_bias_dim: " << (int)attn_bias_dim <<
+  // std::endl;
+
+  if (m->elementwise_affine) {
+    gamma = helperGetGenericTensorAccessorRO(m->weight_type[1],
+                                             regions[5],
+                                             task->regions[5],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
+    gamma_domain = runtime->get_index_space_domain(
+        ctx, task->regions[5].region.get_index_space());
+
+    if (m->use_bias) {
+      beta = helperGetGenericTensorAccessorRO(m->weight_type[2],
+                                              regions[6],
+                                              task->regions[6],
+                                              FID_DATA,
+                                              ctx,
+                                              runtime);
+      beta_domain = runtime->get_index_space_domain(
+          ctx, task->regions[6].region.get_index_space());
+      assert(gamma_domain == beta_domain);
+    }
+
+    assert(gamma_domain.get_volume() == m->effective_num_elements);
+    int numdims = gamma_domain.get_dim();
+    size_t vol = 1;
+    int i = 0;
+    while (vol < gamma_domain.get_volume()) {
+      int g_d = gamma_domain.hi()[i] - gamma_domain.lo()[i] + 1;
+      int in_d = in_domain.hi()[i] - in_domain.lo()[i] + 1;
+      assert(g_d == in_d);
+      vol *= g_d;
+      i++;
+    }
+  }
+
+  AddBiasResidualLayerNorm::inference_kernel_wrapper(
+      m,
+      (int)attn_bias_dim,
+      (int)residual_domain.get_volume(),
+      input,
+      added_output,
+      output,
+      residual,
+      attn_bias,
+      gamma,
+      beta);
+}
+
+bool AddBiasResidualLayerNorm::measure_operator_cost(
+    Simulator *sim, MachineView const &mv, CostMetrics &cost_metrics) const {
+  return false;
+}
+
+void AddBiasResidualLayerNorm::serialize(Legion::Serializer &sez) const {
+  sez.serialize(this->layer_guid.id);
+  sez.serialize(this->layer_guid.transformer_layer_id);
+  sez.serialize(this->axes.size());
+  for (size_t i = 0; i < this->axes.size(); i++) {
+    sez.serialize(this->axes[i]);
+  }
+  sez.serialize(this->elementwise_affine);
+  sez.serialize(this->eps);
+  sez.serialize(this->use_bias);
+}
+
+using PCG::Node;
+/*static*/
+Node AddBiasResidualLayerNorm::deserialize(FFModel &ff,
+                                           Legion::Deserializer &dez,
+                                           ParallelTensor inputs[],
+                                           int num_inputs) {
+  assert(num_inputs == 2);
+  size_t num_axes;
+  std::vector<int> axes;
+  bool elementwise_affine;
+  bool use_bias;
+  float eps;
+  size_t id, transformer_layer_id;
+  dez.deserialize(id);
+  dez.deserialize(transformer_layer_id);
+  LayerID layer_guid(id, transformer_layer_id);
+  dez.deserialize(num_axes);
+  for (size_t i = 0; i < num_axes; i++) {
+    int axis_idx;
+    dez.deserialize(axis_idx);
+    axes.push_back(axis_idx);
+  }
+  dez.deserialize(elementwise_affine);
+  dez.deserialize(eps);
+  dez.deserialize(use_bias);
+
+  AddBiasResidualLayerNormParams params;
+  params.layer_guid = layer_guid;
+  params.axes = axes;
+  params.elementwise_affine = elementwise_affine;
+  params.eps = eps;
+  params.use_bias = use_bias;
+  return ff.get_or_create_node<AddBiasResidualLayerNorm>({inputs[0], inputs[1]},
+                                                         params);
+}
+
+}; // namespace FlexFlow
+
+namespace std {
+size_t hash<FlexFlow::AddBiasResidualLayerNormParams>::operator()(
+    FlexFlow::AddBiasResidualLayerNormParams const &params) const {
+  size_t key = 0;
+  hash_combine(key, params.axes.size());
+  for (int n : params.axes) {
+    hash_combine(key, n);
+  }
+  hash_combine(key, params.elementwise_affine);
+  hash_combine(key, params.use_bias);
+  return key;
+}
+}; // namespace std
diff --git a/src/ops/add_bias_residual_layer_norm.cpp b/src/ops/add_bias_residual_layer_norm.cpp
new file mode 100644
index 0000000000..3570ae42dc
--- /dev/null
+++ b/src/ops/add_bias_residual_layer_norm.cpp
@@ -0,0 +1,262 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/add_bias_residual_layer_norm.h"
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/utils/hip_helper.h"
+#include <hip/hip_runtime.h>
+
+namespace FlexFlow {
+
+#define C10_WARP_SIZE 32
+constexpr int kCUDABlockReduceNumThreads = 512;
+constexpr int kCUDANumThreads = 256;
+
+AddBiasResidualLayerNormMeta::AddBiasResidualLayerNormMeta(
+    FFHandler handle,
+    AddBiasResidualLayerNorm const *ln,
+    MemoryAllocator &gpu_mem_allocator)
+    : OpMeta(handle) {
+  elementwise_affine = ln->elementwise_affine;
+  use_bias = ln->use_bias;
+  effective_batch_size = ln->effective_batch_size;
+  effective_num_elements = ln->effective_num_elements;
+  profiling = ln->profiling;
+  eps = ln->eps;
+  DataType data_type = ln->data_type;
+  size_t totalSize = effective_batch_size * data_type_size(data_type) * 3;
+  gpu_mem_allocator.create_legion_instance(reserveInst, totalSize);
+  mean_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+  rstd_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+  bias_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+}
+
+AddBiasResidualLayerNormMeta::~AddBiasResidualLayerNormMeta(void) {
+  if (reserveInst != Realm::RegionInstance::NO_INST) {
+    reserveInst.destroy();
+  }
+}
+
+template <typename T>
+__device__ __forceinline__ T WARP_SHFL_DOWN(T value,
+                                            unsigned int delta,
+                                            int width = warpSize,
+                                            unsigned int mask = 0xffffffff) {
+#ifndef __HIP_PLATFORM_HCC__
+  return __shfl_down_sync(mask, value, delta, width);
+#else
+  return __shfl_down(value, delta, width);
+#endif
+}
+
+template <typename T>
+__inline__ __device__ T WarpReduceSum(T val) {
+#pragma unroll
+  for (int offset = (C10_WARP_SIZE >> 1); offset > 0; offset >>= 1) {
+    val += WARP_SHFL_DOWN(val, offset);
+  }
+  return val;
+}
+
+template <typename T>
+__inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
+  int const lid = threadIdx.x % C10_WARP_SIZE;
+  int const wid = threadIdx.x / C10_WARP_SIZE;
+  val = WarpReduceSum(val);
+  __syncthreads();
+  if (lid == 0) {
+    shared[wid] = val;
+  }
+  __syncthreads();
+  val = (threadIdx.x < min(blockDim.x, max_num_threads) / C10_WARP_SIZE)
+            ? shared[lid]
+            : 0;
+  if (wid == 0) {
+    val = WarpReduceSum(val);
+  }
+  return val;
+}
+
+template <typename T>
+__global__ void LayerNormFusedForwardKernel(int attn_bias_dim,
+                                            int residual_volume,
+                                            int64_t effective_num_elements,
+                                            int64_t effective_batch_size,
+                                            float eps,
+                                            T const *input_ptr,
+                                            T const *attn_bias_ptr,
+                                            T const *residual_ptr,
+                                            T *added_output_ptr,
+                                            T *output_ptr,
+                                            T const *gamma_ptr,
+                                            T const *beta_ptr,
+                                            T *mean,
+                                            T *rstd) {
+  // Add attention bias and residual
+  CUDA_KERNEL_LOOP(i, residual_volume) {
+    int bias_idx = i % attn_bias_dim;
+    added_output_ptr[i] =
+        input_ptr[i] + attn_bias_ptr[bias_idx] + residual_ptr[i];
+  }
+
+  __syncthreads();
+
+  // LayerNorm
+  __shared__ float m_shared[C10_WARP_SIZE];
+  __shared__ float v_shared[C10_WARP_SIZE];
+  const int64_t i = blockIdx.x;
+  if (i >= effective_batch_size) {
+    return;
+  }
+  float sum1 = 0.0f;
+  float sum2 = 0.0f;
+  for (int64_t j = threadIdx.x; j < effective_num_elements;
+       j += min(blockDim.x, kCUDABlockReduceNumThreads)) {
+    const int64_t index = i * effective_num_elements + j;
+    sum1 += static_cast<float>(added_output_ptr[index]);
+    sum2 += static_cast<float>(added_output_ptr[index]) *
+            static_cast<float>(added_output_ptr[index]);
+  }
+  if (threadIdx.x < kCUDABlockReduceNumThreads) {
+    sum1 = BlockReduceSum<float>(
+        sum1, m_shared, min(blockDim.x, kCUDABlockReduceNumThreads));
+    sum2 = BlockReduceSum<float>(
+        sum2, v_shared, min(blockDim.x, kCUDABlockReduceNumThreads));
+  }
+  if (threadIdx.x == 0) {
+    float const scale = float(1) / static_cast<float>(effective_num_elements);
+    sum1 *= scale;
+    sum2 = max(sum2 * scale - sum1 * sum1, float(0));
+    mean[i] = static_cast<T>(sum1);
+    rstd[i] = static_cast<T>(rsqrt(sum2 + eps));
+  }
+
+  __syncthreads();
+
+  using T_ACC = T;
+  for (int64_t j = threadIdx.x; j < effective_num_elements;
+       j += min(blockDim.x, kCUDANumThreads)) {
+    const int64_t index = i * effective_num_elements + j;
+    const T_ACC gamma_v =
+        gamma_ptr == nullptr ? T_ACC(1) : static_cast<T_ACC>(gamma_ptr[j]);
+    const T_ACC beta_v =
+        beta_ptr == nullptr ? T_ACC(0) : static_cast<T_ACC>(beta_ptr[j]);
+    output_ptr[index] = (static_cast<T_ACC>(added_output_ptr[index]) -
+                         static_cast<T_ACC>(mean[i])) *
+                            static_cast<T_ACC>(rstd[i]) * gamma_v +
+                        beta_v;
+  }
+}
+
+/*static*/
+template <typename T>
+void AddBiasResidualLayerNorm::inference_kernel(
+    AddBiasResidualLayerNormMeta const *m,
+    int attn_bias_dim,
+    int residual_volume,
+    T const *input_ptr,
+    T const *attn_bias_ptr,
+    T const *residual_ptr,
+    T *added_output_ptr,
+    T *output_ptr,
+    T const *gamma_ptr,
+    T const *beta_ptr,
+    hipStream_t stream) {
+
+  std::pair<int, int> kernel1_parallelism = std::make_pair(
+      GET_BLOCKS(residual_volume), std::min(residual_volume, CUDA_NUM_THREADS));
+  std::pair<int, int> kernel2_parallelism =
+      std::make_pair(m->effective_batch_size, kCUDABlockReduceNumThreads);
+  std::pair<int, int> kernel3_parallelism =
+      std::make_pair(m->effective_batch_size, kCUDANumThreads);
+
+  int num_blocks = std::max({kernel1_parallelism.first,
+                             kernel2_parallelism.first,
+                             kernel3_parallelism.first});
+  int num_threads = std::max({kernel1_parallelism.second,
+                              kernel2_parallelism.second,
+                              kernel3_parallelism.second});
+
+  hipLaunchKernelGGL(HIP_KERNEL_NAME(LayerNormFusedForwardKernel<T>),
+                     num_blocks,
+                     num_threads,
+                     0,
+                     stream,
+                     attn_bias_dim,
+                     residual_volume,
+                     m->effective_num_elements,
+                     m->effective_batch_size,
+                     m->eps,
+                     input_ptr,
+                     attn_bias_ptr,
+                     residual_ptr,
+                     added_output_ptr,
+                     output_ptr,
+                     gamma_ptr,
+                     beta_ptr,
+                     static_cast<T *>(m->mean_ptr),
+                     static_cast<T *>(m->rstd_ptr));
+}
+
+/*static*/
+void AddBiasResidualLayerNorm::inference_kernel_wrapper(
+    AddBiasResidualLayerNormMeta const *m,
+    int attn_bias_dim,
+    int residual_volume,
+    GenericTensorAccessorR const &input,
+    GenericTensorAccessorW &added_output,
+    GenericTensorAccessorW &output,
+    GenericTensorAccessorR const &residual,
+    GenericTensorAccessorR const &attn_bias,
+    GenericTensorAccessorR const &gamma,
+    GenericTensorAccessorR const &beta) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  if (m->input_type[0] == DT_FLOAT) {
+    AddBiasResidualLayerNorm::inference_kernel<float>(
+        m,
+        attn_bias_dim,
+        residual_volume,
+        input.get_float_ptr(),
+        attn_bias.get_float_ptr(),
+        residual.get_float_ptr(),
+        added_output.get_float_ptr(),
+        output.get_float_ptr(),
+        gamma.get_float_ptr(),
+        m->use_bias ? beta.get_float_ptr() : nullptr,
+        stream);
+  } else if (m->input_type[0] == DT_HALF) {
+    AddBiasResidualLayerNorm::inference_kernel<half>(
+        m,
+        attn_bias_dim,
+        residual_volume,
+        input.get_half_ptr(),
+        attn_bias.get_half_ptr(),
+        residual.get_half_ptr(),
+        added_output.get_half_ptr(),
+        output.get_half_ptr(),
+        gamma.get_half_ptr(),
+        m->use_bias ? beta.get_half_ptr() : nullptr,
+        stream);
+  } else {
+    assert(false && "unsupport datatype in layernorm");
+  }
+}
+
+}; // namespace FlexFlow
diff --git a/src/ops/add_bias_residual_layer_norm.cu b/src/ops/add_bias_residual_layer_norm.cu
new file mode 100644
index 0000000000..9ac440080f
--- /dev/null
+++ b/src/ops/add_bias_residual_layer_norm.cu
@@ -0,0 +1,299 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/ops/add_bias_residual_layer_norm.h"
+#include "flexflow/utils/cuda_helper.h"
+
+namespace FlexFlow {
+
+#define C10_WARP_SIZE 32
+constexpr int kCUDABlockReduceNumThreads = 512;
+constexpr int kCUDANumThreads = 256;
+
+AddBiasResidualLayerNormMeta::AddBiasResidualLayerNormMeta(
+    FFHandler handle,
+    AddBiasResidualLayerNorm const *ln,
+    MemoryAllocator &gpu_mem_allocator)
+    : OpMeta(handle) {
+  elementwise_affine = ln->elementwise_affine;
+  use_bias = ln->use_bias;
+  effective_batch_size = ln->effective_batch_size;
+  effective_num_elements = ln->effective_num_elements;
+  profiling = ln->profiling;
+  eps = ln->eps;
+  DataType data_type = ln->data_type;
+  size_t totalSize = effective_batch_size * data_type_size(data_type) * 3;
+  gpu_mem_allocator.create_legion_instance(reserveInst, totalSize);
+  mean_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+  rstd_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+  bias_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+}
+
+AddBiasResidualLayerNormMeta::~AddBiasResidualLayerNormMeta(void) {
+  if (reserveInst != Realm::RegionInstance::NO_INST) {
+    reserveInst.destroy();
+  }
+}
+
+template <typename T>
+__device__ __forceinline__ T WARP_SHFL_DOWN(T value,
+                                            unsigned int delta,
+                                            int width = warpSize,
+                                            unsigned int mask = 0xffffffff) {
+#ifndef __HIP_PLATFORM_HCC__
+  return __shfl_down_sync(mask, value, delta, width);
+#else
+  return __shfl_down(value, delta, width);
+#endif
+}
+
+template <typename T>
+__inline__ __device__ T WarpReduceSum(T val) {
+#pragma unroll
+  for (int offset = (C10_WARP_SIZE >> 1); offset > 0; offset >>= 1) {
+    val += WARP_SHFL_DOWN(val, offset);
+  }
+  return val;
+}
+
+template <typename T>
+__inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
+  int const lid = threadIdx.x % C10_WARP_SIZE;
+  int const wid = threadIdx.x / C10_WARP_SIZE;
+  val = WarpReduceSum(val);
+  __syncthreads();
+  if (lid == 0) {
+    shared[wid] = val;
+  }
+  __syncthreads();
+  val = (threadIdx.x < min(blockDim.x, max_num_threads) / C10_WARP_SIZE)
+            ? shared[lid]
+            : 0;
+  if (wid == 0) {
+    val = WarpReduceSum(val);
+  }
+  return val;
+}
+
+template <typename T>
+__global__ void LayerNormFusedForwardKernel(int64_t N,
+                                            int64_t attn_bias_dim,
+                                            float eps,
+                                            T const *input_ptr,
+                                            T const *attn_bias_ptr,
+                                            T const *residual_ptr,
+                                            T *X,
+                                            T *mean,
+                                            T *rstd,
+                                            T const *gamma,
+                                            T const *beta,
+                                            T *Y) {
+  __shared__ float m_shared[C10_WARP_SIZE];
+  __shared__ float v_shared[C10_WARP_SIZE];
+  const int64_t i = blockIdx.x;
+  float sum1 = 0.0f;
+  float sum2 = 0.0f;
+  for (int64_t j = threadIdx.x; j < N;
+       j += min(blockDim.x, kCUDABlockReduceNumThreads)) {
+    const int64_t index = i * N + j;
+    const int64_t bias_idx = index % attn_bias_dim;
+    X[index] = input_ptr[index] + attn_bias_ptr[bias_idx] + residual_ptr[index];
+    sum1 += static_cast<float>(X[index]);
+    sum2 += static_cast<float>(X[index]) * static_cast<float>(X[index]);
+  }
+  if (threadIdx.x < kCUDABlockReduceNumThreads) {
+    sum1 = BlockReduceSum<float>(
+        sum1, m_shared, min(blockDim.x, kCUDABlockReduceNumThreads));
+    sum2 = BlockReduceSum<float>(
+        sum2, v_shared, min(blockDim.x, kCUDABlockReduceNumThreads));
+  }
+  if (threadIdx.x == 0) {
+    float const scale = float(1) / static_cast<float>(N);
+    sum1 *= scale;
+    sum2 = max(sum2 * scale - sum1 * sum1, float(0));
+    mean[i] = static_cast<T>(sum1);
+    rstd[i] = static_cast<T>(rsqrt(sum2 + eps));
+  }
+
+  __syncthreads();
+
+  using T_ACC = T;
+  for (int64_t j = threadIdx.x; j < N; j += min(blockDim.x, kCUDANumThreads)) {
+    const int64_t index = i * N + j;
+    const T_ACC gamma_v =
+        gamma == nullptr ? T_ACC(1) : static_cast<T_ACC>(gamma[j]);
+    const T_ACC beta_v =
+        beta == nullptr ? T_ACC(0) : static_cast<T_ACC>(beta[j]);
+    Y[index] = (static_cast<T_ACC>(X[index]) - static_cast<T_ACC>(mean[i])) *
+                   static_cast<T_ACC>(rstd[i]) * gamma_v +
+               beta_v;
+  }
+}
+
+/*static*/
+template <typename T>
+void AddBiasResidualLayerNorm::inference_kernel(
+    AddBiasResidualLayerNormMeta const *m,
+    int attn_bias_dim,
+    int residual_volume,
+    T const *input_ptr,
+    T const *attn_bias_ptr,
+    T const *residual_ptr,
+    T *added_output_ptr,
+    T *output_ptr,
+    T const *gamma_ptr,
+    T const *beta_ptr,
+    cudaStream_t stream) {
+
+  std::pair<int, int> kernel1_parallelism =
+      std::make_pair(m->effective_batch_size, kCUDABlockReduceNumThreads);
+  std::pair<int, int> kernel2_parallelism =
+      std::make_pair(m->effective_batch_size, kCUDANumThreads);
+
+  int num_blocks =
+      std::max(kernel1_parallelism.first, kernel2_parallelism.first);
+  int num_threads =
+      std::max(kernel1_parallelism.second, kernel2_parallelism.second);
+
+  LayerNormFusedForwardKernel<T>
+      <<<num_blocks, num_threads, 0, stream>>>(m->effective_num_elements,
+                                               attn_bias_dim,
+                                               m->eps,
+                                               input_ptr,
+                                               attn_bias_ptr,
+                                               residual_ptr,
+                                               added_output_ptr,
+                                               static_cast<T *>(m->mean_ptr),
+                                               static_cast<T *>(m->rstd_ptr),
+                                               gamma_ptr,
+                                               beta_ptr,
+                                               output_ptr);
+}
+
+/*static*/
+void AddBiasResidualLayerNorm::inference_kernel_wrapper(
+    AddBiasResidualLayerNormMeta const *m,
+    int attn_bias_dim,
+    int residual_volume,
+    GenericTensorAccessorR const &input,
+    GenericTensorAccessorW &added_output,
+    GenericTensorAccessorW &output,
+    GenericTensorAccessorR const &residual,
+    GenericTensorAccessorR const &attn_bias,
+    GenericTensorAccessorR const &gamma,
+    GenericTensorAccessorR const &beta) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+  if (m->input_type[0] == DT_FLOAT) {
+    AddBiasResidualLayerNorm::inference_kernel<float>(
+        m,
+        attn_bias_dim,
+        residual_volume,
+        input.get_float_ptr(),
+        attn_bias.get_float_ptr(),
+        residual.get_float_ptr(),
+        added_output.get_float_ptr(),
+        output.get_float_ptr(),
+        gamma.get_float_ptr(),
+        m->use_bias ? beta.get_float_ptr() : nullptr,
+        stream);
+  } else if (m->input_type[0] == DT_HALF) {
+    AddBiasResidualLayerNorm::inference_kernel<half>(
+        m,
+        attn_bias_dim,
+        residual_volume,
+        input.get_half_ptr(),
+        attn_bias.get_half_ptr(),
+        residual.get_half_ptr(),
+        added_output.get_half_ptr(),
+        output.get_half_ptr(),
+        gamma.get_half_ptr(),
+        m->use_bias ? beta.get_half_ptr() : nullptr,
+        stream);
+  } else {
+    assert(false && "unsupport datatype in layernorm");
+  }
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[AddBiasResidualLayerNorm] forward time (CF) = %.9fms\n", elapsed);
+    // if (m->input_type[0] == DT_FLOAT) {
+    //   print_tensor<float>(input.get_float_ptr(),
+    //                       32,
+    //                       "[AddBiasResidualLayerNorm:forward:input]");
+    //   print_tensor<float>(attn_bias.get_float_ptr(),
+    //                       32,
+    //                       "[AddBiasResidualLayerNorm:forward:attn_bias]");
+    //   print_tensor<float>(residual.get_float_ptr(),
+    //                       32,
+    //                       "[AddBiasResidualLayerNorm:forward:residual]");
+    //   print_tensor<float>(added_output.get_float_ptr(),
+    //                       32,
+    //                       "[AddBiasResidualLayerNorm:forward:added_output]");
+    //   print_tensor<float>(output.get_float_ptr(),
+    //                       32,
+    //                       "[AddBiasResidualLayerNorm:forward:output]");
+    //   print_tensor<float>(gamma.get_float_ptr(),
+    //                       32,
+    //                       "[AddBiasResidualLayerNorm:forward:gamma]");
+    //   print_tensor<float>(
+    //       beta.get_float_ptr(), 32,
+    //       "[AddBiasResidualLayerNorm:forward:beta]");
+    // } else {
+    //   print_tensor<half>(
+    //       input.get_half_ptr(), 32,
+    //       "[AddBiasResidualLayerNorm:forward:input]");
+    //   print_tensor<half>(attn_bias.get_half_ptr(),
+    //                      32,
+    //                      "[AddBiasResidualLayerNorm:forward:attn_bias]");
+    //   print_tensor<half>(residual.get_half_ptr(),
+    //                      32,
+    //                      "[AddBiasResidualLayerNorm:forward:residual]");
+    //   print_tensor<half>(added_output.get_half_ptr(),
+    //                      32,
+    //                      "[AddBiasResidualLayerNorm:forward:added_output]");
+    //   print_tensor<half>(output.get_half_ptr(),
+    //                      32,
+    //                      "[AddBiasResidualLayerNorm:forward:output]");
+    //   print_tensor<half>(
+    //       gamma.get_half_ptr(), 32,
+    //       "[AddBiasResidualLayerNorm:forward:gamma]");
+    //   print_tensor<half>(
+    //       beta.get_half_ptr(), 32,
+    //       "[AddBiasResidualLayerNorm:forward:beta]");
+    // }
+    // print_tensor<T>(in_ptr, 32, "[AddBiasResidualLayerNorm:forward:input]");
+    // print_tensor<T>(out_ptr, 32,
+    // "[AddBiasResidualLayerNorm:forward:output]");
+  }
+}
+
+}; // namespace FlexFlow
diff --git a/src/ops/fused.cpp b/src/ops/fused.cpp
index 9824e8469d..c2780545f3 100644
--- a/src/ops/fused.cpp
+++ b/src/ops/fused.cpp
@@ -16,9 +16,11 @@
 #include "flexflow/ops/fused.h"
 #include "flexflow/accessor.h"
 #include "flexflow/model.h"
+#include "flexflow/ops/add_bias_residual_layer_norm.h"
 #include "flexflow/ops/batch_norm.h"
 #include "flexflow/ops/element_unary.h"
 #include "flexflow/ops/embedding.h"
+#include "flexflow/ops/flat.h"
 #include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ops/kernels/batch_matmul_kernels.h"
 #include "flexflow/ops/kernels/concat_kernels.h"
@@ -34,7 +36,6 @@
 #include "flexflow/ops/kernels/softmax_kernels.h"
 #include "flexflow/ops/kernels/transpose_kernels.h"
 #include "flexflow/ops/layer_norm.h"
-#include "flexflow/ops/linear.h"
 #include "flexflow/ops/spec_inc_multihead_self_attention.h"
 #include "flexflow/ops/tree_inc_multihead_self_attention.h"
 #include "flexflow/parallel_ops/kernels/allreduce_kernels.h"
@@ -49,9 +50,8 @@ using Legion::Domain;
 using Legion::Future;
 using Legion::LogicalPartition;
 using Legion::LogicalRegion;
+using Legion::Memory;
 using Legion::PhysicalRegion;
-using Legion::PointInRectIterator;
-using Legion::Rect;
 using Legion::Runtime;
 using Legion::Task;
 
@@ -73,7 +73,7 @@ OpMeta *FusedOp::init_task(Task const *task,
 /*
   regions[...](I): inputs
   regions[...](I): weights
-  regions[...](I): outputs
+  regions[...](O): outputs
 */
 __host__ void FusedOp::forward_task(Task const *task,
                                     std::vector<PhysicalRegion> const &regions,
@@ -233,7 +233,6 @@ __host__ void FusedOp::forward_task(Task const *task,
           if (!m->add_bias_only_once || task->index_point.point_data[0] == 0) {
             bias_ptr = my_weight_accessor[1].get_float_ptr();
           }
-          bias_ptr = my_weight_accessor[1].get_float_ptr();
         } else {
           assert(fused->op_num_weights[op] == 1);
         }
@@ -304,6 +303,71 @@ __host__ void FusedOp::forward_task(Task const *task,
                                                        my_output_accessor[0]);
         break;
       }
+      case OP_EMBEDDING: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        EmbeddingMeta *m = (EmbeddingMeta *)metas->meta[op];
+        if (m->aggr == AGGR_MODE_NONE) {
+          // assert(kernel_domain.get_dim() == 2);
+          assert(my_input_accessor[0].domain.get_dim() + 1 ==
+                 my_output_accessor[0].domain.get_dim());
+          for (size_t i = 0; i < my_input_accessor[0].domain.get_dim(); i++) {
+            assert(my_input_accessor[0].domain.hi()[i] ==
+                   my_output_accessor[0].domain.hi()[i + 1]);
+            assert(my_input_accessor[0].domain.lo()[i] ==
+                   my_output_accessor[0].domain.lo()[i + 1]);
+          }
+          assert(my_weight_accessor[0].domain.hi()[0] -
+                     my_weight_accessor[0].domain.lo()[0] ==
+                 my_output_accessor[0].domain.hi()[0] -
+                     my_output_accessor[0].domain.lo()[0]);
+        } else {
+          assert(my_input_accessor[0].domain.get_dim() ==
+                 my_output_accessor[0].domain.get_dim());
+          for (size_t i = 1; i < my_input_accessor[0].domain.get_dim(); i++) {
+            assert(my_input_accessor[0].domain.hi()[i] ==
+                   my_output_accessor[0].domain.hi()[i]);
+            assert(my_input_accessor[0].domain.lo()[i] ==
+                   my_output_accessor[0].domain.lo()[i]);
+          }
+          assert(my_weight_accessor[0].domain.hi()[0] -
+                     my_weight_accessor[0].domain.lo()[0] ==
+                 my_output_accessor[0].domain.hi()[0] -
+                     my_output_accessor[0].domain.lo()[0]);
+        }
+        int in_dim, out_dim, effective_batch_size;
+        if (m->aggr == AGGR_MODE_NONE) {
+          in_dim = 1;
+          out_dim = my_output_accessor[0].domain.hi()[0] -
+                    my_output_accessor[0].domain.lo()[0] + 1;
+          effective_batch_size =
+              my_output_accessor[0].domain.get_volume() / out_dim;
+          assert(effective_batch_size * in_dim ==
+                 my_input_accessor[0].domain.get_volume());
+        } else {
+          assert(m->aggr == AGGR_MODE_AVG || m->aggr == AGGR_MODE_SUM);
+          in_dim = my_input_accessor[0].domain.hi()[0] -
+                   my_input_accessor[0].domain.lo()[0] + 1;
+          out_dim = my_output_accessor[0].domain.hi()[0] -
+                    my_output_accessor[0].domain.lo()[0] + 1;
+          effective_batch_size =
+              my_output_accessor[0].domain.get_volume() / out_dim;
+          assert(effective_batch_size * in_dim ==
+                 my_input_accessor[0].domain.get_volume());
+        }
+
+        assert(my_input_accessor[0].data_type == DT_INT32 ||
+               my_input_accessor[0].data_type == DT_INT64);
+        Kernels::Embedding::forward_kernel_wrapper(m,
+                                                   my_input_accessor[0],
+                                                   my_output_accessor[0],
+                                                   my_weight_accessor[0],
+                                                   in_dim,
+                                                   out_dim,
+                                                   effective_batch_size);
+        break;
+      }
       case OP_GELU:
       case OP_RELU:
       case OP_SIGMOID:
@@ -391,6 +455,29 @@ __host__ void FusedOp::forward_task(Task const *task,
             my_output_accessor[0].domain);
         break;
       }
+      case OP_LAYERNORM: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        LayerNormMeta const *m = (LayerNormMeta *)metas->meta[op];
+        if (m->elementwise_affine) {
+          assert(fused->op_num_weights[op] == 1 + (int)(m->use_bias));
+        }
+        GenericTensorAccessorR gamma, beta;
+        if (m->elementwise_affine) {
+          gamma = my_weight_accessor[0];
+          if (m->use_bias) {
+            beta = my_weight_accessor[1];
+          }
+        }
+        LayerNorm::forward_kernel_wrapper(
+            m, my_input_accessor[0], my_output_accessor[0], gamma, beta);
+        break;
+      }
+      case OP_ADD_BIAS_RESIDUAL_LAYERNORM: {
+        assert(false && "Operator AddBiasResidualLayerNorm does not support "
+                        "the forward() task");
+        break;
+      }
       default: {
         fprintf(stderr,
                 "Fusion currently does not support type = %d\n",
@@ -410,7 +497,7 @@ __host__ void FusedOp::forward_task(Task const *task,
 /*
   regions[...](I): inputs
   regions[...](I): weights
-  regions[...](I): outputs
+  regions[...](O): outputs
 */
 __host__ void
     FusedOp::inference_task(Task const *task,
@@ -731,9 +818,10 @@ __host__ void
         assert(fused->op_num_outputs[op] == 1);
         IncMultiHeadSelfAttentionMeta const *m =
             (IncMultiHeadSelfAttentionMeta *)metas->meta[op];
-        assert(fused->op_num_weights[op] == (1 + (int)(*m->bias)));
+        assert(fused->op_num_weights[op] ==
+               (1 + (int)(*m->qkv_bias || *m->final_bias)));
         GenericTensorAccessorR biases;
-        if (*m->bias) {
+        if (*m->qkv_bias || *m->final_bias) {
           assert(fused->op_num_weights[op] == 2);
           biases = my_weight_accessor[1];
         }
@@ -754,9 +842,10 @@ __host__ void
             (TreeIncMultiHeadSelfAttentionMeta *)metas->meta[op];
         TreeVerifyBatchConfig const &tree_bc =
             Future(task->futures[0]).get_result<TreeVerifyBatchConfig>();
-        assert(fused->op_num_weights[op] == (1 + (int)(*m->bias)));
+        assert(fused->op_num_weights[op] ==
+               (1 + (int)(*m->qkv_bias || *m->final_bias)));
         GenericTensorAccessorR biases;
-        if (*m->bias) {
+        if (*m->qkv_bias || *m->final_bias) {
           assert(fused->op_num_weights[op] == 2);
           biases = my_weight_accessor[1];
         }
@@ -779,9 +868,10 @@ __host__ void
         //     (BeamSearchBatchConfig *)task->args;
         BeamSearchBatchConfig const &beam_bc =
             Future(task->futures[0]).get_result<BeamSearchBatchConfig>();
-        assert(fused->op_num_weights[op] == (1 + (int)(*m->bias)));
+        assert(fused->op_num_weights[op] ==
+               (1 + (int)(*m->qkv_bias || *m->final_bias)));
         GenericTensorAccessorR biases;
-        if (*m->bias) {
+        if (*m->qkv_bias || *m->final_bias) {
           assert(fused->op_num_weights[op] == 2);
           biases = my_weight_accessor[1];
         }
@@ -813,6 +903,45 @@ __host__ void
             m, my_input_accessor[0], my_output_accessor[0], gamma, beta);
         break;
       }
+      case OP_ADD_BIAS_RESIDUAL_LAYERNORM: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_outputs[op] == 2);
+        AddBiasResidualLayerNormMeta const *m =
+            (AddBiasResidualLayerNormMeta *)metas->meta[op];
+        if (!m->elementwise_affine) {
+          assert(fused->op_num_weights[op] == 1); // attn bias
+        } else {
+          if (!m->use_bias) {
+            assert(fused->op_num_weights[op] == 2); // attn bias + weight
+          } else {
+            assert(fused->op_num_weights[op] == 3); // attn bias + weight + bias
+          }
+        }
+        GenericTensorAccessorR gamma, beta;
+        if (m->elementwise_affine) {
+          gamma = my_weight_accessor[1];
+          if (m->use_bias) {
+            beta = my_weight_accessor[2];
+          }
+        }
+        Domain attn_bias_domain = my_weight_accessor[0].domain;
+        Domain residual_domain = my_input_accessor[1].domain;
+        int attn_bias_dim =
+            attn_bias_domain.hi()[0] - attn_bias_domain.lo()[0] + 1;
+        int residual_volume = residual_domain.get_volume();
+        AddBiasResidualLayerNorm::inference_kernel_wrapper(
+            m,
+            attn_bias_dim,
+            residual_volume,
+            my_input_accessor[0],
+            my_output_accessor[0],
+            my_output_accessor[1],
+            my_input_accessor[1],
+            my_weight_accessor[0],
+            gamma,
+            beta);
+        break;
+      }
       case OP_SOFTMAX: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_weights[op] == 0);
@@ -865,7 +994,6 @@ __host__ void
   regions[...](I/O): weight_grad
   regions[...](I/O): output_grad
 */
-
 __host__ void FusedOp::backward_task(Task const *task,
                                      std::vector<PhysicalRegion> const &regions,
                                      Context ctx,
@@ -1018,6 +1146,65 @@ __host__ void FusedOp::backward_task(Task const *task,
       assert(my_output_grad_accessor[i].domain == my_output_accessor[i].domain);
     }
     switch (fused->op_op_type[op]) {
+      case OP_BATCHMATMUL: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        Domain out_domain = my_output_accessor[0].domain;
+        Domain a_domain = my_input_accessor[0].domain;
+        Domain b_domain = my_input_accessor[1].domain;
+        // check dims
+        int m = b_domain.hi()[0] - b_domain.lo()[0] + 1;
+        assert(m == out_domain.hi()[0] - out_domain.lo()[0] + 1);
+        int n = a_domain.hi()[1] - a_domain.lo()[1] + 1;
+        assert(n == out_domain.hi()[1] - out_domain.lo()[1] + 1);
+        int k = a_domain.hi()[0] - a_domain.lo()[0] + 1;
+        assert(k == b_domain.hi()[1] - b_domain.lo()[1] + 1);
+        assert(a_domain.get_dim() == b_domain.get_dim());
+        assert(a_domain.get_dim() == out_domain.get_dim());
+        int batch = 1;
+        for (int i = 2; i < a_domain.get_dim(); i++) {
+          int dim_size = a_domain.hi()[i] - a_domain.lo()[i] + 1;
+          assert(dim_size == b_domain.hi()[i] - b_domain.lo()[i] + 1);
+          assert(dim_size == out_domain.hi()[i] - out_domain.lo()[i] + 1);
+          batch *= dim_size;
+        }
+        BatchMatmulMeta *meta = (BatchMatmulMeta *)metas->meta[op];
+        Kernels::BatchMatmul::backward_kernel_wrapper(
+            meta,
+            (float const *)my_output_accessor[0].get_float_ptr(),
+            (float const *)my_output_grad_accessor[0].get_float_ptr(),
+            (float const *)my_input_accessor[0].get_float_ptr(),
+            (float *)my_input_grad_accessor[0].get_float_ptr(),
+            (float const *)my_input_accessor[1].get_float_ptr(),
+            (float *)my_input_grad_accessor[1].get_float_ptr(),
+            (float *)nullptr,
+            m,
+            n,
+            k,
+            batch);
+        break;
+      }
+      case OP_BATCHNORM: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_accessor[0].domain.get_dim() == 5);
+        assert(my_weight_accessor[0].domain.get_dim() == 2);
+        assert(my_weight_accessor[1].domain.get_dim() == 2);
+        assert(my_output_accessor[0].domain.get_dim() == 5);
+        BatchNormMeta *m = (BatchNormMeta *)metas->meta[op];
+        BatchNorm::backward_kernel(
+            m,
+            (float const *)my_input_accessor[0].get_float_ptr(),
+            (float *)my_output_grad_accessor[0].get_float_ptr(),
+            (float const *)my_output_accessor[0].get_float_ptr(),
+            (float *)my_input_grad_accessor[0].get_float_ptr(),
+            (float const *)my_weight_accessor[0].get_float_ptr(),
+            (float *)my_weight_grad_accessor[0].get_float_ptr(),
+            (float *)my_weight_grad_accessor[1].get_float_ptr(),
+            my_output_accessor[0].domain.get_volume());
+        break;
+      }
       case OP_CONCAT: {
         assert(fused->op_num_weights[op] == 0);
         assert(fused->op_num_outputs[op] == 1);
@@ -1048,26 +1235,6 @@ __host__ void FusedOp::backward_task(Task const *task,
             my_weight_grad_accessor[1].get_float_ptr());
         break;
       }
-      case OP_BATCHNORM: {
-        assert(fused->op_num_inputs[op] == 1);
-        assert(fused->op_num_outputs[op] == 1);
-        assert(my_input_accessor[0].domain.get_dim() == 5);
-        assert(my_weight_accessor[0].domain.get_dim() == 2);
-        assert(my_weight_accessor[1].domain.get_dim() == 2);
-        assert(my_output_accessor[0].domain.get_dim() == 5);
-        BatchNormMeta *m = (BatchNormMeta *)metas->meta[op];
-        BatchNorm::backward_kernel(
-            m,
-            (float const *)my_input_accessor[0].get_float_ptr(),
-            (float *)my_output_grad_accessor[0].get_float_ptr(),
-            (float const *)my_output_accessor[0].get_float_ptr(),
-            (float *)my_input_grad_accessor[0].get_float_ptr(),
-            (float const *)my_weight_accessor[0].get_float_ptr(),
-            (float *)my_weight_grad_accessor[0].get_float_ptr(),
-            (float *)my_weight_grad_accessor[1].get_float_ptr(),
-            my_output_accessor[0].domain.get_volume());
-        break;
-      }
       case OP_DROPOUT: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
@@ -1078,6 +1245,61 @@ __host__ void FusedOp::backward_task(Task const *task,
             my_input_grad_accessor[0].get_float_ptr());
         break;
       }
+      case OP_EW_ADD:
+      case OP_EW_SUB:
+      case OP_EW_MUL:
+      case OP_EW_DIV:
+      case OP_EW_MAX:
+      case OP_EW_MIN: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_accessor[0].domain == my_input_accessor[1].domain);
+        assert(my_input_accessor[0].domain == my_output_accessor[0].domain);
+        ElementBinaryMeta *m = (ElementBinaryMeta *)metas->meta[op];
+        Kernels::ElementBinary::backward_kernel_wrapper(
+            m,
+            my_output_grad_accessor[0].get_float_ptr(),
+            my_input_accessor[0].get_float_ptr(),
+            my_input_accessor[1].get_float_ptr(),
+            my_input_grad_accessor[0].get_float_ptr(),
+            my_input_grad_accessor[1].get_float_ptr());
+        break;
+      }
+      case OP_EMBEDDING: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        EmbeddingMeta *m = (EmbeddingMeta *)metas->meta[op];
+        assert(my_input_accessor[0].data_type == DT_INT64);
+        int in_dim, out_dim, effective_batch_size;
+        if (m->aggr == AGGR_MODE_NONE) {
+          in_dim = 1;
+          out_dim = my_output_grad_accessor[0].domain.hi()[0] -
+                    my_output_grad_accessor[0].domain.lo()[0] + 1;
+          effective_batch_size =
+              my_output_grad_accessor[0].domain.get_volume() / out_dim;
+          assert(effective_batch_size * in_dim ==
+                 my_input_accessor[0].domain.get_volume());
+        } else {
+          in_dim = my_input_accessor[0].domain.hi()[0] -
+                   my_input_accessor[0].domain.lo()[0] + 1;
+          out_dim = my_output_grad_accessor[0].domain.hi()[0] -
+                    my_output_grad_accessor[0].domain.lo()[0] + 1;
+          effective_batch_size =
+              my_output_grad_accessor[0].domain.get_volume() / out_dim;
+          assert(effective_batch_size * in_dim ==
+                 my_input_accessor[0].domain.get_volume());
+        }
+        Kernels::Embedding::backward_kernel_wrapper(m,
+                                                    my_input_accessor[0],
+                                                    my_output_grad_accessor[0],
+                                                    my_weight_grad_accessor[0],
+                                                    in_dim,
+                                                    out_dim,
+                                                    effective_batch_size);
+        break;
+      }
       case OP_LINEAR: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
@@ -1110,66 +1332,6 @@ __host__ void FusedOp::backward_task(Task const *task,
             batch_size);
         break;
       }
-      case OP_BATCHMATMUL: {
-        assert(fused->op_num_inputs[op] == 2);
-        assert(fused->op_num_weights[op] == 0);
-        assert(fused->op_num_outputs[op] == 1);
-        Domain out_domain = my_output_accessor[0].domain;
-        Domain a_domain = my_input_accessor[0].domain;
-        Domain b_domain = my_input_accessor[1].domain;
-        // check dims
-        int m = b_domain.hi()[0] - b_domain.lo()[0] + 1;
-        assert(m == out_domain.hi()[0] - out_domain.lo()[0] + 1);
-        int n = a_domain.hi()[1] - a_domain.lo()[1] + 1;
-        assert(n == out_domain.hi()[1] - out_domain.lo()[1] + 1);
-        int k = a_domain.hi()[0] - a_domain.lo()[0] + 1;
-        assert(k == b_domain.hi()[1] - b_domain.lo()[1] + 1);
-        assert(a_domain.get_dim() == b_domain.get_dim());
-        assert(a_domain.get_dim() == out_domain.get_dim());
-        int batch = 1;
-        for (int i = 2; i < a_domain.get_dim(); i++) {
-          int dim_size = a_domain.hi()[i] - a_domain.lo()[i] + 1;
-          assert(dim_size == b_domain.hi()[i] - b_domain.lo()[i] + 1);
-          assert(dim_size == out_domain.hi()[i] - out_domain.lo()[i] + 1);
-          batch *= dim_size;
-        }
-        BatchMatmulMeta *meta = (BatchMatmulMeta *)metas->meta[op];
-        Kernels::BatchMatmul::backward_kernel_wrapper(
-            meta,
-            (float const *)my_output_accessor[0].get_float_ptr(),
-            (float const *)my_output_grad_accessor[0].get_float_ptr(),
-            (float const *)my_input_accessor[0].get_float_ptr(),
-            (float *)my_input_grad_accessor[0].get_float_ptr(),
-            (float const *)my_input_accessor[1].get_float_ptr(),
-            (float *)my_input_grad_accessor[1].get_float_ptr(),
-            (float *)nullptr,
-            m,
-            n,
-            k,
-            batch);
-        break;
-      }
-      case OP_EW_ADD:
-      case OP_EW_SUB:
-      case OP_EW_MUL:
-      case OP_EW_DIV:
-      case OP_EW_MAX:
-      case OP_EW_MIN: {
-        assert(fused->op_num_inputs[op] == 2);
-        assert(fused->op_num_weights[op] == 0);
-        assert(fused->op_num_outputs[op] == 1);
-        assert(my_input_accessor[0].domain == my_input_accessor[1].domain);
-        assert(my_input_accessor[0].domain == my_output_accessor[0].domain);
-        ElementBinaryMeta *m = (ElementBinaryMeta *)metas->meta[op];
-        Kernels::ElementBinary::backward_kernel_wrapper(
-            m,
-            my_output_grad_accessor[0].get_float_ptr(),
-            my_input_accessor[0].get_float_ptr(),
-            my_input_accessor[1].get_float_ptr(),
-            my_input_grad_accessor[0].get_float_ptr(),
-            my_input_grad_accessor[1].get_float_ptr());
-        break;
-      }
       case OP_GELU:
       case OP_RELU:
       case OP_SIGMOID:
diff --git a/src/ops/fused.cu b/src/ops/fused.cu
index 5cecbd168e..011dd9be75 100644
--- a/src/ops/fused.cu
+++ b/src/ops/fused.cu
@@ -15,6 +15,7 @@
 
 #include "flexflow/accessor.h"
 #include "flexflow/model.h"
+#include "flexflow/ops/add_bias_residual_layer_norm.h"
 #include "flexflow/ops/batch_norm.h"
 #include "flexflow/ops/element_unary.h"
 #include "flexflow/ops/embedding.h"
@@ -467,6 +468,29 @@ __host__ void FusedOp::forward_task(Task const *task,
             my_output_accessor[0].domain);
         break;
       }
+      case OP_LAYERNORM: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        LayerNormMeta const *m = (LayerNormMeta *)metas->meta[op];
+        if (m->elementwise_affine) {
+          assert(fused->op_num_weights[op] == 1 + (int)(m->use_bias));
+        }
+        GenericTensorAccessorR gamma, beta;
+        if (m->elementwise_affine) {
+          gamma = my_weight_accessor[0];
+          if (m->use_bias) {
+            beta = my_weight_accessor[1];
+          }
+        }
+        LayerNorm::forward_kernel_wrapper(
+            m, my_input_accessor[0], my_output_accessor[0], gamma, beta);
+        break;
+      }
+      case OP_ADD_BIAS_RESIDUAL_LAYERNORM: {
+        assert(false && "Operator AddBiasResidualLayerNorm does not support "
+                        "the forward() task");
+        break;
+      }
       default: {
         fprintf(stderr,
                 "Fusion currently does not support type = %d\n",
@@ -823,9 +847,10 @@ __host__ void
         assert(fused->op_num_outputs[op] == 1);
         IncMultiHeadSelfAttentionMeta const *m =
             (IncMultiHeadSelfAttentionMeta *)metas->meta[op];
-        assert(fused->op_num_weights[op] == (1 + (int)(*m->bias)));
+        assert(fused->op_num_weights[op] ==
+               (1 + (int)(*m->qkv_bias || *m->final_bias)));
         GenericTensorAccessorR biases;
-        if (*m->bias) {
+        if (*m->qkv_bias || *m->final_bias) {
           assert(fused->op_num_weights[op] == 2);
           biases = my_weight_accessor[1];
         }
@@ -848,9 +873,10 @@ __host__ void
         //     (TreeVerifyBatchConfig *)task->args;
         TreeVerifyBatchConfig const &tree_bc =
             Future(task->futures[0]).get_result<TreeVerifyBatchConfig>();
-        assert(fused->op_num_weights[op] == (1 + (int)(*m->bias)));
+        assert(fused->op_num_weights[op] ==
+               (1 + (int)(*m->qkv_bias || *m->final_bias)));
         GenericTensorAccessorR biases;
-        if (*m->bias) {
+        if (*m->qkv_bias || *m->final_bias) {
           assert(fused->op_num_weights[op] == 2);
           biases = my_weight_accessor[1];
         }
@@ -873,9 +899,10 @@ __host__ void
         //     (BeamSearchBatchConfig *)task->args;
         BeamSearchBatchConfig const &beam_bc =
             Future(task->futures[0]).get_result<BeamSearchBatchConfig>();
-        assert(fused->op_num_weights[op] == (1 + (int)(*m->bias)));
+        assert(fused->op_num_weights[op] ==
+               (1 + (int)(*m->qkv_bias || *m->final_bias)));
         GenericTensorAccessorR biases;
-        if (*m->bias) {
+        if (*m->qkv_bias || *m->final_bias) {
           assert(fused->op_num_weights[op] == 2);
           biases = my_weight_accessor[1];
         }
@@ -907,6 +934,45 @@ __host__ void
             m, my_input_accessor[0], my_output_accessor[0], gamma, beta);
         break;
       }
+      case OP_ADD_BIAS_RESIDUAL_LAYERNORM: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_outputs[op] == 2);
+        AddBiasResidualLayerNormMeta const *m =
+            (AddBiasResidualLayerNormMeta *)metas->meta[op];
+        if (!m->elementwise_affine) {
+          assert(fused->op_num_weights[op] == 1); // attn bias
+        } else {
+          if (!m->use_bias) {
+            assert(fused->op_num_weights[op] == 2); // attn bias + weight
+          } else {
+            assert(fused->op_num_weights[op] == 3); // attn bias + weight + bias
+          }
+        }
+        GenericTensorAccessorR gamma, beta;
+        if (m->elementwise_affine) {
+          gamma = my_weight_accessor[1];
+          if (m->use_bias) {
+            beta = my_weight_accessor[2];
+          }
+        }
+        Domain attn_bias_domain = my_weight_accessor[0].domain;
+        Domain residual_domain = my_input_accessor[1].domain;
+        int attn_bias_dim =
+            attn_bias_domain.hi()[0] - attn_bias_domain.lo()[0] + 1;
+        int residual_volume = residual_domain.get_volume();
+        AddBiasResidualLayerNorm::inference_kernel_wrapper(
+            m,
+            attn_bias_dim,
+            residual_volume,
+            my_input_accessor[0],
+            my_output_accessor[0],
+            my_output_accessor[1],
+            my_input_accessor[1],
+            my_weight_accessor[0],
+            gamma,
+            beta);
+        break;
+      }
       case OP_SOFTMAX: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_weights[op] == 0);
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index 2c7518bae9..7cb9867312 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -64,8 +64,8 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
                                              int kdim,
                                              int vdim,
                                              float dropout,
-                                             bool bias,
-                                             bool add_bias_kv,
+                                             bool qkv_bias,
+                                             bool final_bias,
                                              bool add_zero_attn,
                                              DataType data_type,
                                              Initializer *kernel_initializer,
@@ -82,8 +82,8 @@ Tensor FFModel::inc_multihead_self_attention(const Tensor input,
                                        kdim,
                                        vdim,
                                        dropout,
-                                       bias,
-                                       add_bias_kv,
+                                       qkv_bias,
+                                       final_bias,
                                        add_zero_attn,
                                        data_type,
                                        kernel_initializer,
@@ -102,8 +102,8 @@ Tensor FFModel::inc_multiquery_self_attention(const Tensor input,
                                               int kdim,
                                               int vdim,
                                               float dropout,
-                                              bool bias,
-                                              bool add_bias_kv,
+                                              bool qkv_bias,
+                                              bool final_bias,
                                               bool add_zero_attn,
                                               DataType data_type,
                                               Initializer *kernel_initializer,
@@ -119,7 +119,7 @@ Tensor FFModel::inc_multiquery_self_attention(const Tensor input,
   DataType quantization_type = cpu_offload ? config.quantization_type : DT_NONE;
   bool offload = cpu_offload;
   Layer *li = nullptr;
-  int weight_num = bias ? 2 : 1;
+  int weight_num = (qkv_bias || final_bias) ? 2 : 1;
   if (data_type != input->data_type) {
     Tensor casted_input = cast(input, data_type, "type cast for IncMHA");
     li = new Layer(this,
@@ -178,10 +178,12 @@ Tensor FFModel::inc_multiquery_self_attention(const Tensor input,
         kernel_initializer,
         CHOSEN_SYNC_TYPE);
   }
-  if (bias) {
+  if (qkv_bias || final_bias) {
     // q, k, v, o
-    int dims[1] = {qProjSize * num_q_heads +
-                   (kProjSize + vProjSize) * num_kv_heads + oProjSize};
+    int qkv_bias_size =
+        qProjSize * num_q_heads + (kProjSize + vProjSize) * num_kv_heads;
+    int dims[1] = {(qkv_bias ? qkv_bias_size : 0) +
+                   (final_bias ? oProjSize : 0)};
     li->weights[1] = create_weight_legion_ordering(1,
                                                    dims,
                                                    data_type,
@@ -196,8 +198,8 @@ Tensor FFModel::inc_multiquery_self_attention(const Tensor input,
   li->add_int_property("num_kv_heads", num_kv_heads);
   li->add_int_property("kdim", kdim);
   li->add_int_property("vdim", vdim);
-  li->add_int_property("bias", bias);
-  li->add_int_property("add_bias_kv", add_bias_kv);
+  li->add_int_property("qkv_bias", qkv_bias);
+  li->add_int_property("final_bias", final_bias);
   li->add_int_property("add_zero_attn", add_zero_attn);
   li->add_float_property("dropout", dropout);
   li->add_int_property("apply_rotary_embedding", apply_rotary_embedding);
@@ -231,10 +233,10 @@ Op *IncMultiHeadSelfAttention::create_operator_from_layer(
   int vdim = value;
   float dropout;
   layer->get_float_property("dropout", dropout);
-  layer->get_int_property("bias", value);
-  bool bias = (bool)value;
-  layer->get_int_property("add_bias_kv", value);
-  bool add_bias_kv = (bool)value;
+  layer->get_int_property("qkv_bias", value);
+  bool qkv_bias = (bool)value;
+  layer->get_int_property("final_bias", value);
+  bool final_bias = (bool)value;
   layer->get_int_property("add_zero_attn", value);
   bool add_zero_attn = (bool)value;
   layer->get_int_property("apply_rotary_embedding", value);
@@ -264,8 +266,8 @@ Op *IncMultiHeadSelfAttention::create_operator_from_layer(
                                        kdim,
                                        vdim,
                                        dropout,
-                                       bias,
-                                       add_bias_kv,
+                                       qkv_bias,
+                                       final_bias,
                                        add_zero_attn,
                                        apply_rotary_embedding,
                                        scaling_query,
@@ -289,8 +291,8 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     int _kdim,
     int _vdim,
     float _dropout,
-    bool _bias,
-    bool _add_bias_kv,
+    bool _qkv_bias,
+    bool _final_bias,
     bool _add_zero_attn,
     bool _apply_rotary_embedding,
     bool _scaling_query,
@@ -308,11 +310,12 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
          _input->data_type,
          name,
          1 /*inputs*/,
-         (_bias ? 2 : 1), /*weights*/
+         (_qkv_bias || _final_bias ? 2 : 1), /*weights*/
          1 /*outputs*/,
          _input),
       num_q_heads(_num_q_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
-      bias(_bias), add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      qkv_bias(_qkv_bias), final_bias(_final_bias),
+      add_zero_attn(_add_zero_attn),
       apply_rotary_embedding(_apply_rotary_embedding),
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
       vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
@@ -365,11 +368,12 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
         true /*create_grad*/,
         initializer,
         CHOSEN_SYNC_TYPE);
-    if (bias) {
+    if (qkv_bias || final_bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
-      bias_shape.dims[0].size = qProjSize * num_q_heads +
-                                (kProjSize + vProjSize) * num_kv_heads +
-                                oProjSize;
+      int qkv_bias_size =
+          qProjSize * num_q_heads + (kProjSize + vProjSize) * num_kv_heads;
+      bias_shape.dims[0].size =
+          (qkv_bias ? qkv_bias_size : 0) + (final_bias ? oProjSize : 0);
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
       weights[1] =
           model.create_parallel_weight_legion_ordering(bias_shape.num_dims,
@@ -401,8 +405,8 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     int _kdim,
     int _vdim,
     float _dropout,
-    bool _bias,
-    bool _add_bias_kv,
+    bool _qkv_bias,
+    bool _final_bias,
     bool _add_zero_attn,
     bool _apply_rotary_embedding,
     bool _scaling_query,
@@ -420,12 +424,13 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
          _input->data_type,
          name,
          1 /*inputs*/,
-         (_bias ? 2 : 1), /*weights*/
+         (_qkv_bias || _final_bias ? 2 : 1), /*weights*/
          1 /*outputs*/,
          _input,
          _weight),
       num_q_heads(_num_q_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
-      bias(_bias), add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      qkv_bias(_qkv_bias), final_bias(_final_bias),
+      add_zero_attn(_add_zero_attn),
       apply_rotary_embedding(_apply_rotary_embedding),
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
       vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
@@ -477,11 +482,12 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
         true /*create_grad*/,
         initializer,
         CHOSEN_SYNC_TYPE);
-    if (bias) {
+    if (qkv_bias || final_bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
-      bias_shape.dims[0].size = qProjSize * num_q_heads +
-                                (kProjSize + vProjSize) * num_kv_heads +
-                                oProjSize;
+      int qkv_bias_size =
+          qProjSize * num_q_heads + (kProjSize + vProjSize) * num_kv_heads;
+      bias_shape.dims[0].size =
+          (qkv_bias ? qkv_bias_size : 0) + (final_bias ? oProjSize : 0);
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
       weights[1] =
           model.create_parallel_weight_legion_ordering(bias_shape.num_dims,
@@ -520,8 +526,8 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
                                 other.qProjSize,
                                 other.vProjSize,
                                 other.dropout,
-                                other.bias,
-                                other.add_bias_kv,
+                                other.qkv_bias,
+                                other.final_bias,
                                 other.add_zero_attn,
                                 other.apply_rotary_embedding,
                                 other.scaling_query,
@@ -549,8 +555,8 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
                                 params.kdim,
                                 params.vdim,
                                 params.dropout,
-                                params.bias,
-                                params.add_bias_kv,
+                                params.qkv_bias,
+                                params.final_bias,
                                 params.add_zero_attn,
                                 params.apply_rotary_embedding,
                                 params.scaling_query,
@@ -779,7 +785,7 @@ FutureMap IncMultiHeadSelfAttention::inference(
                                                     batch_outputs[0]->region));
   launcher.add_field(idx++, FID_DATA);
 
-  if (bias) {
+  if (qkv_bias || final_bias) {
     launcher.add_region_requirement(
         RegionRequirement(weights[1]->part,
                           0 /*projection id*/,
@@ -817,7 +823,8 @@ void IncMultiHeadSelfAttention::inference_task(
   IncMultiHeadSelfAttentionMeta const *m =
       *((IncMultiHeadSelfAttentionMeta **)task->local_args);
 
-  assert((*m->bias ? regions.size() == 4 : regions.size() == 3));
+  assert(((*m->qkv_bias || *m->final_bias) ? regions.size() == 4
+                                           : regions.size() == 3));
 
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
@@ -826,7 +833,7 @@ void IncMultiHeadSelfAttention::inference_task(
   GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
       m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
   GenericTensorAccessorR biases;
-  if (*m->bias) {
+  if (*m->qkv_bias || *m->final_bias) {
     biases = helperGetGenericTensorAccessorRO(m->weight_type[1],
                                               regions[3],
                                               task->regions[3],
@@ -1643,7 +1650,7 @@ bool operator==(IncMultiHeadSelfAttentionParams const &lhs,
   return lhs.layer_guid == rhs.layer_guid && lhs.embed_dim == rhs.embed_dim &&
          lhs.num_q_heads == rhs.num_q_heads && lhs.kdim == rhs.kdim &&
          lhs.vdim == rhs.vdim && lhs.dropout == rhs.dropout &&
-         lhs.bias == rhs.bias && lhs.add_bias_kv == rhs.add_bias_kv &&
+         lhs.qkv_bias == rhs.qkv_bias && lhs.final_bias == rhs.final_bias &&
          lhs.add_zero_attn == rhs.add_zero_attn &&
          lhs.apply_rotary_embedding == rhs.apply_rotary_embedding &&
          lhs.scaling_query == rhs.scaling_query &&
@@ -1660,8 +1667,8 @@ IncMultiHeadSelfAttentionParams IncMultiHeadSelfAttention::get_params() const {
   params.kdim = this->kProjSize;
   params.vdim = this->vProjSize;
   params.dropout = this->dropout;
-  params.bias = this->bias;
-  params.add_bias_kv = this->add_bias_kv;
+  params.qkv_bias = this->qkv_bias;
+  params.final_bias = this->final_bias;
   params.add_zero_attn = this->add_zero_attn;
   params.apply_rotary_embedding = this->apply_rotary_embedding;
   params.scaling_query = this->scaling_query;
@@ -1689,8 +1696,8 @@ size_t hash<FlexFlow::IncMultiHeadSelfAttentionParams>::operator()(
   hash_combine(key, params.kdim);
   hash_combine(key, params.vdim);
   hash_combine(key, params.dropout);
-  hash_combine(key, params.bias);
-  hash_combine(key, params.add_bias_kv);
+  hash_combine(key, params.qkv_bias);
+  hash_combine(key, params.final_bias);
   hash_combine(key, params.add_zero_attn);
   hash_combine(key, params.apply_rotary_embedding);
   hash_combine(key, params.scaling_query);
diff --git a/src/ops/inc_multihead_self_attention.cpp b/src/ops/inc_multihead_self_attention.cpp
index a08114fec9..8fb635bace 100644
--- a/src/ops/inc_multihead_self_attention.cpp
+++ b/src/ops/inc_multihead_self_attention.cpp
@@ -348,7 +348,7 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
   int k_block_size = m->kProjSize * num_tokens;
   int q_array_size = m->qProjSize * num_tokens * m->num_q_heads;
   // apply bias for q, k, v
-  if (*m->bias) {
+  if (*m->qkv_bias) {
     hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_proj_bias_qkv<DT>),
                        GET_BLOCKS(parallelism),
                        min(CUDA_NUM_THREADS, parallelism),
@@ -847,7 +847,7 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     tokens_previous_requests += num_new_tokens;
   }
 
-  if (*m->bias && shard_id == 0) {
+  if (*m->final_bias && shard_id == 0) {
     int parallelism = m->oProjSize * num_tokens;
     int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
                           m->kProjSize * m->global_num_kv_heads +
@@ -878,7 +878,7 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     GenericTensorAccessorR const &bias) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
-  bool use_bias = *m->bias;
+  bool use_bias = *m->qkv_bias || *m->final_bias;
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
@@ -961,11 +961,11 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
                                     attn->vProjSize,
                                     attn->oProjSize,
                                     attn->apply_rotary_embedding,
-                                    attn->bias,
+                                    attn->qkv_bias,
                                     attn->scaling_query,
                                     attn->qk_prod_scaling,
                                     attn->position_bias,
-                                    attn->add_bias_kv,
+                                    attn->final_bias,
                                     attn->scaling_factor,
                                     weight,
                                     gpu_mem_allocator,
@@ -989,11 +989,11 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     int _vProjSize,
     int _oProjSize,
     bool _apply_rotary_embedding,
-    bool _bias,
+    bool _qkv_bias,
     bool _scaling_query,
     bool _qk_prod_scaling,
     bool _position_bias,
-    bool _add_bias_kv,
+    bool _final_bias,
     float _scaling_factor,
     GenericTensorAccessorR const &weight,
     MemoryAllocator &gpu_mem_allocator,
@@ -1004,7 +1004,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     int _num_kv_heads,
     DataType _quantization_type,
     bool _offload)
-    : OpMeta(handler, attn) {
+    : OpMeta(handler, attn), weight_ptr(nullptr), bias_ptr(nullptr) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDNN(miopenSetStream(handler.dnn, stream));
@@ -1038,13 +1038,20 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     quantized_weightSize = get_quantization_to_byte_size(
         attn->data_type, quantization_type, weightSize);
   }
-  biasSize = _bias ? oProjSize * size_of_dt * 4 : 0;
+  // biasSize = _bias ? oProjSize * size_of_dt * 4 : 0;
+
+  int qkv_bias_size =
+      qProjSize * num_q_heads + (kProjSize + vProjSize) * num_kv_heads;
+  int final_bias_size = oProjSize;
+  biasSize =
+      (_qkv_bias ? qkv_bias_size : 0) + (final_bias ? final_bias_size : 0);
+
   // has_load_weights = (bool *)calloc(1, sizeof(bool));
   //*has_load_weights = false;
   apply_rotary_embedding = (bool *)calloc(1, sizeof(bool));
   *apply_rotary_embedding = _apply_rotary_embedding;
-  bias = (bool *)calloc(1, sizeof(bool));
-  *bias = _bias;
+  qkv_bias = (bool *)calloc(1, sizeof(bool));
+  *qkv_bias = _qkv_bias;
   scaling_query = (bool *)calloc(1, sizeof(bool));
   *scaling_query = _scaling_query;
   scaling_factor = _scaling_factor;
@@ -1052,8 +1059,8 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   *qk_prod_scaling = _qk_prod_scaling;
   position_bias = (bool *)calloc(1, sizeof(bool));
   *position_bias = _position_bias;
-  // Currently do not support adding bias to key/value projection
-  assert(!_add_bias_kv);
+  final_bias = (bool *)calloc(1, sizeof(bool));
+  *final_bias = _final_bias;
 
   // allocate weight and bias in the reserve space for cpu offloading
   if (offload) {
@@ -1201,6 +1208,22 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   checkCUDA(hipStreamSynchronize(stream));
 }
 
-IncMultiHeadSelfAttentionMeta::~IncMultiHeadSelfAttentionMeta(void) {}
+IncMultiHeadSelfAttentionMeta::~IncMultiHeadSelfAttentionMeta(void) {
+  if (reserveInst != Realm::RegionInstance::NO_INST) {
+    reserveInst.destroy();
+  }
+}
+
+template void Kernels::IncMultiHeadAttention::pre_build_weight_kernel<float>(
+    IncMultiHeadSelfAttentionMeta const *m,
+    GenericTensorAccessorR const weight,
+    DataType data_type,
+    hipStream_t stream);
+
+template void Kernels::IncMultiHeadAttention::pre_build_weight_kernel<half>(
+    IncMultiHeadSelfAttentionMeta const *m,
+    GenericTensorAccessorR const weight,
+    DataType data_type,
+    hipStream_t stream);
 
 }; // namespace FlexFlow
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index f0e6d9df1d..ec776f4cda 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -323,7 +323,7 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
   int k_block_size = m->kProjSize * num_tokens;
   int q_array_size = m->qProjSize * num_tokens * m->num_q_heads;
   // apply bias for q, k, v
-  if (*m->bias) {
+  if (*m->qkv_bias) {
     apply_proj_bias_qkv<<<GET_BLOCKS(parallelism),
                           min(CUDA_NUM_THREADS, parallelism),
                           0,
@@ -466,7 +466,7 @@ void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
                       DT *output_ptr,
                       DT const *bias_ptr,
                       cudaStream_t stream) {
-  // here because we need postion info in infernece 1
+  // here because we need position info in inference 1
 
   if (m->offload && m->biasSize > 0) {
     cudaMemcpyAsync(
@@ -852,7 +852,7 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     tokens_previous_requests += num_new_tokens;
   }
 
-  if (*m->bias && shard_id == 0) {
+  if (*m->final_bias && shard_id == 0) {
     int parallelism = m->oProjSize * num_tokens;
     int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
                           m->kProjSize * m->global_num_kv_heads +
@@ -879,7 +879,7 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     GenericTensorAccessorR const &bias) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
-  bool use_bias = *m->bias;
+  bool use_bias = *m->qkv_bias || *m->final_bias;
 
   cudaEvent_t t_start, t_end;
   if (m->profiling) {
@@ -935,7 +935,36 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
     cudaEventDestroy(t_start);
     cudaEventDestroy(t_end);
-    printf("IncMultiHeadSelfAttention forward time = %.2fms\n", elapsed);
+    printf("IncMultiHeadSelfAttention forward time = %.9fms\n", elapsed);
+
+    // if (input.data_type == DT_HALF) {
+    //   print_tensor<half>(input.get_half_ptr(),
+    //                      32,
+    //                      "[IncMultiHeadSelfAttention:forward:input]");
+    //   print_tensor<half>(weight.get_half_ptr(),
+    //                      32,
+    //                      "[IncMultiHeadSelfAttention:forward:weight]");
+    //   print_tensor<half>(output.get_half_ptr(),
+    //                      32,
+    //                      "[IncMultiHeadSelfAttention:forward:output]");
+    //   print_tensor<half>(
+    //       bias.get_half_ptr(), 32,
+    //       "[IncMultiHeadSelfAttention:forward:bias]");
+    // } else {
+    //   print_tensor<float>(input.get_float_ptr(),
+    //                       32,
+    //                       "[IncMultiHeadSelfAttention:forward:input]");
+    //   print_tensor<float>(weight.get_float_ptr(),
+    //                       32,
+    //                       "[IncMultiHeadSelfAttention:forward:weight]");
+    //   print_tensor<float>(output.get_float_ptr(),
+    //                       32,
+    //                       "[IncMultiHeadSelfAttention:forward:output]");
+    //   print_tensor<float>(
+    //       bias.get_float_ptr(), 32,
+    //       "[IncMultiHeadSelfAttention:forward:bias]");
+    // }
+
     // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
     // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
     // acc_output.rect, "[Attention:forward:output]");
@@ -961,11 +990,11 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
                                     attn->vProjSize,
                                     attn->oProjSize,
                                     attn->apply_rotary_embedding,
-                                    attn->bias,
+                                    attn->qkv_bias,
                                     attn->scaling_query,
                                     attn->qk_prod_scaling,
                                     attn->position_bias,
-                                    attn->add_bias_kv,
+                                    attn->final_bias,
                                     attn->scaling_factor,
                                     weight,
                                     gpu_mem_allocator,
@@ -989,11 +1018,11 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     int _vProjSize,
     int _oProjSize,
     bool _apply_rotary_embedding,
-    bool _bias,
+    bool _qkv_bias,
     bool _scaling_query,
     bool _qk_prod_scaling,
     bool _position_bias,
-    bool _add_bias_kv,
+    bool _final_bias,
     float _scaling_factor,
     GenericTensorAccessorR const &weight,
     MemoryAllocator &gpu_mem_allocator,
@@ -1038,13 +1067,20 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     quantized_weightSize = get_quantization_to_byte_size(
         attn->data_type, quantization_type, weightSize);
   }
-  biasSize = _bias ? oProjSize * size_of_dt * 4 : 0;
+  // biasSize = _bias ? oProjSize * size_of_dt * 4 : 0;
+
+  int qkv_bias_size =
+      qProjSize * num_q_heads + (kProjSize + vProjSize) * num_kv_heads;
+  int final_bias_size = oProjSize;
+  biasSize =
+      (_qkv_bias ? qkv_bias_size : 0) + (final_bias ? final_bias_size : 0);
+
   // has_load_weights = (bool *)calloc(1, sizeof(bool));
   //*has_load_weights = false;
   apply_rotary_embedding = (bool *)calloc(1, sizeof(bool));
   *apply_rotary_embedding = _apply_rotary_embedding;
-  bias = (bool *)calloc(1, sizeof(bool));
-  *bias = _bias;
+  qkv_bias = (bool *)calloc(1, sizeof(bool));
+  *qkv_bias = _qkv_bias;
   scaling_query = (bool *)calloc(1, sizeof(bool));
   *scaling_query = _scaling_query;
   scaling_factor = _scaling_factor;
@@ -1052,8 +1088,8 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   *qk_prod_scaling = _qk_prod_scaling;
   position_bias = (bool *)calloc(1, sizeof(bool));
   *position_bias = _position_bias;
-  // Currently do not support adding bias to key/value projection
-  assert(!_add_bias_kv);
+  final_bias = (bool *)calloc(1, sizeof(bool));
+  *final_bias = _final_bias;
 
   // allocate weight and bias in the reserve space for cpu offloading
   if (offload) {
diff --git a/src/ops/kernels/element_binary_kernels.cu b/src/ops/kernels/element_binary_kernels.cu
index 6d30ae690a..ff5d5a67e1 100644
--- a/src/ops/kernels/element_binary_kernels.cu
+++ b/src/ops/kernels/element_binary_kernels.cu
@@ -137,7 +137,7 @@ void forward_kernel_wrapper(ElementBinaryMeta const *m,
       default:
         assert(false);
     }
-    printf("[%s] forward time (CF) = %.2fms\n", opName, elapsed);
+    printf("[%s] forward time (CF) = %.9fms\n", opName, elapsed);
     // print_tensor<float>(in1_ptr, 32, "[EWB:forward:input1]");
     // print_tensor<float>(in2_ptr, 32, "[EWB:forward:input2]");
     // print_tensor<float>(out_ptr, 32, "[EWB:forward:output]");
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index 758d7cfcce..cb519239c5 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -130,6 +130,7 @@ Tensor FFModel::layer_norm(const Tensor input,
                                                  0,
                                                  true /*create_grad*/);
   if (num_weights > 0) {
+    assert(elementwise_affine);
     int numdims = axes.size();
     int dims[numdims];
     for (int i = 0; i < numdims; i++) {
@@ -238,13 +239,13 @@ LayerNorm::LayerNorm(FFModel &model,
   effective_batch_size = (inputs[0]->get_volume() / num_replicas) / M;
   assert(use_bias == (numWeights == 2));
   if (numWeights > 0 && allocate_weights) {
+    assert(elementwise_affine);
     ParallelTensorShape beta_gamma_shape = _input->get_shape();
     for (int i = axes.size(); i < beta_gamma_shape.num_dims - 1; i++) {
       beta_gamma_shape.dims[i].size = 1;
     }
     int seed = std::rand();
     Initializer *gamma_initializer = new UniformInitializer(seed, 1.0f, 1.0f);
-    Initializer *beta_initializer = new UniformInitializer(seed, 0.0f, 0.0f);
     weights[0] = model.create_parallel_weight_legion_ordering(
         beta_gamma_shape.num_dims, // axes.size(),
         beta_gamma_shape.dims,
@@ -253,14 +254,18 @@ LayerNorm::LayerNorm(FFModel &model,
         true /*create_grad*/,
         gamma_initializer,
         CHOSEN_SYNC_TYPE);
-    weights[1] = model.create_parallel_weight_legion_ordering(
-        beta_gamma_shape.num_dims, //.size(),
-        beta_gamma_shape.dims,
-        _input->data_type,
-        NULL /*owner_op*/,
-        true /*create_grad*/,
-        beta_initializer,
-        CHOSEN_SYNC_TYPE);
+    if (numWeights == 2) {
+      assert(use_bias);
+      Initializer *beta_initializer = new UniformInitializer(seed, 0.0f, 0.0f);
+      weights[1] = model.create_parallel_weight_legion_ordering(
+          beta_gamma_shape.num_dims, //.size(),
+          beta_gamma_shape.dims,
+          _input->data_type,
+          NULL /*owner_op*/,
+          true /*create_grad*/,
+          beta_initializer,
+          CHOSEN_SYNC_TYPE);
+    }
   }
 }
 
diff --git a/src/ops/layer_norm.cu b/src/ops/layer_norm.cu
index 97b5094a21..202a8837ff 100644
--- a/src/ops/layer_norm.cu
+++ b/src/ops/layer_norm.cu
@@ -95,6 +95,26 @@ __inline__ __device__ T BlockReduceSum(T val, T *shared) {
   return val;
 }
 
+template <typename T>
+__inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
+  int const lid = threadIdx.x % C10_WARP_SIZE;
+  int const wid = threadIdx.x / C10_WARP_SIZE;
+  val = WarpReduceSum(val);
+  __syncthreads();
+  if (lid == 0) {
+    shared[wid] = val;
+  }
+  __syncthreads();
+  val = (threadIdx.x < min(blockDim.x, max_num_threads) / C10_WARP_SIZE)
+            ? shared[lid]
+            : 0;
+  if (wid == 0) {
+    val = WarpReduceSum(val);
+  }
+  return val;
+}
+
+#ifdef DEADCODE
 template <typename T>
 __global__ void RowwiseMomentsCUDAKernel(
     int64_t N, float eps, T const *X, T *mean, T *rstd) {
@@ -140,6 +160,56 @@ __global__ void LayerNormForwardCUDAKernel(int64_t N,
                beta_v;
   }
 }
+#endif
+
+template <typename T>
+__global__ void LayerNormFusedForwardKernel(int64_t N,
+                                            float eps,
+                                            T const *X,
+                                            T *mean,
+                                            T *rstd,
+                                            T const *gamma,
+                                            T const *beta,
+                                            T *Y) {
+  __shared__ float m_shared[C10_WARP_SIZE];
+  __shared__ float v_shared[C10_WARP_SIZE];
+  const int64_t i = blockIdx.x;
+  float sum1 = 0.0f;
+  float sum2 = 0.0f;
+  for (int64_t j = threadIdx.x; j < N;
+       j += min(blockDim.x, kCUDABlockReduceNumThreads)) {
+    const int64_t index = i * N + j;
+    sum1 += static_cast<float>(X[index]);
+    sum2 += static_cast<float>(X[index]) * static_cast<float>(X[index]);
+  }
+  if (threadIdx.x < kCUDABlockReduceNumThreads) {
+    sum1 = BlockReduceSum<float>(
+        sum1, m_shared, min(blockDim.x, kCUDABlockReduceNumThreads));
+    sum2 = BlockReduceSum<float>(
+        sum2, v_shared, min(blockDim.x, kCUDABlockReduceNumThreads));
+  }
+  if (threadIdx.x == 0) {
+    float const scale = float(1) / static_cast<float>(N);
+    sum1 *= scale;
+    sum2 = max(sum2 * scale - sum1 * sum1, float(0));
+    mean[i] = static_cast<T>(sum1);
+    rstd[i] = static_cast<T>(rsqrt(sum2 + eps));
+  }
+
+  __syncthreads();
+
+  using T_ACC = T;
+  for (int64_t j = threadIdx.x; j < N; j += min(blockDim.x, kCUDANumThreads)) {
+    const int64_t index = i * N + j;
+    const T_ACC gamma_v =
+        gamma == nullptr ? T_ACC(1) : static_cast<T_ACC>(gamma[j]);
+    const T_ACC beta_v =
+        beta == nullptr ? T_ACC(0) : static_cast<T_ACC>(beta[j]);
+    Y[index] = (static_cast<T_ACC>(X[index]) - static_cast<T_ACC>(mean[i])) *
+                   static_cast<T_ACC>(rstd[i]) * gamma_v +
+               beta_v;
+  }
+}
 
 /*static*/
 template <typename T>
@@ -149,22 +219,26 @@ void LayerNorm::forward_kernel(LayerNormMeta const *m,
                                T const *gamma_ptr,
                                T const *beta_ptr,
                                cudaStream_t stream) {
-  RowwiseMomentsCUDAKernel<T>
-      <<<m->effective_batch_size, kCUDABlockReduceNumThreads, 0, stream>>>(
-          m->effective_num_elements,
-          m->eps,
-          in_ptr,
-          static_cast<T *>(m->mean_ptr),
-          static_cast<T *>(m->rstd_ptr));
-  LayerNormForwardCUDAKernel<T>
-      <<<m->effective_batch_size, kCUDANumThreads, 0, stream>>>(
-          m->effective_num_elements,
-          in_ptr,
-          static_cast<T *>(m->mean_ptr),
-          static_cast<T *>(m->rstd_ptr),
-          gamma_ptr,
-          beta_ptr,
-          out_ptr);
+
+  std::pair<int, int> kernel1_parallelism =
+      std::make_pair(m->effective_batch_size, kCUDABlockReduceNumThreads);
+  std::pair<int, int> kernel2_parallelism =
+      std::make_pair(m->effective_batch_size, kCUDANumThreads);
+
+  int num_blocks =
+      std::max(kernel1_parallelism.first, kernel2_parallelism.first);
+  int num_threads =
+      std::max(kernel1_parallelism.second, kernel2_parallelism.second);
+
+  LayerNormFusedForwardKernel<T>
+      <<<num_blocks, num_threads, 0, stream>>>(m->effective_num_elements,
+                                               m->eps,
+                                               in_ptr,
+                                               static_cast<T *>(m->mean_ptr),
+                                               static_cast<T *>(m->rstd_ptr),
+                                               gamma_ptr,
+                                               beta_ptr,
+                                               out_ptr);
 }
 
 /*static*/
@@ -208,7 +282,7 @@ void LayerNorm::forward_kernel_wrapper(LayerNormMeta const *m,
     checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
     cudaEventDestroy(t_start);
     cudaEventDestroy(t_end);
-    printf("[LayerNorm] forward time (CF) = %.2fms\n", elapsed);
+    printf("[LayerNorm] forward time (CF) = %.9fms\n", elapsed);
     // print_tensor<T>(in_ptr, 32, "[LayerNorm:forward:input]");
     // print_tensor<T>(out_ptr, 32, "[LayerNorm:forward:output]");
   }
diff --git a/src/ops/spec_inc_multihead_self_attention.cc b/src/ops/spec_inc_multihead_self_attention.cc
index 01275c9875..350ab3c167 100644
--- a/src/ops/spec_inc_multihead_self_attention.cc
+++ b/src/ops/spec_inc_multihead_self_attention.cc
@@ -23,10 +23,6 @@
 #endif
 #include "flexflow/utils/hash_utils.h"
 #include "legion/legion_utilities.h"
-#ifdef INFERENCE_TESTS
-#include <torch/torch.h>
-using namespace at::indexing;
-#endif
 
 namespace FlexFlow {
 
@@ -63,8 +59,8 @@ Tensor
                                                int kdim,
                                                int vdim,
                                                float dropout,
-                                               bool bias,
-                                               bool add_bias_kv,
+                                               bool qkv_bias,
+                                               bool final_bias,
                                                bool add_zero_attn,
                                                DataType data_type,
                                                Initializer *kernel_initializer,
@@ -81,8 +77,8 @@ Tensor
                                             kdim,
                                             vdim,
                                             dropout,
-                                            bias,
-                                            add_bias_kv,
+                                            qkv_bias,
+                                            final_bias,
                                             add_zero_attn,
                                             data_type,
                                             kernel_initializer,
@@ -102,8 +98,8 @@ Tensor
                                                 int kdim,
                                                 int vdim,
                                                 float dropout,
-                                                bool bias,
-                                                bool add_bias_kv,
+                                                bool qkv_bias,
+                                                bool final_bias,
                                                 bool add_zero_attn,
                                                 DataType data_type,
                                                 Initializer *kernel_initializer,
@@ -117,7 +113,7 @@ Tensor
     data_type = input->data_type;
   }
   Layer *li = nullptr;
-  int weight_num = bias ? 2 : 1;
+  int weight_num = (qkv_bias || final_bias) ? 2 : 1;
   if (data_type != input->data_type) {
     Tensor casted_input = cast(input, data_type, "type cast for IncMHA");
     li = new Layer(this,
@@ -168,10 +164,12 @@ Tensor
                                                    kernel_initializer,
                                                    CHOSEN_SYNC_TYPE);
   }
-  if (bias) {
+  if (qkv_bias || final_bias) {
     // q, k, v, o
-    int dims[1] = {qProjSize * num_q_heads +
-                   (kProjSize + vProjSize) * num_kv_heads + oProjSize};
+    int qkv_bias_size =
+        qProjSize * num_q_heads + (kProjSize + vProjSize) * num_kv_heads;
+    int dims[1] = {(qkv_bias ? qkv_bias_size : 0) +
+                   (final_bias ? oProjSize : 0)};
     li->weights[1] = create_weight_legion_ordering(1,
                                                    dims,
                                                    data_type,
@@ -186,8 +184,8 @@ Tensor
   li->add_int_property("num_kv_heads", num_kv_heads);
   li->add_int_property("kdim", kdim);
   li->add_int_property("vdim", vdim);
-  li->add_int_property("bias", bias);
-  li->add_int_property("add_bias_kv", add_bias_kv);
+  li->add_int_property("qkv_bias", qkv_bias);
+  li->add_int_property("final_bias", final_bias);
   li->add_int_property("add_zero_attn", add_zero_attn);
   li->add_float_property("dropout", dropout);
   li->add_int_property("apply_rotary_embedding", apply_rotary_embedding);
@@ -218,10 +216,10 @@ Op *SpecIncMultiHeadSelfAttention::create_operator_from_layer(
   int vdim = value;
   float dropout;
   layer->get_float_property("dropout", dropout);
-  layer->get_int_property("bias", value);
-  bool bias = (bool)value;
-  layer->get_int_property("add_bias_kv", value);
-  bool add_bias_kv = (bool)value;
+  layer->get_int_property("qkv_bias", value);
+  bool qkv_bias = (bool)value;
+  layer->get_int_property("final_bias", value);
+  bool final_bias = (bool)value;
   layer->get_int_property("add_zero_attn", value);
   bool add_zero_attn = (bool)value;
   layer->get_int_property("apply_rotary_embedding", value);
@@ -244,8 +242,8 @@ Op *SpecIncMultiHeadSelfAttention::create_operator_from_layer(
                                            kdim,
                                            vdim,
                                            dropout,
-                                           bias,
-                                           add_bias_kv,
+                                           qkv_bias,
+                                           final_bias,
                                            add_zero_attn,
                                            apply_rotary_embedding,
                                            scaling_query,
@@ -266,8 +264,8 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     int _kdim,
     int _vdim,
     float _dropout,
-    bool _bias,
-    bool _add_bias_kv,
+    bool _qkv_bias,
+    bool _final_bias,
     bool _add_zero_attn,
     bool _apply_rotary_embedding,
     bool _scaling_query,
@@ -282,11 +280,12 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
          _input->data_type,
          name,
          1 /*inputs*/,
-         (_bias ? 2 : 1) /*weights*/,
+         (_qkv_bias || _final_bias ? 2 : 1) /*weights*/,
          1 /*outputs*/,
          _input),
       num_q_heads(_num_q_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
-      bias(_bias), add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      qkv_bias(_qkv_bias), final_bias(_final_bias),
+      add_zero_attn(_add_zero_attn),
       apply_rotary_embedding(_apply_rotary_embedding),
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
       vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
@@ -330,11 +329,12 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
                                                  true /*create_grad*/,
                                                  initializer,
                                                  CHOSEN_SYNC_TYPE);
-    if (bias) {
+    if (qkv_bias || final_bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
-      bias_shape.dims[0].size = qProjSize * num_q_heads +
-                                (kProjSize + vProjSize) * num_kv_heads +
-                                oProjSize;
+      int qkv_bias_size =
+          qProjSize * num_q_heads + (kProjSize + vProjSize) * num_kv_heads;
+      bias_shape.dims[0].size =
+          (qkv_bias ? qkv_bias_size : 0) + (final_bias ? oProjSize : 0);
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
       weights[1] =
           model.create_parallel_weight_legion_ordering(bias_shape.num_dims,
@@ -366,8 +366,8 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     int _kdim,
     int _vdim,
     float _dropout,
-    bool _bias,
-    bool _add_bias_kv,
+    bool _qkv_bias,
+    bool _final_bias,
     bool _add_zero_attn,
     bool _apply_rotary_embedding,
     bool _scaling_query,
@@ -382,12 +382,13 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
          _input->data_type,
          name,
          1 /*inputs*/,
-         (_bias ? 2 : 1) /*weights*/,
+         (_qkv_bias || _final_bias ? 2 : 1) /*weights*/,
          1 /*outputs*/,
          _input,
          _weight),
       num_q_heads(_num_q_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
-      bias(_bias), add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      qkv_bias(_qkv_bias), final_bias(_final_bias),
+      add_zero_attn(_add_zero_attn),
       apply_rotary_embedding(_apply_rotary_embedding),
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
       vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
@@ -431,11 +432,12 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
                                                  true /*create_grad*/,
                                                  initializer,
                                                  CHOSEN_SYNC_TYPE);
-    if (bias) {
+    if (qkv_bias || final_bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
-      bias_shape.dims[0].size = qProjSize * num_q_heads +
-                                (kProjSize + vProjSize) * num_kv_heads +
-                                oProjSize;
+      int qkv_bias_size =
+          qProjSize * num_q_heads + (kProjSize + vProjSize) * num_kv_heads;
+      bias_shape.dims[0].size =
+          (qkv_bias ? qkv_bias_size : 0) + (final_bias ? oProjSize : 0);
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
       weights[1] =
           model.create_parallel_weight_legion_ordering(bias_shape.num_dims,
@@ -474,8 +476,8 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
                                     other.qProjSize,
                                     other.vProjSize,
                                     other.dropout,
-                                    other.bias,
-                                    other.add_bias_kv,
+                                    other.qkv_bias,
+                                    other.final_bias,
                                     other.add_zero_attn,
                                     other.apply_rotary_embedding,
                                     other.scaling_query,
@@ -500,8 +502,8 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
                                     params.kdim,
                                     params.vdim,
                                     params.dropout,
-                                    params.bias,
-                                    params.add_bias_kv,
+                                    params.qkv_bias,
+                                    params.final_bias,
                                     params.add_zero_attn,
                                     params.apply_rotary_embedding,
                                     params.scaling_query,
@@ -708,7 +710,7 @@ FutureMap SpecIncMultiHeadSelfAttention::inference(
                                                     batch_outputs[0]->region));
   launcher.add_field(idx++, FID_DATA);
 
-  if (bias) {
+  if (qkv_bias || final_bias) {
     launcher.add_region_requirement(RegionRequirement(weights[1]->part,
                                                       0 /*projection id*/,
                                                       READ_ONLY,
@@ -740,7 +742,8 @@ void SpecIncMultiHeadSelfAttention::inference_task(
 
   SpecIncMultiHeadSelfAttentionMeta const *m =
       *((SpecIncMultiHeadSelfAttentionMeta **)task->local_args);
-  assert((*m->bias ? regions.size() == 4 : regions.size() == 3));
+  assert(((*m->qkv_bias || *m->final_bias) ? regions.size() == 4
+                                           : regions.size() == 3));
 
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
@@ -749,7 +752,7 @@ void SpecIncMultiHeadSelfAttention::inference_task(
   GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
       m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
   GenericTensorAccessorR biases;
-  if (*m->bias) {
+  if (*m->qkv_bias || *m->final_bias) {
     biases = helperGetGenericTensorAccessorRO(m->weight_type[1],
                                               regions[3],
                                               task->regions[3],
@@ -818,7 +821,7 @@ bool operator==(SpecIncMultiHeadSelfAttentionParams const &lhs,
   return lhs.layer_guid == rhs.layer_guid && lhs.embed_dim == rhs.embed_dim &&
          lhs.num_q_heads == rhs.num_q_heads && lhs.kdim == rhs.kdim &&
          lhs.vdim == rhs.vdim && lhs.dropout == rhs.dropout &&
-         lhs.bias == rhs.bias && lhs.add_bias_kv == rhs.add_bias_kv &&
+         lhs.qkv_bias == rhs.qkv_bias && lhs.final_bias == rhs.final_bias &&
          lhs.add_zero_attn == rhs.add_zero_attn &&
          lhs.apply_rotary_embedding == rhs.apply_rotary_embedding &&
          lhs.scaling_query == rhs.scaling_query &&
@@ -837,8 +840,8 @@ SpecIncMultiHeadSelfAttentionParams
   params.kdim = this->kProjSize;
   params.vdim = this->vProjSize;
   params.dropout = this->dropout;
-  params.bias = this->bias;
-  params.add_bias_kv = this->add_bias_kv;
+  params.qkv_bias = this->qkv_bias;
+  params.final_bias = this->final_bias;
   params.add_zero_attn = this->add_zero_attn;
   params.apply_rotary_embedding = this->apply_rotary_embedding;
   params.scaling_query = this->scaling_query;
@@ -862,8 +865,8 @@ size_t hash<FlexFlow::SpecIncMultiHeadSelfAttentionParams>::operator()(
   hash_combine(key, params.kdim);
   hash_combine(key, params.vdim);
   hash_combine(key, params.dropout);
-  hash_combine(key, params.bias);
-  hash_combine(key, params.add_bias_kv);
+  hash_combine(key, params.qkv_bias);
+  hash_combine(key, params.final_bias);
   hash_combine(key, params.add_zero_attn);
   hash_combine(key, params.apply_rotary_embedding);
   hash_combine(key, params.scaling_query);
diff --git a/src/ops/spec_inc_multihead_self_attention.cpp b/src/ops/spec_inc_multihead_self_attention.cpp
index 7e85a65e05..f983238198 100644
--- a/src/ops/spec_inc_multihead_self_attention.cpp
+++ b/src/ops/spec_inc_multihead_self_attention.cpp
@@ -512,7 +512,7 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       tokens_prev_requests_squares += num_new_tokens * total_tokens;
     }
   }
-  if (*m->bias && shard_id == 0) {
+  if (*m->final_bias && shard_id == 0) {
     int parallelism = m->oProjSize * num_tokens;
     int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
                           m->kProjSize * m->global_num_kv_heads +
@@ -600,7 +600,7 @@ void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
     GenericTensorAccessorR const &bias) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
-  bool use_bias = *m->bias;
+  bool use_bias = *m->qkv_bias || *m->final_bias;
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
@@ -671,11 +671,11 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
                                     attn->vProjSize,
                                     attn->oProjSize,
                                     attn->apply_rotary_embedding,
-                                    attn->bias,
+                                    attn->qkv_bias,
                                     attn->scaling_query,
                                     attn->qk_prod_scaling,
                                     attn->position_bias,
-                                    attn->add_bias_kv,
+                                    attn->final_bias,
                                     attn->scaling_factor,
                                     weight,
                                     gpu_mem_allocator,
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 47e9941e1d..6ef5145654 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -531,7 +531,7 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       tokens_prev_requests_squares += num_new_tokens * total_tokens;
     }
   }
-  if (*m->bias && shard_id == 0) {
+  if (*m->final_bias && shard_id == 0) {
     int parallelism = m->oProjSize * num_tokens;
     int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
                           m->kProjSize * m->global_num_kv_heads +
@@ -610,7 +610,7 @@ void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
     GenericTensorAccessorR const &bias) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
-  bool use_bias = *m->bias;
+  bool use_bias = *m->qkv_bias || *m->final_bias;
 
   cudaEvent_t t_start, t_end;
   if (m->profiling) {
@@ -684,11 +684,11 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
                                     attn->vProjSize,
                                     attn->oProjSize,
                                     attn->apply_rotary_embedding,
-                                    attn->bias,
+                                    attn->qkv_bias,
                                     attn->scaling_query,
                                     attn->qk_prod_scaling,
                                     attn->position_bias,
-                                    attn->add_bias_kv,
+                                    attn->final_bias,
                                     attn->scaling_factor,
                                     weight,
                                     gpu_mem_allocator,
diff --git a/src/ops/tree_inc_multihead_self_attention.cc b/src/ops/tree_inc_multihead_self_attention.cc
index 9597482ad2..207dae0785 100644
--- a/src/ops/tree_inc_multihead_self_attention.cc
+++ b/src/ops/tree_inc_multihead_self_attention.cc
@@ -23,10 +23,6 @@
 #endif
 #include "flexflow/utils/hash_utils.h"
 #include "legion/legion_utilities.h"
-#ifdef INFERENCE_TESTS
-#include <torch/torch.h>
-using namespace at::indexing;
-#endif
 
 namespace FlexFlow {
 
@@ -65,8 +61,8 @@ Tensor FFModel::inc_multihead_self_attention_verify(
     int kdim,
     int vdim,
     float dropout,
-    bool bias,
-    bool add_bias_kv,
+    bool qkv_bias,
+    bool final_bias,
     bool add_zero_attn,
     DataType data_type,
     Initializer *kernel_initializer,
@@ -83,8 +79,8 @@ Tensor FFModel::inc_multihead_self_attention_verify(
                                               kdim,
                                               vdim,
                                               dropout,
-                                              bias,
-                                              add_bias_kv,
+                                              qkv_bias,
+                                              final_bias,
                                               add_zero_attn,
                                               data_type,
                                               kernel_initializer,
@@ -104,8 +100,8 @@ Tensor FFModel::inc_multiquery_self_attention_verify(
     int kdim,
     int vdim,
     float dropout,
-    bool bias,
-    bool add_bias_kv,
+    bool qkv_bias,
+    bool final_bias,
     bool add_zero_attn,
     DataType data_type,
     Initializer *kernel_initializer,
@@ -121,7 +117,7 @@ Tensor FFModel::inc_multiquery_self_attention_verify(
   DataType quantization_type = cpu_offload ? config.quantization_type : DT_NONE;
   bool offload = cpu_offload;
   Layer *li = nullptr;
-  int weight_num = bias ? 2 : 1;
+  int weight_num = (qkv_bias || final_bias) ? 2 : 1;
   if (data_type != input->data_type) {
     Tensor casted_input = cast(input, data_type, "type cast for IncMHA");
     li = new Layer(this,
@@ -180,10 +176,12 @@ Tensor FFModel::inc_multiquery_self_attention_verify(
         kernel_initializer,
         CHOSEN_SYNC_TYPE);
   }
-  if (bias) {
+  if (qkv_bias || final_bias) {
     // q, k, v, o
-    int dims[1] = {qProjSize * num_q_heads +
-                   (kProjSize + vProjSize) * num_kv_heads + oProjSize};
+    int qkv_bias_size =
+        qProjSize * num_q_heads + (kProjSize + vProjSize) * num_kv_heads;
+    int dims[1] = {(qkv_bias ? qkv_bias_size : 0) +
+                   (final_bias ? oProjSize : 0)};
     li->weights[1] = create_weight_legion_ordering(1,
                                                    dims,
                                                    data_type,
@@ -198,8 +196,8 @@ Tensor FFModel::inc_multiquery_self_attention_verify(
   li->add_int_property("num_kv_heads", num_kv_heads);
   li->add_int_property("kdim", kdim);
   li->add_int_property("vdim", vdim);
-  li->add_int_property("bias", bias);
-  li->add_int_property("add_bias_kv", add_bias_kv);
+  li->add_int_property("qkv_bias", qkv_bias);
+  li->add_int_property("final_bias", final_bias);
   li->add_int_property("add_zero_attn", add_zero_attn);
   li->add_float_property("dropout", dropout);
   li->add_int_property("apply_rotary_embedding", apply_rotary_embedding);
@@ -232,10 +230,10 @@ Op *TreeIncMultiHeadSelfAttention::create_operator_from_layer(
   int vdim = value;
   float dropout;
   layer->get_float_property("dropout", dropout);
-  layer->get_int_property("bias", value);
-  bool bias = (bool)value;
-  layer->get_int_property("add_bias_kv", value);
-  bool add_bias_kv = (bool)value;
+  layer->get_int_property("qkv_bias", value);
+  bool qkv_bias = (bool)value;
+  layer->get_int_property("final_bias", value);
+  bool final_bias = (bool)value;
   layer->get_int_property("add_zero_attn", value);
   bool add_zero_attn = (bool)value;
   layer->get_int_property("apply_rotary_embedding", value);
@@ -263,8 +261,8 @@ Op *TreeIncMultiHeadSelfAttention::create_operator_from_layer(
                                            kdim,
                                            vdim,
                                            dropout,
-                                           bias,
-                                           add_bias_kv,
+                                           qkv_bias,
+                                           final_bias,
                                            add_zero_attn,
                                            apply_rotary_embedding,
                                            scaling_query,
@@ -288,8 +286,8 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     int _kdim,
     int _vdim,
     float _dropout,
-    bool _bias,
-    bool _add_bias_kv,
+    bool _qkv_bias,
+    bool _final_bias,
     bool _add_zero_attn,
     bool _apply_rotary_embedding,
     bool _scaling_query,
@@ -307,11 +305,12 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
          _input->data_type,
          name,
          1 /*inputs*/,
-         (_bias ? 2 : 1) /*weights*/,
+         (_qkv_bias || _final_bias ? 2 : 1) /*weights*/,
          1 /*outputs*/,
          _input),
       num_q_heads(_num_q_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
-      bias(_bias), add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      qkv_bias(_qkv_bias), final_bias(_final_bias),
+      add_zero_attn(_add_zero_attn),
       apply_rotary_embedding(_apply_rotary_embedding),
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
       vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
@@ -365,11 +364,12 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
         true /*create_grad*/,
         initializer,
         CHOSEN_SYNC_TYPE);
-    if (bias) {
+    if (qkv_bias || final_bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
-      bias_shape.dims[0].size = qProjSize * num_q_heads +
-                                (kProjSize + vProjSize) * num_kv_heads +
-                                oProjSize;
+      int qkv_bias_size =
+          qProjSize * num_q_heads + (kProjSize + vProjSize) * num_kv_heads;
+      bias_shape.dims[0].size =
+          (qkv_bias ? qkv_bias_size : 0) + (final_bias ? oProjSize : 0);
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
       weights[1] =
           model.create_parallel_weight_legion_ordering(bias_shape.num_dims,
@@ -401,8 +401,8 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     int _kdim,
     int _vdim,
     float _dropout,
-    bool _bias,
-    bool _add_bias_kv,
+    bool _qkv_bias,
+    bool _final_bias,
     bool _add_zero_attn,
     bool _apply_rotary_embedding,
     bool _scaling_query,
@@ -420,12 +420,13 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
          _input->data_type,
          name,
          1 /*inputs*/,
-         (_bias ? 2 : 1) /*weights*/,
+         (_qkv_bias || _final_bias ? 2 : 1) /*weights*/,
          1 /*outputs*/,
          _input,
          _weight),
       num_q_heads(_num_q_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
-      bias(_bias), add_bias_kv(_add_bias_kv), add_zero_attn(_add_zero_attn),
+      qkv_bias(_qkv_bias), final_bias(_final_bias),
+      add_zero_attn(_add_zero_attn),
       apply_rotary_embedding(_apply_rotary_embedding),
       qSize(_input->dims[0].size), kSize(_input->dims[0].size),
       vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
@@ -476,11 +477,12 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
         true /*create_grad*/,
         initializer,
         CHOSEN_SYNC_TYPE);
-    if (bias) {
+    if (qkv_bias || final_bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
-      bias_shape.dims[0].size = qProjSize * num_q_heads +
-                                (kProjSize + vProjSize) * num_kv_heads +
-                                oProjSize;
+      int qkv_bias_size =
+          qProjSize * num_q_heads + (kProjSize + vProjSize) * num_kv_heads;
+      bias_shape.dims[0].size =
+          (qkv_bias ? qkv_bias_size : 0) + (final_bias ? oProjSize : 0);
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
       weights[1] =
           model.create_parallel_weight_legion_ordering(bias_shape.num_dims,
@@ -519,8 +521,8 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
                                     other.qProjSize,
                                     other.vProjSize,
                                     other.dropout,
-                                    other.bias,
-                                    other.add_bias_kv,
+                                    other.qkv_bias,
+                                    other.final_bias,
                                     other.add_zero_attn,
                                     other.apply_rotary_embedding,
                                     other.scaling_query,
@@ -548,8 +550,8 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
                                     params.kdim,
                                     params.vdim,
                                     params.dropout,
-                                    params.bias,
-                                    params.add_bias_kv,
+                                    params.qkv_bias,
+                                    params.final_bias,
                                     params.add_zero_attn,
                                     params.apply_rotary_embedding,
                                     params.scaling_query,
@@ -776,7 +778,7 @@ FutureMap TreeIncMultiHeadSelfAttention::inference(
                                                     EXCLUSIVE,
                                                     batch_outputs[0]->region));
   launcher.add_field(idx++, FID_DATA);
-  if (bias) {
+  if (qkv_bias || final_bias) {
     launcher.add_region_requirement(
         RegionRequirement(weights[1]->part,
                           0 /*projection id*/,
@@ -814,7 +816,8 @@ void TreeIncMultiHeadSelfAttention::inference_task(
 
   TreeIncMultiHeadSelfAttentionMeta *m =
       *((TreeIncMultiHeadSelfAttentionMeta **)task->local_args);
-  assert((*m->bias ? regions.size() == 4 : regions.size() == 3));
+  assert(((*m->qkv_bias || *m->final_bias) ? regions.size() == 4
+                                           : regions.size() == 3));
 
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
@@ -823,7 +826,7 @@ void TreeIncMultiHeadSelfAttention::inference_task(
   GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
       m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
   GenericTensorAccessorR biases;
-  if (*m->bias) {
+  if (*m->qkv_bias || *m->final_bias) {
     biases = helperGetGenericTensorAccessorRO(m->weight_type[1],
                                               regions[3],
                                               task->regions[3],
@@ -854,788 +857,6 @@ void TreeIncMultiHeadSelfAttention::inference_task(
 
   TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
       m, &bc, task->index_point.point_data[0], input, weight, output, biases);
-#ifdef INFERENCE_TESTS
-  printf("Checking TreeIncMultiHeadSelfAttention computations...\n");
-
-  // =============================================================================
-  //  Define helper functions to handle row-major arrays
-  // =============================================================================
-
-  auto set_value_row_major = [](float *arr,
-                                std::vector<int> const &shape,
-                                std::vector<int> const &indices,
-                                float value) -> void {
-    int offset = 0;
-    for (int i = 0; i < shape.size(); i++) {
-      int index = indices[i];
-      int stride = 1;
-      for (int j = i + 1; j < shape.size(); j++) {
-        stride *= shape[j];
-      }
-      offset += index * stride;
-    }
-    *(arr + offset) = value;
-  };
-
-  // =============================================================================
-  //  Load input/output/weights and parse general configs
-  // =============================================================================
-
-  float *input_cpu =
-      download_tensor<float>(input.get_float_ptr(), input_domain.get_volume());
-  assert(input_cpu != nullptr);
-  float *weight_cpu = download_tensor<float>(weight.get_float_ptr(),
-                                             weight_domain.get_volume());
-  assert(weight_cpu != nullptr);
-  float *output_cpu = download_tensor<float>(output.get_float_ptr(),
-                                             output_domain.get_volume());
-  assert(output_cpu != nullptr);
-
-  // Input tensor dimensions
-  coord_t data_dim = input_domain.hi()[0] - input_domain.lo()[0] + 1;
-  coord_t max_sequence_length = input_domain.hi()[1] - input_domain.lo()[1] + 1;
-  coord_t batch_size = input_domain.hi()[2] - input_domain.lo()[2] + 1;
-  coord_t replica_dim = input_domain.hi()[3] - input_domain.lo()[3] + 1;
-  assert(replica_dim == 1);
-
-  size_t effective_batch_size = max_sequence_length * batch_size;
-  float inputs_arr[data_dim][effective_batch_size] = {0};
-  for (size_t i = 0; i < data_dim * bc.num_active_tokens(); i++) {
-    size_t data_index = i % data_dim;
-    size_t token_index = i / data_dim;
-    assert(data_index < data_dim);
-    assert(token_index < effective_batch_size);
-    inputs_arr[data_index][token_index] = input_cpu[i];
-  }
-  torch::Tensor torch_input = torch::from_blob(
-      inputs_arr, {data_dim, (long int)effective_batch_size}, torch::kFloat32);
-
-  // Weight tensor dimensions
-  coord_t all_weight_params = weight_domain.hi()[0] - weight_domain.lo()[0] + 1;
-  coord_t num_q_heads = weight_domain.hi()[1] - weight_domain.lo()[1] + 1;
-  replica_dim = weight_domain.hi()[2] - weight_domain.lo()[2] + 1;
-  size_t qParas = m->qProjSize * m->qSize;
-  size_t kParas = m->kProjSize * m->kSize;
-  size_t vParas = m->vProjSize * m->vSize;
-  size_t oParas = m->oProjSize * (m->vProjSize > 0 ? m->vProjSize : m->vSize);
-
-  assert(all_weight_params == qParas + kParas + vParas + oParas);
-  assert(num_q_heads == m->num_q_heads);
-  assert(replica_dim == 1);
-
-  assert(m->qSize == m->kSize && m->kSize == m->vSize);
-  // printf("m->qSize: %i\n", m->qSize);
-  //  keep things simple for now
-  assert(m->qProjSize == m->kProjSize && m->kProjSize == m->vProjSize);
-  long int proj_sum = m->qProjSize + m->kProjSize + m->vProjSize;
-  // load weight manually because Torch can't easily read a tensor serialized in
-  // column-major order.
-
-  // printf("m->kProjSize: %i, TreeVerifyBatchConfig::MAX_NUM_TOKENS: %i, "
-  //     "bc.num_active_tokens(): %i, num_q_heads: %lli,
-  //     TreeVerifyBatchConfig::MAX_NUM_REQUESTS: %i, "
-  //     "bc.num_active_requests(): %i\n", m->kProjSize,
-  //     TreeVerifyBatchConfig::MAX_NUM_TOKENS, bc.num_active_tokens(),
-  //     num_q_heads, TreeVerifyBatchConfig::MAX_NUM_REQUESTS,
-  //     bc.num_active_requests());
-  // for (int t=0; t < bc.num_active_tokens(); t++) {
-  //   printf("token %i has request_index: %li and token_position: %li\n",
-  //   t, bc.token2ids.token_indexes[t].request_index,
-  //   bc.token2ids.token_indexes[t].token_position);
-  // }
-
-  // =============================================================================
-  //  Load the output tensor (with CUDA results), and create a Torch tensor
-  // =============================================================================
-
-  float output_cuda[m->oProjSize][effective_batch_size] = {0};
-  for (int i = 0; i < m->oProjSize * effective_batch_size; i++) {
-    int row_idx = i % m->oProjSize;
-    int col_idx = i / m->oProjSize;
-    assert(row_idx < m->oProjSize && col_idx < effective_batch_size);
-    output_cuda[row_idx][col_idx] = output_cpu[i];
-  }
-  torch::Tensor torch_out_cuda =
-      torch::from_blob(output_cuda,
-                       {m->oProjSize, (int64_t)effective_batch_size},
-                       torch::kFloat32);
-
-  // =============================================================================
-  //  Load the Q/K/V projection weights, and create a Torch tensor
-  // =============================================================================
-  std::vector<int> w_qkv_shape = {m->qSize, m->qProjSize, 3, (int)num_q_heads};
-  float *w_qkv =
-      (float *)calloc(m->qSize * m->qProjSize * 3 * num_q_heads, sizeof(float));
-  assert(w_qkv[0] == 0.0f);
-
-  for (int h = 0; h < num_q_heads; h++) {
-    for (size_t i = 0; i < m->qProjSize * m->qSize; i++) {
-      int row_index = i % m->qSize;
-      int column_index = i / m->qSize;
-      // Q
-      set_value_row_major(w_qkv,
-                          w_qkv_shape,
-                          {row_index, column_index, 0, h},
-                          weight_cpu[all_weight_params * h +
-                                     m->qSize * column_index + row_index]);
-      // K
-      set_value_row_major(
-          w_qkv,
-          w_qkv_shape,
-          {row_index, column_index, 1, h},
-          weight_cpu[all_weight_params * h + m->qProjSize * m->qSize +
-                     m->qSize * column_index + row_index]);
-      // V
-      set_value_row_major(
-          w_qkv,
-          w_qkv_shape,
-          {row_index, column_index, 2, h},
-          weight_cpu[all_weight_params * h + 2 * m->qProjSize * m->qSize +
-                     m->qSize * column_index + row_index]);
-    }
-  }
-  // convert weights to torch tensor
-  torch::Tensor torch_w_qkv = torch::from_blob(
-      w_qkv, {m->qSize, m->qProjSize, 3, (int)num_q_heads}, torch::kFloat32);
-
-  /* std::cout << "Torch projection weights size: " << torch_w_qkv.sizes()
-            << std::endl;
-  std::cout << "Torch input size: " << torch_input.sizes() << std::endl;
-  std::cout << "Number of active tokens: " << bc.num_active_tokens()
-            << std::endl; */
-  // std::cout << "torch_w_qkv:" << std::endl << torch_w_qkv << std::endl;
-
-  // =============================================================================
-  //  Compute the Q/K/V projections, and compare the results with CUDA
-  // =============================================================================
-
-  //  ----------------------- C++ computations & checks ------------------------
-  torch::Tensor qkv_projs = torch::einsum(
-      "ijkl,im->jmkl",
-      {torch_w_qkv,
-       torch_input.index({Slice(), Slice(0, bc.num_active_tokens())})});
-  // std::cout << "qkv_projs size: " << qkv_projs.sizes() << std::endl;
-  assert(qkv_projs.sizes()[0] == m->qProjSize);
-  assert(qkv_projs.sizes()[1] == bc.num_active_tokens() &&
-         qkv_projs.sizes()[1] <= effective_batch_size);
-  assert(qkv_projs.sizes()[2] == 3);
-  assert(qkv_projs.sizes()[3] == num_q_heads);
-  free(w_qkv);
-
-  //  ----------------------- Loading CUDA results for this step ---------------
-  float *QKVProjArray_cpu = download_tensor<float>(
-      m->devQKVProjArray,
-      TreeVerifyBatchConfig::MAX_NUM_TOKENS * proj_sum * m->num_q_heads);
-  assert(QKVProjArray_cpu != nullptr);
-
-  std::vector<int> QKVProjArray_converted_shape = {
-      m->qProjSize, bc.num_active_tokens(), 3, (int)num_q_heads};
-  float *QKVProjArray_converted = (float *)calloc(
-      m->qProjSize * bc.num_active_tokens() * 3 * num_q_heads, sizeof(float));
-
-  // skip over padding at the end of QKVProjArray_cpu
-  // convert from column order to 3D matrix because torch cannot automatically
-  // import matrices flattened in column order
-  for (size_t i = 0; i < proj_sum * bc.num_active_tokens() * num_q_heads; i++) {
-    int proj_size_index = i % m->qProjSize;
-    int head_index = i / (proj_sum * bc.num_active_tokens());
-    int token_index =
-        ((i - head_index * proj_sum * bc.num_active_tokens()) / m->qProjSize) %
-        bc.num_active_tokens();
-    int qkv_offset = (i - head_index * proj_sum * bc.num_active_tokens()) /
-                     (m->qProjSize * bc.num_active_tokens());
-    assert(proj_size_index < proj_sum);
-    assert(head_index < num_q_heads);
-    assert(token_index < bc.num_active_tokens());
-    assert(qkv_offset < 3);
-    set_value_row_major(QKVProjArray_converted,
-                        QKVProjArray_converted_shape,
-                        {proj_size_index, token_index, qkv_offset, head_index},
-                        QKVProjArray_cpu[i]);
-  }
-  torch::Tensor QKVProjArray_torch =
-      torch::from_blob(QKVProjArray_converted,
-                       {m->qProjSize, bc.num_active_tokens(), 3, num_q_heads},
-                       torch::kFloat32);
-
-  //  ----------------------- Comparing C++ & CUDA results ---------------------
-  // std::cout << "QKVProjArray_torch" << std::endl;
-  // for (int i=0; i<num_q_heads; i++) {
-  //   for (int j=0; j<3; j++) {
-  //     std::cout << QKVProjArray_torch.index({Slice(), Slice(), j, i}) <<
-  //     std::endl;
-  //   }
-  // }
-  // std::cout << "qkv_projs" << std::endl;
-  // for (int i=0; i<num_q_heads; i++) {
-  //   for (int j=0; j<3; j++) {
-  //     std::cout << qkv_projs.index({Slice(), Slice(), j, i}) << std::endl;
-  //   }
-  // }
-  assert(torch::allclose(QKVProjArray_torch, qkv_projs, 1e-05, 1e-05));
-  free(QKVProjArray_converted);
-
-  // =============================================================================
-  //  Store the K/V projections into the cache
-  // =============================================================================
-
-  //  ----------------------- C++ operations & checks --------------------------
-  // Store projections into k/v cache arrays
-  for (size_t h = 0; h < num_q_heads; h++) {
-    for (size_t t = 0; t < bc.num_active_tokens(); t++) {
-      for (size_t d = 0; d < m->kProjSize; d++) {
-        size_t kcache_idx = d * MAX_SEQ_LEN * m->num_q_heads *
-                                TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
-                            bc.tokensInfo[t].abs_depth_in_request *
-                                m->num_q_heads *
-                                TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
-                            h * TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
-                            bc.tokensInfo[t].request_index;
-        m->kcache[kcache_idx] =
-            qkv_projs.index({(int64_t)d, (int64_t)t, 1, (int64_t)h})
-                .item<float>();
-      }
-      for (size_t d = 0; d < m->vProjSize; d++) {
-        size_t vcache_idx = d * MAX_SEQ_LEN * m->num_q_heads *
-                                TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
-                            bc.tokensInfo[t].abs_depth_in_request *
-                                m->num_q_heads *
-                                TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
-                            h * TreeVerifyBatchConfig::MAX_NUM_REQUESTS +
-                            bc.tokensInfo[t].request_index;
-        m->vcache[vcache_idx] =
-            qkv_projs.index({(int64_t)d, (int64_t)t, 2, (int64_t)h})
-                .item<float>();
-      }
-    }
-  }
-  // Create torch tensors from the arrays
-  torch::Tensor K_t =
-      torch::from_blob(m->kcache,
-                       {m->kProjSize,
-                        MAX_SEQ_LEN,
-                        num_q_heads,
-                        TreeVerifyBatchConfig::MAX_NUM_REQUESTS},
-                       torch::kFloat32);
-  torch::Tensor V_t =
-      torch::from_blob(m->vcache,
-                       {m->vProjSize,
-                        MAX_SEQ_LEN,
-                        num_q_heads,
-                        TreeVerifyBatchConfig::MAX_NUM_REQUESTS},
-                       torch::kFloat32);
-
-  // Compute useful indices
-  std::vector<size_t> req_idxs;
-  std::vector<size_t> r_first_idx;
-  std::vector<size_t> r_num_tokens;
-  for (size_t t = 0; t < bc.num_active_tokens(); t++) {
-    size_t rid = bc.tokensInfo[t].request_index;
-    if (req_idxs.size() == 0 || req_idxs[req_idxs.size() - 1] != rid) {
-      req_idxs.push_back(rid);
-      r_first_idx.push_back(t);
-      r_num_tokens.push_back(1);
-    } else {
-      r_num_tokens[r_num_tokens.size() - 1]++;
-    }
-    assert(req_idxs.size() == r_first_idx.size() &&
-           r_first_idx.size() == r_num_tokens.size());
-  }
-  assert(req_idxs.size() == bc.num_active_requests());
-  assert(std::accumulate(r_num_tokens.begin(),
-                         r_num_tokens.end(),
-                         decltype(r_num_tokens)::value_type(0)) ==
-         bc.num_active_tokens());
-
-  //  ----------------------- Loading CUDA results for this step ---------------
-  float *keyCache_cpu = download_tensor<float>(
-      m->keyCache,
-      m->num_q_heads * m->kProjSize * TreeVerifyBatchConfig::MAX_NUM_REQUESTS *
-          MAX_SEQ_LEN);
-  float *valueCache_cpu = download_tensor<float>(
-      m->valueCache,
-      m->num_q_heads * m->vProjSize * TreeVerifyBatchConfig::MAX_NUM_REQUESTS *
-          MAX_SEQ_LEN);
-  assert(keyCache_cpu != nullptr);
-  assert(valueCache_cpu != nullptr);
-
-  float *kcache_cuda =
-      (float *)calloc(m->kProjSize * MAX_SEQ_LEN * m->num_q_heads *
-                          TreeVerifyBatchConfig::MAX_NUM_REQUESTS,
-                      sizeof(float));
-  float *vcache_cuda =
-      (float *)calloc(m->vProjSize * MAX_SEQ_LEN * m->num_q_heads *
-                          TreeVerifyBatchConfig::MAX_NUM_REQUESTS,
-                      sizeof(float));
-  int index = 0;
-  for (int i = 0; i < m->kProjSize; i++) {
-    for (int j = 0; j < MAX_SEQ_LEN; j++) {
-      for (int k = 0; k < m->num_q_heads; k++) {
-        for (int l = 0; l < TreeVerifyBatchConfig::MAX_NUM_REQUESTS; l++) {
-          int col_major_index =
-              l * m->kProjSize * MAX_SEQ_LEN * m->num_q_heads +
-              k * m->kProjSize * MAX_SEQ_LEN + j * m->kProjSize + i;
-          kcache_cuda[index++] = keyCache_cpu[col_major_index];
-        }
-      }
-    }
-  }
-  index = 0;
-  for (int i = 0; i < m->vProjSize; i++) {
-    for (int j = 0; j < MAX_SEQ_LEN; j++) {
-      for (int k = 0; k < m->num_q_heads; k++) {
-        for (int l = 0; l < TreeVerifyBatchConfig::MAX_NUM_REQUESTS; l++) {
-          int col_major_index =
-              l * m->vProjSize * MAX_SEQ_LEN * m->num_q_heads +
-              k * m->vProjSize * MAX_SEQ_LEN + j * m->vProjSize + i;
-          vcache_cuda[index++] = valueCache_cpu[col_major_index];
-        }
-      }
-    }
-  }
-  torch::Tensor K_t_cuda =
-      torch::from_blob(kcache_cuda,
-                       {m->kProjSize,
-                        MAX_SEQ_LEN,
-                        num_q_heads,
-                        TreeVerifyBatchConfig::MAX_NUM_REQUESTS},
-                       torch::kFloat32);
-  torch::Tensor V_t_cuda =
-      torch::from_blob(vcache_cuda,
-                       {m->vProjSize,
-                        MAX_SEQ_LEN,
-                        num_q_heads,
-                        TreeVerifyBatchConfig::MAX_NUM_REQUESTS},
-                       torch::kFloat32);
-
-  //  ----------------------- Comparing C++ & CUDA results ---------------------
-
-  // std::cout << "kcache differences:" << std::endl;
-  // for (int i=0; i < bc.num_active_requests() + 1; i++) {
-  //   for (int j=0; j < num_q_heads; j++) {
-  //     for (int l=0; l < m->kProjSize; l++) {
-  //       for (int k=0; k < MAX_SEQ_LEN; k++) {
-  //         size_t kcache_idx =
-  //           l * MAX_SEQ_LEN * num_q_heads *
-  //           TreeVerifyBatchConfig::MAX_NUM_REQUESTS + k * num_q_heads *
-  //           TreeVerifyBatchConfig::MAX_NUM_REQUESTS + j *
-  //           TreeVerifyBatchConfig::MAX_NUM_REQUESTS + i; if (
-  //           abs(m->kcache[kcache_idx] - keyCache_cpu[
-  //               i * m->kProjSize * MAX_SEQ_LEN * num_q_heads +
-  //               j * m->kProjSize * MAX_SEQ_LEN +
-  //               k * m->kProjSize +
-  //               l
-  //           ]) > 0.00001) {
-  //             printf("req: %i (rid: %i), head: %i, data_dim: %i, token_pos:
-  //             %i\n",
-  //                   i, req_idxs[i], j, l, k);
-  //           }
-  //       }
-  //     }
-  //   }
-  // }
-
-  //  std::cout << "keyCache from CUDA:" << std::endl;
-  //  for (int i=0; i<bc.num_active_requests()+1; i++) {
-  //    for (int j=0; j<num_q_heads; j++) {
-  //     for (int l=0; l<m->kProjSize; l++) {
-  //       for (int k=0; k< MAX_SEQ_LEN; k++) {
-  //         printf("%f ",
-  //           keyCache_cpu[i * m->kProjSize * MAX_SEQ_LEN * num_q_heads +
-  //               j * m->kProjSize * MAX_SEQ_LEN +
-  //               k * m->kProjSize +
-  //               l
-  //         ]);
-  //       }
-  //       printf("\n");
-  //     }
-  //     printf("\n");
-  //    }
-  //    printf("\n");
-  //  }
-
-  //  std::cout << "valueCache from CUDA:" << std::endl;
-  //  for (int i=0; i<bc.num_active_requests()+1; i++) {
-  //    for (int j=0; j<num_q_heads; j++) {
-  //       for (int l=0; l<m->vProjSize; l++) {
-  //         for (int k=0; k< MAX_SEQ_LEN; k++) {
-  //           printf("%f ",
-  //             valueCache_cpu[
-  //                 i * m->vProjSize * MAX_SEQ_LEN * num_q_heads +
-  //                 j * m->vProjSize * MAX_SEQ_LEN +
-  //                 k * m->vProjSize +
-  //             l]);
-  //         }
-  //         printf("\n");
-  //       }
-  //       printf("\n");
-  //    }
-  //    printf("\n");
-  //  }
-
-  //  printf("\n");
-
-  //  std::cout << "C++ kcache:" << std::endl;
-  //  for (int i=0; i<bc.num_active_requests()+1; i++) {
-  //    for (int j=0; j < num_q_heads; j++) {
-  //       for (int l=0; l < m->kProjSize; l++) {
-  //         for (int k=0; k < MAX_SEQ_LEN; k++) {
-  //           size_t kcache_idx =
-  //             l * MAX_SEQ_LEN * num_q_heads *
-  //             TreeVerifyBatchConfig::MAX_NUM_REQUESTS + k * num_q_heads *
-  //             TreeVerifyBatchConfig::MAX_NUM_REQUESTS + j *
-  //             TreeVerifyBatchConfig::MAX_NUM_REQUESTS + i;
-  //           printf("%f ", m->kcache[kcache_idx]);
-  //         }
-  //         printf("\n");
-  //       }
-  //       printf("\n");
-  //    }
-  //    printf("\n");
-  //  }
-
-  //  std::cout << "C++ vcache:" << std::endl;
-  //  for (int i=0; i<bc.num_active_requests()+1; i++) {
-  //    for (int j=0; j<num_q_heads; j++) {
-  //       for (int l=0; l<m->vProjSize; l++) {
-  //         for (int k=0; k< MAX_SEQ_LEN; k++) {
-  //             size_t vcache_idx =
-  //               l * MAX_SEQ_LEN * num_q_heads *
-  //               TreeVerifyBatchConfig::MAX_NUM_REQUESTS + k * num_q_heads *
-  //               TreeVerifyBatchConfig::MAX_NUM_REQUESTS + j *
-  //               TreeVerifyBatchConfig::MAX_NUM_REQUESTS + i;
-  //             printf("%f ", m->vcache[vcache_idx]);
-  //         }
-  //         printf("\n");
-  //       }
-  //       printf("\n");
-  //    }
-  //    printf("\n");
-  //  }
-
-  assert(torch::allclose(K_t_cuda, K_t, 1e-05, 1e-05));
-  assert(torch::allclose(V_t_cuda, V_t, 1e-05, 1e-05));
-  free(kcache_cuda);
-  free(vcache_cuda);
-
-  // =============================================================================
-  //  Load the W_out projection weights
-  // =============================================================================
-
-  //  ----------------------- C++ operations & checks --------------------------
-  float *w_out = (float *)calloc(m->vProjSize * m->num_q_heads * m->oProjSize,
-                                 sizeof(float));
-  std::vector<int> w_out_shape = {m->vProjSize, m->num_q_heads, m->oProjSize};
-  assert(m->qProjSize == m->kProjSize && m->kProjSize == m->vProjSize);
-  for (int h = 0; h < num_q_heads; h++) {
-    for (int v = 0; v < m->vProjSize; v++) {
-      for (int o = 0; o < m->oProjSize; o++) {
-        set_value_row_major(
-            w_out,
-            w_out_shape,
-            {v, h, o},
-            weight_cpu[all_weight_params * h + 3 * m->qProjSize * m->qSize +
-                       m->vProjSize * o + v]);
-      }
-    }
-  }
-  // convert weights to torch tensor
-  torch::Tensor torch_w_out = torch::from_blob(
-      w_out, {m->vProjSize, m->num_q_heads, m->oProjSize}, torch::kFloat32);
-
-  //  ----------------------- Loading CUDA results for this step ---------------
-  float *w_out_cuda = download_tensor<float>(
-      m->W_out_contiguous, m->vProjSize * m->oProjSize * m->num_q_heads);
-  assert(w_out_cuda != nullptr);
-  float *converted_wout_tensor = (float *)calloc(
-      m->vProjSize * m->num_q_heads * m->oProjSize, sizeof(float));
-  std::vector<int> converted_wout_tensor_shape = {
-      m->vProjSize, m->num_q_heads, m->oProjSize};
-
-  for (int i = 0; i < m->vProjSize * m->num_q_heads * m->oProjSize; i++) {
-    int v_idx = i % m->vProjSize;
-    int h_idx = (i / m->vProjSize) % m->num_q_heads;
-    int o_idx = i / (m->vProjSize * m->num_q_heads);
-    assert(v_idx < m->vProjSize && h_idx < m->num_q_heads &&
-           o_idx < m->oProjSize);
-    set_value_row_major(converted_wout_tensor,
-                        converted_wout_tensor_shape,
-                        {v_idx, h_idx, o_idx},
-                        w_out_cuda[i]);
-  }
-  torch::Tensor w_out_cuda_tensor =
-      torch::from_blob(converted_wout_tensor,
-                       {m->vProjSize, m->num_q_heads, m->oProjSize},
-                       torch::kFloat32);
-
-  //  ----------------------- Comparing C++ & CUDA results ---------------------
-  assert(torch::allclose(w_out_cuda_tensor, torch_w_out, 1e-05, 1e-05));
-  free(converted_wout_tensor);
-
-  // =============================================================================
-  //  Compute the softmax(QK^T/sqrt(d_k))V product, request by request
-  // =============================================================================
-
-  //  ----------------------- C++ initialization steps -------------------------
-  torch::Tensor Q_projs = qkv_projs.index({Slice(), Slice(), 0, Slice()})
-                              .reshape({qkv_projs.sizes()[0],
-                                        qkv_projs.sizes()[1],
-                                        qkv_projs.sizes()[3]});
-
-  torch::Tensor qk_products[bc.num_active_requests()];
-  torch::Tensor qk_softmax[bc.num_active_requests()];
-  torch::Tensor attn_heads[bc.num_active_requests()];
-
-  torch::Tensor cpp_output =
-      torch::zeros({m->oProjSize, bc.num_active_tokens()});
-
-  //  ----------------------- Loading CUDA results for this step ---------------
-  float *qk_prods_cpu = download_tensor<float>(
-      m->qk_prods,
-      TreeVerifyBatchConfig::MAX_NUM_TOKENS *
-          TreeVerifyBatchConfig::MAX_NUM_TOKENS * num_q_heads);
-  assert(qk_prods_cpu != nullptr);
-
-  float *qk_prods_softmax_cpu = download_tensor<float>(
-      m->qk_prods_softmax,
-      TreeVerifyBatchConfig::MAX_NUM_TOKENS *
-          TreeVerifyBatchConfig::MAX_NUM_TOKENS * num_q_heads);
-  assert(qk_prods_softmax_cpu != nullptr);
-
-  float *attn_heads_cpu = download_tensor<float>(
-      m->attn_heads,
-      TreeVerifyBatchConfig::MAX_NUM_TOKENS * m->num_q_heads * m->vProjSize);
-  assert(attn_heads_cpu != nullptr);
-
-  //  ----------------------- Main loop (request by request) -------------------
-  size_t qk_prods_cpu_offset = 0;
-
-  for (size_t r = 0; r < bc.num_active_requests(); r++) {
-    // Compute pre-request parameters
-    size_t num_new_tokens = r_num_tokens[r];
-    int64_t rid = (int64_t)(req_idxs[r]);
-    int64_t num_tokens_received_so_far =
-        (int64_t)(bc.requestsInfo[rid].token_start_offset +
-                  bc.requestsInfo[rid].num_tokens_in_batch);
-    assert(num_new_tokens == bc.requestsInfo[rid].num_tokens_in_batch);
-    assert(num_tokens_received_so_far >= (int64_t)num_new_tokens);
-
-    //  ----------------------- C++ computations -------------------------------
-    // Get the slice of the Q projection tensor with the tokens in the current
-    // request
-    torch::Tensor Q_req =
-        Q_projs.index({Slice(),
-                       Slice(r_first_idx[r], r_first_idx[r] + num_new_tokens),
-                       Slice()});
-    // std::cout << "Q_req.sizes(): " << Q_req.sizes() << std::endl;
-    assert(Q_req.sizes()[0] == m->qProjSize);
-    assert(Q_req.sizes()[1] == num_new_tokens);
-    assert(Q_req.sizes()[2] == num_q_heads);
-
-    /*printf("\n------------ QK multiplication (C++) -------------\n");
-    printf("Request r=%lu. num_new_tokens: %lu, num_tokens_received_so_far: %li,
-    rid: %li, Qproj slice: (%i, %i)\n", r, num_new_tokens,
-    num_tokens_received_so_far, rid, r_first_idx[r], r_first_idx[r] +
-    num_new_tokens);
-
-    std::cout << "Q_req matrix (idk dims):" << std::endl <<
-    Q_req.index({Slice(), Slice(), 0}) << std::endl << std::endl; std::cout <<
-    "K_t matrix (ilk dims):" << std::endl << K_t.index({Slice(), Slice(0,
-    num_tokens_received_so_far), 0, rid}) << std::endl << std::endl; std::cout
-    << "C++ alpha: " << (1.0f / sqrt(m->kProjSize)) << std::endl;*/
-
-    // Compute (Q*K^T)/sqrt(d_k) matmul
-    qk_products[r] =
-        torch::einsum("ijk,ilk->jlk",
-                      {Q_req,
-                       K_t.index({Slice(),
-                                  Slice(0, num_tokens_received_so_far),
-                                  Slice(),
-                                  rid})}) *
-        (1.0f / sqrt(m->kProjSize));
-
-    // Set entries above diagonal to -inf to make attention causal.
-    for (int h = 0; h < num_q_heads; h++) {
-      qk_products[r].index(
-          {Slice(), Slice(num_tokens_received_so_far - num_new_tokens), h}) =
-          qk_products[r]
-              .index({Slice(),
-                      Slice(num_tokens_received_so_far - num_new_tokens),
-                      h})
-              .tril() +
-          torch::full({(int64_t)num_new_tokens, (int64_t)num_new_tokens},
-                      -INFINITY)
-              .triu()
-              .fill_diagonal_(0);
-    }
-    // Compute softmax for each request block
-    qk_softmax[r] = torch::softmax(qk_products[r], -2);
-    assert(qk_softmax[r].sizes()[0] == num_new_tokens);
-    assert(qk_softmax[r].sizes()[1] == num_tokens_received_so_far);
-    assert(qk_softmax[r].sizes()[2] == m->num_q_heads);
-
-    //  ------------------- Loading CUDA results for this step ---------------
-    float *converted_qk_prod = (float *)calloc(
-        num_new_tokens * num_tokens_received_so_far * num_q_heads,
-        sizeof(float));
-    float *converted_qk_prod_softmax = (float *)calloc(
-        num_new_tokens * num_tokens_received_so_far * num_q_heads,
-        sizeof(float));
-    std::vector<int> converted_qk_prod_shape = {
-        (int)num_new_tokens, (int)num_tokens_received_so_far, (int)num_q_heads};
-
-    for (size_t i = 0;
-         i < num_new_tokens * num_tokens_received_so_far * num_q_heads;
-         i++) {
-      size_t new_t_idx = i % num_new_tokens;
-      size_t all_t_idx = (i / num_new_tokens) % num_tokens_received_so_far;
-      size_t head_idx = i / (num_new_tokens * num_tokens_received_so_far);
-      assert(new_t_idx < num_new_tokens &&
-             all_t_idx < num_tokens_received_so_far && head_idx < num_q_heads);
-      set_value_row_major(converted_qk_prod,
-                          converted_qk_prod_shape,
-                          {(int)new_t_idx, (int)all_t_idx, (int)head_idx},
-                          qk_prods_cpu[i + qk_prods_cpu_offset]);
-      set_value_row_major(converted_qk_prod_softmax,
-                          converted_qk_prod_shape,
-                          {(int)new_t_idx, (int)all_t_idx, (int)head_idx},
-                          qk_prods_softmax_cpu[i + qk_prods_cpu_offset]);
-    }
-    torch::Tensor qk_prods_cuda = torch::from_blob(
-        converted_qk_prod,
-        {(int64_t)num_new_tokens, num_tokens_received_so_far, num_q_heads},
-        torch::kFloat32);
-    torch::Tensor qk_prods_softmax_cuda = torch::from_blob(
-        converted_qk_prod_softmax,
-        {(int64_t)num_new_tokens, num_tokens_received_so_far, num_q_heads},
-        torch::kFloat32);
-
-    //  ------------------- Comparing C++ & CUDA results ------------------
-    /* std::cout << "C++:" <<std::endl;
-    for (int h=0; h<num_q_heads; h++) {
-      std::cout << qk_products[r].index({Slice(), Slice(), h}) << std::endl;
-    }
-    std::cout << "CUDA:" <<std::endl;
-    for (int h=0; h<num_q_heads; h++) {
-      std::cout << qk_prods_cuda.index({Slice(), Slice(), h}) << std::endl;
-    } */
-    /* //
-    std::cout << "C++:" <<std::endl;
-    for (int h=0; h<num_q_heads; h++) {
-      std::cout << qk_softmax[r].index({Slice(), Slice(), h}) << std::endl;
-    }
-    std::cout << "CUDA:" <<std::endl;
-    for (int h=0; h<num_q_heads; h++) {
-      std::cout << qk_prods_softmax_cuda.index({Slice(), Slice(), h}) <<
-    std::endl;
-    } */
-    // std::cout << "C++ tril:" <<std::endl;
-    // for (int h=0; h<num_q_heads; h++) {
-    //   std::cout << qk_products[r].tril().index({Slice(), Slice(), h}) <<
-    //   std::endl;
-    // }
-    assert(torch::allclose(qk_prods_cuda, qk_products[r], 1e-05, 1e-05));
-    assert(torch::allclose(qk_prods_softmax_cuda, qk_softmax[r], 1e-05, 1e-05));
-    free(converted_qk_prod);
-    free(converted_qk_prod_softmax);
-
-    //  --------------------- C++ computations --------------------------
-    // Multiply softmax results by V
-    assert(
-        V_t.index({Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})
-            .sizes()[0] == m->vProjSize);
-    assert(
-        V_t.index({Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})
-            .sizes()[1] == num_tokens_received_so_far);
-    assert(
-        V_t.index({Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})
-            .sizes()[2] == m->num_q_heads);
-    attn_heads[r] = torch::einsum(
-        "ijk,ljk->ilk",
-        {qk_softmax[r],
-         V_t.index(
-             {Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})});
-    assert(attn_heads[r].sizes()[0] == num_new_tokens);
-    assert(attn_heads[r].sizes()[1] == m->vProjSize);
-    assert(attn_heads[r].sizes()[2] == m->num_q_heads);
-
-    //  ------------------- Loading CUDA results for this step  ---------------
-    float converted_attn_heads_cpu[num_new_tokens][m->vProjSize]
-                                  [m->num_q_heads] = {0};
-    for (int i = 0; i < num_new_tokens * m->vProjSize * m->num_q_heads; i++) {
-      int token_ix = i % num_new_tokens;
-      int vproj_idx = (i / num_new_tokens) % m->vProjSize;
-      int head_idx = i / (num_new_tokens * m->vProjSize);
-      assert(token_ix < num_new_tokens && vproj_idx < m->vProjSize &&
-             head_idx < m->num_q_heads);
-      converted_attn_heads_cpu[token_ix][vproj_idx][head_idx] =
-          attn_heads_cpu[r_first_idx[r] * m->vProjSize * m->num_q_heads + i];
-    }
-    torch::Tensor converted_attn_heads_cuda = torch::from_blob(
-        converted_attn_heads_cpu,
-        {(int64_t)num_new_tokens, m->vProjSize, m->num_q_heads},
-        torch::kFloat32);
-
-    //  -------------------- Comparing C++ & CUDA results -------------------
-    /* std::cout << "CUDA attn head for req " << r << ":" <<std::endl;
-    for (int h=0; h<m->num_q_heads; h++) {
-      std::cout << converted_attn_heads_cuda.index({Slice(), Slice(), h}) <<
-    std::endl;
-    }
-    std::cout << "C++ attn head for req " << r << ":" <<std::endl;
-    for (int h=0; h<m->num_q_heads; h++) {
-      std::cout << attn_heads[r].index({Slice(), Slice(), h}) << std::endl;
-    } */
-    assert(torch::allclose(
-        converted_attn_heads_cuda, attn_heads[r], 1e-05, 1e-05));
-
-    //  ----------------------- C++ computations ----------------------------
-    // Compute output values by projecting all heads to output space
-    cpp_output.index(
-        {Slice(),
-         Slice(r_first_idx[r], r_first_idx[r] + (int64_t)num_new_tokens)}) =
-        torch::einsum("jkl,ijk->li", {torch_w_out, attn_heads[r]});
-
-    // increment main loop's auxiliary index
-    qk_prods_cpu_offset +=
-        num_new_tokens * num_tokens_received_so_far * num_q_heads;
-  }
-
-  //  ----------------------- Comparing C++ & CUDA results ---------------------
-  /* std::cout << "C++:" <<std::endl;
-  for (int i=0; i<m->oProjSize; i++) {
-    std::cout << cpp_output.index({i, Slice()}) << std::endl;
-  }
-  std::cout << "CUDA:" <<std::endl;
-  for (int i=0; i<m->oProjSize; i++) {
-    std::cout << torch_out_cuda.index({i, Slice(0,
-  (int64_t)bc.num_active_tokens())}) << std::endl;
-  } */
-
-  assert(
-      torch::allclose(torch_out_cuda.index(
-                          {Slice(), Slice(0, (int64_t)bc.num_active_tokens())}),
-                      cpp_output,
-                      1e-05,
-                      1e-05));
-
-  // =============================================================================
-  //  Cleanup
-  // =============================================================================
-  free(w_out);
-  checkCUDA(cudaFreeHost(input_cpu));
-  checkCUDA(cudaFreeHost(weight_cpu));
-  checkCUDA(cudaFreeHost(output_cpu));
-  checkCUDA(cudaFreeHost(QKVProjArray_cpu));
-  checkCUDA(cudaFreeHost(keyCache_cpu));
-  checkCUDA(cudaFreeHost(valueCache_cpu));
-  checkCUDA(cudaFreeHost(qk_prods_cpu));
-  checkCUDA(cudaFreeHost(qk_prods_softmax_cpu));
-  checkCUDA(cudaFreeHost(attn_heads_cpu));
-  checkCUDA(cudaFreeHost(w_out_cuda));
-  // assert(false && "All good if you see this assert failure! :)");
-#endif
-  // Done with INFERENCE_TESTS block
 }
 
 void TreeIncMultiHeadSelfAttention::backward(FFModel const &ff) {
@@ -1664,13 +885,13 @@ bool operator==(TreeIncMultiHeadSelfAttentionParams const &lhs,
   return lhs.layer_guid == rhs.layer_guid && lhs.embed_dim == rhs.embed_dim &&
          lhs.num_q_heads == rhs.num_q_heads && lhs.kdim == rhs.kdim &&
          lhs.vdim == rhs.vdim && lhs.dropout == rhs.dropout &&
-         lhs.bias == rhs.bias && lhs.add_bias_kv == rhs.add_bias_kv &&
+         lhs.qkv_bias == rhs.qkv_bias && lhs.final_bias == rhs.final_bias &&
          lhs.add_zero_attn == rhs.add_zero_attn &&
          lhs.apply_rotary_embedding == rhs.apply_rotary_embedding &&
          lhs.scaling_query == rhs.scaling_query &&
          lhs.scaling_factor == rhs.scaling_factor &&
          lhs.qk_prod_scaling == rhs.qk_prod_scaling &&
-         lhs.position_bias == lhs.position_bias;
+         lhs.position_bias == rhs.position_bias;
 }
 
 TreeIncMultiHeadSelfAttentionParams
@@ -1683,8 +904,8 @@ TreeIncMultiHeadSelfAttentionParams
   params.kdim = this->kProjSize;
   params.vdim = this->vProjSize;
   params.dropout = this->dropout;
-  params.bias = this->bias;
-  params.add_bias_kv = this->add_bias_kv;
+  params.qkv_bias = this->qkv_bias;
+  params.final_bias = this->final_bias;
   params.add_zero_attn = this->add_zero_attn;
   params.apply_rotary_embedding = this->apply_rotary_embedding;
   params.scaling_query = this->scaling_query;
@@ -1708,8 +929,8 @@ size_t hash<FlexFlow::TreeIncMultiHeadSelfAttentionParams>::operator()(
   hash_combine(key, params.kdim);
   hash_combine(key, params.vdim);
   hash_combine(key, params.dropout);
-  hash_combine(key, params.bias);
-  hash_combine(key, params.add_bias_kv);
+  hash_combine(key, params.qkv_bias);
+  hash_combine(key, params.final_bias);
   hash_combine(key, params.add_zero_attn);
   hash_combine(key, params.apply_rotary_embedding);
   hash_combine(key, params.scaling_query);
diff --git a/src/ops/tree_inc_multihead_self_attention.cpp b/src/ops/tree_inc_multihead_self_attention.cpp
index 1a9d1b6968..0fa68bed08 100644
--- a/src/ops/tree_inc_multihead_self_attention.cpp
+++ b/src/ops/tree_inc_multihead_self_attention.cpp
@@ -500,7 +500,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
     // check that we have finished all tokens of the request
     assert(last_token_idx_of_the_request + 1 == processed_tokens_in_batch);
   }
-  if (*m->bias && shard_id == 0) {
+  if (*m->final_bias && shard_id == 0) {
     int parallelism = m->oProjSize * processed_tokens_in_batch;
     int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
                           m->kProjSize * m->global_num_kv_heads +
@@ -608,7 +608,7 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
     GenericTensorAccessorR const &bias) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
-  bool use_bias = *m->bias;
+  bool use_bias = *m->qkv_bias || *m->final_bias;
 
   hipEvent_t t_start, t_end;
   if (m->profiling) {
@@ -692,11 +692,11 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
                                     attn->vProjSize,
                                     attn->oProjSize,
                                     attn->apply_rotary_embedding,
-                                    attn->bias,
+                                    attn->qkv_bias,
                                     attn->scaling_query,
                                     attn->qk_prod_scaling,
                                     attn->position_bias,
-                                    attn->add_bias_kv,
+                                    attn->final_bias,
                                     attn->scaling_factor,
                                     weight,
                                     gpu_mem_allocator,
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index f916bdb925..95ac93ad8a 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -500,7 +500,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
     // check that we have finished all tokens of the request
     assert(last_token_idx_of_the_request + 1 == processed_tokens_in_batch);
   }
-  if (*m->bias && shard_id == 0) {
+  if (*m->final_bias && shard_id == 0) {
     int parallelism = m->oProjSize * processed_tokens_in_batch;
     int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
                           m->kProjSize * m->global_num_kv_heads +
@@ -605,7 +605,7 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
     GenericTensorAccessorR const &bias) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
-  bool use_bias = *m->bias;
+  bool use_bias = *m->qkv_bias || *m->final_bias;
 
   cudaEvent_t t_start, t_end;
   if (m->profiling) {
@@ -689,11 +689,11 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
                                     attn->vProjSize,
                                     attn->oProjSize,
                                     attn->apply_rotary_embedding,
-                                    attn->bias,
+                                    attn->qkv_bias,
                                     attn->scaling_query,
                                     attn->qk_prod_scaling,
                                     attn->position_bias,
-                                    attn->add_bias_kv,
+                                    attn->final_bias,
                                     attn->scaling_factor,
                                     weight,
                                     gpu_mem_allocator,
diff --git a/src/runtime/ffconst_utils.cc b/src/runtime/ffconst_utils.cc
index 0723ee136d..2b1910637f 100644
--- a/src/runtime/ffconst_utils.cc
+++ b/src/runtime/ffconst_utils.cc
@@ -170,6 +170,8 @@ std::string get_operator_type_name(OperatorType type) {
       return "Mean";
     case OP_LAYERNORM:
       return "LayerNorm";
+    case OP_ADD_BIAS_RESIDUAL_LAYERNORM:
+      return "AddBiasResidualLayerNorm";
     case OP_RMS_NORM:
       return "RMSNorm";
     case OP_GELU:
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index 0e957f0702..5a5e267d96 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -15,6 +15,7 @@
 #include "flexflow/graph.h"
 #include "flexflow/dominators.h"
 #include "flexflow/ffconst_utils.h"
+#include "flexflow/ops/add_bias_residual_layer_norm.h"
 #include "flexflow/ops/aggregate.h"
 #include "flexflow/ops/arg_topk.h"
 #include "flexflow/ops/argmax.h"
@@ -2316,8 +2317,8 @@ GraphOptimalViewSerialized
         sez.serialize(attn->qProjSize);
         sez.serialize(attn->vProjSize);
         sez.serialize(attn->dropout);
-        sez.serialize(attn->bias);
-        sez.serialize(attn->add_bias_kv);
+        sez.serialize(attn->qkv_bias);
+        sez.serialize(attn->final_bias);
         sez.serialize(attn->add_zero_attn);
         sez.serialize(attn->apply_rotary_embedding);
         sez.serialize(attn->scaling_query);
@@ -2340,8 +2341,8 @@ GraphOptimalViewSerialized
         sez.serialize(attn->qProjSize);
         sez.serialize(attn->vProjSize);
         sez.serialize(attn->dropout);
-        sez.serialize(attn->bias);
-        sez.serialize(attn->add_bias_kv);
+        sez.serialize(attn->qkv_bias);
+        sez.serialize(attn->final_bias);
         sez.serialize(attn->add_zero_attn);
         sez.serialize(attn->apply_rotary_embedding);
         sez.serialize(attn->scaling_query);
@@ -2361,8 +2362,8 @@ GraphOptimalViewSerialized
         sez.serialize(attn->qProjSize);
         sez.serialize(attn->vProjSize);
         sez.serialize(attn->dropout);
-        sez.serialize(attn->bias);
-        sez.serialize(attn->add_bias_kv);
+        sez.serialize(attn->qkv_bias);
+        sez.serialize(attn->final_bias);
         sez.serialize(attn->add_zero_attn);
         sez.serialize(attn->apply_rotary_embedding);
         sez.serialize(attn->scaling_query);
@@ -2701,6 +2702,11 @@ void FFModel::deserialize_graph_optimal_view(
         node = LayerNorm::deserialize(*this, dez, inputs, num_inputs);
         break;
       }
+      case OP_ADD_BIAS_RESIDUAL_LAYERNORM: {
+        node = AddBiasResidualLayerNorm::deserialize(
+            *this, dez, inputs, num_inputs);
+        break;
+      }
       case OP_LINEAR: {
         node = Linear::deserialize(*this, dez, inputs, num_inputs);
         break;
@@ -2742,7 +2748,7 @@ void FFModel::deserialize_graph_optimal_view(
         int embed_dim, num_q_heads, k_dim, v_dim, num_kv_heads,
             tensor_parallelism_degree;
         float dropout, scaling_factor;
-        bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
+        bool qkv_bias, final_bias, add_zero_attn, apply_rotary_embedding,
             scaling_query, qk_prod_scaling, offload, position_bias;
         DataType quantization_type;
         size_t id, transformer_layer_id;
@@ -2754,8 +2760,8 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(k_dim);
         dez.deserialize(v_dim);
         dez.deserialize(dropout);
-        dez.deserialize(bias);
-        dez.deserialize(add_bias_kv);
+        dez.deserialize(qkv_bias);
+        dez.deserialize(final_bias);
         dez.deserialize(add_zero_attn);
         dez.deserialize(apply_rotary_embedding);
         dez.deserialize(scaling_query);
@@ -2773,8 +2779,8 @@ void FFModel::deserialize_graph_optimal_view(
         params.kdim = k_dim;
         params.vdim = v_dim;
         params.dropout = dropout;
-        params.bias = bias;
-        params.add_bias_kv = add_bias_kv;
+        params.qkv_bias = qkv_bias;
+        params.final_bias = final_bias;
         params.add_zero_attn = add_zero_attn;
         params.layer_guid = layer_guid;
         params.apply_rotary_embedding = apply_rotary_embedding;
@@ -2793,7 +2799,7 @@ void FFModel::deserialize_graph_optimal_view(
         assert(num_inputs == 1);
         int embed_dim, num_q_heads, k_dim, v_dim, num_kv_heads;
         float dropout, scaling_factor;
-        bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
+        bool qkv_bias, final_bias, add_zero_attn, apply_rotary_embedding,
             scaling_query, qk_prod_scaling, position_bias;
         size_t id, transformer_layer_id;
         dez.deserialize(id);
@@ -2804,8 +2810,8 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(k_dim);
         dez.deserialize(v_dim);
         dez.deserialize(dropout);
-        dez.deserialize(bias);
-        dez.deserialize(add_bias_kv);
+        dez.deserialize(qkv_bias);
+        dez.deserialize(final_bias);
         dez.deserialize(add_zero_attn);
         dez.deserialize(apply_rotary_embedding);
         dez.deserialize(scaling_query);
@@ -2820,8 +2826,8 @@ void FFModel::deserialize_graph_optimal_view(
         params.kdim = k_dim;
         params.vdim = v_dim;
         params.dropout = dropout;
-        params.bias = bias;
-        params.add_bias_kv = add_bias_kv;
+        params.qkv_bias = qkv_bias;
+        params.final_bias = final_bias;
         params.add_zero_attn = add_zero_attn;
         params.layer_guid = layer_guid;
         params.apply_rotary_embedding = apply_rotary_embedding;
@@ -2839,7 +2845,7 @@ void FFModel::deserialize_graph_optimal_view(
         int embed_dim, num_q_heads, k_dim, v_dim, num_kv_heads,
             tensor_parallelism_degree;
         float dropout, scaling_factor;
-        bool bias, add_bias_kv, add_zero_attn, apply_rotary_embedding,
+        bool qkv_bias, final_bias, add_zero_attn, apply_rotary_embedding,
             scaling_query, qk_prod_scaling, offload, position_bias;
         DataType quantization_type;
         size_t id, transformer_layer_id;
@@ -2851,8 +2857,8 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(k_dim);
         dez.deserialize(v_dim);
         dez.deserialize(dropout);
-        dez.deserialize(bias);
-        dez.deserialize(add_bias_kv);
+        dez.deserialize(qkv_bias);
+        dez.deserialize(final_bias);
         dez.deserialize(add_zero_attn);
         dez.deserialize(apply_rotary_embedding);
         dez.deserialize(scaling_query);
@@ -2870,8 +2876,8 @@ void FFModel::deserialize_graph_optimal_view(
         params.kdim = k_dim;
         params.vdim = v_dim;
         params.dropout = dropout;
-        params.bias = bias;
-        params.add_bias_kv = add_bias_kv;
+        params.qkv_bias = qkv_bias;
+        params.final_bias = final_bias;
         params.add_zero_attn = add_zero_attn;
         params.layer_guid = layer_guid;
         params.apply_rotary_embedding = apply_rotary_embedding;
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 2768439117..4f8caaa570 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -22,6 +22,7 @@
 #include "flexflow/ffconst_utils.h"
 #include "flexflow/graph.h"
 #include "flexflow/mapper.h"
+#include "flexflow/ops/add_bias_residual_layer_norm.h"
 #include "flexflow/ops/aggregate.h"
 #include "flexflow/ops/aggregate_spec.h"
 #include "flexflow/ops/arg_topk.h"
@@ -3100,6 +3101,12 @@ Op *FFModel::create_operator_from_layer(
       operators.push_back(op);
       return op;
     }
+    case OP_ADD_BIAS_RESIDUAL_LAYERNORM: {
+      Op *op = AddBiasResidualLayerNorm::create_operator_from_layer(
+          *this, layer, inputs);
+      operators.push_back(op);
+      return op;
+    }
     case OP_RMS_NORM: {
       Op *op = RMSNorm::create_operator_from_layer(*this, layer, inputs);
       operators.push_back(op);
@@ -5205,6 +5212,42 @@ void register_flexflow_internal_tasks(Runtime *runtime,
       runtime->register_task_variant<LayerNorm::forward_task>(registrar);
     }
   }
+  // AddBiasResidualLayerNorm task
+  {
+    TaskVariantRegistrar registrar(ADD_BIAS_RESIDUAL_LAYERNORM_INIT_TASK_ID,
+                                   "add_bias_residual_layernorm_init_task");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<OpMeta *,
+                                        AddBiasResidualLayerNorm::init_task>(
+          registrar, "add_bias_residual_layernorm_init_task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<OpMeta *,
+                                     AddBiasResidualLayerNorm::init_task>(
+          registrar);
+    }
+  }
+  {
+    TaskVariantRegistrar registrar(ADD_BIAS_RESIDUAL_LAYERNORM_INF_TASK_ID,
+                                   "add_bias_residual_layernorm_fwd_task");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<
+          AddBiasResidualLayerNorm::inference_task>(
+          registrar, "add_bias_residual_layernorm_inference_task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<AddBiasResidualLayerNorm::inference_task>(
+          registrar);
+    }
+  }
   // rms norm task
   {
     TaskVariantRegistrar registrar(RMSNROM_INIT_TASK_ID, "rmsnorm_init_task");
diff --git a/src/runtime/operator_params.cc b/src/runtime/operator_params.cc
index 5f9ae98936..a983dcdb03 100644
--- a/src/runtime/operator_params.cc
+++ b/src/runtime/operator_params.cc
@@ -1,4 +1,5 @@
 #include "flexflow/operator_params.h"
+#include "flexflow/ops/add_bias_residual_layer_norm.h"
 #include "flexflow/ops/aggregate.h"
 #include "flexflow/ops/aggregate_spec.h"
 #include "flexflow/ops/arg_topk.h"
@@ -93,6 +94,8 @@ tl::optional<OperatorParameters> get_op_parameters(Op const *op) {
       return ((TreeIncMultiHeadSelfAttention *)op)->get_params();
     case OP_LAYERNORM:
       return ((LayerNorm *)op)->get_params();
+    case OP_ADD_BIAS_RESIDUAL_LAYERNORM:
+      return ((AddBiasResidualLayerNorm *)op)->get_params();
     case OP_REDUCE_SUM:
       return ((Reduce *)op)->get_params();
     case OP_RESHAPE:
diff --git a/src/runtime/substitution.cc b/src/runtime/substitution.cc
index 5071b5dd66..ae3be1222e 100644
--- a/src/runtime/substitution.cc
+++ b/src/runtime/substitution.cc
@@ -18,6 +18,7 @@
 #include "flexflow/ffconst_utils.h"
 #include "flexflow/graph.h"
 #include "flexflow/graph_structures.h"
+#include "flexflow/ops/add_bias_residual_layer_norm.h"
 #include "flexflow/ops/aggregate.h"
 #include "flexflow/ops/attention.h"
 #include "flexflow/ops/concat.h"
@@ -3798,6 +3799,22 @@ bool FFModel::convert_graph_to_operators(
         new_op = new FusedParallelOp(*this, inputs[0], parallel_ops);
         break;
       }
+      case OP_ADD_BIAS_RESIDUAL_LAYERNORM: {
+        assert(inList.size() == 2);
+        AddBiasResidualLayerNorm *abr_ln = (AddBiasResidualLayerNorm *)node.ptr;
+        AddBiasResidualLayerNormParams params = abr_ln->get_params();
+        new_op = new AddBiasResidualLayerNorm(*this,
+                                              abr_ln->layer_guid,
+                                              inputs[0],
+                                              inputs[1],
+                                              abr_ln->axes,
+                                              abr_ln->elementwise_affine,
+                                              abr_ln->use_bias,
+                                              abr_ln->eps,
+                                              true,
+                                              NULL);
+        break;
+      }
       default: {
         new_op = node.ptr->materialize(*this, inputs, num_inputs);
         break;
diff --git a/tests/inference/huggingface_inference.py b/tests/inference/huggingface_inference.py
index 072e8f2bdb..fee215f4c4 100644
--- a/tests/inference/huggingface_inference.py
+++ b/tests/inference/huggingface_inference.py
@@ -1,6 +1,7 @@
 import argparse
 import json
 import os
+import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer, AutoConfig, LlamaTokenizer
 
 def main():
@@ -39,12 +40,11 @@ def main():
 
     # Set default tensor type depending on argument indicating the float type to use
     if not args.use_full_precision:
-        import torch
-
         torch.set_default_tensor_type(torch.HalfTensor)
 
     # Run huggingface model
-    device = "cuda" if args.gpu else "cpu"
+    cuda_availble = torch.cuda.is_available()
+    device = "cuda" if args.gpu and cuda_availble else "cpu"
     # Get Model
     model = AutoModelForCausalLM.from_pretrained(args.model_name).to(device)
     # Get Tokenizer

From 322afa9d878b4b4a063e63a65f26d67f9c7a5aa0 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sat, 23 Sep 2023 17:14:25 -0400
Subject: [PATCH 230/344] Fuse inference kernels (part 2) (#1143)

* fuse sigmoid,silu,multi in llama model

* linting

* fix

* use new fused op

* fix

* fix

* .

* fuse rms norm kernels

* cleanup

* hip rocm fix

* fix typo

* add residual rms norm

* fix

* fix

* add missing file

* linting

* fix

* fix

* fix

* fix hip rocm

* fix warning

* removed deadcode

* fix, apply fused op for rms norm and add

* fix sigmoid-silu-multi with tensor parallelism

* fix

* fix

* fix floating point issue

* remove comment
---
 include/flexflow/ffconst.h                    |   2 +
 include/flexflow/flexflow_c.h                 |  14 +
 include/flexflow/model.h                      |  33 +-
 include/flexflow/operator_params.h            |   4 +
 .../ops/kernels/residual_rms_norm_kernels.h   |  56 ++
 include/flexflow/ops/residual_rms_norm.h      |  88 +++
 .../flexflow/ops/residual_rms_norm_params.h   |  29 +
 include/flexflow/ops/sigmoid_silu_multi.h     |  86 +++
 .../flexflow/ops/sigmoid_silu_multi_params.h  |  24 +
 include/flexflow/substitution_loader.h        |   2 +
 inference/file_loader.cc                      |   2 +-
 inference/models/falcon.cc                    | 183 ++++---
 inference/models/llama.cc                     | 209 +++++---
 inference/models/mpt.cc                       | 122 +++--
 inference/models/opt.cc                       |  57 +-
 inference/models/starcoder.cc                 | 165 +++---
 python/flexflow/core/flexflow_cffi.py         |  49 ++
 python/flexflow/serve/models/llama.py         |  14 +-
 python/flexflow/serve/models/mpt.py           |  25 +-
 python/flexflow/serve/models/opt.py           |  27 +-
 python/flexflow/serve/models/starcoder.py     |  20 +-
 python/flexflow/type.py                       |   2 +
 src/c/flexflow_c.cc                           |  40 ++
 src/ops/add_bias_residual_layer_norm.cc       |  24 +-
 src/ops/fused.cpp                             |  35 ++
 src/ops/fused.cu                              |  35 ++
 src/ops/kernels/residual_rms_norm_kernels.cpp | 227 ++++++++
 src/ops/kernels/residual_rms_norm_kernels.cu  | 224 ++++++++
 src/ops/kernels/rms_norm_kernels.cpp          |  85 ++-
 src/ops/kernels/rms_norm_kernels.cu           |  93 +++-
 src/ops/layer_norm.cu                         |   6 +-
 src/ops/residual_rms_norm.cc                  | 505 ++++++++++++++++++
 src/ops/rms_norm.cc                           |   8 +-
 src/ops/sampling.cpp                          |   2 +-
 src/ops/sigmoid_silu_multi.cc                 | 390 ++++++++++++++
 src/ops/sigmoid_silu_multi.cpp                | 118 ++++
 src/ops/sigmoid_silu_multi.cu                 |  97 ++++
 src/runtime/ffconst_utils.cc                  |   4 +
 src/runtime/graph.cc                          |  10 +
 src/runtime/model.cc                          | 150 +++---
 src/runtime/operator_params.cc                |   6 +
 src/runtime/substitution.cc                   |  10 +
 42 files changed, 2741 insertions(+), 541 deletions(-)
 create mode 100644 include/flexflow/ops/kernels/residual_rms_norm_kernels.h
 create mode 100644 include/flexflow/ops/residual_rms_norm.h
 create mode 100644 include/flexflow/ops/residual_rms_norm_params.h
 create mode 100644 include/flexflow/ops/sigmoid_silu_multi.h
 create mode 100644 include/flexflow/ops/sigmoid_silu_multi_params.h
 create mode 100644 src/ops/kernels/residual_rms_norm_kernels.cpp
 create mode 100644 src/ops/kernels/residual_rms_norm_kernels.cu
 create mode 100644 src/ops/residual_rms_norm.cc
 create mode 100644 src/ops/sigmoid_silu_multi.cc
 create mode 100644 src/ops/sigmoid_silu_multi.cpp
 create mode 100644 src/ops/sigmoid_silu_multi.cu

diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index f86cbff399..9dc68e21ed 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -160,9 +160,11 @@ enum OperatorType {
   OP_MEAN,  // https://pytorch.org/docs/stable/generated/torch.mean.html
   OP_LAYERNORM,
   OP_ADD_BIAS_RESIDUAL_LAYERNORM,
+  OP_SIGMOID_SILU_MULTI,
   OP_EXPERTS,
   OP_GATHER, // https://pytorch.org/docs/stable/generated/torch.gather.html
   OP_RMS_NORM,
+  OP_RESIDUAL_RMS_NORM,
   OP_BEAM_TOPK,
   OP_ARGMAX,
   OP_INC_MULTIHEAD_SELF_ATTENTION,
diff --git a/include/flexflow/flexflow_c.h b/include/flexflow/flexflow_c.h
index e363ccf888..995c238a8c 100644
--- a/include/flexflow/flexflow_c.h
+++ b/include/flexflow/flexflow_c.h
@@ -270,6 +270,12 @@ flexflow_tensor_t *flexflow_model_add_add_bias_residual_layer_norm(
     bool use_bias,
     char const *name);
 
+flexflow_tensor_t
+    flexflow_model_add_sigmoid_silu_multi(flexflow_model_t handle,
+                                          const flexflow_tensor_t input1,
+                                          const flexflow_tensor_t input2,
+                                          char const *name);
+
 flexflow_tensor_t
     flexflow_model_add_batch_matmul(flexflow_model_t handle,
                                     const flexflow_tensor_t a,
@@ -540,6 +546,14 @@ flexflow_tensor_t flexflow_model_add_rms_norm(flexflow_model_t handle_,
                                               int dim,
                                               char const *name);
 
+flexflow_tensor_t *
+    flexflow_model_add_residual_rms_norm(flexflow_model_t handle_,
+                                         const flexflow_tensor_t input1_,
+                                         const flexflow_tensor_t input2_,
+                                         float eps,
+                                         int dim,
+                                         char const *name);
+
 flexflow_tensor_t flexflow_model_add_arg_top_k(flexflow_model_t handle_,
                                                const flexflow_tensor_t input_,
                                                int k,
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 05a12bee31..f88f96cd5a 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -108,6 +108,8 @@ enum TaskIDs {
   LAYERNORM_BWD_TASK_ID,
   ADD_BIAS_RESIDUAL_LAYERNORM_INIT_TASK_ID,
   ADD_BIAS_RESIDUAL_LAYERNORM_INF_TASK_ID,
+  SIGMOID_SILU_MULTI_INIT_TASK_ID,
+  SIGMOID_SILU_MULTI_INF_TASK_ID,
   LINEAR_INIT_TASK_ID,
   LINEAR_INIT_PARA_TASK_ID,
   LINEAR_INF_TASK_ID,
@@ -153,9 +155,11 @@ enum TaskIDs {
   ATTENTION_INIT_TASK_ID,
   ATTENTION_FWD_TASK_ID,
   ATTENTION_BWD_TASK_ID,
-  RMSNROM_INIT_TASK_ID,
-  RMSNROM_FWD_TASK_ID,
-  RMSNROM_INF_TASK_ID,
+  RMSNORM_INIT_TASK_ID,
+  RMSNORM_FWD_TASK_ID,
+  RMSNORM_INF_TASK_ID,
+  RESIDUAL_RMSNORM_INIT_TASK_ID,
+  RESIDUAL_RMSNORM_INF_TASK_ID,
   BEAM_TOPK_INIT_TASK_ID,
   BEAM_TOPK_INF_TASK_ID,
   INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
@@ -312,6 +316,7 @@ class Gather;
 class Group_by;
 class LayerNorm;
 class AddBiasResidualLayerNorm;
+class SigmoidSiluMulti;
 class Linear;
 class MultiHeadAttention;
 class IncMultiHeadSelfAttention;
@@ -325,6 +330,7 @@ class TopK;
 class ArgTopK;
 class Transpose;
 class RMSNorm;
+class ResidualRMSNorm;
 class BeamTopK;
 class SpecIncMultiHeadSelfAttention;
 class Sampling;
@@ -545,6 +551,11 @@ class FFModel {
                                     bool use_bias = true,
                                     DataType data_type = DT_NONE,
                                     char const *name = NULL);
+  // Add a sigmoid_silu_multi layer
+  Tensor sigmoid_silu_multi(const Tensor input1,
+                            const Tensor input2,
+                            DataType data_type = DT_NONE,
+                            char const *name = NULL);
   // Add a batch_norm layer
   Tensor
       batch_norm(const Tensor input, bool relu = true, char const *name = NULL);
@@ -560,6 +571,14 @@ class FFModel {
                   int dim,
                   DataType data_type = DT_NONE,
                   char const *name = NULL);
+  // Add a residual root mean square layer
+  void residual_rms_norm(const Tensor input1,
+                         const Tensor input2,
+                         Tensor *outputs,
+                         float eps,
+                         int dim,
+                         DataType data_type = DT_NONE,
+                         char const *name = NULL);
   // Add a beam search top k layer
   Tensor beam_top_k(const Tensor input,
                     int max_beam_size,
@@ -1132,6 +1151,10 @@ class FFModel {
           std::pair<std::pair<ParallelTensorShape, ParallelTensorShape>,
                     AddBiasResidualLayerNormParams>,
           AddBiasResidualLayerNorm *>,
+      std::unordered_map<
+          std::pair<std::pair<ParallelTensorShape, ParallelTensorShape>,
+                    SigmoidSiluMultiParams>,
+          SigmoidSiluMulti *>,
       std::unordered_map<std::pair<ParallelTensorShape, LinearParams>,
                          Linear *>,
       std::unordered_map<std::pair<ParallelTensorShape, Pool2DParams>,
@@ -1170,6 +1193,10 @@ class FFModel {
                          Transpose *>,
       std::unordered_map<std::pair<ParallelTensorShape, RMSNormParams>,
                          RMSNorm *>,
+      std::unordered_map<
+          std::pair<std::pair<ParallelTensorShape, ParallelTensorShape>,
+                    ResidualRMSNormParams>,
+          ResidualRMSNorm *>,
       std::unordered_map<std::pair<ParallelTensorShape, RepartitionParams>,
                          Repartition *>,
       std::unordered_map<std::pair<ParallelTensorShape, ReplicateParams>,
diff --git a/include/flexflow/operator_params.h b/include/flexflow/operator_params.h
index 514c70f2ec..31f18049ff 100644
--- a/include/flexflow/operator_params.h
+++ b/include/flexflow/operator_params.h
@@ -26,8 +26,10 @@
 #include "flexflow/ops/pool_2d_params.h"
 #include "flexflow/ops/reduce_params.h"
 #include "flexflow/ops/reshape_params.h"
+#include "flexflow/ops/residual_rms_norm_params.h"
 #include "flexflow/ops/rms_norm_params.h"
 #include "flexflow/ops/sampling_params.h"
+#include "flexflow/ops/sigmoid_silu_multi_params.h"
 #include "flexflow/ops/softmax_params.h"
 #include "flexflow/ops/spec_inc_multihead_self_attention_params.h"
 #include "flexflow/ops/split_params.h"
@@ -61,6 +63,7 @@ using OperatorParameters = mp::variant<AggregateParams,
                                        Group_byParams,
                                        LayerNormParams,
                                        AddBiasResidualLayerNormParams,
+                                       SigmoidSiluMultiParams,
                                        LinearParams,
                                        MultiHeadAttentionParams,
                                        IncMultiHeadSelfAttentionParams,
@@ -68,6 +71,7 @@ using OperatorParameters = mp::variant<AggregateParams,
                                        SpecIncMultiHeadSelfAttentionParams,
                                        TreeIncMultiHeadSelfAttentionParams,
                                        RMSNormParams,
+                                       ResidualRMSNormParams,
                                        Pool2DParams,
                                        ReduceParams,
                                        ReshapeParams,
diff --git a/include/flexflow/ops/kernels/residual_rms_norm_kernels.h b/include/flexflow/ops/kernels/residual_rms_norm_kernels.h
new file mode 100644
index 0000000000..aa454711ec
--- /dev/null
+++ b/include/flexflow/ops/kernels/residual_rms_norm_kernels.h
@@ -0,0 +1,56 @@
+#ifndef _FLEXFLOW_OPS_KERNELS_RESIDUAL_RMSNORM_KERNELS_H
+#define _FLEXFLOW_OPS_KERNELS_RESIDUAL_RMSNORM_KERNELS_H
+
+#include "flexflow/accessor.h"
+#include "flexflow/device.h"
+#include "flexflow/fftype.h"
+#include "flexflow/op_meta.h"
+#include "flexflow/utils/memory_allocator.h"
+
+namespace FlexFlow {
+using Legion::coord_t;
+
+class ResidualRMSNorm;
+
+class ResidualRMSNormMeta : public OpMeta {
+public:
+  ResidualRMSNormMeta(FFHandler handler,
+                      ResidualRMSNorm const *rms,
+                      MemoryAllocator &gpu_mem_allocator);
+  ~ResidualRMSNormMeta(void);
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+  cudnnTensorDescriptor_t inputTensor, outputTensor;
+  cudnnReduceTensorDescriptor_t reduceDesc;
+#else
+  miopenTensorDescriptor_t inputTensor, outputTensor;
+  miopenReduceTensorDescriptor_t reduceDesc;
+#endif
+
+public:
+  float eps;
+  void *rms_ptr;
+  void *norm_ptr;
+
+  float alpha;
+  float beta;
+
+  int in_dim;
+  int batch_size;
+  int num_elements;
+  char op_name[MAX_OPNAME];
+  Realm::RegionInstance reserveInst;
+};
+
+namespace Kernels {
+namespace ResidualRMSNorm {
+void forward_kernel_wrapper(ResidualRMSNormMeta const *m,
+                            GenericTensorAccessorR const &input1,
+                            GenericTensorAccessorR const &input2,
+                            GenericTensorAccessorR const &weight,
+                            GenericTensorAccessorW const &residual_output,
+                            GenericTensorAccessorW const &output);
+} // namespace ResidualRMSNorm
+} // namespace Kernels
+} // namespace FlexFlow
+
+#endif // _FLEXFLOW_OPS_KERNELS_RMSNORM_KERNELS_H
diff --git a/include/flexflow/ops/residual_rms_norm.h b/include/flexflow/ops/residual_rms_norm.h
new file mode 100644
index 0000000000..783173c5eb
--- /dev/null
+++ b/include/flexflow/ops/residual_rms_norm.h
@@ -0,0 +1,88 @@
+#ifndef _FLEXFLOW_RESIDUAL_RMS_NORM_H
+#define _FLEXFLOW_RESIDUAL_RMS_NORM_H
+
+#include "flexflow/inference.h"
+#include "flexflow/model.h"
+#include "flexflow/ops/residual_rms_norm_params.h"
+#include "flexflow/utils/memory_allocator.h"
+
+namespace FlexFlow {
+
+class ResidualRMSNormMeta;
+
+class ResidualRMSNorm : public Op {
+public:
+  using Params = ResidualRMSNormParams;
+  using Input = std::pair<ParallelTensor, ParallelTensor>;
+  ResidualRMSNorm(FFModel &model,
+                  LayerID const &_layer_guid,
+                  const ParallelTensor _input1,
+                  const ParallelTensor _input2,
+                  float _eps,
+                  int dim,
+                  bool allocate_weights,
+                  char const *name);
+  ResidualRMSNorm(FFModel &model,
+                  ResidualRMSNormParams const &params,
+                  Input const &inputs,
+                  bool allocate_weights,
+                  char const *name = nullptr);
+
+  ResidualRMSNorm(FFModel &model,
+                  ResidualRMSNorm const &other,
+                  Input const &inputs,
+                  bool allocate_weights);
+  void init(FFModel const &) override;
+  void forward(FFModel const &) override;
+  void backward(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfigFuture const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
+  void print_layer(FFModel const &model) override {
+    assert(0);
+  }
+
+  static Op *
+      create_operator_from_layer(FFModel &model,
+                                 Layer const *layer,
+                                 std::vector<ParallelTensor> const &inputs);
+  void serialize(Legion::Serializer &) const override;
+  static PCG::Node deserialize(FFModel &ff,
+                               Legion::Deserializer &d,
+                               ParallelTensor inputs[],
+                               int num_inputs);
+  Op *materialize(FFModel &ff,
+                  ParallelTensor inputs[],
+                  int num_inputs) const override;
+  ResidualRMSNormParams get_params() const;
+
+  static OpMeta *init_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static void forward_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
+  bool measure_operator_cost(Simulator *sim,
+                             MachineView const &pc,
+                             CostMetrics &cost_metrics) const override;
+
+public:
+  float eps;
+  char op_name[MAX_OPNAME];
+  int effective_batch_size;
+  int dim, data_dim;
+};
+} // namespace FlexFlow
+#endif // _FLEXFLOW_RESIDUAL_RMS_NORM_H
diff --git a/include/flexflow/ops/residual_rms_norm_params.h b/include/flexflow/ops/residual_rms_norm_params.h
new file mode 100644
index 0000000000..64751a30b0
--- /dev/null
+++ b/include/flexflow/ops/residual_rms_norm_params.h
@@ -0,0 +1,29 @@
+#ifndef _FLEXFLOW_RESIDUAL_RMSNORM_PARAMS_H
+#define _FLEXFLOW_RESIDUAL_RMSNORM_PARAMS_H
+
+#include "flexflow/ffconst.h"
+#include "flexflow/fftype.h"
+#include "flexflow/parallel_tensor.h"
+
+namespace FlexFlow {
+
+struct ResidualRMSNormParams {
+  LayerID layer_guid;
+  float eps;
+  int dim;
+  bool is_valid(
+      std::pair<ParallelTensorShape, ParallelTensorShape> const &input) const;
+};
+
+bool operator==(ResidualRMSNormParams const &, ResidualRMSNormParams const &);
+
+} // namespace FlexFlow
+
+namespace std {
+template <>
+struct hash<FlexFlow::ResidualRMSNormParams> {
+  size_t operator()(FlexFlow::ResidualRMSNormParams const &) const;
+};
+} // namespace std
+
+#endif // _FLEXFLOW_RESIDUAL_RMSNORM_PARAMS_H
\ No newline at end of file
diff --git a/include/flexflow/ops/sigmoid_silu_multi.h b/include/flexflow/ops/sigmoid_silu_multi.h
new file mode 100644
index 0000000000..6a69288607
--- /dev/null
+++ b/include/flexflow/ops/sigmoid_silu_multi.h
@@ -0,0 +1,86 @@
+#pragma once
+
+#include "flexflow/inference.h"
+#include "flexflow/model.h"
+#include "flexflow/utils/memory_allocator.h"
+namespace FlexFlow {
+
+class SigmoidSiluMultiMeta;
+
+class SigmoidSiluMulti : public Op {
+public:
+  using Params = SigmoidSiluMultiParams;
+  using Input = std::pair<ParallelTensor, ParallelTensor>;
+  SigmoidSiluMulti(FFModel &model,
+                   Params const &params,
+                   Input const &inputs,
+                   char const *name = nullptr);
+  SigmoidSiluMulti(FFModel &model,
+                   LayerID const &_layer_guid,
+                   const ParallelTensor _input1,
+                   const ParallelTensor _input2,
+                   char const *name = nullptr);
+  void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
+  void forward(FFModel const &) override;
+  void backward(FFModel const &) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfigFuture const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
+  void print_layer(FFModel const &model) override {
+    assert(0);
+  }
+  static Op *
+      create_operator_from_layer(FFModel &model,
+                                 Layer const *layer,
+                                 std::vector<ParallelTensor> const &inputs);
+  void serialize(Legion::Serializer &) const override;
+  static PCG::Node deserialize(FFModel &ff,
+                               Legion::Deserializer &d,
+                               ParallelTensor inputs[],
+                               int num_inputs);
+
+  SigmoidSiluMultiParams get_params() const;
+
+  static OpMeta *init_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
+  bool measure_operator_cost(Simulator *sim,
+                             MachineView const &pc,
+                             CostMetrics &cost_metrics) const override;
+  template <typename T>
+  static void inference_kernel(SigmoidSiluMultiMeta const *m,
+                               int num_elements,
+                               T const *input1_ptr,
+                               T const *input2_ptr,
+                               T *output_ptr,
+                               ffStream_t stream);
+  static void inference_kernel_wrapper(SigmoidSiluMultiMeta const *m,
+                                       GenericTensorAccessorR const &input1,
+                                       GenericTensorAccessorR const &input2,
+                                       GenericTensorAccessorW const &output);
+};
+
+class SigmoidSiluMultiMeta : public OpMeta {
+public:
+  SigmoidSiluMultiMeta(FFHandler handle,
+                       SigmoidSiluMulti const *ln,
+                       MemoryAllocator &gpu_mem_allocator);
+  ~SigmoidSiluMultiMeta(void);
+
+public:
+  char op_name[MAX_OPNAME];
+  Realm::RegionInstance reserveInst;
+};
+
+}; // namespace FlexFlow
diff --git a/include/flexflow/ops/sigmoid_silu_multi_params.h b/include/flexflow/ops/sigmoid_silu_multi_params.h
new file mode 100644
index 0000000000..c8182505b3
--- /dev/null
+++ b/include/flexflow/ops/sigmoid_silu_multi_params.h
@@ -0,0 +1,24 @@
+#pragma once
+
+#include "flexflow/ffconst.h"
+#include "flexflow/fftype.h"
+#include "flexflow/parallel_tensor.h"
+
+namespace FlexFlow {
+
+struct SigmoidSiluMultiParams {
+  LayerID layer_guid;
+  bool is_valid(
+      std::pair<ParallelTensorShape, ParallelTensorShape> const &) const;
+};
+
+bool operator==(SigmoidSiluMultiParams const &, SigmoidSiluMultiParams const &);
+
+} // namespace FlexFlow
+
+namespace std {
+template <>
+struct hash<FlexFlow::SigmoidSiluMultiParams> {
+  size_t operator()(FlexFlow::SigmoidSiluMultiParams const &) const;
+};
+} // namespace std
diff --git a/include/flexflow/substitution_loader.h b/include/flexflow/substitution_loader.h
index 6dbb12e28b..ff2fd10446 100644
--- a/include/flexflow/substitution_loader.h
+++ b/include/flexflow/substitution_loader.h
@@ -126,7 +126,9 @@ NLOHMANN_JSON_SERIALIZE_ENUM(
      {OP_MEAN, "OP_MEAN"},
      {OP_LAYERNORM, "OP_LAYERNORM"},
      {OP_ADD_BIAS_RESIDUAL_LAYERNORM, "OP_ADD_BIAS_RESIDUAL_LAYERNORM"},
+     {OP_SIGMOID_SILU_MULTI, "OP_SIGMOID_SILU_MULTI"},
      {OP_RMS_NORM, "OP_RMS_NORM"},
+     {OP_RESIDUAL_RMS_NORM, "OP_RESIDUAL_RMS_NORM"},
      {OP_REPARTITION, "OP_PARTITION"},
      {OP_COMBINE, "OP_COMBINE"},
      {OP_REPLICATE, "OP_REPLICATE"},
diff --git a/inference/file_loader.cc b/inference/file_loader.cc
index 5b92f31552..dc724319d2 100644
--- a/inference/file_loader.cc
+++ b/inference/file_loader.cc
@@ -756,7 +756,7 @@ void FileDataLoader::load_single_weight_tensor(FFModel *ff,
 
 void FileDataLoader::load_weights(FFModel *ff, bool use_full_precision) {
   for (Layer *l : ff->layers) {
-    if (l->numWeights < 1 || !l->name || strlen(l->name) < 1) {
+    if (l->numWeights < 1 || l->name == NULL || strlen(l->name) < 1) {
       continue;
     }
     for (int i = 0; i < l->numWeights; i++) {
diff --git a/inference/models/falcon.cc b/inference/models/falcon.cc
index 72cbd8d551..e89e22450c 100644
--- a/inference/models/falcon.cc
+++ b/inference/models/falcon.cc
@@ -45,44 +45,34 @@ void FALCON::create_falcon_model(FFModel &ff,
     input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
 
-  Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
-
-  Tensor token;
   std::vector<int> axes = {0};
 
-  if (use_full_precision) {
-    token = ff.embedding(input,
-                         falcon_config.vocab_size,
-                         falcon_config.hidden_size,
-                         AGGR_MODE_NONE,
-                         DT_FLOAT,
-                         NULL,
-                         embed_init);
-  } else {
-    token = ff.embedding(input,
-                         falcon_config.vocab_size,
-                         falcon_config.hidden_size,
-                         AGGR_MODE_NONE,
-                         DT_HALF,
-                         NULL,
-                         embed_init);
-  }
-
-  Layer *embedding = ff.layers.back();
-  weights_layers.emplace("word_embeddings_weight", embedding);
+  Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
+  Tensor token = ff.embedding(input,
+                              falcon_config.vocab_size,
+                              falcon_config.hidden_size,
+                              AGGR_MODE_NONE,
+                              use_full_precision ? DT_FLOAT : DT_HALF,
+                              NULL,
+                              embed_init,
+                              "word_embeddings");
 
   for (int i = 0; i < falcon_config.n_layer; i++) {
     // set transformer layer id
     ff.set_transformer_layer_id(i);
+
     // step 1: attention
-    Tensor att_norm =
-        ff.layer_norm(token, axes, true, falcon_config.layer_norm_epsilon);
-    Layer *attention_norm = ff.layers.back();
+    std::string layer_name = "layers_" + std::to_string(i) + "_input_layernorm";
+    Tensor att_norm = ff.layer_norm(token,
+                                    axes,
+                                    true,
+                                    falcon_config.layer_norm_epsilon,
+                                    true,
+                                    DT_NONE,
+                                    layer_name.c_str());
 
-    weights_layers.emplace("layers_" + std::to_string(i) +
-                               "_input_layernorm_weight",
-                           attention_norm);
     Tensor mha;
+    layer_name = "layers_" + std::to_string(i) + "_attention";
     switch (mode) {
       case BEAM_SEARCH_MODE: {
         mha = ff.spec_inc_multiquery_self_attention(
@@ -92,13 +82,18 @@ void FALCON::create_falcon_model(FFModel &ff,
             falcon_config.n_head_kv,
             falcon_config.hidden_size / falcon_config.n_head,
             falcon_config.hidden_size / falcon_config.n_head,
-            0.0f,    /*dropout*/
-            false,   /*qkv_bias*/
-            false,   /*final_bias*/
-            false,   /*add_zero_attn*/
-            DT_NONE, /*data_type*/
-            NULL,    /*kernel_initializer*/
-            true     /*apply_rotary_embedding*/
+            0.0f,              /*dropout*/
+            false,             /*qkv_bias*/
+            false,             /*final_bias*/
+            false,             /*add_zero_attn*/
+            DT_NONE,           /*data_type*/
+            NULL,              /*kernel_initializer*/
+            true,              /*apply_rotary_embedding*/
+            false,             /*scaling query*/
+            1.0f,              /*scaling factor*/
+            true,              /*qk_prod_scaling*/
+            false,             /*position_bias*/
+            layer_name.c_str() /*name*/
         );
         break;
       }
@@ -111,13 +106,18 @@ void FALCON::create_falcon_model(FFModel &ff,
             falcon_config.n_head_kv,
             falcon_config.hidden_size / falcon_config.n_head,
             falcon_config.hidden_size / falcon_config.n_head,
-            0.0f,    /*dropout*/
-            false,   /*qkv_bias*/
-            false,   /*final_bias*/
-            false,   /*add_zero_attn*/
-            DT_NONE, /*data_type*/
-            nullptr, /*kernel_initializer*/
-            true     /*apply_rotary_embedding*/
+            0.0f,              /*dropout*/
+            false,             /*qkv_bias*/
+            false,             /*final_bias*/
+            false,             /*add_zero_attn*/
+            DT_NONE,           /*data_type*/
+            nullptr,           /*kernel_initializer*/
+            true,              /*apply_rotary_embedding*/
+            false,             /*scaling query*/
+            1.0f,              /*scaling factor*/
+            true,              /*qk_prod_scaling*/
+            false,             /*position_bias*/
+            layer_name.c_str() /*name*/
         );
         break;
       }
@@ -130,13 +130,18 @@ void FALCON::create_falcon_model(FFModel &ff,
             falcon_config.n_head_kv,
             falcon_config.hidden_size / falcon_config.n_head,
             falcon_config.hidden_size / falcon_config.n_head,
-            0.0f,    /*dropout*/
-            false,   /*qkv_bias*/
-            false,   /*final_bias*/
-            false,   /*add_zero_attn*/
-            DT_NONE, /*data_type*/
-            nullptr, /*kernel_initializer*/
-            true     /*apply_rotary_embedding*/
+            0.0f,              /*dropout*/
+            false,             /*qkv_bias*/
+            false,             /*final_bias*/
+            false,             /*add_zero_attn*/
+            DT_NONE,           /*data_type*/
+            nullptr,           /*kernel_initializer*/
+            true,              /*apply_rotary_embedding*/
+            false,             /*scaling query*/
+            1.0f,              /*scaling factor*/
+            true,              /*qk_prod_scaling*/
+            false,             /*position_bias*/
+            layer_name.c_str() /*name*/
         );
         break;
       }
@@ -144,42 +149,58 @@ void FALCON::create_falcon_model(FFModel &ff,
         assert(false);
       }
     }
-    Layer *attention_layer = ff.layers.back();
-
-    // multi query
-    //  weights_layers.emplace("layers_" + std::to_string(i) +
-    //                             "_self_attention_dense_weight",
-    //                         attention_layer);
-
-    weights_layers.emplace("layers_" + std::to_string(i) + "_attention_weight",
-                           attention_layer);
-    Tensor dense_h_to_4h =
-        ff.dense(att_norm, falcon_config.hidden_size * 4, AC_MODE_NONE, false);
-    Layer *dense_h_to_4h_layer = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) +
-                               "_mlp_dense_h_to_4h_weight",
-                           dense_h_to_4h_layer);
+
+    layer_name = "layers_" + std::to_string(i) + "_mlp_dense_h_to_4h";
+    Tensor dense_h_to_4h = ff.dense(att_norm,
+                                    falcon_config.hidden_size * 4,
+                                    AC_MODE_NONE,
+                                    false,
+                                    DT_NONE,
+                                    nullptr,
+                                    nullptr,
+                                    nullptr,
+                                    REG_MODE_NONE,
+                                    0.0f,
+                                    layer_name.c_str());
+
     dense_h_to_4h = ff.gelu(dense_h_to_4h);
-    Tensor mlp_output =
-        ff.dense(dense_h_to_4h, falcon_config.hidden_size, AC_MODE_NONE, false);
-    Layer *dense_4h_to_h_layer = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) +
-                               "_mlp_dense_4h_to_h_weight",
-                           dense_4h_to_h_layer);
+
+    layer_name = "layers_" + std::to_string(i) + "_mlp_dense_4h_to_h";
+    Tensor mlp_output = ff.dense(dense_h_to_4h,
+                                 falcon_config.hidden_size,
+                                 AC_MODE_NONE,
+                                 false,
+                                 DT_NONE,
+                                 nullptr,
+                                 nullptr,
+                                 nullptr,
+                                 REG_MODE_NONE,
+                                 0.0f,
+                                 layer_name.c_str());
 
     token = ff.add(token, mha);
     token = ff.add(token, mlp_output);
   }
   // final normalization and linear
-  Tensor ln_f =
-      ff.layer_norm(token, axes, true, falcon_config.layer_norm_epsilon);
-  Layer *ln_f_layer = ff.layers.back();
-  weights_layers.emplace("ln_f_weight", ln_f_layer);
-
-  Tensor lm_head =
-      ff.dense(ln_f, falcon_config.vocab_size, AC_MODE_NONE, false);
-  Layer *lm_head_layer = ff.layers.back();
-  weights_layers.emplace("lm_head_weight", lm_head_layer);
+  Tensor ln_f = ff.layer_norm(token,
+                              axes,
+                              true,
+                              falcon_config.layer_norm_epsilon,
+                              true,
+                              DT_NONE,
+                              "ln_f");
+
+  Tensor lm_head = ff.dense(ln_f,
+                            falcon_config.vocab_size,
+                            AC_MODE_NONE,
+                            false,
+                            DT_NONE,
+                            nullptr,
+                            nullptr,
+                            nullptr,
+                            REG_MODE_NONE,
+                            0.0f,
+                            "lm_head");
 
   Tensor output;
   if (mode == BEAM_SEARCH_MODE) {
@@ -200,7 +221,7 @@ void FALCON::create_falcon_model(FFModel &ff,
                             falcon_config.hidden_size,
                             falcon_config.hidden_size / falcon_config.n_head,
                             ff.config.tensor_parallelism_degree);
-  std::cout << "------laod weights ----------" << std::endl;
+  std::cout << "------load weights ----------" << std::endl;
   fileloader.load_weights(&ff, use_full_precision);
   std::cout << "------load weight finished----------" << std::endl;
 
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index 463c96527b..c71755a3d3 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -48,41 +48,29 @@ void LLAMA::create_llama_model(FFModel &ff,
 
   Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
 
-  Tensor token;
-
-  if (use_full_precision) {
-    token = ff.embedding(input,
-                         llama_config.vocab_size,
-                         llama_config.hidden_size,
-                         AGGR_MODE_NONE,
-                         DT_FLOAT,
-                         NULL,
-                         embed_init);
-  } else {
-    token = ff.embedding(input,
-                         llama_config.vocab_size,
-                         llama_config.hidden_size,
-                         AGGR_MODE_NONE,
-                         DT_HALF,
-                         NULL,
-                         embed_init);
-  }
-
-  Layer *embedding = ff.layers.back();
-  weights_layers.emplace("tok_embeddings_weight", embedding);
+  Tensor token = ff.embedding(input,
+                              llama_config.vocab_size,
+                              llama_config.hidden_size,
+                              AGGR_MODE_NONE,
+                              use_full_precision ? DT_FLOAT : DT_HALF,
+                              NULL,
+                              embed_init,
+                              "tok_embeddings");
 
   for (int i = 0; i < llama_config.num_hidden_layers; i++) {
     // set transformer layer id
     ff.set_transformer_layer_id(i);
+
     // step 1: attention
-    Tensor att_norm =
-        ff.rms_norm(token, llama_config.rms_norm_eps, llama_config.hidden_size);
-    Layer *attention_norm = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) +
-                               "_attention_norm_weight",
-                           attention_norm);
+    std::string layer_name = "layers_" + std::to_string(i) + "_attention_norm";
+    Tensor att_norm = ff.rms_norm(token,
+                                  llama_config.rms_norm_eps,
+                                  llama_config.hidden_size,
+                                  DT_NONE,
+                                  layer_name.c_str());
 
     Tensor mha;
+    layer_name = "layers_" + std::to_string(i) + "_attention";
     switch (mode) {
       case BEAM_SEARCH_MODE: {
         mha = ff.spec_inc_multihead_self_attention(
@@ -91,13 +79,18 @@ void LLAMA::create_llama_model(FFModel &ff,
             llama_config.num_attention_heads,
             llama_config.hidden_size / llama_config.num_attention_heads,
             llama_config.hidden_size / llama_config.num_attention_heads,
-            0.0f,    /*dropout*/
-            false,   /*qkv_bias*/
-            false,   /*final_bias*/
-            false,   /*add_zero_attn*/
-            DT_NONE, /*data_type*/
-            NULL,    /*kernel_initializer*/
-            true     /*apply_rotary_embedding*/
+            0.0f,              /*dropout*/
+            false,             /*qkv_bias*/
+            false,             /*final_bias*/
+            false,             /*add_zero_attn*/
+            DT_NONE,           /*data_type*/
+            NULL,              /*kernel_initializer*/
+            true,              /*apply_rotary_embedding*/
+            false,             /*scaling query*/
+            1.0f,              /*scaling factor*/
+            true,              /*qk_prod_scaling*/
+            false,             /*position_bias*/
+            layer_name.c_str() /*name*/
         );
         break;
       }
@@ -108,13 +101,18 @@ void LLAMA::create_llama_model(FFModel &ff,
             llama_config.num_attention_heads,
             llama_config.hidden_size / llama_config.num_attention_heads,
             llama_config.hidden_size / llama_config.num_attention_heads,
-            0.0f,    /*dropout*/
-            false,   /*qkv_bias*/
-            false,   /*final_bias*/
-            false,   /*add_zero_attn*/
-            DT_NONE, /*data_type*/
-            nullptr, /*kernel_initializer*/
-            true     /*apply_rotary_embedding*/
+            0.0f,              /*dropout*/
+            false,             /*qkv_bias*/
+            false,             /*final_bias*/
+            false,             /*add_zero_attn*/
+            DT_NONE,           /*data_type*/
+            nullptr,           /*kernel_initializer*/
+            true,              /*apply_rotary_embedding*/
+            false,             /*scaling query*/
+            1.0f,              /*scaling factor*/
+            true,              /*qk_prod_scaling*/
+            false,             /*position_bias*/
+            layer_name.c_str() /*name*/
         );
         break;
       }
@@ -125,13 +123,18 @@ void LLAMA::create_llama_model(FFModel &ff,
             llama_config.num_attention_heads,
             llama_config.hidden_size / llama_config.num_attention_heads,
             llama_config.hidden_size / llama_config.num_attention_heads,
-            0.0f,    /*dropout*/
-            false,   /*qkv_bias*/
-            false,   /*final_bias*/
-            false,   /*add_zero_attn*/
-            DT_NONE, /*data_type*/
-            nullptr, /*kernel_initializer*/
-            true     /*apply_rotary_embedding*/
+            0.0f,              /*dropout*/
+            false,             /*qkv_bias*/
+            false,             /*final_bias*/
+            false,             /*add_zero_attn*/
+            DT_NONE,           /*data_type*/
+            nullptr,           /*kernel_initializer*/
+            true,              /*apply_rotary_embedding*/
+            false,             /*scaling query*/
+            1.0f,              /*scaling factor*/
+            true,              /*qk_prod_scaling*/
+            false,             /*position_bias*/
+            layer_name.c_str() /*name*/
         );
         break;
       }
@@ -139,50 +142,82 @@ void LLAMA::create_llama_model(FFModel &ff,
         assert(false);
       }
     }
-    Layer *attention_layer = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) + "_attention_weight",
-                           attention_layer);
-    token = ff.add(token, mha);
 
     // step 2: SILU activaion
-    Tensor ff_norm =
-        ff.rms_norm(token, llama_config.rms_norm_eps, llama_config.hidden_size);
-    Layer *ffn_layer = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) + "_ffn_norm_weight",
-                           ffn_layer);
-
-    Tensor w1 =
-        ff.dense(ff_norm, llama_config.intermediate_size, AC_MODE_NONE, false);
-    Layer *w1_layer = ff.layers.back();
-    weights_layers.emplace(
-        "layers_" + std::to_string(i) + "_feed_forward_w1_weight", w1_layer);
-
-    Tensor w3 =
-        ff.dense(ff_norm, llama_config.intermediate_size, AC_MODE_NONE, false);
-    Layer *w3_layer = ff.layers.back();
-    weights_layers.emplace(
-        "layers_" + std::to_string(i) + "_feed_forward_w3_weight", w3_layer);
-
-    Tensor sigmoid = ff.sigmoid(w1);
-    Tensor silu = ff.multiply(w1, sigmoid);
-    Tensor multi = ff.multiply(silu, w3);
-
-    Tensor w2 = ff.dense(multi, llama_config.hidden_size, AC_MODE_NONE, false);
-    Layer *w2_layer = ff.layers.back();
-    weights_layers.emplace(
-        "layers_" + std::to_string(i) + "_feed_forward_w2_weight", w2_layer);
+    layer_name = "layers_" + std::to_string(i) + "_ffn_norm";
+    Tensor token_ff_norm[2];
+    ff.residual_rms_norm(token,
+                         mha,
+                         token_ff_norm,
+                         llama_config.rms_norm_eps,
+                         llama_config.hidden_size,
+                         DT_NONE,
+                         layer_name.c_str());
+
+    token = token_ff_norm[0];
+    Tensor ff_norm = token_ff_norm[1];
+
+    layer_name = "layers_" + std::to_string(i) + "_feed_forward_w1";
+    Tensor w1 = ff.dense(ff_norm,
+                         llama_config.intermediate_size,
+                         AC_MODE_NONE,
+                         false,
+                         DT_NONE,
+                         nullptr,
+                         nullptr,
+                         nullptr,
+                         REG_MODE_NONE,
+                         0.0f,
+                         layer_name.c_str());
+
+    layer_name = "layers_" + std::to_string(i) + "_feed_forward_w3";
+    Tensor w3 = ff.dense(ff_norm,
+                         llama_config.intermediate_size,
+                         AC_MODE_NONE,
+                         false,
+                         DT_NONE,
+                         nullptr,
+                         nullptr,
+                         nullptr,
+                         REG_MODE_NONE,
+                         0.0f,
+                         layer_name.c_str());
+
+    Tensor multi = ff.sigmoid_silu_multi(w1, w3);
+
+    layer_name = "layers_" + std::to_string(i) + "_feed_forward_w2";
+    Tensor w2 = ff.dense(multi,
+                         llama_config.hidden_size,
+                         AC_MODE_NONE,
+                         false,
+                         DT_NONE,
+                         nullptr,
+                         nullptr,
+                         nullptr,
+                         REG_MODE_NONE,
+                         0.0f,
+                         layer_name.c_str());
     token = ff.add(token, w2);
   }
   // final normalization and linear
   std::vector<int> axes = {2};
-  token =
-      ff.rms_norm(token, llama_config.rms_norm_eps, llama_config.hidden_size);
-  Layer *final_norm = ff.layers.back();
-  weights_layers.emplace("norm_weight", final_norm);
-
-  Tensor dense = ff.dense(token, llama_config.vocab_size, AC_MODE_NONE, false);
-  Layer *final_linear = ff.layers.back();
-  weights_layers.emplace("output_weight", final_linear);
+  token = ff.rms_norm(token,
+                      llama_config.rms_norm_eps,
+                      llama_config.hidden_size,
+                      DT_NONE,
+                      "norm");
+
+  Tensor dense = ff.dense(token,
+                          llama_config.vocab_size,
+                          AC_MODE_NONE,
+                          false,
+                          DT_NONE,
+                          nullptr,
+                          nullptr,
+                          nullptr,
+                          REG_MODE_NONE,
+                          0.0f,
+                          "output");
 
   Tensor output;
   if (mode == BEAM_SEARCH_MODE) {
diff --git a/inference/models/mpt.cc b/inference/models/mpt.cc
index 1ef15654b3..933d1a0b18 100644
--- a/inference/models/mpt.cc
+++ b/inference/models/mpt.cc
@@ -47,40 +47,26 @@ void MPT::create_mpt_model(FFModel &ff,
   Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
   std::vector<int> axes = {0};
 
-  Tensor hidden_states;
-  if (use_full_precision) {
-    hidden_states = ff.embedding(input,
-                                 mpt_config.vocab_size,
-                                 mpt_config.hidden_size,
-                                 AGGR_MODE_NONE,
-                                 DT_FLOAT,
-                                 NULL,
-                                 embed_init);
-  } else {
-    hidden_states = ff.embedding(input,
-                                 mpt_config.vocab_size,
-                                 mpt_config.hidden_size,
-                                 AGGR_MODE_NONE,
-                                 DT_HALF,
-                                 NULL,
-                                 embed_init);
-  }
-
-  Layer *embedding = ff.layers.back();
-  weights_layers.emplace("transformer_wte_weight", embedding);
+  Tensor hidden_states = ff.embedding(input,
+                                      mpt_config.vocab_size,
+                                      mpt_config.hidden_size,
+                                      AGGR_MODE_NONE,
+                                      use_full_precision ? DT_FLOAT : DT_HALF,
+                                      NULL,
+                                      embed_init,
+                                      "transformer_wte");
 
   for (int i = 0; i < mpt_config.n_layers; i++) {
     ff.set_transformer_layer_id(i);
 
     Tensor residual = hidden_states;
 
-    Tensor layernorm_output =
-        ff.layer_norm(hidden_states, axes, true, 1e-05, false);
-    Layer *norm_1 = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) + "_norm_1_weight",
-                           norm_1);
+    std::string layer_name = "layers_" + std::to_string(i) + "_norm_1";
+    Tensor layernorm_output = ff.layer_norm(
+        hidden_states, axes, true, 1e-05, false, DT_NONE, layer_name.c_str());
 
     Tensor attn_outputs;
+    layer_name = "layers_" + std::to_string(i) + "_attention";
     switch (mode) {
       case BEAM_SEARCH_MODE: {
         attn_outputs = ff.spec_inc_multihead_self_attention(
@@ -100,7 +86,9 @@ void MPT::create_mpt_model(FFModel &ff,
             /*scaling factor*/
             pow((mpt_config.hidden_size / mpt_config.n_heads), -0.5),
             /*qk_prod_scaling*/ false,
-            /*position_bias*/ true);
+            /*position_bias*/ true,
+            layer_name.c_str() /*name*/
+        );
         break;
       }
       case TREE_VERIFY_MODE: {
@@ -121,7 +109,9 @@ void MPT::create_mpt_model(FFModel &ff,
             /*scaling factor*/
             pow((mpt_config.hidden_size / mpt_config.n_heads), -0.5),
             /*qk_prod_scaling*/ false,
-            /*position_bias*/ true);
+            /*position_bias*/ true,
+            layer_name.c_str() /*name*/
+        );
         break;
       }
       case INC_DECODING_MODE: {
@@ -142,7 +132,9 @@ void MPT::create_mpt_model(FFModel &ff,
             /*scaling factor*/
             pow((mpt_config.hidden_size / mpt_config.n_heads), -0.5),
             /*qk_prod_scaling*/ false,
-            /*position_bias*/ true);
+            /*position_bias*/ true,
+            layer_name.c_str() /*name*/
+        );
         break;
       }
       default: {
@@ -150,45 +142,61 @@ void MPT::create_mpt_model(FFModel &ff,
       }
     }
 
-    Layer *attention_layer = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) + "_attention_weight",
-                           attention_layer);
-
     hidden_states = ff.add(attn_outputs, residual);
-    layernorm_output = ff.layer_norm(hidden_states, axes, true, 1e-05, false);
-    Layer *norm_2 = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) + "_norm_2_weight",
-                           norm_2);
+
+    layer_name = "layers_" + std::to_string(i) + "_norm_2";
+    layernorm_output = ff.layer_norm(
+        hidden_states, axes, true, 1e-05, false, DT_NONE, layer_name.c_str());
 
     residual = hidden_states;
 
     // MLP
-    //  output = self.ffn(layernorm_output, residual)
-    layernorm_output = ff.dense(
-        layernorm_output, 4 * mpt_config.hidden_size, AC_MODE_NONE, false);
-    Layer *up_proj = ff.layers.back();
-    weights_layers.emplace(
-        "layers_" + std::to_string(i) + "_ffn_up_proj_weight", up_proj);
+    layer_name = "layers_" + std::to_string(i) + "_ffn_up_proj";
+    layernorm_output = ff.dense(layernorm_output,
+                                4 * mpt_config.hidden_size,
+                                AC_MODE_NONE,
+                                false,
+                                DT_NONE,
+                                nullptr,
+                                nullptr,
+                                nullptr,
+                                REG_MODE_NONE,
+                                0.0f,
+                                layer_name.c_str());
+
     layernorm_output = ff.gelu(layernorm_output);
-    Tensor intermediate_output =
-        ff.dense(layernorm_output, mpt_config.hidden_size, AC_MODE_NONE, false);
-    Layer *down_proj = ff.layers.back();
-    weights_layers.emplace(
-        "layers_" + std::to_string(i) + "_ffn_down_proj_weight", down_proj);
+
+    layer_name = "layers_" + std::to_string(i) + "_ffn_down_proj";
+    Tensor intermediate_output = ff.dense(layernorm_output,
+                                          mpt_config.hidden_size,
+                                          AC_MODE_NONE,
+                                          false,
+                                          DT_NONE,
+                                          nullptr,
+                                          nullptr,
+                                          nullptr,
+                                          REG_MODE_NONE,
+                                          0.0f,
+                                          layer_name.c_str());
 
     hidden_states = ff.add(intermediate_output, residual);
   }
 
   // final
-  Tensor all_final_norm =
-      ff.layer_norm(hidden_states, axes, true, 1e-05, false);
-  Layer *norm_f = ff.layers.back();
-  weights_layers.emplace("transformer_norm_f_weight", norm_f);
-
-  Tensor lm_head =
-      ff.dense(all_final_norm, mpt_config.vocab_size, AC_MODE_NONE, false);
-  Layer *lm_head_layer = ff.layers.back();
-  weights_layers.emplace("lm_head_weight", lm_head_layer);
+  Tensor all_final_norm = ff.layer_norm(
+      hidden_states, axes, true, 1e-05, false, DT_NONE, "transformer_norm_f");
+
+  Tensor lm_head = ff.dense(all_final_norm,
+                            mpt_config.vocab_size,
+                            AC_MODE_NONE,
+                            false,
+                            DT_NONE,
+                            nullptr,
+                            nullptr,
+                            nullptr,
+                            REG_MODE_NONE,
+                            0.0f,
+                            "lm_head");
 
   Tensor output;
   if (mode == BEAM_SEARCH_MODE) {
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index 5afef5e3a6..5f2494d0b2 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -50,47 +50,24 @@ void OPT::create_opt_model(FFModel &ff,
   Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
   std::vector<int> axes = {0};
 
-  Tensor token;
-  if (use_full_precision) {
-    token = ff.embedding(input,
-                         opt_config.vocab_size,
-                         opt_config.word_embed_proj_dim,
-                         AGGR_MODE_NONE,
-                         DT_FLOAT,
-                         NULL,
-                         embed_init,
-                         "embed_tokens");
-  } else {
-    token = ff.embedding(input,
-                         opt_config.vocab_size,
-                         opt_config.word_embed_proj_dim,
-                         AGGR_MODE_NONE,
-                         DT_HALF,
-                         NULL,
-                         embed_init,
-                         "embed_tokens");
-  }
+  Tensor token = ff.embedding(input,
+                              opt_config.vocab_size,
+                              opt_config.word_embed_proj_dim,
+                              AGGR_MODE_NONE,
+                              use_full_precision ? DT_FLOAT : DT_HALF,
+                              NULL,
+                              embed_init,
+                              "embed_tokens");
 
-  Tensor positional_embedding;
-  if (use_full_precision) {
-    positional_embedding = ff.embedding(position_input,
-                                        opt_config.max_position_embeddings,
-                                        opt_config.hidden_size,
-                                        AGGR_MODE_NONE,
-                                        DT_FLOAT,
-                                        NULL,
-                                        embed_init,
-                                        "embed_positions");
-  } else {
-    positional_embedding = ff.embedding(position_input,
-                                        opt_config.max_position_embeddings,
-                                        opt_config.hidden_size,
-                                        AGGR_MODE_NONE,
-                                        DT_HALF,
-                                        NULL,
-                                        embed_init,
-                                        "embed_positions");
-  }
+  Tensor positional_embedding =
+      ff.embedding(position_input,
+                   opt_config.max_position_embeddings,
+                   opt_config.hidden_size,
+                   AGGR_MODE_NONE,
+                   use_full_precision ? DT_FLOAT : DT_HALF,
+                   NULL,
+                   embed_init,
+                   "embed_positions");
 
   Tensor residual = ff.add(token, positional_embedding);
 
diff --git a/inference/models/starcoder.cc b/inference/models/starcoder.cc
index 982d58654b..f9659c7279 100644
--- a/inference/models/starcoder.cc
+++ b/inference/models/starcoder.cc
@@ -55,65 +55,43 @@ void STARCODER::create_starcoder_model(
 
   Initializer *embed_init = new UniformInitializer(std::rand(), 0, 0);
 
-  Tensor token;
-
-  if (use_full_precision) {
-    token = ff.embedding(input,
-                         startcoder_config.vocab_size,
-                         startcoder_config.hidden_size,
-                         AGGR_MODE_NONE,
-                         DT_FLOAT,
-                         NULL,
-                         embed_init);
-  } else {
-    token = ff.embedding(input,
-                         startcoder_config.vocab_size,
-                         startcoder_config.hidden_size,
-                         AGGR_MODE_NONE,
-                         DT_HALF,
-                         NULL,
-                         embed_init);
-  }
-
-  Layer *embedding = ff.layers.back();
-  weights_layers.emplace("transformer_wte_weight", embedding);
-
-  Tensor positional_embedding;
-  if (use_full_precision) {
-    positional_embedding =
-        ff.embedding(position_input,
-                     startcoder_config.max_position_embeddings,
-                     startcoder_config.hidden_size,
-                     AGGR_MODE_NONE,
-                     DT_FLOAT,
-                     NULL,
-                     embed_init);
-  } else {
-    positional_embedding =
-        ff.embedding(position_input,
-                     startcoder_config.max_position_embeddings,
-                     startcoder_config.hidden_size,
-                     AGGR_MODE_NONE,
-                     DT_HALF,
-                     NULL,
-                     embed_init);
-  }
-  Layer *pos_embedding = ff.layers.back();
-  weights_layers.emplace("transformer_wpe_weight", pos_embedding);
+  Tensor token = ff.embedding(input,
+                              startcoder_config.vocab_size,
+                              startcoder_config.hidden_size,
+                              AGGR_MODE_NONE,
+                              use_full_precision ? DT_FLOAT : DT_HALF,
+                              NULL,
+                              embed_init,
+                              "transformer_wte");
+
+  Tensor positional_embedding =
+      ff.embedding(position_input,
+                   startcoder_config.max_position_embeddings,
+                   startcoder_config.hidden_size,
+                   AGGR_MODE_NONE,
+                   use_full_precision ? DT_FLOAT : DT_HALF,
+                   NULL,
+                   embed_init,
+                   "transformer_wpe");
 
   Tensor hidden_states = ff.add(token, positional_embedding);
 
   for (int i = 0; i < startcoder_config.num_hidden_layers; i++) {
     // set transformer layer id
     ff.set_transformer_layer_id(i);
+
     // step 1: attention
-    Tensor ln_1 = ff.layer_norm(
-        hidden_states, axes, true, startcoder_config.layer_norm_epsilon);
-    Layer *layer_norm = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) + "_ln_1_weight",
-                           layer_norm);
+    std::string layer_name = "layers_" + std::to_string(i) + "_ln_1";
+    Tensor ln_1 = ff.layer_norm(hidden_states,
+                                axes,
+                                true,
+                                startcoder_config.layer_norm_epsilon,
+                                true,
+                                DT_NONE,
+                                layer_name.c_str());
 
     Tensor mha;
+    layer_name = "layers_" + std::to_string(i) + "_attention";
     switch (mode) {
       case INC_DECODING_MODE: {
         mha = ff.inc_multiquery_self_attention(
@@ -131,7 +109,12 @@ void STARCODER::create_starcoder_model(
             false,                       /*add_zero_attn*/
             DT_NONE,                     /*data_type*/
             nullptr,                     /*kernel_initializer*/
-            false                        /*apply_rotary_embedding*/
+            false,                       /*apply_rotary_embedding*/
+            false,                       /*scaling query*/
+            1.0f,                        /*scaling factor*/
+            true,                        /*qk_prod_scaling*/
+            false,                       /*position_bias*/
+            layer_name.c_str()           /*name*/
         );
         break;
       }
@@ -139,43 +122,69 @@ void STARCODER::create_starcoder_model(
         assert(false);
       }
     }
-    Layer *attention_layer = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) + "_attention_weight",
-                           attention_layer);
+
     Tensor residual = ff.add(hidden_states, mha);
 
-    Tensor l2_norm = ff.layer_norm(
-        residual, axes, true, startcoder_config.layer_norm_epsilon);
-    Layer *l2_layer = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) + "_ln_2_weight",
-                           l2_layer);
+    layer_name = "layers_" + std::to_string(i) + "_ln_2";
+    Tensor l2_norm = ff.layer_norm(residual,
+                                   axes,
+                                   true,
+                                   startcoder_config.layer_norm_epsilon,
+                                   true,
+                                   DT_NONE,
+                                   layer_name.c_str());
 
     // mlp
-    Tensor c_fc = ff.dense(
-        l2_norm, startcoder_config.intermediate_size, AC_MODE_NONE, true);
-    Layer *c_fc_layer = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) + "_mlp_c_fc_weight",
-                           c_fc_layer);
+    layer_name = "layers_" + std::to_string(i) + "_mlp_c_fc";
+    Tensor c_fc = ff.dense(l2_norm,
+                           startcoder_config.intermediate_size,
+                           AC_MODE_NONE,
+                           true,
+                           DT_NONE,
+                           nullptr,
+                           nullptr,
+                           nullptr,
+                           REG_MODE_NONE,
+                           0.0f,
+                           layer_name.c_str());
+
     c_fc = ff.gelu(c_fc);
 
-    Tensor c_proj =
-        ff.dense(c_fc, startcoder_config.hidden_size, AC_MODE_NONE, true);
-    Layer *c_proj_layer = ff.layers.back();
-    weights_layers.emplace("layers_" + std::to_string(i) + "_mlp_c_proj_weight",
-                           c_proj_layer);
+    layer_name = "layers_" + std::to_string(i) + "_mlp_c_proj";
+    Tensor c_proj = ff.dense(c_fc,
+                             startcoder_config.hidden_size,
+                             AC_MODE_NONE,
+                             true,
+                             DT_NONE,
+                             nullptr,
+                             nullptr,
+                             nullptr,
+                             REG_MODE_NONE,
+                             0.0f,
+                             layer_name.c_str());
 
     hidden_states = ff.add(residual, c_proj);
   }
   // final normalization and linear
-  Tensor ln_f = ff.layer_norm(
-      hidden_states, axes, true, startcoder_config.layer_norm_epsilon);
-  Layer *final_norm = ff.layers.back();
-  weights_layers.emplace("transformer_ln_f_weight", final_norm);
-
-  Tensor lm_head =
-      ff.dense(ln_f, startcoder_config.vocab_size, AC_MODE_NONE, false);
-  Layer *final_linear = ff.layers.back();
-  weights_layers.emplace("lm_head_weight", final_linear);
+  Tensor ln_f = ff.layer_norm(hidden_states,
+                              axes,
+                              true,
+                              startcoder_config.layer_norm_epsilon,
+                              true,
+                              DT_NONE,
+                              "transformer_ln_f");
+
+  Tensor lm_head = ff.dense(ln_f,
+                            startcoder_config.vocab_size,
+                            AC_MODE_NONE,
+                            false,
+                            DT_NONE,
+                            nullptr,
+                            nullptr,
+                            nullptr,
+                            REG_MODE_NONE,
+                            0.0f,
+                            "lm_head");
 
   Tensor output;
   if (mode == BEAM_SEARCH_MODE) {
diff --git a/python/flexflow/core/flexflow_cffi.py b/python/flexflow/core/flexflow_cffi.py
index 08b87856de..b2231b58e6 100644
--- a/python/flexflow/core/flexflow_cffi.py
+++ b/python/flexflow/core/flexflow_cffi.py
@@ -294,6 +294,13 @@ def get_weight_tensor(self):
   def get_bias_tensor(self):
     return self.get_parameter_by_id(2)
 
+# -----------------------------------------------------------------------
+# SigmoidSiluMulti
+# -----------------------------------------------------------------------
+class SigmoidSiluMulti(Op):
+  def __init__(self, handle, idx=None, name=None):
+    super(SigmoidSiluMulti, self).__init__(handle, idx, name)
+
 # -----------------------------------------------------------------------
 # Dropout
 # -----------------------------------------------------------------------
@@ -476,6 +483,13 @@ class RMSNorm(Op):
   def __init__(self, handle, idx=None, name=None):
     super(RMSNorm, self).__init__(handle, idx, name)
 
+# -----------------------------------------------------------------------
+# Residual RMS Norm
+# -----------------------------------------------------------------------
+class ResidualRMSNorm(Op):
+  def __init__(self, handle, idx=None, name=None):
+    super(ResidualRMSNorm, self).__init__(handle, idx, name)
+
 # -----------------------------------------------------------------------
 # ArgTopK
 # -----------------------------------------------------------------------
@@ -572,6 +586,8 @@ def convert_op_handle_to_op(op_type, handle, idx=None, name=None):
     return LayerNorm(handle, idx, name)
   elif op_type == OpType.ADD_BIAS_RESIDUAL_LAYERNORM:
     return AddBiasResidualLayerNorm(handle, idx, name)
+  elif op_type == OpType.SIGMOID_SILU_MULTI:
+    return SigmoidSiluMulti(handle, idx, name)
   elif op_type == OpType.BATCH_MATMUL:
     return Batch_Matmul(handle, idx, name)
   elif op_type == OpType.SPLIT:
@@ -594,6 +610,8 @@ def convert_op_handle_to_op(op_type, handle, idx=None, name=None):
     return TreeIncMultiHeadSelfAttention(handle, idx, name)
   elif op_type == OpType.RMS_NORM:
     return RMSNorm(handle, idx, name)
+  elif op_type == OpType.RESIDUAL_RMS_NORM:
+    return ResidualRMSNorm(handle, idx, name)
   elif op_type == OpType.ARG_TOPK:
     return ArgTopK(handle, idx, name)
   elif op_type == OpType.BEAM_TOPK:
@@ -1598,6 +1616,12 @@ def add_bias_residual_layer_norm(self, input, residual, axes, elementwise_affine
     handles_array = ffc().flexflow_model_add_add_bias_residual_layer_norm(self.handle, input.handle, residual.handle, len(axes), c_axes, elementwise_affine, eps, use_bias, c_name)
     self.add_layer(OpType.ADD_BIAS_RESIDUAL_LAYERNORM, name)
     return Tensor(handles_array[0], owner_op_type=OpType.ADD_BIAS_RESIDUAL_LAYERNORM), Tensor(handles_array[1], owner_op_type=OpType.ADD_BIAS_RESIDUAL_LAYERNORM)
+  
+  def sigmoid_silu_multi(self, input1, input2, name=None):
+    c_name = get_c_name(name)
+    handle = ffc().flexflow_model_add_sigmoid_silu_multi(self.handle, input1.handle, input2.handle, c_name)
+    self.add_layer(OpType.SIGMOID_SILU_MULTI, name)
+    return Tensor(handle, owner_op_type=OpType.SIGMOID_SILU_MULTI)
 
   def batch_matmul(self, A, B, a_seq_length_dim=None, b_seq_length_dim=None, name=None):
     """Layer that applied batched matrix multiplication onto two input Tensors, :attr:`output = x * y`.
@@ -2588,6 +2612,31 @@ def rms_norm(self, input, eps, dim, name=None):
     self.add_layer(OpType.RMS_NORM, name)
     return Tensor(handle, owner_op_type=OpType.RMS_NORM)
   
+  def residual_rms_norm(self, input1, input2, eps, dim, name=None):
+    """Defines the Residual RMS Norm layer.
+             
+    :param input: the input 1 Tensor.
+    :type input: Tensor
+
+    :param input: the input 2 Tensor.
+    :type input: Tensor
+
+    :param eps: a value added to the denominator for numerical stability
+    :type eps: float
+                          
+    :param dim: The dimension with respect to which to take the norm
+    :type dim: int
+             
+    :param name: the name of the layer. Default is None.
+    :type name: string
+
+    :returns:  Tensor -- the output tensor.
+    """
+    c_name = get_c_name(name)
+    handles_array = ffc().flexflow_model_add_residual_rms_norm(self.handle, input1.handle, input2.handle, eps, dim, c_name)
+    self.add_layer(OpType.RESIDUAL_RMS_NORM, name)
+    return Tensor(handles_array[0], owner_op_type=OpType.RESIDUAL_RMS_NORM), Tensor(handles_array[1], owner_op_type=OpType.RESIDUAL_RMS_NORM)
+  
   def arg_top_k(self, input, k, sorted, name=None):
     """Defines the Arg TopK layer.
              
diff --git a/python/flexflow/serve/models/llama.py b/python/flexflow/serve/models/llama.py
index d1171cc3d3..5bf302f895 100644
--- a/python/flexflow/serve/models/llama.py
+++ b/python/flexflow/serve/models/llama.py
@@ -26,7 +26,11 @@ def __init__(self, hf_config):
         self.num_hidden_layers = hf_config.num_hidden_layers
         self.vocab_size = hf_config.vocab_size
         self.num_attention_heads = hf_config.num_attention_heads
-        self.num_key_value_heads = hf_config.num_attention_heads if hf_config.num_key_value_heads is None else hf_config.num_key_value_heads
+        self.num_key_value_heads = (
+            hf_config.num_attention_heads
+            if hf_config.num_key_value_heads is None
+            else hf_config.num_key_value_heads
+        )
         self.hidden_size = hf_config.hidden_size
         self.rms_norm_eps = hf_config.rms_norm_eps
         self.intermediate_size = hf_config.intermediate_size
@@ -166,9 +170,9 @@ def build_model(self):
             else:
                 assert False
 
-            token = ffmodel.add(token, mha)
-            ff_norm = ffmodel.rms_norm(
+            token, ff_norm = ffmodel.residual_rms_norm(
                 token,
+                mha,
                 self.llama_config.rms_norm_eps,
                 self.llama_config.hidden_size,
                 name=f"layers_{i}_ffn_norm",
@@ -187,9 +191,7 @@ def build_model(self):
                 False,
                 name=f"layers_{i}_feed_forward_w3",
             )
-            sigmoid = ffmodel.sigmoid(w1)
-            silu = ffmodel.multiply(w1, sigmoid)
-            multi = ffmodel.multiply(silu, w3)
+            multi = ffmodel.sigmoid_silu_multi(w1, w3)
             w2 = ffmodel.dense(
                 multi,
                 self.llama_config.hidden_size,
diff --git a/python/flexflow/serve/models/mpt.py b/python/flexflow/serve/models/mpt.py
index 10353c5a96..8487a42c2a 100644
--- a/python/flexflow/serve/models/mpt.py
+++ b/python/flexflow/serve/models/mpt.py
@@ -30,6 +30,7 @@ def __init__(self, hf_config):
         hf_config.num_attention_heads = hf_config.n_heads
         hf_config.hidden_size = hf_config.d_model
 
+
 class FlexFlowMPT(FlexFlowModel):
     def __init__(
         self,
@@ -57,22 +58,15 @@ def __init__(
         self.maxint = 2**31 - 1
 
         # Sanity checks
-        if (
-            self.mpt_config.hidden_size
-            % self.mpt_config.n_heads
-            != 0
-        ):
+        if self.mpt_config.hidden_size % self.mpt_config.n_heads != 0:
             raise ValueError(
                 f"Hidden size ({self.mpt_config.hidden_size}) is not divisible by n_head ({self.mpt_config.n_heads})"
             )
 
         # Sanity checks
         if (
-            self.mpt_config.n_heads
-            < self.ffconfig.tensor_parallelism_degree
-            or self.mpt_config.n_heads
-            % self.ffconfig.tensor_parallelism_degree
-            != 0
+            self.mpt_config.n_heads < self.ffconfig.tensor_parallelism_degree
+            or self.mpt_config.n_heads % self.ffconfig.tensor_parallelism_degree != 0
         ):
             raise ValueError(
                 f"Number of attention heads ({self.mpt_config.n_heads}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
@@ -131,7 +125,7 @@ def build_model(self):
                     (self.mpt_config.hidden_size / self.mpt_config.n_heads)
                     ** (-0.5),  # scaling_factor
                     False,  # qk_prod_scaling
-                    True, # qk_prod_scaling
+                    True,  # qk_prod_scaling
                     name=f"layers_{i}_attention",
                 )
             elif self.mode == InferenceMode.TREE_VERIFY_MODE:
@@ -152,7 +146,7 @@ def build_model(self):
                     (self.mpt_config.hidden_size / self.mpt_config.n_heads)
                     ** (-0.5),  # scaling_factor
                     False,  # qk_prod_scaling
-                    True, # qk_prod_scaling
+                    True,  # qk_prod_scaling
                     name=f"layers_{i}_attention",
                 )
             elif self.mode == InferenceMode.INC_DECODING_MODE:
@@ -173,7 +167,7 @@ def build_model(self):
                     (self.mpt_config.hidden_size / self.mpt_config.n_heads)
                     ** (-0.5),  # scaling_factor
                     False,  # qk_prod_scaling
-                    True, # qk_prod_scaling
+                    True,  # qk_prod_scaling
                     name=f"layers_{i}_attention",
                 )
             else:
@@ -240,7 +234,7 @@ def convert_hf_model(model, dst_folder):
         os.makedirs(dst_folder, exist_ok=True)
         for name, params in model.named_parameters():
             name = name.replace("transformer.blocks.", "layers.").replace(".", "_")
-            if 'Wqkv' in name:
+            if "Wqkv" in name:
                 name_q = name.replace("attn_Wqkv", "attention_wq")
                 name_k = name.replace("attn_Wqkv", "attention_wk")
                 name_v = name.replace("attn_Wqkv", "attention_wv")
@@ -256,7 +250,7 @@ def convert_hf_model(model, dst_folder):
                 q.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_q))
                 k.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_k))
                 v.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_v))
-            elif 'out_proj' in name:
+            elif "out_proj" in name:
                 name = name.replace("attn_out_proj", "attention_wo")
                 params.detach().cpu().numpy().tofile(os.path.join(dst_folder, name))
             else:
@@ -266,6 +260,7 @@ def convert_hf_model(model, dst_folder):
             os.path.join(dst_folder, "transformer_wte_weight"),
             os.path.join(dst_folder, "lm_head_weight"),
         )
+
     def get_layers_with_weights(self):
         layer_names = [
             "transformer_wte_weight",
diff --git a/python/flexflow/serve/models/opt.py b/python/flexflow/serve/models/opt.py
index d90dabad1d..5c7fff2dfe 100644
--- a/python/flexflow/serve/models/opt.py
+++ b/python/flexflow/serve/models/opt.py
@@ -196,22 +196,15 @@ def build_model(self):
             else:
                 assert False
 
-            # residual = ffmodel.add(mha, residual)
-
             # This is either a before or after attention LayerNorm. In both cases, we need to compute the LN here.
-            """ norm_name = (
-                f"layers_{i}_final_layer_norm"
-                if self.opt_config.do_layer_norm_before
-                else f"layers_{i}_attention_layer_norm"
-            ) """
-            # ff_norm = ffmodel.layer_norm(
-            #     residual,
-            #     axes,
-            #     self.opt_config.layer_norm_elementwise_affine,
-            #     1e-05,
-            #     name=norm_name,
-            # )
-            residual, ff_norm = ffmodel.add_bias_residual_layer_norm(mha, residual, axes, self.opt_config.layer_norm_elementwise_affine, 1e-05, name=f"layers_{i}_add_bias_residual_layer_norm")
+            residual, ff_norm = ffmodel.add_bias_residual_layer_norm(
+                mha,
+                residual,
+                axes,
+                self.opt_config.layer_norm_elementwise_affine,
+                1e-05,
+                name=f"layers_{i}_add_bias_residual_layer_norm",
+            )
 
             if not self.opt_config.do_layer_norm_before:
                 residual = ff_norm
@@ -287,7 +280,9 @@ def convert_hf_model(model, dst_folder):
                 .replace("v_proj", "wv")
                 .replace("out_proj", "wo")
                 .replace("attention_wo_bias", "add_bias_residual_layer_norm_attn_bias")
-                .replace("_final_layer_norm", "_add_bias_residual_layer_norm") # important to use the leading "_" to avoid matching the last LayerNorm
+                .replace(
+                    "_final_layer_norm", "_add_bias_residual_layer_norm"
+                )  # important to use the leading "_" to avoid matching the last LayerNorm
             )
             params.detach().cpu().numpy().tofile(f"{dst_folder}/{name}")
         # copy embedding weights
diff --git a/python/flexflow/serve/models/starcoder.py b/python/flexflow/serve/models/starcoder.py
index 05594f81e5..6a80a31514 100644
--- a/python/flexflow/serve/models/starcoder.py
+++ b/python/flexflow/serve/models/starcoder.py
@@ -89,7 +89,7 @@ def __init__(
             raise ValueError(
                 f"Number of k/v attention heads ({self.starcoder_config.n_head_kv}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
             )
-            
+
         self.build_model()
 
     def build_model(self):
@@ -109,7 +109,7 @@ def build_model(self):
             self.data_type,
             None,
             embed_init,
-            name="transformer_wte_weight",
+            name="transformer_wte",
         )
         positional_embedding = ffmodel.embedding(
             position_tensor,
@@ -119,7 +119,7 @@ def build_model(self):
             self.data_type,
             None,
             embed_init,
-            name="transformer_wpe_weight",
+            name="transformer_wpe",
         )
 
         hidden_states = ffmodel.add(token, positional_embedding)
@@ -135,7 +135,7 @@ def build_model(self):
                 axes,
                 True,
                 self.starcoder_config.layer_norm_epsilon,
-                name=f"layers_{i}_ln_1_weight",
+                name=f"layers_{i}_ln_1",
             )
 
             assert self.mode == InferenceMode.INC_DECODING_MODE
@@ -155,7 +155,7 @@ def build_model(self):
                 DataType.DT_NONE,  # data_type
                 None,  # kernel initializer
                 False,  # apply_rotary_embedding
-                name=f"layers_{i}_attention_weight",
+                name=f"layers_{i}_attention",
             )
 
             residual = ffmodel.add(mha, hidden_states)
@@ -165,7 +165,7 @@ def build_model(self):
                 axes,
                 True,
                 self.starcoder_config.layer_norm_epsilon,
-                name=f"layers_{i}_ln_2_weight",
+                name=f"layers_{i}_ln_2",
             )
 
             # mlp
@@ -175,7 +175,7 @@ def build_model(self):
                 self.starcoder_config.intermediate_size,
                 ActiMode.AC_MODE_NONE,
                 True,
-                name=f"layers_{i}_mlp_c_fc_weight",
+                name=f"layers_{i}_mlp_c_fc",
             )
             activation = ffmodel.gelu(c_fc, False)
             c_proj = ffmodel.dense(
@@ -183,7 +183,7 @@ def build_model(self):
                 self.starcoder_config.hidden_size,
                 ActiMode.AC_MODE_NONE,
                 True,
-                name=f"layers_{i}_mlp_c_proj_weight",
+                name=f"layers_{i}_mlp_c_proj",
             )
             hidden_states = ffmodel.add(residual, c_proj)
 
@@ -192,14 +192,14 @@ def build_model(self):
             axes,
             True,
             self.starcoder_config.layer_norm_epsilon,
-            name=f"transformer_ln_f_weight",
+            name=f"transformer_ln_f",
         )
         lm_head = ffmodel.dense(
             ln_f,
             self.starcoder_config.vocab_size,
             ActiMode.AC_MODE_NONE,
             False,
-            name="lm_head_weight",
+            name="lm_head",
         )
 
         if self.generation_config.do_sample:
diff --git a/python/flexflow/type.py b/python/flexflow/type.py
index a4785dba51..ec8a6bc432 100644
--- a/python/flexflow/type.py
+++ b/python/flexflow/type.py
@@ -149,6 +149,8 @@ class OpType(Enum):
     ARG_TOPK = 2301
     BEAM_TOPK = 2302
     ADD_BIAS_RESIDUAL_LAYERNORM = 2303
+    SIGMOID_SILU_MULTI = 2304
+    RESIDUAL_RMS_NORM = 2305
 
 
 def enum_to_int(enum, enum_item):
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index dee030abee..0ebe29e3e9 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -685,6 +685,24 @@ flexflow_tensor_t *flexflow_model_add_add_bias_residual_layer_norm(
   return tensor_outputs_wrapped;
 }
 
+flexflow_tensor_t
+    flexflow_model_add_sigmoid_silu_multi(flexflow_model_t handle_,
+                                          const flexflow_tensor_t input1_,
+                                          const flexflow_tensor_t input2_,
+                                          char const *name) {
+  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
+  const Tensor input1 = FFCObjectWrapper::unwrap(input1_);
+  const Tensor input2 = FFCObjectWrapper::unwrap(input2_);
+  Tensor tensor =
+      handle->sigmoid_silu_multi(input1, input2, input1->data_type, name);
+  DEBUG_PRINT("[SigmoidSiluMulti] new Tensor %p, input1 %p, input2 %p, name %s",
+              tensor,
+              input1,
+              input2,
+              name);
+  return FFCObjectWrapper::wrap(tensor);
+}
+
 flexflow_tensor_t flexflow_model_add_batch_matmul(flexflow_model_t handle_,
                                                   const flexflow_tensor_t a_,
                                                   const flexflow_tensor_t b_,
@@ -1386,6 +1404,28 @@ flexflow_tensor_t flexflow_model_add_rms_norm(flexflow_model_t handle_,
   return FFCObjectWrapper::wrap(tensor);
 }
 
+flexflow_tensor_t *
+    flexflow_model_add_residual_rms_norm(flexflow_model_t handle_,
+                                         const flexflow_tensor_t input1_,
+                                         const flexflow_tensor_t input2_,
+                                         float eps,
+                                         int dim,
+                                         char const *name) {
+  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
+  Tensor input1 = FFCObjectWrapper::unwrap(input1_);
+  Tensor input2 = FFCObjectWrapper::unwrap(input2_);
+  Tensor tensor_outputs[2];
+  handle->residual_rms_norm(
+      input1, input2, tensor_outputs, eps, dim, input1->data_type, name);
+  assert(tensor_outputs[0] != nullptr);
+  assert(tensor_outputs[1] != nullptr);
+  flexflow_tensor_t *tensor_outputs_wrapped =
+      (flexflow_tensor_t *)calloc(2, sizeof(flexflow_tensor_t));
+  tensor_outputs_wrapped[0] = FFCObjectWrapper::wrap(tensor_outputs[0]);
+  tensor_outputs_wrapped[1] = FFCObjectWrapper::wrap(tensor_outputs[1]);
+  return tensor_outputs_wrapped;
+}
+
 flexflow_tensor_t flexflow_model_add_arg_top_k(flexflow_model_t handle_,
                                                const flexflow_tensor_t input_,
                                                int k,
diff --git a/src/ops/add_bias_residual_layer_norm.cc b/src/ops/add_bias_residual_layer_norm.cc
index ea770f2ac7..159c82b346 100644
--- a/src/ops/add_bias_residual_layer_norm.cc
+++ b/src/ops/add_bias_residual_layer_norm.cc
@@ -123,19 +123,11 @@ void FFModel::add_bias_residual_layer_norm(const Tensor input,
                  residual);
   // added: attn_output + final attention bias + residual. To be added to the
   // output of FC2
-  ln->outputs[0] = create_tensor_legion_ordering(input->num_dims,
-                                                 input->dims,
-                                                 input->data_type,
-                                                 ln,
-                                                 0,
-                                                 false /*create_grad*/);
+  ln->outputs[0] = create_tensor_legion_ordering(
+      input->num_dims, input->dims, data_type, ln, 0, false /*create_grad*/);
   // layer_norm(added)
-  ln->outputs[1] = create_tensor_legion_ordering(input->num_dims,
-                                                 input->dims,
-                                                 input->data_type,
-                                                 ln,
-                                                 0,
-                                                 false /*create_grad*/);
+  ln->outputs[1] = create_tensor_legion_ordering(
+      input->num_dims, input->dims, data_type, ln, 1, false /*create_grad*/);
   {
     int numdims = axes.size();
     int dims[numdims];
@@ -146,7 +138,7 @@ void FFModel::add_bias_residual_layer_norm(const Tensor input,
     int attn_bias_dims[1] = {dims[0]};
     ln->weights[0] = create_weight_legion_ordering(1,
                                                    attn_bias_dims,
-                                                   input->data_type,
+                                                   data_type,
                                                    ln,
                                                    false /*create_grad*/,
                                                    nullptr,
@@ -155,7 +147,7 @@ void FFModel::add_bias_residual_layer_norm(const Tensor input,
       assert(elementwise_affine);
       ln->weights[1] = create_weight_legion_ordering(numdims,
                                                      dims,
-                                                     input->data_type,
+                                                     data_type,
                                                      ln,
                                                      false /*create_grad*/,
                                                      nullptr,
@@ -164,7 +156,7 @@ void FFModel::add_bias_residual_layer_norm(const Tensor input,
         assert(use_bias);
         ln->weights[2] = create_weight_legion_ordering(numdims,
                                                        dims,
-                                                       input->data_type,
+                                                       data_type,
                                                        ln,
                                                        false /*create_grad*/,
                                                        nullptr,
@@ -818,6 +810,8 @@ namespace std {
 size_t hash<FlexFlow::AddBiasResidualLayerNormParams>::operator()(
     FlexFlow::AddBiasResidualLayerNormParams const &params) const {
   size_t key = 0;
+  hash_combine(key, params.layer_guid.id);
+  hash_combine(key, params.layer_guid.transformer_layer_id);
   hash_combine(key, params.axes.size());
   for (int n : params.axes) {
     hash_combine(key, n);
diff --git a/src/ops/fused.cpp b/src/ops/fused.cpp
index c2780545f3..f865c6dd2a 100644
--- a/src/ops/fused.cpp
+++ b/src/ops/fused.cpp
@@ -32,10 +32,12 @@
 #include "flexflow/ops/kernels/linear_kernels.h"
 #include "flexflow/ops/kernels/pool_2d_kernels.h"
 #include "flexflow/ops/kernels/reshape_kernels.h"
+#include "flexflow/ops/kernels/residual_rms_norm_kernels.h"
 #include "flexflow/ops/kernels/rms_norm_kernels.h"
 #include "flexflow/ops/kernels/softmax_kernels.h"
 #include "flexflow/ops/kernels/transpose_kernels.h"
 #include "flexflow/ops/layer_norm.h"
+#include "flexflow/ops/sigmoid_silu_multi.h"
 #include "flexflow/ops/spec_inc_multihead_self_attention.h"
 #include "flexflow/ops/tree_inc_multihead_self_attention.h"
 #include "flexflow/parallel_ops/kernels/allreduce_kernels.h"
@@ -478,6 +480,16 @@ __host__ void FusedOp::forward_task(Task const *task,
                         "the forward() task");
         break;
       }
+      case OP_RESIDUAL_RMS_NORM: {
+        assert(false && "Operator ResidualRMSNorm does not support "
+                        "the forward() task");
+        break;
+      }
+      case OP_SIGMOID_SILU_MULTI: {
+        assert(false && "Operator SigmoidSiluMulti does not support "
+                        "the forward() task");
+        break;
+      }
       default: {
         fprintf(stderr,
                 "Fusion currently does not support type = %d\n",
@@ -813,6 +825,19 @@ __host__ void
                                                  my_output_accessor[0]);
         break;
       }
+      case OP_RESIDUAL_RMS_NORM: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_weights[op] == 1);
+        assert(fused->op_num_outputs[op] == 2);
+        ResidualRMSNormMeta const *m = (ResidualRMSNormMeta *)metas->meta[op];
+        Kernels::ResidualRMSNorm::forward_kernel_wrapper(m,
+                                                         my_input_accessor[0],
+                                                         my_input_accessor[1],
+                                                         my_weight_accessor[0],
+                                                         my_output_accessor[0],
+                                                         my_output_accessor[1]);
+        break;
+      }
       case OP_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
@@ -942,6 +967,16 @@ __host__ void
             beta);
         break;
       }
+      case OP_SIGMOID_SILU_MULTI: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_outputs[op] == 1);
+        SigmoidSiluMultiMeta const *m = (SigmoidSiluMultiMeta *)metas->meta[op];
+        SigmoidSiluMulti::inference_kernel_wrapper(m,
+                                                   my_input_accessor[0],
+                                                   my_input_accessor[1],
+                                                   my_output_accessor[0]);
+        break;
+      }
       case OP_SOFTMAX: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_weights[op] == 0);
diff --git a/src/ops/fused.cu b/src/ops/fused.cu
index 011dd9be75..13927e8ee6 100644
--- a/src/ops/fused.cu
+++ b/src/ops/fused.cu
@@ -32,10 +32,12 @@
 #include "flexflow/ops/kernels/linear_kernels.h"
 #include "flexflow/ops/kernels/pool_2d_kernels.h"
 #include "flexflow/ops/kernels/reshape_kernels.h"
+#include "flexflow/ops/kernels/residual_rms_norm_kernels.h"
 #include "flexflow/ops/kernels/rms_norm_kernels.h"
 #include "flexflow/ops/kernels/softmax_kernels.h"
 #include "flexflow/ops/kernels/transpose_kernels.h"
 #include "flexflow/ops/layer_norm.h"
+#include "flexflow/ops/sigmoid_silu_multi.h"
 #include "flexflow/ops/spec_inc_multihead_self_attention.h"
 #include "flexflow/ops/tree_inc_multihead_self_attention.h"
 #include "flexflow/parallel_ops/kernels/allreduce_kernels.h"
@@ -491,6 +493,16 @@ __host__ void FusedOp::forward_task(Task const *task,
                         "the forward() task");
         break;
       }
+      case OP_SIGMOID_SILU_MULTI: {
+        assert(false && "Operator SigmoidSiluMulti does not support "
+                        "the forward() task");
+        break;
+      }
+      case OP_RESIDUAL_RMS_NORM: {
+        assert(false && "Operator ResidualRMSNorm does not support "
+                        "the forward() task");
+        break;
+      }
       default: {
         fprintf(stderr,
                 "Fusion currently does not support type = %d\n",
@@ -842,6 +854,19 @@ __host__ void
                                                  my_output_accessor[0]);
         break;
       }
+      case OP_RESIDUAL_RMS_NORM: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_weights[op] == 1);
+        assert(fused->op_num_outputs[op] == 2);
+        ResidualRMSNormMeta const *m = (ResidualRMSNormMeta *)metas->meta[op];
+        Kernels::ResidualRMSNorm::forward_kernel_wrapper(m,
+                                                         my_input_accessor[0],
+                                                         my_input_accessor[1],
+                                                         my_weight_accessor[0],
+                                                         my_output_accessor[0],
+                                                         my_output_accessor[1]);
+        break;
+      }
       case OP_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
@@ -973,6 +998,16 @@ __host__ void
             beta);
         break;
       }
+      case OP_SIGMOID_SILU_MULTI: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_outputs[op] == 1);
+        SigmoidSiluMultiMeta const *m = (SigmoidSiluMultiMeta *)metas->meta[op];
+        SigmoidSiluMulti::inference_kernel_wrapper(m,
+                                                   my_input_accessor[0],
+                                                   my_input_accessor[1],
+                                                   my_output_accessor[0]);
+        break;
+      }
       case OP_SOFTMAX: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_weights[op] == 0);
diff --git a/src/ops/kernels/residual_rms_norm_kernels.cpp b/src/ops/kernels/residual_rms_norm_kernels.cpp
new file mode 100644
index 0000000000..6906556452
--- /dev/null
+++ b/src/ops/kernels/residual_rms_norm_kernels.cpp
@@ -0,0 +1,227 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/kernels/residual_rms_norm_kernels.h"
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/ops/residual_rms_norm.h"
+#include "flexflow/utils/hip_helper.h"
+#include <hip/hip_runtime.h>
+
+namespace FlexFlow {
+// declare Legion names
+using Legion::coord_t;
+#define C10_WARP_SIZE 32
+constexpr int kCUDABlockReduceNumThreads = 512;
+constexpr int kCUDANumThreads = 256;
+
+ResidualRMSNormMeta::ResidualRMSNormMeta(FFHandler handler,
+                                         ResidualRMSNorm const *rms,
+                                         MemoryAllocator &gpu_mem_allocator)
+    : OpMeta(handler, rms) {
+  eps = rms->eps;
+  alpha = 1.0f;
+  beta = 0.0f;
+
+  in_dim = rms->data_dim;
+  batch_size = rms->effective_batch_size;
+  num_elements = in_dim * batch_size;
+
+  DataType data_type = rms->weights[0]->data_type;
+  size_t rms_ptr_size = batch_size;
+  size_t norm_ptr_size = num_elements;
+  size_t totalSize = (rms_ptr_size + norm_ptr_size) * data_type_size(data_type);
+  gpu_mem_allocator.create_legion_instance(reserveInst, totalSize);
+  rms_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      rms_ptr_size * data_type_size(data_type));
+  norm_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      norm_ptr_size * data_type_size(data_type));
+}
+ResidualRMSNormMeta::~ResidualRMSNormMeta(void) {
+  if (reserveInst != Realm::RegionInstance::NO_INST) {
+    reserveInst.destroy();
+  }
+}
+namespace Kernels {
+namespace ResidualRMSNorm {
+
+template <typename T>
+__device__ __forceinline__ T WARP_SHFL_DOWN(T value,
+                                            unsigned int delta,
+                                            int width = warpSize,
+                                            unsigned int mask = 0xffffffff) {
+#ifndef __HIP_PLATFORM_HCC__
+  return __shfl_down_sync(mask, value, delta, width);
+#else
+  return __shfl_down(value, delta, width);
+#endif
+}
+
+template <typename T>
+__inline__ __device__ T WarpReduceSum(T val) {
+#pragma unroll
+  for (int offset = (C10_WARP_SIZE >> 1); offset > 0; offset >>= 1) {
+    val += WARP_SHFL_DOWN(val, offset);
+  }
+  return val;
+}
+
+template <typename T>
+__inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
+  int const lid = threadIdx.x % C10_WARP_SIZE;
+  int const wid = threadIdx.x / C10_WARP_SIZE;
+  val = WarpReduceSum(val);
+  __syncthreads();
+  if (lid == 0) {
+    shared[wid] = val;
+  }
+  __syncthreads();
+  val = (threadIdx.x < (min(blockDim.x, max_num_threads) / C10_WARP_SIZE))
+            ? shared[lid]
+            : T(0);
+  if (wid == 0) {
+    val = WarpReduceSum(val);
+  }
+  return val;
+}
+
+template <typename T>
+__global__ void ResidualRMSNormFusedForwardKernel(int64_t N,
+                                                  float eps,
+                                                  T const *X1,
+                                                  T const *X2,
+                                                  T *X_out,
+                                                  T *rms,
+                                                  T *Y,
+                                                  T const *weights,
+                                                  T *output) {
+  __shared__ float v_shared[C10_WARP_SIZE];
+  int64_t const i = blockIdx.x;
+  float sum = 0.0f;
+  for (int64_t j = threadIdx.x; j < N;
+       j += min(blockDim.x, kCUDABlockReduceNumThreads)) {
+    int64_t const index = i * N + j;
+    X_out[index] = X1[index] + X2[index];
+    sum +=
+        (static_cast<float>(X_out[index]) * static_cast<float>(X_out[index]));
+  }
+  sum = BlockReduceSum<float>(
+      sum,
+      v_shared,
+      min(blockDim.x,
+          kCUDABlockReduceNumThreads)); // use BlockReduceSum() to sum X_ij^2
+
+  if (threadIdx.x == 0) {
+    rms[i] = static_cast<T>(rsqrt((sum / static_cast<float>(N)) + eps));
+  }
+
+  __syncthreads();
+
+  using T_ACC = T;
+  for (int64_t j = threadIdx.x; j < N; j += min(blockDim.x, kCUDANumThreads)) {
+    const int64_t index = i * N + j;
+    Y[index] = static_cast<T_ACC>(X_out[index]) * static_cast<T_ACC>(rms[i]);
+    output[index] = Y[index] * weights[index % N];
+  }
+}
+
+template <typename T>
+void forward_kernel(ResidualRMSNormMeta const *m,
+                    T const *input1_ptr,
+                    T const *input2_ptr,
+                    T const *weight_ptr,
+                    T *residual_output_ptr,
+                    T *output_ptr,
+                    hipStream_t stream) {
+  std::pair<int, int> kernel1_parallelism =
+      std::make_pair(m->batch_size, kCUDABlockReduceNumThreads);
+  std::pair<int, int> kernel2_parallelism =
+      std::make_pair(m->batch_size, kCUDANumThreads);
+
+  int num_blocks =
+      std::max(kernel1_parallelism.first, kernel2_parallelism.first);
+  int num_threads =
+      std::max(kernel1_parallelism.second, kernel2_parallelism.second);
+
+  hipLaunchKernelGGL(HIP_KERNEL_NAME(ResidualRMSNormFusedForwardKernel<T>),
+                     num_blocks,
+                     num_threads,
+                     0,
+                     stream,
+                     m->in_dim,
+                     m->eps,
+                     input1_ptr,
+                     input2_ptr,
+                     residual_output_ptr,
+                     static_cast<T *>(m->rms_ptr),
+                     static_cast<T *>(m->norm_ptr),
+                     weight_ptr,
+                     output_ptr);
+}
+
+void forward_kernel_wrapper(ResidualRMSNormMeta const *m,
+                            GenericTensorAccessorR const &input1,
+                            GenericTensorAccessorR const &input2,
+                            GenericTensorAccessorR const &weight,
+                            GenericTensorAccessorW const &residual_output,
+                            GenericTensorAccessorW const &output) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+
+  assert(input1.data_type == input2.data_type);
+  assert(output.data_type == input1.data_type);
+  assert(weight.data_type == output.data_type);
+  assert(residual_output.data_type == output.data_type);
+
+  if (output.data_type == DT_HALF) {
+    forward_kernel(m,
+                   input1.get_half_ptr(),
+                   input2.get_half_ptr(),
+                   weight.get_half_ptr(),
+                   residual_output.get_half_ptr(),
+                   output.get_half_ptr(),
+                   stream);
+  } else if (output.data_type == DT_FLOAT) {
+    forward_kernel(m,
+                   input1.get_float_ptr(),
+                   input2.get_float_ptr(),
+                   weight.get_float_ptr(),
+                   residual_output.get_float_ptr(),
+                   output.get_float_ptr(),
+                   stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("[ResidualRMSNorm] forward time (CF) = %.2fms\n", elapsed);
+  }
+}
+
+} // namespace ResidualRMSNorm
+} // namespace Kernels
+} // namespace FlexFlow
diff --git a/src/ops/kernels/residual_rms_norm_kernels.cu b/src/ops/kernels/residual_rms_norm_kernels.cu
new file mode 100644
index 0000000000..17ac14449b
--- /dev/null
+++ b/src/ops/kernels/residual_rms_norm_kernels.cu
@@ -0,0 +1,224 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/ops/kernels/residual_rms_norm_kernels.h"
+#include "flexflow/ops/residual_rms_norm.h"
+#include "flexflow/utils/cuda_helper.h"
+#include <cublas_v2.h>
+
+namespace FlexFlow {
+// declare Legion names
+using Legion::coord_t;
+
+#define C10_WARP_SIZE 32
+constexpr int kCUDABlockReduceNumThreads = 512;
+constexpr int kCUDANumThreads = 256;
+
+ResidualRMSNormMeta::ResidualRMSNormMeta(FFHandler handler,
+                                         ResidualRMSNorm const *rms,
+                                         MemoryAllocator &gpu_mem_allocator)
+    : OpMeta(handler, rms) {
+  eps = rms->eps;
+  alpha = 1.0f;
+  beta = 0.0f;
+
+  in_dim = rms->data_dim;
+  batch_size = rms->effective_batch_size;
+  num_elements = in_dim * batch_size;
+
+  DataType data_type = rms->weights[0]->data_type;
+  size_t rms_ptr_size = batch_size;
+  size_t norm_ptr_size = num_elements;
+  size_t totalSize = (rms_ptr_size + norm_ptr_size) * data_type_size(data_type);
+  gpu_mem_allocator.create_legion_instance(reserveInst, totalSize);
+  rms_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      rms_ptr_size * data_type_size(data_type));
+  norm_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      norm_ptr_size * data_type_size(data_type));
+}
+ResidualRMSNormMeta::~ResidualRMSNormMeta(void) {
+  if (reserveInst != Realm::RegionInstance::NO_INST) {
+    reserveInst.destroy();
+  }
+}
+
+namespace Kernels {
+namespace ResidualRMSNorm {
+
+template <typename T>
+__device__ __forceinline__ T WARP_SHFL_DOWN(T value,
+                                            unsigned int delta,
+                                            int width = warpSize,
+                                            unsigned int mask = 0xffffffff) {
+#ifndef __HIP_PLATFORM_HCC__
+  return __shfl_down_sync(mask, value, delta, width);
+#else
+  return __shfl_down(value, delta, width);
+#endif
+}
+
+template <typename T>
+__inline__ __device__ T WarpReduceSum(T val) {
+#pragma unroll
+  for (int offset = (C10_WARP_SIZE >> 1); offset > 0; offset >>= 1) {
+    val += WARP_SHFL_DOWN(val, offset);
+  }
+  return val;
+}
+
+template <typename T>
+__inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
+  int const lid = threadIdx.x % C10_WARP_SIZE;
+  int const wid = threadIdx.x / C10_WARP_SIZE;
+  val = WarpReduceSum(val);
+  __syncthreads();
+  if (lid == 0) {
+    shared[wid] = val;
+  }
+  __syncthreads();
+  val = (threadIdx.x < (min(blockDim.x, max_num_threads) / C10_WARP_SIZE))
+            ? shared[lid]
+            : T(0);
+  if (wid == 0) {
+    val = WarpReduceSum(val);
+  }
+  return val;
+}
+
+template <typename T>
+__global__ void ResidualRMSNormFusedForwardKernel(int64_t N,
+                                                  float eps,
+                                                  T const *X1,
+                                                  T const *X2,
+                                                  T *X_out,
+                                                  T *rms,
+                                                  T *Y,
+                                                  T const *weights,
+                                                  T *output) {
+  __shared__ float v_shared[C10_WARP_SIZE];
+  int64_t const i = blockIdx.x;
+  float sum = 0.0f;
+  for (int64_t j = threadIdx.x; j < N;
+       j += min(blockDim.x, kCUDABlockReduceNumThreads)) {
+    int64_t const index = i * N + j;
+    X_out[index] = X1[index] + X2[index];
+    sum +=
+        (static_cast<float>(X_out[index]) * static_cast<float>(X_out[index]));
+  }
+  sum = BlockReduceSum<float>(
+      sum,
+      v_shared,
+      min(blockDim.x,
+          kCUDABlockReduceNumThreads)); // use BlockReduceSum() to sum X_ij^2
+
+  if (threadIdx.x == 0) {
+    rms[i] = static_cast<T>(rsqrt((sum / static_cast<float>(N)) + eps));
+  }
+
+  __syncthreads();
+
+  using T_ACC = T;
+  for (int64_t j = threadIdx.x; j < N; j += min(blockDim.x, kCUDANumThreads)) {
+    const int64_t index = i * N + j;
+    Y[index] = static_cast<T_ACC>(X_out[index]) * static_cast<T_ACC>(rms[i]);
+    output[index] = Y[index] * weights[index % N];
+  }
+}
+
+template <typename T>
+void forward_kernel(ResidualRMSNormMeta const *m,
+                    T const *input1_ptr,
+                    T const *input2_ptr,
+                    T const *weight_ptr,
+                    T *residual_output_ptr,
+                    T *output_ptr,
+                    cudaStream_t stream) {
+
+  std::pair<int, int> kernel1_parallelism =
+      std::make_pair(m->batch_size, kCUDABlockReduceNumThreads);
+  std::pair<int, int> kernel2_parallelism =
+      std::make_pair(m->batch_size, kCUDANumThreads);
+
+  int num_blocks =
+      std::max(kernel1_parallelism.first, kernel2_parallelism.first);
+  int num_threads =
+      std::max(kernel1_parallelism.second, kernel2_parallelism.second);
+
+  ResidualRMSNormFusedForwardKernel<T>
+      <<<num_blocks, num_threads, 0, stream>>>(m->in_dim,
+                                               m->eps,
+                                               input1_ptr,
+                                               input2_ptr,
+                                               residual_output_ptr,
+                                               static_cast<T *>(m->rms_ptr),
+                                               static_cast<T *>(m->norm_ptr),
+                                               weight_ptr,
+                                               output_ptr);
+}
+
+void forward_kernel_wrapper(ResidualRMSNormMeta const *m,
+                            GenericTensorAccessorR const &input1,
+                            GenericTensorAccessorR const &input2,
+                            GenericTensorAccessorR const &weight,
+                            GenericTensorAccessorW const &residual_output,
+                            GenericTensorAccessorW const &output) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+
+  assert(input1.data_type == input2.data_type);
+  assert(output.data_type == input1.data_type);
+  assert(weight.data_type == output.data_type);
+  assert(residual_output.data_type == output.data_type);
+  if (output.data_type == DT_HALF) {
+    forward_kernel(m,
+                   input1.get_half_ptr(),
+                   input2.get_half_ptr(),
+                   weight.get_half_ptr(),
+                   residual_output.get_half_ptr(),
+                   output.get_half_ptr(),
+                   stream);
+  } else if (output.data_type == DT_FLOAT) {
+    forward_kernel(m,
+                   input1.get_float_ptr(),
+                   input2.get_float_ptr(),
+                   weight.get_float_ptr(),
+                   residual_output.get_float_ptr(),
+                   output.get_float_ptr(),
+                   stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[ResidualRMSNorm] forward time (CF) = %.2fms\n", elapsed);
+  }
+}
+
+} // namespace ResidualRMSNorm
+} // namespace Kernels
+} // namespace FlexFlow
diff --git a/src/ops/kernels/rms_norm_kernels.cpp b/src/ops/kernels/rms_norm_kernels.cpp
index 3f4952b4a6..24ab7051e6 100644
--- a/src/ops/kernels/rms_norm_kernels.cpp
+++ b/src/ops/kernels/rms_norm_kernels.cpp
@@ -78,7 +78,7 @@ __inline__ __device__ T WarpReduceSum(T val) {
 }
 
 template <typename T>
-__inline__ __device__ T BlockReduceSum(T val, T *shared) {
+__inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
   int const lid = threadIdx.x % C10_WARP_SIZE;
   int const wid = threadIdx.x / C10_WARP_SIZE;
   val = WarpReduceSum(val);
@@ -87,7 +87,9 @@ __inline__ __device__ T BlockReduceSum(T val, T *shared) {
     shared[wid] = val;
   }
   __syncthreads();
-  val = (threadIdx.x < (blockDim.x / C10_WARP_SIZE)) ? shared[lid] : T(0);
+  val = (threadIdx.x < (min(blockDim.x, max_num_threads) / C10_WARP_SIZE))
+            ? shared[lid]
+            : T(0);
   if (wid == 0) {
     val = WarpReduceSum(val);
   }
@@ -95,41 +97,38 @@ __inline__ __device__ T BlockReduceSum(T val, T *shared) {
 }
 
 template <typename T>
-__global__ void
-    RowwiseRootMeanSquareKernel(long long N, float eps, T const *X, T *rms) {
+__global__ void RMSNormFusedForwardKernel(int64_t N,
+                                          float eps,
+                                          T const *X,
+                                          T *rms,
+                                          T *Y,
+                                          T const *weights,
+                                          T *output) {
   __shared__ float v_shared[C10_WARP_SIZE];
-  long long const i = blockIdx.x;
+  int64_t const i = blockIdx.x;
   float sum = 0.0f;
-  for (long long j = threadIdx.x; j < N; j += blockDim.x) {
-    long long const index = i * N + j;
+  for (int64_t j = threadIdx.x; j < N;
+       j += min(blockDim.x, kCUDABlockReduceNumThreads)) {
+    int64_t const index = i * N + j;
     sum += (static_cast<float>(X[index]) * static_cast<float>(X[index]));
   }
-  sum = BlockReduceSum<float>(sum,
-                              v_shared); // use BlockReduceSum() to sum X_ij^2
+  sum = BlockReduceSum<float>(
+      sum,
+      v_shared,
+      min(blockDim.x,
+          kCUDABlockReduceNumThreads)); // use BlockReduceSum() to sum X_ij^2
 
   if (threadIdx.x == 0) {
     rms[i] = static_cast<T>(rsqrt((sum / static_cast<float>(N)) + eps));
   }
-}
 
-template <typename T>
-__global__ void NormKernel(int64_t N, T const *X, T const *rstd, T *Y) {
+  __syncthreads();
+
   using T_ACC = T;
-  const int64_t i = blockIdx.x;
-  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
+  for (int64_t j = threadIdx.x; j < N; j += min(blockDim.x, kCUDANumThreads)) {
     const int64_t index = i * N + j;
-    Y[index] = static_cast<T_ACC>(X[index]) * static_cast<T_ACC>(rstd[i]);
-  }
-}
-
-template <typename T>
-__global__ void elewise_apply_weights(int64_t batch_size,
-                                      int64_t in_dim,
-                                      T const *norm,
-                                      T const *weights,
-                                      T *output) {
-  CUDA_KERNEL_LOOP(i, batch_size * in_dim) {
-    output[i] = norm[i] * weights[i % in_dim];
+    Y[index] = static_cast<T_ACC>(X[index]) * static_cast<T_ACC>(rms[i]);
+    output[index] = Y[index] * weights[index % N];
   }
 }
 
@@ -139,33 +138,25 @@ void forward_kernel(RMSNormMeta const *m,
                     T const *weight_ptr,
                     T *output_ptr,
                     hipStream_t stream) {
-  int parallelism = m->batch_size * m->in_dim;
-  hipLaunchKernelGGL(HIP_KERNEL_NAME(RowwiseRootMeanSquareKernel<T>),
-                     m->batch_size,
-                     kCUDABlockReduceNumThreads,
+  std::pair<int, int> kernel1_parallelism =
+      std::make_pair(m->batch_size, kCUDABlockReduceNumThreads);
+  std::pair<int, int> kernel2_parallelism =
+      std::make_pair(m->batch_size, kCUDANumThreads);
+
+  int num_blocks =
+      std::max(kernel1_parallelism.first, kernel2_parallelism.first);
+  int num_threads =
+      std::max(kernel1_parallelism.second, kernel2_parallelism.second);
+
+  hipLaunchKernelGGL(HIP_KERNEL_NAME(RMSNormFusedForwardKernel<T>),
+                     num_blocks,
+                     num_threads,
                      0,
                      stream,
                      m->in_dim,
                      m->eps,
                      input_ptr,
-                     static_cast<T *>(m->rms_ptr));
-
-  hipLaunchKernelGGL(HIP_KERNEL_NAME(NormKernel<T>),
-                     m->batch_size,
-                     kCUDANumThreads,
-                     0,
-                     stream,
-                     m->in_dim,
-                     input_ptr,
                      static_cast<T *>(m->rms_ptr),
-                     static_cast<T *>(m->norm_ptr));
-  hipLaunchKernelGGL(HIP_KERNEL_NAME(elewise_apply_weights),
-                     GET_BLOCKS(parallelism),
-                     min(CUDA_NUM_THREADS, parallelism),
-                     0,
-                     stream,
-                     m->batch_size,
-                     m->in_dim,
                      static_cast<T *>(m->norm_ptr),
                      weight_ptr,
                      output_ptr);
diff --git a/src/ops/kernels/rms_norm_kernels.cu b/src/ops/kernels/rms_norm_kernels.cu
index 234bf73150..7c9f4a9f98 100644
--- a/src/ops/kernels/rms_norm_kernels.cu
+++ b/src/ops/kernels/rms_norm_kernels.cu
@@ -96,6 +96,26 @@ __inline__ __device__ T BlockReduceSum(T val, T *shared) {
   return val;
 }
 
+template <typename T>
+__inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
+  int const lid = threadIdx.x % C10_WARP_SIZE;
+  int const wid = threadIdx.x / C10_WARP_SIZE;
+  val = WarpReduceSum(val);
+  __syncthreads();
+  if (lid == 0) {
+    shared[wid] = val;
+  }
+  __syncthreads();
+  val = (threadIdx.x < (min(blockDim.x, max_num_threads) / C10_WARP_SIZE))
+            ? shared[lid]
+            : T(0);
+  if (wid == 0) {
+    val = WarpReduceSum(val);
+  }
+  return val;
+}
+
+#ifdef DEADCODE
 template <typename T>
 __global__ void
     RowwiseRootMeanSquareKernel(long long N, float eps, T const *X, T *rms) {
@@ -134,6 +154,43 @@ __global__ void elewise_apply_weights(int64_t batch_size,
     output[i] = norm[i] * weights[i % in_dim];
   }
 }
+#endif
+
+template <typename T>
+__global__ void RMSNormFusedForwardKernel(int64_t N,
+                                          float eps,
+                                          T const *X,
+                                          T *rms,
+                                          T *Y,
+                                          T const *weights,
+                                          T *output) {
+  __shared__ float v_shared[C10_WARP_SIZE];
+  int64_t const i = blockIdx.x;
+  float sum = 0.0f;
+  for (int64_t j = threadIdx.x; j < N;
+       j += min(blockDim.x, kCUDABlockReduceNumThreads)) {
+    int64_t const index = i * N + j;
+    sum += (static_cast<float>(X[index]) * static_cast<float>(X[index]));
+  }
+  sum = BlockReduceSum<float>(
+      sum,
+      v_shared,
+      min(blockDim.x,
+          kCUDABlockReduceNumThreads)); // use BlockReduceSum() to sum X_ij^2
+
+  if (threadIdx.x == 0) {
+    rms[i] = static_cast<T>(rsqrt((sum / static_cast<float>(N)) + eps));
+  }
+
+  __syncthreads();
+
+  using T_ACC = T;
+  for (int64_t j = threadIdx.x; j < N; j += min(blockDim.x, kCUDANumThreads)) {
+    const int64_t index = i * N + j;
+    Y[index] = static_cast<T_ACC>(X[index]) * static_cast<T_ACC>(rms[i]);
+    output[index] = Y[index] * weights[index % N];
+  }
+}
 
 template <typename T>
 void forward_kernel(RMSNormMeta const *m,
@@ -141,23 +198,25 @@ void forward_kernel(RMSNormMeta const *m,
                     T const *weight_ptr,
                     T *output_ptr,
                     cudaStream_t stream) {
-  int parallelism = m->batch_size * m->in_dim;
-  RowwiseRootMeanSquareKernel<T>
-      <<<m->batch_size, kCUDABlockReduceNumThreads, 0, stream>>>(
-          m->in_dim, m->eps, input_ptr, static_cast<T *>(m->rms_ptr));
-  NormKernel<T><<<m->batch_size, kCUDANumThreads, 0, stream>>>(
-      m->in_dim,
-      input_ptr,
-      static_cast<T *>(m->rms_ptr),
-      static_cast<T *>(m->norm_ptr));
-  elewise_apply_weights<<<GET_BLOCKS(parallelism),
-                          min(CUDA_NUM_THREADS, parallelism),
-                          0,
-                          stream>>>(m->batch_size,
-                                    m->in_dim,
-                                    static_cast<T *>(m->norm_ptr),
-                                    weight_ptr,
-                                    output_ptr);
+
+  std::pair<int, int> kernel1_parallelism =
+      std::make_pair(m->batch_size, kCUDABlockReduceNumThreads);
+  std::pair<int, int> kernel2_parallelism =
+      std::make_pair(m->batch_size, kCUDANumThreads);
+
+  int num_blocks =
+      std::max(kernel1_parallelism.first, kernel2_parallelism.first);
+  int num_threads =
+      std::max(kernel1_parallelism.second, kernel2_parallelism.second);
+
+  RMSNormFusedForwardKernel<T>
+      <<<num_blocks, num_threads, 0, stream>>>(m->in_dim,
+                                               m->eps,
+                                               input_ptr,
+                                               static_cast<T *>(m->rms_ptr),
+                                               static_cast<T *>(m->norm_ptr),
+                                               weight_ptr,
+                                               output_ptr);
 }
 
 void forward_kernel_wrapper(RMSNormMeta const *m,
diff --git a/src/ops/layer_norm.cu b/src/ops/layer_norm.cu
index 202a8837ff..4d04710b2a 100644
--- a/src/ops/layer_norm.cu
+++ b/src/ops/layer_norm.cu
@@ -88,7 +88,7 @@ __inline__ __device__ T BlockReduceSum(T val, T *shared) {
     shared[wid] = val;
   }
   __syncthreads();
-  val = (threadIdx.x < blockDim.x / C10_WARP_SIZE) ? shared[lid] : 0;
+  val = (threadIdx.x < (blockDim.x / C10_WARP_SIZE)) ? shared[lid] : T(0);
   if (wid == 0) {
     val = WarpReduceSum(val);
   }
@@ -105,9 +105,9 @@ __inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
     shared[wid] = val;
   }
   __syncthreads();
-  val = (threadIdx.x < min(blockDim.x, max_num_threads) / C10_WARP_SIZE)
+  val = (threadIdx.x < (min(blockDim.x, max_num_threads) / C10_WARP_SIZE))
             ? shared[lid]
-            : 0;
+            : T(0);
   if (wid == 0) {
     val = WarpReduceSum(val);
   }
diff --git a/src/ops/residual_rms_norm.cc b/src/ops/residual_rms_norm.cc
new file mode 100644
index 0000000000..3efb7274a0
--- /dev/null
+++ b/src/ops/residual_rms_norm.cc
@@ -0,0 +1,505 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/residual_rms_norm.h"
+#include "flexflow/model.h"
+#include "flexflow/ops/kernels/residual_rms_norm_kernels.h"
+#include "flexflow/utils/hash_utils.h"
+#include "legion/legion_utilities.h"
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::ArgumentMap;
+using Legion::Context;
+using Legion::Domain;
+using Legion::FutureMap;
+using Legion::IndexLauncher;
+using Legion::Machine;
+using Legion::Memory;
+using Legion::PhysicalRegion;
+using Legion::Predicate;
+using Legion::Rect;
+using Legion::RegionRequirement;
+using Legion::Runtime;
+using Legion::Task;
+using Legion::TaskArgument;
+using Legion::TaskLauncher;
+
+using namespace FlexFlow::Kernels::ResidualRMSNorm;
+
+bool operator==(ResidualRMSNormParams const &lhs,
+                ResidualRMSNormParams const &rhs) {
+  return lhs.layer_guid == rhs.layer_guid && lhs.eps == rhs.eps;
+}
+
+bool ResidualRMSNormParams::is_valid(
+    std::pair<ParallelTensorShape, ParallelTensorShape> const &input) const {
+  return input.first.is_valid() && input.second.is_valid();
+}
+
+ResidualRMSNormParams ResidualRMSNorm::get_params() const {
+  ResidualRMSNormParams params;
+  params.layer_guid = this->layer_guid;
+  params.eps = this->eps;
+  params.dim = this->dim;
+  return params;
+}
+
+void FFModel::residual_rms_norm(const Tensor input1,
+                                const Tensor input2,
+                                Tensor *outputs,
+                                float eps,
+                                int dim,
+                                DataType data_type,
+                                char const *name) {
+  if (data_type == DT_NONE) {
+    data_type = input1->data_type;
+  }
+  Tensor casted_input1 =
+      (data_type != input1->data_type)
+          ? cast(input1, data_type, "type cast for residual_rms_norm")
+          : input1;
+  Tensor casted_input2 =
+      (data_type != input2->data_type)
+          ? cast(input2, data_type, "type cast for residual_rms_norm")
+          : input2;
+  Layer *rm = new Layer(this,
+                        OP_RESIDUAL_RMS_NORM,
+                        data_type,
+                        name,
+                        2 /*inputs*/,
+                        1 /*weights*/,
+                        2 /*outputs*/,
+                        casted_input1,
+                        casted_input2);
+
+  rm->outputs[0] = create_tensor_legion_ordering(
+      input1->num_dims, input1->dims, data_type, rm, 0, false /*create_grad*/);
+  rm->outputs[1] = create_tensor_legion_ordering(
+      input1->num_dims, input1->dims, data_type, rm, 1, false /*create_grad*/);
+
+  // weights
+  int weight_dims[1] = {dim};
+  rm->weights[0] = create_weight_legion_ordering(1,
+                                                 weight_dims,
+                                                 data_type,
+                                                 rm,
+                                                 true /*create_grad*/,
+                                                 nullptr,
+                                                 CHOSEN_SYNC_TYPE);
+
+  rm->add_float_property("eps", eps);
+  rm->add_int_property("dim", dim);
+  layers.push_back(rm);
+  outputs[0] = rm->outputs[0];
+  outputs[1] = rm->outputs[1];
+}
+
+Op *ResidualRMSNorm::create_operator_from_layer(
+    FFModel &model,
+    Layer const *layer,
+    std::vector<ParallelTensor> const &inputs) {
+  float eps;
+  layer->get_float_property("eps", eps);
+  long long value;
+  layer->get_int_property("dim", value);
+  int dim = value;
+
+  return new ResidualRMSNorm(model,
+                             layer->layer_guid,
+                             inputs[0],
+                             inputs[1],
+                             eps,
+                             dim,
+                             false,
+                             layer->name);
+}
+
+ResidualRMSNorm::ResidualRMSNorm(
+    FFModel &model,
+    ResidualRMSNormParams const &params,
+    std::pair<ParallelTensor, ParallelTensor> const &inputs,
+    bool allocate_weights = false,
+    char const *name)
+    : ResidualRMSNorm(model,
+                      params.layer_guid,
+                      inputs.first,
+                      inputs.second,
+                      params.eps,
+                      params.dim,
+                      allocate_weights,
+                      name) {}
+
+ResidualRMSNorm::ResidualRMSNorm(
+    FFModel &model,
+    ResidualRMSNorm const &other,
+    std::pair<ParallelTensor, ParallelTensor> const &inputs,
+    bool allocate_weights)
+    : ResidualRMSNorm(model,
+                      other.layer_guid,
+                      inputs.first,
+                      inputs.second,
+                      other.eps,
+                      other.dim,
+                      allocate_weights,
+                      other.name) {}
+ResidualRMSNorm::ResidualRMSNorm(FFModel &model,
+                                 LayerID const &_layer_guid,
+                                 const ParallelTensor _input1,
+                                 const ParallelTensor _input2,
+                                 float _eps,
+                                 int dim,
+                                 bool allocate_weights,
+                                 char const *name)
+    : Op(model,
+         OP_RESIDUAL_RMS_NORM,
+         _input1->data_type,
+         name,
+         2 /*num of inputs tensor */,
+         1 /*num of weights tensor */,
+         2 /*num of outputs tensor */,
+         _input1,
+         _input2) {
+  eps = _eps;
+  inputs[0] = _input1;
+  inputs[1] = _input2;
+  layer_guid = _layer_guid;
+  int num_dims = _input1->num_dims;
+  this->dim = dim;
+  data_dim = _input1->dims[0].size;
+  effective_batch_size = 1;
+  for (int i = 1; i <= num_dims - 2; i++) {
+    effective_batch_size *= _input1->dims[i].size;
+  }
+  // Currently assert that all non-replica dims are not parallelized
+  // We only support parallelism along the replica dim now
+  for (int i = 0; i < _input1->num_dims - 1; i++) {
+    assert(_input1->dims[i].degree == 1);
+  }
+  // Check that the two inputs have the same dimensions
+  for (int i = 0; i < _input1->num_dims; i++) {
+    assert(_input2->dims[i] == _input1->dims[i]);
+  }
+  // output has the same parallel dims as input
+  ParallelDim output_dims[MAX_TENSOR_DIM];
+  for (int i = 0; i < _input1->num_dims; i++) {
+    output_dims[i] = _input1->dims[i];
+  }
+  outputs[0] = model.create_parallel_tensor_legion_ordering(_input1->num_dims,
+                                                            output_dims,
+                                                            _input1->data_type,
+                                                            this,
+                                                            0 /*owner_idx*/);
+  outputs[1] = model.create_parallel_tensor_legion_ordering(_input1->num_dims,
+                                                            output_dims,
+                                                            _input1->data_type,
+                                                            this,
+                                                            1 /*owner_idx*/);
+
+  if (allocate_weights) {
+    // weights should have the shape of (data_dim, data_dim)
+    ParallelDim new_weight_dims[MAX_TENSOR_DIM];
+
+    new_weight_dims[0].size = dim;
+    new_weight_dims[0].degree = 1;
+    new_weight_dims[0].parallel_idx = -1;
+    new_weight_dims[1] = _input1->dims[_input1->num_dims - 1]; // replica dim
+
+    // weights
+    Initializer *kernel_initializer = new GlorotUniform(std::rand() /*seed*/);
+    weights[0] =
+        model.create_parallel_weight_legion_ordering(2,
+                                                     new_weight_dims,
+                                                     _input1->data_type,
+                                                     nullptr /*owner_op*/,
+                                                     false /*create_grad*/,
+                                                     kernel_initializer,
+                                                     CHOSEN_SYNC_TYPE);
+  }
+}
+
+void ResidualRMSNorm::init(FFModel const &ff) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(RESIDUAL_RMSNORM_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(ResidualRMSNorm)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[1]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[1]->region));
+  launcher.add_field(3, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(4, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
+void ResidualRMSNorm::init_inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
+
+  IndexLauncher launcher(RESIDUAL_RMSNORM_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(ResidualRMSNorm)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[1]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[1]->region));
+  launcher.add_field(3, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(4, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
+}
+
+OpMeta *ResidualRMSNorm::init_task(Task const *task,
+                                   std::vector<PhysicalRegion> const &regions,
+                                   Context ctx,
+                                   Runtime *runtime) {
+  ResidualRMSNorm *rn = (ResidualRMSNorm *)task->args;
+  FFHandler handle = *((FFHandler const *)task->local_args);
+  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                       .only_kind(Memory::GPU_FB_MEM)
+                       .best_affinity_to(task->target_proc)
+                       .first();
+  MemoryAllocator gpu_mem_allocator(gpu_mem);
+  ResidualRMSNormMeta *meta =
+      new ResidualRMSNormMeta(handle, rn, gpu_mem_allocator);
+  return meta;
+}
+
+void ResidualRMSNorm::forward(FFModel const &ff) {
+  assert(false);
+}
+
+FutureMap
+    ResidualRMSNorm::inference(FFModel const &ff,
+                               BatchConfigFuture const &bc,
+                               std::vector<ParallelTensor> const &batch_inputs,
+                               std::vector<ParallelTensor> const &batch_outputs,
+                               MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+
+  IndexLauncher launcher(RESIDUAL_RMSNORM_INF_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[1]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[1]->region));
+  launcher.add_field(3, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(4, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+/*
+  regions[0](I): input1
+  regions[1](I): input2
+  regions[2](O): residual output
+  regions[3](O): output
+  regions[4](I/O): weight
+*/
+void ResidualRMSNorm::inference_task(Task const *task,
+                                     std::vector<PhysicalRegion> const &regions,
+                                     Context ctx,
+                                     Runtime *runtime) {
+  assert(task->regions.size() == 5);
+  assert(regions.size() == 5);
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_tokens == 0) {
+    return;
+  }
+  ResidualRMSNormMeta const *m = *((ResidualRMSNormMeta **)task->local_args);
+  GenericTensorAccessorR input1 = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR input2 = helperGetGenericTensorAccessorRO(
+      m->input_type[1], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW residual_output = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type[1], regions[3], task->regions[3], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
+      m->weight_type[0], regions[4], task->regions[4], FID_DATA, ctx, runtime);
+  forward_kernel_wrapper(m, input1, input2, weight, residual_output, output);
+}
+
+void ResidualRMSNorm::serialize(Legion::Serializer &sez) const {
+  sez.serialize(this->layer_guid.id);
+  sez.serialize(this->layer_guid.transformer_layer_id);
+  sez.serialize(this->eps);
+  sez.serialize(this->dim);
+}
+
+using PCG::Node;
+/*static*/
+Node ResidualRMSNorm::deserialize(FFModel &ff,
+                                  Legion::Deserializer &dez,
+                                  ParallelTensor inputs[],
+                                  int num_inputs) {
+  assert(num_inputs == 2);
+  float eps;
+  size_t id, transformer_layer_id;
+  int dim;
+  dez.deserialize(id);
+  dez.deserialize(transformer_layer_id);
+
+  LayerID layer_guid(id, transformer_layer_id);
+  dez.deserialize(eps);
+  dez.deserialize(dim);
+  ResidualRMSNormParams params;
+  params.layer_guid = layer_guid;
+  params.eps = eps;
+  params.dim = dim;
+  return ff.get_or_create_node<ResidualRMSNorm>({inputs[0], inputs[1]}, params);
+}
+
+void ResidualRMSNorm::backward(FFModel const &ff) {
+  assert(false);
+}
+Op *ResidualRMSNorm::materialize(FFModel &ff,
+                                 ParallelTensor inputs[],
+                                 int num_inputs) const {
+  ResidualRMSNormParams params = get_params();
+  return new ResidualRMSNorm(
+      ff, params, {inputs[0], inputs[1]}, true, this->name);
+}
+
+bool ResidualRMSNorm::measure_operator_cost(Simulator *sim,
+                                            MachineView const &mv,
+                                            CostMetrics &cost_metrics) const {
+  return false;
+}
+
+} // namespace FlexFlow
+namespace std {
+size_t hash<FlexFlow::ResidualRMSNormParams>::operator()(
+    FlexFlow::ResidualRMSNormParams const &params) const {
+  size_t key = 0;
+  hash_combine(key, params.eps);
+  hash_combine(key, params.layer_guid.id);
+  hash_combine(key, params.dim);
+  return key;
+}
+}; // namespace std
diff --git a/src/ops/rms_norm.cc b/src/ops/rms_norm.cc
index c3a4e9b58c..5b1634472d 100644
--- a/src/ops/rms_norm.cc
+++ b/src/ops/rms_norm.cc
@@ -208,7 +208,7 @@ void RMSNorm::init(FFModel const &ff) {
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
   set_argumentmap_for_init(ff, argmap);
-  IndexLauncher launcher(RMSNROM_INIT_TASK_ID,
+  IndexLauncher launcher(RMSNORM_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(RMSNorm)),
                          argmap,
@@ -253,7 +253,7 @@ void RMSNorm::init_inference(FFModel const &ff,
   size_t machine_view_hash = view->hash();
   set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
 
-  IndexLauncher launcher(RMSNROM_INIT_TASK_ID,
+  IndexLauncher launcher(RMSNORM_INIT_TASK_ID,
                          parallel_is,
                          TaskArgument(this, sizeof(RMSNorm)),
                          argmap,
@@ -305,7 +305,7 @@ void RMSNorm::forward(FFModel const &ff) {
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
   set_argumentmap_for_forward(ff, argmap);
-  IndexLauncher launcher(RMSNROM_FWD_TASK_ID,
+  IndexLauncher launcher(RMSNORM_FWD_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
                          argmap,
@@ -347,7 +347,7 @@ FutureMap RMSNorm::inference(FFModel const &ff,
   set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
 
-  IndexLauncher launcher(RMSNROM_INF_TASK_ID,
+  IndexLauncher launcher(RMSNORM_INF_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
                          argmap,
diff --git a/src/ops/sampling.cpp b/src/ops/sampling.cpp
index f76acc8e71..3d8f103524 100644
--- a/src/ops/sampling.cpp
+++ b/src/ops/sampling.cpp
@@ -173,7 +173,7 @@ void Sampling::forward_kernel_wrapper(SamplingMeta const *m,
     checkCUDA(hipEventRecord(t_start, stream));
   }
 
-  handle_unimplemented_hip_kernel(OP_RMS_NORM);
+  handle_unimplemented_hip_kernel(OP_SAMPLING);
 
   if (m->profiling) {
     checkCUDA(hipEventRecord(t_end, stream));
diff --git a/src/ops/sigmoid_silu_multi.cc b/src/ops/sigmoid_silu_multi.cc
new file mode 100644
index 0000000000..031c7833a4
--- /dev/null
+++ b/src/ops/sigmoid_silu_multi.cc
@@ -0,0 +1,390 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/sigmoid_silu_multi.h"
+#include "flexflow/model.h"
+#include "flexflow/utils/hash_utils.h"
+#include "legion/legion_utilities.h"
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::ArgumentMap;
+using Legion::Context;
+using Legion::coord_t;
+using Legion::Domain;
+using Legion::FutureMap;
+using Legion::IndexLauncher;
+using Legion::InlineLauncher;
+using Legion::Machine;
+using Legion::Memory;
+using Legion::PhysicalRegion;
+using Legion::Predicate;
+using Legion::Rect;
+using Legion::RegionRequirement;
+using Legion::Runtime;
+using Legion::Task;
+using Legion::TaskArgument;
+using Legion::TaskLauncher;
+
+bool operator==(SigmoidSiluMultiParams const &lhs,
+                SigmoidSiluMultiParams const &rhs) {
+  return lhs.layer_guid == rhs.layer_guid;
+}
+
+bool SigmoidSiluMultiParams::is_valid(
+    std::pair<ParallelTensorShape, ParallelTensorShape> const &input) const {
+  return input.first.is_valid() && input.second.is_valid();
+}
+
+SigmoidSiluMultiParams SigmoidSiluMulti::get_params() const {
+  SigmoidSiluMultiParams params;
+  params.layer_guid = this->layer_guid;
+  return params;
+}
+
+Tensor FFModel::sigmoid_silu_multi(const Tensor input1,
+                                   const Tensor input2,
+                                   DataType data_type,
+                                   char const *name) {
+
+  // Check dims
+  assert(input1->num_dims == input2->num_dims);
+  for (int i = 0; i < input1->num_dims; i++) {
+    assert(input1->dims[i] == input2->dims[i]);
+  }
+  // Tensor Data type
+  if (data_type == DT_NONE) {
+    data_type = input1->data_type;
+    assert(input2->data_type == input1->data_type);
+  }
+  Tensor casted_input1 =
+      (data_type != input1->data_type)
+          ? cast(input1, data_type, "type cast for sigmoid_silu_multi")
+          : input1;
+  Tensor casted_input2 =
+      (data_type != input2->data_type)
+          ? cast(input2, data_type, "type cast for sigmoid_silu_multi")
+          : input2;
+
+  // Create layer
+  Layer *ssm = new Layer(this,
+                         OP_SIGMOID_SILU_MULTI,
+                         data_type,
+                         name,
+                         2 /*inputs*/,
+                         0 /*weights*/,
+                         1 /*outputs*/,
+                         casted_input1,
+                         casted_input2);
+  ssm->outputs[0] = create_tensor_legion_ordering(
+      input1->num_dims, input1->dims, data_type, ssm, 0, false /*create_grad*/);
+  layers.push_back(ssm);
+  return ssm->outputs[0];
+}
+
+Op *SigmoidSiluMulti::create_operator_from_layer(
+    FFModel &model,
+    Layer const *layer,
+    std::vector<ParallelTensor> const &inputs) {
+
+  return new SigmoidSiluMulti(
+      model, layer->layer_guid, inputs[0], inputs[1], layer->name);
+}
+
+SigmoidSiluMulti::SigmoidSiluMulti(
+    FFModel &model,
+    SigmoidSiluMultiParams const &params,
+    std::pair<ParallelTensor, ParallelTensor> const &inputs,
+    char const *name)
+    : SigmoidSiluMulti(
+          model, params.layer_guid, inputs.first, inputs.second, name) {}
+
+SigmoidSiluMulti::SigmoidSiluMulti(FFModel &model,
+                                   LayerID const &_layer_guid,
+                                   const ParallelTensor _input1,
+                                   const ParallelTensor _input2,
+                                   char const *name)
+    : Op(model,
+         OP_SIGMOID_SILU_MULTI,
+         _input1->data_type,
+         name,
+         2 /*inputs*/,
+         0 /*weights*/,
+         1 /*outputs*/,
+         _input1,
+         _input2) {
+  // overwrite layer_guid
+  layer_guid = _layer_guid;
+  outputs[0] = model.create_parallel_tensor_legion_ordering(_input1->num_dims,
+                                                            _input1->dims,
+                                                            _input1->data_type,
+                                                            this,
+                                                            0 /*owner_idx*/);
+}
+
+void SigmoidSiluMulti::init_inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher launcher(SIGMOID_SILU_MULTI_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(SigmoidSiluMulti)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  // input 1
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  // input 2
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[1]->region));
+  launcher.add_field(1, FID_DATA);
+  // output
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
+}
+
+void SigmoidSiluMulti::init(FFModel const &ff) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(SIGMOID_SILU_MULTI_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(SigmoidSiluMulti)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  // input 1
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  // input 2
+  launcher.add_region_requirement(RegionRequirement(inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[1]->region));
+  launcher.add_field(1, FID_DATA);
+  // output
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
+/*
+  regions[0](I): input 1
+  regions[1](I): input 2
+  regions[2](O): output
+*/
+OpMeta *SigmoidSiluMulti::init_task(Task const *task,
+                                    std::vector<PhysicalRegion> const &regions,
+                                    Context ctx,
+                                    Runtime *runtime) {
+  SigmoidSiluMulti *ssm = (SigmoidSiluMulti *)task->args;
+  FFHandler handle = *((FFHandler const *)task->local_args);
+  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                       .only_kind(Memory::GPU_FB_MEM)
+                       .best_affinity_to(task->target_proc)
+                       .first();
+  MemoryAllocator gpu_mem_allocator(gpu_mem);
+  SigmoidSiluMultiMeta *meta =
+      new SigmoidSiluMultiMeta(handle, ssm, gpu_mem_allocator);
+  meta->input_type[0] = ssm->inputs[0]->data_type;
+  meta->input_type[1] = ssm->inputs[1]->data_type;
+  meta->output_type[0] = ssm->outputs[0]->data_type;
+  return meta;
+}
+
+void SigmoidSiluMulti::forward(FFModel const &ff) {
+  assert(false);
+}
+
+void SigmoidSiluMulti::backward(FFModel const &ff) {
+  assert(false);
+}
+
+FutureMap SigmoidSiluMulti::inference(
+    FFModel const &ff,
+    BatchConfigFuture const &bc,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+  /* std::cout << "SigmoidSiluMulti op machine_view: " << *(MachineView
+     const *)mv
+            << std::endl; */
+  IndexLauncher launcher(SIGMOID_SILU_MULTI_INF_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
+  // input 1
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  // input 2
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[1]->region));
+  launcher.add_field(1, FID_DATA);
+  // output
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+/*
+  regions[0](I): input 1
+  regions[1](I): input 2
+  regions[2](O): output
+*/
+void SigmoidSiluMulti::inference_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+
+  assert(task->regions.size() == regions.size());
+  assert(regions.size() == 3);
+
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_tokens == 0) {
+    return;
+  }
+
+  SigmoidSiluMultiMeta const *m = *((SigmoidSiluMultiMeta **)task->local_args);
+
+  GenericTensorAccessorR input1 = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR input2 = helperGetGenericTensorAccessorRO(
+      m->input_type[1], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+
+  Domain input1_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  Domain input2_domain = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+  Domain output_domain = runtime->get_index_space_domain(
+      ctx, task->regions[2].region.get_index_space());
+
+  assert(input1_domain.get_volume() == input2_domain.get_volume());
+  assert(input1_domain.get_volume() == output_domain.get_volume());
+
+  assert(input1_domain == input2_domain);
+  assert(input1_domain == output_domain);
+
+  SigmoidSiluMulti::inference_kernel_wrapper(m, input1, input2, output);
+}
+
+bool SigmoidSiluMulti::measure_operator_cost(Simulator *sim,
+                                             MachineView const &mv,
+                                             CostMetrics &cost_metrics) const {
+  return false;
+}
+
+void SigmoidSiluMulti::serialize(Legion::Serializer &sez) const {
+  sez.serialize(this->layer_guid.id);
+  sez.serialize(this->layer_guid.transformer_layer_id);
+}
+
+using PCG::Node;
+/*static*/
+Node SigmoidSiluMulti::deserialize(FFModel &ff,
+                                   Legion::Deserializer &dez,
+                                   ParallelTensor inputs[],
+                                   int num_inputs) {
+  assert(num_inputs == 2);
+  size_t id, transformer_layer_id;
+  dez.deserialize(id);
+  dez.deserialize(transformer_layer_id);
+  LayerID layer_guid(id, transformer_layer_id);
+
+  SigmoidSiluMultiParams params;
+  params.layer_guid = layer_guid;
+  return ff.get_or_create_node<SigmoidSiluMulti>({inputs[0], inputs[1]},
+                                                 params);
+}
+
+}; // namespace FlexFlow
+
+namespace std {
+size_t hash<FlexFlow::SigmoidSiluMultiParams>::operator()(
+    FlexFlow::SigmoidSiluMultiParams const &params) const {
+  size_t key = 0;
+  hash_combine(key, params.layer_guid.id);
+  hash_combine(key, params.layer_guid.transformer_layer_id);
+  return key;
+}
+}; // namespace std
diff --git a/src/ops/sigmoid_silu_multi.cpp b/src/ops/sigmoid_silu_multi.cpp
new file mode 100644
index 0000000000..fa73a55722
--- /dev/null
+++ b/src/ops/sigmoid_silu_multi.cpp
@@ -0,0 +1,118 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/sigmoid_silu_multi.h"
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/utils/hip_helper.h"
+#include <hip/hip_runtime.h>
+
+namespace FlexFlow {
+
+SigmoidSiluMultiMeta::SigmoidSiluMultiMeta(FFHandler handle,
+                                           SigmoidSiluMulti const *ssm,
+                                           MemoryAllocator &gpu_mem_allocator)
+    : OpMeta(handle) {
+  profiling = ssm->profiling;
+}
+
+SigmoidSiluMultiMeta::~SigmoidSiluMultiMeta(void) {
+  if (reserveInst != Realm::RegionInstance::NO_INST) {
+    reserveInst.destroy();
+  }
+}
+
+__device__ __forceinline__ float sigmoid_float(float x) {
+  return 1.0 / (1.0 + expf(-x));
+}
+
+__device__ __forceinline__ half sigmoid_half(half x) {
+  return (half)1.0 / ((half)1.0 + hexp(-x));
+}
+
+__global__ void SigmoidSiluMultiKernelFloat(int num_elements,
+                                            float const *input1_ptr,
+                                            float const *input2_ptr,
+                                            float *output_ptr) {
+  CUDA_KERNEL_LOOP(i, num_elements) {
+    output_ptr[i] =
+        input1_ptr[i] * sigmoid_float(input1_ptr[i]) * input2_ptr[i];
+  }
+}
+
+__global__ void SigmoidSiluMultiKernelHalf(int num_elements,
+                                           half const *input1_ptr,
+                                           half const *input2_ptr,
+                                           half *output_ptr) {
+  CUDA_KERNEL_LOOP(i, num_elements) {
+    output_ptr[i] = input1_ptr[i] * sigmoid_half(input1_ptr[i]) * input2_ptr[i];
+  }
+}
+
+/*static*/
+void SigmoidSiluMulti::inference_kernel_wrapper(
+    SigmoidSiluMultiMeta const *m,
+    GenericTensorAccessorR const &input1,
+    GenericTensorAccessorR const &input2,
+    GenericTensorAccessorW const &output) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  int num_elements = input1.domain.get_volume();
+  assert(input2.domain.get_volume() == num_elements);
+  assert(output.domain.get_volume() == num_elements);
+
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+
+  if (m->input_type[0] == DT_FLOAT) {
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(SigmoidSiluMultiKernelFloat),
+                       GET_BLOCKS(num_elements),
+                       min(CUDA_NUM_THREADS, num_elements),
+                       0,
+                       stream,
+                       input1.domain.get_volume(),
+                       input1.get_float_ptr(),
+                       input2.get_float_ptr(),
+                       output.get_float_ptr());
+  } else if (m->input_type[0] == DT_HALF) {
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(SigmoidSiluMultiKernelHalf),
+                       GET_BLOCKS(num_elements),
+                       min(CUDA_NUM_THREADS, num_elements),
+                       0,
+                       stream,
+                       input1.domain.get_volume(),
+                       input1.get_half_ptr(),
+                       input2.get_half_ptr(),
+                       output.get_half_ptr());
+  } else {
+    assert(false && "unsupport datatype in SigmoidSiluMulti");
+  }
+
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("[SigmoidSiluMulti] forward time (CF) = %.9fms\n", elapsed);
+  }
+}
+
+}; // namespace FlexFlow
diff --git a/src/ops/sigmoid_silu_multi.cu b/src/ops/sigmoid_silu_multi.cu
new file mode 100644
index 0000000000..fd69f6a8aa
--- /dev/null
+++ b/src/ops/sigmoid_silu_multi.cu
@@ -0,0 +1,97 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/ops/sigmoid_silu_multi.h"
+#include "flexflow/utils/cuda_helper.h"
+
+namespace FlexFlow {
+
+SigmoidSiluMultiMeta::SigmoidSiluMultiMeta(FFHandler handle,
+                                           SigmoidSiluMulti const *ssm,
+                                           MemoryAllocator &gpu_mem_allocator)
+    : OpMeta(handle) {
+  profiling = ssm->profiling;
+}
+
+SigmoidSiluMultiMeta::~SigmoidSiluMultiMeta(void) {
+  if (reserveInst != Realm::RegionInstance::NO_INST) {
+    reserveInst.destroy();
+  }
+}
+
+template <typename T>
+__global__ void SigmoidSiluMultiKernel(int num_elements,
+                                       T const *input1_ptr,
+                                       T const *input2_ptr,
+                                       T *output_ptr) {
+  CUDA_KERNEL_LOOP(i, num_elements) {
+    float sigmoid_val = static_cast<float>(input1_ptr[i]);
+    sigmoid_val = 1.0f / (1.0f + exp(-sigmoid_val));
+    output_ptr[i] = input1_ptr[i] * T(sigmoid_val) * input2_ptr[i];
+  }
+}
+
+/*static*/
+void SigmoidSiluMulti::inference_kernel_wrapper(
+    SigmoidSiluMultiMeta const *m,
+    GenericTensorAccessorR const &input1,
+    GenericTensorAccessorR const &input2,
+    GenericTensorAccessorW const &output) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  int num_elements = input1.domain.get_volume();
+  assert(input2.domain.get_volume() == num_elements);
+  assert(output.domain.get_volume() == num_elements);
+
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+  if (m->input_type[0] == DT_FLOAT) {
+    SigmoidSiluMultiKernel<<<GET_BLOCKS(num_elements),
+                             min(CUDA_NUM_THREADS, num_elements),
+                             0,
+                             stream>>>(input1.domain.get_volume(),
+                                       input1.get_float_ptr(),
+                                       input2.get_float_ptr(),
+                                       output.get_float_ptr());
+  } else if (m->input_type[0] == DT_HALF) {
+    SigmoidSiluMultiKernel<<<GET_BLOCKS(num_elements),
+                             min(CUDA_NUM_THREADS, num_elements),
+                             0,
+                             stream>>>(input1.domain.get_volume(),
+                                       input1.get_half_ptr(),
+                                       input2.get_half_ptr(),
+                                       output.get_half_ptr());
+  } else {
+    assert(false && "unsupport datatype in SigmoidSiluMulti");
+  }
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[SigmoidSiluMulti] forward time (CF) = %.9fms\n", elapsed);
+  }
+}
+
+}; // namespace FlexFlow
diff --git a/src/runtime/ffconst_utils.cc b/src/runtime/ffconst_utils.cc
index 2b1910637f..91b21e8d8f 100644
--- a/src/runtime/ffconst_utils.cc
+++ b/src/runtime/ffconst_utils.cc
@@ -172,8 +172,12 @@ std::string get_operator_type_name(OperatorType type) {
       return "LayerNorm";
     case OP_ADD_BIAS_RESIDUAL_LAYERNORM:
       return "AddBiasResidualLayerNorm";
+    case OP_SIGMOID_SILU_MULTI:
+      return "SigmoidSiluMulti";
     case OP_RMS_NORM:
       return "RMSNorm";
+    case OP_RESIDUAL_RMS_NORM:
+      return "ResidualRMSNorm";
     case OP_GELU:
       return "GELU";
     case OP_IDENTITY:
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index 5a5e267d96..037be739e7 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -40,8 +40,10 @@
 #include "flexflow/ops/pool_2d.h"
 #include "flexflow/ops/reduce.h"
 #include "flexflow/ops/reshape.h"
+#include "flexflow/ops/residual_rms_norm.h"
 #include "flexflow/ops/rms_norm.h"
 #include "flexflow/ops/sampling.h"
+#include "flexflow/ops/sigmoid_silu_multi.h"
 #include "flexflow/ops/softmax.h"
 #include "flexflow/ops/spec_inc_multihead_self_attention.h"
 #include "flexflow/ops/split.h"
@@ -2707,6 +2709,10 @@ void FFModel::deserialize_graph_optimal_view(
             *this, dez, inputs, num_inputs);
         break;
       }
+      case OP_SIGMOID_SILU_MULTI: {
+        node = SigmoidSiluMulti::deserialize(*this, dez, inputs, num_inputs);
+        break;
+      }
       case OP_LINEAR: {
         node = Linear::deserialize(*this, dez, inputs, num_inputs);
         break;
@@ -2960,6 +2966,10 @@ void FFModel::deserialize_graph_optimal_view(
         node = RMSNorm::deserialize(*this, dez, inputs, num_inputs);
         break;
       }
+      case OP_RESIDUAL_RMS_NORM: {
+        node = ResidualRMSNorm::deserialize(*this, dez, inputs, num_inputs);
+        break;
+      }
       case OP_COMBINE: {
         assert(num_inputs == 1);
         int combine_dim, combine_degree;
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 4f8caaa570..0cb50733a3 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -51,9 +51,11 @@
 #include "flexflow/ops/pool_2d.h"
 #include "flexflow/ops/reduce.h"
 #include "flexflow/ops/reshape.h"
+#include "flexflow/ops/residual_rms_norm.h"
 #include "flexflow/ops/reverse.h"
 #include "flexflow/ops/rms_norm.h"
 #include "flexflow/ops/sampling.h"
+#include "flexflow/ops/sigmoid_silu_multi.h"
 #include "flexflow/ops/softmax.h"
 #include "flexflow/ops/spec_inc_multihead_self_attention.h"
 #include "flexflow/ops/split.h"
@@ -3107,11 +3109,23 @@ Op *FFModel::create_operator_from_layer(
       operators.push_back(op);
       return op;
     }
+    case OP_SIGMOID_SILU_MULTI: {
+      Op *op =
+          SigmoidSiluMulti::create_operator_from_layer(*this, layer, inputs);
+      operators.push_back(op);
+      return op;
+    }
     case OP_RMS_NORM: {
       Op *op = RMSNorm::create_operator_from_layer(*this, layer, inputs);
       operators.push_back(op);
       return op;
     }
+    case OP_RESIDUAL_RMS_NORM: {
+      Op *op =
+          ResidualRMSNorm::create_operator_from_layer(*this, layer, inputs);
+      operators.push_back(op);
+      return op;
+    }
     case OP_LINEAR: {
       Op *op = Linear::create_operator_from_layer(*this, layer, inputs);
       operators.push_back(op);
@@ -3247,74 +3261,24 @@ void FFModel::create_operators_from_layers() {
                 (l->op_type == OP_LINEAR && layer_idx >= 2 &&
                  layers[layer_idx - 1]->op_type == OP_GELU &&
                  layers[layer_idx - 2]->op_type == OP_LINEAR) ||
+                // LLAMA without element-wise operator fusion
                 (l->op_type == OP_LINEAR && layer_idx >= 5 &&
                  layers[layer_idx - 1]->op_type == OP_EW_MUL &&
                  layers[layer_idx - 2]->op_type == OP_EW_MUL &&
                  layers[layer_idx - 3]->op_type == OP_SIGMOID &&
                  layers[layer_idx - 4]->op_type == OP_LINEAR &&
-                 layers[layer_idx - 5]->op_type == OP_LINEAR))) {
+                 layers[layer_idx - 5]->op_type == OP_LINEAR) ||
+                // LLAMA with element-wise operator fusion
+                (l->op_type == OP_LINEAR && layer_idx >= 3 &&
+                 layers[layer_idx - 1]->op_type == OP_SIGMOID_SILU_MULTI &&
+                 layers[layer_idx - 2]->op_type == OP_LINEAR &&
+                 layers[layer_idx - 3]->op_type == OP_LINEAR))) {
       assert(op->numOutputs == 1);
       AllReduce *allreduce =
           new AllReduce(*this, op->outputs[0], op->outputs[0]->num_dims - 1);
       operators.push_back(allreduce);
       op = allreduce;
     }
-#ifdef DEADCODE
-    if (config.computationMode == COMP_MODE_INFERENCE &&
-        config.tensor_parallelism_degree > 1 &&
-        (l->op_type == OP_INC_MULTIHEAD_SELF_ATTENTION ||
-         l->op_type == OP_TREE_INC_MULTIHEAD_SELF_ATTENTION ||
-         (l->op_type == OP_LINEAR && layer_idx + 3 <= layers.size() &&
-          layers[layer_idx + 1]->op_type == OP_RELU &&
-          layers[layer_idx + 2]->op_type == OP_LINEAR) ||
-         (l->op_type == OP_LINEAR && layer_idx + 6 <= layers.size() &&
-          layers[layer_idx + 1]->op_type == OP_LINEAR &&
-          layers[layer_idx + 2]->op_type == OP_SIGMOID &&
-          layers[layer_idx + 3]->op_type == OP_EW_MUL &&
-          layers[layer_idx + 4]->op_type == OP_EW_MUL &&
-          layers[layer_idx + 5]->op_type == OP_LINEAR) ||
-         (l->op_type == OP_LINEAR && layer_idx + 5 <= layers.size() &&
-          layer_idx >= 1 && layers[layer_idx - 1]->op_type == OP_LINEAR &&
-          layers[layer_idx + 1]->op_type == OP_SIGMOID &&
-          layers[layer_idx + 2]->op_type == OP_EW_MUL &&
-          layers[layer_idx + 3]->op_type == OP_EW_MUL &&
-          layers[layer_idx + 4]->op_type == OP_LINEAR))) {
-      std::vector<ParallelTensor> partitioned_inputs;
-      assert(inputs.size() == 1);
-      Replicate *repl = new Replicate(*this,
-                                      inputs[0],
-                                      inputs[0]->num_dims - 1,
-                                      config.tensor_parallelism_degree);
-      partitioned_inputs.push_back(repl->outputs[0]);
-      operators.push_back(repl);
-      op = create_operator_from_layer(l, partitioned_inputs);
-    } else {
-      op = create_operator_from_layer(l, inputs);
-    }
-    // Op *op = create_operator_from_layer(l, inputs);
-    //  add reduce operators if needed
-    if (config.computationMode == COMP_MODE_INFERENCE &&
-        config.tensor_parallelism_degree > 1 &&
-        (l->op_type == OP_INC_MULTIHEAD_SELF_ATTENTION ||
-         l->op_type == OP_TREE_INC_MULTIHEAD_SELF_ATTENTION ||
-         (l->op_type == OP_LINEAR && layer_idx >= 2 &&
-          layers[layer_idx - 1]->op_type == OP_RELU &&
-          layers[layer_idx - 2]->op_type == OP_LINEAR) ||
-         (l->op_type == OP_LINEAR && layer_idx >= 5 &&
-          layers[layer_idx - 1]->op_type == OP_EW_MUL &&
-          layers[layer_idx - 2]->op_type == OP_EW_MUL &&
-          layers[layer_idx - 3]->op_type == OP_SIGMOID &&
-          layers[layer_idx - 4]->op_type == OP_LINEAR &&
-          layers[layer_idx - 5]->op_type == OP_LINEAR))) {
-      assert(op->numOutputs == 1);
-      Reduction *reduct = new Reduction(*this,
-                                        op->outputs[0],
-                                        op->outputs[0]->num_dims - 1,
-                                        config.tensor_parallelism_degree);
-      operators.push_back(reduct);
-      op = reduct;
-    }
-#endif
     assert(op->numOutputs == l->numOutputs);
     for (int i = 0; i < op->numOutputs; i++) {
       tensors_to_parallel_tensors[l->outputs[i]] = op->outputs[i];
@@ -5248,9 +5212,42 @@ void register_flexflow_internal_tasks(Runtime *runtime,
           registrar);
     }
   }
+  // SigmoidSiluMulti task
+  {
+    TaskVariantRegistrar registrar(SIGMOID_SILU_MULTI_INIT_TASK_ID,
+                                   "SigmoidSiluMulti Init");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<OpMeta *, SigmoidSiluMulti::init_task>(
+          registrar, "SigmoidSiluMulti Init Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<OpMeta *, SigmoidSiluMulti::init_task>(
+          registrar);
+    }
+  }
+  {
+    TaskVariantRegistrar registrar(SIGMOID_SILU_MULTI_INF_TASK_ID,
+                                   "SigmoidSiluMulti Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<SigmoidSiluMulti::inference_task>(
+          registrar, "SigmoidSiluMulti Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<SigmoidSiluMulti::inference_task>(
+          registrar);
+    }
+  }
   // rms norm task
   {
-    TaskVariantRegistrar registrar(RMSNROM_INIT_TASK_ID, "rmsnorm_init_task");
+    TaskVariantRegistrar registrar(RMSNORM_INIT_TASK_ID, "rmsnorm_init_task");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
     if (pre_register) {
@@ -5264,7 +5261,7 @@ void register_flexflow_internal_tasks(Runtime *runtime,
     }
   }
   {
-    TaskVariantRegistrar registrar(RMSNROM_FWD_TASK_ID, "rmsnorm_fwd_task");
+    TaskVariantRegistrar registrar(RMSNORM_FWD_TASK_ID, "rmsnorm_fwd_task");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
     if (pre_register) {
@@ -5278,7 +5275,7 @@ void register_flexflow_internal_tasks(Runtime *runtime,
     }
   }
   {
-    TaskVariantRegistrar registrar(RMSNROM_INF_TASK_ID, "RMS Norm Inference");
+    TaskVariantRegistrar registrar(RMSNORM_INF_TASK_ID, "RMS Norm Inference");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
     if (pre_register) {
@@ -5291,6 +5288,39 @@ void register_flexflow_internal_tasks(Runtime *runtime,
       runtime->register_task_variant<RMSNorm::inference_task>(registrar);
     }
   }
+  // rms norm task
+  {
+    TaskVariantRegistrar registrar(RESIDUAL_RMSNORM_INIT_TASK_ID,
+                                   "Residual RMS Norm Init");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<OpMeta *, ResidualRMSNorm::init_task>(
+          registrar, "Residual RMS Norm Init");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<OpMeta *, ResidualRMSNorm::init_task>(
+          registrar);
+    }
+  }
+  {
+    TaskVariantRegistrar registrar(RESIDUAL_RMSNORM_INF_TASK_ID,
+                                   "Residual RMS Norm Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<ResidualRMSNorm::inference_task>(
+          registrar, "RMS Norm Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<ResidualRMSNorm::inference_task>(
+          registrar);
+    }
+  }
   {
     TaskVariantRegistrar registrar(LAYERNORM_BWD_TASK_ID, "layernorm_bwd_task");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
diff --git a/src/runtime/operator_params.cc b/src/runtime/operator_params.cc
index a983dcdb03..43f3dc7cf9 100644
--- a/src/runtime/operator_params.cc
+++ b/src/runtime/operator_params.cc
@@ -27,9 +27,11 @@
 #include "flexflow/ops/pool_2d.h"
 #include "flexflow/ops/reduce.h"
 #include "flexflow/ops/reshape.h"
+#include "flexflow/ops/residual_rms_norm.h"
 #include "flexflow/ops/reverse.h"
 #include "flexflow/ops/rms_norm.h"
 #include "flexflow/ops/sampling.h"
+#include "flexflow/ops/sigmoid_silu_multi.h"
 #include "flexflow/ops/softmax.h"
 #include "flexflow/ops/spec_inc_multihead_self_attention.h"
 #include "flexflow/ops/split.h"
@@ -96,6 +98,8 @@ tl::optional<OperatorParameters> get_op_parameters(Op const *op) {
       return ((LayerNorm *)op)->get_params();
     case OP_ADD_BIAS_RESIDUAL_LAYERNORM:
       return ((AddBiasResidualLayerNorm *)op)->get_params();
+    case OP_SIGMOID_SILU_MULTI:
+      return ((SigmoidSiluMulti *)op)->get_params();
     case OP_REDUCE_SUM:
       return ((Reduce *)op)->get_params();
     case OP_RESHAPE:
@@ -130,6 +134,8 @@ tl::optional<OperatorParameters> get_op_parameters(Op const *op) {
       return ((AggregateSpec *)op)->get_params();
     case OP_RMS_NORM:
       return ((RMSNorm *)op)->get_params();
+    case OP_RESIDUAL_RMS_NORM:
+      return ((ResidualRMSNorm *)op)->get_params();
     case OP_ARG_TOPK:
       return ((ArgTopK *)op)->get_params();
     case OP_BEAM_TOPK:
diff --git a/src/runtime/substitution.cc b/src/runtime/substitution.cc
index ae3be1222e..8618c41129 100644
--- a/src/runtime/substitution.cc
+++ b/src/runtime/substitution.cc
@@ -33,7 +33,9 @@
 #include "flexflow/ops/linear.h"
 #include "flexflow/ops/noop.h"
 #include "flexflow/ops/pool_2d.h"
+#include "flexflow/ops/residual_rms_norm.h"
 #include "flexflow/ops/rms_norm.h"
+#include "flexflow/ops/sigmoid_silu_multi.h"
 #include "flexflow/ops/softmax.h"
 #include "flexflow/ops/split.h"
 #include "flexflow/ops/tree_inc_multihead_self_attention.h"
@@ -3815,6 +3817,14 @@ bool FFModel::convert_graph_to_operators(
                                               NULL);
         break;
       }
+      case OP_SIGMOID_SILU_MULTI: {
+        assert(inList.size() == 2);
+        SigmoidSiluMulti *ssm = (SigmoidSiluMulti *)node.ptr;
+        SigmoidSiluMultiParams params = ssm->get_params();
+        new_op = new SigmoidSiluMulti(
+            *this, ssm->layer_guid, inputs[0], inputs[1], NULL);
+        break;
+      }
       default: {
         new_op = node.ptr->materialize(*this, inputs, num_inputs);
         break;

From f2f97117b4a81897b2e11af200a325584bc9848f Mon Sep 17 00:00:00 2001
From: DerrickYLJ <99985904+DerrickYLJ@users.noreply.github.com>
Date: Sat, 23 Sep 2023 22:26:27 -0400
Subject: [PATCH 231/344] Build ROCm Docker images on Oracle instance (#1144)

* added oracle machine start/close and incorporate building rocm with oracle runner if needed in docker-build workflow

* bug fix

* delete building legion

* bug fix

* bug fix

* cleanup

* fix

* rm unnecessary workflow

* newline

* fix

* fix

* fix

* fix

* fix

* update docker skip workflow

---------

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
---
 .github/workflows/docker-build-skip.yml |  33 ++--
 .github/workflows/docker-build.yml      | 210 +++++++++++++++---------
 .github/workflows/gpu-ci.yml            |   6 +-
 .github/workflows/helpers/oracle_con.py |  38 +++++
 4 files changed, 187 insertions(+), 100 deletions(-)
 create mode 100644 .github/workflows/helpers/oracle_con.py

diff --git a/.github/workflows/docker-build-skip.yml b/.github/workflows/docker-build-skip.yml
index 59b584c6c4..02b703467c 100644
--- a/.github/workflows/docker-build-skip.yml
+++ b/.github/workflows/docker-build-skip.yml
@@ -13,27 +13,22 @@ concurrency:
   cancel-in-progress: true
 
 jobs:
-  docker-build:
-    name: Build and Install FlexFlow in a Docker Container
-    runs-on: ubuntu-20.04
+  docker-build-rocm:
+    name: Build and Install FlexFlow in a Docker Container (ROCm backend)
+    runs-on: ubuntu-latest
     strategy:
       matrix:
-        gpu_backend: ["cuda", "hip_rocm"]
-        cuda_version: ["11.1", "11.2", "11.3", "11.5", "11.6", "11.7", "11.8"]
-        # The CUDA version doesn't matter when building for hip_rocm, so we just pick one arbitrarily (11.8) to avoid building for hip_rocm once per number of CUDA version supported
-        exclude:
-          - gpu_backend: "hip_rocm"
-            cuda_version: "11.1"
-          - gpu_backend: "hip_rocm"
-            cuda_version: "11.2"
-          - gpu_backend: "hip_rocm"
-            cuda_version: "11.3"
-          - gpu_backend: "hip_rocm"
-            cuda_version: "11.5"
-          - gpu_backend: "hip_rocm"
-            cuda_version: "11.6"
-          - gpu_backend: "hip_rocm"
-            cuda_version: "11.7"
+        hip_version: ["5.3", "5.4", "5.5", "5.6"]
+      fail-fast: false
+    steps:
+      - run: 'echo "No docker-build required"'
+  
+  docker-build-cuda:
+    name: Build and Install FlexFlow in a Docker Container (CUDA backend)
+    runs-on: ubuntu-latest
+    strategy:
+      matrix:
+        cuda_version: ["11.1", "11.2", "11.3", "11.4", "11.5", "11.6", "11.7", "11.8", "12.0"]
       fail-fast: false
     steps:
       - run: 'echo "No docker-build required"'
diff --git a/.github/workflows/docker-build.yml b/.github/workflows/docker-build.yml
index 899de4664e..655310e141 100644
--- a/.github/workflows/docker-build.yml
+++ b/.github/workflows/docker-build.yml
@@ -9,9 +9,9 @@ on:
     branches:
       - "inference"
       - "master"
-  schedule:
-    # Run every week on Sunday at midnight PT (3am ET / 8am UTC) to keep the docker images updated
-    - cron: "0 8 * * 0"
+  # schedule:
+  #   # Run every week on Sunday at midnight PT (3am ET / 8am UTC) to keep the docker images updated
+  #   - cron: "0 8 * * 0"
   workflow_dispatch:
 
 # Cancel outdated workflows if they are still running
@@ -20,120 +20,174 @@ concurrency:
   cancel-in-progress: true
 
 jobs:
-  docker-build:
-    name: Build and Install FlexFlow in a Docker Container
-    runs-on: ubuntu-20.04
+  oracle-runner-start:
+    name: Start a self-hosted Oracle machine to build the ROCM Docker images
+    runs-on: ubuntu-latest
+    if: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
+    env: 
+      OCI_CLI_USER: ${{ secrets.OCI_CLI_USER }}
+      OCI_CLI_TENANCY: ${{ secrets.OCI_CLI_TENANCY }}
+      OCI_CLI_FINGERPRINT: ${{ secrets.OCI_CLI_FINGERPRINT }}
+      OCI_CLI_KEY_CONTENT: ${{ secrets.OCI_CLI_KEY_CONTENT }}
+      OCI_CLI_REGION: ${{ secrets.OCI_CLI_REGION }} 
+      OCI_INSTANCE_ID: ${{ secrets.INSTANCE_ID_FFCI }}
+    steps:
+      - name: Checkout Git Repository
+        uses: actions/checkout@v3
+
+      - name: Install Oracle Cloud Infrastructure library
+        run: pip install oci
+      
+      - name: Start Oracle Machine
+        run: python3 .github/workflows/helpers/oracle_con.py --start --instance_id $OCI_INSTANCE_ID
+
+  # 1. in docker-build cases: if there are push/ workflow_dispatch to inference, 
+  # the job should be run on oracle machine to build rocm and 11.8 cuda version
+  # 2. add a job to turn off the oracle machine if not needed
+  rocm_runner_choice:
+    name: Determine what runner to use to build the ROCm Docker image(s)
+    runs-on: ubuntu-latest
+    outputs:
+      rocm_runner: ${{ steps.step1.outputs.runner }}
+    steps:
+      - name: Determine the runner
+        id: step1
+        env:
+          deploy_needed: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
+        run: |
+          if [ $deploy_needed == "true" ]; then
+            echo "::set-output name=runner::[self-hosted, cpu_only]"
+          else
+            echo "::set-output name=runner::ubuntu-20.04"
+          fi
+
+  docker-build-rocm:
+    needs: rocm_runner_choice
+    name: Build and Install FlexFlow in a Docker Container (ROCm backend)
+    runs-on: ${{ needs.rocm_runner_choice.outputs.rocm_runner }}
     strategy:
       matrix:
-        gpu_backend: ["cuda", "hip_rocm"]
-        gpu_backend_version: ["11.1", "11.2", "11.3", "11.4", "11.5", "11.6", "11.7", "11.8", "12.0", "5.3", "5.4", "5.5", "5.6"]
-        # The CUDA version doesn't matter when building for hip_rocm, so we just pick one arbitrarily (11.8) to avoid building for hip_rocm once per number of CUDA version supported
-        exclude:
-          - gpu_backend: "cuda"
-            gpu_backend_version: "5.3"
-          - gpu_backend: "cuda"
-            gpu_backend_version: "5.4"
-          - gpu_backend: "cuda"
-            gpu_backend_version: "5.5"
-          - gpu_backend: "cuda"
-            gpu_backend_version: "5.6"
-          - gpu_backend: "hip_rocm"
-            gpu_backend_version: "11.1"
-          - gpu_backend: "hip_rocm"
-            gpu_backend_version: "11.2"
-          - gpu_backend: "hip_rocm"
-            gpu_backend_version: "11.3"
-          - gpu_backend: "hip_rocm"
-            gpu_backend_version: "11.4"
-          - gpu_backend: "hip_rocm"
-            gpu_backend_version: "11.5"
-          - gpu_backend: "hip_rocm"
-            gpu_backend_version: "11.6"
-          - gpu_backend: "hip_rocm"
-            gpu_backend_version: "11.7"
-          - gpu_backend: "hip_rocm"
-            gpu_backend_version: "11.8"
-          - gpu_backend: "hip_rocm"
-            gpu_backend_version: "12.0"
+        hip_version: ["5.3", "5.4", "5.5", "5.6"]
       fail-fast: false
     env:
-      FF_GPU_BACKEND: ${{ matrix.gpu_backend }}
-      gpu_backend_version: ${{ matrix.gpu_backend_version }}
-      # one of the two variables below will be unused
-      cuda_version: ${{ matrix.gpu_backend_version }}
-      hip_version: ${{ matrix.gpu_backend_version }}
-      branch_name: ${{ github.head_ref || github.ref_name }}
-    timeout-minutes: 480
+      FF_GPU_BACKEND: "hip_rocm"
+      hip_version: ${{ matrix.hip_version }}
     steps:
       - name: Checkout Git Repository
+        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.hip_version == '5.6' }}
         uses: actions/checkout@v3
         with:
           submodules: recursive
 
       - name: Free additional space on runner
-        env:
-          deploy_needed: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && env.branch_name == 'inference' }}
-          build_needed: ${{ ( matrix.gpu_backend == 'hip_rocm' && matrix.gpu_backend_version == '5.6' ) || ( matrix.gpu_backend == 'cuda' && matrix.gpu_backend_version == '11.8' ) }}
-        run: |
-          if [[ $deploy_needed == "true" || $build_needed == "true" ]]; then
-            .github/workflows/helpers/free_space_on_runner.sh
-          else
-            echo "Skipping this step to save time"
-          fi
+        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.hip_version == '5.6' }}
+        run: .github/workflows/helpers/free_space_on_runner.sh
 
       - name: Build Docker container
+        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.hip_version == '5.6' }}
         env:
-          deploy_needed: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && env.branch_name == 'inference' }}
-          build_needed: ${{ ( matrix.gpu_backend == 'hip_rocm' && matrix.gpu_backend_version == '5.6' ) || ( matrix.gpu_backend == 'cuda' && matrix.gpu_backend_version == '11.8' ) }}
+          deploy_needed: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
+          build_needed: ${{ matrix.hip_version == '5.6' }}
         run: |
           # On push to inference, build for all compatible architectures, so that we can publish 
           # a pre-built general-purpose image. On all other cases, only build for one architecture
           # to save time.
           if [[ $deploy_needed == "true" ]] ; then
-            export FF_CUDA_ARCH=all
             export FF_HIP_ARCH=all
             ./docker/build.sh flexflow
           elif [[ $build_needed == "true" ]]; then
-            export FF_CUDA_ARCH=70
             export FF_HIP_ARCH=gfx1100,gfx1036
             ./docker/build.sh flexflow
-          else
-            echo "Skipping build to save time"
           fi
 
       - name: Check availability of flexflow modules in Python
-        if: ${{ matrix.gpu_backend == 'cuda' }}
+        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.hip_version == '5.6' }}
+        run: docker run --entrypoint /bin/bash flexflow-${FF_GPU_BACKEND}-${hip_version}:latest -c "python -c 'import flexflow.core; import flexflow.serve as ff; exit()'"
+
+      - name: Publish Docker environment image (on push to inference)
+        if: ${{ github.repository_owner == 'flexflow' && ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
         env:
-          deploy_needed: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && env.branch_name == 'inference' }}
-          build_needed: ${{ ( matrix.gpu_backend == 'hip_rocm' && matrix.gpu_backend_version == '5.6' ) || ( matrix.gpu_backend == 'cuda' && matrix.gpu_backend_version == '11.8' ) }}
+          FLEXFLOW_CONTAINER_TOKEN: ${{ secrets.FLEXFLOW_CONTAINER_TOKEN }}
         run: |
-          if [[ $deploy_needed == "true" || $build_needed == "true" ]]; then
-            if [[ $FF_GPU_BACKEND == "cuda" ]]; then
-              docker run --entrypoint /bin/bash flexflow-${FF_GPU_BACKEND}-${gpu_backend_version}:latest -c "export LD_LIBRARY_PATH=/usr/local/cuda/lib64/stubs:$LD_LIBRARY_PATH; sudo ln -s /usr/local/cuda/lib64/stubs/libcuda.so /usr/local/cuda/lib64/stubs/libcuda.so.1; python -c 'import flexflow.core; import flexflow.serve as ff; exit()'"
-            else
-              docker run --entrypoint /bin/bash flexflow-${FF_GPU_BACKEND}-${gpu_backend_version}:latest -c "python -c 'import flexflow.core; import flexflow.serve as ff; exit()'"
-            fi
-          else
-            echo "Skipping test to save time"
+          ./docker/publish.sh flexflow-environment
+          ./docker/publish.sh flexflow
+  
+  docker-build-cuda:
+    name: Build and Install FlexFlow in a Docker Container (CUDA backend)
+    runs-on: ubuntu-20.04
+    strategy:
+      matrix:
+        cuda_version: ["11.1", "11.2", "11.3", "11.4", "11.5", "11.6", "11.7", "11.8", "12.0"]
+      fail-fast: false
+    env:
+      FF_GPU_BACKEND: "cuda"
+      cuda_version: ${{ matrix.cuda_version }}
+    steps:
+      - name: Checkout Git Repository
+        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.cuda_version == '11.8' }}
+        uses: actions/checkout@v3
+        with:
+          submodules: recursive
+
+      - name: Free additional space on runner
+        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.cuda_version == '11.8' }}
+        run: .github/workflows/helpers/free_space_on_runner.sh
+
+      - name: Build Docker container
+        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.cuda_version == '11.8' }}
+        env:
+          deploy_needed: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
+          build_needed: ${{ matrix.cuda_version == '11.8' }}
+        run: |
+          # On push to inference, build for all compatible architectures, so that we can publish 
+          # a pre-built general-purpose image. On all other cases, only build for one architecture
+          # to save time.
+          if [[ $deploy_needed == "true" ]] ; then
+            export FF_CUDA_ARCH=all
+            ./docker/build.sh flexflow
+          elif [[ $build_needed == "true" ]]; then
+            export FF_CUDA_ARCH=86
+            ./docker/build.sh flexflow
           fi
 
+      - name: Check availability of flexflow modules in Python
+        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.cuda_version == '11.8' }}
+        run: docker run --entrypoint /bin/bash flexflow-${FF_GPU_BACKEND}-${cuda_version}:latest -c "export LD_LIBRARY_PATH=/usr/local/cuda/lib64/stubs:$LD_LIBRARY_PATH; sudo ln -s /usr/local/cuda/lib64/stubs/libcuda.so /usr/local/cuda/lib64/stubs/libcuda.so.1; python -c 'import flexflow.core; import flexflow.serve as ff; exit()'"
+
       - name: Publish Docker environment image (on push to inference)
-        if: github.repository_owner == 'flexflow'
+        if: ${{ github.repository_owner == 'flexflow' && ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
         env:
           FLEXFLOW_CONTAINER_TOKEN: ${{ secrets.FLEXFLOW_CONTAINER_TOKEN }}
-          deploy_needed: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && env.branch_name == 'inference' }}
         run: |
-          if [[ $deploy_needed == "true" ]]; then
-            ./docker/publish.sh flexflow-environment
-            ./docker/publish.sh flexflow
-          else
-            echo "No need to update Docker containers in ghrc.io registry at this time."
-          fi
+          ./docker/publish.sh flexflow-environment
+          ./docker/publish.sh flexflow
+
+  oracle-runner-stop:
+    needs: docker-build-rocm
+    if: ${{ always() && ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
+    runs-on: ubuntu-latest
+    name: Turn off the self-hosted Oracle machine where we built the ROCM Docker images
+    env:
+      OCI_CLI_USER: ${{ secrets.OCI_CLI_USER }}
+      OCI_CLI_TENANCY: ${{ secrets.OCI_CLI_TENANCY }}
+      OCI_CLI_FINGERPRINT: ${{ secrets.OCI_CLI_FINGERPRINT }}
+      OCI_CLI_KEY_CONTENT: ${{ secrets.OCI_CLI_KEY_CONTENT }}
+      OCI_CLI_REGION: ${{ secrets.OCI_CLI_REGION }} 
+      OCI_INSTANCE_ID: ${{ secrets.INSTANCE_ID_FFCI }}
+    steps:
+      - name: Checkout Git Repository
+        uses: actions/checkout@v3
+      
+      - name: Install Oracle Cloud Infrastructure library
+        run: pip install oci
+        
+      - name: Stop Oracle Machine
+        run: python3 docker/oracle_con.py --stop --instance_id $OCI_INSTANCE_ID
 
   notify-slack:
     name: Notify Slack in case of failure
     runs-on: ubuntu-20.04
-    needs: docker-build
+    needs: [docker-build-cuda, docker-build-rocm]
     if: ${{ failure() && github.event_name == 'schedule' && github.repository_owner == 'flexflow' }}
     steps:
       - name: Send Slack message
diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index d604a7cea9..aee16832f3 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -61,7 +61,7 @@ jobs:
 
   python-interface-check:
     name: Check Python Interface
-    runs-on: self-hosted
+    runs-on: [self-hosted, gpu]
     defaults:
       run:
         shell: bash -l {0} # required to use an activated conda environment
@@ -135,7 +135,7 @@ jobs:
 
   inference-tests:
     name: Inference Tests
-    runs-on: self-hosted
+    runs-on: [self-hosted, gpu]
     defaults:
       run:
         shell: bash -l {0} # required to use an activated conda environment
@@ -210,7 +210,7 @@ jobs:
 
   gpu-ci-flexflow:
     name: Single Machine, Multiple GPUs Tests
-    runs-on: self-hosted
+    runs-on: [self-hosted, gpu]
     # skip this time-consuming test for PRs to the inference branch
     # if: ${{ github.event_name != 'pull_request' || github.base_ref != 'inference' }}
     defaults:
diff --git a/.github/workflows/helpers/oracle_con.py b/.github/workflows/helpers/oracle_con.py
new file mode 100644
index 0000000000..4fd41930b7
--- /dev/null
+++ b/.github/workflows/helpers/oracle_con.py
@@ -0,0 +1,38 @@
+import oci
+import argparse
+import os
+
+parser = argparse.ArgumentParser(description="Program with optional flags")
+group = parser.add_mutually_exclusive_group()
+group.add_argument("--start", action="store_true", help="Start action")
+group.add_argument("--stop", action="store_true", help="Stop action")
+parser.add_argument("--instance_id", type=str, required=True, help="instance id required")
+args = parser.parse_args()
+
+oci_key_content = os.getenv("OCI_CLI_KEY_CONTENT")
+
+config = {
+    "user": os.getenv("OCI_CLI_USER"),
+    "key_content": os.getenv("OCI_CLI_KEY_CONTENT"),
+    "fingerprint": os.getenv("OCI_CLI_FINGERPRINT"),
+    "tenancy": os.getenv("OCI_CLI_TENANCY"),
+    "region": os.getenv("OCI_CLI_REGION")
+}
+
+# Initialize the OCI configuration
+# config = oci.config.from_file()
+oci.config.validate_config(config)
+
+# Initialize the ComputeClient to interact with VM instances
+compute = oci.core.ComputeClient(config)
+
+# Replace 'your_instance_id' with the actual instance ID of your VM
+instance_id = args.instance_id
+
+# Perform the action
+if args.start:
+    # Start the VM
+    compute.instance_action(instance_id, "START")
+else:
+    # Stop the VM
+    compute.instance_action(instance_id, "STOP")

From 48cca2bf61c4cfe82b44adee375fe8de2ce3479a Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sat, 23 Sep 2023 22:31:55 -0400
Subject: [PATCH 232/344] fix (#1147)

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 python/flexflow/serve/__init__.py | 3 +++
 1 file changed, 3 insertions(+)

diff --git a/python/flexflow/serve/__init__.py b/python/flexflow/serve/__init__.py
index 7531c006a8..2c6395aca1 100644
--- a/python/flexflow/serve/__init__.py
+++ b/python/flexflow/serve/__init__.py
@@ -141,6 +141,7 @@ def init(
         configs_dict = {
             "num_gpus": num_gpus,
             "memory_per_gpu": memory_per_gpu,
+            "num_cpus": num_cpus,
             "zero_copy_memory_per_node": zero_copy_memory_per_node,
             "legion_utility_processors": legion_utility_processors,
             "data_parallelism_degree": data_parallelism_degree,
@@ -174,6 +175,8 @@ def init(
         __check_positive_int(configs_dict, param)
 
     # Set default values
+    if configs_dict.get("num_cpus", None) is None:
+        configs_dict["num_cpus"] = 4
     if configs_dict.get("legion_utility_processors", None) is None:
         configs_dict["legion_utility_processors"] = 8
     if configs_dict.get("data_parallelism_degree", None) is None:

From 02326e04f0c8e574d00515b473cc9bebcfcd1862 Mon Sep 17 00:00:00 2001
From: DerrickYLJ <99985904+DerrickYLJ@users.noreply.github.com>
Date: Sun, 24 Sep 2023 00:28:11 -0400
Subject: [PATCH 233/344] Docker workflow cleanup (#1148)

---
 .github/workflows/docker-build.yml      | 3 ---
 .github/workflows/helpers/oracle_con.py | 1 -
 2 files changed, 4 deletions(-)

diff --git a/.github/workflows/docker-build.yml b/.github/workflows/docker-build.yml
index 655310e141..cce6b5e74f 100644
--- a/.github/workflows/docker-build.yml
+++ b/.github/workflows/docker-build.yml
@@ -41,9 +41,6 @@ jobs:
       - name: Start Oracle Machine
         run: python3 .github/workflows/helpers/oracle_con.py --start --instance_id $OCI_INSTANCE_ID
 
-  # 1. in docker-build cases: if there are push/ workflow_dispatch to inference, 
-  # the job should be run on oracle machine to build rocm and 11.8 cuda version
-  # 2. add a job to turn off the oracle machine if not needed
   rocm_runner_choice:
     name: Determine what runner to use to build the ROCm Docker image(s)
     runs-on: ubuntu-latest
diff --git a/.github/workflows/helpers/oracle_con.py b/.github/workflows/helpers/oracle_con.py
index 4fd41930b7..0891d66e99 100644
--- a/.github/workflows/helpers/oracle_con.py
+++ b/.github/workflows/helpers/oracle_con.py
@@ -20,7 +20,6 @@
 }
 
 # Initialize the OCI configuration
-# config = oci.config.from_file()
 oci.config.validate_config(config)
 
 # Initialize the ComputeClient to interact with VM instances

From 191df5dcc821d45317723415e587a9df49a8ee67 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 24 Sep 2023 14:58:32 -0400
Subject: [PATCH 234/344] fix oracle instance script

---
 .github/workflows/docker-build.yml | 10 +++++-----
 1 file changed, 5 insertions(+), 5 deletions(-)

diff --git a/.github/workflows/docker-build.yml b/.github/workflows/docker-build.yml
index cce6b5e74f..4009f3c338 100644
--- a/.github/workflows/docker-build.yml
+++ b/.github/workflows/docker-build.yml
@@ -21,7 +21,7 @@ concurrency:
 
 jobs:
   oracle-runner-start:
-    name: Start a self-hosted Oracle machine to build the ROCM Docker images
+    name: Start an Oracle instance to build the ROCM Docker images
     runs-on: ubuntu-latest
     if: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
     env: 
@@ -30,7 +30,7 @@ jobs:
       OCI_CLI_FINGERPRINT: ${{ secrets.OCI_CLI_FINGERPRINT }}
       OCI_CLI_KEY_CONTENT: ${{ secrets.OCI_CLI_KEY_CONTENT }}
       OCI_CLI_REGION: ${{ secrets.OCI_CLI_REGION }} 
-      OCI_INSTANCE_ID: ${{ secrets.INSTANCE_ID_FFCI }}
+      OCI_INSTANCE_ID: ${{ secrets.OCI_INSTANCE_ID }}
     steps:
       - name: Checkout Git Repository
         uses: actions/checkout@v3
@@ -163,14 +163,14 @@ jobs:
     needs: docker-build-rocm
     if: ${{ always() && ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
     runs-on: ubuntu-latest
-    name: Turn off the self-hosted Oracle machine where we built the ROCM Docker images
+    name: Stop the Oracle instance we used to build the ROCM Docker images
     env:
       OCI_CLI_USER: ${{ secrets.OCI_CLI_USER }}
       OCI_CLI_TENANCY: ${{ secrets.OCI_CLI_TENANCY }}
       OCI_CLI_FINGERPRINT: ${{ secrets.OCI_CLI_FINGERPRINT }}
       OCI_CLI_KEY_CONTENT: ${{ secrets.OCI_CLI_KEY_CONTENT }}
       OCI_CLI_REGION: ${{ secrets.OCI_CLI_REGION }} 
-      OCI_INSTANCE_ID: ${{ secrets.INSTANCE_ID_FFCI }}
+      OCI_INSTANCE_ID: ${{ secrets.OCI_INSTANCE_ID }}
     steps:
       - name: Checkout Git Repository
         uses: actions/checkout@v3
@@ -179,7 +179,7 @@ jobs:
         run: pip install oci
         
       - name: Stop Oracle Machine
-        run: python3 docker/oracle_con.py --stop --instance_id $OCI_INSTANCE_ID
+        run: python3 .github/workflows/helpers/oracle_con.py --stop --instance_id $OCI_INSTANCE_ID
 
   notify-slack:
     name: Notify Slack in case of failure

From dfbd0fbfee616b3924828ba78c422459d3a8e7b5 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 24 Sep 2023 15:40:57 -0400
Subject: [PATCH 235/344] fix

---
 .github/workflows/docker-build.yml | 72 +++++++++++++-----------------
 1 file changed, 32 insertions(+), 40 deletions(-)

diff --git a/.github/workflows/docker-build.yml b/.github/workflows/docker-build.yml
index 4009f3c338..db6553cd45 100644
--- a/.github/workflows/docker-build.yml
+++ b/.github/workflows/docker-build.yml
@@ -41,27 +41,34 @@ jobs:
       - name: Start Oracle Machine
         run: python3 .github/workflows/helpers/oracle_con.py --start --instance_id $OCI_INSTANCE_ID
 
-  rocm_runner_choice:
-    name: Determine what runner to use to build the ROCm Docker image(s)
-    runs-on: ubuntu-latest
-    outputs:
-      rocm_runner: ${{ steps.step1.outputs.runner }}
-    steps:
-      - name: Determine the runner
-        id: step1
-        env:
-          deploy_needed: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
-        run: |
-          if [ $deploy_needed == "true" ]; then
-            echo "::set-output name=runner::[self-hosted, cpu_only]"
-          else
-            echo "::set-output name=runner::ubuntu-20.04"
-          fi
-
   docker-build-rocm:
-    needs: rocm_runner_choice
     name: Build and Install FlexFlow in a Docker Container (ROCm backend)
-    runs-on: ${{ needs.rocm_runner_choice.outputs.rocm_runner }}
+    runs-on: ubuntu-20.04
+    if: ${{ ( github.event_name != 'push' && github.event_name != 'schedule' && github.event_name != 'workflow_dispatch' ) || github.ref_name != 'inference' }}
+    env:
+      FF_GPU_BACKEND: "hip_rocm"
+      hip_version: 5.6
+    steps:
+      - name: Checkout Git Repository
+        uses: actions/checkout@v3
+        with:
+          submodules: recursive
+
+      - name: Free additional space on runner
+        run: .github/workflows/helpers/free_space_on_runner.sh
+
+      - name: Build Docker container
+        run: FF_HIP_ARCH="gfx1100,gfx1036" ./docker/build.sh flexflow
+
+      - name: Check availability of flexflow modules in Python
+        run: docker run --entrypoint /bin/bash flexflow-${FF_GPU_BACKEND}-${hip_version}:latest -c "python -c 'import flexflow.core; import flexflow.serve as ff; exit()'"
+  
+
+  docker-build-and-publish-rocm:
+    name: Build and Deploy FlexFlow Docker Containers (ROCm backend)
+    needs: oracle-runner-start
+    runs-on: [self-hosted, cpu_only]
+    if: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
     strategy:
       matrix:
         hip_version: ["5.3", "5.4", "5.5", "5.6"]
@@ -71,38 +78,23 @@ jobs:
       hip_version: ${{ matrix.hip_version }}
     steps:
       - name: Checkout Git Repository
-        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.hip_version == '5.6' }}
         uses: actions/checkout@v3
         with:
           submodules: recursive
 
       - name: Free additional space on runner
-        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.hip_version == '5.6' }}
         run: .github/workflows/helpers/free_space_on_runner.sh
 
       - name: Build Docker container
-        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.hip_version == '5.6' }}
-        env:
-          deploy_needed: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
-          build_needed: ${{ matrix.hip_version == '5.6' }}
-        run: |
-          # On push to inference, build for all compatible architectures, so that we can publish 
-          # a pre-built general-purpose image. On all other cases, only build for one architecture
-          # to save time.
-          if [[ $deploy_needed == "true" ]] ; then
-            export FF_HIP_ARCH=all
-            ./docker/build.sh flexflow
-          elif [[ $build_needed == "true" ]]; then
-            export FF_HIP_ARCH=gfx1100,gfx1036
-            ./docker/build.sh flexflow
-          fi
+        # On push to inference, build for all compatible architectures, so that we can publish 
+        # a pre-built general-purpose image. On all other cases, only build for one architecture
+        # to save time.
+        run: FF_HIP_ARCH=all ./docker/build.sh flexflow
 
       - name: Check availability of flexflow modules in Python
-        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.hip_version == '5.6' }}
         run: docker run --entrypoint /bin/bash flexflow-${FF_GPU_BACKEND}-${hip_version}:latest -c "python -c 'import flexflow.core; import flexflow.serve as ff; exit()'"
 
       - name: Publish Docker environment image (on push to inference)
-        if: ${{ github.repository_owner == 'flexflow' && ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
         env:
           FLEXFLOW_CONTAINER_TOKEN: ${{ secrets.FLEXFLOW_CONTAINER_TOKEN }}
         run: |
@@ -160,7 +152,7 @@ jobs:
           ./docker/publish.sh flexflow
 
   oracle-runner-stop:
-    needs: docker-build-rocm
+    needs: docker-build-and-publish-rocm
     if: ${{ always() && ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
     runs-on: ubuntu-latest
     name: Stop the Oracle instance we used to build the ROCM Docker images
@@ -184,7 +176,7 @@ jobs:
   notify-slack:
     name: Notify Slack in case of failure
     runs-on: ubuntu-20.04
-    needs: [docker-build-cuda, docker-build-rocm]
+    needs: [docker-build-cuda, docker-build-and-publish-rocm]
     if: ${{ failure() && github.event_name == 'schedule' && github.repository_owner == 'flexflow' }}
     steps:
       - name: Send Slack message

From 5958971bc4b980e750b0a6e35be9359f1d3403d3 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 24 Sep 2023 16:07:01 -0400
Subject: [PATCH 236/344] fix

---
 .github/workflows/docker-build.yml | 3 ---
 1 file changed, 3 deletions(-)

diff --git a/.github/workflows/docker-build.yml b/.github/workflows/docker-build.yml
index db6553cd45..05c94c7e84 100644
--- a/.github/workflows/docker-build.yml
+++ b/.github/workflows/docker-build.yml
@@ -82,9 +82,6 @@ jobs:
         with:
           submodules: recursive
 
-      - name: Free additional space on runner
-        run: .github/workflows/helpers/free_space_on_runner.sh
-
       - name: Build Docker container
         # On push to inference, build for all compatible architectures, so that we can publish 
         # a pre-built general-purpose image. On all other cases, only build for one architecture

From 0a56d0170f1c8bed1c866eb33f480aa5ff57769c Mon Sep 17 00:00:00 2001
From: zwang86 <46699021+zwang86@users.noreply.github.com>
Date: Mon, 25 Sep 2023 12:49:35 -0400
Subject: [PATCH 237/344] [SpecInfer] Update RequestManager (#1096)

* Reorder pipeline.

* refactor and small fixes.

* Update

* Refactor backup.

* pipeline update.

* Format.

* fix

* .

* fix

* fix

* fix.

* Fix reloading new request with long prompts.

* Fix edge cases.

* Fix edge case

* fix

* try a fix to CI

* .

* fix

* Fix: clean up code and fix decoding_steps.

* try 1 try

* fix: allow parse 0 tokens for pending request.

* format.

* remove comment tests

* remove print.

* fix decoding steps

* .

* quick fix.

* remove debugging prints.

* fix store_beam_metadata.

* hip

---------

Co-authored-by: Zeyu Wang <zeyuwang@catalyst-cluster.cs.cmu.edu>
Co-authored-by: Zeyu Wang <zeyuwang@catalyst-0-11.eth>
Co-authored-by: xinhaoc <xinhaoc@andrew.cmu.edu>
Co-authored-by: xinhaoc <chengxh_98@163.com>
Co-authored-by: Xinhao Cheng <99570243+xinhaoc@users.noreply.github.com>
Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 include/flexflow/batch_config.h               |    5 +-
 include/flexflow/model.h                      |    5 +-
 .../flexflow/ops/kernels/softmax_kernels.h    |    2 +
 include/flexflow/request_manager.h            |   14 +-
 inference/incr_decoding/incr_decoding.cc      |    6 +-
 inference/spec_infer/spec_infer.cc            |    6 +-
 src/c/flexflow_c.cc                           |    4 +-
 src/mapper/mapper.cc                          |    2 +-
 src/ops/argmax.cpp                            |    2 +-
 src/ops/argmax.cu                             |    4 +-
 src/ops/kernels/softmax.cpp                   |    5 +-
 src/ops/kernels/softmax.cu                    |    6 +-
 src/ops/spec_inc_multihead_self_attention.cu  |    8 +-
 src/runtime/request_manager.cc                | 1035 ++++++++++-------
 14 files changed, 645 insertions(+), 459 deletions(-)

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index ce331d3e41..8aa69a3cad 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -46,13 +46,14 @@ class BatchConfig {
   void print() const;
   virtual InferenceMode get_mode() const;
   static BatchConfig const *from_future(BatchConfigFuture const &future);
-  static int const MAX_NUM_REQUESTS = 1;
+  static int const MAX_NUM_REQUESTS = 4;
   static int const MAX_NUM_TOKENS = 64;
   static int const MAX_PROMPT_LENGTH = 62;
   static int const MAX_SEQ_LENGTH = 256;
 
   //  These are set by update
   int num_tokens;
+  bool loading_prompt = false;
 
   struct PerRequestInfo {
     int token_start_offset;
@@ -69,6 +70,7 @@ class BatchConfig {
   PerTokenInfo tokensInfo[MAX_NUM_TOKENS];
 
   bool request_completed[MAX_NUM_REQUESTS];
+  bool request_running[MAX_NUM_TOKENS];
 };
 
 class TreeVerifyBatchConfig : public BatchConfig {
@@ -113,7 +115,6 @@ class BeamSearchBatchConfig : public BatchConfig {
   inline static int const MAX_BEAM_DEPTH = 8;
 
   int model_id;
-  int max_init_length = 0;
 
   struct BeamSearchPerRequestInfo {
     int beam_size;
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index f88f96cd5a..177575e809 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -239,8 +239,8 @@ enum TaskIDs {
   RM_LOAD_TOKENS_TASK_ID,
   RM_LOAD_POSITION_TASK_ID,
   RM_PREPARE_NEXT_BATCH_TASK_ID,
-  RM_PREPARE_NEXT_BATCH_BEAM_TASK_ID,
   RM_PREPARE_NEXT_BATCH_INIT_TASK_ID,
+  RM_PREPARE_NEXT_BATCH_BEAM_TASK_ID,
   RM_PREPARE_NEXT_BATCH_VERIFY_TASK_ID,
   // Custom tasks
   CUSTOM_GPU_TASK_ID_FIRST,
@@ -787,7 +787,8 @@ class FFModel {
   // ========================================
   // Inference APIs
   // ========================================
-  GenerationResult generate(std::string const &text, int max_seq_length);
+  GenerationResult generate(std::vector<std::string> &prompts,
+                            int max_seq_length);
 
   Tensor create_tensor_legion_ordering(int num_dim,
                                        int const dims[],
diff --git a/include/flexflow/ops/kernels/softmax_kernels.h b/include/flexflow/ops/kernels/softmax_kernels.h
index 14c07414e9..987a546459 100644
--- a/include/flexflow/ops/kernels/softmax_kernels.h
+++ b/include/flexflow/ops/kernels/softmax_kernels.h
@@ -15,8 +15,10 @@ class SoftmaxMeta : public OpMeta {
               Legion::Domain const &input_domain);
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
   cudnnTensorDescriptor_t inputTensor;
+  cudnnTensorDescriptor_t outputTensor;
 #else
   miopenTensorDescriptor_t inputTensor;
+  miopenTensorDescriptor_t outputTensor;
 #endif
   bool profiling;
   int dim;
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index e444402dd0..8515d8a04b 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -52,13 +52,17 @@ class InferenceManager {
 
 struct Request {
   enum Status {
-    PENDING = 101,
-    RUNNING = 102,
-    COMPLETED = 103,
+    PENDING = 101,   // loading prompt
+    RUNNING = 102,   // running inference
+    COMPLETED = 103, // finished and verified
+    FINISHING = 104, // finishing request, but not yet verified
   };
   BatchConfig::RequestGuid guid;
   int max_sequence_length;
   int initial_len;
+  int ssm_cache_size = 0;
+  int llm_cache_size = 0;
+
   Status status = PENDING;
   std::vector<BatchConfig::TokenId> tokens;
 
@@ -102,10 +106,10 @@ class RequestManager {
   FFModel *get_model(int model_id);
 
   GenerationResult generate_incr_decoding(FFModel *model,
-                                          std::string const &text,
+                                          std::vector<std::string> &prompts,
                                           int max_seq_length);
   GenerationResult generate_spec_infer(FFModel *model,
-                                       std::string const &text,
+                                       std::vector<std::string> &prompts,
                                        int max_seq_length);
   GenerationResult get_generation_result(RequestGuid const &guid);
   RequestGuid register_new_request(std::string const &prompt,
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index 19cd8726e2..3f913e4573 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -242,13 +242,15 @@ void FlexFlow::top_level_task(Task const *task,
                                    /*parser_callback_t */ nullptr,
                                    /*allow_exceptions */ true,
                                    /*ignore_comments */ true);
+    std::vector<std::string> prompts;
     for (auto &prompt : prompt_json) {
       std::string text = prompt.get<std::string>();
       printf("Prompt[%d]: %s\n", total_num_requests, text.c_str());
       total_num_requests++;
-      GenerationResult result =
-          model.generate(text, 128 /*max_sequence_length*/);
+      prompts.push_back(text);
     }
+    GenerationResult result =
+        model.generate(prompts, 128 /*max_sequence_length*/);
   }
 
   // Execution fence
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 9d139997f7..2b1fb6e817 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -384,12 +384,16 @@ void FlexFlow::top_level_task(Task const *task,
                                    /*parser_callback_t */ nullptr,
                                    /*allow_exceptions */ true,
                                    /*ignore_comments */ true);
+
+    std::vector<std::string> prompts;
     for (auto &prompt : prompt_json) {
       std::string text = prompt.get<std::string>();
       printf("Prompt[%d]: %s\n", total_num_requests, text.c_str());
       total_num_requests++;
-      tree_model.generate(text, 128 /*max_sequence_length*/);
+      prompts.push_back(text);
+      // tree_model.generate(text, 128 /*max_sequence_length*/);
     }
+    tree_model.generate(prompts, 128 /*max_sequence_length*/);
   }
 
   // Execution fence
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index 0ebe29e3e9..fcdae9cf33 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -1529,8 +1529,10 @@ flexflow_generation_result_t
                             int max_seq_length,
                             int *output_length_and_tokens) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
+  std::vector<std::string> prompts;
   std::string const text_str(input_text);
-  GenerationResult result = handle->generate(text_str, max_seq_length);
+  prompts.push_back(input_text);
+  GenerationResult result = handle->generate(prompts, max_seq_length);
   DEBUG_PRINT("[Model] generate %p %s %i", handle, text_str, max_seq_length);
   assert(result.output_tokens.size() <= max_seq_length);
   output_length_and_tokens[0] = result.output_tokens.size();
diff --git a/src/mapper/mapper.cc b/src/mapper/mapper.cc
index 3d08eb0bcc..a86a6167a6 100644
--- a/src/mapper/mapper.cc
+++ b/src/mapper/mapper.cc
@@ -284,8 +284,8 @@ void FFMapper::select_task_options(const MapperContext ctx,
     return;
   }
   if ((task.task_id == RM_PREPARE_NEXT_BATCH_TASK_ID) ||
-      (task.task_id == RM_PREPARE_NEXT_BATCH_BEAM_TASK_ID) ||
       (task.task_id == RM_PREPARE_NEXT_BATCH_INIT_TASK_ID) ||
+      (task.task_id == RM_PREPARE_NEXT_BATCH_BEAM_TASK_ID) ||
       (task.task_id == RM_PREPARE_NEXT_BATCH_VERIFY_TASK_ID)) {
     output.initial_proc = all_cpus[0];
     return;
diff --git a/src/ops/argmax.cpp b/src/ops/argmax.cpp
index ec5ea6c36a..8a1cf0b3b0 100644
--- a/src/ops/argmax.cpp
+++ b/src/ops/argmax.cpp
@@ -393,7 +393,7 @@ void ArgMax::forward_kernel(ArgMaxMeta const *m,
 
   if (m->beam_search) {
     // set all parents id zero in arg top1 case.
-    checkCUDA(hipMemset(parent, 0, batch_size * sizeof(int)));
+    checkCUDA(hipMemsetAsync(parent, 0, batch_size * sizeof(int), stream));
   }
   int num_shards = 0;
   int k = 1;
diff --git a/src/ops/argmax.cu b/src/ops/argmax.cu
index 37e067006c..05c84719c1 100644
--- a/src/ops/argmax.cu
+++ b/src/ops/argmax.cu
@@ -59,7 +59,7 @@ void ArgMax::forward_kernel(ArgMaxMeta const *m,
   DT alpha = 1.0f, beta = 0.0f;
   if (m->beam_search) {
     // set all parents id zero in arg top1 case.
-    checkCUDA(cudaMemset(parent, 0, batch_size * sizeof(int)));
+    checkCUDA(cudaMemsetAsync(parent, 0, batch_size * sizeof(int), stream));
   }
   size_t temp_storage_bytes = m->temp_storage_bytes;
   // use cub
@@ -83,6 +83,7 @@ void ArgMax::forward_kernel(ArgMaxMeta const *m,
                           prob_ptr,
                           batch_size,
                           m->beam_search);
+  // print_tensor<int>(indices_ptr, 32, "argmax op");
 }
 
 /*static*/
@@ -93,7 +94,6 @@ void ArgMax::forward_kernel_wrapper(ArgMaxMeta const *m,
                                     int batch_size) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
-
   cudaEvent_t t_start, t_end;
   if (m->profiling) {
     cudaEventCreate(&t_start);
diff --git a/src/ops/kernels/softmax.cpp b/src/ops/kernels/softmax.cpp
index bd8b46116d..ca4872d51b 100644
--- a/src/ops/kernels/softmax.cpp
+++ b/src/ops/kernels/softmax.cpp
@@ -29,6 +29,9 @@ SoftmaxMeta::SoftmaxMeta(FFHandler handler,
   checkCUDNN(miopenCreateTensorDescriptor(&inputTensor));
   checkCUDNN(
       cudnnSetTensorDescriptorFromDomain4SoftMax(inputTensor, input_domain));
+  checkCUDNN(miopenCreateTensorDescriptor(&outputTensor));
+  checkCUDNN(
+      cudnnSetTensorDescriptorFromDomain4SoftMax(outputTensor, input_domain));
   dim = softmax->dim;
   profiling = softmax->profiling;
   std::strcpy(op_name, softmax->name);
@@ -127,7 +130,7 @@ void forward_kernel(SoftmaxMeta const *m,
                                      m->inputTensor,
                                      input_ptr,
                                      &beta,
-                                     m->inputTensor,
+                                     m->outputTensor,
                                      output_ptr,
                                      MIOPEN_SOFTMAX_ACCURATE,
                                      MIOPEN_SOFTMAX_MODE_CHANNEL));
diff --git a/src/ops/kernels/softmax.cu b/src/ops/kernels/softmax.cu
index 15130c19a7..67a9c21038 100644
--- a/src/ops/kernels/softmax.cu
+++ b/src/ops/kernels/softmax.cu
@@ -28,6 +28,9 @@ SoftmaxMeta::SoftmaxMeta(FFHandler handler,
   checkCUDNN(cudnnCreateTensorDescriptor(&inputTensor));
   checkCUDNN(cudnnSetTensorDescriptorFromDomain4SoftMax(
       inputTensor, input_domain, softmax->data_type));
+  checkCUDNN(cudnnCreateTensorDescriptor(&outputTensor));
+  checkCUDNN(cudnnSetTensorDescriptorFromDomain4SoftMax(
+      outputTensor, input_domain, softmax->data_type));
   dim = softmax->dim;
   profiling = softmax->profiling;
   std::strcpy(op_name, softmax->name);
@@ -42,7 +45,6 @@ void forward_kernel_wrapper(SoftmaxMeta const *m,
                             DT *output_ptr) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
-
   cudaEvent_t t_start, t_end;
   if (m->profiling) {
     cudaEventCreate(&t_start);
@@ -127,7 +129,7 @@ void forward_kernel(SoftmaxMeta const *m,
                                  m->inputTensor,
                                  input_ptr,
                                  &beta,
-                                 m->inputTensor,
+                                 m->outputTensor,
                                  output_ptr));
 }
 
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 6ef5145654..b4cdc77e2a 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -251,6 +251,7 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
     if (bc->request_completed[i]) {
       continue;
     }
+
     for (int sub_req_id = 0; sub_req_id < bc->sub_requests[i]; sub_req_id++) {
 
       // int num_new_tokens = bc->num_processing_tokens[i];
@@ -259,6 +260,11 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
       int total_tokens = bc->requestsInfo[i].token_start_offset +
                          bc->requestsInfo[i].num_tokens_in_batch;
+
+      if (num_new_tokens <= 0) {
+        continue;
+      }
+
       // Compute (QK^T/sqrt(d_k))
       int m_ = num_new_tokens;
       int n = total_tokens;
@@ -543,7 +549,7 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
         output_ptr, bias_ptr, num_tokens, qkv_weight_size, m->oProjSize);
   }
 
-  assert(tokens_previous_requests == num_tokens);
+  // assert(tokens_previous_requests == num_tokens);
 }
 
 template <typename DT>
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 5eb3192e25..5489c9b06d 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -143,17 +143,12 @@ RequestManager::RequestGuid
   request.guid = next_available_guid++;
   request.max_sequence_length = max_sequence_length;
 
-  if (prompt.size() > BatchConfig::MAX_PROMPT_LENGTH) {
+  if (prompt.size() >= BatchConfig::MAX_SEQ_LENGTH) {
     std::cout << "Warning: too many tokens in prompt, only load up to "
-              << BatchConfig::MAX_PROMPT_LENGTH << " tokens, but got "
+              << BatchConfig::MAX_SEQ_LENGTH << " tokens, but got "
               << prompt.size() << ".\n";
-    // Truncate the prompt to MAX_NUM_TOKENS
-    // request.tokens.insert(request.tokens.end(),
-    //                       prompt.begin(),
-    //                       prompt.begin() + BatchConfig::MAX_PROMPT_LENGTH);
-    // request.initial_len = BatchConfig::MAX_PROMPT_LENGTH;
+
     printf("tokens size: %zu\n", request.tokens.size());
-    // assert(false);
     return 0;
   } else {
     request.initial_len = prompt.size();
@@ -206,14 +201,12 @@ RequestManager::RequestGuid
     request.tokens.push_back(bos_token_id);
   }
   std::vector<int32_t> tokens = this->tokenizer_->Encode(prompt);
-  if (tokens.size() > BatchConfig::MAX_PROMPT_LENGTH) {
+  if (tokens.size() >= BatchConfig::MAX_SEQ_LENGTH) {
     std::cout << "Warning: too many tokens in prompt, only load up to "
-              << BatchConfig::MAX_PROMPT_LENGTH << " tokens, but got "
+              << BatchConfig::MAX_SEQ_LENGTH << " tokens, but got "
               << tokens.size() << ".\n";
-    // Truncate the prompt to MAX_NUM_TOKENS
-    // tokens.resize(BatchConfig::MAX_PROMPT_LENGTH);
+
     printf("tokens size: %zu\n", tokens.size());
-    // assert(false);
     return 0;
   }
   for (int i = 0; i < tokens.size(); i++) {
@@ -238,6 +231,7 @@ RequestManager::RequestGuid
   all_requests[request.guid] = request;
   {
     std::string output = "New request tokens:";
+    output = "[" + std::to_string(request.guid) + "]" + output;
     for (int i = 0; i < request.tokens.size(); i++) {
       output = output + " " + std::to_string(request.tokens[i]);
     }
@@ -467,149 +461,8 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
 }
 
 /* ----- Speculative Inference Specific functions ----- */
-BeamSearchBatchConfigFuture RequestManager::prepare_next_batch_beam(
-    BeamSearchBatchConfigFuture const &old_bc,
-    BeamInferenceResultFuture const &result) {
-  Runtime *runtime = Runtime::get_runtime();
-  Context ctx = Runtime::get_context();
-
-  RequestManager *rm = this;
-  TaskLauncher launcher(RM_PREPARE_NEXT_BATCH_BEAM_TASK_ID,
-                        TaskArgument(&rm, sizeof(RequestManager *)));
-  launcher.add_future(old_bc);
-  launcher.add_future(result);
-  return runtime->execute_task(ctx, launcher);
-}
-
-BeamSearchBatchConfig RequestManager::prepare_next_batch_beam_task(
-    Task const *task,
-    std::vector<PhysicalRegion> const &regions,
-    Context ctx,
-    Runtime *runtime) {
-  RequestManager *rm = *((RequestManager **)task->args);
-  BeamSearchBatchConfig const &bc =
-      Future(task->futures[0]).get_result<BeamSearchBatchConfig>();
-  BeamInferenceResult const &result =
-      Future(task->futures[1]).get_result<BeamInferenceResult>();
-  return rm->prepare_next_batch_beam(bc, result);
-}
-
-// update beam search metadata
-BeamSearchBatchConfig
-    RequestManager::prepare_next_batch_beam(BeamSearchBatchConfig const &old_bc,
-                                            BeamInferenceResult const &result) {
-  const std::lock_guard<std::mutex> lock(request_queue_mutex);
-  if (verbose) {
-    std::cout << "\n############### prepare_next_batch_beam ###############\n";
-  }
-  if (verbose) {
-    std::cout << "print all results"
-              << "\n";
-    for (int i = 0; i < 40; i++) {
-      std::cout << result.token_ids[i] << ", ";
-    }
-    std::cout << "Current Beam Depth: "
-              << old_bc.beamRequestsInfo[0].current_depth << "\n";
-  }
-
-  // Step 1: Store result to the beam tree struct
-  store_beam_metadata(old_bc, result);
-
-  // Step 2: preparing the next batch for existing requests
-  BeamSearchBatchConfig new_bc;
-  new_bc.max_init_length = 0;
-  new_bc.model_id = old_bc.model_id;
-  // std::cout << "old_bc.model_id: " << old_bc.model_id << "\n";
-
-  for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
-    if (old_bc.request_completed[i]) {
-      continue;
-    }
-    // Comment out this assertion since num_tokens_in_batch can be
-    // zero when beam search has reached required sequence length
-    // assert(old_bc.requestsInfo[i].num_tokens_in_batch > 0);
-    Request &request = all_requests[old_bc.requestsInfo[i].request_guid];
-    int processed_tokens = old_bc.requestsInfo[i].token_start_offset +
-                           old_bc.requestsInfo[i].num_tokens_in_batch;
-
-    // assert(processed_tokens < request.tokens.size());
-    log_req_mgr.debug() << "processed_tokens: " << processed_tokens << "\n";
-    if (processed_tokens >
-        old_bc.beamRequestsInfo[i].max_depth + request.tokens.size()
-        // || ir.results[t] == 0 TODO: replace this with <EOS>
-    ) {
-      log_req_mgr.print("[Done] guid(%zu) with spec_tree_depth(%d)",
-                        old_bc.requestsInfo[i].request_guid,
-                        old_bc.beamRequestsInfo[i].max_depth);
-      // new_bc.request_completed[i] = true;
-      new_bc.request_completed[i] = false;
-      new_bc.requestsInfo[i].token_start_offset = processed_tokens;
-      new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
-      new_bc.requestsInfo[i].max_sequence_length =
-          old_bc.requestsInfo[i].max_sequence_length;
-    } else {
-      log_req_mgr.debug() << "num tokens: " << old_bc.num_tokens << ", "
-                          << new_bc.num_tokens;
-      new_bc.request_completed[i] = false;
-      new_bc.requestsInfo[i].token_start_offset = processed_tokens;
-      new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
-      new_bc.requestsInfo[i].max_sequence_length =
-          old_bc.requestsInfo[i].max_sequence_length;
-
-      // update the beam search metadata
-      // how many sub request in current request
-      // why is sub_requests has MAX_NUM_REQUESTS * MAX_BEAM_WIDTH entries?
-      new_bc.sub_requests[i] = old_bc.beamRequestsInfo[i].beam_size;
-      // update the parentid, accumalated_probs, depth, and token_ids
-      new_bc.beamRequestsInfo[i].current_depth =
-          old_bc.beamRequestsInfo[i].current_depth + 1;
-      new_bc.beamRequestsInfo[i].beam_size =
-          old_bc.beamRequestsInfo[i].beam_size;
-      new_bc.beamRequestsInfo[i].max_depth =
-          old_bc.beamRequestsInfo[i].max_depth;
-
-      // do the slot exchange to minimize the cache exchange in kernel.
-      // std::cout << "update metadata" << std::endl;
-      update_beam_metadata(new_bc, request.beam_trees.at(old_bc.model_id), i);
-
-      if (new_bc.requestsInfo[i].token_start_offset + 1 >=
-          request.tokens.size()) {
-        // Incremental phase
-        new_bc.requestsInfo[i].num_tokens_in_batch = 1;
-      } else {
-        // Prompt phase
-        new_bc.requestsInfo[i].num_tokens_in_batch =
-            std::min(BatchConfig::MAX_NUM_TOKENS - new_bc.num_tokens,
-                     (int)request.tokens.size() -
-                         new_bc.requestsInfo[i].token_start_offset);
-      }
-
-      // register more tokens due to the beam width
-      for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
-        int depth = new_bc.requestsInfo[i].token_start_offset + j;
-        for (int k = 0; k < new_bc.sub_requests[i]; k++) {
-          new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
-          new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = depth;
-
-          // get value from requestinfo
-          new_bc.tokensInfo[new_bc.num_tokens].token_id =
-              new_bc.beamRequestsInfo[i].tokens[k];
-          // request.tokens[depth];
-          new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = k;
-          new_bc.num_tokens++;
-        }
-      }
-    }
-  }
-  if (verbose) {
-    std::cout << "prepare_next_batch_beam OLD vs NEW batchconfigs:"
-              << std::endl;
-    old_bc.print();
-    new_bc.print();
-  }
-  return new_bc;
-}
 
+/***** Request Init Phase *****/
 BeamSearchBatchConfigFuture RequestManager::prepare_next_batch_init(
     TreeVerifyBatchConfigFuture const &old_bc,
     InferenceResultFuture const &result,
@@ -648,6 +501,9 @@ BeamSearchBatchConfig
   if (verbose) {
     std::cout << "\n############### prepare_next_batch_init ###############\n";
   }
+
+  std::cout << "\n############### prepare_next_batch_init ###############\n";
+
   // Step 1: use result to update requests
   BeamSearchBatchConfig new_bc;
   new_bc.num_tokens = 0;
@@ -661,188 +517,226 @@ BeamSearchBatchConfig
     size_t guid = old_bc.requestsInfo[i].request_guid;
     Request &request = all_requests[guid];
 
+    std::cout << "[ " << guid << " ]" << std::endl;
+
     // Verify this: get verified tokens from result
     std::vector<std::pair<BatchConfig::TokenId, int>> tree_outputs =
         std::vector<std::pair<BatchConfig::TokenId, int>>();
 
     assert(old_bc.num_tokens > 0);
 
-    int start_depth = old_bc.tokensInfo[result_index].abs_depth_in_request;
-    if (committed_tokens.find(guid) == committed_tokens.end()) {
-      committed_tokens[guid] = std::vector<std::pair<int, int>>();
+    // reset committed_tokens
+    if (committed_tokens.count(guid) == 0) {
+      committed_tokens[guid] = {};
     } else {
-      committed_tokens.at(guid).clear();
+      committed_tokens[guid].clear();
     }
+
     // iterate through all the tokens that belong to request i
+    int root_abs_depth = request.tokens.size() - 1;
+
     while (result_index < old_bc.num_tokens &&
            old_bc.tokensInfo[result_index].request_index == i) {
-      // new tokens have not been appended yet, so the last appended token is
-      // the root of the beam search token tree
-      int root_abs_depth = request.tokens.size() - 1;
-      if (old_bc.tokensInfo[result_index].abs_depth_in_request >=
-          root_abs_depth) {
-        // append to tree_outputs a pair consisting of (token id, depth)
-        tree_outputs.push_back(std::make_pair(
-            result.token_ids[result_index],
-            old_bc.tokensInfo[result_index].abs_depth_in_request + 1));
-        // append (depth, index of the token in result) to committed_tokens
-        // array
-        committed_tokens.at(guid).push_back(
-            std::make_pair(old_bc.tokensInfo[result_index].abs_depth_in_request,
-                           result_index));
+      int abs_depth = old_bc.tokensInfo[result_index].abs_depth_in_request;
+      int token_id = result.token_ids[result_index];
+
+      if (request.status == Request::PENDING) {
+        committed_tokens[guid].emplace_back(abs_depth, result_index);
+      } else if (abs_depth >= root_abs_depth) {
+        tree_outputs.emplace_back(token_id, abs_depth + 1);
+        committed_tokens[guid].emplace_back(abs_depth, result_index);
 
         if (verbose) {
           std::cout << "Index within old batch: " << result_index << std::endl;
           printf("  Input: [%d] %d ---> [%d] %d \n",
-                 old_bc.tokensInfo[result_index].abs_depth_in_request,
+                 abs_depth,
                  old_bc.tokensInfo[result_index].token_id,
                  tree_outputs.back().second,
-                 tree_outputs.back().first);
+                 token_id);
         }
-        // std::cout << "  Input: " << old_bc.tokensInfo[result_index].token_id
-        // << ""
-        //   << old_bc.tokensInfo[result_index].abs_depth_in_request <<
-        //   std::endl;
-        // std::cout << "  Result: " << result.token_ids[result_index] << ",
-        // depth: "
-        //   << old_bc.tokensInfo[result_index].abs_depth_in_request + 1 <<
-        //   std::endl;
+        std::cout << "Index within old batch: " << result_index << std::endl;
+        printf("  Input: [%d] %d ---> [%d] %d \n",
+               abs_depth,
+               old_bc.tokensInfo[result_index].token_id,
+               tree_outputs.back().second,
+               token_id);
       }
       result_index++;
     }
 
-    std::vector<std::pair<BatchConfig::TokenId, int>> verified_tokens =
-        traverse_verify_tree(guid, dfs_tree_inputs.at(guid), tree_outputs);
-    log_req_mgr.print("Number of Verified Tokens = %zu",
-                      verified_tokens.size());
-    // check if the request is finished
-    if (verified_tokens.size() + request.tokens.size() >=
-        request.max_sequence_length) {
-      // Append all verified tokens to the request
-      for (int j = 0; j < verified_tokens.size(); j++) {
-        if (verified_tokens[j].second < request.max_sequence_length) {
-          request.tokens.push_back(verified_tokens[j].first);
+    if (request.status == Request::RUNNING) {
+      std::vector<std::pair<BatchConfig::TokenId, int>> verified_tokens =
+          traverse_verify_tree(guid, dfs_tree_inputs.at(guid), tree_outputs);
+      log_req_mgr.print("Number of Verified Tokens = %zu",
+                        verified_tokens.size());
+
+      // check if the request is finished
+      if (verified_tokens.size() + request.tokens.size() >=
+          request.max_sequence_length) {
+        // Append all verified tokens to the request
+        for (auto const &token_pair : verified_tokens) {
+          if (token_pair.second < request.max_sequence_length) {
+            request.tokens.push_back(token_pair.first);
+          }
         }
-      }
-      request.status = Request::COMPLETED;
-      log_req_mgr.print("[Done] guid(%zu) with final length(%zu)",
-                        request.guid,
-                        request.tokens.size());
-      std::string output = this->tokenizer_->Decode(request.tokens);
-      {
-        // update generation result and trigger future
-        GenerationResult &gr = request_generation_results[request.guid];
-        assert(gr.guid == request.guid);
-        gr.output_tokens = request.tokens;
-        gr.output_text = output;
-      }
-      log_req_mgr.print("Final output: %s", output.c_str());
-      new_bc.request_completed[i] = true;
-      num_processed_requests++;
-      ProfileInfo profile_info = profiling_requests[request.guid];
-      profile_info.finish_time = Realm::Clock::current_time_in_microseconds();
-      total_request_run_time +=
-          profile_info.finish_time - profile_info.start_time;
-      profiling_requests[request.guid] = profile_info;
-      log_req_mgr.print("[Profile] guid(%zu) decoding_steps(%d) start(%.1lf) "
-                        "finish(%.1lf) latency(%.1lf)",
-                        request.guid,
-                        profile_info.decoding_steps,
-                        profile_info.start_time,
-                        profile_info.finish_time,
-                        profile_info.finish_time - profile_info.start_time);
-
-      // Write output to file if needed:
-      if (!output_filepath.empty()) {
-        std::ofstream outputFile(output_filepath);
-        if (outputFile.is_open()) {
-          outputFile << "end-to-end latency: " << std::fixed
-                     << std::setprecision(3) << total_request_run_time
-                     << std::endl;
-          outputFile << "num decoding steps: " << profile_info.decoding_steps
-                     << std::endl;
-          outputFile << "token IDs: ";
-          for (int i = 0; i < request.tokens.size(); i++) {
-            outputFile << request.tokens[i];
-            if (i < request.tokens.size() - 1) {
-              outputFile << ",";
+        request.status = Request::COMPLETED;
+        log_req_mgr.print("[Done] guid(%zu) with final length(%zu)",
+                          request.guid,
+                          request.tokens.size());
+        std::string output = this->tokenizer_->Decode(request.tokens);
+        {
+          // update generation result and trigger future
+          GenerationResult &gr = request_generation_results[request.guid];
+          assert(gr.guid == request.guid);
+          gr.output_tokens = request.tokens;
+          gr.output_text = output;
+        }
+        log_req_mgr.print("Final output: %s", output.c_str());
+
+        new_bc.request_completed[i] = true;
+        new_bc.request_running[i] = false;
+        num_processed_requests++;
+
+        // Log profiling info
+        ProfileInfo profile_info = profiling_requests[request.guid];
+        profile_info.finish_time = Realm::Clock::current_time_in_microseconds();
+        total_request_run_time +=
+            profile_info.finish_time - profile_info.start_time;
+        profiling_requests[request.guid] = profile_info;
+        log_req_mgr.print("[Profile] guid(%zu) decoding_steps(%d) start(%.1lf) "
+                          "finish(%.1lf) latency(%.1lf)",
+                          request.guid,
+                          profile_info.decoding_steps,
+                          profile_info.start_time,
+                          profile_info.finish_time,
+                          profile_info.finish_time - profile_info.start_time);
+
+        // Write output to file if needed:
+        if (!output_filepath.empty()) {
+          std::ofstream outputFile(output_filepath);
+          if (outputFile.is_open()) {
+            outputFile << "end-to-end latency: " << std::fixed
+                       << std::setprecision(3)
+                       << profile_info.finish_time - profile_info.start_time
+                       << std::endl;
+            outputFile << "num decoding steps: " << profile_info.decoding_steps
+                       << std::endl;
+            outputFile << "token IDs: ";
+            for (int i = 0; i < request.tokens.size(); i++) {
+              outputFile << request.tokens[i];
+              if (i < request.tokens.size() - 1) {
+                outputFile << ",";
+              }
             }
+            outputFile << std::endl;
+            outputFile << output;
+            outputFile.close();
+          } else {
+            std::cout << "Unable to open the output file: " << output_filepath
+                      << std::endl;
+            assert(false);
           }
-          outputFile << std::endl;
-          outputFile << output;
-          outputFile.close();
-        } else {
-          std::cout << "Unable to open the output file: " << output_filepath
-                    << std::endl;
-          assert(false);
         }
-      }
 
-      // delete the old input tree from cache
-      dfs_tree_inputs.erase(request.guid);
+        // delete the old input tree from cache
+        dfs_tree_inputs.erase(request.guid);
 
-      continue;
-    }
+      } else { // Request not finished, pass verified_tokens to next iteration
 
-    new_bc.request_completed[i] = false;
-
-    // Normal Request Info
-    new_bc.requestsInfo[i].token_start_offset = verified_tokens.front().second;
-    new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
-    new_bc.requestsInfo[i].max_sequence_length =
-        old_bc.requestsInfo[i].max_sequence_length;
-    new_bc.requestsInfo[i].num_tokens_in_batch = verified_tokens.size();
-
-    // TODO: Beam Request Info, missing from VerifyTreeBatchConfig
-    int new_max_depth = new_bc.requestsInfo[i].max_sequence_length -
-                        new_bc.requestsInfo[i].token_start_offset -
-                        verified_tokens.size();
-    new_bc.beamRequestsInfo[i].current_depth = 1;
-    new_bc.beamRequestsInfo[i].beam_size =
-        BeamSearchBatchConfig::MAX_BEAM_WIDTH;
-    new_bc.beamRequestsInfo[i].max_depth =
-        std::min(new_max_depth, BeamSearchBatchConfig::MAX_BEAM_DEPTH);
-    for (int j = 0; j < BeamSearchBatchConfig::MAX_BEAM_WIDTH; j++) {
-      new_bc.beamRequestsInfo[i].parent_id[j] = 0;
-      new_bc.beamRequestsInfo[i].probs[j] = 1;
-    }
+        new_bc.request_completed[i] = false;
+        new_bc.request_running[i] = true;
+
+        // Normal Request Info
+        new_bc.requestsInfo[i].token_start_offset =
+            verified_tokens.front().second;
+        new_bc.requestsInfo[i].request_guid =
+            old_bc.requestsInfo[i].request_guid;
+        new_bc.requestsInfo[i].max_sequence_length =
+            old_bc.requestsInfo[i].max_sequence_length;
+        new_bc.requestsInfo[i].num_tokens_in_batch = verified_tokens.size();
 
-    new_bc.sub_requests[i] = 1;
+        // TODO: Beam Request Info, missing from VerifyTreeBatchConfig
+        int new_max_depth = new_bc.requestsInfo[i].max_sequence_length -
+                            new_bc.requestsInfo[i].token_start_offset -
+                            verified_tokens.size();
+        new_bc.beamRequestsInfo[i].current_depth = 1;
+        new_bc.beamRequestsInfo[i].beam_size =
+            BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+        new_bc.beamRequestsInfo[i].max_depth =
+            std::min(new_max_depth, BeamSearchBatchConfig::MAX_BEAM_DEPTH);
+        for (int j = 0; j < BeamSearchBatchConfig::MAX_BEAM_WIDTH; j++) {
+          new_bc.beamRequestsInfo[i].parent_id[j] = 0;
+          new_bc.beamRequestsInfo[i].probs[j] = 1;
+        }
 
-    // Token Info
-    for (int j = 0; j < verified_tokens.size(); j++) {
-      auto token = verified_tokens.at(j);
+        new_bc.sub_requests[i] = 1;
 
-      // Normal Token Info
-      new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
-      new_bc.tokensInfo[new_bc.num_tokens].token_id = token.first;
-      new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = token.second;
+        // Token Info
+        for (int j = 0; j < verified_tokens.size(); j++) {
+          auto token = verified_tokens.at(j);
 
-      // Beam Token Info
-      new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = 0;
-      new_bc.num_tokens++;
+          // Normal Token Info
+          new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
+          new_bc.tokensInfo[new_bc.num_tokens].token_id = token.first;
+          new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request =
+              token.second;
 
-      // Add verified token to request's token list
-      request.tokens.push_back(token.first);
+          // Beam Token Info
+          new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = 0;
+          new_bc.num_tokens++;
 
-      if (new_bc.num_tokens == BatchConfig::MAX_NUM_TOKENS) {
-        break;
+          // Add verified token to request's token list
+          request.tokens.push_back(token.first);
+
+          if (new_bc.num_tokens == BatchConfig::MAX_NUM_TOKENS) {
+            break;
+          }
+        }
+        std::string output = this->tokenizer_->Decode(request.tokens);
+        log_req_mgr.print("Output: %s", output.c_str());
       }
+    } else if (request.status == Request::PENDING) {
+      new_bc.request_completed[i] = false;
+      new_bc.request_running[i] = false;
+
+      std::cout << "ssm_cache_size: " << request.ssm_cache_size << ", "
+                << "initial_len: " << request.initial_len << std::endl;
+      assert(request.ssm_cache_size == request.initial_len);
+
+      // Normal Request Info
+      new_bc.requestsInfo[i].token_start_offset = request.ssm_cache_size;
+      new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
+      new_bc.requestsInfo[i].max_sequence_length =
+          old_bc.requestsInfo[i].max_sequence_length;
+      new_bc.requestsInfo[i].num_tokens_in_batch = 0;
+
+      // TODO: Beam Request Info, missing from VerifyTreeBatchConfig
+      new_bc.beamRequestsInfo[i].current_depth = 1;
+      new_bc.beamRequestsInfo[i].beam_size =
+          BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+      new_bc.beamRequestsInfo[i].max_depth = 0;
+      for (int j = 0; j < BeamSearchBatchConfig::MAX_BEAM_WIDTH; j++) {
+        new_bc.beamRequestsInfo[i].parent_id[j] = 0;
+        new_bc.beamRequestsInfo[i].probs[j] = 1;
+      }
+
+      new_bc.sub_requests[i] = 1;
+
+      // Token Info
+      std::string output = this->tokenizer_->Decode(request.tokens);
+      log_req_mgr.print("Output: %s", output.c_str());
+    } else {
+      assert(false);
     }
-    std::string output = this->tokenizer_->Decode(request.tokens);
-    log_req_mgr.print("Output: %s", output.c_str());
   }
 
   // Step 2: Initialize new request
-  new_bc.max_init_length = 0;
   for (int i = 0; i < BeamSearchBatchConfig::MAX_NUM_REQUESTS; i++) {
     if (new_bc.request_completed[i]) {
       if (!pending_request_queue.empty() &&
           new_bc.num_tokens < BeamSearchBatchConfig::MAX_NUM_TOKENS) {
         Request new_request = pending_request_queue.front();
         pending_request_queue.pop();
-        new_bc.max_init_length =
-            std::max(new_bc.max_init_length, new_request.initial_len);
         // all_requests[new_request.guid] = new_request;
         new_bc.requestsInfo[i].token_start_offset = 0;
         new_bc.requestsInfo[i].request_guid = new_request.guid;
@@ -886,6 +780,33 @@ BeamSearchBatchConfig
           new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = 0;
           new_bc.num_tokens++;
         }
+
+        // if (new_bc.requestsInfo[i].num_tokens_in_batch <
+        // new_request.initial_len) {
+        //   all_requests[new_request.guid].status = Request::PENDING;
+        //   new_bc.request_running[i] = false;
+        //   std::cout << "Request " << new_request.guid << " is pending"
+        //             << std::endl;
+        // } else {
+        //   all_requests[new_request.guid].status = Request::RUNNING;
+        //   new_bc.request_running[i] = true;
+        //   std::cout << "Request " << new_request.guid << " is running"
+        //             << std::endl;
+        // }
+        all_requests[new_request.guid].status = Request::PENDING;
+        all_requests[new_request.guid].ssm_cache_size =
+            new_bc.requestsInfo[i].num_tokens_in_batch;
+        new_bc.request_running[i] = false;
+        std::cout << "SSM KV Cache Size init: "
+                  << all_requests[new_request.guid].ssm_cache_size << std::endl;
+        std::cout << "LLM KV Cache Size init: "
+                  << all_requests[new_request.guid].llm_cache_size << std::endl;
+
+        std::cout << "load " << new_bc.requestsInfo[i].num_tokens_in_batch
+                  << " tokens for request " << new_request.guid << std::endl;
+        std::cout << "total prompt in request: " << new_request.initial_len
+                  << std::endl;
+
         if (new_bc.num_tokens == BatchConfig::MAX_NUM_TOKENS) {
           break;
         }
@@ -902,6 +823,209 @@ BeamSearchBatchConfig
   return new_bc;
 }
 
+/***** Beam Search Phase *****/
+BeamSearchBatchConfigFuture RequestManager::prepare_next_batch_beam(
+    BeamSearchBatchConfigFuture const &old_bc,
+    BeamInferenceResultFuture const &result) {
+  Runtime *runtime = Runtime::get_runtime();
+  Context ctx = Runtime::get_context();
+
+  RequestManager *rm = this;
+  TaskLauncher launcher(RM_PREPARE_NEXT_BATCH_BEAM_TASK_ID,
+                        TaskArgument(&rm, sizeof(RequestManager *)));
+  launcher.add_future(old_bc);
+  launcher.add_future(result);
+  return runtime->execute_task(ctx, launcher);
+}
+
+BeamSearchBatchConfig RequestManager::prepare_next_batch_beam_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  RequestManager *rm = *((RequestManager **)task->args);
+  BeamSearchBatchConfig const &bc =
+      Future(task->futures[0]).get_result<BeamSearchBatchConfig>();
+  BeamInferenceResult const &result =
+      Future(task->futures[1]).get_result<BeamInferenceResult>();
+  return rm->prepare_next_batch_beam(bc, result);
+}
+
+// update beam search metadata
+BeamSearchBatchConfig
+    RequestManager::prepare_next_batch_beam(BeamSearchBatchConfig const &old_bc,
+                                            BeamInferenceResult const &result) {
+  const std::lock_guard<std::mutex> lock(request_queue_mutex);
+  if (verbose) {
+    std::cout << "\n############### prepare_next_batch_beam ###############\n";
+  }
+  if (verbose) {
+    std::cout << "print all results"
+              << "\n";
+    for (int i = 0; i < 40; i++) {
+      std::cout << result.token_ids[i] << ", ";
+    }
+    std::cout << "Current Beam Depth: "
+              << old_bc.beamRequestsInfo[0].current_depth << "\n";
+  }
+  // Step 1: Store result to the beam tree struct
+  store_beam_metadata(old_bc, result);
+
+  // Step 2: preparing the next batch for existing requests
+  BeamSearchBatchConfig new_bc;
+  new_bc.model_id = old_bc.model_id;
+  // std::cout << "old_bc.model_id: " << old_bc.model_id << "\n";
+
+  for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
+    if (old_bc.request_completed[i]) {
+      continue;
+    }
+    // Comment out this assertion since num_tokens_in_batch can be
+    // zero when beam search has reached required sequence length
+    // assert(old_bc.requestsInfo[i].num_tokens_in_batch > 0);
+    Request &request = all_requests[old_bc.requestsInfo[i].request_guid];
+    int processed_tokens = old_bc.requestsInfo[i].token_start_offset +
+                           old_bc.requestsInfo[i].num_tokens_in_batch;
+
+    // assert(processed_tokens < request.tokens.size());
+    log_req_mgr.debug() << "processed_tokens: " << processed_tokens << "\n";
+    // if (processed_tokens >
+    //         old_bc.beamRequestsInfo[i].max_depth + request.tokens.size() &&
+    //     request.status == Request::RUNNING
+    //     // || ir.results[t] == 0 TODO: replace this with <EOS>
+    // ) {
+    //   // log_req_mgr.print("[Done] guid(%zu) with spec_tree_depth(%d)",
+    //   //                   old_bc.requestsInfo[i].request_guid,
+    //   //                   old_bc.beamRequestsInfo[i].max_depth);
+    //   // // new_bc.request_completed[i] = true;
+    //   // new_bc.request_completed[i] = false;
+    //   // new_bc.requestsInfo[i].token_start_offset = processed_tokens;
+    //   // new_bc.requestsInfo[i].request_guid =
+    //   // old_bc.requestsInfo[i].request_guid;
+    //   // new_bc.requestsInfo[i].max_sequence_length =
+    //   //     old_bc.requestsInfo[i].max_sequence_length;
+    //   // new_bc.beamRequestsInfo[i].current_depth =
+    //   //       old_bc.beamRequestsInfo[i].current_depth;
+    //   // new_bc.request_running[i] = false;
+    //   std::cout << "beam search end:" << request.status << i << ", "
+    //             << new_bc.requestsInfo[i].num_tokens_in_batch << "\n";
+    // }
+    // else
+    {
+      log_req_mgr.debug() << "num tokens: " << old_bc.num_tokens << ", "
+                          << new_bc.num_tokens;
+      new_bc.request_completed[i] = false;
+      new_bc.requestsInfo[i].token_start_offset = processed_tokens;
+      new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
+      new_bc.requestsInfo[i].max_sequence_length =
+          old_bc.requestsInfo[i].max_sequence_length;
+
+      // update the beam search metadata
+      // how many sub request in current request
+      // why is sub_requests has MAX_NUM_REQUESTS * MAX_BEAM_WIDTH entries?
+      new_bc.sub_requests[i] = old_bc.beamRequestsInfo[i].beam_size;
+
+      // update the parentid, accumalated_probs, depth, and token_ids
+      new_bc.beamRequestsInfo[i].beam_size =
+          old_bc.beamRequestsInfo[i].beam_size;
+      new_bc.beamRequestsInfo[i].max_depth =
+          old_bc.beamRequestsInfo[i].max_depth;
+      if (request.status == Request::RUNNING) {
+        new_bc.beamRequestsInfo[i].current_depth =
+            old_bc.beamRequestsInfo[i].current_depth + 1;
+        new_bc.request_running[i] = true;
+        // do the slot exchange to minimize the cache exchange in kernel.
+        update_beam_metadata(new_bc, request.beam_trees.at(old_bc.model_id), i);
+      } else {
+        // if the request is pending, we need to update the beam search
+        // metadata based on the initial length
+        new_bc.beamRequestsInfo[i].current_depth =
+            old_bc.beamRequestsInfo[i].current_depth;
+        new_bc.request_running[i] = false;
+      }
+
+      // do the slot exchange to minimize the cache exchange in kernel.
+      // update_beam_metadata(new_bc, request.beam_trees.at(old_bc.model_id),
+      // i);
+      if (new_bc.requestsInfo[i].token_start_offset >= request.tokens.size()) {
+        // Incremental phase
+        if (request.status == Request::RUNNING) {
+          new_bc.requestsInfo[i].num_tokens_in_batch = 1;
+        } else {
+          new_bc.requestsInfo[i].num_tokens_in_batch = 0;
+        }
+
+        if (verbose) {
+          std::cout << "[ Beam Spec] " << request.guid << std::endl;
+          std::cout << "Incremental phase: " << request.tokens.size()
+                    << ", num_tokens_in_batch: "
+                    << new_bc.requestsInfo[i].num_tokens_in_batch << std::endl;
+        }
+      } else {
+        // Prompt phase
+        new_bc.requestsInfo[i].num_tokens_in_batch =
+            // std::min(BatchConfig::MAX_NUM_TOKENS - new_bc.num_tokens,
+            std::min(BatchConfig::MAX_NUM_TOKENS - new_bc.num_tokens -
+                         BatchConfig::MAX_NUM_REQUESTS + i,
+                     (int)request.tokens.size() -
+                         new_bc.requestsInfo[i].token_start_offset);
+        request.ssm_cache_size += new_bc.requestsInfo[i].num_tokens_in_batch;
+        if (verbose) {
+          std::cout << "[ Beam Spec] " << request.guid << std::endl;
+          std::cout << "Prompt phase: " << request.tokens.size()
+                    << ", num_tokens_in_batch:"
+                    << new_bc.requestsInfo[i].num_tokens_in_batch << std::endl;
+          std::cout << "Update ssm cache size: " << request.ssm_cache_size
+                    << std::endl;
+        }
+      }
+
+      if (verbose) {
+        std::cout << "SSM KV Cache Size beam: " << request.ssm_cache_size
+                  << std::endl;
+        std::cout << "LLM KV Cache Size beam: " << request.llm_cache_size
+                  << std::endl;
+      }
+
+      // register more tokens due to the beam width
+      for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
+        int depth = new_bc.requestsInfo[i].token_start_offset + j;
+        for (int k = 0; k < new_bc.sub_requests[i]; k++) {
+          new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
+          new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = depth;
+
+          // get value from requestinfo
+          if (request.status == Request::RUNNING) {
+            // std::cout << "[running ]Num of token in batch: "
+            //           << new_bc.requestsInfo[i].num_tokens_in_batch
+            //           << std::endl;
+            new_bc.tokensInfo[new_bc.num_tokens].token_id =
+                new_bc.beamRequestsInfo[i].tokens[k];
+          } else {
+            // std::cout << "[pending ]Num of token in batch: "
+            //           << new_bc.requestsInfo[i].num_tokens_in_batch
+            //           << std::endl;
+            new_bc.tokensInfo[new_bc.num_tokens].token_id =
+                request.tokens[request.tokens.size() - 1];
+          }
+
+          new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = k;
+          new_bc.num_tokens++;
+        }
+      }
+    }
+  }
+  if (verbose) {
+    std::cout << "prepare_next_batch_beam OLD vs NEW batchconfigs:"
+              << std::endl;
+    old_bc.print();
+    new_bc.print();
+  }
+  return new_bc;
+}
+
+/***** Verify Phase *****/
+
 TreeVerifyBatchConfigFuture RequestManager::prepare_next_batch_verify(
     std::vector<BeamSearchBatchConfigFuture> const &old_batches) {
   Runtime *runtime = Runtime::get_runtime();
@@ -943,6 +1067,17 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
   new_bc.num_tokens_to_commit = 0;
   new_bc.num_tokens = 0;
 
+  int max_prompt_load_size = BatchConfig::MAX_NUM_TOKENS;
+  for (int i = 0; i < TreeVerifyBatchConfig::MAX_NUM_REQUESTS; i++) {
+    if (old_batches.at(0).request_completed[i]) {
+      continue;
+    } else if (old_batches.at(0).request_running[i]) {
+      max_prompt_load_size -= (BeamSearchBatchConfig::MAX_BEAM_DEPTH + 1);
+    } else {
+      max_prompt_load_size -= 1;
+    }
+  }
+
   for (int i = 0; i < TreeVerifyBatchConfig::MAX_NUM_REQUESTS; i++) {
     if (old_batches.at(0).request_completed[i]) {
       continue;
@@ -950,60 +1085,73 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
     size_t guid = old_batches.at(0).requestsInfo[i].request_guid;
     Request &request = all_requests[guid];
 
-    // Get the dfs tree
-    std::vector<std::vector<std::pair<BatchConfig::TokenId, int>>>
-        all_dfs_trees;
-
-    for (int j = 0; j < old_batches.size(); j++) {
-      std::vector<std::pair<BatchConfig::TokenId, int>> new_tree =
-          traverse_beam_tree(old_batches.at(j), i, request.tokens.size() - 1);
-      all_dfs_trees.push_back(new_tree);
-    }
-    assert(all_dfs_trees.size() == old_batches.size());
-    std::vector<std::pair<BatchConfig::TokenId, int>> dfs_tree_inputs =
-        merge_dfs_trees(all_dfs_trees, request.tokens.size() - 1, guid);
+    // Profiling
+    profiling_requests[request.guid].decoding_steps += 1;
 
-    if (verbose) {
-      std::cout << "Request Tokens Size: " << request.tokens.size()
+    if (request.status == Request::RUNNING) {
+      new_bc.request_running[i] = true;
+      std::cout << "[Verify] Request " << request.guid << " is running"
                 << std::endl;
-      for (int k = 0; k < request.tokens.size(); k++) {
-        std::cout << k << ": " << request.tokens[k] << std::endl;
-      }
-    }
 
-    // Normal Request Info
-    new_bc.requestsInfo[i].token_start_offset = dfs_tree_inputs.front().second;
-    new_bc.requestsInfo[i].request_guid =
-        old_batches.at(0).requestsInfo[i].request_guid;
-    new_bc.requestsInfo[i].max_sequence_length =
-        old_batches.at(0).requestsInfo[i].max_sequence_length;
-    // TODO: Check this
-    new_bc.requestsInfo[i].num_tokens_in_batch = 0;
-    new_bc.request_completed[i] = false;
+      // Get the dfs tree
+      std::vector<std::vector<std::pair<BatchConfig::TokenId, int>>>
+          all_dfs_trees;
 
-    // Profiling
-    profiling_requests[new_bc.requestsInfo[i].request_guid].decoding_steps += 1;
-    // TODO: Add prompt token first in first verify iteration
-    if (request.tokens.size() == request.initial_len) {
-      // Initialization (prompt) phase
-      for (int j = 0; j < request.initial_len; j++) {
-        new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
-        new_bc.tokensInfo[new_bc.num_tokens].token_id = request.tokens[j];
-        new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = j;
+      for (int j = 0; j < old_batches.size(); j++) {
+        std::vector<std::pair<BatchConfig::TokenId, int>> new_tree =
+            traverse_beam_tree(old_batches.at(j), i, request.tokens.size() - 1);
+        all_dfs_trees.push_back(new_tree);
+      }
+      assert(all_dfs_trees.size() == old_batches.size());
+      std::vector<std::pair<BatchConfig::TokenId, int>> dfs_tree_inputs =
+          merge_dfs_trees(all_dfs_trees, request.tokens.size() - 1, guid);
 
-        new_bc.num_tokens++;
-        new_bc.requestsInfo[i].num_tokens_in_batch++;
+      if (verbose) {
+        std::cout << "Request Tokens Size: " << request.tokens.size()
+                  << std::endl;
+        for (int k = 0; k < request.tokens.size(); k++) {
+          std::cout << k << ": " << request.tokens[k] << std::endl;
+        }
       }
 
-      std::cout << "new_bc.num_tokens: " << new_bc.num_tokens << std::endl;
-      if (new_bc.num_tokens >= BatchConfig::MAX_NUM_TOKENS) {
-        assert(false &&
-               "Exceeding the space available in the TreeVerify batch");
-        break;
+      // Normal Request Info
+      new_bc.requestsInfo[i].token_start_offset =
+          dfs_tree_inputs.front().second;
+      new_bc.requestsInfo[i].request_guid =
+          old_batches.at(0).requestsInfo[i].request_guid;
+      new_bc.requestsInfo[i].max_sequence_length =
+          old_batches.at(0).requestsInfo[i].max_sequence_length;
+      // TODO: Check this
+      new_bc.requestsInfo[i].num_tokens_in_batch = 0;
+      new_bc.request_completed[i] = false;
+
+      // Committed Tokens
+      if (committed_tokens.find(guid) != committed_tokens.end()) {
+        for (int j = 0; j < dfs_tree_inputs.size(); j++) {
+          if (j < committed_tokens.at(guid).size()) {
+            auto committed_token = committed_tokens.at(guid).at(j);
+            new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_index =
+                committed_token.second;
+            new_bc.committed_tokens[new_bc.num_tokens_to_commit].request_index =
+                i;
+            new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_depth =
+                committed_token.first;
+            if (verbose) {
+              std::cout << new_bc.num_tokens_to_commit
+                        << "- committed_token.token_depth: "
+                        << committed_token.first
+                        << ", token_index: " << committed_token.second
+                        << std::endl;
+            }
+            new_bc.num_tokens_to_commit++;
+          }
+        }
+      }
+      if (verbose) {
+        std::cout << "new_bc.num_tokens_to_commit: "
+                  << new_bc.num_tokens_to_commit << std::endl;
       }
 
-      new_bc.requestsInfo[i].token_start_offset = 0;
-    } else {
       // Incremental phase: only add the last committed token
       new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
       new_bc.tokensInfo[new_bc.num_tokens].token_id = request.tokens.back();
@@ -1013,116 +1161,124 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       new_bc.num_tokens++;
       new_bc.requestsInfo[i].num_tokens_in_batch++;
 
-      if (new_bc.num_tokens == BatchConfig::MAX_NUM_TOKENS) {
+      if (new_bc.num_tokens > BatchConfig::MAX_NUM_TOKENS) {
         assert(false &&
                "Exceeding the space available in the TreeVerify batch");
         break;
       }
 
       new_bc.requestsInfo[i].token_start_offset = request.tokens.size() - 1;
-    }
-
-    if (verbose) {
-      std::cout << "dfs_tree_inputs.size(): " << dfs_tree_inputs.size()
-                << std::endl;
-    }
 
-    // add prompt to the dfs tree
-    if (committed_tokens.find(guid) != committed_tokens.end()) {
-      if (dfs_tree_inputs.at(0).second ==
-          request.initial_len + committed_tokens.at(guid).size() - 1) {
-        for (int j = 0; j < request.initial_len; j++) {
-          new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_index = j;
-          new_bc.committed_tokens[new_bc.num_tokens_to_commit].request_index =
-              i;
-          new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_depth = j;
-          if (verbose) {
-            std::cout << new_bc.num_tokens_to_commit
-                      << "- committed_token.token_depth: " << j
-                      << ", token_index: " << j << std::endl;
-          }
-          new_bc.num_tokens_to_commit++;
-        }
-      } else {
-        // only add the root token
-        auto committed_token = committed_tokens.at(guid).at(0);
-        new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_index =
-            committed_token.second;
-        new_bc.committed_tokens[new_bc.num_tokens_to_commit].request_index = i;
-        new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_depth =
-            committed_token.first;
+      // Add Tokens from the DFS Tree to the next batch
+      for (int j = 1; j < dfs_tree_inputs.size(); j++) {
+        auto token = dfs_tree_inputs.at(j);
         if (verbose) {
-          std::cout << new_bc.num_tokens_to_commit
-                    << "- committed_token.token_depth: "
-                    << committed_token.first
-                    << ", token_index: " << committed_token.second << std::endl;
+          std::cout << "[" << j << "] Token: " << token.first
+                    << ", Depth:" << token.second << std::endl;
         }
-        new_bc.num_tokens_to_commit++;
-      }
-      if (verbose) {
-        std::cout << "new_bc.num_tokens_to_commit: "
-                  << new_bc.num_tokens_to_commit << std::endl;
-      }
-    }
+        // Normal Token Info
+        new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
+        new_bc.tokensInfo[new_bc.num_tokens].token_id = token.first;
+        new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request =
+            token.second;
 
-    // Token Info
-    for (int j = 1; j < dfs_tree_inputs.size(); j++) {
-      auto token = dfs_tree_inputs.at(j);
-      if (verbose) {
-        std::cout << "[" << j << "] Token: " << token.first
-                  << ", Depth:" << token.second << std::endl;
+        new_bc.num_tokens++;
+        new_bc.requestsInfo[i].num_tokens_in_batch++;
+
+        if (new_bc.num_tokens == BatchConfig::MAX_NUM_TOKENS - 1) {
+          break;
+        }
       }
-      // Normal Token Info
-      new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
-      new_bc.tokensInfo[new_bc.num_tokens].token_id = token.first;
-      new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = token.second;
 
-      // TODO: Add committed token info
+    } else if (request.status == Request::PENDING) {
+      new_bc.request_running[i] = false;
       if (verbose) {
-        std::cout << "committed_tokens.size(): " << new_bc.num_tokens_to_commit
+        std::cout << "[Verify] Request " << request.guid
+                  << " is pending in loading prompt phase" << std::endl;
+        std::cout << "SSM KV Cache Size verify: " << request.ssm_cache_size
+                  << std::endl;
+        std::cout << "LLM KV Cache Size verify: " << request.llm_cache_size
                   << std::endl;
       }
 
+      // Commit all tokens from the last loading batch
       if (committed_tokens.find(guid) != committed_tokens.end()) {
-        if (j < committed_tokens.at(guid).size()) {
-          auto committed_token = committed_tokens.at(guid).at(j);
+        for (int j = 0; j < committed_tokens.at(guid).size(); j++) {
+          auto token = committed_tokens.at(guid).at(j);
           new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_index =
-              committed_token.second;
+              token.second;
           new_bc.committed_tokens[new_bc.num_tokens_to_commit].request_index =
               i;
           new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_depth =
-              committed_token.first;
-          if (verbose) {
-            std::cout << new_bc.num_tokens_to_commit
-                      << "- committed_token.token_depth: "
-                      << committed_token.first
-                      << ", token_index: " << committed_token.second
-                      << std::endl;
-          }
+              token.first;
+
           new_bc.num_tokens_to_commit++;
+          request.llm_cache_size++;
         }
-      }
-      if (verbose) {
-        std::cout << "new_bc.num_tokens_to_commit: "
+        std::cout << "[Verify] Committed Tokens from last loading batch: "
                   << new_bc.num_tokens_to_commit << std::endl;
       }
 
-      new_bc.num_tokens++;
-      new_bc.requestsInfo[i].num_tokens_in_batch++;
+      // Normal Request Info
+      new_bc.requestsInfo[i].token_start_offset = request.llm_cache_size;
+      new_bc.requestsInfo[i].request_guid =
+          old_batches.at(0).requestsInfo[i].request_guid;
+      new_bc.requestsInfo[i].max_sequence_length =
+          old_batches.at(0).requestsInfo[i].max_sequence_length;
 
-      if (new_bc.num_tokens == BatchConfig::MAX_NUM_TOKENS - 1) {
-        break;
-      }
-    }
+      new_bc.request_completed[i] = false;
 
-    std::cout << "new_bc.num_tokens: " << new_bc.num_tokens << std::endl;
-  }
+      new_bc.requestsInfo[i].num_tokens_in_batch = std::min(
+          max_prompt_load_size,
+          (int)request.initial_len - new_bc.requestsInfo[i].token_start_offset);
+      max_prompt_load_size -= new_bc.requestsInfo[i].num_tokens_in_batch;
 
-  if (verbose) {
-    std::cout << "prepare_next_batch_verify OLD vs NEW batchconfigs below:"
-              << std::endl;
-    // old_batches.print();
-    // new_bc.print();
+      std::cout << "max_prompt_load_size: " << max_prompt_load_size
+                << std::endl;
+      std::cout << "new_bc.requestsInfo[i].num_tokens_in_batch: " << i << ", "
+                << new_bc.requestsInfo[i].num_tokens_in_batch << std::endl;
+
+      if (request.llm_cache_size < request.initial_len) {
+        // Initialization (prompt) phase
+        for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
+          new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
+          new_bc.tokensInfo[new_bc.num_tokens].token_id =
+              request.tokens[request.llm_cache_size + j];
+          new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request =
+              request.llm_cache_size + j;
+
+          new_bc.num_tokens++;
+        }
+
+        if (new_bc.num_tokens > BatchConfig::MAX_NUM_TOKENS) {
+          assert(false &&
+                 "Exceeding the space available in the TreeVerify batch");
+          break;
+        }
+      } else { // launch the request into running phase after loading all prompt
+        if (BatchConfig::MAX_NUM_TOKENS - new_bc.num_tokens > 0) {
+          request.status = Request::RUNNING;
+          new_bc.request_running[i] = true;
+
+          new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
+          new_bc.tokensInfo[new_bc.num_tokens].token_id = request.tokens.back();
+          new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request =
+              request.tokens.size() - 1;
+
+          new_bc.num_tokens++;
+          new_bc.requestsInfo[i].num_tokens_in_batch++;
+          std::cout << "new_bc.requestsInfo[i].num_tokens_in_batch: "
+                    << new_bc.requestsInfo[i].num_tokens_in_batch << std::endl;
+
+          dfs_tree_inputs[guid] =
+              std::vector<std::pair<BatchConfig::TokenId, int>>{std::make_pair(
+                  request.tokens.back(), request.tokens.size() - 1)};
+        }
+      }
+
+    } else {
+      assert(false && "Request status is not RUNNING or PENDING");
+    }
   }
 
   return new_bc;
@@ -1145,14 +1301,16 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
   }
 
   for (int i = 0; i <= old_bc.num_tokens; i++) {
-    int request_index = old_bc.tokensInfo[i].request_index;
-
-    // End of the request
     if (i == old_bc.num_tokens ||
-        old_bc.requestsInfo[request_index].request_guid != guid) {
+        old_bc.requestsInfo[old_bc.tokensInfo[i].request_index].request_guid !=
+            guid) {
+
+      int index = old_bc.tokensInfo[i - 1].request_index;
+      int beam_size = old_bc.beamRequestsInfo[index].beam_size;
+      int depth = old_bc.beamRequestsInfo[index].current_depth;
 
       // Each token yields (beam_width) results
-      int beam_width = old_bc.beamRequestsInfo[request_index].beam_size;
+      int beam_width = old_bc.beamRequestsInfo[index].beam_size;
 
       // Count tokens sent to model in this request to find the final token's
       // index
@@ -1165,10 +1323,6 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
                   << ", value: " << result.token_ids[result_index] << "\n";
       }
 
-      int index = old_bc.tokensInfo[i - 1].request_index;
-      int beam_size = old_bc.beamRequestsInfo[index].beam_size;
-      int depth = old_bc.beamRequestsInfo[index].current_depth;
-
       Request &request = all_requests[old_bc.requestsInfo[index].request_guid];
 
       if (depth == 1) {
@@ -1212,7 +1366,7 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
 
       // update the guid and start_depth for current request
       if (i < old_bc.num_tokens) {
-        guid = old_bc.requestsInfo[request_index].request_guid;
+        guid = old_bc.requestsInfo[index].request_guid;
         start_depth = old_bc.tokensInfo[i].abs_depth_in_request;
       }
     }
@@ -1585,24 +1739,27 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
   return merged_tree;
 }
 
-GenerationResult FFModel::generate(std::string const &text,
+GenerationResult FFModel::generate(std::vector<std::string> &prompts,
                                    int max_seq_length) {
   RequestManager *rm = RequestManager::get_request_manager();
   if (rm->get_num_ssms() == 0) {
     // No SSMs: perform incremental decoding
-    return rm->generate_incr_decoding(this, text, max_seq_length);
+    return rm->generate_incr_decoding(this, prompts, max_seq_length);
   } else {
     // Registered SSMs: perform speculative inference
-    return rm->generate_spec_infer(this, text, max_seq_length);
+    return rm->generate_spec_infer(this, prompts, max_seq_length);
   }
 }
 
 /*static*/
-GenerationResult RequestManager::generate_incr_decoding(FFModel *llm,
-                                                        std::string const &text,
-                                                        int max_seq_length) {
+GenerationResult RequestManager::generate_incr_decoding(
+    FFModel *llm, std::vector<std::string> &prompts, int max_seq_length) {
   InferenceManager *im = InferenceManager::get_inference_manager();
-  RequestGuid guid = register_new_request(text, max_seq_length);
+  RequestGuid guid;
+  for (int i = 0; i < prompts.size(); i++) {
+    guid = register_new_request(prompts.at(i), max_seq_length);
+  }
+
   if (guid == 0) {
     std::cout
         << "=========== Discard request exceed prompt maximum... ==========="
@@ -1652,11 +1809,13 @@ GenerationResult RequestManager::generate_incr_decoding(FFModel *llm,
 }
 
 /*static*/
-GenerationResult RequestManager::generate_spec_infer(FFModel *llm,
-                                                     std::string const &text,
-                                                     int max_seq_length) {
+GenerationResult RequestManager::generate_spec_infer(
+    FFModel *llm, std::vector<std::string> &prompts, int max_seq_length) {
   InferenceManager *im = InferenceManager::get_inference_manager();
-  RequestGuid guid = register_new_request(text, max_seq_length);
+  RequestGuid guid;
+  for (int i = 0; i < prompts.size(); i++) {
+    guid = register_new_request(prompts.at(i), max_seq_length);
+  }
   if (guid == 0) {
     std::cout
         << "=========== Discard request exceed prompt maximum... ==========="

From 1d5e0c593a956b7fcc789a1b034e6ff920aad1d4 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 26 Sep 2023 18:01:58 -0400
Subject: [PATCH 238/344] Fuse inference kernels (part 3) (#1146)

* cleanup

* linting

* fuse residual + rms_norm (across layers)

* add ResidualLayerNorm operator

* fix

* bug fix, apply residual_layer_norm operator in opt model

* fix bugs

* mpt

* cleanup opt

* starcoder

* falcon

* fusion fix, falcon python

* mpt python

* fix

* fix

* python opt

* starcoder python

* formatting

* rocm fix

* fix rocm 2

* fix rocm 3

* linting
---
 include/flexflow/ffconst.h                    |    1 +
 include/flexflow/flexflow_c.h                 |   13 +
 include/flexflow/model.h                      |   20 +
 include/flexflow/operator_params.h            |    2 +
 include/flexflow/ops/residual_layer_norm.h    |  113 +
 .../flexflow/ops/residual_layer_norm_params.h |   31 +
 include/flexflow/substitution_loader.h        |    1 +
 inference/models/falcon.cc                    |  190 +-
 inference/models/llama.cc                     |  218 +-
 inference/models/mpt.cc                       |  130 +-
 inference/models/opt.cc                       |  142 +-
 inference/models/starcoder.cc                 |  122 +-
 python/flexflow/core/flexflow_cffi.py         | 6689 ++++++++++-------
 python/flexflow/serve/models/falcon.py        |   40 +-
 python/flexflow/serve/models/llama.py         |   25 +-
 python/flexflow/serve/models/mpt.py           |   46 +-
 python/flexflow/serve/models/opt.py           |   23 +-
 python/flexflow/serve/models/starcoder.py     |   26 +-
 python/flexflow/type.py                       |    1 +
 src/c/flexflow_c.cc                           |   65 +-
 src/ops/add_bias_residual_layer_norm.cu       |    8 +-
 src/ops/fused.cpp                             |   45 +
 src/ops/fused.cu                              |   45 +
 src/ops/layer_norm.cu                         |   27 +-
 src/ops/residual_layer_norm.cc                |  823 ++
 src/ops/residual_layer_norm.cpp               |  247 +
 src/ops/residual_layer_norm.cu                |  242 +
 src/runtime/ffconst_utils.cc                  |    2 +
 src/runtime/graph.cc                          |    5 +
 src/runtime/model.cc                          |   40 +
 src/runtime/operator_params.cc                |    3 +
 src/runtime/substitution.cc                   |    1 +
 32 files changed, 6058 insertions(+), 3328 deletions(-)
 create mode 100644 include/flexflow/ops/residual_layer_norm.h
 create mode 100644 include/flexflow/ops/residual_layer_norm_params.h
 create mode 100644 src/ops/residual_layer_norm.cc
 create mode 100644 src/ops/residual_layer_norm.cpp
 create mode 100644 src/ops/residual_layer_norm.cu

diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index 9dc68e21ed..124b46862a 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -159,6 +159,7 @@ enum OperatorType {
   OP_POW,   // https://pytorch.org/docs/stable/generated/torch.pow.html
   OP_MEAN,  // https://pytorch.org/docs/stable/generated/torch.mean.html
   OP_LAYERNORM,
+  OP_RESIDUAL_LAYERNORM,
   OP_ADD_BIAS_RESIDUAL_LAYERNORM,
   OP_SIGMOID_SILU_MULTI,
   OP_EXPERTS,
diff --git a/include/flexflow/flexflow_c.h b/include/flexflow/flexflow_c.h
index 995c238a8c..db034a78c9 100644
--- a/include/flexflow/flexflow_c.h
+++ b/include/flexflow/flexflow_c.h
@@ -259,6 +259,19 @@ flexflow_tensor_t flexflow_model_add_layer_norm(flexflow_model_t handle,
                                                 bool use_bias,
                                                 char const *name);
 
+flexflow_tensor_t *
+    flexflow_model_add_residual_layer_norm(flexflow_model_t handle,
+                                           const flexflow_tensor_t input,
+                                           const flexflow_tensor_t residual1,
+                                           const flexflow_tensor_t residual2,
+                                           bool use_two_residuals,
+                                           int n,
+                                           int *axes,
+                                           bool elementwise_affine,
+                                           float eps,
+                                           bool use_bias,
+                                           char const *name);
+
 flexflow_tensor_t *flexflow_model_add_add_bias_residual_layer_norm(
     flexflow_model_t handle,
     const flexflow_tensor_t input,
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 177575e809..97ee553fb3 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -106,6 +106,8 @@ enum TaskIDs {
   LAYERNORM_FWD_TASK_ID,
   LAYERNORM_INF_TASK_ID,
   LAYERNORM_BWD_TASK_ID,
+  RESIDUAL_LAYERNORM_INIT_TASK_ID,
+  RESIDUAL_LAYERNORM_INF_TASK_ID,
   ADD_BIAS_RESIDUAL_LAYERNORM_INIT_TASK_ID,
   ADD_BIAS_RESIDUAL_LAYERNORM_INF_TASK_ID,
   SIGMOID_SILU_MULTI_INIT_TASK_ID,
@@ -315,6 +317,7 @@ class Flat;
 class Gather;
 class Group_by;
 class LayerNorm;
+class ResidualLayerNorm;
 class AddBiasResidualLayerNorm;
 class SigmoidSiluMulti;
 class Linear;
@@ -541,6 +544,18 @@ class FFModel {
                     bool use_bias = true,
                     DataType data_type = DT_NONE,
                     char const *name = NULL);
+  // Add a layer_norm layer with residual(s)
+  void residual_layer_norm(const Tensor input,
+                           const Tensor residual1,
+                           const Tensor residual2,
+                           Tensor *outputs,
+                           bool use_two_residuals,
+                           std::vector<int> const &axes,
+                           bool elementwise_affine,
+                           float eps,
+                           bool use_bias = true,
+                           DataType data_type = DT_NONE,
+                           char const *name = NULL);
   // Add a add_bias_residual_layer_norm layer
   void add_bias_residual_layer_norm(const Tensor input,
                                     const Tensor residual,
@@ -1148,6 +1163,11 @@ class FFModel {
           Group_by *>,
       std::unordered_map<std::pair<ParallelTensorShape, LayerNormParams>,
                          LayerNorm *>,
+      std::unordered_map<std::pair<std::tuple<ParallelTensorShape,
+                                              ParallelTensorShape,
+                                              ParallelTensorShape>,
+                                   ResidualLayerNormParams>,
+                         ResidualLayerNorm *>,
       std::unordered_map<
           std::pair<std::pair<ParallelTensorShape, ParallelTensorShape>,
                     AddBiasResidualLayerNormParams>,
diff --git a/include/flexflow/operator_params.h b/include/flexflow/operator_params.h
index 31f18049ff..5b187839ef 100644
--- a/include/flexflow/operator_params.h
+++ b/include/flexflow/operator_params.h
@@ -26,6 +26,7 @@
 #include "flexflow/ops/pool_2d_params.h"
 #include "flexflow/ops/reduce_params.h"
 #include "flexflow/ops/reshape_params.h"
+#include "flexflow/ops/residual_layer_norm_params.h"
 #include "flexflow/ops/residual_rms_norm_params.h"
 #include "flexflow/ops/rms_norm_params.h"
 #include "flexflow/ops/sampling_params.h"
@@ -62,6 +63,7 @@ using OperatorParameters = mp::variant<AggregateParams,
                                        GatherParams,
                                        Group_byParams,
                                        LayerNormParams,
+                                       ResidualLayerNormParams,
                                        AddBiasResidualLayerNormParams,
                                        SigmoidSiluMultiParams,
                                        LinearParams,
diff --git a/include/flexflow/ops/residual_layer_norm.h b/include/flexflow/ops/residual_layer_norm.h
new file mode 100644
index 0000000000..39f149554e
--- /dev/null
+++ b/include/flexflow/ops/residual_layer_norm.h
@@ -0,0 +1,113 @@
+#pragma once
+
+#include "flexflow/inference.h"
+#include "flexflow/model.h"
+#include "flexflow/utils/memory_allocator.h"
+namespace FlexFlow {
+
+class ResidualLayerNormMeta;
+
+class ResidualLayerNorm : public Op {
+public:
+  using Params = ResidualLayerNormParams;
+  using Input = std::tuple<ParallelTensor, ParallelTensor, ParallelTensor>;
+  ResidualLayerNorm(FFModel &model,
+                    Params const &params,
+                    Input const &inputs,
+                    bool allocate_weights = false,
+                    char const *name = nullptr);
+  ResidualLayerNorm(FFModel &model,
+                    LayerID const &_layer_guid,
+                    const ParallelTensor _input,
+                    const ParallelTensor _residual1,
+                    const ParallelTensor _residual2,
+                    bool _use_two_residuals,
+                    std::vector<int> const &axes,
+                    bool _elementwise_affine,
+                    bool _use_bias,
+                    float _eps,
+                    bool allocate_weights,
+                    char const *name);
+  void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
+  void forward(FFModel const &) override;
+  void backward(FFModel const &) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfigFuture const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
+  void print_layer(FFModel const &model) override {
+    assert(0);
+  }
+  static Op *
+      create_operator_from_layer(FFModel &model,
+                                 Layer const *layer,
+                                 std::vector<ParallelTensor> const &inputs);
+  void serialize(Legion::Serializer &) const override;
+  static PCG::Node deserialize(FFModel &ff,
+                               Legion::Deserializer &d,
+                               ParallelTensor inputs[],
+                               int num_inputs);
+  Op *materialize(FFModel &ff,
+                  ParallelTensor inputs[],
+                  int num_inputs) const override;
+  ResidualLayerNormParams get_params() const;
+
+  static OpMeta *init_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
+  bool measure_operator_cost(Simulator *sim,
+                             MachineView const &pc,
+                             CostMetrics &cost_metrics) const override;
+  template <typename T>
+  static void inference_kernel(ResidualLayerNormMeta const *m,
+                               T const *input_ptr,
+                               T const *residual1_ptr,
+                               T const *residual2_ptr,
+                               T *added_output_ptr,
+                               T *output_ptr,
+                               T const *gamma_ptr,
+                               T const *beta_ptr,
+                               ffStream_t stream);
+  static void inference_kernel_wrapper(ResidualLayerNormMeta const *m,
+                                       GenericTensorAccessorR const &input,
+                                       GenericTensorAccessorR const &residual1,
+                                       GenericTensorAccessorR const &residual2,
+                                       GenericTensorAccessorW &added_output,
+                                       GenericTensorAccessorW &output,
+                                       GenericTensorAccessorR const &gamma,
+                                       GenericTensorAccessorR const &beta);
+
+public:
+  bool elementwise_affine, use_bias, use_two_residuals;
+  int64_t effective_batch_size, effective_num_elements;
+  float eps;
+  std::vector<int> axes;
+};
+
+class ResidualLayerNormMeta : public OpMeta {
+public:
+  ResidualLayerNormMeta(FFHandler handle,
+                        ResidualLayerNorm const *ln,
+                        MemoryAllocator &gpu_mem_allocator);
+  ~ResidualLayerNormMeta(void);
+
+public:
+  bool elementwise_affine, use_bias, use_two_residuals;
+  int64_t effective_batch_size, effective_num_elements;
+  float eps;
+  void *mean_ptr, *rstd_ptr, *ds_ptr, *db_ptr, *scale_ptr, *bias_ptr;
+  char op_name[MAX_OPNAME];
+  Realm::RegionInstance reserveInst;
+};
+
+}; // namespace FlexFlow
diff --git a/include/flexflow/ops/residual_layer_norm_params.h b/include/flexflow/ops/residual_layer_norm_params.h
new file mode 100644
index 0000000000..24da4a2c08
--- /dev/null
+++ b/include/flexflow/ops/residual_layer_norm_params.h
@@ -0,0 +1,31 @@
+#pragma once
+
+#include "flexflow/ffconst.h"
+#include "flexflow/fftype.h"
+#include "flexflow/parallel_tensor.h"
+
+namespace FlexFlow {
+
+struct ResidualLayerNormParams {
+  LayerID layer_guid;
+  std::vector<int> axes;
+  bool elementwise_affine;
+  float eps;
+  bool use_bias;
+  bool use_two_residuals;
+  bool is_valid(std::tuple<ParallelTensorShape,
+                           ParallelTensorShape,
+                           ParallelTensorShape> const &) const;
+};
+
+bool operator==(ResidualLayerNormParams const &,
+                ResidualLayerNormParams const &);
+
+} // namespace FlexFlow
+
+namespace std {
+template <>
+struct hash<FlexFlow::ResidualLayerNormParams> {
+  size_t operator()(FlexFlow::ResidualLayerNormParams const &) const;
+};
+} // namespace std
diff --git a/include/flexflow/substitution_loader.h b/include/flexflow/substitution_loader.h
index ff2fd10446..e0c252ffd8 100644
--- a/include/flexflow/substitution_loader.h
+++ b/include/flexflow/substitution_loader.h
@@ -125,6 +125,7 @@ NLOHMANN_JSON_SERIALIZE_ENUM(
      {OP_POW, "OP_POW"},
      {OP_MEAN, "OP_MEAN"},
      {OP_LAYERNORM, "OP_LAYERNORM"},
+     {OP_RESIDUAL_LAYERNORM, "OP_RESIDUAL_LAYERNORM"},
      {OP_ADD_BIAS_RESIDUAL_LAYERNORM, "OP_ADD_BIAS_RESIDUAL_LAYERNORM"},
      {OP_SIGMOID_SILU_MULTI, "OP_SIGMOID_SILU_MULTI"},
      {OP_RMS_NORM, "OP_RMS_NORM"},
diff --git a/inference/models/falcon.cc b/inference/models/falcon.cc
index e89e22450c..3be92a953c 100644
--- a/inference/models/falcon.cc
+++ b/inference/models/falcon.cc
@@ -57,22 +57,43 @@ void FALCON::create_falcon_model(FFModel &ff,
                               embed_init,
                               "word_embeddings");
 
+  Tensor mha = nullptr, mlp_output = nullptr;
+  Tensor res_ln_outputs[2] = {nullptr, nullptr};
+
   for (int i = 0; i < falcon_config.n_layer; i++) {
     // set transformer layer id
     ff.set_transformer_layer_id(i);
 
     // step 1: attention
-    std::string layer_name = "layers_" + std::to_string(i) + "_input_layernorm";
-    Tensor att_norm = ff.layer_norm(token,
-                                    axes,
-                                    true,
-                                    falcon_config.layer_norm_epsilon,
-                                    true,
-                                    DT_NONE,
-                                    layer_name.c_str());
-
-    Tensor mha;
-    layer_name = "layers_" + std::to_string(i) + "_attention";
+    Tensor att_norm = nullptr;
+    if (i == 0) {
+      att_norm = ff.layer_norm(
+          token,
+          axes,
+          true,
+          falcon_config.layer_norm_epsilon,
+          true,
+          DT_NONE,
+          std::string("layers_" + std::to_string(i) + "_input_layernorm")
+              .c_str());
+    } else {
+      ff.residual_layer_norm(
+          token,
+          mha,
+          mlp_output,
+          res_ln_outputs,
+          true,
+          axes,
+          true,
+          falcon_config.layer_norm_epsilon,
+          true,
+          DT_NONE,
+          std::string("layers_" + std::to_string(i) + "_input_layernorm")
+              .c_str());
+      token = res_ln_outputs[0];
+      att_norm = res_ln_outputs[1];
+    }
+
     switch (mode) {
       case BEAM_SEARCH_MODE: {
         mha = ff.spec_inc_multiquery_self_attention(
@@ -82,18 +103,19 @@ void FALCON::create_falcon_model(FFModel &ff,
             falcon_config.n_head_kv,
             falcon_config.hidden_size / falcon_config.n_head,
             falcon_config.hidden_size / falcon_config.n_head,
-            0.0f,              /*dropout*/
-            false,             /*qkv_bias*/
-            false,             /*final_bias*/
-            false,             /*add_zero_attn*/
-            DT_NONE,           /*data_type*/
-            NULL,              /*kernel_initializer*/
-            true,              /*apply_rotary_embedding*/
-            false,             /*scaling query*/
-            1.0f,              /*scaling factor*/
-            true,              /*qk_prod_scaling*/
-            false,             /*position_bias*/
-            layer_name.c_str() /*name*/
+            0.0f,    /*dropout*/
+            false,   /*qkv_bias*/
+            false,   /*final_bias*/
+            false,   /*add_zero_attn*/
+            DT_NONE, /*data_type*/
+            NULL,    /*kernel_initializer*/
+            true,    /*apply_rotary_embedding*/
+            false,   /*scaling query*/
+            1.0f,    /*scaling factor*/
+            true,    /*qk_prod_scaling*/
+            false,   /*position_bias*/
+            std::string("layers_" + std::to_string(i) + "_attention")
+                .c_str() /*name*/
         );
         break;
       }
@@ -106,18 +128,19 @@ void FALCON::create_falcon_model(FFModel &ff,
             falcon_config.n_head_kv,
             falcon_config.hidden_size / falcon_config.n_head,
             falcon_config.hidden_size / falcon_config.n_head,
-            0.0f,              /*dropout*/
-            false,             /*qkv_bias*/
-            false,             /*final_bias*/
-            false,             /*add_zero_attn*/
-            DT_NONE,           /*data_type*/
-            nullptr,           /*kernel_initializer*/
-            true,              /*apply_rotary_embedding*/
-            false,             /*scaling query*/
-            1.0f,              /*scaling factor*/
-            true,              /*qk_prod_scaling*/
-            false,             /*position_bias*/
-            layer_name.c_str() /*name*/
+            0.0f,    /*dropout*/
+            false,   /*qkv_bias*/
+            false,   /*final_bias*/
+            false,   /*add_zero_attn*/
+            DT_NONE, /*data_type*/
+            nullptr, /*kernel_initializer*/
+            true,    /*apply_rotary_embedding*/
+            false,   /*scaling query*/
+            1.0f,    /*scaling factor*/
+            true,    /*qk_prod_scaling*/
+            false,   /*position_bias*/
+            std::string("layers_" + std::to_string(i) + "_attention")
+                .c_str() /*name*/
         );
         break;
       }
@@ -130,18 +153,19 @@ void FALCON::create_falcon_model(FFModel &ff,
             falcon_config.n_head_kv,
             falcon_config.hidden_size / falcon_config.n_head,
             falcon_config.hidden_size / falcon_config.n_head,
-            0.0f,              /*dropout*/
-            false,             /*qkv_bias*/
-            false,             /*final_bias*/
-            false,             /*add_zero_attn*/
-            DT_NONE,           /*data_type*/
-            nullptr,           /*kernel_initializer*/
-            true,              /*apply_rotary_embedding*/
-            false,             /*scaling query*/
-            1.0f,              /*scaling factor*/
-            true,              /*qk_prod_scaling*/
-            false,             /*position_bias*/
-            layer_name.c_str() /*name*/
+            0.0f,    /*dropout*/
+            false,   /*qkv_bias*/
+            false,   /*final_bias*/
+            false,   /*add_zero_attn*/
+            DT_NONE, /*data_type*/
+            nullptr, /*kernel_initializer*/
+            true,    /*apply_rotary_embedding*/
+            false,   /*scaling query*/
+            1.0f,    /*scaling factor*/
+            true,    /*qk_prod_scaling*/
+            false,   /*position_bias*/
+            std::string("layers_" + std::to_string(i) + "_attention")
+                .c_str() /*name*/
         );
         break;
       }
@@ -150,45 +174,49 @@ void FALCON::create_falcon_model(FFModel &ff,
       }
     }
 
-    layer_name = "layers_" + std::to_string(i) + "_mlp_dense_h_to_4h";
-    Tensor dense_h_to_4h = ff.dense(att_norm,
-                                    falcon_config.hidden_size * 4,
-                                    AC_MODE_NONE,
-                                    false,
-                                    DT_NONE,
-                                    nullptr,
-                                    nullptr,
-                                    nullptr,
-                                    REG_MODE_NONE,
-                                    0.0f,
-                                    layer_name.c_str());
+    Tensor dense_h_to_4h = ff.dense(
+        att_norm,
+        falcon_config.hidden_size * 4,
+        AC_MODE_NONE,
+        false,
+        DT_NONE,
+        nullptr,
+        nullptr,
+        nullptr,
+        REG_MODE_NONE,
+        0.0f,
+        std::string("layers_" + std::to_string(i) + "_mlp_dense_h_to_4h")
+            .c_str());
 
     dense_h_to_4h = ff.gelu(dense_h_to_4h);
 
-    layer_name = "layers_" + std::to_string(i) + "_mlp_dense_4h_to_h";
-    Tensor mlp_output = ff.dense(dense_h_to_4h,
-                                 falcon_config.hidden_size,
-                                 AC_MODE_NONE,
-                                 false,
-                                 DT_NONE,
-                                 nullptr,
-                                 nullptr,
-                                 nullptr,
-                                 REG_MODE_NONE,
-                                 0.0f,
-                                 layer_name.c_str());
-
-    token = ff.add(token, mha);
-    token = ff.add(token, mlp_output);
+    mlp_output = ff.dense(
+        dense_h_to_4h,
+        falcon_config.hidden_size,
+        AC_MODE_NONE,
+        false,
+        DT_NONE,
+        nullptr,
+        nullptr,
+        nullptr,
+        REG_MODE_NONE,
+        0.0f,
+        std::string("layers_" + std::to_string(i) + "_mlp_dense_4h_to_h")
+            .c_str());
   }
   // final normalization and linear
-  Tensor ln_f = ff.layer_norm(token,
-                              axes,
-                              true,
-                              falcon_config.layer_norm_epsilon,
-                              true,
-                              DT_NONE,
-                              "ln_f");
+  ff.residual_layer_norm(token,
+                         mha,
+                         mlp_output,
+                         res_ln_outputs,
+                         true,
+                         axes,
+                         true,
+                         falcon_config.layer_norm_epsilon,
+                         true,
+                         DT_NONE,
+                         "ln_f");
+  Tensor ln_f = res_ln_outputs[1];
 
   Tensor lm_head = ff.dense(ln_f,
                             falcon_config.vocab_size,
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index c71755a3d3..56f919ace1 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -57,20 +57,38 @@ void LLAMA::create_llama_model(FFModel &ff,
                               embed_init,
                               "tok_embeddings");
 
+  Tensor w2 = nullptr;
+
   for (int i = 0; i < llama_config.num_hidden_layers; i++) {
     // set transformer layer id
     ff.set_transformer_layer_id(i);
 
     // step 1: attention
-    std::string layer_name = "layers_" + std::to_string(i) + "_attention_norm";
-    Tensor att_norm = ff.rms_norm(token,
-                                  llama_config.rms_norm_eps,
-                                  llama_config.hidden_size,
-                                  DT_NONE,
-                                  layer_name.c_str());
+    Tensor att_norm = nullptr;
+    Tensor token_att_norm[2] = {nullptr, nullptr};
+    if (i == 0) {
+      att_norm = ff.rms_norm(
+          token,
+          llama_config.rms_norm_eps,
+          llama_config.hidden_size,
+          DT_NONE,
+          std::string("layers_" + std::to_string(i) + "_attention_norm")
+              .c_str());
+    } else {
+      ff.residual_rms_norm(
+          token,
+          w2,
+          token_att_norm,
+          llama_config.rms_norm_eps,
+          llama_config.hidden_size,
+          DT_NONE,
+          std::string("layers_" + std::to_string(i) + "_attention_norm")
+              .c_str());
+      token = token_att_norm[0];
+      att_norm = token_att_norm[1];
+    }
 
     Tensor mha;
-    layer_name = "layers_" + std::to_string(i) + "_attention";
     switch (mode) {
       case BEAM_SEARCH_MODE: {
         mha = ff.spec_inc_multihead_self_attention(
@@ -79,18 +97,19 @@ void LLAMA::create_llama_model(FFModel &ff,
             llama_config.num_attention_heads,
             llama_config.hidden_size / llama_config.num_attention_heads,
             llama_config.hidden_size / llama_config.num_attention_heads,
-            0.0f,              /*dropout*/
-            false,             /*qkv_bias*/
-            false,             /*final_bias*/
-            false,             /*add_zero_attn*/
-            DT_NONE,           /*data_type*/
-            NULL,              /*kernel_initializer*/
-            true,              /*apply_rotary_embedding*/
-            false,             /*scaling query*/
-            1.0f,              /*scaling factor*/
-            true,              /*qk_prod_scaling*/
-            false,             /*position_bias*/
-            layer_name.c_str() /*name*/
+            0.0f,    /*dropout*/
+            false,   /*qkv_bias*/
+            false,   /*final_bias*/
+            false,   /*add_zero_attn*/
+            DT_NONE, /*data_type*/
+            NULL,    /*kernel_initializer*/
+            true,    /*apply_rotary_embedding*/
+            false,   /*scaling query*/
+            1.0f,    /*scaling factor*/
+            true,    /*qk_prod_scaling*/
+            false,   /*position_bias*/
+            std::string("layers_" + std::to_string(i) + "_attention")
+                .c_str() /*name*/
         );
         break;
       }
@@ -101,18 +120,19 @@ void LLAMA::create_llama_model(FFModel &ff,
             llama_config.num_attention_heads,
             llama_config.hidden_size / llama_config.num_attention_heads,
             llama_config.hidden_size / llama_config.num_attention_heads,
-            0.0f,              /*dropout*/
-            false,             /*qkv_bias*/
-            false,             /*final_bias*/
-            false,             /*add_zero_attn*/
-            DT_NONE,           /*data_type*/
-            nullptr,           /*kernel_initializer*/
-            true,              /*apply_rotary_embedding*/
-            false,             /*scaling query*/
-            1.0f,              /*scaling factor*/
-            true,              /*qk_prod_scaling*/
-            false,             /*position_bias*/
-            layer_name.c_str() /*name*/
+            0.0f,    /*dropout*/
+            false,   /*qkv_bias*/
+            false,   /*final_bias*/
+            false,   /*add_zero_attn*/
+            DT_NONE, /*data_type*/
+            nullptr, /*kernel_initializer*/
+            true,    /*apply_rotary_embedding*/
+            false,   /*scaling query*/
+            1.0f,    /*scaling factor*/
+            true,    /*qk_prod_scaling*/
+            false,   /*position_bias*/
+            std::string("layers_" + std::to_string(i) + "_attention")
+                .c_str() /*name*/
         );
         break;
       }
@@ -123,18 +143,19 @@ void LLAMA::create_llama_model(FFModel &ff,
             llama_config.num_attention_heads,
             llama_config.hidden_size / llama_config.num_attention_heads,
             llama_config.hidden_size / llama_config.num_attention_heads,
-            0.0f,              /*dropout*/
-            false,             /*qkv_bias*/
-            false,             /*final_bias*/
-            false,             /*add_zero_attn*/
-            DT_NONE,           /*data_type*/
-            nullptr,           /*kernel_initializer*/
-            true,              /*apply_rotary_embedding*/
-            false,             /*scaling query*/
-            1.0f,              /*scaling factor*/
-            true,              /*qk_prod_scaling*/
-            false,             /*position_bias*/
-            layer_name.c_str() /*name*/
+            0.0f,    /*dropout*/
+            false,   /*qkv_bias*/
+            false,   /*final_bias*/
+            false,   /*add_zero_attn*/
+            DT_NONE, /*data_type*/
+            nullptr, /*kernel_initializer*/
+            true,    /*apply_rotary_embedding*/
+            false,   /*scaling query*/
+            1.0f,    /*scaling factor*/
+            true,    /*qk_prod_scaling*/
+            false,   /*position_bias*/
+            std::string("layers_" + std::to_string(i) + "_attention")
+                .c_str() /*name*/
         );
         break;
       }
@@ -144,70 +165,73 @@ void LLAMA::create_llama_model(FFModel &ff,
     }
 
     // step 2: SILU activaion
-    layer_name = "layers_" + std::to_string(i) + "_ffn_norm";
-    Tensor token_ff_norm[2];
-    ff.residual_rms_norm(token,
-                         mha,
-                         token_ff_norm,
-                         llama_config.rms_norm_eps,
-                         llama_config.hidden_size,
-                         DT_NONE,
-                         layer_name.c_str());
-
+    Tensor token_ff_norm[2] = {nullptr, nullptr};
+    ff.residual_rms_norm(
+        token,
+        mha,
+        token_ff_norm,
+        llama_config.rms_norm_eps,
+        llama_config.hidden_size,
+        DT_NONE,
+        std::string("layers_" + std::to_string(i) + "_ffn_norm").c_str());
     token = token_ff_norm[0];
     Tensor ff_norm = token_ff_norm[1];
 
-    layer_name = "layers_" + std::to_string(i) + "_feed_forward_w1";
-    Tensor w1 = ff.dense(ff_norm,
-                         llama_config.intermediate_size,
-                         AC_MODE_NONE,
-                         false,
-                         DT_NONE,
-                         nullptr,
-                         nullptr,
-                         nullptr,
-                         REG_MODE_NONE,
-                         0.0f,
-                         layer_name.c_str());
+    Tensor w1 =
+        ff.dense(ff_norm,
+                 llama_config.intermediate_size,
+                 AC_MODE_NONE,
+                 false,
+                 DT_NONE,
+                 nullptr,
+                 nullptr,
+                 nullptr,
+                 REG_MODE_NONE,
+                 0.0f,
+                 std::string("layers_" + std::to_string(i) + "_feed_forward_w1")
+                     .c_str());
 
-    layer_name = "layers_" + std::to_string(i) + "_feed_forward_w3";
-    Tensor w3 = ff.dense(ff_norm,
-                         llama_config.intermediate_size,
-                         AC_MODE_NONE,
-                         false,
-                         DT_NONE,
-                         nullptr,
-                         nullptr,
-                         nullptr,
-                         REG_MODE_NONE,
-                         0.0f,
-                         layer_name.c_str());
+    Tensor w3 =
+        ff.dense(ff_norm,
+                 llama_config.intermediate_size,
+                 AC_MODE_NONE,
+                 false,
+                 DT_NONE,
+                 nullptr,
+                 nullptr,
+                 nullptr,
+                 REG_MODE_NONE,
+                 0.0f,
+                 std::string("layers_" + std::to_string(i) + "_feed_forward_w3")
+                     .c_str());
 
     Tensor multi = ff.sigmoid_silu_multi(w1, w3);
 
-    layer_name = "layers_" + std::to_string(i) + "_feed_forward_w2";
-    Tensor w2 = ff.dense(multi,
-                         llama_config.hidden_size,
-                         AC_MODE_NONE,
-                         false,
-                         DT_NONE,
-                         nullptr,
-                         nullptr,
-                         nullptr,
-                         REG_MODE_NONE,
-                         0.0f,
-                         layer_name.c_str());
-    token = ff.add(token, w2);
+    w2 =
+        ff.dense(multi,
+                 llama_config.hidden_size,
+                 AC_MODE_NONE,
+                 false,
+                 DT_NONE,
+                 nullptr,
+                 nullptr,
+                 nullptr,
+                 REG_MODE_NONE,
+                 0.0f,
+                 std::string("layers_" + std::to_string(i) + "_feed_forward_w2")
+                     .c_str());
   }
   // final normalization and linear
-  std::vector<int> axes = {2};
-  token = ff.rms_norm(token,
-                      llama_config.rms_norm_eps,
-                      llama_config.hidden_size,
-                      DT_NONE,
-                      "norm");
+  Tensor final_rms_norm_output[2] = {nullptr, nullptr};
+  ff.residual_rms_norm(token,
+                       w2,
+                       final_rms_norm_output,
+                       llama_config.rms_norm_eps,
+                       llama_config.hidden_size,
+                       DT_NONE,
+                       "norm");
 
-  Tensor dense = ff.dense(token,
+  Tensor dense = ff.dense(final_rms_norm_output[1],
                           llama_config.vocab_size,
                           AC_MODE_NONE,
                           false,
diff --git a/inference/models/mpt.cc b/inference/models/mpt.cc
index 933d1a0b18..3bd1b912ed 100644
--- a/inference/models/mpt.cc
+++ b/inference/models/mpt.cc
@@ -56,17 +56,39 @@ void MPT::create_mpt_model(FFModel &ff,
                                       embed_init,
                                       "transformer_wte");
 
+  Tensor intermediate_output = nullptr, layernorm_output = nullptr;
+  Tensor res_ln_outputs[2] = {nullptr, nullptr};
+
   for (int i = 0; i < mpt_config.n_layers; i++) {
     ff.set_transformer_layer_id(i);
 
-    Tensor residual = hidden_states;
-
-    std::string layer_name = "layers_" + std::to_string(i) + "_norm_1";
-    Tensor layernorm_output = ff.layer_norm(
-        hidden_states, axes, true, 1e-05, false, DT_NONE, layer_name.c_str());
+    if (i == 0) {
+      layernorm_output = ff.layer_norm(
+          hidden_states,
+          axes,
+          true,
+          1e-05,
+          false,
+          DT_NONE,
+          std::string("layers_" + std::to_string(i) + "_norm_1").c_str());
+    } else {
+      ff.residual_layer_norm(
+          intermediate_output,
+          hidden_states,
+          nullptr,
+          res_ln_outputs,
+          false,
+          axes,
+          true,
+          1e-05,
+          false,
+          DT_NONE,
+          std::string("layers_" + std::to_string(i) + "_norm_1").c_str());
+      hidden_states = res_ln_outputs[0];
+      layernorm_output = res_ln_outputs[1];
+    }
 
     Tensor attn_outputs;
-    layer_name = "layers_" + std::to_string(i) + "_attention";
     switch (mode) {
       case BEAM_SEARCH_MODE: {
         attn_outputs = ff.spec_inc_multihead_self_attention(
@@ -87,7 +109,8 @@ void MPT::create_mpt_model(FFModel &ff,
             pow((mpt_config.hidden_size / mpt_config.n_heads), -0.5),
             /*qk_prod_scaling*/ false,
             /*position_bias*/ true,
-            layer_name.c_str() /*name*/
+            std::string("layers_" + std::to_string(i) + "_attention")
+                .c_str() /*name*/
         );
         break;
       }
@@ -110,7 +133,8 @@ void MPT::create_mpt_model(FFModel &ff,
             pow((mpt_config.hidden_size / mpt_config.n_heads), -0.5),
             /*qk_prod_scaling*/ false,
             /*position_bias*/ true,
-            layer_name.c_str() /*name*/
+            std::string("layers_" + std::to_string(i) + "_attention")
+                .c_str() /*name*/
         );
         break;
       }
@@ -133,7 +157,8 @@ void MPT::create_mpt_model(FFModel &ff,
             pow((mpt_config.hidden_size / mpt_config.n_heads), -0.5),
             /*qk_prod_scaling*/ false,
             /*position_bias*/ true,
-            layer_name.c_str() /*name*/
+            std::string("layers_" + std::to_string(i) + "_attention")
+                .c_str() /*name*/
         );
         break;
       }
@@ -142,49 +167,62 @@ void MPT::create_mpt_model(FFModel &ff,
       }
     }
 
-    hidden_states = ff.add(attn_outputs, residual);
-
-    layer_name = "layers_" + std::to_string(i) + "_norm_2";
-    layernorm_output = ff.layer_norm(
-        hidden_states, axes, true, 1e-05, false, DT_NONE, layer_name.c_str());
-
-    residual = hidden_states;
+    ff.residual_layer_norm(
+        attn_outputs,
+        hidden_states,
+        nullptr,
+        res_ln_outputs,
+        false,
+        axes,
+        true,
+        1e-05,
+        false,
+        DT_NONE,
+        std::string("layers_" + std::to_string(i) + "_norm_2").c_str());
+    hidden_states = res_ln_outputs[0];
+    layernorm_output = res_ln_outputs[1];
 
     // MLP
-    layer_name = "layers_" + std::to_string(i) + "_ffn_up_proj";
-    layernorm_output = ff.dense(layernorm_output,
-                                4 * mpt_config.hidden_size,
-                                AC_MODE_NONE,
-                                false,
-                                DT_NONE,
-                                nullptr,
-                                nullptr,
-                                nullptr,
-                                REG_MODE_NONE,
-                                0.0f,
-                                layer_name.c_str());
-
+    layernorm_output = ff.dense(
+        layernorm_output,
+        4 * mpt_config.hidden_size,
+        AC_MODE_NONE,
+        false,
+        DT_NONE,
+        nullptr,
+        nullptr,
+        nullptr,
+        REG_MODE_NONE,
+        0.0f,
+        std::string("layers_" + std::to_string(i) + "_ffn_up_proj").c_str());
     layernorm_output = ff.gelu(layernorm_output);
-
-    layer_name = "layers_" + std::to_string(i) + "_ffn_down_proj";
-    Tensor intermediate_output = ff.dense(layernorm_output,
-                                          mpt_config.hidden_size,
-                                          AC_MODE_NONE,
-                                          false,
-                                          DT_NONE,
-                                          nullptr,
-                                          nullptr,
-                                          nullptr,
-                                          REG_MODE_NONE,
-                                          0.0f,
-                                          layer_name.c_str());
-
-    hidden_states = ff.add(intermediate_output, residual);
+    intermediate_output = ff.dense(
+        layernorm_output,
+        mpt_config.hidden_size,
+        AC_MODE_NONE,
+        false,
+        DT_NONE,
+        nullptr,
+        nullptr,
+        nullptr,
+        REG_MODE_NONE,
+        0.0f,
+        std::string("layers_" + std::to_string(i) + "_ffn_down_proj").c_str());
   }
 
   // final
-  Tensor all_final_norm = ff.layer_norm(
-      hidden_states, axes, true, 1e-05, false, DT_NONE, "transformer_norm_f");
+  ff.residual_layer_norm(intermediate_output,
+                         hidden_states,
+                         nullptr,
+                         res_ln_outputs,
+                         false,
+                         axes,
+                         true,
+                         1e-05,
+                         false,
+                         DT_NONE,
+                         "transformer_norm_f");
+  Tensor all_final_norm = res_ln_outputs[1];
 
   Tensor lm_head = ff.dense(all_final_norm,
                             mpt_config.vocab_size,
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index 5f2494d0b2..cdab25bfca 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -69,7 +69,8 @@ void OPT::create_opt_model(FFModel &ff,
                    embed_init,
                    "embed_positions");
 
-  Tensor residual = ff.add(token, positional_embedding);
+  Tensor fc2 = nullptr, added = nullptr;
+  Tensor res_ln_outputs[2] = {nullptr, nullptr};
 
   for (int i = 0; i < opt_config.num_hidden_layers; i++) {
     // set transformer layer id
@@ -79,20 +80,23 @@ void OPT::create_opt_model(FFModel &ff,
     // 350m applies layer norm AFTER attention
     // https://github.com/huggingface/transformers/blob/main/src/transformers/models/opt/modeling_opt.py#LL324C1-L325C1
     // this version is before normalization
-
-    std::string layer_name =
-        "layers_" + std::to_string(i) + "_attention_layer_norm";
-    Tensor hidden_states =
-        ff.layer_norm(residual,
-                      axes,
-                      opt_config.layer_norm_elementwise_affine,
-                      1e-05,
-                      true,
-                      DT_NONE,
-                      layer_name.c_str());
+    ff.residual_layer_norm(
+        (i == 0) ? token : added,
+        (i == 0) ? positional_embedding : fc2,
+        nullptr,
+        res_ln_outputs,
+        false,
+        axes,
+        opt_config.layer_norm_elementwise_affine,
+        1e-05,
+        true,
+        DT_NONE,
+        std::string("layers_" + std::to_string(i) + "_attention_layer_norm")
+            .c_str());
+    Tensor residual = res_ln_outputs[0];
+    Tensor hidden_states = res_ln_outputs[1];
 
     Tensor mha;
-    layer_name = "layers_" + std::to_string(i) + "_attention";
     switch (mode) {
       case BEAM_SEARCH_MODE: {
         mha = ff.spec_inc_multihead_self_attention(
@@ -110,10 +114,11 @@ void OPT::create_opt_model(FFModel &ff,
             false,   /*apply_rotary_embedding*/
             true,    /*scaling query*/
             pow((opt_config.hidden_size / opt_config.num_attention_heads),
-                -0.5),         /*scaling factor*/
-            false,             /*qk_prod_scaling*/
-            false,             /*position_bias*/
-            layer_name.c_str() /*name*/
+                -0.5), /*scaling factor*/
+            false,     /*qk_prod_scaling*/
+            false,     /*position_bias*/
+            std::string("layers_" + std::to_string(i) + "_attention")
+                .c_str() /*name*/
         );
         break;
       }
@@ -133,10 +138,11 @@ void OPT::create_opt_model(FFModel &ff,
             false,   /*apply_rotary_embedding*/
             true,    /*scaling query*/
             pow((opt_config.hidden_size / opt_config.num_attention_heads),
-                -0.5),         /*scaling factor*/
-            false,             /*qk_prod_scaling*/
-            false,             /*position_bias*/
-            layer_name.c_str() /*name*/
+                -0.5), /*scaling factor*/
+            false,     /*qk_prod_scaling*/
+            false,     /*position_bias*/
+            std::string("layers_" + std::to_string(i) + "_attention")
+                .c_str() /*name*/
         );
         break;
       }
@@ -156,10 +162,11 @@ void OPT::create_opt_model(FFModel &ff,
             false,   /*apply_rotary_embedding*/
             true,    /*scaling query*/
             pow((opt_config.hidden_size / opt_config.num_attention_heads),
-                -0.5),         /*scaling factor*/
-            false,             /*qk_prod_scaling*/
-            false,             /*position_bias*/
-            layer_name.c_str() /*name*/
+                -0.5), /*scaling factor*/
+            false,     /*qk_prod_scaling*/
+            false,     /*position_bias*/
+            std::string("layers_" + std::to_string(i) + "_attention")
+                .c_str() /*name*/
         );
         break;
       }
@@ -168,63 +175,60 @@ void OPT::create_opt_model(FFModel &ff,
       }
     }
 
-    // Tensor added = ff.add(mha, residual);
-    // Tensor final_norm = ff.layer_norm(
-    //     added, axes, opt_config.layer_norm_elementwise_affine, 1e-05);
-
-    layer_name =
-        "layers_" + std::to_string(i) + "_add_bias_residual_layer_norm";
-    Tensor added_final_norm[2];
     ff.add_bias_residual_layer_norm(mha,
                                     residual,
-                                    added_final_norm,
+                                    res_ln_outputs,
                                     axes,
                                     opt_config.layer_norm_elementwise_affine,
                                     1e-05,
                                     true,
                                     DT_NONE,
-                                    layer_name.c_str());
-    Tensor added = added_final_norm[0];
-    Tensor final_norm = added_final_norm[1];
+                                    std::string("layers_" + std::to_string(i) +
+                                                "_add_bias_residual_layer_norm")
+                                        .c_str());
+    added = res_ln_outputs[0];
+    Tensor final_norm = res_ln_outputs[1];
 
     //--------linear fc1 fc2 ----------
-    layer_name = "layers_" + std::to_string(i) + "_fc1";
-    Tensor fc1 = ff.dense(final_norm,
-                          opt_config.ffn_dim,
-                          AC_MODE_NONE,
-                          true,
-                          DT_NONE,
-                          nullptr,
-                          nullptr,
-                          nullptr,
-                          REG_MODE_NONE,
-                          0.0f,
-                          layer_name.c_str());
+    Tensor fc1 =
+        ff.dense(final_norm,
+                 opt_config.ffn_dim,
+                 AC_MODE_NONE,
+                 true,
+                 DT_NONE,
+                 nullptr,
+                 nullptr,
+                 nullptr,
+                 REG_MODE_NONE,
+                 0.0f,
+                 std::string("layers_" + std::to_string(i) + "_fc1").c_str());
     Tensor activation = ff.relu(fc1, false);
-    layer_name = "layers_" + std::to_string(i) + "_fc2";
-    Tensor fc2 = ff.dense(activation,
-                          opt_config.hidden_size,
-                          AC_MODE_NONE,
-                          true,
-                          DT_NONE,
-                          nullptr,
-                          nullptr,
-                          nullptr,
-                          REG_MODE_NONE,
-                          0.0f,
-                          layer_name.c_str());
-    residual = ff.add(added, fc2);
+    fc2 = ff.dense(activation,
+                   opt_config.hidden_size,
+                   AC_MODE_NONE,
+                   true,
+                   DT_NONE,
+                   nullptr,
+                   nullptr,
+                   nullptr,
+                   REG_MODE_NONE,
+                   0.0f,
+                   std::string("layers_" + std::to_string(i) + "_fc2").c_str());
   }
 
   // final
-  Tensor all_final_norm =
-      ff.layer_norm(residual,
-                    axes,
-                    opt_config.layer_norm_elementwise_affine,
-                    1e-05,
-                    true,
-                    DT_NONE,
-                    "final_layer_norm");
+  ff.residual_layer_norm(added,
+                         fc2,
+                         nullptr,
+                         res_ln_outputs,
+                         false,
+                         axes,
+                         opt_config.layer_norm_elementwise_affine,
+                         1e-05,
+                         true,
+                         DT_NONE,
+                         "final_layer_norm");
+  Tensor all_final_norm = res_ln_outputs[1];
 
   Tensor lm_head = ff.dense(all_final_norm,
                             opt_config.vocab_size,
diff --git a/inference/models/starcoder.cc b/inference/models/starcoder.cc
index f9659c7279..89b53b1cf5 100644
--- a/inference/models/starcoder.cc
+++ b/inference/models/starcoder.cc
@@ -74,24 +74,30 @@ void STARCODER::create_starcoder_model(
                    embed_init,
                    "transformer_wpe");
 
-  Tensor hidden_states = ff.add(token, positional_embedding);
+  Tensor residual = nullptr, c_proj = nullptr;
+  Tensor res_ln_outputs[2] = {nullptr, nullptr};
 
   for (int i = 0; i < startcoder_config.num_hidden_layers; i++) {
     // set transformer layer id
     ff.set_transformer_layer_id(i);
 
     // step 1: attention
-    std::string layer_name = "layers_" + std::to_string(i) + "_ln_1";
-    Tensor ln_1 = ff.layer_norm(hidden_states,
-                                axes,
-                                true,
-                                startcoder_config.layer_norm_epsilon,
-                                true,
-                                DT_NONE,
-                                layer_name.c_str());
+    ff.residual_layer_norm(
+        (i == 0) ? token : residual,
+        (i == 0) ? positional_embedding : c_proj,
+        nullptr,
+        res_ln_outputs,
+        false,
+        axes,
+        true,
+        startcoder_config.layer_norm_epsilon,
+        true,
+        DT_NONE,
+        std::string("layers_" + std::to_string(i) + "_ln_1").c_str());
+    Tensor hidden_states = res_ln_outputs[0];
+    Tensor ln_1 = res_ln_outputs[1];
 
     Tensor mha;
-    layer_name = "layers_" + std::to_string(i) + "_attention";
     switch (mode) {
       case INC_DECODING_MODE: {
         mha = ff.inc_multiquery_self_attention(
@@ -114,7 +120,8 @@ void STARCODER::create_starcoder_model(
             1.0f,                        /*scaling factor*/
             true,                        /*qk_prod_scaling*/
             false,                       /*position_bias*/
-            layer_name.c_str()           /*name*/
+            std::string("layers_" + std::to_string(i) + "_attention")
+                .c_str() /*name*/
         );
         break;
       }
@@ -123,56 +130,63 @@ void STARCODER::create_starcoder_model(
       }
     }
 
-    Tensor residual = ff.add(hidden_states, mha);
-
-    layer_name = "layers_" + std::to_string(i) + "_ln_2";
-    Tensor l2_norm = ff.layer_norm(residual,
-                                   axes,
-                                   true,
-                                   startcoder_config.layer_norm_epsilon,
-                                   true,
-                                   DT_NONE,
-                                   layer_name.c_str());
+    ff.residual_layer_norm(
+        hidden_states,
+        mha,
+        nullptr,
+        res_ln_outputs,
+        false,
+        axes,
+        true,
+        startcoder_config.layer_norm_epsilon,
+        true,
+        DT_NONE,
+        std::string("layers_" + std::to_string(i) + "_ln_2").c_str());
+    residual = res_ln_outputs[0];
+    Tensor l2_norm = res_ln_outputs[1];
 
     // mlp
-    layer_name = "layers_" + std::to_string(i) + "_mlp_c_fc";
-    Tensor c_fc = ff.dense(l2_norm,
-                           startcoder_config.intermediate_size,
-                           AC_MODE_NONE,
-                           true,
-                           DT_NONE,
-                           nullptr,
-                           nullptr,
-                           nullptr,
-                           REG_MODE_NONE,
-                           0.0f,
-                           layer_name.c_str());
+    Tensor c_fc = ff.dense(
+        l2_norm,
+        startcoder_config.intermediate_size,
+        AC_MODE_NONE,
+        true,
+        DT_NONE,
+        nullptr,
+        nullptr,
+        nullptr,
+        REG_MODE_NONE,
+        0.0f,
+        std::string("layers_" + std::to_string(i) + "_mlp_c_fc").c_str());
 
     c_fc = ff.gelu(c_fc);
 
-    layer_name = "layers_" + std::to_string(i) + "_mlp_c_proj";
-    Tensor c_proj = ff.dense(c_fc,
-                             startcoder_config.hidden_size,
-                             AC_MODE_NONE,
-                             true,
-                             DT_NONE,
-                             nullptr,
-                             nullptr,
-                             nullptr,
-                             REG_MODE_NONE,
-                             0.0f,
-                             layer_name.c_str());
-
-    hidden_states = ff.add(residual, c_proj);
+    c_proj = ff.dense(
+        c_fc,
+        startcoder_config.hidden_size,
+        AC_MODE_NONE,
+        true,
+        DT_NONE,
+        nullptr,
+        nullptr,
+        nullptr,
+        REG_MODE_NONE,
+        0.0f,
+        std::string("layers_" + std::to_string(i) + "_mlp_c_proj").c_str());
   }
   // final normalization and linear
-  Tensor ln_f = ff.layer_norm(hidden_states,
-                              axes,
-                              true,
-                              startcoder_config.layer_norm_epsilon,
-                              true,
-                              DT_NONE,
-                              "transformer_ln_f");
+  ff.residual_layer_norm(residual,
+                         c_proj,
+                         nullptr,
+                         res_ln_outputs,
+                         false,
+                         axes,
+                         true,
+                         startcoder_config.layer_norm_epsilon,
+                         true,
+                         DT_NONE,
+                         "transformer_ln_f");
+  Tensor ln_f = res_ln_outputs[1];
 
   Tensor lm_head = ff.dense(ln_f,
                             startcoder_config.vocab_size,
diff --git a/python/flexflow/core/flexflow_cffi.py b/python/flexflow/core/flexflow_cffi.py
index b2231b58e6..b029f1e2ff 100644
--- a/python/flexflow/core/flexflow_cffi.py
+++ b/python/flexflow/core/flexflow_cffi.py
@@ -18,3356 +18,4231 @@
 import warnings
 import numpy as np
 from .flexflow_logger import fflogger
-from flexflow.type import ActiMode, RegularizerMode, AggrMode, PoolType, DataType, LossType, CompMode, MetricsType, InferenceMode, ModelType, OpType, ParameterSyncType, enum_to_int, int_to_enum
+from flexflow.type import (
+    ActiMode,
+    RegularizerMode,
+    AggrMode,
+    PoolType,
+    DataType,
+    LossType,
+    CompMode,
+    MetricsType,
+    InferenceMode,
+    ModelType,
+    OpType,
+    ParameterSyncType,
+    enum_to_int,
+    int_to_enum,
+)
 from flexflow.config import *
 from .flexflowlib import ffi, flexflow_library
 
+
 def ffc():
-  if not flexflow_already_initialized():
-    raise RuntimeError("Cannot use FlexFlow library before initializing FlexFlow")
-  ffc = flexflow_library.lib
-  if ffc is None:
-    raise RuntimeError("FlexFlow library is None")
-  return ffc
+    if not flexflow_already_initialized():
+        raise RuntimeError("Cannot use FlexFlow library before initializing FlexFlow")
+    ffc = flexflow_library.lib
+    if ffc is None:
+        raise RuntimeError("FlexFlow library is None")
+    return ffc
+
 
 ff_tracing_id = 200
 
-warnings.simplefilter('always', DeprecationWarning)
+warnings.simplefilter("always", DeprecationWarning)
+
 
 def get_c_name(name):
-  if name is None:
-    return ffi.NULL
-  else:
-    return ffi.new("char[]", name.encode('ascii'))
+    if name is None:
+        return ffi.NULL
+    else:
+        return ffi.new("char[]", name.encode("ascii"))
+
 
 def get_datatype_size(datatype):
-  if (datatype == DataType.DT_HALF):
-    return 2
-  if (datatype == DataType.DT_FLOAT):
-    return 4
-  elif (datatype == DataType.DT_DOUBLE):
-    return 8
-  elif (datatype == DataType.DT_INT32):
-    return 4
-  elif (datatype == DataType.DT_INT64):
-    return 8
-  else:
-    assert 0, "unknow datatype" + str(datatype)
-    return 0
+    if datatype == DataType.DT_HALF:
+        return 2
+    if datatype == DataType.DT_FLOAT:
+        return 4
+    elif datatype == DataType.DT_DOUBLE:
+        return 8
+    elif datatype == DataType.DT_INT32:
+        return 4
+    elif datatype == DataType.DT_INT64:
+        return 8
+    else:
+        assert 0, "unknow datatype" + str(datatype)
+        return 0
+
 
 # -----------------------------------------------------------------------
 # Op
 # -----------------------------------------------------------------------
 class Op(object):
-  __slots__ = ['handle', 'idx', 'name']
-  def __init__(self, handle, idx=None, name=None):
-    assert ffi.typeof(handle) == ffi.typeof('flexflow_op_t'), "Op handle is wrong"
-    self.handle = handle
-    self.idx = idx
-    self.name = name
+    __slots__ = ["handle", "idx", "name"]
+
+    def __init__(self, handle, idx=None, name=None):
+        assert ffi.typeof(handle) == ffi.typeof("flexflow_op_t"), "Op handle is wrong"
+        self.handle = handle
+        self.idx = idx
+        self.name = name
+
+    def get_number_parameters(self):
+        return ffc().flexflow_op_get_num_parameters(self.handle)
 
-  def get_number_parameters(self):
-    return ffc().flexflow_op_get_num_parameters(self.handle)
+    def get_parameter_by_id(self, id):
+        handle = ffc().flexflow_op_get_parameter_by_id(self.handle, id)
+        return Parameter(handle)
 
-  def get_parameter_by_id(self, id):
-    handle = ffc().flexflow_op_get_parameter_by_id(self.handle, id)
-    return Parameter(handle)
+    def get_number_inputs(self):
+        return ffc().flexflow_op_get_num_inputs(self.handle)
 
-  def get_number_inputs(self):
-    return ffc().flexflow_op_get_num_inputs(self.handle)
+    def get_input_by_id(self, id):
+        handle = ffc().flexflow_op_get_input_by_id(self.handle, id)
+        return Tensor(handle, False)
 
-  def get_input_by_id(self, id):
-    handle = ffc().flexflow_op_get_input_by_id(self.handle, id)
-    return Tensor(handle, False)
+    def get_number_outputs(self):
+        return ffc().flexflow_op_get_num_outputs(self.handle)
 
-  def get_number_outputs(self):
-    return ffc().flexflow_op_get_num_outputs(self.handle)
+    def get_output_by_id(self, id):
+        handle = ffc().flexflow_op_get_output_by_id(self.handle, id)
+        return Tensor(handle, False)
 
-  def get_output_by_id(self, id):
-    handle = ffc().flexflow_op_get_output_by_id(self.handle, id)
-    return Tensor(handle, False)
+    def init(self, model):
+        ffc().flexflow_op_init(self.handle, model.handle)
 
-  def init(self, model):
-    ffc().flexflow_op_init(self.handle, model.handle)
+    def forward(self, model):
+        ffc().flexflow_op_forward(self.handle, model.handle)
+        # return Tensor(handle)
 
-  def forward(self, model):
-    ffc().flexflow_op_forward(self.handle, model.handle)
-    #return Tensor(handle)
+    def _add_to_model(self, model):
+        ffc().flexflow_op_add_to_model(self.handle, model.handle)
 
-  def _add_to_model(self, model):
-    ffc().flexflow_op_add_to_model(self.handle, model.handle)
+    def get_output_tensor(self):
+        return self.get_output_by_id(0)
 
-  def get_output_tensor(self):
-    return self.get_output_by_id(0)
 
 # -----------------------------------------------------------------------
 # Exp
 # -----------------------------------------------------------------------
 class Exp(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Exp, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Exp, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Sin
 # -----------------------------------------------------------------------
 class Sin(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Sin, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Sin, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Cos
 # -----------------------------------------------------------------------
 class Cos(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Cos, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Cos, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Add
 # -----------------------------------------------------------------------
 class Add(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Add, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Add, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Subtract
 # -----------------------------------------------------------------------
 class Subtract(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Subtract, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Subtract, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Multiply
 # -----------------------------------------------------------------------
 class Multiply(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Multiply, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Multiply, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Divide
 # -----------------------------------------------------------------------
 class Divide(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Divide, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Divide, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Max
 # -----------------------------------------------------------------------
 class Max(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Max, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Max, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Min
 # -----------------------------------------------------------------------
 class Min(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Min, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Min, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # ReduceSum
 # -----------------------------------------------------------------------
 class ReduceSum(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(ReduceSum, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(ReduceSum, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Conv2D
 # -----------------------------------------------------------------------
 class Conv2D(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Conv2D, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Conv2D, self).__init__(handle, idx, name)
 
-  def get_weight_tensor(self):
-    return self.get_parameter_by_id(0)
+    def get_weight_tensor(self):
+        return self.get_parameter_by_id(0)
 
-  def get_bias_tensor(self):
-    return self.get_parameter_by_id(1)
+    def get_bias_tensor(self):
+        return self.get_parameter_by_id(1)
 
-  def get_input_tensor(self):
-    return self.get_input_by_id(0)
+    def get_input_tensor(self):
+        return self.get_input_by_id(0)
+
+    def get_output_tensor(self):
+        return self.get_output_by_id(0)
 
-  def get_output_tensor(self):
-    return self.get_output_by_id(0)
 
 # -----------------------------------------------------------------------
 # Pool2D
 # -----------------------------------------------------------------------
 class Pool2D(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Pool2D, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Pool2D, self).__init__(handle, idx, name)
+
+    def get_input_tensor(self):
+        return self.get_input_by_id(0)
 
-  def get_input_tensor(self):
-    return self.get_input_by_id(0)
+    def get_output_tensor(self):
+        return self.get_output_by_id(0)
 
-  def get_output_tensor(self):
-    return self.get_output_by_id(0)
 
 # -----------------------------------------------------------------------
 # Linear
 # -----------------------------------------------------------------------
 class Linear(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Linear, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Linear, self).__init__(handle, idx, name)
 
-  def get_weight_tensor(self):
-    return self.get_parameter_by_id(0)
+    def get_weight_tensor(self):
+        return self.get_parameter_by_id(0)
 
-  def get_bias_tensor(self):
-    return self.get_parameter_by_id(1)
+    def get_bias_tensor(self):
+        return self.get_parameter_by_id(1)
 
-  def get_input_tensor(self):
-    return self.get_input_by_id(0)
+    def get_input_tensor(self):
+        return self.get_input_by_id(0)
+
+    def get_output_tensor(self):
+        return self.get_output_by_id(0)
 
-  def get_output_tensor(self):
-    return self.get_output_by_id(0)
 
 # -----------------------------------------------------------------------
 # Flat
 # -----------------------------------------------------------------------
 class Flat(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Flat, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Flat, self).__init__(handle, idx, name)
+
+    def get_input_tensor(self):
+        return self.get_input_by_id(0)
 
-  def get_input_tensor(self):
-    return self.get_input_by_id(0)
+    def get_output_tensor(self):
+        return self.get_output_by_id(0)
 
-  def get_output_tensor(self):
-    return self.get_output_by_id(0)
 
 # -----------------------------------------------------------------------
 # Softmax
 # -----------------------------------------------------------------------
 class Softmax(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Softmax, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Softmax, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Embedding
 # -----------------------------------------------------------------------
 class Embedding(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Embedding, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Embedding, self).__init__(handle, idx, name)
+
+    def get_weight_tensor(self):
+        return self.get_parameter_by_id(0)
 
-  def get_weight_tensor(self):
-    return self.get_parameter_by_id(0)
 
 # -----------------------------------------------------------------------
 # Concat
 # -----------------------------------------------------------------------
 class Concat(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Concat, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Concat, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # BatchNorm
 # -----------------------------------------------------------------------
 class BatchNorm(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(BatchNorm, self).__init__(handle, idx, name)
-    
+    def __init__(self, handle, idx=None, name=None):
+        super(BatchNorm, self).__init__(handle, idx, name)
+
+
 # -----------------------------------------------------------------------
 # LayerNorm
 # -----------------------------------------------------------------------
 class LayerNorm(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(LayerNorm, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(LayerNorm, self).__init__(handle, idx, name)
+
+    def get_weight_tensor(self):
+        return self.get_parameter_by_id(0)
+
+    def get_bias_tensor(self):
+        return self.get_parameter_by_id(1)
+
 
-  def get_weight_tensor(self):
-    return self.get_parameter_by_id(0)
+# -----------------------------------------------------------------------
+# ResidualLayerNorm
+# -----------------------------------------------------------------------
+class ResidualLayerNorm(Op):
+    def __init__(self, handle, idx=None, name=None):
+        super(ResidualLayerNorm, self).__init__(handle, idx, name)
+
+    def get_weight_tensor(self):
+        return self.get_parameter_by_id(1)
+
+    def get_bias_tensor(self):
+        return self.get_parameter_by_id(2)
 
-  def get_bias_tensor(self):
-    return self.get_parameter_by_id(1)
 
 # -----------------------------------------------------------------------
 # AddBiasResidualLayerNorm
 # -----------------------------------------------------------------------
 class AddBiasResidualLayerNorm(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(AddBiasResidualLayerNorm, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(AddBiasResidualLayerNorm, self).__init__(handle, idx, name)
+
+    def get_attn_bias_tensor(self):
+        return self.get_parameter_by_id(0)
 
-  def get_attn_bias_tensor(self):
-    return self.get_parameter_by_id(0)
-  
-  def get_weight_tensor(self):
-    return self.get_parameter_by_id(1)
+    def get_weight_tensor(self):
+        return self.get_parameter_by_id(1)
+
+    def get_bias_tensor(self):
+        return self.get_parameter_by_id(2)
 
-  def get_bias_tensor(self):
-    return self.get_parameter_by_id(2)
 
 # -----------------------------------------------------------------------
 # SigmoidSiluMulti
 # -----------------------------------------------------------------------
 class SigmoidSiluMulti(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(SigmoidSiluMulti, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(SigmoidSiluMulti, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Dropout
 # -----------------------------------------------------------------------
 class Dropout(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Dropout, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Dropout, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # ScalarMultiply
 # -----------------------------------------------------------------------
 class ScalarMultiply(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(ScalarMultiply, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(ScalarMultiply, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # ScalarAdd
 # -----------------------------------------------------------------------
 class ScalarAdd(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(ScalarAdd, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(ScalarAdd, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # ScalarSub
 # -----------------------------------------------------------------------
 class ScalarSub(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(ScalarSub, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(ScalarSub, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # ScalarTrueDiv
 # -----------------------------------------------------------------------
 class ScalarTrueDiv(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(ScalarTrueDiv, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(ScalarTrueDiv, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Rsqrt
 # -----------------------------------------------------------------------
 class Rsqrt(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Rsqrt, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Rsqrt, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Pow
 # -----------------------------------------------------------------------
 class Pow(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Pow, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Pow, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Mean
 # -----------------------------------------------------------------------
 class Mean(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Mean, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Mean, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Relu
 # -----------------------------------------------------------------------
 class Relu(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Relu, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Relu, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Gelu
 # -----------------------------------------------------------------------
 class Gelu(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Gelu, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Gelu, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Sigmod
 # -----------------------------------------------------------------------
 class Sigmoid(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Sigmoid, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Sigmoid, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Tanh
 # -----------------------------------------------------------------------
 class Tanh(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Tanh, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Tanh, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Elu
 # -----------------------------------------------------------------------
 class Elu(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Elu, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Elu, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Batch_Norm
 # -----------------------------------------------------------------------
 class Batch_Norm(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Batch_Norm, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Batch_Norm, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Batch_Matmul
 # -----------------------------------------------------------------------
 class Batch_Matmul(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Batch_Matmul, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Batch_Matmul, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Split
 # -----------------------------------------------------------------------
 class Split(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Split, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Split, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Reshape
 # -----------------------------------------------------------------------
 class Reshape(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Reshape, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Reshape, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Gather
 # -----------------------------------------------------------------------
 class Gather(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Gather, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Gather, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Identity
 # -----------------------------------------------------------------------
 class Identity(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Identity, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Identity, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Transpose
 # -----------------------------------------------------------------------
 class Transpose(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Transpose, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Transpose, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Reverse
 # -----------------------------------------------------------------------
 class Reverse(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Reverse, self).__init__(handle, idx, name)
-    
+    def __init__(self, handle, idx=None, name=None):
+        super(Reverse, self).__init__(handle, idx, name)
+
+
 # -----------------------------------------------------------------------
 # MultiHeadAttention
 # -----------------------------------------------------------------------
 class MultiHeadAttention(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(MultiHeadAttention, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(MultiHeadAttention, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Incremental MultiHeadAttention
 # -----------------------------------------------------------------------
 class IncMultiHeadAttention(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(IncMultiHeadAttention, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(IncMultiHeadAttention, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Speculative Incremental MultiHeadAttention
 # -----------------------------------------------------------------------
 class SpecIncMultiHeadSelfAttention(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(SpecIncMultiHeadSelfAttention, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(SpecIncMultiHeadSelfAttention, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # TreeVerify Incremental MultiHeadAttention
 # -----------------------------------------------------------------------
 class TreeIncMultiHeadSelfAttention(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(TreeIncMultiHeadSelfAttention, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(TreeIncMultiHeadSelfAttention, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # RMS Norm
 # -----------------------------------------------------------------------
 class RMSNorm(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(RMSNorm, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(RMSNorm, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Residual RMS Norm
 # -----------------------------------------------------------------------
 class ResidualRMSNorm(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(ResidualRMSNorm, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(ResidualRMSNorm, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # ArgTopK
 # -----------------------------------------------------------------------
 class ArgTopK(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(ArgTopK, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(ArgTopK, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # BeamTopK
 # -----------------------------------------------------------------------
 class BeamTopK(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(BeamTopK, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(BeamTopK, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # Sampling
 # -----------------------------------------------------------------------
 class Sampling(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(Sampling, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(Sampling, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # ArgMax
 # -----------------------------------------------------------------------
 class ArgMax(Op):
-  def __init__(self, handle, idx=None, name=None):
-    super(ArgMax, self).__init__(handle, idx, name)
+    def __init__(self, handle, idx=None, name=None):
+        super(ArgMax, self).__init__(handle, idx, name)
+
 
 # -----------------------------------------------------------------------
 # flexflow_op_t handle to Op
 # -----------------------------------------------------------------------
 def convert_op_handle_to_op(op_type, handle, idx=None, name=None):
-  if op_type == OpType.CONV2D:
-    return Conv2D(handle, idx, name)
-  elif op_type == OpType.POOL2D:
-    return Pool2D(handle, idx, name)
-  elif op_type == OpType.LINEAR:
-    return Linear(handle, idx, name)
-  elif op_type == OpType.EMBEDDING:
-    return Embedding(handle, idx, name)
-  elif op_type == OpType.FLAT:
-    return Flat(handle, idx, name)
-  elif op_type == OpType.CONCAT:
-    return Concat(handle, idx, name)
-  elif op_type == OpType.SOFTMAX:
-    return Softmax(handle, idx, name)
-  elif op_type == OpType.EXP:
-    return Exp(handle, idx, name)
-  elif op_type == OpType.SIN:
-    return Sin(handle, idx, name)
-  elif op_type == OpType.COS:
-    return Cos(handle, idx, name)
-  elif op_type == OpType.ADD:
-    return Add(handle, idx, name)
-  elif op_type == OpType.SUBTRACT:
-    return Subtract(handle, idx, name)
-  elif op_type == OpType.MULTIPLY:
-    return Multiply(handle, idx, name)
-  elif op_type == OpType.DIVIDE:
-    return Divide(handle, idx, name)
-  elif op_type == OpType.MAX:
-    return Max(handle, idx, name)
-  elif op_type == OpType.MIN:
-    return Min(handle, idx, name)
-  elif op_type == OpType.REDUCE_SUM:
-    return ReduceSum(handle, idx, name)
-  elif op_type == OpType.MSELOSS:
-    return MSELoss(handle, idx, name)
-  elif op_type == OpType.SCALAR_MULTIPLY:
-    return ScalarMultiply(handle, idx, name)
-  elif op_type == OpType.SCALAR_ADD:
-      return ScalarAdd(handle, idx, name)
-  elif op_type == OpType.SCALAR_SUB:
-      return ScalarSub(handle, idx, name)
-  elif op_type == OpType.SCALAR_FLOORDIV:
-      return ScalarFloorDiv(handle, idx, name)
-  elif op_type == OpType.SCALAR_TRUEDIV:
-      return ScalarTrueDiv(handle, idx, name)
-  elif op_type == OpType.GELU:
-    return Gelu(handle, idx, name)
-  elif op_type == OpType.RELU:
-    return Relu(handle, idx, name)
-  elif op_type == OpType.SIGMOID:
-    return Sigmoid(handle, idx, name)
-  elif op_type == OpType.TANH:
-    return Tanh(handle, idx, name)
-  elif op_type == OpType.ELU:
-    return Elu(handle, idx, name)
-  elif op_type == OpType.DROPOUT:
-    return Dropout(handle, idx, name)
-  elif op_type == OpType.BATCH_NORM:
-    return BatchNorm(handle, idx, name)
-  elif op_type == OpType.LAYER_NORM:
-    return LayerNorm(handle, idx, name)
-  elif op_type == OpType.ADD_BIAS_RESIDUAL_LAYERNORM:
-    return AddBiasResidualLayerNorm(handle, idx, name)
-  elif op_type == OpType.SIGMOID_SILU_MULTI:
-    return SigmoidSiluMulti(handle, idx, name)
-  elif op_type == OpType.BATCH_MATMUL:
-    return Batch_Matmul(handle, idx, name)
-  elif op_type == OpType.SPLIT:
-    return Split(handle, idx, name)
-  elif op_type == OpType.RESHAPE:
-    return Reshape(handle, idx, name)
-  elif op_type == OpType.IDENTITY:
-    return Identity(handle,idx,name)
-  elif op_type == OpType.TRANSPOSE:
-    return Transpose(handle, idx, name)
-  elif op_type == OpType.REVERSE:
-    return Reverse(handle, idx, name)
-  elif op_type == OpType.MULTIHEAD_ATTENTION:
-    return MultiHeadAttention(handle, idx, name)
-  elif op_type == OpType.INC_MULTIHEAD_ATTENTION:
-    return IncMultiHeadAttention(handle, idx, name)
-  elif op_type == OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION:
-    return SpecIncMultiHeadSelfAttention(handle, idx, name)
-  elif op_type == OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION:
-    return TreeIncMultiHeadSelfAttention(handle, idx, name)
-  elif op_type == OpType.RMS_NORM:
-    return RMSNorm(handle, idx, name)
-  elif op_type == OpType.RESIDUAL_RMS_NORM:
-    return ResidualRMSNorm(handle, idx, name)
-  elif op_type == OpType.ARG_TOPK:
-    return ArgTopK(handle, idx, name)
-  elif op_type == OpType.BEAM_TOPK:
-    return BeamTopK(handle, idx, name)
-  elif op_type == OpType.SAMPLING:
-    return Sampling(handle, idx, name)
-  elif op_type == OpType.ARGMAX:
-    return ArgMax(handle, idx, name)
-  elif op_type == OpType.RSQRT:
-    return Rsqrt(handle, idx, name)
-  elif op_type == OpType.POW:
-    return Pow(handle, idx, name)
-  elif op_type == OpType.MEAN:
-    return Mean(handle, idx, name)
-  elif op_type == OpType.GATHER:
-    return Gather(handle, idx, name)
-  else:
-    assert 0, "unknown layer type {}".format(op_type)
-    return None
+    if op_type == OpType.CONV2D:
+        return Conv2D(handle, idx, name)
+    elif op_type == OpType.POOL2D:
+        return Pool2D(handle, idx, name)
+    elif op_type == OpType.LINEAR:
+        return Linear(handle, idx, name)
+    elif op_type == OpType.EMBEDDING:
+        return Embedding(handle, idx, name)
+    elif op_type == OpType.FLAT:
+        return Flat(handle, idx, name)
+    elif op_type == OpType.CONCAT:
+        return Concat(handle, idx, name)
+    elif op_type == OpType.SOFTMAX:
+        return Softmax(handle, idx, name)
+    elif op_type == OpType.EXP:
+        return Exp(handle, idx, name)
+    elif op_type == OpType.SIN:
+        return Sin(handle, idx, name)
+    elif op_type == OpType.COS:
+        return Cos(handle, idx, name)
+    elif op_type == OpType.ADD:
+        return Add(handle, idx, name)
+    elif op_type == OpType.SUBTRACT:
+        return Subtract(handle, idx, name)
+    elif op_type == OpType.MULTIPLY:
+        return Multiply(handle, idx, name)
+    elif op_type == OpType.DIVIDE:
+        return Divide(handle, idx, name)
+    elif op_type == OpType.MAX:
+        return Max(handle, idx, name)
+    elif op_type == OpType.MIN:
+        return Min(handle, idx, name)
+    elif op_type == OpType.REDUCE_SUM:
+        return ReduceSum(handle, idx, name)
+    elif op_type == OpType.MSELOSS:
+        return MSELoss(handle, idx, name)
+    elif op_type == OpType.SCALAR_MULTIPLY:
+        return ScalarMultiply(handle, idx, name)
+    elif op_type == OpType.SCALAR_ADD:
+        return ScalarAdd(handle, idx, name)
+    elif op_type == OpType.SCALAR_SUB:
+        return ScalarSub(handle, idx, name)
+    elif op_type == OpType.SCALAR_FLOORDIV:
+        return ScalarFloorDiv(handle, idx, name)
+    elif op_type == OpType.SCALAR_TRUEDIV:
+        return ScalarTrueDiv(handle, idx, name)
+    elif op_type == OpType.GELU:
+        return Gelu(handle, idx, name)
+    elif op_type == OpType.RELU:
+        return Relu(handle, idx, name)
+    elif op_type == OpType.SIGMOID:
+        return Sigmoid(handle, idx, name)
+    elif op_type == OpType.TANH:
+        return Tanh(handle, idx, name)
+    elif op_type == OpType.ELU:
+        return Elu(handle, idx, name)
+    elif op_type == OpType.DROPOUT:
+        return Dropout(handle, idx, name)
+    elif op_type == OpType.BATCH_NORM:
+        return BatchNorm(handle, idx, name)
+    elif op_type == OpType.LAYER_NORM:
+        return LayerNorm(handle, idx, name)
+    elif op_type == OpType.RESIDUAL_LAYERNORM:
+        return ResidualLayerNorm(handle, idx, name)
+    elif op_type == OpType.ADD_BIAS_RESIDUAL_LAYERNORM:
+        return AddBiasResidualLayerNorm(handle, idx, name)
+    elif op_type == OpType.SIGMOID_SILU_MULTI:
+        return SigmoidSiluMulti(handle, idx, name)
+    elif op_type == OpType.BATCH_MATMUL:
+        return Batch_Matmul(handle, idx, name)
+    elif op_type == OpType.SPLIT:
+        return Split(handle, idx, name)
+    elif op_type == OpType.RESHAPE:
+        return Reshape(handle, idx, name)
+    elif op_type == OpType.IDENTITY:
+        return Identity(handle, idx, name)
+    elif op_type == OpType.TRANSPOSE:
+        return Transpose(handle, idx, name)
+    elif op_type == OpType.REVERSE:
+        return Reverse(handle, idx, name)
+    elif op_type == OpType.MULTIHEAD_ATTENTION:
+        return MultiHeadAttention(handle, idx, name)
+    elif op_type == OpType.INC_MULTIHEAD_ATTENTION:
+        return IncMultiHeadAttention(handle, idx, name)
+    elif op_type == OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION:
+        return SpecIncMultiHeadSelfAttention(handle, idx, name)
+    elif op_type == OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION:
+        return TreeIncMultiHeadSelfAttention(handle, idx, name)
+    elif op_type == OpType.RMS_NORM:
+        return RMSNorm(handle, idx, name)
+    elif op_type == OpType.RESIDUAL_RMS_NORM:
+        return ResidualRMSNorm(handle, idx, name)
+    elif op_type == OpType.ARG_TOPK:
+        return ArgTopK(handle, idx, name)
+    elif op_type == OpType.BEAM_TOPK:
+        return BeamTopK(handle, idx, name)
+    elif op_type == OpType.SAMPLING:
+        return Sampling(handle, idx, name)
+    elif op_type == OpType.ARGMAX:
+        return ArgMax(handle, idx, name)
+    elif op_type == OpType.RSQRT:
+        return Rsqrt(handle, idx, name)
+    elif op_type == OpType.POW:
+        return Pow(handle, idx, name)
+    elif op_type == OpType.MEAN:
+        return Mean(handle, idx, name)
+    elif op_type == OpType.GATHER:
+        return Gather(handle, idx, name)
+    else:
+        assert 0, "unknown layer type {}".format(op_type)
+        return None
+
 
 # -----------------------------------------------------------------------
 # FFConfig
 # -----------------------------------------------------------------------
 
+
 class FFConfig(object):
-  __slots__ = ['handle', '_handle', 'enable_tracing']
-  def __init__(self):
-    self.handle = ffc().flexflow_config_create()
-    self._handle = ffi.gc(self.handle, ffc().flexflow_config_destroy)
-    self.enable_tracing = False
-
-  def parse_args(self):
-    ffc().flexflow_config_parse_args_default(self.handle)
-
-  @property
-  def batch_size(self):
-    return ffc().flexflow_config_get_batch_size(self.handle)
-
-  @property
-  def workers_per_node(self):
-    return ffc().flexflow_config_get_workers_per_node(self.handle)
-
-  @property
-  def num_nodes(self):
-    return ffc().flexflow_config_get_num_nodes(self.handle)
-
-  @property
-  def epochs(self):
-    return ffc().flexflow_config_get_epochs(self.handle)
-    
-  @property
-  def enable_control_replication(self):
-    return ffc().flexflow_config_get_enable_control_replication(self.handle)
-  
-  @property
-  def data_parallelism_degree(self):
-    return ffc().flexflow_config_get_data_parallelism_degree(self.handle)
-  
-  @data_parallelism_degree.setter
-  def data_parallelism_degree(self, value):
-    if type(value) is not int: 
-      raise ValueError("The data parallelism degree must be specified as an integer number")
-    elif value < 1:
-      raise ValueError("The data parallelism degree cannot be lower than 1")
-    ffc().flexflow_config_set_data_parallelism_degree(self.handle, value)
-  
-  @property
-  def tensor_parallelism_degree(self):
-    return ffc().flexflow_config_get_tensor_parallelism_degree(self.handle)
-  
-  @tensor_parallelism_degree.setter
-  def tensor_parallelism_degree(self, value):
-    if type(value) is not int: 
-      raise ValueError("The tensor parallelism degree must be specified as an integer number")
-    elif value < 1:
-      raise ValueError("The tensor parallelism degree cannot be lower than 1")
-    ffc().flexflow_config_set_tensor_parallelism_degree(self.handle, value)
-  
-  @property
-  def pipeline_parallelism_degree(self):
-    return ffc().flexflow_config_get_pipeline_parallelism_degree(self.handle)
-  
-  @pipeline_parallelism_degree.setter
-  def pipeline_parallelism_degree(self, value):
-    if type(value) is not int: 
-      raise ValueError("The pipeline parallelism degree must be specified as an integer number")
-    elif value < 1:
-      raise ValueError("The pipeline parallelism degree cannot be lower than 1")
-    ffc().flexflow_config_set_pipeline_parallelism_degree(self.handle, value)
-    
-  @property
-  def python_data_loader_type(self):
-    return ffc().flexflow_config_get_python_data_loader_type(self.handle)
-  
-  @property
-  def cpu_offload(self):
-    return ffc().flexflow_config_get_offload(self.handle)
-
-  def get_current_time(self):
-    return ffc().flexflow_get_current_time(self.handle)
-
-  def begin_trace(self, trace_id):
-    if self.enable_tracing:
-      ffc().flexflow_begin_trace(self.handle, trace_id)
-
-  def end_trace(self, trace_id):
-    if self.enable_tracing:
-      ffc().flexflow_end_trace(self.handle, trace_id)
+    __slots__ = ["handle", "_handle", "enable_tracing"]
+
+    def __init__(self):
+        self.handle = ffc().flexflow_config_create()
+        self._handle = ffi.gc(self.handle, ffc().flexflow_config_destroy)
+        self.enable_tracing = False
+
+    def parse_args(self):
+        ffc().flexflow_config_parse_args_default(self.handle)
+
+    @property
+    def batch_size(self):
+        return ffc().flexflow_config_get_batch_size(self.handle)
+
+    @property
+    def workers_per_node(self):
+        return ffc().flexflow_config_get_workers_per_node(self.handle)
+
+    @property
+    def num_nodes(self):
+        return ffc().flexflow_config_get_num_nodes(self.handle)
+
+    @property
+    def epochs(self):
+        return ffc().flexflow_config_get_epochs(self.handle)
+
+    @property
+    def enable_control_replication(self):
+        return ffc().flexflow_config_get_enable_control_replication(self.handle)
+
+    @property
+    def data_parallelism_degree(self):
+        return ffc().flexflow_config_get_data_parallelism_degree(self.handle)
+
+    @data_parallelism_degree.setter
+    def data_parallelism_degree(self, value):
+        if type(value) is not int:
+            raise ValueError(
+                "The data parallelism degree must be specified as an integer number"
+            )
+        elif value < 1:
+            raise ValueError("The data parallelism degree cannot be lower than 1")
+        ffc().flexflow_config_set_data_parallelism_degree(self.handle, value)
+
+    @property
+    def tensor_parallelism_degree(self):
+        return ffc().flexflow_config_get_tensor_parallelism_degree(self.handle)
+
+    @tensor_parallelism_degree.setter
+    def tensor_parallelism_degree(self, value):
+        if type(value) is not int:
+            raise ValueError(
+                "The tensor parallelism degree must be specified as an integer number"
+            )
+        elif value < 1:
+            raise ValueError("The tensor parallelism degree cannot be lower than 1")
+        ffc().flexflow_config_set_tensor_parallelism_degree(self.handle, value)
+
+    @property
+    def pipeline_parallelism_degree(self):
+        return ffc().flexflow_config_get_pipeline_parallelism_degree(self.handle)
+
+    @pipeline_parallelism_degree.setter
+    def pipeline_parallelism_degree(self, value):
+        if type(value) is not int:
+            raise ValueError(
+                "The pipeline parallelism degree must be specified as an integer number"
+            )
+        elif value < 1:
+            raise ValueError("The pipeline parallelism degree cannot be lower than 1")
+        ffc().flexflow_config_set_pipeline_parallelism_degree(self.handle, value)
+
+    @property
+    def python_data_loader_type(self):
+        return ffc().flexflow_config_get_python_data_loader_type(self.handle)
+
+    @property
+    def cpu_offload(self):
+        return ffc().flexflow_config_get_offload(self.handle)
+
+    def get_current_time(self):
+        return ffc().flexflow_get_current_time(self.handle)
+
+    def begin_trace(self, trace_id):
+        if self.enable_tracing:
+            ffc().flexflow_begin_trace(self.handle, trace_id)
+
+    def end_trace(self, trace_id):
+        if self.enable_tracing:
+            ffc().flexflow_end_trace(self.handle, trace_id)
+
 
 # -----------------------------------------------------------------------
 # Tensor
 # -----------------------------------------------------------------------
 
-class Tensor(object):
-  __slots__ = ['p_handle', 'handle', '_handle', 'num_dims', 'dims', 'data_type', 'owner_op', 'mapped']
-  def __init__(self, handle, deallocate=True, owner_op_type=None, p_handle=None):
-    if handle == None and ffi.typeof(p_handle) == ffi.typeof('flexflow_tensor_t*'):
-      self.p_handle = p_handle
-      self.handle = self.p_handle[0]
-    elif handle != None and ffi.typeof(handle) == ffi.typeof('flexflow_tensor_t'):
-      self.p_handle = 0
-      self.handle = handle
-    #elif handle != None and ffi.typeof(handle) == ffi.typeof('flexflow_tensor_t'):
-    #  self.p_handle = ffi.new('flexflow_tensor_t *')
-    #  self.p_handle.impl = handle.impl
-    #  self.handle = self.p_handle[0]
-    else:
-      assert 0, "Tensor handle is wrong"
-    self.num_dims = 0
-    self.dims = 0
-    self.mapped = False
-    self.__get_dims()
-    self.__get_data_type()
-    # if (deallocate == True):
-    #   self._handle = ffi.gc(self.handle, ffc().flexflow_tensor_destroy)
-    # if (self.is_mapped() == True):
-    #   self.mapped = True
-
-    if owner_op_type != None:
-      self.__get_owner_op(owner_op_type)
-      assert self.owner_op != None
-
-  def inline_map(self, ffmodel, ffconfig):
-    assert self.mapped == False, "Tensor is already mapped."
-    ffc().flexflow_tensor_inline_map(self.handle, ffmodel.handle, ffconfig.handle);
-    self.mapped = True
-    assert self.num_dims > 0, "check dims"
-
-  def inline_unmap(self, ffmodel, ffconfig):
-    assert self.mapped == True, "Tensor is not inline mapped."
-    ffc().flexflow_tensor_inline_unmap(self.handle, ffmodel.handle, ffconfig.handle);
-    self.mapped = False
-
-  def get_array(self, ffmodel, ffconfig):
-    assert self.mapped == True, "Tensor is not mapped."
-    raw_ptr = self.__get_raw_ptr(ffmodel, ffconfig, self.data_type)
-    raw_ptr_int = int(ffi.cast("uintptr_t", raw_ptr))
-    fflogger.debug("raw_ptr: %s, %d" %( str(raw_ptr), raw_ptr_int))
-    strides = None
-    if (self.num_dims >= 1 or self.num_dims <= 4):
-      shape = self.dims
-    else:
-      assert 0, "unknow num_dims"
-    initializer = RegionNdarray(shape, self.data_type, raw_ptr_int, strides, False)
-    array = np.asarray(initializer)
-    # print("stride", array.__array_interface__['strides'])
-    return array
-
-  def get_flat_array(self, ffmodel, ffconfig):
-    assert self.mapped == True, "Tensor is not mapped."
-    raw_ptr = self.__get_raw_ptr(ffmodel, ffconfig, self.data_type)
-    raw_ptr_int = int(ffi.cast("uintptr_t", raw_ptr))
-    fflogger.debug("raw_ptr: %s, %d" %( str(raw_ptr), raw_ptr_int))
-    strides = None
-    if (self.num_dims >= 1 or self.num_dims <= 4):
-      shape_prod = np.prod(self.dims)
-      shape = (shape_prod,)
-    else:
-      assert 0, "unknown num_dims"
-    initializer = RegionNdarray(shape, self.data_type, raw_ptr_int, strides, False)
-    array = np.asarray(initializer)
-    return array
-
-  def attach_numpy_array(self, ffmodel, ffconfig, np_array):
-    assert np_array.__array_interface__['strides'] == None, "numpy array strides is not None"
-    np_shape = np_array.shape
-    num_dims = len(np_shape)
-    assert num_dims == self.num_dims, "please check dims (%d == %d)" %(num_dims, self.num_dims)
-    for i in range(0, num_dims):
-      assert np_shape[i] == self.dims[i], "please check shape dim %d (%d == %d)" %(i, np_shape[i], self.dims[i])
-    np_raw_ptr = np_array.__array_interface__['data']
-    raw_ptr = ffi.cast("void*", np_raw_ptr[0])
-    fflogger.debug("attach numpy array: %s, %s, %s" %( str(np_raw_ptr), str(raw_ptr), hex(np_raw_ptr[0])))
-    self.__attach_raw_ptr(ffmodel, ffconfig, raw_ptr)
-
-  def detach_numpy_array(self, ffconfig):
-    self.__detach_raw_ptr(ffconfig)
-
-  def is_mapped(self):
-    return ffc().flexflow_tensor_is_mapped(self.handle)
-    
-  def set_tensor(self, ffmodel, np_array):
-    assert np_array.__array_interface__['strides'] == None, "Parameter set_weights, numpy array strides is not None"
-    np_shape = np_array.shape
-    num_dims = len(np_shape)
-    assert num_dims == self.num_dims, "please check dims (%d == %d)" %(num_dims, self.num_dims)
-    for i in range(0, num_dims):
-      assert np_shape[i] == self.dims[i], "please check shape dim %d (%d == %d)" %(i, np_shape[i], self.dims[i])
-    c_dims = ffi.new("int[]", self.dims)
-    np_raw_ptr = np_array.__array_interface__['data']
-    if np_array.dtype == np.float16:
-      assert self.data_type == DataType.DT_HALF, "Wrong datatype"
-      raw_ptr = ffi.cast("half*", np_raw_ptr[0])
-      ret_val = ffc().flexflow_tensor_set_tensor_float(self.handle, ffmodel.handle, num_dims, c_dims, raw_ptr)
-    elif np_array.dtype == np.float32:
-      assert self.data_type == DataType.DT_FLOAT, "Wrong datatype"
-      raw_ptr = ffi.cast("float*", np_raw_ptr[0])
-      ret_val = ffc().flexflow_tensor_set_tensor_float(self.handle, ffmodel.handle, num_dims, c_dims, raw_ptr)
-    elif np_array.dtype == np.int32:
-      assert self.data_type == DataType.DT_INT32, "Wrong datatype"
-      raw_ptr = ffi.cast("int*", np_raw_ptr[0])
-      ret_val = ffc().flexflow_tensor_set_tensor_int(self.handle, ffmodel.handle, num_dims, c_dims, raw_ptr)
-    else:
-      assert 0, "Unsupported datatype"
-    fflogger.debug("set tensor raw_ptr: %s, %s, %s, %s" %( str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(np_shape)))
-    assert ret_val == True, ret_val
-    
-  def get_tensor(self, ffmodel):
-    shape = self.dims
-    if self.data_type == DataType.DT_HALF:
-      np_array = np.empty(shape, dtype=np.float16)
-    elif self.data_type == DataType.DT_FLOAT:
-      np_array = np.empty(shape, dtype=np.float32)
-    elif self.data_type == DataType.DT_INT32:
-      np_array = np.empty(shape, dtype=np.int32)
-    elif self.data_type == DataType.DT_INT64:
-      np_array = np.empty(shape, dtype=np.int64)
-    else:
-      assert 0, f"Unsupported datatype: {self.data_type}"
-    np_raw_ptr = np_array.__array_interface__['data']
-    if np_array.dtype == np.float32:
-      raw_ptr = ffi.cast("float*", np_raw_ptr[0])
-      ret_val = ffc().flexflow_tensor_get_tensor_float(self.handle, ffmodel.handle, raw_ptr, False)
-    elif np_array.dtype == np.int32:
-      raw_ptr = ffi.cast("int*", np_raw_ptr[0])
-      ret_val = ffc().flexflow_tensor_get_tensor_int(self.handle, ffmodel.handle, raw_ptr, False)
-    elif np_array.dtype == np.int64:
-      raw_ptr = ffi.cast("int64_t*", np_raw_ptr[0])
-      ret_val = ffc().flexflow_tensor_get_tensor_int64(self.handle, ffmodel.handle, raw_ptr, False)
-    fflogger.debug("get weights raw_ptr: %s, %s, %s, %s" %( str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(shape)))
-    assert ret_val == True
-    return np_array
-
-  def get_gradients(self, ffmodel, comm_type):
-    shape = self.dims
-    if self.data_type == DataType.DT_HALF:
-      np_array = np.empty(shape, dtype=np.float16)
-    elif self.data_type == DataType.DT_FLOAT:
-      np_array = np.empty(shape, dtype=np.float32)
-    elif self.data_type == DataType.DT_INT32:
-      np_array = np.empty(shape, dtype=np.int32)
-    elif self.data_type == DataType.DT_INT64:
-      np_array = np.empty(shape, dtype=np.int64)
-    else:
-      assert 0, f"Unsupported datatype: {self.data_type}"
-    np_raw_ptr = np_array.__array_interface__['data']
-    c_comm_type = enum_to_int(ParameterSyncType, comm_type)
-    if np_array.dtype == np.float32:
-      raw_ptr = ffi.cast("float*", np_raw_ptr[0])
-      ret_val = ffc().flexflow_tensor_get_tensor_float(self.handle, ffmodel.handle, raw_ptr, True)
-    elif np_array.dtype == np.int32:
-      raw_ptr = ffi.cast("int*", np_raw_ptr[0])
-      ret_val = ffc().flexflow_tensor_get_tensor_int(self.handle, ffmodel.handle, raw_ptr, True)
-    elif np_array.dtype == np.int64:
-      raw_ptr = ffi.cast("int64_t*", np_raw_ptr[0])
-      ret_val = ffc().flexflow_tensor_get_tensor_int64(self.handle, ffmodel.handle, raw_ptr, True)
-    fflogger.debug("get weights raw_ptr: %s, %s, %s, %s" %( str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(shape)))
-    assert ret_val == True
-    return np_array
-  
-  def get_model_output_gradients(self, ffmodel, comm_type):
-    shape = self.dims
-    if self.data_type == DataType.DT_HALF:
-      np_array = np.empty(shape, dtype=np.float16)
-    elif self.data_type == DataType.DT_FLOAT:
-      np_array = np.empty(shape, dtype=np.float32)
-    elif self.data_type == DataType.DT_INT32:
-      np_array = np.empty(shape, dtype=np.int32)
-    elif self.data_type == DataType.DT_INT64:
-      np_array = np.empty(shape, dtype=np.int64)
-    else:
-      assert 0, f"Unsupported datatype: {self.data_type}"
-    np_raw_ptr = np_array.__array_interface__['data']
-    c_comm_type = enum_to_int(ParameterSyncType, comm_type)
-    if np_array.dtype == np.float32:
-      raw_ptr = ffi.cast("float*", np_raw_ptr[0])
-      ret_val = ffc().flexflow_model_get_output_tensor_float(ffmodel.handle, self.handle, raw_ptr, True)
-    else:
-      assert 0, "unknown data type"
-    fflogger.debug("get weights raw_ptr: %s, %s, %s, %s" %( str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(shape)))
-    assert ret_val == True
-    return np_array
-  
-  def get_model_output_tensor(self, ffmodel):
-    shape = self.dims
-    if self.data_type == DataType.DT_HALF:
-      np_array = np.empty(shape, dtype=np.float16)
-    elif self.data_type == DataType.DT_FLOAT:
-      np_array = np.empty(shape, dtype=np.float32)
-    elif self.data_type == DataType.DT_INT32:
-      np_array = np.empty(shape, dtype=np.int32)
-    elif self.data_type == DataType.DT_INT64:
-      np_array = np.empty(shape, dtype=np.int64)
-    else:
-      assert 0, f"Unsupported datatype: {self.data_type}"
-    np_raw_ptr = np_array.__array_interface__['data']
-    if np_array.dtype == np.float32:
-      raw_ptr = ffi.cast("float*", np_raw_ptr[0])
-      ret_val = ffc().flexflow_model_get_output_tensor_float(ffmodel.handle, self.handle, raw_ptr, False)
-    else:
-      assert 0, "unknown data type"
-    fflogger.debug("get weights raw_ptr: %s, %s, %s, %s" %( str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(shape)))
-    assert ret_val == True
-    return np_array
-
-  def __get_raw_ptr(self, ffmodel, ffconfig, data_type):
-    assert data_type == self.data_type, "Tensor check data type"
-    if (data_type == DataType.DT_HALF):
-      return ffc().flexflow_tensor_get_raw_ptr_float(self.handle, ffmodel.handle, ffconfig.handle)
-    elif (data_type == DataType.DT_FLOAT):
-      return ffc().flexflow_tensor_get_raw_ptr_float(self.handle, ffmodel.handle, ffconfig.handle)
-    elif (data_type == DataType.DT_INT32):
-      return ffc().flexflow_tensor_get_raw_ptr_int32(self.handle, ffmodel.handle, ffconfig.handle)
-    else:
-      assert 0, "unknown data type"
-
-  def __get_dims(self):
-    self.num_dims = ffc().flexflow_tensor_get_num_dims(self.handle)
-    # if (self.num_dims == 1):
-    #   self.dims = (ffc().flexflow_tensor_get_dim(self.handle, 0),)
-    # elif (self.num_dims == 2):
-    #   self.dims = (ffc().flexflow_tensor_get_dim(self.handle, 1), ffc().flexflow_tensor_get_dim(self.handle, 0))
-    # elif (self.num_dims == 3):
-    #   self.dims = (ffc().flexflow_tensor_get_dim(self.handle, 2), ffc().flexflow_tensor_get_dim(self.handle, 1), ffc().flexflow_tensor_get_dim(self.handle, 0))
-    # elif (self.num_dims == 4):
-    #   self.dims = (ffc().flexflow_tensor_get_dim(self.handle, 3), ffc().flexflow_tensor_get_dim(self.handle, 2), ffc().flexflow_tensor_get_dim(self.handle, 1), ffc().flexflow_tensor_get_dim(self.handle, 0))
-    # elif (self.num_dims == 5):
-    #   self.dims = (ffc().flexflow_tensor_get_dim(self.handle, 4), ffc().flexflow_tensor_get_dim(self.handle, 3), ffc().flexflow_tensor_get_dim(self.handle, 2), ffc().flexflow_tensor_get_dim(self.handle, 1), ffc().flexflow_tensor_get_dim(self.handle, 0))
-    # else:
-    #   assert 0, "unknown num_dims"
-    d = ffc().flexflow_tensor_get_dims(self.handle)
-    if (self.num_dims == 1):
-      self.dims = (d[0],)
-    elif (self.num_dims == 2):
-      self.dims = (d[1], d[0])
-    elif (self.num_dims == 3):
-      self.dims = (d[2], d[1], d[0])
-    elif (self.num_dims == 4):
-      self.dims = (d[3], d[2], d[1], d[0])
-    elif (self.num_dims == 5):
-      self.dims = (d[4], d[3], d[2], d[1], d[0])
-    else:
-      assert 0, "unknown num_dims"
-
-  def __get_data_type(self):
-    dtype = ffc().flexflow_tensor_get_data_type(self.handle)
-    if (dtype == 40):
-      self.data_type = DataType.DT_BOOLEAN
-    elif (dtype == 41):
-      self.data_type = DataType.DT_INT32
-    elif (dtype == 42):
-      self.data_type = DataType.DT_INT64
-    elif (dtype == 43):
-      self.data_type = DataType.DT_HALF
-    elif (dtype == 44):
-      self.data_type = DataType.DT_FLOAT
-    elif (dtype == 45):
-      self.data_type = DataType.DT_DOUBLE
-    else:
-      assert 0, "unknown data type {}".format(dtype)
 
-  def __get_owner_op(self, op_type):
-    op_handle = ffc().flexflow_tensor_get_owner_op(self.handle)
-    if op_handle.impl == ffi.NULL:
-      self.owner_op = None
-    else:
-      self.owner_op = convert_op_handle_to_op(op_type, op_handle)
-
-  def __attach_raw_ptr(self, ffmodel, ffconfig, raw_ptr, column_major=True):
-    assert self.mapped == False, "Tensor is already mapped."
-    ffc().flexflow_tensor_attach_raw_ptr(self.handle, ffmodel.handle, ffconfig.handle, raw_ptr, column_major)
-    self.mapped = True
+class Tensor(object):
+    __slots__ = [
+        "p_handle",
+        "handle",
+        "_handle",
+        "num_dims",
+        "dims",
+        "data_type",
+        "owner_op",
+        "mapped",
+    ]
+
+    def __init__(self, handle, deallocate=True, owner_op_type=None, p_handle=None):
+        if handle == None and ffi.typeof(p_handle) == ffi.typeof("flexflow_tensor_t*"):
+            self.p_handle = p_handle
+            self.handle = self.p_handle[0]
+        elif handle != None and ffi.typeof(handle) == ffi.typeof("flexflow_tensor_t"):
+            self.p_handle = 0
+            self.handle = handle
+        # elif handle != None and ffi.typeof(handle) == ffi.typeof('flexflow_tensor_t'):
+        #  self.p_handle = ffi.new('flexflow_tensor_t *')
+        #  self.p_handle.impl = handle.impl
+        #  self.handle = self.p_handle[0]
+        else:
+            assert 0, "Tensor handle is wrong"
+        self.num_dims = 0
+        self.dims = 0
+        self.mapped = False
+        self.__get_dims()
+        self.__get_data_type()
+        # if (deallocate == True):
+        #   self._handle = ffi.gc(self.handle, ffc().flexflow_tensor_destroy)
+        # if (self.is_mapped() == True):
+        #   self.mapped = True
+
+        if owner_op_type != None:
+            self.__get_owner_op(owner_op_type)
+            assert self.owner_op != None
+
+    def inline_map(self, ffmodel, ffconfig):
+        assert self.mapped == False, "Tensor is already mapped."
+        ffc().flexflow_tensor_inline_map(self.handle, ffmodel.handle, ffconfig.handle)
+        self.mapped = True
+        assert self.num_dims > 0, "check dims"
+
+    def inline_unmap(self, ffmodel, ffconfig):
+        assert self.mapped == True, "Tensor is not inline mapped."
+        ffc().flexflow_tensor_inline_unmap(self.handle, ffmodel.handle, ffconfig.handle)
+        self.mapped = False
+
+    def get_array(self, ffmodel, ffconfig):
+        assert self.mapped == True, "Tensor is not mapped."
+        raw_ptr = self.__get_raw_ptr(ffmodel, ffconfig, self.data_type)
+        raw_ptr_int = int(ffi.cast("uintptr_t", raw_ptr))
+        fflogger.debug("raw_ptr: %s, %d" % (str(raw_ptr), raw_ptr_int))
+        strides = None
+        if self.num_dims >= 1 or self.num_dims <= 4:
+            shape = self.dims
+        else:
+            assert 0, "unknow num_dims"
+        initializer = RegionNdarray(shape, self.data_type, raw_ptr_int, strides, False)
+        array = np.asarray(initializer)
+        # print("stride", array.__array_interface__['strides'])
+        return array
+
+    def get_flat_array(self, ffmodel, ffconfig):
+        assert self.mapped == True, "Tensor is not mapped."
+        raw_ptr = self.__get_raw_ptr(ffmodel, ffconfig, self.data_type)
+        raw_ptr_int = int(ffi.cast("uintptr_t", raw_ptr))
+        fflogger.debug("raw_ptr: %s, %d" % (str(raw_ptr), raw_ptr_int))
+        strides = None
+        if self.num_dims >= 1 or self.num_dims <= 4:
+            shape_prod = np.prod(self.dims)
+            shape = (shape_prod,)
+        else:
+            assert 0, "unknown num_dims"
+        initializer = RegionNdarray(shape, self.data_type, raw_ptr_int, strides, False)
+        array = np.asarray(initializer)
+        return array
+
+    def attach_numpy_array(self, ffmodel, ffconfig, np_array):
+        assert (
+            np_array.__array_interface__["strides"] == None
+        ), "numpy array strides is not None"
+        np_shape = np_array.shape
+        num_dims = len(np_shape)
+        assert num_dims == self.num_dims, "please check dims (%d == %d)" % (
+            num_dims,
+            self.num_dims,
+        )
+        for i in range(0, num_dims):
+            assert (
+                np_shape[i] == self.dims[i]
+            ), "please check shape dim %d (%d == %d)" % (i, np_shape[i], self.dims[i])
+        np_raw_ptr = np_array.__array_interface__["data"]
+        raw_ptr = ffi.cast("void*", np_raw_ptr[0])
+        fflogger.debug(
+            "attach numpy array: %s, %s, %s"
+            % (str(np_raw_ptr), str(raw_ptr), hex(np_raw_ptr[0]))
+        )
+        self.__attach_raw_ptr(ffmodel, ffconfig, raw_ptr)
+
+    def detach_numpy_array(self, ffconfig):
+        self.__detach_raw_ptr(ffconfig)
+
+    def is_mapped(self):
+        return ffc().flexflow_tensor_is_mapped(self.handle)
+
+    def set_tensor(self, ffmodel, np_array):
+        assert (
+            np_array.__array_interface__["strides"] == None
+        ), "Parameter set_weights, numpy array strides is not None"
+        np_shape = np_array.shape
+        num_dims = len(np_shape)
+        assert num_dims == self.num_dims, "please check dims (%d == %d)" % (
+            num_dims,
+            self.num_dims,
+        )
+        for i in range(0, num_dims):
+            assert (
+                np_shape[i] == self.dims[i]
+            ), "please check shape dim %d (%d == %d)" % (i, np_shape[i], self.dims[i])
+        c_dims = ffi.new("int[]", self.dims)
+        np_raw_ptr = np_array.__array_interface__["data"]
+        if np_array.dtype == np.float16:
+            assert self.data_type == DataType.DT_HALF, "Wrong datatype"
+            raw_ptr = ffi.cast("half*", np_raw_ptr[0])
+            ret_val = ffc().flexflow_tensor_set_tensor_float(
+                self.handle, ffmodel.handle, num_dims, c_dims, raw_ptr
+            )
+        elif np_array.dtype == np.float32:
+            assert self.data_type == DataType.DT_FLOAT, "Wrong datatype"
+            raw_ptr = ffi.cast("float*", np_raw_ptr[0])
+            ret_val = ffc().flexflow_tensor_set_tensor_float(
+                self.handle, ffmodel.handle, num_dims, c_dims, raw_ptr
+            )
+        elif np_array.dtype == np.int32:
+            assert self.data_type == DataType.DT_INT32, "Wrong datatype"
+            raw_ptr = ffi.cast("int*", np_raw_ptr[0])
+            ret_val = ffc().flexflow_tensor_set_tensor_int(
+                self.handle, ffmodel.handle, num_dims, c_dims, raw_ptr
+            )
+        else:
+            assert 0, "Unsupported datatype"
+        fflogger.debug(
+            "set tensor raw_ptr: %s, %s, %s, %s"
+            % (str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(np_shape))
+        )
+        assert ret_val == True, ret_val
+
+    def get_tensor(self, ffmodel):
+        shape = self.dims
+        if self.data_type == DataType.DT_HALF:
+            np_array = np.empty(shape, dtype=np.float16)
+        elif self.data_type == DataType.DT_FLOAT:
+            np_array = np.empty(shape, dtype=np.float32)
+        elif self.data_type == DataType.DT_INT32:
+            np_array = np.empty(shape, dtype=np.int32)
+        elif self.data_type == DataType.DT_INT64:
+            np_array = np.empty(shape, dtype=np.int64)
+        else:
+            assert 0, f"Unsupported datatype: {self.data_type}"
+        np_raw_ptr = np_array.__array_interface__["data"]
+        if np_array.dtype == np.float32:
+            raw_ptr = ffi.cast("float*", np_raw_ptr[0])
+            ret_val = ffc().flexflow_tensor_get_tensor_float(
+                self.handle, ffmodel.handle, raw_ptr, False
+            )
+        elif np_array.dtype == np.int32:
+            raw_ptr = ffi.cast("int*", np_raw_ptr[0])
+            ret_val = ffc().flexflow_tensor_get_tensor_int(
+                self.handle, ffmodel.handle, raw_ptr, False
+            )
+        elif np_array.dtype == np.int64:
+            raw_ptr = ffi.cast("int64_t*", np_raw_ptr[0])
+            ret_val = ffc().flexflow_tensor_get_tensor_int64(
+                self.handle, ffmodel.handle, raw_ptr, False
+            )
+        fflogger.debug(
+            "get weights raw_ptr: %s, %s, %s, %s"
+            % (str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(shape))
+        )
+        assert ret_val == True
+        return np_array
+
+    def get_gradients(self, ffmodel, comm_type):
+        shape = self.dims
+        if self.data_type == DataType.DT_HALF:
+            np_array = np.empty(shape, dtype=np.float16)
+        elif self.data_type == DataType.DT_FLOAT:
+            np_array = np.empty(shape, dtype=np.float32)
+        elif self.data_type == DataType.DT_INT32:
+            np_array = np.empty(shape, dtype=np.int32)
+        elif self.data_type == DataType.DT_INT64:
+            np_array = np.empty(shape, dtype=np.int64)
+        else:
+            assert 0, f"Unsupported datatype: {self.data_type}"
+        np_raw_ptr = np_array.__array_interface__["data"]
+        c_comm_type = enum_to_int(ParameterSyncType, comm_type)
+        if np_array.dtype == np.float32:
+            raw_ptr = ffi.cast("float*", np_raw_ptr[0])
+            ret_val = ffc().flexflow_tensor_get_tensor_float(
+                self.handle, ffmodel.handle, raw_ptr, True
+            )
+        elif np_array.dtype == np.int32:
+            raw_ptr = ffi.cast("int*", np_raw_ptr[0])
+            ret_val = ffc().flexflow_tensor_get_tensor_int(
+                self.handle, ffmodel.handle, raw_ptr, True
+            )
+        elif np_array.dtype == np.int64:
+            raw_ptr = ffi.cast("int64_t*", np_raw_ptr[0])
+            ret_val = ffc().flexflow_tensor_get_tensor_int64(
+                self.handle, ffmodel.handle, raw_ptr, True
+            )
+        fflogger.debug(
+            "get weights raw_ptr: %s, %s, %s, %s"
+            % (str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(shape))
+        )
+        assert ret_val == True
+        return np_array
+
+    def get_model_output_gradients(self, ffmodel, comm_type):
+        shape = self.dims
+        if self.data_type == DataType.DT_HALF:
+            np_array = np.empty(shape, dtype=np.float16)
+        elif self.data_type == DataType.DT_FLOAT:
+            np_array = np.empty(shape, dtype=np.float32)
+        elif self.data_type == DataType.DT_INT32:
+            np_array = np.empty(shape, dtype=np.int32)
+        elif self.data_type == DataType.DT_INT64:
+            np_array = np.empty(shape, dtype=np.int64)
+        else:
+            assert 0, f"Unsupported datatype: {self.data_type}"
+        np_raw_ptr = np_array.__array_interface__["data"]
+        c_comm_type = enum_to_int(ParameterSyncType, comm_type)
+        if np_array.dtype == np.float32:
+            raw_ptr = ffi.cast("float*", np_raw_ptr[0])
+            ret_val = ffc().flexflow_model_get_output_tensor_float(
+                ffmodel.handle, self.handle, raw_ptr, True
+            )
+        else:
+            assert 0, "unknown data type"
+        fflogger.debug(
+            "get weights raw_ptr: %s, %s, %s, %s"
+            % (str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(shape))
+        )
+        assert ret_val == True
+        return np_array
+
+    def get_model_output_tensor(self, ffmodel):
+        shape = self.dims
+        if self.data_type == DataType.DT_HALF:
+            np_array = np.empty(shape, dtype=np.float16)
+        elif self.data_type == DataType.DT_FLOAT:
+            np_array = np.empty(shape, dtype=np.float32)
+        elif self.data_type == DataType.DT_INT32:
+            np_array = np.empty(shape, dtype=np.int32)
+        elif self.data_type == DataType.DT_INT64:
+            np_array = np.empty(shape, dtype=np.int64)
+        else:
+            assert 0, f"Unsupported datatype: {self.data_type}"
+        np_raw_ptr = np_array.__array_interface__["data"]
+        if np_array.dtype == np.float32:
+            raw_ptr = ffi.cast("float*", np_raw_ptr[0])
+            ret_val = ffc().flexflow_model_get_output_tensor_float(
+                ffmodel.handle, self.handle, raw_ptr, False
+            )
+        else:
+            assert 0, "unknown data type"
+        fflogger.debug(
+            "get weights raw_ptr: %s, %s, %s, %s"
+            % (str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(shape))
+        )
+        assert ret_val == True
+        return np_array
+
+    def __get_raw_ptr(self, ffmodel, ffconfig, data_type):
+        assert data_type == self.data_type, "Tensor check data type"
+        if data_type == DataType.DT_HALF:
+            return ffc().flexflow_tensor_get_raw_ptr_float(
+                self.handle, ffmodel.handle, ffconfig.handle
+            )
+        elif data_type == DataType.DT_FLOAT:
+            return ffc().flexflow_tensor_get_raw_ptr_float(
+                self.handle, ffmodel.handle, ffconfig.handle
+            )
+        elif data_type == DataType.DT_INT32:
+            return ffc().flexflow_tensor_get_raw_ptr_int32(
+                self.handle, ffmodel.handle, ffconfig.handle
+            )
+        else:
+            assert 0, "unknown data type"
+
+    def __get_dims(self):
+        self.num_dims = ffc().flexflow_tensor_get_num_dims(self.handle)
+        # if (self.num_dims == 1):
+        #   self.dims = (ffc().flexflow_tensor_get_dim(self.handle, 0),)
+        # elif (self.num_dims == 2):
+        #   self.dims = (ffc().flexflow_tensor_get_dim(self.handle, 1), ffc().flexflow_tensor_get_dim(self.handle, 0))
+        # elif (self.num_dims == 3):
+        #   self.dims = (ffc().flexflow_tensor_get_dim(self.handle, 2), ffc().flexflow_tensor_get_dim(self.handle, 1), ffc().flexflow_tensor_get_dim(self.handle, 0))
+        # elif (self.num_dims == 4):
+        #   self.dims = (ffc().flexflow_tensor_get_dim(self.handle, 3), ffc().flexflow_tensor_get_dim(self.handle, 2), ffc().flexflow_tensor_get_dim(self.handle, 1), ffc().flexflow_tensor_get_dim(self.handle, 0))
+        # elif (self.num_dims == 5):
+        #   self.dims = (ffc().flexflow_tensor_get_dim(self.handle, 4), ffc().flexflow_tensor_get_dim(self.handle, 3), ffc().flexflow_tensor_get_dim(self.handle, 2), ffc().flexflow_tensor_get_dim(self.handle, 1), ffc().flexflow_tensor_get_dim(self.handle, 0))
+        # else:
+        #   assert 0, "unknown num_dims"
+        d = ffc().flexflow_tensor_get_dims(self.handle)
+        if self.num_dims == 1:
+            self.dims = (d[0],)
+        elif self.num_dims == 2:
+            self.dims = (d[1], d[0])
+        elif self.num_dims == 3:
+            self.dims = (d[2], d[1], d[0])
+        elif self.num_dims == 4:
+            self.dims = (d[3], d[2], d[1], d[0])
+        elif self.num_dims == 5:
+            self.dims = (d[4], d[3], d[2], d[1], d[0])
+        else:
+            assert 0, "unknown num_dims"
+
+    def __get_data_type(self):
+        dtype = ffc().flexflow_tensor_get_data_type(self.handle)
+        if dtype == 40:
+            self.data_type = DataType.DT_BOOLEAN
+        elif dtype == 41:
+            self.data_type = DataType.DT_INT32
+        elif dtype == 42:
+            self.data_type = DataType.DT_INT64
+        elif dtype == 43:
+            self.data_type = DataType.DT_HALF
+        elif dtype == 44:
+            self.data_type = DataType.DT_FLOAT
+        elif dtype == 45:
+            self.data_type = DataType.DT_DOUBLE
+        else:
+            assert 0, "unknown data type {}".format(dtype)
+
+    def __get_owner_op(self, op_type):
+        op_handle = ffc().flexflow_tensor_get_owner_op(self.handle)
+        if op_handle.impl == ffi.NULL:
+            self.owner_op = None
+        else:
+            self.owner_op = convert_op_handle_to_op(op_type, op_handle)
+
+    def __attach_raw_ptr(self, ffmodel, ffconfig, raw_ptr, column_major=True):
+        assert self.mapped == False, "Tensor is already mapped."
+        ffc().flexflow_tensor_attach_raw_ptr(
+            self.handle, ffmodel.handle, ffconfig.handle, raw_ptr, column_major
+        )
+        self.mapped = True
+
+    def __detach_raw_ptr(self, ffconfig):
+        assert self.mapped == True, "Tensor is not mapped."
+        ffc().flexflow_tensor_detach_raw_ptr(self.handle, ffconfig.handle)
+        self.mapped = False
 
-  def __detach_raw_ptr(self, ffconfig):
-    assert self.mapped == True, "Tensor is not mapped."
-    ffc().flexflow_tensor_detach_raw_ptr(self.handle, ffconfig.handle)
-    self.mapped = False
 
 # -----------------------------------------------------------------------
 # Parameter
 # -----------------------------------------------------------------------
 
+
 class Parameter(Tensor):
-  __slots__ = ['parameter_handle']
-  def __init__(self, handle):
-    assert ffi.typeof(handle) == ffi.typeof('flexflow_tensor_t'), "Parameter handle is wrong"
-    self.parameter_handle = handle
-    super(Parameter, self).__init__(self.parameter_handle, deallocate=False)
-
-  def set_weights(self, ffmodel, np_array):
-    assert np_array.__array_interface__['strides'] == None, "Parameter set_weights, numpy array strides is not None"
-    np_shape = np_array.shape
-    num_dims = len(np_shape)
-    assert num_dims == self.num_dims, "please check dims (%d == %d)" %(num_dims, self.num_dims)
-    print(np_shape, self.dims)
-    for i in range(0, num_dims):
-      assert np_shape[i] == self.dims[i], "please check shape dim %d (%d == %d)" %(i, np_shape[i], self.dims[i])
-    c_dims = ffi.new("int[]", self.dims)
-    np_raw_ptr = np_array.__array_interface__['data']
-    raw_ptr = ffi.cast("float*", np_raw_ptr[0])
-    fflogger.debug("set weights raw_ptr: %s, %s, %s, %s" %( str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(np_shape)))
-    ret_val = ffc().flexflow_tensor_set_tensor_float(self.parameter_handle, ffmodel.handle, num_dims, c_dims, raw_ptr)
-    assert ret_val == True, ret_val
-
-  def get_weights(self, ffmodel):
-    shape = self.dims
-    np_array = np.empty(shape, dtype=np.float32)
-    np_raw_ptr = np_array.__array_interface__['data']
-    raw_ptr = ffi.cast("float*", np_raw_ptr[0])
-    fflogger.debug("get weights raw_ptr: %s, %s, %s, %s" %( str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(shape)))
-    ret_val = ffc().flexflow_tensor_get_tensor_float(self.parameter_handle, ffmodel.handle, raw_ptr, False)
-    assert ret_val == True
-    return np_array
+    __slots__ = ["parameter_handle"]
+
+    def __init__(self, handle):
+        assert ffi.typeof(handle) == ffi.typeof(
+            "flexflow_tensor_t"
+        ), "Parameter handle is wrong"
+        self.parameter_handle = handle
+        super(Parameter, self).__init__(self.parameter_handle, deallocate=False)
+
+    def set_weights(self, ffmodel, np_array):
+        assert (
+            np_array.__array_interface__["strides"] == None
+        ), "Parameter set_weights, numpy array strides is not None"
+        np_shape = np_array.shape
+        num_dims = len(np_shape)
+        assert num_dims == self.num_dims, "please check dims (%d == %d)" % (
+            num_dims,
+            self.num_dims,
+        )
+        print(np_shape, self.dims)
+        for i in range(0, num_dims):
+            assert (
+                np_shape[i] == self.dims[i]
+            ), "please check shape dim %d (%d == %d)" % (i, np_shape[i], self.dims[i])
+        c_dims = ffi.new("int[]", self.dims)
+        np_raw_ptr = np_array.__array_interface__["data"]
+        raw_ptr = ffi.cast("float*", np_raw_ptr[0])
+        fflogger.debug(
+            "set weights raw_ptr: %s, %s, %s, %s"
+            % (str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(np_shape))
+        )
+        ret_val = ffc().flexflow_tensor_set_tensor_float(
+            self.parameter_handle, ffmodel.handle, num_dims, c_dims, raw_ptr
+        )
+        assert ret_val == True, ret_val
+
+    def get_weights(self, ffmodel):
+        shape = self.dims
+        np_array = np.empty(shape, dtype=np.float32)
+        np_raw_ptr = np_array.__array_interface__["data"]
+        raw_ptr = ffi.cast("float*", np_raw_ptr[0])
+        fflogger.debug(
+            "get weights raw_ptr: %s, %s, %s, %s"
+            % (str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(shape))
+        )
+        ret_val = ffc().flexflow_tensor_get_tensor_float(
+            self.parameter_handle, ffmodel.handle, raw_ptr, False
+        )
+        assert ret_val == True
+        return np_array
+
 
 # -----------------------------------------------------------------------
 # FFModel
 # -----------------------------------------------------------------------
 
+
 class FFModel(object):
-  """
-  """
-  __slots__ = ['handle', '_handle', '_layers', '_nb_layers', '_ffconfig', '_tracing_id', 'initializers', 'attr_tensors']
-  def __init__(self, ffconfig):
-    """Constructor of FFModel.
-           
-    :param ffconfig: configurations of FlexFlow and the created model.
-    :type ffconfig: FFConfig
-
-    :returns:  FFModel -- the model.
-    """
-    self.handle = ffc().flexflow_model_create(ffconfig.handle, ffconfig.cpu_offload)
-    self._handle = ffi.gc(self.handle, ffc().flexflow_model_destroy)
-    self._layers = dict()
-    self._nb_layers = 0
-    self._ffconfig = ffconfig
-    global ff_tracing_id
-    self._tracing_id = ff_tracing_id
-    ff_tracing_id += 1
-    self.initializers = {}
-    self.attr_tensors = {}
-
-  def get_layers(self):
-    return self._layers
-
-  def add_layer(self, op_type, name):
-    layer_id = self._nb_layers
-    op_handle = ffc().flexflow_model_get_last_layer(self.handle)
-    self._layers[self._nb_layers] = convert_op_handle_to_op(op_type, op_handle, idx=layer_id, name=name)
-    self._nb_layers += 1
-
-  def create_tensor(self, dims, data_type, create_grad=True):
-    """Instantiate a FlexFlow tensor.
-             
-    :param x: a shape tuple/list (integers), including the batch size.
-    :type x: list of int
-             
-    :param data_type: the datatype of the created tensor. Options are
-      DT_FLOAT, DT_DOUBLE, DT_INT32, DT_INT64, DT_BOOLEAN.
-    :type data_type: DataType
-    
-    :param create_grad: weather the tensor creates a gradients vector. 
-      If you don't specify anything, a gradients vector is used.
-    :type create_grad: bool
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_dims = ffi.new("int[]", dims)
-    c_data_type = enum_to_int(DataType, data_type)
-    num_dims = len(dims)
-    handle = ffc().flexflow_tensor_create(self.handle, num_dims, c_dims, c_data_type, create_grad);
-    return Tensor(handle)
-
-  def map_tensor(self, tensor, parallel_op = None):
-    op_handle = self.__get_op_handle(parallel_op)
-    ffc().flexflow_tensor_map(self.handle, tensor.handle, op_handle)
-
-  def create_constant(self, dims, value, data_type):
-    c_dims = ffi.new("int[]", dims)
-    c_data_type = enum_to_int(DataType, data_type)
-    num_dims = len(dims)
-    handle = ffc().flexflow_constant_create(self.handle, num_dims, c_dims, value, c_data_type);
-    return Tensor(handle)
-
-  def exp(self, x, name=None):
-    """Exponential activation function.
-             
-    :param x: the input Tensor.
-    :type x: Tensor
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_exp(self.handle, x.handle, c_name)
-    self.add_layer(OpType.EXP, name)
-    return Tensor(handle, owner_op_type=OpType.EXP)
-
-  def sin(self, x, name=None):
-    """Elementwise sine function.
-             
-    :param x: the input Tensor.
-    :type x: Tensor
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_sin(self.handle, x.handle, c_name)
-    self.add_layer(OpType.SIN, name)
-    return Tensor(handle, owner_op_type=OpType.SIN)
-
-  def cos(self, x, name=None):
-    """Elementwise cosine function.
-             
-    :param x: the input Tensor.
-    :type x: Tensor
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_cos(self.handle, x.handle, c_name)
-    self.add_layer(OpType.COS, name)
-    return Tensor(handle, owner_op_type=OpType.COS)
-
-
-  def add(self, x, y, inplace_a=False, name=None):
-    """Layer that adds two input Tensors, :attr:`output = x + y`.
-             
-    :param x: the first input Tensor.
-    :type x: Tensor
-    
-    :param y: the second input Tensor.
-    :type y: Tensor
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_add(self.handle, x.handle, y.handle, inplace_a, c_name)
-    self.add_layer(OpType.ADD, name)
-    return Tensor(handle, owner_op_type=OpType.ADD)
-
-  def subtract(self, x, y, inplace_a=False, name=None):
-    """Layer that subtracts two input Tensors, :attr:`output = x * y`.
-             
-    :param x: the first input Tensor.
-    :type x: Tensor
-    
-    :param y: the second input Tensor.
-    :type y: Tensor
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_subtract(self.handle, x.handle, y.handle, inplace_a, c_name)
-    self.add_layer(OpType.SUBTRACT, name)
-    return Tensor(handle, owner_op_type=OpType.SUBTRACT)
-
-  def multiply(self, x, y, inplace_a=False, name=None):
-    """Layer that multiplies (element-wise) two input Tensors, :attr:`output = x * y`.
-             
-    :param x: the first input Tensor.
-    :type x: Tensor
-    
-    :param y: the second input Tensor.
-    :type y: Tensor
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_multiply(self.handle, x.handle, y.handle, inplace_a, c_name)
-    self.add_layer(OpType.MULTIPLY, name)
-    return Tensor(handle, owner_op_type=OpType.MULTIPLY)
-
-  def divide(self, x, y, inplace_a=False, name=None):
-    """Layer that divides (element-wise) two input Tensors, :attr:`output = x / y`.
-             
-    :param x: the first input Tensor.
-    :type x: Tensor
-    
-    :param y: the second input Tensor.
-    :type y: Tensor
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_divide(self.handle, x.handle, y.handle, inplace_a, c_name)
-    self.add_layer(OpType.DIVIDE, name)
-    return Tensor(handle, owner_op_type=OpType.DIVIDE)
-
-  def max(self, x, y, inplace_a=False, name=None):
-    """Layer that computes the max (element-wise) two input Tensors, :attr:`output = max(x,y)`.
-             
-    :param x: the first input Tensor.
-    :type x: Tensor
-    
-    :param y: the second input Tensor.
-    :type y: Tensor
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_max(self.handle, x.handle, y.handle, inplace_a, c_name)
-    self.add_layer(OpType.MAX, name)
-    return Tensor(handle, owner_op_type=OpType.MAX)
-
-  def min(self, x, y, inplace_a=False, name=None):
-    """Layer that computes the min (element-wise) two input Tensors, :attr:`output = min(x,y)`.
-             
-    :param x: the first input Tensor.
-    :type x: Tensor
-    
-    :param y: the second input Tensor.
-    :type y: Tensor
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_min(self.handle, x.handle, y.handle, inplace_a, c_name)
-    self.add_layer(OpType.MIN, name)
-    return Tensor(handle, owner_op_type=OpType.MIN)
-
-  def reduce_sum(self, input, axes, keepdims=False, name=None):
-    """Layer that computes the sum of the input Tensor along given axes.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-    
-    :param axes: the axes along which reduction is applied
-    :type axes: List[int]
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    c_axes = ffi.new("int[]", axes)
-    handle = ffc().flexflow_model_add_reduce_sum(self.handle, input.handle, c_axes, len(axes), keepdims, c_name)
-    self.add_layer(OpType.REDUCE_SUM, name)
-    return Tensor(handle, owner_op_type=OpType.REDUCE_SUM)
-
-  def rsqrt(self, input, name=None):
-    """Layer that computes the element-wise reciprocal square-root.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_rsqrt(self.handle, input.handle, c_name)
-    self.add_layer(OpType.RSQRT, name)
-    return Tensor(handle, owner_op_type=OpType.RSQRT)
-
-  def pow(self, input, exponent, name=None):
-    """Layer that computes the element-wise power.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-
-    :param exponent: exponent to raise each element in the input tensor.
-    :type exponent: float
-
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_pow(self.handle, input.handle, exponent, c_name)
-    self.add_layer(OpType.POW, name)
-    return Tensor(handle, owner_op_type=OpType.POW)
-
-  def mean(self, input, dims, keepdims=False, name=None):
-    """Layer that computes the mean of the input tensor across the given
-    dimensions.
-
-    :param input: the input Tensor.
-    :type input: Tensor
-
-    :param dims: dimensions to take the mean over.
-    :type dims: list
-
-    :param keepdims: keeps the dimensions in :attr:`dims` as size 1 if True and
-                     collapses the dimension if False. Default is False.
-    :type keepdims: bool
-
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    dims = list(dims)
-    c_dims = ffi.new("int[]", dims)
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_mean(self.handle, input.handle, c_dims, len(dims), keepdims, c_name)
-    self.add_layer(OpType.MEAN, name)
-    return Tensor(handle, owner_op_type=OpType.MEAN)
-
-  def conv2d(self, input, out_channels, 
-             kernel_h, kernel_w, 
-             stride_h, stride_w, 
-             padding_h, padding_w, 
-             activation=ActiMode.AC_MODE_NONE, 
-             groups=1, use_bias=True, shared_op=None, 
-             kernel_initializer=None, bias_initializer=None, name=None):
-    """This layer creates a 2D convolution kernel that is convolved with the layer :attr:`input` 
-    to produce a tensor of :attr:`output`.
-    
-    The size of input tensor is :math:`(N, C_{in}, H, W)` and the size of output tensor 
-    is :math:`(N, C_{out}, H_{out}, W_{out})`, which can be calculated by:
-    
-    .. math::
-      C_{out} = out\_channels
-    
-    .. math::
-      K_{H} = kernel\_h
-             
-    .. math::
-      K_{W} = kernel\_w
-             
-    .. math::
-      S_{H} = stride\_h
-             
-    .. math::
-      S_{W} = stride\_w
-             
-    .. math::
-      P_{H} = padding\_h
-             
-    .. math::
-      P_{S} = padding\_s
-                      
-    .. math::
-      H_{out} = (H - K_{H} + 2 * P_{H}) / S_{H} + 1 
-             
-    .. math::
-      W_{out} = (W - K_{W} + 2 * P_{W}) / S_{W} + 1      
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-             
-    :param out\_channels: the dimensionality of the output space (i.e. the number of output filters in the convolution).
-    :type out\_channels: int
-
-    :param kernel_h: the height of the 2D convolution window: :math:`K_{H}`.
-    :type kernel_h: int
-
-    :param kernel_w: the width of the 2D convolution window: :math:`K_{W}`.
-    :type kernel_w: int
-
-    :param stride_h: the stride of the convolution along the height: :math:`S_{H}`.
-    :type stride_h: int
-
-    :param stride_w: the stride of the convolution along the width: :math:`S_{W}`.
-    :type stride_w: int
-
-    :param padding_h: the amount of implicit zero-paddings along the height: :math:`P_{H}`.
-    :type padding_h: int
-
-    :param padding_w: the amount of implicit zero-paddings along the width: :math:`P_{W}`.
-    :type padding_w: int   
-
-    :param activation: Activation function to use. Default is ActiMode.AC_MODE_NONE.
-    :type activation: ActiMode   
- 
-    :param groups: the number of groups in this convolution
-    :type groups: int   
-            
-    :param use_bias: whether the layer uses a bias vector. Default is True.
-    :type use_bias: bool  
-
-    :param shared_op: the layer whose parameters are shared with. Default is None.
-    :type shared_op: Op  
-             
-    :param kernel_initializer: Initializer for the kernel weights matrix. If it is set to None, the GlorotUniformInitializer is applied.
-    :type kernel_initializer: Initializer
-
-    :param bias_initializer: Initializer for the bias vector. If it is set to None, the ZeroInitializer is applied.
-    :type bias_initializer: Initializer
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    shared_op_handle = self.__get_op_handle(shared_op)
-    c_activation = enum_to_int(ActiMode, activation)
-    kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-    bias_init_handle = self.__get_initializer_handle(bias_initializer)
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_conv2d(self.handle, input.handle, out_channels, kernel_h, kernel_w, stride_h, stride_w, padding_h, padding_w, c_activation, groups, use_bias, shared_op_handle, kernel_init_handle, bias_init_handle, c_name)
-    self.add_layer(OpType.CONV2D, name)
-    return Tensor(handle, owner_op_type=OpType.CONV2D)
-
-  def embedding(self, input, num_embeddings, embedding_dim, 
-                aggr, dtype=DataType.DT_FLOAT, shared_op=None, kernel_initializer=None, name=None):
-    """Layer that turns positive integers into dense vectors of fixed size
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-    
-    :param num_embeddings: size of the vocabulary, i.e. maximum integer index + 1
-    :type num_embeddings: int
-                
-    :param embedding_dim: dimension of the dense embedding.
-    :type embedding_dim: int
-                
-    :param aggr: aggregation mode. Options are AGGR_MODE_NONE, AGGR_MODE_SUM and AGGR_MODE_AVG.
-    :type aggr: AggrMode
-
-    :param dtype: the tensor data type. Options are DT_BOOLEAN, DT_INT32, DT_INT64, DT_HALF, DT_FLOAT, DT_DOUBLE, DT_INT4, DT_INT8, DT_NONE
-    :type dtype: DataType
-                
-    :param shared_op: the layer whose parameters are shared with. Default is None.
-    :type shared_op: Op  
-             
-    :param kernel_initializer: Initializer for the kernel weights matrix. If it is set to None, the GlorotUniformInitializer is applied.
-    :type kernel_initializer: Initializer
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    shared_op_handle = self.__get_op_handle(shared_op)
-    c_aggr = enum_to_int(AggrMode, aggr)
-    c_dtype = enum_to_int(DataType, dtype)
-    if kernel_initializer is None:
-      kernel_initializer = GlorotUniformInitializer(42)
-    assert (type(kernel_initializer) is GlorotUniformInitializer) or \
-      (type(kernel_initializer) is ZeroInitializer) or \
-      (type(kernel_initializer) is UniformInitializer) or \
-      (type(kernel_initializer) is NormInitializer), \
-      f"Unknown initializer type: {kernel_initializer}"
-    handle = ffc().flexflow_model_add_embedding(
-      self.handle, input.handle, num_embeddings, embedding_dim, c_aggr, c_dtype,
-      shared_op_handle, kernel_initializer.handle, c_name,
-    )
-    # NOTE: We must keep a reference to the initializer or else it will be
-    # immediately destructed
-    self.initializers[name] = kernel_initializer
-    self.add_layer(OpType.EMBEDDING, name)
-    return Tensor(handle, owner_op_type=OpType.EMBEDDING)
-
-  def pool2d(self, input, kernel_h, kernel_w, 
-             stride_h, stride_w, 
-             padding_h, padding_w, 
-             pool_type=PoolType.POOL_MAX, 
-             activation=ActiMode.AC_MODE_NONE, name=None):
-    """Pooling operation for 2D spatial data.
-    
-    The size of input tensor is :math:`(N, C_{in}, H, W)` and the size of output tensor 
-    is :math:`(N, C_{out}, H_{out}, W_{out})`, which can be calculated by:
-    
-    .. math::
-      C_{out} = out\_channels
-    
-    .. math::
-      K_{H} = kernel\_h
-             
-    .. math::
-      K_{W} = kernel\_w
-             
-    .. math::
-      S_{H} = stride\_h
-             
-    .. math::
-      S_{W} = stride\_w
-             
-    .. math::
-      P_{H} = padding\_h
-             
-    .. math::
-      P_{S} = padding\_s
-                      
-    .. math::
-      H_{out} = (H - K_{H} + 2 * P_{H}) / S_{H} + 1 
-             
-    .. math::
-      W_{out} = (W - K_{W} + 2 * P_{W}) / S_{W} + 1      
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-
-    :param kernel_h: the height of the 2D pooling window: :math:`K_{H}`.
-    :type kernel_h: int
-
-    :param kernel_w: the width of the 2D pooling window: :math:`K_{W}`.
-    :type kernel_w: int
-
-    :param stride_h: the stride of the pooling along the height: :math:`S_{H}`.
-    :type stride_h: int
-
-    :param stride_w: the stride of the pooling along the width: :math:`S_{W}`.
-    :type stride_w: int
-
-    :param padding_h: the amount of implicit zero-paddings along the height: :math:`P_{H}`.
-    :type padding_h: int
-
-    :param padding_w: the amount of implicit zero-paddings along the width: :math:`P_{W}`.
-    :type padding_w: int
-
-    :param activation: Tyoe of pooling function to use. If you don't specify anything, PoolType.POOL_MAX is applied.
-    :type activation: PoolType
-
-    :param activation: Activation function to use. Default is ActiMode.AC_MODE_NONE.
-    :type activation: ActiMode
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    c_pool_type = enum_to_int(PoolType, pool_type)
-    c_activation = enum_to_int(ActiMode, activation)
-    handle = ffc().flexflow_model_add_pool2d(self.handle, input.handle, kernel_h, kernel_w, stride_h, stride_w, padding_h, padding_w, c_pool_type, c_activation, c_name)
-    self.add_layer(OpType.POOL2D, name)
-    return Tensor(handle, owner_op_type=OpType.POOL2D)
-
-  def batch_norm(self, input, relu=True, name=None):
-    """Layer that normalizes its inputs.
-
-    Batch normalization applies a transformation that maintains the mean output close to 0 and the output standard deviation close to 1.
-             
-    :param input: the list of input Tensors.
-    :type input: Tensor
-    
-    :param relu: whether a ReLU function is applied. Default is True.
-    :type relu: bool
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_batch_norm(self.handle, input.handle, relu, c_name)
-    self.add_layer(OpType.BATCH_NORM, name)
-    return Tensor(handle, owner_op_type=OpType.BATCH_NORM)
-    
-  def layer_norm(self, input, axes, elementwise_affine=True, eps=1e-5, use_bias = True, name=None):
-    c_name = get_c_name(name)
-    c_axes = ffi.new("int[]", axes)
-    handle = ffc().flexflow_model_add_layer_norm(self.handle, input.handle, len(axes), c_axes, elementwise_affine, eps, use_bias, c_name)
-    self.add_layer(OpType.LAYER_NORM, name)
-    return Tensor(handle, owner_op_type=OpType.LAYER_NORM)
-  
-  def add_bias_residual_layer_norm(self, input, residual, axes, elementwise_affine=True, eps=1e-5, use_bias = True, name=None):
-    c_name = get_c_name(name)
-    c_axes = ffi.new("int[]", axes)
-    handles_array = ffc().flexflow_model_add_add_bias_residual_layer_norm(self.handle, input.handle, residual.handle, len(axes), c_axes, elementwise_affine, eps, use_bias, c_name)
-    self.add_layer(OpType.ADD_BIAS_RESIDUAL_LAYERNORM, name)
-    return Tensor(handles_array[0], owner_op_type=OpType.ADD_BIAS_RESIDUAL_LAYERNORM), Tensor(handles_array[1], owner_op_type=OpType.ADD_BIAS_RESIDUAL_LAYERNORM)
-  
-  def sigmoid_silu_multi(self, input1, input2, name=None):
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_sigmoid_silu_multi(self.handle, input1.handle, input2.handle, c_name)
-    self.add_layer(OpType.SIGMOID_SILU_MULTI, name)
-    return Tensor(handle, owner_op_type=OpType.SIGMOID_SILU_MULTI)
-
-  def batch_matmul(self, A, B, a_seq_length_dim=None, b_seq_length_dim=None, name=None):
-    """Layer that applied batched matrix multiplication onto two input Tensors, :attr:`output = x * y`.
-             
-    :param A: the first input Tensor.
-    :type A: Tensor
-    
-    :param B: the second input Tensor.
-    :type B: Tensor
-
-    :param a_seq_length_dim: an int when set indicating the a_seq_length_dim dimention of A is a sequence_length dimension
-    :type a_seq_length_dim: int
-
-    :param b_seq_length_dim: an int when set indicating the b_seq_length_dim dimention of B is a sequence_length dimension
-    :type b_seq_length_dim: int
-            
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :param name:  Whether to add use bias in layer normalization
-    :type name: bool
-
-    :returns:  Tensor -- the output tensor.
-    """
-    if a_seq_length_dim is None:
-      a_seq_length_dim = -1
-    if b_seq_length_dim is None:
-      b_seq_length_dim = -1
-    handle = ffc().flexflow_model_add_batch_matmul(self.handle, A.handle, B.handle, a_seq_length_dim, b_seq_length_dim)
-    self.add_layer(OpType.BATCH_MATMUL, name)
-    return Tensor(handle, owner_op_type=OpType.BATCH_MATMUL)
-
-  def dense(self, input, out_dim, 
-            activation=ActiMode.AC_MODE_NONE, 
-            use_bias=True, 
-            datatype=DataType.DT_NONE, 
-            shared_op=None,
-            kernel_initializer=None, bias_initializer=None, 
-            kernel_regularizer=None, name=None):
-    """Dense implements the operation: :attr:`output = activation(dot(input, kernel) + bias)` where 
-    :attr:`activation` is the element-wise activation function passed as the activation argument, 
-    :attr:`kernel` is a weights matrix created by the layer, and 
-    :attr:`bias` is a bias vector created by the layer (only applicable if :attr:`use_bias` is True).
-    
-    The size of input tensor is :math:`(N, C_{in})` and the size of output tensor 
-    is :math:`(N, C_{out})`, where :math:`C_{out} = out\_dim`   
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-            
-    :param out\_dim: dimensionality of the output space.
-    :type out\_dim: int
-
-    :param activation: Activation function to use. Default is ActiMode.AC_MODE_NONE.
-    :type activation: ActiMode   
-             
-    :param use_bias: whether the layer uses a bias vector. Default is True.
-    :type use_bias: bool  
-
-    :param shared_op: the layer whose parameters are shared with. Default is None.
-    :type shared_op: Op  
-             
-    :param kernel_initializer: Initializer for the kernel weights matrix. If it is set to None, the GlorotUniformInitializer is applied.
-    :type kernel_initializer: Initializer
-
-    :param bias_initializer: Initializer for the bias vector. If it is set to None, the ZeroInitializer is applied.
-    :type bias_initializer: Initializer
-
-    :param kernel_regularizer: Regularizer for the kernel weights matrix
-    :type bias_initializer: Regularizer
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    shared_op_handle = self.__get_op_handle(shared_op)
-    c_activation = enum_to_int(ActiMode, activation)
-    c_datatype = enum_to_int(DataType, datatype)
-    kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-    bias_init_handle = self.__get_initializer_handle(bias_initializer)
-    if kernel_regularizer:
-      c_kernel_reg_type = enum_to_int(RegularizerMode, kernel_regularizer.type)
-      kernel_reg_lambda = kernel_regularizer._lambda
-    else:
-      c_kernel_reg_type = enum_to_int(
-        RegularizerMode, RegularizerMode.REG_MODE_NONE)
-      kernel_reg_lambda = 0.0
-    handle = ffc().flexflow_model_add_dense(
-      self.handle, input.handle, out_dim, c_activation, use_bias, c_datatype,
-      shared_op_handle, kernel_init_handle, bias_init_handle,
-      c_kernel_reg_type, kernel_reg_lambda, c_name)
-    self.add_layer(OpType.LINEAR, name)
-    return Tensor(handle, owner_op_type=OpType.LINEAR)
-
-  def concat(self, tensors, axis, name=None):
-    """Layer that concatenates a list of inputs.
-
-    It takes as input a list of tensors, all of the same shape except for the concatenation axis, and returns a single tensor that is the concatenation of all inputs.
-             
-    :param input: the list of input Tensors.
-    :type input: List of Tensors
-    
-    :param axis: the dimension along which to concatenate.
-    :type axis: int
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    assert type(tensors) is list, "tensors should be a list"
-    tensor_handle_list = []
-    n = len(tensors)
-    assert n <= 256, "Please increase MAX_NUM_INPUTS"
-    for tensor in tensors:
-      tensor_handle_list.append(tensor.handle)
-    c_tensor_handle_list = ffi.new("flexflow_tensor_t[]", tensor_handle_list)
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_concat(self.handle, n, c_tensor_handle_list, axis, c_name)
-    self.add_layer(OpType.CONCAT, name)
-    return Tensor(handle, owner_op_type=OpType.CONCAT)
-
-  def split(self, input, sizes, axis, name=None):
-    """Layer that splits a :attr:`input` tensor into a list of tensors.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-    
-    :param sizes: either an int indicating the number of splits along axis or a Python list containing the sizes of each output tensor along axis. If a scalar, then it must evenly divide :attr:`input.dims[axis]`; otherwise the sum of sizes along the split axis must match that of the :attr:`input`. 
-    :type sizes: int or list of int
-    
-    :param axis: the dimension along which to split.
-    :type axis: int
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  list of Tensors -- the output tensors.
-    """
-    if type(sizes) is list:
-      split = sizes
-    else:
-      assert input.dims[axis] % sizes == 0, "Split dimension is not divisible"
-      split = [input.dims[axis] // sizes for i in range(sizes)]
-    n = len(split)
-    assert n <= 256, "Please increase MAX_NUM_OUTPUTS"
-    c_split = ffi.new("int[]", split)
-    c_outputs_handle_list = ffi.new("flexflow_tensor_t[256]")
-    c_name = get_c_name(name)
-    ffc().flexflow_model_add_split(self.handle, input.handle, n, c_outputs_handle_list, c_split, axis, c_name)
-    output_tensor_list = []
-    for i in range(n):
-      tensor_p_handle = ffi.new("flexflow_tensor_t*")
-      tensor_p_handle.impl = c_outputs_handle_list[i].impl
-      output_tensor_list.append(Tensor(None, owner_op_type=OpType.SPLIT, p_handle=tensor_p_handle))
-    self.add_layer(OpType.SPLIT, name)
-    del c_outputs_handle_list
-    return output_tensor_list
-
-  def flat(self, input, name=None):
-    """Flattens the input. Does not affect the batch size.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_flat(self.handle, input.handle, c_name)
-    self.add_layer(OpType.FLAT, name)
-    return Tensor(handle, owner_op_type=OpType.FLAT)
-
-  def softmax(self, input, axis=-1, name=None):
-    """Softmax activation function.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_softmax(self.handle, input.handle, axis, c_name)
-    self.add_layer(OpType.SOFTMAX, name)
-    return Tensor(handle, owner_op_type=OpType.SOFTMAX)
-
-  def reshape(self, input, shape, name=None):
-    """Layer that reshapes inputs into the given shape.
-    
-    Given a :attr:`input` tensor, this operation returns a output tensor that has the same values as tensor in the same order, 
-    except with a new shape given by :attr:`shape`.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-    
-    :param shape: A list defining the shape of the output tensor.
-    :type shape: list of int
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    c_shape = ffi.new("int[]", shape)
-    handle = ffc().flexflow_model_add_reshape(self.handle, input.handle, len(shape), c_shape, c_name)
-    self.add_layer(OpType.RESHAPE, name)
-    return Tensor(handle, owner_op_type=OpType.RESHAPE)
-
-  def gather(self, input, index, dim, name=None):
-    """Layer that gathers values along the dim axis.
-    
-    :param input: the input tensor
-    :type input: Tensor
-
-    :param index: the index tensor, which specifies the indices of elements to gather
-    :type index: Tensor
-
-    :param dim: the axis along which to index
-    :type dim: int
-
-    :param name: the name of the layer. Default is None
-    :type name: string
-
-    :returns: Tensor -- the output tensor
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_gather(self.handle, input.handle, index.handle, dim, c_name)
-    self.add_layer(OpType.GATHER, name)
-    return Tensor(handle, owner_op_type=OpType.GATHER)
-
-  def transpose(self, input, perm, name=None):
-    """Transposes the :attr:`input` tensor. Permutes the dimensions according to perm
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-    
-    :param perm: A permutation of the dimensions of a.
-    :type perm: List of int
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    c_perm = ffi.new("int[]", perm)
-    handle = ffc().flexflow_model_add_transpose(self.handle, input.handle, len(perm), c_perm, c_name)
-    self.add_layer(OpType.TRANSPOSE, name)
-    return Tensor(handle, owner_op_type=OpType.TRANSPOSE)
-
-  def reverse(self, input, axis, name=None):
-    """Layer that reverses specific dimensions of a tensor.
-    
-    Given a :attr:`input` tensor, this operation reverses the dimension :attr:`axis`.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-    
-    :param axis: the dimension to reverse.
-    :type axis: int
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_reverse(self.handle, input.handle, axis, c_name)
-    self.add_layer(OpType.REVERSE, name)
-    return Tensor(handle, owner_op_type=OpType.REVERSE)
-
-  def scalar_multiply(self, input, scalar, inplace=True, name=None):
-    """Scalar multiplication of a tensor by an scalar.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-
-    :param input: the scalar
-    :type scalar: float
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_scalar_multiply(self.handle, input.handle, scalar, inplace, c_name)
-    self.add_layer(OpType.SCALAR_MULTIPLY, name)
-    return Tensor(handle, owner_op_type=OpType.SCALAR_MULTIPLY)
-
-  def scalar_add(self, input, scalar, inplace=True, name=None):
-    """Scalar addition of a scalar to each entry of a tensor.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-
-    :param input: the scalar
-    :type scalar: float
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_scalar_add(self.handle, input.handle, scalar, inplace, c_name)
-    self.add_layer(OpType.SCALAR_ADD, name)
-    return Tensor(handle, owner_op_type=OpType.SCALAR_ADD)
-
-  def scalar_sub(self, input, scalar, inplace=True, name=None):
-    """Scalar subtraction of a scalar to each entry of a tensor.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-
-    :param input: the scalar
-    :type scalar: float
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_scalar_sub(self.handle, input.handle, scalar, inplace, c_name)
-    self.add_layer(OpType.SCALAR_SUB, name)
-    return Tensor(handle, owner_op_type=OpType.SCALAR_SUB)
-
-  def scalar_true_divide(self, input, scalar, inplace=True, name=None):
-    """Scalar regular division of a tensor by an scalar.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-
-    :param input: the scalar
-    :type scalar: float
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_scalar_truediv(self.handle, input.handle, scalar, inplace, c_name)
-    self.add_layer(OpType.SCALAR_TRUEDIV, name)
-    return Tensor(handle, owner_op_type=OpType.SCALAR_TRUEDIV)
-
-  def gelu(self, input, inplace=True, name=None):
-    """Gaussian Error Linear Unit activation function.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_gelu(self.handle, input.handle, c_name)
-    self.add_layer(OpType.GELU, name)
-    return Tensor(handle, owner_op_type=OpType.GELU)
-  
-  def relu(self, input, inplace=True, name=None):
-    """Rectified Linear Unit activation function.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_relu(self.handle, input.handle, inplace, c_name)
-    self.add_layer(OpType.RELU, name)
-    return Tensor(handle, owner_op_type=OpType.RELU)
-
-  def identity(self, input, name=None):
-    """Identity function.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_identity(self.handle, input.handle, c_name)
-    self.add_layer(OpType.IDENTITY, name)
-    return Tensor(handle, owner_op_type=OpType.IDENTITY)
-  
-  def sigmoid(self, input, name=None):
-    """Sigmoid activation function, :math:`sigmoid(x) = 1 / (1 + exp(-x))`.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_sigmoid(self.handle, input.handle, c_name)
-    self.add_layer(OpType.SIGMOID, name)
-    return Tensor(handle, owner_op_type=OpType.SIGMOID)
-
-  def tanh(self, input, name=None):
-    """Hyperbolic tangent activation function.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_tanh(self.handle, input.handle, c_name)
-    self.add_layer(OpType.TANH, name)
-    return Tensor(handle, owner_op_type=OpType.TANH)
-
-  def elu(self, input, inplace=True, name=None):
-    """Exponential Linear Unit. activation function.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_elu(self.handle, input.handle, inplace, c_name)
-    self.add_layer(OpType.ELU, name)
-    return Tensor(handle, owner_op_type=OpType.ELU)
-
-  def dropout(self, input, rate, seed, name=None):
-    """The Dropout layer randomly sets input units to 0 with 
-    a frequency of :attr:`rate` at each step during training time, 
-    which helps prevent overfitting. 
-    Inputs not set to 0 are scaled up by 1/(1 - rate) such that the 
-    sum over all inputs is unchanged.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-    
-    :param rate: Fraction of the input units to drop.
-    :type rate: float(0-1)
-    
-    :param seed: random seed.
-    :type seed: int
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_dropout(self.handle, input.handle, rate, seed, c_name)
-    self.add_layer(OpType.DROPOUT, name)
-    return Tensor(handle, owner_op_type=OpType.DROPOUT)
-    
-  def multihead_attention(self, query, key, value, 
-                          embed_dim, num_heads, 
-                          kdim=0, vdim=0, dropout=0.0, 
-                          bias=True, add_bias_kv=False, add_zero_attn=False, 
-                          kernel_initializer=None, name=None):
-    """Defines the MultiHead Attention operation as described in Attention Is All You Need 
-    which takes in the tensors :attr:`query`, :attr:`key`, and :attr:`value`, 
-    and returns the dot-product attention between them:.
-             
-    :param query: the query Tensor.
-    :type query: Tensor
-    
-    :param key: the key Tensor.
-    :type key: Tensor
-                          
-    :param value: the value Tensor.
-    :type value: Tensor
-
-    :param embed_dim: total dimension of the model
-    :type embed_dim: int
-                          
-    :param num_heads: Number of attention heads.
-    :type num_heads: int
-                          
-    :param kdim: total number of features in key. Default is 0
-    :type kdim: int
-                          
-    :param vdim: total number of features in value. Default is 0
-    :type vdim: int
-                          
-    :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
-    :type dropout: float(0-1)
-                          
-    :param bias: Whether the dense layers use bias vectors. Default is True.
-    :type bias: bool
-                          
-    :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
-    :type add_bias_kv: bool
-                          
-    :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
-    :type add_zero_attn: bool
-    
-    :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
-    :type kernel_initializer: Initializer
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """     
-    c_name = get_c_name(name)                 
-    kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-    handle = ffc().flexflow_model_add_multihead_attention(self.handle, query.handle, key.handle, value.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, kernel_init_handle, c_name)
-    self.add_layer(OpType.MULTIHEAD_ATTENTION, name)
-    return Tensor(handle, owner_op_type=OpType.MULTIHEAD_ATTENTION)
-  
-  def inc_multihead_self_attention(self, input, 
-                              embed_dim, num_heads,
-                              kdim=0, vdim=0, dropout=0.0, 
-                              bias=True, add_bias_kv=False, add_zero_attn=False, 
-                              data_type=DataType.DT_NONE, kernel_initializer=None, 
-                              apply_rotary_embedding=False, scaling_query=False, scaling_factor=1.0,
-                              qk_prod_scaling=True, position_bias=False, name=None):
-    """Defines the MultiHead Attention operation as described in Attention Is All You Need 
-    which takes in the tensors :attr:`input`, and uses it for all three of query, key and values. 
-    In inference mode, the attention is computed using incremental decoding.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-
-    :param embed_dim: total dimension of the model
-    :type embed_dim: int
-                          
-    :param num_heads: Number of attention heads.
-    :type num_heads: int
-                          
-    :param kdim: total number of features in key. Default is 0
-    :type kdim: int
-                          
-    :param vdim: total number of features in value. Default is 0
-    :type vdim: int
-                          
-    :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
-    :type dropout: float(0-1)
-                          
-    :param bias: Whether the dense layers use bias vectors. Default is True.
-    :type bias: bool
-                          
-    :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
-    :type add_bias_kv: bool
-                          
-    :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
-    :type add_zero_attn: bool
-
-    :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
-    :type data_type: DataType
-    
-    :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
-    :type kernel_initializer: Initializer
-
-    :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
-    :type apply_rotary_embedding: bool
-
-    :param scaling_query: Whether to apply scaling query. Default is False.
-    :type scaling_query: bool
-
-    :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
-    :type scaling_factor: float
-
-    :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
-    :type qk_prod_scaling: bool
-
-    :param position_bias: Whether to add position bias to the QK product. Default is False.
-    :type position_bias: bool
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """     
-    c_name = get_c_name(name)                 
-    kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-    c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc().flexflow_model_add_inc_multihead_self_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, position_bias, c_name)
-    self.add_layer(OpType.INC_MULTIHEAD_ATTENTION, name)
-    return Tensor(handle, owner_op_type=OpType.INC_MULTIHEAD_ATTENTION)
-  
-  def spec_inc_multihead_self_attention(self, input, 
-                                   embed_dim, num_heads,
-                                   kdim=0, vdim=0, dropout=0.0, 
-                                   bias=True, add_bias_kv=False, add_zero_attn=False, 
-                                   data_type=DataType.DT_NONE, kernel_initializer=None, 
-                                   apply_rotary_embedding=False, scaling_query=False, scaling_factor=1.0,
-                                   qk_prod_scaling=True, position_bias=False, name=None):
-    """Defines the MultiHead Attention operation as described in Attention Is All You Need 
-    which takes in the tensors :attr:`input`, and uses it for all three of query, key and values. 
-    This operator only supports computing the attention in inference (beam search) mode.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-
-    :param embed_dim: total dimension of the model
-    :type embed_dim: int
-                          
-    :param num_heads: Number of attention heads.
-    :type num_heads: int
-                          
-    :param kdim: total number of features in key. Default is 0
-    :type kdim: int
-                          
-    :param vdim: total number of features in value. Default is 0
-    :type vdim: int
-                          
-    :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
-    :type dropout: float(0-1)
-                          
-    :param bias: Whether the dense layers use bias vectors. Default is True.
-    :type bias: bool
-                          
-    :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
-    :type add_bias_kv: bool
-                          
-    :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
-    :type add_zero_attn: bool
-
-    :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
-    :type data_type: DataType
-    
-    :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
-    :type kernel_initializer: Initializer
-
-    :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
-    :type apply_rotary_embedding: bool
-
-    :param scaling_query: Whether to apply scaling query. Default is False.
-    :type scaling_query: bool
-
-    :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
-    :type scaling_factor: float
-
-    :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
-    :type qk_prod_scaling: bool
-
-    :param position_bias: Whether to add position bias to the QK product. Default is False.
-    :type position_bias: bool
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """     
-    c_name = get_c_name(name)                 
-    kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-    c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc().flexflow_model_add_spec_inc_multihead_self_attention(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, position_bias, c_name)
-    self.add_layer(OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION, name)
-    return Tensor(handle, owner_op_type=OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION)
-  
-  def inc_multihead_self_attention_verify(self, input, 
-                                          embed_dim, num_heads,
-                                          kdim=0, vdim=0, dropout=0.0, 
-                                          bias=True, add_bias_kv=False, add_zero_attn=False, 
-                                          data_type=DataType.DT_NONE, kernel_initializer=None, 
-                                          apply_rotary_embedding=False, scaling_query=False, scaling_factor=1.0,
-                                          qk_prod_scaling=True, position_bias=False, name=None):
-    """Defines the MultiHead Attention operation as described in Attention Is All You Need 
-    which takes in the tensors :attr:`input`, and uses it for all three of query, key and values. 
-    This operator only supports computing the attention in inference (tree verify) mode.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-
-    :param embed_dim: total dimension of the model
-    :type embed_dim: int
-                          
-    :param num_heads: Number of attention heads.
-    :type num_heads: int
-                          
-    :param kdim: total number of features in key. Default is 0
-    :type kdim: int
-                          
-    :param vdim: total number of features in value. Default is 0
-    :type vdim: int
-                          
-    :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
-    :type dropout: float(0-1)
-                          
-    :param bias: Whether the dense layers use bias vectors. Default is True.
-    :type bias: bool
-                          
-    :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
-    :type add_bias_kv: bool
-                          
-    :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
-    :type add_zero_attn: bool
-
-    :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
-    :type data_type: DataType
-    
-    :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
-    :type kernel_initializer: Initializer
-
-    :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
-    :type apply_rotary_embedding: bool
-
-    :param scaling_query: Whether to apply scaling query. Default is False.
-    :type scaling_query: bool
-
-    :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
-    :type scaling_factor: float
-
-    :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
-    :type qk_prod_scaling: bool
-
-    :param position_bias: Whether to add position bias to the QK product. Default is False.
-    :type position_bias: bool
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """     
-    c_name = get_c_name(name)                 
-    kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-    c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc().flexflow_model_add_inc_multihead_self_attention_verify(self.handle, input.handle, embed_dim, num_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, position_bias, c_name)
-    self.add_layer(OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION, name)
-    return Tensor(handle, owner_op_type=OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION)
-  
-  def inc_multiquery_self_attention(self, input, 
-                              embed_dim, num_q_heads, num_kv_heads,
-                              kdim=0, vdim=0, dropout=0.0, 
-                              bias=True, add_bias_kv=False, add_zero_attn=False, 
-                              data_type=DataType.DT_NONE, kernel_initializer=None, 
-                              apply_rotary_embedding=False, scaling_query=False, scaling_factor=1.0,
-                              qk_prod_scaling=True, position_bias=False, name=None):
-    """Defines the multi-query head attention, which allows a different number of Q and KV heads,
-    and takes in the tensors :attr:`input`, and uses it for all three of query, key and values. 
-    In inference mode, the attention is computed using incremental decoding.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-
-    :param embed_dim: total dimension of the model
-    :type embed_dim: int
-                          
-    :param num_q_heads: Number of query attention heads.
-    :type num_q_heads: int
-
-    :param num_kv_heads: Number of key/value attention heads.
-    :type num_kv_heads: int
-                          
-    :param kdim: total number of features in key. Default is 0
-    :type kdim: int
-                          
-    :param vdim: total number of features in value. Default is 0
-    :type vdim: int
-                          
-    :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
-    :type dropout: float(0-1)
-                          
-    :param bias: Whether the dense layers use bias vectors. Default is True.
-    :type bias: bool
-                          
-    :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
-    :type add_bias_kv: bool
-                          
-    :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
-    :type add_zero_attn: bool
-
-    :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
-    :type data_type: DataType
-    
-    :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
-    :type kernel_initializer: Initializer
-
-    :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
-    :type apply_rotary_embedding: bool
-
-    :param scaling_query: Whether to apply scaling query. Default is False.
-    :type scaling_query: bool
-
-    :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
-    :type scaling_factor: float
-
-    :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
-    :type qk_prod_scaling: bool
-
-    :param position_bias: Whether to add position bias to the QK product. Default is False.
-    :type position_bias: bool
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """     
-    c_name = get_c_name(name)                 
-    kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-    c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc().flexflow_model_add_inc_multiquery_self_attention(self.handle, input.handle, embed_dim, num_q_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, position_bias, c_name)
-    self.add_layer(OpType.INC_MULTIHEAD_ATTENTION, name)
-    return Tensor(handle, owner_op_type=OpType.INC_MULTIHEAD_ATTENTION)
-  
-  def spec_inc_multiquery_self_attention(self, input, 
-                                   embed_dim, num_q_heads, num_kv_heads,
-                                   kdim=0, vdim=0, dropout=0.0, 
-                                   bias=True, add_bias_kv=False, add_zero_attn=False, 
-                                   data_type=DataType.DT_NONE, kernel_initializer=None, 
-                                   apply_rotary_embedding=False, scaling_query=False, scaling_factor=1.0,
-                                   qk_prod_scaling=True, position_bias=False, name=None):
-    """Defines the multi-query head attention, which allows a different number of Q and KV heads,
-    and takes in the tensors :attr:`input`, and uses it for all three of query, key and values. 
-    This operator only supports computing the attention in inference (beam search) mode.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-
-    :param embed_dim: total dimension of the model
-    :type embed_dim: int
-                          
-    :param num_q_heads: Number of query attention heads.
-    :type num_q_heads: int
-
-    :param num_kv_heads: Number of key/value attention heads.
-    :type num_kv_heads: int
-                          
-    :param kdim: total number of features in key. Default is 0
-    :type kdim: int
-                          
-    :param vdim: total number of features in value. Default is 0
-    :type vdim: int
-                          
-    :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
-    :type dropout: float(0-1)
-                          
-    :param bias: Whether the dense layers use bias vectors. Default is True.
-    :type bias: bool
-                          
-    :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
-    :type add_bias_kv: bool
-                          
-    :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
-    :type add_zero_attn: bool
-
-    :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
-    :type data_type: DataType
-    
-    :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
-    :type kernel_initializer: Initializer
-
-    :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
-    :type apply_rotary_embedding: bool
-
-    :param scaling_query: Whether to apply scaling query. Default is False.
-    :type scaling_query: bool
-
-    :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
-    :type scaling_factor: float
-
-    :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
-    :type qk_prod_scaling: bool
-
-    :param position_bias: Whether to add position bias to the QK product. Default is False.
-    :type position_bias: bool
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """     
-    c_name = get_c_name(name)                 
-    kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-    c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc().flexflow_model_add_spec_inc_multiquery_self_attention(self.handle, input.handle, embed_dim, num_q_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, position_bias, c_name)
-    self.add_layer(OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION, name)
-    return Tensor(handle, owner_op_type=OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION)
-  
-  def inc_multiquery_self_attention_verify(self, input, 
-                                          embed_dim, num_q_heads, num_kv_heads,
-                                          kdim=0, vdim=0, dropout=0.0, 
-                                          bias=True, add_bias_kv=False, add_zero_attn=False, 
-                                          data_type=DataType.DT_NONE, kernel_initializer=None, 
-                                          apply_rotary_embedding=False, scaling_query=False, scaling_factor=1.0,
-                                          qk_prod_scaling=True, position_bias=False, name=None):
-    """Defines the multi-query head attention, which allows a different number of Q and KV heads,
-    and takes in the tensors :attr:`input`, and uses it for all three of query, key and values. 
-    This operator only supports computing the attention in inference (tree verify) mode.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-
-    :param embed_dim: total dimension of the model
-    :type embed_dim: int
-                          
-    :param num_q_heads: Number of query attention heads.
-    :type num_q_heads: int
-
-    :param num_kv_heads: Number of key/value attention heads.
-    :type num_kv_heads: int
-                          
-    :param kdim: total number of features in key. Default is 0
-    :type kdim: int
-                          
-    :param vdim: total number of features in value. Default is 0
-    :type vdim: int
-                          
-    :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
-    :type dropout: float(0-1)
-                          
-    :param bias: Whether the dense layers use bias vectors. Default is True.
-    :type bias: bool
-                          
-    :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
-    :type add_bias_kv: bool
-                          
-    :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
-    :type add_zero_attn: bool
-
-    :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
-    :type data_type: DataType
-    
-    :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
-    :type kernel_initializer: Initializer
-
-    :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
-    :type apply_rotary_embedding: bool
-
-    :param scaling_query: Whether to apply scaling query. Default is False.
-    :type scaling_query: bool
-
-    :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
-    :type scaling_factor: float
-
-    :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
-    :type qk_prod_scaling: bool
-
-    :param position_bias: Whether to add position bias to the QK product. Default is False.
-    :type position_bias: bool
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """     
-    c_name = get_c_name(name)                 
-    kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-    c_data_type = enum_to_int(DataType, data_type)
-    handle = ffc().flexflow_model_add_inc_multiquery_self_attention_verify(self.handle, input.handle, embed_dim, num_q_heads, num_kv_heads, kdim, vdim, dropout, bias, add_bias_kv, add_zero_attn, c_data_type, kernel_init_handle, apply_rotary_embedding, scaling_query, scaling_factor, qk_prod_scaling, position_bias, c_name)
-    self.add_layer(OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION, name)
-    return Tensor(handle, owner_op_type=OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION)
-  
-  def rms_norm(self, input, eps, dim, name=None):
-    """Defines the RMS Norm layer.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-
-    :param eps: a value added to the denominator for numerical stability
-    :type eps: float
-                          
-    :param dim: The dimension with respect to which to take the norm
-    :type dim: int
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_rms_norm(self.handle, input.handle, eps, dim, c_name)
-    self.add_layer(OpType.RMS_NORM, name)
-    return Tensor(handle, owner_op_type=OpType.RMS_NORM)
-  
-  def residual_rms_norm(self, input1, input2, eps, dim, name=None):
-    """Defines the Residual RMS Norm layer.
-             
-    :param input: the input 1 Tensor.
-    :type input: Tensor
-
-    :param input: the input 2 Tensor.
-    :type input: Tensor
-
-    :param eps: a value added to the denominator for numerical stability
-    :type eps: float
-                          
-    :param dim: The dimension with respect to which to take the norm
-    :type dim: int
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handles_array = ffc().flexflow_model_add_residual_rms_norm(self.handle, input1.handle, input2.handle, eps, dim, c_name)
-    self.add_layer(OpType.RESIDUAL_RMS_NORM, name)
-    return Tensor(handles_array[0], owner_op_type=OpType.RESIDUAL_RMS_NORM), Tensor(handles_array[1], owner_op_type=OpType.RESIDUAL_RMS_NORM)
-  
-  def arg_top_k(self, input, k, sorted, name=None):
-    """Defines the Arg TopK layer.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-
-    :param k: the top k indices to select
-    :type k: int
-                          
-    :param sorted: Whether the entries should be sorted
-    :type sorted: bool
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_arg_top_k(self.handle, input.handle, k, sorted, c_name)
-    self.add_layer(OpType.ARG_TOPK, name)
-    return Tensor(handle, owner_op_type=OpType.ARG_TOPK)
-
-  def beam_top_k(self, input, max_beam_size, sorted, name=None):
-    """Defines the Beam TopK layer.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-
-    :param max_beam_size: the top max_beam_size indices to select
-    :type max_beam_size: int
-                          
-    :param sorted: Whether the entries should be sorted
-    :type sorted: bool
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_beam_top_k(self.handle, input.handle, max_beam_size, sorted, c_name)
-    self.add_layer(OpType.BEAM_TOPK, name)
-    return Tensor(handle, owner_op_type=OpType.BEAM_TOPK)
-  
-  def sampling(self, input, top_p, name=None):
-    """Defines the Sampling layer.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-
-    :param top_p: The top_p parameter of the sampling
-    :type top_p: float
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_sampling(self.handle, input.handle, top_p, c_name)
-    self.add_layer(OpType.SAMPLING, name)
-    return Tensor(handle, owner_op_type=OpType.SAMPLING)
-  
-  def argmax(self, input, beam_search, name=None):
-    """Defines the Sampling layer.
-             
-    :param input: the input Tensor.
-    :type input: Tensor
-
-    :param beam_search: Whether you need to perform beam search
-    :type beam_search: bool
-             
-    :param name: the name of the layer. Default is None.
-    :type name: string
-
-    :returns:  Tensor -- the output tensor.
-    """
-    c_name = get_c_name(name)
-    handle = ffc().flexflow_model_add_argmax(self.handle, input.handle, beam_search, c_name)
-    self.add_layer(OpType.ARGMAX, name)
-    return Tensor(handle, owner_op_type=OpType.ARGMAX)
-
-  def reset_metrics(self):
-    """Reset performance metrics.
-             
-    :returns:  None -- no returns.
-    """
-    ffc().flexflow_model_reset_metrics(self.handle)
-
-  def init_layers(self):
-    """Initialize layers.
-             
-    :returns:  None -- no returns.
-    """
-    ffc().flexflow_model_init_layers(self.handle)
-
-  def prefetch(self):
-    ffc().flexflow_model_prefetch(self.handle)
-
-  def forward(self, seq_length=None):
-    """Forward propagation of all layers.
-             
-    :returns:  None -- no returns.
-    """
-    if seq_length is None:
-      seq_length = -1
-    ffc().flexflow_model_forward(self.handle, seq_length)
-
-  #TODO: seperate compute_metrics from backward
-  def backward(self, seq_length=None):
-    """Backward propagation of all layers.
-             
-    :returns:  None -- no returns.
-    """
-    if seq_length is None:
-      seq_length = -1
-    ffc().flexflow_model_backward(self.handle, seq_length)
-
-  def compute_metrics(self):
-    """Compute performance metrics.
-             
-    :returns:  None -- no returns.
-    """
-    ffc().flexflow_model_compute_metrics(self.handle)
-
-  def update(self):
-    """Update weights and biases of all layers.
-             
-    :returns:  None -- no returns.
-    """
-    ffc().flexflow_model_update(self.handle)
-
-  def compile(self, optimizer=None, loss_type=None, metrics=None, comp_mode=None):
-    """Configure the model for trainting. FlexFlow uses lazy initialization,
-    so the actual creating of all operations (including creating and partitioning
-    of weight, bias and output tensors) happen during compile. 
-             
-    :param optimizer: optimizer instance.
-    :type optimizer: Optimizer
-    
-    :param loss_type: Enum of LossType. 
-      Options are LOSS_CATEGORICAL_CROSSENTROPY, LOSS_SPARSE_CATEGORICAL_CROSSENTROPY, 
-      LOSS_MEAN_SQUARED_ERROR_AVG_REDUCE and LOSS_MEAN_SQUARED_ERROR_SUM_REDUCE.
-    :type loss_type: LossType
-    
-    :param metrics: List of metrics to be evaluated by the model during training and testing. 
-      Each of this is a Enum of MetricsType. Options are METRICS_ACCURACY, 
-      METRICS_CATEGORICAL_CROSSENTROPY, METRICS_SPARSE_CATEGORICAL_CROSSENTROPY,
-      METRICS_MEAN_SQUARED_ERROR, METRICS_ROOT_MEAN_SQUARED_ERROR, METRICS_MEAN_ABSOLUTE_ERROR
-    :type metrics: MetricsType
-
-    :param comp_mode: Enum of CompMode.
-      Options are COMP_MODE_TRAINING, COMP_MODE_INFERENCE
-    :type comp_mode: CompMode
-
-    :returns:  None -- no returns.
-    """
-    self.optimizer = optimizer
-
-    c_loss_type = enum_to_int(LossType, loss_type)
-    metrics_int = []
-    for metric in metrics:
-      metrics_int.append(enum_to_int(MetricsType, metric))
-    c_metrics = ffi.new("int[]", metrics_int)
-    if comp_mode == None:
-      comp_mode = CompMode.TRAINING
-    c_comp_mode = enum_to_int(CompMode, comp_mode)
-    ffc().flexflow_model_compile(self.handle, c_loss_type, c_metrics, len(metrics), c_comp_mode)
-    for (ff_tensor, np_tensor) in self.attr_tensors.items():
-      ff_tensor.set_tensor(self, np_tensor)
-    print("Compiled ffmodel!")
-
-  def fit(self, x=None, y=None, batch_size=None, epochs=1):
-    """Trains the model for a fixed number of epochs (iterations on a dataset).
-             
-    :param x: Input data. It can be a Dataloader instance or a list of Dataloader instances.
-    :type x: Dataloader
-    
-    :param y: Target data (label). It can be a Dataloader instance or a list of Dataloader instances.
-    :type y: Dataloader
-    
-    :param batch_size: Number of samples per gradient update. It must be identical with :attr:`-b`
-      or :attr:`--batch-size` from the command line.
-    :type batch_size: int
-    
-    :param epochs: Number of epochs to train the model. 
-      An epoch is an iteration over the entire :attr:`x` and :attr:`y` data provided.
-      The default value is 1.
-    :type epochs: int
-             
-    :returns:  None -- no returns.
-    """
-    if (isinstance(x, list) == False):
-      dataloaders = [x]
-    else:
-      dataloaders = x
-    dataloaders.append(y)
-
-    num_samples = y.num_samples
-    batch_size = self._ffconfig.batch_size
-    self._tracing_id += 1 # get a new tracing id
-    for epoch in range(0,epochs):
-      for d in dataloaders:
-        d.reset()
-      self.reset_metrics()
-      iterations = num_samples / batch_size
-      for iter in range(0, int(iterations)):
-        self._ffconfig.begin_trace(self._tracing_id)
+    """ """
+
+    __slots__ = [
+        "handle",
+        "_handle",
+        "_layers",
+        "_nb_layers",
+        "_ffconfig",
+        "_tracing_id",
+        "initializers",
+        "attr_tensors",
+    ]
+
+    def __init__(self, ffconfig):
+        """Constructor of FFModel.
+
+        :param ffconfig: configurations of FlexFlow and the created model.
+        :type ffconfig: FFConfig
+
+        :returns:  FFModel -- the model.
+        """
+        self.handle = ffc().flexflow_model_create(ffconfig.handle, ffconfig.cpu_offload)
+        self._handle = ffi.gc(self.handle, ffc().flexflow_model_destroy)
+        self._layers = dict()
+        self._nb_layers = 0
+        self._ffconfig = ffconfig
+        global ff_tracing_id
+        self._tracing_id = ff_tracing_id
+        ff_tracing_id += 1
+        self.initializers = {}
+        self.attr_tensors = {}
+
+    def get_layers(self):
+        return self._layers
+
+    def add_layer(self, op_type, name):
+        layer_id = self._nb_layers
+        op_handle = ffc().flexflow_model_get_last_layer(self.handle)
+        self._layers[self._nb_layers] = convert_op_handle_to_op(
+            op_type, op_handle, idx=layer_id, name=name
+        )
+        self._nb_layers += 1
+
+    def create_tensor(self, dims, data_type, create_grad=True):
+        """Instantiate a FlexFlow tensor.
+
+        :param x: a shape tuple/list (integers), including the batch size.
+        :type x: list of int
+
+        :param data_type: the datatype of the created tensor. Options are
+          DT_FLOAT, DT_DOUBLE, DT_INT32, DT_INT64, DT_BOOLEAN.
+        :type data_type: DataType
+
+        :param create_grad: weather the tensor creates a gradients vector.
+          If you don't specify anything, a gradients vector is used.
+        :type create_grad: bool
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_dims = ffi.new("int[]", dims)
+        c_data_type = enum_to_int(DataType, data_type)
+        num_dims = len(dims)
+        handle = ffc().flexflow_tensor_create(
+            self.handle, num_dims, c_dims, c_data_type, create_grad
+        )
+        return Tensor(handle)
+
+    def map_tensor(self, tensor, parallel_op=None):
+        op_handle = self.__get_op_handle(parallel_op)
+        ffc().flexflow_tensor_map(self.handle, tensor.handle, op_handle)
+
+    def create_constant(self, dims, value, data_type):
+        c_dims = ffi.new("int[]", dims)
+        c_data_type = enum_to_int(DataType, data_type)
+        num_dims = len(dims)
+        handle = ffc().flexflow_constant_create(
+            self.handle, num_dims, c_dims, value, c_data_type
+        )
+        return Tensor(handle)
+
+    def exp(self, x, name=None):
+        """Exponential activation function.
+
+        :param x: the input Tensor.
+        :type x: Tensor
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_exp(self.handle, x.handle, c_name)
+        self.add_layer(OpType.EXP, name)
+        return Tensor(handle, owner_op_type=OpType.EXP)
+
+    def sin(self, x, name=None):
+        """Elementwise sine function.
+
+        :param x: the input Tensor.
+        :type x: Tensor
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_sin(self.handle, x.handle, c_name)
+        self.add_layer(OpType.SIN, name)
+        return Tensor(handle, owner_op_type=OpType.SIN)
+
+    def cos(self, x, name=None):
+        """Elementwise cosine function.
+
+        :param x: the input Tensor.
+        :type x: Tensor
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_cos(self.handle, x.handle, c_name)
+        self.add_layer(OpType.COS, name)
+        return Tensor(handle, owner_op_type=OpType.COS)
+
+    def add(self, x, y, inplace_a=False, name=None):
+        """Layer that adds two input Tensors, :attr:`output = x + y`.
+
+        :param x: the first input Tensor.
+        :type x: Tensor
+
+        :param y: the second input Tensor.
+        :type y: Tensor
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_add(
+            self.handle, x.handle, y.handle, inplace_a, c_name
+        )
+        self.add_layer(OpType.ADD, name)
+        return Tensor(handle, owner_op_type=OpType.ADD)
+
+    def subtract(self, x, y, inplace_a=False, name=None):
+        """Layer that subtracts two input Tensors, :attr:`output = x * y`.
+
+        :param x: the first input Tensor.
+        :type x: Tensor
+
+        :param y: the second input Tensor.
+        :type y: Tensor
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_subtract(
+            self.handle, x.handle, y.handle, inplace_a, c_name
+        )
+        self.add_layer(OpType.SUBTRACT, name)
+        return Tensor(handle, owner_op_type=OpType.SUBTRACT)
+
+    def multiply(self, x, y, inplace_a=False, name=None):
+        """Layer that multiplies (element-wise) two input Tensors, :attr:`output = x * y`.
+
+        :param x: the first input Tensor.
+        :type x: Tensor
+
+        :param y: the second input Tensor.
+        :type y: Tensor
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_multiply(
+            self.handle, x.handle, y.handle, inplace_a, c_name
+        )
+        self.add_layer(OpType.MULTIPLY, name)
+        return Tensor(handle, owner_op_type=OpType.MULTIPLY)
+
+    def divide(self, x, y, inplace_a=False, name=None):
+        """Layer that divides (element-wise) two input Tensors, :attr:`output = x / y`.
+
+        :param x: the first input Tensor.
+        :type x: Tensor
+
+        :param y: the second input Tensor.
+        :type y: Tensor
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_divide(
+            self.handle, x.handle, y.handle, inplace_a, c_name
+        )
+        self.add_layer(OpType.DIVIDE, name)
+        return Tensor(handle, owner_op_type=OpType.DIVIDE)
+
+    def max(self, x, y, inplace_a=False, name=None):
+        """Layer that computes the max (element-wise) two input Tensors, :attr:`output = max(x,y)`.
+
+        :param x: the first input Tensor.
+        :type x: Tensor
+
+        :param y: the second input Tensor.
+        :type y: Tensor
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_max(
+            self.handle, x.handle, y.handle, inplace_a, c_name
+        )
+        self.add_layer(OpType.MAX, name)
+        return Tensor(handle, owner_op_type=OpType.MAX)
+
+    def min(self, x, y, inplace_a=False, name=None):
+        """Layer that computes the min (element-wise) two input Tensors, :attr:`output = min(x,y)`.
+
+        :param x: the first input Tensor.
+        :type x: Tensor
+
+        :param y: the second input Tensor.
+        :type y: Tensor
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_min(
+            self.handle, x.handle, y.handle, inplace_a, c_name
+        )
+        self.add_layer(OpType.MIN, name)
+        return Tensor(handle, owner_op_type=OpType.MIN)
+
+    def reduce_sum(self, input, axes, keepdims=False, name=None):
+        """Layer that computes the sum of the input Tensor along given axes.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param axes: the axes along which reduction is applied
+        :type axes: List[int]
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        c_axes = ffi.new("int[]", axes)
+        handle = ffc().flexflow_model_add_reduce_sum(
+            self.handle, input.handle, c_axes, len(axes), keepdims, c_name
+        )
+        self.add_layer(OpType.REDUCE_SUM, name)
+        return Tensor(handle, owner_op_type=OpType.REDUCE_SUM)
+
+    def rsqrt(self, input, name=None):
+        """Layer that computes the element-wise reciprocal square-root.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_rsqrt(self.handle, input.handle, c_name)
+        self.add_layer(OpType.RSQRT, name)
+        return Tensor(handle, owner_op_type=OpType.RSQRT)
+
+    def pow(self, input, exponent, name=None):
+        """Layer that computes the element-wise power.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param exponent: exponent to raise each element in the input tensor.
+        :type exponent: float
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_pow(
+            self.handle, input.handle, exponent, c_name
+        )
+        self.add_layer(OpType.POW, name)
+        return Tensor(handle, owner_op_type=OpType.POW)
+
+    def mean(self, input, dims, keepdims=False, name=None):
+        """Layer that computes the mean of the input tensor across the given
+        dimensions.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param dims: dimensions to take the mean over.
+        :type dims: list
+
+        :param keepdims: keeps the dimensions in :attr:`dims` as size 1 if True and
+                         collapses the dimension if False. Default is False.
+        :type keepdims: bool
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        dims = list(dims)
+        c_dims = ffi.new("int[]", dims)
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_mean(
+            self.handle, input.handle, c_dims, len(dims), keepdims, c_name
+        )
+        self.add_layer(OpType.MEAN, name)
+        return Tensor(handle, owner_op_type=OpType.MEAN)
+
+    def conv2d(
+        self,
+        input,
+        out_channels,
+        kernel_h,
+        kernel_w,
+        stride_h,
+        stride_w,
+        padding_h,
+        padding_w,
+        activation=ActiMode.AC_MODE_NONE,
+        groups=1,
+        use_bias=True,
+        shared_op=None,
+        kernel_initializer=None,
+        bias_initializer=None,
+        name=None,
+    ):
+        """This layer creates a 2D convolution kernel that is convolved with the layer :attr:`input`
+        to produce a tensor of :attr:`output`.
+
+        The size of input tensor is :math:`(N, C_{in}, H, W)` and the size of output tensor
+        is :math:`(N, C_{out}, H_{out}, W_{out})`, which can be calculated by:
+
+        .. math::
+          C_{out} = out\_channels
+
+        .. math::
+          K_{H} = kernel\_h
+
+        .. math::
+          K_{W} = kernel\_w
+
+        .. math::
+          S_{H} = stride\_h
+
+        .. math::
+          S_{W} = stride\_w
+
+        .. math::
+          P_{H} = padding\_h
+
+        .. math::
+          P_{S} = padding\_s
+
+        .. math::
+          H_{out} = (H - K_{H} + 2 * P_{H}) / S_{H} + 1
+
+        .. math::
+          W_{out} = (W - K_{W} + 2 * P_{W}) / S_{W} + 1
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param out\_channels: the dimensionality of the output space (i.e. the number of output filters in the convolution).
+        :type out\_channels: int
+
+        :param kernel_h: the height of the 2D convolution window: :math:`K_{H}`.
+        :type kernel_h: int
+
+        :param kernel_w: the width of the 2D convolution window: :math:`K_{W}`.
+        :type kernel_w: int
+
+        :param stride_h: the stride of the convolution along the height: :math:`S_{H}`.
+        :type stride_h: int
+
+        :param stride_w: the stride of the convolution along the width: :math:`S_{W}`.
+        :type stride_w: int
+
+        :param padding_h: the amount of implicit zero-paddings along the height: :math:`P_{H}`.
+        :type padding_h: int
+
+        :param padding_w: the amount of implicit zero-paddings along the width: :math:`P_{W}`.
+        :type padding_w: int
+
+        :param activation: Activation function to use. Default is ActiMode.AC_MODE_NONE.
+        :type activation: ActiMode
+
+        :param groups: the number of groups in this convolution
+        :type groups: int
+
+        :param use_bias: whether the layer uses a bias vector. Default is True.
+        :type use_bias: bool
+
+        :param shared_op: the layer whose parameters are shared with. Default is None.
+        :type shared_op: Op
+
+        :param kernel_initializer: Initializer for the kernel weights matrix. If it is set to None, the GlorotUniformInitializer is applied.
+        :type kernel_initializer: Initializer
+
+        :param bias_initializer: Initializer for the bias vector. If it is set to None, the ZeroInitializer is applied.
+        :type bias_initializer: Initializer
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        shared_op_handle = self.__get_op_handle(shared_op)
+        c_activation = enum_to_int(ActiMode, activation)
+        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+        bias_init_handle = self.__get_initializer_handle(bias_initializer)
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_conv2d(
+            self.handle,
+            input.handle,
+            out_channels,
+            kernel_h,
+            kernel_w,
+            stride_h,
+            stride_w,
+            padding_h,
+            padding_w,
+            c_activation,
+            groups,
+            use_bias,
+            shared_op_handle,
+            kernel_init_handle,
+            bias_init_handle,
+            c_name,
+        )
+        self.add_layer(OpType.CONV2D, name)
+        return Tensor(handle, owner_op_type=OpType.CONV2D)
+
+    def embedding(
+        self,
+        input,
+        num_embeddings,
+        embedding_dim,
+        aggr,
+        dtype=DataType.DT_FLOAT,
+        shared_op=None,
+        kernel_initializer=None,
+        name=None,
+    ):
+        """Layer that turns positive integers into dense vectors of fixed size
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param num_embeddings: size of the vocabulary, i.e. maximum integer index + 1
+        :type num_embeddings: int
+
+        :param embedding_dim: dimension of the dense embedding.
+        :type embedding_dim: int
+
+        :param aggr: aggregation mode. Options are AGGR_MODE_NONE, AGGR_MODE_SUM and AGGR_MODE_AVG.
+        :type aggr: AggrMode
+
+        :param dtype: the tensor data type. Options are DT_BOOLEAN, DT_INT32, DT_INT64, DT_HALF, DT_FLOAT, DT_DOUBLE, DT_INT4, DT_INT8, DT_NONE
+        :type dtype: DataType
+
+        :param shared_op: the layer whose parameters are shared with. Default is None.
+        :type shared_op: Op
+
+        :param kernel_initializer: Initializer for the kernel weights matrix. If it is set to None, the GlorotUniformInitializer is applied.
+        :type kernel_initializer: Initializer
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        shared_op_handle = self.__get_op_handle(shared_op)
+        c_aggr = enum_to_int(AggrMode, aggr)
+        c_dtype = enum_to_int(DataType, dtype)
+        if kernel_initializer is None:
+            kernel_initializer = GlorotUniformInitializer(42)
+        assert (
+            (type(kernel_initializer) is GlorotUniformInitializer)
+            or (type(kernel_initializer) is ZeroInitializer)
+            or (type(kernel_initializer) is UniformInitializer)
+            or (type(kernel_initializer) is NormInitializer)
+        ), f"Unknown initializer type: {kernel_initializer}"
+        handle = ffc().flexflow_model_add_embedding(
+            self.handle,
+            input.handle,
+            num_embeddings,
+            embedding_dim,
+            c_aggr,
+            c_dtype,
+            shared_op_handle,
+            kernel_initializer.handle,
+            c_name,
+        )
+        # NOTE: We must keep a reference to the initializer or else it will be
+        # immediately destructed
+        self.initializers[name] = kernel_initializer
+        self.add_layer(OpType.EMBEDDING, name)
+        return Tensor(handle, owner_op_type=OpType.EMBEDDING)
+
+    def pool2d(
+        self,
+        input,
+        kernel_h,
+        kernel_w,
+        stride_h,
+        stride_w,
+        padding_h,
+        padding_w,
+        pool_type=PoolType.POOL_MAX,
+        activation=ActiMode.AC_MODE_NONE,
+        name=None,
+    ):
+        """Pooling operation for 2D spatial data.
+
+        The size of input tensor is :math:`(N, C_{in}, H, W)` and the size of output tensor
+        is :math:`(N, C_{out}, H_{out}, W_{out})`, which can be calculated by:
+
+        .. math::
+          C_{out} = out\_channels
+
+        .. math::
+          K_{H} = kernel\_h
+
+        .. math::
+          K_{W} = kernel\_w
+
+        .. math::
+          S_{H} = stride\_h
+
+        .. math::
+          S_{W} = stride\_w
+
+        .. math::
+          P_{H} = padding\_h
+
+        .. math::
+          P_{S} = padding\_s
+
+        .. math::
+          H_{out} = (H - K_{H} + 2 * P_{H}) / S_{H} + 1
+
+        .. math::
+          W_{out} = (W - K_{W} + 2 * P_{W}) / S_{W} + 1
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param kernel_h: the height of the 2D pooling window: :math:`K_{H}`.
+        :type kernel_h: int
+
+        :param kernel_w: the width of the 2D pooling window: :math:`K_{W}`.
+        :type kernel_w: int
+
+        :param stride_h: the stride of the pooling along the height: :math:`S_{H}`.
+        :type stride_h: int
+
+        :param stride_w: the stride of the pooling along the width: :math:`S_{W}`.
+        :type stride_w: int
+
+        :param padding_h: the amount of implicit zero-paddings along the height: :math:`P_{H}`.
+        :type padding_h: int
+
+        :param padding_w: the amount of implicit zero-paddings along the width: :math:`P_{W}`.
+        :type padding_w: int
+
+        :param activation: Tyoe of pooling function to use. If you don't specify anything, PoolType.POOL_MAX is applied.
+        :type activation: PoolType
+
+        :param activation: Activation function to use. Default is ActiMode.AC_MODE_NONE.
+        :type activation: ActiMode
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        c_pool_type = enum_to_int(PoolType, pool_type)
+        c_activation = enum_to_int(ActiMode, activation)
+        handle = ffc().flexflow_model_add_pool2d(
+            self.handle,
+            input.handle,
+            kernel_h,
+            kernel_w,
+            stride_h,
+            stride_w,
+            padding_h,
+            padding_w,
+            c_pool_type,
+            c_activation,
+            c_name,
+        )
+        self.add_layer(OpType.POOL2D, name)
+        return Tensor(handle, owner_op_type=OpType.POOL2D)
+
+    def batch_norm(self, input, relu=True, name=None):
+        """Layer that normalizes its inputs.
+
+        Batch normalization applies a transformation that maintains the mean output close to 0 and the output standard deviation close to 1.
+
+        :param input: the list of input Tensors.
+        :type input: Tensor
+
+        :param relu: whether a ReLU function is applied. Default is True.
+        :type relu: bool
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_batch_norm(
+            self.handle, input.handle, relu, c_name
+        )
+        self.add_layer(OpType.BATCH_NORM, name)
+        return Tensor(handle, owner_op_type=OpType.BATCH_NORM)
+
+    def layer_norm(
+        self, input, axes, elementwise_affine=True, eps=1e-5, use_bias=True, name=None
+    ):
+        """Add a LayerNorm layer
+
+        :param input: The input tensor
+        :type input: Tensor
+        :param axes: Indicate which axes (starting from the end) the LayerNorm should normalize over
+        :type axes: Union[int, List[int]]
+        :param elementwise_affine: Whether the LayerNorm should use the gamma weight for scaling, defaults to True
+        :type elementwise_affine: bool, optional
+        :param eps: A small float value added to the LayerNorm denominator for numerical stability, defaults to 1e-5
+        :type eps: float, optional
+        :param use_bias: Whether to add a beta bias to the LayerNorm result, defaults to True
+        :type use_bias: bool, optional
+        :param name: Name of the operator, also used for loading weights in inference mode, defaults to None
+        :type name: _type_, optional
+        :return: The LayerNorm output tensor
+        :rtype: Tensor
+        """
+        c_name = get_c_name(name)
+        c_axes = ffi.new("int[]", axes)
+        handle = ffc().flexflow_model_add_layer_norm(
+            self.handle,
+            input.handle,
+            len(axes),
+            c_axes,
+            elementwise_affine,
+            eps,
+            use_bias,
+            c_name,
+        )
+        self.add_layer(OpType.LAYER_NORM, name)
+        return Tensor(handle, owner_op_type=OpType.LAYER_NORM)
+
+    def residual_layer_norm(
+        self,
+        input,
+        residual1,
+        residual2,
+        use_two_residuals,
+        axes,
+        elementwise_affine=True,
+        eps=1e-5,
+        use_bias=True,
+        name=None,
+    ):
+        """Add a fused LayerNorm + Residual layer. This operator uses a single kernel, resulting in 
+        better efficiency compared to using separate element-wise add and LayerNorm operators.
+
+        :param input: The input tensor
+        :type input: Tensor
+        :param residual1: The residual tensor to add to the input before computing the LayerNorm
+        :type residual1: Tensor
+        :param residual2: An optional second residual tensor to add to the input (in addition to residual1) before computing the LayerNorm
+        :type residual2: Tensor
+        :param use_two_residuals: A boolean that should be set to True if using the second optional residual, False otherwise
+        :type use_two_residuals: bool
+        :param axes: Indicate which axes (starting from the end) the LayerNorm should normalize over
+        :type axes: List[int]
+        :param elementwise_affine: Whether the LayerNorm should use the gamma weight for scaling, defaults to True
+        :type elementwise_affine: bool, optional
+        :param eps: A small float value added to the LayerNorm denominator for numerical stability, defaults to 1e-5
+        :type eps: float, optional
+        :param use_bias: Whether to add a beta bias to the LayerNorm result, defaults to True
+        :type use_bias: bool, optional
+        :param name: Name of the operator, also used for loading weights in inference mode, defaults to None
+        :type name: str, optional
+        :return: A tensor with the sum of the input and residual(s), and the LayerNorm output
+        :rtype: (Tensor, Tensor)
+        """
+        c_name = get_c_name(name)
+        c_axes = ffi.new("int[]", axes)
+        residual2_handle = (
+            residual1.handle
+        )  # This is intentional. Data will be ignored, and we cannot pass None
+        if use_two_residuals:
+            assert residual2 is not None
+            residual2_handle = residual2.handle
+        handles_array = ffc().flexflow_model_add_residual_layer_norm(
+            self.handle,
+            input.handle,
+            residual1.handle,
+            residual2_handle,
+            use_two_residuals,
+            len(axes),
+            c_axes,
+            elementwise_affine,
+            eps,
+            use_bias,
+            c_name,
+        )
+        self.add_layer(OpType.RESIDUAL_LAYERNORM, name)
+        return Tensor(
+            handles_array[0], owner_op_type=OpType.RESIDUAL_LAYERNORM
+        ), Tensor(handles_array[1], owner_op_type=OpType.RESIDUAL_LAYERNORM)
+
+    def add_bias_residual_layer_norm(
+        self,
+        input,
+        residual,
+        axes,
+        elementwise_affine=True,
+        eps=1e-5,
+        use_bias=True,
+        name=None,
+    ):
+        """Add a Attention Bias + Residual + LayerNorm layer. This operator uses a single kernel, 
+        resulting in better efficiency compared to using separate attention bias addition + 
+        element-wise residual addition + LayerNorm operators.
+
+        :param input: The input tensor
+        :type input: Tensor
+        :param residual: The residual tensor
+        :type residual: Tensor
+        :param axes: Indicate which axes (starting from the end) the LayerNorm should normalize over
+        :type axes: Union[int, List[int]]
+        :param elementwise_affine: Whether the LayerNorm should use the gamma weight for scaling, defaults to True
+        :type elementwise_affine: bool, optional
+        :param eps: A small float value added to the LayerNorm denominator for numerical stability, defaults to 1e-5
+        :type eps: float, optional
+        :param use_bias: Whether to add a beta bias to the LayerNorm result, defaults to True
+        :type use_bias: bool, optional
+        :param name: Name of the operator, also used for loading weights in inference mode, defaults to None
+        :type name: _type_, optional
+        :return: A tensor with the sum of the attention bias, input and residual(s), and the LayerNorm output
+        :rtype: (Tensor, Tensor)
+        """
+        c_name = get_c_name(name)
+        c_axes = ffi.new("int[]", axes)
+        handles_array = ffc().flexflow_model_add_add_bias_residual_layer_norm(
+            self.handle,
+            input.handle,
+            residual.handle,
+            len(axes),
+            c_axes,
+            elementwise_affine,
+            eps,
+            use_bias,
+            c_name,
+        )
+        self.add_layer(OpType.ADD_BIAS_RESIDUAL_LAYERNORM, name)
+        return Tensor(
+            handles_array[0], owner_op_type=OpType.ADD_BIAS_RESIDUAL_LAYERNORM
+        ), Tensor(handles_array[1], owner_op_type=OpType.ADD_BIAS_RESIDUAL_LAYERNORM)
+
+    def sigmoid_silu_multi(self, input1, input2, name=None):
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_sigmoid_silu_multi(
+            self.handle, input1.handle, input2.handle, c_name
+        )
+        self.add_layer(OpType.SIGMOID_SILU_MULTI, name)
+        return Tensor(handle, owner_op_type=OpType.SIGMOID_SILU_MULTI)
+
+    def batch_matmul(
+        self, A, B, a_seq_length_dim=None, b_seq_length_dim=None, name=None
+    ):
+        """Layer that applied batched matrix multiplication onto two input Tensors, :attr:`output = x * y`.
+
+        :param A: the first input Tensor.
+        :type A: Tensor
+
+        :param B: the second input Tensor.
+        :type B: Tensor
+
+        :param a_seq_length_dim: an int when set indicating the a_seq_length_dim dimention of A is a sequence_length dimension
+        :type a_seq_length_dim: int
+
+        :param b_seq_length_dim: an int when set indicating the b_seq_length_dim dimention of B is a sequence_length dimension
+        :type b_seq_length_dim: int
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :param name:  Whether to add use bias in layer normalization
+        :type name: bool
+
+        :returns:  Tensor -- the output tensor.
+        """
+        if a_seq_length_dim is None:
+            a_seq_length_dim = -1
+        if b_seq_length_dim is None:
+            b_seq_length_dim = -1
+        handle = ffc().flexflow_model_add_batch_matmul(
+            self.handle, A.handle, B.handle, a_seq_length_dim, b_seq_length_dim
+        )
+        self.add_layer(OpType.BATCH_MATMUL, name)
+        return Tensor(handle, owner_op_type=OpType.BATCH_MATMUL)
+
+    def dense(
+        self,
+        input,
+        out_dim,
+        activation=ActiMode.AC_MODE_NONE,
+        use_bias=True,
+        datatype=DataType.DT_NONE,
+        shared_op=None,
+        kernel_initializer=None,
+        bias_initializer=None,
+        kernel_regularizer=None,
+        name=None,
+    ):
+        """Dense implements the operation: :attr:`output = activation(dot(input, kernel) + bias)` where
+        :attr:`activation` is the element-wise activation function passed as the activation argument,
+        :attr:`kernel` is a weights matrix created by the layer, and
+        :attr:`bias` is a bias vector created by the layer (only applicable if :attr:`use_bias` is True).
+
+        The size of input tensor is :math:`(N, C_{in})` and the size of output tensor
+        is :math:`(N, C_{out})`, where :math:`C_{out} = out\_dim`
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param out\_dim: dimensionality of the output space.
+        :type out\_dim: int
+
+        :param activation: Activation function to use. Default is ActiMode.AC_MODE_NONE.
+        :type activation: ActiMode
+
+        :param use_bias: whether the layer uses a bias vector. Default is True.
+        :type use_bias: bool
+
+        :param shared_op: the layer whose parameters are shared with. Default is None.
+        :type shared_op: Op
+
+        :param kernel_initializer: Initializer for the kernel weights matrix. If it is set to None, the GlorotUniformInitializer is applied.
+        :type kernel_initializer: Initializer
+
+        :param bias_initializer: Initializer for the bias vector. If it is set to None, the ZeroInitializer is applied.
+        :type bias_initializer: Initializer
+
+        :param kernel_regularizer: Regularizer for the kernel weights matrix
+        :type bias_initializer: Regularizer
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        shared_op_handle = self.__get_op_handle(shared_op)
+        c_activation = enum_to_int(ActiMode, activation)
+        c_datatype = enum_to_int(DataType, datatype)
+        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+        bias_init_handle = self.__get_initializer_handle(bias_initializer)
+        if kernel_regularizer:
+            c_kernel_reg_type = enum_to_int(RegularizerMode, kernel_regularizer.type)
+            kernel_reg_lambda = kernel_regularizer._lambda
+        else:
+            c_kernel_reg_type = enum_to_int(
+                RegularizerMode, RegularizerMode.REG_MODE_NONE
+            )
+            kernel_reg_lambda = 0.0
+        handle = ffc().flexflow_model_add_dense(
+            self.handle,
+            input.handle,
+            out_dim,
+            c_activation,
+            use_bias,
+            c_datatype,
+            shared_op_handle,
+            kernel_init_handle,
+            bias_init_handle,
+            c_kernel_reg_type,
+            kernel_reg_lambda,
+            c_name,
+        )
+        self.add_layer(OpType.LINEAR, name)
+        return Tensor(handle, owner_op_type=OpType.LINEAR)
+
+    def concat(self, tensors, axis, name=None):
+        """Layer that concatenates a list of inputs.
+
+        It takes as input a list of tensors, all of the same shape except for the concatenation axis, and returns a single tensor that is the concatenation of all inputs.
+
+        :param input: the list of input Tensors.
+        :type input: List of Tensors
+
+        :param axis: the dimension along which to concatenate.
+        :type axis: int
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        assert type(tensors) is list, "tensors should be a list"
+        tensor_handle_list = []
+        n = len(tensors)
+        assert n <= 256, "Please increase MAX_NUM_INPUTS"
+        for tensor in tensors:
+            tensor_handle_list.append(tensor.handle)
+        c_tensor_handle_list = ffi.new("flexflow_tensor_t[]", tensor_handle_list)
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_concat(
+            self.handle, n, c_tensor_handle_list, axis, c_name
+        )
+        self.add_layer(OpType.CONCAT, name)
+        return Tensor(handle, owner_op_type=OpType.CONCAT)
+
+    def split(self, input, sizes, axis, name=None):
+        """Layer that splits a :attr:`input` tensor into a list of tensors.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param sizes: either an int indicating the number of splits along axis or a Python list containing the sizes of each output tensor along axis. If a scalar, then it must evenly divide :attr:`input.dims[axis]`; otherwise the sum of sizes along the split axis must match that of the :attr:`input`.
+        :type sizes: int or list of int
+
+        :param axis: the dimension along which to split.
+        :type axis: int
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  list of Tensors -- the output tensors.
+        """
+        if type(sizes) is list:
+            split = sizes
+        else:
+            assert input.dims[axis] % sizes == 0, "Split dimension is not divisible"
+            split = [input.dims[axis] // sizes for i in range(sizes)]
+        n = len(split)
+        assert n <= 256, "Please increase MAX_NUM_OUTPUTS"
+        c_split = ffi.new("int[]", split)
+        c_outputs_handle_list = ffi.new("flexflow_tensor_t[256]")
+        c_name = get_c_name(name)
+        ffc().flexflow_model_add_split(
+            self.handle, input.handle, n, c_outputs_handle_list, c_split, axis, c_name
+        )
+        output_tensor_list = []
+        for i in range(n):
+            tensor_p_handle = ffi.new("flexflow_tensor_t*")
+            tensor_p_handle.impl = c_outputs_handle_list[i].impl
+            output_tensor_list.append(
+                Tensor(None, owner_op_type=OpType.SPLIT, p_handle=tensor_p_handle)
+            )
+        self.add_layer(OpType.SPLIT, name)
+        del c_outputs_handle_list
+        return output_tensor_list
+
+    def flat(self, input, name=None):
+        """Flattens the input. Does not affect the batch size.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_flat(self.handle, input.handle, c_name)
+        self.add_layer(OpType.FLAT, name)
+        return Tensor(handle, owner_op_type=OpType.FLAT)
+
+    def softmax(self, input, axis=-1, name=None):
+        """Softmax activation function.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_softmax(
+            self.handle, input.handle, axis, c_name
+        )
+        self.add_layer(OpType.SOFTMAX, name)
+        return Tensor(handle, owner_op_type=OpType.SOFTMAX)
+
+    def reshape(self, input, shape, name=None):
+        """Layer that reshapes inputs into the given shape.
+
+        Given a :attr:`input` tensor, this operation returns a output tensor that has the same values as tensor in the same order,
+        except with a new shape given by :attr:`shape`.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param shape: A list defining the shape of the output tensor.
+        :type shape: list of int
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        c_shape = ffi.new("int[]", shape)
+        handle = ffc().flexflow_model_add_reshape(
+            self.handle, input.handle, len(shape), c_shape, c_name
+        )
+        self.add_layer(OpType.RESHAPE, name)
+        return Tensor(handle, owner_op_type=OpType.RESHAPE)
+
+    def gather(self, input, index, dim, name=None):
+        """Layer that gathers values along the dim axis.
+
+        :param input: the input tensor
+        :type input: Tensor
+
+        :param index: the index tensor, which specifies the indices of elements to gather
+        :type index: Tensor
+
+        :param dim: the axis along which to index
+        :type dim: int
+
+        :param name: the name of the layer. Default is None
+        :type name: string
+
+        :returns: Tensor -- the output tensor
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_gather(
+            self.handle, input.handle, index.handle, dim, c_name
+        )
+        self.add_layer(OpType.GATHER, name)
+        return Tensor(handle, owner_op_type=OpType.GATHER)
+
+    def transpose(self, input, perm, name=None):
+        """Transposes the :attr:`input` tensor. Permutes the dimensions according to perm
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param perm: A permutation of the dimensions of a.
+        :type perm: List of int
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        c_perm = ffi.new("int[]", perm)
+        handle = ffc().flexflow_model_add_transpose(
+            self.handle, input.handle, len(perm), c_perm, c_name
+        )
+        self.add_layer(OpType.TRANSPOSE, name)
+        return Tensor(handle, owner_op_type=OpType.TRANSPOSE)
+
+    def reverse(self, input, axis, name=None):
+        """Layer that reverses specific dimensions of a tensor.
+
+        Given a :attr:`input` tensor, this operation reverses the dimension :attr:`axis`.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param axis: the dimension to reverse.
+        :type axis: int
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_reverse(
+            self.handle, input.handle, axis, c_name
+        )
+        self.add_layer(OpType.REVERSE, name)
+        return Tensor(handle, owner_op_type=OpType.REVERSE)
+
+    def scalar_multiply(self, input, scalar, inplace=True, name=None):
+        """Scalar multiplication of a tensor by an scalar.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param input: the scalar
+        :type scalar: float
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_scalar_multiply(
+            self.handle, input.handle, scalar, inplace, c_name
+        )
+        self.add_layer(OpType.SCALAR_MULTIPLY, name)
+        return Tensor(handle, owner_op_type=OpType.SCALAR_MULTIPLY)
+
+    def scalar_add(self, input, scalar, inplace=True, name=None):
+        """Scalar addition of a scalar to each entry of a tensor.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param input: the scalar
+        :type scalar: float
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_scalar_add(
+            self.handle, input.handle, scalar, inplace, c_name
+        )
+        self.add_layer(OpType.SCALAR_ADD, name)
+        return Tensor(handle, owner_op_type=OpType.SCALAR_ADD)
+
+    def scalar_sub(self, input, scalar, inplace=True, name=None):
+        """Scalar subtraction of a scalar to each entry of a tensor.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param input: the scalar
+        :type scalar: float
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_scalar_sub(
+            self.handle, input.handle, scalar, inplace, c_name
+        )
+        self.add_layer(OpType.SCALAR_SUB, name)
+        return Tensor(handle, owner_op_type=OpType.SCALAR_SUB)
+
+    def scalar_true_divide(self, input, scalar, inplace=True, name=None):
+        """Scalar regular division of a tensor by an scalar.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param input: the scalar
+        :type scalar: float
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_scalar_truediv(
+            self.handle, input.handle, scalar, inplace, c_name
+        )
+        self.add_layer(OpType.SCALAR_TRUEDIV, name)
+        return Tensor(handle, owner_op_type=OpType.SCALAR_TRUEDIV)
+
+    def gelu(self, input, inplace=True, name=None):
+        """Gaussian Error Linear Unit activation function.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_gelu(self.handle, input.handle, c_name)
+        self.add_layer(OpType.GELU, name)
+        return Tensor(handle, owner_op_type=OpType.GELU)
+
+    def relu(self, input, inplace=True, name=None):
+        """Rectified Linear Unit activation function.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_relu(
+            self.handle, input.handle, inplace, c_name
+        )
+        self.add_layer(OpType.RELU, name)
+        return Tensor(handle, owner_op_type=OpType.RELU)
+
+    def identity(self, input, name=None):
+        """Identity function.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_identity(self.handle, input.handle, c_name)
+        self.add_layer(OpType.IDENTITY, name)
+        return Tensor(handle, owner_op_type=OpType.IDENTITY)
+
+    def sigmoid(self, input, name=None):
+        """Sigmoid activation function, :math:`sigmoid(x) = 1 / (1 + exp(-x))`.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_sigmoid(self.handle, input.handle, c_name)
+        self.add_layer(OpType.SIGMOID, name)
+        return Tensor(handle, owner_op_type=OpType.SIGMOID)
+
+    def tanh(self, input, name=None):
+        """Hyperbolic tangent activation function.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_tanh(self.handle, input.handle, c_name)
+        self.add_layer(OpType.TANH, name)
+        return Tensor(handle, owner_op_type=OpType.TANH)
+
+    def elu(self, input, inplace=True, name=None):
+        """Exponential Linear Unit. activation function.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_elu(
+            self.handle, input.handle, inplace, c_name
+        )
+        self.add_layer(OpType.ELU, name)
+        return Tensor(handle, owner_op_type=OpType.ELU)
+
+    def dropout(self, input, rate, seed, name=None):
+        """The Dropout layer randomly sets input units to 0 with
+        a frequency of :attr:`rate` at each step during training time,
+        which helps prevent overfitting.
+        Inputs not set to 0 are scaled up by 1/(1 - rate) such that the
+        sum over all inputs is unchanged.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param rate: Fraction of the input units to drop.
+        :type rate: float(0-1)
+
+        :param seed: random seed.
+        :type seed: int
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_dropout(
+            self.handle, input.handle, rate, seed, c_name
+        )
+        self.add_layer(OpType.DROPOUT, name)
+        return Tensor(handle, owner_op_type=OpType.DROPOUT)
+
+    def multihead_attention(
+        self,
+        query,
+        key,
+        value,
+        embed_dim,
+        num_heads,
+        kdim=0,
+        vdim=0,
+        dropout=0.0,
+        bias=True,
+        add_bias_kv=False,
+        add_zero_attn=False,
+        kernel_initializer=None,
+        name=None,
+    ):
+        """Defines the MultiHead Attention operation as described in Attention Is All You Need
+        which takes in the tensors :attr:`query`, :attr:`key`, and :attr:`value`,
+        and returns the dot-product attention between them:.
+
+        :param query: the query Tensor.
+        :type query: Tensor
+
+        :param key: the key Tensor.
+        :type key: Tensor
+
+        :param value: the value Tensor.
+        :type value: Tensor
+
+        :param embed_dim: total dimension of the model
+        :type embed_dim: int
+
+        :param num_heads: Number of attention heads.
+        :type num_heads: int
+
+        :param kdim: total number of features in key. Default is 0
+        :type kdim: int
+
+        :param vdim: total number of features in value. Default is 0
+        :type vdim: int
+
+        :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
+        :type dropout: float(0-1)
+
+        :param bias: Whether the dense layers use bias vectors. Default is True.
+        :type bias: bool
+
+        :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
+        :type add_bias_kv: bool
+
+        :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
+        :type add_zero_attn: bool
+
+        :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+        :type kernel_initializer: Initializer
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+        handle = ffc().flexflow_model_add_multihead_attention(
+            self.handle,
+            query.handle,
+            key.handle,
+            value.handle,
+            embed_dim,
+            num_heads,
+            kdim,
+            vdim,
+            dropout,
+            bias,
+            add_bias_kv,
+            add_zero_attn,
+            kernel_init_handle,
+            c_name,
+        )
+        self.add_layer(OpType.MULTIHEAD_ATTENTION, name)
+        return Tensor(handle, owner_op_type=OpType.MULTIHEAD_ATTENTION)
+
+    def inc_multihead_self_attention(
+        self,
+        input,
+        embed_dim,
+        num_heads,
+        kdim=0,
+        vdim=0,
+        dropout=0.0,
+        bias=True,
+        add_bias_kv=False,
+        add_zero_attn=False,
+        data_type=DataType.DT_NONE,
+        kernel_initializer=None,
+        apply_rotary_embedding=False,
+        scaling_query=False,
+        scaling_factor=1.0,
+        qk_prod_scaling=True,
+        position_bias=False,
+        name=None,
+    ):
+        """Defines the MultiHead Attention operation as described in Attention Is All You Need
+        which takes in the tensors :attr:`input`, and uses it for all three of query, key and values.
+        In inference mode, the attention is computed using incremental decoding.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param embed_dim: total dimension of the model
+        :type embed_dim: int
+
+        :param num_heads: Number of attention heads.
+        :type num_heads: int
+
+        :param kdim: total number of features in key. Default is 0
+        :type kdim: int
+
+        :param vdim: total number of features in value. Default is 0
+        :type vdim: int
+
+        :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
+        :type dropout: float(0-1)
+
+        :param bias: Whether the dense layers use bias vectors. Default is True.
+        :type bias: bool
+
+        :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
+        :type add_bias_kv: bool
+
+        :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
+        :type add_zero_attn: bool
+
+        :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
+        :type data_type: DataType
+
+        :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+        :type kernel_initializer: Initializer
+
+        :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
+        :type apply_rotary_embedding: bool
+
+        :param scaling_query: Whether to apply scaling query. Default is False.
+        :type scaling_query: bool
+
+        :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
+        :type scaling_factor: float
+
+        :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
+        :type qk_prod_scaling: bool
+
+        :param position_bias: Whether to add position bias to the QK product. Default is False.
+        :type position_bias: bool
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+        c_data_type = enum_to_int(DataType, data_type)
+        handle = ffc().flexflow_model_add_inc_multihead_self_attention(
+            self.handle,
+            input.handle,
+            embed_dim,
+            num_heads,
+            kdim,
+            vdim,
+            dropout,
+            bias,
+            add_bias_kv,
+            add_zero_attn,
+            c_data_type,
+            kernel_init_handle,
+            apply_rotary_embedding,
+            scaling_query,
+            scaling_factor,
+            qk_prod_scaling,
+            position_bias,
+            c_name,
+        )
+        self.add_layer(OpType.INC_MULTIHEAD_ATTENTION, name)
+        return Tensor(handle, owner_op_type=OpType.INC_MULTIHEAD_ATTENTION)
+
+    def spec_inc_multihead_self_attention(
+        self,
+        input,
+        embed_dim,
+        num_heads,
+        kdim=0,
+        vdim=0,
+        dropout=0.0,
+        bias=True,
+        add_bias_kv=False,
+        add_zero_attn=False,
+        data_type=DataType.DT_NONE,
+        kernel_initializer=None,
+        apply_rotary_embedding=False,
+        scaling_query=False,
+        scaling_factor=1.0,
+        qk_prod_scaling=True,
+        position_bias=False,
+        name=None,
+    ):
+        """Defines the MultiHead Attention operation as described in Attention Is All You Need
+        which takes in the tensors :attr:`input`, and uses it for all three of query, key and values.
+        This operator only supports computing the attention in inference (beam search) mode.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param embed_dim: total dimension of the model
+        :type embed_dim: int
+
+        :param num_heads: Number of attention heads.
+        :type num_heads: int
+
+        :param kdim: total number of features in key. Default is 0
+        :type kdim: int
+
+        :param vdim: total number of features in value. Default is 0
+        :type vdim: int
+
+        :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
+        :type dropout: float(0-1)
+
+        :param bias: Whether the dense layers use bias vectors. Default is True.
+        :type bias: bool
+
+        :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
+        :type add_bias_kv: bool
+
+        :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
+        :type add_zero_attn: bool
+
+        :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
+        :type data_type: DataType
+
+        :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+        :type kernel_initializer: Initializer
+
+        :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
+        :type apply_rotary_embedding: bool
+
+        :param scaling_query: Whether to apply scaling query. Default is False.
+        :type scaling_query: bool
+
+        :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
+        :type scaling_factor: float
+
+        :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
+        :type qk_prod_scaling: bool
+
+        :param position_bias: Whether to add position bias to the QK product. Default is False.
+        :type position_bias: bool
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+        c_data_type = enum_to_int(DataType, data_type)
+        handle = ffc().flexflow_model_add_spec_inc_multihead_self_attention(
+            self.handle,
+            input.handle,
+            embed_dim,
+            num_heads,
+            kdim,
+            vdim,
+            dropout,
+            bias,
+            add_bias_kv,
+            add_zero_attn,
+            c_data_type,
+            kernel_init_handle,
+            apply_rotary_embedding,
+            scaling_query,
+            scaling_factor,
+            qk_prod_scaling,
+            position_bias,
+            c_name,
+        )
+        self.add_layer(OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION, name)
+        return Tensor(handle, owner_op_type=OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION)
+
+    def inc_multihead_self_attention_verify(
+        self,
+        input,
+        embed_dim,
+        num_heads,
+        kdim=0,
+        vdim=0,
+        dropout=0.0,
+        bias=True,
+        add_bias_kv=False,
+        add_zero_attn=False,
+        data_type=DataType.DT_NONE,
+        kernel_initializer=None,
+        apply_rotary_embedding=False,
+        scaling_query=False,
+        scaling_factor=1.0,
+        qk_prod_scaling=True,
+        position_bias=False,
+        name=None,
+    ):
+        """Defines the MultiHead Attention operation as described in Attention Is All You Need
+        which takes in the tensors :attr:`input`, and uses it for all three of query, key and values.
+        This operator only supports computing the attention in inference (tree verify) mode.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param embed_dim: total dimension of the model
+        :type embed_dim: int
+
+        :param num_heads: Number of attention heads.
+        :type num_heads: int
+
+        :param kdim: total number of features in key. Default is 0
+        :type kdim: int
+
+        :param vdim: total number of features in value. Default is 0
+        :type vdim: int
+
+        :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
+        :type dropout: float(0-1)
+
+        :param bias: Whether the dense layers use bias vectors. Default is True.
+        :type bias: bool
+
+        :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
+        :type add_bias_kv: bool
+
+        :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
+        :type add_zero_attn: bool
+
+        :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
+        :type data_type: DataType
+
+        :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+        :type kernel_initializer: Initializer
+
+        :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
+        :type apply_rotary_embedding: bool
+
+        :param scaling_query: Whether to apply scaling query. Default is False.
+        :type scaling_query: bool
+
+        :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
+        :type scaling_factor: float
+
+        :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
+        :type qk_prod_scaling: bool
+
+        :param position_bias: Whether to add position bias to the QK product. Default is False.
+        :type position_bias: bool
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+        c_data_type = enum_to_int(DataType, data_type)
+        handle = ffc().flexflow_model_add_inc_multihead_self_attention_verify(
+            self.handle,
+            input.handle,
+            embed_dim,
+            num_heads,
+            kdim,
+            vdim,
+            dropout,
+            bias,
+            add_bias_kv,
+            add_zero_attn,
+            c_data_type,
+            kernel_init_handle,
+            apply_rotary_embedding,
+            scaling_query,
+            scaling_factor,
+            qk_prod_scaling,
+            position_bias,
+            c_name,
+        )
+        self.add_layer(OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION, name)
+        return Tensor(handle, owner_op_type=OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION)
+
+    def inc_multiquery_self_attention(
+        self,
+        input,
+        embed_dim,
+        num_q_heads,
+        num_kv_heads,
+        kdim=0,
+        vdim=0,
+        dropout=0.0,
+        bias=True,
+        add_bias_kv=False,
+        add_zero_attn=False,
+        data_type=DataType.DT_NONE,
+        kernel_initializer=None,
+        apply_rotary_embedding=False,
+        scaling_query=False,
+        scaling_factor=1.0,
+        qk_prod_scaling=True,
+        position_bias=False,
+        name=None,
+    ):
+        """Defines the multi-query head attention, which allows a different number of Q and KV heads,
+        and takes in the tensors :attr:`input`, and uses it for all three of query, key and values.
+        In inference mode, the attention is computed using incremental decoding.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param embed_dim: total dimension of the model
+        :type embed_dim: int
+
+        :param num_q_heads: Number of query attention heads.
+        :type num_q_heads: int
+
+        :param num_kv_heads: Number of key/value attention heads.
+        :type num_kv_heads: int
+
+        :param kdim: total number of features in key. Default is 0
+        :type kdim: int
+
+        :param vdim: total number of features in value. Default is 0
+        :type vdim: int
+
+        :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
+        :type dropout: float(0-1)
+
+        :param bias: Whether the dense layers use bias vectors. Default is True.
+        :type bias: bool
+
+        :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
+        :type add_bias_kv: bool
+
+        :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
+        :type add_zero_attn: bool
+
+        :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
+        :type data_type: DataType
+
+        :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+        :type kernel_initializer: Initializer
+
+        :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
+        :type apply_rotary_embedding: bool
+
+        :param scaling_query: Whether to apply scaling query. Default is False.
+        :type scaling_query: bool
+
+        :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
+        :type scaling_factor: float
+
+        :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
+        :type qk_prod_scaling: bool
+
+        :param position_bias: Whether to add position bias to the QK product. Default is False.
+        :type position_bias: bool
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+        c_data_type = enum_to_int(DataType, data_type)
+        handle = ffc().flexflow_model_add_inc_multiquery_self_attention(
+            self.handle,
+            input.handle,
+            embed_dim,
+            num_q_heads,
+            num_kv_heads,
+            kdim,
+            vdim,
+            dropout,
+            bias,
+            add_bias_kv,
+            add_zero_attn,
+            c_data_type,
+            kernel_init_handle,
+            apply_rotary_embedding,
+            scaling_query,
+            scaling_factor,
+            qk_prod_scaling,
+            position_bias,
+            c_name,
+        )
+        self.add_layer(OpType.INC_MULTIHEAD_ATTENTION, name)
+        return Tensor(handle, owner_op_type=OpType.INC_MULTIHEAD_ATTENTION)
+
+    def spec_inc_multiquery_self_attention(
+        self,
+        input,
+        embed_dim,
+        num_q_heads,
+        num_kv_heads,
+        kdim=0,
+        vdim=0,
+        dropout=0.0,
+        bias=True,
+        add_bias_kv=False,
+        add_zero_attn=False,
+        data_type=DataType.DT_NONE,
+        kernel_initializer=None,
+        apply_rotary_embedding=False,
+        scaling_query=False,
+        scaling_factor=1.0,
+        qk_prod_scaling=True,
+        position_bias=False,
+        name=None,
+    ):
+        """Defines the multi-query head attention, which allows a different number of Q and KV heads,
+        and takes in the tensors :attr:`input`, and uses it for all three of query, key and values.
+        This operator only supports computing the attention in inference (beam search) mode.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param embed_dim: total dimension of the model
+        :type embed_dim: int
+
+        :param num_q_heads: Number of query attention heads.
+        :type num_q_heads: int
+
+        :param num_kv_heads: Number of key/value attention heads.
+        :type num_kv_heads: int
+
+        :param kdim: total number of features in key. Default is 0
+        :type kdim: int
+
+        :param vdim: total number of features in value. Default is 0
+        :type vdim: int
+
+        :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
+        :type dropout: float(0-1)
+
+        :param bias: Whether the dense layers use bias vectors. Default is True.
+        :type bias: bool
+
+        :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
+        :type add_bias_kv: bool
+
+        :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
+        :type add_zero_attn: bool
+
+        :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
+        :type data_type: DataType
+
+        :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+        :type kernel_initializer: Initializer
+
+        :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
+        :type apply_rotary_embedding: bool
+
+        :param scaling_query: Whether to apply scaling query. Default is False.
+        :type scaling_query: bool
+
+        :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
+        :type scaling_factor: float
+
+        :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
+        :type qk_prod_scaling: bool
+
+        :param position_bias: Whether to add position bias to the QK product. Default is False.
+        :type position_bias: bool
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+        c_data_type = enum_to_int(DataType, data_type)
+        handle = ffc().flexflow_model_add_spec_inc_multiquery_self_attention(
+            self.handle,
+            input.handle,
+            embed_dim,
+            num_q_heads,
+            num_kv_heads,
+            kdim,
+            vdim,
+            dropout,
+            bias,
+            add_bias_kv,
+            add_zero_attn,
+            c_data_type,
+            kernel_init_handle,
+            apply_rotary_embedding,
+            scaling_query,
+            scaling_factor,
+            qk_prod_scaling,
+            position_bias,
+            c_name,
+        )
+        self.add_layer(OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION, name)
+        return Tensor(handle, owner_op_type=OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION)
+
+    def inc_multiquery_self_attention_verify(
+        self,
+        input,
+        embed_dim,
+        num_q_heads,
+        num_kv_heads,
+        kdim=0,
+        vdim=0,
+        dropout=0.0,
+        bias=True,
+        add_bias_kv=False,
+        add_zero_attn=False,
+        data_type=DataType.DT_NONE,
+        kernel_initializer=None,
+        apply_rotary_embedding=False,
+        scaling_query=False,
+        scaling_factor=1.0,
+        qk_prod_scaling=True,
+        position_bias=False,
+        name=None,
+    ):
+        """Defines the multi-query head attention, which allows a different number of Q and KV heads,
+        and takes in the tensors :attr:`input`, and uses it for all three of query, key and values.
+        This operator only supports computing the attention in inference (tree verify) mode.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param embed_dim: total dimension of the model
+        :type embed_dim: int
+
+        :param num_q_heads: Number of query attention heads.
+        :type num_q_heads: int
+
+        :param num_kv_heads: Number of key/value attention heads.
+        :type num_kv_heads: int
+
+        :param kdim: total number of features in key. Default is 0
+        :type kdim: int
+
+        :param vdim: total number of features in value. Default is 0
+        :type vdim: int
+
+        :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
+        :type dropout: float(0-1)
+
+        :param bias: Whether the dense layers use bias vectors. Default is True.
+        :type bias: bool
+
+        :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
+        :type add_bias_kv: bool
+
+        :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
+        :type add_zero_attn: bool
+
+        :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
+        :type data_type: DataType
+
+        :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+        :type kernel_initializer: Initializer
+
+        :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
+        :type apply_rotary_embedding: bool
+
+        :param scaling_query: Whether to apply scaling query. Default is False.
+        :type scaling_query: bool
+
+        :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
+        :type scaling_factor: float
+
+        :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
+        :type qk_prod_scaling: bool
+
+        :param position_bias: Whether to add position bias to the QK product. Default is False.
+        :type position_bias: bool
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+        c_data_type = enum_to_int(DataType, data_type)
+        handle = ffc().flexflow_model_add_inc_multiquery_self_attention_verify(
+            self.handle,
+            input.handle,
+            embed_dim,
+            num_q_heads,
+            num_kv_heads,
+            kdim,
+            vdim,
+            dropout,
+            bias,
+            add_bias_kv,
+            add_zero_attn,
+            c_data_type,
+            kernel_init_handle,
+            apply_rotary_embedding,
+            scaling_query,
+            scaling_factor,
+            qk_prod_scaling,
+            position_bias,
+            c_name,
+        )
+        self.add_layer(OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION, name)
+        return Tensor(handle, owner_op_type=OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION)
+
+    def rms_norm(self, input, eps, dim, name=None):
+        """Defines the RMS Norm layer.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param eps: a value added to the denominator for numerical stability
+        :type eps: float
+
+        :param dim: The dimension with respect to which to take the norm
+        :type dim: int
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_rms_norm(
+            self.handle, input.handle, eps, dim, c_name
+        )
+        self.add_layer(OpType.RMS_NORM, name)
+        return Tensor(handle, owner_op_type=OpType.RMS_NORM)
+
+    def residual_rms_norm(self, input1, input2, eps, dim, name=None):
+        """Defines the Residual RMS Norm layer.
+
+        :param input: the input 1 Tensor.
+        :type input: Tensor
+
+        :param input: the input 2 Tensor.
+        :type input: Tensor
+
+        :param eps: a value added to the denominator for numerical stability
+        :type eps: float
+
+        :param dim: The dimension with respect to which to take the norm
+        :type dim: int
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handles_array = ffc().flexflow_model_add_residual_rms_norm(
+            self.handle, input1.handle, input2.handle, eps, dim, c_name
+        )
+        self.add_layer(OpType.RESIDUAL_RMS_NORM, name)
+        return Tensor(handles_array[0], owner_op_type=OpType.RESIDUAL_RMS_NORM), Tensor(
+            handles_array[1], owner_op_type=OpType.RESIDUAL_RMS_NORM
+        )
+
+    def arg_top_k(self, input, k, sorted, name=None):
+        """Defines the Arg TopK layer.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param k: the top k indices to select
+        :type k: int
+
+        :param sorted: Whether the entries should be sorted
+        :type sorted: bool
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_arg_top_k(
+            self.handle, input.handle, k, sorted, c_name
+        )
+        self.add_layer(OpType.ARG_TOPK, name)
+        return Tensor(handle, owner_op_type=OpType.ARG_TOPK)
+
+    def beam_top_k(self, input, max_beam_size, sorted, name=None):
+        """Defines the Beam TopK layer.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param max_beam_size: the top max_beam_size indices to select
+        :type max_beam_size: int
+
+        :param sorted: Whether the entries should be sorted
+        :type sorted: bool
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_beam_top_k(
+            self.handle, input.handle, max_beam_size, sorted, c_name
+        )
+        self.add_layer(OpType.BEAM_TOPK, name)
+        return Tensor(handle, owner_op_type=OpType.BEAM_TOPK)
+
+    def sampling(self, input, top_p, name=None):
+        """Defines the Sampling layer.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param top_p: The top_p parameter of the sampling
+        :type top_p: float
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_sampling(
+            self.handle, input.handle, top_p, c_name
+        )
+        self.add_layer(OpType.SAMPLING, name)
+        return Tensor(handle, owner_op_type=OpType.SAMPLING)
+
+    def argmax(self, input, beam_search, name=None):
+        """Defines the Sampling layer.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param beam_search: Whether you need to perform beam search
+        :type beam_search: bool
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_argmax(
+            self.handle, input.handle, beam_search, c_name
+        )
+        self.add_layer(OpType.ARGMAX, name)
+        return Tensor(handle, owner_op_type=OpType.ARGMAX)
+
+    def reset_metrics(self):
+        """Reset performance metrics.
+
+        :returns:  None -- no returns.
+        """
+        ffc().flexflow_model_reset_metrics(self.handle)
+
+    def init_layers(self):
+        """Initialize layers.
+
+        :returns:  None -- no returns.
+        """
+        ffc().flexflow_model_init_layers(self.handle)
+
+    def prefetch(self):
+        ffc().flexflow_model_prefetch(self.handle)
+
+    def forward(self, seq_length=None):
+        """Forward propagation of all layers.
+
+        :returns:  None -- no returns.
+        """
+        if seq_length is None:
+            seq_length = -1
+        ffc().flexflow_model_forward(self.handle, seq_length)
+
+    # TODO: seperate compute_metrics from backward
+    def backward(self, seq_length=None):
+        """Backward propagation of all layers.
+
+        :returns:  None -- no returns.
+        """
+        if seq_length is None:
+            seq_length = -1
+        ffc().flexflow_model_backward(self.handle, seq_length)
+
+    def compute_metrics(self):
+        """Compute performance metrics.
+
+        :returns:  None -- no returns.
+        """
+        ffc().flexflow_model_compute_metrics(self.handle)
+
+    def update(self):
+        """Update weights and biases of all layers.
+
+        :returns:  None -- no returns.
+        """
+        ffc().flexflow_model_update(self.handle)
+
+    def compile(self, optimizer=None, loss_type=None, metrics=None, comp_mode=None):
+        """Configure the model for trainting. FlexFlow uses lazy initialization,
+        so the actual creating of all operations (including creating and partitioning
+        of weight, bias and output tensors) happen during compile.
+
+        :param optimizer: optimizer instance.
+        :type optimizer: Optimizer
+
+        :param loss_type: Enum of LossType.
+          Options are LOSS_CATEGORICAL_CROSSENTROPY, LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+          LOSS_MEAN_SQUARED_ERROR_AVG_REDUCE and LOSS_MEAN_SQUARED_ERROR_SUM_REDUCE.
+        :type loss_type: LossType
+
+        :param metrics: List of metrics to be evaluated by the model during training and testing.
+          Each of this is a Enum of MetricsType. Options are METRICS_ACCURACY,
+          METRICS_CATEGORICAL_CROSSENTROPY, METRICS_SPARSE_CATEGORICAL_CROSSENTROPY,
+          METRICS_MEAN_SQUARED_ERROR, METRICS_ROOT_MEAN_SQUARED_ERROR, METRICS_MEAN_ABSOLUTE_ERROR
+        :type metrics: MetricsType
+
+        :param comp_mode: Enum of CompMode.
+          Options are COMP_MODE_TRAINING, COMP_MODE_INFERENCE
+        :type comp_mode: CompMode
+
+        :returns:  None -- no returns.
+        """
+        self.optimizer = optimizer
+
+        c_loss_type = enum_to_int(LossType, loss_type)
+        metrics_int = []
+        for metric in metrics:
+            metrics_int.append(enum_to_int(MetricsType, metric))
+        c_metrics = ffi.new("int[]", metrics_int)
+        if comp_mode == None:
+            comp_mode = CompMode.TRAINING
+        c_comp_mode = enum_to_int(CompMode, comp_mode)
+        ffc().flexflow_model_compile(
+            self.handle, c_loss_type, c_metrics, len(metrics), c_comp_mode
+        )
+        for ff_tensor, np_tensor in self.attr_tensors.items():
+            ff_tensor.set_tensor(self, np_tensor)
+        print("Compiled ffmodel!")
+
+    def fit(self, x=None, y=None, batch_size=None, epochs=1):
+        """Trains the model for a fixed number of epochs (iterations on a dataset).
+
+        :param x: Input data. It can be a Dataloader instance or a list of Dataloader instances.
+        :type x: Dataloader
+
+        :param y: Target data (label). It can be a Dataloader instance or a list of Dataloader instances.
+        :type y: Dataloader
+
+        :param batch_size: Number of samples per gradient update. It must be identical with :attr:`-b`
+          or :attr:`--batch-size` from the command line.
+        :type batch_size: int
+
+        :param epochs: Number of epochs to train the model.
+          An epoch is an iteration over the entire :attr:`x` and :attr:`y` data provided.
+          The default value is 1.
+        :type epochs: int
+
+        :returns:  None -- no returns.
+        """
+        if isinstance(x, list) == False:
+            dataloaders = [x]
+        else:
+            dataloaders = x
+        dataloaders.append(y)
+
+        num_samples = y.num_samples
+        batch_size = self._ffconfig.batch_size
+        self._tracing_id += 1  # get a new tracing id
+        for epoch in range(0, epochs):
+            for d in dataloaders:
+                d.reset()
+            self.reset_metrics()
+            iterations = num_samples / batch_size
+            for iter in range(0, int(iterations)):
+                self._ffconfig.begin_trace(self._tracing_id)
+                for d in dataloaders:
+                    d.next_batch(self)
+                self.forward()
+                self.zero_gradients()
+                self.backward()
+                self.update()
+                self._ffconfig.end_trace(self._tracing_id)
+
+    def eval(self, x=None, y=None, batch_size=None):
+        """Returns the loss value & metrics values for the model in test mode.
+
+        :param x: Input data. It can be a Dataloader instance or a list of Dataloader instances.
+        :type x: Dataloader
+
+        :param y: Target data (label). It can be a Dataloader instance or a list of Dataloader instances.
+        :type y: Dataloader
+
+        :param batch_size: Number of samples per gradient update. It must be identical with :attr:`-b`
+          or :attr:`--batch-size` from the command line.
+        :type batch_size: int
+
+        :param epochs: Number of epochs to train the model.
+          An epoch is an iteration over the entire :attr:`x` and :attr:`y` data provided.
+          The default value is 1.
+        :type epochs: int
+
+        :returns:  None -- no returns.
+        """
+        if isinstance(x, list) == False:
+            dataloaders = [x]
+        else:
+            dataloaders = x
+        dataloaders.append(y)
+
+        num_samples = y.num_samples
+        batch_size = self._ffconfig.batch_size
         for d in dataloaders:
-          d.next_batch(self)
-        self.forward()
-        self.zero_gradients()
-        self.backward()
-        self.update()
-        self._ffconfig.end_trace(self._tracing_id)
-          
-  def eval(self, x=None, y=None, batch_size=None):
-    """Returns the loss value & metrics values for the model in test mode. 
-             
-    :param x: Input data. It can be a Dataloader instance or a list of Dataloader instances.
-    :type x: Dataloader
-    
-    :param y: Target data (label). It can be a Dataloader instance or a list of Dataloader instances.
-    :type y: Dataloader
-    
-    :param batch_size: Number of samples per gradient update. It must be identical with :attr:`-b`
-      or :attr:`--batch-size` from the command line.
-    :type batch_size: int
-    
-    :param epochs: Number of epochs to train the model. 
-      An epoch is an iteration over the entire :attr:`x` and :attr:`y` data provided.
-      The default value is 1.
-    :type epochs: int
-             
-    :returns:  None -- no returns.
-    """
-    if (isinstance(x, list) == False):
-      dataloaders = [x]
-    else:
-      dataloaders = x
-    dataloaders.append(y)
-
-    num_samples = y.num_samples
-    batch_size = self._ffconfig.batch_size
-    for d in dataloaders:
-      d.reset()
-    self.reset_metrics()
-    iterations = num_samples / batch_size
-    self._tracing_id += 1 # get a new tracing id
-    for iter in range(0, int(iterations)):
-      for d in dataloaders:
-        d.next_batch(self)
-      self._ffconfig.begin_trace(self._tracing_id)
-      self.forward()
-      self.compute_metrics()
-      self._ffconfig.end_trace(self._tracing_id)
-
-  def zero_gradients(self):
-    """Empty the gradients of all layers.
-             
-    :returns:  None -- no returns.
-    """
-    ffc().flexflow_model_zero_gradients(self.handle)
-
-  def set_optimizer(self, optimizer):
-    if isinstance(optimizer, SGDOptimizer) == True:
-      ffc().flexflow_model_set_sgd_optimizer(self.handle, optimizer.handle)
-    elif isinstance(optimizer, AdamOptimizer) == True:
-      ffc().flexflow_model_set_adam_optimizer(self.handle, optimizer.handle)
-    elif optimizer == None:
-      pass
-    else:
-      assert 0, "[Model]: unknown optimizer"
-
-  optimizer = property(fset=set_optimizer)
-
-  def print_layers(self, id=-1):
-    ffc().flexflow_model_print_layers(self.handle, id)
-
-  def get_layer_by_id(self, layer_id):
-    return self._layers[layer_id]
-
-  def get_last_layer(self):
-    return self._layers[self._nb_layers-1]
-
-  def get_layer_by_name(self, layer_name):
-    for layer_id in self._layers:
-      layer = self._layers[layer_id]
-      if layer.name == layer_name:
-        return layer
-    assert 0, f"Cannot find the layer with name {layer_name}"
-    return None
-
-  def get_tensor_by_id(self, id):
-    handle = ffc().flexflow_model_get_parameter_by_id(self.handle, id)
-    return Parameter(handle)
-
-  @property
-  def label_tensor(self):
-    handle = ffc().flexflow_model_get_label_tensor(self.handle)
-    return Tensor(handle, deallocate=False)
-
-  def get_perf_metrics(self):
-    handle = ffc().flexflow_model_get_perf_metrics(self.handle)
-    return PerfMetrics(handle)
-  
-  def set_transformer_layer_id(self, id):
-    ffc().flexflow_model_set_transformer_layer_id(self.handle, id)
-    
-  def create_data_loader(self, batch_tensor, full_array):
-    """Create a SingleDataloader instance. 
-             
-    :param batch_tensor: a batch-sized tensor. Usually it is a input tensor of the model.  
-    :type batch_tensor: Tensor
-    
-    :param full_array: the entire data.
-    :type full_array: Numpy Array
-             
-    :returns:  SingleDataloader -- returns a dataloader instance.
-    """
-
-    if (self._ffconfig.enable_control_replication):
-      assert self._ffconfig.python_data_loader_type != 1, 'To enable control replication, please set --python-data-loader-type 2'
-      return self.__create_data_loader_ptr(batch_tensor, full_array)
-    else:
-      if (self._ffconfig.python_data_loader_type == 1):
-        return self.__create_data_loader_attach(batch_tensor, full_array)
-      else:
-        return self.__create_data_loader_ptr(batch_tensor, full_array)
-
-  def __create_data_loader_attach(self, batch_tensor, full_array):
-    full_array_shape = full_array.shape
-    num_samples = full_array_shape[0]
-    num_dim = len(full_array_shape)
-    if (full_array.dtype == "float16"):
-      datatype = DataType.DT_HALF
-    elif (full_array.dtype == "float32"):
-      datatype = DataType.DT_FLOAT
-    elif (full_array.dtype == "int32"):
-      datatype = DataType.DT_INT32
-    elif (full_array.dtype == "int64"):
-       datatype = DataType.DT_INT64
-    else:
-      assert 0, "unsupported datatype"
-
-    if (num_dim == 2):
-      full_tensor = self.create_tensor([num_samples, full_array_shape[1]], datatype)
-      self.map_tensor(full_tensor)
-    elif (num_dim == 4):
-      full_tensor = self.create_tensor([num_samples, full_array_shape[1], full_array_shape[2], full_array_shape[3]], datatype)
-      self.map_tensor(full_tensor)
-    else:
-      assert 0, "unsupported dims"
-
-    full_tensor.attach_numpy_array(self._ffconfig, full_array)
-    dataloader = SingleDataLoader(self, batch_tensor, full_tensor, num_samples, datatype)
-    full_tensor.detach_numpy_array(self._ffconfig)
-
-    return dataloader
-    
-  def __create_data_loader_ptr(self, batch_tensor, full_array):
-    full_array_shape = full_array.shape
-    num_samples = full_array_shape[0]
-    if (full_array.dtype == "float16"):
-      datatype = DataType.DT_HALF
-    elif (full_array.dtype == "float32"):
-      datatype = DataType.DT_FLOAT
-    elif (full_array.dtype == "int32"):
-      datatype = DataType.DT_INT32
-    elif (full_array.dtype == "int64"):
-       datatype = DataType.DT_INT64
-    else:
-      assert 0, "unsupported datatype"
-    np_raw_ptr = full_array.__array_interface__['data']
-    raw_ptr = ffi.cast("float*", np_raw_ptr[0])
-    print("numpy array: %s, %s, %s" % (str(np_raw_ptr), str(raw_ptr), hex(np_raw_ptr[0])))
-    dataloader = SingleDataLoader(self, batch_tensor, raw_ptr, num_samples, datatype)
-
-    return dataloader
-
-  def __get_initializer_handle(self, initializer):
-    if (initializer == None):
-      null_initializer = Initializer(None)
-      return null_initializer.handle
-    else:
-      return initializer.handle
+            d.reset()
+        self.reset_metrics()
+        iterations = num_samples / batch_size
+        self._tracing_id += 1  # get a new tracing id
+        for iter in range(0, int(iterations)):
+            for d in dataloaders:
+                d.next_batch(self)
+            self._ffconfig.begin_trace(self._tracing_id)
+            self.forward()
+            self.compute_metrics()
+            self._ffconfig.end_trace(self._tracing_id)
+
+    def zero_gradients(self):
+        """Empty the gradients of all layers.
+
+        :returns:  None -- no returns.
+        """
+        ffc().flexflow_model_zero_gradients(self.handle)
+
+    def set_optimizer(self, optimizer):
+        if isinstance(optimizer, SGDOptimizer) == True:
+            ffc().flexflow_model_set_sgd_optimizer(self.handle, optimizer.handle)
+        elif isinstance(optimizer, AdamOptimizer) == True:
+            ffc().flexflow_model_set_adam_optimizer(self.handle, optimizer.handle)
+        elif optimizer == None:
+            pass
+        else:
+            assert 0, "[Model]: unknown optimizer"
+
+    optimizer = property(fset=set_optimizer)
+
+    def print_layers(self, id=-1):
+        ffc().flexflow_model_print_layers(self.handle, id)
+
+    def get_layer_by_id(self, layer_id):
+        return self._layers[layer_id]
+
+    def get_last_layer(self):
+        return self._layers[self._nb_layers - 1]
+
+    def get_layer_by_name(self, layer_name):
+        for layer_id in self._layers:
+            layer = self._layers[layer_id]
+            if layer.name == layer_name:
+                return layer
+        assert 0, f"Cannot find the layer with name {layer_name}"
+        return None
+
+    def get_tensor_by_id(self, id):
+        handle = ffc().flexflow_model_get_parameter_by_id(self.handle, id)
+        return Parameter(handle)
+
+    @property
+    def label_tensor(self):
+        handle = ffc().flexflow_model_get_label_tensor(self.handle)
+        return Tensor(handle, deallocate=False)
+
+    def get_perf_metrics(self):
+        handle = ffc().flexflow_model_get_perf_metrics(self.handle)
+        return PerfMetrics(handle)
+
+    def set_transformer_layer_id(self, id):
+        ffc().flexflow_model_set_transformer_layer_id(self.handle, id)
+
+    def create_data_loader(self, batch_tensor, full_array):
+        """Create a SingleDataloader instance.
+
+        :param batch_tensor: a batch-sized tensor. Usually it is a input tensor of the model.
+        :type batch_tensor: Tensor
+
+        :param full_array: the entire data.
+        :type full_array: Numpy Array
+
+        :returns:  SingleDataloader -- returns a dataloader instance.
+        """
+
+        if self._ffconfig.enable_control_replication:
+            assert (
+                self._ffconfig.python_data_loader_type != 1
+            ), "To enable control replication, please set --python-data-loader-type 2"
+            return self.__create_data_loader_ptr(batch_tensor, full_array)
+        else:
+            if self._ffconfig.python_data_loader_type == 1:
+                return self.__create_data_loader_attach(batch_tensor, full_array)
+            else:
+                return self.__create_data_loader_ptr(batch_tensor, full_array)
+
+    def __create_data_loader_attach(self, batch_tensor, full_array):
+        full_array_shape = full_array.shape
+        num_samples = full_array_shape[0]
+        num_dim = len(full_array_shape)
+        if full_array.dtype == "float16":
+            datatype = DataType.DT_HALF
+        elif full_array.dtype == "float32":
+            datatype = DataType.DT_FLOAT
+        elif full_array.dtype == "int32":
+            datatype = DataType.DT_INT32
+        elif full_array.dtype == "int64":
+            datatype = DataType.DT_INT64
+        else:
+            assert 0, "unsupported datatype"
+
+        if num_dim == 2:
+            full_tensor = self.create_tensor(
+                [num_samples, full_array_shape[1]], datatype
+            )
+            self.map_tensor(full_tensor)
+        elif num_dim == 4:
+            full_tensor = self.create_tensor(
+                [
+                    num_samples,
+                    full_array_shape[1],
+                    full_array_shape[2],
+                    full_array_shape[3],
+                ],
+                datatype,
+            )
+            self.map_tensor(full_tensor)
+        else:
+            assert 0, "unsupported dims"
+
+        full_tensor.attach_numpy_array(self._ffconfig, full_array)
+        dataloader = SingleDataLoader(
+            self, batch_tensor, full_tensor, num_samples, datatype
+        )
+        full_tensor.detach_numpy_array(self._ffconfig)
+
+        return dataloader
+
+    def __create_data_loader_ptr(self, batch_tensor, full_array):
+        full_array_shape = full_array.shape
+        num_samples = full_array_shape[0]
+        if full_array.dtype == "float16":
+            datatype = DataType.DT_HALF
+        elif full_array.dtype == "float32":
+            datatype = DataType.DT_FLOAT
+        elif full_array.dtype == "int32":
+            datatype = DataType.DT_INT32
+        elif full_array.dtype == "int64":
+            datatype = DataType.DT_INT64
+        else:
+            assert 0, "unsupported datatype"
+        np_raw_ptr = full_array.__array_interface__["data"]
+        raw_ptr = ffi.cast("float*", np_raw_ptr[0])
+        print(
+            "numpy array: %s, %s, %s"
+            % (str(np_raw_ptr), str(raw_ptr), hex(np_raw_ptr[0]))
+        )
+        dataloader = SingleDataLoader(
+            self, batch_tensor, raw_ptr, num_samples, datatype
+        )
+
+        return dataloader
+
+    def __get_initializer_handle(self, initializer):
+        if initializer == None:
+            null_initializer = Initializer(None)
+            return null_initializer.handle
+        else:
+            return initializer.handle
+
+    def __get_op_handle(self, shared_op):
+        if shared_op == None:
+            op_handle = ffi.new("flexflow_op_t *")
+            op_handle.impl = ffi.NULL
+            op = Op(op_handle[0])
+        else:
+            op = shared_op
+        return op.handle
+
+    def get_output_tensor(self, ffmodel, data_type):
+        shape = self.dims
+        if data_type == DataType.DT_HALF:
+            np_array = np.empty(shape, dtype=np.float16)
+        elif data_type == DataType.DT_FLOAT:
+            np_array = np.empty(shape, dtype=np.float32)
+        elif self.data_type == DataType.DT_INT32:
+            np_array = np.empty(shape, dtype=np.int32)
+        elif self.data_type == DataType.DT_INT64:
+            np_array = np.empty(shape, dtype=np.int64)
+        else:
+            assert 0, f"Unsupported datatype: {self.data_type}"
+        np_raw_ptr = np_array.__array_interface__["data"]
+        if np_array.dtype == np.float32:
+            raw_ptr = ffi.cast("float*", np_raw_ptr[0])
+            ret_val = ffc().flexflow_tensor_get_tensor_float(
+                self.handle, ffmodel.handle, raw_ptr, False
+            )
+        elif np_array.dtype == np.int32:
+            raw_ptr = ffi.cast("int*", np_raw_ptr[0])
+            ret_val = ffc().flexflow_tensor_get_tensor_int(
+                self.handle, ffmodel.handle, raw_ptr, False
+            )
+        elif np_array.dtype == np.int64:
+            raw_ptr = ffi.cast("int64_t*", np_raw_ptr[0])
+            ret_val = ffc().flexflow_tensor_get_tensor_int64(
+                self.handle, ffmodel.handle, raw_ptr, False
+            )
+        fflogger.debug(
+            "get weights raw_ptr: %s, %s, %s, %s"
+            % (str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(shape))
+        )
+        assert ret_val == True
+        return np_array
+
+    def generate(self, prompt, max_sequence_length):
+        c_input_text = get_c_name(prompt)
+        max_num_chars = 36000
+        c_output_text = ffi.new("char[]", max_num_chars)
+        c_output_length_and_tokens = ffi.new("int[]", max_sequence_length + 100)
+        ffc().flexflow_model_generate(
+            self.handle,
+            c_input_text,
+            max_num_chars,
+            c_output_text,
+            max_sequence_length,
+            c_output_length_and_tokens,
+        )
+        output_length = c_output_length_and_tokens[0]
+        output_tokens = []
+        for i in range(output_length):
+            output_tokens.append(c_output_length_and_tokens[i + 1])
+        from flexflow.serve import GenerationResult
+
+        return GenerationResult(ffi.string(c_output_text), output_tokens)
+
+    def set_position_offset(self, offset):
+        ffc().flexflow_model_set_position_offset(self.handle, offset)
 
-  def __get_op_handle(self, shared_op):
-    if shared_op == None:
-      op_handle = ffi.new('flexflow_op_t *')
-      op_handle.impl = ffi.NULL
-      op = Op(op_handle[0])
-    else:
-      op = shared_op
-    return op.handle
-  
-  def get_output_tensor(self, ffmodel, data_type):
-    shape = self.dims
-    if data_type == DataType.DT_HALF:
-      np_array = np.empty(shape, dtype=np.float16)
-    elif data_type == DataType.DT_FLOAT:
-      np_array = np.empty(shape, dtype=np.float32)
-    elif self.data_type == DataType.DT_INT32:
-      np_array = np.empty(shape, dtype=np.int32)
-    elif self.data_type == DataType.DT_INT64:
-      np_array = np.empty(shape, dtype=np.int64)
-    else:
-      assert 0, f"Unsupported datatype: {self.data_type}"
-    np_raw_ptr = np_array.__array_interface__['data']
-    if np_array.dtype == np.float32:
-      raw_ptr = ffi.cast("float*", np_raw_ptr[0])
-      ret_val = ffc().flexflow_tensor_get_tensor_float(self.handle, ffmodel.handle, raw_ptr, False)
-    elif np_array.dtype == np.int32:
-      raw_ptr = ffi.cast("int*", np_raw_ptr[0])
-      ret_val = ffc().flexflow_tensor_get_tensor_int(self.handle, ffmodel.handle, raw_ptr, False)
-    elif np_array.dtype == np.int64:
-      raw_ptr = ffi.cast("int64_t*", np_raw_ptr[0])
-      ret_val = ffc().flexflow_tensor_get_tensor_int64(self.handle, ffmodel.handle, raw_ptr, False)
-    fflogger.debug("get weights raw_ptr: %s, %s, %s, %s" %( str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(shape)))
-    assert ret_val == True
-    return np_array   
-  
-  def generate(self, prompt, max_sequence_length):
-    c_input_text = get_c_name(prompt)
-    max_num_chars = 36000
-    c_output_text = ffi.new("char[]", max_num_chars)
-    c_output_length_and_tokens = ffi.new("int[]", max_sequence_length + 100)
-    ffc().flexflow_model_generate(self.handle, c_input_text, max_num_chars, c_output_text, max_sequence_length, c_output_length_and_tokens)
-    output_length = c_output_length_and_tokens[0]
-    output_tokens = []
-    for i in range(output_length):
-      output_tokens.append(c_output_length_and_tokens[i+1])
-    from flexflow.serve import GenerationResult
-    return GenerationResult(ffi.string(c_output_text), output_tokens)
-  
-  def set_position_offset(self, offset):
-    ffc().flexflow_model_set_position_offset(self.handle, offset)
 
 # -----------------------------------------------------------------------
 # SGDOptimizer
 # -----------------------------------------------------------------------
 
+
 class SGDOptimizer(object):
-  __slots__ = ['handle', '_handle']
-  def __init__(self, ffmodel, lr=0.01, momentum=0.0, nesterov=False, weight_decay=0.0):
-    self.handle = ffc().flexflow_sgd_optimizer_create(ffmodel.handle, lr, momentum, nesterov, weight_decay)
-    self._handle = ffi.gc(self.handle, ffc().flexflow_sgd_optimizer_destroy)
+    __slots__ = ["handle", "_handle"]
+
+    def __init__(
+        self, ffmodel, lr=0.01, momentum=0.0, nesterov=False, weight_decay=0.0
+    ):
+        self.handle = ffc().flexflow_sgd_optimizer_create(
+            ffmodel.handle, lr, momentum, nesterov, weight_decay
+        )
+        self._handle = ffi.gc(self.handle, ffc().flexflow_sgd_optimizer_destroy)
+
+    def set_learning_rate(self, learning_rate):
+        ffc().flexflow_sgd_optimizer_set_lr(self.handle, learning_rate)
 
-  def set_learning_rate(self, learning_rate):
-    ffc().flexflow_sgd_optimizer_set_lr(self.handle, learning_rate)
 
 # -----------------------------------------------------------------------
 # AdamOptimizer
 # -----------------------------------------------------------------------
 
+
 class AdamOptimizer(object):
-  __slots__ = ['handle', '_handle']
-  def __init__(self, ffmodel, alpha=0.001, beta1=0.9, beta2=0.999, weight_decay=0.0, epsilon=1e-8):
-    self.handle = ffc().flexflow_adam_optimizer_create(ffmodel.handle, alpha, beta1, beta2, weight_decay, epsilon)
-    self._handle = ffi.gc(self.handle, ffc().flexflow_adam_optimizer_destroy)
+    __slots__ = ["handle", "_handle"]
+
+    def __init__(
+        self,
+        ffmodel,
+        alpha=0.001,
+        beta1=0.9,
+        beta2=0.999,
+        weight_decay=0.0,
+        epsilon=1e-8,
+    ):
+        self.handle = ffc().flexflow_adam_optimizer_create(
+            ffmodel.handle, alpha, beta1, beta2, weight_decay, epsilon
+        )
+        self._handle = ffi.gc(self.handle, ffc().flexflow_adam_optimizer_destroy)
+
+    def set_learning_rate(self, learning_rate):
+        ffc().flexflow_adam_optimizer_set_lr(self.handle, learning_rate)
 
-  def set_learning_rate(self, learning_rate):
-    ffc().flexflow_adam_optimizer_set_lr(self.handle, learning_rate)
 
 # -----------------------------------------------------------------------
 # Initializer
 # -----------------------------------------------------------------------
 class Initializer(object):
-  __slots__ = ['handle', 'p_handle']
-  def __init__(self, handle, p_handle=0):
-    self.p_handle = ffi.new('flexflow_initializer_t *')
-    if (handle == None):
-      self.p_handle.impl = ffi.NULL
-    else:
-      self.p_handle.impl = handle.impl
-    self.handle = self.p_handle[0]
-    assert ffi.typeof(self.handle) == ffi.typeof('flexflow_initializer_t'), "Initializer handle is wrong"
+    __slots__ = ["handle", "p_handle"]
+
+    def __init__(self, handle, p_handle=0):
+        self.p_handle = ffi.new("flexflow_initializer_t *")
+        if handle == None:
+            self.p_handle.impl = ffi.NULL
+        else:
+            self.p_handle.impl = handle.impl
+        self.handle = self.p_handle[0]
+        assert ffi.typeof(self.handle) == ffi.typeof(
+            "flexflow_initializer_t"
+        ), "Initializer handle is wrong"
+
 
 # -----------------------------------------------------------------------
 # GlorotUniform
 # -----------------------------------------------------------------------
 
+
 class GlorotUniformInitializer(Initializer):
-  __slots__ = ['glorot_handle', '_glorot_handle']
-  def __init__(self, seed):
-    self.glorot_handle = ffc().flexflow_glorot_uniform_initializer_create(seed)
-    self._glorot_handle = ffi.gc(self.glorot_handle, ffc().flexflow_glorot_uniform_initializer_destroy)
-    super(GlorotUniformInitializer, self).__init__(self.glorot_handle)
+    __slots__ = ["glorot_handle", "_glorot_handle"]
+
+    def __init__(self, seed):
+        self.glorot_handle = ffc().flexflow_glorot_uniform_initializer_create(seed)
+        self._glorot_handle = ffi.gc(
+            self.glorot_handle, ffc().flexflow_glorot_uniform_initializer_destroy
+        )
+        super(GlorotUniformInitializer, self).__init__(self.glorot_handle)
+
 
 # -----------------------------------------------------------------------
 # ZeroInitializer
 # -----------------------------------------------------------------------
 
+
 class ZeroInitializer(Initializer):
-  __slots__ = ['zero_handle', '_zero_handle']
-  def __init__(self):
-    self.zero_handle = ffc().flexflow_zero_initializer_create()
-    self._zero_handle = ffi.gc(self.zero_handle, ffc().flexflow_zero_initializer_destroy)
-    super(ZeroInitializer, self).__init__(self.zero_handle)
+    __slots__ = ["zero_handle", "_zero_handle"]
+
+    def __init__(self):
+        self.zero_handle = ffc().flexflow_zero_initializer_create()
+        self._zero_handle = ffi.gc(
+            self.zero_handle, ffc().flexflow_zero_initializer_destroy
+        )
+        super(ZeroInitializer, self).__init__(self.zero_handle)
+
 
 # -----------------------------------------------------------------------
 # UniformInitializer
 # -----------------------------------------------------------------------
 
+
 class UniformInitializer(Initializer):
-  __slots__ = ['uniform_handle', '_uniform_handle']
-  def __init__(self, seed, minv, maxv):
-    self.uniform_handle = ffc().flexflow_uniform_initializer_create(seed, minv, maxv)
-    self._uniform_handle = ffi.gc(self.uniform_handle, ffc().flexflow_uniform_initializer_destroy)
-    super(UniformInitializer, self).__init__(self.uniform_handle)
+    __slots__ = ["uniform_handle", "_uniform_handle"]
+
+    def __init__(self, seed, minv, maxv):
+        self.uniform_handle = ffc().flexflow_uniform_initializer_create(
+            seed, minv, maxv
+        )
+        self._uniform_handle = ffi.gc(
+            self.uniform_handle, ffc().flexflow_uniform_initializer_destroy
+        )
+        super(UniformInitializer, self).__init__(self.uniform_handle)
+
 
 # -----------------------------------------------------------------------
 # NormInitializer
 # -----------------------------------------------------------------------
 
+
 class NormInitializer(Initializer):
-  __slots__ = ['norm_handle', '_norm_handle']
-  def __init__(self, seed, mean, stddev):
-    self.norm_handle = ffc().flexflow_norm_initializer_create(seed, mean, stddev)
-    self._norm_handle = ffi.gc(self.norm_handle, ffc().flexflow_norm_initializer_destroy)
-    super(NormInitializer, self).__init__(self.norm_handle)
+    __slots__ = ["norm_handle", "_norm_handle"]
+
+    def __init__(self, seed, mean, stddev):
+        self.norm_handle = ffc().flexflow_norm_initializer_create(seed, mean, stddev)
+        self._norm_handle = ffi.gc(
+            self.norm_handle, ffc().flexflow_norm_initializer_destroy
+        )
+        super(NormInitializer, self).__init__(self.norm_handle)
+
 
 # -----------------------------------------------------------------------
 # PerfMetrics
 # -----------------------------------------------------------------------
 
+
 class PerfMetrics(object):
-  __slots__= ['handle', '_handle']
-  def __init__(self, handle):
-    self.handle = handle
-    self._handle = ffi.gc(self.handle, ffc().flexflow_per_metrics_destroy)
+    __slots__ = ["handle", "_handle"]
+
+    def __init__(self, handle):
+        self.handle = handle
+        self._handle = ffi.gc(self.handle, ffc().flexflow_per_metrics_destroy)
+
+    def get_accuracy(self):
+        return ffc().flexflow_per_metrics_get_accuracy(self.handle)
 
-  def get_accuracy(self):
-    return ffc().flexflow_per_metrics_get_accuracy(self.handle)
 
 # -----------------------------------------------------------------------
 # NetConfig
 # -----------------------------------------------------------------------
 
+
 class NetConfig(object):
-  def __init__(self):
-    self.handle = ffc().flexflow_net_config_create()
-    self._handle = ffi.gc(self.handle, ffc().flexflow_net_config_destroy)
-    cpath = ffc().flexflow_net_config_get_dataset_path(self.handle)
-    self.dataset_path = ffi.string(cpath)
+    def __init__(self):
+        self.handle = ffc().flexflow_net_config_create()
+        self._handle = ffi.gc(self.handle, ffc().flexflow_net_config_destroy)
+        cpath = ffc().flexflow_net_config_get_dataset_path(self.handle)
+        self.dataset_path = ffi.string(cpath)
+
 
 # -----------------------------------------------------------------------
 # DLRMConfig
 # -----------------------------------------------------------------------
 
+
 class DLRMConfig(object):
-  def __init__(self):
-    self.handle = ffc().flexflow_dlrm_config_create()
-    self._handle = ffi.gc(self.handle, ffc().flexflow_dlrm_config_destroy)
+    def __init__(self):
+        self.handle = ffc().flexflow_dlrm_config_create()
+        self._handle = ffi.gc(self.handle, ffc().flexflow_dlrm_config_destroy)
+
+        cstr = ffc().flexflow_dlrm_config_get_dataset_path(self.handle)
+        self.dataset_path = ffi.string(cstr)
 
-    cstr = ffc().flexflow_dlrm_config_get_dataset_path(self.handle)
-    self.dataset_path = ffi.string(cstr)
+        cstr = ffc().flexflow_dlrm_config_get_arch_interaction_op(self.handle)
+        self.arch_interaction_op = ffi.string(cstr)
 
-    cstr = ffc().flexflow_dlrm_config_get_arch_interaction_op(self.handle)
-    self.arch_interaction_op = ffi.string(cstr)
+        self.sparse_feature_size = ffc().flexflow_dlrm_config_get_sparse_feature_size(
+            self.handle
+        )
+        self.sigmoid_bot = ffc().flexflow_dlrm_config_get_sigmoid_bot(self.handle)
+        self.sigmoid_top = ffc().flexflow_dlrm_config_get_sigmoid_top(self.handle)
+        self.embedding_bag_size = ffc().flexflow_dlrm_config_get_embedding_bag_size(
+            self.handle
+        )
+        self.loss_threshold = ffc().flexflow_dlrm_config_get_loss_threshold(self.handle)
 
-    self.sparse_feature_size = ffc().flexflow_dlrm_config_get_sparse_feature_size(self.handle)
-    self.sigmoid_bot = ffc().flexflow_dlrm_config_get_sigmoid_bot(self.handle)
-    self.sigmoid_top = ffc().flexflow_dlrm_config_get_sigmoid_top(self.handle)
-    self.embedding_bag_size = ffc().flexflow_dlrm_config_get_embedding_bag_size(self.handle)
-    self.loss_threshold = ffc().flexflow_dlrm_config_get_loss_threshold(self.handle)
+        mlp_bot_c = ffc().flexflow_dlrm_config_get_mlp_bot(self.handle)
+        self.mlp_bot = []
+        for i in range(0, mlp_bot_c[0]):
+            self.mlp_bot.append(mlp_bot_c[i + 1])
 
-    mlp_bot_c = ffc().flexflow_dlrm_config_get_mlp_bot(self.handle)
-    self.mlp_bot = []
-    for i in range(0, mlp_bot_c[0]):
-      self.mlp_bot.append(mlp_bot_c[i+1])
+        mlp_top_c = ffc().flexflow_dlrm_config_get_mlp_top(self.handle)
+        self.mlp_top = []
+        for i in range(0, mlp_top_c[0]):
+            self.mlp_top.append(mlp_top_c[i + 1])
 
-    mlp_top_c = ffc().flexflow_dlrm_config_get_mlp_top(self.handle)
-    self.mlp_top = []
-    for i in range(0, mlp_top_c[0]):
-      self.mlp_top.append(mlp_top_c[i+1])
+        embedding_size_c = ffc().flexflow_dlrm_config_get_embedding_size(self.handle)
+        self.embedding_size = []
+        for i in range(0, embedding_size_c[0]):
+            self.embedding_size.append(embedding_size_c[i + 1])
 
-    embedding_size_c = ffc().flexflow_dlrm_config_get_embedding_size(self.handle)
-    self.embedding_size = []
-    for i in range(0, embedding_size_c[0]):
-      self.embedding_size.append(embedding_size_c[i+1])
 
 # -----------------------------------------------------------------------
 # Single DataLoader
 # -----------------------------------------------------------------------
 
+
 class SingleDataLoader(object):
-  __slots__ = ['handle', '_handle']
-  def __init__(self, ffmodel, input, full_input, num_samples, data_type):
-    assert type(ffmodel) is FFModel, "SingleDataLoader ffmodel is wrong"
-    assert type(input) is Tensor, "SingleDataLoader input is wrong"
-    if type(full_input) is Tensor:
-      self.init_from_tensor(ffmodel, input, full_input, num_samples, data_type)
-    else:
-      self.init_from_ptr(ffmodel, input, full_input, num_samples, data_type)
-    self._handle = ffi.gc(self.handle, ffc().flexflow_single_dataloader_destroy)
-    
-  def init_from_tensor(self, ffmodel, input, full_input, num_samples, data_type):
-    assert type(full_input) is Tensor, "SingleDataLoader full_input is wrong"
-    c_data_type = enum_to_int(DataType, data_type)
-    self.handle = ffc().flexflow_single_dataloader_create(ffmodel.handle, input.handle, full_input.handle, num_samples, c_data_type)
-    
-  def init_from_ptr(self, ffmodel, input, full_input, num_samples, data_type):
-    # assert type(full_input) is Tensor, "SingleDataLoader full_input is wrong"
-    c_data_type = enum_to_int(DataType, data_type)
-    self.handle = ffc().flexflow_single_dataloader_create2(ffmodel.handle, input.handle, full_input, num_samples, c_data_type)
-
-  @property
-  def num_samples(self):
-    return ffc().flexflow_single_dataloader_get_num_samples(self.handle)
-
-  @num_samples.setter
-  def num_samples(self, samples):
-    ffc().flexflow_single_dataloader_set_num_samples(self.handle, samples)
-
-  def next_batch(self, ffmodel):
-    """Ask the dataloder to load the next batch to the :attr:`batch_tensor`. 
-             
-    :returns:  None -- no returns.
-    """
-    ffc().flowflow_single_dataloader_next_batch(self.handle, ffmodel.handle)
-
-  def reset(self):
-    """Reset the current position of the dataloder to 0. 
-             
-    :returns:  None -- no returns.
-    """
-    ffc().flexflow_single_dataloader_reset(self.handle)
+    __slots__ = ["handle", "_handle"]
+
+    def __init__(self, ffmodel, input, full_input, num_samples, data_type):
+        assert type(ffmodel) is FFModel, "SingleDataLoader ffmodel is wrong"
+        assert type(input) is Tensor, "SingleDataLoader input is wrong"
+        if type(full_input) is Tensor:
+            self.init_from_tensor(ffmodel, input, full_input, num_samples, data_type)
+        else:
+            self.init_from_ptr(ffmodel, input, full_input, num_samples, data_type)
+        self._handle = ffi.gc(self.handle, ffc().flexflow_single_dataloader_destroy)
+
+    def init_from_tensor(self, ffmodel, input, full_input, num_samples, data_type):
+        assert type(full_input) is Tensor, "SingleDataLoader full_input is wrong"
+        c_data_type = enum_to_int(DataType, data_type)
+        self.handle = ffc().flexflow_single_dataloader_create(
+            ffmodel.handle, input.handle, full_input.handle, num_samples, c_data_type
+        )
+
+    def init_from_ptr(self, ffmodel, input, full_input, num_samples, data_type):
+        # assert type(full_input) is Tensor, "SingleDataLoader full_input is wrong"
+        c_data_type = enum_to_int(DataType, data_type)
+        self.handle = ffc().flexflow_single_dataloader_create2(
+            ffmodel.handle, input.handle, full_input, num_samples, c_data_type
+        )
+
+    @property
+    def num_samples(self):
+        return ffc().flexflow_single_dataloader_get_num_samples(self.handle)
+
+    @num_samples.setter
+    def num_samples(self, samples):
+        ffc().flexflow_single_dataloader_set_num_samples(self.handle, samples)
+
+    def next_batch(self, ffmodel):
+        """Ask the dataloder to load the next batch to the :attr:`batch_tensor`.
+
+        :returns:  None -- no returns.
+        """
+        ffc().flowflow_single_dataloader_next_batch(self.handle, ffmodel.handle)
+
+    def reset(self):
+        """Reset the current position of the dataloder to 0.
+
+        :returns:  None -- no returns.
+        """
+        ffc().flexflow_single_dataloader_reset(self.handle)
+
 
 class RegionNdarray(object):
-  __slots__ = ['__array_interface__']
-  def __init__(self, shape, data_type, base_ptr, strides, read_only):
-    # See: https://docs.scipy.org/doc/numpy/reference/arrays.interface.html
-    if (data_type == DataType.DT_HALF):
-      field_type = "<f2" 
-    elif (data_type == DataType.DT_FLOAT):
-      field_type = "<f4"
-    elif (data_type == DataType.DT_INT32):
-      field_type = "<i4"
-    else:
-      assert 0, "unknown data type"
-      field_type = "<f4"
-    self.__array_interface__ = {
-      'version': 3,
-      'shape': shape,
-      'typestr': field_type,
-      'data': (base_ptr, read_only),
-      'strides': strides,
-    }
+    __slots__ = ["__array_interface__"]
+
+    def __init__(self, shape, data_type, base_ptr, strides, read_only):
+        # See: https://docs.scipy.org/doc/numpy/reference/arrays.interface.html
+        if data_type == DataType.DT_HALF:
+            field_type = "<f2"
+        elif data_type == DataType.DT_FLOAT:
+            field_type = "<f4"
+        elif data_type == DataType.DT_INT32:
+            field_type = "<i4"
+        else:
+            assert 0, "unknown data type"
+            field_type = "<f4"
+        self.__array_interface__ = {
+            "version": 3,
+            "shape": shape,
+            "typestr": field_type,
+            "data": (base_ptr, read_only),
+            "strides": strides,
+        }
+
 
 # -----------------------------------------------------------------------
 # BatchConfig
 # -----------------------------------------------------------------------
 
+
 class BatchConfig(object):
-  __slots__ = ['handle', '_handle']
-  def __init__(self):
-    self.handle = ffc().flexflow_batch_config_create()
-    self._handle = ffi.gc(self.handle, ffc().flexflow_batch_config_destroy)
+    __slots__ = ["handle", "_handle"]
+
+    def __init__(self):
+        self.handle = ffc().flexflow_batch_config_create()
+        self._handle = ffi.gc(self.handle, ffc().flexflow_batch_config_destroy)
+
 
 # -----------------------------------------------------------------------
 # TreeVerifyBatchConfig
 # -----------------------------------------------------------------------
 
+
 class TreeVerifyBatchConfig(object):
-  __slots__ = ['handle', '_handle']
-  def __init__(self):
-    self.handle = ffc().flexflow_tree_verify_batch_config_create()
-    self._handle = ffi.gc(self.handle, ffc().flexflow_tree_verify_batch_config_destroy)
+    __slots__ = ["handle", "_handle"]
+
+    def __init__(self):
+        self.handle = ffc().flexflow_tree_verify_batch_config_create()
+        self._handle = ffi.gc(
+            self.handle, ffc().flexflow_tree_verify_batch_config_destroy
+        )
+
 
 # -----------------------------------------------------------------------
 # BeamSearchBatchConfig
 # -----------------------------------------------------------------------
 
+
 class BatchConfig(object):
-  __slots__ = ['handle', '_handle']
-  def __init__(self):
-    self.handle = ffc().flexflow_beam_search_batch_config_create()
-    self._handle = ffi.gc(self.handle, ffc().flexflow_beam_search_batch_config_destroy)
+    __slots__ = ["handle", "_handle"]
+
+    def __init__(self):
+        self.handle = ffc().flexflow_beam_search_batch_config_create()
+        self._handle = ffi.gc(
+            self.handle, ffc().flexflow_beam_search_batch_config_destroy
+        )
+
 
 # -----------------------------------------------------------------------
 # RequestManager
 # -----------------------------------------------------------------------
 
+
 class RequestManager(object):
-  __slots__ = ['handle']
-  def __init__(self):
-    self.handle = ffc().flexflow_request_manager_get_request_manager()
-    #self._handle = ffi.gc(self.handle, ffc().flexflow_request_manager_destroy)
-
-  def register_tokenizer(self, model_type, bos_token_id, eos_token_id, tokenizer_filepath):
-    c_model_type = enum_to_int(ModelType, model_type)
-    c_tokenizer_filepath = get_c_name(tokenizer_filepath)
-    return ffc().flexflow_request_manager_register_tokenizer(self.handle, c_model_type, bos_token_id, eos_token_id, c_tokenizer_filepath)
-  
-  def register_output_filepath(self, output_filepath):
-    c_output_filepath = get_c_name(output_filepath)
-    return ffc().flexflow_request_manager_register_output_filepath(self.handle, c_output_filepath)
-
-  def register_ssm_model(self, model):
-    return ffc().flexflow_request_manager_register_ssm_model(self.handle, model.handle)
-  
+    __slots__ = ["handle"]
+
+    def __init__(self):
+        self.handle = ffc().flexflow_request_manager_get_request_manager()
+        # self._handle = ffi.gc(self.handle, ffc().flexflow_request_manager_destroy)
+
+    def register_tokenizer(
+        self, model_type, bos_token_id, eos_token_id, tokenizer_filepath
+    ):
+        c_model_type = enum_to_int(ModelType, model_type)
+        c_tokenizer_filepath = get_c_name(tokenizer_filepath)
+        return ffc().flexflow_request_manager_register_tokenizer(
+            self.handle, c_model_type, bos_token_id, eos_token_id, c_tokenizer_filepath
+        )
+
+    def register_output_filepath(self, output_filepath):
+        c_output_filepath = get_c_name(output_filepath)
+        return ffc().flexflow_request_manager_register_output_filepath(
+            self.handle, c_output_filepath
+        )
+
+    def register_ssm_model(self, model):
+        return ffc().flexflow_request_manager_register_ssm_model(
+            self.handle, model.handle
+        )
+
+
 # -----------------------------------------------------------------------
 # InferenceManager
 # -----------------------------------------------------------------------
 
+
 class InferenceManager(object):
-  __slots__ = ['handle']
-  def __init__(self):
-    self.handle = ffc().flexflow_inference_manager_get_inference_manager()
-    #self._handle = ffi.gc(self.handle, ffc().flexflow_inference_manager_destroy)
+    __slots__ = ["handle"]
+
+    def __init__(self):
+        self.handle = ffc().flexflow_inference_manager_get_inference_manager()
+        # self._handle = ffi.gc(self.handle, ffc().flexflow_inference_manager_destroy)
 
-  def compile_model_and_allocate_buffer(self, model):
-    ffc().flexflow_inference_manager_compile_model_and_allocate_buffer(self.handle, model.handle)
+    def compile_model_and_allocate_buffer(self, model):
+        ffc().flexflow_inference_manager_compile_model_and_allocate_buffer(
+            self.handle, model.handle
+        )
+
+    def init_operators_inference(self, model):
+        ffc().flexflow_inference_manager_init_operators_inference(
+            self.handle, model.handle
+        )
 
-  def init_operators_inference(self, model):
-    ffc().flexflow_inference_manager_init_operators_inference(self.handle, model.handle)
 
 # -----------------------------------------------------------------------
 # FileDataLoader
 # -----------------------------------------------------------------------
 
+
 class FileDataLoader(object):
-  __slots__ = ['handle', '_handle']
-  def __init__(self, weight_file_path, num_q_heads, num_kv_heads, hidden_dim, qkv_inner_dim, tensor_parallelism_degree):
-    c_weight_file_path = get_c_name(weight_file_path)
-    self.handle = ffc().flexflow_file_data_loader_create(c_weight_file_path, num_q_heads, num_kv_heads, hidden_dim, qkv_inner_dim, tensor_parallelism_degree)
-    self._handle = ffi.gc(self.handle, ffc().flexflow_file_data_loader_destroy)
-  
-  def load_weights(self, model, data_type):
-    # Check data type and create use_full_precision boolean
-    assert(data_type == DataType.DT_FLOAT or data_type == DataType.DT_HALF)
-    use_full_precision = data_type == DataType.DT_FLOAT
-    ffc().flexflow_file_data_loader_load_weights(self.handle, model.handle, use_full_precision)
+    __slots__ = ["handle", "_handle"]
+
+    def __init__(
+        self,
+        weight_file_path,
+        num_q_heads,
+        num_kv_heads,
+        hidden_dim,
+        qkv_inner_dim,
+        tensor_parallelism_degree,
+    ):
+        c_weight_file_path = get_c_name(weight_file_path)
+        self.handle = ffc().flexflow_file_data_loader_create(
+            c_weight_file_path,
+            num_q_heads,
+            num_kv_heads,
+            hidden_dim,
+            qkv_inner_dim,
+            tensor_parallelism_degree,
+        )
+        self._handle = ffi.gc(self.handle, ffc().flexflow_file_data_loader_destroy)
+
+    def load_weights(self, model, data_type):
+        # Check data type and create use_full_precision boolean
+        assert data_type == DataType.DT_FLOAT or data_type == DataType.DT_HALF
+        use_full_precision = data_type == DataType.DT_FLOAT
+        ffc().flexflow_file_data_loader_load_weights(
+            self.handle, model.handle, use_full_precision
+        )
diff --git a/python/flexflow/serve/models/falcon.py b/python/flexflow/serve/models/falcon.py
index 6e161f8bf7..3d61349d67 100644
--- a/python/flexflow/serve/models/falcon.py
+++ b/python/flexflow/serve/models/falcon.py
@@ -107,13 +107,25 @@ def build_model(self):
         for i in range(self.falcon_config.n_layer):
             ffmodel.set_transformer_layer_id(i)
 
-            att_norm = ffmodel.layer_norm(
-                token,
-                axes,
-                True,
-                self.falcon_config.layer_norm_epsilon,
-                name=f"layers_{i}_input_layernorm",
-            )
+            if i == 0:
+                att_norm = ffmodel.layer_norm(
+                    token,
+                    axes,
+                    True,
+                    self.falcon_config.layer_norm_epsilon,
+                    name=f"layers_{i}_input_layernorm",
+                )
+            else:
+                token, att_norm = ffmodel.residual_layer_norm(
+                    token,
+                    mha,
+                    mlp_output,
+                    True,
+                    axes,
+                    True,
+                    self.falcon_config.layer_norm_epsilon,
+                    name=f"layers_{i}_input_layernorm",
+                )
 
             if self.mode == InferenceMode.BEAM_SEARCH_MODE:
                 mha = ffmodel.spec_inc_multiquery_self_attention(
@@ -185,11 +197,15 @@ def build_model(self):
                 name=f"layers_{i}_mlp_dense_4h_to_h",
             )
 
-            token = ffmodel.add(token, mha)
-            token = ffmodel.add(token, mlp_output)
-
-        ln_f = ffmodel.layer_norm(
-            token, axes, True, self.falcon_config.layer_norm_epsilon, name="ln_f"
+        _, ln_f = ffmodel.residual_layer_norm(
+            token,
+            mha,
+            mlp_output,
+            True,
+            axes,
+            True,
+            self.falcon_config.layer_norm_epsilon,
+            name="ln_f",
         )
         lm_head = ffmodel.dense(
             ln_f,
diff --git a/python/flexflow/serve/models/llama.py b/python/flexflow/serve/models/llama.py
index 5bf302f895..b8ea85b287 100644
--- a/python/flexflow/serve/models/llama.py
+++ b/python/flexflow/serve/models/llama.py
@@ -103,12 +103,21 @@ def build_model(self):
         for i in range(self.llama_config.num_hidden_layers):
             ffmodel.set_transformer_layer_id(i)
 
-            attn_norm = ffmodel.rms_norm(
-                token,
-                self.llama_config.rms_norm_eps,
-                self.llama_config.hidden_size,
-                name=f"layers_{i}_attention_norm",
-            )
+            if i == 0:
+                attn_norm = ffmodel.rms_norm(
+                    token,
+                    self.llama_config.rms_norm_eps,
+                    self.llama_config.hidden_size,
+                    name=f"layers_{i}_attention_norm",
+                )
+            else:
+                token, attn_norm = ffmodel.residual_rms_norm(
+                    token,
+                    w2,
+                    self.llama_config.rms_norm_eps,
+                    self.llama_config.hidden_size,
+                    name=f"layers_{i}_attention_norm",
+                )
 
             if self.mode == InferenceMode.BEAM_SEARCH_MODE:
                 mha = ffmodel.spec_inc_multiquery_self_attention(
@@ -199,10 +208,10 @@ def build_model(self):
                 False,
                 name=f"layers_{i}_feed_forward_w2",
             )
-            token = ffmodel.add(token, w2)
 
-        token = ffmodel.rms_norm(
+        _, token = ffmodel.residual_rms_norm(
             token,
+            w2,
             self.llama_config.rms_norm_eps,
             self.llama_config.hidden_size,
             name="norm",
diff --git a/python/flexflow/serve/models/mpt.py b/python/flexflow/serve/models/mpt.py
index 8487a42c2a..6e1ca9fdfa 100644
--- a/python/flexflow/serve/models/mpt.py
+++ b/python/flexflow/serve/models/mpt.py
@@ -97,15 +97,28 @@ def build_model(self):
 
         for i in range(self.mpt_config.n_layers):
             ffmodel.set_transformer_layer_id(i)
-            residual = hidden_states
-            layernorm_output = ffmodel.layer_norm(
-                hidden_states,
-                axes,
-                True,
-                1e-05,
-                False,
-                name=f"layers_{i}_norm_1",
-            )
+
+            if i == 0:
+                layernorm_output = ffmodel.layer_norm(
+                    hidden_states,
+                    axes,
+                    True,
+                    1e-05,
+                    False,
+                    name=f"layers_{i}_norm_1",
+                )
+            else:
+                hidden_states, layernorm_output = ffmodel.residual_layer_norm(
+                    intermediate_output,
+                    hidden_states,
+                    None,
+                    False,
+                    axes,
+                    True,
+                    1e-05,
+                    False,
+                    name=f"layers_{i}_norm_1",
+                )
 
             if self.mode == InferenceMode.BEAM_SEARCH_MODE:
                 attn_outputs = ffmodel.spec_inc_multihead_self_attention(
@@ -173,19 +186,18 @@ def build_model(self):
             else:
                 assert False
 
-            hidden_states = ffmodel.add(attn_outputs, residual)
-
-            layernorm_output = ffmodel.layer_norm(
+            hidden_states, layernorm_output = ffmodel.residual_layer_norm(
+                attn_outputs,
                 hidden_states,
+                None,
+                False,
                 axes,
                 True,
                 1e-05,
                 False,
                 name=f"layers_{i}_norm_2",
             )
-            residual = hidden_states
             # mlp
-
             layernorm_output = ffmodel.dense(
                 layernorm_output,
                 4 * self.mpt_config.hidden_size,
@@ -201,10 +213,12 @@ def build_model(self):
                 False,
                 name=f"layers_{i}_ffn_down_proj",
             )
-            hidden_states = ffmodel.add(intermediate_output, residual)
 
-        all_final_norm = ffmodel.layer_norm(
+        _, all_final_norm = ffmodel.residual_layer_norm(
+            intermediate_output,
             hidden_states,
+            None,
+            False,
             axes,
             True,
             1e-05,
diff --git a/python/flexflow/serve/models/opt.py b/python/flexflow/serve/models/opt.py
index 5c7fff2dfe..639be2d5c4 100644
--- a/python/flexflow/serve/models/opt.py
+++ b/python/flexflow/serve/models/opt.py
@@ -113,8 +113,6 @@ def build_model(self):
             name="embed_positions",
         )
 
-        residual = ffmodel.add(token, positional_embedding)
-
         axes = [
             0,
         ]
@@ -123,15 +121,19 @@ def build_model(self):
             ffmodel.set_transformer_layer_id(i)
 
             if self.opt_config.do_layer_norm_before:
-                hidden_states = ffmodel.layer_norm(
-                    residual,
+                residual, hidden_states = ffmodel.residual_layer_norm(
+                    token if i == 0 else residual,
+                    positional_embedding if i == 0 else fc2,
+                    None,
+                    False,
                     axes,
                     self.opt_config.layer_norm_elementwise_affine,
                     1e-05,
                     name=f"layers_{i}_attention_layer_norm",
                 )
             else:
-                hidden_states = residual
+                hidden_states = ffmodel.add(token, positional_embedding)
+                residual = hidden_states
 
             if self.mode == InferenceMode.BEAM_SEARCH_MODE:
                 mha = ffmodel.spec_inc_multihead_self_attention(
@@ -224,19 +226,24 @@ def build_model(self):
                 True,
                 name=f"layers_{i}_fc2",
             )
-            residual = ffmodel.add(residual, fc2)
 
             if not self.opt_config.do_layer_norm_before:
-                residual = ffmodel.layer_norm(
+                _, residual = ffmodel.residual_layer_norm(
                     residual,
+                    fc2,
+                    None,
+                    False,
                     axes,
                     self.opt_config.layer_norm_elementwise_affine,
                     1e-05,
                     name=f"layers_{i}_final_layer_norm",
                 )
 
-        all_final_norm = ffmodel.layer_norm(
+        _, all_final_norm = ffmodel.residual_layer_norm(
             residual,
+            fc2,
+            None,
+            False,
             axes,
             self.opt_config.layer_norm_elementwise_affine,
             1e-05,
diff --git a/python/flexflow/serve/models/starcoder.py b/python/flexflow/serve/models/starcoder.py
index 6a80a31514..feb5be7d75 100644
--- a/python/flexflow/serve/models/starcoder.py
+++ b/python/flexflow/serve/models/starcoder.py
@@ -122,16 +122,18 @@ def build_model(self):
             name="transformer_wpe",
         )
 
-        hidden_states = ffmodel.add(token, positional_embedding)
-
         axes = [
             0,
         ]
 
         for i in range(self.starcoder_config.num_hidden_layers):
             ffmodel.set_transformer_layer_id(i)
-            ln_1 = ffmodel.layer_norm(
-                hidden_states,
+
+            hidden_states, ln_1 = ffmodel.residual_layer_norm(
+                token if i == 0 else residual,
+                positional_embedding if i == 0 else c_proj,
+                None,
+                False,
                 axes,
                 True,
                 self.starcoder_config.layer_norm_epsilon,
@@ -158,9 +160,11 @@ def build_model(self):
                 name=f"layers_{i}_attention",
             )
 
-            residual = ffmodel.add(mha, hidden_states)
-
-            l2_norm = ffmodel.layer_norm(
+            residual, l2_norm = ffmodel.residual_layer_norm(
+                hidden_states,
+                mha,
+                None,
+                False,
                 residual,
                 axes,
                 True,
@@ -185,10 +189,12 @@ def build_model(self):
                 True,
                 name=f"layers_{i}_mlp_c_proj",
             )
-            hidden_states = ffmodel.add(residual, c_proj)
 
-        ln_f = ffmodel.layer_norm(
-            hidden_states,
+        _, ln_f = ffmodel.residual_layer_norm(
+            residual,
+            c_proj,
+            None,
+            False,
             axes,
             True,
             self.starcoder_config.layer_norm_epsilon,
diff --git a/python/flexflow/type.py b/python/flexflow/type.py
index ec8a6bc432..9caecdde54 100644
--- a/python/flexflow/type.py
+++ b/python/flexflow/type.py
@@ -151,6 +151,7 @@ class OpType(Enum):
     ADD_BIAS_RESIDUAL_LAYERNORM = 2303
     SIGMOID_SILU_MULTI = 2304
     RESIDUAL_RMS_NORM = 2305
+    RESIDUAL_LAYERNORM = 2306
 
 
 def enum_to_int(enum, enum_item):
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index fcdae9cf33..3684725c0a 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -638,6 +638,65 @@ flexflow_tensor_t flexflow_model_add_layer_norm(flexflow_model_t handle_,
   return FFCObjectWrapper::wrap(tensor);
 }
 
+flexflow_tensor_t *
+    flexflow_model_add_residual_layer_norm(flexflow_model_t handle_,
+                                           const flexflow_tensor_t input_,
+                                           const flexflow_tensor_t residual1_,
+                                           const flexflow_tensor_t residual2_,
+                                           bool use_two_residuals,
+                                           int n,
+                                           int *axes,
+                                           bool elementwise_affine,
+                                           float eps,
+                                           bool use_bias,
+                                           char const *name) {
+  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
+  const Tensor input = FFCObjectWrapper::unwrap(input_);
+  const Tensor residual1 = FFCObjectWrapper::unwrap(residual1_);
+  const Tensor residual2 =
+      use_two_residuals ? FFCObjectWrapper::unwrap(residual2_) : nullptr;
+  Tensor tensor_outputs[2];
+  std::vector<int> axes_vec;
+  for (int i = 0; i < n; i++) {
+    axes_vec.push_back(axes[i]);
+  }
+  if (use_two_residuals) {
+    assert(residual2 != nullptr);
+  }
+  handle->residual_layer_norm(input,
+                              residual1,
+                              residual2,
+                              tensor_outputs,
+                              use_two_residuals,
+                              axes_vec,
+                              elementwise_affine,
+                              eps,
+                              use_bias,
+                              input->data_type,
+                              name);
+  assert(tensor_outputs[0] != nullptr);
+  assert(tensor_outputs[1] != nullptr);
+  DEBUG_PRINT("[ResidualLayerNorm] input %p, residual1 %p, residual2 "
+              "%p, output0: %p, "
+              "output1: %p, use_two_residuals: %d, elementwise_affine %d, eps "
+              "%f, use_bias: %d, name %s",
+              input,
+              residual1,
+              residual2,
+              tensor_outputs[0],
+              tensor_outputs[1],
+              use_two_residuals,
+              elementwise_affine,
+              eps,
+              use_bias,
+              name);
+  flexflow_tensor_t *tensor_outputs_wrapped =
+      (flexflow_tensor_t *)calloc(2, sizeof(flexflow_tensor_t));
+  tensor_outputs_wrapped[0] = FFCObjectWrapper::wrap(tensor_outputs[0]);
+  tensor_outputs_wrapped[1] = FFCObjectWrapper::wrap(tensor_outputs[1]);
+  return tensor_outputs_wrapped;
+}
+
 flexflow_tensor_t *flexflow_model_add_add_bias_residual_layer_norm(
     flexflow_model_t handle_,
     const flexflow_tensor_t input_,
@@ -667,16 +726,16 @@ flexflow_tensor_t *flexflow_model_add_add_bias_residual_layer_norm(
                                        name);
   assert(tensor_outputs[0] != nullptr);
   assert(tensor_outputs[1] != nullptr);
-  DEBUG_PRINT("[LayerNorm] new Tensor %p, input %p, residual %p, output0: %p, "
+  DEBUG_PRINT("[AddBiasResidualLayerNorm] input %p, residual %p, output0: %p, "
               "output1: %p, elementwise_affine %d, eps "
-              "%f, name %s",
-              tensor,
+              "%f, use_bias %d, name %s",
               input,
               residual,
               tensor_outputs[0],
               tensor_outputs[1],
               elementwise_affine,
               eps,
+              use_bias,
               name);
   flexflow_tensor_t *tensor_outputs_wrapped =
       (flexflow_tensor_t *)calloc(2, sizeof(flexflow_tensor_t));
diff --git a/src/ops/add_bias_residual_layer_norm.cu b/src/ops/add_bias_residual_layer_norm.cu
index 9ac440080f..626e56d64f 100644
--- a/src/ops/add_bias_residual_layer_norm.cu
+++ b/src/ops/add_bias_residual_layer_norm.cu
@@ -217,8 +217,8 @@ void AddBiasResidualLayerNorm::inference_kernel_wrapper(
         residual.get_float_ptr(),
         added_output.get_float_ptr(),
         output.get_float_ptr(),
-        gamma.get_float_ptr(),
-        m->use_bias ? beta.get_float_ptr() : nullptr,
+        m->elementwise_affine ? gamma.get_float_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta.get_float_ptr() : nullptr,
         stream);
   } else if (m->input_type[0] == DT_HALF) {
     AddBiasResidualLayerNorm::inference_kernel<half>(
@@ -230,8 +230,8 @@ void AddBiasResidualLayerNorm::inference_kernel_wrapper(
         residual.get_half_ptr(),
         added_output.get_half_ptr(),
         output.get_half_ptr(),
-        gamma.get_half_ptr(),
-        m->use_bias ? beta.get_half_ptr() : nullptr,
+        m->elementwise_affine ? gamma.get_half_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta.get_half_ptr() : nullptr,
         stream);
   } else {
     assert(false && "unsupport datatype in layernorm");
diff --git a/src/ops/fused.cpp b/src/ops/fused.cpp
index f865c6dd2a..3282bc57d9 100644
--- a/src/ops/fused.cpp
+++ b/src/ops/fused.cpp
@@ -37,6 +37,7 @@
 #include "flexflow/ops/kernels/softmax_kernels.h"
 #include "flexflow/ops/kernels/transpose_kernels.h"
 #include "flexflow/ops/layer_norm.h"
+#include "flexflow/ops/residual_layer_norm.h"
 #include "flexflow/ops/sigmoid_silu_multi.h"
 #include "flexflow/ops/spec_inc_multihead_self_attention.h"
 #include "flexflow/ops/tree_inc_multihead_self_attention.h"
@@ -475,6 +476,11 @@ __host__ void FusedOp::forward_task(Task const *task,
             m, my_input_accessor[0], my_output_accessor[0], gamma, beta);
         break;
       }
+      case OP_RESIDUAL_LAYERNORM: {
+        assert(false && "Operator ResidualLayerNorm does not support "
+                        "the forward() task");
+        break;
+      }
       case OP_ADD_BIAS_RESIDUAL_LAYERNORM: {
         assert(false && "Operator AddBiasResidualLayerNorm does not support "
                         "the forward() task");
@@ -928,6 +934,45 @@ __host__ void
             m, my_input_accessor[0], my_output_accessor[0], gamma, beta);
         break;
       }
+      case OP_RESIDUAL_LAYERNORM: {
+        assert(fused->op_num_outputs[op] == 2);
+        ResidualLayerNormMeta const *m =
+            (ResidualLayerNormMeta *)metas->meta[op];
+        if (m->use_two_residuals) {
+          assert(fused->op_num_inputs[op] == 3);
+        } else {
+          assert(fused->op_num_inputs[op] == 2);
+        }
+        if (!m->elementwise_affine) {
+          assert(fused->op_num_weights[op] == 0);
+        } else {
+          if (!m->use_bias) {
+            assert(fused->op_num_weights[op] == 1); // weight
+          } else {
+            assert(fused->op_num_weights[op] == 2); // weight + bias
+          }
+        }
+        GenericTensorAccessorR residual2;
+        if (m->use_two_residuals) {
+          residual2 = my_input_accessor[2];
+        }
+        GenericTensorAccessorR gamma, beta;
+        if (m->elementwise_affine) {
+          gamma = my_weight_accessor[0];
+          if (m->use_bias) {
+            beta = my_weight_accessor[1];
+          }
+        }
+        ResidualLayerNorm::inference_kernel_wrapper(m,
+                                                    my_input_accessor[0],
+                                                    my_input_accessor[1],
+                                                    residual2,
+                                                    my_output_accessor[0],
+                                                    my_output_accessor[1],
+                                                    gamma,
+                                                    beta);
+        break;
+      }
       case OP_ADD_BIAS_RESIDUAL_LAYERNORM: {
         assert(fused->op_num_inputs[op] == 2);
         assert(fused->op_num_outputs[op] == 2);
diff --git a/src/ops/fused.cu b/src/ops/fused.cu
index 13927e8ee6..5f2874e662 100644
--- a/src/ops/fused.cu
+++ b/src/ops/fused.cu
@@ -37,6 +37,7 @@
 #include "flexflow/ops/kernels/softmax_kernels.h"
 #include "flexflow/ops/kernels/transpose_kernels.h"
 #include "flexflow/ops/layer_norm.h"
+#include "flexflow/ops/residual_layer_norm.h"
 #include "flexflow/ops/sigmoid_silu_multi.h"
 #include "flexflow/ops/spec_inc_multihead_self_attention.h"
 #include "flexflow/ops/tree_inc_multihead_self_attention.h"
@@ -488,6 +489,11 @@ __host__ void FusedOp::forward_task(Task const *task,
             m, my_input_accessor[0], my_output_accessor[0], gamma, beta);
         break;
       }
+      case OP_RESIDUAL_LAYERNORM: {
+        assert(false && "Operator ResidualLayerNorm does not support "
+                        "the forward() task");
+        break;
+      }
       case OP_ADD_BIAS_RESIDUAL_LAYERNORM: {
         assert(false && "Operator AddBiasResidualLayerNorm does not support "
                         "the forward() task");
@@ -959,6 +965,45 @@ __host__ void
             m, my_input_accessor[0], my_output_accessor[0], gamma, beta);
         break;
       }
+      case OP_RESIDUAL_LAYERNORM: {
+        assert(fused->op_num_outputs[op] == 2);
+        ResidualLayerNormMeta const *m =
+            (ResidualLayerNormMeta *)metas->meta[op];
+        if (m->use_two_residuals) {
+          assert(fused->op_num_inputs[op] == 3);
+        } else {
+          assert(fused->op_num_inputs[op] == 2);
+        }
+        if (!m->elementwise_affine) {
+          assert(fused->op_num_weights[op] == 0);
+        } else {
+          if (!m->use_bias) {
+            assert(fused->op_num_weights[op] == 1); // weight
+          } else {
+            assert(fused->op_num_weights[op] == 2); // weight + bias
+          }
+        }
+        GenericTensorAccessorR residual2;
+        if (m->use_two_residuals) {
+          residual2 = my_input_accessor[2];
+        }
+        GenericTensorAccessorR gamma, beta;
+        if (m->elementwise_affine) {
+          gamma = my_weight_accessor[0];
+          if (m->use_bias) {
+            beta = my_weight_accessor[1];
+          }
+        }
+        ResidualLayerNorm::inference_kernel_wrapper(m,
+                                                    my_input_accessor[0],
+                                                    my_input_accessor[1],
+                                                    residual2,
+                                                    my_output_accessor[0],
+                                                    my_output_accessor[1],
+                                                    gamma,
+                                                    beta);
+        break;
+      }
       case OP_ADD_BIAS_RESIDUAL_LAYERNORM: {
         assert(fused->op_num_inputs[op] == 2);
         assert(fused->op_num_outputs[op] == 2);
diff --git a/src/ops/layer_norm.cu b/src/ops/layer_norm.cu
index 4d04710b2a..12751113a2 100644
--- a/src/ops/layer_norm.cu
+++ b/src/ops/layer_norm.cu
@@ -257,20 +257,21 @@ void LayerNorm::forward_kernel_wrapper(LayerNormMeta const *m,
     cudaEventRecord(t_start, stream);
   }
   if (m->input_type[0] == DT_FLOAT) {
-    LayerNorm::forward_kernel<float>(m,
-                                     input.get_float_ptr(),
-                                     output.get_float_ptr(),
-                                     gamma.get_float_ptr(),
-                                     m->use_bias ? beta.get_float_ptr()
-                                                 : nullptr,
-                                     stream);
+    LayerNorm::forward_kernel<float>(
+        m,
+        input.get_float_ptr(),
+        output.get_float_ptr(),
+        m->elementwise_affine ? gamma.get_float_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta.get_float_ptr() : nullptr,
+        stream);
   } else if (m->input_type[0] == DT_HALF) {
-    LayerNorm::forward_kernel<half>(m,
-                                    input.get_half_ptr(),
-                                    output.get_half_ptr(),
-                                    gamma.get_half_ptr(),
-                                    m->use_bias ? beta.get_half_ptr() : nullptr,
-                                    stream);
+    LayerNorm::forward_kernel<half>(
+        m,
+        input.get_half_ptr(),
+        output.get_half_ptr(),
+        m->elementwise_affine ? gamma.get_half_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta.get_half_ptr() : nullptr,
+        stream);
   } else {
     assert(false && "unsupport datatype in layernorm");
   }
diff --git a/src/ops/residual_layer_norm.cc b/src/ops/residual_layer_norm.cc
new file mode 100644
index 0000000000..3bec09521a
--- /dev/null
+++ b/src/ops/residual_layer_norm.cc
@@ -0,0 +1,823 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/residual_layer_norm.h"
+#include "flexflow/model.h"
+#include "flexflow/utils/hash_utils.h"
+#include "legion/legion_utilities.h"
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::ArgumentMap;
+using Legion::Context;
+using Legion::coord_t;
+using Legion::Domain;
+using Legion::FutureMap;
+using Legion::IndexLauncher;
+using Legion::InlineLauncher;
+using Legion::Machine;
+using Legion::Memory;
+using Legion::PhysicalRegion;
+using Legion::Predicate;
+using Legion::Rect;
+using Legion::RegionRequirement;
+using Legion::Runtime;
+using Legion::Task;
+using Legion::TaskArgument;
+using Legion::TaskLauncher;
+
+bool operator==(ResidualLayerNormParams const &lhs,
+                ResidualLayerNormParams const &rhs) {
+  return lhs.layer_guid == rhs.layer_guid && lhs.axes == rhs.axes &&
+         lhs.elementwise_affine == rhs.elementwise_affine &&
+         lhs.use_bias == rhs.use_bias &&
+         lhs.use_two_residuals == rhs.use_two_residuals;
+}
+
+bool ResidualLayerNormParams::is_valid(
+    std::tuple<ParallelTensorShape,
+               ParallelTensorShape,
+               ParallelTensorShape> const &input) const {
+  return std::get<0>(input).is_valid() && std::get<1>(input).is_valid() &&
+         (!use_two_residuals || std::get<2>(input).is_valid());
+}
+
+ResidualLayerNormParams ResidualLayerNorm::get_params() const {
+  ResidualLayerNormParams params;
+  params.layer_guid = this->layer_guid;
+  params.axes = this->axes;
+  params.elementwise_affine = this->elementwise_affine;
+  params.eps = this->eps;
+  params.use_bias = this->use_bias;
+  params.use_two_residuals = this->use_two_residuals;
+  return params;
+}
+
+void FFModel::residual_layer_norm(const Tensor input,
+                                  const Tensor residual1,
+                                  const Tensor residual2,
+                                  Tensor *outputs,
+                                  bool use_two_residuals,
+                                  std::vector<int> const &axes,
+                                  bool elementwise_affine,
+                                  float eps,
+                                  bool use_bias,
+                                  DataType data_type,
+                                  char const *name) {
+  // In PyTorch, axes must be the sizes of the last axes.size() dimensions of
+  // the input tensor. However, since the tensor dimensions are reversed in
+  // FlexFlow (batch size is the last dimension), we require that axes must be
+  // the sizes of the FIRST axes.size() dimensions of the input tensor.
+
+  // Another difference is that in PyTorch, the axes vector should contain the
+  // sizes of the dimensions with respect to which you want to compute the
+  // layernorm. In FlexFlow, instead, axes should contain the INDICES of the
+  // dimensions in question. We do this because the size of a dimension might be
+  // different when splitting a tensor in model parallelism.
+  assert(
+      axes.size() <= input->num_dims &&
+      "number of axes must be less than tensor dimensions"); // input does not
+                                                             // have replica
+                                                             // dimension here
+  for (int i = 0; i < axes.size(); i++) {
+    assert(axes[i] == i && "axes must be the first axes.size() dimensions");
+  }
+
+  // Check dims
+  assert(input->num_dims == residual1->num_dims);
+  if (use_two_residuals) {
+    assert(residual2 != nullptr);
+    assert(input->num_dims == residual2->num_dims);
+  }
+  for (int i = 0; i < input->num_dims; i++) {
+    assert(input->dims[i] == residual1->dims[i]);
+    if (use_two_residuals) {
+      assert(input->dims[i] == residual2->dims[i]);
+    }
+  }
+
+  if (data_type == DT_NONE) {
+    data_type = input->data_type;
+  }
+
+  int num_weights = elementwise_affine ? (use_bias ? 2 : 1) : 0;
+  Layer *ln = nullptr;
+  Tensor casted_input =
+      (data_type != input->data_type)
+          ? cast(input, data_type, "type cast for residual_layer_norm")
+          : input;
+  Tensor casted_residual1 =
+      (data_type != residual1->data_type)
+          ? cast(residual1, data_type, "type cast for residual1_layer_norm")
+          : residual1;
+  Tensor casted_residual2 = nullptr;
+  if (use_two_residuals) {
+    casted_residual2 =
+        (data_type != residual2->data_type)
+            ? cast(residual2, data_type, "type cast for residual2_layer_norm")
+            : residual2;
+  }
+  ln = new Layer(this,
+                 OP_RESIDUAL_LAYERNORM,
+                 data_type,
+                 name,
+                 2 + use_two_residuals /*inputs*/,
+                 num_weights,
+                 2 /*outputs*/,
+                 casted_input,
+                 casted_residual1,
+                 casted_residual2);
+  ln->outputs[0] = create_tensor_legion_ordering(
+      input->num_dims, input->dims, data_type, ln, 0, false /*create_grad*/);
+  ln->outputs[1] = create_tensor_legion_ordering(
+      input->num_dims, input->dims, data_type, ln, 1, false /*create_grad*/);
+  {
+    int numdims = axes.size();
+    int dims[numdims];
+    for (int i = 0; i < numdims; i++) {
+      dims[i] = input->dims[axes[i]];
+    }
+    if (num_weights >= 1) {
+      assert(elementwise_affine);
+      ln->weights[0] = create_weight_legion_ordering(numdims,
+                                                     dims,
+                                                     data_type,
+                                                     ln,
+                                                     false /*create_grad*/,
+                                                     nullptr,
+                                                     CHOSEN_SYNC_TYPE);
+      if (num_weights == 2) {
+        assert(use_bias);
+        ln->weights[1] = create_weight_legion_ordering(numdims,
+                                                       dims,
+                                                       data_type,
+                                                       ln,
+                                                       false /*create_grad*/,
+                                                       nullptr,
+                                                       CHOSEN_SYNC_TYPE);
+      }
+    }
+  }
+  ln->add_int_property("elementwise_affine", elementwise_affine);
+  ln->add_int_property("use_bias", use_bias);
+  ln->add_int_vector_property("axes", axes);
+  ln->add_float_property("eps", eps);
+  ln->add_int_property("use_two_residuals", use_two_residuals);
+  layers.push_back(ln);
+  outputs[0] = ln->outputs[0];
+  outputs[1] = ln->outputs[1];
+}
+
+Op *ResidualLayerNorm::create_operator_from_layer(
+    FFModel &model,
+    Layer const *layer,
+    std::vector<ParallelTensor> const &inputs) {
+  long long value;
+  layer->get_int_property("elementwise_affine", value);
+  bool elementwise_affine = (bool)value;
+  layer->get_int_property("use_bias", value);
+  bool use_bias = (bool)value;
+  std::vector<int> axes;
+  layer->get_int_vector_property("axes", axes);
+  float eps;
+  layer->get_float_property("eps", eps);
+  layer->get_int_property("use_two_residuals", value);
+  bool use_two_residuals = (bool)value;
+  return new ResidualLayerNorm(model,
+                               layer->layer_guid,
+                               inputs[0],
+                               inputs[1],
+                               use_two_residuals ? inputs[2] : nullptr,
+                               use_two_residuals,
+                               axes,
+                               elementwise_affine,
+                               use_bias,
+                               eps,
+                               false, // allocate_weights
+                               layer->name);
+}
+
+ResidualLayerNorm::ResidualLayerNorm(
+    FFModel &model,
+    ResidualLayerNormParams const &params,
+    std::tuple<ParallelTensor, ParallelTensor, ParallelTensor> const &inputs,
+    bool allocate_weights,
+    char const *name)
+    : ResidualLayerNorm(model,
+                        params.layer_guid,
+                        std::get<0>(inputs),
+                        std::get<1>(inputs),
+                        params.use_two_residuals ? std::get<2>(inputs)
+                                                 : nullptr,
+                        params.use_two_residuals,
+                        params.axes,
+                        params.elementwise_affine,
+                        params.use_bias,
+                        params.eps,
+                        allocate_weights,
+                        name) {}
+
+ResidualLayerNorm::ResidualLayerNorm(FFModel &model,
+                                     LayerID const &_layer_guid,
+                                     const ParallelTensor _input,
+                                     const ParallelTensor _residual1,
+                                     const ParallelTensor _residual2,
+                                     bool _use_two_residuals,
+                                     std::vector<int> const &_axes,
+                                     bool _elementwise_affine,
+                                     bool _use_bias,
+                                     float _eps,
+                                     bool allocate_weights,
+                                     char const *name)
+    : Op(model,
+         OP_RESIDUAL_LAYERNORM,
+         _input->data_type,
+         name,
+         2 + _use_two_residuals /*inputs*/,
+         _elementwise_affine ? (_use_bias ? 2 : 1) : 0 /*weights*/,
+         2 /*outputs*/,
+         _input,
+         _residual1,
+         _use_two_residuals ? _residual2 : nullptr),
+      elementwise_affine(_elementwise_affine), eps(_eps), axes(_axes),
+      use_bias(_use_bias), use_two_residuals(_use_two_residuals) {
+  // overwrite layer_guid
+  layer_guid = _layer_guid;
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      _input->num_dims, _input->dims, _input->data_type, this, 0 /*owner_idx*/);
+  outputs[1] = model.create_parallel_tensor_legion_ordering(
+      _input->num_dims, _input->dims, _input->data_type, this, 1 /*owner_idx*/);
+  assert(check_output_input_weight_parallel_dims(allocate_weights));
+
+  int M = 1;
+  for (int i = 0; i < axes.size(); i++) {
+    M *= inputs[0]->dims[axes[i]].size;
+  }
+  int num_replicas = 1;
+  for (int i = 0; i < inputs[0]->num_dims; i++) {
+    if (inputs[0]->dims[i].is_replica_dim) {
+      num_replicas *= inputs[0]->dims[i].size;
+    }
+  }
+  effective_num_elements = M;
+  effective_batch_size = (inputs[0]->get_volume() / num_replicas) / M;
+  if (!elementwise_affine) {
+    assert(numWeights == 0);
+  } else {
+    if (!use_bias) {
+      assert(numWeights == 1); // weight
+    } else {
+      assert(numWeights == 2); // weight + bias
+    }
+  }
+
+  if (allocate_weights) {
+    int seed = std::rand();
+    if (numWeights >= 1) {
+      assert(elementwise_affine);
+
+      ParallelTensorShape beta_gamma_shape = _input->get_shape();
+      for (int i = axes.size(); i < beta_gamma_shape.num_dims - 1; i++) {
+        beta_gamma_shape.dims[i].size = 1;
+      }
+
+      // weight
+      Initializer *gamma_initializer = new UniformInitializer(seed, 1.0f, 1.0f);
+      weights[0] = model.create_parallel_weight_legion_ordering(
+          beta_gamma_shape.num_dims, // axes.size(),
+          beta_gamma_shape.dims,
+          _input->data_type,
+          NULL /*owner_op*/,
+          false /*create_grad*/,
+          gamma_initializer,
+          CHOSEN_SYNC_TYPE);
+
+      // bias
+      if (numWeights == 2) {
+        assert(use_bias);
+        Initializer *beta_initializer =
+            new UniformInitializer(seed, 0.0f, 0.0f);
+        weights[1] = model.create_parallel_weight_legion_ordering(
+            beta_gamma_shape.num_dims, //.size(),
+            beta_gamma_shape.dims,
+            _input->data_type,
+            NULL /*owner_op*/,
+            false /*create_grad*/,
+            beta_initializer,
+            CHOSEN_SYNC_TYPE);
+      }
+    }
+  }
+}
+
+void ResidualLayerNorm::init_inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher launcher(RESIDUAL_LAYERNORM_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(ResidualLayerNorm)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  int field_id = 0;
+  // input
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(field_id++, FID_DATA);
+  // residual1
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[1]->region));
+  launcher.add_field(field_id++, FID_DATA);
+  // residual2
+  if (use_two_residuals) {
+    launcher.add_region_requirement(RegionRequirement(batch_inputs[2]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      batch_inputs[2]->region));
+    launcher.add_field(field_id++, FID_DATA);
+  }
+  // added: input + residual(s)
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(field_id++, FID_DATA);
+  // layer norm output
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[1]->region));
+  launcher.add_field(field_id++, FID_DATA);
+  // weights
+  if (elementwise_affine) {
+    launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[0]->region));
+    launcher.add_field(field_id++, FID_DATA);
+    if (use_bias) {
+      launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                        0 /*projection id*/,
+                                                        READ_ONLY,
+                                                        EXCLUSIVE,
+                                                        weights[1]->region));
+      launcher.add_field(field_id++, FID_DATA);
+    }
+  }
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
+}
+
+void ResidualLayerNorm::init(FFModel const &ff) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(ADD_BIAS_RESIDUAL_LAYERNORM_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(ResidualLayerNorm)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  int field_id = 0;
+  // input
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(field_id++, FID_DATA);
+  // residual1
+  launcher.add_region_requirement(RegionRequirement(inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[1]->region));
+  launcher.add_field(field_id++, FID_DATA);
+  // residual2
+  if (use_two_residuals) {
+    launcher.add_region_requirement(RegionRequirement(inputs[1]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      inputs[1]->region));
+    launcher.add_field(field_id++, FID_DATA);
+  }
+  // added: input + residual(s)
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(field_id++, FID_DATA);
+  // layer norm output
+  launcher.add_region_requirement(RegionRequirement(outputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[1]->region));
+  launcher.add_field(field_id++, FID_DATA);
+  // weights
+  if (elementwise_affine) {
+    launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[0]->region));
+    launcher.add_field(field_id++, FID_DATA);
+
+    if (use_bias) {
+      launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                        0 /*projection id*/,
+                                                        READ_ONLY,
+                                                        EXCLUSIVE,
+                                                        weights[1]->region));
+      launcher.add_field(field_id++, FID_DATA);
+    }
+  }
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
+OpMeta *ResidualLayerNorm::init_task(Task const *task,
+                                     std::vector<PhysicalRegion> const &regions,
+                                     Context ctx,
+                                     Runtime *runtime) {
+  ResidualLayerNorm *ln = (ResidualLayerNorm *)task->args;
+  FFHandler handle = *((FFHandler const *)task->local_args);
+  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                       .only_kind(Memory::GPU_FB_MEM)
+                       .best_affinity_to(task->target_proc)
+                       .first();
+  MemoryAllocator gpu_mem_allocator(gpu_mem);
+  ResidualLayerNormMeta *meta =
+      new ResidualLayerNormMeta(handle, ln, gpu_mem_allocator);
+  meta->input_type[0] = ln->inputs[0]->data_type;
+  meta->input_type[1] = ln->inputs[1]->data_type;
+  if (ln->use_two_residuals) {
+    meta->input_type[2] = ln->inputs[2]->data_type;
+  }
+  if (ln->elementwise_affine) {
+    meta->weight_type[0] = ln->weights[0]->data_type;
+    if (ln->use_bias) {
+      meta->weight_type[1] = ln->weights[1]->data_type;
+    }
+  }
+  meta->output_type[0] = ln->outputs[0]->data_type;
+  meta->output_type[1] = ln->outputs[1]->data_type;
+  return meta;
+}
+
+void ResidualLayerNorm::forward(FFModel const &ff) {
+  assert(false);
+}
+
+void ResidualLayerNorm::backward(FFModel const &ff) {
+  assert(false);
+}
+
+Op *ResidualLayerNorm::materialize(FFModel &ff,
+                                   ParallelTensor inputs[],
+                                   int num_inputs) const {
+  ResidualLayerNormParams params = get_params();
+  return new ResidualLayerNorm(
+      ff,
+      params,
+      {inputs[0], inputs[1], params.use_two_residuals ? inputs[2] : nullptr},
+      true,
+      this->name);
+}
+
+FutureMap ResidualLayerNorm::inference(
+    FFModel const &ff,
+    BatchConfigFuture const &bc,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+
+  IndexLauncher launcher(RESIDUAL_LAYERNORM_INF_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
+  int field_id = 0;
+  // input
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(field_id++, FID_DATA);
+  // residual1
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[1]->region));
+  launcher.add_field(field_id++, FID_DATA);
+  // residual2
+  if (use_two_residuals) {
+    launcher.add_region_requirement(RegionRequirement(batch_inputs[2]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      batch_inputs[2]->region));
+    launcher.add_field(field_id++, FID_DATA);
+  }
+  // added: input + residual(s)
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(field_id++, FID_DATA);
+  // layer norm output
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[1]->region));
+  launcher.add_field(field_id++, FID_DATA);
+  if (elementwise_affine) {
+    launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[0]->region));
+    launcher.add_field(field_id++, FID_DATA);
+
+    if (use_bias) {
+      launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                        0 /*projection id*/,
+                                                        READ_ONLY,
+                                                        EXCLUSIVE,
+                                                        weights[1]->region));
+      launcher.add_field(field_id++, FID_DATA);
+    }
+  }
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+void ResidualLayerNorm::inference_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+
+  assert(task->regions.size() == regions.size());
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_tokens == 0) {
+    return;
+  }
+
+  ResidualLayerNormMeta const *m =
+      *((ResidualLayerNormMeta **)task->local_args);
+
+  assert(regions.size() ==
+         4 + m->use_two_residuals +
+             (m->elementwise_affine ? (m->use_bias ? 2 : 1) : 0));
+
+  int region_idx = 0, task_region_idx = 0;
+  GenericTensorAccessorR input =
+      helperGetGenericTensorAccessorRO(m->input_type[0],
+                                       regions[region_idx++],
+                                       task->regions[task_region_idx++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorR residual1 =
+      helperGetGenericTensorAccessorRO(m->input_type[1],
+                                       regions[region_idx++],
+                                       task->regions[task_region_idx++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorR residual2;
+  if (m->use_two_residuals) {
+    residual2 =
+        helperGetGenericTensorAccessorRO(m->input_type[2],
+                                         regions[region_idx++],
+                                         task->regions[task_region_idx++],
+                                         FID_DATA,
+                                         ctx,
+                                         runtime);
+  }
+  GenericTensorAccessorW added_output =
+      helperGetGenericTensorAccessorWO(m->output_type[0],
+                                       regions[region_idx++],
+                                       task->regions[task_region_idx++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorW output =
+      helperGetGenericTensorAccessorWO(m->output_type[1],
+                                       regions[region_idx++],
+                                       task->regions[task_region_idx++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorR gamma, beta;
+  if (m->elementwise_affine) {
+    gamma = helperGetGenericTensorAccessorRO(m->weight_type[0],
+                                             regions[region_idx++],
+                                             task->regions[task_region_idx++],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
+    if (m->use_bias) {
+      beta = helperGetGenericTensorAccessorRO(m->weight_type[1],
+                                              regions[region_idx++],
+                                              task->regions[task_region_idx++],
+                                              FID_DATA,
+                                              ctx,
+                                              runtime);
+    }
+  }
+
+  task_region_idx = 0;
+  Domain in_domain = runtime->get_index_space_domain(
+      ctx, task->regions[task_region_idx++].region.get_index_space());
+  Domain residual1_domain = runtime->get_index_space_domain(
+      ctx, task->regions[task_region_idx++].region.get_index_space());
+  Domain residual2_domain;
+  if (m->use_two_residuals) {
+    residual2_domain = runtime->get_index_space_domain(
+        ctx, task->regions[task_region_idx++].region.get_index_space());
+    assert(in_domain.get_volume() == residual2_domain.get_volume());
+    assert(residual2_domain == in_domain);
+  }
+  Domain added_out_domain = runtime->get_index_space_domain(
+      ctx, task->regions[task_region_idx++].region.get_index_space());
+  Domain out_domain = runtime->get_index_space_domain(
+      ctx, task->regions[task_region_idx++].region.get_index_space());
+  Domain gamma_domain, beta_domain;
+  if (m->elementwise_affine) {
+    gamma_domain = runtime->get_index_space_domain(
+        ctx, task->regions[task_region_idx++].region.get_index_space());
+    assert(gamma_domain.get_volume() == m->effective_num_elements);
+    int numdims = gamma_domain.get_dim();
+    size_t vol = 1;
+    int i = 0;
+    while (vol < gamma_domain.get_volume()) {
+      int g_d = gamma_domain.hi()[i] - gamma_domain.lo()[i] + 1;
+      int in_d = in_domain.hi()[i] - in_domain.lo()[i] + 1;
+      assert(g_d == in_d);
+      vol *= g_d;
+      i++;
+    }
+    if (m->use_bias) {
+      beta_domain = runtime->get_index_space_domain(
+          ctx, task->regions[task_region_idx++].region.get_index_space());
+      assert(gamma_domain == beta_domain);
+    }
+  }
+  assert(in_domain.get_volume() == out_domain.get_volume());
+  assert(out_domain.get_volume() == added_out_domain.get_volume());
+  assert(in_domain.get_volume() == residual1_domain.get_volume());
+  assert(in_domain == out_domain);
+  assert(added_out_domain == out_domain);
+  assert(residual1_domain == in_domain);
+  assert(in_domain.get_volume() ==
+         m->effective_num_elements * m->effective_batch_size);
+
+  ResidualLayerNorm::inference_kernel_wrapper(
+      m, input, residual1, residual2, added_output, output, gamma, beta);
+}
+
+bool ResidualLayerNorm::measure_operator_cost(Simulator *sim,
+                                              MachineView const &mv,
+                                              CostMetrics &cost_metrics) const {
+  return false;
+}
+
+void ResidualLayerNorm::serialize(Legion::Serializer &sez) const {
+  sez.serialize(this->layer_guid.id);
+  sez.serialize(this->layer_guid.transformer_layer_id);
+  sez.serialize(this->axes.size());
+  for (size_t i = 0; i < this->axes.size(); i++) {
+    sez.serialize(this->axes[i]);
+  }
+  sez.serialize(this->elementwise_affine);
+  sez.serialize(this->eps);
+  sez.serialize(this->use_bias);
+  sez.serialize(this->use_two_residuals);
+}
+
+using PCG::Node;
+/*static*/
+Node ResidualLayerNorm::deserialize(FFModel &ff,
+                                    Legion::Deserializer &dez,
+                                    ParallelTensor inputs[],
+                                    int num_inputs) {
+  size_t num_axes;
+  std::vector<int> axes;
+  bool elementwise_affine;
+  bool use_bias;
+  bool use_two_residuals;
+  float eps;
+  size_t id, transformer_layer_id;
+  dez.deserialize(id);
+  dez.deserialize(transformer_layer_id);
+  LayerID layer_guid(id, transformer_layer_id);
+  dez.deserialize(num_axes);
+  for (size_t i = 0; i < num_axes; i++) {
+    int axis_idx;
+    dez.deserialize(axis_idx);
+    axes.push_back(axis_idx);
+  }
+  dez.deserialize(elementwise_affine);
+  dez.deserialize(eps);
+  dez.deserialize(use_bias);
+  dez.deserialize(use_two_residuals);
+  if (use_two_residuals) {
+    assert(num_inputs == 3);
+  } else {
+    assert(num_inputs == 2);
+  }
+
+  ResidualLayerNormParams params;
+  params.layer_guid = layer_guid;
+  params.axes = axes;
+  params.elementwise_affine = elementwise_affine;
+  params.eps = eps;
+  params.use_bias = use_bias;
+  params.use_two_residuals = use_two_residuals;
+  if (use_two_residuals) {
+    return ff.get_or_create_node<ResidualLayerNorm>(
+        {inputs[0], inputs[1], inputs[2]}, params);
+  } else {
+    return ff.get_or_create_node<ResidualLayerNorm>(
+        {inputs[0], inputs[1], inputs[1]}, params);
+  }
+}
+
+}; // namespace FlexFlow
+
+namespace std {
+size_t hash<FlexFlow::ResidualLayerNormParams>::operator()(
+    FlexFlow::ResidualLayerNormParams const &params) const {
+  size_t key = 0;
+  hash_combine(key, params.layer_guid.id);
+  hash_combine(key, params.layer_guid.transformer_layer_id);
+  hash_combine(key, params.axes.size());
+  for (int n : params.axes) {
+    hash_combine(key, n);
+  }
+  hash_combine(key, params.elementwise_affine);
+  hash_combine(key, params.use_bias);
+  hash_combine(key, params.use_two_residuals);
+  return key;
+}
+}; // namespace std
diff --git a/src/ops/residual_layer_norm.cpp b/src/ops/residual_layer_norm.cpp
new file mode 100644
index 0000000000..7b42392326
--- /dev/null
+++ b/src/ops/residual_layer_norm.cpp
@@ -0,0 +1,247 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/residual_layer_norm.h"
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/utils/hip_helper.h"
+#include <hip/hip_runtime.h>
+
+namespace FlexFlow {
+
+#define C10_WARP_SIZE 32
+constexpr int kCUDABlockReduceNumThreads = 512;
+constexpr int kCUDANumThreads = 256;
+
+ResidualLayerNormMeta::ResidualLayerNormMeta(FFHandler handle,
+                                             ResidualLayerNorm const *ln,
+                                             MemoryAllocator &gpu_mem_allocator)
+    : OpMeta(handle) {
+  elementwise_affine = ln->elementwise_affine;
+  use_bias = ln->use_bias;
+  use_two_residuals = ln->use_two_residuals;
+  effective_batch_size = ln->effective_batch_size;
+  effective_num_elements = ln->effective_num_elements;
+  profiling = ln->profiling;
+  eps = ln->eps;
+  DataType data_type = ln->data_type;
+  size_t totalSize = effective_batch_size * data_type_size(data_type) * 3;
+  gpu_mem_allocator.create_legion_instance(reserveInst, totalSize);
+  mean_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+  rstd_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+  bias_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+}
+
+ResidualLayerNormMeta::~ResidualLayerNormMeta(void) {
+  if (reserveInst != Realm::RegionInstance::NO_INST) {
+    reserveInst.destroy();
+  }
+}
+
+template <typename T>
+__device__ __forceinline__ T WARP_SHFL_DOWN(T value,
+                                            unsigned int delta,
+                                            int width = warpSize,
+                                            unsigned int mask = 0xffffffff) {
+#ifndef __HIP_PLATFORM_HCC__
+  return __shfl_down_sync(mask, value, delta, width);
+#else
+  return __shfl_down(value, delta, width);
+#endif
+}
+
+template <typename T>
+__inline__ __device__ T WarpReduceSum(T val) {
+#pragma unroll
+  for (int offset = (C10_WARP_SIZE >> 1); offset > 0; offset >>= 1) {
+    val += WARP_SHFL_DOWN(val, offset);
+  }
+  return val;
+}
+
+template <typename T>
+__inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
+  int const lid = threadIdx.x % C10_WARP_SIZE;
+  int const wid = threadIdx.x / C10_WARP_SIZE;
+  val = WarpReduceSum(val);
+  __syncthreads();
+  if (lid == 0) {
+    shared[wid] = val;
+  }
+  __syncthreads();
+  val = (threadIdx.x < min(blockDim.x, max_num_threads) / C10_WARP_SIZE)
+            ? shared[lid]
+            : 0;
+  if (wid == 0) {
+    val = WarpReduceSum(val);
+  }
+  return val;
+}
+
+template <typename T>
+__global__ void ResidualLayerNormKernel(int64_t N,
+                                        float eps,
+                                        T const *input_ptr,
+                                        T const *residual1_ptr,
+                                        T const *residual2_ptr,
+                                        T *X,
+                                        T *mean,
+                                        T *rstd,
+                                        T const *gamma,
+                                        T const *beta,
+                                        T *Y) {
+  __shared__ float m_shared[C10_WARP_SIZE];
+  __shared__ float v_shared[C10_WARP_SIZE];
+  const int64_t i = blockIdx.x;
+  float sum1 = 0.0f;
+  float sum2 = 0.0f;
+  for (int64_t j = threadIdx.x; j < N;
+       j += min(blockDim.x, kCUDABlockReduceNumThreads)) {
+    const int64_t index = i * N + j;
+    const T residual2_val = (residual2_ptr == nullptr)
+                                ? T(0)
+                                : static_cast<T>(residual2_ptr[index]);
+    X[index] = input_ptr[index] + residual1_ptr[index] + residual2_val;
+    sum1 += static_cast<float>(X[index]);
+    sum2 += static_cast<float>(X[index]) * static_cast<float>(X[index]);
+  }
+  if (threadIdx.x < kCUDABlockReduceNumThreads) {
+    sum1 = BlockReduceSum<float>(
+        sum1, m_shared, min(blockDim.x, kCUDABlockReduceNumThreads));
+    sum2 = BlockReduceSum<float>(
+        sum2, v_shared, min(blockDim.x, kCUDABlockReduceNumThreads));
+  }
+  if (threadIdx.x == 0) {
+    float const scale = float(1) / static_cast<float>(N);
+    sum1 *= scale;
+    sum2 = max(sum2 * scale - sum1 * sum1, float(0));
+    mean[i] = static_cast<T>(sum1);
+    rstd[i] = static_cast<T>(rsqrt(sum2 + eps));
+  }
+
+  __syncthreads();
+
+  using T_ACC = T;
+  for (int64_t j = threadIdx.x; j < N; j += min(blockDim.x, kCUDANumThreads)) {
+    const int64_t index = i * N + j;
+    const T_ACC gamma_v =
+        gamma == nullptr ? T_ACC(1) : static_cast<T_ACC>(gamma[j]);
+    const T_ACC beta_v =
+        beta == nullptr ? T_ACC(0) : static_cast<T_ACC>(beta[j]);
+    Y[index] = (static_cast<T_ACC>(X[index]) - static_cast<T_ACC>(mean[i])) *
+                   static_cast<T_ACC>(rstd[i]) * gamma_v +
+               beta_v;
+  }
+}
+
+/*static*/
+template <typename T>
+void ResidualLayerNorm::inference_kernel(ResidualLayerNormMeta const *m,
+                                         T const *input_ptr,
+                                         T const *residual1_ptr,
+                                         T const *residual2_ptr,
+                                         T *added_output_ptr,
+                                         T *output_ptr,
+                                         T const *gamma_ptr,
+                                         T const *beta_ptr,
+                                         hipStream_t stream) {
+
+  std::pair<int, int> kernel1_parallelism =
+      std::make_pair(m->effective_batch_size, kCUDABlockReduceNumThreads);
+  std::pair<int, int> kernel2_parallelism =
+      std::make_pair(m->effective_batch_size, kCUDANumThreads);
+
+  int num_blocks =
+      std::max(kernel1_parallelism.first, kernel2_parallelism.first);
+  int num_threads =
+      std::max(kernel1_parallelism.second, kernel2_parallelism.second);
+
+  hipLaunchKernelGGL(HIP_KERNEL_NAME(ResidualLayerNormKernel<T>),
+                     num_blocks,
+                     num_threads,
+                     0,
+                     stream,
+                     m->effective_num_elements,
+                     m->eps,
+                     input_ptr,
+                     residual1_ptr,
+                     residual2_ptr,
+                     added_output_ptr,
+                     static_cast<T *>(m->mean_ptr),
+                     static_cast<T *>(m->rstd_ptr),
+                     gamma_ptr,
+                     beta_ptr,
+                     output_ptr);
+}
+
+/*static*/
+void ResidualLayerNorm::inference_kernel_wrapper(
+    ResidualLayerNormMeta const *m,
+    GenericTensorAccessorR const &input,
+    GenericTensorAccessorR const &residual1,
+    GenericTensorAccessorR const &residual2,
+    GenericTensorAccessorW &added_output,
+    GenericTensorAccessorW &output,
+    GenericTensorAccessorR const &gamma,
+    GenericTensorAccessorR const &beta) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+  if (m->input_type[0] == DT_FLOAT) {
+    ResidualLayerNorm::inference_kernel<float>(
+        m,
+        input.get_float_ptr(),
+        residual1.get_float_ptr(),
+        residual2.get_float_ptr(),
+        added_output.get_float_ptr(),
+        output.get_float_ptr(),
+        m->elementwise_affine ? gamma.get_float_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta.get_float_ptr() : nullptr,
+        stream);
+  } else if (m->input_type[0] == DT_HALF) {
+    ResidualLayerNorm::inference_kernel<half>(
+        m,
+        input.get_half_ptr(),
+        residual1.get_half_ptr(),
+        residual2.get_half_ptr(),
+        added_output.get_half_ptr(),
+        output.get_half_ptr(),
+        m->elementwise_affine ? gamma.get_half_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta.get_half_ptr() : nullptr,
+        stream);
+  } else {
+    assert(false && "unsupport datatype in layernorm");
+  }
+
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("[ResidualLayerNorm] forward time (CF) = %.9fms\n", elapsed);
+  }
+}
+
+}; // namespace FlexFlow
diff --git a/src/ops/residual_layer_norm.cu b/src/ops/residual_layer_norm.cu
new file mode 100644
index 0000000000..3bd18217cb
--- /dev/null
+++ b/src/ops/residual_layer_norm.cu
@@ -0,0 +1,242 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/ops/residual_layer_norm.h"
+#include "flexflow/utils/cuda_helper.h"
+
+namespace FlexFlow {
+
+#define C10_WARP_SIZE 32
+constexpr int kCUDABlockReduceNumThreads = 512;
+constexpr int kCUDANumThreads = 256;
+
+ResidualLayerNormMeta::ResidualLayerNormMeta(FFHandler handle,
+                                             ResidualLayerNorm const *ln,
+                                             MemoryAllocator &gpu_mem_allocator)
+    : OpMeta(handle) {
+  elementwise_affine = ln->elementwise_affine;
+  use_bias = ln->use_bias;
+  use_two_residuals = ln->use_two_residuals;
+  effective_batch_size = ln->effective_batch_size;
+  effective_num_elements = ln->effective_num_elements;
+  profiling = ln->profiling;
+  eps = ln->eps;
+  DataType data_type = ln->data_type;
+  size_t totalSize = effective_batch_size * data_type_size(data_type) * 3;
+  gpu_mem_allocator.create_legion_instance(reserveInst, totalSize);
+  mean_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+  rstd_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+  bias_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+}
+
+ResidualLayerNormMeta::~ResidualLayerNormMeta(void) {
+  if (reserveInst != Realm::RegionInstance::NO_INST) {
+    reserveInst.destroy();
+  }
+}
+
+template <typename T>
+__device__ __forceinline__ T WARP_SHFL_DOWN(T value,
+                                            unsigned int delta,
+                                            int width = warpSize,
+                                            unsigned int mask = 0xffffffff) {
+#ifndef __HIP_PLATFORM_HCC__
+  return __shfl_down_sync(mask, value, delta, width);
+#else
+  return __shfl_down(value, delta, width);
+#endif
+}
+
+template <typename T>
+__inline__ __device__ T WarpReduceSum(T val) {
+#pragma unroll
+  for (int offset = (C10_WARP_SIZE >> 1); offset > 0; offset >>= 1) {
+    val += WARP_SHFL_DOWN(val, offset);
+  }
+  return val;
+}
+
+template <typename T>
+__inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
+  int const lid = threadIdx.x % C10_WARP_SIZE;
+  int const wid = threadIdx.x / C10_WARP_SIZE;
+  val = WarpReduceSum(val);
+  __syncthreads();
+  if (lid == 0) {
+    shared[wid] = val;
+  }
+  __syncthreads();
+  val = (threadIdx.x < min(blockDim.x, max_num_threads) / C10_WARP_SIZE)
+            ? shared[lid]
+            : 0;
+  if (wid == 0) {
+    val = WarpReduceSum(val);
+  }
+  return val;
+}
+
+template <typename T>
+__global__ void ResidualLayerNormKernel(int64_t N,
+                                        float eps,
+                                        T const *input_ptr,
+                                        T const *residual1_ptr,
+                                        T const *residual2_ptr,
+                                        T *X,
+                                        T *mean,
+                                        T *rstd,
+                                        T const *gamma,
+                                        T const *beta,
+                                        T *Y) {
+  __shared__ float m_shared[C10_WARP_SIZE];
+  __shared__ float v_shared[C10_WARP_SIZE];
+  const int64_t i = blockIdx.x;
+  float sum1 = 0.0f;
+  float sum2 = 0.0f;
+  for (int64_t j = threadIdx.x; j < N;
+       j += min(blockDim.x, kCUDABlockReduceNumThreads)) {
+    const int64_t index = i * N + j;
+    const T residual2_val = (residual2_ptr == nullptr)
+                                ? T(0)
+                                : static_cast<T>(residual2_ptr[index]);
+    X[index] = input_ptr[index] + residual1_ptr[index] + residual2_val;
+    sum1 += static_cast<float>(X[index]);
+    sum2 += static_cast<float>(X[index]) * static_cast<float>(X[index]);
+  }
+  if (threadIdx.x < kCUDABlockReduceNumThreads) {
+    sum1 = BlockReduceSum<float>(
+        sum1, m_shared, min(blockDim.x, kCUDABlockReduceNumThreads));
+    sum2 = BlockReduceSum<float>(
+        sum2, v_shared, min(blockDim.x, kCUDABlockReduceNumThreads));
+  }
+  if (threadIdx.x == 0) {
+    float const scale = float(1) / static_cast<float>(N);
+    sum1 *= scale;
+    sum2 = max(sum2 * scale - sum1 * sum1, float(0));
+    mean[i] = static_cast<T>(sum1);
+    rstd[i] = static_cast<T>(rsqrt(sum2 + eps));
+  }
+
+  __syncthreads();
+
+  using T_ACC = T;
+  for (int64_t j = threadIdx.x; j < N; j += min(blockDim.x, kCUDANumThreads)) {
+    const int64_t index = i * N + j;
+    const T_ACC gamma_v =
+        gamma == nullptr ? T_ACC(1) : static_cast<T_ACC>(gamma[j]);
+    const T_ACC beta_v =
+        beta == nullptr ? T_ACC(0) : static_cast<T_ACC>(beta[j]);
+    Y[index] = (static_cast<T_ACC>(X[index]) - static_cast<T_ACC>(mean[i])) *
+                   static_cast<T_ACC>(rstd[i]) * gamma_v +
+               beta_v;
+  }
+}
+
+/*static*/
+template <typename T>
+void ResidualLayerNorm::inference_kernel(ResidualLayerNormMeta const *m,
+                                         T const *input_ptr,
+                                         T const *residual1_ptr,
+                                         T const *residual2_ptr,
+                                         T *added_output_ptr,
+                                         T *output_ptr,
+                                         T const *gamma_ptr,
+                                         T const *beta_ptr,
+                                         cudaStream_t stream) {
+
+  std::pair<int, int> kernel1_parallelism =
+      std::make_pair(m->effective_batch_size, kCUDABlockReduceNumThreads);
+  std::pair<int, int> kernel2_parallelism =
+      std::make_pair(m->effective_batch_size, kCUDANumThreads);
+
+  int num_blocks =
+      std::max(kernel1_parallelism.first, kernel2_parallelism.first);
+  int num_threads =
+      std::max(kernel1_parallelism.second, kernel2_parallelism.second);
+
+  ResidualLayerNormKernel<T>
+      <<<num_blocks, num_threads, 0, stream>>>(m->effective_num_elements,
+                                               m->eps,
+                                               input_ptr,
+                                               residual1_ptr,
+                                               residual2_ptr,
+                                               added_output_ptr,
+                                               static_cast<T *>(m->mean_ptr),
+                                               static_cast<T *>(m->rstd_ptr),
+                                               gamma_ptr,
+                                               beta_ptr,
+                                               output_ptr);
+}
+
+/*static*/
+void ResidualLayerNorm::inference_kernel_wrapper(
+    ResidualLayerNormMeta const *m,
+    GenericTensorAccessorR const &input,
+    GenericTensorAccessorR const &residual1,
+    GenericTensorAccessorR const &residual2,
+    GenericTensorAccessorW &added_output,
+    GenericTensorAccessorW &output,
+    GenericTensorAccessorR const &gamma,
+    GenericTensorAccessorR const &beta) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+  if (m->input_type[0] == DT_FLOAT) {
+    ResidualLayerNorm::inference_kernel<float>(
+        m,
+        input.get_float_ptr(),
+        residual1.get_float_ptr(),
+        m->use_two_residuals ? residual2.get_float_ptr() : nullptr,
+        added_output.get_float_ptr(),
+        output.get_float_ptr(),
+        m->elementwise_affine ? gamma.get_float_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta.get_float_ptr() : nullptr,
+        stream);
+  } else if (m->input_type[0] == DT_HALF) {
+    ResidualLayerNorm::inference_kernel<half>(
+        m,
+        input.get_half_ptr(),
+        residual1.get_half_ptr(),
+        m->use_two_residuals ? residual2.get_half_ptr() : nullptr,
+        added_output.get_half_ptr(),
+        output.get_half_ptr(),
+        m->elementwise_affine ? gamma.get_half_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta.get_half_ptr() : nullptr,
+        stream);
+  } else {
+    assert(false && "unsupport datatype in layernorm");
+  }
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[ResidualLayerNorm] forward time (CF) = %.9fms\n", elapsed);
+  }
+}
+
+}; // namespace FlexFlow
diff --git a/src/runtime/ffconst_utils.cc b/src/runtime/ffconst_utils.cc
index 91b21e8d8f..c7b6e1257a 100644
--- a/src/runtime/ffconst_utils.cc
+++ b/src/runtime/ffconst_utils.cc
@@ -170,6 +170,8 @@ std::string get_operator_type_name(OperatorType type) {
       return "Mean";
     case OP_LAYERNORM:
       return "LayerNorm";
+    case OP_RESIDUAL_LAYERNORM:
+      return "ResidualLayerNorm";
     case OP_ADD_BIAS_RESIDUAL_LAYERNORM:
       return "AddBiasResidualLayerNorm";
     case OP_SIGMOID_SILU_MULTI:
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index 037be739e7..408de57c54 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -40,6 +40,7 @@
 #include "flexflow/ops/pool_2d.h"
 #include "flexflow/ops/reduce.h"
 #include "flexflow/ops/reshape.h"
+#include "flexflow/ops/residual_layer_norm.h"
 #include "flexflow/ops/residual_rms_norm.h"
 #include "flexflow/ops/rms_norm.h"
 #include "flexflow/ops/sampling.h"
@@ -2704,6 +2705,10 @@ void FFModel::deserialize_graph_optimal_view(
         node = LayerNorm::deserialize(*this, dez, inputs, num_inputs);
         break;
       }
+      case OP_RESIDUAL_LAYERNORM: {
+        node = ResidualLayerNorm::deserialize(*this, dez, inputs, num_inputs);
+        break;
+      }
       case OP_ADD_BIAS_RESIDUAL_LAYERNORM: {
         node = AddBiasResidualLayerNorm::deserialize(
             *this, dez, inputs, num_inputs);
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 0cb50733a3..5ef55992ef 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -51,6 +51,7 @@
 #include "flexflow/ops/pool_2d.h"
 #include "flexflow/ops/reduce.h"
 #include "flexflow/ops/reshape.h"
+#include "flexflow/ops/residual_layer_norm.h"
 #include "flexflow/ops/residual_rms_norm.h"
 #include "flexflow/ops/reverse.h"
 #include "flexflow/ops/rms_norm.h"
@@ -3103,6 +3104,12 @@ Op *FFModel::create_operator_from_layer(
       operators.push_back(op);
       return op;
     }
+    case OP_RESIDUAL_LAYERNORM: {
+      Op *op =
+          ResidualLayerNorm::create_operator_from_layer(*this, layer, inputs);
+      operators.push_back(op);
+      return op;
+    }
     case OP_ADD_BIAS_RESIDUAL_LAYERNORM: {
       Op *op = AddBiasResidualLayerNorm::create_operator_from_layer(
           *this, layer, inputs);
@@ -5176,6 +5183,39 @@ void register_flexflow_internal_tasks(Runtime *runtime,
       runtime->register_task_variant<LayerNorm::forward_task>(registrar);
     }
   }
+  // ResidualLayerNorm task
+  {
+    TaskVariantRegistrar registrar(RESIDUAL_LAYERNORM_INIT_TASK_ID,
+                                   "residual_layernorm_init_task");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<OpMeta *, ResidualLayerNorm::init_task>(
+          registrar, "residual_layernorm_init_task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<OpMeta *, ResidualLayerNorm::init_task>(
+          registrar);
+    }
+  }
+  {
+    TaskVariantRegistrar registrar(RESIDUAL_LAYERNORM_INF_TASK_ID,
+                                   "residual_layernorm_fwd_task");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<ResidualLayerNorm::inference_task>(
+          registrar, "residual_layernorm_inference_task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<ResidualLayerNorm::inference_task>(
+          registrar);
+    }
+  }
   // AddBiasResidualLayerNorm task
   {
     TaskVariantRegistrar registrar(ADD_BIAS_RESIDUAL_LAYERNORM_INIT_TASK_ID,
diff --git a/src/runtime/operator_params.cc b/src/runtime/operator_params.cc
index 43f3dc7cf9..6b2d223f54 100644
--- a/src/runtime/operator_params.cc
+++ b/src/runtime/operator_params.cc
@@ -27,6 +27,7 @@
 #include "flexflow/ops/pool_2d.h"
 #include "flexflow/ops/reduce.h"
 #include "flexflow/ops/reshape.h"
+#include "flexflow/ops/residual_layer_norm.h"
 #include "flexflow/ops/residual_rms_norm.h"
 #include "flexflow/ops/reverse.h"
 #include "flexflow/ops/rms_norm.h"
@@ -96,6 +97,8 @@ tl::optional<OperatorParameters> get_op_parameters(Op const *op) {
       return ((TreeIncMultiHeadSelfAttention *)op)->get_params();
     case OP_LAYERNORM:
       return ((LayerNorm *)op)->get_params();
+    case OP_RESIDUAL_LAYERNORM:
+      return ((ResidualLayerNorm *)op)->get_params();
     case OP_ADD_BIAS_RESIDUAL_LAYERNORM:
       return ((AddBiasResidualLayerNorm *)op)->get_params();
     case OP_SIGMOID_SILU_MULTI:
diff --git a/src/runtime/substitution.cc b/src/runtime/substitution.cc
index 8618c41129..e8b986582f 100644
--- a/src/runtime/substitution.cc
+++ b/src/runtime/substitution.cc
@@ -33,6 +33,7 @@
 #include "flexflow/ops/linear.h"
 #include "flexflow/ops/noop.h"
 #include "flexflow/ops/pool_2d.h"
+#include "flexflow/ops/residual_layer_norm.h"
 #include "flexflow/ops/residual_rms_norm.h"
 #include "flexflow/ops/rms_norm.h"
 #include "flexflow/ops/sigmoid_silu_multi.h"

From ee6090ebec6548ef5294acec91cd0bc59934a70c Mon Sep 17 00:00:00 2001
From: zwang86 <46699021+zwang86@users.noreply.github.com>
Date: Fri, 29 Sep 2023 11:04:16 -0400
Subject: [PATCH 239/344] [SpecInfer] Reduce single request per batch overhead
 (#1155)

* Initial commit.

* Format

* Update batch_config setup.
---
 include/flexflow/batch_config.h |  3 +--
 src/runtime/request_manager.cc  | 14 ++++++++++++++
 2 files changed, 15 insertions(+), 2 deletions(-)

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 8aa69a3cad..d2fbd6219a 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -46,9 +46,8 @@ class BatchConfig {
   void print() const;
   virtual InferenceMode get_mode() const;
   static BatchConfig const *from_future(BatchConfigFuture const &future);
-  static int const MAX_NUM_REQUESTS = 4;
+  static int const MAX_NUM_REQUESTS = 7;
   static int const MAX_NUM_TOKENS = 64;
-  static int const MAX_PROMPT_LENGTH = 62;
   static int const MAX_SEQ_LENGTH = 256;
 
   //  These are set by update
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 5489c9b06d..6f0a1f3851 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -1144,6 +1144,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
                         << std::endl;
             }
             new_bc.num_tokens_to_commit++;
+            request.llm_cache_size++;
           }
         }
       }
@@ -1255,6 +1256,19 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
                  "Exceeding the space available in the TreeVerify batch");
           break;
         }
+
+        if (new_bc.num_tokens + request.llm_cache_size >= request.initial_len) {
+          // launch the request into running phase after loading all prompt
+          request.status = Request::RUNNING;
+          new_bc.request_running[i] = true;
+
+          std::cout << "new_bc.requestsInfo[i].num_tokens_in_batch: "
+                    << new_bc.requestsInfo[i].num_tokens_in_batch << std::endl;
+
+          dfs_tree_inputs[guid] =
+              std::vector<std::pair<BatchConfig::TokenId, int>>{std::make_pair(
+                  request.tokens.back(), request.tokens.size() - 1)};
+        }
       } else { // launch the request into running phase after loading all prompt
         if (BatchConfig::MAX_NUM_TOKENS - new_bc.num_tokens > 0) {
           request.status = Request::RUNNING;

From 426aa7d6f6a8627e7751a9a768b7e7c0f004c435 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 29 Sep 2023 17:27:22 -0400
Subject: [PATCH 240/344] Support new Falcon model (#1158)

* support new falcon

* maybe fix

* .

* .

* .

* fix

* fix

* cleanup
---
 .github/workflows/gpu-ci-daemon.yml    |  1 +
 .github/workflows/gpu-ci.yml           |  1 +
 .github/workflows/multinode-test.yml   |  1 +
 python/flexflow/serve/__init__.py      | 18 ++++----
 python/flexflow/serve/models/falcon.py | 21 +++++++--
 python/flexflow/serve/serve.py         | 62 +++++++++++++++++++-------
 6 files changed, 75 insertions(+), 29 deletions(-)

diff --git a/.github/workflows/gpu-ci-daemon.yml b/.github/workflows/gpu-ci-daemon.yml
index 603b44c34e..b36e7b49e1 100644
--- a/.github/workflows/gpu-ci-daemon.yml
+++ b/.github/workflows/gpu-ci-daemon.yml
@@ -34,5 +34,6 @@ jobs:
         run: |
           pip3 install pip --upgrade
           pip3 install pyopenssl --upgrade
+          pip3 install urllib3 --upgrade
           pip3 install pygithub
           python3 .github/workflows/helpers/gpu_ci_helper.py --daemon
diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index aee16832f3..4a43a3dee7 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -56,6 +56,7 @@ jobs:
         run: |
           pip3 install pip --upgrade
           pip3 install pyopenssl --upgrade
+          pip3 install urllib3 --upgrade
           pip3 install pygithub
           python3 .github/workflows/helpers/gpu_ci_helper.py
 
diff --git a/.github/workflows/multinode-test.yml b/.github/workflows/multinode-test.yml
index 37f81b615f..ca2b47df27 100644
--- a/.github/workflows/multinode-test.yml
+++ b/.github/workflows/multinode-test.yml
@@ -25,6 +25,7 @@ jobs:
         run: |
           pip3 install pip --upgrade
           pip3 install pyopenssl --upgrade
+          pip3 install urllib3 --upgrade
           pip3 install pygithub
           python3 .github/workflows/helpers/gpu_ci_helper.py
 
diff --git a/python/flexflow/serve/__init__.py b/python/flexflow/serve/__init__.py
index 2c6395aca1..9b282ae5f4 100644
--- a/python/flexflow/serve/__init__.py
+++ b/python/flexflow/serve/__init__.py
@@ -48,19 +48,19 @@ def init(
     fusion: Optional[bool] = None,
 ):
     """
-    Configure FlexFlow Serve and start the runtime. 
-    
+    Configure FlexFlow Serve and start the runtime.
+
     The function takes, alternatively, configs_dict (a positional argument of type dictionary),
     or three mandatory named parameters, plus some additional optional named parameters. When passing
     a configs_dict, no named parameter should be specified, and the dictionary should have keys matching
     at least the mandatory named parameters.
-    
+
     The three mandatory parameters, which cannot be changed after starting the runtime, are:
     - num_gpus: the number of GPUs to reserve for the runtime
     - memory_per_gpu: the amount of memory (in MB) to pre-allocate on each GPU
     - zero_copy_memory_per_node: the amount of zero-copy memory (in MB) to pre-allocate for each node
-    
-    The optional parameters are: 
+
+    The optional parameters are:
     - num_cpus: the number of CPU processors to reserve for the runtime, defaults to 4
     - legion_utility_processors: number of Legion utility threads to create per process, defaults to 1
     - data_parallelism_degree: the degree of parallelization in the data parallel dimension, defaults to 1
@@ -72,7 +72,7 @@ def init(
     - use_8bit_quantization: whether to use 8-bit quantization, defaults to False
     - profiling: whether to enable the FlexFlow profiling mode, defaults to False
     - fusion: whether to enable the FlexFlow operator fusion optimization, defaults to True
-    
+
     The configurations are passed down to the FlexFlow runtime (implemented in C++) via command line arguments.
 
 
@@ -106,7 +106,7 @@ def init(
     :type profiling: Optional[bool], optional
     :param fusion: whether to enable the FlexFlow operator fusion optimization, defaults to True
     :type fusion: Optional[bool], optional
-    
+
     :raises ValueError: this function will raise an exception if the user passes both a configs_dict and some named parameters
     :raises TypeError: this function will raise an exception if the configs_dict is not a dictionary
     :raises ValueError: this function will raise an exception if the mandatory FlexFlow initialization parameters are missing, or are not positive integers: num_gpus, memory_per_gpu, zero_copy_memory_per_node
@@ -152,7 +152,7 @@ def init(
             "use_4bit_quantization": use_4bit_quantization,
             "use_8bit_quantization": use_8bit_quantization,
             "profiling": profiling,
-            "fusion": fusion
+            "fusion": fusion,
         }
 
     # Check that mandatory configs are present
@@ -188,7 +188,7 @@ def init(
     if configs_dict.get("offload", None) is None:
         configs_dict["offload"] = False
     if configs_dict.get("offload_reserve_space_size", None) is None:
-        configs_dict["offload_reserve_space_size"] = 1024 ** 2
+        configs_dict["offload_reserve_space_size"] = 1024**2
     if configs_dict.get("use_4bit_quantization", None) is None:
         configs_dict["use_4bit_quantization"] = False
     if configs_dict.get("use_8bit_quantization", None) is None:
diff --git a/python/flexflow/serve/models/falcon.py b/python/flexflow/serve/models/falcon.py
index 3d61349d67..2fd2f4953f 100644
--- a/python/flexflow/serve/models/falcon.py
+++ b/python/flexflow/serve/models/falcon.py
@@ -27,9 +27,17 @@ def __init__(self, hf_config):
         self.hidden_size = hf_config.hidden_size
         self.layer_norm_epsilon = hf_config.layer_norm_epsilon
         self.multi_query = hf_config.multi_query
-        self.n_head = hf_config.n_head
+        self.n_head = (
+            hf_config.n_head
+            if "n_head" in hf_config.__dict__
+            else hf_config.num_attention_heads
+        )
         self.n_head_kv = hf_config.n_head_kv if "n_head_kv" in hf_config.__dict__ else 1
-        self.n_layer = hf_config.n_layer
+        self.n_layer = (
+            hf_config.n_layer
+            if "n_layer" in hf_config.__dict__
+            else hf_config.num_hidden_layers
+        )
         self.parallel_attn = hf_config.parallel_attn
         self.vocab_size = hf_config.vocab_size
 
@@ -234,6 +242,11 @@ def build_model(self):
 
     def convert_hf_model(model, dst_folder):
         os.makedirs(dst_folder, exist_ok=True)
+        n_head = (
+            model.config.n_head
+            if "n_head" in model.config.__dict__
+            else model.config.num_attention_heads
+        )
         for name, params in model.named_parameters():
             name = (
                 name.replace(".", "_")
@@ -250,8 +263,8 @@ def convert_hf_model(model, dst_folder):
                     params,
                     [
                         model.config.hidden_size,
-                        model.config.hidden_size // model.config.n_head,
-                        model.config.hidden_size // model.config.n_head,
+                        model.config.hidden_size // n_head,
+                        model.config.hidden_size // n_head,
                     ],
                     0,
                 )
diff --git a/python/flexflow/serve/serve.py b/python/flexflow/serve/serve.py
index 5cbe16b064..7e340a04e2 100644
--- a/python/flexflow/serve/serve.py
+++ b/python/flexflow/serve/serve.py
@@ -52,12 +52,15 @@ def __init__(
         self.topp = topp
         self.topk = topk
 
+
 class GenerationResult:
     """A class to store the output of a generation request."""
+
     def __init__(self, text: str = None, tokens: list = None):
         self.output_text = text
         self.output_tokens = tokens
 
+
 class LLM:
     """This class creates a LLM (Large-Language Model) object based on a model from HuggingFace"""
 
@@ -87,6 +90,7 @@ def __init__(
             "LLaMAForCausalLM": (ModelType.LLAMA, FlexFlowLLAMA),
             "OPTForCausalLM": (ModelType.OPT, FlexFlowOPT),
             "RWForCausalLM": (ModelType.FALCON, FlexFlowFalcon),
+            "FalconForCausalLM": (ModelType.FALCON, FlexFlowFalcon),
             "GPTBigCodeForCausalLM": (ModelType.STARCODER, FlexFlowSTARCODER),
             "MPTForCausalLM": (ModelType.MPT, FlexFlowMPT),
         }
@@ -124,21 +128,27 @@ def download_hf_config(self):
 
     def __get_revision_hashes(self, model_name: str, weights: bool):
         ff_revision = None
-        ff_revision_file = os.path.join(self.weights_path, "rev_sha.txt") if weights else os.path.join(self.tokenizer_path, "rev_sha.txt")
+        ff_revision_file = (
+            os.path.join(self.weights_path, "rev_sha.txt")
+            if weights
+            else os.path.join(self.tokenizer_path, "rev_sha.txt")
+        )
         if os.path.exists(ff_revision_file):
             ff_revision = "".join(open(ff_revision_file).read().split())
-        
+
         if os.path.exists(model_name) and os.path.isdir(model_name):
             # Local model
             files = os.listdir(model_name)
-            state = files + [os.path.getmtime(os.path.join(model_name, f)) for f in files]
-            latest_revision = hashlib.md5(str(state).encode('utf-8')).hexdigest() 
+            state = files + [
+                os.path.getmtime(os.path.join(model_name, f)) for f in files
+            ]
+            latest_revision = hashlib.md5(str(state).encode("utf-8")).hexdigest()
         else:
             # Remote HuggingFace model
             hf_api = HfApi()
             latest_revision = hf_api.model_info(self.model_name).sha
         return ff_revision, ff_revision_file, latest_revision
-    
+
     def download_hf_weights_if_needed(self):
         """Check in the folder specified by the cache_path whether the LLM's model weights are available and up to date.
         If not, or if the refresh_cache parameter is set to True, download new weights.
@@ -168,7 +178,9 @@ def download_hf_weights_if_needed(self):
         os.makedirs(self.weights_path, exist_ok=True)
         print(f"Creating directory {self.weights_path} (if it doesn't exist)...")
 
-        ff_revision, ff_revision_file, latest_revision = self.__get_revision_hashes(self.model_name, weights=True)
+        ff_revision, ff_revision_file, latest_revision = self.__get_revision_hashes(
+            self.model_name, weights=True
+        )
 
         # Download if needed
         if ff_revision != latest_revision:
@@ -179,9 +191,13 @@ def download_hf_weights_if_needed(self):
                 )
             else:
                 # Remote model
-                print(f"'{self.model_name}' local model weights were updated! Converting new weights now...")
+                print(
+                    f"'{self.model_name}' local model weights were updated! Converting new weights now..."
+                )
             # Download model from HuggingFace, or load it from the local folder
-            hf_model = AutoModelForCausalLM.from_pretrained(self.model_name, trust_remote_code=True)
+            hf_model = AutoModelForCausalLM.from_pretrained(
+                self.model_name, trust_remote_code=True
+            )
             # Print log message to notify user download of model has finished
             if not os.path.exists(self.model_name) or os.path.isdir(self.model_name):
                 print("Done downloading HF weights. Converting them now...")
@@ -217,15 +233,21 @@ def download_hf_tokenizer_if_needed(self):
             os.makedirs(self.tokenizer_path, exist_ok=True)
 
         # Get local revision SHA, check if it matches latest one on huggingface
-        ff_revision, ff_revision_file, latest_revision = self.__get_revision_hashes(self.model_name, weights=False)
+        ff_revision, ff_revision_file, latest_revision = self.__get_revision_hashes(
+            self.model_name, weights=False
+        )
 
         if ff_revision != latest_revision:
             if not os.path.exists(self.model_name) or os.path.isdir(self.model_name):
                 # Local model
-                print(f"'{self.model_name}' tokenizer not found in cache or outdated. Downloading from huggingface.co ...")
+                print(
+                    f"'{self.model_name}' tokenizer not found in cache or outdated. Downloading from huggingface.co ..."
+                )
             else:
                 # Remote model
-                print(f"'{self.model_name}' local tokenizer was updated! Saving new tokenizer now...")
+                print(
+                    f"'{self.model_name}' local tokenizer was updated! Saving new tokenizer now..."
+                )
             # Download tokenizer from HuggingFace, or load it from the local folder
             if self.model_type == ModelType.LLAMA:
                 hf_tokenizer = LlamaTokenizer.from_pretrained(
@@ -242,7 +264,7 @@ def download_hf_tokenizer_if_needed(self):
             # Save new revision hash to file
             with open(ff_revision_file, "w+") as f:
                 f.write(latest_revision)
-            
+
         else:
             print(f"Loading '{self.model_name}' tokenizer from the cache...")
 
@@ -357,9 +379,15 @@ def compile(
 
         # Create request manager
         self.rm = RequestManager()
-        bos_token_id = -1 if self.hf_config.bos_token_id is None else self.hf_config.bos_token_id
-        eos_token_id = -1 if self.hf_config.eos_token_id is None else self.hf_config.eos_token_id
-        self.rm.register_tokenizer(self.model_type, bos_token_id, eos_token_id, self.tokenizer_path)
+        bos_token_id = (
+            -1 if self.hf_config.bos_token_id is None else self.hf_config.bos_token_id
+        )
+        eos_token_id = (
+            -1 if self.hf_config.eos_token_id is None else self.hf_config.eos_token_id
+        )
+        self.rm.register_tokenizer(
+            self.model_type, bos_token_id, eos_token_id, self.tokenizer_path
+        )
         self.rm.register_output_filepath(self.output_file)
 
         self.im.init_operators_inference(self.model.ffmodel)
@@ -382,7 +410,9 @@ def generate(self, prompts: Union[str, List[str]], max_length: int = 128):
         elif type(prompts) == list:
             if len(prompts) == 0:
                 return []
-            return [self.model.ffmodel.generate(prompt, max_length) for prompt in prompts]
+            return [
+                self.model.ffmodel.generate(prompt, max_length) for prompt in prompts
+            ]
         else:
             assert False, "Please pass a non-empty string or list of strings"
 

From 0e68bb7070862a4f965ac643ef50067122e4ecbd Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sat, 30 Sep 2023 13:02:44 -0400
Subject: [PATCH 241/344] Fix `pip install` issues affecting some platforms
 (#1159)

---
 CMakeLists.txt                      |  2 +-
 cmake/pip_install/CMakeLists.txt    |  2 +-
 python/flexflow/core/flexflowlib.py | 18 +++++++++---------
 3 files changed, 11 insertions(+), 11 deletions(-)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index ef571dc59c..32399ed4d8 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -630,7 +630,7 @@ install(FILES ${FLEXFLOW_HDR} DESTINATION ${INCLUDE_DEST})
 install(TARGETS flexflow DESTINATION ${LIB_DEST})
 # install python
 if (FF_USE_PYTHON)
-  execute_process(COMMAND ${PYTHON_EXECUTABLE} -c "from distutils import sysconfig; print(sysconfig.get_python_lib(plat_specific=False,standard_lib=False))" OUTPUT_VARIABLE PY_DEST OUTPUT_STRIP_TRAILING_WHITESPACE)
+  execute_process(COMMAND ${PYTHON_EXECUTABLE} -c "import site, os; print([pkg for func in (site.getsitepackages(), site.getusersitepackages()) for pkg in ([func] if isinstance(func, str) else func) if os.access(pkg, os.W_OK)][0])" OUTPUT_VARIABLE PY_DEST OUTPUT_STRIP_TRAILING_WHITESPACE)
   if (NOT FF_BUILD_FROM_PYPI)
     install(
       DIRECTORY ${FLEXFLOW_ROOT}/python/flexflow/
diff --git a/cmake/pip_install/CMakeLists.txt b/cmake/pip_install/CMakeLists.txt
index b7795daf71..7ce38c4abc 100644
--- a/cmake/pip_install/CMakeLists.txt
+++ b/cmake/pip_install/CMakeLists.txt
@@ -1,6 +1,6 @@
 # Use setup.py script to re-install the Python bindings library with the right library paths
 if (FF_USE_PYTHON)
-    execute_process(COMMAND ${PYTHON_EXECUTABLE} -c "from distutils import sysconfig; print(sysconfig.get_python_lib(plat_specific=False,standard_lib=False))" OUTPUT_VARIABLE PY_DEST OUTPUT_STRIP_TRAILING_WHITESPACE)  
+    execute_process(COMMAND ${PYTHON_EXECUTABLE} -c "import site, os; print([pkg for func in (site.getsitepackages(), site.getusersitepackages()) for pkg in ([func] if isinstance(func, str) else func) if os.access(pkg, os.W_OK)][0])" OUTPUT_VARIABLE PY_DEST OUTPUT_STRIP_TRAILING_WHITESPACE)  
     if(FF_BUILD_FROM_PYPI)
         install(CODE "execute_process(COMMAND ${CMAKE_COMMAND} -E echo \"Editing path to Legion library using path: ${PY_DEST}/flexflow/lib \")")
         # CMAKE_CURRENT_SOURCE_DIR=/usr/FlexFlow/cmake/pip_install 
diff --git a/python/flexflow/core/flexflowlib.py b/python/flexflow/core/flexflowlib.py
index 6fc8e52cf7..717696e4ae 100644
--- a/python/flexflow/core/flexflowlib.py
+++ b/python/flexflow/core/flexflowlib.py
@@ -12,7 +12,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 
-import os, platform
+import site, os, platform
 from typing import Any, Union
 
 from .flexflow_cffi_header import flexflow_header
@@ -47,14 +47,14 @@ def get_shared_library(self) -> str:
         libname = "libflexflow" + self.get_library_extension()
         
         # If we installed with pip, use the full path instead of just the library name, because the library will not be in the LD_LIBRARY_PATH
-        packages_dir = sysconfig.get_python_lib(plat_specific=False, standard_lib=False)
-        ff_lib_path = os.path.join(packages_dir, "flexflow", "lib", libname)
-        installed_with_pip = os.path.exists(ff_lib_path)
-
-        if installed_with_pip:
-            return ff_lib_path
-        else:
-            return libname
+        candidate_package_dirs = [pkg for func in (site.getsitepackages(), site.getusersitepackages()) for pkg in ([func] if isinstance(func, str) else func)]
+        candidate_package_dirs += sysconfig.get_python_lib(plat_specific=False, standard_lib=False)
+        for packages_dir in candidate_package_dirs:
+            ff_lib_path = os.path.join(packages_dir, "flexflow", "lib", libname)
+            installed_with_pip = os.path.exists(ff_lib_path)
+            if installed_with_pip:
+                return ff_lib_path
+        return libname
 
     def get_c_header(self) -> str:
         return self._header

From 65cb5706e74d380011db377429c6ed1fb911bde4 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sat, 30 Sep 2023 23:54:06 -0400
Subject: [PATCH 242/344] [Python] - Automatically install Rust with `pip
 install` if not available (#1161)

* install rust if not available

* fix

* fix

* fix

* cleanup
---
 setup.py | 15 +++++++++++++++
 1 file changed, 15 insertions(+)

diff --git a/setup.py b/setup.py
index 5cc4d72b20..ad48fb9367 100644
--- a/setup.py
+++ b/setup.py
@@ -98,6 +98,21 @@ def compute_version() -> str:
 with open(Path(__file__).parent / "requirements.txt", "r") as reqs_file:
     requirements = reqs_file.read().strip().split("\n")
 
+# Install Rust if not yet available
+try:
+    # Attempt to run a Rust command to check if Rust is installed
+    subprocess.check_output(['cargo', '--version'])
+except FileNotFoundError:
+    print("Rust/Cargo not found, installing it...")
+    # Rust is not installed, so install it using rustup
+    try:
+        subprocess.run("curl https://sh.rustup.rs -sSf | sh -s -- -y", shell=True, check=True)
+        print("Rust and Cargo installed successfully.")
+    except subprocess.CalledProcessError as e:
+        print(f"Error: {e}")
+    # Add the cargo binary directory to the PATH
+    os.environ["PATH"] = f"{os.path.join(os.environ.get('HOME', '/root'), '.cargo', 'bin')}:{os.environ.get('PATH', '')}"
+
 setup(
     name="flexflow",
     version=compute_version(),

From 5919fff9099b50a492edc1a9ce2d94a5868bc779 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 1 Oct 2023 05:47:32 -0400
Subject: [PATCH 243/344] Fix model configs (Falcon in C++, LLAMA in Python)
 (#1162)

* cleanup

* fix

* fix

* fix

* fix loading of weights

* import configs in models init (python)

* remove unnecessary warning
---
 inference/incr_decoding/incr_decoding.cc  |  2 +-
 inference/models/falcon.h                 |  8 +++-
 inference/spec_infer/spec_infer.cc        |  2 +-
 python/flexflow/core/__init__.py          |  3 +-
 python/flexflow/serve/models/__init__.py  | 10 ++---
 python/flexflow/serve/models/base.py      |  3 --
 python/flexflow/serve/models/falcon.py    | 25 ++---------
 python/flexflow/serve/models/llama.py     | 27 ++----------
 python/flexflow/serve/models/mpt.py       | 28 ++----------
 python/flexflow/serve/models/opt.py       | 28 ++----------
 python/flexflow/serve/models/starcoder.py | 28 ++----------
 python/flexflow/serve/serve.py            | 52 +++++++++++++----------
 12 files changed, 60 insertions(+), 156 deletions(-)

diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index 3f913e4573..f3fd32878f 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -168,7 +168,7 @@ void FlexFlow::top_level_task(Task const *task,
     } else if (str == "OPTForCausalLM") {
       model_type = ModelType::OPT;
       break;
-    } else if (str == "RWForCausalLM") {
+    } else if (str == "RWForCausalLM" || str == "FalconForCausalLM") {
       model_type = ModelType::FALCON;
       break;
     } else if (str == "GPTBigCodeForCausalLM") {
diff --git a/inference/models/falcon.h b/inference/models/falcon.h
index a822f9be34..6c9124fe4c 100644
--- a/inference/models/falcon.h
+++ b/inference/models/falcon.h
@@ -37,13 +37,17 @@ class FALCON {
           hidden_size = model_config["hidden_size"];
           layer_norm_epsilon = model_config["layer_norm_epsilon"];
           multi_query = model_config["multi_query"];
-          n_head = model_config["n_head"];
+          n_head = (model_config.find("n_head") != model_config.end())
+                       ? model_config["n_head"]
+                       : model_config["num_attention_heads"];
           if (model_config.contains("n_head_kv")) {
             n_head_kv = model_config["n_head_kv"];
           } else {
             n_head_kv = 1;
           }
-          n_layer = model_config["n_layer"];
+          n_layer = (model_config.find("n_layer") != model_config.end())
+                        ? model_config["n_layer"]
+                        : model_config["num_hidden_layers"];
           parallel_attn = model_config["parallel_attn"];
           vocab_size = model_config["vocab_size"];
         } catch (json::exception const &e) {
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 2b1fb6e817..a95b26c930 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -163,7 +163,7 @@ void get_model_meta(FilePaths &file_paths,
     } else if (str == "OPTForCausalLM") {
       model_metadata.llm_model_type = ModelType::OPT;
       break;
-    } else if (str == "RWForCausalLM") {
+    } else if (str == "RWForCausalLM" || str == "FalconForCausalLM") {
       model_metadata.llm_model_type = ModelType::FALCON;
       break;
     } else if (str == "MPTForCausalLM") {
diff --git a/python/flexflow/core/__init__.py b/python/flexflow/core/__init__.py
index 5e8e4ece81..ace6030a1b 100644
--- a/python/flexflow/core/__init__.py
+++ b/python/flexflow/core/__init__.py
@@ -124,7 +124,8 @@ def init_flexflow_runtime(configs_dict: Optional[dict] = None, **kwargs):
             # Pass parameters to the FlexFlow C++ runtime via command line arguments
             for arg in ff_args:
                 if arg not in ff_arg_to_sysarg:
-                    warnings.warn(f"Ignoring parameter {arg}: not recognized.")
+                    # warnings.warn(f"Ignoring parameter {arg}: not recognized.")
+                    continue
                 else:
                     sys_arg = [ff_arg_to_sysarg[arg]]
                     if type(ff_args[arg]) == bool:
diff --git a/python/flexflow/serve/models/__init__.py b/python/flexflow/serve/models/__init__.py
index a1ca9152ce..7b0e632f53 100644
--- a/python/flexflow/serve/models/__init__.py
+++ b/python/flexflow/serve/models/__init__.py
@@ -12,8 +12,8 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 
-from .llama import FlexFlowLLAMA
-from .opt import FlexFlowOPT
-from .falcon import FlexFlowFalcon
-from .starcoder import FlexFlowSTARCODER
-from .mpt import FlexFlowMPT
+from .llama import FlexFlowLLAMA, LLAMAConfig
+from .opt import FlexFlowOPT, OPTConfig
+from .falcon import FlexFlowFalcon, FalconConfig
+from .starcoder import FlexFlowSTARCODER, STARCODERConfig
+from .mpt import FlexFlowMPT, MPTConfig
diff --git a/python/flexflow/serve/models/base.py b/python/flexflow/serve/models/base.py
index b7f4e54fc1..19affd9b47 100644
--- a/python/flexflow/serve/models/base.py
+++ b/python/flexflow/serve/models/base.py
@@ -34,6 +34,3 @@ def build_model(self):
 
     def convert_hf_model(model, dst_folder):
         assert False, "Not implemented yet"
-
-    def get_layers_with_weights(self):
-        assert False, "Not implemented yet"
diff --git a/python/flexflow/serve/models/falcon.py b/python/flexflow/serve/models/falcon.py
index 2fd2f4953f..96268f5347 100644
--- a/python/flexflow/serve/models/falcon.py
+++ b/python/flexflow/serve/models/falcon.py
@@ -40,6 +40,9 @@ def __init__(self, hf_config):
         )
         self.parallel_attn = hf_config.parallel_attn
         self.vocab_size = hf_config.vocab_size
+        # Standardized FlexFlow num heads fields below
+        self.num_attention_heads = self.n_head
+        self.num_key_value_heads = self.n_head_kv
 
 
 class FlexFlowFalcon(FlexFlowModel):
@@ -277,25 +280,3 @@ def convert_hf_model(model, dst_folder):
         model.lm_head.weight.detach().cpu().numpy().tofile(
             os.path.join(dst_folder, "lm_head_weight")
         )
-
-    def get_layers_with_weights(self):
-        layer_names = [
-            "word_embeddings_weight",
-            "ln_f_weight",
-            "lm_head_weight",
-        ] + [
-            expr
-            for i in range(self.falcon_config.n_layer)
-            for expr in (
-                f"layers_{i}_input_layernorm_weight",
-                f"layers_{i}_attention_weight",
-                f"layers_{i}_mlp_dense_h_to_4h_weight",
-                f"layers_{i}_mlp_dense_4h_to_h_weight",
-            )
-        ]
-        layers_with_weights = {
-            layer_name: self.ffmodel.get_layer_by_name(layer_name)
-            for layer_name in layer_names
-        }
-
-        return layers_with_weights
diff --git a/python/flexflow/serve/models/llama.py b/python/flexflow/serve/models/llama.py
index b8ea85b287..ba2f6e0826 100644
--- a/python/flexflow/serve/models/llama.py
+++ b/python/flexflow/serve/models/llama.py
@@ -25,15 +25,16 @@ def __init__(self, hf_config):
         self.max_beam_depth = 8
         self.num_hidden_layers = hf_config.num_hidden_layers
         self.vocab_size = hf_config.vocab_size
+        self.hidden_size = hf_config.hidden_size
+        self.rms_norm_eps = hf_config.rms_norm_eps
+        self.intermediate_size = hf_config.intermediate_size
+        # Standardized FlexFlow num heads fields below
         self.num_attention_heads = hf_config.num_attention_heads
         self.num_key_value_heads = (
             hf_config.num_attention_heads
             if hf_config.num_key_value_heads is None
             else hf_config.num_key_value_heads
         )
-        self.hidden_size = hf_config.hidden_size
-        self.rms_norm_eps = hf_config.rms_norm_eps
-        self.intermediate_size = hf_config.intermediate_size
 
 
 class FlexFlowLLAMA(FlexFlowModel):
@@ -262,23 +263,3 @@ def convert_hf_model(model, dst_folder):
                 .replace("model_", "")
             )
             params.detach().cpu().numpy().tofile(f"{dst_folder}/{name}")
-
-    def get_layers_with_weights(self):
-        layer_names = ["tok_embeddings_weight", "norm_weight", "output_weight"] + [
-            expr
-            for i in range(self.llama_config.num_hidden_layers)
-            for expr in (
-                f"layers_{i}_attention_norm_weight",
-                f"layers_{i}_attention_weight",
-                f"layers_{i}_ffn_norm_weight",
-                f"layers_{i}_feed_forward_w1_weight",
-                f"layers_{i}_feed_forward_w3_weight",
-                f"layers_{i}_feed_forward_w2_weight",
-            )
-        ]
-        layers_with_weights = {
-            layer_name: self.ffmodel.get_layer_by_name(layer_name)
-            for layer_name in layer_names
-        }
-
-        return layers_with_weights
diff --git a/python/flexflow/serve/models/mpt.py b/python/flexflow/serve/models/mpt.py
index 6e1ca9fdfa..43a2514394 100644
--- a/python/flexflow/serve/models/mpt.py
+++ b/python/flexflow/serve/models/mpt.py
@@ -27,8 +27,9 @@ def __init__(self, hf_config):
         self.n_heads = hf_config.n_heads
         self.n_layers = hf_config.n_layers
         self.vocab_size = hf_config.vocab_size
-        hf_config.num_attention_heads = hf_config.n_heads
-        hf_config.hidden_size = hf_config.d_model
+        # Standardized FlexFlow num heads fields below
+        self.num_attention_heads = hf_config.n_heads
+        self.num_key_value_heads = hf_config.n_heads
 
 
 class FlexFlowMPT(FlexFlowModel):
@@ -274,26 +275,3 @@ def convert_hf_model(model, dst_folder):
             os.path.join(dst_folder, "transformer_wte_weight"),
             os.path.join(dst_folder, "lm_head_weight"),
         )
-
-    def get_layers_with_weights(self):
-        layer_names = [
-            "transformer_wte_weight",
-            "transformer_norm_f_weight",
-            "lm_head_weight",
-        ] + [
-            expr
-            for i in range(self.mpt_config.n_layers)
-            for expr in (
-                f"layers_{i}_norm_1_weight",
-                f"layers_{i}_attention_weight",
-                f"layers_{i}_norm_2_weight",
-                f"layers_{i}_ffn_up_proj_weight",
-                f"layers_{i}_ffn_down_proj_weight",
-            )
-        ]
-        layers_with_weights = {
-            layer_name: self.ffmodel.get_layer_by_name(layer_name)
-            for layer_name in layer_names
-        }
-
-        return layers_with_weights
diff --git a/python/flexflow/serve/models/opt.py b/python/flexflow/serve/models/opt.py
index 639be2d5c4..d51287a181 100644
--- a/python/flexflow/serve/models/opt.py
+++ b/python/flexflow/serve/models/opt.py
@@ -30,10 +30,12 @@ def __init__(self, hf_config):
         self.hidden_size = hf_config.hidden_size
         self.layer_norm_elementwise_affine = hf_config.layer_norm_elementwise_affine
         self.max_position_embeddings = hf_config.max_position_embeddings
-        self.num_attention_heads = hf_config.num_attention_heads
         self.num_hidden_layers = hf_config.num_hidden_layers
         self.vocab_size = hf_config.vocab_size
         self.word_embed_proj_dim = hf_config.word_embed_proj_dim
+        # Standardized FlexFlow num heads fields below
+        self.num_attention_heads = hf_config.num_attention_heads
+        self.num_key_value_heads = hf_config.num_attention_heads
 
 
 class FlexFlowOPT(FlexFlowModel):
@@ -297,27 +299,3 @@ def convert_hf_model(model, dst_folder):
             os.path.join(dst_folder, "embed_tokens_weight"),
             os.path.join(dst_folder, "embed_tokens_weight_lm_head"),
         )
-
-    def get_layers_with_weights(self):
-        layer_names = [
-            "embed_tokens_weight",
-            "embed_positions_weight",
-            "final_layer_norm_weight",
-            "embed_tokens_weight_lm_head",
-        ] + [
-            expr
-            for i in range(self.opt_config.num_hidden_layers)
-            for expr in (
-                f"layers_{i}_attention_layer_norm_weight",
-                f"layers_{i}_attention_weight",
-                f"layers_{i}_final_layer_norm_weight",
-                f"layers_{i}_fc1_weight",
-                f"layers_{i}_fc2_weight",
-            )
-        ]
-        layers_with_weights = {
-            layer_name: self.ffmodel.get_layer_by_name(layer_name)
-            for layer_name in layer_names
-        }
-
-        return layers_with_weights
diff --git a/python/flexflow/serve/models/starcoder.py b/python/flexflow/serve/models/starcoder.py
index feb5be7d75..4eee3182d1 100644
--- a/python/flexflow/serve/models/starcoder.py
+++ b/python/flexflow/serve/models/starcoder.py
@@ -27,11 +27,13 @@ def __init__(self, hf_config):
         self.hidden_size = hf_config.n_embd
         self.layer_norm_epsilon = hf_config.layer_norm_epsilon
         self.max_position_embeddings = hf_config.n_positions
-        self.num_attention_heads = hf_config.n_head
         self.num_hidden_layers = hf_config.n_layer
         self.vocab_size = hf_config.vocab_size
         self.intermediate_size = hf_config.n_inner
         self.n_head_kv = 1 if hf_config.multi_query else hf_config.n_head
+        # Standardized FlexFlow num heads fields below
+        self.num_attention_heads = hf_config.n_head
+        self.num_key_value_heads = self.n_head_kv
 
 
 class FlexFlowSTARCODER(FlexFlowModel):
@@ -266,27 +268,3 @@ def convert_hf_model(model, dst_folder):
         model.lm_head.weight.detach().cpu().numpy().tofile(
             os.path.join(dst_folder, "lm_head_weight")
         )
-
-    def get_layers_with_weights(self):
-        layer_names = [
-            "transformer_wte_weight",
-            "transformer_wpe_weight",
-            "transformer_ln_f_weight",
-            "lm_head_weight",
-        ] + [
-            expr
-            for i in range(self.starcoder_config.num_hidden_layers)
-            for expr in (
-                f"layers_{i}_ln_1_weight",
-                f"layers_{i}_attention_weight",
-                f"layers_{i}_ln_2_weight",
-                f"layers_{i}_mlp_c_fc_weight",
-                f"layers_{i}_mlp_c_proj_weight",
-            )
-        ]
-        layers_with_weights = {
-            layer_name: self.ffmodel.get_layer_by_name(layer_name)
-            for layer_name in layer_names
-        }
-
-        return layers_with_weights
diff --git a/python/flexflow/serve/serve.py b/python/flexflow/serve/serve.py
index 7e340a04e2..eace15f691 100644
--- a/python/flexflow/serve/serve.py
+++ b/python/flexflow/serve/serve.py
@@ -19,6 +19,13 @@
     FlexFlowSTARCODER,
     FlexFlowMPT,
 )
+from flexflow.serve.models import (
+    LLAMAConfig,
+    OPTConfig,
+    FalconConfig,
+    STARCODERConfig,
+    MPTConfig,
+)
 from flexflow.core import *
 from transformers import AutoConfig, AutoModelForCausalLM, AutoTokenizer, LlamaTokenizer
 from huggingface_hub import HfApi
@@ -86,17 +93,25 @@ def __init__(
         :type output_file: str, optional
         """
         self.supported_models = {
-            "LlamaForCausalLM": (ModelType.LLAMA, FlexFlowLLAMA),
-            "LLaMAForCausalLM": (ModelType.LLAMA, FlexFlowLLAMA),
-            "OPTForCausalLM": (ModelType.OPT, FlexFlowOPT),
-            "RWForCausalLM": (ModelType.FALCON, FlexFlowFalcon),
-            "FalconForCausalLM": (ModelType.FALCON, FlexFlowFalcon),
-            "GPTBigCodeForCausalLM": (ModelType.STARCODER, FlexFlowSTARCODER),
-            "MPTForCausalLM": (ModelType.MPT, FlexFlowMPT),
+            "LlamaForCausalLM": (ModelType.LLAMA, FlexFlowLLAMA, LLAMAConfig),
+            "LLaMAForCausalLM": (ModelType.LLAMA, FlexFlowLLAMA, LLAMAConfig),
+            "OPTForCausalLM": (ModelType.OPT, FlexFlowOPT, OPTConfig),
+            "RWForCausalLM": (ModelType.FALCON, FlexFlowFalcon, FalconConfig),
+            "FalconForCausalLM": (ModelType.FALCON, FlexFlowFalcon, FalconConfig),
+            "GPTBigCodeForCausalLM": (
+                ModelType.STARCODER,
+                FlexFlowSTARCODER,
+                STARCODERConfig,
+            ),
+            "MPTForCausalLM": (ModelType.MPT, FlexFlowMPT, MPTConfig),
         }
         self.hf_config = AutoConfig.from_pretrained(model_name, trust_remote_code=True)
         self.model_name = self.hf_config._name_or_path
-        self.model_type, self.model_class = self.__get_ff_model_type()
+        (
+            self.model_type,
+            self.model_class,
+            self.config_class,
+        ) = self.__get_ff_model_type()
         self.data_type = data_type
         assert self.data_type == DataType.DT_HALF or self.data_type == DataType.DT_FLOAT
         self.cache_path = cache_path if len(cache_path) > 0 else "~/.cache/flexflow"
@@ -274,23 +289,14 @@ def __load_hf_weights(self):
         self.download_hf_weights_if_needed()
 
         # Create file data loader, load weights into tensors
-        if (
-            self.model_type == ModelType.FALCON
-            or self.model_type == ModelType.STARCODER
-        ):
-            n_q_heads = self.hf_config.num_attention_heads
-            if "n_head_kv" in self.hf_config.__dict__:
-                n_kv_heads = self.hf_config.n_head_kv
-            else:
-                n_kv_heads = 1
-        else:
-            n_q_heads = n_kv_heads = self.hf_config.num_attention_heads
+        model_configs = self.config_class(self.hf_config)
+
         self.fileloader = FileDataLoader(
             self.weights_path,
-            n_q_heads,
-            n_kv_heads,
-            self.hf_config.hidden_size,
-            self.hf_config.hidden_size // n_q_heads,
+            model_configs.num_attention_heads,
+            model_configs.num_key_value_heads,
+            model_configs.hidden_size,
+            model_configs.hidden_size // model_configs.num_attention_heads,
             self.ffconfig.tensor_parallelism_degree,
         )
 

From d9a95ef5d722551046f93df40a884feb9c2959fe Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Sun, 1 Oct 2023 16:02:03 -0500
Subject: [PATCH 244/344] Make MAX_BATCH_SIZE, MAX_NUM_TOKENS, MAX_SEQ_LENGTH
 user-provided input arguments (#1018)

* add max_tokens_per_batch, max_requests_per_batch, and max_sequence_length in RequestManager

* initial implementation

* fix c++ examples

* fix

* .

* more tries to fix

* remove MAX_SEQ_LENGTH

---------

Co-authored-by: zwang86 <46699021+zwang86@users.noreply.github.com>
Co-authored-by: Xinhao Cheng <99570243+xinhaoc@users.noreply.github.com>
---
 include/flexflow/batch_config.h               |  11 +-
 include/flexflow/flexflow_c.h                 |   9 ++
 include/flexflow/request_manager.h            |  14 +-
 inference/incr_decoding/incr_decoding.cc      |  28 +++-
 inference/models/falcon.cc                    |   4 +-
 inference/models/falcon.h                     |  11 +-
 inference/models/llama.cc                     |   3 +-
 inference/models/llama.h                      |  11 +-
 inference/models/mpt.cc                       |   2 +-
 inference/models/mpt.h                        |   7 +-
 inference/models/opt.cc                       |   2 +-
 inference/models/opt.h                        |  11 +-
 inference/models/starcoder.cc                 |   4 +-
 inference/models/starcoder.h                  |   7 +-
 inference/python/incr_decoding.py             |   2 +-
 inference/python/spec_infer.py                |   4 +-
 inference/spec_infer/spec_infer.cc            |  28 +++-
 python/flexflow/core/flexflow_cffi.py         |  11 ++
 python/flexflow/serve/models/base.py          |   6 +-
 python/flexflow/serve/models/falcon.py        |  22 +--
 python/flexflow/serve/models/llama.py         |  22 +--
 python/flexflow/serve/models/mpt.py           |  22 +--
 python/flexflow/serve/models/opt.py           |  22 +--
 python/flexflow/serve/models/starcoder.py     |  22 +--
 python/flexflow/serve/serve.py                |  33 +++--
 src/c/flexflow_c.cc                           |  22 +++
 src/ops/beam_topk.cpp                         |  22 +--
 src/ops/beam_topk.cu                          |  23 +--
 src/ops/inc_multihead_self_attention.cc       | 135 ++++++++++--------
 src/ops/inc_multihead_self_attention.cpp      |  47 +++---
 src/ops/inc_multihead_self_attention.cu       |  61 ++++----
 src/ops/spec_inc_multihead_self_attention.cpp |  37 ++---
 src/ops/spec_inc_multihead_self_attention.cu  |  27 ++--
 src/ops/tree_inc_multihead_self_attention.cpp |  15 +-
 src/ops/tree_inc_multihead_self_attention.cu  |  15 +-
 src/runtime/batch_config.cc                   |  25 +++-
 src/runtime/beam_search_batch_config.cc       |  11 +-
 src/runtime/inference_manager.cc              |  10 +-
 src/runtime/model.cc                          |   2 +-
 src/runtime/request_manager.cc                |  99 +++++++++----
 src/runtime/request_manager.cpp               |   8 +-
 src/runtime/request_manager.cu                |   9 +-
 src/runtime/tree_verify_batch_config.cc       |   7 +-
 43 files changed, 547 insertions(+), 346 deletions(-)

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index d2fbd6219a..6dabc70f4b 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -43,12 +43,17 @@ class BatchConfig {
   BatchConfig();
   int num_active_requests() const;
   int num_active_tokens() const;
+  static int max_requests_per_batch();
+  static int max_tokens_per_batch();
+  static int max_sequence_length();
   void print() const;
   virtual InferenceMode get_mode() const;
   static BatchConfig const *from_future(BatchConfigFuture const &future);
-  static int const MAX_NUM_REQUESTS = 7;
-  static int const MAX_NUM_TOKENS = 64;
-  static int const MAX_SEQ_LENGTH = 256;
+  // Maximum possible values for different parameters
+  // These maximum values are used for copying BatchConfig
+  // across workers
+  static int const MAX_NUM_REQUESTS = 64;
+  static int const MAX_NUM_TOKENS = 1024;
 
   //  These are set by update
   int num_tokens;
diff --git a/include/flexflow/flexflow_c.h b/include/flexflow/flexflow_c.h
index db034a78c9..01a2818a2b 100644
--- a/include/flexflow/flexflow_c.h
+++ b/include/flexflow/flexflow_c.h
@@ -965,6 +965,15 @@ flexflow_request_manager_t flexflow_request_manager_get_request_manager(void);
 
 // void flexflow_request_manager_destroy(flexflow_request_manager_t handle_);
 
+void flexflow_request_manager_set_max_requests_per_batch(
+    flexflow_request_manager_t handle_, int max_num_requests);
+
+void flexflow_request_manager_set_max_tokens_per_batch(
+    flexflow_request_manager_t handle_, int max_num_tokens);
+
+void flexflow_request_manager_set_max_sequence_length(
+    flexflow_request_manager_t handle_, int max_seq_length);
+
 void flexflow_request_manager_register_tokenizer(
     flexflow_request_manager_t handle_,
     enum ModelType model_type,
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index 8515d8a04b..3081aaa1c2 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -30,7 +30,7 @@ using tokenizers::Tokenizer;
 
 class InferenceManager {
 public:
-  InferenceManager(FFConfig const &config, int max_num_tokens_per_batch);
+  InferenceManager(FFConfig const &config);
   static InferenceManager *get_inference_manager();
   void compile_model_and_allocate_buffer(FFModel *model);
   void init_operators_inference(FFModel *model);
@@ -46,7 +46,6 @@ class InferenceManager {
 public:
   FFConfig ff_config;
   std::unordered_map<ParallelTensor, std::vector<ParallelTensor>> tensor_buffer;
-  int max_num_tokens_per_batch;
   int num_devices;
 };
 
@@ -96,6 +95,12 @@ class RequestManager {
   size_t get_num_processed_requests();
   size_t get_num_ssms();
 
+  void set_max_requests_per_batch(int max_num_requests);
+  int get_max_requests_per_batch();
+  void set_max_tokens_per_batch(int max_num_tokens);
+  int get_max_tokens_per_batch();
+  void set_max_sequence_length(int max_seq_length);
+  int get_max_sequence_length();
   int register_ssm_model(FFModel *model);
   void register_tokenizer(ModelType model_type,
                           int bos_token_id,
@@ -201,6 +206,11 @@ class RequestManager {
       Legion::Runtime *runtime);
 
 private:
+  // configuration parameters
+  int max_requests_per_batch;
+  int max_tokens_per_batch;
+  int max_sequence_length;
+  // private fields
   std::unique_ptr<Tokenizer> tokenizer_;
   bool verbose;
   ModelType model_type;
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index f3fd32878f..463bc10151 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -43,7 +43,10 @@ void parse_input_args(char **argv,
                       bool &verbose,
                       bool &do_sample,
                       float &temperature,
-                      float &topp) {
+                      float &topp,
+                      int &max_requests_per_batch,
+                      int &max_tokens_per_batch,
+                      int &max_sequence_length) {
   for (int i = 1; i < argc; i++) {
     // llm model type
     if (!strcmp(argv[i], "-llm-model")) {
@@ -89,6 +92,18 @@ void parse_input_args(char **argv,
       topp = std::stof(argv[++i]);
       continue;
     }
+    if (!strcmp(argv[i], "--max-requests-per-batch")) {
+      max_requests_per_batch = std::stoi(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--max-tokens-per-batch")) {
+      max_tokens_per_batch = std::stoi(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--max-sequence-length")) {
+      max_sequence_length = std::stoi(argv[++i]);
+      continue;
+    }
   }
   if (paths.cache_folder_path.empty()) {
     paths.cache_folder_path = "~/.cache/flexflow";
@@ -115,6 +130,9 @@ void FlexFlow::top_level_task(Task const *task,
   bool do_sample = false;
   float temperature = 0.0f;
   float topp = 0.0f;
+  int max_requests_per_batch = 8;
+  int max_tokens_per_batch = 128;
+  int max_sequence_length = 256;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
   char **argv = command_args.argv;
@@ -127,7 +145,10 @@ void FlexFlow::top_level_task(Task const *task,
                    verbose,
                    do_sample,
                    temperature,
-                   topp);
+                   topp,
+                   max_requests_per_batch,
+                   max_tokens_per_batch,
+                   max_sequence_length);
 
   assert(ffconfig.data_parallelism_degree * ffconfig.tensor_parallelism_degree *
              ffconfig.pipeline_parallelism_degree ==
@@ -191,6 +212,9 @@ void FlexFlow::top_level_task(Task const *task,
 
   GenerationConfig generationConfig(do_sample, temperature, topp);
   RequestManager *rm = RequestManager::get_request_manager();
+  rm->set_max_requests_per_batch(max_requests_per_batch);
+  rm->set_max_tokens_per_batch(max_tokens_per_batch);
+  rm->set_max_sequence_length(max_sequence_length);
   rm->register_tokenizer(
       model_type, bos_token_id, eos_token_id, tokenizer_filepath);
   rm->register_output_filepath(file_paths.output_file_path);
diff --git a/inference/models/falcon.cc b/inference/models/falcon.cc
index 3be92a953c..553a2f0d3d 100644
--- a/inference/models/falcon.cc
+++ b/inference/models/falcon.cc
@@ -40,8 +40,8 @@ void FALCON::create_falcon_model(FFModel &ff,
 
   Tensor input;
   {
-    assert(falcon_config.max_num_tokens <= BatchConfig::MAX_NUM_TOKENS);
-    int const token_dims[] = {BatchConfig::MAX_NUM_TOKENS, 1};
+    // assert(falcon_config.max_num_tokens <= BatchConfig::MAX_NUM_TOKENS);
+    int const token_dims[] = {BatchConfig::max_tokens_per_batch(), 1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
 
diff --git a/inference/models/falcon.h b/inference/models/falcon.h
index 6c9124fe4c..01226a30dc 100644
--- a/inference/models/falcon.h
+++ b/inference/models/falcon.h
@@ -59,8 +59,8 @@ class FALCON {
                   << std::endl;
         assert(false);
       }
-      max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
-      max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
+      // max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
+      // max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
       max_beam_width = BeamSearchBatchConfig::MAX_BEAM_WIDTH;
       max_beam_depth = BeamSearchBatchConfig::MAX_BEAM_DEPTH;
     }
@@ -77,8 +77,8 @@ class FALCON {
       std::cout << "\tparallel_attn: " << parallel_attn << std::endl;
       std::cout << "\tvocab_size: " << vocab_size << std::endl;
 
-      std::cout << "\tmax_seq_len: " << max_seq_len << std::endl;
-      std::cout << "\tmax_num_tokens: " << max_num_tokens << std::endl;
+      // std::cout << "\tmax_seq_len: " << max_seq_len << std::endl;
+      // std::cout << "\tmax_num_tokens: " << max_num_tokens << std::endl;
       std::cout << "\tmax_beam_width: " << max_beam_width << std::endl;
       std::cout << "\tmax_beam_depth: " << max_beam_depth << std::endl;
     }
@@ -86,7 +86,8 @@ class FALCON {
     bool bias, multi_query, parallel_attn;
     int hidden_size, n_head, n_head_kv, n_layer, vocab_size;
     float layer_norm_epsilon;
-    int max_seq_len, max_num_tokens, max_beam_width, max_beam_depth;
+    // int max_seq_len, max_num_tokens;
+    int max_beam_width, max_beam_depth;
   };
 
   static void create_falcon_model(FFModel &ff,
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index 56f919ace1..b8fe70526d 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -41,8 +41,7 @@ void LLAMA::create_llama_model(FFModel &ff,
 
   Tensor input;
   {
-    assert(llama_config.max_num_tokens <= BatchConfig::MAX_NUM_TOKENS);
-    int const token_dims[] = {BatchConfig::MAX_NUM_TOKENS, 1};
+    int const token_dims[] = {BatchConfig::max_tokens_per_batch(), 1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
 
diff --git a/inference/models/llama.h b/inference/models/llama.h
index f01a7dbd52..8ecfcd7155 100644
--- a/inference/models/llama.h
+++ b/inference/models/llama.h
@@ -49,8 +49,8 @@ class LLAMA {
                   << std::endl;
         assert(false);
       }
-      max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
-      max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
+      // max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
+      // max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
       max_beam_width = BeamSearchBatchConfig::MAX_BEAM_WIDTH;
       max_beam_depth = BeamSearchBatchConfig::MAX_BEAM_DEPTH;
     }
@@ -65,13 +65,14 @@ class LLAMA {
       std::cout << "\trms_norm_eps: " << rms_norm_eps << std::endl;
       std::cout << "\tintermediate_size: " << intermediate_size << std::endl;
 
-      std::cout << "\tmax_seq_len: " << max_seq_len << std::endl;
-      std::cout << "\tmax_num_tokens: " << max_num_tokens << std::endl;
+      // std::cout << "\tmax_seq_len: " << max_seq_len << std::endl;
+      // std::cout << "\tmax_num_tokens: " << max_num_tokens << std::endl;
       std::cout << "\tmax_beam_width: " << max_beam_width << std::endl;
       std::cout << "\tmax_beam_depth: " << max_beam_depth << std::endl;
     }
 
-    int max_seq_len, max_num_tokens, max_beam_width, max_beam_depth;
+    // int max_seq_len, max_num_tokens;
+    int max_beam_width, max_beam_depth;
     int num_hidden_layers, vocab_size, num_attention_heads, hidden_size,
         intermediate_size;
     float rms_norm_eps;
diff --git a/inference/models/mpt.cc b/inference/models/mpt.cc
index 3bd1b912ed..b074d332ed 100644
--- a/inference/models/mpt.cc
+++ b/inference/models/mpt.cc
@@ -40,7 +40,7 @@ void MPT::create_mpt_model(FFModel &ff,
   //------------------------------ build the model --------------------------
   Tensor input;
   {
-    int const token_dims[] = {BatchConfig::MAX_NUM_TOKENS, 1};
+    int const token_dims[] = {BatchConfig::max_tokens_per_batch(), 1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
 
diff --git a/inference/models/mpt.h b/inference/models/mpt.h
index 437e0cb247..1969cd9c89 100644
--- a/inference/models/mpt.h
+++ b/inference/models/mpt.h
@@ -46,8 +46,8 @@ class MPT {
                   << std::endl;
         assert(false);
       }
-      max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
-      max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
+      // max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
+      // max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
       max_beam_width = BeamSearchBatchConfig::MAX_BEAM_WIDTH;
       max_beam_depth = BeamSearchBatchConfig::MAX_BEAM_DEPTH;
     }
@@ -60,7 +60,8 @@ class MPT {
       std::cout << "\tvocab_size: " << vocab_size << std::endl;
     }
 
-    int max_seq_len, max_num_tokens, max_beam_width, max_beam_depth;
+    // int max_seq_len, max_num_tokens;
+    int max_beam_width, max_beam_depth;
     int hidden_size, n_heads, n_layers, vocab_size;
   };
 
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index cdab25bfca..9b29ae5410 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -42,7 +42,7 @@ void OPT::create_opt_model(FFModel &ff,
   Tensor position_input;
   ff.set_position_offset(2);
   {
-    int const token_dims[] = {BatchConfig::MAX_NUM_TOKENS, 1};
+    int const token_dims[] = {BatchConfig::max_tokens_per_batch(), 1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
     position_input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
diff --git a/inference/models/opt.h b/inference/models/opt.h
index ab972ae10c..1ffe096bca 100644
--- a/inference/models/opt.h
+++ b/inference/models/opt.h
@@ -54,8 +54,8 @@ class OPT {
                   << std::endl;
         assert(false);
       }
-      max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
-      max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
+      // max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
+      // max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
       max_beam_width = BeamSearchBatchConfig::MAX_BEAM_WIDTH;
       max_beam_depth = BeamSearchBatchConfig::MAX_BEAM_DEPTH;
     }
@@ -79,13 +79,14 @@ class OPT {
       std::cout << "\tword_embed_proj_dim: " << word_embed_proj_dim
                 << std::endl;
 
-      std::cout << "\tmax_seq_len: " << max_seq_len << std::endl;
-      std::cout << "\tmax_num_tokens: " << max_num_tokens << std::endl;
+      // std::cout << "\tmax_seq_len: " << max_seq_len << std::endl;
+      // std::cout << "\tmax_num_tokens: " << max_num_tokens << std::endl;
       std::cout << "\tmax_beam_width: " << max_beam_width << std::endl;
       std::cout << "\tmax_beam_depth: " << max_beam_depth << std::endl;
     }
 
-    int max_seq_len, max_num_tokens, max_beam_width, max_beam_depth;
+    // int max_seq_len, max_num_tokens;
+    int max_beam_width, max_beam_depth;
     bool do_layer_norm_before, enable_bias, layer_norm_elementwise_affine;
     float dropout;
     int ffn_dim, hidden_size, max_position_embeddings, num_attention_heads,
diff --git a/inference/models/starcoder.cc b/inference/models/starcoder.cc
index 89b53b1cf5..ba7b2cb43a 100644
--- a/inference/models/starcoder.cc
+++ b/inference/models/starcoder.cc
@@ -47,8 +47,8 @@ void STARCODER::create_starcoder_model(
   Tensor position_input;
   ff.set_position_offset(0);
   {
-    assert(startcoder_config.max_num_tokens <= BatchConfig::MAX_NUM_TOKENS);
-    int const token_dims[] = {BatchConfig::MAX_NUM_TOKENS, 1};
+    // assert(startcoder_config.max_num_tokens <= BatchConfig::MAX_NUM_TOKENS);
+    int const token_dims[] = {BatchConfig::max_tokens_per_batch(), 1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
     position_input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
diff --git a/inference/models/starcoder.h b/inference/models/starcoder.h
index 9789a1c36e..bc113e4d52 100644
--- a/inference/models/starcoder.h
+++ b/inference/models/starcoder.h
@@ -51,15 +51,16 @@ class STARCODER {
                   << std::endl;
         assert(false);
       }
-      max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
-      max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
+      // max_seq_len = BatchConfig::MAX_SEQ_LENGTH;
+      // max_num_tokens = BatchConfig::MAX_NUM_TOKENS;
       max_beam_width = BeamSearchBatchConfig::MAX_BEAM_WIDTH;
       max_beam_depth = BeamSearchBatchConfig::MAX_BEAM_DEPTH;
     }
 
     void print() const {}
 
-    int max_seq_len, max_num_tokens, max_beam_width, max_beam_depth;
+    // int max_seq_len, max_num_tokens;
+    int max_beam_width, max_beam_depth;
     int num_hidden_layers, vocab_size, num_attention_heads, hidden_size,
         intermediate_size, max_position_embeddings;
     float layer_norm_epsilon, dropout_p;
diff --git a/inference/python/incr_decoding.py b/inference/python/incr_decoding.py
index 1ed7791143..d8a494b4d5 100644
--- a/inference/python/incr_decoding.py
+++ b/inference/python/incr_decoding.py
@@ -97,7 +97,7 @@ def main():
     )
     llm.compile(
         generation_config,
-        max_batch_size=1,
+        max_requests_per_batch=1,
         max_seq_length=256,
         max_tokens_per_batch=64,
     )
diff --git a/inference/python/spec_infer.py b/inference/python/spec_infer.py
index 7dc6635819..c9e87bd29f 100644
--- a/inference/python/spec_infer.py
+++ b/inference/python/spec_infer.py
@@ -134,7 +134,7 @@ def main():
     for ssm in ssms:
         ssm.compile(
             generation_config,
-            max_batch_size=1,
+            max_requests_per_batch=1,
             max_seq_length=256,
             max_tokens_per_batch=64,
         )
@@ -142,7 +142,7 @@ def main():
     # Compile the LLM for inference and load the weights into memory
     llm.compile(
         generation_config,
-        max_batch_size=1,
+        max_requests_per_batch=1,
         max_seq_length=256,
         max_tokens_per_batch=64,
         ssms=ssms,
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index a95b26c930..98b5ec4633 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -58,7 +58,10 @@ void parse_input_args(char **argv,
                       FilePaths &paths,
                       ModelNames &model_names,
                       bool &use_full_precision,
-                      bool &verbose) {
+                      bool &verbose,
+                      int &max_requests_per_batch,
+                      int &max_tokens_per_batch,
+                      int &max_sequence_length) {
   for (int i = 1; i < argc; i++) {
     // llm model name
     if (!strcmp(argv[i], "-llm-model")) {
@@ -101,6 +104,18 @@ void parse_input_args(char **argv,
       verbose = true;
       continue;
     }
+    if (!strcmp(argv[i], "--max-requests-per-batch")) {
+      max_requests_per_batch = std::stoi(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--max-tokens-per-batch")) {
+      max_tokens_per_batch = std::stoi(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--max-sequence-length")) {
+      max_sequence_length = std::stoi(argv[++i]);
+      continue;
+    }
   }
   if (paths.cache_folder_path.empty()) {
     paths.cache_folder_path = "~/.cache/flexflow";
@@ -265,6 +280,9 @@ void FlexFlow::top_level_task(Task const *task,
   ModelMeta model_metadata;
   bool use_full_precision = false;
   bool verbose = false;
+  int max_requests_per_batch = 16;
+  int max_tokens_per_batch = 256;
+  int max_sequence_length = 1024;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
   char **argv = command_args.argv;
@@ -274,7 +292,10 @@ void FlexFlow::top_level_task(Task const *task,
                    file_paths,
                    model_metadata.model_names,
                    use_full_precision,
-                   verbose);
+                   verbose,
+                   max_requests_per_batch,
+                   max_tokens_per_batch,
+                   max_sequence_length);
 
   get_model_meta(file_paths, model_metadata, use_full_precision);
 
@@ -286,6 +307,9 @@ void FlexFlow::top_level_task(Task const *task,
   GenerationConfig generationConfig;
   InferenceManager *im = InferenceManager::get_inference_manager();
   RequestManager *rm = RequestManager::get_request_manager();
+  rm->set_max_requests_per_batch(max_requests_per_batch);
+  rm->set_max_tokens_per_batch(max_tokens_per_batch);
+  rm->set_max_sequence_length(max_sequence_length);
   rm->register_tokenizer(model_metadata.llm_model_type,
                          model_metadata.bos_token_id,
                          model_metadata.eos_token_id,
diff --git a/python/flexflow/core/flexflow_cffi.py b/python/flexflow/core/flexflow_cffi.py
index b029f1e2ff..de3f7e6929 100644
--- a/python/flexflow/core/flexflow_cffi.py
+++ b/python/flexflow/core/flexflow_cffi.py
@@ -4187,6 +4187,17 @@ def register_ssm_model(self, model):
             self.handle, model.handle
         )
 
+    def set_max_requests_per_batch(self, max_requests):
+        return ffc().flexflow_request_manager_set_max_requests_per_batch(
+            self.handle, max_requests)
+    
+    def set_max_tokens_per_batch(self, max_tokens):
+        return ffc().flexflow_request_manager_set_max_tokens_per_batch(
+            self.handle, max_tokens)
+    
+    def set_max_sequence_length(self, max_length):
+        return ffc().flexflow_request_manager_set_max_sequence_length(
+            self.handle, max_length)
 
 # -----------------------------------------------------------------------
 # InferenceManager
diff --git a/python/flexflow/serve/models/base.py b/python/flexflow/serve/models/base.py
index 19affd9b47..025008ec78 100644
--- a/python/flexflow/serve/models/base.py
+++ b/python/flexflow/serve/models/base.py
@@ -21,9 +21,9 @@ def __init__(
         ffconfig,
         hf_config,
         data_type,
-        max_batch_size=1,
-        max_seq_length=256,
-        max_tokens_per_batch=64,
+        #max_batch_size=1,
+        #max_seq_length=256,
+        #max_tokens_per_batch=64,
         weights_filepath="",
         tokenizer_filepath="",
     ):
diff --git a/python/flexflow/serve/models/falcon.py b/python/flexflow/serve/models/falcon.py
index 96268f5347..9a1bca48c4 100644
--- a/python/flexflow/serve/models/falcon.py
+++ b/python/flexflow/serve/models/falcon.py
@@ -19,8 +19,8 @@
 
 class FalconConfig:
     def __init__(self, hf_config):
-        self.max_seq_len = 256
-        self.max_num_tokens = 64
+        #self.max_seq_len = 256
+        #self.max_num_tokens = 64
         self.max_beam_width = 1
         self.max_beam_depth = 8
         self.bias = hf_config.bias
@@ -53,20 +53,20 @@ def __init__(
         ffconfig,
         hf_config,
         data_type,
-        max_batch_size=1,
-        max_seq_length=256,
-        max_tokens_per_batch=64,
+        #max_batch_size=1,
+        #max_seq_length=256,
+        max_tokens_per_batch,
         weights_filepath="",
         tokenizer_filepath="",
     ):
         self.mode = mode
         self.generation_config = generation_config
         self.ffconfig = ffconfig
-        self.max_batch_size = max_batch_size
+        #self.max_batch_size = max_batch_size
         self.data_type = data_type
         self.falcon_config = FalconConfig(hf_config)
-        self.falcon_config.max_seq_length = max_seq_length
-        self.falcon_config.max_num_tokens = max_tokens_per_batch
+        #self.falcon_config.max_seq_length = max_seq_length
+        #self.falcon_config.max_num_tokens = max_tokens_per_batch
         self.weights_filepath = weights_filepath
         self.tokenizer_filepath = tokenizer_filepath
         self.maxint = 2**31 - 1
@@ -92,12 +92,12 @@ def __init__(
                 f"Number of k/v attention heads ({self.falcon_config.n_head_kv}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
             )
 
-        self.build_model()
+        self.build_model(max_tokens_per_batch)
 
-    def build_model(self):
+    def build_model(self, max_tokens_per_batch):
         ffmodel = FFModel(self.ffconfig)
 
-        tokens_dims = [self.falcon_config.max_num_tokens, 1]
+        tokens_dims = [max_tokens_per_batch, 1]
         input_tensor = ffmodel.create_tensor(tokens_dims, DataType.DT_INT32)
 
         embed_init = UniformInitializer(random.randint(0, self.maxint), 0, 0)
diff --git a/python/flexflow/serve/models/llama.py b/python/flexflow/serve/models/llama.py
index ba2f6e0826..7ba0e78a37 100644
--- a/python/flexflow/serve/models/llama.py
+++ b/python/flexflow/serve/models/llama.py
@@ -19,8 +19,8 @@
 
 class LLAMAConfig:
     def __init__(self, hf_config):
-        self.max_seq_len = 256
-        self.max_num_tokens = 64
+        #self.max_seq_len = 256
+        #self.max_num_tokens = 64
         self.max_beam_width = 1
         self.max_beam_depth = 8
         self.num_hidden_layers = hf_config.num_hidden_layers
@@ -45,20 +45,20 @@ def __init__(
         ffconfig,
         hf_config,
         data_type,
-        max_batch_size=1,
-        max_seq_length=256,
-        max_tokens_per_batch=64,
+        #max_batch_size=1,
+        #max_seq_length=256,
+        max_tokens_per_batch,
         weights_filepath="",
         tokenizer_filepath="",
     ):
         self.mode = mode
         self.generation_config = generation_config
         self.ffconfig = ffconfig
-        self.max_batch_size = max_batch_size
+        #self.max_batch_size = max_batch_size
         self.data_type = data_type
         self.llama_config = LLAMAConfig(hf_config)
-        self.llama_config.max_seq_length = max_seq_length
-        self.llama_config.max_num_tokens = max_tokens_per_batch
+        #self.llama_config.max_seq_length = max_seq_length
+        #self.llama_config.max_num_tokens = max_tokens_per_batch
         self.weights_filepath = weights_filepath
         self.tokenizer_filepath = tokenizer_filepath
         self.maxint = 2**31 - 1
@@ -81,12 +81,12 @@ def __init__(
                 f"Number of attention heads ({self.llama_config.num_attention_heads}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
             )
 
-        self.build_model()
+        self.build_model(max_tokens_per_batch)
 
-    def build_model(self):
+    def build_model(self, max_tokens_per_batch):
         ffmodel = FFModel(self.ffconfig)
 
-        tokens_dims = [self.llama_config.max_num_tokens, 1]
+        tokens_dims = [max_tokens_per_batch, 1]
         input_tensor = ffmodel.create_tensor(tokens_dims, DataType.DT_INT32)
 
         embed_init = UniformInitializer(random.randint(0, self.maxint), 0, 0)
diff --git a/python/flexflow/serve/models/mpt.py b/python/flexflow/serve/models/mpt.py
index 43a2514394..79a5bb940f 100644
--- a/python/flexflow/serve/models/mpt.py
+++ b/python/flexflow/serve/models/mpt.py
@@ -19,8 +19,8 @@
 
 class MPTConfig:
     def __init__(self, hf_config):
-        self.max_seq_len = 256
-        self.max_num_tokens = 64
+        #self.max_seq_len = 256
+        #self.max_num_tokens = 64
         self.max_beam_width = 1
         self.max_beam_depth = 8
         self.hidden_size = hf_config.d_model
@@ -40,20 +40,20 @@ def __init__(
         ffconfig,
         hf_config,
         data_type,
-        max_batch_size=1,
-        max_seq_length=256,
-        max_tokens_per_batch=64,
+        #max_batch_size=1,
+        #max_seq_length=256,
+        max_tokens_per_batch,
         weights_filepath="",
         tokenizer_filepath="",
     ):
         self.mode = mode
         self.generation_config = generation_config
         self.ffconfig = ffconfig
-        self.max_batch_size = max_batch_size
+        #self.max_batch_size = max_batch_size
         self.data_type = data_type
         self.mpt_config = MPTConfig(hf_config)
-        self.mpt_config.max_seq_length = max_seq_length
-        self.mpt_config.max_num_tokens = max_tokens_per_batch
+        #self.mpt_config.max_seq_length = max_seq_length
+        #self.mpt_config.max_num_tokens = max_tokens_per_batch
         self.weights_filepath = weights_filepath
         self.tokenizer_filepath = tokenizer_filepath
         self.maxint = 2**31 - 1
@@ -72,12 +72,12 @@ def __init__(
             raise ValueError(
                 f"Number of attention heads ({self.mpt_config.n_heads}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
             )
-        self.build_model()
+        self.build_model(max_tokens_per_batch)
 
-    def build_model(self):
+    def build_model(self, max_tokens_per_batch):
         ffmodel = FFModel(self.ffconfig)
 
-        tokens_dims = [self.mpt_config.max_num_tokens, 1]
+        tokens_dims = [max_tokens_per_batch, 1]
         input = ffmodel.create_tensor(tokens_dims, DataType.DT_INT32)
 
         embed_init = UniformInitializer(random.randint(0, self.maxint), 0, 0)
diff --git a/python/flexflow/serve/models/opt.py b/python/flexflow/serve/models/opt.py
index d51287a181..dfd1cde7d4 100644
--- a/python/flexflow/serve/models/opt.py
+++ b/python/flexflow/serve/models/opt.py
@@ -19,8 +19,8 @@
 
 class OPTConfig:
     def __init__(self, hf_config):
-        self.max_seq_len = 256
-        self.max_num_tokens = 64
+        #self.max_seq_len = 256
+        #self.max_num_tokens = 64
         self.max_beam_width = 1
         self.max_beam_depth = 8
         self.do_layer_norm_before = hf_config.do_layer_norm_before
@@ -46,20 +46,20 @@ def __init__(
         ffconfig,
         hf_config,
         data_type,
-        max_batch_size=1,
-        max_seq_length=256,
-        max_tokens_per_batch=64,
+        #max_batch_size=1,
+        #max_seq_length=256,
+        max_tokens_per_batch,
         weights_filepath="",
         tokenizer_filepath="",
     ):
         self.mode = mode
         self.generation_config = generation_config
         self.ffconfig = ffconfig
-        self.max_batch_size = max_batch_size
+        #self.max_batch_size = max_batch_size
         self.data_type = data_type
         self.opt_config = OPTConfig(hf_config)
-        self.opt_config.max_seq_length = max_seq_length
-        self.opt_config.max_num_tokens = max_tokens_per_batch
+        #self.opt_config.max_seq_length = max_seq_length
+        #self.opt_config.max_num_tokens = max_tokens_per_batch
         self.weights_filepath = weights_filepath
         self.tokenizer_filepath = tokenizer_filepath
         self.maxint = 2**31 - 1
@@ -82,12 +82,12 @@ def __init__(
                 f"Number of attention heads ({self.opt_config.num_attention_heads}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
             )
 
-        self.build_model()
+        self.build_model(max_tokens_per_batch)
 
-    def build_model(self):
+    def build_model(self, max_tokens_per_batch):
         ffmodel = FFModel(self.ffconfig)
 
-        tokens_dims = [self.opt_config.max_num_tokens, 1]
+        tokens_dims = [max_tokens_per_batch, 1]
         input_tensor = ffmodel.create_tensor(tokens_dims, DataType.DT_INT32)
         position_tensor = ffmodel.create_tensor(tokens_dims, DataType.DT_INT32)
 
diff --git a/python/flexflow/serve/models/starcoder.py b/python/flexflow/serve/models/starcoder.py
index 4eee3182d1..33b0b26ff8 100644
--- a/python/flexflow/serve/models/starcoder.py
+++ b/python/flexflow/serve/models/starcoder.py
@@ -19,8 +19,8 @@
 
 class STARCODERConfig:
     def __init__(self, hf_config):
-        self.max_seq_len = 256
-        self.max_num_tokens = 64
+        #self.max_seq_len = 256
+        #self.max_num_tokens = 64
         self.max_beam_width = 1
         self.max_beam_depth = 8
         self.dropout_p = hf_config.attn_pdrop
@@ -44,20 +44,20 @@ def __init__(
         ffconfig,
         hf_config,
         data_type,
-        max_batch_size=1,
-        max_seq_length=256,
-        max_tokens_per_batch=64,
+        #max_batch_size=1,
+        #max_seq_length=256,
+        max_tokens_per_batch,
         weights_filepath="",
         tokenizer_filepath="",
     ):
         self.mode = mode
         self.generation_config = generation_config
         self.ffconfig = ffconfig
-        self.max_batch_size = max_batch_size
+        #self.max_batch_size = max_batch_size
         self.data_type = data_type
         self.starcoder_config = STARCODERConfig(hf_config)
-        self.starcoder_config.max_seq_length = max_seq_length
-        self.starcoder_config.max_num_tokens = max_tokens_per_batch
+        #self.starcoder_config.max_seq_length = max_seq_length
+        #self.starcoder_config.max_num_tokens = max_tokens_per_batch
         self.weights_filepath = weights_filepath
         self.tokenizer_filepath = tokenizer_filepath
         self.maxint = 2**31 - 1
@@ -92,12 +92,12 @@ def __init__(
                 f"Number of k/v attention heads ({self.starcoder_config.n_head_kv}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
             )
 
-        self.build_model()
+        self.build_model(max_tokens_per_batch)
 
-    def build_model(self):
+    def build_model(self, max_tokens_per_batch):
         ffmodel = FFModel(self.ffconfig)
 
-        tokens_dims = [self.starcoder_config.max_num_tokens, 1]
+        tokens_dims = [max_tokens_per_batch, 1]
         input_tensor = ffmodel.create_tensor(tokens_dims, DataType.DT_INT32)
         position_tensor = ffmodel.create_tensor(tokens_dims, DataType.DT_INT32)
 
diff --git a/python/flexflow/serve/serve.py b/python/flexflow/serve/serve.py
index eace15f691..549677d77a 100644
--- a/python/flexflow/serve/serve.py
+++ b/python/flexflow/serve/serve.py
@@ -305,7 +305,7 @@ def __load_hf_weights(self):
     def compile(
         self,
         generation_config: GenerationConfig = GenerationConfig(),
-        max_batch_size: int = 1,
+        max_requests_per_batch: int = 1,
         max_seq_length: int = 256,
         max_tokens_per_batch: int = 64,
         model_specific_data_parallelism_degree: int = None,
@@ -319,8 +319,8 @@ def compile(
         :type mode: InferenceMode, optional
         :param generation_config: The GenerationConfig object with the configurations to use for sampling, defaults to GenerationConfig()
         :type generation_config: GenerationConfig, optional
-        :param max_batch_size: The maximum batch size to allow, defaults to 1
-        :type max_batch_size: int, optional
+        :param max_requests_per_batch: The maximum batch size to allow, defaults to 1
+        :type max_requests_per_batch: int, optional
         :param max_seq_length: The maximum sequence length to allow per batch, defaults to 256
         :type max_seq_length: int, optional
         :param max_tokens_per_batch: The maximum number of tokens (across requests) to allow per batch, defaults to 64
@@ -334,9 +334,9 @@ def compile(
         :param ssms: The SSMs to use when operating in speculative inference mode, defaults to []
         :type ssms: list, optional
         """
-        self.max_batch_size = max_batch_size
-        self.max_seq_length = max_seq_length
-        self.max_tokens_per_batch = max_tokens_per_batch
+        #self.max_requests_per_batch = max_requests_per_batch
+        #self.max_seq_length = max_seq_length
+        #self.max_tokens_per_batch = max_tokens_per_batch
         self.ssms = ssms
         self.generation_config = GenerationConfig()
         self.ffconfig = FFConfig()
@@ -363,6 +363,12 @@ def compile(
                 model_specific_pipeline_parallelism_degree
             )
 
+        # Create request manager and set serving configuration
+        self.rm = RequestManager()
+        self.rm.set_max_requests_per_batch(max_requests_per_batch)
+        self.rm.set_max_tokens_per_batch(max_tokens_per_batch)
+        self.rm.set_max_sequence_length(max_seq_length)
+
         # Instantiate the relevant model
         self.model = self.model_class(
             mode,
@@ -370,9 +376,7 @@ def compile(
             self.ffconfig,
             self.hf_config,
             self.data_type,
-            max_batch_size,
-            max_seq_length,
-            max_tokens_per_batch,
+            max_tokens_per_batch
         )
 
         # Create inference manager
@@ -383,8 +387,7 @@ def compile(
         self.__load_hf_weights()
         self.download_hf_tokenizer_if_needed()
 
-        # Create request manager
-        self.rm = RequestManager()
+        # Create tokenizer (this must be done after we have downloaded the tokenizer
         bos_token_id = (
             -1 if self.hf_config.bos_token_id is None else self.hf_config.bos_token_id
         )
@@ -458,7 +461,7 @@ def __init__(
     def compile(
         self,
         generation_config: GenerationConfig = GenerationConfig(),
-        max_batch_size: int = 1,
+        max_requests_per_batch: int = 1,
         max_seq_length: int = 256,
         max_tokens_per_batch: int = 64,
         model_specific_data_parallelism_degree: int = 1,
@@ -472,8 +475,8 @@ def compile(
         :type mode: InferenceMode, optional
         :param generation_config: The GenerationConfig object with the configurations to use for sampling, defaults to GenerationConfig()
         :type generation_config: GenerationConfig, optional
-        :param max_batch_size: The maximum batch size to allow, defaults to 1
-        :type max_batch_size: int, optional
+        :param max_requests_per_batch: The maximum batch size to allow, defaults to 1
+        :type max_requests_per_batch: int, optional
         :param max_seq_length: The maximum sequence length to allow per batch, defaults to 256
         :type max_seq_length: int, optional
         :param max_tokens_per_batch: The maximum number of tokens (across requests) to allow per batch, defaults to 64
@@ -489,7 +492,7 @@ def compile(
         """
         super().compile(
             generation_config,
-            max_batch_size,
+            max_requests_per_batch,
             max_seq_length,
             max_tokens_per_batch,
             model_specific_data_parallelism_degree,
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index 3684725c0a..5bb5249f5d 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -2551,6 +2551,28 @@ flexflow_request_manager_t flexflow_request_manager_get_request_manager(void) {
   return FFCObjectWrapper::wrap(rm);
 }
 
+void flexflow_request_manager_set_max_requests_per_batch(
+    flexflow_request_manager_t handle_, int max_num_requests) {
+  RequestManager *handle = FFCObjectWrapper::unwrap(handle_);
+  handle->set_max_requests_per_batch(max_num_requests);
+  DEBUG_PRINT("[RequestManager] set max_requests_per_batch %d",
+              max_num_requests);
+}
+
+void flexflow_request_manager_set_max_tokens_per_batch(
+    flexflow_request_manager_t handle_, int max_num_tokens) {
+  RequestManager *handle = FFCObjectWrapper::unwrap(handle_);
+  handle->set_max_tokens_per_batch(max_num_tokens);
+  DEBUG_PRINT("[RequestManager] set max_tokens_per_batch %d", max_num_tokens);
+}
+
+void flexflow_request_manager_set_max_sequence_length(
+    flexflow_request_manager_t handle_, int max_seq_length) {
+  RequestManager *handle = FFCObjectWrapper::unwrap(handle_);
+  handle->set_max_sequence_length(max_seq_length);
+  DEBUG_PRINT("[RequestManager] set max_sequence_length %d", max_seq_length);
+}
+
 void flexflow_request_manager_register_tokenizer(
     flexflow_request_manager_t handle_,
     enum ModelType model_type,
diff --git a/src/ops/beam_topk.cpp b/src/ops/beam_topk.cpp
index 5ee260714d..18534455a0 100644
--- a/src/ops/beam_topk.cpp
+++ b/src/ops/beam_topk.cpp
@@ -510,7 +510,7 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
   int parent_ids[max_total_requests];
   DT acc_probs[max_total_requests];
 
-  for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
     if (bc->request_completed[i]) {
       continue;
     }
@@ -683,16 +683,16 @@ BeamTopKMeta::BeamTopKMeta(FFHandler handler,
                            MemoryAllocator &gpu_mem_allocator)
     : OpMeta(handler) {
   DataType data_type = op->inputs[0]->data_type;
-  size_t parent_id_size = BeamSearchBatchConfig::MAX_BEAM_WIDTH *
-                          BeamSearchBatchConfig::MAX_NUM_REQUESTS;
-  size_t acc_probs_size = BeamSearchBatchConfig::MAX_BEAM_WIDTH *
-                          BeamSearchBatchConfig::MAX_NUM_REQUESTS;
-  size_t block_start_index_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
-                                  BeamSearchBatchConfig::MAX_NUM_REQUESTS;
-  size_t request_id_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
-                           BeamSearchBatchConfig::MAX_NUM_REQUESTS;
-  size_t tokens_per_request_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
-                                   BeamSearchBatchConfig::MAX_NUM_REQUESTS;
+  int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
+  int max_requests_per_batch = BatchConfig::max_requests_per_batch();
+  size_t parent_id_size =
+      BeamSearchBatchConfig::MAX_BEAM_WIDTH * max_requests_per_batch;
+  size_t acc_probs_size =
+      BeamSearchBatchConfig::MAX_BEAM_WIDTH * max_requests_per_batch;
+  size_t block_start_index_size = max_tokens_per_batch * max_requests_per_batch;
+  size_t request_id_size = max_tokens_per_batch * max_requests_per_batch;
+  size_t tokens_per_request_size =
+      max_tokens_per_batch * max_requests_per_batch;
   size_t totalSize = sizeof(int) * parent_id_size +
                      data_type_size(data_type) * acc_probs_size +
                      sizeof(int) * block_start_index_size +
diff --git a/src/ops/beam_topk.cu b/src/ops/beam_topk.cu
index 42fa7a5ab5..72ab7862a6 100644
--- a/src/ops/beam_topk.cu
+++ b/src/ops/beam_topk.cu
@@ -15,6 +15,7 @@
 
 #include "flexflow/ffconst_utils.h"
 #include "flexflow/ops/beam_topk.h"
+#include "flexflow/request_manager.h"
 #include "flexflow/utils/cuda_helper.h"
 
 namespace FlexFlow {
@@ -542,7 +543,7 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
   int parent_ids[max_total_requests];
   DT acc_probs[max_total_requests];
 
-  for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
     if (bc->request_completed[i]) {
       continue;
     }
@@ -715,16 +716,16 @@ BeamTopKMeta::BeamTopKMeta(FFHandler handler,
                            MemoryAllocator &gpu_mem_allocator)
     : OpMeta(handler) {
   DataType data_type = op->inputs[0]->data_type;
-  size_t parent_id_size = BeamSearchBatchConfig::MAX_BEAM_WIDTH *
-                          BeamSearchBatchConfig::MAX_NUM_REQUESTS;
-  size_t acc_probs_size = BeamSearchBatchConfig::MAX_BEAM_WIDTH *
-                          BeamSearchBatchConfig::MAX_NUM_REQUESTS;
-  size_t block_start_index_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
-                                  BeamSearchBatchConfig::MAX_NUM_REQUESTS;
-  size_t request_id_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
-                           BeamSearchBatchConfig::MAX_NUM_REQUESTS;
-  size_t tokens_per_request_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
-                                   BeamSearchBatchConfig::MAX_NUM_REQUESTS;
+  int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
+  int max_requests_per_batch = BatchConfig::max_requests_per_batch();
+  size_t parent_id_size =
+      BeamSearchBatchConfig::MAX_BEAM_WIDTH * max_requests_per_batch;
+  size_t acc_probs_size =
+      BeamSearchBatchConfig::MAX_BEAM_WIDTH * max_requests_per_batch;
+  size_t block_start_index_size = max_tokens_per_batch * max_requests_per_batch;
+  size_t request_id_size = max_tokens_per_batch * max_requests_per_batch;
+  size_t tokens_per_request_size =
+      max_tokens_per_batch * max_requests_per_batch;
   size_t totalSize = sizeof(int) * parent_id_size +
                      data_type_size(data_type) * acc_probs_size +
                      sizeof(int) * block_start_index_size +
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index 7cb9867312..68b5fa39a1 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -937,11 +937,13 @@ void IncMultiHeadSelfAttention::inference_task(
   // load weight manually because Torch can't easily read a tensor serialized in
   // column-major order.
 
-  // printf("m->kProjSize: %i, BatchConfig::MAX_NUM_TOKENS: %i, "
+  // printf("m->kProjSize: %i, BatchConfig::max_tokens_per_batch(): %i, "
   //     "bc->num_active_tokens(): %i, num_q_heads: %lli,
-  //     BatchConfig::MAX_NUM_REQUESTS: %i, " "bc->num_active_requests(): %i\n",
-  //     m->kProjSize, BatchConfig::MAX_NUM_TOKENS, bc->num_active_tokens(),
-  //     num_q_heads, BatchConfig::MAX_NUM_REQUESTS, bc->num_active_requests());
+  //     BatchConfig::max_requests_per_batch(): %i, "
+  //     "bc->num_active_requests(): %i\n", m->kProjSize,
+  //     BatchConfig::max_tokens_per_batch(), bc->num_active_tokens(),
+  //     num_q_heads, BatchConfig::max_requests_per_batch(),
+  //     bc->num_active_requests());
   // for (int t=0; t < bc->num_active_tokens(); t++) {
   //   printf("token %i has request_index: %li and token_position: %li\n",
   //   t, bc->token2ids.token_indexes[t].request_index,
@@ -1029,7 +1031,7 @@ void IncMultiHeadSelfAttention::inference_task(
   //  ----------------------- Loading CUDA results for this step ---------------
   float *QKVProjArray_cpu = download_tensor<float>(
       m->devQKVProjArray,
-      BatchConfig::MAX_NUM_TOKENS * proj_sum * m->num_q_heads);
+      BatchConfig::max_tokens_per_batch() * proj_sum * m->num_q_heads);
   assert(QKVProjArray_cpu != nullptr);
 
   std::vector<int> QKVProjArray_converted_shape = {
@@ -1089,21 +1091,25 @@ void IncMultiHeadSelfAttention::inference_task(
   for (size_t h = 0; h < num_q_heads; h++) {
     for (size_t t = 0; t < bc->num_active_tokens(); t++) {
       for (size_t d = 0; d < m->kProjSize; d++) {
-        size_t kcache_idx =
-            d * MAX_SEQ_LEN * m->num_q_heads * BatchConfig::MAX_NUM_REQUESTS +
-            bc->tokensInfo[t].abs_depth_in_request * m->num_q_heads *
-                BatchConfig::MAX_NUM_REQUESTS +
-            h * BatchConfig::MAX_NUM_REQUESTS + bc->tokensInfo[t].request_index;
+        size_t kcache_idx = d * MAX_SEQ_LEN * m->num_q_heads *
+                                BatchConfig::max_requests_per_batch() +
+                            bc->tokensInfo[t].abs_depth_in_request *
+                                m->num_q_heads *
+                                BatchConfig::max_requests_per_batch() +
+                            h * BatchConfig::max_requests_per_batch() +
+                            bc->tokensInfo[t].request_index;
         m->kcache[kcache_idx] =
             qkv_projs.index({(int64_t)d, (int64_t)t, 1, (int64_t)h})
                 .item<float>();
       }
       for (size_t d = 0; d < m->vProjSize; d++) {
-        size_t vcache_idx =
-            d * MAX_SEQ_LEN * m->num_q_heads * BatchConfig::MAX_NUM_REQUESTS +
-            bc->tokensInfo[t].abs_depth_in_request * m->num_q_heads *
-                BatchConfig::MAX_NUM_REQUESTS +
-            h * BatchConfig::MAX_NUM_REQUESTS + bc->tokensInfo[t].request_index;
+        size_t vcache_idx = d * MAX_SEQ_LEN * m->num_q_heads *
+                                BatchConfig::max_requests_per_batch() +
+                            bc->tokensInfo[t].abs_depth_in_request *
+                                m->num_q_heads *
+                                BatchConfig::max_requests_per_batch() +
+                            h * BatchConfig::max_requests_per_batch() +
+                            bc->tokensInfo[t].request_index;
         m->vcache[vcache_idx] =
             qkv_projs.index({(int64_t)d, (int64_t)t, 2, (int64_t)h})
                 .item<float>();
@@ -1111,14 +1117,18 @@ void IncMultiHeadSelfAttention::inference_task(
     }
   }
   // Create torch tensors from the arrays
-  torch::Tensor K_t = torch::from_blob(
-      m->kcache,
-      {m->kProjSize, MAX_SEQ_LEN, num_q_heads, BatchConfig::MAX_NUM_REQUESTS},
-      torch::kFloat32);
-  torch::Tensor V_t = torch::from_blob(
-      m->vcache,
-      {m->vProjSize, MAX_SEQ_LEN, num_q_heads, BatchConfig::MAX_NUM_REQUESTS},
-      torch::kFloat32);
+  torch::Tensor K_t = torch::from_blob(m->kcache,
+                                       {m->kProjSize,
+                                        MAX_SEQ_LEN,
+                                        num_q_heads,
+                                        BatchConfig::max_requests_per_batch()},
+                                       torch::kFloat32);
+  torch::Tensor V_t = torch::from_blob(m->vcache,
+                                       {m->vProjSize,
+                                        MAX_SEQ_LEN,
+                                        num_q_heads,
+                                        BatchConfig::max_requests_per_batch()},
+                                       torch::kFloat32);
 
   // Compute useful indices
   std::vector<size_t> req_idxs;
@@ -1143,30 +1153,30 @@ void IncMultiHeadSelfAttention::inference_task(
          bc->num_active_tokens());
 
   //  ----------------------- Loading CUDA results for this step ---------------
-  float *keyCache_cpu =
-      download_tensor<float>(m->keyCache,
-                             m->num_q_heads * m->kProjSize *
-                                 BatchConfig::MAX_NUM_REQUESTS * MAX_SEQ_LEN);
-  float *valueCache_cpu =
-      download_tensor<float>(m->valueCache,
-                             m->num_q_heads * m->vProjSize *
-                                 BatchConfig::MAX_NUM_REQUESTS * MAX_SEQ_LEN);
+  float *keyCache_cpu = download_tensor<float>(
+      m->keyCache,
+      m->num_q_heads * m->kProjSize * BatchConfig::max_requests_per_batch() *
+          MAX_SEQ_LEN);
+  float *valueCache_cpu = download_tensor<float>(
+      m->valueCache,
+      m->num_q_heads * m->vProjSize * BatchConfig::max_requests_per_batch() *
+          MAX_SEQ_LEN);
   assert(keyCache_cpu != nullptr);
   assert(valueCache_cpu != nullptr);
 
   float *kcache_cuda =
       (float *)calloc(m->kProjSize * MAX_SEQ_LEN * m->num_q_heads *
-                          BatchConfig::MAX_NUM_REQUESTS,
+                          BatchConfig::max_requests_per_batch(),
                       sizeof(float));
   float *vcache_cuda =
       (float *)calloc(m->vProjSize * MAX_SEQ_LEN * m->num_q_heads *
-                          BatchConfig::MAX_NUM_REQUESTS,
+                          BatchConfig::max_requests_per_batch(),
                       sizeof(float));
   int index = 0;
   for (int i = 0; i < m->kProjSize; i++) {
     for (int j = 0; j < MAX_SEQ_LEN; j++) {
       for (int k = 0; k < m->num_q_heads; k++) {
-        for (int l = 0; l < BatchConfig::MAX_NUM_REQUESTS; l++) {
+        for (int l = 0; l < BatchConfig::max_requests_per_batch(); l++) {
           int col_major_index =
               l * m->kProjSize * MAX_SEQ_LEN * m->num_q_heads +
               k * m->kProjSize * MAX_SEQ_LEN + j * m->kProjSize + i;
@@ -1179,7 +1189,7 @@ void IncMultiHeadSelfAttention::inference_task(
   for (int i = 0; i < m->vProjSize; i++) {
     for (int j = 0; j < MAX_SEQ_LEN; j++) {
       for (int k = 0; k < m->num_q_heads; k++) {
-        for (int l = 0; l < BatchConfig::MAX_NUM_REQUESTS; l++) {
+        for (int l = 0; l < BatchConfig::max_requests_per_batch(); l++) {
           int col_major_index =
               l * m->vProjSize * MAX_SEQ_LEN * m->num_q_heads +
               k * m->vProjSize * MAX_SEQ_LEN + j * m->vProjSize + i;
@@ -1188,14 +1198,20 @@ void IncMultiHeadSelfAttention::inference_task(
       }
     }
   }
-  torch::Tensor K_t_cuda = torch::from_blob(
-      kcache_cuda,
-      {m->kProjSize, MAX_SEQ_LEN, num_q_heads, BatchConfig::MAX_NUM_REQUESTS},
-      torch::kFloat32);
-  torch::Tensor V_t_cuda = torch::from_blob(
-      vcache_cuda,
-      {m->vProjSize, MAX_SEQ_LEN, num_q_heads, BatchConfig::MAX_NUM_REQUESTS},
-      torch::kFloat32);
+  torch::Tensor K_t_cuda =
+      torch::from_blob(kcache_cuda,
+                       {m->kProjSize,
+                        MAX_SEQ_LEN,
+                        num_q_heads,
+                        BatchConfig::max_requests_per_batch()},
+                       torch::kFloat32);
+  torch::Tensor V_t_cuda =
+      torch::from_blob(vcache_cuda,
+                       {m->vProjSize,
+                        MAX_SEQ_LEN,
+                        num_q_heads,
+                        BatchConfig::max_requests_per_batch()},
+                       torch::kFloat32);
 
   //  ----------------------- Comparing C++ & CUDA results ---------------------
 
@@ -1205,11 +1221,11 @@ void IncMultiHeadSelfAttention::inference_task(
   //     for (int l=0; l < m->kProjSize; l++) {
   //       for (int k=0; k < MAX_SEQ_LEN; k++) {
   //         size_t kcache_idx =
-  //           l * MAX_SEQ_LEN * num_q_heads * BatchConfig::MAX_NUM_REQUESTS +
-  //           k * num_q_heads * BatchConfig::MAX_NUM_REQUESTS +
-  //           j * BatchConfig::MAX_NUM_REQUESTS +
-  //           i;
-  //           if ( abs(m->kcache[kcache_idx] - keyCache_cpu[
+  //           l * MAX_SEQ_LEN * num_q_heads *
+  //           BatchConfig::max_requests_per_batch() + k * num_q_heads *
+  //           BatchConfig::max_requests_per_batch() + j *
+  //           BatchConfig::max_requests_per_batch() + i; if (
+  //           abs(m->kcache[kcache_idx] - keyCache_cpu[
   //               i * m->kProjSize * MAX_SEQ_LEN * num_q_heads +
   //               j * m->kProjSize * MAX_SEQ_LEN +
   //               k * m->kProjSize +
@@ -1270,10 +1286,10 @@ void IncMultiHeadSelfAttention::inference_task(
   //       for (int l=0; l < m->kProjSize; l++) {
   //         for (int k=0; k < MAX_SEQ_LEN; k++) {
   //           size_t kcache_idx =
-  //             l * MAX_SEQ_LEN * num_q_heads * BatchConfig::MAX_NUM_REQUESTS +
-  //             k * num_q_heads * BatchConfig::MAX_NUM_REQUESTS +
-  //             j * BatchConfig::MAX_NUM_REQUESTS +
-  //             i;
+  //             l * MAX_SEQ_LEN * num_q_heads *
+  //             BatchConfig::max_requests_per_batch() + k * num_q_heads *
+  //             BatchConfig::max_requests_per_batch() + j *
+  //             BatchConfig::max_requests_per_batch() + i;
   //           printf("%f ", m->kcache[kcache_idx]);
   //         }
   //         printf("\n");
@@ -1289,9 +1305,10 @@ void IncMultiHeadSelfAttention::inference_task(
   //       for (int l=0; l<m->vProjSize; l++) {
   //         for (int k=0; k< MAX_SEQ_LEN; k++) {
   //             size_t vcache_idx =
-  //               l * MAX_SEQ_LEN * num_q_heads * BatchConfig::MAX_NUM_REQUESTS
-  //               + k * num_q_heads * BatchConfig::MAX_NUM_REQUESTS + j *
-  //               BatchConfig::MAX_NUM_REQUESTS + i;
+  //               l * MAX_SEQ_LEN * num_q_heads *
+  //               BatchConfig::max_requests_per_batch()
+  //               + k * num_q_heads * BatchConfig::max_requests_per_batch() + j
+  //               * BatchConfig::max_requests_per_batch() + i;
   //             printf("%f ", m->vcache[vcache_idx]);
   //         }
   //         printf("\n");
@@ -1380,17 +1397,19 @@ void IncMultiHeadSelfAttention::inference_task(
   //  ----------------------- Loading CUDA results for this step ---------------
   float *qk_prods_cpu = download_tensor<float>(
       m->qk_prods,
-      BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_NUM_TOKENS * num_q_heads);
+      BatchConfig::max_tokens_per_batch() *
+          BatchConfig::max_tokens_per_batch() * num_q_heads);
   assert(qk_prods_cpu != nullptr);
 
   float *qk_prods_softmax_cpu = download_tensor<float>(
       m->qk_prods_softmax,
-      BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_NUM_TOKENS * num_q_heads);
+      BatchConfig::max_tokens_per_batch() *
+          BatchConfig::max_tokens_per_batch() * num_q_heads);
   assert(qk_prods_softmax_cpu != nullptr);
 
   float *attn_heads_cpu = download_tensor<float>(
       m->attn_heads,
-      BatchConfig::MAX_NUM_TOKENS * m->num_q_heads * m->vProjSize);
+      BatchConfig::max_tokens_per_batch() * m->num_q_heads * m->vProjSize);
   assert(attn_heads_cpu != nullptr);
 
   //  ----------------------- Main loop (request by request) -------------------
diff --git a/src/ops/inc_multihead_self_attention.cpp b/src/ops/inc_multihead_self_attention.cpp
index 8fb635bace..f09d905dd3 100644
--- a/src/ops/inc_multihead_self_attention.cpp
+++ b/src/ops/inc_multihead_self_attention.cpp
@@ -426,7 +426,7 @@ void update_kv_cache_kernel(IncMultiHeadSelfAttentionMeta const *m,
                        num_tokens,
                        m->num_q_heads,
                        m->num_kv_heads,
-                       BatchConfig::MAX_SEQ_LENGTH);
+                       BatchConfig::max_sequence_length());
   }
 }
 
@@ -576,13 +576,13 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
   int num_tokens = bc->num_active_tokens();
   int tokens_previous_requests = 0;
   int q_block_size = m->qProjSize * num_tokens;
-  int kt_block_size = m->kProjSize * BatchConfig::MAX_SEQ_LENGTH;
+  int kt_block_size = m->kProjSize * BatchConfig::max_sequence_length();
   int kt_req_block_size = kt_block_size * m->num_kv_heads;
-  int vt_block_size = m->vProjSize * BatchConfig::MAX_SEQ_LENGTH;
+  int vt_block_size = m->vProjSize * BatchConfig::max_sequence_length();
   int vt_req_block_size = vt_block_size * m->num_kv_heads;
   assert(m->qProjSize == m->kProjSize);
 
-  for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
     if (bc->request_completed[i]) {
       continue;
     }
@@ -1070,8 +1070,9 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
 
   // allocate memory for the seqArray and reserve space
   {
+    int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
     size_t qkv_max_proj_size =
-        BatchConfig::MAX_NUM_TOKENS *
+        max_tokens_per_batch *
         (qProjSize * num_q_heads + kProjSize * num_kv_heads +
          vProjSize * num_kv_heads);
     size_t key_cache_size = 0, value_cache_size = 0;
@@ -1079,36 +1080,36 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
       case INC_DECODING_MODE:
       case TREE_VERIFY_MODE: {
         key_cache_size = num_kv_heads * kProjSize *
-                         BatchConfig::MAX_NUM_REQUESTS *
-                         BatchConfig::MAX_SEQ_LENGTH;
+                         BatchConfig::max_requests_per_batch() *
+                         BatchConfig::max_sequence_length();
         value_cache_size = num_kv_heads * vProjSize *
-                           BatchConfig::MAX_NUM_REQUESTS *
-                           BatchConfig::MAX_SEQ_LENGTH;
+                           BatchConfig::max_requests_per_batch() *
+                           BatchConfig::max_sequence_length();
         break;
       }
       case BEAM_SEARCH_MODE: {
-        key_cache_size =
-            num_kv_heads * kProjSize * BeamSearchBatchConfig::MAX_NUM_REQUESTS *
-            BatchConfig::MAX_SEQ_LENGTH * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
-        value_cache_size =
-            num_kv_heads * vProjSize * BeamSearchBatchConfig::MAX_NUM_REQUESTS *
-            BatchConfig::MAX_SEQ_LENGTH * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+        key_cache_size = num_kv_heads * kProjSize *
+                         BeamSearchBatchConfig::max_requests_per_batch() *
+                         BatchConfig::max_sequence_length() *
+                         BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+        value_cache_size = num_kv_heads * vProjSize *
+                           BeamSearchBatchConfig::max_requests_per_batch() *
+                           BatchConfig::max_sequence_length() *
+                           BeamSearchBatchConfig::MAX_BEAM_WIDTH;
         break;
       }
       default:
         assert(false && "Unkown inference mode");
     }
-    size_t tokeninfo_size = BatchConfig::MAX_NUM_TOKENS;
+    size_t tokeninfo_size = max_tokens_per_batch;
     size_t qk_prod_size =
-        BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_SEQ_LENGTH * num_q_heads;
-    size_t attn_heads_size =
-        BatchConfig::MAX_NUM_TOKENS * num_q_heads * vProjSize;
+        max_tokens_per_batch * BatchConfig::max_sequence_length() * num_q_heads;
+    size_t attn_heads_size = max_tokens_per_batch * num_q_heads * vProjSize;
     size_t W_out_block_size = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
     size_t W_out_contiguous_size = W_out_block_size * num_q_heads;
-    size_t complex_size =
-        (BatchConfig::MAX_NUM_TOKENS *
-         (qProjSize * num_q_heads + kProjSize * num_kv_heads)) /
-        2;
+    size_t complex_size = (max_tokens_per_batch * (qProjSize * num_q_heads +
+                                                   kProjSize * num_kv_heads)) /
+                          2;
     size_t totalSize =
         (qkv_max_proj_size + key_cache_size + value_cache_size +
          2 * qk_prod_size + attn_heads_size + W_out_contiguous_size) *
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index ec776f4cda..eaaa398654 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -393,7 +393,7 @@ void update_kv_cache_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                num_tokens,
                                m->num_q_heads,
                                m->num_kv_heads,
-                               BatchConfig::MAX_SEQ_LENGTH);
+                               BatchConfig::max_sequence_length());
   }
 }
 
@@ -579,13 +579,13 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
   int num_tokens = bc->num_active_tokens();
   int tokens_previous_requests = 0;
   int q_block_size = m->qProjSize * num_tokens;
-  int kt_block_size = m->kProjSize * BatchConfig::MAX_SEQ_LENGTH;
+  int kt_block_size = m->kProjSize * BatchConfig::max_sequence_length();
   int kt_req_block_size = kt_block_size * m->num_kv_heads;
-  int vt_block_size = m->vProjSize * BatchConfig::MAX_SEQ_LENGTH;
+  int vt_block_size = m->vProjSize * BatchConfig::max_sequence_length();
   int vt_req_block_size = vt_block_size * m->num_kv_heads;
   assert(m->qProjSize == m->kProjSize);
 
-  for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
     if (bc->request_completed[i]) {
       continue;
     }
@@ -1098,18 +1098,21 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   }
 
 #ifdef INFERENCE_TESTS
-  kcache = (float *)calloc(kProjSize * BatchConfig::MAX_SEQ_LENGTH *
-                               num_q_heads * BatchConfig::MAX_NUM_REQUESTS,
-                           sizeof(float));
-  vcache = (float *)calloc(vProjSize * BatchConfig::MAX_SEQ_LENGTH *
-                               num_q_heads * BatchConfig::MAX_NUM_REQUESTS,
-                           sizeof(float));
+  kcache =
+      (float *)calloc(kProjSize * BatchConfig::max_sequence_length() *
+                          num_q_heads * BatchConfig::max_requests_per_batch(),
+                      sizeof(float));
+  vcache =
+      (float *)calloc(vProjSize * BatchConfig::max_sequence_length() *
+                          num_q_heads * BatchConfig::max_requests_per_batch(),
+                      sizeof(float));
 #endif
 
   // allocate memory for the seqArray and reserve space
   {
+    int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
     size_t qkv_max_proj_size =
-        BatchConfig::MAX_NUM_TOKENS *
+        max_tokens_per_batch *
         (qProjSize * num_q_heads + kProjSize * num_kv_heads +
          vProjSize * num_kv_heads);
     size_t key_cache_size = 0, value_cache_size = 0;
@@ -1117,36 +1120,36 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
       case INC_DECODING_MODE:
       case TREE_VERIFY_MODE: {
         key_cache_size = num_kv_heads * kProjSize *
-                         BatchConfig::MAX_NUM_REQUESTS *
-                         BatchConfig::MAX_SEQ_LENGTH;
+                         BatchConfig::max_requests_per_batch() *
+                         BatchConfig::max_sequence_length();
         value_cache_size = num_kv_heads * vProjSize *
-                           BatchConfig::MAX_NUM_REQUESTS *
-                           BatchConfig::MAX_SEQ_LENGTH;
+                           BatchConfig::max_requests_per_batch() *
+                           BatchConfig::max_sequence_length();
         break;
       }
       case BEAM_SEARCH_MODE: {
-        key_cache_size =
-            num_kv_heads * kProjSize * BeamSearchBatchConfig::MAX_NUM_REQUESTS *
-            BatchConfig::MAX_SEQ_LENGTH * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
-        value_cache_size =
-            num_kv_heads * vProjSize * BeamSearchBatchConfig::MAX_NUM_REQUESTS *
-            BatchConfig::MAX_SEQ_LENGTH * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+        key_cache_size = num_kv_heads * kProjSize *
+                         BeamSearchBatchConfig::max_requests_per_batch() *
+                         BatchConfig::max_sequence_length() *
+                         BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+        value_cache_size = num_kv_heads * vProjSize *
+                           BeamSearchBatchConfig::max_requests_per_batch() *
+                           BatchConfig::max_sequence_length() *
+                           BeamSearchBatchConfig::MAX_BEAM_WIDTH;
         break;
       }
       default:
         assert(false && "Unkown inference mode");
     }
-    size_t tokeninfo_size = BatchConfig::MAX_NUM_TOKENS;
+    size_t tokeninfo_size = max_tokens_per_batch;
     size_t qk_prod_size =
-        BatchConfig::MAX_NUM_TOKENS * BatchConfig::MAX_SEQ_LENGTH * num_q_heads;
-    size_t attn_heads_size =
-        BatchConfig::MAX_NUM_TOKENS * num_q_heads * vProjSize;
+        max_tokens_per_batch * BatchConfig::max_sequence_length() * num_q_heads;
+    size_t attn_heads_size = max_tokens_per_batch * num_q_heads * vProjSize;
     size_t W_out_block_size = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
     size_t W_out_contiguous_size = W_out_block_size * num_q_heads;
-    size_t complex_size =
-        (BatchConfig::MAX_NUM_TOKENS *
-         (qProjSize * num_q_heads + kProjSize * num_kv_heads)) /
-        2;
+    size_t complex_size = (max_tokens_per_batch * (qProjSize * num_q_heads +
+                                                   kProjSize * num_kv_heads)) /
+                          2;
     size_t totalSize =
         (qkv_max_proj_size + key_cache_size + value_cache_size +
          2 * qk_prod_size + attn_heads_size + W_out_contiguous_size) *
diff --git a/src/ops/spec_inc_multihead_self_attention.cpp b/src/ops/spec_inc_multihead_self_attention.cpp
index f983238198..30b6f5cb84 100644
--- a/src/ops/spec_inc_multihead_self_attention.cpp
+++ b/src/ops/spec_inc_multihead_self_attention.cpp
@@ -175,7 +175,7 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                        num_tokens,
                        m->num_q_heads,
                        m->num_kv_heads,
-                       BatchConfig::MAX_SEQ_LENGTH,
+                       BatchConfig::max_sequence_length(),
                        BeamSearchBatchConfig::MAX_BEAM_WIDTH,
                        /*root*/ curr_depth == 0);
   }
@@ -225,13 +225,13 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   //     (m->qProjSize + m->kProjSize + m->vProjSize) * num_tokens;
   int q_block_size = m->qProjSize * num_tokens;
 
-  int kt_block_size = m->kProjSize * BatchConfig::MAX_SEQ_LENGTH;
+  int kt_block_size = m->kProjSize * BatchConfig::max_sequence_length();
   int kt_req_block_size = kt_block_size * m->num_kv_heads;
-  int vt_block_size = m->vProjSize * BatchConfig::MAX_SEQ_LENGTH;
+  int vt_block_size = m->vProjSize * BatchConfig::max_sequence_length();
   int vt_req_block_size = vt_block_size * m->num_kv_heads;
   assert(m->qProjSize == m->kProjSize);
 
-  for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
     if (bc->request_completed[i]) {
       continue;
     }
@@ -542,29 +542,30 @@ void inference_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                       DT const *bias_ptr,
                       hipStream_t stream) {
   // here because we need postion info in infernece 1
+  int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
   checkCUDA(
       hipMemcpyAsync(m->token_infos,
                      &(bc->tokensInfo),
-                     bc->MAX_NUM_TOKENS * sizeof(BatchConfig::PerTokenInfo),
-                     hipMemcpyHostToDevice,
-                     stream));
-  checkCUDA(
-      hipMemcpyAsync(m->request_infos,
-                     &(bc->requestsInfo),
-                     bc->MAX_NUM_REQUESTS * sizeof(BatchConfig::PerRequestInfo),
+                     max_tokens_per_batch * sizeof(BatchConfig::PerTokenInfo),
                      hipMemcpyHostToDevice,
                      stream));
+  checkCUDA(hipMemcpyAsync(m->request_infos,
+                           &(bc->requestsInfo),
+                           bc->max_requests_per_batch() *
+                               sizeof(BatchConfig::PerRequestInfo),
+                           hipMemcpyHostToDevice,
+                           stream));
   checkCUDA(
       hipMemcpyAsync(m->beam_token_infos,
                      &(bc->beamTokenInfo),
-                     bc->MAX_NUM_TOKENS * bc->MAX_BEAM_WIDTH *
+                     max_tokens_per_batch * bc->MAX_BEAM_WIDTH *
                          sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo),
                      hipMemcpyHostToDevice,
                      stream));
   checkCUDA(hipMemcpyAsync(
       m->beam_request_infos,
       &(bc->beamRequestsInfo),
-      bc->MAX_NUM_REQUESTS *
+      bc->max_requests_per_batch() *
           sizeof(BeamSearchBatchConfig::BeamSearchPerRequestInfo),
       hipMemcpyHostToDevice,
       stream));
@@ -692,10 +693,12 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
 
   // allocate memory for the seqArray and reserve space
   {
-    size_t beam_tokeninfo_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
-                                 BeamSearchBatchConfig::MAX_BEAM_WIDTH;
-    size_t requestinfo_size = BeamSearchBatchConfig::MAX_NUM_REQUESTS;
-    size_t beam_requestinfo_size = BeamSearchBatchConfig::MAX_NUM_REQUESTS;
+    int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
+    size_t beam_tokeninfo_size =
+        max_tokens_per_batch * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+    size_t requestinfo_size = BeamSearchBatchConfig::max_requests_per_batch();
+    size_t beam_requestinfo_size =
+        BeamSearchBatchConfig::max_requests_per_batch();
     size_t total_size =
         requestinfo_size * sizeof(BatchConfig::PerRequestInfo) +
         beam_tokeninfo_size *
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index b4cdc77e2a..b479528607 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -191,7 +191,7 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                                     num_tokens,
                                     m->num_q_heads,
                                     m->num_kv_heads,
-                                    BatchConfig::MAX_SEQ_LENGTH,
+                                    BatchConfig::max_sequence_length(),
                                     BeamSearchBatchConfig::MAX_BEAM_WIDTH,
                                     /*root*/ curr_depth == 0);
   }
@@ -241,13 +241,13 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   //     (m->qProjSize + m->kProjSize + m->vProjSize) * num_tokens;
   int q_block_size = m->qProjSize * num_tokens;
 
-  int kt_block_size = m->kProjSize * BatchConfig::MAX_SEQ_LENGTH;
+  int kt_block_size = m->kProjSize * BatchConfig::max_sequence_length();
   int kt_req_block_size = kt_block_size * m->num_kv_heads;
-  int vt_block_size = m->vProjSize * BatchConfig::MAX_SEQ_LENGTH;
+  int vt_block_size = m->vProjSize * BatchConfig::max_sequence_length();
   int vt_req_block_size = vt_block_size * m->num_kv_heads;
   assert(m->qProjSize == m->kProjSize);
 
-  for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
     if (bc->request_completed[i]) {
       continue;
     }
@@ -564,23 +564,24 @@ void inference_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   // here because we need postion info in infernece 1
   cudaMemcpyAsync(m->token_infos,
                   &(bc->tokensInfo),
-                  bc->MAX_NUM_TOKENS * sizeof(BatchConfig::PerTokenInfo),
+                  bc->num_active_tokens() * sizeof(BatchConfig::PerTokenInfo),
                   cudaMemcpyHostToDevice,
                   stream);
   cudaMemcpyAsync(m->request_infos,
                   &(bc->requestsInfo),
-                  bc->MAX_NUM_REQUESTS * sizeof(BatchConfig::PerRequestInfo),
+                  bc->max_requests_per_batch() *
+                      sizeof(BatchConfig::PerRequestInfo),
                   cudaMemcpyHostToDevice,
                   stream);
   cudaMemcpyAsync(m->beam_token_infos,
                   &(bc->beamTokenInfo),
-                  bc->MAX_NUM_TOKENS * bc->MAX_BEAM_WIDTH *
+                  bc->num_active_tokens() * bc->MAX_BEAM_WIDTH *
                       sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo),
                   cudaMemcpyHostToDevice,
                   stream);
   cudaMemcpyAsync(m->beam_request_infos,
                   &(bc->beamRequestsInfo),
-                  bc->MAX_NUM_REQUESTS *
+                  bc->max_requests_per_batch() *
                       sizeof(BeamSearchBatchConfig::BeamSearchPerRequestInfo),
                   cudaMemcpyHostToDevice,
                   stream);
@@ -711,10 +712,12 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
 
   // allocate memory for the seqArray and reserve space
   {
-    size_t beam_tokeninfo_size = BeamSearchBatchConfig::MAX_NUM_TOKENS *
-                                 BeamSearchBatchConfig::MAX_BEAM_WIDTH;
-    size_t requestinfo_size = BeamSearchBatchConfig::MAX_NUM_REQUESTS;
-    size_t beam_requestinfo_size = BeamSearchBatchConfig::MAX_NUM_REQUESTS;
+    int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
+    size_t beam_tokeninfo_size =
+        max_tokens_per_batch * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+    size_t requestinfo_size = BeamSearchBatchConfig::max_requests_per_batch();
+    size_t beam_requestinfo_size =
+        BeamSearchBatchConfig::max_requests_per_batch();
     size_t total_size =
         requestinfo_size * sizeof(BatchConfig::PerRequestInfo) +
         beam_tokeninfo_size *
diff --git a/src/ops/tree_inc_multihead_self_attention.cpp b/src/ops/tree_inc_multihead_self_attention.cpp
index 0fa68bed08..c10cf9d0ca 100644
--- a/src/ops/tree_inc_multihead_self_attention.cpp
+++ b/src/ops/tree_inc_multihead_self_attention.cpp
@@ -104,7 +104,7 @@ void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
         m->num_active_tokens, // number of active tokens in previous batch
         m->num_q_heads,
         m->num_kv_heads,
-        BatchConfig::MAX_SEQ_LENGTH);
+        BatchConfig::max_sequence_length());
   }
 }
 
@@ -195,13 +195,13 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
   // int qkv_block_size =
   //     (m->qProjSize + m->kProjSize + m->vProjSize) * bc->num_active_tokens();
   int q_block_size = m->qProjSize * bc->num_active_tokens();
-  int kt_block_size = m->kProjSize * BatchConfig::MAX_SEQ_LENGTH;
+  int kt_block_size = m->kProjSize * BatchConfig::max_sequence_length();
   int kt_req_block_size = kt_block_size * m->num_kv_heads;
-  int vt_block_size = m->vProjSize * BatchConfig::MAX_SEQ_LENGTH;
+  int vt_block_size = m->vProjSize * BatchConfig::max_sequence_length();
   int vt_req_block_size = vt_block_size * m->num_kv_heads;
   assert(m->qProjSize == m->kProjSize);
 
-  for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
     if (bc->request_completed[i]) {
       continue;
     }
@@ -241,7 +241,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
             m->num_active_tokens,      // total_tokens_in_batch
             m->num_q_heads,
             m->num_kv_heads,
-            BatchConfig::MAX_SEQ_LENGTH);
+            BatchConfig::max_sequence_length());
       }
 
       // bc->token_last_available_idx[i] + 1;
@@ -570,7 +570,7 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
   }
   checkCUDA(hipMemcpyAsync(m->token_infos,
                            &(bc->tokensInfo),
-                           bc->MAX_NUM_TOKENS *
+                           bc->num_active_tokens() *
                                sizeof(TreeVerifyBatchConfig::PerTokenInfo),
                            hipMemcpyHostToDevice,
                            stream));
@@ -714,7 +714,8 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
 
   // allocate memory for the seqArray and reserve space
   {
-    size_t committed_tokeninfo_size = TreeVerifyBatchConfig::MAX_NUM_TOKENS;
+    int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
+    size_t committed_tokeninfo_size = max_tokens_per_batch;
     size_t total_size = committed_tokeninfo_size *
                         sizeof(TreeVerifyBatchConfig::CommittedTokensInfo);
     if (offload) {
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index 95ac93ad8a..5901c0e3ab 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -102,7 +102,7 @@ void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
         m->num_active_tokens, // number of active tokens in previous batch
         m->num_q_heads,
         m->num_kv_heads,
-        BatchConfig::MAX_SEQ_LENGTH);
+        BatchConfig::max_sequence_length());
   }
 }
 
@@ -193,13 +193,13 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
   // int qkv_block_size =
   //     (m->qProjSize + m->kProjSize + m->vProjSize) * bc->num_active_tokens();
   int q_block_size = m->qProjSize * bc->num_active_tokens();
-  int kt_block_size = m->kProjSize * BatchConfig::MAX_SEQ_LENGTH;
+  int kt_block_size = m->kProjSize * BatchConfig::max_sequence_length();
   int kt_req_block_size = kt_block_size * m->num_kv_heads;
-  int vt_block_size = m->vProjSize * BatchConfig::MAX_SEQ_LENGTH;
+  int vt_block_size = m->vProjSize * BatchConfig::max_sequence_length();
   int vt_req_block_size = vt_block_size * m->num_kv_heads;
   assert(m->qProjSize == m->kProjSize);
 
-  for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
     if (bc->request_completed[i]) {
       continue;
     }
@@ -237,7 +237,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
             m->num_active_tokens,      // total_tokens_in_batch
             m->num_q_heads,
             m->num_kv_heads,
-            BatchConfig::MAX_SEQ_LENGTH);
+            BatchConfig::max_sequence_length());
       }
 
       // bc->token_last_available_idx[i] + 1;
@@ -567,7 +567,7 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
   }
   cudaMemcpyAsync(m->token_infos,
                   &(bc->tokensInfo),
-                  bc->MAX_NUM_TOKENS *
+                  bc->num_active_tokens() *
                       sizeof(TreeVerifyBatchConfig::PerTokenInfo),
                   cudaMemcpyHostToDevice,
                   stream);
@@ -711,7 +711,8 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
 
   // allocate memory for the seqArray and reserve space
   {
-    size_t committed_tokeninfo_size = TreeVerifyBatchConfig::MAX_NUM_TOKENS;
+    int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
+    size_t committed_tokeninfo_size = max_tokens_per_batch;
     size_t total_size = committed_tokeninfo_size *
                         sizeof(TreeVerifyBatchConfig::CommittedTokensInfo);
     if (offload) {
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index d658b6590f..cbf839c6b2 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/batch_config.h"
+#include "flexflow/request_manager.h"
 #include "legion.h"
 #include <cassert>
 #include <climits>
@@ -60,7 +61,7 @@ InferenceMode BatchConfig::get_mode() const {
 
 int BatchConfig::num_active_requests() const {
   int num_requests = 0;
-  for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
+  for (int i = 0; i < max_requests_per_batch(); i++) {
     if (!request_completed[i]) {
       num_requests++;
     }
@@ -72,17 +73,33 @@ int BatchConfig::num_active_tokens() const {
   return num_tokens;
 }
 
+/*static*/
+int BatchConfig::max_requests_per_batch() {
+  return RequestManager::get_request_manager()->get_max_requests_per_batch();
+}
+
+/*static*/
+int BatchConfig::max_tokens_per_batch() {
+  return RequestManager::get_request_manager()->get_max_tokens_per_batch();
+}
+
+/*static*/
+int BatchConfig::max_sequence_length() {
+  return RequestManager::get_request_manager()->get_max_sequence_length();
+}
+
 void BatchConfig::print() const {
   std::cout << "@@@@@@@@@@@@@@ Batch Config (mode " << get_mode()
             << ") @@@@@@@@@@@@@@" << std::endl;
-  std::cout << "Max number of requests: " << MAX_NUM_REQUESTS << std::endl;
-  std::cout << "Max number of tokens: " << MAX_NUM_TOKENS << std::endl;
+  std::cout << "Max number of requests: " << max_requests_per_batch()
+            << std::endl;
+  std::cout << "Max number of tokens: " << max_tokens_per_batch() << std::endl;
   std::cout << "Number of tokens: " << num_tokens << std::endl;
   std::cout << "Number of requests: " << num_active_requests() << std::endl;
   // std::cout << "Cached results: " << cached_results << std::endl;
 
   std::cout << "Per-request info:\n";
-  for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
+  for (int i = 0; i < max_requests_per_batch(); i++) {
     if (!request_completed[i]) {
       std::cout << "  Request " << i << ":\n";
       std::cout << "    Token start offset: "
diff --git a/src/runtime/beam_search_batch_config.cc b/src/runtime/beam_search_batch_config.cc
index dc30d89d78..634d60a352 100644
--- a/src/runtime/beam_search_batch_config.cc
+++ b/src/runtime/beam_search_batch_config.cc
@@ -69,7 +69,7 @@ bool BeamSearchBatchConfig::done() const {
 
 int BeamSearchBatchConfig::max_beam_depth_all_requests() const {
   int max_depth_all_requests = 0;
-  for (int i = 0; i < BeamSearchBatchConfig::MAX_NUM_REQUESTS; i++) {
+  for (int i = 0; i < BeamSearchBatchConfig::max_requests_per_batch(); i++) {
     if (!request_completed[i] &&
         beamRequestsInfo[i].max_depth > max_depth_all_requests) {
       /* printf("\treq %i has max_depth=%i. Increasing max_depth_all_requests "
@@ -86,7 +86,7 @@ int BeamSearchBatchConfig::max_beam_depth_all_requests() const {
 
 int BeamSearchBatchConfig::current_depth_all_requests() const {
   int current_depth = 0;
-  for (int i = 0; i < BeamSearchBatchConfig::MAX_NUM_REQUESTS; i++) {
+  for (int i = 0; i < BeamSearchBatchConfig::max_requests_per_batch(); i++) {
     if (!request_completed[i] &&
         beamRequestsInfo[i].current_depth > current_depth) {
       /* printf("\treq %i has current_depth=%i. Increasing "
@@ -104,8 +104,9 @@ int BeamSearchBatchConfig::current_depth_all_requests() const {
 void BeamSearchBatchConfig::print() const {
   std::cout << "@@@@@@@@@@@@@@ BeamSearchBatchConfig (mode " << get_mode()
             << ") @@@@@@@@@@@@@@" << std::endl;
-  std::cout << "Max number of requests: " << MAX_NUM_REQUESTS << std::endl;
-  std::cout << "Max number of tokens: " << MAX_NUM_TOKENS << std::endl;
+  std::cout << "Max number of requests: " << max_requests_per_batch()
+            << std::endl;
+  std::cout << "Max number of tokens: " << max_tokens_per_batch() << std::endl;
   std::cout << "Number of tokens: " << num_tokens << std::endl;
   std::cout << "Number of requests: " << num_active_requests() << std::endl;
   std::cout << "Beam width: " << beam_width << std::endl;
@@ -113,7 +114,7 @@ void BeamSearchBatchConfig::print() const {
   std::cout << "Current Iterations: " << current_iteration << std::endl;
 
   std::cout << "Per-request info:\n";
-  for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
+  for (int i = 0; i < max_requests_per_batch(); i++) {
     // assert(beamRequestsInfo[i].request_completed == request_completed[i]);
     if (!request_completed[i]) {
       std::cout << "  Request " << i << ":\n";
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index f36dcb2922..eb045e8159 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -28,9 +28,8 @@ using namespace Legion;
 LegionRuntime::Logger::Category log_inf_mgr("InferenceManager");
 LegionRuntime::Logger::Category log_offload("Offloading");
 
-InferenceManager::InferenceManager(FFConfig const &_config,
-                                   int _max_num_tokens_per_batch)
-    : ff_config(_config), max_num_tokens_per_batch(_max_num_tokens_per_batch) {
+InferenceManager::InferenceManager(FFConfig const &_config)
+    : ff_config(_config) {
   num_devices = ff_config.workersPerNode * ff_config.numNodes;
   // Check parallelization degrees
   assert(ff_config.data_parallelism_degree <= num_devices &&
@@ -62,8 +61,7 @@ InferenceManager *inference_manager_singleton = nullptr;
 InferenceManager *InferenceManager::get_inference_manager() {
   if (inference_manager_singleton == nullptr) {
     FFConfig ffconfig;
-    inference_manager_singleton =
-        new InferenceManager(ffconfig, BatchConfig::MAX_NUM_TOKENS);
+    inference_manager_singleton = new InferenceManager(ffconfig);
   }
   return inference_manager_singleton;
 }
@@ -84,7 +82,7 @@ void InferenceManager::compile_model_and_allocate_buffer(FFModel *model) {
   // TODO: currently assume there is a single data-parallel pipeline
   // (i.e., data-parallel-degree == 1)
   assert(model->config.data_parallelism_degree == 1);
-  model->config.batchSize = max_num_tokens_per_batch;
+  model->config.batchSize = BatchConfig::max_tokens_per_batch();
   model->compile_inference();
   Context ctx = model->config.lg_ctx;
   Runtime *runtime = model->config.lg_hlr;
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 5ef55992ef..3fa201e7ab 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -3971,7 +3971,7 @@ struct DefaultConfig {
   const static bool profiling = false;
   constexpr static float learningRate = 0.01f;
   constexpr static float weightDecay = 0.0001f;
-  const static size_t workSpaceSize = (size_t)1 * 1024 * 1024 * 1024; // 2GB
+  const static size_t workSpaceSize = (size_t)128 * 1024 * 1024; // 128 MB
   const static int numNodes = 1;
   const static int workersPerNode = 0;
   const static int cpusPerNode = 0;
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 6f0a1f3851..1b825318dd 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -43,6 +43,14 @@ std::string LoadBytesFromFile(std::string const &path) {
 
 RequestManager::RequestManager()
     : verbose(false), next_available_guid(1000000), num_processed_requests(0) {
+  // The following config parameters are set
+  // during ffmodel.compile()
+  // Initialize them to -1 to make sure no one
+  // gets an incorrect value of them before
+  // ffmodel.compile()
+  max_requests_per_batch = -1;
+  max_tokens_per_batch = -1;
+  max_sequence_length = -1;
   {
     // Initialize futures for spec infer
     TreeVerifyBatchConfig tree_bc;
@@ -65,6 +73,39 @@ RequestManager::RequestManager()
   }
 }
 
+void RequestManager::set_max_requests_per_batch(int max_num_requests) {
+  assert(max_requests_per_batch == -1 ||
+         max_requests_per_batch == max_num_requests);
+  max_requests_per_batch = max_num_requests;
+  assert(max_requests_per_batch <= BatchConfig::MAX_NUM_REQUESTS);
+}
+
+int RequestManager::get_max_requests_per_batch() {
+  assert(max_requests_per_batch > 0);
+  return max_requests_per_batch;
+}
+
+void RequestManager::set_max_tokens_per_batch(int max_num_tokens) {
+  assert(max_tokens_per_batch == -1 || max_tokens_per_batch == max_num_tokens);
+  max_tokens_per_batch = max_num_tokens;
+  assert(max_tokens_per_batch <= BatchConfig::MAX_NUM_TOKENS);
+}
+
+int RequestManager::get_max_tokens_per_batch() {
+  assert(max_tokens_per_batch > 0);
+  return max_tokens_per_batch;
+}
+
+void RequestManager::set_max_sequence_length(int max_seq_length) {
+  assert(max_sequence_length == -1 || max_sequence_length == max_seq_length);
+  max_sequence_length = max_seq_length;
+}
+
+int RequestManager::get_max_sequence_length() {
+  assert(max_sequence_length > 0);
+  return max_sequence_length;
+}
+
 void RequestManager::register_tokenizer(ModelType type,
                                         int bos_token_id,
                                         int eos_token_id,
@@ -143,9 +184,9 @@ RequestManager::RequestGuid
   request.guid = next_available_guid++;
   request.max_sequence_length = max_sequence_length;
 
-  if (prompt.size() >= BatchConfig::MAX_SEQ_LENGTH) {
+  if (prompt.size() >= get_max_sequence_length()) {
     std::cout << "Warning: too many tokens in prompt, only load up to "
-              << BatchConfig::MAX_SEQ_LENGTH << " tokens, but got "
+              << get_max_sequence_length() << " tokens, but got "
               << prompt.size() << ".\n";
 
     printf("tokens size: %zu\n", request.tokens.size());
@@ -201,9 +242,9 @@ RequestManager::RequestGuid
     request.tokens.push_back(bos_token_id);
   }
   std::vector<int32_t> tokens = this->tokenizer_->Encode(prompt);
-  if (tokens.size() >= BatchConfig::MAX_SEQ_LENGTH) {
+  if (tokens.size() >= get_max_sequence_length()) {
     std::cout << "Warning: too many tokens in prompt, only load up to "
-              << BatchConfig::MAX_SEQ_LENGTH << " tokens, but got "
+              << get_max_sequence_length() << " tokens, but got "
               << tokens.size() << ".\n";
 
     printf("tokens size: %zu\n", tokens.size());
@@ -317,7 +358,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
   }
   // Step 2: prepare the next batch for existing requests
   BatchConfig new_bc;
-  for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
+  for (int i = 0; i < BatchConfig::max_requests_per_batch(); i++) {
     if (old_bc.request_completed[i]) {
       continue;
     }
@@ -405,7 +446,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
       } else {
         // Prompt phase
         new_bc.requestsInfo[i].num_tokens_in_batch =
-            std::min(BatchConfig::MAX_NUM_TOKENS - new_bc.num_tokens,
+            std::min(get_max_tokens_per_batch() - new_bc.num_tokens,
                      (int)request.tokens.size() -
                          new_bc.requestsInfo[i].token_start_offset);
       }
@@ -422,17 +463,17 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
     }
   }
   // Step 3: add new requests to the next batch
-  for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
+  for (int i = 0; i < BatchConfig::max_requests_per_batch(); i++) {
     if (new_bc.request_completed[i]) {
       if (!pending_request_queue.empty() &&
-          new_bc.num_tokens < BatchConfig::MAX_NUM_TOKENS) {
+          new_bc.num_tokens < get_max_tokens_per_batch()) {
         Request new_request = pending_request_queue.front();
         pending_request_queue.pop();
         // all_requests[new_request.guid] = new_request;
         new_bc.requestsInfo[i].token_start_offset = 0;
         new_bc.requestsInfo[i].request_guid = new_request.guid;
         new_bc.requestsInfo[i].num_tokens_in_batch =
-            std::min(BatchConfig::MAX_NUM_TOKENS - new_bc.num_tokens,
+            std::min(get_max_tokens_per_batch() - new_bc.num_tokens,
                      (int)new_request.tokens.size());
         new_bc.requestsInfo[i].max_sequence_length =
             new_request.max_sequence_length;
@@ -451,7 +492,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
               new_request.tokens[depth];
           new_bc.num_tokens++;
         }
-        if (new_bc.num_tokens == BatchConfig::MAX_NUM_TOKENS) {
+        if (new_bc.num_tokens == get_max_tokens_per_batch()) {
           break;
         }
       }
@@ -510,7 +551,7 @@ BeamSearchBatchConfig
   new_bc.model_id = model_id;
   int result_index = 0;
 
-  for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
+  for (int i = 0; i < BatchConfig::max_requests_per_batch(); i++) {
     if (old_bc.request_completed[i]) {
       continue;
     }
@@ -688,7 +729,7 @@ BeamSearchBatchConfig
           // Add verified token to request's token list
           request.tokens.push_back(token.first);
 
-          if (new_bc.num_tokens == BatchConfig::MAX_NUM_TOKENS) {
+          if (new_bc.num_tokens == get_max_tokens_per_batch()) {
             break;
           }
         }
@@ -731,17 +772,17 @@ BeamSearchBatchConfig
   }
 
   // Step 2: Initialize new request
-  for (int i = 0; i < BeamSearchBatchConfig::MAX_NUM_REQUESTS; i++) {
+  for (int i = 0; i < BeamSearchBatchConfig::max_requests_per_batch(); i++) {
     if (new_bc.request_completed[i]) {
       if (!pending_request_queue.empty() &&
-          new_bc.num_tokens < BeamSearchBatchConfig::MAX_NUM_TOKENS) {
+          new_bc.num_tokens < get_max_tokens_per_batch()) {
         Request new_request = pending_request_queue.front();
         pending_request_queue.pop();
         // all_requests[new_request.guid] = new_request;
         new_bc.requestsInfo[i].token_start_offset = 0;
         new_bc.requestsInfo[i].request_guid = new_request.guid;
         new_bc.requestsInfo[i].num_tokens_in_batch =
-            std::min(BeamSearchBatchConfig::MAX_NUM_TOKENS - new_bc.num_tokens,
+            std::min(get_max_tokens_per_batch() - new_bc.num_tokens,
                      (int)new_request.tokens.size());
         new_bc.requestsInfo[i].max_sequence_length =
             new_request.max_sequence_length;
@@ -757,7 +798,7 @@ BeamSearchBatchConfig
         new_bc.beamRequestsInfo[i].current_depth = 1;
         new_bc.beamRequestsInfo[i].max_depth =
             std::min(BeamSearchBatchConfig::MAX_BEAM_DEPTH,
-                     BatchConfig::MAX_NUM_TOKENS -
+                     get_max_tokens_per_batch() -
                          new_bc.requestsInfo[i].num_tokens_in_batch - 1);
         for (int j = 0; j < BeamSearchBatchConfig::MAX_BEAM_WIDTH; j++) {
           new_bc.beamRequestsInfo[i].parent_id[j] = 0;
@@ -807,7 +848,7 @@ BeamSearchBatchConfig
         std::cout << "total prompt in request: " << new_request.initial_len
                   << std::endl;
 
-        if (new_bc.num_tokens == BatchConfig::MAX_NUM_TOKENS) {
+        if (new_bc.num_tokens == get_max_tokens_per_batch()) {
           break;
         }
       }
@@ -876,7 +917,7 @@ BeamSearchBatchConfig
   new_bc.model_id = old_bc.model_id;
   // std::cout << "old_bc.model_id: " << old_bc.model_id << "\n";
 
-  for (int i = 0; i < BatchConfig::MAX_NUM_REQUESTS; i++) {
+  for (int i = 0; i < BatchConfig::max_requests_per_batch(); i++) {
     if (old_bc.request_completed[i]) {
       continue;
     }
@@ -922,7 +963,8 @@ BeamSearchBatchConfig
 
       // update the beam search metadata
       // how many sub request in current request
-      // why is sub_requests has MAX_NUM_REQUESTS * MAX_BEAM_WIDTH entries?
+      // why is sub_requests has max_requests_per_batch() * MAX_BEAM_WIDTH
+      // entries?
       new_bc.sub_requests[i] = old_bc.beamRequestsInfo[i].beam_size;
 
       // update the parentid, accumalated_probs, depth, and token_ids
@@ -964,9 +1006,8 @@ BeamSearchBatchConfig
       } else {
         // Prompt phase
         new_bc.requestsInfo[i].num_tokens_in_batch =
-            // std::min(BatchConfig::MAX_NUM_TOKENS - new_bc.num_tokens,
-            std::min(BatchConfig::MAX_NUM_TOKENS - new_bc.num_tokens -
-                         BatchConfig::MAX_NUM_REQUESTS + i,
+            std::min(get_max_tokens_per_batch() - new_bc.num_tokens -
+                         BatchConfig::max_requests_per_batch() + i,
                      (int)request.tokens.size() -
                          new_bc.requestsInfo[i].token_start_offset);
         request.ssm_cache_size += new_bc.requestsInfo[i].num_tokens_in_batch;
@@ -1067,8 +1108,8 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
   new_bc.num_tokens_to_commit = 0;
   new_bc.num_tokens = 0;
 
-  int max_prompt_load_size = BatchConfig::MAX_NUM_TOKENS;
-  for (int i = 0; i < TreeVerifyBatchConfig::MAX_NUM_REQUESTS; i++) {
+  int max_prompt_load_size = get_max_tokens_per_batch();
+  for (int i = 0; i < TreeVerifyBatchConfig::max_requests_per_batch(); i++) {
     if (old_batches.at(0).request_completed[i]) {
       continue;
     } else if (old_batches.at(0).request_running[i]) {
@@ -1078,7 +1119,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
     }
   }
 
-  for (int i = 0; i < TreeVerifyBatchConfig::MAX_NUM_REQUESTS; i++) {
+  for (int i = 0; i < TreeVerifyBatchConfig::max_requests_per_batch(); i++) {
     if (old_batches.at(0).request_completed[i]) {
       continue;
     }
@@ -1162,7 +1203,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       new_bc.num_tokens++;
       new_bc.requestsInfo[i].num_tokens_in_batch++;
 
-      if (new_bc.num_tokens > BatchConfig::MAX_NUM_TOKENS) {
+      if (new_bc.num_tokens > get_max_tokens_per_batch()) {
         assert(false &&
                "Exceeding the space available in the TreeVerify batch");
         break;
@@ -1186,7 +1227,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
         new_bc.num_tokens++;
         new_bc.requestsInfo[i].num_tokens_in_batch++;
 
-        if (new_bc.num_tokens == BatchConfig::MAX_NUM_TOKENS - 1) {
+        if (new_bc.num_tokens == get_max_tokens_per_batch() - 1) {
           break;
         }
       }
@@ -1251,7 +1292,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
           new_bc.num_tokens++;
         }
 
-        if (new_bc.num_tokens > BatchConfig::MAX_NUM_TOKENS) {
+        if (new_bc.num_tokens > get_max_tokens_per_batch()) {
           assert(false &&
                  "Exceeding the space available in the TreeVerify batch");
           break;
@@ -1270,7 +1311,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
                   request.tokens.back(), request.tokens.size() - 1)};
         }
       } else { // launch the request into running phase after loading all prompt
-        if (BatchConfig::MAX_NUM_TOKENS - new_bc.num_tokens > 0) {
+        if (get_max_tokens_per_batch() - new_bc.num_tokens > 0) {
           request.status = Request::RUNNING;
           new_bc.request_running[i] = true;
 
diff --git a/src/runtime/request_manager.cpp b/src/runtime/request_manager.cpp
index f323f262f2..1e756606f8 100644
--- a/src/runtime/request_manager.cpp
+++ b/src/runtime/request_manager.cpp
@@ -33,11 +33,11 @@ void RequestManager::load_tokens_task(
   BatchConfig const *batch_config = BatchConfig::from_future(task->futures[0]);
   BatchConfig::TokenId dram_copy[BatchConfig::MAX_NUM_TOKENS];
 
-  // Extreme long prompts are not supported, only load up to MAX_NUM_TOKENS as
-  // prompt
-  if (batch_config->num_tokens > BatchConfig::MAX_NUM_TOKENS) {
+  // Extreme long prompts are not supported, only load up to
+  // max_tokens_per_batch as prompt
+  if (batch_config->num_tokens > BatchConfig::max_tokens_per_batch()) {
     printf("Warning: too many tokens in prompt, only load up to %d tokens\n",
-           BatchConfig::MAX_NUM_TOKENS);
+           BatchConfig::max_tokens_per_batch());
     printf("Got: %d tokens\n", batch_config->num_tokens);
   }
 
diff --git a/src/runtime/request_manager.cu b/src/runtime/request_manager.cu
index 58e996629e..cd3e03fff6 100644
--- a/src/runtime/request_manager.cu
+++ b/src/runtime/request_manager.cu
@@ -32,14 +32,13 @@ void RequestManager::load_tokens_task(
   BatchConfig const *batch_config = BatchConfig::from_future(task->futures[0]);
   BatchConfig::TokenId dram_copy[BatchConfig::MAX_NUM_TOKENS];
 
-  // Extreme long prompts are not supported, only load up to MAX_NUM_TOKENS as
-  // prompt
-  if (batch_config->num_tokens > BatchConfig::MAX_NUM_TOKENS) {
+  // Extreme long prompts are not supported, only load up to
+  // BatchConfig::max_tokens_per_batch() as prompt
+  if (batch_config->num_tokens > BatchConfig::max_tokens_per_batch()) {
     printf("Warning: too many tokens in prompt, only load up to %d tokens\n",
-           BatchConfig::MAX_NUM_TOKENS);
+           BatchConfig::max_tokens_per_batch());
     printf("Got: %d tokens\n", batch_config->num_tokens);
   }
-  // assert(batch_config->num_tokens <= BatchConfig::MAX_NUM_TOKENS);
 
   for (int i = 0; i < batch_config->num_tokens; i++) {
     dram_copy[i] = batch_config->tokensInfo[i].token_id;
diff --git a/src/runtime/tree_verify_batch_config.cc b/src/runtime/tree_verify_batch_config.cc
index 78eff184c4..9efa06a2d5 100644
--- a/src/runtime/tree_verify_batch_config.cc
+++ b/src/runtime/tree_verify_batch_config.cc
@@ -33,14 +33,15 @@ InferenceMode TreeVerifyBatchConfig::get_mode() const {
 void TreeVerifyBatchConfig::print() const {
   std::cout << "@@@@@@@@@@@@@@ TreeVerifyBatchConfig (mode " << get_mode()
             << ") @@@@@@@@@@@@@@" << std::endl;
-  std::cout << "Max number of requests: " << MAX_NUM_REQUESTS << std::endl;
-  std::cout << "Max number of tokens: " << MAX_NUM_TOKENS << std::endl;
+  std::cout << "Max number of requests: " << max_requests_per_batch()
+            << std::endl;
+  std::cout << "Max number of tokens: " << max_tokens_per_batch() << std::endl;
   std::cout << "Number of tokens: " << num_tokens << std::endl;
   std::cout << "Number of requests: " << num_active_requests() << std::endl;
   // std::cout << "Cached results: " << cached_results << std::endl;
 
   std::cout << "Per-request info:\n";
-  for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
+  for (int i = 0; i < max_requests_per_batch(); i++) {
     if (!request_completed[i]) {
       std::cout << "  Request " << i << ":\n";
       std::cout << "    Token start offset: "

From edc6c49e01d2796fb5a12440064b68a86bff6081 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 2 Oct 2023 14:23:36 -0400
Subject: [PATCH 245/344] [Cleanup] - Remove obsolete stuff (#1160)

* remove obsolete stuff

* fix

---------

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 .github/workflows/clang-format-check.yml |   1 -
 bootcamp_demo/ff_alexnet_cifar10.py      |  70 ---
 bootcamp_demo/keras_cnn_cifar10.py       |  56 --
 bootcamp_demo/torch_alexnet_cifar10.py   |  44 --
 conda/build.sh                           |  30 -
 conda/meta.yaml                          |  28 -
 jupyter_notebook/README.md               |  89 ---
 jupyter_notebook/flexflow_jupyter.json   |  67 --
 jupyter_notebook/flexflow_kernel_nocr.py |  59 --
 jupyter_notebook/install.py              | 408 ------------
 nmt/Makefile                             |  50 --
 nmt/embed.cu                             | 373 -----------
 nmt/linear.cu                            | 618 ------------------
 nmt/lstm.cu                              | 652 -------------------
 nmt/nmt.cc                               | 359 -----------
 nmt/ops.h                                | 177 ------
 nmt/rnn.cu                               | 770 -----------------------
 nmt/rnn.h                                | 438 -------------
 nmt/rnn_mapper.cc                        | 138 ----
 nmt/rnn_mapper.h                         |  63 --
 nmt/softmax_data_parallel.cu             | 392 ------------
 scripts/FC_env_setup.sh                  |  33 -
 scripts/FC_setup.sh                      |  34 -
 scripts/FC_setup.txt                     |  24 -
 scripts/Makefile                         |   2 -
 scripts/compile_protobuf.sh              |   6 -
 scripts/osdi22ae/bert.sh                 |   7 -
 scripts/osdi22ae/candle_uno.sh           |   7 -
 scripts/osdi22ae/dlrm.sh                 |   7 -
 scripts/osdi22ae/inception.sh            |   7 -
 scripts/osdi22ae/mlp.sh                  |   7 -
 scripts/osdi22ae/resnext-50.sh           |   7 -
 scripts/osdi22ae/xdl.sh                  |   7 -
 scripts/test_run.sh                      |  38 --
 34 files changed, 5068 deletions(-)
 delete mode 100644 bootcamp_demo/ff_alexnet_cifar10.py
 delete mode 100644 bootcamp_demo/keras_cnn_cifar10.py
 delete mode 100644 bootcamp_demo/torch_alexnet_cifar10.py
 delete mode 100755 conda/build.sh
 delete mode 100644 conda/meta.yaml
 delete mode 100644 jupyter_notebook/README.md
 delete mode 100644 jupyter_notebook/flexflow_jupyter.json
 delete mode 100644 jupyter_notebook/flexflow_kernel_nocr.py
 delete mode 100644 jupyter_notebook/install.py
 delete mode 100644 nmt/Makefile
 delete mode 100644 nmt/embed.cu
 delete mode 100644 nmt/linear.cu
 delete mode 100644 nmt/lstm.cu
 delete mode 100644 nmt/nmt.cc
 delete mode 100644 nmt/ops.h
 delete mode 100644 nmt/rnn.cu
 delete mode 100644 nmt/rnn.h
 delete mode 100644 nmt/rnn_mapper.cc
 delete mode 100644 nmt/rnn_mapper.h
 delete mode 100644 nmt/softmax_data_parallel.cu
 delete mode 100755 scripts/FC_env_setup.sh
 delete mode 100644 scripts/FC_setup.sh
 delete mode 100644 scripts/FC_setup.txt
 delete mode 100644 scripts/Makefile
 delete mode 100755 scripts/compile_protobuf.sh
 delete mode 100755 scripts/osdi22ae/bert.sh
 delete mode 100755 scripts/osdi22ae/candle_uno.sh
 delete mode 100755 scripts/osdi22ae/dlrm.sh
 delete mode 100755 scripts/osdi22ae/inception.sh
 delete mode 100755 scripts/osdi22ae/mlp.sh
 delete mode 100755 scripts/osdi22ae/resnext-50.sh
 delete mode 100755 scripts/osdi22ae/xdl.sh
 delete mode 100644 scripts/test_run.sh

diff --git a/.github/workflows/clang-format-check.yml b/.github/workflows/clang-format-check.yml
index 1601da86b3..fdf53e8254 100644
--- a/.github/workflows/clang-format-check.yml
+++ b/.github/workflows/clang-format-check.yml
@@ -11,7 +11,6 @@ jobs:
             exclude: '\.proto$'
           - check: "include"
           - check: "inference"
-          - check: "nmt"
           - check: "python"
           - check: "scripts"
           - check: "tests"
diff --git a/bootcamp_demo/ff_alexnet_cifar10.py b/bootcamp_demo/ff_alexnet_cifar10.py
deleted file mode 100644
index cb0b0e99ad..0000000000
--- a/bootcamp_demo/ff_alexnet_cifar10.py
+++ /dev/null
@@ -1,70 +0,0 @@
-#./flexflow_python $FF_HOME/bootcamp_demo/ff_alexnet_cifar10.py -ll:py 1 -ll:gpu 1 -ll:fsize 2048 -ll:zsize 12192
-
-from flexflow.core import *
-from flexflow.keras.datasets import cifar10
-from flexflow.torch.model import PyTorchModel
-from PIL import Image
-
-def top_level_task():
-  ffconfig = FFConfig()
-  ffconfig.parse_args()
-  print("Python API batchSize(%d) workersPerNodes(%d) numNodes(%d)" %(ffconfig.get_batch_size(), ffconfig.get_workers_per_node(), ffconfig.get_num_nodes()))
-  ffmodel = FFModel(ffconfig)
-
-  dims_input = [ffconfig.get_batch_size(), 3, 229, 229]
-  input_tensor = ffmodel.create_tensor(dims_input, DataType.DT_FLOAT)
-  
-  torch_model = PyTorchModel("alexnet.ff")  
-  output_tensors = torch_model.apply(ffmodel, [input_tensor])
-
-  ffoptimizer = SGDOptimizer(ffmodel, 0.01)
-  ffmodel.set_sgd_optimizer(ffoptimizer)
-  ffmodel.compile(loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY, metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY])
-  label_tensor = ffmodel.get_label_tensor()
-
-  num_samples = 10000
-
-  (x_train, y_train), (x_test, y_test) = cifar10.load_data(num_samples)
-
-  full_input_np = np.zeros((num_samples, 3, 229, 229), dtype=np.float32)
-  
-  for i in range(0, num_samples):
-    image = x_train[i, :, :, :]
-    image = image.transpose(1, 2, 0)
-    pil_image = Image.fromarray(image)
-    pil_image = pil_image.resize((229,229), Image.NEAREST)
-    image = np.array(pil_image, dtype=np.float32)
-    image = image.transpose(2, 0, 1)
-    full_input_np[i, :, :, :] = image
-  
-  full_input_np /= 255
-  
-  y_train = y_train.astype('int32')
-  full_label_np = y_train
-
-  dataloader_input = ffmodel.create_data_loader(input_tensor, full_input_np)
-  dataloader_label = ffmodel.create_data_loader(label_tensor, full_label_np)
-
-  num_samples = dataloader_input.num_samples
-
-  ffmodel.init_layers()
-
-  epochs = ffconfig.get_epochs()
-
-  ts_start = ffconfig.get_current_time()
-  
-  ffmodel.fit(x=dataloader_input, y=dataloader_label, epochs=epochs)
-
-  ts_end = ffconfig.get_current_time()
-  run_time = 1e-6 * (ts_end - ts_start);
-  print("epochs %d, ELAPSED TIME = %.4fs, THROUGHPUT = %.2f samples/s\n" %(epochs, run_time, num_samples * epochs / run_time));
-
-  # perf_metrics = ffmodel.get_perf_metrics()
-  # accuracy = perf_metrics.get_accuracy()
-  # if accuracy < ModelAccuracy.CIFAR10_CNN.value:
-  #   assert 0, 'Check Accuracy'
-
-
-if __name__ == "__main__":
-  print("cifar10 cnn")
-  top_level_task()
diff --git a/bootcamp_demo/keras_cnn_cifar10.py b/bootcamp_demo/keras_cnn_cifar10.py
deleted file mode 100644
index a62f625449..0000000000
--- a/bootcamp_demo/keras_cnn_cifar10.py
+++ /dev/null
@@ -1,56 +0,0 @@
-#./flexflow_python $FF_HOME/bootcamp_demo/keras_cnn_cifar10.py -ll:py 1 -ll:gpu 1 -ll:fsize 2048 -ll:zsize 12192
-
-# from keras.models import Model, Sequential
-# from keras.layers import Input, Flatten, Dense, Activation, Conv2D, MaxPooling2D, Dropout
-# from keras.optimizers import SGD
-# from keras.datasets import cifar10
-# from keras import losses
-# from keras import metrics
-
-from flexflow.keras.models import Model, Sequential
-from flexflow.keras.layers import Input, Flatten, Dense, Activation, Conv2D, MaxPooling2D, Dropout
-from flexflow.keras.optimizers import SGD
-from flexflow.keras.datasets import cifar10
-from flexflow.keras import losses
-from flexflow.keras import metrics
-
-import numpy as np
-  
-def top_level_task():
-  num_classes = 10
-  
-  num_samples = 10000
-  
-  #(x_train, y_train), (x_test, y_test) = cifar10.load_data()
-  (x_train, y_train), (x_test, y_test) = cifar10.load_data(num_samples)
-  
-  x_train = x_train.astype('float32')
-  x_train /= 255
-  y_train = y_train.astype('int32')
-  print("shape: ", x_train.shape[1:])
-  
-  model = Sequential()
-
-  model.add(Conv2D(filters=32, input_shape=(3,32,32), kernel_size=(3,3), strides=(1,1), padding="valid", activation="relu"))
-  model.add(Conv2D(filters=32, kernel_size=(3,3), strides=(1,1), padding="valid", activation="relu"))
-  model.add(MaxPooling2D(pool_size=(2,2), strides=(2,2), padding="valid"))
-  model.add(Conv2D(filters=64, kernel_size=(3,3), strides=(1,1), padding="valid", activation="relu"))
-  model.add(Conv2D(filters=64, kernel_size=(3,3), strides=(1,1), padding="valid"))
-  model.add(Activation("relu"))
-  model.add(MaxPooling2D(pool_size=(2,2), strides=(2,2), padding="valid"))
-  model.add(Flatten())
-  model.add(Dense(512))
-  model.add(Activation("relu"))
-  model.add(Dropout(0.5))
-  model.add(Dense(num_classes))
-  model.add(Activation("softmax"))
-  
-  opt = SGD(learning_rate=0.01)
-  model.compile(optimizer=opt, loss='sparse_categorical_crossentropy', metrics=['accuracy', 'sparse_categorical_crossentropy'])
-  print(model.summary())
-
-  model.fit(x_train, y_train, batch_size=64, epochs=4)
-
-if __name__ == "__main__":
-  print("Functional API, cifar10 cnn")
-  top_level_task()
\ No newline at end of file
diff --git a/bootcamp_demo/torch_alexnet_cifar10.py b/bootcamp_demo/torch_alexnet_cifar10.py
deleted file mode 100644
index 394161c5a3..0000000000
--- a/bootcamp_demo/torch_alexnet_cifar10.py
+++ /dev/null
@@ -1,44 +0,0 @@
-#./flexflow_python $FF_HOME/bootcamp_demo/torch_alexnet_cifar10.py -ll:py 1 -ll:gpu 1 -ll:fsize 2048 -ll:zsize 12192
-
-# https://github.com/pytorch/vision/blob/master/torchvision/models/alexnet.py
-
-import torch.nn as nn
-import torch
-import flexflow.torch.fx as fx
-import torchvision.models as models
-
-class AlexNet(nn.Module):
-  def __init__(self, num_classes: int = 1000) -> None:
-    super(AlexNet, self).__init__()
-    self.features = nn.Sequential(
-      nn.Conv2d(3, 64, kernel_size=11, stride=4, padding=2),
-      nn.ReLU(inplace=True),
-      nn.MaxPool2d(kernel_size=3, stride=2),
-      nn.Conv2d(64, 192, kernel_size=5, padding=2),
-      nn.ReLU(inplace=True),
-      nn.MaxPool2d(kernel_size=3, stride=2),
-      nn.Conv2d(192, 384, kernel_size=3, padding=1),
-      nn.ReLU(inplace=True),
-      nn.Conv2d(384, 256, kernel_size=3, padding=1),
-      nn.ReLU(inplace=True),
-      nn.Conv2d(256, 256, kernel_size=3, padding=1),
-      nn.ReLU(inplace=True),
-      nn.MaxPool2d(kernel_size=3, stride=2),
-    )
-    self.classifier = nn.Sequential(
-      nn.Linear(256 * 6 * 6, 4096),
-      nn.ReLU(inplace=True),
-      nn.Linear(4096, 4096),
-      nn.ReLU(inplace=True),
-      nn.Linear(4096, num_classes),
-      nn.Softmax(),
-    )
-
-  def forward(self, x: torch.Tensor) -> torch.Tensor:
-    x = self.features(x)
-    x = torch.flatten(x, 1)
-    x = self.classifier(x)
-    return x
-
-model = AlexNet(num_classes=10)
-fx.torch_to_flexflow(model, "alexnet.ff")
\ No newline at end of file
diff --git a/conda/build.sh b/conda/build.sh
deleted file mode 100755
index 0e84b7489a..0000000000
--- a/conda/build.sh
+++ /dev/null
@@ -1,30 +0,0 @@
-#! /usr/bin/env bash
-set -euo pipefail
-
-# Cd into FF_HOME
-cd "${BASH_SOURCE[0]%/*}/../"
-
-# build flexflow
-# "search and replace" bash syntax used below to make shellcheck happy.
-# see here: https://wiki-dev.bash-hackers.org/syntax/pe
-CXXFLAGS="${CXXFLAGS//-O2/}"
-CXXFLAGS="${CXXFLAGS//-std=c++17/}"
-CXXFLAGS="${CXXFLAGS//-DNDEBUG/}"
-CXXFLAGS="${CXXFLAGS//-D_FORTIFY_SOURCE=2/}"
-export CXXFLAGS
-CPPFLAGS="${CPPFLAGS//-O2/}"
-CPPFLAGS="${CPPFLAGS//-std=c++17/}"
-CPPFLAGS="${CPPFLAGS//-DNDEBUG/}"
-CPPFLAGS="${CPPFLAGS//-D_FORTIFY_SOURCE=2/}"
-export CPPFLAGS
-
-#export CUDNN_HOME=/projects/opt/centos7/cuda/10.1
-#export CUDA_HOME=/projects/opt/centos7/cuda/10.1
-export PROTOBUF_DIR=$BUILD_PREFIX
-export FF_HOME=$SRC_DIR
-export LG_RT_DIR=$SRC_DIR/legion/runtime
-#export FF_ENABLE_DEBUG=1
-#export DEBUG=0
-
-cd python
-make
diff --git a/conda/meta.yaml b/conda/meta.yaml
deleted file mode 100644
index b6e14b2957..0000000000
--- a/conda/meta.yaml
+++ /dev/null
@@ -1,28 +0,0 @@
-package:
-  name: flexflow
-  version: "1.0"
-
-source:
-  git_rev: master
-  git_url: https://github.com/flexflow/FlexFlow.git
-
-build:
-  number: 0
-
-requirements:
-  build:
-    - make
-    - git
-    - zlib
-    - protobuf
-    - {{ compiler('c') }}
-    - {{ compiler('cxx') }}
-  host:
-    - python
-    - cffi
-  run:
-    - cffi
-    - numpy
-    - python
-    - zlib
-    - keras-preprocessing
diff --git a/jupyter_notebook/README.md b/jupyter_notebook/README.md
deleted file mode 100644
index fe25df6dbf..0000000000
--- a/jupyter_notebook/README.md
+++ /dev/null
@@ -1,89 +0,0 @@
-# Jupyter Notebook
-
-This directory contains Jupyter notebook support for
-FlexFlow. 
-It allows user to run any FlexFlow Python
-program (e.g., training models) on a single node using
-the in-browser jupyter notebook UI. 
-
-## Quick Start
-### Pre-requisite
-* Python >= 3.6
-* FlexFlow Python binding needs to be installed, please check the [installation guide](https://flexflow.readthedocs.io/en/latest/installation.html)
-* Install Jupyter notebook
-
-        pip install notebook
-
-### Install the FlexFlow IPython kernel
-```
-python ./install.py --(configurations)
-```
-Please refer to the [IPython Kernel Configurations](#kernel-configurations) section for the configuration details.
-
-If the installation is successed, the following log will be printed to the terminal.
-The `flexflow_kernel_nocr` is the IPython kernel name, where `nocr` means control replication is not enabled. 
-The control replication can be enabled once multi-node jupyter notebook support is provided in the future. 
-The `FlexFlow_SM_GPU` is the display name
-of the kernel, which can be modified by the configuration json file. 
-`FlexFlow` is the name entry in the json file, `SM` means the IPython kernel
-is only for shared memory machine, and `GPU` means GPU execution is enabled. 
-```
-IPython kernel: flexflow_kernel_nocr(FlexFlow_SM_GPU) has been installed
-```
-The installed IPython kernel can be also seen by using the following command:
-```
-jupyter kernelspec list
-```
-
-### Create a turnel (Optional)
-If you want to run the jupyter notebook server on a remote compute node instead of localhost, 
-you can create a turnel from localhost to the compute node.
-```
-ssh -4 -t -L 8888:localhost:8002 username@login-node-hostname ssh -t -L 8002:localhost:8888 computing_node
-```
-
-### Start the Jupyter Notebook server
-Launch jupyter notebook server on the compute node or localhost if the turnel is not created
-```
-jupyter notebook --port=8888 --no-browser
-```
-
-### Use the Jupyter Notebook in the browser
-* Open the browser, type the addredd http://localhost:8888/?token=xxx, the token will be
-displayed in the terminal once the server is started. 
-* Once the webpage is loaded, click "New" on the right top corner, and click the kernel 
-just installed. It is shown as the display name of the kernel, e.g. `FlexFlow_SM_GPU`.
-
-### Uninstall the IPython kernel
-```
-jupyter kernelspec uninstall flexflow_kernel_nocr
-```
-If the IPython kernel is re-installed, the old one will be automatically uninstalled by the install.py
-
-
-## IPython Kernel Configurations
-The IPython kernel can be configured by either passing arguments to `install.py` or using a json file.
-The accepted arguments can be listed with
-```
-python ./install.py --help
-```
-
-It is always preferred to use a json file. 
-The `flexflow_python.json` is the template respect to the
-flexflow_python. Most entries are using the following format:
-```
-"cpus": {
-    "cmd": "--cpus",
-    "value": 1
-}
-```
-* `cpus` is the name of the field. 
-
-* `cmd` is used to tell how to pass the value to the field.
-For example, flexflow uses `-ll:cpu` to set the number of CPUs, so the `cmd` in `flexflow_python.json` is `-ll:cpu`.
-
-* `value` is the value of the field. It can be set to `null`. In this case, the value is read
-from the command line arguments. 
-
-Other configuration options can be added by either appending them to the command line arguments or
-using the `other_options` field of the json file. 
diff --git a/jupyter_notebook/flexflow_jupyter.json b/jupyter_notebook/flexflow_jupyter.json
deleted file mode 100644
index 0ff79c7234..0000000000
--- a/jupyter_notebook/flexflow_jupyter.json
+++ /dev/null
@@ -1,67 +0,0 @@
-{
-    "name": "FlexFlow",
-    "kernel_name": "flexflow_kernel_nocr",
-    "flexflow_python_prefix": null,
-    "exe": "flexflow_python",
-    "cpus": {
-        "cmd": "-ll:cpu", 
-        "value": 1
-    },
-    "gpus": {
-        "cmd": "-ll:gpu",
-        "value": 1
-    },
-    "openmp": {
-        "cmd": "-ll:ocpu", 
-        "value": 0
-    },
-    "ompthreads": {
-        "cmd": "-ll:othr", 
-        "value": 0
-    },
-    "utility": {
-        "cmd": "-ll:util", 
-        "value": 1
-    },
-    "sysmem": {
-        "cmd": "-ll:csize", 
-        "value": null
-    },
-    "fbmem": {
-        "cmd": "-ll:fsize", 
-        "value": 4096
-    },
-    "zcmem": {
-        "cmd": "-ll:zsize", 
-        "value": 10240
-    },
-    "regmem": {
-        "cmd": "-ll:rsize", 
-        "value": null
-    },
-    "not_control_replicable": {
-        "action": "store_true",
-        "cmd": "--nocr", 
-        "value": null
-    },
-    "nodes": {
-        "cmd": "-n", 
-        "value": 1
-    },
-    "ranks_per_node": {
-        "cmd": "--npernode", 
-        "value": 1
-    },
-    "launcher": {
-        "type": "generic",
-        "cmd": "--launcher",
-        "value": null,
-        "launcher_extra": null
-    },
-    "other_options": [
-        {
-            "cmd": "-ll:py", 
-            "value": 1
-        }
-    ]
-}
\ No newline at end of file
diff --git a/jupyter_notebook/flexflow_kernel_nocr.py b/jupyter_notebook/flexflow_kernel_nocr.py
deleted file mode 100644
index 8441db5d3a..0000000000
--- a/jupyter_notebook/flexflow_kernel_nocr.py
+++ /dev/null
@@ -1,59 +0,0 @@
-#!/usr/bin/env python3
-
-# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-#     http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-#
-
-from __future__ import print_function
-from ipykernel.ipkernel import IPythonKernel
-import sys
-
-__version__ = '0.1'
-
-class FlexFlowKernelNoCR(IPythonKernel):
-    implementation = 'flexflow_kernel_nocr'
-    implementation_version = __version__
-
-    banner = "FlexFlow IPython Kernel for SM"
-    language = 'python'
-    language_version = __version__
-    language_info = {'name': 'flexflow_kernel_nocr',
-                     'mimetype': 'text/x-python',
-                     'codemirror_mode': {
-                        'name': 'ipython',
-                        'version': 3
-                        },
-                     'pygments_lexer': 'ipython3',
-                     'nbconvert_exporter': 'python',
-                     'file_extension': '.py'}
-
-    def __init__(self, **kwargs):
-        self.__stdout = None
-        self._set_stdout()
-        print("Init FlexFlow kernel for single node or multi-nodes without control replication.")
-        self._reset_stdout()
-        super().__init__(**kwargs)
-
-    def _set_stdout(self):
-        assert(self.__stdout == None), "stdout should be None"
-        self.__stdout = sys.stdout
-        sys.stdout = open('/dev/stdout', 'w')
-
-    def _reset_stdout(self):
-        assert(self.__stdout != None), "stdout should not be None"
-        sys.stdout = self.__stdout
-
-if __name__ == "__main__":
-    from ipykernel.kernelapp import IPKernelApp
-    IPKernelApp.launch_instance(kernel_class=FlexFlowKernelNoCR)
diff --git a/jupyter_notebook/install.py b/jupyter_notebook/install.py
deleted file mode 100644
index 9073620d26..0000000000
--- a/jupyter_notebook/install.py
+++ /dev/null
@@ -1,408 +0,0 @@
-#!/usr/bin/env python3
-
-# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-#     http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-#
-
-import json
-import os
-import re
-import sys
-import argparse
-from distutils import log
-import json
-import inspect
-import shutil
-
-from jupyter_client.kernelspec import KernelSpecManager, NoSuchKernel
-from IPython.utils.tempdir import TemporaryDirectory
-
-kernel_json = {"argv": [],
-    "display_name": "None",
-    "language": "python",
-}
-
-kernel_json_suffix_nocr = ["flexflow_kernel_nocr.py", "-f", "{connection_file}"]
-
-
-required_cmd_dict_key = ["name", "kernel_name", "flexflow_python_prefix", "exe", "cpus", "gpus", "openmp", "ompthreads", "utility", "sysmem", "fbmem", "zcmem", "regmem", "not_control_replicable"]
-
-# This internal method is used to delete a kernel specified by kernel_name
-def _delete_kernel(ksm, kernel_name, mute=True):
-    try:
-        spec = ksm.get_kernel_spec(kernel_name)
-        shutil.rmtree(spec.resource_dir)
-        if mute == False:
-            print("Find existing kernel:" + kernel_name + ", delete it before installation.")
-    except NoSuchKernel:
-        if mute == False:
-            print("No existing kernel:" + kernel_name + " has been installed, continue to installation.")
-
-# This internal method is used to install a kernel
-def _install_kernel(ksm, kernel_name, kernel_json, user, prefix, mute=True):
-    with TemporaryDirectory() as td:
-        os.chmod(td, 0o755)
-        with open(os.path.join(td, "kernel.json"), "w") as f:
-            json.dump(kernel_json, f, sort_keys=True)
-        try:
-            ksm.install_kernel_spec(td, kernel_name, user=user, prefix=prefix)
-            if mute == False:
-                print("IPython kernel: " + kernel_name + "(" + kernel_json["display_name"] + ") has been installed")
-        except Exception as e:
-            if mute == False:
-                log.error("Failed to install the IPython kernel: " +  kernel_name + "(" + kernel_json["display_name"] + ") with error: " + str(e))
-
-# This method parses the json file into a dict named cmd_dict
-def parse_json(flexflow_python_prefix,
-               cpus, 
-               gpus,
-               openmp,
-               ompthreads,
-               utility,
-               sysmem,
-               fbmem,
-               zcmem,
-               regmem,
-               launcher,
-               nodes,
-               ranks_per_node,
-               not_control_replicable,
-               kernel_name,
-               filename):
-    with open(filename) as json_file:
-        cmd_dict = json.load(json_file)
-        for key in required_cmd_dict_key:
-            if key not in cmd_dict:
-                assert 0, "Key: " + key + " is not existed."
-    # Criterion
-    #   if entry in the json file is set to null, we load it from the cmd line
-    args = inspect.getfullargspec(parse_json)
-    keys = args.args[0: len(args.args)-1]
-    sig = inspect.signature(parse_json)
-    argv_dict = locals()
-    for key in keys:
-        if key == "launcher":
-            if cmd_dict[key]["value"] == None and argv_dict[key] != "none":
-                cmd_dict[key]["value"] = argv_dict[key]
-            if cmd_dict[key]["launcher_extra"] == None:
-                cmd_dict[key]["launcher_extra"] = list()
-        elif key == "flexflow_python_prefix" or key == "kernel_name":
-            if cmd_dict[key] == None:
-                cmd_dict[key] = argv_dict[key]
-        else:
-            if cmd_dict[key]["value"] == None:
-                cmd_dict[key]["value"] = argv_dict[key]
-
-    return cmd_dict
-
-# This method is used to install the kernel for jupyter notebook support for single or
-# multiple nodes runs without control replication
-def install_kernel_nocr(user, prefix, cmd_opts, cmd_dict, verbose, kernel_file_dir):
-    if verbose:
-        print("cmd_dict is:\n" + str(cmd_dict))
-
-    # setup name and argv
-    kernel_json["argv"] = [cmd_dict["flexflow_python_prefix"] + "/" + cmd_dict["exe"]] + kernel_json["argv"]
-    kernel_json["display_name"] = cmd_dict["name"]
-
-    # launcher
-    if cmd_dict["launcher"]["value"] == None:
-        kernel_json["display_name"] += "_SM"
-    else:
-        kernel_json["display_name"] += "_DM"
-        nodes = cmd_dict["nodes"]["value"]
-        ranks_per_node = cmd_dict["ranks_per_node"]["value"]
-        launcher = cmd_dict["launcher"]["value"]
-        if cmd_dict["launcher"]["type"] == "legate":
-            # use legate launcher
-            kernel_json["argv"] += cmd_dict["launcher"]["cmd"], launcher, \
-                                   cmd_dict["nodes"]["cmd"], str(nodes), \
-                                   cmd_dict["ranks_per_node"]["cmd"], str(ranks_per_node)
-        else:
-            # use mpirun, srun and jsrun launcher
-            ranks = nodes * ranks_per_node
-            if launcher == "mpirun":
-                kernel_json["argv"] = ["mpirun", "-n", str(ranks), "--npernode", str(ranks_per_node)] + cmd_dict["launcher"]["launcher_extra"] + kernel_json["argv"]
-            elif launcher == "srun":
-                kernel_json["argv"] = ["srun", "-n", str(ranks), "--ntasks-per-node", str(ranks_per_node)] + cmd_dict["launcher"]["launcher_extra"] + kernel_json["argv"]
-            elif launcher == "jsrun":
-                kernel_json["argv"] = ["jsrun", "-n", str(ranks // ranks_per_node), "-r", "1", "-a", str(ranks_per_node)] + cmd_dict["launcher"]["launcher_extra"] + kernel_json["argv"]
-            else:
-                assert 0, "Unknown launcher"
-
-    # let's do not enable control replication because pygion has issue with cleaning up
-    # disable control replication
-    # assert cmd_dict["not_control_replicable"]["value"] == True
-    # kernel_json["argv"].append(cmd_dict["not_control_replicable"]["cmd"])
-
-    # cpu
-    if cmd_dict["cpus"]["value"] > 0:
-        kernel_json["argv"] += cmd_dict["cpus"]["cmd"], str(cmd_dict["cpus"]["value"])
-
-    # gpu
-    if cmd_dict["gpus"]["value"] > 0:
-        kernel_json["display_name"] += "_GPU"
-        kernel_json["argv"] += cmd_dict["gpus"]["cmd"], str(cmd_dict["gpus"]["value"])
-        if cmd_dict["fbmem"]["value"] > 0:
-            kernel_json["argv"] += cmd_dict["fbmem"]["cmd"], str(cmd_dict["fbmem"]["value"])
-        if cmd_dict["zcmem"]["value"] > 0:
-            kernel_json["argv"] += cmd_dict["zcmem"]["cmd"], str(cmd_dict["zcmem"]["value"])
-
-    # openmp
-    if cmd_dict["openmp"]["value"] > 0:
-        if cmd_dict["ompthreads"]["value"] > 0:
-            kernel_json["argv"] += cmd_dict["openmp"]["cmd"], str(cmd_dict["openmp"]["value"])
-            kernel_json["argv"] += cmd_dict["ompthreads"]["cmd"], str(cmd_dict["ompthreads"]["value"])
-        else:
-            print(
-                "WARNING: ignore request for "
-                + str(cmd_dict["openmp"]["value"])
-                + "OpenMP processors with 0 threads"
-            )
-    
-    # utility
-    if cmd_dict["utility"]["value"] > 0:
-        kernel_json["argv"] += cmd_dict["utility"]["cmd"], str(cmd_dict["utility"]["value"])
-    
-    # system memory
-    if cmd_dict["sysmem"]["value"] > 0:
-        kernel_json["argv"] += cmd_dict["sysmem"]["cmd"], str(cmd_dict["sysmem"]["value"])
-    
-    # register memory
-    if cmd_dict["regmem"]["value"] > 0:
-        kernel_json["argv"] += cmd_dict["regmem"]["cmd"], str(cmd_dict["regmem"]["value"])
-    
-    # other options from json
-    if "other_options" in cmd_dict:
-        other_options = cmd_dict["other_options"]
-        for option in other_options:
-            if option["value"] == None:
-                kernel_json["argv"].append(option["cmd"])
-            else:
-                kernel_json["argv"] += option["cmd"], str(option["value"])
-
-    # other options from cmd line
-    for option in cmd_opts:
-        kernel_json["argv"].append(option)
-
-    ksm = KernelSpecManager()
-
-    # we need the installation dir of kernel, so first install a fake one
-    tmp_kernel_name = "tmp_legion_kernel"
-    tmp_kernel_json = {"argv": [], "display_name": "Tmp", "language": "python"}
-    _install_kernel(ksm, tmp_kernel_name, tmp_kernel_json, user, prefix)
-    spec = ksm.get_kernel_spec(tmp_kernel_name)
-    kernel_install_dir = os.path.dirname(spec.resource_dir)
-    _delete_kernel(ksm, tmp_kernel_name)
-
-    # Now start installation
-    kernel_name = cmd_dict["kernel_name"]
-
-    # add installation dir to legin_kernel_nocr.py
-    kernel_install_dir = os.path.join(kernel_install_dir, kernel_name)
-    kernel_filename = kernel_json_suffix_nocr[0]
-    kernel_json_suffix_nocr[0] = os.path.join(kernel_install_dir, kernel_filename)
-    kernel_json["argv"] += kernel_json_suffix_nocr
-    if verbose:
-        print("The kernel_json is:\n" + str(kernel_json))
-
-    # check if kernel is existed, if yes, then delete the old one before installation. 
-    _delete_kernel(ksm, kernel_name, False)
-
-    # install the kernel
-    _install_kernel(ksm, kernel_name, kernel_json, user, prefix, False)
-
-    # copy legion_kernel_nocr.py into kernel dir
-    if kernel_file_dir == None:
-        file_path = os.getcwd() + "/" + kernel_filename
-    else:
-        file_path = kernel_file_dir + "/" + kernel_filename
-    shutil.copy(file_path, kernel_install_dir)
-
-def parse_args(argv=None):
-    parser = argparse.ArgumentParser(
-        description="Install Legion IPython Kernel"
-    )
-
-    parser.add_argument(
-        "--user",
-        action="store_true",
-        default=True,
-        dest="user",
-        help="Install the kernel in user home directory",
-    )
-    parser.add_argument(
-        "--kernel-name",
-        default="",
-        dest="kernel_name",
-        help="Install the kernel into prefix",
-    )
-    parser.add_argument(
-        "--prefix",
-        default=None,
-        dest="prefix",
-        help="Install the kernel into prefix",
-    )
-    parser.add_argument(
-        "--json",
-        default="flexflow_jupyter.json",
-        dest="json",
-        help="Configuration file of flexflow_python",
-    )
-    parser.add_argument(
-        "--flexflow-python-prefix",
-        default=None,
-        dest="flexflow_python_prefix",
-        help="The dirctory where flexflow_python is installed",
-    )
-    parser.add_argument(
-        "--cpus",
-        type=int,
-        default=1,
-        dest="cpus",
-        help="Number of CPUs to use per rank",
-    )
-    parser.add_argument(
-        "--gpus",
-        type=int,
-        default=1,
-        dest="gpus",
-        help="Number of GPUs to use per rank",
-    )
-    parser.add_argument(
-        "--omps",
-        type=int,
-        default=0,
-        dest="openmp",
-        help="Number of OpenMP groups to use per rank",
-    )
-    parser.add_argument(
-        "--ompthreads",
-        type=int,
-        default=4,
-        dest="ompthreads",
-        help="Number of threads per OpenMP group",
-    )
-    parser.add_argument(
-        "--utility",
-        type=int,
-        default=1,
-        dest="utility",
-        help="Number of Utility processors per rank to request for meta-work",
-    )
-    parser.add_argument(
-        "--sysmem",
-        type=int,
-        default=4000,
-        dest="sysmem",
-        help="Amount of DRAM memory per rank (in MBs)",
-    )
-    parser.add_argument(
-        "--fbmem",
-        type=int,
-        default=4000,
-        dest="fbmem",
-        help="Amount of framebuffer memory per GPU (in MBs)",
-    )
-    parser.add_argument(
-        "--zcmem",
-        type=int,
-        default=32,
-        dest="zcmem",
-        help="Amount of zero-copy memory per rank (in MBs)",
-    )
-    parser.add_argument(
-        "--regmem",
-        type=int,
-        default=0,
-        dest="regmem",
-        help="Amount of registered CPU-side pinned memory per rank (in MBs)",
-    )
-    parser.add_argument(
-        "--no-replicate",
-        dest="not_control_replicable",
-        action="store_true",
-        required=False,
-        default=True,
-        help="Execute this program without control replication.  Most of the "
-        "time, this is not recommended.  This option should be used for "
-        "debugging.  The -lg:safe_ctrlrepl Legion option may be helpful "
-        "with discovering issues with replicated control.",
-    )
-    parser.add_argument(
-        "--launcher",
-        dest="launcher",
-        choices=["mpirun", "jsrun", "srun", "none"],
-        default="none",
-        help='launcher program to use (set to "none" for local runs, or if '
-        "the launch has already happened by the time legate is invoked)",
-    )
-    parser.add_argument(
-        "--nodes",
-        type=int,
-        default=1,
-        dest="nodes",
-        help="Number of nodes to use",
-    )
-    parser.add_argument(
-        "--ranks-per-node",
-        type=int,
-        default=1,
-        dest="ranks_per_node",
-        help="Number of ranks (processes running copies of the program) to "
-        "launch per node. The default (1 rank per node) will typically result "
-        "in the best performance.",
-    )
-    parser.add_argument(
-        "--verbose",
-        action="store_true",
-        default=False,
-        dest="verbose",
-        help="Display the detailed log of installation",
-    )
-
-    args, opts = parser.parse_known_args()
-    return args, opts
-
-def driver(args, opts, kernel_file_dir=None):
-    cmd_dict = parse_json(flexflow_python_prefix=args.flexflow_python_prefix,
-                          cpus=args.cpus,
-                          gpus=args.gpus,
-                          openmp=args.openmp,
-                          ompthreads=args.ompthreads,
-                          utility=args.utility,
-                          sysmem=args.sysmem,
-                          fbmem=args.fbmem,
-                          zcmem=args.zcmem,
-                          regmem=args.regmem,
-                          launcher=args.launcher,
-                          nodes=args.nodes,
-                          ranks_per_node=args.ranks_per_node,
-                          not_control_replicable=args.not_control_replicable,
-                          kernel_name=args.kernel_name,
-                          filename=args.json)
-
-    if cmd_dict["not_control_replicable"]:
-        install_kernel_nocr(user=args.user, 
-                            prefix=args.prefix, 
-                            cmd_opts=opts,
-                            cmd_dict=cmd_dict,
-                            verbose=args.verbose,
-                            kernel_file_dir=kernel_file_dir)
-    else:
-        assert 0, "Control replication is not supported yet"
-
-if __name__ == '__main__':
-    args, opts = parse_args()
-    driver(args, opts)
diff --git a/nmt/Makefile b/nmt/Makefile
deleted file mode 100644
index 261da88655..0000000000
--- a/nmt/Makefile
+++ /dev/null
@@ -1,50 +0,0 @@
-# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-#     http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-#
-
-ifndef LG_RT_DIR
-$(error LG_RT_DIR variable is not defined, aborting build)
-endif
-
-# Flags for directing the runtime makefile what to include
-DEBUG           ?= 0		# Include debugging symbols
-OUTPUT_LEVEL    ?= LEVEL_DEBUG	# Compile time logging level
-USE_CUDA        ?= 1		# Include CUDA support (requires CUDA)
-USE_GASNET      ?= 1		# Include GASNet support (requires GASNet)
-USE_HDF         ?= 0		# Include HDF5 support (requires HDF5)
-ALT_MAPPERS     ?= 0		# Include alternative mappers (not recommended)
-
-# Put the binary file name here
-OUTFILE		?= nmt
-# List all the application source files here
-GEN_SRC		?= nmt.cc rnn_mapper.cc	# .cc files
-GEN_GPU_SRC	?= lstm.cu linear.cu embed.cu rnn.cu softmax_data_parallel.cu ../cnn_helper.cu# .cu files
-
-# You can modify these variables, some will be appended to by the runtime makefile
-INC_FLAGS	?= 
-CC_FLAGS	?= 
-NVCC_FLAGS	?=
-GASNET_FLAGS	?=
-LD_FLAGS	?= -lcudnn -lcublas -lcurand 
-# For Point and Rect typedefs
-CC_FLAGS	+= -std=c++11
-NVCC_FLAGS  += -std=c++11
-###########################################################################
-#
-#   Don't change anything below here
-#   
-###########################################################################
-
-include $(LG_RT_DIR)/runtime.mk
-
diff --git a/nmt/embed.cu b/nmt/embed.cu
deleted file mode 100644
index 077c5ec565..0000000000
--- a/nmt/embed.cu
+++ /dev/null
@@ -1,373 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "../cnn_helper.h"
-#include "rnn.h"
-#include "rnn_mapper.h"
-
-struct EmbedInitParams {
-  DnnHandle handle;
-  int batchSize, outputSize, vocabSize;
-};
-
-Tensor RnnModel::add_embed_node(Tensor x,
-                                int vocab_size,
-                                int output_size,
-                                ParallelConfig pc,
-                                SharedVariable params) {
-  assert(x.numDim == 2);
-  assert(x.adim[1] == LSTM_PER_NODE_LENGTH);
-  assert(x.pdim[1] == LSTM_PER_NODE_LENGTH);
-  Embed *node = new Embed(config, x, vocab_size, output_size, pc, params);
-  layers.push_back(node);
-  return node->outputs[0];
-}
-
-Embed::Embed(RnnConfig config,
-             Tensor x,
-             int _vocab_size,
-             int _output_size,
-             ParallelConfig pc,
-             SharedVariable _params)
-    : RnnOp(x, pc, _params), batchSize(x.adim[0]), vocabSize(_vocab_size),
-      outputSize(_output_size) {
-  Context ctx = config.lg_ctx;
-  HighLevelRuntime *runtime = config.lg_hlr;
-  assert(pc.nDims == 1);
-  {
-    Rect<1> rect(Point<1>(0), Point<1>(pc.dim[0] - 1));
-    part_rect = rect;
-  }
-  IndexSpaceT<1> part_is = runtime->create_index_space(ctx, part_rect);
-  FieldSpace fs = config.field_space;
-  Rect<3, coord_t> y_rect(
-      Point<3>(0, 0, 0),
-      Point<3>(outputSize - 1, batchSize - 1, LSTM_PER_NODE_LENGTH - 1));
-  IndexSpaceT<3> y_is = runtime->create_index_space(ctx, y_rect);
-  LogicalRegion y_lr = runtime->create_logical_region(ctx, y_is, fs);
-  LogicalRegion y_grad_lr = runtime->create_logical_region(ctx, y_is, fs);
-  int num_par_n = part_rect.hi[0] - part_rect.lo[0] + 1;
-  assert(batchSize % num_par_n == 0);
-  int extent_n = batchSize / num_par_n;
-  int extent_c = outputSize;
-  Rect<3, coord_t> extent(
-      Point<3>(0, 0, 0),
-      Point<3>(extent_c - 1, extent_n - 1, LSTM_PER_NODE_LENGTH - 1));
-  Transform<3, 1, coord_t> trans;
-  trans[0][0] = 0;
-  trans[1][0] = extent_n;
-  trans[2][0] = 0;
-  IndexPartition y_ip = runtime->create_partition_by_restriction(
-      ctx, y_is, part_is, trans, extent);
-  assert(runtime->is_index_partition_disjoint(ctx, y_ip));
-  assert(runtime->is_index_partition_complete(ctx, y_ip));
-  LogicalPartition y_lp = runtime->get_logical_partition(ctx, y_lr, y_ip);
-  LogicalPartition y_grad_lp =
-      runtime->get_logical_partition(ctx, y_grad_lr, y_ip);
-  outputs[0].region = y_lr;
-  outputs[0].region_grad = y_grad_lr;
-  outputs[0].partition = y_lp;
-  outputs[0].partition_grad = y_grad_lp;
-  outputs[0].numDim = 3;
-  outputs[0].adim[0] = outputSize;
-  outputs[0].adim[1] = batchSize;
-  outputs[0].adim[2] = LSTM_PER_NODE_LENGTH;
-  outputs[0].pdim[0] = extent_c;
-  outputs[0].pdim[1] = extent_n;
-  outputs[0].pdim[2] = LSTM_PER_NODE_LENGTH;
-}
-
-/*
-  regions[0] (I): x
-  regions[1] (I): w
-  regions[2] (O): y
- */
-OpMeta *Embed::init_task(Task const *task,
-                         std::vector<PhysicalRegion> const &regions,
-                         Context ctx,
-                         Runtime *runtime) {
-  assert(regions.size() == 3);
-  assert(task->regions.size() == 3);
-  EmbedInitParams const *embed = (EmbedInitParams *)task->args;
-  Rect<2> rect_x = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  Rect<1> rect_w = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  Rect<3> rect_y = runtime->get_index_space_domain(
-      ctx, task->regions[2].region.get_index_space());
-  assert(rect_x.hi[0] - rect_x.lo[0] + 1 == embed->batchSize);
-  assert(rect_x.hi[1] - rect_x.lo[1] + 1 == LSTM_PER_NODE_LENGTH);
-  assert(rect_w.hi[0] - rect_w.lo[0] + 1 ==
-         embed->vocabSize * embed->outputSize);
-  assert(rect_y.hi[0] - rect_y.lo[0] + 1 == embed->outputSize);
-  assert(rect_y.hi[1] - rect_y.lo[1] + 1 == embed->batchSize);
-  assert(rect_y.hi[2] - rect_y.lo[2] + 1 == LSTM_PER_NODE_LENGTH);
-  EmbedMeta *m = new EmbedMeta(embed->handle);
-  m->profiling_runtime = false;
-  return m;
-}
-
-void Embed::init(RnnModel const &model) {
-  Context ctx = model.config.lg_ctx;
-  Runtime *runtime = model.config.lg_hlr;
-  int idx = 0;
-  for (PointInRectIterator<1> it(part_rect); it(); it++, idx++) {
-    EmbedInitParams initParams;
-    initParams.handle = model.dnn_handlers[paraConfig.gpu[idx]];
-    initParams.batchSize = outputs[0].pdim[1];
-    initParams.outputSize = outputs[0].pdim[0];
-    initParams.vocabSize = vocabSize;
-    // batch is the first dim of input and the second dim of output
-    assert(inputs[0].pdim[0] == outputs[0].pdim[1]);
-    TaskLauncher launcher(EMBED_INIT_TASK_ID,
-                          TaskArgument(&initParams, sizeof(initParams)),
-                          Predicate::TRUE_PRED,
-                          0 /*MapperID*/,
-                          RnnMapper::assign_to_gpu(paraConfig.gpu[idx]));
-    DomainPoint dp(*it);
-    {
-      LogicalRegion x =
-          runtime->get_logical_subregion_by_color(inputs[0].partition, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(x, READ_ONLY, EXCLUSIVE, inputs[0].region));
-      launcher.add_field(0, FID_DATA);
-    }
-    launcher.add_region_requirement(
-        RegionRequirement(params.region, READ_ONLY, EXCLUSIVE, params.region));
-    launcher.add_field(1, FID_DATA);
-    {
-      LogicalRegion y =
-          runtime->get_logical_subregion_by_color(outputs[0].partition, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(y, WRITE_ONLY, EXCLUSIVE, outputs[0].region));
-      launcher.add_field(2, FID_DATA);
-    }
-    Future f = runtime->execute_task(ctx, launcher);
-    meta[idx] = f.get_result<OpMeta *>();
-  }
-}
-
-__global__ void embedForward(int const *x_ptr,
-                             float const *embed,
-                             float *y_ptr,
-                             coord_t numElements,
-                             int shift,
-                             int outputSize) {
-  CUDA_KERNEL_LOOP(i, numElements) {
-    int idx = i >> shift;
-    int off = i & (outputSize - 1);
-    int wordIdx = x_ptr[idx];
-    y_ptr[i] = embed[(wordIdx << shift) + off];
-  }
-}
-
-__global__ void embedBackward(int const *x_ptr,
-                              float *embed,
-                              float const *y_ptr,
-                              coord_t numElements,
-                              int shift,
-                              int outputSize) {
-  CUDA_KERNEL_LOOP(i, numElements) {
-    int idx = i >> shift;
-    int off = i & (outputSize - 1);
-    int wordIdx = x_ptr[idx];
-    atomicAdd(embed + (wordIdx << shift) + off, y_ptr[i]);
-  }
-}
-
-/*
-  regions[0](I): x
-  regions[1](I): w
-  regions[2](O): y
-*/
-void Embed::forward_task(Task const *task,
-                         std::vector<PhysicalRegion> const &regions,
-                         Context ctx,
-                         Runtime *runtime) {
-#ifndef DISABLE_COMPUTATION
-  assert(regions.size() == 3);
-  assert(task->regions.size() == 3);
-  EmbedMeta const *m = *((EmbedMeta **)task->args);
-  AccessorRO<int, 2> const acc_x(regions[0], FID_DATA);
-  AccessorRO<float, 1> const acc_w(regions[1], FID_DATA);
-  AccessorWO<float, 3> const acc_y(regions[2], FID_DATA);
-  Rect<2> rect_x = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  Rect<1> rect_w = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  Rect<3> rect_y = runtime->get_index_space_domain(
-      ctx, task->regions[2].region.get_index_space());
-  assert(acc_x.accessor.is_dense_arbitrary(rect_x));
-  assert(acc_w.accessor.is_dense_arbitrary(rect_w));
-  assert(acc_y.accessor.is_dense_arbitrary(rect_y));
-  int batch_size = rect_y.hi[1] - rect_y.lo[1] + 1;
-  int output_size = rect_y.hi[0] - rect_y.lo[0] + 1;
-  int const *x_ptr = acc_x.ptr(rect_x.lo);
-  float const *w_ptr = acc_w.ptr(rect_w.lo);
-  float *y_ptr = acc_y.ptr(rect_y.lo);
-  cudaEvent_t t_start, t_end;
-  if (m->profiling_runtime) {
-    cudaEventCreate(&t_start);
-    cudaEventCreate(&t_end);
-    cudaEventRecord(t_start);
-  }
-  int shift = 0;
-  int size = 1;
-  while (size < output_size) {
-    size = size * 2;
-    shift = shift + 1;
-  }
-  assert(size == output_size);
-  embedForward<<<GET_BLOCKS(rect_y.volume()), CUDA_NUM_THREADS>>>(
-      x_ptr, w_ptr, y_ptr, rect_y.volume(), shift, output_size);
-  if (m->profiling_runtime) {
-    cudaEventRecord(t_end);
-    checkCUDA(cudaEventSynchronize(t_end));
-    float elapsed = 0;
-    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
-    cudaEventDestroy(t_start);
-    cudaEventDestroy(t_end);
-    printf("Embed forward time = %.2lfms\n", elapsed);
-  }
-#endif
-}
-
-void Embed::forward(RnnModel const &model) {
-  Context ctx = model.config.lg_ctx;
-  Runtime *runtime = model.config.lg_hlr;
-  int idx = 0;
-  for (PointInRectIterator<1> it(part_rect); it(); it++, idx++) {
-    OpMeta *mp = meta[idx];
-    TaskLauncher launcher(EMBED_FWD_TASK_ID,
-                          TaskArgument(&mp, sizeof(OpMeta *)),
-                          Predicate::TRUE_PRED,
-                          0 /*MapperID*/,
-                          RnnMapper::assign_to_gpu(paraConfig.gpu[idx]));
-    DomainPoint dp(*it);
-    {
-      LogicalRegion x =
-          runtime->get_logical_subregion_by_color(inputs[0].partition, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(x, READ_ONLY, EXCLUSIVE, inputs[0].region));
-      launcher.add_field(0, FID_DATA);
-    }
-    launcher.add_region_requirement(
-        RegionRequirement(params.region, READ_ONLY, EXCLUSIVE, params.region));
-    launcher.add_field(1, FID_DATA);
-    {
-      LogicalRegion y =
-          runtime->get_logical_subregion_by_color(outputs[0].partition, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(y, WRITE_ONLY, EXCLUSIVE, outputs[0].region));
-      launcher.add_field(2, FID_DATA);
-    }
-    runtime->execute_task(ctx, launcher);
-  }
-}
-
-/*
-  regions[0](I): x
-  regions[1](I/O): w_grad
-  regions[2](I): y_grad
-*/
-void Embed::backward_task(Task const *task,
-                          std::vector<PhysicalRegion> const &regions,
-                          Context ctx,
-                          Runtime *runtime) {
-#ifndef DISABLE_COMPUTATION
-  assert(regions.size() == 3);
-  assert(task->regions.size() == 3);
-  EmbedMeta const *m = *((EmbedMeta **)task->args);
-  AccessorRO<int, 2> const acc_x(regions[0], FID_DATA);
-  AccessorRW<float, 1> const acc_w(regions[1], FID_DATA);
-  AccessorRO<float, 3> const acc_y(regions[2], FID_DATA);
-  Rect<2> rect_x = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  Rect<1> rect_w = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  Rect<3> rect_y = runtime->get_index_space_domain(
-      ctx, task->regions[2].region.get_index_space());
-  assert(acc_x.accessor.is_dense_arbitrary(rect_x));
-  assert(acc_w.accessor.is_dense_arbitrary(rect_w));
-  assert(acc_y.accessor.is_dense_arbitrary(rect_y));
-  int batch_size = rect_y.hi[1] - rect_y.lo[1] + 1;
-  int output_size = rect_y.hi[0] - rect_y.lo[0] + 1;
-  int const *x_ptr = acc_x.ptr(rect_x.lo);
-  float *w_ptr = acc_w.ptr(rect_w.lo);
-  float const *y_ptr = acc_y.ptr(rect_y.lo);
-  cudaEvent_t t_start, t_end;
-  if (m->profiling_runtime) {
-    cudaEventCreate(&t_start);
-    cudaEventCreate(&t_end);
-    cudaEventRecord(t_start);
-  }
-  int shift = 0;
-  int size = 1;
-  while (size < output_size) {
-    size = size * 2;
-    shift = shift + 1;
-  }
-  assert(size == output_size);
-  embedBackward<<<GET_BLOCKS(rect_y.volume()), CUDA_NUM_THREADS>>>(
-      x_ptr, w_ptr, y_ptr, rect_y.volume(), shift, output_size);
-  if (m->profiling_runtime) {
-    cudaEventRecord(t_end);
-    checkCUDA(cudaEventSynchronize(t_end));
-    float elapsed = 0;
-    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
-    cudaEventDestroy(t_start);
-    cudaEventDestroy(t_end);
-    printf("Embed backward time = %.2lfms\n", elapsed);
-  }
-#endif
-}
-
-void Embed::backward(RnnModel const &model) {
-  Context ctx = model.config.lg_ctx;
-  Runtime *runtime = model.config.lg_hlr;
-  int idx = 0;
-  for (PointInRectIterator<1> it(part_rect); it(); it++, idx++) {
-    OpMeta *mp = meta[idx];
-    TaskLauncher launcher(EMBED_BWD_TASK_ID,
-                          TaskArgument(&mp, sizeof(OpMeta *)),
-                          Predicate::TRUE_PRED,
-                          0 /*MapperID*/,
-                          RnnMapper::assign_to_gpu(paraConfig.gpu[idx]));
-    DomainPoint dp(*it);
-    {
-      LogicalRegion x =
-          runtime->get_logical_subregion_by_color(inputs[0].partition, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(x, READ_ONLY, EXCLUSIVE, inputs[0].region));
-      launcher.add_field(0, FID_DATA);
-    }
-    launcher.add_region_requirement(
-        RegionRequirement(params.gradients[paraConfig.gpu[idx]],
-                          READ_WRITE,
-                          EXCLUSIVE,
-                          params.gradients[paraConfig.gpu[idx]]));
-    launcher.add_field(1, FID_DATA);
-    {
-      LogicalRegion y_grad = runtime->get_logical_subregion_by_color(
-          outputs[0].partition_grad, dp);
-      launcher.add_region_requirement(RegionRequirement(
-          y_grad, READ_ONLY, EXCLUSIVE, outputs[0].region_grad));
-      launcher.add_field(2, FID_DATA);
-    }
-    runtime->execute_task(ctx, launcher);
-  }
-}
-
-void Embed::update(RnnModel const &model) {}
diff --git a/nmt/linear.cu b/nmt/linear.cu
deleted file mode 100644
index 48a7290bf0..0000000000
--- a/nmt/linear.cu
+++ /dev/null
@@ -1,618 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "../cnn_helper.h"
-#include "rnn.h"
-#include "rnn_mapper.h"
-
-struct LinearInitParams {
-  DnnHandle handle;
-  int batchSize, inputSize, outputSize;
-};
-
-Tensor RnnModel::add_linear_node(Tensor x,
-                                 int output_size,
-                                 ParallelConfig pc,
-                                 SharedVariable params) {
-  assert(x.numDim == 3);
-  assert(x.adim[2] == LSTM_PER_NODE_LENGTH);
-  assert(x.pdim[2] == LSTM_PER_NODE_LENGTH);
-  Linear *node = new Linear(config, x, output_size, pc, params, part_is);
-  layers.push_back(node);
-  return node->outputs[0];
-}
-
-Linear::Linear(RnnConfig config,
-               Tensor input,
-               int _output_size,
-               ParallelConfig pc,
-               SharedVariable _params,
-               IndexSpaceT<1> input_part_is)
-    : RnnOp(input, pc, _params), input_size(input.adim[0]),
-      output_size(_output_size) {
-  Context ctx = config.lg_ctx;
-  HighLevelRuntime *runtime = config.lg_hlr;
-  assert(pc.nDims == 2);
-  int num_par_n = pc.dim[1];
-  int num_par_c = pc.dim[0];
-  input_part_rect = runtime->get_index_space_domain(ctx, input_part_is);
-  {
-    Rect<2> rect(Point<2>(0, 0), Point<2>(num_par_c - 1, num_par_n - 1));
-    part_rect = rect;
-  }
-  IndexSpaceT<2> part_is = runtime->create_index_space(ctx, part_rect);
-  int batch_size = input.adim[1];
-  FieldSpace fs = config.field_space;
-  Rect<3, coord_t> y_rect(
-      Point<3>(0, 0, 0),
-      Point<3>(output_size - 1, batch_size - 1, LSTM_PER_NODE_LENGTH - 1));
-  IndexSpaceT<3> y_is = runtime->create_index_space(ctx, y_rect);
-  LogicalRegion y_lr = runtime->create_logical_region(ctx, y_is, fs);
-  LogicalRegion y_grad_lr = runtime->create_logical_region(ctx, y_is, fs);
-  assert(output_size % num_par_c == 0);
-  assert(batch_size % num_par_n == 0);
-  int extent_c = output_size / num_par_c;
-  int extent_n = batch_size / num_par_n;
-  Rect<3, coord_t> extent(
-      Point<3>(0, 0, 0),
-      Point<3>(extent_c - 1, extent_n - 1, LSTM_PER_NODE_LENGTH - 1));
-  Transform<3, 2, coord_t> trans;
-  trans[0][0] = extent_c;
-  trans[0][1] = 0;
-  trans[1][0] = 0;
-  trans[1][1] = extent_n;
-  trans[2][0] = 0;
-  trans[2][1] = 0;
-  IndexPartition y_ip = runtime->create_partition_by_restriction(
-      ctx, y_is, part_is, trans, extent);
-  assert(runtime->is_index_partition_disjoint(ctx, y_ip));
-  assert(runtime->is_index_partition_complete(ctx, y_ip));
-  LogicalPartition y_lp = runtime->get_logical_partition(ctx, y_lr, y_ip);
-  LogicalPartition y_grad_lp =
-      runtime->get_logical_partition(ctx, y_grad_lr, y_ip);
-
-  // Note: we only need replica's grad, so no need to create lr/lp for forward
-  Rect<3, coord_t> replica_rect(Point<3>(0, 0, 0),
-                                Point<3>(input_size - 1,
-                                         batch_size - 1,
-                                         LSTM_PER_NODE_LENGTH * num_par_c - 1));
-  IndexSpaceT<3> replica_is = runtime->create_index_space(ctx, replica_rect);
-  replica.region_grad = runtime->create_logical_region(ctx, replica_is, fs);
-  trans[0][0] = 0;
-  trans[0][1] = 0;
-  trans[1][0] = 0;
-  trans[1][1] = extent_n;
-  trans[2][0] = LSTM_PER_NODE_LENGTH;
-  trans[2][1] = 0;
-  Rect<3, coord_t> replica_ext(
-      Point<3>(0, 0, 0),
-      Point<3>(input_size - 1, extent_n - 1, LSTM_PER_NODE_LENGTH - 1));
-  IndexPartition replica_ip = runtime->create_partition_by_restriction(
-      ctx, replica_is, part_is, trans, replica_ext);
-  assert(runtime->is_index_partition_disjoint(ctx, replica_ip));
-  assert(runtime->is_index_partition_complete(ctx, replica_ip));
-  replica.partition_grad =
-      runtime->get_logical_partition(ctx, replica.region_grad, replica_ip);
-  for (int i = 0; i < num_par_c; i++) {
-    Transform<3, 1, coord_t> input_trans;
-    input_trans[0][0] = 0;
-    input_trans[1][0] = inputs[0].pdim[1];
-    input_trans[2][0] = 0;
-    Rect<3, coord_t> ext(Point<3>(0, 0, LSTM_PER_NODE_LENGTH * i),
-                         Point<3>(inputs[0].pdim[0] - 1,
-                                  inputs[0].pdim[1] - 1,
-                                  LSTM_PER_NODE_LENGTH * (i + 1) - 1));
-    IndexPartition ip = runtime->create_partition_by_restriction(
-        ctx, replica_is, input_part_is, input_trans, ext);
-    assert(runtime->is_index_partition_disjoint(ctx, ip));
-    replica_sub_lps[i] =
-        runtime->get_logical_partition(ctx, replica.region_grad, ip);
-  }
-
-  outputs[0].numDim = 3;
-  outputs[0].adim[0] = output_size;
-  outputs[0].adim[1] = batch_size;
-  outputs[0].adim[2] = LSTM_PER_NODE_LENGTH;
-  outputs[0].pdim[0] = extent_c;
-  outputs[0].pdim[1] = extent_n;
-  outputs[0].pdim[2] = LSTM_PER_NODE_LENGTH;
-  outputs[0].region = y_lr;
-  outputs[0].partition = y_lp;
-  outputs[0].region_grad = y_grad_lr;
-  outputs[0].partition_grad = y_grad_lp;
-
-  // Every partition reads all in_channels
-  trans[0][0] = 0;
-  trans[0][1] = 0;
-  trans[1][0] = 0;
-  trans[1][1] = extent_n;
-  trans[2][0] = 0;
-  trans[2][1] = 0;
-  Rect<3, coord_t> input_ext(
-      Point<3>(0, 0, 0),
-      Point<3>(input_size - 1, extent_n - 1, LSTM_PER_NODE_LENGTH));
-  IndexSpaceT<3> input_is = IndexSpaceT<3>(inputs[0].region.get_index_space());
-  IndexPartition input_ip = runtime->create_partition_by_restriction(
-      ctx, input_is, part_is, trans, input_ext);
-  input_lp = runtime->get_logical_partition(ctx, inputs[0].region, input_ip);
-}
-
-/*
-  regions[0](I): x
-  regions[1](I): w
-  regions[2](O): y
- */
-OpMeta *Linear::init_task(Task const *task,
-                          std::vector<PhysicalRegion> const &regions,
-                          Context ctx,
-                          Runtime *runtime) {
-  assert(regions.size() == 3);
-  assert(task->regions.size() == 3);
-  LinearInitParams const *linear = (LinearInitParams *)task->args;
-  Rect<3> rect_x = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  Rect<1> rect_w = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  Rect<3> rect_y = runtime->get_index_space_domain(
-      ctx, task->regions[2].region.get_index_space());
-  assert(rect_x.hi[0] - rect_x.lo[0] + 1 == linear->inputSize);
-  assert(rect_x.hi[1] - rect_x.lo[1] + 1 == linear->batchSize);
-  assert(rect_x.hi[2] - rect_x.lo[2] + 1 == LSTM_PER_NODE_LENGTH);
-  assert(rect_y.hi[0] - rect_y.lo[0] + 1 == linear->outputSize);
-  assert(rect_y.hi[1] - rect_y.lo[1] + 1 == linear->batchSize);
-  assert(rect_y.hi[2] - rect_y.lo[2] + 1 == LSTM_PER_NODE_LENGTH);
-  assert(rect_w.hi[0] - rect_w.lo[0] + 1 ==
-         linear->outputSize * (linear->inputSize + 1));
-  LinearMeta *m = new LinearMeta(linear->handle);
-  m->profiling_runtime = false;
-#ifndef DISABLE_COMPUTATION
-  int batch_size = linear->batchSize * LSTM_PER_NODE_LENGTH;
-  float *dram_one_ptr = (float *)malloc(sizeof(float) * batch_size);
-  for (int i = 0; i < batch_size; i++) {
-    dram_one_ptr[i] = 1.0f;
-  }
-  checkCUDA(cudaMalloc(&m->one_ptr, sizeof(float) * batch_size));
-  checkCUDA(cudaMemcpy(m->one_ptr,
-                       dram_one_ptr,
-                       sizeof(float) * batch_size,
-                       cudaMemcpyHostToDevice));
-#endif
-  return m;
-}
-
-void Linear::init(RnnModel const &model) {
-  Context ctx = model.config.lg_ctx;
-  Runtime *runtime = model.config.lg_hlr;
-  int idx = 0;
-  int num_par_c = part_rect.hi[0] - part_rect.lo[0] + 1;
-  for (PointInRectIterator<2> it(part_rect); it(); it++, idx++) {
-    LinearInitParams initParams;
-    initParams.handle = model.dnn_handlers[paraConfig.gpu[idx]];
-    initParams.batchSize = outputs[0].pdim[1];
-    initParams.inputSize = inputs[0].pdim[0];
-    initParams.outputSize = outputs[0].pdim[0];
-    TaskLauncher launcher(RNN_LINEAR_INIT_TASK_ID,
-                          TaskArgument(&initParams, sizeof(initParams)),
-                          Predicate::TRUE_PRED,
-                          0 /*MapperID*/,
-                          RnnMapper::assign_to_gpu(paraConfig.gpu[idx]));
-    DomainPoint dp(*it);
-    // Add input
-    {
-      LogicalRegion x = runtime->get_logical_subregion_by_color(input_lp, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(x, READ_ONLY, EXCLUSIVE, inputs[0].region));
-      launcher.add_field(0, FID_DATA);
-    }
-    launcher.add_region_requirement(
-        RegionRequirement(params.subregions[num_par_c + dp[0]],
-                          READ_ONLY,
-                          EXCLUSIVE,
-                          params.region));
-    launcher.add_field(1, FID_DATA);
-    // Add output
-    {
-      LogicalRegion y =
-          runtime->get_logical_subregion_by_color(outputs[0].partition, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(y, WRITE_ONLY, EXCLUSIVE, outputs[0].region));
-      launcher.add_field(2, FID_DATA);
-    }
-    Future f = runtime->execute_task(ctx, launcher);
-    meta[idx] = f.get_result<OpMeta *>();
-  }
-}
-
-/*
-  regions[0] (I): x
-  regions[1] (I): w
-  regions[2] (O): y
- */
-void Linear::forward_task(Task const *task,
-                          std::vector<PhysicalRegion> const &regions,
-                          Context ctx,
-                          Runtime *runtime) {
-#ifndef DISABLE_COMPUTATION
-  assert(regions.size() == 3);
-  assert(task->regions.size() == 3);
-  float alpha = 1.0f, beta = 0.0f;
-  LinearMeta const *m = *((LinearMeta **)task->args);
-  AccessorRO<float, 3> const acc_x(regions[0], FID_DATA);
-  AccessorRO<float, 1> const acc_w(regions[1], FID_DATA);
-  AccessorWO<float, 3> const acc_y(regions[2], FID_DATA);
-  Rect<3> rect_x = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  Rect<1> rect_w = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  Rect<3> rect_y = runtime->get_index_space_domain(
-      ctx, task->regions[2].region.get_index_space());
-  assert(acc_x.accessor.is_dense_arbitrary(rect_x));
-  assert(acc_w.accessor.is_dense_arbitrary(rect_w));
-  assert(acc_y.accessor.is_dense_arbitrary(rect_y));
-  int input_size = rect_x.hi[0] - rect_x.lo[0] + 1;
-  int output_size = rect_y.hi[0] - rect_y.lo[0] + 1;
-  int batch_size = (rect_x.hi[1] - rect_x.lo[1] + 1) * LSTM_PER_NODE_LENGTH;
-  float const *x_ptr = acc_x.ptr(rect_x.lo);
-  float const *w_ptr = acc_w.ptr(rect_w.lo);
-  float const *bias_ptr = w_ptr + input_size;
-  float *y_ptr = acc_y.ptr(rect_y.lo);
-  cudaEvent_t t_start, t_end;
-  if (m->profiling_runtime) {
-    cudaEventCreate(&t_start);
-    cudaEventCreate(&t_end);
-    cudaEventRecord(t_start);
-  }
-  cudaStream_t stream;
-  checkCUDA(cudaStreamCreate(&stream));
-  checkCUDA(cublasSetStream(m->handle.blas, stream));
-  checkCUDA(cublasSgemm(m->handle.blas,
-                        CUBLAS_OP_T,
-                        CUBLAS_OP_N,
-                        output_size,
-                        batch_size,
-                        input_size,
-                        &alpha,
-                        w_ptr,
-                        input_size + 1,
-                        x_ptr,
-                        input_size,
-                        &beta,
-                        y_ptr,
-                        output_size));
-  checkCUDA(cublasSgemm(m->handle.blas,
-                        CUBLAS_OP_T,
-                        CUBLAS_OP_N,
-                        output_size,
-                        batch_size,
-                        1,
-                        &alpha,
-                        bias_ptr,
-                        input_size + 1,
-                        m->one_ptr,
-                        1,
-                        &alpha,
-                        y_ptr,
-                        output_size));
-  if (m->profiling_runtime) {
-    cudaEventRecord(t_end);
-    checkCUDA(cudaEventSynchronize(t_end));
-    float elapsed = 0;
-    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
-    cudaEventDestroy(t_start);
-    cudaEventDestroy(t_end);
-    printf("Linear forward time = %.2lfms\n", elapsed);
-  }
-#ifdef PRINT_INTERMEDIATE_RESULT
-  print_tensor<3, float>(y_ptr, rect_y, "linear(fwd):y");
-#endif
-#endif
-}
-
-void Linear::forward(RnnModel const &model) {
-  Context ctx = model.config.lg_ctx;
-  Runtime *runtime = model.config.lg_hlr;
-  int idx = 0;
-  int num_par_c = part_rect.hi[0] - part_rect.lo[0] + 1;
-  for (PointInRectIterator<2> it(part_rect); it(); it++, idx++) {
-    OpMeta *mp = meta[idx];
-    TaskLauncher launcher(RNN_LINEAR_FWD_TASK_ID,
-                          TaskArgument(&mp, sizeof(OpMeta *)),
-                          Predicate::TRUE_PRED,
-                          0 /*MapperID*/,
-                          RnnMapper::assign_to_gpu(paraConfig.gpu[idx]));
-    DomainPoint dp(*it);
-    // Add input
-    {
-      LogicalRegion x = runtime->get_logical_subregion_by_color(input_lp, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(x, READ_ONLY, EXCLUSIVE, inputs[0].region));
-      launcher.add_field(0, FID_DATA);
-    }
-    launcher.add_region_requirement(
-        RegionRequirement(params.subregions[num_par_c + dp[0]],
-                          READ_ONLY,
-                          EXCLUSIVE,
-                          params.region));
-    launcher.add_field(1, FID_DATA);
-    // Add output
-    {
-      LogicalRegion y =
-          runtime->get_logical_subregion_by_color(outputs[0].partition, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(y, WRITE_ONLY, EXCLUSIVE, outputs[0].region));
-      launcher.add_field(2, FID_DATA);
-    }
-    runtime->execute_task(ctx, launcher);
-  }
-}
-
-/*
-  regions[0](I): x
-  regions[1](I): w
-  regions[2](I): y
-  regions[3](O); replica_grad
-  regions[4](I/O): w_grad
-  regions[5](I): y_grad
-*/
-void Linear::backward_task(Task const *task,
-                           std::vector<PhysicalRegion> const &regions,
-                           Context ctx,
-                           Runtime *runtime) {
-#ifndef DISABLE_COMPUTATION
-  assert(regions.size() == 6);
-  assert(task->regions.size() == 6);
-  float alpha = 1.0f, beta = 0.0f;
-  LinearMeta const *m = *((LinearMeta **)task->args);
-  AccessorRO<float, 3> const acc_x(regions[0], FID_DATA);
-  AccessorRO<float, 1> const acc_w(regions[1], FID_DATA);
-  AccessorRO<float, 3> const acc_y(regions[2], FID_DATA);
-  AccessorWO<float, 3> const acc_replica_grad(regions[3], FID_DATA);
-  AccessorRW<float, 1> const acc_w_grad(regions[4], FID_DATA);
-  AccessorRO<float, 3> const acc_y_grad(regions[5], FID_DATA);
-
-  Rect<3> rect_x = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  Rect<1> rect_w = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  Rect<3> rect_y = runtime->get_index_space_domain(
-      ctx, task->regions[2].region.get_index_space());
-  Rect<3> rect_replica_grad = runtime->get_index_space_domain(
-      ctx, task->regions[3].region.get_index_space());
-  Rect<1> rect_w_grad = runtime->get_index_space_domain(
-      ctx, task->regions[4].region.get_index_space());
-  Rect<3> rect_y_grad = runtime->get_index_space_domain(
-      ctx, task->regions[5].region.get_index_space());
-  assert(acc_x.accessor.is_dense_arbitrary(rect_x));
-  assert(acc_w.accessor.is_dense_arbitrary(rect_w));
-  assert(acc_y.accessor.is_dense_arbitrary(rect_y));
-  assert(acc_replica_grad.accessor.is_dense_arbitrary(rect_replica_grad));
-  assert(acc_w_grad.accessor.is_dense_arbitrary(rect_w_grad));
-  assert(acc_y_grad.accessor.is_dense_arbitrary(rect_y_grad));
-  int input_size = rect_x.hi[0] - rect_x.lo[0] + 1;
-  int output_size = rect_y.hi[0] - rect_y.lo[0] + 1;
-  int batch_size = (rect_x.hi[1] - rect_x.lo[1] + 1) * LSTM_PER_NODE_LENGTH;
-  float const *x_ptr = acc_x.ptr(rect_x.lo);
-  float const *w_ptr = acc_w.ptr(rect_w.lo);
-  float const *y_ptr = acc_y.ptr(rect_y.lo);
-  float *replica_grad_ptr = acc_replica_grad.ptr(rect_replica_grad.lo);
-  // Note that w_grad might be bigger than w
-  assert(rect_w_grad.contains(rect_w));
-  float *w_grad_ptr = acc_w_grad.ptr(rect_w_grad.lo);
-  float *bias_grad_ptr = w_grad_ptr + input_size;
-  float const *y_grad_ptr = acc_y_grad.ptr(rect_y_grad.lo);
-  cudaEvent_t t_start, t_end;
-  if (m->profiling_runtime) {
-    cudaEventCreate(&t_start);
-    cudaEventCreate(&t_end);
-    cudaEventRecord(t_start);
-  }
-
-  cudaStream_t stream;
-  checkCUDA(cudaStreamCreate(&stream));
-  checkCUDA(cublasSetStream(m->handle.blas, stream));
-  // Compute weight gradient
-  checkCUDA(cublasSgemm(m->handle.blas,
-                        CUBLAS_OP_N,
-                        CUBLAS_OP_T,
-                        input_size,
-                        output_size,
-                        batch_size,
-                        &alpha,
-                        x_ptr,
-                        input_size,
-                        y_grad_ptr,
-                        output_size,
-                        &alpha,
-                        w_grad_ptr,
-                        input_size + 1));
-  // Compute bias gradient
-  checkCUDA(cublasSgemv(m->handle.blas,
-                        CUBLAS_OP_N,
-                        output_size,
-                        batch_size,
-                        &alpha,
-                        y_grad_ptr,
-                        output_size,
-                        m->one_ptr,
-                        1,
-                        &alpha,
-                        bias_grad_ptr,
-                        input_size + 1));
-  // Compute data gradient
-  checkCUDA(cublasSgemm(m->handle.blas,
-                        CUBLAS_OP_N,
-                        CUBLAS_OP_N,
-                        input_size,
-                        batch_size,
-                        output_size,
-                        &alpha,
-                        w_ptr,
-                        input_size + 1,
-                        y_grad_ptr,
-                        output_size,
-                        &beta,
-                        replica_grad_ptr,
-                        input_size));
-  if (m->profiling_runtime) {
-    cudaEventRecord(t_end);
-    checkCUDA(cudaEventSynchronize(t_end));
-    float elapsed = 0;
-    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
-    cudaEventDestroy(t_start);
-    cudaEventDestroy(t_end);
-    printf("Linear backward time = %.2lfms\n", elapsed);
-  }
-#ifdef PRINT_INTERMEDIATE_RESULT
-  print_tensor<1, float>(w_grad_ptr, rect_w_grad, "linear(bwd):w_grad");
-#endif
-#endif
-}
-
-/*
-  regions[0](O): input
-  regions[1..num_par_c](I): replicas
-*/
-void Linear::backward2_task(Task const *task,
-                            std::vector<PhysicalRegion> const &regions,
-                            Context ctx,
-                            Runtime *runtime) {
-#ifndef DISABLE_COMPUTATION
-  float alpha = 1.0f;
-  LinearMeta const *m = *((LinearMeta **)task->args);
-  AccessorWO<float, 3> const acc_input(regions[0], FID_DATA);
-  Rect<3> rect_input = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  assert(acc_input.accessor.is_dense_arbitrary(rect_input));
-  float *input_ptr = acc_input.ptr(rect_input.lo);
-  cudaStream_t stream;
-  checkCUDA(cudaStreamCreate(&stream));
-  checkCUDA(cublasSetStream(m->handle.blas, stream));
-  for (int i = 1; i < task->regions.size(); i++) {
-    AccessorRO<float, 3> const acc_replica(regions[i], FID_DATA);
-    Rect<3> rect_replica = runtime->get_index_space_domain(
-        ctx, task->regions[i].region.get_index_space());
-    assert(rect_replica.volume() == rect_input.volume());
-    assert(acc_replica.accessor.is_dense_arbitrary(rect_replica));
-    float const *replica_ptr = acc_replica.ptr(rect_replica.lo);
-    if (i == 1) {
-      checkCUDA(cublasScopy(
-          m->handle.blas, rect_input.volume(), replica_ptr, 1, input_ptr, 1));
-    } else {
-      checkCUDA(cublasSaxpy(m->handle.blas,
-                            rect_input.volume(),
-                            &alpha,
-                            replica_ptr,
-                            1,
-                            input_ptr,
-                            1));
-    }
-  }
-#endif
-}
-
-void Linear::backward(RnnModel const &model) {
-  Context ctx = model.config.lg_ctx;
-  Runtime *runtime = model.config.lg_hlr;
-  int idx = 0;
-  int num_par_c = part_rect.hi[0] - part_rect.lo[0] + 1;
-  for (PointInRectIterator<2> it(part_rect); it(); it++, idx++) {
-    OpMeta *mp = meta[idx];
-    TaskLauncher launcher(RNN_LINEAR_BWD_TASK_ID,
-                          TaskArgument(&mp, sizeof(OpMeta *)),
-                          Predicate::TRUE_PRED,
-                          0 /*MapperID*/,
-                          RnnMapper::assign_to_gpu(paraConfig.gpu[idx]));
-    DomainPoint dp(*it);
-    // Add x
-    {
-      LogicalRegion x = runtime->get_logical_subregion_by_color(input_lp, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(x, READ_ONLY, EXCLUSIVE, inputs[0].region));
-      launcher.add_field(0, FID_DATA);
-    }
-    // Add w
-    launcher.add_region_requirement(
-        RegionRequirement(params.subregions[num_par_c + dp[0]],
-                          READ_ONLY,
-                          EXCLUSIVE,
-                          params.region));
-    launcher.add_field(1, FID_DATA);
-    // Add y
-    {
-      LogicalRegion y =
-          runtime->get_logical_subregion_by_color(outputs[0].partition, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(y, READ_ONLY, EXCLUSIVE, outputs[0].region));
-      launcher.add_field(2, FID_DATA);
-    }
-    // Add replica_grad
-    {
-      LogicalRegion replica_grad =
-          runtime->get_logical_subregion_by_color(replica.partition_grad, dp);
-      launcher.add_region_requirement(RegionRequirement(
-          replica_grad, WRITE_ONLY, EXCLUSIVE, replica.region_grad));
-      launcher.add_field(3, FID_DATA);
-    }
-    // Add w_grad
-    launcher.add_region_requirement(
-        RegionRequirement(params.gradients[paraConfig.gpu[idx]],
-                          READ_WRITE,
-                          EXCLUSIVE,
-                          params.gradients[paraConfig.gpu[idx]]));
-    launcher.add_field(4, FID_DATA);
-    // Add y_grad
-    {
-      LogicalRegion y_grad = runtime->get_logical_subregion_by_color(
-          outputs[0].partition_grad, dp);
-      launcher.add_region_requirement(RegionRequirement(
-          y_grad, READ_ONLY, EXCLUSIVE, outputs[0].region_grad));
-      launcher.add_field(5, FID_DATA);
-    }
-    runtime->execute_task(ctx, launcher);
-  }
-
-  // We aggregate data from replica tensor to input tensor
-  idx = 0;
-  for (PointInRectIterator<1> it(input_part_rect); it(); it++, idx++) {
-    OpMeta *mp = meta[idx];
-    TaskLauncher launcher(RNN_LINEAR_BWD2_TASK_ID,
-                          TaskArgument(&mp, sizeof(OpMeta *)),
-                          Predicate::TRUE_PRED,
-                          0 /*MapperID*/,
-                          RnnMapper::assign_to_gpu(paraConfig.gpu[idx]));
-    DomainPoint dp(*it);
-    LogicalRegion input =
-        runtime->get_logical_subregion_by_color(inputs[0].partition_grad, dp);
-    launcher.add_region_requirement(
-        RegionRequirement(input, WRITE_ONLY, EXCLUSIVE, inputs[0].region_grad));
-    launcher.add_field(0, FID_DATA);
-    int num_par_c = part_rect.hi[0] - part_rect.lo[0] + 1;
-    for (int i = 0; i < num_par_c; i++) {
-      LogicalRegion r =
-          runtime->get_logical_subregion_by_color(replica_sub_lps[i], dp);
-      launcher.add_region_requirement(
-          RegionRequirement(r, READ_ONLY, EXCLUSIVE, replica.region_grad));
-      launcher.add_field(i + 1, FID_DATA);
-    }
-    runtime->execute_task(ctx, launcher);
-  }
-}
-
-void Linear::update_task(Task const *task,
-                         std::vector<PhysicalRegion> const &regions,
-                         Context ctx,
-                         Runtime *runtime) {}
-
-void Linear::update(RnnModel const &model) {}
diff --git a/nmt/lstm.cu b/nmt/lstm.cu
deleted file mode 100644
index 1a405bb1a0..0000000000
--- a/nmt/lstm.cu
+++ /dev/null
@@ -1,652 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "../cnn_helper.h"
-#include "rnn.h"
-#include "rnn_mapper.h"
-
-struct LSTMInitParams {
-  DnnHandle handle;
-  int batchSize, inputSize, outputSize;
-};
-
-LSTMTensors RnnModel::add_lstm_node(
-    Tensor x, Tensor hx, Tensor cx, ParallelConfig pc, SharedVariable params) {
-  assert(x.numDim == 3);
-  assert(hx.numDim == 2);
-  assert(cx.numDim == 2);
-  assert(x.adim[2] == LSTM_PER_NODE_LENGTH);
-  assert(x.pdim[2] == LSTM_PER_NODE_LENGTH);
-  int batch_size = x.adim[1];
-  assert(hx.adim[1] == batch_size);
-  assert(cx.adim[1] == batch_size);
-  int input_size = x.adim[0];
-  int output_size = hx.adim[0];
-  assert(cx.adim[0] == output_size);
-  LSTM *node = new LSTM(
-      config, x, hx, cx, batch_size, input_size, output_size, pc, params);
-  layers.push_back(node);
-  LSTMTensors output;
-  output.x = node->outputs[0];
-  output.hx = node->outputs[1];
-  output.cx = node->outputs[2];
-  return output;
-}
-
-/*
- output[0]: y
- output[1]: hy
- output[2]: cy
- */
-LSTM::LSTM(RnnConfig config,
-           Tensor x,
-           Tensor hx,
-           Tensor cx,
-           int _batch_size,
-           int _input_size,
-           int _output_size,
-           ParallelConfig pc,
-           SharedVariable _params)
-    : RnnOp(x, hx, cx, pc, _params), batch_size(_batch_size),
-      input_size(_input_size), output_size(_output_size) {
-  printf("LSTM node: batch(%d) input(%d) output(%d)\n",
-         batch_size,
-         input_size,
-         output_size);
-  Context ctx = config.lg_ctx;
-  HighLevelRuntime *runtime = config.lg_hlr;
-  assert(pc.nDims == 1);
-  {
-    Rect<1> rect(Point<1>(0), Point<1>(pc.dim[0] - 1));
-    part_rect = rect;
-  }
-  IndexSpaceT<1> part_is = runtime->create_index_space(ctx, part_rect);
-  FieldSpace fs = config.field_space;
-  Rect<3, coord_t> y_rect(
-      Point<3>(0, 0, 0),
-      Point<3>(output_size - 1, batch_size - 1, LSTM_PER_NODE_LENGTH - 1));
-  IndexSpaceT<3> y_is = runtime->create_index_space(ctx, y_rect);
-  LogicalRegion y_lr = runtime->create_logical_region(ctx, y_is, fs);
-  LogicalRegion y_grad_lr = runtime->create_logical_region(ctx, y_is, fs);
-  int num_par_n = part_rect.hi[0] - part_rect.lo[0] + 1;
-  assert(batch_size % num_par_n == 0);
-  int extent_n = batch_size / num_par_n;
-  int extent_c = output_size;
-  Rect<3, coord_t> extent(
-      Point<3>(0, 0, 0),
-      Point<3>(extent_c - 1, extent_n - 1, LSTM_PER_NODE_LENGTH - 1));
-  Transform<3, 1, coord_t> trans;
-  trans[0][0] = 0;
-  trans[1][0] = extent_n;
-  trans[2][0] = 0;
-  IndexPartition y_ip = runtime->create_partition_by_restriction(
-      ctx, y_is, part_is, trans, extent);
-  assert(runtime->is_index_partition_disjoint(ctx, y_ip));
-  assert(runtime->is_index_partition_complete(ctx, y_ip));
-  LogicalPartition y_lp = runtime->get_logical_partition(ctx, y_lr, y_ip);
-  LogicalPartition y_grad_lp =
-      runtime->get_logical_partition(ctx, y_grad_lr, y_ip);
-  outputs[0].region = y_lr;
-  outputs[0].region_grad = y_grad_lr;
-  outputs[0].partition = y_lp;
-  outputs[0].partition_grad = y_grad_lp;
-  outputs[0].numDim = 3;
-  outputs[0].adim[0] = output_size;
-  outputs[0].adim[1] = batch_size;
-  outputs[0].adim[2] = LSTM_PER_NODE_LENGTH;
-  outputs[0].pdim[0] = extent_c;
-  outputs[0].pdim[1] = extent_n;
-  outputs[0].pdim[2] = LSTM_PER_NODE_LENGTH;
-
-  Rect<2, coord_t> hy_rect(Point<2>(0, 0),
-                           Point<2>(output_size - 1, batch_size - 1));
-  IndexSpaceT<2> hy_is = runtime->create_index_space(ctx, hy_rect);
-  LogicalRegion hy_lr = runtime->create_logical_region(ctx, hy_is, fs);
-  LogicalRegion hy_grad_lr = runtime->create_logical_region(ctx, hy_is, fs);
-  Rect<2, coord_t> hy_ext(Point<2>(0, 0), Point<2>(extent_c - 1, extent_n - 1));
-  Transform<2, 1, coord_t> hy_trans;
-  hy_trans[0][0] = 0;
-  hy_trans[1][0] = extent_n;
-  IndexPartition hy_ip = runtime->create_partition_by_restriction(
-      ctx, hy_is, part_is, hy_trans, hy_ext);
-  assert(runtime->is_index_partition_disjoint(ctx, hy_ip));
-  assert(runtime->is_index_partition_complete(ctx, hy_ip));
-  LogicalPartition hy_lp = runtime->get_logical_partition(ctx, hy_lr, hy_ip);
-  LogicalPartition hy_grad_lp =
-      runtime->get_logical_partition(ctx, hy_grad_lr, hy_ip);
-  outputs[1].region = hy_lr;
-  outputs[1].region_grad = hy_grad_lr;
-  outputs[1].partition = hy_lp;
-  outputs[1].partition_grad = hy_grad_lp;
-  outputs[1].numDim = 2;
-  outputs[1].adim[0] = output_size;
-  outputs[1].adim[1] = batch_size;
-  outputs[1].pdim[0] = extent_c;
-  outputs[1].pdim[1] = extent_n;
-
-  LogicalRegion cy_lr = runtime->create_logical_region(ctx, hy_is, fs);
-  LogicalRegion cy_grad_lr = runtime->create_logical_region(ctx, hy_is, fs);
-  LogicalPartition cy_lp = runtime->get_logical_partition(ctx, cy_lr, hy_ip);
-  LogicalPartition cy_grad_lp =
-      runtime->get_logical_partition(ctx, cy_grad_lr, hy_ip);
-  outputs[2] = outputs[1];
-  outputs[2].region = cy_lr;
-  outputs[2].region_grad = cy_grad_lr;
-  outputs[2].partition = cy_lp;
-  outputs[2].partition_grad = cy_grad_lp;
-}
-
-/*
-  regions[0] (I): x
-  regions[1] (I): hx
-  regions[2] (I): cx
-  regions[3] (I): w
-  regions[4] (O): y
-  regions[5] (O): hy
-  regions[6] (O): cy
-*/
-OpMeta *LSTM::init_task(Task const *task,
-                        std::vector<PhysicalRegion> const &regions,
-                        Context ctx,
-                        Runtime *runtime) {
-  int const numLayers = 1;
-  int const seqLength = LSTM_PER_NODE_LENGTH;
-  float const dropoutRate = 0.2f;
-  assert(regions.size() == 7);
-  assert(task->regions.size() == 7);
-  Rect<1> para_rect = runtime->get_index_space_domain(
-      ctx, task->regions[3].region.get_index_space());
-  LSTMInitParams const *lstm = (LSTMInitParams *)task->args;
-  LSTMMeta *m = new LSTMMeta(lstm->handle);
-#ifndef DISABLE_COMPUTATION
-  checkCUDNN(cudnnCreateRNNDescriptor(&m->rnnDesc));
-  checkCUDNN(cudnnCreateDropoutDescriptor(&m->dropoutDesc));
-  size_t dropoutSize;
-  void *dropoutStates;
-  checkCUDNN(cudnnDropoutGetStatesSize(m->handle.dnn, &dropoutSize));
-  checkCUDA(cudaMalloc(&dropoutStates, dropoutSize));
-  checkCUDNN(cudnnSetDropoutDescriptor(m->dropoutDesc,
-                                       m->handle.dnn,
-                                       dropoutRate,
-                                       dropoutStates,
-                                       dropoutSize,
-                                       10 /*seed*/));
-  checkCUDNN(cudnnSetRNNDescriptor_v5(m->rnnDesc,
-                                      lstm->outputSize,
-                                      numLayers,
-                                      m->dropoutDesc,
-                                      CUDNN_LINEAR_INPUT,
-                                      CUDNN_UNIDIRECTIONAL,
-                                      CUDNN_LSTM,
-                                      CUDNN_DATA_FLOAT));
-  for (int i = 0; i < seqLength; i++) {
-    checkCUDNN(cudnnCreateTensorDescriptor(&m->xDescs[i]));
-    int dims[] = {lstm->batchSize, lstm->inputSize, 1};
-    int strides[] = {dims[1] * dims[2], dims[2], 1};
-    checkCUDNN(cudnnSetTensorNdDescriptor(
-        m->xDescs[i], CUDNN_DATA_FLOAT, 3, dims, strides));
-  }
-  size_t workSpaceSize;
-  checkCUDNN(cudnnGetRNNWorkspaceSize(
-      m->handle.dnn, m->rnnDesc, seqLength, m->xDescs, &workSpaceSize));
-  // Assert that we have enough work space
-  assert(workSpaceSize <= m->handle.workSpaceSize);
-  checkCUDNN(cudnnGetRNNTrainingReserveSize(
-      m->handle.dnn, m->rnnDesc, seqLength, m->xDescs, &m->reserveSpaceSize));
-  checkCUDA(cudaMalloc(&m->reserveSpace, m->reserveSpaceSize));
-  size_t paramsSize;
-  checkCUDNN(cudnnGetRNNParamsSize(
-      m->handle.dnn, m->rnnDesc, m->xDescs[0], &paramsSize, CUDNN_DATA_FLOAT));
-  assert(paramsSize == sizeof(float) * para_rect.volume());
-  {
-    int dims[] = {(int)paramsSize, 1, 1};
-    checkCUDNN(cudnnCreateFilterDescriptor(&m->wDesc));
-    checkCUDNN(cudnnSetFilterNdDescriptor(
-        m->wDesc, CUDNN_DATA_FLOAT, CUDNN_TENSOR_NCHW, 3, dims));
-  }
-  {
-    checkCUDNN(cudnnCreateTensorDescriptor(&m->hxDesc));
-    checkCUDNN(cudnnCreateTensorDescriptor(&m->cxDesc));
-    checkCUDNN(cudnnCreateTensorDescriptor(&m->hyDesc));
-    checkCUDNN(cudnnCreateTensorDescriptor(&m->cyDesc));
-    int dims[] = {numLayers, lstm->batchSize, lstm->outputSize};
-    int strides[] = {dims[1] * dims[2], dims[2], 1};
-    checkCUDNN(cudnnSetTensorNdDescriptor(
-        m->hxDesc, CUDNN_DATA_FLOAT, 3, dims, strides));
-    checkCUDNN(cudnnSetTensorNdDescriptor(
-        m->cxDesc, CUDNN_DATA_FLOAT, 3, dims, strides));
-    checkCUDNN(cudnnSetTensorNdDescriptor(
-        m->hyDesc, CUDNN_DATA_FLOAT, 3, dims, strides));
-    checkCUDNN(cudnnSetTensorNdDescriptor(
-        m->cyDesc, CUDNN_DATA_FLOAT, 3, dims, strides));
-  }
-  for (int i = 0; i < seqLength; i++) {
-    checkCUDNN(cudnnCreateTensorDescriptor(&m->yDescs[i]));
-    int dims[] = {lstm->batchSize, lstm->outputSize, 1};
-    int strides[] = {dims[1] * dims[2], dims[2], 1};
-    checkCUDNN(cudnnSetTensorNdDescriptor(
-        m->yDescs[i], CUDNN_DATA_FLOAT, 3, dims, strides));
-  }
-  m->profiling_runtime = true;
-  return m;
-#endif
-}
-
-void LSTM::init(RnnModel const &model) {
-  Context ctx = model.config.lg_ctx;
-  Runtime *runtime = model.config.lg_hlr;
-  int idx = 0;
-  for (PointInRectIterator<1> it(part_rect); it(); it++, idx++) {
-    LSTMInitParams initParams;
-    initParams.handle = model.dnn_handlers[paraConfig.gpu[idx]];
-    initParams.batchSize = outputs[0].pdim[1];
-    initParams.inputSize = inputs[0].pdim[0];
-    initParams.outputSize = outputs[0].pdim[0];
-    // For now assume batch sizes equal
-    assert(inputs[0].pdim[1] == outputs[0].pdim[1]);
-
-    TaskLauncher launcher(LSTM_INIT_TASK_ID,
-                          TaskArgument(&initParams, sizeof(initParams)),
-                          Predicate::TRUE_PRED,
-                          0 /*MapperID*/,
-                          RnnMapper::assign_to_gpu(paraConfig.gpu[idx]));
-    DomainPoint dp(*it);
-    // add region requirements for x, hx, cx
-    for (int i = 0; i < 3; i++) {
-      LogicalRegion x =
-          runtime->get_logical_subregion_by_color(inputs[i].partition, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(x, READ_ONLY, EXCLUSIVE, inputs[i].region));
-      launcher.add_field(i, FID_DATA);
-    }
-    launcher.add_region_requirement(
-        RegionRequirement(params.region, READ_ONLY, EXCLUSIVE, params.region));
-    launcher.add_field(3, FID_DATA);
-    for (int i = 0; i < 3; i++) {
-      LogicalRegion x =
-          runtime->get_logical_subregion_by_color(outputs[i].partition, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(x, WRITE_ONLY, EXCLUSIVE, outputs[i].region));
-      launcher.add_field(4 + i, FID_DATA);
-    }
-    Future f = runtime->execute_task(ctx, launcher);
-    meta[idx] = f.get_result<OpMeta *>();
-  }
-}
-
-/*
-  regions[0] (I): x
-  regions[1] (I): hx
-  regions[2] (I): cx
-  regions[3] (I): w
-  regions[4] (O): y
-  regions[5] (O): hy
-  regions[6] (O): cy
-*/
-void LSTM::forward_task(Task const *task,
-                        std::vector<PhysicalRegion> const &regions,
-                        Context ctx,
-                        Runtime *runtime) {
-#ifndef DISABLE_COMPUTATION
-  assert(regions.size() == 7);
-  assert(task->regions.size() == 7);
-  LSTMMeta const *m = *((LSTMMeta **)task->args);
-  AccessorRO<float, 3> const acc_x(regions[0], FID_DATA);
-  AccessorRO<float, 2> const acc_hx(regions[1], FID_DATA);
-  AccessorRO<float, 2> const acc_cx(regions[2], FID_DATA);
-  AccessorRO<float, 1> const acc_w(regions[3], FID_DATA);
-  AccessorWO<float, 3> const acc_y(regions[4], FID_DATA);
-  AccessorWO<float, 2> const acc_hy(regions[5], FID_DATA);
-  AccessorWO<float, 2> const acc_cy(regions[6], FID_DATA);
-  Rect<3> rect_x, rect_y;
-  Rect<2> rect_hx, rect_cx, rect_hy, rect_cy;
-  Rect<1> rect_w;
-  rect_x = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  rect_hx = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  rect_cx = runtime->get_index_space_domain(
-      ctx, task->regions[2].region.get_index_space());
-  rect_w = runtime->get_index_space_domain(
-      ctx, task->regions[3].region.get_index_space());
-  rect_y = runtime->get_index_space_domain(
-      ctx, task->regions[4].region.get_index_space());
-  rect_hy = runtime->get_index_space_domain(
-      ctx, task->regions[5].region.get_index_space());
-  rect_cy = runtime->get_index_space_domain(
-      ctx, task->regions[6].region.get_index_space());
-  assert(acc_x.accessor.is_dense_arbitrary(rect_x));
-  assert(acc_hx.accessor.is_dense_arbitrary(rect_hx));
-  assert(acc_cx.accessor.is_dense_arbitrary(rect_cx));
-  assert(acc_w.accessor.is_dense_arbitrary(rect_w));
-  assert(acc_y.accessor.is_dense_arbitrary(rect_y));
-  assert(acc_hy.accessor.is_dense_arbitrary(rect_hy));
-  assert(acc_cy.accessor.is_dense_arbitrary(rect_cy));
-  assert(rect_hx == rect_cx);
-  assert(rect_hx == rect_hy);
-  assert(rect_hx == rect_cy);
-  float const *x_ptr = acc_x.ptr(rect_x.lo);
-  float const *hx_ptr = acc_hx.ptr(rect_hx.lo);
-  float const *cx_ptr = acc_cx.ptr(rect_cx.lo);
-  float const *w_ptr = acc_w.ptr(rect_w.lo);
-  float *y_ptr = acc_y.ptr(rect_y.lo);
-  float *hy_ptr = acc_hy.ptr(rect_hy.lo);
-  float *cy_ptr = acc_cy.ptr(rect_cy.lo);
-  cudaEvent_t t_start, t_end;
-  if (m->profiling_runtime) {
-    cudaEventCreate(&t_start);
-    cudaEventCreate(&t_end);
-    cudaEventRecord(t_start);
-  }
-  cudaStream_t stream;
-  checkCUDA(cudaStreamCreate(&stream));
-  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
-  checkCUDNN(cudnnRNNForwardTraining(m->handle.dnn,
-                                     m->rnnDesc,
-                                     LSTM_PER_NODE_LENGTH /*seqLength*/,
-                                     m->xDescs,
-                                     x_ptr,
-                                     m->hxDesc,
-                                     hx_ptr,
-                                     m->cxDesc,
-                                     cx_ptr,
-                                     m->wDesc,
-                                     w_ptr,
-                                     m->yDescs,
-                                     y_ptr,
-                                     m->hyDesc,
-                                     hy_ptr,
-                                     m->cyDesc,
-                                     cy_ptr,
-                                     m->handle.workSpace,
-                                     m->handle.workSpaceSize,
-                                     m->reserveSpace,
-                                     m->reserveSpaceSize));
-  if (m->profiling_runtime) {
-    cudaEventRecord(t_end);
-    checkCUDA(cudaEventSynchronize(t_end));
-    float elapsed = 0;
-    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
-    cudaEventDestroy(t_start);
-    cudaEventDestroy(t_end);
-    printf("LSTM forward time = %.2fms\n", elapsed);
-  }
-#ifdef PRINT_INTERMEDIATE_RESULT
-  print_tensor<3, float>(y_ptr, rect_y, "lstm_fwd:y");
-#endif
-#endif
-}
-
-void LSTM::forward(RnnModel const &model) {
-  Context ctx = model.config.lg_ctx;
-  Runtime *runtime = model.config.lg_hlr;
-  int idx = 0;
-  for (PointInRectIterator<1> it(part_rect); it(); it++, idx++) {
-    OpMeta *mp = meta[idx];
-    TaskLauncher launcher(LSTM_FWD_TASK_ID,
-                          TaskArgument(&mp, sizeof(OpMeta *)),
-                          Predicate::TRUE_PRED,
-                          0 /*MapperID*/,
-                          RnnMapper::assign_to_gpu(paraConfig.gpu[idx]));
-    DomainPoint dp(*it);
-    // add region requirements for x, hx, cx
-    for (int i = 0; i < 3; i++) {
-      LogicalRegion x =
-          runtime->get_logical_subregion_by_color(inputs[i].partition, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(x, READ_ONLY, EXCLUSIVE, inputs[i].region));
-      launcher.add_field(i, FID_DATA);
-    }
-    launcher.add_region_requirement(
-        RegionRequirement(params.region, READ_ONLY, EXCLUSIVE, params.region));
-    launcher.add_field(3, FID_DATA);
-    for (int i = 0; i < 3; i++) {
-      LogicalRegion x =
-          runtime->get_logical_subregion_by_color(outputs[i].partition, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(x, WRITE_ONLY, EXCLUSIVE, outputs[i].region));
-      launcher.add_field(4 + i, FID_DATA);
-    }
-    runtime->execute_task(ctx, launcher);
-  }
-}
-
-/*
-  regions[0] (I): x
-  regions[1] (I): hx
-  regions[2] (I): cx
-  regions[3] (I): w
-  regions[4] (I): y
-  regions[5] (I): hy
-  regions[6] (I): cy
-  regions[7] (O): x_grad
-  regions[8] (O): hx_grad
-  regions[9] (O): cx_grad
- regions[10] (I/O): w_grad
- regions[11] (I): y_grad
- regions[12] (I): hy_grad
- regions[13] (I): cy_grad
-*/
-void LSTM::backward_task(Task const *task,
-                         std::vector<PhysicalRegion> const &regions,
-                         Context ctx,
-                         Runtime *runtime) {
-#ifndef DISABLE_COMPUTATION
-  assert(regions.size() == 14);
-  assert(task->regions.size() == 14);
-  LSTMMeta const *m = *((LSTMMeta **)task->args);
-  AccessorRO<float, 3> const acc_x(regions[0], FID_DATA);
-  AccessorRO<float, 2> const acc_hx(regions[1], FID_DATA);
-  AccessorRO<float, 2> const acc_cx(regions[2], FID_DATA);
-  AccessorRO<float, 1> const acc_w(regions[3], FID_DATA);
-  AccessorRO<float, 3> const acc_y(regions[4], FID_DATA);
-  AccessorRO<float, 2> const acc_hy(regions[5], FID_DATA);
-  AccessorRO<float, 2> const acc_cy(regions[6], FID_DATA);
-  AccessorWO<float, 3> const acc_x_grad(regions[7], FID_DATA);
-  AccessorWO<float, 2> const acc_hx_grad(regions[8], FID_DATA);
-  AccessorWO<float, 2> const acc_cx_grad(regions[9], FID_DATA);
-  AccessorRW<float, 1> const acc_w_grad(regions[10], FID_DATA);
-  AccessorRO<float, 3> const acc_y_grad(regions[11], FID_DATA);
-  AccessorRO<float, 2> const acc_hy_grad(regions[12], FID_DATA);
-  AccessorRO<float, 2> const acc_cy_grad(regions[13], FID_DATA);
-
-  Rect<3> rect_x, rect_y, rect_x_grad, rect_y_grad;
-  Rect<2> rect_hx, rect_cx, rect_hy, rect_cy, rect_hx_grad, rect_cx_grad,
-      rect_hy_grad, rect_cy_grad;
-  Rect<1> rect_w, rect_w_grad;
-  rect_x = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  rect_hx = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  rect_cx = runtime->get_index_space_domain(
-      ctx, task->regions[2].region.get_index_space());
-  rect_w = runtime->get_index_space_domain(
-      ctx, task->regions[3].region.get_index_space());
-  rect_y = runtime->get_index_space_domain(
-      ctx, task->regions[4].region.get_index_space());
-  rect_hy = runtime->get_index_space_domain(
-      ctx, task->regions[5].region.get_index_space());
-  rect_cy = runtime->get_index_space_domain(
-      ctx, task->regions[6].region.get_index_space());
-  rect_x_grad = runtime->get_index_space_domain(
-      ctx, task->regions[7].region.get_index_space());
-  rect_hx_grad = runtime->get_index_space_domain(
-      ctx, task->regions[8].region.get_index_space());
-  rect_cx_grad = runtime->get_index_space_domain(
-      ctx, task->regions[9].region.get_index_space());
-  rect_w_grad = runtime->get_index_space_domain(
-      ctx, task->regions[10].region.get_index_space());
-  rect_y_grad = runtime->get_index_space_domain(
-      ctx, task->regions[11].region.get_index_space());
-  rect_hy_grad = runtime->get_index_space_domain(
-      ctx, task->regions[12].region.get_index_space());
-  rect_cy_grad = runtime->get_index_space_domain(
-      ctx, task->regions[13].region.get_index_space());
-
-  assert(acc_x.accessor.is_dense_arbitrary(rect_x));
-  assert(acc_hx.accessor.is_dense_arbitrary(rect_hx));
-  assert(acc_cx.accessor.is_dense_arbitrary(rect_cx));
-  assert(acc_w.accessor.is_dense_arbitrary(rect_w));
-  assert(acc_y.accessor.is_dense_arbitrary(rect_y));
-  assert(acc_hy.accessor.is_dense_arbitrary(rect_hy));
-  assert(acc_cy.accessor.is_dense_arbitrary(rect_cy));
-  assert(acc_x_grad.accessor.is_dense_arbitrary(rect_x_grad));
-  assert(acc_hx_grad.accessor.is_dense_arbitrary(rect_hx_grad));
-  assert(acc_cx_grad.accessor.is_dense_arbitrary(rect_cx_grad));
-  assert(acc_w_grad.accessor.is_dense_arbitrary(rect_w_grad));
-  assert(acc_y_grad.accessor.is_dense_arbitrary(rect_y_grad));
-  assert(acc_hy_grad.accessor.is_dense_arbitrary(rect_hy_grad));
-  assert(acc_cy_grad.accessor.is_dense_arbitrary(rect_cy_grad));
-
-  float const *x_ptr = acc_x.ptr(rect_x.lo);
-  float const *hx_ptr = acc_hx.ptr(rect_hx.lo);
-  float const *cx_ptr = acc_cx.ptr(rect_cx.lo);
-  float const *w_ptr = acc_w.ptr(rect_w.lo);
-  float const *y_ptr = acc_y.ptr(rect_y.lo);
-  float const *hy_ptr = acc_hy.ptr(rect_hy.lo);
-  float const *cy_ptr = acc_cy.ptr(rect_cy.lo);
-  float *x_grad_ptr = acc_x_grad.ptr(rect_x_grad.lo);
-  float *hx_grad_ptr = acc_hx_grad.ptr(rect_hx_grad.lo);
-  float *cx_grad_ptr = acc_cx_grad.ptr(rect_cx_grad.lo);
-  float *w_grad_ptr = acc_w_grad.ptr(rect_w_grad.lo);
-  float const *y_grad_ptr = acc_y_grad.ptr(rect_y_grad.lo);
-  float const *hy_grad_ptr = acc_hy_grad.ptr(rect_hy_grad.lo);
-  float const *cy_grad_ptr = acc_cy_grad.ptr(rect_cy_grad.lo);
-
-  cudaEvent_t t_start, t_end;
-  if (m->profiling_runtime) {
-    cudaEventCreate(&t_start);
-    cudaEventCreate(&t_end);
-    cudaEventRecord(t_start);
-  }
-  cudaStream_t stream;
-  checkCUDA(cudaStreamCreate(&stream));
-  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
-  checkCUDNN(cudnnRNNBackwardData(m->handle.dnn,
-                                  m->rnnDesc,
-                                  LSTM_PER_NODE_LENGTH /*seqLength*/,
-                                  m->yDescs,
-                                  y_ptr,
-                                  m->yDescs,
-                                  y_grad_ptr,
-                                  m->hyDesc,
-                                  hy_grad_ptr,
-                                  m->cyDesc,
-                                  cy_grad_ptr,
-                                  m->wDesc,
-                                  w_ptr,
-                                  m->hxDesc,
-                                  hx_ptr,
-                                  m->cxDesc,
-                                  cx_ptr,
-                                  m->xDescs,
-                                  x_grad_ptr,
-                                  m->hxDesc,
-                                  hx_grad_ptr,
-                                  m->cxDesc,
-                                  cx_grad_ptr,
-                                  m->handle.workSpace,
-                                  m->handle.workSpaceSize,
-                                  m->reserveSpace,
-                                  m->reserveSpaceSize));
-  checkCUDNN(cudnnRNNBackwardWeights(m->handle.dnn,
-                                     m->rnnDesc,
-                                     LSTM_PER_NODE_LENGTH /*seqLength*/,
-                                     m->xDescs,
-                                     x_ptr,
-                                     m->hxDesc,
-                                     hx_ptr,
-                                     m->yDescs,
-                                     y_ptr,
-                                     m->handle.workSpace,
-                                     m->handle.workSpaceSize,
-                                     m->wDesc,
-                                     w_grad_ptr,
-                                     m->reserveSpace,
-                                     m->reserveSpaceSize));
-  if (m->profiling_runtime) {
-    cudaEventRecord(t_end);
-    checkCUDA(cudaEventSynchronize(t_end));
-    float elapsed = 0;
-    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
-    cudaEventDestroy(t_start);
-    cudaEventDestroy(t_end);
-    printf("LSTM backward time = %.2fms\n", elapsed);
-  }
-#ifdef PRINT_INTERMEDIATE_RESULT
-  print_tensor<1, float>(w_grad_ptr, rect_w_grad, "lstm_bwd:w_grad");
-  print_tensor<3, float>(x_grad_ptr, rect_x_grad, "lstm_bwd:x_grad");
-  print_tensor<2, float>(hx_grad_ptr, rect_hx_grad, "lstm_bwd:hx_grad");
-  print_tensor<2, float>(cx_grad_ptr, rect_cx_grad, "lstm_bwd:cx_grad");
-#endif
-#endif
-}
-
-void LSTM::backward(RnnModel const &model) {
-  Context ctx = model.config.lg_ctx;
-  Runtime *runtime = model.config.lg_hlr;
-  int idx = 0;
-  for (PointInRectIterator<1> it(part_rect); it(); it++, idx++) {
-    OpMeta *mp = meta[idx];
-    DomainPoint dp(*it);
-    TaskLauncher launcher(LSTM_BWD_TASK_ID,
-                          TaskArgument(&mp, sizeof(OpMeta *)),
-                          Predicate::TRUE_PRED,
-                          0 /*MapperID*/,
-                          RnnMapper::assign_to_gpu(paraConfig.gpu[idx]));
-    // add region requirements for x, hx, cx
-    for (int i = 0; i < 3; i++) {
-      LogicalRegion x =
-          runtime->get_logical_subregion_by_color(inputs[i].partition, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(x, READ_ONLY, EXCLUSIVE, inputs[i].region));
-      launcher.add_field(i, FID_DATA);
-    }
-    launcher.add_region_requirement(
-        RegionRequirement(params.region, READ_ONLY, EXCLUSIVE, params.region));
-    launcher.add_field(3, FID_DATA);
-    for (int i = 0; i < 3; i++) {
-      LogicalRegion x =
-          runtime->get_logical_subregion_by_color(outputs[i].partition, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(x, READ_ONLY, EXCLUSIVE, outputs[i].region));
-      launcher.add_field(4 + i, FID_DATA);
-    }
-    // add region requirements for gradients
-    for (int i = 0; i < 3; i++) {
-      LogicalRegion x =
-          runtime->get_logical_subregion_by_color(inputs[i].partition_grad, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(x, WRITE_ONLY, EXCLUSIVE, inputs[i].region_grad));
-      launcher.add_field(7 + i, FID_DATA);
-    }
-    launcher.add_region_requirement(
-        RegionRequirement(params.gradients[paraConfig.gpu[idx]],
-                          READ_WRITE,
-                          EXCLUSIVE,
-                          params.gradients[paraConfig.gpu[idx]]));
-    launcher.add_field(10, FID_DATA);
-    for (int i = 0; i < 3; i++) {
-      LogicalRegion x = runtime->get_logical_subregion_by_color(
-          outputs[i].partition_grad, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(x, READ_ONLY, EXCLUSIVE, outputs[i].region_grad));
-      launcher.add_field(11 + i, FID_DATA);
-    }
-    runtime->execute_task(ctx, launcher);
-  }
-}
-
-void LSTM::update(RnnModel const &model) {}
diff --git a/nmt/nmt.cc b/nmt/nmt.cc
deleted file mode 100644
index cc8c09024b..0000000000
--- a/nmt/nmt.cc
+++ /dev/null
@@ -1,359 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "rnn.h"
-#include "rnn_mapper.h"
-#include <cstdio>
-
-using namespace Legion;
-
-LegionRuntime::Logger::Category log_nmt("nmt");
-
-void parse_input_args(char **argv,
-                      int argc,
-                      int &batch_size,
-                      int &num_layers,
-                      int &seq_length,
-                      int &hidden_size,
-                      int &embed_size);
-
-void set_global_config(GlobalConfig &global,
-                       int num_layers,
-                       int seq_length,
-                       int workers_per_node,
-                       int num_nodes);
-
-void top_level_task(Task const *task,
-                    std::vector<PhysicalRegion> const &regions,
-                    Context ctx,
-                    Runtime *runtime) {
-  int bs_per_worker = 64;
-  int num_layers = 2;
-  int seq_length = 20;
-  int hidden_size = 2048;
-  int embed_size = 2048;
-  int vocab_size = 20 * 1024;
-  int num_nodes = 1;
-  int workers_per_node = 1;
-  int num_parts = workers_per_node * num_nodes;
-  int batch_size = bs_per_worker * num_parts;
-  int num_iterations = 10;
-  {
-    InputArgs const &command_args = HighLevelRuntime::get_input_args();
-    char **argv = command_args.argv;
-    int argc = command_args.argc;
-    parse_input_args(argv,
-                     argc,
-                     batch_size,
-                     num_layers,
-                     seq_length,
-                     hidden_size,
-                     embed_size);
-  }
-  GlobalConfig global;
-  set_global_config(
-      global, num_layers, seq_length, workers_per_node, num_nodes);
-  RnnModel model(batch_size,
-                 num_layers,
-                 seq_length,
-                 hidden_size,
-                 embed_size,
-                 vocab_size,
-                 num_parts,
-                 num_nodes,
-                 workers_per_node,
-                 global,
-                 ctx,
-                 runtime);
-  ArgumentMap local_args;
-  size_t workSpaceSize = (size_t)2 * 1024 * 1024 * 1024;
-  Rect<1> workers_rect(Point<1>(0), Point<1>(num_nodes * workers_per_node - 1));
-  int idx = 0;
-  for (PointInRectIterator<1> it(workers_rect); it(); it++) {
-    TaskLauncher launcher(CUDNN_INIT_TASK_ID,
-                          TaskArgument(&workSpaceSize, sizeof(workSpaceSize)),
-                          Predicate::TRUE_PRED,
-                          0 /*MapperID*/,
-                          RnnMapper::assign_to_gpu(idx));
-    Future f = runtime->execute_task(ctx, launcher);
-    model.dnn_handlers[idx++] = f.get_result<DnnHandle>();
-  }
-
-  model.init();
-  double ts_start = Realm::Clock::current_time_in_microseconds();
-  for (int i = 0; i < num_iterations; i++) {
-    model.forward();
-    model.backward();
-    model.update();
-  }
-  runtime->issue_execution_fence(ctx);
-  TimingLauncher timer(MEASURE_MICRO_SECONDS);
-  Future future = runtime->issue_timing_measurement(ctx, timer);
-  future.get_void_result();
-  double ts_end = Realm::Clock::current_time_in_microseconds();
-  double run_time = 1e-6 * (ts_end - ts_start);
-  printf("time = %.4fs\n", run_time);
-}
-
-int main(int argc, char **argv) {
-  Runtime::set_top_level_task_id(TOP_LEVEL_TASK_ID);
-  {
-    TaskVariantRegistrar registrar(TOP_LEVEL_TASK_ID, "top_level");
-    registrar.add_constraint(ProcessorConstraint(Processor::LOC_PROC));
-    // registrar.set_inner();
-    Runtime::preregister_task_variant<top_level_task>(registrar, "top_level");
-  }
-
-  // DNN_INIT_TASK
-  {
-    TaskVariantRegistrar registrar(CUDNN_INIT_TASK_ID, "cudnn_init_task");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<DnnHandle, init_cudnn>(registrar,
-                                                             "cudnn_init_task");
-  }
-  //
-  {
-    TaskVariantRegistrar registrar(WORD_INIT_TASK_ID, "word_init_task(dummy)");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<RnnModel::word_init_task>(
-        registrar, "word_init_task(dummy)");
-  }
-  // Word Embedding task
-  {
-    TaskVariantRegistrar registrar(EMBED_INIT_TASK_ID, "embed_init_task");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<OpMeta *, Embed::init_task>(
-        registrar, "embed_init_task");
-  }
-  {
-    TaskVariantRegistrar registrar(EMBED_FWD_TASK_ID, "embed_fwd_task");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<Embed::forward_task>(registrar,
-                                                           "embed_fwd_task");
-  }
-  {
-    TaskVariantRegistrar registrar(EMBED_BWD_TASK_ID, "embed_bwd_task");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<Embed::backward_task>(registrar,
-                                                            "embed_bwd_task");
-  }
-  // LSTM task
-  {
-    TaskVariantRegistrar registrar(LSTM_INIT_TASK_ID, "lstm_init_task");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<OpMeta *, LSTM::init_task>(
-        registrar, "lstm_init_task");
-  }
-  {
-    TaskVariantRegistrar registrar(LSTM_FWD_TASK_ID, "lstm_fwd_task");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<LSTM::forward_task>(registrar,
-                                                          "lstm_fwd_task");
-  }
-  {
-    TaskVariantRegistrar registrar(LSTM_BWD_TASK_ID, "lstm_bwd_task");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<LSTM::backward_task>(registrar,
-                                                           "lstm_bwd_task");
-  }
-  // Rnn Linear task
-  {
-    TaskVariantRegistrar registrar(RNN_LINEAR_INIT_TASK_ID, "linear_init_task");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<OpMeta *, Linear::init_task>(
-        registrar, "linear_init_task");
-  }
-  {
-    TaskVariantRegistrar registrar(RNN_LINEAR_FWD_TASK_ID, "linar_fwd_task");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<Linear::forward_task>(registrar,
-                                                            "linear_fwd_task");
-  }
-  {
-    TaskVariantRegistrar registrar(RNN_LINEAR_BWD_TASK_ID, "linear_bwd_task");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<Linear::backward_task>(registrar,
-                                                             "linear_bwd_task");
-  }
-  {
-    TaskVariantRegistrar registrar(RNN_LINEAR_BWD2_TASK_ID, "linear_bwd2_task");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<Linear::backward2_task>(
-        registrar, "linear_bwd2_task");
-  }
-  // Softmax (Data Parallel Implementation) task
-  {
-    TaskVariantRegistrar registrar(RNN_SOFTMAXDP_INIT_TASK_ID,
-                                   "softmaxDP_init_task");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<OpMeta *, SoftmaxDP::init_task>(
-        registrar, "softmaxDP_init_task");
-  }
-  {
-    TaskVariantRegistrar registrar(RNN_SOFTMAXDP_FWD_TASK_ID,
-                                   "softmaxDP_fwd_task");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<SoftmaxDP::forward_task>(
-        registrar, "softmaxDP_fwd_task");
-  }
-  {
-    TaskVariantRegistrar registrar(RNN_SOFTMAXDP_BWD_TASK_ID,
-                                   "softmaxDP_bwd_task");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<SoftmaxDP::backward_task>(
-        registrar, "softmaxDP_bwd_task");
-  }
-  // Params related tasks
-  {
-    TaskVariantRegistrar registrar(PARAMS_INIT_TASK_ID, "params_init_task");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<RnnModel::params_init_task>(
-        registrar, "params_init_task");
-  }
-  {
-    TaskVariantRegistrar registrar(ZERO_1D_INIT_TASK_ID, "zero_1d_init_task");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<RnnModel::zero_1d_init_task>(
-        registrar, "zero_1d_init_task");
-  }
-  {
-    TaskVariantRegistrar registrar(ZERO_2D_INIT_TASK_ID, "zero_2d_init_task");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<RnnModel::zero_2d_init_task>(
-        registrar, "zero_2d_init_task");
-  }
-  {
-    TaskVariantRegistrar registrar(ZERO_3D_INIT_TASK_ID, "zero_3d_init_task");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<RnnModel::zero_3d_init_task>(
-        registrar, "zero_3d_init_task");
-  }
-  {
-    TaskVariantRegistrar registrar(PARAMS_UPD_TASK_ID, "params_upd_task");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<RnnModel::params_update_task>(
-        registrar, "params_upd_task");
-  }
-  // Dummy tasks
-  {
-    TaskVariantRegistrar registrar(DUMMY_TASK_ID, "dummy_task");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    Runtime::preregister_task_variant<RnnModel::dummy_task>(registrar,
-                                                            "dummy_task");
-  }
-
-  Runtime::add_registration_callback(update_mappers);
-  return Runtime::start(argc, argv);
-}
-
-void parse_input_args(char **argv,
-                      int argc,
-                      int &batch_size,
-                      int &num_layers,
-                      int &seq_length,
-                      int &hidden_size,
-                      int &embed_size) {
-  for (int i = 1; i < argc; i++) {
-    if (!strcmp(argv[i], "-b")) {
-      batch_size = atoi(argv[++i]);
-      continue;
-    }
-    if (!strcmp(argv[i], "-l")) {
-      num_layers = atoi(argv[++i]);
-      continue;
-    }
-    if (!strcmp(argv[i], "-s")) {
-      seq_length = atoi(argv[++i]);
-      continue;
-    }
-    if (!strcmp(argv[i], "-h")) {
-      hidden_size = atoi(argv[++i]);
-      continue;
-    }
-    if (!strcmp(argv[i], "-e")) {
-      embed_size = atoi(argv[++i]);
-      continue;
-    }
-  }
-}
-
-void set_global_config(GlobalConfig &global,
-                       int num_layers,
-                       int seq_length,
-                       int workers_per_node,
-                       int num_nodes) {
-  int num_parts = workers_per_node * num_nodes;
-  for (int i = 0; i * LSTM_PER_NODE_LENGTH < 2 * seq_length; i++) {
-    ParallelConfig pc;
-    pc.nDims = 1;
-    pc.dim[0] = num_parts;
-    for (int j = 0; j < num_parts; j++) {
-      pc.gpu[j] = i * LSTM_PER_NODE_LENGTH < seq_length ? 0 : 1;
-    }
-    // pc.gpu[j] = j;
-    global.embed[i] = pc;
-  }
-  for (int i = 0; i < num_layers; i++) {
-    for (int j = 0; j * LSTM_PER_NODE_LENGTH < 2 * seq_length; j++) {
-      ParallelConfig pc;
-      pc.nDims = 1;
-      pc.dim[0] = num_parts;
-      for (int k = 0; k < num_parts; k++) {
-        pc.gpu[k] = k;
-      }
-      global.lstm[i][j] = pc;
-    }
-  }
-  for (int i = 0; i * LSTM_PER_NODE_LENGTH < seq_length; i++) {
-    ParallelConfig pc;
-    pc.nDims = 2;
-    pc.dim[0] = 1;
-    pc.dim[1] = num_parts;
-    for (int j = 0; j < num_parts; j++) {
-      pc.gpu[j] = j;
-    }
-    global.linear[i] = pc;
-  }
-  for (int i = 0; i * LSTM_PER_NODE_LENGTH < seq_length; i++) {
-    ParallelConfig pc;
-    pc.nDims = 1;
-    pc.dim[0] = num_parts;
-    for (int j = 0; j < num_parts; j++) {
-      pc.gpu[j] = j;
-    }
-    global.softmax[i] = pc;
-  }
-}
diff --git a/nmt/ops.h b/nmt/ops.h
deleted file mode 100644
index d6faf662a0..0000000000
--- a/nmt/ops.h
+++ /dev/null
@@ -1,177 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#ifndef _LEGION_CNN_OPS_H_
-#define _LEGION_CNN_OPS_H_
-
-// #define DISABLE_COMPUTATION
-#include "legion.h"
-#include <cublas_v2.h>
-#include <cuda_runtime.h>
-#include <cudnn.h>
-#include <curand.h>
-#include <unistd.h>
-using namespace Legion;
-
-template <typename FT, int N, typename T = coord_t>
-using AccessorRO =
-    FieldAccessor<READ_ONLY, FT, N, T, Realm::AffineAccessor<FT, N, T>>;
-template <typename FT, int N, typename T = coord_t>
-using AccessorRW =
-    FieldAccessor<READ_WRITE, FT, N, T, Realm::AffineAccessor<FT, N, T>>;
-template <typename FT, int N, typename T = coord_t>
-using AccessorWO =
-    FieldAccessor<WRITE_ONLY, FT, N, T, Realm::AffineAccessor<FT, N, T>>;
-
-#define MAX_NUM_INPUTS 6
-#define MAX_NUM_OUTPUTS 6
-#define MAX_NUM_LOCALS 3
-#define MAX_NUM_WORKERS 16
-#define MAX_NUM_PARTS 16
-#define MAX_DIM 4
-#define MAX_FILENAME 200
-
-enum TaskIDs {
-  TOP_LEVEL_TASK_ID,
-  CUDNN_INIT_TASK_ID,
-  IMAGE_INIT_TASK_ID,
-  LABEL_INIT_TASK_ID,
-  LOAD_IMAGES_TASK_ID,
-  NORMALIZE_IMAGES_TASK_ID,
-  CONV2D_INIT_TASK_ID,
-  CONV2D_INIT_PARA_TASK_ID,
-  CONV2D_FWD_TASK_ID,
-  CONV2D_BWD_TASK_ID,
-  CONV2D_UPD_TASK_ID,
-  POOL2D_INIT_TASK_ID,
-  POOL2D_FWD_TASK_ID,
-  POOL2D_BWD_TASK_ID,
-  LINEAR_INIT_TASK_ID,
-  LINEAR_INIT_PARA_TASK_ID,
-  LINEAR_FWD_TASK_ID,
-  LINEAR_BWD_TASK_ID,
-  LINEAR_BWD2_TASK_ID,
-  LINEAR_UPD_TASK_ID,
-  FLAT_INIT_TASK_ID,
-  FLAT_FWD_TASK_ID,
-  FLAT_BWD_TASK_ID,
-  SOFTMAX_INIT_TASK_ID,
-  SOFTMAX_FWD_TASK_ID,
-  SOFTMAX_BWD_TASK_ID,
-  CONCAT_INIT_TASK_ID,
-  CONCAT_FWD_TASK_ID,
-  CONCAT_BWD_TASK_ID,
-  // RNN Task IDs
-  LSTM_INIT_TASK_ID,
-  LSTM_FWD_TASK_ID,
-  LSTM_BWD_TASK_ID,
-  RNN_LINEAR_INIT_TASK_ID,
-  RNN_LINEAR_FWD_TASK_ID,
-  RNN_LINEAR_BWD_TASK_ID,
-  RNN_LINEAR_BWD2_TASK_ID,
-  EMBED_INIT_TASK_ID,
-  EMBED_FWD_TASK_ID,
-  EMBED_BWD_TASK_ID,
-  RNN_SOFTMAXDP_INIT_TASK_ID,
-  RNN_SOFTMAXDP_FWD_TASK_ID,
-  RNN_SOFTMAXDP_BWD_TASK_ID,
-  PARAMS_INIT_TASK_ID,
-  PARAMS_UPD_TASK_ID,
-  WORD_INIT_TASK_ID, // DUMMY_TASK_ID: To be removed
-  ZERO_1D_INIT_TASK_ID,
-  ZERO_2D_INIT_TASK_ID,
-  ZERO_3D_INIT_TASK_ID,
-  // Dummy task ID
-  DUMMY_TASK_ID,
-};
-
-enum Pool2DType {
-  POOL2D_MAX,
-  POOL2D_AVG,
-};
-
-enum FieldIDs {
-  FID_DATA,
-};
-
-struct DnnHandle {
-#ifndef DISABLE_COMPUTATION
-  cudnnHandle_t dnn;
-  cublasHandle_t blas;
-#endif
-  void *workSpace;
-  size_t workSpaceSize;
-};
-
-struct Tensor {
-  //  Tensor(int _numDim, int* _dim, LogicalRegion lr, LogicalPartition lp)
-  //  {
-  //    numDim = _numDim;
-  //    for (int i = 0; i < numDim; i++)
-  //      dim[i] = _dim[i];
-  //    region = lr;
-  //    partition = lp;
-  //  }
-  int numDim, adim[MAX_DIM], pdim[MAX_DIM];
-  LogicalRegion region, region_grad;
-  LogicalPartition partition, partition_grad;
-};
-
-struct TensorWithGrad {
-  // int dim[MAX_DIM];
-  LogicalRegion region, region_grad;
-  LogicalPartition partition, partition_grad;
-};
-
-class OpMeta {
-public:
-  OpMeta(DnnHandle _handle) : handle(_handle){};
-
-public:
-  DnnHandle handle;
-};
-
-// Empty base class
-class CnnModel;
-class DataLoader;
-
-class Op {
-public:
-  Op(Tensor input);
-  Op(int num, Tensor *inputs);
-  virtual void init(CnnModel const &) = 0;
-
-  virtual void forward(CnnModel const &) = 0;
-
-  virtual void backward(CnnModel const &) = 0;
-
-  virtual void update(CnnModel const &) = 0;
-
-public:
-  Tensor output;
-  // Op* pre_ops[MAX_NUM_INPUTS];
-  Tensor inputs[MAX_NUM_INPUTS];
-  LogicalPartition input_lps[MAX_NUM_INPUTS];
-  TensorWithGrad locals[MAX_NUM_LOCALS];
-  OpMeta *meta[MAX_NUM_WORKERS];
-  // std::vector<LogicalRegion> inputs, grads;
-};
-
-DnnHandle init_cudnn(Task const *task,
-                     std::vector<PhysicalRegion> const &regions,
-                     Context ctx,
-                     Runtime *runtime);
-
-#endif // _LEGION_OPS_H_
diff --git a/nmt/rnn.cu b/nmt/rnn.cu
deleted file mode 100644
index 3d59116833..0000000000
--- a/nmt/rnn.cu
+++ /dev/null
@@ -1,770 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "../cnn_helper.h"
-#include "rnn.h"
-#include "rnn_mapper.h"
-
-DnnHandle init_cudnn(Task const *task,
-                     std::vector<PhysicalRegion> const &regions,
-                     Context ctx,
-                     HighLevelRuntime *runtime) {
-  assert(regions.size() == 0);
-  assert(task->arglen == sizeof(size_t));
-  size_t workSpaceSize = *(size_t const *)task->args;
-  DnnHandle handle;
-  handle.workSpaceSize = workSpaceSize;
-  printf("workSpaceSize = %zu\n", workSpaceSize);
-#ifndef DISABLE_COMPUTATION
-  checkCUDA(cublasCreate(&handle.blas));
-  checkCUDNN(cudnnCreate(&handle.dnn));
-#endif
-  checkCUDA(cudaMalloc(&handle.workSpace, workSpaceSize));
-  return handle;
-}
-
-const SharedVariable SharedVariable::NO_VARIABLE = SharedVariable();
-
-RnnOp::RnnOp(Tensor input, ParallelConfig pc, SharedVariable _params)
-    : paraConfig(pc), params(_params) {
-  inputs[0] = input;
-}
-
-RnnOp::RnnOp(
-    Tensor t1, Tensor t2, Tensor t3, ParallelConfig pc, SharedVariable _params)
-    : paraConfig(pc), params(_params) {
-  inputs[0] = t1;
-  inputs[1] = t2;
-  inputs[2] = t3;
-}
-
-RnnOp::RnnOp(int n, Tensor *_inputs) {
-  for (int i = 0; i < n; i++) {
-    inputs[i] = _inputs[i];
-  }
-}
-
-RnnModel::RnnModel(int batch_size,
-                   int numLayers,
-                   int seqLength,
-                   int hidden_size,
-                   int embed_size,
-                   int vocab_size,
-                   int num_parts,
-                   int num_nodes,
-                   int num_gpus_per_node,
-                   GlobalConfig global,
-                   Context ctx,
-                   Runtime *runtime) {
-  config.lg_ctx = ctx;
-  config.lg_hlr = runtime;
-  config.batchSize = batch_size;
-  config.hiddenSize = hidden_size;
-  config.embedSize = embed_size;
-  config.vocabSize = vocab_size;
-  config.numLayers = numLayers;
-  config.seqLength = seqLength;
-  config.numParts = num_parts;
-  config.numNodes = num_nodes;
-  config.workersPerNode = num_gpus_per_node;
-  config.field_space = runtime->create_field_space(ctx);
-  {
-    FieldAllocator allocator =
-        runtime->create_field_allocator(ctx, config.field_space);
-    allocator.allocate_field(sizeof(float), FID_DATA);
-  }
-  Rect<1> part_rect(Point<1>(0), Point<1>(num_parts - 1));
-  part_is = runtime->create_index_space(ctx, part_rect);
-  assert(seqLength <= MAX_SEQ_LENGTH);
-  assert(numLayers <= MAX_NUM_LAYERS);
-  int nodes_per_layer = seqLength / LSTM_PER_NODE_LENGTH;
-  // Create srcs/dsts tensors
-  {
-    Rect<2> word_rect(Point<2>(0, 0),
-                      Point<2>(batch_size - 1, LSTM_PER_NODE_LENGTH - 1));
-    IndexSpaceT<2> word_is = runtime->create_index_space(ctx, word_rect);
-    int extent_n = batch_size / num_parts;
-    Rect<2, coord_t> extent(Point<2>(0, 0),
-                            Point<2>(extent_n - 1, LSTM_PER_NODE_LENGTH - 1));
-    Transform<2, 1, coord_t> trans;
-    trans[0][0] = extent_n;
-    trans[1][0] = 0;
-    IndexPartition word_ip = runtime->create_partition_by_restriction(
-        ctx, word_is, part_is, trans, extent);
-    assert(runtime->is_index_partition_disjoint(ctx, word_ip));
-    assert(runtime->is_index_partition_complete(ctx, word_ip));
-    assert(seqLength % LSTM_PER_NODE_LENGTH == 0);
-    for (int i = 0; i < nodes_per_layer; i++) {
-      srcs[i].numDim = 2;
-      srcs[i].adim[0] = batch_size;
-      srcs[i].adim[1] = LSTM_PER_NODE_LENGTH;
-      srcs[i].pdim[0] = extent_n;
-      srcs[i].pdim[1] = LSTM_PER_NODE_LENGTH;
-      srcs[i].region =
-          runtime->create_logical_region(ctx, word_is, config.field_space);
-      srcs[i].partition =
-          runtime->get_logical_partition(ctx, srcs[i].region, word_ip);
-      srcs[i].region_grad =
-          runtime->create_logical_region(ctx, word_is, config.field_space);
-      srcs[i].partition_grad =
-          runtime->get_logical_partition(ctx, srcs[i].region_grad, word_ip);
-      dsts[i] = srcs[i];
-      dsts[i].region =
-          runtime->create_logical_region(ctx, word_is, config.field_space);
-      dsts[i].partition =
-          runtime->get_logical_partition(ctx, dsts[i].region, word_ip);
-      dsts[i].region_grad =
-          runtime->create_logical_region(ctx, word_is, config.field_space);
-      dsts[i].partition_grad =
-          runtime->get_logical_partition(ctx, dsts[i].region_grad, word_ip);
-    }
-  }
-  // Create zeroed tensors
-  {
-    Rect<2> hx_rect(Point<2>(0, 0), Point<2>(hidden_size - 1, batch_size - 1));
-    IndexSpaceT<2> hx_is = runtime->create_index_space(ctx, hx_rect);
-    int extent_c = hidden_size;
-    int extent_n = batch_size / num_parts;
-    Rect<2> hx_ext(Point<2>(0, 0), Point<2>(extent_c - 1, extent_n - 1));
-    Transform<2, 1, coord_t> hx_trans;
-    hx_trans[0][0] = 0;
-    hx_trans[1][0] = extent_n;
-    IndexPartition hx_ip = runtime->create_partition_by_restriction(
-        ctx, hx_is, part_is, hx_trans, hx_ext);
-    assert(runtime->is_index_partition_disjoint(ctx, hx_ip));
-    assert(runtime->is_index_partition_complete(ctx, hx_ip));
-    for (int i = 0; i < numLayers; i++) {
-      for (int j = 0; j < 2; j++) {
-        Tensor t;
-        t.numDim = 2;
-        t.adim[0] = hidden_size;
-        t.adim[1] = batch_size;
-        t.pdim[0] = extent_c;
-        t.pdim[1] = extent_n;
-        t.region =
-            runtime->create_logical_region(ctx, hx_is, config.field_space);
-        t.partition = runtime->get_logical_partition(ctx, t.region, hx_ip);
-        t.region_grad =
-            runtime->create_logical_region(ctx, hx_is, config.field_space);
-        t.partition_grad =
-            runtime->get_logical_partition(ctx, t.region_grad, hx_ip);
-        if (j == 0) {
-          zero[i].hx = t;
-        } else {
-          zero[i].cx = t;
-        }
-      }
-    }
-  }
-  // Embedding
-  SharedVariable srcEmbed, dstEmbed;
-  {
-    int numParams = config.vocabSize * config.embedSize;
-    Rect<1> params_rect(Point<1>(0), Point<1>(numParams - 1));
-    IndexSpaceT<1> params_is = runtime->create_index_space(ctx, params_rect);
-    srcEmbed.region =
-        runtime->create_logical_region(ctx, params_is, config.field_space);
-    dstEmbed.region =
-        runtime->create_logical_region(ctx, params_is, config.field_space);
-    for (int i = 0; i < 2 * nodes_per_layer; i++) {
-      ParallelConfig pc = global.embed[i];
-      assert(pc.nDims == 1);
-      for (int j = 0; j < pc.dim[0]; j++) {
-        int gpuId = pc.gpu[j];
-        if (i < nodes_per_layer) {
-          if (srcEmbed.gradients[gpuId] == LogicalRegion::NO_REGION) {
-            srcEmbed.gradients[gpuId] = runtime->create_logical_region(
-                ctx, params_is, config.field_space);
-          }
-        } else {
-          if (dstEmbed.gradients[gpuId] == LogicalRegion::NO_REGION) {
-            dstEmbed.gradients[gpuId] = runtime->create_logical_region(
-                ctx, params_is, config.field_space);
-          }
-        }
-      }
-    }
-    // Collect masterOnNode for srcEmbed/dstEmbed
-    for (int i = 0; i < config.numNodes; i++) {
-      for (int j = config.workersPerNode - 1; j >= 0; j--) {
-        int gpuId = i * config.workersPerNode + j;
-        if (srcEmbed.gradients[gpuId] != LogicalRegion::NO_REGION) {
-          srcEmbed.masterOnNode[i] = gpuId;
-        }
-        if (dstEmbed.gradients[gpuId] != LogicalRegion::NO_REGION) {
-          dstEmbed.masterOnNode[i] = gpuId;
-        }
-      }
-    }
-  }
-
-  // Encoders/decoders
-  SharedVariable encoders[MAX_NUM_LAYERS], decoders[MAX_NUM_LAYERS];
-  for (int i = 0; i < numLayers; i++) {
-    int input_size = (i == 0) ? embed_size : hidden_size;
-    int output_size = hidden_size;
-    int numParams = (input_size + 1 + output_size + 1) * output_size * 4;
-    Rect<1> params_rect(Point<1>(0), Point<1>(numParams - 1));
-    IndexSpaceT<1> params_is = runtime->create_index_space(ctx, params_rect);
-    encoders[i].region =
-        runtime->create_logical_region(ctx, params_is, config.field_space);
-    decoders[i].region =
-        runtime->create_logical_region(ctx, params_is, config.field_space);
-    for (int j = 0; j < 2 * nodes_per_layer; j++) {
-      ParallelConfig pc = global.lstm[i][j];
-      assert(pc.nDims == 1);
-      for (int k = 0; k < pc.dim[0]; k++) {
-        int gpuId = pc.gpu[k];
-        if (j < nodes_per_layer) {
-          if (encoders[i].gradients[gpuId] == LogicalRegion::NO_REGION) {
-            encoders[i].gradients[gpuId] = runtime->create_logical_region(
-                ctx, params_is, config.field_space);
-          }
-        } else {
-          if (decoders[i].gradients[gpuId] == LogicalRegion::NO_REGION) {
-            decoders[i].gradients[gpuId] = runtime->create_logical_region(
-                ctx, params_is, config.field_space);
-          }
-        }
-      }
-    }
-    // Collect masterOnNode for encoders[i]/decoders[i]
-    for (int j = 0; j < config.numNodes; j++) {
-      for (int k = config.workersPerNode - 1; k >= 0; k--) {
-        int gpuId = j * config.workersPerNode + k;
-        if (encoders[i].gradients[gpuId] != LogicalRegion::NO_REGION) {
-          encoders[i].masterOnNode[j] = gpuId;
-        }
-        if (decoders[i].gradients[gpuId] != LogicalRegion::NO_REGION) {
-          decoders[i].masterOnNode[j] = gpuId;
-        }
-      }
-    }
-  }
-  SharedVariable linear;
-  {
-    int numParams = (hidden_size + 1) * vocab_size;
-    Rect<1> params_rect(Point<1>(0), Point<1>(numParams - 1));
-    IndexSpaceT<1> params_is = runtime->create_index_space(ctx, params_rect);
-    linear.region =
-        runtime->create_logical_region(ctx, params_is, config.field_space);
-    linear.subregions[1] = linear.region;
-    // Create subregions for the shared variable linear
-    for (int parts = 2; parts <= MAX_NUM_PARTS; parts *= 2) {
-      Rect<1> rect(Point<1>(0), Point<1>(parts - 1));
-      IndexSpaceT<1> is = runtime->create_index_space(ctx, rect);
-      IndexPartition ip = runtime->create_equal_partition(ctx, params_is, is);
-      LogicalPartition lp =
-          runtime->get_logical_partition(ctx, linear.region, ip);
-      int idx = 0;
-      for (PointInRectIterator<1> it(rect); it(); it++, idx++) {
-        DomainPoint dp(*it);
-        linear.subregions[parts + idx] =
-            runtime->get_logical_subregion_by_color(ctx, lp, dp);
-      }
-    }
-    // Compute bboxes for the shared variable linear
-    // Also compute masterOnNode which is the largest gradients on each node
-    std::map<int, Rect<1>> bboxes;
-    for (int i = 0; i < nodes_per_layer; i++) {
-      ParallelConfig pc = global.linear[i];
-      assert(pc.nDims == 2);
-      for (int j = 0; j < pc.dim[1]; j++) {
-        for (int k = 0; k < pc.dim[0]; k++) {
-          int gpuIdx = pc.gpu[j * pc.dim[0] + k];
-          Rect<1> rect = runtime->get_index_space_domain(
-              ctx, linear.subregions[pc.dim[0] + k].get_index_space());
-          if (bboxes.find(gpuIdx) == bboxes.end()) {
-            bboxes[gpuIdx] = rect;
-          } else {
-            bboxes[gpuIdx] = bboxes[gpuIdx].union_bbox(rect);
-          }
-          int nodeIdx = gpuIdx / config.workersPerNode;
-          if (linear.masterOnNode[nodeIdx] == MASTER_NOT_ASSIGNED) {
-            linear.masterOnNode[nodeIdx] = gpuIdx;
-          } else {
-            int masterIdx = linear.masterOnNode[nodeIdx];
-            if (bboxes[gpuIdx].volume() > bboxes[masterIdx].volume()) {
-              linear.masterOnNode[nodeIdx] = gpuIdx;
-            }
-          }
-        }
-      }
-    }
-    // The first bbox on each node is a superset of all bboxes on that node
-    for (int n = 0; n < config.numNodes; n++) {
-      if (linear.masterOnNode[n] != MASTER_NOT_ASSIGNED) {
-        for (int j = 0; j < config.workersPerNode; j++) {
-          if (bboxes.find(n * config.workersPerNode + j) != bboxes.end()) {
-            Rect<1> rect = bboxes[n * config.workersPerNode + j];
-            bboxes[linear.masterOnNode[n]] =
-                bboxes[linear.masterOnNode[n]].union_bbox(rect);
-          }
-        }
-      }
-    }
-    for (int i = 0; i < config.numNodes * config.workersPerNode; i++) {
-      if (bboxes.find(i) != bboxes.end()) {
-        IndexSpaceT<1> params_is = runtime->create_index_space(ctx, bboxes[i]);
-        linear.gradients[i] =
-            runtime->create_logical_region(ctx, params_is, config.field_space);
-      } else {
-        linear.gradients[i] = LogicalRegion::NO_REGION;
-      }
-    }
-  }
-
-  Tensor embed[2 * MAX_SEQ_LENGTH];
-  for (int i = 0; i < 2 * nodes_per_layer; i++) {
-    embed[i] = add_embed_node(i < nodes_per_layer ? srcs[i]
-                                                  : dsts[i - nodes_per_layer],
-                              config.vocabSize,
-                              config.embedSize,
-                              global.embed[i],
-                              i < nodes_per_layer ? srcEmbed : dstEmbed);
-  }
-  for (int i = 0; i < numLayers; i++) {
-    // Add encoder lstm nodes
-    for (int j = 0; j < nodes_per_layer; j++) {
-      Tensor x = (i == 0) ? embed[j] : lstm[i - 1][j].x;
-      Tensor hx = (j == 0) ? zero[i].hx : lstm[i][j - 1].hx;
-      Tensor cx = (j == 0) ? zero[i].cx : lstm[i][j - 1].cx;
-      lstm[i][j] = add_lstm_node(x, hx, cx, global.lstm[i][j], encoders[i]);
-    }
-    // Add decoder lstm nodes
-    for (int j = nodes_per_layer; j < 2 * nodes_per_layer; j++) {
-      Tensor x = (i == 0) ? embed[j] : lstm[i - 1][j].x;
-      Tensor hx = lstm[i][j - 1].hx;
-      Tensor cx = lstm[i][j - 1].cx;
-      lstm[i][j] = add_lstm_node(x, hx, cx, global.lstm[i][j], decoders[i]);
-    }
-  }
-  // Add linear nodes
-  for (int j = nodes_per_layer; j < 2 * nodes_per_layer; j++) {
-    Tensor logit = add_linear_node(lstm[numLayers - 1][j].x,
-                                   vocab_size,
-                                   global.linear[j - nodes_per_layer],
-                                   linear);
-    add_softmaxDP_node(
-        logit, dsts[j - nodes_per_layer], global.softmax[j - nodes_per_layer]);
-  }
-
-  // Add shared variables
-  sharedVariables.push_back(srcEmbed);
-  sharedVariables.push_back(dstEmbed);
-  for (int i = 0; i < config.numLayers; i++) {
-    sharedVariables.push_back(encoders[i]);
-    sharedVariables.push_back(decoders[i]);
-  }
-  sharedVariables.push_back(linear);
-}
-
-void RnnModel::word_init_task(Task const *task,
-                              std::vector<PhysicalRegion> const &regions,
-                              Context ctx,
-                              Runtime *runtime) {
-  Rect<2> rect0 = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  int *host_ptr;
-  bool same = *((bool *)task->args);
-  checkCUDA(cudaHostAlloc(&host_ptr,
-                          sizeof(int) * rect0.volume(),
-                          cudaHostAllocPortable | cudaHostAllocMapped));
-  for (int i = 0; i < rect0.volume(); i++) {
-    host_ptr[i] = same ? 1 : i % 16;
-  }
-  for (int i = 0; i < regions.size(); i++) {
-    AccessorWO<int, 2> const acc(regions[i], FID_DATA);
-    Rect<2> rect = runtime->get_index_space_domain(
-        ctx, task->regions[i].region.get_index_space());
-    assert(acc.accessor.is_dense_arbitrary(rect));
-    assert(rect == rect0);
-    int *ptr = acc.ptr(rect.lo);
-    checkCUDA(cudaMemcpy(
-        ptr, host_ptr, sizeof(int) * rect0.volume(), cudaMemcpyHostToDevice));
-  }
-  checkCUDA(cudaFreeHost(host_ptr));
-}
-
-void RnnModel::init() {
-  Context ctx = config.lg_ctx;
-  Runtime *runtime = config.lg_hlr;
-  // Init words
-  Rect<1> part_rect = runtime->get_index_space_domain(ctx, part_is);
-  for (PointInRectIterator<1> it(part_rect); it(); it++) {
-    int idx = 0;
-    bool same = false;
-    TaskLauncher launcher(WORD_INIT_TASK_ID,
-                          TaskArgument(&same, sizeof(same)),
-                          Predicate::TRUE_PRED,
-                          0 /*MapperID*/,
-                          RnnMapper::assign_to_gpu(0));
-    DomainPoint dp(*it);
-    for (int i = 0; i * LSTM_PER_NODE_LENGTH < config.seqLength; i++) {
-      LogicalRegion x =
-          runtime->get_logical_subregion_by_color(srcs[i].partition, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(x, WRITE_ONLY, EXCLUSIVE, srcs[i].region));
-      launcher.add_field(idx++, FID_DATA);
-    }
-    for (int i = 0; i * LSTM_PER_NODE_LENGTH < config.seqLength; i++) {
-      LogicalRegion x =
-          runtime->get_logical_subregion_by_color(dsts[i].partition, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(x, WRITE_ONLY, EXCLUSIVE, dsts[i].region));
-      launcher.add_field(idx++, FID_DATA);
-    }
-    Future f = runtime->execute_task(ctx, launcher);
-    f.get_void_result();
-  }
-  // Init zero tensors
-  for (PointInRectIterator<1> it(part_rect); it(); it++) {
-    int idx = 0;
-    TaskLauncher launcher(ZERO_2D_INIT_TASK_ID,
-                          TaskArgument(NULL, 0),
-                          Predicate::TRUE_PRED,
-                          0,
-                          RnnMapper::assign_to_gpu(0));
-    DomainPoint dp(*it);
-    for (int i = 0; i < config.numLayers; i++) {
-      LogicalRegion hx =
-          runtime->get_logical_subregion_by_color(zero[i].hx.partition, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(hx, WRITE_ONLY, EXCLUSIVE, zero[i].hx.region));
-      launcher.add_field(idx++, FID_DATA);
-    }
-    for (int i = 0; i < config.numLayers; i++) {
-      LogicalRegion cx =
-          runtime->get_logical_subregion_by_color(zero[i].cx.partition, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(cx, WRITE_ONLY, EXCLUSIVE, zero[i].cx.region));
-      launcher.add_field(idx++, FID_DATA);
-    }
-    Future f = runtime->execute_task(ctx, launcher);
-    f.get_void_result();
-  }
-  // Init hx_grad/cx_grad for the last LSTM node on each layer
-  int nodes_per_layer = config.seqLength / LSTM_PER_NODE_LENGTH;
-  for (PointInRectIterator<1> it(part_rect); it(); it++) {
-    int idx = 0;
-    TaskLauncher launcher(ZERO_2D_INIT_TASK_ID,
-                          TaskArgument(NULL, 0),
-                          Predicate::TRUE_PRED,
-                          0,
-                          RnnMapper::assign_to_gpu(0));
-    DomainPoint dp(*it);
-    for (int i = 0; i < config.numLayers; i++) {
-      LSTMTensors last_lstm = lstm[i][2 * nodes_per_layer - 1];
-      // hx
-      LogicalRegion hx_grad = runtime->get_logical_subregion_by_color(
-          last_lstm.hx.partition_grad, dp);
-      launcher.add_region_requirement(RegionRequirement(
-          hx_grad, WRITE_ONLY, EXCLUSIVE, last_lstm.hx.region_grad));
-      launcher.add_field(idx++, FID_DATA);
-      // cx
-      LogicalRegion cx_grad = runtime->get_logical_subregion_by_color(
-          last_lstm.cx.partition_grad, dp);
-      launcher.add_region_requirement(RegionRequirement(
-          cx_grad, WRITE_ONLY, EXCLUSIVE, last_lstm.cx.region_grad));
-      launcher.add_field(idx++, FID_DATA);
-    }
-    Future f = runtime->execute_task(ctx, launcher);
-    f.get_void_result();
-  }
-  // TODO: to be removed when we have attention layers
-  // Init y_grad for the decoder lstm nodes
-  for (PointInRectIterator<1> it(part_rect); it(); it++) {
-    int idx = 0;
-    TaskLauncher launcher(ZERO_3D_INIT_TASK_ID,
-                          TaskArgument(NULL, 0),
-                          Predicate::TRUE_PRED,
-                          0,
-                          RnnMapper::assign_to_gpu(0));
-    DomainPoint dp(*it);
-    for (int i = 0; i < nodes_per_layer; i++) {
-      LSTMTensors top_lstm = lstm[config.numLayers - 1][i];
-      LogicalRegion y_grad = runtime->get_logical_subregion_by_color(
-          top_lstm.x.partition_grad, dp);
-      launcher.add_region_requirement(RegionRequirement(
-          y_grad, WRITE_ONLY, EXCLUSIVE, top_lstm.x.region_grad));
-      launcher.add_field(idx++, FID_DATA);
-    }
-    Future f = runtime->execute_task(ctx, launcher);
-    f.get_void_result();
-  }
-  // Init shared variables
-  for (int i = 0; i < sharedVariables.size(); i++) {
-    init_shared_variable(sharedVariables[i]);
-  }
-  for (size_t i = 0; i < layers.size(); i++) {
-    layers[i]->init(*this);
-  }
-}
-
-void RnnModel::zero_3d_init_task(Task const *task,
-                                 std::vector<PhysicalRegion> const &regions,
-                                 Context ctx,
-                                 Runtime *runtime) {
-  for (int i = 0; i < task->regions.size(); i++) {
-    AccessorWO<float, 3> const acc_w(regions[i], FID_DATA);
-    Rect<3> rect_w = runtime->get_index_space_domain(
-        ctx, task->regions[i].region.get_index_space());
-    assert(acc_w.accessor.is_dense_arbitrary(rect_w));
-    float *w_ptr = acc_w.ptr(rect_w.lo);
-    assign_kernel<<<GET_BLOCKS(rect_w.volume()), CUDA_NUM_THREADS>>>(
-        w_ptr, rect_w.volume(), 0.0f);
-  }
-}
-
-void RnnModel::zero_2d_init_task(Task const *task,
-                                 std::vector<PhysicalRegion> const &regions,
-                                 Context ctx,
-                                 Runtime *runtime) {
-  for (int i = 0; i < task->regions.size(); i++) {
-    AccessorWO<float, 2> const acc_w(regions[i], FID_DATA);
-    Rect<2> rect_w = runtime->get_index_space_domain(
-        ctx, task->regions[i].region.get_index_space());
-    assert(acc_w.accessor.is_dense_arbitrary(rect_w));
-    float *w_ptr = acc_w.ptr(rect_w.lo);
-    assign_kernel<<<GET_BLOCKS(rect_w.volume()), CUDA_NUM_THREADS>>>(
-        w_ptr, rect_w.volume(), 0.0f);
-  }
-}
-
-void RnnModel::zero_1d_init_task(Task const *task,
-                                 std::vector<PhysicalRegion> const &regions,
-                                 Context ctx,
-                                 Runtime *runtime) {
-  for (int i = 0; i < task->regions.size(); i++) {
-    AccessorWO<float, 1> const acc_w(regions[i], FID_DATA);
-    Rect<1> rect_w = runtime->get_index_space_domain(
-        ctx, task->regions[i].region.get_index_space());
-    assert(acc_w.accessor.is_dense_arbitrary(rect_w));
-    float *w_ptr = acc_w.ptr(rect_w.lo);
-    assign_kernel<<<GET_BLOCKS(rect_w.volume()), CUDA_NUM_THREADS>>>(
-        w_ptr, rect_w.volume(), 0.0f);
-  }
-}
-
-void RnnModel::dummy_task(Task const *task,
-                          std::vector<PhysicalRegion> const &regions,
-                          Context ctx,
-                          Runtime *runtime) {}
-
-void RnnModel::forward() {
-  config.iterator++;
-  Context ctx = config.lg_ctx;
-  Runtime *runtime = config.lg_hlr;
-  // Step 1: launch dummy tasks to prefetch shared variables
-  for (size_t i = 0; i < sharedVariables.size(); i++) {
-    for (int n = 0; n < config.numNodes; n++) {
-      if (sharedVariables[i].masterOnNode[n] != MASTER_NOT_ASSIGNED) {
-        int gpuId = sharedVariables[i].masterOnNode[n];
-        TaskLauncher launcher(DUMMY_TASK_ID,
-                              TaskArgument(NULL, 0),
-                              Predicate::TRUE_PRED,
-                              0,
-                              RnnMapper::assign_to_gpu(gpuId));
-        launcher.add_region_requirement(
-            RegionRequirement(sharedVariables[i].region,
-                              READ_ONLY,
-                              EXCLUSIVE,
-                              sharedVariables[i].region));
-        launcher.add_field(0, FID_DATA);
-        runtime->execute_task(ctx, launcher);
-      }
-    }
-  }
-  runtime->issue_mapping_fence(ctx);
-  // Step 2: zero gradients
-  for (size_t i = 0; i < sharedVariables.size(); i++) {
-    for (int j = 0; j < config.workersPerNode * config.numNodes; j++) {
-      if (sharedVariables[i].gradients[j] != LogicalRegion::NO_REGION) {
-        TaskLauncher launcher(ZERO_1D_INIT_TASK_ID,
-                              TaskArgument(NULL, 0),
-                              Predicate::TRUE_PRED,
-                              0,
-                              RnnMapper::assign_to_gpu(j));
-        LogicalRegion gradient = sharedVariables[i].gradients[j];
-        launcher.add_region_requirement(
-            RegionRequirement(gradient, WRITE_ONLY, EXCLUSIVE, gradient));
-        launcher.add_field(0, FID_DATA);
-        runtime->execute_task(ctx, launcher);
-      }
-    }
-  }
-  // Step 3: launch forward tasks
-  for (size_t i = 0; i < layers.size(); i++) {
-    layers[i]->forward(*this);
-  }
-}
-
-void RnnModel::backward() {
-  for (int i = layers.size() - 1; i >= 0; i--) {
-    layers[i]->backward(*this);
-  }
-}
-
-void RnnModel::update() {
-  for (int i = sharedVariables.size() - 1; i >= 0; i--) {
-    update_shared_variable(sharedVariables[i]);
-  }
-}
-
-/*
-  regions[0](O): w
-*/
-void RnnModel::params_init_task(Task const *task,
-                                std::vector<PhysicalRegion> const &regions,
-                                Context ctx,
-                                Runtime *runtime) {
-  assert(regions.size() == 1);
-  assert(task->regions.size() == 1);
-  float value = *((float *)task->args);
-  AccessorWO<float, 1> const acc_w(regions[0], FID_DATA);
-  Rect<1> rect_w = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  assert(acc_w.accessor.is_dense_arbitrary(rect_w));
-  float *w_ptr = acc_w.ptr(rect_w.lo);
-  cudaStream_t stream;
-  checkCUDA(cudaStreamCreate(&stream));
-  curandGenerator_t genGPU;
-  curandCreateGenerator(&genGPU, CURAND_RNG_PSEUDO_DEFAULT);
-  curandSetStream(genGPU, stream);
-  curandSetPseudoRandomGeneratorSeed(genGPU, 1234LL);
-  curandGenerateUniform(genGPU, w_ptr, rect_w.volume());
-  checkCUDA(cudaDeviceSynchronize());
-  scale_kernel<<<GET_BLOCKS(rect_w.volume()), CUDA_NUM_THREADS>>>(
-      w_ptr, rect_w.volume(), -value, value);
-  // assign_kernel<<<GET_BLOCKS(rect_w.volume()), CUDA_NUM_THREADS>>>(
-  //   w_ptr, rect_w.volume(), value);
-}
-
-void RnnModel::init_shared_variable(SharedVariable params) {
-  Context ctx = config.lg_ctx;
-  Runtime *runtime = config.lg_hlr;
-  float value = 0.1f;
-  TaskLauncher launcher(PARAMS_INIT_TASK_ID,
-                        TaskArgument(&value, sizeof(value)),
-                        Predicate::TRUE_PRED,
-                        0 /*MapperID*/,
-                        RnnMapper::assign_to_gpu(params.masterOnNode[0]));
-  launcher.add_region_requirement(
-      RegionRequirement(params.region, WRITE_ONLY, EXCLUSIVE, params.region));
-  launcher.add_field(0, FID_DATA);
-  Future f = runtime->execute_task(ctx, launcher);
-  f.get_void_result();
-}
-
-/*
-  regions[0]: (I/O): w
-  regions[1..]: (O): w_grad
- */
-void RnnModel::params_update_task(Task const *task,
-                                  std::vector<PhysicalRegion> const &regions,
-                                  Context ctx,
-                                  Runtime *runtime) {
-  assert(regions.size() == task->regions.size());
-  float rate = *((float *)task->args);
-  AccessorRW<float, 1> const acc_w(regions[0], FID_DATA);
-  Rect<1> rect_w = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  assert(acc_w.accessor.is_dense_arbitrary(rect_w));
-  for (int i = 1; i < regions.size(); i++) {
-    AccessorRO<float, 1> const acc_w_grad(regions[i], FID_DATA);
-    Rect<1> rect_w_grad = runtime->get_index_space_domain(
-        ctx, task->regions[i].region.get_index_space());
-    assert(rect_w.contains(rect_w_grad));
-    assert(acc_w_grad.accessor.is_dense_arbitrary(rect_w_grad));
-    float *w_ptr = acc_w.ptr(rect_w_grad.lo);
-    float const *w_grad_ptr = acc_w_grad.ptr(rect_w_grad.lo);
-    apply_add_with_scale<<<GET_BLOCKS(rect_w_grad.volume()),
-                           CUDA_NUM_THREADS>>>(
-        w_ptr, w_grad_ptr, rect_w_grad.volume(), rate);
-#ifdef PRINT_INTERMEDIATE_RESULT
-    print_tensor<1, float>(w_grad_ptr, rect_w_grad, "partial_w");
-#endif
-  }
-#ifdef PRINT_INTERMEDIATE_RESULT
-  float *w_ptr = acc_w.ptr(rect_w.lo);
-  print_tensor<1, float>(w_ptr, rect_w, "final_w");
-#endif
-}
-
-void RnnModel::update_shared_variable(SharedVariable params) {
-  Context ctx = config.lg_ctx;
-  Runtime *runtime = config.lg_hlr;
-  // for (int i = 0; i < config.workersPerNode; i++)
-  //   if (params.gradients[i] != LogicalRegion::NO_REGION) {
-  //     Rect<1> rect =
-  //       runtime->get_index_space_domain(ctx,
-  //       params.gradients[i].get_index_space());
-  //     printf("rect[%d]: lo(%d) hi(%d)\n", i, rect.lo[0], rect.hi[0]);
-  //   }
-  float rate = 1.0f;
-  for (int node = 0; node < config.numNodes; node++) {
-    if (params.masterOnNode[node] != MASTER_NOT_ASSIGNED) {
-      TaskLauncher launcher(
-          PARAMS_UPD_TASK_ID,
-          TaskArgument(&rate, sizeof(rate)),
-          Predicate::TRUE_PRED,
-          0 /*MapperID*/,
-          RnnMapper::assign_to_gpu(params.masterOnNode[node]));
-      LogicalRegion masterGrad = params.gradients[params.masterOnNode[node]];
-      assert(masterGrad != LogicalRegion::NO_REGION);
-      launcher.add_region_requirement(
-          RegionRequirement(masterGrad, READ_WRITE, EXCLUSIVE, masterGrad));
-      launcher.add_field(0, FID_DATA);
-      int cnt = 1;
-      for (int idx = 0; idx < config.workersPerNode; idx++) {
-        int gpuIdx = node * config.workersPerNode + idx;
-        if (gpuIdx == params.masterOnNode[node]) {
-          continue;
-        }
-        LogicalRegion grad = params.gradients[gpuIdx];
-        if (grad == LogicalRegion::NO_REGION) {
-          continue;
-        }
-        launcher.add_region_requirement(
-            RegionRequirement(grad, READ_ONLY, EXCLUSIVE, grad));
-        launcher.add_field(cnt++, FID_DATA);
-      }
-      // printf("Step 1: cnt = %d\n", cnt);
-      runtime->execute_task(ctx, launcher);
-    }
-  }
-  rate = -0.1f;
-  TaskLauncher launcher(PARAMS_UPD_TASK_ID,
-                        TaskArgument(&rate, sizeof(rate)),
-                        Predicate::TRUE_PRED,
-                        0 /*MapperID*/,
-                        RnnMapper::assign_to_gpu(params.masterOnNode[0]));
-  launcher.add_region_requirement(
-      RegionRequirement(params.region, READ_WRITE, EXCLUSIVE, params.region));
-  launcher.add_field(0, FID_DATA);
-  int cnt = 1;
-  for (int node = 0; node < config.numNodes; node++) {
-    if (params.masterOnNode[node] != MASTER_NOT_ASSIGNED) {
-      int gpuIdx = params.masterOnNode[node];
-      LogicalRegion grad = params.gradients[gpuIdx];
-      assert(grad != LogicalRegion::NO_REGION);
-      launcher.add_region_requirement(
-          RegionRequirement(grad, READ_ONLY, EXCLUSIVE, grad));
-      launcher.add_field(cnt++, FID_DATA);
-    }
-  }
-  // printf("Step 2: cnt = %d\n", cnt);
-  runtime->execute_task(ctx, launcher);
-}
diff --git a/nmt/rnn.h b/nmt/rnn.h
deleted file mode 100644
index 001e7e06e2..0000000000
--- a/nmt/rnn.h
+++ /dev/null
@@ -1,438 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#ifndef _LEGION_RNN_H_
-#define _LEGION_RNN_H_
-
-#include "ops.h"
-
-#define MAX_SEQ_LENGTH 100
-#define MAX_NUM_LAYERS 4
-#define LSTM_PER_NODE_LENGTH 10
-#define MASTER_NOT_ASSIGNED -1
-// #define PRINT_INTERMEDIATE_RESULT
-
-struct RnnConfig {
-  Context lg_ctx;
-  HighLevelRuntime *lg_hlr;
-  FieldSpace field_space;
-  int batchSize, hiddenSize, embedSize, vocabSize;
-  int numLayers, seqLength, numParts;
-  int numNodes, workersPerNode;
-  int iterator;
-};
-
-struct SharedVariable {
-  static const SharedVariable NO_VARIABLE; /*empty SharedVariable handle*/
-  LogicalRegion region, gradients[MAX_NUM_WORKERS];
-  LogicalRegion subregions[2 * MAX_NUM_PARTS];
-  int masterOnNode[MAX_NUM_WORKERS];
-  SharedVariable() {
-    region = LogicalRegion::NO_REGION;
-    for (int i = 0; i < MAX_NUM_WORKERS; i++) {
-      gradients[i] = LogicalRegion::NO_REGION;
-    }
-    for (int i = 0; i < 2 * MAX_NUM_PARTS; i++) {
-      subregions[i] = LogicalRegion::NO_REGION;
-    }
-    for (int i = 0; i < MAX_NUM_WORKERS; i++) {
-      masterOnNode[i] = MASTER_NOT_ASSIGNED;
-    }
-  }
-};
-
-struct ParallelConfig {
-  int nDims, dim[MAX_DIM];
-  int gpu[MAX_NUM_WORKERS];
-};
-
-struct GlobalConfig {
-  ParallelConfig linear[MAX_SEQ_LENGTH];
-  ParallelConfig lstm[MAX_NUM_LAYERS][2 * MAX_SEQ_LENGTH];
-  ParallelConfig embed[2 * MAX_SEQ_LENGTH];
-  ParallelConfig softmax[MAX_SEQ_LENGTH];
-};
-
-class RnnModel;
-
-class RnnOp {
-public:
-  RnnOp(Tensor input, ParallelConfig pc, SharedVariable _params);
-  RnnOp(Tensor t1,
-        Tensor t2,
-        Tensor t3,
-        ParallelConfig pc,
-        SharedVariable _params);
-  RnnOp(int num, Tensor *inputs);
-  virtual void init(RnnModel const &) = 0;
-
-  virtual void forward(RnnModel const &) = 0;
-
-  virtual void backward(RnnModel const &) = 0;
-
-  virtual void update(RnnModel const &) = 0;
-
-public:
-  Tensor outputs[MAX_NUM_OUTPUTS];
-  Tensor inputs[MAX_NUM_INPUTS];
-  OpMeta *meta[MAX_NUM_WORKERS];
-  ParallelConfig paraConfig;
-  SharedVariable params;
-};
-
-struct LSTMTensors {
-  Tensor x, hx, cx;
-};
-
-class RnnModel {
-public:
-  RnnModel(int batch_size,
-           int numLayers,
-           int seqLength,
-           int hidden_size,
-           int embed_size,
-           int vocab_size,
-           int num_parts,
-           int num_nodes,
-           int num_workers_per_node,
-           GlobalConfig global,
-           Context ctx,
-           Runtime *runtime);
-
-  void init();
-
-  void forward();
-
-  void backward();
-
-  void update();
-
-  void init_shared_variable(SharedVariable params);
-
-  void update_shared_variable(SharedVariable params);
-
-  static void word_init_task(Task const *task,
-                             std::vector<PhysicalRegion> const &regions,
-                             Context ctx,
-                             HighLevelRuntime *runtime);
-
-  static void zero_1d_init_task(Task const *task,
-                                std::vector<PhysicalRegion> const &regions,
-                                Context ctx,
-                                HighLevelRuntime *runtime);
-
-  static void zero_2d_init_task(Task const *task,
-                                std::vector<PhysicalRegion> const &regions,
-                                Context ctx,
-                                HighLevelRuntime *runtime);
-
-  static void zero_3d_init_task(Task const *task,
-                                std::vector<PhysicalRegion> const &regions,
-                                Context ctx,
-                                HighLevelRuntime *runtime);
-
-  static void dummy_task(Task const *task,
-                         std::vector<PhysicalRegion> const &regions,
-                         Context ctx,
-                         HighLevelRuntime *runtime);
-
-  static void params_init_task(Task const *task,
-                               std::vector<PhysicalRegion> const &regions,
-                               Context ctx,
-                               HighLevelRuntime *runtime);
-
-  static void params_update_task(Task const *task,
-                                 std::vector<PhysicalRegion> const &regions,
-                                 Context ctx,
-                                 HighLevelRuntime *runtime);
-
-  LSTMTensors add_lstm_node(
-      Tensor x, Tensor hx, Tensor cx, ParallelConfig pc, SharedVariable params);
-
-  Tensor add_linear_node(Tensor x,
-                         int output_size,
-                         ParallelConfig pc,
-                         SharedVariable params);
-
-  Tensor add_embed_node(Tensor x,
-                        int vocab_size,
-                        int output_size,
-                        ParallelConfig pc,
-                        SharedVariable params);
-
-  Tensor add_softmaxDP_node(Tensor x, Tensor label, ParallelConfig pc);
-
-public:
-  RnnConfig config;
-  std::vector<RnnOp *> layers;
-  std::vector<SharedVariable> sharedVariables;
-  DnnHandle dnn_handlers[MAX_NUM_WORKERS];
-  Tensor srcs[MAX_SEQ_LENGTH], dsts[MAX_SEQ_LENGTH];
-  LSTMTensors zero[MAX_NUM_LAYERS];
-  LSTMTensors lstm[MAX_NUM_LAYERS][2 * MAX_SEQ_LENGTH];
-  IndexSpaceT<1> part_is;
-};
-
-/*
- * For now, every single LSTM cell with 1 word and 1 layer is a
- * LSTM operation.
- */
-class LSTM : public RnnOp {
-public:
-  LSTM(RnnConfig config,
-       Tensor x,
-       Tensor hx,
-       Tensor cx,
-       int batch_size,
-       int input_size,
-       int output_size,
-       ParallelConfig pc,
-       SharedVariable params);
-
-  void init(RnnModel const &);
-
-  void forward(RnnModel const &);
-
-  void backward(RnnModel const &);
-
-  void update(RnnModel const &);
-
-  static OpMeta *init_task(Task const *task,
-                           std::vector<PhysicalRegion> const &regions,
-                           Context ctx,
-                           Runtime *runtime);
-
-  static void forward_task(Task const *task,
-                           std::vector<PhysicalRegion> const &regions,
-                           Context ctx,
-                           Runtime *runtime);
-
-  static void backward_task(Task const *task,
-                            std::vector<PhysicalRegion> const &regions,
-                            Context ctx,
-                            HighLevelRuntime *runtime);
-
-  static void update_task(Task const *task,
-                          std::vector<PhysicalRegion> const &regions,
-                          Context ctx,
-                          HighLevelRuntime *runtime);
-
-public:
-  int batch_size, input_size, output_size;
-  Rect<1> part_rect;
-};
-
-class LSTMMeta : public OpMeta {
-public:
-  LSTMMeta(DnnHandle handle) : OpMeta(handle){};
-  cudnnRNNDescriptor_t rnnDesc;
-  cudnnDropoutDescriptor_t dropoutDesc;
-  cudnnTensorDescriptor_t xDescs[LSTM_PER_NODE_LENGTH],
-      yDescs[LSTM_PER_NODE_LENGTH], cxDesc, hxDesc, cyDesc, hyDesc;
-  cudnnFilterDescriptor_t wDesc;
-  size_t reserveSpaceSize;
-  void *reserveSpace;
-  bool profiling_runtime;
-};
-
-class Linear : public RnnOp {
-public:
-  Linear(RnnConfig config,
-         Tensor input,
-         int output_channels,
-         ParallelConfig pc,
-         SharedVariable params,
-         IndexSpaceT<1> input_part_is);
-
-  void init(RnnModel const &);
-
-  void forward(RnnModel const &);
-
-  void backward(RnnModel const &);
-
-  void update(RnnModel const &);
-
-  static OpMeta *init_task(Task const *task,
-                           std::vector<PhysicalRegion> const &regions,
-                           Context ctx,
-                           Runtime *runtime);
-
-  static void forward_task(Task const *task,
-                           std::vector<PhysicalRegion> const &regions,
-                           Context ctx,
-                           Runtime *runtime);
-
-  static void backward_task(Task const *task,
-                            std::vector<PhysicalRegion> const &regions,
-                            Context ctx,
-                            HighLevelRuntime *runtime);
-
-  static void backward2_task(Task const *task,
-                             std::vector<PhysicalRegion> const &regions,
-                             Context ctx,
-                             HighLevelRuntime *runtime);
-
-  static void update_task(Task const *task,
-                          std::vector<PhysicalRegion> const &regions,
-                          Context ctx,
-                          HighLevelRuntime *runtime);
-
-public:
-  int batch_size, input_size, output_size;
-  Tensor replica;
-  // each replica_sub_lps[i] is a disjoint partition
-  LogicalPartition replica_sub_lps[MAX_NUM_WORKERS];
-  // input_lp may be an aliased partition if num_par_c > 1
-  LogicalPartition input_lp;
-  Rect<2> part_rect;
-  Rect<1> input_part_rect;
-};
-
-class LinearMeta : public OpMeta {
-public:
-  LinearMeta(DnnHandle handle) : OpMeta(handle){};
-  float *one_ptr;
-  bool profiling_runtime;
-};
-
-class Embed : public RnnOp {
-public:
-  Embed(RnnConfig config,
-        Tensor input,
-        int embed_size,
-        int output_size,
-        ParallelConfig pc,
-        SharedVariable params);
-
-  void init(RnnModel const &);
-
-  void forward(RnnModel const &);
-
-  void backward(RnnModel const &);
-
-  void update(RnnModel const &);
-
-  static OpMeta *init_task(Task const *task,
-                           std::vector<PhysicalRegion> const &regions,
-                           Context ctx,
-                           Runtime *runtime);
-
-  static void forward_task(Task const *task,
-                           std::vector<PhysicalRegion> const &regions,
-                           Context ctx,
-                           Runtime *runtime);
-
-  static void backward_task(Task const *task,
-                            std::vector<PhysicalRegion> const &regions,
-                            Context ctx,
-                            HighLevelRuntime *runtime);
-
-  static void update_task(Task const *task,
-                          std::vector<PhysicalRegion> const &regions,
-                          Context ctx,
-                          HighLevelRuntime *runtime);
-
-public:
-  int batchSize, outputSize, vocabSize;
-  Rect<1> part_rect;
-};
-
-class EmbedMeta : public OpMeta {
-public:
-  EmbedMeta(DnnHandle handle) : OpMeta(handle){};
-  bool profiling_runtime;
-};
-
-/*class Softmax : public RnnOp {
-public:
-  Softmax(RnnConfig config, Tensor input, Tensor output,
-          ParallelConfig pc);
-
-  void init(const RnnModel&);
-
-  void forward(const RnnModel&);
-
-  void backward(const RnnModel&);
-
-  void update(const RnnModel&);
-
-  static OpMeta* init_task(const Task *task,
-                           const std::vector<PhysicalRegion> &regions,
-                           Context ctx, Runtime *runtime);
-
-  static void forward_task(const Task *task,
-                           const std::vector<PhysicalRegion> &regions,
-                           Context ctx, Runtime *runtime);
-
-  static void backward_task(const Task *task,
-                            const std::vector<PhysicalRegion> &regions,
-                            Context ctx, HighLevelRuntime *runtime);
-public:
-  Rect<1> part_rect;
-};
-
-class SoftmaxMeta : public OpMeta {
-public:
-  SoftmaxMeta(DnnHandle handle) : OpMeta(handle) {};
-  size_t storage_bytes;
-  void* storage;
-  int* offsets;
-  bool profiling_runtime;
-};
-*/
-class SoftmaxDP : public RnnOp {
-public:
-  SoftmaxDP(RnnConfig config, Tensor logit, Tensor label, ParallelConfig pc);
-
-  void init(RnnModel const &);
-
-  void forward(RnnModel const &);
-
-  void backward(RnnModel const &);
-
-  void update(RnnModel const &);
-
-  static OpMeta *init_task(Task const *task,
-                           std::vector<PhysicalRegion> const &regions,
-                           Context ctx,
-                           Runtime *runtime);
-
-  static void forward_task(Task const *task,
-                           std::vector<PhysicalRegion> const &regions,
-                           Context ctx,
-                           Runtime *runtime);
-
-  static void backward_task(Task const *task,
-                            std::vector<PhysicalRegion> const &regions,
-                            Context ctx,
-                            HighLevelRuntime *runtime);
-
-public:
-  Rect<1> part_rect;
-  Tensor label;
-  LogicalPartition logit_lp, logit_grad_lp;
-};
-
-class SoftmaxDPMeta : public OpMeta {
-public:
-  SoftmaxDPMeta(DnnHandle handle) : OpMeta(handle){};
-#ifndef DISABLE_COMPUTATION
-  cudnnTensorDescriptor_t inputTensor;
-#endif
-  int batchSize;
-  bool profiling_runtime;
-};
-
-#endif //_LEGION_RNN_H_
diff --git a/nmt/rnn_mapper.cc b/nmt/rnn_mapper.cc
deleted file mode 100644
index 9a50d2b3e0..0000000000
--- a/nmt/rnn_mapper.cc
+++ /dev/null
@@ -1,138 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "rnn_mapper.h"
-#define ASSIGN_TO_GPU_MASK 0xABCD0000
-
-RnnMapper::RnnMapper(MapperRuntime *rt,
-                     Machine machine,
-                     Processor local,
-                     char const *mapper_name,
-                     std::vector<Processor> *_gpus,
-                     std::map<Processor, Memory> *_proc_fbmems,
-                     std::vector<Processor> *_cpus)
-    : DefaultMapper(rt, machine, local, mapper_name), gpus(*_gpus),
-      proc_fbmems(*_proc_fbmems), cpus(*_cpus) {}
-
-void RnnMapper::select_task_options(const MapperContext ctx,
-                                    Task const &task,
-                                    TaskOptions &output) {
-  if ((task.tag & ASSIGN_TO_GPU_MASK) == ASSIGN_TO_GPU_MASK) {
-    output.inline_task = false;
-    output.stealable = false;
-    output.map_locally = true;
-    unsigned long gpuId = task.tag ^ ASSIGN_TO_GPU_MASK;
-    output.initial_proc = gpus[gpuId % gpus.size()];
-  } else {
-    DefaultMapper::select_task_options(ctx, task, output);
-  }
-}
-
-#ifdef DEADCODE
-void RnnMapper::map_task(const MapperContext ctx,
-                         Task const &task,
-                         MapTaskInput const &input,
-                         MapTaskOutput &output) {
-  printf("Task(%s %zx):", task.get_task_name(), task.tag);
-  for (size_t i = 0; i < input.valid_instances.size(); i++) {
-    printf(" (");
-    for (size_t j = 0; j < input.valid_instances[i].size(); j++) {
-      printf("%zx ", input.valid_instances[i][j].get_location().id);
-    }
-    printf(")");
-  }
-  printf("\n");
-  DefaultMapper::map_task(ctx, task, input, output);
-}
-
-void RnnMapper::select_task_sources(const MapperContext ctx,
-                                    Task const &task,
-                                    SelectTaskSrcInput const &input,
-                                    SelectTaskSrcOutput &output) {
-  printf("Slct(%s %zx)[%d]:",
-         task.get_task_name(),
-         task.tag,
-         input.region_req_index);
-  for (size_t i = 0; i < input.source_instances.size(); i++) {
-    printf(" %zx", input.source_instances[i].get_location().id);
-  }
-  DefaultMapper::select_task_sources(ctx, task, input, output);
-  printf(" chosen = %zx\n", output.chosen_ranking.front().get_location().id);
-}
-#endif
-
-void update_mappers(Machine machine,
-                    Runtime *runtime,
-                    std::set<Processor> const &local_procs) {
-  std::vector<Processor> *gpus = new std::vector<Processor>();
-  std::map<Processor, Memory> *proc_fbmems = new std::map<Processor, Memory>();
-  std::vector<Processor> *cpus = new std::vector<Processor>();
-  // std::map<Processor, Memory>* proc_zcmems = new std::map<Processor,
-  // Memory>();
-  std::vector<Machine::ProcessorMemoryAffinity> proc_mem_affinities;
-  machine.get_proc_mem_affinity(proc_mem_affinities);
-  Machine::ProcessorQuery proc_query(machine);
-  for (Machine::ProcessorQuery::iterator it = proc_query.begin();
-       it != proc_query.end();
-       it++) {
-    if (it->kind() == Processor::TOC_PROC) {
-      gpus->push_back(*it);
-      Machine::MemoryQuery fb_query(machine);
-      fb_query.only_kind(Memory::GPU_FB_MEM);
-      fb_query.best_affinity_to(*it);
-      assert(fb_query.count() == 1);
-      (*proc_fbmems)[*it] = *(fb_query.begin());
-    } else if (it->kind() == Processor::LOC_PROC) {
-      cpus->push_back(*it);
-    }
-  }
-
-  /*
-    for (unsigned idx = 0; idx < proc_mem_affinities.size(); ++idx) {
-      Machine::ProcessorMemoryAffinity& affinity = proc_mem_affinities[idx];
-      if (affinity.p.kind() == Processor::TOC_PROC) {
-        if (affinity.m.kind() == Memory::GPU_FB_MEM) {
-          (*proc_fbmems)[affinity.p] = affinity.m;
-        }
-        else if (affinity.m.kind() == Memory::Z_COPY_MEM) {
-          (*proc_zcmems)[affinity.p] = affinity.m;
-        }
-      }
-    }
-
-    for (std::map<Processor, Memory>::iterator it = proc_fbmems->begin();
-         it != proc_fbmems->end(); it++) {
-      gpus->push_back(it->first);
-    }
-  */
-
-  for (std::set<Processor>::const_iterator it = local_procs.begin();
-       it != local_procs.end();
-       it++) {
-    RnnMapper *mapper = new RnnMapper(runtime->get_mapper_runtime(),
-                                      machine,
-                                      *it,
-                                      "rnn_mapper",
-                                      gpus,
-                                      proc_fbmems,
-                                      cpus);
-    runtime->replace_default_mapper(mapper, *it);
-  }
-}
-
-MappingTagID RnnMapper::assign_to_gpu(int idx) {
-  assert(idx <= 0xFFFF);
-  return (ASSIGN_TO_GPU_MASK | idx);
-}
diff --git a/nmt/rnn_mapper.h b/nmt/rnn_mapper.h
deleted file mode 100644
index 357eab97ba..0000000000
--- a/nmt/rnn_mapper.h
+++ /dev/null
@@ -1,63 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#ifndef __RNN_MAPPER_H__
-#define __RNN_MAPPER_H__
-
-#include "default_mapper.h"
-#include "legion.h"
-#include "ops.h"
-
-using namespace Legion;
-using namespace Legion::Mapping;
-
-class RnnMapper : public DefaultMapper {
-public:
-  RnnMapper(MapperRuntime *rt,
-            Machine machine,
-            Processor local,
-            char const *mapper_name,
-            std::vector<Processor> *gpus,
-            std::map<Processor, Memory> *proc_fbmems,
-            std::vector<Processor> *cpus);
-
-public:
-  virtual void select_task_options(const MapperContext ctx,
-                                   Task const &task,
-                                   TaskOptions &output);
-  // virtual void slice_task(const MapperContext ctx,
-  //                       const Task& task,
-  //                     const SliceTaskInput& input,
-  //                   SliceTaskOutput& output);
-  // virtual void map_task(const MapperContext ctx,
-  //                     const Task& task,
-  //                   const MapTaskInput& input,
-  //                 MapTaskOutput& output);
-  // virtual void select_task_sources(const MapperContext ctx,
-  //                                const Task& task,
-  //                              const SelectTaskSrcInput& input,
-  //                            SelectTaskSrcOutput& output);
-  static MappingTagID assign_to_gpu(int gpuIdx);
-
-protected:
-  std::vector<Processor> &gpus;
-  std::map<Processor, Memory> &proc_fbmems;
-  std::vector<Processor> &cpus;
-};
-
-void update_mappers(Machine machine,
-                    Runtime *rt,
-                    std::set<Processor> const &local_procs);
-#endif
diff --git a/nmt/softmax_data_parallel.cu b/nmt/softmax_data_parallel.cu
deleted file mode 100644
index 9b41a332ec..0000000000
--- a/nmt/softmax_data_parallel.cu
+++ /dev/null
@@ -1,392 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "../cnn_helper.h"
-#include "rnn.h"
-#include "rnn_mapper.h"
-
-struct SoftmaxDPInitParams {
-  DnnHandle handle;
-  int batchSize;
-  bool profiling;
-};
-
-Tensor RnnModel::add_softmaxDP_node(Tensor logit,
-                                    Tensor label,
-                                    ParallelConfig pc) {
-  assert(logit.numDim == 3);
-  assert(logit.adim[2] == LSTM_PER_NODE_LENGTH);
-  assert(logit.pdim[2] == LSTM_PER_NODE_LENGTH);
-  SoftmaxDP *node = new SoftmaxDP(config, logit, label, pc);
-  layers.push_back(node);
-  return node->outputs[0];
-}
-
-SoftmaxDP::SoftmaxDP(RnnConfig config,
-                     Tensor logit,
-                     Tensor _label,
-                     ParallelConfig pc)
-    : RnnOp(logit, pc, SharedVariable::NO_VARIABLE), label(_label) {
-  Context ctx = config.lg_ctx;
-  Runtime *runtime = config.lg_hlr;
-  assert(pc.nDims == 1);
-  int num_par_n = pc.dim[0];
-  {
-    Rect<1> rect(Point<1>(0), Point<1>(num_par_n - 1));
-    part_rect = rect;
-  }
-  IndexSpaceT<1> part_is = runtime->create_index_space(ctx, part_rect);
-  int batch_size = logit.adim[1];
-  int output_size = logit.adim[0];
-  FieldSpace fs = config.field_space;
-  Rect<3, coord_t> y_rect(
-      Point<3>(0, 0, 0),
-      Point<3>(output_size - 1, batch_size - 1, LSTM_PER_NODE_LENGTH - 1));
-  IndexSpaceT<3> y_is = runtime->create_index_space(ctx, y_rect);
-  LogicalRegion y_lr = runtime->create_logical_region(ctx, y_is, fs);
-  LogicalRegion y_grad_lr = runtime->create_logical_region(ctx, y_is, fs);
-  assert(batch_size % num_par_n == 0);
-  int extent_n = batch_size / num_par_n;
-  Rect<3, coord_t> extent(
-      Point<3>(0, 0, 0),
-      Point<3>(output_size - 1, extent_n - 1, LSTM_PER_NODE_LENGTH - 1));
-  Transform<3, 1, coord_t> trans;
-  trans[0][0] = 0;
-  trans[1][0] = extent_n;
-  trans[2][0] = 0;
-  IndexPartition y_ip = runtime->create_partition_by_restriction(
-      ctx, y_is, part_is, trans, extent);
-  assert(runtime->is_index_partition_disjoint(ctx, y_ip));
-  assert(runtime->is_index_partition_complete(ctx, y_ip));
-  LogicalPartition y_lp = runtime->get_logical_partition(ctx, y_lr, y_ip);
-  LogicalPartition y_grad_lp =
-      runtime->get_logical_partition(ctx, y_grad_lr, y_ip);
-  outputs[0].numDim = 3;
-  outputs[0].adim[0] = output_size;
-  outputs[0].adim[1] = batch_size;
-  outputs[0].adim[2] = LSTM_PER_NODE_LENGTH;
-  outputs[0].pdim[0] = output_size;
-  outputs[0].pdim[1] = extent_n;
-  outputs[0].pdim[2] = LSTM_PER_NODE_LENGTH;
-  outputs[0].region = y_lr;
-  outputs[0].partition = y_lp;
-  outputs[0].region_grad = y_grad_lr;
-  outputs[0].partition_grad = y_grad_lp;
-  // Every partition reads all input_channels
-  // Use the same partitioning as outputs
-  // if (inputs[0].pdim[0] == outputs[0].pdim[0]
-  //  && inputs[0].pdim[1] == outputs[0].pdim[1]) {
-  //  logit_lp = inputs[0].partition;
-  //  logit_grad_lp = inputs[0].partition_grad;
-  //} else {
-  IndexSpaceT<3> logit_is(inputs[0].region.get_index_space());
-  IndexPartition logit_ip = runtime->create_partition_by_restriction(
-      ctx, logit_is, part_is, trans, extent);
-  logit_lp = runtime->get_logical_partition(ctx, inputs[0].region, logit_ip);
-  logit_grad_lp =
-      runtime->get_logical_partition(ctx, inputs[0].region_grad, logit_ip);
-  //}
-}
-
-/*
-  regions[0](I): x
-  regions[1](O): y
-*/
-OpMeta *SoftmaxDP::init_task(Task const *task,
-                             std::vector<PhysicalRegion> const &regions,
-                             Context ctx,
-                             Runtime *runtime) {
-  assert(regions.size() == 2);
-  assert(task->regions.size() == 2);
-  SoftmaxDPInitParams const *softmaxDP = (SoftmaxDPInitParams *)task->args;
-  AccessorRO<float, 3> const acc_x(regions[0], FID_DATA);
-  AccessorWO<float, 3> const acc_y(regions[1], FID_DATA);
-  Rect<3> rect_x = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  Rect<3> rect_y = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  assert(acc_x.accessor.is_dense_arbitrary(rect_x));
-  assert(acc_y.accessor.is_dense_arbitrary(rect_y));
-  SoftmaxDPMeta *m = new SoftmaxDPMeta(softmaxDP->handle);
-  m->profiling_runtime = softmaxDP->profiling;
-  m->batchSize = softmaxDP->batchSize;
-#ifndef DISABLE_COMPUTATION
-  checkCUDNN(cudnnCreateTensorDescriptor(&m->inputTensor));
-  assert(rect_x == rect_y);
-  int input_c = rect_x.hi[0] - rect_x.lo[0] + 1;
-  int input_n = (rect_x.hi[1] - rect_x.lo[1] + 1) * LSTM_PER_NODE_LENGTH;
-  checkCUDNN(cudnnSetTensor4dDescriptor(m->inputTensor,
-                                        CUDNN_TENSOR_NCHW,
-                                        CUDNN_DATA_FLOAT,
-                                        input_n,
-                                        input_c,
-                                        1,
-                                        1));
-#endif
-  return m;
-}
-
-void SoftmaxDP::init(RnnModel const &model) {
-  Context ctx = model.config.lg_ctx;
-  Runtime *runtime = model.config.lg_hlr;
-  int idx = 0;
-  for (PointInRectIterator<1> it(part_rect); it(); it++, idx++) {
-    SoftmaxDPInitParams initParams;
-    initParams.handle = model.dnn_handlers[paraConfig.gpu[idx]];
-    initParams.batchSize = model.config.batchSize;
-    initParams.profiling = false;
-    TaskLauncher launcher(RNN_SOFTMAXDP_INIT_TASK_ID,
-                          TaskArgument(&initParams, sizeof(initParams)),
-                          Predicate::TRUE_PRED,
-                          0 /*MapperID*/,
-                          RnnMapper::assign_to_gpu(paraConfig.gpu[idx]));
-    DomainPoint dp(*it);
-    {
-      LogicalRegion x = runtime->get_logical_subregion_by_color(logit_lp, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(x, READ_ONLY, EXCLUSIVE, inputs[0].region));
-      launcher.add_field(0, FID_DATA);
-    }
-    {
-      LogicalRegion y =
-          runtime->get_logical_subregion_by_color(outputs[0].partition, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(y, WRITE_ONLY, EXCLUSIVE, outputs[0].region));
-      launcher.add_field(1, FID_DATA);
-    }
-    Future f = runtime->execute_task(ctx, launcher);
-    meta[idx] = f.get_result<OpMeta *>();
-  }
-}
-
-/*
-  regions[0](I): x
-  regions[1](O): y
-*/
-void SoftmaxDP::forward_task(Task const *task,
-                             std::vector<PhysicalRegion> const &regions,
-                             Context ctx,
-                             Runtime *runtime) {
-#ifndef DISABLE_COMPUTATION
-  assert(regions.size() == 2);
-  assert(task->regions.size() == 2);
-  float alpha = 1.0f, beta = 0.0f;
-  SoftmaxDPMeta const *m = *((SoftmaxDPMeta **)task->args);
-  AccessorRO<float, 3> const acc_x(regions[0], FID_DATA);
-  AccessorWO<float, 3> const acc_y(regions[1], FID_DATA);
-  Rect<3> rect_x = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  Rect<3> rect_y = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  assert(acc_x.accessor.is_dense_arbitrary(rect_x));
-  assert(acc_y.accessor.is_dense_arbitrary(rect_y));
-  float const *x_ptr = acc_x.ptr(rect_x.lo);
-  float *y_ptr = acc_y.ptr(rect_y.lo);
-
-  cudaEvent_t t_start, t_end;
-  if (m->profiling_runtime) {
-    cudaEventCreate(&t_start);
-    cudaEventCreate(&t_end);
-    cudaEventRecord(t_start);
-  }
-  cudaStream_t stream;
-  checkCUDA(cudaStreamCreate(&stream));
-  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
-  checkCUDNN(cudnnSoftmaxForward(m->handle.dnn,
-                                 CUDNN_SOFTMAX_ACCURATE,
-                                 CUDNN_SOFTMAX_MODE_CHANNEL,
-                                 &alpha,
-                                 m->inputTensor,
-                                 x_ptr,
-                                 &beta,
-                                 m->inputTensor,
-                                 y_ptr));
-  if (m->profiling_runtime) {
-    cudaEventRecord(t_end);
-    checkCUDA(cudaEventSynchronize(t_end));
-    float elapsed = 0;
-    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
-    cudaEventDestroy(t_start);
-    cudaEventDestroy(t_end);
-    printf("SoftmaxDP forward time = %.2fms\n", elapsed);
-  }
-#ifdef PRINT_INTERMEDIATE_RESULT
-  print_tensor<3, float>(y_ptr, rect_y, "softmax");
-#endif
-#endif
-}
-
-void SoftmaxDP::forward(RnnModel const &model) {
-  Context ctx = model.config.lg_ctx;
-  Runtime *runtime = model.config.lg_hlr;
-  int idx = 0;
-  for (PointInRectIterator<1> it(part_rect); it(); it++, idx++) {
-    OpMeta *mp = meta[idx];
-    TaskLauncher launcher(RNN_SOFTMAXDP_FWD_TASK_ID,
-                          TaskArgument(&mp, sizeof(OpMeta *)),
-                          Predicate::TRUE_PRED,
-                          0 /*MapperID*/,
-                          RnnMapper::assign_to_gpu(paraConfig.gpu[idx]));
-    DomainPoint dp(*it);
-    {
-      LogicalRegion x = runtime->get_logical_subregion_by_color(logit_lp, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(x, READ_ONLY, EXCLUSIVE, inputs[0].region));
-      launcher.add_field(0, FID_DATA);
-    }
-    {
-      LogicalRegion y =
-          runtime->get_logical_subregion_by_color(outputs[0].partition, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(y, WRITE_ONLY, EXCLUSIVE, outputs[0].region));
-      launcher.add_field(1, FID_DATA);
-    }
-    runtime->execute_task(ctx, launcher);
-  }
-}
-
-__global__ void SoftmaxLossBackprop(float *input,
-                                    int const *label,
-                                    int vocab_size,
-                                    int batch_size) {
-  CUDA_KERNEL_LOOP(i, batch_size) {
-    int label_idx = label[i];
-    input[i * vocab_size + label_idx] -= 1.0f;
-  }
-}
-
-/*
-  regions[0](O): x_grad
-  regions[1](I): y
-  regions[2](I): labels
-*/
-void SoftmaxDP::backward_task(Task const *task,
-                              std::vector<PhysicalRegion> const &regions,
-                              Context ctx,
-                              Runtime *runtime) {
-#ifndef DISABLE_COMPUTATION
-  assert(regions.size() == 3);
-  assert(task->regions.size() == 3);
-  SoftmaxDPMeta const *m = *((SoftmaxDPMeta **)task->args);
-  AccessorWO<float, 3> const acc_x_grad(regions[0], FID_DATA);
-  AccessorRO<float, 3> const acc_y(regions[1], FID_DATA);
-  AccessorRO<int, 2> const acc_label(regions[2], FID_DATA);
-  Rect<3> rect_x_grad = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  Rect<3> rect_y = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  Rect<2> rect_label = runtime->get_index_space_domain(
-      ctx, task->regions[2].region.get_index_space());
-  assert(acc_x_grad.accessor.is_dense_arbitrary(rect_x_grad));
-  assert(acc_y.accessor.is_dense_arbitrary(rect_y));
-  assert(acc_label.accessor.is_dense_arbitrary(rect_label));
-  float *x_grad_ptr = acc_x_grad.ptr(rect_x_grad.lo);
-  float const *y_ptr = acc_y.ptr(rect_y.lo);
-  int const *label_ptr = acc_label.ptr(rect_label.lo);
-  assert(rect_x_grad == rect_y);
-  assert(rect_y.hi[1] - rect_y.lo[1] == rect_label.hi[0] - rect_label.lo[0]);
-  assert(rect_y.hi[2] - rect_y.lo[2] == rect_label.hi[1] - rect_label.lo[1]);
-  int num_labels = rect_label.volume();
-  int vocab_size = rect_y.hi[0] - rect_y.lo[0] + 1;
-
-  cudaEvent_t t_start, t_end;
-  if (m->profiling_runtime) {
-    cudaEventCreate(&t_start);
-    cudaEventCreate(&t_end);
-    cudaEventRecord(t_start);
-  }
-  checkCUDA(cudaMemcpyAsync(x_grad_ptr,
-                            y_ptr,
-                            rect_x_grad.volume() * sizeof(float),
-                            cudaMemcpyDeviceToDevice));
-  SoftmaxLossBackprop<<<GET_BLOCKS(num_labels), CUDA_NUM_THREADS>>>(
-      x_grad_ptr, label_ptr, vocab_size, num_labels);
-
-  // Accouting for batch size in SGD
-  float scalVal = 1.0f / static_cast<float>(m->batchSize);
-  scale_kernel<<<GET_BLOCKS(rect_x_grad.volume()), CUDA_NUM_THREADS>>>(
-      x_grad_ptr, rect_x_grad.volume(), 0.0f, scalVal);
-  // checkCUDA(cublasSscal(m->handle.blas, rect_x_grad.volume(),
-  //                       &scalVal, x_grad_ptr, 1));
-  if (m->profiling_runtime) {
-    cudaEventRecord(t_end);
-    checkCUDA(cudaEventSynchronize(t_end));
-    float elapsed = 0;
-    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
-    cudaEventDestroy(t_start);
-    cudaEventDestroy(t_end);
-    printf("Softmax backward time = %.2fms\n", elapsed);
-  }
-#ifdef PRINT_INTERMEDIATE_RESULT
-  print_tensor<3, float>(x_grad_ptr, rect_x_grad, "softmax bwd:x_grad");
-  float *host_ptr;
-  checkCUDA(cudaHostAlloc(&host_ptr,
-                          sizeof(float) * rect_x_grad.volume(),
-                          cudaHostAllocPortable | cudaHostAllocMapped));
-  checkCUDA(cudaMemcpy(host_ptr,
-                       x_grad_ptr,
-                       sizeof(float) * rect_x_grad.volume(),
-                       cudaMemcpyDeviceToHost));
-  int idx = 0;
-  float loss = 0.0f;
-  for (PointInRectIterator<3> it(rect_x_grad); it(); it++, idx++) {
-    if (host_ptr[idx] < 0) {
-      loss += -std::log(host_ptr[idx] + 1);
-    }
-  }
-  printf("lost = %.4lf\n", loss);
-  checkCUDA(cudaFreeHost(host_ptr));
-#endif
-#endif
-}
-
-void SoftmaxDP::backward(RnnModel const &model) {
-  Context ctx = model.config.lg_ctx;
-  Runtime *runtime = model.config.lg_hlr;
-  int idx = 0;
-  for (PointInRectIterator<1> it(part_rect); it(); it++, idx++) {
-    OpMeta *mp = meta[idx];
-    TaskLauncher launcher(RNN_SOFTMAXDP_BWD_TASK_ID,
-                          TaskArgument(&mp, sizeof(OpMeta *)),
-                          Predicate::TRUE_PRED,
-                          0 /*MapperID*/,
-                          RnnMapper::assign_to_gpu(paraConfig.gpu[idx]));
-    DomainPoint dp(*it);
-    {
-      LogicalRegion x =
-          runtime->get_logical_subregion_by_color(logit_grad_lp, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(x, WRITE_ONLY, EXCLUSIVE, inputs[0].region_grad));
-      launcher.add_field(0, FID_DATA);
-    }
-    {
-      LogicalRegion y =
-          runtime->get_logical_subregion_by_color(outputs[0].partition, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(y, READ_ONLY, EXCLUSIVE, outputs[0].region));
-      launcher.add_field(1, FID_DATA);
-    }
-    {
-      LogicalRegion l =
-          runtime->get_logical_subregion_by_color(label.partition, dp);
-      launcher.add_region_requirement(
-          RegionRequirement(l, READ_ONLY, EXCLUSIVE, label.region));
-      launcher.add_field(2, FID_DATA);
-    }
-    runtime->execute_task(ctx, launcher);
-  }
-}
-
-void SoftmaxDP::update(RnnModel const &model) {}
diff --git a/scripts/FC_env_setup.sh b/scripts/FC_env_setup.sh
deleted file mode 100755
index ad58118761..0000000000
--- a/scripts/FC_env_setup.sh
+++ /dev/null
@@ -1,33 +0,0 @@
-#!/bin/bash
-set -euo pipefail
-
-# Cd into FF_HOME
-cd "${BASH_SOURCE[0]%/*}/../"
-
-export GASNET=${PWD}/GASNet-2019.9.0
-export LEGION=${PWD}/legion
-export PROTOBUF=${PWD}/protobuf
-
-module unload cuda cudnn NCCL
-
-#cuda v10
-#module load cuda/10.0
-#module load cudnn/v7.6-cuda.10.0
-#module load NCCL/2.4.8-1-cuda.10.0
-#export CUDA=/public/apps/cuda/10.1
-#export CUDNN=/public/apps/cudnn/v7.6/cuda
-#export NCCL=/public/apps/NCCL/2.4.8-1
-
-#cuda v9.2
-module load cuda/9.2
-module load cudnn/v7.3-cuda.9.2
-module load NCCL/2.2.13-1-cuda.9.2
-export CUDA=/public/apps/cuda/9.2
-export CUDNN=/public/apps/cudnn/v7.3/cuda
-export NCCL=/public/apps/NCCL/2.2.13-1
-
-module load cmake/3.15.3/gcc.7.3.0
-module load anaconda3/2019.07
-
-export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$PROTOBUF/src/.libs
-export PATH=$PATH:$PROTOBUF
diff --git a/scripts/FC_setup.sh b/scripts/FC_setup.sh
deleted file mode 100644
index 537d0c0b83..0000000000
--- a/scripts/FC_setup.sh
+++ /dev/null
@@ -1,34 +0,0 @@
-#! /usr/bin/env bash
-set -euo pipefail
-
-# Cd into FF_HOME
-cd "${BASH_SOURCE[0]%/*}/../"
-
-git submodule update --init --recursive
-./scripts/FC_env_setup.sh
-
-cd "$PROTOBUF"
-git submodule update --init --recursive
-##git checkout 6d4e7fd #still cannot get the strategy compile to use the local runtime. So need to checkout v 3.10.0
-./autogen.sh
-./configure
-make -j
-cd ..
-
-cd "$GASNET"
-./FC.build_script.sh
-cd ..
-
-cd src/runtime
-../../protobuf/src/protoc --cpp_out=. strategy.proto
-./gen_strategy.sh 8 8 1 # for 8 gpu per node,  and 8 embeddings per node, and 1 node
-cd ../..
-
-cd "$LEGION"
-git checkout control_replication
-cd ../
-
-
-make app=examples/DLRM/dlrm -j
-cd examples/DLRM
-./run_random.sh 1 
\ No newline at end of file
diff --git a/scripts/FC_setup.txt b/scripts/FC_setup.txt
deleted file mode 100644
index 0702815343..0000000000
--- a/scripts/FC_setup.txt
+++ /dev/null
@@ -1,24 +0,0 @@
-git clone --recursive
-git submodule update --init --recursive
-source FC_env_setup.sh
-
-cd $PROTOBUF
-git submodule update --init --recursive
-##git checkout 6d4e7fd #still cannot get the strategy compile to use the local runtime. So need to checkout v 3.10.0
-./autogen.sh
-./configure
-make -j
-cd ..
-
-cd $GASNET
-./FC.build_script.sh
-cd ..
-
-cd src/runtime
-../../protobuf/src/protoc --cpp_out=. strategy.proto
-./gen_strategy.sh 8 8 # for 8 gpu and 8 embeddings
-cd ../..
-
-make app=examples/DLRM/dlrm -j
-cd examples/DLRM
-./run_random.sh 1 
diff --git a/scripts/Makefile b/scripts/Makefile
deleted file mode 100644
index 7fa21fb11a..0000000000
--- a/scripts/Makefile
+++ /dev/null
@@ -1,2 +0,0 @@
-simulator:
-	nvcc simulator.cc -lcudnn -lcublas -std=c++11 -arch=compute_37 -code=sm_37
diff --git a/scripts/compile_protobuf.sh b/scripts/compile_protobuf.sh
deleted file mode 100755
index bea26e6940..0000000000
--- a/scripts/compile_protobuf.sh
+++ /dev/null
@@ -1,6 +0,0 @@
-#!/bin/bash
-set -euo pipefail
-
-cd src/runtime
-protoc --cpp_out=. strategy.proto
-cd ../..
diff --git a/scripts/osdi22ae/bert.sh b/scripts/osdi22ae/bert.sh
deleted file mode 100755
index 18d2c3195c..0000000000
--- a/scripts/osdi22ae/bert.sh
+++ /dev/null
@@ -1,7 +0,0 @@
-#! /usr/bin/env bash
-
-echo "Running BERT with a parallelization strategy discovered by Unity"
-"$FF_HOME"/build/examples/cpp/Transformer/transformer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 14000 -b 8 --budget 30
-
-echo "Running BERT Uno with data parallelism"
-"$FF_HOME"/build/examples/cpp/Transformer/transformer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 14000 -b 8 --budget 30 --only-data-parallel
diff --git a/scripts/osdi22ae/candle_uno.sh b/scripts/osdi22ae/candle_uno.sh
deleted file mode 100755
index 22458149f1..0000000000
--- a/scripts/osdi22ae/candle_uno.sh
+++ /dev/null
@@ -1,7 +0,0 @@
-#! /usr/bin/env bash
-
-echo "Running CANDLE Uno with a parallelization strategy discovered by Unity"
-"$FF_HOME"/build/examples/cpp/candle_uno/candle_uno -ll:gpu 4 -ll:fsize 14000 -ll:zsize 14000 --budget 20
-
-echo "Running CANDLE Uno with data parallelism"
-"$FF_HOME"/build/examples/cpp/candle_uno/candle_uno -ll:gpu 4 -ll:fsize 14000 -ll:zsize 14000 --budget 20 --only-data-parallel
diff --git a/scripts/osdi22ae/dlrm.sh b/scripts/osdi22ae/dlrm.sh
deleted file mode 100755
index a75e78bc0a..0000000000
--- a/scripts/osdi22ae/dlrm.sh
+++ /dev/null
@@ -1,7 +0,0 @@
-#! /usr/bin/env bash
-
-echo "Running DLRM with a parallelization strategy discovered by Unity"
-"$FF_HOME"/build/examples/cpp/DLRM/dlrm -ll:gpu 4 -ll:fsize 14000 -ll:zsize 14000 --budget 20
-
-echo "Running DLRM with data parallelism"
-"$FF_HOME"/build/examples/cpp/DLRM/dlrm -ll:gpu 4 -ll:fsize 14000 -ll:zsize 14000 --budget 20 --only-data-parallel
diff --git a/scripts/osdi22ae/inception.sh b/scripts/osdi22ae/inception.sh
deleted file mode 100755
index 7b6c079eab..0000000000
--- a/scripts/osdi22ae/inception.sh
+++ /dev/null
@@ -1,7 +0,0 @@
-#! /usr/bin/env bash
-
-echo "Running Inception-v3 with a parallelization strategy discovered by Unity"
-"$FF_HOME"/build/examples/cpp/InceptionV3/inception -ll:gpu 4 -ll:fsize 11000 -ll:zsize 14000 -b 64 --budget 10
-
-echo "Running Inception-v3 with data parallelism"
-"$FF_HOME"/build/examples/cpp/InceptionV3/inception -ll:gpu 4 -ll:fsize 11000 -ll:zsize 14000 -b 64 --budget 10 --only-data-parallel
diff --git a/scripts/osdi22ae/mlp.sh b/scripts/osdi22ae/mlp.sh
deleted file mode 100755
index fa84607983..0000000000
--- a/scripts/osdi22ae/mlp.sh
+++ /dev/null
@@ -1,7 +0,0 @@
-#! /usr/bin/env bash
-
-echo "Running MLP with a parallelization strategy discovered by Unity"
-"$FF_HOME"/build/examples/cpp/MLP_Unify/mlp_unify -ll:gpu 4 -ll:fsize 14000 -ll:zsize 14000 --budget 20
-
-echo "Running MLP with data parallelism"
-"$FF_HOME"/build/examples/cpp/MLP_Unify/mlp_unify -ll:gpu 4 -ll:fsize 14000 -ll:zsize 14000 --budget 20 --only-data-parallel
diff --git a/scripts/osdi22ae/resnext-50.sh b/scripts/osdi22ae/resnext-50.sh
deleted file mode 100755
index c73e079361..0000000000
--- a/scripts/osdi22ae/resnext-50.sh
+++ /dev/null
@@ -1,7 +0,0 @@
-#! /usr/bin/env bash
-
-echo "Running ResNeXt-50 with a parallelization strategy discovered by Unity"
-"$FF_HOME"/build/examples/cpp/resnext50/resnext50 -ll:gpu 4 -ll:fsize 12000 -ll:zsize 14000 -b 16 --budget 20
-
-echo "Running ResNeXt-50 with data parallelism"
-"$FF_HOME"/build/examples/cpp/resnext50/resnext50 -ll:gpu 4 -ll:fsize 12000 -ll:zsize 14000 -b 16 --budget 20 --only-data-parallel
diff --git a/scripts/osdi22ae/xdl.sh b/scripts/osdi22ae/xdl.sh
deleted file mode 100755
index fcb5172b30..0000000000
--- a/scripts/osdi22ae/xdl.sh
+++ /dev/null
@@ -1,7 +0,0 @@
-#! /usr/bin/env bash
-
-echo "Running XDL with a parallelization strategy discovered by Unity"
-"$FF_HOME"/build/examples/cpp/XDL/xdl -ll:gpu 4 -ll:fsize 14000 -ll:zsize 14000 --budget 20
-
-echo "Running XDL with data parallelism"
-"$FF_HOME"/build/examples/cpp/XDL/xdl -ll:gpu 4 -ll:fsize 14000 -ll:zsize 14000 --budget 20 --only-data-parallel
diff --git a/scripts/test_run.sh b/scripts/test_run.sh
deleted file mode 100644
index 9ff8f71129..0000000000
--- a/scripts/test_run.sh
+++ /dev/null
@@ -1,38 +0,0 @@
-#! /usr/bin/env bash
-set -euo pipefail
-
-# Cd into FF_HOME
-cd "${BASH_SOURCE[0]%/*}/../"
-
-# git checkout dcr # We are using the dcr branch by default
-git submodule update --init --recursive
-./scripts/FC_env_setup.sh
-
-cd "$PROTOBUF"
-git submodule update --init --recursive
-##git checkout 6d4e7fd #still cannot get the strategy compile to use the local runtime. So need to checkout v 3.10.0
-./autogen.sh
-./configure
-make -j
-cd ..
-
-cd "$GASNET"
-./FC.build_script.sh
-cd ..
-
-cd src/runtime
-../../protobuf/src/protoc --cpp_out=. strategy.proto
-./gen_strategy.sh 8 8 1 # for 8 gpu per node,  and 8 embeddings per node, and 1 node
-./gen_strategy.sh 2 1 1 # for 2 gpu per node, testing purpose
-cd ../..
-
-cd "$LEGION"
-git checkout control_replication
-cd ../
-
-
-make app=src/ops/tests/concat_test -j -f Makefile
-cd src/ops/tests
-./test_run_FF_target.sh concat_test 2 && cp output.txt output_2gpus.txt
-./test_run_FF_target.sh concat_test 1 && cp output.txt output_1gpus.txt
-

From de6933b57a8b3d37bb26fb5e8a0bd77326c28c6b Mon Sep 17 00:00:00 2001
From: Pinku Surana <suranap@users.noreply.github.com>
Date: Thu, 5 Oct 2023 15:52:51 -0400
Subject: [PATCH 246/344] Compare flle path reliably (#1173)

Fixes #957. `-ef` is "True if file1 and file2 refer to the same device and inode numbers."
---
 python/flexflow_python_build.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/python/flexflow_python_build.py b/python/flexflow_python_build.py
index 65aff5af56..45b858b113 100755
--- a/python/flexflow_python_build.py
+++ b/python/flexflow_python_build.py
@@ -43,7 +43,7 @@
     f'BUILD_FOLDER="{build_dir}"',
     'SCRIPT_DIR="$(realpath "${BASH_SOURCE[0]%/*}")"',
     'legion_python_args=("$@" "-ll:py" "1")',
-    'if [[ "$SCRIPT_DIR" == "$BUILD_FOLDER" ]]; then',
+    'if [[ "$SCRIPT_DIR" -ef "$BUILD_FOLDER" ]]; then',
     f'\tPYTHON_FOLDER="{script_dir}"',
     '\tPYLIB_PATH="$("$PYTHON_FOLDER"/flexflow/findpylib.py)"',
     '\tPYLIB_DIR="$(dirname "$PYLIB_PATH")"',

From 50ff264ee02956bd464e575c70011ed9550bef56 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 8 Oct 2023 19:39:01 -0400
Subject: [PATCH 247/344] [Tool] - Add mechanism to save operators' tensors to
 file (#1174)

* add model id, layer_id and op_name to opmeta

* pass model id to opmeta

* .

* implement inference tensor save function

* add calls to save tensors function in ops

* more ops

* done

* fix bugs, implement batchconfig << operator, add function to save bc to file

* fixes

* hip_rocm fixes

* fix

* fix bug

* fix ci

* removed out of date incmha inference test

* add save tensors function to fused.cu
---
 .gitignore                                    |   2 +
 conda/pytorch-gpu.yml                         |   2 +-
 include/flexflow/batch_config.h               |  13 +-
 include/flexflow/config.h                     |   1 +
 include/flexflow/fftype.h                     |   4 +-
 include/flexflow/layer.h                      |   1 +
 include/flexflow/model.h                      |   5 +
 include/flexflow/op_meta.h                    |   4 +
 include/flexflow/operator.h                   |  10 +
 .../ops/add_bias_residual_layer_norm.h        |   1 -
 include/flexflow/ops/element_unary.h          |   1 -
 .../ops/inc_multihead_self_attention.h        |   3 -
 include/flexflow/ops/kernels/concat_kernels.h |   1 -
 .../flexflow/ops/kernels/conv_2d_kernels.h    |   1 -
 .../ops/kernels/element_binary_kernels.h      |   1 -
 include/flexflow/ops/kernels/linear_kernels.h |   1 -
 .../flexflow/ops/kernels/pool_2d_kernels.h    |   1 -
 .../ops/kernels/residual_rms_norm_kernels.h   |   1 -
 .../flexflow/ops/kernels/rms_norm_kernels.h   |   1 -
 .../flexflow/ops/kernels/softmax_kernels.h    |   2 +-
 include/flexflow/ops/layer_norm.h             |   1 -
 include/flexflow/ops/linear.h                 |   1 +
 include/flexflow/ops/residual_layer_norm.h    |   1 -
 include/flexflow/ops/residual_rms_norm.h      |   1 -
 include/flexflow/ops/rms_norm.h               |   1 -
 include/flexflow/ops/sigmoid_silu_multi.h     |   1 -
 include/flexflow/utils/hip_helper.h           |   3 +
 inference/python/incr_decoding.py             |   1 +
 inference/python/spec_infer.py                |   1 +
 python/flexflow/core/__init__.py              |   1 +
 python/flexflow/serve/__init__.py             |   8 +
 src/c/flexflow_c.cc                           |   3 +-
 src/ops/add_bias_residual_layer_norm.cc       |  65 +-
 src/ops/add_bias_residual_layer_norm.cpp      |   1 +
 src/ops/add_bias_residual_layer_norm.cu       |   1 +
 src/ops/aggregate.cc                          |   3 +
 src/ops/aggregate_spec.cc                     |   3 +
 src/ops/arg_topk.cc                           |  18 +-
 src/ops/argmax.cc                             |  21 +-
 src/ops/attention.cc                          |   3 +
 src/ops/batch_matmul.cc                       |   3 +
 src/ops/batch_norm.cpp                        |   1 +
 src/ops/batch_norm.cu                         |   1 +
 src/ops/beam_topk.cc                          |  78 +-
 src/ops/cache.cc                              |   3 +
 src/ops/cast.cc                               |   2 +
 src/ops/concat.cc                             |   2 +
 src/ops/conv_2d.cc                            |   8 +-
 src/ops/dropout.cc                            |   2 +
 src/ops/element_binary.cc                     |  19 +-
 src/ops/element_unary.cc                      |  31 +-
 src/ops/embedding.cc                          |  77 +-
 src/ops/experts.cc                            |  39 +-
 src/ops/fused.cu                              |  25 +
 src/ops/gather.cc                             |   8 +-
 src/ops/group_by.cc                           |  41 +-
 src/ops/inc_multihead_self_attention.cc       | 797 +-----------------
 src/ops/inc_multihead_self_attention.cu       |  15 -
 src/ops/kernels/dropout_kernels.cpp           |   1 +
 src/ops/kernels/dropout_kernels.cu            |   1 +
 src/ops/kernels/element_binary_kernels.cu     |   1 +
 src/ops/kernels/softmax.cpp                   |   1 +
 src/ops/kernels/softmax.cu                    |   1 +
 src/ops/layer_norm.cc                         |  25 +-
 src/ops/layer_norm.cu                         |   1 +
 src/ops/linear.cc                             |  22 +-
 src/ops/pool_2d.cc                            |   2 +
 src/ops/reduce.cc                             |   8 +-
 src/ops/reshape.cc                            |   8 +-
 src/ops/residual_layer_norm.cc                |  36 +-
 src/ops/residual_layer_norm.cpp               |   1 +
 src/ops/residual_layer_norm.cu                |   1 +
 src/ops/residual_rms_norm.cc                  |  17 +-
 src/ops/rms_norm.cc                           |  16 +-
 src/ops/sampling.cc                           |  12 +-
 src/ops/sigmoid_silu_multi.cc                 |  17 +-
 src/ops/sigmoid_silu_multi.cpp                |   1 +
 src/ops/sigmoid_silu_multi.cu                 |   1 +
 src/ops/softmax.cc                            |  89 +-
 src/ops/spec_inc_multihead_self_attention.cc  |  25 +-
 src/ops/topk.cc                               |   3 +
 src/ops/transpose.cc                          |   3 +
 src/ops/tree_inc_multihead_self_attention.cc  |  16 +-
 src/runtime/batch_config.cc                   |  84 +-
 src/runtime/beam_search_batch_config.cc       | 140 +--
 src/runtime/cuda_helper.cu                    | 104 ++-
 src/runtime/fftype.cc                         |  13 +-
 src/runtime/graph.cc                          |  30 +-
 src/runtime/hip_helper.cpp                    | 117 +++
 src/runtime/layer.cc                          |   6 +-
 src/runtime/model.cc                          |  20 +-
 src/runtime/operator.cc                       | 109 +++
 src/runtime/tree_verify_batch_config.cc       | 100 ++-
 .../python_test_configs/generate_configs.py   |   1 +
 94 files changed, 1109 insertions(+), 1270 deletions(-)

diff --git a/.gitignore b/.gitignore
index be0266c9b5..8fcc105f01 100644
--- a/.gitignore
+++ b/.gitignore
@@ -185,3 +185,5 @@ gpt_tokenizer
 
 # pip version
 python/flexflow/version.txt
+
+inference_tensors
\ No newline at end of file
diff --git a/conda/pytorch-gpu.yml b/conda/pytorch-gpu.yml
index 677e71d73f..85d24ced17 100644
--- a/conda/pytorch-gpu.yml
+++ b/conda/pytorch-gpu.yml
@@ -3,7 +3,7 @@ channels:
   - defaults
   - conda-forge
 dependencies:
-  - python>=3.6
+  - python>=3.6,<3.12
   - pip
   - pip:
     - numpy>=1.16.0
diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 6dabc70f4b..108bc8d172 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -46,7 +46,9 @@ class BatchConfig {
   static int max_requests_per_batch();
   static int max_tokens_per_batch();
   static int max_sequence_length();
+  friend std::ostream &operator<<(std::ostream &os, BatchConfig const &bc);
   void print() const;
+  void save_to_file(std::string const &filename) const;
   virtual InferenceMode get_mode() const;
   static BatchConfig const *from_future(BatchConfigFuture const &future);
   // Maximum possible values for different parameters
@@ -55,9 +57,8 @@ class BatchConfig {
   static int const MAX_NUM_REQUESTS = 64;
   static int const MAX_NUM_TOKENS = 1024;
 
-  //  These are set by update
+  //  Set by update
   int num_tokens;
-  bool loading_prompt = false;
 
   struct PerRequestInfo {
     int token_start_offset;
@@ -74,7 +75,7 @@ class BatchConfig {
   PerTokenInfo tokensInfo[MAX_NUM_TOKENS];
 
   bool request_completed[MAX_NUM_REQUESTS];
-  bool request_running[MAX_NUM_TOKENS];
+  bool request_running[MAX_NUM_REQUESTS];
 };
 
 class TreeVerifyBatchConfig : public BatchConfig {
@@ -82,7 +83,10 @@ class TreeVerifyBatchConfig : public BatchConfig {
   TreeVerifyBatchConfig();
   ~TreeVerifyBatchConfig();
   InferenceMode get_mode() const;
+  friend std::ostream &operator<<(std::ostream &os,
+                                  TreeVerifyBatchConfig const &bc);
   void print() const;
+  void save_to_file(std::string const &filename) const;
   struct CommittedTokensInfo {
     int token_index;   // the index of the token in the previous batch
     int request_index; // request index in the batch
@@ -108,7 +112,10 @@ class BeamSearchBatchConfig : public BatchConfig {
 
   ~BeamSearchBatchConfig();
 
+  friend std::ostream &operator<<(std::ostream &os,
+                                  BeamSearchBatchConfig const &bc);
   void print() const;
+  void save_to_file(std::string const &filename) const;
   bool done() const;
   int max_beam_depth_all_requests() const;
   int current_depth_all_requests() const;
diff --git a/include/flexflow/config.h b/include/flexflow/config.h
index 9716060173..c2af6d707c 100644
--- a/include/flexflow/config.h
+++ b/include/flexflow/config.h
@@ -134,6 +134,7 @@ class FFConfig {
   Legion::Runtime *lg_hlr;
   // Legion::FieldSpace field_space;
   bool syntheticInput, profiling, perform_fusion;
+  bool inference_debugging;
   size_t simulator_work_space_size;
   size_t search_budget;
   float search_alpha;
diff --git a/include/flexflow/fftype.h b/include/flexflow/fftype.h
index 18ed6b8100..1cd90fda26 100644
--- a/include/flexflow/fftype.h
+++ b/include/flexflow/fftype.h
@@ -10,12 +10,12 @@ class LayerID {
 public:
   static const LayerID NO_ID;
   LayerID();
-  LayerID(size_t id, size_t transformer_layer_id);
+  LayerID(size_t id, size_t transformer_layer_id, size_t model_id);
   bool is_valid_id() const;
   friend bool operator==(LayerID const &lhs, LayerID const &rhs);
 
 public:
-  size_t id, transformer_layer_id;
+  size_t id, transformer_layer_id, model_id;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/layer.h b/include/flexflow/layer.h
index 0c1d7a6092..69a57e4e1c 100644
--- a/include/flexflow/layer.h
+++ b/include/flexflow/layer.h
@@ -52,6 +52,7 @@ class Layer {
   bool trainableInputs[MAX_NUM_INPUTS];
   int numInputs, numWeights, numOutputs;
   bool profiling;
+  bool inference_debugging;
 
 private:
   std::unordered_map<std::string, long long> int_properties;
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 97ee553fb3..d8402ba622 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -1234,6 +1234,8 @@ class FFModel {
   std::unordered_map<size_t, NoOp *> cached_noop_ops;
   std::unordered_map<size_t, NoOp *> cached_input_ops;
   std::vector<MachineView> all_valid_views;
+  int model_id; // unique incremental id assigned to each model. Used in the
+                // inference_debugging mode.
 #ifdef FF_USE_NCCL
   std::unordered_map<size_t, ncclComm_t *> view_hash_to_nccl_comms;
 #endif
@@ -1262,6 +1264,9 @@ class FFModel {
   ElementUnary *
       unary(OperatorType op, char const *name = NULL, float scalar = 0.0);
   PCG::Node new_node(Op *);
+  static int model_counter; // number of instantiated FFModel objects. Used to
+                            // assign a unique incremental id to each model.
+                            // Used in the inference_debugging mode.
 };
 
 class UtilityTasks {
diff --git a/include/flexflow/op_meta.h b/include/flexflow/op_meta.h
index 512844db92..60785a1e29 100644
--- a/include/flexflow/op_meta.h
+++ b/include/flexflow/op_meta.h
@@ -15,6 +15,10 @@ class OpMeta {
 public:
   FFHandler handle;
   bool profiling; // Measure the run time of the task
+  bool inference_debugging;
+  int decoding_step;
+  char op_name[MAX_OPNAME];
+  LayerID layer_guid;
   bool trainableInputs[MAX_NUM_INPUTS];
   DataType input_type[MAX_NUM_INPUTS];
   DataType weight_type[MAX_NUM_WEIGHTS];
diff --git a/include/flexflow/operator.h b/include/flexflow/operator.h
index 1b2fc7bbfc..fd21436681 100644
--- a/include/flexflow/operator.h
+++ b/include/flexflow/operator.h
@@ -1,6 +1,7 @@
 #ifndef _OPERATOR_H
 #define _OPERATOR_H
 
+#include "flexflow/accessor.h"
 #include "flexflow/batch_config.h"
 #include "flexflow/fftype.h"
 #include "flexflow/machine_view.h"
@@ -183,6 +184,7 @@ class Op {
      const ParallelTensor input4 = NULL);
   Op(int guid,
      bool profiling,
+     bool inference_debugging,
      OperatorType otype,
      DataType dtype,
      char const *name,
@@ -225,6 +227,13 @@ class Op {
     assert(false);
   };
   virtual void print_layer(FFModel const &model) = 0;
+  static void save_inference_tensors_to_file(
+      OpMeta *m,
+      int shard_id,
+      BatchConfig const *bc,
+      std::vector<GenericTensorAccessorR> input_tensors,
+      std::vector<GenericTensorAccessorR> weight_tensors,
+      std::vector<GenericTensorAccessorW> output_tensors);
   virtual bool measure_operator_cost(Simulator *sim,
                                      MachineView const &mv,
                                      CostMetrics &cost_metrics) const = 0;
@@ -316,6 +325,7 @@ class Op {
   std::map<ParallelTensor, OpMeta *[MAX_NUM_WORKERS]> inference_meta;
   int numInputs, numWeights, numOutputs;
   bool profiling;
+  bool inference_debugging;
   bool add_bias_only_once;
 #ifdef FF_USE_NCCL
   ncclUniqueId ncclId;
diff --git a/include/flexflow/ops/add_bias_residual_layer_norm.h b/include/flexflow/ops/add_bias_residual_layer_norm.h
index 523f4d3b7c..bb470376c3 100644
--- a/include/flexflow/ops/add_bias_residual_layer_norm.h
+++ b/include/flexflow/ops/add_bias_residual_layer_norm.h
@@ -106,7 +106,6 @@ class AddBiasResidualLayerNormMeta : public OpMeta {
   int64_t effective_batch_size, effective_num_elements;
   float eps;
   void *mean_ptr, *rstd_ptr, *ds_ptr, *db_ptr, *scale_ptr, *bias_ptr;
-  char op_name[MAX_OPNAME];
   Realm::RegionInstance reserveInst;
 };
 
diff --git a/include/flexflow/ops/element_unary.h b/include/flexflow/ops/element_unary.h
index f82db5f910..ddef59549c 100644
--- a/include/flexflow/ops/element_unary.h
+++ b/include/flexflow/ops/element_unary.h
@@ -26,7 +26,6 @@ class ElementUnaryMeta : public OpMeta {
   DataType data_type;
   bool inplace;
   float scalar;
-  char op_name[MAX_OPNAME];
 };
 
 class ElementUnary : public Op {
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index 8290998f02..51a3b9fbe1 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -185,9 +185,6 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
   bool *qk_prod_scaling;
   bool *position_bias;
   float scaling_factor;
-#ifdef INFERENCE_TESTS
-  float *kcache, *vcache;
-#endif
   void *weight_ptr, *bias_ptr; // for weight offload
   void *devQKVProjArray, *keyCache, *valueCache;
   void *qk_prods, *qk_prods_softmax;
diff --git a/include/flexflow/ops/kernels/concat_kernels.h b/include/flexflow/ops/kernels/concat_kernels.h
index 755e1800da..4da6aaf5e2 100644
--- a/include/flexflow/ops/kernels/concat_kernels.h
+++ b/include/flexflow/ops/kernels/concat_kernels.h
@@ -12,7 +12,6 @@ class ConcatMeta : public OpMeta {
 public:
   ConcatMeta(FFHandler handle) : OpMeta(handle){};
   int legion_axis;
-  char op_name[MAX_OPNAME];
 };
 
 namespace Kernels {
diff --git a/include/flexflow/ops/kernels/conv_2d_kernels.h b/include/flexflow/ops/kernels/conv_2d_kernels.h
index a848d83d60..7b2a0fe135 100644
--- a/include/flexflow/ops/kernels/conv_2d_kernels.h
+++ b/include/flexflow/ops/kernels/conv_2d_kernels.h
@@ -28,7 +28,6 @@ class Conv2DMeta : public OpMeta {
   miopenConvBwdDataAlgorithm_t bwdDataAlgo;
 #endif
   bool relu, use_bias;
-  char op_name[MAX_OPNAME];
 };
 
 namespace Kernels {
diff --git a/include/flexflow/ops/kernels/element_binary_kernels.h b/include/flexflow/ops/kernels/element_binary_kernels.h
index b0c596301b..5a375fb661 100644
--- a/include/flexflow/ops/kernels/element_binary_kernels.h
+++ b/include/flexflow/ops/kernels/element_binary_kernels.h
@@ -23,7 +23,6 @@ class ElementBinaryMeta : public OpMeta {
   OperatorType op_type;
   bool inplace_a, has_same_operands;
   bool broadcast_input1, broadcast_input2;
-  char op_name[MAX_OPNAME];
 };
 
 namespace Kernels {
diff --git a/include/flexflow/ops/kernels/linear_kernels.h b/include/flexflow/ops/kernels/linear_kernels.h
index bbebe3c79b..a5fdc7c602 100644
--- a/include/flexflow/ops/kernels/linear_kernels.h
+++ b/include/flexflow/ops/kernels/linear_kernels.h
@@ -34,7 +34,6 @@ class LinearMeta : public OpMeta {
   RegularizerMode kernel_reg_type;
   float kernel_reg_lambda;
   bool use_bias, add_bias_only_once;
-  char op_name[MAX_OPNAME];
   Realm::RegionInstance reserveInst;
 };
 
diff --git a/include/flexflow/ops/kernels/pool_2d_kernels.h b/include/flexflow/ops/kernels/pool_2d_kernels.h
index ac86cb50c3..7f73a8295d 100644
--- a/include/flexflow/ops/kernels/pool_2d_kernels.h
+++ b/include/flexflow/ops/kernels/pool_2d_kernels.h
@@ -14,7 +14,6 @@ class Pool2DMeta : public OpMeta {
   ffActivationDescriptor_t actiDesc;
   ffPoolingDescriptor_t poolDesc;
   bool relu;
-  char op_name[MAX_OPNAME];
 };
 
 namespace Kernels {
diff --git a/include/flexflow/ops/kernels/residual_rms_norm_kernels.h b/include/flexflow/ops/kernels/residual_rms_norm_kernels.h
index aa454711ec..0eef4ca72b 100644
--- a/include/flexflow/ops/kernels/residual_rms_norm_kernels.h
+++ b/include/flexflow/ops/kernels/residual_rms_norm_kernels.h
@@ -37,7 +37,6 @@ class ResidualRMSNormMeta : public OpMeta {
   int in_dim;
   int batch_size;
   int num_elements;
-  char op_name[MAX_OPNAME];
   Realm::RegionInstance reserveInst;
 };
 
diff --git a/include/flexflow/ops/kernels/rms_norm_kernels.h b/include/flexflow/ops/kernels/rms_norm_kernels.h
index 2063777ef1..35c5aa69fa 100644
--- a/include/flexflow/ops/kernels/rms_norm_kernels.h
+++ b/include/flexflow/ops/kernels/rms_norm_kernels.h
@@ -37,7 +37,6 @@ class RMSNormMeta : public OpMeta {
   int in_dim;
   int batch_size;
   int num_elements;
-  char op_name[MAX_OPNAME];
   Realm::RegionInstance reserveInst;
 };
 
diff --git a/include/flexflow/ops/kernels/softmax_kernels.h b/include/flexflow/ops/kernels/softmax_kernels.h
index 987a546459..8cfaf3c586 100644
--- a/include/flexflow/ops/kernels/softmax_kernels.h
+++ b/include/flexflow/ops/kernels/softmax_kernels.h
@@ -21,8 +21,8 @@ class SoftmaxMeta : public OpMeta {
   miopenTensorDescriptor_t outputTensor;
 #endif
   bool profiling;
+  bool inference_debugging;
   int dim;
-  char op_name[MAX_OPNAME];
   DataType input_type, output_type;
 };
 
diff --git a/include/flexflow/ops/layer_norm.h b/include/flexflow/ops/layer_norm.h
index c65370e0fd..9e48d81190 100644
--- a/include/flexflow/ops/layer_norm.h
+++ b/include/flexflow/ops/layer_norm.h
@@ -123,7 +123,6 @@ class LayerNormMeta : public OpMeta {
   int64_t effective_batch_size, effective_num_elements;
   float eps;
   void *mean_ptr, *rstd_ptr, *ds_ptr, *db_ptr, *scale_ptr, *bias_ptr;
-  char op_name[MAX_OPNAME];
   Realm::RegionInstance reserveInst;
 };
 
diff --git a/include/flexflow/ops/linear.h b/include/flexflow/ops/linear.h
index 025674c7ba..a32df80537 100644
--- a/include/flexflow/ops/linear.h
+++ b/include/flexflow/ops/linear.h
@@ -96,6 +96,7 @@ class Linear : public Op {
 private:
   Linear(int guid,
          bool profiling,
+         bool inference_debugging,
          const ParallelTensor input,
          int out_dim,
          ActiMode activation,
diff --git a/include/flexflow/ops/residual_layer_norm.h b/include/flexflow/ops/residual_layer_norm.h
index 39f149554e..0e9be82125 100644
--- a/include/flexflow/ops/residual_layer_norm.h
+++ b/include/flexflow/ops/residual_layer_norm.h
@@ -106,7 +106,6 @@ class ResidualLayerNormMeta : public OpMeta {
   int64_t effective_batch_size, effective_num_elements;
   float eps;
   void *mean_ptr, *rstd_ptr, *ds_ptr, *db_ptr, *scale_ptr, *bias_ptr;
-  char op_name[MAX_OPNAME];
   Realm::RegionInstance reserveInst;
 };
 
diff --git a/include/flexflow/ops/residual_rms_norm.h b/include/flexflow/ops/residual_rms_norm.h
index 783173c5eb..0d92a236e8 100644
--- a/include/flexflow/ops/residual_rms_norm.h
+++ b/include/flexflow/ops/residual_rms_norm.h
@@ -80,7 +80,6 @@ class ResidualRMSNorm : public Op {
 
 public:
   float eps;
-  char op_name[MAX_OPNAME];
   int effective_batch_size;
   int dim, data_dim;
 };
diff --git a/include/flexflow/ops/rms_norm.h b/include/flexflow/ops/rms_norm.h
index a3074de015..1dc940ebd3 100644
--- a/include/flexflow/ops/rms_norm.h
+++ b/include/flexflow/ops/rms_norm.h
@@ -79,7 +79,6 @@ class RMSNorm : public Op {
 
 public:
   float eps;
-  char op_name[MAX_OPNAME];
   int effective_batch_size;
   int dim, data_dim;
 };
diff --git a/include/flexflow/ops/sigmoid_silu_multi.h b/include/flexflow/ops/sigmoid_silu_multi.h
index 6a69288607..604438260a 100644
--- a/include/flexflow/ops/sigmoid_silu_multi.h
+++ b/include/flexflow/ops/sigmoid_silu_multi.h
@@ -79,7 +79,6 @@ class SigmoidSiluMultiMeta : public OpMeta {
   ~SigmoidSiluMultiMeta(void);
 
 public:
-  char op_name[MAX_OPNAME];
   Realm::RegionInstance reserveInst;
 };
 
diff --git a/include/flexflow/utils/hip_helper.h b/include/flexflow/utils/hip_helper.h
index be6f4a713d..5d3c831d4f 100644
--- a/include/flexflow/utils/hip_helper.h
+++ b/include/flexflow/utils/hip_helper.h
@@ -137,6 +137,9 @@ __host__ void updateGAS(float *para_ptr,
 template <typename T>
 void print_tensor(T const *ptr, size_t num_elements, char const *prefix);
 
+template <typename T>
+void save_tensor(T const *ptr, size_t num_elements, char const *file_name);
+
 template <typename T>
 T *download_tensor(T const *ptr, size_t num_elements);
 
diff --git a/inference/python/incr_decoding.py b/inference/python/incr_decoding.py
index d8a494b4d5..3621ee83a3 100644
--- a/inference/python/incr_decoding.py
+++ b/inference/python/incr_decoding.py
@@ -55,6 +55,7 @@ def get_configs():
             "use_4bit_quantization": False,
             "use_8bit_quantization": False,
             "profiling": False,
+            "inference_debugging": False,
             "fusion": True,
         }
         llm_configs = {
diff --git a/inference/python/spec_infer.py b/inference/python/spec_infer.py
index c9e87bd29f..3d0f1a1c0e 100644
--- a/inference/python/spec_infer.py
+++ b/inference/python/spec_infer.py
@@ -55,6 +55,7 @@ def get_configs():
             "use_4bit_quantization": False,
             "use_8bit_quantization": False,
             "profiling": False,
+            "inference_debugging": False,
             "fusion": True,
         }
         llm_configs = {
diff --git a/python/flexflow/core/__init__.py b/python/flexflow/core/__init__.py
index ace6030a1b..d7b1a595d2 100644
--- a/python/flexflow/core/__init__.py
+++ b/python/flexflow/core/__init__.py
@@ -41,6 +41,7 @@
     "num_cpus": "-ll:cpu",
     "legion_utility_processors": "-ll:util",
     "profiling": "--profiling",
+    "inference_debugging": "--inference-debugging",
     "fusion": "--fusion",
     "disable_control_replication": "--disable-control-replication",
     # Training args
diff --git a/python/flexflow/serve/__init__.py b/python/flexflow/serve/__init__.py
index 9b282ae5f4..cf467280bd 100644
--- a/python/flexflow/serve/__init__.py
+++ b/python/flexflow/serve/__init__.py
@@ -45,6 +45,7 @@ def init(
     use_4bit_quantization: Optional[bool] = None,
     use_8bit_quantization: Optional[bool] = None,
     profiling: Optional[bool] = None,
+    inference_debugging: Optional[bool] = None,
     fusion: Optional[bool] = None,
 ):
     """
@@ -71,6 +72,7 @@ def init(
     - use_4bit_quantization: whether to use 4-bit quantization, defaults to False
     - use_8bit_quantization: whether to use 8-bit quantization, defaults to False
     - profiling: whether to enable the FlexFlow profiling mode, defaults to False
+    - inference_debugging: whether to run inference in debugging mode, saving all inputs/outputs/weights to file, defaults to False
     - fusion: whether to enable the FlexFlow operator fusion optimization, defaults to True
 
     The configurations are passed down to the FlexFlow runtime (implemented in C++) via command line arguments.
@@ -104,6 +106,8 @@ def init(
     :type use_8bit_quantization: Optional[bool], optional
     :param profiling: whether to enable the FlexFlow profiling mode, defaults to False
     :type profiling: Optional[bool], optional
+    :param inference_debugging: whether to run inference in debugging mode, saving all inputs/outputs/weights to file, defaults to False
+    :type inference_debugging: Optional[bool], optional
     :param fusion: whether to enable the FlexFlow operator fusion optimization, defaults to True
     :type fusion: Optional[bool], optional
 
@@ -128,6 +132,7 @@ def init(
             use_4bit_quantization is not None,
             use_8bit_quantization is not None,
             profiling is not None,
+            inference_debugging is not None,
             fusion is not None,
         ]
     ):
@@ -152,6 +157,7 @@ def init(
             "use_4bit_quantization": use_4bit_quantization,
             "use_8bit_quantization": use_8bit_quantization,
             "profiling": profiling,
+            "inference_debugging": inference_debugging,
             "fusion": fusion,
         }
 
@@ -195,6 +201,8 @@ def init(
         configs_dict["use_8bit_quantization"] = False
     if configs_dict.get("profiling", None) is None:
         configs_dict["profiling"] = False
+    if configs_dict.get("inference_debugging", None) is None:
+        configs_dict["inference_debugging"] = False
     if configs_dict.get("fusion", None) is None:
         configs_dict["fusion"] = True
 
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index 5bb5249f5d..80202f6f99 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -1592,7 +1592,8 @@ flexflow_generation_result_t
   std::string const text_str(input_text);
   prompts.push_back(input_text);
   GenerationResult result = handle->generate(prompts, max_seq_length);
-  DEBUG_PRINT("[Model] generate %p %s %i", handle, text_str, max_seq_length);
+  DEBUG_PRINT(
+      "[Model] generate %p %s %i", handle, text_str.c_str(), max_seq_length);
   assert(result.output_tokens.size() <= max_seq_length);
   output_length_and_tokens[0] = result.output_tokens.size();
   std::copy(result.output_tokens.begin(),
diff --git a/src/ops/add_bias_residual_layer_norm.cc b/src/ops/add_bias_residual_layer_norm.cc
index 159c82b346..42fbb3016a 100644
--- a/src/ops/add_bias_residual_layer_norm.cc
+++ b/src/ops/add_bias_residual_layer_norm.cc
@@ -508,6 +508,8 @@ OpMeta *AddBiasResidualLayerNorm::init_task(
   }
   meta->output_type[0] = ln->outputs[0]->data_type;
   meta->output_type[1] = ln->outputs[1]->data_type;
+  std::strcpy(meta->op_name, ln->name);
+  meta->layer_guid = ln->layer_guid;
   return meta;
 }
 
@@ -620,7 +622,7 @@ void AddBiasResidualLayerNorm::inference_task(
     return;
   }
 
-  AddBiasResidualLayerNormMeta const *m =
+  AddBiasResidualLayerNormMeta *m =
       *((AddBiasResidualLayerNormMeta **)task->local_args);
 
   assert(regions.size() ==
@@ -669,40 +671,6 @@ void AddBiasResidualLayerNorm::inference_task(
   assert(in_domain.get_volume() ==
          m->effective_num_elements * m->effective_batch_size);
 
-  // std::cout << std::endl << "INFERENCE task tensor dims:" << std::endl;
-  // std::cout << "input: ";
-  // for (int i=0; i<in_domain.get_dim(); i++) {
-  //   std::cout << in_domain.hi()[i] - in_domain.lo()[i] + 1 << " ";
-  // }
-  // std::cout << std::endl;
-  // std::cout << "residual: ";
-  // for (int i=0; i<residual_domain.get_dim(); i++) {
-  //   std::cout << residual_domain.hi()[i] - residual_domain.lo()[i] + 1 << "
-  //   ";
-  // }
-  // std::cout << std::endl;
-  // std::cout << "added_output: ";
-  // for (int i=0; i<added_out_domain.get_dim(); i++) {
-  //   std::cout << added_out_domain.hi()[i] - added_out_domain.lo()[i] + 1 << "
-  //   ";
-  // }
-  // std::cout << std::endl;
-  // std::cout << "output: ";
-  // for (int i=0; i<out_domain.get_dim(); i++) {
-  //   std::cout << out_domain.hi()[i] - out_domain.lo()[i] + 1 << " ";
-  // }
-  // std::cout << std::endl;
-  // std::cout << "attn_bias: ";
-  // for (int i=0; i<attn_bias_domain.get_dim(); i++) {
-  //   std::cout << attn_bias_domain.hi()[i] - attn_bias_domain.lo()[i] + 1 << "
-  //   ";
-  // }
-  // std::cout << std::endl;
-
-  // std::cout << "in_domain.get_volume(): " << in_domain.get_volume() <<
-  // std::endl; std::cout << "(int)attn_bias_dim: " << (int)attn_bias_dim <<
-  // std::endl;
-
   if (m->elementwise_affine) {
     gamma = helperGetGenericTensorAccessorRO(m->weight_type[1],
                                              regions[5],
@@ -749,6 +717,26 @@ void AddBiasResidualLayerNorm::inference_task(
       attn_bias,
       gamma,
       beta);
+
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    std::vector<GenericTensorAccessorR> weights_accessors;
+    weights_accessors.push_back(attn_bias);
+    if (m->elementwise_affine) {
+      weights_accessors.push_back(gamma);
+      if (m->use_bias) {
+        weights_accessors.push_back(beta);
+      }
+    }
+    AddBiasResidualLayerNorm::save_inference_tensors_to_file(
+        m,
+        shard_id,
+        bc,
+        {input, residual},
+        weights_accessors,
+        {added_output, output});
+  }
 }
 
 bool AddBiasResidualLayerNorm::measure_operator_cost(
@@ -759,6 +747,7 @@ bool AddBiasResidualLayerNorm::measure_operator_cost(
 void AddBiasResidualLayerNorm::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->layer_guid.transformer_layer_id);
+  sez.serialize(this->layer_guid.model_id);
   sez.serialize(this->axes.size());
   for (size_t i = 0; i < this->axes.size(); i++) {
     sez.serialize(this->axes[i]);
@@ -780,10 +769,11 @@ Node AddBiasResidualLayerNorm::deserialize(FFModel &ff,
   bool elementwise_affine;
   bool use_bias;
   float eps;
-  size_t id, transformer_layer_id;
+  size_t id, transformer_layer_id, deserialized_model_id;
   dez.deserialize(id);
   dez.deserialize(transformer_layer_id);
-  LayerID layer_guid(id, transformer_layer_id);
+  dez.deserialize(deserialized_model_id);
+  LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
   dez.deserialize(num_axes);
   for (size_t i = 0; i < num_axes; i++) {
     int axis_idx;
@@ -812,6 +802,7 @@ size_t hash<FlexFlow::AddBiasResidualLayerNormParams>::operator()(
   size_t key = 0;
   hash_combine(key, params.layer_guid.id);
   hash_combine(key, params.layer_guid.transformer_layer_id);
+  hash_combine(key, params.layer_guid.model_id);
   hash_combine(key, params.axes.size());
   for (int n : params.axes) {
     hash_combine(key, n);
diff --git a/src/ops/add_bias_residual_layer_norm.cpp b/src/ops/add_bias_residual_layer_norm.cpp
index 3570ae42dc..1add43ecd9 100644
--- a/src/ops/add_bias_residual_layer_norm.cpp
+++ b/src/ops/add_bias_residual_layer_norm.cpp
@@ -34,6 +34,7 @@ AddBiasResidualLayerNormMeta::AddBiasResidualLayerNormMeta(
   effective_batch_size = ln->effective_batch_size;
   effective_num_elements = ln->effective_num_elements;
   profiling = ln->profiling;
+  inference_debugging = ln->inference_debugging;
   eps = ln->eps;
   DataType data_type = ln->data_type;
   size_t totalSize = effective_batch_size * data_type_size(data_type) * 3;
diff --git a/src/ops/add_bias_residual_layer_norm.cu b/src/ops/add_bias_residual_layer_norm.cu
index 626e56d64f..ceb1a6514e 100644
--- a/src/ops/add_bias_residual_layer_norm.cu
+++ b/src/ops/add_bias_residual_layer_norm.cu
@@ -33,6 +33,7 @@ AddBiasResidualLayerNormMeta::AddBiasResidualLayerNormMeta(
   effective_batch_size = ln->effective_batch_size;
   effective_num_elements = ln->effective_num_elements;
   profiling = ln->profiling;
+  inference_debugging = ln->inference_debugging;
   eps = ln->eps;
   DataType data_type = ln->data_type;
   size_t totalSize = effective_batch_size * data_type_size(data_type) * 3;
diff --git a/src/ops/aggregate.cc b/src/ops/aggregate.cc
index c7217bb700..67810d3f5b 100644
--- a/src/ops/aggregate.cc
+++ b/src/ops/aggregate.cc
@@ -235,6 +235,9 @@ OpMeta *Aggregate::init_task(Task const *task,
   FFHandler handle = *((FFHandler *)task->local_args);
   AggregateMeta *m = new AggregateMeta(handle, agg->n);
   m->profiling = agg->profiling;
+  m->inference_debugging = agg->inference_debugging;
+  std::strcpy(m->op_name, agg->name);
+  m->layer_guid = agg->layer_guid;
   return m;
 }
 
diff --git a/src/ops/aggregate_spec.cc b/src/ops/aggregate_spec.cc
index 5190983148..19b2edc14a 100644
--- a/src/ops/aggregate_spec.cc
+++ b/src/ops/aggregate_spec.cc
@@ -209,6 +209,9 @@ OpMeta *AggregateSpec::init_task(Task const *task,
   FFHandler handle = *((FFHandler *)task->local_args);
   AggregateSpecMeta *m = new AggregateSpecMeta(handle, agg->n);
   m->profiling = agg->profiling;
+  m->inference_debugging = agg->inference_debugging;
+  std::strcpy(m->op_name, agg->name);
+  m->layer_guid = agg->layer_guid;
   return m;
 }
 
diff --git a/src/ops/arg_topk.cc b/src/ops/arg_topk.cc
index b877a9f96d..a06b89de07 100644
--- a/src/ops/arg_topk.cc
+++ b/src/ops/arg_topk.cc
@@ -241,7 +241,10 @@ OpMeta *ArgTopK::init_task(Task const *task,
   FFHandler handle = *((FFHandler *)task->local_args);
   ArgTopKMeta *m = new ArgTopKMeta(handle, topk);
   m->profiling = topk->profiling;
+  m->inference_debugging = topk->inference_debugging;
   m->sorted = topk->sorted;
+  std::strcpy(m->op_name, topk->name);
+  m->layer_guid = topk->layer_guid;
   return m;
 }
 
@@ -308,7 +311,7 @@ InferenceResult
     InferenceResult ir;
     return ir;
   }
-  ArgTopKMeta const *m = *((ArgTopKMeta **)task->local_args);
+  ArgTopKMeta *m = *((ArgTopKMeta **)task->local_args);
 
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
@@ -318,6 +321,13 @@ InferenceResult
   int batch_size = bc->num_active_tokens();
   ArgTopK::forward_kernel_wrapper(m, input, indices, batch_size);
 
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    ArgTopK::save_inference_tensors_to_file(
+        m, shard_id, bc, {input}, {}, {indices});
+  }
+
   InferenceResult ir;
   download_tensor<BatchConfig::TokenId>(
       indices.get_int32_ptr(), ir.token_ids, batch_size);
@@ -332,6 +342,7 @@ void ArgTopK::backward(FFModel const &ff) {
 void ArgTopK::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->layer_guid.transformer_layer_id);
+  sez.serialize(this->layer_guid.model_id);
   sez.serialize(this->k);
   sez.serialize(this->sorted);
 }
@@ -341,10 +352,11 @@ Node ArgTopK::deserialize(FFModel &ff,
                           ParallelTensor inputs[],
                           int num_inputs) {
   assert(num_inputs == 1);
-  size_t id, transformer_layer_id;
+  size_t id, transformer_layer_id, deserialized_model_id;
   dez.deserialize(id);
   dez.deserialize(transformer_layer_id);
-  LayerID layer_guid(id, transformer_layer_id);
+  dez.deserialize(deserialized_model_id);
+  LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
   int k;
   bool sorted;
   dez.deserialize(k);
diff --git a/src/ops/argmax.cc b/src/ops/argmax.cc
index 7863931c82..f336c843e8 100644
--- a/src/ops/argmax.cc
+++ b/src/ops/argmax.cc
@@ -245,7 +245,10 @@ OpMeta *ArgMax::init_task(Task const *task,
                                  length * batch_size,
                                  gpu_mem_allocator);
   m->profiling = s->profiling;
+  m->inference_debugging = s->inference_debugging;
   m->beam_search = s->beam_search;
+  std::strcpy(m->op_name, s->name);
+  m->layer_guid = s->layer_guid;
   return m;
 }
 
@@ -339,7 +342,7 @@ BeamInferenceResult
     BeamInferenceResult ir;
     return ir;
   }
-  ArgMaxMeta const *m = *((ArgMaxMeta **)task->local_args);
+  ArgMaxMeta *m = *((ArgMaxMeta **)task->local_args);
 
   GenericTensorAccessorW input = helperGetGenericTensorAccessorRW(
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
@@ -355,6 +358,14 @@ BeamInferenceResult
       indices.get_int32_ptr(), ir.token_ids, batch_size);
   download_tensor(m->probs, ir.probs, batch_size);
   download_tensor<int>(parent.get_int32_ptr(), ir.parent_id, batch_size);
+
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    ArgMax::save_inference_tensors_to_file(
+        m, shard_id, bc, {}, {}, {input, indices, parent});
+  }
+
   return ir;
 }
 
@@ -365,7 +376,7 @@ InferenceResult
                                 Runtime *runtime) {
   assert(regions.size() == 2);
   assert(task->regions.size() == 2);
-  ArgMaxMeta const *m = *((ArgMaxMeta **)task->local_args);
+  ArgMaxMeta *m = *((ArgMaxMeta **)task->local_args);
   BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
   if (bc->num_tokens == 0) {
     // Directly return for empty batch config
@@ -381,6 +392,12 @@ InferenceResult
   int batch_size = bc->num_active_tokens();
   ArgMax::forward_kernel_wrapper(m, input, indices, parent, batch_size);
   InferenceResult ir;
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    ArgMax::save_inference_tensors_to_file(
+        m, shard_id, bc, {}, {}, {input, indices});
+  }
   download_tensor<BatchConfig::TokenId>(
       indices.get_int32_ptr(), ir.token_ids, batch_size);
   return ir;
diff --git a/src/ops/attention.cc b/src/ops/attention.cc
index 027ea18634..1f71be07a8 100644
--- a/src/ops/attention.cc
+++ b/src/ops/attention.cc
@@ -521,6 +521,9 @@ OpMeta *
   MultiHeadAttentionMeta *m =
       new MultiHeadAttentionMeta(handle, attn, gpu_mem, num_samples, num_heads);
   m->profiling = attn->profiling;
+  m->inference_debugging = attn->inference_debugging;
+  std::strcpy(m->op_name, attn->name);
+  m->layer_guid = attn->layer_guid;
   assert(acc_weight.rect.volume() * sizeof(float) == m->weightSize);
   return m;
 }
diff --git a/src/ops/batch_matmul.cc b/src/ops/batch_matmul.cc
index 977c5443b9..f4b06877e5 100644
--- a/src/ops/batch_matmul.cc
+++ b/src/ops/batch_matmul.cc
@@ -274,8 +274,11 @@ OpMeta *BatchMatmul::init_task(Task const *task,
   FFHandler handle = *((FFHandler const *)task->local_args);
   BatchMatmulMeta *m = new BatchMatmulMeta(handle);
   m->profiling = bmm->profiling;
+  m->inference_debugging = bmm->inference_debugging;
   m->a_seq_length_dim = bmm->a_seq_length_dim;
   m->b_seq_length_dim = bmm->b_seq_length_dim;
+  std::strcpy(m->op_name, bmm->name);
+  m->layer_guid = bmm->layer_guid;
   return m;
 }
 
diff --git a/src/ops/batch_norm.cpp b/src/ops/batch_norm.cpp
index 34a7fcbe72..106e5ebad2 100644
--- a/src/ops/batch_norm.cpp
+++ b/src/ops/batch_norm.cpp
@@ -293,6 +293,7 @@ BatchNormMeta::BatchNormMeta(FFHandler handler,
   checkCUDNN(miopenCreateTensorDescriptor(&outputTensor));
   relu = bn->relu;
   profiling = bn->profiling;
+  inference_debugging = bn->inference_debugging;
   mode = miopenBNSpatial;
   // #if HIPDNN_VERSION >= 7000
   //   mode = HIPDNN_BATCHNORM_SPATIAL_PERSISTENT;
diff --git a/src/ops/batch_norm.cu b/src/ops/batch_norm.cu
index c17244dce0..b77e9d489f 100644
--- a/src/ops/batch_norm.cu
+++ b/src/ops/batch_norm.cu
@@ -279,6 +279,7 @@ BatchNormMeta::BatchNormMeta(FFHandler handler,
   checkCUDNN(cudnnCreateTensorDescriptor(&outputTensor));
   relu = bn->relu;
   profiling = bn->profiling;
+  inference_debugging = bn->inference_debugging;
   mode = CUDNN_BATCHNORM_SPATIAL;
 #if CUDNN_VERSION >= 7000
   mode = CUDNN_BATCHNORM_SPATIAL_PERSISTENT;
diff --git a/src/ops/beam_topk.cc b/src/ops/beam_topk.cc
index 93a6de5a8f..2883428254 100644
--- a/src/ops/beam_topk.cc
+++ b/src/ops/beam_topk.cc
@@ -278,6 +278,9 @@ OpMeta *BeamTopK::init_task(Task const *task,
   MemoryAllocator gpu_mem_allocator(gpu_mem);
   BeamTopKMeta *m = new BeamTopKMeta(handle, topk, gpu_mem_allocator);
   m->profiling = topk->profiling;
+  m->inference_debugging = topk->inference_debugging;
+  std::strcpy(m->op_name, topk->name);
+  m->layer_guid = topk->layer_guid;
   m->sorted = topk->sorted;
   m->max_beam_width = topk->max_beam_width;
   m->input_type[0] = topk->inputs[0]->data_type;
@@ -346,60 +349,36 @@ BeamInferenceResult
 
   assert(regions.size() == 4);
   assert(task->regions.size() == 4);
-  // BeamSearchBatchConfig const *bc = (BeamSearchBatchConfig *)task->args;
 
+  BeamTopKMeta *m = *((BeamTopKMeta **)task->local_args);
   BeamSearchBatchConfig const &bc =
       Future(task->futures[0]).get_result<BeamSearchBatchConfig>();
-  // std::cout << "beam search topk inference: "
-  //           << "\n";
+
   if (bc.num_tokens == 0) {
     BeamInferenceResult ir;
     return ir;
   }
 
-  BeamTopKMeta const *m = *((BeamTopKMeta **)task->local_args);
-  Domain in1_domain = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  //   Domain out1_domain = runtime->get_index_space_domain(
-  //       ctx, task->regions[1].region.get_index_space());
-  Domain out2_domain = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  int numdims = in1_domain.get_dim();
-
-  // float const *in_ptr = helperGetTensorPointerRO<float>(
-  //     regions[0], task->regions[0], FID_DATA, ctx, runtime);
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  //   float *value_ptr = helperGetTensorPointerWO<float>(
-  //       regions[1], task->regions[1], FID_DATA, ctx, runtime);
-  int *index_ptr = helperGetTensorPointerWO<int>(
-      regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW index = helperGetGenericTensorAccessorWO(
+      DT_INT32, regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW value = helperGetGenericTensorAccessorWO(
+      DT_FLOAT, regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW parent = helperGetGenericTensorAccessorWO(
+      DT_FLOAT, regions[3], task->regions[3], FID_DATA, ctx, runtime);
+
+  Domain input_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
 
-  // );
-  float *value_ptr = helperGetTensorPointerWO<float>(
-      regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  int *index_ptr = index.get_int32_ptr();
+  float *value_ptr = value.get_float_ptr();
+  int *parent_ptr = parent.get_int32_ptr();
 
-  int *parent_ptr = helperGetTensorPointerWO<int>(
-      regions[3], task->regions[3], FID_DATA, ctx, runtime);
   // embedding size: eg. 4096
-  int length = in1_domain.hi()[0] - in1_domain.lo()[0] + 1;
-
-  // int k = out2_domain.hi()[0] - out2_domain.lo()[0] + 1;
-
+  int length = input_domain.hi()[0] - input_domain.lo()[0] + 1;
   // total token nums
-  // size_t tokens_per_request = in1_domain.hi()[1] - in1_domain.lo()[1] + 1;
-  // size_t batch_size = in1_domain.get_volume() / length;
   size_t batch_size = bc.num_active_tokens();
-  // std::vector<int> beam_width;
-  // std::unordered_map<size_t, int> sub_requests = bc->sub_requests;
-  // for (int i = 0; i < bc->MAX_NUM_REQUESTS; i++) {
-  //   if (bc->request_completed[i]) {
-  //     continue;
-  //   }
-  //   // add beam width for each main request
-  //   beam_width.push_back(sub_requests[i]);
-  //   std::cout << "sub req num: " <<sub_requests[i] << "\n";
-  // }
 
   // need meta for: how many sub requests in a main request
   BeamTopK::forward_kernel_wrapper(m,
@@ -416,15 +395,16 @@ BeamInferenceResult
 
   download_tensor<int>(index_ptr, ir.token_ids, batch_size * m->max_beam_width);
   download_tensor<float>(value_ptr, ir.probs, batch_size * m->max_beam_width);
-  // if(m->output_type[0] == DT_FLOAT){
-  //     download_tensor<float>(value.get_float_ptr(), ir.probs, batch_size *
-  //     m->max_beam_width);
-  // }else if(m->output_type[0] == DT_HALF){
-  //     download_tensor<float>(value.get_half_ptr(), ir.probs, batch_size *
-  //     m->max_beam_width);
-  // }
   download_tensor<int>(
       parent_ptr, ir.parent_id, batch_size * m->max_beam_width);
+
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    BeamTopK::save_inference_tensors_to_file(
+        m, shard_id, &bc, {input}, {}, {index, value, parent});
+  }
+
   return ir;
 }
 
@@ -435,6 +415,7 @@ void BeamTopK::backward(FFModel const &ff) {
 void BeamTopK::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->layer_guid.transformer_layer_id);
+  sez.serialize(this->layer_guid.model_id);
   sez.serialize(this->sorted);
   sez.serialize(this->max_beam_width);
 }
@@ -445,11 +426,12 @@ Node BeamTopK::deserialize(FFModel &ff,
                            int num_inputs) {
   assert(num_inputs == 1);
   bool sorted;
-  size_t id, transformer_layer_id;
+  size_t id, transformer_layer_id, deserialized_model_id;
   int max_beam_width;
   dez.deserialize(id);
   dez.deserialize(transformer_layer_id);
-  LayerID layer_guid(id, transformer_layer_id);
+  dez.deserialize(deserialized_model_id);
+  LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
   dez.deserialize(sorted);
   dez.deserialize(max_beam_width);
   BeamTopKParams params;
diff --git a/src/ops/cache.cc b/src/ops/cache.cc
index 339b2cab55..691e45b559 100644
--- a/src/ops/cache.cc
+++ b/src/ops/cache.cc
@@ -168,6 +168,9 @@ OpMeta *Cache::init_task(Task const *task,
   CacheMeta *m = new CacheMeta(handle);
   m->cache_score = 0.0f;
   m->profiling = c->profiling;
+  m->inference_debugging = c->inference_debugging;
+  std::strcpy(m->op_name, c->name);
+  m->layer_guid = c->layer_guid;
   return m;
 }
 
diff --git a/src/ops/cast.cc b/src/ops/cast.cc
index d98a54fe62..2a845cb303 100644
--- a/src/ops/cast.cc
+++ b/src/ops/cast.cc
@@ -193,6 +193,8 @@ OpMeta *Cast::init_task(Task const *task,
   CastMeta *m = new CastMeta(handler);
   m->input_data_type = cast->inputs[0]->data_type;
   m->output_data_type = cast->outputs[0]->data_type;
+  std::strcpy(m->op_name, cast->name);
+  m->layer_guid = cast->layer_guid;
   return m;
 }
 
diff --git a/src/ops/concat.cc b/src/ops/concat.cc
index 8014d1e145..80935e387b 100644
--- a/src/ops/concat.cc
+++ b/src/ops/concat.cc
@@ -201,7 +201,9 @@ OpMeta *Concat::init_task(Task const *task,
   // Note that our internal axis index ordering is opposite to other frameworks
   init_meta(m, cc->legion_axis);
   m->profiling = cc->profiling;
+  m->inference_debugging = cc->inference_debugging;
   std::strcpy(m->op_name, cc->name);
+  m->layer_guid = cc->layer_guid;
   return m;
 }
 
diff --git a/src/ops/conv_2d.cc b/src/ops/conv_2d.cc
index ce7b6ebc01..7d8fd32570 100644
--- a/src/ops/conv_2d.cc
+++ b/src/ops/conv_2d.cc
@@ -592,8 +592,10 @@ OpMeta *Conv2D::init_task(Task const *task,
   m->relu = conv->activation == AC_MODE_RELU;
   m->use_bias = conv->use_bias;
   m->profiling = conv->profiling;
+  m->inference_debugging = conv->inference_debugging;
   m->trainableInputs[0] = conv->trainableInputs[0];
   std::strcpy(m->op_name, conv->name);
+  m->layer_guid = conv->layer_guid;
 
   int input_w = acc_input.rect.hi[0] - acc_input.rect.lo[0] + 1;
   int input_h = acc_input.rect.hi[1] - acc_input.rect.lo[1] + 1;
@@ -1013,6 +1015,7 @@ bool Conv2D::estimate_sync_cost(Simulator *sim,
 void Conv2D::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->layer_guid.transformer_layer_id);
+  sez.serialize(this->layer_guid.model_id);
   sez.serialize(this->out_channels);
   sez.serialize(this->kernel_h);
   sez.serialize(this->kernel_w);
@@ -1037,10 +1040,11 @@ Node Conv2D::deserialize(FFModel &ff,
       padding_w, groups;
   bool use_bias;
   ActiMode activation;
-  size_t id, transformer_layer_id;
+  size_t id, transformer_layer_id, deserialized_model_id;
   dez.deserialize(id);
   dez.deserialize(transformer_layer_id);
-  LayerID layer_guid(id, transformer_layer_id);
+  dez.deserialize(deserialized_model_id);
+  LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
   dez.deserialize(out_channels);
   dez.deserialize(kernel_h);
   dez.deserialize(kernel_w);
diff --git a/src/ops/dropout.cc b/src/ops/dropout.cc
index e4021a404e..9b11c9d912 100644
--- a/src/ops/dropout.cc
+++ b/src/ops/dropout.cc
@@ -170,6 +170,8 @@ OpMeta *Dropout::init_task(Task const *task,
                        .first();
   assert(input_domain == output_domain);
   DropoutMeta *m = new DropoutMeta(handle, dropout, gpu_mem, output_domain);
+  std::strcpy(m->op_name, dropout->name);
+  m->layer_guid = dropout->layer_guid;
   return m;
 }
 
diff --git a/src/ops/element_binary.cc b/src/ops/element_binary.cc
index 21edad11e3..aa31477815 100644
--- a/src/ops/element_binary.cc
+++ b/src/ops/element_binary.cc
@@ -420,11 +420,13 @@ OpMeta *ElementBinary::init_task(Task const *task,
   }
   m->op_type = eb->op_type;
   m->profiling = eb->profiling;
+  m->inference_debugging = eb->inference_debugging;
   m->inplace_a = eb->inplace_a;
   m->has_same_operands = eb->has_same_operands;
   m->broadcast_input1 = eb->broadcast_input1;
   m->broadcast_input2 = eb->broadcast_input2;
   std::strcpy(m->op_name, eb->name);
+  m->layer_guid = eb->layer_guid;
   Domain input1_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
   Domain input2_domain, output_domain;
@@ -620,7 +622,7 @@ __host__ void
     return;
   }
   // const ElementBinary* ele = (const ElementBinary*) task->args;
-  ElementBinaryMeta const *m = *((ElementBinaryMeta **)task->local_args);
+  ElementBinaryMeta *m = *((ElementBinaryMeta **)task->local_args);
   GenericTensorAccessorR in1, in2;
   GenericTensorAccessorW out;
   Domain in1_domain = runtime->get_index_space_domain(
@@ -705,8 +707,14 @@ __host__ void
                                              runtime);
     }
   }
-
   forward_kernel_wrapper(m, in1, in2, out);
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    std::vector<GenericTensorAccessorR> weights_accessors;
+    ElementBinary::save_inference_tensors_to_file(
+        m, shard_id, bc, {in1, in2}, {}, {out});
+  }
 }
 
 /*
@@ -1011,6 +1019,7 @@ bool ElementBinary::measure_operator_cost(Simulator *sim,
   ElementBinaryMeta *m = new ElementBinaryMeta(sim->handler, this);
   m->op_type = op_type;
   m->profiling = this->profiling;
+  m->inference_debugging = this->inference_debugging;
   m->inplace_a = this->inplace_a;
   m->has_same_operands = this->has_same_operands;
   m->broadcast_input1 = this->broadcast_input1;
@@ -1103,6 +1112,7 @@ bool ElementBinary::measure_operator_cost(Simulator *sim,
 void ElementBinary::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->layer_guid.transformer_layer_id);
+  sez.serialize(this->layer_guid.model_id);
   sez.serialize(this->op_type);
   sez.serialize(this->inplace_a);
 }
@@ -1115,11 +1125,12 @@ Node ElementBinary::deserialize(FFModel &ff,
                                 int num_inputs) {
   assert(num_inputs == 2);
   OperatorType op_type;
-  size_t id, transformer_layer_id;
+  size_t id, transformer_layer_id, deserialized_model_id;
   bool inplace_a;
   dez.deserialize(id);
   dez.deserialize(transformer_layer_id);
-  LayerID layer_guid(id, transformer_layer_id);
+  dez.deserialize(deserialized_model_id);
+  LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
   dez.deserialize(op_type);
   dez.deserialize(inplace_a);
 
diff --git a/src/ops/element_unary.cc b/src/ops/element_unary.cc
index bdb594b0f6..9fb2e6dc1f 100644
--- a/src/ops/element_unary.cc
+++ b/src/ops/element_unary.cc
@@ -360,9 +360,11 @@ OpMeta *ElementUnary::init_task(Task const *task,
   // Input and output should have the same data type
   assert(eu->outputs[0]->data_type == eu->inputs[0]->data_type);
   m->profiling = eu->profiling;
+  m->inference_debugging = eu->inference_debugging;
   m->inplace = eu->inplace;
   m->scalar = eu->scalar;
   std::strcpy(m->op_name, eu->name);
+  m->layer_guid = eu->layer_guid;
   if (m->inplace) {
     assert(regions.size() == 1);
     assert(task->regions.size() == 1);
@@ -525,7 +527,7 @@ void ElementUnary::forward_task_with_type(
     Context ctx,
     Runtime *runtime) {
   // const ElementUnary* ele = (const ElementUnary*) task->args;
-  ElementUnaryMeta const *m = *((ElementUnaryMeta **)task->local_args);
+  ElementUnaryMeta *m = *((ElementUnaryMeta **)task->local_args);
   Domain input_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
   const DT *input_ptr = NULL;
@@ -550,6 +552,27 @@ void ElementUnary::forward_task_with_type(
 
   ElementUnary::forward_kernel_wrapper<DT>(
       m, input_ptr, output_ptr, input_domain.get_volume());
+
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    std::vector<GenericTensorAccessorR> input_accessors;
+    std::vector<GenericTensorAccessorW> output_accessors;
+    if (m->inplace) {
+      GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+          m->data_type, regions[0], task->regions[0], FID_DATA, ctx, runtime);
+      output_accessors.push_back(output);
+    } else {
+      GenericTensorAccessorR input = helperGetGenericTensorAccessorWO(
+          m->data_type, regions[0], task->regions[0], FID_DATA, ctx, runtime);
+      GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+          m->data_type, regions[1], task->regions[1], FID_DATA, ctx, runtime);
+      input_accessors.push_back(input);
+      output_accessors.push_back(output);
+    }
+    ElementUnary::save_inference_tensors_to_file(
+        m, shard_id, nullptr, input_accessors, {}, output_accessors);
+  }
 }
 
 void ElementUnary::backward(FFModel const &ff) {
@@ -699,6 +722,7 @@ void ElementUnary::serialize(Legion::Serializer &sez) const {
   sez.serialize(scalar);
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->layer_guid.transformer_layer_id);
+  sez.serialize(this->layer_guid.model_id);
 }
 
 bool ElementUnary::measure_operator_cost(Simulator *sim,
@@ -809,10 +833,11 @@ Node ElementUnary::deserialize(FFModel &ff,
   dez.deserialize(op_type);
   dez.deserialize(inplace);
   dez.deserialize(scalar);
-  size_t id, transformer_layer_id;
+  size_t id, transformer_layer_id, deserialized_model_id;
   dez.deserialize(id);
   dez.deserialize(transformer_layer_id);
-  LayerID layer_guid(id, transformer_layer_id);
+  dez.deserialize(deserialized_model_id);
+  LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
 
   ElementUnaryParams params;
   params.op_type = op_type;
diff --git a/src/ops/embedding.cc b/src/ops/embedding.cc
index 409dcb398e..007e799fe0 100644
--- a/src/ops/embedding.cc
+++ b/src/ops/embedding.cc
@@ -416,7 +416,10 @@ OpMeta *Embedding::init_task(Task const *task,
   FFHandler handle = *((FFHandler const *)task->local_args);
   EmbeddingMeta *m = new EmbeddingMeta(handle, embed);
   m->profiling = embed->profiling;
+  m->inference_debugging = embed->inference_debugging;
   m->aggr = embed->aggr;
+  std::strcpy(m->op_name, embed->name);
+  m->layer_guid = embed->layer_guid;
   return m;
 }
 
@@ -514,7 +517,7 @@ void Embedding::forward_task(Task const *task,
                              std::vector<PhysicalRegion> const &regions,
                              Context ctx,
                              Runtime *runtime) {
-  EmbeddingMeta const *m = *((EmbeddingMeta **)task->local_args);
+  EmbeddingMeta *m = *((EmbeddingMeta **)task->local_args);
   assert(regions.size() == 3);
   assert(task->regions.size() == 3);
   // Assert that weight and output must have the same data type
@@ -561,75 +564,13 @@ void Embedding::forward_task(Task const *task,
   }
   forward_kernel_wrapper(
       m, input, output, kernel, in_dim, out_dim, effective_batch_size);
-}
-
-#ifdef DEADCODE
-template <typename TI>
-void Embedding::forward_task_with_type(
-    Task const *task,
-    std::vector<PhysicalRegion> const &regions,
-    Context ctx,
-    Runtime *runtime) {
-  assert(regions.size() == 3);
-  assert(task->regions.size() == 3);
-  // const Embedding* embed = (Embedding*) task->args;
-  EmbeddingMeta const *m = *((EmbeddingMeta **)task->local_args);
-  Domain input_domain = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  Domain output_domain = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  Domain kernel_domain = runtime->get_index_space_domain(
-      ctx, task->regions[2].region.get_index_space());
-  if (m->aggr == AGGR_MODE_NONE) {
-    // assert(kernel_domain.get_dim() == 2);
-    assert(input_domain.get_dim() + 1 == output_domain.get_dim());
-    for (size_t i = 0; i < input_domain.get_dim(); i++) {
-      assert(input_domain.hi()[i] == output_domain.hi()[i + 1]);
-      assert(input_domain.lo()[i] == output_domain.lo()[i + 1]);
-    }
-    assert(kernel_domain.hi()[0] - kernel_domain.lo()[0] ==
-           output_domain.hi()[0] - output_domain.lo()[0]);
-  } else {
-    // assert(kernel_domain.get_dim() == 2);
-    assert(input_domain.get_dim() == output_domain.get_dim());
-    for (size_t i = 1; i < input_domain.get_dim(); i++) {
-      assert(input_domain.hi()[i] == output_domain.hi()[i]);
-      assert(input_domain.lo()[i] == output_domain.lo()[i]);
-    }
-    assert(kernel_domain.hi()[0] - kernel_domain.lo()[0] ==
-           output_domain.hi()[0] - output_domain.lo()[0]);
-  }
-  const TI *input_ptr = helperGetTensorPointerRO<TI>(
-      regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  float *output_ptr = helperGetTensorPointerWO<float>(
-      regions[1], task->regions[1], FID_DATA, ctx, runtime);
-  float const *kernel_ptr = helperGetTensorPointerRO<float>(
-      regions[2], task->regions[2], FID_DATA, ctx, runtime);
-
-  int in_dim, out_dim, effective_batch_size;
-  if (m->aggr == AGGR_MODE_NONE) {
-    in_dim = 1;
-    out_dim = output_domain.hi()[0] - output_domain.lo()[0] + 1;
-    effective_batch_size = output_domain.get_volume() / out_dim;
-    assert(effective_batch_size * in_dim == input_domain.get_volume());
-  } else {
-    in_dim = input_domain.hi()[0] - input_domain.lo()[0] + 1;
-    out_dim = output_domain.hi()[0] - output_domain.lo()[0] + 1;
-    effective_batch_size = output_domain.get_volume() / out_dim;
-    assert(effective_batch_size * in_dim == input_domain.get_volume());
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    Embedding::save_inference_tensors_to_file(
+        m, shard_id, nullptr, {input}, {kernel}, {output});
   }
-
-  forward_kernel_wrapper<TI>(m,
-                             input_ptr,
-                             output_ptr,
-                             kernel_ptr,
-                             in_dim,
-                             out_dim,
-                             effective_batch_size,
-                             m->aggr,
-                             output_domain.get_volume());
 }
-#endif
 
 void Embedding::backward(FFModel const &ff) {
   ArgumentMap argmap;
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index c8b0ec0f26..6a7d622e51 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -398,6 +398,7 @@ void Experts::serialize(Legion::Serializer &sez) const {
   ExpertsParams params = get_params();
   sez.serialize(params.layer_guid.id);
   sez.serialize(params.layer_guid.transformer_layer_id);
+  sez.serialize(params.layer_guid.model_id);
   sez.serialize(params.num_experts);
   sez.serialize(params.experts_start_idx);
   sez.serialize(params.experts_output_dim_size);
@@ -418,10 +419,11 @@ Node Experts::deserialize(FFModel &ff,
   float alpha;
   ActiMode activation;
   bool use_bias;
-  size_t id, transformer_layer_id;
+  size_t id, transformer_layer_id, deserialized_model_id;
   dez.deserialize(id);
   dez.deserialize(transformer_layer_id);
-  LayerID layer_guid(id, transformer_layer_id);
+  dez.deserialize(deserialized_model_id);
+  LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
   dez.deserialize(num_experts);
   dez.deserialize(experts_start_idx);
   dez.deserialize(experts_output_dim_size);
@@ -593,6 +595,9 @@ OpMeta *Experts::init_task(Task const *task,
                                    exp->use_bias,
                                    exp->activation);
   m->profiling = exp->profiling;
+  m->inference_debugging = exp->inference_debugging;
+  std::strcpy(m->op_name, exp->name);
+  m->layer_guid = exp->layer_guid;
   return m;
 }
 
@@ -732,7 +737,7 @@ void Experts::inference_task(Task const *task,
                              Runtime *runtime) {
   assert(regions.size() == task->regions.size());
 
-  ExpertsMeta const *m = *((ExpertsMeta **)task->local_args);
+  ExpertsMeta *m = *((ExpertsMeta **)task->local_args);
   BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
   if (bc->num_tokens == 0) {
     return;
@@ -743,14 +748,19 @@ void Experts::inference_task(Task const *task,
   assert(regions.size() - 4 == (1 + use_bias));
 
   // get input, indices, topk_gate_preds, outputs
-  float const *input_ptr = helperGetTensorPointerRO<float>(
-      regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  int const *indices_ptr = helperGetTensorPointerRO<int>(
-      regions[1], task->regions[1], FID_DATA, ctx, runtime);
-  float const *topk_gate_pred_ptr = helperGetTensorPointerRO<float>(
-      regions[2], task->regions[2], FID_DATA, ctx, runtime);
-  float *output_ptr = helperGetTensorPointerWO<float>(
-      regions[3], task->regions[3], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      DT_FLOAT, regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR indices = helperGetGenericTensorAccessorRO(
+      DT_INT32, regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR topk_gate_preds = helperGetGenericTensorAccessorRO(
+      DT_FLOAT, regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      DT_FLOAT, regions[3], task->regions[3], FID_DATA, ctx, runtime);
+
+  float const *input_ptr = input.get_float_ptr();
+  int const *indices_ptr = indices.get_int32_ptr();
+  float const *topk_gate_pred_ptr = topk_gate_preds.get_float_ptr();
+  float *output_ptr = output.get_float_ptr();
   assert(input_ptr != nullptr && indices_ptr != nullptr &&
          topk_gate_pred_ptr != nullptr && output_ptr != nullptr);
 
@@ -1107,6 +1117,13 @@ void Experts::inference_task(Task const *task,
     free(cpu_output_ptr);
   }
 #endif
+
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    Experts::save_inference_tensors_to_file(
+        m, shard_id, bc, {input, indices, topk_gate_preds}, {}, {output});
+  }
 }
 
 void Experts::forward_task(Task const *task,
diff --git a/src/ops/fused.cu b/src/ops/fused.cu
index 5f2874e662..7d0d5841f0 100644
--- a/src/ops/fused.cu
+++ b/src/ops/fused.cu
@@ -1088,6 +1088,31 @@ __host__ void
         assert(false && "Fusion currently does not support type");
       }
     }
+    if (metas->meta[op]->inference_debugging) {
+      std::vector<GenericTensorAccessorR> input_accessors_to_save;
+      std::vector<GenericTensorAccessorR> weight_accessors_to_save;
+      std::vector<GenericTensorAccessorW> output_accessors_to_save;
+      for (int i = 0; i < fused->op_num_inputs[op]; i++) {
+        int my_off = fused->op_input_idx[i + ioff];
+        if (fused->op_input_source[i + ioff] == SOURCE_INPUT) {
+          input_accessors_to_save.push_back(input_accessor[my_off]);
+        } else if (fused->op_input_source[i + ioff] == SOURCE_OUTPUT) {
+          input_accessors_to_save.push_back(output_accessor[my_off]);
+        } else {
+          assert(false);
+        }
+      }
+      for (int i = 0; i < fused->op_num_weights[op]; i++) {
+        assert(fused->op_weight_source[i + woff] == SOURCE_WEIGHT);
+        weight_accessors_to_save.push_back(weight_accessor[fused->op_weight_idx[i + woff]]);
+      }
+      for (int i = 0; i < fused->op_num_outputs[op]; i++) {
+        output_accessors_to_save.push_back(output_accessor[i + ooff]);
+      }
+      assert(task->index_point.get_dim() == 1);
+      int shard_id = task->index_point.point_data[0];
+      FusedOp::save_inference_tensors_to_file(metas->meta[op], shard_id, bc, input_accessors_to_save, weight_accessors_to_save, output_accessors_to_save);
+    }
     ioff += fused->op_num_inputs[op];
     woff += fused->op_num_weights[op];
     ooff += fused->op_num_outputs[op];
diff --git a/src/ops/gather.cc b/src/ops/gather.cc
index 635c741d8b..d7c1dee44c 100644
--- a/src/ops/gather.cc
+++ b/src/ops/gather.cc
@@ -167,6 +167,7 @@ void Gather::serialize(Legion::Serializer &sez) const {
   sez.serialize(params.legion_dim);
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->layer_guid.transformer_layer_id);
+  sez.serialize(this->layer_guid.model_id);
 }
 
 using PCG::Node;
@@ -178,10 +179,11 @@ Node Gather::deserialize(FFModel &ff,
   assert(num_inputs == 2);
   int legion_dim;
   dez.deserialize(legion_dim);
-  size_t id, transformer_layer_id;
+  size_t id, transformer_layer_id, deserialized_model_id;
   dez.deserialize(id);
   dez.deserialize(transformer_layer_id);
-  LayerID layer_guid(id, transformer_layer_id);
+  dez.deserialize(deserialized_model_id);
+  LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
 
   GatherParams params;
   params.legion_dim = legion_dim;
@@ -243,6 +245,8 @@ OpMeta *Gather::init_task(Task const *task,
   Gather const *gather = (Gather const *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
   GatherMeta *m = new GatherMeta(handle, gather);
+  std::strcpy(m->op_name, gather->name);
+  m->layer_guid = gather->layer_guid;
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
   GenericTensorAccessorR index = helperGetGenericTensorAccessorRO(
diff --git a/src/ops/group_by.cc b/src/ops/group_by.cc
index f2f94234c3..50871983f5 100644
--- a/src/ops/group_by.cc
+++ b/src/ops/group_by.cc
@@ -266,6 +266,9 @@ OpMeta *Group_by::init_task(Task const *task,
   FFHandler handle = *((FFHandler *)task->local_args);
   GroupByMeta *m = new GroupByMeta(handle, gb->n, gb->alpha);
   m->profiling = gb->profiling;
+  m->inference_debugging = gb->inference_debugging;
+  std::strcpy(m->op_name, gb->name);
+  m->layer_guid = gb->layer_guid;
   return m;
 }
 
@@ -369,35 +372,39 @@ void Group_by::forward_task(Task const *task,
   int n = (int)regions.size() - 2;
   assert((int)task->regions.size() == n + 2);
 
-  GroupByMeta const *m = *((GroupByMeta **)task->local_args);
+  GroupByMeta *m = *((GroupByMeta **)task->local_args);
 
   // get input and assign regions. Each tensor has three dimensions:
   // (datapoint_dim, batch_size, replica_dim)
-  AccessorRO<float, 3> const acc_input(regions[0], FID_DATA);
-  AccessorRO<int, 3> const acc_assign(regions[1], FID_DATA);
-
-  Rect<3> rect_input = runtime->get_index_space_domain(
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      DT_FLOAT, regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR assign = helperGetGenericTensorAccessorRO(
+      DT_INT32, regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  Domain input_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
-  Rect<3> rect_assign = runtime->get_index_space_domain(
+  Domain assign_domain = runtime->get_index_space_domain(
       ctx, task->regions[1].region.get_index_space());
 
-  coord_t input_rows = rect_input.hi[1] - rect_input.lo[1] + 1;
-  coord_t input_cols = rect_input.hi[0] - rect_input.lo[0] + 1;
-  assert(input_rows == rect_assign.hi[1] - rect_assign.lo[1] + 1);
+  coord_t input_rows = input_domain.hi()[1] - input_domain.lo()[1] + 1;
+  coord_t input_cols = input_domain.hi()[0] - input_domain.lo()[0] + 1;
+  assert(input_rows == assign_domain.hi()[1] - assign_domain.lo()[1] + 1);
 
-  int k = rect_assign.hi[0] - rect_assign.lo[0] + 1;
+  int k = assign_domain.hi()[0] - assign_domain.lo()[0] + 1;
   int batch_size = input_rows;
   int data_dim = input_cols;
 
   // Create a vector of n outputs, where n is the number of experts.
   // Each entry in the "outputs" vector points to the Legion tensor that will
   // contain the tockens dispatched to the corresponding expert
+  std::vector<GenericTensorAccessorW> output_accessors;
   float *outputs[n];
   for (int i = 0; i < n; i++) {
+    GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+        DT_FLOAT, regions[i + 2], task->regions[i + 2], FID_DATA, ctx, runtime);
+    output_accessors.push_back(output);
     Domain out_domain = runtime->get_index_space_domain(
         ctx, task->regions[i + 2].region.get_index_space());
-    outputs[i] = helperGetTensorPointerWO<float>(
-        regions[i + 2], task->regions[i + 2], FID_DATA, ctx, runtime);
+    outputs[i] = output.get_float_ptr();
 
     coord_t output_rows = out_domain.hi()[1] - out_domain.lo()[1] + 1;
     coord_t output_cols = out_domain.hi()[0] - out_domain.lo()[0] + 1;
@@ -405,13 +412,19 @@ void Group_by::forward_task(Task const *task,
   }
 
   Group_by::forward_kernel_wrapper(m,
-                                   acc_input.ptr(rect_input),
-                                   acc_assign.ptr(rect_assign),
+                                   input.get_float_ptr(),
+                                   assign.get_int32_ptr(),
                                    outputs,
                                    n,
                                    k,
                                    batch_size,
                                    data_dim);
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    Group_by::save_inference_tensors_to_file(
+        m, shard_id, nullptr, {input, assign}, {}, output_accessors);
+  }
 }
 
 void Group_by::backward(FFModel const &ff) {
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index 68b5fa39a1..2f72976d30 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -23,10 +23,6 @@
 #endif
 #include "flexflow/utils/hash_utils.h"
 #include "legion/legion_utilities.h"
-#ifdef INFERENCE_TESTS
-#include <torch/torch.h>
-using namespace at::indexing;
-#endif
 
 namespace FlexFlow {
 
@@ -725,6 +721,9 @@ OpMeta *IncMultiHeadSelfAttention::init_task(
            gpu_mem_allocator.reserved_total_size);
   }
   m->profiling = attn->profiling;
+  m->inference_debugging = attn->inference_debugging;
+  std::strcpy(m->op_name, attn->name);
+  m->layer_guid = attn->layer_guid;
   if (attn->quantization_type == DT_NONE) {
     assert(weight.domain.get_volume() * data_type_size(weight.data_type) ==
            m->weightSize);
@@ -811,7 +810,6 @@ void IncMultiHeadSelfAttention::inference_task(
 
   assert(task->regions.size() == regions.size());
 
-  // BatchConfig const *bc = (BatchConfig *)task->args;
   BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
   log_inc_mha.debug("BatchConfig, num_tokens: %d, num_requests: %d",
                     bc->num_tokens,
@@ -820,7 +818,7 @@ void IncMultiHeadSelfAttention::inference_task(
     return;
   }
 
-  IncMultiHeadSelfAttentionMeta const *m =
+  IncMultiHeadSelfAttentionMeta *m =
       *((IncMultiHeadSelfAttentionMeta **)task->local_args);
 
   assert(((*m->qkv_bias || *m->final_bias) ? regions.size() == 4
@@ -860,787 +858,18 @@ void IncMultiHeadSelfAttention::inference_task(
 
   IncMultiHeadSelfAttention::inference_kernel_wrapper(
       m, bc, task->index_point.point_data[0], input, weight, output, biases);
-#ifdef INFERENCE_TESTS
-  printf("Checking IncMultiHeadSelfAttention computations...\n");
-
-  // =============================================================================
-  //  Define helper functions to handle row-major arrays
-  // =============================================================================
-
-  auto set_value_row_major = [](float *arr,
-                                std::vector<int> const &shape,
-                                std::vector<int> const &indices,
-                                float value) -> void {
-    int offset = 0;
-    for (int i = 0; i < shape.size(); i++) {
-      int index = indices[i];
-      int stride = 1;
-      for (int j = i + 1; j < shape.size(); j++) {
-        stride *= shape[j];
-      }
-      offset += index * stride;
-    }
-    *(arr + offset) = value;
-  };
-
-  // =============================================================================
-  //  Load input/output/weights and parse general configs
-  // =============================================================================
-
-  float *input_cpu =
-      download_tensor<float>(input.get_float_ptr(), input_domain.get_volume());
-  assert(input_cpu != nullptr);
-  float *weight_cpu = download_tensor<float>(weight.get_float_ptr(),
-                                             weight_domain.get_volume());
-  assert(weight_cpu != nullptr);
-  float *output_cpu = download_tensor<float>(output.get_float_ptr(),
-                                             output_domain.get_volume());
-  assert(output_cpu != nullptr);
-
-  // Input tensor dimensions
-  coord_t data_dim = input_domain.hi()[0] - input_domain.lo()[0] + 1;
-  coord_t max_sequence_length = input_domain.hi()[1] - input_domain.lo()[1] + 1;
-  coord_t batch_size = input_domain.hi()[2] - input_domain.lo()[2] + 1;
-  coord_t replica_dim = input_domain.hi()[3] - input_domain.lo()[3] + 1;
-  assert(replica_dim == 1);
-
-  size_t effective_batch_size = max_sequence_length * batch_size;
-  float inputs_arr[data_dim][effective_batch_size] = {0};
-  for (size_t i = 0; i < data_dim * bc->num_active_tokens(); i++) {
-    size_t data_index = i % data_dim;
-    size_t token_index = i / data_dim;
-    assert(data_index < data_dim);
-    assert(token_index < effective_batch_size);
-    inputs_arr[data_index][token_index] = input_cpu[i];
-  }
-  torch::Tensor torch_input = torch::from_blob(
-      inputs_arr, {data_dim, (long int)effective_batch_size}, torch::kFloat32);
-
-  // Weight tensor dimensions
-  coord_t all_weight_params = weight_domain.hi()[0] - weight_domain.lo()[0] + 1;
-  coord_t num_q_heads = weight_domain.hi()[1] - weight_domain.lo()[1] + 1;
-  replica_dim = weight_domain.hi()[2] - weight_domain.lo()[2] + 1;
-  size_t qParas = m->qProjSize * m->qSize;
-  size_t kParas = m->kProjSize * m->kSize;
-  size_t vParas = m->vProjSize * m->vSize;
-  size_t oParas = m->oProjSize * (m->vProjSize > 0 ? m->vProjSize : m->vSize);
-
-  assert(all_weight_params == qParas + kParas + vParas + oParas);
-  assert(num_q_heads == m->num_q_heads);
-  assert(replica_dim == 1);
-
-  assert(m->qSize == m->kSize && m->kSize == m->vSize);
-  // printf("m->qSize: %i\n", m->qSize);
-  //  keep things simple for now
-  assert(m->qProjSize == m->kProjSize && m->kProjSize == m->vProjSize);
-  long int proj_sum = m->qProjSize + m->kProjSize + m->vProjSize;
-  // load weight manually because Torch can't easily read a tensor serialized in
-  // column-major order.
-
-  // printf("m->kProjSize: %i, BatchConfig::max_tokens_per_batch(): %i, "
-  //     "bc->num_active_tokens(): %i, num_q_heads: %lli,
-  //     BatchConfig::max_requests_per_batch(): %i, "
-  //     "bc->num_active_requests(): %i\n", m->kProjSize,
-  //     BatchConfig::max_tokens_per_batch(), bc->num_active_tokens(),
-  //     num_q_heads, BatchConfig::max_requests_per_batch(),
-  //     bc->num_active_requests());
-  // for (int t=0; t < bc->num_active_tokens(); t++) {
-  //   printf("token %i has request_index: %li and token_position: %li\n",
-  //   t, bc->token2ids.token_indexes[t].request_index,
-  //   bc->token2ids.token_indexes[t].token_position);
-  // }
-
-  // =============================================================================
-  //  Load the output tensor (with CUDA results), and create a Torch tensor
-  // =============================================================================
-
-  float output_cuda[m->oProjSize][effective_batch_size] = {0};
-  for (int i = 0; i < m->oProjSize * effective_batch_size; i++) {
-    int row_idx = i % m->oProjSize;
-    int col_idx = i / m->oProjSize;
-    assert(row_idx < m->oProjSize && col_idx < effective_batch_size);
-    output_cuda[row_idx][col_idx] = output_cpu[i];
-  }
-  torch::Tensor torch_out_cuda =
-      torch::from_blob(output_cuda,
-                       {m->oProjSize, (int64_t)effective_batch_size},
-                       torch::kFloat32);
-
-  // =============================================================================
-  //  Load the Q/K/V projection weights, and create a Torch tensor
-  // =============================================================================
-  std::vector<int> w_qkv_shape = {m->qSize, m->qProjSize, 3, (int)num_q_heads};
-  float *w_qkv =
-      (float *)calloc(m->qSize * m->qProjSize * 3 * num_q_heads, sizeof(float));
-  assert(w_qkv[0] == 0.0f);
-
-  for (int h = 0; h < num_q_heads; h++) {
-    for (size_t i = 0; i < m->qProjSize * m->qSize; i++) {
-      int row_index = i % m->qSize;
-      int column_index = i / m->qSize;
-      // Q
-      set_value_row_major(w_qkv,
-                          w_qkv_shape,
-                          {row_index, column_index, 0, h},
-                          weight_cpu[all_weight_params * h +
-                                     m->qSize * column_index + row_index]);
-      // K
-      set_value_row_major(
-          w_qkv,
-          w_qkv_shape,
-          {row_index, column_index, 1, h},
-          weight_cpu[all_weight_params * h + m->qProjSize * m->qSize +
-                     m->qSize * column_index + row_index]);
-      // V
-      set_value_row_major(
-          w_qkv,
-          w_qkv_shape,
-          {row_index, column_index, 2, h},
-          weight_cpu[all_weight_params * h + 2 * m->qProjSize * m->qSize +
-                     m->qSize * column_index + row_index]);
-    }
-  }
-  // convert weights to torch tensor
-  torch::Tensor torch_w_qkv = torch::from_blob(
-      w_qkv, {m->qSize, m->qProjSize, 3, (int)num_q_heads}, torch::kFloat32);
-
-  /* std::cout << "Torch projection weights size: " << torch_w_qkv.sizes()
-            << std::endl;
-  std::cout << "Torch input size: " << torch_input.sizes() << std::endl;
-  std::cout << "Number of active tokens: " << bc->num_active_tokens()
-            << std::endl; */
-  // std::cout << "torch_w_qkv:" << std::endl << torch_w_qkv << std::endl;
-
-  // =============================================================================
-  //  Compute the Q/K/V projections, and compare the results with CUDA
-  // =============================================================================
 
-  //  ----------------------- C++ computations & checks ------------------------
-  torch::Tensor qkv_projs = torch::einsum(
-      "ijkl,im->jmkl",
-      {torch_w_qkv,
-       torch_input.index({Slice(), Slice(0, bc->num_active_tokens())})});
-  // std::cout << "qkv_projs size: " << qkv_projs.sizes() << std::endl;
-  assert(qkv_projs.sizes()[0] == m->qProjSize);
-  assert(qkv_projs.sizes()[1] == bc->num_active_tokens() &&
-         qkv_projs.sizes()[1] <= effective_batch_size);
-  assert(qkv_projs.sizes()[2] == 3);
-  assert(qkv_projs.sizes()[3] == num_q_heads);
-  free(w_qkv);
-
-  //  ----------------------- Loading CUDA results for this step ---------------
-  float *QKVProjArray_cpu = download_tensor<float>(
-      m->devQKVProjArray,
-      BatchConfig::max_tokens_per_batch() * proj_sum * m->num_q_heads);
-  assert(QKVProjArray_cpu != nullptr);
-
-  std::vector<int> QKVProjArray_converted_shape = {
-      m->qProjSize, bc->num_active_tokens(), 3, (int)num_q_heads};
-  float *QKVProjArray_converted = (float *)calloc(
-      m->qProjSize * bc->num_active_tokens() * 3 * num_q_heads, sizeof(float));
-
-  // skip over padding at the end of QKVProjArray_cpu
-  // convert from column order to 3D matrix because torch cannot automatically
-  // import matrices flattened in column order
-  for (size_t i = 0; i < proj_sum * bc->num_active_tokens() * num_q_heads;
-       i++) {
-    int proj_size_index = i % m->qProjSize;
-    int head_index = i / (proj_sum * bc->num_active_tokens());
-    int token_index =
-        ((i - head_index * proj_sum * bc->num_active_tokens()) / m->qProjSize) %
-        bc->num_active_tokens();
-    int qkv_offset = (i - head_index * proj_sum * bc->num_active_tokens()) /
-                     (m->qProjSize * bc->num_active_tokens());
-    assert(proj_size_index < proj_sum);
-    assert(head_index < num_q_heads);
-    assert(token_index < bc->num_active_tokens());
-    assert(qkv_offset < 3);
-    set_value_row_major(QKVProjArray_converted,
-                        QKVProjArray_converted_shape,
-                        {proj_size_index, token_index, qkv_offset, head_index},
-                        QKVProjArray_cpu[i]);
-  }
-  torch::Tensor QKVProjArray_torch =
-      torch::from_blob(QKVProjArray_converted,
-                       {m->qProjSize, bc->num_active_tokens(), 3, num_q_heads},
-                       torch::kFloat32);
-
-  //  ----------------------- Comparing C++ & CUDA results ---------------------
-  // std::cout << "QKVProjArray_torch" << std::endl;
-  // for (int i=0; i<num_q_heads; i++) {
-  //   for (int j=0; j<3; j++) {
-  //     std::cout << QKVProjArray_torch.index({Slice(), Slice(), j, i}) <<
-  //     std::endl;
-  //   }
-  // }
-  // std::cout << "qkv_projs" << std::endl;
-  // for (int i=0; i<num_q_heads; i++) {
-  //   for (int j=0; j<3; j++) {
-  //     std::cout << qkv_projs.index({Slice(), Slice(), j, i}) << std::endl;
-  //   }
-  // }
-  assert(torch::allclose(QKVProjArray_torch, qkv_projs, 1e-05, 1e-05));
-  free(QKVProjArray_converted);
-
-  // =============================================================================
-  //  Store the K/V projections into the cache
-  // =============================================================================
-
-  //  ----------------------- C++ operations & checks --------------------------
-  // Store projections into k/v cache arrays
-  for (size_t h = 0; h < num_q_heads; h++) {
-    for (size_t t = 0; t < bc->num_active_tokens(); t++) {
-      for (size_t d = 0; d < m->kProjSize; d++) {
-        size_t kcache_idx = d * MAX_SEQ_LEN * m->num_q_heads *
-                                BatchConfig::max_requests_per_batch() +
-                            bc->tokensInfo[t].abs_depth_in_request *
-                                m->num_q_heads *
-                                BatchConfig::max_requests_per_batch() +
-                            h * BatchConfig::max_requests_per_batch() +
-                            bc->tokensInfo[t].request_index;
-        m->kcache[kcache_idx] =
-            qkv_projs.index({(int64_t)d, (int64_t)t, 1, (int64_t)h})
-                .item<float>();
-      }
-      for (size_t d = 0; d < m->vProjSize; d++) {
-        size_t vcache_idx = d * MAX_SEQ_LEN * m->num_q_heads *
-                                BatchConfig::max_requests_per_batch() +
-                            bc->tokensInfo[t].abs_depth_in_request *
-                                m->num_q_heads *
-                                BatchConfig::max_requests_per_batch() +
-                            h * BatchConfig::max_requests_per_batch() +
-                            bc->tokensInfo[t].request_index;
-        m->vcache[vcache_idx] =
-            qkv_projs.index({(int64_t)d, (int64_t)t, 2, (int64_t)h})
-                .item<float>();
-      }
-    }
-  }
-  // Create torch tensors from the arrays
-  torch::Tensor K_t = torch::from_blob(m->kcache,
-                                       {m->kProjSize,
-                                        MAX_SEQ_LEN,
-                                        num_q_heads,
-                                        BatchConfig::max_requests_per_batch()},
-                                       torch::kFloat32);
-  torch::Tensor V_t = torch::from_blob(m->vcache,
-                                       {m->vProjSize,
-                                        MAX_SEQ_LEN,
-                                        num_q_heads,
-                                        BatchConfig::max_requests_per_batch()},
-                                       torch::kFloat32);
-
-  // Compute useful indices
-  std::vector<size_t> req_idxs;
-  std::vector<size_t> r_first_idx;
-  std::vector<size_t> r_num_tokens;
-  for (size_t t = 0; t < bc->num_active_tokens(); t++) {
-    size_t rid = bc->tokensInfo[t].request_index;
-    if (req_idxs.size() == 0 || req_idxs[req_idxs.size() - 1] != rid) {
-      req_idxs.push_back(rid);
-      r_first_idx.push_back(t);
-      r_num_tokens.push_back(1);
-    } else {
-      r_num_tokens[r_num_tokens.size() - 1]++;
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    std::vector<GenericTensorAccessorR> weights_accessors;
+    weights_accessors.push_back(weight);
+    if (*m->qkv_bias || *m->final_bias) {
+      weights_accessors.push_back(biases);
     }
-    assert(req_idxs.size() == r_first_idx.size() &&
-           r_first_idx.size() == r_num_tokens.size());
+    IncMultiHeadSelfAttention::save_inference_tensors_to_file(
+        m, shard_id, bc, {input}, weights_accessors, {output});
   }
-  assert(req_idxs.size() == bc->num_active_requests());
-  assert(std::accumulate(r_num_tokens.begin(),
-                         r_num_tokens.end(),
-                         decltype(r_num_tokens)::value_type(0)) ==
-         bc->num_active_tokens());
-
-  //  ----------------------- Loading CUDA results for this step ---------------
-  float *keyCache_cpu = download_tensor<float>(
-      m->keyCache,
-      m->num_q_heads * m->kProjSize * BatchConfig::max_requests_per_batch() *
-          MAX_SEQ_LEN);
-  float *valueCache_cpu = download_tensor<float>(
-      m->valueCache,
-      m->num_q_heads * m->vProjSize * BatchConfig::max_requests_per_batch() *
-          MAX_SEQ_LEN);
-  assert(keyCache_cpu != nullptr);
-  assert(valueCache_cpu != nullptr);
-
-  float *kcache_cuda =
-      (float *)calloc(m->kProjSize * MAX_SEQ_LEN * m->num_q_heads *
-                          BatchConfig::max_requests_per_batch(),
-                      sizeof(float));
-  float *vcache_cuda =
-      (float *)calloc(m->vProjSize * MAX_SEQ_LEN * m->num_q_heads *
-                          BatchConfig::max_requests_per_batch(),
-                      sizeof(float));
-  int index = 0;
-  for (int i = 0; i < m->kProjSize; i++) {
-    for (int j = 0; j < MAX_SEQ_LEN; j++) {
-      for (int k = 0; k < m->num_q_heads; k++) {
-        for (int l = 0; l < BatchConfig::max_requests_per_batch(); l++) {
-          int col_major_index =
-              l * m->kProjSize * MAX_SEQ_LEN * m->num_q_heads +
-              k * m->kProjSize * MAX_SEQ_LEN + j * m->kProjSize + i;
-          kcache_cuda[index++] = keyCache_cpu[col_major_index];
-        }
-      }
-    }
-  }
-  index = 0;
-  for (int i = 0; i < m->vProjSize; i++) {
-    for (int j = 0; j < MAX_SEQ_LEN; j++) {
-      for (int k = 0; k < m->num_q_heads; k++) {
-        for (int l = 0; l < BatchConfig::max_requests_per_batch(); l++) {
-          int col_major_index =
-              l * m->vProjSize * MAX_SEQ_LEN * m->num_q_heads +
-              k * m->vProjSize * MAX_SEQ_LEN + j * m->vProjSize + i;
-          vcache_cuda[index++] = valueCache_cpu[col_major_index];
-        }
-      }
-    }
-  }
-  torch::Tensor K_t_cuda =
-      torch::from_blob(kcache_cuda,
-                       {m->kProjSize,
-                        MAX_SEQ_LEN,
-                        num_q_heads,
-                        BatchConfig::max_requests_per_batch()},
-                       torch::kFloat32);
-  torch::Tensor V_t_cuda =
-      torch::from_blob(vcache_cuda,
-                       {m->vProjSize,
-                        MAX_SEQ_LEN,
-                        num_q_heads,
-                        BatchConfig::max_requests_per_batch()},
-                       torch::kFloat32);
-
-  //  ----------------------- Comparing C++ & CUDA results ---------------------
-
-  // std::cout << "kcache differences:" << std::endl;
-  // for (int i=0; i < bc->num_active_requests() + 1; i++) {
-  //   for (int j=0; j < num_q_heads; j++) {
-  //     for (int l=0; l < m->kProjSize; l++) {
-  //       for (int k=0; k < MAX_SEQ_LEN; k++) {
-  //         size_t kcache_idx =
-  //           l * MAX_SEQ_LEN * num_q_heads *
-  //           BatchConfig::max_requests_per_batch() + k * num_q_heads *
-  //           BatchConfig::max_requests_per_batch() + j *
-  //           BatchConfig::max_requests_per_batch() + i; if (
-  //           abs(m->kcache[kcache_idx] - keyCache_cpu[
-  //               i * m->kProjSize * MAX_SEQ_LEN * num_q_heads +
-  //               j * m->kProjSize * MAX_SEQ_LEN +
-  //               k * m->kProjSize +
-  //               l
-  //           ]) > 0.00001) {
-  //             printf("req: %i (rid: %i), head: %i, data_dim: %i, token_pos:
-  //             %i\n",
-  //                   i, req_idxs[i], j, l, k);
-  //           }
-  //       }
-  //     }
-  //   }
-  // }
-
-  //  std::cout << "keyCache from CUDA:" << std::endl;
-  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
-  //    for (int j=0; j<num_q_heads; j++) {
-  //     for (int l=0; l<m->kProjSize; l++) {
-  //       for (int k=0; k< MAX_SEQ_LEN; k++) {
-  //         printf("%f ",
-  //           keyCache_cpu[i * m->kProjSize * MAX_SEQ_LEN * num_q_heads +
-  //               j * m->kProjSize * MAX_SEQ_LEN +
-  //               k * m->kProjSize +
-  //               l
-  //         ]);
-  //       }
-  //       printf("\n");
-  //     }
-  //     printf("\n");
-  //    }
-  //    printf("\n");
-  //  }
-
-  //  std::cout << "valueCache from CUDA:" << std::endl;
-  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
-  //    for (int j=0; j<num_q_heads; j++) {
-  //       for (int l=0; l<m->vProjSize; l++) {
-  //         for (int k=0; k< MAX_SEQ_LEN; k++) {
-  //           printf("%f ",
-  //             valueCache_cpu[
-  //                 i * m->vProjSize * MAX_SEQ_LEN * num_q_heads +
-  //                 j * m->vProjSize * MAX_SEQ_LEN +
-  //                 k * m->vProjSize +
-  //             l]);
-  //         }
-  //         printf("\n");
-  //       }
-  //       printf("\n");
-  //    }
-  //    printf("\n");
-  //  }
-
-  //  printf("\n");
-
-  //  std::cout << "C++ kcache:" << std::endl;
-  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
-  //    for (int j=0; j < num_q_heads; j++) {
-  //       for (int l=0; l < m->kProjSize; l++) {
-  //         for (int k=0; k < MAX_SEQ_LEN; k++) {
-  //           size_t kcache_idx =
-  //             l * MAX_SEQ_LEN * num_q_heads *
-  //             BatchConfig::max_requests_per_batch() + k * num_q_heads *
-  //             BatchConfig::max_requests_per_batch() + j *
-  //             BatchConfig::max_requests_per_batch() + i;
-  //           printf("%f ", m->kcache[kcache_idx]);
-  //         }
-  //         printf("\n");
-  //       }
-  //       printf("\n");
-  //    }
-  //    printf("\n");
-  //  }
-
-  //  std::cout << "C++ vcache:" << std::endl;
-  //  for (int i=0; i<bc->num_active_requests()+1; i++) {
-  //    for (int j=0; j<num_q_heads; j++) {
-  //       for (int l=0; l<m->vProjSize; l++) {
-  //         for (int k=0; k< MAX_SEQ_LEN; k++) {
-  //             size_t vcache_idx =
-  //               l * MAX_SEQ_LEN * num_q_heads *
-  //               BatchConfig::max_requests_per_batch()
-  //               + k * num_q_heads * BatchConfig::max_requests_per_batch() + j
-  //               * BatchConfig::max_requests_per_batch() + i;
-  //             printf("%f ", m->vcache[vcache_idx]);
-  //         }
-  //         printf("\n");
-  //       }
-  //       printf("\n");
-  //    }
-  //    printf("\n");
-  //  }
-
-  assert(torch::allclose(K_t_cuda, K_t, 1e-05, 1e-05));
-  assert(torch::allclose(V_t_cuda, V_t, 1e-05, 1e-05));
-  free(kcache_cuda);
-  free(vcache_cuda);
-
-  // =============================================================================
-  //  Load the W_out projection weights
-  // =============================================================================
-
-  //  ----------------------- C++ operations & checks --------------------------
-  float *w_out = (float *)calloc(m->vProjSize * m->num_q_heads * m->oProjSize,
-                                 sizeof(float));
-  std::vector<int> w_out_shape = {m->vProjSize, m->num_q_heads, m->oProjSize};
-  assert(m->qProjSize == m->kProjSize && m->kProjSize == m->vProjSize);
-  for (int h = 0; h < num_q_heads; h++) {
-    for (int v = 0; v < m->vProjSize; v++) {
-      for (int o = 0; o < m->oProjSize; o++) {
-        set_value_row_major(
-            w_out,
-            w_out_shape,
-            {v, h, o},
-            weight_cpu[all_weight_params * h + 3 * m->qProjSize * m->qSize +
-                       m->vProjSize * o + v]);
-      }
-    }
-  }
-  // convert weights to torch tensor
-  torch::Tensor torch_w_out = torch::from_blob(
-      w_out, {m->vProjSize, m->num_q_heads, m->oProjSize}, torch::kFloat32);
-
-  //  ----------------------- Loading CUDA results for this step ---------------
-  float *w_out_cuda = download_tensor<float>(
-      m->W_out_contiguous, m->vProjSize * m->oProjSize * m->num_q_heads);
-  assert(w_out_cuda != nullptr);
-  float *converted_wout_tensor = (float *)calloc(
-      m->vProjSize * m->num_q_heads * m->oProjSize, sizeof(float));
-  std::vector<int> converted_wout_tensor_shape = {
-      m->vProjSize, m->num_q_heads, m->oProjSize};
-
-  for (int i = 0; i < m->vProjSize * m->num_q_heads * m->oProjSize; i++) {
-    int v_idx = i % m->vProjSize;
-    int h_idx = (i / m->vProjSize) % m->num_q_heads;
-    int o_idx = i / (m->vProjSize * m->num_q_heads);
-    assert(v_idx < m->vProjSize && h_idx < m->num_q_heads &&
-           o_idx < m->oProjSize);
-    set_value_row_major(converted_wout_tensor,
-                        converted_wout_tensor_shape,
-                        {v_idx, h_idx, o_idx},
-                        w_out_cuda[i]);
-  }
-  torch::Tensor w_out_cuda_tensor =
-      torch::from_blob(converted_wout_tensor,
-                       {m->vProjSize, m->num_q_heads, m->oProjSize},
-                       torch::kFloat32);
-
-  //  ----------------------- Comparing C++ & CUDA results ---------------------
-  assert(torch::allclose(w_out_cuda_tensor, torch_w_out, 1e-05, 1e-05));
-  free(converted_wout_tensor);
-
-  // =============================================================================
-  //  Compute the softmax(QK^T/sqrt(d_k))V product, request by request
-  // =============================================================================
-
-  //  ----------------------- C++ initialization steps -------------------------
-  torch::Tensor Q_projs = qkv_projs.index({Slice(), Slice(), 0, Slice()})
-                              .reshape({qkv_projs.sizes()[0],
-                                        qkv_projs.sizes()[1],
-                                        qkv_projs.sizes()[3]});
-
-  torch::Tensor qk_products[bc->num_active_requests()];
-  torch::Tensor qk_softmax[bc->num_active_requests()];
-  torch::Tensor attn_heads[bc->num_active_requests()];
-
-  torch::Tensor cpp_output =
-      torch::zeros({m->oProjSize, bc->num_active_tokens()});
-
-  //  ----------------------- Loading CUDA results for this step ---------------
-  float *qk_prods_cpu = download_tensor<float>(
-      m->qk_prods,
-      BatchConfig::max_tokens_per_batch() *
-          BatchConfig::max_tokens_per_batch() * num_q_heads);
-  assert(qk_prods_cpu != nullptr);
-
-  float *qk_prods_softmax_cpu = download_tensor<float>(
-      m->qk_prods_softmax,
-      BatchConfig::max_tokens_per_batch() *
-          BatchConfig::max_tokens_per_batch() * num_q_heads);
-  assert(qk_prods_softmax_cpu != nullptr);
-
-  float *attn_heads_cpu = download_tensor<float>(
-      m->attn_heads,
-      BatchConfig::max_tokens_per_batch() * m->num_q_heads * m->vProjSize);
-  assert(attn_heads_cpu != nullptr);
-
-  //  ----------------------- Main loop (request by request) -------------------
-  size_t qk_prods_cpu_offset = 0;
-
-  for (size_t r = 0; r < bc->num_active_requests(); r++) {
-    // Compute pre-request parameters
-    size_t num_new_tokens = r_num_tokens[r];
-    int64_t rid = (int64_t)(req_idxs[r]);
-    int64_t num_tokens_received_so_far =
-        (int64_t)(bc->requestsInfo[rid].token_start_offset +
-                  bc->requestsInfo[rid].num_tokens_in_batch);
-    assert(num_new_tokens == bc->requestsInfo[rid].num_tokens_in_batch);
-    assert(num_tokens_received_so_far >= (int64_t)num_new_tokens);
-
-    //  ----------------------- C++ computations -------------------------------
-    // Get the slice of the Q projection tensor with the tokens in the current
-    // request
-    torch::Tensor Q_req =
-        Q_projs.index({Slice(),
-                       Slice(r_first_idx[r], r_first_idx[r] + num_new_tokens),
-                       Slice()});
-    // std::cout << "Q_req.sizes(): " << Q_req.sizes() << std::endl;
-    assert(Q_req.sizes()[0] == m->qProjSize);
-    assert(Q_req.sizes()[1] == num_new_tokens);
-    assert(Q_req.sizes()[2] == num_q_heads);
-
-    /*printf("\n------------ QK multiplication (C++) -------------\n");
-    printf("Request r=%lu. num_new_tokens: %lu, num_tokens_received_so_far: %li,
-    rid: %li, Qproj slice: (%i, %i)\n", r, num_new_tokens,
-    num_tokens_received_so_far, rid, r_first_idx[r], r_first_idx[r] +
-    num_new_tokens);
-
-    std::cout << "Q_req matrix (idk dims):" << std::endl <<
-    Q_req.index({Slice(), Slice(), 0}) << std::endl << std::endl; std::cout <<
-    "K_t matrix (ilk dims):" << std::endl << K_t.index({Slice(), Slice(0,
-    num_tokens_received_so_far), 0, rid}) << std::endl << std::endl; std::cout
-    << "C++ alpha: " << (1.0f / sqrt(m->kProjSize)) << std::endl;*/
-
-    // Compute (Q*K^T)/sqrt(d_k) matmul
-    qk_products[r] =
-        torch::einsum("ijk,ilk->jlk",
-                      {Q_req,
-                       K_t.index({Slice(),
-                                  Slice(0, num_tokens_received_so_far),
-                                  Slice(),
-                                  rid})}) *
-        (1.0f / sqrt(m->kProjSize));
-
-    // Set entries above diagonal to -inf to make attention causal.
-    for (int h = 0; h < num_q_heads; h++) {
-      qk_products[r].index(
-          {Slice(), Slice(num_tokens_received_so_far - num_new_tokens), h}) =
-          qk_products[r]
-              .index({Slice(),
-                      Slice(num_tokens_received_so_far - num_new_tokens),
-                      h})
-              .tril() +
-          torch::full({(int64_t)num_new_tokens, (int64_t)num_new_tokens},
-                      -INFINITY)
-              .triu()
-              .fill_diagonal_(0);
-    }
-    // Compute softmax for each request block
-    qk_softmax[r] = torch::softmax(qk_products[r], -2);
-    assert(qk_softmax[r].sizes()[0] == num_new_tokens);
-    assert(qk_softmax[r].sizes()[1] == num_tokens_received_so_far);
-    assert(qk_softmax[r].sizes()[2] == m->num_q_heads);
-
-    //  ------------------- Loading CUDA results for this step ---------------
-    float *converted_qk_prod = (float *)calloc(
-        num_new_tokens * num_tokens_received_so_far * num_q_heads,
-        sizeof(float));
-    float *converted_qk_prod_softmax = (float *)calloc(
-        num_new_tokens * num_tokens_received_so_far * num_q_heads,
-        sizeof(float));
-    std::vector<int> converted_qk_prod_shape = {
-        (int)num_new_tokens, (int)num_tokens_received_so_far, (int)num_q_heads};
-
-    for (size_t i = 0;
-         i < num_new_tokens * num_tokens_received_so_far * num_q_heads;
-         i++) {
-      size_t new_t_idx = i % num_new_tokens;
-      size_t all_t_idx = (i / num_new_tokens) % num_tokens_received_so_far;
-      size_t head_idx = i / (num_new_tokens * num_tokens_received_so_far);
-      assert(new_t_idx < num_new_tokens &&
-             all_t_idx < num_tokens_received_so_far && head_idx < num_q_heads);
-      set_value_row_major(converted_qk_prod,
-                          converted_qk_prod_shape,
-                          {(int)new_t_idx, (int)all_t_idx, (int)head_idx},
-                          qk_prods_cpu[i + qk_prods_cpu_offset]);
-      set_value_row_major(converted_qk_prod_softmax,
-                          converted_qk_prod_shape,
-                          {(int)new_t_idx, (int)all_t_idx, (int)head_idx},
-                          qk_prods_softmax_cpu[i + qk_prods_cpu_offset]);
-    }
-    torch::Tensor qk_prods_cuda = torch::from_blob(
-        converted_qk_prod,
-        {(int64_t)num_new_tokens, num_tokens_received_so_far, num_q_heads},
-        torch::kFloat32);
-    torch::Tensor qk_prods_softmax_cuda = torch::from_blob(
-        converted_qk_prod_softmax,
-        {(int64_t)num_new_tokens, num_tokens_received_so_far, num_q_heads},
-        torch::kFloat32);
-
-    //  ------------------- Comparing C++ & CUDA results ------------------
-    /* std::cout << "C++:" <<std::endl;
-    for (int h=0; h<num_q_heads; h++) {
-      std::cout << qk_products[r].index({Slice(), Slice(), h}) << std::endl;
-    }
-    std::cout << "CUDA:" <<std::endl;
-    for (int h=0; h<num_q_heads; h++) {
-      std::cout << qk_prods_cuda.index({Slice(), Slice(), h}) << std::endl;
-    } */
-    /* //
-    std::cout << "C++:" <<std::endl;
-    for (int h=0; h<num_q_heads; h++) {
-      std::cout << qk_softmax[r].index({Slice(), Slice(), h}) << std::endl;
-    }
-    std::cout << "CUDA:" <<std::endl;
-    for (int h=0; h<num_q_heads; h++) {
-      std::cout << qk_prods_softmax_cuda.index({Slice(), Slice(), h}) <<
-    std::endl;
-    } */
-    // std::cout << "C++ tril:" <<std::endl;
-    // for (int h=0; h<num_q_heads; h++) {
-    //   std::cout << qk_products[r].tril().index({Slice(), Slice(), h}) <<
-    //   std::endl;
-    // }
-    assert(torch::allclose(qk_prods_cuda, qk_products[r], 1e-05, 1e-05));
-    assert(torch::allclose(qk_prods_softmax_cuda, qk_softmax[r], 1e-05, 1e-05));
-    free(converted_qk_prod);
-    free(converted_qk_prod_softmax);
-
-    //  --------------------- C++ computations --------------------------
-    // Multiply softmax results by V
-    assert(
-        V_t.index({Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})
-            .sizes()[0] == m->vProjSize);
-    assert(
-        V_t.index({Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})
-            .sizes()[1] == num_tokens_received_so_far);
-    assert(
-        V_t.index({Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})
-            .sizes()[2] == m->num_q_heads);
-    attn_heads[r] = torch::einsum(
-        "ijk,ljk->ilk",
-        {qk_softmax[r],
-         V_t.index(
-             {Slice(), Slice(0, num_tokens_received_so_far), Slice(), rid})});
-    assert(attn_heads[r].sizes()[0] == num_new_tokens);
-    assert(attn_heads[r].sizes()[1] == m->vProjSize);
-    assert(attn_heads[r].sizes()[2] == m->num_q_heads);
-
-    //  ------------------- Loading CUDA results for this step  ---------------
-    float converted_attn_heads_cpu[num_new_tokens][m->vProjSize]
-                                  [m->num_q_heads] = {0};
-    for (int i = 0; i < num_new_tokens * m->vProjSize * m->num_q_heads; i++) {
-      int token_ix = i % num_new_tokens;
-      int vproj_idx = (i / num_new_tokens) % m->vProjSize;
-      int head_idx = i / (num_new_tokens * m->vProjSize);
-      assert(token_ix < num_new_tokens && vproj_idx < m->vProjSize &&
-             head_idx < m->num_q_heads);
-      converted_attn_heads_cpu[token_ix][vproj_idx][head_idx] =
-          attn_heads_cpu[r_first_idx[r] * m->vProjSize * m->num_q_heads + i];
-    }
-    torch::Tensor converted_attn_heads_cuda = torch::from_blob(
-        converted_attn_heads_cpu,
-        {(int64_t)num_new_tokens, m->vProjSize, m->num_q_heads},
-        torch::kFloat32);
-
-    //  -------------------- Comparing C++ & CUDA results -------------------
-    /* std::cout << "CUDA attn head for req " << r << ":" <<std::endl;
-    for (int h=0; h<m->num_q_heads; h++) {
-      std::cout << converted_attn_heads_cuda.index({Slice(), Slice(), h}) <<
-    std::endl;
-    }
-    std::cout << "C++ attn head for req " << r << ":" <<std::endl;
-    for (int h=0; h<m->num_q_heads; h++) {
-      std::cout << attn_heads[r].index({Slice(), Slice(), h}) << std::endl;
-    } */
-    assert(torch::allclose(
-        converted_attn_heads_cuda, attn_heads[r], 1e-05, 1e-05));
-
-    //  ----------------------- C++ computations ----------------------------
-    // Compute output values by projecting all heads to output space
-    cpp_output.index(
-        {Slice(),
-         Slice(r_first_idx[r], r_first_idx[r] + (int64_t)num_new_tokens)}) =
-        torch::einsum("jkl,ijk->li", {torch_w_out, attn_heads[r]});
-
-    // increment main loop's auxiliary index
-    qk_prods_cpu_offset +=
-        num_new_tokens * num_tokens_received_so_far * num_q_heads;
-  }
-
-  //  ----------------------- Comparing C++ & CUDA results ---------------------
-  /* std::cout << "C++:" <<std::endl;
-  for (int i=0; i<m->oProjSize; i++) {
-    std::cout << cpp_output.index({i, Slice()}) << std::endl;
-  }
-  std::cout << "CUDA:" <<std::endl;
-  for (int i=0; i<m->oProjSize; i++) {
-    std::cout << torch_out_cuda.index({i, Slice(0,
-  (int64_t)bc->num_active_tokens())}) << std::endl;
-  } */
-
-  assert(torch::allclose(
-      torch_out_cuda.index(
-          {Slice(), Slice(0, (int64_t)bc->num_active_tokens())}),
-      cpp_output,
-      1e-05,
-      1e-05));
-
-  // =============================================================================
-  //  Cleanup
-  // =============================================================================
-  free(w_out);
-  checkCUDA(cudaFreeHost(input_cpu));
-  checkCUDA(cudaFreeHost(weight_cpu));
-  checkCUDA(cudaFreeHost(output_cpu));
-  checkCUDA(cudaFreeHost(QKVProjArray_cpu));
-  checkCUDA(cudaFreeHost(keyCache_cpu));
-  checkCUDA(cudaFreeHost(valueCache_cpu));
-  checkCUDA(cudaFreeHost(qk_prods_cpu));
-  checkCUDA(cudaFreeHost(qk_prods_softmax_cpu));
-  checkCUDA(cudaFreeHost(attn_heads_cpu));
-  checkCUDA(cudaFreeHost(w_out_cuda));
-  // assert(false && "All good if you see this assert failure! :)");
-#endif
-  // Done with INFERENCE_TESTS block
 }
 
 void IncMultiHeadSelfAttention::backward(FFModel const &ff) {
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index eaaa398654..5a2a14387e 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -1097,17 +1097,6 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     bias_ptr = gpu_mem_allocator.allocate_reserved_untyped(biasSize);
   }
 
-#ifdef INFERENCE_TESTS
-  kcache =
-      (float *)calloc(kProjSize * BatchConfig::max_sequence_length() *
-                          num_q_heads * BatchConfig::max_requests_per_batch(),
-                      sizeof(float));
-  vcache =
-      (float *)calloc(vProjSize * BatchConfig::max_sequence_length() *
-                          num_q_heads * BatchConfig::max_requests_per_batch(),
-                      sizeof(float));
-#endif
-
   // allocate memory for the seqArray and reserve space
   {
     int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
@@ -1253,10 +1242,6 @@ IncMultiHeadSelfAttentionMeta::~IncMultiHeadSelfAttentionMeta(void) {
   if (reserveInst != Realm::RegionInstance::NO_INST) {
     reserveInst.destroy();
   }
-#ifdef INFERENCE_TESTS
-  free(kcache);
-  free(vcache);
-#endif
 }
 
 template void Kernels::IncMultiHeadAttention::pre_build_weight_kernel<float>(
diff --git a/src/ops/kernels/dropout_kernels.cpp b/src/ops/kernels/dropout_kernels.cpp
index b0dd4c644e..14225f0bce 100644
--- a/src/ops/kernels/dropout_kernels.cpp
+++ b/src/ops/kernels/dropout_kernels.cpp
@@ -30,6 +30,7 @@ DropoutMeta::DropoutMeta(FFHandler handler,
                          Domain const &output_domain)
     : OpMeta(handler) {
   profiling = dropout->profiling;
+  inference_debugging = dropout->inference_debugging;
   checkCUDNN(miopenCreateTensorDescriptor(&inputTensor));
   checkCUDNN(miopenCreateTensorDescriptor(&outputTensor));
   checkCUDNN(miopenCreateDropoutDescriptor(&dropoutDesc));
diff --git a/src/ops/kernels/dropout_kernels.cu b/src/ops/kernels/dropout_kernels.cu
index 4a76301fd6..e142bba83b 100644
--- a/src/ops/kernels/dropout_kernels.cu
+++ b/src/ops/kernels/dropout_kernels.cu
@@ -29,6 +29,7 @@ DropoutMeta::DropoutMeta(FFHandler handler,
                          Domain const &output_domain)
     : OpMeta(handler) {
   profiling = dropout->profiling;
+  inference_debugging = dropout->inference_debugging;
   checkCUDNN(cudnnCreateTensorDescriptor(&inputTensor));
   checkCUDNN(cudnnCreateTensorDescriptor(&outputTensor));
   checkCUDNN(cudnnCreateDropoutDescriptor(&dropoutDesc));
diff --git a/src/ops/kernels/element_binary_kernels.cu b/src/ops/kernels/element_binary_kernels.cu
index ff5d5a67e1..42b31a664a 100644
--- a/src/ops/kernels/element_binary_kernels.cu
+++ b/src/ops/kernels/element_binary_kernels.cu
@@ -30,6 +30,7 @@ ElementBinaryMeta::ElementBinaryMeta(FFHandler handler, Op const *op)
   checkCUDNN(cudnnCreateReduceTensorDescriptor(&reduceAddDesc));
   op_type = OP_NOOP;
   profiling = false;
+  inference_debugging = false;
   inplace_a = false;
   has_same_operands = false;
   broadcast_input1 = false;
diff --git a/src/ops/kernels/softmax.cpp b/src/ops/kernels/softmax.cpp
index ca4872d51b..89c9f14a01 100644
--- a/src/ops/kernels/softmax.cpp
+++ b/src/ops/kernels/softmax.cpp
@@ -34,6 +34,7 @@ SoftmaxMeta::SoftmaxMeta(FFHandler handler,
       cudnnSetTensorDescriptorFromDomain4SoftMax(outputTensor, input_domain));
   dim = softmax->dim;
   profiling = softmax->profiling;
+  inference_debugging = softmax->inference_debugging;
   std::strcpy(op_name, softmax->name);
 }
 
diff --git a/src/ops/kernels/softmax.cu b/src/ops/kernels/softmax.cu
index 67a9c21038..e47006cc9d 100644
--- a/src/ops/kernels/softmax.cu
+++ b/src/ops/kernels/softmax.cu
@@ -33,6 +33,7 @@ SoftmaxMeta::SoftmaxMeta(FFHandler handler,
       outputTensor, input_domain, softmax->data_type));
   dim = softmax->dim;
   profiling = softmax->profiling;
+  inference_debugging = softmax->inference_debugging;
   std::strcpy(op_name, softmax->name);
 }
 
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index cb519239c5..bc1358e49c 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -383,6 +383,8 @@ OpMeta *LayerNorm::init_task(Task const *task,
                        .first();
   MemoryAllocator gpu_mem_allocator(gpu_mem);
   LayerNormMeta *meta = new LayerNormMeta(handle, ln, gpu_mem_allocator);
+  std::strcpy(meta->op_name, ln->name);
+  meta->layer_guid = ln->layer_guid;
   meta->input_type[0] = ln->inputs[0]->data_type;
   meta->output_type[0] = ln->outputs[0]->data_type;
   return meta;
@@ -504,7 +506,7 @@ void LayerNorm::inference_task(Task const *task,
     return;
   }
 
-  LayerNormMeta const *m = *((LayerNormMeta **)task->local_args);
+  LayerNormMeta *m = *((LayerNormMeta **)task->local_args);
   assert(task->regions.size() == regions.size());
   float const *in_ptr = NULL;
   float *out_ptr = NULL, *gamma_ptr = NULL, *beta_ptr = NULL;
@@ -558,7 +560,22 @@ void LayerNorm::inference_task(Task const *task,
   } else {
     assert(regions.size() == 2);
   }
+
   LayerNorm::forward_kernel_wrapper(m, in, out, gamma, beta);
+
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    std::vector<GenericTensorAccessorR> weights_accessors;
+    if (m->elementwise_affine) {
+      weights_accessors.push_back(gamma);
+      if (m->use_bias) {
+        weights_accessors.push_back(beta);
+      }
+    }
+    LayerNorm::save_inference_tensors_to_file(
+        m, shard_id, bc, {in}, weights_accessors, {out});
+  }
 }
 
 /*
@@ -858,6 +875,7 @@ bool LayerNorm::measure_operator_cost(Simulator *sim,
 void LayerNorm::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->layer_guid.transformer_layer_id);
+  sez.serialize(this->layer_guid.model_id);
   sez.serialize(this->axes.size());
   for (size_t i = 0; i < this->axes.size(); i++) {
     sez.serialize(this->axes[i]);
@@ -879,10 +897,11 @@ Node LayerNorm::deserialize(FFModel &ff,
   bool elementwise_affine;
   bool use_bias;
   float eps;
-  size_t id, transformer_layer_id;
+  size_t id, transformer_layer_id, deserialized_model_id;
   dez.deserialize(id);
   dez.deserialize(transformer_layer_id);
-  LayerID layer_guid(id, transformer_layer_id);
+  dez.deserialize(deserialized_model_id);
+  LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
   dez.deserialize(num_axes);
   for (size_t i = 0; i < num_axes; i++) {
     int axis_idx;
diff --git a/src/ops/layer_norm.cu b/src/ops/layer_norm.cu
index 12751113a2..6d29071e38 100644
--- a/src/ops/layer_norm.cu
+++ b/src/ops/layer_norm.cu
@@ -33,6 +33,7 @@ LayerNormMeta::LayerNormMeta(FFHandler handle,
   effective_batch_size = ln->effective_batch_size;
   effective_num_elements = ln->effective_num_elements;
   profiling = ln->profiling;
+  inference_debugging = ln->inference_debugging;
   eps = ln->eps;
   DataType data_type = ln->data_type;
   size_t totalSize = effective_batch_size * data_type_size(data_type) * 6;
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index a751ebcc57..63b26bfe7d 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -504,11 +504,13 @@ OpMeta *Linear::init_task_with_dim(Task const *task,
   m->use_bias = linear->use_bias;
   m->add_bias_only_once = linear->add_bias_only_once;
   m->profiling = linear->profiling;
+  m->inference_debugging = linear->inference_debugging;
   m->trainableInputs[0] = linear->trainableInputs[0];
   m->weight_ptr_type = m->input_type[0];
   m->quantization_type = linear->quantization_type;
   m->offload = linear->offload;
   std::strcpy(m->op_name, linear->name);
+  m->layer_guid = linear->layer_guid;
 
   init_kernel(m, batch_size, out_dim);
 
@@ -617,7 +619,7 @@ void Linear::inference_task(Task const *task,
                             Runtime *runtime) {
   Domain input_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
-  LinearMeta const *m = *((LinearMeta **)task->local_args);
+  LinearMeta *m = *((LinearMeta **)task->local_args);
   BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
   if (bc->num_tokens == 0) {
     return;
@@ -658,6 +660,18 @@ void Linear::inference_task(Task const *task,
                          in_dim,
                          out_dim,
                          batch_size);
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    std::vector<GenericTensorAccessorR> weights_accessors;
+    weights_accessors.push_back(weight);
+    if (m->use_bias &&
+        !(m->add_bias_only_once && task->index_point.point_data[0] != 0)) {
+      weights_accessors.push_back(bias);
+    }
+    Linear::save_inference_tensors_to_file(
+        m, shard_id, bc, {input}, weights_accessors, {output});
+  }
 }
 
 void Linear::forward_task(Task const *task,
@@ -1235,6 +1249,7 @@ bool operator==(LinearParams const &lhs, LinearParams const &rhs) {
 void Linear::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->layer_guid.transformer_layer_id);
+  sez.serialize(this->layer_guid.model_id);
   sez.serialize(this->out_channels);
   sez.serialize(this->activation);
   sez.serialize(this->kernel_reg_type);
@@ -1260,10 +1275,11 @@ Node Linear::deserialize(FFModel &ff,
   DataType data_type;
   DataType quantization_type;
   bool offload;
-  size_t id, transformer_layer_id;
+  size_t id, transformer_layer_id, deserialized_model_id;
   dez.deserialize(id);
   dez.deserialize(transformer_layer_id);
-  LayerID layer_guid(id, transformer_layer_id);
+  dez.deserialize(deserialized_model_id);
+  LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
   dez.deserialize(out_channels);
   dez.deserialize(activation);
   dez.deserialize(kernel_reg_type);
diff --git a/src/ops/pool_2d.cc b/src/ops/pool_2d.cc
index f56a60641d..e358448ddf 100644
--- a/src/ops/pool_2d.cc
+++ b/src/ops/pool_2d.cc
@@ -317,7 +317,9 @@ OpMeta *Pool2D::init_task(Task const *task,
   FFHandler handle = *((FFHandler const *)task->local_args);
   Pool2DMeta *m = new Pool2DMeta(handle);
   m->profiling = pool->profiling;
+  m->inference_debugging = pool->inference_debugging;
   std::strcpy(m->op_name, pool->name);
+  m->layer_guid = pool->layer_guid;
   TensorAccessorR<float, Pool2DInput::NUMDIM> acc_input(
       regions[0], task->regions[0], FID_DATA, ctx, runtime);
   TensorAccessorW<float, Pool2DOutput::NUMDIM> acc_output(regions[1],
diff --git a/src/ops/reduce.cc b/src/ops/reduce.cc
index 6c999c8858..7a443e6ad0 100644
--- a/src/ops/reduce.cc
+++ b/src/ops/reduce.cc
@@ -210,6 +210,8 @@ OpMeta *Reduce::init_task(Task const *task,
   GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
       DT_FLOAT, regions[1], task->regions[1], FID_DATA, ctx, runtime);
   ReduceMeta *m = new ReduceMeta(handle, rd, input.domain);
+  std::strcpy(m->op_name, rd->name);
+  m->layer_guid = rd->layer_guid;
   return m;
 }
 
@@ -375,6 +377,7 @@ void Reduce::serialize(Legion::Serializer &sez) const {
   sez.serialize(params.keepdims);
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->layer_guid.transformer_layer_id);
+  sez.serialize(this->layer_guid.model_id);
 }
 
 using PCG::Node;
@@ -393,10 +396,11 @@ Node Reduce::deserialize(FFModel &ff,
     axes.push_back(dim_idx);
   }
   dez.deserialize(keepdims);
-  size_t id, transformer_layer_id;
+  size_t id, transformer_layer_id, deserialized_model_id;
   dez.deserialize(id);
   dez.deserialize(transformer_layer_id);
-  LayerID layer_guid(id, transformer_layer_id);
+  dez.deserialize(deserialized_model_id);
+  LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
 
   return ff.get_or_create_node<Reduce>(inputs[0], {axes, keepdims, layer_guid});
 }
diff --git a/src/ops/reshape.cc b/src/ops/reshape.cc
index 41c3fcdbf1..45da190680 100644
--- a/src/ops/reshape.cc
+++ b/src/ops/reshape.cc
@@ -181,6 +181,8 @@ OpMeta *Reshape::init_task(Task const *task,
   Reshape const *reshape = (Reshape *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
   ReshapeMeta *m = new ReshapeMeta(handle);
+  std::strcpy(m->op_name, reshape->name);
+  m->layer_guid = reshape->layer_guid;
   m->data_type = reshape->outputs[0]->data_type;
   return m;
 }
@@ -411,6 +413,7 @@ void Reshape::serialize(Legion::Serializer &sez) const {
   }
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->layer_guid.transformer_layer_id);
+  sez.serialize(this->layer_guid.model_id);
 }
 
 using PCG::Node;
@@ -428,10 +431,11 @@ Node Reshape::deserialize(FFModel &ff,
     dez.deserialize(value);
     shape.push_back(value);
   }
-  size_t id, transformer_layer_id;
+  size_t id, transformer_layer_id, deserialized_model_id;
   dez.deserialize(id);
   dez.deserialize(transformer_layer_id);
-  LayerID layer_guid(id, transformer_layer_id);
+  dez.deserialize(deserialized_model_id);
+  LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
 
   ReshapeParams params;
   params.shape = shape;
diff --git a/src/ops/residual_layer_norm.cc b/src/ops/residual_layer_norm.cc
index 3bec09521a..7de40fb389 100644
--- a/src/ops/residual_layer_norm.cc
+++ b/src/ops/residual_layer_norm.cc
@@ -493,6 +493,8 @@ OpMeta *ResidualLayerNorm::init_task(Task const *task,
   MemoryAllocator gpu_mem_allocator(gpu_mem);
   ResidualLayerNormMeta *meta =
       new ResidualLayerNormMeta(handle, ln, gpu_mem_allocator);
+  std::strcpy(meta->op_name, ln->name);
+  meta->layer_guid = ln->layer_guid;
   meta->input_type[0] = ln->inputs[0]->data_type;
   meta->input_type[1] = ln->inputs[1]->data_type;
   if (ln->use_two_residuals) {
@@ -622,8 +624,7 @@ void ResidualLayerNorm::inference_task(
     return;
   }
 
-  ResidualLayerNormMeta const *m =
-      *((ResidualLayerNormMeta **)task->local_args);
+  ResidualLayerNormMeta *m = *((ResidualLayerNormMeta **)task->local_args);
 
   assert(regions.size() ==
          4 + m->use_two_residuals +
@@ -734,6 +735,30 @@ void ResidualLayerNorm::inference_task(
 
   ResidualLayerNorm::inference_kernel_wrapper(
       m, input, residual1, residual2, added_output, output, gamma, beta);
+
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    std::vector<GenericTensorAccessorR> input_accessors;
+    input_accessors.push_back(input);
+    input_accessors.push_back(residual1);
+    if (m->use_two_residuals) {
+      input_accessors.push_back(residual2);
+    }
+    std::vector<GenericTensorAccessorR> weights_accessors;
+    if (m->elementwise_affine) {
+      weights_accessors.push_back(gamma);
+      if (m->use_bias) {
+        weights_accessors.push_back(beta);
+      }
+    }
+    ResidualLayerNorm::save_inference_tensors_to_file(m,
+                                                      shard_id,
+                                                      bc,
+                                                      input_accessors,
+                                                      weights_accessors,
+                                                      {added_output, output});
+  }
 }
 
 bool ResidualLayerNorm::measure_operator_cost(Simulator *sim,
@@ -745,6 +770,7 @@ bool ResidualLayerNorm::measure_operator_cost(Simulator *sim,
 void ResidualLayerNorm::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->layer_guid.transformer_layer_id);
+  sez.serialize(this->layer_guid.model_id);
   sez.serialize(this->axes.size());
   for (size_t i = 0; i < this->axes.size(); i++) {
     sez.serialize(this->axes[i]);
@@ -767,10 +793,11 @@ Node ResidualLayerNorm::deserialize(FFModel &ff,
   bool use_bias;
   bool use_two_residuals;
   float eps;
-  size_t id, transformer_layer_id;
+  size_t id, transformer_layer_id, deserialized_model_id;
   dez.deserialize(id);
   dez.deserialize(transformer_layer_id);
-  LayerID layer_guid(id, transformer_layer_id);
+  dez.deserialize(deserialized_model_id);
+  LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
   dez.deserialize(num_axes);
   for (size_t i = 0; i < num_axes; i++) {
     int axis_idx;
@@ -811,6 +838,7 @@ size_t hash<FlexFlow::ResidualLayerNormParams>::operator()(
   size_t key = 0;
   hash_combine(key, params.layer_guid.id);
   hash_combine(key, params.layer_guid.transformer_layer_id);
+  hash_combine(key, params.layer_guid.model_id);
   hash_combine(key, params.axes.size());
   for (int n : params.axes) {
     hash_combine(key, n);
diff --git a/src/ops/residual_layer_norm.cpp b/src/ops/residual_layer_norm.cpp
index 7b42392326..f1b7a537b0 100644
--- a/src/ops/residual_layer_norm.cpp
+++ b/src/ops/residual_layer_norm.cpp
@@ -34,6 +34,7 @@ ResidualLayerNormMeta::ResidualLayerNormMeta(FFHandler handle,
   effective_batch_size = ln->effective_batch_size;
   effective_num_elements = ln->effective_num_elements;
   profiling = ln->profiling;
+  inference_debugging = ln->inference_debugging;
   eps = ln->eps;
   DataType data_type = ln->data_type;
   size_t totalSize = effective_batch_size * data_type_size(data_type) * 3;
diff --git a/src/ops/residual_layer_norm.cu b/src/ops/residual_layer_norm.cu
index 3bd18217cb..e5ebdce6ed 100644
--- a/src/ops/residual_layer_norm.cu
+++ b/src/ops/residual_layer_norm.cu
@@ -33,6 +33,7 @@ ResidualLayerNormMeta::ResidualLayerNormMeta(FFHandler handle,
   effective_batch_size = ln->effective_batch_size;
   effective_num_elements = ln->effective_num_elements;
   profiling = ln->profiling;
+  inference_debugging = ln->inference_debugging;
   eps = ln->eps;
   DataType data_type = ln->data_type;
   size_t totalSize = effective_batch_size * data_type_size(data_type) * 3;
diff --git a/src/ops/residual_rms_norm.cc b/src/ops/residual_rms_norm.cc
index 3efb7274a0..b447a2a3b5 100644
--- a/src/ops/residual_rms_norm.cc
+++ b/src/ops/residual_rms_norm.cc
@@ -351,6 +351,8 @@ OpMeta *ResidualRMSNorm::init_task(Task const *task,
   MemoryAllocator gpu_mem_allocator(gpu_mem);
   ResidualRMSNormMeta *meta =
       new ResidualRMSNormMeta(handle, rn, gpu_mem_allocator);
+  std::strcpy(meta->op_name, rn->name);
+  meta->layer_guid = rn->layer_guid;
   return meta;
 }
 
@@ -431,7 +433,7 @@ void ResidualRMSNorm::inference_task(Task const *task,
   if (bc->num_tokens == 0) {
     return;
   }
-  ResidualRMSNormMeta const *m = *((ResidualRMSNormMeta **)task->local_args);
+  ResidualRMSNormMeta *m = *((ResidualRMSNormMeta **)task->local_args);
   GenericTensorAccessorR input1 = helperGetGenericTensorAccessorRO(
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
   GenericTensorAccessorR input2 = helperGetGenericTensorAccessorRO(
@@ -443,11 +445,18 @@ void ResidualRMSNorm::inference_task(Task const *task,
   GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
       m->weight_type[0], regions[4], task->regions[4], FID_DATA, ctx, runtime);
   forward_kernel_wrapper(m, input1, input2, weight, residual_output, output);
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    ResidualRMSNorm::save_inference_tensors_to_file(
+        m, shard_id, bc, {input1, input2}, {weight}, {residual_output, output});
+  }
 }
 
 void ResidualRMSNorm::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->layer_guid.transformer_layer_id);
+  sez.serialize(this->layer_guid.model_id);
   sez.serialize(this->eps);
   sez.serialize(this->dim);
 }
@@ -460,12 +469,12 @@ Node ResidualRMSNorm::deserialize(FFModel &ff,
                                   int num_inputs) {
   assert(num_inputs == 2);
   float eps;
-  size_t id, transformer_layer_id;
+  size_t id, transformer_layer_id, deserialized_model_id;
   int dim;
   dez.deserialize(id);
   dez.deserialize(transformer_layer_id);
-
-  LayerID layer_guid(id, transformer_layer_id);
+  dez.deserialize(deserialized_model_id);
+  LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
   dez.deserialize(eps);
   dez.deserialize(dim);
   ResidualRMSNormParams params;
diff --git a/src/ops/rms_norm.cc b/src/ops/rms_norm.cc
index 5b1634472d..2a34f83be2 100644
--- a/src/ops/rms_norm.cc
+++ b/src/ops/rms_norm.cc
@@ -297,6 +297,8 @@ OpMeta *RMSNorm::init_task(Task const *task,
                        .first();
   MemoryAllocator gpu_mem_allocator(gpu_mem);
   RMSNormMeta *meta = new RMSNormMeta(handle, rn, gpu_mem_allocator);
+  std::strcpy(meta->op_name, rn->name);
+  meta->layer_guid = rn->layer_guid;
   return meta;
 }
 
@@ -413,7 +415,7 @@ void RMSNorm::inference_task(Task const *task,
   if (bc->num_tokens == 0) {
     return;
   }
-  RMSNormMeta const *m = *((RMSNormMeta **)task->local_args);
+  RMSNormMeta *m = *((RMSNormMeta **)task->local_args);
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
   GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
@@ -421,11 +423,18 @@ void RMSNorm::inference_task(Task const *task,
   GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
       m->weight_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
   forward_kernel_wrapper(m, input, weight, output);
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    RMSNorm::save_inference_tensors_to_file(
+        m, shard_id, bc, {input}, {weight}, {output});
+  }
 }
 
 void RMSNorm::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->layer_guid.transformer_layer_id);
+  sez.serialize(this->layer_guid.model_id);
   sez.serialize(this->eps);
   sez.serialize(this->dim);
 }
@@ -438,12 +447,13 @@ Node RMSNorm::deserialize(FFModel &ff,
                           int num_inputs) {
   assert(num_inputs == 1);
   float eps;
-  size_t id, transformer_layer_id;
+  size_t id, transformer_layer_id, deserialized_model_id;
   int dim;
   dez.deserialize(id);
   dez.deserialize(transformer_layer_id);
+  dez.deserialize(deserialized_model_id);
 
-  LayerID layer_guid(id, transformer_layer_id);
+  LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
   dez.deserialize(eps);
   dez.deserialize(dim);
   RMSNormParams params;
diff --git a/src/ops/sampling.cc b/src/ops/sampling.cc
index 6eb62b2933..463b15aadb 100644
--- a/src/ops/sampling.cc
+++ b/src/ops/sampling.cc
@@ -231,6 +231,9 @@ OpMeta *Sampling::init_task(Task const *task,
   SamplingMeta *m = new SamplingMeta(
       handle, s, batch_size, length * batch_size, acc_input, gpu_mem_allocator);
   m->profiling = s->profiling;
+  m->inference_debugging = s->inference_debugging;
+  std::strcpy(m->op_name, s->name);
+  m->layer_guid = s->layer_guid;
   m->top_p = s->top_p;
   return m;
 }
@@ -287,7 +290,7 @@ InferenceResult
   assert(task->regions.size() == 2);
   BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
   // BatchConfig const *bc = (BatchConfig *)task->args;
-  SamplingMeta const *m = *((SamplingMeta **)task->local_args);
+  SamplingMeta *m = *((SamplingMeta **)task->local_args);
   if (bc->num_tokens == 0) {
     // Directly return for empty batch config
     InferenceResult ir;
@@ -302,6 +305,13 @@ InferenceResult
   int batch_size = bc->num_active_tokens();
   Sampling::forward_kernel_wrapper(m, input, indices, batch_size);
 
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    Sampling::save_inference_tensors_to_file(
+        m, shard_id, bc, {}, {}, {input, indices});
+  }
+
   InferenceResult ir;
   download_tensor<BatchConfig::TokenId>(
       indices.get_int32_ptr(), ir.token_ids, batch_size);
diff --git a/src/ops/sigmoid_silu_multi.cc b/src/ops/sigmoid_silu_multi.cc
index 031c7833a4..3b2ed7cef4 100644
--- a/src/ops/sigmoid_silu_multi.cc
+++ b/src/ops/sigmoid_silu_multi.cc
@@ -244,6 +244,8 @@ OpMeta *SigmoidSiluMulti::init_task(Task const *task,
   meta->input_type[0] = ssm->inputs[0]->data_type;
   meta->input_type[1] = ssm->inputs[1]->data_type;
   meta->output_type[0] = ssm->outputs[0]->data_type;
+  std::strcpy(meta->op_name, ssm->name);
+  meta->layer_guid = ssm->layer_guid;
   return meta;
 }
 
@@ -323,7 +325,7 @@ void SigmoidSiluMulti::inference_task(
     return;
   }
 
-  SigmoidSiluMultiMeta const *m = *((SigmoidSiluMultiMeta **)task->local_args);
+  SigmoidSiluMultiMeta *m = *((SigmoidSiluMultiMeta **)task->local_args);
 
   GenericTensorAccessorR input1 = helperGetGenericTensorAccessorRO(
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
@@ -346,6 +348,12 @@ void SigmoidSiluMulti::inference_task(
   assert(input1_domain == output_domain);
 
   SigmoidSiluMulti::inference_kernel_wrapper(m, input1, input2, output);
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    SigmoidSiluMulti::save_inference_tensors_to_file(
+        m, shard_id, bc, {input1, input2}, {}, {output});
+  }
 }
 
 bool SigmoidSiluMulti::measure_operator_cost(Simulator *sim,
@@ -357,6 +365,7 @@ bool SigmoidSiluMulti::measure_operator_cost(Simulator *sim,
 void SigmoidSiluMulti::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->layer_guid.transformer_layer_id);
+  sez.serialize(this->layer_guid.model_id);
 }
 
 using PCG::Node;
@@ -366,10 +375,11 @@ Node SigmoidSiluMulti::deserialize(FFModel &ff,
                                    ParallelTensor inputs[],
                                    int num_inputs) {
   assert(num_inputs == 2);
-  size_t id, transformer_layer_id;
+  size_t id, transformer_layer_id, deserialized_model_id;
   dez.deserialize(id);
   dez.deserialize(transformer_layer_id);
-  LayerID layer_guid(id, transformer_layer_id);
+  dez.deserialize(deserialized_model_id);
+  LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
 
   SigmoidSiluMultiParams params;
   params.layer_guid = layer_guid;
@@ -385,6 +395,7 @@ size_t hash<FlexFlow::SigmoidSiluMultiParams>::operator()(
   size_t key = 0;
   hash_combine(key, params.layer_guid.id);
   hash_combine(key, params.layer_guid.transformer_layer_id);
+  hash_combine(key, params.layer_guid.model_id);
   return key;
 }
 }; // namespace std
diff --git a/src/ops/sigmoid_silu_multi.cpp b/src/ops/sigmoid_silu_multi.cpp
index fa73a55722..7b7f30a288 100644
--- a/src/ops/sigmoid_silu_multi.cpp
+++ b/src/ops/sigmoid_silu_multi.cpp
@@ -25,6 +25,7 @@ SigmoidSiluMultiMeta::SigmoidSiluMultiMeta(FFHandler handle,
                                            MemoryAllocator &gpu_mem_allocator)
     : OpMeta(handle) {
   profiling = ssm->profiling;
+  inference_debugging = ssm->inference_debugging;
 }
 
 SigmoidSiluMultiMeta::~SigmoidSiluMultiMeta(void) {
diff --git a/src/ops/sigmoid_silu_multi.cu b/src/ops/sigmoid_silu_multi.cu
index fd69f6a8aa..590b641b5a 100644
--- a/src/ops/sigmoid_silu_multi.cu
+++ b/src/ops/sigmoid_silu_multi.cu
@@ -24,6 +24,7 @@ SigmoidSiluMultiMeta::SigmoidSiluMultiMeta(FFHandler handle,
                                            MemoryAllocator &gpu_mem_allocator)
     : OpMeta(handle) {
   profiling = ssm->profiling;
+  inference_debugging = ssm->inference_debugging;
 }
 
 SigmoidSiluMultiMeta::~SigmoidSiluMultiMeta(void) {
diff --git a/src/ops/softmax.cc b/src/ops/softmax.cc
index 28c9ecea67..ba0a1288d6 100644
--- a/src/ops/softmax.cc
+++ b/src/ops/softmax.cc
@@ -230,6 +230,8 @@ OpMeta *Softmax::init_task(Task const *task,
   m->input_type = softmax->inputs[0]->data_type;
   m->output_type = softmax->outputs[0]->data_type;
   // checkCUDNN(cudnnCreateTensorDescriptor(&m->outputTensor));
+  std::strcpy(m->op_name, softmax->name);
+  m->layer_guid = softmax->layer_guid;
   return m;
 }
 
@@ -303,50 +305,25 @@ void Softmax::forward_task(Task const *task,
                            std::vector<PhysicalRegion> const &regions,
                            Context ctx,
                            Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
   Domain in_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
   SoftmaxMeta const *m = *((SoftmaxMeta **)task->local_args);
-  switch (in_domain.get_dim()) {
-#define DIMFUNC(DIM)                                                           \
-  case DIM:                                                                    \
-    if (m->output_type == DT_HALF) {                                           \
-      return forward_task_with_dim<half, DIM>(task, regions, ctx, runtime);    \
-    } else if (m->output_type == DT_FLOAT) {                                   \
-      return forward_task_with_dim<float, DIM>(task, regions, ctx, runtime);   \
-    } else {                                                                   \
-      assert(false && "Unsupported data type");                                \
-    }
-    LEGION_FOREACH_N(DIMFUNC)
-#undef DIMFUNC
-    default:
-      assert(false);
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->output_type, regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type, regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  if (m->output_type == DT_HALF) {
+    forward_kernel_wrapper(m, input.get_half_ptr(), output.get_half_ptr());
+  } else if (m->output_type == DT_FLOAT) {
+    forward_kernel_wrapper(m, input.get_float_ptr(), output.get_float_ptr());
+  } else {
+    assert(false && "Unsupported data type");
   }
 }
 
-/*
-  regions[0](I): input
-  regions[1](O): output
-*/
-template <typename DT, int NDIM>
-void Softmax::forward_task_with_dim(Task const *task,
-                                    std::vector<PhysicalRegion> const &regions,
-                                    Context ctx,
-                                    Runtime *runtime) {
-  assert(regions.size() == 2);
-  assert(task->regions.size() == 2);
-  // const Softmax* softmax = (Softmax*) task->args;
-  SoftmaxMeta const *m = *((SoftmaxMeta **)task->local_args);
-  TensorAccessorR<DT, NDIM> acc_input(
-      regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  TensorAccessorW<DT, NDIM> acc_output(regions[1],
-                                       task->regions[1],
-                                       FID_DATA,
-                                       ctx,
-                                       runtime,
-                                       false /*readOutput*/);
-  forward_kernel_wrapper(m, acc_input.ptr, acc_output.ptr);
-}
-
 void Softmax::backward(FFModel const &ff) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
@@ -435,29 +412,31 @@ void Softmax::inference_task(Task const *task,
                              Context ctx,
                              Runtime *runtime) {
   assert(task->regions.size() == regions.size());
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
   BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
   if (bc->num_tokens == 0) {
     return;
   }
   Domain in_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
-  SoftmaxMeta const *m = *((SoftmaxMeta **)task->local_args);
-  switch (in_domain.get_dim()) {
-#define DIMFUNC(DIM)                                                           \
-  case DIM:                                                                    \
-    if (m->output_type == DT_HALF) {                                           \
-      forward_task_with_dim<half, DIM>(task, regions, ctx, runtime);           \
-      break;                                                                   \
-    } else if (m->output_type == DT_FLOAT) {                                   \
-      forward_task_with_dim<float, DIM>(task, regions, ctx, runtime);          \
-      break;                                                                   \
-    } else {                                                                   \
-      assert(false && "Unsupported data type");                                \
-    }
-    LEGION_FOREACH_N(DIMFUNC)
-#undef DIMFUNC
-    default:
-      assert(false);
+  SoftmaxMeta *m = *((SoftmaxMeta **)task->local_args);
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->output_type, regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type, regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  if (m->output_type == DT_HALF) {
+    forward_kernel_wrapper(m, input.get_half_ptr(), output.get_half_ptr());
+  } else if (m->output_type == DT_FLOAT) {
+    forward_kernel_wrapper(m, input.get_float_ptr(), output.get_float_ptr());
+  } else {
+    assert(false && "Unsupported data type");
+  }
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    Softmax::save_inference_tensors_to_file(
+        m, shard_id, bc, {input}, {}, {output});
   }
 }
 
diff --git a/src/ops/spec_inc_multihead_self_attention.cc b/src/ops/spec_inc_multihead_self_attention.cc
index 350ab3c167..4c78960d5f 100644
--- a/src/ops/spec_inc_multihead_self_attention.cc
+++ b/src/ops/spec_inc_multihead_self_attention.cc
@@ -658,6 +658,9 @@ OpMeta *SpecIncMultiHeadSelfAttention::init_task(
   assert(gpu_mem_allocator.instance_allocated_size ==
          gpu_mem_allocator.instance_total_size);
   m->profiling = attn->profiling;
+  m->inference_debugging = attn->inference_debugging;
+  std::strcpy(m->op_name, attn->name);
+  m->layer_guid = attn->layer_guid;
   assert(weight.domain.get_volume() * data_type_size(weight.data_type) ==
          m->weightSize);
   return m;
@@ -733,14 +736,13 @@ void SpecIncMultiHeadSelfAttention::inference_task(
     Runtime *runtime) {
   assert(task->regions.size() == regions.size());
 
-  // BeamSearchBatchConfig const *bc = (BeamSearchBatchConfig *)task->args;
   BeamSearchBatchConfig const &bc =
       Future(task->futures[0]).get_result<BeamSearchBatchConfig>();
   if (bc.num_tokens == 0) {
     return;
   }
 
-  SpecIncMultiHeadSelfAttentionMeta const *m =
+  SpecIncMultiHeadSelfAttentionMeta *m =
       *((SpecIncMultiHeadSelfAttentionMeta **)task->local_args);
   assert(((*m->qkv_bias || *m->final_bias) ? regions.size() == 4
                                            : regions.size() == 3));
@@ -777,14 +779,17 @@ void SpecIncMultiHeadSelfAttention::inference_task(
   assert(task->index_point.get_dim() == 1);
   SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
       m, &bc, task->index_point.point_data[0], input, weight, output, biases);
-
-  // print_tensor<float>(input.get_float_ptr(), 20, "attention input");
-  // print_tensor<float>(output.get_float_ptr(), 20, "attention output");
-  // if(bc.beam_slots.at(0).current_depth == 1){
-  //     print_beam_tensor<float>(input.get_float_ptr(), 50, 4096, 40, "mha topk
-  //     input"); print_beam_tensor<float>(output.get_float_ptr(), 50, 4096, 40,
-  //     "mha topk output");
-  // }
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    std::vector<GenericTensorAccessorR> weights_accessors;
+    weights_accessors.push_back(weight);
+    if (*m->qkv_bias || *m->final_bias) {
+      weights_accessors.push_back(biases);
+    }
+    SpecIncMultiHeadSelfAttention::save_inference_tensors_to_file(
+        m, shard_id, &bc, {input}, weights_accessors, {output});
+  }
 }
 
 void SpecIncMultiHeadSelfAttention::backward(FFModel const &ff) {
diff --git a/src/ops/topk.cc b/src/ops/topk.cc
index d76ad75167..b38ff85f90 100644
--- a/src/ops/topk.cc
+++ b/src/ops/topk.cc
@@ -225,7 +225,10 @@ OpMeta *TopK::init_task(Task const *task,
   FFHandler handle = *((FFHandler *)task->local_args);
   TopKMeta *m = new TopKMeta(handle);
   m->profiling = topk->profiling;
+  m->inference_debugging = topk->inference_debugging;
   m->sorted = topk->sorted;
+  std::strcpy(m->op_name, topk->name);
+  m->layer_guid = topk->layer_guid;
   return m;
 }
 
diff --git a/src/ops/transpose.cc b/src/ops/transpose.cc
index 303948964b..500b7867af 100644
--- a/src/ops/transpose.cc
+++ b/src/ops/transpose.cc
@@ -193,6 +193,9 @@ OpMeta *Transpose::init_task(Task const *task,
   TransposeMeta *m = new TransposeMeta(handle);
   transpose->init_meta(m, in_domain, out_domain);
   m->profiling = transpose->profiling;
+  m->inference_debugging = transpose->inference_debugging;
+  std::strcpy(m->op_name, transpose->name);
+  m->layer_guid = transpose->layer_guid;
   return m;
 }
 
diff --git a/src/ops/tree_inc_multihead_self_attention.cc b/src/ops/tree_inc_multihead_self_attention.cc
index 207dae0785..6b520aa37b 100644
--- a/src/ops/tree_inc_multihead_self_attention.cc
+++ b/src/ops/tree_inc_multihead_self_attention.cc
@@ -722,6 +722,9 @@ OpMeta *TreeIncMultiHeadSelfAttention::init_task(
            gpu_mem_allocator.reserved_total_size);
   }
   m->profiling = attn->profiling;
+  m->inference_debugging = attn->inference_debugging;
+  std::strcpy(m->op_name, attn->name);
+  m->layer_guid = attn->layer_guid;
 
   if (attn->quantization_type == DT_NONE) {
     assert(weight.domain.get_volume() * data_type_size(weight.data_type) ==
@@ -803,7 +806,6 @@ void TreeIncMultiHeadSelfAttention::inference_task(
     Runtime *runtime) {
   assert(task->regions.size() == regions.size());
 
-  // TreeVerifyBatchConfig const *bc = (TreeVerifyBatchConfig *)task->args;
   TreeVerifyBatchConfig const &bc =
       Future(task->futures[0]).get_result<TreeVerifyBatchConfig>();
   log_tree_verify.debug(
@@ -857,6 +859,18 @@ void TreeIncMultiHeadSelfAttention::inference_task(
 
   TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
       m, &bc, task->index_point.point_data[0], input, weight, output, biases);
+
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    std::vector<GenericTensorAccessorR> weights_accessors;
+    weights_accessors.push_back(weight);
+    if (*m->qkv_bias || *m->final_bias) {
+      weights_accessors.push_back(biases);
+    }
+    TreeIncMultiHeadSelfAttention::save_inference_tensors_to_file(
+        m, shard_id, &bc, {input}, weights_accessors, {output});
+  }
 }
 
 void TreeIncMultiHeadSelfAttention::backward(FFModel const &ff) {
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index cbf839c6b2..72572c4e06 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -88,43 +88,61 @@ int BatchConfig::max_sequence_length() {
   return RequestManager::get_request_manager()->get_max_sequence_length();
 }
 
-void BatchConfig::print() const {
-  std::cout << "@@@@@@@@@@@@@@ Batch Config (mode " << get_mode()
-            << ") @@@@@@@@@@@@@@" << std::endl;
-  std::cout << "Max number of requests: " << max_requests_per_batch()
-            << std::endl;
-  std::cout << "Max number of tokens: " << max_tokens_per_batch() << std::endl;
-  std::cout << "Number of tokens: " << num_tokens << std::endl;
-  std::cout << "Number of requests: " << num_active_requests() << std::endl;
-  // std::cout << "Cached results: " << cached_results << std::endl;
-
-  std::cout << "Per-request info:\n";
-  for (int i = 0; i < max_requests_per_batch(); i++) {
-    if (!request_completed[i]) {
-      std::cout << "  Request " << i << ":\n";
-      std::cout << "    Token start offset: "
-                << requestsInfo[i].token_start_offset << std::endl;
-      std::cout << "    Number of tokens in batch: "
-                << requestsInfo[i].num_tokens_in_batch << std::endl;
-      std::cout << "    GUID: " << requestsInfo[i].request_guid << std::endl;
-      std::cout << "    Max sequence length: "
-                << requestsInfo[i].max_sequence_length << std::endl;
-      std::cout << "    Request completed: " << request_completed[i]
-                << std::endl;
+std::ostream &operator<<(std::ostream &os, BatchConfig const &bc) {
+  os << "@@@@@@@@@@@@@@ Batch Config (mode " << bc.get_mode()
+     << ") @@@@@@@@@@@@@@" << std::endl;
+  // Max values
+  os << "Max number of requests: " << bc.max_requests_per_batch() << std::endl;
+  os << "Max number of tokens: " << bc.max_tokens_per_batch() << std::endl;
+  os << "Max sequence length: " << bc.max_sequence_length() << std::endl;
+  // Current values
+  os << "Number of tokens: " << bc.num_active_tokens() << std::endl;
+  os << "Number of requests: " << bc.num_active_requests() << std::endl;
+
+  // Per-request info
+  os << "Per-request info:\n";
+  for (int i = 0; i < bc.max_requests_per_batch(); i++) {
+    if (!bc.request_completed[i]) {
+      os << "  Request " << i << ":\n";
+      os << "    Token start offset: " << bc.requestsInfo[i].token_start_offset
+         << std::endl;
+      os << "    Number of tokens in batch: "
+         << bc.requestsInfo[i].num_tokens_in_batch << std::endl;
+      os << "    GUID: " << bc.requestsInfo[i].request_guid << std::endl;
+      os << "    Max sequence length: "
+         << bc.requestsInfo[i].max_sequence_length << std::endl;
+      os << "    Request completed: " << bc.request_completed[i] << std::endl;
+      os << "    Request running: " << bc.request_running[i] << std::endl;
     }
   }
 
-  std::cout << "Per-token info:\n";
-  for (int i = 0; i < num_tokens; i++) {
-    std::cout << "  Token " << i << ":\n";
-    std::cout << "    Absolute depth in request: "
-              << tokensInfo[i].abs_depth_in_request << std::endl;
-    std::cout << "    Request index: " << tokensInfo[i].request_index
-              << std::endl;
-    std::cout << "    Token id: " << tokensInfo[i].token_id << std::endl;
+  // Per-token info
+  os << "Per-token info:\n";
+  for (int i = 0; i < bc.num_tokens; i++) {
+    os << "  Token " << i << ":\n";
+    os << "    Absolute depth in request: "
+       << bc.tokensInfo[i].abs_depth_in_request << std::endl;
+    os << "    Request index: " << bc.tokensInfo[i].request_index << std::endl;
+    os << "    Token id: " << bc.tokensInfo[i].token_id << std::endl;
+  }
+  os << "@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@" << std::endl;
+  return os;
+}
+
+void BatchConfig::print() const {
+  std::cout << *this << std::endl;
+}
+
+void BatchConfig::save_to_file(std::string const &filename) const {
+  std::ofstream outputFile(filename);
+  if (outputFile.is_open()) {
+    outputFile << *this << std::endl;
+    outputFile.close();
+  } else {
+    std::cerr << "Error: Unable to open the batch config output file: "
+              << filename << std::endl;
+    assert(false);
   }
-  std::cout << "@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@"
-            << std::endl;
 }
 
 }; // namespace FlexFlow
diff --git a/src/runtime/beam_search_batch_config.cc b/src/runtime/beam_search_batch_config.cc
index 634d60a352..811ef00ba2 100644
--- a/src/runtime/beam_search_batch_config.cc
+++ b/src/runtime/beam_search_batch_config.cc
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/batch_config.h"
+#include "flexflow/request_manager.h"
 #include "legion.h"
 #include <cassert>
 #include <climits>
@@ -101,72 +102,93 @@ int BeamSearchBatchConfig::current_depth_all_requests() const {
   return current_depth;
 }
 
-void BeamSearchBatchConfig::print() const {
-  std::cout << "@@@@@@@@@@@@@@ BeamSearchBatchConfig (mode " << get_mode()
-            << ") @@@@@@@@@@@@@@" << std::endl;
-  std::cout << "Max number of requests: " << max_requests_per_batch()
-            << std::endl;
-  std::cout << "Max number of tokens: " << max_tokens_per_batch() << std::endl;
-  std::cout << "Number of tokens: " << num_tokens << std::endl;
-  std::cout << "Number of requests: " << num_active_requests() << std::endl;
-  std::cout << "Beam width: " << beam_width << std::endl;
-  std::cout << "Target Iterations: " << target_iterations << std::endl;
-  std::cout << "Current Iterations: " << current_iteration << std::endl;
-
-  std::cout << "Per-request info:\n";
-  for (int i = 0; i < max_requests_per_batch(); i++) {
-    // assert(beamRequestsInfo[i].request_completed == request_completed[i]);
-    if (!request_completed[i]) {
-      std::cout << "  Request " << i << ":\n";
-      std::cout << "    Token start offset: "
-                << requestsInfo[i].token_start_offset << std::endl;
-      std::cout << "    Number of tokens in batch: "
-                << requestsInfo[i].num_tokens_in_batch << std::endl;
-      std::cout << "    GUID: " << requestsInfo[i].request_guid << std::endl;
-      std::cout << "    Max sequence length: "
-                << requestsInfo[i].max_sequence_length << std::endl;
-      std::cout << "    Beam Search Specific: " << std::endl;
-      std::cout << "        beam_size: " << beamRequestsInfo[i].beam_size
-                << std::endl;
-      std::cout << "        current_depth: "
-                << beamRequestsInfo[i].current_depth << std::endl;
-      std::cout << "        max_depth: " << beamRequestsInfo[i].max_depth
-                << std::endl;
-      std::cout << "        tokens: ";
-      for (int j = 0; j < MAX_BEAM_WIDTH; j++) {
-        std::cout << beamRequestsInfo[i].tokens[j] << ", ";
+std::ostream &operator<<(std::ostream &os, BeamSearchBatchConfig const &bc) {
+  os << "@@@@@@@@@@@@@@ BeamSearchBatchConfig (mode " << bc.get_mode()
+     << ") @@@@@@@@@@@@@@" << std::endl;
+  // Max values
+  os << "Max number of requests: " << bc.max_requests_per_batch() << std::endl;
+  os << "Max number of tokens: " << bc.max_tokens_per_batch() << std::endl;
+  os << "Max sequence length: " << bc.max_sequence_length() << std::endl;
+  // Current values
+  os << "Number of tokens: " << bc.num_active_tokens() << std::endl;
+  os << "Number of requests: " << bc.num_active_requests() << std::endl;
+  // BeamSearch-specific
+  os << "Model ID: " << bc.model_id << std::endl;
+  os << "Max Beam Depth (all requests): " << bc.max_beam_depth_all_requests()
+     << std::endl;
+  os << "Current depth (all requests): " << bc.current_depth_all_requests()
+     << std::endl;
+  os << "Beam width: " << bc.beam_width << std::endl;
+  os << "Target Iterations: " << bc.target_iterations << std::endl;
+  os << "Current Iterations: " << bc.current_iteration << std::endl;
+
+  os << "Per-request info:\n";
+  for (int i = 0; i < bc.max_requests_per_batch(); i++) {
+    if (!bc.request_completed[i]) {
+      os << "  Request " << i << ":\n";
+      os << "    Token start offset: " << bc.requestsInfo[i].token_start_offset
+         << std::endl;
+      os << "    Number of tokens in batch: "
+         << bc.requestsInfo[i].num_tokens_in_batch << std::endl;
+      os << "    GUID: " << bc.requestsInfo[i].request_guid << std::endl;
+      os << "    Max sequence length: "
+         << bc.requestsInfo[i].max_sequence_length << std::endl;
+      os << "    Request completed: " << bc.request_completed[i] << std::endl;
+      os << "    Request running: " << bc.request_running[i] << std::endl;
+      os << "    Beam Search Specific: " << std::endl;
+      os << "        beam_size: " << bc.beamRequestsInfo[i].beam_size
+         << std::endl;
+      os << "        current_depth: " << bc.beamRequestsInfo[i].current_depth
+         << std::endl;
+      os << "        max_depth: " << bc.beamRequestsInfo[i].max_depth
+         << std::endl;
+      os << "        tokens: ";
+      for (int j = 0; j < bc.MAX_BEAM_WIDTH; j++) {
+        os << bc.beamRequestsInfo[i].tokens[j] << ", ";
       }
-      std::cout << std::endl;
-      std::cout << "        probs: ";
-      for (int j = 0; j < MAX_BEAM_WIDTH; j++) {
-        std::cout << beamRequestsInfo[i].probs[j] << ", ";
+      os << std::endl;
+      os << "        probs: ";
+      for (int j = 0; j < bc.MAX_BEAM_WIDTH; j++) {
+        os << bc.beamRequestsInfo[i].probs[j] << ", ";
       }
-      std::cout << std::endl;
-      std::cout << "        parent_id: ";
-      for (int j = 0; j < MAX_BEAM_WIDTH; j++) {
-        std::cout << beamRequestsInfo[i].parent_id[j] << ", ";
+      os << std::endl;
+      os << "        parent_id: ";
+      for (int j = 0; j < bc.MAX_BEAM_WIDTH; j++) {
+        os << bc.beamRequestsInfo[i].parent_id[j] << ", ";
       }
-      std::cout << std::endl;
+      os << std::endl;
     }
   }
 
-  std::cout << "Per-token info:\n";
-  for (int i = 0; i < num_tokens; i++) {
-    std::cout << "  Token " << i << ":\n";
-    std::cout << "    Absolute depth in request: "
-              << tokensInfo[i].abs_depth_in_request << std::endl;
-    std::cout << "    Request index: " << tokensInfo[i].request_index
-              << std::endl;
-    std::cout << "    Token id: " << tokensInfo[i].token_id << std::endl;
-    std::cout << "    Beam Search Specific: " << std::endl;
-    std::cout << "        beam_size: " << beamTokenInfo[i].sub_request_index
-              << std::endl;
-    // std::cout << "    Parent token id: " << tokensInfo[i].parent_token_id <<
-    // std::endl; std::cout << "    Accumulated log prob: "
-    //           << tokensInfo[i].cum_log_prob << std::endl;
+  os << "Per-token info:\n";
+  for (int i = 0; i < bc.num_tokens; i++) {
+    os << "  Token " << i << ":\n";
+    os << "    Absolute depth in request: "
+       << bc.tokensInfo[i].abs_depth_in_request << std::endl;
+    os << "    Request index: " << bc.tokensInfo[i].request_index << std::endl;
+    os << "    Token id: " << bc.tokensInfo[i].token_id << std::endl;
+    os << "    Beam Search Specific: " << std::endl;
+    os << "        beam_size: " << bc.beamTokenInfo[i].sub_request_index
+       << std::endl;
+  }
+  os << "@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@" << std::endl;
+  return os;
+}
+
+void BeamSearchBatchConfig::print() const {
+  std::cout << *this << std::endl;
+}
+
+void BeamSearchBatchConfig::save_to_file(std::string const &filename) const {
+  std::ofstream outputFile(filename);
+  if (outputFile.is_open()) {
+    outputFile << *this << std::endl;
+    outputFile.close();
+  } else {
+    std::cerr << "Error: Unable to open the batch config output file: "
+              << filename << std::endl;
+    assert(false);
   }
-  std::cout << "@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@"
-            << std::endl;
 }
 
 }; // namespace FlexFlow
diff --git a/src/runtime/cuda_helper.cu b/src/runtime/cuda_helper.cu
index e4728bdb88..fa6bf55fe5 100644
--- a/src/runtime/cuda_helper.cu
+++ b/src/runtime/cuda_helper.cu
@@ -268,23 +268,106 @@ __host__ void print_beam_tensor(T const *ptr,
   checkCUDA(cudaFreeHost(host_ptr));
 }
 
-template <typename T>
+template <>
 __host__ void
-    save_tensor(T const *ptr, size_t num_elements, char const *file_name) {
+    save_tensor(float const *ptr, size_t num_elements, char const *file_name) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
-  T *host_ptr;
+  float *host_ptr;
   checkCUDA(cudaHostAlloc(&host_ptr,
-                          sizeof(T) * num_elements,
+                          sizeof(float) * num_elements,
                           cudaHostAllocPortable | cudaHostAllocMapped));
-  checkCUDA(cudaMemcpyAsync(
-      host_ptr, ptr, sizeof(T) * num_elements, cudaMemcpyDeviceToHost, stream));
-  // checkCUDA(cudaDeviceSynchronize());
-  cudaDeviceSynchronize();
+  checkCUDA(cudaMemcpyAsync(host_ptr,
+                            ptr,
+                            sizeof(float) * num_elements,
+                            cudaMemcpyDeviceToHost,
+                            stream));
+  checkCUDA(cudaDeviceSynchronize());
   FILE *tensor_file;
   tensor_file = fopen(file_name, "w");
+  assert(tensor_file != NULL);
   for (unsigned i = 0; i < num_elements; i++) {
-    fprintf(tensor_file, "%.20f, ", (float)host_ptr[i]);
+    fprintf(tensor_file, "%.9f, ", host_ptr[i]);
+  }
+
+  fclose(tensor_file);
+  checkCUDA(cudaFreeHost(host_ptr));
+}
+
+template <>
+__host__ void
+    save_tensor(half const *ptr, size_t num_elements, char const *file_name) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  half *host_ptr;
+  checkCUDA(cudaHostAlloc(&host_ptr,
+                          sizeof(half) * num_elements,
+                          cudaHostAllocPortable | cudaHostAllocMapped));
+  checkCUDA(cudaMemcpyAsync(host_ptr,
+                            ptr,
+                            sizeof(half) * num_elements,
+                            cudaMemcpyDeviceToHost,
+                            stream));
+  checkCUDA(cudaDeviceSynchronize());
+  FILE *tensor_file;
+  tensor_file = fopen(file_name, "w");
+  assert(tensor_file != NULL);
+  for (unsigned i = 0; i < num_elements; i++) {
+    fprintf(tensor_file, "%.9f, ", (float)host_ptr[i]);
+  }
+
+  fclose(tensor_file);
+  checkCUDA(cudaFreeHost(host_ptr));
+}
+
+template <>
+__host__ void save_tensor(int32_t const *ptr,
+                          size_t num_elements,
+                          char const *file_name) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  int32_t *host_ptr;
+  checkCUDA(cudaHostAlloc(&host_ptr,
+                          sizeof(int32_t) * num_elements,
+                          cudaHostAllocPortable | cudaHostAllocMapped));
+  checkCUDA(cudaMemcpyAsync(host_ptr,
+                            ptr,
+                            sizeof(int32_t) * num_elements,
+                            cudaMemcpyDeviceToHost,
+                            stream));
+  checkCUDA(cudaDeviceSynchronize());
+  FILE *tensor_file;
+  tensor_file = fopen(file_name, "w");
+  assert(tensor_file != NULL);
+  for (unsigned i = 0; i < num_elements; i++) {
+    fprintf(tensor_file, "%d, ", host_ptr[i]);
+  }
+
+  fclose(tensor_file);
+  checkCUDA(cudaFreeHost(host_ptr));
+}
+
+template <>
+__host__ void save_tensor(int64_t const *ptr,
+                          size_t num_elements,
+                          char const *file_name) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  int64_t *host_ptr;
+  checkCUDA(cudaHostAlloc(&host_ptr,
+                          sizeof(int64_t) * num_elements,
+                          cudaHostAllocPortable | cudaHostAllocMapped));
+  checkCUDA(cudaMemcpyAsync(host_ptr,
+                            ptr,
+                            sizeof(int64_t) * num_elements,
+                            cudaMemcpyDeviceToHost,
+                            stream));
+  checkCUDA(cudaDeviceSynchronize());
+  FILE *tensor_file;
+  tensor_file = fopen(file_name, "w");
+  assert(tensor_file != NULL);
+  for (unsigned i = 0; i < num_elements; i++) {
+    fprintf(tensor_file, "%ld, ", host_ptr[i]);
   }
 
   fclose(tensor_file);
@@ -608,6 +691,9 @@ template __host__ void print_beam_tensor<int64_t>(int64_t const *ptr,
 
 template __host__ void
     save_tensor<float>(float const *ptr, size_t rect, char const *file_name);
+template __host__ void save_tensor<int32_t>(int32_t const *ptr,
+                                            size_t rect,
+                                            char const *file_name);
 template __host__ void save_tensor<int64_t>(int64_t const *ptr,
                                             size_t rect,
                                             char const *file_name);
diff --git a/src/runtime/fftype.cc b/src/runtime/fftype.cc
index 2b94f07999..819e6527e5 100644
--- a/src/runtime/fftype.cc
+++ b/src/runtime/fftype.cc
@@ -6,21 +6,26 @@ namespace FlexFlow {
 
 const LayerID LayerID::NO_ID = LayerID();
 
-LayerID::LayerID() : id(0), transformer_layer_id(MAX_NUM_TRANSFORMER_LAYERS) {}
+LayerID::LayerID()
+    : id(0), transformer_layer_id(MAX_NUM_TRANSFORMER_LAYERS), model_id(0) {}
 
-LayerID::LayerID(size_t _id, size_t _transformer_layer_id)
-    : id(_id), transformer_layer_id(_transformer_layer_id) {
+LayerID::LayerID(size_t _id, size_t _transformer_layer_id, size_t _model_id)
+    : id(_id), transformer_layer_id(_transformer_layer_id),
+      model_id(_model_id) {
   assert(is_valid_id());
 }
 
 bool LayerID::is_valid_id() const {
-  return (id >= LAYER_GUID_FIRST_VALID && id <= LAYER_GUID_LAST_VALID);
+  return (id >= LAYER_GUID_FIRST_VALID && id <= LAYER_GUID_LAST_VALID &&
+          transformer_layer_id >= 0 &&
+          transformer_layer_id < MAX_NUM_TRANSFORMER_LAYERS && model_id >= 0);
 }
 
 bool operator==(LayerID const &lhs, LayerID const &rhs) {
   // id should be sufficient to distinguish different layers
   if (lhs.id == rhs.id) {
     assert(lhs.transformer_layer_id == rhs.transformer_layer_id);
+    assert(lhs.model_id == rhs.model_id);
   }
   return lhs.id == rhs.id;
 }
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index 408de57c54..6d33dd9f27 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -2291,6 +2291,7 @@ GraphOptimalViewSerialized
         Embedding *embed = (Embedding *)op;
         sez.serialize(embed->layer_guid.id);
         sez.serialize(embed->layer_guid.transformer_layer_id);
+        sez.serialize(embed->layer_guid.model_id);
         sez.serialize(embed->num_entries);
         sez.serialize(embed->out_channels);
         sez.serialize(embed->aggr);
@@ -2301,6 +2302,7 @@ GraphOptimalViewSerialized
         MultiHeadAttention *attn = (MultiHeadAttention *)op;
         sez.serialize(attn->layer_guid.id);
         sez.serialize(attn->layer_guid.transformer_layer_id);
+        sez.serialize(attn->layer_guid.model_id);
         sez.serialize(attn->oProjSize);
         sez.serialize(attn->num_heads);
         sez.serialize(attn->qProjSize);
@@ -2315,6 +2317,7 @@ GraphOptimalViewSerialized
         IncMultiHeadSelfAttention *attn = (IncMultiHeadSelfAttention *)op;
         sez.serialize(attn->layer_guid.id);
         sez.serialize(attn->layer_guid.transformer_layer_id);
+        sez.serialize(attn->layer_guid.model_id);
         sez.serialize(attn->oProjSize);
         sez.serialize(attn->num_q_heads);
         sez.serialize(attn->qProjSize);
@@ -2339,6 +2342,7 @@ GraphOptimalViewSerialized
             (SpecIncMultiHeadSelfAttention *)op;
         sez.serialize(attn->layer_guid.id);
         sez.serialize(attn->layer_guid.transformer_layer_id);
+        sez.serialize(attn->layer_guid.model_id);
         sez.serialize(attn->oProjSize);
         sez.serialize(attn->num_q_heads);
         sez.serialize(attn->qProjSize);
@@ -2360,6 +2364,7 @@ GraphOptimalViewSerialized
             (TreeIncMultiHeadSelfAttention *)op;
         sez.serialize(attn->layer_guid.id);
         sez.serialize(attn->layer_guid.transformer_layer_id);
+        sez.serialize(attn->layer_guid.model_id);
         sez.serialize(attn->oProjSize);
         sez.serialize(attn->num_q_heads);
         sez.serialize(attn->qProjSize);
@@ -2639,11 +2644,12 @@ void FFModel::deserialize_graph_optimal_view(
         assert(num_inputs == 1);
         AggrMode aggr;
         int num_entries, out_channels;
-        size_t id, transformer_layer_id;
+        size_t id, transformer_layer_id, deserialized_model_id;
         DataType data_type;
         dez.deserialize(id);
         dez.deserialize(transformer_layer_id);
-        LayerID layer_guid(id, transformer_layer_id);
+        dez.deserialize(deserialized_model_id);
+        LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
         dez.deserialize(num_entries);
         dez.deserialize(out_channels);
         dez.deserialize(aggr);
@@ -2727,10 +2733,11 @@ void FFModel::deserialize_graph_optimal_view(
         int embed_dim, num_heads, k_dim, v_dim;
         float dropout;
         bool bias, add_bias_kv, add_zero_attn;
-        size_t id, transformer_layer_id;
+        size_t id, transformer_layer_id, deserialized_model_id;
         dez.deserialize(id);
         dez.deserialize(transformer_layer_id);
-        LayerID layer_guid(id, transformer_layer_id);
+        dez.deserialize(deserialized_model_id);
+        LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
         dez.deserialize(embed_dim);
         dez.deserialize(num_heads);
         dez.deserialize(k_dim);
@@ -2762,10 +2769,11 @@ void FFModel::deserialize_graph_optimal_view(
         bool qkv_bias, final_bias, add_zero_attn, apply_rotary_embedding,
             scaling_query, qk_prod_scaling, offload, position_bias;
         DataType quantization_type;
-        size_t id, transformer_layer_id;
+        size_t id, transformer_layer_id, deserialized_model_id;
         dez.deserialize(id);
         dez.deserialize(transformer_layer_id);
-        LayerID layer_guid(id, transformer_layer_id);
+        dez.deserialize(deserialized_model_id);
+        LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
         dez.deserialize(embed_dim);
         dez.deserialize(num_q_heads);
         dez.deserialize(k_dim);
@@ -2812,10 +2820,11 @@ void FFModel::deserialize_graph_optimal_view(
         float dropout, scaling_factor;
         bool qkv_bias, final_bias, add_zero_attn, apply_rotary_embedding,
             scaling_query, qk_prod_scaling, position_bias;
-        size_t id, transformer_layer_id;
+        size_t id, transformer_layer_id, deserialized_model_id;
         dez.deserialize(id);
         dez.deserialize(transformer_layer_id);
-        LayerID layer_guid(id, transformer_layer_id);
+        dez.deserialize(deserialized_model_id);
+        LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
         dez.deserialize(embed_dim);
         dez.deserialize(num_q_heads);
         dez.deserialize(k_dim);
@@ -2859,10 +2868,11 @@ void FFModel::deserialize_graph_optimal_view(
         bool qkv_bias, final_bias, add_zero_attn, apply_rotary_embedding,
             scaling_query, qk_prod_scaling, offload, position_bias;
         DataType quantization_type;
-        size_t id, transformer_layer_id;
+        size_t id, transformer_layer_id, deserialized_model_id;
         dez.deserialize(id);
         dez.deserialize(transformer_layer_id);
-        LayerID layer_guid(id, transformer_layer_id);
+        dez.deserialize(deserialized_model_id);
+        LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
         dez.deserialize(embed_dim);
         dez.deserialize(num_q_heads);
         dez.deserialize(k_dim);
diff --git a/src/runtime/hip_helper.cpp b/src/runtime/hip_helper.cpp
index 1f27dc15e7..fb94135c8f 100644
--- a/src/runtime/hip_helper.cpp
+++ b/src/runtime/hip_helper.cpp
@@ -247,6 +247,112 @@ __host__ void
   checkCUDA(hipHostFree(host_ptr));
 }
 
+template <>
+__host__ void
+    save_tensor(float const *ptr, size_t num_elements, char const *file_name) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  float *host_ptr;
+  checkCUDA(hipHostMalloc(&host_ptr,
+                          sizeof(float) * num_elements,
+                          hipHostMallocPortable | hipHostMallocMapped));
+  checkCUDA(hipMemcpyAsync(host_ptr,
+                           ptr,
+                           sizeof(float) * num_elements,
+                           hipMemcpyDeviceToHost,
+                           stream));
+  checkCUDA(hipDeviceSynchronize());
+  FILE *tensor_file;
+  tensor_file = fopen(file_name, "w");
+  assert(tensor_file != NULL);
+  for (unsigned i = 0; i < num_elements; i++) {
+    fprintf(tensor_file, "%.9f, ", host_ptr[i]);
+  }
+
+  fclose(tensor_file);
+  checkCUDA(hipHostFree(host_ptr));
+}
+
+template <>
+__host__ void
+    save_tensor(half const *ptr, size_t num_elements, char const *file_name) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  half *host_ptr;
+  checkCUDA(hipHostMalloc(&host_ptr,
+                          sizeof(half) * num_elements,
+                          hipHostMallocPortable | hipHostMallocMapped));
+  checkCUDA(hipMemcpyAsync(host_ptr,
+                           ptr,
+                           sizeof(half) * num_elements,
+                           hipMemcpyDeviceToHost,
+                           stream));
+  checkCUDA(hipDeviceSynchronize());
+  FILE *tensor_file;
+  tensor_file = fopen(file_name, "w");
+  assert(tensor_file != NULL);
+  for (unsigned i = 0; i < num_elements; i++) {
+    fprintf(tensor_file, "%.9f, ", (float)host_ptr[i]);
+  }
+
+  fclose(tensor_file);
+  checkCUDA(hipHostFree(host_ptr));
+}
+
+template <>
+__host__ void save_tensor(int32_t const *ptr,
+                          size_t num_elements,
+                          char const *file_name) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  int32_t *host_ptr;
+  checkCUDA(hipHostMalloc(&host_ptr,
+                          sizeof(int32_t) * num_elements,
+                          hipHostMallocPortable | hipHostMallocMapped));
+  checkCUDA(hipMemcpyAsync(host_ptr,
+                           ptr,
+                           sizeof(int32_t) * num_elements,
+                           hipMemcpyDeviceToHost,
+                           stream));
+  checkCUDA(hipDeviceSynchronize());
+  FILE *tensor_file;
+  tensor_file = fopen(file_name, "w");
+  assert(tensor_file != NULL);
+  for (unsigned i = 0; i < num_elements; i++) {
+    fprintf(tensor_file, "%d, ", host_ptr[i]);
+  }
+
+  fclose(tensor_file);
+  checkCUDA(hipHostFree(host_ptr));
+}
+
+template <>
+__host__ void save_tensor(int64_t const *ptr,
+                          size_t num_elements,
+                          char const *file_name) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  int64_t *host_ptr;
+  checkCUDA(hipHostMalloc(&host_ptr,
+                          sizeof(int64_t) * num_elements,
+                          hipHostMallocPortable | hipHostMallocMapped));
+  checkCUDA(hipMemcpyAsync(host_ptr,
+                           ptr,
+                           sizeof(int64_t) * num_elements,
+                           hipMemcpyDeviceToHost,
+                           stream));
+  checkCUDA(hipDeviceSynchronize());
+  FILE *tensor_file;
+  tensor_file = fopen(file_name, "w");
+  assert(tensor_file != NULL);
+  for (unsigned i = 0; i < num_elements; i++) {
+    fprintf(tensor_file, "%ld, ", host_ptr[i]);
+  }
+
+  fclose(tensor_file);
+  checkCUDA(hipHostFree(host_ptr));
+}
+
 template <typename T>
 __host__ T *download_tensor(T const *ptr, size_t num_elements) {
   // device synchronize to make sure the data are ready
@@ -493,6 +599,17 @@ template __host__ void
 template __host__ void
     print_tensor<half>(half const *ptr, size_t rect, char const *prefix);
 
+template __host__ void
+    save_tensor<float>(float const *ptr, size_t rect, char const *file_name);
+template __host__ void save_tensor<int32_t>(int32_t const *ptr,
+                                            size_t rect,
+                                            char const *file_name);
+template __host__ void save_tensor<int64_t>(int64_t const *ptr,
+                                            size_t rect,
+                                            char const *file_name);
+template __host__ void
+    save_tensor<half>(half const *ptr, size_t rect, char const *file_name);
+
 template __host__ float *download_tensor<float>(float const *ptr,
                                                 size_t num_elements);
 template __host__ half *download_tensor<half>(half const *ptr,
diff --git a/src/runtime/layer.cc b/src/runtime/layer.cc
index d2473f4b2b..8f33f6db87 100644
--- a/src/runtime/layer.cc
+++ b/src/runtime/layer.cc
@@ -17,7 +17,8 @@ Layer::Layer(FFModel *model,
              const Tensor _input4)
     : op_type(_otype), data_type(_dtype),
       layer_guid(model->layer_global_guid++,
-                 model->current_transformer_layer_id),
+                 model->current_transformer_layer_id,
+                 model->model_id),
       numInputs(_numInputs), numWeights(_numWeights), numOutputs(_numOutputs) {
   std::string pcname;
   if (_name == nullptr) {
@@ -52,7 +53,8 @@ Layer::Layer(FFModel *model,
              Tensor const *_tensors)
     : op_type(_otype), data_type(_dtype),
       layer_guid(model->layer_global_guid++,
-                 model->current_transformer_layer_id),
+                 model->current_transformer_layer_id,
+                 model->model_id),
       numInputs(_numInputs), numWeights(_numWeights), numOutputs(_numOutputs) {
   std::string pcname;
   if (_name == nullptr) {
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 3fa201e7ab..92f0cff472 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -122,7 +122,8 @@ Op::Op(FFModel &model,
        const ParallelTensor _input4)
     : op_type(_otype), data_type(_dtype), op_guid(model.op_global_guid++),
       numInputs(_numInputs), numWeights(_numWeights), numOutputs(_numOutputs),
-      profiling(model.config.profiling) {
+      profiling(model.config.profiling),
+      inference_debugging(model.config.inference_debugging) {
   for (int i = 0; i < MAX_NUM_INPUTS; i++) {
     inputs[i] = NULL;
   }
@@ -167,7 +168,8 @@ Op::Op(FFModel &model,
        ParallelTensor const *_inputs)
     : op_type(_otype), data_type(_dtype), op_guid(model.op_global_guid++),
       numInputs(_numInputs), numWeights(_numWeights), numOutputs(_numOutputs),
-      profiling(model.config.profiling) {
+      profiling(model.config.profiling),
+      inference_debugging(model.config.inference_debugging) {
   std::string pcname;
   if (_name == NULL) {
     pcname = get_operator_type_name(op_type);
@@ -1462,7 +1464,8 @@ bool Op::get_weight_parameter(TNParameter tnp,
   return true;
 }
 
-OpMeta::OpMeta(FFHandler _handle) : handle(_handle), profiling(false) {
+OpMeta::OpMeta(FFHandler _handle)
+    : handle(_handle), profiling(false), inference_debugging(false) {
   for (int i = 0; i < MAX_NUM_INPUTS; i++) {
     trainableInputs[i] = true;
   }
@@ -1475,6 +1478,7 @@ OpMeta::OpMeta(FFHandler _handle) : handle(_handle), profiling(false) {
   for (int i = 0; i < MAX_NUM_OUTPUTS; i++) {
     output_type[i] = DT_NONE;
   }
+  decoding_step = 0;
 }
 
 OpMeta::OpMeta(FFHandler _handle, Op const *op) : OpMeta(_handle) {
@@ -1487,6 +1491,7 @@ OpMeta::OpMeta(FFHandler _handle, Op const *op) : OpMeta(_handle) {
   for (int i = 0; i < op->numOutputs; i++) {
     output_type[i] = op->outputs[i]->data_type;
   }
+  decoding_step = 0;
 }
 
 FFRuntime::FFRuntime(FFConfig &config) {
@@ -1530,6 +1535,8 @@ FFRuntime::FFRuntime(FFConfig &config) {
 
 FFRuntime *ffruntime_singleton = nullptr;
 
+int FFModel::model_counter = 0;
+
 FFModel::FFModel(FFConfig &_config, bool cpu_offload)
     : op_global_guid(OP_GUID_FIRST_VALID),
       layer_global_guid(LAYER_GUID_FIRST_VALID),
@@ -1570,6 +1577,7 @@ FFModel::FFModel(FFConfig &_config, bool cpu_offload)
   for (int idx = 0; idx < config.workersPerNode * config.numNodes; idx++) {
     handlers[idx] = ffruntime_singleton->handlers[idx];
   }
+  model_id = model_counter++;
 }
 
 void FFModel::clear_graph_search_cache() {
@@ -3969,6 +3977,7 @@ struct DefaultConfig {
   // const static int iterations = 1;
   const static int batchSize = 64;
   const static bool profiling = false;
+  const static bool inference_debugging = false;
   constexpr static float learningRate = 0.01f;
   constexpr static float weightDecay = 0.0001f;
   const static size_t workSpaceSize = (size_t)128 * 1024 * 1024; // 128 MB
@@ -4003,6 +4012,7 @@ FFConfig::FFConfig() {
   // iterations = DefaultConfig::iterations;
   batchSize = DefaultConfig::batchSize;
   profiling = DefaultConfig::profiling;
+  inference_debugging = DefaultConfig::inference_debugging;
   learningRate = DefaultConfig::learningRate;
   weightDecay = DefaultConfig::weightDecay;
   workSpaceSize = DefaultConfig::workSpaceSize;
@@ -4188,6 +4198,10 @@ void FFConfig::parse_args(char **argv, int argc) {
       profiling = true;
       continue;
     }
+    if (!strcmp(argv[i], "--inference-debugging")) {
+      inference_debugging = true;
+      continue;
+    }
     if (!strcmp(argv[i], "--allow-tensor-op-math-conversion")) {
       allow_tensor_op_math_conversion = true;
       continue;
diff --git a/src/runtime/operator.cc b/src/runtime/operator.cc
index 08b1af8ca5..0b3813f41c 100644
--- a/src/runtime/operator.cc
+++ b/src/runtime/operator.cc
@@ -3,6 +3,14 @@
 #include "flexflow/simulator.h"
 #include <stdexcept>
 
+#include <sys/stat.h>
+#include <sys/types.h>
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+#include "flexflow/utils/cuda_helper.h"
+#else
+#include "flexflow/utils/hip_helper.h"
+#endif
+
 namespace FlexFlow {
 
 size_t Op::get_untyped_params_hash() const {
@@ -17,4 +25,105 @@ size_t Op::get_params_hash() const {
       get_operator_type_name(this->op_type));
 }
 
+/*static*/
+void Op::save_inference_tensors_to_file(
+    OpMeta *m,
+    int shard_id,
+    BatchConfig const *bc,
+    std::vector<GenericTensorAccessorR> input_tensors,
+    std::vector<GenericTensorAccessorR> weight_tensors,
+    std::vector<GenericTensorAccessorW> output_tensors) {
+
+  // Check if output directory exists, and create it if it does not
+  char const *folder_path = "./inference_tensors";
+  struct stat st = {0};
+  if (stat(folder_path, &st) == -1) {
+    // Directory does not exist, create it
+    mkdir(folder_path, 0700);
+  }
+  // output base filepath, shared by all tensors from the same operator
+  std::string base_filepath =
+      "./inference_tensors/model_" + std::to_string(m->layer_guid.model_id) +
+      "_decoding-step_" + std::to_string(m->decoding_step) + "_layer-num_" +
+      std::to_string(m->layer_guid.transformer_layer_id) + "_layer-name_" +
+      m->op_name + "_shard-id_" + std::to_string(shard_id);
+  // save batch config, if passed
+  if (bc != nullptr) {
+    bc->save_to_file(base_filepath + "_batch-config");
+  }
+  // save all inputs
+  for (int i = 0; i < input_tensors.size(); i++) {
+    std::string filename = base_filepath + "_input_" + std::to_string(i);
+    if (input_tensors[i].data_type == DT_FLOAT) {
+      save_tensor(input_tensors[i].get_float_ptr(),
+                  input_tensors[i].domain.get_volume(),
+                  filename.c_str());
+    } else if (input_tensors[i].data_type == DT_HALF) {
+      save_tensor(input_tensors[i].get_half_ptr(),
+                  input_tensors[i].domain.get_volume(),
+                  filename.c_str());
+    } else if (input_tensors[i].data_type == DT_INT32) {
+      save_tensor(input_tensors[i].get_int32_ptr(),
+                  input_tensors[i].domain.get_volume(),
+                  filename.c_str());
+    } else if (input_tensors[i].data_type == DT_INT64) {
+      save_tensor(input_tensors[i].get_int64_ptr(),
+                  input_tensors[i].domain.get_volume(),
+                  filename.c_str());
+    } else {
+      assert(false && "Tensor data type not supported");
+    }
+  }
+  // only dump the weights once
+  if (m->decoding_step == 0) {
+    for (int i = 0; i < weight_tensors.size(); i++) {
+      std::string filename = base_filepath + "_weight_" + std::to_string(i);
+      if (weight_tensors[i].data_type == DT_FLOAT) {
+        save_tensor(weight_tensors[i].get_float_ptr(),
+                    weight_tensors[i].domain.get_volume(),
+                    filename.c_str());
+      } else if (weight_tensors[i].data_type == DT_HALF) {
+        save_tensor(weight_tensors[i].get_half_ptr(),
+                    weight_tensors[i].domain.get_volume(),
+                    filename.c_str());
+      } else if (weight_tensors[i].data_type == DT_INT32) {
+        save_tensor(weight_tensors[i].get_int32_ptr(),
+                    weight_tensors[i].domain.get_volume(),
+                    filename.c_str());
+      } else if (weight_tensors[i].data_type == DT_INT64) {
+        save_tensor(weight_tensors[i].get_int64_ptr(),
+                    weight_tensors[i].domain.get_volume(),
+                    filename.c_str());
+      } else {
+        assert(false && "Tensor data type not supported");
+      }
+    }
+  }
+  // save all outputs
+  for (int i = 0; i < output_tensors.size(); i++) {
+    std::string filename = base_filepath + "_output_" + std::to_string(i);
+    if (output_tensors[i].data_type == DT_FLOAT) {
+      save_tensor(output_tensors[i].get_float_ptr(),
+                  output_tensors[i].domain.get_volume(),
+                  filename.c_str());
+    } else if (output_tensors[i].data_type == DT_HALF) {
+      save_tensor(output_tensors[i].get_half_ptr(),
+                  output_tensors[i].domain.get_volume(),
+                  filename.c_str());
+    } else if (output_tensors[i].data_type == DT_INT32) {
+      save_tensor(output_tensors[i].get_int32_ptr(),
+                  output_tensors[i].domain.get_volume(),
+                  filename.c_str());
+    } else if (output_tensors[i].data_type == DT_INT64) {
+      save_tensor(output_tensors[i].get_int64_ptr(),
+                  output_tensors[i].domain.get_volume(),
+                  filename.c_str());
+    } else {
+      assert(false && "Tensor data type not supported");
+    }
+  }
+  // increase count of decoding steps
+  m->decoding_step++;
+}
+
 }; // namespace FlexFlow
\ No newline at end of file
diff --git a/src/runtime/tree_verify_batch_config.cc b/src/runtime/tree_verify_batch_config.cc
index 9efa06a2d5..cb68ecc5f1 100644
--- a/src/runtime/tree_verify_batch_config.cc
+++ b/src/runtime/tree_verify_batch_config.cc
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/batch_config.h"
+#include "flexflow/request_manager.h"
 #include "legion.h"
 #include <cassert>
 #include <climits>
@@ -30,55 +31,72 @@ InferenceMode TreeVerifyBatchConfig::get_mode() const {
   return TREE_VERIFY_MODE;
 }
 
-void TreeVerifyBatchConfig::print() const {
-  std::cout << "@@@@@@@@@@@@@@ TreeVerifyBatchConfig (mode " << get_mode()
-            << ") @@@@@@@@@@@@@@" << std::endl;
-  std::cout << "Max number of requests: " << max_requests_per_batch()
-            << std::endl;
-  std::cout << "Max number of tokens: " << max_tokens_per_batch() << std::endl;
-  std::cout << "Number of tokens: " << num_tokens << std::endl;
-  std::cout << "Number of requests: " << num_active_requests() << std::endl;
-  // std::cout << "Cached results: " << cached_results << std::endl;
+std::ostream &operator<<(std::ostream &os, TreeVerifyBatchConfig const &bc) {
+  os << "@@@@@@@@@@@@@@ TreeVerifyBatchConfig (mode " << bc.get_mode()
+     << ") @@@@@@@@@@@@@@" << std::endl;
+  // Max values
+  os << "Max number of requests: " << bc.max_requests_per_batch() << std::endl;
+  os << "Max number of tokens: " << bc.max_tokens_per_batch() << std::endl;
+  os << "Max sequence length: " << bc.max_sequence_length() << std::endl;
+  // Current values
+  os << "Number of tokens: " << bc.num_active_tokens() << std::endl;
+  os << "Number of requests: " << bc.num_active_requests() << std::endl;
+  os << "Number of tokens to commit: " << bc.num_tokens_to_commit << std::endl;
 
-  std::cout << "Per-request info:\n";
-  for (int i = 0; i < max_requests_per_batch(); i++) {
-    if (!request_completed[i]) {
-      std::cout << "  Request " << i << ":\n";
-      std::cout << "    Token start offset: "
-                << requestsInfo[i].token_start_offset << std::endl;
-      std::cout << "    Number of tokens in batch: "
-                << requestsInfo[i].num_tokens_in_batch << std::endl;
-      std::cout << "    GUID: " << requestsInfo[i].request_guid << std::endl;
-      std::cout << "    Max sequence length: "
-                << requestsInfo[i].max_sequence_length << std::endl;
-      std::cout << "    Request completed: " << request_completed[i]
-                << std::endl;
+  os << "Per-request info:\n";
+  for (int i = 0; i < bc.max_requests_per_batch(); i++) {
+    if (!bc.request_completed[i]) {
+      os << "  Request " << i << ":\n";
+      os << "    Token start offset: " << bc.requestsInfo[i].token_start_offset
+         << std::endl;
+      os << "    Number of tokens in batch: "
+         << bc.requestsInfo[i].num_tokens_in_batch << std::endl;
+      os << "    GUID: " << bc.requestsInfo[i].request_guid << std::endl;
+      os << "    Max sequence length: "
+         << bc.requestsInfo[i].max_sequence_length << std::endl;
+      os << "    Request completed: " << bc.request_completed[i] << std::endl;
+      os << "    Request running: " << bc.request_running[i] << std::endl;
     }
   }
 
-  std::cout << "Per-token info:\n";
-  for (int i = 0; i < num_tokens; i++) {
-    std::cout << "  Token " << i << ":\n";
-    std::cout << "    Absolute depth in request: "
-              << tokensInfo[i].abs_depth_in_request << std::endl;
-    std::cout << "    Request index: " << tokensInfo[i].request_index
-              << std::endl;
-    std::cout << "    Token id: " << tokensInfo[i].token_id << std::endl;
+  os << "Per-token info:\n";
+  for (int i = 0; i < bc.num_tokens; i++) {
+    os << "  Token " << i << ":\n";
+    os << "    Absolute depth in request: "
+       << bc.tokensInfo[i].abs_depth_in_request << std::endl;
+    os << "    Request index: " << bc.tokensInfo[i].request_index << std::endl;
+    os << "    Token id: " << bc.tokensInfo[i].token_id << std::endl;
   }
 
-  std::cout << "Tokens to commit info:\n";
-  for (int i = 0; i < num_tokens_to_commit; i++) {
-    std::cout << "  Token " << i << ":\n";
-    std::cout << "    token_index: " << committed_tokens[i].token_index
-              << std::endl;
-    std::cout << "    request_index: " << committed_tokens[i].request_index
-              << std::endl;
-    std::cout << "    token_depth: " << committed_tokens[i].token_depth
-              << std::endl;
+  os << "Tokens to commit info:\n";
+  for (int i = 0; i < bc.num_tokens_to_commit; i++) {
+    os << "  Token " << i << ":\n";
+    os << "    token_index: " << bc.committed_tokens[i].token_index
+       << std::endl;
+    os << "    request_index: " << bc.committed_tokens[i].request_index
+       << std::endl;
+    os << "    token_depth: " << bc.committed_tokens[i].token_depth
+       << std::endl;
   }
 
-  std::cout << "@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@"
-            << std::endl;
+  os << "@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@" << std::endl;
+  return os;
+}
+
+void TreeVerifyBatchConfig::print() const {
+  std::cout << *this << std::endl;
+}
+
+void TreeVerifyBatchConfig::save_to_file(std::string const &filename) const {
+  std::ofstream outputFile(filename);
+  if (outputFile.is_open()) {
+    outputFile << *this << std::endl;
+    outputFile.close();
+  } else {
+    std::cerr << "Error: Unable to open the batch config output file: "
+              << filename << std::endl;
+    assert(false);
+  }
 }
 
 }; // namespace FlexFlow
diff --git a/tests/inference/python_test_configs/generate_configs.py b/tests/inference/python_test_configs/generate_configs.py
index e683faa469..609e15de49 100644
--- a/tests/inference/python_test_configs/generate_configs.py
+++ b/tests/inference/python_test_configs/generate_configs.py
@@ -18,6 +18,7 @@
     "use_4bit_quantization": False,
     "use_8bit_quantization": False,
     "profiling": False,
+    "inference_debugging": False,
     "fusion": True,
 }
 llm_configs = {

From 5e34846c5904c11e2a8fd1d027c9a5aab43d0f92 Mon Sep 17 00:00:00 2001
From: Xinhao Cheng <99570243+xinhaoc@users.noreply.github.com>
Date: Mon, 9 Oct 2023 23:51:45 -0400
Subject: [PATCH 248/344] fix backward gelu, layernorm (#1187)

---
 src/ops/element_unary.cpp |  5 ++-
 src/ops/element_unary.cu  |  5 ++-
 src/ops/layer_norm.cpp    | 94 +++++++++++++++++++++++++++++++++++++++
 src/ops/layer_norm.cu     | 89 ++++++++++++++++++++++++++++++++++++
 4 files changed, 189 insertions(+), 4 deletions(-)

diff --git a/src/ops/element_unary.cpp b/src/ops/element_unary.cpp
index 424e739e13..e20200420f 100644
--- a/src/ops/element_unary.cpp
+++ b/src/ops/element_unary.cpp
@@ -192,8 +192,9 @@ __global__ void elewise_unary_backward_kernel(coord_t volume,
       case OP_GELU: {
         input_grad[i] =
             (T)(output_grad[i] *
-                (0.5 * static_cast<T>(erfc(-input[i] * M_SQRT1_2)) -
-                 0.5 * M_SQRT1_2 * input[i] * exp(-input[i] * input[i] * 0.5)));
+                (0.5 * static_cast<T>(erfc(-input[i] * M_SQRT1_2)) +
+                 0.5 * M_SQRT1_2 * input[i] *
+                     ((2 / sqrt(M_PI)) * exp(-input[i] * input[i] * 0.5))));
         break;
       }
       case OP_RSQRT: {
diff --git a/src/ops/element_unary.cu b/src/ops/element_unary.cu
index 4a38dabe52..c7f5e90f4c 100644
--- a/src/ops/element_unary.cu
+++ b/src/ops/element_unary.cu
@@ -205,8 +205,9 @@ __global__ void elewise_unary_backward_kernel(coord_t volume,
       case OP_GELU: {
         input_grad[i] =
             (T)(output_grad[i] *
-                (0.5 * static_cast<T>(erfc(-input[i] * M_SQRT1_2)) -
-                 0.5 * M_SQRT1_2 * input[i] * exp(-input[i] * input[i] * 0.5)));
+                (0.5 * static_cast<T>(erfc(-input[i] * M_SQRT1_2)) +
+                 0.5 * M_SQRT1_2 * input[i] *
+                     ((2 / sqrt(M_PI)) * exp(-input[i] * input[i] * 0.5))));
         break;
       }
       case OP_RSQRT: {
diff --git a/src/ops/layer_norm.cpp b/src/ops/layer_norm.cpp
index d97c2f62ff..07dbdb3dfb 100644
--- a/src/ops/layer_norm.cpp
+++ b/src/ops/layer_norm.cpp
@@ -364,6 +364,82 @@ __global__ void GammaBetaBackwardCUDAKernel(int64_t M,
   }
 }
 
+template <typename T>
+__device__ __inline__ void compute_gI(T const *__restrict__ dY,
+                                      T const *__restrict__ X,
+                                      T const *__restrict__ mean,
+                                      T const *__restrict__ rstd,
+                                      T const *__restrict__ gamma,
+                                      T *dX,
+                                      int const N,
+                                      T *buf) {
+  auto const i1 = blockIdx.x;
+  const T mean_val = mean[i1];
+  const T rstd_val = rstd[i1];
+  T stats_x1{0}, stats_x2{0};
+  constexpr int unroll = 4;
+  auto l = unroll * threadIdx.x;
+  T const *X_i = X + i1 * N;
+  T const *dY_i = dY + i1 * N;
+  T *dX_i = dX + i1 * N;
+  // vectorized reads don't improve perf, so use regular unrolling
+
+  for (; l + unroll - 1 < N; l += blockDim.x * unroll) {
+#pragma unroll
+    for (int k = 0; k < unroll; k++) {
+      T gamma_val = (gamma != nullptr) ? static_cast<T>(gamma[l + k]) : T(1);
+      const T c_h = static_cast<T>(X_i[l + k]);
+      const T c_loss = static_cast<T>(dY_i[l + k]);
+      stats_x1 += c_loss * gamma_val;
+      stats_x2 += c_loss * gamma_val * (c_h - mean_val) * rstd_val;
+    }
+  }
+  for (; l < N; l++) {
+    T gamma_val = (gamma != nullptr) ? static_cast<T>(gamma[l]) : T(1);
+    const T c_h = static_cast<T>(X_i[l]);
+    const T c_loss = static_cast<T>(dY_i[l]);
+    stats_x1 += c_loss * gamma_val;
+    stats_x2 += c_loss * gamma_val * (c_h - mean_val) * rstd_val;
+  }
+
+  stats_x1 = BlockReduceSum(stats_x1, buf);
+  stats_x2 = BlockReduceSum(stats_x2, buf);
+  if (threadIdx.x == 0) {
+    buf[0] = stats_x1;
+    buf[1] = stats_x2;
+  }
+  __syncthreads();
+  stats_x1 = buf[0];
+  stats_x2 = buf[1];
+  T fH = N;
+  T term1 = (T(1) / fH) * rstd_val;
+
+  for (int l = threadIdx.x; l < N; l += blockDim.x) {
+    const T x = X_i[l];
+    const T dy = dY_i[l];
+    T gamma_val = (gamma != nullptr) ? static_cast<T>(gamma[l]) : T(1);
+    T f_grad_input = fH * gamma_val * dy;
+    f_grad_input -= (x - mean_val) * rstd_val * stats_x2;
+    f_grad_input -= stats_x1;
+    f_grad_input *= term1;
+    dX_i[l] = f_grad_input;
+  }
+}
+
+template <typename T>
+__global__ void layer_norm_grad_input_kernel(T const *__restrict__ dY,
+                                             T const *__restrict__ X,
+                                             T const *__restrict__ mean,
+                                             T const *__restrict__ rstd,
+                                             T const *__restrict__ gamma,
+                                             T *dX,
+                                             int const N) {
+  alignas(sizeof(double)) extern __shared__ char s_data1[];
+  T *buf = reinterpret_cast<T *>(&s_data1);
+
+  compute_gI(dY, X, mean, rstd, gamma, dX, N, buf);
+}
+
 /*static*/
 template <typename T>
 void LayerNorm::backward_kernel(LayerNormMeta const *m,
@@ -401,6 +477,24 @@ void LayerNorm::backward_kernel(LayerNormMeta const *m,
                      static_cast<T *>(m->db_ptr),
                      static_cast<T *>(m->scale_ptr),
                      static_cast<T *>(m->bias_ptr));
+
+  int const warp_size = C10_WARP_SIZE;
+  int const num_threads = 128;
+  const dim3 blocks(M);
+  int nshared = (num_threads / warp_size) * sizeof(T);
+
+  hipLaunchKernelGGL(HIP_KERNEL_NAME(layer_norm_grad_input_kernel),
+                     blocks,
+                     num_threads,
+                     nshared,
+                     stream,
+                     output_grad_ptr,
+                     input_ptr,
+                     static_cast<T *>(m->mean_ptr),
+                     static_cast<T *>(m->rstd_ptr),
+                     gamma_ptr,
+                     input_grad_ptr,
+                     N);
   if (gamma_grad_ptr != NULL || beta_grad_ptr != NULL) {
     if (M < 512) {
       // For small batch size, do colwise reduce directly
diff --git a/src/ops/layer_norm.cu b/src/ops/layer_norm.cu
index 6d29071e38..44979c48fe 100644
--- a/src/ops/layer_norm.cu
+++ b/src/ops/layer_norm.cu
@@ -467,6 +467,82 @@ __global__ void GammaBetaBackwardCUDAKernel(int64_t M,
   }
 }
 
+template <typename T>
+__device__ __inline__ void compute_gI(T const *__restrict__ dY,
+                                      T const *__restrict__ X,
+                                      T const *__restrict__ mean,
+                                      T const *__restrict__ rstd,
+                                      T const *__restrict__ gamma,
+                                      T *dX,
+                                      int const N,
+                                      T *buf) {
+  auto const i1 = blockIdx.x;
+  const T mean_val = mean[i1];
+  const T rstd_val = rstd[i1];
+  T stats_x1{0}, stats_x2{0};
+  constexpr int unroll = 4;
+  auto l = unroll * threadIdx.x;
+  T const *X_i = X + i1 * N;
+  T const *dY_i = dY + i1 * N;
+  T *dX_i = dX + i1 * N;
+  // vectorized reads don't improve perf, so use regular unrolling
+
+  for (; l + unroll - 1 < N; l += blockDim.x * unroll) {
+#pragma unroll
+    for (int k = 0; k < unroll; k++) {
+      T gamma_val = (gamma != nullptr) ? static_cast<T>(gamma[l + k]) : T(1);
+      const T c_h = static_cast<T>(X_i[l + k]);
+      const T c_loss = static_cast<T>(dY_i[l + k]);
+      stats_x1 += c_loss * gamma_val;
+      stats_x2 += c_loss * gamma_val * (c_h - mean_val) * rstd_val;
+    }
+  }
+  for (; l < N; l++) {
+    T gamma_val = (gamma != nullptr) ? static_cast<T>(gamma[l]) : T(1);
+    const T c_h = static_cast<T>(X_i[l]);
+    const T c_loss = static_cast<T>(dY_i[l]);
+    stats_x1 += c_loss * gamma_val;
+    stats_x2 += c_loss * gamma_val * (c_h - mean_val) * rstd_val;
+  }
+
+  stats_x1 = BlockReduceSum(stats_x1, buf);
+  stats_x2 = BlockReduceSum(stats_x2, buf);
+  if (threadIdx.x == 0) {
+    buf[0] = stats_x1;
+    buf[1] = stats_x2;
+  }
+  __syncthreads();
+  stats_x1 = buf[0];
+  stats_x2 = buf[1];
+  T fH = N;
+  T term1 = (T(1) / fH) * rstd_val;
+
+  for (int l = threadIdx.x; l < N; l += blockDim.x) {
+    const T x = X_i[l];
+    const T dy = dY_i[l];
+    T gamma_val = (gamma != nullptr) ? static_cast<T>(gamma[l]) : T(1);
+    T f_grad_input = fH * gamma_val * dy;
+    f_grad_input -= (x - mean_val) * rstd_val * stats_x2;
+    f_grad_input -= stats_x1;
+    f_grad_input *= term1;
+    dX_i[l] = f_grad_input;
+  }
+}
+
+template <typename T>
+__global__ void layer_norm_grad_input_kernel(T const *__restrict__ dY,
+                                             T const *__restrict__ X,
+                                             T const *__restrict__ mean,
+                                             T const *__restrict__ rstd,
+                                             T const *__restrict__ gamma,
+                                             T *dX,
+                                             int const N) {
+  alignas(sizeof(double)) extern __shared__ char s_data1[];
+  T *buf = reinterpret_cast<T *>(&s_data1);
+
+  compute_gI(dY, X, mean, rstd, gamma, dX, N, buf);
+}
+
 /*static*/
 template <typename T>
 void LayerNorm::backward_kernel(LayerNormMeta const *m,
@@ -497,6 +573,19 @@ void LayerNorm::backward_kernel(LayerNormMeta const *m,
                                           static_cast<T *>(m->db_ptr),
                                           static_cast<T *>(m->scale_ptr),
                                           static_cast<T *>(m->bias_ptr));
+  int const warp_size = C10_WARP_SIZE;
+  int const num_threads = 128;
+  const dim3 blocks(M);
+  int nshared = (num_threads / warp_size) * sizeof(T);
+  layer_norm_grad_input_kernel<<<blocks, num_threads, nshared, stream>>>(
+      output_grad_ptr,
+      input_ptr,
+      static_cast<T *>(m->mean_ptr),
+      static_cast<T *>(m->rstd_ptr),
+      gamma_ptr,
+      input_grad_ptr,
+      N);
+
   if (gamma_grad_ptr != NULL || beta_grad_ptr != NULL) {
     if (M < 512) {
       // For small batch size, do colwise reduce directly

From 7b574630744fe3c8a80feb634f02e0395c43613d Mon Sep 17 00:00:00 2001
From: Xinhao Cheng <99570243+xinhaoc@users.noreply.github.com>
Date: Sat, 14 Oct 2023 17:52:48 -0400
Subject: [PATCH 249/344] Optimize attention kernel v2 1.0, use Gemm replace
 GemmStridedBatch (#1190)

* change layout

* main change

* fix

* change spec&tree kernel

* fix tp

* fix

* fix multi requests

* replicate key&value

* ci

* cleanup&hip

* more fix.

* ci
---
 .../ops/inc_multihead_self_attention.h        |   5 +-
 .../inc_multihead_self_attention_kernels.h    |   3 +
 inference/file_loader.cc                      |  59 ++-
 inference/models/falcon.cc                    |   4 +-
 python/flexflow/serve/models/falcon.py        |   8 -
 python/flexflow/serve/models/starcoder.py     |   8 -
 src/ops/inc_multihead_self_attention.cc       |  16 +-
 src/ops/inc_multihead_self_attention.cpp      | 439 ++++++-----------
 src/ops/inc_multihead_self_attention.cu       | 457 ++++++------------
 src/ops/spec_inc_multihead_self_attention.cc  |  14 +-
 src/ops/spec_inc_multihead_self_attention.cpp | 261 ++++------
 src/ops/spec_inc_multihead_self_attention.cu  | 264 ++++------
 src/ops/tree_inc_multihead_self_attention.cc  |  14 +-
 src/ops/tree_inc_multihead_self_attention.cpp | 280 ++++-------
 src/ops/tree_inc_multihead_self_attention.cu  | 280 ++++-------
 tests/inference/cpp_inference_tests.sh        |   4 +-
 tests/inference/python_inference_tests.sh     |   2 +-
 .../python_test_configs/generate_configs.py   |   5 +-
 18 files changed, 777 insertions(+), 1346 deletions(-)

diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index 51a3b9fbe1..5ff0942fff 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -176,7 +176,8 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
   size_t weights_params, weightSize, biasSize, reserveSpaceSize,
       quantized_weightSize;
   int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
-  int global_num_q_heads, global_num_kv_heads, num_q_heads, num_kv_heads;
+  int global_num_q_heads, global_num_kv_heads, num_q_heads, num_kv_heads,
+      hidden_size;
   bool *has_load_weights;
   bool *apply_rotary_embedding;
   bool *qkv_bias;
@@ -188,7 +189,7 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
   void *weight_ptr, *bias_ptr; // for weight offload
   void *devQKVProjArray, *keyCache, *valueCache;
   void *qk_prods, *qk_prods_softmax;
-  void *attn_heads, *W_out_contiguous;
+  void *attn_heads;
   char *quantized_weight_ptr;
   BatchConfig::PerTokenInfo *token_infos;
   DataType quantization_type;
diff --git a/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h b/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
index 4d2002d10b..763f654e28 100644
--- a/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
+++ b/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
@@ -1,6 +1,9 @@
 #ifndef _FLEXFLOW_OPS_KERNELS_INC_MULTIHEAD_SELF_ATTENTION_KERNELS_H
 #define _FLEXFLOW_OPS_KERNELS_INC_MULTIHEAD_SELF_ATTENTION_KERNELS_H
 
+#define QKV_WEIGHT_NUM 3
+#define KV_WEIGHT_NUM 2
+
 #include "flexflow/batch_config.h"
 #include "flexflow/device.h"
 #include "flexflow/fftype.h"
diff --git a/inference/file_loader.cc b/inference/file_loader.cc
index dc724319d2..7c6870d439 100644
--- a/inference/file_loader.cc
+++ b/inference/file_loader.cc
@@ -154,7 +154,11 @@ void load_attention_bias_v2(DT *ptr,
     std::string weight_filepath = join_path({weights_folder, filename});
 
     int n_heads = file_index == 0 ? num_heads : num_kv_heads;
+
+    int replicate_num = num_heads / num_kv_heads;
+
     size_t qkv_partial_size = qkv_inner_dim * n_heads;
+    size_t qkv_replicate_size = qkv_inner_dim * num_heads;
     size_t out_partial_size = hidden_dim;
     size_t partial_size =
         (file_index < 3) ? qkv_partial_size : out_partial_size;
@@ -178,13 +182,24 @@ void load_attention_bias_v2(DT *ptr,
 
     size_t data_index = 0;
 
-    for (int i = 0; i < partial_size; i++) {
-      ptr[idx + i] = host_array.at(data_index);
-      data_index++;
+    // q, o
+    if (file_index == 0 || file_index == 3) {
+      for (int i = 0; i < partial_size; i++) {
+        ptr[idx + i] = host_array.at(data_index);
+        data_index++;
+      }
+    } else {
+      // k, v
+      for (int i = 0; i < partial_size; i++) {
+        for (int j = 0; j < replicate_num; j++) {
+          ptr[idx + j * partial_size + i] = host_array.at(data_index);
+        }
+        data_index++;
+      }
     }
 
     file_index++;
-    idx += qkv_partial_size;
+    idx += qkv_replicate_size;
 
     in.close();
   }
@@ -220,9 +235,14 @@ void load_attention_weights_v2(DT *ptr,
   size_t k_size = single_proj_size * num_kv_heads,
          v_size = single_proj_size * num_kv_heads;
 
+  size_t k_replicate_size = one_weight_file_size;
+  size_t v_replicate_size = one_weight_file_size;
+
+  int replicate_num = num_heads / num_kv_heads;
+
   // stride for q, k, v, o
-  size_t stride_size =
-      (q_size + v_size + k_size + o_size) / tensor_parallelism_degree;
+  size_t stride_size = (q_size + v_replicate_size + k_replicate_size + o_size) /
+                       tensor_parallelism_degree;
   for (auto filename : weight_filenames) {
     std::cout << "Loading weight file " << filename << std::endl;
     std::string weight_filepath = join_path({weights_folder, filename});
@@ -231,7 +251,8 @@ void load_attention_weights_v2(DT *ptr,
     size_t partial_size = (file_index == 0 || file_index == 3)
                               ? one_weight_file_size
                               : single_proj_size * num_kv_heads;
-    size_t one_partition_size = partial_size / tensor_parallelism_degree;
+    size_t one_partition_size =
+        one_weight_file_size / tensor_parallelism_degree;
 
     std::ifstream in(weight_filepath, std::ios::in | std::ios::binary);
     if (!in.good()) {
@@ -252,16 +273,30 @@ void load_attention_weights_v2(DT *ptr,
       assert(false && "data size mismatch");
     }
     // wq, wk, wo
-    for (int i = 0; i < tensor_parallelism_degree; i++) {
-      for (int j = 0; j < one_partition_size; j++) {
-        ptr[base_index + i * stride_size + j] = host_array.at(data_index++);
+    if (file_index == 0) {
+      for (int i = 0; i < tensor_parallelism_degree; i++) {
+        for (int j = 0; j < one_partition_size; j++) {
+          ptr[base_index + i * stride_size + j] = host_array.at(data_index++);
+        }
+      }
+    } else {
+      for (int i = 0; i < num_heads; i++) {
+        int kv_idx = i / (num_heads / num_kv_heads);
+        int head_idx = i % (num_heads / tensor_parallelism_degree);
+        int tp_idx = (i / (num_heads / tensor_parallelism_degree));
+        for (int j = 0; j < single_proj_size; j++) {
+          ptr[base_index + tp_idx * stride_size + single_proj_size * head_idx +
+              j] = host_array.at(kv_idx * single_proj_size + j);
+        }
       }
     }
-    assert(data_index == partial_size);
+
+    // assert(data_index == partial_size);
     base_index += one_partition_size;
     file_index++;
   }
-  assert(base_index == (q_size + k_size + v_size) / tensor_parallelism_degree);
+  assert(base_index == (q_size + k_replicate_size + v_replicate_size) /
+                           tensor_parallelism_degree);
 
   {
     std::cout << "Loading weight file " << o_file << std::endl;
diff --git a/inference/models/falcon.cc b/inference/models/falcon.cc
index 553a2f0d3d..bfcec847b9 100644
--- a/inference/models/falcon.cc
+++ b/inference/models/falcon.cc
@@ -29,9 +29,7 @@ void FALCON::create_falcon_model(FFModel &ff,
   falcon_config.print();
 
   if (ff.config.tensor_parallelism_degree > falcon_config.n_head ||
-      falcon_config.n_head % ff.config.tensor_parallelism_degree != 0 ||
-      ff.config.tensor_parallelism_degree > falcon_config.n_head_kv ||
-      falcon_config.n_head_kv % ff.config.tensor_parallelism_degree != 0) {
+      falcon_config.n_head % ff.config.tensor_parallelism_degree != 0) {
     assert(false && "The number of attention heads is smaller, or it is not "
                     "divisible by the tensor parallelism degree");
   }
diff --git a/python/flexflow/serve/models/falcon.py b/python/flexflow/serve/models/falcon.py
index 9a1bca48c4..2b114f09b3 100644
--- a/python/flexflow/serve/models/falcon.py
+++ b/python/flexflow/serve/models/falcon.py
@@ -83,14 +83,6 @@ def __init__(
             raise ValueError(
                 f"Number of q attention heads ({self.falcon_config.n_head}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
             )
-        if (
-            self.falcon_config.n_head_kv < self.ffconfig.tensor_parallelism_degree
-            or self.falcon_config.n_head_kv % self.ffconfig.tensor_parallelism_degree
-            != 0
-        ):
-            raise ValueError(
-                f"Number of k/v attention heads ({self.falcon_config.n_head_kv}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
-            )
 
         self.build_model(max_tokens_per_batch)
 
diff --git a/python/flexflow/serve/models/starcoder.py b/python/flexflow/serve/models/starcoder.py
index 33b0b26ff8..f4f28a70e1 100644
--- a/python/flexflow/serve/models/starcoder.py
+++ b/python/flexflow/serve/models/starcoder.py
@@ -83,14 +83,6 @@ def __init__(
             raise ValueError(
                 f"Number of attention heads ({self.starcoder_config.num_attention_heads}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
             )
-        if (
-            self.starcoder_config.n_head_kv < self.ffconfig.tensor_parallelism_degree
-            or self.starcoder_config.n_head_kv % self.ffconfig.tensor_parallelism_degree
-            != 0
-        ):
-            raise ValueError(
-                f"Number of k/v attention heads ({self.starcoder_config.n_head_kv}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
-            )
 
         self.build_model(max_tokens_per_batch)
 
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index 2f72976d30..8a3e9c96b1 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -154,8 +154,10 @@ Tensor FFModel::inc_multiquery_self_attention(const Tensor input,
   int kParas = kProjSize * kSize;
   int vParas = vProjSize * vSize;
   int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
-  int weight_size = qParas * num_q_heads + kParas * num_kv_heads +
-                    vParas * num_kv_heads + oParas * num_q_heads;
+
+  // allocate num_q_heads for key, value for replication
+  int weight_size = qParas * num_q_heads + kParas * num_q_heads +
+                    vParas * num_q_heads + oParas * num_q_heads;
   int one_head_size = qParas + kParas + vParas + oParas;
 
   {
@@ -177,7 +179,7 @@ Tensor FFModel::inc_multiquery_self_attention(const Tensor input,
   if (qkv_bias || final_bias) {
     // q, k, v, o
     int qkv_bias_size =
-        qProjSize * num_q_heads + (kProjSize + vProjSize) * num_kv_heads;
+        qProjSize * num_q_heads + (kProjSize + vProjSize) * num_q_heads;
     int dims[1] = {(qkv_bias ? qkv_bias_size : 0) +
                    (final_bias ? oProjSize : 0)};
     li->weights[1] = create_weight_legion_ordering(1,
@@ -348,7 +350,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
     dims[1].size = this->num_q_heads * (qParas + oParas) +
-                   this->num_kv_heads * (kParas + vParas);
+                   this->num_q_heads * (kParas + vParas);
     dims[1].is_replica_dim = false;
 
     if (quantization_type != DT_NONE) {
@@ -367,7 +369,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     if (qkv_bias || final_bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
       int qkv_bias_size =
-          qProjSize * num_q_heads + (kProjSize + vProjSize) * num_kv_heads;
+          qProjSize * num_q_heads + (kProjSize + vProjSize) * num_q_heads;
       bias_shape.dims[0].size =
           (qkv_bias ? qkv_bias_size : 0) + (final_bias ? oProjSize : 0);
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
@@ -461,7 +463,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
     dims[1].size = this->num_q_heads * (qParas + oParas) +
-                   this->num_kv_heads * (kParas + vParas);
+                   this->num_q_heads * (kParas + vParas);
     dims[1].is_replica_dim = false;
     // dims[2].size = this->num_q_heads * (qParas + oParas) + this->num_kv_heads
     // * (kParas + vParas);
@@ -481,7 +483,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
     if (qkv_bias || final_bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
       int qkv_bias_size =
-          qProjSize * num_q_heads + (kProjSize + vProjSize) * num_kv_heads;
+          qProjSize * num_q_heads + (kProjSize + vProjSize) * num_q_heads;
       bias_shape.dims[0].size =
           (qkv_bias ? qkv_bias_size : 0) + (final_bias ? oProjSize : 0);
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
diff --git a/src/ops/inc_multihead_self_attention.cpp b/src/ops/inc_multihead_self_attention.cpp
index f09d905dd3..562898a220 100644
--- a/src/ops/inc_multihead_self_attention.cpp
+++ b/src/ops/inc_multihead_self_attention.cpp
@@ -76,51 +76,31 @@ __global__ void apply_proj_bias_qkv(DT *input_ptr,
                                     int kProjSize,
                                     int vProjSize,
                                     int global_num_q_heads,
-                                    int global_num_kv_heads,
                                     int num_q_heads,
-                                    int num_kv_heads,
                                     bool scaling_query,
-                                    float scaling_factor) {
-  CUDA_KERNEL_LOOP(i,
-                   num_tokens *
-                       (qProjSize * num_q_heads + kProjSize * num_kv_heads +
-                        vProjSize * num_kv_heads)) {
+                                    float scaling_factor,
+                                    int hidden_size) {
+  CUDA_KERNEL_LOOP(i, num_tokens * hidden_size * QKV_WEIGHT_NUM) {
     // for simplicity, assume q, k, v is in same shape
     // 0->q, 1->k, 2->v
     // int qkv_index = i / (num_tokens * qProjSize) % 3;
 
-    int qkv_index = i < num_tokens * qProjSize * num_q_heads
-                        ? 0
-                        : (i < num_tokens * (qProjSize * num_q_heads +
-                                             kProjSize * num_kv_heads)
-                               ? 1
-                               : 2);
-
-    int q_block_size = qProjSize * num_tokens * num_q_heads;
-    int k_block_size = kProjSize * num_tokens * num_kv_heads;
-
-    int bias_idx = 0;
-    if (qkv_index == 0) {
-      int head_idx = i / (num_tokens * qProjSize);
-      int global_head_idx = head_idx + shard_id * num_q_heads;
-      int global_i = i + shard_id * num_q_heads * num_tokens * qProjSize;
-      bias_idx = global_head_idx * qProjSize +
-                 (global_i % (num_tokens * (qProjSize)) % qProjSize);
-    } else {
+    int token_idx = i / (hidden_size * QKV_WEIGHT_NUM);
+    size_t in_token_idx = i - token_idx * hidden_size * 3;
+    int qkv_index = in_token_idx / hidden_size;
+    int proj_size = qkv_index == 0 ? qProjSize : kProjSize;
 
-      int idx =
-          qkv_index == 1 ? i - q_block_size : i - q_block_size - k_block_size;
-      int pre_length = qkv_index == 1 ? qProjSize * global_num_q_heads
-                                      : qProjSize * global_num_q_heads +
-                                            kProjSize * global_num_kv_heads;
+    int head_idx =
+        (in_token_idx - qkv_index * num_q_heads * proj_size) / proj_size;
+    int global_head_idx = head_idx + shard_id * num_q_heads;
 
-      int head_idx = idx / (num_tokens * kProjSize);
-      int global_head_idx = head_idx + shard_id * num_kv_heads;
-      int global_idx = idx + shard_id * num_tokens * num_kv_heads * kProjSize;
+    size_t pre_length =
+        qkv_index == 0
+            ? 0
+            : (qkv_index == 1 ? qProjSize * global_num_q_heads
+                              : qProjSize * global_num_q_heads * KV_WEIGHT_NUM);
 
-      bias_idx = pre_length + global_head_idx * kProjSize +
-                 (global_idx % (num_tokens * (qProjSize)) % qProjSize);
-    }
+    size_t bias_idx = pre_length + global_head_idx * proj_size + i % proj_size;
 
     input_ptr[i] += bias_ptr[bias_idx];
 
@@ -134,9 +114,12 @@ __global__ void scaling_query_kernel(DT *input_ptr,
                                      int qProjSize,
                                      int num_tokens,
                                      int num_q_heads,
-                                     float scaling_factor) {
-  CUDA_KERNEL_LOOP(i, num_tokens * (qProjSize * num_q_heads)) {
-    input_ptr[i] *= scaling_factor;
+                                     float scaling_factor,
+                                     int hidden_size) {
+  CUDA_KERNEL_LOOP(i, num_tokens * hidden_size) {
+    int token_idx = i / hidden_size;
+    input_ptr[i % hidden_size + token_idx * hidden_size * QKV_WEIGHT_NUM] *=
+        scaling_factor;
   }
 }
 
@@ -192,28 +175,22 @@ __global__ void
                               BatchConfig::PerTokenInfo const *tokenInfos,
                               int qProjSize,
                               int kProjSize,
-                              int num_q_heads,
                               int num_tokens,
-                              int num_kv_heads,
-                              int q_block_size,
-                              int k_block_size,
-                              int q_array_size) {
-  CUDA_KERNEL_LOOP(
-      i,
-      num_tokens * (qProjSize * num_q_heads + kProjSize * num_kv_heads) / 2) {
+                              size_t q_array_size,
+                              int hidden_size) {
+  CUDA_KERNEL_LOOP(i, num_tokens * hidden_size) {
     // create complex number
     bool q_tensor = i < (q_array_size / 2);
     int proj_size = q_tensor ? qProjSize : kProjSize;
     int real_i = q_tensor ? i : i - q_array_size / 2;
 
-    int head_idx = real_i / (num_tokens * proj_size / 2);
-    int idx = real_i % (num_tokens * proj_size / 2);
-    int token_idx =
-        (real_i - head_idx * (num_tokens * proj_size / 2)) / (proj_size / 2);
+    int token_idx = real_i / (hidden_size / 2);
+    int idx = real_i % (proj_size / 2);
+    int head_idx = (real_i - (token_idx * (hidden_size / 2))) / (proj_size / 2);
 
-    int real_part_index = idx + token_idx * (proj_size / 2) +
-                          head_idx * (q_tensor ? q_block_size : k_block_size) +
-                          (q_tensor ? 0 : q_array_size);
+    int real_part_index = idx + head_idx * proj_size +
+                          token_idx * hidden_size * 3 +
+                          hidden_size * (q_tensor ? 0 : 1);
     int complex_part_index = real_part_index + (proj_size / 2);
 
     complex_input[i] = {input_ptr[real_part_index],
@@ -244,35 +221,24 @@ __global__ void store_kv_cache(DT const *devQKVProjArray,
                                DT *kCache_ptr,
                                DT *vCache_ptr,
                                BatchConfig::PerTokenInfo const *tokenInfos,
-                               int qProjSize,
-                               int kProjSize,
-                               int vProjSize,
                                int num_tokens,
-                               int num_q_heads,
-                               int num_kv_heads,
-                               int max_seq_len) {
-  CUDA_KERNEL_LOOP(i, num_tokens * (kProjSize + vProjSize) * num_kv_heads) {
-    int q_array_size = qProjSize * num_tokens * num_q_heads;
-    int k_array_size = kProjSize * num_tokens * num_kv_heads;
-
-    bool k_cache = i < k_array_size;
-    int real_i = k_cache ? i : i - k_array_size;
-
-    int proj_size = k_cache ? kProjSize : vProjSize;
-    int head_idx = real_i / (num_tokens * proj_size);
-    int token_idx = (real_i - head_idx * (num_tokens * proj_size)) / proj_size;
-    int data_idx = real_i % proj_size;
-
-    DT val = devQKVProjArray[q_array_size + (k_cache ? 0 : k_array_size) +
-                             head_idx * proj_size * num_tokens +
-                             token_idx * proj_size + data_idx];
+                               int max_seq_len,
+                               int hidden_size) {
+  CUDA_KERNEL_LOOP(i, num_tokens * hidden_size) {
+    int token_idx = i / hidden_size;
+    int offset = i % hidden_size;
+    size_t val_idx = token_idx * 3 * hidden_size + hidden_size + offset;
+    DT kVal = devQKVProjArray[val_idx];
+    DT vVal = devQKVProjArray[val_idx + hidden_size];
+
     int const req_id = tokenInfos[token_idx].request_index;
     int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
 
-    DT *cache_ptr = k_cache ? kCache_ptr : vCache_ptr;
-    cache_ptr[req_id * (num_kv_heads * max_seq_len * proj_size) +
-              head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
-              data_idx] = val;
+    // key cache
+    kCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
+               offset] = kVal;
+    vCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
+               offset] = vVal;
   }
 }
 
@@ -301,52 +267,39 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
   // Weights: qSize x qProjSize x 3 x num_q_heads
   // Input: qSize x num_tokens
   // Output >>> qProjSize x num_tokens x 3 x num_q_heads
-  int m_q = m->qProjSize;
-  int m_k = m->kProjSize;
-  int m_v = m->vProjSize;
+  int m_q = m->qProjSize * m->num_q_heads;
+  int m_k = m->kProjSize * m->num_q_heads;
+  int m_v = m->vProjSize * m->num_q_heads;
   assert(m_q == m_k && m_k == m_v); // keep things simple for now
   int n = bc->num_active_tokens();
   int k = m->qSize;
-  int m_ = m_q;
-  int lda = k, ldb = k, ldc = m_q;
-
-  size_t strideA = m_q * k; // query weight head size
-  size_t strideB = 0;       // input stays the same for all heads.
-  size_t strideC = m_q * n; // size of the output block for each head.
-
-  // compute QKV
-  checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
-                                        HIPBLAS_OP_T,
-                                        HIPBLAS_OP_N,
-                                        m_,
-                                        n,
-                                        k,
-                                        &alpha,
-                                        weight_ptr,
-                                        hipblas_data_type,
-                                        lda,
-                                        strideA,
-                                        input_ptr,
-                                        hipblas_data_type,
-                                        ldb,
-                                        strideB,
-                                        &beta,
-                                        output_ptr,
-                                        hipblas_data_type,
-                                        ldc,
-                                        strideC,
-                                        m->num_q_heads + m->num_kv_heads +
-                                            m->num_kv_heads,
-                                        compute_type,
-                                        HIPBLAS_GEMM_DEFAULT));
+  int m_ = m_q * QKV_WEIGHT_NUM;
+  int lda = k, ldb = k, ldc = m_;
+  checkCUDA(hipblasGemmEx(m->handle.blas,
+                          HIPBLAS_OP_T,
+                          HIPBLAS_OP_N,
+                          m_,
+                          n,
+                          k,
+                          &alpha,
+                          weight_ptr,
+                          hipblas_data_type,
+                          lda,
+                          input_ptr,
+                          hipblas_data_type,
+                          ldb,
+                          &beta,
+                          output_ptr,
+                          hipblas_data_type,
+                          ldc,
+                          compute_type,
+                          HIPBLAS_GEMM_DEFAULT));
 
   // apply rotary emmmbedding for q and k
   // step1 change the k, v to complex tensor
   int num_tokens = bc->num_active_tokens();
   int parallelism = m->kProjSize * num_tokens * m->num_q_heads;
-  int q_block_size = m->qProjSize * num_tokens;
-  int k_block_size = m->kProjSize * num_tokens;
-  int q_array_size = m->qProjSize * num_tokens * m->num_q_heads;
+  size_t q_array_size = m->qProjSize * num_tokens * m->num_q_heads;
   // apply bias for q, k, v
   if (*m->qkv_bias) {
     hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_proj_bias_qkv<DT>),
@@ -362,11 +315,10 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                        m->kProjSize,
                        m->vProjSize,
                        m->global_num_q_heads,
-                       m->global_num_kv_heads,
                        m->num_q_heads,
-                       m->num_kv_heads,
                        *m->scaling_query,
-                       m->scaling_factor);
+                       m->scaling_factor,
+                       m->hidden_size);
   } else if (m->scaling_query) {
     hipLaunchKernelGGL(HIP_KERNEL_NAME(scaling_query_kernel<DT>),
                        GET_BLOCKS(parallelism),
@@ -377,13 +329,12 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                        num_tokens,
                        m->num_q_heads,
                        m->qProjSize,
-                       m->scaling_factor);
+                       m->scaling_factor,
+                       m->hidden_size);
   }
   if (*m->apply_rotary_embedding) {
     /*q&k*/
-    parallelism =
-        num_tokens *
-        (m->qProjSize * m->num_q_heads + m->kProjSize * m->num_kv_heads) / 2;
+    parallelism = num_tokens * m->hidden_size;
     hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_rotary_embedding_hf<DT>),
                        GET_BLOCKS(parallelism),
                        min(CUDA_NUM_THREADS, parallelism),
@@ -394,12 +345,9 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                        m->token_infos,
                        m->qProjSize,
                        m->kProjSize,
-                       m->num_q_heads,
                        num_tokens,
-                       m->num_kv_heads,
-                       q_block_size,
-                       k_block_size,
-                       q_array_size);
+                       q_array_size,
+                       m->hidden_size);
   }
 }
 
@@ -409,8 +357,7 @@ void update_kv_cache_kernel(IncMultiHeadSelfAttentionMeta const *m,
                             hipStream_t stream) {
   int num_tokens = bc->num_active_tokens();
   if (num_tokens > 0) {
-    int parallelism =
-        (m->kProjSize + m->vProjSize) * num_tokens * m->num_kv_heads;
+    int parallelism = m->hidden_size * num_tokens;
     hipLaunchKernelGGL(HIP_KERNEL_NAME(store_kv_cache<DT>),
                        GET_BLOCKS(parallelism),
                        min(CUDA_NUM_THREADS, parallelism),
@@ -420,13 +367,9 @@ void update_kv_cache_kernel(IncMultiHeadSelfAttentionMeta const *m,
                        static_cast<DT *>(m->keyCache),
                        static_cast<DT *>(m->valueCache),
                        m->token_infos,
-                       m->qProjSize,
-                       m->kProjSize,
-                       m->vProjSize,
                        num_tokens,
-                       m->num_q_heads,
-                       m->num_kv_heads,
-                       BatchConfig::max_sequence_length());
+                       BatchConfig::max_sequence_length(),
+                       m->hidden_size);
   }
 }
 
@@ -575,11 +518,13 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
   // int num_requests = bc->num_active_requests();
   int num_tokens = bc->num_active_tokens();
   int tokens_previous_requests = 0;
-  int q_block_size = m->qProjSize * num_tokens;
-  int kt_block_size = m->kProjSize * BatchConfig::max_sequence_length();
-  int kt_req_block_size = kt_block_size * m->num_kv_heads;
-  int vt_block_size = m->vProjSize * BatchConfig::max_sequence_length();
-  int vt_req_block_size = vt_block_size * m->num_kv_heads;
+  int q_block_size = m->qProjSize;
+  int kt_block_size = m->kProjSize;
+  int kt_req_block_size =
+      kt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+  int vt_block_size = m->vProjSize;
+  int vt_req_block_size =
+      vt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
@@ -595,7 +540,8 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     int m_ = num_new_tokens;
     int n = total_tokens;
     int k = m->qProjSize;
-    int lda = k, ldb = k, ldc = m_;
+    int lda = k * m->num_q_heads * QKV_WEIGHT_NUM, ldb = k * m->num_q_heads,
+        ldc = m_;
     int strideA = q_block_size;
     int strideB = kt_block_size;
     int strideC = num_new_tokens * total_tokens;
@@ -605,72 +551,37 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     }
     // To get A, skip over Q entries from previous requests (same head)
     DT const *A = static_cast<DT *>(m->devQKVProjArray) +
-                  tokens_previous_requests * m->qProjSize;
+                  tokens_previous_requests * m->qProjSize * m->num_q_heads *
+                      QKV_WEIGHT_NUM;
     // To get B, skip over K entries from previous requests (all heads +
     // padding)
     DT const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
     // To get C, skip over QK^T products from previous requests
     DT *C = static_cast<DT *>(m->qk_prods);
-    if (m->num_kv_heads == m->num_q_heads) {
-      checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
-                                            HIPBLAS_OP_T,
-                                            HIPBLAS_OP_N,
-                                            m_,
-                                            n,
-                                            k,
-                                            &alpha,
-                                            A,
-                                            hipblas_data_type,
-                                            lda,
-                                            strideA,
-                                            B,
-                                            hipblas_data_type,
-                                            ldb,
-                                            strideB,
-                                            &beta,
-                                            C,
-                                            hipblas_data_type,
-                                            ldc,
-                                            strideC,
-                                            m->num_q_heads,
-                                            compute_type,
-                                            HIPBLAS_GEMM_DEFAULT));
+    checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
+                                          HIPBLAS_OP_T,
+                                          HIPBLAS_OP_N,
+                                          m_,
+                                          n,
+                                          k,
+                                          &alpha,
+                                          A,
+                                          hipblas_data_type,
+                                          lda,
+                                          strideA,
+                                          B,
+                                          hipblas_data_type,
+                                          ldb,
+                                          strideB,
+                                          &beta,
+                                          C,
+                                          hipblas_data_type,
+                                          ldc,
+                                          strideC,
+                                          m->num_q_heads,
+                                          compute_type,
+                                          HIPBLAS_GEMM_DEFAULT));
 
-    } else {
-      strideB = 0;
-      // use hipblasGemmStridedBatchedEx
-      int one_step_heads = m->num_q_heads / m->num_kv_heads;
-      m_ = num_new_tokens;
-      n = total_tokens;
-      k = m->qProjSize;
-      lda = k, ldb = k, ldc = m_;
-      for (int step = 0; step < m->num_kv_heads; step++) {
-        checkCUDA(
-            hipblasGemmStridedBatchedEx(m->handle.blas,
-                                        HIPBLAS_OP_T,
-                                        HIPBLAS_OP_N,
-                                        m_,
-                                        n,
-                                        k,
-                                        &alpha,
-                                        A + step * strideA * one_step_heads,
-                                        hipblas_data_type,
-                                        lda,
-                                        strideA,
-                                        B + step * kt_block_size,
-                                        hipblas_data_type,
-                                        ldb,
-                                        strideB,
-                                        &beta,
-                                        C + step * strideC * one_step_heads,
-                                        hipblas_data_type,
-                                        ldc,
-                                        strideC,
-                                        one_step_heads,
-                                        compute_type,
-                                        HIPBLAS_GEMM_DEFAULT));
-      }
-    }
     // add alibi position bias to qk production
     if (*m->position_bias) {
       size_t parallelism = m->num_q_heads * total_tokens * num_new_tokens;
@@ -740,7 +651,7 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     m_ = num_new_tokens;
     n = m->vProjSize;
     k = total_tokens;
-    lda = m_, ldb = n, ldc = m_;
+    lda = m_, ldb = n * m->num_q_heads, ldc = m_;
     strideA = num_new_tokens * total_tokens;
     strideB = vt_block_size;
     strideC = num_new_tokens * m->vProjSize;
@@ -755,64 +666,29 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     C = static_cast<DT *>(m->attn_heads) +
         tokens_previous_requests * m->num_q_heads * m->vProjSize;
 
-    if (m->num_q_heads == m->num_kv_heads) {
-      checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
-                                            HIPBLAS_OP_N,
-                                            HIPBLAS_OP_T,
-                                            m_,
-                                            n,
-                                            k,
-                                            &alpha,
-                                            A,
-                                            hipblas_data_type,
-                                            lda,
-                                            strideA,
-                                            B,
-                                            hipblas_data_type,
-                                            ldb,
-                                            strideB,
-                                            &beta,
-                                            C,
-                                            hipblas_data_type,
-                                            ldc,
-                                            strideC,
-                                            m->num_q_heads,
-                                            compute_type,
-                                            HIPBLAS_GEMM_DEFAULT));
-    } else {
-      int one_step_heads = m->num_q_heads / m->num_kv_heads;
-      n = m->vProjSize;
-      lda = m_, ldb = n, ldc = m_;
-      strideA = num_new_tokens * total_tokens;
-      strideB = 0;
-      strideC = num_new_tokens * m->vProjSize;
-      for (int step = 0; step < m->num_kv_heads; step++) {
-        checkCUDA(
-            hipblasGemmStridedBatchedEx(m->handle.blas,
-                                        HIPBLAS_OP_N,
-                                        HIPBLAS_OP_T,
-                                        m_,
-                                        n,
-                                        k,
-                                        &alpha,
-                                        A + step * one_step_heads * strideA,
-                                        hipblas_data_type,
-                                        lda,
-                                        strideA,
-                                        B + step * vt_block_size,
-                                        hipblas_data_type,
-                                        ldb,
-                                        strideB,
-                                        &beta,
-                                        C + step * one_step_heads * strideC,
-                                        hipblas_data_type,
-                                        ldc,
-                                        strideC,
-                                        one_step_heads,
-                                        compute_type,
-                                        HIPBLAS_GEMM_DEFAULT));
-      }
-    }
+    checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
+                                          HIPBLAS_OP_N,
+                                          HIPBLAS_OP_T,
+                                          m_,
+                                          n,
+                                          k,
+                                          &alpha,
+                                          A,
+                                          hipblas_data_type,
+                                          lda,
+                                          strideA,
+                                          B,
+                                          hipblas_data_type,
+                                          ldb,
+                                          strideB,
+                                          &beta,
+                                          C,
+                                          hipblas_data_type,
+                                          ldc,
+                                          strideC,
+                                          m->num_q_heads,
+                                          compute_type,
+                                          HIPBLAS_GEMM_DEFAULT));
     // Project to output, save result directly on output tensor
     alpha = 1.0f, beta = 0.0f;
     m_ = m->oProjSize;
@@ -820,8 +696,8 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     n = num_new_tokens;
     lda = k, ldb = n, ldc = m_;
     A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
-                                 m->kProjSize * m->num_kv_heads +
-                                 m->vProjSize * m->num_kv_heads);
+                                 m->kProjSize * m->num_q_heads +
+                                 m->vProjSize * m->num_q_heads);
     B = C;
     C = static_cast<DT *>(output_ptr) + tokens_previous_requests * m->oProjSize;
 
@@ -850,8 +726,8 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
   if (*m->final_bias && shard_id == 0) {
     int parallelism = m->oProjSize * num_tokens;
     int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
-                          m->kProjSize * m->global_num_kv_heads +
-                          m->vProjSize * m->global_num_kv_heads;
+                          m->kProjSize * m->global_num_q_heads +
+                          m->vProjSize * m->global_num_q_heads;
     hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_proj_bias_w<DT>),
                        GET_BLOCKS(parallelism),
                        min(CUDA_NUM_THREADS, parallelism),
@@ -1028,11 +904,12 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   global_num_kv_heads = _global_num_kv_heads;
   num_q_heads = _num_q_heads;
   num_kv_heads = _num_kv_heads;
+  hidden_size = num_q_heads * qProjSize;
 
   weightSize =
       ((qSize * qProjSize + oProjSize * (vProjSize > 0 ? vProjSize : vSize)) *
            num_q_heads +
-       (kSize * kProjSize + vSize * vProjSize) * num_kv_heads) *
+       (kSize * kProjSize + vSize * vProjSize) * num_q_heads) *
       size_of_dt;
   if (quantization_type != DT_NONE) {
     quantized_weightSize = get_quantization_to_byte_size(
@@ -1041,7 +918,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   // biasSize = _bias ? oProjSize * size_of_dt * 4 : 0;
 
   int qkv_bias_size =
-      qProjSize * num_q_heads + (kProjSize + vProjSize) * num_kv_heads;
+      qProjSize * num_q_heads + (kProjSize + vProjSize) * num_q_heads;
   int final_bias_size = oProjSize;
   biasSize =
       (_qkv_bias ? qkv_bias_size : 0) + (final_bias ? final_bias_size : 0);
@@ -1071,28 +948,27 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   // allocate memory for the seqArray and reserve space
   {
     int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
-    size_t qkv_max_proj_size =
-        max_tokens_per_batch *
-        (qProjSize * num_q_heads + kProjSize * num_kv_heads +
-         vProjSize * num_kv_heads);
+    size_t qkv_max_proj_size = max_tokens_per_batch * (qProjSize * num_q_heads +
+                                                       kProjSize * num_q_heads +
+                                                       vProjSize * num_q_heads);
     size_t key_cache_size = 0, value_cache_size = 0;
     switch (infer_mode) {
       case INC_DECODING_MODE:
       case TREE_VERIFY_MODE: {
-        key_cache_size = num_kv_heads * kProjSize *
+        key_cache_size = num_q_heads * kProjSize *
                          BatchConfig::max_requests_per_batch() *
                          BatchConfig::max_sequence_length();
-        value_cache_size = num_kv_heads * vProjSize *
+        value_cache_size = num_q_heads * vProjSize *
                            BatchConfig::max_requests_per_batch() *
                            BatchConfig::max_sequence_length();
         break;
       }
       case BEAM_SEARCH_MODE: {
-        key_cache_size = num_kv_heads * kProjSize *
+        key_cache_size = num_q_heads * kProjSize *
                          BeamSearchBatchConfig::max_requests_per_batch() *
                          BatchConfig::max_sequence_length() *
                          BeamSearchBatchConfig::MAX_BEAM_WIDTH;
-        value_cache_size = num_kv_heads * vProjSize *
+        value_cache_size = num_q_heads * vProjSize *
                            BeamSearchBatchConfig::max_requests_per_batch() *
                            BatchConfig::max_sequence_length() *
                            BeamSearchBatchConfig::MAX_BEAM_WIDTH;
@@ -1105,14 +981,12 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     size_t qk_prod_size =
         max_tokens_per_batch * BatchConfig::max_sequence_length() * num_q_heads;
     size_t attn_heads_size = max_tokens_per_batch * num_q_heads * vProjSize;
-    size_t W_out_block_size = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
-    size_t W_out_contiguous_size = W_out_block_size * num_q_heads;
     size_t complex_size = (max_tokens_per_batch * (qProjSize * num_q_heads +
-                                                   kProjSize * num_kv_heads)) /
+                                                   kProjSize * num_q_heads)) /
                           2;
     size_t totalSize =
         (qkv_max_proj_size + key_cache_size + value_cache_size +
-         2 * qk_prod_size + attn_heads_size + W_out_contiguous_size) *
+         2 * qk_prod_size + attn_heads_size) *
             size_of_dt +
         tokeninfo_size * sizeof(BatchConfig::PerTokenInfo) +
         complex_size * sizeof(hipFloatComplex); // more components will
@@ -1173,9 +1047,6 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
       attn_heads = gpu_mem_allocator.allocate_reserved_untyped(attn_heads_size *
                                                                size_of_dt);
       // offset += attn_heads_size * size_of_dt;
-      W_out_contiguous = gpu_mem_allocator.allocate_reserved_untyped(
-          W_out_contiguous_size * size_of_dt);
-      // offset += W_out_contiguous_size * size_of_dt;
       complex_input =
           gpu_mem_allocator.allocate_reserved<hipFloatComplex>(complex_size);
       // offset += complex_size * sizeof(hipFloatComplex);
@@ -1189,8 +1060,6 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
           qk_prod_size * size_of_dt);
       attn_heads = gpu_mem_allocator.allocate_instance_untyped(attn_heads_size *
                                                                size_of_dt);
-      W_out_contiguous = gpu_mem_allocator.allocate_instance_untyped(
-          W_out_contiguous_size * size_of_dt);
       complex_input =
           gpu_mem_allocator.allocate_instance<hipFloatComplex>(complex_size);
     }
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 5a2a14387e..00d45a9cfa 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -76,59 +76,33 @@ __global__ void apply_proj_bias_qkv(DT *input_ptr,
                                     int kProjSize,
                                     int vProjSize,
                                     int global_num_q_heads,
-                                    int global_num_kv_heads,
                                     int num_q_heads,
-                                    int num_kv_heads,
                                     bool scaling_query,
-                                    float scaling_factor) {
-  CUDA_KERNEL_LOOP(i,
-                   num_tokens *
-                       (qProjSize * num_q_heads + kProjSize * num_kv_heads +
-                        vProjSize * num_kv_heads)) {
+                                    float scaling_factor,
+                                    int hidden_size) {
+  CUDA_KERNEL_LOOP(i, num_tokens * hidden_size * QKV_WEIGHT_NUM) {
     // for simplicity, assume q, k, v is in same shape
     // 0->q, 1->k, 2->v
     // int qkv_index = i / (num_tokens * qProjSize) % 3;
 
-    int qkv_index = i < num_tokens * qProjSize * num_q_heads
-                        ? 0
-                        : (i < num_tokens * (qProjSize * num_q_heads +
-                                             kProjSize * num_kv_heads)
-                               ? 1
-                               : 2);
-
-    // int head_idx = i / (num_tokens * (qProjSize + kProjSize + vProjSize));
-    // int qkv_block_size = (qProjSize + kProjSize + vProjSize) * num_tokens;
-    int q_block_size = qProjSize * num_tokens * num_q_heads;
-    int k_block_size = kProjSize * num_tokens * num_kv_heads;
-
-    // int idx = i % (num_tokens * (qProjSize));
-
-    // int real_part_index =
-    //     head_idx * qkv_block_size + qkv_index * q_block_size + idx;
-    int bias_idx = 0;
-    if (qkv_index == 0) {
-      int head_idx = i / (num_tokens * qProjSize);
-      int global_head_idx = head_idx + shard_id * num_q_heads;
-      int global_i = i + shard_id * num_q_heads * num_tokens * qProjSize;
-      bias_idx = global_head_idx * qProjSize +
-                 (global_i % (num_tokens * (qProjSize)) % qProjSize);
-    } else {
+    int token_idx = i / (hidden_size * QKV_WEIGHT_NUM);
+    size_t in_token_idx = i - token_idx * hidden_size * QKV_WEIGHT_NUM;
 
-      int idx =
-          qkv_index == 1 ? i - q_block_size : i - q_block_size - k_block_size;
-      int pre_length = qkv_index == 1 ? qProjSize * global_num_q_heads
-                                      : qProjSize * global_num_q_heads +
-                                            kProjSize * global_num_kv_heads;
+    int qkv_index = in_token_idx / hidden_size;
 
-      int head_idx = idx / (num_tokens * kProjSize);
-      int global_head_idx = head_idx + shard_id * num_kv_heads;
-      int global_idx = idx + shard_id * num_tokens * num_kv_heads * kProjSize;
+    int proj_size = qkv_index == 0 ? qProjSize : kProjSize;
 
-      bias_idx = pre_length + global_head_idx * kProjSize +
-                 (global_idx % (num_tokens * (qProjSize)) % qProjSize);
-    }
-    // int bias_idx = qkv_index * qProjSize * global_num_q_heads +
-    //                global_head_idx * qProjSize + (idx % qProjSize);
+    int head_idx =
+        (in_token_idx - qkv_index * num_q_heads * proj_size) / proj_size;
+    int global_head_idx = head_idx + shard_id * num_q_heads;
+
+    size_t pre_length =
+        qkv_index == 0
+            ? 0
+            : (qkv_index == 1 ? qProjSize * global_num_q_heads
+                              : qProjSize * global_num_q_heads * KV_WEIGHT_NUM);
+
+    size_t bias_idx = pre_length + global_head_idx * proj_size + i % proj_size;
 
     input_ptr[i] += bias_ptr[bias_idx];
 
@@ -143,9 +117,12 @@ __global__ void scaling_query_kernel(DT *input_ptr,
                                      int qProjSize,
                                      int num_tokens,
                                      int num_q_heads,
-                                     float scaling_factor) {
-  CUDA_KERNEL_LOOP(i, num_tokens * (qProjSize * num_q_heads)) {
-    input_ptr[i] *= scaling_factor;
+                                     float scaling_factor,
+                                     int hidden_size) {
+  CUDA_KERNEL_LOOP(i, num_tokens * hidden_size) {
+    int token_idx = i / hidden_size;
+    input_ptr[i % hidden_size + token_idx * hidden_size * QKV_WEIGHT_NUM] *=
+        scaling_factor;
   }
 }
 
@@ -205,28 +182,22 @@ __global__ void
                               BatchConfig::PerTokenInfo const *tokenInfos,
                               int qProjSize,
                               int kProjSize,
-                              int num_q_heads,
                               int num_tokens,
-                              int num_kv_heads,
-                              int q_block_size,
-                              int k_block_size,
-                              int q_array_size) {
-  CUDA_KERNEL_LOOP(
-      i,
-      num_tokens * (qProjSize * num_q_heads + kProjSize * num_kv_heads) / 2) {
+                              size_t q_array_size,
+                              int hidden_size) {
+  CUDA_KERNEL_LOOP(i, num_tokens * hidden_size) {
     // create complex number
     bool q_tensor = i < (q_array_size / 2);
     int proj_size = q_tensor ? qProjSize : kProjSize;
     int real_i = q_tensor ? i : i - q_array_size / 2;
 
-    int head_idx = real_i / (num_tokens * proj_size / 2);
-    int idx = real_i % (num_tokens * proj_size / 2);
-    int token_idx =
-        (real_i - head_idx * (num_tokens * proj_size / 2)) / (proj_size / 2);
+    int token_idx = real_i / (hidden_size / 2);
+    int idx = real_i % (proj_size / 2);
+    int head_idx = (real_i - (token_idx * (hidden_size / 2))) / (proj_size / 2);
 
-    int real_part_index = idx + token_idx * (proj_size / 2) +
-                          head_idx * (q_tensor ? q_block_size : k_block_size) +
-                          (q_tensor ? 0 : q_array_size);
+    int real_part_index = idx + head_idx * proj_size +
+                          token_idx * hidden_size * QKV_WEIGHT_NUM +
+                          hidden_size * (q_tensor ? 0 : 1);
     int complex_part_index = real_part_index + (proj_size / 2);
 
     complex_input[i] = {input_ptr[real_part_index],
@@ -277,51 +248,38 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
   // Weights: qSize x qProjSize x 3 x num_q_heads
   // Input: qSize x num_tokens
   // Output >>> qProjSize x num_tokens x 3 x num_q_heads
-  int m_q = m->qProjSize;
-  int m_k = m->kProjSize;
-  int m_v = m->vProjSize;
+  int m_q = m->qProjSize * m->num_q_heads;
+  int m_k = m->kProjSize * m->num_q_heads;
+  int m_v = m->vProjSize * m->num_q_heads;
   assert(m_q == m_k && m_k == m_v); // keep things simple for now
   int n = bc->num_active_tokens();
   int k = m->qSize;
-  int m_ = m_q;
-  int lda = k, ldb = k, ldc = m_q;
-
-  size_t strideA = m_q * k; // query weight head size
-  size_t strideB = 0;       // input stays the same for all heads.
-  size_t strideC = m_q * n; // size of the output block for each head.
-
-  // compute QKV
-  checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                       CUBLAS_OP_T,
-                                       CUBLAS_OP_N,
-                                       m_,
-                                       n,
-                                       k,
-                                       &alpha,
-                                       weight_ptr,
-                                       cublas_data_type,
-                                       lda,
-                                       strideA,
-                                       input_ptr,
-                                       cublas_data_type,
-                                       ldb,
-                                       strideB,
-                                       &beta,
-                                       output_ptr,
-                                       cublas_data_type,
-                                       ldc,
-                                       strideC,
-                                       m->num_q_heads + m->num_kv_heads +
-                                           m->num_kv_heads,
-                                       compute_type,
-                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-  // apply rotary emmmbedding for q and k
-  // step1 change the k, v to complex tensor
+  int m_ = m_q * QKV_WEIGHT_NUM;
+  int lda = k, ldb = k, ldc = m_;
+  checkCUDA(cublasGemmEx(m->handle.blas,
+                         CUBLAS_OP_T,
+                         CUBLAS_OP_N,
+                         m_,
+                         n,
+                         k,
+                         &alpha,
+                         weight_ptr,
+                         cublas_data_type,
+                         lda,
+                         input_ptr,
+                         cublas_data_type,
+                         ldb,
+                         &beta,
+                         output_ptr,
+                         cublas_data_type,
+                         ldc,
+                         compute_type,
+                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+  // apply rotary emmmbedding for q
+  // and k step1 change the k, v to complex tensor
   int num_tokens = bc->num_active_tokens();
   int parallelism = m->kProjSize * num_tokens * m->num_q_heads;
-  int q_block_size = m->qProjSize * num_tokens;
-  int k_block_size = m->kProjSize * num_tokens;
-  int q_array_size = m->qProjSize * num_tokens * m->num_q_heads;
+  size_t q_array_size = m->qProjSize * num_tokens * m->num_q_heads;
   // apply bias for q, k, v
   if (*m->qkv_bias) {
     apply_proj_bias_qkv<<<GET_BLOCKS(parallelism),
@@ -335,11 +293,10 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                     m->kProjSize,
                                     m->vProjSize,
                                     m->global_num_q_heads,
-                                    m->global_num_kv_heads,
                                     m->num_q_heads,
-                                    m->num_kv_heads,
                                     *m->scaling_query,
-                                    m->scaling_factor);
+                                    m->scaling_factor,
+                                    m->hidden_size);
   } else if (m->scaling_query) {
     scaling_query_kernel<<<GET_BLOCKS(parallelism),
                            min(CUDA_NUM_THREADS, parallelism),
@@ -348,13 +305,12 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                      num_tokens,
                                      m->num_q_heads,
                                      m->qProjSize,
-                                     m->scaling_factor);
+                                     m->scaling_factor,
+                                     m->hidden_size);
   }
   if (*m->apply_rotary_embedding) {
     /*q&k*/
-    parallelism =
-        num_tokens *
-        (m->qProjSize * m->num_q_heads + m->kProjSize * m->num_kv_heads) / 2;
+    parallelism = num_tokens * m->hidden_size;
     apply_rotary_embedding_hf<<<GET_BLOCKS(parallelism),
                                 min(CUDA_NUM_THREADS, parallelism),
                                 0,
@@ -363,12 +319,9 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                           m->token_infos,
                                           m->qProjSize,
                                           m->kProjSize,
-                                          m->num_q_heads,
                                           num_tokens,
-                                          m->num_kv_heads,
-                                          q_block_size,
-                                          k_block_size,
-                                          q_array_size);
+                                          q_array_size,
+                                          m->hidden_size);
   }
 }
 
@@ -378,8 +331,7 @@ void update_kv_cache_kernel(IncMultiHeadSelfAttentionMeta const *m,
                             cudaStream_t stream) {
   int num_tokens = bc->num_active_tokens();
   if (num_tokens > 0) {
-    int parallelism =
-        (m->kProjSize + m->vProjSize) * num_tokens * m->num_kv_heads;
+    int parallelism = m->hidden_size * num_tokens;
     store_kv_cache<<<GET_BLOCKS(parallelism),
                      min(CUDA_NUM_THREADS, parallelism),
                      0,
@@ -387,13 +339,9 @@ void update_kv_cache_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                static_cast<DT *>(m->keyCache),
                                static_cast<DT *>(m->valueCache),
                                m->token_infos,
-                               m->qProjSize,
-                               m->kProjSize,
-                               m->vProjSize,
                                num_tokens,
-                               m->num_q_heads,
-                               m->num_kv_heads,
-                               BatchConfig::max_sequence_length());
+                               BatchConfig::max_sequence_length(),
+                               m->hidden_size);
   }
 }
 
@@ -507,35 +455,26 @@ __global__ void store_kv_cache(DT const *devQKVProjArray,
                                DT *kCache_ptr,
                                DT *vCache_ptr,
                                BatchConfig::PerTokenInfo const *tokenInfos,
-                               int qProjSize,
-                               int kProjSize,
-                               int vProjSize,
                                int num_tokens,
-                               int num_q_heads,
-                               int num_kv_heads,
-                               int max_seq_len) {
-  CUDA_KERNEL_LOOP(i, num_tokens * (kProjSize + vProjSize) * num_kv_heads) {
-    int q_array_size = qProjSize * num_tokens * num_q_heads;
-    int k_array_size = kProjSize * num_tokens * num_kv_heads;
-
-    bool k_cache = i < k_array_size;
-    int real_i = k_cache ? i : i - k_array_size;
-
-    int proj_size = k_cache ? kProjSize : vProjSize;
-    int head_idx = real_i / (num_tokens * proj_size);
-    int token_idx = (real_i - head_idx * (num_tokens * proj_size)) / proj_size;
-    int data_idx = real_i % proj_size;
-
-    DT val = devQKVProjArray[q_array_size + (k_cache ? 0 : k_array_size) +
-                             head_idx * proj_size * num_tokens +
-                             token_idx * proj_size + data_idx];
+                               int max_seq_len,
+                               int hidden_size) {
+  CUDA_KERNEL_LOOP(i, num_tokens * hidden_size) {
+    int token_idx = i / hidden_size;
+    int offset = i % hidden_size;
+
+    size_t val_idx =
+        token_idx * QKV_WEIGHT_NUM * hidden_size + hidden_size + offset;
+
+    DT kVal = devQKVProjArray[val_idx];
+    DT vVal = devQKVProjArray[val_idx + hidden_size];
     int const req_id = tokenInfos[token_idx].request_index;
     int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
 
-    DT *cache_ptr = k_cache ? kCache_ptr : vCache_ptr;
-    cache_ptr[req_id * (num_kv_heads * max_seq_len * proj_size) +
-              head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
-              data_idx] = val;
+    // key cache
+    kCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
+               offset] = kVal;
+    vCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
+               offset] = vVal;
   }
 }
 
@@ -578,11 +517,13 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
   // int num_requests = bc->num_active_requests();
   int num_tokens = bc->num_active_tokens();
   int tokens_previous_requests = 0;
-  int q_block_size = m->qProjSize * num_tokens;
-  int kt_block_size = m->kProjSize * BatchConfig::max_sequence_length();
-  int kt_req_block_size = kt_block_size * m->num_kv_heads;
-  int vt_block_size = m->vProjSize * BatchConfig::max_sequence_length();
-  int vt_req_block_size = vt_block_size * m->num_kv_heads;
+  int q_block_size = m->qProjSize;
+  int kt_block_size = m->kProjSize;
+  int kt_req_block_size =
+      kt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+  int vt_block_size = m->vProjSize;
+  int vt_req_block_size =
+      vt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
@@ -598,7 +539,8 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     int m_ = num_new_tokens;
     int n = total_tokens;
     int k = m->qProjSize;
-    int lda = k, ldb = k, ldc = m_;
+    int lda = k * m->num_q_heads * QKV_WEIGHT_NUM, ldb = k * m->num_q_heads,
+        ldc = m_;
     int strideA = q_block_size;
     int strideB = kt_block_size;
     int strideC = num_new_tokens * total_tokens;
@@ -608,72 +550,36 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     }
     // To get A, skip over Q entries from previous requests (same head)
     DT const *A = static_cast<DT *>(m->devQKVProjArray) +
-                  tokens_previous_requests * m->qProjSize;
+                  tokens_previous_requests * m->qProjSize * m->num_q_heads *
+                      QKV_WEIGHT_NUM;
     // To get B, skip over K entries from previous requests (all heads +
     // padding)
     DT const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
     // To get C, skip over QK^T products from previous requests
     DT *C = static_cast<DT *>(m->qk_prods);
-    if (m->num_kv_heads == m->num_q_heads) {
-      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                           CUBLAS_OP_T,
-                                           CUBLAS_OP_N,
-                                           m_,
-                                           n,
-                                           k,
-                                           &alpha,
-                                           A,
-                                           cublas_data_type,
-                                           lda,
-                                           strideA,
-                                           B,
-                                           cublas_data_type,
-                                           ldb,
-                                           strideB,
-                                           &beta,
-                                           C,
-                                           cublas_data_type,
-                                           ldc,
-                                           strideC,
-                                           m->num_q_heads,
-                                           compute_type,
-                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-
-    } else {
-      strideB = 0;
-      // use cublasGemmStridedBatchedEx
-      int one_step_heads = m->num_q_heads / m->num_kv_heads;
-      m_ = num_new_tokens;
-      n = total_tokens;
-      k = m->qProjSize;
-      lda = k, ldb = k, ldc = m_;
-      for (int step = 0; step < m->num_kv_heads; step++) {
-        checkCUDA(
-            cublasGemmStridedBatchedEx(m->handle.blas,
-                                       CUBLAS_OP_T,
-                                       CUBLAS_OP_N,
-                                       m_,
-                                       n,
-                                       k,
-                                       &alpha,
-                                       A + step * strideA * one_step_heads,
-                                       cublas_data_type,
-                                       lda,
-                                       strideA,
-                                       B + step * kt_block_size,
-                                       cublas_data_type,
-                                       ldb,
-                                       strideB,
-                                       &beta,
-                                       C + step * strideC * one_step_heads,
-                                       cublas_data_type,
-                                       ldc,
-                                       strideC,
-                                       one_step_heads,
-                                       compute_type,
-                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-      }
-    }
+    checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                         CUBLAS_OP_T,
+                                         CUBLAS_OP_N,
+                                         m_,
+                                         n,
+                                         k,
+                                         &alpha,
+                                         A,
+                                         cublas_data_type,
+                                         lda,
+                                         strideA,
+                                         B,
+                                         cublas_data_type,
+                                         ldb,
+                                         strideB,
+                                         &beta,
+                                         C,
+                                         cublas_data_type,
+                                         ldc,
+                                         strideC,
+                                         m->num_q_heads,
+                                         compute_type,
+                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
     // add alibi position bias to qk production
     if (*m->position_bias) {
       size_t parallelism = m->num_q_heads * total_tokens * num_new_tokens;
@@ -745,7 +651,7 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     m_ = num_new_tokens;
     n = m->vProjSize;
     k = total_tokens;
-    lda = m_, ldb = n, ldc = m_;
+    lda = m_, ldb = n * m->num_q_heads, ldc = m_;
     strideA = num_new_tokens * total_tokens;
     strideB = vt_block_size;
     strideC = num_new_tokens * m->vProjSize;
@@ -759,65 +665,29 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     // requests
     C = static_cast<DT *>(m->attn_heads) +
         tokens_previous_requests * m->num_q_heads * m->vProjSize;
-
-    if (m->num_q_heads == m->num_kv_heads) {
-      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                           CUBLAS_OP_N,
-                                           CUBLAS_OP_T,
-                                           m_,
-                                           n,
-                                           k,
-                                           &alpha,
-                                           A,
-                                           cublas_data_type,
-                                           lda,
-                                           strideA,
-                                           B,
-                                           cublas_data_type,
-                                           ldb,
-                                           strideB,
-                                           &beta,
-                                           C,
-                                           cublas_data_type,
-                                           ldc,
-                                           strideC,
-                                           m->num_q_heads,
-                                           compute_type,
-                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-    } else {
-      int one_step_heads = m->num_q_heads / m->num_kv_heads;
-      n = m->vProjSize;
-      lda = m_, ldb = n, ldc = m_;
-      strideA = num_new_tokens * total_tokens;
-      strideB = 0;
-      strideC = num_new_tokens * m->vProjSize;
-      for (int step = 0; step < m->num_kv_heads; step++) {
-        checkCUDA(
-            cublasGemmStridedBatchedEx(m->handle.blas,
-                                       CUBLAS_OP_N,
-                                       CUBLAS_OP_T,
-                                       m_,
-                                       n,
-                                       k,
-                                       &alpha,
-                                       A + step * one_step_heads * strideA,
-                                       cublas_data_type,
-                                       lda,
-                                       strideA,
-                                       B + step * vt_block_size,
-                                       cublas_data_type,
-                                       ldb,
-                                       strideB,
-                                       &beta,
-                                       C + step * one_step_heads * strideC,
-                                       cublas_data_type,
-                                       ldc,
-                                       strideC,
-                                       one_step_heads,
-                                       compute_type,
-                                       CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-      }
-    }
+    checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                         CUBLAS_OP_N,
+                                         CUBLAS_OP_T,
+                                         m_,
+                                         n,
+                                         k,
+                                         &alpha,
+                                         A,
+                                         cublas_data_type,
+                                         lda,
+                                         strideA,
+                                         B,
+                                         cublas_data_type,
+                                         ldb,
+                                         strideB,
+                                         &beta,
+                                         C,
+                                         cublas_data_type,
+                                         ldc,
+                                         strideC,
+                                         m->num_q_heads,
+                                         compute_type,
+                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
     // Project to output, save result directly on output tensor
     alpha = 1.0f, beta = 0.0f;
     m_ = m->oProjSize;
@@ -825,8 +695,8 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     n = num_new_tokens;
     lda = k, ldb = n, ldc = m_;
     A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
-                                 m->kProjSize * m->num_kv_heads +
-                                 m->vProjSize * m->num_kv_heads);
+                                 m->kProjSize * m->num_q_heads +
+                                 m->vProjSize * m->num_q_heads);
     B = C;
     C = static_cast<DT *>(output_ptr) + tokens_previous_requests * m->oProjSize;
 
@@ -855,8 +725,8 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
   if (*m->final_bias && shard_id == 0) {
     int parallelism = m->oProjSize * num_tokens;
     int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
-                          m->kProjSize * m->global_num_kv_heads +
-                          m->vProjSize * m->global_num_kv_heads;
+                          m->kProjSize * m->global_num_q_heads +
+                          m->vProjSize * m->global_num_q_heads;
 
     apply_proj_bias_w<<<GET_BLOCKS(parallelism),
                         min(CUDA_NUM_THREADS, parallelism),
@@ -1057,11 +927,12 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   global_num_kv_heads = _global_num_kv_heads;
   num_q_heads = _num_q_heads;
   num_kv_heads = _num_kv_heads;
+  hidden_size = num_q_heads * qProjSize;
 
   weightSize =
       ((qSize * qProjSize + oProjSize * (vProjSize > 0 ? vProjSize : vSize)) *
            num_q_heads +
-       (kSize * kProjSize + vSize * vProjSize) * num_kv_heads) *
+       (kSize * kProjSize + vSize * vProjSize) * num_q_heads) *
       size_of_dt;
   if (quantization_type != DT_NONE) {
     quantized_weightSize = get_quantization_to_byte_size(
@@ -1070,7 +941,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   // biasSize = _bias ? oProjSize * size_of_dt * 4 : 0;
 
   int qkv_bias_size =
-      qProjSize * num_q_heads + (kProjSize + vProjSize) * num_kv_heads;
+      qProjSize * num_q_heads + (kProjSize + vProjSize) * num_q_heads;
   int final_bias_size = oProjSize;
   biasSize =
       (_qkv_bias ? qkv_bias_size : 0) + (final_bias ? final_bias_size : 0);
@@ -1100,28 +971,27 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   // allocate memory for the seqArray and reserve space
   {
     int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
-    size_t qkv_max_proj_size =
-        max_tokens_per_batch *
-        (qProjSize * num_q_heads + kProjSize * num_kv_heads +
-         vProjSize * num_kv_heads);
+    size_t qkv_max_proj_size = max_tokens_per_batch * (qProjSize * num_q_heads +
+                                                       kProjSize * num_q_heads +
+                                                       vProjSize * num_q_heads);
     size_t key_cache_size = 0, value_cache_size = 0;
     switch (infer_mode) {
       case INC_DECODING_MODE:
       case TREE_VERIFY_MODE: {
-        key_cache_size = num_kv_heads * kProjSize *
+        key_cache_size = num_q_heads * kProjSize *
                          BatchConfig::max_requests_per_batch() *
                          BatchConfig::max_sequence_length();
-        value_cache_size = num_kv_heads * vProjSize *
+        value_cache_size = num_q_heads * vProjSize *
                            BatchConfig::max_requests_per_batch() *
                            BatchConfig::max_sequence_length();
         break;
       }
       case BEAM_SEARCH_MODE: {
-        key_cache_size = num_kv_heads * kProjSize *
+        key_cache_size = num_q_heads * kProjSize *
                          BeamSearchBatchConfig::max_requests_per_batch() *
                          BatchConfig::max_sequence_length() *
                          BeamSearchBatchConfig::MAX_BEAM_WIDTH;
-        value_cache_size = num_kv_heads * vProjSize *
+        value_cache_size = num_q_heads * vProjSize *
                            BeamSearchBatchConfig::max_requests_per_batch() *
                            BatchConfig::max_sequence_length() *
                            BeamSearchBatchConfig::MAX_BEAM_WIDTH;
@@ -1134,14 +1004,12 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     size_t qk_prod_size =
         max_tokens_per_batch * BatchConfig::max_sequence_length() * num_q_heads;
     size_t attn_heads_size = max_tokens_per_batch * num_q_heads * vProjSize;
-    size_t W_out_block_size = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
-    size_t W_out_contiguous_size = W_out_block_size * num_q_heads;
     size_t complex_size = (max_tokens_per_batch * (qProjSize * num_q_heads +
-                                                   kProjSize * num_kv_heads)) /
+                                                   kProjSize * num_q_heads)) /
                           2;
     size_t totalSize =
         (qkv_max_proj_size + key_cache_size + value_cache_size +
-         2 * qk_prod_size + attn_heads_size + W_out_contiguous_size) *
+         2 * qk_prod_size + attn_heads_size) *
             size_of_dt +
         tokeninfo_size * sizeof(BatchConfig::PerTokenInfo) +
         complex_size * sizeof(cuFloatComplex); // more components will
@@ -1202,9 +1070,6 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
       attn_heads = gpu_mem_allocator.allocate_reserved_untyped(attn_heads_size *
                                                                size_of_dt);
       // offset += attn_heads_size * size_of_dt;
-      W_out_contiguous = gpu_mem_allocator.allocate_reserved_untyped(
-          W_out_contiguous_size * size_of_dt);
-      // offset += W_out_contiguous_size * size_of_dt;
       complex_input =
           gpu_mem_allocator.allocate_reserved<cuFloatComplex>(complex_size);
       // offset += complex_size * sizeof(cuFloatComplex);
@@ -1218,8 +1083,6 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
           qk_prod_size * size_of_dt);
       attn_heads = gpu_mem_allocator.allocate_instance_untyped(attn_heads_size *
                                                                size_of_dt);
-      W_out_contiguous = gpu_mem_allocator.allocate_instance_untyped(
-          W_out_contiguous_size * size_of_dt);
       complex_input =
           gpu_mem_allocator.allocate_instance<cuFloatComplex>(complex_size);
     }
diff --git a/src/ops/spec_inc_multihead_self_attention.cc b/src/ops/spec_inc_multihead_self_attention.cc
index 4c78960d5f..eb6fd721e6 100644
--- a/src/ops/spec_inc_multihead_self_attention.cc
+++ b/src/ops/spec_inc_multihead_self_attention.cc
@@ -152,8 +152,8 @@ Tensor
   int kParas = kProjSize * kSize;
   int vParas = vProjSize * vSize;
   int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
-  int weight_size = qParas * num_q_heads + kParas * num_kv_heads +
-                    vParas * num_kv_heads + oParas * num_q_heads;
+  int weight_size = qParas * num_q_heads + kParas * num_q_heads +
+                    vParas * num_q_heads + oParas * num_q_heads;
   {
     int dims[1] = {weight_size};
     li->weights[0] = create_weight_legion_ordering(1,
@@ -167,7 +167,7 @@ Tensor
   if (qkv_bias || final_bias) {
     // q, k, v, o
     int qkv_bias_size =
-        qProjSize * num_q_heads + (kProjSize + vProjSize) * num_kv_heads;
+        qProjSize * num_q_heads + (kProjSize + vProjSize) * num_q_heads;
     int dims[1] = {(qkv_bias ? qkv_bias_size : 0) +
                    (final_bias ? oProjSize : 0)};
     li->weights[1] = create_weight_legion_ordering(1,
@@ -319,7 +319,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
     dims[1].size = this->num_q_heads * (qParas + oParas) +
-                   this->num_kv_heads * (kParas + vParas);
+                   this->num_q_heads * (kParas + vParas);
     dims[1].is_replica_dim = false;
     int seed = std::rand();
     Initializer *initializer = new GlorotUniform(seed);
@@ -332,7 +332,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     if (qkv_bias || final_bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
       int qkv_bias_size =
-          qProjSize * num_q_heads + (kProjSize + vProjSize) * num_kv_heads;
+          qProjSize * num_q_heads + (kProjSize + vProjSize) * num_q_heads;
       bias_shape.dims[0].size =
           (qkv_bias ? qkv_bias_size : 0) + (final_bias ? oProjSize : 0);
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
@@ -421,7 +421,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
     dims[1].size = this->num_q_heads * (qParas + oParas) +
-                   this->num_kv_heads * (kParas + vParas);
+                   this->num_q_heads * (kParas + vParas);
     dims[1].is_replica_dim = false;
     // dims[2].size = qParas + kParas + vParas + oParas;
     int seed = std::rand();
@@ -435,7 +435,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     if (qkv_bias || final_bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
       int qkv_bias_size =
-          qProjSize * num_q_heads + (kProjSize + vProjSize) * num_kv_heads;
+          qProjSize * num_q_heads + (kProjSize + vProjSize) * num_q_heads;
       bias_shape.dims[0].size =
           (qkv_bias ? qkv_bias_size : 0) + (final_bias ? oProjSize : 0);
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
diff --git a/src/ops/spec_inc_multihead_self_attention.cpp b/src/ops/spec_inc_multihead_self_attention.cpp
index 30b6f5cb84..173d4a5b1d 100644
--- a/src/ops/spec_inc_multihead_self_attention.cpp
+++ b/src/ops/spec_inc_multihead_self_attention.cpp
@@ -44,22 +44,19 @@ __global__ void spec_store_kv_cache(
     int kProjSize,
     int vProjSize,
     int num_tokens,
-    int num_q_heads,
-    int num_kv_heads,
     int max_seq_len,
     int max_beam_width,
-    bool is_root) {
-  CUDA_KERNEL_LOOP(i, num_tokens * (kProjSize + vProjSize) * num_kv_heads) {
-    int q_array_size = qProjSize * num_tokens * num_q_heads;
-    int k_array_size = kProjSize * num_tokens * num_kv_heads;
+    bool is_root,
+    int hidden_size) {
+  CUDA_KERNEL_LOOP(i, num_tokens * hidden_size * 2) {
+    int token_idx = i / (hidden_size * KV_WEIGHT_NUM);
+    int offset = i % hidden_size;
 
-    bool k_cache = i < k_array_size;
-    int real_i = k_cache ? i : i - k_array_size;
+    size_t val_idx =
+        token_idx * QKV_WEIGHT_NUM * hidden_size + hidden_size + offset;
 
-    int proj_size = k_cache ? kProjSize : vProjSize;
-    int head_idx = real_i / (num_tokens * proj_size);
-    int token_idx = (real_i - head_idx * (num_tokens * proj_size)) / proj_size;
-    int data_idx = real_i % proj_size;
+    DT kVal = devQKVProjArray[val_idx];
+    DT vVal = devQKVProjArray[val_idx + hidden_size];
 
     // above no need to be changed
     // int const req_id = id_map[token_idx].request_index;
@@ -69,10 +66,6 @@ __global__ void spec_store_kv_cache(
     // int const beam_depth = id_map[token_idx].beam_depth;
     // int const beam_width = id_map[token_idx].beam_width;
 
-    DT val = devQKVProjArray[q_array_size + (k_cache ? 0 : k_array_size) +
-                             head_idx * proj_size * num_tokens +
-                             token_idx * proj_size + data_idx];
-
     int const req_id = tokenInfos[token_idx].request_index;
     int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
     int const sub_req_id = beamTokenInfos[token_idx].sub_request_index;
@@ -81,27 +74,26 @@ __global__ void spec_store_kv_cache(
     int const beam_width = beamRequestInfos[req_id].beam_size;
 
     // new token
-    int new_token_cache_idx = (req_id * max_beam_width + sub_req_id) *
-                                  (num_kv_heads * max_seq_len * proj_size) +
-                              head_idx * (max_seq_len * proj_size) +
-                              tok_id * proj_size + data_idx;
-
-    DT *cache_ptr = k_cache ? kCache_ptr : vCache_ptr;
-    cache_ptr[new_token_cache_idx] = val;
+    kCache_ptr[(req_id * max_beam_width + sub_req_id) *
+                   (hidden_size * max_seq_len) +
+               tok_id * hidden_size + offset] = kVal;
+    vCache_ptr[(req_id * max_beam_width + sub_req_id) *
+                   (hidden_size * max_seq_len) +
+               tok_id * hidden_size + offset] = vVal;
 
     // replica in the root iteration
     if (beam_depth == 1) {
       for (int i = 1; i < beam_width; i++) {
-        cache_ptr[(req_id * max_beam_width + i) *
-                      (num_kv_heads * max_seq_len * proj_size) +
-                  head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
-                  data_idx] = val;
+        kCache_ptr[(req_id * max_beam_width + i) * (hidden_size * max_seq_len) +
+                   tok_id * hidden_size + offset] = kVal;
+        vCache_ptr[(req_id * max_beam_width + i) * (hidden_size * max_seq_len) +
+                   tok_id * hidden_size + offset] = vVal;
       }
     }
 
     // naive cache stealing
     if (sub_req_id != parent_id) {
-      if (data_idx == 0 && head_idx == 0 && k_cache) {
+      if (offset == 0 && tok_id == 0) {
         printf("cache stealing!, depth %d req_id %d sub_req_id %d, parentid "
                "%d, tok_id %d\n",
                beam_depth,
@@ -114,14 +106,13 @@ __global__ void spec_store_kv_cache(
       for (int depth = 0; depth < beam_depth; depth++) {
         int steal_token_idx = tok_id - beam_depth + depth;
         int steal_from_idx = (req_id * max_beam_width + parent_id) *
-                                 (num_kv_heads * max_seq_len * proj_size) +
-                             head_idx * (max_seq_len * proj_size) +
-                             steal_token_idx * proj_size + data_idx;
+                                 (hidden_size * max_seq_len) +
+                             steal_token_idx * hidden_size + offset;
         int steal_to_idx = (req_id * max_beam_width + sub_req_id) *
-                               (num_kv_heads * max_seq_len * proj_size) +
-                           head_idx * (max_seq_len * proj_size) +
-                           steal_token_idx * proj_size + data_idx;
-        cache_ptr[steal_to_idx] = cache_ptr[steal_from_idx];
+                               (hidden_size * max_seq_len) +
+                           steal_token_idx * hidden_size + offset;
+        kCache_ptr[steal_to_idx] = kCache_ptr[steal_from_idx];
+        vCache_ptr[steal_to_idx] = vCache_ptr[steal_from_idx];
 
         //   if(data_idx == 0 && head_idx == 0 && k_cache && req_id == 1){
         //     printf("cache stealing kernel!, steal_token_idx %d\n",
@@ -155,8 +146,7 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   // printf("curr depth: %d\n", curr_depth);
   // assert(curr_depth < 3);
   if (num_tokens > 0) {
-    int parallelism =
-        (m->kProjSize + m->vProjSize) * num_tokens * m->num_kv_heads;
+    int parallelism = m->hidden_size * KV_WEIGHT_NUM * num_tokens;
     hipLaunchKernelGGL(HIP_KERNEL_NAME(spec_store_kv_cache<DT>),
                        GET_BLOCKS(parallelism),
                        min(CUDA_NUM_THREADS, parallelism),
@@ -173,11 +163,10 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                        m->kProjSize,
                        m->vProjSize,
                        num_tokens,
-                       m->num_q_heads,
-                       m->num_kv_heads,
                        BatchConfig::max_sequence_length(),
                        BeamSearchBatchConfig::MAX_BEAM_WIDTH,
-                       /*root*/ curr_depth == 0);
+                       /*root*/ curr_depth == 0,
+                       m->hidden_size);
   }
 }
 
@@ -223,12 +212,13 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   int tokens_prev_requests_squares = 0;
   // int qkv_block_size =
   //     (m->qProjSize + m->kProjSize + m->vProjSize) * num_tokens;
-  int q_block_size = m->qProjSize * num_tokens;
-
-  int kt_block_size = m->kProjSize * BatchConfig::max_sequence_length();
-  int kt_req_block_size = kt_block_size * m->num_kv_heads;
-  int vt_block_size = m->vProjSize * BatchConfig::max_sequence_length();
-  int vt_req_block_size = vt_block_size * m->num_kv_heads;
+  int q_block_size = m->qProjSize;
+  int kt_block_size = m->kProjSize;
+  int kt_req_block_size =
+      kt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+  int vt_block_size = m->vProjSize;
+  int vt_req_block_size =
+      vt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
@@ -247,7 +237,8 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       int m_ = num_new_tokens;
       int n = total_tokens;
       int k = m->qProjSize;
-      int lda = k, ldb = k, ldc = m_;
+      int lda = k * m->num_q_heads * QKV_WEIGHT_NUM, ldb = k * m->num_q_heads,
+          ldc = m_;
       int strideA = q_block_size;
       int strideB = kt_block_size;
       int strideC = num_new_tokens * total_tokens;
@@ -259,7 +250,8 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       }
       // To get A, skip over Q entries from previous requests (same head)
       DT const *A = static_cast<DT *>(m->devQKVProjArray) +
-                    tokens_previous_requests * m->qProjSize;
+                    tokens_previous_requests * m->qProjSize * m->num_q_heads *
+                        QKV_WEIGHT_NUM;
       // To get B, skip over K entries from previous requests (all heads +
       // padding)
       DT const *B = static_cast<DT *>(m->keyCache) +
@@ -274,64 +266,30 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       DT *C = static_cast<DT *>(m->qk_prods) +
               m->num_q_heads * tokens_prev_requests_squares;
 
-      if (m->num_q_heads == m->num_kv_heads) {
-        checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
-                                              HIPBLAS_OP_T,
-                                              HIPBLAS_OP_N,
-                                              m_,
-                                              n,
-                                              k,
-                                              &alpha,
-                                              A,
-                                              hipblas_data_type,
-                                              lda,
-                                              strideA,
-                                              B,
-                                              hipblas_data_type,
-                                              ldb,
-                                              strideB,
-                                              &beta,
-                                              C,
-                                              hipblas_data_type,
-                                              ldc,
-                                              strideC,
-                                              m->num_q_heads,
-                                              compute_type,
-                                              HIPBLAS_GEMM_DEFAULT));
-      } else {
-        strideB = 0;
-        int one_step_heads = m->num_q_heads / m->num_kv_heads;
-        m_ = num_new_tokens;
-        n = total_tokens;
-        k = m->qProjSize;
-        lda = k, ldb = k, ldc = m_;
-        for (int step = 0; step < m->num_kv_heads; step++) {
-          checkCUDA(
-              hipblasGemmStridedBatchedEx(m->handle.blas,
-                                          HIPBLAS_OP_T,
-                                          HIPBLAS_OP_N,
-                                          m_,
-                                          n,
-                                          k,
-                                          &alpha,
-                                          A + step * strideA * one_step_heads,
-                                          hipblas_data_type,
-                                          lda,
-                                          strideA,
-                                          B + step * kt_block_size,
-                                          hipblas_data_type,
-                                          ldb,
-                                          strideB,
-                                          &beta,
-                                          C + step * strideC * one_step_heads,
-                                          hipblas_data_type,
-                                          ldc,
-                                          strideC,
-                                          one_step_heads,
-                                          compute_type,
-                                          HIPBLAS_GEMM_DEFAULT));
-        }
-      }
+      checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
+                                            HIPBLAS_OP_T,
+                                            HIPBLAS_OP_N,
+                                            m_,
+                                            n,
+                                            k,
+                                            &alpha,
+                                            A,
+                                            hipblas_data_type,
+                                            lda,
+                                            strideA,
+                                            B,
+                                            hipblas_data_type,
+                                            ldb,
+                                            strideB,
+                                            &beta,
+                                            C,
+                                            hipblas_data_type,
+                                            ldc,
+                                            strideC,
+                                            m->num_q_heads,
+                                            compute_type,
+                                            HIPBLAS_GEMM_DEFAULT));
+
       if (*m->position_bias) {
         size_t parallelism = m->num_q_heads * total_tokens * num_new_tokens;
         hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_position_bias_qkprd<DT>),
@@ -401,7 +359,7 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       m_ = num_new_tokens;
       n = m->vProjSize;
       k = total_tokens;
-      lda = m_, ldb = n, ldc = m_;
+      lda = m_, ldb = n * m->num_q_heads, ldc = m_;
       strideA = num_new_tokens * total_tokens;
       strideB = vt_block_size;
       strideC = num_new_tokens * m->vProjSize;
@@ -417,64 +375,29 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       C = static_cast<DT *>(m->attn_heads) +
           tokens_previous_requests * m->num_q_heads * m->vProjSize;
 
-      if (m->num_q_heads == m->num_kv_heads) {
-        checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
-                                              HIPBLAS_OP_N,
-                                              HIPBLAS_OP_T,
-                                              m_,
-                                              n,
-                                              k,
-                                              &alpha,
-                                              A,
-                                              hipblas_data_type,
-                                              lda,
-                                              strideA,
-                                              B,
-                                              hipblas_data_type,
-                                              ldb,
-                                              strideB,
-                                              &beta,
-                                              C,
-                                              hipblas_data_type,
-                                              ldc,
-                                              strideC,
-                                              m->num_q_heads,
-                                              compute_type,
-                                              HIPBLAS_GEMM_DEFAULT));
-      } else {
-        int one_step_heads = m->num_q_heads / m->num_kv_heads;
-        n = m->vProjSize;
-        lda = m_, ldb = n, ldc = m_;
-        strideA = num_new_tokens * total_tokens;
-        strideB = 0;
-        strideC = num_new_tokens * m->vProjSize;
-        for (int step = 0; step < m->num_kv_heads; step++) {
-          checkCUDA(
-              hipblasGemmStridedBatchedEx(m->handle.blas,
-                                          HIPBLAS_OP_N,
-                                          HIPBLAS_OP_T,
-                                          m_,
-                                          n,
-                                          k,
-                                          &alpha,
-                                          A + step * one_step_heads * strideA,
-                                          hipblas_data_type,
-                                          lda,
-                                          strideA,
-                                          B + step * vt_block_size,
-                                          hipblas_data_type,
-                                          ldb,
-                                          strideB,
-                                          &beta,
-                                          C + step * one_step_heads,
-                                          hipblas_data_type,
-                                          ldc,
-                                          strideC,
-                                          one_step_heads,
-                                          compute_type,
-                                          HIPBLAS_GEMM_DEFAULT));
-        }
-      }
+      checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
+                                            HIPBLAS_OP_N,
+                                            HIPBLAS_OP_T,
+                                            m_,
+                                            n,
+                                            k,
+                                            &alpha,
+                                            A,
+                                            hipblas_data_type,
+                                            lda,
+                                            strideA,
+                                            B,
+                                            hipblas_data_type,
+                                            ldb,
+                                            strideB,
+                                            &beta,
+                                            C,
+                                            hipblas_data_type,
+                                            ldc,
+                                            strideC,
+                                            m->num_q_heads,
+                                            compute_type,
+                                            HIPBLAS_GEMM_DEFAULT));
 
       // Project to output, save result directly on output tensor
       alpha = 1.0f, beta = 0.0f;
@@ -483,8 +406,8 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       n = num_new_tokens;
       lda = k, ldb = n, ldc = m_;
       A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
-                                   m->kProjSize * m->num_kv_heads +
-                                   m->vProjSize * m->num_kv_heads);
+                                   m->kProjSize * m->num_q_heads +
+                                   m->vProjSize * m->num_q_heads);
       B = C;
       C = static_cast<DT *>(output_ptr) +
           tokens_previous_requests * m->oProjSize;
@@ -515,8 +438,8 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   if (*m->final_bias && shard_id == 0) {
     int parallelism = m->oProjSize * num_tokens;
     int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
-                          m->kProjSize * m->global_num_kv_heads +
-                          m->vProjSize * m->global_num_kv_heads;
+                          m->kProjSize * m->global_num_q_heads +
+                          m->vProjSize * m->global_num_q_heads;
     hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_proj_bias_w<DT>),
                        GET_BLOCKS(parallelism),
                        min(CUDA_NUM_THREADS, parallelism),
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index b479528607..00eec96824 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -43,22 +43,19 @@ __global__ void spec_store_kv_cache(
     int kProjSize,
     int vProjSize,
     int num_tokens,
-    int num_q_heads,
-    int num_kv_heads,
     int max_seq_len,
     int max_beam_width,
-    bool is_root) {
-  CUDA_KERNEL_LOOP(i, num_tokens * (kProjSize + vProjSize) * num_kv_heads) {
-    int q_array_size = qProjSize * num_tokens * num_q_heads;
-    int k_array_size = kProjSize * num_tokens * num_kv_heads;
+    bool is_root,
+    int hidden_size) {
+  CUDA_KERNEL_LOOP(i, num_tokens * hidden_size * 2) {
+    int token_idx = i / (hidden_size * KV_WEIGHT_NUM);
+    int offset = i % hidden_size;
 
-    bool k_cache = i < k_array_size;
-    int real_i = k_cache ? i : i - k_array_size;
+    size_t val_idx =
+        token_idx * QKV_WEIGHT_NUM * hidden_size + hidden_size + offset;
 
-    int proj_size = k_cache ? kProjSize : vProjSize;
-    int head_idx = real_i / (num_tokens * proj_size);
-    int token_idx = (real_i - head_idx * (num_tokens * proj_size)) / proj_size;
-    int data_idx = real_i % proj_size;
+    DT kVal = devQKVProjArray[val_idx];
+    DT vVal = devQKVProjArray[val_idx + hidden_size];
 
     // above no need to be changed
     // int const req_id = id_map[token_idx].request_index;
@@ -68,10 +65,6 @@ __global__ void spec_store_kv_cache(
     // int const beam_depth = id_map[token_idx].beam_depth;
     // int const beam_width = id_map[token_idx].beam_width;
 
-    DT val = devQKVProjArray[q_array_size + (k_cache ? 0 : k_array_size) +
-                             head_idx * proj_size * num_tokens +
-                             token_idx * proj_size + data_idx];
-
     int const req_id = tokenInfos[token_idx].request_index;
     int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
     int const sub_req_id = beamTokenInfos[token_idx].sub_request_index;
@@ -79,22 +72,20 @@ __global__ void spec_store_kv_cache(
     int const beam_depth = beamRequestInfos[req_id].current_depth;
     int const beam_width = beamRequestInfos[req_id].beam_size;
 
-    // new token
-    int new_token_cache_idx = (req_id * max_beam_width + sub_req_id) *
-                                  (num_kv_heads * max_seq_len * proj_size) +
-                              head_idx * (max_seq_len * proj_size) +
-                              tok_id * proj_size + data_idx;
-
-    DT *cache_ptr = k_cache ? kCache_ptr : vCache_ptr;
-    cache_ptr[new_token_cache_idx] = val;
+    kCache_ptr[(req_id * max_beam_width + sub_req_id) *
+                   (hidden_size * max_seq_len) +
+               tok_id * hidden_size + offset] = kVal;
+    vCache_ptr[(req_id * max_beam_width + sub_req_id) *
+                   (hidden_size * max_seq_len) +
+               tok_id * hidden_size + offset] = vVal;
 
     // replica in the root iteration
     if (beam_depth == 1) {
       for (int i = 1; i < beam_width; i++) {
-        cache_ptr[(req_id * max_beam_width + i) *
-                      (num_kv_heads * max_seq_len * proj_size) +
-                  head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
-                  data_idx] = val;
+        kCache_ptr[(req_id * max_beam_width + i) * (hidden_size * max_seq_len) +
+                   tok_id * hidden_size + offset] = kVal;
+        vCache_ptr[(req_id * max_beam_width + i) * (hidden_size * max_seq_len) +
+                   tok_id * hidden_size + offset] = vVal;
       }
     }
 
@@ -119,7 +110,7 @@ __global__ void spec_store_kv_cache(
 
     // naive cache stealing
     if (sub_req_id != parent_id) {
-      if (data_idx == 0 && head_idx == 0 && k_cache) {
+      if (offset == 0 && tok_id == 0) {
         printf("cache stealing!, depth %d req_id %d sub_req_id %d, parentid "
                "%d, tok_id %d\n",
                beam_depth,
@@ -132,14 +123,13 @@ __global__ void spec_store_kv_cache(
       for (int depth = 0; depth < beam_depth; depth++) {
         int steal_token_idx = tok_id - beam_depth + depth;
         int steal_from_idx = (req_id * max_beam_width + parent_id) *
-                                 (num_kv_heads * max_seq_len * proj_size) +
-                             head_idx * (max_seq_len * proj_size) +
-                             steal_token_idx * proj_size + data_idx;
+                                 (hidden_size * max_seq_len) +
+                             steal_token_idx * hidden_size + offset;
         int steal_to_idx = (req_id * max_beam_width + sub_req_id) *
-                               (num_kv_heads * max_seq_len * proj_size) +
-                           head_idx * (max_seq_len * proj_size) +
-                           steal_token_idx * proj_size + data_idx;
-        cache_ptr[steal_to_idx] = cache_ptr[steal_from_idx];
+                               (hidden_size * max_seq_len) +
+                           steal_token_idx * hidden_size + offset;
+        kCache_ptr[steal_to_idx] = kCache_ptr[steal_from_idx];
+        vCache_ptr[steal_to_idx] = vCache_ptr[steal_from_idx];
 
         //   if(data_idx == 0 && head_idx == 0 && k_cache && req_id == 1){
         //     printf("cache stealing kernel!, steal_token_idx %d\n",
@@ -173,8 +163,7 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   // printf("curr depth: %d\n", curr_depth);
   // assert(curr_depth < 3);
   if (num_tokens > 0) {
-    int parallelism =
-        (m->kProjSize + m->vProjSize) * num_tokens * m->num_kv_heads;
+    int parallelism = m->hidden_size * KV_WEIGHT_NUM * num_tokens;
     spec_store_kv_cache<<<GET_BLOCKS(parallelism),
                           min(CUDA_NUM_THREADS, parallelism),
                           0,
@@ -189,11 +178,10 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                                     m->kProjSize,
                                     m->vProjSize,
                                     num_tokens,
-                                    m->num_q_heads,
-                                    m->num_kv_heads,
                                     BatchConfig::max_sequence_length(),
                                     BeamSearchBatchConfig::MAX_BEAM_WIDTH,
-                                    /*root*/ curr_depth == 0);
+                                    /*root*/ curr_depth == 0,
+                                    m->hidden_size);
   }
 }
 
@@ -239,12 +227,14 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   int tokens_prev_requests_squares = 0;
   // int qkv_block_size =
   //     (m->qProjSize + m->kProjSize + m->vProjSize) * num_tokens;
-  int q_block_size = m->qProjSize * num_tokens;
-
-  int kt_block_size = m->kProjSize * BatchConfig::max_sequence_length();
-  int kt_req_block_size = kt_block_size * m->num_kv_heads;
-  int vt_block_size = m->vProjSize * BatchConfig::max_sequence_length();
-  int vt_req_block_size = vt_block_size * m->num_kv_heads;
+  int q_block_size = m->qProjSize;
+
+  int kt_block_size = m->kProjSize;
+  int kt_req_block_size =
+      kt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+  int vt_block_size = m->vProjSize;
+  int vt_req_block_size =
+      vt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
@@ -269,7 +259,8 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       int m_ = num_new_tokens;
       int n = total_tokens;
       int k = m->qProjSize;
-      int lda = k, ldb = k, ldc = m_;
+      int lda = k * m->num_q_heads * QKV_WEIGHT_NUM, ldb = k * m->num_q_heads,
+          ldc = m_;
       int strideA = q_block_size;
       int strideB = kt_block_size;
       int strideC = num_new_tokens * total_tokens;
@@ -281,7 +272,8 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       }
       // To get A, skip over Q entries from previous requests (same head)
       DT const *A = static_cast<DT *>(m->devQKVProjArray) +
-                    tokens_previous_requests * m->qProjSize;
+                    tokens_previous_requests * m->qProjSize * m->num_q_heads *
+                        QKV_WEIGHT_NUM;
       // To get B, skip over K entries from previous requests (all heads +
       // padding)
       DT const *B = static_cast<DT *>(m->keyCache) +
@@ -295,65 +287,29 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       // To get C, skip over QK^T products from previous requests
       DT *C = static_cast<DT *>(m->qk_prods) +
               m->num_q_heads * tokens_prev_requests_squares;
-
-      if (m->num_q_heads == m->num_kv_heads) {
-        checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                             CUBLAS_OP_T,
-                                             CUBLAS_OP_N,
-                                             m_,
-                                             n,
-                                             k,
-                                             &alpha,
-                                             A,
-                                             cublas_data_type,
-                                             lda,
-                                             strideA,
-                                             B,
-                                             cublas_data_type,
-                                             ldb,
-                                             strideB,
-                                             &beta,
-                                             C,
-                                             cublas_data_type,
-                                             ldc,
-                                             strideC,
-                                             m->num_q_heads,
-                                             compute_type,
-                                             CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-      } else {
-        strideB = 0;
-        int one_step_heads = m->num_q_heads / m->num_kv_heads;
-        m_ = num_new_tokens;
-        n = total_tokens;
-        k = m->qProjSize;
-        lda = k, ldb = k, ldc = m_;
-        for (int step = 0; step < m->num_kv_heads; step++) {
-          checkCUDA(
-              cublasGemmStridedBatchedEx(m->handle.blas,
-                                         CUBLAS_OP_T,
-                                         CUBLAS_OP_N,
-                                         m_,
-                                         n,
-                                         k,
-                                         &alpha,
-                                         A + step * strideA * one_step_heads,
-                                         cublas_data_type,
-                                         lda,
-                                         strideA,
-                                         B + step * kt_block_size,
-                                         cublas_data_type,
-                                         ldb,
-                                         strideB,
-                                         &beta,
-                                         C + step * strideC * one_step_heads,
-                                         cublas_data_type,
-                                         ldc,
-                                         strideC,
-                                         one_step_heads,
-                                         compute_type,
-                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-        }
-      }
+      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                           CUBLAS_OP_T,
+                                           CUBLAS_OP_N,
+                                           m_,
+                                           n,
+                                           k,
+                                           &alpha,
+                                           A,
+                                           cublas_data_type,
+                                           lda,
+                                           strideA,
+                                           B,
+                                           cublas_data_type,
+                                           ldb,
+                                           strideB,
+                                           &beta,
+                                           C,
+                                           cublas_data_type,
+                                           ldc,
+                                           strideC,
+                                           m->num_q_heads,
+                                           compute_type,
+                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
       // add alibi position bias to qk production
       // add alibi position bias to qk production
       if (*m->position_bias) {
@@ -426,7 +382,7 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       m_ = num_new_tokens;
       n = m->vProjSize;
       k = total_tokens;
-      lda = m_, ldb = n, ldc = m_;
+      lda = m_, ldb = n * m->num_q_heads, ldc = m_;
       strideA = num_new_tokens * total_tokens;
       strideB = vt_block_size;
       strideC = num_new_tokens * m->vProjSize;
@@ -441,65 +397,29 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       // requests
       C = static_cast<DT *>(m->attn_heads) +
           tokens_previous_requests * m->num_q_heads * m->vProjSize;
-
-      if (m->num_q_heads == m->num_kv_heads) {
-        checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                             CUBLAS_OP_N,
-                                             CUBLAS_OP_T,
-                                             m_,
-                                             n,
-                                             k,
-                                             &alpha,
-                                             A,
-                                             cublas_data_type,
-                                             lda,
-                                             strideA,
-                                             B,
-                                             cublas_data_type,
-                                             ldb,
-                                             strideB,
-                                             &beta,
-                                             C,
-                                             cublas_data_type,
-                                             ldc,
-                                             strideC,
-                                             m->num_q_heads,
-                                             compute_type,
-                                             CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-      } else {
-        int one_step_heads = m->num_q_heads / m->num_kv_heads;
-        n = m->vProjSize;
-        lda = m_, ldb = n, ldc = m_;
-        strideA = num_new_tokens * total_tokens;
-        strideB = 0;
-        strideC = num_new_tokens * m->vProjSize;
-        for (int step = 0; step < m->num_kv_heads; step++) {
-          checkCUDA(
-              cublasGemmStridedBatchedEx(m->handle.blas,
-                                         CUBLAS_OP_N,
-                                         CUBLAS_OP_T,
-                                         m_,
-                                         n,
-                                         k,
-                                         &alpha,
-                                         A + step * one_step_heads * strideA,
-                                         cublas_data_type,
-                                         lda,
-                                         strideA,
-                                         B + step * vt_block_size,
-                                         cublas_data_type,
-                                         ldb,
-                                         strideB,
-                                         &beta,
-                                         C + step * one_step_heads,
-                                         cublas_data_type,
-                                         ldc,
-                                         strideC,
-                                         one_step_heads,
-                                         compute_type,
-                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-        }
-      }
+      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                           CUBLAS_OP_N,
+                                           CUBLAS_OP_T,
+                                           m_,
+                                           n,
+                                           k,
+                                           &alpha,
+                                           A,
+                                           cublas_data_type,
+                                           lda,
+                                           strideA,
+                                           B,
+                                           cublas_data_type,
+                                           ldb,
+                                           strideB,
+                                           &beta,
+                                           C,
+                                           cublas_data_type,
+                                           ldc,
+                                           strideC,
+                                           m->num_q_heads,
+                                           compute_type,
+                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
 
       // Project to output, save result directly on output tensor
       alpha = 1.0f, beta = 0.0f;
@@ -508,8 +428,8 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       n = num_new_tokens;
       lda = k, ldb = n, ldc = m_;
       A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
-                                   m->kProjSize * m->num_kv_heads +
-                                   m->vProjSize * m->num_kv_heads);
+                                   m->kProjSize * m->num_q_heads +
+                                   m->vProjSize * m->num_q_heads);
       B = C;
       C = static_cast<DT *>(output_ptr) +
           tokens_previous_requests * m->oProjSize;
@@ -540,8 +460,8 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   if (*m->final_bias && shard_id == 0) {
     int parallelism = m->oProjSize * num_tokens;
     int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
-                          m->kProjSize * m->global_num_kv_heads +
-                          m->vProjSize * m->global_num_kv_heads;
+                          m->kProjSize * m->global_num_q_heads +
+                          m->vProjSize * m->global_num_q_heads;
     apply_proj_bias_w<<<GET_BLOCKS(parallelism),
                         min(CUDA_NUM_THREADS, parallelism),
                         0,
diff --git a/src/ops/tree_inc_multihead_self_attention.cc b/src/ops/tree_inc_multihead_self_attention.cc
index 6b520aa37b..d5a8a1063d 100644
--- a/src/ops/tree_inc_multihead_self_attention.cc
+++ b/src/ops/tree_inc_multihead_self_attention.cc
@@ -157,8 +157,8 @@ Tensor FFModel::inc_multiquery_self_attention_verify(
   int vParas = vProjSize * vSize;
   int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
   int one_head_size = qParas + kParas + vParas + oParas;
-  int weight_size = qParas * num_q_heads + kParas * num_kv_heads +
-                    vParas * num_kv_heads + oParas * num_q_heads;
+  int weight_size = qParas * num_q_heads + kParas * num_q_heads +
+                    vParas * num_q_heads + oParas * num_q_heads;
   {
     // compress the weight size if quantization.
     if (quantization_type != DT_NONE) {
@@ -179,7 +179,7 @@ Tensor FFModel::inc_multiquery_self_attention_verify(
   if (qkv_bias || final_bias) {
     // q, k, v, o
     int qkv_bias_size =
-        qProjSize * num_q_heads + (kProjSize + vProjSize) * num_kv_heads;
+        qProjSize * num_q_heads + (kProjSize + vProjSize) * num_q_heads;
     int dims[1] = {(qkv_bias ? qkv_bias_size : 0) +
                    (final_bias ? oProjSize : 0)};
     li->weights[1] = create_weight_legion_ordering(1,
@@ -346,7 +346,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
     dims[1].size = this->num_q_heads * (qParas + oParas) +
-                   this->num_kv_heads * (kParas + vParas);
+                   this->num_q_heads * (kParas + vParas);
     dims[1].is_replica_dim = false;
     // dims[2].size = qParas + kParas + vParas + oParas;
     if (quantization_type != DT_NONE) {
@@ -367,7 +367,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     if (qkv_bias || final_bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
       int qkv_bias_size =
-          qProjSize * num_q_heads + (kProjSize + vProjSize) * num_kv_heads;
+          qProjSize * num_q_heads + (kProjSize + vProjSize) * num_q_heads;
       bias_shape.dims[0].size =
           (qkv_bias ? qkv_bias_size : 0) + (final_bias ? oProjSize : 0);
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
@@ -461,7 +461,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     dims[0].size = dims[0].degree;
     dims[1] = inputs[0]->dims[num_dims - 1];
     dims[1].size = this->num_q_heads * (qParas + oParas) +
-                   this->num_kv_heads * (kParas + vParas);
+                   this->num_q_heads * (kParas + vParas);
     dims[1].is_replica_dim = false;
     // dims[2].size = qParas + kParas + vParas + oParas;
     if (quantization_type != DT_NONE) {
@@ -480,7 +480,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
     if (qkv_bias || final_bias) {
       ParallelTensorShape bias_shape = _input->get_shape();
       int qkv_bias_size =
-          qProjSize * num_q_heads + (kProjSize + vProjSize) * num_kv_heads;
+          qProjSize * num_q_heads + (kProjSize + vProjSize) * num_q_heads;
       bias_shape.dims[0].size =
           (qkv_bias ? qkv_bias_size : 0) + (final_bias ? oProjSize : 0);
       bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
diff --git a/src/ops/tree_inc_multihead_self_attention.cpp b/src/ops/tree_inc_multihead_self_attention.cpp
index c10cf9d0ca..1d9ebf67e0 100644
--- a/src/ops/tree_inc_multihead_self_attention.cpp
+++ b/src/ops/tree_inc_multihead_self_attention.cpp
@@ -42,40 +42,29 @@ __global__ void commit_tokens_kernel(
     int vProjSize,
     int num_tokens_to_commit,
     int num_active_tokens_in_last_batch,
-    int num_q_heads,
-    int num_kv_heads,
-    int max_seq_len) {
-
-  CUDA_KERNEL_LOOP(
-      i, num_tokens_to_commit * (kProjSize + vProjSize) * num_kv_heads) {
-    bool k_cache = i < (num_tokens_to_commit * kProjSize * num_kv_heads);
-    int real_i =
-        k_cache ? i : i - (num_tokens_to_commit * kProjSize * num_kv_heads);
-
-    int proj_size = k_cache ? kProjSize : vProjSize;
-    int data_idx = real_i % proj_size;
-    int head_idx = real_i / (num_tokens_to_commit * proj_size);
-    int token_pos =
-        (real_i - head_idx * (num_tokens_to_commit * proj_size)) / proj_size;
+    int max_seq_len,
+    int hidden_size) {
+
+  CUDA_KERNEL_LOOP(i, num_tokens_to_commit * hidden_size * 2) {
+
+    int token_pos = i / (hidden_size * KV_WEIGHT_NUM);
     int token_idx_in_last_batch = committedTokenInfos[token_pos].token_index;
+    int offset = i % hidden_size;
     assert(token_idx_in_last_batch < num_active_tokens_in_last_batch);
 
-    int q_array_size =
-        qProjSize * num_active_tokens_in_last_batch * num_q_heads;
-    int k_array_size =
-        kProjSize * num_active_tokens_in_last_batch * num_kv_heads;
+    size_t val_idx =
+        token_idx_in_last_batch * 3 * hidden_size + hidden_size + offset;
+
+    DT kVal = devQKVProjArray[val_idx];
+    DT vVal = devQKVProjArray[val_idx + hidden_size];
 
-    DT val =
-        devQKVProjArray[q_array_size + (k_cache ? 0 : k_array_size) +
-                        head_idx * proj_size * num_active_tokens_in_last_batch +
-                        token_idx_in_last_batch * proj_size + data_idx];
     int const req_id = committedTokenInfos[token_pos].request_index;
     int const tok_id = committedTokenInfos[token_pos].token_depth;
 
-    DT *cache_ptr = k_cache ? kCache_ptr : vCache_ptr;
-    cache_ptr[req_id * (num_kv_heads * max_seq_len * proj_size) +
-              head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
-              data_idx] = val;
+    kCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
+               offset] = kVal;
+    vCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
+               offset] = vVal;
   }
 }
 
@@ -85,8 +74,7 @@ void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
                    hipStream_t stream) {
   int num_tokens_to_commit = bc->num_tokens_to_commit;
   if (num_tokens_to_commit > 0) {
-    int parallelism =
-        (m->kProjSize + m->vProjSize) * num_tokens_to_commit * m->num_kv_heads;
+    int parallelism = m->hidden_size * KV_WEIGHT_NUM * num_tokens_to_commit;
     hipLaunchKernelGGL(
         HIP_KERNEL_NAME(commit_tokens_kernel<DT>),
         GET_BLOCKS(parallelism),
@@ -102,9 +90,8 @@ void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
         m->vProjSize,
         num_tokens_to_commit,
         m->num_active_tokens, // number of active tokens in previous batch
-        m->num_q_heads,
-        m->num_kv_heads,
-        BatchConfig::max_sequence_length());
+        BatchConfig::max_sequence_length(),
+        m->hidden_size);
   }
 }
 
@@ -120,37 +107,23 @@ __global__ void update_tree_branch_kv_cache(
     int num_tokens_in_branch,
     int processed_tokens_in_batch,
     int total_tokens_in_batch,
-    int num_q_heads,
-    int num_kv_heads,
-    int max_seq_len) {
-  CUDA_KERNEL_LOOP(
-      i, num_tokens_in_branch * (kProjSize + vProjSize) * num_kv_heads) {
-
-    int q_array_size = qProjSize * total_tokens_in_batch * num_q_heads;
-    int k_array_size = kProjSize * total_tokens_in_batch * num_kv_heads;
-
-    bool k_cache = i < (num_tokens_in_branch * kProjSize * num_kv_heads);
-    int real_i =
-        k_cache ? i : i - (num_tokens_in_branch * kProjSize * num_kv_heads);
-
-    int proj_size = k_cache ? kProjSize : vProjSize;
-    int data_idx = real_i % proj_size;
-    int token_idx =
-        (real_i / proj_size) % num_tokens_in_branch; // index in the tree branch
-    int head_idx = real_i / (proj_size * num_tokens_in_branch);
+    int max_seq_len,
+    int hidden_size) {
+  CUDA_KERNEL_LOOP(i, num_tokens_in_branch * hidden_size * 2) {
+    int token_idx = i / (hidden_size * KV_WEIGHT_NUM);
+    int offset = i % hidden_size;
 
     token_idx += processed_tokens_in_batch; // get index in the whole batch
-    DT val = devQKVProjArray[q_array_size + (k_cache ? 0 : k_array_size) +
-                             head_idx * proj_size * total_tokens_in_batch +
-                             token_idx * proj_size + data_idx];
+    size_t val_idx = token_idx * 3 * hidden_size + hidden_size + offset;
+    DT kVal = devQKVProjArray[val_idx];
+    DT vVal = devQKVProjArray[val_idx + hidden_size];
 
     int const req_id = tokenInfos[token_idx].request_index;
     int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
-    DT *cache_ptr = k_cache ? kCache_ptr : vCache_ptr;
-
-    cache_ptr[req_id * (num_kv_heads * max_seq_len * proj_size) +
-              head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
-              data_idx] = val;
+    kCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
+               offset] = kVal;
+    vCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
+               offset] = vVal;
   }
 }
 
@@ -194,11 +167,13 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
   int processed_tokens_in_batch = 0;
   // int qkv_block_size =
   //     (m->qProjSize + m->kProjSize + m->vProjSize) * bc->num_active_tokens();
-  int q_block_size = m->qProjSize * bc->num_active_tokens();
-  int kt_block_size = m->kProjSize * BatchConfig::max_sequence_length();
-  int kt_req_block_size = kt_block_size * m->num_kv_heads;
-  int vt_block_size = m->vProjSize * BatchConfig::max_sequence_length();
-  int vt_req_block_size = vt_block_size * m->num_kv_heads;
+  int q_block_size = m->qProjSize;
+  int kt_block_size = m->kProjSize;
+  int kt_req_block_size =
+      kt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+  int vt_block_size = m->vProjSize;
+  int vt_req_block_size =
+      vt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
@@ -221,8 +196,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       assert(num_new_tokens >= 1 && total_tokens_in_request >= num_new_tokens);
       {
         // update K-V cache
-        int parallelism =
-            (m->kProjSize + m->vProjSize) * num_new_tokens * m->num_kv_heads;
+        int parallelism = m->hidden_size * KV_WEIGHT_NUM * num_new_tokens;
         hipLaunchKernelGGL(
             HIP_KERNEL_NAME(update_tree_branch_kv_cache<DT>),
             GET_BLOCKS(parallelism),
@@ -239,9 +213,8 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
             num_new_tokens,            // num_tokens_in_branch
             processed_tokens_in_batch, // num_processed_tokens_in_batch
             m->num_active_tokens,      // total_tokens_in_batch
-            m->num_q_heads,
-            m->num_kv_heads,
-            BatchConfig::max_sequence_length());
+            BatchConfig::max_sequence_length(),
+            m->hidden_size);
       }
 
       // bc->token_last_available_idx[i] + 1;
@@ -249,7 +222,8 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       int m_ = num_new_tokens;
       int n = total_tokens_in_request;
       int k = m->qProjSize;
-      int lda = k, ldb = k, ldc = m_;
+      int lda = k * m->num_q_heads * QKV_WEIGHT_NUM, ldb = k * m->num_q_heads,
+          ldc = m_;
       int strideA = q_block_size;
       int strideB = kt_block_size;
       int strideC = num_new_tokens * total_tokens_in_request;
@@ -261,67 +235,38 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       }
       // To get A, skip over Q entries from previous requests (same head)
       DT const *A = static_cast<DT *>(m->devQKVProjArray) +
-                    processed_tokens_in_batch * m->qProjSize;
+                    processed_tokens_in_batch * m->qProjSize * m->num_q_heads *
+                        QKV_WEIGHT_NUM;
       // To get B, skip over K entries from previous requests (all heads +
       // padding)
       DT const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
       // To get C, skip over QK^T products from previous requests
       DT *C = static_cast<DT *>(m->qk_prods);
 
-      if (m->num_q_heads == m->num_kv_heads) {
-        checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
-                                              HIPBLAS_OP_T,
-                                              HIPBLAS_OP_N,
-                                              m_,
-                                              n,
-                                              k,
-                                              &alpha,
-                                              A,
-                                              hipblas_data_type,
-                                              lda,
-                                              strideA,
-                                              B,
-                                              hipblas_data_type,
-                                              ldb,
-                                              strideB,
-                                              &beta,
-                                              C,
-                                              hipblas_data_type,
-                                              ldc,
-                                              strideC,
-                                              m->num_q_heads,
-                                              compute_type,
-                                              HIPBLAS_GEMM_DEFAULT));
-      } else {
-        strideB = 0;
-        int one_step_heads = m->num_q_heads / m->num_kv_heads;
-        for (int step = 0; step < m->num_kv_heads; step++) {
-          checkCUDA(
-              hipblasGemmStridedBatchedEx(m->handle.blas,
-                                          HIPBLAS_OP_T,
-                                          HIPBLAS_OP_N,
-                                          m_,
-                                          n,
-                                          k,
-                                          &alpha,
-                                          A + step * strideA * one_step_heads,
-                                          hipblas_data_type,
-                                          lda,
-                                          strideA,
-                                          B + step * kt_block_size,
-                                          hipblas_data_type,
-                                          ldb,
-                                          strideB,
-                                          &beta,
-                                          C + step * strideC * one_step_heads,
-                                          hipblas_data_type,
-                                          ldc,
-                                          strideC,
-                                          one_step_heads,
-                                          compute_type,
-                                          HIPBLAS_GEMM_DEFAULT));
-        }
-      }
+      checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
+                                            HIPBLAS_OP_T,
+                                            HIPBLAS_OP_N,
+                                            m_,
+                                            n,
+                                            k,
+                                            &alpha,
+                                            A,
+                                            hipblas_data_type,
+                                            lda,
+                                            strideA,
+                                            B,
+                                            hipblas_data_type,
+                                            ldb,
+                                            strideB,
+                                            &beta,
+                                            C,
+                                            hipblas_data_type,
+                                            ldc,
+                                            strideC,
+                                            m->num_q_heads,
+                                            compute_type,
+                                            HIPBLAS_GEMM_DEFAULT));
+
       if (*m->position_bias) {
         size_t parallelism =
             m->num_q_heads * total_tokens_in_request * num_new_tokens;
@@ -392,7 +337,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       m_ = num_new_tokens;
       n = m->vProjSize;
       k = total_tokens_in_request;
-      lda = m_, ldb = n, ldc = m_;
+      lda = m_, ldb = n * m->num_q_heads, ldc = m_;
       strideA = num_new_tokens * total_tokens_in_request;
       strideB = vt_block_size;
       strideC = num_new_tokens * m->vProjSize;
@@ -407,60 +352,29 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       C = static_cast<DT *>(m->attn_heads) +
           processed_tokens_in_batch * m->num_q_heads * m->vProjSize;
 
-      if (m->num_q_heads == m->num_kv_heads) {
-        checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
-                                              HIPBLAS_OP_N,
-                                              HIPBLAS_OP_T,
-                                              m_,
-                                              n,
-                                              k,
-                                              &alpha,
-                                              A,
-                                              hipblas_data_type,
-                                              lda,
-                                              strideA,
-                                              B,
-                                              hipblas_data_type,
-                                              ldb,
-                                              strideB,
-                                              &beta,
-                                              C,
-                                              hipblas_data_type,
-                                              ldc,
-                                              strideC,
-                                              m->num_q_heads,
-                                              compute_type,
-                                              HIPBLAS_GEMM_DEFAULT));
-      } else {
-        int one_step_heads = m->num_q_heads / m->num_kv_heads;
-        strideB = 0;
-        for (int step = 0; step < m->num_kv_heads; step++) {
-          checkCUDA(
-              hipblasGemmStridedBatchedEx(m->handle.blas,
-                                          HIPBLAS_OP_N,
-                                          HIPBLAS_OP_T,
-                                          m_,
-                                          n,
-                                          k,
-                                          &alpha,
-                                          A + step * one_step_heads * strideA,
-                                          hipblas_data_type,
-                                          lda,
-                                          strideA,
-                                          B + step * vt_block_size,
-                                          hipblas_data_type,
-                                          ldb,
-                                          strideB,
-                                          &beta,
-                                          C + step * one_step_heads * strideC,
-                                          hipblas_data_type,
-                                          ldc,
-                                          strideC,
-                                          one_step_heads,
-                                          compute_type,
-                                          HIPBLAS_GEMM_DEFAULT));
-        }
-      }
+      checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
+                                            HIPBLAS_OP_N,
+                                            HIPBLAS_OP_T,
+                                            m_,
+                                            n,
+                                            k,
+                                            &alpha,
+                                            A,
+                                            hipblas_data_type,
+                                            lda,
+                                            strideA,
+                                            B,
+                                            hipblas_data_type,
+                                            ldb,
+                                            strideB,
+                                            &beta,
+                                            C,
+                                            hipblas_data_type,
+                                            ldc,
+                                            strideC,
+                                            m->num_q_heads,
+                                            compute_type,
+                                            HIPBLAS_GEMM_DEFAULT));
 
       // Project to output, save result directly on output tensor
       alpha = 1.0f, beta = 0.0f;
@@ -469,8 +383,8 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       n = num_new_tokens;
       lda = k, ldb = n, ldc = m_;
       A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
-                                   m->kProjSize * m->num_kv_heads +
-                                   m->vProjSize * m->num_kv_heads);
+                                   m->kProjSize * m->num_q_heads +
+                                   m->vProjSize * m->num_q_heads);
       B = C;
       C = static_cast<DT *>(output_ptr) +
           processed_tokens_in_batch * m->oProjSize;
@@ -503,8 +417,8 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
   if (*m->final_bias && shard_id == 0) {
     int parallelism = m->oProjSize * processed_tokens_in_batch;
     int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
-                          m->kProjSize * m->global_num_kv_heads +
-                          m->vProjSize * m->global_num_kv_heads;
+                          m->kProjSize * m->global_num_q_heads +
+                          m->vProjSize * m->global_num_q_heads;
     hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_proj_bias_w<DT>),
                        GET_BLOCKS(parallelism),
                        min(CUDA_NUM_THREADS, parallelism),
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index 5901c0e3ab..0da432b732 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -42,40 +42,29 @@ __global__ void commit_tokens_kernel(
     int vProjSize,
     int num_tokens_to_commit,
     int num_active_tokens_in_last_batch,
-    int num_q_heads,
-    int num_kv_heads,
-    int max_seq_len) {
-
-  CUDA_KERNEL_LOOP(
-      i, num_tokens_to_commit * (kProjSize + vProjSize) * num_kv_heads) {
-    bool k_cache = i < (num_tokens_to_commit * kProjSize * num_kv_heads);
-    int real_i =
-        k_cache ? i : i - (num_tokens_to_commit * kProjSize * num_kv_heads);
-
-    int proj_size = k_cache ? kProjSize : vProjSize;
-    int data_idx = real_i % proj_size;
-    int head_idx = real_i / (num_tokens_to_commit * proj_size);
-    int token_pos =
-        (real_i - head_idx * (num_tokens_to_commit * proj_size)) / proj_size;
+    int max_seq_len,
+    int hidden_size) {
+
+  CUDA_KERNEL_LOOP(i, num_tokens_to_commit * hidden_size * 2) {
+
+    int token_pos = i / (hidden_size * KV_WEIGHT_NUM);
     int token_idx_in_last_batch = committedTokenInfos[token_pos].token_index;
+    int offset = i % hidden_size;
     assert(token_idx_in_last_batch < num_active_tokens_in_last_batch);
 
-    int q_array_size =
-        qProjSize * num_active_tokens_in_last_batch * num_q_heads;
-    int k_array_size =
-        kProjSize * num_active_tokens_in_last_batch * num_kv_heads;
+    size_t val_idx = token_idx_in_last_batch * QKV_WEIGHT_NUM * hidden_size +
+                     hidden_size + offset;
+
+    DT kVal = devQKVProjArray[val_idx];
+    DT vVal = devQKVProjArray[val_idx + hidden_size];
 
-    DT val =
-        devQKVProjArray[q_array_size + (k_cache ? 0 : k_array_size) +
-                        head_idx * proj_size * num_active_tokens_in_last_batch +
-                        token_idx_in_last_batch * proj_size + data_idx];
     int const req_id = committedTokenInfos[token_pos].request_index;
     int const tok_id = committedTokenInfos[token_pos].token_depth;
 
-    DT *cache_ptr = k_cache ? kCache_ptr : vCache_ptr;
-    cache_ptr[req_id * (num_kv_heads * max_seq_len * proj_size) +
-              head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
-              data_idx] = val;
+    kCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
+               offset] = kVal;
+    vCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
+               offset] = vVal;
   }
 }
 
@@ -85,8 +74,7 @@ void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
                    cudaStream_t stream) {
   int num_tokens_to_commit = bc->num_tokens_to_commit;
   if (num_tokens_to_commit > 0) {
-    int parallelism =
-        (m->kProjSize + m->vProjSize) * num_tokens_to_commit * m->num_kv_heads;
+    int parallelism = m->hidden_size * KV_WEIGHT_NUM * num_tokens_to_commit;
     commit_tokens_kernel<<<GET_BLOCKS(parallelism),
                            min(CUDA_NUM_THREADS, parallelism),
                            0,
@@ -100,9 +88,8 @@ void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
         m->vProjSize,
         num_tokens_to_commit,
         m->num_active_tokens, // number of active tokens in previous batch
-        m->num_q_heads,
-        m->num_kv_heads,
-        BatchConfig::max_sequence_length());
+        BatchConfig::max_sequence_length(),
+        m->hidden_size);
   }
 }
 
@@ -118,37 +105,26 @@ __global__ void update_tree_branch_kv_cache(
     int num_tokens_in_branch,
     int processed_tokens_in_batch,
     int total_tokens_in_batch,
-    int num_q_heads,
-    int num_kv_heads,
-    int max_seq_len) {
-  CUDA_KERNEL_LOOP(
-      i, num_tokens_in_branch * (kProjSize + vProjSize) * num_kv_heads) {
-
-    int q_array_size = qProjSize * total_tokens_in_batch * num_q_heads;
-    int k_array_size = kProjSize * total_tokens_in_batch * num_kv_heads;
-
-    bool k_cache = i < (num_tokens_in_branch * kProjSize * num_kv_heads);
-    int real_i =
-        k_cache ? i : i - (num_tokens_in_branch * kProjSize * num_kv_heads);
+    int max_seq_len,
+    int hidden_size) {
+  CUDA_KERNEL_LOOP(i, num_tokens_in_branch * hidden_size * 2) {
 
-    int proj_size = k_cache ? kProjSize : vProjSize;
-    int data_idx = real_i % proj_size;
-    int token_idx =
-        (real_i / proj_size) % num_tokens_in_branch; // index in the tree branch
-    int head_idx = real_i / (proj_size * num_tokens_in_branch);
+    int token_idx = i / (hidden_size * KV_WEIGHT_NUM);
+    int offset = i % hidden_size;
 
     token_idx += processed_tokens_in_batch; // get index in the whole batch
-    DT val = devQKVProjArray[q_array_size + (k_cache ? 0 : k_array_size) +
-                             head_idx * proj_size * total_tokens_in_batch +
-                             token_idx * proj_size + data_idx];
+    size_t val_idx =
+        token_idx * QKV_WEIGHT_NUM * hidden_size + hidden_size + offset;
+
+    DT kVal = devQKVProjArray[val_idx];
+    DT vVal = devQKVProjArray[val_idx + hidden_size];
 
     int const req_id = tokenInfos[token_idx].request_index;
     int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
-    DT *cache_ptr = k_cache ? kCache_ptr : vCache_ptr;
-
-    cache_ptr[req_id * (num_kv_heads * max_seq_len * proj_size) +
-              head_idx * (max_seq_len * proj_size) + tok_id * proj_size +
-              data_idx] = val;
+    kCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
+               offset] = kVal;
+    vCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
+               offset] = vVal;
   }
 }
 
@@ -192,11 +168,13 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
   int processed_tokens_in_batch = 0;
   // int qkv_block_size =
   //     (m->qProjSize + m->kProjSize + m->vProjSize) * bc->num_active_tokens();
-  int q_block_size = m->qProjSize * bc->num_active_tokens();
-  int kt_block_size = m->kProjSize * BatchConfig::max_sequence_length();
-  int kt_req_block_size = kt_block_size * m->num_kv_heads;
-  int vt_block_size = m->vProjSize * BatchConfig::max_sequence_length();
-  int vt_req_block_size = vt_block_size * m->num_kv_heads;
+  int q_block_size = m->qProjSize;
+  int kt_block_size = m->kProjSize;
+  int kt_req_block_size =
+      kt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+  int vt_block_size = m->vProjSize;
+  int vt_req_block_size =
+      vt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
@@ -219,8 +197,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       assert(num_new_tokens >= 1 && total_tokens_in_request >= num_new_tokens);
       {
         // update K-V cache
-        int parallelism =
-            (m->kProjSize + m->vProjSize) * num_new_tokens * m->num_kv_heads;
+        int parallelism = m->hidden_size * KV_WEIGHT_NUM * num_new_tokens;
         update_tree_branch_kv_cache<<<GET_BLOCKS(parallelism),
                                       min(CUDA_NUM_THREADS, parallelism),
                                       0,
@@ -235,9 +212,8 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
             num_new_tokens,            // num_tokens_in_branch
             processed_tokens_in_batch, // num_processed_tokens_in_batch
             m->num_active_tokens,      // total_tokens_in_batch
-            m->num_q_heads,
-            m->num_kv_heads,
-            BatchConfig::max_sequence_length());
+            BatchConfig::max_sequence_length(),
+            m->hidden_size);
       }
 
       // bc->token_last_available_idx[i] + 1;
@@ -245,7 +221,8 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       int m_ = num_new_tokens;
       int n = total_tokens_in_request;
       int k = m->qProjSize;
-      int lda = k, ldb = k, ldc = m_;
+      int lda = k * m->num_q_heads * QKV_WEIGHT_NUM, ldb = k * m->num_q_heads,
+          ldc = m_;
       int strideA = q_block_size;
       int strideB = kt_block_size;
       int strideC = num_new_tokens * total_tokens_in_request;
@@ -257,67 +234,37 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       }
       // To get A, skip over Q entries from previous requests (same head)
       DT const *A = static_cast<DT *>(m->devQKVProjArray) +
-                    processed_tokens_in_batch * m->qProjSize;
+                    processed_tokens_in_batch * m->qProjSize * m->num_q_heads *
+                        QKV_WEIGHT_NUM;
       // To get B, skip over K entries from previous requests (all heads +
       // padding)
       DT const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
       // To get C, skip over QK^T products from previous requests
       DT *C = static_cast<DT *>(m->qk_prods);
 
-      if (m->num_q_heads == m->num_kv_heads) {
-        checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                             CUBLAS_OP_T,
-                                             CUBLAS_OP_N,
-                                             m_,
-                                             n,
-                                             k,
-                                             &alpha,
-                                             A,
-                                             cublas_data_type,
-                                             lda,
-                                             strideA,
-                                             B,
-                                             cublas_data_type,
-                                             ldb,
-                                             strideB,
-                                             &beta,
-                                             C,
-                                             cublas_data_type,
-                                             ldc,
-                                             strideC,
-                                             m->num_q_heads,
-                                             compute_type,
-                                             CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-      } else {
-        strideB = 0;
-        int one_step_heads = m->num_q_heads / m->num_kv_heads;
-        for (int step = 0; step < m->num_kv_heads; step++) {
-          checkCUDA(
-              cublasGemmStridedBatchedEx(m->handle.blas,
-                                         CUBLAS_OP_T,
-                                         CUBLAS_OP_N,
-                                         m_,
-                                         n,
-                                         k,
-                                         &alpha,
-                                         A + step * strideA * one_step_heads,
-                                         cublas_data_type,
-                                         lda,
-                                         strideA,
-                                         B + step * kt_block_size,
-                                         cublas_data_type,
-                                         ldb,
-                                         strideB,
-                                         &beta,
-                                         C + step * strideC * one_step_heads,
-                                         cublas_data_type,
-                                         ldc,
-                                         strideC,
-                                         one_step_heads,
-                                         compute_type,
-                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-        }
-      }
+      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                           CUBLAS_OP_T,
+                                           CUBLAS_OP_N,
+                                           m_,
+                                           n,
+                                           k,
+                                           &alpha,
+                                           A,
+                                           cublas_data_type,
+                                           lda,
+                                           strideA,
+                                           B,
+                                           cublas_data_type,
+                                           ldb,
+                                           strideB,
+                                           &beta,
+                                           C,
+                                           cublas_data_type,
+                                           ldc,
+                                           strideC,
+                                           m->num_q_heads,
+                                           compute_type,
+                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
       // add alibi position bias to qk production
       // add alibi position bias to qk production
       if (*m->position_bias) {
@@ -392,7 +339,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       m_ = num_new_tokens;
       n = m->vProjSize;
       k = total_tokens_in_request;
-      lda = m_, ldb = n, ldc = m_;
+      lda = m_, ldb = n * m->num_q_heads, ldc = m_;
       strideA = num_new_tokens * total_tokens_in_request;
       strideB = vt_block_size;
       strideC = num_new_tokens * m->vProjSize;
@@ -407,60 +354,29 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       C = static_cast<DT *>(m->attn_heads) +
           processed_tokens_in_batch * m->num_q_heads * m->vProjSize;
 
-      if (m->num_q_heads == m->num_kv_heads) {
-        checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                             CUBLAS_OP_N,
-                                             CUBLAS_OP_T,
-                                             m_,
-                                             n,
-                                             k,
-                                             &alpha,
-                                             A,
-                                             cublas_data_type,
-                                             lda,
-                                             strideA,
-                                             B,
-                                             cublas_data_type,
-                                             ldb,
-                                             strideB,
-                                             &beta,
-                                             C,
-                                             cublas_data_type,
-                                             ldc,
-                                             strideC,
-                                             m->num_q_heads,
-                                             compute_type,
-                                             CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-      } else {
-        int one_step_heads = m->num_q_heads / m->num_kv_heads;
-        strideB = 0;
-        for (int step = 0; step < m->num_kv_heads; step++) {
-          checkCUDA(
-              cublasGemmStridedBatchedEx(m->handle.blas,
-                                         CUBLAS_OP_N,
-                                         CUBLAS_OP_T,
-                                         m_,
-                                         n,
-                                         k,
-                                         &alpha,
-                                         A + step * one_step_heads * strideA,
-                                         cublas_data_type,
-                                         lda,
-                                         strideA,
-                                         B + step * vt_block_size,
-                                         cublas_data_type,
-                                         ldb,
-                                         strideB,
-                                         &beta,
-                                         C + step * one_step_heads * strideC,
-                                         cublas_data_type,
-                                         ldc,
-                                         strideC,
-                                         one_step_heads,
-                                         compute_type,
-                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-        }
-      }
+      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                           CUBLAS_OP_N,
+                                           CUBLAS_OP_T,
+                                           m_,
+                                           n,
+                                           k,
+                                           &alpha,
+                                           A,
+                                           cublas_data_type,
+                                           lda,
+                                           strideA,
+                                           B,
+                                           cublas_data_type,
+                                           ldb,
+                                           strideB,
+                                           &beta,
+                                           C,
+                                           cublas_data_type,
+                                           ldc,
+                                           strideC,
+                                           m->num_q_heads,
+                                           compute_type,
+                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
 
       // Project to output, save result directly on output tensor
       alpha = 1.0f, beta = 0.0f;
@@ -469,8 +385,8 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       n = num_new_tokens;
       lda = k, ldb = n, ldc = m_;
       A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
-                                   m->kProjSize * m->num_kv_heads +
-                                   m->vProjSize * m->num_kv_heads);
+                                   m->kProjSize * m->num_q_heads +
+                                   m->vProjSize * m->num_q_heads);
       B = C;
       C = static_cast<DT *>(output_ptr) +
           processed_tokens_in_batch * m->oProjSize;
@@ -503,8 +419,8 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
   if (*m->final_bias && shard_id == 0) {
     int parallelism = m->oProjSize * processed_tokens_in_batch;
     int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
-                          m->kProjSize * m->global_num_kv_heads +
-                          m->vProjSize * m->global_num_kv_heads;
+                          m->kProjSize * m->global_num_q_heads +
+                          m->vProjSize * m->global_num_q_heads;
     apply_proj_bias_w<<<GET_BLOCKS(parallelism),
                         min(CUDA_NUM_THREADS, parallelism),
                         0,
diff --git a/tests/inference/cpp_inference_tests.sh b/tests/inference/cpp_inference_tests.sh
index 8c8de22364..42a6db09d8 100755
--- a/tests/inference/cpp_inference_tests.sh
+++ b/tests/inference/cpp_inference_tests.sh
@@ -57,9 +57,9 @@ fi
 ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-6.7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_6B_half.txt -pipeline-parallelism-degree 4
 
 # Falcon (full precision)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model tiiuae/falcon-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_falcon_7B.txt -pipeline-parallelism-degree 4
+# ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model tiiuae/falcon-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_falcon_7B.txt -pipeline-parallelism-degree 4
 # Falcon (half precision)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model tiiuae/falcon-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_falcon_7B_half.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model tiiuae/falcon-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_falcon_7B.txt -pipeline-parallelism-degree 4
 
 # # StarCoder (full precision)
 # ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model bigcode/starcoderbase-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_starcoder_7B.txt -pipeline-parallelism-degree 4
diff --git a/tests/inference/python_inference_tests.sh b/tests/inference/python_inference_tests.sh
index 5cbcbc31f9..64c61ba0dc 100755
--- a/tests/inference/python_inference_tests.sh
+++ b/tests/inference/python_inference_tests.sh
@@ -192,4 +192,4 @@ diff <(tail -n +2 "../../inference/output/huggingface_opt_125M.txt") <(tail -n +
 diff <(tail -n +2 "../../inference/output/huggingface_opt_125M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_dec-python-opt-125m-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
 diff <(tail -n +2 "../../inference/output/huggingface_opt_6B.txt") <(tail -n +5 "../../inference/output/incr_dec-python-opt-6.7b-full_prec-1_tp_4_pp.txt")
 #diff <(tail -n +2 "../../inference/output/huggingface_opt_6B_half.txt") <(tail -n +5 "../../inference/output/incr_dec-python-opt-6.7b-half_prec-1_tp_4_pp.txt")
-diff <(tail -n +2 "../../inference/output/huggingface_falcon_7B.txt") <(tail -n +5 "../../inference/output/incr_dec-python-falcon-7b-full_prec-1_tp_4_pp.txt")
+diff <(tail -n +2 "../../inference/output/huggingface_falcon_7B.txt") <(tail -n +5 "../../inference/output/incr_dec-python-falcon-7b-half_prec-1_tp_4_pp.txt")
diff --git a/tests/inference/python_test_configs/generate_configs.py b/tests/inference/python_test_configs/generate_configs.py
index 609e15de49..8efe8999c4 100644
--- a/tests/inference/python_test_configs/generate_configs.py
+++ b/tests/inference/python_test_configs/generate_configs.py
@@ -73,11 +73,14 @@
             tp, pp = parallelism_degrees
 
             # Tensor parallelism not supported by small Falcon model atm
-            if tp > 1 and ("falcon" in model_name or "starcoder" in model_name):
+            if tp > 1 and ("falcon" in model_name):
                 continue
             # skip tp=4 for big models
             if tp > 2 and ("7b" in model_name or "6.7b" in model_name):
                 continue
+
+            if full_precision and ("falcon" in model_name or "starcoder" in model_name):
+                continue
             
             _, after_slash = model_name.rsplit("/", maxsplit=1)
             filename = "incr_dec-" + "python-" + after_slash + ("-full_prec-" if full_precision else "-half_prec-") + f"{tp}_tp_{pp}_pp"

From f243b40382304b618d9d2312ec94907eae4f4167 Mon Sep 17 00:00:00 2001
From: zwang86 <46699021+zwang86@users.noreply.github.com>
Date: Mon, 16 Oct 2023 13:42:48 -0400
Subject: [PATCH 250/344] Allow token arrangement align with request index in
 batch (#1176)

* arrange tokens by request index in incr decoding.

* fix logic.

* fix issues.

* format.

* undo output format change.

* format.

* remove empty line in end of the file.
---
 src/ops/fused.cu               |  10 +-
 src/runtime/request_manager.cc | 229 ++++++++++++++++-----------------
 2 files changed, 120 insertions(+), 119 deletions(-)

diff --git a/src/ops/fused.cu b/src/ops/fused.cu
index 7d0d5841f0..b157453035 100644
--- a/src/ops/fused.cu
+++ b/src/ops/fused.cu
@@ -1104,14 +1104,20 @@ __host__ void
       }
       for (int i = 0; i < fused->op_num_weights[op]; i++) {
         assert(fused->op_weight_source[i + woff] == SOURCE_WEIGHT);
-        weight_accessors_to_save.push_back(weight_accessor[fused->op_weight_idx[i + woff]]);
+        weight_accessors_to_save.push_back(
+            weight_accessor[fused->op_weight_idx[i + woff]]);
       }
       for (int i = 0; i < fused->op_num_outputs[op]; i++) {
         output_accessors_to_save.push_back(output_accessor[i + ooff]);
       }
       assert(task->index_point.get_dim() == 1);
       int shard_id = task->index_point.point_data[0];
-      FusedOp::save_inference_tensors_to_file(metas->meta[op], shard_id, bc, input_accessors_to_save, weight_accessors_to_save, output_accessors_to_save);
+      FusedOp::save_inference_tensors_to_file(metas->meta[op],
+                                              shard_id,
+                                              bc,
+                                              input_accessors_to_save,
+                                              weight_accessors_to_save,
+                                              output_accessors_to_save);
     }
     ioff += fused->op_num_inputs[op];
     woff += fused->op_num_weights[op];
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 1b825318dd..b5688c07e6 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -338,6 +338,7 @@ BatchConfig RequestManager::prepare_next_batch_task(
 BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
                                                InferenceResult const &result) {
   const std::lock_guard<std::mutex> lock(request_queue_mutex);
+
   // Step 1: append result from previous iteration to request's tokens
   for (int i = 0; i < old_bc.num_tokens; i++) {
     size_t guid =
@@ -356,115 +357,11 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
       // log_req_mgr.print("Output: %s", output.c_str());
     }
   }
+
   // Step 2: prepare the next batch for existing requests
   BatchConfig new_bc;
   for (int i = 0; i < BatchConfig::max_requests_per_batch(); i++) {
-    if (old_bc.request_completed[i]) {
-      continue;
-    }
-    assert(old_bc.requestsInfo[i].num_tokens_in_batch > 0);
-    Request &request = all_requests[old_bc.requestsInfo[i].request_guid];
-    int processed_tokens = old_bc.requestsInfo[i].token_start_offset +
-                           old_bc.requestsInfo[i].num_tokens_in_batch;
-    assert(processed_tokens < request.tokens.size());
-    bool request_completed = false;
-    // printf("model_type = %d\n", this->model_type);
-    if (request.tokens.size() >= old_bc.requestsInfo[i].max_sequence_length) {
-      request_completed = true;
-    } else if (request.tokens.back() == eos_token_id) {
-      // Encounter EOS token id
-      request_completed = true;
-    }
-    if (request_completed) {
-      request.status = Request::COMPLETED;
-      log_req_mgr.print("[Done] guid(%zu) final_length(%zu)",
-                        old_bc.requestsInfo[i].request_guid,
-                        request.tokens.size());
-      std::string output = this->tokenizer_->Decode(request.tokens);
-
-      {
-        // update generation result and trigger future
-        GenerationResult &gr = request_generation_results[request.guid];
-        assert(gr.guid == request.guid);
-        gr.output_tokens = request.tokens;
-        gr.output_text = output;
-      }
-      log_req_mgr.print("Final output: %s", output.c_str());
-      num_processed_requests++;
-      ProfileInfo profile_info = profiling_requests[request.guid];
-      profile_info.finish_time = Realm::Clock::current_time_in_microseconds();
-      total_request_run_time +=
-          profile_info.finish_time - profile_info.start_time;
-      profiling_requests[request.guid] = profile_info;
-      log_req_mgr.print("[Profile] guid(%zu) decoding_steps(%d) start(%.1lf) "
-                        "finish(%.1lf) latency(%.1lf)",
-                        request.guid,
-                        profile_info.decoding_steps,
-                        profile_info.start_time,
-                        profile_info.finish_time,
-                        profile_info.finish_time - profile_info.start_time);
-      // Write output to file if needed:
-      if (!output_filepath.empty()) {
-        std::ofstream outputFile(output_filepath);
-        if (outputFile.is_open()) {
-          outputFile << "end-to-end latency: " << std::fixed
-                     << std::setprecision(3) << total_request_run_time
-                     << std::endl;
-          outputFile << "num decoding steps: " << profile_info.decoding_steps
-                     << std::endl;
-          outputFile << "token IDs: ";
-          for (int i = 0; i < request.tokens.size(); i++) {
-            outputFile << request.tokens[i];
-            if (i < request.tokens.size() - 1) {
-              outputFile << ",";
-            }
-          }
-          outputFile << std::endl;
-          outputFile << output;
-          outputFile.close();
-        } else {
-          std::cout << "Unable to open the output file: " << output_filepath
-                    << std::endl;
-          assert(false);
-        }
-      }
-
-      // std::cout << "print results: " << std::endl;
-      // for (int i = 0; i < request.tokens.size(); i++) {
-      //   std::cout << request.tokens.at(i) << ", ";
-      // }
-    } else {
-      new_bc.request_completed[i] = false;
-      new_bc.requestsInfo[i].token_start_offset = processed_tokens;
-      new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
-      new_bc.requestsInfo[i].max_sequence_length =
-          old_bc.requestsInfo[i].max_sequence_length;
-      if (new_bc.requestsInfo[i].token_start_offset + 1 ==
-          request.tokens.size()) {
-        // Incremental phase
-        new_bc.requestsInfo[i].num_tokens_in_batch = 1;
-      } else {
-        // Prompt phase
-        new_bc.requestsInfo[i].num_tokens_in_batch =
-            std::min(get_max_tokens_per_batch() - new_bc.num_tokens,
-                     (int)request.tokens.size() -
-                         new_bc.requestsInfo[i].token_start_offset);
-      }
-      for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
-        int depth = new_bc.requestsInfo[i].token_start_offset + j;
-        new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
-        new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = depth;
-        assert(depth < request.tokens.size());
-        new_bc.tokensInfo[new_bc.num_tokens].token_id = request.tokens[depth];
-        new_bc.num_tokens++;
-      }
-      // Update profiling
-      profiling_requests[new_bc.requestsInfo[i].request_guid].decoding_steps++;
-    }
-  }
-  // Step 3: add new requests to the next batch
-  for (int i = 0; i < BatchConfig::max_requests_per_batch(); i++) {
-    if (new_bc.request_completed[i]) {
+    if (old_bc.request_completed[i]) { // add new requests to the next batch
       if (!pending_request_queue.empty() &&
           new_bc.num_tokens < get_max_tokens_per_batch()) {
         Request new_request = pending_request_queue.front();
@@ -473,7 +370,8 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
         new_bc.requestsInfo[i].token_start_offset = 0;
         new_bc.requestsInfo[i].request_guid = new_request.guid;
         new_bc.requestsInfo[i].num_tokens_in_batch =
-            std::min(get_max_tokens_per_batch() - new_bc.num_tokens,
+            std::min(get_max_tokens_per_batch() - new_bc.num_tokens -
+                         BatchConfig::max_requests_per_batch() + (i + 1),
                      (int)new_request.tokens.size());
         new_bc.requestsInfo[i].max_sequence_length =
             new_request.max_sequence_length;
@@ -496,8 +394,107 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
           break;
         }
       }
+    } else {
+      assert(old_bc.requestsInfo[i].num_tokens_in_batch > 0);
+      Request &request = all_requests[old_bc.requestsInfo[i].request_guid];
+      int processed_tokens = old_bc.requestsInfo[i].token_start_offset +
+                             old_bc.requestsInfo[i].num_tokens_in_batch;
+      assert(processed_tokens < request.tokens.size());
+      bool request_completed = false;
+      // printf("model_type = %d\n", this->model_type);
+      if (request.tokens.size() >= old_bc.requestsInfo[i].max_sequence_length) {
+        request_completed = true;
+      } else if (request.tokens.back() == eos_token_id) {
+        // Encounter EOS token id
+        request_completed = true;
+      }
+      if (request_completed) {
+        request.status = Request::COMPLETED;
+        log_req_mgr.print("[Done] guid(%zu) final_length(%zu)",
+                          old_bc.requestsInfo[i].request_guid,
+                          request.tokens.size());
+        std::string output = this->tokenizer_->Decode(request.tokens);
+
+        {
+          // update generation result and trigger future
+          GenerationResult &gr = request_generation_results[request.guid];
+          assert(gr.guid == request.guid);
+          gr.output_tokens = request.tokens;
+          gr.output_text = output;
+        }
+        log_req_mgr.print("Final output: %s", output.c_str());
+        num_processed_requests++;
+        ProfileInfo profile_info = profiling_requests[request.guid];
+        profile_info.finish_time = Realm::Clock::current_time_in_microseconds();
+        total_request_run_time +=
+            profile_info.finish_time - profile_info.start_time;
+        profiling_requests[request.guid] = profile_info;
+        log_req_mgr.print("[Profile] guid(%zu) decoding_steps(%d) start(%.1lf) "
+                          "finish(%.1lf) latency(%.1lf)",
+                          request.guid,
+                          profile_info.decoding_steps,
+                          profile_info.start_time,
+                          profile_info.finish_time,
+                          profile_info.finish_time - profile_info.start_time);
+        // Write output to file if needed:
+        if (!output_filepath.empty()) {
+          std::ofstream outputFile(output_filepath, std::ios::app);
+          if (outputFile.is_open()) {
+            outputFile << "end-to-end latency: " << std::fixed
+                       << std::setprecision(3) << total_request_run_time
+                       << std::endl;
+            outputFile << "num decoding steps: " << profile_info.decoding_steps
+                       << std::endl;
+            outputFile << "token IDs: ";
+            for (int i = 0; i < request.tokens.size(); i++) {
+              outputFile << request.tokens[i];
+              if (i < request.tokens.size() - 1) {
+                outputFile << ",";
+              }
+            }
+            outputFile << std::endl;
+            outputFile << output;
+            outputFile.close();
+          } else {
+            std::cout << "Unable to open the output file: " << output_filepath
+                      << std::endl;
+            assert(false);
+          }
+        }
+
+      } else {
+        new_bc.request_completed[i] = false;
+        new_bc.requestsInfo[i].token_start_offset = processed_tokens;
+        new_bc.requestsInfo[i].request_guid =
+            old_bc.requestsInfo[i].request_guid;
+        new_bc.requestsInfo[i].max_sequence_length =
+            old_bc.requestsInfo[i].max_sequence_length;
+        if (new_bc.requestsInfo[i].token_start_offset + 1 ==
+            request.tokens.size()) {
+          // Incremental phase
+          new_bc.requestsInfo[i].num_tokens_in_batch = 1;
+        } else {
+          // Prompt phase
+          new_bc.requestsInfo[i].num_tokens_in_batch =
+              std::min(get_max_tokens_per_batch() - new_bc.num_tokens,
+                       (int)request.tokens.size() -
+                           new_bc.requestsInfo[i].token_start_offset);
+        }
+        for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
+          int depth = new_bc.requestsInfo[i].token_start_offset + j;
+          new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
+          new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = depth;
+          assert(depth < request.tokens.size());
+          new_bc.tokensInfo[new_bc.num_tokens].token_id = request.tokens[depth];
+          new_bc.num_tokens++;
+        }
+        // Update profiling
+        profiling_requests[new_bc.requestsInfo[i].request_guid]
+            .decoding_steps++;
+      }
     }
   }
+
   return new_bc;
 }
 
@@ -654,11 +651,10 @@ BeamSearchBatchConfig
 
         // Write output to file if needed:
         if (!output_filepath.empty()) {
-          std::ofstream outputFile(output_filepath);
+          std::ofstream outputFile(output_filepath, std::ios::app);
           if (outputFile.is_open()) {
             outputFile << "end-to-end latency: " << std::fixed
-                       << std::setprecision(3)
-                       << profile_info.finish_time - profile_info.start_time
+                       << std::setprecision(3) << total_request_run_time
                        << std::endl;
             outputFile << "num decoding steps: " << profile_info.decoding_steps
                        << std::endl;
@@ -671,6 +667,7 @@ BeamSearchBatchConfig
             }
             outputFile << std::endl;
             outputFile << output;
+
             outputFile.close();
           } else {
             std::cout << "Unable to open the output file: " << output_filepath
@@ -1098,10 +1095,8 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
     std::vector<BeamSearchBatchConfig> const &old_batches) {
   const std::lock_guard<std::mutex> lock(request_queue_mutex);
 
-  if (verbose) {
-    std::cout
-        << "\n############### prepare_next_batch_verify ###############\n";
-  }
+  std::cout << "\n############### prepare_next_batch_verify ###############\n";
+
   assert(old_batches.size() > 0);
 
   TreeVerifyBatchConfig new_bc;
@@ -1277,8 +1272,6 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
 
       std::cout << "max_prompt_load_size: " << max_prompt_load_size
                 << std::endl;
-      std::cout << "new_bc.requestsInfo[i].num_tokens_in_batch: " << i << ", "
-                << new_bc.requestsInfo[i].num_tokens_in_batch << std::endl;
 
       if (request.llm_cache_size < request.initial_len) {
         // Initialization (prompt) phase
@@ -1298,7 +1291,9 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
           break;
         }
 
-        if (new_bc.num_tokens + request.llm_cache_size >= request.initial_len) {
+        if (new_bc.requestsInfo[i].num_tokens_in_batch +
+                request.llm_cache_size >=
+            request.initial_len) {
           // launch the request into running phase after loading all prompt
           request.status = Request::RUNNING;
           new_bc.request_running[i] = true;

From 4c06a0907ec694b21a989a51120e846d0f0cfa74 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Tue, 17 Oct 2023 14:21:13 -0500
Subject: [PATCH 251/344] variable renaming (#1194)

---
 include/flexflow/batch_config.h               |  2 +-
 include/flexflow/request_manager.h            |  2 +-
 src/ops/inc_multihead_self_attention.cpp      |  2 +-
 src/ops/inc_multihead_self_attention.cu       |  2 +-
 src/ops/spec_inc_multihead_self_attention.cpp |  2 +-
 src/ops/spec_inc_multihead_self_attention.cu  |  2 +-
 src/runtime/batch_config.cc                   |  6 +-
 src/runtime/beam_search_batch_config.cc       |  4 +-
 src/runtime/request_manager.cc                | 66 +++++++++++--------
 src/runtime/tree_verify_batch_config.cc       |  4 +-
 10 files changed, 50 insertions(+), 42 deletions(-)

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 108bc8d172..25bc206bf9 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -61,7 +61,7 @@ class BatchConfig {
   int num_tokens;
 
   struct PerRequestInfo {
-    int token_start_offset;
+    int first_token_depth_in_request;
     int num_tokens_in_batch;
     int max_sequence_length;
     RequestGuid request_guid;
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index 3081aaa1c2..baf6844801 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -154,7 +154,7 @@ class RequestManager {
   std::vector<std::pair<BatchConfig::TokenId, int>>
       traverse_beam_tree(BeamSearchBatchConfig const &old_bc,
                          int request_index,
-                         int token_start_offset);
+                         int first_token_depth_in_request);
 
   // remove guid after put the cached tree in request
   std::vector<std::pair<BatchConfig::TokenId, int>> merge_dfs_trees(
diff --git a/src/ops/inc_multihead_self_attention.cpp b/src/ops/inc_multihead_self_attention.cpp
index 562898a220..37cc986f5e 100644
--- a/src/ops/inc_multihead_self_attention.cpp
+++ b/src/ops/inc_multihead_self_attention.cpp
@@ -532,7 +532,7 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
       continue;
     }
     int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
-    int total_tokens = bc->requestsInfo[i].token_start_offset +
+    int total_tokens = bc->requestsInfo[i].first_token_depth_in_request +
                        bc->requestsInfo[i].num_tokens_in_batch;
     // bc->token_last_available_idx[i] + 1;
     // Compute (QK^T/sqrt(d_k))
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 00d45a9cfa..6ec077c328 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -531,7 +531,7 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
       continue;
     }
     int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
-    int total_tokens = bc->requestsInfo[i].token_start_offset +
+    int total_tokens = bc->requestsInfo[i].first_token_depth_in_request +
                        bc->requestsInfo[i].num_tokens_in_batch;
     // bc->token_last_available_idx[i] + 1;
     // Compute (QK^T/sqrt(d_k))
diff --git a/src/ops/spec_inc_multihead_self_attention.cpp b/src/ops/spec_inc_multihead_self_attention.cpp
index 173d4a5b1d..1d81ae0c11 100644
--- a/src/ops/spec_inc_multihead_self_attention.cpp
+++ b/src/ops/spec_inc_multihead_self_attention.cpp
@@ -231,7 +231,7 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       // int total_tokens = bc->token_last_available_idx[i] + 1;
 
       int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
-      int total_tokens = bc->requestsInfo[i].token_start_offset +
+      int total_tokens = bc->requestsInfo[i].first_token_depth_in_request +
                          bc->requestsInfo[i].num_tokens_in_batch;
       // Compute (QK^T/sqrt(d_k))
       int m_ = num_new_tokens;
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 00eec96824..8b89acf3b7 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -248,7 +248,7 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       // int total_tokens = bc->token_last_available_idx[i] + 1;
 
       int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
-      int total_tokens = bc->requestsInfo[i].token_start_offset +
+      int total_tokens = bc->requestsInfo[i].first_token_depth_in_request +
                          bc->requestsInfo[i].num_tokens_in_batch;
 
       if (num_new_tokens <= 0) {
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index 72572c4e06..4781f09cab 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -27,7 +27,7 @@ using Legion::Memory;
 
 BatchConfig::BatchConfig() : num_tokens(0) {
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
-    requestsInfo[i].token_start_offset = 0;
+    requestsInfo[i].first_token_depth_in_request = 0;
     requestsInfo[i].num_tokens_in_batch = 0;
     request_completed[i] = true;
   }
@@ -104,8 +104,8 @@ std::ostream &operator<<(std::ostream &os, BatchConfig const &bc) {
   for (int i = 0; i < bc.max_requests_per_batch(); i++) {
     if (!bc.request_completed[i]) {
       os << "  Request " << i << ":\n";
-      os << "    Token start offset: " << bc.requestsInfo[i].token_start_offset
-         << std::endl;
+      os << "    Token start offset: "
+         << bc.requestsInfo[i].first_token_depth_in_request << std::endl;
       os << "    Number of tokens in batch: "
          << bc.requestsInfo[i].num_tokens_in_batch << std::endl;
       os << "    GUID: " << bc.requestsInfo[i].request_guid << std::endl;
diff --git a/src/runtime/beam_search_batch_config.cc b/src/runtime/beam_search_batch_config.cc
index 811ef00ba2..f785dc5b74 100644
--- a/src/runtime/beam_search_batch_config.cc
+++ b/src/runtime/beam_search_batch_config.cc
@@ -126,8 +126,8 @@ std::ostream &operator<<(std::ostream &os, BeamSearchBatchConfig const &bc) {
   for (int i = 0; i < bc.max_requests_per_batch(); i++) {
     if (!bc.request_completed[i]) {
       os << "  Request " << i << ":\n";
-      os << "    Token start offset: " << bc.requestsInfo[i].token_start_offset
-         << std::endl;
+      os << "    Token start offset: "
+         << bc.requestsInfo[i].first_token_depth_in_request << std::endl;
       os << "    Number of tokens in batch: "
          << bc.requestsInfo[i].num_tokens_in_batch << std::endl;
       os << "    GUID: " << bc.requestsInfo[i].request_guid << std::endl;
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index b5688c07e6..1c5a6ae5da 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -367,7 +367,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
         Request new_request = pending_request_queue.front();
         pending_request_queue.pop();
         // all_requests[new_request.guid] = new_request;
-        new_bc.requestsInfo[i].token_start_offset = 0;
+        new_bc.requestsInfo[i].first_token_depth_in_request = 0;
         new_bc.requestsInfo[i].request_guid = new_request.guid;
         new_bc.requestsInfo[i].num_tokens_in_batch =
             std::min(get_max_tokens_per_batch() - new_bc.num_tokens -
@@ -382,7 +382,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
         profile_info.start_time = Realm::Clock::current_time_in_microseconds();
         profiling_requests[new_request.guid] = profile_info;
         for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
-          int depth = new_bc.requestsInfo[i].token_start_offset + j;
+          int depth = new_bc.requestsInfo[i].first_token_depth_in_request + j;
           new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
           new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = depth;
           assert(depth < new_request.tokens.size());
@@ -397,8 +397,9 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
     } else {
       assert(old_bc.requestsInfo[i].num_tokens_in_batch > 0);
       Request &request = all_requests[old_bc.requestsInfo[i].request_guid];
-      int processed_tokens = old_bc.requestsInfo[i].token_start_offset +
-                             old_bc.requestsInfo[i].num_tokens_in_batch;
+      int processed_tokens =
+          old_bc.requestsInfo[i].first_token_depth_in_request +
+          old_bc.requestsInfo[i].num_tokens_in_batch;
       assert(processed_tokens < request.tokens.size());
       bool request_completed = false;
       // printf("model_type = %d\n", this->model_type);
@@ -464,12 +465,12 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
 
       } else {
         new_bc.request_completed[i] = false;
-        new_bc.requestsInfo[i].token_start_offset = processed_tokens;
+        new_bc.requestsInfo[i].first_token_depth_in_request = processed_tokens;
         new_bc.requestsInfo[i].request_guid =
             old_bc.requestsInfo[i].request_guid;
         new_bc.requestsInfo[i].max_sequence_length =
             old_bc.requestsInfo[i].max_sequence_length;
-        if (new_bc.requestsInfo[i].token_start_offset + 1 ==
+        if (new_bc.requestsInfo[i].first_token_depth_in_request + 1 ==
             request.tokens.size()) {
           // Incremental phase
           new_bc.requestsInfo[i].num_tokens_in_batch = 1;
@@ -478,10 +479,10 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
           new_bc.requestsInfo[i].num_tokens_in_batch =
               std::min(get_max_tokens_per_batch() - new_bc.num_tokens,
                        (int)request.tokens.size() -
-                           new_bc.requestsInfo[i].token_start_offset);
+                           new_bc.requestsInfo[i].first_token_depth_in_request);
         }
         for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
-          int depth = new_bc.requestsInfo[i].token_start_offset + j;
+          int depth = new_bc.requestsInfo[i].first_token_depth_in_request + j;
           new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
           new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = depth;
           assert(depth < request.tokens.size());
@@ -685,7 +686,7 @@ BeamSearchBatchConfig
         new_bc.request_running[i] = true;
 
         // Normal Request Info
-        new_bc.requestsInfo[i].token_start_offset =
+        new_bc.requestsInfo[i].first_token_depth_in_request =
             verified_tokens.front().second;
         new_bc.requestsInfo[i].request_guid =
             old_bc.requestsInfo[i].request_guid;
@@ -694,9 +695,10 @@ BeamSearchBatchConfig
         new_bc.requestsInfo[i].num_tokens_in_batch = verified_tokens.size();
 
         // TODO: Beam Request Info, missing from VerifyTreeBatchConfig
-        int new_max_depth = new_bc.requestsInfo[i].max_sequence_length -
-                            new_bc.requestsInfo[i].token_start_offset -
-                            verified_tokens.size();
+        int new_max_depth =
+            new_bc.requestsInfo[i].max_sequence_length -
+            new_bc.requestsInfo[i].first_token_depth_in_request -
+            verified_tokens.size();
         new_bc.beamRequestsInfo[i].current_depth = 1;
         new_bc.beamRequestsInfo[i].beam_size =
             BeamSearchBatchConfig::MAX_BEAM_WIDTH;
@@ -742,7 +744,8 @@ BeamSearchBatchConfig
       assert(request.ssm_cache_size == request.initial_len);
 
       // Normal Request Info
-      new_bc.requestsInfo[i].token_start_offset = request.ssm_cache_size;
+      new_bc.requestsInfo[i].first_token_depth_in_request =
+          request.ssm_cache_size;
       new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
       new_bc.requestsInfo[i].max_sequence_length =
           old_bc.requestsInfo[i].max_sequence_length;
@@ -776,7 +779,7 @@ BeamSearchBatchConfig
         Request new_request = pending_request_queue.front();
         pending_request_queue.pop();
         // all_requests[new_request.guid] = new_request;
-        new_bc.requestsInfo[i].token_start_offset = 0;
+        new_bc.requestsInfo[i].first_token_depth_in_request = 0;
         new_bc.requestsInfo[i].request_guid = new_request.guid;
         new_bc.requestsInfo[i].num_tokens_in_batch =
             std::min(get_max_tokens_per_batch() - new_bc.num_tokens,
@@ -806,7 +809,7 @@ BeamSearchBatchConfig
         new_bc.sub_requests[i] = 1;
 
         for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
-          int depth = new_bc.requestsInfo[i].token_start_offset + j;
+          int depth = new_bc.requestsInfo[i].first_token_depth_in_request + j;
           new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
           new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = depth;
           assert(depth < new_request.tokens.size());
@@ -922,7 +925,7 @@ BeamSearchBatchConfig
     // zero when beam search has reached required sequence length
     // assert(old_bc.requestsInfo[i].num_tokens_in_batch > 0);
     Request &request = all_requests[old_bc.requestsInfo[i].request_guid];
-    int processed_tokens = old_bc.requestsInfo[i].token_start_offset +
+    int processed_tokens = old_bc.requestsInfo[i].first_token_depth_in_request +
                            old_bc.requestsInfo[i].num_tokens_in_batch;
 
     // assert(processed_tokens < request.tokens.size());
@@ -937,7 +940,8 @@ BeamSearchBatchConfig
     //   //                   old_bc.beamRequestsInfo[i].max_depth);
     //   // // new_bc.request_completed[i] = true;
     //   // new_bc.request_completed[i] = false;
-    //   // new_bc.requestsInfo[i].token_start_offset = processed_tokens;
+    //   // new_bc.requestsInfo[i].first_token_depth_in_request =
+    //   processed_tokens;
     //   // new_bc.requestsInfo[i].request_guid =
     //   // old_bc.requestsInfo[i].request_guid;
     //   // new_bc.requestsInfo[i].max_sequence_length =
@@ -953,7 +957,7 @@ BeamSearchBatchConfig
       log_req_mgr.debug() << "num tokens: " << old_bc.num_tokens << ", "
                           << new_bc.num_tokens;
       new_bc.request_completed[i] = false;
-      new_bc.requestsInfo[i].token_start_offset = processed_tokens;
+      new_bc.requestsInfo[i].first_token_depth_in_request = processed_tokens;
       new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
       new_bc.requestsInfo[i].max_sequence_length =
           old_bc.requestsInfo[i].max_sequence_length;
@@ -986,7 +990,8 @@ BeamSearchBatchConfig
       // do the slot exchange to minimize the cache exchange in kernel.
       // update_beam_metadata(new_bc, request.beam_trees.at(old_bc.model_id),
       // i);
-      if (new_bc.requestsInfo[i].token_start_offset >= request.tokens.size()) {
+      if (new_bc.requestsInfo[i].first_token_depth_in_request >=
+          request.tokens.size()) {
         // Incremental phase
         if (request.status == Request::RUNNING) {
           new_bc.requestsInfo[i].num_tokens_in_batch = 1;
@@ -1006,7 +1011,7 @@ BeamSearchBatchConfig
             std::min(get_max_tokens_per_batch() - new_bc.num_tokens -
                          BatchConfig::max_requests_per_batch() + i,
                      (int)request.tokens.size() -
-                         new_bc.requestsInfo[i].token_start_offset);
+                         new_bc.requestsInfo[i].first_token_depth_in_request);
         request.ssm_cache_size += new_bc.requestsInfo[i].num_tokens_in_batch;
         if (verbose) {
           std::cout << "[ Beam Spec] " << request.guid << std::endl;
@@ -1027,7 +1032,7 @@ BeamSearchBatchConfig
 
       // register more tokens due to the beam width
       for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
-        int depth = new_bc.requestsInfo[i].token_start_offset + j;
+        int depth = new_bc.requestsInfo[i].first_token_depth_in_request + j;
         for (int k = 0; k < new_bc.sub_requests[i]; k++) {
           new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
           new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = depth;
@@ -1151,7 +1156,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       }
 
       // Normal Request Info
-      new_bc.requestsInfo[i].token_start_offset =
+      new_bc.requestsInfo[i].first_token_depth_in_request =
           dfs_tree_inputs.front().second;
       new_bc.requestsInfo[i].request_guid =
           old_batches.at(0).requestsInfo[i].request_guid;
@@ -1204,7 +1209,8 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
         break;
       }
 
-      new_bc.requestsInfo[i].token_start_offset = request.tokens.size() - 1;
+      new_bc.requestsInfo[i].first_token_depth_in_request =
+          request.tokens.size() - 1;
 
       // Add Tokens from the DFS Tree to the next batch
       for (int j = 1; j < dfs_tree_inputs.size(); j++) {
@@ -1257,7 +1263,8 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       }
 
       // Normal Request Info
-      new_bc.requestsInfo[i].token_start_offset = request.llm_cache_size;
+      new_bc.requestsInfo[i].first_token_depth_in_request =
+          request.llm_cache_size;
       new_bc.requestsInfo[i].request_guid =
           old_batches.at(0).requestsInfo[i].request_guid;
       new_bc.requestsInfo[i].max_sequence_length =
@@ -1265,9 +1272,10 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
 
       new_bc.request_completed[i] = false;
 
-      new_bc.requestsInfo[i].num_tokens_in_batch = std::min(
-          max_prompt_load_size,
-          (int)request.initial_len - new_bc.requestsInfo[i].token_start_offset);
+      new_bc.requestsInfo[i].num_tokens_in_batch =
+          std::min(max_prompt_load_size,
+                   (int)request.initial_len -
+                       new_bc.requestsInfo[i].first_token_depth_in_request);
       max_prompt_load_size -= new_bc.requestsInfo[i].num_tokens_in_batch;
 
       std::cout << "max_prompt_load_size: " << max_prompt_load_size
@@ -1673,7 +1681,7 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
 std::vector<std::pair<BatchConfig::TokenId, int>>
     RequestManager::traverse_beam_tree(BeamSearchBatchConfig const &old_bc,
                                        int request_index,
-                                       int token_start_offset) {
+                                       int first_token_depth_in_request) {
   if (verbose) {
     std::cout << "[Traverse Beam Tree] request_index: " << request_index
               << "\n";
@@ -1709,7 +1717,7 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
               << serializedTree.size() << "\n";
   }
   for (int k = 0; k < serializedTree.size(); k++) {
-    serializedTree.at(k).second += token_start_offset;
+    serializedTree.at(k).second += first_token_depth_in_request;
     if (verbose) {
       std::cout << "token id: " << serializedTree.at(k).first
                 << ", depth: " << serializedTree.at(k).second << "\n";
diff --git a/src/runtime/tree_verify_batch_config.cc b/src/runtime/tree_verify_batch_config.cc
index cb68ecc5f1..6dbcaceaa4 100644
--- a/src/runtime/tree_verify_batch_config.cc
+++ b/src/runtime/tree_verify_batch_config.cc
@@ -47,8 +47,8 @@ std::ostream &operator<<(std::ostream &os, TreeVerifyBatchConfig const &bc) {
   for (int i = 0; i < bc.max_requests_per_batch(); i++) {
     if (!bc.request_completed[i]) {
       os << "  Request " << i << ":\n";
-      os << "    Token start offset: " << bc.requestsInfo[i].token_start_offset
-         << std::endl;
+      os << "    Token start offset: "
+         << bc.requestsInfo[i].first_token_depth_in_request << std::endl;
       os << "    Number of tokens in batch: "
          << bc.requestsInfo[i].num_tokens_in_batch << std::endl;
       os << "    GUID: " << bc.requestsInfo[i].request_guid << std::endl;

From fb0b21cf78f61d2a553f7940f9207469fe20696b Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Wed, 18 Oct 2023 16:54:35 -0500
Subject: [PATCH 252/344] Add `first_token_offset_in_batch` to indicate the
 offset of the request's first token in a `BatchConfig` (#1197)

* Add first_token_offset_in_batch to indicate the offset of the request's first token in a BatchConfig

* format
---
 include/flexflow/batch_config.h              | 1 +
 src/ops/inc_multihead_self_attention.cu      | 2 ++
 src/ops/spec_inc_multihead_self_attention.cu | 3 ++-
 src/ops/tree_inc_multihead_self_attention.cu | 2 ++
 src/runtime/batch_config.cc                  | 5 ++++-
 src/runtime/beam_search_batch_config.cc      | 4 +++-
 src/runtime/request_manager.cc               | 8 ++++++++
 src/runtime/tree_verify_batch_config.cc      | 4 +++-
 8 files changed, 25 insertions(+), 4 deletions(-)

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 25bc206bf9..d625985552 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -62,6 +62,7 @@ class BatchConfig {
 
   struct PerRequestInfo {
     int first_token_depth_in_request;
+    int first_token_offset_in_batch;
     int num_tokens_in_batch;
     int max_sequence_length;
     RequestGuid request_guid;
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 6ec077c328..ced1459b59 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -530,6 +530,8 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     if (bc->request_completed[i]) {
       continue;
     }
+    assert(tokens_previous_requests ==
+           bc->requestsInfo[i].first_token_offset_in_batch);
     int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
     int total_tokens = bc->requestsInfo[i].first_token_depth_in_request +
                        bc->requestsInfo[i].num_tokens_in_batch;
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 8b89acf3b7..fddbd252b6 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -241,7 +241,8 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
     if (bc->request_completed[i]) {
       continue;
     }
-
+    assert(tokens_previous_requests ==
+           bc->requestsInfo[i].first_token_offset_in_batch);
     for (int sub_req_id = 0; sub_req_id < bc->sub_requests[i]; sub_req_id++) {
 
       // int num_new_tokens = bc->num_processing_tokens[i];
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index 0da432b732..98a9c6557a 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -181,6 +181,8 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
     if (bc->request_completed[i]) {
       continue;
     }
+    assert(processed_tokens_in_batch ==
+           bc->requestsInfo[i].first_token_offset_in_batch);
     int last_token_idx_of_the_request =
         processed_tokens_in_batch + bc->requestsInfo[i].num_tokens_in_batch - 1;
     while (processed_tokens_in_batch <= last_token_idx_of_the_request) {
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index 4781f09cab..d2fbc0883f 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -28,6 +28,7 @@ using Legion::Memory;
 BatchConfig::BatchConfig() : num_tokens(0) {
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
     requestsInfo[i].first_token_depth_in_request = 0;
+    requestsInfo[i].first_token_offset_in_batch = 0;
     requestsInfo[i].num_tokens_in_batch = 0;
     request_completed[i] = true;
   }
@@ -104,8 +105,10 @@ std::ostream &operator<<(std::ostream &os, BatchConfig const &bc) {
   for (int i = 0; i < bc.max_requests_per_batch(); i++) {
     if (!bc.request_completed[i]) {
       os << "  Request " << i << ":\n";
-      os << "    Token start offset: "
+      os << "    First token depth in request: "
          << bc.requestsInfo[i].first_token_depth_in_request << std::endl;
+      os << "    First token offset in batch: "
+         << bc.requestsInfo[i].first_token_offset_in_batch << std::endl;
       os << "    Number of tokens in batch: "
          << bc.requestsInfo[i].num_tokens_in_batch << std::endl;
       os << "    GUID: " << bc.requestsInfo[i].request_guid << std::endl;
diff --git a/src/runtime/beam_search_batch_config.cc b/src/runtime/beam_search_batch_config.cc
index f785dc5b74..74843e9460 100644
--- a/src/runtime/beam_search_batch_config.cc
+++ b/src/runtime/beam_search_batch_config.cc
@@ -126,8 +126,10 @@ std::ostream &operator<<(std::ostream &os, BeamSearchBatchConfig const &bc) {
   for (int i = 0; i < bc.max_requests_per_batch(); i++) {
     if (!bc.request_completed[i]) {
       os << "  Request " << i << ":\n";
-      os << "    Token start offset: "
+      os << "    First token depth in request: "
          << bc.requestsInfo[i].first_token_depth_in_request << std::endl;
+      os << "    First token offset in batch: "
+         << bc.requestsInfo[i].first_token_offset_in_batch << std::endl;
       os << "    Number of tokens in batch: "
          << bc.requestsInfo[i].num_tokens_in_batch << std::endl;
       os << "    GUID: " << bc.requestsInfo[i].request_guid << std::endl;
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 1c5a6ae5da..4d232b6d44 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -368,6 +368,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
         pending_request_queue.pop();
         // all_requests[new_request.guid] = new_request;
         new_bc.requestsInfo[i].first_token_depth_in_request = 0;
+        new_bc.requestsInfo[i].first_token_offset_in_batch = new_bc.num_tokens;
         new_bc.requestsInfo[i].request_guid = new_request.guid;
         new_bc.requestsInfo[i].num_tokens_in_batch =
             std::min(get_max_tokens_per_batch() - new_bc.num_tokens -
@@ -466,6 +467,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
       } else {
         new_bc.request_completed[i] = false;
         new_bc.requestsInfo[i].first_token_depth_in_request = processed_tokens;
+        new_bc.requestsInfo[i].first_token_offset_in_batch = new_bc.num_tokens;
         new_bc.requestsInfo[i].request_guid =
             old_bc.requestsInfo[i].request_guid;
         new_bc.requestsInfo[i].max_sequence_length =
@@ -688,6 +690,7 @@ BeamSearchBatchConfig
         // Normal Request Info
         new_bc.requestsInfo[i].first_token_depth_in_request =
             verified_tokens.front().second;
+        new_bc.requestsInfo[i].first_token_offset_in_batch = new_bc.num_tokens;
         new_bc.requestsInfo[i].request_guid =
             old_bc.requestsInfo[i].request_guid;
         new_bc.requestsInfo[i].max_sequence_length =
@@ -746,6 +749,7 @@ BeamSearchBatchConfig
       // Normal Request Info
       new_bc.requestsInfo[i].first_token_depth_in_request =
           request.ssm_cache_size;
+      new_bc.requestsInfo[i].first_token_offset_in_batch = new_bc.num_tokens;
       new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
       new_bc.requestsInfo[i].max_sequence_length =
           old_bc.requestsInfo[i].max_sequence_length;
@@ -780,6 +784,7 @@ BeamSearchBatchConfig
         pending_request_queue.pop();
         // all_requests[new_request.guid] = new_request;
         new_bc.requestsInfo[i].first_token_depth_in_request = 0;
+        new_bc.requestsInfo[i].first_token_offset_in_batch = new_bc.num_tokens;
         new_bc.requestsInfo[i].request_guid = new_request.guid;
         new_bc.requestsInfo[i].num_tokens_in_batch =
             std::min(get_max_tokens_per_batch() - new_bc.num_tokens,
@@ -958,6 +963,7 @@ BeamSearchBatchConfig
                           << new_bc.num_tokens;
       new_bc.request_completed[i] = false;
       new_bc.requestsInfo[i].first_token_depth_in_request = processed_tokens;
+      new_bc.requestsInfo[i].first_token_offset_in_batch = new_bc.num_tokens;
       new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
       new_bc.requestsInfo[i].max_sequence_length =
           old_bc.requestsInfo[i].max_sequence_length;
@@ -1158,6 +1164,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       // Normal Request Info
       new_bc.requestsInfo[i].first_token_depth_in_request =
           dfs_tree_inputs.front().second;
+      new_bc.requestsInfo[i].first_token_offset_in_batch = new_bc.num_tokens;
       new_bc.requestsInfo[i].request_guid =
           old_batches.at(0).requestsInfo[i].request_guid;
       new_bc.requestsInfo[i].max_sequence_length =
@@ -1265,6 +1272,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       // Normal Request Info
       new_bc.requestsInfo[i].first_token_depth_in_request =
           request.llm_cache_size;
+      new_bc.requestsInfo[i].first_token_offset_in_batch = new_bc.num_tokens;
       new_bc.requestsInfo[i].request_guid =
           old_batches.at(0).requestsInfo[i].request_guid;
       new_bc.requestsInfo[i].max_sequence_length =
diff --git a/src/runtime/tree_verify_batch_config.cc b/src/runtime/tree_verify_batch_config.cc
index 6dbcaceaa4..841c735f59 100644
--- a/src/runtime/tree_verify_batch_config.cc
+++ b/src/runtime/tree_verify_batch_config.cc
@@ -47,8 +47,10 @@ std::ostream &operator<<(std::ostream &os, TreeVerifyBatchConfig const &bc) {
   for (int i = 0; i < bc.max_requests_per_batch(); i++) {
     if (!bc.request_completed[i]) {
       os << "  Request " << i << ":\n";
-      os << "    Token start offset: "
+      os << "    First token depth in request: "
          << bc.requestsInfo[i].first_token_depth_in_request << std::endl;
+      os << "    First token offset in batch: "
+         << bc.requestsInfo[i].first_token_offset_in_batch << std::endl;
       os << "    Number of tokens in batch: "
          << bc.requestsInfo[i].num_tokens_in_batch << std::endl;
       os << "    GUID: " << bc.requestsInfo[i].request_guid << std::endl;

From caf5d61a4fdfc71a10667aeb0bec8f841c67599d Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Sun, 22 Oct 2023 13:26:48 -0500
Subject: [PATCH 253/344] Update the data layout of m->attn_heads (#1204)

* Update the data layout of m->attn_heads to make it consistent with others

* move output product out of loop

---------

Co-authored-by: xinhaoc <chengxh_98@163.com>
---
 src/ops/inc_multihead_self_attention.cu      |  85 ++++++++--------
 src/ops/spec_inc_multihead_self_attention.cu | 100 +++++++++----------
 src/ops/tree_inc_multihead_self_attention.cu |  87 ++++++++--------
 3 files changed, 134 insertions(+), 138 deletions(-)

diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index ced1459b59..3b24a5a324 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -650,19 +650,19 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                    C_softmax));
     // Matmul softmax(QK^T/sqrt(d_k)) by V
     alpha = 1.0f, beta = 0.0f;
-    m_ = num_new_tokens;
-    n = m->vProjSize;
+    m_ = m->vProjSize;
+    n = num_new_tokens;
     k = total_tokens;
-    lda = m_, ldb = n * m->num_q_heads, ldc = m_;
-    strideA = num_new_tokens * total_tokens;
-    strideB = vt_block_size;
-    strideC = num_new_tokens * m->vProjSize;
-    // To get A, skip over softmax(QK^T/sqrt(d_k)) entries from previous
-    // requests (all heads)
-    A = C_softmax;
-    // To get B, skip over V^T entries from previous requests (all heads +
+    lda = m_ * m->num_q_heads, ldb = n, ldc = m_ * m->num_q_heads;
+    strideA = vt_block_size;
+    strideB = num_new_tokens * total_tokens;
+    strideC = m->vProjSize;
+    // To get A, skip over V^T entries from previous requests (all heads +
     // padding)
-    B = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
+    A = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
+    // To get B, skip over softmax(QK^T/sqrt(d_k)) entries from previous
+    // requests (all heads)
+    B = C_softmax;
     // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
     // requests
     C = static_cast<DT *>(m->attn_heads) +
@@ -690,40 +690,41 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                          m->num_q_heads,
                                          compute_type,
                                          CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-    // Project to output, save result directly on output tensor
-    alpha = 1.0f, beta = 0.0f;
-    m_ = m->oProjSize;
-    k = m->vProjSize * m->num_q_heads;
-    n = num_new_tokens;
-    lda = k, ldb = n, ldc = m_;
-    A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
-                                 m->kProjSize * m->num_q_heads +
-                                 m->vProjSize * m->num_q_heads);
-    B = C;
-    C = static_cast<DT *>(output_ptr) + tokens_previous_requests * m->oProjSize;
-
-    checkCUDA(cublasGemmEx(m->handle.blas,
-                           CUBLAS_OP_T,
-                           CUBLAS_OP_T,
-                           m_,
-                           n,
-                           k,
-                           &alpha,
-                           A,
-                           cublas_data_type,
-                           lda,
-                           B,
-                           cublas_data_type,
-                           ldb,
-                           &beta,
-                           C,
-                           cublas_data_type,
-                           ldc,
-                           compute_type,
-                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
     tokens_previous_requests += num_new_tokens;
   }
 
+  // Project to output, save result directly on output tensor
+  DT alpha = 1.0f, beta = 0.0f;
+  int m_ = m->oProjSize;
+  int k = m->vProjSize * m->num_q_heads;
+  int n = bc->num_active_tokens();
+  int lda = k, ldb = k, ldc = m_;
+  DT const *A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
+                                         m->kProjSize * m->num_q_heads +
+                                         m->vProjSize * m->num_q_heads);
+  DT const *B = static_cast<DT *>(m->attn_heads);
+  DT *C = static_cast<DT *>(output_ptr);
+
+  checkCUDA(cublasGemmEx(m->handle.blas,
+                         CUBLAS_OP_T,
+                         CUBLAS_OP_N,
+                         m_,
+                         n,
+                         k,
+                         &alpha,
+                         A,
+                         cublas_data_type,
+                         lda,
+                         B,
+                         cublas_data_type,
+                         ldb,
+                         &beta,
+                         C,
+                         cublas_data_type,
+                         ldc,
+                         compute_type,
+                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
   if (*m->final_bias && shard_id == 0) {
     int parallelism = m->oProjSize * num_tokens;
     int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index fddbd252b6..ac74eb1c8f 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -223,7 +223,7 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
 #endif
   // int num_requests = bc->num_active_requests();
   int num_tokens = bc->num_active_tokens();
-  int tokens_previous_requests = 0;
+  // int tokens_previous_requests = 0;
   int tokens_prev_requests_squares = 0;
   // int qkv_block_size =
   //     (m->qProjSize + m->kProjSize + m->vProjSize) * num_tokens;
@@ -241,10 +241,7 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
     if (bc->request_completed[i]) {
       continue;
     }
-    assert(tokens_previous_requests ==
-           bc->requestsInfo[i].first_token_offset_in_batch);
     for (int sub_req_id = 0; sub_req_id < bc->sub_requests[i]; sub_req_id++) {
-
       // int num_new_tokens = bc->num_processing_tokens[i];
       // int total_tokens = bc->token_last_available_idx[i] + 1;
 
@@ -273,8 +270,8 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       }
       // To get A, skip over Q entries from previous requests (same head)
       DT const *A = static_cast<DT *>(m->devQKVProjArray) +
-                    tokens_previous_requests * m->qProjSize * m->num_q_heads *
-                        QKV_WEIGHT_NUM;
+                    bc->requestsInfo[i].first_token_offset_in_batch *
+                        m->qProjSize * m->num_q_heads * QKV_WEIGHT_NUM;
       // To get B, skip over K entries from previous requests (all heads +
       // padding)
       DT const *B = static_cast<DT *>(m->keyCache) +
@@ -380,24 +377,25 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                                      C_softmax));
       // Matmul softmax(QK^T/sqrt(d_k)) by V
       alpha = 1.0f, beta = 0.0f;
-      m_ = num_new_tokens;
-      n = m->vProjSize;
+      m_ = m->vProjSize;
+      n = num_new_tokens;
       k = total_tokens;
-      lda = m_, ldb = n * m->num_q_heads, ldc = m_;
-      strideA = num_new_tokens * total_tokens;
-      strideB = vt_block_size;
-      strideC = num_new_tokens * m->vProjSize;
-      // To get A, skip over softmax(QK^T/sqrt(d_k)) entries from previous
-      // requests (all heads)
-      A = C_softmax;
-      // To get B, skip over V^T entries from previous requests (all heads +
+      lda = m_ * m->num_q_heads, ldb = n, ldc = m_ * m->num_q_heads;
+      strideA = vt_block_size;
+      strideB = num_new_tokens * total_tokens;
+      strideC = m->vProjSize;
+      // To get A, skip over V^T entries from previous requests (all heads +
       // padding)
-      B = static_cast<DT *>(m->valueCache) +
+      A = static_cast<DT *>(m->valueCache) +
           (i * bc->MAX_BEAM_WIDTH + sub_req_id) * vt_req_block_size;
+      // To get B, skip over softmax(QK^T/sqrt(d_k)) entries from previous
+      // requests (all heads)
+      B = C_softmax;
       // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
       // requests
       C = static_cast<DT *>(m->attn_heads) +
-          tokens_previous_requests * m->num_q_heads * m->vProjSize;
+          bc->requestsInfo[i].first_token_offset_in_batch * m->num_q_heads *
+              m->vProjSize;
       checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                            CUBLAS_OP_N,
                                            CUBLAS_OP_T,
@@ -422,42 +420,42 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                                            compute_type,
                                            CUBLAS_GEMM_DEFAULT_TENSOR_OP));
 
-      // Project to output, save result directly on output tensor
-      alpha = 1.0f, beta = 0.0f;
-      m_ = m->oProjSize;
-      k = m->vProjSize * m->num_q_heads;
-      n = num_new_tokens;
-      lda = k, ldb = n, ldc = m_;
-      A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
-                                   m->kProjSize * m->num_q_heads +
-                                   m->vProjSize * m->num_q_heads);
-      B = C;
-      C = static_cast<DT *>(output_ptr) +
-          tokens_previous_requests * m->oProjSize;
-
-      checkCUDA(cublasGemmEx(m->handle.blas,
-                             CUBLAS_OP_T,
-                             CUBLAS_OP_T,
-                             m_,
-                             n,
-                             k,
-                             &alpha,
-                             A,
-                             cublas_data_type,
-                             lda,
-                             B,
-                             cublas_data_type,
-                             ldb,
-                             &beta,
-                             C,
-                             cublas_data_type,
-                             ldc,
-                             compute_type,
-                             CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-      tokens_previous_requests += num_new_tokens;
+      // tokens_previous_requests += num_new_tokens;
       tokens_prev_requests_squares += num_new_tokens * total_tokens;
     }
   }
+
+  // Project to output, save result directly on output tensor
+  DT alpha = 1.0f, beta = 0.0f;
+  int m_ = m->oProjSize;
+  int k = m->vProjSize * m->num_q_heads;
+  int n = bc->num_active_tokens();
+  int lda = k, ldb = k, ldc = m_;
+  DT const *A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
+                                         m->kProjSize * m->num_q_heads +
+                                         m->vProjSize * m->num_q_heads);
+  DT const *B = static_cast<DT *>(m->attn_heads);
+  DT *C = static_cast<DT *>(output_ptr);
+
+  checkCUDA(cublasGemmEx(m->handle.blas,
+                         CUBLAS_OP_T,
+                         CUBLAS_OP_N,
+                         m_,
+                         n,
+                         k,
+                         &alpha,
+                         A,
+                         cublas_data_type,
+                         lda,
+                         B,
+                         cublas_data_type,
+                         ldb,
+                         &beta,
+                         C,
+                         cublas_data_type,
+                         ldc,
+                         compute_type,
+                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
   if (*m->final_bias && shard_id == 0) {
     int parallelism = m->oProjSize * num_tokens;
     int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index 98a9c6557a..edf7a2d075 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -338,24 +338,23 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                                      C_softmax));
       // Matmul softmax(QK^T/sqrt(d_k)) by V
       alpha = 1.0f, beta = 0.0f;
-      m_ = num_new_tokens;
-      n = m->vProjSize;
+      m_ = m->vProjSize;
+      n = num_new_tokens;
       k = total_tokens_in_request;
-      lda = m_, ldb = n * m->num_q_heads, ldc = m_;
-      strideA = num_new_tokens * total_tokens_in_request;
-      strideB = vt_block_size;
-      strideC = num_new_tokens * m->vProjSize;
-      // To get A, skip over softmax(QK^T/sqrt(d_k)) entries from previous
-      // requests (all heads)
-      A = C_softmax;
-      // To get B, skip over V^T entries from previous requests (all heads +
+      lda = m_ * m->num_q_heads, ldb = n, ldc = m_ * m->num_q_heads;
+      strideA = vt_block_size;
+      strideB = num_new_tokens * total_tokens_in_request;
+      strideC = m->vProjSize;
+      // To get A, skip over V^T entries from previous requests (all heads +
       // padding)
-      B = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
+      A = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
+      // To get B, skip over softmax(QK^T/sqrt(d_k)) entries from previous
+      // requests (all heads)
+      B = C_softmax;
       // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
       // requests
       C = static_cast<DT *>(m->attn_heads) +
           processed_tokens_in_batch * m->num_q_heads * m->vProjSize;
-
       checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                            CUBLAS_OP_N,
                                            CUBLAS_OP_T,
@@ -379,45 +378,43 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                                            m->num_q_heads,
                                            compute_type,
                                            CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-
-      // Project to output, save result directly on output tensor
-      alpha = 1.0f, beta = 0.0f;
-      m_ = m->oProjSize;
-      k = m->vProjSize * m->num_q_heads;
-      n = num_new_tokens;
-      lda = k, ldb = n, ldc = m_;
-      A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
-                                   m->kProjSize * m->num_q_heads +
-                                   m->vProjSize * m->num_q_heads);
-      B = C;
-      C = static_cast<DT *>(output_ptr) +
-          processed_tokens_in_batch * m->oProjSize;
-
-      checkCUDA(cublasGemmEx(m->handle.blas,
-                             CUBLAS_OP_T,
-                             CUBLAS_OP_T,
-                             m_,
-                             n,
-                             k,
-                             &alpha,
-                             A,
-                             cublas_data_type,
-                             lda,
-                             B,
-                             cublas_data_type,
-                             ldb,
-                             &beta,
-                             C,
-                             cublas_data_type,
-                             ldc,
-                             compute_type,
-                             CUBLAS_GEMM_DEFAULT_TENSOR_OP));
       processed_tokens_in_batch += num_new_tokens;
     }
     // Before moving to the next request
     // check that we have finished all tokens of the request
     assert(last_token_idx_of_the_request + 1 == processed_tokens_in_batch);
   }
+  // Project to output, save result directly on output tensor
+  DT alpha = 1.0f, beta = 0.0f;
+  int m_ = m->oProjSize;
+  int k = m->vProjSize * m->num_q_heads;
+  int n = processed_tokens_in_batch;
+  int lda = k, ldb = k, ldc = m_;
+  DT const *A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
+                                         m->kProjSize * m->num_q_heads +
+                                         m->vProjSize * m->num_q_heads);
+  DT const *B = static_cast<DT *>(m->attn_heads);
+  DT *C = static_cast<DT *>(output_ptr);
+
+  checkCUDA(cublasGemmEx(m->handle.blas,
+                         CUBLAS_OP_T,
+                         CUBLAS_OP_N,
+                         m_,
+                         n,
+                         k,
+                         &alpha,
+                         A,
+                         cublas_data_type,
+                         lda,
+                         B,
+                         cublas_data_type,
+                         ldb,
+                         &beta,
+                         C,
+                         cublas_data_type,
+                         ldc,
+                         compute_type,
+                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
   if (*m->final_bias && shard_id == 0) {
     int parallelism = m->oProjSize * processed_tokens_in_batch;
     int qkv_weight_size = m->qProjSize * m->global_num_q_heads +

From dd9f62d2122df87fcec96694fd41fc37abfcfb4c Mon Sep 17 00:00:00 2001
From: DerrickYLJ <99985904+DerrickYLJ@users.noreply.github.com>
Date: Mon, 23 Oct 2023 00:03:33 -0400
Subject: [PATCH 254/344] Pre-build Legion library (#1042)

* add optional flag for building legion only

* added build path and legion-only flag

* bug fix

* pass new variable with config file

* move nccl

* bug fix

* add cuda_arch list

* export position move

* cd into legion

* quick fix

* retrieve os version and cd directory

* using ubuntu

* directory fix

* bug fix

* add touch

* create the release to flexflow-third-party

* bug fix

* bug fix

* fix indentation

* fix

* bash launching

* bug fix

* bug fix

* extract tar file`

* bug fix

* add parameter

* bash fix

* python version

* bug fix

* bug fix

* bug fix

* bug fix

* bug fix

* build bash

* bug fix

* bug fix

* bug fix

* bug fix

* bug fix

* auto running docker container

* renew bash script

* bug fix

* bug fix

* bug fix

* non-running container

* bug fix

* make it easier to switch between inference and master branch

* multiple fixes

* bug fix

* bug fix

* add python version

* bug fix

* restore

* enable building docker images for different hip versions

* ignore shellcheck error code

* support hip compilation in inference cmake files

* fix

* workflow and hardcode

* bug fix

* fix

* cmake fix

* python versions

* cmake fixes

* cmake fixes

* move install

* order

* bug fix

* nested if condition fix

* update docker workflow and config scripts

* update scripts

* fix

* fix

* cleanup

* rocm 5.6 by default in workflow

* move outside

* update workflow

* incorp install.sh

* bug fix

* fix

* fix

* fix

* bg fix

* fix permissions

* bug fix

* bug fix

* bug fix

* bug fix

* updated

* bug fix

* fix workflow

* check

* check

* bug fix

* fix

* add python env

* fix

* cleanup

* update workflow

* newline

* added runner

* added endif

* Code Cleanup

* restore to self-hosted

* bug fix

* fix

* fix

* update workflow

* fixes

* fix cmake for hip rocm

---------

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
---
 .github/workflows/helpers/prebuild_legion.sh |  75 +++
 .github/workflows/prebuild-legion.yml        |  84 ++++
 CMakeLists.txt                               | 468 ++++++++++---------
 cmake/cuda.cmake                             |   2 +-
 config/config.inc                            |  11 +-
 config/config.linux                          |   5 +-
 docker/build.sh                              |   9 +-
 docker/flexflow-environment/Dockerfile       |  31 +-
 docker/flexflow/Dockerfile                   |   9 +
 9 files changed, 452 insertions(+), 242 deletions(-)
 create mode 100755 .github/workflows/helpers/prebuild_legion.sh
 create mode 100644 .github/workflows/prebuild-legion.yml

diff --git a/.github/workflows/helpers/prebuild_legion.sh b/.github/workflows/helpers/prebuild_legion.sh
new file mode 100755
index 0000000000..ccaa58383e
--- /dev/null
+++ b/.github/workflows/helpers/prebuild_legion.sh
@@ -0,0 +1,75 @@
+#! /usr/bin/env bash
+set -euo pipefail
+
+# Parse input params
+python_version=${python_version:-"empty"}
+gpu_backend=${gpu_backend:-"empty"}
+gpu_backend_version=${gpu_backend_version:-"empty"}
+
+if [[ "${gpu_backend}" != @(cuda|hip_cuda|hip_rocm|intel) ]]; then
+  echo "Error, value of gpu_backend (${gpu_backend}) is invalid. Pick between 'cuda', 'hip_cuda', 'hip_rocm' or 'intel'."
+  exit 1
+else
+  echo "Pre-building Legion with GPU backend: ${gpu_backend}"
+fi
+
+if [[ "${gpu_backend}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; then
+    # Check that CUDA version is supported. Versions above 12.0 not supported because we don't publish docker images for it yet.
+    if [[ "$gpu_backend_version" != @(11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0) ]]; then
+        echo "cuda_version is not supported, please choose among {11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0}"
+        exit 1
+    fi
+    export cuda_version="$gpu_backend_version"
+elif [[ "${gpu_backend}" == "hip_rocm" ]]; then
+    # Check that HIP version is supported
+    if [[ "$gpu_backend_version" != @(5.3|5.4|5.5|5.6) ]]; then
+        echo "hip_version is not supported, please choose among {5.3, 5.4, 5.5, 5.6}"
+        exit 1
+    fi
+    export hip_version="$gpu_backend_version"
+else
+    echo "gpu backend: ${gpu_backend} and gpu_backend_version: ${gpu_backend_version} not yet supported."
+    exit 1
+fi
+
+# Cd into directory holding this script
+cd "${BASH_SOURCE[0]%/*}"
+
+export FF_GPU_BACKEND="${gpu_backend}"
+export FF_CUDA_ARCH=all
+export FF_HIP_ARCH=all
+export BUILD_LEGION_ONLY=ON
+export INSTALL_DIR="/usr/legion"
+export python_version="${python_version}"
+
+# Build Docker Flexflow Container
+echo "building docker"
+../../../docker/build.sh flexflow
+
+# Cleanup any existing container with the same name
+docker rm prelegion || true
+
+# Create container to be able to copy data from the image
+docker create --name prelegion flexflow-"${gpu_backend}"-"${gpu_backend_version}":latest
+
+# Copy legion libraries to host
+echo "extract legion library assets"
+mkdir -p ../../../prebuilt_legion_assets
+rm -rf ../../../prebuilt_legion_assets/tmp || true
+docker cp prelegion:$INSTALL_DIR ../../../prebuilt_legion_assets/tmp
+
+
+# Create the tarball file
+cd ../../../prebuilt_legion_assets/tmp
+export LEGION_TARBALL="legion_ubuntu-20.04_${gpu_backend}-${gpu_backend_version}_py${python_version}.tar.gz"
+
+echo "Creating archive $LEGION_TARBALL"
+tar -zcvf "../$LEGION_TARBALL" ./
+cd ..
+echo "Checking the size of the Legion tarball..."
+du -h "$LEGION_TARBALL"
+
+
+# Cleanup
+rm -rf tmp/*
+docker rm prelegion
diff --git a/.github/workflows/prebuild-legion.yml b/.github/workflows/prebuild-legion.yml
new file mode 100644
index 0000000000..00e7e78a77
--- /dev/null
+++ b/.github/workflows/prebuild-legion.yml
@@ -0,0 +1,84 @@
+name: "prebuild-legion"
+on:
+  push:
+    branches:
+      - "inference"
+    paths:
+      - "cmake/**"
+      - "config/**"
+      - "deps/legion/**"
+      - ".github/workflows/helpers/install_dependencies.sh"
+  workflow_dispatch:
+concurrency:
+  group: prebuild-legion-${{ github.head_ref || github.run_id }}
+  cancel-in-progress: true
+
+jobs:
+  prebuild-legion:
+    name: Prebuild Legion with CMake
+    runs-on: ubuntu-20.04
+    defaults:
+      run:
+        shell: bash -l {0} # required to use an activated conda environment
+    strategy:
+      matrix:
+        gpu_backend: ["cuda", "hip_rocm"]
+        gpu_backend_version: ["11.8", "5.6"]
+        python_version: "3.11"
+        exclude:
+          - gpu_backend: "cuda"
+            gpu_backend_version: "5.6"
+          - gpu_backend: "hip_rocm"
+            gpu_backend_version: "11.8"
+      fail-fast: false
+    steps:
+      - name: Checkout Git Repository
+        uses: actions/checkout@v3
+        with:
+          submodules: recursive
+
+      - name: Free additional space on runner
+        run: .github/workflows/helpers/free_space_on_runner.sh
+
+      - name: Build Legion
+        env:
+          FF_GPU_BACKEND: ${{ matrix.gpu_backend }}
+        run: .github/workflows/helpers/prebuild_legion.sh
+
+      - name: Archive compiled Legion library (CUDA)
+        env:
+          FF_GPU_BACKEND: ${{ matrix.gpu_backend }}
+        uses: actions/upload-artifact@v3
+        with:
+          name: legion_ubuntu-20.04_${{ matrix.gpu_backend }}-${{ matrix.gpu_backend_version }}_py${{ matrix.python_version }}
+          path: prebuilt_legion_assets/legion_ubuntu-20.04_${{ matrix.gpu_backend }}-${{ matrix.gpu_backend_version }}_py${{ matrix.python_version }}.tar.gz
+
+  create-release:
+    name: Create new release
+    runs-on: ubuntu-20.04
+    needs: prebuild-legion
+    steps:
+      - name: Checkout Git Repository
+        uses: actions/checkout@v3
+      - name: Free additional space on runner
+        run: .github/workflows/helpers/free_space_on_runner.sh
+      - name: Create folder for artifacts
+        run: mkdir artifacts unwrapped_artifacts
+      - name: Download artifacts
+        uses: actions/download-artifact@v3
+        with:
+          path: ./artifacts
+      - name: Display structure of downloaded files
+        working-directory: ./artifacts
+        run: ls -R
+      - name: Unwrap all artifacts
+        working-directory: ./artifacts
+        run: find . -maxdepth 2 -mindepth 2 -type f -name "*.tar.gz" -exec mv {} ../unwrapped_artifacts/  \;
+      - name: Get datetime
+        run: echo "RELEASE_DATETIME=$(date '+%Y-%m-%dT%H-%M-%S')" >> $GITHUB_ENV
+      - name: Release
+        env:
+          NAME: ${{ env.RELEASE_DATETIME }}
+          TAG_NAME: ${{ env.RELEASE_DATETIME }}
+          GITHUB_TOKEN: ${{ secrets.FLEXFLOW_TOKEN }}
+        run: gh release create $TAG_NAME ./unwrapped_artifacts/*.tar.gz --repo flexflow/flexflow-third-party
diff --git a/CMakeLists.txt b/CMakeLists.txt
index 32399ed4d8..648b46b49e 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -48,6 +48,9 @@ option(BUILD_SHARED_LIBS "Build shared libraries instead of static ones" ON)
 # option for using Python
 option(FF_USE_PYTHON "Enable Python" ON)
 
+# option for building legion only 
+option(BUILD_LEGION_ONLY "Build Legion only" OFF)
+
 # option to download pre-compiled NCCL/Legion libraries
 option(FF_USE_PREBUILT_NCCL "Enable use of NCCL pre-compiled library, if available" ON)
 option(FF_USE_PREBUILT_LEGION "Enable use of Legion pre-compiled library, if available" ON)
@@ -235,266 +238,271 @@ if (FF_GPU_BACKEND STREQUAL "cuda" OR FF_GPU_BACKEND STREQUAL "hip_cuda")
   include(cudnn)
 endif()
 
-# NCCL
-if(FF_USE_NCCL)
-  if(FF_GPU_BACKEND STREQUAL "hip_cuda" OR FF_GPU_BACKEND STREQUAL "cuda")
-    include(nccl)
-  endif() 
-  list(APPEND FF_CC_FLAGS
-    -DFF_USE_NCCL)
-  list(APPEND FF_NVCC_FLAGS
-    -DFF_USE_NCCL)
-endif()
-
-# Inference tests
-if(INFERENCE_TESTS)
-  list(APPEND FF_CC_FLAGS
-    -DINFERENCE_TESTS)
-  list(APPEND FF_NVCC_FLAGS
-    -DINFERENCE_TESTS)
-endif()
-
 # Legion
 include(legion)
 
-# json
-include(json)
-
-# variant
-include(variant)
-
-# optional
-include(optional)
-
-if (FF_GPU_BACKEND STREQUAL "cuda")
-  list(APPEND FF_CC_FLAGS
-    -DFF_USE_CUDA)
-  list(APPEND FF_NVCC_FLAGS
-    -DFF_USE_CUDA)
-elseif (FF_GPU_BACKEND STREQUAL "hip_cuda")
-  list(APPEND FF_CC_FLAGS
-    -DFF_USE_HIP_CUDA)
-  list(APPEND FF_HIPCC_FLAGS
-    -DFF_USE_HIP_CUDA)
-elseif (FF_GPU_BACKEND STREQUAL "hip_rocm")
-  list(APPEND FF_CC_FLAGS
-    -DFF_USE_HIP_ROCM)
-  list(APPEND FF_HIPCC_FLAGS
-    -DFF_USE_HIP_ROCM)
-else()
-endif()
+# Not build FlexFlow if BUILD_LEGION_ONLY is ON
+if(NOT BUILD_LEGION_ONLY)
+  # NCCL
+  if(FF_USE_NCCL)
+    if(FF_GPU_BACKEND STREQUAL "hip_cuda" OR FF_GPU_BACKEND STREQUAL "cuda")
+      include(nccl)
+    endif() 
+    list(APPEND FF_CC_FLAGS
+      -DFF_USE_NCCL)
+    list(APPEND FF_NVCC_FLAGS
+      -DFF_USE_NCCL)
+  endif()
 
-# Start build FlexFlow
-if (CMAKE_BUILD_TYPE STREQUAL "Debug")
+  # Inference tests
+  if(INFERENCE_TESTS)
   list(APPEND FF_CC_FLAGS
-    -DFF_DEBUG)
+    -DINFERENCE_TESTS)
   list(APPEND FF_NVCC_FLAGS
-    -DFF_DEBUG)
-endif()
+    -DINFERENCE_TESTS)
+  endif()
+  
+  # json
+  include(json)
+
+  # variant
+  include(variant)
+
+  # optional
+  include(optional)
+
+  if (FF_GPU_BACKEND STREQUAL "cuda")
+    list(APPEND FF_CC_FLAGS
+      -DFF_USE_CUDA)
+    list(APPEND FF_NVCC_FLAGS
+      -DFF_USE_CUDA)
+  elseif (FF_GPU_BACKEND STREQUAL "hip_cuda")
+    list(APPEND FF_CC_FLAGS
+      -DFF_USE_HIP_CUDA)
+    list(APPEND FF_HIPCC_FLAGS
+      -DFF_USE_HIP_CUDA)
+  elseif (FF_GPU_BACKEND STREQUAL "hip_rocm")
+    list(APPEND FF_CC_FLAGS
+      -DFF_USE_HIP_ROCM)
+    list(APPEND FF_HIPCC_FLAGS
+      -DFF_USE_HIP_ROCM)
+  else()
+  endif()
 
-message(STATUS "FlexFlow MAX_DIM: ${FF_MAX_DIM}")
-message(STATUS "LEGION_MAX_RETURN_SIZE: ${LEGION_MAX_RETURN_SIZE}")
+  # Start build FlexFlow
+  if (CMAKE_BUILD_TYPE STREQUAL "Debug")
+    list(APPEND FF_CC_FLAGS
+      -DFF_DEBUG)
+    list(APPEND FF_NVCC_FLAGS
+      -DFF_DEBUG)
+  endif()
 
-list(APPEND FF_CC_FLAGS
-  -DMAX_TENSOR_DIM=${FF_MAX_DIM}
-  -DLEGION_MAX_RETURN_SIZE=${LEGION_MAX_RETURN_SIZE})
+  message(STATUS "FlexFlow MAX_DIM: ${FF_MAX_DIM}")
+  message(STATUS "LEGION_MAX_RETURN_SIZE: ${LEGION_MAX_RETURN_SIZE}")
 
-if(FF_USE_AVX2)
   list(APPEND FF_CC_FLAGS
-    -DFF_USE_AVX2
-    -mavx2)
-endif()
-
-list(APPEND FF_NVCC_FLAGS
-  -Wno-deprecated-gpu-targets
-  -DMAX_TENSOR_DIM=${FF_MAX_DIM}
-  -DLEGION_MAX_RETURN_SIZE=${LEGION_MAX_RETURN_SIZE})
-
-list(APPEND FF_LD_FLAGS
-  -lrt
-  -ldl
-  -rdynamic
-  -lstdc++fs)
-
-# Set FF FLAGS
-add_compile_options(${FF_CC_FLAGS})
-set(CUDA_NVCC_FLAGS ${CUDA_NVCC_FLAGS} ${FF_NVCC_FLAGS} -UNDEBUG)
-link_libraries(${FF_LD_FLAGS})
-
-list(APPEND FLEXFLOW_INCLUDE_DIRS
-  ${FLEXFLOW_ROOT}/include
-  ${FLEXFLOW_ROOT})
-
-file(GLOB_RECURSE FLEXFLOW_HDR
-  LIST_DIRECTORIES False
-  ${FLEXFLOW_ROOT}/include/*.h)
-  list(APPEND FLEXFLOW_HDR ${FLEXFLOW_ROOT}/inference/file_loader.h)
-
-file(GLOB_RECURSE FLEXFLOW_SRC
-  LIST_DIRECTORIES False
-  ${FLEXFLOW_ROOT}/src/*.cc)
-list(REMOVE_ITEM FLEXFLOW_SRC "${FLEXFLOW_ROOT}/src/runtime/cpp_driver.cc")
-list(APPEND FLEXFLOW_SRC ${FLEXFLOW_ROOT}/inference/file_loader.cc)
-
-set(FLEXFLOW_CPP_DRV_SRC
-  ${FLEXFLOW_ROOT}/src/runtime/cpp_driver.cc)
-
-add_library(substitution_loader SHARED
-  ${FLEXFLOW_ROOT}/src/runtime/substitution_loader.cc)
-target_include_directories(substitution_loader PRIVATE ${FLEXFLOW_INCLUDE_DIRS})
-target_link_libraries(substitution_loader nlohmann_json::nlohmann_json)
+    -DMAX_TENSOR_DIM=${FF_MAX_DIM}
+    -DLEGION_MAX_RETURN_SIZE=${LEGION_MAX_RETURN_SIZE})
 
+  if(FF_USE_AVX2)
+    list(APPEND FF_CC_FLAGS
+      -DFF_USE_AVX2
+      -mavx2)
+  endif()
 
-#message("FLEXFLOW_INCLUDE_DIRS: ${FLEXFLOW_INCLUDE_DIRS}")
+  list(APPEND FF_NVCC_FLAGS
+    -Wno-deprecated-gpu-targets
+    -DMAX_TENSOR_DIM=${FF_MAX_DIM}
+    -DLEGION_MAX_RETURN_SIZE=${LEGION_MAX_RETURN_SIZE})
+
+  list(APPEND FF_LD_FLAGS
+    -lrt
+    -ldl
+    -rdynamic
+    -lstdc++fs)
+
+  # Set FF FLAGS
+  add_compile_options(${FF_CC_FLAGS})
+  set(CUDA_NVCC_FLAGS ${CUDA_NVCC_FLAGS} ${FF_NVCC_FLAGS} -UNDEBUG)
+  link_libraries(${FF_LD_FLAGS})
+
+  list(APPEND FLEXFLOW_INCLUDE_DIRS
+    ${FLEXFLOW_ROOT}/include
+    ${FLEXFLOW_ROOT})
+
+  file(GLOB_RECURSE FLEXFLOW_HDR
+    LIST_DIRECTORIES False
+    ${FLEXFLOW_ROOT}/include/*.h)
+  
+  list(APPEND FLEXFLOW_HDR ${FLEXFLOW_ROOT}/inference/file_loader.h)
 
-# compile flexflow lib
-if (FF_GPU_BACKEND STREQUAL "cuda")
-  file(GLOB_RECURSE FLEXFLOW_GPU_SRC
+  file(GLOB_RECURSE FLEXFLOW_SRC
     LIST_DIRECTORIES False
-    ${FLEXFLOW_ROOT}/src/*.cu)
+    ${FLEXFLOW_ROOT}/src/*.cc)
+  
+  list(REMOVE_ITEM FLEXFLOW_SRC "${FLEXFLOW_ROOT}/src/runtime/cpp_driver.cc")
+  list(APPEND FLEXFLOW_SRC ${FLEXFLOW_ROOT}/inference/file_loader.cc)
 
-  add_compile_definitions(FF_USE_CUDA)
+  set(FLEXFLOW_CPP_DRV_SRC
+    ${FLEXFLOW_ROOT}/src/runtime/cpp_driver.cc)
 
-  if(BUILD_SHARED_LIBS)
-    cuda_add_library(flexflow SHARED ${FLEXFLOW_GPU_SRC} ${FLEXFLOW_SRC} OPTIONS ${CUDA_GENCODE})
-  else()
-    cuda_add_library(flexflow STATIC ${FLEXFLOW_GPU_SRC} ${FLEXFLOW_SRC} OPTIONS ${CUDA_GENCODE})
-  endif()
-elseif(FF_GPU_BACKEND STREQUAL "hip_cuda" OR FF_GPU_BACKEND STREQUAL "hip_rocm")
-  file(GLOB_RECURSE FLEXFLOW_GPU_SRC
-    LIST_DIRECTORIES False
-    ${FLEXFLOW_ROOT}/src/*.cpp)
+  add_library(substitution_loader SHARED
+    ${FLEXFLOW_ROOT}/src/runtime/substitution_loader.cc)
+  target_include_directories(substitution_loader PRIVATE ${FLEXFLOW_INCLUDE_DIRS})
+  target_link_libraries(substitution_loader nlohmann_json::nlohmann_json)
 
-  if(BUILD_SHARED_LIBS)
-    add_library(flexflow SHARED ${FLEXFLOW_GPU_SRC} ${FLEXFLOW_SRC})
-  else()
-    add_library(flexflow STATIC ${FLEXFLOW_GPU_SRC} ${FLEXFLOW_SRC})
-  endif()
 
-  list(APPEND CMAKE_PREFIX_PATH ${ROCM_PATH}/hip ${ROCM_PATH})
+  #message("FLEXFLOW_INCLUDE_DIRS: ${FLEXFLOW_INCLUDE_DIRS}")
 
-  find_package(hip REQUIRED)
+  # compile flexflow lib
+  if (FF_GPU_BACKEND STREQUAL "cuda")
+    file(GLOB_RECURSE FLEXFLOW_GPU_SRC
+      LIST_DIRECTORIES False
+      ${FLEXFLOW_ROOT}/src/*.cu)
 
-  if (FF_GPU_BACKEND STREQUAL "hip_cuda")
-    # The targets defined by the hip cmake config only target amd devices.
-    # For targeting nvidia devices, we'll make our own interface target,
-    # hip_device_nvidia, that includes the rocm and hip headers. 
-    add_library(hip_device_nvidia INTERFACE)
+    add_compile_definitions(FF_USE_CUDA)
 
-    if (NOT FF_CUDA_ARCH STREQUAL "")
-      target_compile_options(hip_device_nvidia INTERFACE -arch=compute_${FF_CUDA_ARCH})
+    if(BUILD_SHARED_LIBS)
+      cuda_add_library(flexflow SHARED ${FLEXFLOW_GPU_SRC} ${FLEXFLOW_SRC} OPTIONS ${CUDA_GENCODE})
+    else()
+      cuda_add_library(flexflow STATIC ${FLEXFLOW_GPU_SRC} ${FLEXFLOW_SRC} OPTIONS ${CUDA_GENCODE})
     endif()
+  elseif(FF_GPU_BACKEND STREQUAL "hip_cuda" OR FF_GPU_BACKEND STREQUAL "hip_rocm")
+    file(GLOB_RECURSE FLEXFLOW_GPU_SRC
+      LIST_DIRECTORIES False
+      ${FLEXFLOW_ROOT}/src/*.cpp)
 
-    target_include_directories(hip_device_nvidia SYSTEM INTERFACE ${HIP_INCLUDE_DIRS} ${ROCM_PATH}/include)
-    target_include_directories(hip_device_nvidia INTERFACE ${HIP_INCLUDE_DIRS} ${ROCM_PATH}/include)
-
-    add_compile_definitions(FF_USE_HIP_CUDA)
-
-    # Linking cuda: 
-    # We do not explicitly link cuda. hipcc when targeting nvidia will 
-    # use nvcc under the hood. nvcc when used for linking will handle 
-    # linking cuda dependencies
-    target_link_libraries(flexflow hip_device_nvidia)
-  elseif(FF_GPU_BACKEND STREQUAL "hip_rocm")
-    find_package(hipblas REQUIRED)
-    find_package(miopen REQUIRED)
-    if(FF_USE_NCCL)
-      find_package(rccl REQUIRED)
+    if(BUILD_SHARED_LIBS)
+      add_library(flexflow SHARED ${FLEXFLOW_GPU_SRC} ${FLEXFLOW_SRC})
+    else()
+      add_library(flexflow STATIC ${FLEXFLOW_GPU_SRC} ${FLEXFLOW_SRC})
     endif()
-    # find_package(rocrand REQUIRED)
-    find_library(HIP_RAND_LIBRARY hiprand REQUIRED)
 
-    add_compile_definitions(FF_USE_HIP_ROCM)
-
-    if (FF_HIP_ARCH STREQUAL "")
-      message(FATAL_ERROR "FF_HIP_ARCH is undefined")
-    endif()
-    set_property(TARGET flexflow PROPERTY HIP_ARCHITECTURES "${HIP_ARCH_LIST}")
-
-    message(STATUS "FF_GPU_BACKEND: ${FF_GPU_BACKEND}")
-    message(STATUS "FF_HIP_ARCH: ${FF_HIP_ARCH}")
-    message(STATUS "HIP_ARCH_LIST: ${HIP_ARCH_LIST}")
-    get_property(CHECK_HIP_ARCHS TARGET flexflow PROPERTY HIP_ARCHITECTURES)
-    message(STATUS "CHECK_HIP_ARCHS: ${CHECK_HIP_ARCHS}")
-    message(STATUS "HIP_CLANG_PATH: ${HIP_CLANG_PATH}")
-
-    # The hip cmake config module defines three targets, 
-    # hip::amdhip64, hip::host, and hip::device.
-    #
-    # hip::host and hip::device are interface targets. hip::amdhip64 is an 
-    # imported target for libamdhip.
-    #
-    # You do not directly link to hip::amdhip64. hip::host links to hip::amdhip64
-    # and hip::device links to hip::host. Link to hip::host to just use hip without 
-    # compiling any GPU code. Link to hip::device to compile the GPU device code.
-    #
-    # Docs (outdated):
-    # https://rocmdocs.amd.com/en/latest/Installation_Guide/Using-CMake-with-AMD-ROCm.html
-    target_link_libraries(flexflow hip::device roc::hipblas MIOpen ${HIP_RAND_LIBRARY})
-    if(FF_USE_NCCL)
+    list(APPEND CMAKE_PREFIX_PATH ${ROCM_PATH}/hip ${ROCM_PATH})
+
+    find_package(hip REQUIRED)
+
+    if (FF_GPU_BACKEND STREQUAL "hip_cuda")
+      # The targets defined by the hip cmake config only target amd devices.
+      # For targeting nvidia devices, we'll make our own interface target,
+      # hip_device_nvidia, that includes the rocm and hip headers. 
+      add_library(hip_device_nvidia INTERFACE)
+
+      if (NOT FF_CUDA_ARCH STREQUAL "")
+        target_compile_options(hip_device_nvidia INTERFACE -arch=compute_${FF_CUDA_ARCH})
+      endif()
+
+      target_include_directories(hip_device_nvidia SYSTEM INTERFACE ${HIP_INCLUDE_DIRS} ${ROCM_PATH}/include)
+      target_include_directories(hip_device_nvidia INTERFACE ${HIP_INCLUDE_DIRS} ${ROCM_PATH}/include)
+
+      add_compile_definitions(FF_USE_HIP_CUDA)
+
+      # Linking cuda: 
+      # We do not explicitly link cuda. hipcc when targeting nvidia will 
+      # use nvcc under the hood. nvcc when used for linking will handle 
+      # linking cuda dependencies
+      target_link_libraries(flexflow hip_device_nvidia)
+    elseif(FF_GPU_BACKEND STREQUAL "hip_rocm")
+      find_package(hipblas REQUIRED)
+      find_package(miopen REQUIRED)
+      if(FF_USE_NCCL)
+        find_package(rccl REQUIRED)
+      endif()
+      # find_package(rocrand REQUIRED)
+      find_library(HIP_RAND_LIBRARY hiprand REQUIRED)
+
+      add_compile_definitions(FF_USE_HIP_ROCM)
+
+      if (FF_HIP_ARCH STREQUAL "")
+        message(FATAL_ERROR "FF_HIP_ARCH is undefined")
+      endif()
+      set_property(TARGET flexflow PROPERTY HIP_ARCHITECTURES "${HIP_ARCH_LIST}")
+
+      message(STATUS "FF_GPU_BACKEND: ${FF_GPU_BACKEND}")
+      message(STATUS "FF_HIP_ARCH: ${FF_HIP_ARCH}")
+      message(STATUS "HIP_ARCH_LIST: ${HIP_ARCH_LIST}")
+      get_property(CHECK_HIP_ARCHS TARGET flexflow PROPERTY HIP_ARCHITECTURES)
+      message(STATUS "CHECK_HIP_ARCHS: ${CHECK_HIP_ARCHS}")
+      message(STATUS "HIP_CLANG_PATH: ${HIP_CLANG_PATH}")
+
+      # The hip cmake config module defines three targets, 
+      # hip::amdhip64, hip::host, and hip::device.
+      #
+      # hip::host and hip::device are interface targets. hip::amdhip64 is an 
+      # imported target for libamdhip.
+      #
+      # You do not directly link to hip::amdhip64. hip::host links to hip::amdhip64
+      # and hip::device links to hip::host. Link to hip::host to just use hip without 
+      # compiling any GPU code. Link to hip::device to compile the GPU device code.
+      #
+      # Docs (outdated):
+      # https://rocmdocs.amd.com/en/latest/Installation_Guide/Using-CMake-with-AMD-ROCm.html
+      target_link_libraries(flexflow hip::device roc::hipblas MIOpen ${HIP_RAND_LIBRARY})
+      if(FF_USE_NCCL)
         target_link_libraries(flexflow rccl)
+      endif()
     endif()
+  else()
+    message(FATAL_ERROR "Unsupported FF_GPU_BACKEND for cmake: ${FF_GPU_BACKEND}")
   endif()
-else()
-  message(FATAL_ERROR "Unsupported FF_GPU_BACKEND for cmake: ${FF_GPU_BACKEND}")
-endif()
 
-if(FF_USE_NCCL AND (FF_GPU_BACKEND STREQUAL "hip_cuda" OR FF_GPU_BACKEND STREQUAL "cuda"))
-  add_dependencies(flexflow ${NCCL_NAME})
-endif()
+  if(FF_USE_NCCL AND (FF_GPU_BACKEND STREQUAL "hip_cuda" OR FF_GPU_BACKEND STREQUAL "cuda"))
+    add_dependencies(flexflow ${NCCL_NAME})
+  endif()
 
-target_include_directories(flexflow PUBLIC ${FLEXFLOW_INCLUDE_DIRS})
-# LEGION_URL is defined if we found a precompiled Legion library to download
-if(LEGION_URL)
-  # Legion builds produce two library files: one for the Legion runtime and one for the Realm runtime. 
-  # When linking FlexFlow to a precompiled version of Legion, we need to manually link to both library files.
-  target_link_libraries(flexflow ${LEGION_LIBRARY} ${REALM_LIBRARY} ${FLEXFLOW_EXT_LIBRARIES} nlohmann_json::nlohmann_json mpark_variant optional)
-  add_dependencies(flexflow ${LEGION_NAME})
-else()
-  # When building Legion from source, we do so by calling add_subdirectory(), and obtain a library with both the
-  # Legion and Realm runtimes. The library's name is saved into the LEGION_LIBRARY variable. Hence, we only need
-  # to link FlexFlow to ${LEGION_LIBRARY}
-  target_link_libraries(flexflow ${LEGION_LIBRARY} ${FLEXFLOW_EXT_LIBRARIES} nlohmann_json::nlohmann_json mpark_variant optional)
-endif()
+  target_include_directories(flexflow PUBLIC ${FLEXFLOW_INCLUDE_DIRS})
+  # LEGION_URL is defined if we found a precompiled Legion library to download
+  if(LEGION_URL)
+    # Legion builds produce two library files: one for the Legion runtime and one for the Realm runtime. 
+    # When linking FlexFlow to a precompiled version of Legion, we need to manually link to both library files.
+    target_link_libraries(flexflow ${LEGION_LIBRARY} ${REALM_LIBRARY} ${FLEXFLOW_EXT_LIBRARIES} nlohmann_json::nlohmann_json mpark_variant optional)
+    add_dependencies(flexflow ${LEGION_NAME})
+  else()
+    # When building Legion from source, we do so by calling add_subdirectory(), and obtain a library with both the
+    # Legion and Realm runtimes. The library's name is saved into the LEGION_LIBRARY variable. Hence, we only need
+    # to link FlexFlow to ${LEGION_LIBRARY}
+    target_link_libraries(flexflow ${LEGION_LIBRARY} ${FLEXFLOW_EXT_LIBRARIES} nlohmann_json::nlohmann_json mpark_variant optional)
+  endif()
 
-#library api version, bump from time to time
-set(SOVERSION 1)
-
-set_target_properties(flexflow PROPERTIES POSITION_INDEPENDENT_CODE ON)
-set_target_properties(flexflow PROPERTIES OUTPUT_NAME "flexflow${INSTALL_SUFFIX}")
-set_target_properties(flexflow PROPERTIES SOVERSION ${SOVERSION})
-if (CMAKE_SYSTEM_NAME STREQUAL "Linux")
-  set_target_properties(flexflow PROPERTIES BUILD_RPATH "\$ORIGIN")
-  set_target_properties(flexflow PROPERTIES INSTALL_RPATH "\$ORIGIN")
-elseif (CMAKE_SYSTEM_NAME STREQUAL "Darwin")
-  set_target_properties(flexflow PROPERTIES BUILD_RPATH "@loader_path")
-  set_target_properties(flexflow PROPERTIES INSTALL_RPATH "@loader_path")
-endif()
+  #library api version, bump from time to time
+  set(SOVERSION 1)
+
+  set_target_properties(flexflow PROPERTIES POSITION_INDEPENDENT_CODE ON)
+  set_target_properties(flexflow PROPERTIES OUTPUT_NAME "flexflow${INSTALL_SUFFIX}")
+  set_target_properties(flexflow PROPERTIES SOVERSION ${SOVERSION})
+  if (CMAKE_SYSTEM_NAME STREQUAL "Linux")
+    set_target_properties(flexflow PROPERTIES BUILD_RPATH "\$ORIGIN")
+    set_target_properties(flexflow PROPERTIES INSTALL_RPATH "\$ORIGIN")
+  elseif (CMAKE_SYSTEM_NAME STREQUAL "Darwin")
+    set_target_properties(flexflow PROPERTIES BUILD_RPATH "@loader_path")
+    set_target_properties(flexflow PROPERTIES INSTALL_RPATH "@loader_path")
+  endif()
 
-# python related
-if (FF_USE_PYTHON)
-  # create flexflow_cffi_header.py
-  add_custom_command(TARGET flexflow
-    PRE_BUILD	
-    COMMAND ${FLEXFLOW_ROOT}/python/flexflow_cffi_build.py --ffhome-dir ${FLEXFLOW_ROOT} --output-dir ${FLEXFLOW_ROOT}/python/flexflow/core
-    WORKING_DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}
-    COMMENT "Creating flexflow_cffi_header.py..."
-  )
-  if (NOT FF_BUILD_FROM_PYPI)
-    # generate the Legion Python bindings library. When building from pip, we need to do this post-install to prevent Legion from overwriting the path to the Legion shared library
-    add_custom_command(TARGET flexflow
-      POST_BUILD	
-      COMMAND ${PYTHON_EXECUTABLE} ${CMAKE_CURRENT_SOURCE_DIR}/deps/legion/bindings/python/setup.py build --cmake-build-dir ${Legion_BINARY_DIR}/runtime --prefix ${Legion_BINARY_DIR} --build-lib=${Legion_BINARY_DIR}/bindings/python ${Legion_PYTHON_EXTRA_INSTALL_ARGS}
-      WORKING_DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}/deps/legion/bindings/python
-    )
-    # create flexflow_python interpreter. When building from pip, we install the FF_HOME/python/flexflow_python script instead.
+  # python related
+  if (FF_USE_PYTHON)
+    # create flexflow_cffi_header.py
     add_custom_command(TARGET flexflow
       PRE_BUILD	
-      COMMAND ${PYTHON_EXECUTABLE} ${FLEXFLOW_ROOT}/python/flexflow_python_build.py --build-dir ${CMAKE_BINARY_DIR}
+      COMMAND ${FLEXFLOW_ROOT}/python/flexflow_cffi_build.py --ffhome-dir ${FLEXFLOW_ROOT} --output-dir ${FLEXFLOW_ROOT}/python/flexflow/core
       WORKING_DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}
-      COMMENT "Creating flexflow_python interpreter..."
+      COMMENT "Creating flexflow_cffi_header.py..."
     )
-    install(PROGRAMS ${CMAKE_BINARY_DIR}/flexflow_python DESTINATION "bin")
+    if (NOT FF_BUILD_FROM_PYPI)
+      # generate the Legion Python bindings library. When building from pip, we need to do this post-install to prevent Legion from overwriting the path to the Legion shared library
+      add_custom_command(TARGET flexflow
+        POST_BUILD	
+        COMMAND ${PYTHON_EXECUTABLE} ${CMAKE_CURRENT_SOURCE_DIR}/deps/legion/bindings/python/setup.py build --cmake-build-dir ${Legion_BINARY_DIR}/runtime --prefix ${Legion_BINARY_DIR} --build-lib=${Legion_BINARY_DIR}/bindings/python ${Legion_PYTHON_EXTRA_INSTALL_ARGS}
+        WORKING_DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}/deps/legion/bindings/python
+      )
+      # create flexflow_python interpreter. When building from pip, we install the FF_HOME/python/flexflow_python script instead.
+      add_custom_command(TARGET flexflow
+        PRE_BUILD	
+        COMMAND ${PYTHON_EXECUTABLE} ${FLEXFLOW_ROOT}/python/flexflow_python_build.py --build-dir ${CMAKE_BINARY_DIR}
+        WORKING_DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}
+        COMMENT "Creating flexflow_python interpreter..."
+      )
+      install(PROGRAMS ${CMAKE_BINARY_DIR}/flexflow_python DESTINATION "bin")
+    endif()
   endif()
 endif()
 
@@ -531,13 +539,13 @@ if(FF_BUILD_UNIT_TESTS)
   add_subdirectory(tests/unit)
 endif()
 
-if(FF_BUILD_SUBSTITUTION_TOOL)
-  add_subdirectory(tools/protobuf_to_json)
-endif()
+  if(FF_BUILD_SUBSTITUTION_TOOL)
+    add_subdirectory(tools/protobuf_to_json)
+  endif()
 
-if(FF_BUILD_VISUALIZATION_TOOL)
-  add_subdirectory(tools/substitutions_to_dot)
-endif()
+  if(FF_BUILD_VISUALIZATION_TOOL)
+    add_subdirectory(tools/substitutions_to_dot)
+  endif()
 
 if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_TOKENIZER)
   if (FF_GPU_BACKEND STREQUAL "hip_rocm")
diff --git a/cmake/cuda.cmake b/cmake/cuda.cmake
index f4111d8ea6..d7f52543a1 100644
--- a/cmake/cuda.cmake
+++ b/cmake/cuda.cmake
@@ -54,7 +54,7 @@ if(CUDA_FOUND)
     set(FF_CUDA_ARCH ${DETECTED_CUDA_ARCH})
   # Set FF_CUDA_ARCH to the list of all GPU architectures compatible with FlexFlow
   elseif("${FF_CUDA_ARCH}" STREQUAL "all") 
-    set(FF_CUDA_ARCH 60,61,62,70,72,75,80,86)
+    set(FF_CUDA_ARCH 60,61,62,70,72,75,80,86,90)
   endif()
   
   # create CUDA_GENCODE list based on FF_CUDA_ARCH
diff --git a/config/config.inc b/config/config.inc
index eb1ad21fc0..7f1f0ffcf4 100644
--- a/config/config.inc
+++ b/config/config.inc
@@ -67,6 +67,15 @@ if [ -n "$CUDNN_DIR" ]; then
   SET_CUDNN="-DCUDNN_PATH=${CUDNN_DIR}"
 fi
 
+# build legion only 
+if [ "$BUILD_LEGION_ONLY" = "ON" ]; then
+  SET_BUILD_LEGION_ONLY="-DBUILD_LEGION_ONLY=ON"
+elif [ "$BUILD_LEGION_ONLY" = "OFF" ]; then
+  SET_BUILD_LEGION_ONLY="-DBUILD_LEGION_ONLY=OFF"
+else
+  SET_BUILD_LEGION_ONLY="-DBUILD_LEGION_ONLY=OFF"
+fi
+
 # enable Python
 if [ "$FF_USE_PYTHON" = "ON" ]; then
   SET_PYTHON="-DFF_USE_PYTHON=ON"
@@ -218,7 +227,7 @@ if [ -n "$FF_GPU_BACKEND" ]; then
   fi
 fi
 
-CMAKE_FLAGS="-DCUDA_USE_STATIC_CUDA_RUNTIME=OFF -DLegion_HIJACK_CUDART=OFF ${SET_CC} ${SET_CXX} ${SET_INSTALL_DIR} ${SET_INFERENCE_TESTS} ${SET_LIBTORCH_PATH} ${SET_BUILD} ${SET_CUDA_ARCH} ${SET_CUDA} ${SET_CUDNN} ${SET_HIP_ARCH} ${SET_PYTHON} ${SET_NCCL} ${SET_NCCL_DIR} ${SET_LEGION_NETWORKS} ${SET_EXAMPLES} ${SET_INFERENCE_EXAMPLES} ${SET_USE_PREBUILT_LEGION} ${SET_USE_PREBUILT_NCCL} ${SET_USE_ALL_PREBUILT_LIBRARIES} ${SET_BUILD_UNIT_TESTS} ${SET_AVX2} ${SET_MAX_DIM} ${SET_LEGION_MAX_RETURN_SIZE} ${SET_ROCM_PATH} ${SET_FF_GPU_BACKEND}"
+CMAKE_FLAGS="-DCUDA_USE_STATIC_CUDA_RUNTIME=OFF -DLegion_HIJACK_CUDART=OFF ${SET_CC} ${SET_CXX} ${SET_INSTALL_DIR} ${SET_INFERENCE_TESTS} ${SET_LIBTORCH_PATH} ${SET_BUILD} ${SET_CUDA_ARCH} ${SET_CUDA} ${SET_CUDNN} ${SET_HIP_ARCH} ${SET_PYTHON} ${SET_BUILD_LEGION_ONLY} ${SET_NCCL} ${SET_NCCL_DIR} ${SET_LEGION_NETWORKS} ${SET_EXAMPLES} ${SET_INFERENCE_EXAMPLES} ${SET_USE_PREBUILT_LEGION} ${SET_USE_PREBUILT_NCCL} ${SET_USE_ALL_PREBUILT_LIBRARIES} ${SET_BUILD_UNIT_TESTS} ${SET_AVX2} ${SET_MAX_DIM} ${SET_LEGION_MAX_RETURN_SIZE} ${SET_ROCM_PATH} ${SET_FF_GPU_BACKEND}"
 
 function run_cmake() {
 SRC_LOCATION=${SRC_LOCATION:=`dirname $0`/../}
diff --git a/config/config.linux b/config/config.linux
index 3686237538..5f15090a02 100755
--- a/config/config.linux
+++ b/config/config.linux
@@ -77,6 +77,9 @@ FF_USE_AVX2=${FF_USE_AVX2:-OFF}
 # set MAX_DIM
 FF_MAX_DIM=${FF_MAX_DIM:-5}
 
+# set BUILD_LEGION_ONLY
+BUILD_LEGION_ONLY=${BUILD_LEGION_ONLY:-OFF}
+
 # set LEGION_MAX_RETURN_SIZE
 LEGION_MAX_RETURN_SIZE=${LEGION_MAX_RETURN_SIZE:-262144}
 
@@ -97,7 +100,7 @@ fi
 
 function get_build_configs() {
     # Create a string with the values of the variables set in this script
-    BUILD_CONFIGS="FF_CUDA_ARCH=${FF_CUDA_ARCH} FF_HIP_ARCH=${FF_HIP_ARCH} CUDNN_DIR=${CUDNN_DIR} CUDA_DIR=${CUDA_DIR} NCCL_DIR=${NCCL_DIR} FF_USE_PYTHON=${FF_USE_PYTHON} FF_GASNET_CONDUIT=${FF_GASNET_CONDUIT} FF_UCX_URL=${FF_UCX_URL} FF_LEGION_NETWORKS=${FF_LEGION_NETWORKS} FF_BUILD_ALL_EXAMPLES=${FF_BUILD_ALL_EXAMPLES} FF_BUILD_ALL_INFERENCE_EXAMPLES=${FF_BUILD_ALL_INFERENCE_EXAMPLES} FF_BUILD_UNIT_TESTS=${FF_BUILD_UNIT_TESTS} FF_USE_PREBUILT_NCCL=${FF_USE_PREBUILT_NCCL} FF_USE_PREBUILT_LEGION=${FF_USE_PREBUILT_LEGION} FF_USE_ALL_PREBUILT_LIBRARIES=${FF_USE_ALL_PREBUILT_LIBRARIES} FF_USE_AVX2=${FF_USE_AVX2} FF_MAX_DIM=${FF_MAX_DIM} ROCM_PATH=${ROCM_PATH} FF_GPU_BACKEND=${FF_GPU_BACKEND}"
+    BUILD_CONFIGS="FF_CUDA_ARCH=${FF_CUDA_ARCH} FF_HIP_ARCH=${FF_HIP_ARCH} CUDNN_DIR=${CUDNN_DIR} CUDA_DIR=${CUDA_DIR} NCCL_DIR=${NCCL_DIR} FF_USE_PYTHON=${FF_USE_PYTHON} BUILD_LEGION_ONLY=${BUILD_LEGION_ONLY} FF_GASNET_CONDUIT=${FF_GASNET_CONDUIT} FF_UCX_URL=${FF_UCX_URL} FF_LEGION_NETWORKS=${FF_LEGION_NETWORKS} FF_BUILD_ALL_EXAMPLES=${FF_BUILD_ALL_EXAMPLES} FF_BUILD_ALL_INFERENCE_EXAMPLES=${FF_BUILD_ALL_INFERENCE_EXAMPLES} FF_BUILD_UNIT_TESTS=${FF_BUILD_UNIT_TESTS} FF_USE_PREBUILT_NCCL=${FF_USE_PREBUILT_NCCL} FF_USE_PREBUILT_LEGION=${FF_USE_PREBUILT_LEGION} FF_USE_ALL_PREBUILT_LIBRARIES=${FF_USE_ALL_PREBUILT_LIBRARIES} FF_USE_AVX2=${FF_USE_AVX2} FF_MAX_DIM=${FF_MAX_DIM} ROCM_PATH=${ROCM_PATH} FF_GPU_BACKEND=${FF_GPU_BACKEND}"
 }
 
 if [[ -n "$1" && ( "$1" == "CMAKE_FLAGS" || "$1" == "CUDA_PATH" ) ]]; then
diff --git a/docker/build.sh b/docker/build.sh
index e72c23fcd8..6603d919f5 100755
--- a/docker/build.sh
+++ b/docker/build.sh
@@ -12,6 +12,7 @@ image=${1:-flexflow}
 FF_GPU_BACKEND=${FF_GPU_BACKEND:-cuda}
 cuda_version=${cuda_version:-"empty"}
 hip_version=${hip_version:-"empty"}
+python_version=${python_version:-latest}
 
 # Check docker image name
 if [[ "$image" != @(flexflow-environment|flexflow) ]]; then
@@ -96,7 +97,13 @@ fi
 cores_available=$(nproc --all)
 n_build_cores=$(( cores_available -1 ))
 
-docker build --build-arg "ff_environment_base_image=${ff_environment_base_image}" --build-arg "N_BUILD_CORES=${n_build_cores}" --build-arg "FF_GPU_BACKEND=${FF_GPU_BACKEND}" --build-arg "hip_version=${hip_version}" -t "flexflow-environment-${FF_GPU_BACKEND}${gpu_backend_version}" -f docker/flexflow-environment/Dockerfile .
+# check python_version
+if [[ "$python_version" != @(3.8|3.9|3.10|3.11|latest) ]]; then
+  echo "python_version not supported!"
+  exit 0
+fi
+
+docker build --build-arg "ff_environment_base_image=${ff_environment_base_image}" --build-arg "N_BUILD_CORES=${n_build_cores}" --build-arg "FF_GPU_BACKEND=${FF_GPU_BACKEND}" --build-arg "hip_version=${hip_version}" --build-arg "python_version=${python_version}" -t "flexflow-environment-${FF_GPU_BACKEND}${gpu_backend_version}" -f docker/flexflow-environment/Dockerfile .
 
 # If the user only wants to build the environment image, we are done
 if [[ "$image" == "flexflow-environment" ]]; then
diff --git a/docker/flexflow-environment/Dockerfile b/docker/flexflow-environment/Dockerfile
index a12f31c738..0e9a3cda82 100644
--- a/docker/flexflow-environment/Dockerfile
+++ b/docker/flexflow-environment/Dockerfile
@@ -16,14 +16,29 @@ RUN apt-get update && apt-get install -y --no-install-recommends wget sudo binut
         apt-get upgrade -y libstdc++6
 
 # Install Python3 with Miniconda
-RUN wget -c -q https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh && \
-    mv Miniconda3-latest-Linux-x86_64.sh ~/Miniconda3-latest-Linux-x86_64.sh && \
-    chmod +x ~/Miniconda3-latest-Linux-x86_64.sh && \
-    bash ~/Miniconda3-latest-Linux-x86_64.sh -b -p /opt/conda && \
-    rm ~/Miniconda3-latest-Linux-x86_64.sh && \
-    /opt/conda/bin/conda upgrade --all && \
-    /opt/conda/bin/conda install conda-build conda-verify && \
-    /opt/conda/bin/conda clean -ya
+ARG python_version "latest"
+RUN MINICONDA_SCRIPT_NAME=Miniconda3-latest-Linux-x86_64.sh; \
+    if [ "$python_version" != "3.8" ] && [ "$python_version" != "3.9" ] && [ "$python_version" != "3.10" ] && [ "$python_version" != "3.11" ] && [ "$python_version" != "latest" ]; then \
+        echo "python_version '${python_version}' is not supported, please choose among {3.8, 3.9, 3.10, 3.11 or latest (default)}"; \
+        exit 1; \
+    fi; \
+    if [ "${python_version}" = "3.8" ]; then \
+        MINICONDA_SCRIPT_NAME=Miniconda3-py38_23.5.2-0-Linux-x86_64.sh; \
+    elif [ "${python_version}" = "3.9" ]; then \
+        MINICONDA_SCRIPT_NAME=Miniconda3-py39_23.5.2-0-Linux-x86_64.sh; \
+    elif [ "${python_version}" = "3.10" ]; then \
+        MINICONDA_SCRIPT_NAME=Miniconda3-py310_23.5.2-0-Linux-x86_64.sh; \
+    elif [ "${python_version}" = "3.11" ]; then \
+        MINICONDA_SCRIPT_NAME=Miniconda3-py311_23.5.2-0-Linux-x86_64.sh; \
+    fi; \
+    wget -c -q https://repo.continuum.io/miniconda/${MINICONDA_SCRIPT_NAME} && \
+        mv ./${MINICONDA_SCRIPT_NAME} ~/${MINICONDA_SCRIPT_NAME} && \
+        chmod +x ~/${MINICONDA_SCRIPT_NAME} && \
+        bash ~/${MINICONDA_SCRIPT_NAME} -b -p /opt/conda && \
+        rm ~/${MINICONDA_SCRIPT_NAME} && \
+        /opt/conda/bin/conda upgrade --all && \
+        /opt/conda/bin/conda install conda-build conda-verify && \
+        /opt/conda/bin/conda clean -ya
 
 # Optionally install HIP dependencies
 # Note that amd's docs say to also install the `hip-runtime-nvidia` package. This
diff --git a/docker/flexflow/Dockerfile b/docker/flexflow/Dockerfile
index a7d540bc71..60f9d4d653 100644
--- a/docker/flexflow/Dockerfile
+++ b/docker/flexflow/Dockerfile
@@ -15,6 +15,15 @@ COPY . .
 ARG BUILD_CONFIGS
 ARG N_BUILD_CORES
 
+# Create install directory if needed
+RUN for pair in $BUILD_CONFIGS; do \
+        key=${pair%%=*}; \
+        value=${pair#*=}; \
+        if [ "$key" = "INSTALL_DIR" ] && [ -n "$value" ]; then \
+            mkdir -p "$value"; \
+        fi; \
+    done
+
 # Build and install C++ and Python versions of FlexFlow
 RUN mkdir -p build && cd build && \
     eval "$BUILD_CONFIGS" ../config/config.linux && \

From 300989077a52094fc1f5762eb4fcab421a427e03 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 23 Oct 2023 01:24:13 -0400
Subject: [PATCH 255/344] Fix CUDA cmake (#1205)

---
 cmake/cuda.cmake | 8 ++++++--
 1 file changed, 6 insertions(+), 2 deletions(-)

diff --git a/cmake/cuda.cmake b/cmake/cuda.cmake
index d7f52543a1..a1a66c7cc8 100644
--- a/cmake/cuda.cmake
+++ b/cmake/cuda.cmake
@@ -53,8 +53,12 @@ if(CUDA_FOUND)
     message( STATUS "CUDA Detected CUDA_ARCH : ${DETECTED_CUDA_ARCH}" )
     set(FF_CUDA_ARCH ${DETECTED_CUDA_ARCH})
   # Set FF_CUDA_ARCH to the list of all GPU architectures compatible with FlexFlow
-  elseif("${FF_CUDA_ARCH}" STREQUAL "all") 
-    set(FF_CUDA_ARCH 60,61,62,70,72,75,80,86,90)
+  elseif("${FF_CUDA_ARCH}" STREQUAL "all")
+    if(CUDA_VERSION VERSION_GREATER_EQUAL "11.8")
+      set(FF_CUDA_ARCH 60,61,62,70,72,75,80,86,90)
+    else()
+      set(FF_CUDA_ARCH 60,61,62,70,72,75,80,86)
+    endif()
   endif()
   
   # create CUDA_GENCODE list based on FF_CUDA_ARCH

From 452fa9c21878c9c337ddfeab69e31f096cdf1b61 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 23 Oct 2023 01:35:35 -0400
Subject: [PATCH 256/344] Fix Legion prebuild workflow (#1207)

---
 .github/workflows/prebuild-legion.yml | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/.github/workflows/prebuild-legion.yml b/.github/workflows/prebuild-legion.yml
index 00e7e78a77..1cf0ea2dd8 100644
--- a/.github/workflows/prebuild-legion.yml
+++ b/.github/workflows/prebuild-legion.yml
@@ -24,7 +24,7 @@ jobs:
       matrix:
         gpu_backend: ["cuda", "hip_rocm"]
         gpu_backend_version: ["11.8", "5.6"]
-        python_version: "3.11"
+        python_version: ["3.11"]
         exclude:
           - gpu_backend: "cuda"
             gpu_backend_version: "5.6"

From d1da022b0e46715d926e4eb9edb669ded4126995 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 23 Oct 2023 20:56:51 -0400
Subject: [PATCH 257/344] Fix Legion prebuild workflow (2) (#1208)

* fix

* fix

* fix

* fix
---
 .github/workflows/helpers/prebuild_legion.sh |   2 +-
 .github/workflows/prebuild-legion.yml        |   6 +-
 CMakeLists.txt                               | 260 +++++++++----------
 config/config.linux                          |   2 +-
 4 files changed, 135 insertions(+), 135 deletions(-)

diff --git a/.github/workflows/helpers/prebuild_legion.sh b/.github/workflows/helpers/prebuild_legion.sh
index ccaa58383e..9f5cbe147a 100755
--- a/.github/workflows/helpers/prebuild_legion.sh
+++ b/.github/workflows/helpers/prebuild_legion.sh
@@ -13,7 +13,7 @@ else
   echo "Pre-building Legion with GPU backend: ${gpu_backend}"
 fi
 
-if [[ "${gpu_backend}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; then
+if [[ "${gpu_backend}" == "cuda" || "${gpu_backend}" == "hip_cuda" ]]; then
     # Check that CUDA version is supported. Versions above 12.0 not supported because we don't publish docker images for it yet.
     if [[ "$gpu_backend_version" != @(11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0) ]]; then
         echo "cuda_version is not supported, please choose among {11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0}"
diff --git a/.github/workflows/prebuild-legion.yml b/.github/workflows/prebuild-legion.yml
index 1cf0ea2dd8..267daaee6b 100644
--- a/.github/workflows/prebuild-legion.yml
+++ b/.github/workflows/prebuild-legion.yml
@@ -42,12 +42,12 @@ jobs:
 
       - name: Build Legion
         env:
-          FF_GPU_BACKEND: ${{ matrix.gpu_backend }}
+          gpu_backend: ${{ matrix.gpu_backend }}
+          gpu_backend_version: ${{ matrix.gpu_backend_version }}
+          python_version: ${{ matrix.python_version }}
         run: .github/workflows/helpers/prebuild_legion.sh
 
       - name: Archive compiled Legion library (CUDA)
-        env:
-          FF_GPU_BACKEND: ${{ matrix.gpu_backend }}
         uses: actions/upload-artifact@v3
         with:
           name: legion_ubuntu-20.04_${{ matrix.gpu_backend }}-${{ matrix.gpu_backend_version }}_py${{ matrix.python_version }}
diff --git a/CMakeLists.txt b/CMakeLists.txt
index 648b46b49e..f9ce66a0f1 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -504,156 +504,156 @@ if(NOT BUILD_LEGION_ONLY)
       install(PROGRAMS ${CMAKE_BINARY_DIR}/flexflow_python DESTINATION "bin")
     endif()
   endif()
-endif()
-
-if (INFERENCE_TESTS)
-  target_link_libraries(flexflow "${TORCH_LIBRARIES}")
-  set_property(TARGET flexflow PROPERTY CXX_STANDARD 14)
-endif()
-
-# build binary
-option(FF_BUILD_TOKENIZER "build tokenizer=cpp for LLM serving" ON)
-option(FF_BUILD_RESNET "build resnet example" OFF)
-option(FF_BUILD_RESNEXT "build resnext example" OFF)
-option(FF_BUILD_ALEXNET "build alexnet example" OFF)
-option(FF_BUILD_DLRM "build DLRM example" OFF)
-option(FF_BUILD_XDL "build XDL example" OFF)
-option(FF_BUILD_INCEPTION "build inception example" OFF)
-option(FF_BUILD_CANDLE_UNO "build candle uno example" OFF)
-option(FF_BUILD_TRANSFORMER "build transformer example" OFF)
-option(FF_BUILD_MOE "build mixture of experts example" OFF)
-option(FF_BUILD_MLP_UNIFY "build mlp unify example" OFF)
-option(FF_BUILD_SPLIT_TEST "build split test example" OFF)
-option(FF_BUILD_SPLIT_TEST_2 "build split test 2 example" OFF)
-option(FF_BUILD_MLP_UNIFY_INFERENCE "build mlp unify inference example" OFF)
-option(FF_BUILD_ALL_INFERENCE_EXAMPLES "build all inference examples. Overrides others" OFF)
-option(FF_BUILD_ALL_EXAMPLES "build all examples. Overrides others" OFF)
-option(FF_BUILD_UNIT_TESTS "build non-operator unit tests" OFF)
-option(FF_BUILD_SUBSTITUTION_TOOL "build substitution conversion tool" OFF)
-option(FF_BUILD_VISUALIZATION_TOOL "build substitution visualization tool" OFF)
-
-if(FF_BUILD_UNIT_TESTS)
-  set(BUILD_GMOCK OFF)
-  add_subdirectory(deps/googletest)
-  enable_testing()
-  add_subdirectory(tests/unit)
-endif()
-
-  if(FF_BUILD_SUBSTITUTION_TOOL)
-    add_subdirectory(tools/protobuf_to_json)
+  
+  if (INFERENCE_TESTS)
+    target_link_libraries(flexflow "${TORCH_LIBRARIES}")
+    set_property(TARGET flexflow PROPERTY CXX_STANDARD 14)
   endif()
 
-  if(FF_BUILD_VISUALIZATION_TOOL)
-    add_subdirectory(tools/substitutions_to_dot)
+  # build binary
+  option(FF_BUILD_TOKENIZER "build tokenizer=cpp for LLM serving" ON)
+  option(FF_BUILD_RESNET "build resnet example" OFF)
+  option(FF_BUILD_RESNEXT "build resnext example" OFF)
+  option(FF_BUILD_ALEXNET "build alexnet example" OFF)
+  option(FF_BUILD_DLRM "build DLRM example" OFF)
+  option(FF_BUILD_XDL "build XDL example" OFF)
+  option(FF_BUILD_INCEPTION "build inception example" OFF)
+  option(FF_BUILD_CANDLE_UNO "build candle uno example" OFF)
+  option(FF_BUILD_TRANSFORMER "build transformer example" OFF)
+  option(FF_BUILD_MOE "build mixture of experts example" OFF)
+  option(FF_BUILD_MLP_UNIFY "build mlp unify example" OFF)
+  option(FF_BUILD_SPLIT_TEST "build split test example" OFF)
+  option(FF_BUILD_SPLIT_TEST_2 "build split test 2 example" OFF)
+  option(FF_BUILD_MLP_UNIFY_INFERENCE "build mlp unify inference example" OFF)
+  option(FF_BUILD_ALL_INFERENCE_EXAMPLES "build all inference examples. Overrides others" OFF)
+  option(FF_BUILD_ALL_EXAMPLES "build all examples. Overrides others" OFF)
+  option(FF_BUILD_UNIT_TESTS "build non-operator unit tests" OFF)
+  option(FF_BUILD_SUBSTITUTION_TOOL "build substitution conversion tool" OFF)
+  option(FF_BUILD_VISUALIZATION_TOOL "build substitution visualization tool" OFF)
+
+  if(FF_BUILD_UNIT_TESTS)
+    set(BUILD_GMOCK OFF)
+    add_subdirectory(deps/googletest)
+    enable_testing()
+    add_subdirectory(tests/unit)
   endif()
 
-if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_TOKENIZER)
-  if (FF_GPU_BACKEND STREQUAL "hip_rocm")
-    SET(SPM_USE_BUILTIN_PROTOBUF OFF CACHE BOOL "Use builtin version of protobuf to compile SentencePiece")
-  endif()
-  # Ensure Rust is installed
-  execute_process(COMMAND rustc --version
-                RESULT_VARIABLE RUST_COMMAND_RESULT
-                OUTPUT_VARIABLE RUSTC_OUTPUT
-                ERROR_QUIET)
-  if(NOT RUST_COMMAND_RESULT EQUAL 0)
-    message(FATAL_ERROR "Rust is not installed on the system. Please install it by running: 'curl https://sh.rustup.rs -sSf | sh -s -- -y' and following the instructions on the screen.")
+    if(FF_BUILD_SUBSTITUTION_TOOL)
+      add_subdirectory(tools/protobuf_to_json)
+    endif()
+
+    if(FF_BUILD_VISUALIZATION_TOOL)
+      add_subdirectory(tools/substitutions_to_dot)
+    endif()
+
+  if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_TOKENIZER)
+    if (FF_GPU_BACKEND STREQUAL "hip_rocm")
+      SET(SPM_USE_BUILTIN_PROTOBUF OFF CACHE BOOL "Use builtin version of protobuf to compile SentencePiece")
+    endif()
+    # Ensure Rust is installed
+    execute_process(COMMAND rustc --version
+                  RESULT_VARIABLE RUST_COMMAND_RESULT
+                  OUTPUT_VARIABLE RUSTC_OUTPUT
+                  ERROR_QUIET)
+    if(NOT RUST_COMMAND_RESULT EQUAL 0)
+      message(FATAL_ERROR "Rust is not installed on the system. Please install it by running: 'curl https://sh.rustup.rs -sSf | sh -s -- -y' and following the instructions on the screen.")
+    endif()
+    # Ensure Cargo is installed
+    execute_process(COMMAND cargo --version
+                    RESULT_VARIABLE CARGO_RESULT
+                    OUTPUT_QUIET ERROR_QUIET)
+    if(NOT CARGO_RESULT EQUAL 0)
+      message(FATAL_ERROR "Rust is installed, but cargo is not. Please install it by running: 'curl https://sh.rustup.rs -sSf | sh -s -- -y' and following the instructions on the screen.")
+    endif()
+    add_subdirectory(deps/tokenizers-cpp tokenizers EXCLUDE_FROM_ALL)
+    target_include_directories(flexflow PUBLIC deps/tokenizers-cpp/include)
+    target_link_libraries(flexflow tokenizers_cpp)
   endif()
-  # Ensure Cargo is installed
-  execute_process(COMMAND cargo --version
-                  RESULT_VARIABLE CARGO_RESULT
-                  OUTPUT_QUIET ERROR_QUIET)
-  if(NOT CARGO_RESULT EQUAL 0)
-    message(FATAL_ERROR "Rust is installed, but cargo is not. Please install it by running: 'curl https://sh.rustup.rs -sSf | sh -s -- -y' and following the instructions on the screen.")
+  if(FF_BUILD_RESNET OR FF_BUILD_ALL_EXAMPLES)
+    add_subdirectory(examples/cpp/ResNet)
   endif()
-  add_subdirectory(deps/tokenizers-cpp tokenizers EXCLUDE_FROM_ALL)
-  target_include_directories(flexflow PUBLIC deps/tokenizers-cpp/include)
-  target_link_libraries(flexflow tokenizers_cpp)
-endif()
-if(FF_BUILD_RESNET OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/ResNet)
-endif()
 
-if(FF_BUILD_RESNEXT OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/resnext50)
-endif()
+  if(FF_BUILD_RESNEXT OR FF_BUILD_ALL_EXAMPLES)
+    add_subdirectory(examples/cpp/resnext50)
+  endif()
 
-if(FF_BUILD_ALEXNET OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/AlexNet)
-endif()
+  if(FF_BUILD_ALEXNET OR FF_BUILD_ALL_EXAMPLES)
+    add_subdirectory(examples/cpp/AlexNet)
+  endif()
 
-if(FF_BUILD_MLP_UNIFY OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/MLP_Unify)
-endif()
+  if(FF_BUILD_MLP_UNIFY OR FF_BUILD_ALL_EXAMPLES)
+    add_subdirectory(examples/cpp/MLP_Unify)
+  endif()
 
-if(FF_BUILD_SPLIT_TEST OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/split_test)
-endif()
+  if(FF_BUILD_SPLIT_TEST OR FF_BUILD_ALL_EXAMPLES)
+    add_subdirectory(examples/cpp/split_test)
+  endif()
 
-if(FF_BUILD_SPLIT_TEST_2 OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/split_test_2)
-endif()
+  if(FF_BUILD_SPLIT_TEST_2 OR FF_BUILD_ALL_EXAMPLES)
+    add_subdirectory(examples/cpp/split_test_2)
+  endif()
 
-if(FF_BUILD_INCEPTION OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/InceptionV3)
-endif()
+  if(FF_BUILD_INCEPTION OR FF_BUILD_ALL_EXAMPLES)
+    add_subdirectory(examples/cpp/InceptionV3)
+  endif()
 
-#TODO: Once functional add to BUILD_ALL_EXAMPLES
-if(FF_BUILD_CANDLE_UNO OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/candle_uno)
-endif()
+  #TODO: Once functional add to BUILD_ALL_EXAMPLES
+  if(FF_BUILD_CANDLE_UNO OR FF_BUILD_ALL_EXAMPLES)
+    add_subdirectory(examples/cpp/candle_uno)
+  endif()
 
-if(FF_BUILD_DLRM OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/DLRM)
+  if(FF_BUILD_DLRM OR FF_BUILD_ALL_EXAMPLES)
+    add_subdirectory(examples/cpp/DLRM)
 
-  #add_executable(generate_dlrm_hetero_strategy src/runtime/dlrm_strategy_hetero.cc)
-  #target_include_directories(generate_dlrm_hetero_strategy PUBLIC ${FLEXFLOW_INCLUDE_DIRS})
+    #add_executable(generate_dlrm_hetero_strategy src/runtime/dlrm_strategy_hetero.cc)
+    #target_include_directories(generate_dlrm_hetero_strategy PUBLIC ${FLEXFLOW_INCLUDE_DIRS})
 
-  #add_executable(generate_dlrm_strategy src/runtime/dlrm_strategy.cc)
-  #target_include_directories(generate_dlrm_strategy PUBLIC ${FLEXFLOW_INCLUDE_DIRS})
-endif()
+    #add_executable(generate_dlrm_strategy src/runtime/dlrm_strategy.cc)
+    #target_include_directories(generate_dlrm_strategy PUBLIC ${FLEXFLOW_INCLUDE_DIRS})
+  endif()
 
-if(FF_BUILD_XDL OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/XDL)
-endif()
+  if(FF_BUILD_XDL OR FF_BUILD_ALL_EXAMPLES)
+    add_subdirectory(examples/cpp/XDL)
+  endif()
 
-if(FF_BUILD_TRANSFORMER OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/Transformer)
-endif()
+  if(FF_BUILD_TRANSFORMER OR FF_BUILD_ALL_EXAMPLES)
+    add_subdirectory(examples/cpp/Transformer)
+  endif()
 
-if(FF_BUILD_MOE OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(examples/cpp/mixture_of_experts)
-endif()
+  if(FF_BUILD_MOE OR FF_BUILD_ALL_EXAMPLES)
+    add_subdirectory(examples/cpp/mixture_of_experts)
+  endif()
 
-if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
-  add_subdirectory(inference/spec_infer)
-  add_subdirectory(inference/incr_decoding)
-endif()
+  if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
+    add_subdirectory(inference/spec_infer)
+    add_subdirectory(inference/incr_decoding)
+  endif()
 
 
-# installation
-set(INCLUDE_DEST "include")
-set(LIB_DEST "lib")
-install(FILES ${FLEXFLOW_HDR} DESTINATION ${INCLUDE_DEST})
-install(TARGETS flexflow DESTINATION ${LIB_DEST})
-# install python
-if (FF_USE_PYTHON)
-  execute_process(COMMAND ${PYTHON_EXECUTABLE} -c "import site, os; print([pkg for func in (site.getsitepackages(), site.getusersitepackages()) for pkg in ([func] if isinstance(func, str) else func) if os.access(pkg, os.W_OK)][0])" OUTPUT_VARIABLE PY_DEST OUTPUT_STRIP_TRAILING_WHITESPACE)
-  if (NOT FF_BUILD_FROM_PYPI)
-    install(
-      DIRECTORY ${FLEXFLOW_ROOT}/python/flexflow/
-      DESTINATION ${PY_DEST}/flexflow
-      FILES_MATCHING 
-      PATTERN "*.py")
-  else()
-    # pip automatically installs all *.py files in the python/flexflow folder, but because flexflow_cffi_header.py is generated at build time, we have to install it manually.
-    install(
-      PROGRAMS ${FLEXFLOW_ROOT}/python/flexflow/core/flexflow_cffi_header.py
-      DESTINATION ${PY_DEST}/flexflow/core
-    )
-    # Use setup.py script to re-install the Python bindings library with the right library paths. 
-    # Need to put the instructions in a subfolder because of issue below:
-    # https://stackoverflow.com/questions/43875499/do-post-processing-after-make-install-in-cmake
-    add_subdirectory(cmake/pip_install)
+  # installation
+  set(INCLUDE_DEST "include")
+  set(LIB_DEST "lib")
+  install(FILES ${FLEXFLOW_HDR} DESTINATION ${INCLUDE_DEST})
+  install(TARGETS flexflow DESTINATION ${LIB_DEST})
+  # install python
+  if (FF_USE_PYTHON)
+    execute_process(COMMAND ${PYTHON_EXECUTABLE} -c "import site, os; print([pkg for func in (site.getsitepackages(), site.getusersitepackages()) for pkg in ([func] if isinstance(func, str) else func) if os.access(pkg, os.W_OK)][0])" OUTPUT_VARIABLE PY_DEST OUTPUT_STRIP_TRAILING_WHITESPACE)
+    if (NOT FF_BUILD_FROM_PYPI)
+      install(
+        DIRECTORY ${FLEXFLOW_ROOT}/python/flexflow/
+        DESTINATION ${PY_DEST}/flexflow
+        FILES_MATCHING 
+        PATTERN "*.py")
+    else()
+      # pip automatically installs all *.py files in the python/flexflow folder, but because flexflow_cffi_header.py is generated at build time, we have to install it manually.
+      install(
+        PROGRAMS ${FLEXFLOW_ROOT}/python/flexflow/core/flexflow_cffi_header.py
+        DESTINATION ${PY_DEST}/flexflow/core
+      )
+      # Use setup.py script to re-install the Python bindings library with the right library paths. 
+      # Need to put the instructions in a subfolder because of issue below:
+      # https://stackoverflow.com/questions/43875499/do-post-processing-after-make-install-in-cmake
+      add_subdirectory(cmake/pip_install)
+    endif()
   endif()
-endif()
+endif() # if(NOT BUILD_LEGION_ONLY)
diff --git a/config/config.linux b/config/config.linux
index 5f15090a02..224509d616 100755
--- a/config/config.linux
+++ b/config/config.linux
@@ -100,7 +100,7 @@ fi
 
 function get_build_configs() {
     # Create a string with the values of the variables set in this script
-    BUILD_CONFIGS="FF_CUDA_ARCH=${FF_CUDA_ARCH} FF_HIP_ARCH=${FF_HIP_ARCH} CUDNN_DIR=${CUDNN_DIR} CUDA_DIR=${CUDA_DIR} NCCL_DIR=${NCCL_DIR} FF_USE_PYTHON=${FF_USE_PYTHON} BUILD_LEGION_ONLY=${BUILD_LEGION_ONLY} FF_GASNET_CONDUIT=${FF_GASNET_CONDUIT} FF_UCX_URL=${FF_UCX_URL} FF_LEGION_NETWORKS=${FF_LEGION_NETWORKS} FF_BUILD_ALL_EXAMPLES=${FF_BUILD_ALL_EXAMPLES} FF_BUILD_ALL_INFERENCE_EXAMPLES=${FF_BUILD_ALL_INFERENCE_EXAMPLES} FF_BUILD_UNIT_TESTS=${FF_BUILD_UNIT_TESTS} FF_USE_PREBUILT_NCCL=${FF_USE_PREBUILT_NCCL} FF_USE_PREBUILT_LEGION=${FF_USE_PREBUILT_LEGION} FF_USE_ALL_PREBUILT_LIBRARIES=${FF_USE_ALL_PREBUILT_LIBRARIES} FF_USE_AVX2=${FF_USE_AVX2} FF_MAX_DIM=${FF_MAX_DIM} ROCM_PATH=${ROCM_PATH} FF_GPU_BACKEND=${FF_GPU_BACKEND}"
+    BUILD_CONFIGS="FF_CUDA_ARCH=${FF_CUDA_ARCH} FF_HIP_ARCH=${FF_HIP_ARCH} CUDNN_DIR=${CUDNN_DIR} CUDA_DIR=${CUDA_DIR} NCCL_DIR=${NCCL_DIR} FF_USE_PYTHON=${FF_USE_PYTHON} BUILD_LEGION_ONLY=${BUILD_LEGION_ONLY} FF_GASNET_CONDUIT=${FF_GASNET_CONDUIT} FF_UCX_URL=${FF_UCX_URL} FF_LEGION_NETWORKS=${FF_LEGION_NETWORKS} FF_BUILD_ALL_EXAMPLES=${FF_BUILD_ALL_EXAMPLES} FF_BUILD_ALL_INFERENCE_EXAMPLES=${FF_BUILD_ALL_INFERENCE_EXAMPLES} FF_BUILD_UNIT_TESTS=${FF_BUILD_UNIT_TESTS} FF_USE_PREBUILT_NCCL=${FF_USE_PREBUILT_NCCL} FF_USE_PREBUILT_LEGION=${FF_USE_PREBUILT_LEGION} FF_USE_ALL_PREBUILT_LIBRARIES=${FF_USE_ALL_PREBUILT_LIBRARIES} FF_USE_AVX2=${FF_USE_AVX2} FF_MAX_DIM=${FF_MAX_DIM} ROCM_PATH=${ROCM_PATH} FF_GPU_BACKEND=${FF_GPU_BACKEND} INSTALL_DIR=${INSTALL_DIR}"
 }
 
 if [[ -n "$1" && ( "$1" == "CMAKE_FLAGS" || "$1" == "CUDA_PATH" ) ]]; then

From 1105f4e157afc67ccce7df0e9aef601d7490e61b Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 23 Oct 2023 22:02:14 -0400
Subject: [PATCH 258/344] Fix Legion prebuild workflow (3) (#1210)

---
 config/config.linux | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/config/config.linux b/config/config.linux
index 224509d616..37b9bd16fd 100755
--- a/config/config.linux
+++ b/config/config.linux
@@ -10,7 +10,7 @@
 #LD_FLAGS=${LD_FLAGS+=""}
 
 #set install dir
-#INSTALL_DIR=
+INSTALL_DIR=${INSTALL_DIR:-}
 
 # set build type
 BUILD_TYPE=${BUILD_TYPE:-Release}

From bd305f77b0c247edb86a70d0c2d1f1b4868bd4e3 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sat, 4 Nov 2023 22:29:16 -0400
Subject: [PATCH 259/344] [CI/Docs/Examples] - Replace llama with llama2 model
 (#1219)

* replace llama with llama2

* shellcheck

* rename test

* fix

* rename test

* fix

* use text completion prompt, turn off hf sampling by default

* fix output name

* formatting

* avoid python 3.12 for now

* fix

* fixes for falcon

* fix
---
 .github/README.md                             | 24 ++---
 .github/workflows/gpu-ci-skip.yml             |  6 +-
 .github/workflows/gpu-ci.yml                  | 15 ++--
 .github/workflows/multinode-test.yml          |  6 +-
 INSTALL.md                                    |  2 +-
 SERVE.md                                      | 24 ++---
 conda/environment.yml                         |  2 +-
 conda/flexflow.yml                            |  2 +-
 inference/MODEL_WEIGHTS.md                    |  2 +-
 inference/python/incr_decoding.py             |  4 +-
 inference/python/spec_infer.py                |  6 +-
 inference/utils/compress_llama_weights.py     |  2 +-
 python/flexflow/serve/serve.py                |  4 +-
 tests/inference/cpp_inference_tests.sh        | 44 +++++-----
 tests/inference/huggingface_inference.py      | 24 +++--
 tests/inference/python_inference_tests.sh     | 30 +++----
 .../python_test_configs/generate_configs.py   | 46 ++++++----
 tests/inference_tests.sh                      | 10 ++-
 tests/multinode_helpers/mpi_wrapper1.sh       |  2 +-
 tests/python_interface_test.sh                |  6 +-
 .../{multi_gpu_tests.sh => training_tests.sh} | 88 +++++++++----------
 21 files changed, 193 insertions(+), 156 deletions(-)
 rename tests/{multi_gpu_tests.sh => training_tests.sh} (61%)

diff --git a/.github/README.md b/.github/README.md
index a8846260c8..5db26c5aa8 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -72,7 +72,7 @@ ff.init(
 Second, we specify the LLM to serve and the SSM(s) used to accelerate LLM serving. The list of supported LLMs and SSMs is available at [supported models](#supported-llms-and-ssms).
 ```python
 # Specify the LLM
-llm = ff.LLM("decapoda-research/llama-7b-hf")
+llm = ff.LLM("meta-llama/Llama-2-7b-hf")
 
 # Specify a list of SSMs (just one in this case)
 ssms=[]
@@ -116,7 +116,7 @@ ff.init(
     )
 
 # Create the FlexFlow LLM
-llm = ff.LLM("decapoda-research/llama-7b-hf")
+llm = ff.LLM("meta-llama/Llama-2-7b-hf")
 
 # Create the sampling configs
 generation_config = ff.GenerationConfig(
@@ -152,8 +152,8 @@ A C++ example is available at [this folder](../inference/spec_infer/). After bui
 * `-ll:gpu`: number of GPU processors to use on each node for serving an LLM (default: 0)
 * `-ll:fsize`: size of device memory on each GPU in MB
 * `-ll:zsize`: size of zero-copy memory (pinned DRAM with direct GPU access) in MB. FlexFlow Serve keeps a replica of the LLM parameters on zero-copy memory, and therefore requires that the zero-copy memory is sufficient for storing the LLM parameters.
-* `-llm-model`: the LLM model ID from HuggingFace (e.g. "decapoda-research/llama-7b-hf")
-* `-ssm-model`: the SSM model ID from HuggingFace (e.g. "JackFram/llama-160m"). You can use multiple `-ssm-model`s in the command line to launch multiple SSMs.
+* `-llm-model`: the LLM model ID from HuggingFace (e.g. "meta-llama/Llama-2-7b-hf")
+* `-ssm-model`: the SSM model ID from HuggingFace (e.g. "JackFram/llama-160m-base"). You can use multiple `-ssm-model`s in the command line to launch multiple SSMs.
 * `-cache-folder`: the folder
 * `-data-parallelism-degree`, `-tensor-parallelism-degree` and `-pipeline-parallelism-degree`: parallelization degrees in the data, tensor, and pipeline dimensions. Their product must equal the number of GPUs available on the machine. When any of the three parallelism degree arguments is omitted, a default value of 1 will be used. 
 * `-prompt`: (optional) path to the prompt file. FlexFlow Serve expects a json format file for prompts. In addition, users can also use the following API for registering requests:
@@ -162,7 +162,7 @@ A C++ example is available at [this folder](../inference/spec_infer/). After bui
 For example, you can use the following command line to serve a LLaMA-7B or LLaMA-13B model on 4 GPUs and use two collectively boost-tuned LLaMA-68M models for speculative inference.
 
 ```bash
-./inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model decapoda-research/llama-7b-hf -ssm-model JackFram/llama-68m -prompt /path/to/prompt.json -tensor-parallelism-degree 4 --fusion
+./inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-68m -prompt /path/to/prompt.json -tensor-parallelism-degree 4 --fusion
 ```
 </details>
 
@@ -193,13 +193,13 @@ Below is a list of models that we have explicitly tested and for which a SSM may
 
 | Model | Model id on HuggingFace | Boost-tuned SSMs |
 | :---- | :---- | :---- |
-| LLaMA-7B | decapoda-research/llama-7b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
-| LLaMA-13B | decapoda-research/llama-13b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
-| LLaMA-30B | decapoda-research/llama-30b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
-| LLaMA-65B | decapoda-research/llama-65b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
-| LLaMA-2-7B | meta-llama/Llama-2-7b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
-| LLaMA-2-13B | meta-llama/Llama-2-13b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
-| LLaMA-2-70B | meta-llama/Llama-2-70b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-7B | meta-llama/Llama-2-7b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
+| LLaMA-13B | decapoda-research/llama-13b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
+| LLaMA-30B | decapoda-research/llama-30b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
+| LLaMA-65B | decapoda-research/llama-65b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
+| LLaMA-2-7B | meta-llama/Llama-2-7b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
+| LLaMA-2-13B | meta-llama/Llama-2-13b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
+| LLaMA-2-70B | meta-llama/Llama-2-70b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
 | OPT-6.7B | facebook/opt-6.7b | [OPT-125M](https://huggingface.co/facebook/opt-125m) |
 | OPT-13B | facebook/opt-13b | [OPT-125M](https://huggingface.co/facebook/opt-125m) |
 | OPT-30B | facebook/opt-30b | [OPT-125M](https://huggingface.co/facebook/opt-125m) |
diff --git a/.github/workflows/gpu-ci-skip.yml b/.github/workflows/gpu-ci-skip.yml
index 6a18e56bd1..f4cb950931 100644
--- a/.github/workflows/gpu-ci-skip.yml
+++ b/.github/workflows/gpu-ci-skip.yml
@@ -15,7 +15,7 @@ on:
       - ".github/workflows/gpu-ci.yml"
       - "tests/cpp_gpu_tests.sh"
       - "tests/inference_tests.sh"
-      - "tests/multi_gpu_tests.sh"
+      - "tests/training_tests.sh"
       - "tests/python_interface_test.sh"
   workflow_dispatch:
 
@@ -44,8 +44,8 @@ jobs:
     steps:
       - run: 'echo "No gpu-ci required"'
 
-  gpu-ci-flexflow:
-    name: Single Machine, Multiple GPUs Tests
+  training-tests:
+    name: Training Tests
     runs-on: ubuntu-20.04
     # if: ${{ github.event_name != 'pull_request' || github.base_ref != 'inference' }}
     needs: inference-tests
diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index 4a43a3dee7..3901d6b5f7 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -15,7 +15,7 @@ on:
       - ".github/workflows/gpu-ci.yml"
       - "tests/cpp_gpu_tests.sh"
       - "tests/inference_tests.sh"
-      - "tests/multi_gpu_tests.sh"
+      - "tests/training_tests.sh"
       - "tests/python_interface_test.sh"
   push:
     branches:
@@ -34,7 +34,7 @@ on:
       - ".github/workflows/gpu-ci.yml"
       - "tests/cpp_gpu_tests.sh"
       - "tests/inference_tests.sh"
-      - "tests/multi_gpu_tests.sh"
+      - "tests/training_tests.sh"
       - "tests/python_interface_test.sh"
   workflow_dispatch:
 
@@ -141,7 +141,8 @@ jobs:
       run:
         shell: bash -l {0} # required to use an activated conda environment
     env: 
-      CONDA: "3"    
+      CONDA: "3"
+      HUGGINGFACE_TOKEN: ${{ secrets.HUGGINGFACE_TOKEN }}
     needs: gpu-ci-concierge
     container:
       image: ghcr.io/flexflow/flexflow-environment-cuda-11.8:latest
@@ -185,7 +186,7 @@ jobs:
           export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$CONDA_PREFIX/lib
           
           # GPT tokenizer test
-          ./tests/gpt_tokenizer_test.sh
+          # ./tests/gpt_tokenizer_test.sh
 
           # Inference tests
           source ./build/set_python_envs.sh
@@ -209,8 +210,8 @@ jobs:
         if: always()
         run: sudo rm -rf ~/.cache 
 
-  gpu-ci-flexflow:
-    name: Single Machine, Multiple GPUs Tests
+  training-tests:
+    name: Training Tests
     runs-on: [self-hosted, gpu]
     # skip this time-consuming test for PRs to the inference branch
     # if: ${{ github.event_name != 'pull_request' || github.base_ref != 'inference' }}
@@ -266,5 +267,5 @@ jobs:
           # C++ tests
           ./tests/cpp_gpu_tests.sh 4
           # Python tests
-          ./tests/multi_gpu_tests.sh 4
+          ./tests/training_tests.sh 4
 
diff --git a/.github/workflows/multinode-test.yml b/.github/workflows/multinode-test.yml
index ca2b47df27..226f953b38 100644
--- a/.github/workflows/multinode-test.yml
+++ b/.github/workflows/multinode-test.yml
@@ -78,7 +78,7 @@ jobs:
           export OMPI_ALLOW_RUN_AS_ROOT=1
           export OMPI_ALLOW_RUN_AS_ROOT_CONFIRM=1
           export OMPI_MCA_btl_vader_single_copy_mechanism=none
-          ./tests/multi_gpu_tests.sh 2 2
+          ./tests/training_tests.sh 2 2
   
   multinode-gpu-test-ucx:
     name: Multinode GPU Test with UCX
@@ -129,7 +129,7 @@ jobs:
           export OMPI_ALLOW_RUN_AS_ROOT=1
           export OMPI_ALLOW_RUN_AS_ROOT_CONFIRM=1
           export OMPI_MCA_btl_vader_single_copy_mechanism=none
-          ./tests/multi_gpu_tests.sh 2 2
+          ./tests/training_tests.sh 2 2
   
   multinode-gpu-test-native-ucx:
     name: Multinode GPU Test with native UCX
@@ -177,7 +177,7 @@ jobs:
           export OMPI_ALLOW_RUN_AS_ROOT=1
           export OMPI_ALLOW_RUN_AS_ROOT_CONFIRM=1
           export OMPI_MCA_btl_vader_single_copy_mechanism=none
-          ./tests/multi_gpu_tests.sh 2 2
+          ./tests/training_tests.sh 2 2
 
   notify-slack:
     name: Notify Slack in case of failure
diff --git a/INSTALL.md b/INSTALL.md
index a197df24ed..1734319540 100644
--- a/INSTALL.md
+++ b/INSTALL.md
@@ -97,7 +97,7 @@ source ./build/set_python_envs.sh
 cd "$FF_HOME"
 ./python/flexflow_python examples/python/native/mnist_mlp.py -ll:py 1 -ll:gpu 1 -ll:fsize <size of gpu buffer> -ll:zsize <size of zero buffer>
 ```
-A script to run all the Python examples is available at `tests/multi_gpu_tests.sh`
+A script to run all the Python examples is available at `tests/training_tests.sh`
 
 ### Run FlexFlow C++ examples
 
diff --git a/SERVE.md b/SERVE.md
index 60d0b566f0..1a00be2589 100644
--- a/SERVE.md
+++ b/SERVE.md
@@ -32,7 +32,7 @@ ff.init(
 Second, we specify the LLM to serve and the SSM(s) used to accelerate LLM serving. The list of supported LLMs and SSMs is available at [supported models](#supported-llms-and-ssms).
 ```python
 # Specify the LLM
-llm = ff.LLM("decapoda-research/llama-7b-hf")
+llm = ff.LLM("meta-llama/Llama-2-7b-hf")
 
 # Specify a list of SSMs (just one in this case)
 ssms=[]
@@ -78,7 +78,7 @@ ff.init(
     )
 
 # Create the FlexFlow LLM
-llm = ff.LLM("decapoda-research/llama-7b-hf")
+llm = ff.LLM("meta-llama/Llama-2-7b-hf")
 
 # Create the sampling configs
 generation_config = ff.GenerationConfig(
@@ -116,8 +116,8 @@ A C++ example is available at [this folder](../inference/spec_infer/). After bui
 * `-ll:gpu`: number of GPU processors to use on each node for serving an LLM (default: 0)
 * `-ll:fsize`: size of device memory on each GPU in MB
 * `-ll:zsize`: size of zero-copy memory (pinned DRAM with direct GPU access) in MB. FlexFlow Serve keeps a replica of the LLM parameters on zero-copy memory, and therefore requires that the zero-copy memory is sufficient for storing the LLM parameters.
-* `-llm-model`: the LLM model ID from HuggingFace (e.g. "decapoda-research/llama-7b-hf")
-* `-ssm-model`: the SSM model ID from HuggingFace (e.g. "JackFram/llama-160m"). You can use multiple `-ssm-model`s in the command line to launch multiple SSMs.
+* `-llm-model`: the LLM model ID from HuggingFace (e.g. "meta-llama/Llama-2-7b-hf")
+* `-ssm-model`: the SSM model ID from HuggingFace (e.g. "JackFram/llama-160m-base"). You can use multiple `-ssm-model`s in the command line to launch multiple SSMs.
 * `-cache-folder`: the folder
 * `-data-parallelism-degree`, `-tensor-parallelism-degree` and `-pipeline-parallelism-degree`: parallelization degrees in the data, tensor, and pipeline dimensions. Their product must equal the number of GPUs available on the machine. When any of the three parallelism degree arguments is omitted, a default value of 1 will be used. 
 * `-prompt`: (optional) path to the prompt file. FlexFlow Serve expects a json format file for prompts. In addition, users can also use the following API for registering requests:
@@ -126,7 +126,7 @@ A C++ example is available at [this folder](../inference/spec_infer/). After bui
 For example, you can use the following command line to serve a LLaMA-7B or LLaMA-13B model on 4 GPUs and use two collectively boost-tuned LLaMA-68M models for speculative inference.
 
 ```bash
-./inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model decapoda-research/llama-7b-hf -ssm-model JackFram/llama-68m -prompt /path/to/prompt.json -tensor-parallelism-degree 4 --fusion
+./inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-68m -prompt /path/to/prompt.json -tensor-parallelism-degree 4 --fusion
 ```
 </details>
 
@@ -157,13 +157,13 @@ Below is a list of models that we have explicitly tested and for which a SSM may
 
 | Model | Model id on HuggingFace | Boost-tuned SSMs |
 | :---- | :---- | :---- |
-| LLaMA-7B | decapoda-research/llama-7b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
-| LLaMA-13B | decapoda-research/llama-13b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
-| LLaMA-30B | decapoda-research/llama-30b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
-| LLaMA-65B | decapoda-research/llama-65b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
-| LLaMA-2-7B | meta-llama/Llama-2-7b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
-| LLaMA-2-13B | meta-llama/Llama-2-13b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
-| LLaMA-2-70B | meta-llama/Llama-2-70b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-7B | meta-llama/Llama-2-7b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
+| LLaMA-13B | decapoda-research/llama-13b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
+| LLaMA-30B | decapoda-research/llama-30b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
+| LLaMA-65B | decapoda-research/llama-65b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
+| LLaMA-2-7B | meta-llama/Llama-2-7b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
+| LLaMA-2-13B | meta-llama/Llama-2-13b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
+| LLaMA-2-70B | meta-llama/Llama-2-70b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
 | OPT-6.7B | facebook/opt-6.7b | [OPT-125M](https://huggingface.co/facebook/opt-125m) |
 | OPT-13B | facebook/opt-13b | [OPT-125M](https://huggingface.co/facebook/opt-125m) |
 | OPT-30B | facebook/opt-30b | [OPT-125M](https://huggingface.co/facebook/opt-125m) |
diff --git a/conda/environment.yml b/conda/environment.yml
index 9ae0dc9c7a..48cd8ddb33 100644
--- a/conda/environment.yml
+++ b/conda/environment.yml
@@ -3,7 +3,7 @@ channels:
   - defaults
   - conda-forge
 dependencies:
-  - python>=3.6
+  - python>=3.6,<3.12
   - cffi>=1.11.0
   - Pillow
   - pybind11
diff --git a/conda/flexflow.yml b/conda/flexflow.yml
index c9226269f2..67ef6b3419 100644
--- a/conda/flexflow.yml
+++ b/conda/flexflow.yml
@@ -3,7 +3,7 @@ channels:
   - defaults
   - conda-forge
 dependencies:
-  - python>=3.6
+  - python>=3.6,<3.12
   - cffi>=1.11.0
   - Pillow
   - pybind11
diff --git a/inference/MODEL_WEIGHTS.md b/inference/MODEL_WEIGHTS.md
index e46e6b45d1..d78fb37be9 100644
--- a/inference/MODEL_WEIGHTS.md
+++ b/inference/MODEL_WEIGHTS.md
@@ -2,7 +2,7 @@ To convert the weights of a HuggingFace LLM to SpecInfer's weight format, we fir
 
 ```python
 from transformers import AutoModelForCausalLM
-model = AutoModelForCausalLM.from_pretrained("decapoda-research/llama-7b-hf")
+model = AutoModelForCausalLM.from_pretrained("meta-llama/Llama-2-7b-hf")
 
 for name, params in model.named_parameters():
     for name, params in model.named_parameters():
diff --git a/inference/python/incr_decoding.py b/inference/python/incr_decoding.py
index 3621ee83a3..4a146ab503 100644
--- a/inference/python/incr_decoding.py
+++ b/inference/python/incr_decoding.py
@@ -43,7 +43,7 @@ def get_configs():
             # required parameters
             "num_gpus": 4,
             "memory_per_gpu": 14000,
-            "zero_copy_memory_per_node": 30000,
+            "zero_copy_memory_per_node": 40000,
             # optional parameters
             "num_cpus": 4,
             "legion_utility_processors": 4,
@@ -108,7 +108,7 @@ def main():
         prompts = [s for s in json.load(open(configs.prompt))]
         results = llm.generate(prompts)
     else:
-        result = llm.generate("Here are some travel tips for Tokyo:\n")
+        result = llm.generate("Three tips for staying healthy are: ")
 
 
 if __name__ == "__main__":
diff --git a/inference/python/spec_infer.py b/inference/python/spec_infer.py
index 3d0f1a1c0e..201b8d4a63 100644
--- a/inference/python/spec_infer.py
+++ b/inference/python/spec_infer.py
@@ -43,7 +43,7 @@ def get_configs():
             # required parameters
             "num_gpus": 4,
             "memory_per_gpu": 14000,
-            "zero_copy_memory_per_node": 30000,
+            "zero_copy_memory_per_node": 40000,
             # optional parameters
             "num_cpus": 4,
             "legion_utility_processors": 4,
@@ -60,7 +60,7 @@ def get_configs():
         }
         llm_configs = {
             # required llm arguments
-            "llm_model": "decapoda-research/llama-7b-hf",
+            "llm_model": "meta-llama/Llama-2-7b-hf",
             # optional llm parameters
             "cache_path": "",
             "refresh_cache": False,
@@ -154,7 +154,7 @@ def main():
         prompts = [s for s in json.load(open(configs.prompt))]
         results = llm.generate(prompts)
     else:
-        result = llm.generate("Here are some travel tips for Tokyo:\n")
+        result = llm.generate("Three tips for staying healthy are: ")
 
 
 if __name__ == "__main__":
diff --git a/inference/utils/compress_llama_weights.py b/inference/utils/compress_llama_weights.py
index c92ae6aca9..daaee9c9d5 100644
--- a/inference/utils/compress_llama_weights.py
+++ b/inference/utils/compress_llama_weights.py
@@ -91,7 +91,7 @@ def decompress(packed_data, config):
 if __name__ == "__main__":
     # torch.set_default_tensor_type(torch.HalfTensor)
     # torch.set_default_tensor_type(torch.cuda.HalfTensor)
-    model = AutoModelForCausalLM.from_pretrained("decapoda-research/llama-7b-hf")
+    model = AutoModelForCausalLM.from_pretrained("meta-llama/Llama-2-7b-hf")
     config = CompressionConfig(
         num_bits=8, group_size=32, group_dim=0, symmetric=False)
     for name, params in model.named_parameters():
diff --git a/python/flexflow/serve/serve.py b/python/flexflow/serve/serve.py
index 549677d77a..55601f957e 100644
--- a/python/flexflow/serve/serve.py
+++ b/python/flexflow/serve/serve.py
@@ -81,7 +81,7 @@ def __init__(
     ):
         """Create the LLM object
 
-        :param model_name: The name of the HuggingFace model to use. E.g. 'decapoda-research/llama-7b-hf'
+        :param model_name: The name of the HuggingFace model to use. E.g. 'meta-llama/Llama-2-7b-hf'
         :type model_name: str
         :param data_type: The data type to use for the tensors (e.g. DataType.DT_FLOAT for full precision, or DataType.DT_HALF for half precision), defaults to DataType.DT_HALF
         :type data_type: DataType, optional
@@ -439,7 +439,7 @@ def __init__(
     ):
         """Create the SSM object
 
-        :param model_name: The name of the HuggingFace model to use. E.g. 'decapoda-research/llama-7b-hf'
+        :param model_name: The name of the HuggingFace model to use. E.g. 'meta-llama/Llama-2-7b-hf'
         :type model_name: str
         :param data_type: The data type to use for the tensors (e.g. DataType.DT_FLOAT for full precision, or DataType.DT_HALF for half precision), defaults to DataType.DT_HALF
         :type data_type: DataType, optional
diff --git a/tests/inference/cpp_inference_tests.sh b/tests/inference/cpp_inference_tests.sh
index 42a6db09d8..211d7fe1bf 100755
--- a/tests/inference/cpp_inference_tests.sh
+++ b/tests/inference/cpp_inference_tests.sh
@@ -10,9 +10,9 @@ cd "${BASH_SOURCE[0]%/*}"
 ###############################################################################################
 
 # LLAMA
-../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model decapoda-research/llama-7b-hf -ssm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama.txt -pipeline-parallelism-degree 4
+../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama.txt -pipeline-parallelism-degree 4
 # LLAMA (half precision)
-../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model decapoda-research/llama-7b-hf -ssm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_half.txt -pipeline-parallelism-degree 4
+../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_half.txt -pipeline-parallelism-degree 4
 
 # OPT
 ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-6.7b -ssm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt.txt -pipeline-parallelism-degree 4
@@ -22,9 +22,9 @@ cd "${BASH_SOURCE[0]%/*}"
 # Tensor parallelism tests
 if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
     # LLAMA
-    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model decapoda-research/llama-7b-hf -ssm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     # LLAMA (half precision)
-    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model decapoda-research/llama-7b-hf -ssm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     
     # OPT
     ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-6.7b -ssm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
@@ -42,9 +42,9 @@ fi
 ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half.txt -pipeline-parallelism-degree 4
 
 # LLAMA (big model)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model decapoda-research/llama-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_7B.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model meta-llama/Llama-2-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_2_7B.txt -pipeline-parallelism-degree 4
 # LLAMA (big model, half precision)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model decapoda-research/llama-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_7B_half.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model meta-llama/Llama-2-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_2_7B_half.txt -pipeline-parallelism-degree 4
 
 # OPT (small model)
 ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M.txt -pipeline-parallelism-degree 4
@@ -57,9 +57,9 @@ fi
 ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-6.7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_6B_half.txt -pipeline-parallelism-degree 4
 
 # Falcon (full precision)
-# ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model tiiuae/falcon-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_falcon_7B.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 40000 --fusion --use-full-precision -llm-model tiiuae/falcon-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_falcon_7B.txt -pipeline-parallelism-degree 4
 # Falcon (half precision)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model tiiuae/falcon-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_falcon_7B.txt -pipeline-parallelism-degree 4
+# ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model tiiuae/falcon-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_falcon_7B.txt -pipeline-parallelism-degree 4
 
 # # StarCoder (full precision)
 # ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model bigcode/starcoderbase-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_starcoder_7B.txt -pipeline-parallelism-degree 4
@@ -76,9 +76,9 @@ if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
     ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
 
     # LLAMA (big model)
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model decapoda-research/llama-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_7B_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model meta-llama/Llama-2-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_2_7B_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     # LLAMA (big model, half precision)
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model decapoda-research/llama-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_7B_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model meta-llama/Llama-2-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_2_7B_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
 
     # OPT (small model)
     ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
@@ -179,22 +179,22 @@ function compare_decoding_steps_spec_infer_incr_decoding {
 
 ############ Alignment between speculative inference and incremental decoding #################
 # Full precision
-diff <(tail -n +3 "../../inference/output/incr_decoding_llama_7B.txt") <(tail -n +3 "../../inference/output/spec_inference_llama.txt")
+diff <(tail -n +3 "../../inference/output/incr_decoding_llama_2_7B.txt") <(tail -n +3 "../../inference/output/spec_inference_llama.txt")
 diff <(tail -n +3 "../../inference/output/incr_decoding_opt_6B.txt")   <(tail -n +3 "../../inference/output/spec_inference_opt.txt")
 # Half precision
-check_partial_token_match "../../inference/output/incr_decoding_llama_7B_half.txt" "../../inference/output/spec_inference_llama_half.txt"
+check_partial_token_match "../../inference/output/incr_decoding_llama_2_7B_half.txt" "../../inference/output/spec_inference_llama_half.txt"
 check_partial_token_match "../../inference/output/incr_decoding_opt_6B_half.txt" "../../inference/output/spec_inference_opt_half.txt"
 
 # Speed test: speculative inference should be at very least 1.5x faster than incremental decoding
 # Full precision
-#compare_speed_spec_infer_incr_decoding "../../inference/output/incr_decoding_llama_7B.txt" "../../inference/output/spec_inference_llama.txt"
+#compare_speed_spec_infer_incr_decoding "../../inference/output/incr_decoding_llama_2_7B.txt" "../../inference/output/spec_inference_llama.txt"
 #compare_speed_spec_infer_incr_decoding "../../inference/output/incr_decoding_opt_6B.txt" "../../inference/output/spec_inference_opt.txt"
-compare_decoding_steps_spec_infer_incr_decoding "../../inference/output/incr_decoding_llama_7B.txt" "../../inference/output/spec_inference_llama.txt"
+compare_decoding_steps_spec_infer_incr_decoding "../../inference/output/incr_decoding_llama_2_7B.txt" "../../inference/output/spec_inference_llama.txt"
 compare_decoding_steps_spec_infer_incr_decoding "../../inference/output/incr_decoding_opt_6B.txt" "../../inference/output/spec_inference_opt.txt"
 # Half precision
-#compare_speed_spec_infer_incr_decoding "../../inference/output/incr_decoding_llama_7B_half.txt" "../../inference/output/spec_inference_llama_half.txt"
+#compare_speed_spec_infer_incr_decoding "../../inference/output/incr_decoding_llama_2_7B_half.txt" "../../inference/output/spec_inference_llama_half.txt"
 #compare_speed_spec_infer_incr_decoding "../../inference/output/incr_decoding_opt_6B_half.txt" "../../inference/output/spec_inference_opt_half.txt"
-compare_decoding_steps_spec_infer_incr_decoding "../../inference/output/incr_decoding_llama_7B_half.txt" "../../inference/output/spec_inference_llama_half.txt"
+compare_decoding_steps_spec_infer_incr_decoding "../../inference/output/incr_decoding_llama_2_7B_half.txt" "../../inference/output/spec_inference_llama_half.txt"
 compare_decoding_steps_spec_infer_incr_decoding "../../inference/output/incr_decoding_opt_6B_half.txt" "../../inference/output/spec_inference_opt_half.txt"
 
 ############ Alignment between tensor model parallelism and pipeline parallelism only #################
@@ -205,8 +205,8 @@ if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
     check_partial_token_match "../../inference/output/spec_inference_opt_half_tp.txt" "../../inference/output/spec_inference_opt_half.txt"
     diff <(tail -n +3 "../../inference/output/incr_decoding_llama_160M_tp.txt") <(tail -n +3 "../../inference/output/incr_decoding_llama_160M.txt")
     check_partial_token_match "../../inference/output/incr_decoding_llama_160M_half_tp.txt" "../../inference/output/incr_decoding_llama_160M_half.txt"
-    diff <(tail -n +3 "../../inference/output/incr_decoding_llama_7B_tp.txt") <(tail -n +3 "../../inference/output/incr_decoding_llama_7B.txt")
-    check_partial_token_match "../../inference/output/incr_decoding_llama_7B_half_tp.txt" "../../inference/output/incr_decoding_llama_7B_half.txt"
+    diff <(tail -n +3 "../../inference/output/incr_decoding_llama_2_7B_tp.txt") <(tail -n +3 "../../inference/output/incr_decoding_llama_2_7B.txt")
+    check_partial_token_match "../../inference/output/incr_decoding_llama_2_7B_half_tp.txt" "../../inference/output/incr_decoding_llama_2_7B_half.txt"
     diff <(tail -n +3 "../../inference/output/incr_decoding_opt_125M_tp.txt") <(tail -n +3 "../../inference/output/incr_decoding_opt_125M.txt")
     check_partial_token_match "../../inference/output/incr_decoding_opt_125M_half_tp.txt" "../../inference/output/incr_decoding_opt_125M_half.txt"
     diff <(tail -n +3 "../../inference/output/incr_decoding_opt_6B_tp.txt") <(tail -n +3 "../../inference/output/incr_decoding_opt_6B.txt")
@@ -222,10 +222,10 @@ python3 ./huggingface_inference.py --model-name "JackFram/llama-160m-base" --use
 python3 ./huggingface_inference.py --model-name "JackFram/llama-160m-base" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M_half.txt" --gpu
 
 # LLAMA (big model, full precision)
-python3 ./huggingface_inference.py --model-name "decapoda-research/llama-7b-hf" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B.txt"
+python3 ./huggingface_inference.py --model-name "meta-llama/Llama-2-7b-hf" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_2_7B.txt"
 
 # LLAMA (big model, half precision)
-python3 ./huggingface_inference.py --model-name "decapoda-research/llama-7b-hf" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B_half.txt" --gpu
+python3 ./huggingface_inference.py --model-name "meta-llama/Llama-2-7b-hf" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_2_7B_half.txt" --gpu
 
 # OPT (small model, full precision)
 python3 ./huggingface_inference.py --model-name "facebook/opt-125m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_125M.txt" --gpu --max-length 128
@@ -245,8 +245,8 @@ python3 ./huggingface_inference.py --model-name "tiiuae/falcon-7b" --use-full-pr
 
 diff <(tail -n +2 "../../inference/output/huggingface_llama_160M.txt") <(tail -n +5 "../../inference/output/incr_decoding_llama_160M.txt")
 diff <(tail -n +2 "../../inference/output/huggingface_llama_160M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_decoding_llama_160M_half.txt" | tr -s '[:space:]' '\n' | head -n 20)
-diff <(tail -n +2 "../../inference/output/huggingface_llama_7B.txt") <(tail -n +5 "../../inference/output/incr_decoding_llama_7B.txt")
-diff <(tail -n +2 "../../inference/output/huggingface_llama_7B_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_decoding_llama_7B_half.txt" | tr -s '[:space:]' '\n' | head -n 20)
+diff <(tail -n +2 "../../inference/output/huggingface_llama_2_7B.txt") <(tail -n +5 "../../inference/output/incr_decoding_llama_2_7B.txt")
+diff <(tail -n +2 "../../inference/output/huggingface_llama_2_7B_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_decoding_llama_2_7B_half.txt" | tr -s '[:space:]' '\n' | head -n 20)
 
 diff <(tail -n +2 "../../inference/output/huggingface_opt_125M.txt") <(tail -n +5 "../../inference/output/incr_decoding_opt_125M.txt")
 diff <(tail -n +2 "../../inference/output/huggingface_opt_125M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_decoding_opt_125M_half.txt" | tr -s '[:space:]' '\n' | head -n 20)
diff --git a/tests/inference/huggingface_inference.py b/tests/inference/huggingface_inference.py
index fee215f4c4..5b533bf3c0 100644
--- a/tests/inference/huggingface_inference.py
+++ b/tests/inference/huggingface_inference.py
@@ -2,7 +2,14 @@
 import json
 import os
 import torch
-from transformers import AutoModelForCausalLM, AutoTokenizer, AutoConfig, LlamaTokenizer
+from transformers import (
+    AutoModelForCausalLM,
+    AutoTokenizer,
+    AutoConfig,
+    LlamaTokenizer,
+    GenerationConfig,
+)
+
 
 def main():
     # Change working dir to folder storing this script
@@ -19,6 +26,7 @@ def main():
     parser.add_argument(
         "--use-full-precision", action="store_true", help="Use full precision"
     )
+    parser.add_argument("--do-sample", action="store_true", help="Use sampling")
     parser.add_argument("--gpu", action="store_true", help="Run on GPU")
     args = parser.parse_args()
     # Check if max-length is greater than 0
@@ -54,13 +62,19 @@ def main():
         tokenizer = LlamaTokenizer.from_pretrained(args.model_name, use_fast=True)
     else:
         tokenizer = AutoTokenizer.from_pretrained(args.model_name)
+    generation_config = GenerationConfig.from_pretrained(args.model_name)
+    generation_config.do_sample = args.do_sample
     # Generate output
     with open(args.output_file, "w") as f:
         for i, prompt in enumerate(prompt_list):
-            batch = tokenizer(
-                prompt, return_tensors="pt", add_special_tokens=True
-            ).to(device)
-            generated = model.generate(batch["input_ids"], max_length=args.max_length)
+            batch = tokenizer(prompt, return_tensors="pt", add_special_tokens=True).to(
+                device
+            )
+            generated = model.generate(
+                batch["input_ids"],
+                max_length=args.max_length,
+                generation_config=generation_config,
+            )
             out = tokenizer.decode(generated[0])
             # Write output to file
             out_str = out if i == (len(prompt_list) - 1) else out + "\n"
diff --git a/tests/inference/python_inference_tests.sh b/tests/inference/python_inference_tests.sh
index 64c61ba0dc..b0f8daa14e 100755
--- a/tests/inference/python_inference_tests.sh
+++ b/tests/inference/python_inference_tests.sh
@@ -108,25 +108,25 @@ function compare_decoding_steps_spec_infer_incr_decoding {
 
 ############ Alignment between speculative inference and incremental decoding #################
 # Full precision
-diff <(tail -n +3 "../../inference/output/incr_dec-python-llama-7b-hf-full_prec-1_tp_4_pp.txt") <(tail -n +3 "../../inference/output/spec_infer-python-llama-7b-hf-full_prec-1_tp_4_pp.txt")
+diff <(tail -n +3 "../../inference/output/incr_dec-python-llama-2-7b-hf-full_prec-1_tp_4_pp.txt") <(tail -n +3 "../../inference/output/spec_infer-python-llama-2-7b-hf-full_prec-1_tp_4_pp.txt")
 diff <(tail -n +3 "../../inference/output/incr_dec-python-opt-6.7b-full_prec-1_tp_4_pp.txt")   <(tail -n +3 "../../inference/output/spec_infer-python-opt-6.7b-full_prec-1_tp_4_pp.txt")
 # Half precision
-check_partial_token_match "../../inference/output/incr_dec-python-llama-7b-hf-half_prec-1_tp_4_pp.txt" "../../inference/output/spec_infer-python-llama-7b-hf-half_prec-1_tp_4_pp.txt"
+check_partial_token_match "../../inference/output/incr_dec-python-llama-2-7b-hf-half_prec-1_tp_4_pp.txt" "../../inference/output/spec_infer-python-llama-2-7b-hf-half_prec-1_tp_4_pp.txt"
 check_partial_token_match "../../inference/output/incr_dec-python-opt-6.7b-half_prec-1_tp_4_pp.txt" "../../inference/output/spec_infer-python-opt-6.7b-half_prec-1_tp_4_pp.txt"
 
 # Speed test: speculative inference should be at very least 1.5x faster than incremental decoding
 # Full precision
-compare_decoding_steps_spec_infer_incr_decoding "../../inference/output/incr_dec-python-llama-7b-hf-full_prec-1_tp_4_pp.txt" "../../inference/output/spec_infer-python-llama-7b-hf-full_prec-1_tp_4_pp.txt"
+compare_decoding_steps_spec_infer_incr_decoding "../../inference/output/incr_dec-python-llama-2-7b-hf-full_prec-1_tp_4_pp.txt" "../../inference/output/spec_infer-python-llama-2-7b-hf-full_prec-1_tp_4_pp.txt"
 compare_decoding_steps_spec_infer_incr_decoding "../../inference/output/incr_dec-python-opt-6.7b-full_prec-1_tp_4_pp.txt" "../../inference/output/spec_infer-python-opt-6.7b-full_prec-1_tp_4_pp.txt"
 # Half precision
-compare_decoding_steps_spec_infer_incr_decoding "../../inference/output/incr_dec-python-llama-7b-hf-half_prec-1_tp_4_pp.txt" "../../inference/output/spec_infer-python-llama-7b-hf-half_prec-1_tp_4_pp.txt"
+compare_decoding_steps_spec_infer_incr_decoding "../../inference/output/incr_dec-python-llama-2-7b-hf-half_prec-1_tp_4_pp.txt" "../../inference/output/spec_infer-python-llama-2-7b-hf-half_prec-1_tp_4_pp.txt"
 compare_decoding_steps_spec_infer_incr_decoding "../../inference/output/incr_dec-python-opt-6.7b-half_prec-1_tp_4_pp.txt" "../../inference/output/spec_infer-python-opt-6.7b-half_prec-1_tp_4_pp.txt"
 
 ############ Alignment between tensor model parallelism and pipeline parallelism only #################
 ## Specinfer
 # LLAMA
-diff <(tail -n +3 "../../inference/output/spec_infer-python-llama-7b-hf-full_prec-2_tp_2_pp.txt") <(tail -n +3 "../../inference/output/spec_infer-python-llama-7b-hf-full_prec-1_tp_4_pp.txt")
-check_partial_token_match "../../inference/output/spec_infer-python-llama-7b-hf-half_prec-2_tp_2_pp.txt" "../../inference/output/spec_infer-python-llama-7b-hf-half_prec-1_tp_4_pp.txt"
+diff <(tail -n +3 "../../inference/output/spec_infer-python-llama-2-7b-hf-full_prec-2_tp_2_pp.txt") <(tail -n +3 "../../inference/output/spec_infer-python-llama-2-7b-hf-full_prec-1_tp_4_pp.txt")
+check_partial_token_match "../../inference/output/spec_infer-python-llama-2-7b-hf-half_prec-2_tp_2_pp.txt" "../../inference/output/spec_infer-python-llama-2-7b-hf-half_prec-1_tp_4_pp.txt"
 # OPT
 diff <(tail -n +3 "../../inference/output/spec_infer-python-opt-6.7b-full_prec-2_tp_2_pp.txt")  <(tail -n +3 "../../inference/output/spec_infer-python-opt-6.7b-full_prec-1_tp_4_pp.txt")
 check_partial_token_match "../../inference/output/spec_infer-python-opt-6.7b-half_prec-2_tp_2_pp.txt" "../../inference/output/spec_infer-python-opt-6.7b-half_prec-1_tp_4_pp.txt"
@@ -138,10 +138,10 @@ check_partial_token_match "../../inference/output/incr_dec-python-llama-160m-bas
 diff <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-base-full_prec-4_tp_1_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-base-full_prec-1_tp_4_pp.txt")
 check_partial_token_match "../../inference/output/incr_dec-python-llama-160m-base-half_prec-4_tp_1_pp.txt" "../../inference/output/incr_dec-python-llama-160m-base-half_prec-1_tp_4_pp.txt"
 # Big LLAMA
-diff <(tail -n +3 "../../inference/output/incr_dec-python-llama-7b-hf-full_prec-2_tp_2_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-llama-7b-hf-full_prec-1_tp_4_pp.txt")
-check_partial_token_match "../../inference/output/incr_dec-python-llama-7b-hf-half_prec-2_tp_2_pp.txt" "../../inference/output/incr_dec-python-llama-7b-hf-half_prec-1_tp_4_pp.txt"
-#diff <(tail -n +3 "../../inference/output/incr_dec-python-llama-7b-hf-full_prec-4_tp_1_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-llama-7b-hf-full_prec-1_tp_4_pp.txt")
-#check_partial_token_match "../../inference/output/incr_dec-python-llama-7b-hf-half_prec-4_tp_1_pp.txt" "../../inference/output/incr_dec-python-llama-7b-hf-half_prec-1_tp_4_pp.txt"
+diff <(tail -n +3 "../../inference/output/incr_dec-python-llama-2-7b-hf-full_prec-2_tp_2_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-llama-2-7b-hf-full_prec-1_tp_4_pp.txt")
+check_partial_token_match "../../inference/output/incr_dec-python-llama-2-7b-hf-half_prec-2_tp_2_pp.txt" "../../inference/output/incr_dec-python-llama-2-7b-hf-half_prec-1_tp_4_pp.txt"
+#diff <(tail -n +3 "../../inference/output/incr_dec-python-llama-2-7b-hf-full_prec-4_tp_1_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-llama-2-7b-hf-full_prec-1_tp_4_pp.txt")
+#check_partial_token_match "../../inference/output/incr_dec-python-llama-2-7b-hf-half_prec-4_tp_1_pp.txt" "../../inference/output/incr_dec-python-llama-2-7b-hf-half_prec-1_tp_4_pp.txt"
 # Small OPT
 diff <(tail -n +3 "../../inference/output/incr_dec-python-opt-125m-full_prec-2_tp_2_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-opt-125m-full_prec-1_tp_4_pp.txt")
 check_partial_token_match "../../inference/output/incr_dec-python-opt-125m-half_prec-2_tp_2_pp.txt" "../../inference/output/incr_dec-python-opt-125m-half_prec-1_tp_4_pp.txt"
@@ -163,10 +163,10 @@ python3 ./huggingface_inference.py --model-name "JackFram/llama-160m-base" --use
 python3 ./huggingface_inference.py --model-name "JackFram/llama-160m-base" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M_half.txt" --gpu
 
 # LLAMA (big model, full precision)
-python3 ./huggingface_inference.py --model-name "decapoda-research/llama-7b-hf" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B.txt"
+python3 ./huggingface_inference.py --model-name "meta-llama/Llama-2-7b-hf" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B.txt"
 
 # LLAMA (big model, half precision)
-python3 ./huggingface_inference.py --model-name "decapoda-research/llama-7b-hf" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B_half.txt" --gpu
+python3 ./huggingface_inference.py --model-name "meta-llama/Llama-2-7b-hf" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B_half.txt" --gpu
 
 # OPT (small model, full precision)
 python3 ./huggingface_inference.py --model-name "facebook/opt-125m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_opt_125M.txt" --gpu --max-length 128
@@ -185,11 +185,11 @@ python3 ./huggingface_inference.py --model-name "tiiuae/falcon-7b" --use-full-pr
 
 diff <(tail -n +2 "../../inference/output/huggingface_llama_160M.txt") <(tail -n +5 "../../inference/output/incr_dec-python-llama-160m-base-full_prec-1_tp_4_pp.txt")
 diff <(tail -n +2 "../../inference/output/huggingface_llama_160M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_dec-python-llama-160m-base-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
-diff <(tail -n +2 "../../inference/output/huggingface_llama_7B.txt") <(tail -n +5 "../../inference/output/incr_dec-python-llama-7b-hf-full_prec-1_tp_4_pp.txt")
-diff <(tail -n +2 "../../inference/output/huggingface_llama_7B_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_dec-python-llama-7b-hf-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
+diff <(tail -n +2 "../../inference/output/huggingface_llama_7B.txt") <(tail -n +5 "../../inference/output/incr_dec-python-llama-2-7b-hf-full_prec-1_tp_4_pp.txt")
+diff <(tail -n +2 "../../inference/output/huggingface_llama_7B_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_dec-python-llama-2-7b-hf-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
 
 diff <(tail -n +2 "../../inference/output/huggingface_opt_125M.txt") <(tail -n +5 "../../inference/output/incr_dec-python-opt-125m-full_prec-1_tp_4_pp.txt")
 diff <(tail -n +2 "../../inference/output/huggingface_opt_125M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_dec-python-opt-125m-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
 diff <(tail -n +2 "../../inference/output/huggingface_opt_6B.txt") <(tail -n +5 "../../inference/output/incr_dec-python-opt-6.7b-full_prec-1_tp_4_pp.txt")
 #diff <(tail -n +2 "../../inference/output/huggingface_opt_6B_half.txt") <(tail -n +5 "../../inference/output/incr_dec-python-opt-6.7b-half_prec-1_tp_4_pp.txt")
-diff <(tail -n +2 "../../inference/output/huggingface_falcon_7B.txt") <(tail -n +5 "../../inference/output/incr_dec-python-falcon-7b-half_prec-1_tp_4_pp.txt")
+diff <(tail -n +2 "../../inference/output/huggingface_falcon_7B.txt") <(tail -n +5 "../../inference/output/incr_dec-python-falcon-7b-full_prec-1_tp_4_pp.txt")
diff --git a/tests/inference/python_test_configs/generate_configs.py b/tests/inference/python_test_configs/generate_configs.py
index 8efe8999c4..c77e19053d 100644
--- a/tests/inference/python_test_configs/generate_configs.py
+++ b/tests/inference/python_test_configs/generate_configs.py
@@ -6,7 +6,7 @@
     # required parameters
     "num_gpus": 4,
     "memory_per_gpu": 14000,
-    "zero_copy_memory_per_node": 30000,
+    "zero_copy_memory_per_node": 40000,
     # optional parameters
     "num_cpus": 4,
     "legion_utility_processors": 4,
@@ -47,12 +47,16 @@
 ff_init_configs.update(llm_configs)
 
 # Test parameters to fill in
-llama_models = ["decapoda-research/llama-7b-hf", "JackFram/llama-160m-base"]
+llama_models = ["meta-llama/Llama-2-7b-hf", "JackFram/llama-160m-base"]
 opt_models = ["facebook/opt-6.7b", "facebook/opt-125m"]
-falcon_models = ["tiiuae/falcon-7b",]
-mpt_models = ["mosaicml/mpt-7b", ]
+falcon_models = [
+    "tiiuae/falcon-7b",
+]
+mpt_models = [
+    "mosaicml/mpt-7b",
+]
 # starcoder_models = ["bigcode/starcoderbase-7b",]
-parallelism_settings = [(1,4), (2,2), (4,1)]
+parallelism_settings = [(1, 4), (2, 2), (4, 1)]
 
 # The paths below should be with respect to the folder from which the tests are launched (FF_HOME/tests/inference)
 prompt_file = "../../inference/prompt/test.json"
@@ -69,7 +73,6 @@
 for model_name in all_models:
     for full_precision in (True, False):
         for parallelism_degrees in parallelism_settings:
-            
             tp, pp = parallelism_degrees
 
             # Tensor parallelism not supported by small Falcon model atm
@@ -79,14 +82,21 @@
             if tp > 2 and ("7b" in model_name or "6.7b" in model_name):
                 continue
 
-            if full_precision and ("falcon" in model_name or "starcoder" in model_name):
+            # Run Falcon only in full precision, Starcoder only in half precision
+            if (not full_precision and "falcon" in model_name) or (full_precision and "starcoder" in model_name):
                 continue
-            
+
             _, after_slash = model_name.rsplit("/", maxsplit=1)
-            filename = "incr_dec-" + "python-" + after_slash + ("-full_prec-" if full_precision else "-half_prec-") + f"{tp}_tp_{pp}_pp"
+            filename = (
+                "incr_dec-"
+                + "python-"
+                + after_slash.lower()
+                + ("-full_prec-" if full_precision else "-half_prec-")
+                + f"{tp}_tp_{pp}_pp"
+            )
             test_configs_file = "./" + filename + ".json"
-            output_file = os.path.join(output_folder, filename+".txt")
-            
+            output_file = os.path.join(output_folder, filename + ".txt")
+
             ff_init_configs["tensor_parallelism_degree"] = tp
             ff_init_configs["pipeline_parallelism_degree"] = pp
             ff_init_configs["llm_model"] = model_name
@@ -110,17 +120,23 @@
                 continue
 
             _, after_slash = big_model.rsplit("/", maxsplit=1)
-            filename = "spec_infer-" + "python-" + after_slash + ("-full_prec-" if full_precision else "-half_prec-") + f"{tp}_tp_{pp}_pp"
+            filename = (
+                "spec_infer-"
+                + "python-"
+                + after_slash.lower()
+                + ("-full_prec-" if full_precision else "-half_prec-")
+                + f"{tp}_tp_{pp}_pp"
+            )
             test_configs_file = "./" + filename + ".json"
-            output_file = os.path.join(output_folder, filename+".txt")
-            
+            output_file = os.path.join(output_folder, filename + ".txt")
+
             ff_init_configs["tensor_parallelism_degree"] = tp
             ff_init_configs["pipeline_parallelism_degree"] = pp
             ff_init_configs["llm_model"] = big_model
             ff_init_configs["full_precision"] = full_precision
             ff_init_configs["output_file"] = output_file
             ff_init_configs["prompt"] = prompt_file
-            
+
             ssm_configs["ssms"][0]["ssm_model"] = small_model
             ssm_configs["ssms"][0]["full_precision"] = full_precision
             ff_init_configs.update(ssm_configs)
diff --git a/tests/inference_tests.sh b/tests/inference_tests.sh
index c757dd5ee6..d450c2d6d5 100755
--- a/tests/inference_tests.sh
+++ b/tests/inference_tests.sh
@@ -16,6 +16,12 @@ CPP_INFERENCE_TESTS=${CPP_INFERENCE_TESTS:-OFF}
 # Enable model parallelism tests in C++, if desired
 TENSOR_PARALLELISM_TESTS=${TENSOR_PARALLELISM_TESTS:-OFF}
 
+# Token to access private huggingface models (e.g. LLAMA-2)
+HUGGINGFACE_TOKEN=${HUGGINGFACE_TOKEN:-none}
+if [[ "$HUGGINGFACE_TOKEN" != "none" ]]; then
+    huggingface-cli login --token "$HUGGINGFACE_TOKEN"
+fi
+
 # Clean up before test (just in case)
 cleanup
 
@@ -24,7 +30,7 @@ pip3 install protobuf==3.20.3
 
 # Create test prompt file
 mkdir -p ../inference/prompt
-echo '["Give three tips for staying healthy."]' > ../inference/prompt/test.json
+echo '["Three tips for staying healthy are: "]' > ../inference/prompt/test.json
 
 # Create output folder
 mkdir -p ../inference/output
@@ -38,7 +44,7 @@ if [[ "$PYTHON_INFERENCE_TESTS" == "ON" ]]; then
 fi
 if [[ "$CPP_INFERENCE_TESTS" == "ON" ]]; then
     # Manually download the weights in both half and full precision
-    python3 ../inference/utils/download_hf_model.py "decapoda-research/llama-7b-hf" "JackFram/llama-160m-base" "facebook/opt-6.7b" "facebook/opt-125m" "tiiuae/falcon-7b"
+    python3 ../inference/utils/download_hf_model.py "meta-llama/Llama-2-7b-hf" "JackFram/llama-160m-base" "facebook/opt-6.7b" "facebook/opt-125m" "tiiuae/falcon-7b"
     echo "Running C++ inference tests..."
     ./inference/cpp_inference_tests.sh
 fi
diff --git a/tests/multinode_helpers/mpi_wrapper1.sh b/tests/multinode_helpers/mpi_wrapper1.sh
index 87d17d11a3..076fd2d66c 100755
--- a/tests/multinode_helpers/mpi_wrapper1.sh
+++ b/tests/multinode_helpers/mpi_wrapper1.sh
@@ -8,5 +8,5 @@ if [ -z "$GPUS" ]; then echo "GPUS variable is not defined, aborting tests"; exi
 
 # We need to wrap the instruction below in its own script because MPI throws an error if we try
 # to run "mpirun" more than once in the same script. Hence, we cannot simply call "mpirun" in the
-# multi_gpu_tests.sh script
+# training_tests.sh script
 mpirun -np "$NUM_NODES" "$FF_HOME"/tests/multinode_helpers/mpi_wrapper2.sh "$@"
diff --git a/tests/python_interface_test.sh b/tests/python_interface_test.sh
index 4f83918a49..5ce4d9803b 100755
--- a/tests/python_interface_test.sh
+++ b/tests/python_interface_test.sh
@@ -14,13 +14,13 @@ check_python_interface() {
 	
 	# Generate configs JSON files
 	test_params=$(jq -n --arg num_gpus "$GPUS" --arg memory_per_gpu "$FSIZE" --arg zero_copy_memory_per_node "$ZSIZE" --arg batch_size "$BATCHSIZE" --arg only_data_parallel "$ONLY_DATA_PARALLEL" '{"num_gpus":$num_gpus,"memory_per_gpu":$memory_per_gpu,"zero_copy_memory_per_node":$zero_copy_memory_per_node,"batch_size":$batch_size,"only_data_parallel":$only_data_parallel}')
-	mkdir -p /tmp/flexflow/multi_gpu_tests
-	echo "$test_params" > /tmp/flexflow/multi_gpu_tests/test_params.json
+	mkdir -p /tmp/flexflow/training_tests
+	echo "$test_params" > /tmp/flexflow/training_tests/test_params.json
 	
 	if [[ "$interpreter" == "python" ]]; then
 		EXE="python"
 		echo "Running a single-GPU Python test to check the Python interface (native python interpreter)"
-		$EXE "$FF_HOME"/examples/python/keras/seq_mnist_mlp.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+		$EXE "$FF_HOME"/examples/python/keras/seq_mnist_mlp.py -config-file /tmp/flexflow/training_tests/test_params.json
 	elif [[ "$interpreter" == "flexflow_python" ]]; then
 		if [[ "$installation_status" == "before-installation" ]]; then
 			EXE="$BUILD_FOLDER"/flexflow_python
diff --git a/tests/multi_gpu_tests.sh b/tests/training_tests.sh
similarity index 61%
rename from tests/multi_gpu_tests.sh
rename to tests/training_tests.sh
index 3a6f6467df..2d1f00883b 100755
--- a/tests/multi_gpu_tests.sh
+++ b/tests/training_tests.sh
@@ -33,57 +33,57 @@ test_params_5_epochs=$(echo "$test_params" | jq '. + {"epochs": 5}')
 test_params_40_epochs=$(echo "$test_params" | jq '. + {"epochs": 40}')
 test_params_5_epochs_no_batch_size=$(echo "$test_params_5_epochs" | jq 'del(.batch_size)')
 test_params_40_epochs_no_batch_size=$(echo "$test_params_40_epochs" | jq 'del(.batch_size)')
-mkdir -p /tmp/flexflow/multi_gpu_tests
-echo "$test_params" > /tmp/flexflow/multi_gpu_tests/test_params.json
-echo "$test_params_5_epochs" > /tmp/flexflow/multi_gpu_tests/test_params_5_epochs.json
-echo "$test_params_5_epochs_no_batch_size" > /tmp/flexflow/multi_gpu_tests/test_params_5_epochs_no_batch_size.json
-echo "$test_params_40_epochs_no_batch_size" > /tmp/flexflow/multi_gpu_tests/test_params_40_epochs_no_batch_size.json
+mkdir -p /tmp/flexflow/training_tests
+echo "$test_params" > /tmp/flexflow/training_tests/test_params.json
+echo "$test_params_5_epochs" > /tmp/flexflow/training_tests/test_params_5_epochs.json
+echo "$test_params_5_epochs_no_batch_size" > /tmp/flexflow/training_tests/test_params_5_epochs_no_batch_size.json
+echo "$test_params_40_epochs_no_batch_size" > /tmp/flexflow/training_tests/test_params_40_epochs_no_batch_size.json
 
 #Sequential model tests
-$EXE "$FF_HOME"/examples/python/keras/seq_mnist_mlp.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/seq_mnist_cnn.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-#$EXE "$FF_HOME"/examples/python/keras/seq_reuters_mlp.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/seq_cifar10_cnn.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/seq_mnist_mlp_net2net.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/seq_mnist_cnn_net2net.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/seq_mnist_cnn_nested.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/seq_mnist_mlp.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/seq_mnist_cnn.py -config-file /tmp/flexflow/training_tests/test_params.json
+#$EXE "$FF_HOME"/examples/python/keras/seq_reuters_mlp.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/seq_cifar10_cnn.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/seq_mnist_mlp_net2net.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/seq_mnist_cnn_net2net.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/seq_mnist_cnn_nested.py -config-file /tmp/flexflow/training_tests/test_params.json
 
 #Keras other
-$EXE "$FF_HOME"/examples/python/keras/callback.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/unary.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/reshape.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/elementwise_mul_broadcast.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/reduce_sum.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/identity_loss.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/elementwise_max_min.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/rsqrt.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/gather.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/regularizer.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/callback.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/unary.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/reshape.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/elementwise_mul_broadcast.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/reduce_sum.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/identity_loss.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/elementwise_max_min.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/rsqrt.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/gather.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/regularizer.py -config-file /tmp/flexflow/training_tests/test_params.json
 
 #Functional API
-$EXE "$FF_HOME"/examples/python/keras/func_mnist_mlp.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/func_mnist_mlp_concat.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/func_mnist_mlp_concat2.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/func_mnist_cnn.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/func_mnist_cnn_concat.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_nested.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/func_cifar10_alexnet.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/func_mnist_mlp_net2net.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_net2net.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_mnist_mlp.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_mnist_mlp_concat.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_mnist_mlp_concat2.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_mnist_cnn.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_mnist_cnn_concat.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_nested.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_cifar10_alexnet.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_mnist_mlp_net2net.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_net2net.py -config-file /tmp/flexflow/training_tests/test_params.json
 
 #Python
-$EXE "$FF_HOME"/examples/python/native/print_layers.py -config-file /tmp/flexflow/multi_gpu_tests/test_params_5_epochs.json
-$EXE "$FF_HOME"/examples/python/native/split.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/native/alexnet.py -config-file /tmp/flexflow/multi_gpu_tests/test_params_40_epochs_no_batch_size.json
-$EXE "$FF_HOME"/examples/python/native/mnist_mlp.py -config-file /tmp/flexflow/multi_gpu_tests/test_params_5_epochs.json
-$EXE "$FF_HOME"/examples/python/native/mnist_cnn.py -config-file /tmp/flexflow/multi_gpu_tests/test_params_5_epochs.json
-$EXE "$FF_HOME"/examples/python/native/cifar10_cnn.py -config-file /tmp/flexflow/multi_gpu_tests/test_params_40_epochs_no_batch_size.json
-$EXE "$FF_HOME"/examples/python/native/cifar10_cnn_attach.py -config-file /tmp/flexflow/multi_gpu_tests/test_params_5_epochs_no_batch_size.json
-$EXE "$FF_HOME"/examples/python/native/mnist_mlp_attach.py -config-file /tmp/flexflow/multi_gpu_tests/test_params_5_epochs_no_batch_size.json
+$EXE "$FF_HOME"/examples/python/native/print_layers.py -config-file /tmp/flexflow/training_tests/test_params_5_epochs.json
+$EXE "$FF_HOME"/examples/python/native/split.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/native/alexnet.py -config-file /tmp/flexflow/training_tests/test_params_40_epochs_no_batch_size.json
+$EXE "$FF_HOME"/examples/python/native/mnist_mlp.py -config-file /tmp/flexflow/training_tests/test_params_5_epochs.json
+$EXE "$FF_HOME"/examples/python/native/mnist_cnn.py -config-file /tmp/flexflow/training_tests/test_params_5_epochs.json
+$EXE "$FF_HOME"/examples/python/native/cifar10_cnn.py -config-file /tmp/flexflow/training_tests/test_params_40_epochs_no_batch_size.json
+$EXE "$FF_HOME"/examples/python/native/cifar10_cnn_attach.py -config-file /tmp/flexflow/training_tests/test_params_5_epochs_no_batch_size.json
+$EXE "$FF_HOME"/examples/python/native/mnist_mlp_attach.py -config-file /tmp/flexflow/training_tests/test_params_5_epochs_no_batch_size.json
 
 #Possible crash
-$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_concat.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_concat_model.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_concat_seq_model.py -config-file /tmp/flexflow/multi_gpu_tests/test_params.json
-$EXE "$FF_HOME"/examples/python/native/cifar10_cnn_concat.py -config-file /tmp/flexflow/multi_gpu_tests/test_params_40_epochs_no_batch_size.json
+$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_concat.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_concat_model.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_concat_seq_model.py -config-file /tmp/flexflow/training_tests/test_params.json
+$EXE "$FF_HOME"/examples/python/native/cifar10_cnn_concat.py -config-file /tmp/flexflow/training_tests/test_params_40_epochs_no_batch_size.json

From b0fe5220770777c9297d028de5e466f5dd68b2d9 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 5 Nov 2023 21:08:09 -0500
Subject: [PATCH 260/344] Fix inference tests in CI (#1225)

* updated diffs in tests

* manually add BOS token in LLAMA

* shellcheck

* fix
---
 .github/README.md                             | 16 +++----
 CMakeLists.txt                                | 13 ++++++
 SERVE.md                                      | 16 +++----
 config/config.inc                             |  2 +-
 include/flexflow/ffconst.h                    |  9 ++--
 inference/incr_decoding/incr_decoding.cc      | 11 +----
 inference/python/spec_infer.py                |  2 +-
 inference/spec_infer/spec_infer.cc            | 24 ++--------
 python/flexflow/type.py                       |  9 ++--
 src/runtime/request_manager.cc                | 26 ++++++++++-
 tests/inference/cpp_inference_tests.sh        | 45 ++++++++++---------
 tests/inference/python_inference_tests.sh     | 30 ++++++-------
 .../python_test_configs/generate_configs.py   |  4 +-
 tests/inference_tests.sh                      |  2 +-
 14 files changed, 112 insertions(+), 97 deletions(-)

diff --git a/.github/README.md b/.github/README.md
index 5db26c5aa8..528df18faf 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -153,7 +153,7 @@ A C++ example is available at [this folder](../inference/spec_infer/). After bui
 * `-ll:fsize`: size of device memory on each GPU in MB
 * `-ll:zsize`: size of zero-copy memory (pinned DRAM with direct GPU access) in MB. FlexFlow Serve keeps a replica of the LLM parameters on zero-copy memory, and therefore requires that the zero-copy memory is sufficient for storing the LLM parameters.
 * `-llm-model`: the LLM model ID from HuggingFace (e.g. "meta-llama/Llama-2-7b-hf")
-* `-ssm-model`: the SSM model ID from HuggingFace (e.g. "JackFram/llama-160m-base"). You can use multiple `-ssm-model`s in the command line to launch multiple SSMs.
+* `-ssm-model`: the SSM model ID from HuggingFace (e.g. "JackFram/llama-160m"). You can use multiple `-ssm-model`s in the command line to launch multiple SSMs.
 * `-cache-folder`: the folder
 * `-data-parallelism-degree`, `-tensor-parallelism-degree` and `-pipeline-parallelism-degree`: parallelization degrees in the data, tensor, and pipeline dimensions. Their product must equal the number of GPUs available on the machine. When any of the three parallelism degree arguments is omitted, a default value of 1 will be used. 
 * `-prompt`: (optional) path to the prompt file. FlexFlow Serve expects a json format file for prompts. In addition, users can also use the following API for registering requests:
@@ -193,13 +193,13 @@ Below is a list of models that we have explicitly tested and for which a SSM may
 
 | Model | Model id on HuggingFace | Boost-tuned SSMs |
 | :---- | :---- | :---- |
-| LLaMA-7B | meta-llama/Llama-2-7b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
-| LLaMA-13B | decapoda-research/llama-13b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
-| LLaMA-30B | decapoda-research/llama-30b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
-| LLaMA-65B | decapoda-research/llama-65b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
-| LLaMA-2-7B | meta-llama/Llama-2-7b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
-| LLaMA-2-13B | meta-llama/Llama-2-13b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
-| LLaMA-2-70B | meta-llama/Llama-2-70b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
+| LLaMA-7B | meta-llama/Llama-2-7b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-13B | decapoda-research/llama-13b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-30B | decapoda-research/llama-30b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-65B | decapoda-research/llama-65b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-2-7B | meta-llama/Llama-2-7b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-2-13B | meta-llama/Llama-2-13b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-2-70B | meta-llama/Llama-2-70b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
 | OPT-6.7B | facebook/opt-6.7b | [OPT-125M](https://huggingface.co/facebook/opt-125m) |
 | OPT-13B | facebook/opt-13b | [OPT-125M](https://huggingface.co/facebook/opt-125m) |
 | OPT-30B | facebook/opt-30b | [OPT-125M](https://huggingface.co/facebook/opt-125m) |
diff --git a/CMakeLists.txt b/CMakeLists.txt
index f9ce66a0f1..3732d5ff6f 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -32,6 +32,19 @@ if(NOT CMAKE_BUILD_TYPE AND NOT CMAKE_CONFIGURATION_TYPES)
       STRING "Choose the type of build." FORCE)
 endif()
 
+if(INSTALL_DIR)
+  message(STATUS "INSTALL_DIR: ${INSTALL_DIR}")
+  set(CMAKE_INSTALL_PREFIX ${INSTALL_DIR} CACHE PATH "Installation directory" FORCE)
+else()
+  # Install DIR not set. Use default, unless a conda environment is active
+  if (DEFINED ENV{CONDA_PREFIX} AND NOT FF_BUILD_FROM_PYPI)
+    set(CONDA_PREFIX $ENV{CONDA_PREFIX})
+    # Set CMAKE_INSTALL_PREFIX to the Conda environment's installation path
+    set(CMAKE_INSTALL_PREFIX ${CONDA_PREFIX} CACHE PATH "Installation directory" FORCE)
+    message(STATUS "Active conda environment detected. Setting CMAKE_INSTALL_PREFIX: ${CMAKE_INSTALL_PREFIX}")
+  endif()
+endif()
+
 # do not disable assertions even if in release mode
 set(CMAKE_CXX_FLAGS_RELEASE "${CMAKE_CXX_FLAGS_RELEASE} -UNDEBUG")
 
diff --git a/SERVE.md b/SERVE.md
index 1a00be2589..f6e34750cd 100644
--- a/SERVE.md
+++ b/SERVE.md
@@ -117,7 +117,7 @@ A C++ example is available at [this folder](../inference/spec_infer/). After bui
 * `-ll:fsize`: size of device memory on each GPU in MB
 * `-ll:zsize`: size of zero-copy memory (pinned DRAM with direct GPU access) in MB. FlexFlow Serve keeps a replica of the LLM parameters on zero-copy memory, and therefore requires that the zero-copy memory is sufficient for storing the LLM parameters.
 * `-llm-model`: the LLM model ID from HuggingFace (e.g. "meta-llama/Llama-2-7b-hf")
-* `-ssm-model`: the SSM model ID from HuggingFace (e.g. "JackFram/llama-160m-base"). You can use multiple `-ssm-model`s in the command line to launch multiple SSMs.
+* `-ssm-model`: the SSM model ID from HuggingFace (e.g. "JackFram/llama-160m"). You can use multiple `-ssm-model`s in the command line to launch multiple SSMs.
 * `-cache-folder`: the folder
 * `-data-parallelism-degree`, `-tensor-parallelism-degree` and `-pipeline-parallelism-degree`: parallelization degrees in the data, tensor, and pipeline dimensions. Their product must equal the number of GPUs available on the machine. When any of the three parallelism degree arguments is omitted, a default value of 1 will be used. 
 * `-prompt`: (optional) path to the prompt file. FlexFlow Serve expects a json format file for prompts. In addition, users can also use the following API for registering requests:
@@ -157,13 +157,13 @@ Below is a list of models that we have explicitly tested and for which a SSM may
 
 | Model | Model id on HuggingFace | Boost-tuned SSMs |
 | :---- | :---- | :---- |
-| LLaMA-7B | meta-llama/Llama-2-7b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
-| LLaMA-13B | decapoda-research/llama-13b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
-| LLaMA-30B | decapoda-research/llama-30b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
-| LLaMA-65B | decapoda-research/llama-65b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
-| LLaMA-2-7B | meta-llama/Llama-2-7b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
-| LLaMA-2-13B | meta-llama/Llama-2-13b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
-| LLaMA-2-70B | meta-llama/Llama-2-70b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m-base) |
+| LLaMA-7B | meta-llama/Llama-2-7b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-13B | decapoda-research/llama-13b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-30B | decapoda-research/llama-30b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-65B | decapoda-research/llama-65b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-2-7B | meta-llama/Llama-2-7b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-2-13B | meta-llama/Llama-2-13b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
+| LLaMA-2-70B | meta-llama/Llama-2-70b-hf | [LLaMA-68M](https://huggingface.co/JackFram/llama-68m) , [LLaMA-160M](https://huggingface.co/JackFram/llama-160m) |
 | OPT-6.7B | facebook/opt-6.7b | [OPT-125M](https://huggingface.co/facebook/opt-125m) |
 | OPT-13B | facebook/opt-13b | [OPT-125M](https://huggingface.co/facebook/opt-125m) |
 | OPT-30B | facebook/opt-30b | [OPT-125M](https://huggingface.co/facebook/opt-125m) |
diff --git a/config/config.inc b/config/config.inc
index 7f1f0ffcf4..5a7bde5ce9 100644
--- a/config/config.inc
+++ b/config/config.inc
@@ -24,7 +24,7 @@ fi
 
 #set installation dir
 if [ -n "$INSTALL_DIR" ]; then
-  SET_INSTALL_DIR="-DCMAKE_INSTALL_PREFIX=${INSTALL_DIR}"
+  SET_INSTALL_DIR="-DINSTALL_DIR=${INSTALL_DIR}"
 fi
 
 if [ "$INFERENCE_TESTS" = "ON" ]; then
diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index 124b46862a..512645e624 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -186,11 +186,10 @@ enum OperatorType {
 enum ModelType {
   UNKNOWN = 3001,
   LLAMA = 3002,
-  LLAMA2 = 3003,
-  OPT = 3004,
-  FALCON = 3005,
-  STARCODER = 3006,
-  MPT = 3007
+  OPT = 3003,
+  FALCON = 3004,
+  STARCODER = 3005,
+  MPT = 3006
 };
 
 enum PMParameter {
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index 463bc10151..c3f9052305 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -177,14 +177,7 @@ void FlexFlow::top_level_task(Task const *task,
   auto architectures = model_config["architectures"];
   for (auto const &str : architectures) {
     if (str == "LlamaForCausalLM" || str == "LLaMAForCausalLM") {
-      std::string nameOrPath = model_config["_name_or_path"];
-      // TODO: support LLAMA-2 models not from Meta
-      bool llama2 = nameOrPath.find("meta-llama/Llama-2") == 0;
-      if (llama2) {
-        model_type = ModelType::LLAMA2;
-      } else {
-        model_type = ModelType::LLAMA;
-      }
+      model_type = ModelType::LLAMA;
       break;
     } else if (str == "OPTForCausalLM") {
       model_type = ModelType::OPT;
@@ -220,7 +213,7 @@ void FlexFlow::top_level_task(Task const *task,
   rm->register_output_filepath(file_paths.output_file_path);
 
   FFModel model(ffconfig, ffconfig.cpu_offload);
-  if (model_type == ModelType::LLAMA || model_type == ModelType::LLAMA2) {
+  if (model_type == ModelType::LLAMA) {
     LLAMA::create_llama_model(model,
                               config_filepath,
                               weights_filepath,
diff --git a/inference/python/spec_infer.py b/inference/python/spec_infer.py
index 201b8d4a63..c9fb5cc7bb 100644
--- a/inference/python/spec_infer.py
+++ b/inference/python/spec_infer.py
@@ -68,7 +68,7 @@ def get_configs():
             "ssms": [
                 {
                     # required ssm parameter
-                    "ssm_model": "JackFram/llama-160m-base",
+                    "ssm_model": "JackFram/llama-160m",
                     # optional ssm parameters
                     "cache_path": "",
                     "refresh_cache": False,
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 98b5ec4633..8b0eb926d9 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -166,14 +166,7 @@ void get_model_meta(FilePaths &file_paths,
   auto architectures = llm_model_config["architectures"];
   for (auto const &str : architectures) {
     if (str == "LlamaForCausalLM" || str == "LLaMAForCausalLM") {
-      std::string nameOrPath = llm_model_config["_name_or_path"];
-      // TODO: support LLAMA-2 models not from Meta
-      bool llama2 = nameOrPath.find("meta-llama/Llama-2") == 0;
-      if (llama2) {
-        model_metadata.llm_model_type = ModelType::LLAMA2;
-      } else {
-        model_metadata.llm_model_type = ModelType::LLAMA;
-      }
+      model_metadata.llm_model_type = ModelType::LLAMA;
       break;
     } else if (str == "OPTForCausalLM") {
       model_metadata.llm_model_type = ModelType::OPT;
@@ -223,14 +216,7 @@ void get_model_meta(FilePaths &file_paths,
     auto architectures = ssm_model_config["architectures"];
     for (auto const &str : architectures) {
       if (str == "LlamaForCausalLM" || str == "LLaMAForCausalLM") {
-        std::string nameOrPath = ssm_model_config["_name_or_path"];
-        // TODO: support LLAMA-2 models not from Meta
-        bool llama2 = nameOrPath.find("meta-llama/Llama-2") == 0;
-        if (llama2) {
-          ssm_model_type = ModelType::LLAMA2;
-        } else {
-          ssm_model_type = ModelType::LLAMA;
-        }
+        ssm_model_type = ModelType::LLAMA;
         break;
       } else if (str == "OPTForCausalLM") {
         ssm_model_type = ModelType::OPT;
@@ -318,8 +304,7 @@ void FlexFlow::top_level_task(Task const *task,
 
   // Create LLM model
   FFModel tree_model(ffconfig, ffconfig.cpu_offload);
-  if (model_metadata.llm_model_type == ModelType::LLAMA ||
-      model_metadata.llm_model_type == ModelType::LLAMA2) {
+  if (model_metadata.llm_model_type == ModelType::LLAMA) {
     LLAMA::create_llama_model(tree_model,
                               model_metadata.llm_model_config_path,
                               model_metadata.llm_weights_path,
@@ -363,8 +348,7 @@ void FlexFlow::top_level_task(Task const *task,
 
   for (int ssm_id = 0; ssm_id < num_ssms; ssm_id++) {
     FFModel &beam_model = ssm_models[ssm_id];
-    if (model_metadata.ssm_model_types[ssm_id] == ModelType::LLAMA ||
-        model_metadata.ssm_model_types[ssm_id] == ModelType::LLAMA2) {
+    if (model_metadata.ssm_model_types[ssm_id] == ModelType::LLAMA) {
       LLAMA::create_llama_model(beam_model,
                                 model_metadata.ssm_model_config_paths[ssm_id],
                                 model_metadata.ssm_model_weights_paths[ssm_id],
diff --git a/python/flexflow/type.py b/python/flexflow/type.py
index 9caecdde54..994a85f57e 100644
--- a/python/flexflow/type.py
+++ b/python/flexflow/type.py
@@ -75,11 +75,10 @@ class InferenceMode(Enum):
 class ModelType(Enum):
     UNKNOWN = 3001
     LLAMA = 3002
-    LLAMA2 = 3003
-    OPT = 3004
-    FALCON = 3005
-    STARCODER = 3006
-    MPT = 3007
+    OPT = 3003
+    FALCON = 3004
+    STARCODER = 3005
+    MPT = 3006
 
 
 class OpType(Enum):
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 4d232b6d44..e052c8716a 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -115,7 +115,7 @@ void RequestManager::register_tokenizer(ModelType type,
   this->eos_token_id = eos_token_id;
   std::string tokenizer_folder =
       (!path.empty() && path.back() != '/') ? path + '/' : path;
-  if (model_type == ModelType::LLAMA || model_type == ModelType::LLAMA2) {
+  if (model_type == ModelType::LLAMA) {
     bool path_to_file = !path.empty() &&
                         (path.size() >= strlen("tokenizer.model")) &&
                         path.find("tokenizer.model") ==
@@ -416,6 +416,12 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
                           old_bc.requestsInfo[i].request_guid,
                           request.tokens.size());
         std::string output = this->tokenizer_->Decode(request.tokens);
+        // Unlike Huggingface, the sentencepiece C++ library automatically
+        // removes the BOS token
+        if (model_type == ModelType::LLAMA &&
+            request.tokens.at(0) == bos_token_id) {
+          output = "<s> " + output;
+        }
 
         {
           // update generation result and trigger future
@@ -625,6 +631,12 @@ BeamSearchBatchConfig
                           request.guid,
                           request.tokens.size());
         std::string output = this->tokenizer_->Decode(request.tokens);
+        // Unlike Huggingface, the sentencepiece C++ library automatically
+        // removes the BOS token
+        if (model_type == ModelType::LLAMA &&
+            request.tokens.at(0) == bos_token_id) {
+          output = "<s> " + output;
+        }
         {
           // update generation result and trigger future
           GenerationResult &gr = request_generation_results[request.guid];
@@ -736,6 +748,12 @@ BeamSearchBatchConfig
           }
         }
         std::string output = this->tokenizer_->Decode(request.tokens);
+        // Unlike Huggingface, the sentencepiece C++ library automatically
+        // removes the BOS token
+        if (model_type == ModelType::LLAMA &&
+            request.tokens.at(0) == bos_token_id) {
+          output = "<s> " + output;
+        }
         log_req_mgr.print("Output: %s", output.c_str());
       }
     } else if (request.status == Request::PENDING) {
@@ -769,6 +787,12 @@ BeamSearchBatchConfig
 
       // Token Info
       std::string output = this->tokenizer_->Decode(request.tokens);
+      // Unlike Huggingface, the sentencepiece C++ library automatically removes
+      // the BOS token
+      if (model_type == ModelType::LLAMA &&
+          request.tokens.at(0) == bos_token_id) {
+        output = "<s> " + output;
+      }
       log_req_mgr.print("Output: %s", output.c_str());
     } else {
       assert(false);
diff --git a/tests/inference/cpp_inference_tests.sh b/tests/inference/cpp_inference_tests.sh
index 211d7fe1bf..8beea55999 100755
--- a/tests/inference/cpp_inference_tests.sh
+++ b/tests/inference/cpp_inference_tests.sh
@@ -10,9 +10,9 @@ cd "${BASH_SOURCE[0]%/*}"
 ###############################################################################################
 
 # LLAMA
-../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama.txt -pipeline-parallelism-degree 4
+../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama.txt -pipeline-parallelism-degree 4
 # LLAMA (half precision)
-../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_half.txt -pipeline-parallelism-degree 4
+../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_half.txt -pipeline-parallelism-degree 4
 
 # OPT
 ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-6.7b -ssm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt.txt -pipeline-parallelism-degree 4
@@ -22,9 +22,9 @@ cd "${BASH_SOURCE[0]%/*}"
 # Tensor parallelism tests
 if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
     # LLAMA
-    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     # LLAMA (half precision)
-    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     
     # OPT
     ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-6.7b -ssm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
@@ -37,9 +37,12 @@ fi
 ###############################################################################################
 
 # LLAMA (small model)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M.txt -pipeline-parallelism-degree 4
+
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 1 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M.txt -pipeline-parallelism-degree 1
+
 # LLAMA (small model, half precision)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half.txt -pipeline-parallelism-degree 4
 
 # LLAMA (big model)
 ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model meta-llama/Llama-2-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_2_7B.txt -pipeline-parallelism-degree 4
@@ -69,11 +72,11 @@ fi
 # Tensor parallelism tests
 if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
     # LLAMA (small model)
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
     # LLAMA (small model, half precision)
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m-base -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
 
     # LLAMA (big model)
     ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model meta-llama/Llama-2-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_2_7B_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
@@ -216,10 +219,10 @@ fi
 ######################### Alignment tests with HuggingFace ####################################
 
 # LLAMA (small model, full precision)
-python3 ./huggingface_inference.py --model-name "JackFram/llama-160m-base" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M.txt" --gpu
+python3 ./huggingface_inference.py --model-name "JackFram/llama-160m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M.txt" --gpu
 
 # LLAMA (small model, half precision)
-python3 ./huggingface_inference.py --model-name "JackFram/llama-160m-base" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M_half.txt" --gpu
+python3 ./huggingface_inference.py --model-name "JackFram/llama-160m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M_half.txt" --gpu
 
 # LLAMA (big model, full precision)
 python3 ./huggingface_inference.py --model-name "meta-llama/Llama-2-7b-hf" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_2_7B.txt"
@@ -243,14 +246,14 @@ python3 ./huggingface_inference.py --model-name "facebook/opt-6.7b" --use-full-p
 python3 ./huggingface_inference.py --model-name "tiiuae/falcon-7b" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_falcon_7B.txt" --max-length 128
 
 
-diff <(tail -n +2 "../../inference/output/huggingface_llama_160M.txt") <(tail -n +5 "../../inference/output/incr_decoding_llama_160M.txt")
-diff <(tail -n +2 "../../inference/output/huggingface_llama_160M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_decoding_llama_160M_half.txt" | tr -s '[:space:]' '\n' | head -n 20)
-diff <(tail -n +2 "../../inference/output/huggingface_llama_2_7B.txt") <(tail -n +5 "../../inference/output/incr_decoding_llama_2_7B.txt")
-diff <(tail -n +2 "../../inference/output/huggingface_llama_2_7B_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_decoding_llama_2_7B_half.txt" | tr -s '[:space:]' '\n' | head -n 20)
+diff "../../inference/output/huggingface_llama_160M.txt" <(tail -n +4 "../../inference/output/incr_decoding_llama_160M.txt")
+diff <( < ../../inference/output/huggingface_llama_160M_half.txt tr -s '[:space:]' '\n' | head -n 20) <(tail -n +4 "../../inference/output/incr_decoding_llama_160M_half.txt" | tr -s '[:space:]' '\n' | head -n 20)
+diff "../../inference/output/huggingface_llama_2_7B.txt" <(tail -n +4 "../../inference/output/incr_decoding_llama_2_7B.txt")
+diff <( < ../../inference/output/huggingface_llama_2_7B_half.txt tr -s '[:space:]' '\n' | head -n 20) <(tail -n +4 "../../inference/output/incr_decoding_llama_2_7B_half.txt" | tr -s '[:space:]' '\n' | head -n 20)
 
-diff <(tail -n +2 "../../inference/output/huggingface_opt_125M.txt") <(tail -n +5 "../../inference/output/incr_decoding_opt_125M.txt")
-diff <(tail -n +2 "../../inference/output/huggingface_opt_125M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_decoding_opt_125M_half.txt" | tr -s '[:space:]' '\n' | head -n 20)
-diff <(tail -n +2 "../../inference/output/huggingface_opt_6B.txt") <(tail -n +5 "../../inference/output/incr_decoding_opt_6B.txt")
-# diff <(tail -n +2 "../../inference/output/huggingface_opt_6B_half.txt") <(tail -n +5 "../../inference/output/incr_decoding_opt_6B_half.txt")
-diff <(tail -n +2 "../../inference/output/huggingface_falcon_7B.txt") <(tail -n +5 "../../inference/output/incr_decoding_falcon_7B.txt")
+diff "../../inference/output/huggingface_opt_125M.txt" <(tail -n +4 "../../inference/output/incr_decoding_opt_125M.txt")
+diff <( < ../../inference/output/huggingface_opt_125M_half.txt tr -s '[:space:]' '\n' | head -n 20) <(tail -n +4 "../../inference/output/incr_decoding_opt_125M_half.txt" | tr -s '[:space:]' '\n' | head -n 20)
+diff "../../inference/output/huggingface_opt_6B.txt" <(tail -n +4 "../../inference/output/incr_decoding_opt_6B.txt")
+# diff "../../inference/output/huggingface_opt_6B_half.txt" <(tail -n +4 "../../inference/output/incr_decoding_opt_6B_half.txt")
+diff "../../inference/output/huggingface_falcon_7B.txt" <(tail -n +4 "../../inference/output/incr_decoding_falcon_7B.txt")
 
diff --git a/tests/inference/python_inference_tests.sh b/tests/inference/python_inference_tests.sh
index b0f8daa14e..3544f58e26 100755
--- a/tests/inference/python_inference_tests.sh
+++ b/tests/inference/python_inference_tests.sh
@@ -133,10 +133,10 @@ check_partial_token_match "../../inference/output/spec_infer-python-opt-6.7b-hal
 
 ## Incremental decoding
 # Small LLAMA
-diff <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-base-full_prec-2_tp_2_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-base-full_prec-1_tp_4_pp.txt")
-check_partial_token_match "../../inference/output/incr_dec-python-llama-160m-base-half_prec-2_tp_2_pp.txt" "../../inference/output/incr_dec-python-llama-160m-base-half_prec-1_tp_4_pp.txt"
-diff <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-base-full_prec-4_tp_1_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-base-full_prec-1_tp_4_pp.txt")
-check_partial_token_match "../../inference/output/incr_dec-python-llama-160m-base-half_prec-4_tp_1_pp.txt" "../../inference/output/incr_dec-python-llama-160m-base-half_prec-1_tp_4_pp.txt"
+diff <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-full_prec-2_tp_2_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-full_prec-1_tp_4_pp.txt")
+check_partial_token_match "../../inference/output/incr_dec-python-llama-160m-half_prec-2_tp_2_pp.txt" "../../inference/output/incr_dec-python-llama-160m-half_prec-1_tp_4_pp.txt"
+diff <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-full_prec-4_tp_1_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-full_prec-1_tp_4_pp.txt")
+check_partial_token_match "../../inference/output/incr_dec-python-llama-160m-half_prec-4_tp_1_pp.txt" "../../inference/output/incr_dec-python-llama-160m-half_prec-1_tp_4_pp.txt"
 # Big LLAMA
 diff <(tail -n +3 "../../inference/output/incr_dec-python-llama-2-7b-hf-full_prec-2_tp_2_pp.txt") <(tail -n +3 "../../inference/output/incr_dec-python-llama-2-7b-hf-full_prec-1_tp_4_pp.txt")
 check_partial_token_match "../../inference/output/incr_dec-python-llama-2-7b-hf-half_prec-2_tp_2_pp.txt" "../../inference/output/incr_dec-python-llama-2-7b-hf-half_prec-1_tp_4_pp.txt"
@@ -157,10 +157,10 @@ check_partial_token_match "../../inference/output/incr_dec-python-opt-6.7b-half_
 ######################### Alignment tests with HuggingFace ####################################
 
 # LLAMA (small model, full precision)
-python3 ./huggingface_inference.py --model-name "JackFram/llama-160m-base" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M.txt" --gpu
+python3 ./huggingface_inference.py --model-name "JackFram/llama-160m" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M.txt" --gpu
 
 # LLAMA (small model, half precision)
-python3 ./huggingface_inference.py --model-name "JackFram/llama-160m-base" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M_half.txt" --gpu
+python3 ./huggingface_inference.py --model-name "JackFram/llama-160m" --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_160M_half.txt" --gpu
 
 # LLAMA (big model, full precision)
 python3 ./huggingface_inference.py --model-name "meta-llama/Llama-2-7b-hf" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_llama_7B.txt"
@@ -183,13 +183,13 @@ python3 ./huggingface_inference.py --model-name "facebook/opt-6.7b" --use-full-p
 # Falcon (full precision)
 python3 ./huggingface_inference.py --model-name "tiiuae/falcon-7b" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_falcon_7B.txt" --max-length 128
 
-diff <(tail -n +2 "../../inference/output/huggingface_llama_160M.txt") <(tail -n +5 "../../inference/output/incr_dec-python-llama-160m-base-full_prec-1_tp_4_pp.txt")
-diff <(tail -n +2 "../../inference/output/huggingface_llama_160M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_dec-python-llama-160m-base-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
-diff <(tail -n +2 "../../inference/output/huggingface_llama_7B.txt") <(tail -n +5 "../../inference/output/incr_dec-python-llama-2-7b-hf-full_prec-1_tp_4_pp.txt")
-diff <(tail -n +2 "../../inference/output/huggingface_llama_7B_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_dec-python-llama-2-7b-hf-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
+diff "../../inference/output/huggingface_llama_160M.txt" <(tail -n +4 "../../inference/output/incr_dec-python-llama-160m-full_prec-1_tp_4_pp.txt")
+diff <( < ../../inference/output/huggingface_llama_160M_half.txt tr -s '[:space:]' '\n' | head -n 20) <(tail -n +4 "../../inference/output/incr_dec-python-llama-160m-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
+diff "../../inference/output/huggingface_llama_7B.txt" <(tail -n +4 "../../inference/output/incr_dec-python-llama-2-7b-hf-full_prec-1_tp_4_pp.txt")
+diff <( < ../../inference/output/huggingface_llama_7B_half.txt tr -s '[:space:]' '\n' | head -n 20) <(tail -n +4 "../../inference/output/incr_dec-python-llama-2-7b-hf-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
 
-diff <(tail -n +2 "../../inference/output/huggingface_opt_125M.txt") <(tail -n +5 "../../inference/output/incr_dec-python-opt-125m-full_prec-1_tp_4_pp.txt")
-diff <(tail -n +2 "../../inference/output/huggingface_opt_125M_half.txt" | tr -s '[:space:]' '\n' | head -n 20) <(tail -n +5 "../../inference/output/incr_dec-python-opt-125m-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
-diff <(tail -n +2 "../../inference/output/huggingface_opt_6B.txt") <(tail -n +5 "../../inference/output/incr_dec-python-opt-6.7b-full_prec-1_tp_4_pp.txt")
-#diff <(tail -n +2 "../../inference/output/huggingface_opt_6B_half.txt") <(tail -n +5 "../../inference/output/incr_dec-python-opt-6.7b-half_prec-1_tp_4_pp.txt")
-diff <(tail -n +2 "../../inference/output/huggingface_falcon_7B.txt") <(tail -n +5 "../../inference/output/incr_dec-python-falcon-7b-full_prec-1_tp_4_pp.txt")
+diff "../../inference/output/huggingface_opt_125M.txt" <(tail -n +4 "../../inference/output/incr_dec-python-opt-125m-full_prec-1_tp_4_pp.txt")
+diff <( < ../../inference/output/huggingface_opt_125M_half.txt tr -s '[:space:]' '\n' | head -n 20) <(tail -n +4 "../../inference/output/incr_dec-python-opt-125m-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
+diff "../../inference/output/huggingface_opt_6B.txt" <(tail -n +4 "../../inference/output/incr_dec-python-opt-6.7b-full_prec-1_tp_4_pp.txt")
+#diff "../../inference/output/huggingface_opt_6B_half.txt" <(tail -n +4 "../../inference/output/incr_dec-python-opt-6.7b-half_prec-1_tp_4_pp.txt")
+diff "../../inference/output/huggingface_falcon_7B.txt" <(tail -n +4 "../../inference/output/incr_dec-python-falcon-7b-full_prec-1_tp_4_pp.txt")
diff --git a/tests/inference/python_test_configs/generate_configs.py b/tests/inference/python_test_configs/generate_configs.py
index c77e19053d..ebaadade32 100644
--- a/tests/inference/python_test_configs/generate_configs.py
+++ b/tests/inference/python_test_configs/generate_configs.py
@@ -35,7 +35,7 @@
     "ssms": [
         {
             # required ssm parameter
-            "ssm_model": "JackFram/llama-160m-base",
+            "ssm_model": "JackFram/llama-160m",
             # optional ssm parameters
             "cache_path": "",
             "refresh_cache": False,
@@ -47,7 +47,7 @@
 ff_init_configs.update(llm_configs)
 
 # Test parameters to fill in
-llama_models = ["meta-llama/Llama-2-7b-hf", "JackFram/llama-160m-base"]
+llama_models = ["meta-llama/Llama-2-7b-hf", "JackFram/llama-160m"]
 opt_models = ["facebook/opt-6.7b", "facebook/opt-125m"]
 falcon_models = [
     "tiiuae/falcon-7b",
diff --git a/tests/inference_tests.sh b/tests/inference_tests.sh
index d450c2d6d5..895b74c798 100755
--- a/tests/inference_tests.sh
+++ b/tests/inference_tests.sh
@@ -44,7 +44,7 @@ if [[ "$PYTHON_INFERENCE_TESTS" == "ON" ]]; then
 fi
 if [[ "$CPP_INFERENCE_TESTS" == "ON" ]]; then
     # Manually download the weights in both half and full precision
-    python3 ../inference/utils/download_hf_model.py "meta-llama/Llama-2-7b-hf" "JackFram/llama-160m-base" "facebook/opt-6.7b" "facebook/opt-125m" "tiiuae/falcon-7b"
+    python3 ../inference/utils/download_hf_model.py "meta-llama/Llama-2-7b-hf" "JackFram/llama-160m" "facebook/opt-6.7b" "facebook/opt-125m" "tiiuae/falcon-7b"
     echo "Running C++ inference tests..."
     ./inference/cpp_inference_tests.sh
 fi

From c6ad6e2056c5739a138d80fc3af1a06249e7ddba Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Thu, 9 Nov 2023 17:46:23 -0500
Subject: [PATCH 261/344] Update the default cublas behavior when CUDA_VERSION
 is not specified (#1209)

* Update the default cublas behavior when CUDA_VERSION is not specified

* fix hip error

* use CUBLAS_COMPUTE_FAST_16F for full-precision gemm
---
 src/ops/inc_multihead_self_attention.cpp      | 14 +++++-----
 src/ops/inc_multihead_self_attention.cu       | 26 +++++++++++++------
 src/ops/kernels/linear_kernels.cpp            | 18 +++++++------
 src/ops/kernels/linear_kernels.cu             | 26 +++++++++++++------
 src/ops/spec_inc_multihead_self_attention.cpp |  7 ++---
 src/ops/spec_inc_multihead_self_attention.cu  | 13 +++++++---
 src/ops/tree_inc_multihead_self_attention.cpp |  7 ++---
 src/ops/tree_inc_multihead_self_attention.cu  | 13 +++++++---
 8 files changed, 80 insertions(+), 44 deletions(-)

diff --git a/src/ops/inc_multihead_self_attention.cpp b/src/ops/inc_multihead_self_attention.cpp
index 37cc986f5e..d60386f927 100644
--- a/src/ops/inc_multihead_self_attention.cpp
+++ b/src/ops/inc_multihead_self_attention.cpp
@@ -257,10 +257,11 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
   DT alpha = 1.0f, beta = 0.0f;
   assert(m->qSize == m->vSize && m->qSize == m->kSize);
   hipblasDatatype_t hipblas_data_type = ff_to_cuda_datatype(m->output_type[0]);
-#if CUDA_VERSION >= 11000
-  // TODO: currently set the default to HIPBLAS_COMPUTE_16F for best performance
-  cublasComputeType_t compute_type = HIPBLAS_COMPUTE_16F;
+#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  hipblasDatatype_t compute_type = hipblas_data_type;
 #else
+  // TODO: currently use the hipblas_data_type
+  // cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
   hipblasDatatype_t compute_type = hipblas_data_type;
 #endif
   // Compute (W^T)x matmul: einsum(ijkl,im->jmkl)
@@ -509,10 +510,11 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
   hipblasDatatype_t hipblas_data_type = ff_to_cuda_datatype(m->output_type[0]);
   miopenDataType_t miopen_data_type = ff_to_cudnn_datatype(m->output_type[0]);
   assert(data_type_size(m->output_type[0]) == sizeof(DT));
-#if CUDA_VERSION >= 11000
-  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
-  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  hipblasDatatype_t compute_type = hipblas_data_type;
 #else
+  // TODO: currently use the hipblas_data_type
+  // cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
   hipblasDatatype_t compute_type = hipblas_data_type;
 #endif
   // int num_requests = bc->num_active_requests();
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 3b24a5a324..cff5550c85 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -238,11 +238,16 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
   DT alpha = 1.0f, beta = 0.0f;
   assert(m->qSize == m->vSize && m->qSize == m->kSize);
   cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
-#if CUDA_VERSION >= 11000
-  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
-  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
-#else
+#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
   cudaDataType_t compute_type = cublas_data_type;
+#else
+  // For best performance, set the default cublas compute type to
+  // CUBLAS_COMPUTE_16F for half precision and to
+  // CUBLAS_COMPUTE_32F_FAST_16F for full precision
+  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+  if (m->output_type[0] == DT_FLOAT) {
+    compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
+  }
 #endif
   // Compute (W^T)x matmul: einsum(ijkl,im->jmkl)
   // Weights: qSize x qProjSize x 3 x num_q_heads
@@ -508,11 +513,16 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
   cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
   cudnnDataType_t cudnn_data_type = ff_to_cudnn_datatype(m->output_type[0]);
   assert(data_type_size(m->output_type[0]) == sizeof(DT));
-#if CUDA_VERSION >= 11000
-  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
-  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
-#else
+#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
   cudaDataType_t compute_type = cublas_data_type;
+#else
+  // For best performance, set the default cublas compute type to
+  // CUBLAS_COMPUTE_16F for half precision and to
+  // CUBLAS_COMPUTE_32F_FAST_16F for full precision
+  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+  if (m->output_type[0] == DT_FLOAT) {
+    compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
+  }
 #endif
   // int num_requests = bc->num_active_requests();
   int num_tokens = bc->num_active_tokens();
diff --git a/src/ops/kernels/linear_kernels.cpp b/src/ops/kernels/linear_kernels.cpp
index 231ca0f3d7..072eb5e96b 100644
--- a/src/ops/kernels/linear_kernels.cpp
+++ b/src/ops/kernels/linear_kernels.cpp
@@ -241,11 +241,12 @@ void forward_kernel(LinearMeta const *m,
   hipblasDatatype_t input_type = ff_to_cuda_datatype(m->input_type[0]);
   hipblasDatatype_t weight_type = ff_to_cuda_datatype(m->weight_type[0]);
   hipblasDatatype_t output_type = ff_to_cuda_datatype(m->output_type[0]);
-#if CUDA_VERSION >= 11000
-  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
-  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  hipblasDatatype_t compute_type = output_type;
 #else
-  hipblasDatatype_t compute_type = input_type;
+  // TODO: currently use the output_type
+  // cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+  hipblasDatatype_t compute_type = output_type;
 #endif
   checkCUDA(hipblasGemmEx(m->handle.blas,
                           HIPBLAS_OP_T,
@@ -337,11 +338,12 @@ void backward_kernel(LinearMeta const *m,
   hipblasDatatype_t input_type = ff_to_cuda_datatype(m->input_type[0]);
   hipblasDatatype_t weight_type = ff_to_cuda_datatype(m->weight_type[0]);
   hipblasDatatype_t output_type = ff_to_cuda_datatype(m->output_type[0]);
-#if CUDA_VERSION >= 11000
-  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
-  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  hipblasDatatype_t compute_type = output_type;
 #else
-  hipblasDatatype_t compute_type = HIPBLAS_R_32F;
+  // TODO: currently use output_type
+  // cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+  hipblasDatatype_t compute_type = output_type;
 #endif
   int output_size = out_dim * batch_size;
   if (m->activation == AC_MODE_RELU) {
diff --git a/src/ops/kernels/linear_kernels.cu b/src/ops/kernels/linear_kernels.cu
index 8a93357dcf..9373c2fb2f 100644
--- a/src/ops/kernels/linear_kernels.cu
+++ b/src/ops/kernels/linear_kernels.cu
@@ -311,11 +311,16 @@ void forward_kernel(LinearMeta const *m,
                                    : ff_to_cuda_datatype(m->weight_type[0]);
   cudaDataType_t output_type = ff_to_cuda_datatype(m->output_type[0]);
   assert(input_type == weight_type && weight_type == output_type);
-#if CUDA_VERSION >= 11000
-  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
-  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  cudaDataType_t compute_type = cublas_data_type;
 #else
-  cudaDataType_t compute_type = input_type;
+  // For best performance, set the default cublas compute type to
+  // CUBLAS_COMPUTE_16F for half precision and to
+  // CUBLAS_COMPUTE_32F_FAST_16F for full precision
+  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+  if (m->output_type[0] == DT_FLOAT) {
+    compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
+  }
 #endif
   checkCUDA(cublasGemmEx(m->handle.blas,
                          CUBLAS_OP_T,
@@ -401,11 +406,16 @@ void backward_kernel(LinearMeta const *m,
   cudaDataType_t input_type = ff_to_cuda_datatype(m->input_type[0]);
   cudaDataType_t weight_type = ff_to_cuda_datatype(m->weight_type[0]);
   cudaDataType_t output_type = ff_to_cuda_datatype(m->output_type[0]);
-#if CUDA_VERSION >= 11000
-  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
-  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  cudaDataType_t compute_type = cublas_data_type;
 #else
-  cudaDataType_t compute_type = CUDA_R_32F;
+  // For best performance, set the default cublas compute type to
+  // CUBLAS_COMPUTE_16F for half precision and to
+  // CUBLAS_COMPUTE_32F_FAST_16F for full precision
+  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+  if (m->output_type[0] == DT_FLOAT) {
+    compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
+  }
 #endif
   int output_size = out_dim * batch_size;
   if (m->activation == AC_MODE_RELU) {
diff --git a/src/ops/spec_inc_multihead_self_attention.cpp b/src/ops/spec_inc_multihead_self_attention.cpp
index 1d81ae0c11..b1687d12a2 100644
--- a/src/ops/spec_inc_multihead_self_attention.cpp
+++ b/src/ops/spec_inc_multihead_self_attention.cpp
@@ -200,10 +200,11 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   hipblasDatatype_t hipblas_data_type = ff_to_cuda_datatype(m->output_type[0]);
   miopenDataType_t miopen_data_type = ff_to_cudnn_datatype(m->output_type[0]);
   assert(data_type_size(m->output_type[0]) == sizeof(DT));
-#if CUDA_VERSION >= 11000
-  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
-  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  hipblasDatatype_t compute_type = hipblas_data_type;
 #else
+  // TODO: currently use the hipblas_data_type
+  // cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
   hipblasDatatype_t compute_type = hipblas_data_type;
 #endif
   // int num_requests = bc->num_active_requests();
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index ac74eb1c8f..52e083889e 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -215,11 +215,16 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
   cudnnDataType_t cudnn_data_type = ff_to_cudnn_datatype(m->output_type[0]);
   assert(data_type_size(m->output_type[0]) == sizeof(DT));
-#if CUDA_VERSION >= 11000
-  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
-  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
-#else
+#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
   cudaDataType_t compute_type = cublas_data_type;
+#else
+  // For best performance, set the default cublas compute type to
+  // CUBLAS_COMPUTE_16F for half precision and to
+  // CUBLAS_COMPUTE_32F_FAST_16F for full precision
+  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+  if (m->output_type[0] == DT_FLOAT) {
+    compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
+  }
 #endif
   // int num_requests = bc->num_active_requests();
   int num_tokens = bc->num_active_tokens();
diff --git a/src/ops/tree_inc_multihead_self_attention.cpp b/src/ops/tree_inc_multihead_self_attention.cpp
index 1d9ebf67e0..26291fb3b4 100644
--- a/src/ops/tree_inc_multihead_self_attention.cpp
+++ b/src/ops/tree_inc_multihead_self_attention.cpp
@@ -157,10 +157,11 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
   hipblasDatatype_t hipblas_data_type = ff_to_cuda_datatype(m->output_type[0]);
   miopenDataType_t miopen_data_type = ff_to_cudnn_datatype(m->output_type[0]);
   assert(data_type_size(m->output_type[0]) == sizeof(DT));
-#if CUDA_VERSION >= 11000
-  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
-  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  hipblasDatatype_t compute_type = hipblas_data_type;
 #else
+  // TODO: currently use the hipblas_data_type
+  // cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
   hipblasDatatype_t compute_type = hipblas_data_type;
 #endif
   // int num_requests = bc->num_active_requests();
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index edf7a2d075..0aa50f605c 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -158,11 +158,16 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
   cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
   cudnnDataType_t cudnn_data_type = ff_to_cudnn_datatype(m->output_type[0]);
   assert(data_type_size(m->output_type[0]) == sizeof(DT));
-#if CUDA_VERSION >= 11000
-  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
-  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
-#else
+#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
   cudaDataType_t compute_type = cublas_data_type;
+#else
+  // For best performance, set the default cublas compute type to
+  // CUBLAS_COMPUTE_16F for half precision and to
+  // CUBLAS_COMPUTE_32F_FAST_16F for full precision
+  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+  if (m->output_type[0] == DT_FLOAT) {
+    compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
+  }
 #endif
   // int num_requests = bc->num_active_requests();
   int processed_tokens_in_batch = 0;

From 3bcf3d4975db86c071e3118c6d027851925613c7 Mon Sep 17 00:00:00 2001
From: zwang86 <46699021+zwang86@users.noreply.github.com>
Date: Fri, 10 Nov 2023 08:30:45 -0500
Subject: [PATCH 262/344] Reorder tokens in batch using based on token type
 (#1214)

* Reorder tokens in init and verify batch.

* Format code

* fix

---------

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 src/runtime/request_manager.cc | 194 ++++++++++++++++++++++-----------
 1 file changed, 133 insertions(+), 61 deletions(-)

diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index e052c8716a..f1164d3c49 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -362,39 +362,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
   BatchConfig new_bc;
   for (int i = 0; i < BatchConfig::max_requests_per_batch(); i++) {
     if (old_bc.request_completed[i]) { // add new requests to the next batch
-      if (!pending_request_queue.empty() &&
-          new_bc.num_tokens < get_max_tokens_per_batch()) {
-        Request new_request = pending_request_queue.front();
-        pending_request_queue.pop();
-        // all_requests[new_request.guid] = new_request;
-        new_bc.requestsInfo[i].first_token_depth_in_request = 0;
-        new_bc.requestsInfo[i].first_token_offset_in_batch = new_bc.num_tokens;
-        new_bc.requestsInfo[i].request_guid = new_request.guid;
-        new_bc.requestsInfo[i].num_tokens_in_batch =
-            std::min(get_max_tokens_per_batch() - new_bc.num_tokens -
-                         BatchConfig::max_requests_per_batch() + (i + 1),
-                     (int)new_request.tokens.size());
-        new_bc.requestsInfo[i].max_sequence_length =
-            new_request.max_sequence_length;
-        new_bc.request_completed[i] = false;
-        // add profile_info for the new request
-        ProfileInfo profile_info;
-        profile_info.decoding_steps = 1;
-        profile_info.start_time = Realm::Clock::current_time_in_microseconds();
-        profiling_requests[new_request.guid] = profile_info;
-        for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
-          int depth = new_bc.requestsInfo[i].first_token_depth_in_request + j;
-          new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
-          new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = depth;
-          assert(depth < new_request.tokens.size());
-          new_bc.tokensInfo[new_bc.num_tokens].token_id =
-              new_request.tokens[depth];
-          new_bc.num_tokens++;
-        }
-        if (new_bc.num_tokens == get_max_tokens_per_batch()) {
-          break;
-        }
-      }
+      continue;
     } else {
       assert(old_bc.requestsInfo[i].num_tokens_in_batch > 0);
       Request &request = all_requests[old_bc.requestsInfo[i].request_guid];
@@ -504,6 +472,44 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
     }
   }
 
+  // Step 3: add new requests to the next batch
+  for (int i = 0; i < BatchConfig::max_requests_per_batch(); i++) {
+    if (new_bc.request_completed[i]) {
+      if (!pending_request_queue.empty() &&
+          new_bc.num_tokens < get_max_tokens_per_batch()) {
+        Request new_request = pending_request_queue.front();
+        pending_request_queue.pop();
+        // all_requests[new_request.guid] = new_request;
+        new_bc.requestsInfo[i].first_token_depth_in_request = 0;
+        new_bc.requestsInfo[i].first_token_offset_in_batch = new_bc.num_tokens;
+        new_bc.requestsInfo[i].request_guid = new_request.guid;
+        new_bc.requestsInfo[i].num_tokens_in_batch =
+            std::min(get_max_tokens_per_batch() - new_bc.num_tokens,
+                     (int)new_request.tokens.size());
+        new_bc.requestsInfo[i].max_sequence_length =
+            new_request.max_sequence_length;
+        new_bc.request_completed[i] = false;
+        // add profile_info for the new request
+        ProfileInfo profile_info;
+        profile_info.decoding_steps = 1;
+        profile_info.start_time = Realm::Clock::current_time_in_microseconds();
+        profiling_requests[new_request.guid] = profile_info;
+        for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
+          int depth = new_bc.requestsInfo[i].first_token_depth_in_request + j;
+          new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
+          new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = depth;
+          assert(depth < new_request.tokens.size());
+          new_bc.tokensInfo[new_bc.num_tokens].token_id =
+              new_request.tokens[depth];
+          new_bc.num_tokens++;
+        }
+        if (new_bc.num_tokens == get_max_tokens_per_batch()) {
+          break;
+        }
+      }
+    }
+  }
+
   return new_bc;
 }
 
@@ -946,8 +952,9 @@ BeamSearchBatchConfig
   new_bc.model_id = old_bc.model_id;
   // std::cout << "old_bc.model_id: " << old_bc.model_id << "\n";
 
+  // Add incremental tokens to the batch
   for (int i = 0; i < BatchConfig::max_requests_per_batch(); i++) {
-    if (old_bc.request_completed[i]) {
+    if (old_bc.request_completed[i] || !old_bc.request_running[i]) {
       continue;
     }
     // Comment out this assertion since num_tokens_in_batch can be
@@ -1003,6 +1010,7 @@ BeamSearchBatchConfig
           old_bc.beamRequestsInfo[i].beam_size;
       new_bc.beamRequestsInfo[i].max_depth =
           old_bc.beamRequestsInfo[i].max_depth;
+
       if (request.status == Request::RUNNING) {
         new_bc.beamRequestsInfo[i].current_depth =
             old_bc.beamRequestsInfo[i].current_depth + 1;
@@ -1010,11 +1018,7 @@ BeamSearchBatchConfig
         // do the slot exchange to minimize the cache exchange in kernel.
         update_beam_metadata(new_bc, request.beam_trees.at(old_bc.model_id), i);
       } else {
-        // if the request is pending, we need to update the beam search
-        // metadata based on the initial length
-        new_bc.beamRequestsInfo[i].current_depth =
-            old_bc.beamRequestsInfo[i].current_depth;
-        new_bc.request_running[i] = false;
+        assert(false && "Request should not be pending in beam search phase");
       }
 
       // do the slot exchange to minimize the cache exchange in kernel.
@@ -1026,7 +1030,8 @@ BeamSearchBatchConfig
         if (request.status == Request::RUNNING) {
           new_bc.requestsInfo[i].num_tokens_in_batch = 1;
         } else {
-          new_bc.requestsInfo[i].num_tokens_in_batch = 0;
+          assert(false && "Request should be done");
+          // new_bc.requestsInfo[i].num_tokens_in_batch = 0;
         }
 
         if (verbose) {
@@ -1035,6 +1040,84 @@ BeamSearchBatchConfig
                     << ", num_tokens_in_batch: "
                     << new_bc.requestsInfo[i].num_tokens_in_batch << std::endl;
         }
+      }
+
+      if (verbose) {
+        std::cout << "SSM KV Cache Size beam: " << request.ssm_cache_size
+                  << std::endl;
+        std::cout << "LLM KV Cache Size beam: " << request.llm_cache_size
+                  << std::endl;
+      }
+
+      // register more tokens due to the beam width
+      for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
+        int depth = new_bc.requestsInfo[i].first_token_depth_in_request + j;
+        for (int k = 0; k < new_bc.sub_requests[i]; k++) {
+          new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
+          new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = depth;
+
+          // get value from requestinfo
+          new_bc.tokensInfo[new_bc.num_tokens].token_id =
+              new_bc.beamRequestsInfo[i].tokens[k];
+
+          new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = k;
+          new_bc.num_tokens++;
+        }
+      }
+    }
+  }
+
+  // Add prompt tokens to the batch
+  for (int i = 0; i < BatchConfig::max_requests_per_batch(); i++) {
+    if (old_bc.request_completed[i] || old_bc.request_running[i]) {
+      continue;
+    }
+    // Comment out this assertion since num_tokens_in_batch can be
+    // zero when beam search has reached required sequence length
+    // assert(old_bc.requestsInfo[i].num_tokens_in_batch > 0);
+    Request &request = all_requests[old_bc.requestsInfo[i].request_guid];
+    int processed_tokens = old_bc.requestsInfo[i].first_token_depth_in_request +
+                           old_bc.requestsInfo[i].num_tokens_in_batch;
+
+    // assert(processed_tokens < request.tokens.size());
+    log_req_mgr.debug() << "processed_tokens: " << processed_tokens << "\n";
+
+    {
+      log_req_mgr.debug() << "num tokens: " << old_bc.num_tokens << ", "
+                          << new_bc.num_tokens;
+      new_bc.request_completed[i] = false;
+      new_bc.requestsInfo[i].first_token_depth_in_request = processed_tokens;
+      new_bc.requestsInfo[i].first_token_offset_in_batch = new_bc.num_tokens;
+      new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
+      new_bc.requestsInfo[i].max_sequence_length =
+          old_bc.requestsInfo[i].max_sequence_length;
+
+      // update the beam search metadata
+      // how many sub request in current request
+      // why is sub_requests has max_requests_per_batch() * MAX_BEAM_WIDTH
+      // entries?
+      new_bc.sub_requests[i] = old_bc.beamRequestsInfo[i].beam_size;
+
+      // update the parentid, accumalated_probs, depth, and token_ids
+      new_bc.beamRequestsInfo[i].beam_size =
+          old_bc.beamRequestsInfo[i].beam_size;
+      new_bc.beamRequestsInfo[i].max_depth =
+          old_bc.beamRequestsInfo[i].max_depth;
+
+      if (request.status == Request::PENDING) {
+        // if the request is pending, we need to update the beam search
+        // metadata based on the initial length
+        new_bc.beamRequestsInfo[i].current_depth =
+            old_bc.beamRequestsInfo[i].current_depth;
+        new_bc.request_running[i] = false;
+      } else {
+        assert(false && "Request should be pending");
+      }
+
+      if (new_bc.requestsInfo[i].first_token_depth_in_request >=
+          request.tokens.size()) {
+        // request is done
+        new_bc.requestsInfo[i].num_tokens_in_batch = 0;
       } else {
         // Prompt phase
         new_bc.requestsInfo[i].num_tokens_in_batch =
@@ -1043,17 +1126,16 @@ BeamSearchBatchConfig
                      (int)request.tokens.size() -
                          new_bc.requestsInfo[i].first_token_depth_in_request);
         request.ssm_cache_size += new_bc.requestsInfo[i].num_tokens_in_batch;
-        if (verbose) {
-          std::cout << "[ Beam Spec] " << request.guid << std::endl;
-          std::cout << "Prompt phase: " << request.tokens.size()
-                    << ", num_tokens_in_batch:"
-                    << new_bc.requestsInfo[i].num_tokens_in_batch << std::endl;
-          std::cout << "Update ssm cache size: " << request.ssm_cache_size
-                    << std::endl;
-        }
       }
 
       if (verbose) {
+        std::cout << "[ Beam Spec] " << request.guid << std::endl;
+        std::cout << "Prompt phase: " << request.tokens.size()
+                  << ", num_tokens_in_batch:"
+                  << new_bc.requestsInfo[i].num_tokens_in_batch << std::endl;
+        std::cout << "Update ssm cache size: " << request.ssm_cache_size
+                  << std::endl;
+
         std::cout << "SSM KV Cache Size beam: " << request.ssm_cache_size
                   << std::endl;
         std::cout << "LLM KV Cache Size beam: " << request.llm_cache_size
@@ -1068,19 +1150,8 @@ BeamSearchBatchConfig
           new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = depth;
 
           // get value from requestinfo
-          if (request.status == Request::RUNNING) {
-            // std::cout << "[running ]Num of token in batch: "
-            //           << new_bc.requestsInfo[i].num_tokens_in_batch
-            //           << std::endl;
-            new_bc.tokensInfo[new_bc.num_tokens].token_id =
-                new_bc.beamRequestsInfo[i].tokens[k];
-          } else {
-            // std::cout << "[pending ]Num of token in batch: "
-            //           << new_bc.requestsInfo[i].num_tokens_in_batch
-            //           << std::endl;
-            new_bc.tokensInfo[new_bc.num_tokens].token_id =
-                request.tokens[request.tokens.size() - 1];
-          }
+          new_bc.tokensInfo[new_bc.num_tokens].token_id =
+              request.tokens[request.tokens.size() - 1];
 
           new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = k;
           new_bc.num_tokens++;
@@ -1088,6 +1159,7 @@ BeamSearchBatchConfig
       }
     }
   }
+
   if (verbose) {
     std::cout << "prepare_next_batch_beam OLD vs NEW batchconfigs:"
               << std::endl;

From b15d06082babe07649e3dc20f0c516029054f9fc Mon Sep 17 00:00:00 2001
From: Xinhao Cheng <99570243+xinhaoc@users.noreply.github.com>
Date: Wed, 15 Nov 2023 15:33:39 -0500
Subject: [PATCH 263/344] Optimize attention kernel (#1228)

* change layout

* main change

* fix

* change spec&tree kernel

* fix tp

* fix

* fix multi requests

* replicate key&value

* ci

* cleanup&hip

* more fix.

* ci

* new kernel

* draft

* fix

* align inc

* fix

* .

* multi batch

* fix

* fix

* fix different thread per key case

* fix

* .

* .

* .

* fix.

* fix.

* .

* .

* ..

* opt

* fix half

* fix.

* .

* hip

* clean

---------

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 include/flexflow/batch_config.h               |   3 +
 .../ops/inc_multihead_self_attention.h        |  10 +-
 .../inc_multihead_self_attention_kernels.h    |  16 +
 .../inc_multihead_self_attention_utils.cuh    | 524 ++++++++++++++++++
 .../ops/spec_inc_multihead_self_attention.h   |   1 -
 src/ops/inc_multihead_self_attention.cu       | 523 +++++++++++++----
 src/ops/spec_inc_multihead_self_attention.cu  |  89 +--
 src/ops/tree_inc_multihead_self_attention.cu  | 376 ++++++++++++-
 src/runtime/request_manager.cc                |   9 +
 9 files changed, 1380 insertions(+), 171 deletions(-)
 create mode 100644 include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index d625985552..e2903c4d11 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -59,6 +59,9 @@ class BatchConfig {
 
   //  Set by update
   int num_tokens;
+  // number of tokens in prompt phase, start offset of tokens in inc_decoding
+  // phase. num_tokens - num_prompt_tokens = num_generation_tokens;
+  int num_generation_tokens;
 
   struct PerRequestInfo {
     int first_token_depth_in_request;
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index 5ff0942fff..43dc527bc8 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -29,7 +29,7 @@ class IncMultiHeadSelfAttention : public Op {
 
   IncMultiHeadSelfAttention(FFModel &model,
                             LayerID const &layer_guid,
-                            const ParallelTensor _input,
+                            ParallelTensor const _input,
                             int _embed_dim,
                             int _num_q_heads,
                             int _num_kv_heads,
@@ -50,8 +50,8 @@ class IncMultiHeadSelfAttention : public Op {
                             int _tensor_parallelism_degree,
                             char const *name);
   IncMultiHeadSelfAttention(FFModel &model,
-                            const ParallelTensor _input,
-                            const ParallelTensor _weight,
+                            ParallelTensor const _input,
+                            ParallelTensor const _weight,
                             int _embed_dim,
                             int _num_q_heads,
                             int _num_kv_heads,
@@ -73,7 +73,7 @@ class IncMultiHeadSelfAttention : public Op {
                             char const *name);
   IncMultiHeadSelfAttention(FFModel &model,
                             IncMultiHeadSelfAttention const &other,
-                            const ParallelTensor input,
+                            ParallelTensor const input,
                             bool allocate_weights);
   IncMultiHeadSelfAttention(FFModel &model,
                             Params const &params,
@@ -192,9 +192,11 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
   void *attn_heads;
   char *quantized_weight_ptr;
   BatchConfig::PerTokenInfo *token_infos;
+  BatchConfig::PerRequestInfo *request_infos;
   DataType quantization_type;
   bool offload;
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+  // cudaStream_t task_local_stream;
   cudnnTensorDescriptor_t qk_tensor;
   cuFloatComplex *complex_input;
 #elif defined(FF_USE_HIP_ROCM)
diff --git a/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h b/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
index 763f654e28..9bf2f581e2 100644
--- a/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
+++ b/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
@@ -14,6 +14,22 @@ namespace FlexFlow {
 namespace Kernels {
 namespace IncMultiHeadAttention {
 
+template <typename DT>
+void compute_attention_kernel_generation(IncMultiHeadSelfAttentionMeta const *m,
+                                         BatchConfig const *bc,
+                                         DT *output_ptr,
+                                         ffStream_t stream);
+
+template <typename DT>
+void compute_o_prod_bias(IncMultiHeadSelfAttentionMeta const *m,
+                         BatchConfig const *bc,
+                         int shard_id,
+                         DT *output_ptr,
+                         DT const *weight_ptr,
+                         DT const *bias_ptr,
+                         int num_tokens,
+                         ffStream_t stream);
+
 template <typename DT>
 __global__ void apply_position_bias_qkprd(DT *input_ptr,
                                           int num_tokens,
diff --git a/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh b/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh
new file mode 100644
index 0000000000..c128c1a126
--- /dev/null
+++ b/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh
@@ -0,0 +1,524 @@
+#ifndef _FLEXFLOW_OPS_KERNELS_INC_MULTIHEAD_SELF_UTILS_H
+#define _FLEXFLOW_OPS_KERNELS_INC_MULTIHEAD_SELF_UTILS_H
+
+#include "flexflow/inference.h"
+
+namespace FlexFlow {
+
+////////////////basic datatype//////////////////////
+struct half4 {
+  half x;
+  half y;
+  half z;
+  half w;
+};
+
+struct half8 {
+  half x;
+  half y;
+  half z;
+  half w;
+  half a;
+  half b;
+  half c;
+  half d;
+};
+struct float8 {
+  float x;
+  float y;
+  float z;
+  float w;
+  float a;
+  float b;
+  float c;
+  float d;
+};
+
+////////////////data type///////////////
+template <typename DT, int VECPSIZE>
+struct VEC_K {};
+template <>
+struct VEC_K<float, 1> {
+  using Type = float;
+};
+template <>
+struct VEC_K<float, 2> {
+  using Type = float2;
+};
+template <>
+struct VEC_K<float, 4> {
+  using Type = float4;
+};
+template <>
+struct VEC_K<half, 1> {
+  using Type = half;
+};
+template <>
+struct VEC_K<half, 2> {
+  using Type = half2;
+};
+template <>
+struct VEC_K<half, 4> {
+  using Type = half4;
+};
+
+// data type for QK production
+template <typename T>
+struct Vec_fp32_ {};
+
+template <>
+struct Vec_fp32_<float> {
+  using Type = float;
+};
+template <>
+struct Vec_fp32_<float2> {
+  using Type = float2;
+};
+template <>
+struct Vec_fp32_<float4> {
+  using Type = float4;
+};
+template <>
+struct Vec_fp32_<half> {
+  using Type = float;
+};
+template <>
+struct Vec_fp32_<half2> {
+  using Type = float2;
+};
+template <>
+struct Vec_fp32_<half4> {
+  using Type = float4;
+};
+template <>
+struct Vec_fp32_<half8> {
+  using Type = float8;
+};
+
+template <typename DT>
+struct VEC_V {};
+template <>
+struct VEC_V<float> {
+  using Type = float4;
+};
+template <>
+struct VEC_V<half> {
+  using Type = half8;
+};
+
+////////////////data structures half///////////////
+
+////////////////////////////////////floating point
+/// operations///////////////////////////////////////////
+
+template <typename Acc, typename A, typename B>
+inline __device__ Acc mul(A a, B b) {
+  return Acc{}; // for compile
+}
+template <>
+inline __device__ float mul<float, float>(float a, float b) {
+  return a * b;
+}
+
+template <>
+inline __device__ float2 mul(float2 a, float2 b) {
+  float2 c;
+  c.x = a.x * b.x;
+  c.y = a.y * b.y;
+  return c;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <>
+inline __device__ float2 mul(float a, float2 b) {
+  float2 c;
+  c.x = a * b.x;
+  c.y = a * b.y;
+  return c;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <>
+inline __device__ float4 mul(float4 a, float4 b) {
+  float4 c;
+  c.x = a.x * b.x;
+  c.y = a.y * b.y;
+  c.z = a.z * b.z;
+  c.w = a.w * b.w;
+  return c;
+}
+
+// template <>
+// inline __device__ float4 mul(half4 a, half4 b) {
+//   float4 c;
+//   c.x = a.x * b.x;
+//   c.y = a.y * b.y;
+//   c.z = a.z * b.z;
+//   c.w = a.w * b.w;
+//   return c;
+// }
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+inline __device__ float fma(float a, float b, float c) {
+  return a * b + c;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+inline __device__ float2 fma(float2 a, float2 b, float2 c) {
+  float2 d;
+  d.x = fma(a.x, b.x, c.x);
+  d.y = fma(a.y, b.y, c.y);
+  return d;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+inline __device__ float2 fma(float a, float2 b, float2 c) {
+  float2 d;
+  d.x = fma(a, b.x, c.x);
+  d.y = fma(a, b.y, c.y);
+  return d;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+inline __device__ float4 fma(float4 a, float4 b, float4 c) {
+  float4 d;
+  d.x = fma(a.x, b.x, c.x);
+  d.y = fma(a.y, b.y, c.y);
+  d.z = fma(a.z, b.z, c.z);
+  d.w = fma(a.w, b.w, c.w);
+  return d;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+inline __device__ float4 fma(float a, float4 b, float4 c) {
+  float4 d;
+  d.x = fma(a, b.x, c.x);
+  d.y = fma(a, b.y, c.y);
+  d.z = fma(a, b.z, c.z);
+  d.w = fma(a, b.w, c.w);
+  return d;
+}
+
+inline __device__ float8 fma(float a, float8 f1, float8 f2) {
+  float8 res;
+  res.x = fma(a, f1.x, f2.x);
+  res.y = fma(a, f1.y, f2.y);
+  res.z = fma(a, f1.z, f2.z);
+  res.w = fma(a, f1.w, f2.w);
+  res.a = fma(a, f1.a, f2.a);
+  res.b = fma(a, f1.b, f2.b);
+  res.c = fma(a, f1.c, f2.c);
+  res.d = fma(a, f1.d, f2.d);
+  return res;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+inline __device__ float add(float a, float b) {
+  return a + b;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+inline __device__ float2 add(float2 a, float2 b) {
+  float2 c;
+  c.x = add(a.x, b.x);
+  c.y = add(a.y, b.y);
+  return c;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+inline __device__ float4 add(float4 a, float4 b) {
+  float4 c;
+  c.x = add(a.x, b.x);
+  c.y = add(a.y, b.y);
+  c.z = add(a.z, b.z);
+  c.w = add(a.w, b.w);
+  return c;
+}
+
+inline __device__ float8 add(float8 f1, float8 f2) {
+  float8 res;
+  res.x = add(f1.x, f2.x);
+  res.y = add(f1.y, f2.y);
+  res.z = add(f1.z, f2.z);
+  res.w = add(f1.w, f2.w);
+  res.a = add(f1.a, f2.a);
+  res.b = add(f1.b, f2.b);
+  res.c = add(f1.c, f2.c);
+  res.d = add(f1.d, f2.d);
+  return res;
+}
+
+inline __device__ float sum(float v) {
+  return v;
+}
+
+template <typename T>
+inline __device__ __host__ T div_up(T m, T n) {
+  return (m + n - 1) / n;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+inline __device__ float sum(float2 v) {
+  return v.x + v.y;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+inline __device__ float sum(float4 v) {
+  return v.x + v.y + v.z + v.w;
+}
+
+inline __device__ float cast_to_float(float u) {
+  return u;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+inline __device__ float2 cast_to_float(float2 u) {
+  return u;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+inline __device__ float4 cast_to_float(float4 u) {
+  return u;
+}
+
+inline __device__ float cast_to_float(half u) {
+  return __half2float(u);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+inline __device__ float2 cast_to_float(half2 u) {
+  float2 tmp;
+  tmp.x = __half2float(u.x);
+  tmp.y = __half2float(u.y);
+  return tmp;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+inline __device__ float4 cast_to_float(half4 u) {
+  float4 tmp;
+  tmp.x = __half2float(u.x);
+  tmp.y = __half2float(u.y);
+  tmp.z = __half2float(u.z);
+  tmp.w = __half2float(u.w);
+  return tmp;
+}
+inline __device__ float8 cast_to_float(half8 u) {
+  float8 tmp;
+  tmp.x = __half2float(u.x);
+  tmp.y = __half2float(u.y);
+  tmp.z = __half2float(u.z);
+  tmp.w = __half2float(u.w);
+  tmp.a = __half2float(u.a);
+  tmp.b = __half2float(u.b);
+  tmp.c = __half2float(u.c);
+  tmp.d = __half2float(u.d);
+  return tmp;
+}
+
+inline __device__ void convert_from_float(float4 &dst, float4 src) {
+  dst = src;
+}
+inline __device__ void convert_from_float(float &dst, float src) {
+  dst = src;
+}
+inline __device__ void convert_from_float(float2 &dst, float2 src) {
+  dst = src;
+}
+inline __device__ void convert_from_float(float8 &dst, float8 src) {
+  dst = src;
+}
+
+inline __device__ void convert_from_float(half4 &dst, float4 src) {
+  dst.x = __float2half(src.x);
+  dst.y = __float2half(src.y);
+  dst.z = __float2half(src.z);
+  dst.w = __float2half(src.w);
+}
+
+inline __device__ void convert_from_float(half8 &dst, float8 src) {
+  dst.x = __float2half(src.x);
+  dst.y = __float2half(src.y);
+  dst.z = __float2half(src.z);
+  dst.w = __float2half(src.w);
+  dst.a = __float2half(src.a);
+  dst.b = __float2half(src.b);
+  dst.c = __float2half(src.c);
+  dst.d = __float2half(src.d);
+}
+inline __device__ void convert_from_float(half2 &dst, float2 src) {
+  dst.x = __float2half(src.x);
+  dst.y = __float2half(src.y);
+}
+inline __device__ void convert_from_float(half &dst, float src) {
+  dst = __float2half(src);
+}
+
+//////////////////////////////////////utils///////////////////////////////////////////////
+
+template <typename T>
+inline __device__ void zero(T &dst) {
+  constexpr int WORDS = sizeof(T) / 4;
+  union {
+    T raw;
+    uint32_t words[WORDS];
+  } tmp;
+#pragma unroll
+  for (int ii = 0; ii < WORDS; ++ii) {
+    tmp.words[ii] = 0u;
+  }
+  dst = tmp.raw;
+}
+
+template <int THREADS_PER_KEY, typename K_vec, int N>
+inline __device__ float qk_dot_(K_vec const (&q)[N], K_vec const (&k)[N]) {
+  // use float32 to get better accuracy
+  using Vec_sum = typename Vec_fp32_<K_vec>::Type;
+  // Compute the parallel products for Q*K^T (treat vector lanes separately).
+  Vec_sum qk_vec =
+      mul<Vec_sum, Vec_sum, Vec_sum>(cast_to_float(q[0]), cast_to_float(k[0]));
+#pragma unroll
+  for (int ii = 1; ii < N; ++ii) {
+    qk_vec = FlexFlow::fma(cast_to_float(q[ii]), cast_to_float(k[ii]), qk_vec);
+  }
+
+  // Finalize the reduction across lanes.
+  float qk = sum(qk_vec);
+#pragma unroll
+  for (int mask = THREADS_PER_KEY / 2; mask >= 1; mask /= 2) {
+    qk += __shfl_xor_sync(uint32_t(-1), qk, mask);
+  }
+  return qk;
+}
+template <typename T, int THREADS_PER_KEY>
+struct Qk_dot {
+  template <typename K_vec, int N>
+  static inline __device__ float dot(K_vec const (&q)[N], K_vec const (&k)[N]) {
+    return qk_dot_<THREADS_PER_KEY>(q, k);
+  }
+};
+
+template <int WARPS_PER_BLOCK, int WARP_SIZE = 32>
+inline __device__ float block_sum(float *red_smem, float sum) {
+
+  // Decompose the thread index into warp / lane.
+  int warp = threadIdx.x / WARP_SIZE;
+  int lane = threadIdx.x % WARP_SIZE;
+
+// Compute the sum per warp.
+#pragma unroll
+  for (int mask = WARP_SIZE / 2; mask >= 1; mask /= 2) {
+    sum += __shfl_xor_sync(uint32_t(-1), sum, mask);
+  }
+
+  // Warp leaders store the data to shared memory.
+  if (lane == 0) {
+    red_smem[warp] = sum;
+  }
+
+  // Make sure the data is in shared memory.
+  __syncthreads();
+
+  // The warps compute the final sums.
+  if (lane < WARPS_PER_BLOCK) {
+    sum = red_smem[lane];
+  }
+
+// Parallel reduction inside the warp.
+#pragma unroll
+  for (int mask = WARPS_PER_BLOCK / 2; mask >= 1; mask /= 2) {
+    sum += __shfl_xor_sync(uint32_t(-1), sum, mask);
+  }
+
+  // Broadcast to other threads.
+  return __shfl_sync(uint32_t(-1), sum, 0);
+}
+
+template <typename DT>
+inline size_t smem_size_in_bytes(int hidden_size_per_head,
+                                 int max_sequence_length,
+                                 int threads_per_value,
+                                 int threads_per_block) {
+  // The amount of shared memory needed to store the Q*K^T values in float.
+
+  size_t qk_sz = div_up(max_sequence_length + 1, 4) * 16;
+  size_t logits_sz = qk_sz;
+
+  // The total size needed during softmax.
+  size_t softmax_sz = qk_sz + logits_sz;
+  size_t q_size = hidden_size_per_head * sizeof(DT);
+
+  // The number of partial rows to reduce in the final reduction.
+  int rows_per_red = threads_per_block / threads_per_value;
+  // The amount of storage needed to finalize the outputs.
+  size_t red_sz = rows_per_red * hidden_size_per_head * sizeof(float) / 2;
+  // The max.
+  return max(softmax_sz, red_sz) + q_size;
+}
+
+template <typename DT>
+inline void smem_size_in_bytes_tree(int hidden_size_per_head,
+                                    int max_sequence_length,
+                                    int threads_per_value,
+                                    int threads_per_block,
+                                    TreeVerifyBatchConfig const *bc,
+                                    int shared_mem[]) {
+
+  int max_query_length = 0;
+  int max_total_length = 0;
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    max_query_length =
+        max(max_query_length, bc->requestsInfo[i].num_tokens_in_batch);
+    max_total_length = max(max_total_length,
+                           bc->requestsInfo[i].first_token_depth_in_request +
+                               bc->requestsInfo[i].num_tokens_in_batch);
+  }
+
+  // todo fix this
+  int max_qk_length = max_query_length * max_total_length;
+
+  // The amount of shared memory needed to store the Q*K^T values in float.
+  size_t qk_sz = div_up(max_qk_length + 1, 4) * 16;
+
+  size_t logits_sz = qk_sz;
+
+  // The total size needed during softmax.
+  size_t softmax_sz = qk_sz + logits_sz;
+
+  size_t q_size = hidden_size_per_head * sizeof(DT);
+
+  // The number of partial rows to reduce in the final reduction.
+  int rows_per_red = threads_per_block / threads_per_value;
+  // The amount of storage needed to finalize the outputs.
+  // use 4
+  size_t red_sz = rows_per_red * hidden_size_per_head * sizeof(float) / 2;
+  // The max.
+  shared_mem[0] = qk_sz;
+  shared_mem[1] = softmax_sz + red_sz + q_size;
+}
+
+template <typename T, int Dh>
+struct threads_per_value_t {
+  static int const value = Dh * sizeof(T) / 16;
+};
+
+} // namespace FlexFlow
+#endif // _FLEXFLOW_OPS_KERNELS_INC_MULTIHEAD_SELF_UTILS_H
\ No newline at end of file
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention.h b/include/flexflow/ops/spec_inc_multihead_self_attention.h
index 363776cdb0..56bb2bd80d 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention.h
@@ -140,7 +140,6 @@ class SpecIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
 
 public:
   Realm::RegionInstance beam_search_reserve_inst;
-  BatchConfig::PerRequestInfo *request_infos;
   BeamSearchBatchConfig::BeamSearchPerTokenInfo *beam_token_infos;
   BeamSearchBatchConfig::BeamSearchPerRequestInfo *beam_request_infos;
 };
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index cff5550c85..20f7d64936 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -19,6 +19,7 @@
 #include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ops/kernels/decompress_kernels.h"
 #include "flexflow/ops/kernels/inc_multihead_self_attention_kernels.h"
+#include "flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh"
 #include "flexflow/utils/cuda_helper.h"
 
 namespace FlexFlow {
@@ -27,9 +28,277 @@ namespace FlexFlow {
 using Legion::coord_t;
 using Legion::Memory;
 
+#define WARP_SIZE 32
+
 namespace Kernels {
 namespace IncMultiHeadAttention {
 
+// gridDim = num_heads
+// blockDim = num_tokens/num_request * head_size
+// QKV tensor layout: |QKV| * num_new_tokens. |Q=K=V=head_size * num_heads|
+// one thread process one head_size
+template <typename DT,
+          int THREADS_PER_BLOCK,
+          int Dh,
+          int Dh_MAX,
+          int THREADS_PER_KEY,
+          int THREADS_PER_VALUE>
+__global__ void compute_attention_kernel_generation_kernel(
+    DT const *query,
+    DT const *key_cache,
+    DT const *value_cache,
+    DT *output_ptr,
+    float const scale,
+    int max_seq_length,
+    int per_head_size,
+    int hidden_size,
+    BatchConfig::PerRequestInfo *request_infos,
+    bool is_beam,
+    int max_beam_width) {
+
+  // q, k
+  using Q_vec = typename VEC_K<DT, THREADS_PER_KEY>::Type;
+  using K_vec = typename VEC_K<DT, THREADS_PER_KEY>::Type;
+  using V_vec = typename VEC_V<DT>::Type;
+  using Out_sum = typename Vec_fp32_<V_vec>::Type;
+
+  constexpr int WARPS_PER_BLOCK = THREADS_PER_BLOCK / WARP_SIZE;
+
+  // eg.  if head_size = 128, thread_per_key = 4, with float32 precision
+  // then K_VEC_SIZE = 1,  QK_VEC_SIZE = 4
+  //  K_ELTS_PER_THREAD = 128 / 4 = 32
+  //  K_VECS_PER_THREAD = 32 / 1 = 32
+  constexpr int K_VEC_SIZE = sizeof(K_vec) / sizeof(DT);
+  // constexpr int QK_VEC_SIZE = 16 / sizeof(DT);
+  // // constexpr int QK_VEC_SIZE = sizeof(Qk_vec_k) / sizeof(DT);
+  constexpr int K_ELTS_PER_THREAD = Dh / THREADS_PER_KEY;
+  constexpr int K_VECS_PER_THREAD = K_ELTS_PER_THREAD / K_VEC_SIZE;
+  // constexpr int QK_ELTS_IN_16B = 16 / sizeof(DT);
+
+  // thread id
+  int const tidx = threadIdx.x;
+  // head id
+  int const head_idx = blockIdx.x;
+  // request idx
+  int const request_idx = blockIdx.y;
+
+  int const beam_request_idx =
+      is_beam ? request_idx / max_beam_width : request_idx;
+  int const beam_sub_request_idx = is_beam ? request_idx % max_beam_width : 0;
+
+  int const first_step = 0;
+
+  int const tlength =
+      request_infos[beam_request_idx].first_token_depth_in_request +
+      request_infos[beam_request_idx].num_tokens_in_batch;
+
+  // shared memory objects
+  extern __shared__ char smem_[];
+
+  float *qk_smem = reinterpret_cast<float *>(smem_);
+  float *out_smem = reinterpret_cast<float *>(smem_);
+
+  float qk_max = -FLT_MAX;
+
+  // first WARPS_PER_BLOCK for store qk_max, second WARPS_PER_BLOCK for sum
+  __shared__ float red_smem[WARPS_PER_BLOCK * 2];
+
+  const DT *q_ptr = query + beam_request_idx * hidden_size * QKV_WEIGHT_NUM +
+                    head_idx * per_head_size;
+  __shared__ Q_vec q_vecs[THREADS_PER_KEY][K_VECS_PER_THREAD];
+  // DT const *q_ptr =
+  //     query + request_idx * Dh * QKV_WEIGHT_NUM + head_idx * per_head_size;
+
+  // q tensor in this thread
+  // if THREADS_PER_KEY is 4, first thread load 0, 4, 8, 12..., total
+  // K_VECS_PER_THREAD elements
+  // QK_vec_k: 32->1, 64->2, 128->4... head_size
+  // K_vec_k: 4->1, 2->2, 1->4 threads_per_key
+
+  // the start offset of the element eg. (0, 1, 2, 3) * K_VEC_SIZE
+  int ki = tidx % THREADS_PER_KEY * K_VEC_SIZE;
+  int ki_o = tidx % THREADS_PER_KEY;
+  // the first key's offset for this thread
+  // ko = 0, 0, 0, 0, 1, 1, 1, 1, ....
+  int ko = tidx / THREADS_PER_KEY;
+  // load q tensor
+  Q_vec q_vec[K_VECS_PER_THREAD];
+#pragma unroll
+  for (int ii = 0; ii < K_VECS_PER_THREAD; ++ii) {
+    q_vecs[ki_o][ii] = *reinterpret_cast<Q_vec const *>(
+        q_ptr + ki + ii * THREADS_PER_KEY * K_VEC_SIZE);
+  }
+  __syncthreads();
+  // first iter = 128 / 4 = 32
+  // K_VECS_PER_THREAD = 32
+  //  K_PER_ITER how many keys in this loop
+  //  The number of timesteps loaded per iteration.
+  constexpr int K_PER_ITER = THREADS_PER_BLOCK / THREADS_PER_KEY;
+  //   // The number of keys per warp.
+  constexpr int K_PER_WARP = WARP_SIZE / THREADS_PER_KEY;
+
+  DT const *k_cache_batch =
+      key_cache +
+      (beam_request_idx * max_beam_width + beam_sub_request_idx) *
+          max_seq_length * hidden_size +
+      ki;
+
+  int ti_end =
+      div_up(tlength - first_step, K_PER_WARP) * K_PER_WARP + first_step;
+  // get k, perform qk proj
+
+  for (int ti = ko; ti < ti_end; ti += K_PER_ITER) {
+    K_vec k[K_VECS_PER_THREAD];
+    int const ti_circ = ti % max_seq_length;
+#pragma unroll
+    for (int ii = 0; ii < K_VECS_PER_THREAD; ++ii) {
+      int jj = ii * THREADS_PER_KEY * K_VEC_SIZE;
+      if (ti < tlength) {
+        k[ii] = *reinterpret_cast<K_vec const *>(k_cache_batch +
+                                                 ti_circ * hidden_size +
+                                                 head_idx * per_head_size + jj);
+      }
+      // Compute dot product.
+      // This includes a reduction across the threads in the same thread group.
+    }
+    float qk = scale * Qk_dot<DT, THREADS_PER_KEY>::dot(q_vecs[ki_o], k);
+    // // todo add positional embedding to the qk production
+    // // Store the product to shared memory. There's one qk value per
+    // timestep.
+    // // Update the max.
+    if (ti < tlength && tidx % THREADS_PER_KEY == 0) {
+      // todo add alobi here
+      bool const mask = ti_circ >= tlength;
+      if (mask) {
+        assert(false);
+      }
+      qk_max = mask ? qk_max : fmaxf(qk_max, qk);
+      qk_smem[ti - first_step] = mask ? 0.f : qk;
+    }
+  }
+
+  __syncthreads();
+
+#pragma unroll
+  for (int mask = WARP_SIZE / 2; mask >= THREADS_PER_KEY; mask /= 2) {
+    qk_max = fmaxf(qk_max, __shfl_xor_sync(uint32_t(-1), qk_max, mask));
+  }
+
+  // Decompose the thread index into warp and lane.
+  int const warp = tidx / WARP_SIZE;
+  int const lane = tidx % WARP_SIZE;
+
+  // The warp leader writes the max to shared memory.
+  if (lane == 0) {
+    red_smem[warp] = qk_max;
+  }
+
+  // Make sure the products are in shared memory.
+  __syncthreads();
+
+  // The warps finalize the reduction.
+  qk_max = lane < WARPS_PER_BLOCK ? red_smem[lane] : -FLT_MAX;
+#pragma unroll
+  for (int mask = WARPS_PER_BLOCK / 2; mask >= 1; mask /= 2) {
+    qk_max = fmaxf(qk_max, __shfl_xor_sync(uint32_t(-1), qk_max, mask));
+  }
+
+  // Broadcast to all the threads in the warp.
+  qk_max = __shfl_sync(uint32_t(-1), qk_max, 0);
+
+  float exp_sum = 0.f;
+  for (int ti = first_step + tidx; ti < tlength; ti += THREADS_PER_BLOCK) {
+    float logit = __expf(qk_smem[ti - first_step] - qk_max);
+    exp_sum += logit;
+    qk_smem[ti - first_step] = logit;
+  }
+
+  // Compute the sum.
+  exp_sum = block_sum<WARPS_PER_BLOCK>(&red_smem[WARPS_PER_BLOCK], exp_sum);
+
+  // softmax
+  float inv_sum = __fdividef(1.f, exp_sum + 1.e-6);
+  for (int ti = first_step + tidx; ti < tlength; ti += THREADS_PER_BLOCK) {
+    qk_smem[ti - first_step] *= inv_sum;
+  }
+
+  __syncthreads();
+  // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
+  //   printf("softmax %.10f\n", qk_smem[0]);
+  // }
+
+  // value projection
+  constexpr int V_VEC_SIZE = 16 / sizeof(DT);
+  // A vector of V elements for the current timestep.
+  // using V_vec_k = typename V_vec_k_<DT, V_VEC_SIZE>::Type;
+  // using V_vec_acum = typename V_vec_acum_fp32_<V_vec_k>::Type;
+
+  // The value computed by this thread.
+  int vo = tidx / THREADS_PER_VALUE;
+  // The hidden dimensions computed by this particular thread.
+  int vi = tidx % THREADS_PER_VALUE * V_VEC_SIZE;
+  constexpr int V_PER_ITER = THREADS_PER_BLOCK / THREADS_PER_VALUE;
+
+  Out_sum out;
+  zero(out);
+
+  // The base pointer for the value in the cache buffer.
+  DT const *v_cache_batch =
+      value_cache +
+      (beam_request_idx * max_beam_width + beam_sub_request_idx) *
+          max_seq_length * hidden_size +
+      vi;
+
+  if (Dh == Dh_MAX || vi < Dh) {
+    for (int ti = first_step + vo; ti < tlength; ti += V_PER_ITER) {
+      // Load the values from the cache.
+      int const ti_circ = ti % max_seq_length;
+
+      V_vec v = *reinterpret_cast<V_vec const *>(
+          v_cache_batch + ti_circ * hidden_size + head_idx * per_head_size);
+      float logit = qk_smem[ti - first_step];
+      out = FlexFlow::fma(logit, cast_to_float(v), out);
+    }
+  }
+
+  //   // Make sure we can start writing to shared memory.
+  __syncthreads();
+
+  // Run the final reduction amongst the different groups computing different
+  // partial outputs.
+  if (Dh == Dh_MAX || vi < Dh) {
+#pragma unroll
+    for (int active_groups = V_PER_ITER; active_groups >= 2;
+         active_groups /= 2) {
+
+      // The midpoint in the number of active groups.
+      int midpoint = active_groups / 2;
+
+      // The upper part of active threads store to shared memory.
+      if (vo >= midpoint && vo < active_groups && (Dh == Dh_MAX || vi < Dh)) {
+        *reinterpret_cast<Out_sum *>(out_smem + (vo - midpoint) * Dh + vi) =
+            out;
+      }
+      __syncthreads();
+
+      // The bottom warps update their values.
+      if (vo < midpoint && (Dh == Dh_MAX || vi < Dh)) {
+        out = add(*reinterpret_cast<Out_sum const *>(out_smem + vo * Dh + vi),
+                  out);
+      }
+      __syncthreads();
+    }
+  }
+
+  // Output the final values.
+  if (vo == 0 && (Dh == Dh_MAX || vi < Dh)) {
+    convert_from_float(
+        *reinterpret_cast<V_vec *>(output_ptr + beam_request_idx * hidden_size +
+                                   head_idx * per_head_size + vi),
+        out);
+  }
+}
+
 // only used by MPT model. https://arxiv.org/abs/2108.12409
 template <typename DT>
 __global__ void apply_position_bias_qkprd(DT *input_ptr,
@@ -350,6 +619,117 @@ void update_kv_cache_kernel(IncMultiHeadSelfAttentionMeta const *m,
   }
 }
 
+template <typename DT>
+void compute_o_prod_bias(IncMultiHeadSelfAttentionMeta const *m,
+                         BatchConfig const *bc,
+                         int shard_id,
+                         DT *output_ptr,
+                         DT const *weight_ptr,
+                         DT const *bias_ptr,
+                         int num_tokens,
+                         cudaStream_t stream) {
+  cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
+  cudnnDataType_t cudnn_data_type = ff_to_cudnn_datatype(m->output_type[0]);
+  assert(data_type_size(m->output_type[0]) == sizeof(DT));
+#if CUDA_VERSION >= 11000
+  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
+  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+#else
+  cudaDataType_t compute_type = cublas_data_type;
+#endif
+  // Project to output, save result directly on output tensor
+  DT alpha = 1.0f, beta = 0.0f;
+  // int num_tokens = bc->num_active_tokens();
+  int m_ = m->oProjSize;
+  int k = m->vProjSize * m->num_q_heads;
+  int n = num_tokens;
+  int lda = k, ldb = k, ldc = m_;
+  DT const *A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
+                                         m->kProjSize * m->num_q_heads +
+                                         m->vProjSize * m->num_q_heads);
+  DT const *B = static_cast<DT *>(m->attn_heads);
+  DT *C = static_cast<DT *>(output_ptr);
+
+  checkCUDA(cublasGemmEx(m->handle.blas,
+                         CUBLAS_OP_T,
+                         CUBLAS_OP_N,
+                         m_,
+                         n,
+                         k,
+                         &alpha,
+                         A,
+                         cublas_data_type,
+                         lda,
+                         B,
+                         cublas_data_type,
+                         ldb,
+                         &beta,
+                         C,
+                         cublas_data_type,
+                         ldc,
+                         compute_type,
+                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
+  if (*m->final_bias && shard_id == 0) {
+    int parallelism = m->oProjSize * num_tokens;
+    int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
+                          m->kProjSize * m->global_num_q_heads +
+                          m->vProjSize * m->global_num_q_heads;
+    apply_proj_bias_w<<<GET_BLOCKS(parallelism),
+                        min(CUDA_NUM_THREADS, parallelism),
+                        0,
+                        stream>>>(
+        output_ptr, bias_ptr, num_tokens, qkv_weight_size, m->oProjSize);
+  }
+}
+
+#define LAUNCH_ATTENTION_SCORE_KERNEL(                                         \
+    DT, Dh, Dh_MAX, THDS_PER_KEY, THREADS_PER_VALUE, THDS_PER_BLOCK, stream)   \
+  smem_sz = smem_size_in_bytes<DT>(m->qProjSize,                               \
+                                   BatchConfig::max_sequence_length(),         \
+                                   THREADS_PER_VALUE,                          \
+                                   THDS_PER_BLOCK);                            \
+  compute_attention_kernel_generation_kernel<DT,                               \
+                                             THDS_PER_BLOCK,                   \
+                                             Dh,                               \
+                                             Dh_MAX,                           \
+                                             THDS_PER_KEY,                     \
+                                             THREADS_PER_VALUE>                \
+      <<<grid, THDS_PER_BLOCK, smem_sz, stream>>>(                             \
+          static_cast<DT *>(m->devQKVProjArray),                               \
+          static_cast<DT *>(m->keyCache),                                      \
+          static_cast<DT *>(m->valueCache),                                    \
+          output_ptr,                                                          \
+          scale,                                                               \
+          BatchConfig::max_sequence_length(),                                  \
+          m->qProjSize,                                                        \
+          m->hidden_size,                                                      \
+          m->request_infos,                                                    \
+          false,                                                               \
+          0)
+
+template <typename DT>
+void compute_attention_kernel_generation(IncMultiHeadSelfAttentionMeta const *m,
+                                         BatchConfig const *bc,
+                                         DT *output_ptr,
+                                         cudaStream_t stream) {
+  dim3 grid(m->num_q_heads, bc->num_active_requests());
+  int const per_head_size = m->qProjSize;
+  float scale = (*m->qk_prod_scaling) ? 1.0f / sqrt(m->kProjSize) : 1.0f;
+  size_t smem_sz;
+  if (per_head_size == 64) {
+    constexpr int THREADS_PER_VALUE_64 = threads_per_value_t<DT, 64>::value;
+    LAUNCH_ATTENTION_SCORE_KERNEL(
+        DT, 64, 64, 4, THREADS_PER_VALUE_64, 128, stream);
+  } else if (per_head_size == 128) {
+    constexpr int THREADS_PER_VALUE_128 = threads_per_value_t<DT, 128>::value;
+    LAUNCH_ATTENTION_SCORE_KERNEL(
+        DT, 128, 128, 4, THREADS_PER_VALUE_128, 128, stream);
+  } else {
+    assert(false && "a unsupported head size");
+  }
+}
+
 template <typename DT>
 void pre_build_weight_kernel(IncMultiHeadSelfAttentionMeta const *m,
                              GenericTensorAccessorR const weight,
@@ -419,18 +799,26 @@ void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
                       DT *output_ptr,
                       DT const *bias_ptr,
                       cudaStream_t stream) {
-  // here because we need position info in inference 1
 
   if (m->offload && m->biasSize > 0) {
     cudaMemcpyAsync(
         m->bias_ptr, bias_ptr, m->biasSize, cudaMemcpyHostToDevice, stream);
     bias_ptr = static_cast<DT *>(m->bias_ptr);
   }
+
+  // todo Xinhao copy how many requests if requests are not continous?
   cudaMemcpyAsync(m->token_infos,
                   &(bc->tokensInfo),
                   bc->num_active_tokens() * sizeof(BatchConfig::PerTokenInfo),
                   cudaMemcpyHostToDevice,
                   stream);
+  cudaMemcpyAsync(m->request_infos,
+                  &(bc->requestsInfo),
+                  bc->max_requests_per_batch() *
+                      sizeof(BatchConfig::PerRequestInfo),
+                  cudaMemcpyHostToDevice,
+                  stream);
+
   // phase 1: Implement kernel to compute KQV for input tokens
   compute_qkv_kernel(m,
                      bc,
@@ -440,14 +828,24 @@ void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
                      static_cast<DT *>(m->devQKVProjArray),
                      bias_ptr,
                      stream);
-
-  // phase 2: Update key/val cache
   update_kv_cache_kernel<DT>(m, bc, stream);
 
-  // phase 3: Compute attention score
-  // 3 kernels for pahse 3: matmul1 - softmax - matmal2
-  compute_attention_kernel(
-      m, bc, shard_id, output_ptr, bias_ptr, weight_ptr, stream);
+  if (bc->num_generation_tokens > 0) {
+    // phase 3: Compute attention score for generation tokens
+    compute_attention_kernel_generation<DT>(
+        m, bc, static_cast<DT *>(m->attn_heads), stream);
+  }
+
+  if (bc->num_tokens > bc->num_generation_tokens) {
+    // phase 4: Compute attention score for prompt tokens;
+    compute_attention_kernel_prompt(
+        m, bc, shard_id, bias_ptr, weight_ptr, stream);
+  }
+
+  // compute output production and bias together for all tokens
+  int num_tokens = bc->num_active_tokens();
+  compute_o_prod_bias(
+      m, bc, shard_id, output_ptr, weight_ptr, bias_ptr, num_tokens, stream);
 }
 
 } // namespace IncMultiHeadAttention
@@ -501,13 +899,12 @@ __global__ void fill_entries_above_diagonal(DT *matrix,
 }
 
 template <typename DT>
-void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
-                              BatchConfig const *bc,
-                              int shard_id,
-                              DT *output_ptr,
-                              DT const *bias_ptr,
-                              DT const *weight_ptr,
-                              cudaStream_t stream) {
+void compute_attention_kernel_prompt(IncMultiHeadSelfAttentionMeta const *m,
+                                     BatchConfig const *bc,
+                                     int shard_id,
+                                     DT const *bias_ptr,
+                                     DT const *weight_ptr,
+                                     cudaStream_t stream) {
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
   cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
@@ -675,8 +1072,11 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
     B = C_softmax;
     // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
     // requests
+
+    // store the result attn heads, also skip the genration tokens
     C = static_cast<DT *>(m->attn_heads) +
-        tokens_previous_requests * m->num_q_heads * m->vProjSize;
+        (tokens_previous_requests + bc->num_generation_tokens) *
+            m->num_q_heads * m->vProjSize;
     checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                          CUBLAS_OP_N,
                                          CUBLAS_OP_T,
@@ -702,52 +1102,6 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                          CUBLAS_GEMM_DEFAULT_TENSOR_OP));
     tokens_previous_requests += num_new_tokens;
   }
-
-  // Project to output, save result directly on output tensor
-  DT alpha = 1.0f, beta = 0.0f;
-  int m_ = m->oProjSize;
-  int k = m->vProjSize * m->num_q_heads;
-  int n = bc->num_active_tokens();
-  int lda = k, ldb = k, ldc = m_;
-  DT const *A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
-                                         m->kProjSize * m->num_q_heads +
-                                         m->vProjSize * m->num_q_heads);
-  DT const *B = static_cast<DT *>(m->attn_heads);
-  DT *C = static_cast<DT *>(output_ptr);
-
-  checkCUDA(cublasGemmEx(m->handle.blas,
-                         CUBLAS_OP_T,
-                         CUBLAS_OP_N,
-                         m_,
-                         n,
-                         k,
-                         &alpha,
-                         A,
-                         cublas_data_type,
-                         lda,
-                         B,
-                         cublas_data_type,
-                         ldb,
-                         &beta,
-                         C,
-                         cublas_data_type,
-                         ldc,
-                         compute_type,
-                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-
-  if (*m->final_bias && shard_id == 0) {
-    int parallelism = m->oProjSize * num_tokens;
-    int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
-                          m->kProjSize * m->global_num_q_heads +
-                          m->vProjSize * m->global_num_q_heads;
-
-    apply_proj_bias_w<<<GET_BLOCKS(parallelism),
-                        min(CUDA_NUM_THREADS, parallelism),
-                        0,
-                        stream>>>(
-        output_ptr, bias_ptr, num_tokens, qkv_weight_size, m->oProjSize);
-  }
-
   assert(tokens_previous_requests == num_tokens);
 }
 
@@ -811,6 +1165,7 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
   } else {
     assert(false && "Unspported data type");
   }
+
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
     checkCUDA(cudaEventSynchronize(t_end));
@@ -819,38 +1174,6 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     cudaEventDestroy(t_start);
     cudaEventDestroy(t_end);
     printf("IncMultiHeadSelfAttention forward time = %.9fms\n", elapsed);
-
-    // if (input.data_type == DT_HALF) {
-    //   print_tensor<half>(input.get_half_ptr(),
-    //                      32,
-    //                      "[IncMultiHeadSelfAttention:forward:input]");
-    //   print_tensor<half>(weight.get_half_ptr(),
-    //                      32,
-    //                      "[IncMultiHeadSelfAttention:forward:weight]");
-    //   print_tensor<half>(output.get_half_ptr(),
-    //                      32,
-    //                      "[IncMultiHeadSelfAttention:forward:output]");
-    //   print_tensor<half>(
-    //       bias.get_half_ptr(), 32,
-    //       "[IncMultiHeadSelfAttention:forward:bias]");
-    // } else {
-    //   print_tensor<float>(input.get_float_ptr(),
-    //                       32,
-    //                       "[IncMultiHeadSelfAttention:forward:input]");
-    //   print_tensor<float>(weight.get_float_ptr(),
-    //                       32,
-    //                       "[IncMultiHeadSelfAttention:forward:weight]");
-    //   print_tensor<float>(output.get_float_ptr(),
-    //                       32,
-    //                       "[IncMultiHeadSelfAttention:forward:output]");
-    //   print_tensor<float>(
-    //       bias.get_float_ptr(), 32,
-    //       "[IncMultiHeadSelfAttention:forward:bias]");
-    // }
-
-    // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
-    // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
-    // acc_output.rect, "[Attention:forward:output]");
   }
 }
 
@@ -1013,6 +1336,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
       default:
         assert(false && "Unkown inference mode");
     }
+    size_t requestinfo_size = BatchConfig::max_requests_per_batch();
     size_t tokeninfo_size = max_tokens_per_batch;
     size_t qk_prod_size =
         max_tokens_per_batch * BatchConfig::max_sequence_length() * num_q_heads;
@@ -1025,8 +1349,10 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
          2 * qk_prod_size + attn_heads_size) *
             size_of_dt +
         tokeninfo_size * sizeof(BatchConfig::PerTokenInfo) +
-        complex_size * sizeof(cuFloatComplex); // more components will
-                                               // be added here later
+        complex_size * sizeof(cuFloatComplex) +
+        requestinfo_size *
+            sizeof(BatchConfig::PerRequestInfo); // more components will
+                                                 // be added here later
     if (offload) {
       // assert that we have enough reserved work space left
       size_t totalSharedSize =
@@ -1086,6 +1412,9 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
       complex_input =
           gpu_mem_allocator.allocate_reserved<cuFloatComplex>(complex_size);
       // offset += complex_size * sizeof(cuFloatComplex);
+      request_infos =
+          gpu_mem_allocator.allocate_reserved<BatchConfig::PerRequestInfo>(
+              requestinfo_size);
     } else {
       token_infos =
           gpu_mem_allocator.allocate_instance<BatchConfig::PerTokenInfo>(
@@ -1098,6 +1427,9 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
                                                                size_of_dt);
       complex_input =
           gpu_mem_allocator.allocate_instance<cuFloatComplex>(complex_size);
+      request_infos =
+          gpu_mem_allocator.allocate_instance<BatchConfig::PerRequestInfo>(
+              requestinfo_size);
     }
 
     // allocate more size for quantization data
@@ -1131,5 +1463,4 @@ template void Kernels::IncMultiHeadAttention::pre_build_weight_kernel<half>(
     GenericTensorAccessorR const weight,
     DataType data_type,
     cudaStream_t stream);
-
 }; // namespace FlexFlow
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 52e083889e..6dad1c6de9 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -17,6 +17,7 @@
 #endif
 #include "flexflow/ffconst_utils.h"
 #include "flexflow/ops/kernels/inc_multihead_self_attention_kernels.h"
+#include "flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh"
 #include "flexflow/ops/spec_inc_multihead_self_attention.h"
 #include "flexflow/utils/cuda_helper.h"
 
@@ -203,13 +204,13 @@ __global__ void spec_fill_entries_above_diagonal(DT *matrix,
 }
 
 template <typename DT>
-void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
-                              BeamSearchBatchConfig const *bc,
-                              int shard_id,
-                              DT *output_ptr,
-                              DT const *bias_ptr,
-                              DT const *weight_ptr,
-                              cudaStream_t stream) {
+void compute_attention_kernel_prompt(SpecIncMultiHeadSelfAttentionMeta const *m,
+                                     BeamSearchBatchConfig const *bc,
+                                     int shard_id,
+                                     DT *output_ptr,
+                                     DT const *bias_ptr,
+                                     DT const *weight_ptr,
+                                     cudaStream_t stream) {
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
   cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
@@ -228,7 +229,7 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
 #endif
   // int num_requests = bc->num_active_requests();
   int num_tokens = bc->num_active_tokens();
-  // int tokens_previous_requests = 0;
+  int tokens_previous_requests = 0;
   int tokens_prev_requests_squares = 0;
   // int qkv_block_size =
   //     (m->qProjSize + m->kProjSize + m->vProjSize) * num_tokens;
@@ -399,8 +400,8 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
       // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
       // requests
       C = static_cast<DT *>(m->attn_heads) +
-          bc->requestsInfo[i].first_token_offset_in_batch * m->num_q_heads *
-              m->vProjSize;
+          (tokens_previous_requests + bc->num_generation_tokens) *
+              m->num_q_heads * m->vProjSize;
       checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                            CUBLAS_OP_N,
                                            CUBLAS_OP_T,
@@ -425,54 +426,11 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                                            compute_type,
                                            CUBLAS_GEMM_DEFAULT_TENSOR_OP));
 
-      // tokens_previous_requests += num_new_tokens;
+      tokens_previous_requests += num_new_tokens;
       tokens_prev_requests_squares += num_new_tokens * total_tokens;
     }
   }
 
-  // Project to output, save result directly on output tensor
-  DT alpha = 1.0f, beta = 0.0f;
-  int m_ = m->oProjSize;
-  int k = m->vProjSize * m->num_q_heads;
-  int n = bc->num_active_tokens();
-  int lda = k, ldb = k, ldc = m_;
-  DT const *A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
-                                         m->kProjSize * m->num_q_heads +
-                                         m->vProjSize * m->num_q_heads);
-  DT const *B = static_cast<DT *>(m->attn_heads);
-  DT *C = static_cast<DT *>(output_ptr);
-
-  checkCUDA(cublasGemmEx(m->handle.blas,
-                         CUBLAS_OP_T,
-                         CUBLAS_OP_N,
-                         m_,
-                         n,
-                         k,
-                         &alpha,
-                         A,
-                         cublas_data_type,
-                         lda,
-                         B,
-                         cublas_data_type,
-                         ldb,
-                         &beta,
-                         C,
-                         cublas_data_type,
-                         ldc,
-                         compute_type,
-                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-  if (*m->final_bias && shard_id == 0) {
-    int parallelism = m->oProjSize * num_tokens;
-    int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
-                          m->kProjSize * m->global_num_q_heads +
-                          m->vProjSize * m->global_num_q_heads;
-    apply_proj_bias_w<<<GET_BLOCKS(parallelism),
-                        min(CUDA_NUM_THREADS, parallelism),
-                        0,
-                        stream>>>(
-        output_ptr, bias_ptr, num_tokens, qkv_weight_size, m->oProjSize);
-  }
-
   // assert(tokens_previous_requests == num_tokens);
 }
 
@@ -520,11 +478,23 @@ void inference_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                      stream);
   // phase 2: Update key/val cache
   update_kv_cache_kernel<DT>(m, bc, stream);
-
+  if (bc->num_generation_tokens > 0) {
+    compute_attention_kernel_generation<DT>(
+        m, bc, static_cast<DT *>(m->attn_heads), stream);
+  }
   // phase 3: Compute attention score
   // 3 kernels for pahse 3: matmul1 - softmax - matmal2
-  compute_attention_kernel(
-      m, bc, shard_id, output_ptr, bias_ptr, weight_ptr, stream);
+  if (bc->num_tokens > bc->num_generation_tokens) {
+    compute_attention_kernel_prompt(
+        m, bc, shard_id, output_ptr, bias_ptr, weight_ptr, stream);
+  }
+
+  // compute output production and bias together for all tokens
+  int num_tokens =
+      bc->num_active_tokens() * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+        
+  compute_o_prod_bias(
+      m, bc, shard_id, output_ptr, weight_ptr, bias_ptr, num_tokens, stream);
 }
 
 } // namespace SpecIncMultiHeadAttention
@@ -643,7 +613,6 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
     size_t beam_requestinfo_size =
         BeamSearchBatchConfig::max_requests_per_batch();
     size_t total_size =
-        requestinfo_size * sizeof(BatchConfig::PerRequestInfo) +
         beam_tokeninfo_size *
             sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo) +
         beam_requestinfo_size *
@@ -660,10 +629,6 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
                 beam_tokeninfo_size);
     // offset += beam_tokeninfo_size *
     //           sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo);
-    request_infos =
-        gpu_mem_allocator.allocate_instance<BatchConfig::PerRequestInfo>(
-            requestinfo_size);
-    // offset += requestinfo_size * sizeof(BatchConfig::PerRequestInfo);
     beam_request_infos =
         gpu_mem_allocator
             .allocate_instance<BeamSearchBatchConfig::BeamSearchPerRequestInfo>(
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index 0aa50f605c..bc7d1017b7 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -17,6 +17,7 @@
 #endif
 #include "flexflow/ffconst_utils.h"
 #include "flexflow/ops/kernels/inc_multihead_self_attention_kernels.h"
+#include "flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh"
 #include "flexflow/ops/tree_inc_multihead_self_attention.h"
 #include "flexflow/utils/cuda_helper.h"
 
@@ -26,11 +27,251 @@ namespace FlexFlow {
 using Legion::coord_t;
 using Legion::Memory;
 
+#define WARP_SIZE 32
+
 using namespace Kernels::IncMultiHeadAttention;
 
 namespace Kernels {
 namespace TreeIncMultiHeadAttention {
 
+template <typename DT,
+          int THREADS_PER_BLOCK,
+          int Dh,
+          int Dh_MAX,
+          int THREADS_PER_KEY,
+          int THREADS_PER_VALUE>
+__global__ void compute_attention_kernel_fused_kernel(
+    DT const *query,
+    DT const *key_cache,
+    DT const *value_cache,
+    DT *output_ptr,
+    float const scale,
+    int const max_seq_length,
+    int const max_token_per_batch,
+    int per_head_size,
+    int hidden_size,
+    BatchConfig::PerRequestInfo *request_infos,
+    int num_heads,
+    int num_requests,
+    int qk_smem_sz) {
+
+  // q, k
+  using Q_vec = typename VEC_K<DT, THREADS_PER_KEY>::Type;
+  using K_vec = typename VEC_K<DT, THREADS_PER_KEY>::Type;
+  using V_vec = typename VEC_V<DT>::Type;
+  using Out_sum = typename Vec_fp32_<V_vec>::Type;
+
+  constexpr int WARPS_PER_BLOCK = THREADS_PER_BLOCK / WARP_SIZE;
+
+  constexpr int K_VEC_SIZE = sizeof(K_vec) / sizeof(DT);
+  constexpr int K_ELTS_PER_THREAD = Dh / THREADS_PER_KEY;
+  constexpr int K_VECS_PER_THREAD = K_ELTS_PER_THREAD / K_VEC_SIZE;
+  // constexpr int QK_ELTS_IN_16B = 16 / sizeof(DT);
+
+  // thread id
+  int const tidx = threadIdx.x;
+  // head id
+  int const head_idx = blockIdx.x;
+  // request idx
+  int const request_idx = blockIdx.y;
+
+  int const first_step = 0;
+
+  int const tlength = request_infos[request_idx].first_token_depth_in_request +
+                      request_infos[request_idx].num_tokens_in_batch;
+  int const qlength = request_infos[request_idx].num_tokens_in_batch;
+
+  int first_token_idx = 0;
+  for (int r = 0; r < request_idx; r++) {
+    first_token_idx += request_infos[request_idx].num_tokens_in_batch;
+  }
+
+  // shared memory objects
+  extern __shared__ char smem_[];
+
+  float *qk_smem = reinterpret_cast<float *>(smem_);
+  float *out_smem = reinterpret_cast<float *>(smem_ + qk_smem_sz);
+
+  float qk_max = -FLT_MAX;
+
+  // first WARPS_PER_BLOCK for store qk_max, second WARPS_PER_BLOCK for sum
+  __shared__ float red_smem[WARPS_PER_BLOCK * 2];
+
+  const DT *q_ptr = query + first_token_idx * hidden_size * QKV_WEIGHT_NUM +
+                    head_idx * per_head_size;
+  __shared__ Q_vec q_vecs[THREADS_PER_KEY][K_VECS_PER_THREAD];
+
+  // the start offset of the element eg. (0, 1, 2, 3) * K_VEC_SIZE
+  int ki = tidx % THREADS_PER_KEY * K_VEC_SIZE;
+  int ki_o = tidx % THREADS_PER_KEY;
+  // the first key's offset for this thread
+  // ko = 0, 0, 0, 0, 1, 1, 1, 1, ....
+  int ko = tidx / THREADS_PER_KEY;
+  // load q tensor
+  Q_vec q_vec[K_VECS_PER_THREAD];
+
+  constexpr int K_PER_ITER = THREADS_PER_BLOCK / THREADS_PER_KEY;
+  // The number of keys per warp.
+  constexpr int K_PER_WARP = WARP_SIZE / THREADS_PER_KEY;
+
+  DT const *k_cache_batch =
+      key_cache + request_idx * max_seq_length * hidden_size + ki;
+
+  int ti_end =
+      div_up(tlength - first_step, K_PER_WARP) * K_PER_WARP + first_step;
+
+  for (int qi = 0; qi < qlength; qi += 1) {
+#pragma unroll
+    for (int ii = 0; ii < K_VECS_PER_THREAD; ++ii) {
+      q_vecs[ki_o][ii] = *reinterpret_cast<Q_vec const *>(
+          q_ptr + (hidden_size * QKV_WEIGHT_NUM * qi) + ki +
+          ii * THREADS_PER_KEY * K_VEC_SIZE);
+    }
+    __syncthreads();
+    for (int ti = ko; ti < ti_end; ti += K_PER_ITER) {
+      K_vec k[K_VECS_PER_THREAD];
+      int const ti_circ = ti % max_seq_length;
+      for (int ii = 0; ii < K_VECS_PER_THREAD; ++ii) {
+        int jj = ii * THREADS_PER_KEY * K_VEC_SIZE;
+        if (ti < tlength) {
+          k[ii] = *reinterpret_cast<K_vec const *>(
+              k_cache_batch + ti_circ * hidden_size + head_idx * per_head_size +
+              jj);
+        }
+      }
+      float qk = scale * Qk_dot<DT, THREADS_PER_KEY>::dot(q_vecs[ki_o], k);
+
+      if (ti < tlength && tidx % THREADS_PER_KEY == 0) {
+        bool const mask = ti_circ >= tlength;
+        if (mask) {
+          assert(false);
+        }
+
+        int pos = ti * qlength + qi;
+        if (((pos / qlength) % tlength) > (pos % qlength + tlength - qlength)) {
+          qk = -FLT_MAX;
+        }
+        qk_max = mask ? qk_max : fmaxf(qk_max, qk);
+
+        qk_smem[pos] = mask ? 0.f : qk;
+      }
+    }
+    __syncthreads();
+
+    for (int mask = WARP_SIZE / 2; mask >= THREADS_PER_KEY; mask /= 2) {
+      qk_max = fmaxf(qk_max, __shfl_xor_sync(uint32_t(-1), qk_max, mask));
+    }
+
+    // Decompose the thread index into warp and lane.
+    int const warp = tidx / WARP_SIZE;
+    int const lane = tidx % WARP_SIZE;
+
+    // The warp leader writes the max to shared memory.
+    if (lane == 0) {
+      red_smem[warp] = qk_max;
+    }
+
+    // Make sure the products are in shared memory.
+    __syncthreads();
+
+    // The warps finalize the reduction.
+    qk_max = lane < WARPS_PER_BLOCK ? red_smem[lane] : -FLT_MAX;
+
+    for (int mask = WARPS_PER_BLOCK / 2; mask >= 1; mask /= 2) {
+      qk_max = fmaxf(qk_max, __shfl_xor_sync(uint32_t(-1), qk_max, mask));
+    }
+
+    // Broadcast to all the threads in the warp.
+    qk_max = __shfl_sync(uint32_t(-1), qk_max, 0);
+
+    float exp_sum = 0.f;
+
+    for (int ti = first_step + tidx; ti < tlength; ti += THREADS_PER_BLOCK) {
+      float logit = __expf(qk_smem[ti * qlength + qi] - qk_max);
+      exp_sum += logit;
+      qk_smem[ti * qlength + qi] = logit;
+    }
+
+    // Compute the sum.
+    exp_sum = block_sum<WARPS_PER_BLOCK>(&red_smem[WARPS_PER_BLOCK], exp_sum);
+
+    // softmax
+    float inv_sum = __fdividef(1.f, exp_sum + 1.e-6);
+
+    for (int ti = first_step + tidx; ti < tlength; ti += THREADS_PER_BLOCK) {
+      qk_smem[ti * qlength + qi] *= inv_sum;
+    }
+
+    __syncthreads();
+  }
+
+  // value projection
+  constexpr int V_VEC_SIZE = 16 / sizeof(DT);
+  // The value computed by this thread.
+  int vo = tidx / THREADS_PER_VALUE;
+  // The hidden dimensions computed by this particular thread.
+  int vi = tidx % THREADS_PER_VALUE * V_VEC_SIZE;
+  constexpr int V_PER_ITER = THREADS_PER_BLOCK / THREADS_PER_VALUE;
+
+  Out_sum out;
+  // The base pointer for the value in the cache buffer.
+  DT const *v_cache_batch =
+      value_cache + request_idx * max_seq_length * hidden_size + vi;
+
+  for (int qi = 0; qi < qlength; qi++) {
+    zero(out);
+    __syncthreads();
+    if (Dh == Dh_MAX || vi < Dh) {
+      for (int ti = first_step + vo; ti < tlength; ti += V_PER_ITER) {
+        // Load the values from the cache.
+        int const ti_circ = ti % max_seq_length;
+
+        V_vec v = *reinterpret_cast<V_vec const *>(
+            v_cache_batch + ti_circ * hidden_size + head_idx * per_head_size);
+        float logit = qk_smem[ti * qlength + qi];
+        out = FlexFlow::fma(logit, cast_to_float(v), out);
+      }
+    }
+
+    // Make sure we can start writing to shared memory.
+    __syncthreads();
+
+    // Run the final reduction amongst the different groups computing different
+    // partial outputs.
+    if (Dh == Dh_MAX || vi < Dh) {
+#pragma unroll
+      for (int active_groups = V_PER_ITER; active_groups >= 2;
+           active_groups /= 2) {
+
+        // The midpoint in the number of active groups.
+        int midpoint = active_groups / 2;
+
+        // The upper part of active threads store to shared memory.
+        if (vo >= midpoint && vo < active_groups && (Dh == Dh_MAX || vi < Dh)) {
+          *reinterpret_cast<Out_sum *>(out_smem + (vo - midpoint) * Dh + vi) =
+              out;
+        }
+        __syncthreads();
+
+        // The bottom warps update their values.
+        if (vo < midpoint && (Dh == Dh_MAX || vi < Dh)) {
+          out = add(*reinterpret_cast<Out_sum const *>(out_smem + vo * Dh + vi),
+                    out);
+        }
+        __syncthreads();
+      }
+    }
+
+    // Output the final values.
+    if (vo == 0 && (Dh == Dh_MAX || vi < Dh)) {
+      convert_from_float(*reinterpret_cast<V_vec *>(
+                             output_ptr + (first_token_idx + qi) * hidden_size +
+                             head_idx * per_head_size + vi),
+                         out);
+    }
+  }
+}
+
 template <typename DT>
 __global__ void commit_tokens_kernel(
     DT const *devQKVProjArray,
@@ -128,6 +369,37 @@ __global__ void update_tree_branch_kv_cache(
   }
 }
 
+template <typename DT>
+__global__ void update_tree_branch_kv_cache_fused(
+    DT const *devQKVProjArray,
+    DT *kCache_ptr,
+    DT *vCache_ptr,
+    TreeVerifyBatchConfig::PerTokenInfo const *tokenInfos,
+    int qProjSize,
+    int kProjSize,
+    int vProjSize,
+    int num_new_tokens,
+    int max_seq_len,
+    int hidden_size) {
+  CUDA_KERNEL_LOOP(i, num_new_tokens * hidden_size) {
+
+    int token_idx = i / hidden_size;
+    int offset = i % hidden_size;
+    size_t val_idx =
+        token_idx * QKV_WEIGHT_NUM * hidden_size + hidden_size + offset;
+
+    DT kVal = devQKVProjArray[val_idx];
+    DT vVal = devQKVProjArray[val_idx + hidden_size];
+
+    int const req_id = tokenInfos[token_idx].request_index;
+    int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
+    kCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
+               offset] = kVal;
+    vCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
+               offset] = vVal;
+  }
+}
+
 template <typename DT>
 __global__ void tree_fill_entries_above_diagonal(DT *matrix,
                                                  size_t new_tokens,
@@ -200,6 +472,9 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
         num_new_tokens++;
       }
 
+      std::cout << "num_new_tokens: " << num_new_tokens << "\n";
+      assert(false);
+
       int total_tokens_in_request = bc->tokensInfo[j].abs_depth_in_request + 1;
       assert(num_new_tokens >= 1 && total_tokens_in_request >= num_new_tokens);
       {
@@ -438,6 +713,79 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
   assert(processed_tokens_in_batch == bc->num_active_tokens());
 }
 
+#define LAUNCH_TREE_VERIFY_ATTENTION_SCORE_KERNEL(                             \
+    DT, Dh, Dh_MAX, THDS_PER_KEY, THDS_PER_VALUE, THDS_PER_BLOCK, stream)      \
+  smem_size_in_bytes_tree<DT>(m->qProjSize,                                    \
+                              BatchConfig::max_sequence_length(),              \
+                              THDS_PER_VALUE,                                  \
+                              THDS_PER_BLOCK,                                  \
+                              bc,                                              \
+                              smem_sz);                                        \
+  compute_attention_kernel_fused_kernel<DT,                                    \
+                                        THDS_PER_BLOCK,                        \
+                                        Dh,                                    \
+                                        Dh_MAX,                                \
+                                        THDS_PER_KEY,                          \
+                                        THDS_PER_VALUE>                        \
+      <<<grid, THDS_PER_BLOCK, smem_sz[1], stream>>>(                          \
+          static_cast<DT *>(m->devQKVProjArray),                               \
+          static_cast<DT *>(m->keyCache),                                      \
+          static_cast<DT *>(m->valueCache),                                    \
+          output_ptr,                                                          \
+          scale,                                                               \
+          BatchConfig::max_sequence_length(),                                  \
+          BatchConfig::max_tokens_per_batch(),                                 \
+          m->qProjSize,                                                        \
+          m->hidden_size,                                                      \
+          m->request_infos,                                                    \
+          m->num_q_heads,                                                      \
+          bc->num_active_requests(),                                           \
+          smem_sz[0])
+
+template <typename DT>
+void compute_attention_kernel_fused(IncMultiHeadSelfAttentionMeta const *m,
+                                    TreeVerifyBatchConfig const *bc,
+                                    DT *output_ptr,
+                                    cudaStream_t stream) {
+
+  // update the kv cache
+  //  update K-V cache
+  int num_new_tokens = bc->num_active_tokens();
+  int parallelism = m->hidden_size * num_new_tokens;
+  update_tree_branch_kv_cache_fused<<<GET_BLOCKS(parallelism),
+                                      min(CUDA_NUM_THREADS, parallelism),
+                                      0,
+                                      stream>>>(
+      static_cast<DT *>(m->devQKVProjArray),
+      static_cast<DT *>(m->keyCache),
+      static_cast<DT *>(m->valueCache),
+      m->token_infos,
+      m->qProjSize,
+      m->kProjSize,
+      m->vProjSize,
+      num_new_tokens,
+      BatchConfig::max_sequence_length(),
+      m->hidden_size);
+
+  dim3 grid(m->num_q_heads, bc->num_active_requests());
+  int const per_head_size = m->qProjSize;
+  float scale = (*m->qk_prod_scaling) ? 1.0f / sqrt(m->kProjSize) : 1.0f;
+
+  // 0->qk production size, 1->total shared size
+  int smem_sz[2];
+  if (per_head_size == 64) {
+    constexpr int THREADS_PER_VALUE_64 = threads_per_value_t<DT, 64>::value;
+    LAUNCH_TREE_VERIFY_ATTENTION_SCORE_KERNEL(
+        DT, 64, 64, 4, THREADS_PER_VALUE_64, 128, stream);
+  } else if (per_head_size == 128) {
+    constexpr int THREADS_PER_VALUE_128 = threads_per_value_t<DT, 128>::value;
+    LAUNCH_TREE_VERIFY_ATTENTION_SCORE_KERNEL(
+        DT, 128, 128, 4, THREADS_PER_VALUE_128, 128, stream);
+  } else {
+    assert(false && "a unsupported head size");
+  }
+}
+
 template <typename DT>
 void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
                       TreeVerifyBatchConfig const *bc,
@@ -463,6 +811,7 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
       bias_ptr = static_cast<DT *>(m->bias_ptr);
     }
   }
+
   // copy committed tokens info to GPU for the commit_tokens kernel
   // Note that m->num_active_tokens stores the number of active
   // tokens in the previous batch, which is needed for committing
@@ -491,6 +840,12 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
                       sizeof(TreeVerifyBatchConfig::PerTokenInfo),
                   cudaMemcpyHostToDevice,
                   stream);
+  cudaMemcpyAsync(m->request_infos,
+                  &(bc->requestsInfo),
+                  bc->max_requests_per_batch() *
+                      sizeof(BatchConfig::PerRequestInfo),
+                  cudaMemcpyHostToDevice,
+                  stream);
   // phase 1: Implement kernel to compute KQV for input tokens
   compute_qkv_kernel(m,
                      bc,
@@ -504,11 +859,20 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
   // phase 2: No need to update key/val cache
   // IncMultiHeadSelfAttention::update_kv_cache_kernel(
   //    m, bc, stream);
+  // use the new kernel
+  compute_attention_kernel_fused<DT>(
+      m, bc, static_cast<DT *>(m->attn_heads), stream);
+
+  int processed_tokens_in_batch = bc->num_active_tokens();
 
-  // phase 3: Compute attention score
-  // 3 kernels for pahse 3: matmul1 - softmax - matmal2
-  compute_attention_kernel(
-      m, bc, shard_id, output_ptr, bias_ptr, weight_ptr, stream);
+  compute_o_prod_bias(m,
+                      bc,
+                      shard_id,
+                      output_ptr,
+                      weight_ptr,
+                      bias_ptr,
+                      processed_tokens_in_batch,
+                      stream);
 }
 
 } // namespace TreeIncMultiHeadAttention
@@ -583,10 +947,6 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
     checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
     cudaEventDestroy(t_start);
     cudaEventDestroy(t_end);
-    printf("TreeIncMultiHeadSelfAttention forward time = %.2fms\n", elapsed);
-    // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
-    // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
-    // acc_output.rect, "[Attention:forward:output]");
   }
 }
 
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index f1164d3c49..7c37f3391e 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -357,6 +357,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
       // log_req_mgr.print("Output: %s", output.c_str());
     }
   }
+  int num_generation_tokens = 0;
 
   // Step 2: prepare the next batch for existing requests
   BatchConfig new_bc;
@@ -450,6 +451,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
             request.tokens.size()) {
           // Incremental phase
           new_bc.requestsInfo[i].num_tokens_in_batch = 1;
+          num_generation_tokens++;
         } else {
           // Prompt phase
           new_bc.requestsInfo[i].num_tokens_in_batch =
@@ -471,6 +473,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
       }
     }
   }
+  new_bc.num_generation_tokens = num_generation_tokens;
 
   // Step 3: add new requests to the next batch
   for (int i = 0; i < BatchConfig::max_requests_per_batch(); i++) {
@@ -563,6 +566,8 @@ BeamSearchBatchConfig
   new_bc.model_id = model_id;
   int result_index = 0;
 
+  int num_generation_tokens = 0;
+
   for (int i = 0; i < BatchConfig::max_requests_per_batch(); i++) {
     if (old_bc.request_completed[i]) {
       continue;
@@ -889,6 +894,7 @@ BeamSearchBatchConfig
       }
     }
   }
+  new_bc.num_generation_tokens = num_generation_tokens;
 
   if (verbose) {
     std::cout << "prepare_next_batch_init OLD vs NEW batchconfigs below:"
@@ -951,6 +957,7 @@ BeamSearchBatchConfig
   BeamSearchBatchConfig new_bc;
   new_bc.model_id = old_bc.model_id;
   // std::cout << "old_bc.model_id: " << old_bc.model_id << "\n";
+  int num_generation_tokens = 0;
 
   // Add incremental tokens to the batch
   for (int i = 0; i < BatchConfig::max_requests_per_batch(); i++) {
@@ -1155,11 +1162,13 @@ BeamSearchBatchConfig
 
           new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = k;
           new_bc.num_tokens++;
+          num_generation_tokens++;
         }
       }
     }
   }
 
+  new_bc.num_generation_tokens = num_generation_tokens;
   if (verbose) {
     std::cout << "prepare_next_batch_beam OLD vs NEW batchconfigs:"
               << std::endl;

From 672cdad3b1e7f4416bcc694c88d07c7145bb9295 Mon Sep 17 00:00:00 2001
From: Wei Wu <eddy16112@gmail.com>
Date: Fri, 17 Nov 2023 05:57:14 -0800
Subject: [PATCH 264/344] fix ucx against inference branch (#1230)

* fix ucx

* use the old way to set c++17
---
 CMakeLists.txt      | 108 +++++---------------------------------------
 MULTI-NODE.md       |  57 +++++++++++++++++++++--
 cmake/cuda.cmake    |   2 +
 cmake/legion.cmake  |   4 ++
 cmake/nccl.cmake    |   3 +-
 config/config.inc   |   9 ++--
 config/config.linux |   8 ++--
 7 files changed, 81 insertions(+), 110 deletions(-)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index 3732d5ff6f..b201cf99dc 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -15,6 +15,10 @@ set(CMAKE_MODULE_PATH ${CMAKE_MODULE_PATH} ${CMAKE_CURRENT_LIST_DIR}/cmake)
 set(FLEXFLOW_ROOT ${CMAKE_CURRENT_LIST_DIR})
 set(CMAKE_CXX_FLAGS "-std=c++17 ${CMAKE_CXX_FLAGS} -fPIC -UNDEBUG")
 
+# set std 17
+#set(CMAKE_CXX_STANDARD 17)
+#set(CMAKE_CUDA_STANDARD 17)
+
 option(INFERENCE_TESTS "Run inference tests" OFF)
 set(LIBTORCH_PATH "${CMAKE_CURRENT_SOURCE_DIR}/../libtorch" CACHE STRING "LibTorch Path")
 if (INFERENCE_TESTS)
@@ -69,106 +73,15 @@ option(FF_USE_PREBUILT_NCCL "Enable use of NCCL pre-compiled library, if availab
 option(FF_USE_PREBUILT_LEGION "Enable use of Legion pre-compiled library, if available" ON)
 option(FF_USE_ALL_PREBUILT_LIBRARIES "Enable use of all pre-compiled libraries, if available" OFF)
 
-# option for using Python
-set(FF_GASNET_CONDUITS aries udp mpi ibv ucx)
+# option for using network
+set(FF_GASNET_CONDUITS aries udp mpi ibv)
 set(FF_GASNET_CONDUIT "mpi" CACHE STRING "Select GASNet conduit ${FF_GASNET_CONDUITS}")
 set_property(CACHE FF_GASNET_CONDUIT PROPERTY STRINGS ${FF_GASNET_CONDUITS})
 set(FF_LEGION_NETWORKS "" CACHE STRING "Network backend(s) to use")
 
-if ((FF_LEGION_NETWORKS STREQUAL "gasnet" AND FF_GASNET_CONDUIT STREQUAL "ucx") OR FF_LEGION_NETWORKS STREQUAL "ucx")
-    if("${FF_UCX_URL}" STREQUAL "")
-        set(UCX_URL "https://github.com/openucx/ucx/releases/download/v1.14.0-rc1/ucx-1.14.0.tar.gz")
-    else()
-        set(UCX_URL "${FF_UCX_URL}")
-    endif()
-
-    set(UCX_DIR ${CMAKE_CURRENT_BINARY_DIR}/ucx)
-    get_filename_component(UCX_COMPRESSED_FILE_NAME "${UCX_URL}" NAME)
-    # message(STATUS "UCX_URL: ${UCX_URL}")
-    # message(STATUS "UCX_COMPRESSED_FILE_NAME: ${UCX_COMPRESSED_FILE_NAME}")
-    set(UCX_COMPRESSED_FILE_PATH "${CMAKE_CURRENT_BINARY_DIR}/${UCX_COMPRESSED_FILE_NAME}")
-    set(UCX_BUILD_NEEDED OFF)
-    set(UCX_CONFIG_FILE ${UCX_DIR}/config.txt)
-    set(UCX_BUILD_OUTPUT ${UCX_DIR}/build.log)
-
-    if(EXISTS ${UCX_CONFIG_FILE})
-        file(READ ${UCX_CONFIG_FILE} PREV_UCX_CONFIG)
-        # message(STATUS "PREV_UCX_CONFIG: ${PREV_UCX_CONFIG}")
-        if("${UCX_URL}" STREQUAL "${PREV_UCX_CONFIG}")
-            # configs match - no build needed
-            set(UCX_BUILD_NEEDED OFF)
-        else()
-	        message(STATUS "UCX configuration has changed - rebuilding...")
-            set(UCX_BUILD_NEEDED ON)
-        endif()
-    else()
-        message(STATUS "Configuring and building UCX...")
-        set(UCX_BUILD_NEEDED ON)
-    endif()
-
-    if(UCX_BUILD_NEEDED)
-        if(NOT EXISTS "${UCX_COMPRESSED_FILE_PATH}")
-            message(STATUS "Downloading openucx/ucx from: ${UCX_URL}")
-            file(
-                DOWNLOAD
-                "${UCX_URL}" "${UCX_COMPRESSED_FILE_PATH}"
-                SHOW_PROGRESS
-                STATUS status
-                LOG log
-            )
-
-            list(GET status 0 status_code)
-            list(GET status 1 status_string)
-
-            if(status_code EQUAL 0)
-                message(STATUS "Downloading... done")
-            else()
-                message(FATAL_ERROR "error: downloading '${UCX_URL}' failed
-                    status_code: ${status_code}
-                    status_string: ${status_string}
-                    log:
-                    --- LOG BEGIN ---
-                    ${log}
-                    --- LOG END ---"
-                )
-            endif()
-        else()
-            message(STATUS "${UCX_COMPRESSED_FILE_NAME} already exists")
-        endif()
-
-        execute_process(COMMAND mkdir -p ${UCX_DIR})
-        execute_process(COMMAND tar xzf ${UCX_COMPRESSED_FILE_PATH} -C ${UCX_DIR} --strip-components 1)
-        message(STATUS "Building UCX...")
-        execute_process(
-            COMMAND sh -c "cd ${UCX_DIR} && ${UCX_DIR}/contrib/configure-release --prefix=${UCX_DIR}/install --enable-mt && make -j8 && make install"
-            RESULT_VARIABLE UCX_BUILD_STATUS
-            OUTPUT_FILE ${UCX_BUILD_OUTPUT}
-            ERROR_FILE ${UCX_BUILD_OUTPUT}
-        )
-
-        if(UCX_BUILD_STATUS)
-            message(FATAL_ERROR "UCX build result = ${UCX_BUILD_STATUS} - see ${UCX_BUILD_OUTPUT} for more details")
-        endif()
-
-        # Currently, we use default build configurations for UCX and therefore only save URL as configuration settings
-        file(WRITE ${UCX_CONFIG_FILE} "${UCX_URL}")
-    endif()
-
-    if (FF_LEGION_NETWORKS STREQUAL "gasnet" AND FF_GASNET_CONDUIT STREQUAL "ucx")
-        set(ENV{UCX_HOME} "${UCX_DIR}/install")
-        install(DIRECTORY ${UCX_DIR}/install/bin/ DESTINATION bin)
-        install(DIRECTORY ${UCX_DIR}/install/include/ DESTINATION include)
-        install(DIRECTORY ${UCX_DIR}/install/lib/ DESTINATION lib)
-        install(DIRECTORY ${UCX_DIR}/install/share/ DESTINATION share)
-    endif()
-
-    if (FF_LEGION_NETWORKS STREQUAL "ucx")
-        set(ucx_DIR ${UCX_DIR}/cmake)
-        set(ENV{Legion_NETWORKS} "ucx")
-        message(STATUS "Legion_NETWORKS: $ENV{Legion_NETWORKS}")
-    endif()
-else()
-    message(STATUS "FF_GASNET_CONDUIT: ${FF_GASNET_CONDUIT}")
+message(STATUS "FF_LEGION_NETWORKS: ${FF_LEGION_NETWORKS}")
+if (FF_LEGION_NETWORKS STREQUAL "gasnet")
+  message(STATUS "FF_GASNET_CONDUIT: ${FF_GASNET_CONDUIT}")
 endif()
 
 set(FF_GPU_BACKENDS cuda hip_cuda hip_rocm intel)
@@ -213,6 +126,7 @@ list(APPEND CC_FLAGS
 list(APPEND NVCC_FLAGS
   -std=c++17)
 
+
 add_compile_options(${CC_FLAGS})
 set(CUDA_NVCC_FLAGS ${CUDA_NVCC_FLAGS} ${NVCC_FLAGS})
 link_libraries(${LD_FLAGS})
@@ -524,7 +438,7 @@ if(NOT BUILD_LEGION_ONLY)
   endif()
 
   # build binary
-  option(FF_BUILD_TOKENIZER "build tokenizer=cpp for LLM serving" ON)
+  option(FF_BUILD_TOKENIZER "build tokenizer=cpp for LLM serving" OFF)
   option(FF_BUILD_RESNET "build resnet example" OFF)
   option(FF_BUILD_RESNEXT "build resnext example" OFF)
   option(FF_BUILD_ALEXNET "build alexnet example" OFF)
diff --git a/MULTI-NODE.md b/MULTI-NODE.md
index 9cf95976ac..37e8f6182c 100644
--- a/MULTI-NODE.md
+++ b/MULTI-NODE.md
@@ -17,15 +17,33 @@ Source: Custom (use the security group ID)
 
 You can also use your own GPU cluster, as long as all machines are interconnected with a low-latency network.
 
-## 2. Configure and build FlexFlow
+## 2. Configure and build UCX
 
-Follow steps 1 to 5 in the [Build from source guide](https://flexflow.readthedocs.io/en/latest/installation.html) to download the source code, install system dependencies, install the Python dependencies, configure the FlexFlow build, and build FlexFlow **on each instance at the same path**. 
+Find the latest source code release for UCX at https://github.com/openucx/ucx/releases. As of writing this documentation, the latest UCX was 1.15.0 at https://github.com/openucx/ucx/releases/download/v1.15.0/ucx-1.15.0.tar.gz. Extract it and switch to the directory with UCX source code, and run:
+
+```
+CUDA_PATH=/usr/local/cuda
+PREFIX=$PWD/install
+./contrib/configure-release-mt --prefix="$PREFIX" --without-go --enable-mt --with-cuda="$CUDA_PATH"
+make -j install
+echo "$PREFIX"
+```
+
+Replace `{{ CUDA_PATH }}` with the path of your CUDA installation. If you don't know the path, try `which nvcc`. Take note of the path of UCX installation, echoed as part of the last command.
+
+## 3. Configure and build FlexFlow
+
+Follow steps 1 to 5 in [INSTALL.md](INSTALL.md#1-download-the-source-code) to download the source code, install system dependencies, install the Python dependencies, configure the FlexFlow build, and build FlexFlow **on each instance at the same path**. Or you can use NFS to mount home directory of each instance so that only a single build is necessary.
 
 You can skip step 2 (Install system dependencies) if you have spun up instances with Deep Learning AMI, which comes preconfigured with CUDA. Otherwise, you need to install system dependencies on each instance.
 
-For step 4 (Configuring the FlexFlow build), make sure to specify a network using the `FF_LEGION_NETWORKS` parameter. We recommend using `FF_LEGION_NETWORKS=gasnet` and `FF_GASNET_CONDUIT=ucx`. Other configurations are optional.
+For step 4 (Configuring the FlexFlow build), here are the parameters that need to be configured:
+* Set `FF_LEGION_NETWORKS=ucx`
+* Set `UCX_DIR` to the UCX installation path mentioned in [Configure and build UCX](#2-configure-and-build-ucx)
 
-## 3. Configure MPI
+Other configuration options are optional.
+
+## 4. Configure MPI
 
 MPI is an easy way to launch FlexFlow across all instances simultaneously and set up communication between them.
 
@@ -64,8 +82,37 @@ ssh-ed25519 AAAAC3NzaC1lZDI1NTE5AAAAIOy5NKYdE8Cwgid59rx6xMqyj9vLaWuXIwy/BSRiK4su
 
 5. Test MPI by running `mpirun -N 1 --hostfile ~/hostfile hostname`. It should display the hostname of all your nodes. If you encounter any errors like `WARNING: Open MPI accepted a TCP connection from what appears to be another Open MPI process but cannot find a corresponding process entry for that peer.`, add the parameter `--mca btl_tcp_if_include` in the `mpirun` command (refer to [this Stack Overflow question](https://stackoverflow.com/questions/15072563/running-mpi-on-two-hosts)).
 
-## 4. Test FlexFlow
+## 5. Test FlexFlow
 
+<<<<<<< HEAD
 Follow step 6 in the [Build from source guide](https://flexflow.readthedocs.io/en/latest/installation.html) to set environment variables.
 
 A script to run a Python example on multiple nodes is available at `scripts/mnist_mlp_run.sh`. You can run the script using [`mpirun`](https://www.open-mpi.org/doc/current/man1/mpirun.1.php) (if you configured it in step 3) or [`srun`](https://slurm.schedmd.com/srun.html).
+=======
+Follow step 6 in [INSTALL.md](INSTALL.md#6-test-flexflow) to set environment variables.
+
+Save the following script as `mnist_mlp_run.sh` and make sure to change `FLEXFLOW_DIR` and `UCX_DIR` to appropriate paths:
+
+```bash
+#!/bin/bash
+eval "$(conda shell.bash hook)"
+conda activate flexflow
+export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$CONDA_PREFIX/lib
+
+# Path to your FlexFlow build
+FLEXFLOW_DIR=/home/ubuntu/FlexFlow/build
+
+# Path to your UCX installation
+UCX_DIR=/home/ubuntu/ucx-1.15.0/install
+
+export REALM_UCP_BOOTSTRAP_PLUGIN=$FLEXFLOW_DIR/deps/legion/lib/realm_ucp_bootstrap_mpi.so
+export LD_LIBRARY_PATH=$FLEXFLOW_DIR/deps/legion/lib:$LD_LIBRARY_PATH
+export LD_LIBRARY_PATH=$FLEXFLOW_DIR:$LD_LIBRARY_PATH
+export LD_LIBRARY_PATH=$UCX_DIR/lib:$LD_LIBRARY_PATH
+export LD_LIBRARY_PATH=/opt/conda/envs/flexflow/lib:$LD_LIBRARY_PATH
+
+mpiexec -x REALM_UCP_BOOTSTRAP_PLUGIN -x PATH -x LD_LIBRARY_PATH --hostfile ~/hostfile --mca btl_tcp_if_include ens5 -np 2 "$FLEXFLOW_DIR"/flexflow_python "$FLEXFLOW_DIR"/../examples/python/native/mnist_mlp.py -ll:py 1 -ll:gpu 1 -ll:fsize 8000 -ll:zsize 8000
+```
+
+Run the script to test FlexFlow on mnist mlp training. You can adjust the script to run any other program.
+>>>>>>> c031ab1f... fix ucx
diff --git a/cmake/cuda.cmake b/cmake/cuda.cmake
index a1a66c7cc8..68e4ca07b1 100644
--- a/cmake/cuda.cmake
+++ b/cmake/cuda.cmake
@@ -70,6 +70,7 @@ if(CUDA_FOUND)
   endforeach()
   string(REGEX REPLACE "([0-9]+)" "-gencode arch=compute_\\1,code=sm_\\1" CUDA_GENCODE "${CUDA_GENCODE}")
 
+  set(CMAKE_CUDA_COMPILER "${CUDA_NVCC_EXECUTABLE}")
   #output
   message( STATUS "CUDA_VERSION: ${CUDA_VERSION}")
   message( STATUS "CUDA root path : ${CUDA_TOOLKIT_ROOT_DIR}" )
@@ -80,6 +81,7 @@ if(CUDA_FOUND)
   message( STATUS "CURAND libraries : ${CUDA_curand_LIBRARY}" )
   message( STATUS "CUDA Arch : ${FF_CUDA_ARCH}" )
   message( STATUS "CUDA_GENCODE: ${CUDA_GENCODE}")
+  message( STATUS "CMAKE_CUDA_COMPILER: ${CMAKE_CUDA_COMPILER}")
 
   list(APPEND FLEXFLOW_INCLUDE_DIRS
     ${CUDA_INCLUDE_DIRS})
diff --git a/cmake/legion.cmake b/cmake/legion.cmake
index b83cbc52f2..2afb507d3b 100644
--- a/cmake/legion.cmake
+++ b/cmake/legion.cmake
@@ -132,6 +132,10 @@ else()
 		  set(Legion_EMBED_GASNet_VERSION "GASNet-2022.3.0" CACHE STRING "GASNet version")
 		  set(Legion_NETWORKS "gasnetex" CACHE STRING "GASNet conduit")
 		  set(GASNet_CONDUIT ${FF_GASNET_CONDUIT})
+		elseif("${FF_LEGION_NETWORKS}" STREQUAL "ucx")
+		  set(ucx_ROOT ${UCX_PATH}/lib/cmake)
+          message(STATUS "Find ucx: ${UCX_PATH}")
+		  set(Legion_NETWORKS "ucx" CACHE STRING "Enable UCX")
 		endif()
 		message(STATUS "GASNET ROOT: $ENV{GASNet_ROOT_DIR}")
 		set(Legion_MAX_DIM ${FF_MAX_DIM} CACHE STRING "Maximum number of dimensions")
diff --git a/cmake/nccl.cmake b/cmake/nccl.cmake
index 04a23dcb8a..c140a44ec8 100644
--- a/cmake/nccl.cmake
+++ b/cmake/nccl.cmake
@@ -109,8 +109,9 @@ else()
     message( STATUS "NCCL include : ${NCCL_INCLUDE_DIRS}" )
     message( STATUS "NCCL libraries : ${NCCL_LIBRARIES}" )
     add_library(nccl SHARED IMPORTED)
+  
+  # Build NCCL from source
   else()
-    # Build NCCL from source
     message(STATUS "Building NCCL from source")
     list(TRANSFORM CUDA_GENCODE PREPEND "NVCC_GENCODE=" OUTPUT_VARIABLE NCCL_BUILD_NVCC_GENCODE)
   
diff --git a/config/config.inc b/config/config.inc
index 5a7bde5ce9..e5c9c69acf 100644
--- a/config/config.inc
+++ b/config/config.inc
@@ -108,12 +108,13 @@ if [ "$FF_LEGION_NETWORKS" = "gasnet" ]; then
     SET_LEGION_NETWORKS+=" -DFF_GASNET_CONDUIT=mpi"
   elif [ "$FF_GASNET_CONDUIT" = "udp" ]; then
     SET_LEGION_NETWORKS+=" -DFF_GASNET_CONDUIT=udp"
-  elif [ "$FF_GASNET_CONDUIT" = "ucx" ]; then
-    SET_LEGION_NETWORKS+=" -DFF_GASNET_CONDUIT=ucx"
-    SET_LEGION_NETWORKS+=" -DFF_UCX_URL=$FF_UCX_URL"
   fi
 elif [ "$FF_LEGION_NETWORKS" = "ucx" ]; then
   SET_LEGION_NETWORKS+=" -DFF_LEGION_NETWORKS=ucx"
+  # set ucx dir
+  if [ -n "$UCX_DIR" ]; then
+    SET_UCX="-DUCX_PATH=${UCX_DIR}"
+  fi
 fi
 
 # build C++ examples
@@ -227,7 +228,7 @@ if [ -n "$FF_GPU_BACKEND" ]; then
   fi
 fi
 
-CMAKE_FLAGS="-DCUDA_USE_STATIC_CUDA_RUNTIME=OFF -DLegion_HIJACK_CUDART=OFF ${SET_CC} ${SET_CXX} ${SET_INSTALL_DIR} ${SET_INFERENCE_TESTS} ${SET_LIBTORCH_PATH} ${SET_BUILD} ${SET_CUDA_ARCH} ${SET_CUDA} ${SET_CUDNN} ${SET_HIP_ARCH} ${SET_PYTHON} ${SET_BUILD_LEGION_ONLY} ${SET_NCCL} ${SET_NCCL_DIR} ${SET_LEGION_NETWORKS} ${SET_EXAMPLES} ${SET_INFERENCE_EXAMPLES} ${SET_USE_PREBUILT_LEGION} ${SET_USE_PREBUILT_NCCL} ${SET_USE_ALL_PREBUILT_LIBRARIES} ${SET_BUILD_UNIT_TESTS} ${SET_AVX2} ${SET_MAX_DIM} ${SET_LEGION_MAX_RETURN_SIZE} ${SET_ROCM_PATH} ${SET_FF_GPU_BACKEND}"
+CMAKE_FLAGS="-DCUDA_USE_STATIC_CUDA_RUNTIME=OFF -DLegion_HIJACK_CUDART=OFF ${SET_CC} ${SET_CXX} ${SET_INSTALL_DIR} ${SET_INFERENCE_TESTS} ${SET_LIBTORCH_PATH} ${SET_BUILD} ${SET_CUDA_ARCH} ${SET_CUDA} ${SET_CUDNN} ${SET_HIP_ARCH} ${SET_PYTHON} ${SET_BUILD_LEGION_ONLY} ${SET_NCCL} ${SET_NCCL_DIR} ${SET_LEGION_NETWORKS} ${SET_UCX} ${SET_EXAMPLES} ${SET_INFERENCE_EXAMPLES} ${SET_USE_PREBUILT_LEGION} ${SET_USE_PREBUILT_NCCL} ${SET_USE_ALL_PREBUILT_LIBRARIES} ${SET_BUILD_UNIT_TESTS} ${SET_AVX2} ${SET_MAX_DIM} ${SET_LEGION_MAX_RETURN_SIZE} ${SET_ROCM_PATH} ${SET_FF_GPU_BACKEND}"
 
 function run_cmake() {
 SRC_LOCATION=${SRC_LOCATION:=`dirname $0`/../}
diff --git a/config/config.linux b/config/config.linux
index 37b9bd16fd..db71abcacd 100755
--- a/config/config.linux
+++ b/config/config.linux
@@ -42,7 +42,8 @@ CUDNN_DIR=${CUDNN_DIR:-"/usr/local/cuda"}
 # set CUDA dir in case cmake cannot autodetect a path
 CUDA_DIR=${CUDA_DIR:-"/usr/local/cuda"}
 
-#set NCCL dir
+# if not use PREBUILD_NCCL, you can set NCCL_DIR to use external nccl lib,
+# otherwise, we will build nccl from source
 NCCL_DIR=${NCCL_DIR:-"/usr/local/cuda"}
 
 # enable Python
@@ -54,8 +55,8 @@ FF_LEGION_NETWORKS=${FF_LEGION_NETWORKS:-}
 # select GASNET conduit
 FF_GASNET_CONDUIT=${FF_GASNET_CONDUIT:-ibv}
 
-# set UCX URL
-FF_UCX_URL=${FF_UCX_URL:-""}
+# set UCX dir if Legion networks is set to ucx
+UCX_DIR=${UCX_DIR:-""}
 
 # build C++ examples
 FF_BUILD_ALL_EXAMPLES=${FF_BUILD_ALL_EXAMPLES:-OFF}
@@ -67,6 +68,7 @@ FF_BUILD_UNIT_TESTS=${FF_BUILD_UNIT_TESTS:-OFF}
 # use precompiled NCCL and Legion libraries, where available
 FF_USE_PREBUILT_NCCL=${FF_USE_PREBUILT_NCCL:-OFF}
 FF_USE_PREBUILT_LEGION=${FF_USE_PREBUILT_LEGION:-OFF}
+
 # use the flag below to use both the NCCL and Legion pre-built libraries.
 # when the flag below is set to ON, the two flags above are ignored.
 FF_USE_ALL_PREBUILT_LIBRARIES=${FF_USE_ALL_PREBUILT_LIBRARIES:-OFF}

From 457b5f2e8b2bf751d30fb074ebe4e8b3b937be85 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 28 Nov 2023 10:33:58 -0500
Subject: [PATCH 265/344] post ucx fixes

---
 MULTI-NODE.md            | 32 ++------------------------------
 config/config.linux      |  2 +-
 scripts/mnist_mlp_run.sh | 15 ++++++++++++++-
 3 files changed, 17 insertions(+), 32 deletions(-)

diff --git a/MULTI-NODE.md b/MULTI-NODE.md
index 37e8f6182c..28f2eab8ed 100644
--- a/MULTI-NODE.md
+++ b/MULTI-NODE.md
@@ -84,35 +84,7 @@ ssh-ed25519 AAAAC3NzaC1lZDI1NTE5AAAAIOy5NKYdE8Cwgid59rx6xMqyj9vLaWuXIwy/BSRiK4su
 
 ## 5. Test FlexFlow
 
-<<<<<<< HEAD
-Follow step 6 in the [Build from source guide](https://flexflow.readthedocs.io/en/latest/installation.html) to set environment variables.
+Follow step 6 in the [Build from source guide](https://flexflow.readthedocs.io/en/latest/installation.html) to set the environment variables.
 
-A script to run a Python example on multiple nodes is available at `scripts/mnist_mlp_run.sh`. You can run the script using [`mpirun`](https://www.open-mpi.org/doc/current/man1/mpirun.1.php) (if you configured it in step 3) or [`srun`](https://slurm.schedmd.com/srun.html).
-=======
-Follow step 6 in [INSTALL.md](INSTALL.md#6-test-flexflow) to set environment variables.
+A script to run a Python example on multiple nodes is available at `scripts/mnist_mlp_run.sh`. Run the script to test FlexFlow on mnist mlp training. You can adjust the script to run any other program. Make sure to change the `FLEXFLOW_DIR` and `UCX_DIR` variables in it to appropriate paths. 
 
-Save the following script as `mnist_mlp_run.sh` and make sure to change `FLEXFLOW_DIR` and `UCX_DIR` to appropriate paths:
-
-```bash
-#!/bin/bash
-eval "$(conda shell.bash hook)"
-conda activate flexflow
-export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$CONDA_PREFIX/lib
-
-# Path to your FlexFlow build
-FLEXFLOW_DIR=/home/ubuntu/FlexFlow/build
-
-# Path to your UCX installation
-UCX_DIR=/home/ubuntu/ucx-1.15.0/install
-
-export REALM_UCP_BOOTSTRAP_PLUGIN=$FLEXFLOW_DIR/deps/legion/lib/realm_ucp_bootstrap_mpi.so
-export LD_LIBRARY_PATH=$FLEXFLOW_DIR/deps/legion/lib:$LD_LIBRARY_PATH
-export LD_LIBRARY_PATH=$FLEXFLOW_DIR:$LD_LIBRARY_PATH
-export LD_LIBRARY_PATH=$UCX_DIR/lib:$LD_LIBRARY_PATH
-export LD_LIBRARY_PATH=/opt/conda/envs/flexflow/lib:$LD_LIBRARY_PATH
-
-mpiexec -x REALM_UCP_BOOTSTRAP_PLUGIN -x PATH -x LD_LIBRARY_PATH --hostfile ~/hostfile --mca btl_tcp_if_include ens5 -np 2 "$FLEXFLOW_DIR"/flexflow_python "$FLEXFLOW_DIR"/../examples/python/native/mnist_mlp.py -ll:py 1 -ll:gpu 1 -ll:fsize 8000 -ll:zsize 8000
-```
-
-Run the script to test FlexFlow on mnist mlp training. You can adjust the script to run any other program.
->>>>>>> c031ab1f... fix ucx
diff --git a/config/config.linux b/config/config.linux
index db71abcacd..30edfa7dfe 100755
--- a/config/config.linux
+++ b/config/config.linux
@@ -102,7 +102,7 @@ fi
 
 function get_build_configs() {
     # Create a string with the values of the variables set in this script
-    BUILD_CONFIGS="FF_CUDA_ARCH=${FF_CUDA_ARCH} FF_HIP_ARCH=${FF_HIP_ARCH} CUDNN_DIR=${CUDNN_DIR} CUDA_DIR=${CUDA_DIR} NCCL_DIR=${NCCL_DIR} FF_USE_PYTHON=${FF_USE_PYTHON} BUILD_LEGION_ONLY=${BUILD_LEGION_ONLY} FF_GASNET_CONDUIT=${FF_GASNET_CONDUIT} FF_UCX_URL=${FF_UCX_URL} FF_LEGION_NETWORKS=${FF_LEGION_NETWORKS} FF_BUILD_ALL_EXAMPLES=${FF_BUILD_ALL_EXAMPLES} FF_BUILD_ALL_INFERENCE_EXAMPLES=${FF_BUILD_ALL_INFERENCE_EXAMPLES} FF_BUILD_UNIT_TESTS=${FF_BUILD_UNIT_TESTS} FF_USE_PREBUILT_NCCL=${FF_USE_PREBUILT_NCCL} FF_USE_PREBUILT_LEGION=${FF_USE_PREBUILT_LEGION} FF_USE_ALL_PREBUILT_LIBRARIES=${FF_USE_ALL_PREBUILT_LIBRARIES} FF_USE_AVX2=${FF_USE_AVX2} FF_MAX_DIM=${FF_MAX_DIM} ROCM_PATH=${ROCM_PATH} FF_GPU_BACKEND=${FF_GPU_BACKEND} INSTALL_DIR=${INSTALL_DIR}"
+    BUILD_CONFIGS="FF_CUDA_ARCH=${FF_CUDA_ARCH} FF_HIP_ARCH=${FF_HIP_ARCH} CUDNN_DIR=${CUDNN_DIR} CUDA_DIR=${CUDA_DIR} NCCL_DIR=${NCCL_DIR} FF_USE_PYTHON=${FF_USE_PYTHON} BUILD_LEGION_ONLY=${BUILD_LEGION_ONLY} FF_GASNET_CONDUIT=${FF_GASNET_CONDUIT} UCX_DIR=${UCX_DIR} FF_LEGION_NETWORKS=${FF_LEGION_NETWORKS} FF_BUILD_ALL_EXAMPLES=${FF_BUILD_ALL_EXAMPLES} FF_BUILD_ALL_INFERENCE_EXAMPLES=${FF_BUILD_ALL_INFERENCE_EXAMPLES} FF_BUILD_UNIT_TESTS=${FF_BUILD_UNIT_TESTS} FF_USE_PREBUILT_NCCL=${FF_USE_PREBUILT_NCCL} FF_USE_PREBUILT_LEGION=${FF_USE_PREBUILT_LEGION} FF_USE_ALL_PREBUILT_LIBRARIES=${FF_USE_ALL_PREBUILT_LIBRARIES} FF_USE_AVX2=${FF_USE_AVX2} FF_MAX_DIM=${FF_MAX_DIM} ROCM_PATH=${ROCM_PATH} FF_GPU_BACKEND=${FF_GPU_BACKEND} INSTALL_DIR=${INSTALL_DIR}"
 }
 
 if [[ -n "$1" && ( "$1" == "CMAKE_FLAGS" || "$1" == "CUDA_PATH" ) ]]; then
diff --git a/scripts/mnist_mlp_run.sh b/scripts/mnist_mlp_run.sh
index 8842790e6a..b070195d88 100755
--- a/scripts/mnist_mlp_run.sh
+++ b/scripts/mnist_mlp_run.sh
@@ -2,4 +2,17 @@
 eval "$(conda shell.bash hook)"
 conda activate flexflow
 export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$CONDA_PREFIX/lib
-~/FlexFlow/python/flexflow_python ~/FlexFlow/examples/python/native/mnist_mlp.py -ll:py 1 -ll:gpu 1 -ll:fsize 8000 -ll:zsize 8000
+
+# Path to your FlexFlow build
+FLEXFLOW_DIR=/home/ubuntu/FlexFlow/build
+
+# Path to your UCX installation
+UCX_DIR=/home/ubuntu/ucx-1.15.0/install
+
+export REALM_UCP_BOOTSTRAP_PLUGIN=$FLEXFLOW_DIR/deps/legion/lib/realm_ucp_bootstrap_mpi.so
+export LD_LIBRARY_PATH=$FLEXFLOW_DIR/deps/legion/lib:$LD_LIBRARY_PATH
+export LD_LIBRARY_PATH=$FLEXFLOW_DIR:$LD_LIBRARY_PATH
+export LD_LIBRARY_PATH=$UCX_DIR/lib:$LD_LIBRARY_PATH
+export LD_LIBRARY_PATH=/opt/conda/envs/flexflow/lib:$LD_LIBRARY_PATH
+
+mpiexec -x REALM_UCP_BOOTSTRAP_PLUGIN -x PATH -x LD_LIBRARY_PATH --hostfile ~/hostfile --mca btl_tcp_if_include ens5 -np 2 "$FLEXFLOW_DIR"/flexflow_python "$FLEXFLOW_DIR"/../examples/python/native/mnist_mlp.py -ll:py 1 -ll:gpu 1 -ll:fsize 8000 -ll:zsize 8000

From 5501cf86a5bf00a8cf4589559c3c45732b4a8d26 Mon Sep 17 00:00:00 2001
From: Soumya Chatterjee <soumyac@stanford.edu>
Date: Thu, 30 Nov 2023 18:00:23 -0800
Subject: [PATCH 266/344] Fix tensor shapes for elementwise binary operations
 with broadcasting (#1234)

* Fix shapes in keras

* remove extra lines

* Add python<3.12 requirement to fix CI errors

* Add python<=3.11 requirement to fix CI errors

* Tweak around requirement to fix CI errors

* Restore flexflow.yml

* Restore pytorch-gpu.yml

---------

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 python/flexflow/keras/layers/merge.py | 33 ++++++++++++++++++++++++---
 src/ops/element_binary.cc             | 15 +++++++++++-
 2 files changed, 44 insertions(+), 4 deletions(-)

diff --git a/python/flexflow/keras/layers/merge.py b/python/flexflow/keras/layers/merge.py
index fa967422d8..be2fe0c8c9 100644
--- a/python/flexflow/keras/layers/merge.py
+++ b/python/flexflow/keras/layers/merge.py
@@ -101,7 +101,16 @@ def __init__(self, **kwargs):
   def _calculate_inout_shape(self, input_tensors):    
     assert len(input_tensors) == 2, "check input_tensors"   
     self.input_shape = input_tensors[0].batch_shape
-    self.output_shape = input_tensors[0].batch_shape
+    self.output_shape = list(input_tensors[0].batch_shape)
+    for i, d in enumerate(input_tensors[1].batch_shape):
+      if self.output_shape[i] != d:
+        if self.output_shape[i] == 1 or d == 1:
+          self.output_shape[i] *= d
+        else:
+          raise AssertionError(
+            f"Tensor with shape {input_tensors[0].batch_shape} and "
+            f"{input_tensors[1].batch_shape} cannot be added")
+    self.output_shape = tuple(self.output_shape)
     fflogger.debug("add output %s" %( str(self.output_shape)))
     
 def subtract(input_tensors):
@@ -114,7 +123,16 @@ def __init__(self, **kwargs):
   def _calculate_inout_shape(self, input_tensors): 
     assert len(input_tensors) == 2, "check input_tensors"   
     self.input_shape = input_tensors[0].batch_shape
-    self.output_shape = input_tensors[0].batch_shape
+    self.output_shape = list(input_tensors[0].batch_shape)
+    for i, d in enumerate(input_tensors[1].batch_shape):
+      if self.output_shape[i] != d:
+        if self.output_shape[i] == 1 or d == 1:
+          self.output_shape[i] *= d
+        else:
+          raise AssertionError(
+            f"Tensor with shape {input_tensors[0].batch_shape} and "
+            f"{input_tensors[1].batch_shape} cannot be subtracted")
+    self.output_shape = tuple(self.output_shape)
     fflogger.debug("subtract output %s" %( str(self.output_shape)))
 
 def multiply(input_tensors):
@@ -127,7 +145,16 @@ def __init__(self, **kwargs):
   def _calculate_inout_shape(self, input_tensors): 
     assert len(input_tensors) == 2, "check input_tensors"   
     self.input_shape = input_tensors[0].batch_shape
-    self.output_shape = input_tensors[0].batch_shape
+    self.output_shape = list(input_tensors[0].batch_shape)
+    for i, d in enumerate(input_tensors[1].batch_shape):
+      if self.output_shape[i] != d:
+        if self.output_shape[i] == 1 or d == 1:
+          self.output_shape[i] *= d
+        else:
+          raise AssertionError(
+            f"Tensor with shape {input_tensors[0].batch_shape} and "
+            f"{input_tensors[1].batch_shape} cannot be multiplied")
+    self.output_shape = tuple(self.output_shape)
     fflogger.debug("multiply output %s" %( str(self.output_shape)))
 
 class Maximum(_Merge):
diff --git a/src/ops/element_binary.cc b/src/ops/element_binary.cc
index aa31477815..42c6487581 100644
--- a/src/ops/element_binary.cc
+++ b/src/ops/element_binary.cc
@@ -89,8 +89,21 @@ Tensor FFModel::binary(OperatorType op,
   }
   // Assert type match after broadcast
   assert(ele->inputs[0]->data_type == ele->inputs[1]->data_type);
+
+  int numdim = in1->num_dims;
+  int dims[MAX_TENSOR_DIM];
+  for (int i = 0; i < numdim; i++) {
+    if (in1->dims[i] == 1) {
+      dims[i] = in2->dims[i];
+    } else if (in2->dims[i] == 1) {
+      dims[i] = in1->dims[i];
+    } else {
+      dims[i] = in1->dims[i];
+    }
+  }
+
   ele->outputs[0] = create_tensor_legion_ordering(
-      in1->num_dims, in1->dims, ele->data_type, ele, 0, true /*create_grad*/);
+      in1->num_dims, dims, ele->data_type, ele, 0, true /*create_grad*/);
   ele->add_int_property("inplace_a", inplace_a);
   layers.push_back(ele);
   return ele->outputs[0];

From 477afcb83abec5f3e1043269798d9314f0e8f18e Mon Sep 17 00:00:00 2001
From: Xinhao Cheng <99570243+xinhaoc@users.noreply.github.com>
Date: Sat, 2 Dec 2023 19:27:49 -0500
Subject: [PATCH 267/344] Fix attention  (#1238)

* fix

* .
---
 src/ops/inc_multihead_self_attention.cu | 5 ++++-
 1 file changed, 4 insertions(+), 1 deletion(-)

diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 20f7d64936..ce30b5dfda 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -713,7 +713,7 @@ void compute_attention_kernel_generation(IncMultiHeadSelfAttentionMeta const *m,
                                          BatchConfig const *bc,
                                          DT *output_ptr,
                                          cudaStream_t stream) {
-  dim3 grid(m->num_q_heads, bc->num_active_requests());
+  dim3 grid(m->num_q_heads, bc->num_generation_tokens);
   int const per_head_size = m->qProjSize;
   float scale = (*m->qk_prod_scaling) ? 1.0f / sqrt(m->kProjSize) : 1.0f;
   size_t smem_sz;
@@ -936,6 +936,9 @@ void compute_attention_kernel_prompt(IncMultiHeadSelfAttentionMeta const *m,
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
     if (bc->request_completed[i]) {
       continue;
+    } else if (tokens_previous_requests < bc->num_generation_tokens) {
+      tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
+      continue;
     }
     assert(tokens_previous_requests ==
            bc->requestsInfo[i].first_token_offset_in_batch);

From 08f60b15031b8c1eb5bb331005f9cb3755386b72 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 11 Dec 2023 22:34:36 -0500
Subject: [PATCH 268/344] Fix HIP build for AMD (#1243)

* fix

* update hip docker

* undo legion update until pr is merged on gitlab
---
 CMakeLists.txt                         | 11 +++++++----
 cmake/hip.cmake                        |  4 ++--
 config/config.inc                      |  7 +++++--
 docker/flexflow-environment/Dockerfile |  5 +----
 inference/incr_decoding/CMakeLists.txt |  1 +
 inference/spec_infer/CMakeLists.txt    |  1 +
 6 files changed, 17 insertions(+), 12 deletions(-)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index b201cf99dc..90cab126e6 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -14,6 +14,7 @@ endif()
 set(CMAKE_MODULE_PATH ${CMAKE_MODULE_PATH} ${CMAKE_CURRENT_LIST_DIR}/cmake)
 set(FLEXFLOW_ROOT ${CMAKE_CURRENT_LIST_DIR})
 set(CMAKE_CXX_FLAGS "-std=c++17 ${CMAKE_CXX_FLAGS} -fPIC -UNDEBUG")
+set(CMAKE_HIP_FLAGS "-std=c++17 ${CMAKE_HIP_FLAGS} -fPIC -UNDEBUG")
 
 # set std 17
 #set(CMAKE_CXX_STANDARD 17)
@@ -51,6 +52,7 @@ endif()
 
 # do not disable assertions even if in release mode
 set(CMAKE_CXX_FLAGS_RELEASE "${CMAKE_CXX_FLAGS_RELEASE} -UNDEBUG")
+set(CMAKE_HIP_FLAGS_RELEASE "${CMAKE_HIP_FLAGS_RELEASE} -UNDEBUG")
 
 if(${CMAKE_SYSTEM_NAME} MATCHES "Linux")
   set(LIBEXT ".so")
@@ -157,6 +159,7 @@ endif()
 
 # HIP
 if (FF_GPU_BACKEND STREQUAL "hip_rocm" OR FF_GPU_BACKEND STREQUAL "hip_cuda")
+  enable_language(HIP)
   include(hip)
 endif()
 
@@ -299,7 +302,10 @@ if(NOT BUILD_LEGION_ONLY)
       LIST_DIRECTORIES False
       ${FLEXFLOW_ROOT}/src/*.cpp)
 
-    if(BUILD_SHARED_LIBS)
+      set_source_files_properties(${FLEXFLOW_GPU_SRC} PROPERTIES LANGUAGE HIP)
+      set_source_files_properties(${FLEXFLOW_SRC} PROPERTIES LANGUAGE HIP)
+    
+      if(BUILD_SHARED_LIBS)
       add_library(flexflow SHARED ${FLEXFLOW_GPU_SRC} ${FLEXFLOW_SRC})
     else()
       add_library(flexflow STATIC ${FLEXFLOW_GPU_SRC} ${FLEXFLOW_SRC})
@@ -474,9 +480,6 @@ if(NOT BUILD_LEGION_ONLY)
     endif()
 
   if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_TOKENIZER)
-    if (FF_GPU_BACKEND STREQUAL "hip_rocm")
-      SET(SPM_USE_BUILTIN_PROTOBUF OFF CACHE BOOL "Use builtin version of protobuf to compile SentencePiece")
-    endif()
     # Ensure Rust is installed
     execute_process(COMMAND rustc --version
                   RESULT_VARIABLE RUST_COMMAND_RESULT
diff --git a/cmake/hip.cmake b/cmake/hip.cmake
index abcc82b03a..25f2e05e19 100644
--- a/cmake/hip.cmake
+++ b/cmake/hip.cmake
@@ -2,11 +2,11 @@ if (NOT FF_HIP_ARCH STREQUAL "")
     if (FF_HIP_ARCH STREQUAL "all")
         set(FF_HIP_ARCH "gfx900,gfx902,gfx904,gfx906,gfx908,gfx909,gfx90a,gfx90c,gfx940,gfx1010,gfx1011,gfx1012,gfx1013,gfx1030,gfx1031,gfx1032,gfx1033,gfx1034,gfx1035,gfx1036,gfx1100,gfx1101,gfx1102,gfx1103")
     endif()
-    string(REPLACE "," " " HIP_ARCH_LIST "${FF_HIP_ARCH}")
+    string(REPLACE "," "," HIP_ARCH_LIST "${FF_HIP_ARCH}")
 endif()
 
 message(STATUS "FF_HIP_ARCH: ${FF_HIP_ARCH}")
 if(FF_GPU_BACKEND STREQUAL "hip_rocm")
-    set(HIP_CLANG_PATH ${ROCM_PATH}/llvm/bin CACHE STRING "Path to the clang compiler by ROCM" FORCE)
+    #set(HIP_CLANG_PATH ${ROCM_PATH}/llvm/bin CACHE STRING "Path to the clang compiler by ROCM" FORCE)
     set(GPU_TARGETS "${FF_HIP_ARCH}" CACHE STRING "The GPU TARGETs")
 endif()
diff --git a/config/config.inc b/config/config.inc
index e5c9c69acf..1121c114c4 100644
--- a/config/config.inc
+++ b/config/config.inc
@@ -190,6 +190,8 @@ if [ -n "$ROCM_PATH" ]; then
   SET_ROCM_PATH="-DROCM_PATH=${ROCM_PATH}"
 fi
 
+ADD_ROCM_TO_PATH=""
+
 # set GPU backend
 if [ -n "$FF_GPU_BACKEND" ]; then
   SET_FF_GPU_BACKEND="-DFF_GPU_BACKEND=${FF_GPU_BACKEND}"
@@ -222,7 +224,8 @@ if [ -n "$FF_GPU_BACKEND" ]; then
         chmod +x "$(pwd)/nvidia_hipcc"
         SET_CXX="-DCMAKE_CXX_COMPILER=$(pwd)/nvidia_hipcc -DCMAKE_CXX_LINKER=$(pwd)/nvidia_hipcc"
       else
-        SET_CXX="-DCMAKE_CXX_COMPILER=/opt/rocm/bin/hipcc -DCMAKE_CXX_LINKER=/opt/rocm/bin/hipcc"
+        ADD_ROCM_TO_PATH="PATH=${PATH}:${ROCM_PATH}/bin"
+        #SET_CXX="-DCMAKE_CXX_COMPILER=/opt/rocm/bin/hipcc -DCMAKE_CXX_LINKER=/opt/rocm/bin/hipcc"
       fi
     fi
   fi
@@ -232,7 +235,7 @@ CMAKE_FLAGS="-DCUDA_USE_STATIC_CUDA_RUNTIME=OFF -DLegion_HIJACK_CUDART=OFF ${SET
 
 function run_cmake() {
 SRC_LOCATION=${SRC_LOCATION:=`dirname $0`/../}
-CMAKE_COMMAND="${SET_CC_FLAGS} ${SET_NVCC_FLAGS} ${SET_LD_FLAGS} ${SET_CUDA_LIB_PATH} cmake ${CMAKE_FLAGS} $* ${SRC_LOCATION}"
+CMAKE_COMMAND="${SET_CC_FLAGS} ${SET_NVCC_FLAGS} ${SET_LD_FLAGS} ${SET_CUDA_LIB_PATH} ${ADD_ROCM_TO_PATH} cmake ${CMAKE_FLAGS} $* ${SRC_LOCATION}"
 echo $CMAKE_COMMAND
 eval $CMAKE_COMMAND
 }
diff --git a/docker/flexflow-environment/Dockerfile b/docker/flexflow-environment/Dockerfile
index 0e9a3cda82..edbf9a7e52 100644
--- a/docker/flexflow-environment/Dockerfile
+++ b/docker/flexflow-environment/Dockerfile
@@ -74,11 +74,8 @@ RUN  if [ "$FF_GPU_BACKEND" = "hip_cuda" ] || [ "$FF_GPU_BACKEND" = "hip_rocm" ]
         rm ./${AMD_GPU_SCRIPT_NAME}; \
         amdgpu-install -y --usecase=hip,rocm --no-dkms; \
         apt-get install -y hip-dev hipblas miopen-hip rocm-hip-sdk rocm-device-libs; \
-        # Install protobuf v3.20.x manually
+        # Install protobuf dependencies
         apt-get update -y && sudo apt-get install -y pkg-config zip g++ zlib1g-dev autoconf automake libtool make; \
-        git clone -b 3.20.x https://github.com/protocolbuffers/protobuf.git; cd protobuf/ ; git submodule update --init --recursive; \
-        ./autogen.sh; ./configure; cores_available=$(nproc --all); n_build_cores=$(( cores_available -1 )); \
-        if (( n_build_cores < 1 )) ; then n_build_cores=1 ; fi; make -j $n_build_cores; make install; ldconfig; cd .. ; \
     else \
         echo "FF_GPU_BACKEND: ${FF_GPU_BACKEND}. Skipping installing HIP dependencies"; \
     fi
diff --git a/inference/incr_decoding/CMakeLists.txt b/inference/incr_decoding/CMakeLists.txt
index e415835a79..53b7cf0c2f 100644
--- a/inference/incr_decoding/CMakeLists.txt
+++ b/inference/incr_decoding/CMakeLists.txt
@@ -20,6 +20,7 @@ if (FF_GPU_BACKEND STREQUAL "cuda" OR FF_GPU_BACKEND STREQUAL "hip_cuda")
     target_compile_definitions(${project_target} PRIVATE __HIP_PLATFORM_NVIDIA__)
   endif()
 elseif(FF_GPU_BACKEND STREQUAL "hip_rocm")
+  set_source_files_properties(${CPU_SRC} PROPERTIES LANGUAGE HIP)
   hip_add_executable(${project_target} ${CPU_SRC})
   if (FF_HIP_ARCH STREQUAL "")
     message(FATAL_ERROR "FF_HIP_ARCH is empty!")
diff --git a/inference/spec_infer/CMakeLists.txt b/inference/spec_infer/CMakeLists.txt
index 26d5bd1894..c877a3530b 100644
--- a/inference/spec_infer/CMakeLists.txt
+++ b/inference/spec_infer/CMakeLists.txt
@@ -19,6 +19,7 @@ if (FF_GPU_BACKEND STREQUAL "cuda" OR FF_GPU_BACKEND STREQUAL "hip_cuda")
     target_compile_definitions(${project_target} PRIVATE __HIP_PLATFORM_NVIDIA__)
   endif()
 elseif(FF_GPU_BACKEND STREQUAL "hip_rocm")
+  set_source_files_properties(${CPU_SRC} PROPERTIES LANGUAGE HIP)
   hip_add_executable(${project_target} ${CPU_SRC})
   if (FF_HIP_ARCH STREQUAL "")
     message(FATAL_ERROR "FF_HIP_ARCH is empty!")

From 3cf49a6d89b9ce60efde018fc99565390ee37eb7 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 12 Dec 2023 03:55:52 -0500
Subject: [PATCH 269/344] [Documentation] - Annotate attention kernel with
 shapes of tensors (#1244)

* add attention shape annotations

* linting

* fix
---
 src/ops/inc_multihead_self_attention.cu      | 443 ++++++++++---------
 src/ops/spec_inc_multihead_self_attention.cu |   2 +-
 2 files changed, 247 insertions(+), 198 deletions(-)

diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index ce30b5dfda..7da9aa389c 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -504,7 +504,6 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
 
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
-  DT alpha = 1.0f, beta = 0.0f;
   assert(m->qSize == m->vSize && m->qSize == m->kSize);
   cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
 #if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
@@ -518,43 +517,52 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
     compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
   }
 #endif
-  // Compute (W^T)x matmul: einsum(ijkl,im->jmkl)
-  // Weights: qSize x qProjSize x 3 x num_q_heads
-  // Input: qSize x num_tokens
-  // Output >>> qProjSize x num_tokens x 3 x num_q_heads
-  int m_q = m->qProjSize * m->num_q_heads;
-  int m_k = m->kProjSize * m->num_q_heads;
-  int m_v = m->vProjSize * m->num_q_heads;
-  assert(m_q == m_k && m_k == m_v); // keep things simple for now
-  int n = bc->num_active_tokens();
-  int k = m->qSize;
-  int m_ = m_q * QKV_WEIGHT_NUM;
-  int lda = k, ldb = k, ldc = m_;
-  checkCUDA(cublasGemmEx(m->handle.blas,
-                         CUBLAS_OP_T,
-                         CUBLAS_OP_N,
-                         m_,
-                         n,
-                         k,
-                         &alpha,
-                         weight_ptr,
-                         cublas_data_type,
-                         lda,
-                         input_ptr,
-                         cublas_data_type,
-                         ldb,
-                         &beta,
-                         output_ptr,
-                         cublas_data_type,
-                         ldc,
-                         compute_type,
-                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-  // apply rotary emmmbedding for q
-  // and k step1 change the k, v to complex tensor
+
+  // Step 1: Compute QKV projections
+  {
+    DT alpha = 1.0f, beta = 0.0f;
+    // after transpositions
+    int m_q = m->qProjSize * m->num_q_heads;
+    int m_k = m->kProjSize * m->num_q_heads;
+    int m_v = m->vProjSize * m->num_q_heads;
+    assert(m_q == m_k && m_k == m_v); // keep things simple for now
+    int n = bc->num_active_tokens();
+    int k = m->qSize;
+    int m_ = m_q * QKV_WEIGHT_NUM;
+    // before transpositions
+    int lda = k, ldb = k, ldc = m_;
+    // matrix A: QKV weights
+    // matrix A's layout: [qSize (hidden_dim), qProjSize, num_heads, 3]
+    // matrix B: input
+    // matrix B's layout: [qSize (hidden_dim), num_new_tokens]
+    // matrix C: devQKVProjArray
+    // matrix B's layout: [qProjSize, num_heads, 3, num_new_tokens]
+    checkCUDA(cublasGemmEx(m->handle.blas,
+                           CUBLAS_OP_T,
+                           CUBLAS_OP_N,
+                           m_,
+                           n,
+                           k,
+                           &alpha,
+                           weight_ptr,
+                           cublas_data_type,
+                           lda,
+                           input_ptr,
+                           cublas_data_type,
+                           ldb,
+                           &beta,
+                           output_ptr,
+                           cublas_data_type,
+                           ldc,
+                           compute_type,
+                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+  }
+
   int num_tokens = bc->num_active_tokens();
   int parallelism = m->kProjSize * num_tokens * m->num_q_heads;
   size_t q_array_size = m->qProjSize * num_tokens * m->num_q_heads;
-  // apply bias for q, k, v
+
+  // Step 2: apply bias for QKV, or scale the query
   if (*m->qkv_bias) {
     apply_proj_bias_qkv<<<GET_BLOCKS(parallelism),
                           min(CUDA_NUM_THREADS, parallelism),
@@ -582,6 +590,8 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                                      m->scaling_factor,
                                      m->hidden_size);
   }
+
+  // Step 3: apply rotary embedding if needed
   if (*m->apply_rotary_embedding) {
     /*q&k*/
     parallelism = num_tokens * m->hidden_size;
@@ -638,38 +648,47 @@ void compute_o_prod_bias(IncMultiHeadSelfAttentionMeta const *m,
   cudaDataType_t compute_type = cublas_data_type;
 #endif
   // Project to output, save result directly on output tensor
-  DT alpha = 1.0f, beta = 0.0f;
-  // int num_tokens = bc->num_active_tokens();
-  int m_ = m->oProjSize;
-  int k = m->vProjSize * m->num_q_heads;
-  int n = num_tokens;
-  int lda = k, ldb = k, ldc = m_;
-  DT const *A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
-                                         m->kProjSize * m->num_q_heads +
-                                         m->vProjSize * m->num_q_heads);
-  DT const *B = static_cast<DT *>(m->attn_heads);
-  DT *C = static_cast<DT *>(output_ptr);
-
-  checkCUDA(cublasGemmEx(m->handle.blas,
-                         CUBLAS_OP_T,
-                         CUBLAS_OP_N,
-                         m_,
-                         n,
-                         k,
-                         &alpha,
-                         A,
-                         cublas_data_type,
-                         lda,
-                         B,
-                         cublas_data_type,
-                         ldb,
-                         &beta,
-                         C,
-                         cublas_data_type,
-                         ldc,
-                         compute_type,
-                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-
+  {
+    DT alpha = 1.0f, beta = 0.0f;
+    // after transpositions
+    int m_ = m->oProjSize;
+    int k = m->vProjSize * m->num_q_heads;
+    int n = num_tokens;
+    // before transpositions
+    int lda = k, ldb = k, ldc = m_;
+    // matrix A: output projection weight
+    // matrix A's layout: [vProjSize * num_heads, oProjSize]
+    DT const *A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
+                                           m->kProjSize * m->num_q_heads +
+                                           m->vProjSize * m->num_q_heads);
+    // matrix B: attn heads
+    // matrix B's layout: [vProjSize * num_heads, num_new_tokens]
+    DT const *B = static_cast<DT *>(m->attn_heads);
+    // matrix B: output
+    // matrix B's layout: [oProjSize, num_new_tokens]
+    DT *C = static_cast<DT *>(output_ptr);
+
+    checkCUDA(cublasGemmEx(m->handle.blas,
+                           CUBLAS_OP_T,
+                           CUBLAS_OP_N,
+                           m_,
+                           n,
+                           k,
+                           &alpha,
+                           A,
+                           cublas_data_type,
+                           lda,
+                           B,
+                           cublas_data_type,
+                           ldb,
+                           &beta,
+                           C,
+                           cublas_data_type,
+                           ldc,
+                           compute_type,
+                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+  }
+  // Add final output bias
   if (*m->final_bias && shard_id == 0) {
     int parallelism = m->oProjSize * num_tokens;
     int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
@@ -945,54 +964,69 @@ void compute_attention_kernel_prompt(IncMultiHeadSelfAttentionMeta const *m,
     int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
     int total_tokens = bc->requestsInfo[i].first_token_depth_in_request +
                        bc->requestsInfo[i].num_tokens_in_batch;
-    // bc->token_last_available_idx[i] + 1;
-    // Compute (QK^T/sqrt(d_k))
-    // a flag of using this scaling alpha
-    int m_ = num_new_tokens;
-    int n = total_tokens;
-    int k = m->qProjSize;
-    int lda = k * m->num_q_heads * QKV_WEIGHT_NUM, ldb = k * m->num_q_heads,
-        ldc = m_;
-    int strideA = q_block_size;
-    int strideB = kt_block_size;
-    int strideC = num_new_tokens * total_tokens;
-    DT alpha = 1.0f, beta = 0.0f;
-    if (*m->qk_prod_scaling) {
-      alpha = static_cast<DT>(1.0f / sqrt(m->kProjSize));
+    // Step 1: compute query-key product QK.T/sqrt(d_k)
+    {
+      // Scale by sqrt(d_k) as per the original attention paper
+      DT alpha = 1.0f, beta = 0.0f;
+      if (*m->qk_prod_scaling) {
+        alpha = static_cast<DT>(1.0f / sqrt(m->kProjSize));
+      }
+      // after transpositions
+      int m_ = num_new_tokens;
+      int n = total_tokens;
+      int k = m->qProjSize;
+      // before transpositions
+      int lda = k * m->num_q_heads * QKV_WEIGHT_NUM, ldb = k * m->num_q_heads,
+          ldc = m_;
+      // N.B. strides are applied before transpose operations
+      int strideA = q_block_size;
+      int strideB = kt_block_size;
+      int strideC = num_new_tokens * total_tokens;
+
+      // matrix A: devQKVProjArray
+      // matrix A's layout: [qProjSize, num_heads, 3, num_new_tokens]
+      // To get query projection, skip over Q entries from previous requests
+      DT const *A = static_cast<DT *>(m->devQKVProjArray) +
+                    tokens_previous_requests * m->qProjSize * m->num_q_heads *
+                        QKV_WEIGHT_NUM;
+      // matrix B: key cache
+      // matrix B's layout: [kProjSize * num_heads, total_tokens]
+      // To get B, skip over K entries from previous requests (all heads +
+      // padding)
+      DT const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
+      // matrix C: qk_prods
+      // matrix C's layout: [num_new_tokens, total_tokens, num_heads]
+      // To get C, skip over QK.T products from previous requests
+      DT *C = static_cast<DT *>(m->qk_prods);
+      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                           CUBLAS_OP_T,
+                                           CUBLAS_OP_N,
+                                           m_,
+                                           n,
+                                           k,
+                                           &alpha,
+                                           A,
+                                           cublas_data_type,
+                                           lda,
+                                           strideA,
+                                           B,
+                                           cublas_data_type,
+                                           ldb,
+                                           strideB,
+                                           &beta,
+                                           C,
+                                           cublas_data_type,
+                                           ldc,
+                                           strideC,
+                                           m->num_q_heads,
+                                           compute_type,
+                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
     }
-    // To get A, skip over Q entries from previous requests (same head)
-    DT const *A = static_cast<DT *>(m->devQKVProjArray) +
-                  tokens_previous_requests * m->qProjSize * m->num_q_heads *
-                      QKV_WEIGHT_NUM;
-    // To get B, skip over K entries from previous requests (all heads +
-    // padding)
-    DT const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
-    // To get C, skip over QK^T products from previous requests
+    // Step 2: Add alibi position bias to qk production
+    // matrix C: qk_prods
+    // matrix C's layout: [num_new_tokens, total_tokens, num_heads]
+    // To get C, skip over QK.T products from previous requests
     DT *C = static_cast<DT *>(m->qk_prods);
-    checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                         CUBLAS_OP_T,
-                                         CUBLAS_OP_N,
-                                         m_,
-                                         n,
-                                         k,
-                                         &alpha,
-                                         A,
-                                         cublas_data_type,
-                                         lda,
-                                         strideA,
-                                         B,
-                                         cublas_data_type,
-                                         ldb,
-                                         strideB,
-                                         &beta,
-                                         C,
-                                         cublas_data_type,
-                                         ldc,
-                                         strideC,
-                                         m->num_q_heads,
-                                         compute_type,
-                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-    // add alibi position bias to qk production
     if (*m->position_bias) {
       size_t parallelism = m->num_q_heads * total_tokens * num_new_tokens;
       apply_position_bias_qkprd<<<GET_BLOCKS(parallelism),
@@ -1006,8 +1040,8 @@ void compute_attention_kernel_prompt(IncMultiHeadSelfAttentionMeta const *m,
                                             shard_id);
     }
 
-    // Fill all elements above diagonal in qk prods with -inf to force
-    // causal attention.
+    // Step 3: Apply causal mask. Fill all elements above diagonal in qk prods
+    // with -inf to force causal attention.
     assert(num_new_tokens <= total_tokens);
     size_t entries_above_diagonal = num_new_tokens * (num_new_tokens - 1) / 2;
     if (entries_above_diagonal > 0) {
@@ -1022,87 +1056,102 @@ void compute_attention_kernel_prompt(IncMultiHeadSelfAttentionMeta const *m,
                                               entries_above_diagonal,
                                               static_cast<DT>(-INFINITY));
     }
-    // Compute Softmax(QK^T/sqrt(d_k))
-    // Before modifying the parameters below, make sure to read the following
-    // description of the CUDNN_TENSOR_NCHW tensor layout, from
-    // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#cudnnTensorFormat_t:
-    // This tensor format specifies that the data is laid out in the following
-    // order: batch size, feature maps, rows, columns. The strides are
-    // implicitly defined in such a way that the data are contiguous in memory
-    // with no padding between images, feature maps, rows, and columns; the
-    // columns are the inner dimension and the images are the outermost
-    // dimension.
-    int n_param = m->num_q_heads;
-    int c_param = total_tokens;
-    int h_param = 1;
-    int w_param = num_new_tokens;
-    checkCUDNN(cudnnSetTensor4dDescriptor(m->qk_tensor,
-                                          CUDNN_TENSOR_NCHW,
-                                          cudnn_data_type,
-                                          n_param,
-                                          c_param,
-                                          h_param,
-                                          w_param));
-    float softmax_alpha = 1.0f, softmax_beta = 0.0f;
-    DT *C_softmax = static_cast<DT *>(m->qk_prods_softmax);
-    // The softmax operation below is executed according to the
-    // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
-    // softmax operation is computed per spatial location (H,W) per image (N)
-    // across dimension C.
-    checkCUDNN(cudnnSoftmaxForward(m->handle.dnn,
-                                   CUDNN_SOFTMAX_ACCURATE,
-                                   CUDNN_SOFTMAX_MODE_CHANNEL,
-                                   &softmax_alpha,
-                                   m->qk_tensor,
-                                   C,
-                                   &softmax_beta,
-                                   m->qk_tensor,
-                                   C_softmax));
-    // Matmul softmax(QK^T/sqrt(d_k)) by V
-    alpha = 1.0f, beta = 0.0f;
-    m_ = m->vProjSize;
-    n = num_new_tokens;
-    k = total_tokens;
-    lda = m_ * m->num_q_heads, ldb = n, ldc = m_ * m->num_q_heads;
-    strideA = vt_block_size;
-    strideB = num_new_tokens * total_tokens;
-    strideC = m->vProjSize;
-    // To get A, skip over V^T entries from previous requests (all heads +
-    // padding)
-    A = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
-    // To get B, skip over softmax(QK^T/sqrt(d_k)) entries from previous
-    // requests (all heads)
-    B = C_softmax;
-    // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
-    // requests
-
-    // store the result attn heads, also skip the genration tokens
-    C = static_cast<DT *>(m->attn_heads) +
-        (tokens_previous_requests + bc->num_generation_tokens) *
-            m->num_q_heads * m->vProjSize;
-    checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                         CUBLAS_OP_N,
-                                         CUBLAS_OP_T,
-                                         m_,
-                                         n,
-                                         k,
-                                         &alpha,
-                                         A,
-                                         cublas_data_type,
-                                         lda,
-                                         strideA,
-                                         B,
-                                         cublas_data_type,
-                                         ldb,
-                                         strideB,
-                                         &beta,
-                                         C,
-                                         cublas_data_type,
-                                         ldc,
-                                         strideC,
-                                         m->num_q_heads,
-                                         compute_type,
-                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
+    // Step 4: Compute Softmax(QK.T/sqrt(d_k))
+    {
+      // Before modifying the parameters below, make sure to read the following
+      // description of the CUDNN_TENSOR_NCHW tensor layout, from
+      // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#cudnnTensorFormat_t:
+      // This tensor format specifies that the data is laid out in the following
+      // order: batch size, feature maps, rows, columns. The strides are
+      // implicitly defined in such a way that the data are contiguous in memory
+      // with no padding between images, feature maps, rows, and columns; the
+      // columns are the inner dimension and the images are the outermost
+      // dimension.
+      int n_param = m->num_q_heads;
+      int c_param = total_tokens;
+      int h_param = 1;
+      int w_param = num_new_tokens;
+      checkCUDNN(cudnnSetTensor4dDescriptor(m->qk_tensor,
+                                            CUDNN_TENSOR_NCHW,
+                                            cudnn_data_type,
+                                            n_param,
+                                            c_param,
+                                            h_param,
+                                            w_param));
+      float softmax_alpha = 1.0f, softmax_beta = 0.0f;
+      DT *C_softmax = static_cast<DT *>(m->qk_prods_softmax);
+      // The softmax operation below is executed according to the
+      // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
+      // softmax operation is computed per spatial location (H,W) per image (N)
+      // across dimension C.
+      checkCUDNN(cudnnSoftmaxForward(m->handle.dnn,
+                                     CUDNN_SOFTMAX_ACCURATE,
+                                     CUDNN_SOFTMAX_MODE_CHANNEL,
+                                     &softmax_alpha,
+                                     m->qk_tensor,
+                                     C,
+                                     &softmax_beta,
+                                     m->qk_tensor,
+                                     C_softmax));
+    }
+    // Step 5: Matmul softmax(QK.T/sqrt(d_k)) by V. Implemented as V @
+    // softmax(QK.T/sqrt(d_k)).T
+    {
+      DT alpha = 1.0f, beta = 0.0f;
+      // after transpositions
+      int m_ = m->vProjSize;
+      int n = num_new_tokens;
+      int k = total_tokens;
+      // before transpositions
+      int lda = m_ * m->num_q_heads, ldb = n, ldc = m_ * m->num_q_heads;
+      // N.B. strides are applied before transpose operations
+      int strideA = vt_block_size;
+      int strideB = num_new_tokens * total_tokens;
+      int strideC = m->vProjSize;
+      // matrix A: value cache
+      // matrix A's layout: [vProjSize, num_heads, total_tokens]
+      // To get A, skip over V.T entries from previous requests (all heads +
+      // padding)
+      DT *A = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
+      // matrix B: qk_prods_softmax
+      // matrix B's layout: [num_new_tokens, total_tokens, num_heads]
+      // To get B, skip over softmax(QK.T/sqrt(d_k)) entries from previous
+      // requests (all heads)
+      DT *B = static_cast<DT *>(m->qk_prods_softmax);
+      ;
+      // matrix C: attn heads
+      // matrix C's layout: [vProjSize, num_heads, num_new_tokens]
+      // To get C, skip over softmax(QK.T/sqrt(d_k))V products from previous
+      // requests
+      // store the result attn heads, also skip the genration tokens
+      DT *C = static_cast<DT *>(m->attn_heads) +
+              (tokens_previous_requests + bc->num_generation_tokens) *
+                  m->num_q_heads * m->vProjSize;
+      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                           CUBLAS_OP_N,
+                                           CUBLAS_OP_T,
+                                           m_,
+                                           n,
+                                           k,
+                                           &alpha,
+                                           A,
+                                           cublas_data_type,
+                                           lda,
+                                           strideA,
+                                           B,
+                                           cublas_data_type,
+                                           ldb,
+                                           strideB,
+                                           &beta,
+                                           C,
+                                           cublas_data_type,
+                                           ldc,
+                                           strideC,
+                                           m->num_q_heads,
+                                           compute_type,
+                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+    }
     tokens_previous_requests += num_new_tokens;
   }
   assert(tokens_previous_requests == num_tokens);
@@ -1255,7 +1304,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   assert(kSize == vSize);
   qProjSize = _qProjSize;
   kProjSize = _kProjSize;
-  assert(qProjSize == kProjSize); // required for attention QK^T matmul
+  assert(qProjSize == kProjSize); // required for attention QK.T matmul
   vProjSize = _vProjSize;
   oProjSize = _oProjSize;
   size_t size_of_dt = data_type_size(attn->data_type);
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 6dad1c6de9..562dee4d93 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -492,7 +492,7 @@ void inference_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   // compute output production and bias together for all tokens
   int num_tokens =
       bc->num_active_tokens() * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
-        
+
   compute_o_prod_bias(
       m, bc, shard_id, output_ptr, weight_ptr, bias_ptr, num_tokens, stream);
 }

From 7e7f955f7a4a1f5de9f78d7e964f8e4d0baabb72 Mon Sep 17 00:00:00 2001
From: Xinhao Cheng <99570243+xinhaoc@users.noreply.github.com>
Date: Sun, 24 Dec 2023 10:14:12 -0500
Subject: [PATCH 270/344] Fix link issue (#1247)

---
 src/ops/inc_multihead_self_attention.cu | 20 ++++++++++++++++++++
 1 file changed, 20 insertions(+)

diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 7da9aa389c..695f4b13b9 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -1515,4 +1515,24 @@ template void Kernels::IncMultiHeadAttention::pre_build_weight_kernel<half>(
     GenericTensorAccessorR const weight,
     DataType data_type,
     cudaStream_t stream);
+
+template void Kernels::IncMultiHeadAttention::compute_o_prod_bias<float>(
+    IncMultiHeadSelfAttentionMeta const *m,
+    BatchConfig const *bc,
+    int shard_id,
+    float *output_ptr,
+    float const *weight_ptr,
+    float const *bias_ptr,
+    int num_tokens,
+    cudaStream_t stream);
+
+template void Kernels::IncMultiHeadAttention::compute_o_prod_bias<half>(
+    IncMultiHeadSelfAttentionMeta const *m,
+    BatchConfig const *bc,
+    int shard_id,
+    half *output_ptr,
+    half const *weight_ptr,
+    half const *bias_ptr,
+    int num_tokens,
+    cudaStream_t stream);
 }; // namespace FlexFlow

From ed5a2e07fdc9285612f167c150f8d138e51895f7 Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Mon, 25 Dec 2023 12:17:48 -0500
Subject: [PATCH 271/344] init

---
 include/flexflow/batch_config.h               |  12 +
 include/flexflow/config.h                     |   9 +
 include/flexflow/ffconst.h                    |   1 +
 include/flexflow/model.h                      |  45 +
 include/flexflow/operator_params.h            |   2 +
 .../specinfer_inc_multihead_self_attention.h  | 150 +++
 ...nfer_inc_multihead_self_attention_params.h |  33 +
 include/flexflow/request_manager.h            |  14 +-
 inference/file_loader.cc                      |   3 +-
 inference/models/llama.cc                     |   5 +-
 inference/spec_infer/spec_infer.cc            |   3 +
 src/ops/inc_multihead_self_attention.cpp      |  19 +
 src/ops/inc_multihead_self_attention.cu       |  61 +-
 .../specinfer_inc_multihead_self_attention.cc | 883 +++++++++++++++++
 .../specinfer_inc_multihead_self_attention.cu | 890 ++++++++++++++++++
 src/ops/tree_inc_multihead_self_attention.cu  |  24 +-
 src/runtime/ffconst_utils.cc                  |   2 +
 src/runtime/graph.cc                          |  71 +-
 src/runtime/inference_manager.cc              |  13 +-
 src/runtime/model.cc                          | 149 ++-
 src/runtime/model.cpp                         |  48 +
 src/runtime/model.cu                          |  28 +-
 src/runtime/request_manager.cc                | 250 +++--
 src/runtime/request_manager.cpp               |  16 +
 src/runtime/request_manager.cu                |  50 +
 25 files changed, 2589 insertions(+), 192 deletions(-)
 create mode 100644 include/flexflow/ops/specinfer_inc_multihead_self_attention.h
 create mode 100644 include/flexflow/ops/specinfer_inc_multihead_self_attention_params.h
 create mode 100644 src/ops/specinfer_inc_multihead_self_attention.cc
 create mode 100644 src/ops/specinfer_inc_multihead_self_attention.cu

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index e2903c4d11..c33c3558cc 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -129,6 +129,9 @@ class BeamSearchBatchConfig : public BatchConfig {
   inline static int const MAX_BEAM_WIDTH = 1;
   inline static int const MAX_BEAM_DEPTH = 8;
 
+  // maximum tree branches for a request
+  inline static int const MAX_SPECULATIVE_TREE_BRANCHES = 9;
+
   int model_id;
 
   struct BeamSearchPerRequestInfo {
@@ -139,14 +142,23 @@ class BeamSearchBatchConfig : public BatchConfig {
     BatchConfig::TokenId tokens[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
     float probs[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
     int parent_id[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
+    int sub_request_num;
   };
 
   struct BeamSearchPerTokenInfo {
     int sub_request_index;
   };
 
+  struct SpecInferTopology {
+    int real_token_pos[MAX_SPECULATIVE_TREE_BRANCHES][MAX_NUM_TOKENS];
+    int allocated_tokens;
+  };
+
+
   BeamSearchPerRequestInfo beamRequestsInfo[MAX_NUM_REQUESTS];
   BeamSearchPerTokenInfo beamTokenInfo[MAX_NUM_TOKENS * MAX_BEAM_WIDTH];
+  SpecInferTopology topology_mask[MAX_NUM_REQUESTS];
+
   // why is this == MAX_NUM_REQUESTS * MAX_BEAM_WIDTH?
   int sub_requests[MAX_NUM_REQUESTS * MAX_BEAM_WIDTH];
 
diff --git a/include/flexflow/config.h b/include/flexflow/config.h
index c2af6d707c..321d14961b 100644
--- a/include/flexflow/config.h
+++ b/include/flexflow/config.h
@@ -16,6 +16,7 @@
 #ifndef _FLEXFLOW_CONFIG_H_
 #define _FLEXFLOW_CONFIG_H_
 #include "ffconst.h"
+#include "flexflow/batch_config.h"
 #include "legion.h"
 #include <cstring>
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
@@ -75,6 +76,14 @@ struct FFHandler {
 #endif
   void *workSpace;
   size_t workSpaceSize;
+  void *batch_config_metadata;
+
+  // request info + token info + topolopgy mask info
+  size_t batch_config_metadata_size =
+      sizeof(BatchConfig::tokensInfo) + sizeof(BatchConfig::requestsInfo) +
+      sizeof(BeamSearchBatchConfig::topology_mask) +
+      sizeof(BeamSearchBatchConfig::beamTokenInfo) +
+      sizeof(BeamSearchBatchConfig::beamRequestsInfo);
   void *offload_reserve_space;
   size_t offload_reserve_space_size;
   DataType quantization_type;
diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index 512645e624..ef0003b08e 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -171,6 +171,7 @@ enum OperatorType {
   OP_INC_MULTIHEAD_SELF_ATTENTION,
   OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION,
   OP_TREE_INC_MULTIHEAD_SELF_ATTENTION,
+  OP_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION,
   OP_SAMPLING,
   // Parallel Ops
   OP_REPARTITION,
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index d8402ba622..3602cb108b 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -172,6 +172,8 @@ enum TaskIDs {
   SPEC_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
   TREE_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
   TREE_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
+  SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
+  SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
   MSELOSS_BWD_TASK_ID,
   FUSEDOP_INIT_TASK_ID,
   FUSEDOP_FWD_TASK_ID,
@@ -324,6 +326,7 @@ class Linear;
 class MultiHeadAttention;
 class IncMultiHeadSelfAttention;
 class TreeIncMultiHeadSelfAttention;
+class SpecInferIncMultiHeadSelfAttention;
 class Pool2D;
 class Reduce;
 class Reshape;
@@ -743,6 +746,25 @@ class FFModel {
       bool qk_prod_scaling = true,
       bool position_bias = false,
       char const *name = NULL);
+
+Tensor specinfer_inc_multihead_self_attention(
+      const Tensor input,
+      int embed_dim,
+      int num_heads,
+      int kdim = 0,
+      int vdim = 0,
+      float dropout = 0.0f,
+      bool bias = false,
+      bool add_bias_kv = false,
+      bool add_zero_attn = false,
+      DataType data_type = DT_NONE,
+      Initializer *kernel_initializer = NULL,
+      bool apply_rotary_embedding = false,
+      bool scaling_query = false,
+      float scaling_factor = 1.0f,
+      bool qk_prod_scaling = true,
+      bool position_bias = false,
+      char const *name = NULL);
   Tensor inc_multiquery_self_attention(const Tensor input,
                                        int embed_dim,
                                        int num_q_heads,
@@ -799,6 +821,26 @@ class FFModel {
       bool qk_prod_scaling = true,
       bool position_bias = false,
       char const *name = NULL);
+
+  Tensor specinfer_inc_multiquery_self_attention(
+      const Tensor input,
+      int embed_dim,
+      int num_q_heads,
+      int num_kv_heads,
+      int kdim = 0,
+      int vdim = 0,
+      float dropout = 0.0f,
+      bool bias = false,
+      bool add_bias_kv = false,
+      bool add_zero_attn = false,
+      DataType data_type = DT_NONE,
+      Initializer *kernel_initializer = NULL,
+      bool apply_rotary_embedding = false,
+      bool scaling_query = false,
+      float scaling_factor = 1.0f,
+      bool qk_prod_scaling = true,
+      bool position_bias = false,
+      char const *name = NULL);
   // ========================================
   // Inference APIs
   // ========================================
@@ -1200,6 +1242,9 @@ class FFModel {
       std::unordered_map<
           std::pair<ParallelTensorShape, TreeIncMultiHeadSelfAttentionParams>,
           TreeIncMultiHeadSelfAttention *>,
+      std::unordered_map<
+          std::pair<ParallelTensorShape, SpecInferIncMultiHeadSelfAttentionParams>,
+          SpecInferIncMultiHeadSelfAttention *>,
       std::unordered_map<std::pair<ParallelTensorShape, ReduceParams>,
                          Reduce *>,
       std::unordered_map<std::pair<ParallelTensorShape, ReshapeParams>,
diff --git a/include/flexflow/operator_params.h b/include/flexflow/operator_params.h
index 5b187839ef..cee2ae95a4 100644
--- a/include/flexflow/operator_params.h
+++ b/include/flexflow/operator_params.h
@@ -37,6 +37,7 @@
 #include "flexflow/ops/topk_params.h"
 #include "flexflow/ops/transpose_params.h"
 #include "flexflow/ops/tree_inc_multihead_self_attention_params.h"
+#include "flexflow/ops/specinfer_inc_multihead_self_attention_params.h"
 #include "flexflow/parallel_ops/allreduce_params.h"
 #include "flexflow/parallel_ops/combine_params.h"
 #include "flexflow/parallel_ops/fused_parallel_op_params.h"
@@ -72,6 +73,7 @@ using OperatorParameters = mp::variant<AggregateParams,
                                        BeamTopKParams,
                                        SpecIncMultiHeadSelfAttentionParams,
                                        TreeIncMultiHeadSelfAttentionParams,
+                                       SpecInferIncMultiHeadSelfAttentionParams,
                                        RMSNormParams,
                                        ResidualRMSNormParams,
                                        Pool2DParams,
diff --git a/include/flexflow/ops/specinfer_inc_multihead_self_attention.h b/include/flexflow/ops/specinfer_inc_multihead_self_attention.h
new file mode 100644
index 0000000000..6e5dc73b5c
--- /dev/null
+++ b/include/flexflow/ops/specinfer_inc_multihead_self_attention.h
@@ -0,0 +1,150 @@
+#ifndef _FLEXFLOW_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_H
+#define _FLEXFLOW_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_H
+
+#include "flexflow/accessor.h"
+#include "flexflow/device.h"
+#include "flexflow/fftype.h"
+#include "flexflow/inference.h"
+#include "flexflow/layer.h"
+#include "flexflow/node.h"
+#include "flexflow/op_meta.h"
+#include "flexflow/operator.h"
+#include "flexflow/ops/inc_multihead_self_attention.h"
+#include "flexflow/ops/specinfer_inc_multihead_self_attention_params.h"
+#include "math.h"
+#include <cfloat>
+#include <complex>
+
+namespace FlexFlow {
+
+class SpecInferIncMultiHeadSelfAttentionMeta;
+
+class SpecInferIncMultiHeadSelfAttention : public Op {
+public:
+  using Params = SpecInferIncMultiHeadSelfAttentionParams;
+  using Input = ParallelTensor;
+
+  SpecInferIncMultiHeadSelfAttention(FFModel &model,
+                                LayerID const &layer_guid,
+                                const ParallelTensor _input,
+                                int _embed_dim,
+                                int _num_q_heads,
+                                int _num_kv_heads,
+                                int _kdim,
+                                int _vdim,
+                                float _dropout,
+                                bool _qkv_bias,
+                                bool _final_bias,
+                                bool _add_zero_attn,
+                                bool _apply_rotary_embedding,
+                                bool _scaling_query,
+                                float _scaling_factor,
+                                bool _qk_prod_scaling,
+                                bool _position_bias,
+                                bool allocate_weights,
+                                char const *name);
+  SpecInferIncMultiHeadSelfAttention(FFModel &model,
+                                const ParallelTensor _input,
+                                const ParallelTensor _weight,
+                                int _embed_dim,
+                                int _num_q_heads,
+                                int _num_kv_heads,
+                                int _kdim,
+                                int _vdim,
+                                float _dropout,
+                                bool _qkv_bias,
+                                bool _final_bias,
+                                bool _add_zero_attn,
+                                bool _apply_rotary_embedding,
+                                bool _scaling_query,
+                                float _scaling_factor,
+                                bool _qk_prod_scaling,
+                                bool _position_bias,
+                                bool allocate_weights,
+                                char const *name);
+  SpecInferIncMultiHeadSelfAttention(FFModel &model,
+                                SpecInferIncMultiHeadSelfAttention const &other,
+                                const ParallelTensor input,
+                                bool allocate_weights);
+  SpecInferIncMultiHeadSelfAttention(FFModel &model,
+                                Params const &params,
+                                Input const &inputs,
+                                bool allocate_weights = false,
+                                char const *name = nullptr);
+  static Op *
+      create_operator_from_layer(FFModel &model,
+                                 Layer const *layer,
+                                 std::vector<ParallelTensor> const &inputs);
+  void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
+  void forward(FFModel const &) override;
+  void backward(FFModel const &) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfigFuture const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
+  void print_layer(FFModel const &model) override {
+    assert(0);
+  }
+  bool get_int_parameter(PMParameter, int *) const override;
+
+  static OpMeta *init_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
+  Op *materialize(FFModel &ff,
+                  ParallelTensor inputs[],
+                  int num_inputs) const override;
+  bool measure_operator_cost(Simulator *sim,
+                             MachineView const &mv,
+                             CostMetrics &cost_metrics) const override;
+
+  static void
+      inference_kernel_wrapper(SpecInferIncMultiHeadSelfAttentionMeta const *m,
+                               BeamSearchBatchConfig const *bc,
+                               int shard_id,
+                               GenericTensorAccessorR const &input,
+                               GenericTensorAccessorR const &weight,
+                               GenericTensorAccessorW const &output,
+                               GenericTensorAccessorR const &bias);
+  Params get_params() const;
+
+public:
+  int num_q_heads, num_kv_heads, tensor_parallelism_degree;
+  float dropout, scaling_factor;
+  bool qkv_bias;
+  bool final_bias, add_zero_attn, apply_rotary_embedding, scaling_query,
+      qk_prod_scaling, position_bias;
+  int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
+  int qoSeqLength, kvSeqLength;
+};
+
+class SpecInferIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
+public:
+  SpecInferIncMultiHeadSelfAttentionMeta(FFHandler handler,
+                                    SpecInferIncMultiHeadSelfAttention const *attn,
+                                    GenericTensorAccessorR const &weight,
+                                    MemoryAllocator &gpu_mem_allocator,
+                                    int num_samples,
+                                    int _num_q_heads,
+                                    int _num_kv_heads);
+  ~SpecInferIncMultiHeadSelfAttentionMeta(void);
+
+public:
+  Realm::RegionInstance beam_search_reserve_inst;
+  BeamSearchBatchConfig::BeamSearchPerTokenInfo *beam_token_infos;
+  BeamSearchBatchConfig::BeamSearchPerRequestInfo *beam_request_infos;
+  BeamSearchBatchConfig::SpecInferTopology *beam_topology_mask;
+};
+
+}; // namespace FlexFlow
+
+#endif // _FLEXFLOW_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_H
diff --git a/include/flexflow/ops/specinfer_inc_multihead_self_attention_params.h b/include/flexflow/ops/specinfer_inc_multihead_self_attention_params.h
new file mode 100644
index 0000000000..b57b06a7f7
--- /dev/null
+++ b/include/flexflow/ops/specinfer_inc_multihead_self_attention_params.h
@@ -0,0 +1,33 @@
+#ifndef _FLEXFLOW_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_PARAMS_H
+#define _FLEXFLOW_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_PARAMS_H
+
+#include "flexflow/ffconst.h"
+#include "flexflow/fftype.h"
+#include "flexflow/parallel_tensor.h"
+
+namespace FlexFlow {
+
+struct SpecInferIncMultiHeadSelfAttentionParams {
+  LayerID layer_guid;
+  int embed_dim, num_q_heads, num_kv_heads, kdim, vdim;
+  float dropout, scaling_factor;
+  bool qkv_bias, final_bias, add_zero_attn, apply_rotary_embedding,
+      scaling_query, qk_prod_scaling, position_bias;
+
+  bool is_valid(ParallelTensorShape const &) const;
+};
+
+bool operator==(SpecInferIncMultiHeadSelfAttentionParams const &,
+                SpecInferIncMultiHeadSelfAttentionParams const &);
+
+} // namespace FlexFlow
+
+namespace std {
+template <>
+struct hash<FlexFlow::SpecInferIncMultiHeadSelfAttentionParams> {
+  size_t
+      operator()(FlexFlow::SpecInferIncMultiHeadSelfAttentionParams const &) const;
+};
+} // namespace std
+
+#endif // _FLEXFLOW_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_PARAMS_H
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index baf6844801..e67888d2d6 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -38,7 +38,8 @@ class InferenceManager {
   Legion::FutureMap
       inference(FFModel *model, int index, BatchConfigFuture const &bc);
   void load_input_tokens_from_batch_config(BatchConfigFuture const &bc,
-                                           ParallelTensor const input);
+                                           ParallelTensor const input,
+                                           FFHandler *handlers);
   void load_positions(BatchConfigFuture const &bc,
                       ParallelTensor position_input,
                       int offset);
@@ -72,9 +73,10 @@ struct Request {
 struct BeamTree {
   struct treeLayer {
     BeamSearchBatchConfig::TokenId
-        tokens[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
+        tokens[BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES];
     int parent_ids[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
-    float probs[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
+    float probs[BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES];
+    int nodes_num_this_layer = 0;
   };
   treeLayer treeLayers[BeamSearchBatchConfig::MAX_BEAM_DEPTH + 1];
 };
@@ -100,6 +102,7 @@ class RequestManager {
   void set_max_tokens_per_batch(int max_num_tokens);
   int get_max_tokens_per_batch();
   void set_max_sequence_length(int max_seq_length);
+  void push_spec_infer_tree_width(int tree_width);
   int get_max_sequence_length();
   int register_ssm_model(FFModel *model);
   void register_tokenizer(ModelType model_type,
@@ -148,6 +151,7 @@ class RequestManager {
   void store_beam_metadata(BeamSearchBatchConfig const &old_bc,
                            BeamInferenceResult const &result);
   void update_beam_metadata(BeamSearchBatchConfig &new_bc,
+                            BeamSearchBatchConfig const &old_bc,
                             BeamTree &tree,
                             int request_index);
 
@@ -210,6 +214,7 @@ class RequestManager {
   int max_requests_per_batch;
   int max_tokens_per_batch;
   int max_sequence_length;
+  std::vector<int> spec_infer_tree_width;
   // private fields
   std::unique_ptr<Tokenizer> tokenizer_;
   bool verbose;
@@ -243,7 +248,8 @@ class RequestManager {
 
 private:
   struct ProfileInfo {
-    int decoding_steps;
+    int llm_decoding_steps;
+    int ssm_decoding_steps;
     double start_time, finish_time;
   };
   std::unordered_map<RequestGuid, ProfileInfo> profiling_requests;
diff --git a/inference/file_loader.cc b/inference/file_loader.cc
index 7c6870d439..3f70ddf488 100644
--- a/inference/file_loader.cc
+++ b/inference/file_loader.cc
@@ -726,7 +726,8 @@ void FileDataLoader::load_single_weight_tensor(FFModel *ff,
 
   if (l->op_type == OP_INC_MULTIHEAD_SELF_ATTENTION ||
       l->op_type == OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION ||
-      l->op_type == OP_TREE_INC_MULTIHEAD_SELF_ATTENTION) {
+      l->op_type == OP_TREE_INC_MULTIHEAD_SELF_ATTENTION ||
+      l->op_type == OP_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION) {
     if (weight_filename.find("self_attention") != std::string::npos) {
       load_attention_weights_multi_query(
           data, weight_filename, weights_folder, hidden_dim, num_heads);
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index b8fe70526d..f62df1b1d7 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -90,7 +90,7 @@ void LLAMA::create_llama_model(FFModel &ff,
     Tensor mha;
     switch (mode) {
       case BEAM_SEARCH_MODE: {
-        mha = ff.spec_inc_multihead_self_attention(
+        mha = ff.specinfer_inc_multihead_self_attention(
             att_norm,
             llama_config.hidden_size,
             llama_config.num_attention_heads,
@@ -246,7 +246,8 @@ void LLAMA::create_llama_model(FFModel &ff,
   if (mode == BEAM_SEARCH_MODE) {
     Tensor softmax = ff.softmax(dense, -1);
     // output = ff.beam_top_k(softmax, llama_config.max_beam_width, false);
-    output = ff.argmax(softmax, /*beam_Search*/ true);
+    // output = ff.argmax(softmax, /*beam_Search*/ true);
+    output = ff.beam_top_k(softmax, llama_config.max_beam_width, false);
   } else {
     // Tensor softmax = ff.softmax(dense, -1);
     if (generation_config.do_sample) {
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 8b0eb926d9..e2594ba87f 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -302,6 +302,9 @@ void FlexFlow::top_level_task(Task const *task,
                          model_metadata.llm_tokenizer_path);
   rm->register_output_filepath(file_paths.output_file_path);
 
+  //first decoding step: 3 results
+  rm->push_spec_infer_tree_width(1);
+
   // Create LLM model
   FFModel tree_model(ffconfig, ffconfig.cpu_offload);
   if (model_metadata.llm_model_type == ModelType::LLAMA) {
diff --git a/src/ops/inc_multihead_self_attention.cpp b/src/ops/inc_multihead_self_attention.cpp
index d60386f927..a59740f4a3 100644
--- a/src/ops/inc_multihead_self_attention.cpp
+++ b/src/ops/inc_multihead_self_attention.cpp
@@ -1098,4 +1098,23 @@ template void Kernels::IncMultiHeadAttention::pre_build_weight_kernel<half>(
     DataType data_type,
     hipStream_t stream);
 
+template void Kernels::IncMultiHeadAttention::compute_o_prod_bias<float>(
+    IncMultiHeadSelfAttentionMeta const *m,
+    BatchConfig const *bc,
+    int shard_id,
+    float *output_ptr,
+    float const *weight_ptr,
+    float const *bias_ptr,
+    int num_tokens,
+    cudaStream_t stream);
+template void Kernels::IncMultiHeadAttention::compute_o_prod_bias<half>(
+    IncMultiHeadSelfAttentionMeta const *m,
+    BatchConfig const *bc,
+    int shard_id,
+    half *output_ptr,
+    half const *weight_ptr,
+    half const *bias_ptr,
+    int num_tokens,
+    cudaStream_t stream);
+
 }; // namespace FlexFlow
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 695f4b13b9..4c184acb3c 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -826,17 +826,17 @@ void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
   }
 
   // todo Xinhao copy how many requests if requests are not continous?
-  cudaMemcpyAsync(m->token_infos,
-                  &(bc->tokensInfo),
-                  bc->num_active_tokens() * sizeof(BatchConfig::PerTokenInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
-  cudaMemcpyAsync(m->request_infos,
-                  &(bc->requestsInfo),
-                  bc->max_requests_per_batch() *
-                      sizeof(BatchConfig::PerRequestInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
+  // cudaMemcpyAsync(m->token_infos,
+  //                 &(bc->tokensInfo),
+  //                 bc->num_active_tokens() *
+  //                 sizeof(BatchConfig::PerTokenInfo), cudaMemcpyHostToDevice,
+  //                 stream);
+  // cudaMemcpyAsync(m->request_infos,
+  //                 &(bc->requestsInfo),
+  //                 bc->max_requests_per_batch() *
+  //                     sizeof(BatchConfig::PerRequestInfo),
+  //                 cudaMemcpyHostToDevice,
+  //                 stream);
 
   // phase 1: Implement kernel to compute KQV for input tokens
   compute_qkv_kernel(m,
@@ -1375,14 +1375,15 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
         break;
       }
       case BEAM_SEARCH_MODE: {
+        // a K-ary tree max node is (k^n - 1) / 2
         key_cache_size = num_q_heads * kProjSize *
                          BeamSearchBatchConfig::max_requests_per_batch() *
                          BatchConfig::max_sequence_length() *
-                         BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+                         BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES;
         value_cache_size = num_q_heads * vProjSize *
                            BeamSearchBatchConfig::max_requests_per_batch() *
                            BatchConfig::max_sequence_length() *
-                           BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+                           BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES;
         break;
       }
       default:
@@ -1400,10 +1401,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
         (qkv_max_proj_size + key_cache_size + value_cache_size +
          2 * qk_prod_size + attn_heads_size) *
             size_of_dt +
-        tokeninfo_size * sizeof(BatchConfig::PerTokenInfo) +
-        complex_size * sizeof(cuFloatComplex) +
-        requestinfo_size *
-            sizeof(BatchConfig::PerRequestInfo); // more components will
+        complex_size * sizeof(cuFloatComplex); // more components will
                                                  // be added here later
     if (offload) {
       // assert that we have enough reserved work space left
@@ -1447,10 +1445,15 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     valueCache = gpu_mem_allocator.allocate_instance_untyped(value_cache_size *
                                                              size_of_dt);
 
+    token_infos =
+        static_cast<BatchConfig::PerTokenInfo *>(handler.batch_config_metadata);
+    request_infos = static_cast<BatchConfig::PerRequestInfo *>(
+        handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo));
+
     if (offload) {
-      token_infos =
-          gpu_mem_allocator.allocate_reserved<BatchConfig::PerTokenInfo>(
-              tokeninfo_size);
+      // token_infos =
+      //     gpu_mem_allocator.allocate_reserved<BatchConfig::PerTokenInfo>(
+      //         tokeninfo_size);
       // offset += sizeof(BatchConfig::PerTokenInfo) * tokeninfo_size;
       qk_prods = gpu_mem_allocator.allocate_reserved_untyped(qk_prod_size *
                                                              size_of_dt);
@@ -1464,13 +1467,13 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
       complex_input =
           gpu_mem_allocator.allocate_reserved<cuFloatComplex>(complex_size);
       // offset += complex_size * sizeof(cuFloatComplex);
-      request_infos =
-          gpu_mem_allocator.allocate_reserved<BatchConfig::PerRequestInfo>(
-              requestinfo_size);
+      // request_infos =
+      //     gpu_mem_allocator.allocate_reserved<BatchConfig::PerRequestInfo>(
+      //         requestinfo_size);
     } else {
-      token_infos =
-          gpu_mem_allocator.allocate_instance<BatchConfig::PerTokenInfo>(
-              tokeninfo_size);
+      // token_infos =
+      //     gpu_mem_allocator.allocate_instance<BatchConfig::PerTokenInfo>(
+      //         tokeninfo_size);
       qk_prods = gpu_mem_allocator.allocate_instance_untyped(qk_prod_size *
                                                              size_of_dt);
       qk_prods_softmax = gpu_mem_allocator.allocate_instance_untyped(
@@ -1479,9 +1482,9 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
                                                                size_of_dt);
       complex_input =
           gpu_mem_allocator.allocate_instance<cuFloatComplex>(complex_size);
-      request_infos =
-          gpu_mem_allocator.allocate_instance<BatchConfig::PerRequestInfo>(
-              requestinfo_size);
+      // request_infos =
+      //     gpu_mem_allocator.allocate_instance<BatchConfig::PerRequestInfo>(
+      //         requestinfo_size);
     }
 
     // allocate more size for quantization data
diff --git a/src/ops/specinfer_inc_multihead_self_attention.cc b/src/ops/specinfer_inc_multihead_self_attention.cc
new file mode 100644
index 0000000000..42074f39e4
--- /dev/null
+++ b/src/ops/specinfer_inc_multihead_self_attention.cc
@@ -0,0 +1,883 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/specinfer_inc_multihead_self_attention.h"
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/model.h"
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+#include "flexflow/utils/cuda_helper.h"
+#else
+#include "flexflow/utils/hip_helper.h"
+#endif
+#include "flexflow/utils/hash_utils.h"
+#include "legion/legion_utilities.h"
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::ArgumentMap;
+using Legion::Context;
+using Legion::coord_t;
+using Legion::Domain;
+using Legion::Future;
+using Legion::FutureMap;
+using Legion::IndexLauncher;
+using Legion::Machine;
+using Legion::Memory;
+using Legion::PhysicalRegion;
+using Legion::Predicate;
+using Legion::Rect;
+using Legion::RegionRequirement;
+using Legion::Runtime;
+using Legion::Task;
+using Legion::TaskArgument;
+using Legion::TaskLauncher;
+using PCG::Node;
+
+bool SpecInferIncMultiHeadSelfAttentionParams::is_valid(
+    ParallelTensorShape const &input) const {
+  bool is_valid = input.is_valid();
+  return is_valid;
+}
+
+Tensor FFModel::specinfer_inc_multihead_self_attention(
+    Tensor const input,
+    int embed_dim,
+    int num_heads,
+    int kdim,
+    int vdim,
+    float dropout,
+    bool qkv_bias,
+    bool final_bias,
+    bool add_zero_attn,
+    DataType data_type,
+    Initializer *kernel_initializer,
+    bool apply_rotary_embedding,
+    bool scaling_query,
+    float scaling_factor,
+    bool qk_prod_scaling,
+    bool position_bias,
+    char const *name) {
+  return specinfer_inc_multiquery_self_attention(input,
+                                                 embed_dim,
+                                                 num_heads,
+                                                 num_heads,
+                                                 kdim,
+                                                 vdim,
+                                                 dropout,
+                                                 qkv_bias,
+                                                 final_bias,
+                                                 add_zero_attn,
+                                                 data_type,
+                                                 kernel_initializer,
+                                                 apply_rotary_embedding,
+                                                 scaling_query,
+                                                 scaling_factor,
+                                                 qk_prod_scaling,
+                                                 position_bias,
+                                                 name);
+}
+
+Tensor FFModel::specinfer_inc_multiquery_self_attention(
+    Tensor const input,
+    int embed_dim,
+    int num_q_heads,
+    int num_kv_heads,
+    int kdim,
+    int vdim,
+    float dropout,
+    bool qkv_bias,
+    bool final_bias,
+    bool add_zero_attn,
+    DataType data_type,
+    Initializer *kernel_initializer,
+    bool apply_rotary_embedding,
+    bool scaling_query,
+    float scaling_factor,
+    bool qk_prod_scaling,
+    bool position_bias,
+    char const *name) {
+  if (data_type == DT_NONE) {
+    data_type = input->data_type;
+  }
+  Layer *li = nullptr;
+  int weight_num = (qkv_bias || final_bias) ? 2 : 1;
+  if (data_type != input->data_type) {
+    Tensor casted_input = cast(input, data_type, "type cast for IncMHA");
+    li = new Layer(this,
+                   OP_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION,
+                   data_type,
+                   name,
+                   1 /*inputs*/,
+                   weight_num /*weights*/,
+                   1 /*outputs*/,
+                   casted_input);
+  } else {
+    li = new Layer(this,
+                   OP_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION,
+                   data_type,
+                   name,
+                   1 /*inputs*/,
+                   weight_num /*weights*/,
+                   1 /*outputs*/,
+                   input);
+  }
+  {
+    int numdims = input->num_dims;
+    int dims[MAX_TENSOR_DIM];
+    for (int i = 0; i < numdims; i++) {
+      dims[i] = input->dims[i];
+    }
+    dims[0] = embed_dim;
+    li->outputs[0] = create_tensor_legion_ordering(
+        numdims, dims, data_type, li, 0, true /*create_grad*/);
+  }
+  // Compute weight size
+  int qProjSize = kdim, kProjSize = kdim, vProjSize = kdim,
+      oProjSize = embed_dim;
+  int qSize = input->dims[0], kSize = input->dims[0], vSize = input->dims[0];
+  int qParas = qProjSize * qSize;
+  int kParas = kProjSize * kSize;
+  int vParas = vProjSize * vSize;
+  int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
+  int weight_size = qParas * num_q_heads + kParas * num_q_heads +
+                    vParas * num_q_heads + oParas * num_q_heads;
+  {
+    int dims[1] = {weight_size};
+    li->weights[0] = create_weight_legion_ordering(1,
+                                                   dims,
+                                                   data_type,
+                                                   li,
+                                                   true /*create_grad*/,
+                                                   kernel_initializer,
+                                                   CHOSEN_SYNC_TYPE);
+  }
+  if (qkv_bias || final_bias) {
+    // q, k, v, o
+    int qkv_bias_size =
+        qProjSize * num_q_heads + (kProjSize + vProjSize) * num_q_heads;
+    int dims[1] = {(qkv_bias ? qkv_bias_size : 0) +
+                   (final_bias ? oProjSize : 0)};
+    li->weights[1] = create_weight_legion_ordering(1,
+                                                   dims,
+                                                   data_type,
+                                                   li,
+                                                   true /*create_grad*/,
+                                                   kernel_initializer,
+                                                   CHOSEN_SYNC_TYPE);
+  }
+  li->data_type = data_type;
+  li->add_int_property("embed_dim", embed_dim);
+  li->add_int_property("num_q_heads", num_q_heads);
+  li->add_int_property("num_kv_heads", num_kv_heads);
+  li->add_int_property("kdim", kdim);
+  li->add_int_property("vdim", vdim);
+  li->add_int_property("qkv_bias", qkv_bias);
+  li->add_int_property("final_bias", final_bias);
+  li->add_int_property("add_zero_attn", add_zero_attn);
+  li->add_float_property("dropout", dropout);
+  li->add_int_property("apply_rotary_embedding", apply_rotary_embedding);
+  li->add_int_property("scaling_query", scaling_query);
+  li->add_float_property("scaling_factor", scaling_factor);
+  li->add_int_property("qk_prod_scaling", qk_prod_scaling);
+  li->add_int_property("position_bias", position_bias);
+  layers.push_back(li);
+  return li->outputs[0];
+}
+
+Op *SpecInferIncMultiHeadSelfAttention::create_operator_from_layer(
+    FFModel &model,
+    Layer const *layer,
+    std::vector<ParallelTensor> const &inputs) {
+
+  std::cout << "spec create operator: " << layer->name << "\n";
+  long long value;
+  layer->get_int_property("embed_dim", value);
+  int embed_dim = value;
+  layer->get_int_property("num_q_heads", value);
+  int num_q_heads = value;
+  layer->get_int_property("num_kv_heads", value);
+  int num_kv_heads = value;
+  layer->get_int_property("kdim", value);
+  int kdim = value;
+  layer->get_int_property("vdim", value);
+  int vdim = value;
+  float dropout;
+  layer->get_float_property("dropout", dropout);
+  layer->get_int_property("qkv_bias", value);
+  bool qkv_bias = (bool)value;
+  layer->get_int_property("final_bias", value);
+  bool final_bias = (bool)value;
+  layer->get_int_property("add_zero_attn", value);
+  bool add_zero_attn = (bool)value;
+  layer->get_int_property("apply_rotary_embedding", value);
+  bool apply_rotary_embedding = (bool)value;
+  layer->get_int_property("scaling_query", value);
+  bool scaling_query = (bool)value;
+  float scaling_factor;
+  layer->get_float_property("scaling_factor", scaling_factor);
+  layer->get_int_property("qk_prod_scaling", value);
+  bool qk_prod_scaling = (bool)value;
+  layer->get_int_property("position_bias", value);
+  bool position_bias = (bool)value;
+
+  return new SpecInferIncMultiHeadSelfAttention(model,
+                                                layer->layer_guid,
+                                                inputs[0],
+                                                embed_dim,
+                                                num_q_heads,
+                                                num_kv_heads,
+                                                kdim,
+                                                vdim,
+                                                dropout,
+                                                qkv_bias,
+                                                final_bias,
+                                                add_zero_attn,
+                                                apply_rotary_embedding,
+                                                scaling_query,
+                                                scaling_factor,
+                                                qk_prod_scaling,
+                                                position_bias,
+                                                false /*allocate_weights*/,
+                                                layer->name);
+}
+
+SpecInferIncMultiHeadSelfAttention::SpecInferIncMultiHeadSelfAttention(
+    FFModel &model,
+    LayerID const &_layer_guid,
+    ParallelTensor const _input,
+    int _embed_dim,
+    int _num_q_heads,
+    int _num_kv_heads,
+    int _kdim,
+    int _vdim,
+    float _dropout,
+    bool _qkv_bias,
+    bool _final_bias,
+    bool _add_zero_attn,
+    bool _apply_rotary_embedding,
+    bool _scaling_query,
+    float _scaling_factor,
+    bool _qk_prod_scaling,
+    bool _position_bias,
+    bool allocate_weights,
+    char const *name)
+    // Initializer* _bias_initializer)
+    : Op(model,
+         OP_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION,
+         _input->data_type,
+         name,
+         1 /*inputs*/,
+         (_qkv_bias || _final_bias ? 2 : 1) /*weights*/,
+         1 /*outputs*/,
+         _input),
+      num_q_heads(_num_q_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
+      qkv_bias(_qkv_bias), final_bias(_final_bias),
+      add_zero_attn(_add_zero_attn),
+      apply_rotary_embedding(_apply_rotary_embedding),
+      qSize(_input->dims[0].size), kSize(_input->dims[0].size),
+      vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
+      vProjSize(_vdim), oProjSize(_embed_dim),
+      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
+      scaling_query(_scaling_query), scaling_factor(_scaling_factor),
+      qk_prod_scaling(_qk_prod_scaling), position_bias(_position_bias) {
+  // overwrite layer_guid
+  layer_guid = _layer_guid;
+
+  numOutputs = 1;
+  int numdim = _input->num_dims;
+  ParallelDim dims[MAX_TENSOR_DIM];
+  for (int i = 0; i < numdim; i++) {
+    dims[i] = _input->dims[i];
+  }
+  dims[0].size = _embed_dim;
+  // Currently require no parallelism along this dim
+  assert(dims[0].degree == 1);
+  if (allocate_weights) {
+    // Create weight tensor
+    int num_dims = inputs[0]->num_dims;
+    // Compute weight size
+    int qParas = this->qProjSize * this->qSize;
+    int kParas = this->kProjSize * this->kSize;
+    int vParas = this->vProjSize * this->vSize;
+    int oParas =
+        this->oProjSize * (this->vProjSize > 0 ? this->vProjSize : this->vSize);
+    ParallelDim dims[2];
+    dims[0] = inputs[0]->dims[num_dims - 2];
+    dims[0].size = dims[0].degree;
+    dims[1] = inputs[0]->dims[num_dims - 1];
+    dims[1].size = this->num_q_heads * (qParas + oParas) +
+                   this->num_q_heads * (kParas + vParas);
+    dims[1].is_replica_dim = false;
+    int seed = std::rand();
+    Initializer *initializer = new GlorotUniform(seed);
+    weights[0] = model.create_parallel_weight<2>(dims,
+                                                 this->data_type,
+                                                 NULL /*owner_op*/,
+                                                 true /*create_grad*/,
+                                                 initializer,
+                                                 CHOSEN_SYNC_TYPE);
+    if (qkv_bias || final_bias) {
+      ParallelTensorShape bias_shape = _input->get_shape();
+      int qkv_bias_size =
+          qProjSize * num_q_heads + (kProjSize + vProjSize) * num_q_heads;
+      bias_shape.dims[0].size =
+          (qkv_bias ? qkv_bias_size : 0) + (final_bias ? oProjSize : 0);
+      bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
+      weights[1] =
+          model.create_parallel_weight_legion_ordering(bias_shape.num_dims,
+                                                       bias_shape.dims,
+                                                       this->data_type,
+                                                       nullptr /*owner_op*/,
+                                                       true /*create_grad*/,
+                                                       initializer,
+                                                       CHOSEN_SYNC_TYPE);
+    }
+  }
+
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      _input->num_dims, dims, this->data_type, this);
+  /* for (int i = 0; i < numdim; i++) { */
+  /*   register_output_input_parallel_dims(outputs[0], i, inputs[0], i); */
+  /* } */
+  /* // Check correctness */
+  /* assert(check_output_input_weight_parallel_dims()); */
+}
+
+SpecInferIncMultiHeadSelfAttention::SpecInferIncMultiHeadSelfAttention(
+    FFModel &model,
+    ParallelTensor const _input,
+    ParallelTensor const _weight,
+    int _embed_dim,
+    int _num_q_heads,
+    int _num_kv_heads,
+    int _kdim,
+    int _vdim,
+    float _dropout,
+    bool _qkv_bias,
+    bool _final_bias,
+    bool _add_zero_attn,
+    bool _apply_rotary_embedding,
+    bool _scaling_query,
+    float _scaling_factor,
+    bool _qk_prod_scaling,
+    bool _position_bias,
+    bool allocate_weights,
+    char const *name)
+    // Initializer* _bias_initializer)
+    : Op(model,
+         OP_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION,
+         _input->data_type,
+         name,
+         1 /*inputs*/,
+         (_qkv_bias || _final_bias ? 2 : 1) /*weights*/,
+         1 /*outputs*/,
+         _input,
+         _weight),
+      num_q_heads(_num_q_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
+      qkv_bias(_qkv_bias), final_bias(_final_bias),
+      add_zero_attn(_add_zero_attn),
+      apply_rotary_embedding(_apply_rotary_embedding),
+      qSize(_input->dims[0].size), kSize(_input->dims[0].size),
+      vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
+      vProjSize(_vdim), oProjSize(_embed_dim),
+      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
+      scaling_query(_scaling_query), scaling_factor(_scaling_factor),
+      qk_prod_scaling(_qk_prod_scaling), position_bias(_position_bias)
+// bias_initializer(_bias_initializer)
+{
+  numOutputs = 1;
+  int numdim = _input->num_dims;
+  ParallelDim dims[MAX_TENSOR_DIM];
+  for (int i = 0; i < numdim; i++) {
+    dims[i] = _input->dims[i];
+  }
+  dims[0].size = _embed_dim;
+  // Currently require no parallelism along this dim
+  assert(dims[0].degree == 1);
+  if (allocate_weights) {
+    // Create weight tensor
+    int num_dims = inputs[0]->num_dims;
+    // Compute weight size
+    int qParas = this->qProjSize * this->qSize;
+    int kParas = this->kProjSize * this->kSize;
+    int vParas = this->vProjSize * this->vSize;
+    int oParas =
+        this->oProjSize * (this->vProjSize > 0 ? this->vProjSize : this->vSize);
+    ParallelDim dims[2];
+    dims[0] = inputs[0]->dims[num_dims - 2];
+    dims[0].size = dims[0].degree;
+    dims[1] = inputs[0]->dims[num_dims - 1];
+    dims[1].size = this->num_q_heads * (qParas + oParas) +
+                   this->num_q_heads * (kParas + vParas);
+    dims[1].is_replica_dim = false;
+    // dims[2].size = qParas + kParas + vParas + oParas;
+    int seed = std::rand();
+    Initializer *initializer = new GlorotUniform(seed);
+    weights[0] = model.create_parallel_weight<2>(dims,
+                                                 this->data_type,
+                                                 NULL /*owner_op*/,
+                                                 true /*create_grad*/,
+                                                 initializer,
+                                                 CHOSEN_SYNC_TYPE);
+    if (qkv_bias || final_bias) {
+      ParallelTensorShape bias_shape = _input->get_shape();
+      int qkv_bias_size =
+          qProjSize * num_q_heads + (kProjSize + vProjSize) * num_q_heads;
+      bias_shape.dims[0].size =
+          (qkv_bias ? qkv_bias_size : 0) + (final_bias ? oProjSize : 0);
+      bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
+      weights[1] =
+          model.create_parallel_weight_legion_ordering(bias_shape.num_dims,
+                                                       bias_shape.dims,
+                                                       this->data_type,
+                                                       nullptr /*owner_op*/,
+                                                       true /*create_grad*/,
+                                                       initializer,
+                                                       CHOSEN_SYNC_TYPE);
+    }
+  }
+
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      _input->num_dims, dims, this->data_type, this);
+
+  /* for (int i = 0; i < numdim; i++) { */
+  /*   register_output_input_parallel_dims(outputs[0], i, inputs[0], i); */
+  /* } */
+  /* register_output_weight_parallel_dims(outputs[0], numdim-1, _weight, 1); */
+  /* register_output_weight_parallel_dims(outputs[0], numdim-2, _weight, 2); */
+  // Check correctness
+  /* assert(check_output_input_weight_parallel_dims()); */
+}
+
+SpecInferIncMultiHeadSelfAttention::SpecInferIncMultiHeadSelfAttention(
+    FFModel &model,
+    SpecInferIncMultiHeadSelfAttention const &other,
+    ParallelTensor const input,
+    bool allocate_weights)
+    : SpecInferIncMultiHeadSelfAttention(model,
+                                         other.layer_guid,
+                                         input,
+                                         other.oProjSize,
+                                         other.num_q_heads,
+                                         other.num_kv_heads,
+                                         other.qProjSize,
+                                         other.vProjSize,
+                                         other.dropout,
+                                         other.qkv_bias,
+                                         other.final_bias,
+                                         other.add_zero_attn,
+                                         other.apply_rotary_embedding,
+                                         other.scaling_query,
+                                         other.scaling_factor,
+                                         other.qk_prod_scaling,
+                                         other.position_bias,
+                                         allocate_weights,
+                                         other.name) {}
+
+SpecInferIncMultiHeadSelfAttention::SpecInferIncMultiHeadSelfAttention(
+    FFModel &model,
+    SpecInferIncMultiHeadSelfAttentionParams const &params,
+    ParallelTensor const &input,
+    bool allocate_weights,
+    char const *name)
+    : SpecInferIncMultiHeadSelfAttention(model,
+                                         params.layer_guid,
+                                         input,
+                                         params.embed_dim,
+                                         params.num_q_heads,
+                                         params.num_kv_heads,
+                                         params.kdim,
+                                         params.vdim,
+                                         params.dropout,
+                                         params.qkv_bias,
+                                         params.final_bias,
+                                         params.add_zero_attn,
+                                         params.apply_rotary_embedding,
+                                         params.scaling_query,
+                                         params.scaling_factor,
+                                         params.qk_prod_scaling,
+                                         params.position_bias,
+                                         allocate_weights,
+                                         name) {}
+
+void SpecInferIncMultiHeadSelfAttention::init_inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = batch_outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher launcher(
+      SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
+      parallel_is,
+      TaskArgument(this, sizeof(SpecInferIncMultiHeadSelfAttention)),
+      argmap,
+      Predicate::TRUE_PRED,
+      false /*must*/,
+      0 /*mapper_id*/,
+      machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
+}
+
+void SpecInferIncMultiHeadSelfAttention::init(FFModel const &ff) {
+  assert(check_output_input_weight_same_parallel_is());
+  parallel_is = outputs[0]->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(
+      SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
+      parallel_is,
+      TaskArgument(this, sizeof(SpecInferIncMultiHeadSelfAttention)),
+      argmap,
+      Predicate::TRUE_PRED,
+      false /*must*/,
+      0 /*mapper_id*/,
+      outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(2, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
+/*
+  regions[0](I): input
+  regions[1](I): weight
+  regions[2](O): output
+*/
+OpMeta *SpecInferIncMultiHeadSelfAttention::init_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  SpecInferIncMultiHeadSelfAttention const *attn =
+      (SpecInferIncMultiHeadSelfAttention *)task->args;
+  FFHandler handle = *((FFHandler const *)task->local_args);
+
+  GenericTensorAccessorR input =
+      helperGetGenericTensorAccessorRO(attn->inputs[0]->data_type,
+                                       regions[0],
+                                       task->regions[0],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorR weight =
+      helperGetGenericTensorAccessorRO(attn->weights[0]->data_type,
+                                       regions[1],
+                                       task->regions[1],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorW output =
+      helperGetGenericTensorAccessorWO(attn->outputs[0]->data_type,
+                                       regions[2],
+                                       task->regions[2],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+
+  int num_samples = input.domain.hi()[2] - input.domain.lo()[2] + 1;
+  assert(attn->qoSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
+  assert(attn->kvSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
+  int num_q_heads = attn->num_q_heads;
+  int num_kv_heads = attn->num_kv_heads;
+  assert(attn->oProjSize == output.domain.hi()[0] - output.domain.lo()[0] + 1);
+
+  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                       .only_kind(Memory::GPU_FB_MEM)
+                       .best_affinity_to(task->target_proc)
+                       .first();
+  MemoryAllocator gpu_mem_allocator(gpu_mem);
+  // We don't do offloading for SSMs (small speculative models)
+  SpecInferIncMultiHeadSelfAttentionMeta *m =
+      new SpecInferIncMultiHeadSelfAttentionMeta(handle,
+                                                 attn,
+                                                 weight,
+                                                 gpu_mem_allocator,
+                                                 num_samples,
+                                                 num_q_heads,
+                                                 num_kv_heads);
+  // assert that we didn't over allocate memory
+  assert(gpu_mem_allocator.instance_allocated_size ==
+         gpu_mem_allocator.instance_total_size);
+  m->profiling = attn->profiling;
+  m->inference_debugging = attn->inference_debugging;
+  std::strcpy(m->op_name, attn->name);
+  m->layer_guid = attn->layer_guid;
+  assert(weight.domain.get_volume() * data_type_size(weight.data_type) ==
+         m->weightSize);
+  return m;
+}
+
+void SpecInferIncMultiHeadSelfAttention::forward(FFModel const &ff) {
+  // SpecInferIncMultiHeadSelfAttention doesn't support forward
+  assert(false);
+}
+
+FutureMap SpecInferIncMultiHeadSelfAttention::inference(
+    FFModel const &ff,
+    BatchConfigFuture const &bc,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+  int idx = 0;
+  IndexLauncher launcher(SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
+                         parallel_is,
+                         TaskArgument(nullptr, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(idx++, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(idx++, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(idx++, FID_DATA);
+
+  if (qkv_bias || final_bias) {
+    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[1]->region));
+    launcher.add_field(idx++, FID_DATA);
+  }
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+/*
+  regions[0](I): input
+  regions[3](I): weight
+  regions[4](O): output
+*/
+void SpecInferIncMultiHeadSelfAttention::inference_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  assert(task->regions.size() == regions.size());
+
+  BeamSearchBatchConfig const &bc =
+      Future(task->futures[0]).get_result<BeamSearchBatchConfig>();
+  if (bc.num_tokens == 0) {
+    return;
+  }
+
+  SpecInferIncMultiHeadSelfAttentionMeta *m =
+      *((SpecInferIncMultiHeadSelfAttentionMeta **)task->local_args);
+  assert(((*m->qkv_bias || *m->final_bias) ? regions.size() == 4
+                                           : regions.size() == 3));
+
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
+      m->weight_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR biases;
+  if (*m->qkv_bias || *m->final_bias) {
+    biases = helperGetGenericTensorAccessorRO(m->weight_type[1],
+                                              regions[3],
+                                              task->regions[3],
+                                              FID_DATA,
+                                              ctx,
+                                              runtime);
+    Domain bias_domain = runtime->get_index_space_domain(
+        ctx, task->regions[3].region.get_index_space());
+    assert(bias_domain.get_dim() == 4);
+  }
+  Domain input_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  Domain weight_domain = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+  Domain output_domain = runtime->get_index_space_domain(
+      ctx, task->regions[2].region.get_index_space());
+
+  assert(input_domain.get_dim() == 4);
+  assert(weight_domain.get_dim() == 2);
+  assert(output_domain.get_dim() == 4);
+
+  assert(task->index_point.get_dim() == 1);
+  SpecInferIncMultiHeadSelfAttention::inference_kernel_wrapper(
+      m, &bc, task->index_point.point_data[0], input, weight, output, biases);
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    std::vector<GenericTensorAccessorR> weights_accessors;
+    weights_accessors.push_back(weight);
+    if (*m->qkv_bias || *m->final_bias) {
+      weights_accessors.push_back(biases);
+    }
+    SpecInferIncMultiHeadSelfAttention::save_inference_tensors_to_file(
+        m, shard_id, &bc, {input}, weights_accessors, {output});
+  }
+}
+
+void SpecInferIncMultiHeadSelfAttention::backward(FFModel const &ff) {
+  // SpecInferIncMultiHeadSelfAttention does not support backward
+  assert(false);
+}
+
+bool SpecInferIncMultiHeadSelfAttention::get_int_parameter(PMParameter para,
+                                                           int *value) const {
+  switch (para) {
+    case PM_NUM_HEADS:
+      *value = num_q_heads;
+      return true;
+    default:
+      return Op::get_int_parameter(para, value);
+  }
+}
+
+Op *SpecInferIncMultiHeadSelfAttention::materialize(FFModel &ff,
+                                                    ParallelTensor inputs[],
+                                                    int num_inputs) const {
+  SpecInferIncMultiHeadSelfAttentionParams params = get_params();
+  return new SpecInferIncMultiHeadSelfAttention(
+      ff, params, inputs[0], true, this->name);
+}
+
+bool SpecInferIncMultiHeadSelfAttention::measure_operator_cost(
+    Simulator *sim, MachineView const &mv, CostMetrics &cost_metrics) const {
+  return false;
+}
+
+bool operator==(SpecInferIncMultiHeadSelfAttentionParams const &lhs,
+                SpecInferIncMultiHeadSelfAttentionParams const &rhs) {
+  return lhs.layer_guid == rhs.layer_guid && lhs.embed_dim == rhs.embed_dim &&
+         lhs.num_q_heads == rhs.num_q_heads && lhs.kdim == rhs.kdim &&
+         lhs.vdim == rhs.vdim && lhs.dropout == rhs.dropout &&
+         lhs.qkv_bias == rhs.qkv_bias && lhs.final_bias == rhs.final_bias &&
+         lhs.add_zero_attn == rhs.add_zero_attn &&
+         lhs.apply_rotary_embedding == rhs.apply_rotary_embedding &&
+         lhs.scaling_query == rhs.scaling_query &&
+         lhs.scaling_factor == rhs.scaling_factor &&
+         lhs.qk_prod_scaling == rhs.qk_prod_scaling &&
+         lhs.position_bias == rhs.position_bias;
+}
+
+SpecInferIncMultiHeadSelfAttentionParams
+    SpecInferIncMultiHeadSelfAttention::get_params() const {
+  SpecInferIncMultiHeadSelfAttentionParams params;
+  params.layer_guid = this->layer_guid;
+  params.embed_dim = this->oProjSize;
+  params.num_q_heads = this->num_q_heads;
+  params.num_kv_heads = this->num_kv_heads;
+  params.kdim = this->kProjSize;
+  params.vdim = this->vProjSize;
+  params.dropout = this->dropout;
+  params.qkv_bias = this->qkv_bias;
+  params.final_bias = this->final_bias;
+  params.add_zero_attn = this->add_zero_attn;
+  params.apply_rotary_embedding = this->apply_rotary_embedding;
+  params.scaling_query = this->scaling_query;
+  params.scaling_factor = this->scaling_factor;
+  params.qk_prod_scaling = this->qk_prod_scaling;
+  params.position_bias = this->position_bias;
+
+  return params;
+}
+
+}; // namespace FlexFlow
+
+namespace std {
+size_t hash<FlexFlow::SpecInferIncMultiHeadSelfAttentionParams>::operator()(
+    FlexFlow::SpecInferIncMultiHeadSelfAttentionParams const &params) const {
+  size_t key = 0;
+  hash_combine(key, params.layer_guid.id);
+  hash_combine(key, params.embed_dim);
+  hash_combine(key, params.num_q_heads);
+  hash_combine(key, params.num_kv_heads);
+  hash_combine(key, params.kdim);
+  hash_combine(key, params.vdim);
+  hash_combine(key, params.dropout);
+  hash_combine(key, params.qkv_bias);
+  hash_combine(key, params.final_bias);
+  hash_combine(key, params.add_zero_attn);
+  hash_combine(key, params.apply_rotary_embedding);
+  hash_combine(key, params.scaling_query);
+  hash_combine(key, params.scaling_factor);
+  hash_combine(key, params.qk_prod_scaling);
+  hash_combine(key, params.position_bias);
+  return key;
+}
+}; // namespace std
diff --git a/src/ops/specinfer_inc_multihead_self_attention.cu b/src/ops/specinfer_inc_multihead_self_attention.cu
new file mode 100644
index 0000000000..0bdf07a9d7
--- /dev/null
+++ b/src/ops/specinfer_inc_multihead_self_attention.cu
@@ -0,0 +1,890 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+#include "cuComplex.h"
+#endif
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/ops/kernels/inc_multihead_self_attention_kernels.h"
+#include "flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh"
+#include "flexflow/ops/specinfer_inc_multihead_self_attention.h"
+#include "flexflow/utils/cuda_helper.h"
+
+namespace FlexFlow {
+
+#define WARP_SIZE 32
+
+// declare Legion names
+using Legion::coord_t;
+using Legion::Memory;
+using namespace Kernels::IncMultiHeadAttention;
+
+namespace Kernels {
+namespace SpecInferIncMultiHeadAttention {
+
+template <typename DT,
+          int THREADS_PER_BLOCK,
+          int Dh,
+          int Dh_MAX,
+          int THREADS_PER_KEY,
+          int THREADS_PER_VALUE>
+__global__ void compute_specinfer_attention_kernel_generation_kernel(
+    DT const *query,
+    DT const *key_cache,
+    DT const *value_cache,
+    DT *output_ptr,
+    float const scale,
+    int const max_seq_length,
+    int per_head_size,
+    int hidden_size,
+    BatchConfig::PerRequestInfo *request_infos,
+    BeamSearchBatchConfig::BeamSearchPerRequestInfo *beam_request_infos,
+    BeamSearchBatchConfig::SpecInferTopology *topology_mask,
+    int max_tree_branches) {
+
+  // q, k
+  using Q_vec = typename VEC_K<DT, THREADS_PER_KEY>::Type;
+  using K_vec = typename VEC_K<DT, THREADS_PER_KEY>::Type;
+  using V_vec = typename VEC_V<DT>::Type;
+  using Out_sum = typename Vec_fp32_<V_vec>::Type;
+
+  constexpr int WARPS_PER_BLOCK = THREADS_PER_BLOCK / WARP_SIZE;
+
+  constexpr int K_VEC_SIZE = sizeof(K_vec) / sizeof(DT);
+  constexpr int K_ELTS_PER_THREAD = Dh / THREADS_PER_KEY;
+  constexpr int K_VECS_PER_THREAD = K_ELTS_PER_THREAD / K_VEC_SIZE;
+  // constexpr int QK_ELTS_IN_16B = 16 / sizeof(DT);
+
+  // thread id
+  int const tidx = threadIdx.x;
+  // head id
+  int const head_idx = blockIdx.x;
+  // request idx
+  int const request_idx = blockIdx.y;
+
+  BeamSearchBatchConfig::SpecInferTopology topology =
+      topology_mask[request_idx];
+
+  int const first_step = 0;
+
+  int const tlength = request_infos[request_idx].first_token_depth_in_request +
+                      request_infos[request_idx].num_tokens_in_batch;
+  // int const qlength = request_infos[request_idx].num_tokens_in_batch;
+  int const tree_branch_num = beam_request_infos[request_idx].sub_request_num;
+
+  // will decode qlength tokens in this thread block
+  // int const qlength = tree_branch_num;
+
+  int first_token_idx = 0;
+  for (int r = 0; r < request_idx; r++) {
+    first_token_idx += request_infos[request_idx].num_tokens_in_batch;
+  }
+
+  // shared memory objects
+  extern __shared__ char smem_[];
+
+  float *qk_smem = reinterpret_cast<float *>(smem_);
+  float *out_smem = reinterpret_cast<float *>(smem_);
+
+  float qk_max = -FLT_MAX;
+
+  // first WARPS_PER_BLOCK for store qk_max, second WARPS_PER_BLOCK for sum
+  __shared__ float red_smem[WARPS_PER_BLOCK * 2];
+
+  const DT *q_ptr = query + first_token_idx * hidden_size * QKV_WEIGHT_NUM +
+                    head_idx * per_head_size;
+  __shared__ Q_vec q_vecs[THREADS_PER_KEY][K_VECS_PER_THREAD];
+
+  // the start offset of the element eg. (0, 1, 2, 3) * K_VEC_SIZE
+  int ki = tidx % THREADS_PER_KEY * K_VEC_SIZE;
+  int ki_o = tidx % THREADS_PER_KEY;
+  // the first key's offset for this thread
+  // ko = 0, 0, 0, 0, 1, 1, 1, 1, ....
+  int ko = tidx / THREADS_PER_KEY;
+  // load q tensor
+  Q_vec q_vec[K_VECS_PER_THREAD];
+
+  constexpr int K_PER_ITER = THREADS_PER_BLOCK / THREADS_PER_KEY;
+  // The number of keys per warp.
+  constexpr int K_PER_WARP = WARP_SIZE / THREADS_PER_KEY;
+
+  DT const *k_cache_batch =
+      key_cache +
+      request_idx * max_seq_length * hidden_size * max_tree_branches + ki;
+
+  int ti_end =
+      div_up(tlength - first_step, K_PER_WARP) * K_PER_WARP + first_step;
+
+  for (int sub_req_idx = 0; sub_req_idx < tree_branch_num; sub_req_idx += 1) {
+#pragma unroll
+    for (int ii = 0; ii < K_VECS_PER_THREAD; ++ii) {
+      q_vecs[ki_o][ii] = *reinterpret_cast<Q_vec const *>(
+          q_ptr + (hidden_size * QKV_WEIGHT_NUM * sub_req_idx) + ki +
+          ii * THREADS_PER_KEY * K_VEC_SIZE);
+    }
+    __syncthreads();
+    for (int ti = ko; ti < ti_end; ti += K_PER_ITER) {
+      K_vec k[K_VECS_PER_THREAD];
+      int const ti_circ = ti % max_seq_length;
+
+      for (int ii = 0; ii < K_VECS_PER_THREAD; ++ii) {
+        int jj = ii * THREADS_PER_KEY * K_VEC_SIZE;
+        if (ti < tlength) {
+          // find the real position of the cache;
+          // depth: 0, 1, 2, 3, 4, 4, 5, 5 ,5, 5,
+          int const real_cache_idx = topology.real_token_pos[sub_req_idx][ti];
+          k[ii] = *reinterpret_cast<K_vec const *>(
+              k_cache_batch + real_cache_idx * hidden_size +
+              head_idx * per_head_size + jj);
+        }
+      }
+      float qk = scale * Qk_dot<DT, THREADS_PER_KEY>::dot(q_vecs[ki_o], k);
+
+      if (ti < tlength && tidx % THREADS_PER_KEY == 0) {
+        // todo add alobi here
+        bool const mask = ti_circ >= tlength;
+        if (mask) {
+          assert(false);
+        }
+        qk_max = mask ? qk_max : fmaxf(qk_max, qk);
+        qk_smem[ti - first_step] = mask ? 0.f : qk;
+      }
+    }
+
+    __syncthreads();
+
+#pragma unroll
+    for (int mask = WARP_SIZE / 2; mask >= THREADS_PER_KEY; mask /= 2) {
+      qk_max = fmaxf(qk_max, __shfl_xor_sync(uint32_t(-1), qk_max, mask));
+    }
+
+    // Decompose the thread index into warp and lane.
+    int const warp = tidx / WARP_SIZE;
+    int const lane = tidx % WARP_SIZE;
+
+    // The warp leader writes the max to shared memory.
+    if (lane == 0) {
+      red_smem[warp] = qk_max;
+    }
+
+    // Make sure the products are in shared memory.
+    __syncthreads();
+
+    // The warps finalize the reduction.
+    qk_max = lane < WARPS_PER_BLOCK ? red_smem[lane] : -FLT_MAX;
+#pragma unroll
+    for (int mask = WARPS_PER_BLOCK / 2; mask >= 1; mask /= 2) {
+      qk_max = fmaxf(qk_max, __shfl_xor_sync(uint32_t(-1), qk_max, mask));
+    }
+
+    // Broadcast to all the threads in the warp.
+    qk_max = __shfl_sync(uint32_t(-1), qk_max, 0);
+
+    float exp_sum = 0.f;
+    for (int ti = first_step + tidx; ti < tlength; ti += THREADS_PER_BLOCK) {
+      float logit = __expf(qk_smem[ti - first_step] - qk_max);
+      exp_sum += logit;
+      qk_smem[ti - first_step] = logit;
+    }
+
+    // Compute the sum.
+    exp_sum = block_sum<WARPS_PER_BLOCK>(&red_smem[WARPS_PER_BLOCK], exp_sum);
+
+    // softmax
+    float inv_sum = __fdividef(1.f, exp_sum + 1.e-6);
+    for (int ti = first_step + tidx; ti < tlength; ti += THREADS_PER_BLOCK) {
+      qk_smem[ti - first_step] *= inv_sum;
+    }
+
+    __syncthreads();
+    // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
+    //   printf("softmax %.10f\n", qk_smem[0]);
+    // }
+
+    // value projection
+    constexpr int V_VEC_SIZE = 16 / sizeof(DT);
+    // A vector of V elements for the current timestep.
+    // using V_vec_k = typename V_vec_k_<DT, V_VEC_SIZE>::Type;
+    // using V_vec_acum = typename V_vec_acum_fp32_<V_vec_k>::Type;
+
+    // The value computed by this thread.
+    int vo = tidx / THREADS_PER_VALUE;
+    // The hidden dimensions computed by this particular thread.
+    int vi = tidx % THREADS_PER_VALUE * V_VEC_SIZE;
+    constexpr int V_PER_ITER = THREADS_PER_BLOCK / THREADS_PER_VALUE;
+
+    Out_sum out;
+    zero(out);
+
+    // The base pointer for the value in the cache buffer.
+    DT const *v_cache_batch =
+        value_cache +
+        request_idx * max_seq_length * hidden_size * max_tree_branches + vi;
+    // DT const *v_cache_batch =
+    //     value_cache +
+    //     (beam_request_idx * max_beam_width + beam_sub_request_idx) *
+    //         max_seq_length * hidden_size +
+    //     vi;
+
+    if (Dh == Dh_MAX || vi < Dh) {
+      for (int ti = first_step + vo; ti < tlength; ti += V_PER_ITER) {
+        // Load the values from the cache.
+        int const ti_circ = ti % max_seq_length;
+        int const real_cache_idx = topology.real_token_pos[sub_req_idx][ti];
+        V_vec v = *reinterpret_cast<V_vec const *>(
+            v_cache_batch + real_cache_idx * hidden_size +
+            head_idx * per_head_size);
+        float logit = qk_smem[ti - first_step];
+        out = FlexFlow::fma(logit, cast_to_float(v), out);
+      }
+    }
+
+    //   // Make sure we can start writing to shared memory.
+    __syncthreads();
+
+    // Run the final reduction amongst the different groups computing different
+    // partial outputs.
+    if (Dh == Dh_MAX || vi < Dh) {
+#pragma unroll
+      for (int active_groups = V_PER_ITER; active_groups >= 2;
+           active_groups /= 2) {
+
+        // The midpoint in the number of active groups.
+        int midpoint = active_groups / 2;
+
+        // The upper part of active threads store to shared memory.
+        if (vo >= midpoint && vo < active_groups && (Dh == Dh_MAX || vi < Dh)) {
+          *reinterpret_cast<Out_sum *>(out_smem + (vo - midpoint) * Dh + vi) =
+              out;
+        }
+        __syncthreads();
+
+        // The bottom warps update their values.
+        if (vo < midpoint && (Dh == Dh_MAX || vi < Dh)) {
+          out = add(*reinterpret_cast<Out_sum const *>(out_smem + vo * Dh + vi),
+                    out);
+        }
+        __syncthreads();
+      }
+    }
+
+    // Output the final values.
+    if (vo == 0 && (Dh == Dh_MAX || vi < Dh)) {
+      convert_from_float(
+          *reinterpret_cast<V_vec *>(output_ptr + request_idx * hidden_size +
+                                     head_idx * per_head_size + vi),
+          out);
+    }
+  }
+}
+
+template <typename DT>
+__global__ void specinfer_store_kv_cache(
+    DT const *devQKVProjArray,
+    DT *kCache_ptr,
+    DT *vCache_ptr,
+    BatchConfig::PerTokenInfo *tokenInfos,
+    BatchConfig::PerRequestInfo *requestInfo,
+    BeamSearchBatchConfig::BeamSearchPerTokenInfo *beamTokenInfos,
+    BeamSearchBatchConfig::BeamSearchPerRequestInfo *beamRequestInfos,
+    BeamSearchBatchConfig::SpecInferTopology *beam_topology_mask,
+    int qProjSize,
+    int kProjSize,
+    int vProjSize,
+    int num_tokens,
+    int max_seq_len,
+    int max_tree_branches,
+    bool is_root,
+    int hidden_size) {
+  CUDA_KERNEL_LOOP(i, num_tokens * hidden_size * 2) {
+    int token_idx = i / (hidden_size * KV_WEIGHT_NUM);
+    int offset = i % hidden_size;
+
+    size_t val_idx =
+        token_idx * QKV_WEIGHT_NUM * hidden_size + hidden_size + offset;
+
+    DT kVal = devQKVProjArray[val_idx];
+    DT vVal = devQKVProjArray[val_idx + hidden_size];
+
+    // above no need to be changed
+    // int const req_id = id_map[token_idx].request_index;
+    // int const tok_id = id_map[token_idx].token_position;
+    // int const sub_req_id = id_map[token_idx].sub_request_index;
+    // int const parent_id = id_map[token_idx].parent_id;
+    // int const beam_depth = id_map[token_idx].beam_depth;
+    // int const beam_width = id_map[token_idx].beam_width;
+
+    int const req_id = tokenInfos[token_idx].request_index;
+    int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
+    int const sub_req_id = beamTokenInfos[token_idx].sub_request_index;
+    // int const parent_id = beamRequestInfos[req_id].parent_id[sub_req_id];
+    // int const beam_depth = beamRequestInfos[req_id].current_depth;
+    // int const beam_width = beamRequestInfos[req_id].beam_size;
+    int const allocated_tokens = beam_topology_mask[req_id].allocated_tokens;
+
+    kCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
+               (allocated_tokens + sub_req_id) * hidden_size + offset] = kVal;
+    vCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
+               (allocated_tokens + sub_req_id) * hidden_size + offset] = vVal;
+  }
+}
+
+template <typename DT>
+void update_kv_cache_kernel(SpecInferIncMultiHeadSelfAttentionMeta const *m,
+                            BeamSearchBatchConfig const *bc,
+                            cudaStream_t stream) {
+  int num_tokens = bc->num_active_tokens();
+  int curr_depth = bc->beamRequestsInfo[0].current_depth;
+  // printf("curr depth: %d\n", curr_depth);
+  // assert(curr_depth < 3);
+  if (num_tokens > 0) {
+    int parallelism = m->hidden_size * KV_WEIGHT_NUM * num_tokens;
+    specinfer_store_kv_cache<<<GET_BLOCKS(parallelism),
+                               min(CUDA_NUM_THREADS, parallelism),
+                               0,
+                               stream>>>(
+        static_cast<DT *>(m->devQKVProjArray),
+        static_cast<DT *>(m->keyCache),
+        static_cast<DT *>(m->valueCache),
+        m->token_infos,
+        m->request_infos,
+        m->beam_token_infos,
+        m->beam_request_infos,
+        m->beam_topology_mask,
+        m->qProjSize,
+        m->kProjSize,
+        m->vProjSize,
+        num_tokens,
+        BatchConfig::max_sequence_length(),
+        BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES,
+        /*root*/ curr_depth == 0,
+        m->hidden_size);
+  }
+}
+
+#define LAUNCH_SPECINFER_ATTENTION_SCORE_KERNEL(                               \
+    DT, Dh, Dh_MAX, THDS_PER_KEY, THREADS_PER_VALUE, THDS_PER_BLOCK, stream)   \
+  smem_sz = smem_size_in_bytes<DT>(m->qProjSize,                               \
+                                   BatchConfig::max_sequence_length(),         \
+                                   THREADS_PER_VALUE,                          \
+                                   THDS_PER_BLOCK);                            \
+  compute_specinfer_attention_kernel_generation_kernel<DT,                     \
+                                                       THDS_PER_BLOCK,         \
+                                                       Dh,                     \
+                                                       Dh_MAX,                 \
+                                                       THDS_PER_KEY,           \
+                                                       THREADS_PER_VALUE>      \
+      <<<grid, THDS_PER_BLOCK, smem_sz, stream>>>(                             \
+          static_cast<DT *>(m->devQKVProjArray),                               \
+          static_cast<DT *>(m->keyCache),                                      \
+          static_cast<DT *>(m->valueCache),                                    \
+          output_ptr,                                                          \
+          scale,                                                               \
+          BatchConfig::max_sequence_length(),                                  \
+          m->qProjSize,                                                        \
+          m->hidden_size,                                                      \
+          m->request_infos,                                                    \
+          m->beam_request_infos,                                               \
+          m->beam_topology_mask,                                               \
+          BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES)
+
+template <typename DT>
+void compute_specinfer_attention_kernel_generation(
+    SpecInferIncMultiHeadSelfAttentionMeta const *m,
+    BeamSearchBatchConfig const *bc,
+    DT *output_ptr,
+    cudaStream_t stream) {
+  // one block == one head per request
+  dim3 grid(m->num_q_heads, bc->num_active_requests());
+  int const per_head_size = m->qProjSize;
+  float scale = (*m->qk_prod_scaling) ? 1.0f / sqrt(m->kProjSize) : 1.0f;
+  size_t smem_sz;
+  if (per_head_size == 64) {
+    constexpr int THREADS_PER_VALUE_64 = threads_per_value_t<DT, 64>::value;
+    LAUNCH_SPECINFER_ATTENTION_SCORE_KERNEL(
+        DT, 64, 64, 4, THREADS_PER_VALUE_64, 128, stream);
+  } else if (per_head_size == 128) {
+    constexpr int THREADS_PER_VALUE_128 = threads_per_value_t<DT, 128>::value;
+    LAUNCH_SPECINFER_ATTENTION_SCORE_KERNEL(
+        DT, 128, 128, 4, THREADS_PER_VALUE_128, 128, stream);
+  } else {
+    assert(false && "a unsupported head size");
+  }
+}
+
+template <typename DT>
+__global__ void spec_fill_entries_above_diagonal(DT *matrix,
+                                                 size_t new_tokens,
+                                                 size_t total_tokens_in_request,
+                                                 size_t num_q_heads,
+                                                 DT value) {
+  CUDA_KERNEL_LOOP(i, new_tokens * total_tokens_in_request * num_q_heads) {
+    // size_t head_idx = i / (new_tokens * total_tokens_in_request);
+    size_t src_idx = (i / new_tokens) % total_tokens_in_request;
+    size_t dst_idx = i % new_tokens + total_tokens_in_request - new_tokens;
+    // Casual Mask
+    if (src_idx > dst_idx) {
+      matrix[i] = value;
+    }
+  }
+}
+
+template <typename DT>
+void compute_attention_kernel_prompt(
+    SpecInferIncMultiHeadSelfAttentionMeta const *m,
+    BeamSearchBatchConfig const *bc,
+    int shard_id,
+    DT *output_ptr,
+    DT const *bias_ptr,
+    DT const *weight_ptr,
+    cudaStream_t stream) {
+  checkCUDA(cublasSetStream(m->handle.blas, stream));
+  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
+  cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
+  cudnnDataType_t cudnn_data_type = ff_to_cudnn_datatype(m->output_type[0]);
+  assert(data_type_size(m->output_type[0]) == sizeof(DT));
+#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  cudaDataType_t compute_type = cublas_data_type;
+#else
+  // For best performance, set the default cublas compute type to
+  // CUBLAS_COMPUTE_16F for half precision and to
+  // CUBLAS_COMPUTE_32F_FAST_16F for full precision
+  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+  if (m->output_type[0] == DT_FLOAT) {
+    compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
+  }
+#endif
+  // int num_requests = bc->num_active_requests();
+  int num_tokens = bc->num_active_tokens();
+  int tokens_previous_requests = 0;
+  int tokens_prev_requests_squares = 0;
+  // int qkv_block_size =
+  //     (m->qProjSize + m->kProjSize + m->vProjSize) * num_tokens;
+  int q_block_size = m->qProjSize;
+
+  int kt_block_size = m->kProjSize;
+  int kt_req_block_size =
+      kt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+  int vt_block_size = m->vProjSize;
+  int vt_req_block_size =
+      vt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+  assert(m->qProjSize == m->kProjSize);
+
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    } else if (tokens_previous_requests < bc->num_generation_tokens) {
+      tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
+      continue;
+    }
+
+    // all requests in prompt phase should only have one sub requests;
+    assert(bc->sub_requests[i] == 1);
+    // int num_new_tokens = bc->num_processing_tokens[i];
+    // int total_tokens = bc->token_last_available_idx[i] + 1;
+
+    int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+    int total_tokens = bc->requestsInfo[i].first_token_depth_in_request +
+                       bc->requestsInfo[i].num_tokens_in_batch;
+
+    if (num_new_tokens <= 0) {
+      continue;
+    }
+
+    // Compute (QK^T/sqrt(d_k))
+    int m_ = num_new_tokens;
+    int n = total_tokens;
+    int k = m->qProjSize;
+    int lda = k * m->num_q_heads * QKV_WEIGHT_NUM, ldb = k * m->num_q_heads,
+        ldc = m_;
+    int strideA = q_block_size;
+    int strideB = kt_block_size;
+    int strideC = num_new_tokens * total_tokens;
+
+    // a flag of using this scaling alpha
+    DT alpha = 1.0f, beta = 0.0f;
+    if (*m->qk_prod_scaling) {
+      alpha = static_cast<DT>(1.0f / sqrt(m->kProjSize));
+    }
+    // To get A, skip over Q entries from previous requests (same head)
+    DT const *A = static_cast<DT *>(m->devQKVProjArray) +
+                  bc->requestsInfo[i].first_token_offset_in_batch *
+                      m->qProjSize * m->num_q_heads * QKV_WEIGHT_NUM;
+    // To get B, skip over K entries from previous requests (all heads +
+    // padding)
+    DT const *B = static_cast<DT *>(m->keyCache) +
+                  (i * bc->MAX_SPECULATIVE_TREE_BRANCHES) * kt_req_block_size;
+
+    // if (i == 0 && sub_req_id == 0 &&
+    //     bc->beam_slots.at(0).current_depth == 1) {
+    //   int offset = (float *)B - m->keyCache;
+    //   printf("key cache offset %d\n", kt_req_block_size);
+    // }
+    // To get C, skip over QK^T products from previous requests
+    DT *C = static_cast<DT *>(m->qk_prods) +
+            m->num_q_heads * tokens_prev_requests_squares;
+    checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                         CUBLAS_OP_T,
+                                         CUBLAS_OP_N,
+                                         m_,
+                                         n,
+                                         k,
+                                         &alpha,
+                                         A,
+                                         cublas_data_type,
+                                         lda,
+                                         strideA,
+                                         B,
+                                         cublas_data_type,
+                                         ldb,
+                                         strideB,
+                                         &beta,
+                                         C,
+                                         cublas_data_type,
+                                         ldc,
+                                         strideC,
+                                         m->num_q_heads,
+                                         compute_type,
+                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+    // add alibi position bias to qk production
+    // add alibi position bias to qk production
+    if (*m->position_bias) {
+      size_t parallelism = m->num_q_heads * total_tokens * num_new_tokens;
+      apply_position_bias_qkprd<<<GET_BLOCKS(parallelism),
+                                  min((size_t)CUDA_NUM_THREADS, parallelism),
+                                  0,
+                                  stream>>>(C,
+                                            num_new_tokens,
+                                            total_tokens,
+                                            m->num_q_heads,
+                                            m->global_num_q_heads,
+                                            shard_id);
+    }
+    // Fill all elements above diagonal in qk prods with -inf to force
+    // causal attention.
+    assert(num_new_tokens <= total_tokens);
+    if (num_new_tokens > 1) {
+      size_t parallelism = m->num_q_heads * num_new_tokens * total_tokens;
+      spec_fill_entries_above_diagonal<<<GET_BLOCKS(parallelism),
+                                         min((size_t)CUDA_NUM_THREADS,
+                                             parallelism),
+                                         0,
+                                         stream>>>(C,
+                                                   num_new_tokens,
+                                                   total_tokens,
+                                                   m->num_q_heads,
+                                                   static_cast<DT>(-INFINITY));
+    }
+    // Compute Softmax(QK^T/sqrt(d_k))
+    // Before modifying the parameters below, make sure to read the following
+    // description of the CUDNN_TENSOR_NCHW tensor layout, from
+    // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#cudnnTensorFormat_t:
+    // This tensor format specifies that the data is laid out in the following
+    // order: batch size, feature maps, rows, columns. The strides are
+    // implicitly defined in such a way that the data are contiguous in memory
+    // with no padding between images, feature maps, rows, and columns; the
+    // columns are the inner dimension and the images are the outermost
+    // dimension.
+    int n_param = m->num_q_heads;
+    int c_param = total_tokens;
+    int h_param = 1;
+    int w_param = num_new_tokens;
+    checkCUDNN(cudnnSetTensor4dDescriptor(m->qk_tensor,
+                                          CUDNN_TENSOR_NCHW,
+                                          cudnn_data_type,
+                                          n_param,
+                                          c_param,
+                                          h_param,
+                                          w_param));
+    float softmax_alpha = 1.0f, softmax_beta = 0.0f;
+    DT *C_softmax = static_cast<DT *>(m->qk_prods_softmax) +
+                    m->num_q_heads * tokens_prev_requests_squares;
+    // The softmax operation below is executed according to the
+    // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
+    // softmax operation is computed per spatial location (H,W) per image (N)
+    // across dimension C.
+    checkCUDNN(cudnnSoftmaxForward(m->handle.dnn,
+                                   CUDNN_SOFTMAX_ACCURATE,
+                                   CUDNN_SOFTMAX_MODE_CHANNEL,
+                                   &softmax_alpha,
+                                   m->qk_tensor,
+                                   C,
+                                   &softmax_beta,
+                                   m->qk_tensor,
+                                   C_softmax));
+    // Matmul softmax(QK^T/sqrt(d_k)) by V
+    alpha = 1.0f, beta = 0.0f;
+    m_ = m->vProjSize;
+    n = num_new_tokens;
+    k = total_tokens;
+    lda = m_ * m->num_q_heads, ldb = n, ldc = m_ * m->num_q_heads;
+    strideA = vt_block_size;
+    strideB = num_new_tokens * total_tokens;
+    strideC = m->vProjSize;
+    // To get A, skip over V^T entries from previous requests (all heads +
+    // padding)
+    A = static_cast<DT *>(m->valueCache) +
+        (i * bc->MAX_SPECULATIVE_TREE_BRANCHES) * vt_req_block_size;
+    // To get B, skip over softmax(QK^T/sqrt(d_k)) entries from previous
+    // requests (all heads)
+    B = C_softmax;
+    // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
+    // requests
+    C = static_cast<DT *>(m->attn_heads) +
+        (tokens_previous_requests + bc->num_generation_tokens) *
+            m->num_q_heads * m->vProjSize;
+    checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                         CUBLAS_OP_N,
+                                         CUBLAS_OP_T,
+                                         m_,
+                                         n,
+                                         k,
+                                         &alpha,
+                                         A,
+                                         cublas_data_type,
+                                         lda,
+                                         strideA,
+                                         B,
+                                         cublas_data_type,
+                                         ldb,
+                                         strideB,
+                                         &beta,
+                                         C,
+                                         cublas_data_type,
+                                         ldc,
+                                         strideC,
+                                         m->num_q_heads,
+                                         compute_type,
+                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
+    tokens_previous_requests += num_new_tokens;
+    tokens_prev_requests_squares += num_new_tokens * total_tokens;
+  }
+
+  // assert(tokens_previous_requests == num_tokens);
+}
+
+template <typename DT>
+void inference_kernel(SpecInferIncMultiHeadSelfAttentionMeta const *m,
+                      BeamSearchBatchConfig const *bc,
+                      int shard_id,
+                      DT const *input_ptr,
+                      DT const *weight_ptr,
+                      DT *output_ptr,
+                      DT const *bias_ptr,
+                      cudaStream_t stream) {
+  // phase 1: Implement kernel to compute KQV for input tokens
+  compute_qkv_kernel(m,
+                     bc,
+                     shard_id,
+                     input_ptr,
+                     weight_ptr,
+                     static_cast<DT *>(m->devQKVProjArray),
+                     bias_ptr,
+                     stream);
+  // phase 2: Update key/val cache
+  update_kv_cache_kernel<DT>(m, bc, stream);
+  if (bc->num_generation_tokens > 0) {
+    compute_specinfer_attention_kernel_generation<DT>(
+        m, bc, static_cast<DT *>(m->attn_heads), stream);
+  }
+  // phase 3: Compute attention score
+  // 3 kernels for pahse 3: matmul1 - softmax - matmal2
+  if (bc->num_tokens > bc->num_generation_tokens) {
+    compute_attention_kernel_prompt(
+        m, bc, shard_id, output_ptr, bias_ptr, weight_ptr, stream);
+  }
+
+  // compute output production and bias together for all tokens
+  int num_tokens = bc->num_active_tokens();
+
+  compute_o_prod_bias(
+      m, bc, shard_id, output_ptr, weight_ptr, bias_ptr, num_tokens, stream);
+}
+
+} // namespace SpecInferIncMultiHeadAttention
+} // namespace Kernels
+
+/*static*/
+void SpecInferIncMultiHeadSelfAttention::inference_kernel_wrapper(
+    SpecInferIncMultiHeadSelfAttentionMeta const *m,
+    BeamSearchBatchConfig const *bc,
+    int shard_id,
+    GenericTensorAccessorR const &input,
+    GenericTensorAccessorR const &weight,
+    GenericTensorAccessorW const &output,
+    GenericTensorAccessorR const &bias) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  bool use_bias = *m->qkv_bias || *m->final_bias;
+
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+
+  assert(input.data_type == weight.data_type);
+  assert(input.data_type == output.data_type);
+  if (use_bias) {
+    assert(input.data_type == bias.data_type);
+  }
+
+  if (input.data_type == DT_HALF) {
+    half const *bias_ptr =
+        use_bias ? bias.get_half_ptr() : static_cast<half const *>(nullptr);
+    Kernels::SpecInferIncMultiHeadAttention::inference_kernel(
+        m,
+        bc,
+        shard_id,
+        input.get_half_ptr(),
+        weight.get_half_ptr(),
+        output.get_half_ptr(),
+        bias_ptr,
+        stream);
+  } else if (input.data_type == DT_FLOAT) {
+    float const *bias_ptr =
+        use_bias ? bias.get_float_ptr() : static_cast<float const *>(nullptr);
+    Kernels::SpecInferIncMultiHeadAttention::inference_kernel(
+        m,
+        bc,
+        shard_id,
+        input.get_float_ptr(),
+        weight.get_float_ptr(),
+        output.get_float_ptr(),
+        bias_ptr,
+        stream);
+  } else {
+    assert(false && "Unspported data type");
+  }
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("SpecInferIncMultiHeadSelfAttention forward time = %.2fms\n",
+           elapsed);
+    // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
+    // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
+    // acc_output.rect, "[Attention:forward:output]");
+  }
+}
+
+SpecInferIncMultiHeadSelfAttentionMeta::SpecInferIncMultiHeadSelfAttentionMeta(
+    FFHandler handler,
+    SpecInferIncMultiHeadSelfAttention const *attn,
+    GenericTensorAccessorR const &weight,
+    MemoryAllocator &gpu_mem_allocator,
+    int num_samples,
+    int _num_q_heads,
+    int _num_kv_heads)
+    : IncMultiHeadSelfAttentionMeta(handler,
+                                    BEAM_SEARCH_MODE,
+                                    attn,
+                                    attn->qSize,
+                                    attn->kSize,
+                                    attn->vSize,
+                                    attn->qProjSize,
+                                    attn->kProjSize,
+                                    attn->vProjSize,
+                                    attn->oProjSize,
+                                    attn->apply_rotary_embedding,
+                                    attn->qkv_bias,
+                                    attn->scaling_query,
+                                    attn->qk_prod_scaling,
+                                    attn->position_bias,
+                                    attn->final_bias,
+                                    attn->scaling_factor,
+                                    weight,
+                                    gpu_mem_allocator,
+                                    num_samples,
+                                    attn->num_q_heads,
+                                    attn->num_kv_heads,
+                                    _num_q_heads,
+                                    _num_kv_heads,
+                                    DT_NONE,
+                                    false) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  checkCUDNN(cudnnSetStream(handler.dnn, stream));
+
+  // allocate memory for the seqArray and reserve space
+  {
+    // int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
+    // size_t beam_tokeninfo_size =
+    //     max_tokens_per_batch * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+    // size_t requestinfo_size =
+    // BeamSearchBatchConfig::max_requests_per_batch(); size_t
+    // beam_requestinfo_size =
+    //     BeamSearchBatchConfig::max_requests_per_batch();
+    // size_t total_size =
+    //     beam_tokeninfo_size *
+    //         sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo) +
+    //     beam_requestinfo_size *
+    //         sizeof(BeamSearchBatchConfig::
+    //                    BeamSearchPerRequestInfo); // more components will
+    //                                               // be added here later
+
+    // We always directly allocate memory for small speculative models
+    // gpu_mem_allocator.create_legion_instance(beam_search_reserve_inst,
+    //                                          total_size);
+    beam_topology_mask =
+        static_cast<BeamSearchBatchConfig::SpecInferTopology *>(
+            handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
+            sizeof(BatchConfig::requestsInfo));
+
+    beam_token_infos =
+        static_cast<BeamSearchBatchConfig::BeamSearchPerTokenInfo *>(
+            handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
+            sizeof(BatchConfig::requestsInfo) +
+            sizeof(BeamSearchBatchConfig::topology_mask));
+
+    beam_request_infos =
+        static_cast<BeamSearchBatchConfig::BeamSearchPerRequestInfo *>(
+            handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
+            sizeof(BatchConfig::requestsInfo) +
+            sizeof(BeamSearchBatchConfig::topology_mask) +
+            sizeof(BeamSearchBatchConfig::beamTokenInfo));
+    // beam_token_infos =
+    //     gpu_mem_allocator
+    //         .allocate_instance<BeamSearchBatchConfig::BeamSearchPerTokenInfo>(
+    //             beam_tokeninfo_size);
+    // offset += beam_tokeninfo_size *
+    //           sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo);
+    // beam_request_infos =
+    //     gpu_mem_allocator
+    //         .allocate_instance<BeamSearchBatchConfig::BeamSearchPerRequestInfo>(
+    //             beam_requestinfo_size);
+    // offset += beam_requestinfo_size *
+    //           sizeof(BeamSearchBatchConfig::BeamSearchPerRequestInfo);
+    // assert(offset == total_size);
+    // assert(gpu_mem_allocator.instance_total_size ==
+    //        gpu_mem_allocator.instance_allocated_size);
+  }
+
+  cudaStreamSynchronize(stream);
+}
+
+SpecInferIncMultiHeadSelfAttentionMeta::~SpecInferIncMultiHeadSelfAttentionMeta(
+    void) {
+  if (beam_search_reserve_inst != Realm::RegionInstance::NO_INST) {
+    beam_search_reserve_inst.destroy();
+  }
+}
+
+}; // namespace FlexFlow
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index bc7d1017b7..1da56e383a 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -834,18 +834,18 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
         m->bias_ptr, bias_ptr, m->biasSize, cudaMemcpyHostToDevice, stream);
     bias_ptr = static_cast<DT *>(m->bias_ptr);
   }
-  cudaMemcpyAsync(m->token_infos,
-                  &(bc->tokensInfo),
-                  bc->num_active_tokens() *
-                      sizeof(TreeVerifyBatchConfig::PerTokenInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
-  cudaMemcpyAsync(m->request_infos,
-                  &(bc->requestsInfo),
-                  bc->max_requests_per_batch() *
-                      sizeof(BatchConfig::PerRequestInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
+  // cudaMemcpyAsync(m->token_infos,
+  //                 &(bc->tokensInfo),
+  //                 bc->num_active_tokens() *
+  //                     sizeof(TreeVerifyBatchConfig::PerTokenInfo),
+  //                 cudaMemcpyHostToDevice,
+  //                 stream);
+  // cudaMemcpyAsync(m->request_infos,
+  //                 &(bc->requestsInfo),
+  //                 bc->max_requests_per_batch() *
+  //                     sizeof(BatchConfig::PerRequestInfo),
+  //                 cudaMemcpyHostToDevice,
+  //                 stream);
   // phase 1: Implement kernel to compute KQV for input tokens
   compute_qkv_kernel(m,
                      bc,
diff --git a/src/runtime/ffconst_utils.cc b/src/runtime/ffconst_utils.cc
index c7b6e1257a..904bfbcaff 100644
--- a/src/runtime/ffconst_utils.cc
+++ b/src/runtime/ffconst_utils.cc
@@ -154,6 +154,8 @@ std::string get_operator_type_name(OperatorType type) {
       return "SpecIncMultiHeadSelfAttention";
     case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION:
       return "TreeIncMultiHeadSelfAttention";
+     case OP_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION:
+      return "SpecInferPgraoIncMultiHeadSelfAttention";
     case OP_INPUT:
       return "Input";
     case OP_WEIGHT:
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index 6d33dd9f27..46f7cc0f29 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -51,6 +51,7 @@
 #include "flexflow/ops/topk.h"
 #include "flexflow/ops/transpose.h"
 #include "flexflow/ops/tree_inc_multihead_self_attention.h"
+#include "flexflow/ops/specinfer_inc_multihead_self_attention.h"
 #include "flexflow/parallel_ops/allreduce.h"
 #include "flexflow/parallel_ops/combine.h"
 #include "flexflow/parallel_ops/fused_parallel_op.h"
@@ -69,7 +70,7 @@ using FlexFlow::MachineView;
 LegionRuntime::Logger::Category log_graph("graph");
 LegionRuntime::Logger::Category log_simplify("graph_simplify");
 
-const Node Node::INVALID_NODE = Node();
+Node const Node::INVALID_NODE = Node();
 
 Node::Node(void) : guid(0), ptr(NULL) {}
 
@@ -2384,6 +2385,28 @@ GraphOptimalViewSerialized
         sez.serialize(attn->tensor_parallelism_degree);
         break;
       }
+      case OP_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION: {
+        SpecInferIncMultiHeadSelfAttention *attn =
+            (SpecInferIncMultiHeadSelfAttention *)op;
+        sez.serialize(attn->layer_guid.id);
+        sez.serialize(attn->layer_guid.transformer_layer_id);
+        sez.serialize(attn->layer_guid.model_id);
+        sez.serialize(attn->oProjSize);
+        sez.serialize(attn->num_q_heads);
+        sez.serialize(attn->qProjSize);
+        sez.serialize(attn->vProjSize);
+        sez.serialize(attn->dropout);
+        sez.serialize(attn->qkv_bias);
+        sez.serialize(attn->final_bias);
+        sez.serialize(attn->add_zero_attn);
+        sez.serialize(attn->apply_rotary_embedding);
+        sez.serialize(attn->scaling_query);
+        sez.serialize(attn->scaling_factor);
+        sez.serialize(attn->qk_prod_scaling);
+        sez.serialize(attn->position_bias);
+        sez.serialize(attn->num_kv_heads);
+        break;
+      }
       case OP_SOFTMAX: {
         Softmax *softmax = (Softmax *)op;
         sez.serialize(softmax->dim);
@@ -2914,6 +2937,52 @@ void FFModel::deserialize_graph_optimal_view(
                                                                  params);
         break;
       }
+      case OP_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION: {
+        assert(num_inputs == 1);
+        int embed_dim, num_q_heads, k_dim, v_dim, num_kv_heads;
+        float dropout, scaling_factor;
+        bool qkv_bias, final_bias, add_zero_attn, apply_rotary_embedding,
+            scaling_query, qk_prod_scaling, position_bias;
+        size_t id, transformer_layer_id, deserialized_model_id;
+        dez.deserialize(id);
+        dez.deserialize(transformer_layer_id);
+        dez.deserialize(deserialized_model_id);
+        LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
+        dez.deserialize(embed_dim);
+        dez.deserialize(num_q_heads);
+        dez.deserialize(k_dim);
+        dez.deserialize(v_dim);
+        dez.deserialize(dropout);
+        dez.deserialize(qkv_bias);
+        dez.deserialize(final_bias);
+        dez.deserialize(add_zero_attn);
+        dez.deserialize(apply_rotary_embedding);
+        dez.deserialize(scaling_query);
+        dez.deserialize(scaling_factor);
+        dez.deserialize(qk_prod_scaling);
+        dez.deserialize(position_bias);
+        dez.deserialize(num_kv_heads);
+
+        SpecInferIncMultiHeadSelfAttentionParams params;
+        params.embed_dim = embed_dim;
+        params.num_q_heads = num_q_heads;
+        params.kdim = k_dim;
+        params.vdim = v_dim;
+        params.dropout = dropout;
+        params.qkv_bias = qkv_bias;
+        params.final_bias = final_bias;
+        params.add_zero_attn = add_zero_attn;
+        params.layer_guid = layer_guid;
+        params.apply_rotary_embedding = apply_rotary_embedding;
+        params.scaling_query = scaling_query;
+        params.scaling_factor = scaling_factor;
+        params.qk_prod_scaling = qk_prod_scaling;
+        params.position_bias = position_bias;
+        params.num_kv_heads = num_kv_heads;
+        node = get_or_create_node<SpecInferIncMultiHeadSelfAttention>(inputs[0],
+                                                                      params);
+        break;
+      }
       case OP_TOPK: {
         node = TopK::deserialize(*this, dez, inputs, num_inputs);
         break;
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index eb045e8159..fb978adfff 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -318,7 +318,7 @@ FutureMap InferenceManager::inference(FFModel *model,
         found_input_operator = true;
         assert(op->numOutputs == 1);
         ParallelTensor pt = tensor_buffer[op->outputs[0]][batch_index];
-        load_input_tokens_from_batch_config(bc, pt);
+        load_input_tokens_from_batch_config(bc, pt, model->handlers);
       }
     }
 
@@ -348,11 +348,20 @@ FutureMap InferenceManager::inference(FFModel *model,
 };
 
 void InferenceManager::load_input_tokens_from_batch_config(
-    BatchConfigFuture const &bc, ParallelTensor const input) {
+    BatchConfigFuture const &bc, ParallelTensor const input, FFHandler *handlers) {
   Context ctx = ff_config.lg_ctx;
   Runtime *runtime = ff_config.lg_hlr;
   size_t machine_view_hash = input->machine_view.hash();
   ArgumentMap argmap;
+  Rect<1> task_rect(Point<1>(0),
+                    Point<1>(ff_config.workersPerNode * ff_config.numNodes - 1));
+  IndexSpaceT<1> task_is = runtime->create_index_space(ctx, task_rect);
+  MachineView view = input->machine_view;
+  for (PointInRectIterator<1> it(task_rect); it(); it++) {
+    FFHandler handle = handlers[view.get_device_id(*it)];
+    argmap.set_point(*it, TaskArgument(&handle, sizeof(FFHandler)));
+  }
+
   IndexLauncher launcher(RM_LOAD_TOKENS_TASK_ID,
                          input->parallel_is,
                          TaskArgument(nullptr, 0),
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 92f0cff472..8bda9016c3 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -59,6 +59,7 @@
 #include "flexflow/ops/sigmoid_silu_multi.h"
 #include "flexflow/ops/softmax.h"
 #include "flexflow/ops/spec_inc_multihead_self_attention.h"
+#include "flexflow/ops/specinfer_inc_multihead_self_attention.h"
 #include "flexflow/ops/split.h"
 #include "flexflow/ops/topk.h"
 #include "flexflow/ops/transpose.h"
@@ -93,10 +94,10 @@ Op::Op(FFModel &model,
        int numWeights,
        bool allocate_weights,
        int numOutputs,
-       const ParallelTensor input1,
-       const ParallelTensor input2,
-       const ParallelTensor input3,
-       const ParallelTensor input4)
+       ParallelTensor const input1,
+       ParallelTensor const input2,
+       ParallelTensor const input3,
+       ParallelTensor const input4)
     : Op(model,
          otype,
          dtype,
@@ -116,10 +117,10 @@ Op::Op(FFModel &model,
        int _numInputs,
        int _numWeights,
        int _numOutputs,
-       const ParallelTensor _input1,
-       const ParallelTensor _input2,
-       const ParallelTensor _input3,
-       const ParallelTensor _input4)
+       ParallelTensor const _input1,
+       ParallelTensor const _input2,
+       ParallelTensor const _input3,
+       ParallelTensor const _input4)
     : op_type(_otype), data_type(_dtype), op_guid(model.op_global_guid++),
       numInputs(_numInputs), numWeights(_numWeights), numOutputs(_numOutputs),
       profiling(model.config.profiling),
@@ -1024,9 +1025,9 @@ void Op::register_output_parallel_dims(
                                      operation);
 }
 
-int Op::get_output_to_input_dim_mapping(const ParallelTensor output,
+int Op::get_output_to_input_dim_mapping(ParallelTensor const output,
                                         int output_dim,
-                                        const ParallelTensor input) {
+                                        ParallelTensor const input) {
   int output_idx = -1, input_idx = -1;
   for (int i = 0; i < numOutputs; i++) {
     if (output == outputs[i]) {
@@ -1059,9 +1060,9 @@ int Op::get_output_to_input_dim_mapping(const ParallelTensor output,
   return -1;
 }
 
-int Op::get_output_to_weight_dim_mapping(const ParallelTensor output,
+int Op::get_output_to_weight_dim_mapping(ParallelTensor const output,
                                          int output_dim,
-                                         const ParallelTensor weight) {
+                                         ParallelTensor const weight) {
   int output_idx = -1, weight_idx = -1;
   for (int i = 0; i < numOutputs; i++) {
     if (output == outputs[i]) {
@@ -1658,7 +1659,7 @@ Tensor FFModel::create_tensor(int numdim,
 }
 
 ParallelTensor FFModel::create_parallel_tensor(int numdim,
-                                               const ParallelDim dims[],
+                                               ParallelDim const dims[],
                                                DataType data_type,
                                                Op const *op,
                                                int idx,
@@ -1691,7 +1692,7 @@ Tensor FFModel::create_tensor_legion_ordering(int numdim,
 
 ParallelTensor
     FFModel::create_parallel_tensor_legion_ordering(int numdim,
-                                                    const ParallelDim dims[],
+                                                    ParallelDim const dims[],
                                                     DataType data_type,
                                                     Op const *op,
                                                     int idx,
@@ -1741,7 +1742,7 @@ Tensor FFModel::create_tensor(int const dims[],
 }
 
 template <int NDIM>
-ParallelTensor FFModel::create_parallel_tensor(const ParallelDim dims[],
+ParallelTensor FFModel::create_parallel_tensor(ParallelDim const dims[],
                                                DataType data_type,
                                                Op const *owner_op,
                                                int owner_idx,
@@ -1822,7 +1823,7 @@ Parameter FFModel::create_weight(int numdim,
 }
 
 template <int NDIM>
-ParallelParameter FFModel::create_parallel_weight(const ParallelDim dims[],
+ParallelParameter FFModel::create_parallel_weight(ParallelDim const dims[],
                                                   DataType data_type,
                                                   Op const *owner_op,
                                                   bool create_grad,
@@ -1853,7 +1854,7 @@ ParallelParameter FFModel::create_parallel_weight(const ParallelDim dims[],
 }
 
 ParallelParameter FFModel::create_parallel_weight(int numdim,
-                                                  const ParallelDim dims[],
+                                                  ParallelDim const dims[],
                                                   DataType data_type,
                                                   Op const *owner_op,
                                                   bool create_grad,
@@ -1873,7 +1874,7 @@ ParallelParameter FFModel::create_parallel_weight(int numdim,
 
 ParallelParameter FFModel::create_parallel_weight_legion_ordering(
     int numdim,
-    const ParallelDim dims[],
+    ParallelDim const dims[],
     DataType data_type,
     Op const *owner_op,
     bool create_grad,
@@ -2087,7 +2088,7 @@ void FFModel::map_weight_with_dim(ParallelTensor weight,
 }
 
 bool FFModel::get_parallel_tensor_from_tensor(
-    const Tensor tensor, ParallelTensor &parallel_tensor) const {
+    Tensor const tensor, ParallelTensor &parallel_tensor) const {
   // check if tensor->parallel_tensor is already set
   if (tensor->parallel_tensor != nullptr) {
     parallel_tensor = tensor->parallel_tensor;
@@ -2124,7 +2125,7 @@ bool FFModel::get_parallel_tensor_from_tensor(
 }
 
 void FFModel::create_disjoint_partition(int num_dims,
-                                        const ParallelDim dims[],
+                                        ParallelDim const dims[],
                                         IndexSpace const &part_is,
                                         LogicalRegion const &region,
                                         LogicalPartition &part) {
@@ -2147,7 +2148,7 @@ void FFModel::create_disjoint_partition(int num_dims,
 
 template <int NDIM, int TDIM>
 void FFModel::create_disjoint_partition_with_dim2(
-    const ParallelDim dims[],
+    ParallelDim const dims[],
     IndexSpaceT<TDIM> const &part_is,
     LogicalRegion const &region,
     LogicalPartition &part) {
@@ -2180,7 +2181,7 @@ void FFModel::create_disjoint_partition_with_dim2(
 }
 
 void FFModel::create_aliased_partition(int num_dims,
-                                       const ParallelDim dims[],
+                                       ParallelDim const dims[],
                                        int aliased_dim,
                                        IndexSpace const &part_is,
                                        LogicalRegion const &region,
@@ -2204,7 +2205,7 @@ void FFModel::create_aliased_partition(int num_dims,
 
 template <int NDIM, int TDIM>
 void FFModel::create_aliased_partition_with_dim2(
-    const ParallelDim dims[],
+    ParallelDim const dims[],
     int aliased_dim,
     IndexSpaceT<TDIM> const &part_is,
     LogicalRegion const &region,
@@ -2241,7 +2242,7 @@ void FFModel::create_aliased_partition_with_dim2(
 }
 
 template <int NDIM>
-void FFModel::create_disjoint_partition(const ParallelTensor tensor,
+void FFModel::create_disjoint_partition(ParallelTensor const tensor,
                                         IndexSpaceT<NDIM> const &part_is,
                                         LogicalPartition &part_fwd,
                                         LogicalPartition &part_bwd) {
@@ -2289,7 +2290,7 @@ void FFModel::create_disjoint_partition(const ParallelTensor tensor,
 
 template <int NDIM, int TDIM>
 void FFModel::create_data_parallel_partition_with_diff_dims(
-    const ParallelTensor tensor,
+    ParallelTensor const tensor,
     IndexSpaceT<TDIM> const &part_is,
     LogicalPartition &part_fwd,
     LogicalPartition &part_bwd) {
@@ -2671,7 +2672,7 @@ IndexSpace FFModel::get_task_is(ParallelConfig const &pc) const {
   return get_task_is(view);
 }
 
-IndexSpace FFModel::get_or_create_task_is(const ParallelTensor tensor) {
+IndexSpace FFModel::get_or_create_task_is(ParallelTensor const tensor) {
   MachineView view;
   view.ndims = 0;
   for (int i = 0; i < tensor->num_dims; i++) {
@@ -3038,6 +3039,12 @@ Op *FFModel::create_operator_from_layer(
       operators.push_back(op);
       return op;
     }
+    case OP_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION: {
+      Op *op = SpecInferIncMultiHeadSelfAttention::create_operator_from_layer(
+          *this, layer, inputs);
+      operators.push_back(op);
+      return op;
+    }
     case OP_BATCHMATMUL: {
       Op *op = BatchMatmul::create_operator_from_layer(*this, layer, inputs);
       operators.push_back(op);
@@ -3227,7 +3234,7 @@ Op *FFModel::create_operator_from_layer(
 }
 
 void FFModel::create_operators_from_layers() {
-  std::map<const Tensor, ParallelTensor> tensors_to_parallel_tensors;
+  std::map<Tensor const, ParallelTensor> tensors_to_parallel_tensors;
   // for (auto const &l : layers) {
   for (int layer_idx = 0; layer_idx < layers.size(); layer_idx++) {
     auto const &l = layers[layer_idx];
@@ -3973,38 +3980,38 @@ void FFIterationConfig::reset() {
 
 // Default Config Parameters
 struct DefaultConfig {
-  const static int epochs = 1;
+  static int const epochs = 1;
   // const static int iterations = 1;
-  const static int batchSize = 64;
-  const static bool profiling = false;
-  const static bool inference_debugging = false;
+  static int const batchSize = 64;
+  static bool const profiling = false;
+  static bool const inference_debugging = false;
   constexpr static float learningRate = 0.01f;
   constexpr static float weightDecay = 0.0001f;
-  const static size_t workSpaceSize = (size_t)128 * 1024 * 1024; // 128 MB
-  const static int numNodes = 1;
-  const static int workersPerNode = 0;
-  const static int cpusPerNode = 0;
-  const static size_t searchBudget = -1;
-  const static size_t simulatorWorkSpaceSize =
+  static size_t const workSpaceSize = (size_t)128 * 1024 * 1024; // 128 MB
+  static int const numNodes = 1;
+  static int const workersPerNode = 0;
+  static int const cpusPerNode = 0;
+  static size_t const searchBudget = -1;
+  static size_t const simulatorWorkSpaceSize =
       (size_t)2 * 1024 * 1024 * 1024; // 2 GB
   constexpr static float searchAlpha = 1.2f;
-  const static bool searchOverlapBackwardUpdate = false;
-  const static size_t offloadReserveSpaceSize =
+  static bool const searchOverlapBackwardUpdate = false;
+  static size_t const offloadReserveSpaceSize =
       (size_t)8 * 1024 * 1024 * 1024; // 8 GB
-  const static bool cpuOffload = false;
-  const static bool onlyDataParallel = true;
-  const static bool enableSampleParallel = true;
-  const static bool enableParameterParallel = false;
-  const static bool enableAttributeParallel = false;
-  const static bool enableInplaceOptimizations = false;
-  const static bool allowTensorOpMathConversion = false;
-  const static int machine_model_version = 0;
-  const static int simulator_segment_size = 16777216; // 16 MB
-  const static int simulator_max_num_segments = 1;
-  const static int base_optimize_threshold = 10;
-  const static bool enable_control_replication = true;
+  static bool const cpuOffload = false;
+  static bool const onlyDataParallel = true;
+  static bool const enableSampleParallel = true;
+  static bool const enableParameterParallel = false;
+  static bool const enableAttributeParallel = false;
+  static bool const enableInplaceOptimizations = false;
+  static bool const allowTensorOpMathConversion = false;
+  static int const machine_model_version = 0;
+  static int const simulator_segment_size = 16777216; // 16 MB
+  static int const simulator_max_num_segments = 1;
+  static int const base_optimize_threshold = 10;
+  static bool const enable_control_replication = true;
   // The default python data loader type is 2 to enable control replication
-  const static int python_data_loader_type = 2;
+  static int const python_data_loader_type = 2;
 };
 
 FFConfig::FFConfig() {
@@ -6209,6 +6216,44 @@ void register_flexflow_internal_tasks(Runtime *runtime,
           TreeIncMultiHeadSelfAttention::inference_task>(registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(
+        SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
+        "SpecInferIncMultiHeadSelfAttention Init");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<
+          OpMeta *,
+          SpecInferIncMultiHeadSelfAttention::init_task>(
+          registrar, "SpecInferIncMultiHeadSelfAttention Init Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<
+          OpMeta *,
+          SpecInferIncMultiHeadSelfAttention::init_task>(registrar);
+    }
+  }
+  {
+    TaskVariantRegistrar registrar(
+        SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
+        "SpecInferIncMultiHeadSelfAttention Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<
+          SpecInferIncMultiHeadSelfAttention::inference_task>(
+          registrar, "SpecInferIncMultiHeadSelfAttention Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<
+          SpecInferIncMultiHeadSelfAttention::inference_task>(registrar);
+    }
+  }
   // NoOp
   {
     TaskVariantRegistrar registrar(NOOP_INIT_TASK_ID, "Weight NCCL Init");
diff --git a/src/runtime/model.cpp b/src/runtime/model.cpp
index 6c482426eb..b51ab83091 100644
--- a/src/runtime/model.cpp
+++ b/src/runtime/model.cpp
@@ -131,6 +131,54 @@ FFHandler
         .wait();
     handle.workSpace = workspaceInst.pointer_untyped(0, sizeof(char));
   }
+  if (handle.offload_reserve_space_size > 0) {
+    // allocate memory for offload reserve space
+    Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                         .only_kind(Memory::GPU_FB_MEM)
+                         .best_affinity_to(task->target_proc)
+                         .first();
+    Realm::Rect<1, coord_t> bounds(
+        Realm::Point<1, coord_t>(0),
+        Realm::Point<1, coord_t>(handle.offload_reserve_space_size - 1));
+    std::vector<size_t> field_sizes;
+    field_sizes.push_back(sizeof(char));
+    Realm::RegionInstance workspaceInst;
+    Realm::RegionInstance::create_instance(workspaceInst,
+                                           gpu_mem,
+                                           bounds,
+                                           field_sizes,
+                                           0,
+                                           Realm::ProfilingRequestSet())
+        .wait();
+    handle.offload_reserve_space =
+        workspaceInst.pointer_untyped(0, sizeof(char));
+  }else {
+    handle.offload_reserve_space = nullptr;
+  }
+  if (handle.batch_config_metadata_size > 0) {
+    // allocate memory for offload reserve space
+    Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                         .only_kind(Memory::GPU_FB_MEM)
+                         .best_affinity_to(task->target_proc)
+                         .first();
+    Realm::Rect<1, coord_t> bounds(
+        Realm::Point<1, coord_t>(0),
+        Realm::Point<1, coord_t>(handle.batch_config_metadata_size - 1));
+    std::vector<size_t> field_sizes;
+    field_sizes.push_back(sizeof(char));
+    Realm::RegionInstance workspaceInst;
+    Realm::RegionInstance::create_instance(workspaceInst,
+                                           gpu_mem,
+                                           bounds,
+                                           field_sizes,
+                                           0,
+                                           Realm::ProfilingRequestSet())
+        .wait();
+    handle.batch_config_metadata =
+        workspaceInst.pointer_untyped(0, sizeof(char));
+  }else {
+    handle.batch_config_metadata = nullptr;
+  }
   // checkCUDA(hipMalloc(&handle.workSpace, handle.workSpaceSize));
 #ifdef FF_USE_NCCL
   handle.ncclComm = NULL;
diff --git a/src/runtime/model.cu b/src/runtime/model.cu
index 17401a0f14..523b3c76f3 100644
--- a/src/runtime/model.cu
+++ b/src/runtime/model.cu
@@ -148,9 +148,35 @@ FFHandler
         .wait();
     handle.offload_reserve_space =
         workspaceInst.pointer_untyped(0, sizeof(char));
-  } else {
+  }else {
     handle.offload_reserve_space = nullptr;
   }
+  if (handle.batch_config_metadata_size > 0) {
+    printf("allocate instance for metadata %d\n", handle.batch_config_metadata_size);
+    // allocate memory for offload reserve space
+    Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                         .only_kind(Memory::GPU_FB_MEM)
+                         .best_affinity_to(task->target_proc)
+                         .first();
+    Realm::Rect<1, coord_t> bounds(
+        Realm::Point<1, coord_t>(0),
+        Realm::Point<1, coord_t>(handle.batch_config_metadata_size - 1));
+    std::vector<size_t> field_sizes;
+    field_sizes.push_back(sizeof(char));
+    Realm::RegionInstance workspaceInst;
+    Realm::RegionInstance::create_instance(workspaceInst,
+                                           gpu_mem,
+                                           bounds,
+                                           field_sizes,
+                                           0,
+                                           Realm::ProfilingRequestSet())
+        .wait();
+    handle.batch_config_metadata =
+        workspaceInst.pointer_untyped(0, sizeof(char));
+  }else {
+    handle.batch_config_metadata = nullptr;
+  }
+   
 
   // checkCUDA(cudaMalloc(&handle.workSpace, handle.workSpaceSize));
 #ifdef FF_USE_NCCL
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 7c37f3391e..e1b591c320 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -106,6 +106,11 @@ int RequestManager::get_max_sequence_length() {
   return max_sequence_length;
 }
 
+void RequestManager::push_spec_infer_tree_width(int tree_width) {
+  assert(tree_width <= BeamSearchBatchConfig::MAX_BEAM_WIDTH);
+  spec_infer_tree_width.emplace_back(tree_width);
+}
+
 void RequestManager::register_tokenizer(ModelType type,
                                         int bos_token_id,
                                         int eos_token_id,
@@ -176,7 +181,7 @@ size_t RequestManager::get_num_ssms() {
 RequestManager::RequestGuid
     RequestManager::register_new_request(std::vector<TokenId> const &prompt,
                                          int max_sequence_length) {
-  const std::lock_guard<std::mutex> lock(request_queue_mutex);
+  std::lock_guard<std::mutex> const lock(request_queue_mutex);
 
   // Add a new request
   Request request;
@@ -232,7 +237,7 @@ RequestManager::RequestGuid
 RequestManager::RequestGuid
     RequestManager::register_new_request(std::string const &prompt,
                                          int max_sequence_length) {
-  const std::lock_guard<std::mutex> lock(request_queue_mutex);
+  std::lock_guard<std::mutex> const lock(request_queue_mutex);
   // Add a new request
   Request request;
   request.status = Request::PENDING;
@@ -290,7 +295,7 @@ RequestManager::RequestGuid
 }
 
 bool RequestManager::is_request_completed(RequestGuid const &guid) {
-  const std::lock_guard<std::mutex> lock(request_queue_mutex);
+  std::lock_guard<std::mutex> const lock(request_queue_mutex);
   assert(all_requests.find(guid) != all_requests.end());
   Request const &request = all_requests[guid];
   // return request.tokens.size() >= request.max_sequence_length;
@@ -299,7 +304,7 @@ bool RequestManager::is_request_completed(RequestGuid const &guid) {
 
 GenerationResult
     RequestManager::get_generation_result(RequestGuid const &guid) {
-  const std::lock_guard<std::mutex> lock(request_queue_mutex);
+  std::lock_guard<std::mutex> const lock(request_queue_mutex);
   assert(request_generation_results.find(guid) !=
          request_generation_results.end());
   return request_generation_results[guid];
@@ -337,7 +342,7 @@ BatchConfig RequestManager::prepare_next_batch_task(
 
 BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
                                                InferenceResult const &result) {
-  const std::lock_guard<std::mutex> lock(request_queue_mutex);
+  std::lock_guard<std::mutex> const lock(request_queue_mutex);
 
   // Step 1: append result from previous iteration to request's tokens
   for (int i = 0; i < old_bc.num_tokens; i++) {
@@ -406,13 +411,14 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
         total_request_run_time +=
             profile_info.finish_time - profile_info.start_time;
         profiling_requests[request.guid] = profile_info;
-        log_req_mgr.print("[Profile] guid(%zu) decoding_steps(%d) start(%.1lf) "
-                          "finish(%.1lf) latency(%.1lf)",
-                          request.guid,
-                          profile_info.decoding_steps,
-                          profile_info.start_time,
-                          profile_info.finish_time,
-                          profile_info.finish_time - profile_info.start_time);
+        log_req_mgr.print(
+            "[Profile] guid(%zu) llm_decoding_steps(%d) start(%.1lf) "
+            "finish(%.1lf) latency(%.1lf)",
+            request.guid,
+            profile_info.llm_decoding_steps,
+            profile_info.start_time,
+            profile_info.finish_time,
+            profile_info.finish_time - profile_info.start_time);
         // Write output to file if needed:
         if (!output_filepath.empty()) {
           std::ofstream outputFile(output_filepath, std::ios::app);
@@ -420,8 +426,8 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
             outputFile << "end-to-end latency: " << std::fixed
                        << std::setprecision(3) << total_request_run_time
                        << std::endl;
-            outputFile << "num decoding steps: " << profile_info.decoding_steps
-                       << std::endl;
+            outputFile << "num decoding steps: "
+                       << profile_info.llm_decoding_steps << std::endl;
             outputFile << "token IDs: ";
             for (int i = 0; i < request.tokens.size(); i++) {
               outputFile << request.tokens[i];
@@ -469,7 +475,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
         }
         // Update profiling
         profiling_requests[new_bc.requestsInfo[i].request_guid]
-            .decoding_steps++;
+            .llm_decoding_steps++;
       }
     }
   }
@@ -494,7 +500,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
         new_bc.request_completed[i] = false;
         // add profile_info for the new request
         ProfileInfo profile_info;
-        profile_info.decoding_steps = 1;
+        profile_info.llm_decoding_steps = 1;
         profile_info.start_time = Realm::Clock::current_time_in_microseconds();
         profiling_requests[new_request.guid] = profile_info;
         for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
@@ -553,7 +559,7 @@ BeamSearchBatchConfig
     RequestManager::prepare_next_batch_init(TreeVerifyBatchConfig const &old_bc,
                                             InferenceResult const &result,
                                             int model_id) {
-  const std::lock_guard<std::mutex> lock(request_queue_mutex);
+  std::lock_guard<std::mutex> const lock(request_queue_mutex);
   if (verbose) {
     std::cout << "\n############### prepare_next_batch_init ###############\n";
   }
@@ -664,16 +670,18 @@ BeamSearchBatchConfig
         // Log profiling info
         ProfileInfo profile_info = profiling_requests[request.guid];
         profile_info.finish_time = Realm::Clock::current_time_in_microseconds();
+        profile_info.ssm_decoding_steps = 0;
         total_request_run_time +=
             profile_info.finish_time - profile_info.start_time;
         profiling_requests[request.guid] = profile_info;
-        log_req_mgr.print("[Profile] guid(%zu) decoding_steps(%d) start(%.1lf) "
-                          "finish(%.1lf) latency(%.1lf)",
-                          request.guid,
-                          profile_info.decoding_steps,
-                          profile_info.start_time,
-                          profile_info.finish_time,
-                          profile_info.finish_time - profile_info.start_time);
+        log_req_mgr.print(
+            "[Profile] guid(%zu) llm_decoding_steps(%d) start(%.1lf) "
+            "finish(%.1lf) latency(%.1lf)",
+            request.guid,
+            profile_info.llm_decoding_steps,
+            profile_info.start_time,
+            profile_info.finish_time,
+            profile_info.finish_time - profile_info.start_time);
 
         // Write output to file if needed:
         if (!output_filepath.empty()) {
@@ -682,8 +690,8 @@ BeamSearchBatchConfig
             outputFile << "end-to-end latency: " << std::fixed
                        << std::setprecision(3) << total_request_run_time
                        << std::endl;
-            outputFile << "num decoding steps: " << profile_info.decoding_steps
-                       << std::endl;
+            outputFile << "num decoding steps: "
+                       << profile_info.llm_decoding_steps << std::endl;
             outputFile << "token IDs: ";
             for (int i = 0; i < request.tokens.size(); i++) {
               outputFile << request.tokens[i];
@@ -726,8 +734,14 @@ BeamSearchBatchConfig
             new_bc.requestsInfo[i].first_token_depth_in_request -
             verified_tokens.size();
         new_bc.beamRequestsInfo[i].current_depth = 1;
+
+        profiling_requests[request.guid].ssm_decoding_steps = 0;
+
+        int ssm_decoding_steps = 0;
         new_bc.beamRequestsInfo[i].beam_size =
-            BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+            spec_infer_tree_width.size() > ssm_decoding_steps
+                ? spec_infer_tree_width[ssm_decoding_steps]
+                : 1;
         new_bc.beamRequestsInfo[i].max_depth =
             std::min(new_max_depth, BeamSearchBatchConfig::MAX_BEAM_DEPTH);
         for (int j = 0; j < BeamSearchBatchConfig::MAX_BEAM_WIDTH; j++) {
@@ -735,6 +749,8 @@ BeamSearchBatchConfig
           new_bc.beamRequestsInfo[i].probs[j] = 1;
         }
 
+        new_bc.beamRequestsInfo[i].sub_request_num = 1;
+
         new_bc.sub_requests[i] = 1;
 
         // Token Info
@@ -746,6 +762,8 @@ BeamSearchBatchConfig
           new_bc.tokensInfo[new_bc.num_tokens].token_id = token.first;
           new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request =
               token.second;
+          new_bc.topology_mask[i].real_token_pos[0][token.second] =
+              new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request;
 
           // Beam Token Info
           new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = 0;
@@ -786,14 +804,20 @@ BeamSearchBatchConfig
 
       // TODO: Beam Request Info, missing from VerifyTreeBatchConfig
       new_bc.beamRequestsInfo[i].current_depth = 1;
+      int ssm_decoding_steps =
+          profiling_requests[request.guid].ssm_decoding_steps;
       new_bc.beamRequestsInfo[i].beam_size =
-          BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+          spec_infer_tree_width.size() > ssm_decoding_steps
+              ? spec_infer_tree_width[ssm_decoding_steps]
+              : 1;
       new_bc.beamRequestsInfo[i].max_depth = 0;
       for (int j = 0; j < BeamSearchBatchConfig::MAX_BEAM_WIDTH; j++) {
         new_bc.beamRequestsInfo[i].parent_id[j] = 0;
         new_bc.beamRequestsInfo[i].probs[j] = 1;
       }
 
+      new_bc.beamRequestsInfo[i].sub_request_num = 1;
+
       new_bc.sub_requests[i] = 1;
 
       // Token Info
@@ -829,12 +853,17 @@ BeamSearchBatchConfig
 
         // add profile_info for the new request
         ProfileInfo profile_info;
-        profile_info.decoding_steps = 0;
+        profile_info.llm_decoding_steps = 0;
+        profile_info.ssm_decoding_steps = 0;
         profile_info.start_time = Realm::Clock::current_time_in_microseconds();
         profiling_requests[new_request.guid] = profile_info;
         // init the beam search metadata per request
+        int ssm_decoding_steps = profile_info.ssm_decoding_steps;
+
         new_bc.beamRequestsInfo[i].beam_size =
-            BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+            spec_infer_tree_width.size() > ssm_decoding_steps
+                ? spec_infer_tree_width[ssm_decoding_steps]
+                : 1;
         new_bc.beamRequestsInfo[i].current_depth = 1;
         new_bc.beamRequestsInfo[i].max_depth =
             std::min(BeamSearchBatchConfig::MAX_BEAM_DEPTH,
@@ -846,6 +875,7 @@ BeamSearchBatchConfig
         }
 
         new_bc.request_completed[i] = false;
+        new_bc.beamRequestsInfo[i].sub_request_num = 1;
         new_bc.sub_requests[i] = 1;
 
         for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
@@ -855,6 +885,7 @@ BeamSearchBatchConfig
           assert(depth < new_request.tokens.size());
           new_bc.tokensInfo[new_bc.num_tokens].token_id =
               new_request.tokens[depth];
+          new_bc.topology_mask[i].real_token_pos[0][depth] = depth;
 
           // beam search meta data, indicate which sub request this token
           // belongs to, init to 0;
@@ -937,7 +968,7 @@ BeamSearchBatchConfig RequestManager::prepare_next_batch_beam_task(
 BeamSearchBatchConfig
     RequestManager::prepare_next_batch_beam(BeamSearchBatchConfig const &old_bc,
                                             BeamInferenceResult const &result) {
-  const std::lock_guard<std::mutex> lock(request_queue_mutex);
+  std::lock_guard<std::mutex> const lock(request_queue_mutex);
   if (verbose) {
     std::cout << "\n############### prepare_next_batch_beam ###############\n";
   }
@@ -1005,25 +1036,38 @@ BeamSearchBatchConfig
       new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
       new_bc.requestsInfo[i].max_sequence_length =
           old_bc.requestsInfo[i].max_sequence_length;
-
+      profiling_requests[request.guid].ssm_decoding_steps += 1;
       // update the beam search metadata
       // how many sub request in current request
       // why is sub_requests has max_requests_per_batch() * MAX_BEAM_WIDTH
       // entries?
-      new_bc.sub_requests[i] = old_bc.beamRequestsInfo[i].beam_size;
-
       // update the parentid, accumalated_probs, depth, and token_ids
+      int ssm_decoding_steps =
+          profiling_requests[request.guid].ssm_decoding_steps;
+
       new_bc.beamRequestsInfo[i].beam_size =
-          old_bc.beamRequestsInfo[i].beam_size;
+          spec_infer_tree_width.size() > ssm_decoding_steps
+              ? spec_infer_tree_width[ssm_decoding_steps]
+              : 1;
       new_bc.beamRequestsInfo[i].max_depth =
           old_bc.beamRequestsInfo[i].max_depth;
 
+      new_bc.sub_requests[i] =
+          old_bc.sub_requests[i] * new_bc.beamRequestsInfo[i].beam_size;
+      new_bc.beamRequestsInfo[i].sub_request_num =
+          old_bc.beamRequestsInfo[i].sub_request_num *
+          new_bc.beamRequestsInfo[i].beam_size;
+
+      assert(new_bc.beamRequestsInfo[i].sub_request_num <=
+             BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES);
+
       if (request.status == Request::RUNNING) {
         new_bc.beamRequestsInfo[i].current_depth =
             old_bc.beamRequestsInfo[i].current_depth + 1;
         new_bc.request_running[i] = true;
         // do the slot exchange to minimize the cache exchange in kernel.
-        update_beam_metadata(new_bc, request.beam_trees.at(old_bc.model_id), i);
+        update_beam_metadata(
+            new_bc, old_bc, request.beam_trees.at(old_bc.model_id), i);
       } else {
         assert(false && "Request should not be pending in beam search phase");
       }
@@ -1059,7 +1103,7 @@ BeamSearchBatchConfig
       // register more tokens due to the beam width
       for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
         int depth = new_bc.requestsInfo[i].first_token_depth_in_request + j;
-        for (int k = 0; k < new_bc.sub_requests[i]; k++) {
+        for (int k = 0; k < new_bc.beamRequestsInfo[i].sub_request_num; k++) {
           new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
           new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = depth;
 
@@ -1103,13 +1147,24 @@ BeamSearchBatchConfig
       // how many sub request in current request
       // why is sub_requests has max_requests_per_batch() * MAX_BEAM_WIDTH
       // entries?
-      new_bc.sub_requests[i] = old_bc.beamRequestsInfo[i].beam_size;
+      int ssm_decoding_steps =
+          profiling_requests[request.guid].ssm_decoding_steps;
 
-      // update the parentid, accumalated_probs, depth, and token_ids
       new_bc.beamRequestsInfo[i].beam_size =
-          old_bc.beamRequestsInfo[i].beam_size;
+          spec_infer_tree_width.size() > ssm_decoding_steps
+              ? spec_infer_tree_width[ssm_decoding_steps]
+              : 1;
       new_bc.beamRequestsInfo[i].max_depth =
           old_bc.beamRequestsInfo[i].max_depth;
+      new_bc.sub_requests[i] =
+          old_bc.sub_requests[i] * new_bc.beamRequestsInfo[i].beam_size;
+      new_bc.beamRequestsInfo[i].sub_request_num =
+          old_bc.beamRequestsInfo[i].sub_request_num *
+          new_bc.beamRequestsInfo[i].beam_size;
+      assert(new_bc.beamRequestsInfo[i].sub_request_num <=
+             BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES);
+
+      // update the parentid, accumalated_probs, depth, and token_ids
 
       if (request.status == Request::PENDING) {
         // if the request is pending, we need to update the beam search
@@ -1152,7 +1207,7 @@ BeamSearchBatchConfig
       // register more tokens due to the beam width
       for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
         int depth = new_bc.requestsInfo[i].first_token_depth_in_request + j;
-        for (int k = 0; k < new_bc.sub_requests[i]; k++) {
+        for (int k = 0; k < new_bc.beamRequestsInfo[i].sub_request_num; k++) {
           new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
           new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = depth;
 
@@ -1209,7 +1264,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify_task(
 
 TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
     std::vector<BeamSearchBatchConfig> const &old_batches) {
-  const std::lock_guard<std::mutex> lock(request_queue_mutex);
+  std::lock_guard<std::mutex> const lock(request_queue_mutex);
 
   std::cout << "\n############### prepare_next_batch_verify ###############\n";
 
@@ -1238,7 +1293,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
     Request &request = all_requests[guid];
 
     // Profiling
-    profiling_requests[request.guid].decoding_steps += 1;
+    profiling_requests[request.guid].llm_decoding_steps += 1;
 
     if (request.status == Request::RUNNING) {
       new_bc.request_running[i] = true;
@@ -1478,16 +1533,19 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
 
       int index = old_bc.tokensInfo[i - 1].request_index;
       int beam_size = old_bc.beamRequestsInfo[index].beam_size;
+
+      // int leaf_node_num = old_bc.sub_requests[index];
+      int leaf_node_num = old_bc.beamRequestsInfo[i].sub_request_num;
       int depth = old_bc.beamRequestsInfo[index].current_depth;
 
       // Each token yields (beam_width) results
-      int beam_width = old_bc.beamRequestsInfo[index].beam_size;
+      // int beam_width = old_bc.beamRequestsInfo[index].beam_size;
 
       // Count tokens sent to model in this request to find the final token's
       // index
       result_index +=
           (old_bc.tokensInfo[i - 1].abs_depth_in_request - start_depth) *
-          beam_width;
+          leaf_node_num;
 
       if (verbose) {
         std::cout << "i = " << i << ", result index = " << result_index
@@ -1514,7 +1572,7 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
         }
       }
 
-      for (int beam_id = 0; beam_id < beam_width; beam_id++) {
+      for (int beam_id = 0; beam_id < leaf_node_num; beam_id++) {
         request.beam_trees.at(old_bc.model_id)
             .treeLayers[depth]
             .tokens[beam_id] = result.token_ids[result_index];
@@ -1546,6 +1604,7 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
 
 // for updating the beam search metadata in requests in incremental phase
 void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
+                                          BeamSearchBatchConfig const &old_bc,
                                           BeamTree &tree,
                                           int request_index) {
 
@@ -1556,6 +1615,9 @@ void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
   int depth = new_bc.beamRequestsInfo[request_index].current_depth - 1;
   int beam_size = new_bc.beamRequestsInfo[request_index].beam_size;
 
+  // int leaf_node_num = old_bc.sub_requests[request_index];
+  int leaf_node_num = old_bc.beamRequestsInfo[request_index].sub_request_num;
+
   if (new_bc.beamRequestsInfo[request_index].current_depth ==
       1) { // TODO: check if this is correct
     // for (int j = 0; j < beam_size; j++) {
@@ -1568,49 +1630,61 @@ void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
     // Do nothing
     // assert(false);
   } else {
-    std::set<int> parents;
-    std::set<int> childs;
-    // cache stealing
-    for (int j = 0; j < beam_size; j++) {
-      int parent_id = tree.treeLayers[depth].parent_ids[j];
-      if (childs.find(parent_id) == childs.end()) {
-        // copy beam slot
-        new_bc.beamRequestsInfo[request_index].parent_id[parent_id] =
-            tree.treeLayers[depth].parent_ids[j];
-        new_bc.beamRequestsInfo[request_index].probs[parent_id] =
-            tree.treeLayers[depth].probs[j];
-        new_bc.beamRequestsInfo[request_index].tokens[parent_id] =
-            tree.treeLayers[depth].tokens[j];
-        parents.emplace(j);
-        childs.emplace(parent_id);
-      }
-    }
-    if (parents.size() < beam_size) {
-      for (int j = 0; j < beam_size; j++) {
-        if (parents.find(j) == parents.end()) {
-          // this slot has not been assigned
-          // find the smallest not assigned child and put in
-          if (verbose) {
-            std::cout << "request_index" << request_index
-                      << ", miss slot: " << j << "\n";
-          }
-          for (int k = 0; k < beam_size; k++) {
-            if (childs.find(k) == childs.end()) {
-              // parent -> j to child k;
-              new_bc.beamRequestsInfo[request_index].parent_id[k] =
-                  tree.treeLayers[depth].parent_ids[j];
-              new_bc.beamRequestsInfo[request_index].probs[k] =
-                  tree.treeLayers[depth].probs[j];
-              new_bc.beamRequestsInfo[request_index].tokens[k] =
-                  tree.treeLayers[depth].tokens[j];
-              parents.emplace(j);
-              childs.emplace(k);
-              break;
-            }
-          }
-        }
-      }
+    for (int j = 0; j < leaf_node_num; j++) {
+      new_bc.beamRequestsInfo[request_index].parent_id[j] =
+          tree.treeLayers[depth].parent_ids[j];
+      new_bc.beamRequestsInfo[request_index].probs[j] =
+          tree.treeLayers[depth].probs[j];
+      new_bc.beamRequestsInfo[request_index].tokens[j] =
+          tree.treeLayers[depth].tokens[j];
+
+      // new_bc.topology_mask[request_index].real_token_pos[j] =
     }
+    assert(false);
+
+    // std::set<int> parents;
+    // std::set<int> childs;
+    // // cache stealing
+    // for (int j = 0; j < beam_size; j++) {
+    //   int parent_id = tree.treeLayers[depth].parent_ids[j];
+    //   if (childs.find(parent_id) == childs.end()) {
+    //     // copy beam slot
+    //     new_bc.beamRequestsInfo[request_index].parent_id[parent_id] =
+    //         tree.treeLayers[depth].parent_ids[j];
+    //     new_bc.beamRequestsInfo[request_index].probs[parent_id] =
+    //         tree.treeLayers[depth].probs[j];
+    //     new_bc.beamRequestsInfo[request_index].tokens[parent_id] =
+    //         tree.treeLayers[depth].tokens[j];
+    //     parents.emplace(j);
+    //     childs.emplace(parent_id);
+    //   }
+    // }
+    // if (parents.size() < beam_size) {
+    //   for (int j = 0; j < beam_size; j++) {
+    //     if (parents.find(j) == parents.end()) {
+    //       // this slot has not been assigned
+    //       // find the smallest not assigned child and put in
+    //       if (verbose) {
+    //         std::cout << "request_index" << request_index
+    //                   << ", miss slot: " << j << "\n";
+    //       }
+    //       for (int k = 0; k < beam_size; k++) {
+    //         if (childs.find(k) == childs.end()) {
+    //           // parent -> j to child k;
+    //           new_bc.beamRequestsInfo[request_index].parent_id[k] =
+    //               tree.treeLayers[depth].parent_ids[j];
+    //           new_bc.beamRequestsInfo[request_index].probs[k] =
+    //               tree.treeLayers[depth].probs[j];
+    //           new_bc.beamRequestsInfo[request_index].tokens[k] =
+    //               tree.treeLayers[depth].tokens[j];
+    //           parents.emplace(j);
+    //           childs.emplace(k);
+    //           break;
+    //         }
+    //       }
+    //     }
+    //   }
+    // }
   }
   if (verbose) {
     std::cout << "-----------after parent id exchange-----------" << std::endl;
diff --git a/src/runtime/request_manager.cpp b/src/runtime/request_manager.cpp
index 1e756606f8..9635b3bc1e 100644
--- a/src/runtime/request_manager.cpp
+++ b/src/runtime/request_manager.cpp
@@ -56,6 +56,22 @@ void RequestManager::load_tokens_task(
                            sizeof(TokenId) * batch_config->num_tokens,
                            hipMemcpyHostToDevice,
                            stream));
+
+  // copy meta data to workSpace
+  FFHandler handle = *((FFHandler const *)task->local_args);
+  cudaMemcpyAsync(handle.batch_config_metadata,
+                  &(batch_config->tokensInfo),
+                  batch_config->num_active_tokens() *
+                      sizeof(BatchConfig::PerTokenInfo),
+                  cudaMemcpyHostToDevice,
+                  stream);
+  cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+                      sizeof(BatchConfig::tokensInfo),
+                  &(batch_config->requestsInfo),
+                  batch_config->max_requests_per_batch() *
+                      sizeof(BatchConfig::PerRequestInfo),
+                  cudaMemcpyHostToDevice,
+                  stream);
 }
 
 void RequestManager::load_positions_task(
diff --git a/src/runtime/request_manager.cu b/src/runtime/request_manager.cu
index cd3e03fff6..f4500d152d 100644
--- a/src/runtime/request_manager.cu
+++ b/src/runtime/request_manager.cu
@@ -30,6 +30,7 @@ void RequestManager::load_tokens_task(
 
   // BatchConfig const batch_config = *((BatchConfig *)task->args);
   BatchConfig const *batch_config = BatchConfig::from_future(task->futures[0]);
+
   BatchConfig::TokenId dram_copy[BatchConfig::MAX_NUM_TOKENS];
 
   // Extreme long prompts are not supported, only load up to
@@ -55,6 +56,55 @@ void RequestManager::load_tokens_task(
                             sizeof(TokenId) * batch_config->num_tokens,
                             cudaMemcpyHostToDevice,
                             stream));
+
+  // copy meta data to workSpace
+  FFHandler handle = *((FFHandler const *)task->local_args);
+  cudaMemcpyAsync(handle.batch_config_metadata,
+                  &(batch_config->tokensInfo),
+                  batch_config->num_active_tokens() *
+                      sizeof(BatchConfig::PerTokenInfo),
+                  cudaMemcpyHostToDevice,
+                  stream);
+  cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+                      sizeof(BatchConfig::tokensInfo),
+                  &(batch_config->requestsInfo),
+                  batch_config->max_requests_per_batch() *
+                      sizeof(BatchConfig::PerRequestInfo),
+                  cudaMemcpyHostToDevice,
+                  stream);
+
+  
+  // load speculative metadata
+  if (batch_config->get_mode() == BEAM_SEARCH_MODE) {
+    BeamSearchBatchConfig const *beam_batch_config =
+        static_cast<BeamSearchBatchConfig const *>(batch_config);
+
+    cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+                      sizeof(BatchConfig::tokensInfo) +
+                      sizeof(BatchConfig::requestsInfo),
+                  &(beam_batch_config->topology_mask),
+                  sizeof(BeamSearchBatchConfig::topology_mask),
+                  cudaMemcpyHostToDevice,
+                  stream);
+
+    cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+                        sizeof(BatchConfig::tokensInfo) +
+                        sizeof(BatchConfig::requestsInfo) +
+                        sizeof(BeamSearchBatchConfig::topology_mask),
+                    &(beam_batch_config->beamRequestsInfo),
+                    sizeof(BeamSearchBatchConfig::beamRequestsInfo),
+                    cudaMemcpyHostToDevice,
+                    stream);
+    cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+                        sizeof(BatchConfig::tokensInfo) +
+                        sizeof(BatchConfig::requestsInfo) +
+                        sizeof(BeamSearchBatchConfig::topology_mask) +
+                        sizeof(BeamSearchBatchConfig::beamRequestsInfo),
+                    &(beam_batch_config->beamTokenInfo),
+                    sizeof(BeamSearchBatchConfig::beamTokenInfo),
+                    cudaMemcpyHostToDevice,
+                    stream);
+  }
 }
 
 void RequestManager::load_positions_task(

From d3a57cb22b080741d9677d82701f035ccd33f8da Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Tue, 26 Dec 2023 03:09:33 -0500
Subject: [PATCH 272/344] fix speculative

---
 include/flexflow/batch_config.h               |  4 +-
 inference/models/llama.cc                     |  1 +
 inference/spec_infer/spec_infer.cc            |  4 +-
 src/ops/beam_topk.cc                          | 11 ++-
 src/ops/beam_topk.cu                          | 61 ++++++------
 .../specinfer_inc_multihead_self_attention.cu | 91 +++++++++++-------
 src/runtime/inference_manager.cc              |  1 +
 src/runtime/request_manager.cc                | 93 +++++++++++++++----
 src/runtime/request_manager.cu                | 10 +-
 9 files changed, 185 insertions(+), 91 deletions(-)

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index c33c3558cc..dd947bbd85 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -126,11 +126,11 @@ class BeamSearchBatchConfig : public BatchConfig {
 
   size_t beam_width;
   size_t target_iterations;
-  inline static int const MAX_BEAM_WIDTH = 1;
+  inline static int const MAX_BEAM_WIDTH = 3;
   inline static int const MAX_BEAM_DEPTH = 8;
 
   // maximum tree branches for a request
-  inline static int const MAX_SPECULATIVE_TREE_BRANCHES = 9;
+  inline static int const MAX_SPECULATIVE_TREE_BRANCHES = 3;
 
   int model_id;
 
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index f62df1b1d7..4f76e9e0fa 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -248,6 +248,7 @@ void LLAMA::create_llama_model(FFModel &ff,
     // output = ff.beam_top_k(softmax, llama_config.max_beam_width, false);
     // output = ff.argmax(softmax, /*beam_Search*/ true);
     output = ff.beam_top_k(softmax, llama_config.max_beam_width, false);
+    // output = ff.top_k(softmax, )
   } else {
     // Tensor softmax = ff.softmax(dense, -1);
     if (generation_config.do_sample) {
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index e2594ba87f..2ccdfd388d 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -303,7 +303,7 @@ void FlexFlow::top_level_task(Task const *task,
   rm->register_output_filepath(file_paths.output_file_path);
 
   //first decoding step: 3 results
-  rm->push_spec_infer_tree_width(1);
+  rm->push_spec_infer_tree_width(3);
 
   // Create LLM model
   FFModel tree_model(ffconfig, ffconfig.cpu_offload);
@@ -404,7 +404,7 @@ void FlexFlow::top_level_task(Task const *task,
       prompts.push_back(text);
       // tree_model.generate(text, 128 /*max_sequence_length*/);
     }
-    tree_model.generate(prompts, 128 /*max_sequence_length*/);
+    tree_model.generate(prompts, 15 /*max_sequence_length*/);
   }
 
   // Execution fence
diff --git a/src/ops/beam_topk.cc b/src/ops/beam_topk.cc
index 2883428254..3f636c2c98 100644
--- a/src/ops/beam_topk.cc
+++ b/src/ops/beam_topk.cc
@@ -366,14 +366,18 @@ BeamInferenceResult
   GenericTensorAccessorW value = helperGetGenericTensorAccessorWO(
       DT_FLOAT, regions[2], task->regions[2], FID_DATA, ctx, runtime);
   GenericTensorAccessorW parent = helperGetGenericTensorAccessorWO(
-      DT_FLOAT, regions[3], task->regions[3], FID_DATA, ctx, runtime);
+      DT_INT32, regions[3], task->regions[3], FID_DATA, ctx, runtime);
 
   Domain input_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
-
+  
+  printf("----------1-----------\n");
   int *index_ptr = index.get_int32_ptr();
+  printf("----------2-----------\n");
   float *value_ptr = value.get_float_ptr();
+  printf("----------3-----------\n");
   int *parent_ptr = parent.get_int32_ptr();
+  printf("----------4-----------\n");
 
   // embedding size: eg. 4096
   int length = input_domain.hi()[0] - input_domain.lo()[0] + 1;
@@ -398,6 +402,9 @@ BeamInferenceResult
   download_tensor<int>(
       parent_ptr, ir.parent_id, batch_size * m->max_beam_width);
 
+  print_tensor<int>(index_ptr, 32, "indexxxxxxx");
+  printf("max beam width %d\n", m->max_beam_width);
+
   if (m->inference_debugging) {
     assert(task->index_point.get_dim() == 1);
     int shard_id = task->index_point.point_data[0];
diff --git a/src/ops/beam_topk.cu b/src/ops/beam_topk.cu
index 72ab7862a6..515bba4bc0 100644
--- a/src/ops/beam_topk.cu
+++ b/src/ops/beam_topk.cu
@@ -379,9 +379,9 @@ template <typename T>
 __global__ void
     mergeSubRequestsKernel(int64_t N, T const *X, T const *rstd, T *Y) {
   using T_ACC = T;
-  const int64_t i = blockIdx.x;
+  int64_t const i = blockIdx.x;
   for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
-    const int64_t index = i * N + j;
+    int64_t const index = i * N + j;
     Y[index] = static_cast<T_ACC>(X[index]) * static_cast<T_ACC>(rstd[i]);
   }
 }
@@ -556,8 +556,7 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
     int beam_size = bc->beamRequestsInfo[i].beam_size;
 
     // initial request
-    log_beam_topk.debug() << "sub_requests: " << i << ", " << sub_requests[i]
-                          << "\n";
+    std::cout << "sub_requests: " << i << ", " << sub_requests[i] << "\n";
     assert(sub_requests[i] > 0);
     // process sub requests
     for (int j = 0; j < sub_requests[i]; j++) {
@@ -565,12 +564,12 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
       // beam_slots[i].parent_id[j];
       acc_probs[req_index * BeamSearchBatchConfig::MAX_BEAM_WIDTH + j] =
           bc->beamRequestsInfo[i].probs[j];
-      log_beam_topk.debug()
-          << "probbbb req: " << i
-          << ", sub req probability : " << bc->beamRequestsInfo[i].probs[j]
-          << ", sub request id " << j << ", parent id "
-          << bc->beamRequestsInfo[i].parent_id[j] << ", data inddd"
-          << req_index * BeamSearchBatchConfig::MAX_BEAM_WIDTH + j << "\n";
+      std::cout << "probbbb req: " << i << ", sub req probability : "
+                << bc->beamRequestsInfo[i].probs[j] << ", sub request id " << j
+                << ", parent id " << bc->beamRequestsInfo[i].parent_id[j]
+                << ", data inddd"
+                << req_index * BeamSearchBatchConfig::MAX_BEAM_WIDTH + j
+                << "\n";
     }
 
     // process tokens
@@ -584,6 +583,8 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
 
     max_heap_size = std::max(max_heap_size, beam_size * sub_requests[i]);
     max_beam_width = std::max(max_beam_width, beam_size);
+
+    std::cout << "max beam width: " << max_beam_width << "\n";
     req_index += 1;
     block_start_index += (sub_requests[i] - 1) * num_new_tokens * length;
   }
@@ -613,26 +614,34 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
   assert(num_shards >= (size_t)max_heap_size);
   num_shards = max_heap_size;
 
-  checkCUDA(cudaMemcpy(m->parent_ids,
-                       parent_ids,
-                       sizeof(int) * max_total_requests,
-                       cudaMemcpyHostToDevice));
-  checkCUDA(cudaMemcpy(m->acc_probs,
-                       acc_probs,
-                       sizeof(DT) * max_total_requests,
-                       cudaMemcpyHostToDevice));
-  checkCUDA(cudaMemcpy(m->block_start_index,
-                       beam_block_start_index.data(),
-                       sizeof(int) * beam_num_blocks,
-                       cudaMemcpyHostToDevice));
-  checkCUDA(cudaMemcpy(m->request_id,
+  checkCUDA(cudaMemcpyAsync(m->parent_ids,
+                            parent_ids,
+                            sizeof(int) * max_total_requests,
+                            cudaMemcpyHostToDevice,
+                            stream));
+  checkCUDA(cudaMemcpyAsync(m->acc_probs,
+                            acc_probs,
+                            sizeof(DT) * max_total_requests,
+                            cudaMemcpyHostToDevice,
+                            stream));
+  // trick, set acc_probs to 0;
+  checkCUDA(
+      cudaMemsetAsync(m->acc_probs, 1.0, batch_size * sizeof(DT), stream));
+  checkCUDA(cudaMemcpyAsync(m->block_start_index,
+                            beam_block_start_index.data(),
+                            sizeof(int) * beam_num_blocks,
+                            cudaMemcpyHostToDevice,
+                            stream));
+  checkCUDA(cudaMemcpyAsync(m->request_id,
                        request_id.data(),
                        sizeof(int) * beam_num_blocks,
-                       cudaMemcpyHostToDevice));
-  checkCUDA(cudaMemcpy(m->tokens_per_request,
+                       cudaMemcpyHostToDevice,
+                       stream));
+  checkCUDA(cudaMemcpyAsync(m->tokens_per_request,
                        tokens_per_request.data(),
                        sizeof(int) * beam_num_blocks,
-                       cudaMemcpyHostToDevice));
+                       cudaMemcpyHostToDevice,
+                       stream));
   // int depth =
   //     bc->beamRequestsInfo[bc->tokensInfo[0].request_index].current_depth;
   beam_topk_forward_kernel<<<beam_num_blocks, num_shards, 0, stream>>>(
diff --git a/src/ops/specinfer_inc_multihead_self_attention.cu b/src/ops/specinfer_inc_multihead_self_attention.cu
index 0bdf07a9d7..9d6f70d5ba 100644
--- a/src/ops/specinfer_inc_multihead_self_attention.cu
+++ b/src/ops/specinfer_inc_multihead_self_attention.cu
@@ -133,6 +133,13 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
           q_ptr + (hidden_size * QKV_WEIGHT_NUM * sub_req_idx) + ki +
           ii * THREADS_PER_KEY * K_VEC_SIZE);
     }
+
+     if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
+    printf("cacheposssss %d, %d\n", tree_branch_num, topology.real_token_pos[0][0]);
+     printf("cacheposssss %d, %d\n", tree_branch_num, topology.real_token_pos[0][1]);
+      printf("cacheposssss %d, %d\n", tree_branch_num, topology.real_token_pos[0][2]);
+       printf("cacheposssss %d, %d\n", tree_branch_num, topology.real_token_pos[0][10]);
+  }
     __syncthreads();
     for (int ti = ko; ti < ti_end; ti += K_PER_ITER) {
       K_vec k[K_VECS_PER_THREAD];
@@ -317,26 +324,38 @@ __global__ void specinfer_store_kv_cache(
     DT kVal = devQKVProjArray[val_idx];
     DT vVal = devQKVProjArray[val_idx + hidden_size];
 
-    // above no need to be changed
-    // int const req_id = id_map[token_idx].request_index;
-    // int const tok_id = id_map[token_idx].token_position;
-    // int const sub_req_id = id_map[token_idx].sub_request_index;
-    // int const parent_id = id_map[token_idx].parent_id;
-    // int const beam_depth = id_map[token_idx].beam_depth;
-    // int const beam_width = id_map[token_idx].beam_width;
-
     int const req_id = tokenInfos[token_idx].request_index;
     int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
+    int const first_token_in_req = requestInfo[req_id].first_token_depth_in_request;
     int const sub_req_id = beamTokenInfos[token_idx].sub_request_index;
-    // int const parent_id = beamRequestInfos[req_id].parent_id[sub_req_id];
-    // int const beam_depth = beamRequestInfos[req_id].current_depth;
-    // int const beam_width = beamRequestInfos[req_id].beam_size;
     int const allocated_tokens = beam_topology_mask[req_id].allocated_tokens;
 
+    int const beam_size = beamRequestInfos[req_id].sub_request_num;
+
+    int real_idx = tok_id - first_token_in_req + allocated_tokens;
+
+    if (i == 0) {
+      printf("ffasdasds%d, %d, %d, %d, %d, %d\n",
+             beamTokenInfos[0].sub_request_index,
+             allocated_tokens,
+             sub_req_id,
+             tok_id,
+             first_token_in_req,
+             real_idx);
+    }
+    // }else if(i == hidden_size * 2){
+    //   printf("ffasdasdskkkk%d, %d, %d\n", allocated_tokens, tok_id,
+    //   sub_req_id);
+    // }
+    
+    
+
     kCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
-               (allocated_tokens + sub_req_id) * hidden_size + offset] = kVal;
+               (real_idx) * hidden_size +
+               offset] = kVal;
     vCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
-               (allocated_tokens + sub_req_id) * hidden_size + offset] = vVal;
+               (real_idx) * hidden_size +
+               offset] = vVal;
   }
 }
 
@@ -350,6 +369,9 @@ void update_kv_cache_kernel(SpecInferIncMultiHeadSelfAttentionMeta const *m,
   // assert(curr_depth < 3);
   if (num_tokens > 0) {
     int parallelism = m->hidden_size * KV_WEIGHT_NUM * num_tokens;
+    printf("tokenInfo %d, %d\n",
+           bc->beamTokenInfo[0].sub_request_index,
+           num_tokens);
     specinfer_store_kv_cache<<<GET_BLOCKS(parallelism),
                                min(CUDA_NUM_THREADS, parallelism),
                                0,
@@ -484,10 +506,11 @@ void compute_attention_kernel_prompt(
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
     if (bc->request_completed[i]) {
       continue;
-    } else if (tokens_previous_requests < bc->num_generation_tokens) {
-      tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
-      continue;
-    }
+    } 
+    // else if (tokens_previous_requests < bc->num_generation_tokens) {
+    //   tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
+    //   continue;
+    // }
 
     // all requests in prompt phase should only have one sub requests;
     assert(bc->sub_requests[i] == 1);
@@ -523,6 +546,9 @@ void compute_attention_kernel_prompt(
                       m->qProjSize * m->num_q_heads * QKV_WEIGHT_NUM;
     // To get B, skip over K entries from previous requests (all heads +
     // padding)
+
+    print_tensor<float>((float*)A, 32, "A");
+    std::cout << "meta: " << num_new_tokens << ", " << total_tokens << "\n";
     DT const *B = static_cast<DT *>(m->keyCache) +
                   (i * bc->MAX_SPECULATIVE_TREE_BRANCHES) * kt_req_block_size;
 
@@ -557,6 +583,7 @@ void compute_attention_kernel_prompt(
                                          m->num_q_heads,
                                          compute_type,
                                          CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+    print_tensor<float>((float*)C, 32, "C");
     // add alibi position bias to qk production
     // add alibi position bias to qk production
     if (*m->position_bias) {
@@ -641,6 +668,8 @@ void compute_attention_kernel_prompt(
     B = C_softmax;
     // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
     // requests
+
+    print_tensor<float>((float*)C_softmax, 32, "C_softmax");
     C = static_cast<DT *>(m->attn_heads) +
         (tokens_previous_requests + bc->num_generation_tokens) *
             m->num_q_heads * m->vProjSize;
@@ -695,6 +724,8 @@ void inference_kernel(SpecInferIncMultiHeadSelfAttentionMeta const *m,
                      stream);
   // phase 2: Update key/val cache
   update_kv_cache_kernel<DT>(m, bc, stream);
+  std::cout << "specinfer kernel token num: " << bc->num_generation_tokens
+            << ", " << bc->num_tokens << "\n";
   if (bc->num_generation_tokens > 0) {
     compute_specinfer_attention_kernel_generation<DT>(
         m, bc, static_cast<DT *>(m->attn_heads), stream);
@@ -705,6 +736,8 @@ void inference_kernel(SpecInferIncMultiHeadSelfAttentionMeta const *m,
     compute_attention_kernel_prompt(
         m, bc, shard_id, output_ptr, bias_ptr, weight_ptr, stream);
   }
+  // compute_attention_kernel_prompt(
+  //       m, bc, shard_id, output_ptr, bias_ptr, weight_ptr, stream);
 
   // compute output production and bias together for all tokens
   int num_tokens = bc->num_active_tokens();
@@ -783,6 +816,12 @@ void SpecInferIncMultiHeadSelfAttention::inference_kernel_wrapper(
     // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
     // acc_output.rect, "[Attention:forward:output]");
   }
+
+  // if(bc->num_tokens == 1){
+  //   print_tensor<float>(input.get_float_ptr(), 32, "specinc input");
+  //   print_tensor<float>(output.get_float_ptr(), 32, "specinc output");
+  //   assert(false);
+  // }
 }
 
 SpecInferIncMultiHeadSelfAttentionMeta::SpecInferIncMultiHeadSelfAttentionMeta(
@@ -825,24 +864,6 @@ SpecInferIncMultiHeadSelfAttentionMeta::SpecInferIncMultiHeadSelfAttentionMeta(
 
   // allocate memory for the seqArray and reserve space
   {
-    // int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
-    // size_t beam_tokeninfo_size =
-    //     max_tokens_per_batch * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
-    // size_t requestinfo_size =
-    // BeamSearchBatchConfig::max_requests_per_batch(); size_t
-    // beam_requestinfo_size =
-    //     BeamSearchBatchConfig::max_requests_per_batch();
-    // size_t total_size =
-    //     beam_tokeninfo_size *
-    //         sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo) +
-    //     beam_requestinfo_size *
-    //         sizeof(BeamSearchBatchConfig::
-    //                    BeamSearchPerRequestInfo); // more components will
-    //                                               // be added here later
-
-    // We always directly allocate memory for small speculative models
-    // gpu_mem_allocator.create_legion_instance(beam_search_reserve_inst,
-    //                                          total_size);
     beam_topology_mask =
         static_cast<BeamSearchBatchConfig::SpecInferTopology *>(
             handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index fb978adfff..52fd64c606 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -257,6 +257,7 @@ void InferenceManager::init_operators_inference(FFModel *model) {
         ((ParallelOp *)op)
             ->create_input_partition_inference(*model, inputs, outputs);
       }
+      printf("init op %s\n", op->name);
       op->init_inference(*model, inputs, outputs);
     }
   }
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index e1b591c320..845a580c13 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -714,7 +714,8 @@ BeamSearchBatchConfig
         dfs_tree_inputs.erase(request.guid);
 
       } else { // Request not finished, pass verified_tokens to next iteration
-
+        
+        std::cout << "parse to next iteration: " << "\n";
         new_bc.request_completed[i] = false;
         new_bc.request_running[i] = true;
 
@@ -752,6 +753,12 @@ BeamSearchBatchConfig
         new_bc.beamRequestsInfo[i].sub_request_num = 1;
 
         new_bc.sub_requests[i] = 1;
+        new_bc.topology_mask[i].allocated_tokens = request.tokens.size();
+
+        //assign new kv cache position
+        for(int j = 0; j < request.tokens.size(); j++){
+          new_bc.topology_mask[i].real_token_pos[0][j] = j;
+        }
 
         // Token Info
         for (int j = 0; j < verified_tokens.size(); j++) {
@@ -768,6 +775,8 @@ BeamSearchBatchConfig
           // Beam Token Info
           new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = 0;
           new_bc.num_tokens++;
+          std::cout << "num_gen ++ " << "\n";
+          num_generation_tokens++;
 
           // Add verified token to request's token list
           request.tokens.push_back(token.first);
@@ -776,6 +785,8 @@ BeamSearchBatchConfig
             break;
           }
         }
+        
+
         std::string output = this->tokenizer_->Decode(request.tokens);
         // Unlike Huggingface, the sentencepiece C++ library automatically
         // removes the BOS token
@@ -817,6 +828,7 @@ BeamSearchBatchConfig
       }
 
       new_bc.beamRequestsInfo[i].sub_request_num = 1;
+      new_bc.topology_mask[i].allocated_tokens = 0;
 
       new_bc.sub_requests[i] = 1;
 
@@ -875,7 +887,11 @@ BeamSearchBatchConfig
         }
 
         new_bc.request_completed[i] = false;
+
         new_bc.beamRequestsInfo[i].sub_request_num = 1;
+        printf("sub request num == 1, %d \n",
+               new_bc.beamRequestsInfo[i].beam_size);
+
         new_bc.sub_requests[i] = 1;
 
         for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
@@ -892,6 +908,7 @@ BeamSearchBatchConfig
           new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = 0;
           new_bc.num_tokens++;
         }
+        new_bc.topology_mask[i].allocated_tokens = 0;
 
         // if (new_bc.requestsInfo[i].num_tokens_in_batch <
         // new_request.initial_len) {
@@ -927,6 +944,8 @@ BeamSearchBatchConfig
   }
   new_bc.num_generation_tokens = num_generation_tokens;
 
+  std::cout << "prepare next batch init gen tokens: " << new_bc.num_generation_tokens << "\n";
+
   if (verbose) {
     std::cout << "prepare_next_batch_init OLD vs NEW batchconfigs below:"
               << std::endl;
@@ -969,10 +988,10 @@ BeamSearchBatchConfig
     RequestManager::prepare_next_batch_beam(BeamSearchBatchConfig const &old_bc,
                                             BeamInferenceResult const &result) {
   std::lock_guard<std::mutex> const lock(request_queue_mutex);
-  if (verbose) {
+  if (true) {
     std::cout << "\n############### prepare_next_batch_beam ###############\n";
   }
-  if (verbose) {
+  if (true) {
     std::cout << "print all results"
               << "\n";
     for (int i = 0; i < 40; i++) {
@@ -980,6 +999,8 @@ BeamSearchBatchConfig
     }
     std::cout << "Current Beam Depth: "
               << old_bc.beamRequestsInfo[0].current_depth << "\n";
+    std::cout << "Current sub request num: "
+              << old_bc.beamRequestsInfo[0].sub_request_num << "\n";
   }
   // Step 1: Store result to the beam tree struct
   store_beam_metadata(old_bc, result);
@@ -1049,6 +1070,7 @@ BeamSearchBatchConfig
           spec_infer_tree_width.size() > ssm_decoding_steps
               ? spec_infer_tree_width[ssm_decoding_steps]
               : 1;
+
       new_bc.beamRequestsInfo[i].max_depth =
           old_bc.beamRequestsInfo[i].max_depth;
 
@@ -1154,13 +1176,16 @@ BeamSearchBatchConfig
           spec_infer_tree_width.size() > ssm_decoding_steps
               ? spec_infer_tree_width[ssm_decoding_steps]
               : 1;
+      printf("beam size: %d, %d\n",
+             new_bc.beamRequestsInfo[i].beam_size,
+             ssm_decoding_steps);
       new_bc.beamRequestsInfo[i].max_depth =
           old_bc.beamRequestsInfo[i].max_depth;
       new_bc.sub_requests[i] =
           old_bc.sub_requests[i] * new_bc.beamRequestsInfo[i].beam_size;
       new_bc.beamRequestsInfo[i].sub_request_num =
-          old_bc.beamRequestsInfo[i].sub_request_num *
-          new_bc.beamRequestsInfo[i].beam_size;
+          old_bc.beamRequestsInfo[i].sub_request_num;
+
       assert(new_bc.beamRequestsInfo[i].sub_request_num <=
              BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES);
 
@@ -1230,6 +1255,16 @@ BeamSearchBatchConfig
     old_bc.print();
     new_bc.print();
   }
+
+  if (true) {
+    std::cout << "print all resultsBBB"
+              << "\n";
+    for (int i = 0; i < 40; i++) {
+      std::cout << result.token_ids[i] << ", ";
+    }
+    std::cout << "Current Beam DepthBBB: "
+              << old_bc.beamRequestsInfo[0].current_depth << "\n";
+  }
   return new_bc;
 }
 
@@ -1296,6 +1331,8 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
     profiling_requests[request.guid].llm_decoding_steps += 1;
 
     if (request.status == Request::RUNNING) {
+      std::cout << "prepare next batch running: pending\n"
+                << "\n";
       new_bc.request_running[i] = true;
       std::cout << "[Verify] Request " << request.guid << " is running"
                 << std::endl;
@@ -1401,6 +1438,8 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       }
 
     } else if (request.status == Request::PENDING) {
+      std::cout << "prepare next batch verify: pending\n"
+                << "\n";
       new_bc.request_running[i] = false;
       if (verbose) {
         std::cout << "[Verify] Request " << request.guid
@@ -1450,6 +1489,9 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
                 << std::endl;
 
       if (request.llm_cache_size < request.initial_len) {
+        std::cout << "Initialization (prompt) phase: "
+                  << new_bc.requestsInfo[i].num_tokens_in_batch << ", "
+                  << old_batches.at(0).beamRequestsInfo[i].beam_size << "\n";
         // Initialization (prompt) phase
         for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
           new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
@@ -1457,7 +1499,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
               request.tokens[request.llm_cache_size + j];
           new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request =
               request.llm_cache_size + j;
-
+          std::cout << "load prompt tokens: " << j << ": " << new_bc.tokensInfo[new_bc.num_tokens].token_id << "\n";
           new_bc.num_tokens++;
         }
 
@@ -1483,6 +1525,8 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
         }
       } else { // launch the request into running phase after loading all prompt
         if (get_max_tokens_per_batch() - new_bc.num_tokens > 0) {
+          std::cout << "Initialization running phase: "
+                    << new_bc.requestsInfo[i].num_tokens_in_batch << "\n";
           request.status = Request::RUNNING;
           new_bc.request_running[i] = true;
 
@@ -1521,7 +1565,7 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
   auto start_depth = old_bc.tokensInfo[0].abs_depth_in_request;
   int result_index = 0;
 
-  if (verbose) {
+  if (true) {
     std::cout << "Store total of " << old_bc.num_tokens
               << " tokens in the current batch.\n";
   }
@@ -1535,7 +1579,8 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
       int beam_size = old_bc.beamRequestsInfo[index].beam_size;
 
       // int leaf_node_num = old_bc.sub_requests[index];
-      int leaf_node_num = old_bc.beamRequestsInfo[i].sub_request_num;
+      int leaf_node_num =
+          old_bc.beamRequestsInfo[index].sub_request_num * beam_size;
       int depth = old_bc.beamRequestsInfo[index].current_depth;
 
       // Each token yields (beam_width) results
@@ -1545,18 +1590,26 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
       // index
       result_index +=
           (old_bc.tokensInfo[i - 1].abs_depth_in_request - start_depth) *
-          leaf_node_num;
+          beam_size;
 
-      if (verbose) {
+      // result_index += old_bc.topology_mask[index].allocated_tokens;
+
+      if (true) {
         std::cout << "i = " << i << ", result index = " << result_index
-                  << ", value: " << result.token_ids[result_index] << "\n";
+                  << ", value: " << result.token_ids[result_index]
+                  << ", leaf node num: " << leaf_node_num << ", depth" << depth
+                  << ", beam size: " << beam_size << "\n";
       }
 
       Request &request = all_requests[old_bc.requestsInfo[index].request_guid];
 
+      if (old_bc.requestsInfo[index].num_tokens_in_batch == 0) {
+        continue;
+      }
+
       if (depth == 1) {
         // store the last input into the tree;
-        if (verbose) {
+        if (true) {
           std::cout << "try to store the input"
                     << "\n";
         }
@@ -1566,7 +1619,7 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
         request.beam_trees.at(old_bc.model_id).treeLayers[0].probs[0] = 1;
         request.beam_trees.at(old_bc.model_id).treeLayers[0].parent_ids[0] = -1;
 
-        if (verbose) {
+        if (true) {
           std::cout << "Store the previous last token to the tree root: "
                     << request.tokens.back() << "\n";
         }
@@ -1583,7 +1636,7 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
             .treeLayers[depth]
             .parent_ids[beam_id] = result.parent_id[result_index];
 
-        if (verbose) {
+        if (true) {
           std::cout << "tree value: " << depth << "token: "
                     << request.beam_trees.at(old_bc.model_id)
                            .treeLayers[depth]
@@ -1592,7 +1645,6 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
         }
         result_index += 1;
       }
-
       // update the guid and start_depth for current request
       if (i < old_bc.num_tokens) {
         guid = old_bc.requestsInfo[index].request_guid;
@@ -1600,6 +1652,10 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
       }
     }
   }
+
+  if (old_bc.num_tokens != 10) {
+    assert(false);
+  }
 }
 
 // for updating the beam search metadata in requests in incremental phase
@@ -1638,7 +1694,6 @@ void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
       new_bc.beamRequestsInfo[request_index].tokens[j] =
           tree.treeLayers[depth].tokens[j];
 
-      // new_bc.topology_mask[request_index].real_token_pos[j] =
     }
     assert(false);
 
@@ -1784,7 +1839,7 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
     // depth) pairs
     for (auto const &pair : inputSerializedTree) {
       oss << " " << pair.second << ":" << pair.first;
-      // log_req_mgr.print("(%d, %d)", pair.first, pair.second);
+      log_req_mgr.print("(%d, %d)", pair.first, pair.second);
     }
     log_req_mgr.print("Input tree:%s", oss.str().c_str());
   }
@@ -1793,7 +1848,7 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
     // outputSerializedTree is an array of (token id, depth + 1) pairs
     std::ostringstream oss;
     for (auto const &pair : outputSerializedTree) {
-      // log_req_mgr.print("(%d, %d)", pair.first, pair.second);
+      log_req_mgr.print("(%d, %d)", pair.first, pair.second);
       oss << " " << pair.second << ":" << pair.first;
     }
     log_req_mgr.print("Output tree:%s", oss.str().c_str());
@@ -1847,7 +1902,7 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
     // log_req_mgr.print("========Verified============");
     std::ostringstream oss;
     for (auto const &pair : verifiedTree) {
-      // log_req_mgr.print("(%d, %d)", pair.first, pair.second);
+      log_req_mgr.print("(%d, %d)", pair.first, pair.second);
       oss << " " << pair.second << ":" << pair.first;
     }
     log_req_mgr.print("Verified:%s", oss.str().c_str());
diff --git a/src/runtime/request_manager.cu b/src/runtime/request_manager.cu
index f4500d152d..b76c5c326e 100644
--- a/src/runtime/request_manager.cu
+++ b/src/runtime/request_manager.cu
@@ -91,17 +91,17 @@ void RequestManager::load_tokens_task(
                         sizeof(BatchConfig::tokensInfo) +
                         sizeof(BatchConfig::requestsInfo) +
                         sizeof(BeamSearchBatchConfig::topology_mask),
-                    &(beam_batch_config->beamRequestsInfo),
-                    sizeof(BeamSearchBatchConfig::beamRequestsInfo),
+                    &(beam_batch_config->beamTokenInfo),
+                    sizeof(BeamSearchBatchConfig::beamTokenInfo),
                     cudaMemcpyHostToDevice,
                     stream);
     cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
                         sizeof(BatchConfig::tokensInfo) +
                         sizeof(BatchConfig::requestsInfo) +
                         sizeof(BeamSearchBatchConfig::topology_mask) +
-                        sizeof(BeamSearchBatchConfig::beamRequestsInfo),
-                    &(beam_batch_config->beamTokenInfo),
-                    sizeof(BeamSearchBatchConfig::beamTokenInfo),
+                        sizeof(BeamSearchBatchConfig::beamTokenInfo),
+                    &(beam_batch_config->beamRequestsInfo),
+                    sizeof(BeamSearchBatchConfig::beamRequestsInfo),
                     cudaMemcpyHostToDevice,
                     stream);
   }

From 617a29fdda4e79d0d9c7bbcc1455ed447c42988f Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Tue, 26 Dec 2023 13:43:49 -0500
Subject: [PATCH 273/344] fix speculative

---
 .../specinfer_inc_multihead_self_attention.cu |  42 ++++---
 src/runtime/request_manager.cc                | 107 +++++++++++++-----
 2 files changed, 109 insertions(+), 40 deletions(-)

diff --git a/src/ops/specinfer_inc_multihead_self_attention.cu b/src/ops/specinfer_inc_multihead_self_attention.cu
index 9d6f70d5ba..63cd90f44f 100644
--- a/src/ops/specinfer_inc_multihead_self_attention.cu
+++ b/src/ops/specinfer_inc_multihead_self_attention.cu
@@ -134,11 +134,20 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
           ii * THREADS_PER_KEY * K_VEC_SIZE);
     }
 
-     if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
-    printf("cacheposssss %d, %d\n", tree_branch_num, topology.real_token_pos[0][0]);
-     printf("cacheposssss %d, %d\n", tree_branch_num, topology.real_token_pos[0][1]);
-      printf("cacheposssss %d, %d\n", tree_branch_num, topology.real_token_pos[0][2]);
-       printf("cacheposssss %d, %d\n", tree_branch_num, topology.real_token_pos[0][10]);
+     if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && sub_req_idx == 0) {
+    printf("cacheposssssA %d, %d\n", tree_branch_num, topology.real_token_pos[0][0]);
+     printf("cacheposssssB %d, %d\n", tree_branch_num, topology.real_token_pos[0][1]);
+      printf("cacheposssssC %d, %d\n", tree_branch_num, topology.real_token_pos[0][2]);
+       printf("cacheposssssD %d, %d\n", tree_branch_num, topology.real_token_pos[0][11]);
+       printf("cacheposssssD %d, %d\n", tree_branch_num, topology.real_token_pos[0][12]);
+       printf("cacheposssssD %d, %d\n", tree_branch_num, topology.real_token_pos[0][13]);
+  }else if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && sub_req_idx == 1) {
+    printf("cacheposssssE %d, %d\n", tree_branch_num, topology.real_token_pos[sub_req_idx][0]);
+     printf("cacheposssssF %d, %d\n", tree_branch_num, topology.real_token_pos[sub_req_idx][1]);
+      printf("cacheposssssG %d, %d\n", tree_branch_num, topology.real_token_pos[sub_req_idx][2]);
+       printf("cacheposssssH %d, %d\n", tree_branch_num, topology.real_token_pos[sub_req_idx][11]);
+       printf("cacheposssssH %d, %d\n", tree_branch_num, topology.real_token_pos[sub_req_idx][12]);
+       printf("cacheposssssH %d, %d\n", tree_branch_num, topology.real_token_pos[sub_req_idx][13]);
   }
     __syncthreads();
     for (int ti = ko; ti < ti_end; ti += K_PER_ITER) {
@@ -289,7 +298,7 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
     // Output the final values.
     if (vo == 0 && (Dh == Dh_MAX || vi < Dh)) {
       convert_from_float(
-          *reinterpret_cast<V_vec *>(output_ptr + request_idx * hidden_size +
+          *reinterpret_cast<V_vec *>(output_ptr + (request_idx + sub_req_idx) * hidden_size +
                                      head_idx * per_head_size + vi),
           out);
     }
@@ -332,7 +341,7 @@ __global__ void specinfer_store_kv_cache(
 
     int const beam_size = beamRequestInfos[req_id].sub_request_num;
 
-    int real_idx = tok_id - first_token_in_req + allocated_tokens;
+    int real_idx = tok_id - first_token_in_req + allocated_tokens + sub_req_id;
 
     if (i == 0) {
       printf("ffasdasds%d, %d, %d, %d, %d, %d\n",
@@ -343,10 +352,15 @@ __global__ void specinfer_store_kv_cache(
              first_token_in_req,
              real_idx);
     }
-    // }else if(i == hidden_size * 2){
-    //   printf("ffasdasdskkkk%d, %d, %d\n", allocated_tokens, tok_id,
-    //   sub_req_id);
-    // }
+    else if(i == hidden_size * 2){
+      printf("hshddhdhdsdaww%d, %d, %d, %d, %d, %d\n",
+             beamTokenInfos[0].sub_request_index,
+             allocated_tokens,
+             sub_req_id,
+             tok_id,
+             first_token_in_req,
+             real_idx);
+    }
     
     
 
@@ -547,7 +561,7 @@ void compute_attention_kernel_prompt(
     // To get B, skip over K entries from previous requests (all heads +
     // padding)
 
-    print_tensor<float>((float*)A, 32, "A");
+    // print_tensor<float>((float*)A, 32, "A");
     std::cout << "meta: " << num_new_tokens << ", " << total_tokens << "\n";
     DT const *B = static_cast<DT *>(m->keyCache) +
                   (i * bc->MAX_SPECULATIVE_TREE_BRANCHES) * kt_req_block_size;
@@ -583,7 +597,7 @@ void compute_attention_kernel_prompt(
                                          m->num_q_heads,
                                          compute_type,
                                          CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-    print_tensor<float>((float*)C, 32, "C");
+    // print_tensor<float>((float*)C, 32, "C");
     // add alibi position bias to qk production
     // add alibi position bias to qk production
     if (*m->position_bias) {
@@ -669,7 +683,7 @@ void compute_attention_kernel_prompt(
     // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
     // requests
 
-    print_tensor<float>((float*)C_softmax, 32, "C_softmax");
+    // print_tensor<float>((float*)C_softmax, 32, "C_softmax");
     C = static_cast<DT *>(m->attn_heads) +
         (tokens_previous_requests + bc->num_generation_tokens) *
             m->num_q_heads * m->vProjSize;
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 845a580c13..775280e2cf 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -714,8 +714,9 @@ BeamSearchBatchConfig
         dfs_tree_inputs.erase(request.guid);
 
       } else { // Request not finished, pass verified_tokens to next iteration
-        
-        std::cout << "parse to next iteration: " << "\n";
+
+        std::cout << "parse to next iteration: "
+                  << "\n";
         new_bc.request_completed[i] = false;
         new_bc.request_running[i] = true;
 
@@ -755,8 +756,8 @@ BeamSearchBatchConfig
         new_bc.sub_requests[i] = 1;
         new_bc.topology_mask[i].allocated_tokens = request.tokens.size();
 
-        //assign new kv cache position
-        for(int j = 0; j < request.tokens.size(); j++){
+        // assign new kv cache position
+        for (int j = 0; j < request.tokens.size(); j++) {
           new_bc.topology_mask[i].real_token_pos[0][j] = j;
         }
 
@@ -775,7 +776,8 @@ BeamSearchBatchConfig
           // Beam Token Info
           new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = 0;
           new_bc.num_tokens++;
-          std::cout << "num_gen ++ " << "\n";
+          std::cout << "num_gen ++ "
+                    << "\n";
           num_generation_tokens++;
 
           // Add verified token to request's token list
@@ -785,7 +787,6 @@ BeamSearchBatchConfig
             break;
           }
         }
-        
 
         std::string output = this->tokenizer_->Decode(request.tokens);
         // Unlike Huggingface, the sentencepiece C++ library automatically
@@ -944,7 +945,8 @@ BeamSearchBatchConfig
   }
   new_bc.num_generation_tokens = num_generation_tokens;
 
-  std::cout << "prepare next batch init gen tokens: " << new_bc.num_generation_tokens << "\n";
+  std::cout << "prepare next batch init gen tokens: "
+            << new_bc.num_generation_tokens << "\n";
 
   if (verbose) {
     std::cout << "prepare_next_batch_init OLD vs NEW batchconfigs below:"
@@ -1078,7 +1080,14 @@ BeamSearchBatchConfig
           old_bc.sub_requests[i] * new_bc.beamRequestsInfo[i].beam_size;
       new_bc.beamRequestsInfo[i].sub_request_num =
           old_bc.beamRequestsInfo[i].sub_request_num *
-          new_bc.beamRequestsInfo[i].beam_size;
+          old_bc.beamRequestsInfo[i].beam_size;
+
+      std::cout << "oldbc : " << old_bc.beamRequestsInfo[i].sub_request_num
+                << ", " << old_bc.beamRequestsInfo[i].beam_size << "\n";
+
+      // if (old_bc.beamRequestsInfo[i].current_depth == 3) {
+      //   assert(false);
+      // }
 
       assert(new_bc.beamRequestsInfo[i].sub_request_num <=
              BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES);
@@ -1090,6 +1099,10 @@ BeamSearchBatchConfig
         // do the slot exchange to minimize the cache exchange in kernel.
         update_beam_metadata(
             new_bc, old_bc, request.beam_trees.at(old_bc.model_id), i);
+
+        new_bc.topology_mask[i].allocated_tokens =
+            old_bc.topology_mask[i].allocated_tokens +
+            old_bc.beamRequestsInfo[i].sub_request_num;
       } else {
         assert(false && "Request should not be pending in beam search phase");
       }
@@ -1101,6 +1114,7 @@ BeamSearchBatchConfig
           request.tokens.size()) {
         // Incremental phase
         if (request.status == Request::RUNNING) {
+          // todo check it
           new_bc.requestsInfo[i].num_tokens_in_batch = 1;
         } else {
           assert(false && "Request should be done");
@@ -1122,7 +1136,31 @@ BeamSearchBatchConfig
                   << std::endl;
       }
 
+      //       for (int j = 0; j < request.tokens.size(); j++) {
+      //     new_bc.topology_mask[i].real_token_pos[0][j] = j;
+      // }
+
       // register more tokens due to the beam width
+      std::cout << "register more tokens: "
+                << new_bc.beamRequestsInfo[i].sub_request_num << ", "
+                << new_bc.requestsInfo[i].num_tokens_in_batch << ", "
+                << new_bc.topology_mask[i].allocated_tokens << "\n";
+
+      // copy meta data and replicate
+      int replicate_num = new_bc.beamRequestsInfo[i].sub_request_num /
+                          old_bc.beamRequestsInfo[i].sub_request_num;
+
+      for (int j = 0; j < old_bc.beamRequestsInfo[i].sub_request_num; j++) {
+        int old_idx = j;
+        for (int k = 0; k < replicate_num; k++) {
+          int new_idx = j * replicate_num + k;
+          std::cout << "copy from " << old_idx << "to: " << new_idx << "\n";
+          memcpy(new_bc.topology_mask[i].real_token_pos[new_idx],
+                 old_bc.topology_mask[i].real_token_pos[old_idx],
+                 sizeof(int) * BatchConfig::MAX_NUM_TOKENS);
+        }
+      }
+
       for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
         int depth = new_bc.requestsInfo[i].first_token_depth_in_request + j;
         for (int k = 0; k < new_bc.beamRequestsInfo[i].sub_request_num; k++) {
@@ -1135,6 +1173,15 @@ BeamSearchBatchConfig
 
           new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = k;
           new_bc.num_tokens++;
+
+          // width first
+          new_bc.topology_mask[i].real_token_pos[k][depth] =
+              new_bc.topology_mask[i].allocated_tokens + num_generation_tokens;
+
+          std::cout << "topology: sub request: " << k << ", "
+                    << ", " << depth << ", "
+                    << new_bc.topology_mask[i].real_token_pos[k][depth] << "\n";
+          num_generation_tokens++;
         }
       }
     }
@@ -1331,6 +1378,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
     profiling_requests[request.guid].llm_decoding_steps += 1;
 
     if (request.status == Request::RUNNING) {
+      
       std::cout << "prepare next batch running: pending\n"
                 << "\n";
       new_bc.request_running[i] = true;
@@ -1415,11 +1463,12 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
 
       new_bc.requestsInfo[i].first_token_depth_in_request =
           request.tokens.size() - 1;
-
+      
+      std::cout << "prepare next batch verify: " << dfs_tree_inputs.size() << "\n";
       // Add Tokens from the DFS Tree to the next batch
       for (int j = 1; j < dfs_tree_inputs.size(); j++) {
         auto token = dfs_tree_inputs.at(j);
-        if (verbose) {
+        if (true) {
           std::cout << "[" << j << "] Token: " << token.first
                     << ", Depth:" << token.second << std::endl;
         }
@@ -1436,6 +1485,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
           break;
         }
       }
+      assert(false);
 
     } else if (request.status == Request::PENDING) {
       std::cout << "prepare next batch verify: pending\n"
@@ -1499,7 +1549,8 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
               request.tokens[request.llm_cache_size + j];
           new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request =
               request.llm_cache_size + j;
-          std::cout << "load prompt tokens: " << j << ": " << new_bc.tokensInfo[new_bc.num_tokens].token_id << "\n";
+          std::cout << "load prompt tokens: " << j << ": "
+                    << new_bc.tokensInfo[new_bc.num_tokens].token_id << "\n";
           new_bc.num_tokens++;
         }
 
@@ -1625,7 +1676,10 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
         }
       }
 
+      std::cout << "leaffffff: " << leaf_node_num << "\n";
+
       for (int beam_id = 0; beam_id < leaf_node_num; beam_id++) {
+
         request.beam_trees.at(old_bc.model_id)
             .treeLayers[depth]
             .tokens[beam_id] = result.token_ids[result_index];
@@ -1635,14 +1689,19 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
         request.beam_trees.at(old_bc.model_id)
             .treeLayers[depth]
             .parent_ids[beam_id] = result.parent_id[result_index];
-
-        if (true) {
-          std::cout << "tree value: " << depth << "token: "
-                    << request.beam_trees.at(old_bc.model_id)
-                           .treeLayers[depth]
-                           .tokens[beam_id]
-                    << "result tokens: " << result.token_ids[result_index];
-        }
+        std::cout << "??????? beam id: " << beam_id << ", token: "
+                  << request.beam_trees.at(old_bc.model_id)
+                         .treeLayers[depth]
+                         .tokens[beam_id]
+                  << "\n";
+
+        // if (true) {
+        //   std::cout << "tree value: " << depth << "token: "
+        //             << request.beam_trees.at(old_bc.model_id)
+        //                    .treeLayers[depth]
+        //                    .tokens[beam_id]
+        //             << "result tokens: " << result.token_ids[result_index];
+        // }
         result_index += 1;
       }
       // update the guid and start_depth for current request
@@ -1652,10 +1711,6 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
       }
     }
   }
-
-  if (old_bc.num_tokens != 10) {
-    assert(false);
-  }
 }
 
 // for updating the beam search metadata in requests in incremental phase
@@ -1672,7 +1727,7 @@ void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
   int beam_size = new_bc.beamRequestsInfo[request_index].beam_size;
 
   // int leaf_node_num = old_bc.sub_requests[request_index];
-  int leaf_node_num = old_bc.beamRequestsInfo[request_index].sub_request_num;
+  int leaf_node_num = new_bc.beamRequestsInfo[request_index].sub_request_num;
 
   if (new_bc.beamRequestsInfo[request_index].current_depth ==
       1) { // TODO: check if this is correct
@@ -1693,9 +1748,9 @@ void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
           tree.treeLayers[depth].probs[j];
       new_bc.beamRequestsInfo[request_index].tokens[j] =
           tree.treeLayers[depth].tokens[j];
-
+      std::cout << "token: " << j << ": "
+                << new_bc.beamRequestsInfo[request_index].tokens[j] << "\n";
     }
-    assert(false);
 
     // std::set<int> parents;
     // std::set<int> childs;

From b5f9d5d2d5eea50951a466d339bdc47910e69e07 Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Thu, 28 Dec 2023 01:57:39 -0500
Subject: [PATCH 274/344] bitmap+tree verify

---
 include/flexflow/batch_config.h               |  20 +-
 include/flexflow/config.h                     |   3 +-
 .../inc_multihead_self_attention_utils.cuh    |   2 +-
 .../specinfer_inc_multihead_self_attention.h  |   1 +
 .../ops/tree_inc_multihead_self_attention.h   |   1 +
 include/flexflow/request_manager.h            |  10 +
 src/ops/argmax.cc                             |   2 +
 src/ops/inc_multihead_self_attention.cu       |   8 +-
 src/ops/kernels/embedding_kernels.cu          |   1 +
 .../specinfer_inc_multihead_self_attention.cu | 202 ++++++++----
 src/ops/tree_inc_multihead_self_attention.cu  | 197 ++++++++----
 src/runtime/request_manager.cc                | 291 ++++++++++++++----
 src/runtime/request_manager.cu                |  12 +
 13 files changed, 562 insertions(+), 188 deletions(-)

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index dd947bbd85..db5d4a8e48 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -56,6 +56,7 @@ class BatchConfig {
   // across workers
   static int const MAX_NUM_REQUESTS = 64;
   static int const MAX_NUM_TOKENS = 1024;
+  static int const MAX_SPEC_TREE_TOKEN_NUM = 64;
 
   //  Set by update
   int num_tokens;
@@ -75,6 +76,24 @@ class BatchConfig {
     int request_index;
     TokenId token_id;
   };
+
+  struct BitMask {
+    unsigned long long mask[MAX_SPEC_TREE_TOKEN_NUM] = {0};
+
+    // how many tokens before the tree, every sub requests need this part of
+    // cache
+    int non_tree_cache_size;
+
+    // current tree size
+    int tree_size;
+
+    int this_layer_size;
+
+    // input length-> prompt/root
+    int prompt_size;
+  };
+
+  BitMask causalMask[MAX_NUM_REQUESTS];
   PerRequestInfo requestsInfo[MAX_NUM_REQUESTS];
   PerTokenInfo tokensInfo[MAX_NUM_TOKENS];
 
@@ -154,7 +173,6 @@ class BeamSearchBatchConfig : public BatchConfig {
     int allocated_tokens;
   };
 
-
   BeamSearchPerRequestInfo beamRequestsInfo[MAX_NUM_REQUESTS];
   BeamSearchPerTokenInfo beamTokenInfo[MAX_NUM_TOKENS * MAX_BEAM_WIDTH];
   SpecInferTopology topology_mask[MAX_NUM_REQUESTS];
diff --git a/include/flexflow/config.h b/include/flexflow/config.h
index 321d14961b..fe261dfb48 100644
--- a/include/flexflow/config.h
+++ b/include/flexflow/config.h
@@ -83,7 +83,8 @@ struct FFHandler {
       sizeof(BatchConfig::tokensInfo) + sizeof(BatchConfig::requestsInfo) +
       sizeof(BeamSearchBatchConfig::topology_mask) +
       sizeof(BeamSearchBatchConfig::beamTokenInfo) +
-      sizeof(BeamSearchBatchConfig::beamRequestsInfo);
+      sizeof(BeamSearchBatchConfig::beamRequestsInfo) +
+      sizeof(BatchConfig::causalMask);
   void *offload_reserve_space;
   size_t offload_reserve_space_size;
   DataType quantization_type;
diff --git a/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh b/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh
index c128c1a126..0c065b6b0e 100644
--- a/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh
+++ b/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh
@@ -456,7 +456,7 @@ inline size_t smem_size_in_bytes(int hidden_size_per_head,
                                  int threads_per_block) {
   // The amount of shared memory needed to store the Q*K^T values in float.
 
-  size_t qk_sz = div_up(max_sequence_length + 1, 4) * 16;
+  size_t qk_sz = div_up(1000 + 1, 4) * 16;
   size_t logits_sz = qk_sz;
 
   // The total size needed during softmax.
diff --git a/include/flexflow/ops/specinfer_inc_multihead_self_attention.h b/include/flexflow/ops/specinfer_inc_multihead_self_attention.h
index 6e5dc73b5c..eb1b2882c3 100644
--- a/include/flexflow/ops/specinfer_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/specinfer_inc_multihead_self_attention.h
@@ -143,6 +143,7 @@ class SpecInferIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionM
   BeamSearchBatchConfig::BeamSearchPerTokenInfo *beam_token_infos;
   BeamSearchBatchConfig::BeamSearchPerRequestInfo *beam_request_infos;
   BeamSearchBatchConfig::SpecInferTopology *beam_topology_mask;
+  BatchConfig::BitMask *causalMask;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention.h b/include/flexflow/ops/tree_inc_multihead_self_attention.h
index 6e2da19ce9..d160da4a72 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention.h
@@ -147,6 +147,7 @@ class TreeIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
   int num_active_tokens;
   Realm::RegionInstance committed_token_reserve_inst;
   TreeVerifyBatchConfig::CommittedTokensInfo *committed_token_infos;
+  BatchConfig::BitMask *causalMask;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index e67888d2d6..dc1939c74b 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -110,6 +110,16 @@ class RequestManager {
                           int eos_token_id,
                           std::string const &path);
   void register_output_filepath(std::string const &);
+  void initBitMask(BatchConfig::BitMask &bitmask, int initLength);
+  void appendBitMask(BatchConfig::BitMask &bitmask,
+                     int newNodes,
+                     int preBeamSize,
+                     int old_sub_num,
+                     BeamTree const tree,
+                     int currentDepth);
+  void updateBitMask(BatchConfig::BitMask &bitmask,
+                     int initLength,
+                     int non_tree_size);
 
   FFModel *get_model(int model_id);
 
diff --git a/src/ops/argmax.cc b/src/ops/argmax.cc
index f336c843e8..0344c707fc 100644
--- a/src/ops/argmax.cc
+++ b/src/ops/argmax.cc
@@ -398,6 +398,8 @@ InferenceResult
     ArgMax::save_inference_tensors_to_file(
         m, shard_id, bc, {}, {}, {input, indices});
   }
+
+  print_tensor<int>(indices.get_int32_ptr(), 32, "tree attn output");
   download_tensor<BatchConfig::TokenId>(
       indices.get_int32_ptr(), ir.token_ids, batch_size);
   return ir;
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 4c184acb3c..a05dbbf919 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -1364,8 +1364,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
                                                        vProjSize * num_q_heads);
     size_t key_cache_size = 0, value_cache_size = 0;
     switch (infer_mode) {
-      case INC_DECODING_MODE:
-      case TREE_VERIFY_MODE: {
+      case INC_DECODING_MODE: {
         key_cache_size = num_q_heads * kProjSize *
                          BatchConfig::max_requests_per_batch() *
                          BatchConfig::max_sequence_length();
@@ -1374,7 +1373,8 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
                            BatchConfig::max_sequence_length();
         break;
       }
-      case BEAM_SEARCH_MODE: {
+      case BEAM_SEARCH_MODE:
+      case TREE_VERIFY_MODE: {
         // a K-ary tree max node is (k^n - 1) / 2
         key_cache_size = num_q_heads * kProjSize *
                          BeamSearchBatchConfig::max_requests_per_batch() *
@@ -1402,7 +1402,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
          2 * qk_prod_size + attn_heads_size) *
             size_of_dt +
         complex_size * sizeof(cuFloatComplex); // more components will
-                                                 // be added here later
+                                               // be added here later
     if (offload) {
       // assert that we have enough reserved work space left
       size_t totalSharedSize =
diff --git a/src/ops/kernels/embedding_kernels.cu b/src/ops/kernels/embedding_kernels.cu
index 22d8161ff1..91f5d60e85 100644
--- a/src/ops/kernels/embedding_kernels.cu
+++ b/src/ops/kernels/embedding_kernels.cu
@@ -118,6 +118,7 @@ void forward_kernel_wrapper(EmbeddingMeta const *m,
     // print_tensor<float>(output_ptr, output_domain.get_volume(),
     // "[Embedding:forward:output]");
   }
+  print_tensor<int>(input.get_int32_ptr(), 32, "embeddinginput");
 }
 
 /*static*/
diff --git a/src/ops/specinfer_inc_multihead_self_attention.cu b/src/ops/specinfer_inc_multihead_self_attention.cu
index 63cd90f44f..e8ac1d980c 100644
--- a/src/ops/specinfer_inc_multihead_self_attention.cu
+++ b/src/ops/specinfer_inc_multihead_self_attention.cu
@@ -51,6 +51,7 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
     BatchConfig::PerRequestInfo *request_infos,
     BeamSearchBatchConfig::BeamSearchPerRequestInfo *beam_request_infos,
     BeamSearchBatchConfig::SpecInferTopology *topology_mask,
+    BatchConfig::BitMask *causalMask,
     int max_tree_branches) {
 
   // q, k
@@ -75,11 +76,18 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
 
   BeamSearchBatchConfig::SpecInferTopology topology =
       topology_mask[request_idx];
+  BatchConfig::BitMask bitmask = causalMask[request_idx];
 
   int const first_step = 0;
 
   int const tlength = request_infos[request_idx].first_token_depth_in_request +
                       request_infos[request_idx].num_tokens_in_batch;
+
+  if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
+    printf("specinfer attn fused kernel %lld\n", bitmask.mask[1]);
+  }
+
+  int const totalCacheSize = bitmask.non_tree_cache_size + bitmask.tree_size;
   // int const qlength = request_infos[request_idx].num_tokens_in_batch;
   int const tree_branch_num = beam_request_infos[request_idx].sub_request_num;
 
@@ -88,7 +96,8 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
 
   int first_token_idx = 0;
   for (int r = 0; r < request_idx; r++) {
-    first_token_idx += request_infos[request_idx].num_tokens_in_batch;
+    // first_token_idx += request_infos[request_idx].num_tokens_in_batch;
+    first_token_idx += bitmask.this_layer_size;
   }
 
   // shared memory objects
@@ -124,7 +133,7 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
       request_idx * max_seq_length * hidden_size * max_tree_branches + ki;
 
   int ti_end =
-      div_up(tlength - first_step, K_PER_WARP) * K_PER_WARP + first_step;
+      div_up(totalCacheSize - first_step, K_PER_WARP) * K_PER_WARP + first_step;
 
   for (int sub_req_idx = 0; sub_req_idx < tree_branch_num; sub_req_idx += 1) {
 #pragma unroll
@@ -134,21 +143,25 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
           ii * THREADS_PER_KEY * K_VEC_SIZE);
     }
 
-     if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && sub_req_idx == 0) {
-    printf("cacheposssssA %d, %d\n", tree_branch_num, topology.real_token_pos[0][0]);
-     printf("cacheposssssB %d, %d\n", tree_branch_num, topology.real_token_pos[0][1]);
-      printf("cacheposssssC %d, %d\n", tree_branch_num, topology.real_token_pos[0][2]);
-       printf("cacheposssssD %d, %d\n", tree_branch_num, topology.real_token_pos[0][11]);
-       printf("cacheposssssD %d, %d\n", tree_branch_num, topology.real_token_pos[0][12]);
-       printf("cacheposssssD %d, %d\n", tree_branch_num, topology.real_token_pos[0][13]);
-  }else if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && sub_req_idx == 1) {
-    printf("cacheposssssE %d, %d\n", tree_branch_num, topology.real_token_pos[sub_req_idx][0]);
-     printf("cacheposssssF %d, %d\n", tree_branch_num, topology.real_token_pos[sub_req_idx][1]);
-      printf("cacheposssssG %d, %d\n", tree_branch_num, topology.real_token_pos[sub_req_idx][2]);
-       printf("cacheposssssH %d, %d\n", tree_branch_num, topology.real_token_pos[sub_req_idx][11]);
-       printf("cacheposssssH %d, %d\n", tree_branch_num, topology.real_token_pos[sub_req_idx][12]);
-       printf("cacheposssssH %d, %d\n", tree_branch_num, topology.real_token_pos[sub_req_idx][13]);
-  }
+    int const query_token = bitmask.tree_size - tree_branch_num + sub_req_idx;
+
+    if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && sub_req_idx == 0) {
+      // printf("fuckmasksss %d, %d, %d, %d, %d\n",
+      //        bitmask.prompt_size,
+      //        bitmask.non_tree_cache_size,
+      //        tree_branch_num,
+      //        bitmask.tree_size,
+      //        tlength);
+      //  printf("cacheposssssB %d, %d\n", tree_branch_num,
+      //  topology.real_token_pos[0][1]);
+      //   printf("cacheposssssC %d, %d\n", tree_branch_num,
+      //   topology.real_token_pos[0][2]);
+      //    printf("cacheposssssD %d, %d\n", tree_branch_num,
+      //    topology.real_token_pos[0][11]); printf("cacheposssssD %d, %d\n",
+      //    tree_branch_num, topology.real_token_pos[0][12]);
+      //    printf("cacheposssssD %d, %d\n", tree_branch_num,
+      //    topology.real_token_pos[0][13]);
+    }
     __syncthreads();
     for (int ti = ko; ti < ti_end; ti += K_PER_ITER) {
       K_vec k[K_VECS_PER_THREAD];
@@ -156,22 +169,33 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
 
       for (int ii = 0; ii < K_VECS_PER_THREAD; ++ii) {
         int jj = ii * THREADS_PER_KEY * K_VEC_SIZE;
-        if (ti < tlength) {
+        if (ti < totalCacheSize) {
           // find the real position of the cache;
           // depth: 0, 1, 2, 3, 4, 4, 5, 5 ,5, 5,
-          int const real_cache_idx = topology.real_token_pos[sub_req_idx][ti];
+          // int const real_cache_idx =
+          // topology.real_token_pos[sub_req_idx][ti];
           k[ii] = *reinterpret_cast<K_vec const *>(
-              k_cache_batch + real_cache_idx * hidden_size +
-              head_idx * per_head_size + jj);
+              k_cache_batch + ti_circ * hidden_size + head_idx * per_head_size +
+              jj);
         }
       }
       float qk = scale * Qk_dot<DT, THREADS_PER_KEY>::dot(q_vecs[ki_o], k);
 
-      if (ti < tlength && tidx % THREADS_PER_KEY == 0) {
+      if (ti < totalCacheSize && tidx % THREADS_PER_KEY == 0) {
         // todo add alobi here
-        bool const mask = ti_circ >= tlength;
-        if (mask) {
-          assert(false);
+        // bool const mask = ti_circ >= totalCacheSize;
+        bool const mask = (ti >= bitmask.non_tree_cache_size &&
+                           (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
+                              (1 << query_token))));
+
+        if (blockIdx.y == 0 && blockIdx.x == 0 && mask && sub_req_idx == 0) {
+          // printf("specinfer mask: ti:%d, %d, %d, %d, %lld\n",
+          //        ti,
+          //        totalCacheSize,
+          //        ti - bitmask.non_tree_cache_size,
+          //        query_token,
+          //        bitmask.mask[ti - bitmask.non_tree_cache_size]);
+          // assert(false);
         }
         qk_max = mask ? qk_max : fmaxf(qk_max, qk);
         qk_smem[ti - first_step] = mask ? 0.f : qk;
@@ -208,10 +232,14 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
     qk_max = __shfl_sync(uint32_t(-1), qk_max, 0);
 
     float exp_sum = 0.f;
-    for (int ti = first_step + tidx; ti < tlength; ti += THREADS_PER_BLOCK) {
-      float logit = __expf(qk_smem[ti - first_step] - qk_max);
+    for (int ti = first_step + tidx; ti < totalCacheSize;
+         ti += THREADS_PER_BLOCK) {
+      bool const mask = (ti >= bitmask.non_tree_cache_size &&
+                         (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
+                            (1 << query_token))));
+      float logit = mask ? 0.0f : __expf(qk_smem[ti - first_step] - qk_max);
       exp_sum += logit;
-      qk_smem[ti - first_step] = logit;
+      qk_smem[ti - first_step] = mask ? 0.0f : logit;
     }
 
     // Compute the sum.
@@ -219,7 +247,8 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
 
     // softmax
     float inv_sum = __fdividef(1.f, exp_sum + 1.e-6);
-    for (int ti = first_step + tidx; ti < tlength; ti += THREADS_PER_BLOCK) {
+    for (int ti = first_step + tidx; ti < totalCacheSize;
+         ti += THREADS_PER_BLOCK) {
       qk_smem[ti - first_step] *= inv_sum;
     }
 
@@ -254,14 +283,17 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
     //     vi;
 
     if (Dh == Dh_MAX || vi < Dh) {
-      for (int ti = first_step + vo; ti < tlength; ti += V_PER_ITER) {
+      for (int ti = first_step + vo; ti < totalCacheSize; ti += V_PER_ITER) {
         // Load the values from the cache.
         int const ti_circ = ti % max_seq_length;
-        int const real_cache_idx = topology.real_token_pos[sub_req_idx][ti];
+        // int const real_cache_idx = topology.real_token_pos[sub_req_idx][ti];
         V_vec v = *reinterpret_cast<V_vec const *>(
-            v_cache_batch + real_cache_idx * hidden_size +
-            head_idx * per_head_size);
-        float logit = qk_smem[ti - first_step];
+            v_cache_batch + ti_circ * hidden_size + head_idx * per_head_size);
+
+        bool const mask = (ti >= bitmask.non_tree_cache_size &&
+                           (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
+                              (1 << query_token))));
+        float logit = mask ? 0.0f : qk_smem[ti - first_step];
         out = FlexFlow::fma(logit, cast_to_float(v), out);
       }
     }
@@ -298,7 +330,8 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
     // Output the final values.
     if (vo == 0 && (Dh == Dh_MAX || vi < Dh)) {
       convert_from_float(
-          *reinterpret_cast<V_vec *>(output_ptr + (request_idx + sub_req_idx) * hidden_size +
+          *reinterpret_cast<V_vec *>(output_ptr +
+                                     (request_idx + sub_req_idx) * hidden_size +
                                      head_idx * per_head_size + vi),
           out);
     }
@@ -315,6 +348,7 @@ __global__ void specinfer_store_kv_cache(
     BeamSearchBatchConfig::BeamSearchPerTokenInfo *beamTokenInfos,
     BeamSearchBatchConfig::BeamSearchPerRequestInfo *beamRequestInfos,
     BeamSearchBatchConfig::SpecInferTopology *beam_topology_mask,
+    BatchConfig::BitMask *causalMask,
     int qProjSize,
     int kProjSize,
     int vProjSize,
@@ -335,41 +369,57 @@ __global__ void specinfer_store_kv_cache(
 
     int const req_id = tokenInfos[token_idx].request_index;
     int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
-    int const first_token_in_req = requestInfo[req_id].first_token_depth_in_request;
+    int const first_token_in_req =
+        requestInfo[req_id].first_token_depth_in_request;
     int const sub_req_id = beamTokenInfos[token_idx].sub_request_index;
     int const allocated_tokens = beam_topology_mask[req_id].allocated_tokens;
+    int const total_token = requestInfo[req_id].num_tokens_in_batch;
+
+    BatchConfig::BitMask bitmask = causalMask[req_id];
+
+    int const sub_request_num = beamRequestInfos[req_id].sub_request_num;
 
-    int const beam_size = beamRequestInfos[req_id].sub_request_num;
+    int const tree_branch_num = beamRequestInfos[req_id].sub_request_num;
+
+    // int const query_token = bitmask.non_tree_cache_size + bitmask.tree_size -
+    //                         tree_branch_num + sub_req_id + tok_id;
+    // bitmask.tree_size - tree_branch_num + sub_req_id;
+
+    // if prompt token -> token id
+    // if tree token:
+    int const cache_idx = bitmask.non_tree_cache_size + bitmask.tree_size -
+                          bitmask.this_layer_size + token_idx;
 
     int real_idx = tok_id - first_token_in_req + allocated_tokens + sub_req_id;
 
-    if (i == 0) {
-      printf("ffasdasds%d, %d, %d, %d, %d, %d\n",
-             beamTokenInfos[0].sub_request_index,
-             allocated_tokens,
-             sub_req_id,
-             tok_id,
-             first_token_in_req,
-             real_idx);
-    }
-    else if(i == hidden_size * 2){
-      printf("hshddhdhdsdaww%d, %d, %d, %d, %d, %d\n",
-             beamTokenInfos[0].sub_request_index,
-             allocated_tokens,
-             sub_req_id,
-             tok_id,
-             first_token_in_req,
-             real_idx);
-    }
-    
-    
+    // if (i == 0) {
+    //   printf("ffasdasds%d, %d, %d, %d, %d, %d, %d, %d, %d, %d, %d\n",
+    //          beamTokenInfos[0].sub_request_index,
+    //          allocated_tokens,
+    //          sub_req_id,
+    //          tok_id,
+    //          first_token_in_req,
+    //          real_idx,
+    //          cache_idx,
+    //          bitmask.non_tree_cache_size,
+    //          bitmask.tree_size,
+    //          sub_request_num,
+    //         token_idx );
+    // } else if (i == hidden_size * 2) {
+    //   printf("hshddhdhdsdaww%d, %d, %d, %d, %d, %d, %d\n",
+    //          beamTokenInfos[0].sub_request_index,
+    //          allocated_tokens,
+    //          sub_req_id,
+    //          tok_id,
+    //          first_token_in_req,
+    //          real_idx,
+    //          cache_idx);
+    // }
 
     kCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
-               (real_idx) * hidden_size +
-               offset] = kVal;
+               (cache_idx)*hidden_size + offset] = kVal;
     vCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
-               (real_idx) * hidden_size +
-               offset] = vVal;
+               (cache_idx)*hidden_size + offset] = vVal;
   }
 }
 
@@ -398,6 +448,7 @@ void update_kv_cache_kernel(SpecInferIncMultiHeadSelfAttentionMeta const *m,
         m->beam_token_infos,
         m->beam_request_infos,
         m->beam_topology_mask,
+        m->causalMask,
         m->qProjSize,
         m->kProjSize,
         m->vProjSize,
@@ -433,6 +484,7 @@ void update_kv_cache_kernel(SpecInferIncMultiHeadSelfAttentionMeta const *m,
           m->request_infos,                                                    \
           m->beam_request_infos,                                               \
           m->beam_topology_mask,                                               \
+          m->causalMask,                                                       \
           BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES)
 
 template <typename DT>
@@ -520,7 +572,7 @@ void compute_attention_kernel_prompt(
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
     if (bc->request_completed[i]) {
       continue;
-    } 
+    }
     // else if (tokens_previous_requests < bc->num_generation_tokens) {
     //   tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
     //   continue;
@@ -728,6 +780,16 @@ void inference_kernel(SpecInferIncMultiHeadSelfAttentionMeta const *m,
                       DT const *bias_ptr,
                       cudaStream_t stream) {
   // phase 1: Implement kernel to compute KQV for input tokens
+
+  cudaMemcpyAsync(m->causalMask,
+                  &(bc->causalMask),
+                  bc->num_active_requests() * sizeof(BatchConfig::BitMask),
+                  cudaMemcpyHostToDevice,
+                  stream);
+  std::cout << "kernel bit mask: " << bc->causalMask[0].prompt_size << ", "
+            << bc->causalMask[0].non_tree_cache_size << ", "
+            << bc->causalMask[0].mask[0] << ", " << sizeof(BatchConfig::BitMask)
+            << "\n";
   compute_qkv_kernel(m,
                      bc,
                      shard_id,
@@ -830,6 +892,7 @@ void SpecInferIncMultiHeadSelfAttention::inference_kernel_wrapper(
     // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
     // acc_output.rect, "[Attention:forward:output]");
   }
+  //  print_tensor<float>(output.get_float_ptr(), 32, "specinc output");
 
   // if(bc->num_tokens == 1){
   //   print_tensor<float>(input.get_float_ptr(), 32, "specinc input");
@@ -878,6 +941,11 @@ SpecInferIncMultiHeadSelfAttentionMeta::SpecInferIncMultiHeadSelfAttentionMeta(
 
   // allocate memory for the seqArray and reserve space
   {
+    size_t causal_mask_size = BatchConfig::MAX_NUM_REQUESTS;
+    size_t total_size = causal_mask_size * sizeof(BatchConfig::BitMask);
+    gpu_mem_allocator.create_legion_instance(beam_search_reserve_inst,
+                                             total_size);
+
     beam_topology_mask =
         static_cast<BeamSearchBatchConfig::SpecInferTopology *>(
             handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
@@ -895,6 +963,16 @@ SpecInferIncMultiHeadSelfAttentionMeta::SpecInferIncMultiHeadSelfAttentionMeta(
             sizeof(BatchConfig::requestsInfo) +
             sizeof(BeamSearchBatchConfig::topology_mask) +
             sizeof(BeamSearchBatchConfig::beamTokenInfo));
+    // causalMask =
+    //     static_cast<BatchConfig::BitMask *>(
+    //         handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
+    //         sizeof(BatchConfig::requestsInfo) +
+    //         sizeof(BeamSearchBatchConfig::topology_mask) +
+    //         sizeof(BeamSearchBatchConfig::beamTokenInfo)) +
+    //     sizeof(BeamSearchBatchConfig::beamRequestsInfo);
+
+    causalMask = gpu_mem_allocator.allocate_instance<BatchConfig::BitMask>(
+        causal_mask_size);
     // beam_token_infos =
     //     gpu_mem_allocator
     //         .allocate_instance<BeamSearchBatchConfig::BeamSearchPerTokenInfo>(
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index 1da56e383a..a3e3adcc30 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -53,6 +53,8 @@ __global__ void compute_attention_kernel_fused_kernel(
     BatchConfig::PerRequestInfo *request_infos,
     int num_heads,
     int num_requests,
+    int max_tree_branches,
+    BatchConfig::BitMask *causalMask,
     int qk_smem_sz) {
 
   // q, k
@@ -81,6 +83,17 @@ __global__ void compute_attention_kernel_fused_kernel(
                       request_infos[request_idx].num_tokens_in_batch;
   int const qlength = request_infos[request_idx].num_tokens_in_batch;
 
+  BatchConfig::BitMask bitmask = causalMask[request_idx];
+
+  // bitmask.mask[1] = 3;
+  if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
+    printf("tree attn fused kernel %d, %d, %d, %lld\n",
+           tlength,
+           qlength,
+           bitmask.non_tree_cache_size,
+           bitmask.mask[1]);
+  }
+
   int first_token_idx = 0;
   for (int r = 0; r < request_idx; r++) {
     first_token_idx += request_infos[request_idx].num_tokens_in_batch;
@@ -115,7 +128,8 @@ __global__ void compute_attention_kernel_fused_kernel(
   constexpr int K_PER_WARP = WARP_SIZE / THREADS_PER_KEY;
 
   DT const *k_cache_batch =
-      key_cache + request_idx * max_seq_length * hidden_size + ki;
+      key_cache +
+      request_idx * max_tree_branches * max_seq_length * hidden_size + ki;
 
   int ti_end =
       div_up(tlength - first_step, K_PER_WARP) * K_PER_WARP + first_step;
@@ -127,10 +141,12 @@ __global__ void compute_attention_kernel_fused_kernel(
           q_ptr + (hidden_size * QKV_WEIGHT_NUM * qi) + ki +
           ii * THREADS_PER_KEY * K_VEC_SIZE);
     }
+
     __syncthreads();
     for (int ti = ko; ti < ti_end; ti += K_PER_ITER) {
       K_vec k[K_VECS_PER_THREAD];
       int const ti_circ = ti % max_seq_length;
+
       for (int ii = 0; ii < K_VECS_PER_THREAD; ++ii) {
         int jj = ii * THREADS_PER_KEY * K_VEC_SIZE;
         if (ti < tlength) {
@@ -142,22 +158,35 @@ __global__ void compute_attention_kernel_fused_kernel(
       float qk = scale * Qk_dot<DT, THREADS_PER_KEY>::dot(q_vecs[ki_o], k);
 
       if (ti < tlength && tidx % THREADS_PER_KEY == 0) {
-        bool const mask = ti_circ >= tlength;
-        if (mask) {
-          assert(false);
+        bool const mask =
+            (ti >= bitmask.non_tree_cache_size &&
+             (!(bitmask.mask[ti - bitmask.non_tree_cache_size] & (1 << qi))));
+        
+        if (blockIdx.y == 0 && blockIdx.x == 0 && qi == 0 && mask) {
+          printf("tree attn mask for first token %d, %lld, %d, %d\n",
+                 ti,
+                 bitmask.mask[ti - bitmask.non_tree_cache_size],
+                 bitmask.non_tree_cache_size,
+                 qi);
         }
 
-        int pos = ti * qlength + qi;
-        if (((pos / qlength) % tlength) > (pos % qlength + tlength - qlength)) {
-          qk = -FLT_MAX;
-        }
         qk_max = mask ? qk_max : fmaxf(qk_max, qk);
 
-        qk_smem[pos] = mask ? 0.f : qk;
+        if (blockIdx.y == 0 && blockIdx.x == 0 && qi == 1 && !mask) {
+          printf("tree attn mask for second token %d, %lld, %d, %d, %.10f\n",
+                 ti,
+                 bitmask.mask[ti - bitmask.non_tree_cache_size],
+                 bitmask.non_tree_cache_size,
+                 qi,
+                 qk);
+        }
+        qk_smem[ti - first_step] = mask ? 0.0f : qk;
       }
     }
+
     __syncthreads();
 
+#pragma unroll
     for (int mask = WARP_SIZE / 2; mask >= THREADS_PER_KEY; mask /= 2) {
       qk_max = fmaxf(qk_max, __shfl_xor_sync(uint32_t(-1), qk_max, mask));
     }
@@ -176,66 +205,97 @@ __global__ void compute_attention_kernel_fused_kernel(
 
     // The warps finalize the reduction.
     qk_max = lane < WARPS_PER_BLOCK ? red_smem[lane] : -FLT_MAX;
-
+#pragma unroll
     for (int mask = WARPS_PER_BLOCK / 2; mask >= 1; mask /= 2) {
       qk_max = fmaxf(qk_max, __shfl_xor_sync(uint32_t(-1), qk_max, mask));
     }
 
     // Broadcast to all the threads in the warp.
     qk_max = __shfl_sync(uint32_t(-1), qk_max, 0);
+    
+     if (blockIdx.y == 0 && blockIdx.x == 0 && qi == 0 && tidx == 0) {
+          printf("tree attn first token qk_max %f\n",
+                 qk_max);
+      }
 
-    float exp_sum = 0.f;
 
+    float exp_sum = 0.f;
     for (int ti = first_step + tidx; ti < tlength; ti += THREADS_PER_BLOCK) {
-      float logit = __expf(qk_smem[ti * qlength + qi] - qk_max);
+      bool const mask =
+          (ti >= bitmask.non_tree_cache_size &&
+           (!(bitmask.mask[ti - bitmask.non_tree_cache_size] & (1 << qi))));
+      float logit = mask ? 0.0f : __expf(qk_smem[ti - first_step] - qk_max);
       exp_sum += logit;
-      qk_smem[ti * qlength + qi] = logit;
+      qk_smem[ti - first_step] = mask ? 0.0f : logit;
     }
 
     // Compute the sum.
     exp_sum = block_sum<WARPS_PER_BLOCK>(&red_smem[WARPS_PER_BLOCK], exp_sum);
 
+    if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && qi == 1) {
+      printf("expsum %.10f\n", exp_sum);
+    }
+
     // softmax
     float inv_sum = __fdividef(1.f, exp_sum + 1.e-6);
-
     for (int ti = first_step + tidx; ti < tlength; ti += THREADS_PER_BLOCK) {
-      qk_smem[ti * qlength + qi] *= inv_sum;
+      qk_smem[ti - first_step] *= inv_sum;
     }
 
     __syncthreads();
-  }
+    if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && qi == 1) {
+      printf("softmax %.10f\n", qk_smem[0]);
+    }
 
-  // value projection
-  constexpr int V_VEC_SIZE = 16 / sizeof(DT);
-  // The value computed by this thread.
-  int vo = tidx / THREADS_PER_VALUE;
-  // The hidden dimensions computed by this particular thread.
-  int vi = tidx % THREADS_PER_VALUE * V_VEC_SIZE;
-  constexpr int V_PER_ITER = THREADS_PER_BLOCK / THREADS_PER_VALUE;
+    // value projection
+    constexpr int V_VEC_SIZE = 16 / sizeof(DT);
+    // A vector of V elements for the current timestep.
+    // using V_vec_k = typename V_vec_k_<DT, V_VEC_SIZE>::Type;
+    // using V_vec_acum = typename V_vec_acum_fp32_<V_vec_k>::Type;
 
-  Out_sum out;
-  // The base pointer for the value in the cache buffer.
-  DT const *v_cache_batch =
-      value_cache + request_idx * max_seq_length * hidden_size + vi;
+    // The value computed by this thread.
+    int vo = tidx / THREADS_PER_VALUE;
+    // The hidden dimensions computed by this particular thread.
+    int vi = tidx % THREADS_PER_VALUE * V_VEC_SIZE;
+    constexpr int V_PER_ITER = THREADS_PER_BLOCK / THREADS_PER_VALUE;
 
-  for (int qi = 0; qi < qlength; qi++) {
+    Out_sum out;
     zero(out);
-    __syncthreads();
+
+    // The base pointer for the value in the cache buffer.
+    DT const *v_cache_batch =
+        value_cache +
+        request_idx * max_seq_length * hidden_size * max_tree_branches + vi;
+    // DT const *v_cache_batch =
+    //     value_cache +
+    //     (beam_request_idx * max_beam_width + beam_sub_request_idx) *
+    //         max_seq_length * hidden_size +
+    //     vi;
+
     if (Dh == Dh_MAX || vi < Dh) {
       for (int ti = first_step + vo; ti < tlength; ti += V_PER_ITER) {
         // Load the values from the cache.
         int const ti_circ = ti % max_seq_length;
-
+        // int const real_cache_idx = topology.real_token_pos[sub_req_idx][ti];
         V_vec v = *reinterpret_cast<V_vec const *>(
             v_cache_batch + ti_circ * hidden_size + head_idx * per_head_size);
-        float logit = qk_smem[ti * qlength + qi];
+
+        bool const mask =
+            (ti >= bitmask.non_tree_cache_size &&
+             (!(bitmask.mask[ti - bitmask.non_tree_cache_size] & (1 << qi))));
+        float logit = mask ? 0.0f : qk_smem[ti - first_step];
         out = FlexFlow::fma(logit, cast_to_float(v), out);
+        
       }
     }
 
-    // Make sure we can start writing to shared memory.
+    //   // Make sure we can start writing to shared memory.
     __syncthreads();
 
+    if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && qi == 1) {
+      printf("valueX %.10f\n", out.x);
+    }
+
     // Run the final reduction amongst the different groups computing different
     // partial outputs.
     if (Dh == Dh_MAX || vi < Dh) {
@@ -268,6 +328,11 @@ __global__ void compute_attention_kernel_fused_kernel(
                              output_ptr + (first_token_idx + qi) * hidden_size +
                              head_idx * per_head_size + vi),
                          out);
+       if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && qi == 1) {
+          printf("tree attn final value, %.9f, %.9f, %.9f, %.9f, %d, %d\n",
+                 out.x, out.y, out.z, out.w, vi, (first_token_idx + qi) * hidden_size +
+                             head_idx * per_head_size + vi);
+        }                  
     }
   }
 }
@@ -380,7 +445,9 @@ __global__ void update_tree_branch_kv_cache_fused(
     int vProjSize,
     int num_new_tokens,
     int max_seq_len,
-    int hidden_size) {
+    int hidden_size,
+    int max_tree_branches,
+    int first_token_depth) {
   CUDA_KERNEL_LOOP(i, num_new_tokens * hidden_size) {
 
     int token_idx = i / hidden_size;
@@ -393,10 +460,10 @@ __global__ void update_tree_branch_kv_cache_fused(
 
     int const req_id = tokenInfos[token_idx].request_index;
     int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
-    kCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
-               offset] = kVal;
-    vCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
-               offset] = vVal;
+    kCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
+               (token_idx + first_token_depth) * hidden_size + offset] = kVal;
+    vCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
+               (token_idx + first_token_depth) * hidden_size + offset] = vVal;
   }
 }
 
@@ -473,7 +540,6 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
       }
 
       std::cout << "num_new_tokens: " << num_new_tokens << "\n";
-      assert(false);
 
       int total_tokens_in_request = bc->tokensInfo[j].abs_depth_in_request + 1;
       assert(num_new_tokens >= 1 && total_tokens_in_request >= num_new_tokens);
@@ -728,22 +794,11 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                                         THDS_PER_KEY,                          \
                                         THDS_PER_VALUE>                        \
       <<<grid, THDS_PER_BLOCK, smem_sz[1], stream>>>(                          \
-          static_cast<DT *>(m->devQKVProjArray),                               \
-          static_cast<DT *>(m->keyCache),                                      \
-          static_cast<DT *>(m->valueCache),                                    \
-          output_ptr,                                                          \
-          scale,                                                               \
-          BatchConfig::max_sequence_length(),                                  \
-          BatchConfig::max_tokens_per_batch(),                                 \
-          m->qProjSize,                                                        \
-          m->hidden_size,                                                      \
-          m->request_infos,                                                    \
-          m->num_q_heads,                                                      \
-          bc->num_active_requests(),                                           \
+          static_cast<DT *>(m->devQKVProjArray), static_cast<DT *>(m->keyCache), static_cast<DT *>(m->valueCache), output_ptr, scale, BatchConfig::max_sequence_length(), BatchConfig::max_tokens_per_batch(), m->qProjSize, m->hidden_size, m->request_infos, m->num_q_heads, bc->num_active_requests(), BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES, m->causalMask,                                                       \  
           smem_sz[0])
 
 template <typename DT>
-void compute_attention_kernel_fused(IncMultiHeadSelfAttentionMeta const *m,
+void compute_attention_kernel_fused(TreeIncMultiHeadSelfAttentionMeta const *m,
                                     TreeVerifyBatchConfig const *bc,
                                     DT *output_ptr,
                                     cudaStream_t stream) {
@@ -752,6 +807,12 @@ void compute_attention_kernel_fused(IncMultiHeadSelfAttentionMeta const *m,
   //  update K-V cache
   int num_new_tokens = bc->num_active_tokens();
   int parallelism = m->hidden_size * num_new_tokens;
+  printf("update KV cache %d, idx: %d\n",
+         num_new_tokens,
+         bc->requestsInfo[0].first_token_depth_in_request);
+  for (int i = 0; i < num_new_tokens; i++) {
+    printf("abs depth:%d\n", bc->tokensInfo[i].abs_depth_in_request);
+  }
   update_tree_branch_kv_cache_fused<<<GET_BLOCKS(parallelism),
                                       min(CUDA_NUM_THREADS, parallelism),
                                       0,
@@ -765,7 +826,9 @@ void compute_attention_kernel_fused(IncMultiHeadSelfAttentionMeta const *m,
       m->vProjSize,
       num_new_tokens,
       BatchConfig::max_sequence_length(),
-      m->hidden_size);
+      m->hidden_size,
+      BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES,
+      bc->requestsInfo[0].first_token_depth_in_request);
 
   dim3 grid(m->num_q_heads, bc->num_active_requests());
   int const per_head_size = m->qProjSize;
@@ -816,12 +879,19 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
   // Note that m->num_active_tokens stores the number of active
   // tokens in the previous batch, which is needed for committing
   // keys/values to the key-value cache
+  std::cout << "tokens to be committed: " << bc->num_tokens_to_commit << "\n";
+
   cudaMemcpyAsync(m->committed_token_infos,
                   &(bc->committed_tokens),
                   bc->num_tokens_to_commit *
                       sizeof(TreeVerifyBatchConfig::CommittedTokensInfo),
                   cudaMemcpyHostToDevice,
                   stream);
+  cudaMemcpyAsync(m->causalMask,
+                  &(bc->causalMask),
+                  bc->num_active_requests() * sizeof(BatchConfig::BitMask),
+                  cudaMemcpyHostToDevice,
+                  stream);
   commit_tokens<DT>(m, bc, stream);
 
   // After commit we update m->num_active_tokens to be the number of active
@@ -948,6 +1018,20 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
     cudaEventDestroy(t_start);
     cudaEventDestroy(t_end);
   }
+
+  // print_tensor<float>(output.get_float_ptr(), 32, "tree attn kernel");
+
+  // save_tensor<float>(
+  //     input.get_float_ptr(),
+  //     768 * bc->num_active_tokens(),
+  //     "/home/xinhaoc/FlexFlow/inference/output/Newtreeinput.txt");
+  // save_tensor<float>(
+  //     output.get_float_ptr(),
+  //     768 * bc->num_active_tokens(),
+  //     "/home/xinhaoc/FlexFlow/inference/output/Newtreeoutput.txt");
+  // std::cout << "new tokens: " << bc->num_active_tokens() << "\n";
+
+  // assert(bc->num_tokens_to_commit == 0);
 }
 
 TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
@@ -993,8 +1077,11 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
   {
     int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
     size_t committed_tokeninfo_size = max_tokens_per_batch;
+    size_t causal_mask_size = BatchConfig::MAX_NUM_REQUESTS;
+
     size_t total_size = committed_tokeninfo_size *
-                        sizeof(TreeVerifyBatchConfig::CommittedTokensInfo);
+                            sizeof(TreeVerifyBatchConfig::CommittedTokensInfo) +
+                        causal_mask_size * sizeof(BatchConfig::BitMask);
     if (offload) {
       // assert that we have enough reserved work space left
       assert(gpu_mem_allocator.reserved_total_size -
@@ -1004,6 +1091,8 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
           gpu_mem_allocator
               .allocate_reserved<TreeVerifyBatchConfig::CommittedTokensInfo>(
                   committed_tokeninfo_size);
+      causalMask = gpu_mem_allocator.allocate_instance<BatchConfig::BitMask>(
+          causal_mask_size);
     } else {
       gpu_mem_allocator.create_legion_instance(committed_token_reserve_inst,
                                                total_size);
@@ -1011,6 +1100,8 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
           gpu_mem_allocator
               .allocate_instance<TreeVerifyBatchConfig::CommittedTokensInfo>(
                   committed_tokeninfo_size);
+      causalMask = gpu_mem_allocator.allocate_instance<BatchConfig::BitMask>(
+          causal_mask_size);
     }
   }
 
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 775280e2cf..8a7cea1cc3 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -16,6 +16,7 @@
 #include "flexflow/request_manager.h"
 #include "flexflow/parallel_ops/parallel_op.h"
 // #include "flexflow/tokenizers.h"
+#include <bitset>
 #include <filesystem>
 #include <iomanip>
 #include <new>
@@ -735,6 +736,11 @@ BeamSearchBatchConfig
             new_bc.requestsInfo[i].max_sequence_length -
             new_bc.requestsInfo[i].first_token_depth_in_request -
             verified_tokens.size();
+        // std::cout << "max depth: " << new_max_depth << ", "
+        //           << new_bc.requestsInfo[i].first_token_depth_in_request <<
+        //           ", "
+        //           << verified_tokens.size() << "\n";
+        // assert(false);
         new_bc.beamRequestsInfo[i].current_depth = 1;
 
         profiling_requests[request.guid].ssm_decoding_steps = 0;
@@ -761,6 +767,10 @@ BeamSearchBatchConfig
           new_bc.topology_mask[i].real_token_pos[0][j] = j;
         }
 
+        updateBitMask(new_bc.causalMask[i],
+                      verified_tokens.size(),
+                      request.tokens.size());
+
         // Token Info
         for (int j = 0; j < verified_tokens.size(); j++) {
           auto token = verified_tokens.at(j);
@@ -910,6 +920,11 @@ BeamSearchBatchConfig
           new_bc.num_tokens++;
         }
         new_bc.topology_mask[i].allocated_tokens = 0;
+        new_bc.causalMask[i].non_tree_cache_size = 0;
+        new_bc.causalMask[i].tree_size =
+            new_bc.requestsInfo[i].num_tokens_in_batch;
+        initBitMask(new_bc.causalMask[i],
+                    new_bc.requestsInfo[i].num_tokens_in_batch);
 
         // if (new_bc.requestsInfo[i].num_tokens_in_batch <
         // new_request.initial_len) {
@@ -1161,6 +1176,27 @@ BeamSearchBatchConfig
         }
       }
 
+      memcpy(&new_bc.causalMask[i],
+             &old_bc.causalMask[i],
+             sizeof(BatchConfig::BitMask));
+      // sub_request_num -> nodes of input next iteration
+      //  beam_size replicate num
+
+      std::cout << "print beam tree: "
+                << old_bc.beamRequestsInfo[i].current_depth << "\n";
+      BeamTree tree = request.beam_trees[old_bc.model_id];
+      for (int k = 0; k <= old_bc.beamRequestsInfo[i].current_depth; k++) {
+        std::cout << "layer: " << k << "\n";
+        std::cout << "nodes: " << tree.treeLayers[k].nodes_num_this_layer
+                  << "\n";
+      }
+      appendBitMask(new_bc.causalMask[i],
+                    new_bc.beamRequestsInfo[i].sub_request_num,
+                    old_bc.beamRequestsInfo[i].beam_size,
+                    old_bc.beamRequestsInfo[i].sub_request_num,
+                    tree,
+                    old_bc.beamRequestsInfo[i].current_depth);
+      // assert(false);
       for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
         int depth = new_bc.requestsInfo[i].first_token_depth_in_request + j;
         for (int k = 0; k < new_bc.beamRequestsInfo[i].sub_request_num; k++) {
@@ -1248,6 +1284,10 @@ BeamSearchBatchConfig
         assert(false && "Request should be pending");
       }
 
+      memcpy(&new_bc.causalMask[i],
+             &old_bc.causalMask[i],
+             sizeof(BatchConfig::BitMask));
+
       if (new_bc.requestsInfo[i].first_token_depth_in_request >=
           request.tokens.size()) {
         // request is done
@@ -1260,6 +1300,13 @@ BeamSearchBatchConfig
                      (int)request.tokens.size() -
                          new_bc.requestsInfo[i].first_token_depth_in_request);
         request.ssm_cache_size += new_bc.requestsInfo[i].num_tokens_in_batch;
+        BeamTree tree = request.beam_trees[old_bc.model_id];
+        appendBitMask(new_bc.causalMask[i],
+                      new_bc.beamRequestsInfo[i].sub_request_num,
+                      old_bc.beamRequestsInfo[i].beam_size,
+                      old_bc.beamRequestsInfo[i].sub_request_num,
+                      tree,
+                      old_bc.beamRequestsInfo[i].current_depth);
       }
 
       if (verbose) {
@@ -1378,7 +1425,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
     profiling_requests[request.guid].llm_decoding_steps += 1;
 
     if (request.status == Request::RUNNING) {
-      
+
       std::cout << "prepare next batch running: pending\n"
                 << "\n";
       new_bc.request_running[i] = true;
@@ -1398,7 +1445,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       std::vector<std::pair<BatchConfig::TokenId, int>> dfs_tree_inputs =
           merge_dfs_trees(all_dfs_trees, request.tokens.size() - 1, guid);
 
-      if (verbose) {
+      if (true) {
         std::cout << "Request Tokens Size: " << request.tokens.size()
                   << std::endl;
         for (int k = 0; k < request.tokens.size(); k++) {
@@ -1414,6 +1461,13 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
           old_batches.at(0).requestsInfo[i].request_guid;
       new_bc.requestsInfo[i].max_sequence_length =
           old_batches.at(0).requestsInfo[i].max_sequence_length;
+
+      // copy bitmask to verify batchconfig
+      memcpy(&(new_bc.causalMask[i]),
+             &(old_batches.at(0).causalMask[i]),
+             sizeof(BatchConfig::BitMask));
+      // std::cout << "bitmask: " << new_bc.causalMask[i].mask[0] << "\n";
+      // assert(false);
       // TODO: Check this
       new_bc.requestsInfo[i].num_tokens_in_batch = 0;
       new_bc.request_completed[i] = false;
@@ -1429,7 +1483,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
                 i;
             new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_depth =
                 committed_token.first;
-            if (verbose) {
+            if (true) {
               std::cout << new_bc.num_tokens_to_commit
                         << "- committed_token.token_depth: "
                         << committed_token.first
@@ -1441,7 +1495,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
           }
         }
       }
-      if (verbose) {
+      if (true) {
         std::cout << "new_bc.num_tokens_to_commit: "
                   << new_bc.num_tokens_to_commit << std::endl;
       }
@@ -1463,8 +1517,10 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
 
       new_bc.requestsInfo[i].first_token_depth_in_request =
           request.tokens.size() - 1;
-      
-      std::cout << "prepare next batch verify: " << dfs_tree_inputs.size() << "\n";
+
+      std::cout << "prepare next batch verify: " << dfs_tree_inputs.size()
+                << "\n";
+
       // Add Tokens from the DFS Tree to the next batch
       for (int j = 1; j < dfs_tree_inputs.size(); j++) {
         auto token = dfs_tree_inputs.at(j);
@@ -1485,7 +1541,6 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
           break;
         }
       }
-      assert(false);
 
     } else if (request.status == Request::PENDING) {
       std::cout << "prepare next batch verify: pending\n"
@@ -1518,6 +1573,12 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
                   << new_bc.num_tokens_to_commit << std::endl;
       }
 
+      memcpy(&(new_bc.causalMask[i]),
+             &(old_batches.at(0).causalMask[i]),
+             sizeof(BatchConfig::BitMask));
+      // std::cout << "bitmask: " << new_bc.causalMask[i].mask[0] << "\n";
+      // assert(false);
+
       // Normal Request Info
       new_bc.requestsInfo[i].first_token_depth_in_request =
           request.llm_cache_size;
@@ -1643,8 +1704,6 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
           (old_bc.tokensInfo[i - 1].abs_depth_in_request - start_depth) *
           beam_size;
 
-      // result_index += old_bc.topology_mask[index].allocated_tokens;
-
       if (true) {
         std::cout << "i = " << i << ", result index = " << result_index
                   << ", value: " << result.token_ids[result_index]
@@ -1669,6 +1728,9 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
             request.tokens.back();
         request.beam_trees.at(old_bc.model_id).treeLayers[0].probs[0] = 1;
         request.beam_trees.at(old_bc.model_id).treeLayers[0].parent_ids[0] = -1;
+        request.beam_trees.at(old_bc.model_id)
+            .treeLayers[0]
+            .nodes_num_this_layer = 1;
 
         if (true) {
           std::cout << "Store the previous last token to the tree root: "
@@ -1677,7 +1739,9 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
       }
 
       std::cout << "leaffffff: " << leaf_node_num << "\n";
-
+      request.beam_trees.at(old_bc.model_id)
+          .treeLayers[depth]
+          .nodes_num_this_layer = leaf_node_num;
       for (int beam_id = 0; beam_id < leaf_node_num; beam_id++) {
 
         request.beam_trees.at(old_bc.model_id)
@@ -1751,50 +1815,6 @@ void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
       std::cout << "token: " << j << ": "
                 << new_bc.beamRequestsInfo[request_index].tokens[j] << "\n";
     }
-
-    // std::set<int> parents;
-    // std::set<int> childs;
-    // // cache stealing
-    // for (int j = 0; j < beam_size; j++) {
-    //   int parent_id = tree.treeLayers[depth].parent_ids[j];
-    //   if (childs.find(parent_id) == childs.end()) {
-    //     // copy beam slot
-    //     new_bc.beamRequestsInfo[request_index].parent_id[parent_id] =
-    //         tree.treeLayers[depth].parent_ids[j];
-    //     new_bc.beamRequestsInfo[request_index].probs[parent_id] =
-    //         tree.treeLayers[depth].probs[j];
-    //     new_bc.beamRequestsInfo[request_index].tokens[parent_id] =
-    //         tree.treeLayers[depth].tokens[j];
-    //     parents.emplace(j);
-    //     childs.emplace(parent_id);
-    //   }
-    // }
-    // if (parents.size() < beam_size) {
-    //   for (int j = 0; j < beam_size; j++) {
-    //     if (parents.find(j) == parents.end()) {
-    //       // this slot has not been assigned
-    //       // find the smallest not assigned child and put in
-    //       if (verbose) {
-    //         std::cout << "request_index" << request_index
-    //                   << ", miss slot: " << j << "\n";
-    //       }
-    //       for (int k = 0; k < beam_size; k++) {
-    //         if (childs.find(k) == childs.end()) {
-    //           // parent -> j to child k;
-    //           new_bc.beamRequestsInfo[request_index].parent_id[k] =
-    //               tree.treeLayers[depth].parent_ids[j];
-    //           new_bc.beamRequestsInfo[request_index].probs[k] =
-    //               tree.treeLayers[depth].probs[j];
-    //           new_bc.beamRequestsInfo[request_index].tokens[k] =
-    //               tree.treeLayers[depth].tokens[j];
-    //           parents.emplace(j);
-    //           childs.emplace(k);
-    //           break;
-    //         }
-    //       }
-    //     }
-    //   }
-    // }
   }
   if (verbose) {
     std::cout << "-----------after parent id exchange-----------" << std::endl;
@@ -1809,6 +1829,128 @@ void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
   }
 }
 
+// bit mask related function
+
+// prompt phase, init task
+void RequestManager::initBitMask(BatchConfig::BitMask &bitmask,
+                                 int initLength) {
+  assert(initLength <= BatchConfig::MAX_SPEC_TREE_TOKEN_NUM &&
+         "do not support tree size > 64");
+  // eg. 4 tokens: t1: 0000000..1111, t2: 0000000..1110, t3: 0000000..1100, t4:
+  // 0000000..1000
+
+  bitmask.prompt_size = initLength;
+  bitmask.this_layer_size = initLength;
+  bitmask.tree_size = initLength;
+  for (int i = 0; i < bitmask.prompt_size; i++) {
+    for (int j = i; j < bitmask.prompt_size; j++) {
+      bitmask.mask[i] |= (1 << j);
+    }
+  }
+  std::cout << "see bit mask" << bitmask.prompt_size << "\n";
+  std::cout << "see bit mask" << std::bitset<64>(bitmask.mask[0]) << "\n";
+  std::cout << "see bit mask" << std::bitset<64>(bitmask.mask[1]) << "\n";
+  std::cout << "see bit mask" << std::bitset<64>(bitmask.mask[2]) << "\n";
+}
+
+// prepare next init
+void RequestManager::updateBitMask(BatchConfig::BitMask &bitmask,
+                                   int initLength,
+                                   int non_tree_size) {
+  // assert(initLength == 1);
+  // eg. 4 tokens: t1: 0000000..1111, t2: 0000000..1110, t3: 0000000..1100, t4:
+  // 0000000..1000
+  assert(initLength <= BatchConfig::MAX_SPEC_TREE_TOKEN_NUM &&
+         "do not support tree size > 64");
+  bitmask.non_tree_cache_size = non_tree_size;
+  bitmask.tree_size = initLength;
+  bitmask.this_layer_size = initLength;
+  std::cout << "non_tree_size: " << non_tree_size << "\n";
+  bitmask.prompt_size = initLength;
+  for (int i = 0; i < bitmask.prompt_size; i++) {
+    for (int j = i; j < bitmask.prompt_size; j++) {
+      bitmask.mask[i] |= (1 << j);
+    }
+  }
+
+  std::cout << "see bit mask update" << bitmask.prompt_size << "\n";
+  std::cout << "see bit mask update" << std::bitset<64>(bitmask.mask[0])
+            << "\n";
+  std::cout << "see bit mask update" << std::bitset<64>(bitmask.mask[1])
+            << "\n";
+  std::cout << "see bit mask update" << std::bitset<64>(bitmask.mask[2])
+            << "\n";
+}
+
+// prepare next beam, append layers to the tree
+void RequestManager::appendBitMask(BatchConfig::BitMask &bitmask,
+                                   int newNodes,
+                                   int preBeamSize,
+                                   int old_sub_num,
+                                   BeamTree const tree,
+                                   int currentDepth) {
+  int pre_tree_size = bitmask.tree_size;
+  bitmask.tree_size += newNodes;
+  bitmask.this_layer_size = newNodes;
+  assert(bitmask.tree_size <= BatchConfig::MAX_SPEC_TREE_TOKEN_NUM &&
+         "do not support tree size > 64");
+  // preBeamSize: replicate num
+
+  // add relationship with input/prompt
+  for (int i = 0; i < bitmask.prompt_size; i++) {
+    for (int j = pre_tree_size; j < bitmask.tree_size; j++) {
+      bitmask.mask[i] |= (1 << j);
+      std::cout << "see bit mask append: " << i << ", to" << j
+                << std::bitset<64>(bitmask.mask[i]) << "\n";
+    }
+  }
+
+  std::cout << "bitmask.tree_size: " << bitmask.tree_size << ", "
+            << pre_tree_size << ", " << bitmask.prompt_size << ", "
+            << preBeamSize << "\n";
+
+  // int num_groups = newNodes / preBeamSize;
+  // int group_size = newNodes / num_groups;
+  // add relations to branch
+  // requests in same groups share same relations, except the last token.
+
+  // set middle layers
+  //  skip the root prompt/tokens
+  int token_idx = bitmask.prompt_size;
+  int new_nodes_start_idx = pre_tree_size;
+  std::cout << "new nodes start " << new_nodes_start_idx << "\n";
+  for (int i = 1; i < currentDepth; i++) {
+    new_nodes_start_idx = pre_tree_size;
+    int nodes_this_layer = tree.treeLayers[i].nodes_num_this_layer;
+    std::cout << "tree layer: " << i << " nodes:" << nodes_this_layer
+              << "group size: " << newNodes / nodes_this_layer << "\n";
+    for (int j = 0; j < nodes_this_layer; j++) {
+      int group_size = newNodes / nodes_this_layer;
+      for (int k = 0; k < group_size; k++) {
+        bitmask.mask[token_idx] |= (1 << new_nodes_start_idx);
+        new_nodes_start_idx += 1;
+      }
+      token_idx += 1;
+    }
+  }
+
+  std::cout << "token idx: " << token_idx << ", " << pre_tree_size << ", "
+            << new_nodes_start_idx << ", " << newNodes
+            << "current depth: " << currentDepth << "\n";
+  std::cout << "new nodes end " << new_nodes_start_idx << "\n";
+
+  std::cout << "tree size: " << bitmask.tree_size << "\n";
+  assert(token_idx == pre_tree_size);
+  assert(currentDepth <= 1 || new_nodes_start_idx == bitmask.tree_size);
+
+  // assert(currentDepth <= 2);
+  // set last layer, all tokens are only relevant to it self;
+  for (int i = token_idx; i < bitmask.tree_size; i++) {
+    bitmask.mask[i] |= (1 << i);
+    std::cout << "set rel: " << i << "to: " << i << "\n";
+  }
+}
+
 bool PreOrder(
     BeamTree const &tree,
     int max_depth,
@@ -1979,7 +2121,7 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
     RequestManager::traverse_beam_tree(BeamSearchBatchConfig const &old_bc,
                                        int request_index,
                                        int first_token_depth_in_request) {
-  if (verbose) {
+  if (true) {
     std::cout << "[Traverse Beam Tree] request_index: " << request_index
               << "\n";
     std::cout << "[Traverse Beam Tree] max_depth: "
@@ -1988,6 +2130,8 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
               << old_bc.beamRequestsInfo[request_index].current_depth << "\n";
     std::cout << "[Traverse Beam Tree] beam_width: "
               << old_bc.beamRequestsInfo[request_index].beam_size << "\n";
+    std::cout << "[Traverse Beam Tree] start index: "
+              << first_token_depth_in_request << "\n";
   }
 
   auto guid = old_bc.requestsInfo[request_index].request_guid;
@@ -1995,27 +2139,39 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
   // std::cout << "request.beam_trees.size(): " << request.beam_trees.size()
   //           << std::endl;
   BeamTree tree = request.beam_trees.at(old_bc.model_id);
-  // std::cout << "\n\n";
 
+  std::cout << "print beam tree: "
+            << "\n";
+  std::vector<std::pair<BatchConfig::TokenId, int>> serializedTree;
+  for (int i = 0; i <= old_bc.beamRequestsInfo[request_index].max_depth; i++) {
+    std::cout << "tree layer: " << i
+              << ", num_nodes: " << tree.treeLayers[i].nodes_num_this_layer
+              << "\n";
+    // push tokens into tree
+    for (int j = 0; j < tree.treeLayers[i].nodes_num_this_layer; j++) {
+      std::cout << "token: " << tree.treeLayers[i].tokens[j] << "\n";
+      serializedTree.push_back(std::make_pair(tree.treeLayers[i].tokens[j], i));
+    }
+  }
   // token, index
   // todo make this one global for different stages
-  std::vector<std::pair<BatchConfig::TokenId, int>> serializedTree;
-  PreOrder(tree,
-           old_bc.beamRequestsInfo[request_index].max_depth,
-           0,
-           old_bc.beamRequestsInfo[request_index].beam_size,
-           0,
-           serializedTree,
-           verbose);
+
+  // PreOrder(tree,
+  //          old_bc.beamRequestsInfo[request_index].max_depth,
+  //          0,
+  //          old_bc.beamRequestsInfo[request_index].beam_size,
+  //          0,
+  //          serializedTree,
+  //          verbose);
 
   // print it
-  if (verbose) {
+  if (true) {
     std::cout << "Print serialized tree: size:" << request_index
               << serializedTree.size() << "\n";
   }
   for (int k = 0; k < serializedTree.size(); k++) {
     serializedTree.at(k).second += first_token_depth_in_request;
-    if (verbose) {
+    if (true) {
       std::cout << "token id: " << serializedTree.at(k).first
                 << ", depth: " << serializedTree.at(k).second << "\n";
     }
@@ -2041,6 +2197,9 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
             input_trees,
         int root_depth,
         RequestGuid guid) {
+  assert(input_trees.size() == 1 && "currently using one ssm");
+  return input_trees.at(0);
+
   std::vector<std::pair<BatchConfig::TokenId, int>> merged_tree;
 
   std::unordered_map<int, std::set<int>> childrens;
diff --git a/src/runtime/request_manager.cu b/src/runtime/request_manager.cu
index b76c5c326e..4d7e2c8806 100644
--- a/src/runtime/request_manager.cu
+++ b/src/runtime/request_manager.cu
@@ -104,6 +104,18 @@ void RequestManager::load_tokens_task(
                     sizeof(BeamSearchBatchConfig::beamRequestsInfo),
                     cudaMemcpyHostToDevice,
                     stream);
+
+    // cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+    //                     sizeof(BatchConfig::tokensInfo) +
+    //                     sizeof(BatchConfig::requestsInfo) +
+    //                     sizeof(BeamSearchBatchConfig::topology_mask) +
+    //                     sizeof(BeamSearchBatchConfig::beamTokenInfo) +
+    //                     sizeof(BeamSearchBatchConfig::beamRequestsInfo),
+    //                 &(beam_batch_config->causalMask),
+    //                 sizeof(BatchConfig::causalMask),
+    //                 cudaMemcpyHostToDevice,
+    //                 stream);
+    //  std::cout << "copy calsual mask info: " << beam_batch_config->causalMask[0].prompt_size << "\n";
   }
 }
 

From 945268f1a56e804b62b731c136bf8358c47b765f Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Thu, 28 Dec 2023 11:19:16 -0500
Subject: [PATCH 275/344] fix.

---
 inference/spec_infer/spec_infer.cc           |  2 +-
 src/ops/tree_inc_multihead_self_attention.cu | 78 ++++++++++----------
 src/runtime/request_manager.cc               | 11 ++-
 3 files changed, 50 insertions(+), 41 deletions(-)

diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 2ccdfd388d..e4fa71a1d5 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -404,7 +404,7 @@ void FlexFlow::top_level_task(Task const *task,
       prompts.push_back(text);
       // tree_model.generate(text, 128 /*max_sequence_length*/);
     }
-    tree_model.generate(prompts, 15 /*max_sequence_length*/);
+    tree_model.generate(prompts, 23 /*max_sequence_length*/);
   }
 
   // Execution fence
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index a3e3adcc30..3d5ccf9431 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -162,24 +162,24 @@ __global__ void compute_attention_kernel_fused_kernel(
             (ti >= bitmask.non_tree_cache_size &&
              (!(bitmask.mask[ti - bitmask.non_tree_cache_size] & (1 << qi))));
         
-        if (blockIdx.y == 0 && blockIdx.x == 0 && qi == 0 && mask) {
-          printf("tree attn mask for first token %d, %lld, %d, %d\n",
-                 ti,
-                 bitmask.mask[ti - bitmask.non_tree_cache_size],
-                 bitmask.non_tree_cache_size,
-                 qi);
-        }
+        // if (blockIdx.y == 0 && blockIdx.x == 0 && qi == 0 && mask) {
+        //   printf("tree attn mask for first token %d, %lld, %d, %d\n",
+        //          ti,
+        //          bitmask.mask[ti - bitmask.non_tree_cache_size],
+        //          bitmask.non_tree_cache_size,
+        //          qi);
+        // }
 
         qk_max = mask ? qk_max : fmaxf(qk_max, qk);
 
-        if (blockIdx.y == 0 && blockIdx.x == 0 && qi == 1 && !mask) {
-          printf("tree attn mask for second token %d, %lld, %d, %d, %.10f\n",
-                 ti,
-                 bitmask.mask[ti - bitmask.non_tree_cache_size],
-                 bitmask.non_tree_cache_size,
-                 qi,
-                 qk);
-        }
+        // if (blockIdx.y == 0 && blockIdx.x == 0 && qi == 1 && !mask) {
+        //   printf("tree attn mask for second token %d, %lld, %d, %d, %.10f\n",
+        //          ti,
+        //          bitmask.mask[ti - bitmask.non_tree_cache_size],
+        //          bitmask.non_tree_cache_size,
+        //          qi,
+        //          qk);
+        // }
         qk_smem[ti - first_step] = mask ? 0.0f : qk;
       }
     }
@@ -213,10 +213,10 @@ __global__ void compute_attention_kernel_fused_kernel(
     // Broadcast to all the threads in the warp.
     qk_max = __shfl_sync(uint32_t(-1), qk_max, 0);
     
-     if (blockIdx.y == 0 && blockIdx.x == 0 && qi == 0 && tidx == 0) {
-          printf("tree attn first token qk_max %f\n",
-                 qk_max);
-      }
+    //  if (blockIdx.y == 0 && blockIdx.x == 0 && qi == 0 && tidx == 0) {
+    //       printf("tree attn first token qk_max %f\n",
+    //              qk_max);
+    //   }
 
 
     float exp_sum = 0.f;
@@ -232,9 +232,9 @@ __global__ void compute_attention_kernel_fused_kernel(
     // Compute the sum.
     exp_sum = block_sum<WARPS_PER_BLOCK>(&red_smem[WARPS_PER_BLOCK], exp_sum);
 
-    if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && qi == 1) {
-      printf("expsum %.10f\n", exp_sum);
-    }
+    // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && qi == 1) {
+    //   printf("expsum %.10f\n", exp_sum);
+    // }
 
     // softmax
     float inv_sum = __fdividef(1.f, exp_sum + 1.e-6);
@@ -243,9 +243,9 @@ __global__ void compute_attention_kernel_fused_kernel(
     }
 
     __syncthreads();
-    if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && qi == 1) {
-      printf("softmax %.10f\n", qk_smem[0]);
-    }
+    // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && qi == 1) {
+    //   printf("softmax %.10f\n", qk_smem[0]);
+    // }
 
     // value projection
     constexpr int V_VEC_SIZE = 16 / sizeof(DT);
@@ -292,9 +292,9 @@ __global__ void compute_attention_kernel_fused_kernel(
     //   // Make sure we can start writing to shared memory.
     __syncthreads();
 
-    if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && qi == 1) {
-      printf("valueX %.10f\n", out.x);
-    }
+    // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && qi == 1) {
+    //   printf("valueX %.10f\n", out.x);
+    // }
 
     // Run the final reduction amongst the different groups computing different
     // partial outputs.
@@ -328,11 +328,11 @@ __global__ void compute_attention_kernel_fused_kernel(
                              output_ptr + (first_token_idx + qi) * hidden_size +
                              head_idx * per_head_size + vi),
                          out);
-       if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && qi == 1) {
-          printf("tree attn final value, %.9f, %.9f, %.9f, %.9f, %d, %d\n",
-                 out.x, out.y, out.z, out.w, vi, (first_token_idx + qi) * hidden_size +
-                             head_idx * per_head_size + vi);
-        }                  
+      //  if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && qi == 1) {
+      //     printf("tree attn final value, %.9f, %.9f, %.9f, %.9f, %d, %d\n",
+      //            out.x, out.y, out.z, out.w, vi, (first_token_idx + qi) * hidden_size +
+      //                        head_idx * per_head_size + vi);
+      //   }                  
     }
   }
 }
@@ -807,12 +807,12 @@ void compute_attention_kernel_fused(TreeIncMultiHeadSelfAttentionMeta const *m,
   //  update K-V cache
   int num_new_tokens = bc->num_active_tokens();
   int parallelism = m->hidden_size * num_new_tokens;
-  printf("update KV cache %d, idx: %d\n",
-         num_new_tokens,
-         bc->requestsInfo[0].first_token_depth_in_request);
-  for (int i = 0; i < num_new_tokens; i++) {
-    printf("abs depth:%d\n", bc->tokensInfo[i].abs_depth_in_request);
-  }
+  // printf("update KV cache %d, idx: %d\n",
+  //        num_new_tokens,
+  //        bc->requestsInfo[0].first_token_depth_in_request);
+  // for (int i = 0; i < num_new_tokens; i++) {
+  //   printf("abs depth:%d\n", bc->tokensInfo[i].abs_depth_in_request);
+  // }
   update_tree_branch_kv_cache_fused<<<GET_BLOCKS(parallelism),
                                       min(CUDA_NUM_THREADS, parallelism),
                                       0,
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 8a7cea1cc3..e7b08f653d 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -630,8 +630,11 @@ BeamSearchBatchConfig
     }
 
     if (request.status == Request::RUNNING) {
+      std::cout << "verify running: " << dfs_tree_inputs.at(guid).size() << ", "
+                << tree_outputs.size() << "\n";
       std::vector<std::pair<BatchConfig::TokenId, int>> verified_tokens =
           traverse_verify_tree(guid, dfs_tree_inputs.at(guid), tree_outputs);
+
       log_req_mgr.print("Number of Verified Tokens = %zu",
                         verified_tokens.size());
 
@@ -1426,7 +1429,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
 
     if (request.status == Request::RUNNING) {
 
-      std::cout << "prepare next batch running: pending\n"
+      std::cout << "prepare next batch running:\n"
                 << "\n";
       new_bc.request_running[i] = true;
       std::cout << "[Verify] Request " << request.guid << " is running"
@@ -1663,6 +1666,9 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
     }
   }
 
+  std::cout << "check dfs tree input size: " << dfs_tree_inputs[1000000].size()
+            << "\n";
+
   return new_bc;
 }
 
@@ -2198,6 +2204,7 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
         int root_depth,
         RequestGuid guid) {
   assert(input_trees.size() == 1 && "currently using one ssm");
+  dfs_tree_inputs[guid] = input_trees.at(0);
   return input_trees.at(0);
 
   std::vector<std::pair<BatchConfig::TokenId, int>> merged_tree;
@@ -2249,6 +2256,8 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
   }
 
   dfs_tree_inputs[guid] = merged_tree;
+  // std::cout << "assign dfr tree: " << guid << ", " << merged_tree.size() << ", "
+  //           << dfs_tree_inputs[guid].size() << "\n";
 
   return merged_tree;
 }

From ce95127aecaf553679539310574b48417609efa2 Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Fri, 29 Dec 2023 03:41:26 -0500
Subject: [PATCH 276/344] fix

---
 inference/spec_infer/spec_infer.cc            |   4 +-
 src/ops/kernels/embedding_kernels.cu          |   2 +-
 .../specinfer_inc_multihead_self_attention.cu |  76 ++++---
 src/ops/tree_inc_multihead_self_attention.cu  | 114 ++++++----
 src/runtime/request_manager.cc                | 198 +++++++++++-------
 5 files changed, 246 insertions(+), 148 deletions(-)

diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index e4fa71a1d5..9af3e12e5a 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -402,9 +402,9 @@ void FlexFlow::top_level_task(Task const *task,
       printf("Prompt[%d]: %s\n", total_num_requests, text.c_str());
       total_num_requests++;
       prompts.push_back(text);
-      // tree_model.generate(text, 128 /*max_sequence_length*/);
+    // tree_model.generate(text, 128 /*max_sequence_length*/);
     }
-    tree_model.generate(prompts, 23 /*max_sequence_length*/);
+    tree_model.generate(prompts, 128 /*max_sequence_length*/);
   }
 
   // Execution fence
diff --git a/src/ops/kernels/embedding_kernels.cu b/src/ops/kernels/embedding_kernels.cu
index 91f5d60e85..0cde42de56 100644
--- a/src/ops/kernels/embedding_kernels.cu
+++ b/src/ops/kernels/embedding_kernels.cu
@@ -118,7 +118,7 @@ void forward_kernel_wrapper(EmbeddingMeta const *m,
     // print_tensor<float>(output_ptr, output_domain.get_volume(),
     // "[Embedding:forward:output]");
   }
-  print_tensor<int>(input.get_int32_ptr(), 32, "embeddinginput");
+  // print_tensor<int>(input.get_int32_ptr(), 32, "embeddinginput");
 }
 
 /*static*/
diff --git a/src/ops/specinfer_inc_multihead_self_attention.cu b/src/ops/specinfer_inc_multihead_self_attention.cu
index e8ac1d980c..f2ea63d904 100644
--- a/src/ops/specinfer_inc_multihead_self_attention.cu
+++ b/src/ops/specinfer_inc_multihead_self_attention.cu
@@ -83,9 +83,9 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
   int const tlength = request_infos[request_idx].first_token_depth_in_request +
                       request_infos[request_idx].num_tokens_in_batch;
 
-  if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
-    printf("specinfer attn fused kernel %lld\n", bitmask.mask[1]);
-  }
+  // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
+  //   printf("specinfer attn fused kernel %lld\n", bitmask.mask[1]);
+  // }
 
   int const totalCacheSize = bitmask.non_tree_cache_size + bitmask.tree_size;
   // int const qlength = request_infos[request_idx].num_tokens_in_batch;
@@ -181,6 +181,10 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
       }
       float qk = scale * Qk_dot<DT, THREADS_PER_KEY>::dot(q_vecs[ki_o], k);
 
+      // if (blockIdx.y == 0 && blockIdx.x == 0) {
+      //   printf("spec inc attn qkqkqk %d,  %.10f, %d\n", ti, qk, sub_req_idx);
+      // }
+
       if (ti < totalCacheSize && tidx % THREADS_PER_KEY == 0) {
         // todo add alobi here
         // bool const mask = ti_circ >= totalCacheSize;
@@ -188,15 +192,15 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
                            (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
                               (1 << query_token))));
 
-        if (blockIdx.y == 0 && blockIdx.x == 0 && mask && sub_req_idx == 0) {
-          // printf("specinfer mask: ti:%d, %d, %d, %d, %lld\n",
-          //        ti,
-          //        totalCacheSize,
-          //        ti - bitmask.non_tree_cache_size,
-          //        query_token,
-          //        bitmask.mask[ti - bitmask.non_tree_cache_size]);
-          // assert(false);
-        }
+        // if (blockIdx.y == 0 && blockIdx.x == 0 && sub_req_idx == 0) {
+        //   printf("specinfer mask: ti:%d, %d, %d, %d, %lld\n",
+        //          ti,
+        //          totalCacheSize,
+        //          bitmask.non_tree_cache_size,
+        //          query_token,
+        //          bitmask.mask[ti - bitmask.non_tree_cache_size]);
+        //   // assert(false);
+        // }
         qk_max = mask ? qk_max : fmaxf(qk_max, qk);
         qk_smem[ti - first_step] = mask ? 0.f : qk;
       }
@@ -231,6 +235,10 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
     // Broadcast to all the threads in the warp.
     qk_max = __shfl_sync(uint32_t(-1), qk_max, 0);
 
+    // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
+    //   printf("spec inc attn first token qk_max %.10f\n", qk_max);
+    // }
+
     float exp_sum = 0.f;
     for (int ti = first_step + tidx; ti < totalCacheSize;
          ti += THREADS_PER_BLOCK) {
@@ -245,6 +253,10 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
     // Compute the sum.
     exp_sum = block_sum<WARPS_PER_BLOCK>(&red_smem[WARPS_PER_BLOCK], exp_sum);
 
+    // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
+    //   printf("spec inc attn exp_sum %.10f\n", exp_sum);
+    // }
+
     // softmax
     float inv_sum = __fdividef(1.f, exp_sum + 1.e-6);
     for (int ti = first_step + tidx; ti < totalCacheSize;
@@ -301,6 +313,10 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
     //   // Make sure we can start writing to shared memory.
     __syncthreads();
 
+    // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
+    //   printf("valueX %.10f\n", out.x);
+    // }
+
     // Run the final reduction amongst the different groups computing different
     // partial outputs.
     if (Dh == Dh_MAX || vi < Dh) {
@@ -357,8 +373,8 @@ __global__ void specinfer_store_kv_cache(
     int max_tree_branches,
     bool is_root,
     int hidden_size) {
-  CUDA_KERNEL_LOOP(i, num_tokens * hidden_size * 2) {
-    int token_idx = i / (hidden_size * KV_WEIGHT_NUM);
+  CUDA_KERNEL_LOOP(i, num_tokens * hidden_size) {
+    int token_idx = i / (hidden_size);
     int offset = i % hidden_size;
 
     size_t val_idx =
@@ -416,6 +432,16 @@ __global__ void specinfer_store_kv_cache(
     //          cache_idx);
     // }
 
+    // if (i % hidden_size == 0) {
+    //   printf("update cache: %d, %d, %d, %d, %d, %d\n",
+    //          cache_idx,
+    //          num_tokens,
+    //          bitmask.non_tree_cache_size,
+    //          bitmask.tree_size,
+    //          bitmask.this_layer_size,
+    //          token_idx);
+    // }
+
     kCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
                (cache_idx)*hidden_size + offset] = kVal;
     vCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
@@ -433,9 +459,9 @@ void update_kv_cache_kernel(SpecInferIncMultiHeadSelfAttentionMeta const *m,
   // assert(curr_depth < 3);
   if (num_tokens > 0) {
     int parallelism = m->hidden_size * KV_WEIGHT_NUM * num_tokens;
-    printf("tokenInfo %d, %d\n",
-           bc->beamTokenInfo[0].sub_request_index,
-           num_tokens);
+    // printf("tokenInfo %d, %d\n",
+    //        bc->beamTokenInfo[0].sub_request_index,
+    //        num_tokens);
     specinfer_store_kv_cache<<<GET_BLOCKS(parallelism),
                                min(CUDA_NUM_THREADS, parallelism),
                                0,
@@ -786,10 +812,11 @@ void inference_kernel(SpecInferIncMultiHeadSelfAttentionMeta const *m,
                   bc->num_active_requests() * sizeof(BatchConfig::BitMask),
                   cudaMemcpyHostToDevice,
                   stream);
-  std::cout << "kernel bit mask: " << bc->causalMask[0].prompt_size << ", "
-            << bc->causalMask[0].non_tree_cache_size << ", "
-            << bc->causalMask[0].mask[0] << ", " << sizeof(BatchConfig::BitMask)
-            << "\n";
+  // std::cout << "kernel bit mask: " << bc->causalMask[0].prompt_size << ", "
+  //           << bc->causalMask[0].non_tree_cache_size << ", "
+  //           << bc->causalMask[0].mask[0] << ", " <<
+  //           sizeof(BatchConfig::BitMask)
+  //           << "\n";
   compute_qkv_kernel(m,
                      bc,
                      shard_id,
@@ -800,8 +827,8 @@ void inference_kernel(SpecInferIncMultiHeadSelfAttentionMeta const *m,
                      stream);
   // phase 2: Update key/val cache
   update_kv_cache_kernel<DT>(m, bc, stream);
-  std::cout << "specinfer kernel token num: " << bc->num_generation_tokens
-            << ", " << bc->num_tokens << "\n";
+  // std::cout << "specinfer kernel token num: " << bc->num_generation_tokens
+  //           << ", " << bc->num_tokens << "\n";
   if (bc->num_generation_tokens > 0) {
     compute_specinfer_attention_kernel_generation<DT>(
         m, bc, static_cast<DT *>(m->attn_heads), stream);
@@ -809,6 +836,7 @@ void inference_kernel(SpecInferIncMultiHeadSelfAttentionMeta const *m,
   // phase 3: Compute attention score
   // 3 kernels for pahse 3: matmul1 - softmax - matmal2
   if (bc->num_tokens > bc->num_generation_tokens) {
+    // printf("spec inc prompt decoding\n");
     compute_attention_kernel_prompt(
         m, bc, shard_id, output_ptr, bias_ptr, weight_ptr, stream);
   }
@@ -892,7 +920,7 @@ void SpecInferIncMultiHeadSelfAttention::inference_kernel_wrapper(
     // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
     // acc_output.rect, "[Attention:forward:output]");
   }
-  //  print_tensor<float>(output.get_float_ptr(), 32, "specinc output");
+  // print_tensor<float>(output.get_float_ptr(), 32, "specinc output");
 
   // if(bc->num_tokens == 1){
   //   print_tensor<float>(input.get_float_ptr(), 32, "specinc input");
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index 3d5ccf9431..180a165451 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -86,13 +86,13 @@ __global__ void compute_attention_kernel_fused_kernel(
   BatchConfig::BitMask bitmask = causalMask[request_idx];
 
   // bitmask.mask[1] = 3;
-  if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
-    printf("tree attn fused kernel %d, %d, %d, %lld\n",
-           tlength,
-           qlength,
-           bitmask.non_tree_cache_size,
-           bitmask.mask[1]);
-  }
+  // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
+  //   printf("tree attn fused kernel %d, %d, %d, %lld\n",
+  //          tlength,
+  //          qlength,
+  //          bitmask.non_tree_cache_size,
+  //          bitmask.mask[3]);
+  // }
 
   int first_token_idx = 0;
   for (int r = 0; r < request_idx; r++) {
@@ -161,7 +161,7 @@ __global__ void compute_attention_kernel_fused_kernel(
         bool const mask =
             (ti >= bitmask.non_tree_cache_size &&
              (!(bitmask.mask[ti - bitmask.non_tree_cache_size] & (1 << qi))));
-        
+
         // if (blockIdx.y == 0 && blockIdx.x == 0 && qi == 0 && mask) {
         //   printf("tree attn mask for first token %d, %lld, %d, %d\n",
         //          ti,
@@ -169,16 +169,22 @@ __global__ void compute_attention_kernel_fused_kernel(
         //          bitmask.non_tree_cache_size,
         //          qi);
         // }
+        // if (blockIdx.y == 0 && blockIdx.x == 0 && qi == 3 && mask) {
+        //   printf("tree attn mask for third token %d, %lld, %d, %d\n",
+        //          ti,
+        //          bitmask.mask[ti - bitmask.non_tree_cache_size],
+        //          bitmask.non_tree_cache_size,
+        //          qi);
+        // }
 
         qk_max = mask ? qk_max : fmaxf(qk_max, qk);
 
         // if (blockIdx.y == 0 && blockIdx.x == 0 && qi == 1 && !mask) {
-        //   printf("tree attn mask for second token %d, %lld, %d, %d, %.10f\n",
+        //   printf("tree attn qkqkqkqk %d %.10f, %.10f, %.10f\n",
         //          ti,
-        //          bitmask.mask[ti - bitmask.non_tree_cache_size],
-        //          bitmask.non_tree_cache_size,
-        //          qi,
-        //          qk);
+        //          qk,
+        //          q_vecs[ki_o][0].x,
+        //          k[0].x);
         // }
         qk_smem[ti - first_step] = mask ? 0.0f : qk;
       }
@@ -212,12 +218,10 @@ __global__ void compute_attention_kernel_fused_kernel(
 
     // Broadcast to all the threads in the warp.
     qk_max = __shfl_sync(uint32_t(-1), qk_max, 0);
-    
-    //  if (blockIdx.y == 0 && blockIdx.x == 0 && qi == 0 && tidx == 0) {
-    //       printf("tree attn first token qk_max %f\n",
-    //              qk_max);
-    //   }
 
+    // if (blockIdx.y == 0 && blockIdx.x == 0 && qi == 1 && tidx == 0) {
+    //   printf("tree attn first token qk_max %f\n", qk_max);
+    // }
 
     float exp_sum = 0.f;
     for (int ti = first_step + tidx; ti < tlength; ti += THREADS_PER_BLOCK) {
@@ -244,7 +248,7 @@ __global__ void compute_attention_kernel_fused_kernel(
 
     __syncthreads();
     // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && qi == 1) {
-    //   printf("softmax %.10f\n", qk_smem[0]);
+    //   printf("softmax %.10f\n", qk_smem[1]);
     // }
 
     // value projection
@@ -280,12 +284,13 @@ __global__ void compute_attention_kernel_fused_kernel(
         V_vec v = *reinterpret_cast<V_vec const *>(
             v_cache_batch + ti_circ * hidden_size + head_idx * per_head_size);
 
-        bool const mask =
-            (ti >= bitmask.non_tree_cache_size &&
-             (!(bitmask.mask[ti - bitmask.non_tree_cache_size] & (1 << qi))));
-        float logit = mask ? 0.0f : qk_smem[ti - first_step];
-        out = FlexFlow::fma(logit, cast_to_float(v), out);
-        
+        if (ti < tlength) {
+          bool const mask =
+              (ti >= bitmask.non_tree_cache_size &&
+               (!(bitmask.mask[ti - bitmask.non_tree_cache_size] & (1 << qi))));
+          float logit = mask ? 0.0f : qk_smem[ti - first_step];
+          out = FlexFlow::fma(logit, cast_to_float(v), out);
+        }
       }
     }
 
@@ -328,11 +333,16 @@ __global__ void compute_attention_kernel_fused_kernel(
                              output_ptr + (first_token_idx + qi) * hidden_size +
                              head_idx * per_head_size + vi),
                          out);
-      //  if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && qi == 1) {
-      //     printf("tree attn final value, %.9f, %.9f, %.9f, %.9f, %d, %d\n",
-      //            out.x, out.y, out.z, out.w, vi, (first_token_idx + qi) * hidden_size +
-      //                        head_idx * per_head_size + vi);
-      //   }                  
+      // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && qi == 1) {
+      //   printf("tree attn final value, %.9f, %.9f, %.9f, %.9f, %d, %d\n",
+      //          out.x,
+      //          out.y,
+      //          out.z,
+      //          out.w,
+      //          vi,
+      //          (first_token_idx + qi) * hidden_size + head_idx * per_head_size +
+      //              vi);
+      // }
     }
   }
 }
@@ -349,11 +359,12 @@ __global__ void commit_tokens_kernel(
     int num_tokens_to_commit,
     int num_active_tokens_in_last_batch,
     int max_seq_len,
-    int hidden_size) {
+    int hidden_size,
+    int max_tree_branches) {
 
-  CUDA_KERNEL_LOOP(i, num_tokens_to_commit * hidden_size * 2) {
+  CUDA_KERNEL_LOOP(i, num_tokens_to_commit * hidden_size) {
 
-    int token_pos = i / (hidden_size * KV_WEIGHT_NUM);
+    int token_pos = i / (hidden_size);
     int token_idx_in_last_batch = committedTokenInfos[token_pos].token_index;
     int offset = i % hidden_size;
     assert(token_idx_in_last_batch < num_active_tokens_in_last_batch);
@@ -367,10 +378,23 @@ __global__ void commit_tokens_kernel(
     int const req_id = committedTokenInfos[token_pos].request_index;
     int const tok_id = committedTokenInfos[token_pos].token_depth;
 
-    kCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
-               offset] = kVal;
-    vCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
-               offset] = vVal;
+    // if(i == 0){
+    //   printf("commit token: %d %d %f\n", token_idx_in_last_batch, tok_id,
+    //   kVal);
+    // }
+    // if(i == hidden_size){
+    //   printf("commit token 1: %d %d %f\n", token_idx_in_last_batch, tok_id,
+    //   kVal);
+    // }
+    // if(i == 2 * hidden_size){
+    //   printf("commit token 2: %d %d %f\n", token_idx_in_last_batch, tok_id,
+    //   kVal);
+    // }
+
+    kCache_ptr[req_id * max_tree_branches * (hidden_size * max_seq_len) +
+               tok_id * hidden_size + offset] = kVal;
+    vCache_ptr[req_id * max_tree_branches * (hidden_size * max_seq_len) +
+               tok_id * hidden_size + offset] = vVal;
   }
 }
 
@@ -395,7 +419,8 @@ void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
         num_tokens_to_commit,
         m->num_active_tokens, // number of active tokens in previous batch
         BatchConfig::max_sequence_length(),
-        m->hidden_size);
+        m->hidden_size,
+        BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES);
   }
 }
 
@@ -413,9 +438,9 @@ __global__ void update_tree_branch_kv_cache(
     int total_tokens_in_batch,
     int max_seq_len,
     int hidden_size) {
-  CUDA_KERNEL_LOOP(i, num_tokens_in_branch * hidden_size * 2) {
+  CUDA_KERNEL_LOOP(i, num_tokens_in_branch * hidden_size) {
 
-    int token_idx = i / (hidden_size * KV_WEIGHT_NUM);
+    int token_idx = i / (hidden_size);
     int offset = i % hidden_size;
 
     token_idx += processed_tokens_in_batch; // get index in the whole batch
@@ -460,6 +485,11 @@ __global__ void update_tree_branch_kv_cache_fused(
 
     int const req_id = tokenInfos[token_idx].request_index;
     int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
+
+    // if(i % hidden_size == 0){
+    //   printf("update token id: %d, %d\n", token_idx, token_idx +
+    //   first_token_depth);
+    // }
     kCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
                (token_idx + first_token_depth) * hidden_size + offset] = kVal;
     vCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
@@ -879,7 +909,8 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
   // Note that m->num_active_tokens stores the number of active
   // tokens in the previous batch, which is needed for committing
   // keys/values to the key-value cache
-  std::cout << "tokens to be committed: " << bc->num_tokens_to_commit << "\n";
+  // std::cout << "tokens to be committed: " << bc->num_tokens_to_commit <<
+  // "\n";
 
   cudaMemcpyAsync(m->committed_token_infos,
                   &(bc->committed_tokens),
@@ -925,6 +956,7 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
                      static_cast<DT *>(m->devQKVProjArray),
                      bias_ptr,
                      stream);
+  // print_tensor<float>((float *)m->devQKVProjArray, 32, "qkvtenor");
 
   // phase 2: No need to update key/val cache
   // IncMultiHeadSelfAttention::update_kv_cache_kernel(
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index e7b08f653d..d5c2b7392d 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -609,6 +609,8 @@ BeamSearchBatchConfig
         committed_tokens[guid].emplace_back(abs_depth, result_index);
       } else if (abs_depth >= root_abs_depth) {
         tree_outputs.emplace_back(token_id, abs_depth + 1);
+        std::cout << "committred tokens push: " << abs_depth
+                  << " ,result index: " << result_index << "\n";
         committed_tokens[guid].emplace_back(abs_depth, result_index);
 
         if (verbose) {
@@ -789,9 +791,9 @@ BeamSearchBatchConfig
           // Beam Token Info
           new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = 0;
           new_bc.num_tokens++;
-          std::cout << "num_gen ++ "
-                    << "\n";
-          num_generation_tokens++;
+          // std::cout << "num_gen ++ "
+          //           << "\n";
+          // num_generation_tokens++;
 
           // Add verified token to request's token list
           request.tokens.push_back(token.first);
@@ -923,9 +925,7 @@ BeamSearchBatchConfig
           new_bc.num_tokens++;
         }
         new_bc.topology_mask[i].allocated_tokens = 0;
-        new_bc.causalMask[i].non_tree_cache_size = 0;
-        new_bc.causalMask[i].tree_size =
-            new_bc.requestsInfo[i].num_tokens_in_batch;
+
         initBitMask(new_bc.causalMask[i],
                     new_bc.requestsInfo[i].num_tokens_in_batch);
 
@@ -1185,14 +1185,14 @@ BeamSearchBatchConfig
       // sub_request_num -> nodes of input next iteration
       //  beam_size replicate num
 
-      std::cout << "print beam tree: "
-                << old_bc.beamRequestsInfo[i].current_depth << "\n";
+      // std::cout << "print beam tree: "
+      //           << old_bc.beamRequestsInfo[i].current_depth << "\n";
       BeamTree tree = request.beam_trees[old_bc.model_id];
-      for (int k = 0; k <= old_bc.beamRequestsInfo[i].current_depth; k++) {
-        std::cout << "layer: " << k << "\n";
-        std::cout << "nodes: " << tree.treeLayers[k].nodes_num_this_layer
-                  << "\n";
-      }
+      // for (int k = 0; k <= old_bc.beamRequestsInfo[i].current_depth; k++) {
+      //   std::cout << "layer: " << k << "\n";
+      //   std::cout << "nodes: " << tree.treeLayers[k].nodes_num_this_layer
+      //             << "\n";
+      // }
       appendBitMask(new_bc.causalMask[i],
                     new_bc.beamRequestsInfo[i].sub_request_num,
                     old_bc.beamRequestsInfo[i].beam_size,
@@ -1217,9 +1217,10 @@ BeamSearchBatchConfig
           new_bc.topology_mask[i].real_token_pos[k][depth] =
               new_bc.topology_mask[i].allocated_tokens + num_generation_tokens;
 
-          std::cout << "topology: sub request: " << k << ", "
-                    << ", " << depth << ", "
-                    << new_bc.topology_mask[i].real_token_pos[k][depth] << "\n";
+          // std::cout << "topology: sub request: " << k << ", "
+          //           << ", " << depth << ", "
+          //           << new_bc.topology_mask[i].real_token_pos[k][depth] <<
+          //           "\n";
           num_generation_tokens++;
         }
       }
@@ -1354,13 +1355,13 @@ BeamSearchBatchConfig
   }
 
   if (true) {
-    std::cout << "print all resultsBBB"
-              << "\n";
-    for (int i = 0; i < 40; i++) {
-      std::cout << result.token_ids[i] << ", ";
-    }
-    std::cout << "Current Beam DepthBBB: "
-              << old_bc.beamRequestsInfo[0].current_depth << "\n";
+    // std::cout << "print all resultsBBB"
+    //           << "\n";
+    // for (int i = 0; i < 40; i++) {
+    //   std::cout << result.token_ids[i] << ", ";
+    // }
+    // std::cout << "Current Beam DepthBBB: "
+    //           << old_bc.beamRequestsInfo[0].current_depth << "\n";
   }
   return new_bc;
 }
@@ -1449,11 +1450,11 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
           merge_dfs_trees(all_dfs_trees, request.tokens.size() - 1, guid);
 
       if (true) {
-        std::cout << "Request Tokens Size: " << request.tokens.size()
-                  << std::endl;
-        for (int k = 0; k < request.tokens.size(); k++) {
-          std::cout << k << ": " << request.tokens[k] << std::endl;
-        }
+        // std::cout << "Request Tokens Size: " << request.tokens.size()
+        //           << std::endl;
+        // for (int k = 0; k < request.tokens.size(); k++) {
+        //   std::cout << k << ": " << request.tokens[k] << std::endl;
+        // }
       }
 
       // Normal Request Info
@@ -1475,27 +1476,42 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       new_bc.requestsInfo[i].num_tokens_in_batch = 0;
       new_bc.request_completed[i] = false;
 
+      std::cout << "dfs_tree_inputs: " << dfs_tree_inputs.size() << ", "
+                << new_bc.causalMask[i].tree_size << ", "
+                << new_bc.causalMask[i].non_tree_cache_size << "\n";
+      std::cout << "mask: " << std::bitset<64>(new_bc.causalMask[i].mask[0])
+                << "\n";
+      std::cout << "mask: " << std::bitset<64>(new_bc.causalMask[i].mask[1])
+                << "\n";
+      std::cout << "mask: " << std::bitset<64>(new_bc.causalMask[i].mask[2])
+                << "\n";
+      std::cout << "mask: " << std::bitset<64>(new_bc.causalMask[i].mask[3])
+                << "\n";
+      std::cout << "mask: " << std::bitset<64>(new_bc.causalMask[i].mask[4])
+                << "\n";
+
       // Committed Tokens
       if (committed_tokens.find(guid) != committed_tokens.end()) {
-        for (int j = 0; j < dfs_tree_inputs.size(); j++) {
-          if (j < committed_tokens.at(guid).size()) {
-            auto committed_token = committed_tokens.at(guid).at(j);
-            new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_index =
-                committed_token.second;
-            new_bc.committed_tokens[new_bc.num_tokens_to_commit].request_index =
-                i;
-            new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_depth =
-                committed_token.first;
-            if (true) {
-              std::cout << new_bc.num_tokens_to_commit
-                        << "- committed_token.token_depth: "
-                        << committed_token.first
-                        << ", token_index: " << committed_token.second
-                        << std::endl;
-            }
-            new_bc.num_tokens_to_commit++;
-            request.llm_cache_size++;
+        for (int j = 0; j < committed_tokens.at(guid).size(); j++) {
+          // if (j < committed_tokens.at(guid).size()) {
+
+          auto committed_token = committed_tokens.at(guid).at(j);
+          new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_index =
+              committed_token.second;
+          new_bc.committed_tokens[new_bc.num_tokens_to_commit].request_index =
+              i;
+          new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_depth =
+              committed_token.first;
+          if (true) {
+            std::cout << new_bc.num_tokens_to_commit
+                      << "- committed_token.token_depth: "
+                      << committed_token.first
+                      << ", token_index: " << committed_token.second
+                      << std::endl;
           }
+          new_bc.num_tokens_to_commit++;
+          request.llm_cache_size++;
+          // }
         }
       }
       if (true) {
@@ -1759,11 +1775,11 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
         request.beam_trees.at(old_bc.model_id)
             .treeLayers[depth]
             .parent_ids[beam_id] = result.parent_id[result_index];
-        std::cout << "??????? beam id: " << beam_id << ", token: "
-                  << request.beam_trees.at(old_bc.model_id)
-                         .treeLayers[depth]
-                         .tokens[beam_id]
-                  << "\n";
+        // std::cout << "??????? beam id: " << beam_id << ", token: "
+        //           << request.beam_trees.at(old_bc.model_id)
+        //                  .treeLayers[depth]
+        //                  .tokens[beam_id]
+        //           << "\n";
 
         // if (true) {
         //   std::cout << "tree value: " << depth << "token: "
@@ -1844,19 +1860,20 @@ void RequestManager::initBitMask(BatchConfig::BitMask &bitmask,
          "do not support tree size > 64");
   // eg. 4 tokens: t1: 0000000..1111, t2: 0000000..1110, t3: 0000000..1100, t4:
   // 0000000..1000
+  bitmask.non_tree_cache_size = 0;
+  bitmask.tree_size = initLength;
 
   bitmask.prompt_size = initLength;
   bitmask.this_layer_size = initLength;
-  bitmask.tree_size = initLength;
   for (int i = 0; i < bitmask.prompt_size; i++) {
     for (int j = i; j < bitmask.prompt_size; j++) {
       bitmask.mask[i] |= (1 << j);
     }
   }
-  std::cout << "see bit mask" << bitmask.prompt_size << "\n";
-  std::cout << "see bit mask" << std::bitset<64>(bitmask.mask[0]) << "\n";
-  std::cout << "see bit mask" << std::bitset<64>(bitmask.mask[1]) << "\n";
-  std::cout << "see bit mask" << std::bitset<64>(bitmask.mask[2]) << "\n";
+  // std::cout << "see bit mask" << bitmask.prompt_size << "\n";
+  // std::cout << "see bit mask" << std::bitset<64>(bitmask.mask[0]) << "\n";
+  // std::cout << "see bit mask" << std::bitset<64>(bitmask.mask[1]) << "\n";
+  // std::cout << "see bit mask" << std::bitset<64>(bitmask.mask[2]) << "\n";
 }
 
 // prepare next init
@@ -1868,11 +1885,16 @@ void RequestManager::updateBitMask(BatchConfig::BitMask &bitmask,
   // 0000000..1000
   assert(initLength <= BatchConfig::MAX_SPEC_TREE_TOKEN_NUM &&
          "do not support tree size > 64");
-  bitmask.non_tree_cache_size = non_tree_size;
-  bitmask.tree_size = initLength;
+  assert(initLength >= 1 && "verified token num should >= 1");
+
+  std::cout << "non tree size: " << non_tree_size << ", "
+            << bitmask.non_tree_cache_size << "\n";
+
+  bitmask.non_tree_cache_size = non_tree_size + initLength - 1;
+  bitmask.tree_size = 1;
   bitmask.this_layer_size = initLength;
   std::cout << "non_tree_size: " << non_tree_size << "\n";
-  bitmask.prompt_size = initLength;
+  bitmask.prompt_size = 1;
   for (int i = 0; i < bitmask.prompt_size; i++) {
     for (int j = i; j < bitmask.prompt_size; j++) {
       bitmask.mask[i] |= (1 << j);
@@ -1906,14 +1928,14 @@ void RequestManager::appendBitMask(BatchConfig::BitMask &bitmask,
   for (int i = 0; i < bitmask.prompt_size; i++) {
     for (int j = pre_tree_size; j < bitmask.tree_size; j++) {
       bitmask.mask[i] |= (1 << j);
-      std::cout << "see bit mask append: " << i << ", to" << j
-                << std::bitset<64>(bitmask.mask[i]) << "\n";
+      // std::cout << "see bit mask append: " << i << ", to" << j
+      //           << std::bitset<64>(bitmask.mask[i]) << "\n";
     }
   }
 
-  std::cout << "bitmask.tree_size: " << bitmask.tree_size << ", "
-            << pre_tree_size << ", " << bitmask.prompt_size << ", "
-            << preBeamSize << "\n";
+  // std::cout << "bitmask.tree_size: " << bitmask.tree_size << ", "
+  //           << pre_tree_size << ", " << bitmask.prompt_size << ", "
+  //           << preBeamSize << "\n";
 
   // int num_groups = newNodes / preBeamSize;
   // int group_size = newNodes / num_groups;
@@ -1924,12 +1946,12 @@ void RequestManager::appendBitMask(BatchConfig::BitMask &bitmask,
   //  skip the root prompt/tokens
   int token_idx = bitmask.prompt_size;
   int new_nodes_start_idx = pre_tree_size;
-  std::cout << "new nodes start " << new_nodes_start_idx << "\n";
+  // std::cout << "new nodes start " << new_nodes_start_idx << "\n";
   for (int i = 1; i < currentDepth; i++) {
     new_nodes_start_idx = pre_tree_size;
     int nodes_this_layer = tree.treeLayers[i].nodes_num_this_layer;
-    std::cout << "tree layer: " << i << " nodes:" << nodes_this_layer
-              << "group size: " << newNodes / nodes_this_layer << "\n";
+    // std::cout << "tree layer: " << i << " nodes:" << nodes_this_layer
+    //           << "group size: " << newNodes / nodes_this_layer << "\n";
     for (int j = 0; j < nodes_this_layer; j++) {
       int group_size = newNodes / nodes_this_layer;
       for (int k = 0; k < group_size; k++) {
@@ -1940,12 +1962,12 @@ void RequestManager::appendBitMask(BatchConfig::BitMask &bitmask,
     }
   }
 
-  std::cout << "token idx: " << token_idx << ", " << pre_tree_size << ", "
-            << new_nodes_start_idx << ", " << newNodes
-            << "current depth: " << currentDepth << "\n";
-  std::cout << "new nodes end " << new_nodes_start_idx << "\n";
+  // std::cout << "token idx: " << token_idx << ", " << pre_tree_size << ", "
+  //           << new_nodes_start_idx << ", " << newNodes
+  //           << "current depth: " << currentDepth << "\n";
+  // std::cout << "new nodes end " << new_nodes_start_idx << "\n";
 
-  std::cout << "tree size: " << bitmask.tree_size << "\n";
+  // std::cout << "tree size: " << bitmask.tree_size << "\n";
   assert(token_idx == pre_tree_size);
   assert(currentDepth <= 1 || new_nodes_start_idx == bitmask.tree_size);
 
@@ -1953,8 +1975,23 @@ void RequestManager::appendBitMask(BatchConfig::BitMask &bitmask,
   // set last layer, all tokens are only relevant to it self;
   for (int i = token_idx; i < bitmask.tree_size; i++) {
     bitmask.mask[i] |= (1 << i);
-    std::cout << "set rel: " << i << "to: " << i << "\n";
+    // std::cout << "set rel: " << i << "to: " << i << "\n";
   }
+
+  // if(bitmask.non_tree_cache_size == 19 && bitmask.tree_size > 2){
+  //   assert(false);
+  // }
+
+  std::cout << "see bit mask append" << bitmask.prompt_size << "\n";
+  std::cout << "see bit mask append" << bitmask.non_tree_cache_size << "\n";
+  std::cout << "see bit mask append" << std::bitset<64>(bitmask.mask[0])
+            << "\n";
+  std::cout << "see bit mask append" << std::bitset<64>(bitmask.mask[1])
+            << "\n";
+  std::cout << "see bit mask append" << std::bitset<64>(bitmask.mask[2])
+            << "\n";
+  std::cout << "see bit mask append" << std::bitset<64>(bitmask.mask[3])
+            << "\n";
 }
 
 bool PreOrder(
@@ -2146,16 +2183,16 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
   //           << std::endl;
   BeamTree tree = request.beam_trees.at(old_bc.model_id);
 
-  std::cout << "print beam tree: "
-            << "\n";
+  // std::cout << "print beam tree: "
+  //           << "\n";
   std::vector<std::pair<BatchConfig::TokenId, int>> serializedTree;
   for (int i = 0; i <= old_bc.beamRequestsInfo[request_index].max_depth; i++) {
-    std::cout << "tree layer: " << i
-              << ", num_nodes: " << tree.treeLayers[i].nodes_num_this_layer
-              << "\n";
+    // std::cout << "tree layer: " << i
+    //           << ", num_nodes: " << tree.treeLayers[i].nodes_num_this_layer
+    //           << "\n";
     // push tokens into tree
     for (int j = 0; j < tree.treeLayers[i].nodes_num_this_layer; j++) {
-      std::cout << "token: " << tree.treeLayers[i].tokens[j] << "\n";
+      // std::cout << "token: " << tree.treeLayers[i].tokens[j] << "\n";
       serializedTree.push_back(std::make_pair(tree.treeLayers[i].tokens[j], i));
     }
   }
@@ -2256,7 +2293,8 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
   }
 
   dfs_tree_inputs[guid] = merged_tree;
-  // std::cout << "assign dfr tree: " << guid << ", " << merged_tree.size() << ", "
+  // std::cout << "assign dfr tree: " << guid << ", " << merged_tree.size() <<
+  // ", "
   //           << dfs_tree_inputs[guid].size() << "\n";
 
   return merged_tree;

From 3ed25d681127d742770776b8d07d9771e0e19f79 Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Fri, 29 Dec 2023 16:10:16 -0500
Subject: [PATCH 277/344] multi batch

---
 src/ops/beam_topk.cc                          |  3 +-
 src/ops/beam_topk.cu                          |  3 +-
 .../specinfer_inc_multihead_self_attention.cu | 66 +++++++------------
 .../tree attn kernel, 0----> -0.029753357172  |  1 +
 src/ops/tree_inc_multihead_self_attention.cu  | 45 +++++++++----
 src/runtime/request_manager.cc                | 37 ++++++++---
 6 files changed, 89 insertions(+), 66 deletions(-)
 create mode 100644 src/ops/tree attn kernel, 0----> -0.029753357172

diff --git a/src/ops/beam_topk.cc b/src/ops/beam_topk.cc
index 3f636c2c98..20d019eec3 100644
--- a/src/ops/beam_topk.cc
+++ b/src/ops/beam_topk.cc
@@ -402,8 +402,7 @@ BeamInferenceResult
   download_tensor<int>(
       parent_ptr, ir.parent_id, batch_size * m->max_beam_width);
 
-  print_tensor<int>(index_ptr, 32, "indexxxxxxx");
-  printf("max beam width %d\n", m->max_beam_width);
+  // print_tensor<int>(index_ptr, 32, "indexxxxxxx");
 
   if (m->inference_debugging) {
     assert(task->index_point.get_dim() == 1);
diff --git a/src/ops/beam_topk.cu b/src/ops/beam_topk.cu
index 515bba4bc0..d647fe9ed7 100644
--- a/src/ops/beam_topk.cu
+++ b/src/ops/beam_topk.cu
@@ -626,7 +626,7 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
                             stream));
   // trick, set acc_probs to 0;
   checkCUDA(
-      cudaMemsetAsync(m->acc_probs, 1.0, batch_size * sizeof(DT), stream));
+      cudaMemsetAsync(m->acc_probs, 1.0, max_total_requests * sizeof(DT), stream));
   checkCUDA(cudaMemcpyAsync(m->block_start_index,
                             beam_block_start_index.data(),
                             sizeof(int) * beam_num_blocks,
@@ -644,6 +644,7 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
                        stream));
   // int depth =
   //     bc->beamRequestsInfo[bc->tokensInfo[0].request_index].current_depth;
+  beam_num_blocks = bc->num_active_tokens();
   beam_topk_forward_kernel<<<beam_num_blocks, num_shards, 0, stream>>>(
       input_ptr,
       shared_memory_size,
diff --git a/src/ops/specinfer_inc_multihead_self_attention.cu b/src/ops/specinfer_inc_multihead_self_attention.cu
index f2ea63d904..3fdd1ab554 100644
--- a/src/ops/specinfer_inc_multihead_self_attention.cu
+++ b/src/ops/specinfer_inc_multihead_self_attention.cu
@@ -100,6 +100,10 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
     first_token_idx += bitmask.this_layer_size;
   }
 
+  // if (tidx == 0 && head_idx == 0) {
+  //   printf("spec req: %d, %d\n", request_idx, first_token_idx);
+  // }
+
   // shared memory objects
   extern __shared__ char smem_[];
 
@@ -135,17 +139,16 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
   int ti_end =
       div_up(totalCacheSize - first_step, K_PER_WARP) * K_PER_WARP + first_step;
 
-  for (int sub_req_idx = 0; sub_req_idx < tree_branch_num; sub_req_idx += 1) {
+  for (int qi = 0; qi < tree_branch_num; qi += 1) {
 #pragma unroll
     for (int ii = 0; ii < K_VECS_PER_THREAD; ++ii) {
       q_vecs[ki_o][ii] = *reinterpret_cast<Q_vec const *>(
-          q_ptr + (hidden_size * QKV_WEIGHT_NUM * sub_req_idx) + ki +
+          q_ptr + (hidden_size * QKV_WEIGHT_NUM * qi) + ki +
           ii * THREADS_PER_KEY * K_VEC_SIZE);
     }
 
-    int const query_token = bitmask.tree_size - tree_branch_num + sub_req_idx;
-
-    if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && sub_req_idx == 0) {
+    int const query_token = bitmask.tree_size - tree_branch_num + qi;
+    if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && qi == 0) {
       // printf("fuckmasksss %d, %d, %d, %d, %d\n",
       //        bitmask.prompt_size,
       //        bitmask.non_tree_cache_size,
@@ -345,11 +348,10 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
 
     // Output the final values.
     if (vo == 0 && (Dh == Dh_MAX || vi < Dh)) {
-      convert_from_float(
-          *reinterpret_cast<V_vec *>(output_ptr +
-                                     (request_idx + sub_req_idx) * hidden_size +
-                                     head_idx * per_head_size + vi),
-          out);
+      convert_from_float(*reinterpret_cast<V_vec *>(
+                             output_ptr + (first_token_idx + qi) * hidden_size +
+                             head_idx * per_head_size + vi),
+                         out);
     }
   }
 }
@@ -391,6 +393,9 @@ __global__ void specinfer_store_kv_cache(
     int const allocated_tokens = beam_topology_mask[req_id].allocated_tokens;
     int const total_token = requestInfo[req_id].num_tokens_in_batch;
 
+    int const request_token_offset =
+        requestInfo[req_id].first_token_offset_in_batch;
+
     BatchConfig::BitMask bitmask = causalMask[req_id];
 
     int const sub_request_num = beamRequestInfos[req_id].sub_request_num;
@@ -404,42 +409,18 @@ __global__ void specinfer_store_kv_cache(
     // if prompt token -> token id
     // if tree token:
     int const cache_idx = bitmask.non_tree_cache_size + bitmask.tree_size -
-                          bitmask.this_layer_size + token_idx;
+                          bitmask.this_layer_size + token_idx -
+                          request_token_offset;
 
     int real_idx = tok_id - first_token_in_req + allocated_tokens + sub_req_id;
 
-    // if (i == 0) {
-    //   printf("ffasdasds%d, %d, %d, %d, %d, %d, %d, %d, %d, %d, %d\n",
-    //          beamTokenInfos[0].sub_request_index,
-    //          allocated_tokens,
-    //          sub_req_id,
-    //          tok_id,
-    //          first_token_in_req,
+    // if (i % hidden_size == 0) {
+    //   printf("ffasdasds request %d, real idx %d, cache idx %d  token id %d, kval %.10f\n",
+    //          req_id,
     //          real_idx,
     //          cache_idx,
-    //          bitmask.non_tree_cache_size,
-    //          bitmask.tree_size,
-    //          sub_request_num,
-    //         token_idx );
-    // } else if (i == hidden_size * 2) {
-    //   printf("hshddhdhdsdaww%d, %d, %d, %d, %d, %d, %d\n",
-    //          beamTokenInfos[0].sub_request_index,
-    //          allocated_tokens,
-    //          sub_req_id,
     //          tok_id,
-    //          first_token_in_req,
-    //          real_idx,
-    //          cache_idx);
-    // }
-
-    // if (i % hidden_size == 0) {
-    //   printf("update cache: %d, %d, %d, %d, %d, %d\n",
-    //          cache_idx,
-    //          num_tokens,
-    //          bitmask.non_tree_cache_size,
-    //          bitmask.tree_size,
-    //          bitmask.this_layer_size,
-    //          token_idx);
+    //          kVal);
     // }
 
     kCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
@@ -846,6 +827,8 @@ void inference_kernel(SpecInferIncMultiHeadSelfAttentionMeta const *m,
   // compute output production and bias together for all tokens
   int num_tokens = bc->num_active_tokens();
 
+  // std::cout << "specinfer num tokens: " << num_tokens;
+
   compute_o_prod_bias(
       m, bc, shard_id, output_ptr, weight_ptr, bias_ptr, num_tokens, stream);
 }
@@ -920,7 +903,8 @@ void SpecInferIncMultiHeadSelfAttention::inference_kernel_wrapper(
     // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
     // acc_output.rect, "[Attention:forward:output]");
   }
-  // print_tensor<float>(output.get_float_ptr(), 32, "specinc output");
+  // save_tensor<float>(output.get_float_ptr(), 768 * 3, "/home/xinhaoc/FlexFlow/inference/output/fk1.txt");
+  // save_tensor<float>(output.get_float_ptr() + 768 * 3, 768 * 3, "/home/xinhaoc/FlexFlow/inference/output/fk2.txt");
 
   // if(bc->num_tokens == 1){
   //   print_tensor<float>(input.get_float_ptr(), 32, "specinc input");
diff --git a/src/ops/tree attn kernel, 0----> -0.029753357172 b/src/ops/tree attn kernel, 0----> -0.029753357172
new file mode 100644
index 0000000000..e4f14ee757
--- /dev/null
+++ b/src/ops/tree attn kernel, 0----> -0.029753357172	
@@ -0,0 +1 @@
+tree attn kernel, 0----> -0.02975335717201232910 0.01930358447134494781 0.03780741989612579346 0.11878532171249389648 -0.03523746877908706665 0.02421043440699577332 0.03719477355480194092 -0.00304851122200489044 0.02062662504613399506 0.06683708727359771729 -0.00642335414886474609 -0.00504039414227008820 0.02955199964344501495 0.00648811273276805878 0.00558663159608840942 0.02003456838428974152 -0.04041406139731407166 0.00736814411357045174 -0.04575226455926895142 0.03949077427387237549 0.05742383748292922974 0.04866250604391098022 0.04687267541885375977 -0.00701304525136947632 -0.03712264448404312134 -0.02175992354750633240 -0.03979443758726119995 0.03961737453937530518 -0.07450901716947555542 0.02090370282530784607 -0.03487894684076309204 0.01653470844030380249
\ No newline at end of file
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index 180a165451..11169fa36d 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -99,6 +99,10 @@ __global__ void compute_attention_kernel_fused_kernel(
     first_token_idx += request_infos[request_idx].num_tokens_in_batch;
   }
 
+  // if(tidx == 0 && head_idx == 0){
+  //   printf("tree req: %d, %d\n", request_idx, first_token_idx);
+  // }
+
   // shared memory objects
   extern __shared__ char smem_[];
 
@@ -140,6 +144,12 @@ __global__ void compute_attention_kernel_fused_kernel(
       q_vecs[ki_o][ii] = *reinterpret_cast<Q_vec const *>(
           q_ptr + (hidden_size * QKV_WEIGHT_NUM * qi) + ki +
           ii * THREADS_PER_KEY * K_VEC_SIZE);
+
+      // if (head_idx == 0 && qi == 1 && tidx == 0) {
+      //     printf("laod q %d,  %d %.10f\n",
+      //     request_idx,
+      //            qi,q_vecs[ki_o][ii].x);
+      //   }
     }
 
     __syncthreads();
@@ -162,11 +172,12 @@ __global__ void compute_attention_kernel_fused_kernel(
             (ti >= bitmask.non_tree_cache_size &&
              (!(bitmask.mask[ti - bitmask.non_tree_cache_size] & (1 << qi))));
 
-        // if (blockIdx.y == 0 && blockIdx.x == 0 && qi == 0 && mask) {
-        //   printf("tree attn mask for first token %d, %lld, %d, %d\n",
+        // if (head_idx == 0 && qi == 9 && mask) {
+        //   printf("tree attn mask for first token %d, %lld, %d, %d, %d\n",
         //          ti,
         //          bitmask.mask[ti - bitmask.non_tree_cache_size],
         //          bitmask.non_tree_cache_size,
+        //         request_idx,
         //          qi);
         // }
         // if (blockIdx.y == 0 && blockIdx.x == 0 && qi == 3 && mask) {
@@ -179,11 +190,15 @@ __global__ void compute_attention_kernel_fused_kernel(
 
         qk_max = mask ? qk_max : fmaxf(qk_max, qk);
 
-        // if (blockIdx.y == 0 && blockIdx.x == 0 && qi == 1 && !mask) {
-        //   printf("tree attn qkqkqkqk %d %.10f, %.10f, %.10f\n",
+        // if (head_idx == 0 && qi == 1 && !mask && tidx == 0) {
+        //   printf("tree attn qkqkqkqk request id %d,  %d %.10f, %.10f, %.10f\n",
+        //   request_idx,
         //          ti,
         //          qk,
         //          q_vecs[ki_o][0].x,
+        //          q_vecs[ki_o][1].x,
+        //          q_vecs[ki_o][2].x,
+        //          q_vecs[ki_o][3].x,
         //          k[0].x);
         // }
         qk_smem[ti - first_step] = mask ? 0.0f : qk;
@@ -219,7 +234,7 @@ __global__ void compute_attention_kernel_fused_kernel(
     // Broadcast to all the threads in the warp.
     qk_max = __shfl_sync(uint32_t(-1), qk_max, 0);
 
-    // if (blockIdx.y == 0 && blockIdx.x == 0 && qi == 1 && tidx == 0) {
+    // if (head_idx == 0 && qi == 9 && tidx == 0) {
     //   printf("tree attn first token qk_max %f\n", qk_max);
     // }
 
@@ -236,7 +251,7 @@ __global__ void compute_attention_kernel_fused_kernel(
     // Compute the sum.
     exp_sum = block_sum<WARPS_PER_BLOCK>(&red_smem[WARPS_PER_BLOCK], exp_sum);
 
-    // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && qi == 1) {
+    // if (head_idx == 0 && tidx == 0 && qi == 9) {
     //   printf("expsum %.10f\n", exp_sum);
     // }
 
@@ -247,7 +262,7 @@ __global__ void compute_attention_kernel_fused_kernel(
     }
 
     __syncthreads();
-    // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && qi == 1) {
+    // if (head_idx == 0 && tidx == 0 && qi == 9) {
     //   printf("softmax %.10f\n", qk_smem[1]);
     // }
 
@@ -465,6 +480,7 @@ __global__ void update_tree_branch_kv_cache_fused(
     DT *kCache_ptr,
     DT *vCache_ptr,
     TreeVerifyBatchConfig::PerTokenInfo const *tokenInfos,
+    BatchConfig::PerRequestInfo *request_infos,
     int qProjSize,
     int kProjSize,
     int vProjSize,
@@ -486,14 +502,15 @@ __global__ void update_tree_branch_kv_cache_fused(
     int const req_id = tokenInfos[token_idx].request_index;
     int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
 
+    int const request_token_offset = request_infos[req_id].first_token_offset_in_batch;
+
     // if(i % hidden_size == 0){
-    //   printf("update token id: %d, %d\n", token_idx, token_idx +
-    //   first_token_depth);
+    //   printf("update token request id: %d, %d, %d  value%.10f\n", req_id, token_idx, request_token_offset, kVal);
     // }
     kCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
-               (token_idx + first_token_depth) * hidden_size + offset] = kVal;
+               (token_idx + first_token_depth - request_token_offset) * hidden_size + offset] = kVal;
     vCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
-               (token_idx + first_token_depth) * hidden_size + offset] = vVal;
+               (token_idx + first_token_depth - request_token_offset) * hidden_size + offset] = vVal;
   }
 }
 
@@ -851,6 +868,7 @@ void compute_attention_kernel_fused(TreeIncMultiHeadSelfAttentionMeta const *m,
       static_cast<DT *>(m->keyCache),
       static_cast<DT *>(m->valueCache),
       m->token_infos,
+      m->request_infos,
       m->qProjSize,
       m->kProjSize,
       m->vProjSize,
@@ -956,7 +974,8 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
                      static_cast<DT *>(m->devQKVProjArray),
                      bias_ptr,
                      stream);
-  // print_tensor<float>((float *)m->devQKVProjArray, 32, "qkvtenor");
+  // print_tensor<float>((float *)m->devQKVProjArray + 768 * 8 * 3 + 768, 32, "qkvtenor1");                   
+  // print_tensor<float>((float *)m->devQKVProjArray + 768 * 18 * 3 + 768, 32, "qkvtenor2");
 
   // phase 2: No need to update key/val cache
   // IncMultiHeadSelfAttention::update_kv_cache_kernel(
@@ -1000,6 +1019,8 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
     cudaEventRecord(t_start, stream);
   }
 
+  std::cout << "tree input tokens: " <<bc->num_active_tokens() << "\n";
+
   // assert(input.data_type == weight.data_type);
   assert(input.data_type == output.data_type);
   if (use_bias) {
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index d5c2b7392d..ab062a4610 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -634,6 +634,7 @@ BeamSearchBatchConfig
     if (request.status == Request::RUNNING) {
       std::cout << "verify running: " << dfs_tree_inputs.at(guid).size() << ", "
                 << tree_outputs.size() << "\n";
+      
       std::vector<std::pair<BatchConfig::TokenId, int>> verified_tokens =
           traverse_verify_tree(guid, dfs_tree_inputs.at(guid), tree_outputs);
 
@@ -812,6 +813,7 @@ BeamSearchBatchConfig
         }
         log_req_mgr.print("Output: %s", output.c_str());
       }
+ 
     } else if (request.status == Request::PENDING) {
       new_bc.request_completed[i] = false;
       new_bc.request_running[i] = false;
@@ -1185,8 +1187,8 @@ BeamSearchBatchConfig
       // sub_request_num -> nodes of input next iteration
       //  beam_size replicate num
 
-      // std::cout << "print beam tree: "
-      //           << old_bc.beamRequestsInfo[i].current_depth << "\n";
+      std::cout << "print beam tree: "
+                << old_bc.beamRequestsInfo[i].current_depth << "\n";
       BeamTree tree = request.beam_trees[old_bc.model_id];
       // for (int k = 0; k <= old_bc.beamRequestsInfo[i].current_depth; k++) {
       //   std::cout << "layer: " << k << "\n";
@@ -1224,6 +1226,12 @@ BeamSearchBatchConfig
           num_generation_tokens++;
         }
       }
+      // if(new_bc.beamRequestsInfo[i].current_depth >= 3 && i > 0){
+      //   assert(false);
+      // }
+      
+
+      
     }
   }
 
@@ -1709,6 +1717,8 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
         old_bc.requestsInfo[old_bc.tokensInfo[i].request_index].request_guid !=
             guid) {
 
+      std::cout << "i is: " << i << "old guid" << guid << " new guid" << old_bc.requestsInfo[old_bc.tokensInfo[i].request_index].request_guid  <<"\n";
+
       int index = old_bc.tokensInfo[i - 1].request_index;
       int beam_size = old_bc.beamRequestsInfo[index].beam_size;
 
@@ -1722,16 +1732,21 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
 
       // Count tokens sent to model in this request to find the final token's
       // index
+
+      std::cout << "previous result index: "<<  result_index;
+
       result_index +=
           (old_bc.tokensInfo[i - 1].abs_depth_in_request - start_depth) *
           beam_size;
-
-      if (true) {
-        std::cout << "i = " << i << ", result index = " << result_index
-                  << ", value: " << result.token_ids[result_index]
-                  << ", leaf node num: " << leaf_node_num << ", depth" << depth
-                  << ", beam size: " << beam_size << "\n";
-      }
+      
+      std::cout << "after result index: "<<  result_index;
+
+      // if (true) {
+      //   std::cout << "i = " << i << ", result index = " << result_index
+      //             << ", value: " << result.token_ids[result_index]
+      //             << ", leaf node num: " << leaf_node_num << ", depth" << depth
+      //             << ", beam size: " << beam_size << "\n";
+      // }
 
       Request &request = all_requests[old_bc.requestsInfo[index].request_guid];
 
@@ -1792,7 +1807,9 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
       }
       // update the guid and start_depth for current request
       if (i < old_bc.num_tokens) {
-        guid = old_bc.requestsInfo[index].request_guid;
+        int new_req_idx = old_bc.tokensInfo[i].request_index;
+        guid = old_bc.requestsInfo[new_req_idx].request_guid;
+        std::cout << "update guid: " << guid  << ", request idx: " << index<< "\n";
         start_depth = old_bc.tokensInfo[i].abs_depth_in_request;
       }
     }

From 5c3ad3592f7b71dc705466fa24cb7c7c1e179deb Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Fri, 29 Dec 2023 17:37:28 -0500
Subject: [PATCH 278/344] copy metadata once

---
 include/flexflow/batch_config.h               |  6 --
 include/flexflow/config.h                     |  4 +-
 .../specinfer_inc_multihead_self_attention.h  |  1 -
 src/ops/inc_multihead_self_attention.cu       | 13 ---
 .../specinfer_inc_multihead_self_attention.cu | 94 ++++---------------
 src/ops/tree_inc_multihead_self_attention.cu  | 65 ++++++-------
 src/runtime/request_manager.cc                | 46 +--------
 src/runtime/request_manager.cu                | 74 ++++++++-------
 8 files changed, 89 insertions(+), 214 deletions(-)

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index db5d4a8e48..c3a75e59a4 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -168,14 +168,8 @@ class BeamSearchBatchConfig : public BatchConfig {
     int sub_request_index;
   };
 
-  struct SpecInferTopology {
-    int real_token_pos[MAX_SPECULATIVE_TREE_BRANCHES][MAX_NUM_TOKENS];
-    int allocated_tokens;
-  };
-
   BeamSearchPerRequestInfo beamRequestsInfo[MAX_NUM_REQUESTS];
   BeamSearchPerTokenInfo beamTokenInfo[MAX_NUM_TOKENS * MAX_BEAM_WIDTH];
-  SpecInferTopology topology_mask[MAX_NUM_REQUESTS];
 
   // why is this == MAX_NUM_REQUESTS * MAX_BEAM_WIDTH?
   int sub_requests[MAX_NUM_REQUESTS * MAX_BEAM_WIDTH];
diff --git a/include/flexflow/config.h b/include/flexflow/config.h
index fe261dfb48..1526b9291f 100644
--- a/include/flexflow/config.h
+++ b/include/flexflow/config.h
@@ -81,10 +81,10 @@ struct FFHandler {
   // request info + token info + topolopgy mask info
   size_t batch_config_metadata_size =
       sizeof(BatchConfig::tokensInfo) + sizeof(BatchConfig::requestsInfo) +
-      sizeof(BeamSearchBatchConfig::topology_mask) +
       sizeof(BeamSearchBatchConfig::beamTokenInfo) +
       sizeof(BeamSearchBatchConfig::beamRequestsInfo) +
-      sizeof(BatchConfig::causalMask);
+      sizeof(BatchConfig::causalMask) +
+      sizeof(TreeVerifyBatchConfig::committed_tokens);
   void *offload_reserve_space;
   size_t offload_reserve_space_size;
   DataType quantization_type;
diff --git a/include/flexflow/ops/specinfer_inc_multihead_self_attention.h b/include/flexflow/ops/specinfer_inc_multihead_self_attention.h
index eb1b2882c3..b6fed1ae25 100644
--- a/include/flexflow/ops/specinfer_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/specinfer_inc_multihead_self_attention.h
@@ -142,7 +142,6 @@ class SpecInferIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionM
   Realm::RegionInstance beam_search_reserve_inst;
   BeamSearchBatchConfig::BeamSearchPerTokenInfo *beam_token_infos;
   BeamSearchBatchConfig::BeamSearchPerRequestInfo *beam_request_infos;
-  BeamSearchBatchConfig::SpecInferTopology *beam_topology_mask;
   BatchConfig::BitMask *causalMask;
 };
 
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index a05dbbf919..a084f216e9 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -825,19 +825,6 @@ void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
     bias_ptr = static_cast<DT *>(m->bias_ptr);
   }
 
-  // todo Xinhao copy how many requests if requests are not continous?
-  // cudaMemcpyAsync(m->token_infos,
-  //                 &(bc->tokensInfo),
-  //                 bc->num_active_tokens() *
-  //                 sizeof(BatchConfig::PerTokenInfo), cudaMemcpyHostToDevice,
-  //                 stream);
-  // cudaMemcpyAsync(m->request_infos,
-  //                 &(bc->requestsInfo),
-  //                 bc->max_requests_per_batch() *
-  //                     sizeof(BatchConfig::PerRequestInfo),
-  //                 cudaMemcpyHostToDevice,
-  //                 stream);
-
   // phase 1: Implement kernel to compute KQV for input tokens
   compute_qkv_kernel(m,
                      bc,
diff --git a/src/ops/specinfer_inc_multihead_self_attention.cu b/src/ops/specinfer_inc_multihead_self_attention.cu
index 3fdd1ab554..4d4afd28e4 100644
--- a/src/ops/specinfer_inc_multihead_self_attention.cu
+++ b/src/ops/specinfer_inc_multihead_self_attention.cu
@@ -50,7 +50,6 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
     int hidden_size,
     BatchConfig::PerRequestInfo *request_infos,
     BeamSearchBatchConfig::BeamSearchPerRequestInfo *beam_request_infos,
-    BeamSearchBatchConfig::SpecInferTopology *topology_mask,
     BatchConfig::BitMask *causalMask,
     int max_tree_branches) {
 
@@ -74,8 +73,6 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
   // request idx
   int const request_idx = blockIdx.y;
 
-  BeamSearchBatchConfig::SpecInferTopology topology =
-      topology_mask[request_idx];
   BatchConfig::BitMask bitmask = causalMask[request_idx];
 
   int const first_step = 0;
@@ -148,23 +145,7 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
     }
 
     int const query_token = bitmask.tree_size - tree_branch_num + qi;
-    if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && qi == 0) {
-      // printf("fuckmasksss %d, %d, %d, %d, %d\n",
-      //        bitmask.prompt_size,
-      //        bitmask.non_tree_cache_size,
-      //        tree_branch_num,
-      //        bitmask.tree_size,
-      //        tlength);
-      //  printf("cacheposssssB %d, %d\n", tree_branch_num,
-      //  topology.real_token_pos[0][1]);
-      //   printf("cacheposssssC %d, %d\n", tree_branch_num,
-      //   topology.real_token_pos[0][2]);
-      //    printf("cacheposssssD %d, %d\n", tree_branch_num,
-      //    topology.real_token_pos[0][11]); printf("cacheposssssD %d, %d\n",
-      //    tree_branch_num, topology.real_token_pos[0][12]);
-      //    printf("cacheposssssD %d, %d\n", tree_branch_num,
-      //    topology.real_token_pos[0][13]);
-    }
+
     __syncthreads();
     for (int ti = ko; ti < ti_end; ti += K_PER_ITER) {
       K_vec k[K_VECS_PER_THREAD];
@@ -173,10 +154,7 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
       for (int ii = 0; ii < K_VECS_PER_THREAD; ++ii) {
         int jj = ii * THREADS_PER_KEY * K_VEC_SIZE;
         if (ti < totalCacheSize) {
-          // find the real position of the cache;
-          // depth: 0, 1, 2, 3, 4, 4, 5, 5 ,5, 5,
-          // int const real_cache_idx =
-          // topology.real_token_pos[sub_req_idx][ti];
+
           k[ii] = *reinterpret_cast<K_vec const *>(
               k_cache_batch + ti_circ * hidden_size + head_idx * per_head_size +
               jj);
@@ -291,17 +269,12 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
     DT const *v_cache_batch =
         value_cache +
         request_idx * max_seq_length * hidden_size * max_tree_branches + vi;
-    // DT const *v_cache_batch =
-    //     value_cache +
-    //     (beam_request_idx * max_beam_width + beam_sub_request_idx) *
-    //         max_seq_length * hidden_size +
-    //     vi;
+
 
     if (Dh == Dh_MAX || vi < Dh) {
       for (int ti = first_step + vo; ti < totalCacheSize; ti += V_PER_ITER) {
         // Load the values from the cache.
         int const ti_circ = ti % max_seq_length;
-        // int const real_cache_idx = topology.real_token_pos[sub_req_idx][ti];
         V_vec v = *reinterpret_cast<V_vec const *>(
             v_cache_batch + ti_circ * hidden_size + head_idx * per_head_size);
 
@@ -365,7 +338,6 @@ __global__ void specinfer_store_kv_cache(
     BatchConfig::PerRequestInfo *requestInfo,
     BeamSearchBatchConfig::BeamSearchPerTokenInfo *beamTokenInfos,
     BeamSearchBatchConfig::BeamSearchPerRequestInfo *beamRequestInfos,
-    BeamSearchBatchConfig::SpecInferTopology *beam_topology_mask,
     BatchConfig::BitMask *causalMask,
     int qProjSize,
     int kProjSize,
@@ -390,7 +362,6 @@ __global__ void specinfer_store_kv_cache(
     int const first_token_in_req =
         requestInfo[req_id].first_token_depth_in_request;
     int const sub_req_id = beamTokenInfos[token_idx].sub_request_index;
-    int const allocated_tokens = beam_topology_mask[req_id].allocated_tokens;
     int const total_token = requestInfo[req_id].num_tokens_in_batch;
 
     int const request_token_offset =
@@ -412,17 +383,6 @@ __global__ void specinfer_store_kv_cache(
                           bitmask.this_layer_size + token_idx -
                           request_token_offset;
 
-    int real_idx = tok_id - first_token_in_req + allocated_tokens + sub_req_id;
-
-    // if (i % hidden_size == 0) {
-    //   printf("ffasdasds request %d, real idx %d, cache idx %d  token id %d, kval %.10f\n",
-    //          req_id,
-    //          real_idx,
-    //          cache_idx,
-    //          tok_id,
-    //          kVal);
-    // }
-
     kCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
                (cache_idx)*hidden_size + offset] = kVal;
     vCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
@@ -454,7 +414,6 @@ void update_kv_cache_kernel(SpecInferIncMultiHeadSelfAttentionMeta const *m,
         m->request_infos,
         m->beam_token_infos,
         m->beam_request_infos,
-        m->beam_topology_mask,
         m->causalMask,
         m->qProjSize,
         m->kProjSize,
@@ -490,7 +449,6 @@ void update_kv_cache_kernel(SpecInferIncMultiHeadSelfAttentionMeta const *m,
           m->hidden_size,                                                      \
           m->request_infos,                                                    \
           m->beam_request_infos,                                               \
-          m->beam_topology_mask,                                               \
           m->causalMask,                                                       \
           BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES)
 
@@ -788,16 +746,6 @@ void inference_kernel(SpecInferIncMultiHeadSelfAttentionMeta const *m,
                       cudaStream_t stream) {
   // phase 1: Implement kernel to compute KQV for input tokens
 
-  cudaMemcpyAsync(m->causalMask,
-                  &(bc->causalMask),
-                  bc->num_active_requests() * sizeof(BatchConfig::BitMask),
-                  cudaMemcpyHostToDevice,
-                  stream);
-  // std::cout << "kernel bit mask: " << bc->causalMask[0].prompt_size << ", "
-  //           << bc->causalMask[0].non_tree_cache_size << ", "
-  //           << bc->causalMask[0].mask[0] << ", " <<
-  //           sizeof(BatchConfig::BitMask)
-  //           << "\n";
   compute_qkv_kernel(m,
                      bc,
                      shard_id,
@@ -953,38 +901,30 @@ SpecInferIncMultiHeadSelfAttentionMeta::SpecInferIncMultiHeadSelfAttentionMeta(
 
   // allocate memory for the seqArray and reserve space
   {
-    size_t causal_mask_size = BatchConfig::MAX_NUM_REQUESTS;
-    size_t total_size = causal_mask_size * sizeof(BatchConfig::BitMask);
-    gpu_mem_allocator.create_legion_instance(beam_search_reserve_inst,
-                                             total_size);
+    // size_t causal_mask_size = BatchConfig::MAX_NUM_REQUESTS;
+    // size_t total_size = causal_mask_size * sizeof(BatchConfig::BitMask);
+    // gpu_mem_allocator.create_legion_instance(beam_search_reserve_inst,
+    //                                          total_size);
 
-    beam_topology_mask =
-        static_cast<BeamSearchBatchConfig::SpecInferTopology *>(
-            handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
-            sizeof(BatchConfig::requestsInfo));
 
     beam_token_infos =
         static_cast<BeamSearchBatchConfig::BeamSearchPerTokenInfo *>(
             handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
-            sizeof(BatchConfig::requestsInfo) +
-            sizeof(BeamSearchBatchConfig::topology_mask));
+            sizeof(BatchConfig::requestsInfo));
 
     beam_request_infos =
         static_cast<BeamSearchBatchConfig::BeamSearchPerRequestInfo *>(
             handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
-            sizeof(BatchConfig::requestsInfo) +
-            sizeof(BeamSearchBatchConfig::topology_mask) +
+            sizeof(BatchConfig::requestsInfo)  +
             sizeof(BeamSearchBatchConfig::beamTokenInfo));
-    // causalMask =
-    //     static_cast<BatchConfig::BitMask *>(
-    //         handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
-    //         sizeof(BatchConfig::requestsInfo) +
-    //         sizeof(BeamSearchBatchConfig::topology_mask) +
-    //         sizeof(BeamSearchBatchConfig::beamTokenInfo)) +
-    //     sizeof(BeamSearchBatchConfig::beamRequestsInfo);
-
-    causalMask = gpu_mem_allocator.allocate_instance<BatchConfig::BitMask>(
-        causal_mask_size);
+    causalMask =  static_cast<BatchConfig::BitMask *>(
+            handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
+            sizeof(BatchConfig::requestsInfo)  +
+            sizeof(BeamSearchBatchConfig::beamTokenInfo)
+            + sizeof(BeamSearchBatchConfig::beamRequestsInfo));      
+
+    // causalMask = gpu_mem_allocator.allocate_instance<BatchConfig::BitMask>(
+    //     causal_mask_size);
     // beam_token_infos =
     //     gpu_mem_allocator
     //         .allocate_instance<BeamSearchBatchConfig::BeamSearchPerTokenInfo>(
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index 11169fa36d..ebbfac23ea 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -191,8 +191,8 @@ __global__ void compute_attention_kernel_fused_kernel(
         qk_max = mask ? qk_max : fmaxf(qk_max, qk);
 
         // if (head_idx == 0 && qi == 1 && !mask && tidx == 0) {
-        //   printf("tree attn qkqkqkqk request id %d,  %d %.10f, %.10f, %.10f\n",
-        //   request_idx,
+        //   printf("tree attn qkqkqkqk request id %d,  %d %.10f, %.10f,
+        //   %.10f\n", request_idx,
         //          ti,
         //          qk,
         //          q_vecs[ki_o][0].x,
@@ -355,7 +355,8 @@ __global__ void compute_attention_kernel_fused_kernel(
       //          out.z,
       //          out.w,
       //          vi,
-      //          (first_token_idx + qi) * hidden_size + head_idx * per_head_size +
+      //          (first_token_idx + qi) * hidden_size + head_idx *
+      //          per_head_size +
       //              vi);
       // }
     }
@@ -502,15 +503,21 @@ __global__ void update_tree_branch_kv_cache_fused(
     int const req_id = tokenInfos[token_idx].request_index;
     int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
 
-    int const request_token_offset = request_infos[req_id].first_token_offset_in_batch;
+    int const request_token_offset =
+        request_infos[req_id].first_token_offset_in_batch;
 
     // if(i % hidden_size == 0){
-    //   printf("update token request id: %d, %d, %d  value%.10f\n", req_id, token_idx, request_token_offset, kVal);
+    //   printf("update token request id: %d, %d, %d  value%.10f\n", req_id,
+    //   token_idx, request_token_offset, kVal);
     // }
     kCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
-               (token_idx + first_token_depth - request_token_offset) * hidden_size + offset] = kVal;
+               (token_idx + first_token_depth - request_token_offset) *
+                   hidden_size +
+               offset] = kVal;
     vCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
-               (token_idx + first_token_depth - request_token_offset) * hidden_size + offset] = vVal;
+               (token_idx + first_token_depth - request_token_offset) *
+                   hidden_size +
+               offset] = vVal;
   }
 }
 
@@ -974,8 +981,9 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
                      static_cast<DT *>(m->devQKVProjArray),
                      bias_ptr,
                      stream);
-  // print_tensor<float>((float *)m->devQKVProjArray + 768 * 8 * 3 + 768, 32, "qkvtenor1");                   
-  // print_tensor<float>((float *)m->devQKVProjArray + 768 * 18 * 3 + 768, 32, "qkvtenor2");
+  // print_tensor<float>((float *)m->devQKVProjArray + 768 * 8 * 3 + 768, 32,
+  // "qkvtenor1"); print_tensor<float>((float *)m->devQKVProjArray + 768 * 18 *
+  // 3 + 768, 32, "qkvtenor2");
 
   // phase 2: No need to update key/val cache
   // IncMultiHeadSelfAttention::update_kv_cache_kernel(
@@ -1019,7 +1027,7 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
     cudaEventRecord(t_start, stream);
   }
 
-  std::cout << "tree input tokens: " <<bc->num_active_tokens() << "\n";
+  std::cout << "tree input tokens: " << bc->num_active_tokens() << "\n";
 
   // assert(input.data_type == weight.data_type);
   assert(input.data_type == output.data_type);
@@ -1128,34 +1136,15 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
 
   // allocate memory for the seqArray and reserve space
   {
-    int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
-    size_t committed_tokeninfo_size = max_tokens_per_batch;
-    size_t causal_mask_size = BatchConfig::MAX_NUM_REQUESTS;
-
-    size_t total_size = committed_tokeninfo_size *
-                            sizeof(TreeVerifyBatchConfig::CommittedTokensInfo) +
-                        causal_mask_size * sizeof(BatchConfig::BitMask);
-    if (offload) {
-      // assert that we have enough reserved work space left
-      assert(gpu_mem_allocator.reserved_total_size -
-                 gpu_mem_allocator.reserved_allocated_size >=
-             total_size);
-      committed_token_infos =
-          gpu_mem_allocator
-              .allocate_reserved<TreeVerifyBatchConfig::CommittedTokensInfo>(
-                  committed_tokeninfo_size);
-      causalMask = gpu_mem_allocator.allocate_instance<BatchConfig::BitMask>(
-          causal_mask_size);
-    } else {
-      gpu_mem_allocator.create_legion_instance(committed_token_reserve_inst,
-                                               total_size);
-      committed_token_infos =
-          gpu_mem_allocator
-              .allocate_instance<TreeVerifyBatchConfig::CommittedTokensInfo>(
-                  committed_tokeninfo_size);
-      causalMask = gpu_mem_allocator.allocate_instance<BatchConfig::BitMask>(
-          causal_mask_size);
-    }
+
+    causalMask = static_cast<BatchConfig::BitMask *>(
+        handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
+        sizeof(BatchConfig::requestsInfo));
+    committed_token_infos =
+        static_cast<TreeVerifyBatchConfig::CommittedTokensInfo *>(
+            handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
+            sizeof(BatchConfig::requestsInfo) +
+            sizeof(BatchConfig::causalMask));
   }
 
   cudaStreamSynchronize(stream);
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index ab062a4610..670db1ab0e 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -766,12 +766,6 @@ BeamSearchBatchConfig
         new_bc.beamRequestsInfo[i].sub_request_num = 1;
 
         new_bc.sub_requests[i] = 1;
-        new_bc.topology_mask[i].allocated_tokens = request.tokens.size();
-
-        // assign new kv cache position
-        for (int j = 0; j < request.tokens.size(); j++) {
-          new_bc.topology_mask[i].real_token_pos[0][j] = j;
-        }
 
         updateBitMask(new_bc.causalMask[i],
                       verified_tokens.size(),
@@ -786,8 +780,6 @@ BeamSearchBatchConfig
           new_bc.tokensInfo[new_bc.num_tokens].token_id = token.first;
           new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request =
               token.second;
-          new_bc.topology_mask[i].real_token_pos[0][token.second] =
-              new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request;
 
           // Beam Token Info
           new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = 0;
@@ -846,7 +838,6 @@ BeamSearchBatchConfig
       }
 
       new_bc.beamRequestsInfo[i].sub_request_num = 1;
-      new_bc.topology_mask[i].allocated_tokens = 0;
 
       new_bc.sub_requests[i] = 1;
 
@@ -919,14 +910,12 @@ BeamSearchBatchConfig
           assert(depth < new_request.tokens.size());
           new_bc.tokensInfo[new_bc.num_tokens].token_id =
               new_request.tokens[depth];
-          new_bc.topology_mask[i].real_token_pos[0][depth] = depth;
 
           // beam search meta data, indicate which sub request this token
           // belongs to, init to 0;
           new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = 0;
           new_bc.num_tokens++;
         }
-        new_bc.topology_mask[i].allocated_tokens = 0;
 
         initBitMask(new_bc.causalMask[i],
                     new_bc.requestsInfo[i].num_tokens_in_batch);
@@ -1120,9 +1109,6 @@ BeamSearchBatchConfig
         update_beam_metadata(
             new_bc, old_bc, request.beam_trees.at(old_bc.model_id), i);
 
-        new_bc.topology_mask[i].allocated_tokens =
-            old_bc.topology_mask[i].allocated_tokens +
-            old_bc.beamRequestsInfo[i].sub_request_num;
       } else {
         assert(false && "Request should not be pending in beam search phase");
       }
@@ -1156,31 +1142,9 @@ BeamSearchBatchConfig
                   << std::endl;
       }
 
-      //       for (int j = 0; j < request.tokens.size(); j++) {
-      //     new_bc.topology_mask[i].real_token_pos[0][j] = j;
-      // }
-
       // register more tokens due to the beam width
-      std::cout << "register more tokens: "
-                << new_bc.beamRequestsInfo[i].sub_request_num << ", "
-                << new_bc.requestsInfo[i].num_tokens_in_batch << ", "
-                << new_bc.topology_mask[i].allocated_tokens << "\n";
-
-      // copy meta data and replicate
-      int replicate_num = new_bc.beamRequestsInfo[i].sub_request_num /
-                          old_bc.beamRequestsInfo[i].sub_request_num;
-
-      for (int j = 0; j < old_bc.beamRequestsInfo[i].sub_request_num; j++) {
-        int old_idx = j;
-        for (int k = 0; k < replicate_num; k++) {
-          int new_idx = j * replicate_num + k;
-          std::cout << "copy from " << old_idx << "to: " << new_idx << "\n";
-          memcpy(new_bc.topology_mask[i].real_token_pos[new_idx],
-                 old_bc.topology_mask[i].real_token_pos[old_idx],
-                 sizeof(int) * BatchConfig::MAX_NUM_TOKENS);
-        }
-      }
 
+      //copy metadata
       memcpy(&new_bc.causalMask[i],
              &old_bc.causalMask[i],
              sizeof(BatchConfig::BitMask));
@@ -1215,14 +1179,6 @@ BeamSearchBatchConfig
           new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = k;
           new_bc.num_tokens++;
 
-          // width first
-          new_bc.topology_mask[i].real_token_pos[k][depth] =
-              new_bc.topology_mask[i].allocated_tokens + num_generation_tokens;
-
-          // std::cout << "topology: sub request: " << k << ", "
-          //           << ", " << depth << ", "
-          //           << new_bc.topology_mask[i].real_token_pos[k][depth] <<
-          //           "\n";
           num_generation_tokens++;
         }
       }
diff --git a/src/runtime/request_manager.cu b/src/runtime/request_manager.cu
index 4d7e2c8806..e8824feda5 100644
--- a/src/runtime/request_manager.cu
+++ b/src/runtime/request_manager.cu
@@ -59,64 +59,74 @@ void RequestManager::load_tokens_task(
 
   // copy meta data to workSpace
   FFHandler handle = *((FFHandler const *)task->local_args);
+  size_t total_copy_size = 0;
   cudaMemcpyAsync(handle.batch_config_metadata,
                   &(batch_config->tokensInfo),
-                  batch_config->num_active_tokens() *
-                      sizeof(BatchConfig::PerTokenInfo),
+                  sizeof(BatchConfig::tokensInfo),
                   cudaMemcpyHostToDevice,
                   stream);
+  total_copy_size += sizeof(BatchConfig::tokensInfo);
+
   cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-                      sizeof(BatchConfig::tokensInfo),
+                      total_copy_size,
                   &(batch_config->requestsInfo),
-                  batch_config->max_requests_per_batch() *
-                      sizeof(BatchConfig::PerRequestInfo),
+                  sizeof(BatchConfig::requestsInfo),
                   cudaMemcpyHostToDevice,
                   stream);
+  total_copy_size += sizeof(BatchConfig::requestsInfo);
 
-  
   // load speculative metadata
   if (batch_config->get_mode() == BEAM_SEARCH_MODE) {
     BeamSearchBatchConfig const *beam_batch_config =
         static_cast<BeamSearchBatchConfig const *>(batch_config);
 
     cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-                      sizeof(BatchConfig::tokensInfo) +
-                      sizeof(BatchConfig::requestsInfo),
-                  &(beam_batch_config->topology_mask),
-                  sizeof(BeamSearchBatchConfig::topology_mask),
-                  cudaMemcpyHostToDevice,
-                  stream);
-
-    cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-                        sizeof(BatchConfig::tokensInfo) +
-                        sizeof(BatchConfig::requestsInfo) +
-                        sizeof(BeamSearchBatchConfig::topology_mask),
+                        total_copy_size,
                     &(beam_batch_config->beamTokenInfo),
                     sizeof(BeamSearchBatchConfig::beamTokenInfo),
                     cudaMemcpyHostToDevice,
                     stream);
+
+    total_copy_size += sizeof(BeamSearchBatchConfig::beamTokenInfo);
+
     cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-                        sizeof(BatchConfig::tokensInfo) +
-                        sizeof(BatchConfig::requestsInfo) +
-                        sizeof(BeamSearchBatchConfig::topology_mask) +
-                        sizeof(BeamSearchBatchConfig::beamTokenInfo),
+                        total_copy_size,
                     &(beam_batch_config->beamRequestsInfo),
                     sizeof(BeamSearchBatchConfig::beamRequestsInfo),
                     cudaMemcpyHostToDevice,
                     stream);
+    total_copy_size += sizeof(BeamSearchBatchConfig::beamRequestsInfo);
 
-    // cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-    //                     sizeof(BatchConfig::tokensInfo) +
-    //                     sizeof(BatchConfig::requestsInfo) +
-    //                     sizeof(BeamSearchBatchConfig::topology_mask) +
-    //                     sizeof(BeamSearchBatchConfig::beamTokenInfo) +
-    //                     sizeof(BeamSearchBatchConfig::beamRequestsInfo),
-    //                 &(beam_batch_config->causalMask),
-    //                 sizeof(BatchConfig::causalMask),
-    //                 cudaMemcpyHostToDevice,
-    //                 stream);
-    //  std::cout << "copy calsual mask info: " << beam_batch_config->causalMask[0].prompt_size << "\n";
+    cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+                        total_copy_size,
+                    &(beam_batch_config->causalMask),
+                    sizeof(BatchConfig::causalMask),
+                    cudaMemcpyHostToDevice,
+                    stream);
+
+    total_copy_size += sizeof(BatchConfig::causalMask);
+  } else if (batch_config->get_mode() == TREE_VERIFY_MODE) {
+    TreeVerifyBatchConfig const *tree_batch_config =
+        static_cast<TreeVerifyBatchConfig const *>(batch_config);
+
+    cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+                        total_copy_size,
+                    &(tree_batch_config->causalMask),
+                    sizeof(BatchConfig::causalMask),
+                    cudaMemcpyHostToDevice,
+                    stream);
+    total_copy_size += sizeof(BatchConfig::causalMask);
+    cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+                        total_copy_size,
+                    &(tree_batch_config->committed_tokens),
+                    sizeof(TreeVerifyBatchConfig::committed_tokens),
+                    cudaMemcpyHostToDevice,
+                    stream);
+    total_copy_size += sizeof(TreeVerifyBatchConfig::committed_tokens);
   }
+
+  // add a size check
+  assert(total_copy_size <= handle.batch_config_metadata_size);
 }
 
 void RequestManager::load_positions_task(

From fae148da9a4b495d26642c1929ebe9f25cdf3b1d Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Sat, 30 Dec 2023 05:11:38 -0500
Subject: [PATCH 279/344] fix some corner cases

---
 include/flexflow/model.h                      |   1 +
 .../inc_multihead_self_attention_utils.cuh    |   4 +-
 include/flexflow/request_manager.h            |   7 +
 inference/spec_infer/spec_infer.cc            |   6 +-
 src/ops/argmax.cc                             |   2 +-
 src/ops/beam_topk.cc                          |   1 +
 src/ops/inc_multihead_self_attention.cu       |   8 +-
 src/ops/kernels/embedding_kernels.cu          |   2 +-
 src/ops/spec_inc_multihead_self_attention.cu  |  18 +--
 .../specinfer_inc_multihead_self_attention.cu |  75 +++++-----
 src/ops/tree_inc_multihead_self_attention.cu  |  94 ++++++------
 src/runtime/cuda_helper.cu                    |   2 +-
 src/runtime/inference_manager.cc              |  61 +++++++-
 src/runtime/model.cc                          |  17 +++
 src/runtime/request_manager.cc                | 141 ++++++++++++++----
 src/runtime/request_manager.cu                |  87 +++++++++++
 16 files changed, 389 insertions(+), 137 deletions(-)

diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 3602cb108b..9cdbec64a9 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -242,6 +242,7 @@ enum TaskIDs {
   // InferenceManager & RequestManager
   RM_LOAD_TOKENS_TASK_ID,
   RM_LOAD_POSITION_TASK_ID,
+  RM_LOAD_BATCH_CONFIG_TASK_ID,
   RM_PREPARE_NEXT_BATCH_TASK_ID,
   RM_PREPARE_NEXT_BATCH_INIT_TASK_ID,
   RM_PREPARE_NEXT_BATCH_BEAM_TASK_ID,
diff --git a/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh b/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh
index 0c065b6b0e..1b21a80dc9 100644
--- a/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh
+++ b/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh
@@ -456,7 +456,7 @@ inline size_t smem_size_in_bytes(int hidden_size_per_head,
                                  int threads_per_block) {
   // The amount of shared memory needed to store the Q*K^T values in float.
 
-  size_t qk_sz = div_up(1000 + 1, 4) * 16;
+  size_t qk_sz = div_up(2000 + 1, 4) * 16;
   size_t logits_sz = qk_sz;
 
   // The total size needed during softmax.
@@ -493,7 +493,7 @@ inline void smem_size_in_bytes_tree(int hidden_size_per_head,
   }
 
   // todo fix this
-  int max_qk_length = max_query_length * max_total_length;
+  int max_qk_length = max_query_length * max_total_length + 1000;
 
   // The amount of shared memory needed to store the Q*K^T values in float.
   size_t qk_sz = div_up(max_qk_length + 1, 4) * 16;
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index dc1939c74b..8cb45e55b4 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -43,6 +43,8 @@ class InferenceManager {
   void load_positions(BatchConfigFuture const &bc,
                       ParallelTensor position_input,
                       int offset);
+  void load_inference_metadata_batch_config(BatchConfigFuture const &bc,
+                                            FFHandler *handlers);
 
 public:
   FFConfig ff_config;
@@ -195,6 +197,11 @@ class RequestManager {
                           Legion::Context ctx,
                           Legion::Runtime *runtime);
 
+  static void
+      load_batch_config_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
   static BatchConfig prepare_next_batch_task(
       Legion::Task const *task,
       std::vector<Legion::PhysicalRegion> const &regions,
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 9af3e12e5a..258b2d78eb 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -266,9 +266,9 @@ void FlexFlow::top_level_task(Task const *task,
   ModelMeta model_metadata;
   bool use_full_precision = false;
   bool verbose = false;
-  int max_requests_per_batch = 16;
-  int max_tokens_per_batch = 256;
-  int max_sequence_length = 1024;
+  int max_requests_per_batch = 10;
+  int max_tokens_per_batch = 199;
+  int max_sequence_length = 200;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
   char **argv = command_args.argv;
diff --git a/src/ops/argmax.cc b/src/ops/argmax.cc
index 0344c707fc..d195a5af75 100644
--- a/src/ops/argmax.cc
+++ b/src/ops/argmax.cc
@@ -399,7 +399,7 @@ InferenceResult
         m, shard_id, bc, {}, {}, {input, indices});
   }
 
-  print_tensor<int>(indices.get_int32_ptr(), 32, "tree attn output");
+  // print_tensor<int>(indices.get_int32_ptr(), 199, "tree attn output");
   download_tensor<BatchConfig::TokenId>(
       indices.get_int32_ptr(), ir.token_ids, batch_size);
   return ir;
diff --git a/src/ops/beam_topk.cc b/src/ops/beam_topk.cc
index 20d019eec3..5dfaae41ee 100644
--- a/src/ops/beam_topk.cc
+++ b/src/ops/beam_topk.cc
@@ -404,6 +404,7 @@ BeamInferenceResult
 
   // print_tensor<int>(index_ptr, 32, "indexxxxxxx");
 
+
   if (m->inference_debugging) {
     assert(task->index_point.get_dim() == 1);
     int shard_id = task->index_point.point_data[0];
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index a084f216e9..2f16dd71c2 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -1365,12 +1365,12 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
         // a K-ary tree max node is (k^n - 1) / 2
         key_cache_size = num_q_heads * kProjSize *
                          BeamSearchBatchConfig::max_requests_per_batch() *
-                         BatchConfig::max_sequence_length() *
-                         BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES;
+                         (BatchConfig::max_sequence_length() +
+                          BatchConfig::MAX_SPEC_TREE_TOKEN_NUM);
         value_cache_size = num_q_heads * vProjSize *
                            BeamSearchBatchConfig::max_requests_per_batch() *
-                           BatchConfig::max_sequence_length() *
-                           BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES;
+                           (BatchConfig::max_sequence_length() +
+                            BatchConfig::MAX_SPEC_TREE_TOKEN_NUM);
         break;
       }
       default:
diff --git a/src/ops/kernels/embedding_kernels.cu b/src/ops/kernels/embedding_kernels.cu
index 0cde42de56..3085fdb6ba 100644
--- a/src/ops/kernels/embedding_kernels.cu
+++ b/src/ops/kernels/embedding_kernels.cu
@@ -118,7 +118,7 @@ void forward_kernel_wrapper(EmbeddingMeta const *m,
     // print_tensor<float>(output_ptr, output_domain.get_volume(),
     // "[Embedding:forward:output]");
   }
-  // print_tensor<int>(input.get_int32_ptr(), 32, "embeddinginput");
+  print_tensor<int>(input.get_int32_ptr(), 200, "embeddinginput");
 }
 
 /*static*/
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 562dee4d93..29e3d9a48d 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -111,15 +111,15 @@ __global__ void spec_store_kv_cache(
 
     // naive cache stealing
     if (sub_req_id != parent_id) {
-      if (offset == 0 && tok_id == 0) {
-        printf("cache stealing!, depth %d req_id %d sub_req_id %d, parentid "
-               "%d, tok_id %d\n",
-               beam_depth,
-               req_id,
-               sub_req_id,
-               parent_id,
-               tok_id);
-      }
+      // if (offset == 0 && tok_id == 0) {
+      //   printf("cache stealing!, depth %d req_id %d sub_req_id %d, parentid "
+      //          "%d, tok_id %d\n",
+      //          beam_depth,
+      //          req_id,
+      //          sub_req_id,
+      //          parent_id,
+      //          tok_id);
+      // }
 
       for (int depth = 0; depth < beam_depth; depth++) {
         int steal_token_idx = tok_id - beam_depth + depth;
diff --git a/src/ops/specinfer_inc_multihead_self_attention.cu b/src/ops/specinfer_inc_multihead_self_attention.cu
index 4d4afd28e4..e84ec3095c 100644
--- a/src/ops/specinfer_inc_multihead_self_attention.cu
+++ b/src/ops/specinfer_inc_multihead_self_attention.cu
@@ -50,8 +50,7 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
     int hidden_size,
     BatchConfig::PerRequestInfo *request_infos,
     BeamSearchBatchConfig::BeamSearchPerRequestInfo *beam_request_infos,
-    BatchConfig::BitMask *causalMask,
-    int max_tree_branches) {
+    BatchConfig::BitMask *causalMask) {
 
   // q, k
   using Q_vec = typename VEC_K<DT, THREADS_PER_KEY>::Type;
@@ -83,8 +82,14 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
   // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
   //   printf("specinfer attn fused kernel %lld\n", bitmask.mask[1]);
   // }
+  
 
   int const totalCacheSize = bitmask.non_tree_cache_size + bitmask.tree_size;
+
+  // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
+  //   printf("specinfer attn fused kernel %d, %d\n",
+  //          totalCacheSize,request_infos[request_idx].num_tokens_in_batch);
+  // }
   // int const qlength = request_infos[request_idx].num_tokens_in_batch;
   int const tree_branch_num = beam_request_infos[request_idx].sub_request_num;
 
@@ -94,7 +99,7 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
   int first_token_idx = 0;
   for (int r = 0; r < request_idx; r++) {
     // first_token_idx += request_infos[request_idx].num_tokens_in_batch;
-    first_token_idx += bitmask.this_layer_size;
+    first_token_idx += causalMask[r].this_layer_size;
   }
 
   // if (tidx == 0 && head_idx == 0) {
@@ -130,8 +135,7 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
   constexpr int K_PER_WARP = WARP_SIZE / THREADS_PER_KEY;
 
   DT const *k_cache_batch =
-      key_cache +
-      request_idx * max_seq_length * hidden_size * max_tree_branches + ki;
+      key_cache + request_idx * max_seq_length * hidden_size + ki;
 
   int ti_end =
       div_up(totalCacheSize - first_step, K_PER_WARP) * K_PER_WARP + first_step;
@@ -267,9 +271,7 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
 
     // The base pointer for the value in the cache buffer.
     DT const *v_cache_batch =
-        value_cache +
-        request_idx * max_seq_length * hidden_size * max_tree_branches + vi;
-
+        value_cache + request_idx * max_seq_length * hidden_size + vi;
 
     if (Dh == Dh_MAX || vi < Dh) {
       for (int ti = first_step + vo; ti < totalCacheSize; ti += V_PER_ITER) {
@@ -344,7 +346,6 @@ __global__ void specinfer_store_kv_cache(
     int vProjSize,
     int num_tokens,
     int max_seq_len,
-    int max_tree_branches,
     bool is_root,
     int hidden_size) {
   CUDA_KERNEL_LOOP(i, num_tokens * hidden_size) {
@@ -383,10 +384,10 @@ __global__ void specinfer_store_kv_cache(
                           bitmask.this_layer_size + token_idx -
                           request_token_offset;
 
-    kCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
-               (cache_idx)*hidden_size + offset] = kVal;
-    vCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
-               (cache_idx)*hidden_size + offset] = vVal;
+    kCache_ptr[req_id * (hidden_size * max_seq_len) + (cache_idx)*hidden_size +
+               offset] = kVal;
+    vCache_ptr[req_id * (hidden_size * max_seq_len) + (cache_idx)*hidden_size +
+               offset] = vVal;
   }
 }
 
@@ -419,8 +420,8 @@ void update_kv_cache_kernel(SpecInferIncMultiHeadSelfAttentionMeta const *m,
         m->kProjSize,
         m->vProjSize,
         num_tokens,
-        BatchConfig::max_sequence_length(),
-        BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES,
+        BatchConfig::max_sequence_length() +
+            BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,
         /*root*/ curr_depth == 0,
         m->hidden_size);
   }
@@ -429,7 +430,8 @@ void update_kv_cache_kernel(SpecInferIncMultiHeadSelfAttentionMeta const *m,
 #define LAUNCH_SPECINFER_ATTENTION_SCORE_KERNEL(                               \
     DT, Dh, Dh_MAX, THDS_PER_KEY, THREADS_PER_VALUE, THDS_PER_BLOCK, stream)   \
   smem_sz = smem_size_in_bytes<DT>(m->qProjSize,                               \
-                                   BatchConfig::max_sequence_length(),         \
+                                   BatchConfig::max_sequence_length() +        \
+                                       BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,   \
                                    THREADS_PER_VALUE,                          \
                                    THDS_PER_BLOCK);                            \
   compute_specinfer_attention_kernel_generation_kernel<DT,                     \
@@ -444,13 +446,13 @@ void update_kv_cache_kernel(SpecInferIncMultiHeadSelfAttentionMeta const *m,
           static_cast<DT *>(m->valueCache),                                    \
           output_ptr,                                                          \
           scale,                                                               \
-          BatchConfig::max_sequence_length(),                                  \
+          BatchConfig::max_sequence_length() +                                 \
+              BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,                            \
           m->qProjSize,                                                        \
           m->hidden_size,                                                      \
           m->request_infos,                                                    \
           m->beam_request_infos,                                               \
-          m->causalMask,                                                       \
-          BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES)
+          m->causalMask)
 
 template <typename DT>
 void compute_specinfer_attention_kernel_generation(
@@ -527,11 +529,13 @@ void compute_attention_kernel_prompt(
   int q_block_size = m->qProjSize;
 
   int kt_block_size = m->kProjSize;
-  int kt_req_block_size =
-      kt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+  int kt_req_block_size = kt_block_size * m->num_q_heads *
+                          (BatchConfig::max_sequence_length() +
+                           BatchConfig::MAX_SPEC_TREE_TOKEN_NUM);
   int vt_block_size = m->vProjSize;
-  int vt_req_block_size =
-      vt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+  int vt_req_block_size = vt_block_size * m->num_q_heads *
+                          (BatchConfig::max_sequence_length() +
+                           BatchConfig::MAX_SPEC_TREE_TOKEN_NUM);
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
@@ -580,8 +584,7 @@ void compute_attention_kernel_prompt(
 
     // print_tensor<float>((float*)A, 32, "A");
     std::cout << "meta: " << num_new_tokens << ", " << total_tokens << "\n";
-    DT const *B = static_cast<DT *>(m->keyCache) +
-                  (i * bc->MAX_SPECULATIVE_TREE_BRANCHES) * kt_req_block_size;
+    DT const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
 
     // if (i == 0 && sub_req_id == 0 &&
     //     bc->beam_slots.at(0).current_depth == 1) {
@@ -692,8 +695,7 @@ void compute_attention_kernel_prompt(
     strideC = m->vProjSize;
     // To get A, skip over V^T entries from previous requests (all heads +
     // padding)
-    A = static_cast<DT *>(m->valueCache) +
-        (i * bc->MAX_SPECULATIVE_TREE_BRANCHES) * vt_req_block_size;
+    A = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
     // To get B, skip over softmax(QK^T/sqrt(d_k)) entries from previous
     // requests (all heads)
     B = C_softmax;
@@ -851,8 +853,10 @@ void SpecInferIncMultiHeadSelfAttention::inference_kernel_wrapper(
     // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
     // acc_output.rect, "[Attention:forward:output]");
   }
-  // save_tensor<float>(output.get_float_ptr(), 768 * 3, "/home/xinhaoc/FlexFlow/inference/output/fk1.txt");
-  // save_tensor<float>(output.get_float_ptr() + 768 * 3, 768 * 3, "/home/xinhaoc/FlexFlow/inference/output/fk2.txt");
+  // save_tensor<float>(output.get_float_ptr(), 768 * 3,
+  // "/home/xinhaoc/FlexFlow/inference/output/fk1.txt");
+  // save_tensor<float>(output.get_float_ptr() + 768 * 3, 768 * 3,
+  // "/home/xinhaoc/FlexFlow/inference/output/fk2.txt");
 
   // if(bc->num_tokens == 1){
   //   print_tensor<float>(input.get_float_ptr(), 32, "specinc input");
@@ -906,7 +910,6 @@ SpecInferIncMultiHeadSelfAttentionMeta::SpecInferIncMultiHeadSelfAttentionMeta(
     // gpu_mem_allocator.create_legion_instance(beam_search_reserve_inst,
     //                                          total_size);
 
-
     beam_token_infos =
         static_cast<BeamSearchBatchConfig::BeamSearchPerTokenInfo *>(
             handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
@@ -915,13 +918,13 @@ SpecInferIncMultiHeadSelfAttentionMeta::SpecInferIncMultiHeadSelfAttentionMeta(
     beam_request_infos =
         static_cast<BeamSearchBatchConfig::BeamSearchPerRequestInfo *>(
             handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
-            sizeof(BatchConfig::requestsInfo)  +
+            sizeof(BatchConfig::requestsInfo) +
             sizeof(BeamSearchBatchConfig::beamTokenInfo));
-    causalMask =  static_cast<BatchConfig::BitMask *>(
-            handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
-            sizeof(BatchConfig::requestsInfo)  +
-            sizeof(BeamSearchBatchConfig::beamTokenInfo)
-            + sizeof(BeamSearchBatchConfig::beamRequestsInfo));      
+    causalMask = static_cast<BatchConfig::BitMask *>(
+        handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
+        sizeof(BatchConfig::requestsInfo) +
+        sizeof(BeamSearchBatchConfig::beamTokenInfo) +
+        sizeof(BeamSearchBatchConfig::beamRequestsInfo));
 
     // causalMask = gpu_mem_allocator.allocate_instance<BatchConfig::BitMask>(
     //     causal_mask_size);
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index ebbfac23ea..8641e63e38 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -53,7 +53,6 @@ __global__ void compute_attention_kernel_fused_kernel(
     BatchConfig::PerRequestInfo *request_infos,
     int num_heads,
     int num_requests,
-    int max_tree_branches,
     BatchConfig::BitMask *causalMask,
     int qk_smem_sz) {
 
@@ -86,8 +85,9 @@ __global__ void compute_attention_kernel_fused_kernel(
   BatchConfig::BitMask bitmask = causalMask[request_idx];
 
   // bitmask.mask[1] = 3;
-  // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
-  //   printf("tree attn fused kernel %d, %d, %d, %lld\n",
+  // if (head_idx == 0 && tidx == 0) {
+  //   printf("tree attn fused kernel req id %d %d, %d, %d, %lld\n",
+  //          request_idx,
   //          tlength,
   //          qlength,
   //          bitmask.non_tree_cache_size,
@@ -96,12 +96,12 @@ __global__ void compute_attention_kernel_fused_kernel(
 
   int first_token_idx = 0;
   for (int r = 0; r < request_idx; r++) {
-    first_token_idx += request_infos[request_idx].num_tokens_in_batch;
+    first_token_idx += request_infos[r].num_tokens_in_batch;
   }
 
-  // if(tidx == 0 && head_idx == 0){
-  //   printf("tree req: %d, %d\n", request_idx, first_token_idx);
-  // }
+  if(tidx == 0 && head_idx == 0){
+    printf("tree req: %d, %d\n", request_idx, first_token_idx);
+  }
 
   // shared memory objects
   extern __shared__ char smem_[];
@@ -132,8 +132,7 @@ __global__ void compute_attention_kernel_fused_kernel(
   constexpr int K_PER_WARP = WARP_SIZE / THREADS_PER_KEY;
 
   DT const *k_cache_batch =
-      key_cache +
-      request_idx * max_tree_branches * max_seq_length * hidden_size + ki;
+      key_cache + request_idx * max_seq_length * hidden_size + ki;
 
   int ti_end =
       div_up(tlength - first_step, K_PER_WARP) * K_PER_WARP + first_step;
@@ -190,17 +189,14 @@ __global__ void compute_attention_kernel_fused_kernel(
 
         qk_max = mask ? qk_max : fmaxf(qk_max, qk);
 
-        // if (head_idx == 0 && qi == 1 && !mask && tidx == 0) {
-        //   printf("tree attn qkqkqkqk request id %d,  %d %.10f, %.10f,
-        //   %.10f\n", request_idx,
-        //          ti,
-        //          qk,
-        //          q_vecs[ki_o][0].x,
-        //          q_vecs[ki_o][1].x,
-        //          q_vecs[ki_o][2].x,
-        //          q_vecs[ki_o][3].x,
-        //          k[0].x);
-        // }
+        if (head_idx == 0 && qi == 0 && !mask) {
+          printf("tree attn qkqkqkqk request id %d,  %d %.10f, %.10f, %.10f\n ",
+                 request_idx,
+                 ti,
+                 qk,
+                 q_vecs[ki_o][0].x,
+                 k[0].x);
+        }
         qk_smem[ti - first_step] = mask ? 0.0f : qk;
       }
     }
@@ -283,8 +279,7 @@ __global__ void compute_attention_kernel_fused_kernel(
 
     // The base pointer for the value in the cache buffer.
     DT const *v_cache_batch =
-        value_cache +
-        request_idx * max_seq_length * hidden_size * max_tree_branches + vi;
+        value_cache + request_idx * max_seq_length * hidden_size + vi;
     // DT const *v_cache_batch =
     //     value_cache +
     //     (beam_request_idx * max_beam_width + beam_sub_request_idx) *
@@ -375,8 +370,7 @@ __global__ void commit_tokens_kernel(
     int num_tokens_to_commit,
     int num_active_tokens_in_last_batch,
     int max_seq_len,
-    int hidden_size,
-    int max_tree_branches) {
+    int hidden_size) {
 
   CUDA_KERNEL_LOOP(i, num_tokens_to_commit * hidden_size) {
 
@@ -407,10 +401,10 @@ __global__ void commit_tokens_kernel(
     //   kVal);
     // }
 
-    kCache_ptr[req_id * max_tree_branches * (hidden_size * max_seq_len) +
-               tok_id * hidden_size + offset] = kVal;
-    vCache_ptr[req_id * max_tree_branches * (hidden_size * max_seq_len) +
-               tok_id * hidden_size + offset] = vVal;
+    kCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
+               offset] = kVal;
+    vCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
+               offset] = vVal;
   }
 }
 
@@ -434,9 +428,9 @@ void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
         m->vProjSize,
         num_tokens_to_commit,
         m->num_active_tokens, // number of active tokens in previous batch
-        BatchConfig::max_sequence_length(),
-        m->hidden_size,
-        BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES);
+        BatchConfig::max_sequence_length() +
+            BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,
+        m->hidden_size);
   }
 }
 
@@ -488,7 +482,6 @@ __global__ void update_tree_branch_kv_cache_fused(
     int num_new_tokens,
     int max_seq_len,
     int hidden_size,
-    int max_tree_branches,
     int first_token_depth) {
   CUDA_KERNEL_LOOP(i, num_new_tokens * hidden_size) {
 
@@ -510,11 +503,11 @@ __global__ void update_tree_branch_kv_cache_fused(
     //   printf("update token request id: %d, %d, %d  value%.10f\n", req_id,
     //   token_idx, request_token_offset, kVal);
     // }
-    kCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
+    kCache_ptr[req_id * (hidden_size * max_seq_len) +
                (token_idx + first_token_depth - request_token_offset) *
                    hidden_size +
                offset] = kVal;
-    vCache_ptr[(req_id * max_tree_branches) * (hidden_size * max_seq_len) +
+    vCache_ptr[req_id * (hidden_size * max_seq_len) +
                (token_idx + first_token_depth - request_token_offset) *
                    hidden_size +
                offset] = vVal;
@@ -569,10 +562,12 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
   int q_block_size = m->qProjSize;
   int kt_block_size = m->kProjSize;
   int kt_req_block_size =
-      kt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+      kt_block_size * m->num_q_heads * BatchConfig::max_sequence_length() +
+      BatchConfig::MAX_SPEC_TREE_TOKEN_NUM;
   int vt_block_size = m->vProjSize;
   int vt_req_block_size =
-      vt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+      vt_block_size * m->num_q_heads * BatchConfig::max_sequence_length() +
+      BatchConfig::MAX_SPEC_TREE_TOKEN_NUM;
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
@@ -836,7 +831,8 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
 #define LAUNCH_TREE_VERIFY_ATTENTION_SCORE_KERNEL(                             \
     DT, Dh, Dh_MAX, THDS_PER_KEY, THDS_PER_VALUE, THDS_PER_BLOCK, stream)      \
   smem_size_in_bytes_tree<DT>(m->qProjSize,                                    \
-                              BatchConfig::max_sequence_length(),              \
+                              BatchConfig::max_sequence_length() +             \
+                                  BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,        \
                               THDS_PER_VALUE,                                  \
                               THDS_PER_BLOCK,                                  \
                               bc,                                              \
@@ -848,7 +844,20 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                                         THDS_PER_KEY,                          \
                                         THDS_PER_VALUE>                        \
       <<<grid, THDS_PER_BLOCK, smem_sz[1], stream>>>(                          \
-          static_cast<DT *>(m->devQKVProjArray), static_cast<DT *>(m->keyCache), static_cast<DT *>(m->valueCache), output_ptr, scale, BatchConfig::max_sequence_length(), BatchConfig::max_tokens_per_batch(), m->qProjSize, m->hidden_size, m->request_infos, m->num_q_heads, bc->num_active_requests(), BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES, m->causalMask,                                                       \  
+          static_cast<DT *>(m->devQKVProjArray),                               \
+          static_cast<DT *>(m->keyCache),                                      \
+          static_cast<DT *>(m->valueCache),                                    \
+          output_ptr,                                                          \
+          scale,                                                               \
+          BatchConfig::max_sequence_length() +                                 \
+              BatchConfig::BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,               \
+          BatchConfig::max_tokens_per_batch(),                                 \
+          m->qProjSize,                                                        \
+          m->hidden_size,                                                      \
+          m->request_infos,                                                    \
+          m->num_q_heads,                                                      \
+          bc->num_active_requests(),                                           \
+          m->causalMask,                                                       \
           smem_sz[0])
 
 template <typename DT>
@@ -880,9 +889,8 @@ void compute_attention_kernel_fused(TreeIncMultiHeadSelfAttentionMeta const *m,
       m->kProjSize,
       m->vProjSize,
       num_new_tokens,
-      BatchConfig::max_sequence_length(),
+      BatchConfig::max_sequence_length() + BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,
       m->hidden_size,
-      BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES,
       bc->requestsInfo[0].first_token_depth_in_request);
 
   dim3 grid(m->num_q_heads, bc->num_active_requests());
@@ -981,9 +989,9 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
                      static_cast<DT *>(m->devQKVProjArray),
                      bias_ptr,
                      stream);
-  // print_tensor<float>((float *)m->devQKVProjArray + 768 * 8 * 3 + 768, 32,
-  // "qkvtenor1"); print_tensor<float>((float *)m->devQKVProjArray + 768 * 18 *
-  // 3 + 768, 32, "qkvtenor2");
+
+  // print_tensor<float>((float *)m->devQKVProjArray, 32, "qkvtenor1"); 
+  // print_tensor<float>((float *)m->devQKVProjArray + 768 * (25 * 7) * 3, 32, "qkvtenor2");
 
   // phase 2: No need to update key/val cache
   // IncMultiHeadSelfAttention::update_kv_cache_kernel(
diff --git a/src/runtime/cuda_helper.cu b/src/runtime/cuda_helper.cu
index fa6bf55fe5..398ed7f3cd 100644
--- a/src/runtime/cuda_helper.cu
+++ b/src/runtime/cuda_helper.cu
@@ -226,7 +226,7 @@ __host__ void print_tensor(T const *ptr,
   printf("%s, %d---->", prefix, shard_id);
   for (idx = 0; idx < num_elements; idx++) {
     printf(" %.20lf", (float)host_ptr[idx]);
-    if (idx >= 100) {
+    if (idx >= 200) {
       break;
     }
   }
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 52fd64c606..e7f7c5f52d 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -320,6 +320,7 @@ FutureMap InferenceManager::inference(FFModel *model,
         assert(op->numOutputs == 1);
         ParallelTensor pt = tensor_buffer[op->outputs[0]][batch_index];
         load_input_tokens_from_batch_config(bc, pt, model->handlers);
+        load_inference_metadata_batch_config(bc, model->handlers);
       }
     }
 
@@ -349,18 +350,32 @@ FutureMap InferenceManager::inference(FFModel *model,
 };
 
 void InferenceManager::load_input_tokens_from_batch_config(
-    BatchConfigFuture const &bc, ParallelTensor const input, FFHandler *handlers) {
+    BatchConfigFuture const &bc,
+    ParallelTensor const input,
+    FFHandler *handlers) {
   Context ctx = ff_config.lg_ctx;
   Runtime *runtime = ff_config.lg_hlr;
   size_t machine_view_hash = input->machine_view.hash();
   ArgumentMap argmap;
-  Rect<1> task_rect(Point<1>(0),
-                    Point<1>(ff_config.workersPerNode * ff_config.numNodes - 1));
-  IndexSpaceT<1> task_is = runtime->create_index_space(ctx, task_rect);
-  MachineView view = input->machine_view;
-  for (PointInRectIterator<1> it(task_rect); it(); it++) {
-    FFHandler handle = handlers[view.get_device_id(*it)];
-    argmap.set_point(*it, TaskArgument(&handle, sizeof(FFHandler)));
+  Domain domain = runtime->get_index_space_domain(ctx, input->parallel_is);
+
+  switch (domain.get_dim()) {
+#define DIMFUNC(DIM)                                                           \
+  case DIM: {                                                                  \
+    Rect<DIM> rect = domain;                                                   \
+    MachineView view = input->machine_view;                                    \
+    int idx = 0;                                                               \
+    for (PointInRectIterator<DIM> it(rect); it(); it++) {                      \
+      argmap.set_point(*it,                                                    \
+                       TaskArgument(&handlers[view.get_device_id(*it)],        \
+                                    sizeof(FFHandler)));                       \
+    }                                                                          \
+    break;                                                                     \
+  }
+    LEGION_FOREACH_N(DIMFUNC)
+#undef DIMFUNC
+    default:
+      assert(false);
   }
 
   IndexLauncher launcher(RM_LOAD_TOKENS_TASK_ID,
@@ -378,6 +393,36 @@ void InferenceManager::load_input_tokens_from_batch_config(
   runtime->execute_index_space(ctx, launcher);
 }
 
+void InferenceManager::load_inference_metadata_batch_config(
+    BatchConfigFuture const &bc,
+    FFHandler *handlers) {
+  Context ctx = ff_config.lg_ctx;
+  Runtime *runtime = ff_config.lg_hlr;
+  ArgumentMap argmap;
+
+  Rect<1> task_rect(Point<1>(0),
+                    Point<1>(ff_config.workersPerNode * ff_config.numNodes - 1));
+  IndexSpaceT<1> task_is = runtime->create_index_space(ctx, task_rect);
+
+  // int rank = 0;
+  int idx = 0;
+  for (PointInRectIterator<1> it(task_rect); it(); it++) {
+    FFHandler handler = handlers[idx++];
+    argmap.set_point(*it, TaskArgument(&handler, sizeof(FFHandler)));
+  }
+
+  IndexLauncher launcher(RM_LOAD_BATCH_CONFIG_TASK_ID,
+                         task_is,
+                         TaskArgument(nullptr, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         FFConfig::DataParallelism_GPU);
+  launcher.add_future(bc);
+  runtime->execute_index_space(ctx, launcher);
+}
+
 void InferenceManager::load_positions(BatchConfigFuture const &bc,
                                       ParallelTensor position_input,
                                       int offset) {
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 8bda9016c3..cf72f2d40b 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -4344,6 +4344,23 @@ void register_flexflow_internal_tasks(Runtime *runtime,
           registrar);
     }
   }
+  // RequestManager load metadata
+  {
+    TaskVariantRegistrar registrar(RM_LOAD_BATCH_CONFIG_TASK_ID,
+                                   "RequestManager Load meta data");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<RequestManager::load_batch_config_task>(
+          registrar, "RequestManager Load metadata Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<RequestManager::load_batch_config_task>(
+          registrar);
+    }
+  }
   // RequestManager prepare_next_batch
   {
     TaskVariantRegistrar registrar(RM_PREPARE_NEXT_BATCH_TASK_ID,
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 670db1ab0e..5c3262eb27 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -609,8 +609,8 @@ BeamSearchBatchConfig
         committed_tokens[guid].emplace_back(abs_depth, result_index);
       } else if (abs_depth >= root_abs_depth) {
         tree_outputs.emplace_back(token_id, abs_depth + 1);
-        std::cout << "committred tokens push: " << abs_depth
-                  << " ,result index: " << result_index << "\n";
+        // std::cout << "committred tokens push: " << abs_depth
+        //           << " ,result index: " << result_index << "\n";
         committed_tokens[guid].emplace_back(abs_depth, result_index);
 
         if (verbose) {
@@ -621,12 +621,12 @@ BeamSearchBatchConfig
                  tree_outputs.back().second,
                  token_id);
         }
-        std::cout << "Index within old batch: " << result_index << std::endl;
-        printf("  Input: [%d] %d ---> [%d] %d \n",
-               abs_depth,
-               old_bc.tokensInfo[result_index].token_id,
-               tree_outputs.back().second,
-               token_id);
+        // std::cout << "Index within old batch: " << result_index << std::endl;
+        // printf("  Input: [%d] %d ---> [%d] %d \n",
+        //        abs_depth,
+        //        old_bc.tokensInfo[result_index].token_id,
+        //        tree_outputs.back().second,
+        //        token_id);
       }
       result_index++;
     }
@@ -634,13 +634,12 @@ BeamSearchBatchConfig
     if (request.status == Request::RUNNING) {
       std::cout << "verify running: " << dfs_tree_inputs.at(guid).size() << ", "
                 << tree_outputs.size() << "\n";
-      
+
       std::vector<std::pair<BatchConfig::TokenId, int>> verified_tokens =
           traverse_verify_tree(guid, dfs_tree_inputs.at(guid), tree_outputs);
 
       log_req_mgr.print("Number of Verified Tokens = %zu",
                         verified_tokens.size());
-
       // check if the request is finished
       if (verified_tokens.size() + request.tokens.size() >=
           request.max_sequence_length) {
@@ -805,7 +804,12 @@ BeamSearchBatchConfig
         }
         log_req_mgr.print("Output: %s", output.c_str());
       }
- 
+
+      if (request.tokens.size() > 19 && i >= 7) {
+        std::cout << request.tokens.size() << "\n";
+        assert(false);
+      }
+
     } else if (request.status == Request::PENDING) {
       new_bc.request_completed[i] = false;
       new_bc.request_running[i] = false;
@@ -1099,7 +1103,8 @@ BeamSearchBatchConfig
       // }
 
       assert(new_bc.beamRequestsInfo[i].sub_request_num <=
-             BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES);
+                 BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES &&
+             "exceed maximum nodes per layer");
 
       if (request.status == Request::RUNNING) {
         new_bc.beamRequestsInfo[i].current_depth =
@@ -1144,7 +1149,7 @@ BeamSearchBatchConfig
 
       // register more tokens due to the beam width
 
-      //copy metadata
+      // copy metadata
       memcpy(&new_bc.causalMask[i],
              &old_bc.causalMask[i],
              sizeof(BatchConfig::BitMask));
@@ -1185,9 +1190,6 @@ BeamSearchBatchConfig
       // if(new_bc.beamRequestsInfo[i].current_depth >= 3 && i > 0){
       //   assert(false);
       // }
-      
-
-      
     }
   }
 
@@ -1238,7 +1240,8 @@ BeamSearchBatchConfig
           old_bc.beamRequestsInfo[i].sub_request_num;
 
       assert(new_bc.beamRequestsInfo[i].sub_request_num <=
-             BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES);
+                 BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES &&
+             "exceed maximum nodes per layer");
 
       // update the parentid, accumalated_probs, depth, and token_ids
 
@@ -1504,6 +1507,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       std::cout << "prepare next batch verify: " << dfs_tree_inputs.size()
                 << "\n";
 
+      bool cutLayer = false;
       // Add Tokens from the DFS Tree to the next batch
       for (int j = 1; j < dfs_tree_inputs.size(); j++) {
         auto token = dfs_tree_inputs.at(j);
@@ -1520,11 +1524,27 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
         new_bc.num_tokens++;
         new_bc.requestsInfo[i].num_tokens_in_batch++;
 
-        if (new_bc.num_tokens == get_max_tokens_per_batch() - 1) {
+        if (new_bc.num_tokens == get_max_tokens_per_batch() &&
+            (j != dfs_tree_inputs.size() - 1)) {
+          cutLayer = true;
           break;
         }
       }
 
+      // delete the last incomplete layer
+      if (cutLayer) {
+        int total_tokens = new_bc.num_tokens;
+        for (int j = total_tokens - 1; j >= 1; j--) {
+          new_bc.num_tokens--;
+          new_bc.requestsInfo[i].num_tokens_in_batch--;
+          std::cout << "cut: " << j << "\n";
+          if (new_bc.tokensInfo[j].abs_depth_in_request !=
+              new_bc.tokensInfo[j - 1].abs_depth_in_request) {
+            break;
+          }
+        }
+      }
+
     } else if (request.status == Request::PENDING) {
       std::cout << "prepare next batch verify: pending\n"
                 << "\n";
@@ -1646,6 +1666,8 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
     }
   }
 
+  std::cout << "how many tokens in verify? " << new_bc.num_tokens << "\n";
+
   std::cout << "check dfs tree input size: " << dfs_tree_inputs[1000000].size()
             << "\n";
 
@@ -1673,7 +1695,10 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
         old_bc.requestsInfo[old_bc.tokensInfo[i].request_index].request_guid !=
             guid) {
 
-      std::cout << "i is: " << i << "old guid" << guid << " new guid" << old_bc.requestsInfo[old_bc.tokensInfo[i].request_index].request_guid  <<"\n";
+      std::cout << "i is: " << i << "old guid" << guid << " new guid"
+                << old_bc.requestsInfo[old_bc.tokensInfo[i].request_index]
+                       .request_guid
+                << "\n";
 
       int index = old_bc.tokensInfo[i - 1].request_index;
       int beam_size = old_bc.beamRequestsInfo[index].beam_size;
@@ -1689,18 +1714,19 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
       // Count tokens sent to model in this request to find the final token's
       // index
 
-      std::cout << "previous result index: "<<  result_index;
+      std::cout << "previous result index: " << result_index;
 
       result_index +=
           (old_bc.tokensInfo[i - 1].abs_depth_in_request - start_depth) *
           beam_size;
-      
-      std::cout << "after result index: "<<  result_index;
+
+      std::cout << "after result index: " << result_index;
 
       // if (true) {
       //   std::cout << "i = " << i << ", result index = " << result_index
       //             << ", value: " << result.token_ids[result_index]
-      //             << ", leaf node num: " << leaf_node_num << ", depth" << depth
+      //             << ", leaf node num: " << leaf_node_num << ", depth" <<
+      //             depth
       //             << ", beam size: " << beam_size << "\n";
       // }
 
@@ -1765,7 +1791,8 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
       if (i < old_bc.num_tokens) {
         int new_req_idx = old_bc.tokensInfo[i].request_index;
         guid = old_bc.requestsInfo[new_req_idx].request_guid;
-        std::cout << "update guid: " << guid  << ", request idx: " << index<< "\n";
+        std::cout << "update guid: " << guid << ", request idx: " << index
+                  << "\n";
         start_depth = old_bc.tokensInfo[i].abs_depth_in_request;
       }
     }
@@ -2082,12 +2109,42 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
   // In this case the inputSeriedTree ends with padding 0s
   assert(inputSerializedTree.size() >= outputSerializedTree.size());
 
+  int *treeLayers = new int[inputSerializedTree.size()];
+  int node_num = 1;
+  int layer_num = 0;
+  for (int token_id = 0; token_id < inputSerializedTree.size(); token_id++) {
+    if (token_id == (inputSerializedTree.size() - 1) ||
+        inputSerializedTree.at(token_id + 1).second !=
+            inputSerializedTree.at(token_id).second) {
+      treeLayers[layer_num] = node_num;
+      layer_num += 1;
+      node_num = 1;
+    } else {
+      node_num++;
+    }
+  }
+
+  // to avoid branch switch when same tokens in input tree.
+
+  bool findFirst = false;
+  layer_num = -1;
+  int first_layer_slot = 0;
+  int first_layer_slot_total = 0;
+  int processed_whole_layer_tokens = 0;
+
   for (int i = 0; i < outputSerializedTree.size(); i++) {
     auto input = inputSerializedTree.at(i);
     auto output = outputSerializedTree.at(i);
 
+    if (i == 0 || inputSerializedTree.at(i - 1).second !=
+                      inputSerializedTree.at(i).second) {
+      layer_num += 1;
+      processed_whole_layer_tokens += i == 0 ? 0 : treeLayers[layer_num - 1];
+    }
+
     if (i == 0) {
       verifiedTree.push_back(output);
+
       new_committed_tokens.push_back(std::make_pair(
           input.second,
           committed_tokens.at(guid).at(i).second)); // <input_abs_depth,
@@ -2102,11 +2159,37 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
 
     if (input.first == verifiedTree.back().first &&
         input.second == verifiedTree.back().second) {
-      verifiedTree.push_back(output);
-      new_committed_tokens.push_back(std::make_pair(
-          input.second,
-          committed_tokens.at(guid).at(i).second)); // <input_abs_depth,
-                                                    // input_index_in_batch>
+      if (findFirst) {
+        // must in this branch.
+        int layer_slot = i - processed_whole_layer_tokens;
+        int layer_slot_total = treeLayers[layer_num];
+        if ((first_layer_slot == layer_slot)) {
+          verifiedTree.push_back(output);
+          new_committed_tokens.push_back(std::make_pair(
+              input.second, committed_tokens.at(guid).at(i).second));
+          // at this point, you'll not go other branches
+          std::cout << "verify tree push back: " << output.first
+                    << ", tree size is: " << verifiedTree.size()
+                    << ", ??: " << input.first << ", " << input.second << "\n";
+
+        } else {
+          printf("not correct slot\n");
+        }
+      } else {
+        verifiedTree.push_back(output);
+        first_layer_slot = i - processed_whole_layer_tokens;
+        first_layer_slot_total = treeLayers[layer_num];
+        findFirst = true;
+        new_committed_tokens.push_back(std::make_pair(
+            input.second,
+            committed_tokens.at(guid).at(i).second)); // <input_abs_depth,
+                                                      // input_index_in_batch>
+        // at this point, you'll not go other branches
+        std::cout << "verify tree push back: " << output.first
+                  << ", tree size is: " << verifiedTree.size()
+                  << ", ??: " << input.first << ", " << input.second << "\n";
+      }
+
       assert(committed_tokens.at(guid).at(i).first == input.second);
     }
   }
diff --git a/src/runtime/request_manager.cu b/src/runtime/request_manager.cu
index e8824feda5..bb6b6030aa 100644
--- a/src/runtime/request_manager.cu
+++ b/src/runtime/request_manager.cu
@@ -57,6 +57,92 @@ void RequestManager::load_tokens_task(
                             cudaMemcpyHostToDevice,
                             stream));
 
+  // // copy meta data to workSpace
+  // FFHandler handle = *((FFHandler const *)task->local_args);
+  // size_t total_copy_size = 0;
+  // cudaMemcpyAsync(handle.batch_config_metadata,
+  //                 &(batch_config->tokensInfo),
+  //                 sizeof(BatchConfig::tokensInfo),
+  //                 cudaMemcpyHostToDevice,
+  //                 stream);
+  // total_copy_size += sizeof(BatchConfig::tokensInfo);
+
+  // cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+  //                     total_copy_size,
+  //                 &(batch_config->requestsInfo),
+  //                 sizeof(BatchConfig::requestsInfo),
+  //                 cudaMemcpyHostToDevice,
+  //                 stream);
+  // total_copy_size += sizeof(BatchConfig::requestsInfo);
+
+  // // load speculative metadata
+  // if (batch_config->get_mode() == BEAM_SEARCH_MODE) {
+  //   BeamSearchBatchConfig const *beam_batch_config =
+  //       static_cast<BeamSearchBatchConfig const *>(batch_config);
+
+  //   cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+  //                       total_copy_size,
+  //                   &(beam_batch_config->beamTokenInfo),
+  //                   sizeof(BeamSearchBatchConfig::beamTokenInfo),
+  //                   cudaMemcpyHostToDevice,
+  //                   stream);
+
+  //   total_copy_size += sizeof(BeamSearchBatchConfig::beamTokenInfo);
+
+  //   cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+  //                       total_copy_size,
+  //                   &(beam_batch_config->beamRequestsInfo),
+  //                   sizeof(BeamSearchBatchConfig::beamRequestsInfo),
+  //                   cudaMemcpyHostToDevice,
+  //                   stream);
+  //   total_copy_size += sizeof(BeamSearchBatchConfig::beamRequestsInfo);
+
+  //   cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+  //                       total_copy_size,
+  //                   &(beam_batch_config->causalMask),
+  //                   sizeof(BatchConfig::causalMask),
+  //                   cudaMemcpyHostToDevice,
+  //                   stream);
+
+  //   total_copy_size += sizeof(BatchConfig::causalMask);
+  // } else if (batch_config->get_mode() == TREE_VERIFY_MODE) {
+  //   TreeVerifyBatchConfig const *tree_batch_config =
+  //       static_cast<TreeVerifyBatchConfig const *>(batch_config);
+
+  //   cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+  //                       total_copy_size,
+  //                   &(tree_batch_config->causalMask),
+  //                   sizeof(BatchConfig::causalMask),
+  //                   cudaMemcpyHostToDevice,
+  //                   stream);
+  //   total_copy_size += sizeof(BatchConfig::causalMask);
+  //   cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+  //                       total_copy_size,
+  //                   &(tree_batch_config->committed_tokens),
+  //                   sizeof(TreeVerifyBatchConfig::committed_tokens),
+  //                   cudaMemcpyHostToDevice,
+  //                   stream);
+  //   total_copy_size += sizeof(TreeVerifyBatchConfig::committed_tokens);
+  // }
+
+  // // add a size check
+  // std::cout << "handle.batch_config_metadata_size: " << handle.batch_config_metadata_size << ", "<< total_copy_size << "\n";
+  // assert(total_copy_size <= handle.batch_config_metadata_size);
+}
+
+void RequestManager::load_batch_config_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  assert(regions.size() == 0);
+  assert(task->regions.size() == 0);
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  // BatchConfig const batch_config = *((BatchConfig *)task->args);
+  BatchConfig const *batch_config = BatchConfig::from_future(task->futures[0]);
+
   // copy meta data to workSpace
   FFHandler handle = *((FFHandler const *)task->local_args);
   size_t total_copy_size = 0;
@@ -126,6 +212,7 @@ void RequestManager::load_tokens_task(
   }
 
   // add a size check
+  std::cout << "hahaha handle.batch_config_metadata_size: " << handle.batch_config_metadata_size << ", "<< total_copy_size << "\n";
   assert(total_copy_size <= handle.batch_config_metadata_size);
 }
 

From 6c442593976ebc7efa6a50087a486ee613616a74 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Sat, 30 Dec 2023 13:06:37 -0500
Subject: [PATCH 280/344] Replicate load_token tasks so that it can be fused
 with other compute tasks; this eliminates Replicate and enables a larger
 fused op

---
 include/flexflow/config.h |  1 +
 src/ops/embedding.cc      | 18 ++++++------------
 src/runtime/model.cc      | 31 ++++++++++++++++++++-----------
 3 files changed, 27 insertions(+), 23 deletions(-)

diff --git a/include/flexflow/config.h b/include/flexflow/config.h
index c2af6d707c..01f318c6d5 100644
--- a/include/flexflow/config.h
+++ b/include/flexflow/config.h
@@ -132,6 +132,7 @@ class FFConfig {
   size_t workSpaceSize;
   Legion::Context lg_ctx;
   Legion::Runtime *lg_hlr;
+  Legion::IndexSpaceT<1> all_gpu_task_is;
   // Legion::FieldSpace field_space;
   bool syntheticInput, profiling, perform_fusion;
   bool inference_debugging;
diff --git a/src/ops/embedding.cc b/src/ops/embedding.cc
index 007e799fe0..76236e65ff 100644
--- a/src/ops/embedding.cc
+++ b/src/ops/embedding.cc
@@ -155,11 +155,8 @@ int Embedding::output_size(ParallelDim output_dims[MAX_TENSOR_DIM]) {
     output_dims[OUT_CHANNELS].size = this->out_channels;
     output_dims[OUT_CHANNELS].degree = 1;
     output_dims[OUT_CHANNELS].parallel_idx = -1;
-    // Currently do not support parallelizing over the replica dim
-    output_dims[num_dims - 1].size = 1;
-    output_dims[num_dims - 1].degree = 1;
-    output_dims[num_dims - 1].parallel_idx = -1;
-    output_dims[num_dims - 1].is_replica_dim = true;
+    // Copy replica dim
+    output_dims[num_dims - 1] = input->dims[input->num_dims - 1];
     return num_dims;
   } else {
     int num_dims = input->num_dims;
@@ -170,11 +167,8 @@ int Embedding::output_size(ParallelDim output_dims[MAX_TENSOR_DIM]) {
     output_dims[OUT_CHANNELS].size = this->out_channels;
     output_dims[OUT_CHANNELS].degree = 1;
     output_dims[OUT_CHANNELS].parallel_idx = -1;
-    // Currently do not support parallelizing over the replica dim
-    output_dims[num_dims - 1].size = 1;
-    output_dims[num_dims - 1].degree = 1;
-    output_dims[num_dims - 1].parallel_idx = -1;
-    output_dims[num_dims - 1].is_replica_dim = true;
+    // Copy replica dim
+    output_dims[num_dims - 1] = input->dims[input->num_dims - 1];
     return num_dims;
   }
   // const int REPLICA = this->output_vocab_size_replica_dim();
@@ -189,13 +183,13 @@ int Embedding::weight_size(ParallelDim weight_dims[MAX_TENSOR_DIM]) {
   weight_dims[Weight::VOCAB_SIZE].size = this->num_entries;
   weight_dims[Weight::VOCAB_SIZE].degree = 1;
   weight_dims[Weight::VOCAB_SIZE].parallel_idx = -1;
-  for (int i = 2; i < input->num_dims; i++) {
+  for (int i = 2; i < input->num_dims + 1; i++) {
     weight_dims[i].size = input->dims[i - 1].degree;
     weight_dims[i].degree = weight_dims[i].size;
     weight_dims[i].parallel_idx = input->dims[i - 1].parallel_idx;
     weight_dims[i].is_replica_dim = true;
   }
-  return input->num_dims;
+  return input->num_dims + 1;
 }
 
 void Embedding::register_output_mappings() {
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 92f0cff472..975045cd3b 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -1499,10 +1499,8 @@ FFRuntime::FFRuntime(FFConfig &config) {
   Context ctx = config.lg_ctx;
 
   ArgumentMap argmap;
-  Rect<1> task_rect(Point<1>(0),
-                    Point<1>(config.workersPerNode * config.numNodes - 1));
-  IndexSpaceT<1> task_is = runtime->create_index_space(ctx, task_rect);
-
+  Domain domain = runtime->get_index_space_domain(ctx, config.all_gpu_task_is);
+  Rect<1> task_rect = domain;
   // int rank = 0;
   for (PointInRectIterator<1> it(task_rect); it(); it++) {
     FFInitInfo info;
@@ -1518,7 +1516,7 @@ FFRuntime::FFRuntime(FFConfig &config) {
 
   // Init CUDA library on each worker
   IndexLauncher initLauncher(FF_INIT_TASK_ID,
-                             task_is,
+                             config.all_gpu_task_is,
                              TaskArgument(NULL, 0),
                              argmap,
                              Predicate::TRUE_PRED,
@@ -2993,6 +2991,12 @@ Op *FFModel::create_operator_from_layer(
       dims[num_dims].degree = 1;
       dims[num_dims].parallel_idx = -1;
       dims[num_dims].is_replica_dim = true;
+      if (config.computationMode == COMP_MODE_INFERENCE &&
+          config.tensor_parallelism_degree > 1) {
+        dims[num_dims].size *= config.tensor_parallelism_degree;
+        dims[num_dims].degree *= config.tensor_parallelism_degree;
+        dims[num_dims].parallel_idx = 0;
+      }
       // create_parallel_tensor adds an NoOp into operators
       ParallelTensor pt =
           create_parallel_tensor_legion_ordering(num_dims + 1,
@@ -3002,6 +3006,7 @@ Op *FFModel::create_operator_from_layer(
                                                  0,
                                                  true /*gradients*/,
                                                  tensor->tensor_guid);
+      assert(pt->get_shape().is_valid());
       // assert that this tensor hasn't been mapped before
       assert(tensor->parallel_tensor == nullptr);
       tensor->parallel_tensor = pt;
@@ -3260,12 +3265,12 @@ void FFModel::create_operators_from_layers() {
     if (config.computationMode == COMP_MODE_INFERENCE &&
         config.tensor_parallelism_degree > 1 && l->op_type == OP_EMBEDDING) {
       assert(op->numOutputs == 1);
-      Replicate *repl = new Replicate(*this,
-                                      op->outputs[0],
-                                      op->outputs[0]->num_dims - 1,
-                                      config.tensor_parallelism_degree);
-      operators.push_back(repl);
-      op = repl;
+      // Replicate *repl = new Replicate(*this,
+      //                                 op->outputs[0],
+      //                                 op->outputs[0]->num_dims - 1,
+      //                                 config.tensor_parallelism_degree);
+      // operators.push_back(repl);
+      // op = repl;
     } else if (config.computationMode == COMP_MODE_INFERENCE &&
                config.tensor_parallelism_degree > 1 &&
                (l->op_type == OP_INC_MULTIHEAD_SELF_ATTENTION ||
@@ -4076,6 +4081,10 @@ FFConfig::FFConfig() {
   Runtime *runtime = Runtime::get_runtime();
   lg_hlr = runtime;
   lg_ctx = Runtime::get_context();
+  Rect<1> task_rect(Point<1>(0), Point<1>(workersPerNode * numNodes - 1));
+  // Create an index space for tasks running on all GPUs
+  all_gpu_task_is = runtime->create_index_space(lg_ctx, task_rect);
+
   // field_space = runtime->create_field_space(lg_ctx);
 }
 

From ac112037a8e88193d3377684ae2821d253551c2d Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Sat, 30 Dec 2023 15:09:19 -0500
Subject: [PATCH 281/344] more fix.

---
 include/flexflow/batch_config.h               |  3 +
 src/ops/inc_multihead_self_attention.cu       | 13 ++--
 src/ops/kernels/embedding_kernels.cu          |  2 +-
 .../specinfer_inc_multihead_self_attention.cu | 58 ++++++++---------
 src/ops/tree_inc_multihead_self_attention.cu  | 42 ++++++------
 src/runtime/request_manager.cc                | 65 ++++++++++---------
 6 files changed, 98 insertions(+), 85 deletions(-)

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index c3a75e59a4..8065e0f038 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -69,6 +69,9 @@ class BatchConfig {
     int first_token_offset_in_batch;
     int num_tokens_in_batch;
     int max_sequence_length;
+
+    //request id in batch config:
+    int batch_config_request_id;
     RequestGuid request_guid;
   };
   struct PerTokenInfo {
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 2f16dd71c2..3b3879e8e5 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -82,6 +82,9 @@ __global__ void compute_attention_kernel_generation_kernel(
   // request idx
   int const request_idx = blockIdx.y;
 
+  int const batch_config_request_id =
+      request_infos[request_idx].batch_config_request_id;
+
   int const beam_request_idx =
       is_beam ? request_idx / max_beam_width : request_idx;
   int const beam_sub_request_idx = is_beam ? request_idx % max_beam_width : 0;
@@ -89,8 +92,8 @@ __global__ void compute_attention_kernel_generation_kernel(
   int const first_step = 0;
 
   int const tlength =
-      request_infos[beam_request_idx].first_token_depth_in_request +
-      request_infos[beam_request_idx].num_tokens_in_batch;
+      request_infos[batch_config_request_id].first_token_depth_in_request +
+      request_infos[batch_config_request_id].num_tokens_in_batch;
 
   // shared memory objects
   extern __shared__ char smem_[];
@@ -103,7 +106,7 @@ __global__ void compute_attention_kernel_generation_kernel(
   // first WARPS_PER_BLOCK for store qk_max, second WARPS_PER_BLOCK for sum
   __shared__ float red_smem[WARPS_PER_BLOCK * 2];
 
-  const DT *q_ptr = query + beam_request_idx * hidden_size * QKV_WEIGHT_NUM +
+  const DT *q_ptr = query + batch_config_request_id * hidden_size * QKV_WEIGHT_NUM +
                     head_idx * per_head_size;
   __shared__ Q_vec q_vecs[THREADS_PER_KEY][K_VECS_PER_THREAD];
   // DT const *q_ptr =
@@ -139,7 +142,7 @@ __global__ void compute_attention_kernel_generation_kernel(
 
   DT const *k_cache_batch =
       key_cache +
-      (beam_request_idx * max_beam_width + beam_sub_request_idx) *
+      (batch_config_request_id * max_beam_width + beam_sub_request_idx) *
           max_seq_length * hidden_size +
       ki;
 
@@ -245,7 +248,7 @@ __global__ void compute_attention_kernel_generation_kernel(
   // The base pointer for the value in the cache buffer.
   DT const *v_cache_batch =
       value_cache +
-      (beam_request_idx * max_beam_width + beam_sub_request_idx) *
+      (batch_config_request_id * max_beam_width + beam_sub_request_idx) *
           max_seq_length * hidden_size +
       vi;
 
diff --git a/src/ops/kernels/embedding_kernels.cu b/src/ops/kernels/embedding_kernels.cu
index 3085fdb6ba..6947be432e 100644
--- a/src/ops/kernels/embedding_kernels.cu
+++ b/src/ops/kernels/embedding_kernels.cu
@@ -118,7 +118,7 @@ void forward_kernel_wrapper(EmbeddingMeta const *m,
     // print_tensor<float>(output_ptr, output_domain.get_volume(),
     // "[Embedding:forward:output]");
   }
-  print_tensor<int>(input.get_int32_ptr(), 200, "embeddinginput");
+  // print_tensor<int>(input.get_int32_ptr(), 200, "embeddinginput");
 }
 
 /*static*/
diff --git a/src/ops/specinfer_inc_multihead_self_attention.cu b/src/ops/specinfer_inc_multihead_self_attention.cu
index e84ec3095c..8340519ff3 100644
--- a/src/ops/specinfer_inc_multihead_self_attention.cu
+++ b/src/ops/specinfer_inc_multihead_self_attention.cu
@@ -69,36 +69,43 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
   int const tidx = threadIdx.x;
   // head id
   int const head_idx = blockIdx.x;
-  // request idx
+  // nth request idx
   int const request_idx = blockIdx.y;
 
-  BatchConfig::BitMask bitmask = causalMask[request_idx];
+  // request id in batch config
+  int const batch_config_request_id =
+      request_infos[request_idx].batch_config_request_id;
+
+  // request_idx = re
+
+  BatchConfig::BitMask bitmask = causalMask[batch_config_request_id];
 
   int const first_step = 0;
 
-  int const tlength = request_infos[request_idx].first_token_depth_in_request +
-                      request_infos[request_idx].num_tokens_in_batch;
+  int const tlength =
+      request_infos[batch_config_request_id].first_token_depth_in_request +
+      request_infos[batch_config_request_id].num_tokens_in_batch;
 
-  // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
-  //   printf("specinfer attn fused kernel %lld\n", bitmask.mask[1]);
-  // }
-  
+  if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
+    printf("specinfer attn fused kernel!!!\n");
+  }
 
   int const totalCacheSize = bitmask.non_tree_cache_size + bitmask.tree_size;
 
-  // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
-  //   printf("specinfer attn fused kernel %d, %d\n",
-  //          totalCacheSize,request_infos[request_idx].num_tokens_in_batch);
-  // }
+  if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
+    printf("specinfer attn fused kernel %d, %d\n",
+           totalCacheSize,
+           request_infos[batch_config_request_id].num_tokens_in_batch);
+  }
   // int const qlength = request_infos[request_idx].num_tokens_in_batch;
-  int const tree_branch_num = beam_request_infos[request_idx].sub_request_num;
+  int const tree_branch_num =
+      beam_request_infos[batch_config_request_id].sub_request_num;
 
   // will decode qlength tokens in this thread block
   // int const qlength = tree_branch_num;
 
   int first_token_idx = 0;
   for (int r = 0; r < request_idx; r++) {
-    // first_token_idx += request_infos[request_idx].num_tokens_in_batch;
     first_token_idx += causalMask[r].this_layer_size;
   }
 
@@ -135,7 +142,7 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
   constexpr int K_PER_WARP = WARP_SIZE / THREADS_PER_KEY;
 
   DT const *k_cache_batch =
-      key_cache + request_idx * max_seq_length * hidden_size + ki;
+      key_cache + batch_config_request_id * max_seq_length * hidden_size + ki;
 
   int ti_end =
       div_up(totalCacheSize - first_step, K_PER_WARP) * K_PER_WARP + first_step;
@@ -166,10 +173,6 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
       }
       float qk = scale * Qk_dot<DT, THREADS_PER_KEY>::dot(q_vecs[ki_o], k);
 
-      // if (blockIdx.y == 0 && blockIdx.x == 0) {
-      //   printf("spec inc attn qkqkqk %d,  %.10f, %d\n", ti, qk, sub_req_idx);
-      // }
-
       if (ti < totalCacheSize && tidx % THREADS_PER_KEY == 0) {
         // todo add alobi here
         // bool const mask = ti_circ >= totalCacheSize;
@@ -177,14 +180,8 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
                            (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
                               (1 << query_token))));
 
-        // if (blockIdx.y == 0 && blockIdx.x == 0 && sub_req_idx == 0) {
-        //   printf("specinfer mask: ti:%d, %d, %d, %d, %lld\n",
-        //          ti,
-        //          totalCacheSize,
-        //          bitmask.non_tree_cache_size,
-        //          query_token,
-        //          bitmask.mask[ti - bitmask.non_tree_cache_size]);
-        //   // assert(false);
+        // if (blockIdx.y == 0 && blockIdx.x == 0 && !mask) {
+        //   printf("spec inc attn qkqkqk %d,  %.10f, %d\n", ti, qk, qi);
         // }
         qk_max = mask ? qk_max : fmaxf(qk_max, qk);
         qk_smem[ti - first_step] = mask ? 0.f : qk;
@@ -271,7 +268,8 @@ __global__ void compute_specinfer_attention_kernel_generation_kernel(
 
     // The base pointer for the value in the cache buffer.
     DT const *v_cache_batch =
-        value_cache + request_idx * max_seq_length * hidden_size + vi;
+        value_cache + batch_config_request_id * max_seq_length * hidden_size +
+        vi;
 
     if (Dh == Dh_MAX || vi < Dh) {
       for (int ti = first_step + vo; ti < totalCacheSize; ti += V_PER_ITER) {
@@ -461,6 +459,7 @@ void compute_specinfer_attention_kernel_generation(
     DT *output_ptr,
     cudaStream_t stream) {
   // one block == one head per request
+  printf("??? at here: %d\n", bc->num_active_requests());
   dim3 grid(m->num_q_heads, bc->num_active_requests());
   int const per_head_size = m->qProjSize;
   float scale = (*m->qk_prod_scaling) ? 1.0f / sqrt(m->kProjSize) : 1.0f;
@@ -761,13 +760,14 @@ void inference_kernel(SpecInferIncMultiHeadSelfAttentionMeta const *m,
   // std::cout << "specinfer kernel token num: " << bc->num_generation_tokens
   //           << ", " << bc->num_tokens << "\n";
   if (bc->num_generation_tokens > 0) {
+    printf("spec inc generation decoding\n");
     compute_specinfer_attention_kernel_generation<DT>(
         m, bc, static_cast<DT *>(m->attn_heads), stream);
   }
   // phase 3: Compute attention score
   // 3 kernels for pahse 3: matmul1 - softmax - matmal2
   if (bc->num_tokens > bc->num_generation_tokens) {
-    // printf("spec inc prompt decoding\n");
+    printf("spec inc prompt decoding\n");
     compute_attention_kernel_prompt(
         m, bc, shard_id, output_ptr, bias_ptr, weight_ptr, stream);
   }
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index 8641e63e38..a4329f52db 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -76,13 +76,16 @@ __global__ void compute_attention_kernel_fused_kernel(
   // request idx
   int const request_idx = blockIdx.y;
 
+  int const batch_config_request_id =
+      request_infos[request_idx].batch_config_request_id;
+
   int const first_step = 0;
 
-  int const tlength = request_infos[request_idx].first_token_depth_in_request +
-                      request_infos[request_idx].num_tokens_in_batch;
-  int const qlength = request_infos[request_idx].num_tokens_in_batch;
+  int const tlength = request_infos[batch_config_request_id].first_token_depth_in_request +
+                      request_infos[batch_config_request_id].num_tokens_in_batch;
+  int const qlength = request_infos[batch_config_request_id].num_tokens_in_batch;
 
-  BatchConfig::BitMask bitmask = causalMask[request_idx];
+  BatchConfig::BitMask bitmask = causalMask[batch_config_request_id];
 
   // bitmask.mask[1] = 3;
   // if (head_idx == 0 && tidx == 0) {
@@ -132,7 +135,7 @@ __global__ void compute_attention_kernel_fused_kernel(
   constexpr int K_PER_WARP = WARP_SIZE / THREADS_PER_KEY;
 
   DT const *k_cache_batch =
-      key_cache + request_idx * max_seq_length * hidden_size + ki;
+      key_cache + batch_config_request_id * max_seq_length * hidden_size + ki;
 
   int ti_end =
       div_up(tlength - first_step, K_PER_WARP) * K_PER_WARP + first_step;
@@ -189,14 +192,14 @@ __global__ void compute_attention_kernel_fused_kernel(
 
         qk_max = mask ? qk_max : fmaxf(qk_max, qk);
 
-        if (head_idx == 0 && qi == 0 && !mask) {
-          printf("tree attn qkqkqkqk request id %d,  %d %.10f, %.10f, %.10f\n ",
-                 request_idx,
-                 ti,
-                 qk,
-                 q_vecs[ki_o][0].x,
-                 k[0].x);
-        }
+        // if (head_idx == 0 && qi == 0 && !mask) {
+        //   printf("tree attn qkqkqkqk request id %d,  %d %.10f, %.10f, %.10f\n ",
+        //          request_idx,
+        //          ti,
+        //          qk,
+        //          q_vecs[ki_o][0].x,
+        //          k[0].x);
+        // }
         qk_smem[ti - first_step] = mask ? 0.0f : qk;
       }
     }
@@ -279,7 +282,7 @@ __global__ void compute_attention_kernel_fused_kernel(
 
     // The base pointer for the value in the cache buffer.
     DT const *v_cache_batch =
-        value_cache + request_idx * max_seq_length * hidden_size + vi;
+        value_cache + batch_config_request_id * max_seq_length * hidden_size + vi;
     // DT const *v_cache_batch =
     //     value_cache +
     //     (beam_request_idx * max_beam_width + beam_sub_request_idx) *
@@ -481,8 +484,7 @@ __global__ void update_tree_branch_kv_cache_fused(
     int vProjSize,
     int num_new_tokens,
     int max_seq_len,
-    int hidden_size,
-    int first_token_depth) {
+    int hidden_size) {
   CUDA_KERNEL_LOOP(i, num_new_tokens * hidden_size) {
 
     int token_idx = i / hidden_size;
@@ -498,10 +500,11 @@ __global__ void update_tree_branch_kv_cache_fused(
 
     int const request_token_offset =
         request_infos[req_id].first_token_offset_in_batch;
+    int const first_token_depth = request_infos[req_id].first_token_depth_in_request;
 
     // if(i % hidden_size == 0){
-    //   printf("update token request id: %d, %d, %d  value%.10f\n", req_id,
-    //   token_idx, request_token_offset, kVal);
+    //   printf("update token request id: %d, %d, %d  real id %d, value%.10f\n", req_id,
+    //   token_idx, request_token_offset,(token_idx + first_token_depth - request_token_offset), kVal);
     // }
     kCache_ptr[req_id * (hidden_size * max_seq_len) +
                (token_idx + first_token_depth - request_token_offset) *
@@ -890,8 +893,7 @@ void compute_attention_kernel_fused(TreeIncMultiHeadSelfAttentionMeta const *m,
       m->vProjSize,
       num_new_tokens,
       BatchConfig::max_sequence_length() + BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,
-      m->hidden_size,
-      bc->requestsInfo[0].first_token_depth_in_request);
+      m->hidden_size);
 
   dim3 grid(m->num_q_heads, bc->num_active_requests());
   int const per_head_size = m->qProjSize;
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 5c3262eb27..e30a7ee478 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -364,6 +364,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
     }
   }
   int num_generation_tokens = 0;
+  int num_active_req = -1;
 
   // Step 2: prepare the next batch for existing requests
   BatchConfig new_bc;
@@ -454,6 +455,8 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
             old_bc.requestsInfo[i].request_guid;
         new_bc.requestsInfo[i].max_sequence_length =
             old_bc.requestsInfo[i].max_sequence_length;
+        num_active_req++;
+        new_bc.requestsInfo[num_active_req].batch_config_request_id = i; 
         if (new_bc.requestsInfo[i].first_token_depth_in_request + 1 ==
             request.tokens.size()) {
           // Incremental phase
@@ -490,6 +493,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
         Request new_request = pending_request_queue.front();
         pending_request_queue.pop();
         // all_requests[new_request.guid] = new_request;
+
         new_bc.requestsInfo[i].first_token_depth_in_request = 0;
         new_bc.requestsInfo[i].first_token_offset_in_batch = new_bc.num_tokens;
         new_bc.requestsInfo[i].request_guid = new_request.guid;
@@ -499,6 +503,8 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
         new_bc.requestsInfo[i].max_sequence_length =
             new_request.max_sequence_length;
         new_bc.request_completed[i] = false;
+        num_active_req++;
+        new_bc.requestsInfo[num_active_req].batch_config_request_id = i; 
         // add profile_info for the new request
         ProfileInfo profile_info;
         profile_info.llm_decoding_steps = 1;
@@ -574,6 +580,7 @@ BeamSearchBatchConfig
   int result_index = 0;
 
   int num_generation_tokens = 0;
+  int num_active_req = -1;
 
   for (int i = 0; i < BatchConfig::max_requests_per_batch(); i++) {
     if (old_bc.request_completed[i]) {
@@ -596,10 +603,11 @@ BeamSearchBatchConfig
     } else {
       committed_tokens[guid].clear();
     }
+    
 
     // iterate through all the tokens that belong to request i
     int root_abs_depth = request.tokens.size() - 1;
-
+    
     while (result_index < old_bc.num_tokens &&
            old_bc.tokensInfo[result_index].request_index == i) {
       int abs_depth = old_bc.tokensInfo[result_index].abs_depth_in_request;
@@ -639,7 +647,7 @@ BeamSearchBatchConfig
           traverse_verify_tree(guid, dfs_tree_inputs.at(guid), tree_outputs);
 
       log_req_mgr.print("Number of Verified Tokens = %zu",
-                        verified_tokens.size());
+                        verified_tokens.size());                 
       // check if the request is finished
       if (verified_tokens.size() + request.tokens.size() >=
           request.max_sequence_length) {
@@ -723,8 +731,10 @@ BeamSearchBatchConfig
 
         std::cout << "parse to next iteration: "
                   << "\n";
+
         new_bc.request_completed[i] = false;
         new_bc.request_running[i] = true;
+        num_active_req++;
 
         // Normal Request Info
         new_bc.requestsInfo[i].first_token_depth_in_request =
@@ -735,6 +745,7 @@ BeamSearchBatchConfig
         new_bc.requestsInfo[i].max_sequence_length =
             old_bc.requestsInfo[i].max_sequence_length;
         new_bc.requestsInfo[i].num_tokens_in_batch = verified_tokens.size();
+        new_bc.requestsInfo[num_active_req].batch_config_request_id = i; 
 
         // TODO: Beam Request Info, missing from VerifyTreeBatchConfig
         int new_max_depth =
@@ -805,14 +816,15 @@ BeamSearchBatchConfig
         log_req_mgr.print("Output: %s", output.c_str());
       }
 
-      if (request.tokens.size() > 19 && i >= 7) {
-        std::cout << request.tokens.size() << "\n";
-        assert(false);
-      }
+      // if (request.tokens.size() > 19 && i >= 7) {
+      //   std::cout << request.tokens.size() << "\n";
+      //   assert(false);
+      // }
 
     } else if (request.status == Request::PENDING) {
       new_bc.request_completed[i] = false;
       new_bc.request_running[i] = false;
+      num_active_req++;
 
       std::cout << "ssm_cache_size: " << request.ssm_cache_size << ", "
                 << "initial_len: " << request.initial_len << std::endl;
@@ -826,6 +838,7 @@ BeamSearchBatchConfig
       new_bc.requestsInfo[i].max_sequence_length =
           old_bc.requestsInfo[i].max_sequence_length;
       new_bc.requestsInfo[i].num_tokens_in_batch = 0;
+      new_bc.requestsInfo[num_active_req].batch_config_request_id = i; 
 
       // TODO: Beam Request Info, missing from VerifyTreeBatchConfig
       new_bc.beamRequestsInfo[i].current_depth = 1;
@@ -867,6 +880,7 @@ BeamSearchBatchConfig
         Request new_request = pending_request_queue.front();
         pending_request_queue.pop();
         // all_requests[new_request.guid] = new_request;
+        num_active_req++;
         new_bc.requestsInfo[i].first_token_depth_in_request = 0;
         new_bc.requestsInfo[i].first_token_offset_in_batch = new_bc.num_tokens;
         new_bc.requestsInfo[i].request_guid = new_request.guid;
@@ -875,6 +889,7 @@ BeamSearchBatchConfig
                      (int)new_request.tokens.size());
         new_bc.requestsInfo[i].max_sequence_length =
             new_request.max_sequence_length;
+        new_bc.requestsInfo[num_active_req].batch_config_request_id = i; 
 
         // add profile_info for the new request
         ProfileInfo profile_info;
@@ -967,6 +982,8 @@ BeamSearchBatchConfig
     old_bc.print();
     new_bc.print();
   }
+  std::cout << "prepare next batch init active tokens: "
+            << new_bc.num_tokens << "\n";
   return new_bc;
 }
 
@@ -1027,10 +1044,12 @@ BeamSearchBatchConfig
   int num_generation_tokens = 0;
 
   // Add incremental tokens to the batch
+  int num_active_req = -1;
   for (int i = 0; i < BatchConfig::max_requests_per_batch(); i++) {
     if (old_bc.request_completed[i] || !old_bc.request_running[i]) {
       continue;
     }
+    num_active_req ++;
     // Comment out this assertion since num_tokens_in_batch can be
     // zero when beam search has reached required sequence length
     // assert(old_bc.requestsInfo[i].num_tokens_in_batch > 0);
@@ -1040,29 +1059,6 @@ BeamSearchBatchConfig
 
     // assert(processed_tokens < request.tokens.size());
     log_req_mgr.debug() << "processed_tokens: " << processed_tokens << "\n";
-    // if (processed_tokens >
-    //         old_bc.beamRequestsInfo[i].max_depth + request.tokens.size() &&
-    //     request.status == Request::RUNNING
-    //     // || ir.results[t] == 0 TODO: replace this with <EOS>
-    // ) {
-    //   // log_req_mgr.print("[Done] guid(%zu) with spec_tree_depth(%d)",
-    //   //                   old_bc.requestsInfo[i].request_guid,
-    //   //                   old_bc.beamRequestsInfo[i].max_depth);
-    //   // // new_bc.request_completed[i] = true;
-    //   // new_bc.request_completed[i] = false;
-    //   // new_bc.requestsInfo[i].first_token_depth_in_request =
-    //   processed_tokens;
-    //   // new_bc.requestsInfo[i].request_guid =
-    //   // old_bc.requestsInfo[i].request_guid;
-    //   // new_bc.requestsInfo[i].max_sequence_length =
-    //   //     old_bc.requestsInfo[i].max_sequence_length;
-    //   // new_bc.beamRequestsInfo[i].current_depth =
-    //   //       old_bc.beamRequestsInfo[i].current_depth;
-    //   // new_bc.request_running[i] = false;
-    //   std::cout << "beam search end:" << request.status << i << ", "
-    //             << new_bc.requestsInfo[i].num_tokens_in_batch << "\n";
-    // }
-    // else
     {
       log_req_mgr.debug() << "num tokens: " << old_bc.num_tokens << ", "
                           << new_bc.num_tokens;
@@ -1073,6 +1069,7 @@ BeamSearchBatchConfig
       new_bc.requestsInfo[i].max_sequence_length =
           old_bc.requestsInfo[i].max_sequence_length;
       profiling_requests[request.guid].ssm_decoding_steps += 1;
+      new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
       // update the beam search metadata
       // how many sub request in current request
       // why is sub_requests has max_requests_per_batch() * MAX_BEAM_WIDTH
@@ -1164,6 +1161,7 @@ BeamSearchBatchConfig
       //   std::cout << "nodes: " << tree.treeLayers[k].nodes_num_this_layer
       //             << "\n";
       // }
+      std::cout << "append bit mask: "<< i << "\n";
       appendBitMask(new_bc.causalMask[i],
                     new_bc.beamRequestsInfo[i].sub_request_num,
                     old_bc.beamRequestsInfo[i].beam_size,
@@ -1198,6 +1196,7 @@ BeamSearchBatchConfig
     if (old_bc.request_completed[i] || old_bc.request_running[i]) {
       continue;
     }
+    num_active_req++;
     // Comment out this assertion since num_tokens_in_batch can be
     // zero when beam search has reached required sequence length
     // assert(old_bc.requestsInfo[i].num_tokens_in_batch > 0);
@@ -1217,6 +1216,7 @@ BeamSearchBatchConfig
       new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
       new_bc.requestsInfo[i].max_sequence_length =
           old_bc.requestsInfo[i].max_sequence_length;
+      new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
 
       // update the beam search metadata
       // how many sub request in current request
@@ -1330,6 +1330,8 @@ BeamSearchBatchConfig
     // std::cout << "Current Beam DepthBBB: "
     //           << old_bc.beamRequestsInfo[0].current_depth << "\n";
   }
+  std::cout << "prepare next batch beam total tokens: " << new_bc.num_tokens
+  << "gneration tokens: " << new_bc.num_generation_tokens <<  "\n";
   return new_bc;
 }
 
@@ -1384,11 +1386,12 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       max_prompt_load_size -= 1;
     }
   }
-
+  int num_active_req = -1;
   for (int i = 0; i < TreeVerifyBatchConfig::max_requests_per_batch(); i++) {
     if (old_batches.at(0).request_completed[i]) {
       continue;
     }
+    num_active_req++;
     size_t guid = old_batches.at(0).requestsInfo[i].request_guid;
     Request &request = all_requests[guid];
 
@@ -1432,6 +1435,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
           old_batches.at(0).requestsInfo[i].request_guid;
       new_bc.requestsInfo[i].max_sequence_length =
           old_batches.at(0).requestsInfo[i].max_sequence_length;
+      new_bc.requestsInfo[num_active_req].batch_config_request_id = i;    
 
       // copy bitmask to verify batchconfig
       memcpy(&(new_bc.causalMask[i]),
@@ -1590,6 +1594,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
           old_batches.at(0).requestsInfo[i].request_guid;
       new_bc.requestsInfo[i].max_sequence_length =
           old_batches.at(0).requestsInfo[i].max_sequence_length;
+      new_bc.requestsInfo[num_active_req].batch_config_request_id = i; 
 
       new_bc.request_completed[i] = false;
 

From 7eaffbc480b05d674bbf465c903b2277f6240e0b Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Sat, 30 Dec 2023 17:24:08 -0500
Subject: [PATCH 282/344] clean up

---
 include/flexflow/batch_config.h               |    2 +-
 include/flexflow/ffconst.h                    |    1 -
 include/flexflow/model.h                      |   45 -
 include/flexflow/operator_params.h            |    2 -
 .../ops/spec_inc_multihead_self_attention.h   |    1 +
 .../specinfer_inc_multihead_self_attention.h  |  150 ---
 ...nfer_inc_multihead_self_attention_params.h |   33 -
 include/flexflow/request_manager.h            |    2 +
 inference/file_loader.cc                      |    3 +-
 inference/models/llama.cc                     |    2 +-
 src/ops/argmax.cc                             |    1 -
 src/ops/beam_topk.cc                          |    7 +-
 src/ops/beam_topk.cu                          |   39 +-
 src/ops/inc_multihead_self_attention.cu       |    3 +-
 src/ops/kernels/embedding_kernels.cu          |    1 -
 src/ops/spec_inc_multihead_self_attention.cc  |   12 +-
 src/ops/spec_inc_multihead_self_attention.cu  | 1011 +++++++++++------
 .../specinfer_inc_multihead_self_attention.cc |  883 --------------
 .../specinfer_inc_multihead_self_attention.cu |  958 ----------------
 .../tree attn kernel, 0----> -0.029753357172  |    1 -
 src/ops/tree_inc_multihead_self_attention.cu  |  122 +-
 src/runtime/ffconst_utils.cc                  |    2 -
 src/runtime/graph.cc                          |   71 +-
 src/runtime/inference_manager.cc              |    8 +-
 src/runtime/model.cc                          |  149 +--
 src/runtime/model.cpp                         |    4 +-
 src/runtime/model.cu                          |    5 +-
 src/runtime/request_manager.cc                |  288 ++---
 src/runtime/request_manager.cu                |    1 -
 29 files changed, 835 insertions(+), 2972 deletions(-)
 delete mode 100644 include/flexflow/ops/specinfer_inc_multihead_self_attention.h
 delete mode 100644 include/flexflow/ops/specinfer_inc_multihead_self_attention_params.h
 delete mode 100644 src/ops/specinfer_inc_multihead_self_attention.cc
 delete mode 100644 src/ops/specinfer_inc_multihead_self_attention.cu
 delete mode 100644 src/ops/tree attn kernel, 0----> -0.029753357172

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 8065e0f038..13904aaa46 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -70,7 +70,7 @@ class BatchConfig {
     int num_tokens_in_batch;
     int max_sequence_length;
 
-    //request id in batch config:
+    // request id in batch config:
     int batch_config_request_id;
     RequestGuid request_guid;
   };
diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index ef0003b08e..512645e624 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -171,7 +171,6 @@ enum OperatorType {
   OP_INC_MULTIHEAD_SELF_ATTENTION,
   OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION,
   OP_TREE_INC_MULTIHEAD_SELF_ATTENTION,
-  OP_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION,
   OP_SAMPLING,
   // Parallel Ops
   OP_REPARTITION,
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 9cdbec64a9..16df99ab1a 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -172,8 +172,6 @@ enum TaskIDs {
   SPEC_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
   TREE_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
   TREE_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
-  SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
-  SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
   MSELOSS_BWD_TASK_ID,
   FUSEDOP_INIT_TASK_ID,
   FUSEDOP_FWD_TASK_ID,
@@ -327,7 +325,6 @@ class Linear;
 class MultiHeadAttention;
 class IncMultiHeadSelfAttention;
 class TreeIncMultiHeadSelfAttention;
-class SpecInferIncMultiHeadSelfAttention;
 class Pool2D;
 class Reduce;
 class Reshape;
@@ -747,25 +744,6 @@ class FFModel {
       bool qk_prod_scaling = true,
       bool position_bias = false,
       char const *name = NULL);
-
-Tensor specinfer_inc_multihead_self_attention(
-      const Tensor input,
-      int embed_dim,
-      int num_heads,
-      int kdim = 0,
-      int vdim = 0,
-      float dropout = 0.0f,
-      bool bias = false,
-      bool add_bias_kv = false,
-      bool add_zero_attn = false,
-      DataType data_type = DT_NONE,
-      Initializer *kernel_initializer = NULL,
-      bool apply_rotary_embedding = false,
-      bool scaling_query = false,
-      float scaling_factor = 1.0f,
-      bool qk_prod_scaling = true,
-      bool position_bias = false,
-      char const *name = NULL);
   Tensor inc_multiquery_self_attention(const Tensor input,
                                        int embed_dim,
                                        int num_q_heads,
@@ -822,26 +800,6 @@ Tensor specinfer_inc_multihead_self_attention(
       bool qk_prod_scaling = true,
       bool position_bias = false,
       char const *name = NULL);
-
-  Tensor specinfer_inc_multiquery_self_attention(
-      const Tensor input,
-      int embed_dim,
-      int num_q_heads,
-      int num_kv_heads,
-      int kdim = 0,
-      int vdim = 0,
-      float dropout = 0.0f,
-      bool bias = false,
-      bool add_bias_kv = false,
-      bool add_zero_attn = false,
-      DataType data_type = DT_NONE,
-      Initializer *kernel_initializer = NULL,
-      bool apply_rotary_embedding = false,
-      bool scaling_query = false,
-      float scaling_factor = 1.0f,
-      bool qk_prod_scaling = true,
-      bool position_bias = false,
-      char const *name = NULL);
   // ========================================
   // Inference APIs
   // ========================================
@@ -1243,9 +1201,6 @@ Tensor specinfer_inc_multihead_self_attention(
       std::unordered_map<
           std::pair<ParallelTensorShape, TreeIncMultiHeadSelfAttentionParams>,
           TreeIncMultiHeadSelfAttention *>,
-      std::unordered_map<
-          std::pair<ParallelTensorShape, SpecInferIncMultiHeadSelfAttentionParams>,
-          SpecInferIncMultiHeadSelfAttention *>,
       std::unordered_map<std::pair<ParallelTensorShape, ReduceParams>,
                          Reduce *>,
       std::unordered_map<std::pair<ParallelTensorShape, ReshapeParams>,
diff --git a/include/flexflow/operator_params.h b/include/flexflow/operator_params.h
index cee2ae95a4..5b187839ef 100644
--- a/include/flexflow/operator_params.h
+++ b/include/flexflow/operator_params.h
@@ -37,7 +37,6 @@
 #include "flexflow/ops/topk_params.h"
 #include "flexflow/ops/transpose_params.h"
 #include "flexflow/ops/tree_inc_multihead_self_attention_params.h"
-#include "flexflow/ops/specinfer_inc_multihead_self_attention_params.h"
 #include "flexflow/parallel_ops/allreduce_params.h"
 #include "flexflow/parallel_ops/combine_params.h"
 #include "flexflow/parallel_ops/fused_parallel_op_params.h"
@@ -73,7 +72,6 @@ using OperatorParameters = mp::variant<AggregateParams,
                                        BeamTopKParams,
                                        SpecIncMultiHeadSelfAttentionParams,
                                        TreeIncMultiHeadSelfAttentionParams,
-                                       SpecInferIncMultiHeadSelfAttentionParams,
                                        RMSNormParams,
                                        ResidualRMSNormParams,
                                        Pool2DParams,
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention.h b/include/flexflow/ops/spec_inc_multihead_self_attention.h
index 56bb2bd80d..a306f7985a 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention.h
@@ -142,6 +142,7 @@ class SpecIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
   Realm::RegionInstance beam_search_reserve_inst;
   BeamSearchBatchConfig::BeamSearchPerTokenInfo *beam_token_infos;
   BeamSearchBatchConfig::BeamSearchPerRequestInfo *beam_request_infos;
+  BatchConfig::BitMask *causalMask;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/ops/specinfer_inc_multihead_self_attention.h b/include/flexflow/ops/specinfer_inc_multihead_self_attention.h
deleted file mode 100644
index b6fed1ae25..0000000000
--- a/include/flexflow/ops/specinfer_inc_multihead_self_attention.h
+++ /dev/null
@@ -1,150 +0,0 @@
-#ifndef _FLEXFLOW_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_H
-#define _FLEXFLOW_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_H
-
-#include "flexflow/accessor.h"
-#include "flexflow/device.h"
-#include "flexflow/fftype.h"
-#include "flexflow/inference.h"
-#include "flexflow/layer.h"
-#include "flexflow/node.h"
-#include "flexflow/op_meta.h"
-#include "flexflow/operator.h"
-#include "flexflow/ops/inc_multihead_self_attention.h"
-#include "flexflow/ops/specinfer_inc_multihead_self_attention_params.h"
-#include "math.h"
-#include <cfloat>
-#include <complex>
-
-namespace FlexFlow {
-
-class SpecInferIncMultiHeadSelfAttentionMeta;
-
-class SpecInferIncMultiHeadSelfAttention : public Op {
-public:
-  using Params = SpecInferIncMultiHeadSelfAttentionParams;
-  using Input = ParallelTensor;
-
-  SpecInferIncMultiHeadSelfAttention(FFModel &model,
-                                LayerID const &layer_guid,
-                                const ParallelTensor _input,
-                                int _embed_dim,
-                                int _num_q_heads,
-                                int _num_kv_heads,
-                                int _kdim,
-                                int _vdim,
-                                float _dropout,
-                                bool _qkv_bias,
-                                bool _final_bias,
-                                bool _add_zero_attn,
-                                bool _apply_rotary_embedding,
-                                bool _scaling_query,
-                                float _scaling_factor,
-                                bool _qk_prod_scaling,
-                                bool _position_bias,
-                                bool allocate_weights,
-                                char const *name);
-  SpecInferIncMultiHeadSelfAttention(FFModel &model,
-                                const ParallelTensor _input,
-                                const ParallelTensor _weight,
-                                int _embed_dim,
-                                int _num_q_heads,
-                                int _num_kv_heads,
-                                int _kdim,
-                                int _vdim,
-                                float _dropout,
-                                bool _qkv_bias,
-                                bool _final_bias,
-                                bool _add_zero_attn,
-                                bool _apply_rotary_embedding,
-                                bool _scaling_query,
-                                float _scaling_factor,
-                                bool _qk_prod_scaling,
-                                bool _position_bias,
-                                bool allocate_weights,
-                                char const *name);
-  SpecInferIncMultiHeadSelfAttention(FFModel &model,
-                                SpecInferIncMultiHeadSelfAttention const &other,
-                                const ParallelTensor input,
-                                bool allocate_weights);
-  SpecInferIncMultiHeadSelfAttention(FFModel &model,
-                                Params const &params,
-                                Input const &inputs,
-                                bool allocate_weights = false,
-                                char const *name = nullptr);
-  static Op *
-      create_operator_from_layer(FFModel &model,
-                                 Layer const *layer,
-                                 std::vector<ParallelTensor> const &inputs);
-  void init(FFModel const &) override;
-  void init_inference(FFModel const &,
-                      std::vector<ParallelTensor> const &,
-                      std::vector<ParallelTensor> const &,
-                      MachineView const *mv = nullptr) override;
-  void forward(FFModel const &) override;
-  void backward(FFModel const &) override;
-  Legion::FutureMap inference(FFModel const &,
-                              BatchConfigFuture const &,
-                              std::vector<ParallelTensor> const &,
-                              std::vector<ParallelTensor> const &,
-                              MachineView const *mv = nullptr) override;
-  void print_layer(FFModel const &model) override {
-    assert(0);
-  }
-  bool get_int_parameter(PMParameter, int *) const override;
-
-  static OpMeta *init_task(Legion::Task const *task,
-                           std::vector<Legion::PhysicalRegion> const &regions,
-                           Legion::Context ctx,
-                           Legion::Runtime *runtime);
-  static void inference_task(Legion::Task const *task,
-                             std::vector<Legion::PhysicalRegion> const &regions,
-                             Legion::Context ctx,
-                             Legion::Runtime *runtime);
-  Op *materialize(FFModel &ff,
-                  ParallelTensor inputs[],
-                  int num_inputs) const override;
-  bool measure_operator_cost(Simulator *sim,
-                             MachineView const &mv,
-                             CostMetrics &cost_metrics) const override;
-
-  static void
-      inference_kernel_wrapper(SpecInferIncMultiHeadSelfAttentionMeta const *m,
-                               BeamSearchBatchConfig const *bc,
-                               int shard_id,
-                               GenericTensorAccessorR const &input,
-                               GenericTensorAccessorR const &weight,
-                               GenericTensorAccessorW const &output,
-                               GenericTensorAccessorR const &bias);
-  Params get_params() const;
-
-public:
-  int num_q_heads, num_kv_heads, tensor_parallelism_degree;
-  float dropout, scaling_factor;
-  bool qkv_bias;
-  bool final_bias, add_zero_attn, apply_rotary_embedding, scaling_query,
-      qk_prod_scaling, position_bias;
-  int qSize, kSize, vSize, qProjSize, kProjSize, vProjSize, oProjSize;
-  int qoSeqLength, kvSeqLength;
-};
-
-class SpecInferIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
-public:
-  SpecInferIncMultiHeadSelfAttentionMeta(FFHandler handler,
-                                    SpecInferIncMultiHeadSelfAttention const *attn,
-                                    GenericTensorAccessorR const &weight,
-                                    MemoryAllocator &gpu_mem_allocator,
-                                    int num_samples,
-                                    int _num_q_heads,
-                                    int _num_kv_heads);
-  ~SpecInferIncMultiHeadSelfAttentionMeta(void);
-
-public:
-  Realm::RegionInstance beam_search_reserve_inst;
-  BeamSearchBatchConfig::BeamSearchPerTokenInfo *beam_token_infos;
-  BeamSearchBatchConfig::BeamSearchPerRequestInfo *beam_request_infos;
-  BatchConfig::BitMask *causalMask;
-};
-
-}; // namespace FlexFlow
-
-#endif // _FLEXFLOW_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_H
diff --git a/include/flexflow/ops/specinfer_inc_multihead_self_attention_params.h b/include/flexflow/ops/specinfer_inc_multihead_self_attention_params.h
deleted file mode 100644
index b57b06a7f7..0000000000
--- a/include/flexflow/ops/specinfer_inc_multihead_self_attention_params.h
+++ /dev/null
@@ -1,33 +0,0 @@
-#ifndef _FLEXFLOW_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_PARAMS_H
-#define _FLEXFLOW_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_PARAMS_H
-
-#include "flexflow/ffconst.h"
-#include "flexflow/fftype.h"
-#include "flexflow/parallel_tensor.h"
-
-namespace FlexFlow {
-
-struct SpecInferIncMultiHeadSelfAttentionParams {
-  LayerID layer_guid;
-  int embed_dim, num_q_heads, num_kv_heads, kdim, vdim;
-  float dropout, scaling_factor;
-  bool qkv_bias, final_bias, add_zero_attn, apply_rotary_embedding,
-      scaling_query, qk_prod_scaling, position_bias;
-
-  bool is_valid(ParallelTensorShape const &) const;
-};
-
-bool operator==(SpecInferIncMultiHeadSelfAttentionParams const &,
-                SpecInferIncMultiHeadSelfAttentionParams const &);
-
-} // namespace FlexFlow
-
-namespace std {
-template <>
-struct hash<FlexFlow::SpecInferIncMultiHeadSelfAttentionParams> {
-  size_t
-      operator()(FlexFlow::SpecInferIncMultiHeadSelfAttentionParams const &) const;
-};
-} // namespace std
-
-#endif // _FLEXFLOW_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_PARAMS_H
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index 8cb45e55b4..1c4b0b2a2f 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -231,6 +231,8 @@ class RequestManager {
   int max_requests_per_batch;
   int max_tokens_per_batch;
   int max_sequence_length;
+
+  // tree width in each speculative step, if not specified 1
   std::vector<int> spec_infer_tree_width;
   // private fields
   std::unique_ptr<Tokenizer> tokenizer_;
diff --git a/inference/file_loader.cc b/inference/file_loader.cc
index 3f70ddf488..7c6870d439 100644
--- a/inference/file_loader.cc
+++ b/inference/file_loader.cc
@@ -726,8 +726,7 @@ void FileDataLoader::load_single_weight_tensor(FFModel *ff,
 
   if (l->op_type == OP_INC_MULTIHEAD_SELF_ATTENTION ||
       l->op_type == OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION ||
-      l->op_type == OP_TREE_INC_MULTIHEAD_SELF_ATTENTION ||
-      l->op_type == OP_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION) {
+      l->op_type == OP_TREE_INC_MULTIHEAD_SELF_ATTENTION) {
     if (weight_filename.find("self_attention") != std::string::npos) {
       load_attention_weights_multi_query(
           data, weight_filename, weights_folder, hidden_dim, num_heads);
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index 4f76e9e0fa..10001ee916 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -90,7 +90,7 @@ void LLAMA::create_llama_model(FFModel &ff,
     Tensor mha;
     switch (mode) {
       case BEAM_SEARCH_MODE: {
-        mha = ff.specinfer_inc_multihead_self_attention(
+        mha = ff.spec_inc_multihead_self_attention(
             att_norm,
             llama_config.hidden_size,
             llama_config.num_attention_heads,
diff --git a/src/ops/argmax.cc b/src/ops/argmax.cc
index d195a5af75..c3bb3d493e 100644
--- a/src/ops/argmax.cc
+++ b/src/ops/argmax.cc
@@ -399,7 +399,6 @@ InferenceResult
         m, shard_id, bc, {}, {}, {input, indices});
   }
 
-  // print_tensor<int>(indices.get_int32_ptr(), 199, "tree attn output");
   download_tensor<BatchConfig::TokenId>(
       indices.get_int32_ptr(), ir.token_ids, batch_size);
   return ir;
diff --git a/src/ops/beam_topk.cc b/src/ops/beam_topk.cc
index 5dfaae41ee..87d357b535 100644
--- a/src/ops/beam_topk.cc
+++ b/src/ops/beam_topk.cc
@@ -370,14 +370,10 @@ BeamInferenceResult
 
   Domain input_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
-  
-  printf("----------1-----------\n");
+
   int *index_ptr = index.get_int32_ptr();
-  printf("----------2-----------\n");
   float *value_ptr = value.get_float_ptr();
-  printf("----------3-----------\n");
   int *parent_ptr = parent.get_int32_ptr();
-  printf("----------4-----------\n");
 
   // embedding size: eg. 4096
   int length = input_domain.hi()[0] - input_domain.lo()[0] + 1;
@@ -404,7 +400,6 @@ BeamInferenceResult
 
   // print_tensor<int>(index_ptr, 32, "indexxxxxxx");
 
-
   if (m->inference_debugging) {
     assert(task->index_point.get_dim() == 1);
     int shard_id = task->index_point.point_data[0];
diff --git a/src/ops/beam_topk.cu b/src/ops/beam_topk.cu
index d647fe9ed7..a958786be3 100644
--- a/src/ops/beam_topk.cu
+++ b/src/ops/beam_topk.cu
@@ -379,9 +379,9 @@ template <typename T>
 __global__ void
     mergeSubRequestsKernel(int64_t N, T const *X, T const *rstd, T *Y) {
   using T_ACC = T;
-  int64_t const i = blockIdx.x;
+  const int64_t i = blockIdx.x;
   for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
-    int64_t const index = i * N + j;
+    const int64_t index = i * N + j;
     Y[index] = static_cast<T_ACC>(X[index]) * static_cast<T_ACC>(rstd[i]);
   }
 }
@@ -556,7 +556,6 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
     int beam_size = bc->beamRequestsInfo[i].beam_size;
 
     // initial request
-    std::cout << "sub_requests: " << i << ", " << sub_requests[i] << "\n";
     assert(sub_requests[i] > 0);
     // process sub requests
     for (int j = 0; j < sub_requests[i]; j++) {
@@ -564,12 +563,13 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
       // beam_slots[i].parent_id[j];
       acc_probs[req_index * BeamSearchBatchConfig::MAX_BEAM_WIDTH + j] =
           bc->beamRequestsInfo[i].probs[j];
-      std::cout << "probbbb req: " << i << ", sub req probability : "
-                << bc->beamRequestsInfo[i].probs[j] << ", sub request id " << j
-                << ", parent id " << bc->beamRequestsInfo[i].parent_id[j]
-                << ", data inddd"
-                << req_index * BeamSearchBatchConfig::MAX_BEAM_WIDTH + j
-                << "\n";
+      // std::cout << "probbbb req: " << i << ", sub req probability : "
+      //           << bc->beamRequestsInfo[i].probs[j] << ", sub request id " <<
+      //           j
+      //           << ", parent id " << bc->beamRequestsInfo[i].parent_id[j]
+      //           << ", data inddd"
+      //           << req_index * BeamSearchBatchConfig::MAX_BEAM_WIDTH + j
+      //           << "\n";
     }
 
     // process tokens
@@ -584,7 +584,6 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
     max_heap_size = std::max(max_heap_size, beam_size * sub_requests[i]);
     max_beam_width = std::max(max_beam_width, beam_size);
 
-    std::cout << "max beam width: " << max_beam_width << "\n";
     req_index += 1;
     block_start_index += (sub_requests[i] - 1) * num_new_tokens * length;
   }
@@ -625,23 +624,23 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
                             cudaMemcpyHostToDevice,
                             stream));
   // trick, set acc_probs to 0;
-  checkCUDA(
-      cudaMemsetAsync(m->acc_probs, 1.0, max_total_requests * sizeof(DT), stream));
+  checkCUDA(cudaMemsetAsync(
+      m->acc_probs, 1.0, max_total_requests * sizeof(DT), stream));
   checkCUDA(cudaMemcpyAsync(m->block_start_index,
                             beam_block_start_index.data(),
                             sizeof(int) * beam_num_blocks,
                             cudaMemcpyHostToDevice,
                             stream));
   checkCUDA(cudaMemcpyAsync(m->request_id,
-                       request_id.data(),
-                       sizeof(int) * beam_num_blocks,
-                       cudaMemcpyHostToDevice,
-                       stream));
+                            request_id.data(),
+                            sizeof(int) * beam_num_blocks,
+                            cudaMemcpyHostToDevice,
+                            stream));
   checkCUDA(cudaMemcpyAsync(m->tokens_per_request,
-                       tokens_per_request.data(),
-                       sizeof(int) * beam_num_blocks,
-                       cudaMemcpyHostToDevice,
-                       stream));
+                            tokens_per_request.data(),
+                            sizeof(int) * beam_num_blocks,
+                            cudaMemcpyHostToDevice,
+                            stream));
   // int depth =
   //     bc->beamRequestsInfo[bc->tokensInfo[0].request_index].current_depth;
   beam_num_blocks = bc->num_active_tokens();
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 3b3879e8e5..cca0b230c3 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -106,7 +106,8 @@ __global__ void compute_attention_kernel_generation_kernel(
   // first WARPS_PER_BLOCK for store qk_max, second WARPS_PER_BLOCK for sum
   __shared__ float red_smem[WARPS_PER_BLOCK * 2];
 
-  const DT *q_ptr = query + batch_config_request_id * hidden_size * QKV_WEIGHT_NUM +
+  const DT *q_ptr = query +
+                    batch_config_request_id * hidden_size * QKV_WEIGHT_NUM +
                     head_idx * per_head_size;
   __shared__ Q_vec q_vecs[THREADS_PER_KEY][K_VECS_PER_THREAD];
   // DT const *q_ptr =
diff --git a/src/ops/kernels/embedding_kernels.cu b/src/ops/kernels/embedding_kernels.cu
index 6947be432e..22d8161ff1 100644
--- a/src/ops/kernels/embedding_kernels.cu
+++ b/src/ops/kernels/embedding_kernels.cu
@@ -118,7 +118,6 @@ void forward_kernel_wrapper(EmbeddingMeta const *m,
     // print_tensor<float>(output_ptr, output_domain.get_volume(),
     // "[Embedding:forward:output]");
   }
-  // print_tensor<int>(input.get_int32_ptr(), 200, "embeddinginput");
 }
 
 /*static*/
diff --git a/src/ops/spec_inc_multihead_self_attention.cc b/src/ops/spec_inc_multihead_self_attention.cc
index eb6fd721e6..5d234df822 100644
--- a/src/ops/spec_inc_multihead_self_attention.cc
+++ b/src/ops/spec_inc_multihead_self_attention.cc
@@ -53,7 +53,7 @@ bool SpecIncMultiHeadSelfAttentionParams::is_valid(
 }
 
 Tensor
-    FFModel::spec_inc_multihead_self_attention(const Tensor input,
+    FFModel::spec_inc_multihead_self_attention(Tensor const input,
                                                int embed_dim,
                                                int num_heads,
                                                int kdim,
@@ -91,7 +91,7 @@ Tensor
 }
 
 Tensor
-    FFModel::spec_inc_multiquery_self_attention(const Tensor input,
+    FFModel::spec_inc_multiquery_self_attention(Tensor const input,
                                                 int embed_dim,
                                                 int num_q_heads,
                                                 int num_kv_heads,
@@ -257,7 +257,7 @@ Op *SpecIncMultiHeadSelfAttention::create_operator_from_layer(
 SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     FFModel &model,
     LayerID const &_layer_guid,
-    const ParallelTensor _input,
+    ParallelTensor const _input,
     int _embed_dim,
     int _num_q_heads,
     int _num_kv_heads,
@@ -358,8 +358,8 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
 
 SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     FFModel &model,
-    const ParallelTensor _input,
-    const ParallelTensor _weight,
+    ParallelTensor const _input,
+    ParallelTensor const _weight,
     int _embed_dim,
     int _num_q_heads,
     int _num_kv_heads,
@@ -465,7 +465,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
 SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     FFModel &model,
     SpecIncMultiHeadSelfAttention const &other,
-    const ParallelTensor input,
+    ParallelTensor const input,
     bool allocate_weights)
     : SpecIncMultiHeadSelfAttention(model,
                                     other.layer_guid,
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 29e3d9a48d..b3a87fe244 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -23,16 +23,295 @@
 
 namespace FlexFlow {
 
+#define WARP_SIZE 32
+
 // declare Legion names
 using Legion::coord_t;
 using Legion::Memory;
 using namespace Kernels::IncMultiHeadAttention;
 
 namespace Kernels {
-namespace SpecIncMultiHeadAttention {
+namespace SpecIncMultiHeadSelfAttention {
+
+template <typename DT,
+          int THREADS_PER_BLOCK,
+          int Dh,
+          int Dh_MAX,
+          int THREADS_PER_KEY,
+          int THREADS_PER_VALUE>
+__global__ void compute_spec_inc_attention_kernel_generation_kernel(
+    DT const *query,
+    DT const *key_cache,
+    DT const *value_cache,
+    DT *output_ptr,
+    float const scale,
+    int const max_seq_length,
+    int per_head_size,
+    int hidden_size,
+    BatchConfig::PerRequestInfo *request_infos,
+    BeamSearchBatchConfig::BeamSearchPerRequestInfo *beam_request_infos,
+    BatchConfig::BitMask *causalMask) {
+
+  // q, k
+  using Q_vec = typename VEC_K<DT, THREADS_PER_KEY>::Type;
+  using K_vec = typename VEC_K<DT, THREADS_PER_KEY>::Type;
+  using V_vec = typename VEC_V<DT>::Type;
+  using Out_sum = typename Vec_fp32_<V_vec>::Type;
+
+  constexpr int WARPS_PER_BLOCK = THREADS_PER_BLOCK / WARP_SIZE;
+
+  constexpr int K_VEC_SIZE = sizeof(K_vec) / sizeof(DT);
+  constexpr int K_ELTS_PER_THREAD = Dh / THREADS_PER_KEY;
+  constexpr int K_VECS_PER_THREAD = K_ELTS_PER_THREAD / K_VEC_SIZE;
+  // constexpr int QK_ELTS_IN_16B = 16 / sizeof(DT);
+
+  // thread id
+  int const tidx = threadIdx.x;
+  // head id
+  int const head_idx = blockIdx.x;
+  // nth request idx
+  int const request_idx = blockIdx.y;
+
+  // request id in batch config
+  int const batch_config_request_id =
+      request_infos[request_idx].batch_config_request_id;
+
+  // request_idx = re
+
+  BatchConfig::BitMask bitmask = causalMask[batch_config_request_id];
+
+  int const first_step = 0;
+
+  int const tlength =
+      request_infos[batch_config_request_id].first_token_depth_in_request +
+      request_infos[batch_config_request_id].num_tokens_in_batch;
+
+  int const totalCacheSize = bitmask.non_tree_cache_size + bitmask.tree_size;
+
+  // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
+  //   printf("spec inc attn fused kernel %d, %d\n",
+  //          totalCacheSize,
+  //          request_infos[batch_config_request_id].num_tokens_in_batch);
+  // }
+  // int const qlength = request_infos[request_idx].num_tokens_in_batch;
+  int const tree_branch_num =
+      beam_request_infos[batch_config_request_id].sub_request_num;
+
+  // will decode qlength tokens in this thread block
+  // int const qlength = tree_branch_num;
+
+  int first_token_idx = 0;
+  for (int r = 0; r < request_idx; r++) {
+    first_token_idx += causalMask[r].this_layer_size;
+  }
+
+  // shared memory objects
+  extern __shared__ char smem_[];
+
+  float *qk_smem = reinterpret_cast<float *>(smem_);
+  float *out_smem = reinterpret_cast<float *>(smem_);
+
+  float qk_max = -FLT_MAX;
+
+  // first WARPS_PER_BLOCK for store qk_max, second WARPS_PER_BLOCK for sum
+  __shared__ float red_smem[WARPS_PER_BLOCK * 2];
+
+  const DT *q_ptr = query + first_token_idx * hidden_size * QKV_WEIGHT_NUM +
+                    head_idx * per_head_size;
+  __shared__ Q_vec q_vecs[THREADS_PER_KEY][K_VECS_PER_THREAD];
+
+  // the start offset of the element eg. (0, 1, 2, 3) * K_VEC_SIZE
+  int ki = tidx % THREADS_PER_KEY * K_VEC_SIZE;
+  int ki_o = tidx % THREADS_PER_KEY;
+  // the first key's offset for this thread
+  // ko = 0, 0, 0, 0, 1, 1, 1, 1, ....
+  int ko = tidx / THREADS_PER_KEY;
+  // load q tensor
+  Q_vec q_vec[K_VECS_PER_THREAD];
+
+  constexpr int K_PER_ITER = THREADS_PER_BLOCK / THREADS_PER_KEY;
+  // The number of keys per warp.
+  constexpr int K_PER_WARP = WARP_SIZE / THREADS_PER_KEY;
+
+  DT const *k_cache_batch =
+      key_cache + batch_config_request_id * max_seq_length * hidden_size + ki;
+
+  int ti_end =
+      div_up(totalCacheSize - first_step, K_PER_WARP) * K_PER_WARP + first_step;
+
+  for (int qi = 0; qi < tree_branch_num; qi += 1) {
+#pragma unroll
+    for (int ii = 0; ii < K_VECS_PER_THREAD; ++ii) {
+      q_vecs[ki_o][ii] = *reinterpret_cast<Q_vec const *>(
+          q_ptr + (hidden_size * QKV_WEIGHT_NUM * qi) + ki +
+          ii * THREADS_PER_KEY * K_VEC_SIZE);
+    }
+
+    int const query_token = bitmask.tree_size - tree_branch_num + qi;
+
+    __syncthreads();
+    for (int ti = ko; ti < ti_end; ti += K_PER_ITER) {
+      K_vec k[K_VECS_PER_THREAD];
+      int const ti_circ = ti % max_seq_length;
+
+      for (int ii = 0; ii < K_VECS_PER_THREAD; ++ii) {
+        int jj = ii * THREADS_PER_KEY * K_VEC_SIZE;
+        if (ti < totalCacheSize) {
+
+          k[ii] = *reinterpret_cast<K_vec const *>(
+              k_cache_batch + ti_circ * hidden_size + head_idx * per_head_size +
+              jj);
+        }
+      }
+      float qk = scale * Qk_dot<DT, THREADS_PER_KEY>::dot(q_vecs[ki_o], k);
+
+      if (ti < totalCacheSize && tidx % THREADS_PER_KEY == 0) {
+        // todo add alobi here
+        // bool const mask = ti_circ >= totalCacheSize;
+        bool const mask = (ti >= bitmask.non_tree_cache_size &&
+                           (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
+                              (1 << query_token))));
+
+        // if (blockIdx.y == 0 && blockIdx.x == 0 && !mask) {
+        //   printf("spec inc attn qkqkqk %d,  %.10f, %d\n", ti, qk, qi);
+        // }
+        qk_max = mask ? qk_max : fmaxf(qk_max, qk);
+        qk_smem[ti - first_step] = mask ? 0.f : qk;
+      }
+    }
+
+    __syncthreads();
+
+#pragma unroll
+    for (int mask = WARP_SIZE / 2; mask >= THREADS_PER_KEY; mask /= 2) {
+      qk_max = fmaxf(qk_max, __shfl_xor_sync(uint32_t(-1), qk_max, mask));
+    }
+
+    // Decompose the thread index into warp and lane.
+    int const warp = tidx / WARP_SIZE;
+    int const lane = tidx % WARP_SIZE;
+
+    // The warp leader writes the max to shared memory.
+    if (lane == 0) {
+      red_smem[warp] = qk_max;
+    }
+
+    // Make sure the products are in shared memory.
+    __syncthreads();
+
+    // The warps finalize the reduction.
+    qk_max = lane < WARPS_PER_BLOCK ? red_smem[lane] : -FLT_MAX;
+#pragma unroll
+    for (int mask = WARPS_PER_BLOCK / 2; mask >= 1; mask /= 2) {
+      qk_max = fmaxf(qk_max, __shfl_xor_sync(uint32_t(-1), qk_max, mask));
+    }
+
+    // Broadcast to all the threads in the warp.
+    qk_max = __shfl_sync(uint32_t(-1), qk_max, 0);
+
+    // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
+    //   printf("spec inc attn first token qk_max %.10f\n", qk_max);
+    // }
+
+    float exp_sum = 0.f;
+    for (int ti = first_step + tidx; ti < totalCacheSize;
+         ti += THREADS_PER_BLOCK) {
+      bool const mask = (ti >= bitmask.non_tree_cache_size &&
+                         (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
+                            (1 << query_token))));
+      float logit = mask ? 0.0f : __expf(qk_smem[ti - first_step] - qk_max);
+      exp_sum += logit;
+      qk_smem[ti - first_step] = mask ? 0.0f : logit;
+    }
+
+    // Compute the sum.
+    exp_sum = block_sum<WARPS_PER_BLOCK>(&red_smem[WARPS_PER_BLOCK], exp_sum);
+
+    // softmax
+    float inv_sum = __fdividef(1.f, exp_sum + 1.e-6);
+    for (int ti = first_step + tidx; ti < totalCacheSize;
+         ti += THREADS_PER_BLOCK) {
+      qk_smem[ti - first_step] *= inv_sum;
+    }
+
+    __syncthreads();
+
+    // value projection
+    constexpr int V_VEC_SIZE = 16 / sizeof(DT);
+    // A vector of V elements for the current timestep.
+    // using V_vec_k = typename V_vec_k_<DT, V_VEC_SIZE>::Type;
+    // using V_vec_acum = typename V_vec_acum_fp32_<V_vec_k>::Type;
+
+    // The value computed by this thread.
+    int vo = tidx / THREADS_PER_VALUE;
+    // The hidden dimensions computed by this particular thread.
+    int vi = tidx % THREADS_PER_VALUE * V_VEC_SIZE;
+    constexpr int V_PER_ITER = THREADS_PER_BLOCK / THREADS_PER_VALUE;
+
+    Out_sum out;
+    zero(out);
+
+    // The base pointer for the value in the cache buffer.
+    DT const *v_cache_batch =
+        value_cache + batch_config_request_id * max_seq_length * hidden_size +
+        vi;
+
+    if (Dh == Dh_MAX || vi < Dh) {
+      for (int ti = first_step + vo; ti < totalCacheSize; ti += V_PER_ITER) {
+        // Load the values from the cache.
+        int const ti_circ = ti % max_seq_length;
+        V_vec v = *reinterpret_cast<V_vec const *>(
+            v_cache_batch + ti_circ * hidden_size + head_idx * per_head_size);
+
+        bool const mask = (ti >= bitmask.non_tree_cache_size &&
+                           (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
+                              (1 << query_token))));
+        float logit = mask ? 0.0f : qk_smem[ti - first_step];
+        out = FlexFlow::fma(logit, cast_to_float(v), out);
+      }
+    }
+
+    //   // Make sure we can start writing to shared memory.
+    __syncthreads();
+
+    // Run the final reduction amongst the different groups computing different
+    // partial outputs.
+    if (Dh == Dh_MAX || vi < Dh) {
+#pragma unroll
+      for (int active_groups = V_PER_ITER; active_groups >= 2;
+           active_groups /= 2) {
+
+        // The midpoint in the number of active groups.
+        int midpoint = active_groups / 2;
+
+        // The upper part of active threads store to shared memory.
+        if (vo >= midpoint && vo < active_groups && (Dh == Dh_MAX || vi < Dh)) {
+          *reinterpret_cast<Out_sum *>(out_smem + (vo - midpoint) * Dh + vi) =
+              out;
+        }
+        __syncthreads();
+
+        // The bottom warps update their values.
+        if (vo < midpoint && (Dh == Dh_MAX || vi < Dh)) {
+          out = add(*reinterpret_cast<Out_sum const *>(out_smem + vo * Dh + vi),
+                    out);
+        }
+        __syncthreads();
+      }
+    }
+
+    // Output the final values.
+    if (vo == 0 && (Dh == Dh_MAX || vi < Dh)) {
+      convert_from_float(*reinterpret_cast<V_vec *>(
+                             output_ptr + (first_token_idx + qi) * hidden_size +
+                             head_idx * per_head_size + vi),
+                         out);
+    }
+  }
+}
 
 template <typename DT>
-__global__ void spec_store_kv_cache(
+__global__ void spec_inc_store_kv_cache(
     DT const *devQKVProjArray,
     DT *kCache_ptr,
     DT *vCache_ptr,
@@ -40,16 +319,16 @@ __global__ void spec_store_kv_cache(
     BatchConfig::PerRequestInfo *requestInfo,
     BeamSearchBatchConfig::BeamSearchPerTokenInfo *beamTokenInfos,
     BeamSearchBatchConfig::BeamSearchPerRequestInfo *beamRequestInfos,
+    BatchConfig::BitMask *causalMask,
     int qProjSize,
     int kProjSize,
     int vProjSize,
     int num_tokens,
     int max_seq_len,
-    int max_beam_width,
     bool is_root,
     int hidden_size) {
-  CUDA_KERNEL_LOOP(i, num_tokens * hidden_size * 2) {
-    int token_idx = i / (hidden_size * KV_WEIGHT_NUM);
+  CUDA_KERNEL_LOOP(i, num_tokens * hidden_size) {
+    int token_idx = i / (hidden_size);
     int offset = i % hidden_size;
 
     size_t val_idx =
@@ -58,100 +337,36 @@ __global__ void spec_store_kv_cache(
     DT kVal = devQKVProjArray[val_idx];
     DT vVal = devQKVProjArray[val_idx + hidden_size];
 
-    // above no need to be changed
-    // int const req_id = id_map[token_idx].request_index;
-    // int const tok_id = id_map[token_idx].token_position;
-    // int const sub_req_id = id_map[token_idx].sub_request_index;
-    // int const parent_id = id_map[token_idx].parent_id;
-    // int const beam_depth = id_map[token_idx].beam_depth;
-    // int const beam_width = id_map[token_idx].beam_width;
-
     int const req_id = tokenInfos[token_idx].request_index;
     int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
+    int const first_token_in_req =
+        requestInfo[req_id].first_token_depth_in_request;
     int const sub_req_id = beamTokenInfos[token_idx].sub_request_index;
-    int const parent_id = beamRequestInfos[req_id].parent_id[sub_req_id];
-    int const beam_depth = beamRequestInfos[req_id].current_depth;
-    int const beam_width = beamRequestInfos[req_id].beam_size;
-
-    kCache_ptr[(req_id * max_beam_width + sub_req_id) *
-                   (hidden_size * max_seq_len) +
-               tok_id * hidden_size + offset] = kVal;
-    vCache_ptr[(req_id * max_beam_width + sub_req_id) *
-                   (hidden_size * max_seq_len) +
-               tok_id * hidden_size + offset] = vVal;
-
-    // replica in the root iteration
-    if (beam_depth == 1) {
-      for (int i = 1; i < beam_width; i++) {
-        kCache_ptr[(req_id * max_beam_width + i) * (hidden_size * max_seq_len) +
-                   tok_id * hidden_size + offset] = kVal;
-        vCache_ptr[(req_id * max_beam_width + i) * (hidden_size * max_seq_len) +
-                   tok_id * hidden_size + offset] = vVal;
-      }
-    }
+    int const total_token = requestInfo[req_id].num_tokens_in_batch;
 
-    // if (head_idx == 0 && beam_depth == 0 && token_idx == 8 && k_cache) {
-    //   // printf("token idx %d\n", token_idx);
-    //   printf("data idx: %d, tok_id %d, new_token_cache_idx %d, parent_id %d,
-    //   "
-    //          "sub_req_id %d, num_tokens %d, kProjSize %d, num_kv_heads %d,
-    //          val "
-    //          "%f, beam_width %d\n",
-    //          data_idx,
-    //          tok_id,
-    //          new_token_cache_idx,
-    //          parent_id,
-    //          sub_req_id,
-    //          num_tokens,
-    //          kProjSize,
-    //          num_kv_heads,
-    //          val,
-    //          beam_width);
-    // }
+    int const request_token_offset =
+        requestInfo[req_id].first_token_offset_in_batch;
 
-    // naive cache stealing
-    if (sub_req_id != parent_id) {
-      // if (offset == 0 && tok_id == 0) {
-      //   printf("cache stealing!, depth %d req_id %d sub_req_id %d, parentid "
-      //          "%d, tok_id %d\n",
-      //          beam_depth,
-      //          req_id,
-      //          sub_req_id,
-      //          parent_id,
-      //          tok_id);
-      // }
-
-      for (int depth = 0; depth < beam_depth; depth++) {
-        int steal_token_idx = tok_id - beam_depth + depth;
-        int steal_from_idx = (req_id * max_beam_width + parent_id) *
-                                 (hidden_size * max_seq_len) +
-                             steal_token_idx * hidden_size + offset;
-        int steal_to_idx = (req_id * max_beam_width + sub_req_id) *
-                               (hidden_size * max_seq_len) +
-                           steal_token_idx * hidden_size + offset;
-        kCache_ptr[steal_to_idx] = kCache_ptr[steal_from_idx];
-        vCache_ptr[steal_to_idx] = vCache_ptr[steal_from_idx];
-
-        //   if(data_idx == 0 && head_idx == 0 && k_cache && req_id == 1){
-        //     printf("cache stealing kernel!, steal_token_idx %d\n",
-        //     steal_token_idx);
-        // }
-      }
-    }
+    BatchConfig::BitMask bitmask = causalMask[req_id];
 
-    // parallel cache stealing not yet implemented
-    // logic shld be
-    // launch spec_store_kv_cache with parallelism * current depth
-    // from the i here, get depth index
-    // if depth index not the current one, check if we need to steal
-    // steal if needed
-
-    // cache stealing theory
-    // identify which sub request does this token come from
-    // for initial token, 0
-    // for other, may 0,0,1/ 0,1,2/ 1,1,1 to get which cache to be reuse and
-    // which to be delete copy beam_size bunch of blocks when sub_req_id ==
-    // parent_id : like 0 -> 0, 1->1, 2->2, do nothing, just append the new k/v
+    int const sub_request_num = beamRequestInfos[req_id].sub_request_num;
+
+    int const tree_branch_num = beamRequestInfos[req_id].sub_request_num;
+
+    // int const query_token = bitmask.non_tree_cache_size + bitmask.tree_size -
+    //                         tree_branch_num + sub_req_id + tok_id;
+    // bitmask.tree_size - tree_branch_num + sub_req_id;
+
+    // if prompt token -> token id
+    // if tree token:
+    int const cache_idx = bitmask.non_tree_cache_size + bitmask.tree_size -
+                          bitmask.this_layer_size + token_idx -
+                          request_token_offset;
+
+    kCache_ptr[req_id * (hidden_size * max_seq_len) + (cache_idx)*hidden_size +
+               offset] = kVal;
+    vCache_ptr[req_id * (hidden_size * max_seq_len) + (cache_idx)*hidden_size +
+               offset] = vVal;
   }
 }
 
@@ -161,28 +376,79 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                             cudaStream_t stream) {
   int num_tokens = bc->num_active_tokens();
   int curr_depth = bc->beamRequestsInfo[0].current_depth;
-  // printf("curr depth: %d\n", curr_depth);
-  // assert(curr_depth < 3);
   if (num_tokens > 0) {
     int parallelism = m->hidden_size * KV_WEIGHT_NUM * num_tokens;
-    spec_store_kv_cache<<<GET_BLOCKS(parallelism),
-                          min(CUDA_NUM_THREADS, parallelism),
-                          0,
-                          stream>>>(static_cast<DT *>(m->devQKVProjArray),
-                                    static_cast<DT *>(m->keyCache),
-                                    static_cast<DT *>(m->valueCache),
-                                    m->token_infos,
-                                    m->request_infos,
-                                    m->beam_token_infos,
-                                    m->beam_request_infos,
-                                    m->qProjSize,
-                                    m->kProjSize,
-                                    m->vProjSize,
-                                    num_tokens,
-                                    BatchConfig::max_sequence_length(),
-                                    BeamSearchBatchConfig::MAX_BEAM_WIDTH,
-                                    /*root*/ curr_depth == 0,
-                                    m->hidden_size);
+    spec_inc_store_kv_cache<<<GET_BLOCKS(parallelism),
+                               min(CUDA_NUM_THREADS, parallelism),
+                               0,
+                               stream>>>(
+        static_cast<DT *>(m->devQKVProjArray),
+        static_cast<DT *>(m->keyCache),
+        static_cast<DT *>(m->valueCache),
+        m->token_infos,
+        m->request_infos,
+        m->beam_token_infos,
+        m->beam_request_infos,
+        m->causalMask,
+        m->qProjSize,
+        m->kProjSize,
+        m->vProjSize,
+        num_tokens,
+        BatchConfig::max_sequence_length() +
+            BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,
+        /*root*/ curr_depth == 0,
+        m->hidden_size);
+  }
+}
+
+#define LAUNCH_SPEC_INC_ATTENTION_SCORE_KERNEL(                               \
+    DT, Dh, Dh_MAX, THDS_PER_KEY, THREADS_PER_VALUE, THDS_PER_BLOCK, stream)   \
+  smem_sz = smem_size_in_bytes<DT>(m->qProjSize,                               \
+                                   BatchConfig::max_sequence_length() +        \
+                                       BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,   \
+                                   THREADS_PER_VALUE,                          \
+                                   THDS_PER_BLOCK);                            \
+  compute_spec_inc_attention_kernel_generation_kernel<DT,                     \
+                                                       THDS_PER_BLOCK,         \
+                                                       Dh,                     \
+                                                       Dh_MAX,                 \
+                                                       THDS_PER_KEY,           \
+                                                       THREADS_PER_VALUE>      \
+      <<<grid, THDS_PER_BLOCK, smem_sz, stream>>>(                             \
+          static_cast<DT *>(m->devQKVProjArray),                               \
+          static_cast<DT *>(m->keyCache),                                      \
+          static_cast<DT *>(m->valueCache),                                    \
+          output_ptr,                                                          \
+          scale,                                                               \
+          BatchConfig::max_sequence_length() +                                 \
+              BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,                            \
+          m->qProjSize,                                                        \
+          m->hidden_size,                                                      \
+          m->request_infos,                                                    \
+          m->beam_request_infos,                                               \
+          m->causalMask)
+
+template <typename DT>
+void compute_spec_inc_attention_kernel_generation(
+    SpecIncMultiHeadSelfAttentionMeta const *m,
+    BeamSearchBatchConfig const *bc,
+    DT *output_ptr,
+    cudaStream_t stream) {
+  // one block == one head per request
+  dim3 grid(m->num_q_heads, bc->num_active_requests());
+  int const per_head_size = m->qProjSize;
+  float scale = (*m->qk_prod_scaling) ? 1.0f / sqrt(m->kProjSize) : 1.0f;
+  size_t smem_sz;
+  if (per_head_size == 64) {
+    constexpr int THREADS_PER_VALUE_64 = threads_per_value_t<DT, 64>::value;
+    LAUNCH_SPEC_INC_ATTENTION_SCORE_KERNEL(
+        DT, 64, 64, 4, THREADS_PER_VALUE_64, 128, stream);
+  } else if (per_head_size == 128) {
+    constexpr int THREADS_PER_VALUE_128 = threads_per_value_t<DT, 128>::value;
+    LAUNCH_SPEC_INC_ATTENTION_SCORE_KERNEL(
+        DT, 128, 128, 4, THREADS_PER_VALUE_128, 128, stream);
+  } else {
+    assert(false && "a unsupported head size");
   }
 }
 
@@ -204,13 +470,14 @@ __global__ void spec_fill_entries_above_diagonal(DT *matrix,
 }
 
 template <typename DT>
-void compute_attention_kernel_prompt(SpecIncMultiHeadSelfAttentionMeta const *m,
-                                     BeamSearchBatchConfig const *bc,
-                                     int shard_id,
-                                     DT *output_ptr,
-                                     DT const *bias_ptr,
-                                     DT const *weight_ptr,
-                                     cudaStream_t stream) {
+void compute_attention_kernel_prompt(
+    SpecIncMultiHeadSelfAttentionMeta const *m,
+    BeamSearchBatchConfig const *bc,
+    int shard_id,
+    DT *output_ptr,
+    DT const *bias_ptr,
+    DT const *weight_ptr,
+    cudaStream_t stream) {
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
   cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
@@ -236,199 +503,208 @@ void compute_attention_kernel_prompt(SpecIncMultiHeadSelfAttentionMeta const *m,
   int q_block_size = m->qProjSize;
 
   int kt_block_size = m->kProjSize;
-  int kt_req_block_size =
-      kt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+  int kt_req_block_size = kt_block_size * m->num_q_heads *
+                          (BatchConfig::max_sequence_length() +
+                           BatchConfig::MAX_SPEC_TREE_TOKEN_NUM);
   int vt_block_size = m->vProjSize;
-  int vt_req_block_size =
-      vt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+  int vt_req_block_size = vt_block_size * m->num_q_heads *
+                          (BatchConfig::max_sequence_length() +
+                           BatchConfig::MAX_SPEC_TREE_TOKEN_NUM);
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
     if (bc->request_completed[i]) {
       continue;
     }
-    for (int sub_req_id = 0; sub_req_id < bc->sub_requests[i]; sub_req_id++) {
-      // int num_new_tokens = bc->num_processing_tokens[i];
-      // int total_tokens = bc->token_last_available_idx[i] + 1;
+    // else if (tokens_previous_requests < bc->num_generation_tokens) {
+    //   tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
+    //   continue;
+    // }
 
-      int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
-      int total_tokens = bc->requestsInfo[i].first_token_depth_in_request +
-                         bc->requestsInfo[i].num_tokens_in_batch;
+    // all requests in prompt phase should only have one sub requests;
+    assert(bc->sub_requests[i] == 1);
+    // int num_new_tokens = bc->num_processing_tokens[i];
+    // int total_tokens = bc->token_last_available_idx[i] + 1;
 
-      if (num_new_tokens <= 0) {
-        continue;
-      }
+    int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+    int total_tokens = bc->requestsInfo[i].first_token_depth_in_request +
+                       bc->requestsInfo[i].num_tokens_in_batch;
 
-      // Compute (QK^T/sqrt(d_k))
-      int m_ = num_new_tokens;
-      int n = total_tokens;
-      int k = m->qProjSize;
-      int lda = k * m->num_q_heads * QKV_WEIGHT_NUM, ldb = k * m->num_q_heads,
-          ldc = m_;
-      int strideA = q_block_size;
-      int strideB = kt_block_size;
-      int strideC = num_new_tokens * total_tokens;
-
-      // a flag of using this scaling alpha
-      DT alpha = 1.0f, beta = 0.0f;
-      if (*m->qk_prod_scaling) {
-        alpha = static_cast<DT>(1.0f / sqrt(m->kProjSize));
-      }
-      // To get A, skip over Q entries from previous requests (same head)
-      DT const *A = static_cast<DT *>(m->devQKVProjArray) +
-                    bc->requestsInfo[i].first_token_offset_in_batch *
-                        m->qProjSize * m->num_q_heads * QKV_WEIGHT_NUM;
-      // To get B, skip over K entries from previous requests (all heads +
-      // padding)
-      DT const *B = static_cast<DT *>(m->keyCache) +
-                    (i * bc->MAX_BEAM_WIDTH + sub_req_id) * kt_req_block_size;
-
-      // if (i == 0 && sub_req_id == 0 &&
-      //     bc->beam_slots.at(0).current_depth == 1) {
-      //   int offset = (float *)B - m->keyCache;
-      //   printf("key cache offset %d\n", kt_req_block_size);
-      // }
-      // To get C, skip over QK^T products from previous requests
-      DT *C = static_cast<DT *>(m->qk_prods) +
-              m->num_q_heads * tokens_prev_requests_squares;
-      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                           CUBLAS_OP_T,
-                                           CUBLAS_OP_N,
-                                           m_,
-                                           n,
-                                           k,
-                                           &alpha,
-                                           A,
-                                           cublas_data_type,
-                                           lda,
-                                           strideA,
-                                           B,
-                                           cublas_data_type,
-                                           ldb,
-                                           strideB,
-                                           &beta,
-                                           C,
-                                           cublas_data_type,
-                                           ldc,
-                                           strideC,
-                                           m->num_q_heads,
-                                           compute_type,
-                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-      // add alibi position bias to qk production
-      // add alibi position bias to qk production
-      if (*m->position_bias) {
-        size_t parallelism = m->num_q_heads * total_tokens * num_new_tokens;
-        apply_position_bias_qkprd<<<GET_BLOCKS(parallelism),
-                                    min((size_t)CUDA_NUM_THREADS, parallelism),
-                                    0,
-                                    stream>>>(C,
-                                              num_new_tokens,
-                                              total_tokens,
-                                              m->num_q_heads,
-                                              m->global_num_q_heads,
-                                              shard_id);
-      }
-      // Fill all elements above diagonal in qk prods with -inf to force
-      // causal attention.
-      assert(num_new_tokens <= total_tokens);
-      if (num_new_tokens > 1) {
-        size_t parallelism = m->num_q_heads * num_new_tokens * total_tokens;
-        spec_fill_entries_above_diagonal<<<GET_BLOCKS(parallelism),
-                                           min((size_t)CUDA_NUM_THREADS,
-                                               parallelism),
-                                           0,
-                                           stream>>>(
-            C,
-            num_new_tokens,
-            total_tokens,
-            m->num_q_heads,
-            static_cast<DT>(-INFINITY));
-      }
-      // Compute Softmax(QK^T/sqrt(d_k))
-      // Before modifying the parameters below, make sure to read the following
-      // description of the CUDNN_TENSOR_NCHW tensor layout, from
-      // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#cudnnTensorFormat_t:
-      // This tensor format specifies that the data is laid out in the following
-      // order: batch size, feature maps, rows, columns. The strides are
-      // implicitly defined in such a way that the data are contiguous in memory
-      // with no padding between images, feature maps, rows, and columns; the
-      // columns are the inner dimension and the images are the outermost
-      // dimension.
-      int n_param = m->num_q_heads;
-      int c_param = total_tokens;
-      int h_param = 1;
-      int w_param = num_new_tokens;
-      checkCUDNN(cudnnSetTensor4dDescriptor(m->qk_tensor,
-                                            CUDNN_TENSOR_NCHW,
-                                            cudnn_data_type,
-                                            n_param,
-                                            c_param,
-                                            h_param,
-                                            w_param));
-      float softmax_alpha = 1.0f, softmax_beta = 0.0f;
-      DT *C_softmax = static_cast<DT *>(m->qk_prods_softmax) +
-                      m->num_q_heads * tokens_prev_requests_squares;
-      // The softmax operation below is executed according to the
-      // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
-      // softmax operation is computed per spatial location (H,W) per image (N)
-      // across dimension C.
-      checkCUDNN(cudnnSoftmaxForward(m->handle.dnn,
-                                     CUDNN_SOFTMAX_ACCURATE,
-                                     CUDNN_SOFTMAX_MODE_CHANNEL,
-                                     &softmax_alpha,
-                                     m->qk_tensor,
-                                     C,
-                                     &softmax_beta,
-                                     m->qk_tensor,
-                                     C_softmax));
-      // Matmul softmax(QK^T/sqrt(d_k)) by V
-      alpha = 1.0f, beta = 0.0f;
-      m_ = m->vProjSize;
-      n = num_new_tokens;
-      k = total_tokens;
-      lda = m_ * m->num_q_heads, ldb = n, ldc = m_ * m->num_q_heads;
-      strideA = vt_block_size;
-      strideB = num_new_tokens * total_tokens;
-      strideC = m->vProjSize;
-      // To get A, skip over V^T entries from previous requests (all heads +
-      // padding)
-      A = static_cast<DT *>(m->valueCache) +
-          (i * bc->MAX_BEAM_WIDTH + sub_req_id) * vt_req_block_size;
-      // To get B, skip over softmax(QK^T/sqrt(d_k)) entries from previous
-      // requests (all heads)
-      B = C_softmax;
-      // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
-      // requests
-      C = static_cast<DT *>(m->attn_heads) +
-          (tokens_previous_requests + bc->num_generation_tokens) *
-              m->num_q_heads * m->vProjSize;
-      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                           CUBLAS_OP_N,
-                                           CUBLAS_OP_T,
-                                           m_,
-                                           n,
-                                           k,
-                                           &alpha,
-                                           A,
-                                           cublas_data_type,
-                                           lda,
-                                           strideA,
-                                           B,
-                                           cublas_data_type,
-                                           ldb,
-                                           strideB,
-                                           &beta,
-                                           C,
-                                           cublas_data_type,
-                                           ldc,
-                                           strideC,
-                                           m->num_q_heads,
-                                           compute_type,
-                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-
-      tokens_previous_requests += num_new_tokens;
-      tokens_prev_requests_squares += num_new_tokens * total_tokens;
+    if (num_new_tokens <= 0) {
+      continue;
+    }
+
+    // Compute (QK^T/sqrt(d_k))
+    int m_ = num_new_tokens;
+    int n = total_tokens;
+    int k = m->qProjSize;
+    int lda = k * m->num_q_heads * QKV_WEIGHT_NUM, ldb = k * m->num_q_heads,
+        ldc = m_;
+    int strideA = q_block_size;
+    int strideB = kt_block_size;
+    int strideC = num_new_tokens * total_tokens;
+
+    // a flag of using this scaling alpha
+    DT alpha = 1.0f, beta = 0.0f;
+    if (*m->qk_prod_scaling) {
+      alpha = static_cast<DT>(1.0f / sqrt(m->kProjSize));
+    }
+    // To get A, skip over Q entries from previous requests (same head)
+    DT const *A = static_cast<DT *>(m->devQKVProjArray) +
+                  bc->requestsInfo[i].first_token_offset_in_batch *
+                      m->qProjSize * m->num_q_heads * QKV_WEIGHT_NUM;
+    // To get B, skip over K entries from previous requests (all heads +
+    // padding)
+
+    // print_tensor<float>((float*)A, 32, "A");
+    DT const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
+
+    // if (i == 0 && sub_req_id == 0 &&
+    //     bc->beam_slots.at(0).current_depth == 1) {
+    //   int offset = (float *)B - m->keyCache;
+    //   printf("key cache offset %d\n", kt_req_block_size);
+    // }
+    // To get C, skip over QK^T products from previous requests
+    DT *C = static_cast<DT *>(m->qk_prods) +
+            m->num_q_heads * tokens_prev_requests_squares;
+    checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                         CUBLAS_OP_T,
+                                         CUBLAS_OP_N,
+                                         m_,
+                                         n,
+                                         k,
+                                         &alpha,
+                                         A,
+                                         cublas_data_type,
+                                         lda,
+                                         strideA,
+                                         B,
+                                         cublas_data_type,
+                                         ldb,
+                                         strideB,
+                                         &beta,
+                                         C,
+                                         cublas_data_type,
+                                         ldc,
+                                         strideC,
+                                         m->num_q_heads,
+                                         compute_type,
+                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+    // print_tensor<float>((float*)C, 32, "C");
+    // add alibi position bias to qk production
+    // add alibi position bias to qk production
+    if (*m->position_bias) {
+      size_t parallelism = m->num_q_heads * total_tokens * num_new_tokens;
+      apply_position_bias_qkprd<<<GET_BLOCKS(parallelism),
+                                  min((size_t)CUDA_NUM_THREADS, parallelism),
+                                  0,
+                                  stream>>>(C,
+                                            num_new_tokens,
+                                            total_tokens,
+                                            m->num_q_heads,
+                                            m->global_num_q_heads,
+                                            shard_id);
     }
+    // Fill all elements above diagonal in qk prods with -inf to force
+    // causal attention.
+    assert(num_new_tokens <= total_tokens);
+    if (num_new_tokens > 1) {
+      size_t parallelism = m->num_q_heads * num_new_tokens * total_tokens;
+      spec_fill_entries_above_diagonal<<<GET_BLOCKS(parallelism),
+                                         min((size_t)CUDA_NUM_THREADS,
+                                             parallelism),
+                                         0,
+                                         stream>>>(C,
+                                                   num_new_tokens,
+                                                   total_tokens,
+                                                   m->num_q_heads,
+                                                   static_cast<DT>(-INFINITY));
+    }
+    // Compute Softmax(QK^T/sqrt(d_k))
+    // Before modifying the parameters below, make sure to read the following
+    // description of the CUDNN_TENSOR_NCHW tensor layout, from
+    // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#cudnnTensorFormat_t:
+    // This tensor format specifies that the data is laid out in the following
+    // order: batch size, feature maps, rows, columns. The strides are
+    // implicitly defined in such a way that the data are contiguous in memory
+    // with no padding between images, feature maps, rows, and columns; the
+    // columns are the inner dimension and the images are the outermost
+    // dimension.
+    int n_param = m->num_q_heads;
+    int c_param = total_tokens;
+    int h_param = 1;
+    int w_param = num_new_tokens;
+    checkCUDNN(cudnnSetTensor4dDescriptor(m->qk_tensor,
+                                          CUDNN_TENSOR_NCHW,
+                                          cudnn_data_type,
+                                          n_param,
+                                          c_param,
+                                          h_param,
+                                          w_param));
+    float softmax_alpha = 1.0f, softmax_beta = 0.0f;
+    DT *C_softmax = static_cast<DT *>(m->qk_prods_softmax) +
+                    m->num_q_heads * tokens_prev_requests_squares;
+    // The softmax operation below is executed according to the
+    // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
+    // softmax operation is computed per spatial location (H,W) per image (N)
+    // across dimension C.
+    checkCUDNN(cudnnSoftmaxForward(m->handle.dnn,
+                                   CUDNN_SOFTMAX_ACCURATE,
+                                   CUDNN_SOFTMAX_MODE_CHANNEL,
+                                   &softmax_alpha,
+                                   m->qk_tensor,
+                                   C,
+                                   &softmax_beta,
+                                   m->qk_tensor,
+                                   C_softmax));
+    // Matmul softmax(QK^T/sqrt(d_k)) by V
+    alpha = 1.0f, beta = 0.0f;
+    m_ = m->vProjSize;
+    n = num_new_tokens;
+    k = total_tokens;
+    lda = m_ * m->num_q_heads, ldb = n, ldc = m_ * m->num_q_heads;
+    strideA = vt_block_size;
+    strideB = num_new_tokens * total_tokens;
+    strideC = m->vProjSize;
+    // To get A, skip over V^T entries from previous requests (all heads +
+    // padding)
+    A = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
+    // To get B, skip over softmax(QK^T/sqrt(d_k)) entries from previous
+    // requests (all heads)
+    B = C_softmax;
+    // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
+    // requests
+
+    // print_tensor<float>((float*)C_softmax, 32, "C_softmax");
+    C = static_cast<DT *>(m->attn_heads) +
+        (tokens_previous_requests + bc->num_generation_tokens) *
+            m->num_q_heads * m->vProjSize;
+    checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                         CUBLAS_OP_N,
+                                         CUBLAS_OP_T,
+                                         m_,
+                                         n,
+                                         k,
+                                         &alpha,
+                                         A,
+                                         cublas_data_type,
+                                         lda,
+                                         strideA,
+                                         B,
+                                         cublas_data_type,
+                                         ldb,
+                                         strideB,
+                                         &beta,
+                                         C,
+                                         cublas_data_type,
+                                         ldc,
+                                         strideC,
+                                         m->num_q_heads,
+                                         compute_type,
+                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
+    tokens_previous_requests += num_new_tokens;
+    tokens_prev_requests_squares += num_new_tokens * total_tokens;
   }
 
   // assert(tokens_previous_requests == num_tokens);
@@ -443,31 +719,8 @@ void inference_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                       DT *output_ptr,
                       DT const *bias_ptr,
                       cudaStream_t stream) {
-  // here because we need postion info in infernece 1
-  cudaMemcpyAsync(m->token_infos,
-                  &(bc->tokensInfo),
-                  bc->num_active_tokens() * sizeof(BatchConfig::PerTokenInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
-  cudaMemcpyAsync(m->request_infos,
-                  &(bc->requestsInfo),
-                  bc->max_requests_per_batch() *
-                      sizeof(BatchConfig::PerRequestInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
-  cudaMemcpyAsync(m->beam_token_infos,
-                  &(bc->beamTokenInfo),
-                  bc->num_active_tokens() * bc->MAX_BEAM_WIDTH *
-                      sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
-  cudaMemcpyAsync(m->beam_request_infos,
-                  &(bc->beamRequestsInfo),
-                  bc->max_requests_per_batch() *
-                      sizeof(BeamSearchBatchConfig::BeamSearchPerRequestInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
   // phase 1: Implement kernel to compute KQV for input tokens
+
   compute_qkv_kernel(m,
                      bc,
                      shard_id,
@@ -479,7 +732,7 @@ void inference_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   // phase 2: Update key/val cache
   update_kv_cache_kernel<DT>(m, bc, stream);
   if (bc->num_generation_tokens > 0) {
-    compute_attention_kernel_generation<DT>(
+    compute_spec_inc_attention_kernel_generation<DT>(
         m, bc, static_cast<DT *>(m->attn_heads), stream);
   }
   // phase 3: Compute attention score
@@ -488,16 +741,14 @@ void inference_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
     compute_attention_kernel_prompt(
         m, bc, shard_id, output_ptr, bias_ptr, weight_ptr, stream);
   }
-
   // compute output production and bias together for all tokens
-  int num_tokens =
-      bc->num_active_tokens() * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+  int num_tokens = bc->num_active_tokens();
 
   compute_o_prod_bias(
       m, bc, shard_id, output_ptr, weight_ptr, bias_ptr, num_tokens, stream);
 }
 
-} // namespace SpecIncMultiHeadAttention
+} // namespace SpecIncMultiHeadSelfAttention
 } // namespace Kernels
 
 /*static*/
@@ -529,25 +780,27 @@ void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
   if (input.data_type == DT_HALF) {
     half const *bias_ptr =
         use_bias ? bias.get_half_ptr() : static_cast<half const *>(nullptr);
-    Kernels::SpecIncMultiHeadAttention::inference_kernel(m,
-                                                         bc,
-                                                         shard_id,
-                                                         input.get_half_ptr(),
-                                                         weight.get_half_ptr(),
-                                                         output.get_half_ptr(),
-                                                         bias_ptr,
-                                                         stream);
+    Kernels::SpecIncMultiHeadSelfAttention::inference_kernel(
+        m,
+        bc,
+        shard_id,
+        input.get_half_ptr(),
+        weight.get_half_ptr(),
+        output.get_half_ptr(),
+        bias_ptr,
+        stream);
   } else if (input.data_type == DT_FLOAT) {
     float const *bias_ptr =
         use_bias ? bias.get_float_ptr() : static_cast<float const *>(nullptr);
-    Kernels::SpecIncMultiHeadAttention::inference_kernel(m,
-                                                         bc,
-                                                         shard_id,
-                                                         input.get_float_ptr(),
-                                                         weight.get_float_ptr(),
-                                                         output.get_float_ptr(),
-                                                         bias_ptr,
-                                                         stream);
+    Kernels::SpecIncMultiHeadSelfAttention::inference_kernel(
+        m,
+        bc,
+        shard_id,
+        input.get_float_ptr(),
+        weight.get_float_ptr(),
+        output.get_float_ptr(),
+        bias_ptr,
+        stream);
   } else {
     assert(false && "Unspported data type");
   }
@@ -559,7 +812,8 @@ void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
     checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
     cudaEventDestroy(t_start);
     cudaEventDestroy(t_end);
-    printf("SpecIncMultiHeadSelfAttention forward time = %.2fms\n", elapsed);
+    printf("SpecIncMultiHeadSelfAttention forward time = %.2fms\n",
+           elapsed);
     // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
     // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
     // acc_output.rect, "[Attention:forward:output]");
@@ -606,44 +860,51 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
 
   // allocate memory for the seqArray and reserve space
   {
-    int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
-    size_t beam_tokeninfo_size =
-        max_tokens_per_batch * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
-    size_t requestinfo_size = BeamSearchBatchConfig::max_requests_per_batch();
-    size_t beam_requestinfo_size =
-        BeamSearchBatchConfig::max_requests_per_batch();
-    size_t total_size =
-        beam_tokeninfo_size *
-            sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo) +
-        beam_requestinfo_size *
-            sizeof(BeamSearchBatchConfig::
-                       BeamSearchPerRequestInfo); // more components will
-                                                  // be added here later
-
-    // We always directly allocate memory for small speculative models
-    gpu_mem_allocator.create_legion_instance(beam_search_reserve_inst,
-                                             total_size);
+    // size_t causal_mask_size = BatchConfig::MAX_NUM_REQUESTS;
+    // size_t total_size = causal_mask_size * sizeof(BatchConfig::BitMask);
+    // gpu_mem_allocator.create_legion_instance(beam_search_reserve_inst,
+    //                                          total_size);
+
     beam_token_infos =
-        gpu_mem_allocator
-            .allocate_instance<BeamSearchBatchConfig::BeamSearchPerTokenInfo>(
-                beam_tokeninfo_size);
+        static_cast<BeamSearchBatchConfig::BeamSearchPerTokenInfo *>(
+            handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
+            sizeof(BatchConfig::requestsInfo));
+
+    beam_request_infos =
+        static_cast<BeamSearchBatchConfig::BeamSearchPerRequestInfo *>(
+            handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
+            sizeof(BatchConfig::requestsInfo) +
+            sizeof(BeamSearchBatchConfig::beamTokenInfo));
+    causalMask = static_cast<BatchConfig::BitMask *>(
+        handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
+        sizeof(BatchConfig::requestsInfo) +
+        sizeof(BeamSearchBatchConfig::beamTokenInfo) +
+        sizeof(BeamSearchBatchConfig::beamRequestsInfo));
+
+    // causalMask = gpu_mem_allocator.allocate_instance<BatchConfig::BitMask>(
+    //     causal_mask_size);
+    // beam_token_infos =
+    //     gpu_mem_allocator
+    //         .allocate_instance<BeamSearchBatchConfig::BeamSearchPerTokenInfo>(
+    //             beam_tokeninfo_size);
     // offset += beam_tokeninfo_size *
     //           sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo);
-    beam_request_infos =
-        gpu_mem_allocator
-            .allocate_instance<BeamSearchBatchConfig::BeamSearchPerRequestInfo>(
-                beam_requestinfo_size);
+    // beam_request_infos =
+    //     gpu_mem_allocator
+    //         .allocate_instance<BeamSearchBatchConfig::BeamSearchPerRequestInfo>(
+    //             beam_requestinfo_size);
     // offset += beam_requestinfo_size *
     //           sizeof(BeamSearchBatchConfig::BeamSearchPerRequestInfo);
     // assert(offset == total_size);
-    assert(gpu_mem_allocator.instance_total_size ==
-           gpu_mem_allocator.instance_allocated_size);
+    // assert(gpu_mem_allocator.instance_total_size ==
+    //        gpu_mem_allocator.instance_allocated_size);
   }
 
   cudaStreamSynchronize(stream);
 }
 
-SpecIncMultiHeadSelfAttentionMeta::~SpecIncMultiHeadSelfAttentionMeta(void) {
+SpecIncMultiHeadSelfAttentionMeta::~SpecIncMultiHeadSelfAttentionMeta(
+    void) {
   if (beam_search_reserve_inst != Realm::RegionInstance::NO_INST) {
     beam_search_reserve_inst.destroy();
   }
diff --git a/src/ops/specinfer_inc_multihead_self_attention.cc b/src/ops/specinfer_inc_multihead_self_attention.cc
deleted file mode 100644
index 42074f39e4..0000000000
--- a/src/ops/specinfer_inc_multihead_self_attention.cc
+++ /dev/null
@@ -1,883 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-
-#include "flexflow/ops/specinfer_inc_multihead_self_attention.h"
-#include "flexflow/ffconst_utils.h"
-#include "flexflow/model.h"
-#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
-#include "flexflow/utils/cuda_helper.h"
-#else
-#include "flexflow/utils/hip_helper.h"
-#endif
-#include "flexflow/utils/hash_utils.h"
-#include "legion/legion_utilities.h"
-
-namespace FlexFlow {
-
-// declare Legion names
-using Legion::ArgumentMap;
-using Legion::Context;
-using Legion::coord_t;
-using Legion::Domain;
-using Legion::Future;
-using Legion::FutureMap;
-using Legion::IndexLauncher;
-using Legion::Machine;
-using Legion::Memory;
-using Legion::PhysicalRegion;
-using Legion::Predicate;
-using Legion::Rect;
-using Legion::RegionRequirement;
-using Legion::Runtime;
-using Legion::Task;
-using Legion::TaskArgument;
-using Legion::TaskLauncher;
-using PCG::Node;
-
-bool SpecInferIncMultiHeadSelfAttentionParams::is_valid(
-    ParallelTensorShape const &input) const {
-  bool is_valid = input.is_valid();
-  return is_valid;
-}
-
-Tensor FFModel::specinfer_inc_multihead_self_attention(
-    Tensor const input,
-    int embed_dim,
-    int num_heads,
-    int kdim,
-    int vdim,
-    float dropout,
-    bool qkv_bias,
-    bool final_bias,
-    bool add_zero_attn,
-    DataType data_type,
-    Initializer *kernel_initializer,
-    bool apply_rotary_embedding,
-    bool scaling_query,
-    float scaling_factor,
-    bool qk_prod_scaling,
-    bool position_bias,
-    char const *name) {
-  return specinfer_inc_multiquery_self_attention(input,
-                                                 embed_dim,
-                                                 num_heads,
-                                                 num_heads,
-                                                 kdim,
-                                                 vdim,
-                                                 dropout,
-                                                 qkv_bias,
-                                                 final_bias,
-                                                 add_zero_attn,
-                                                 data_type,
-                                                 kernel_initializer,
-                                                 apply_rotary_embedding,
-                                                 scaling_query,
-                                                 scaling_factor,
-                                                 qk_prod_scaling,
-                                                 position_bias,
-                                                 name);
-}
-
-Tensor FFModel::specinfer_inc_multiquery_self_attention(
-    Tensor const input,
-    int embed_dim,
-    int num_q_heads,
-    int num_kv_heads,
-    int kdim,
-    int vdim,
-    float dropout,
-    bool qkv_bias,
-    bool final_bias,
-    bool add_zero_attn,
-    DataType data_type,
-    Initializer *kernel_initializer,
-    bool apply_rotary_embedding,
-    bool scaling_query,
-    float scaling_factor,
-    bool qk_prod_scaling,
-    bool position_bias,
-    char const *name) {
-  if (data_type == DT_NONE) {
-    data_type = input->data_type;
-  }
-  Layer *li = nullptr;
-  int weight_num = (qkv_bias || final_bias) ? 2 : 1;
-  if (data_type != input->data_type) {
-    Tensor casted_input = cast(input, data_type, "type cast for IncMHA");
-    li = new Layer(this,
-                   OP_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION,
-                   data_type,
-                   name,
-                   1 /*inputs*/,
-                   weight_num /*weights*/,
-                   1 /*outputs*/,
-                   casted_input);
-  } else {
-    li = new Layer(this,
-                   OP_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION,
-                   data_type,
-                   name,
-                   1 /*inputs*/,
-                   weight_num /*weights*/,
-                   1 /*outputs*/,
-                   input);
-  }
-  {
-    int numdims = input->num_dims;
-    int dims[MAX_TENSOR_DIM];
-    for (int i = 0; i < numdims; i++) {
-      dims[i] = input->dims[i];
-    }
-    dims[0] = embed_dim;
-    li->outputs[0] = create_tensor_legion_ordering(
-        numdims, dims, data_type, li, 0, true /*create_grad*/);
-  }
-  // Compute weight size
-  int qProjSize = kdim, kProjSize = kdim, vProjSize = kdim,
-      oProjSize = embed_dim;
-  int qSize = input->dims[0], kSize = input->dims[0], vSize = input->dims[0];
-  int qParas = qProjSize * qSize;
-  int kParas = kProjSize * kSize;
-  int vParas = vProjSize * vSize;
-  int oParas = oProjSize * (vProjSize > 0 ? vProjSize : vSize);
-  int weight_size = qParas * num_q_heads + kParas * num_q_heads +
-                    vParas * num_q_heads + oParas * num_q_heads;
-  {
-    int dims[1] = {weight_size};
-    li->weights[0] = create_weight_legion_ordering(1,
-                                                   dims,
-                                                   data_type,
-                                                   li,
-                                                   true /*create_grad*/,
-                                                   kernel_initializer,
-                                                   CHOSEN_SYNC_TYPE);
-  }
-  if (qkv_bias || final_bias) {
-    // q, k, v, o
-    int qkv_bias_size =
-        qProjSize * num_q_heads + (kProjSize + vProjSize) * num_q_heads;
-    int dims[1] = {(qkv_bias ? qkv_bias_size : 0) +
-                   (final_bias ? oProjSize : 0)};
-    li->weights[1] = create_weight_legion_ordering(1,
-                                                   dims,
-                                                   data_type,
-                                                   li,
-                                                   true /*create_grad*/,
-                                                   kernel_initializer,
-                                                   CHOSEN_SYNC_TYPE);
-  }
-  li->data_type = data_type;
-  li->add_int_property("embed_dim", embed_dim);
-  li->add_int_property("num_q_heads", num_q_heads);
-  li->add_int_property("num_kv_heads", num_kv_heads);
-  li->add_int_property("kdim", kdim);
-  li->add_int_property("vdim", vdim);
-  li->add_int_property("qkv_bias", qkv_bias);
-  li->add_int_property("final_bias", final_bias);
-  li->add_int_property("add_zero_attn", add_zero_attn);
-  li->add_float_property("dropout", dropout);
-  li->add_int_property("apply_rotary_embedding", apply_rotary_embedding);
-  li->add_int_property("scaling_query", scaling_query);
-  li->add_float_property("scaling_factor", scaling_factor);
-  li->add_int_property("qk_prod_scaling", qk_prod_scaling);
-  li->add_int_property("position_bias", position_bias);
-  layers.push_back(li);
-  return li->outputs[0];
-}
-
-Op *SpecInferIncMultiHeadSelfAttention::create_operator_from_layer(
-    FFModel &model,
-    Layer const *layer,
-    std::vector<ParallelTensor> const &inputs) {
-
-  std::cout << "spec create operator: " << layer->name << "\n";
-  long long value;
-  layer->get_int_property("embed_dim", value);
-  int embed_dim = value;
-  layer->get_int_property("num_q_heads", value);
-  int num_q_heads = value;
-  layer->get_int_property("num_kv_heads", value);
-  int num_kv_heads = value;
-  layer->get_int_property("kdim", value);
-  int kdim = value;
-  layer->get_int_property("vdim", value);
-  int vdim = value;
-  float dropout;
-  layer->get_float_property("dropout", dropout);
-  layer->get_int_property("qkv_bias", value);
-  bool qkv_bias = (bool)value;
-  layer->get_int_property("final_bias", value);
-  bool final_bias = (bool)value;
-  layer->get_int_property("add_zero_attn", value);
-  bool add_zero_attn = (bool)value;
-  layer->get_int_property("apply_rotary_embedding", value);
-  bool apply_rotary_embedding = (bool)value;
-  layer->get_int_property("scaling_query", value);
-  bool scaling_query = (bool)value;
-  float scaling_factor;
-  layer->get_float_property("scaling_factor", scaling_factor);
-  layer->get_int_property("qk_prod_scaling", value);
-  bool qk_prod_scaling = (bool)value;
-  layer->get_int_property("position_bias", value);
-  bool position_bias = (bool)value;
-
-  return new SpecInferIncMultiHeadSelfAttention(model,
-                                                layer->layer_guid,
-                                                inputs[0],
-                                                embed_dim,
-                                                num_q_heads,
-                                                num_kv_heads,
-                                                kdim,
-                                                vdim,
-                                                dropout,
-                                                qkv_bias,
-                                                final_bias,
-                                                add_zero_attn,
-                                                apply_rotary_embedding,
-                                                scaling_query,
-                                                scaling_factor,
-                                                qk_prod_scaling,
-                                                position_bias,
-                                                false /*allocate_weights*/,
-                                                layer->name);
-}
-
-SpecInferIncMultiHeadSelfAttention::SpecInferIncMultiHeadSelfAttention(
-    FFModel &model,
-    LayerID const &_layer_guid,
-    ParallelTensor const _input,
-    int _embed_dim,
-    int _num_q_heads,
-    int _num_kv_heads,
-    int _kdim,
-    int _vdim,
-    float _dropout,
-    bool _qkv_bias,
-    bool _final_bias,
-    bool _add_zero_attn,
-    bool _apply_rotary_embedding,
-    bool _scaling_query,
-    float _scaling_factor,
-    bool _qk_prod_scaling,
-    bool _position_bias,
-    bool allocate_weights,
-    char const *name)
-    // Initializer* _bias_initializer)
-    : Op(model,
-         OP_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION,
-         _input->data_type,
-         name,
-         1 /*inputs*/,
-         (_qkv_bias || _final_bias ? 2 : 1) /*weights*/,
-         1 /*outputs*/,
-         _input),
-      num_q_heads(_num_q_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
-      qkv_bias(_qkv_bias), final_bias(_final_bias),
-      add_zero_attn(_add_zero_attn),
-      apply_rotary_embedding(_apply_rotary_embedding),
-      qSize(_input->dims[0].size), kSize(_input->dims[0].size),
-      vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
-      vProjSize(_vdim), oProjSize(_embed_dim),
-      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
-      scaling_query(_scaling_query), scaling_factor(_scaling_factor),
-      qk_prod_scaling(_qk_prod_scaling), position_bias(_position_bias) {
-  // overwrite layer_guid
-  layer_guid = _layer_guid;
-
-  numOutputs = 1;
-  int numdim = _input->num_dims;
-  ParallelDim dims[MAX_TENSOR_DIM];
-  for (int i = 0; i < numdim; i++) {
-    dims[i] = _input->dims[i];
-  }
-  dims[0].size = _embed_dim;
-  // Currently require no parallelism along this dim
-  assert(dims[0].degree == 1);
-  if (allocate_weights) {
-    // Create weight tensor
-    int num_dims = inputs[0]->num_dims;
-    // Compute weight size
-    int qParas = this->qProjSize * this->qSize;
-    int kParas = this->kProjSize * this->kSize;
-    int vParas = this->vProjSize * this->vSize;
-    int oParas =
-        this->oProjSize * (this->vProjSize > 0 ? this->vProjSize : this->vSize);
-    ParallelDim dims[2];
-    dims[0] = inputs[0]->dims[num_dims - 2];
-    dims[0].size = dims[0].degree;
-    dims[1] = inputs[0]->dims[num_dims - 1];
-    dims[1].size = this->num_q_heads * (qParas + oParas) +
-                   this->num_q_heads * (kParas + vParas);
-    dims[1].is_replica_dim = false;
-    int seed = std::rand();
-    Initializer *initializer = new GlorotUniform(seed);
-    weights[0] = model.create_parallel_weight<2>(dims,
-                                                 this->data_type,
-                                                 NULL /*owner_op*/,
-                                                 true /*create_grad*/,
-                                                 initializer,
-                                                 CHOSEN_SYNC_TYPE);
-    if (qkv_bias || final_bias) {
-      ParallelTensorShape bias_shape = _input->get_shape();
-      int qkv_bias_size =
-          qProjSize * num_q_heads + (kProjSize + vProjSize) * num_q_heads;
-      bias_shape.dims[0].size =
-          (qkv_bias ? qkv_bias_size : 0) + (final_bias ? oProjSize : 0);
-      bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
-      weights[1] =
-          model.create_parallel_weight_legion_ordering(bias_shape.num_dims,
-                                                       bias_shape.dims,
-                                                       this->data_type,
-                                                       nullptr /*owner_op*/,
-                                                       true /*create_grad*/,
-                                                       initializer,
-                                                       CHOSEN_SYNC_TYPE);
-    }
-  }
-
-  outputs[0] = model.create_parallel_tensor_legion_ordering(
-      _input->num_dims, dims, this->data_type, this);
-  /* for (int i = 0; i < numdim; i++) { */
-  /*   register_output_input_parallel_dims(outputs[0], i, inputs[0], i); */
-  /* } */
-  /* // Check correctness */
-  /* assert(check_output_input_weight_parallel_dims()); */
-}
-
-SpecInferIncMultiHeadSelfAttention::SpecInferIncMultiHeadSelfAttention(
-    FFModel &model,
-    ParallelTensor const _input,
-    ParallelTensor const _weight,
-    int _embed_dim,
-    int _num_q_heads,
-    int _num_kv_heads,
-    int _kdim,
-    int _vdim,
-    float _dropout,
-    bool _qkv_bias,
-    bool _final_bias,
-    bool _add_zero_attn,
-    bool _apply_rotary_embedding,
-    bool _scaling_query,
-    float _scaling_factor,
-    bool _qk_prod_scaling,
-    bool _position_bias,
-    bool allocate_weights,
-    char const *name)
-    // Initializer* _bias_initializer)
-    : Op(model,
-         OP_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION,
-         _input->data_type,
-         name,
-         1 /*inputs*/,
-         (_qkv_bias || _final_bias ? 2 : 1) /*weights*/,
-         1 /*outputs*/,
-         _input,
-         _weight),
-      num_q_heads(_num_q_heads), num_kv_heads(_num_kv_heads), dropout(_dropout),
-      qkv_bias(_qkv_bias), final_bias(_final_bias),
-      add_zero_attn(_add_zero_attn),
-      apply_rotary_embedding(_apply_rotary_embedding),
-      qSize(_input->dims[0].size), kSize(_input->dims[0].size),
-      vSize(_input->dims[0].size), qProjSize(_kdim), kProjSize(_kdim),
-      vProjSize(_vdim), oProjSize(_embed_dim),
-      qoSeqLength(_input->dims[1].size), kvSeqLength(_input->dims[1].size),
-      scaling_query(_scaling_query), scaling_factor(_scaling_factor),
-      qk_prod_scaling(_qk_prod_scaling), position_bias(_position_bias)
-// bias_initializer(_bias_initializer)
-{
-  numOutputs = 1;
-  int numdim = _input->num_dims;
-  ParallelDim dims[MAX_TENSOR_DIM];
-  for (int i = 0; i < numdim; i++) {
-    dims[i] = _input->dims[i];
-  }
-  dims[0].size = _embed_dim;
-  // Currently require no parallelism along this dim
-  assert(dims[0].degree == 1);
-  if (allocate_weights) {
-    // Create weight tensor
-    int num_dims = inputs[0]->num_dims;
-    // Compute weight size
-    int qParas = this->qProjSize * this->qSize;
-    int kParas = this->kProjSize * this->kSize;
-    int vParas = this->vProjSize * this->vSize;
-    int oParas =
-        this->oProjSize * (this->vProjSize > 0 ? this->vProjSize : this->vSize);
-    ParallelDim dims[2];
-    dims[0] = inputs[0]->dims[num_dims - 2];
-    dims[0].size = dims[0].degree;
-    dims[1] = inputs[0]->dims[num_dims - 1];
-    dims[1].size = this->num_q_heads * (qParas + oParas) +
-                   this->num_q_heads * (kParas + vParas);
-    dims[1].is_replica_dim = false;
-    // dims[2].size = qParas + kParas + vParas + oParas;
-    int seed = std::rand();
-    Initializer *initializer = new GlorotUniform(seed);
-    weights[0] = model.create_parallel_weight<2>(dims,
-                                                 this->data_type,
-                                                 NULL /*owner_op*/,
-                                                 true /*create_grad*/,
-                                                 initializer,
-                                                 CHOSEN_SYNC_TYPE);
-    if (qkv_bias || final_bias) {
-      ParallelTensorShape bias_shape = _input->get_shape();
-      int qkv_bias_size =
-          qProjSize * num_q_heads + (kProjSize + vProjSize) * num_q_heads;
-      bias_shape.dims[0].size =
-          (qkv_bias ? qkv_bias_size : 0) + (final_bias ? oProjSize : 0);
-      bias_shape.dims[1].size = bias_shape.dims[2].size = 1;
-      weights[1] =
-          model.create_parallel_weight_legion_ordering(bias_shape.num_dims,
-                                                       bias_shape.dims,
-                                                       this->data_type,
-                                                       nullptr /*owner_op*/,
-                                                       true /*create_grad*/,
-                                                       initializer,
-                                                       CHOSEN_SYNC_TYPE);
-    }
-  }
-
-  outputs[0] = model.create_parallel_tensor_legion_ordering(
-      _input->num_dims, dims, this->data_type, this);
-
-  /* for (int i = 0; i < numdim; i++) { */
-  /*   register_output_input_parallel_dims(outputs[0], i, inputs[0], i); */
-  /* } */
-  /* register_output_weight_parallel_dims(outputs[0], numdim-1, _weight, 1); */
-  /* register_output_weight_parallel_dims(outputs[0], numdim-2, _weight, 2); */
-  // Check correctness
-  /* assert(check_output_input_weight_parallel_dims()); */
-}
-
-SpecInferIncMultiHeadSelfAttention::SpecInferIncMultiHeadSelfAttention(
-    FFModel &model,
-    SpecInferIncMultiHeadSelfAttention const &other,
-    ParallelTensor const input,
-    bool allocate_weights)
-    : SpecInferIncMultiHeadSelfAttention(model,
-                                         other.layer_guid,
-                                         input,
-                                         other.oProjSize,
-                                         other.num_q_heads,
-                                         other.num_kv_heads,
-                                         other.qProjSize,
-                                         other.vProjSize,
-                                         other.dropout,
-                                         other.qkv_bias,
-                                         other.final_bias,
-                                         other.add_zero_attn,
-                                         other.apply_rotary_embedding,
-                                         other.scaling_query,
-                                         other.scaling_factor,
-                                         other.qk_prod_scaling,
-                                         other.position_bias,
-                                         allocate_weights,
-                                         other.name) {}
-
-SpecInferIncMultiHeadSelfAttention::SpecInferIncMultiHeadSelfAttention(
-    FFModel &model,
-    SpecInferIncMultiHeadSelfAttentionParams const &params,
-    ParallelTensor const &input,
-    bool allocate_weights,
-    char const *name)
-    : SpecInferIncMultiHeadSelfAttention(model,
-                                         params.layer_guid,
-                                         input,
-                                         params.embed_dim,
-                                         params.num_q_heads,
-                                         params.num_kv_heads,
-                                         params.kdim,
-                                         params.vdim,
-                                         params.dropout,
-                                         params.qkv_bias,
-                                         params.final_bias,
-                                         params.add_zero_attn,
-                                         params.apply_rotary_embedding,
-                                         params.scaling_query,
-                                         params.scaling_factor,
-                                         params.qk_prod_scaling,
-                                         params.position_bias,
-                                         allocate_weights,
-                                         name) {}
-
-void SpecInferIncMultiHeadSelfAttention::init_inference(
-    FFModel const &ff,
-    std::vector<ParallelTensor> const &batch_inputs,
-    std::vector<ParallelTensor> const &batch_outputs,
-    MachineView const *mv) {
-  assert(check_output_input_weight_same_parallel_is());
-  parallel_is = batch_outputs[0]->parallel_is;
-  ArgumentMap argmap;
-  Context ctx = ff.config.lg_ctx;
-  Runtime *runtime = ff.config.lg_hlr;
-  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
-  size_t machine_view_hash = view->hash();
-  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
-  IndexLauncher launcher(
-      SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
-      parallel_is,
-      TaskArgument(this, sizeof(SpecInferIncMultiHeadSelfAttention)),
-      argmap,
-      Predicate::TRUE_PRED,
-      false /*must*/,
-      0 /*mapper_id*/,
-      machine_view_hash);
-  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_inputs[0]->region));
-  launcher.add_field(0, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    weights[0]->region));
-  launcher.add_field(1, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_outputs[0]->region));
-  launcher.add_field(2, FID_DATA);
-  FutureMap fm = runtime->execute_index_space(ctx, launcher);
-  fm.wait_all_results();
-  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
-}
-
-void SpecInferIncMultiHeadSelfAttention::init(FFModel const &ff) {
-  assert(check_output_input_weight_same_parallel_is());
-  parallel_is = outputs[0]->parallel_is;
-  ArgumentMap argmap;
-  Context ctx = ff.config.lg_ctx;
-  Runtime *runtime = ff.config.lg_hlr;
-  set_argumentmap_for_init(ff, argmap);
-  IndexLauncher launcher(
-      SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
-      parallel_is,
-      TaskArgument(this, sizeof(SpecInferIncMultiHeadSelfAttention)),
-      argmap,
-      Predicate::TRUE_PRED,
-      false /*must*/,
-      0 /*mapper_id*/,
-      outputs[0]->machine_view.hash());
-  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    inputs[0]->region));
-  launcher.add_field(0, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    weights[0]->region));
-  launcher.add_field(1, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    outputs[0]->region));
-  launcher.add_field(2, FID_DATA);
-  FutureMap fm = runtime->execute_index_space(ctx, launcher);
-  fm.wait_all_results();
-  set_opmeta_from_futuremap(ff, fm);
-}
-
-/*
-  regions[0](I): input
-  regions[1](I): weight
-  regions[2](O): output
-*/
-OpMeta *SpecInferIncMultiHeadSelfAttention::init_task(
-    Task const *task,
-    std::vector<PhysicalRegion> const &regions,
-    Context ctx,
-    Runtime *runtime) {
-  SpecInferIncMultiHeadSelfAttention const *attn =
-      (SpecInferIncMultiHeadSelfAttention *)task->args;
-  FFHandler handle = *((FFHandler const *)task->local_args);
-
-  GenericTensorAccessorR input =
-      helperGetGenericTensorAccessorRO(attn->inputs[0]->data_type,
-                                       regions[0],
-                                       task->regions[0],
-                                       FID_DATA,
-                                       ctx,
-                                       runtime);
-  GenericTensorAccessorR weight =
-      helperGetGenericTensorAccessorRO(attn->weights[0]->data_type,
-                                       regions[1],
-                                       task->regions[1],
-                                       FID_DATA,
-                                       ctx,
-                                       runtime);
-  GenericTensorAccessorW output =
-      helperGetGenericTensorAccessorWO(attn->outputs[0]->data_type,
-                                       regions[2],
-                                       task->regions[2],
-                                       FID_DATA,
-                                       ctx,
-                                       runtime);
-
-  int num_samples = input.domain.hi()[2] - input.domain.lo()[2] + 1;
-  assert(attn->qoSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
-  assert(attn->kvSeqLength == input.domain.hi()[1] - input.domain.lo()[1] + 1);
-  int num_q_heads = attn->num_q_heads;
-  int num_kv_heads = attn->num_kv_heads;
-  assert(attn->oProjSize == output.domain.hi()[0] - output.domain.lo()[0] + 1);
-
-  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                       .only_kind(Memory::GPU_FB_MEM)
-                       .best_affinity_to(task->target_proc)
-                       .first();
-  MemoryAllocator gpu_mem_allocator(gpu_mem);
-  // We don't do offloading for SSMs (small speculative models)
-  SpecInferIncMultiHeadSelfAttentionMeta *m =
-      new SpecInferIncMultiHeadSelfAttentionMeta(handle,
-                                                 attn,
-                                                 weight,
-                                                 gpu_mem_allocator,
-                                                 num_samples,
-                                                 num_q_heads,
-                                                 num_kv_heads);
-  // assert that we didn't over allocate memory
-  assert(gpu_mem_allocator.instance_allocated_size ==
-         gpu_mem_allocator.instance_total_size);
-  m->profiling = attn->profiling;
-  m->inference_debugging = attn->inference_debugging;
-  std::strcpy(m->op_name, attn->name);
-  m->layer_guid = attn->layer_guid;
-  assert(weight.domain.get_volume() * data_type_size(weight.data_type) ==
-         m->weightSize);
-  return m;
-}
-
-void SpecInferIncMultiHeadSelfAttention::forward(FFModel const &ff) {
-  // SpecInferIncMultiHeadSelfAttention doesn't support forward
-  assert(false);
-}
-
-FutureMap SpecInferIncMultiHeadSelfAttention::inference(
-    FFModel const &ff,
-    BatchConfigFuture const &bc,
-    std::vector<ParallelTensor> const &batch_inputs,
-    std::vector<ParallelTensor> const &batch_outputs,
-    MachineView const *mv) {
-  ArgumentMap argmap;
-  Context ctx = ff.config.lg_ctx;
-  Runtime *runtime = ff.config.lg_hlr;
-  parallel_is = batch_outputs[0]->parallel_is;
-  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
-  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
-  size_t machine_view_hash = view->hash();
-  int idx = 0;
-  IndexLauncher launcher(SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
-                         parallel_is,
-                         TaskArgument(nullptr, 0),
-                         argmap,
-                         Predicate::TRUE_PRED,
-                         false /*must*/,
-                         0 /*mapper_id*/,
-                         machine_view_hash);
-  launcher.add_future(bc);
-  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_inputs[0]->region));
-  launcher.add_field(idx++, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    weights[0]->region));
-  launcher.add_field(idx++, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_outputs[0]->region));
-  launcher.add_field(idx++, FID_DATA);
-
-  if (qkv_bias || final_bias) {
-    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
-                                                      0 /*projection id*/,
-                                                      READ_ONLY,
-                                                      EXCLUSIVE,
-                                                      weights[1]->region));
-    launcher.add_field(idx++, FID_DATA);
-  }
-  return runtime->execute_index_space(ctx, launcher);
-}
-
-/*
-  regions[0](I): input
-  regions[3](I): weight
-  regions[4](O): output
-*/
-void SpecInferIncMultiHeadSelfAttention::inference_task(
-    Task const *task,
-    std::vector<PhysicalRegion> const &regions,
-    Context ctx,
-    Runtime *runtime) {
-  assert(task->regions.size() == regions.size());
-
-  BeamSearchBatchConfig const &bc =
-      Future(task->futures[0]).get_result<BeamSearchBatchConfig>();
-  if (bc.num_tokens == 0) {
-    return;
-  }
-
-  SpecInferIncMultiHeadSelfAttentionMeta *m =
-      *((SpecInferIncMultiHeadSelfAttentionMeta **)task->local_args);
-  assert(((*m->qkv_bias || *m->final_bias) ? regions.size() == 4
-                                           : regions.size() == 3));
-
-  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
-      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
-      m->weight_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
-  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
-      m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
-  GenericTensorAccessorR biases;
-  if (*m->qkv_bias || *m->final_bias) {
-    biases = helperGetGenericTensorAccessorRO(m->weight_type[1],
-                                              regions[3],
-                                              task->regions[3],
-                                              FID_DATA,
-                                              ctx,
-                                              runtime);
-    Domain bias_domain = runtime->get_index_space_domain(
-        ctx, task->regions[3].region.get_index_space());
-    assert(bias_domain.get_dim() == 4);
-  }
-  Domain input_domain = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
-  Domain weight_domain = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  Domain output_domain = runtime->get_index_space_domain(
-      ctx, task->regions[2].region.get_index_space());
-
-  assert(input_domain.get_dim() == 4);
-  assert(weight_domain.get_dim() == 2);
-  assert(output_domain.get_dim() == 4);
-
-  assert(task->index_point.get_dim() == 1);
-  SpecInferIncMultiHeadSelfAttention::inference_kernel_wrapper(
-      m, &bc, task->index_point.point_data[0], input, weight, output, biases);
-  if (m->inference_debugging) {
-    assert(task->index_point.get_dim() == 1);
-    int shard_id = task->index_point.point_data[0];
-    std::vector<GenericTensorAccessorR> weights_accessors;
-    weights_accessors.push_back(weight);
-    if (*m->qkv_bias || *m->final_bias) {
-      weights_accessors.push_back(biases);
-    }
-    SpecInferIncMultiHeadSelfAttention::save_inference_tensors_to_file(
-        m, shard_id, &bc, {input}, weights_accessors, {output});
-  }
-}
-
-void SpecInferIncMultiHeadSelfAttention::backward(FFModel const &ff) {
-  // SpecInferIncMultiHeadSelfAttention does not support backward
-  assert(false);
-}
-
-bool SpecInferIncMultiHeadSelfAttention::get_int_parameter(PMParameter para,
-                                                           int *value) const {
-  switch (para) {
-    case PM_NUM_HEADS:
-      *value = num_q_heads;
-      return true;
-    default:
-      return Op::get_int_parameter(para, value);
-  }
-}
-
-Op *SpecInferIncMultiHeadSelfAttention::materialize(FFModel &ff,
-                                                    ParallelTensor inputs[],
-                                                    int num_inputs) const {
-  SpecInferIncMultiHeadSelfAttentionParams params = get_params();
-  return new SpecInferIncMultiHeadSelfAttention(
-      ff, params, inputs[0], true, this->name);
-}
-
-bool SpecInferIncMultiHeadSelfAttention::measure_operator_cost(
-    Simulator *sim, MachineView const &mv, CostMetrics &cost_metrics) const {
-  return false;
-}
-
-bool operator==(SpecInferIncMultiHeadSelfAttentionParams const &lhs,
-                SpecInferIncMultiHeadSelfAttentionParams const &rhs) {
-  return lhs.layer_guid == rhs.layer_guid && lhs.embed_dim == rhs.embed_dim &&
-         lhs.num_q_heads == rhs.num_q_heads && lhs.kdim == rhs.kdim &&
-         lhs.vdim == rhs.vdim && lhs.dropout == rhs.dropout &&
-         lhs.qkv_bias == rhs.qkv_bias && lhs.final_bias == rhs.final_bias &&
-         lhs.add_zero_attn == rhs.add_zero_attn &&
-         lhs.apply_rotary_embedding == rhs.apply_rotary_embedding &&
-         lhs.scaling_query == rhs.scaling_query &&
-         lhs.scaling_factor == rhs.scaling_factor &&
-         lhs.qk_prod_scaling == rhs.qk_prod_scaling &&
-         lhs.position_bias == rhs.position_bias;
-}
-
-SpecInferIncMultiHeadSelfAttentionParams
-    SpecInferIncMultiHeadSelfAttention::get_params() const {
-  SpecInferIncMultiHeadSelfAttentionParams params;
-  params.layer_guid = this->layer_guid;
-  params.embed_dim = this->oProjSize;
-  params.num_q_heads = this->num_q_heads;
-  params.num_kv_heads = this->num_kv_heads;
-  params.kdim = this->kProjSize;
-  params.vdim = this->vProjSize;
-  params.dropout = this->dropout;
-  params.qkv_bias = this->qkv_bias;
-  params.final_bias = this->final_bias;
-  params.add_zero_attn = this->add_zero_attn;
-  params.apply_rotary_embedding = this->apply_rotary_embedding;
-  params.scaling_query = this->scaling_query;
-  params.scaling_factor = this->scaling_factor;
-  params.qk_prod_scaling = this->qk_prod_scaling;
-  params.position_bias = this->position_bias;
-
-  return params;
-}
-
-}; // namespace FlexFlow
-
-namespace std {
-size_t hash<FlexFlow::SpecInferIncMultiHeadSelfAttentionParams>::operator()(
-    FlexFlow::SpecInferIncMultiHeadSelfAttentionParams const &params) const {
-  size_t key = 0;
-  hash_combine(key, params.layer_guid.id);
-  hash_combine(key, params.embed_dim);
-  hash_combine(key, params.num_q_heads);
-  hash_combine(key, params.num_kv_heads);
-  hash_combine(key, params.kdim);
-  hash_combine(key, params.vdim);
-  hash_combine(key, params.dropout);
-  hash_combine(key, params.qkv_bias);
-  hash_combine(key, params.final_bias);
-  hash_combine(key, params.add_zero_attn);
-  hash_combine(key, params.apply_rotary_embedding);
-  hash_combine(key, params.scaling_query);
-  hash_combine(key, params.scaling_factor);
-  hash_combine(key, params.qk_prod_scaling);
-  hash_combine(key, params.position_bias);
-  return key;
-}
-}; // namespace std
diff --git a/src/ops/specinfer_inc_multihead_self_attention.cu b/src/ops/specinfer_inc_multihead_self_attention.cu
deleted file mode 100644
index 8340519ff3..0000000000
--- a/src/ops/specinfer_inc_multihead_self_attention.cu
+++ /dev/null
@@ -1,958 +0,0 @@
-/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
- *
- * Licensed under the Apache License, Version 2.0 (the "License");
- * you may not use this file except in compliance with the License.
- * You may obtain a copy of the License at
- *
- *     http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
-#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
-#include "cuComplex.h"
-#endif
-#include "flexflow/ffconst_utils.h"
-#include "flexflow/ops/kernels/inc_multihead_self_attention_kernels.h"
-#include "flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh"
-#include "flexflow/ops/specinfer_inc_multihead_self_attention.h"
-#include "flexflow/utils/cuda_helper.h"
-
-namespace FlexFlow {
-
-#define WARP_SIZE 32
-
-// declare Legion names
-using Legion::coord_t;
-using Legion::Memory;
-using namespace Kernels::IncMultiHeadAttention;
-
-namespace Kernels {
-namespace SpecInferIncMultiHeadAttention {
-
-template <typename DT,
-          int THREADS_PER_BLOCK,
-          int Dh,
-          int Dh_MAX,
-          int THREADS_PER_KEY,
-          int THREADS_PER_VALUE>
-__global__ void compute_specinfer_attention_kernel_generation_kernel(
-    DT const *query,
-    DT const *key_cache,
-    DT const *value_cache,
-    DT *output_ptr,
-    float const scale,
-    int const max_seq_length,
-    int per_head_size,
-    int hidden_size,
-    BatchConfig::PerRequestInfo *request_infos,
-    BeamSearchBatchConfig::BeamSearchPerRequestInfo *beam_request_infos,
-    BatchConfig::BitMask *causalMask) {
-
-  // q, k
-  using Q_vec = typename VEC_K<DT, THREADS_PER_KEY>::Type;
-  using K_vec = typename VEC_K<DT, THREADS_PER_KEY>::Type;
-  using V_vec = typename VEC_V<DT>::Type;
-  using Out_sum = typename Vec_fp32_<V_vec>::Type;
-
-  constexpr int WARPS_PER_BLOCK = THREADS_PER_BLOCK / WARP_SIZE;
-
-  constexpr int K_VEC_SIZE = sizeof(K_vec) / sizeof(DT);
-  constexpr int K_ELTS_PER_THREAD = Dh / THREADS_PER_KEY;
-  constexpr int K_VECS_PER_THREAD = K_ELTS_PER_THREAD / K_VEC_SIZE;
-  // constexpr int QK_ELTS_IN_16B = 16 / sizeof(DT);
-
-  // thread id
-  int const tidx = threadIdx.x;
-  // head id
-  int const head_idx = blockIdx.x;
-  // nth request idx
-  int const request_idx = blockIdx.y;
-
-  // request id in batch config
-  int const batch_config_request_id =
-      request_infos[request_idx].batch_config_request_id;
-
-  // request_idx = re
-
-  BatchConfig::BitMask bitmask = causalMask[batch_config_request_id];
-
-  int const first_step = 0;
-
-  int const tlength =
-      request_infos[batch_config_request_id].first_token_depth_in_request +
-      request_infos[batch_config_request_id].num_tokens_in_batch;
-
-  if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
-    printf("specinfer attn fused kernel!!!\n");
-  }
-
-  int const totalCacheSize = bitmask.non_tree_cache_size + bitmask.tree_size;
-
-  if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
-    printf("specinfer attn fused kernel %d, %d\n",
-           totalCacheSize,
-           request_infos[batch_config_request_id].num_tokens_in_batch);
-  }
-  // int const qlength = request_infos[request_idx].num_tokens_in_batch;
-  int const tree_branch_num =
-      beam_request_infos[batch_config_request_id].sub_request_num;
-
-  // will decode qlength tokens in this thread block
-  // int const qlength = tree_branch_num;
-
-  int first_token_idx = 0;
-  for (int r = 0; r < request_idx; r++) {
-    first_token_idx += causalMask[r].this_layer_size;
-  }
-
-  // if (tidx == 0 && head_idx == 0) {
-  //   printf("spec req: %d, %d\n", request_idx, first_token_idx);
-  // }
-
-  // shared memory objects
-  extern __shared__ char smem_[];
-
-  float *qk_smem = reinterpret_cast<float *>(smem_);
-  float *out_smem = reinterpret_cast<float *>(smem_);
-
-  float qk_max = -FLT_MAX;
-
-  // first WARPS_PER_BLOCK for store qk_max, second WARPS_PER_BLOCK for sum
-  __shared__ float red_smem[WARPS_PER_BLOCK * 2];
-
-  const DT *q_ptr = query + first_token_idx * hidden_size * QKV_WEIGHT_NUM +
-                    head_idx * per_head_size;
-  __shared__ Q_vec q_vecs[THREADS_PER_KEY][K_VECS_PER_THREAD];
-
-  // the start offset of the element eg. (0, 1, 2, 3) * K_VEC_SIZE
-  int ki = tidx % THREADS_PER_KEY * K_VEC_SIZE;
-  int ki_o = tidx % THREADS_PER_KEY;
-  // the first key's offset for this thread
-  // ko = 0, 0, 0, 0, 1, 1, 1, 1, ....
-  int ko = tidx / THREADS_PER_KEY;
-  // load q tensor
-  Q_vec q_vec[K_VECS_PER_THREAD];
-
-  constexpr int K_PER_ITER = THREADS_PER_BLOCK / THREADS_PER_KEY;
-  // The number of keys per warp.
-  constexpr int K_PER_WARP = WARP_SIZE / THREADS_PER_KEY;
-
-  DT const *k_cache_batch =
-      key_cache + batch_config_request_id * max_seq_length * hidden_size + ki;
-
-  int ti_end =
-      div_up(totalCacheSize - first_step, K_PER_WARP) * K_PER_WARP + first_step;
-
-  for (int qi = 0; qi < tree_branch_num; qi += 1) {
-#pragma unroll
-    for (int ii = 0; ii < K_VECS_PER_THREAD; ++ii) {
-      q_vecs[ki_o][ii] = *reinterpret_cast<Q_vec const *>(
-          q_ptr + (hidden_size * QKV_WEIGHT_NUM * qi) + ki +
-          ii * THREADS_PER_KEY * K_VEC_SIZE);
-    }
-
-    int const query_token = bitmask.tree_size - tree_branch_num + qi;
-
-    __syncthreads();
-    for (int ti = ko; ti < ti_end; ti += K_PER_ITER) {
-      K_vec k[K_VECS_PER_THREAD];
-      int const ti_circ = ti % max_seq_length;
-
-      for (int ii = 0; ii < K_VECS_PER_THREAD; ++ii) {
-        int jj = ii * THREADS_PER_KEY * K_VEC_SIZE;
-        if (ti < totalCacheSize) {
-
-          k[ii] = *reinterpret_cast<K_vec const *>(
-              k_cache_batch + ti_circ * hidden_size + head_idx * per_head_size +
-              jj);
-        }
-      }
-      float qk = scale * Qk_dot<DT, THREADS_PER_KEY>::dot(q_vecs[ki_o], k);
-
-      if (ti < totalCacheSize && tidx % THREADS_PER_KEY == 0) {
-        // todo add alobi here
-        // bool const mask = ti_circ >= totalCacheSize;
-        bool const mask = (ti >= bitmask.non_tree_cache_size &&
-                           (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
-                              (1 << query_token))));
-
-        // if (blockIdx.y == 0 && blockIdx.x == 0 && !mask) {
-        //   printf("spec inc attn qkqkqk %d,  %.10f, %d\n", ti, qk, qi);
-        // }
-        qk_max = mask ? qk_max : fmaxf(qk_max, qk);
-        qk_smem[ti - first_step] = mask ? 0.f : qk;
-      }
-    }
-
-    __syncthreads();
-
-#pragma unroll
-    for (int mask = WARP_SIZE / 2; mask >= THREADS_PER_KEY; mask /= 2) {
-      qk_max = fmaxf(qk_max, __shfl_xor_sync(uint32_t(-1), qk_max, mask));
-    }
-
-    // Decompose the thread index into warp and lane.
-    int const warp = tidx / WARP_SIZE;
-    int const lane = tidx % WARP_SIZE;
-
-    // The warp leader writes the max to shared memory.
-    if (lane == 0) {
-      red_smem[warp] = qk_max;
-    }
-
-    // Make sure the products are in shared memory.
-    __syncthreads();
-
-    // The warps finalize the reduction.
-    qk_max = lane < WARPS_PER_BLOCK ? red_smem[lane] : -FLT_MAX;
-#pragma unroll
-    for (int mask = WARPS_PER_BLOCK / 2; mask >= 1; mask /= 2) {
-      qk_max = fmaxf(qk_max, __shfl_xor_sync(uint32_t(-1), qk_max, mask));
-    }
-
-    // Broadcast to all the threads in the warp.
-    qk_max = __shfl_sync(uint32_t(-1), qk_max, 0);
-
-    // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
-    //   printf("spec inc attn first token qk_max %.10f\n", qk_max);
-    // }
-
-    float exp_sum = 0.f;
-    for (int ti = first_step + tidx; ti < totalCacheSize;
-         ti += THREADS_PER_BLOCK) {
-      bool const mask = (ti >= bitmask.non_tree_cache_size &&
-                         (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
-                            (1 << query_token))));
-      float logit = mask ? 0.0f : __expf(qk_smem[ti - first_step] - qk_max);
-      exp_sum += logit;
-      qk_smem[ti - first_step] = mask ? 0.0f : logit;
-    }
-
-    // Compute the sum.
-    exp_sum = block_sum<WARPS_PER_BLOCK>(&red_smem[WARPS_PER_BLOCK], exp_sum);
-
-    // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
-    //   printf("spec inc attn exp_sum %.10f\n", exp_sum);
-    // }
-
-    // softmax
-    float inv_sum = __fdividef(1.f, exp_sum + 1.e-6);
-    for (int ti = first_step + tidx; ti < totalCacheSize;
-         ti += THREADS_PER_BLOCK) {
-      qk_smem[ti - first_step] *= inv_sum;
-    }
-
-    __syncthreads();
-    // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
-    //   printf("softmax %.10f\n", qk_smem[0]);
-    // }
-
-    // value projection
-    constexpr int V_VEC_SIZE = 16 / sizeof(DT);
-    // A vector of V elements for the current timestep.
-    // using V_vec_k = typename V_vec_k_<DT, V_VEC_SIZE>::Type;
-    // using V_vec_acum = typename V_vec_acum_fp32_<V_vec_k>::Type;
-
-    // The value computed by this thread.
-    int vo = tidx / THREADS_PER_VALUE;
-    // The hidden dimensions computed by this particular thread.
-    int vi = tidx % THREADS_PER_VALUE * V_VEC_SIZE;
-    constexpr int V_PER_ITER = THREADS_PER_BLOCK / THREADS_PER_VALUE;
-
-    Out_sum out;
-    zero(out);
-
-    // The base pointer for the value in the cache buffer.
-    DT const *v_cache_batch =
-        value_cache + batch_config_request_id * max_seq_length * hidden_size +
-        vi;
-
-    if (Dh == Dh_MAX || vi < Dh) {
-      for (int ti = first_step + vo; ti < totalCacheSize; ti += V_PER_ITER) {
-        // Load the values from the cache.
-        int const ti_circ = ti % max_seq_length;
-        V_vec v = *reinterpret_cast<V_vec const *>(
-            v_cache_batch + ti_circ * hidden_size + head_idx * per_head_size);
-
-        bool const mask = (ti >= bitmask.non_tree_cache_size &&
-                           (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
-                              (1 << query_token))));
-        float logit = mask ? 0.0f : qk_smem[ti - first_step];
-        out = FlexFlow::fma(logit, cast_to_float(v), out);
-      }
-    }
-
-    //   // Make sure we can start writing to shared memory.
-    __syncthreads();
-
-    // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
-    //   printf("valueX %.10f\n", out.x);
-    // }
-
-    // Run the final reduction amongst the different groups computing different
-    // partial outputs.
-    if (Dh == Dh_MAX || vi < Dh) {
-#pragma unroll
-      for (int active_groups = V_PER_ITER; active_groups >= 2;
-           active_groups /= 2) {
-
-        // The midpoint in the number of active groups.
-        int midpoint = active_groups / 2;
-
-        // The upper part of active threads store to shared memory.
-        if (vo >= midpoint && vo < active_groups && (Dh == Dh_MAX || vi < Dh)) {
-          *reinterpret_cast<Out_sum *>(out_smem + (vo - midpoint) * Dh + vi) =
-              out;
-        }
-        __syncthreads();
-
-        // The bottom warps update their values.
-        if (vo < midpoint && (Dh == Dh_MAX || vi < Dh)) {
-          out = add(*reinterpret_cast<Out_sum const *>(out_smem + vo * Dh + vi),
-                    out);
-        }
-        __syncthreads();
-      }
-    }
-
-    // Output the final values.
-    if (vo == 0 && (Dh == Dh_MAX || vi < Dh)) {
-      convert_from_float(*reinterpret_cast<V_vec *>(
-                             output_ptr + (first_token_idx + qi) * hidden_size +
-                             head_idx * per_head_size + vi),
-                         out);
-    }
-  }
-}
-
-template <typename DT>
-__global__ void specinfer_store_kv_cache(
-    DT const *devQKVProjArray,
-    DT *kCache_ptr,
-    DT *vCache_ptr,
-    BatchConfig::PerTokenInfo *tokenInfos,
-    BatchConfig::PerRequestInfo *requestInfo,
-    BeamSearchBatchConfig::BeamSearchPerTokenInfo *beamTokenInfos,
-    BeamSearchBatchConfig::BeamSearchPerRequestInfo *beamRequestInfos,
-    BatchConfig::BitMask *causalMask,
-    int qProjSize,
-    int kProjSize,
-    int vProjSize,
-    int num_tokens,
-    int max_seq_len,
-    bool is_root,
-    int hidden_size) {
-  CUDA_KERNEL_LOOP(i, num_tokens * hidden_size) {
-    int token_idx = i / (hidden_size);
-    int offset = i % hidden_size;
-
-    size_t val_idx =
-        token_idx * QKV_WEIGHT_NUM * hidden_size + hidden_size + offset;
-
-    DT kVal = devQKVProjArray[val_idx];
-    DT vVal = devQKVProjArray[val_idx + hidden_size];
-
-    int const req_id = tokenInfos[token_idx].request_index;
-    int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
-    int const first_token_in_req =
-        requestInfo[req_id].first_token_depth_in_request;
-    int const sub_req_id = beamTokenInfos[token_idx].sub_request_index;
-    int const total_token = requestInfo[req_id].num_tokens_in_batch;
-
-    int const request_token_offset =
-        requestInfo[req_id].first_token_offset_in_batch;
-
-    BatchConfig::BitMask bitmask = causalMask[req_id];
-
-    int const sub_request_num = beamRequestInfos[req_id].sub_request_num;
-
-    int const tree_branch_num = beamRequestInfos[req_id].sub_request_num;
-
-    // int const query_token = bitmask.non_tree_cache_size + bitmask.tree_size -
-    //                         tree_branch_num + sub_req_id + tok_id;
-    // bitmask.tree_size - tree_branch_num + sub_req_id;
-
-    // if prompt token -> token id
-    // if tree token:
-    int const cache_idx = bitmask.non_tree_cache_size + bitmask.tree_size -
-                          bitmask.this_layer_size + token_idx -
-                          request_token_offset;
-
-    kCache_ptr[req_id * (hidden_size * max_seq_len) + (cache_idx)*hidden_size +
-               offset] = kVal;
-    vCache_ptr[req_id * (hidden_size * max_seq_len) + (cache_idx)*hidden_size +
-               offset] = vVal;
-  }
-}
-
-template <typename DT>
-void update_kv_cache_kernel(SpecInferIncMultiHeadSelfAttentionMeta const *m,
-                            BeamSearchBatchConfig const *bc,
-                            cudaStream_t stream) {
-  int num_tokens = bc->num_active_tokens();
-  int curr_depth = bc->beamRequestsInfo[0].current_depth;
-  // printf("curr depth: %d\n", curr_depth);
-  // assert(curr_depth < 3);
-  if (num_tokens > 0) {
-    int parallelism = m->hidden_size * KV_WEIGHT_NUM * num_tokens;
-    // printf("tokenInfo %d, %d\n",
-    //        bc->beamTokenInfo[0].sub_request_index,
-    //        num_tokens);
-    specinfer_store_kv_cache<<<GET_BLOCKS(parallelism),
-                               min(CUDA_NUM_THREADS, parallelism),
-                               0,
-                               stream>>>(
-        static_cast<DT *>(m->devQKVProjArray),
-        static_cast<DT *>(m->keyCache),
-        static_cast<DT *>(m->valueCache),
-        m->token_infos,
-        m->request_infos,
-        m->beam_token_infos,
-        m->beam_request_infos,
-        m->causalMask,
-        m->qProjSize,
-        m->kProjSize,
-        m->vProjSize,
-        num_tokens,
-        BatchConfig::max_sequence_length() +
-            BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,
-        /*root*/ curr_depth == 0,
-        m->hidden_size);
-  }
-}
-
-#define LAUNCH_SPECINFER_ATTENTION_SCORE_KERNEL(                               \
-    DT, Dh, Dh_MAX, THDS_PER_KEY, THREADS_PER_VALUE, THDS_PER_BLOCK, stream)   \
-  smem_sz = smem_size_in_bytes<DT>(m->qProjSize,                               \
-                                   BatchConfig::max_sequence_length() +        \
-                                       BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,   \
-                                   THREADS_PER_VALUE,                          \
-                                   THDS_PER_BLOCK);                            \
-  compute_specinfer_attention_kernel_generation_kernel<DT,                     \
-                                                       THDS_PER_BLOCK,         \
-                                                       Dh,                     \
-                                                       Dh_MAX,                 \
-                                                       THDS_PER_KEY,           \
-                                                       THREADS_PER_VALUE>      \
-      <<<grid, THDS_PER_BLOCK, smem_sz, stream>>>(                             \
-          static_cast<DT *>(m->devQKVProjArray),                               \
-          static_cast<DT *>(m->keyCache),                                      \
-          static_cast<DT *>(m->valueCache),                                    \
-          output_ptr,                                                          \
-          scale,                                                               \
-          BatchConfig::max_sequence_length() +                                 \
-              BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,                            \
-          m->qProjSize,                                                        \
-          m->hidden_size,                                                      \
-          m->request_infos,                                                    \
-          m->beam_request_infos,                                               \
-          m->causalMask)
-
-template <typename DT>
-void compute_specinfer_attention_kernel_generation(
-    SpecInferIncMultiHeadSelfAttentionMeta const *m,
-    BeamSearchBatchConfig const *bc,
-    DT *output_ptr,
-    cudaStream_t stream) {
-  // one block == one head per request
-  printf("??? at here: %d\n", bc->num_active_requests());
-  dim3 grid(m->num_q_heads, bc->num_active_requests());
-  int const per_head_size = m->qProjSize;
-  float scale = (*m->qk_prod_scaling) ? 1.0f / sqrt(m->kProjSize) : 1.0f;
-  size_t smem_sz;
-  if (per_head_size == 64) {
-    constexpr int THREADS_PER_VALUE_64 = threads_per_value_t<DT, 64>::value;
-    LAUNCH_SPECINFER_ATTENTION_SCORE_KERNEL(
-        DT, 64, 64, 4, THREADS_PER_VALUE_64, 128, stream);
-  } else if (per_head_size == 128) {
-    constexpr int THREADS_PER_VALUE_128 = threads_per_value_t<DT, 128>::value;
-    LAUNCH_SPECINFER_ATTENTION_SCORE_KERNEL(
-        DT, 128, 128, 4, THREADS_PER_VALUE_128, 128, stream);
-  } else {
-    assert(false && "a unsupported head size");
-  }
-}
-
-template <typename DT>
-__global__ void spec_fill_entries_above_diagonal(DT *matrix,
-                                                 size_t new_tokens,
-                                                 size_t total_tokens_in_request,
-                                                 size_t num_q_heads,
-                                                 DT value) {
-  CUDA_KERNEL_LOOP(i, new_tokens * total_tokens_in_request * num_q_heads) {
-    // size_t head_idx = i / (new_tokens * total_tokens_in_request);
-    size_t src_idx = (i / new_tokens) % total_tokens_in_request;
-    size_t dst_idx = i % new_tokens + total_tokens_in_request - new_tokens;
-    // Casual Mask
-    if (src_idx > dst_idx) {
-      matrix[i] = value;
-    }
-  }
-}
-
-template <typename DT>
-void compute_attention_kernel_prompt(
-    SpecInferIncMultiHeadSelfAttentionMeta const *m,
-    BeamSearchBatchConfig const *bc,
-    int shard_id,
-    DT *output_ptr,
-    DT const *bias_ptr,
-    DT const *weight_ptr,
-    cudaStream_t stream) {
-  checkCUDA(cublasSetStream(m->handle.blas, stream));
-  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
-  cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
-  cudnnDataType_t cudnn_data_type = ff_to_cudnn_datatype(m->output_type[0]);
-  assert(data_type_size(m->output_type[0]) == sizeof(DT));
-#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
-  cudaDataType_t compute_type = cublas_data_type;
-#else
-  // For best performance, set the default cublas compute type to
-  // CUBLAS_COMPUTE_16F for half precision and to
-  // CUBLAS_COMPUTE_32F_FAST_16F for full precision
-  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
-  if (m->output_type[0] == DT_FLOAT) {
-    compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
-  }
-#endif
-  // int num_requests = bc->num_active_requests();
-  int num_tokens = bc->num_active_tokens();
-  int tokens_previous_requests = 0;
-  int tokens_prev_requests_squares = 0;
-  // int qkv_block_size =
-  //     (m->qProjSize + m->kProjSize + m->vProjSize) * num_tokens;
-  int q_block_size = m->qProjSize;
-
-  int kt_block_size = m->kProjSize;
-  int kt_req_block_size = kt_block_size * m->num_q_heads *
-                          (BatchConfig::max_sequence_length() +
-                           BatchConfig::MAX_SPEC_TREE_TOKEN_NUM);
-  int vt_block_size = m->vProjSize;
-  int vt_req_block_size = vt_block_size * m->num_q_heads *
-                          (BatchConfig::max_sequence_length() +
-                           BatchConfig::MAX_SPEC_TREE_TOKEN_NUM);
-  assert(m->qProjSize == m->kProjSize);
-
-  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
-    if (bc->request_completed[i]) {
-      continue;
-    }
-    // else if (tokens_previous_requests < bc->num_generation_tokens) {
-    //   tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
-    //   continue;
-    // }
-
-    // all requests in prompt phase should only have one sub requests;
-    assert(bc->sub_requests[i] == 1);
-    // int num_new_tokens = bc->num_processing_tokens[i];
-    // int total_tokens = bc->token_last_available_idx[i] + 1;
-
-    int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
-    int total_tokens = bc->requestsInfo[i].first_token_depth_in_request +
-                       bc->requestsInfo[i].num_tokens_in_batch;
-
-    if (num_new_tokens <= 0) {
-      continue;
-    }
-
-    // Compute (QK^T/sqrt(d_k))
-    int m_ = num_new_tokens;
-    int n = total_tokens;
-    int k = m->qProjSize;
-    int lda = k * m->num_q_heads * QKV_WEIGHT_NUM, ldb = k * m->num_q_heads,
-        ldc = m_;
-    int strideA = q_block_size;
-    int strideB = kt_block_size;
-    int strideC = num_new_tokens * total_tokens;
-
-    // a flag of using this scaling alpha
-    DT alpha = 1.0f, beta = 0.0f;
-    if (*m->qk_prod_scaling) {
-      alpha = static_cast<DT>(1.0f / sqrt(m->kProjSize));
-    }
-    // To get A, skip over Q entries from previous requests (same head)
-    DT const *A = static_cast<DT *>(m->devQKVProjArray) +
-                  bc->requestsInfo[i].first_token_offset_in_batch *
-                      m->qProjSize * m->num_q_heads * QKV_WEIGHT_NUM;
-    // To get B, skip over K entries from previous requests (all heads +
-    // padding)
-
-    // print_tensor<float>((float*)A, 32, "A");
-    std::cout << "meta: " << num_new_tokens << ", " << total_tokens << "\n";
-    DT const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
-
-    // if (i == 0 && sub_req_id == 0 &&
-    //     bc->beam_slots.at(0).current_depth == 1) {
-    //   int offset = (float *)B - m->keyCache;
-    //   printf("key cache offset %d\n", kt_req_block_size);
-    // }
-    // To get C, skip over QK^T products from previous requests
-    DT *C = static_cast<DT *>(m->qk_prods) +
-            m->num_q_heads * tokens_prev_requests_squares;
-    checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                         CUBLAS_OP_T,
-                                         CUBLAS_OP_N,
-                                         m_,
-                                         n,
-                                         k,
-                                         &alpha,
-                                         A,
-                                         cublas_data_type,
-                                         lda,
-                                         strideA,
-                                         B,
-                                         cublas_data_type,
-                                         ldb,
-                                         strideB,
-                                         &beta,
-                                         C,
-                                         cublas_data_type,
-                                         ldc,
-                                         strideC,
-                                         m->num_q_heads,
-                                         compute_type,
-                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-    // print_tensor<float>((float*)C, 32, "C");
-    // add alibi position bias to qk production
-    // add alibi position bias to qk production
-    if (*m->position_bias) {
-      size_t parallelism = m->num_q_heads * total_tokens * num_new_tokens;
-      apply_position_bias_qkprd<<<GET_BLOCKS(parallelism),
-                                  min((size_t)CUDA_NUM_THREADS, parallelism),
-                                  0,
-                                  stream>>>(C,
-                                            num_new_tokens,
-                                            total_tokens,
-                                            m->num_q_heads,
-                                            m->global_num_q_heads,
-                                            shard_id);
-    }
-    // Fill all elements above diagonal in qk prods with -inf to force
-    // causal attention.
-    assert(num_new_tokens <= total_tokens);
-    if (num_new_tokens > 1) {
-      size_t parallelism = m->num_q_heads * num_new_tokens * total_tokens;
-      spec_fill_entries_above_diagonal<<<GET_BLOCKS(parallelism),
-                                         min((size_t)CUDA_NUM_THREADS,
-                                             parallelism),
-                                         0,
-                                         stream>>>(C,
-                                                   num_new_tokens,
-                                                   total_tokens,
-                                                   m->num_q_heads,
-                                                   static_cast<DT>(-INFINITY));
-    }
-    // Compute Softmax(QK^T/sqrt(d_k))
-    // Before modifying the parameters below, make sure to read the following
-    // description of the CUDNN_TENSOR_NCHW tensor layout, from
-    // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#cudnnTensorFormat_t:
-    // This tensor format specifies that the data is laid out in the following
-    // order: batch size, feature maps, rows, columns. The strides are
-    // implicitly defined in such a way that the data are contiguous in memory
-    // with no padding between images, feature maps, rows, and columns; the
-    // columns are the inner dimension and the images are the outermost
-    // dimension.
-    int n_param = m->num_q_heads;
-    int c_param = total_tokens;
-    int h_param = 1;
-    int w_param = num_new_tokens;
-    checkCUDNN(cudnnSetTensor4dDescriptor(m->qk_tensor,
-                                          CUDNN_TENSOR_NCHW,
-                                          cudnn_data_type,
-                                          n_param,
-                                          c_param,
-                                          h_param,
-                                          w_param));
-    float softmax_alpha = 1.0f, softmax_beta = 0.0f;
-    DT *C_softmax = static_cast<DT *>(m->qk_prods_softmax) +
-                    m->num_q_heads * tokens_prev_requests_squares;
-    // The softmax operation below is executed according to the
-    // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
-    // softmax operation is computed per spatial location (H,W) per image (N)
-    // across dimension C.
-    checkCUDNN(cudnnSoftmaxForward(m->handle.dnn,
-                                   CUDNN_SOFTMAX_ACCURATE,
-                                   CUDNN_SOFTMAX_MODE_CHANNEL,
-                                   &softmax_alpha,
-                                   m->qk_tensor,
-                                   C,
-                                   &softmax_beta,
-                                   m->qk_tensor,
-                                   C_softmax));
-    // Matmul softmax(QK^T/sqrt(d_k)) by V
-    alpha = 1.0f, beta = 0.0f;
-    m_ = m->vProjSize;
-    n = num_new_tokens;
-    k = total_tokens;
-    lda = m_ * m->num_q_heads, ldb = n, ldc = m_ * m->num_q_heads;
-    strideA = vt_block_size;
-    strideB = num_new_tokens * total_tokens;
-    strideC = m->vProjSize;
-    // To get A, skip over V^T entries from previous requests (all heads +
-    // padding)
-    A = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
-    // To get B, skip over softmax(QK^T/sqrt(d_k)) entries from previous
-    // requests (all heads)
-    B = C_softmax;
-    // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
-    // requests
-
-    // print_tensor<float>((float*)C_softmax, 32, "C_softmax");
-    C = static_cast<DT *>(m->attn_heads) +
-        (tokens_previous_requests + bc->num_generation_tokens) *
-            m->num_q_heads * m->vProjSize;
-    checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                         CUBLAS_OP_N,
-                                         CUBLAS_OP_T,
-                                         m_,
-                                         n,
-                                         k,
-                                         &alpha,
-                                         A,
-                                         cublas_data_type,
-                                         lda,
-                                         strideA,
-                                         B,
-                                         cublas_data_type,
-                                         ldb,
-                                         strideB,
-                                         &beta,
-                                         C,
-                                         cublas_data_type,
-                                         ldc,
-                                         strideC,
-                                         m->num_q_heads,
-                                         compute_type,
-                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-
-    tokens_previous_requests += num_new_tokens;
-    tokens_prev_requests_squares += num_new_tokens * total_tokens;
-  }
-
-  // assert(tokens_previous_requests == num_tokens);
-}
-
-template <typename DT>
-void inference_kernel(SpecInferIncMultiHeadSelfAttentionMeta const *m,
-                      BeamSearchBatchConfig const *bc,
-                      int shard_id,
-                      DT const *input_ptr,
-                      DT const *weight_ptr,
-                      DT *output_ptr,
-                      DT const *bias_ptr,
-                      cudaStream_t stream) {
-  // phase 1: Implement kernel to compute KQV for input tokens
-
-  compute_qkv_kernel(m,
-                     bc,
-                     shard_id,
-                     input_ptr,
-                     weight_ptr,
-                     static_cast<DT *>(m->devQKVProjArray),
-                     bias_ptr,
-                     stream);
-  // phase 2: Update key/val cache
-  update_kv_cache_kernel<DT>(m, bc, stream);
-  // std::cout << "specinfer kernel token num: " << bc->num_generation_tokens
-  //           << ", " << bc->num_tokens << "\n";
-  if (bc->num_generation_tokens > 0) {
-    printf("spec inc generation decoding\n");
-    compute_specinfer_attention_kernel_generation<DT>(
-        m, bc, static_cast<DT *>(m->attn_heads), stream);
-  }
-  // phase 3: Compute attention score
-  // 3 kernels for pahse 3: matmul1 - softmax - matmal2
-  if (bc->num_tokens > bc->num_generation_tokens) {
-    printf("spec inc prompt decoding\n");
-    compute_attention_kernel_prompt(
-        m, bc, shard_id, output_ptr, bias_ptr, weight_ptr, stream);
-  }
-  // compute_attention_kernel_prompt(
-  //       m, bc, shard_id, output_ptr, bias_ptr, weight_ptr, stream);
-
-  // compute output production and bias together for all tokens
-  int num_tokens = bc->num_active_tokens();
-
-  // std::cout << "specinfer num tokens: " << num_tokens;
-
-  compute_o_prod_bias(
-      m, bc, shard_id, output_ptr, weight_ptr, bias_ptr, num_tokens, stream);
-}
-
-} // namespace SpecInferIncMultiHeadAttention
-} // namespace Kernels
-
-/*static*/
-void SpecInferIncMultiHeadSelfAttention::inference_kernel_wrapper(
-    SpecInferIncMultiHeadSelfAttentionMeta const *m,
-    BeamSearchBatchConfig const *bc,
-    int shard_id,
-    GenericTensorAccessorR const &input,
-    GenericTensorAccessorR const &weight,
-    GenericTensorAccessorW const &output,
-    GenericTensorAccessorR const &bias) {
-  cudaStream_t stream;
-  checkCUDA(get_legion_stream(&stream));
-  bool use_bias = *m->qkv_bias || *m->final_bias;
-
-  cudaEvent_t t_start, t_end;
-  if (m->profiling) {
-    cudaEventCreate(&t_start);
-    cudaEventCreate(&t_end);
-    cudaEventRecord(t_start, stream);
-  }
-
-  assert(input.data_type == weight.data_type);
-  assert(input.data_type == output.data_type);
-  if (use_bias) {
-    assert(input.data_type == bias.data_type);
-  }
-
-  if (input.data_type == DT_HALF) {
-    half const *bias_ptr =
-        use_bias ? bias.get_half_ptr() : static_cast<half const *>(nullptr);
-    Kernels::SpecInferIncMultiHeadAttention::inference_kernel(
-        m,
-        bc,
-        shard_id,
-        input.get_half_ptr(),
-        weight.get_half_ptr(),
-        output.get_half_ptr(),
-        bias_ptr,
-        stream);
-  } else if (input.data_type == DT_FLOAT) {
-    float const *bias_ptr =
-        use_bias ? bias.get_float_ptr() : static_cast<float const *>(nullptr);
-    Kernels::SpecInferIncMultiHeadAttention::inference_kernel(
-        m,
-        bc,
-        shard_id,
-        input.get_float_ptr(),
-        weight.get_float_ptr(),
-        output.get_float_ptr(),
-        bias_ptr,
-        stream);
-  } else {
-    assert(false && "Unspported data type");
-  }
-
-  if (m->profiling) {
-    cudaEventRecord(t_end, stream);
-    checkCUDA(cudaEventSynchronize(t_end));
-    float elapsed = 0;
-    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
-    cudaEventDestroy(t_start);
-    cudaEventDestroy(t_end);
-    printf("SpecInferIncMultiHeadSelfAttention forward time = %.2fms\n",
-           elapsed);
-    // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
-    // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
-    // acc_output.rect, "[Attention:forward:output]");
-  }
-  // save_tensor<float>(output.get_float_ptr(), 768 * 3,
-  // "/home/xinhaoc/FlexFlow/inference/output/fk1.txt");
-  // save_tensor<float>(output.get_float_ptr() + 768 * 3, 768 * 3,
-  // "/home/xinhaoc/FlexFlow/inference/output/fk2.txt");
-
-  // if(bc->num_tokens == 1){
-  //   print_tensor<float>(input.get_float_ptr(), 32, "specinc input");
-  //   print_tensor<float>(output.get_float_ptr(), 32, "specinc output");
-  //   assert(false);
-  // }
-}
-
-SpecInferIncMultiHeadSelfAttentionMeta::SpecInferIncMultiHeadSelfAttentionMeta(
-    FFHandler handler,
-    SpecInferIncMultiHeadSelfAttention const *attn,
-    GenericTensorAccessorR const &weight,
-    MemoryAllocator &gpu_mem_allocator,
-    int num_samples,
-    int _num_q_heads,
-    int _num_kv_heads)
-    : IncMultiHeadSelfAttentionMeta(handler,
-                                    BEAM_SEARCH_MODE,
-                                    attn,
-                                    attn->qSize,
-                                    attn->kSize,
-                                    attn->vSize,
-                                    attn->qProjSize,
-                                    attn->kProjSize,
-                                    attn->vProjSize,
-                                    attn->oProjSize,
-                                    attn->apply_rotary_embedding,
-                                    attn->qkv_bias,
-                                    attn->scaling_query,
-                                    attn->qk_prod_scaling,
-                                    attn->position_bias,
-                                    attn->final_bias,
-                                    attn->scaling_factor,
-                                    weight,
-                                    gpu_mem_allocator,
-                                    num_samples,
-                                    attn->num_q_heads,
-                                    attn->num_kv_heads,
-                                    _num_q_heads,
-                                    _num_kv_heads,
-                                    DT_NONE,
-                                    false) {
-  cudaStream_t stream;
-  checkCUDA(get_legion_stream(&stream));
-  checkCUDNN(cudnnSetStream(handler.dnn, stream));
-
-  // allocate memory for the seqArray and reserve space
-  {
-    // size_t causal_mask_size = BatchConfig::MAX_NUM_REQUESTS;
-    // size_t total_size = causal_mask_size * sizeof(BatchConfig::BitMask);
-    // gpu_mem_allocator.create_legion_instance(beam_search_reserve_inst,
-    //                                          total_size);
-
-    beam_token_infos =
-        static_cast<BeamSearchBatchConfig::BeamSearchPerTokenInfo *>(
-            handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
-            sizeof(BatchConfig::requestsInfo));
-
-    beam_request_infos =
-        static_cast<BeamSearchBatchConfig::BeamSearchPerRequestInfo *>(
-            handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
-            sizeof(BatchConfig::requestsInfo) +
-            sizeof(BeamSearchBatchConfig::beamTokenInfo));
-    causalMask = static_cast<BatchConfig::BitMask *>(
-        handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
-        sizeof(BatchConfig::requestsInfo) +
-        sizeof(BeamSearchBatchConfig::beamTokenInfo) +
-        sizeof(BeamSearchBatchConfig::beamRequestsInfo));
-
-    // causalMask = gpu_mem_allocator.allocate_instance<BatchConfig::BitMask>(
-    //     causal_mask_size);
-    // beam_token_infos =
-    //     gpu_mem_allocator
-    //         .allocate_instance<BeamSearchBatchConfig::BeamSearchPerTokenInfo>(
-    //             beam_tokeninfo_size);
-    // offset += beam_tokeninfo_size *
-    //           sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo);
-    // beam_request_infos =
-    //     gpu_mem_allocator
-    //         .allocate_instance<BeamSearchBatchConfig::BeamSearchPerRequestInfo>(
-    //             beam_requestinfo_size);
-    // offset += beam_requestinfo_size *
-    //           sizeof(BeamSearchBatchConfig::BeamSearchPerRequestInfo);
-    // assert(offset == total_size);
-    // assert(gpu_mem_allocator.instance_total_size ==
-    //        gpu_mem_allocator.instance_allocated_size);
-  }
-
-  cudaStreamSynchronize(stream);
-}
-
-SpecInferIncMultiHeadSelfAttentionMeta::~SpecInferIncMultiHeadSelfAttentionMeta(
-    void) {
-  if (beam_search_reserve_inst != Realm::RegionInstance::NO_INST) {
-    beam_search_reserve_inst.destroy();
-  }
-}
-
-}; // namespace FlexFlow
diff --git a/src/ops/tree attn kernel, 0----> -0.029753357172 b/src/ops/tree attn kernel, 0----> -0.029753357172
deleted file mode 100644
index e4f14ee757..0000000000
--- a/src/ops/tree attn kernel, 0----> -0.029753357172	
+++ /dev/null
@@ -1 +0,0 @@
-tree attn kernel, 0----> -0.02975335717201232910 0.01930358447134494781 0.03780741989612579346 0.11878532171249389648 -0.03523746877908706665 0.02421043440699577332 0.03719477355480194092 -0.00304851122200489044 0.02062662504613399506 0.06683708727359771729 -0.00642335414886474609 -0.00504039414227008820 0.02955199964344501495 0.00648811273276805878 0.00558663159608840942 0.02003456838428974152 -0.04041406139731407166 0.00736814411357045174 -0.04575226455926895142 0.03949077427387237549 0.05742383748292922974 0.04866250604391098022 0.04687267541885375977 -0.00701304525136947632 -0.03712264448404312134 -0.02175992354750633240 -0.03979443758726119995 0.03961737453937530518 -0.07450901716947555542 0.02090370282530784607 -0.03487894684076309204 0.01653470844030380249
\ No newline at end of file
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index a4329f52db..5c6527baf9 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -81,30 +81,22 @@ __global__ void compute_attention_kernel_fused_kernel(
 
   int const first_step = 0;
 
-  int const tlength = request_infos[batch_config_request_id].first_token_depth_in_request +
-                      request_infos[batch_config_request_id].num_tokens_in_batch;
-  int const qlength = request_infos[batch_config_request_id].num_tokens_in_batch;
+  int const tlength =
+      request_infos[batch_config_request_id].first_token_depth_in_request +
+      request_infos[batch_config_request_id].num_tokens_in_batch;
+  int const qlength =
+      request_infos[batch_config_request_id].num_tokens_in_batch;
 
   BatchConfig::BitMask bitmask = causalMask[batch_config_request_id];
 
-  // bitmask.mask[1] = 3;
-  // if (head_idx == 0 && tidx == 0) {
-  //   printf("tree attn fused kernel req id %d %d, %d, %d, %lld\n",
-  //          request_idx,
-  //          tlength,
-  //          qlength,
-  //          bitmask.non_tree_cache_size,
-  //          bitmask.mask[3]);
-  // }
-
   int first_token_idx = 0;
   for (int r = 0; r < request_idx; r++) {
     first_token_idx += request_infos[r].num_tokens_in_batch;
   }
 
-  if(tidx == 0 && head_idx == 0){
-    printf("tree req: %d, %d\n", request_idx, first_token_idx);
-  }
+  // if(tidx == 0 && head_idx == 0){
+  //   printf("tree req: %d, %d\n", request_idx, first_token_idx);
+  // }
 
   // shared memory objects
   extern __shared__ char smem_[];
@@ -174,26 +166,11 @@ __global__ void compute_attention_kernel_fused_kernel(
             (ti >= bitmask.non_tree_cache_size &&
              (!(bitmask.mask[ti - bitmask.non_tree_cache_size] & (1 << qi))));
 
-        // if (head_idx == 0 && qi == 9 && mask) {
-        //   printf("tree attn mask for first token %d, %lld, %d, %d, %d\n",
-        //          ti,
-        //          bitmask.mask[ti - bitmask.non_tree_cache_size],
-        //          bitmask.non_tree_cache_size,
-        //         request_idx,
-        //          qi);
-        // }
-        // if (blockIdx.y == 0 && blockIdx.x == 0 && qi == 3 && mask) {
-        //   printf("tree attn mask for third token %d, %lld, %d, %d\n",
-        //          ti,
-        //          bitmask.mask[ti - bitmask.non_tree_cache_size],
-        //          bitmask.non_tree_cache_size,
-        //          qi);
-        // }
-
         qk_max = mask ? qk_max : fmaxf(qk_max, qk);
 
         // if (head_idx == 0 && qi == 0 && !mask) {
-        //   printf("tree attn qkqkqkqk request id %d,  %d %.10f, %.10f, %.10f\n ",
+        //   printf("tree attn qkqkqkqk request id %d,  %d %.10f, %.10f, %.10f\n
+        //   ",
         //          request_idx,
         //          ti,
         //          qk,
@@ -250,10 +227,6 @@ __global__ void compute_attention_kernel_fused_kernel(
     // Compute the sum.
     exp_sum = block_sum<WARPS_PER_BLOCK>(&red_smem[WARPS_PER_BLOCK], exp_sum);
 
-    // if (head_idx == 0 && tidx == 0 && qi == 9) {
-    //   printf("expsum %.10f\n", exp_sum);
-    // }
-
     // softmax
     float inv_sum = __fdividef(1.f, exp_sum + 1.e-6);
     for (int ti = first_step + tidx; ti < tlength; ti += THREADS_PER_BLOCK) {
@@ -261,9 +234,6 @@ __global__ void compute_attention_kernel_fused_kernel(
     }
 
     __syncthreads();
-    // if (head_idx == 0 && tidx == 0 && qi == 9) {
-    //   printf("softmax %.10f\n", qk_smem[1]);
-    // }
 
     // value projection
     constexpr int V_VEC_SIZE = 16 / sizeof(DT);
@@ -282,12 +252,8 @@ __global__ void compute_attention_kernel_fused_kernel(
 
     // The base pointer for the value in the cache buffer.
     DT const *v_cache_batch =
-        value_cache + batch_config_request_id * max_seq_length * hidden_size + vi;
-    // DT const *v_cache_batch =
-    //     value_cache +
-    //     (beam_request_idx * max_beam_width + beam_sub_request_idx) *
-    //         max_seq_length * hidden_size +
-    //     vi;
+        value_cache + batch_config_request_id * max_seq_length * hidden_size +
+        vi;
 
     if (Dh == Dh_MAX || vi < Dh) {
       for (int ti = first_step + vo; ti < tlength; ti += V_PER_ITER) {
@@ -310,10 +276,6 @@ __global__ void compute_attention_kernel_fused_kernel(
     //   // Make sure we can start writing to shared memory.
     __syncthreads();
 
-    // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && qi == 1) {
-    //   printf("valueX %.10f\n", out.x);
-    // }
-
     // Run the final reduction amongst the different groups computing different
     // partial outputs.
     if (Dh == Dh_MAX || vi < Dh) {
@@ -391,19 +353,6 @@ __global__ void commit_tokens_kernel(
     int const req_id = committedTokenInfos[token_pos].request_index;
     int const tok_id = committedTokenInfos[token_pos].token_depth;
 
-    // if(i == 0){
-    //   printf("commit token: %d %d %f\n", token_idx_in_last_batch, tok_id,
-    //   kVal);
-    // }
-    // if(i == hidden_size){
-    //   printf("commit token 1: %d %d %f\n", token_idx_in_last_batch, tok_id,
-    //   kVal);
-    // }
-    // if(i == 2 * hidden_size){
-    //   printf("commit token 2: %d %d %f\n", token_idx_in_last_batch, tok_id,
-    //   kVal);
-    // }
-
     kCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
                offset] = kVal;
     vCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
@@ -500,11 +449,13 @@ __global__ void update_tree_branch_kv_cache_fused(
 
     int const request_token_offset =
         request_infos[req_id].first_token_offset_in_batch;
-    int const first_token_depth = request_infos[req_id].first_token_depth_in_request;
+    int const first_token_depth =
+        request_infos[req_id].first_token_depth_in_request;
 
     // if(i % hidden_size == 0){
-    //   printf("update token request id: %d, %d, %d  real id %d, value%.10f\n", req_id,
-    //   token_idx, request_token_offset,(token_idx + first_token_depth - request_token_offset), kVal);
+    //   printf("update token request id: %d, %d, %d  real id %d, value%.10f\n",
+    //   req_id, token_idx, request_token_offset,(token_idx + first_token_depth
+    //   - request_token_offset), kVal);
     // }
     kCache_ptr[req_id * (hidden_size * max_seq_len) +
                (token_idx + first_token_depth - request_token_offset) *
@@ -591,8 +542,6 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
         num_new_tokens++;
       }
 
-      std::cout << "num_new_tokens: " << num_new_tokens << "\n";
-
       int total_tokens_in_request = bc->tokensInfo[j].abs_depth_in_request + 1;
       assert(num_new_tokens >= 1 && total_tokens_in_request >= num_new_tokens);
       {
@@ -873,12 +822,6 @@ void compute_attention_kernel_fused(TreeIncMultiHeadSelfAttentionMeta const *m,
   //  update K-V cache
   int num_new_tokens = bc->num_active_tokens();
   int parallelism = m->hidden_size * num_new_tokens;
-  // printf("update KV cache %d, idx: %d\n",
-  //        num_new_tokens,
-  //        bc->requestsInfo[0].first_token_depth_in_request);
-  // for (int i = 0; i < num_new_tokens; i++) {
-  //   printf("abs depth:%d\n", bc->tokensInfo[i].abs_depth_in_request);
-  // }
   update_tree_branch_kv_cache_fused<<<GET_BLOCKS(parallelism),
                                       min(CUDA_NUM_THREADS, parallelism),
                                       0,
@@ -970,18 +913,6 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
         m->bias_ptr, bias_ptr, m->biasSize, cudaMemcpyHostToDevice, stream);
     bias_ptr = static_cast<DT *>(m->bias_ptr);
   }
-  // cudaMemcpyAsync(m->token_infos,
-  //                 &(bc->tokensInfo),
-  //                 bc->num_active_tokens() *
-  //                     sizeof(TreeVerifyBatchConfig::PerTokenInfo),
-  //                 cudaMemcpyHostToDevice,
-  //                 stream);
-  // cudaMemcpyAsync(m->request_infos,
-  //                 &(bc->requestsInfo),
-  //                 bc->max_requests_per_batch() *
-  //                     sizeof(BatchConfig::PerRequestInfo),
-  //                 cudaMemcpyHostToDevice,
-  //                 stream);
   // phase 1: Implement kernel to compute KQV for input tokens
   compute_qkv_kernel(m,
                      bc,
@@ -992,9 +923,6 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
                      bias_ptr,
                      stream);
 
-  // print_tensor<float>((float *)m->devQKVProjArray, 32, "qkvtenor1"); 
-  // print_tensor<float>((float *)m->devQKVProjArray + 768 * (25 * 7) * 3, 32, "qkvtenor2");
-
   // phase 2: No need to update key/val cache
   // IncMultiHeadSelfAttention::update_kv_cache_kernel(
   //    m, bc, stream);
@@ -1037,8 +965,6 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
     cudaEventRecord(t_start, stream);
   }
 
-  std::cout << "tree input tokens: " << bc->num_active_tokens() << "\n";
-
   // assert(input.data_type == weight.data_type);
   assert(input.data_type == output.data_type);
   if (use_bias) {
@@ -1089,20 +1015,6 @@ void TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
     cudaEventDestroy(t_start);
     cudaEventDestroy(t_end);
   }
-
-  // print_tensor<float>(output.get_float_ptr(), 32, "tree attn kernel");
-
-  // save_tensor<float>(
-  //     input.get_float_ptr(),
-  //     768 * bc->num_active_tokens(),
-  //     "/home/xinhaoc/FlexFlow/inference/output/Newtreeinput.txt");
-  // save_tensor<float>(
-  //     output.get_float_ptr(),
-  //     768 * bc->num_active_tokens(),
-  //     "/home/xinhaoc/FlexFlow/inference/output/Newtreeoutput.txt");
-  // std::cout << "new tokens: " << bc->num_active_tokens() << "\n";
-
-  // assert(bc->num_tokens_to_commit == 0);
 }
 
 TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
diff --git a/src/runtime/ffconst_utils.cc b/src/runtime/ffconst_utils.cc
index 904bfbcaff..c7b6e1257a 100644
--- a/src/runtime/ffconst_utils.cc
+++ b/src/runtime/ffconst_utils.cc
@@ -154,8 +154,6 @@ std::string get_operator_type_name(OperatorType type) {
       return "SpecIncMultiHeadSelfAttention";
     case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION:
       return "TreeIncMultiHeadSelfAttention";
-     case OP_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION:
-      return "SpecInferPgraoIncMultiHeadSelfAttention";
     case OP_INPUT:
       return "Input";
     case OP_WEIGHT:
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index 46f7cc0f29..6d33dd9f27 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -51,7 +51,6 @@
 #include "flexflow/ops/topk.h"
 #include "flexflow/ops/transpose.h"
 #include "flexflow/ops/tree_inc_multihead_self_attention.h"
-#include "flexflow/ops/specinfer_inc_multihead_self_attention.h"
 #include "flexflow/parallel_ops/allreduce.h"
 #include "flexflow/parallel_ops/combine.h"
 #include "flexflow/parallel_ops/fused_parallel_op.h"
@@ -70,7 +69,7 @@ using FlexFlow::MachineView;
 LegionRuntime::Logger::Category log_graph("graph");
 LegionRuntime::Logger::Category log_simplify("graph_simplify");
 
-Node const Node::INVALID_NODE = Node();
+const Node Node::INVALID_NODE = Node();
 
 Node::Node(void) : guid(0), ptr(NULL) {}
 
@@ -2385,28 +2384,6 @@ GraphOptimalViewSerialized
         sez.serialize(attn->tensor_parallelism_degree);
         break;
       }
-      case OP_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION: {
-        SpecInferIncMultiHeadSelfAttention *attn =
-            (SpecInferIncMultiHeadSelfAttention *)op;
-        sez.serialize(attn->layer_guid.id);
-        sez.serialize(attn->layer_guid.transformer_layer_id);
-        sez.serialize(attn->layer_guid.model_id);
-        sez.serialize(attn->oProjSize);
-        sez.serialize(attn->num_q_heads);
-        sez.serialize(attn->qProjSize);
-        sez.serialize(attn->vProjSize);
-        sez.serialize(attn->dropout);
-        sez.serialize(attn->qkv_bias);
-        sez.serialize(attn->final_bias);
-        sez.serialize(attn->add_zero_attn);
-        sez.serialize(attn->apply_rotary_embedding);
-        sez.serialize(attn->scaling_query);
-        sez.serialize(attn->scaling_factor);
-        sez.serialize(attn->qk_prod_scaling);
-        sez.serialize(attn->position_bias);
-        sez.serialize(attn->num_kv_heads);
-        break;
-      }
       case OP_SOFTMAX: {
         Softmax *softmax = (Softmax *)op;
         sez.serialize(softmax->dim);
@@ -2937,52 +2914,6 @@ void FFModel::deserialize_graph_optimal_view(
                                                                  params);
         break;
       }
-      case OP_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION: {
-        assert(num_inputs == 1);
-        int embed_dim, num_q_heads, k_dim, v_dim, num_kv_heads;
-        float dropout, scaling_factor;
-        bool qkv_bias, final_bias, add_zero_attn, apply_rotary_embedding,
-            scaling_query, qk_prod_scaling, position_bias;
-        size_t id, transformer_layer_id, deserialized_model_id;
-        dez.deserialize(id);
-        dez.deserialize(transformer_layer_id);
-        dez.deserialize(deserialized_model_id);
-        LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
-        dez.deserialize(embed_dim);
-        dez.deserialize(num_q_heads);
-        dez.deserialize(k_dim);
-        dez.deserialize(v_dim);
-        dez.deserialize(dropout);
-        dez.deserialize(qkv_bias);
-        dez.deserialize(final_bias);
-        dez.deserialize(add_zero_attn);
-        dez.deserialize(apply_rotary_embedding);
-        dez.deserialize(scaling_query);
-        dez.deserialize(scaling_factor);
-        dez.deserialize(qk_prod_scaling);
-        dez.deserialize(position_bias);
-        dez.deserialize(num_kv_heads);
-
-        SpecInferIncMultiHeadSelfAttentionParams params;
-        params.embed_dim = embed_dim;
-        params.num_q_heads = num_q_heads;
-        params.kdim = k_dim;
-        params.vdim = v_dim;
-        params.dropout = dropout;
-        params.qkv_bias = qkv_bias;
-        params.final_bias = final_bias;
-        params.add_zero_attn = add_zero_attn;
-        params.layer_guid = layer_guid;
-        params.apply_rotary_embedding = apply_rotary_embedding;
-        params.scaling_query = scaling_query;
-        params.scaling_factor = scaling_factor;
-        params.qk_prod_scaling = qk_prod_scaling;
-        params.position_bias = position_bias;
-        params.num_kv_heads = num_kv_heads;
-        node = get_or_create_node<SpecInferIncMultiHeadSelfAttention>(inputs[0],
-                                                                      params);
-        break;
-      }
       case OP_TOPK: {
         node = TopK::deserialize(*this, dez, inputs, num_inputs);
         break;
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index e7f7c5f52d..52a1efc2ab 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -257,7 +257,6 @@ void InferenceManager::init_operators_inference(FFModel *model) {
         ((ParallelOp *)op)
             ->create_input_partition_inference(*model, inputs, outputs);
       }
-      printf("init op %s\n", op->name);
       op->init_inference(*model, inputs, outputs);
     }
   }
@@ -394,14 +393,13 @@ void InferenceManager::load_input_tokens_from_batch_config(
 }
 
 void InferenceManager::load_inference_metadata_batch_config(
-    BatchConfigFuture const &bc,
-    FFHandler *handlers) {
+    BatchConfigFuture const &bc, FFHandler *handlers) {
   Context ctx = ff_config.lg_ctx;
   Runtime *runtime = ff_config.lg_hlr;
   ArgumentMap argmap;
 
-  Rect<1> task_rect(Point<1>(0),
-                    Point<1>(ff_config.workersPerNode * ff_config.numNodes - 1));
+  Rect<1> task_rect(
+      Point<1>(0), Point<1>(ff_config.workersPerNode * ff_config.numNodes - 1));
   IndexSpaceT<1> task_is = runtime->create_index_space(ctx, task_rect);
 
   // int rank = 0;
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index cf72f2d40b..c3ee73d78c 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -59,7 +59,6 @@
 #include "flexflow/ops/sigmoid_silu_multi.h"
 #include "flexflow/ops/softmax.h"
 #include "flexflow/ops/spec_inc_multihead_self_attention.h"
-#include "flexflow/ops/specinfer_inc_multihead_self_attention.h"
 #include "flexflow/ops/split.h"
 #include "flexflow/ops/topk.h"
 #include "flexflow/ops/transpose.h"
@@ -94,10 +93,10 @@ Op::Op(FFModel &model,
        int numWeights,
        bool allocate_weights,
        int numOutputs,
-       ParallelTensor const input1,
-       ParallelTensor const input2,
-       ParallelTensor const input3,
-       ParallelTensor const input4)
+       const ParallelTensor input1,
+       const ParallelTensor input2,
+       const ParallelTensor input3,
+       const ParallelTensor input4)
     : Op(model,
          otype,
          dtype,
@@ -117,10 +116,10 @@ Op::Op(FFModel &model,
        int _numInputs,
        int _numWeights,
        int _numOutputs,
-       ParallelTensor const _input1,
-       ParallelTensor const _input2,
-       ParallelTensor const _input3,
-       ParallelTensor const _input4)
+       const ParallelTensor _input1,
+       const ParallelTensor _input2,
+       const ParallelTensor _input3,
+       const ParallelTensor _input4)
     : op_type(_otype), data_type(_dtype), op_guid(model.op_global_guid++),
       numInputs(_numInputs), numWeights(_numWeights), numOutputs(_numOutputs),
       profiling(model.config.profiling),
@@ -1025,9 +1024,9 @@ void Op::register_output_parallel_dims(
                                      operation);
 }
 
-int Op::get_output_to_input_dim_mapping(ParallelTensor const output,
+int Op::get_output_to_input_dim_mapping(const ParallelTensor output,
                                         int output_dim,
-                                        ParallelTensor const input) {
+                                        const ParallelTensor input) {
   int output_idx = -1, input_idx = -1;
   for (int i = 0; i < numOutputs; i++) {
     if (output == outputs[i]) {
@@ -1060,9 +1059,9 @@ int Op::get_output_to_input_dim_mapping(ParallelTensor const output,
   return -1;
 }
 
-int Op::get_output_to_weight_dim_mapping(ParallelTensor const output,
+int Op::get_output_to_weight_dim_mapping(const ParallelTensor output,
                                          int output_dim,
-                                         ParallelTensor const weight) {
+                                         const ParallelTensor weight) {
   int output_idx = -1, weight_idx = -1;
   for (int i = 0; i < numOutputs; i++) {
     if (output == outputs[i]) {
@@ -1659,7 +1658,7 @@ Tensor FFModel::create_tensor(int numdim,
 }
 
 ParallelTensor FFModel::create_parallel_tensor(int numdim,
-                                               ParallelDim const dims[],
+                                               const ParallelDim dims[],
                                                DataType data_type,
                                                Op const *op,
                                                int idx,
@@ -1692,7 +1691,7 @@ Tensor FFModel::create_tensor_legion_ordering(int numdim,
 
 ParallelTensor
     FFModel::create_parallel_tensor_legion_ordering(int numdim,
-                                                    ParallelDim const dims[],
+                                                    const ParallelDim dims[],
                                                     DataType data_type,
                                                     Op const *op,
                                                     int idx,
@@ -1742,7 +1741,7 @@ Tensor FFModel::create_tensor(int const dims[],
 }
 
 template <int NDIM>
-ParallelTensor FFModel::create_parallel_tensor(ParallelDim const dims[],
+ParallelTensor FFModel::create_parallel_tensor(const ParallelDim dims[],
                                                DataType data_type,
                                                Op const *owner_op,
                                                int owner_idx,
@@ -1823,7 +1822,7 @@ Parameter FFModel::create_weight(int numdim,
 }
 
 template <int NDIM>
-ParallelParameter FFModel::create_parallel_weight(ParallelDim const dims[],
+ParallelParameter FFModel::create_parallel_weight(const ParallelDim dims[],
                                                   DataType data_type,
                                                   Op const *owner_op,
                                                   bool create_grad,
@@ -1854,7 +1853,7 @@ ParallelParameter FFModel::create_parallel_weight(ParallelDim const dims[],
 }
 
 ParallelParameter FFModel::create_parallel_weight(int numdim,
-                                                  ParallelDim const dims[],
+                                                  const ParallelDim dims[],
                                                   DataType data_type,
                                                   Op const *owner_op,
                                                   bool create_grad,
@@ -1874,7 +1873,7 @@ ParallelParameter FFModel::create_parallel_weight(int numdim,
 
 ParallelParameter FFModel::create_parallel_weight_legion_ordering(
     int numdim,
-    ParallelDim const dims[],
+    const ParallelDim dims[],
     DataType data_type,
     Op const *owner_op,
     bool create_grad,
@@ -2088,7 +2087,7 @@ void FFModel::map_weight_with_dim(ParallelTensor weight,
 }
 
 bool FFModel::get_parallel_tensor_from_tensor(
-    Tensor const tensor, ParallelTensor &parallel_tensor) const {
+    const Tensor tensor, ParallelTensor &parallel_tensor) const {
   // check if tensor->parallel_tensor is already set
   if (tensor->parallel_tensor != nullptr) {
     parallel_tensor = tensor->parallel_tensor;
@@ -2125,7 +2124,7 @@ bool FFModel::get_parallel_tensor_from_tensor(
 }
 
 void FFModel::create_disjoint_partition(int num_dims,
-                                        ParallelDim const dims[],
+                                        const ParallelDim dims[],
                                         IndexSpace const &part_is,
                                         LogicalRegion const &region,
                                         LogicalPartition &part) {
@@ -2148,7 +2147,7 @@ void FFModel::create_disjoint_partition(int num_dims,
 
 template <int NDIM, int TDIM>
 void FFModel::create_disjoint_partition_with_dim2(
-    ParallelDim const dims[],
+    const ParallelDim dims[],
     IndexSpaceT<TDIM> const &part_is,
     LogicalRegion const &region,
     LogicalPartition &part) {
@@ -2181,7 +2180,7 @@ void FFModel::create_disjoint_partition_with_dim2(
 }
 
 void FFModel::create_aliased_partition(int num_dims,
-                                       ParallelDim const dims[],
+                                       const ParallelDim dims[],
                                        int aliased_dim,
                                        IndexSpace const &part_is,
                                        LogicalRegion const &region,
@@ -2205,7 +2204,7 @@ void FFModel::create_aliased_partition(int num_dims,
 
 template <int NDIM, int TDIM>
 void FFModel::create_aliased_partition_with_dim2(
-    ParallelDim const dims[],
+    const ParallelDim dims[],
     int aliased_dim,
     IndexSpaceT<TDIM> const &part_is,
     LogicalRegion const &region,
@@ -2242,7 +2241,7 @@ void FFModel::create_aliased_partition_with_dim2(
 }
 
 template <int NDIM>
-void FFModel::create_disjoint_partition(ParallelTensor const tensor,
+void FFModel::create_disjoint_partition(const ParallelTensor tensor,
                                         IndexSpaceT<NDIM> const &part_is,
                                         LogicalPartition &part_fwd,
                                         LogicalPartition &part_bwd) {
@@ -2290,7 +2289,7 @@ void FFModel::create_disjoint_partition(ParallelTensor const tensor,
 
 template <int NDIM, int TDIM>
 void FFModel::create_data_parallel_partition_with_diff_dims(
-    ParallelTensor const tensor,
+    const ParallelTensor tensor,
     IndexSpaceT<TDIM> const &part_is,
     LogicalPartition &part_fwd,
     LogicalPartition &part_bwd) {
@@ -2672,7 +2671,7 @@ IndexSpace FFModel::get_task_is(ParallelConfig const &pc) const {
   return get_task_is(view);
 }
 
-IndexSpace FFModel::get_or_create_task_is(ParallelTensor const tensor) {
+IndexSpace FFModel::get_or_create_task_is(const ParallelTensor tensor) {
   MachineView view;
   view.ndims = 0;
   for (int i = 0; i < tensor->num_dims; i++) {
@@ -3039,12 +3038,6 @@ Op *FFModel::create_operator_from_layer(
       operators.push_back(op);
       return op;
     }
-    case OP_SPECINFER_INC_MULTIHEAD_SELF_ATTENTION: {
-      Op *op = SpecInferIncMultiHeadSelfAttention::create_operator_from_layer(
-          *this, layer, inputs);
-      operators.push_back(op);
-      return op;
-    }
     case OP_BATCHMATMUL: {
       Op *op = BatchMatmul::create_operator_from_layer(*this, layer, inputs);
       operators.push_back(op);
@@ -3234,7 +3227,7 @@ Op *FFModel::create_operator_from_layer(
 }
 
 void FFModel::create_operators_from_layers() {
-  std::map<Tensor const, ParallelTensor> tensors_to_parallel_tensors;
+  std::map<const Tensor, ParallelTensor> tensors_to_parallel_tensors;
   // for (auto const &l : layers) {
   for (int layer_idx = 0; layer_idx < layers.size(); layer_idx++) {
     auto const &l = layers[layer_idx];
@@ -3980,38 +3973,38 @@ void FFIterationConfig::reset() {
 
 // Default Config Parameters
 struct DefaultConfig {
-  static int const epochs = 1;
+  const static int epochs = 1;
   // const static int iterations = 1;
-  static int const batchSize = 64;
-  static bool const profiling = false;
-  static bool const inference_debugging = false;
+  const static int batchSize = 64;
+  const static bool profiling = false;
+  const static bool inference_debugging = false;
   constexpr static float learningRate = 0.01f;
   constexpr static float weightDecay = 0.0001f;
-  static size_t const workSpaceSize = (size_t)128 * 1024 * 1024; // 128 MB
-  static int const numNodes = 1;
-  static int const workersPerNode = 0;
-  static int const cpusPerNode = 0;
-  static size_t const searchBudget = -1;
-  static size_t const simulatorWorkSpaceSize =
+  const static size_t workSpaceSize = (size_t)128 * 1024 * 1024; // 128 MB
+  const static int numNodes = 1;
+  const static int workersPerNode = 0;
+  const static int cpusPerNode = 0;
+  const static size_t searchBudget = -1;
+  const static size_t simulatorWorkSpaceSize =
       (size_t)2 * 1024 * 1024 * 1024; // 2 GB
   constexpr static float searchAlpha = 1.2f;
-  static bool const searchOverlapBackwardUpdate = false;
-  static size_t const offloadReserveSpaceSize =
+  const static bool searchOverlapBackwardUpdate = false;
+  const static size_t offloadReserveSpaceSize =
       (size_t)8 * 1024 * 1024 * 1024; // 8 GB
-  static bool const cpuOffload = false;
-  static bool const onlyDataParallel = true;
-  static bool const enableSampleParallel = true;
-  static bool const enableParameterParallel = false;
-  static bool const enableAttributeParallel = false;
-  static bool const enableInplaceOptimizations = false;
-  static bool const allowTensorOpMathConversion = false;
-  static int const machine_model_version = 0;
-  static int const simulator_segment_size = 16777216; // 16 MB
-  static int const simulator_max_num_segments = 1;
-  static int const base_optimize_threshold = 10;
-  static bool const enable_control_replication = true;
+  const static bool cpuOffload = false;
+  const static bool onlyDataParallel = true;
+  const static bool enableSampleParallel = true;
+  const static bool enableParameterParallel = false;
+  const static bool enableAttributeParallel = false;
+  const static bool enableInplaceOptimizations = false;
+  const static bool allowTensorOpMathConversion = false;
+  const static int machine_model_version = 0;
+  const static int simulator_segment_size = 16777216; // 16 MB
+  const static int simulator_max_num_segments = 1;
+  const static int base_optimize_threshold = 10;
+  const static bool enable_control_replication = true;
   // The default python data loader type is 2 to enable control replication
-  static int const python_data_loader_type = 2;
+  const static int python_data_loader_type = 2;
 };
 
 FFConfig::FFConfig() {
@@ -6233,44 +6226,6 @@ void register_flexflow_internal_tasks(Runtime *runtime,
           TreeIncMultiHeadSelfAttention::inference_task>(registrar);
     }
   }
-  {
-    TaskVariantRegistrar registrar(
-        SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
-        "SpecInferIncMultiHeadSelfAttention Init");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    if (pre_register) {
-      Runtime::preregister_task_variant<
-          OpMeta *,
-          SpecInferIncMultiHeadSelfAttention::init_task>(
-          registrar, "SpecInferIncMultiHeadSelfAttention Init Task");
-    } else {
-      if (enable_control_replication) {
-        registrar.global_registration = false;
-      }
-      runtime->register_task_variant<
-          OpMeta *,
-          SpecInferIncMultiHeadSelfAttention::init_task>(registrar);
-    }
-  }
-  {
-    TaskVariantRegistrar registrar(
-        SPECINFER_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
-        "SpecInferIncMultiHeadSelfAttention Inference");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    if (pre_register) {
-      Runtime::preregister_task_variant<
-          SpecInferIncMultiHeadSelfAttention::inference_task>(
-          registrar, "SpecInferIncMultiHeadSelfAttention Inference Task");
-    } else {
-      if (enable_control_replication) {
-        registrar.global_registration = false;
-      }
-      runtime->register_task_variant<
-          SpecInferIncMultiHeadSelfAttention::inference_task>(registrar);
-    }
-  }
   // NoOp
   {
     TaskVariantRegistrar registrar(NOOP_INIT_TASK_ID, "Weight NCCL Init");
diff --git a/src/runtime/model.cpp b/src/runtime/model.cpp
index b51ab83091..5499a280a8 100644
--- a/src/runtime/model.cpp
+++ b/src/runtime/model.cpp
@@ -152,7 +152,7 @@ FFHandler
         .wait();
     handle.offload_reserve_space =
         workspaceInst.pointer_untyped(0, sizeof(char));
-  }else {
+   } else {
     handle.offload_reserve_space = nullptr;
   }
   if (handle.batch_config_metadata_size > 0) {
@@ -176,7 +176,7 @@ FFHandler
         .wait();
     handle.batch_config_metadata =
         workspaceInst.pointer_untyped(0, sizeof(char));
-  }else {
+  } else {
     handle.batch_config_metadata = nullptr;
   }
   // checkCUDA(hipMalloc(&handle.workSpace, handle.workSpaceSize));
diff --git a/src/runtime/model.cu b/src/runtime/model.cu
index 523b3c76f3..c885b29db2 100644
--- a/src/runtime/model.cu
+++ b/src/runtime/model.cu
@@ -148,11 +148,10 @@ FFHandler
         .wait();
     handle.offload_reserve_space =
         workspaceInst.pointer_untyped(0, sizeof(char));
-  }else {
+  } else {
     handle.offload_reserve_space = nullptr;
   }
   if (handle.batch_config_metadata_size > 0) {
-    printf("allocate instance for metadata %d\n", handle.batch_config_metadata_size);
     // allocate memory for offload reserve space
     Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
                          .only_kind(Memory::GPU_FB_MEM)
@@ -173,7 +172,7 @@ FFHandler
         .wait();
     handle.batch_config_metadata =
         workspaceInst.pointer_untyped(0, sizeof(char));
-  }else {
+  } else {
     handle.batch_config_metadata = nullptr;
   }
    
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index e30a7ee478..89d4ddaed4 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -182,7 +182,7 @@ size_t RequestManager::get_num_ssms() {
 RequestManager::RequestGuid
     RequestManager::register_new_request(std::vector<TokenId> const &prompt,
                                          int max_sequence_length) {
-  std::lock_guard<std::mutex> const lock(request_queue_mutex);
+  const std::lock_guard<std::mutex> lock(request_queue_mutex);
 
   // Add a new request
   Request request;
@@ -238,7 +238,7 @@ RequestManager::RequestGuid
 RequestManager::RequestGuid
     RequestManager::register_new_request(std::string const &prompt,
                                          int max_sequence_length) {
-  std::lock_guard<std::mutex> const lock(request_queue_mutex);
+  const std::lock_guard<std::mutex> lock(request_queue_mutex);
   // Add a new request
   Request request;
   request.status = Request::PENDING;
@@ -296,7 +296,7 @@ RequestManager::RequestGuid
 }
 
 bool RequestManager::is_request_completed(RequestGuid const &guid) {
-  std::lock_guard<std::mutex> const lock(request_queue_mutex);
+  const std::lock_guard<std::mutex> lock(request_queue_mutex);
   assert(all_requests.find(guid) != all_requests.end());
   Request const &request = all_requests[guid];
   // return request.tokens.size() >= request.max_sequence_length;
@@ -305,7 +305,7 @@ bool RequestManager::is_request_completed(RequestGuid const &guid) {
 
 GenerationResult
     RequestManager::get_generation_result(RequestGuid const &guid) {
-  std::lock_guard<std::mutex> const lock(request_queue_mutex);
+  const std::lock_guard<std::mutex> lock(request_queue_mutex);
   assert(request_generation_results.find(guid) !=
          request_generation_results.end());
   return request_generation_results[guid];
@@ -343,7 +343,7 @@ BatchConfig RequestManager::prepare_next_batch_task(
 
 BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
                                                InferenceResult const &result) {
-  std::lock_guard<std::mutex> const lock(request_queue_mutex);
+  const std::lock_guard<std::mutex> lock(request_queue_mutex);
 
   // Step 1: append result from previous iteration to request's tokens
   for (int i = 0; i < old_bc.num_tokens; i++) {
@@ -456,7 +456,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
         new_bc.requestsInfo[i].max_sequence_length =
             old_bc.requestsInfo[i].max_sequence_length;
         num_active_req++;
-        new_bc.requestsInfo[num_active_req].batch_config_request_id = i; 
+        new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
         if (new_bc.requestsInfo[i].first_token_depth_in_request + 1 ==
             request.tokens.size()) {
           // Incremental phase
@@ -504,7 +504,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
             new_request.max_sequence_length;
         new_bc.request_completed[i] = false;
         num_active_req++;
-        new_bc.requestsInfo[num_active_req].batch_config_request_id = i; 
+        new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
         // add profile_info for the new request
         ProfileInfo profile_info;
         profile_info.llm_decoding_steps = 1;
@@ -566,7 +566,7 @@ BeamSearchBatchConfig
     RequestManager::prepare_next_batch_init(TreeVerifyBatchConfig const &old_bc,
                                             InferenceResult const &result,
                                             int model_id) {
-  std::lock_guard<std::mutex> const lock(request_queue_mutex);
+  const std::lock_guard<std::mutex> lock(request_queue_mutex);
   if (verbose) {
     std::cout << "\n############### prepare_next_batch_init ###############\n";
   }
@@ -603,11 +603,10 @@ BeamSearchBatchConfig
     } else {
       committed_tokens[guid].clear();
     }
-    
 
     // iterate through all the tokens that belong to request i
     int root_abs_depth = request.tokens.size() - 1;
-    
+
     while (result_index < old_bc.num_tokens &&
            old_bc.tokensInfo[result_index].request_index == i) {
       int abs_depth = old_bc.tokensInfo[result_index].abs_depth_in_request;
@@ -640,14 +639,12 @@ BeamSearchBatchConfig
     }
 
     if (request.status == Request::RUNNING) {
-      std::cout << "verify running: " << dfs_tree_inputs.at(guid).size() << ", "
-                << tree_outputs.size() << "\n";
 
       std::vector<std::pair<BatchConfig::TokenId, int>> verified_tokens =
           traverse_verify_tree(guid, dfs_tree_inputs.at(guid), tree_outputs);
 
       log_req_mgr.print("Number of Verified Tokens = %zu",
-                        verified_tokens.size());                 
+                        verified_tokens.size());
       // check if the request is finished
       if (verified_tokens.size() + request.tokens.size() >=
           request.max_sequence_length) {
@@ -729,9 +726,6 @@ BeamSearchBatchConfig
 
       } else { // Request not finished, pass verified_tokens to next iteration
 
-        std::cout << "parse to next iteration: "
-                  << "\n";
-
         new_bc.request_completed[i] = false;
         new_bc.request_running[i] = true;
         num_active_req++;
@@ -745,18 +739,13 @@ BeamSearchBatchConfig
         new_bc.requestsInfo[i].max_sequence_length =
             old_bc.requestsInfo[i].max_sequence_length;
         new_bc.requestsInfo[i].num_tokens_in_batch = verified_tokens.size();
-        new_bc.requestsInfo[num_active_req].batch_config_request_id = i; 
+        new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
 
         // TODO: Beam Request Info, missing from VerifyTreeBatchConfig
         int new_max_depth =
             new_bc.requestsInfo[i].max_sequence_length -
             new_bc.requestsInfo[i].first_token_depth_in_request -
             verified_tokens.size();
-        // std::cout << "max depth: " << new_max_depth << ", "
-        //           << new_bc.requestsInfo[i].first_token_depth_in_request <<
-        //           ", "
-        //           << verified_tokens.size() << "\n";
-        // assert(false);
         new_bc.beamRequestsInfo[i].current_depth = 1;
 
         profiling_requests[request.guid].ssm_decoding_steps = 0;
@@ -794,9 +783,6 @@ BeamSearchBatchConfig
           // Beam Token Info
           new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = 0;
           new_bc.num_tokens++;
-          // std::cout << "num_gen ++ "
-          //           << "\n";
-          // num_generation_tokens++;
 
           // Add verified token to request's token list
           request.tokens.push_back(token.first);
@@ -816,11 +802,6 @@ BeamSearchBatchConfig
         log_req_mgr.print("Output: %s", output.c_str());
       }
 
-      // if (request.tokens.size() > 19 && i >= 7) {
-      //   std::cout << request.tokens.size() << "\n";
-      //   assert(false);
-      // }
-
     } else if (request.status == Request::PENDING) {
       new_bc.request_completed[i] = false;
       new_bc.request_running[i] = false;
@@ -838,7 +819,7 @@ BeamSearchBatchConfig
       new_bc.requestsInfo[i].max_sequence_length =
           old_bc.requestsInfo[i].max_sequence_length;
       new_bc.requestsInfo[i].num_tokens_in_batch = 0;
-      new_bc.requestsInfo[num_active_req].batch_config_request_id = i; 
+      new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
 
       // TODO: Beam Request Info, missing from VerifyTreeBatchConfig
       new_bc.beamRequestsInfo[i].current_depth = 1;
@@ -889,7 +870,7 @@ BeamSearchBatchConfig
                      (int)new_request.tokens.size());
         new_bc.requestsInfo[i].max_sequence_length =
             new_request.max_sequence_length;
-        new_bc.requestsInfo[num_active_req].batch_config_request_id = i; 
+        new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
 
         // add profile_info for the new request
         ProfileInfo profile_info;
@@ -973,17 +954,12 @@ BeamSearchBatchConfig
   }
   new_bc.num_generation_tokens = num_generation_tokens;
 
-  std::cout << "prepare next batch init gen tokens: "
-            << new_bc.num_generation_tokens << "\n";
-
   if (verbose) {
     std::cout << "prepare_next_batch_init OLD vs NEW batchconfigs below:"
               << std::endl;
     old_bc.print();
     new_bc.print();
   }
-  std::cout << "prepare next batch init active tokens: "
-            << new_bc.num_tokens << "\n";
   return new_bc;
 }
 
@@ -1019,11 +995,11 @@ BeamSearchBatchConfig RequestManager::prepare_next_batch_beam_task(
 BeamSearchBatchConfig
     RequestManager::prepare_next_batch_beam(BeamSearchBatchConfig const &old_bc,
                                             BeamInferenceResult const &result) {
-  std::lock_guard<std::mutex> const lock(request_queue_mutex);
-  if (true) {
+  const std::lock_guard<std::mutex> lock(request_queue_mutex);
+  if (verbose) {
     std::cout << "\n############### prepare_next_batch_beam ###############\n";
   }
-  if (true) {
+  if (verbose) {
     std::cout << "print all results"
               << "\n";
     for (int i = 0; i < 40; i++) {
@@ -1049,7 +1025,7 @@ BeamSearchBatchConfig
     if (old_bc.request_completed[i] || !old_bc.request_running[i]) {
       continue;
     }
-    num_active_req ++;
+    num_active_req++;
     // Comment out this assertion since num_tokens_in_batch can be
     // zero when beam search has reached required sequence length
     // assert(old_bc.requestsInfo[i].num_tokens_in_batch > 0);
@@ -1092,13 +1068,6 @@ BeamSearchBatchConfig
           old_bc.beamRequestsInfo[i].sub_request_num *
           old_bc.beamRequestsInfo[i].beam_size;
 
-      std::cout << "oldbc : " << old_bc.beamRequestsInfo[i].sub_request_num
-                << ", " << old_bc.beamRequestsInfo[i].beam_size << "\n";
-
-      // if (old_bc.beamRequestsInfo[i].current_depth == 3) {
-      //   assert(false);
-      // }
-
       assert(new_bc.beamRequestsInfo[i].sub_request_num <=
                  BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES &&
              "exceed maximum nodes per layer");
@@ -1122,7 +1091,7 @@ BeamSearchBatchConfig
           request.tokens.size()) {
         // Incremental phase
         if (request.status == Request::RUNNING) {
-          // todo check it
+          // todo this is replaced by this_layer_size, but should check it
           new_bc.requestsInfo[i].num_tokens_in_batch = 1;
         } else {
           assert(false && "Request should be done");
@@ -1150,18 +1119,7 @@ BeamSearchBatchConfig
       memcpy(&new_bc.causalMask[i],
              &old_bc.causalMask[i],
              sizeof(BatchConfig::BitMask));
-      // sub_request_num -> nodes of input next iteration
-      //  beam_size replicate num
-
-      std::cout << "print beam tree: "
-                << old_bc.beamRequestsInfo[i].current_depth << "\n";
       BeamTree tree = request.beam_trees[old_bc.model_id];
-      // for (int k = 0; k <= old_bc.beamRequestsInfo[i].current_depth; k++) {
-      //   std::cout << "layer: " << k << "\n";
-      //   std::cout << "nodes: " << tree.treeLayers[k].nodes_num_this_layer
-      //             << "\n";
-      // }
-      std::cout << "append bit mask: "<< i << "\n";
       appendBitMask(new_bc.causalMask[i],
                     new_bc.beamRequestsInfo[i].sub_request_num,
                     old_bc.beamRequestsInfo[i].beam_size,
@@ -1185,9 +1143,6 @@ BeamSearchBatchConfig
           num_generation_tokens++;
         }
       }
-      // if(new_bc.beamRequestsInfo[i].current_depth >= 3 && i > 0){
-      //   assert(false);
-      // }
     }
   }
 
@@ -1320,18 +1275,6 @@ BeamSearchBatchConfig
     old_bc.print();
     new_bc.print();
   }
-
-  if (true) {
-    // std::cout << "print all resultsBBB"
-    //           << "\n";
-    // for (int i = 0; i < 40; i++) {
-    //   std::cout << result.token_ids[i] << ", ";
-    // }
-    // std::cout << "Current Beam DepthBBB: "
-    //           << old_bc.beamRequestsInfo[0].current_depth << "\n";
-  }
-  std::cout << "prepare next batch beam total tokens: " << new_bc.num_tokens
-  << "gneration tokens: " << new_bc.num_generation_tokens <<  "\n";
   return new_bc;
 }
 
@@ -1366,7 +1309,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify_task(
 
 TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
     std::vector<BeamSearchBatchConfig> const &old_batches) {
-  std::lock_guard<std::mutex> const lock(request_queue_mutex);
+  const std::lock_guard<std::mutex> lock(request_queue_mutex);
 
   std::cout << "\n############### prepare_next_batch_verify ###############\n";
 
@@ -1399,12 +1342,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
     profiling_requests[request.guid].llm_decoding_steps += 1;
 
     if (request.status == Request::RUNNING) {
-
-      std::cout << "prepare next batch running:\n"
-                << "\n";
       new_bc.request_running[i] = true;
-      std::cout << "[Verify] Request " << request.guid << " is running"
-                << std::endl;
 
       // Get the dfs tree
       std::vector<std::vector<std::pair<BatchConfig::TokenId, int>>>
@@ -1419,12 +1357,12 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       std::vector<std::pair<BatchConfig::TokenId, int>> dfs_tree_inputs =
           merge_dfs_trees(all_dfs_trees, request.tokens.size() - 1, guid);
 
-      if (true) {
-        // std::cout << "Request Tokens Size: " << request.tokens.size()
-        //           << std::endl;
-        // for (int k = 0; k < request.tokens.size(); k++) {
-        //   std::cout << k << ": " << request.tokens[k] << std::endl;
-        // }
+      if (verbose) {
+        std::cout << "Request Tokens Size: " << request.tokens.size()
+                  << std::endl;
+        for (int k = 0; k < request.tokens.size(); k++) {
+          std::cout << k << ": " << request.tokens[k] << std::endl;
+        }
       }
 
       // Normal Request Info
@@ -1435,31 +1373,21 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
           old_batches.at(0).requestsInfo[i].request_guid;
       new_bc.requestsInfo[i].max_sequence_length =
           old_batches.at(0).requestsInfo[i].max_sequence_length;
-      new_bc.requestsInfo[num_active_req].batch_config_request_id = i;    
+      new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
 
       // copy bitmask to verify batchconfig
       memcpy(&(new_bc.causalMask[i]),
              &(old_batches.at(0).causalMask[i]),
              sizeof(BatchConfig::BitMask));
-      // std::cout << "bitmask: " << new_bc.causalMask[i].mask[0] << "\n";
-      // assert(false);
       // TODO: Check this
       new_bc.requestsInfo[i].num_tokens_in_batch = 0;
       new_bc.request_completed[i] = false;
 
-      std::cout << "dfs_tree_inputs: " << dfs_tree_inputs.size() << ", "
-                << new_bc.causalMask[i].tree_size << ", "
-                << new_bc.causalMask[i].non_tree_cache_size << "\n";
-      std::cout << "mask: " << std::bitset<64>(new_bc.causalMask[i].mask[0])
-                << "\n";
-      std::cout << "mask: " << std::bitset<64>(new_bc.causalMask[i].mask[1])
-                << "\n";
-      std::cout << "mask: " << std::bitset<64>(new_bc.causalMask[i].mask[2])
-                << "\n";
-      std::cout << "mask: " << std::bitset<64>(new_bc.causalMask[i].mask[3])
-                << "\n";
-      std::cout << "mask: " << std::bitset<64>(new_bc.causalMask[i].mask[4])
-                << "\n";
+      // std::cout << "dfs_tree_inputs: " << dfs_tree_inputs.size() << ", "
+      //           << new_bc.causalMask[i].tree_size << ", "
+      //           << new_bc.causalMask[i].non_tree_cache_size << "\n";
+      // std::cout << "mask: " << std::bitset<64>(new_bc.causalMask[i].mask[0])
+      //           << "\n";
 
       // Committed Tokens
       if (committed_tokens.find(guid) != committed_tokens.end()) {
@@ -1473,7 +1401,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
               i;
           new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_depth =
               committed_token.first;
-          if (true) {
+          if (verbose) {
             std::cout << new_bc.num_tokens_to_commit
                       << "- committed_token.token_depth: "
                       << committed_token.first
@@ -1485,7 +1413,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
           // }
         }
       }
-      if (true) {
+      if (verbose) {
         std::cout << "new_bc.num_tokens_to_commit: "
                   << new_bc.num_tokens_to_commit << std::endl;
       }
@@ -1508,14 +1436,11 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       new_bc.requestsInfo[i].first_token_depth_in_request =
           request.tokens.size() - 1;
 
-      std::cout << "prepare next batch verify: " << dfs_tree_inputs.size()
-                << "\n";
-
       bool cutLayer = false;
       // Add Tokens from the DFS Tree to the next batch
       for (int j = 1; j < dfs_tree_inputs.size(); j++) {
         auto token = dfs_tree_inputs.at(j);
-        if (true) {
+        if (verbose) {
           std::cout << "[" << j << "] Token: " << token.first
                     << ", Depth:" << token.second << std::endl;
         }
@@ -1541,7 +1466,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
         for (int j = total_tokens - 1; j >= 1; j--) {
           new_bc.num_tokens--;
           new_bc.requestsInfo[i].num_tokens_in_batch--;
-          std::cout << "cut: " << j << "\n";
+          // std::cout << "cut: " << j << "\n";
           if (new_bc.tokensInfo[j].abs_depth_in_request !=
               new_bc.tokensInfo[j - 1].abs_depth_in_request) {
             break;
@@ -1550,8 +1475,6 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       }
 
     } else if (request.status == Request::PENDING) {
-      std::cout << "prepare next batch verify: pending\n"
-                << "\n";
       new_bc.request_running[i] = false;
       if (verbose) {
         std::cout << "[Verify] Request " << request.guid
@@ -1583,8 +1506,6 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       memcpy(&(new_bc.causalMask[i]),
              &(old_batches.at(0).causalMask[i]),
              sizeof(BatchConfig::BitMask));
-      // std::cout << "bitmask: " << new_bc.causalMask[i].mask[0] << "\n";
-      // assert(false);
 
       // Normal Request Info
       new_bc.requestsInfo[i].first_token_depth_in_request =
@@ -1594,7 +1515,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
           old_batches.at(0).requestsInfo[i].request_guid;
       new_bc.requestsInfo[i].max_sequence_length =
           old_batches.at(0).requestsInfo[i].max_sequence_length;
-      new_bc.requestsInfo[num_active_req].batch_config_request_id = i; 
+      new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
 
       new_bc.request_completed[i] = false;
 
@@ -1608,9 +1529,9 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
                 << std::endl;
 
       if (request.llm_cache_size < request.initial_len) {
-        std::cout << "Initialization (prompt) phase: "
-                  << new_bc.requestsInfo[i].num_tokens_in_batch << ", "
-                  << old_batches.at(0).beamRequestsInfo[i].beam_size << "\n";
+        // std::cout << "Initialization (prompt) phase: "
+        //           << new_bc.requestsInfo[i].num_tokens_in_batch << ", "
+        //           << old_batches.at(0).beamRequestsInfo[i].beam_size << "\n";
         // Initialization (prompt) phase
         for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
           new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
@@ -1618,8 +1539,6 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
               request.tokens[request.llm_cache_size + j];
           new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request =
               request.llm_cache_size + j;
-          std::cout << "load prompt tokens: " << j << ": "
-                    << new_bc.tokensInfo[new_bc.num_tokens].token_id << "\n";
           new_bc.num_tokens++;
         }
 
@@ -1645,8 +1564,8 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
         }
       } else { // launch the request into running phase after loading all prompt
         if (get_max_tokens_per_batch() - new_bc.num_tokens > 0) {
-          std::cout << "Initialization running phase: "
-                    << new_bc.requestsInfo[i].num_tokens_in_batch << "\n";
+          // std::cout << "Initialization running phase: "
+          //           << new_bc.requestsInfo[i].num_tokens_in_batch << "\n";
           request.status = Request::RUNNING;
           new_bc.request_running[i] = true;
 
@@ -1671,11 +1590,6 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
     }
   }
 
-  std::cout << "how many tokens in verify? " << new_bc.num_tokens << "\n";
-
-  std::cout << "check dfs tree input size: " << dfs_tree_inputs[1000000].size()
-            << "\n";
-
   return new_bc;
 }
 
@@ -1690,7 +1604,7 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
   auto start_depth = old_bc.tokensInfo[0].abs_depth_in_request;
   int result_index = 0;
 
-  if (true) {
+  if (verbose) {
     std::cout << "Store total of " << old_bc.num_tokens
               << " tokens in the current batch.\n";
   }
@@ -1700,10 +1614,10 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
         old_bc.requestsInfo[old_bc.tokensInfo[i].request_index].request_guid !=
             guid) {
 
-      std::cout << "i is: " << i << "old guid" << guid << " new guid"
-                << old_bc.requestsInfo[old_bc.tokensInfo[i].request_index]
-                       .request_guid
-                << "\n";
+      // std::cout << "i is: " << i << "old guid" << guid << " new guid"
+      //           << old_bc.requestsInfo[old_bc.tokensInfo[i].request_index]
+      //                  .request_guid
+      //           << "\n";
 
       int index = old_bc.tokensInfo[i - 1].request_index;
       int beam_size = old_bc.beamRequestsInfo[index].beam_size;
@@ -1718,22 +1632,16 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
 
       // Count tokens sent to model in this request to find the final token's
       // index
-
-      std::cout << "previous result index: " << result_index;
-
       result_index +=
           (old_bc.tokensInfo[i - 1].abs_depth_in_request - start_depth) *
           beam_size;
 
-      std::cout << "after result index: " << result_index;
-
-      // if (true) {
-      //   std::cout << "i = " << i << ", result index = " << result_index
-      //             << ", value: " << result.token_ids[result_index]
-      //             << ", leaf node num: " << leaf_node_num << ", depth" <<
-      //             depth
-      //             << ", beam size: " << beam_size << "\n";
-      // }
+      if (verbose) {
+        std::cout << "i = " << i << ", result index = " << result_index
+                  << ", value: " << result.token_ids[result_index]
+                  << ", leaf node num: " << leaf_node_num << ", depth" << depth
+                  << ", beam size: " << beam_size << "\n";
+      }
 
       Request &request = all_requests[old_bc.requestsInfo[index].request_guid];
 
@@ -1743,7 +1651,7 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
 
       if (depth == 1) {
         // store the last input into the tree;
-        if (true) {
+        if (verbose) {
           std::cout << "try to store the input"
                     << "\n";
         }
@@ -1756,13 +1664,11 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
             .treeLayers[0]
             .nodes_num_this_layer = 1;
 
-        if (true) {
+        if (verbose) {
           std::cout << "Store the previous last token to the tree root: "
                     << request.tokens.back() << "\n";
         }
       }
-
-      std::cout << "leaffffff: " << leaf_node_num << "\n";
       request.beam_trees.at(old_bc.model_id)
           .treeLayers[depth]
           .nodes_num_this_layer = leaf_node_num;
@@ -1777,27 +1683,20 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
         request.beam_trees.at(old_bc.model_id)
             .treeLayers[depth]
             .parent_ids[beam_id] = result.parent_id[result_index];
-        // std::cout << "??????? beam id: " << beam_id << ", token: "
-        //           << request.beam_trees.at(old_bc.model_id)
-        //                  .treeLayers[depth]
-        //                  .tokens[beam_id]
-        //           << "\n";
-
-        // if (true) {
-        //   std::cout << "tree value: " << depth << "token: "
-        //             << request.beam_trees.at(old_bc.model_id)
-        //                    .treeLayers[depth]
-        //                    .tokens[beam_id]
-        //             << "result tokens: " << result.token_ids[result_index];
-        // }
+
+        if (verbose) {
+          std::cout << "tree value: " << depth << "token: "
+                    << request.beam_trees.at(old_bc.model_id)
+                           .treeLayers[depth]
+                           .tokens[beam_id]
+                    << "result tokens: " << result.token_ids[result_index];
+        }
         result_index += 1;
       }
       // update the guid and start_depth for current request
       if (i < old_bc.num_tokens) {
         int new_req_idx = old_bc.tokensInfo[i].request_index;
         guid = old_bc.requestsInfo[new_req_idx].request_guid;
-        std::cout << "update guid: " << guid << ", request idx: " << index
-                  << "\n";
         start_depth = old_bc.tokensInfo[i].abs_depth_in_request;
       }
     }
@@ -1839,8 +1738,8 @@ void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
           tree.treeLayers[depth].probs[j];
       new_bc.beamRequestsInfo[request_index].tokens[j] =
           tree.treeLayers[depth].tokens[j];
-      std::cout << "token: " << j << ": "
-                << new_bc.beamRequestsInfo[request_index].tokens[j] << "\n";
+      // std::cout << "token: " << j << ": "
+      //           << new_bc.beamRequestsInfo[request_index].tokens[j] << "\n";
     }
   }
   if (verbose) {
@@ -1892,13 +1791,13 @@ void RequestManager::updateBitMask(BatchConfig::BitMask &bitmask,
          "do not support tree size > 64");
   assert(initLength >= 1 && "verified token num should >= 1");
 
-  std::cout << "non tree size: " << non_tree_size << ", "
-            << bitmask.non_tree_cache_size << "\n";
+  // std::cout << "non tree size: " << non_tree_size << ", "
+  //           << bitmask.non_tree_cache_size << "\n";
 
   bitmask.non_tree_cache_size = non_tree_size + initLength - 1;
   bitmask.tree_size = 1;
   bitmask.this_layer_size = initLength;
-  std::cout << "non_tree_size: " << non_tree_size << "\n";
+  // std::cout << "non_tree_size: " << non_tree_size << "\n";
   bitmask.prompt_size = 1;
   for (int i = 0; i < bitmask.prompt_size; i++) {
     for (int j = i; j < bitmask.prompt_size; j++) {
@@ -1906,13 +1805,9 @@ void RequestManager::updateBitMask(BatchConfig::BitMask &bitmask,
     }
   }
 
-  std::cout << "see bit mask update" << bitmask.prompt_size << "\n";
-  std::cout << "see bit mask update" << std::bitset<64>(bitmask.mask[0])
-            << "\n";
-  std::cout << "see bit mask update" << std::bitset<64>(bitmask.mask[1])
-            << "\n";
-  std::cout << "see bit mask update" << std::bitset<64>(bitmask.mask[2])
-            << "\n";
+  // std::cout << "see bit mask update" << bitmask.prompt_size << "\n";
+  // std::cout << "see bit mask update" << std::bitset<64>(bitmask.mask[0])
+  //           << "\n";
 }
 
 // prepare next beam, append layers to the tree
@@ -1987,16 +1882,10 @@ void RequestManager::appendBitMask(BatchConfig::BitMask &bitmask,
   //   assert(false);
   // }
 
-  std::cout << "see bit mask append" << bitmask.prompt_size << "\n";
-  std::cout << "see bit mask append" << bitmask.non_tree_cache_size << "\n";
-  std::cout << "see bit mask append" << std::bitset<64>(bitmask.mask[0])
-            << "\n";
-  std::cout << "see bit mask append" << std::bitset<64>(bitmask.mask[1])
-            << "\n";
-  std::cout << "see bit mask append" << std::bitset<64>(bitmask.mask[2])
-            << "\n";
-  std::cout << "see bit mask append" << std::bitset<64>(bitmask.mask[3])
-            << "\n";
+  // std::cout << "see bit mask append" << bitmask.prompt_size << "\n";
+  // std::cout << "see bit mask append" << bitmask.non_tree_cache_size << "\n";
+  // std::cout << "see bit mask append" << std::bitset<64>(bitmask.mask[0])
+  //           << "\n";
 }
 
 bool PreOrder(
@@ -2084,7 +1973,7 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
     // depth) pairs
     for (auto const &pair : inputSerializedTree) {
       oss << " " << pair.second << ":" << pair.first;
-      log_req_mgr.print("(%d, %d)", pair.first, pair.second);
+      // log_req_mgr.print("(%d, %d)", pair.first, pair.second);
     }
     log_req_mgr.print("Input tree:%s", oss.str().c_str());
   }
@@ -2093,7 +1982,7 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
     // outputSerializedTree is an array of (token id, depth + 1) pairs
     std::ostringstream oss;
     for (auto const &pair : outputSerializedTree) {
-      log_req_mgr.print("(%d, %d)", pair.first, pair.second);
+      // log_req_mgr.print("(%d, %d)", pair.first, pair.second);
       oss << " " << pair.second << ":" << pair.first;
     }
     log_req_mgr.print("Output tree:%s", oss.str().c_str());
@@ -2130,6 +2019,7 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
   }
 
   // to avoid branch switch when same tokens in input tree.
+  // todo, only checked for N->1->1->1 cases
 
   bool findFirst = false;
   layer_num = -1;
@@ -2173,9 +2063,10 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
           new_committed_tokens.push_back(std::make_pair(
               input.second, committed_tokens.at(guid).at(i).second));
           // at this point, you'll not go other branches
-          std::cout << "verify tree push back: " << output.first
-                    << ", tree size is: " << verifiedTree.size()
-                    << ", ??: " << input.first << ", " << input.second << "\n";
+          // std::cout << "verify tree push back: " << output.first
+          //           << ", tree size is: " << verifiedTree.size()
+          //           << ", ??: " << input.first << ", " << input.second <<
+          //           "\n";
 
         } else {
           printf("not correct slot\n");
@@ -2190,9 +2081,9 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
             committed_tokens.at(guid).at(i).second)); // <input_abs_depth,
                                                       // input_index_in_batch>
         // at this point, you'll not go other branches
-        std::cout << "verify tree push back: " << output.first
-                  << ", tree size is: " << verifiedTree.size()
-                  << ", ??: " << input.first << ", " << input.second << "\n";
+        // std::cout << "verify tree push back: " << output.first
+        //           << ", tree size is: " << verifiedTree.size()
+        //           << ", ??: " << input.first << ", " << input.second << "\n";
       }
 
       assert(committed_tokens.at(guid).at(i).first == input.second);
@@ -2203,7 +2094,7 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
     // log_req_mgr.print("========Verified============");
     std::ostringstream oss;
     for (auto const &pair : verifiedTree) {
-      log_req_mgr.print("(%d, %d)", pair.first, pair.second);
+      // log_req_mgr.print("(%d, %d)", pair.first, pair.second);
       oss << " " << pair.second << ":" << pair.first;
     }
     log_req_mgr.print("Verified:%s", oss.str().c_str());
@@ -2225,7 +2116,7 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
     RequestManager::traverse_beam_tree(BeamSearchBatchConfig const &old_bc,
                                        int request_index,
                                        int first_token_depth_in_request) {
-  if (true) {
+  if (verbose) {
     std::cout << "[Traverse Beam Tree] request_index: " << request_index
               << "\n";
     std::cout << "[Traverse Beam Tree] max_depth: "
@@ -2269,13 +2160,13 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
   //          verbose);
 
   // print it
-  if (true) {
+  if (verbose) {
     std::cout << "Print serialized tree: size:" << request_index
               << serializedTree.size() << "\n";
   }
   for (int k = 0; k < serializedTree.size(); k++) {
     serializedTree.at(k).second += first_token_depth_in_request;
-    if (true) {
+    if (verbose) {
       std::cout << "token id: " << serializedTree.at(k).first
                 << ", depth: " << serializedTree.at(k).second << "\n";
     }
@@ -2354,9 +2245,6 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
   }
 
   dfs_tree_inputs[guid] = merged_tree;
-  // std::cout << "assign dfr tree: " << guid << ", " << merged_tree.size() <<
-  // ", "
-  //           << dfs_tree_inputs[guid].size() << "\n";
 
   return merged_tree;
 }
diff --git a/src/runtime/request_manager.cu b/src/runtime/request_manager.cu
index bb6b6030aa..bb20fb263f 100644
--- a/src/runtime/request_manager.cu
+++ b/src/runtime/request_manager.cu
@@ -212,7 +212,6 @@ void RequestManager::load_batch_config_task(
   }
 
   // add a size check
-  std::cout << "hahaha handle.batch_config_metadata_size: " << handle.batch_config_metadata_size << ", "<< total_copy_size << "\n";
   assert(total_copy_size <= handle.batch_config_metadata_size);
 }
 

From b621f2a9f62f24a8112df7af3850dc3bdb494dc7 Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Sat, 30 Dec 2023 17:25:28 -0500
Subject: [PATCH 283/344] .

---
 inference/spec_infer/spec_infer.cc | 10 +++++-----
 src/runtime/cuda_helper.cu         |  2 +-
 2 files changed, 6 insertions(+), 6 deletions(-)

diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 258b2d78eb..b369a13c1d 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -266,9 +266,9 @@ void FlexFlow::top_level_task(Task const *task,
   ModelMeta model_metadata;
   bool use_full_precision = false;
   bool verbose = false;
-  int max_requests_per_batch = 10;
-  int max_tokens_per_batch = 199;
-  int max_sequence_length = 200;
+  int max_requests_per_batch = 16;
+  int max_tokens_per_batch = 256;
+  int max_sequence_length = 1024;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
   char **argv = command_args.argv;
@@ -302,7 +302,7 @@ void FlexFlow::top_level_task(Task const *task,
                          model_metadata.llm_tokenizer_path);
   rm->register_output_filepath(file_paths.output_file_path);
 
-  //first decoding step: 3 results
+  // first decoding step: 3 results
   rm->push_spec_infer_tree_width(3);
 
   // Create LLM model
@@ -402,7 +402,7 @@ void FlexFlow::top_level_task(Task const *task,
       printf("Prompt[%d]: %s\n", total_num_requests, text.c_str());
       total_num_requests++;
       prompts.push_back(text);
-    // tree_model.generate(text, 128 /*max_sequence_length*/);
+      // tree_model.generate(text, 128 /*max_sequence_length*/);
     }
     tree_model.generate(prompts, 128 /*max_sequence_length*/);
   }
diff --git a/src/runtime/cuda_helper.cu b/src/runtime/cuda_helper.cu
index 398ed7f3cd..fa6bf55fe5 100644
--- a/src/runtime/cuda_helper.cu
+++ b/src/runtime/cuda_helper.cu
@@ -226,7 +226,7 @@ __host__ void print_tensor(T const *ptr,
   printf("%s, %d---->", prefix, shard_id);
   for (idx = 0; idx < num_elements; idx++) {
     printf(" %.20lf", (float)host_ptr[idx]);
-    if (idx >= 200) {
+    if (idx >= 100) {
       break;
     }
   }

From 8a0b007bfe20b50302ad201c01c7ac1dfb30a25a Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Sat, 30 Dec 2023 18:49:19 -0500
Subject: [PATCH 284/344] load batchconfig

---
 src/ops/inc_multihead_self_attention.cpp | 4 ++--
 src/runtime/inference_manager.cc         | 9 ++++-----
 src/runtime/model.cpp                    | 2 +-
 3 files changed, 7 insertions(+), 8 deletions(-)

diff --git a/src/ops/inc_multihead_self_attention.cpp b/src/ops/inc_multihead_self_attention.cpp
index a59740f4a3..00cc4d8868 100644
--- a/src/ops/inc_multihead_self_attention.cpp
+++ b/src/ops/inc_multihead_self_attention.cpp
@@ -1106,7 +1106,7 @@ template void Kernels::IncMultiHeadAttention::compute_o_prod_bias<float>(
     float const *weight_ptr,
     float const *bias_ptr,
     int num_tokens,
-    cudaStream_t stream);
+    hipStream_t stream);
 template void Kernels::IncMultiHeadAttention::compute_o_prod_bias<half>(
     IncMultiHeadSelfAttentionMeta const *m,
     BatchConfig const *bc,
@@ -1115,6 +1115,6 @@ template void Kernels::IncMultiHeadAttention::compute_o_prod_bias<half>(
     half const *weight_ptr,
     half const *bias_ptr,
     int num_tokens,
-    cudaStream_t stream);
+    hipStream_t stream);
 
 }; // namespace FlexFlow
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 52a1efc2ab..8af0ed8978 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -398,11 +398,10 @@ void InferenceManager::load_inference_metadata_batch_config(
   Runtime *runtime = ff_config.lg_hlr;
   ArgumentMap argmap;
 
-  Rect<1> task_rect(
-      Point<1>(0), Point<1>(ff_config.workersPerNode * ff_config.numNodes - 1));
-  IndexSpaceT<1> task_is = runtime->create_index_space(ctx, task_rect);
+  Domain domain =
+      runtime->get_index_space_domain(ctx, ff_config.all_gpu_task_is);
+  Rect<1> task_rect = domain;
 
-  // int rank = 0;
   int idx = 0;
   for (PointInRectIterator<1> it(task_rect); it(); it++) {
     FFHandler handler = handlers[idx++];
@@ -410,7 +409,7 @@ void InferenceManager::load_inference_metadata_batch_config(
   }
 
   IndexLauncher launcher(RM_LOAD_BATCH_CONFIG_TASK_ID,
-                         task_is,
+                         ff_config.all_gpu_task_is,
                          TaskArgument(nullptr, 0),
                          argmap,
                          Predicate::TRUE_PRED,
diff --git a/src/runtime/model.cpp b/src/runtime/model.cpp
index 5499a280a8..ad2b781567 100644
--- a/src/runtime/model.cpp
+++ b/src/runtime/model.cpp
@@ -152,7 +152,7 @@ FFHandler
         .wait();
     handle.offload_reserve_space =
         workspaceInst.pointer_untyped(0, sizeof(char));
-   } else {
+  } else {
     handle.offload_reserve_space = nullptr;
   }
   if (handle.batch_config_metadata_size > 0) {

From 17a718f95523ed3892d0324ed493ef6043607b13 Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Sat, 30 Dec 2023 19:18:22 -0500
Subject: [PATCH 285/344] clean

---
 .../inc_multihead_self_attention_utils.cuh    |   4 +-
 src/ops/argmax.cc                             |   1 -
 src/ops/beam_topk.cc                          |   2 -
 src/ops/inc_multihead_self_attention.cu       |   7 +-
 src/ops/spec_inc_multihead_self_attention.cu  | 111 ++++++------------
 src/ops/tree_inc_multihead_self_attention.cu  |  13 +-
 6 files changed, 49 insertions(+), 89 deletions(-)

diff --git a/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh b/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh
index 1b21a80dc9..c128c1a126 100644
--- a/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh
+++ b/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh
@@ -456,7 +456,7 @@ inline size_t smem_size_in_bytes(int hidden_size_per_head,
                                  int threads_per_block) {
   // The amount of shared memory needed to store the Q*K^T values in float.
 
-  size_t qk_sz = div_up(2000 + 1, 4) * 16;
+  size_t qk_sz = div_up(max_sequence_length + 1, 4) * 16;
   size_t logits_sz = qk_sz;
 
   // The total size needed during softmax.
@@ -493,7 +493,7 @@ inline void smem_size_in_bytes_tree(int hidden_size_per_head,
   }
 
   // todo fix this
-  int max_qk_length = max_query_length * max_total_length + 1000;
+  int max_qk_length = max_query_length * max_total_length;
 
   // The amount of shared memory needed to store the Q*K^T values in float.
   size_t qk_sz = div_up(max_qk_length + 1, 4) * 16;
diff --git a/src/ops/argmax.cc b/src/ops/argmax.cc
index c3bb3d493e..dc7e4ea3b3 100644
--- a/src/ops/argmax.cc
+++ b/src/ops/argmax.cc
@@ -352,7 +352,6 @@ BeamInferenceResult
   GenericTensorAccessorW parent = helperGetGenericTensorAccessorWO(
       DT_INT32, regions[2], task->regions[2], FID_DATA, ctx, runtime);
   ArgMax::forward_kernel_wrapper(m, input, indices, parent, batch_size);
-
   BeamInferenceResult ir;
   download_tensor<BatchConfig::TokenId>(
       indices.get_int32_ptr(), ir.token_ids, batch_size);
diff --git a/src/ops/beam_topk.cc b/src/ops/beam_topk.cc
index 87d357b535..18d0ec1587 100644
--- a/src/ops/beam_topk.cc
+++ b/src/ops/beam_topk.cc
@@ -398,8 +398,6 @@ BeamInferenceResult
   download_tensor<int>(
       parent_ptr, ir.parent_id, batch_size * m->max_beam_width);
 
-  // print_tensor<int>(index_ptr, 32, "indexxxxxxx");
-
   if (m->inference_debugging) {
     assert(task->index_point.get_dim() == 1);
     int shard_id = task->index_point.point_data[0];
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index cca0b230c3..da70e23f87 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -1381,7 +1381,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
         assert(false && "Unkown inference mode");
     }
     size_t requestinfo_size = BatchConfig::max_requests_per_batch();
-    size_t tokeninfo_size = max_tokens_per_batch;
+    // size_t tokeninfo_size = max_tokens_per_batch;
     size_t qk_prod_size =
         max_tokens_per_batch * BatchConfig::max_sequence_length() * num_q_heads;
     size_t attn_heads_size = max_tokens_per_batch * num_q_heads * vProjSize;
@@ -1438,8 +1438,9 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
 
     token_infos =
         static_cast<BatchConfig::PerTokenInfo *>(handler.batch_config_metadata);
-    request_infos = static_cast<BatchConfig::PerRequestInfo *>(
-        handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo));
+    request_infos = reinterpret_cast<BatchConfig::PerRequestInfo *>(
+        reinterpret_cast<char *>(handler.batch_config_metadata) +
+        sizeof(BatchConfig::tokensInfo));
 
     if (offload) {
       // token_infos =
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index b3a87fe244..88dd3f92e4 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -82,29 +82,20 @@ __global__ void compute_spec_inc_attention_kernel_generation_kernel(
 
   int const first_step = 0;
 
-  int const tlength =
-      request_infos[batch_config_request_id].first_token_depth_in_request +
-      request_infos[batch_config_request_id].num_tokens_in_batch;
+  // int const tlength =
+  //     request_infos[batch_config_request_id].first_token_depth_in_request +
+  //     request_infos[batch_config_request_id].num_tokens_in_batch;
 
   int const totalCacheSize = bitmask.non_tree_cache_size + bitmask.tree_size;
 
-  // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
-  //   printf("spec inc attn fused kernel %d, %d\n",
-  //          totalCacheSize,
-  //          request_infos[batch_config_request_id].num_tokens_in_batch);
-  // }
-  // int const qlength = request_infos[request_idx].num_tokens_in_batch;
-  int const tree_branch_num =
-      beam_request_infos[batch_config_request_id].sub_request_num;
-
-  // will decode qlength tokens in this thread block
-  // int const qlength = tree_branch_num;
-
   int first_token_idx = 0;
   for (int r = 0; r < request_idx; r++) {
     first_token_idx += causalMask[r].this_layer_size;
   }
 
+  int const tree_branch_num =
+      beam_request_infos[batch_config_request_id].sub_request_num;
+
   // shared memory objects
   extern __shared__ char smem_[];
 
@@ -338,20 +329,14 @@ __global__ void spec_inc_store_kv_cache(
     DT vVal = devQKVProjArray[val_idx + hidden_size];
 
     int const req_id = tokenInfos[token_idx].request_index;
-    int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
-    int const first_token_in_req =
-        requestInfo[req_id].first_token_depth_in_request;
-    int const sub_req_id = beamTokenInfos[token_idx].sub_request_index;
-    int const total_token = requestInfo[req_id].num_tokens_in_batch;
+    // int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
 
     int const request_token_offset =
         requestInfo[req_id].first_token_offset_in_batch;
 
     BatchConfig::BitMask bitmask = causalMask[req_id];
 
-    int const sub_request_num = beamRequestInfos[req_id].sub_request_num;
-
-    int const tree_branch_num = beamRequestInfos[req_id].sub_request_num;
+    // int const tree_branch_num = beamRequestInfos[req_id].sub_request_num;
 
     // int const query_token = bitmask.non_tree_cache_size + bitmask.tree_size -
     //                         tree_branch_num + sub_req_id + tok_id;
@@ -379,9 +364,9 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   if (num_tokens > 0) {
     int parallelism = m->hidden_size * KV_WEIGHT_NUM * num_tokens;
     spec_inc_store_kv_cache<<<GET_BLOCKS(parallelism),
-                               min(CUDA_NUM_THREADS, parallelism),
-                               0,
-                               stream>>>(
+                              min(CUDA_NUM_THREADS, parallelism),
+                              0,
+                              stream>>>(
         static_cast<DT *>(m->devQKVProjArray),
         static_cast<DT *>(m->keyCache),
         static_cast<DT *>(m->valueCache),
@@ -401,19 +386,19 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   }
 }
 
-#define LAUNCH_SPEC_INC_ATTENTION_SCORE_KERNEL(                               \
+#define LAUNCH_SPEC_INC_ATTENTION_SCORE_KERNEL(                                \
     DT, Dh, Dh_MAX, THDS_PER_KEY, THREADS_PER_VALUE, THDS_PER_BLOCK, stream)   \
   smem_sz = smem_size_in_bytes<DT>(m->qProjSize,                               \
                                    BatchConfig::max_sequence_length() +        \
                                        BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,   \
                                    THREADS_PER_VALUE,                          \
                                    THDS_PER_BLOCK);                            \
-  compute_spec_inc_attention_kernel_generation_kernel<DT,                     \
-                                                       THDS_PER_BLOCK,         \
-                                                       Dh,                     \
-                                                       Dh_MAX,                 \
-                                                       THDS_PER_KEY,           \
-                                                       THREADS_PER_VALUE>      \
+  compute_spec_inc_attention_kernel_generation_kernel<DT,                      \
+                                                      THDS_PER_BLOCK,          \
+                                                      Dh,                      \
+                                                      Dh_MAX,                  \
+                                                      THDS_PER_KEY,            \
+                                                      THREADS_PER_VALUE>       \
       <<<grid, THDS_PER_BLOCK, smem_sz, stream>>>(                             \
           static_cast<DT *>(m->devQKVProjArray),                               \
           static_cast<DT *>(m->keyCache),                                      \
@@ -470,14 +455,13 @@ __global__ void spec_fill_entries_above_diagonal(DT *matrix,
 }
 
 template <typename DT>
-void compute_attention_kernel_prompt(
-    SpecIncMultiHeadSelfAttentionMeta const *m,
-    BeamSearchBatchConfig const *bc,
-    int shard_id,
-    DT *output_ptr,
-    DT const *bias_ptr,
-    DT const *weight_ptr,
-    cudaStream_t stream) {
+void compute_attention_kernel_prompt(SpecIncMultiHeadSelfAttentionMeta const *m,
+                                     BeamSearchBatchConfig const *bc,
+                                     int shard_id,
+                                     DT *output_ptr,
+                                     DT const *bias_ptr,
+                                     DT const *weight_ptr,
+                                     cudaStream_t stream) {
   checkCUDA(cublasSetStream(m->handle.blas, stream));
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
   cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
@@ -812,8 +796,7 @@ void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
     checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
     cudaEventDestroy(t_start);
     cudaEventDestroy(t_end);
-    printf("SpecIncMultiHeadSelfAttention forward time = %.2fms\n",
-           elapsed);
+    printf("SpecIncMultiHeadSelfAttention forward time = %.2fms\n", elapsed);
     // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
     // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
     // acc_output.rect, "[Attention:forward:output]");
@@ -860,51 +843,29 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
 
   // allocate memory for the seqArray and reserve space
   {
-    // size_t causal_mask_size = BatchConfig::MAX_NUM_REQUESTS;
-    // size_t total_size = causal_mask_size * sizeof(BatchConfig::BitMask);
-    // gpu_mem_allocator.create_legion_instance(beam_search_reserve_inst,
-    //                                          total_size);
-
     beam_token_infos =
-        static_cast<BeamSearchBatchConfig::BeamSearchPerTokenInfo *>(
-            handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
+        reinterpret_cast<BeamSearchBatchConfig::BeamSearchPerTokenInfo *>(
+            reinterpret_cast<char *>(handler.batch_config_metadata) +
+            sizeof(BatchConfig::tokensInfo) +
             sizeof(BatchConfig::requestsInfo));
 
     beam_request_infos =
-        static_cast<BeamSearchBatchConfig::BeamSearchPerRequestInfo *>(
-            handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
+        reinterpret_cast<BeamSearchBatchConfig::BeamSearchPerRequestInfo *>(
+            reinterpret_cast<char *>(handler.batch_config_metadata) +
+            sizeof(BatchConfig::tokensInfo) +
             sizeof(BatchConfig::requestsInfo) +
             sizeof(BeamSearchBatchConfig::beamTokenInfo));
-    causalMask = static_cast<BatchConfig::BitMask *>(
-        handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
-        sizeof(BatchConfig::requestsInfo) +
+    causalMask = reinterpret_cast<BatchConfig::BitMask *>(
+        reinterpret_cast<char *>(handler.batch_config_metadata) +
+        sizeof(BatchConfig::tokensInfo) + sizeof(BatchConfig::requestsInfo) +
         sizeof(BeamSearchBatchConfig::beamTokenInfo) +
         sizeof(BeamSearchBatchConfig::beamRequestsInfo));
-
-    // causalMask = gpu_mem_allocator.allocate_instance<BatchConfig::BitMask>(
-    //     causal_mask_size);
-    // beam_token_infos =
-    //     gpu_mem_allocator
-    //         .allocate_instance<BeamSearchBatchConfig::BeamSearchPerTokenInfo>(
-    //             beam_tokeninfo_size);
-    // offset += beam_tokeninfo_size *
-    //           sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo);
-    // beam_request_infos =
-    //     gpu_mem_allocator
-    //         .allocate_instance<BeamSearchBatchConfig::BeamSearchPerRequestInfo>(
-    //             beam_requestinfo_size);
-    // offset += beam_requestinfo_size *
-    //           sizeof(BeamSearchBatchConfig::BeamSearchPerRequestInfo);
-    // assert(offset == total_size);
-    // assert(gpu_mem_allocator.instance_total_size ==
-    //        gpu_mem_allocator.instance_allocated_size);
   }
 
   cudaStreamSynchronize(stream);
 }
 
-SpecIncMultiHeadSelfAttentionMeta::~SpecIncMultiHeadSelfAttentionMeta(
-    void) {
+SpecIncMultiHeadSelfAttentionMeta::~SpecIncMultiHeadSelfAttentionMeta(void) {
   if (beam_search_reserve_inst != Realm::RegionInstance::NO_INST) {
     beam_search_reserve_inst.destroy();
   }
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index 5c6527baf9..b4af80976f 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -445,7 +445,7 @@ __global__ void update_tree_branch_kv_cache_fused(
     DT vVal = devQKVProjArray[val_idx + hidden_size];
 
     int const req_id = tokenInfos[token_idx].request_index;
-    int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
+    // int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
 
     int const request_token_offset =
         request_infos[req_id].first_token_offset_in_batch;
@@ -1059,12 +1059,13 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
   // allocate memory for the seqArray and reserve space
   {
 
-    causalMask = static_cast<BatchConfig::BitMask *>(
-        handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
-        sizeof(BatchConfig::requestsInfo));
+    causalMask = reinterpret_cast<BatchConfig::BitMask *>(
+        reinterpret_cast<char *>(handler.batch_config_metadata) +
+        sizeof(BatchConfig::tokensInfo) + sizeof(BatchConfig::requestsInfo));
     committed_token_infos =
-        static_cast<TreeVerifyBatchConfig::CommittedTokensInfo *>(
-            handler.batch_config_metadata + sizeof(BatchConfig::tokensInfo) +
+        reinterpret_cast<TreeVerifyBatchConfig::CommittedTokensInfo *>(
+            reinterpret_cast<char *>(handler.batch_config_metadata) +
+            sizeof(BatchConfig::tokensInfo) +
             sizeof(BatchConfig::requestsInfo) +
             sizeof(BatchConfig::causalMask));
   }

From c8a107b1b75e5c90a9c7329ab2618b940a4b260f Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Sat, 30 Dec 2023 19:19:45 -0500
Subject: [PATCH 286/344] hip

---
 src/ops/inc_multihead_self_attention.cpp | 19 -------------------
 1 file changed, 19 deletions(-)

diff --git a/src/ops/inc_multihead_self_attention.cpp b/src/ops/inc_multihead_self_attention.cpp
index 00cc4d8868..d60386f927 100644
--- a/src/ops/inc_multihead_self_attention.cpp
+++ b/src/ops/inc_multihead_self_attention.cpp
@@ -1098,23 +1098,4 @@ template void Kernels::IncMultiHeadAttention::pre_build_weight_kernel<half>(
     DataType data_type,
     hipStream_t stream);
 
-template void Kernels::IncMultiHeadAttention::compute_o_prod_bias<float>(
-    IncMultiHeadSelfAttentionMeta const *m,
-    BatchConfig const *bc,
-    int shard_id,
-    float *output_ptr,
-    float const *weight_ptr,
-    float const *bias_ptr,
-    int num_tokens,
-    hipStream_t stream);
-template void Kernels::IncMultiHeadAttention::compute_o_prod_bias<half>(
-    IncMultiHeadSelfAttentionMeta const *m,
-    BatchConfig const *bc,
-    int shard_id,
-    half *output_ptr,
-    half const *weight_ptr,
-    half const *bias_ptr,
-    int num_tokens,
-    hipStream_t stream);
-
 }; // namespace FlexFlow

From 42e1b5d92cf3e93e3f56d3d18d3fb68803b6caaf Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Sat, 30 Dec 2023 20:42:49 -0500
Subject: [PATCH 287/344] hip

---
 src/runtime/request_manager.cpp |  95 +++++++++++++++++---
 src/runtime/request_manager.cu  | 154 +++++++++-----------------------
 2 files changed, 123 insertions(+), 126 deletions(-)

diff --git a/src/runtime/request_manager.cpp b/src/runtime/request_manager.cpp
index 9635b3bc1e..fadbf80d6d 100644
--- a/src/runtime/request_manager.cpp
+++ b/src/runtime/request_manager.cpp
@@ -56,22 +56,91 @@ void RequestManager::load_tokens_task(
                            sizeof(TokenId) * batch_config->num_tokens,
                            hipMemcpyHostToDevice,
                            stream));
+}
+
+void RequestManager::load_batch_config_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  assert(regions.size() == 0);
+  assert(task->regions.size() == 0);
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  // BatchConfig const batch_config = *((BatchConfig *)task->args);
+  BatchConfig const *batch_config = BatchConfig::from_future(task->futures[0]);
 
   // copy meta data to workSpace
   FFHandler handle = *((FFHandler const *)task->local_args);
-  cudaMemcpyAsync(handle.batch_config_metadata,
-                  &(batch_config->tokensInfo),
-                  batch_config->num_active_tokens() *
-                      sizeof(BatchConfig::PerTokenInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
-  cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-                      sizeof(BatchConfig::tokensInfo),
-                  &(batch_config->requestsInfo),
-                  batch_config->max_requests_per_batch() *
-                      sizeof(BatchConfig::PerRequestInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
+  size_t total_copy_size = 0;
+  checkCUDA(hipMemcpyAsync(handle.batch_config_metadata,
+                           &(batch_config->tokensInfo),
+                           sizeof(BatchConfig::tokensInfo),
+                           hipMemcpyHostToDevice,
+                           stream));
+  total_copy_size += sizeof(BatchConfig::tokensInfo);
+
+  checkCUDA(hipMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+                               total_copy_size,
+                           &(batch_config->requestsInfo),
+                           sizeof(BatchConfig::requestsInfo),
+                           hipMemcpyHostToDevice,
+                           stream));
+  total_copy_size += sizeof(BatchConfig::requestsInfo);
+
+  // load speculative metadata
+  if (batch_config->get_mode() == BEAM_SEARCH_MODE) {
+    BeamSearchBatchConfig const *beam_batch_config =
+        static_cast<BeamSearchBatchConfig const *>(batch_config);
+
+    checkCUDA(hipMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+                                 total_copy_size,
+                             &(beam_batch_config->beamTokenInfo),
+                             sizeof(BeamSearchBatchConfig::beamTokenInfo),
+                             hipMemcpyHostToDevice,
+                             stream));
+
+    total_copy_size += sizeof(BeamSearchBatchConfig::beamTokenInfo);
+
+    checkCUDA(hipMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+                                 total_copy_size,
+                             &(beam_batch_config->beamRequestsInfo),
+                             sizeof(BeamSearchBatchConfig::beamRequestsInfo),
+                             hipMemcpyHostToDevice,
+                             stream));
+    total_copy_size += sizeof(BeamSearchBatchConfig::beamRequestsInfo);
+
+    checkCUDA(hipMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+                                 total_copy_size,
+                             &(beam_batch_config->causalMask),
+                             sizeof(BatchConfig::causalMask),
+                             hipMemcpyHostToDevice,
+                             stream));
+
+    total_copy_size += sizeof(BatchConfig::causalMask);
+  } else if (batch_config->get_mode() == TREE_VERIFY_MODE) {
+    TreeVerifyBatchConfig const *tree_batch_config =
+        static_cast<TreeVerifyBatchConfig const *>(batch_config);
+
+    checkCUDA(hipMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+                                 total_copy_size,
+                             &(tree_batch_config->causalMask),
+                             sizeof(BatchConfig::causalMask),
+                             hipMemcpyHostToDevice,
+                             stream));
+    total_copy_size += sizeof(BatchConfig::causalMask);
+    checkCUDA(hipMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+                                 total_copy_size,
+                             &(tree_batch_config->committed_tokens),
+                             sizeof(TreeVerifyBatchConfig::committed_tokens),
+                             hipMemcpyHostToDevice,
+                             stream));
+    total_copy_size += sizeof(TreeVerifyBatchConfig::committed_tokens);
+  }
+
+  // add a size check
+  assert(total_copy_size <= handle.batch_config_metadata_size);
 }
 
 void RequestManager::load_positions_task(
diff --git a/src/runtime/request_manager.cu b/src/runtime/request_manager.cu
index bb20fb263f..51c52c3026 100644
--- a/src/runtime/request_manager.cu
+++ b/src/runtime/request_manager.cu
@@ -56,78 +56,6 @@ void RequestManager::load_tokens_task(
                             sizeof(TokenId) * batch_config->num_tokens,
                             cudaMemcpyHostToDevice,
                             stream));
-
-  // // copy meta data to workSpace
-  // FFHandler handle = *((FFHandler const *)task->local_args);
-  // size_t total_copy_size = 0;
-  // cudaMemcpyAsync(handle.batch_config_metadata,
-  //                 &(batch_config->tokensInfo),
-  //                 sizeof(BatchConfig::tokensInfo),
-  //                 cudaMemcpyHostToDevice,
-  //                 stream);
-  // total_copy_size += sizeof(BatchConfig::tokensInfo);
-
-  // cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-  //                     total_copy_size,
-  //                 &(batch_config->requestsInfo),
-  //                 sizeof(BatchConfig::requestsInfo),
-  //                 cudaMemcpyHostToDevice,
-  //                 stream);
-  // total_copy_size += sizeof(BatchConfig::requestsInfo);
-
-  // // load speculative metadata
-  // if (batch_config->get_mode() == BEAM_SEARCH_MODE) {
-  //   BeamSearchBatchConfig const *beam_batch_config =
-  //       static_cast<BeamSearchBatchConfig const *>(batch_config);
-
-  //   cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-  //                       total_copy_size,
-  //                   &(beam_batch_config->beamTokenInfo),
-  //                   sizeof(BeamSearchBatchConfig::beamTokenInfo),
-  //                   cudaMemcpyHostToDevice,
-  //                   stream);
-
-  //   total_copy_size += sizeof(BeamSearchBatchConfig::beamTokenInfo);
-
-  //   cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-  //                       total_copy_size,
-  //                   &(beam_batch_config->beamRequestsInfo),
-  //                   sizeof(BeamSearchBatchConfig::beamRequestsInfo),
-  //                   cudaMemcpyHostToDevice,
-  //                   stream);
-  //   total_copy_size += sizeof(BeamSearchBatchConfig::beamRequestsInfo);
-
-  //   cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-  //                       total_copy_size,
-  //                   &(beam_batch_config->causalMask),
-  //                   sizeof(BatchConfig::causalMask),
-  //                   cudaMemcpyHostToDevice,
-  //                   stream);
-
-  //   total_copy_size += sizeof(BatchConfig::causalMask);
-  // } else if (batch_config->get_mode() == TREE_VERIFY_MODE) {
-  //   TreeVerifyBatchConfig const *tree_batch_config =
-  //       static_cast<TreeVerifyBatchConfig const *>(batch_config);
-
-  //   cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-  //                       total_copy_size,
-  //                   &(tree_batch_config->causalMask),
-  //                   sizeof(BatchConfig::causalMask),
-  //                   cudaMemcpyHostToDevice,
-  //                   stream);
-  //   total_copy_size += sizeof(BatchConfig::causalMask);
-  //   cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-  //                       total_copy_size,
-  //                   &(tree_batch_config->committed_tokens),
-  //                   sizeof(TreeVerifyBatchConfig::committed_tokens),
-  //                   cudaMemcpyHostToDevice,
-  //                   stream);
-  //   total_copy_size += sizeof(TreeVerifyBatchConfig::committed_tokens);
-  // }
-
-  // // add a size check
-  // std::cout << "handle.batch_config_metadata_size: " << handle.batch_config_metadata_size << ", "<< total_copy_size << "\n";
-  // assert(total_copy_size <= handle.batch_config_metadata_size);
 }
 
 void RequestManager::load_batch_config_task(
@@ -146,19 +74,19 @@ void RequestManager::load_batch_config_task(
   // copy meta data to workSpace
   FFHandler handle = *((FFHandler const *)task->local_args);
   size_t total_copy_size = 0;
-  cudaMemcpyAsync(handle.batch_config_metadata,
-                  &(batch_config->tokensInfo),
-                  sizeof(BatchConfig::tokensInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
+  checkCUDA(cudaMemcpyAsync(handle.batch_config_metadata,
+                            &(batch_config->tokensInfo),
+                            sizeof(BatchConfig::tokensInfo),
+                            cudaMemcpyHostToDevice,
+                            stream));
   total_copy_size += sizeof(BatchConfig::tokensInfo);
 
-  cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-                      total_copy_size,
-                  &(batch_config->requestsInfo),
-                  sizeof(BatchConfig::requestsInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
+  checkCUDA(cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+                                total_copy_size,
+                            &(batch_config->requestsInfo),
+                            sizeof(BatchConfig::requestsInfo),
+                            cudaMemcpyHostToDevice,
+                            stream));
   total_copy_size += sizeof(BatchConfig::requestsInfo);
 
   // load speculative metadata
@@ -166,48 +94,48 @@ void RequestManager::load_batch_config_task(
     BeamSearchBatchConfig const *beam_batch_config =
         static_cast<BeamSearchBatchConfig const *>(batch_config);
 
-    cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-                        total_copy_size,
-                    &(beam_batch_config->beamTokenInfo),
-                    sizeof(BeamSearchBatchConfig::beamTokenInfo),
-                    cudaMemcpyHostToDevice,
-                    stream);
+    checkCUDA(cudaMemcpyAsync(
+        static_cast<char *>(handle.batch_config_metadata) + total_copy_size,
+        &(beam_batch_config->beamTokenInfo),
+        sizeof(BeamSearchBatchConfig::beamTokenInfo),
+        cudaMemcpyHostToDevice,
+        stream));
 
     total_copy_size += sizeof(BeamSearchBatchConfig::beamTokenInfo);
 
-    cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-                        total_copy_size,
-                    &(beam_batch_config->beamRequestsInfo),
-                    sizeof(BeamSearchBatchConfig::beamRequestsInfo),
-                    cudaMemcpyHostToDevice,
-                    stream);
+    checkCUDA(cudaMemcpyAsync(
+        static_cast<char *>(handle.batch_config_metadata) + total_copy_size,
+        &(beam_batch_config->beamRequestsInfo),
+        sizeof(BeamSearchBatchConfig::beamRequestsInfo),
+        cudaMemcpyHostToDevice,
+        stream));
     total_copy_size += sizeof(BeamSearchBatchConfig::beamRequestsInfo);
 
-    cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-                        total_copy_size,
-                    &(beam_batch_config->causalMask),
-                    sizeof(BatchConfig::causalMask),
-                    cudaMemcpyHostToDevice,
-                    stream);
+    checkCUDA(cudaMemcpyAsync(
+        static_cast<char *>(handle.batch_config_metadata) + total_copy_size,
+        &(beam_batch_config->causalMask),
+        sizeof(BatchConfig::causalMask),
+        cudaMemcpyHostToDevice,
+        stream));
 
     total_copy_size += sizeof(BatchConfig::causalMask);
   } else if (batch_config->get_mode() == TREE_VERIFY_MODE) {
     TreeVerifyBatchConfig const *tree_batch_config =
         static_cast<TreeVerifyBatchConfig const *>(batch_config);
 
-    cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-                        total_copy_size,
-                    &(tree_batch_config->causalMask),
-                    sizeof(BatchConfig::causalMask),
-                    cudaMemcpyHostToDevice,
-                    stream);
+    checkCUDA(cudaMemcpyAsync(
+        static_cast<char *>(handle.batch_config_metadata) + total_copy_size,
+        &(tree_batch_config->causalMask),
+        sizeof(BatchConfig::causalMask),
+        cudaMemcpyHostToDevice,
+        stream));
     total_copy_size += sizeof(BatchConfig::causalMask);
-    cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-                        total_copy_size,
-                    &(tree_batch_config->committed_tokens),
-                    sizeof(TreeVerifyBatchConfig::committed_tokens),
-                    cudaMemcpyHostToDevice,
-                    stream);
+    checkCUDA(cudaMemcpyAsync(
+        static_cast<char *>(handle.batch_config_metadata) + total_copy_size,
+        &(tree_batch_config->committed_tokens),
+        sizeof(TreeVerifyBatchConfig::committed_tokens),
+        cudaMemcpyHostToDevice,
+        stream));
     total_copy_size += sizeof(TreeVerifyBatchConfig::committed_tokens);
   }
 

From 4957b7c7d4c73a6fca94ea40f140319b50b49e9a Mon Sep 17 00:00:00 2001
From: Xinhao Cheng <99570243+xinhaoc@users.noreply.github.com>
Date: Sat, 30 Dec 2023 23:24:37 -0500
Subject: [PATCH 288/344] Specinfer - new kernel (#1252)

* init

* fix speculative

* fix speculative

* bitmap+tree verify

* fix.

* fix

* multi batch

* copy metadata once

* fix some corner cases

* Replicate load_token tasks so that it can be fused with other compute tasks; this eliminates Replicate and enables a larger fused op

* more fix.

* clean up

* .

* load batchconfig

* clean

* hip

* hip

---------

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 include/flexflow/batch_config.h               |  29 +-
 include/flexflow/config.h                     |  11 +
 include/flexflow/model.h                      |   1 +
 .../ops/spec_inc_multihead_self_attention.h   |   1 +
 .../ops/tree_inc_multihead_self_attention.h   |   1 +
 include/flexflow/request_manager.h            |  33 +-
 inference/models/llama.cc                     |   4 +-
 inference/spec_infer/spec_infer.cc            |   3 +
 src/ops/argmax.cc                             |   2 +-
 src/ops/beam_topk.cc                          |   2 +-
 src/ops/beam_topk.cu                          |  65 +-
 src/ops/embedding.cc                          |  18 +-
 src/ops/inc_multihead_self_attention.cu       |  81 +-
 src/ops/spec_inc_multihead_self_attention.cc  |  12 +-
 src/ops/spec_inc_multihead_self_attention.cu  | 964 +++++++++++-------
 src/ops/tree_inc_multihead_self_attention.cu  | 232 +++--
 src/runtime/inference_manager.cc              |  56 +-
 src/runtime/model.cc                          |  48 +-
 src/runtime/model.cpp                         |  48 +
 src/runtime/model.cu                          |  25 +
 src/runtime/request_manager.cc                | 639 +++++++++---
 src/runtime/request_manager.cpp               |  85 ++
 src/runtime/request_manager.cu                |  86 ++
 23 files changed, 1727 insertions(+), 719 deletions(-)

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index e2903c4d11..13904aaa46 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -56,6 +56,7 @@ class BatchConfig {
   // across workers
   static int const MAX_NUM_REQUESTS = 64;
   static int const MAX_NUM_TOKENS = 1024;
+  static int const MAX_SPEC_TREE_TOKEN_NUM = 64;
 
   //  Set by update
   int num_tokens;
@@ -68,6 +69,9 @@ class BatchConfig {
     int first_token_offset_in_batch;
     int num_tokens_in_batch;
     int max_sequence_length;
+
+    // request id in batch config:
+    int batch_config_request_id;
     RequestGuid request_guid;
   };
   struct PerTokenInfo {
@@ -75,6 +79,24 @@ class BatchConfig {
     int request_index;
     TokenId token_id;
   };
+
+  struct BitMask {
+    unsigned long long mask[MAX_SPEC_TREE_TOKEN_NUM] = {0};
+
+    // how many tokens before the tree, every sub requests need this part of
+    // cache
+    int non_tree_cache_size;
+
+    // current tree size
+    int tree_size;
+
+    int this_layer_size;
+
+    // input length-> prompt/root
+    int prompt_size;
+  };
+
+  BitMask causalMask[MAX_NUM_REQUESTS];
   PerRequestInfo requestsInfo[MAX_NUM_REQUESTS];
   PerTokenInfo tokensInfo[MAX_NUM_TOKENS];
 
@@ -126,9 +148,12 @@ class BeamSearchBatchConfig : public BatchConfig {
 
   size_t beam_width;
   size_t target_iterations;
-  inline static int const MAX_BEAM_WIDTH = 1;
+  inline static int const MAX_BEAM_WIDTH = 3;
   inline static int const MAX_BEAM_DEPTH = 8;
 
+  // maximum tree branches for a request
+  inline static int const MAX_SPECULATIVE_TREE_BRANCHES = 3;
+
   int model_id;
 
   struct BeamSearchPerRequestInfo {
@@ -139,6 +164,7 @@ class BeamSearchBatchConfig : public BatchConfig {
     BatchConfig::TokenId tokens[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
     float probs[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
     int parent_id[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
+    int sub_request_num;
   };
 
   struct BeamSearchPerTokenInfo {
@@ -147,6 +173,7 @@ class BeamSearchBatchConfig : public BatchConfig {
 
   BeamSearchPerRequestInfo beamRequestsInfo[MAX_NUM_REQUESTS];
   BeamSearchPerTokenInfo beamTokenInfo[MAX_NUM_TOKENS * MAX_BEAM_WIDTH];
+
   // why is this == MAX_NUM_REQUESTS * MAX_BEAM_WIDTH?
   int sub_requests[MAX_NUM_REQUESTS * MAX_BEAM_WIDTH];
 
diff --git a/include/flexflow/config.h b/include/flexflow/config.h
index c2af6d707c..e1480264cc 100644
--- a/include/flexflow/config.h
+++ b/include/flexflow/config.h
@@ -16,6 +16,7 @@
 #ifndef _FLEXFLOW_CONFIG_H_
 #define _FLEXFLOW_CONFIG_H_
 #include "ffconst.h"
+#include "flexflow/batch_config.h"
 #include "legion.h"
 #include <cstring>
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
@@ -75,6 +76,15 @@ struct FFHandler {
 #endif
   void *workSpace;
   size_t workSpaceSize;
+  void *batch_config_metadata;
+
+  // request info + token info + topolopgy mask info
+  size_t batch_config_metadata_size =
+      sizeof(BatchConfig::tokensInfo) + sizeof(BatchConfig::requestsInfo) +
+      sizeof(BeamSearchBatchConfig::beamTokenInfo) +
+      sizeof(BeamSearchBatchConfig::beamRequestsInfo) +
+      sizeof(BatchConfig::causalMask) +
+      sizeof(TreeVerifyBatchConfig::committed_tokens);
   void *offload_reserve_space;
   size_t offload_reserve_space_size;
   DataType quantization_type;
@@ -132,6 +142,7 @@ class FFConfig {
   size_t workSpaceSize;
   Legion::Context lg_ctx;
   Legion::Runtime *lg_hlr;
+  Legion::IndexSpaceT<1> all_gpu_task_is;
   // Legion::FieldSpace field_space;
   bool syntheticInput, profiling, perform_fusion;
   bool inference_debugging;
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index d8402ba622..16df99ab1a 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -240,6 +240,7 @@ enum TaskIDs {
   // InferenceManager & RequestManager
   RM_LOAD_TOKENS_TASK_ID,
   RM_LOAD_POSITION_TASK_ID,
+  RM_LOAD_BATCH_CONFIG_TASK_ID,
   RM_PREPARE_NEXT_BATCH_TASK_ID,
   RM_PREPARE_NEXT_BATCH_INIT_TASK_ID,
   RM_PREPARE_NEXT_BATCH_BEAM_TASK_ID,
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention.h b/include/flexflow/ops/spec_inc_multihead_self_attention.h
index 56bb2bd80d..a306f7985a 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention.h
@@ -142,6 +142,7 @@ class SpecIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
   Realm::RegionInstance beam_search_reserve_inst;
   BeamSearchBatchConfig::BeamSearchPerTokenInfo *beam_token_infos;
   BeamSearchBatchConfig::BeamSearchPerRequestInfo *beam_request_infos;
+  BatchConfig::BitMask *causalMask;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention.h b/include/flexflow/ops/tree_inc_multihead_self_attention.h
index 6e2da19ce9..d160da4a72 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention.h
@@ -147,6 +147,7 @@ class TreeIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
   int num_active_tokens;
   Realm::RegionInstance committed_token_reserve_inst;
   TreeVerifyBatchConfig::CommittedTokensInfo *committed_token_infos;
+  BatchConfig::BitMask *causalMask;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index baf6844801..1c4b0b2a2f 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -38,10 +38,13 @@ class InferenceManager {
   Legion::FutureMap
       inference(FFModel *model, int index, BatchConfigFuture const &bc);
   void load_input_tokens_from_batch_config(BatchConfigFuture const &bc,
-                                           ParallelTensor const input);
+                                           ParallelTensor const input,
+                                           FFHandler *handlers);
   void load_positions(BatchConfigFuture const &bc,
                       ParallelTensor position_input,
                       int offset);
+  void load_inference_metadata_batch_config(BatchConfigFuture const &bc,
+                                            FFHandler *handlers);
 
 public:
   FFConfig ff_config;
@@ -72,9 +75,10 @@ struct Request {
 struct BeamTree {
   struct treeLayer {
     BeamSearchBatchConfig::TokenId
-        tokens[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
+        tokens[BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES];
     int parent_ids[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
-    float probs[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
+    float probs[BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES];
+    int nodes_num_this_layer = 0;
   };
   treeLayer treeLayers[BeamSearchBatchConfig::MAX_BEAM_DEPTH + 1];
 };
@@ -100,6 +104,7 @@ class RequestManager {
   void set_max_tokens_per_batch(int max_num_tokens);
   int get_max_tokens_per_batch();
   void set_max_sequence_length(int max_seq_length);
+  void push_spec_infer_tree_width(int tree_width);
   int get_max_sequence_length();
   int register_ssm_model(FFModel *model);
   void register_tokenizer(ModelType model_type,
@@ -107,6 +112,16 @@ class RequestManager {
                           int eos_token_id,
                           std::string const &path);
   void register_output_filepath(std::string const &);
+  void initBitMask(BatchConfig::BitMask &bitmask, int initLength);
+  void appendBitMask(BatchConfig::BitMask &bitmask,
+                     int newNodes,
+                     int preBeamSize,
+                     int old_sub_num,
+                     BeamTree const tree,
+                     int currentDepth);
+  void updateBitMask(BatchConfig::BitMask &bitmask,
+                     int initLength,
+                     int non_tree_size);
 
   FFModel *get_model(int model_id);
 
@@ -148,6 +163,7 @@ class RequestManager {
   void store_beam_metadata(BeamSearchBatchConfig const &old_bc,
                            BeamInferenceResult const &result);
   void update_beam_metadata(BeamSearchBatchConfig &new_bc,
+                            BeamSearchBatchConfig const &old_bc,
                             BeamTree &tree,
                             int request_index);
 
@@ -181,6 +197,11 @@ class RequestManager {
                           Legion::Context ctx,
                           Legion::Runtime *runtime);
 
+  static void
+      load_batch_config_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
   static BatchConfig prepare_next_batch_task(
       Legion::Task const *task,
       std::vector<Legion::PhysicalRegion> const &regions,
@@ -210,6 +231,9 @@ class RequestManager {
   int max_requests_per_batch;
   int max_tokens_per_batch;
   int max_sequence_length;
+
+  // tree width in each speculative step, if not specified 1
+  std::vector<int> spec_infer_tree_width;
   // private fields
   std::unique_ptr<Tokenizer> tokenizer_;
   bool verbose;
@@ -243,7 +267,8 @@ class RequestManager {
 
 private:
   struct ProfileInfo {
-    int decoding_steps;
+    int llm_decoding_steps;
+    int ssm_decoding_steps;
     double start_time, finish_time;
   };
   std::unordered_map<RequestGuid, ProfileInfo> profiling_requests;
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index b8fe70526d..10001ee916 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -246,7 +246,9 @@ void LLAMA::create_llama_model(FFModel &ff,
   if (mode == BEAM_SEARCH_MODE) {
     Tensor softmax = ff.softmax(dense, -1);
     // output = ff.beam_top_k(softmax, llama_config.max_beam_width, false);
-    output = ff.argmax(softmax, /*beam_Search*/ true);
+    // output = ff.argmax(softmax, /*beam_Search*/ true);
+    output = ff.beam_top_k(softmax, llama_config.max_beam_width, false);
+    // output = ff.top_k(softmax, )
   } else {
     // Tensor softmax = ff.softmax(dense, -1);
     if (generation_config.do_sample) {
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 8b0eb926d9..b369a13c1d 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -302,6 +302,9 @@ void FlexFlow::top_level_task(Task const *task,
                          model_metadata.llm_tokenizer_path);
   rm->register_output_filepath(file_paths.output_file_path);
 
+  // first decoding step: 3 results
+  rm->push_spec_infer_tree_width(3);
+
   // Create LLM model
   FFModel tree_model(ffconfig, ffconfig.cpu_offload);
   if (model_metadata.llm_model_type == ModelType::LLAMA) {
diff --git a/src/ops/argmax.cc b/src/ops/argmax.cc
index f336c843e8..dc7e4ea3b3 100644
--- a/src/ops/argmax.cc
+++ b/src/ops/argmax.cc
@@ -352,7 +352,6 @@ BeamInferenceResult
   GenericTensorAccessorW parent = helperGetGenericTensorAccessorWO(
       DT_INT32, regions[2], task->regions[2], FID_DATA, ctx, runtime);
   ArgMax::forward_kernel_wrapper(m, input, indices, parent, batch_size);
-
   BeamInferenceResult ir;
   download_tensor<BatchConfig::TokenId>(
       indices.get_int32_ptr(), ir.token_ids, batch_size);
@@ -398,6 +397,7 @@ InferenceResult
     ArgMax::save_inference_tensors_to_file(
         m, shard_id, bc, {}, {}, {input, indices});
   }
+
   download_tensor<BatchConfig::TokenId>(
       indices.get_int32_ptr(), ir.token_ids, batch_size);
   return ir;
diff --git a/src/ops/beam_topk.cc b/src/ops/beam_topk.cc
index 2883428254..18d0ec1587 100644
--- a/src/ops/beam_topk.cc
+++ b/src/ops/beam_topk.cc
@@ -366,7 +366,7 @@ BeamInferenceResult
   GenericTensorAccessorW value = helperGetGenericTensorAccessorWO(
       DT_FLOAT, regions[2], task->regions[2], FID_DATA, ctx, runtime);
   GenericTensorAccessorW parent = helperGetGenericTensorAccessorWO(
-      DT_FLOAT, regions[3], task->regions[3], FID_DATA, ctx, runtime);
+      DT_INT32, regions[3], task->regions[3], FID_DATA, ctx, runtime);
 
   Domain input_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
diff --git a/src/ops/beam_topk.cu b/src/ops/beam_topk.cu
index 72ab7862a6..a958786be3 100644
--- a/src/ops/beam_topk.cu
+++ b/src/ops/beam_topk.cu
@@ -556,8 +556,6 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
     int beam_size = bc->beamRequestsInfo[i].beam_size;
 
     // initial request
-    log_beam_topk.debug() << "sub_requests: " << i << ", " << sub_requests[i]
-                          << "\n";
     assert(sub_requests[i] > 0);
     // process sub requests
     for (int j = 0; j < sub_requests[i]; j++) {
@@ -565,12 +563,13 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
       // beam_slots[i].parent_id[j];
       acc_probs[req_index * BeamSearchBatchConfig::MAX_BEAM_WIDTH + j] =
           bc->beamRequestsInfo[i].probs[j];
-      log_beam_topk.debug()
-          << "probbbb req: " << i
-          << ", sub req probability : " << bc->beamRequestsInfo[i].probs[j]
-          << ", sub request id " << j << ", parent id "
-          << bc->beamRequestsInfo[i].parent_id[j] << ", data inddd"
-          << req_index * BeamSearchBatchConfig::MAX_BEAM_WIDTH + j << "\n";
+      // std::cout << "probbbb req: " << i << ", sub req probability : "
+      //           << bc->beamRequestsInfo[i].probs[j] << ", sub request id " <<
+      //           j
+      //           << ", parent id " << bc->beamRequestsInfo[i].parent_id[j]
+      //           << ", data inddd"
+      //           << req_index * BeamSearchBatchConfig::MAX_BEAM_WIDTH + j
+      //           << "\n";
     }
 
     // process tokens
@@ -584,6 +583,7 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
 
     max_heap_size = std::max(max_heap_size, beam_size * sub_requests[i]);
     max_beam_width = std::max(max_beam_width, beam_size);
+
     req_index += 1;
     block_start_index += (sub_requests[i] - 1) * num_new_tokens * length;
   }
@@ -613,28 +613,37 @@ void BeamTopK::forward_kernel(BeamTopKMeta const *m,
   assert(num_shards >= (size_t)max_heap_size);
   num_shards = max_heap_size;
 
-  checkCUDA(cudaMemcpy(m->parent_ids,
-                       parent_ids,
-                       sizeof(int) * max_total_requests,
-                       cudaMemcpyHostToDevice));
-  checkCUDA(cudaMemcpy(m->acc_probs,
-                       acc_probs,
-                       sizeof(DT) * max_total_requests,
-                       cudaMemcpyHostToDevice));
-  checkCUDA(cudaMemcpy(m->block_start_index,
-                       beam_block_start_index.data(),
-                       sizeof(int) * beam_num_blocks,
-                       cudaMemcpyHostToDevice));
-  checkCUDA(cudaMemcpy(m->request_id,
-                       request_id.data(),
-                       sizeof(int) * beam_num_blocks,
-                       cudaMemcpyHostToDevice));
-  checkCUDA(cudaMemcpy(m->tokens_per_request,
-                       tokens_per_request.data(),
-                       sizeof(int) * beam_num_blocks,
-                       cudaMemcpyHostToDevice));
+  checkCUDA(cudaMemcpyAsync(m->parent_ids,
+                            parent_ids,
+                            sizeof(int) * max_total_requests,
+                            cudaMemcpyHostToDevice,
+                            stream));
+  checkCUDA(cudaMemcpyAsync(m->acc_probs,
+                            acc_probs,
+                            sizeof(DT) * max_total_requests,
+                            cudaMemcpyHostToDevice,
+                            stream));
+  // trick, set acc_probs to 0;
+  checkCUDA(cudaMemsetAsync(
+      m->acc_probs, 1.0, max_total_requests * sizeof(DT), stream));
+  checkCUDA(cudaMemcpyAsync(m->block_start_index,
+                            beam_block_start_index.data(),
+                            sizeof(int) * beam_num_blocks,
+                            cudaMemcpyHostToDevice,
+                            stream));
+  checkCUDA(cudaMemcpyAsync(m->request_id,
+                            request_id.data(),
+                            sizeof(int) * beam_num_blocks,
+                            cudaMemcpyHostToDevice,
+                            stream));
+  checkCUDA(cudaMemcpyAsync(m->tokens_per_request,
+                            tokens_per_request.data(),
+                            sizeof(int) * beam_num_blocks,
+                            cudaMemcpyHostToDevice,
+                            stream));
   // int depth =
   //     bc->beamRequestsInfo[bc->tokensInfo[0].request_index].current_depth;
+  beam_num_blocks = bc->num_active_tokens();
   beam_topk_forward_kernel<<<beam_num_blocks, num_shards, 0, stream>>>(
       input_ptr,
       shared_memory_size,
diff --git a/src/ops/embedding.cc b/src/ops/embedding.cc
index 007e799fe0..76236e65ff 100644
--- a/src/ops/embedding.cc
+++ b/src/ops/embedding.cc
@@ -155,11 +155,8 @@ int Embedding::output_size(ParallelDim output_dims[MAX_TENSOR_DIM]) {
     output_dims[OUT_CHANNELS].size = this->out_channels;
     output_dims[OUT_CHANNELS].degree = 1;
     output_dims[OUT_CHANNELS].parallel_idx = -1;
-    // Currently do not support parallelizing over the replica dim
-    output_dims[num_dims - 1].size = 1;
-    output_dims[num_dims - 1].degree = 1;
-    output_dims[num_dims - 1].parallel_idx = -1;
-    output_dims[num_dims - 1].is_replica_dim = true;
+    // Copy replica dim
+    output_dims[num_dims - 1] = input->dims[input->num_dims - 1];
     return num_dims;
   } else {
     int num_dims = input->num_dims;
@@ -170,11 +167,8 @@ int Embedding::output_size(ParallelDim output_dims[MAX_TENSOR_DIM]) {
     output_dims[OUT_CHANNELS].size = this->out_channels;
     output_dims[OUT_CHANNELS].degree = 1;
     output_dims[OUT_CHANNELS].parallel_idx = -1;
-    // Currently do not support parallelizing over the replica dim
-    output_dims[num_dims - 1].size = 1;
-    output_dims[num_dims - 1].degree = 1;
-    output_dims[num_dims - 1].parallel_idx = -1;
-    output_dims[num_dims - 1].is_replica_dim = true;
+    // Copy replica dim
+    output_dims[num_dims - 1] = input->dims[input->num_dims - 1];
     return num_dims;
   }
   // const int REPLICA = this->output_vocab_size_replica_dim();
@@ -189,13 +183,13 @@ int Embedding::weight_size(ParallelDim weight_dims[MAX_TENSOR_DIM]) {
   weight_dims[Weight::VOCAB_SIZE].size = this->num_entries;
   weight_dims[Weight::VOCAB_SIZE].degree = 1;
   weight_dims[Weight::VOCAB_SIZE].parallel_idx = -1;
-  for (int i = 2; i < input->num_dims; i++) {
+  for (int i = 2; i < input->num_dims + 1; i++) {
     weight_dims[i].size = input->dims[i - 1].degree;
     weight_dims[i].degree = weight_dims[i].size;
     weight_dims[i].parallel_idx = input->dims[i - 1].parallel_idx;
     weight_dims[i].is_replica_dim = true;
   }
-  return input->num_dims;
+  return input->num_dims + 1;
 }
 
 void Embedding::register_output_mappings() {
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 695f4b13b9..da70e23f87 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -82,6 +82,9 @@ __global__ void compute_attention_kernel_generation_kernel(
   // request idx
   int const request_idx = blockIdx.y;
 
+  int const batch_config_request_id =
+      request_infos[request_idx].batch_config_request_id;
+
   int const beam_request_idx =
       is_beam ? request_idx / max_beam_width : request_idx;
   int const beam_sub_request_idx = is_beam ? request_idx % max_beam_width : 0;
@@ -89,8 +92,8 @@ __global__ void compute_attention_kernel_generation_kernel(
   int const first_step = 0;
 
   int const tlength =
-      request_infos[beam_request_idx].first_token_depth_in_request +
-      request_infos[beam_request_idx].num_tokens_in_batch;
+      request_infos[batch_config_request_id].first_token_depth_in_request +
+      request_infos[batch_config_request_id].num_tokens_in_batch;
 
   // shared memory objects
   extern __shared__ char smem_[];
@@ -103,7 +106,8 @@ __global__ void compute_attention_kernel_generation_kernel(
   // first WARPS_PER_BLOCK for store qk_max, second WARPS_PER_BLOCK for sum
   __shared__ float red_smem[WARPS_PER_BLOCK * 2];
 
-  const DT *q_ptr = query + beam_request_idx * hidden_size * QKV_WEIGHT_NUM +
+  const DT *q_ptr = query +
+                    batch_config_request_id * hidden_size * QKV_WEIGHT_NUM +
                     head_idx * per_head_size;
   __shared__ Q_vec q_vecs[THREADS_PER_KEY][K_VECS_PER_THREAD];
   // DT const *q_ptr =
@@ -139,7 +143,7 @@ __global__ void compute_attention_kernel_generation_kernel(
 
   DT const *k_cache_batch =
       key_cache +
-      (beam_request_idx * max_beam_width + beam_sub_request_idx) *
+      (batch_config_request_id * max_beam_width + beam_sub_request_idx) *
           max_seq_length * hidden_size +
       ki;
 
@@ -245,7 +249,7 @@ __global__ void compute_attention_kernel_generation_kernel(
   // The base pointer for the value in the cache buffer.
   DT const *v_cache_batch =
       value_cache +
-      (beam_request_idx * max_beam_width + beam_sub_request_idx) *
+      (batch_config_request_id * max_beam_width + beam_sub_request_idx) *
           max_seq_length * hidden_size +
       vi;
 
@@ -825,19 +829,6 @@ void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
     bias_ptr = static_cast<DT *>(m->bias_ptr);
   }
 
-  // todo Xinhao copy how many requests if requests are not continous?
-  cudaMemcpyAsync(m->token_infos,
-                  &(bc->tokensInfo),
-                  bc->num_active_tokens() * sizeof(BatchConfig::PerTokenInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
-  cudaMemcpyAsync(m->request_infos,
-                  &(bc->requestsInfo),
-                  bc->max_requests_per_batch() *
-                      sizeof(BatchConfig::PerRequestInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
-
   // phase 1: Implement kernel to compute KQV for input tokens
   compute_qkv_kernel(m,
                      bc,
@@ -1364,8 +1355,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
                                                        vProjSize * num_q_heads);
     size_t key_cache_size = 0, value_cache_size = 0;
     switch (infer_mode) {
-      case INC_DECODING_MODE:
-      case TREE_VERIFY_MODE: {
+      case INC_DECODING_MODE: {
         key_cache_size = num_q_heads * kProjSize *
                          BatchConfig::max_requests_per_batch() *
                          BatchConfig::max_sequence_length();
@@ -1374,22 +1364,24 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
                            BatchConfig::max_sequence_length();
         break;
       }
-      case BEAM_SEARCH_MODE: {
+      case BEAM_SEARCH_MODE:
+      case TREE_VERIFY_MODE: {
+        // a K-ary tree max node is (k^n - 1) / 2
         key_cache_size = num_q_heads * kProjSize *
                          BeamSearchBatchConfig::max_requests_per_batch() *
-                         BatchConfig::max_sequence_length() *
-                         BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+                         (BatchConfig::max_sequence_length() +
+                          BatchConfig::MAX_SPEC_TREE_TOKEN_NUM);
         value_cache_size = num_q_heads * vProjSize *
                            BeamSearchBatchConfig::max_requests_per_batch() *
-                           BatchConfig::max_sequence_length() *
-                           BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+                           (BatchConfig::max_sequence_length() +
+                            BatchConfig::MAX_SPEC_TREE_TOKEN_NUM);
         break;
       }
       default:
         assert(false && "Unkown inference mode");
     }
     size_t requestinfo_size = BatchConfig::max_requests_per_batch();
-    size_t tokeninfo_size = max_tokens_per_batch;
+    // size_t tokeninfo_size = max_tokens_per_batch;
     size_t qk_prod_size =
         max_tokens_per_batch * BatchConfig::max_sequence_length() * num_q_heads;
     size_t attn_heads_size = max_tokens_per_batch * num_q_heads * vProjSize;
@@ -1400,11 +1392,8 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
         (qkv_max_proj_size + key_cache_size + value_cache_size +
          2 * qk_prod_size + attn_heads_size) *
             size_of_dt +
-        tokeninfo_size * sizeof(BatchConfig::PerTokenInfo) +
-        complex_size * sizeof(cuFloatComplex) +
-        requestinfo_size *
-            sizeof(BatchConfig::PerRequestInfo); // more components will
-                                                 // be added here later
+        complex_size * sizeof(cuFloatComplex); // more components will
+                                               // be added here later
     if (offload) {
       // assert that we have enough reserved work space left
       size_t totalSharedSize =
@@ -1447,10 +1436,16 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     valueCache = gpu_mem_allocator.allocate_instance_untyped(value_cache_size *
                                                              size_of_dt);
 
+    token_infos =
+        static_cast<BatchConfig::PerTokenInfo *>(handler.batch_config_metadata);
+    request_infos = reinterpret_cast<BatchConfig::PerRequestInfo *>(
+        reinterpret_cast<char *>(handler.batch_config_metadata) +
+        sizeof(BatchConfig::tokensInfo));
+
     if (offload) {
-      token_infos =
-          gpu_mem_allocator.allocate_reserved<BatchConfig::PerTokenInfo>(
-              tokeninfo_size);
+      // token_infos =
+      //     gpu_mem_allocator.allocate_reserved<BatchConfig::PerTokenInfo>(
+      //         tokeninfo_size);
       // offset += sizeof(BatchConfig::PerTokenInfo) * tokeninfo_size;
       qk_prods = gpu_mem_allocator.allocate_reserved_untyped(qk_prod_size *
                                                              size_of_dt);
@@ -1464,13 +1459,13 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
       complex_input =
           gpu_mem_allocator.allocate_reserved<cuFloatComplex>(complex_size);
       // offset += complex_size * sizeof(cuFloatComplex);
-      request_infos =
-          gpu_mem_allocator.allocate_reserved<BatchConfig::PerRequestInfo>(
-              requestinfo_size);
+      // request_infos =
+      //     gpu_mem_allocator.allocate_reserved<BatchConfig::PerRequestInfo>(
+      //         requestinfo_size);
     } else {
-      token_infos =
-          gpu_mem_allocator.allocate_instance<BatchConfig::PerTokenInfo>(
-              tokeninfo_size);
+      // token_infos =
+      //     gpu_mem_allocator.allocate_instance<BatchConfig::PerTokenInfo>(
+      //         tokeninfo_size);
       qk_prods = gpu_mem_allocator.allocate_instance_untyped(qk_prod_size *
                                                              size_of_dt);
       qk_prods_softmax = gpu_mem_allocator.allocate_instance_untyped(
@@ -1479,9 +1474,9 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
                                                                size_of_dt);
       complex_input =
           gpu_mem_allocator.allocate_instance<cuFloatComplex>(complex_size);
-      request_infos =
-          gpu_mem_allocator.allocate_instance<BatchConfig::PerRequestInfo>(
-              requestinfo_size);
+      // request_infos =
+      //     gpu_mem_allocator.allocate_instance<BatchConfig::PerRequestInfo>(
+      //         requestinfo_size);
     }
 
     // allocate more size for quantization data
diff --git a/src/ops/spec_inc_multihead_self_attention.cc b/src/ops/spec_inc_multihead_self_attention.cc
index eb6fd721e6..5d234df822 100644
--- a/src/ops/spec_inc_multihead_self_attention.cc
+++ b/src/ops/spec_inc_multihead_self_attention.cc
@@ -53,7 +53,7 @@ bool SpecIncMultiHeadSelfAttentionParams::is_valid(
 }
 
 Tensor
-    FFModel::spec_inc_multihead_self_attention(const Tensor input,
+    FFModel::spec_inc_multihead_self_attention(Tensor const input,
                                                int embed_dim,
                                                int num_heads,
                                                int kdim,
@@ -91,7 +91,7 @@ Tensor
 }
 
 Tensor
-    FFModel::spec_inc_multiquery_self_attention(const Tensor input,
+    FFModel::spec_inc_multiquery_self_attention(Tensor const input,
                                                 int embed_dim,
                                                 int num_q_heads,
                                                 int num_kv_heads,
@@ -257,7 +257,7 @@ Op *SpecIncMultiHeadSelfAttention::create_operator_from_layer(
 SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     FFModel &model,
     LayerID const &_layer_guid,
-    const ParallelTensor _input,
+    ParallelTensor const _input,
     int _embed_dim,
     int _num_q_heads,
     int _num_kv_heads,
@@ -358,8 +358,8 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
 
 SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     FFModel &model,
-    const ParallelTensor _input,
-    const ParallelTensor _weight,
+    ParallelTensor const _input,
+    ParallelTensor const _weight,
     int _embed_dim,
     int _num_q_heads,
     int _num_kv_heads,
@@ -465,7 +465,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
 SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
     FFModel &model,
     SpecIncMultiHeadSelfAttention const &other,
-    const ParallelTensor input,
+    ParallelTensor const input,
     bool allocate_weights)
     : SpecIncMultiHeadSelfAttention(model,
                                     other.layer_guid,
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 562dee4d93..88dd3f92e4 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -23,16 +23,286 @@
 
 namespace FlexFlow {
 
+#define WARP_SIZE 32
+
 // declare Legion names
 using Legion::coord_t;
 using Legion::Memory;
 using namespace Kernels::IncMultiHeadAttention;
 
 namespace Kernels {
-namespace SpecIncMultiHeadAttention {
+namespace SpecIncMultiHeadSelfAttention {
+
+template <typename DT,
+          int THREADS_PER_BLOCK,
+          int Dh,
+          int Dh_MAX,
+          int THREADS_PER_KEY,
+          int THREADS_PER_VALUE>
+__global__ void compute_spec_inc_attention_kernel_generation_kernel(
+    DT const *query,
+    DT const *key_cache,
+    DT const *value_cache,
+    DT *output_ptr,
+    float const scale,
+    int const max_seq_length,
+    int per_head_size,
+    int hidden_size,
+    BatchConfig::PerRequestInfo *request_infos,
+    BeamSearchBatchConfig::BeamSearchPerRequestInfo *beam_request_infos,
+    BatchConfig::BitMask *causalMask) {
+
+  // q, k
+  using Q_vec = typename VEC_K<DT, THREADS_PER_KEY>::Type;
+  using K_vec = typename VEC_K<DT, THREADS_PER_KEY>::Type;
+  using V_vec = typename VEC_V<DT>::Type;
+  using Out_sum = typename Vec_fp32_<V_vec>::Type;
+
+  constexpr int WARPS_PER_BLOCK = THREADS_PER_BLOCK / WARP_SIZE;
+
+  constexpr int K_VEC_SIZE = sizeof(K_vec) / sizeof(DT);
+  constexpr int K_ELTS_PER_THREAD = Dh / THREADS_PER_KEY;
+  constexpr int K_VECS_PER_THREAD = K_ELTS_PER_THREAD / K_VEC_SIZE;
+  // constexpr int QK_ELTS_IN_16B = 16 / sizeof(DT);
+
+  // thread id
+  int const tidx = threadIdx.x;
+  // head id
+  int const head_idx = blockIdx.x;
+  // nth request idx
+  int const request_idx = blockIdx.y;
+
+  // request id in batch config
+  int const batch_config_request_id =
+      request_infos[request_idx].batch_config_request_id;
+
+  // request_idx = re
+
+  BatchConfig::BitMask bitmask = causalMask[batch_config_request_id];
+
+  int const first_step = 0;
+
+  // int const tlength =
+  //     request_infos[batch_config_request_id].first_token_depth_in_request +
+  //     request_infos[batch_config_request_id].num_tokens_in_batch;
+
+  int const totalCacheSize = bitmask.non_tree_cache_size + bitmask.tree_size;
+
+  int first_token_idx = 0;
+  for (int r = 0; r < request_idx; r++) {
+    first_token_idx += causalMask[r].this_layer_size;
+  }
+
+  int const tree_branch_num =
+      beam_request_infos[batch_config_request_id].sub_request_num;
+
+  // shared memory objects
+  extern __shared__ char smem_[];
+
+  float *qk_smem = reinterpret_cast<float *>(smem_);
+  float *out_smem = reinterpret_cast<float *>(smem_);
+
+  float qk_max = -FLT_MAX;
+
+  // first WARPS_PER_BLOCK for store qk_max, second WARPS_PER_BLOCK for sum
+  __shared__ float red_smem[WARPS_PER_BLOCK * 2];
+
+  const DT *q_ptr = query + first_token_idx * hidden_size * QKV_WEIGHT_NUM +
+                    head_idx * per_head_size;
+  __shared__ Q_vec q_vecs[THREADS_PER_KEY][K_VECS_PER_THREAD];
+
+  // the start offset of the element eg. (0, 1, 2, 3) * K_VEC_SIZE
+  int ki = tidx % THREADS_PER_KEY * K_VEC_SIZE;
+  int ki_o = tidx % THREADS_PER_KEY;
+  // the first key's offset for this thread
+  // ko = 0, 0, 0, 0, 1, 1, 1, 1, ....
+  int ko = tidx / THREADS_PER_KEY;
+  // load q tensor
+  Q_vec q_vec[K_VECS_PER_THREAD];
+
+  constexpr int K_PER_ITER = THREADS_PER_BLOCK / THREADS_PER_KEY;
+  // The number of keys per warp.
+  constexpr int K_PER_WARP = WARP_SIZE / THREADS_PER_KEY;
+
+  DT const *k_cache_batch =
+      key_cache + batch_config_request_id * max_seq_length * hidden_size + ki;
+
+  int ti_end =
+      div_up(totalCacheSize - first_step, K_PER_WARP) * K_PER_WARP + first_step;
+
+  for (int qi = 0; qi < tree_branch_num; qi += 1) {
+#pragma unroll
+    for (int ii = 0; ii < K_VECS_PER_THREAD; ++ii) {
+      q_vecs[ki_o][ii] = *reinterpret_cast<Q_vec const *>(
+          q_ptr + (hidden_size * QKV_WEIGHT_NUM * qi) + ki +
+          ii * THREADS_PER_KEY * K_VEC_SIZE);
+    }
+
+    int const query_token = bitmask.tree_size - tree_branch_num + qi;
+
+    __syncthreads();
+    for (int ti = ko; ti < ti_end; ti += K_PER_ITER) {
+      K_vec k[K_VECS_PER_THREAD];
+      int const ti_circ = ti % max_seq_length;
+
+      for (int ii = 0; ii < K_VECS_PER_THREAD; ++ii) {
+        int jj = ii * THREADS_PER_KEY * K_VEC_SIZE;
+        if (ti < totalCacheSize) {
+
+          k[ii] = *reinterpret_cast<K_vec const *>(
+              k_cache_batch + ti_circ * hidden_size + head_idx * per_head_size +
+              jj);
+        }
+      }
+      float qk = scale * Qk_dot<DT, THREADS_PER_KEY>::dot(q_vecs[ki_o], k);
+
+      if (ti < totalCacheSize && tidx % THREADS_PER_KEY == 0) {
+        // todo add alobi here
+        // bool const mask = ti_circ >= totalCacheSize;
+        bool const mask = (ti >= bitmask.non_tree_cache_size &&
+                           (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
+                              (1 << query_token))));
+
+        // if (blockIdx.y == 0 && blockIdx.x == 0 && !mask) {
+        //   printf("spec inc attn qkqkqk %d,  %.10f, %d\n", ti, qk, qi);
+        // }
+        qk_max = mask ? qk_max : fmaxf(qk_max, qk);
+        qk_smem[ti - first_step] = mask ? 0.f : qk;
+      }
+    }
+
+    __syncthreads();
+
+#pragma unroll
+    for (int mask = WARP_SIZE / 2; mask >= THREADS_PER_KEY; mask /= 2) {
+      qk_max = fmaxf(qk_max, __shfl_xor_sync(uint32_t(-1), qk_max, mask));
+    }
+
+    // Decompose the thread index into warp and lane.
+    int const warp = tidx / WARP_SIZE;
+    int const lane = tidx % WARP_SIZE;
+
+    // The warp leader writes the max to shared memory.
+    if (lane == 0) {
+      red_smem[warp] = qk_max;
+    }
+
+    // Make sure the products are in shared memory.
+    __syncthreads();
+
+    // The warps finalize the reduction.
+    qk_max = lane < WARPS_PER_BLOCK ? red_smem[lane] : -FLT_MAX;
+#pragma unroll
+    for (int mask = WARPS_PER_BLOCK / 2; mask >= 1; mask /= 2) {
+      qk_max = fmaxf(qk_max, __shfl_xor_sync(uint32_t(-1), qk_max, mask));
+    }
+
+    // Broadcast to all the threads in the warp.
+    qk_max = __shfl_sync(uint32_t(-1), qk_max, 0);
+
+    // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
+    //   printf("spec inc attn first token qk_max %.10f\n", qk_max);
+    // }
+
+    float exp_sum = 0.f;
+    for (int ti = first_step + tidx; ti < totalCacheSize;
+         ti += THREADS_PER_BLOCK) {
+      bool const mask = (ti >= bitmask.non_tree_cache_size &&
+                         (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
+                            (1 << query_token))));
+      float logit = mask ? 0.0f : __expf(qk_smem[ti - first_step] - qk_max);
+      exp_sum += logit;
+      qk_smem[ti - first_step] = mask ? 0.0f : logit;
+    }
+
+    // Compute the sum.
+    exp_sum = block_sum<WARPS_PER_BLOCK>(&red_smem[WARPS_PER_BLOCK], exp_sum);
+
+    // softmax
+    float inv_sum = __fdividef(1.f, exp_sum + 1.e-6);
+    for (int ti = first_step + tidx; ti < totalCacheSize;
+         ti += THREADS_PER_BLOCK) {
+      qk_smem[ti - first_step] *= inv_sum;
+    }
+
+    __syncthreads();
+
+    // value projection
+    constexpr int V_VEC_SIZE = 16 / sizeof(DT);
+    // A vector of V elements for the current timestep.
+    // using V_vec_k = typename V_vec_k_<DT, V_VEC_SIZE>::Type;
+    // using V_vec_acum = typename V_vec_acum_fp32_<V_vec_k>::Type;
+
+    // The value computed by this thread.
+    int vo = tidx / THREADS_PER_VALUE;
+    // The hidden dimensions computed by this particular thread.
+    int vi = tidx % THREADS_PER_VALUE * V_VEC_SIZE;
+    constexpr int V_PER_ITER = THREADS_PER_BLOCK / THREADS_PER_VALUE;
+
+    Out_sum out;
+    zero(out);
+
+    // The base pointer for the value in the cache buffer.
+    DT const *v_cache_batch =
+        value_cache + batch_config_request_id * max_seq_length * hidden_size +
+        vi;
+
+    if (Dh == Dh_MAX || vi < Dh) {
+      for (int ti = first_step + vo; ti < totalCacheSize; ti += V_PER_ITER) {
+        // Load the values from the cache.
+        int const ti_circ = ti % max_seq_length;
+        V_vec v = *reinterpret_cast<V_vec const *>(
+            v_cache_batch + ti_circ * hidden_size + head_idx * per_head_size);
+
+        bool const mask = (ti >= bitmask.non_tree_cache_size &&
+                           (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
+                              (1 << query_token))));
+        float logit = mask ? 0.0f : qk_smem[ti - first_step];
+        out = FlexFlow::fma(logit, cast_to_float(v), out);
+      }
+    }
+
+    //   // Make sure we can start writing to shared memory.
+    __syncthreads();
+
+    // Run the final reduction amongst the different groups computing different
+    // partial outputs.
+    if (Dh == Dh_MAX || vi < Dh) {
+#pragma unroll
+      for (int active_groups = V_PER_ITER; active_groups >= 2;
+           active_groups /= 2) {
+
+        // The midpoint in the number of active groups.
+        int midpoint = active_groups / 2;
+
+        // The upper part of active threads store to shared memory.
+        if (vo >= midpoint && vo < active_groups && (Dh == Dh_MAX || vi < Dh)) {
+          *reinterpret_cast<Out_sum *>(out_smem + (vo - midpoint) * Dh + vi) =
+              out;
+        }
+        __syncthreads();
+
+        // The bottom warps update their values.
+        if (vo < midpoint && (Dh == Dh_MAX || vi < Dh)) {
+          out = add(*reinterpret_cast<Out_sum const *>(out_smem + vo * Dh + vi),
+                    out);
+        }
+        __syncthreads();
+      }
+    }
+
+    // Output the final values.
+    if (vo == 0 && (Dh == Dh_MAX || vi < Dh)) {
+      convert_from_float(*reinterpret_cast<V_vec *>(
+                             output_ptr + (first_token_idx + qi) * hidden_size +
+                             head_idx * per_head_size + vi),
+                         out);
+    }
+  }
+}
 
 template <typename DT>
-__global__ void spec_store_kv_cache(
+__global__ void spec_inc_store_kv_cache(
     DT const *devQKVProjArray,
     DT *kCache_ptr,
     DT *vCache_ptr,
@@ -40,16 +310,16 @@ __global__ void spec_store_kv_cache(
     BatchConfig::PerRequestInfo *requestInfo,
     BeamSearchBatchConfig::BeamSearchPerTokenInfo *beamTokenInfos,
     BeamSearchBatchConfig::BeamSearchPerRequestInfo *beamRequestInfos,
+    BatchConfig::BitMask *causalMask,
     int qProjSize,
     int kProjSize,
     int vProjSize,
     int num_tokens,
     int max_seq_len,
-    int max_beam_width,
     bool is_root,
     int hidden_size) {
-  CUDA_KERNEL_LOOP(i, num_tokens * hidden_size * 2) {
-    int token_idx = i / (hidden_size * KV_WEIGHT_NUM);
+  CUDA_KERNEL_LOOP(i, num_tokens * hidden_size) {
+    int token_idx = i / (hidden_size);
     int offset = i % hidden_size;
 
     size_t val_idx =
@@ -58,100 +328,30 @@ __global__ void spec_store_kv_cache(
     DT kVal = devQKVProjArray[val_idx];
     DT vVal = devQKVProjArray[val_idx + hidden_size];
 
-    // above no need to be changed
-    // int const req_id = id_map[token_idx].request_index;
-    // int const tok_id = id_map[token_idx].token_position;
-    // int const sub_req_id = id_map[token_idx].sub_request_index;
-    // int const parent_id = id_map[token_idx].parent_id;
-    // int const beam_depth = id_map[token_idx].beam_depth;
-    // int const beam_width = id_map[token_idx].beam_width;
-
     int const req_id = tokenInfos[token_idx].request_index;
-    int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
-    int const sub_req_id = beamTokenInfos[token_idx].sub_request_index;
-    int const parent_id = beamRequestInfos[req_id].parent_id[sub_req_id];
-    int const beam_depth = beamRequestInfos[req_id].current_depth;
-    int const beam_width = beamRequestInfos[req_id].beam_size;
-
-    kCache_ptr[(req_id * max_beam_width + sub_req_id) *
-                   (hidden_size * max_seq_len) +
-               tok_id * hidden_size + offset] = kVal;
-    vCache_ptr[(req_id * max_beam_width + sub_req_id) *
-                   (hidden_size * max_seq_len) +
-               tok_id * hidden_size + offset] = vVal;
-
-    // replica in the root iteration
-    if (beam_depth == 1) {
-      for (int i = 1; i < beam_width; i++) {
-        kCache_ptr[(req_id * max_beam_width + i) * (hidden_size * max_seq_len) +
-                   tok_id * hidden_size + offset] = kVal;
-        vCache_ptr[(req_id * max_beam_width + i) * (hidden_size * max_seq_len) +
-                   tok_id * hidden_size + offset] = vVal;
-      }
-    }
+    // int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
 
-    // if (head_idx == 0 && beam_depth == 0 && token_idx == 8 && k_cache) {
-    //   // printf("token idx %d\n", token_idx);
-    //   printf("data idx: %d, tok_id %d, new_token_cache_idx %d, parent_id %d,
-    //   "
-    //          "sub_req_id %d, num_tokens %d, kProjSize %d, num_kv_heads %d,
-    //          val "
-    //          "%f, beam_width %d\n",
-    //          data_idx,
-    //          tok_id,
-    //          new_token_cache_idx,
-    //          parent_id,
-    //          sub_req_id,
-    //          num_tokens,
-    //          kProjSize,
-    //          num_kv_heads,
-    //          val,
-    //          beam_width);
-    // }
+    int const request_token_offset =
+        requestInfo[req_id].first_token_offset_in_batch;
 
-    // naive cache stealing
-    if (sub_req_id != parent_id) {
-      if (offset == 0 && tok_id == 0) {
-        printf("cache stealing!, depth %d req_id %d sub_req_id %d, parentid "
-               "%d, tok_id %d\n",
-               beam_depth,
-               req_id,
-               sub_req_id,
-               parent_id,
-               tok_id);
-      }
+    BatchConfig::BitMask bitmask = causalMask[req_id];
 
-      for (int depth = 0; depth < beam_depth; depth++) {
-        int steal_token_idx = tok_id - beam_depth + depth;
-        int steal_from_idx = (req_id * max_beam_width + parent_id) *
-                                 (hidden_size * max_seq_len) +
-                             steal_token_idx * hidden_size + offset;
-        int steal_to_idx = (req_id * max_beam_width + sub_req_id) *
-                               (hidden_size * max_seq_len) +
-                           steal_token_idx * hidden_size + offset;
-        kCache_ptr[steal_to_idx] = kCache_ptr[steal_from_idx];
-        vCache_ptr[steal_to_idx] = vCache_ptr[steal_from_idx];
-
-        //   if(data_idx == 0 && head_idx == 0 && k_cache && req_id == 1){
-        //     printf("cache stealing kernel!, steal_token_idx %d\n",
-        //     steal_token_idx);
-        // }
-      }
-    }
+    // int const tree_branch_num = beamRequestInfos[req_id].sub_request_num;
+
+    // int const query_token = bitmask.non_tree_cache_size + bitmask.tree_size -
+    //                         tree_branch_num + sub_req_id + tok_id;
+    // bitmask.tree_size - tree_branch_num + sub_req_id;
+
+    // if prompt token -> token id
+    // if tree token:
+    int const cache_idx = bitmask.non_tree_cache_size + bitmask.tree_size -
+                          bitmask.this_layer_size + token_idx -
+                          request_token_offset;
 
-    // parallel cache stealing not yet implemented
-    // logic shld be
-    // launch spec_store_kv_cache with parallelism * current depth
-    // from the i here, get depth index
-    // if depth index not the current one, check if we need to steal
-    // steal if needed
-
-    // cache stealing theory
-    // identify which sub request does this token come from
-    // for initial token, 0
-    // for other, may 0,0,1/ 0,1,2/ 1,1,1 to get which cache to be reuse and
-    // which to be delete copy beam_size bunch of blocks when sub_req_id ==
-    // parent_id : like 0 -> 0, 1->1, 2->2, do nothing, just append the new k/v
+    kCache_ptr[req_id * (hidden_size * max_seq_len) + (cache_idx)*hidden_size +
+               offset] = kVal;
+    vCache_ptr[req_id * (hidden_size * max_seq_len) + (cache_idx)*hidden_size +
+               offset] = vVal;
   }
 }
 
@@ -161,28 +361,79 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                             cudaStream_t stream) {
   int num_tokens = bc->num_active_tokens();
   int curr_depth = bc->beamRequestsInfo[0].current_depth;
-  // printf("curr depth: %d\n", curr_depth);
-  // assert(curr_depth < 3);
   if (num_tokens > 0) {
     int parallelism = m->hidden_size * KV_WEIGHT_NUM * num_tokens;
-    spec_store_kv_cache<<<GET_BLOCKS(parallelism),
-                          min(CUDA_NUM_THREADS, parallelism),
-                          0,
-                          stream>>>(static_cast<DT *>(m->devQKVProjArray),
-                                    static_cast<DT *>(m->keyCache),
-                                    static_cast<DT *>(m->valueCache),
-                                    m->token_infos,
-                                    m->request_infos,
-                                    m->beam_token_infos,
-                                    m->beam_request_infos,
-                                    m->qProjSize,
-                                    m->kProjSize,
-                                    m->vProjSize,
-                                    num_tokens,
-                                    BatchConfig::max_sequence_length(),
-                                    BeamSearchBatchConfig::MAX_BEAM_WIDTH,
-                                    /*root*/ curr_depth == 0,
-                                    m->hidden_size);
+    spec_inc_store_kv_cache<<<GET_BLOCKS(parallelism),
+                              min(CUDA_NUM_THREADS, parallelism),
+                              0,
+                              stream>>>(
+        static_cast<DT *>(m->devQKVProjArray),
+        static_cast<DT *>(m->keyCache),
+        static_cast<DT *>(m->valueCache),
+        m->token_infos,
+        m->request_infos,
+        m->beam_token_infos,
+        m->beam_request_infos,
+        m->causalMask,
+        m->qProjSize,
+        m->kProjSize,
+        m->vProjSize,
+        num_tokens,
+        BatchConfig::max_sequence_length() +
+            BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,
+        /*root*/ curr_depth == 0,
+        m->hidden_size);
+  }
+}
+
+#define LAUNCH_SPEC_INC_ATTENTION_SCORE_KERNEL(                                \
+    DT, Dh, Dh_MAX, THDS_PER_KEY, THREADS_PER_VALUE, THDS_PER_BLOCK, stream)   \
+  smem_sz = smem_size_in_bytes<DT>(m->qProjSize,                               \
+                                   BatchConfig::max_sequence_length() +        \
+                                       BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,   \
+                                   THREADS_PER_VALUE,                          \
+                                   THDS_PER_BLOCK);                            \
+  compute_spec_inc_attention_kernel_generation_kernel<DT,                      \
+                                                      THDS_PER_BLOCK,          \
+                                                      Dh,                      \
+                                                      Dh_MAX,                  \
+                                                      THDS_PER_KEY,            \
+                                                      THREADS_PER_VALUE>       \
+      <<<grid, THDS_PER_BLOCK, smem_sz, stream>>>(                             \
+          static_cast<DT *>(m->devQKVProjArray),                               \
+          static_cast<DT *>(m->keyCache),                                      \
+          static_cast<DT *>(m->valueCache),                                    \
+          output_ptr,                                                          \
+          scale,                                                               \
+          BatchConfig::max_sequence_length() +                                 \
+              BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,                            \
+          m->qProjSize,                                                        \
+          m->hidden_size,                                                      \
+          m->request_infos,                                                    \
+          m->beam_request_infos,                                               \
+          m->causalMask)
+
+template <typename DT>
+void compute_spec_inc_attention_kernel_generation(
+    SpecIncMultiHeadSelfAttentionMeta const *m,
+    BeamSearchBatchConfig const *bc,
+    DT *output_ptr,
+    cudaStream_t stream) {
+  // one block == one head per request
+  dim3 grid(m->num_q_heads, bc->num_active_requests());
+  int const per_head_size = m->qProjSize;
+  float scale = (*m->qk_prod_scaling) ? 1.0f / sqrt(m->kProjSize) : 1.0f;
+  size_t smem_sz;
+  if (per_head_size == 64) {
+    constexpr int THREADS_PER_VALUE_64 = threads_per_value_t<DT, 64>::value;
+    LAUNCH_SPEC_INC_ATTENTION_SCORE_KERNEL(
+        DT, 64, 64, 4, THREADS_PER_VALUE_64, 128, stream);
+  } else if (per_head_size == 128) {
+    constexpr int THREADS_PER_VALUE_128 = threads_per_value_t<DT, 128>::value;
+    LAUNCH_SPEC_INC_ATTENTION_SCORE_KERNEL(
+        DT, 128, 128, 4, THREADS_PER_VALUE_128, 128, stream);
+  } else {
+    assert(false && "a unsupported head size");
   }
 }
 
@@ -236,199 +487,208 @@ void compute_attention_kernel_prompt(SpecIncMultiHeadSelfAttentionMeta const *m,
   int q_block_size = m->qProjSize;
 
   int kt_block_size = m->kProjSize;
-  int kt_req_block_size =
-      kt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+  int kt_req_block_size = kt_block_size * m->num_q_heads *
+                          (BatchConfig::max_sequence_length() +
+                           BatchConfig::MAX_SPEC_TREE_TOKEN_NUM);
   int vt_block_size = m->vProjSize;
-  int vt_req_block_size =
-      vt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+  int vt_req_block_size = vt_block_size * m->num_q_heads *
+                          (BatchConfig::max_sequence_length() +
+                           BatchConfig::MAX_SPEC_TREE_TOKEN_NUM);
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
     if (bc->request_completed[i]) {
       continue;
     }
-    for (int sub_req_id = 0; sub_req_id < bc->sub_requests[i]; sub_req_id++) {
-      // int num_new_tokens = bc->num_processing_tokens[i];
-      // int total_tokens = bc->token_last_available_idx[i] + 1;
+    // else if (tokens_previous_requests < bc->num_generation_tokens) {
+    //   tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
+    //   continue;
+    // }
 
-      int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
-      int total_tokens = bc->requestsInfo[i].first_token_depth_in_request +
-                         bc->requestsInfo[i].num_tokens_in_batch;
+    // all requests in prompt phase should only have one sub requests;
+    assert(bc->sub_requests[i] == 1);
+    // int num_new_tokens = bc->num_processing_tokens[i];
+    // int total_tokens = bc->token_last_available_idx[i] + 1;
 
-      if (num_new_tokens <= 0) {
-        continue;
-      }
+    int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+    int total_tokens = bc->requestsInfo[i].first_token_depth_in_request +
+                       bc->requestsInfo[i].num_tokens_in_batch;
 
-      // Compute (QK^T/sqrt(d_k))
-      int m_ = num_new_tokens;
-      int n = total_tokens;
-      int k = m->qProjSize;
-      int lda = k * m->num_q_heads * QKV_WEIGHT_NUM, ldb = k * m->num_q_heads,
-          ldc = m_;
-      int strideA = q_block_size;
-      int strideB = kt_block_size;
-      int strideC = num_new_tokens * total_tokens;
-
-      // a flag of using this scaling alpha
-      DT alpha = 1.0f, beta = 0.0f;
-      if (*m->qk_prod_scaling) {
-        alpha = static_cast<DT>(1.0f / sqrt(m->kProjSize));
-      }
-      // To get A, skip over Q entries from previous requests (same head)
-      DT const *A = static_cast<DT *>(m->devQKVProjArray) +
-                    bc->requestsInfo[i].first_token_offset_in_batch *
-                        m->qProjSize * m->num_q_heads * QKV_WEIGHT_NUM;
-      // To get B, skip over K entries from previous requests (all heads +
-      // padding)
-      DT const *B = static_cast<DT *>(m->keyCache) +
-                    (i * bc->MAX_BEAM_WIDTH + sub_req_id) * kt_req_block_size;
-
-      // if (i == 0 && sub_req_id == 0 &&
-      //     bc->beam_slots.at(0).current_depth == 1) {
-      //   int offset = (float *)B - m->keyCache;
-      //   printf("key cache offset %d\n", kt_req_block_size);
-      // }
-      // To get C, skip over QK^T products from previous requests
-      DT *C = static_cast<DT *>(m->qk_prods) +
-              m->num_q_heads * tokens_prev_requests_squares;
-      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                           CUBLAS_OP_T,
-                                           CUBLAS_OP_N,
-                                           m_,
-                                           n,
-                                           k,
-                                           &alpha,
-                                           A,
-                                           cublas_data_type,
-                                           lda,
-                                           strideA,
-                                           B,
-                                           cublas_data_type,
-                                           ldb,
-                                           strideB,
-                                           &beta,
-                                           C,
-                                           cublas_data_type,
-                                           ldc,
-                                           strideC,
-                                           m->num_q_heads,
-                                           compute_type,
-                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-      // add alibi position bias to qk production
-      // add alibi position bias to qk production
-      if (*m->position_bias) {
-        size_t parallelism = m->num_q_heads * total_tokens * num_new_tokens;
-        apply_position_bias_qkprd<<<GET_BLOCKS(parallelism),
-                                    min((size_t)CUDA_NUM_THREADS, parallelism),
-                                    0,
-                                    stream>>>(C,
-                                              num_new_tokens,
-                                              total_tokens,
-                                              m->num_q_heads,
-                                              m->global_num_q_heads,
-                                              shard_id);
-      }
-      // Fill all elements above diagonal in qk prods with -inf to force
-      // causal attention.
-      assert(num_new_tokens <= total_tokens);
-      if (num_new_tokens > 1) {
-        size_t parallelism = m->num_q_heads * num_new_tokens * total_tokens;
-        spec_fill_entries_above_diagonal<<<GET_BLOCKS(parallelism),
-                                           min((size_t)CUDA_NUM_THREADS,
-                                               parallelism),
-                                           0,
-                                           stream>>>(
-            C,
-            num_new_tokens,
-            total_tokens,
-            m->num_q_heads,
-            static_cast<DT>(-INFINITY));
-      }
-      // Compute Softmax(QK^T/sqrt(d_k))
-      // Before modifying the parameters below, make sure to read the following
-      // description of the CUDNN_TENSOR_NCHW tensor layout, from
-      // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#cudnnTensorFormat_t:
-      // This tensor format specifies that the data is laid out in the following
-      // order: batch size, feature maps, rows, columns. The strides are
-      // implicitly defined in such a way that the data are contiguous in memory
-      // with no padding between images, feature maps, rows, and columns; the
-      // columns are the inner dimension and the images are the outermost
-      // dimension.
-      int n_param = m->num_q_heads;
-      int c_param = total_tokens;
-      int h_param = 1;
-      int w_param = num_new_tokens;
-      checkCUDNN(cudnnSetTensor4dDescriptor(m->qk_tensor,
-                                            CUDNN_TENSOR_NCHW,
-                                            cudnn_data_type,
-                                            n_param,
-                                            c_param,
-                                            h_param,
-                                            w_param));
-      float softmax_alpha = 1.0f, softmax_beta = 0.0f;
-      DT *C_softmax = static_cast<DT *>(m->qk_prods_softmax) +
-                      m->num_q_heads * tokens_prev_requests_squares;
-      // The softmax operation below is executed according to the
-      // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
-      // softmax operation is computed per spatial location (H,W) per image (N)
-      // across dimension C.
-      checkCUDNN(cudnnSoftmaxForward(m->handle.dnn,
-                                     CUDNN_SOFTMAX_ACCURATE,
-                                     CUDNN_SOFTMAX_MODE_CHANNEL,
-                                     &softmax_alpha,
-                                     m->qk_tensor,
-                                     C,
-                                     &softmax_beta,
-                                     m->qk_tensor,
-                                     C_softmax));
-      // Matmul softmax(QK^T/sqrt(d_k)) by V
-      alpha = 1.0f, beta = 0.0f;
-      m_ = m->vProjSize;
-      n = num_new_tokens;
-      k = total_tokens;
-      lda = m_ * m->num_q_heads, ldb = n, ldc = m_ * m->num_q_heads;
-      strideA = vt_block_size;
-      strideB = num_new_tokens * total_tokens;
-      strideC = m->vProjSize;
-      // To get A, skip over V^T entries from previous requests (all heads +
-      // padding)
-      A = static_cast<DT *>(m->valueCache) +
-          (i * bc->MAX_BEAM_WIDTH + sub_req_id) * vt_req_block_size;
-      // To get B, skip over softmax(QK^T/sqrt(d_k)) entries from previous
-      // requests (all heads)
-      B = C_softmax;
-      // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
-      // requests
-      C = static_cast<DT *>(m->attn_heads) +
-          (tokens_previous_requests + bc->num_generation_tokens) *
-              m->num_q_heads * m->vProjSize;
-      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
-                                           CUBLAS_OP_N,
-                                           CUBLAS_OP_T,
-                                           m_,
-                                           n,
-                                           k,
-                                           &alpha,
-                                           A,
-                                           cublas_data_type,
-                                           lda,
-                                           strideA,
-                                           B,
-                                           cublas_data_type,
-                                           ldb,
-                                           strideB,
-                                           &beta,
-                                           C,
-                                           cublas_data_type,
-                                           ldc,
-                                           strideC,
-                                           m->num_q_heads,
-                                           compute_type,
-                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
-
-      tokens_previous_requests += num_new_tokens;
-      tokens_prev_requests_squares += num_new_tokens * total_tokens;
+    if (num_new_tokens <= 0) {
+      continue;
+    }
+
+    // Compute (QK^T/sqrt(d_k))
+    int m_ = num_new_tokens;
+    int n = total_tokens;
+    int k = m->qProjSize;
+    int lda = k * m->num_q_heads * QKV_WEIGHT_NUM, ldb = k * m->num_q_heads,
+        ldc = m_;
+    int strideA = q_block_size;
+    int strideB = kt_block_size;
+    int strideC = num_new_tokens * total_tokens;
+
+    // a flag of using this scaling alpha
+    DT alpha = 1.0f, beta = 0.0f;
+    if (*m->qk_prod_scaling) {
+      alpha = static_cast<DT>(1.0f / sqrt(m->kProjSize));
+    }
+    // To get A, skip over Q entries from previous requests (same head)
+    DT const *A = static_cast<DT *>(m->devQKVProjArray) +
+                  bc->requestsInfo[i].first_token_offset_in_batch *
+                      m->qProjSize * m->num_q_heads * QKV_WEIGHT_NUM;
+    // To get B, skip over K entries from previous requests (all heads +
+    // padding)
+
+    // print_tensor<float>((float*)A, 32, "A");
+    DT const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
+
+    // if (i == 0 && sub_req_id == 0 &&
+    //     bc->beam_slots.at(0).current_depth == 1) {
+    //   int offset = (float *)B - m->keyCache;
+    //   printf("key cache offset %d\n", kt_req_block_size);
+    // }
+    // To get C, skip over QK^T products from previous requests
+    DT *C = static_cast<DT *>(m->qk_prods) +
+            m->num_q_heads * tokens_prev_requests_squares;
+    checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                         CUBLAS_OP_T,
+                                         CUBLAS_OP_N,
+                                         m_,
+                                         n,
+                                         k,
+                                         &alpha,
+                                         A,
+                                         cublas_data_type,
+                                         lda,
+                                         strideA,
+                                         B,
+                                         cublas_data_type,
+                                         ldb,
+                                         strideB,
+                                         &beta,
+                                         C,
+                                         cublas_data_type,
+                                         ldc,
+                                         strideC,
+                                         m->num_q_heads,
+                                         compute_type,
+                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+    // print_tensor<float>((float*)C, 32, "C");
+    // add alibi position bias to qk production
+    // add alibi position bias to qk production
+    if (*m->position_bias) {
+      size_t parallelism = m->num_q_heads * total_tokens * num_new_tokens;
+      apply_position_bias_qkprd<<<GET_BLOCKS(parallelism),
+                                  min((size_t)CUDA_NUM_THREADS, parallelism),
+                                  0,
+                                  stream>>>(C,
+                                            num_new_tokens,
+                                            total_tokens,
+                                            m->num_q_heads,
+                                            m->global_num_q_heads,
+                                            shard_id);
     }
+    // Fill all elements above diagonal in qk prods with -inf to force
+    // causal attention.
+    assert(num_new_tokens <= total_tokens);
+    if (num_new_tokens > 1) {
+      size_t parallelism = m->num_q_heads * num_new_tokens * total_tokens;
+      spec_fill_entries_above_diagonal<<<GET_BLOCKS(parallelism),
+                                         min((size_t)CUDA_NUM_THREADS,
+                                             parallelism),
+                                         0,
+                                         stream>>>(C,
+                                                   num_new_tokens,
+                                                   total_tokens,
+                                                   m->num_q_heads,
+                                                   static_cast<DT>(-INFINITY));
+    }
+    // Compute Softmax(QK^T/sqrt(d_k))
+    // Before modifying the parameters below, make sure to read the following
+    // description of the CUDNN_TENSOR_NCHW tensor layout, from
+    // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#cudnnTensorFormat_t:
+    // This tensor format specifies that the data is laid out in the following
+    // order: batch size, feature maps, rows, columns. The strides are
+    // implicitly defined in such a way that the data are contiguous in memory
+    // with no padding between images, feature maps, rows, and columns; the
+    // columns are the inner dimension and the images are the outermost
+    // dimension.
+    int n_param = m->num_q_heads;
+    int c_param = total_tokens;
+    int h_param = 1;
+    int w_param = num_new_tokens;
+    checkCUDNN(cudnnSetTensor4dDescriptor(m->qk_tensor,
+                                          CUDNN_TENSOR_NCHW,
+                                          cudnn_data_type,
+                                          n_param,
+                                          c_param,
+                                          h_param,
+                                          w_param));
+    float softmax_alpha = 1.0f, softmax_beta = 0.0f;
+    DT *C_softmax = static_cast<DT *>(m->qk_prods_softmax) +
+                    m->num_q_heads * tokens_prev_requests_squares;
+    // The softmax operation below is executed according to the
+    // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
+    // softmax operation is computed per spatial location (H,W) per image (N)
+    // across dimension C.
+    checkCUDNN(cudnnSoftmaxForward(m->handle.dnn,
+                                   CUDNN_SOFTMAX_ACCURATE,
+                                   CUDNN_SOFTMAX_MODE_CHANNEL,
+                                   &softmax_alpha,
+                                   m->qk_tensor,
+                                   C,
+                                   &softmax_beta,
+                                   m->qk_tensor,
+                                   C_softmax));
+    // Matmul softmax(QK^T/sqrt(d_k)) by V
+    alpha = 1.0f, beta = 0.0f;
+    m_ = m->vProjSize;
+    n = num_new_tokens;
+    k = total_tokens;
+    lda = m_ * m->num_q_heads, ldb = n, ldc = m_ * m->num_q_heads;
+    strideA = vt_block_size;
+    strideB = num_new_tokens * total_tokens;
+    strideC = m->vProjSize;
+    // To get A, skip over V^T entries from previous requests (all heads +
+    // padding)
+    A = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
+    // To get B, skip over softmax(QK^T/sqrt(d_k)) entries from previous
+    // requests (all heads)
+    B = C_softmax;
+    // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
+    // requests
+
+    // print_tensor<float>((float*)C_softmax, 32, "C_softmax");
+    C = static_cast<DT *>(m->attn_heads) +
+        (tokens_previous_requests + bc->num_generation_tokens) *
+            m->num_q_heads * m->vProjSize;
+    checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                         CUBLAS_OP_N,
+                                         CUBLAS_OP_T,
+                                         m_,
+                                         n,
+                                         k,
+                                         &alpha,
+                                         A,
+                                         cublas_data_type,
+                                         lda,
+                                         strideA,
+                                         B,
+                                         cublas_data_type,
+                                         ldb,
+                                         strideB,
+                                         &beta,
+                                         C,
+                                         cublas_data_type,
+                                         ldc,
+                                         strideC,
+                                         m->num_q_heads,
+                                         compute_type,
+                                         CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
+    tokens_previous_requests += num_new_tokens;
+    tokens_prev_requests_squares += num_new_tokens * total_tokens;
   }
 
   // assert(tokens_previous_requests == num_tokens);
@@ -443,31 +703,8 @@ void inference_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                       DT *output_ptr,
                       DT const *bias_ptr,
                       cudaStream_t stream) {
-  // here because we need postion info in infernece 1
-  cudaMemcpyAsync(m->token_infos,
-                  &(bc->tokensInfo),
-                  bc->num_active_tokens() * sizeof(BatchConfig::PerTokenInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
-  cudaMemcpyAsync(m->request_infos,
-                  &(bc->requestsInfo),
-                  bc->max_requests_per_batch() *
-                      sizeof(BatchConfig::PerRequestInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
-  cudaMemcpyAsync(m->beam_token_infos,
-                  &(bc->beamTokenInfo),
-                  bc->num_active_tokens() * bc->MAX_BEAM_WIDTH *
-                      sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
-  cudaMemcpyAsync(m->beam_request_infos,
-                  &(bc->beamRequestsInfo),
-                  bc->max_requests_per_batch() *
-                      sizeof(BeamSearchBatchConfig::BeamSearchPerRequestInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
   // phase 1: Implement kernel to compute KQV for input tokens
+
   compute_qkv_kernel(m,
                      bc,
                      shard_id,
@@ -479,7 +716,7 @@ void inference_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   // phase 2: Update key/val cache
   update_kv_cache_kernel<DT>(m, bc, stream);
   if (bc->num_generation_tokens > 0) {
-    compute_attention_kernel_generation<DT>(
+    compute_spec_inc_attention_kernel_generation<DT>(
         m, bc, static_cast<DT *>(m->attn_heads), stream);
   }
   // phase 3: Compute attention score
@@ -488,16 +725,14 @@ void inference_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
     compute_attention_kernel_prompt(
         m, bc, shard_id, output_ptr, bias_ptr, weight_ptr, stream);
   }
-
   // compute output production and bias together for all tokens
-  int num_tokens =
-      bc->num_active_tokens() * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+  int num_tokens = bc->num_active_tokens();
 
   compute_o_prod_bias(
       m, bc, shard_id, output_ptr, weight_ptr, bias_ptr, num_tokens, stream);
 }
 
-} // namespace SpecIncMultiHeadAttention
+} // namespace SpecIncMultiHeadSelfAttention
 } // namespace Kernels
 
 /*static*/
@@ -529,25 +764,27 @@ void SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
   if (input.data_type == DT_HALF) {
     half const *bias_ptr =
         use_bias ? bias.get_half_ptr() : static_cast<half const *>(nullptr);
-    Kernels::SpecIncMultiHeadAttention::inference_kernel(m,
-                                                         bc,
-                                                         shard_id,
-                                                         input.get_half_ptr(),
-                                                         weight.get_half_ptr(),
-                                                         output.get_half_ptr(),
-                                                         bias_ptr,
-                                                         stream);
+    Kernels::SpecIncMultiHeadSelfAttention::inference_kernel(
+        m,
+        bc,
+        shard_id,
+        input.get_half_ptr(),
+        weight.get_half_ptr(),
+        output.get_half_ptr(),
+        bias_ptr,
+        stream);
   } else if (input.data_type == DT_FLOAT) {
     float const *bias_ptr =
         use_bias ? bias.get_float_ptr() : static_cast<float const *>(nullptr);
-    Kernels::SpecIncMultiHeadAttention::inference_kernel(m,
-                                                         bc,
-                                                         shard_id,
-                                                         input.get_float_ptr(),
-                                                         weight.get_float_ptr(),
-                                                         output.get_float_ptr(),
-                                                         bias_ptr,
-                                                         stream);
+    Kernels::SpecIncMultiHeadSelfAttention::inference_kernel(
+        m,
+        bc,
+        shard_id,
+        input.get_float_ptr(),
+        weight.get_float_ptr(),
+        output.get_float_ptr(),
+        bias_ptr,
+        stream);
   } else {
     assert(false && "Unspported data type");
   }
@@ -606,38 +843,23 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
 
   // allocate memory for the seqArray and reserve space
   {
-    int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
-    size_t beam_tokeninfo_size =
-        max_tokens_per_batch * BeamSearchBatchConfig::MAX_BEAM_WIDTH;
-    size_t requestinfo_size = BeamSearchBatchConfig::max_requests_per_batch();
-    size_t beam_requestinfo_size =
-        BeamSearchBatchConfig::max_requests_per_batch();
-    size_t total_size =
-        beam_tokeninfo_size *
-            sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo) +
-        beam_requestinfo_size *
-            sizeof(BeamSearchBatchConfig::
-                       BeamSearchPerRequestInfo); // more components will
-                                                  // be added here later
-
-    // We always directly allocate memory for small speculative models
-    gpu_mem_allocator.create_legion_instance(beam_search_reserve_inst,
-                                             total_size);
     beam_token_infos =
-        gpu_mem_allocator
-            .allocate_instance<BeamSearchBatchConfig::BeamSearchPerTokenInfo>(
-                beam_tokeninfo_size);
-    // offset += beam_tokeninfo_size *
-    //           sizeof(BeamSearchBatchConfig::BeamSearchPerTokenInfo);
+        reinterpret_cast<BeamSearchBatchConfig::BeamSearchPerTokenInfo *>(
+            reinterpret_cast<char *>(handler.batch_config_metadata) +
+            sizeof(BatchConfig::tokensInfo) +
+            sizeof(BatchConfig::requestsInfo));
+
     beam_request_infos =
-        gpu_mem_allocator
-            .allocate_instance<BeamSearchBatchConfig::BeamSearchPerRequestInfo>(
-                beam_requestinfo_size);
-    // offset += beam_requestinfo_size *
-    //           sizeof(BeamSearchBatchConfig::BeamSearchPerRequestInfo);
-    // assert(offset == total_size);
-    assert(gpu_mem_allocator.instance_total_size ==
-           gpu_mem_allocator.instance_allocated_size);
+        reinterpret_cast<BeamSearchBatchConfig::BeamSearchPerRequestInfo *>(
+            reinterpret_cast<char *>(handler.batch_config_metadata) +
+            sizeof(BatchConfig::tokensInfo) +
+            sizeof(BatchConfig::requestsInfo) +
+            sizeof(BeamSearchBatchConfig::beamTokenInfo));
+    causalMask = reinterpret_cast<BatchConfig::BitMask *>(
+        reinterpret_cast<char *>(handler.batch_config_metadata) +
+        sizeof(BatchConfig::tokensInfo) + sizeof(BatchConfig::requestsInfo) +
+        sizeof(BeamSearchBatchConfig::beamTokenInfo) +
+        sizeof(BeamSearchBatchConfig::beamRequestsInfo));
   }
 
   cudaStreamSynchronize(stream);
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index bc7d1017b7..b4af80976f 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -53,6 +53,7 @@ __global__ void compute_attention_kernel_fused_kernel(
     BatchConfig::PerRequestInfo *request_infos,
     int num_heads,
     int num_requests,
+    BatchConfig::BitMask *causalMask,
     int qk_smem_sz) {
 
   // q, k
@@ -75,17 +76,28 @@ __global__ void compute_attention_kernel_fused_kernel(
   // request idx
   int const request_idx = blockIdx.y;
 
+  int const batch_config_request_id =
+      request_infos[request_idx].batch_config_request_id;
+
   int const first_step = 0;
 
-  int const tlength = request_infos[request_idx].first_token_depth_in_request +
-                      request_infos[request_idx].num_tokens_in_batch;
-  int const qlength = request_infos[request_idx].num_tokens_in_batch;
+  int const tlength =
+      request_infos[batch_config_request_id].first_token_depth_in_request +
+      request_infos[batch_config_request_id].num_tokens_in_batch;
+  int const qlength =
+      request_infos[batch_config_request_id].num_tokens_in_batch;
+
+  BatchConfig::BitMask bitmask = causalMask[batch_config_request_id];
 
   int first_token_idx = 0;
   for (int r = 0; r < request_idx; r++) {
-    first_token_idx += request_infos[request_idx].num_tokens_in_batch;
+    first_token_idx += request_infos[r].num_tokens_in_batch;
   }
 
+  // if(tidx == 0 && head_idx == 0){
+  //   printf("tree req: %d, %d\n", request_idx, first_token_idx);
+  // }
+
   // shared memory objects
   extern __shared__ char smem_[];
 
@@ -115,7 +127,7 @@ __global__ void compute_attention_kernel_fused_kernel(
   constexpr int K_PER_WARP = WARP_SIZE / THREADS_PER_KEY;
 
   DT const *k_cache_batch =
-      key_cache + request_idx * max_seq_length * hidden_size + ki;
+      key_cache + batch_config_request_id * max_seq_length * hidden_size + ki;
 
   int ti_end =
       div_up(tlength - first_step, K_PER_WARP) * K_PER_WARP + first_step;
@@ -126,11 +138,19 @@ __global__ void compute_attention_kernel_fused_kernel(
       q_vecs[ki_o][ii] = *reinterpret_cast<Q_vec const *>(
           q_ptr + (hidden_size * QKV_WEIGHT_NUM * qi) + ki +
           ii * THREADS_PER_KEY * K_VEC_SIZE);
+
+      // if (head_idx == 0 && qi == 1 && tidx == 0) {
+      //     printf("laod q %d,  %d %.10f\n",
+      //     request_idx,
+      //            qi,q_vecs[ki_o][ii].x);
+      //   }
     }
+
     __syncthreads();
     for (int ti = ko; ti < ti_end; ti += K_PER_ITER) {
       K_vec k[K_VECS_PER_THREAD];
       int const ti_circ = ti % max_seq_length;
+
       for (int ii = 0; ii < K_VECS_PER_THREAD; ++ii) {
         int jj = ii * THREADS_PER_KEY * K_VEC_SIZE;
         if (ti < tlength) {
@@ -142,22 +162,28 @@ __global__ void compute_attention_kernel_fused_kernel(
       float qk = scale * Qk_dot<DT, THREADS_PER_KEY>::dot(q_vecs[ki_o], k);
 
       if (ti < tlength && tidx % THREADS_PER_KEY == 0) {
-        bool const mask = ti_circ >= tlength;
-        if (mask) {
-          assert(false);
-        }
+        bool const mask =
+            (ti >= bitmask.non_tree_cache_size &&
+             (!(bitmask.mask[ti - bitmask.non_tree_cache_size] & (1 << qi))));
 
-        int pos = ti * qlength + qi;
-        if (((pos / qlength) % tlength) > (pos % qlength + tlength - qlength)) {
-          qk = -FLT_MAX;
-        }
         qk_max = mask ? qk_max : fmaxf(qk_max, qk);
 
-        qk_smem[pos] = mask ? 0.f : qk;
+        // if (head_idx == 0 && qi == 0 && !mask) {
+        //   printf("tree attn qkqkqkqk request id %d,  %d %.10f, %.10f, %.10f\n
+        //   ",
+        //          request_idx,
+        //          ti,
+        //          qk,
+        //          q_vecs[ki_o][0].x,
+        //          k[0].x);
+        // }
+        qk_smem[ti - first_step] = mask ? 0.0f : qk;
       }
     }
+
     __syncthreads();
 
+#pragma unroll
     for (int mask = WARP_SIZE / 2; mask >= THREADS_PER_KEY; mask /= 2) {
       qk_max = fmaxf(qk_max, __shfl_xor_sync(uint32_t(-1), qk_max, mask));
     }
@@ -176,7 +202,7 @@ __global__ void compute_attention_kernel_fused_kernel(
 
     // The warps finalize the reduction.
     qk_max = lane < WARPS_PER_BLOCK ? red_smem[lane] : -FLT_MAX;
-
+#pragma unroll
     for (int mask = WARPS_PER_BLOCK / 2; mask >= 1; mask /= 2) {
       qk_max = fmaxf(qk_max, __shfl_xor_sync(uint32_t(-1), qk_max, mask));
     }
@@ -184,12 +210,18 @@ __global__ void compute_attention_kernel_fused_kernel(
     // Broadcast to all the threads in the warp.
     qk_max = __shfl_sync(uint32_t(-1), qk_max, 0);
 
-    float exp_sum = 0.f;
+    // if (head_idx == 0 && qi == 9 && tidx == 0) {
+    //   printf("tree attn first token qk_max %f\n", qk_max);
+    // }
 
+    float exp_sum = 0.f;
     for (int ti = first_step + tidx; ti < tlength; ti += THREADS_PER_BLOCK) {
-      float logit = __expf(qk_smem[ti * qlength + qi] - qk_max);
+      bool const mask =
+          (ti >= bitmask.non_tree_cache_size &&
+           (!(bitmask.mask[ti - bitmask.non_tree_cache_size] & (1 << qi))));
+      float logit = mask ? 0.0f : __expf(qk_smem[ti - first_step] - qk_max);
       exp_sum += logit;
-      qk_smem[ti * qlength + qi] = logit;
+      qk_smem[ti - first_step] = mask ? 0.0f : logit;
     }
 
     // Compute the sum.
@@ -197,43 +229,51 @@ __global__ void compute_attention_kernel_fused_kernel(
 
     // softmax
     float inv_sum = __fdividef(1.f, exp_sum + 1.e-6);
-
     for (int ti = first_step + tidx; ti < tlength; ti += THREADS_PER_BLOCK) {
-      qk_smem[ti * qlength + qi] *= inv_sum;
+      qk_smem[ti - first_step] *= inv_sum;
     }
 
     __syncthreads();
-  }
 
-  // value projection
-  constexpr int V_VEC_SIZE = 16 / sizeof(DT);
-  // The value computed by this thread.
-  int vo = tidx / THREADS_PER_VALUE;
-  // The hidden dimensions computed by this particular thread.
-  int vi = tidx % THREADS_PER_VALUE * V_VEC_SIZE;
-  constexpr int V_PER_ITER = THREADS_PER_BLOCK / THREADS_PER_VALUE;
+    // value projection
+    constexpr int V_VEC_SIZE = 16 / sizeof(DT);
+    // A vector of V elements for the current timestep.
+    // using V_vec_k = typename V_vec_k_<DT, V_VEC_SIZE>::Type;
+    // using V_vec_acum = typename V_vec_acum_fp32_<V_vec_k>::Type;
 
-  Out_sum out;
-  // The base pointer for the value in the cache buffer.
-  DT const *v_cache_batch =
-      value_cache + request_idx * max_seq_length * hidden_size + vi;
+    // The value computed by this thread.
+    int vo = tidx / THREADS_PER_VALUE;
+    // The hidden dimensions computed by this particular thread.
+    int vi = tidx % THREADS_PER_VALUE * V_VEC_SIZE;
+    constexpr int V_PER_ITER = THREADS_PER_BLOCK / THREADS_PER_VALUE;
 
-  for (int qi = 0; qi < qlength; qi++) {
+    Out_sum out;
     zero(out);
-    __syncthreads();
+
+    // The base pointer for the value in the cache buffer.
+    DT const *v_cache_batch =
+        value_cache + batch_config_request_id * max_seq_length * hidden_size +
+        vi;
+
     if (Dh == Dh_MAX || vi < Dh) {
       for (int ti = first_step + vo; ti < tlength; ti += V_PER_ITER) {
         // Load the values from the cache.
         int const ti_circ = ti % max_seq_length;
-
+        // int const real_cache_idx = topology.real_token_pos[sub_req_idx][ti];
         V_vec v = *reinterpret_cast<V_vec const *>(
             v_cache_batch + ti_circ * hidden_size + head_idx * per_head_size);
-        float logit = qk_smem[ti * qlength + qi];
-        out = FlexFlow::fma(logit, cast_to_float(v), out);
+
+        if (ti < tlength) {
+          bool const mask =
+              (ti >= bitmask.non_tree_cache_size &&
+               (!(bitmask.mask[ti - bitmask.non_tree_cache_size] & (1 << qi))));
+          float logit = mask ? 0.0f : qk_smem[ti - first_step];
+          out = FlexFlow::fma(logit, cast_to_float(v), out);
+        }
       }
     }
 
-    // Make sure we can start writing to shared memory.
+    //   // Make sure we can start writing to shared memory.
     __syncthreads();
 
     // Run the final reduction amongst the different groups computing different
@@ -268,6 +308,17 @@ __global__ void compute_attention_kernel_fused_kernel(
                              output_ptr + (first_token_idx + qi) * hidden_size +
                              head_idx * per_head_size + vi),
                          out);
+      // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && qi == 1) {
+      //   printf("tree attn final value, %.9f, %.9f, %.9f, %.9f, %d, %d\n",
+      //          out.x,
+      //          out.y,
+      //          out.z,
+      //          out.w,
+      //          vi,
+      //          (first_token_idx + qi) * hidden_size + head_idx *
+      //          per_head_size +
+      //              vi);
+      // }
     }
   }
 }
@@ -286,9 +337,9 @@ __global__ void commit_tokens_kernel(
     int max_seq_len,
     int hidden_size) {
 
-  CUDA_KERNEL_LOOP(i, num_tokens_to_commit * hidden_size * 2) {
+  CUDA_KERNEL_LOOP(i, num_tokens_to_commit * hidden_size) {
 
-    int token_pos = i / (hidden_size * KV_WEIGHT_NUM);
+    int token_pos = i / (hidden_size);
     int token_idx_in_last_batch = committedTokenInfos[token_pos].token_index;
     int offset = i % hidden_size;
     assert(token_idx_in_last_batch < num_active_tokens_in_last_batch);
@@ -329,7 +380,8 @@ void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
         m->vProjSize,
         num_tokens_to_commit,
         m->num_active_tokens, // number of active tokens in previous batch
-        BatchConfig::max_sequence_length(),
+        BatchConfig::max_sequence_length() +
+            BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,
         m->hidden_size);
   }
 }
@@ -348,9 +400,9 @@ __global__ void update_tree_branch_kv_cache(
     int total_tokens_in_batch,
     int max_seq_len,
     int hidden_size) {
-  CUDA_KERNEL_LOOP(i, num_tokens_in_branch * hidden_size * 2) {
+  CUDA_KERNEL_LOOP(i, num_tokens_in_branch * hidden_size) {
 
-    int token_idx = i / (hidden_size * KV_WEIGHT_NUM);
+    int token_idx = i / (hidden_size);
     int offset = i % hidden_size;
 
     token_idx += processed_tokens_in_batch; // get index in the whole batch
@@ -375,6 +427,7 @@ __global__ void update_tree_branch_kv_cache_fused(
     DT *kCache_ptr,
     DT *vCache_ptr,
     TreeVerifyBatchConfig::PerTokenInfo const *tokenInfos,
+    BatchConfig::PerRequestInfo *request_infos,
     int qProjSize,
     int kProjSize,
     int vProjSize,
@@ -392,10 +445,25 @@ __global__ void update_tree_branch_kv_cache_fused(
     DT vVal = devQKVProjArray[val_idx + hidden_size];
 
     int const req_id = tokenInfos[token_idx].request_index;
-    int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
-    kCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
+    // int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
+
+    int const request_token_offset =
+        request_infos[req_id].first_token_offset_in_batch;
+    int const first_token_depth =
+        request_infos[req_id].first_token_depth_in_request;
+
+    // if(i % hidden_size == 0){
+    //   printf("update token request id: %d, %d, %d  real id %d, value%.10f\n",
+    //   req_id, token_idx, request_token_offset,(token_idx + first_token_depth
+    //   - request_token_offset), kVal);
+    // }
+    kCache_ptr[req_id * (hidden_size * max_seq_len) +
+               (token_idx + first_token_depth - request_token_offset) *
+                   hidden_size +
                offset] = kVal;
-    vCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
+    vCache_ptr[req_id * (hidden_size * max_seq_len) +
+               (token_idx + first_token_depth - request_token_offset) *
+                   hidden_size +
                offset] = vVal;
   }
 }
@@ -448,10 +516,12 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
   int q_block_size = m->qProjSize;
   int kt_block_size = m->kProjSize;
   int kt_req_block_size =
-      kt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+      kt_block_size * m->num_q_heads * BatchConfig::max_sequence_length() +
+      BatchConfig::MAX_SPEC_TREE_TOKEN_NUM;
   int vt_block_size = m->vProjSize;
   int vt_req_block_size =
-      vt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+      vt_block_size * m->num_q_heads * BatchConfig::max_sequence_length() +
+      BatchConfig::MAX_SPEC_TREE_TOKEN_NUM;
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
@@ -472,9 +542,6 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
         num_new_tokens++;
       }
 
-      std::cout << "num_new_tokens: " << num_new_tokens << "\n";
-      assert(false);
-
       int total_tokens_in_request = bc->tokensInfo[j].abs_depth_in_request + 1;
       assert(num_new_tokens >= 1 && total_tokens_in_request >= num_new_tokens);
       {
@@ -716,7 +783,8 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
 #define LAUNCH_TREE_VERIFY_ATTENTION_SCORE_KERNEL(                             \
     DT, Dh, Dh_MAX, THDS_PER_KEY, THDS_PER_VALUE, THDS_PER_BLOCK, stream)      \
   smem_size_in_bytes_tree<DT>(m->qProjSize,                                    \
-                              BatchConfig::max_sequence_length(),              \
+                              BatchConfig::max_sequence_length() +             \
+                                  BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,        \
                               THDS_PER_VALUE,                                  \
                               THDS_PER_BLOCK,                                  \
                               bc,                                              \
@@ -733,17 +801,19 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
           static_cast<DT *>(m->valueCache),                                    \
           output_ptr,                                                          \
           scale,                                                               \
-          BatchConfig::max_sequence_length(),                                  \
+          BatchConfig::max_sequence_length() +                                 \
+              BatchConfig::BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,               \
           BatchConfig::max_tokens_per_batch(),                                 \
           m->qProjSize,                                                        \
           m->hidden_size,                                                      \
           m->request_infos,                                                    \
           m->num_q_heads,                                                      \
           bc->num_active_requests(),                                           \
+          m->causalMask,                                                       \
           smem_sz[0])
 
 template <typename DT>
-void compute_attention_kernel_fused(IncMultiHeadSelfAttentionMeta const *m,
+void compute_attention_kernel_fused(TreeIncMultiHeadSelfAttentionMeta const *m,
                                     TreeVerifyBatchConfig const *bc,
                                     DT *output_ptr,
                                     cudaStream_t stream) {
@@ -760,11 +830,12 @@ void compute_attention_kernel_fused(IncMultiHeadSelfAttentionMeta const *m,
       static_cast<DT *>(m->keyCache),
       static_cast<DT *>(m->valueCache),
       m->token_infos,
+      m->request_infos,
       m->qProjSize,
       m->kProjSize,
       m->vProjSize,
       num_new_tokens,
-      BatchConfig::max_sequence_length(),
+      BatchConfig::max_sequence_length() + BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,
       m->hidden_size);
 
   dim3 grid(m->num_q_heads, bc->num_active_requests());
@@ -816,12 +887,20 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
   // Note that m->num_active_tokens stores the number of active
   // tokens in the previous batch, which is needed for committing
   // keys/values to the key-value cache
+  // std::cout << "tokens to be committed: " << bc->num_tokens_to_commit <<
+  // "\n";
+
   cudaMemcpyAsync(m->committed_token_infos,
                   &(bc->committed_tokens),
                   bc->num_tokens_to_commit *
                       sizeof(TreeVerifyBatchConfig::CommittedTokensInfo),
                   cudaMemcpyHostToDevice,
                   stream);
+  cudaMemcpyAsync(m->causalMask,
+                  &(bc->causalMask),
+                  bc->num_active_requests() * sizeof(BatchConfig::BitMask),
+                  cudaMemcpyHostToDevice,
+                  stream);
   commit_tokens<DT>(m, bc, stream);
 
   // After commit we update m->num_active_tokens to be the number of active
@@ -834,18 +913,6 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
         m->bias_ptr, bias_ptr, m->biasSize, cudaMemcpyHostToDevice, stream);
     bias_ptr = static_cast<DT *>(m->bias_ptr);
   }
-  cudaMemcpyAsync(m->token_infos,
-                  &(bc->tokensInfo),
-                  bc->num_active_tokens() *
-                      sizeof(TreeVerifyBatchConfig::PerTokenInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
-  cudaMemcpyAsync(m->request_infos,
-                  &(bc->requestsInfo),
-                  bc->max_requests_per_batch() *
-                      sizeof(BatchConfig::PerRequestInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
   // phase 1: Implement kernel to compute KQV for input tokens
   compute_qkv_kernel(m,
                      bc,
@@ -991,27 +1058,16 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
 
   // allocate memory for the seqArray and reserve space
   {
-    int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
-    size_t committed_tokeninfo_size = max_tokens_per_batch;
-    size_t total_size = committed_tokeninfo_size *
-                        sizeof(TreeVerifyBatchConfig::CommittedTokensInfo);
-    if (offload) {
-      // assert that we have enough reserved work space left
-      assert(gpu_mem_allocator.reserved_total_size -
-                 gpu_mem_allocator.reserved_allocated_size >=
-             total_size);
-      committed_token_infos =
-          gpu_mem_allocator
-              .allocate_reserved<TreeVerifyBatchConfig::CommittedTokensInfo>(
-                  committed_tokeninfo_size);
-    } else {
-      gpu_mem_allocator.create_legion_instance(committed_token_reserve_inst,
-                                               total_size);
-      committed_token_infos =
-          gpu_mem_allocator
-              .allocate_instance<TreeVerifyBatchConfig::CommittedTokensInfo>(
-                  committed_tokeninfo_size);
-    }
+
+    causalMask = reinterpret_cast<BatchConfig::BitMask *>(
+        reinterpret_cast<char *>(handler.batch_config_metadata) +
+        sizeof(BatchConfig::tokensInfo) + sizeof(BatchConfig::requestsInfo));
+    committed_token_infos =
+        reinterpret_cast<TreeVerifyBatchConfig::CommittedTokensInfo *>(
+            reinterpret_cast<char *>(handler.batch_config_metadata) +
+            sizeof(BatchConfig::tokensInfo) +
+            sizeof(BatchConfig::requestsInfo) +
+            sizeof(BatchConfig::causalMask));
   }
 
   cudaStreamSynchronize(stream);
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index eb045e8159..8af0ed8978 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -318,7 +318,8 @@ FutureMap InferenceManager::inference(FFModel *model,
         found_input_operator = true;
         assert(op->numOutputs == 1);
         ParallelTensor pt = tensor_buffer[op->outputs[0]][batch_index];
-        load_input_tokens_from_batch_config(bc, pt);
+        load_input_tokens_from_batch_config(bc, pt, model->handlers);
+        load_inference_metadata_batch_config(bc, model->handlers);
       }
     }
 
@@ -348,11 +349,34 @@ FutureMap InferenceManager::inference(FFModel *model,
 };
 
 void InferenceManager::load_input_tokens_from_batch_config(
-    BatchConfigFuture const &bc, ParallelTensor const input) {
+    BatchConfigFuture const &bc,
+    ParallelTensor const input,
+    FFHandler *handlers) {
   Context ctx = ff_config.lg_ctx;
   Runtime *runtime = ff_config.lg_hlr;
   size_t machine_view_hash = input->machine_view.hash();
   ArgumentMap argmap;
+  Domain domain = runtime->get_index_space_domain(ctx, input->parallel_is);
+
+  switch (domain.get_dim()) {
+#define DIMFUNC(DIM)                                                           \
+  case DIM: {                                                                  \
+    Rect<DIM> rect = domain;                                                   \
+    MachineView view = input->machine_view;                                    \
+    int idx = 0;                                                               \
+    for (PointInRectIterator<DIM> it(rect); it(); it++) {                      \
+      argmap.set_point(*it,                                                    \
+                       TaskArgument(&handlers[view.get_device_id(*it)],        \
+                                    sizeof(FFHandler)));                       \
+    }                                                                          \
+    break;                                                                     \
+  }
+    LEGION_FOREACH_N(DIMFUNC)
+#undef DIMFUNC
+    default:
+      assert(false);
+  }
+
   IndexLauncher launcher(RM_LOAD_TOKENS_TASK_ID,
                          input->parallel_is,
                          TaskArgument(nullptr, 0),
@@ -368,6 +392,34 @@ void InferenceManager::load_input_tokens_from_batch_config(
   runtime->execute_index_space(ctx, launcher);
 }
 
+void InferenceManager::load_inference_metadata_batch_config(
+    BatchConfigFuture const &bc, FFHandler *handlers) {
+  Context ctx = ff_config.lg_ctx;
+  Runtime *runtime = ff_config.lg_hlr;
+  ArgumentMap argmap;
+
+  Domain domain =
+      runtime->get_index_space_domain(ctx, ff_config.all_gpu_task_is);
+  Rect<1> task_rect = domain;
+
+  int idx = 0;
+  for (PointInRectIterator<1> it(task_rect); it(); it++) {
+    FFHandler handler = handlers[idx++];
+    argmap.set_point(*it, TaskArgument(&handler, sizeof(FFHandler)));
+  }
+
+  IndexLauncher launcher(RM_LOAD_BATCH_CONFIG_TASK_ID,
+                         ff_config.all_gpu_task_is,
+                         TaskArgument(nullptr, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         FFConfig::DataParallelism_GPU);
+  launcher.add_future(bc);
+  runtime->execute_index_space(ctx, launcher);
+}
+
 void InferenceManager::load_positions(BatchConfigFuture const &bc,
                                       ParallelTensor position_input,
                                       int offset) {
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 92f0cff472..37605c44a4 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -1499,10 +1499,8 @@ FFRuntime::FFRuntime(FFConfig &config) {
   Context ctx = config.lg_ctx;
 
   ArgumentMap argmap;
-  Rect<1> task_rect(Point<1>(0),
-                    Point<1>(config.workersPerNode * config.numNodes - 1));
-  IndexSpaceT<1> task_is = runtime->create_index_space(ctx, task_rect);
-
+  Domain domain = runtime->get_index_space_domain(ctx, config.all_gpu_task_is);
+  Rect<1> task_rect = domain;
   // int rank = 0;
   for (PointInRectIterator<1> it(task_rect); it(); it++) {
     FFInitInfo info;
@@ -1518,7 +1516,7 @@ FFRuntime::FFRuntime(FFConfig &config) {
 
   // Init CUDA library on each worker
   IndexLauncher initLauncher(FF_INIT_TASK_ID,
-                             task_is,
+                             config.all_gpu_task_is,
                              TaskArgument(NULL, 0),
                              argmap,
                              Predicate::TRUE_PRED,
@@ -2993,6 +2991,12 @@ Op *FFModel::create_operator_from_layer(
       dims[num_dims].degree = 1;
       dims[num_dims].parallel_idx = -1;
       dims[num_dims].is_replica_dim = true;
+      if (config.computationMode == COMP_MODE_INFERENCE &&
+          config.tensor_parallelism_degree > 1) {
+        dims[num_dims].size *= config.tensor_parallelism_degree;
+        dims[num_dims].degree *= config.tensor_parallelism_degree;
+        dims[num_dims].parallel_idx = 0;
+      }
       // create_parallel_tensor adds an NoOp into operators
       ParallelTensor pt =
           create_parallel_tensor_legion_ordering(num_dims + 1,
@@ -3002,6 +3006,7 @@ Op *FFModel::create_operator_from_layer(
                                                  0,
                                                  true /*gradients*/,
                                                  tensor->tensor_guid);
+      assert(pt->get_shape().is_valid());
       // assert that this tensor hasn't been mapped before
       assert(tensor->parallel_tensor == nullptr);
       tensor->parallel_tensor = pt;
@@ -3260,12 +3265,12 @@ void FFModel::create_operators_from_layers() {
     if (config.computationMode == COMP_MODE_INFERENCE &&
         config.tensor_parallelism_degree > 1 && l->op_type == OP_EMBEDDING) {
       assert(op->numOutputs == 1);
-      Replicate *repl = new Replicate(*this,
-                                      op->outputs[0],
-                                      op->outputs[0]->num_dims - 1,
-                                      config.tensor_parallelism_degree);
-      operators.push_back(repl);
-      op = repl;
+      // Replicate *repl = new Replicate(*this,
+      //                                 op->outputs[0],
+      //                                 op->outputs[0]->num_dims - 1,
+      //                                 config.tensor_parallelism_degree);
+      // operators.push_back(repl);
+      // op = repl;
     } else if (config.computationMode == COMP_MODE_INFERENCE &&
                config.tensor_parallelism_degree > 1 &&
                (l->op_type == OP_INC_MULTIHEAD_SELF_ATTENTION ||
@@ -4076,6 +4081,10 @@ FFConfig::FFConfig() {
   Runtime *runtime = Runtime::get_runtime();
   lg_hlr = runtime;
   lg_ctx = Runtime::get_context();
+  Rect<1> task_rect(Point<1>(0), Point<1>(workersPerNode * numNodes - 1));
+  // Create an index space for tasks running on all GPUs
+  all_gpu_task_is = runtime->create_index_space(lg_ctx, task_rect);
+
   // field_space = runtime->create_field_space(lg_ctx);
 }
 
@@ -4337,6 +4346,23 @@ void register_flexflow_internal_tasks(Runtime *runtime,
           registrar);
     }
   }
+  // RequestManager load metadata
+  {
+    TaskVariantRegistrar registrar(RM_LOAD_BATCH_CONFIG_TASK_ID,
+                                   "RequestManager Load meta data");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<RequestManager::load_batch_config_task>(
+          registrar, "RequestManager Load metadata Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<RequestManager::load_batch_config_task>(
+          registrar);
+    }
+  }
   // RequestManager prepare_next_batch
   {
     TaskVariantRegistrar registrar(RM_PREPARE_NEXT_BATCH_TASK_ID,
diff --git a/src/runtime/model.cpp b/src/runtime/model.cpp
index 6c482426eb..ad2b781567 100644
--- a/src/runtime/model.cpp
+++ b/src/runtime/model.cpp
@@ -131,6 +131,54 @@ FFHandler
         .wait();
     handle.workSpace = workspaceInst.pointer_untyped(0, sizeof(char));
   }
+  if (handle.offload_reserve_space_size > 0) {
+    // allocate memory for offload reserve space
+    Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                         .only_kind(Memory::GPU_FB_MEM)
+                         .best_affinity_to(task->target_proc)
+                         .first();
+    Realm::Rect<1, coord_t> bounds(
+        Realm::Point<1, coord_t>(0),
+        Realm::Point<1, coord_t>(handle.offload_reserve_space_size - 1));
+    std::vector<size_t> field_sizes;
+    field_sizes.push_back(sizeof(char));
+    Realm::RegionInstance workspaceInst;
+    Realm::RegionInstance::create_instance(workspaceInst,
+                                           gpu_mem,
+                                           bounds,
+                                           field_sizes,
+                                           0,
+                                           Realm::ProfilingRequestSet())
+        .wait();
+    handle.offload_reserve_space =
+        workspaceInst.pointer_untyped(0, sizeof(char));
+  } else {
+    handle.offload_reserve_space = nullptr;
+  }
+  if (handle.batch_config_metadata_size > 0) {
+    // allocate memory for offload reserve space
+    Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                         .only_kind(Memory::GPU_FB_MEM)
+                         .best_affinity_to(task->target_proc)
+                         .first();
+    Realm::Rect<1, coord_t> bounds(
+        Realm::Point<1, coord_t>(0),
+        Realm::Point<1, coord_t>(handle.batch_config_metadata_size - 1));
+    std::vector<size_t> field_sizes;
+    field_sizes.push_back(sizeof(char));
+    Realm::RegionInstance workspaceInst;
+    Realm::RegionInstance::create_instance(workspaceInst,
+                                           gpu_mem,
+                                           bounds,
+                                           field_sizes,
+                                           0,
+                                           Realm::ProfilingRequestSet())
+        .wait();
+    handle.batch_config_metadata =
+        workspaceInst.pointer_untyped(0, sizeof(char));
+  } else {
+    handle.batch_config_metadata = nullptr;
+  }
   // checkCUDA(hipMalloc(&handle.workSpace, handle.workSpaceSize));
 #ifdef FF_USE_NCCL
   handle.ncclComm = NULL;
diff --git a/src/runtime/model.cu b/src/runtime/model.cu
index 17401a0f14..c885b29db2 100644
--- a/src/runtime/model.cu
+++ b/src/runtime/model.cu
@@ -151,6 +151,31 @@ FFHandler
   } else {
     handle.offload_reserve_space = nullptr;
   }
+  if (handle.batch_config_metadata_size > 0) {
+    // allocate memory for offload reserve space
+    Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                         .only_kind(Memory::GPU_FB_MEM)
+                         .best_affinity_to(task->target_proc)
+                         .first();
+    Realm::Rect<1, coord_t> bounds(
+        Realm::Point<1, coord_t>(0),
+        Realm::Point<1, coord_t>(handle.batch_config_metadata_size - 1));
+    std::vector<size_t> field_sizes;
+    field_sizes.push_back(sizeof(char));
+    Realm::RegionInstance workspaceInst;
+    Realm::RegionInstance::create_instance(workspaceInst,
+                                           gpu_mem,
+                                           bounds,
+                                           field_sizes,
+                                           0,
+                                           Realm::ProfilingRequestSet())
+        .wait();
+    handle.batch_config_metadata =
+        workspaceInst.pointer_untyped(0, sizeof(char));
+  } else {
+    handle.batch_config_metadata = nullptr;
+  }
+   
 
   // checkCUDA(cudaMalloc(&handle.workSpace, handle.workSpaceSize));
 #ifdef FF_USE_NCCL
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 7c37f3391e..89d4ddaed4 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -16,6 +16,7 @@
 #include "flexflow/request_manager.h"
 #include "flexflow/parallel_ops/parallel_op.h"
 // #include "flexflow/tokenizers.h"
+#include <bitset>
 #include <filesystem>
 #include <iomanip>
 #include <new>
@@ -106,6 +107,11 @@ int RequestManager::get_max_sequence_length() {
   return max_sequence_length;
 }
 
+void RequestManager::push_spec_infer_tree_width(int tree_width) {
+  assert(tree_width <= BeamSearchBatchConfig::MAX_BEAM_WIDTH);
+  spec_infer_tree_width.emplace_back(tree_width);
+}
+
 void RequestManager::register_tokenizer(ModelType type,
                                         int bos_token_id,
                                         int eos_token_id,
@@ -358,6 +364,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
     }
   }
   int num_generation_tokens = 0;
+  int num_active_req = -1;
 
   // Step 2: prepare the next batch for existing requests
   BatchConfig new_bc;
@@ -406,13 +413,14 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
         total_request_run_time +=
             profile_info.finish_time - profile_info.start_time;
         profiling_requests[request.guid] = profile_info;
-        log_req_mgr.print("[Profile] guid(%zu) decoding_steps(%d) start(%.1lf) "
-                          "finish(%.1lf) latency(%.1lf)",
-                          request.guid,
-                          profile_info.decoding_steps,
-                          profile_info.start_time,
-                          profile_info.finish_time,
-                          profile_info.finish_time - profile_info.start_time);
+        log_req_mgr.print(
+            "[Profile] guid(%zu) llm_decoding_steps(%d) start(%.1lf) "
+            "finish(%.1lf) latency(%.1lf)",
+            request.guid,
+            profile_info.llm_decoding_steps,
+            profile_info.start_time,
+            profile_info.finish_time,
+            profile_info.finish_time - profile_info.start_time);
         // Write output to file if needed:
         if (!output_filepath.empty()) {
           std::ofstream outputFile(output_filepath, std::ios::app);
@@ -420,8 +428,8 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
             outputFile << "end-to-end latency: " << std::fixed
                        << std::setprecision(3) << total_request_run_time
                        << std::endl;
-            outputFile << "num decoding steps: " << profile_info.decoding_steps
-                       << std::endl;
+            outputFile << "num decoding steps: "
+                       << profile_info.llm_decoding_steps << std::endl;
             outputFile << "token IDs: ";
             for (int i = 0; i < request.tokens.size(); i++) {
               outputFile << request.tokens[i];
@@ -447,6 +455,8 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
             old_bc.requestsInfo[i].request_guid;
         new_bc.requestsInfo[i].max_sequence_length =
             old_bc.requestsInfo[i].max_sequence_length;
+        num_active_req++;
+        new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
         if (new_bc.requestsInfo[i].first_token_depth_in_request + 1 ==
             request.tokens.size()) {
           // Incremental phase
@@ -469,7 +479,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
         }
         // Update profiling
         profiling_requests[new_bc.requestsInfo[i].request_guid]
-            .decoding_steps++;
+            .llm_decoding_steps++;
       }
     }
   }
@@ -483,6 +493,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
         Request new_request = pending_request_queue.front();
         pending_request_queue.pop();
         // all_requests[new_request.guid] = new_request;
+
         new_bc.requestsInfo[i].first_token_depth_in_request = 0;
         new_bc.requestsInfo[i].first_token_offset_in_batch = new_bc.num_tokens;
         new_bc.requestsInfo[i].request_guid = new_request.guid;
@@ -492,9 +503,11 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
         new_bc.requestsInfo[i].max_sequence_length =
             new_request.max_sequence_length;
         new_bc.request_completed[i] = false;
+        num_active_req++;
+        new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
         // add profile_info for the new request
         ProfileInfo profile_info;
-        profile_info.decoding_steps = 1;
+        profile_info.llm_decoding_steps = 1;
         profile_info.start_time = Realm::Clock::current_time_in_microseconds();
         profiling_requests[new_request.guid] = profile_info;
         for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
@@ -567,6 +580,7 @@ BeamSearchBatchConfig
   int result_index = 0;
 
   int num_generation_tokens = 0;
+  int num_active_req = -1;
 
   for (int i = 0; i < BatchConfig::max_requests_per_batch(); i++) {
     if (old_bc.request_completed[i]) {
@@ -602,6 +616,8 @@ BeamSearchBatchConfig
         committed_tokens[guid].emplace_back(abs_depth, result_index);
       } else if (abs_depth >= root_abs_depth) {
         tree_outputs.emplace_back(token_id, abs_depth + 1);
+        // std::cout << "committred tokens push: " << abs_depth
+        //           << " ,result index: " << result_index << "\n";
         committed_tokens[guid].emplace_back(abs_depth, result_index);
 
         if (verbose) {
@@ -612,22 +628,23 @@ BeamSearchBatchConfig
                  tree_outputs.back().second,
                  token_id);
         }
-        std::cout << "Index within old batch: " << result_index << std::endl;
-        printf("  Input: [%d] %d ---> [%d] %d \n",
-               abs_depth,
-               old_bc.tokensInfo[result_index].token_id,
-               tree_outputs.back().second,
-               token_id);
+        // std::cout << "Index within old batch: " << result_index << std::endl;
+        // printf("  Input: [%d] %d ---> [%d] %d \n",
+        //        abs_depth,
+        //        old_bc.tokensInfo[result_index].token_id,
+        //        tree_outputs.back().second,
+        //        token_id);
       }
       result_index++;
     }
 
     if (request.status == Request::RUNNING) {
+
       std::vector<std::pair<BatchConfig::TokenId, int>> verified_tokens =
           traverse_verify_tree(guid, dfs_tree_inputs.at(guid), tree_outputs);
+
       log_req_mgr.print("Number of Verified Tokens = %zu",
                         verified_tokens.size());
-
       // check if the request is finished
       if (verified_tokens.size() + request.tokens.size() >=
           request.max_sequence_length) {
@@ -664,16 +681,18 @@ BeamSearchBatchConfig
         // Log profiling info
         ProfileInfo profile_info = profiling_requests[request.guid];
         profile_info.finish_time = Realm::Clock::current_time_in_microseconds();
+        profile_info.ssm_decoding_steps = 0;
         total_request_run_time +=
             profile_info.finish_time - profile_info.start_time;
         profiling_requests[request.guid] = profile_info;
-        log_req_mgr.print("[Profile] guid(%zu) decoding_steps(%d) start(%.1lf) "
-                          "finish(%.1lf) latency(%.1lf)",
-                          request.guid,
-                          profile_info.decoding_steps,
-                          profile_info.start_time,
-                          profile_info.finish_time,
-                          profile_info.finish_time - profile_info.start_time);
+        log_req_mgr.print(
+            "[Profile] guid(%zu) llm_decoding_steps(%d) start(%.1lf) "
+            "finish(%.1lf) latency(%.1lf)",
+            request.guid,
+            profile_info.llm_decoding_steps,
+            profile_info.start_time,
+            profile_info.finish_time,
+            profile_info.finish_time - profile_info.start_time);
 
         // Write output to file if needed:
         if (!output_filepath.empty()) {
@@ -682,8 +701,8 @@ BeamSearchBatchConfig
             outputFile << "end-to-end latency: " << std::fixed
                        << std::setprecision(3) << total_request_run_time
                        << std::endl;
-            outputFile << "num decoding steps: " << profile_info.decoding_steps
-                       << std::endl;
+            outputFile << "num decoding steps: "
+                       << profile_info.llm_decoding_steps << std::endl;
             outputFile << "token IDs: ";
             for (int i = 0; i < request.tokens.size(); i++) {
               outputFile << request.tokens[i];
@@ -709,6 +728,7 @@ BeamSearchBatchConfig
 
         new_bc.request_completed[i] = false;
         new_bc.request_running[i] = true;
+        num_active_req++;
 
         // Normal Request Info
         new_bc.requestsInfo[i].first_token_depth_in_request =
@@ -719,6 +739,7 @@ BeamSearchBatchConfig
         new_bc.requestsInfo[i].max_sequence_length =
             old_bc.requestsInfo[i].max_sequence_length;
         new_bc.requestsInfo[i].num_tokens_in_batch = verified_tokens.size();
+        new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
 
         // TODO: Beam Request Info, missing from VerifyTreeBatchConfig
         int new_max_depth =
@@ -726,8 +747,14 @@ BeamSearchBatchConfig
             new_bc.requestsInfo[i].first_token_depth_in_request -
             verified_tokens.size();
         new_bc.beamRequestsInfo[i].current_depth = 1;
+
+        profiling_requests[request.guid].ssm_decoding_steps = 0;
+
+        int ssm_decoding_steps = 0;
         new_bc.beamRequestsInfo[i].beam_size =
-            BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+            spec_infer_tree_width.size() > ssm_decoding_steps
+                ? spec_infer_tree_width[ssm_decoding_steps]
+                : 1;
         new_bc.beamRequestsInfo[i].max_depth =
             std::min(new_max_depth, BeamSearchBatchConfig::MAX_BEAM_DEPTH);
         for (int j = 0; j < BeamSearchBatchConfig::MAX_BEAM_WIDTH; j++) {
@@ -735,8 +762,14 @@ BeamSearchBatchConfig
           new_bc.beamRequestsInfo[i].probs[j] = 1;
         }
 
+        new_bc.beamRequestsInfo[i].sub_request_num = 1;
+
         new_bc.sub_requests[i] = 1;
 
+        updateBitMask(new_bc.causalMask[i],
+                      verified_tokens.size(),
+                      request.tokens.size());
+
         // Token Info
         for (int j = 0; j < verified_tokens.size(); j++) {
           auto token = verified_tokens.at(j);
@@ -758,6 +791,7 @@ BeamSearchBatchConfig
             break;
           }
         }
+
         std::string output = this->tokenizer_->Decode(request.tokens);
         // Unlike Huggingface, the sentencepiece C++ library automatically
         // removes the BOS token
@@ -767,9 +801,11 @@ BeamSearchBatchConfig
         }
         log_req_mgr.print("Output: %s", output.c_str());
       }
+
     } else if (request.status == Request::PENDING) {
       new_bc.request_completed[i] = false;
       new_bc.request_running[i] = false;
+      num_active_req++;
 
       std::cout << "ssm_cache_size: " << request.ssm_cache_size << ", "
                 << "initial_len: " << request.initial_len << std::endl;
@@ -783,17 +819,24 @@ BeamSearchBatchConfig
       new_bc.requestsInfo[i].max_sequence_length =
           old_bc.requestsInfo[i].max_sequence_length;
       new_bc.requestsInfo[i].num_tokens_in_batch = 0;
+      new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
 
       // TODO: Beam Request Info, missing from VerifyTreeBatchConfig
       new_bc.beamRequestsInfo[i].current_depth = 1;
+      int ssm_decoding_steps =
+          profiling_requests[request.guid].ssm_decoding_steps;
       new_bc.beamRequestsInfo[i].beam_size =
-          BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+          spec_infer_tree_width.size() > ssm_decoding_steps
+              ? spec_infer_tree_width[ssm_decoding_steps]
+              : 1;
       new_bc.beamRequestsInfo[i].max_depth = 0;
       for (int j = 0; j < BeamSearchBatchConfig::MAX_BEAM_WIDTH; j++) {
         new_bc.beamRequestsInfo[i].parent_id[j] = 0;
         new_bc.beamRequestsInfo[i].probs[j] = 1;
       }
 
+      new_bc.beamRequestsInfo[i].sub_request_num = 1;
+
       new_bc.sub_requests[i] = 1;
 
       // Token Info
@@ -818,6 +861,7 @@ BeamSearchBatchConfig
         Request new_request = pending_request_queue.front();
         pending_request_queue.pop();
         // all_requests[new_request.guid] = new_request;
+        num_active_req++;
         new_bc.requestsInfo[i].first_token_depth_in_request = 0;
         new_bc.requestsInfo[i].first_token_offset_in_batch = new_bc.num_tokens;
         new_bc.requestsInfo[i].request_guid = new_request.guid;
@@ -826,15 +870,21 @@ BeamSearchBatchConfig
                      (int)new_request.tokens.size());
         new_bc.requestsInfo[i].max_sequence_length =
             new_request.max_sequence_length;
+        new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
 
         // add profile_info for the new request
         ProfileInfo profile_info;
-        profile_info.decoding_steps = 0;
+        profile_info.llm_decoding_steps = 0;
+        profile_info.ssm_decoding_steps = 0;
         profile_info.start_time = Realm::Clock::current_time_in_microseconds();
         profiling_requests[new_request.guid] = profile_info;
         // init the beam search metadata per request
+        int ssm_decoding_steps = profile_info.ssm_decoding_steps;
+
         new_bc.beamRequestsInfo[i].beam_size =
-            BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+            spec_infer_tree_width.size() > ssm_decoding_steps
+                ? spec_infer_tree_width[ssm_decoding_steps]
+                : 1;
         new_bc.beamRequestsInfo[i].current_depth = 1;
         new_bc.beamRequestsInfo[i].max_depth =
             std::min(BeamSearchBatchConfig::MAX_BEAM_DEPTH,
@@ -846,6 +896,11 @@ BeamSearchBatchConfig
         }
 
         new_bc.request_completed[i] = false;
+
+        new_bc.beamRequestsInfo[i].sub_request_num = 1;
+        printf("sub request num == 1, %d \n",
+               new_bc.beamRequestsInfo[i].beam_size);
+
         new_bc.sub_requests[i] = 1;
 
         for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
@@ -862,6 +917,9 @@ BeamSearchBatchConfig
           new_bc.num_tokens++;
         }
 
+        initBitMask(new_bc.causalMask[i],
+                    new_bc.requestsInfo[i].num_tokens_in_batch);
+
         // if (new_bc.requestsInfo[i].num_tokens_in_batch <
         // new_request.initial_len) {
         //   all_requests[new_request.guid].status = Request::PENDING;
@@ -949,6 +1007,8 @@ BeamSearchBatchConfig
     }
     std::cout << "Current Beam Depth: "
               << old_bc.beamRequestsInfo[0].current_depth << "\n";
+    std::cout << "Current sub request num: "
+              << old_bc.beamRequestsInfo[0].sub_request_num << "\n";
   }
   // Step 1: Store result to the beam tree struct
   store_beam_metadata(old_bc, result);
@@ -960,10 +1020,12 @@ BeamSearchBatchConfig
   int num_generation_tokens = 0;
 
   // Add incremental tokens to the batch
+  int num_active_req = -1;
   for (int i = 0; i < BatchConfig::max_requests_per_batch(); i++) {
     if (old_bc.request_completed[i] || !old_bc.request_running[i]) {
       continue;
     }
+    num_active_req++;
     // Comment out this assertion since num_tokens_in_batch can be
     // zero when beam search has reached required sequence length
     // assert(old_bc.requestsInfo[i].num_tokens_in_batch > 0);
@@ -973,29 +1035,6 @@ BeamSearchBatchConfig
 
     // assert(processed_tokens < request.tokens.size());
     log_req_mgr.debug() << "processed_tokens: " << processed_tokens << "\n";
-    // if (processed_tokens >
-    //         old_bc.beamRequestsInfo[i].max_depth + request.tokens.size() &&
-    //     request.status == Request::RUNNING
-    //     // || ir.results[t] == 0 TODO: replace this with <EOS>
-    // ) {
-    //   // log_req_mgr.print("[Done] guid(%zu) with spec_tree_depth(%d)",
-    //   //                   old_bc.requestsInfo[i].request_guid,
-    //   //                   old_bc.beamRequestsInfo[i].max_depth);
-    //   // // new_bc.request_completed[i] = true;
-    //   // new_bc.request_completed[i] = false;
-    //   // new_bc.requestsInfo[i].first_token_depth_in_request =
-    //   processed_tokens;
-    //   // new_bc.requestsInfo[i].request_guid =
-    //   // old_bc.requestsInfo[i].request_guid;
-    //   // new_bc.requestsInfo[i].max_sequence_length =
-    //   //     old_bc.requestsInfo[i].max_sequence_length;
-    //   // new_bc.beamRequestsInfo[i].current_depth =
-    //   //       old_bc.beamRequestsInfo[i].current_depth;
-    //   // new_bc.request_running[i] = false;
-    //   std::cout << "beam search end:" << request.status << i << ", "
-    //             << new_bc.requestsInfo[i].num_tokens_in_batch << "\n";
-    // }
-    // else
     {
       log_req_mgr.debug() << "num tokens: " << old_bc.num_tokens << ", "
                           << new_bc.num_tokens;
@@ -1005,25 +1044,42 @@ BeamSearchBatchConfig
       new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
       new_bc.requestsInfo[i].max_sequence_length =
           old_bc.requestsInfo[i].max_sequence_length;
-
+      profiling_requests[request.guid].ssm_decoding_steps += 1;
+      new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
       // update the beam search metadata
       // how many sub request in current request
       // why is sub_requests has max_requests_per_batch() * MAX_BEAM_WIDTH
       // entries?
-      new_bc.sub_requests[i] = old_bc.beamRequestsInfo[i].beam_size;
-
       // update the parentid, accumalated_probs, depth, and token_ids
+      int ssm_decoding_steps =
+          profiling_requests[request.guid].ssm_decoding_steps;
+
       new_bc.beamRequestsInfo[i].beam_size =
-          old_bc.beamRequestsInfo[i].beam_size;
+          spec_infer_tree_width.size() > ssm_decoding_steps
+              ? spec_infer_tree_width[ssm_decoding_steps]
+              : 1;
+
       new_bc.beamRequestsInfo[i].max_depth =
           old_bc.beamRequestsInfo[i].max_depth;
 
+      new_bc.sub_requests[i] =
+          old_bc.sub_requests[i] * new_bc.beamRequestsInfo[i].beam_size;
+      new_bc.beamRequestsInfo[i].sub_request_num =
+          old_bc.beamRequestsInfo[i].sub_request_num *
+          old_bc.beamRequestsInfo[i].beam_size;
+
+      assert(new_bc.beamRequestsInfo[i].sub_request_num <=
+                 BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES &&
+             "exceed maximum nodes per layer");
+
       if (request.status == Request::RUNNING) {
         new_bc.beamRequestsInfo[i].current_depth =
             old_bc.beamRequestsInfo[i].current_depth + 1;
         new_bc.request_running[i] = true;
         // do the slot exchange to minimize the cache exchange in kernel.
-        update_beam_metadata(new_bc, request.beam_trees.at(old_bc.model_id), i);
+        update_beam_metadata(
+            new_bc, old_bc, request.beam_trees.at(old_bc.model_id), i);
+
       } else {
         assert(false && "Request should not be pending in beam search phase");
       }
@@ -1035,6 +1091,7 @@ BeamSearchBatchConfig
           request.tokens.size()) {
         // Incremental phase
         if (request.status == Request::RUNNING) {
+          // todo this is replaced by this_layer_size, but should check it
           new_bc.requestsInfo[i].num_tokens_in_batch = 1;
         } else {
           assert(false && "Request should be done");
@@ -1057,9 +1114,22 @@ BeamSearchBatchConfig
       }
 
       // register more tokens due to the beam width
+
+      // copy metadata
+      memcpy(&new_bc.causalMask[i],
+             &old_bc.causalMask[i],
+             sizeof(BatchConfig::BitMask));
+      BeamTree tree = request.beam_trees[old_bc.model_id];
+      appendBitMask(new_bc.causalMask[i],
+                    new_bc.beamRequestsInfo[i].sub_request_num,
+                    old_bc.beamRequestsInfo[i].beam_size,
+                    old_bc.beamRequestsInfo[i].sub_request_num,
+                    tree,
+                    old_bc.beamRequestsInfo[i].current_depth);
+      // assert(false);
       for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
         int depth = new_bc.requestsInfo[i].first_token_depth_in_request + j;
-        for (int k = 0; k < new_bc.sub_requests[i]; k++) {
+        for (int k = 0; k < new_bc.beamRequestsInfo[i].sub_request_num; k++) {
           new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
           new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = depth;
 
@@ -1069,6 +1139,8 @@ BeamSearchBatchConfig
 
           new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = k;
           new_bc.num_tokens++;
+
+          num_generation_tokens++;
         }
       }
     }
@@ -1079,6 +1151,7 @@ BeamSearchBatchConfig
     if (old_bc.request_completed[i] || old_bc.request_running[i]) {
       continue;
     }
+    num_active_req++;
     // Comment out this assertion since num_tokens_in_batch can be
     // zero when beam search has reached required sequence length
     // assert(old_bc.requestsInfo[i].num_tokens_in_batch > 0);
@@ -1098,18 +1171,34 @@ BeamSearchBatchConfig
       new_bc.requestsInfo[i].request_guid = old_bc.requestsInfo[i].request_guid;
       new_bc.requestsInfo[i].max_sequence_length =
           old_bc.requestsInfo[i].max_sequence_length;
+      new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
 
       // update the beam search metadata
       // how many sub request in current request
       // why is sub_requests has max_requests_per_batch() * MAX_BEAM_WIDTH
       // entries?
-      new_bc.sub_requests[i] = old_bc.beamRequestsInfo[i].beam_size;
+      int ssm_decoding_steps =
+          profiling_requests[request.guid].ssm_decoding_steps;
 
-      // update the parentid, accumalated_probs, depth, and token_ids
       new_bc.beamRequestsInfo[i].beam_size =
-          old_bc.beamRequestsInfo[i].beam_size;
+          spec_infer_tree_width.size() > ssm_decoding_steps
+              ? spec_infer_tree_width[ssm_decoding_steps]
+              : 1;
+      printf("beam size: %d, %d\n",
+             new_bc.beamRequestsInfo[i].beam_size,
+             ssm_decoding_steps);
       new_bc.beamRequestsInfo[i].max_depth =
           old_bc.beamRequestsInfo[i].max_depth;
+      new_bc.sub_requests[i] =
+          old_bc.sub_requests[i] * new_bc.beamRequestsInfo[i].beam_size;
+      new_bc.beamRequestsInfo[i].sub_request_num =
+          old_bc.beamRequestsInfo[i].sub_request_num;
+
+      assert(new_bc.beamRequestsInfo[i].sub_request_num <=
+                 BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES &&
+             "exceed maximum nodes per layer");
+
+      // update the parentid, accumalated_probs, depth, and token_ids
 
       if (request.status == Request::PENDING) {
         // if the request is pending, we need to update the beam search
@@ -1121,6 +1210,10 @@ BeamSearchBatchConfig
         assert(false && "Request should be pending");
       }
 
+      memcpy(&new_bc.causalMask[i],
+             &old_bc.causalMask[i],
+             sizeof(BatchConfig::BitMask));
+
       if (new_bc.requestsInfo[i].first_token_depth_in_request >=
           request.tokens.size()) {
         // request is done
@@ -1133,6 +1226,13 @@ BeamSearchBatchConfig
                      (int)request.tokens.size() -
                          new_bc.requestsInfo[i].first_token_depth_in_request);
         request.ssm_cache_size += new_bc.requestsInfo[i].num_tokens_in_batch;
+        BeamTree tree = request.beam_trees[old_bc.model_id];
+        appendBitMask(new_bc.causalMask[i],
+                      new_bc.beamRequestsInfo[i].sub_request_num,
+                      old_bc.beamRequestsInfo[i].beam_size,
+                      old_bc.beamRequestsInfo[i].sub_request_num,
+                      tree,
+                      old_bc.beamRequestsInfo[i].current_depth);
       }
 
       if (verbose) {
@@ -1152,7 +1252,7 @@ BeamSearchBatchConfig
       // register more tokens due to the beam width
       for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
         int depth = new_bc.requestsInfo[i].first_token_depth_in_request + j;
-        for (int k = 0; k < new_bc.sub_requests[i]; k++) {
+        for (int k = 0; k < new_bc.beamRequestsInfo[i].sub_request_num; k++) {
           new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
           new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = depth;
 
@@ -1229,21 +1329,20 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       max_prompt_load_size -= 1;
     }
   }
-
+  int num_active_req = -1;
   for (int i = 0; i < TreeVerifyBatchConfig::max_requests_per_batch(); i++) {
     if (old_batches.at(0).request_completed[i]) {
       continue;
     }
+    num_active_req++;
     size_t guid = old_batches.at(0).requestsInfo[i].request_guid;
     Request &request = all_requests[guid];
 
     // Profiling
-    profiling_requests[request.guid].decoding_steps += 1;
+    profiling_requests[request.guid].llm_decoding_steps += 1;
 
     if (request.status == Request::RUNNING) {
       new_bc.request_running[i] = true;
-      std::cout << "[Verify] Request " << request.guid << " is running"
-                << std::endl;
 
       // Get the dfs tree
       std::vector<std::vector<std::pair<BatchConfig::TokenId, int>>>
@@ -1274,31 +1373,44 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
           old_batches.at(0).requestsInfo[i].request_guid;
       new_bc.requestsInfo[i].max_sequence_length =
           old_batches.at(0).requestsInfo[i].max_sequence_length;
+      new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
+
+      // copy bitmask to verify batchconfig
+      memcpy(&(new_bc.causalMask[i]),
+             &(old_batches.at(0).causalMask[i]),
+             sizeof(BatchConfig::BitMask));
       // TODO: Check this
       new_bc.requestsInfo[i].num_tokens_in_batch = 0;
       new_bc.request_completed[i] = false;
 
+      // std::cout << "dfs_tree_inputs: " << dfs_tree_inputs.size() << ", "
+      //           << new_bc.causalMask[i].tree_size << ", "
+      //           << new_bc.causalMask[i].non_tree_cache_size << "\n";
+      // std::cout << "mask: " << std::bitset<64>(new_bc.causalMask[i].mask[0])
+      //           << "\n";
+
       // Committed Tokens
       if (committed_tokens.find(guid) != committed_tokens.end()) {
-        for (int j = 0; j < dfs_tree_inputs.size(); j++) {
-          if (j < committed_tokens.at(guid).size()) {
-            auto committed_token = committed_tokens.at(guid).at(j);
-            new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_index =
-                committed_token.second;
-            new_bc.committed_tokens[new_bc.num_tokens_to_commit].request_index =
-                i;
-            new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_depth =
-                committed_token.first;
-            if (verbose) {
-              std::cout << new_bc.num_tokens_to_commit
-                        << "- committed_token.token_depth: "
-                        << committed_token.first
-                        << ", token_index: " << committed_token.second
-                        << std::endl;
-            }
-            new_bc.num_tokens_to_commit++;
-            request.llm_cache_size++;
+        for (int j = 0; j < committed_tokens.at(guid).size(); j++) {
+          // if (j < committed_tokens.at(guid).size()) {
+
+          auto committed_token = committed_tokens.at(guid).at(j);
+          new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_index =
+              committed_token.second;
+          new_bc.committed_tokens[new_bc.num_tokens_to_commit].request_index =
+              i;
+          new_bc.committed_tokens[new_bc.num_tokens_to_commit].token_depth =
+              committed_token.first;
+          if (verbose) {
+            std::cout << new_bc.num_tokens_to_commit
+                      << "- committed_token.token_depth: "
+                      << committed_token.first
+                      << ", token_index: " << committed_token.second
+                      << std::endl;
           }
+          new_bc.num_tokens_to_commit++;
+          request.llm_cache_size++;
+          // }
         }
       }
       if (verbose) {
@@ -1324,6 +1436,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       new_bc.requestsInfo[i].first_token_depth_in_request =
           request.tokens.size() - 1;
 
+      bool cutLayer = false;
       // Add Tokens from the DFS Tree to the next batch
       for (int j = 1; j < dfs_tree_inputs.size(); j++) {
         auto token = dfs_tree_inputs.at(j);
@@ -1340,11 +1453,27 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
         new_bc.num_tokens++;
         new_bc.requestsInfo[i].num_tokens_in_batch++;
 
-        if (new_bc.num_tokens == get_max_tokens_per_batch() - 1) {
+        if (new_bc.num_tokens == get_max_tokens_per_batch() &&
+            (j != dfs_tree_inputs.size() - 1)) {
+          cutLayer = true;
           break;
         }
       }
 
+      // delete the last incomplete layer
+      if (cutLayer) {
+        int total_tokens = new_bc.num_tokens;
+        for (int j = total_tokens - 1; j >= 1; j--) {
+          new_bc.num_tokens--;
+          new_bc.requestsInfo[i].num_tokens_in_batch--;
+          // std::cout << "cut: " << j << "\n";
+          if (new_bc.tokensInfo[j].abs_depth_in_request !=
+              new_bc.tokensInfo[j - 1].abs_depth_in_request) {
+            break;
+          }
+        }
+      }
+
     } else if (request.status == Request::PENDING) {
       new_bc.request_running[i] = false;
       if (verbose) {
@@ -1374,6 +1503,10 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
                   << new_bc.num_tokens_to_commit << std::endl;
       }
 
+      memcpy(&(new_bc.causalMask[i]),
+             &(old_batches.at(0).causalMask[i]),
+             sizeof(BatchConfig::BitMask));
+
       // Normal Request Info
       new_bc.requestsInfo[i].first_token_depth_in_request =
           request.llm_cache_size;
@@ -1382,6 +1515,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
           old_batches.at(0).requestsInfo[i].request_guid;
       new_bc.requestsInfo[i].max_sequence_length =
           old_batches.at(0).requestsInfo[i].max_sequence_length;
+      new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
 
       new_bc.request_completed[i] = false;
 
@@ -1395,6 +1529,9 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
                 << std::endl;
 
       if (request.llm_cache_size < request.initial_len) {
+        // std::cout << "Initialization (prompt) phase: "
+        //           << new_bc.requestsInfo[i].num_tokens_in_batch << ", "
+        //           << old_batches.at(0).beamRequestsInfo[i].beam_size << "\n";
         // Initialization (prompt) phase
         for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
           new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
@@ -1402,7 +1539,6 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
               request.tokens[request.llm_cache_size + j];
           new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request =
               request.llm_cache_size + j;
-
           new_bc.num_tokens++;
         }
 
@@ -1428,6 +1564,8 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
         }
       } else { // launch the request into running phase after loading all prompt
         if (get_max_tokens_per_batch() - new_bc.num_tokens > 0) {
+          // std::cout << "Initialization running phase: "
+          //           << new_bc.requestsInfo[i].num_tokens_in_batch << "\n";
           request.status = Request::RUNNING;
           new_bc.request_running[i] = true;
 
@@ -1476,26 +1614,41 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
         old_bc.requestsInfo[old_bc.tokensInfo[i].request_index].request_guid !=
             guid) {
 
+      // std::cout << "i is: " << i << "old guid" << guid << " new guid"
+      //           << old_bc.requestsInfo[old_bc.tokensInfo[i].request_index]
+      //                  .request_guid
+      //           << "\n";
+
       int index = old_bc.tokensInfo[i - 1].request_index;
       int beam_size = old_bc.beamRequestsInfo[index].beam_size;
+
+      // int leaf_node_num = old_bc.sub_requests[index];
+      int leaf_node_num =
+          old_bc.beamRequestsInfo[index].sub_request_num * beam_size;
       int depth = old_bc.beamRequestsInfo[index].current_depth;
 
       // Each token yields (beam_width) results
-      int beam_width = old_bc.beamRequestsInfo[index].beam_size;
+      // int beam_width = old_bc.beamRequestsInfo[index].beam_size;
 
       // Count tokens sent to model in this request to find the final token's
       // index
       result_index +=
           (old_bc.tokensInfo[i - 1].abs_depth_in_request - start_depth) *
-          beam_width;
+          beam_size;
 
       if (verbose) {
         std::cout << "i = " << i << ", result index = " << result_index
-                  << ", value: " << result.token_ids[result_index] << "\n";
+                  << ", value: " << result.token_ids[result_index]
+                  << ", leaf node num: " << leaf_node_num << ", depth" << depth
+                  << ", beam size: " << beam_size << "\n";
       }
 
       Request &request = all_requests[old_bc.requestsInfo[index].request_guid];
 
+      if (old_bc.requestsInfo[index].num_tokens_in_batch == 0) {
+        continue;
+      }
+
       if (depth == 1) {
         // store the last input into the tree;
         if (verbose) {
@@ -1507,14 +1660,20 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
             request.tokens.back();
         request.beam_trees.at(old_bc.model_id).treeLayers[0].probs[0] = 1;
         request.beam_trees.at(old_bc.model_id).treeLayers[0].parent_ids[0] = -1;
+        request.beam_trees.at(old_bc.model_id)
+            .treeLayers[0]
+            .nodes_num_this_layer = 1;
 
         if (verbose) {
           std::cout << "Store the previous last token to the tree root: "
                     << request.tokens.back() << "\n";
         }
       }
+      request.beam_trees.at(old_bc.model_id)
+          .treeLayers[depth]
+          .nodes_num_this_layer = leaf_node_num;
+      for (int beam_id = 0; beam_id < leaf_node_num; beam_id++) {
 
-      for (int beam_id = 0; beam_id < beam_width; beam_id++) {
         request.beam_trees.at(old_bc.model_id)
             .treeLayers[depth]
             .tokens[beam_id] = result.token_ids[result_index];
@@ -1534,10 +1693,10 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
         }
         result_index += 1;
       }
-
       // update the guid and start_depth for current request
       if (i < old_bc.num_tokens) {
-        guid = old_bc.requestsInfo[index].request_guid;
+        int new_req_idx = old_bc.tokensInfo[i].request_index;
+        guid = old_bc.requestsInfo[new_req_idx].request_guid;
         start_depth = old_bc.tokensInfo[i].abs_depth_in_request;
       }
     }
@@ -1546,6 +1705,7 @@ void RequestManager::store_beam_metadata(BeamSearchBatchConfig const &old_bc,
 
 // for updating the beam search metadata in requests in incremental phase
 void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
+                                          BeamSearchBatchConfig const &old_bc,
                                           BeamTree &tree,
                                           int request_index) {
 
@@ -1556,6 +1716,9 @@ void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
   int depth = new_bc.beamRequestsInfo[request_index].current_depth - 1;
   int beam_size = new_bc.beamRequestsInfo[request_index].beam_size;
 
+  // int leaf_node_num = old_bc.sub_requests[request_index];
+  int leaf_node_num = new_bc.beamRequestsInfo[request_index].sub_request_num;
+
   if (new_bc.beamRequestsInfo[request_index].current_depth ==
       1) { // TODO: check if this is correct
     // for (int j = 0; j < beam_size; j++) {
@@ -1568,48 +1731,15 @@ void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
     // Do nothing
     // assert(false);
   } else {
-    std::set<int> parents;
-    std::set<int> childs;
-    // cache stealing
-    for (int j = 0; j < beam_size; j++) {
-      int parent_id = tree.treeLayers[depth].parent_ids[j];
-      if (childs.find(parent_id) == childs.end()) {
-        // copy beam slot
-        new_bc.beamRequestsInfo[request_index].parent_id[parent_id] =
-            tree.treeLayers[depth].parent_ids[j];
-        new_bc.beamRequestsInfo[request_index].probs[parent_id] =
-            tree.treeLayers[depth].probs[j];
-        new_bc.beamRequestsInfo[request_index].tokens[parent_id] =
-            tree.treeLayers[depth].tokens[j];
-        parents.emplace(j);
-        childs.emplace(parent_id);
-      }
-    }
-    if (parents.size() < beam_size) {
-      for (int j = 0; j < beam_size; j++) {
-        if (parents.find(j) == parents.end()) {
-          // this slot has not been assigned
-          // find the smallest not assigned child and put in
-          if (verbose) {
-            std::cout << "request_index" << request_index
-                      << ", miss slot: " << j << "\n";
-          }
-          for (int k = 0; k < beam_size; k++) {
-            if (childs.find(k) == childs.end()) {
-              // parent -> j to child k;
-              new_bc.beamRequestsInfo[request_index].parent_id[k] =
-                  tree.treeLayers[depth].parent_ids[j];
-              new_bc.beamRequestsInfo[request_index].probs[k] =
-                  tree.treeLayers[depth].probs[j];
-              new_bc.beamRequestsInfo[request_index].tokens[k] =
-                  tree.treeLayers[depth].tokens[j];
-              parents.emplace(j);
-              childs.emplace(k);
-              break;
-            }
-          }
-        }
-      }
+    for (int j = 0; j < leaf_node_num; j++) {
+      new_bc.beamRequestsInfo[request_index].parent_id[j] =
+          tree.treeLayers[depth].parent_ids[j];
+      new_bc.beamRequestsInfo[request_index].probs[j] =
+          tree.treeLayers[depth].probs[j];
+      new_bc.beamRequestsInfo[request_index].tokens[j] =
+          tree.treeLayers[depth].tokens[j];
+      // std::cout << "token: " << j << ": "
+      //           << new_bc.beamRequestsInfo[request_index].tokens[j] << "\n";
     }
   }
   if (verbose) {
@@ -1625,6 +1755,139 @@ void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
   }
 }
 
+// bit mask related function
+
+// prompt phase, init task
+void RequestManager::initBitMask(BatchConfig::BitMask &bitmask,
+                                 int initLength) {
+  assert(initLength <= BatchConfig::MAX_SPEC_TREE_TOKEN_NUM &&
+         "do not support tree size > 64");
+  // eg. 4 tokens: t1: 0000000..1111, t2: 0000000..1110, t3: 0000000..1100, t4:
+  // 0000000..1000
+  bitmask.non_tree_cache_size = 0;
+  bitmask.tree_size = initLength;
+
+  bitmask.prompt_size = initLength;
+  bitmask.this_layer_size = initLength;
+  for (int i = 0; i < bitmask.prompt_size; i++) {
+    for (int j = i; j < bitmask.prompt_size; j++) {
+      bitmask.mask[i] |= (1 << j);
+    }
+  }
+  // std::cout << "see bit mask" << bitmask.prompt_size << "\n";
+  // std::cout << "see bit mask" << std::bitset<64>(bitmask.mask[0]) << "\n";
+  // std::cout << "see bit mask" << std::bitset<64>(bitmask.mask[1]) << "\n";
+  // std::cout << "see bit mask" << std::bitset<64>(bitmask.mask[2]) << "\n";
+}
+
+// prepare next init
+void RequestManager::updateBitMask(BatchConfig::BitMask &bitmask,
+                                   int initLength,
+                                   int non_tree_size) {
+  // assert(initLength == 1);
+  // eg. 4 tokens: t1: 0000000..1111, t2: 0000000..1110, t3: 0000000..1100, t4:
+  // 0000000..1000
+  assert(initLength <= BatchConfig::MAX_SPEC_TREE_TOKEN_NUM &&
+         "do not support tree size > 64");
+  assert(initLength >= 1 && "verified token num should >= 1");
+
+  // std::cout << "non tree size: " << non_tree_size << ", "
+  //           << bitmask.non_tree_cache_size << "\n";
+
+  bitmask.non_tree_cache_size = non_tree_size + initLength - 1;
+  bitmask.tree_size = 1;
+  bitmask.this_layer_size = initLength;
+  // std::cout << "non_tree_size: " << non_tree_size << "\n";
+  bitmask.prompt_size = 1;
+  for (int i = 0; i < bitmask.prompt_size; i++) {
+    for (int j = i; j < bitmask.prompt_size; j++) {
+      bitmask.mask[i] |= (1 << j);
+    }
+  }
+
+  // std::cout << "see bit mask update" << bitmask.prompt_size << "\n";
+  // std::cout << "see bit mask update" << std::bitset<64>(bitmask.mask[0])
+  //           << "\n";
+}
+
+// prepare next beam, append layers to the tree
+void RequestManager::appendBitMask(BatchConfig::BitMask &bitmask,
+                                   int newNodes,
+                                   int preBeamSize,
+                                   int old_sub_num,
+                                   BeamTree const tree,
+                                   int currentDepth) {
+  int pre_tree_size = bitmask.tree_size;
+  bitmask.tree_size += newNodes;
+  bitmask.this_layer_size = newNodes;
+  assert(bitmask.tree_size <= BatchConfig::MAX_SPEC_TREE_TOKEN_NUM &&
+         "do not support tree size > 64");
+  // preBeamSize: replicate num
+
+  // add relationship with input/prompt
+  for (int i = 0; i < bitmask.prompt_size; i++) {
+    for (int j = pre_tree_size; j < bitmask.tree_size; j++) {
+      bitmask.mask[i] |= (1 << j);
+      // std::cout << "see bit mask append: " << i << ", to" << j
+      //           << std::bitset<64>(bitmask.mask[i]) << "\n";
+    }
+  }
+
+  // std::cout << "bitmask.tree_size: " << bitmask.tree_size << ", "
+  //           << pre_tree_size << ", " << bitmask.prompt_size << ", "
+  //           << preBeamSize << "\n";
+
+  // int num_groups = newNodes / preBeamSize;
+  // int group_size = newNodes / num_groups;
+  // add relations to branch
+  // requests in same groups share same relations, except the last token.
+
+  // set middle layers
+  //  skip the root prompt/tokens
+  int token_idx = bitmask.prompt_size;
+  int new_nodes_start_idx = pre_tree_size;
+  // std::cout << "new nodes start " << new_nodes_start_idx << "\n";
+  for (int i = 1; i < currentDepth; i++) {
+    new_nodes_start_idx = pre_tree_size;
+    int nodes_this_layer = tree.treeLayers[i].nodes_num_this_layer;
+    // std::cout << "tree layer: " << i << " nodes:" << nodes_this_layer
+    //           << "group size: " << newNodes / nodes_this_layer << "\n";
+    for (int j = 0; j < nodes_this_layer; j++) {
+      int group_size = newNodes / nodes_this_layer;
+      for (int k = 0; k < group_size; k++) {
+        bitmask.mask[token_idx] |= (1 << new_nodes_start_idx);
+        new_nodes_start_idx += 1;
+      }
+      token_idx += 1;
+    }
+  }
+
+  // std::cout << "token idx: " << token_idx << ", " << pre_tree_size << ", "
+  //           << new_nodes_start_idx << ", " << newNodes
+  //           << "current depth: " << currentDepth << "\n";
+  // std::cout << "new nodes end " << new_nodes_start_idx << "\n";
+
+  // std::cout << "tree size: " << bitmask.tree_size << "\n";
+  assert(token_idx == pre_tree_size);
+  assert(currentDepth <= 1 || new_nodes_start_idx == bitmask.tree_size);
+
+  // assert(currentDepth <= 2);
+  // set last layer, all tokens are only relevant to it self;
+  for (int i = token_idx; i < bitmask.tree_size; i++) {
+    bitmask.mask[i] |= (1 << i);
+    // std::cout << "set rel: " << i << "to: " << i << "\n";
+  }
+
+  // if(bitmask.non_tree_cache_size == 19 && bitmask.tree_size > 2){
+  //   assert(false);
+  // }
+
+  // std::cout << "see bit mask append" << bitmask.prompt_size << "\n";
+  // std::cout << "see bit mask append" << bitmask.non_tree_cache_size << "\n";
+  // std::cout << "see bit mask append" << std::bitset<64>(bitmask.mask[0])
+  //           << "\n";
+}
+
 bool PreOrder(
     BeamTree const &tree,
     int max_depth,
@@ -1740,12 +2003,43 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
   // In this case the inputSeriedTree ends with padding 0s
   assert(inputSerializedTree.size() >= outputSerializedTree.size());
 
+  int *treeLayers = new int[inputSerializedTree.size()];
+  int node_num = 1;
+  int layer_num = 0;
+  for (int token_id = 0; token_id < inputSerializedTree.size(); token_id++) {
+    if (token_id == (inputSerializedTree.size() - 1) ||
+        inputSerializedTree.at(token_id + 1).second !=
+            inputSerializedTree.at(token_id).second) {
+      treeLayers[layer_num] = node_num;
+      layer_num += 1;
+      node_num = 1;
+    } else {
+      node_num++;
+    }
+  }
+
+  // to avoid branch switch when same tokens in input tree.
+  // todo, only checked for N->1->1->1 cases
+
+  bool findFirst = false;
+  layer_num = -1;
+  int first_layer_slot = 0;
+  int first_layer_slot_total = 0;
+  int processed_whole_layer_tokens = 0;
+
   for (int i = 0; i < outputSerializedTree.size(); i++) {
     auto input = inputSerializedTree.at(i);
     auto output = outputSerializedTree.at(i);
 
+    if (i == 0 || inputSerializedTree.at(i - 1).second !=
+                      inputSerializedTree.at(i).second) {
+      layer_num += 1;
+      processed_whole_layer_tokens += i == 0 ? 0 : treeLayers[layer_num - 1];
+    }
+
     if (i == 0) {
       verifiedTree.push_back(output);
+
       new_committed_tokens.push_back(std::make_pair(
           input.second,
           committed_tokens.at(guid).at(i).second)); // <input_abs_depth,
@@ -1760,11 +2054,38 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
 
     if (input.first == verifiedTree.back().first &&
         input.second == verifiedTree.back().second) {
-      verifiedTree.push_back(output);
-      new_committed_tokens.push_back(std::make_pair(
-          input.second,
-          committed_tokens.at(guid).at(i).second)); // <input_abs_depth,
-                                                    // input_index_in_batch>
+      if (findFirst) {
+        // must in this branch.
+        int layer_slot = i - processed_whole_layer_tokens;
+        int layer_slot_total = treeLayers[layer_num];
+        if ((first_layer_slot == layer_slot)) {
+          verifiedTree.push_back(output);
+          new_committed_tokens.push_back(std::make_pair(
+              input.second, committed_tokens.at(guid).at(i).second));
+          // at this point, you'll not go other branches
+          // std::cout << "verify tree push back: " << output.first
+          //           << ", tree size is: " << verifiedTree.size()
+          //           << ", ??: " << input.first << ", " << input.second <<
+          //           "\n";
+
+        } else {
+          printf("not correct slot\n");
+        }
+      } else {
+        verifiedTree.push_back(output);
+        first_layer_slot = i - processed_whole_layer_tokens;
+        first_layer_slot_total = treeLayers[layer_num];
+        findFirst = true;
+        new_committed_tokens.push_back(std::make_pair(
+            input.second,
+            committed_tokens.at(guid).at(i).second)); // <input_abs_depth,
+                                                      // input_index_in_batch>
+        // at this point, you'll not go other branches
+        // std::cout << "verify tree push back: " << output.first
+        //           << ", tree size is: " << verifiedTree.size()
+        //           << ", ??: " << input.first << ", " << input.second << "\n";
+      }
+
       assert(committed_tokens.at(guid).at(i).first == input.second);
     }
   }
@@ -1804,6 +2125,8 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
               << old_bc.beamRequestsInfo[request_index].current_depth << "\n";
     std::cout << "[Traverse Beam Tree] beam_width: "
               << old_bc.beamRequestsInfo[request_index].beam_size << "\n";
+    std::cout << "[Traverse Beam Tree] start index: "
+              << first_token_depth_in_request << "\n";
   }
 
   auto guid = old_bc.requestsInfo[request_index].request_guid;
@@ -1811,18 +2134,30 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
   // std::cout << "request.beam_trees.size(): " << request.beam_trees.size()
   //           << std::endl;
   BeamTree tree = request.beam_trees.at(old_bc.model_id);
-  // std::cout << "\n\n";
 
+  // std::cout << "print beam tree: "
+  //           << "\n";
+  std::vector<std::pair<BatchConfig::TokenId, int>> serializedTree;
+  for (int i = 0; i <= old_bc.beamRequestsInfo[request_index].max_depth; i++) {
+    // std::cout << "tree layer: " << i
+    //           << ", num_nodes: " << tree.treeLayers[i].nodes_num_this_layer
+    //           << "\n";
+    // push tokens into tree
+    for (int j = 0; j < tree.treeLayers[i].nodes_num_this_layer; j++) {
+      // std::cout << "token: " << tree.treeLayers[i].tokens[j] << "\n";
+      serializedTree.push_back(std::make_pair(tree.treeLayers[i].tokens[j], i));
+    }
+  }
   // token, index
   // todo make this one global for different stages
-  std::vector<std::pair<BatchConfig::TokenId, int>> serializedTree;
-  PreOrder(tree,
-           old_bc.beamRequestsInfo[request_index].max_depth,
-           0,
-           old_bc.beamRequestsInfo[request_index].beam_size,
-           0,
-           serializedTree,
-           verbose);
+
+  // PreOrder(tree,
+  //          old_bc.beamRequestsInfo[request_index].max_depth,
+  //          0,
+  //          old_bc.beamRequestsInfo[request_index].beam_size,
+  //          0,
+  //          serializedTree,
+  //          verbose);
 
   // print it
   if (verbose) {
@@ -1857,6 +2192,10 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
             input_trees,
         int root_depth,
         RequestGuid guid) {
+  assert(input_trees.size() == 1 && "currently using one ssm");
+  dfs_tree_inputs[guid] = input_trees.at(0);
+  return input_trees.at(0);
+
   std::vector<std::pair<BatchConfig::TokenId, int>> merged_tree;
 
   std::unordered_map<int, std::set<int>> childrens;
diff --git a/src/runtime/request_manager.cpp b/src/runtime/request_manager.cpp
index 1e756606f8..fadbf80d6d 100644
--- a/src/runtime/request_manager.cpp
+++ b/src/runtime/request_manager.cpp
@@ -58,6 +58,91 @@ void RequestManager::load_tokens_task(
                            stream));
 }
 
+void RequestManager::load_batch_config_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  assert(regions.size() == 0);
+  assert(task->regions.size() == 0);
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  // BatchConfig const batch_config = *((BatchConfig *)task->args);
+  BatchConfig const *batch_config = BatchConfig::from_future(task->futures[0]);
+
+  // copy meta data to workSpace
+  FFHandler handle = *((FFHandler const *)task->local_args);
+  size_t total_copy_size = 0;
+  checkCUDA(hipMemcpyAsync(handle.batch_config_metadata,
+                           &(batch_config->tokensInfo),
+                           sizeof(BatchConfig::tokensInfo),
+                           hipMemcpyHostToDevice,
+                           stream));
+  total_copy_size += sizeof(BatchConfig::tokensInfo);
+
+  checkCUDA(hipMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+                               total_copy_size,
+                           &(batch_config->requestsInfo),
+                           sizeof(BatchConfig::requestsInfo),
+                           hipMemcpyHostToDevice,
+                           stream));
+  total_copy_size += sizeof(BatchConfig::requestsInfo);
+
+  // load speculative metadata
+  if (batch_config->get_mode() == BEAM_SEARCH_MODE) {
+    BeamSearchBatchConfig const *beam_batch_config =
+        static_cast<BeamSearchBatchConfig const *>(batch_config);
+
+    checkCUDA(hipMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+                                 total_copy_size,
+                             &(beam_batch_config->beamTokenInfo),
+                             sizeof(BeamSearchBatchConfig::beamTokenInfo),
+                             hipMemcpyHostToDevice,
+                             stream));
+
+    total_copy_size += sizeof(BeamSearchBatchConfig::beamTokenInfo);
+
+    checkCUDA(hipMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+                                 total_copy_size,
+                             &(beam_batch_config->beamRequestsInfo),
+                             sizeof(BeamSearchBatchConfig::beamRequestsInfo),
+                             hipMemcpyHostToDevice,
+                             stream));
+    total_copy_size += sizeof(BeamSearchBatchConfig::beamRequestsInfo);
+
+    checkCUDA(hipMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+                                 total_copy_size,
+                             &(beam_batch_config->causalMask),
+                             sizeof(BatchConfig::causalMask),
+                             hipMemcpyHostToDevice,
+                             stream));
+
+    total_copy_size += sizeof(BatchConfig::causalMask);
+  } else if (batch_config->get_mode() == TREE_VERIFY_MODE) {
+    TreeVerifyBatchConfig const *tree_batch_config =
+        static_cast<TreeVerifyBatchConfig const *>(batch_config);
+
+    checkCUDA(hipMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+                                 total_copy_size,
+                             &(tree_batch_config->causalMask),
+                             sizeof(BatchConfig::causalMask),
+                             hipMemcpyHostToDevice,
+                             stream));
+    total_copy_size += sizeof(BatchConfig::causalMask);
+    checkCUDA(hipMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+                                 total_copy_size,
+                             &(tree_batch_config->committed_tokens),
+                             sizeof(TreeVerifyBatchConfig::committed_tokens),
+                             hipMemcpyHostToDevice,
+                             stream));
+    total_copy_size += sizeof(TreeVerifyBatchConfig::committed_tokens);
+  }
+
+  // add a size check
+  assert(total_copy_size <= handle.batch_config_metadata_size);
+}
+
 void RequestManager::load_positions_task(
     Task const *task,
     std::vector<PhysicalRegion> const &regions,
diff --git a/src/runtime/request_manager.cu b/src/runtime/request_manager.cu
index cd3e03fff6..51c52c3026 100644
--- a/src/runtime/request_manager.cu
+++ b/src/runtime/request_manager.cu
@@ -30,6 +30,7 @@ void RequestManager::load_tokens_task(
 
   // BatchConfig const batch_config = *((BatchConfig *)task->args);
   BatchConfig const *batch_config = BatchConfig::from_future(task->futures[0]);
+
   BatchConfig::TokenId dram_copy[BatchConfig::MAX_NUM_TOKENS];
 
   // Extreme long prompts are not supported, only load up to
@@ -57,6 +58,91 @@ void RequestManager::load_tokens_task(
                             stream));
 }
 
+void RequestManager::load_batch_config_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  assert(regions.size() == 0);
+  assert(task->regions.size() == 0);
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  // BatchConfig const batch_config = *((BatchConfig *)task->args);
+  BatchConfig const *batch_config = BatchConfig::from_future(task->futures[0]);
+
+  // copy meta data to workSpace
+  FFHandler handle = *((FFHandler const *)task->local_args);
+  size_t total_copy_size = 0;
+  checkCUDA(cudaMemcpyAsync(handle.batch_config_metadata,
+                            &(batch_config->tokensInfo),
+                            sizeof(BatchConfig::tokensInfo),
+                            cudaMemcpyHostToDevice,
+                            stream));
+  total_copy_size += sizeof(BatchConfig::tokensInfo);
+
+  checkCUDA(cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
+                                total_copy_size,
+                            &(batch_config->requestsInfo),
+                            sizeof(BatchConfig::requestsInfo),
+                            cudaMemcpyHostToDevice,
+                            stream));
+  total_copy_size += sizeof(BatchConfig::requestsInfo);
+
+  // load speculative metadata
+  if (batch_config->get_mode() == BEAM_SEARCH_MODE) {
+    BeamSearchBatchConfig const *beam_batch_config =
+        static_cast<BeamSearchBatchConfig const *>(batch_config);
+
+    checkCUDA(cudaMemcpyAsync(
+        static_cast<char *>(handle.batch_config_metadata) + total_copy_size,
+        &(beam_batch_config->beamTokenInfo),
+        sizeof(BeamSearchBatchConfig::beamTokenInfo),
+        cudaMemcpyHostToDevice,
+        stream));
+
+    total_copy_size += sizeof(BeamSearchBatchConfig::beamTokenInfo);
+
+    checkCUDA(cudaMemcpyAsync(
+        static_cast<char *>(handle.batch_config_metadata) + total_copy_size,
+        &(beam_batch_config->beamRequestsInfo),
+        sizeof(BeamSearchBatchConfig::beamRequestsInfo),
+        cudaMemcpyHostToDevice,
+        stream));
+    total_copy_size += sizeof(BeamSearchBatchConfig::beamRequestsInfo);
+
+    checkCUDA(cudaMemcpyAsync(
+        static_cast<char *>(handle.batch_config_metadata) + total_copy_size,
+        &(beam_batch_config->causalMask),
+        sizeof(BatchConfig::causalMask),
+        cudaMemcpyHostToDevice,
+        stream));
+
+    total_copy_size += sizeof(BatchConfig::causalMask);
+  } else if (batch_config->get_mode() == TREE_VERIFY_MODE) {
+    TreeVerifyBatchConfig const *tree_batch_config =
+        static_cast<TreeVerifyBatchConfig const *>(batch_config);
+
+    checkCUDA(cudaMemcpyAsync(
+        static_cast<char *>(handle.batch_config_metadata) + total_copy_size,
+        &(tree_batch_config->causalMask),
+        sizeof(BatchConfig::causalMask),
+        cudaMemcpyHostToDevice,
+        stream));
+    total_copy_size += sizeof(BatchConfig::causalMask);
+    checkCUDA(cudaMemcpyAsync(
+        static_cast<char *>(handle.batch_config_metadata) + total_copy_size,
+        &(tree_batch_config->committed_tokens),
+        sizeof(TreeVerifyBatchConfig::committed_tokens),
+        cudaMemcpyHostToDevice,
+        stream));
+    total_copy_size += sizeof(TreeVerifyBatchConfig::committed_tokens);
+  }
+
+  // add a size check
+  assert(total_copy_size <= handle.batch_config_metadata_size);
+}
+
 void RequestManager::load_positions_task(
     Task const *task,
     std::vector<PhysicalRegion> const &regions,

From 3047c82aab223b7ff2f6b49cc5489bd89d5b07af Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Sun, 31 Dec 2023 19:17:30 -0500
Subject: [PATCH 289/344] Reducing memory requirements by reusing logical
 regions (#1254)

* Replicate load_token tasks so that it can be fused with other compute tasks; this eliminates Replicate and enables a larger fused op

* Reuse regions for inference to reduce memory requirement

* bug fix when reused regions are assigned to different pipeline stages
---
 include/flexflow/model.h                |  11 +-
 include/flexflow/ops/fused.h            |  11 +-
 src/mapper/mapper.cc                    |   3 +-
 src/ops/fused.cc                        |  56 ++++++-
 src/ops/fused.cu                        |  31 ++--
 src/ops/inc_multihead_self_attention.cu |  14 ++
 src/runtime/inference_manager.cc        | 190 +++++++++---------------
 src/runtime/model.cc                    | 116 ++++++++-------
 8 files changed, 239 insertions(+), 193 deletions(-)

diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 16df99ab1a..cda1f91c89 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -1034,8 +1034,15 @@ class FFModel {
   void get_metrics();
   void backward(int seq_length = -1);
   void update();
-  bool apply_fusion(std::vector<Op *> const &operators,
-                    std::vector<Op *> &new_operators);
+  bool apply_fusion(
+      std::vector<Op *> const &operators,
+      std::vector<Op *> &new_operators,
+      std::unordered_map<ParallelTensor, std::vector<ParallelTensor>>
+          *parallel_tensor_mapping = nullptr);
+  bool check_operators_integrity(
+      std::vector<Op *> const &old_operators,
+      std::unordered_map<ParallelTensor, std::vector<ParallelTensor>>
+          *pt_mapping = nullptr);
   Op *get_final_operator() const;
   void compile(LossType loss_type,
                std::vector<MetricsType> const &metrics,
diff --git a/include/flexflow/ops/fused.h b/include/flexflow/ops/fused.h
index 87c2201c28..a8326e9ab4 100644
--- a/include/flexflow/ops/fused.h
+++ b/include/flexflow/ops/fused.h
@@ -23,7 +23,16 @@ class FusedOp : public Op {
     SOURCE_OUTPUT,
   };
   FusedOp(FFModel &model, Op *op);
-  bool add_operator(FFModel &model, Op *op);
+  static bool use_same_regions(
+      ParallelTensor const source_tensor,
+      ParallelTensor const target_tensor,
+      std::unordered_map<ParallelTensor, std::vector<ParallelTensor>>
+          *pt_mapping = nullptr);
+  bool add_operator(
+      FFModel &model,
+      Op *op,
+      std::unordered_map<ParallelTensor, std::vector<ParallelTensor>>
+          *parallel_tensor_mapping = nullptr);
   ParallelTensor init_inout(FFModel &model, const ParallelTensor input) {
     assert(0);
     return ParallelTensor();
diff --git a/src/mapper/mapper.cc b/src/mapper/mapper.cc
index a86a6167a6..a2fb1d89be 100644
--- a/src/mapper/mapper.cc
+++ b/src/mapper/mapper.cc
@@ -934,13 +934,14 @@ void FFMapper::map_inline(const MapperContext ctx,
                              &footprint)) {
     log_ff_mapper.error(
         "FlexFlow Mapper failed allocation of size %zd bytes"
-        " for region requirement of inline ammping in task %s (UID %lld)"
+        " for region requirement of inline mapping in task %s (UID %lld)"
         " in memory " IDFMT "for processor " IDFMT ".",
         footprint,
         inline_op.parent_task->get_task_name(),
         inline_op.parent_task->get_unique_id(),
         target_memory.id,
         inline_op.parent_task->current_proc.id);
+    printf("target_memory.kind() = %d\n", target_memory.kind());
     assert(false);
   } else {
     output.chosen_instances.push_back(result);
diff --git a/src/ops/fused.cc b/src/ops/fused.cc
index 1d5db2f461..9ad5c4dc9c 100644
--- a/src/ops/fused.cc
+++ b/src/ops/fused.cc
@@ -115,7 +115,42 @@ FusedOp::FusedOp(FFModel &model, Op *op)
   }
 }
 
-bool FusedOp::add_operator(FFModel &model, Op *op) {
+bool FusedOp::use_same_regions(
+    ParallelTensor const source_tensor,
+    ParallelTensor const target_tensor,
+    std::unordered_map<ParallelTensor, std::vector<ParallelTensor>>
+        *pt_mapping) {
+  if (pt_mapping == nullptr) {
+    return (source_tensor->region == target_tensor->region);
+  } else {
+    assert(pt_mapping->find(source_tensor) != pt_mapping->end());
+    assert(pt_mapping->find(target_tensor) != pt_mapping->end());
+    std::vector<ParallelTensor> const &source_mapped_tensor_vector =
+        (*pt_mapping)[source_tensor];
+    std::vector<ParallelTensor> const &target_mapped_tensor_vector =
+        (*pt_mapping)[target_tensor];
+    assert(source_mapped_tensor_vector.size() ==
+           target_mapped_tensor_vector.size());
+    bool same_region = source_mapped_tensor_vector[0]->region ==
+                               target_mapped_tensor_vector[0]->region
+                           ? true
+                           : false;
+    // Same that the two vectors use the exact same regions
+    if (same_region) {
+      for (size_t i = 0; i < source_mapped_tensor_vector.size(); i++) {
+        assert(source_mapped_tensor_vector[i]->region ==
+               target_mapped_tensor_vector[i]->region);
+      }
+    }
+    return same_region;
+  }
+}
+
+bool FusedOp::add_operator(
+    FFModel &model,
+    Op *op,
+    std::unordered_map<ParallelTensor, std::vector<ParallelTensor>>
+        *pt_mapping) {
   // Context ctx = model.config.lg_ctx;
   // Runtime* runtime = model.config.lg_hlr;
   //  Currently assume fusion optimization is performed
@@ -164,7 +199,7 @@ bool FusedOp::add_operator(FFModel &model, Op *op) {
   for (int i = 0; i < op->numInputs; i++) {
     bool found = false;
     for (int j = 0; j < numInputs; j++) {
-      if (inputs[j]->region == op->inputs[i]->region) {
+      if (use_same_regions(inputs[j], op->inputs[i], pt_mapping)) {
         // This input is one of my inputs
         assert(!found);
         assert(inputs[j]->region != LogicalRegion::NO_REGION);
@@ -175,7 +210,7 @@ bool FusedOp::add_operator(FFModel &model, Op *op) {
       }
     }
     for (int j = 0; j < numOutputs; j++) {
-      if ((outputs[j]->region == op->inputs[i]->region) && (!found)) {
+      if (use_same_regions(outputs[j], op->inputs[i], pt_mapping) && (!found)) {
         // This input is one of my outputs
         assert(!found);
         assert(outputs[j]->region != LogicalRegion::NO_REGION);
@@ -201,6 +236,11 @@ bool FusedOp::add_operator(FFModel &model, Op *op) {
   for (int i = 0; i < op->numWeights; i++) {
     bool found = false;
     for (int j = 0; j < numWeights; j++) {
+      // pt_mapping does not apply to weights
+      if (pt_mapping != nullptr) {
+        assert(pt_mapping->find(weights[j]) == pt_mapping->end());
+        assert(pt_mapping->find(op->weights[i]) == pt_mapping->end());
+      }
       if (weights[j]->region == op->weights[i]->region) {
         assert(!found);
         assert(weights[j]->region != LogicalRegion::NO_REGION);
@@ -226,7 +266,7 @@ bool FusedOp::add_operator(FFModel &model, Op *op) {
   for (int i = 0; i < op->numOutputs; i++) {
     bool found = false;
     for (int j = 0; j < numOutputs; j++) {
-      if (outputs[j]->region == op->outputs[i]->region) {
+      if (use_same_regions(outputs[j], op->outputs[i], pt_mapping)) {
         assert(!found);
         found = true;
         op_output_source[output_offset + i] = SOURCE_OUTPUT;
@@ -347,22 +387,26 @@ void FusedOp::init_inference(FFModel const &ff,
   Domain domain = runtime->get_index_space_domain(ctx, parallel_is);
   int ioff = 0, ooff = 0;
   for (int op = 0; op < numOperators; op++) {
-    // prepare batch_inputs, batch_outputs for operators[i]
+    // prepare batch_inputs, batch_outputs for operators[op]
     std::vector<ParallelTensor> my_batch_inputs;
     std::vector<ParallelTensor> my_batch_outputs;
     for (int i = 0; i < op_num_inputs[op]; i++) {
       int my_off = op_input_idx[i + ioff];
       if (op_input_source[i + ioff] == SOURCE_INPUT) {
+        assert(my_off < batch_inputs.size());
         my_batch_inputs.push_back(batch_inputs[my_off]);
       } else if (op_input_source[i + ioff] == SOURCE_OUTPUT) {
+        assert(my_off < batch_outputs.size());
         my_batch_inputs.push_back(batch_outputs[my_off]);
       } else {
         assert(false);
       }
     }
     for (int i = 0; i < op_num_outputs[op]; i++) {
+      int my_off = op_output_idx[i + ooff];
       assert(op_output_source[i + ooff] == SOURCE_OUTPUT);
-      my_batch_outputs.push_back(batch_outputs[i + ooff]);
+      assert(my_off < batch_outputs.size());
+      my_batch_outputs.push_back(batch_outputs[my_off]);
     }
     ioff += op_num_inputs[op];
     ooff += op_num_outputs[op];
diff --git a/src/ops/fused.cu b/src/ops/fused.cu
index b157453035..c6ba0b04c5 100644
--- a/src/ops/fused.cu
+++ b/src/ops/fused.cu
@@ -173,10 +173,11 @@ __host__ void FusedOp::forward_task(Task const *task,
       my_weight_accessor[i] = weight_accessor[fused->op_weight_idx[i + woff]];
     }
     for (int i = 0; i < fused->op_num_outputs[op]; i++) {
+      int my_off = fused->op_output_idx[i + ooff];
       assert(fused->op_output_source[i + ooff] == SOURCE_OUTPUT);
-      // my_od[i] = output_domain[fused->op_output_idx[i + ooff]];
-      // my_op[i] = output_ptr[fused->op_output_idx[i + ooff]];
-      my_output_accessor[i] = output_accessor[i + ooff];
+      // my_od[i] = output_domain[my_off];
+      // my_op[i] = output_ptr[my_off];
+      my_output_accessor[i] = output_accessor[my_off];
     }
     switch (fused->op_op_type[op]) {
       case OP_CONCAT: {
@@ -619,9 +620,11 @@ __host__ void
       int my_off = fused->op_input_idx[i + ioff];
       if (fused->op_input_source[i + ioff] == SOURCE_INPUT) {
         // my_id[i] = input_domain[my_off];
+        assert(my_off < fused->numInputs);
         my_input_accessor[i] = input_accessor[my_off];
       } else if (fused->op_input_source[i + ioff] == SOURCE_OUTPUT) {
         // my_id[i] = output_domain[my_off];
+        assert(my_off < fused->numOutputs);
         my_input_accessor[i] = output_accessor[my_off];
       } else {
         assert(false);
@@ -631,13 +634,16 @@ __host__ void
       assert(fused->op_weight_source[i + woff] == SOURCE_WEIGHT);
       // my_wd[i] = weight_domain[fused->op_weight_idx[i + woff]];
       // my_wp[i] = weight_ptr[fused->op_weight_idx[i + woff]];
+      assert(fused->op_weight_idx[i + woff] < fused->numWeights);
       my_weight_accessor[i] = weight_accessor[fused->op_weight_idx[i + woff]];
     }
     for (int i = 0; i < fused->op_num_outputs[op]; i++) {
+      int my_off = fused->op_output_idx[i + ooff];
       assert(fused->op_output_source[i + ooff] == SOURCE_OUTPUT);
+      assert(my_off < fused->numOutputs);
       // my_od[i] = output_domain[fused->op_output_idx[i + ooff]];
       // my_op[i] = output_ptr[fused->op_output_idx[i + ooff]];
-      my_output_accessor[i] = output_accessor[i + ooff];
+      my_output_accessor[i] = output_accessor[my_off];
     }
     switch (fused->op_op_type[op]) {
       case OP_CONCAT: {
@@ -1108,7 +1114,8 @@ __host__ void
             weight_accessor[fused->op_weight_idx[i + woff]]);
       }
       for (int i = 0; i < fused->op_num_outputs[op]; i++) {
-        output_accessors_to_save.push_back(output_accessor[i + ooff]);
+        int my_off = fused->op_output_idx[i + ooff];
+        output_accessors_to_save.push_back(output_accessor[my_off]);
       }
       assert(task->index_point.get_dim() == 1);
       int shard_id = task->index_point.point_data[0];
@@ -1310,13 +1317,13 @@ __host__ void FusedOp::backward_task(Task const *task,
     }
     for (int i = 0; i < fused->op_num_outputs[op]; i++) {
       assert(fused->op_output_source[i + ooff] == SOURCE_OUTPUT);
-      // my_od[i] = output_domain[fused->op_output_idx[i + ooff]];
-      // my_op[i] = output_ptr[fused->op_output_idx[i + ooff]];
-      my_output_accessor[i] = output_accessor[fused->op_output_idx[i + ooff]];
-      // my_grad_od[i] = output_grad_domain[fused->op_output_idx[i + ooff]];
-      // my_grad_op[i] = output_grad_ptr[fused->op_output_idx[i + ooff]];
-      my_output_grad_accessor[i] =
-          output_grad_accessor[fused->op_output_idx[i + ooff]];
+      int my_off = fused->op_output_idx[i + ooff];
+      // my_od[i] = output_domain[my_off];
+      // my_op[i] = output_ptr[my_off];
+      my_output_accessor[i] = output_accessor[my_off];
+      // my_grad_od[i] = output_grad_domain[my_off];
+      // my_grad_op[i] = output_grad_ptr[my_off];
+      my_output_grad_accessor[i] = output_grad_accessor[my_off];
       assert(my_output_grad_accessor[i].domain == my_output_accessor[i].domain);
     }
     switch (fused->op_op_type[op]) {
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index da70e23f87..db64868cb9 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -1530,4 +1530,18 @@ template void Kernels::IncMultiHeadAttention::compute_o_prod_bias<half>(
     half const *bias_ptr,
     int num_tokens,
     cudaStream_t stream);
+
+template void
+    Kernels::IncMultiHeadAttention::compute_attention_kernel_generation<float>(
+        IncMultiHeadSelfAttentionMeta const *m,
+        BatchConfig const *bc,
+        float *output_ptr,
+        cudaStream_t stream);
+
+template void
+    Kernels::IncMultiHeadAttention::compute_attention_kernel_generation<half>(
+        IncMultiHeadSelfAttentionMeta const *m,
+        BatchConfig const *bc,
+        half *output_ptr,
+        cudaStream_t stream);
 }; // namespace FlexFlow
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 8af0ed8978..cc76da58bb 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -151,7 +151,9 @@ void InferenceManager::compile_model_and_allocate_buffer(FFModel *model) {
 
       std::vector<ParallelTensor> list;
       bool found_parallel_tensor = false;
-      if (model->cpu_offload) {
+      // Always enable memory reuse
+      // if (model->cpu_offload) {
+      if (true) {
         for (auto const &pre_pt : tensor_buffer) {
           bool used_by_future_operator = false;
           bool used_by_current_operator = false;
@@ -159,6 +161,12 @@ void InferenceManager::compile_model_and_allocate_buffer(FFModel *model) {
             // Continue if shape mismatches
             continue;
           }
+          // Skip if pre_pt and pt_base are in different pipeline stages
+          // we compare their pipeline stages using the machine views
+          // of the first data pipeline
+          if (pre_pt.second[0]->machine_view != machine_views[0]) {
+            continue;
+          }
           // Check that pt cannot be used as an input to the current operator
           for (int j = 0; j < op->numInputs; j++) {
             if (parallel_tensor_list_overlaps(tensor_buffer[op->inputs[j]],
@@ -221,6 +229,67 @@ void InferenceManager::compile_model_and_allocate_buffer(FFModel *model) {
     }
     // std::cout << std::endl;
   }
+
+  // Perform fusion optimizations
+  if (model->config.perform_fusion) {
+    fprintf(stderr, "Applying fusion optimizations during compilation...\n");
+    fprintf(
+        stderr, "%zu operators before fusion...\n", model->operators.size());
+    std::vector<Op *> new_operators;
+    std::vector<Op *> old_operators = model->operators;
+    while (
+        model->apply_fusion(model->operators, new_operators, &tensor_buffer)) {
+      for (size_t i = 0; i < new_operators.size(); i++) {
+        for (int idx = 0; idx < new_operators[i]->numInputs; idx++) {
+          for (size_t j = i + 1; j < new_operators.size(); j++) {
+            if (new_operators[i]->inputs[idx]->owner_op == new_operators[j]) {
+              assert(false);
+            }
+          }
+        }
+      }
+      model->operators = new_operators;
+    }
+    assert(model->check_operators_integrity(old_operators, &tensor_buffer));
+    fprintf(stderr, "%zu operators after fusion...\n", model->operators.size());
+  }
+
+  // print optimized graph
+  for (size_t i = 0; i < model->operators.size(); i++) {
+    Op *op = model->operators[i];
+    if (op->op_type == OP_INPUT || op->op_type == OP_WEIGHT) {
+      continue;
+    }
+    printf("operator[%zu]: type(%s) guid(%lu)\n",
+           i,
+           get_operator_type_name(model->operators[i]->op_type).c_str(),
+           model->operators[i]->op_guid);
+    for (int j = 0; j < op->numInputs; j++) {
+      assert(tensor_buffer.find(op->inputs[j]) != tensor_buffer.end());
+      LogicalRegion handle = tensor_buffer[op->inputs[j]][0]->region;
+      printf("\tinputs[%d] mapped_region(%d,%d,%d)\n",
+             j,
+             handle.get_index_space().get_id(),
+             handle.get_field_space().get_id(),
+             handle.get_tree_id());
+    }
+    for (int j = 0; j < op->numOutputs; j++) {
+      LogicalRegion handle = tensor_buffer[op->outputs[j]][0]->region;
+      printf("\toutputs[%d] mapped_region(%d,%d,%d)\n",
+             j,
+             handle.get_index_space().get_id(),
+             handle.get_field_space().get_id(),
+             handle.get_tree_id());
+    }
+    for (int j = 0; j < op->numWeights; j++) {
+      LogicalRegion handle = op->weights[j]->region;
+      printf("\tweights[%d] mapped_region(%d,%d,%d)\n",
+             j,
+             handle.get_index_space().get_id(),
+             handle.get_field_space().get_id(),
+             handle.get_tree_id());
+    }
+  }
 }
 
 void InferenceManager::init_operators_inference(FFModel *model) {
@@ -577,124 +646,7 @@ void FFModel::compile_inference() {
       assert(op->outputs[i]->parallel_tensor_guid != 0);
     }
   }
-  // Perform fusion optimizations
-  if (config.perform_fusion) {
-    fprintf(stderr, "Applying fusion optimizations during compilation...\n");
-    fprintf(stderr, "%zu operators before fusion...\n", operators.size());
-    std::vector<Op *> new_operators;
-    std::vector<Op *> old_operators = operators;
-    while (apply_fusion(operators, new_operators)) {
-      for (size_t i = 0; i < new_operators.size(); i++) {
-        for (int idx = 0; idx < new_operators[i]->numInputs; idx++) {
-          for (size_t j = i + 1; j < new_operators.size(); j++) {
-            if (new_operators[i]->inputs[idx]->owner_op == new_operators[j]) {
-              assert(false);
-            }
-          }
-        }
-      }
-      operators = new_operators;
-    }
-    // Check integrity
-    for (size_t l = 0; l < operators.size(); l++) {
-      if (operators[l]->op_type == OP_FUSED) {
-        FusedOp *fused = (FusedOp *)operators[l];
-        int ioff = 0, woff = 0, ooff = 0;
-        for (int op = 0; op < fused->numOperators; op++) {
-          Op *old_op = fused->operators[op];
-          for (int i = 0; i < fused->op_num_inputs[op]; i++) {
-            int my_off = fused->op_input_idx[i + ioff];
-            if (fused->op_input_source[i + ioff] == FusedOp::SOURCE_INPUT) {
-              assert(fused->inputs[my_off]->region ==
-                     old_op->inputs[i]->region);
-            } else if (fused->op_input_source[i + ioff] ==
-                       FusedOp::SOURCE_OUTPUT) {
-              assert(fused->outputs[my_off]->region ==
-                     old_op->inputs[i]->region);
-            } else {
-              assert(false);
-            }
-          }
-          for (int i = 0; i < fused->op_num_weights[op]; i++) {
-            int my_off = fused->op_weight_idx[i + woff];
-            assert(fused->op_weight_source[i + woff] == FusedOp::SOURCE_WEIGHT);
-            assert(fused->weights[my_off]->region ==
-                   old_op->weights[i]->region);
-          }
-          for (int i = 0; i < fused->op_num_outputs[op]; i++) {
-            int my_off = fused->op_output_idx[i + ooff];
-            assert(fused->op_output_source[i + ooff] == FusedOp::SOURCE_OUTPUT);
-            assert(fused->outputs[my_off]->region ==
-                   old_op->outputs[i]->region);
-          }
-          ioff += fused->op_num_inputs[op];
-          woff += fused->op_num_weights[op];
-          ooff += fused->op_num_outputs[op];
-        }
-      } else {
-        bool found = false;
-        for (size_t i = 0; i < old_operators.size(); i++) {
-          if (old_operators[i] == operators[l]) {
-            assert(!found);
-            found = true;
-          }
-        }
-        assert(found);
-      }
-    }
-    fprintf(stderr, "%zu operators after fusion...\n", operators.size());
-    for (size_t i = 0; i < operators.size(); i++) {
-      Op *op = operators[i];
-      printf("operator[%zu]: type(%s) guid(%lu)\n",
-             i,
-             get_operator_type_name(operators[i]->op_type).c_str(),
-             operators[i]->op_guid);
-      for (int j = 0; j < op->numInputs; j++) {
-        LogicalRegion handle = op->inputs[j]->region;
-        printf("\tinputs[%d] region(%d,%d,%d)\n",
-               j,
-               handle.get_index_space().get_id(),
-               handle.get_field_space().get_id(),
-               handle.get_tree_id());
-      }
-      for (int j = 0; j < op->numOutputs; j++) {
-        LogicalRegion handle = op->outputs[j]->region;
-        printf("\toutputs[%d] region(%d,%d,%d)\n",
-               j,
-               handle.get_index_space().get_id(),
-               handle.get_field_space().get_id(),
-               handle.get_tree_id());
-      }
-      for (int j = 0; j < op->numWeights; j++) {
-        LogicalRegion handle = op->weights[j]->region;
-        printf("\tweights[%d] region(%d,%d,%d)\n",
-               j,
-               handle.get_index_space().get_id(),
-               handle.get_field_space().get_id(),
-               handle.get_tree_id());
-      }
-    }
-  }
-  for (size_t i = 0; i < operators.size(); i++) {
-    Op *op = operators[i];
-    printf("operator[%zu]: type(%d)\n", i, operators[i]->op_type);
-    for (int j = 0; j < op->numInputs; j++) {
-      LogicalRegion handle = op->inputs[j]->region;
-      printf("\tinputs[%d] region(%d,%d,%d)\n",
-             j,
-             handle.get_index_space().get_id(),
-             handle.get_field_space().get_id(),
-             handle.get_tree_id());
-    }
-    for (int j = 0; j < op->numOutputs; j++) {
-      LogicalRegion handle = op->outputs[j]->region;
-      printf("\toutputs[%d] region(%d,%d,%d)\n",
-             j,
-             handle.get_index_space().get_id(),
-             handle.get_field_space().get_id(),
-             handle.get_tree_id());
-    }
-  }
+
 #ifdef FF_USE_NCCL
   for (size_t l = 0; l < operators.size(); l++) {
     // Only create nccl for allreduce and fusedop for inference
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 37605c44a4..3bfe429ddd 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -2859,8 +2859,11 @@ void FFModel::compile(Optimizer *_optimizer,
   compile(loss_type, metrics, comp_mode);
 }
 
-bool FFModel::apply_fusion(std::vector<Op *> const &operators,
-                           std::vector<Op *> &new_operators) {
+bool FFModel::apply_fusion(
+    std::vector<Op *> const &operators,
+    std::vector<Op *> &new_operators,
+    std::unordered_map<ParallelTensor, std::vector<ParallelTensor>>
+        *parallel_tensor_mapping) {
   // Context ctx = config.lg_ctx;
   // Runtime* runtime = config.lg_hlr;
   for (size_t l = 1; l < operators.size() - 1; l++) {
@@ -2925,7 +2928,8 @@ bool FFModel::apply_fusion(std::vector<Op *> const &operators,
           fused_op = new FusedOp(*this, operators[i]);
           allocate_new_fused_op = true;
         }
-        if (fused_op->add_operator(*this, operators[l])) {
+        if (fused_op->add_operator(
+                *this, operators[l], parallel_tensor_mapping)) {
           // Construct new operators
           new_operators.clear();
           for (size_t j = 0; j < i; j++) {
@@ -2943,7 +2947,9 @@ bool FFModel::apply_fusion(std::vector<Op *> const &operators,
                   (op->inputs[idx]->owner_op == operators[i])) {
                 int found = -1;
                 for (int k = 0; k < fused_op->numOutputs; k++) {
-                  if (fused_op->outputs[k]->region == op->inputs[idx]->region) {
+                  if (fused_op->use_same_regions(fused_op->outputs[k],
+                                                 op->inputs[idx],
+                                                 parallel_tensor_mapping)) {
                     assert(found == -1);
                     found = k;
                   }
@@ -2959,7 +2965,6 @@ bool FFModel::apply_fusion(std::vector<Op *> const &operators,
           assert(new_operators.size() + 1 == operators.size());
           return true;
         } else {
-          // TODO: delete fused_op to avoid memory leakage
           if (allocate_new_fused_op) {
             delete fused_op;
           }
@@ -3490,53 +3495,7 @@ void FFModel::compile(LossType loss_type,
       }
       operators = new_operators;
     }
-    // Check integrity
-    for (size_t l = 0; l < operators.size(); l++) {
-      if (operators[l]->op_type == OP_FUSED) {
-        FusedOp *fused = (FusedOp *)operators[l];
-        int ioff = 0, woff = 0, ooff = 0;
-        for (int op = 0; op < fused->numOperators; op++) {
-          Op *old_op = fused->operators[op];
-          for (int i = 0; i < fused->op_num_inputs[op]; i++) {
-            int my_off = fused->op_input_idx[i + ioff];
-            if (fused->op_input_source[i + ioff] == FusedOp::SOURCE_INPUT) {
-              assert(fused->inputs[my_off]->region ==
-                     old_op->inputs[i]->region);
-            } else if (fused->op_input_source[i + ioff] ==
-                       FusedOp::SOURCE_OUTPUT) {
-              assert(fused->outputs[my_off]->region ==
-                     old_op->inputs[i]->region);
-            } else {
-              assert(false);
-            }
-          }
-          for (int i = 0; i < fused->op_num_weights[op]; i++) {
-            int my_off = fused->op_weight_idx[i + woff];
-            assert(fused->op_weight_source[i + woff] == FusedOp::SOURCE_WEIGHT);
-            assert(fused->weights[my_off]->region ==
-                   old_op->weights[i]->region);
-          }
-          for (int i = 0; i < fused->op_num_outputs[op]; i++) {
-            int my_off = fused->op_output_idx[i + ooff];
-            assert(fused->op_output_source[i + ooff] == FusedOp::SOURCE_OUTPUT);
-            assert(fused->outputs[my_off]->region ==
-                   old_op->outputs[i]->region);
-          }
-          ioff += fused->op_num_inputs[op];
-          woff += fused->op_num_weights[op];
-          ooff += fused->op_num_outputs[op];
-        }
-      } else {
-        bool found = false;
-        for (size_t i = 0; i < old_operators.size(); i++) {
-          if (old_operators[i] == operators[l]) {
-            assert(!found);
-            found = true;
-          }
-        }
-        assert(found);
-      }
-    }
+    assert(check_operators_integrity(old_operators));
     fprintf(stderr, "%zu operators after fusion...\n", operators.size());
     for (size_t i = 0; i < operators.size(); i++) {
       Op *op = operators[i];
@@ -3678,6 +3637,59 @@ void FFModel::compile(LossType loss_type,
 #endif
 }
 
+bool FFModel::check_operators_integrity(
+    std::vector<Op *> const &old_operators,
+    std::unordered_map<ParallelTensor, std::vector<ParallelTensor>>
+        *pt_mapping) {
+  // Check integrity
+  for (size_t l = 0; l < operators.size(); l++) {
+    if (operators[l]->op_type == OP_FUSED) {
+      FusedOp *fused = (FusedOp *)operators[l];
+      int ioff = 0, woff = 0, ooff = 0;
+      for (int op = 0; op < fused->numOperators; op++) {
+        Op *old_op = fused->operators[op];
+        for (int i = 0; i < fused->op_num_inputs[op]; i++) {
+          int my_off = fused->op_input_idx[i + ioff];
+          if (fused->op_input_source[i + ioff] == FusedOp::SOURCE_INPUT) {
+            assert(FusedOp::use_same_regions(
+                fused->inputs[my_off], old_op->inputs[i], pt_mapping));
+          } else if (fused->op_input_source[i + ioff] ==
+                     FusedOp::SOURCE_OUTPUT) {
+            assert(FusedOp::use_same_regions(
+                fused->outputs[my_off], old_op->inputs[i], pt_mapping));
+          } else {
+            assert(false);
+          }
+        }
+        for (int i = 0; i < fused->op_num_weights[op]; i++) {
+          int my_off = fused->op_weight_idx[i + woff];
+          assert(fused->op_weight_source[i + woff] == FusedOp::SOURCE_WEIGHT);
+          assert(fused->weights[my_off]->region == old_op->weights[i]->region);
+        }
+        for (int i = 0; i < fused->op_num_outputs[op]; i++) {
+          int my_off = fused->op_output_idx[i + ooff];
+          assert(fused->op_output_source[i + ooff] == FusedOp::SOURCE_OUTPUT);
+          assert(FusedOp::use_same_regions(
+              fused->outputs[my_off], old_op->outputs[i], pt_mapping));
+        }
+        ioff += fused->op_num_inputs[op];
+        woff += fused->op_num_weights[op];
+        ooff += fused->op_num_outputs[op];
+      }
+    } else {
+      bool found = false;
+      for (size_t i = 0; i < old_operators.size(); i++) {
+        if (old_operators[i] == operators[l]) {
+          assert(!found);
+          found = true;
+        }
+      }
+      assert(found);
+    }
+  }
+  return true;
+}
+
 struct PropagationEdgeInfo {
   Op *dstOp;
   size_t size;

From 1901f65bc2045860d4c26c26c2a158b270cb300a Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Sun, 31 Dec 2023 23:25:21 -0500
Subject: [PATCH 290/344] embedding return when no token

---
 src/ops/embedding.cc | 5 +++++
 1 file changed, 5 insertions(+)

diff --git a/src/ops/embedding.cc b/src/ops/embedding.cc
index 76236e65ff..3be3eac618 100644
--- a/src/ops/embedding.cc
+++ b/src/ops/embedding.cc
@@ -478,6 +478,7 @@ FutureMap Embedding::inference(FFModel const &ff,
                          0 /*mapper_id*/,
                          machine_view_hash);
   // regions[0]: input
+  launcher.add_future(bc);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection*/,
                                                     READ_ONLY,
@@ -516,6 +517,10 @@ void Embedding::forward_task(Task const *task,
   assert(task->regions.size() == 3);
   // Assert that weight and output must have the same data type
   // otherwise, a cast operator should be inserted
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_active_tokens() == 0) {
+    return;
+  }
   assert(m->weight_type[0] == m->output_type[0]);
   assert(m->input_type[0] == DT_INT32 || m->input_type[0] == DT_INT64);
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(

From 130ad92f8369d6ba39dd470dafd160b844e49e99 Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Mon, 1 Jan 2024 01:39:41 -0500
Subject: [PATCH 291/344] use arg topk instead of beam topk

---
 include/flexflow/flexflow_c.h          |   1 +
 include/flexflow/model.h               |   2 +
 include/flexflow/ops/arg_topk.h        |  16 ++-
 include/flexflow/ops/arg_topk_params.h |   1 +
 inference/models/llama.cc              |   2 +-
 python/flexflow/core/flexflow_cffi.py  |   5 +-
 src/c/flexflow_c.cc                    |   4 +-
 src/ops/arg_topk.cc                    | 185 +++++++++++++++++++------
 src/ops/arg_topk.cu                    |  91 +++++++++---
 src/runtime/model.cc                   |  18 +++
 10 files changed, 258 insertions(+), 67 deletions(-)

diff --git a/include/flexflow/flexflow_c.h b/include/flexflow/flexflow_c.h
index 01a2818a2b..305c8da513 100644
--- a/include/flexflow/flexflow_c.h
+++ b/include/flexflow/flexflow_c.h
@@ -571,6 +571,7 @@ flexflow_tensor_t flexflow_model_add_arg_top_k(flexflow_model_t handle_,
                                                const flexflow_tensor_t input_,
                                                int k,
                                                bool sorted,
+                                               bool speculative_decoding,
                                                char const *name);
 
 flexflow_tensor_t flexflow_model_add_beam_top_k(flexflow_model_t handle_,
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 16df99ab1a..01244a371b 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -146,6 +146,7 @@ enum TaskIDs {
   TOPK_BWD_TASK_ID,
   ARG_TOPK_INIT_TASK_ID,
   ARG_TOPK_INF_TASK_ID,
+  ARG_TOPK_INF_SPECULATIVE_TASK_ID,
   SAMPLING_INIT_TASK_ID,
   SAMPLING_INF_TASK_ID,
   ARGMAX_INIT_TASK_ID,
@@ -674,6 +675,7 @@ class FFModel {
                    // Tensor *outputs,
                    int k,
                    bool sorted,
+                   bool speculative_decoding,
                    char const *name = NULL);
   Tensor argmax(const Tensor input, bool beam_search, char const *name = NULL);
   Tensor sampling(const Tensor input, float top_p, char const *name = NULL);
diff --git a/include/flexflow/ops/arg_topk.h b/include/flexflow/ops/arg_topk.h
index 8b2d2aa11c..3822a5e41e 100644
--- a/include/flexflow/ops/arg_topk.h
+++ b/include/flexflow/ops/arg_topk.h
@@ -12,6 +12,8 @@ class ArgTopKMeta : public OpMeta {
 public:
   ArgTopKMeta(FFHandler handle, Op const *op);
   bool sorted;
+  int k;
+  bool speculative_decoding;
 };
 
 class ArgTopK : public Op {
@@ -23,6 +25,7 @@ class ArgTopK : public Op {
           const ParallelTensor input,
           int k,
           bool sorted,
+          bool speculative_decoding,
           char const *name);
   ArgTopK(FFModel &model,
           LayerID const &layer_guid,
@@ -61,6 +64,11 @@ class ArgTopK : public Op {
                      std::vector<Legion::PhysicalRegion> const &regions,
                      Legion::Context ctx,
                      Legion::Runtime *runtime);
+  static BeamInferenceResult inference_speculative_task(
+      Legion::Task const *task,
+      std::vector<Legion::PhysicalRegion> const &regions,
+      Legion::Context ctx,
+      Legion::Runtime *runtime);
   void serialize(Legion::Serializer &s) const override;
   static PCG::Node deserialize(FFModel &ff,
                                Legion::Deserializer &d,
@@ -75,22 +83,26 @@ class ArgTopK : public Op {
   template <typename DT>
   static void forward_kernel(ArgTopKMeta const *m,
                              DT const *input_ptr,
-                             // float *output_ptr,
+                             float *output_ptr,
                              int *indices_ptr,
                              size_t batch_size,
                              int length,
                              int k,
                              bool sorted,
+                             BeamSearchBatchConfig const *bc,
                              ffStream_t stream);
   static void forward_kernel_wrapper(ArgTopKMeta const *m,
                                      GenericTensorAccessorR const &input,
+                                     GenericTensorAccessorW const &prob,
                                      GenericTensorAccessorW const &indices,
-                                     int batch_size);
+                                     int batch_size,
+                                     BeamSearchBatchConfig const *bc);
   Params get_params() const;
 
 public:
   int k;
   bool sorted;
+  bool speculative_decoding;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/ops/arg_topk_params.h b/include/flexflow/ops/arg_topk_params.h
index 9d2a21034f..bd9c38e2a9 100644
--- a/include/flexflow/ops/arg_topk_params.h
+++ b/include/flexflow/ops/arg_topk_params.h
@@ -11,6 +11,7 @@ struct ArgTopKParams {
   LayerID layer_guid;
   int k;
   bool sorted;
+  bool speculative_decoding;
   bool is_valid(ParallelTensorShape const &) const;
 };
 bool operator==(ArgTopKParams const &, ArgTopKParams const &);
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index 10001ee916..e9c84efe90 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -247,7 +247,7 @@ void LLAMA::create_llama_model(FFModel &ff,
     Tensor softmax = ff.softmax(dense, -1);
     // output = ff.beam_top_k(softmax, llama_config.max_beam_width, false);
     // output = ff.argmax(softmax, /*beam_Search*/ true);
-    output = ff.beam_top_k(softmax, llama_config.max_beam_width, false);
+    output = ff.arg_top_k(softmax, llama_config.max_beam_width, false, true);
     // output = ff.top_k(softmax, )
   } else {
     // Tensor softmax = ff.softmax(dense, -1);
diff --git a/python/flexflow/core/flexflow_cffi.py b/python/flexflow/core/flexflow_cffi.py
index de3f7e6929..a3c221474d 100644
--- a/python/flexflow/core/flexflow_cffi.py
+++ b/python/flexflow/core/flexflow_cffi.py
@@ -3349,7 +3349,7 @@ def residual_rms_norm(self, input1, input2, eps, dim, name=None):
             handles_array[1], owner_op_type=OpType.RESIDUAL_RMS_NORM
         )
 
-    def arg_top_k(self, input, k, sorted, name=None):
+    def arg_top_k(self, input, k, sorted, speculative_decoding, name=None):
         """Defines the Arg TopK layer.
 
         :param input: the input Tensor.
@@ -3361,6 +3361,9 @@ def arg_top_k(self, input, k, sorted, name=None):
         :param sorted: Whether the entries should be sorted
         :type sorted: bool
 
+        :param speculative_decoding: Whether you need to perform beam search
+        :type speculative_decoding: bool
+
         :param name: the name of the layer. Default is None.
         :type name: string
 
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index 80202f6f99..579fc5e2d1 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -1489,10 +1489,12 @@ flexflow_tensor_t flexflow_model_add_arg_top_k(flexflow_model_t handle_,
                                                const flexflow_tensor_t input_,
                                                int k,
                                                bool sorted,
+                                               bool speculative_decoding,
                                                char const *name) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
   Tensor input = FFCObjectWrapper::unwrap(input_);
-  Tensor tensor = handle->arg_top_k(input, k, sorted, name);
+  Tensor tensor =
+      handle->arg_top_k(input, k, sorted, speculative_decoding, name);
   return FFCObjectWrapper::wrap(tensor);
 }
 
diff --git a/src/ops/arg_topk.cc b/src/ops/arg_topk.cc
index a06b89de07..2727a1d249 100644
--- a/src/ops/arg_topk.cc
+++ b/src/ops/arg_topk.cc
@@ -51,6 +51,7 @@ using PCG::Node;
 Tensor FFModel::arg_top_k(const Tensor input,
                           int k,
                           bool sorted,
+                          bool speculative_decoding,
                           char const *name) {
   Layer *li = new Layer(this,
                         OP_ARG_TOPK,
@@ -58,7 +59,7 @@ Tensor FFModel::arg_top_k(const Tensor input,
                         name,
                         1 /*inputs*/,
                         0 /*weights*/,
-                        1 /*outputs*/,
+                        speculative_decoding ? 2 : 1 /*outputs*/,
                         input);
   {
     int numdims = input->num_dims;
@@ -71,9 +72,14 @@ Tensor FFModel::arg_top_k(const Tensor input,
     //     numdims, dims, input->data_type, li, 0, true /*create_grad*/);
     li->outputs[0] = create_tensor_legion_ordering(
         numdims, dims, DT_INT32, li, 0, false /*create_grad*/);
+    if (speculative_decoding) {
+      li->outputs[1] = create_tensor_legion_ordering(
+          numdims, dims, DT_FLOAT, li, 1, false /*create_grad*/);
+    }
   }
   li->add_int_property("k", k);
   li->add_int_property("sorted", sorted);
+  li->add_int_property("speculative_decoding", speculative_decoding);
   layers.push_back(li);
   // outputs[0] = li->outputs[0];
   // outputs[1] = li->outputs[1];
@@ -89,14 +95,23 @@ Op *ArgTopK::create_operator_from_layer(
   int k = value;
   layer->get_int_property("sorted", value);
   bool sorted = (bool)value;
-  return new ArgTopK(
-      model, layer->layer_guid, inputs[0], k, sorted, layer->name);
+  layer->get_int_property("speculative_decoding", value);
+  bool speculative_decoding = (bool)value;
+
+  return new ArgTopK(model,
+                     layer->layer_guid,
+                     inputs[0],
+                     k,
+                     sorted,
+                     speculative_decoding,
+                     layer->name);
 }
 
 ArgTopKParams ArgTopK::get_params() const {
   ArgTopKParams params;
   params.k = this->k;
   params.sorted = this->sorted;
+  params.speculative_decoding = this->speculative_decoding;
   return params;
 }
 
@@ -106,7 +121,8 @@ bool ArgTopKParams::is_valid(ParallelTensorShape const &) const {
 }
 
 bool operator==(ArgTopKParams const &lhs, ArgTopKParams const &rhs) {
-  return lhs.k == rhs.k && lhs.sorted == rhs.sorted;
+  return lhs.k == rhs.k && lhs.sorted == rhs.sorted &&
+         lhs.speculative_decoding == rhs.speculative_decoding;
 }
 
 ArgTopK::ArgTopK(FFModel &model,
@@ -114,6 +130,7 @@ ArgTopK::ArgTopK(FFModel &model,
                  const ParallelTensor _input,
                  int _k,
                  bool _sorted,
+                 bool _speculative_decoding,
                  char const *name)
     : Op(model,
          OP_ARG_TOPK,
@@ -121,9 +138,9 @@ ArgTopK::ArgTopK(FFModel &model,
          name,
          1 /*inputs*/,
          0 /*weights*/,
-         1 /*outputs*/,
+         _speculative_decoding ? 2 : 1 /*outputs*/,
          _input),
-      k(_k), sorted(_sorted) {
+      k(_k), sorted(_sorted), speculative_decoding(_speculative_decoding) {
   // overwrite layer_guid
   layer_guid = _layer_guid;
   int numdim = inputs[0]->num_dims;
@@ -131,26 +148,42 @@ ArgTopK::ArgTopK(FFModel &model,
   for (int i = 0; i < numdim; i++) {
     dims[i] = inputs[0]->dims[i];
   }
+
   dims[0].size = k;
   assert(inputs[0]->dims[0].degree == 1);
   assert(inputs[0]->dims[0].parallel_idx == -1);
-  //   outputs[0] = model.create_parallel_tensor_legion_ordering(
-  //       numdim, dims, _input->data_type, this, 0 /*owner_idx*/);
+
   outputs[0] = model.create_parallel_tensor_legion_ordering(
       numdim, dims, DT_INT32, this, 0 /*owner_idx*/);
+  if (_speculative_decoding) {
+    outputs[1] = model.create_parallel_tensor_legion_ordering(
+        numdim, dims, DT_FLOAT, this, 1 /*owner_idx*/);
+  }
 }
 
 ArgTopK::ArgTopK(FFModel &model,
                  LayerID const &layer_guid,
                  ArgTopK const &other,
                  const ParallelTensor input)
-    : ArgTopK(model, layer_guid, input, other.k, other.sorted, other.name) {}
+    : ArgTopK(model,
+              layer_guid,
+              input,
+              other.k,
+              other.sorted,
+              other.speculative_decoding,
+              other.name) {}
 
 ArgTopK::ArgTopK(FFModel &model,
                  ArgTopKParams const &params,
-                 const ParallelTensor input,
+                 ParallelTensor const input,
                  char const *name)
-    : ArgTopK(model, params.layer_guid, input, params.k, params.sorted, name) {}
+    : ArgTopK(model,
+              params.layer_guid,
+              input,
+              params.k,
+              params.sorted,
+              params.speculative_decoding,
+              name) {}
 
 void ArgTopK::init_inference(FFModel const &ff,
                              std::vector<ParallelTensor> const &batch_inputs,
@@ -243,8 +276,10 @@ OpMeta *ArgTopK::init_task(Task const *task,
   m->profiling = topk->profiling;
   m->inference_debugging = topk->inference_debugging;
   m->sorted = topk->sorted;
+  m->k = topk->k;
   std::strcpy(m->op_name, topk->name);
   m->layer_guid = topk->layer_guid;
+  m->speculative_decoding = topk->speculative_decoding;
   return m;
 }
 
@@ -267,34 +302,64 @@ FutureMap ArgTopK::inference(FFModel const &ff,
   size_t machine_view_hash = view->hash();
   /* std::cout << "ArgTopK op machine_view: " << *(MachineView const *)mv
             << std::endl; */
-  IndexLauncher launcher(ARG_TOPK_INF_TASK_ID,
-                         parallel_is,
-                         TaskArgument(nullptr, 0),
-                         argmap,
-                         Predicate::TRUE_PRED,
-                         false /*must*/,
-                         0 /*mapper_id*/,
-                         machine_view_hash);
-  launcher.add_future(bc);
-  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_inputs[0]->region));
-  launcher.add_field(0, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_outputs[0]->region));
-  launcher.add_field(1, FID_DATA);
-  //   launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
-  //                                                     0 /*projection id*/,
-  //                                                     WRITE_ONLY,
-  //                                                     EXCLUSIVE,
-  //                                                     batch_outputs[1]->region));
-  //   launcher.add_field(2, FID_DATA);
-  return runtime->execute_index_space(ctx, launcher);
+  if (speculative_decoding) {
+    IndexLauncher launcher(ARG_TOPK_INF_SPECULATIVE_TASK_ID,
+                           parallel_is,
+                           TaskArgument(nullptr, 0),
+                           argmap,
+                           Predicate::TRUE_PRED,
+                           false /*must*/,
+                           0 /*mapper_id*/,
+                           machine_view_hash);
+    launcher.add_future(bc);
+    launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      batch_inputs[0]->region));
+    launcher.add_field(0, FID_DATA);
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[0]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[0]->region));
+    launcher.add_field(1, FID_DATA);
+
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[1]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[1]->region));
+    launcher.add_field(2, FID_DATA);
+    return runtime->execute_index_space(ctx, launcher);
+
+  } else {
+    IndexLauncher launcher(ARG_TOPK_INF_TASK_ID,
+                           parallel_is,
+                           TaskArgument(nullptr, 0),
+                           argmap,
+                           Predicate::TRUE_PRED,
+                           false /*must*/,
+                           0 /*mapper_id*/,
+                           machine_view_hash);
+    launcher.add_future(bc);
+    launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      batch_inputs[0]->region));
+    launcher.add_field(0, FID_DATA);
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[0]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[0]->region));
+    launcher.add_field(1, FID_DATA);
+    return runtime->execute_index_space(ctx, launcher);
+  }
 }
 
 InferenceResult
@@ -317,9 +382,11 @@ InferenceResult
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
   GenericTensorAccessorW indices = helperGetGenericTensorAccessorWO(
       DT_INT32, regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW probs;
 
   int batch_size = bc->num_active_tokens();
-  ArgTopK::forward_kernel_wrapper(m, input, indices, batch_size);
+  ArgTopK::forward_kernel_wrapper(
+      m, input, probs, indices, batch_size, nullptr);
 
   if (m->inference_debugging) {
     assert(task->index_point.get_dim() == 1);
@@ -334,6 +401,39 @@ InferenceResult
   return ir;
 }
 
+BeamInferenceResult ArgTopK::inference_speculative_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  assert(regions.size() == 3);
+  assert(task->regions.size() == 3);
+  BeamSearchBatchConfig const &bc =
+      Future(task->futures[0]).get_result<BeamSearchBatchConfig>();
+  if (bc.num_active_tokens() == 0) {
+    // Directly return for empty batch config
+    BeamInferenceResult ir;
+    return ir;
+  }
+  ArgTopKMeta *m = *((ArgTopKMeta **)task->local_args);
+
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW indices = helperGetGenericTensorAccessorWO(
+      DT_INT32, regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW probs = helperGetGenericTensorAccessorWO(
+      DT_FLOAT, regions[2], task->regions[2], FID_DATA, ctx, runtime);
+
+  int batch_size = bc.num_active_tokens();
+  ArgTopK::forward_kernel_wrapper(m, input, probs, indices, batch_size, &bc);
+
+  BeamInferenceResult ir;
+  download_tensor<BatchConfig::TokenId>(
+      indices.get_int32_ptr(), ir.token_ids, batch_size * m->k);
+  download_tensor<float>(probs.get_float_ptr(), ir.probs, batch_size * m->k);
+  return ir;
+}
+
 void ArgTopK::backward(FFModel const &ff) {
   // ArgTopK does not support backward
   assert(false);
@@ -345,6 +445,7 @@ void ArgTopK::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.model_id);
   sez.serialize(this->k);
   sez.serialize(this->sorted);
+  sez.serialize(this->speculative_decoding);
 }
 
 Node ArgTopK::deserialize(FFModel &ff,
@@ -359,12 +460,15 @@ Node ArgTopK::deserialize(FFModel &ff,
   LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
   int k;
   bool sorted;
+  bool speculative_decoding;
   dez.deserialize(k);
   dez.deserialize(sorted);
+  dez.deserialize(speculative_decoding);
   ArgTopKParams params;
   params.layer_guid = layer_guid;
   params.k = k;
   params.sorted = sorted;
+  params.speculative_decoding = speculative_decoding;
   return ff.get_or_create_node<ArgTopK>(inputs[0], params);
 }
 
@@ -390,6 +494,7 @@ size_t hash<FlexFlow::ArgTopKParams>::operator()(
   hash_combine(key, params.layer_guid.id);
   hash_combine(key, params.k);
   hash_combine(key, params.sorted);
+  hash_combine(key, params.speculative_decoding);
   return key;
 }
 }; // namespace std
diff --git a/src/ops/arg_topk.cu b/src/ops/arg_topk.cu
index 575e0183b4..0b8bb8b563 100644
--- a/src/ops/arg_topk.cu
+++ b/src/ops/arg_topk.cu
@@ -262,8 +262,9 @@ __device__ void mergeShards(int num_shards,
                             int k,
                             Entry<T> *__restrict__ entries,
                             Entry<T> *__restrict__ top_k_heap,
-                            // T *top_k_values,
-                            int *top_k_indices) {
+                            float *top_k_values,
+                            int *top_k_indices,
+                            bool speculative_decoding) {
   // If k < num_shards, we can use a min-heap with k elements to get the top k
   // of the sorted blocks.
   // If k > num_shards, we can initialize a min-heap with the top element from
@@ -313,7 +314,11 @@ __device__ void mergeShards(int num_shards,
     int const last_k = k - 1;
     for (int rank = 0; rank < last_k; rank++) {
       Entry<T> const &max_element = max_heap.root();
-      // top_k_values[rank] = max_element.value;
+      if (speculative_decoding) {
+        assert(top_k_values != nullptr);
+        top_k_values[rank] = static_cast<float>(max_element.value);
+      }
+
       int shard_index = max_element.index;
       top_k_indices[rank] = entries[shard_index].index;
       int next_shard_index = shard_index + num_shards;
@@ -337,8 +342,9 @@ __global__ void arg_topk_forward_kernel(T const *__restrict__ input,
                                         int length,
                                         int k,
                                         bool sorted,
-                                        // T *__restrict__ output,
-                                        int *__restrict__ indices) {
+                                        float *__restrict__ output,
+                                        int *__restrict__ indices,
+                                        bool speculative_decoding) {
   __shared__ char shared_memory[48 << 10];
   int const batch_index = blockIdx.x;
   T const *batch_input = input + batch_index * length;
@@ -350,15 +356,16 @@ __global__ void arg_topk_forward_kernel(T const *__restrict__ input,
   __syncthreads();
   if (thread_index == 0) {
     int const offset = batch_index * k;
-    // auto batch_output = output + offset;
+    auto batch_output = output + offset;
     auto batch_indices = indices + offset;
     Entry<T> *top_k_heap = shared_entries + thread_count * k;
     mergeShards(thread_count,
                 k,
                 shared_entries,
                 top_k_heap,
-                // batch_output,
-                batch_indices);
+                batch_output,
+                batch_indices,
+                speculative_decoding);
   }
 }
 
@@ -366,12 +373,13 @@ __global__ void arg_topk_forward_kernel(T const *__restrict__ input,
 template <typename DT>
 void ArgTopK::forward_kernel(ArgTopKMeta const *m,
                              DT const *input_ptr,
-                             // float *output_ptr,
+                             float *output_ptr,
                              int *indices_ptr,
                              size_t batch_size,
                              int length,
                              int k,
                              bool sorted,
+                             BeamSearchBatchConfig const *bc,
                              cudaStream_t stream) {
   // Adopted from TensorFlow's ArgTopK implementation
   // https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/kernels/topk_op_gpu.h
@@ -390,24 +398,58 @@ void ArgTopK::forward_kernel(ArgTopKMeta const *m,
   size_t shared_memory_size = (num_shards + 1) * k * sizeof(Entry<DT>);
   // size_t num_blocks = (batch_size + num_shards - 1) / num_shards;
   size_t num_blocks = batch_size;
-  assert(num_shards >= (size_t)k);
-  num_shards = k;
-  arg_topk_forward_kernel<<<num_blocks, num_shards, 0, stream>>>(
-      input_ptr,
-      shared_memory_size,
-      length,
-      k,
-      sorted,
-      // output_ptr,
-      indices_ptr);
+
+  // all requests are in the same beam stages
+  if (m->speculative_decoding) {
+    assert(bc->num_active_requests() >= 0);
+
+    // check
+    int beam_size = -1;
+    for (int i = 1; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      } else if (beam_size == -1) {
+        beam_size = bc->beamRequestsInfo[i].beam_size;
+      } else {
+        assert(beam_size == bc->beamRequestsInfo[i].beam_size);
+      }
+    }
+
+    assert(num_shards >= (size_t)beam_size);
+    num_shards = k;
+    arg_topk_forward_kernel<<<num_blocks, num_shards, 0, stream>>>(
+        input_ptr,
+        shared_memory_size,
+        length,
+        beam_size,
+        sorted,
+        output_ptr,
+        indices_ptr,
+        m->speculative_decoding);
+  } else {
+
+    assert(num_shards >= (size_t)k);
+    num_shards = k;
+    arg_topk_forward_kernel<<<num_blocks, num_shards, 0, stream>>>(
+        input_ptr,
+        shared_memory_size,
+        length,
+        k,
+        sorted,
+        nullptr,
+        indices_ptr,
+        false);
+  }
 }
 
 /*static*/
 void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
                                      GenericTensorAccessorR const &input,
                                      // float *output_ptr,
+                                     GenericTensorAccessorW const &probs,
                                      GenericTensorAccessorW const &indices,
-                                     int batch_size) {
+                                     int batch_size,
+                                     BeamSearchBatchConfig const *bc) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -439,6 +481,7 @@ void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
   int length = input.domain.hi()[0] - input.domain.lo()[0] + 1;
   int k = indices.domain.hi()[0] - indices.domain.lo()[0] +
           1; /*TODO: This prints to 5*/
+
   // batch_size = input.domain.get_volume() / length;
   // assert(indices.domain.get_volume() / k == batch_size);
   cudaEvent_t t_start, t_end;
@@ -451,22 +494,26 @@ void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
   if (input.data_type == DT_HALF) {
     ArgTopK::forward_kernel(m,
                             input.get_half_ptr(),
-                            // output_ptr,
+                            m->speculative_decoding ? probs.get_float_ptr()
+                                                    : nullptr,
                             indices.get_int32_ptr(),
                             batch_size,
                             length,
                             k,
                             m->sorted,
+                            m->speculative_decoding ? bc : nullptr,
                             stream);
   } else if (input.data_type == DT_FLOAT) {
     ArgTopK::forward_kernel(m,
                             input.get_float_ptr(),
-                            // output_ptr,
+                            m->speculative_decoding ? probs.get_float_ptr()
+                                                    : nullptr,
                             indices.get_int32_ptr(),
                             batch_size,
                             length,
                             k,
                             m->sorted,
+                            m->speculative_decoding ? bc : nullptr,
                             stream);
   } else {
     assert(false && "Unsupported data type");
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 37605c44a4..f72d320bc8 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -5917,6 +5917,24 @@ void register_flexflow_internal_tasks(Runtime *runtime,
           registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(ARG_TOPK_INF_SPECULATIVE_TASK_ID,
+                                   "ArgTopK Speculative Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<BeamInferenceResult,
+                                        ArgTopK::inference_speculative_task>(
+          registrar, "ArgTopK Speculative Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<BeamInferenceResult,
+                                     ArgTopK::inference_speculative_task>(
+          registrar);
+    }
+  }
   // BeamTopk task
   {
     TaskVariantRegistrar registrar(BEAM_TOPK_INIT_TASK_ID, "BeamTopK Init");

From 4259d2dfa5c42488dad76d511517e45c0ad438c7 Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Mon, 1 Jan 2024 10:08:38 -0500
Subject: [PATCH 292/344] embedding

---
 include/flexflow/ops/embedding.h |  4 ++
 src/ops/embedding.cc             | 64 ++++++++++++++++++++++++++++++++
 2 files changed, 68 insertions(+)

diff --git a/include/flexflow/ops/embedding.h b/include/flexflow/ops/embedding.h
index ae93ef4d1d..0f1b1335d4 100644
--- a/include/flexflow/ops/embedding.h
+++ b/include/flexflow/ops/embedding.h
@@ -80,6 +80,10 @@ class Embedding : public Op {
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
                            Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);                        
   static void backward_task(Legion::Task const *task,
                             std::vector<Legion::PhysicalRegion> const &regions,
                             Legion::Context ctx,
diff --git a/src/ops/embedding.cc b/src/ops/embedding.cc
index 3be3eac618..40d5b600be 100644
--- a/src/ops/embedding.cc
+++ b/src/ops/embedding.cc
@@ -517,6 +517,70 @@ void Embedding::forward_task(Task const *task,
   assert(task->regions.size() == 3);
   // Assert that weight and output must have the same data type
   // otherwise, a cast operator should be inserted
+  assert(m->weight_type[0] == m->output_type[0]);
+  assert(m->input_type[0] == DT_INT32 || m->input_type[0] == DT_INT64);
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR kernel = helperGetGenericTensorAccessorRO(
+      m->weight_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  if (m->aggr == AGGR_MODE_NONE) {
+    // assert(kernel_domain.get_dim() == 2);
+    assert(input.domain.get_dim() + 1 == output.domain.get_dim());
+    for (size_t i = 0; i < input.domain.get_dim(); i++) {
+      assert(input.domain.hi()[i] == output.domain.hi()[i + 1]);
+      assert(input.domain.lo()[i] == output.domain.lo()[i + 1]);
+    }
+    assert(kernel.domain.hi()[0] - kernel.domain.lo()[0] ==
+           output.domain.hi()[0] - output.domain.lo()[0]);
+  } else {
+    // assert(kernel_domain.get_dim() == 2);
+    assert(input.domain.get_dim() == output.domain.get_dim());
+    for (size_t i = 1; i < input.domain.get_dim(); i++) {
+      assert(input.domain.hi()[i] == output.domain.hi()[i]);
+      assert(input.domain.lo()[i] == output.domain.lo()[i]);
+    }
+    assert(kernel.domain.hi()[0] - kernel.domain.lo()[0] ==
+           output.domain.hi()[0] - output.domain.lo()[0]);
+  }
+
+  int in_dim, out_dim, effective_batch_size;
+  if (m->aggr == AGGR_MODE_NONE) {
+    in_dim = 1;
+    out_dim = output.domain.hi()[0] - output.domain.lo()[0] + 1;
+    effective_batch_size = output.domain.get_volume() / out_dim;
+    assert(effective_batch_size * in_dim == input.domain.get_volume());
+  } else {
+    in_dim = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+    out_dim = output.domain.hi()[0] - output.domain.lo()[0] + 1;
+    effective_batch_size = output.domain.get_volume() / out_dim;
+    assert(effective_batch_size * in_dim == input.domain.get_volume());
+  }
+  forward_kernel_wrapper(
+      m, input, output, kernel, in_dim, out_dim, effective_batch_size);
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    Embedding::save_inference_tensors_to_file(
+        m, shard_id, nullptr, {input}, {kernel}, {output});
+  }
+}
+
+/*
+  regions[0](I): input
+  regions[1](O): output
+  regions[2](I): kernel
+*/
+void Embedding::inference_task(Task const *task,
+                               std::vector<PhysicalRegion> const &regions,
+                               Context ctx,
+                               Runtime *runtime) {
+  EmbeddingMeta *m = *((EmbeddingMeta **)task->local_args);
+  assert(regions.size() == 3);
+  assert(task->regions.size() == 3);
+  // Assert that weight and output must have the same data type
+  // otherwise, a cast operator should be inserted
   BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
   if (bc->num_active_tokens() == 0) {
     return;

From fae7fba1994aaf3c04da250a04bec3beb217236e Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Mon, 1 Jan 2024 10:13:30 -0500
Subject: [PATCH 293/344] fmt

---
 include/flexflow/ops/embedding.h | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/include/flexflow/ops/embedding.h b/include/flexflow/ops/embedding.h
index 0f1b1335d4..ed89fcf37a 100644
--- a/include/flexflow/ops/embedding.h
+++ b/include/flexflow/ops/embedding.h
@@ -83,7 +83,7 @@ class Embedding : public Op {
   static void inference_task(Legion::Task const *task,
                              std::vector<Legion::PhysicalRegion> const &regions,
                              Legion::Context ctx,
-                             Legion::Runtime *runtime);                        
+                             Legion::Runtime *runtime);
   static void backward_task(Legion::Task const *task,
                             std::vector<Legion::PhysicalRegion> const &regions,
                             Legion::Context ctx,

From 8d1d5842253a0b6c894bec14550dd1e88eb9c4fd Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Mon, 1 Jan 2024 12:05:12 -0500
Subject: [PATCH 294/344] hip

---
 src/ops/arg_topk.cpp | 90 ++++++++++++++++++++++++++++++++------------
 1 file changed, 66 insertions(+), 24 deletions(-)

diff --git a/src/ops/arg_topk.cpp b/src/ops/arg_topk.cpp
index 6db8abb8c4..f431d3d4bf 100644
--- a/src/ops/arg_topk.cpp
+++ b/src/ops/arg_topk.cpp
@@ -263,8 +263,9 @@ __device__ void mergeShards(int num_shards,
                             int k,
                             Entry<T> *__restrict__ entries,
                             Entry<T> *__restrict__ top_k_heap,
-                            // T *top_k_values,
-                            int *top_k_indices) {
+                            float *top_k_values,
+                            int *top_k_indices,
+                            bool speculative_decoding) {
   // If k < num_shards, we can use a min-heap with k elements to get the top k
   // of the sorted blocks.
   // If k > num_shards, we can initialize a min-heap with the top element from
@@ -314,7 +315,10 @@ __device__ void mergeShards(int num_shards,
     int const last_k = k - 1;
     for (int rank = 0; rank < last_k; rank++) {
       Entry<T> const &max_element = max_heap.root();
-      // top_k_values[rank] = max_element.value;
+      if (speculative_decoding) {
+        assert(top_k_values != nullptr);
+        top_k_values[rank] = static_cast<float>(max_element.value);
+      }
       int shard_index = max_element.index;
       top_k_indices[rank] = entries[shard_index].index;
       int next_shard_index = shard_index + num_shards;
@@ -338,8 +342,9 @@ __global__ void arg_topk_forward_kernel(T const *__restrict__ input,
                                         int length,
                                         int k,
                                         bool sorted,
-                                        // T *__restrict__ output,
-                                        int *__restrict__ indices) {
+                                        float *__restrict__ output,
+                                        int *__restrict__ indices,
+                                        bool speculative_decoding) {
   __shared__ char shared_memory[48 << 10];
   int const batch_index = blockIdx.x;
   T const *batch_input = input + batch_index * length;
@@ -351,15 +356,16 @@ __global__ void arg_topk_forward_kernel(T const *__restrict__ input,
   __syncthreads();
   if (thread_index == 0) {
     int const offset = batch_index * k;
-    // auto batch_output = output + offset;
+    auto batch_output = output + offset;
     auto batch_indices = indices + offset;
     Entry<T> *top_k_heap = shared_entries + thread_count * k;
     mergeShards(thread_count,
                 k,
                 shared_entries,
                 top_k_heap,
-                // batch_output,
-                batch_indices);
+                batch_output,
+                batch_indices,
+                speculative_decoding);
   }
 }
 
@@ -367,12 +373,13 @@ __global__ void arg_topk_forward_kernel(T const *__restrict__ input,
 template <typename DT>
 void ArgTopK::forward_kernel(ArgTopKMeta const *m,
                              DT const *input_ptr,
-                             // float *output_ptr,
+                             float *output_ptr,
                              int *indices_ptr,
                              size_t batch_size,
                              int length,
                              int k,
                              bool sorted,
+                             BeamSearchBatchConfig const *bc,
                              hipStream_t stream) {
   // Adopted from TensorFlow's ArgTopK implementation
   // https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/kernels/topk_op_gpu.h
@@ -391,28 +398,57 @@ void ArgTopK::forward_kernel(ArgTopKMeta const *m,
   size_t shared_memory_size = (num_shards + 1) * k * sizeof(Entry<DT>);
   // size_t num_blocks = (batch_size + num_shards - 1) / num_shards;
   size_t num_blocks = batch_size;
-  assert(num_shards >= (size_t)k);
-  num_shards = k;
-  hipLaunchKernelGGL(arg_topk_forward_kernel,
-                     num_blocks,
-                     num_shards,
-                     0,
-                     stream,
-                     input_ptr,
-                     shared_memory_size,
-                     length,
-                     k,
-                     sorted,
-                     // output_ptr,
-                     indices_ptr);
+  // all requests are in the same beam stages
+  if (m->speculative_decoding) {
+    assert(bc->num_active_requests() >= 0);
+
+    // check
+    int beam_size = -1;
+    for (int i = 1; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      } else if (beam_size == -1) {
+        beam_size = bc->beamRequestsInfo[i].beam_size;
+      } else {
+        assert(beam_size == bc->beamRequestsInfo[i].beam_size);
+      }
+    }
+
+    assert(num_shards >= (size_t)beam_size);
+    num_shards = k;
+    arg_topk_forward_kernel<<<num_blocks, num_shards, 0, stream>>>(
+        input_ptr,
+        shared_memory_size,
+        length,
+        beam_size,
+        sorted,
+        output_ptr,
+        indices_ptr,
+        m->speculative_decoding);
+  } else {
+
+    assert(num_shards >= (size_t)k);
+    num_shards = k;
+    arg_topk_forward_kernel<<<num_blocks, num_shards, 0, stream>>>(
+        input_ptr,
+        shared_memory_size,
+        length,
+        k,
+        sorted,
+        nullptr,
+        indices_ptr,
+        false);
+  }
 }
 
 /*static*/
 void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
                                      GenericTensorAccessorR const &input,
+                                     GenericTensorAccessorW const &probs,
                                      // float *output_ptr,
                                      GenericTensorAccessorW const &indices,
-                                     int batch_size) {
+                                     int batch_size,
+                                     BeamSearchBatchConfig const *bc) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   // Domain in1_domain = runtime->get_index_space_domain(
@@ -457,21 +493,27 @@ void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
     ArgTopK::forward_kernel(m,
                             input.get_half_ptr(),
                             // output_ptr,
+                            m->speculative_decoding ? probs.get_float_ptr()
+                                                    : nullptr,
                             indices.get_int32_ptr(),
                             batch_size,
                             length,
                             k,
                             m->sorted,
+                            m->speculative_decoding ? bc : nullptr,
                             stream);
   } else if (input.data_type == DT_FLOAT) {
     ArgTopK::forward_kernel(m,
                             input.get_float_ptr(),
                             // output_ptr,
+                            m->speculative_decoding ? probs.get_float_ptr()
+                                                    : nullptr,
                             indices.get_int32_ptr(),
                             batch_size,
                             length,
                             k,
                             m->sorted,
+                            m->speculative_decoding ? bc : nullptr,
                             stream);
   } else {
     assert(false && "Unsupported data type");

From 25097e084772ed9693bef408315385a11340671b Mon Sep 17 00:00:00 2001
From: Xinhao Cheng <99570243+xinhaoc@users.noreply.github.com>
Date: Mon, 1 Jan 2024 15:12:07 -0500
Subject: [PATCH 295/344] SpecInfer: optimize performance (#1255)

* init

* fix speculative

* fix speculative

* bitmap+tree verify

* fix.

* fix

* multi batch

* copy metadata once

* fix some corner cases

* Replicate load_token tasks so that it can be fused with other compute tasks; this eliminates Replicate and enables a larger fused op

* more fix.

* clean up

* .

* load batchconfig

* clean

* hip

* hip

* embedding return when no token

* use arg topk instead of beam topk

* embedding

* fmt

* hip

---------

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 include/flexflow/flexflow_c.h          |   1 +
 include/flexflow/model.h               |   2 +
 include/flexflow/ops/arg_topk.h        |  16 ++-
 include/flexflow/ops/arg_topk_params.h |   1 +
 include/flexflow/ops/embedding.h       |   4 +
 inference/models/llama.cc              |   2 +-
 python/flexflow/core/flexflow_cffi.py  |   5 +-
 src/c/flexflow_c.cc                    |   4 +-
 src/ops/arg_topk.cc                    | 185 +++++++++++++++++++------
 src/ops/arg_topk.cpp                   |  90 ++++++++----
 src/ops/arg_topk.cu                    |  91 +++++++++---
 src/ops/embedding.cc                   |  69 +++++++++
 src/runtime/model.cc                   |  18 +++
 13 files changed, 397 insertions(+), 91 deletions(-)

diff --git a/include/flexflow/flexflow_c.h b/include/flexflow/flexflow_c.h
index 01a2818a2b..305c8da513 100644
--- a/include/flexflow/flexflow_c.h
+++ b/include/flexflow/flexflow_c.h
@@ -571,6 +571,7 @@ flexflow_tensor_t flexflow_model_add_arg_top_k(flexflow_model_t handle_,
                                                const flexflow_tensor_t input_,
                                                int k,
                                                bool sorted,
+                                               bool speculative_decoding,
                                                char const *name);
 
 flexflow_tensor_t flexflow_model_add_beam_top_k(flexflow_model_t handle_,
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index cda1f91c89..cf7bb3dd2d 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -146,6 +146,7 @@ enum TaskIDs {
   TOPK_BWD_TASK_ID,
   ARG_TOPK_INIT_TASK_ID,
   ARG_TOPK_INF_TASK_ID,
+  ARG_TOPK_INF_SPECULATIVE_TASK_ID,
   SAMPLING_INIT_TASK_ID,
   SAMPLING_INF_TASK_ID,
   ARGMAX_INIT_TASK_ID,
@@ -674,6 +675,7 @@ class FFModel {
                    // Tensor *outputs,
                    int k,
                    bool sorted,
+                   bool speculative_decoding,
                    char const *name = NULL);
   Tensor argmax(const Tensor input, bool beam_search, char const *name = NULL);
   Tensor sampling(const Tensor input, float top_p, char const *name = NULL);
diff --git a/include/flexflow/ops/arg_topk.h b/include/flexflow/ops/arg_topk.h
index 8b2d2aa11c..3822a5e41e 100644
--- a/include/flexflow/ops/arg_topk.h
+++ b/include/flexflow/ops/arg_topk.h
@@ -12,6 +12,8 @@ class ArgTopKMeta : public OpMeta {
 public:
   ArgTopKMeta(FFHandler handle, Op const *op);
   bool sorted;
+  int k;
+  bool speculative_decoding;
 };
 
 class ArgTopK : public Op {
@@ -23,6 +25,7 @@ class ArgTopK : public Op {
           const ParallelTensor input,
           int k,
           bool sorted,
+          bool speculative_decoding,
           char const *name);
   ArgTopK(FFModel &model,
           LayerID const &layer_guid,
@@ -61,6 +64,11 @@ class ArgTopK : public Op {
                      std::vector<Legion::PhysicalRegion> const &regions,
                      Legion::Context ctx,
                      Legion::Runtime *runtime);
+  static BeamInferenceResult inference_speculative_task(
+      Legion::Task const *task,
+      std::vector<Legion::PhysicalRegion> const &regions,
+      Legion::Context ctx,
+      Legion::Runtime *runtime);
   void serialize(Legion::Serializer &s) const override;
   static PCG::Node deserialize(FFModel &ff,
                                Legion::Deserializer &d,
@@ -75,22 +83,26 @@ class ArgTopK : public Op {
   template <typename DT>
   static void forward_kernel(ArgTopKMeta const *m,
                              DT const *input_ptr,
-                             // float *output_ptr,
+                             float *output_ptr,
                              int *indices_ptr,
                              size_t batch_size,
                              int length,
                              int k,
                              bool sorted,
+                             BeamSearchBatchConfig const *bc,
                              ffStream_t stream);
   static void forward_kernel_wrapper(ArgTopKMeta const *m,
                                      GenericTensorAccessorR const &input,
+                                     GenericTensorAccessorW const &prob,
                                      GenericTensorAccessorW const &indices,
-                                     int batch_size);
+                                     int batch_size,
+                                     BeamSearchBatchConfig const *bc);
   Params get_params() const;
 
 public:
   int k;
   bool sorted;
+  bool speculative_decoding;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/ops/arg_topk_params.h b/include/flexflow/ops/arg_topk_params.h
index 9d2a21034f..bd9c38e2a9 100644
--- a/include/flexflow/ops/arg_topk_params.h
+++ b/include/flexflow/ops/arg_topk_params.h
@@ -11,6 +11,7 @@ struct ArgTopKParams {
   LayerID layer_guid;
   int k;
   bool sorted;
+  bool speculative_decoding;
   bool is_valid(ParallelTensorShape const &) const;
 };
 bool operator==(ArgTopKParams const &, ArgTopKParams const &);
diff --git a/include/flexflow/ops/embedding.h b/include/flexflow/ops/embedding.h
index ae93ef4d1d..ed89fcf37a 100644
--- a/include/flexflow/ops/embedding.h
+++ b/include/flexflow/ops/embedding.h
@@ -80,6 +80,10 @@ class Embedding : public Op {
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
                            Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
   static void backward_task(Legion::Task const *task,
                             std::vector<Legion::PhysicalRegion> const &regions,
                             Legion::Context ctx,
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index 10001ee916..e9c84efe90 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -247,7 +247,7 @@ void LLAMA::create_llama_model(FFModel &ff,
     Tensor softmax = ff.softmax(dense, -1);
     // output = ff.beam_top_k(softmax, llama_config.max_beam_width, false);
     // output = ff.argmax(softmax, /*beam_Search*/ true);
-    output = ff.beam_top_k(softmax, llama_config.max_beam_width, false);
+    output = ff.arg_top_k(softmax, llama_config.max_beam_width, false, true);
     // output = ff.top_k(softmax, )
   } else {
     // Tensor softmax = ff.softmax(dense, -1);
diff --git a/python/flexflow/core/flexflow_cffi.py b/python/flexflow/core/flexflow_cffi.py
index de3f7e6929..a3c221474d 100644
--- a/python/flexflow/core/flexflow_cffi.py
+++ b/python/flexflow/core/flexflow_cffi.py
@@ -3349,7 +3349,7 @@ def residual_rms_norm(self, input1, input2, eps, dim, name=None):
             handles_array[1], owner_op_type=OpType.RESIDUAL_RMS_NORM
         )
 
-    def arg_top_k(self, input, k, sorted, name=None):
+    def arg_top_k(self, input, k, sorted, speculative_decoding, name=None):
         """Defines the Arg TopK layer.
 
         :param input: the input Tensor.
@@ -3361,6 +3361,9 @@ def arg_top_k(self, input, k, sorted, name=None):
         :param sorted: Whether the entries should be sorted
         :type sorted: bool
 
+        :param speculative_decoding: Whether you need to perform beam search
+        :type speculative_decoding: bool
+
         :param name: the name of the layer. Default is None.
         :type name: string
 
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index 80202f6f99..579fc5e2d1 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -1489,10 +1489,12 @@ flexflow_tensor_t flexflow_model_add_arg_top_k(flexflow_model_t handle_,
                                                const flexflow_tensor_t input_,
                                                int k,
                                                bool sorted,
+                                               bool speculative_decoding,
                                                char const *name) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
   Tensor input = FFCObjectWrapper::unwrap(input_);
-  Tensor tensor = handle->arg_top_k(input, k, sorted, name);
+  Tensor tensor =
+      handle->arg_top_k(input, k, sorted, speculative_decoding, name);
   return FFCObjectWrapper::wrap(tensor);
 }
 
diff --git a/src/ops/arg_topk.cc b/src/ops/arg_topk.cc
index a06b89de07..2727a1d249 100644
--- a/src/ops/arg_topk.cc
+++ b/src/ops/arg_topk.cc
@@ -51,6 +51,7 @@ using PCG::Node;
 Tensor FFModel::arg_top_k(const Tensor input,
                           int k,
                           bool sorted,
+                          bool speculative_decoding,
                           char const *name) {
   Layer *li = new Layer(this,
                         OP_ARG_TOPK,
@@ -58,7 +59,7 @@ Tensor FFModel::arg_top_k(const Tensor input,
                         name,
                         1 /*inputs*/,
                         0 /*weights*/,
-                        1 /*outputs*/,
+                        speculative_decoding ? 2 : 1 /*outputs*/,
                         input);
   {
     int numdims = input->num_dims;
@@ -71,9 +72,14 @@ Tensor FFModel::arg_top_k(const Tensor input,
     //     numdims, dims, input->data_type, li, 0, true /*create_grad*/);
     li->outputs[0] = create_tensor_legion_ordering(
         numdims, dims, DT_INT32, li, 0, false /*create_grad*/);
+    if (speculative_decoding) {
+      li->outputs[1] = create_tensor_legion_ordering(
+          numdims, dims, DT_FLOAT, li, 1, false /*create_grad*/);
+    }
   }
   li->add_int_property("k", k);
   li->add_int_property("sorted", sorted);
+  li->add_int_property("speculative_decoding", speculative_decoding);
   layers.push_back(li);
   // outputs[0] = li->outputs[0];
   // outputs[1] = li->outputs[1];
@@ -89,14 +95,23 @@ Op *ArgTopK::create_operator_from_layer(
   int k = value;
   layer->get_int_property("sorted", value);
   bool sorted = (bool)value;
-  return new ArgTopK(
-      model, layer->layer_guid, inputs[0], k, sorted, layer->name);
+  layer->get_int_property("speculative_decoding", value);
+  bool speculative_decoding = (bool)value;
+
+  return new ArgTopK(model,
+                     layer->layer_guid,
+                     inputs[0],
+                     k,
+                     sorted,
+                     speculative_decoding,
+                     layer->name);
 }
 
 ArgTopKParams ArgTopK::get_params() const {
   ArgTopKParams params;
   params.k = this->k;
   params.sorted = this->sorted;
+  params.speculative_decoding = this->speculative_decoding;
   return params;
 }
 
@@ -106,7 +121,8 @@ bool ArgTopKParams::is_valid(ParallelTensorShape const &) const {
 }
 
 bool operator==(ArgTopKParams const &lhs, ArgTopKParams const &rhs) {
-  return lhs.k == rhs.k && lhs.sorted == rhs.sorted;
+  return lhs.k == rhs.k && lhs.sorted == rhs.sorted &&
+         lhs.speculative_decoding == rhs.speculative_decoding;
 }
 
 ArgTopK::ArgTopK(FFModel &model,
@@ -114,6 +130,7 @@ ArgTopK::ArgTopK(FFModel &model,
                  const ParallelTensor _input,
                  int _k,
                  bool _sorted,
+                 bool _speculative_decoding,
                  char const *name)
     : Op(model,
          OP_ARG_TOPK,
@@ -121,9 +138,9 @@ ArgTopK::ArgTopK(FFModel &model,
          name,
          1 /*inputs*/,
          0 /*weights*/,
-         1 /*outputs*/,
+         _speculative_decoding ? 2 : 1 /*outputs*/,
          _input),
-      k(_k), sorted(_sorted) {
+      k(_k), sorted(_sorted), speculative_decoding(_speculative_decoding) {
   // overwrite layer_guid
   layer_guid = _layer_guid;
   int numdim = inputs[0]->num_dims;
@@ -131,26 +148,42 @@ ArgTopK::ArgTopK(FFModel &model,
   for (int i = 0; i < numdim; i++) {
     dims[i] = inputs[0]->dims[i];
   }
+
   dims[0].size = k;
   assert(inputs[0]->dims[0].degree == 1);
   assert(inputs[0]->dims[0].parallel_idx == -1);
-  //   outputs[0] = model.create_parallel_tensor_legion_ordering(
-  //       numdim, dims, _input->data_type, this, 0 /*owner_idx*/);
+
   outputs[0] = model.create_parallel_tensor_legion_ordering(
       numdim, dims, DT_INT32, this, 0 /*owner_idx*/);
+  if (_speculative_decoding) {
+    outputs[1] = model.create_parallel_tensor_legion_ordering(
+        numdim, dims, DT_FLOAT, this, 1 /*owner_idx*/);
+  }
 }
 
 ArgTopK::ArgTopK(FFModel &model,
                  LayerID const &layer_guid,
                  ArgTopK const &other,
                  const ParallelTensor input)
-    : ArgTopK(model, layer_guid, input, other.k, other.sorted, other.name) {}
+    : ArgTopK(model,
+              layer_guid,
+              input,
+              other.k,
+              other.sorted,
+              other.speculative_decoding,
+              other.name) {}
 
 ArgTopK::ArgTopK(FFModel &model,
                  ArgTopKParams const &params,
-                 const ParallelTensor input,
+                 ParallelTensor const input,
                  char const *name)
-    : ArgTopK(model, params.layer_guid, input, params.k, params.sorted, name) {}
+    : ArgTopK(model,
+              params.layer_guid,
+              input,
+              params.k,
+              params.sorted,
+              params.speculative_decoding,
+              name) {}
 
 void ArgTopK::init_inference(FFModel const &ff,
                              std::vector<ParallelTensor> const &batch_inputs,
@@ -243,8 +276,10 @@ OpMeta *ArgTopK::init_task(Task const *task,
   m->profiling = topk->profiling;
   m->inference_debugging = topk->inference_debugging;
   m->sorted = topk->sorted;
+  m->k = topk->k;
   std::strcpy(m->op_name, topk->name);
   m->layer_guid = topk->layer_guid;
+  m->speculative_decoding = topk->speculative_decoding;
   return m;
 }
 
@@ -267,34 +302,64 @@ FutureMap ArgTopK::inference(FFModel const &ff,
   size_t machine_view_hash = view->hash();
   /* std::cout << "ArgTopK op machine_view: " << *(MachineView const *)mv
             << std::endl; */
-  IndexLauncher launcher(ARG_TOPK_INF_TASK_ID,
-                         parallel_is,
-                         TaskArgument(nullptr, 0),
-                         argmap,
-                         Predicate::TRUE_PRED,
-                         false /*must*/,
-                         0 /*mapper_id*/,
-                         machine_view_hash);
-  launcher.add_future(bc);
-  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_inputs[0]->region));
-  launcher.add_field(0, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_outputs[0]->region));
-  launcher.add_field(1, FID_DATA);
-  //   launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
-  //                                                     0 /*projection id*/,
-  //                                                     WRITE_ONLY,
-  //                                                     EXCLUSIVE,
-  //                                                     batch_outputs[1]->region));
-  //   launcher.add_field(2, FID_DATA);
-  return runtime->execute_index_space(ctx, launcher);
+  if (speculative_decoding) {
+    IndexLauncher launcher(ARG_TOPK_INF_SPECULATIVE_TASK_ID,
+                           parallel_is,
+                           TaskArgument(nullptr, 0),
+                           argmap,
+                           Predicate::TRUE_PRED,
+                           false /*must*/,
+                           0 /*mapper_id*/,
+                           machine_view_hash);
+    launcher.add_future(bc);
+    launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      batch_inputs[0]->region));
+    launcher.add_field(0, FID_DATA);
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[0]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[0]->region));
+    launcher.add_field(1, FID_DATA);
+
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[1]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[1]->region));
+    launcher.add_field(2, FID_DATA);
+    return runtime->execute_index_space(ctx, launcher);
+
+  } else {
+    IndexLauncher launcher(ARG_TOPK_INF_TASK_ID,
+                           parallel_is,
+                           TaskArgument(nullptr, 0),
+                           argmap,
+                           Predicate::TRUE_PRED,
+                           false /*must*/,
+                           0 /*mapper_id*/,
+                           machine_view_hash);
+    launcher.add_future(bc);
+    launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      batch_inputs[0]->region));
+    launcher.add_field(0, FID_DATA);
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[0]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[0]->region));
+    launcher.add_field(1, FID_DATA);
+    return runtime->execute_index_space(ctx, launcher);
+  }
 }
 
 InferenceResult
@@ -317,9 +382,11 @@ InferenceResult
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
   GenericTensorAccessorW indices = helperGetGenericTensorAccessorWO(
       DT_INT32, regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW probs;
 
   int batch_size = bc->num_active_tokens();
-  ArgTopK::forward_kernel_wrapper(m, input, indices, batch_size);
+  ArgTopK::forward_kernel_wrapper(
+      m, input, probs, indices, batch_size, nullptr);
 
   if (m->inference_debugging) {
     assert(task->index_point.get_dim() == 1);
@@ -334,6 +401,39 @@ InferenceResult
   return ir;
 }
 
+BeamInferenceResult ArgTopK::inference_speculative_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  assert(regions.size() == 3);
+  assert(task->regions.size() == 3);
+  BeamSearchBatchConfig const &bc =
+      Future(task->futures[0]).get_result<BeamSearchBatchConfig>();
+  if (bc.num_active_tokens() == 0) {
+    // Directly return for empty batch config
+    BeamInferenceResult ir;
+    return ir;
+  }
+  ArgTopKMeta *m = *((ArgTopKMeta **)task->local_args);
+
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW indices = helperGetGenericTensorAccessorWO(
+      DT_INT32, regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW probs = helperGetGenericTensorAccessorWO(
+      DT_FLOAT, regions[2], task->regions[2], FID_DATA, ctx, runtime);
+
+  int batch_size = bc.num_active_tokens();
+  ArgTopK::forward_kernel_wrapper(m, input, probs, indices, batch_size, &bc);
+
+  BeamInferenceResult ir;
+  download_tensor<BatchConfig::TokenId>(
+      indices.get_int32_ptr(), ir.token_ids, batch_size * m->k);
+  download_tensor<float>(probs.get_float_ptr(), ir.probs, batch_size * m->k);
+  return ir;
+}
+
 void ArgTopK::backward(FFModel const &ff) {
   // ArgTopK does not support backward
   assert(false);
@@ -345,6 +445,7 @@ void ArgTopK::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.model_id);
   sez.serialize(this->k);
   sez.serialize(this->sorted);
+  sez.serialize(this->speculative_decoding);
 }
 
 Node ArgTopK::deserialize(FFModel &ff,
@@ -359,12 +460,15 @@ Node ArgTopK::deserialize(FFModel &ff,
   LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
   int k;
   bool sorted;
+  bool speculative_decoding;
   dez.deserialize(k);
   dez.deserialize(sorted);
+  dez.deserialize(speculative_decoding);
   ArgTopKParams params;
   params.layer_guid = layer_guid;
   params.k = k;
   params.sorted = sorted;
+  params.speculative_decoding = speculative_decoding;
   return ff.get_or_create_node<ArgTopK>(inputs[0], params);
 }
 
@@ -390,6 +494,7 @@ size_t hash<FlexFlow::ArgTopKParams>::operator()(
   hash_combine(key, params.layer_guid.id);
   hash_combine(key, params.k);
   hash_combine(key, params.sorted);
+  hash_combine(key, params.speculative_decoding);
   return key;
 }
 }; // namespace std
diff --git a/src/ops/arg_topk.cpp b/src/ops/arg_topk.cpp
index 6db8abb8c4..f431d3d4bf 100644
--- a/src/ops/arg_topk.cpp
+++ b/src/ops/arg_topk.cpp
@@ -263,8 +263,9 @@ __device__ void mergeShards(int num_shards,
                             int k,
                             Entry<T> *__restrict__ entries,
                             Entry<T> *__restrict__ top_k_heap,
-                            // T *top_k_values,
-                            int *top_k_indices) {
+                            float *top_k_values,
+                            int *top_k_indices,
+                            bool speculative_decoding) {
   // If k < num_shards, we can use a min-heap with k elements to get the top k
   // of the sorted blocks.
   // If k > num_shards, we can initialize a min-heap with the top element from
@@ -314,7 +315,10 @@ __device__ void mergeShards(int num_shards,
     int const last_k = k - 1;
     for (int rank = 0; rank < last_k; rank++) {
       Entry<T> const &max_element = max_heap.root();
-      // top_k_values[rank] = max_element.value;
+      if (speculative_decoding) {
+        assert(top_k_values != nullptr);
+        top_k_values[rank] = static_cast<float>(max_element.value);
+      }
       int shard_index = max_element.index;
       top_k_indices[rank] = entries[shard_index].index;
       int next_shard_index = shard_index + num_shards;
@@ -338,8 +342,9 @@ __global__ void arg_topk_forward_kernel(T const *__restrict__ input,
                                         int length,
                                         int k,
                                         bool sorted,
-                                        // T *__restrict__ output,
-                                        int *__restrict__ indices) {
+                                        float *__restrict__ output,
+                                        int *__restrict__ indices,
+                                        bool speculative_decoding) {
   __shared__ char shared_memory[48 << 10];
   int const batch_index = blockIdx.x;
   T const *batch_input = input + batch_index * length;
@@ -351,15 +356,16 @@ __global__ void arg_topk_forward_kernel(T const *__restrict__ input,
   __syncthreads();
   if (thread_index == 0) {
     int const offset = batch_index * k;
-    // auto batch_output = output + offset;
+    auto batch_output = output + offset;
     auto batch_indices = indices + offset;
     Entry<T> *top_k_heap = shared_entries + thread_count * k;
     mergeShards(thread_count,
                 k,
                 shared_entries,
                 top_k_heap,
-                // batch_output,
-                batch_indices);
+                batch_output,
+                batch_indices,
+                speculative_decoding);
   }
 }
 
@@ -367,12 +373,13 @@ __global__ void arg_topk_forward_kernel(T const *__restrict__ input,
 template <typename DT>
 void ArgTopK::forward_kernel(ArgTopKMeta const *m,
                              DT const *input_ptr,
-                             // float *output_ptr,
+                             float *output_ptr,
                              int *indices_ptr,
                              size_t batch_size,
                              int length,
                              int k,
                              bool sorted,
+                             BeamSearchBatchConfig const *bc,
                              hipStream_t stream) {
   // Adopted from TensorFlow's ArgTopK implementation
   // https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/kernels/topk_op_gpu.h
@@ -391,28 +398,57 @@ void ArgTopK::forward_kernel(ArgTopKMeta const *m,
   size_t shared_memory_size = (num_shards + 1) * k * sizeof(Entry<DT>);
   // size_t num_blocks = (batch_size + num_shards - 1) / num_shards;
   size_t num_blocks = batch_size;
-  assert(num_shards >= (size_t)k);
-  num_shards = k;
-  hipLaunchKernelGGL(arg_topk_forward_kernel,
-                     num_blocks,
-                     num_shards,
-                     0,
-                     stream,
-                     input_ptr,
-                     shared_memory_size,
-                     length,
-                     k,
-                     sorted,
-                     // output_ptr,
-                     indices_ptr);
+  // all requests are in the same beam stages
+  if (m->speculative_decoding) {
+    assert(bc->num_active_requests() >= 0);
+
+    // check
+    int beam_size = -1;
+    for (int i = 1; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      } else if (beam_size == -1) {
+        beam_size = bc->beamRequestsInfo[i].beam_size;
+      } else {
+        assert(beam_size == bc->beamRequestsInfo[i].beam_size);
+      }
+    }
+
+    assert(num_shards >= (size_t)beam_size);
+    num_shards = k;
+    arg_topk_forward_kernel<<<num_blocks, num_shards, 0, stream>>>(
+        input_ptr,
+        shared_memory_size,
+        length,
+        beam_size,
+        sorted,
+        output_ptr,
+        indices_ptr,
+        m->speculative_decoding);
+  } else {
+
+    assert(num_shards >= (size_t)k);
+    num_shards = k;
+    arg_topk_forward_kernel<<<num_blocks, num_shards, 0, stream>>>(
+        input_ptr,
+        shared_memory_size,
+        length,
+        k,
+        sorted,
+        nullptr,
+        indices_ptr,
+        false);
+  }
 }
 
 /*static*/
 void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
                                      GenericTensorAccessorR const &input,
+                                     GenericTensorAccessorW const &probs,
                                      // float *output_ptr,
                                      GenericTensorAccessorW const &indices,
-                                     int batch_size) {
+                                     int batch_size,
+                                     BeamSearchBatchConfig const *bc) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   // Domain in1_domain = runtime->get_index_space_domain(
@@ -457,21 +493,27 @@ void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
     ArgTopK::forward_kernel(m,
                             input.get_half_ptr(),
                             // output_ptr,
+                            m->speculative_decoding ? probs.get_float_ptr()
+                                                    : nullptr,
                             indices.get_int32_ptr(),
                             batch_size,
                             length,
                             k,
                             m->sorted,
+                            m->speculative_decoding ? bc : nullptr,
                             stream);
   } else if (input.data_type == DT_FLOAT) {
     ArgTopK::forward_kernel(m,
                             input.get_float_ptr(),
                             // output_ptr,
+                            m->speculative_decoding ? probs.get_float_ptr()
+                                                    : nullptr,
                             indices.get_int32_ptr(),
                             batch_size,
                             length,
                             k,
                             m->sorted,
+                            m->speculative_decoding ? bc : nullptr,
                             stream);
   } else {
     assert(false && "Unsupported data type");
diff --git a/src/ops/arg_topk.cu b/src/ops/arg_topk.cu
index 575e0183b4..0b8bb8b563 100644
--- a/src/ops/arg_topk.cu
+++ b/src/ops/arg_topk.cu
@@ -262,8 +262,9 @@ __device__ void mergeShards(int num_shards,
                             int k,
                             Entry<T> *__restrict__ entries,
                             Entry<T> *__restrict__ top_k_heap,
-                            // T *top_k_values,
-                            int *top_k_indices) {
+                            float *top_k_values,
+                            int *top_k_indices,
+                            bool speculative_decoding) {
   // If k < num_shards, we can use a min-heap with k elements to get the top k
   // of the sorted blocks.
   // If k > num_shards, we can initialize a min-heap with the top element from
@@ -313,7 +314,11 @@ __device__ void mergeShards(int num_shards,
     int const last_k = k - 1;
     for (int rank = 0; rank < last_k; rank++) {
       Entry<T> const &max_element = max_heap.root();
-      // top_k_values[rank] = max_element.value;
+      if (speculative_decoding) {
+        assert(top_k_values != nullptr);
+        top_k_values[rank] = static_cast<float>(max_element.value);
+      }
+
       int shard_index = max_element.index;
       top_k_indices[rank] = entries[shard_index].index;
       int next_shard_index = shard_index + num_shards;
@@ -337,8 +342,9 @@ __global__ void arg_topk_forward_kernel(T const *__restrict__ input,
                                         int length,
                                         int k,
                                         bool sorted,
-                                        // T *__restrict__ output,
-                                        int *__restrict__ indices) {
+                                        float *__restrict__ output,
+                                        int *__restrict__ indices,
+                                        bool speculative_decoding) {
   __shared__ char shared_memory[48 << 10];
   int const batch_index = blockIdx.x;
   T const *batch_input = input + batch_index * length;
@@ -350,15 +356,16 @@ __global__ void arg_topk_forward_kernel(T const *__restrict__ input,
   __syncthreads();
   if (thread_index == 0) {
     int const offset = batch_index * k;
-    // auto batch_output = output + offset;
+    auto batch_output = output + offset;
     auto batch_indices = indices + offset;
     Entry<T> *top_k_heap = shared_entries + thread_count * k;
     mergeShards(thread_count,
                 k,
                 shared_entries,
                 top_k_heap,
-                // batch_output,
-                batch_indices);
+                batch_output,
+                batch_indices,
+                speculative_decoding);
   }
 }
 
@@ -366,12 +373,13 @@ __global__ void arg_topk_forward_kernel(T const *__restrict__ input,
 template <typename DT>
 void ArgTopK::forward_kernel(ArgTopKMeta const *m,
                              DT const *input_ptr,
-                             // float *output_ptr,
+                             float *output_ptr,
                              int *indices_ptr,
                              size_t batch_size,
                              int length,
                              int k,
                              bool sorted,
+                             BeamSearchBatchConfig const *bc,
                              cudaStream_t stream) {
   // Adopted from TensorFlow's ArgTopK implementation
   // https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/kernels/topk_op_gpu.h
@@ -390,24 +398,58 @@ void ArgTopK::forward_kernel(ArgTopKMeta const *m,
   size_t shared_memory_size = (num_shards + 1) * k * sizeof(Entry<DT>);
   // size_t num_blocks = (batch_size + num_shards - 1) / num_shards;
   size_t num_blocks = batch_size;
-  assert(num_shards >= (size_t)k);
-  num_shards = k;
-  arg_topk_forward_kernel<<<num_blocks, num_shards, 0, stream>>>(
-      input_ptr,
-      shared_memory_size,
-      length,
-      k,
-      sorted,
-      // output_ptr,
-      indices_ptr);
+
+  // all requests are in the same beam stages
+  if (m->speculative_decoding) {
+    assert(bc->num_active_requests() >= 0);
+
+    // check
+    int beam_size = -1;
+    for (int i = 1; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      } else if (beam_size == -1) {
+        beam_size = bc->beamRequestsInfo[i].beam_size;
+      } else {
+        assert(beam_size == bc->beamRequestsInfo[i].beam_size);
+      }
+    }
+
+    assert(num_shards >= (size_t)beam_size);
+    num_shards = k;
+    arg_topk_forward_kernel<<<num_blocks, num_shards, 0, stream>>>(
+        input_ptr,
+        shared_memory_size,
+        length,
+        beam_size,
+        sorted,
+        output_ptr,
+        indices_ptr,
+        m->speculative_decoding);
+  } else {
+
+    assert(num_shards >= (size_t)k);
+    num_shards = k;
+    arg_topk_forward_kernel<<<num_blocks, num_shards, 0, stream>>>(
+        input_ptr,
+        shared_memory_size,
+        length,
+        k,
+        sorted,
+        nullptr,
+        indices_ptr,
+        false);
+  }
 }
 
 /*static*/
 void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
                                      GenericTensorAccessorR const &input,
                                      // float *output_ptr,
+                                     GenericTensorAccessorW const &probs,
                                      GenericTensorAccessorW const &indices,
-                                     int batch_size) {
+                                     int batch_size,
+                                     BeamSearchBatchConfig const *bc) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -439,6 +481,7 @@ void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
   int length = input.domain.hi()[0] - input.domain.lo()[0] + 1;
   int k = indices.domain.hi()[0] - indices.domain.lo()[0] +
           1; /*TODO: This prints to 5*/
+
   // batch_size = input.domain.get_volume() / length;
   // assert(indices.domain.get_volume() / k == batch_size);
   cudaEvent_t t_start, t_end;
@@ -451,22 +494,26 @@ void ArgTopK::forward_kernel_wrapper(ArgTopKMeta const *m,
   if (input.data_type == DT_HALF) {
     ArgTopK::forward_kernel(m,
                             input.get_half_ptr(),
-                            // output_ptr,
+                            m->speculative_decoding ? probs.get_float_ptr()
+                                                    : nullptr,
                             indices.get_int32_ptr(),
                             batch_size,
                             length,
                             k,
                             m->sorted,
+                            m->speculative_decoding ? bc : nullptr,
                             stream);
   } else if (input.data_type == DT_FLOAT) {
     ArgTopK::forward_kernel(m,
                             input.get_float_ptr(),
-                            // output_ptr,
+                            m->speculative_decoding ? probs.get_float_ptr()
+                                                    : nullptr,
                             indices.get_int32_ptr(),
                             batch_size,
                             length,
                             k,
                             m->sorted,
+                            m->speculative_decoding ? bc : nullptr,
                             stream);
   } else {
     assert(false && "Unsupported data type");
diff --git a/src/ops/embedding.cc b/src/ops/embedding.cc
index 76236e65ff..40d5b600be 100644
--- a/src/ops/embedding.cc
+++ b/src/ops/embedding.cc
@@ -478,6 +478,7 @@ FutureMap Embedding::inference(FFModel const &ff,
                          0 /*mapper_id*/,
                          machine_view_hash);
   // regions[0]: input
+  launcher.add_future(bc);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                     0 /*projection*/,
                                                     READ_ONLY,
@@ -566,6 +567,74 @@ void Embedding::forward_task(Task const *task,
   }
 }
 
+/*
+  regions[0](I): input
+  regions[1](O): output
+  regions[2](I): kernel
+*/
+void Embedding::inference_task(Task const *task,
+                               std::vector<PhysicalRegion> const &regions,
+                               Context ctx,
+                               Runtime *runtime) {
+  EmbeddingMeta *m = *((EmbeddingMeta **)task->local_args);
+  assert(regions.size() == 3);
+  assert(task->regions.size() == 3);
+  // Assert that weight and output must have the same data type
+  // otherwise, a cast operator should be inserted
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_active_tokens() == 0) {
+    return;
+  }
+  assert(m->weight_type[0] == m->output_type[0]);
+  assert(m->input_type[0] == DT_INT32 || m->input_type[0] == DT_INT64);
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR kernel = helperGetGenericTensorAccessorRO(
+      m->weight_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  if (m->aggr == AGGR_MODE_NONE) {
+    // assert(kernel_domain.get_dim() == 2);
+    assert(input.domain.get_dim() + 1 == output.domain.get_dim());
+    for (size_t i = 0; i < input.domain.get_dim(); i++) {
+      assert(input.domain.hi()[i] == output.domain.hi()[i + 1]);
+      assert(input.domain.lo()[i] == output.domain.lo()[i + 1]);
+    }
+    assert(kernel.domain.hi()[0] - kernel.domain.lo()[0] ==
+           output.domain.hi()[0] - output.domain.lo()[0]);
+  } else {
+    // assert(kernel_domain.get_dim() == 2);
+    assert(input.domain.get_dim() == output.domain.get_dim());
+    for (size_t i = 1; i < input.domain.get_dim(); i++) {
+      assert(input.domain.hi()[i] == output.domain.hi()[i]);
+      assert(input.domain.lo()[i] == output.domain.lo()[i]);
+    }
+    assert(kernel.domain.hi()[0] - kernel.domain.lo()[0] ==
+           output.domain.hi()[0] - output.domain.lo()[0]);
+  }
+
+  int in_dim, out_dim, effective_batch_size;
+  if (m->aggr == AGGR_MODE_NONE) {
+    in_dim = 1;
+    out_dim = output.domain.hi()[0] - output.domain.lo()[0] + 1;
+    effective_batch_size = output.domain.get_volume() / out_dim;
+    assert(effective_batch_size * in_dim == input.domain.get_volume());
+  } else {
+    in_dim = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+    out_dim = output.domain.hi()[0] - output.domain.lo()[0] + 1;
+    effective_batch_size = output.domain.get_volume() / out_dim;
+    assert(effective_batch_size * in_dim == input.domain.get_volume());
+  }
+  forward_kernel_wrapper(
+      m, input, output, kernel, in_dim, out_dim, effective_batch_size);
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    Embedding::save_inference_tensors_to_file(
+        m, shard_id, nullptr, {input}, {kernel}, {output});
+  }
+}
+
 void Embedding::backward(FFModel const &ff) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 3bfe429ddd..32b524f643 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -5929,6 +5929,24 @@ void register_flexflow_internal_tasks(Runtime *runtime,
           registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(ARG_TOPK_INF_SPECULATIVE_TASK_ID,
+                                   "ArgTopK Speculative Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<BeamInferenceResult,
+                                        ArgTopK::inference_speculative_task>(
+          registrar, "ArgTopK Speculative Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<BeamInferenceResult,
+                                     ArgTopK::inference_speculative_task>(
+          registrar);
+    }
+  }
   // BeamTopk task
   {
     TaskVariantRegistrar registrar(BEAM_TOPK_INIT_TASK_ID, "BeamTopK Init");

From d7e8d728b67557bebbf9f76de9b806575b8a4cc2 Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Tue, 2 Jan 2024 13:54:29 -0500
Subject: [PATCH 296/344] fix corner case

---
 include/flexflow/batch_config.h               | 14 ++-
 include/flexflow/config.h                     |  3 +-
 include/flexflow/model.h                      |  1 +
 .../inc_multihead_self_attention_utils.cuh    |  2 +-
 .../ops/spec_inc_multihead_self_attention.h   |  1 +
 .../ops/tree_inc_multihead_self_attention.h   |  1 +
 include/flexflow/request_manager.h            |  2 +
 inference/models/falcon.cc                    |  5 +-
 inference/models/llama.cc                     |  5 +-
 inference/models/mpt.cc                       |  5 +-
 inference/models/opt.cc                       |  5 +-
 inference/models/starcoder.cc                 |  5 +-
 src/ops/arg_topk.cu                           | 11 ++-
 src/ops/inc_multihead_self_attention.cu       |  4 +-
 src/ops/spec_inc_multihead_self_attention.cu  | 60 +++++++-----
 src/ops/tree_inc_multihead_self_attention.cu  | 62 +++++++------
 src/runtime/batch_config.cc                   |  6 ++
 src/runtime/beam_search_batch_config.cc       |  4 +
 src/runtime/model.cc                          | 14 +++
 src/runtime/request_manager.cc                | 93 +++++++++++--------
 src/runtime/request_manager.cu                | 28 +++++-
 21 files changed, 225 insertions(+), 106 deletions(-)

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 13904aaa46..ef17ef43ed 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -45,6 +45,7 @@ class BatchConfig {
   int num_active_tokens() const;
   static int max_requests_per_batch();
   static int max_tokens_per_batch();
+  static int max_verify_tokens_per_batch();
   static int max_sequence_length();
   friend std::ostream &operator<<(std::ostream &os, BatchConfig const &bc);
   void print() const;
@@ -72,6 +73,7 @@ class BatchConfig {
 
     // request id in batch config:
     int batch_config_request_id;
+    bool prompt_phase = false;
     RequestGuid request_guid;
   };
   struct PerTokenInfo {
@@ -85,15 +87,15 @@ class BatchConfig {
 
     // how many tokens before the tree, every sub requests need this part of
     // cache
-    int non_tree_cache_size;
+    int non_tree_cache_size = 0;
 
     // current tree size
-    int tree_size;
+    int tree_size = 0;
 
-    int this_layer_size;
+    int this_layer_size = 0;
 
     // input length-> prompt/root
-    int prompt_size;
+    int prompt_size = 0;
   };
 
   BitMask causalMask[MAX_NUM_REQUESTS];
@@ -145,9 +147,13 @@ class BeamSearchBatchConfig : public BatchConfig {
   bool done() const;
   int max_beam_depth_all_requests() const;
   int current_depth_all_requests() const;
+  int get_speculative_request_num() const;
 
   size_t beam_width;
   size_t target_iterations;
+
+  // how many requests is in speculative phase
+  int speculative_request_num = 0;
   inline static int const MAX_BEAM_WIDTH = 3;
   inline static int const MAX_BEAM_DEPTH = 8;
 
diff --git a/include/flexflow/config.h b/include/flexflow/config.h
index e1480264cc..17a3f59e29 100644
--- a/include/flexflow/config.h
+++ b/include/flexflow/config.h
@@ -84,7 +84,8 @@ struct FFHandler {
       sizeof(BeamSearchBatchConfig::beamTokenInfo) +
       sizeof(BeamSearchBatchConfig::beamRequestsInfo) +
       sizeof(BatchConfig::causalMask) +
-      sizeof(TreeVerifyBatchConfig::committed_tokens);
+      sizeof(TreeVerifyBatchConfig::committed_tokens) +
+      sizeof(BatchConfig::request_completed);
   void *offload_reserve_space;
   size_t offload_reserve_space_size;
   DataType quantization_type;
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index cf7bb3dd2d..6f805e21bd 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -73,6 +73,7 @@ enum TaskIDs {
   DROPOUT_BWD_TASK_ID,
   EMBED_INIT_TASK_ID,
   EMBED_FWD_TASK_ID,
+  EMBED_INF_TASK_ID,
   EMBED_BWD_TASK_ID,
   GATHER_INIT_TASK_ID,
   GATHER_FWD_TASK_ID,
diff --git a/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh b/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh
index c128c1a126..d1e0e050b2 100644
--- a/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh
+++ b/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh
@@ -493,7 +493,7 @@ inline void smem_size_in_bytes_tree(int hidden_size_per_head,
   }
 
   // todo fix this
-  int max_qk_length = max_query_length * max_total_length;
+  int max_qk_length = max_query_length;
 
   // The amount of shared memory needed to store the Q*K^T values in float.
   size_t qk_sz = div_up(max_qk_length + 1, 4) * 16;
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention.h b/include/flexflow/ops/spec_inc_multihead_self_attention.h
index a306f7985a..a0d01092bf 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention.h
@@ -142,6 +142,7 @@ class SpecIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
   Realm::RegionInstance beam_search_reserve_inst;
   BeamSearchBatchConfig::BeamSearchPerTokenInfo *beam_token_infos;
   BeamSearchBatchConfig::BeamSearchPerRequestInfo *beam_request_infos;
+  bool *request_completed;
   BatchConfig::BitMask *causalMask;
 };
 
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention.h b/include/flexflow/ops/tree_inc_multihead_self_attention.h
index d160da4a72..02df0c0137 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention.h
@@ -147,6 +147,7 @@ class TreeIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
   int num_active_tokens;
   Realm::RegionInstance committed_token_reserve_inst;
   TreeVerifyBatchConfig::CommittedTokensInfo *committed_token_infos;
+  bool *request_completed;
   BatchConfig::BitMask *causalMask;
 };
 
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index 1c4b0b2a2f..33714c106e 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -103,6 +103,7 @@ class RequestManager {
   int get_max_requests_per_batch();
   void set_max_tokens_per_batch(int max_num_tokens);
   int get_max_tokens_per_batch();
+  int get_max_verify_tokens_per_batch();
   void set_max_sequence_length(int max_seq_length);
   void push_spec_infer_tree_width(int tree_width);
   int get_max_sequence_length();
@@ -113,6 +114,7 @@ class RequestManager {
                           std::string const &path);
   void register_output_filepath(std::string const &);
   void initBitMask(BatchConfig::BitMask &bitmask, int initLength);
+  void appendPendingRequest(BatchConfig::BitMask &bitmask, int initLength);
   void appendBitMask(BatchConfig::BitMask &bitmask,
                      int newNodes,
                      int preBeamSize,
diff --git a/inference/models/falcon.cc b/inference/models/falcon.cc
index bfcec847b9..999ca37037 100644
--- a/inference/models/falcon.cc
+++ b/inference/models/falcon.cc
@@ -39,7 +39,10 @@ void FALCON::create_falcon_model(FFModel &ff,
   Tensor input;
   {
     // assert(falcon_config.max_num_tokens <= BatchConfig::MAX_NUM_TOKENS);
-    int const token_dims[] = {BatchConfig::max_tokens_per_batch(), 1};
+    int const token_dims[] = {mode == TREE_VERIFY_MODE
+                                  ? BatchConfig::max_verify_tokens_per_batch()
+                                  : BatchConfig::max_tokens_per_batch(),
+                              1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
 
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index e9c84efe90..e54d6d8811 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -41,7 +41,10 @@ void LLAMA::create_llama_model(FFModel &ff,
 
   Tensor input;
   {
-    int const token_dims[] = {BatchConfig::max_tokens_per_batch(), 1};
+    int const token_dims[] = {mode == TREE_VERIFY_MODE
+                                  ? BatchConfig::max_verify_tokens_per_batch()
+                                  : BatchConfig::max_tokens_per_batch(),
+                              1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
 
diff --git a/inference/models/mpt.cc b/inference/models/mpt.cc
index b074d332ed..3df67b264c 100644
--- a/inference/models/mpt.cc
+++ b/inference/models/mpt.cc
@@ -40,7 +40,10 @@ void MPT::create_mpt_model(FFModel &ff,
   //------------------------------ build the model --------------------------
   Tensor input;
   {
-    int const token_dims[] = {BatchConfig::max_tokens_per_batch(), 1};
+    int const token_dims[] = {mode == TREE_VERIFY_MODE
+                                  ? BatchConfig::max_verify_tokens_per_batch()
+                                  : BatchConfig::max_tokens_per_batch(),
+                              1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
 
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index 9b29ae5410..0279f83239 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -42,7 +42,10 @@ void OPT::create_opt_model(FFModel &ff,
   Tensor position_input;
   ff.set_position_offset(2);
   {
-    int const token_dims[] = {BatchConfig::max_tokens_per_batch(), 1};
+    int const token_dims[] = {mode == TREE_VERIFY_MODE
+                                  ? BatchConfig::max_verify_tokens_per_batch()
+                                  : BatchConfig::max_tokens_per_batch(),
+                              1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
     position_input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
diff --git a/inference/models/starcoder.cc b/inference/models/starcoder.cc
index ba7b2cb43a..e683376e47 100644
--- a/inference/models/starcoder.cc
+++ b/inference/models/starcoder.cc
@@ -48,7 +48,10 @@ void STARCODER::create_starcoder_model(
   ff.set_position_offset(0);
   {
     // assert(startcoder_config.max_num_tokens <= BatchConfig::MAX_NUM_TOKENS);
-    int const token_dims[] = {BatchConfig::max_tokens_per_batch(), 1};
+    int const token_dims[] = {mode == TREE_VERIFY_MODE
+                                  ? BatchConfig::max_verify_tokens_per_batch()
+                                  : BatchConfig::max_tokens_per_batch(),
+                              1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
     position_input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
diff --git a/src/ops/arg_topk.cu b/src/ops/arg_topk.cu
index 0b8bb8b563..3302178728 100644
--- a/src/ops/arg_topk.cu
+++ b/src/ops/arg_topk.cu
@@ -405,13 +405,20 @@ void ArgTopK::forward_kernel(ArgTopKMeta const *m,
 
     // check
     int beam_size = -1;
-    for (int i = 1; i < bc->max_requests_per_batch(); i++) {
+
+    // allow last request different with others
+    int num_activate_requests = bc->num_active_requests();
+    int last_request_idx =
+        bc->requestsInfo[num_activate_requests - 1].batch_config_request_id;
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
       if (bc->request_completed[i]) {
         continue;
       } else if (beam_size == -1) {
         beam_size = bc->beamRequestsInfo[i].beam_size;
-      } else {
+
+      } else if (i != last_request_idx) {
         assert(beam_size == bc->beamRequestsInfo[i].beam_size);
+      } else if (i == last_request_idx) {
       }
     }
 
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index db64868cb9..7c8601d3c8 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -1349,7 +1349,9 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
 
   // allocate memory for the seqArray and reserve space
   {
-    int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
+    int max_tokens_per_batch = infer_mode == TREE_VERIFY_MODE
+                                   ? BatchConfig::max_verify_tokens_per_batch()
+                                   : BatchConfig::max_tokens_per_batch();
     size_t qkv_max_proj_size = max_tokens_per_batch * (qProjSize * num_q_heads +
                                                        kProjSize * num_q_heads +
                                                        vProjSize * num_q_heads);
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 88dd3f92e4..b31e5d0994 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -50,7 +50,8 @@ __global__ void compute_spec_inc_attention_kernel_generation_kernel(
     int hidden_size,
     BatchConfig::PerRequestInfo *request_infos,
     BeamSearchBatchConfig::BeamSearchPerRequestInfo *beam_request_infos,
-    BatchConfig::BitMask *causalMask) {
+    BatchConfig::BitMask *causalMask,
+    bool *request_completed) {
 
   // q, k
   using Q_vec = typename VEC_K<DT, THREADS_PER_KEY>::Type;
@@ -86,11 +87,12 @@ __global__ void compute_spec_inc_attention_kernel_generation_kernel(
   //     request_infos[batch_config_request_id].first_token_depth_in_request +
   //     request_infos[batch_config_request_id].num_tokens_in_batch;
 
-  int const totalCacheSize = bitmask.non_tree_cache_size + bitmask.tree_size;
+  int const totalCacheSize =
+      bitmask.non_tree_cache_size + bitmask.tree_size + bitmask.prompt_size - 1;
 
   int first_token_idx = 0;
-  for (int r = 0; r < request_idx; r++) {
-    first_token_idx += causalMask[r].this_layer_size;
+  for (int r = 0; r < batch_config_request_id; r++) {
+    first_token_idx += request_completed[r] ? 0 : causalMask[r].this_layer_size;
   }
 
   int const tree_branch_num =
@@ -138,7 +140,8 @@ __global__ void compute_spec_inc_attention_kernel_generation_kernel(
           ii * THREADS_PER_KEY * K_VEC_SIZE);
     }
 
-    int const query_token = bitmask.tree_size - tree_branch_num + qi;
+    int const query_token =
+        bitmask.prompt_size + bitmask.tree_size - 1 - tree_branch_num + qi;
 
     __syncthreads();
     for (int ti = ko; ti < ti_end; ti += K_PER_ITER) {
@@ -163,8 +166,12 @@ __global__ void compute_spec_inc_attention_kernel_generation_kernel(
                            (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
                               (1 << query_token))));
 
-        // if (blockIdx.y == 0 && blockIdx.x == 0 && !mask) {
-        //   printf("spec inc attn qkqkqk %d,  %.10f, %d\n", ti, qk, qi);
+        // if (head_idx == 0 && ti == 0 && request_idx == 15 && !mask) {
+        //   printf("spec inc attn qkqkqk  request id %d,  %.10f, %d\n",
+        //          batch_config_request_id,
+        //          ti,
+        //          qk,
+        //          qi);
         // }
         qk_max = mask ? qk_max : fmaxf(qk_max, qk);
         qk_smem[ti - first_step] = mask ? 0.f : qk;
@@ -336,17 +343,12 @@ __global__ void spec_inc_store_kv_cache(
 
     BatchConfig::BitMask bitmask = causalMask[req_id];
 
-    // int const tree_branch_num = beamRequestInfos[req_id].sub_request_num;
-
-    // int const query_token = bitmask.non_tree_cache_size + bitmask.tree_size -
-    //                         tree_branch_num + sub_req_id + tok_id;
-    // bitmask.tree_size - tree_branch_num + sub_req_id;
-
     // if prompt token -> token id
     // if tree token:
-    int const cache_idx = bitmask.non_tree_cache_size + bitmask.tree_size -
-                          bitmask.this_layer_size + token_idx -
-                          request_token_offset;
+
+    int const cache_idx = bitmask.prompt_size + bitmask.non_tree_cache_size +
+                          bitmask.tree_size - 1 - bitmask.this_layer_size +
+                          token_idx - request_token_offset;
 
     kCache_ptr[req_id * (hidden_size * max_seq_len) + (cache_idx)*hidden_size +
                offset] = kVal;
@@ -411,7 +413,8 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
           m->hidden_size,                                                      \
           m->request_infos,                                                    \
           m->beam_request_infos,                                               \
-          m->causalMask)
+          m->causalMask,                                                       \
+          m->request_completed)
 
 template <typename DT>
 void compute_spec_inc_attention_kernel_generation(
@@ -420,7 +423,8 @@ void compute_spec_inc_attention_kernel_generation(
     DT *output_ptr,
     cudaStream_t stream) {
   // one block == one head per request
-  dim3 grid(m->num_q_heads, bc->num_active_requests());
+  // how many generation requests
+  dim3 grid(m->num_q_heads, bc->get_speculative_request_num());
   int const per_head_size = m->qProjSize;
   float scale = (*m->qk_prod_scaling) ? 1.0f / sqrt(m->kProjSize) : 1.0f;
   size_t smem_sz;
@@ -499,11 +503,10 @@ void compute_attention_kernel_prompt(SpecIncMultiHeadSelfAttentionMeta const *m,
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
     if (bc->request_completed[i]) {
       continue;
+    } else if (tokens_previous_requests < bc->num_generation_tokens) {
+      tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
+      continue;
     }
-    // else if (tokens_previous_requests < bc->num_generation_tokens) {
-    //   tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
-    //   continue;
-    // }
 
     // all requests in prompt phase should only have one sub requests;
     assert(bc->sub_requests[i] == 1);
@@ -659,10 +662,10 @@ void compute_attention_kernel_prompt(SpecIncMultiHeadSelfAttentionMeta const *m,
     // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
     // requests
 
-    // print_tensor<float>((float*)C_softmax, 32, "C_softmax");
+    int token_offset = bc->requestsInfo[i].first_token_offset_in_batch;
+
     C = static_cast<DT *>(m->attn_heads) +
-        (tokens_previous_requests + bc->num_generation_tokens) *
-            m->num_q_heads * m->vProjSize;
+        (token_offset)*m->num_q_heads * m->vProjSize;
     checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                          CUBLAS_OP_N,
                                          CUBLAS_OP_T,
@@ -860,6 +863,13 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
         sizeof(BatchConfig::tokensInfo) + sizeof(BatchConfig::requestsInfo) +
         sizeof(BeamSearchBatchConfig::beamTokenInfo) +
         sizeof(BeamSearchBatchConfig::beamRequestsInfo));
+
+    request_completed = reinterpret_cast<bool *>(
+        reinterpret_cast<char *>(handler.batch_config_metadata) +
+        sizeof(BatchConfig::tokensInfo) + sizeof(BatchConfig::requestsInfo) +
+        sizeof(BeamSearchBatchConfig::beamTokenInfo) +
+        sizeof(BeamSearchBatchConfig::beamRequestsInfo) +
+        sizeof(BatchConfig::causalMask));
   }
 
   cudaStreamSynchronize(stream);
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index b4af80976f..fc86e1498e 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -54,6 +54,7 @@ __global__ void compute_attention_kernel_fused_kernel(
     int num_heads,
     int num_requests,
     BatchConfig::BitMask *causalMask,
+    bool *request_completed,
     int qk_smem_sz) {
 
   // q, k
@@ -90,13 +91,14 @@ __global__ void compute_attention_kernel_fused_kernel(
   BatchConfig::BitMask bitmask = causalMask[batch_config_request_id];
 
   int first_token_idx = 0;
-  for (int r = 0; r < request_idx; r++) {
-    first_token_idx += request_infos[r].num_tokens_in_batch;
+  for (int r = 0; r < batch_config_request_id; r++) {
+    first_token_idx +=
+        request_completed[r] ? 0 : request_infos[r].num_tokens_in_batch;
   }
 
-  // if(tidx == 0 && head_idx == 0){
-  //   printf("tree req: %d, %d\n", request_idx, first_token_idx);
-  // }
+  bool prompt_phase = request_infos[batch_config_request_id].prompt_phase;
+  int q_start =
+      request_infos[batch_config_request_id].first_token_depth_in_request;
 
   // shared memory objects
   extern __shared__ char smem_[];
@@ -139,7 +141,7 @@ __global__ void compute_attention_kernel_fused_kernel(
           q_ptr + (hidden_size * QKV_WEIGHT_NUM * qi) + ki +
           ii * THREADS_PER_KEY * K_VEC_SIZE);
 
-      // if (head_idx == 0 && qi == 1 && tidx == 0) {
+      // if (head_idx == 0 && request_idx == 1 && tidx == 0) {
       //     printf("laod q %d,  %d %.10f\n",
       //     request_idx,
       //            qi,q_vecs[ki_o][ii].x);
@@ -163,19 +165,23 @@ __global__ void compute_attention_kernel_fused_kernel(
 
       if (ti < tlength && tidx % THREADS_PER_KEY == 0) {
         bool const mask =
-            (ti >= bitmask.non_tree_cache_size &&
-             (!(bitmask.mask[ti - bitmask.non_tree_cache_size] & (1 << qi))));
+            prompt_phase ? (qi + q_start < ti)
+                         : (ti >= bitmask.non_tree_cache_size &&
+                            (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
+                               (1 << qi))));
 
         qk_max = mask ? qk_max : fmaxf(qk_max, qk);
 
-        // if (head_idx == 0 && qi == 0 && !mask) {
-        //   printf("tree attn qkqkqkqk request id %d,  %d %.10f, %.10f, %.10f\n
-        //   ",
+        // if (head_idx == 0 && !mask) {
+        //   printf("tree attn qkqkqkqk request id %d qi%d, ti %d, %.10f, %.10f,
+        //   %.10f, %d\n",
         //          request_idx,
+        //          qi,
         //          ti,
         //          qk,
         //          q_vecs[ki_o][0].x,
-        //          k[0].x);
+        //          k[0].x,
+        //          bitmask.non_tree_cache_size);
         // }
         qk_smem[ti - first_step] = mask ? 0.0f : qk;
       }
@@ -217,8 +223,10 @@ __global__ void compute_attention_kernel_fused_kernel(
     float exp_sum = 0.f;
     for (int ti = first_step + tidx; ti < tlength; ti += THREADS_PER_BLOCK) {
       bool const mask =
-          (ti >= bitmask.non_tree_cache_size &&
-           (!(bitmask.mask[ti - bitmask.non_tree_cache_size] & (1 << qi))));
+          prompt_phase ? (q_start + qi < ti)
+                       : (ti >= bitmask.non_tree_cache_size &&
+                          (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
+                             (1 << qi))));
       float logit = mask ? 0.0f : __expf(qk_smem[ti - first_step] - qk_max);
       exp_sum += logit;
       qk_smem[ti - first_step] = mask ? 0.0f : logit;
@@ -265,8 +273,11 @@ __global__ void compute_attention_kernel_fused_kernel(
 
         if (ti < tlength) {
           bool const mask =
-              (ti >= bitmask.non_tree_cache_size &&
-               (!(bitmask.mask[ti - bitmask.non_tree_cache_size] & (1 << qi))));
+              prompt_phase
+                  ? (q_start + qi < ti)
+                  : (ti >= bitmask.non_tree_cache_size &&
+                     (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
+                        (1 << qi))));
           float logit = mask ? 0.0f : qk_smem[ti - first_step];
           out = FlexFlow::fma(logit, cast_to_float(v), out);
         }
@@ -810,6 +821,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
           m->num_q_heads,                                                      \
           bc->num_active_requests(),                                           \
           m->causalMask,                                                       \
+          m->request_completed,                                                \
           smem_sz[0])
 
 template <typename DT>
@@ -841,7 +853,6 @@ void compute_attention_kernel_fused(TreeIncMultiHeadSelfAttentionMeta const *m,
   dim3 grid(m->num_q_heads, bc->num_active_requests());
   int const per_head_size = m->qProjSize;
   float scale = (*m->qk_prod_scaling) ? 1.0f / sqrt(m->kProjSize) : 1.0f;
-
   // 0->qk production size, 1->total shared size
   int smem_sz[2];
   if (per_head_size == 64) {
@@ -890,17 +901,6 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
   // std::cout << "tokens to be committed: " << bc->num_tokens_to_commit <<
   // "\n";
 
-  cudaMemcpyAsync(m->committed_token_infos,
-                  &(bc->committed_tokens),
-                  bc->num_tokens_to_commit *
-                      sizeof(TreeVerifyBatchConfig::CommittedTokensInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
-  cudaMemcpyAsync(m->causalMask,
-                  &(bc->causalMask),
-                  bc->num_active_requests() * sizeof(BatchConfig::BitMask),
-                  cudaMemcpyHostToDevice,
-                  stream);
   commit_tokens<DT>(m, bc, stream);
 
   // After commit we update m->num_active_tokens to be the number of active
@@ -1068,6 +1068,12 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
             sizeof(BatchConfig::tokensInfo) +
             sizeof(BatchConfig::requestsInfo) +
             sizeof(BatchConfig::causalMask));
+
+    request_completed = reinterpret_cast<bool *>(
+        reinterpret_cast<char *>(handler.batch_config_metadata) +
+        sizeof(BatchConfig::tokensInfo) + sizeof(BatchConfig::requestsInfo) +
+        sizeof(BatchConfig::causalMask) +
+        sizeof(TreeVerifyBatchConfig::committed_tokens));
   }
 
   cudaStreamSynchronize(stream);
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index d2fbc0883f..c432208eca 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -84,6 +84,12 @@ int BatchConfig::max_tokens_per_batch() {
   return RequestManager::get_request_manager()->get_max_tokens_per_batch();
 }
 
+/*static*/
+int BatchConfig::max_verify_tokens_per_batch() {
+  return RequestManager::get_request_manager()
+      ->get_max_verify_tokens_per_batch();
+}
+
 /*static*/
 int BatchConfig::max_sequence_length() {
   return RequestManager::get_request_manager()->get_max_sequence_length();
diff --git a/src/runtime/beam_search_batch_config.cc b/src/runtime/beam_search_batch_config.cc
index 74843e9460..ff7bf1a819 100644
--- a/src/runtime/beam_search_batch_config.cc
+++ b/src/runtime/beam_search_batch_config.cc
@@ -85,6 +85,10 @@ int BeamSearchBatchConfig::max_beam_depth_all_requests() const {
   return max_depth_all_requests;
 }
 
+int BeamSearchBatchConfig::get_speculative_request_num() const {
+  return speculative_request_num;
+}
+
 int BeamSearchBatchConfig::current_depth_all_requests() const {
   int current_depth = 0;
   for (int i = 0; i < BeamSearchBatchConfig::max_requests_per_batch(); i++) {
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 32b524f643..76bed36bda 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -4805,6 +4805,20 @@ void register_flexflow_internal_tasks(Runtime *runtime,
       runtime->register_task_variant<Embedding::forward_task>(registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(EMBED_INF_TASK_ID, "Embedding Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<Embedding::inference_task>(
+          registrar, "Embedding Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<Embedding::inference_task>(registrar);
+    }
+  }
   {
     TaskVariantRegistrar registrar(EMBED_BWD_TASK_ID, "Embedding Backward");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 89d4ddaed4..88754f5a82 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -97,6 +97,12 @@ int RequestManager::get_max_tokens_per_batch() {
   return max_tokens_per_batch;
 }
 
+int RequestManager::get_max_verify_tokens_per_batch() {
+  assert(max_tokens_per_batch > 0);
+  return max_tokens_per_batch +
+         BatchConfig::MAX_SPEC_TREE_TOKEN_NUM * max_requests_per_batch;
+}
+
 void RequestManager::set_max_sequence_length(int max_seq_length) {
   assert(max_sequence_length == -1 || max_sequence_length == max_seq_length);
   max_sequence_length = max_seq_length;
@@ -1126,7 +1132,6 @@ BeamSearchBatchConfig
                     old_bc.beamRequestsInfo[i].sub_request_num,
                     tree,
                     old_bc.beamRequestsInfo[i].current_depth);
-      // assert(false);
       for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
         int depth = new_bc.requestsInfo[i].first_token_depth_in_request + j;
         for (int k = 0; k < new_bc.beamRequestsInfo[i].sub_request_num; k++) {
@@ -1146,6 +1151,9 @@ BeamSearchBatchConfig
     }
   }
 
+  // how many requests is in speculative phase
+  new_bc.speculative_request_num = num_active_req + 1;
+
   // Add prompt tokens to the batch
   for (int i = 0; i < BatchConfig::max_requests_per_batch(); i++) {
     if (old_bc.request_completed[i] || old_bc.request_running[i]) {
@@ -1184,13 +1192,14 @@ BeamSearchBatchConfig
           spec_infer_tree_width.size() > ssm_decoding_steps
               ? spec_infer_tree_width[ssm_decoding_steps]
               : 1;
-      printf("beam size: %d, %d\n",
-             new_bc.beamRequestsInfo[i].beam_size,
-             ssm_decoding_steps);
+      // printf("beam size: %d, %d\n",
+      //        new_bc.beamRequestsInfo[i].beam_size,
+      //        ssm_decoding_steps);
       new_bc.beamRequestsInfo[i].max_depth =
           old_bc.beamRequestsInfo[i].max_depth;
-      new_bc.sub_requests[i] =
-          old_bc.sub_requests[i] * new_bc.beamRequestsInfo[i].beam_size;
+      // new_bc.sub_requests[i] =
+      //     old_bc.sub_requests[i] * new_bc.beamRequestsInfo[i].beam_size;
+      new_bc.sub_requests[i] = 1;
       new_bc.beamRequestsInfo[i].sub_request_num =
           old_bc.beamRequestsInfo[i].sub_request_num;
 
@@ -1218,6 +1227,9 @@ BeamSearchBatchConfig
           request.tokens.size()) {
         // request is done
         new_bc.requestsInfo[i].num_tokens_in_batch = 0;
+        new_bc.causalMask[i].this_layer_size = 0;
+        new_bc.beamRequestsInfo[i].sub_request_num = 0;
+        new_bc.beamRequestsInfo[i].beam_size = 1;
       } else {
         // Prompt phase
         new_bc.requestsInfo[i].num_tokens_in_batch =
@@ -1227,12 +1239,8 @@ BeamSearchBatchConfig
                          new_bc.requestsInfo[i].first_token_depth_in_request);
         request.ssm_cache_size += new_bc.requestsInfo[i].num_tokens_in_batch;
         BeamTree tree = request.beam_trees[old_bc.model_id];
-        appendBitMask(new_bc.causalMask[i],
-                      new_bc.beamRequestsInfo[i].sub_request_num,
-                      old_bc.beamRequestsInfo[i].beam_size,
-                      old_bc.beamRequestsInfo[i].sub_request_num,
-                      tree,
-                      old_bc.beamRequestsInfo[i].current_depth);
+        appendPendingRequest(new_bc.causalMask[i],
+                             new_bc.requestsInfo[i].num_tokens_in_batch);
       }
 
       if (verbose) {
@@ -1258,11 +1266,11 @@ BeamSearchBatchConfig
 
           // get value from requestinfo
           new_bc.tokensInfo[new_bc.num_tokens].token_id =
-              request.tokens[request.tokens.size() - 1];
+              request.tokens[request.tokens.size() -
+                             new_bc.requestsInfo[i].num_tokens_in_batch + j];
 
           new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = k;
           new_bc.num_tokens++;
-          num_generation_tokens++;
         }
       }
     }
@@ -1319,7 +1327,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
   new_bc.num_tokens_to_commit = 0;
   new_bc.num_tokens = 0;
 
-  int max_prompt_load_size = get_max_tokens_per_batch();
+  int max_prompt_load_size = get_max_verify_tokens_per_batch();
   for (int i = 0; i < TreeVerifyBatchConfig::max_requests_per_batch(); i++) {
     if (old_batches.at(0).request_completed[i]) {
       continue;
@@ -1427,7 +1435,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       new_bc.num_tokens++;
       new_bc.requestsInfo[i].num_tokens_in_batch++;
 
-      if (new_bc.num_tokens > get_max_tokens_per_batch()) {
+      if (new_bc.num_tokens > get_max_verify_tokens_per_batch()) {
         assert(false &&
                "Exceeding the space available in the TreeVerify batch");
         break;
@@ -1453,7 +1461,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
         new_bc.num_tokens++;
         new_bc.requestsInfo[i].num_tokens_in_batch++;
 
-        if (new_bc.num_tokens == get_max_tokens_per_batch() &&
+        if (new_bc.num_tokens == get_max_verify_tokens_per_batch() &&
             (j != dfs_tree_inputs.size() - 1)) {
           cutLayer = true;
           break;
@@ -1542,7 +1550,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
           new_bc.num_tokens++;
         }
 
-        if (new_bc.num_tokens > get_max_tokens_per_batch()) {
+        if (new_bc.num_tokens > get_max_verify_tokens_per_batch()) {
           assert(false &&
                  "Exceeding the space available in the TreeVerify batch");
           break;
@@ -1555,15 +1563,17 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
           request.status = Request::RUNNING;
           new_bc.request_running[i] = true;
 
-          std::cout << "new_bc.requestsInfo[i].num_tokens_in_batch: "
-                    << new_bc.requestsInfo[i].num_tokens_in_batch << std::endl;
+          // std::cout << "new_bc.requestsInfo[i].num_tokens_in_batch: "
+          //           << new_bc.requestsInfo[i].num_tokens_in_batch <<
+          //           std::endl;
+          new_bc.requestsInfo[i].prompt_phase = true;
 
           dfs_tree_inputs[guid] =
               std::vector<std::pair<BatchConfig::TokenId, int>>{std::make_pair(
                   request.tokens.back(), request.tokens.size() - 1)};
         }
       } else { // launch the request into running phase after loading all prompt
-        if (get_max_tokens_per_batch() - new_bc.num_tokens > 0) {
+        if (get_max_verify_tokens_per_batch() - new_bc.num_tokens > 0) {
           // std::cout << "Initialization running phase: "
           //           << new_bc.requestsInfo[i].num_tokens_in_batch << "\n";
           request.status = Request::RUNNING;
@@ -1576,9 +1586,11 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
 
           new_bc.num_tokens++;
           new_bc.requestsInfo[i].num_tokens_in_batch++;
-          std::cout << "new_bc.requestsInfo[i].num_tokens_in_batch: "
-                    << new_bc.requestsInfo[i].num_tokens_in_batch << std::endl;
+          // std::cout << "new_bc.requestsInfo[i].num_tokens_in_batch2: "
+          //           << new_bc.requestsInfo[i].num_tokens_in_batch <<
+          //           std::endl;
 
+          new_bc.requestsInfo[i].prompt_phase = true;
           dfs_tree_inputs[guid] =
               std::vector<std::pair<BatchConfig::TokenId, int>>{std::make_pair(
                   request.tokens.back(), request.tokens.size() - 1)};
@@ -1760,20 +1772,14 @@ void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
 // prompt phase, init task
 void RequestManager::initBitMask(BatchConfig::BitMask &bitmask,
                                  int initLength) {
-  assert(initLength <= BatchConfig::MAX_SPEC_TREE_TOKEN_NUM &&
-         "do not support tree size > 64");
+  assert(initLength > 0);
   // eg. 4 tokens: t1: 0000000..1111, t2: 0000000..1110, t3: 0000000..1100, t4:
   // 0000000..1000
   bitmask.non_tree_cache_size = 0;
-  bitmask.tree_size = initLength;
+  bitmask.tree_size = 1;
 
   bitmask.prompt_size = initLength;
   bitmask.this_layer_size = initLength;
-  for (int i = 0; i < bitmask.prompt_size; i++) {
-    for (int j = i; j < bitmask.prompt_size; j++) {
-      bitmask.mask[i] |= (1 << j);
-    }
-  }
   // std::cout << "see bit mask" << bitmask.prompt_size << "\n";
   // std::cout << "see bit mask" << std::bitset<64>(bitmask.mask[0]) << "\n";
   // std::cout << "see bit mask" << std::bitset<64>(bitmask.mask[1]) << "\n";
@@ -1810,6 +1816,25 @@ void RequestManager::updateBitMask(BatchConfig::BitMask &bitmask,
   //           << "\n";
 }
 
+// prompt phase, init task
+void RequestManager::appendPendingRequest(BatchConfig::BitMask &bitmask,
+                                          int initLength) {
+  assert(initLength > 0);
+  std::cout << "append pending bit mask: " << initLength << "\n";
+  // eg. 4 tokens: t1: 0000000..1111, t2: 0000000..1110, t3: 0000000..1100, t4:
+  // 0000000..1000
+  bitmask.non_tree_cache_size = 0;
+  bitmask.tree_size = 1;
+  bitmask.prompt_size += initLength;
+  bitmask.this_layer_size = initLength;
+
+  // for (int i = 0; i < bitmask.prompt_size; i++) {
+  //   for (int j = i; j < bitmask.prompt_size; j++) {
+  //     bitmask.mask[i] |= (1 << j);
+  //   }
+  // }
+}
+
 // prepare next beam, append layers to the tree
 void RequestManager::appendBitMask(BatchConfig::BitMask &bitmask,
                                    int newNodes,
@@ -1862,12 +1887,6 @@ void RequestManager::appendBitMask(BatchConfig::BitMask &bitmask,
     }
   }
 
-  // std::cout << "token idx: " << token_idx << ", " << pre_tree_size << ", "
-  //           << new_nodes_start_idx << ", " << newNodes
-  //           << "current depth: " << currentDepth << "\n";
-  // std::cout << "new nodes end " << new_nodes_start_idx << "\n";
-
-  // std::cout << "tree size: " << bitmask.tree_size << "\n";
   assert(token_idx == pre_tree_size);
   assert(currentDepth <= 1 || new_nodes_start_idx == bitmask.tree_size);
 
diff --git a/src/runtime/request_manager.cu b/src/runtime/request_manager.cu
index 51c52c3026..8380d6be73 100644
--- a/src/runtime/request_manager.cu
+++ b/src/runtime/request_manager.cu
@@ -35,10 +35,17 @@ void RequestManager::load_tokens_task(
 
   // Extreme long prompts are not supported, only load up to
   // BatchConfig::max_tokens_per_batch() as prompt
-  if (batch_config->num_tokens > BatchConfig::max_tokens_per_batch()) {
+  if (batch_config->num_tokens > BatchConfig::max_tokens_per_batch() &&
+      batch_config->get_mode() == INC_DECODING_MODE) {
     printf("Warning: too many tokens in prompt, only load up to %d tokens\n",
            BatchConfig::max_tokens_per_batch());
     printf("Got: %d tokens\n", batch_config->num_tokens);
+  } else if (batch_config->num_tokens >
+             BatchConfig::max_verify_tokens_per_batch()) {
+    printf("Warning: Speculative decoding. too many tokens in prompt, only "
+           "load up to %d tokens\n",
+           BatchConfig::max_verify_tokens_per_batch());
+    printf("Got: %d tokens\n", batch_config->num_tokens);
   }
 
   for (int i = 0; i < batch_config->num_tokens; i++) {
@@ -117,8 +124,16 @@ void RequestManager::load_batch_config_task(
         sizeof(BatchConfig::causalMask),
         cudaMemcpyHostToDevice,
         stream));
-
     total_copy_size += sizeof(BatchConfig::causalMask);
+
+    checkCUDA(cudaMemcpyAsync(
+        static_cast<char *>(handle.batch_config_metadata) + total_copy_size,
+        &(batch_config->request_completed),
+        sizeof(BatchConfig::request_completed),
+        cudaMemcpyHostToDevice,
+        stream));
+
+    total_copy_size += sizeof(BatchConfig::request_completed);
   } else if (batch_config->get_mode() == TREE_VERIFY_MODE) {
     TreeVerifyBatchConfig const *tree_batch_config =
         static_cast<TreeVerifyBatchConfig const *>(batch_config);
@@ -137,6 +152,15 @@ void RequestManager::load_batch_config_task(
         cudaMemcpyHostToDevice,
         stream));
     total_copy_size += sizeof(TreeVerifyBatchConfig::committed_tokens);
+
+    checkCUDA(cudaMemcpyAsync(
+        static_cast<char *>(handle.batch_config_metadata) + total_copy_size,
+        &(batch_config->request_completed),
+        sizeof(BatchConfig::request_completed),
+        cudaMemcpyHostToDevice,
+        stream));
+
+    total_copy_size += sizeof(BatchConfig::request_completed);
   }
 
   // add a size check

From a45826e9daa0364b49f353c1c85cf2a9800bc1d9 Mon Sep 17 00:00:00 2001
From: Xinhao Cheng <99570243+xinhaoc@users.noreply.github.com>
Date: Tue, 2 Jan 2024 15:28:52 -0500
Subject: [PATCH 297/344] SpecInfer fix corner case (#1258)

* init

* fix speculative

* fix speculative

* bitmap+tree verify

* fix.

* fix

* multi batch

* copy metadata once

* fix some corner cases

* Replicate load_token tasks so that it can be fused with other compute tasks; this eliminates Replicate and enables a larger fused op

* more fix.

* clean up

* .

* load batchconfig

* clean

* hip

* hip

* embedding return when no token

* use arg topk instead of beam topk

* embedding

* fmt

* hip

* fix corner case

---------

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 include/flexflow/batch_config.h               | 14 ++-
 include/flexflow/config.h                     |  3 +-
 include/flexflow/model.h                      |  1 +
 .../inc_multihead_self_attention_utils.cuh    |  2 +-
 .../ops/spec_inc_multihead_self_attention.h   |  1 +
 .../ops/tree_inc_multihead_self_attention.h   |  1 +
 include/flexflow/request_manager.h            |  2 +
 inference/models/falcon.cc                    |  5 +-
 inference/models/llama.cc                     |  5 +-
 inference/models/mpt.cc                       |  5 +-
 inference/models/opt.cc                       |  5 +-
 inference/models/starcoder.cc                 |  5 +-
 src/ops/arg_topk.cu                           | 11 ++-
 src/ops/inc_multihead_self_attention.cu       |  4 +-
 src/ops/spec_inc_multihead_self_attention.cu  | 60 +++++++-----
 src/ops/tree_inc_multihead_self_attention.cu  | 62 +++++++------
 src/runtime/batch_config.cc                   |  6 ++
 src/runtime/beam_search_batch_config.cc       |  4 +
 src/runtime/model.cc                          | 14 +++
 src/runtime/request_manager.cc                | 93 +++++++++++--------
 src/runtime/request_manager.cu                | 28 +++++-
 21 files changed, 224 insertions(+), 107 deletions(-)

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 13904aaa46..ef17ef43ed 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -45,6 +45,7 @@ class BatchConfig {
   int num_active_tokens() const;
   static int max_requests_per_batch();
   static int max_tokens_per_batch();
+  static int max_verify_tokens_per_batch();
   static int max_sequence_length();
   friend std::ostream &operator<<(std::ostream &os, BatchConfig const &bc);
   void print() const;
@@ -72,6 +73,7 @@ class BatchConfig {
 
     // request id in batch config:
     int batch_config_request_id;
+    bool prompt_phase = false;
     RequestGuid request_guid;
   };
   struct PerTokenInfo {
@@ -85,15 +87,15 @@ class BatchConfig {
 
     // how many tokens before the tree, every sub requests need this part of
     // cache
-    int non_tree_cache_size;
+    int non_tree_cache_size = 0;
 
     // current tree size
-    int tree_size;
+    int tree_size = 0;
 
-    int this_layer_size;
+    int this_layer_size = 0;
 
     // input length-> prompt/root
-    int prompt_size;
+    int prompt_size = 0;
   };
 
   BitMask causalMask[MAX_NUM_REQUESTS];
@@ -145,9 +147,13 @@ class BeamSearchBatchConfig : public BatchConfig {
   bool done() const;
   int max_beam_depth_all_requests() const;
   int current_depth_all_requests() const;
+  int get_speculative_request_num() const;
 
   size_t beam_width;
   size_t target_iterations;
+
+  // how many requests is in speculative phase
+  int speculative_request_num = 0;
   inline static int const MAX_BEAM_WIDTH = 3;
   inline static int const MAX_BEAM_DEPTH = 8;
 
diff --git a/include/flexflow/config.h b/include/flexflow/config.h
index e1480264cc..17a3f59e29 100644
--- a/include/flexflow/config.h
+++ b/include/flexflow/config.h
@@ -84,7 +84,8 @@ struct FFHandler {
       sizeof(BeamSearchBatchConfig::beamTokenInfo) +
       sizeof(BeamSearchBatchConfig::beamRequestsInfo) +
       sizeof(BatchConfig::causalMask) +
-      sizeof(TreeVerifyBatchConfig::committed_tokens);
+      sizeof(TreeVerifyBatchConfig::committed_tokens) +
+      sizeof(BatchConfig::request_completed);
   void *offload_reserve_space;
   size_t offload_reserve_space_size;
   DataType quantization_type;
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index cf7bb3dd2d..6f805e21bd 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -73,6 +73,7 @@ enum TaskIDs {
   DROPOUT_BWD_TASK_ID,
   EMBED_INIT_TASK_ID,
   EMBED_FWD_TASK_ID,
+  EMBED_INF_TASK_ID,
   EMBED_BWD_TASK_ID,
   GATHER_INIT_TASK_ID,
   GATHER_FWD_TASK_ID,
diff --git a/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh b/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh
index c128c1a126..d1e0e050b2 100644
--- a/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh
+++ b/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh
@@ -493,7 +493,7 @@ inline void smem_size_in_bytes_tree(int hidden_size_per_head,
   }
 
   // todo fix this
-  int max_qk_length = max_query_length * max_total_length;
+  int max_qk_length = max_query_length;
 
   // The amount of shared memory needed to store the Q*K^T values in float.
   size_t qk_sz = div_up(max_qk_length + 1, 4) * 16;
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention.h b/include/flexflow/ops/spec_inc_multihead_self_attention.h
index a306f7985a..a0d01092bf 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention.h
@@ -142,6 +142,7 @@ class SpecIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
   Realm::RegionInstance beam_search_reserve_inst;
   BeamSearchBatchConfig::BeamSearchPerTokenInfo *beam_token_infos;
   BeamSearchBatchConfig::BeamSearchPerRequestInfo *beam_request_infos;
+  bool *request_completed;
   BatchConfig::BitMask *causalMask;
 };
 
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention.h b/include/flexflow/ops/tree_inc_multihead_self_attention.h
index d160da4a72..02df0c0137 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention.h
@@ -147,6 +147,7 @@ class TreeIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
   int num_active_tokens;
   Realm::RegionInstance committed_token_reserve_inst;
   TreeVerifyBatchConfig::CommittedTokensInfo *committed_token_infos;
+  bool *request_completed;
   BatchConfig::BitMask *causalMask;
 };
 
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index 1c4b0b2a2f..33714c106e 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -103,6 +103,7 @@ class RequestManager {
   int get_max_requests_per_batch();
   void set_max_tokens_per_batch(int max_num_tokens);
   int get_max_tokens_per_batch();
+  int get_max_verify_tokens_per_batch();
   void set_max_sequence_length(int max_seq_length);
   void push_spec_infer_tree_width(int tree_width);
   int get_max_sequence_length();
@@ -113,6 +114,7 @@ class RequestManager {
                           std::string const &path);
   void register_output_filepath(std::string const &);
   void initBitMask(BatchConfig::BitMask &bitmask, int initLength);
+  void appendPendingRequest(BatchConfig::BitMask &bitmask, int initLength);
   void appendBitMask(BatchConfig::BitMask &bitmask,
                      int newNodes,
                      int preBeamSize,
diff --git a/inference/models/falcon.cc b/inference/models/falcon.cc
index bfcec847b9..999ca37037 100644
--- a/inference/models/falcon.cc
+++ b/inference/models/falcon.cc
@@ -39,7 +39,10 @@ void FALCON::create_falcon_model(FFModel &ff,
   Tensor input;
   {
     // assert(falcon_config.max_num_tokens <= BatchConfig::MAX_NUM_TOKENS);
-    int const token_dims[] = {BatchConfig::max_tokens_per_batch(), 1};
+    int const token_dims[] = {mode == TREE_VERIFY_MODE
+                                  ? BatchConfig::max_verify_tokens_per_batch()
+                                  : BatchConfig::max_tokens_per_batch(),
+                              1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
 
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index e9c84efe90..e54d6d8811 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -41,7 +41,10 @@ void LLAMA::create_llama_model(FFModel &ff,
 
   Tensor input;
   {
-    int const token_dims[] = {BatchConfig::max_tokens_per_batch(), 1};
+    int const token_dims[] = {mode == TREE_VERIFY_MODE
+                                  ? BatchConfig::max_verify_tokens_per_batch()
+                                  : BatchConfig::max_tokens_per_batch(),
+                              1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
 
diff --git a/inference/models/mpt.cc b/inference/models/mpt.cc
index b074d332ed..3df67b264c 100644
--- a/inference/models/mpt.cc
+++ b/inference/models/mpt.cc
@@ -40,7 +40,10 @@ void MPT::create_mpt_model(FFModel &ff,
   //------------------------------ build the model --------------------------
   Tensor input;
   {
-    int const token_dims[] = {BatchConfig::max_tokens_per_batch(), 1};
+    int const token_dims[] = {mode == TREE_VERIFY_MODE
+                                  ? BatchConfig::max_verify_tokens_per_batch()
+                                  : BatchConfig::max_tokens_per_batch(),
+                              1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
 
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index 9b29ae5410..0279f83239 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -42,7 +42,10 @@ void OPT::create_opt_model(FFModel &ff,
   Tensor position_input;
   ff.set_position_offset(2);
   {
-    int const token_dims[] = {BatchConfig::max_tokens_per_batch(), 1};
+    int const token_dims[] = {mode == TREE_VERIFY_MODE
+                                  ? BatchConfig::max_verify_tokens_per_batch()
+                                  : BatchConfig::max_tokens_per_batch(),
+                              1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
     position_input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
diff --git a/inference/models/starcoder.cc b/inference/models/starcoder.cc
index ba7b2cb43a..e683376e47 100644
--- a/inference/models/starcoder.cc
+++ b/inference/models/starcoder.cc
@@ -48,7 +48,10 @@ void STARCODER::create_starcoder_model(
   ff.set_position_offset(0);
   {
     // assert(startcoder_config.max_num_tokens <= BatchConfig::MAX_NUM_TOKENS);
-    int const token_dims[] = {BatchConfig::max_tokens_per_batch(), 1};
+    int const token_dims[] = {mode == TREE_VERIFY_MODE
+                                  ? BatchConfig::max_verify_tokens_per_batch()
+                                  : BatchConfig::max_tokens_per_batch(),
+                              1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
     position_input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
diff --git a/src/ops/arg_topk.cu b/src/ops/arg_topk.cu
index 0b8bb8b563..5b7978812c 100644
--- a/src/ops/arg_topk.cu
+++ b/src/ops/arg_topk.cu
@@ -404,17 +404,22 @@ void ArgTopK::forward_kernel(ArgTopKMeta const *m,
     assert(bc->num_active_requests() >= 0);
 
     // check
+    // allow last request different with others
     int beam_size = -1;
-    for (int i = 1; i < bc->max_requests_per_batch(); i++) {
+    int num_activate_requests = bc->num_active_requests();
+    int last_request_idx =
+        bc->requestsInfo[num_activate_requests - 1].batch_config_request_id;
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
       if (bc->request_completed[i]) {
         continue;
       } else if (beam_size == -1) {
         beam_size = bc->beamRequestsInfo[i].beam_size;
-      } else {
+
+      } else if (i != last_request_idx) {
         assert(beam_size == bc->beamRequestsInfo[i].beam_size);
+      } else if (i == last_request_idx) {
       }
     }
-
     assert(num_shards >= (size_t)beam_size);
     num_shards = k;
     arg_topk_forward_kernel<<<num_blocks, num_shards, 0, stream>>>(
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index db64868cb9..7c8601d3c8 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -1349,7 +1349,9 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
 
   // allocate memory for the seqArray and reserve space
   {
-    int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
+    int max_tokens_per_batch = infer_mode == TREE_VERIFY_MODE
+                                   ? BatchConfig::max_verify_tokens_per_batch()
+                                   : BatchConfig::max_tokens_per_batch();
     size_t qkv_max_proj_size = max_tokens_per_batch * (qProjSize * num_q_heads +
                                                        kProjSize * num_q_heads +
                                                        vProjSize * num_q_heads);
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 88dd3f92e4..b31e5d0994 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -50,7 +50,8 @@ __global__ void compute_spec_inc_attention_kernel_generation_kernel(
     int hidden_size,
     BatchConfig::PerRequestInfo *request_infos,
     BeamSearchBatchConfig::BeamSearchPerRequestInfo *beam_request_infos,
-    BatchConfig::BitMask *causalMask) {
+    BatchConfig::BitMask *causalMask,
+    bool *request_completed) {
 
   // q, k
   using Q_vec = typename VEC_K<DT, THREADS_PER_KEY>::Type;
@@ -86,11 +87,12 @@ __global__ void compute_spec_inc_attention_kernel_generation_kernel(
   //     request_infos[batch_config_request_id].first_token_depth_in_request +
   //     request_infos[batch_config_request_id].num_tokens_in_batch;
 
-  int const totalCacheSize = bitmask.non_tree_cache_size + bitmask.tree_size;
+  int const totalCacheSize =
+      bitmask.non_tree_cache_size + bitmask.tree_size + bitmask.prompt_size - 1;
 
   int first_token_idx = 0;
-  for (int r = 0; r < request_idx; r++) {
-    first_token_idx += causalMask[r].this_layer_size;
+  for (int r = 0; r < batch_config_request_id; r++) {
+    first_token_idx += request_completed[r] ? 0 : causalMask[r].this_layer_size;
   }
 
   int const tree_branch_num =
@@ -138,7 +140,8 @@ __global__ void compute_spec_inc_attention_kernel_generation_kernel(
           ii * THREADS_PER_KEY * K_VEC_SIZE);
     }
 
-    int const query_token = bitmask.tree_size - tree_branch_num + qi;
+    int const query_token =
+        bitmask.prompt_size + bitmask.tree_size - 1 - tree_branch_num + qi;
 
     __syncthreads();
     for (int ti = ko; ti < ti_end; ti += K_PER_ITER) {
@@ -163,8 +166,12 @@ __global__ void compute_spec_inc_attention_kernel_generation_kernel(
                            (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
                               (1 << query_token))));
 
-        // if (blockIdx.y == 0 && blockIdx.x == 0 && !mask) {
-        //   printf("spec inc attn qkqkqk %d,  %.10f, %d\n", ti, qk, qi);
+        // if (head_idx == 0 && ti == 0 && request_idx == 15 && !mask) {
+        //   printf("spec inc attn qkqkqk  request id %d,  %.10f, %d\n",
+        //          batch_config_request_id,
+        //          ti,
+        //          qk,
+        //          qi);
         // }
         qk_max = mask ? qk_max : fmaxf(qk_max, qk);
         qk_smem[ti - first_step] = mask ? 0.f : qk;
@@ -336,17 +343,12 @@ __global__ void spec_inc_store_kv_cache(
 
     BatchConfig::BitMask bitmask = causalMask[req_id];
 
-    // int const tree_branch_num = beamRequestInfos[req_id].sub_request_num;
-
-    // int const query_token = bitmask.non_tree_cache_size + bitmask.tree_size -
-    //                         tree_branch_num + sub_req_id + tok_id;
-    // bitmask.tree_size - tree_branch_num + sub_req_id;
-
     // if prompt token -> token id
     // if tree token:
-    int const cache_idx = bitmask.non_tree_cache_size + bitmask.tree_size -
-                          bitmask.this_layer_size + token_idx -
-                          request_token_offset;
+
+    int const cache_idx = bitmask.prompt_size + bitmask.non_tree_cache_size +
+                          bitmask.tree_size - 1 - bitmask.this_layer_size +
+                          token_idx - request_token_offset;
 
     kCache_ptr[req_id * (hidden_size * max_seq_len) + (cache_idx)*hidden_size +
                offset] = kVal;
@@ -411,7 +413,8 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
           m->hidden_size,                                                      \
           m->request_infos,                                                    \
           m->beam_request_infos,                                               \
-          m->causalMask)
+          m->causalMask,                                                       \
+          m->request_completed)
 
 template <typename DT>
 void compute_spec_inc_attention_kernel_generation(
@@ -420,7 +423,8 @@ void compute_spec_inc_attention_kernel_generation(
     DT *output_ptr,
     cudaStream_t stream) {
   // one block == one head per request
-  dim3 grid(m->num_q_heads, bc->num_active_requests());
+  // how many generation requests
+  dim3 grid(m->num_q_heads, bc->get_speculative_request_num());
   int const per_head_size = m->qProjSize;
   float scale = (*m->qk_prod_scaling) ? 1.0f / sqrt(m->kProjSize) : 1.0f;
   size_t smem_sz;
@@ -499,11 +503,10 @@ void compute_attention_kernel_prompt(SpecIncMultiHeadSelfAttentionMeta const *m,
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
     if (bc->request_completed[i]) {
       continue;
+    } else if (tokens_previous_requests < bc->num_generation_tokens) {
+      tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
+      continue;
     }
-    // else if (tokens_previous_requests < bc->num_generation_tokens) {
-    //   tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
-    //   continue;
-    // }
 
     // all requests in prompt phase should only have one sub requests;
     assert(bc->sub_requests[i] == 1);
@@ -659,10 +662,10 @@ void compute_attention_kernel_prompt(SpecIncMultiHeadSelfAttentionMeta const *m,
     // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
     // requests
 
-    // print_tensor<float>((float*)C_softmax, 32, "C_softmax");
+    int token_offset = bc->requestsInfo[i].first_token_offset_in_batch;
+
     C = static_cast<DT *>(m->attn_heads) +
-        (tokens_previous_requests + bc->num_generation_tokens) *
-            m->num_q_heads * m->vProjSize;
+        (token_offset)*m->num_q_heads * m->vProjSize;
     checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                          CUBLAS_OP_N,
                                          CUBLAS_OP_T,
@@ -860,6 +863,13 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
         sizeof(BatchConfig::tokensInfo) + sizeof(BatchConfig::requestsInfo) +
         sizeof(BeamSearchBatchConfig::beamTokenInfo) +
         sizeof(BeamSearchBatchConfig::beamRequestsInfo));
+
+    request_completed = reinterpret_cast<bool *>(
+        reinterpret_cast<char *>(handler.batch_config_metadata) +
+        sizeof(BatchConfig::tokensInfo) + sizeof(BatchConfig::requestsInfo) +
+        sizeof(BeamSearchBatchConfig::beamTokenInfo) +
+        sizeof(BeamSearchBatchConfig::beamRequestsInfo) +
+        sizeof(BatchConfig::causalMask));
   }
 
   cudaStreamSynchronize(stream);
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index b4af80976f..fc86e1498e 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -54,6 +54,7 @@ __global__ void compute_attention_kernel_fused_kernel(
     int num_heads,
     int num_requests,
     BatchConfig::BitMask *causalMask,
+    bool *request_completed,
     int qk_smem_sz) {
 
   // q, k
@@ -90,13 +91,14 @@ __global__ void compute_attention_kernel_fused_kernel(
   BatchConfig::BitMask bitmask = causalMask[batch_config_request_id];
 
   int first_token_idx = 0;
-  for (int r = 0; r < request_idx; r++) {
-    first_token_idx += request_infos[r].num_tokens_in_batch;
+  for (int r = 0; r < batch_config_request_id; r++) {
+    first_token_idx +=
+        request_completed[r] ? 0 : request_infos[r].num_tokens_in_batch;
   }
 
-  // if(tidx == 0 && head_idx == 0){
-  //   printf("tree req: %d, %d\n", request_idx, first_token_idx);
-  // }
+  bool prompt_phase = request_infos[batch_config_request_id].prompt_phase;
+  int q_start =
+      request_infos[batch_config_request_id].first_token_depth_in_request;
 
   // shared memory objects
   extern __shared__ char smem_[];
@@ -139,7 +141,7 @@ __global__ void compute_attention_kernel_fused_kernel(
           q_ptr + (hidden_size * QKV_WEIGHT_NUM * qi) + ki +
           ii * THREADS_PER_KEY * K_VEC_SIZE);
 
-      // if (head_idx == 0 && qi == 1 && tidx == 0) {
+      // if (head_idx == 0 && request_idx == 1 && tidx == 0) {
       //     printf("laod q %d,  %d %.10f\n",
       //     request_idx,
       //            qi,q_vecs[ki_o][ii].x);
@@ -163,19 +165,23 @@ __global__ void compute_attention_kernel_fused_kernel(
 
       if (ti < tlength && tidx % THREADS_PER_KEY == 0) {
         bool const mask =
-            (ti >= bitmask.non_tree_cache_size &&
-             (!(bitmask.mask[ti - bitmask.non_tree_cache_size] & (1 << qi))));
+            prompt_phase ? (qi + q_start < ti)
+                         : (ti >= bitmask.non_tree_cache_size &&
+                            (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
+                               (1 << qi))));
 
         qk_max = mask ? qk_max : fmaxf(qk_max, qk);
 
-        // if (head_idx == 0 && qi == 0 && !mask) {
-        //   printf("tree attn qkqkqkqk request id %d,  %d %.10f, %.10f, %.10f\n
-        //   ",
+        // if (head_idx == 0 && !mask) {
+        //   printf("tree attn qkqkqkqk request id %d qi%d, ti %d, %.10f, %.10f,
+        //   %.10f, %d\n",
         //          request_idx,
+        //          qi,
         //          ti,
         //          qk,
         //          q_vecs[ki_o][0].x,
-        //          k[0].x);
+        //          k[0].x,
+        //          bitmask.non_tree_cache_size);
         // }
         qk_smem[ti - first_step] = mask ? 0.0f : qk;
       }
@@ -217,8 +223,10 @@ __global__ void compute_attention_kernel_fused_kernel(
     float exp_sum = 0.f;
     for (int ti = first_step + tidx; ti < tlength; ti += THREADS_PER_BLOCK) {
       bool const mask =
-          (ti >= bitmask.non_tree_cache_size &&
-           (!(bitmask.mask[ti - bitmask.non_tree_cache_size] & (1 << qi))));
+          prompt_phase ? (q_start + qi < ti)
+                       : (ti >= bitmask.non_tree_cache_size &&
+                          (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
+                             (1 << qi))));
       float logit = mask ? 0.0f : __expf(qk_smem[ti - first_step] - qk_max);
       exp_sum += logit;
       qk_smem[ti - first_step] = mask ? 0.0f : logit;
@@ -265,8 +273,11 @@ __global__ void compute_attention_kernel_fused_kernel(
 
         if (ti < tlength) {
           bool const mask =
-              (ti >= bitmask.non_tree_cache_size &&
-               (!(bitmask.mask[ti - bitmask.non_tree_cache_size] & (1 << qi))));
+              prompt_phase
+                  ? (q_start + qi < ti)
+                  : (ti >= bitmask.non_tree_cache_size &&
+                     (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
+                        (1 << qi))));
           float logit = mask ? 0.0f : qk_smem[ti - first_step];
           out = FlexFlow::fma(logit, cast_to_float(v), out);
         }
@@ -810,6 +821,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
           m->num_q_heads,                                                      \
           bc->num_active_requests(),                                           \
           m->causalMask,                                                       \
+          m->request_completed,                                                \
           smem_sz[0])
 
 template <typename DT>
@@ -841,7 +853,6 @@ void compute_attention_kernel_fused(TreeIncMultiHeadSelfAttentionMeta const *m,
   dim3 grid(m->num_q_heads, bc->num_active_requests());
   int const per_head_size = m->qProjSize;
   float scale = (*m->qk_prod_scaling) ? 1.0f / sqrt(m->kProjSize) : 1.0f;
-
   // 0->qk production size, 1->total shared size
   int smem_sz[2];
   if (per_head_size == 64) {
@@ -890,17 +901,6 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
   // std::cout << "tokens to be committed: " << bc->num_tokens_to_commit <<
   // "\n";
 
-  cudaMemcpyAsync(m->committed_token_infos,
-                  &(bc->committed_tokens),
-                  bc->num_tokens_to_commit *
-                      sizeof(TreeVerifyBatchConfig::CommittedTokensInfo),
-                  cudaMemcpyHostToDevice,
-                  stream);
-  cudaMemcpyAsync(m->causalMask,
-                  &(bc->causalMask),
-                  bc->num_active_requests() * sizeof(BatchConfig::BitMask),
-                  cudaMemcpyHostToDevice,
-                  stream);
   commit_tokens<DT>(m, bc, stream);
 
   // After commit we update m->num_active_tokens to be the number of active
@@ -1068,6 +1068,12 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
             sizeof(BatchConfig::tokensInfo) +
             sizeof(BatchConfig::requestsInfo) +
             sizeof(BatchConfig::causalMask));
+
+    request_completed = reinterpret_cast<bool *>(
+        reinterpret_cast<char *>(handler.batch_config_metadata) +
+        sizeof(BatchConfig::tokensInfo) + sizeof(BatchConfig::requestsInfo) +
+        sizeof(BatchConfig::causalMask) +
+        sizeof(TreeVerifyBatchConfig::committed_tokens));
   }
 
   cudaStreamSynchronize(stream);
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index d2fbc0883f..c432208eca 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -84,6 +84,12 @@ int BatchConfig::max_tokens_per_batch() {
   return RequestManager::get_request_manager()->get_max_tokens_per_batch();
 }
 
+/*static*/
+int BatchConfig::max_verify_tokens_per_batch() {
+  return RequestManager::get_request_manager()
+      ->get_max_verify_tokens_per_batch();
+}
+
 /*static*/
 int BatchConfig::max_sequence_length() {
   return RequestManager::get_request_manager()->get_max_sequence_length();
diff --git a/src/runtime/beam_search_batch_config.cc b/src/runtime/beam_search_batch_config.cc
index 74843e9460..ff7bf1a819 100644
--- a/src/runtime/beam_search_batch_config.cc
+++ b/src/runtime/beam_search_batch_config.cc
@@ -85,6 +85,10 @@ int BeamSearchBatchConfig::max_beam_depth_all_requests() const {
   return max_depth_all_requests;
 }
 
+int BeamSearchBatchConfig::get_speculative_request_num() const {
+  return speculative_request_num;
+}
+
 int BeamSearchBatchConfig::current_depth_all_requests() const {
   int current_depth = 0;
   for (int i = 0; i < BeamSearchBatchConfig::max_requests_per_batch(); i++) {
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 32b524f643..76bed36bda 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -4805,6 +4805,20 @@ void register_flexflow_internal_tasks(Runtime *runtime,
       runtime->register_task_variant<Embedding::forward_task>(registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(EMBED_INF_TASK_ID, "Embedding Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<Embedding::inference_task>(
+          registrar, "Embedding Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<Embedding::inference_task>(registrar);
+    }
+  }
   {
     TaskVariantRegistrar registrar(EMBED_BWD_TASK_ID, "Embedding Backward");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 89d4ddaed4..88754f5a82 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -97,6 +97,12 @@ int RequestManager::get_max_tokens_per_batch() {
   return max_tokens_per_batch;
 }
 
+int RequestManager::get_max_verify_tokens_per_batch() {
+  assert(max_tokens_per_batch > 0);
+  return max_tokens_per_batch +
+         BatchConfig::MAX_SPEC_TREE_TOKEN_NUM * max_requests_per_batch;
+}
+
 void RequestManager::set_max_sequence_length(int max_seq_length) {
   assert(max_sequence_length == -1 || max_sequence_length == max_seq_length);
   max_sequence_length = max_seq_length;
@@ -1126,7 +1132,6 @@ BeamSearchBatchConfig
                     old_bc.beamRequestsInfo[i].sub_request_num,
                     tree,
                     old_bc.beamRequestsInfo[i].current_depth);
-      // assert(false);
       for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
         int depth = new_bc.requestsInfo[i].first_token_depth_in_request + j;
         for (int k = 0; k < new_bc.beamRequestsInfo[i].sub_request_num; k++) {
@@ -1146,6 +1151,9 @@ BeamSearchBatchConfig
     }
   }
 
+  // how many requests is in speculative phase
+  new_bc.speculative_request_num = num_active_req + 1;
+
   // Add prompt tokens to the batch
   for (int i = 0; i < BatchConfig::max_requests_per_batch(); i++) {
     if (old_bc.request_completed[i] || old_bc.request_running[i]) {
@@ -1184,13 +1192,14 @@ BeamSearchBatchConfig
           spec_infer_tree_width.size() > ssm_decoding_steps
               ? spec_infer_tree_width[ssm_decoding_steps]
               : 1;
-      printf("beam size: %d, %d\n",
-             new_bc.beamRequestsInfo[i].beam_size,
-             ssm_decoding_steps);
+      // printf("beam size: %d, %d\n",
+      //        new_bc.beamRequestsInfo[i].beam_size,
+      //        ssm_decoding_steps);
       new_bc.beamRequestsInfo[i].max_depth =
           old_bc.beamRequestsInfo[i].max_depth;
-      new_bc.sub_requests[i] =
-          old_bc.sub_requests[i] * new_bc.beamRequestsInfo[i].beam_size;
+      // new_bc.sub_requests[i] =
+      //     old_bc.sub_requests[i] * new_bc.beamRequestsInfo[i].beam_size;
+      new_bc.sub_requests[i] = 1;
       new_bc.beamRequestsInfo[i].sub_request_num =
           old_bc.beamRequestsInfo[i].sub_request_num;
 
@@ -1218,6 +1227,9 @@ BeamSearchBatchConfig
           request.tokens.size()) {
         // request is done
         new_bc.requestsInfo[i].num_tokens_in_batch = 0;
+        new_bc.causalMask[i].this_layer_size = 0;
+        new_bc.beamRequestsInfo[i].sub_request_num = 0;
+        new_bc.beamRequestsInfo[i].beam_size = 1;
       } else {
         // Prompt phase
         new_bc.requestsInfo[i].num_tokens_in_batch =
@@ -1227,12 +1239,8 @@ BeamSearchBatchConfig
                          new_bc.requestsInfo[i].first_token_depth_in_request);
         request.ssm_cache_size += new_bc.requestsInfo[i].num_tokens_in_batch;
         BeamTree tree = request.beam_trees[old_bc.model_id];
-        appendBitMask(new_bc.causalMask[i],
-                      new_bc.beamRequestsInfo[i].sub_request_num,
-                      old_bc.beamRequestsInfo[i].beam_size,
-                      old_bc.beamRequestsInfo[i].sub_request_num,
-                      tree,
-                      old_bc.beamRequestsInfo[i].current_depth);
+        appendPendingRequest(new_bc.causalMask[i],
+                             new_bc.requestsInfo[i].num_tokens_in_batch);
       }
 
       if (verbose) {
@@ -1258,11 +1266,11 @@ BeamSearchBatchConfig
 
           // get value from requestinfo
           new_bc.tokensInfo[new_bc.num_tokens].token_id =
-              request.tokens[request.tokens.size() - 1];
+              request.tokens[request.tokens.size() -
+                             new_bc.requestsInfo[i].num_tokens_in_batch + j];
 
           new_bc.beamTokenInfo[new_bc.num_tokens].sub_request_index = k;
           new_bc.num_tokens++;
-          num_generation_tokens++;
         }
       }
     }
@@ -1319,7 +1327,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
   new_bc.num_tokens_to_commit = 0;
   new_bc.num_tokens = 0;
 
-  int max_prompt_load_size = get_max_tokens_per_batch();
+  int max_prompt_load_size = get_max_verify_tokens_per_batch();
   for (int i = 0; i < TreeVerifyBatchConfig::max_requests_per_batch(); i++) {
     if (old_batches.at(0).request_completed[i]) {
       continue;
@@ -1427,7 +1435,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       new_bc.num_tokens++;
       new_bc.requestsInfo[i].num_tokens_in_batch++;
 
-      if (new_bc.num_tokens > get_max_tokens_per_batch()) {
+      if (new_bc.num_tokens > get_max_verify_tokens_per_batch()) {
         assert(false &&
                "Exceeding the space available in the TreeVerify batch");
         break;
@@ -1453,7 +1461,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
         new_bc.num_tokens++;
         new_bc.requestsInfo[i].num_tokens_in_batch++;
 
-        if (new_bc.num_tokens == get_max_tokens_per_batch() &&
+        if (new_bc.num_tokens == get_max_verify_tokens_per_batch() &&
             (j != dfs_tree_inputs.size() - 1)) {
           cutLayer = true;
           break;
@@ -1542,7 +1550,7 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
           new_bc.num_tokens++;
         }
 
-        if (new_bc.num_tokens > get_max_tokens_per_batch()) {
+        if (new_bc.num_tokens > get_max_verify_tokens_per_batch()) {
           assert(false &&
                  "Exceeding the space available in the TreeVerify batch");
           break;
@@ -1555,15 +1563,17 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
           request.status = Request::RUNNING;
           new_bc.request_running[i] = true;
 
-          std::cout << "new_bc.requestsInfo[i].num_tokens_in_batch: "
-                    << new_bc.requestsInfo[i].num_tokens_in_batch << std::endl;
+          // std::cout << "new_bc.requestsInfo[i].num_tokens_in_batch: "
+          //           << new_bc.requestsInfo[i].num_tokens_in_batch <<
+          //           std::endl;
+          new_bc.requestsInfo[i].prompt_phase = true;
 
           dfs_tree_inputs[guid] =
               std::vector<std::pair<BatchConfig::TokenId, int>>{std::make_pair(
                   request.tokens.back(), request.tokens.size() - 1)};
         }
       } else { // launch the request into running phase after loading all prompt
-        if (get_max_tokens_per_batch() - new_bc.num_tokens > 0) {
+        if (get_max_verify_tokens_per_batch() - new_bc.num_tokens > 0) {
           // std::cout << "Initialization running phase: "
           //           << new_bc.requestsInfo[i].num_tokens_in_batch << "\n";
           request.status = Request::RUNNING;
@@ -1576,9 +1586,11 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
 
           new_bc.num_tokens++;
           new_bc.requestsInfo[i].num_tokens_in_batch++;
-          std::cout << "new_bc.requestsInfo[i].num_tokens_in_batch: "
-                    << new_bc.requestsInfo[i].num_tokens_in_batch << std::endl;
+          // std::cout << "new_bc.requestsInfo[i].num_tokens_in_batch2: "
+          //           << new_bc.requestsInfo[i].num_tokens_in_batch <<
+          //           std::endl;
 
+          new_bc.requestsInfo[i].prompt_phase = true;
           dfs_tree_inputs[guid] =
               std::vector<std::pair<BatchConfig::TokenId, int>>{std::make_pair(
                   request.tokens.back(), request.tokens.size() - 1)};
@@ -1760,20 +1772,14 @@ void RequestManager::update_beam_metadata(BeamSearchBatchConfig &new_bc,
 // prompt phase, init task
 void RequestManager::initBitMask(BatchConfig::BitMask &bitmask,
                                  int initLength) {
-  assert(initLength <= BatchConfig::MAX_SPEC_TREE_TOKEN_NUM &&
-         "do not support tree size > 64");
+  assert(initLength > 0);
   // eg. 4 tokens: t1: 0000000..1111, t2: 0000000..1110, t3: 0000000..1100, t4:
   // 0000000..1000
   bitmask.non_tree_cache_size = 0;
-  bitmask.tree_size = initLength;
+  bitmask.tree_size = 1;
 
   bitmask.prompt_size = initLength;
   bitmask.this_layer_size = initLength;
-  for (int i = 0; i < bitmask.prompt_size; i++) {
-    for (int j = i; j < bitmask.prompt_size; j++) {
-      bitmask.mask[i] |= (1 << j);
-    }
-  }
   // std::cout << "see bit mask" << bitmask.prompt_size << "\n";
   // std::cout << "see bit mask" << std::bitset<64>(bitmask.mask[0]) << "\n";
   // std::cout << "see bit mask" << std::bitset<64>(bitmask.mask[1]) << "\n";
@@ -1810,6 +1816,25 @@ void RequestManager::updateBitMask(BatchConfig::BitMask &bitmask,
   //           << "\n";
 }
 
+// prompt phase, init task
+void RequestManager::appendPendingRequest(BatchConfig::BitMask &bitmask,
+                                          int initLength) {
+  assert(initLength > 0);
+  std::cout << "append pending bit mask: " << initLength << "\n";
+  // eg. 4 tokens: t1: 0000000..1111, t2: 0000000..1110, t3: 0000000..1100, t4:
+  // 0000000..1000
+  bitmask.non_tree_cache_size = 0;
+  bitmask.tree_size = 1;
+  bitmask.prompt_size += initLength;
+  bitmask.this_layer_size = initLength;
+
+  // for (int i = 0; i < bitmask.prompt_size; i++) {
+  //   for (int j = i; j < bitmask.prompt_size; j++) {
+  //     bitmask.mask[i] |= (1 << j);
+  //   }
+  // }
+}
+
 // prepare next beam, append layers to the tree
 void RequestManager::appendBitMask(BatchConfig::BitMask &bitmask,
                                    int newNodes,
@@ -1862,12 +1887,6 @@ void RequestManager::appendBitMask(BatchConfig::BitMask &bitmask,
     }
   }
 
-  // std::cout << "token idx: " << token_idx << ", " << pre_tree_size << ", "
-  //           << new_nodes_start_idx << ", " << newNodes
-  //           << "current depth: " << currentDepth << "\n";
-  // std::cout << "new nodes end " << new_nodes_start_idx << "\n";
-
-  // std::cout << "tree size: " << bitmask.tree_size << "\n";
   assert(token_idx == pre_tree_size);
   assert(currentDepth <= 1 || new_nodes_start_idx == bitmask.tree_size);
 
diff --git a/src/runtime/request_manager.cu b/src/runtime/request_manager.cu
index 51c52c3026..8380d6be73 100644
--- a/src/runtime/request_manager.cu
+++ b/src/runtime/request_manager.cu
@@ -35,10 +35,17 @@ void RequestManager::load_tokens_task(
 
   // Extreme long prompts are not supported, only load up to
   // BatchConfig::max_tokens_per_batch() as prompt
-  if (batch_config->num_tokens > BatchConfig::max_tokens_per_batch()) {
+  if (batch_config->num_tokens > BatchConfig::max_tokens_per_batch() &&
+      batch_config->get_mode() == INC_DECODING_MODE) {
     printf("Warning: too many tokens in prompt, only load up to %d tokens\n",
            BatchConfig::max_tokens_per_batch());
     printf("Got: %d tokens\n", batch_config->num_tokens);
+  } else if (batch_config->num_tokens >
+             BatchConfig::max_verify_tokens_per_batch()) {
+    printf("Warning: Speculative decoding. too many tokens in prompt, only "
+           "load up to %d tokens\n",
+           BatchConfig::max_verify_tokens_per_batch());
+    printf("Got: %d tokens\n", batch_config->num_tokens);
   }
 
   for (int i = 0; i < batch_config->num_tokens; i++) {
@@ -117,8 +124,16 @@ void RequestManager::load_batch_config_task(
         sizeof(BatchConfig::causalMask),
         cudaMemcpyHostToDevice,
         stream));
-
     total_copy_size += sizeof(BatchConfig::causalMask);
+
+    checkCUDA(cudaMemcpyAsync(
+        static_cast<char *>(handle.batch_config_metadata) + total_copy_size,
+        &(batch_config->request_completed),
+        sizeof(BatchConfig::request_completed),
+        cudaMemcpyHostToDevice,
+        stream));
+
+    total_copy_size += sizeof(BatchConfig::request_completed);
   } else if (batch_config->get_mode() == TREE_VERIFY_MODE) {
     TreeVerifyBatchConfig const *tree_batch_config =
         static_cast<TreeVerifyBatchConfig const *>(batch_config);
@@ -137,6 +152,15 @@ void RequestManager::load_batch_config_task(
         cudaMemcpyHostToDevice,
         stream));
     total_copy_size += sizeof(TreeVerifyBatchConfig::committed_tokens);
+
+    checkCUDA(cudaMemcpyAsync(
+        static_cast<char *>(handle.batch_config_metadata) + total_copy_size,
+        &(batch_config->request_completed),
+        sizeof(BatchConfig::request_completed),
+        cudaMemcpyHostToDevice,
+        stream));
+
+    total_copy_size += sizeof(BatchConfig::request_completed);
   }
 
   // add a size check

From 8490e50d5744b6731df9fdc4147b2a6ebd4f2d71 Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Tue, 2 Jan 2024 16:20:24 -0500
Subject: [PATCH 298/344] fix

---
 src/runtime/request_manager.cc | 7 ++-----
 1 file changed, 2 insertions(+), 5 deletions(-)

diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 88754f5a82..a285932b7f 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -1188,10 +1188,7 @@ BeamSearchBatchConfig
       int ssm_decoding_steps =
           profiling_requests[request.guid].ssm_decoding_steps;
 
-      new_bc.beamRequestsInfo[i].beam_size =
-          spec_infer_tree_width.size() > ssm_decoding_steps
-              ? spec_infer_tree_width[ssm_decoding_steps]
-              : 1;
+      new_bc.beamRequestsInfo[i].beam_size = 1;
       // printf("beam size: %d, %d\n",
       //        new_bc.beamRequestsInfo[i].beam_size,
       //        ssm_decoding_steps);
@@ -1820,7 +1817,7 @@ void RequestManager::updateBitMask(BatchConfig::BitMask &bitmask,
 void RequestManager::appendPendingRequest(BatchConfig::BitMask &bitmask,
                                           int initLength) {
   assert(initLength > 0);
-  std::cout << "append pending bit mask: " << initLength << "\n";
+  // std::cout << "append pending bit mask: " << initLength << "\n";
   // eg. 4 tokens: t1: 0000000..1111, t2: 0000000..1110, t3: 0000000..1100, t4:
   // 0000000..1000
   bitmask.non_tree_cache_size = 0;

From c12f0c6ddaea6629214278167b047ffa3158b491 Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Wed, 3 Jan 2024 00:28:15 -0500
Subject: [PATCH 299/344] fix request id issue

---
 src/ops/inc_multihead_self_attention.cu      | 42 +++++---------------
 src/ops/spec_inc_multihead_self_attention.cu |  8 ++--
 src/runtime/request_manager.cc               |  6 +++
 3 files changed, 20 insertions(+), 36 deletions(-)

diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 7c8601d3c8..42933cee27 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -52,9 +52,7 @@ __global__ void compute_attention_kernel_generation_kernel(
     int max_seq_length,
     int per_head_size,
     int hidden_size,
-    BatchConfig::PerRequestInfo *request_infos,
-    bool is_beam,
-    int max_beam_width) {
+    BatchConfig::PerRequestInfo *request_infos) {
 
   // q, k
   using Q_vec = typename VEC_K<DT, THREADS_PER_KEY>::Type;
@@ -85,10 +83,6 @@ __global__ void compute_attention_kernel_generation_kernel(
   int const batch_config_request_id =
       request_infos[request_idx].batch_config_request_id;
 
-  int const beam_request_idx =
-      is_beam ? request_idx / max_beam_width : request_idx;
-  int const beam_sub_request_idx = is_beam ? request_idx % max_beam_width : 0;
-
   int const first_step = 0;
 
   int const tlength =
@@ -106,8 +100,7 @@ __global__ void compute_attention_kernel_generation_kernel(
   // first WARPS_PER_BLOCK for store qk_max, second WARPS_PER_BLOCK for sum
   __shared__ float red_smem[WARPS_PER_BLOCK * 2];
 
-  const DT *q_ptr = query +
-                    batch_config_request_id * hidden_size * QKV_WEIGHT_NUM +
+  const DT *q_ptr = query + request_idx * hidden_size * QKV_WEIGHT_NUM +
                     head_idx * per_head_size;
   __shared__ Q_vec q_vecs[THREADS_PER_KEY][K_VECS_PER_THREAD];
   // DT const *q_ptr =
@@ -142,10 +135,7 @@ __global__ void compute_attention_kernel_generation_kernel(
   constexpr int K_PER_WARP = WARP_SIZE / THREADS_PER_KEY;
 
   DT const *k_cache_batch =
-      key_cache +
-      (batch_config_request_id * max_beam_width + beam_sub_request_idx) *
-          max_seq_length * hidden_size +
-      ki;
+      key_cache + batch_config_request_id * max_seq_length * hidden_size + ki;
 
   int ti_end =
       div_up(tlength - first_step, K_PER_WARP) * K_PER_WARP + first_step;
@@ -248,10 +238,7 @@ __global__ void compute_attention_kernel_generation_kernel(
 
   // The base pointer for the value in the cache buffer.
   DT const *v_cache_batch =
-      value_cache +
-      (batch_config_request_id * max_beam_width + beam_sub_request_idx) *
-          max_seq_length * hidden_size +
-      vi;
+      value_cache + batch_config_request_id * max_seq_length * hidden_size + vi;
 
   if (Dh == Dh_MAX || vi < Dh) {
     for (int ti = first_step + vo; ti < tlength; ti += V_PER_ITER) {
@@ -297,7 +284,7 @@ __global__ void compute_attention_kernel_generation_kernel(
   // Output the final values.
   if (vo == 0 && (Dh == Dh_MAX || vi < Dh)) {
     convert_from_float(
-        *reinterpret_cast<V_vec *>(output_ptr + beam_request_idx * hidden_size +
+        *reinterpret_cast<V_vec *>(output_ptr + request_idx * hidden_size +
                                    head_idx * per_head_size + vi),
         out);
   }
@@ -727,9 +714,7 @@ void compute_o_prod_bias(IncMultiHeadSelfAttentionMeta const *m,
           BatchConfig::max_sequence_length(),                                  \
           m->qProjSize,                                                        \
           m->hidden_size,                                                      \
-          m->request_infos,                                                    \
-          false,                                                               \
-          0)
+          m->request_infos)
 
 template <typename DT>
 void compute_attention_kernel_generation(IncMultiHeadSelfAttentionMeta const *m,
@@ -944,14 +929,9 @@ void compute_attention_kernel_prompt(IncMultiHeadSelfAttentionMeta const *m,
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
-    if (bc->request_completed[i]) {
-      continue;
-    } else if (tokens_previous_requests < bc->num_generation_tokens) {
-      tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
+    if (bc->request_completed[i] || (!bc->requestsInfo[i].prompt_phase)) {
       continue;
     }
-    assert(tokens_previous_requests ==
-           bc->requestsInfo[i].first_token_offset_in_batch);
     int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
     int total_tokens = bc->requestsInfo[i].first_token_depth_in_request +
                        bc->requestsInfo[i].num_tokens_in_batch;
@@ -978,8 +958,8 @@ void compute_attention_kernel_prompt(IncMultiHeadSelfAttentionMeta const *m,
       // matrix A's layout: [qProjSize, num_heads, 3, num_new_tokens]
       // To get query projection, skip over Q entries from previous requests
       DT const *A = static_cast<DT *>(m->devQKVProjArray) +
-                    tokens_previous_requests * m->qProjSize * m->num_q_heads *
-                        QKV_WEIGHT_NUM;
+                    bc->requestsInfo[i].first_token_offset_in_batch *
+                        m->qProjSize * m->num_q_heads * QKV_WEIGHT_NUM;
       // matrix B: key cache
       // matrix B's layout: [kProjSize * num_heads, total_tokens]
       // To get B, skip over K entries from previous requests (all heads +
@@ -1117,7 +1097,7 @@ void compute_attention_kernel_prompt(IncMultiHeadSelfAttentionMeta const *m,
       // requests
       // store the result attn heads, also skip the genration tokens
       DT *C = static_cast<DT *>(m->attn_heads) +
-              (tokens_previous_requests + bc->num_generation_tokens) *
+              (bc->requestsInfo[i].first_token_offset_in_batch) *
                   m->num_q_heads * m->vProjSize;
       checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                            CUBLAS_OP_N,
@@ -1145,7 +1125,7 @@ void compute_attention_kernel_prompt(IncMultiHeadSelfAttentionMeta const *m,
     }
     tokens_previous_requests += num_new_tokens;
   }
-  assert(tokens_previous_requests == num_tokens);
+  assert(tokens_previous_requests == (num_tokens - bc->num_generation_tokens));
 }
 
 /*static*/
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index b31e5d0994..a63417de51 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -501,10 +501,8 @@ void compute_attention_kernel_prompt(SpecIncMultiHeadSelfAttentionMeta const *m,
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
-    if (bc->request_completed[i]) {
-      continue;
-    } else if (tokens_previous_requests < bc->num_generation_tokens) {
-      tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
+    if (bc->request_completed[i] || (!bc->requestsInfo[i].prompt_phase) ||
+        (bc->requestsInfo[i].num_tokens_in_batch == 0)) {
       continue;
     }
 
@@ -694,7 +692,7 @@ void compute_attention_kernel_prompt(SpecIncMultiHeadSelfAttentionMeta const *m,
     tokens_prev_requests_squares += num_new_tokens * total_tokens;
   }
 
-  // assert(tokens_previous_requests == num_tokens);
+  assert(tokens_previous_requests == (num_tokens - bc->num_generation_tokens));
 }
 
 template <typename DT>
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index a285932b7f..c867d2a979 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -468,12 +468,14 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
           // Incremental phase
           new_bc.requestsInfo[i].num_tokens_in_batch = 1;
           num_generation_tokens++;
+          new_bc.requestsInfo[i].prompt_phase = false;
         } else {
           // Prompt phase
           new_bc.requestsInfo[i].num_tokens_in_batch =
               std::min(get_max_tokens_per_batch() - new_bc.num_tokens,
                        (int)request.tokens.size() -
                            new_bc.requestsInfo[i].first_token_depth_in_request);
+          new_bc.requestsInfo[i].prompt_phase = true;
         }
         for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
           int depth = new_bc.requestsInfo[i].first_token_depth_in_request + j;
@@ -509,6 +511,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
         new_bc.requestsInfo[i].max_sequence_length =
             new_request.max_sequence_length;
         new_bc.request_completed[i] = false;
+        new_bc.requestsInfo[i].prompt_phase = true;
         num_active_req++;
         new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
         // add profile_info for the new request
@@ -755,6 +758,7 @@ BeamSearchBatchConfig
         new_bc.beamRequestsInfo[i].current_depth = 1;
 
         profiling_requests[request.guid].ssm_decoding_steps = 0;
+        new_bc.requestsInfo[i].prompt_phase = true;
 
         int ssm_decoding_steps = 0;
         new_bc.beamRequestsInfo[i].beam_size =
@@ -902,6 +906,7 @@ BeamSearchBatchConfig
         }
 
         new_bc.request_completed[i] = false;
+        new_bc.requestsInfo[i].prompt_phase = true;
 
         new_bc.beamRequestsInfo[i].sub_request_num = 1;
         printf("sub request num == 1, %d \n",
@@ -1220,6 +1225,7 @@ BeamSearchBatchConfig
              &old_bc.causalMask[i],
              sizeof(BatchConfig::BitMask));
 
+      new_bc.requestsInfo[i].prompt_phase = true;
       if (new_bc.requestsInfo[i].first_token_depth_in_request >=
           request.tokens.size()) {
         // request is done

From 284ad772692e8b5f0c012de7d2493d95f3380428 Mon Sep 17 00:00:00 2001
From: Xinhao Cheng <99570243+xinhaoc@users.noreply.github.com>
Date: Wed, 3 Jan 2024 03:08:04 -0500
Subject: [PATCH 300/344] Fix Request Id order issue (#1260)

* init

* fix speculative

* fix speculative

* bitmap+tree verify

* fix.

* fix

* multi batch

* copy metadata once

* fix some corner cases

* Replicate load_token tasks so that it can be fused with other compute tasks; this eliminates Replicate and enables a larger fused op

* more fix.

* clean up

* .

* load batchconfig

* clean

* hip

* hip

* embedding return when no token

* use arg topk instead of beam topk

* embedding

* fmt

* hip

* fix corner case

* fix

* fix request id issue

---------

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 src/ops/inc_multihead_self_attention.cu      | 42 +++++---------------
 src/ops/spec_inc_multihead_self_attention.cu |  5 ++-
 src/runtime/request_manager.cc               | 13 +++---
 3 files changed, 22 insertions(+), 38 deletions(-)

diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 7c8601d3c8..42933cee27 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -52,9 +52,7 @@ __global__ void compute_attention_kernel_generation_kernel(
     int max_seq_length,
     int per_head_size,
     int hidden_size,
-    BatchConfig::PerRequestInfo *request_infos,
-    bool is_beam,
-    int max_beam_width) {
+    BatchConfig::PerRequestInfo *request_infos) {
 
   // q, k
   using Q_vec = typename VEC_K<DT, THREADS_PER_KEY>::Type;
@@ -85,10 +83,6 @@ __global__ void compute_attention_kernel_generation_kernel(
   int const batch_config_request_id =
       request_infos[request_idx].batch_config_request_id;
 
-  int const beam_request_idx =
-      is_beam ? request_idx / max_beam_width : request_idx;
-  int const beam_sub_request_idx = is_beam ? request_idx % max_beam_width : 0;
-
   int const first_step = 0;
 
   int const tlength =
@@ -106,8 +100,7 @@ __global__ void compute_attention_kernel_generation_kernel(
   // first WARPS_PER_BLOCK for store qk_max, second WARPS_PER_BLOCK for sum
   __shared__ float red_smem[WARPS_PER_BLOCK * 2];
 
-  const DT *q_ptr = query +
-                    batch_config_request_id * hidden_size * QKV_WEIGHT_NUM +
+  const DT *q_ptr = query + request_idx * hidden_size * QKV_WEIGHT_NUM +
                     head_idx * per_head_size;
   __shared__ Q_vec q_vecs[THREADS_PER_KEY][K_VECS_PER_THREAD];
   // DT const *q_ptr =
@@ -142,10 +135,7 @@ __global__ void compute_attention_kernel_generation_kernel(
   constexpr int K_PER_WARP = WARP_SIZE / THREADS_PER_KEY;
 
   DT const *k_cache_batch =
-      key_cache +
-      (batch_config_request_id * max_beam_width + beam_sub_request_idx) *
-          max_seq_length * hidden_size +
-      ki;
+      key_cache + batch_config_request_id * max_seq_length * hidden_size + ki;
 
   int ti_end =
       div_up(tlength - first_step, K_PER_WARP) * K_PER_WARP + first_step;
@@ -248,10 +238,7 @@ __global__ void compute_attention_kernel_generation_kernel(
 
   // The base pointer for the value in the cache buffer.
   DT const *v_cache_batch =
-      value_cache +
-      (batch_config_request_id * max_beam_width + beam_sub_request_idx) *
-          max_seq_length * hidden_size +
-      vi;
+      value_cache + batch_config_request_id * max_seq_length * hidden_size + vi;
 
   if (Dh == Dh_MAX || vi < Dh) {
     for (int ti = first_step + vo; ti < tlength; ti += V_PER_ITER) {
@@ -297,7 +284,7 @@ __global__ void compute_attention_kernel_generation_kernel(
   // Output the final values.
   if (vo == 0 && (Dh == Dh_MAX || vi < Dh)) {
     convert_from_float(
-        *reinterpret_cast<V_vec *>(output_ptr + beam_request_idx * hidden_size +
+        *reinterpret_cast<V_vec *>(output_ptr + request_idx * hidden_size +
                                    head_idx * per_head_size + vi),
         out);
   }
@@ -727,9 +714,7 @@ void compute_o_prod_bias(IncMultiHeadSelfAttentionMeta const *m,
           BatchConfig::max_sequence_length(),                                  \
           m->qProjSize,                                                        \
           m->hidden_size,                                                      \
-          m->request_infos,                                                    \
-          false,                                                               \
-          0)
+          m->request_infos)
 
 template <typename DT>
 void compute_attention_kernel_generation(IncMultiHeadSelfAttentionMeta const *m,
@@ -944,14 +929,9 @@ void compute_attention_kernel_prompt(IncMultiHeadSelfAttentionMeta const *m,
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
-    if (bc->request_completed[i]) {
-      continue;
-    } else if (tokens_previous_requests < bc->num_generation_tokens) {
-      tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
+    if (bc->request_completed[i] || (!bc->requestsInfo[i].prompt_phase)) {
       continue;
     }
-    assert(tokens_previous_requests ==
-           bc->requestsInfo[i].first_token_offset_in_batch);
     int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
     int total_tokens = bc->requestsInfo[i].first_token_depth_in_request +
                        bc->requestsInfo[i].num_tokens_in_batch;
@@ -978,8 +958,8 @@ void compute_attention_kernel_prompt(IncMultiHeadSelfAttentionMeta const *m,
       // matrix A's layout: [qProjSize, num_heads, 3, num_new_tokens]
       // To get query projection, skip over Q entries from previous requests
       DT const *A = static_cast<DT *>(m->devQKVProjArray) +
-                    tokens_previous_requests * m->qProjSize * m->num_q_heads *
-                        QKV_WEIGHT_NUM;
+                    bc->requestsInfo[i].first_token_offset_in_batch *
+                        m->qProjSize * m->num_q_heads * QKV_WEIGHT_NUM;
       // matrix B: key cache
       // matrix B's layout: [kProjSize * num_heads, total_tokens]
       // To get B, skip over K entries from previous requests (all heads +
@@ -1117,7 +1097,7 @@ void compute_attention_kernel_prompt(IncMultiHeadSelfAttentionMeta const *m,
       // requests
       // store the result attn heads, also skip the genration tokens
       DT *C = static_cast<DT *>(m->attn_heads) +
-              (tokens_previous_requests + bc->num_generation_tokens) *
+              (bc->requestsInfo[i].first_token_offset_in_batch) *
                   m->num_q_heads * m->vProjSize;
       checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                            CUBLAS_OP_N,
@@ -1145,7 +1125,7 @@ void compute_attention_kernel_prompt(IncMultiHeadSelfAttentionMeta const *m,
     }
     tokens_previous_requests += num_new_tokens;
   }
-  assert(tokens_previous_requests == num_tokens);
+  assert(tokens_previous_requests == (num_tokens - bc->num_generation_tokens));
 }
 
 /*static*/
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index b31e5d0994..2d80ed2221 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -501,7 +501,8 @@ void compute_attention_kernel_prompt(SpecIncMultiHeadSelfAttentionMeta const *m,
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
-    if (bc->request_completed[i]) {
+    if (bc->request_completed[i] || (!bc->requestsInfo[i].prompt_phase) ||
+        (bc->requestsInfo[i].num_tokens_in_batch == 0)) {
       continue;
     } else if (tokens_previous_requests < bc->num_generation_tokens) {
       tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
@@ -694,7 +695,7 @@ void compute_attention_kernel_prompt(SpecIncMultiHeadSelfAttentionMeta const *m,
     tokens_prev_requests_squares += num_new_tokens * total_tokens;
   }
 
-  // assert(tokens_previous_requests == num_tokens);
+  assert(tokens_previous_requests == (num_tokens - bc->num_generation_tokens));
 }
 
 template <typename DT>
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 88754f5a82..c867d2a979 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -468,12 +468,14 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
           // Incremental phase
           new_bc.requestsInfo[i].num_tokens_in_batch = 1;
           num_generation_tokens++;
+          new_bc.requestsInfo[i].prompt_phase = false;
         } else {
           // Prompt phase
           new_bc.requestsInfo[i].num_tokens_in_batch =
               std::min(get_max_tokens_per_batch() - new_bc.num_tokens,
                        (int)request.tokens.size() -
                            new_bc.requestsInfo[i].first_token_depth_in_request);
+          new_bc.requestsInfo[i].prompt_phase = true;
         }
         for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
           int depth = new_bc.requestsInfo[i].first_token_depth_in_request + j;
@@ -509,6 +511,7 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
         new_bc.requestsInfo[i].max_sequence_length =
             new_request.max_sequence_length;
         new_bc.request_completed[i] = false;
+        new_bc.requestsInfo[i].prompt_phase = true;
         num_active_req++;
         new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
         // add profile_info for the new request
@@ -755,6 +758,7 @@ BeamSearchBatchConfig
         new_bc.beamRequestsInfo[i].current_depth = 1;
 
         profiling_requests[request.guid].ssm_decoding_steps = 0;
+        new_bc.requestsInfo[i].prompt_phase = true;
 
         int ssm_decoding_steps = 0;
         new_bc.beamRequestsInfo[i].beam_size =
@@ -902,6 +906,7 @@ BeamSearchBatchConfig
         }
 
         new_bc.request_completed[i] = false;
+        new_bc.requestsInfo[i].prompt_phase = true;
 
         new_bc.beamRequestsInfo[i].sub_request_num = 1;
         printf("sub request num == 1, %d \n",
@@ -1188,10 +1193,7 @@ BeamSearchBatchConfig
       int ssm_decoding_steps =
           profiling_requests[request.guid].ssm_decoding_steps;
 
-      new_bc.beamRequestsInfo[i].beam_size =
-          spec_infer_tree_width.size() > ssm_decoding_steps
-              ? spec_infer_tree_width[ssm_decoding_steps]
-              : 1;
+      new_bc.beamRequestsInfo[i].beam_size = 1;
       // printf("beam size: %d, %d\n",
       //        new_bc.beamRequestsInfo[i].beam_size,
       //        ssm_decoding_steps);
@@ -1223,6 +1225,7 @@ BeamSearchBatchConfig
              &old_bc.causalMask[i],
              sizeof(BatchConfig::BitMask));
 
+      new_bc.requestsInfo[i].prompt_phase = true;
       if (new_bc.requestsInfo[i].first_token_depth_in_request >=
           request.tokens.size()) {
         // request is done
@@ -1820,7 +1823,7 @@ void RequestManager::updateBitMask(BatchConfig::BitMask &bitmask,
 void RequestManager::appendPendingRequest(BatchConfig::BitMask &bitmask,
                                           int initLength) {
   assert(initLength > 0);
-  std::cout << "append pending bit mask: " << initLength << "\n";
+  // std::cout << "append pending bit mask: " << initLength << "\n";
   // eg. 4 tokens: t1: 0000000..1111, t2: 0000000..1110, t3: 0000000..1100, t4:
   // 0000000..1000
   bitmask.non_tree_cache_size = 0;

From e17fb8d923b38221d3ab8ba52677505c2c4a9f93 Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Wed, 3 Jan 2024 23:32:45 -0500
Subject: [PATCH 301/344] change MAX_SPECULATIVE_TREE_BRANCHES

---
 include/flexflow/batch_config.h    | 23 ++++++++++++++---------
 include/flexflow/request_manager.h |  2 +-
 src/runtime/request_manager.cc     | 11 ++++++++---
 3 files changed, 23 insertions(+), 13 deletions(-)

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index ef17ef43ed..3dcae464cc 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -167,9 +167,10 @@ class BeamSearchBatchConfig : public BatchConfig {
     int current_depth = -1;
     int max_depth = MAX_BEAM_DEPTH;
 
-    BatchConfig::TokenId tokens[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
-    float probs[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
-    int parent_id[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
+    BatchConfig::TokenId
+        tokens[BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES];
+    float probs[BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES];
+    int parent_id[BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES];
     int sub_request_num;
   };
 
@@ -178,10 +179,11 @@ class BeamSearchBatchConfig : public BatchConfig {
   };
 
   BeamSearchPerRequestInfo beamRequestsInfo[MAX_NUM_REQUESTS];
-  BeamSearchPerTokenInfo beamTokenInfo[MAX_NUM_TOKENS * MAX_BEAM_WIDTH];
+  BeamSearchPerTokenInfo
+      beamTokenInfo[MAX_NUM_TOKENS +
+                    MAX_SPEC_TREE_TOKEN_NUM * MAX_NUM_REQUESTS];
 
-  // why is this == MAX_NUM_REQUESTS * MAX_BEAM_WIDTH?
-  int sub_requests[MAX_NUM_REQUESTS * MAX_BEAM_WIDTH];
+  int sub_requests[MAX_SPECULATIVE_TREE_BRANCHES];
 
 private:
   size_t current_iteration;
@@ -190,9 +192,12 @@ class BeamSearchBatchConfig : public BatchConfig {
 struct BeamInferenceResult {
   static int const MAX_NUM_TOKENS = BatchConfig::MAX_NUM_TOKENS;
   BatchConfig::TokenId
-      token_ids[MAX_NUM_TOKENS * BeamSearchBatchConfig::MAX_BEAM_WIDTH];
-  float probs[MAX_NUM_TOKENS * BeamSearchBatchConfig::MAX_BEAM_WIDTH];
-  int parent_id[MAX_NUM_TOKENS * BeamSearchBatchConfig::MAX_BEAM_WIDTH];
+      token_ids[MAX_NUM_TOKENS *
+                BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES];
+  float probs[MAX_NUM_TOKENS *
+              BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES];
+  int parent_id[MAX_NUM_TOKENS *
+                BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES];
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index 33714c106e..f74b6c5b9f 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -76,7 +76,7 @@ struct BeamTree {
   struct treeLayer {
     BeamSearchBatchConfig::TokenId
         tokens[BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES];
-    int parent_ids[BeamSearchBatchConfig::MAX_BEAM_WIDTH];
+    int parent_ids[BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES];
     float probs[BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES];
     int nodes_num_this_layer = 0;
   };
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index c867d2a979..91a5d3be86 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -767,7 +767,9 @@ BeamSearchBatchConfig
                 : 1;
         new_bc.beamRequestsInfo[i].max_depth =
             std::min(new_max_depth, BeamSearchBatchConfig::MAX_BEAM_DEPTH);
-        for (int j = 0; j < BeamSearchBatchConfig::MAX_BEAM_WIDTH; j++) {
+        for (int j = 0;
+             j < BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES;
+             j++) {
           new_bc.beamRequestsInfo[i].parent_id[j] = 0;
           new_bc.beamRequestsInfo[i].probs[j] = 1;
         }
@@ -840,7 +842,8 @@ BeamSearchBatchConfig
               ? spec_infer_tree_width[ssm_decoding_steps]
               : 1;
       new_bc.beamRequestsInfo[i].max_depth = 0;
-      for (int j = 0; j < BeamSearchBatchConfig::MAX_BEAM_WIDTH; j++) {
+      for (int j = 0; j < BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES;
+           j++) {
         new_bc.beamRequestsInfo[i].parent_id[j] = 0;
         new_bc.beamRequestsInfo[i].probs[j] = 1;
       }
@@ -900,7 +903,9 @@ BeamSearchBatchConfig
             std::min(BeamSearchBatchConfig::MAX_BEAM_DEPTH,
                      get_max_tokens_per_batch() -
                          new_bc.requestsInfo[i].num_tokens_in_batch - 1);
-        for (int j = 0; j < BeamSearchBatchConfig::MAX_BEAM_WIDTH; j++) {
+        for (int j = 0;
+             j < BeamSearchBatchConfig::MAX_SPECULATIVE_TREE_BRANCHES;
+             j++) {
           new_bc.beamRequestsInfo[i].parent_id[j] = 0;
           new_bc.beamRequestsInfo[i].probs[j] = 1;
         }

From 429ddb59073f3155acd7f255c97f2153f99d130b Mon Sep 17 00:00:00 2001
From: xinhaoc <xinhaoc@andrew.cmu.edu>
Date: Thu, 4 Jan 2024 00:06:48 -0500
Subject: [PATCH 302/344] =?UTF-8?q?=E3=80=82?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 include/flexflow/batch_config.h | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 3dcae464cc..5c126293cf 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -183,7 +183,7 @@ class BeamSearchBatchConfig : public BatchConfig {
       beamTokenInfo[MAX_NUM_TOKENS +
                     MAX_SPEC_TREE_TOKEN_NUM * MAX_NUM_REQUESTS];
 
-  int sub_requests[MAX_SPECULATIVE_TREE_BRANCHES];
+  int sub_requests[MAX_NUM_REQUESTS];
 
 private:
   size_t current_iteration;

From 4f61b9f348094f87cc4d32625a65ffb64156d325 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 8 Jan 2024 19:31:20 +0000
Subject: [PATCH 303/344] fix

---
 src/runtime/request_manager.cc | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 91a5d3be86..56a2c122d3 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -43,7 +43,8 @@ std::string LoadBytesFromFile(std::string const &path) {
 }
 
 RequestManager::RequestManager()
-    : verbose(false), next_available_guid(1000000), num_processed_requests(0) {
+    : verbose(false), next_available_guid(1000000), num_processed_requests(0),
+      total_request_run_time(0.0f) {
   // The following config parameters are set
   // during ffmodel.compile()
   // Initialize them to -1 to make sure no one

From 29735f2432efd8290bf4ebb301fa96cbb5530eff Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 8 Jan 2024 22:33:22 +0000
Subject: [PATCH 304/344] fixes to run chatgpt.json prompt dataset in python

---
 .dockerignore                             | 2 ++
 .gitignore                                | 3 ++-
 python/flexflow/core/flexflow_cffi.py     | 2 +-
 src/c/flexflow_c.cc                       | 6 +++++-
 src/runtime/model.cu                      | 1 -
 tests/inference/python_inference_tests.sh | 3 ++-
 6 files changed, 12 insertions(+), 5 deletions(-)

diff --git a/.dockerignore b/.dockerignore
index a7470203e3..b9f228c009 100644
--- a/.dockerignore
+++ b/.dockerignore
@@ -17,3 +17,5 @@ python/flexflow/core/legion_cffi_header.py
 /inference/tokenizer/*
 /inference/prompt/*
 /inference/output/*
+
+/tests/inference/python_test_configs/*.json
diff --git a/.gitignore b/.gitignore
index 8fcc105f01..7f6a3c4137 100644
--- a/.gitignore
+++ b/.gitignore
@@ -186,4 +186,5 @@ gpt_tokenizer
 # pip version
 python/flexflow/version.txt
 
-inference_tensors
\ No newline at end of file
+inference_tensors
+tests/inference/python_test_configs/*.json
diff --git a/python/flexflow/core/flexflow_cffi.py b/python/flexflow/core/flexflow_cffi.py
index a3c221474d..00133dacb4 100644
--- a/python/flexflow/core/flexflow_cffi.py
+++ b/python/flexflow/core/flexflow_cffi.py
@@ -56,7 +56,7 @@ def get_c_name(name):
     if name is None:
         return ffi.NULL
     else:
-        return ffi.new("char[]", name.encode("ascii"))
+        return ffi.new("char[]", name.encode("utf-8"))
 
 
 def get_datatype_size(datatype):
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index 579fc5e2d1..82a37a9736 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -1596,7 +1596,11 @@ flexflow_generation_result_t
   GenerationResult result = handle->generate(prompts, max_seq_length);
   DEBUG_PRINT(
       "[Model] generate %p %s %i", handle, text_str.c_str(), max_seq_length);
-  assert(result.output_tokens.size() <= max_seq_length);
+  // If the prompt exceeds max seq len, check that we return the prompt with no
+  // additional token. Otherwise, check that the output does not exceed the max
+  // sequence length.
+  assert(result.output_tokens.size() <= max_seq_length ||
+         result.output_tokens.size() == result.input_tokens.size());
   output_length_and_tokens[0] = result.output_tokens.size();
   std::copy(result.output_tokens.begin(),
             result.output_tokens.end(),
diff --git a/src/runtime/model.cu b/src/runtime/model.cu
index c885b29db2..23b7f0efbe 100644
--- a/src/runtime/model.cu
+++ b/src/runtime/model.cu
@@ -175,7 +175,6 @@ FFHandler
   } else {
     handle.batch_config_metadata = nullptr;
   }
-   
 
   // checkCUDA(cudaMalloc(&handle.workSpace, handle.workSpaceSize));
 #ifdef FF_USE_NCCL
diff --git a/tests/inference/python_inference_tests.sh b/tests/inference/python_inference_tests.sh
index 3544f58e26..10c0821835 100755
--- a/tests/inference/python_inference_tests.sh
+++ b/tests/inference/python_inference_tests.sh
@@ -6,11 +6,12 @@ set -e
 cd "${BASH_SOURCE[0]%/*}"
 
 # Generate test configs
+rm -rf python_test_configs/*.json
 python python_test_configs/generate_configs.py
 
 # Run all tests
 # Loop through .json files in the ./python_test_configs dir 
-for file in ./python_test_configs/*.json; do
+for file in ./python_test_configs/*"llama"*.json; do
     # Check filename prefix
     if [[ $file == *"incr_dec"* ]]; then
       script="../../inference/python/incr_decoding.py"

From ba4af39404bb92af10926222ceb6d9e88a147fb9 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 9 Jan 2024 06:56:36 +0000
Subject: [PATCH 305/344] fix

---
 tests/inference/python_inference_tests.sh | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/tests/inference/python_inference_tests.sh b/tests/inference/python_inference_tests.sh
index 10c0821835..a1ee281914 100755
--- a/tests/inference/python_inference_tests.sh
+++ b/tests/inference/python_inference_tests.sh
@@ -11,7 +11,7 @@ python python_test_configs/generate_configs.py
 
 # Run all tests
 # Loop through .json files in the ./python_test_configs dir 
-for file in ./python_test_configs/*"llama"*.json; do
+for file in ./python_test_configs/*.json; do
     # Check filename prefix
     if [[ $file == *"incr_dec"* ]]; then
       script="../../inference/python/incr_decoding.py"

From 9c85a4f5900e45e2e7dfbc98f57bf43237b4dbc9 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 10 Jan 2024 13:54:11 -0500
Subject: [PATCH 306/344] Fuse bias and relu in OPT (#1265)

---
 include/flexflow/model.h            |  3 ++-
 inference/models/opt.cc             |  5 ++---
 python/flexflow/serve/models/opt.py |  5 ++---
 src/ops/kernels/linear_kernels.cu   | 22 ++++++++++++++++++++++
 src/runtime/model.cc                | 27 ++++++++++++++++++++++++---
 5 files changed, 52 insertions(+), 10 deletions(-)

diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 6f805e21bd..75b1dbcbe9 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -1090,7 +1090,7 @@ class FFModel {
   std::unordered_map<Op *, std::vector<std::pair<Op *, int>>>
       get_bwd_edge_map() const;
 
-  // Internal funcitons
+  // Internal functions
   Legion::IndexSpace get_or_create_task_is(ParallelConfig const &pc);
   Legion::IndexSpace get_or_create_task_is(MachineView const &view);
   Legion::IndexSpace get_or_create_task_is(Legion::Domain const &domain);
@@ -1098,6 +1098,7 @@ class FFModel {
   Legion::IndexSpace get_task_is(Legion::Domain const &domain) const;
   Legion::IndexSpace get_task_is(ParallelConfig const &pc) const;
   Legion::IndexSpace get_task_is(MachineView const &view) const;
+  bool is_mlp_block(int layer_idx) const;
   void create_operators_from_layers();
   Op *create_operator_from_layer(Layer *layer,
                                  std::vector<ParallelTensor> const &inputs);
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index 0279f83239..e260f8fa36 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -196,7 +196,7 @@ void OPT::create_opt_model(FFModel &ff,
     Tensor fc1 =
         ff.dense(final_norm,
                  opt_config.ffn_dim,
-                 AC_MODE_NONE,
+                 AC_MODE_RELU,
                  true,
                  DT_NONE,
                  nullptr,
@@ -205,8 +205,7 @@ void OPT::create_opt_model(FFModel &ff,
                  REG_MODE_NONE,
                  0.0f,
                  std::string("layers_" + std::to_string(i) + "_fc1").c_str());
-    Tensor activation = ff.relu(fc1, false);
-    fc2 = ff.dense(activation,
+    fc2 = ff.dense(fc1,
                    opt_config.hidden_size,
                    AC_MODE_NONE,
                    true,
diff --git a/python/flexflow/serve/models/opt.py b/python/flexflow/serve/models/opt.py
index dfd1cde7d4..dd36fa6592 100644
--- a/python/flexflow/serve/models/opt.py
+++ b/python/flexflow/serve/models/opt.py
@@ -216,13 +216,12 @@ def build_model(self, max_tokens_per_batch):
             fc1 = ffmodel.dense(
                 ff_norm,
                 self.opt_config.ffn_dim,
-                ActiMode.AC_MODE_NONE,
+                ActiMode.AC_MODE_RELU,
                 True,
                 name=f"layers_{i}_fc1",
             )
-            activation = ffmodel.relu(fc1, False)
             fc2 = ffmodel.dense(
-                activation,
+                fc1,
                 self.opt_config.hidden_size,
                 ActiMode.AC_MODE_NONE,
                 True,
diff --git a/src/ops/kernels/linear_kernels.cu b/src/ops/kernels/linear_kernels.cu
index 9373c2fb2f..c30c9f71c1 100644
--- a/src/ops/kernels/linear_kernels.cu
+++ b/src/ops/kernels/linear_kernels.cu
@@ -252,6 +252,18 @@ Parameter* Linear::get_parameter(int index)
 */
 namespace Internal {
 
+template <typename DT>
+__global__ void AddBiasWithReLU(DT *output_ptr,
+                                DT const *bias_ptr,
+                                int out_dim,
+                                int batch_size) {
+  CUDA_KERNEL_LOOP(i, out_dim * batch_size) {
+    int bias_idx = i % out_dim;
+    DT value = output_ptr[i] + bias_ptr[bias_idx];
+    output_ptr[i] = ((float)value > 0.0f) ? value : (DT)0.0f;
+  }
+}
+
 template <typename DT>
 void forward_kernel(LinearMeta const *m,
                     void const *input_ptr,
@@ -343,6 +355,16 @@ void forward_kernel(LinearMeta const *m,
                          CUBLAS_GEMM_DEFAULT_TENSOR_OP));
   // use_bias = True
   if (bias_ptr != NULL) {
+    // fuse bias and relu
+    if (m->activation == AC_MODE_RELU) {
+      int parallelism = out_dim * batch_size;
+      AddBiasWithReLU<<<GET_BLOCKS(parallelism), CUDA_NUM_THREADS, 0, stream>>>(
+          static_cast<DT *>(output_ptr),
+          static_cast<DT const *>(bias_ptr),
+          out_dim,
+          batch_size);
+      return;
+    }
     checkCUDA(cublasGemmEx(m->handle.blas,
                            CUBLAS_OP_T,
                            CUBLAS_OP_N,
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 76bed36bda..4270515224 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -3236,6 +3236,27 @@ Op *FFModel::create_operator_from_layer(
   }
 }
 
+bool FFModel::is_mlp_block(int layer_idx) const {
+  auto const &l = layers[layer_idx];
+  // standard opt relu
+  if (l->op_type == OP_LINEAR && layer_idx >= 2 &&
+      layers[layer_idx - 1]->op_type == OP_RELU &&
+      layers[layer_idx - 2]->op_type == OP_LINEAR) {
+    return true;
+  }
+  // mlp layer with relu embedded in first dense layer
+  if (l->op_type == OP_LINEAR && layer_idx >= 1 &&
+      layers[layer_idx - 1]->op_type == OP_LINEAR) {
+    long long value;
+    layers[layer_idx - 1]->get_int_property("activation", value);
+    ActiMode activation = (ActiMode)value;
+    if (activation == AC_MODE_RELU) {
+      return true;
+    }
+  }
+  return false;
+}
+
 void FFModel::create_operators_from_layers() {
   std::map<const Tensor, ParallelTensor> tensors_to_parallel_tensors;
   // for (auto const &l : layers) {
@@ -3280,9 +3301,9 @@ void FFModel::create_operators_from_layers() {
                config.tensor_parallelism_degree > 1 &&
                (l->op_type == OP_INC_MULTIHEAD_SELF_ATTENTION ||
                 l->op_type == OP_TREE_INC_MULTIHEAD_SELF_ATTENTION ||
-                (l->op_type == OP_LINEAR && layer_idx >= 2 &&
-                 layers[layer_idx - 1]->op_type == OP_RELU &&
-                 layers[layer_idx - 2]->op_type == OP_LINEAR) ||
+                // mlp layer
+                is_mlp_block(layer_idx) ||
+                // llama mlp layer
                 (l->op_type == OP_LINEAR && layer_idx >= 2 &&
                  layers[layer_idx - 1]->op_type == OP_GELU &&
                  layers[layer_idx - 2]->op_type == OP_LINEAR) ||

From 197e308ffb872aee9a326eff1b6c6c0bccb075a7 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Fri, 12 Jan 2024 12:13:34 -0500
Subject: [PATCH 307/344] fix spec decoding

---
 deps/legion                   | 2 +-
 inference/models/falcon.cc    | 2 +-
 inference/models/llama.cc     | 2 +-
 inference/models/mpt.cc       | 2 +-
 inference/models/opt.cc       | 2 +-
 inference/models/starcoder.cc | 2 +-
 6 files changed, 6 insertions(+), 6 deletions(-)

diff --git a/deps/legion b/deps/legion
index 626b55689c..d065278678 160000
--- a/deps/legion
+++ b/deps/legion
@@ -1 +1 @@
-Subproject commit 626b55689c77848b246e1da19678c7ad58899f0c
+Subproject commit d0652786784249e933dd62f675591da99a5e960d
diff --git a/inference/models/falcon.cc b/inference/models/falcon.cc
index 999ca37037..cf6e90a7de 100644
--- a/inference/models/falcon.cc
+++ b/inference/models/falcon.cc
@@ -39,7 +39,7 @@ void FALCON::create_falcon_model(FFModel &ff,
   Tensor input;
   {
     // assert(falcon_config.max_num_tokens <= BatchConfig::MAX_NUM_TOKENS);
-    int const token_dims[] = {mode == TREE_VERIFY_MODE
+    int const token_dims[] = {(mode == TREE_VERIFY_MODE || mode == BEAM_SEARCH_MODE)
                                   ? BatchConfig::max_verify_tokens_per_batch()
                                   : BatchConfig::max_tokens_per_batch(),
                               1};
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index e54d6d8811..3deba47953 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -41,7 +41,7 @@ void LLAMA::create_llama_model(FFModel &ff,
 
   Tensor input;
   {
-    int const token_dims[] = {mode == TREE_VERIFY_MODE
+    int const token_dims[] = {(mode == TREE_VERIFY_MODE || mode == BEAM_SEARCH_MODE)
                                   ? BatchConfig::max_verify_tokens_per_batch()
                                   : BatchConfig::max_tokens_per_batch(),
                               1};
diff --git a/inference/models/mpt.cc b/inference/models/mpt.cc
index 3df67b264c..484a09f62e 100644
--- a/inference/models/mpt.cc
+++ b/inference/models/mpt.cc
@@ -40,7 +40,7 @@ void MPT::create_mpt_model(FFModel &ff,
   //------------------------------ build the model --------------------------
   Tensor input;
   {
-    int const token_dims[] = {mode == TREE_VERIFY_MODE
+    int const token_dims[] = {(mode == TREE_VERIFY_MODE || mode == BEAM_SEARCH_MODE)
                                   ? BatchConfig::max_verify_tokens_per_batch()
                                   : BatchConfig::max_tokens_per_batch(),
                               1};
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index e260f8fa36..9f75dcea4c 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -42,7 +42,7 @@ void OPT::create_opt_model(FFModel &ff,
   Tensor position_input;
   ff.set_position_offset(2);
   {
-    int const token_dims[] = {mode == TREE_VERIFY_MODE
+    int const token_dims[] = {(mode == TREE_VERIFY_MODE || mode == BEAM_SEARCH_MODE)
                                   ? BatchConfig::max_verify_tokens_per_batch()
                                   : BatchConfig::max_tokens_per_batch(),
                               1};
diff --git a/inference/models/starcoder.cc b/inference/models/starcoder.cc
index e683376e47..ef5388b6ca 100644
--- a/inference/models/starcoder.cc
+++ b/inference/models/starcoder.cc
@@ -48,7 +48,7 @@ void STARCODER::create_starcoder_model(
   ff.set_position_offset(0);
   {
     // assert(startcoder_config.max_num_tokens <= BatchConfig::MAX_NUM_TOKENS);
-    int const token_dims[] = {mode == TREE_VERIFY_MODE
+    int const token_dims[] = {(mode == TREE_VERIFY_MODE || mode == BEAM_SEARCH_MODE)
                                   ? BatchConfig::max_verify_tokens_per_batch()
                                   : BatchConfig::max_tokens_per_batch(),
                               1};

From ed4dbd808eb20ddd99e6349c41a66ec782c3cefb Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Fri, 12 Jan 2024 12:20:52 -0500
Subject: [PATCH 308/344] Revert "fix spec decoding"

This reverts commit 197e308ffb872aee9a326eff1b6c6c0bccb075a7.
---
 deps/legion                   | 2 +-
 inference/models/falcon.cc    | 2 +-
 inference/models/llama.cc     | 2 +-
 inference/models/mpt.cc       | 2 +-
 inference/models/opt.cc       | 2 +-
 inference/models/starcoder.cc | 2 +-
 6 files changed, 6 insertions(+), 6 deletions(-)

diff --git a/deps/legion b/deps/legion
index d065278678..626b55689c 160000
--- a/deps/legion
+++ b/deps/legion
@@ -1 +1 @@
-Subproject commit d0652786784249e933dd62f675591da99a5e960d
+Subproject commit 626b55689c77848b246e1da19678c7ad58899f0c
diff --git a/inference/models/falcon.cc b/inference/models/falcon.cc
index cf6e90a7de..999ca37037 100644
--- a/inference/models/falcon.cc
+++ b/inference/models/falcon.cc
@@ -39,7 +39,7 @@ void FALCON::create_falcon_model(FFModel &ff,
   Tensor input;
   {
     // assert(falcon_config.max_num_tokens <= BatchConfig::MAX_NUM_TOKENS);
-    int const token_dims[] = {(mode == TREE_VERIFY_MODE || mode == BEAM_SEARCH_MODE)
+    int const token_dims[] = {mode == TREE_VERIFY_MODE
                                   ? BatchConfig::max_verify_tokens_per_batch()
                                   : BatchConfig::max_tokens_per_batch(),
                               1};
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index 3deba47953..e54d6d8811 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -41,7 +41,7 @@ void LLAMA::create_llama_model(FFModel &ff,
 
   Tensor input;
   {
-    int const token_dims[] = {(mode == TREE_VERIFY_MODE || mode == BEAM_SEARCH_MODE)
+    int const token_dims[] = {mode == TREE_VERIFY_MODE
                                   ? BatchConfig::max_verify_tokens_per_batch()
                                   : BatchConfig::max_tokens_per_batch(),
                               1};
diff --git a/inference/models/mpt.cc b/inference/models/mpt.cc
index 484a09f62e..3df67b264c 100644
--- a/inference/models/mpt.cc
+++ b/inference/models/mpt.cc
@@ -40,7 +40,7 @@ void MPT::create_mpt_model(FFModel &ff,
   //------------------------------ build the model --------------------------
   Tensor input;
   {
-    int const token_dims[] = {(mode == TREE_VERIFY_MODE || mode == BEAM_SEARCH_MODE)
+    int const token_dims[] = {mode == TREE_VERIFY_MODE
                                   ? BatchConfig::max_verify_tokens_per_batch()
                                   : BatchConfig::max_tokens_per_batch(),
                               1};
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index 9f75dcea4c..e260f8fa36 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -42,7 +42,7 @@ void OPT::create_opt_model(FFModel &ff,
   Tensor position_input;
   ff.set_position_offset(2);
   {
-    int const token_dims[] = {(mode == TREE_VERIFY_MODE || mode == BEAM_SEARCH_MODE)
+    int const token_dims[] = {mode == TREE_VERIFY_MODE
                                   ? BatchConfig::max_verify_tokens_per_batch()
                                   : BatchConfig::max_tokens_per_batch(),
                               1};
diff --git a/inference/models/starcoder.cc b/inference/models/starcoder.cc
index ef5388b6ca..e683376e47 100644
--- a/inference/models/starcoder.cc
+++ b/inference/models/starcoder.cc
@@ -48,7 +48,7 @@ void STARCODER::create_starcoder_model(
   ff.set_position_offset(0);
   {
     // assert(startcoder_config.max_num_tokens <= BatchConfig::MAX_NUM_TOKENS);
-    int const token_dims[] = {(mode == TREE_VERIFY_MODE || mode == BEAM_SEARCH_MODE)
+    int const token_dims[] = {mode == TREE_VERIFY_MODE
                                   ? BatchConfig::max_verify_tokens_per_batch()
                                   : BatchConfig::max_tokens_per_batch(),
                               1};

From 12fdbac30286eee17d4372ccd58230303dd422d6 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Sun, 14 Jan 2024 00:28:25 -0500
Subject: [PATCH 309/344] Add a background server for RequestManager (#1223)

* add a background server for RequestManager

* .

* make incr_decoding work

* make spec_infer work

* format

* update python inference

* fix python issues

* bug fix

* add a Legion future to capture the termination of the background server

* Add thread safety for background server.

* Simplify backend server design.

* resolve conflict.

* Add server task timeout.

* register callbacks to terminate background worker at exit or termination

* [Python] enable decoding multiple requests

* update README.md and default configuration

* [Python] no need to use the llm context environment to start/stop the background server

* require at least four cpu cores

* [Python] add back explict start_server()/stop_server().

* fix

* fix python chatgpt.json

---------

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
Co-authored-by: zwang86 <46699021+zwang86@users.noreply.github.com>
Co-authored-by: Zeyu Wang <zeyuwang@andrew.cmu.edu>
Co-authored-by: xinhaoc <xinhaoc@andrew.cmu.edu>
---
 .github/README.md                             |  24 +-
 CMakeLists.txt                                |   4 +-
 include/flexflow/flexflow_c.h                 |  31 +-
 include/flexflow/model.h                      |   5 +-
 include/flexflow/request_manager.h            |  76 ++--
 .../flexflow/utils}/file_loader.h             |  11 +-
 inference/incr_decoding/CMakeLists.txt        |   1 -
 inference/incr_decoding/incr_decoding.cc      |   8 +-
 inference/models/falcon.cc                    |  24 +-
 inference/models/falcon.h                     |   2 +-
 inference/models/llama.cc                     |  32 +-
 inference/models/llama.h                      |   2 +-
 inference/models/mpt.cc                       |  23 +-
 inference/models/mpt.h                        |   2 +-
 inference/models/opt.cc                       |  23 +-
 inference/models/opt.h                        |   2 +-
 inference/models/starcoder.cc                 |  29 +-
 inference/models/starcoder.h                  |   2 +-
 inference/python/incr_decoding.py             |   7 +-
 inference/python/spec_infer.py                |  18 +-
 inference/spec_infer/CMakeLists.txt           |   1 -
 inference/spec_infer/spec_infer.cc            |   6 +
 python/flexflow/core/flexflow_cffi.py         |  48 ++-
 python/flexflow/serve/models/falcon.py        |   4 +-
 python/flexflow/serve/models/llama.py         |   5 +-
 python/flexflow/serve/models/mpt.py           |   5 +-
 python/flexflow/serve/models/opt.py           |   4 +-
 python/flexflow/serve/models/starcoder.py     |   5 +-
 python/flexflow/serve/serve.py                |  88 +++--
 src/c/flexflow_c.cc                           |  94 +++--
 src/mapper/mapper.cc                          |   3 +-
 src/ops/linear.cc                             |  12 +-
 {inference => src/runtime}/file_loader.cc     |  15 +-
 src/runtime/inference_manager.cc              |  48 ++-
 src/runtime/model.cc                          |  18 +
 src/runtime/request_manager.cc                | 330 ++++++++++++------
 36 files changed, 681 insertions(+), 331 deletions(-)
 rename {inference => include/flexflow/utils}/file_loader.h (84%)
 rename {inference => src/runtime}/file_loader.cc (98%)

diff --git a/.github/README.md b/.github/README.md
index 528df18faf..0972135504 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -79,7 +79,12 @@ ssms=[]
 ssm = ff.SSM("JackFram/llama-68m")
 ssms.append(ssm)
 ```
-Next, we declare the generation configuration and compile both the LLM and SSMs. Note that all SSMs should run in the **beam search** mode, and the LLM should run in the **tree verification** mode to verify the speculated tokens from SSMs.
+Next, we declare the generation configuration and compile both the LLM and SSMs. Note that all SSMs should run in the **beam search** mode, and the LLM should run in the **tree verification** mode to verify the speculated tokens from SSMs. You can also use the following arguments to specify serving configuration when compiling LLMs and SSMs:
+
+* max\_requests\_per\_batch: the maximum number of requests to serve in a batch (default: 16)
+* max\_seq\_length: the maximum number of tokens in a request (default: 256)
+* max\_tokens\_per\_batch: the maximum number of tokens to process in a batch (default: 128)
+
 ```python
 # Create the sampling configs
 generation_config = ff.GenerationConfig(
@@ -91,11 +96,16 @@ for ssm in ssms:
     ssm.compile(generation_config)
 
 # Compile the LLM for inference and load the weights into memory
-llm.compile(generation_config, ssms=ssms)
+llm.compile(generation_config,
+            max_requests_per_batch = 16,
+            max_seq_length = 256,
+            max_tokens_per_batch = 128,
+            ssms=ssms)
 ```
 Finally, we call `llm.generate` to generate the output, which is organized as a list of `GenerationResult`, which include the output tokens and text.
 ```python
-result = llm.generate("Here are some travel tips for Tokyo:\n")
+with llm:
+  result = llm.generate("Here are some travel tips for Tokyo:\n")
 ```
 
 ### Incremental decoding
@@ -124,10 +134,14 @@ generation_config = ff.GenerationConfig(
 )
 
 # Compile the LLM for inference and load the weights into memory
-llm.compile(generation_config)
+llm.compile(generation_config,
+            max_requests_per_batch = 16,
+            max_seq_length = 256,
+            max_tokens_per_batch = 128)
 
 # Generation begins!
-result = llm.generate("Here are some travel tips for Tokyo:\n")
+with llm:
+  result = llm.generate("Here are some travel tips for Tokyo:\n")
 ```
 
 </details>
diff --git a/CMakeLists.txt b/CMakeLists.txt
index 90cab126e6..acbe7e385f 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -264,14 +264,14 @@ if(NOT BUILD_LEGION_ONLY)
     LIST_DIRECTORIES False
     ${FLEXFLOW_ROOT}/include/*.h)
   
-  list(APPEND FLEXFLOW_HDR ${FLEXFLOW_ROOT}/inference/file_loader.h)
+  #list(APPEND FLEXFLOW_HDR ${FLEXFLOW_ROOT}/inference/file_loader.h)
 
   file(GLOB_RECURSE FLEXFLOW_SRC
     LIST_DIRECTORIES False
     ${FLEXFLOW_ROOT}/src/*.cc)
   
   list(REMOVE_ITEM FLEXFLOW_SRC "${FLEXFLOW_ROOT}/src/runtime/cpp_driver.cc")
-  list(APPEND FLEXFLOW_SRC ${FLEXFLOW_ROOT}/inference/file_loader.cc)
+  #list(APPEND FLEXFLOW_SRC ${FLEXFLOW_ROOT}/inference/file_loader.cc)
 
   set(FLEXFLOW_CPP_DRV_SRC
     ${FLEXFLOW_ROOT}/src/runtime/cpp_driver.cc)
diff --git a/include/flexflow/flexflow_c.h b/include/flexflow/flexflow_c.h
index 305c8da513..cab3d14ea7 100644
--- a/include/flexflow/flexflow_c.h
+++ b/include/flexflow/flexflow_c.h
@@ -611,13 +611,13 @@ flexflow_perf_metrics_t
 
 void flexflow_model_set_transformer_layer_id(flexflow_model_t handle, int id);
 
-flexflow_generation_result_t
-    flexflow_model_generate(flexflow_model_t handle_,
-                            char const *input_text,
-                            int max_num_chars,
-                            char *output_text,
-                            int max_seq_length,
-                            int *output_length_and_tokens);
+void flexflow_model_generate(flexflow_model_t handle_,
+                             int num_requests,
+                             char const **input_text,
+                             int max_num_chars,
+                             char **output_text,
+                             int max_seq_length,
+                             int **output_length_and_tokens);
 
 void flexflow_model_set_position_offset(flexflow_model_t handle, int offset);
 
@@ -988,6 +988,12 @@ void flexflow_request_manager_register_output_filepath(
 int flexflow_request_manager_register_ssm_model(
     flexflow_request_manager_t handle_, flexflow_model_t model_handle_);
 
+void flexflow_request_manager_start_background_server(
+    flexflow_request_manager_t handle_, flexflow_model_t model_handle_);
+
+void flexflow_request_manager_terminate_background_server(
+    flexflow_request_manager_t handle_);
+
 // -----------------------------------------------------------------------
 // InferenceManager
 // -----------------------------------------------------------------------
@@ -1004,6 +1010,11 @@ void flexflow_inference_manager_compile_model_and_allocate_buffer(
 void flexflow_inference_manager_init_operators_inference(
     flexflow_inference_manager_t handle_, flexflow_model_t model_handle);
 
+void flexflow_inference_manager_register_model_weights_loader(
+    flexflow_inference_manager_t handle_,
+    flexflow_model_t model_handle,
+    flexflow_file_data_loader_t loader_handle);
+
 // -----------------------------------------------------------------------
 // FileDataLoader
 // -----------------------------------------------------------------------
@@ -1014,13 +1025,13 @@ flexflow_file_data_loader_t
                                      int num_kv_heads,
                                      int hidden_dim,
                                      int qkv_inner_dim,
-                                     int tensor_parallelism_degree);
+                                     int tensor_parallelism_degree,
+                                     bool use_full_precision);
 
 void flexflow_file_data_loader_destroy(flexflow_file_data_loader_t handle_);
 
 void flexflow_file_data_loader_load_weights(flexflow_file_data_loader_t handle_,
-                                            flexflow_model_t model_handle_,
-                                            bool use_full_precision);
+                                            flexflow_model_t model_handle_);
 
 #ifdef __cplusplus
 }
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 75b1dbcbe9..dd6dc76b4d 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -247,6 +247,7 @@ enum TaskIDs {
   RM_PREPARE_NEXT_BATCH_INIT_TASK_ID,
   RM_PREPARE_NEXT_BATCH_BEAM_TASK_ID,
   RM_PREPARE_NEXT_BATCH_VERIFY_TASK_ID,
+  RM_BACKGROUND_SERVING_TASK_ID,
   // Custom tasks
   CUSTOM_GPU_TASK_ID_FIRST,
   CUSTOM_GPU_TASK_ID_1,
@@ -806,8 +807,8 @@ class FFModel {
   // ========================================
   // Inference APIs
   // ========================================
-  GenerationResult generate(std::vector<std::string> &prompts,
-                            int max_seq_length);
+  std::vector<GenerationResult> generate(std::vector<std::string> &prompts,
+                                         int max_seq_length);
 
   Tensor create_tensor_legion_ordering(int num_dim,
                                        int const dims[],
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index f74b6c5b9f..50a51705cd 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -18,6 +18,8 @@
 #include "flexflow/batch_config.h"
 #include "flexflow/inference.h"
 #include "flexflow/model.h"
+#include "flexflow/utils/file_loader.h"
+#include <future>
 #include <mutex>
 #include <tokenizers_cpp.h>
 
@@ -30,25 +32,29 @@ using tokenizers::Tokenizer;
 
 class InferenceManager {
 public:
-  InferenceManager(FFConfig const &config);
+  InferenceManager();
   static InferenceManager *get_inference_manager();
   void compile_model_and_allocate_buffer(FFModel *model);
   void init_operators_inference(FFModel *model);
   Legion::FutureMap inference(FFModel *model, int index, BatchConfig const &bc);
   Legion::FutureMap
       inference(FFModel *model, int index, BatchConfigFuture const &bc);
-  void load_input_tokens_from_batch_config(BatchConfigFuture const &bc,
+  void load_input_tokens_from_batch_config(FFModel *model,
+                                           BatchConfigFuture const &bc,
                                            ParallelTensor const input,
                                            FFHandler *handlers);
-  void load_positions(BatchConfigFuture const &bc,
+  void load_positions(FFModel *model,
+                      BatchConfigFuture const &bc,
                       ParallelTensor position_input,
                       int offset);
-  void load_inference_metadata_batch_config(BatchConfigFuture const &bc,
+  void register_model_weights_loader(FFModel *, FileDataLoader *);
+  void load_inference_metadata_batch_config(FFModel *model,
+                                            BatchConfigFuture const &bc,
                                             FFHandler *handlers);
 
 public:
-  FFConfig ff_config;
   std::unordered_map<ParallelTensor, std::vector<ParallelTensor>> tensor_buffer;
+  std::unordered_map<FFModel *, FileDataLoader *> model_weights_loaders;
   int num_devices;
 };
 
@@ -91,9 +97,15 @@ struct BeamTree {
 
 class RequestManager {
 public:
+  enum Status {
+    INITIALIZED = 1001,
+    SERVING = 1002,
+    TERMINATED = 1003,
+  };
   using RequestGuid = BatchConfig::RequestGuid;
   using TokenId = BatchConfig::TokenId;
 
+  static const RequestGuid INVALID_GUID = 0;
   RequestManager();
   static RequestManager *get_request_manager();
   size_t get_num_processed_requests();
@@ -125,30 +137,38 @@ class RequestManager {
                      int initLength,
                      int non_tree_size);
 
-  FFModel *get_model(int model_id);
+  FFModel *get_ssm_model(int model_id);
 
-  GenerationResult generate_incr_decoding(FFModel *model,
-                                          std::vector<std::string> &prompts,
-                                          int max_seq_length);
-  GenerationResult generate_spec_infer(FFModel *model,
-                                       std::vector<std::string> &prompts,
-                                       int max_seq_length);
+  void serve_incr_decoding(FFModel *model);
+  void serve_spec_infer(FFModel *model);
   GenerationResult get_generation_result(RequestGuid const &guid);
   RequestGuid register_new_request(std::string const &prompt,
                                    int max_sequence_length);
   RequestGuid register_new_request(std::vector<TokenId> const &prompt,
                                    int max_sequence_length);
+  // Methods to start and terminate request manager's background task
+  void start_background_server(FFModel *model);
+  bool is_background_server_terminated();
+  void terminate_background_server();
+  static void terminate_background_server_at_exit();
+  // Methods to check and mark request completion
   bool is_request_completed(RequestGuid const &guid);
+  void trigger_request_completion_future(RequestGuid const &guid);
+  // Methods for preparing next batches
   BatchConfig prepare_next_batch(BatchConfig const &bc,
                                  InferenceResult const &result);
   BatchConfigFuture prepare_next_batch(BatchConfigFuture const &bc,
-                                       InferenceResultFuture const &result);
+                                       InferenceResultFuture const &result,
+                                       Legion::Context ctx,
+                                       Legion::Runtime *runtime);
   BeamSearchBatchConfig
       prepare_next_batch_beam(BeamSearchBatchConfig const &old_bc,
                               BeamInferenceResult const &result);
   BeamSearchBatchConfigFuture
       prepare_next_batch_beam(BeamSearchBatchConfigFuture const &old_bc,
-                              BeamInferenceResultFuture const &result);
+                              BeamInferenceResultFuture const &result,
+                              Legion::Context ctx,
+                              Legion::Runtime *runtime);
   BeamSearchBatchConfig
       prepare_next_batch_init(TreeVerifyBatchConfig const &old_bc,
                               InferenceResult const &result,
@@ -156,11 +176,15 @@ class RequestManager {
   BeamSearchBatchConfigFuture
       prepare_next_batch_init(TreeVerifyBatchConfigFuture const &old_bc,
                               InferenceResultFuture const &result,
-                              int model_id);
+                              int model_id,
+                              Legion::Context ctx,
+                              Legion::Runtime *runtime);
   TreeVerifyBatchConfig prepare_next_batch_verify(
       std::vector<BeamSearchBatchConfig> const &old_batches);
   TreeVerifyBatchConfigFuture prepare_next_batch_verify(
-      std::vector<BeamSearchBatchConfigFuture> const &old_batches);
+      std::vector<BeamSearchBatchConfigFuture> const &old_batches,
+      Legion::Context ctx,
+      Legion::Runtime *runtime);
 
   void store_beam_metadata(BeamSearchBatchConfig const &old_bc,
                            BeamInferenceResult const &result);
@@ -187,7 +211,11 @@ class RequestManager {
           &inputSerializedTree,
       std::vector<std::pair<BatchConfig::TokenId, int>> const
           &outputSerializedTree);
-
+  static void background_serving_task(
+      Legion::Task const *task,
+      std::vector<Legion::PhysicalRegion> const &regions,
+      Legion::Context ctx,
+      Legion::Runtime *runtime);
   static void
       load_tokens_task(Legion::Task const *task,
                        std::vector<Legion::PhysicalRegion> const &regions,
@@ -233,9 +261,11 @@ class RequestManager {
   int max_requests_per_batch;
   int max_tokens_per_batch;
   int max_sequence_length;
+  Status request_manager_status;
 
   // tree width in each speculative step, if not specified 1
   std::vector<int> spec_infer_tree_width;
+
   // private fields
   std::unique_ptr<Tokenizer> tokenizer_;
   bool verbose;
@@ -247,12 +277,9 @@ class RequestManager {
   std::unordered_map<RequestGuid, Request> all_requests;
   std::unordered_map<RequestGuid, GenerationResult> request_generation_results;
   std::mutex request_queue_mutex;
+  std::unordered_map<RequestGuid, std::promise<void> *> request_to_promise;
+  std::mutex request_to_promise_mutex;
   RequestGuid next_available_guid;
-  // Legion futures for inc_decoding and spec_infer
-  BatchConfigFuture last_bcf;
-  InferenceResultFuture last_irf;
-  TreeVerifyBatchConfigFuture last_tree_bcf;
-  InferenceResultFuture last_tree_irf;
 
   // TODO: Move this two vector to request struct
   std::unordered_map<RequestGuid,
@@ -262,11 +289,14 @@ class RequestManager {
       committed_tokens;
 
   // Multi-model support
-  std::vector<FFModel *> models;
+  std::vector<FFModel *> ssm_models;
 
   // Performance profiling
   size_t num_processed_requests;
 
+  // Background server handler
+  Legion::Future background_server_handler;
+
 private:
   struct ProfileInfo {
     int llm_decoding_steps;
diff --git a/inference/file_loader.h b/include/flexflow/utils/file_loader.h
similarity index 84%
rename from inference/file_loader.h
rename to include/flexflow/utils/file_loader.h
index 6f01a79b80..646eb18da2 100644
--- a/inference/file_loader.h
+++ b/include/flexflow/utils/file_loader.h
@@ -30,18 +30,16 @@ class FileDataLoader {
                  int _num_kv_heads,
                  size_t _hidden_dim,
                  size_t _qkv_inner_dim,
-                 int _tensor_parallelism_degree);
+                 int _tensor_parallelism_degree,
+                 bool _use_full_precision);
 
   BatchConfig::TokenId *generate_requests(int num, int length);
 
   template <typename DT>
   void load_single_weight_tensor(FFModel *ff, Layer *l, int weight_idx);
 
-  void load_quantization_weight(FFModel *ff,
-                                Layer *l,
-                                int weight_idx,
-                                bool use_full_precision);
-  void load_weights(FFModel *ff, bool use_full_precision);
+  void load_quantization_weight(FFModel *ff, Layer *l, int weight_idx);
+  void load_weights(FFModel *ff);
 
   void load_positions(FFModel *ff,
                       Tensor pt,
@@ -54,4 +52,5 @@ class FileDataLoader {
   size_t hidden_dim, qkv_inner_dim;
   std::string prompts_filepath;
   std::string weights_folder;
+  bool use_full_precision;
 };
diff --git a/inference/incr_decoding/CMakeLists.txt b/inference/incr_decoding/CMakeLists.txt
index 53b7cf0c2f..3e1a1521d7 100644
--- a/inference/incr_decoding/CMakeLists.txt
+++ b/inference/incr_decoding/CMakeLists.txt
@@ -7,7 +7,6 @@ set(project_target incr_decoding)
 set(CPU_SRC
   ${FLEXFLOW_CPP_DRV_SRC}
   incr_decoding.cc
-  ../file_loader.cc
   ../models/llama.cc
   ../models/opt.cc
   ../models/falcon.cc
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index c3f9052305..f88af3bc43 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -24,6 +24,7 @@
 
 #include <nlohmann/json.hpp>
 
+using namespace FlexFlow;
 using namespace Legion;
 using json = nlohmann::json;
 
@@ -250,6 +251,8 @@ void FlexFlow::top_level_task(Task const *task,
     assert(false && "unknow model type");
   }
 
+  rm->start_background_server(&model);
+
   int total_num_requests = 0;
   {
     using json = nlohmann::json;
@@ -266,10 +269,13 @@ void FlexFlow::top_level_task(Task const *task,
       total_num_requests++;
       prompts.push_back(text);
     }
-    GenerationResult result =
+    std::vector<GenerationResult> result =
         model.generate(prompts, 128 /*max_sequence_length*/);
   }
 
+  // terminate the request manager by stopping the background thread
+  rm->terminate_background_server();
+
   // Execution fence
   {
     Future future = runtime->issue_execution_fence(ctx);
diff --git a/inference/models/falcon.cc b/inference/models/falcon.cc
index 999ca37037..e00f4e9cfd 100644
--- a/inference/models/falcon.cc
+++ b/inference/models/falcon.cc
@@ -39,10 +39,11 @@ void FALCON::create_falcon_model(FFModel &ff,
   Tensor input;
   {
     // assert(falcon_config.max_num_tokens <= BatchConfig::MAX_NUM_TOKENS);
-    int const token_dims[] = {mode == TREE_VERIFY_MODE
-                                  ? BatchConfig::max_verify_tokens_per_batch()
-                                  : BatchConfig::max_tokens_per_batch(),
-                              1};
+    int const token_dims[] = {
+        (mode == TREE_VERIFY_MODE || mode == BEAM_SEARCH_MODE)
+            ? BatchConfig::max_verify_tokens_per_batch()
+            : BatchConfig::max_tokens_per_batch(),
+        1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
 
@@ -239,6 +240,20 @@ void FALCON::create_falcon_model(FFModel &ff,
     output = ff.argmax(lm_head, /*beam_Search*/ false);
   }
 
+  FileDataLoader *fileloader =
+      new FileDataLoader("",
+                         weight_file_path,
+                         falcon_config.n_head,
+                         falcon_config.n_head_kv,
+                         falcon_config.hidden_size,
+                         falcon_config.hidden_size / falcon_config.n_head,
+                         ff.config.tensor_parallelism_degree,
+                         use_full_precision);
+
+  InferenceManager *im = InferenceManager::get_inference_manager();
+  im->register_model_weights_loader(&ff, fileloader);
+
+#ifdef DEADCODE
   // Compile the model
   std::cout << "------start compile ----------" << std::endl;
   InferenceManager *im = InferenceManager::get_inference_manager();
@@ -256,6 +271,7 @@ void FALCON::create_falcon_model(FFModel &ff,
 
   // init operators
   im->init_operators_inference(&ff);
+#endif
 }
 
 }; // namespace FlexFlow
diff --git a/inference/models/falcon.h b/inference/models/falcon.h
index 01226a30dc..fce2dade3f 100644
--- a/inference/models/falcon.h
+++ b/inference/models/falcon.h
@@ -14,7 +14,7 @@
  */
 #pragma once
 
-#include "file_loader.h"
+// #include "file_loader.h"
 #include "flexflow/batch_config.h"
 #include "flexflow/inference.h"
 #include "flexflow/request_manager.h"
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index e54d6d8811..14b8c31fa1 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -41,10 +41,11 @@ void LLAMA::create_llama_model(FFModel &ff,
 
   Tensor input;
   {
-    int const token_dims[] = {mode == TREE_VERIFY_MODE
-                                  ? BatchConfig::max_verify_tokens_per_batch()
-                                  : BatchConfig::max_tokens_per_batch(),
-                              1};
+    int const token_dims[] = {
+        (mode == TREE_VERIFY_MODE || mode == BEAM_SEARCH_MODE)
+            ? BatchConfig::max_verify_tokens_per_batch()
+            : BatchConfig::max_tokens_per_batch(),
+        1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
 
@@ -264,23 +265,28 @@ void LLAMA::create_llama_model(FFModel &ff,
     }
   }
 
+  FileDataLoader *fileloader = new FileDataLoader(
+      "",
+      weight_file_path,
+      llama_config.num_attention_heads,
+      llama_config.num_attention_heads,
+      llama_config.hidden_size,
+      llama_config.hidden_size / llama_config.num_attention_heads,
+      ff.config.tensor_parallelism_degree,
+      use_full_precision);
+
   InferenceManager *im = InferenceManager::get_inference_manager();
+  im->register_model_weights_loader(&ff, fileloader);
+#ifdef DEADCODE
   // Compile the model
   std::cout << "------start compile ----------" << std::endl;
   im->compile_model_and_allocate_buffer(&ff);
-  FileDataLoader fileloader("",
-                            weight_file_path,
-                            llama_config.num_attention_heads,
-                            llama_config.num_attention_heads,
-                            llama_config.hidden_size,
-                            llama_config.hidden_size /
-                                llama_config.num_attention_heads,
-                            ff.config.tensor_parallelism_degree);
-  fileloader.load_weights(&ff, use_full_precision);
+  fileloader.load_weights(&ff);
   std::cout << "------load weight finished----------" << std::endl;
 
   // init operators
   im->init_operators_inference(&ff);
+#endif
 }
 
 }; // namespace FlexFlow
diff --git a/inference/models/llama.h b/inference/models/llama.h
index 8ecfcd7155..ba1f0236f9 100644
--- a/inference/models/llama.h
+++ b/inference/models/llama.h
@@ -14,7 +14,7 @@
  */
 #pragma once
 
-#include "file_loader.h"
+// #include "file_loader.h"
 #include "flexflow/batch_config.h"
 #include "flexflow/inference.h"
 #include "flexflow/request_manager.h"
diff --git a/inference/models/mpt.cc b/inference/models/mpt.cc
index 3df67b264c..7e8fc8358f 100644
--- a/inference/models/mpt.cc
+++ b/inference/models/mpt.cc
@@ -40,10 +40,11 @@ void MPT::create_mpt_model(FFModel &ff,
   //------------------------------ build the model --------------------------
   Tensor input;
   {
-    int const token_dims[] = {mode == TREE_VERIFY_MODE
-                                  ? BatchConfig::max_verify_tokens_per_batch()
-                                  : BatchConfig::max_tokens_per_batch(),
-                              1};
+    int const token_dims[] = {
+        (mode == TREE_VERIFY_MODE || mode == BEAM_SEARCH_MODE)
+            ? BatchConfig::max_verify_tokens_per_batch()
+            : BatchConfig::max_tokens_per_batch(),
+        1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
 
@@ -246,7 +247,20 @@ void MPT::create_mpt_model(FFModel &ff,
   } else {
     output = ff.argmax(lm_head, /*beam_Search*/ false);
   }
+  FileDataLoader *fileloader =
+      new FileDataLoader("",
+                         weight_file_path,
+                         mpt_config.n_heads,
+                         mpt_config.n_heads,
+                         mpt_config.hidden_size,
+                         mpt_config.hidden_size / mpt_config.n_heads,
+                         ff.config.tensor_parallelism_degree,
+                         use_full_precision);
 
+  InferenceManager *im = InferenceManager::get_inference_manager();
+  im->register_model_weights_loader(&ff, fileloader);
+
+#ifdef DEADCODE
   //------------------- compile the model --------------------------------
   InferenceManager *im = InferenceManager::get_inference_manager();
   im->compile_model_and_allocate_buffer(&ff);
@@ -259,6 +273,7 @@ void MPT::create_mpt_model(FFModel &ff,
                             ff.config.tensor_parallelism_degree);
   fileloader.load_weights(&ff, use_full_precision);
   im->init_operators_inference(&ff);
+#endif
 }
 
 }; // namespace FlexFlow
diff --git a/inference/models/mpt.h b/inference/models/mpt.h
index 1969cd9c89..08597e1d75 100644
--- a/inference/models/mpt.h
+++ b/inference/models/mpt.h
@@ -14,7 +14,7 @@
  */
 #pragma once
 
-#include "file_loader.h"
+// #include "file_loader.h"
 #include "flexflow/batch_config.h"
 #include "flexflow/inference.h"
 #include "flexflow/request_manager.h"
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index e260f8fa36..3ff4c96fdf 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -42,10 +42,11 @@ void OPT::create_opt_model(FFModel &ff,
   Tensor position_input;
   ff.set_position_offset(2);
   {
-    int const token_dims[] = {mode == TREE_VERIFY_MODE
-                                  ? BatchConfig::max_verify_tokens_per_batch()
-                                  : BatchConfig::max_tokens_per_batch(),
-                              1};
+    int const token_dims[] = {
+        (mode == TREE_VERIFY_MODE || mode == BEAM_SEARCH_MODE)
+            ? BatchConfig::max_verify_tokens_per_batch()
+            : BatchConfig::max_tokens_per_batch(),
+        1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
     position_input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
@@ -254,6 +255,19 @@ void OPT::create_opt_model(FFModel &ff,
     output = ff.argmax(lm_head, /*beam_Search*/ false);
   }
 
+  FileDataLoader *fileloader = new FileDataLoader(
+      "",
+      weight_file_path,
+      opt_config.num_attention_heads,
+      opt_config.num_attention_heads,
+      opt_config.hidden_size,
+      opt_config.hidden_size / opt_config.num_attention_heads,
+      ff.config.tensor_parallelism_degree,
+      use_full_precision);
+  InferenceManager *im = InferenceManager::get_inference_manager();
+  im->register_model_weights_loader(&ff, fileloader);
+
+#ifdef DEADCODE
   //------------------- compile the model --------------------------------
   std::cout << "------start compile ----------" << std::endl;
   InferenceManager *im = InferenceManager::get_inference_manager();
@@ -269,6 +283,7 @@ void OPT::create_opt_model(FFModel &ff,
   fileloader.load_weights(&ff, use_full_precision);
   std::cout << "------finished loading weights----------" << std::endl;
   im->init_operators_inference(&ff);
+#endif
 }
 
 }; // namespace FlexFlow
diff --git a/inference/models/opt.h b/inference/models/opt.h
index 1ffe096bca..7c736a26d1 100644
--- a/inference/models/opt.h
+++ b/inference/models/opt.h
@@ -14,7 +14,7 @@
  */
 #pragma once
 
-#include "file_loader.h"
+// #include "file_loader.h"
 #include "flexflow/batch_config.h"
 #include "flexflow/inference.h"
 #include "flexflow/request_manager.h"
diff --git a/inference/models/starcoder.cc b/inference/models/starcoder.cc
index e683376e47..2327c86119 100644
--- a/inference/models/starcoder.cc
+++ b/inference/models/starcoder.cc
@@ -48,10 +48,11 @@ void STARCODER::create_starcoder_model(
   ff.set_position_offset(0);
   {
     // assert(startcoder_config.max_num_tokens <= BatchConfig::MAX_NUM_TOKENS);
-    int const token_dims[] = {mode == TREE_VERIFY_MODE
-                                  ? BatchConfig::max_verify_tokens_per_batch()
-                                  : BatchConfig::max_tokens_per_batch(),
-                              1};
+    int const token_dims[] = {
+        (mode == TREE_VERIFY_MODE || mode == BEAM_SEARCH_MODE)
+            ? BatchConfig::max_verify_tokens_per_batch()
+            : BatchConfig::max_tokens_per_batch(),
+        1};
     input = ff.create_tensor<2>(token_dims, DT_INT32);
     position_input = ff.create_tensor<2>(token_dims, DT_INT32);
   }
@@ -221,22 +222,26 @@ void STARCODER::create_starcoder_model(
   }
 
   InferenceManager *im = InferenceManager::get_inference_manager();
+  FileDataLoader *fileloader = new FileDataLoader(
+      "",
+      weight_file_path,
+      startcoder_config.num_attention_heads,
+      1,
+      startcoder_config.hidden_size,
+      startcoder_config.hidden_size / startcoder_config.num_attention_heads,
+      ff.config.tensor_parallelism_degree,
+      use_full_precision);
+  im->register_model_weights_loader(&ff, fileloader);
+#ifdef DEADCODE
   // Compile the model
   std::cout << "------start compile ----------" << std::endl;
   im->compile_model_and_allocate_buffer(&ff);
-  FileDataLoader fileloader("",
-                            weight_file_path,
-                            startcoder_config.num_attention_heads,
-                            1,
-                            startcoder_config.hidden_size,
-                            startcoder_config.hidden_size /
-                                startcoder_config.num_attention_heads,
-                            ff.config.tensor_parallelism_degree);
   fileloader.load_weights(&ff, use_full_precision);
   std::cout << "------load weight finished----------" << std::endl;
 
   // init operators
   im->init_operators_inference(&ff);
+#endif
 }
 
 }; // namespace FlexFlow
diff --git a/inference/models/starcoder.h b/inference/models/starcoder.h
index bc113e4d52..0e9577d569 100644
--- a/inference/models/starcoder.h
+++ b/inference/models/starcoder.h
@@ -14,7 +14,7 @@
  */
 #pragma once
 
-#include "file_loader.h"
+// #include "file_loader.h"
 #include "flexflow/batch_config.h"
 #include "flexflow/inference.h"
 #include "flexflow/request_manager.h"
diff --git a/inference/python/incr_decoding.py b/inference/python/incr_decoding.py
index 4a146ab503..6706cf3c29 100644
--- a/inference/python/incr_decoding.py
+++ b/inference/python/incr_decoding.py
@@ -102,13 +102,16 @@ def main():
         max_seq_length=256,
         max_tokens_per_batch=64,
     )
-
-    # Generation begins!
+    
+    llm.start_server()
+    
     if len(configs.prompt) > 0:
         prompts = [s for s in json.load(open(configs.prompt))]
         results = llm.generate(prompts)
     else:
         result = llm.generate("Three tips for staying healthy are: ")
+        
+    llm.stop_server()
 
 
 if __name__ == "__main__":
diff --git a/inference/python/spec_infer.py b/inference/python/spec_infer.py
index c9fb5cc7bb..8b9a116dc5 100644
--- a/inference/python/spec_infer.py
+++ b/inference/python/spec_infer.py
@@ -73,17 +73,9 @@ def get_configs():
                     "cache_path": "",
                     "refresh_cache": False,
                     "full_precision": False,
-                },
-                {
-                    # required ssm parameter
-                    "ssm_model": "facebook/opt-125m",
-                    # optional ssm parameters
-                    "cache_path": "",
-                    "refresh_cache": False,
-                    "full_precision": False,
-                },
+                }
             ],
-            "prompt": "../prompt/test.json",
+            "prompt": "",
             "output_file": "",
         }
         # Merge dictionaries
@@ -148,14 +140,16 @@ def main():
         max_tokens_per_batch=64,
         ssms=ssms,
     )
+    
+    llm.start_server()
 
-    # Generation begins!
     if len(configs.prompt) > 0:
         prompts = [s for s in json.load(open(configs.prompt))]
         results = llm.generate(prompts)
     else:
         result = llm.generate("Three tips for staying healthy are: ")
-
+        
+    llm.stop_server()
 
 if __name__ == "__main__":
     print("flexflow inference example (speculative inference)")
diff --git a/inference/spec_infer/CMakeLists.txt b/inference/spec_infer/CMakeLists.txt
index c877a3530b..1b25de8623 100644
--- a/inference/spec_infer/CMakeLists.txt
+++ b/inference/spec_infer/CMakeLists.txt
@@ -7,7 +7,6 @@ set(project_target spec_infer)
 set(CPU_SRC
   ${FLEXFLOW_CPP_DRV_SRC}
   spec_infer.cc
-  ../file_loader.cc
   ../models/llama.cc
   ../models/opt.cc
   ../models/falcon.cc
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index b369a13c1d..7578721dd0 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -22,6 +22,7 @@
 #include <nlohmann/json.hpp>
 #include <wordexp.h>
 
+using namespace FlexFlow;
 using namespace Legion;
 using json = nlohmann::json;
 
@@ -385,6 +386,8 @@ void FlexFlow::top_level_task(Task const *task,
     rm->register_ssm_model(&beam_model);
   }
 
+  rm->start_background_server(&tree_model);
+
   // Register requests from prompt file
   int total_num_requests = 0;
   {
@@ -407,6 +410,9 @@ void FlexFlow::top_level_task(Task const *task,
     tree_model.generate(prompts, 128 /*max_sequence_length*/);
   }
 
+  // terminate the request manager by stopping the background thread
+  rm->terminate_background_server();
+
   // Execution fence
   {
     Future future = runtime->issue_execution_fence(ctx);
diff --git a/python/flexflow/core/flexflow_cffi.py b/python/flexflow/core/flexflow_cffi.py
index 00133dacb4..d6f84833be 100644
--- a/python/flexflow/core/flexflow_cffi.py
+++ b/python/flexflow/core/flexflow_cffi.py
@@ -3812,26 +3812,28 @@ def get_output_tensor(self, ffmodel, data_type):
         assert ret_val == True
         return np_array
 
-    def generate(self, prompt, max_sequence_length):
-        c_input_text = get_c_name(prompt)
-        max_num_chars = 36000
-        c_output_text = ffi.new("char[]", max_num_chars)
-        c_output_length_and_tokens = ffi.new("int[]", max_sequence_length + 100)
+    def generate(self, prompt_list, max_sequence_length):
+        assert isinstance(prompt_list, list)
+        c_input_texts = [get_c_name(prompt) for prompt in prompt_list]
+        max_num_chars = 5 * (max_sequence_length + 100)
+        c_output_texts = [ffi.new("char[]", max_num_chars) for prompt in prompt_list]
+        c_output_length_and_tokens = [ffi.new("int[]", max_sequence_length + 100) for prompt in prompt_list]
         ffc().flexflow_model_generate(
             self.handle,
-            c_input_text,
+            len(prompt_list),
+            c_input_texts,
             max_num_chars,
-            c_output_text,
+            c_output_texts,
             max_sequence_length,
             c_output_length_and_tokens,
         )
-        output_length = c_output_length_and_tokens[0]
-        output_tokens = []
-        for i in range(output_length):
-            output_tokens.append(c_output_length_and_tokens[i + 1])
+        #output_length = c_output_length_and_tokens[0]
+        #output_tokens = []
+        #for i in range(output_length):
+        #    output_tokens.append(c_output_length_and_tokens[i + 1])
         from flexflow.serve import GenerationResult
 
-        return GenerationResult(ffi.string(c_output_text), output_tokens)
+        return [GenerationResult(ffi.string(c_output_text), []) for c_output_text in c_output_texts]
 
     def set_position_offset(self, offset):
         ffc().flexflow_model_set_position_offset(self.handle, offset)
@@ -4202,6 +4204,14 @@ def set_max_sequence_length(self, max_length):
         return ffc().flexflow_request_manager_set_max_sequence_length(
             self.handle, max_length)
 
+    def start_server(self, model):
+        return ffc().flexflow_request_manager_start_background_server(
+            self.handle, model.handle
+        )
+
+    def stop_server(self):
+        return ffc().flexflow_request_manager_terminate_background_server(
+            self.handle)
 # -----------------------------------------------------------------------
 # InferenceManager
 # -----------------------------------------------------------------------
@@ -4224,6 +4234,10 @@ def init_operators_inference(self, model):
             self.handle, model.handle
         )
 
+    def register_model_weights_loader(self, model, fileloader):
+        ffc().flexflow_inference_manager_register_model_weights_loader(
+            self.handle, model.handle, fileloader.handle
+        )
 
 # -----------------------------------------------------------------------
 # FileDataLoader
@@ -4241,6 +4255,7 @@ def __init__(
         hidden_dim,
         qkv_inner_dim,
         tensor_parallelism_degree,
+        use_full_precision
     ):
         c_weight_file_path = get_c_name(weight_file_path)
         self.handle = ffc().flexflow_file_data_loader_create(
@@ -4250,13 +4265,14 @@ def __init__(
             hidden_dim,
             qkv_inner_dim,
             tensor_parallelism_degree,
+            use_full_precision
         )
         self._handle = ffi.gc(self.handle, ffc().flexflow_file_data_loader_destroy)
 
-    def load_weights(self, model, data_type):
+    def load_weights(self, model):
         # Check data type and create use_full_precision boolean
-        assert data_type == DataType.DT_FLOAT or data_type == DataType.DT_HALF
-        use_full_precision = data_type == DataType.DT_FLOAT
+        #assert data_type == DataType.DT_FLOAT or data_type == DataType.DT_HALF
+        #use_full_precision = data_type == DataType.DT_FLOAT
         ffc().flexflow_file_data_loader_load_weights(
-            self.handle, model.handle, use_full_precision
+            self.handle, model.handle
         )
diff --git a/python/flexflow/serve/models/falcon.py b/python/flexflow/serve/models/falcon.py
index 2b114f09b3..e9cd789bcc 100644
--- a/python/flexflow/serve/models/falcon.py
+++ b/python/flexflow/serve/models/falcon.py
@@ -23,6 +23,7 @@ def __init__(self, hf_config):
         #self.max_num_tokens = 64
         self.max_beam_width = 1
         self.max_beam_depth = 8
+        self.max_spec_tree_token_num = 64
         self.bias = hf_config.bias
         self.hidden_size = hf_config.hidden_size
         self.layer_norm_epsilon = hf_config.layer_norm_epsilon
@@ -70,6 +71,7 @@ def __init__(
         self.weights_filepath = weights_filepath
         self.tokenizer_filepath = tokenizer_filepath
         self.maxint = 2**31 - 1
+        max_verify_tokens_per_batch = max_tokens_per_batch + self.falcon_config.max_spec_tree_token_num
 
         # Sanity checks
         if self.falcon_config.hidden_size % self.falcon_config.n_head != 0:
@@ -84,7 +86,7 @@ def __init__(
                 f"Number of q attention heads ({self.falcon_config.n_head}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
             )
 
-        self.build_model(max_tokens_per_batch)
+        self.build_model(max_tokens_per_batch if self.mode == InferenceMode.INC_DECODING_MODE else max_verify_tokens_per_batch)
 
     def build_model(self, max_tokens_per_batch):
         ffmodel = FFModel(self.ffconfig)
diff --git a/python/flexflow/serve/models/llama.py b/python/flexflow/serve/models/llama.py
index 7ba0e78a37..900ab48bcd 100644
--- a/python/flexflow/serve/models/llama.py
+++ b/python/flexflow/serve/models/llama.py
@@ -23,6 +23,7 @@ def __init__(self, hf_config):
         #self.max_num_tokens = 64
         self.max_beam_width = 1
         self.max_beam_depth = 8
+        self.max_spec_tree_token_num = 64
         self.num_hidden_layers = hf_config.num_hidden_layers
         self.vocab_size = hf_config.vocab_size
         self.hidden_size = hf_config.hidden_size
@@ -62,6 +63,8 @@ def __init__(
         self.weights_filepath = weights_filepath
         self.tokenizer_filepath = tokenizer_filepath
         self.maxint = 2**31 - 1
+        max_verify_tokens_per_batch = max_tokens_per_batch + self.llama_config.max_spec_tree_token_num
+    
 
         # Sanity checks
         if self.llama_config.hidden_size % self.llama_config.num_attention_heads != 0:
@@ -81,7 +84,7 @@ def __init__(
                 f"Number of attention heads ({self.llama_config.num_attention_heads}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
             )
 
-        self.build_model(max_tokens_per_batch)
+        self.build_model(max_tokens_per_batch if self.mode == InferenceMode.INC_DECODING_MODE else max_verify_tokens_per_batch)
 
     def build_model(self, max_tokens_per_batch):
         ffmodel = FFModel(self.ffconfig)
diff --git a/python/flexflow/serve/models/mpt.py b/python/flexflow/serve/models/mpt.py
index 79a5bb940f..c0f995bf22 100644
--- a/python/flexflow/serve/models/mpt.py
+++ b/python/flexflow/serve/models/mpt.py
@@ -23,6 +23,7 @@ def __init__(self, hf_config):
         #self.max_num_tokens = 64
         self.max_beam_width = 1
         self.max_beam_depth = 8
+        self.max_spec_tree_token_num = 64
         self.hidden_size = hf_config.d_model
         self.n_heads = hf_config.n_heads
         self.n_layers = hf_config.n_layers
@@ -57,6 +58,8 @@ def __init__(
         self.weights_filepath = weights_filepath
         self.tokenizer_filepath = tokenizer_filepath
         self.maxint = 2**31 - 1
+        max_verify_tokens_per_batch = max_tokens_per_batch + self.mpt_config.max_spec_tree_token_num
+
 
         # Sanity checks
         if self.mpt_config.hidden_size % self.mpt_config.n_heads != 0:
@@ -72,7 +75,7 @@ def __init__(
             raise ValueError(
                 f"Number of attention heads ({self.mpt_config.n_heads}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
             )
-        self.build_model(max_tokens_per_batch)
+        self.build_model(max_tokens_per_batch if self.mode == InferenceMode.INC_DECODING_MODE else max_verify_tokens_per_batch)
 
     def build_model(self, max_tokens_per_batch):
         ffmodel = FFModel(self.ffconfig)
diff --git a/python/flexflow/serve/models/opt.py b/python/flexflow/serve/models/opt.py
index dd36fa6592..dc3f841a5a 100644
--- a/python/flexflow/serve/models/opt.py
+++ b/python/flexflow/serve/models/opt.py
@@ -23,6 +23,7 @@ def __init__(self, hf_config):
         #self.max_num_tokens = 64
         self.max_beam_width = 1
         self.max_beam_depth = 8
+        self.max_spec_tree_token_num = 64
         self.do_layer_norm_before = hf_config.do_layer_norm_before
         self.dropout = hf_config.dropout
         self.enable_bias = hf_config.enable_bias
@@ -63,6 +64,7 @@ def __init__(
         self.weights_filepath = weights_filepath
         self.tokenizer_filepath = tokenizer_filepath
         self.maxint = 2**31 - 1
+        max_verify_tokens_per_batch = max_tokens_per_batch + self.opt_config.max_spec_tree_token_num
 
         # Sanity checks
         if self.opt_config.hidden_size % self.opt_config.num_attention_heads != 0:
@@ -82,7 +84,7 @@ def __init__(
                 f"Number of attention heads ({self.opt_config.num_attention_heads}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
             )
 
-        self.build_model(max_tokens_per_batch)
+        self.build_model(max_tokens_per_batch if self.mode == InferenceMode.INC_DECODING_MODE else max_verify_tokens_per_batch)
 
     def build_model(self, max_tokens_per_batch):
         ffmodel = FFModel(self.ffconfig)
diff --git a/python/flexflow/serve/models/starcoder.py b/python/flexflow/serve/models/starcoder.py
index f4f28a70e1..4a6f191abd 100644
--- a/python/flexflow/serve/models/starcoder.py
+++ b/python/flexflow/serve/models/starcoder.py
@@ -23,6 +23,7 @@ def __init__(self, hf_config):
         #self.max_num_tokens = 64
         self.max_beam_width = 1
         self.max_beam_depth = 8
+        self.max_spec_tree_token_num = 64
         self.dropout_p = hf_config.attn_pdrop
         self.hidden_size = hf_config.n_embd
         self.layer_norm_epsilon = hf_config.layer_norm_epsilon
@@ -61,6 +62,8 @@ def __init__(
         self.weights_filepath = weights_filepath
         self.tokenizer_filepath = tokenizer_filepath
         self.maxint = 2**31 - 1
+        max_verify_tokens_per_batch = max_tokens_per_batch + self.starcoder_config.max_spec_tree_token_num
+
 
         # Sanity checks
         if (
@@ -84,7 +87,7 @@ def __init__(
                 f"Number of attention heads ({self.starcoder_config.num_attention_heads}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
             )
 
-        self.build_model(max_tokens_per_batch)
+        self.build_model(max_tokens_per_batch if self.mode == InferenceMode.INC_DECODING_MODE else max_verify_tokens_per_batch)
 
     def build_model(self, max_tokens_per_batch):
         ffmodel = FFModel(self.ffconfig)
diff --git a/python/flexflow/serve/serve.py b/python/flexflow/serve/serve.py
index 55601f957e..d1a935e5fc 100644
--- a/python/flexflow/serve/serve.py
+++ b/python/flexflow/serve/serve.py
@@ -118,6 +118,11 @@ def __init__(
         self.refresh_cache = refresh_cache
         self.output_file = output_file
 
+    def __del__(self):
+        # Stop the background server before deleting the object
+        if type(self) == LLM:
+            self.rm.stop_server()
+
     def __get_ff_model_type(self):
         architectures = getattr(self.hf_config, "architectures", [])
         ff_arch = None
@@ -283,25 +288,6 @@ def download_hf_tokenizer_if_needed(self):
         else:
             print(f"Loading '{self.model_name}' tokenizer from the cache...")
 
-    def __load_hf_weights(self):
-        print("Loading hf weights...")
-
-        self.download_hf_weights_if_needed()
-
-        # Create file data loader, load weights into tensors
-        model_configs = self.config_class(self.hf_config)
-
-        self.fileloader = FileDataLoader(
-            self.weights_path,
-            model_configs.num_attention_heads,
-            model_configs.num_key_value_heads,
-            model_configs.hidden_size,
-            model_configs.hidden_size // model_configs.num_attention_heads,
-            self.ffconfig.tensor_parallelism_degree,
-        )
-
-        self.fileloader.load_weights(self.model.ffmodel, self.data_type)
-
     def compile(
         self,
         generation_config: GenerationConfig = GenerationConfig(),
@@ -379,12 +365,27 @@ def compile(
             max_tokens_per_batch
         )
 
-        # Create inference manager
+        # Download the weights from huggingface (if needed)
+        self.download_hf_weights_if_needed()
+
+        # Create file data loader, load weights into tensors
+        model_configs = self.config_class(self.hf_config)
+
+        self.fileloader = FileDataLoader(
+            self.weights_path,
+            model_configs.num_attention_heads,
+            model_configs.num_key_value_heads,
+            model_configs.hidden_size,
+            model_configs.hidden_size // model_configs.num_attention_heads,
+            self.ffconfig.tensor_parallelism_degree,
+            self.data_type == DataType.DT_FLOAT
+        )
+
+        # Register weights file loader
         self.im = InferenceManager()
-        self.im.compile_model_and_allocate_buffer(self.model.ffmodel)
+        self.im.register_model_weights_loader(self.model.ffmodel, self.fileloader)
 
-        # Download the weights and tokenizer from huggingface (if needed) and load them
-        self.__load_hf_weights()
+        # Download the tokenizer from huggingface (if needed) and load them
         self.download_hf_tokenizer_if_needed()
 
         # Create tokenizer (this must be done after we have downloaded the tokenizer
@@ -399,11 +400,14 @@ def compile(
         )
         self.rm.register_output_filepath(self.output_file)
 
-        self.im.init_operators_inference(self.model.ffmodel)
-
         for ssm in self.ssms:
             self.rm.register_ssm_model(ssm.model.ffmodel)
 
+        # start background server
+        if (mode == InferenceMode.TREE_VERIFY_MODE) or (mode == InferenceMode.INC_DECODING_MODE):
+            import atexit
+            atexit.register(self.rm.stop_server)
+
     def generate(self, prompts: Union[str, List[str]], max_length: int = 128):
         """Generate tokens based on the input prompt(s)
 
@@ -415,16 +419,32 @@ def generate(self, prompts: Union[str, List[str]], max_length: int = 128):
         if type(prompts) == str:
             if len(prompts) == 0:
                 return None
-            return self.model.ffmodel.generate(prompts, max_length)
+            return self.model.ffmodel.generate([prompts], max_length)
         elif type(prompts) == list:
             if len(prompts) == 0:
                 return []
-            return [
-                self.model.ffmodel.generate(prompt, max_length) for prompt in prompts
-            ]
+            return self.model.ffmodel.generate(prompts, max_length)
         else:
             assert False, "Please pass a non-empty string or list of strings"
-
+    
+    def start_server(self):
+        self.rm.start_server(self.model.ffmodel)
+        print("Background server started.")
+        
+    def stop_server(self):
+        self.rm.stop_server()
+        print("Background server stoped.")
+        
+    def __enter__(self):
+        # Start the server when entering the context
+        #self.rm.start_server(self.model.ffmodel)
+        return self
+
+    def __exit__(self, exc_type, exc_value, traceback):
+        # Stop the server when exiting the context
+        #self.rm.stop_server()
+        if exc_type:
+            print(f"Exception occurred: {exc_value}")
 
 class SSM(LLM):
     """This class creates a SSM (Small-Speculative Model) object based on a model from HuggingFace"""
@@ -461,9 +481,9 @@ def __init__(
     def compile(
         self,
         generation_config: GenerationConfig = GenerationConfig(),
-        max_requests_per_batch: int = 1,
+        max_requests_per_batch: int = 16,
         max_seq_length: int = 256,
-        max_tokens_per_batch: int = 64,
+        max_tokens_per_batch: int = 128,
         model_specific_data_parallelism_degree: int = 1,
         model_specific_tensor_parallelism_degree: int = 1,
         model_specific_pipeline_parallelism_degree: int = 1,
@@ -475,11 +495,11 @@ def compile(
         :type mode: InferenceMode, optional
         :param generation_config: The GenerationConfig object with the configurations to use for sampling, defaults to GenerationConfig()
         :type generation_config: GenerationConfig, optional
-        :param max_requests_per_batch: The maximum batch size to allow, defaults to 1
+        :param max_requests_per_batch: The maximum batch size to allow, defaults to 16
         :type max_requests_per_batch: int, optional
         :param max_seq_length: The maximum sequence length to allow per batch, defaults to 256
         :type max_seq_length: int, optional
-        :param max_tokens_per_batch: The maximum number of tokens (across requests) to allow per batch, defaults to 64
+        :param max_tokens_per_batch: The maximum number of tokens (across requests) to allow per batch, defaults to 128
         :type max_tokens_per_batch: int, optional
         :param model_specific_data_parallelism_degree: Use this parameter if you want to give the SSM a different data parallelism degree than the default one, defaults to 1
         :type model_specific_data_parallelism_degree: int, optional
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index 82a37a9736..9ad58695ad 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -17,7 +17,7 @@
 #include "flexflow/dataloader.h"
 #include "flexflow/mapper.h"
 #include "flexflow/request_manager.h"
-#include "inference/file_loader.h"
+#include "flexflow/utils/file_loader.h"
 
 using namespace Legion;
 using namespace FlexFlow;
@@ -1582,32 +1582,41 @@ void flexflow_model_set_transformer_layer_id(flexflow_model_t handle_, int id) {
   handle->set_transformer_layer_id(id);
 }
 
-flexflow_generation_result_t
-    flexflow_model_generate(flexflow_model_t handle_,
-                            char const *input_text,
-                            int max_num_chars,
-                            char *output_text,
-                            int max_seq_length,
-                            int *output_length_and_tokens) {
+void flexflow_model_generate(flexflow_model_t handle_,
+                             int num_requests,
+                             char const **input_texts,
+                             int max_num_chars,
+                             char **output_texts,
+                             int max_seq_length,
+                             int **output_length_and_tokens) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
   std::vector<std::string> prompts;
-  std::string const text_str(input_text);
-  prompts.push_back(input_text);
-  GenerationResult result = handle->generate(prompts, max_seq_length);
-  DEBUG_PRINT(
-      "[Model] generate %p %s %i", handle, text_str.c_str(), max_seq_length);
+  for (int i = 0; i < num_requests; i++) {
+    std::string const text_str(input_texts[i]);
+    prompts.push_back(text_str);
+    DEBUG_PRINT("[Model] generate[%d] %p %s %i",
+                i,
+                handle,
+                text_str.c_str(),
+                max_seq_length);
+  }
+  std::vector<GenerationResult> results =
+      handle->generate(prompts, max_seq_length);
   // If the prompt exceeds max seq len, check that we return the prompt with no
   // additional token. Otherwise, check that the output does not exceed the max
   // sequence length.
-  assert(result.output_tokens.size() <= max_seq_length ||
-         result.output_tokens.size() == result.input_tokens.size());
-  output_length_and_tokens[0] = result.output_tokens.size();
-  std::copy(result.output_tokens.begin(),
-            result.output_tokens.end(),
-            output_length_and_tokens + 1);
-  std::memcpy(
-      output_text, result.output_text.c_str(), result.output_text.length());
-  return FFCObjectWrapper::wrap(&result);
+  for (int i = 0; i < num_requests; i++) {
+    assert(results[i].output_tokens.size() <= max_seq_length ||
+           results[i].output_tokens.size() == results[i].input_tokens.size());
+    output_length_and_tokens[i][0] = results[i].output_tokens.size();
+    std::copy(results[i].output_tokens.begin(),
+              results[i].output_tokens.end(),
+              output_length_and_tokens[i] + 1);
+    std::memcpy(output_texts[i],
+                results[i].output_text.c_str(),
+                results[i].output_text.length());
+  }
+  // return FFCObjectWrapper::wrap(&results[0]);
 }
 
 void flexflow_model_set_position_offset(flexflow_model_t handle_,
@@ -2616,6 +2625,22 @@ int flexflow_request_manager_register_ssm_model(
   return handle->register_ssm_model(model_handle);
 }
 
+void flexflow_request_manager_start_background_server(
+    flexflow_request_manager_t handle_, flexflow_model_t model_handle_) {
+  RequestManager *handle = FFCObjectWrapper::unwrap(handle_);
+  FFModel *model_handle = FFCObjectWrapper::unwrap(model_handle_);
+  DEBUG_PRINT(
+      "[RequestManager] start background server %p %p", handle, model_handle);
+  handle->start_background_server(model_handle);
+}
+
+void flexflow_request_manager_terminate_background_server(
+    flexflow_request_manager_t handle_) {
+  RequestManager *handle = FFCObjectWrapper::unwrap(handle_);
+  DEBUG_PRINT("[RequestManager] terminate background server %p", handle);
+  handle->terminate_background_server();
+}
+
 // -----------------------------------------------------------------------
 // InferenceManager
 // -----------------------------------------------------------------------
@@ -2644,6 +2669,20 @@ void flexflow_inference_manager_init_operators_inference(
   handle->init_operators_inference(model);
 }
 
+void flexflow_inference_manager_register_model_weights_loader(
+    flexflow_inference_manager_t handle_,
+    flexflow_model_t model_handle,
+    flexflow_file_data_loader_t loader_handle) {
+  InferenceManager *handle = FFCObjectWrapper::unwrap(handle_);
+  FFModel *model = FFCObjectWrapper::unwrap(model_handle);
+  FileDataLoader *loader = FFCObjectWrapper::unwrap(loader_handle);
+  DEBUG_PRINT("[InferenceManager] register_model_weights_loader %p %p %p",
+              handle,
+              model,
+              loader);
+  handle->register_model_weights_loader(model, loader);
+}
+
 // -----------------------------------------------------------------------
 // FileDataLoader
 // -----------------------------------------------------------------------
@@ -2654,7 +2693,8 @@ flexflow_file_data_loader_t
                                      int num_kv_heads,
                                      int hidden_dim,
                                      int qkv_inner_dim,
-                                     int tensor_parallelism_degree) {
+                                     int tensor_parallelism_degree,
+                                     bool use_full_precision) {
   assert(weight_file_path != nullptr &&
          "Cannot convert nullptr char * to std::string");
   std::string const weight_file_path_str(weight_file_path);
@@ -2664,7 +2704,8 @@ flexflow_file_data_loader_t
                                               num_kv_heads,
                                               hidden_dim,
                                               qkv_inner_dim,
-                                              tensor_parallelism_degree);
+                                              tensor_parallelism_degree,
+                                              use_full_precision);
   DEBUG_PRINT("[FileDataLoader] new %p", handle);
   return FFCObjectWrapper::wrap(handle);
 }
@@ -2676,9 +2717,8 @@ void flexflow_file_data_loader_destroy(flexflow_file_data_loader_t handle_) {
 }
 
 void flexflow_file_data_loader_load_weights(flexflow_file_data_loader_t handle_,
-                                            flexflow_model_t model_handle_,
-                                            bool use_full_precision) {
+                                            flexflow_model_t model_handle_) {
   FileDataLoader *handle = FFCObjectWrapper::unwrap(handle_);
   FFModel *model = FFCObjectWrapper::unwrap(model_handle_);
-  handle->load_weights(model, use_full_precision);
+  handle->load_weights(model);
 }
diff --git a/src/mapper/mapper.cc b/src/mapper/mapper.cc
index a2fb1d89be..bc26a79d3e 100644
--- a/src/mapper/mapper.cc
+++ b/src/mapper/mapper.cc
@@ -286,7 +286,8 @@ void FFMapper::select_task_options(const MapperContext ctx,
   if ((task.task_id == RM_PREPARE_NEXT_BATCH_TASK_ID) ||
       (task.task_id == RM_PREPARE_NEXT_BATCH_INIT_TASK_ID) ||
       (task.task_id == RM_PREPARE_NEXT_BATCH_BEAM_TASK_ID) ||
-      (task.task_id == RM_PREPARE_NEXT_BATCH_VERIFY_TASK_ID)) {
+      (task.task_id == RM_PREPARE_NEXT_BATCH_VERIFY_TASK_ID) ||
+      (task.task_id == RM_BACKGROUND_SERVING_TASK_ID)) {
     output.initial_proc = all_cpus[0];
     return;
   }
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index 63b26bfe7d..6ca6038778 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -467,12 +467,12 @@ OpMeta *Linear::init_task_with_dim(Task const *task,
                                        ctx,
                                        runtime,
                                        false /*readOutput*/);
-  TensorAccessorW<WT, NDIM> acc_kernel(regions[2],
-                                       task->regions[2],
-                                       FID_DATA,
-                                       ctx,
-                                       runtime,
-                                       false /*readOutput*/);
+  // TensorAccessorW<WT, NDIM> acc_kernel(regions[2],
+  //                                      task->regions[2],
+  //                                      FID_DATA,
+  //                                      ctx,
+  //                                      runtime,
+  //                                      false /*readOutput*/);
 
   // TensorAccessorR<float, 1> acc_bias(
   //     regions[3], task->regions[3], FID_DATA, ctx, runtime);
diff --git a/inference/file_loader.cc b/src/runtime/file_loader.cc
similarity index 98%
rename from inference/file_loader.cc
rename to src/runtime/file_loader.cc
index 7c6870d439..56558b3185 100644
--- a/inference/file_loader.cc
+++ b/src/runtime/file_loader.cc
@@ -13,7 +13,7 @@
  * limitations under the License.
  */
 
-#include "file_loader.h"
+#include "flexflow/utils/file_loader.h"
 #include "flexflow/ffconst_utils.h"
 #include "flexflow/inference.h"
 
@@ -28,11 +28,13 @@ FileDataLoader::FileDataLoader(std::string _prompts_filepath,
                                int _num_kv_heads,
                                size_t _hidden_dim,
                                size_t _qkv_inner_dim,
-                               int _tensor_parallelism_degree)
+                               int _tensor_parallelism_degree,
+                               bool _use_full_precision)
     : prompts_filepath(_prompts_filepath), weights_folder(_weights_folder),
       num_heads(_num_heads), num_kv_heads(_num_kv_heads),
       hidden_dim(_hidden_dim), qkv_inner_dim(_qkv_inner_dim),
-      tensor_parallelism_degree(_tensor_parallelism_degree){};
+      tensor_parallelism_degree(_tensor_parallelism_degree),
+      use_full_precision(_use_full_precision){};
 
 BatchConfig::TokenId *FileDataLoader::generate_requests(int num, int length) {
 
@@ -650,8 +652,7 @@ void load_from_quantized_file(char *ptr,
 
 void FileDataLoader::load_quantization_weight(FFModel *ff,
                                               Layer *l,
-                                              int weight_idx,
-                                              bool use_full_precision) {
+                                              int weight_idx) {
   Tensor weight = l->weights[weight_idx];
   size_t volume = 1;
   std::vector<int> dims_vec;
@@ -789,7 +790,7 @@ void FileDataLoader::load_single_weight_tensor(FFModel *ff,
   delete data;
 }
 
-void FileDataLoader::load_weights(FFModel *ff, bool use_full_precision) {
+void FileDataLoader::load_weights(FFModel *ff) {
   for (Layer *l : ff->layers) {
     if (l->numWeights < 1 || l->name == NULL || strlen(l->name) < 1) {
       continue;
@@ -809,7 +810,7 @@ void FileDataLoader::load_weights(FFModel *ff, bool use_full_precision) {
         case DT_INT4:
         case DT_INT8:
           // load weights in quantization
-          load_quantization_weight(ff, l, i, use_full_precision);
+          load_quantization_weight(ff, l, i);
           break;
         default:
           assert(false && "Unsupported data type");
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index cc76da58bb..6588cbceeb 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -28,8 +28,8 @@ using namespace Legion;
 LegionRuntime::Logger::Category log_inf_mgr("InferenceManager");
 LegionRuntime::Logger::Category log_offload("Offloading");
 
-InferenceManager::InferenceManager(FFConfig const &_config)
-    : ff_config(_config) {
+InferenceManager::InferenceManager() {
+#ifdef DEADCODE
   num_devices = ff_config.workersPerNode * ff_config.numNodes;
   // Check parallelization degrees
   assert(ff_config.data_parallelism_degree <= num_devices &&
@@ -53,6 +53,7 @@ InferenceManager::InferenceManager(FFConfig const &_config)
              num_devices &&
          "Product of data, tensor, and pipeline parallelism degrees does not "
          "match the number of available devices");
+#endif
 }
 
 InferenceManager *inference_manager_singleton = nullptr;
@@ -60,8 +61,8 @@ InferenceManager *inference_manager_singleton = nullptr;
 /*static*/
 InferenceManager *InferenceManager::get_inference_manager() {
   if (inference_manager_singleton == nullptr) {
-    FFConfig ffconfig;
-    inference_manager_singleton = new InferenceManager(ffconfig);
+    // FFConfig ffconfig;
+    inference_manager_singleton = new InferenceManager();
   }
   return inference_manager_singleton;
 }
@@ -382,13 +383,13 @@ FutureMap InferenceManager::inference(FFModel *model,
         // input.
         assert(op->numOutputs == 1);
         ParallelTensor pt = tensor_buffer[op->outputs[0]][batch_index];
-        load_positions(bc, pt, model->position_offset);
+        load_positions(model, bc, pt, model->position_offset);
       } else {
         found_input_operator = true;
         assert(op->numOutputs == 1);
         ParallelTensor pt = tensor_buffer[op->outputs[0]][batch_index];
-        load_input_tokens_from_batch_config(bc, pt, model->handlers);
-        load_inference_metadata_batch_config(bc, model->handlers);
+        load_input_tokens_from_batch_config(model, bc, pt, model->handlers);
+        load_inference_metadata_batch_config(model, bc, model->handlers);
       }
     }
 
@@ -418,11 +419,12 @@ FutureMap InferenceManager::inference(FFModel *model,
 };
 
 void InferenceManager::load_input_tokens_from_batch_config(
+    FFModel *model,
     BatchConfigFuture const &bc,
     ParallelTensor const input,
     FFHandler *handlers) {
-  Context ctx = ff_config.lg_ctx;
-  Runtime *runtime = ff_config.lg_hlr;
+  Context ctx = model->config.lg_ctx;
+  Runtime *runtime = model->config.lg_hlr;
   size_t machine_view_hash = input->machine_view.hash();
   ArgumentMap argmap;
   Domain domain = runtime->get_index_space_domain(ctx, input->parallel_is);
@@ -462,13 +464,13 @@ void InferenceManager::load_input_tokens_from_batch_config(
 }
 
 void InferenceManager::load_inference_metadata_batch_config(
-    BatchConfigFuture const &bc, FFHandler *handlers) {
-  Context ctx = ff_config.lg_ctx;
-  Runtime *runtime = ff_config.lg_hlr;
+    FFModel *model, BatchConfigFuture const &bc, FFHandler *handlers) {
+  Context ctx = model->config.lg_ctx;
+  Runtime *runtime = model->config.lg_hlr;
   ArgumentMap argmap;
 
   Domain domain =
-      runtime->get_index_space_domain(ctx, ff_config.all_gpu_task_is);
+      runtime->get_index_space_domain(ctx, model->config.all_gpu_task_is);
   Rect<1> task_rect = domain;
 
   int idx = 0;
@@ -478,7 +480,7 @@ void InferenceManager::load_inference_metadata_batch_config(
   }
 
   IndexLauncher launcher(RM_LOAD_BATCH_CONFIG_TASK_ID,
-                         ff_config.all_gpu_task_is,
+                         model->config.all_gpu_task_is,
                          TaskArgument(nullptr, 0),
                          argmap,
                          Predicate::TRUE_PRED,
@@ -489,11 +491,12 @@ void InferenceManager::load_inference_metadata_batch_config(
   runtime->execute_index_space(ctx, launcher);
 }
 
-void InferenceManager::load_positions(BatchConfigFuture const &bc,
+void InferenceManager::load_positions(FFModel *model,
+                                      BatchConfigFuture const &bc,
                                       ParallelTensor position_input,
                                       int offset) {
-  Context ctx = ff_config.lg_ctx;
-  Runtime *runtime = ff_config.lg_hlr;
+  Context ctx = model->config.lg_ctx;
+  Runtime *runtime = model->config.lg_hlr;
   size_t machine_view_hash = position_input->machine_view.hash();
   ArgumentMap argmap;
   IndexLauncher launcher(RM_LOAD_POSITION_TASK_ID,
@@ -514,6 +517,11 @@ void InferenceManager::load_positions(BatchConfigFuture const &bc,
   runtime->execute_index_space(ctx, launcher);
 }
 
+void InferenceManager::register_model_weights_loader(FFModel *model,
+                                                     FileDataLoader *loader) {
+  model_weights_loaders[model] = loader;
+}
+
 void FFModel::set_transformer_layer_id(int id) {
   // We assume that users call this function with
   // monotonically increasing ids
@@ -529,6 +537,12 @@ void FFModel::set_position_offset(int offset) {
 }
 
 void FFModel::compile_inference() {
+  // Request at least four CPU processors for inference runs
+  assert(
+      config.cpusPerNode >= 4 &&
+      "FlexFlow Serve requires at least four CPU cores per node, please add "
+      "`-ll:cpu 4` in the command line if you are using the C++ interface or "
+      "set `num_cpus` in `ff.init` if you are using the Python interface");
   Context ctx = config.lg_ctx;
   Runtime *runtime = config.lg_hlr;
   config.computationMode = COMP_MODE_INFERENCE;
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 4270515224..c07c33efca 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -4480,6 +4480,24 @@ void register_flexflow_internal_tasks(Runtime *runtime,
           RequestManager::prepare_next_batch_verify_task>(registrar);
     }
   }
+  // RequestManager background serving task
+  {
+    TaskVariantRegistrar registrar(RM_BACKGROUND_SERVING_TASK_ID,
+                                   "RequestManager Background Serving Task");
+    registrar.add_constraint(ProcessorConstraint(Processor::LOC_PROC));
+    // registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<
+          RequestManager::background_serving_task>(
+          registrar, "RequestManager Background Serving Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<RequestManager::background_serving_task>(
+          registrar);
+    }
+  }
   // ElementUnary task
   {
     TaskVariantRegistrar registrar(ELEMENTUNARY_INIT_TASK_ID,
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 56a2c122d3..46e17d4fdc 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -18,6 +18,7 @@
 // #include "flexflow/tokenizers.h"
 #include <bitset>
 #include <filesystem>
+#include <future>
 #include <iomanip>
 #include <new>
 #include <stack>
@@ -43,7 +44,8 @@ std::string LoadBytesFromFile(std::string const &path) {
 }
 
 RequestManager::RequestManager()
-    : verbose(false), next_available_guid(1000000), num_processed_requests(0),
+    : request_manager_status(INITIALIZED), verbose(false),
+      next_available_guid(1000000), num_processed_requests(0),
       total_request_run_time(0.0f) {
   // The following config parameters are set
   // during ffmodel.compile()
@@ -53,26 +55,6 @@ RequestManager::RequestManager()
   max_requests_per_batch = -1;
   max_tokens_per_batch = -1;
   max_sequence_length = -1;
-  {
-    // Initialize futures for spec infer
-    TreeVerifyBatchConfig tree_bc;
-    InferenceResult tree_ir;
-    TreeVerifyBatchConfigFuture tree_bcf =
-        Future::from_value<TreeVerifyBatchConfig>(tree_bc);
-    InferenceResultFuture tree_irf =
-        Future::from_value<InferenceResult>(tree_ir);
-    last_tree_bcf = tree_bcf;
-    last_tree_irf = tree_irf;
-  }
-  {
-    // Initialize futures for incr decoding
-    BatchConfig bc;
-    InferenceResult ir;
-    BatchConfigFuture bcf = Future::from_value<BatchConfig>(bc);
-    InferenceResultFuture irf = Future::from_value<InferenceResult>(ir);
-    last_bcf = bcf;
-    last_irf = irf;
-  }
 }
 
 void RequestManager::set_max_requests_per_batch(int max_num_requests) {
@@ -171,19 +153,19 @@ void RequestManager::register_output_filepath(
 }
 
 int RequestManager::register_ssm_model(FFModel *model) {
-  int model_id = models.size();
-  models.push_back(model);
-  std::cout << "Register new model with id: " << model_id << std::endl;
+  int model_id = ssm_models.size();
+  ssm_models.push_back(model);
+  std::cout << "Register new ssm model with id: " << model_id << std::endl;
   return model_id;
 }
 
-FFModel *RequestManager::get_model(int model_id) {
-  assert(model_id < models.size());
-  return models[model_id];
+FFModel *RequestManager::get_ssm_model(int model_id) {
+  assert(model_id < ssm_models.size());
+  return ssm_models[model_id];
 }
 
 size_t RequestManager::get_num_ssms() {
-  return models.size();
+  return ssm_models.size();
 }
 
 RequestManager::RequestGuid
@@ -203,7 +185,7 @@ RequestManager::RequestGuid
               << prompt.size() << ".\n";
 
     printf("tokens size: %zu\n", request.tokens.size());
-    return 0;
+    return INVALID_GUID;
   } else {
     request.initial_len = prompt.size();
     request.tokens = prompt;
@@ -214,7 +196,7 @@ RequestManager::RequestGuid
                  "decoding."
               << std::endl;
   } else {
-    std::cout << "Num of models: " << get_num_ssms() << std::endl;
+    std::cout << "Num of SSMs: " << get_num_ssms() << std::endl;
     for (int i = 0; i < get_num_ssms(); i++) {
       BeamTree beam_tree = BeamTree{};
       request.beam_trees.push_back(beam_tree);
@@ -223,6 +205,10 @@ RequestManager::RequestGuid
 
   pending_request_queue.push(request);
   all_requests[request.guid] = request;
+  {
+    const std::lock_guard<std::mutex> lock(request_to_promise_mutex);
+    request_to_promise[request.guid] = new std::promise<void>();
+  }
 
   if (verbose) {
     std::cout << "new req: " << request.tokens.size() << std::endl;
@@ -261,7 +247,7 @@ RequestManager::RequestGuid
               << tokens.size() << ".\n";
 
     printf("tokens size: %zu\n", tokens.size());
-    return 0;
+    return INVALID_GUID;
   }
   for (int i = 0; i < tokens.size(); i++) {
     std::cout << "[" << i << "]" << tokens.at(i) << "\n";
@@ -274,7 +260,7 @@ RequestManager::RequestGuid
                  "decoding."
               << std::endl;
   } else {
-    std::cout << "Num of models: " << get_num_ssms() << std::endl;
+    std::cout << "Num of SSMs: " << get_num_ssms() << std::endl;
     for (int i = 0; i < get_num_ssms(); i++) {
       BeamTree beam_tree = BeamTree{};
       request.beam_trees.push_back(beam_tree);
@@ -283,6 +269,11 @@ RequestManager::RequestGuid
 
   pending_request_queue.push(request);
   all_requests[request.guid] = request;
+  {
+    const std::lock_guard<std::mutex> lock(request_to_promise_mutex);
+    request_to_promise[request.guid] = new std::promise<void>();
+  }
+
   {
     std::string output = "New request tokens:";
     output = "[" + std::to_string(request.guid) + "]" + output;
@@ -312,10 +303,22 @@ bool RequestManager::is_request_completed(RequestGuid const &guid) {
 
 GenerationResult
     RequestManager::get_generation_result(RequestGuid const &guid) {
-  const std::lock_guard<std::mutex> lock(request_queue_mutex);
-  assert(request_generation_results.find(guid) !=
-         request_generation_results.end());
-  return request_generation_results[guid];
+  // First get the future of the request
+  std::future<void> future;
+  {
+    const std::lock_guard<std::mutex> lock(request_to_promise_mutex);
+    assert(request_to_promise.find(guid) != request_to_promise.end());
+    future = request_to_promise[guid]->get_future();
+  }
+  // Wait until the result is completed
+  future.get();
+  // Get the generation result
+  {
+    const std::lock_guard<std::mutex> lock(request_queue_mutex);
+    assert(request_generation_results.find(guid) !=
+           request_generation_results.end());
+    return request_generation_results[guid];
+  }
 }
 
 size_t RequestManager::get_num_processed_requests() {
@@ -324,10 +327,9 @@ size_t RequestManager::get_num_processed_requests() {
 
 BatchConfigFuture
     RequestManager::prepare_next_batch(BatchConfigFuture const &old_bc,
-                                       InferenceResultFuture const &result) {
-  Runtime *runtime = Runtime::get_runtime();
-  Context ctx = Runtime::get_context();
-
+                                       InferenceResultFuture const &result,
+                                       Context ctx,
+                                       Runtime *runtime) {
   RequestManager *rm = this;
   TaskLauncher launcher(RM_PREPARE_NEXT_BATCH_TASK_ID,
                         TaskArgument(&rm, sizeof(RequestManager *)));
@@ -394,10 +396,6 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
         request_completed = true;
       }
       if (request_completed) {
-        request.status = Request::COMPLETED;
-        log_req_mgr.print("[Done] guid(%zu) final_length(%zu)",
-                          old_bc.requestsInfo[i].request_guid,
-                          request.tokens.size());
         std::string output = this->tokenizer_->Decode(request.tokens);
         // Unlike Huggingface, the sentencepiece C++ library automatically
         // removes the BOS token
@@ -405,14 +403,18 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
             request.tokens.at(0) == bos_token_id) {
           output = "<s> " + output;
         }
-
         {
-          // update generation result and trigger future
+          // update generation result
           GenerationResult &gr = request_generation_results[request.guid];
           assert(gr.guid == request.guid);
           gr.output_tokens = request.tokens;
           gr.output_text = output;
         }
+        request.status = Request::COMPLETED;
+        trigger_request_completion_future(request.guid);
+        log_req_mgr.print("[Done] guid(%zu) final_length(%zu)",
+                          old_bc.requestsInfo[i].request_guid,
+                          request.tokens.size());
         log_req_mgr.print("Final output: %s", output.c_str());
         num_processed_requests++;
         ProfileInfo profile_info = profiling_requests[request.guid];
@@ -545,9 +547,9 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
 BeamSearchBatchConfigFuture RequestManager::prepare_next_batch_init(
     TreeVerifyBatchConfigFuture const &old_bc,
     InferenceResultFuture const &result,
-    int model_id) {
-  Runtime *runtime = Runtime::get_runtime();
-  Context ctx = Runtime::get_context();
+    int model_id,
+    Context ctx,
+    Runtime *runtime) {
 
   RequestManager *rm = this;
   TaskLauncher launcher(RM_PREPARE_NEXT_BATCH_INIT_TASK_ID,
@@ -581,8 +583,6 @@ BeamSearchBatchConfig
     std::cout << "\n############### prepare_next_batch_init ###############\n";
   }
 
-  std::cout << "\n############### prepare_next_batch_init ###############\n";
-
   // Step 1: use result to update requests
   BeamSearchBatchConfig new_bc;
   new_bc.num_tokens = 0;
@@ -664,7 +664,6 @@ BeamSearchBatchConfig
             request.tokens.push_back(token_pair.first);
           }
         }
-        request.status = Request::COMPLETED;
         log_req_mgr.print("[Done] guid(%zu) with final length(%zu)",
                           request.guid,
                           request.tokens.size());
@@ -676,12 +675,14 @@ BeamSearchBatchConfig
           output = "<s> " + output;
         }
         {
-          // update generation result and trigger future
+          // update generation result
           GenerationResult &gr = request_generation_results[request.guid];
           assert(gr.guid == request.guid);
           gr.output_tokens = request.tokens;
           gr.output_text = output;
         }
+        request.status = Request::COMPLETED;
+        trigger_request_completion_future(request.guid);
         log_req_mgr.print("Final output: %s", output.c_str());
 
         new_bc.request_completed[i] = true;
@@ -983,9 +984,9 @@ BeamSearchBatchConfig
 /***** Beam Search Phase *****/
 BeamSearchBatchConfigFuture RequestManager::prepare_next_batch_beam(
     BeamSearchBatchConfigFuture const &old_bc,
-    BeamInferenceResultFuture const &result) {
-  Runtime *runtime = Runtime::get_runtime();
-  Context ctx = Runtime::get_context();
+    BeamInferenceResultFuture const &result,
+    Context ctx,
+    Runtime *runtime) {
 
   RequestManager *rm = this;
   TaskLauncher launcher(RM_PREPARE_NEXT_BATCH_BEAM_TASK_ID,
@@ -1298,9 +1299,9 @@ BeamSearchBatchConfig
 /***** Verify Phase *****/
 
 TreeVerifyBatchConfigFuture RequestManager::prepare_next_batch_verify(
-    std::vector<BeamSearchBatchConfigFuture> const &old_batches) {
-  Runtime *runtime = Runtime::get_runtime();
-  Context ctx = Runtime::get_context();
+    std::vector<BeamSearchBatchConfigFuture> const &old_batches,
+    Context ctx,
+    Runtime *runtime) {
 
   RequestManager *rm = this;
   TaskLauncher launcher(RM_PREPARE_NEXT_BATCH_VERIFY_TASK_ID,
@@ -1328,7 +1329,10 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
     std::vector<BeamSearchBatchConfig> const &old_batches) {
   const std::lock_guard<std::mutex> lock(request_queue_mutex);
 
-  std::cout << "\n############### prepare_next_batch_verify ###############\n";
+  if (verbose) {
+    std::cout
+        << "\n############### prepare_next_batch_verify ###############\n";
+  }
 
   assert(old_batches.size() > 0);
 
@@ -2277,39 +2281,107 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
   return merged_tree;
 }
 
-GenerationResult FFModel::generate(std::vector<std::string> &prompts,
-                                   int max_seq_length) {
+std::vector<GenerationResult>
+    FFModel::generate(std::vector<std::string> &prompts, int max_seq_length) {
+  RequestManager *rm = RequestManager::get_request_manager();
+  std::vector<RequestManager::RequestGuid> guids;
+  for (int i = 0; i < prompts.size(); i++) {
+    RequestManager::RequestGuid guid =
+        rm->register_new_request(prompts.at(i), max_seq_length);
+    if (guid != RequestManager::INVALID_GUID) {
+      guids.push_back(guid);
+    }
+  }
+  std::vector<GenerationResult> results;
+  for (int i = 0; i < guids.size(); i++) {
+    results.push_back(rm->get_generation_result(guids[i]));
+  }
+  return results;
+}
+
+void RequestManager::start_background_server(FFModel *model) {
+  assert(request_manager_status == INITIALIZED);
+  request_manager_status = SERVING;
+  // Start background task
+  Runtime *runtime = Runtime::get_runtime();
+  Context ctx = Runtime::get_context();
+  TaskLauncher launcher(RM_BACKGROUND_SERVING_TASK_ID,
+                        TaskArgument(&model, sizeof(FFModel *)));
+  background_server_handler = runtime->execute_task(ctx, launcher);
+  // Register callbacks for normal exit
+  {
+    int ret = std::atexit(RequestManager::terminate_background_server_at_exit);
+    assert(ret == 0); // make sure the callback is successfully registered
+  }
+  // Register callbacks for termination
+  {
+    std::set_terminate([]() {
+      RequestManager::terminate_background_server_at_exit();
+      std::abort();
+    });
+  }
+}
+
+void RequestManager::background_serving_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
   RequestManager *rm = RequestManager::get_request_manager();
+  FFModel *llm = *(FFModel **)task->args;
+  {
+    // Update FFModel's lg_hlr and lg_ctx to the current
+    // task's runtime and ctx, since all future legion tasks are
+    // launched in this task
+    llm->config.lg_hlr = runtime;
+    llm->config.lg_ctx = ctx;
+    // Update the lg_hlr and lg_ctx of all SSMs' FFConfig
+    // since all future legion tasks are launched in this task
+    for (size_t i = 0; i < rm->get_num_ssms(); i++) {
+      FFModel *ssm = rm->get_ssm_model(i);
+      ssm->config.lg_hlr = runtime;
+      ssm->config.lg_ctx = ctx;
+    }
+  }
   if (rm->get_num_ssms() == 0) {
     // No SSMs: perform incremental decoding
-    return rm->generate_incr_decoding(this, prompts, max_seq_length);
+    rm->serve_incr_decoding(llm);
   } else {
     // Registered SSMs: perform speculative inference
-    return rm->generate_spec_infer(this, prompts, max_seq_length);
+    rm->serve_spec_infer(llm);
   }
 }
 
 /*static*/
-GenerationResult RequestManager::generate_incr_decoding(
-    FFModel *llm, std::vector<std::string> &prompts, int max_seq_length) {
+void RequestManager::serve_incr_decoding(FFModel *llm) {
+  Context ctx = llm->config.lg_ctx;
+  Runtime *runtime = llm->config.lg_hlr;
+  // Compile the llm
   InferenceManager *im = InferenceManager::get_inference_manager();
-  RequestGuid guid;
-  for (int i = 0; i < prompts.size(); i++) {
-    guid = register_new_request(prompts.at(i), max_seq_length);
-  }
-
-  if (guid == 0) {
-    std::cout
-        << "=========== Discard request exceed prompt maximum... ==========="
-        << std::endl;
-    return GenerationResult();
+  im->compile_model_and_allocate_buffer(llm);
+  assert(im->model_weights_loaders.find(llm) !=
+         im->model_weights_loaders.end());
+  // Load model weights
+  im->model_weights_loaders[llm]->load_weights(llm);
+  // init operators
+  im->init_operators_inference(llm);
+  // Legion futures for inc_decoding and spec_infer
+  BatchConfigFuture last_bcf;
+  InferenceResultFuture last_irf;
+  {
+    // Initialize futures for incr decoding
+    BatchConfig bc;
+    InferenceResult ir;
+    last_bcf = Future::from_value<BatchConfig>(bc);
+    last_irf = Future::from_value<InferenceResult>(ir);
   }
 
-  int tokens_to_generate = max_seq_length - all_requests[guid].tokens.size();
   std::queue<std::pair<BatchConfigFuture, InferenceResultFuture>>
       batch_pipeline;
   { batch_pipeline.push(std::make_pair(last_bcf, last_irf)); }
-  while (!is_request_completed(guid)) {
+
+  while (!is_background_server_terminated()) {
+
     if (batch_pipeline.size() >= 4) {
       // Block here to avoid launching too many batches
       auto const &batch = batch_pipeline.front();
@@ -2324,15 +2396,10 @@ GenerationResult RequestManager::generate_incr_decoding(
         break;
       }
     }
-    if (is_request_completed(guid)) {
-      break;
-    }
-    Runtime *runtime = Runtime::get_runtime();
-    Context ctx = Runtime::get_context();
     runtime->begin_trace(ctx, 12346 /*trace_id*/);
     auto const &next_batch = batch_pipeline.back();
     BatchConfigFuture bcf =
-        prepare_next_batch(next_batch.first, next_batch.second);
+        prepare_next_batch(next_batch.first, next_batch.second, ctx, runtime);
     FutureMap fm = im->inference(llm, 0, bcf);
     assert(fm.get_future_map_domain().get_volume() == 1);
     InferenceResultFuture irf = fm.get_future(0);
@@ -2341,30 +2408,51 @@ GenerationResult RequestManager::generate_incr_decoding(
     last_irf = irf;
     runtime->end_trace(ctx, 12346 /*trace_id*/);
   }
-  GenerationResult gr = get_generation_result(guid);
-  // assert(gr.output_tokens.size() >= max_seq_length);
-  return gr;
 }
 
 /*static*/
-GenerationResult RequestManager::generate_spec_infer(
-    FFModel *llm, std::vector<std::string> &prompts, int max_seq_length) {
+void RequestManager::serve_spec_infer(FFModel *llm) {
+  Context ctx = llm->config.lg_ctx;
+  Runtime *runtime = llm->config.lg_hlr;
   InferenceManager *im = InferenceManager::get_inference_manager();
-  RequestGuid guid;
-  for (int i = 0; i < prompts.size(); i++) {
-    guid = register_new_request(prompts.at(i), max_seq_length);
+  {
+    // Compile the llm
+    im->compile_model_and_allocate_buffer(llm);
+    assert(im->model_weights_loaders.find(llm) !=
+           im->model_weights_loaders.end());
+    // Load model weights
+    im->model_weights_loaders[llm]->load_weights(llm);
+    // init operators
+    im->init_operators_inference(llm);
   }
-  if (guid == 0) {
-    std::cout
-        << "=========== Discard request exceed prompt maximum... ==========="
-        << std::endl;
-    return GenerationResult();
+  for (size_t i = 0; i < get_num_ssms(); i++) {
+    // Compile the i-th ssm
+    FFModel *ssm = get_ssm_model(i);
+    im->compile_model_and_allocate_buffer(ssm);
+    assert(im->model_weights_loaders.find(llm) !=
+           im->model_weights_loaders.end());
+    // Load model weights
+    im->model_weights_loaders[ssm]->load_weights(ssm);
+    // init operators
+    im->init_operators_inference(ssm);
   }
 
   std::queue<std::pair<TreeVerifyBatchConfigFuture, InferenceResultFuture>>
       batch_pipeline;
+  // Legion futures for inc_decoding and spec_infer
+  TreeVerifyBatchConfigFuture last_tree_bcf;
+  InferenceResultFuture last_tree_irf;
+  {
+    // Initialize futures for spec infer
+    TreeVerifyBatchConfig tree_bc;
+    InferenceResult tree_ir;
+    last_tree_bcf = Future::from_value<TreeVerifyBatchConfig>(tree_bc);
+    last_tree_irf = Future::from_value<InferenceResult>(tree_ir);
+  }
   batch_pipeline.push(std::make_pair(last_tree_bcf, last_tree_irf));
-  while (!is_request_completed(guid)) {
+
+  while (!is_background_server_terminated()) {
+
     if (batch_pipeline.size() >= 4) {
       // Block here to avoid launching too many batches
       auto const &batch = batch_pipeline.front();
@@ -2380,17 +2468,12 @@ GenerationResult RequestManager::generate_spec_infer(
       }
     }
     auto const &next_batch = batch_pipeline.back();
-    BeamSearchBatchConfigFuture beam_bcf =
-        prepare_next_batch_init(next_batch.first, next_batch.second, 0);
+    BeamSearchBatchConfigFuture beam_bcf = prepare_next_batch_init(
+        next_batch.first, next_batch.second, 0, ctx, runtime);
     std::vector<BeamSearchBatchConfigFuture> beam_bcf_vec(get_num_ssms());
     for (size_t ssm_id = 0; ssm_id < get_num_ssms(); ssm_id++) {
       beam_bcf_vec[ssm_id] = beam_bcf;
     }
-    // if (is_request_completed(guid)) {
-    //   break;
-    // }
-    Runtime *runtime = Runtime::get_runtime();
-    Context ctx = Runtime::get_context();
     runtime->begin_trace(ctx, 12345 /*trace_id*/);
 
     for (size_t i = 0; i < get_num_ssms(); i++) {
@@ -2398,16 +2481,17 @@ GenerationResult RequestManager::generate_spec_infer(
            depth++) {
         beam_bcf = beam_bcf_vec[i];
 
-        FutureMap fm = im->inference(get_model(i), 0, beam_bcf_vec[i]);
+        FutureMap fm = im->inference(get_ssm_model(i), 0, beam_bcf_vec[i]);
         assert(fm.get_future_map_domain().get_volume() == 1);
         BeamInferenceResultFuture beam_irf = fm.get_future(0);
-        beam_bcf_vec[i] = prepare_next_batch_beam(beam_bcf_vec[i], beam_irf);
+        beam_bcf_vec[i] =
+            prepare_next_batch_beam(beam_bcf_vec[i], beam_irf, ctx, runtime);
       }
     }
     // Token Tree Verification
     {
       TreeVerifyBatchConfigFuture tree_bcf =
-          prepare_next_batch_verify(beam_bcf_vec);
+          prepare_next_batch_verify(beam_bcf_vec, ctx, runtime);
       FutureMap fm = im->inference(llm, 0, tree_bcf);
       assert(fm.get_future_map_domain().get_volume() == 1);
       InferenceResultFuture tree_irf = fm.get_future(0);
@@ -2417,10 +2501,34 @@ GenerationResult RequestManager::generate_spec_infer(
     }
     runtime->end_trace(ctx, 12345 /*trace_id*/);
   }
+}
+
+void RequestManager::trigger_request_completion_future(
+    RequestGuid const &guid) {
+  const std::lock_guard<std::mutex> lock(request_to_promise_mutex);
+  assert(request_to_promise.find(guid) != request_to_promise.end());
+  // Set the completion promise in case other threads are waiting
+  request_to_promise[guid]->set_value();
+}
+
+/*static*/
+void RequestManager::terminate_background_server_at_exit() {
+  RequestManager *rm = RequestManager::get_request_manager();
+  rm->terminate_background_server();
+}
+
+void RequestManager::terminate_background_server() {
+  if (request_manager_status == SERVING) {
+    request_manager_status = TERMINATED;
+    // Wait for the background server to terminate
+    Runtime *runtime = Runtime::get_runtime();
+    Context ctx = Runtime::get_context();
+    background_server_handler.get_void_result();
+  }
+}
 
-  GenerationResult gr = get_generation_result(guid);
-  // assert(gr.output_tokens.size() >= max_seq_length);
-  return gr;
+bool RequestManager::is_background_server_terminated() {
+  return request_manager_status == TERMINATED;
 }
 
 RequestManager *request_manager_singleton = nullptr;

From 18cd4850229e1fe29778d6383ee3f7175668a093 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Sun, 14 Jan 2024 07:12:32 -0800
Subject: [PATCH 310/344] Update README.md

---
 .github/README.md | 12 +++++++-----
 1 file changed, 7 insertions(+), 5 deletions(-)

diff --git a/.github/README.md b/.github/README.md
index 0972135504..4a2a881c8d 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -102,10 +102,11 @@ llm.compile(generation_config,
             max_tokens_per_batch = 128,
             ssms=ssms)
 ```
-Finally, we call `llm.generate` to generate the output, which is organized as a list of `GenerationResult`, which include the output tokens and text.
+Next, we call `llm.start_server()` to start an LLM server running on a seperate background thread, which allows users to perform computations in parallel with LLM serving. Finally, we call `llm.generate` to generate the output, which is organized as a list of `GenerationResult`, which include the output tokens and text. After all serving requests are processed, you can either call `llm.stop_server()` to terminate the background thread or directly exit the python program, which will automatically terminate the background server thread.
 ```python
-with llm:
-  result = llm.generate("Here are some travel tips for Tokyo:\n")
+llm.start_server()
+result = llm.generate("Here are some travel tips for Tokyo:\n")
+llm.stop_server() # This invocation is optional
 ```
 
 ### Incremental decoding
@@ -140,8 +141,9 @@ llm.compile(generation_config,
             max_tokens_per_batch = 128)
 
 # Generation begins!
-with llm:
-  result = llm.generate("Here are some travel tips for Tokyo:\n")
+llm.start_server()
+result = llm.generate("Here are some travel tips for Tokyo:\n")
+llm.stop_server() # This invocation is optional
 ```
 
 </details>

From 75edadcbaf65fc4cea83eea91de73719ed5a4959 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 19 Jan 2024 23:21:31 -0500
Subject: [PATCH 311/344] Better debugging/logging tools for alignment checks
 (#1275)

* only stop server if rm is initialized

* fix

* better logging

* pass layer names to ops

* add debugging functionality to hf script

* fix

* fixes

* fix

* fix

---------

Co-authored-by: Ubuntu <ubuntu@ip-172-31-17-223.us-east-2.compute.internal>
---
 examples/python/keras/seq_cifar10_cnn.py      |   2 +-
 include/flexflow/operator.h                   | 125 +++++++++++++++++-
 .../ops/add_bias_residual_layer_norm_params.h |   1 +
 include/flexflow/ops/aggregate_params.h       |   1 +
 include/flexflow/ops/aggregate_spec_params.h  |   1 +
 include/flexflow/ops/arg_topk_params.h        |   1 +
 include/flexflow/ops/argmax_params.h          |   1 +
 include/flexflow/ops/attention_params.h       |   1 +
 include/flexflow/ops/batch_matmul_params.h    |   1 +
 include/flexflow/ops/beam_topk_params.h       |   1 +
 include/flexflow/ops/cast_params.h            |   1 +
 include/flexflow/ops/concat_params.h          |   2 +-
 include/flexflow/ops/conv_2d_params.h         |   1 +
 include/flexflow/ops/dropout_params.h         |   1 +
 include/flexflow/ops/element_binary_params.h  |   1 +
 include/flexflow/ops/element_unary_params.h   |   1 +
 include/flexflow/ops/embedding_params.h       |   1 +
 include/flexflow/ops/experts_params.h         |   1 +
 include/flexflow/ops/flat_params.h            |   1 +
 include/flexflow/ops/gather_params.h          |   1 +
 include/flexflow/ops/groupby_params.h         |   1 +
 .../ops/inc_multihead_self_attention_params.h |   1 +
 include/flexflow/ops/layer_norm_params.h      |   1 +
 include/flexflow/ops/linear_params.h          |   1 +
 include/flexflow/ops/pool_2d_params.h         |   1 +
 include/flexflow/ops/reduce_params.h          |   1 +
 include/flexflow/ops/reshape_params.h         |   1 +
 .../flexflow/ops/residual_layer_norm_params.h |   1 +
 .../flexflow/ops/residual_rms_norm_params.h   |   1 +
 include/flexflow/ops/rms_norm_params.h        |   1 +
 include/flexflow/ops/sampling_params.h        |   1 +
 .../flexflow/ops/sigmoid_silu_multi_params.h  |   1 +
 include/flexflow/ops/softmax.h                |   6 +
 include/flexflow/ops/softmax_params.h         |   2 +
 ...spec_inc_multihead_self_attention_params.h |   2 +-
 include/flexflow/ops/split_params.h           |   1 +
 include/flexflow/ops/topk_params.h            |   1 +
 include/flexflow/ops/transpose_params.h       |   1 +
 ...tree_inc_multihead_self_attention_params.h |   1 +
 .../flexflow/parallel_ops/allreduce_params.h  |   1 +
 .../flexflow/parallel_ops/combine_params.h    |   1 +
 .../parallel_ops/fused_parallel_op_params.h   |   1 +
 .../flexflow/parallel_ops/partition_params.h  |   1 +
 .../flexflow/parallel_ops/reduction_params.h  |   1 +
 .../flexflow/parallel_ops/replicate_params.h  |   1 +
 inference/utils/download_hf_model.py          |   4 +-
 python/flexflow/serve/serve.py                |  31 +++--
 src/ops/add_bias_residual_layer_norm.cc       |  12 +-
 src/ops/aggregate.cc                          |  13 +-
 src/ops/aggregate_spec.cc                     |   3 +
 src/ops/arg_topk.cc                           |  12 +-
 src/ops/argmax.cc                             |  12 +-
 src/ops/attention.cc                          |   5 +-
 src/ops/batch_matmul.cc                       |   9 +-
 src/ops/beam_topk.cc                          |  10 +-
 src/ops/cast.cc                               |   8 +-
 src/ops/concat.cc                             |   2 +-
 src/ops/conv_2d.cc                            |   9 +-
 src/ops/dropout.cc                            |   9 +-
 src/ops/element_binary.cc                     |   9 +-
 src/ops/element_unary.cc                      |  11 +-
 src/ops/embedding.cc                          |   2 +-
 src/ops/experts.cc                            |   9 +-
 src/ops/flat.cc                               |   7 +
 src/ops/fused.cu                              |   7 +-
 src/ops/gather.cc                             |   9 +-
 src/ops/group_by.cc                           |  20 ++-
 src/ops/inc_multihead_self_attention.cc       |   5 +-
 src/ops/layer_norm.cc                         |  12 +-
 src/ops/linear.cc                             |  12 +-
 src/ops/pool_2d.cc                            |   9 +-
 src/ops/reduce.cc                             |  18 ++-
 src/ops/reshape.cc                            |  12 +-
 src/ops/residual_layer_norm.cc                |  12 +-
 src/ops/residual_rms_norm.cc                  |  12 +-
 src/ops/rms_norm.cc                           |  12 +-
 src/ops/sampling.cc                           |  12 +-
 src/ops/sigmoid_silu_multi.cc                 |  12 +-
 src/ops/softmax.cc                            |  48 ++++++-
 src/ops/spec_inc_multihead_self_attention.cc  |   5 +-
 src/ops/split.cc                              |   5 +-
 src/ops/topk.cc                               |  12 +-
 src/ops/transpose.cc                          |  11 +-
 src/ops/tree_inc_multihead_self_attention.cc  |   5 +-
 src/parallel_ops/allreduce.cc                 |   5 +-
 src/parallel_ops/combine.cc                   |   5 +-
 src/parallel_ops/fused_parallel_op.cc         |   3 +
 src/parallel_ops/partition.cc                 |   5 +-
 src/parallel_ops/reduction.cc                 |   5 +-
 src/parallel_ops/replicate.cc                 |   5 +-
 src/runtime/cuda_helper.cu                    |  24 +++-
 src/runtime/graph.cc                          |  93 +++++++++++--
 src/runtime/hip_helper.cpp                    |  24 +++-
 src/runtime/operator.cc                       | 101 --------------
 src/runtime/substitution.cc                   |   9 +-
 tests/inference/huggingface_inference.py      |  52 +++++++-
 96 files changed, 746 insertions(+), 190 deletions(-)

diff --git a/examples/python/keras/seq_cifar10_cnn.py b/examples/python/keras/seq_cifar10_cnn.py
index 281a09ed70..66ea8530e0 100644
--- a/examples/python/keras/seq_cifar10_cnn.py
+++ b/examples/python/keras/seq_cifar10_cnn.py
@@ -56,7 +56,7 @@ def top_level_task():
 
 
 if __name__ == "__main__":
-  print("Sequantial model, cifar10 cnn")
+  print("Sequential model, cifar10 cnn")
   configs = ff.get_configs()
   ff.init_flexflow_runtime(configs)
   top_level_task()
diff --git a/include/flexflow/operator.h b/include/flexflow/operator.h
index fd21436681..73c2c3e092 100644
--- a/include/flexflow/operator.h
+++ b/include/flexflow/operator.h
@@ -9,6 +9,14 @@
 #include "flexflow/utils/dot/record_formatter.h"
 #include <vector>
 
+#include <sys/stat.h>
+#include <sys/types.h>
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+#include "flexflow/utils/cuda_helper.h"
+#else
+#include "flexflow/utils/hip_helper.h"
+#endif
+
 namespace FlexFlow {
 
 extern LegionRuntime::Logger::Category log_measure;
@@ -227,13 +235,126 @@ class Op {
     assert(false);
   };
   virtual void print_layer(FFModel const &model) = 0;
+  template <typename OpMetaType>
+  static std::string get_op_name_without_uid(OpMetaType *m) {
+    std::string op_name_without_uid = std::string(m->op_name);
+    size_t last_underscore = op_name_without_uid.length() - 1;
+    for (int i = op_name_without_uid.length() - 1; i > 0; i--) {
+      if (!(std::isdigit(m->op_name[i]) || m->op_name[i] == '_')) {
+        break;
+      } else if (m->op_name[i] == '_') {
+        last_underscore = i;
+      }
+    }
+    op_name_without_uid.erase(last_underscore);
+    return op_name_without_uid;
+  }
+  template <typename OpMetaType>
   static void save_inference_tensors_to_file(
-      OpMeta *m,
+      OpMetaType *m,
       int shard_id,
       BatchConfig const *bc,
       std::vector<GenericTensorAccessorR> input_tensors,
       std::vector<GenericTensorAccessorR> weight_tensors,
-      std::vector<GenericTensorAccessorW> output_tensors);
+      std::vector<GenericTensorAccessorR> output_tensors,
+      bool before_kernel = false) {
+    // Check if output directory exists, and create it if it does not
+    char const *folder_path = "./inference_tensors";
+    struct stat st = {0};
+    if (stat(folder_path, &st) == -1) {
+      // Directory does not exist, create it
+      mkdir(folder_path, 0700);
+    }
+    // output base filepath, shared by all tensors from the same operator
+    std::string op_name_without_uid = get_op_name_without_uid(m);
+    std::string base_filepath =
+        "./inference_tensors/model_" + std::to_string(m->layer_guid.model_id) +
+        "_decoding-step_" + std::to_string(m->decoding_step) + "_layer-num_" +
+        std::to_string(m->layer_guid.transformer_layer_id) + "_layer-name_" +
+        op_name_without_uid + "_shard-id_" + std::to_string(shard_id);
+    if (before_kernel) {
+      base_filepath += "_pre";
+    }
+    // save batch config, if passed
+    if (bc != nullptr) {
+      bc->save_to_file(base_filepath + "_batch-config");
+    }
+    // save all inputs
+    for (int i = 0; i < input_tensors.size(); i++) {
+      std::string filename = base_filepath + "_input_" + std::to_string(i);
+      if (input_tensors[i].data_type == DT_FLOAT) {
+        save_tensor(input_tensors[i].get_float_ptr(),
+                    input_tensors[i].domain.get_volume(),
+                    filename.c_str());
+      } else if (input_tensors[i].data_type == DT_HALF) {
+        save_tensor(input_tensors[i].get_half_ptr(),
+                    input_tensors[i].domain.get_volume(),
+                    filename.c_str());
+      } else if (input_tensors[i].data_type == DT_INT32) {
+        save_tensor(input_tensors[i].get_int32_ptr(),
+                    input_tensors[i].domain.get_volume(),
+                    filename.c_str());
+      } else if (input_tensors[i].data_type == DT_INT64) {
+        save_tensor(input_tensors[i].get_int64_ptr(),
+                    input_tensors[i].domain.get_volume(),
+                    filename.c_str());
+      } else {
+        assert(false && "Tensor data type not supported");
+      }
+    }
+    // only dump the weights once
+    if (m->decoding_step == 0) {
+      for (int i = 0; i < weight_tensors.size(); i++) {
+        std::string filename = base_filepath + "_weight_" + std::to_string(i);
+        if (weight_tensors[i].data_type == DT_FLOAT) {
+          save_tensor(weight_tensors[i].get_float_ptr(),
+                      weight_tensors[i].domain.get_volume(),
+                      filename.c_str());
+        } else if (weight_tensors[i].data_type == DT_HALF) {
+          save_tensor(weight_tensors[i].get_half_ptr(),
+                      weight_tensors[i].domain.get_volume(),
+                      filename.c_str());
+        } else if (weight_tensors[i].data_type == DT_INT32) {
+          save_tensor(weight_tensors[i].get_int32_ptr(),
+                      weight_tensors[i].domain.get_volume(),
+                      filename.c_str());
+        } else if (weight_tensors[i].data_type == DT_INT64) {
+          save_tensor(weight_tensors[i].get_int64_ptr(),
+                      weight_tensors[i].domain.get_volume(),
+                      filename.c_str());
+        } else {
+          assert(false && "Tensor data type not supported");
+        }
+      }
+    }
+    // save all outputs
+    for (int i = 0; i < output_tensors.size(); i++) {
+      std::string filename = base_filepath + "_output_" + std::to_string(i);
+      if (output_tensors[i].data_type == DT_FLOAT) {
+        save_tensor(output_tensors[i].get_float_ptr(),
+                    output_tensors[i].domain.get_volume(),
+                    filename.c_str());
+      } else if (output_tensors[i].data_type == DT_HALF) {
+        save_tensor(output_tensors[i].get_half_ptr(),
+                    output_tensors[i].domain.get_volume(),
+                    filename.c_str());
+      } else if (output_tensors[i].data_type == DT_INT32) {
+        save_tensor(output_tensors[i].get_int32_ptr(),
+                    output_tensors[i].domain.get_volume(),
+                    filename.c_str());
+      } else if (output_tensors[i].data_type == DT_INT64) {
+        save_tensor(output_tensors[i].get_int64_ptr(),
+                    output_tensors[i].domain.get_volume(),
+                    filename.c_str());
+      } else {
+        assert(false && "Tensor data type not supported");
+      }
+    }
+    // increase count of decoding steps
+    if (!before_kernel) {
+      m->decoding_step++;
+    }
+  }
   virtual bool measure_operator_cost(Simulator *sim,
                                      MachineView const &mv,
                                      CostMetrics &cost_metrics) const = 0;
diff --git a/include/flexflow/ops/add_bias_residual_layer_norm_params.h b/include/flexflow/ops/add_bias_residual_layer_norm_params.h
index 6f49983467..87fe2fb562 100644
--- a/include/flexflow/ops/add_bias_residual_layer_norm_params.h
+++ b/include/flexflow/ops/add_bias_residual_layer_norm_params.h
@@ -12,6 +12,7 @@ struct AddBiasResidualLayerNormParams {
   bool elementwise_affine;
   float eps;
   bool use_bias;
+  char name[MAX_OPNAME];
   bool is_valid(
       std::pair<ParallelTensorShape, ParallelTensorShape> const &) const;
 };
diff --git a/include/flexflow/ops/aggregate_params.h b/include/flexflow/ops/aggregate_params.h
index f746881d89..deaa04b3e7 100644
--- a/include/flexflow/ops/aggregate_params.h
+++ b/include/flexflow/ops/aggregate_params.h
@@ -9,6 +9,7 @@ namespace FlexFlow {
 struct AggregateParams {
   int n;
   float lambda_bal;
+  char name[MAX_OPNAME];
   bool is_valid(std::vector<ParallelTensorShape> const &) const;
 };
 bool operator==(AggregateParams const &, AggregateParams const &);
diff --git a/include/flexflow/ops/aggregate_spec_params.h b/include/flexflow/ops/aggregate_spec_params.h
index eb662f4c07..69e8574cba 100644
--- a/include/flexflow/ops/aggregate_spec_params.h
+++ b/include/flexflow/ops/aggregate_spec_params.h
@@ -9,6 +9,7 @@ namespace FlexFlow {
 struct AggregateSpecParams {
   int n;
   float lambda_bal;
+  char name[MAX_OPNAME];
   bool is_valid(ParallelTensorShape const &) const;
 };
 bool operator==(AggregateSpecParams const &, AggregateSpecParams const &);
diff --git a/include/flexflow/ops/arg_topk_params.h b/include/flexflow/ops/arg_topk_params.h
index bd9c38e2a9..b2876c011f 100644
--- a/include/flexflow/ops/arg_topk_params.h
+++ b/include/flexflow/ops/arg_topk_params.h
@@ -12,6 +12,7 @@ struct ArgTopKParams {
   int k;
   bool sorted;
   bool speculative_decoding;
+  char name[MAX_OPNAME];
   bool is_valid(ParallelTensorShape const &) const;
 };
 bool operator==(ArgTopKParams const &, ArgTopKParams const &);
diff --git a/include/flexflow/ops/argmax_params.h b/include/flexflow/ops/argmax_params.h
index a8f629619f..9ddb8e1fe3 100644
--- a/include/flexflow/ops/argmax_params.h
+++ b/include/flexflow/ops/argmax_params.h
@@ -9,6 +9,7 @@ namespace FlexFlow {
 struct ArgMaxParams {
   bool beam_search;
   bool is_valid(ParallelTensorShape const &) const;
+  char name[MAX_OPNAME];
 };
 bool operator==(ArgMaxParams const &, ArgMaxParams const &);
 
diff --git a/include/flexflow/ops/attention_params.h b/include/flexflow/ops/attention_params.h
index b72923a65c..89906407d3 100644
--- a/include/flexflow/ops/attention_params.h
+++ b/include/flexflow/ops/attention_params.h
@@ -11,6 +11,7 @@ struct MultiHeadAttentionParams {
   int embed_dim, num_heads, kdim, vdim;
   float dropout;
   bool bias, add_bias_kv, add_zero_attn;
+  char name[MAX_OPNAME];
 
   bool is_valid(std::tuple<ParallelTensorShape,
                            ParallelTensorShape,
diff --git a/include/flexflow/ops/batch_matmul_params.h b/include/flexflow/ops/batch_matmul_params.h
index 3e6642b61f..29a8ce711a 100644
--- a/include/flexflow/ops/batch_matmul_params.h
+++ b/include/flexflow/ops/batch_matmul_params.h
@@ -6,6 +6,7 @@ namespace FlexFlow {
 
 struct BatchMatmulParams {
   int a_seq_length_dim, b_seq_length_dim;
+  char name[MAX_OPNAME];
   bool is_valid(
       std::pair<ParallelTensorShape, ParallelTensorShape> const &) const;
 };
diff --git a/include/flexflow/ops/beam_topk_params.h b/include/flexflow/ops/beam_topk_params.h
index 430f16e249..3e09848c9a 100644
--- a/include/flexflow/ops/beam_topk_params.h
+++ b/include/flexflow/ops/beam_topk_params.h
@@ -11,6 +11,7 @@ struct BeamTopKParams {
   LayerID layer_guid;
   bool sorted;
   int max_beam_width;
+  char name[MAX_OPNAME];
   bool is_valid(ParallelTensorShape const &) const;
 };
 bool operator==(BeamTopKParams const &, BeamTopKParams const &);
diff --git a/include/flexflow/ops/cast_params.h b/include/flexflow/ops/cast_params.h
index efef3de890..38a69e8a69 100644
--- a/include/flexflow/ops/cast_params.h
+++ b/include/flexflow/ops/cast_params.h
@@ -8,6 +8,7 @@ namespace FlexFlow {
 
 struct CastParams {
   DataType dtype;
+  char name[MAX_OPNAME];
   bool is_valid(ParallelTensorShape const &) const;
 };
 bool operator==(CastParams const &, CastParams const &);
diff --git a/include/flexflow/ops/concat_params.h b/include/flexflow/ops/concat_params.h
index 2987b25424..b1a7e74c55 100644
--- a/include/flexflow/ops/concat_params.h
+++ b/include/flexflow/ops/concat_params.h
@@ -7,7 +7,7 @@ namespace FlexFlow {
 
 struct ConcatParams {
   int axis;
-
+  char name[MAX_OPNAME];
   bool is_valid(std::vector<ParallelTensorShape> const &) const;
 };
 
diff --git a/include/flexflow/ops/conv_2d_params.h b/include/flexflow/ops/conv_2d_params.h
index 9aac91e315..562d5adef9 100644
--- a/include/flexflow/ops/conv_2d_params.h
+++ b/include/flexflow/ops/conv_2d_params.h
@@ -13,6 +13,7 @@ struct Conv2DParams {
       padding_w, groups;
   ActiMode activation;
   bool use_bias;
+  char name[MAX_OPNAME];
 
   bool is_valid(ParallelTensorShape const &input) const;
   void solve_dims(ParallelTensorShape const &input,
diff --git a/include/flexflow/ops/dropout_params.h b/include/flexflow/ops/dropout_params.h
index 61aee12f9f..eb1a4d98cf 100644
--- a/include/flexflow/ops/dropout_params.h
+++ b/include/flexflow/ops/dropout_params.h
@@ -9,6 +9,7 @@ namespace FlexFlow {
 struct DropoutParams {
   float rate;
   unsigned long long seed;
+  char name[MAX_OPNAME];
   bool is_valid(ParallelTensorShape const &) const;
 };
 bool operator==(DropoutParams const &, DropoutParams const &);
diff --git a/include/flexflow/ops/element_binary_params.h b/include/flexflow/ops/element_binary_params.h
index 9489b793a7..bfbb758b6e 100644
--- a/include/flexflow/ops/element_binary_params.h
+++ b/include/flexflow/ops/element_binary_params.h
@@ -11,6 +11,7 @@ struct ElementBinaryParams {
   LayerID layer_guid;
   OperatorType type;
   bool inplace_a;
+  char name[MAX_OPNAME];
 
   bool is_valid(
       std::pair<ParallelTensorShape, ParallelTensorShape> const &) const;
diff --git a/include/flexflow/ops/element_unary_params.h b/include/flexflow/ops/element_unary_params.h
index 1aac85c43e..16cb015e3c 100644
--- a/include/flexflow/ops/element_unary_params.h
+++ b/include/flexflow/ops/element_unary_params.h
@@ -12,6 +12,7 @@ struct ElementUnaryParams {
   bool inplace;
   float scalar = 0.0;
   LayerID layer_guid;
+  char name[MAX_OPNAME];
 
   bool is_valid(ParallelTensorShape const &) const;
 };
diff --git a/include/flexflow/ops/embedding_params.h b/include/flexflow/ops/embedding_params.h
index 71e5cc8b20..d813132048 100644
--- a/include/flexflow/ops/embedding_params.h
+++ b/include/flexflow/ops/embedding_params.h
@@ -12,6 +12,7 @@ struct EmbeddingParams {
   LayerID layer_guid;
   AggrMode aggr;
   DataType data_type;
+  char name[MAX_OPNAME];
 
   bool is_valid(ParallelTensorShape const &) const;
 };
diff --git a/include/flexflow/ops/experts_params.h b/include/flexflow/ops/experts_params.h
index 7adced3c8c..90cce47526 100644
--- a/include/flexflow/ops/experts_params.h
+++ b/include/flexflow/ops/experts_params.h
@@ -17,6 +17,7 @@ struct ExpertsParams {
   int experts_internal_dim_size;
   bool use_bias;
   ActiMode activation;
+  char name[MAX_OPNAME];
 
   bool is_valid(std::vector<ParallelTensorShape> const &) const;
 };
diff --git a/include/flexflow/ops/flat_params.h b/include/flexflow/ops/flat_params.h
index 5f821b0416..fc006849e5 100644
--- a/include/flexflow/ops/flat_params.h
+++ b/include/flexflow/ops/flat_params.h
@@ -7,6 +7,7 @@
 namespace FlexFlow {
 
 struct FlatParams {
+  char name[MAX_OPNAME];
   bool is_valid(ParallelTensorShape const &) const;
   void solve_dims(ParallelTensorShape const &input,
                   ParallelDim output_dims[MAX_TENSOR_DIM],
diff --git a/include/flexflow/ops/gather_params.h b/include/flexflow/ops/gather_params.h
index 51f1184a72..de27cdfc7c 100644
--- a/include/flexflow/ops/gather_params.h
+++ b/include/flexflow/ops/gather_params.h
@@ -10,6 +10,7 @@ namespace FlexFlow {
 struct GatherParams {
   int legion_dim;
   LayerID layer_guid;
+  char name[MAX_OPNAME];
   bool is_valid(
       std::pair<ParallelTensorShape, ParallelTensorShape> const &input) const;
 };
diff --git a/include/flexflow/ops/groupby_params.h b/include/flexflow/ops/groupby_params.h
index 24a74f5412..4f6245863a 100644
--- a/include/flexflow/ops/groupby_params.h
+++ b/include/flexflow/ops/groupby_params.h
@@ -9,6 +9,7 @@ namespace FlexFlow {
 struct Group_byParams {
   int n;
   float alpha;
+  char name[MAX_OPNAME];
   bool is_valid(
       std::pair<ParallelTensorShape, ParallelTensorShape> const &) const;
 };
diff --git a/include/flexflow/ops/inc_multihead_self_attention_params.h b/include/flexflow/ops/inc_multihead_self_attention_params.h
index 7ae39f1cfe..58681069e2 100644
--- a/include/flexflow/ops/inc_multihead_self_attention_params.h
+++ b/include/flexflow/ops/inc_multihead_self_attention_params.h
@@ -16,6 +16,7 @@ struct IncMultiHeadSelfAttentionParams {
       scaling_query, qk_prod_scaling, position_bias;
   DataType quantization_type;
   bool offload;
+  char name[MAX_OPNAME];
   bool is_valid(ParallelTensorShape const &) const;
 };
 
diff --git a/include/flexflow/ops/layer_norm_params.h b/include/flexflow/ops/layer_norm_params.h
index c9aa40048d..3effce6204 100644
--- a/include/flexflow/ops/layer_norm_params.h
+++ b/include/flexflow/ops/layer_norm_params.h
@@ -12,6 +12,7 @@ struct LayerNormParams {
   bool elementwise_affine;
   float eps;
   bool use_bias;
+  char name[MAX_OPNAME];
   bool is_valid(ParallelTensorShape const &) const;
 };
 
diff --git a/include/flexflow/ops/linear_params.h b/include/flexflow/ops/linear_params.h
index 563304e89f..9a62ebd857 100644
--- a/include/flexflow/ops/linear_params.h
+++ b/include/flexflow/ops/linear_params.h
@@ -20,6 +20,7 @@ class LinearParams {
   float kernel_reg_lambda;
   DataType quantization_type;
   bool offload;
+  char name[MAX_OPNAME];
 
   bool is_valid(ParallelTensorShape const &input_shape) const;
   void solve_dims(const ParallelTensor input,
diff --git a/include/flexflow/ops/pool_2d_params.h b/include/flexflow/ops/pool_2d_params.h
index 7d4f1f1c12..54af7f9db6 100644
--- a/include/flexflow/ops/pool_2d_params.h
+++ b/include/flexflow/ops/pool_2d_params.h
@@ -10,6 +10,7 @@ struct Pool2DParams {
   int kernel_h, kernel_w, stride_h, stride_w, padding_h, padding_w;
   PoolType pool_type;
   ActiMode activation;
+  char name[MAX_OPNAME];
 
   bool is_valid(ParallelTensorShape const &input) const;
   void solve_dims(ParallelTensorShape const &input,
diff --git a/include/flexflow/ops/reduce_params.h b/include/flexflow/ops/reduce_params.h
index b79ba9157a..478649584f 100644
--- a/include/flexflow/ops/reduce_params.h
+++ b/include/flexflow/ops/reduce_params.h
@@ -10,6 +10,7 @@ struct ReduceParams {
   std::vector<int> axes;
   bool keepdims;
   LayerID layer_guid;
+  char name[MAX_OPNAME];
 
   bool is_valid(ParallelTensorShape const &) const;
 };
diff --git a/include/flexflow/ops/reshape_params.h b/include/flexflow/ops/reshape_params.h
index ffd88948ea..15753c8e17 100644
--- a/include/flexflow/ops/reshape_params.h
+++ b/include/flexflow/ops/reshape_params.h
@@ -10,6 +10,7 @@ namespace FlexFlow {
 struct ReshapeParams {
   std::vector<int> shape;
   LayerID layer_guid;
+  char name[MAX_OPNAME];
 
   bool is_valid(ParallelTensorShape const &) const;
 };
diff --git a/include/flexflow/ops/residual_layer_norm_params.h b/include/flexflow/ops/residual_layer_norm_params.h
index 24da4a2c08..949ae0c799 100644
--- a/include/flexflow/ops/residual_layer_norm_params.h
+++ b/include/flexflow/ops/residual_layer_norm_params.h
@@ -13,6 +13,7 @@ struct ResidualLayerNormParams {
   float eps;
   bool use_bias;
   bool use_two_residuals;
+  char name[MAX_OPNAME];
   bool is_valid(std::tuple<ParallelTensorShape,
                            ParallelTensorShape,
                            ParallelTensorShape> const &) const;
diff --git a/include/flexflow/ops/residual_rms_norm_params.h b/include/flexflow/ops/residual_rms_norm_params.h
index 64751a30b0..a4e4de59ab 100644
--- a/include/flexflow/ops/residual_rms_norm_params.h
+++ b/include/flexflow/ops/residual_rms_norm_params.h
@@ -11,6 +11,7 @@ struct ResidualRMSNormParams {
   LayerID layer_guid;
   float eps;
   int dim;
+  char name[MAX_OPNAME];
   bool is_valid(
       std::pair<ParallelTensorShape, ParallelTensorShape> const &input) const;
 };
diff --git a/include/flexflow/ops/rms_norm_params.h b/include/flexflow/ops/rms_norm_params.h
index 81295322f0..2e4ceecf48 100644
--- a/include/flexflow/ops/rms_norm_params.h
+++ b/include/flexflow/ops/rms_norm_params.h
@@ -11,6 +11,7 @@ struct RMSNormParams {
   LayerID layer_guid;
   float eps;
   int dim;
+  char name[MAX_OPNAME];
   bool is_valid(ParallelTensorShape const &) const;
 };
 
diff --git a/include/flexflow/ops/sampling_params.h b/include/flexflow/ops/sampling_params.h
index 1449ddbf54..ddc98a3d6c 100644
--- a/include/flexflow/ops/sampling_params.h
+++ b/include/flexflow/ops/sampling_params.h
@@ -8,6 +8,7 @@ namespace FlexFlow {
 
 struct SamplingParams {
   float top_p;
+  char name[MAX_OPNAME];
   bool is_valid(ParallelTensorShape const &) const;
 };
 bool operator==(SamplingParams const &, SamplingParams const &);
diff --git a/include/flexflow/ops/sigmoid_silu_multi_params.h b/include/flexflow/ops/sigmoid_silu_multi_params.h
index c8182505b3..eb152db5c1 100644
--- a/include/flexflow/ops/sigmoid_silu_multi_params.h
+++ b/include/flexflow/ops/sigmoid_silu_multi_params.h
@@ -8,6 +8,7 @@ namespace FlexFlow {
 
 struct SigmoidSiluMultiParams {
   LayerID layer_guid;
+  char name[MAX_OPNAME];
   bool is_valid(
       std::pair<ParallelTensorShape, ParallelTensorShape> const &) const;
 };
diff --git a/include/flexflow/ops/softmax.h b/include/flexflow/ops/softmax.h
index 6fd1a434d4..61094f7361 100644
--- a/include/flexflow/ops/softmax.h
+++ b/include/flexflow/ops/softmax.h
@@ -14,6 +14,7 @@ class Softmax : public Op {
   using Params = SoftmaxParams;
   using Input = ParallelTensor;
   Softmax(FFModel &model,
+          LayerID const &_layer_guid,
           const ParallelTensor logit,
           int dim,
           char const *name);
@@ -60,6 +61,11 @@ class Softmax : public Op {
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
                              CostMetrics &cost_metrics) const override;
+  void serialize(Legion::Serializer &) const override;
+  static PCG::Node deserialize(FFModel &ff,
+                               Legion::Deserializer &d,
+                               ParallelTensor inputs[],
+                               int num_inputs);
   Params get_params() const;
 
 private:
diff --git a/include/flexflow/ops/softmax_params.h b/include/flexflow/ops/softmax_params.h
index d805d9966d..63dc87641f 100644
--- a/include/flexflow/ops/softmax_params.h
+++ b/include/flexflow/ops/softmax_params.h
@@ -6,7 +6,9 @@
 namespace FlexFlow {
 
 struct SoftmaxParams {
+  LayerID layer_guid;
   int dim;
+  char name[MAX_OPNAME];
   bool is_valid(ParallelTensorShape const &) const;
 };
 bool operator==(SoftmaxParams const &, SoftmaxParams const &);
diff --git a/include/flexflow/ops/spec_inc_multihead_self_attention_params.h b/include/flexflow/ops/spec_inc_multihead_self_attention_params.h
index 2f7a706bf1..1461224ba9 100644
--- a/include/flexflow/ops/spec_inc_multihead_self_attention_params.h
+++ b/include/flexflow/ops/spec_inc_multihead_self_attention_params.h
@@ -13,7 +13,7 @@ struct SpecIncMultiHeadSelfAttentionParams {
   float dropout, scaling_factor;
   bool qkv_bias, final_bias, add_zero_attn, apply_rotary_embedding,
       scaling_query, qk_prod_scaling, position_bias;
-
+  char name[MAX_OPNAME];
   bool is_valid(ParallelTensorShape const &) const;
 };
 
diff --git a/include/flexflow/ops/split_params.h b/include/flexflow/ops/split_params.h
index f0f3b2e956..e21a1ab4a1 100644
--- a/include/flexflow/ops/split_params.h
+++ b/include/flexflow/ops/split_params.h
@@ -8,6 +8,7 @@ namespace FlexFlow {
 struct SplitParams {
   std::vector<int> splits;
   int legion_axis;
+  char name[MAX_OPNAME];
   bool is_valid(ParallelTensorShape const &) const;
 };
 
diff --git a/include/flexflow/ops/topk_params.h b/include/flexflow/ops/topk_params.h
index 8b9a0f1bd5..01c6ae9da7 100644
--- a/include/flexflow/ops/topk_params.h
+++ b/include/flexflow/ops/topk_params.h
@@ -9,6 +9,7 @@ namespace FlexFlow {
 struct TopKParams {
   int k;
   bool sorted;
+  char name[MAX_OPNAME];
   bool is_valid(ParallelTensorShape const &) const;
 };
 bool operator==(TopKParams const &, TopKParams const &);
diff --git a/include/flexflow/ops/transpose_params.h b/include/flexflow/ops/transpose_params.h
index 42737ee3e9..2e3e34007a 100644
--- a/include/flexflow/ops/transpose_params.h
+++ b/include/flexflow/ops/transpose_params.h
@@ -6,6 +6,7 @@ namespace FlexFlow {
 
 struct TransposeParams {
   std::vector<int> perm;
+  char name[MAX_OPNAME];
   bool is_valid(ParallelTensorShape const &) const;
 };
 
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention_params.h b/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
index 14fcde74ba..d1a51b8b8f 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention_params.h
@@ -16,6 +16,7 @@ struct TreeIncMultiHeadSelfAttentionParams {
       scaling_query, qk_prod_scaling, position_bias;
   DataType quantization_type;
   bool offload;
+  char name[MAX_OPNAME];
   bool is_valid(ParallelTensorShape const &) const;
 };
 
diff --git a/include/flexflow/parallel_ops/allreduce_params.h b/include/flexflow/parallel_ops/allreduce_params.h
index c04676ffeb..a0daac8f9a 100644
--- a/include/flexflow/parallel_ops/allreduce_params.h
+++ b/include/flexflow/parallel_ops/allreduce_params.h
@@ -5,6 +5,7 @@ namespace FlexFlow {
 
 struct AllReduceParams {
   int allreduce_legion_dim;
+  char name[MAX_OPNAME];
   bool is_valid(ParallelTensorShape const &) const;
 };
 bool operator==(AllReduceParams const &, AllReduceParams const &);
diff --git a/include/flexflow/parallel_ops/combine_params.h b/include/flexflow/parallel_ops/combine_params.h
index 74ef01e08f..8ca05f7f50 100644
--- a/include/flexflow/parallel_ops/combine_params.h
+++ b/include/flexflow/parallel_ops/combine_params.h
@@ -6,6 +6,7 @@ namespace FlexFlow {
 struct CombineParams {
   int combine_legion_dim;
   int combine_degree;
+  char name[MAX_OPNAME];
   bool is_valid(ParallelTensorShape const &) const;
 };
 bool operator==(CombineParams const &, CombineParams const &);
diff --git a/include/flexflow/parallel_ops/fused_parallel_op_params.h b/include/flexflow/parallel_ops/fused_parallel_op_params.h
index cba3844a4c..8c56b30998 100644
--- a/include/flexflow/parallel_ops/fused_parallel_op_params.h
+++ b/include/flexflow/parallel_ops/fused_parallel_op_params.h
@@ -7,6 +7,7 @@ namespace FlexFlow {
 
 struct FusedParallelOpParams {
   std::vector<ParallelOpInfo> parallel_ops;
+  char name[MAX_OPNAME];
   bool is_valid(ParallelTensorShape const &) const;
 };
 bool operator==(FusedParallelOpParams const &, FusedParallelOpParams const &);
diff --git a/include/flexflow/parallel_ops/partition_params.h b/include/flexflow/parallel_ops/partition_params.h
index 921ab43eaf..33ccf6b02c 100644
--- a/include/flexflow/parallel_ops/partition_params.h
+++ b/include/flexflow/parallel_ops/partition_params.h
@@ -6,6 +6,7 @@ namespace FlexFlow {
 struct RepartitionParams {
   int repartition_legion_dim;
   int repartition_degree;
+  char name[MAX_OPNAME];
   bool is_valid(ParallelTensorShape const &) const;
 };
 bool operator==(RepartitionParams const &, RepartitionParams const &);
diff --git a/include/flexflow/parallel_ops/reduction_params.h b/include/flexflow/parallel_ops/reduction_params.h
index fab7da2626..60b6c4f6aa 100644
--- a/include/flexflow/parallel_ops/reduction_params.h
+++ b/include/flexflow/parallel_ops/reduction_params.h
@@ -6,6 +6,7 @@ namespace FlexFlow {
 struct ReductionParams {
   int reduction_legion_dim;
   int reduction_degree;
+  char name[MAX_OPNAME];
   bool is_valid(ParallelTensorShape const &) const;
 };
 bool operator==(ReductionParams const &, ReductionParams const &);
diff --git a/include/flexflow/parallel_ops/replicate_params.h b/include/flexflow/parallel_ops/replicate_params.h
index 06edbc1ddc..da1f94217c 100644
--- a/include/flexflow/parallel_ops/replicate_params.h
+++ b/include/flexflow/parallel_ops/replicate_params.h
@@ -6,6 +6,7 @@ namespace FlexFlow {
 struct ReplicateParams {
   int replicate_legion_dim;
   int replicate_degree;
+  char name[MAX_OPNAME];
   bool is_valid(ParallelTensorShape const &) const;
 };
 bool operator==(ReplicateParams const &, ReplicateParams const &);
diff --git a/inference/utils/download_hf_model.py b/inference/utils/download_hf_model.py
index 03fc8e1633..94a8c23e68 100644
--- a/inference/utils/download_hf_model.py
+++ b/inference/utils/download_hf_model.py
@@ -36,9 +36,9 @@ def parse_args():
 
 def main(args):
     if args.full_precision_only:
-        data_types = ff.DataType.DT_FLOAT
+        data_types = (ff.DataType.DT_FLOAT,)
     elif args.half_precision_only:
-        data_types = ff.DataType.DT_HALF
+        data_types = (ff.DataType.DT_HALF,)
     else:
         data_types = (ff.DataType.DT_FLOAT, ff.DataType.DT_HALF)
 
diff --git a/python/flexflow/serve/serve.py b/python/flexflow/serve/serve.py
index d1a935e5fc..5c3cac9303 100644
--- a/python/flexflow/serve/serve.py
+++ b/python/flexflow/serve/serve.py
@@ -117,10 +117,11 @@ def __init__(
         self.cache_path = cache_path if len(cache_path) > 0 else "~/.cache/flexflow"
         self.refresh_cache = refresh_cache
         self.output_file = output_file
+        self.rm = None
 
     def __del__(self):
         # Stop the background server before deleting the object
-        if type(self) == LLM:
+        if type(self) == LLM and self.rm is not None:
             self.rm.stop_server()
 
     def __get_ff_model_type(self):
@@ -320,9 +321,9 @@ def compile(
         :param ssms: The SSMs to use when operating in speculative inference mode, defaults to []
         :type ssms: list, optional
         """
-        #self.max_requests_per_batch = max_requests_per_batch
-        #self.max_seq_length = max_seq_length
-        #self.max_tokens_per_batch = max_tokens_per_batch
+        # self.max_requests_per_batch = max_requests_per_batch
+        # self.max_seq_length = max_seq_length
+        # self.max_tokens_per_batch = max_tokens_per_batch
         self.ssms = ssms
         self.generation_config = GenerationConfig()
         self.ffconfig = FFConfig()
@@ -362,7 +363,7 @@ def compile(
             self.ffconfig,
             self.hf_config,
             self.data_type,
-            max_tokens_per_batch
+            max_tokens_per_batch,
         )
 
         # Download the weights from huggingface (if needed)
@@ -378,7 +379,7 @@ def compile(
             model_configs.hidden_size,
             model_configs.hidden_size // model_configs.num_attention_heads,
             self.ffconfig.tensor_parallelism_degree,
-            self.data_type == DataType.DT_FLOAT
+            self.data_type == DataType.DT_FLOAT,
         )
 
         # Register weights file loader
@@ -404,8 +405,11 @@ def compile(
             self.rm.register_ssm_model(ssm.model.ffmodel)
 
         # start background server
-        if (mode == InferenceMode.TREE_VERIFY_MODE) or (mode == InferenceMode.INC_DECODING_MODE):
+        if (mode == InferenceMode.TREE_VERIFY_MODE) or (
+            mode == InferenceMode.INC_DECODING_MODE
+        ):
             import atexit
+
             atexit.register(self.rm.stop_server)
 
     def generate(self, prompts: Union[str, List[str]], max_length: int = 128):
@@ -426,26 +430,27 @@ def generate(self, prompts: Union[str, List[str]], max_length: int = 128):
             return self.model.ffmodel.generate(prompts, max_length)
         else:
             assert False, "Please pass a non-empty string or list of strings"
-    
+
     def start_server(self):
         self.rm.start_server(self.model.ffmodel)
         print("Background server started.")
-        
+
     def stop_server(self):
         self.rm.stop_server()
-        print("Background server stoped.")
-        
+        print("Background server stopped.")
+
     def __enter__(self):
         # Start the server when entering the context
-        #self.rm.start_server(self.model.ffmodel)
+        # self.rm.start_server(self.model.ffmodel)
         return self
 
     def __exit__(self, exc_type, exc_value, traceback):
         # Stop the server when exiting the context
-        #self.rm.stop_server()
+        # self.rm.stop_server()
         if exc_type:
             print(f"Exception occurred: {exc_value}")
 
+
 class SSM(LLM):
     """This class creates a SSM (Small-Speculative Model) object based on a model from HuggingFace"""
 
diff --git a/src/ops/add_bias_residual_layer_norm.cc b/src/ops/add_bias_residual_layer_norm.cc
index 42fbb3016a..e670380901 100644
--- a/src/ops/add_bias_residual_layer_norm.cc
+++ b/src/ops/add_bias_residual_layer_norm.cc
@@ -58,6 +58,9 @@ AddBiasResidualLayerNormParams AddBiasResidualLayerNorm::get_params() const {
   params.elementwise_affine = this->elementwise_affine;
   params.eps = this->eps;
   params.use_bias = this->use_bias;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
@@ -213,7 +216,7 @@ AddBiasResidualLayerNorm::AddBiasResidualLayerNorm(
                                params.use_bias,
                                params.eps,
                                allocate_weights,
-                               name) {}
+                               params.name) {}
 
 AddBiasResidualLayerNorm::AddBiasResidualLayerNorm(
     FFModel &model,
@@ -755,6 +758,8 @@ void AddBiasResidualLayerNorm::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->elementwise_affine);
   sez.serialize(this->eps);
   sez.serialize(this->use_bias);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 using PCG::Node;
@@ -783,6 +788,10 @@ Node AddBiasResidualLayerNorm::deserialize(FFModel &ff,
   dez.deserialize(elementwise_affine);
   dez.deserialize(eps);
   dez.deserialize(use_bias);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
 
   AddBiasResidualLayerNormParams params;
   params.layer_guid = layer_guid;
@@ -790,6 +799,7 @@ Node AddBiasResidualLayerNorm::deserialize(FFModel &ff,
   params.elementwise_affine = elementwise_affine;
   params.eps = eps;
   params.use_bias = use_bias;
+  strcpy(params.name, name);
   return ff.get_or_create_node<AddBiasResidualLayerNorm>({inputs[0], inputs[1]},
                                                          params);
 }
diff --git a/src/ops/aggregate.cc b/src/ops/aggregate.cc
index 67810d3f5b..5f05458e34 100644
--- a/src/ops/aggregate.cc
+++ b/src/ops/aggregate.cc
@@ -85,6 +85,9 @@ AggregateParams Aggregate::get_params() const {
   AggregateParams params;
   params.n = this->n;
   params.lambda_bal = this->lambda_bal;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
@@ -164,7 +167,8 @@ Aggregate::Aggregate(FFModel &model,
                      AggregateParams const &params,
                      std::vector<ParallelTensor> const &inputs,
                      char const *name)
-    : Aggregate(model, inputs.data(), params.n, params.lambda_bal, name) {}
+    : Aggregate(
+          model, inputs.data(), params.n, params.lambda_bal, params.name) {}
 
 using PCG::Node;
 Node Aggregate::deserialize(FFModel &ff,
@@ -175,10 +179,15 @@ Node Aggregate::deserialize(FFModel &ff,
   float lambda_bal;
   dez.deserialize(n);
   dez.deserialize(lambda_bal);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
   assert(num_inputs == n + 4);
   AggregateParams params;
   params.n = n;
   params.lambda_bal = lambda_bal;
+  strcpy(params.name, name);
   return ff.get_or_create_node<Aggregate>(inputs, params);
 }
 
@@ -567,6 +576,8 @@ void Aggregate::backward_task(Task const *task,
 void Aggregate::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->n);
   sez.serialize(this->lambda_bal);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 bool Aggregate::measure_operator_cost(Simulator *sim,
diff --git a/src/ops/aggregate_spec.cc b/src/ops/aggregate_spec.cc
index 19b2edc14a..1edd430881 100644
--- a/src/ops/aggregate_spec.cc
+++ b/src/ops/aggregate_spec.cc
@@ -84,6 +84,9 @@ AggregateSpecParams AggregateSpec::get_params() const {
   AggregateSpecParams params;
   params.n = this->n;
   params.lambda_bal = this->lambda_bal;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
diff --git a/src/ops/arg_topk.cc b/src/ops/arg_topk.cc
index 2727a1d249..780a77450e 100644
--- a/src/ops/arg_topk.cc
+++ b/src/ops/arg_topk.cc
@@ -112,6 +112,9 @@ ArgTopKParams ArgTopK::get_params() const {
   params.k = this->k;
   params.sorted = this->sorted;
   params.speculative_decoding = this->speculative_decoding;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
@@ -183,7 +186,7 @@ ArgTopK::ArgTopK(FFModel &model,
               params.k,
               params.sorted,
               params.speculative_decoding,
-              name) {}
+              params.name) {}
 
 void ArgTopK::init_inference(FFModel const &ff,
                              std::vector<ParallelTensor> const &batch_inputs,
@@ -446,6 +449,8 @@ void ArgTopK::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->k);
   sez.serialize(this->sorted);
   sez.serialize(this->speculative_decoding);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 Node ArgTopK::deserialize(FFModel &ff,
@@ -464,11 +469,16 @@ Node ArgTopK::deserialize(FFModel &ff,
   dez.deserialize(k);
   dez.deserialize(sorted);
   dez.deserialize(speculative_decoding);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
   ArgTopKParams params;
   params.layer_guid = layer_guid;
   params.k = k;
   params.sorted = sorted;
   params.speculative_decoding = speculative_decoding;
+  strcpy(params.name, name);
   return ff.get_or_create_node<ArgTopK>(inputs[0], params);
 }
 
diff --git a/src/ops/argmax.cc b/src/ops/argmax.cc
index dc7e4ea3b3..a52ce1886b 100644
--- a/src/ops/argmax.cc
+++ b/src/ops/argmax.cc
@@ -91,6 +91,9 @@ Op *ArgMax::create_operator_from_layer(
 ArgMaxParams ArgMax::get_params() const {
   ArgMaxParams params;
   params.beam_search = this->beam_search;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
@@ -140,7 +143,7 @@ ArgMax::ArgMax(FFModel &model,
                ArgMaxParams const &params,
                const ParallelTensor input,
                char const *name)
-    : ArgMax(model, input, params.beam_search, name) {}
+    : ArgMax(model, input, params.beam_search, params.name) {}
 
 void ArgMax::init_inference(FFModel const &ff,
                             std::vector<ParallelTensor> const &batch_inputs,
@@ -410,6 +413,8 @@ void ArgMax::backward(FFModel const &ff) {
 
 void ArgMax::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->beam_search);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 Node ArgMax::deserialize(FFModel &ff,
@@ -419,8 +424,13 @@ Node ArgMax::deserialize(FFModel &ff,
   assert(num_inputs == 1);
   bool beam_search;
   dez.deserialize(beam_search);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
   ArgMaxParams params;
   params.beam_search = beam_search;
+  strcpy(params.name, name);
   return ff.get_or_create_node<ArgMax>(inputs[0], params);
 }
 
diff --git a/src/ops/attention.cc b/src/ops/attention.cc
index 1f71be07a8..97afc94341 100644
--- a/src/ops/attention.cc
+++ b/src/ops/attention.cc
@@ -363,7 +363,7 @@ MultiHeadAttention::MultiHeadAttention(
                          params.add_bias_kv,
                          params.add_zero_attn,
                          allocate_weights,
-                         name) {}
+                         params.name) {}
 
 void MultiHeadAttention::init_inference(
     FFModel const &ff,
@@ -1013,6 +1013,9 @@ MultiHeadAttentionParams MultiHeadAttention::get_params() const {
   params.bias = this->bias;
   params.add_bias_kv = this->add_bias_kv;
   params.add_zero_attn = this->add_zero_attn;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
diff --git a/src/ops/batch_matmul.cc b/src/ops/batch_matmul.cc
index f4b06877e5..e13169f6c1 100644
--- a/src/ops/batch_matmul.cc
+++ b/src/ops/batch_matmul.cc
@@ -138,7 +138,7 @@ BatchMatmul::BatchMatmul(
                   inputs.second,
                   params.a_seq_length_dim,
                   params.b_seq_length_dim,
-                  name) {}
+                  params.name) {}
 
 // return A*B
 BatchMatmul::BatchMatmul(FFModel &model,
@@ -190,6 +190,8 @@ void BatchMatmul::serialize(Legion::Serializer &sez) const {
   BatchMatmulParams params = get_params();
   sez.serialize(params.a_seq_length_dim);
   sez.serialize(params.b_seq_length_dim);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 using PCG::Node;
@@ -202,10 +204,15 @@ Node BatchMatmul::deserialize(FFModel &ff,
   int a_seq_length_dim, b_seq_length_dim;
   dez.deserialize(a_seq_length_dim);
   dez.deserialize(b_seq_length_dim);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
 
   BatchMatmulParams params;
   params.a_seq_length_dim = a_seq_length_dim;
   params.b_seq_length_dim = b_seq_length_dim;
+  strcpy(params.name, name);
   return ff.get_or_create_node<BatchMatmul>({inputs[0], inputs[1]}, params);
 }
 
diff --git a/src/ops/beam_topk.cc b/src/ops/beam_topk.cc
index 18d0ec1587..d2054cacb0 100644
--- a/src/ops/beam_topk.cc
+++ b/src/ops/beam_topk.cc
@@ -170,7 +170,7 @@ BeamTopK::BeamTopK(FFModel &model,
                params.layer_guid,
                params.max_beam_width,
                params.sorted,
-               name) {}
+               params.name) {}
 
 void BeamTopK::init_inference(FFModel const &ff,
                               std::vector<ParallelTensor> const &batch_inputs,
@@ -418,6 +418,8 @@ void BeamTopK::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.model_id);
   sez.serialize(this->sorted);
   sez.serialize(this->max_beam_width);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 Node BeamTopK::deserialize(FFModel &ff,
@@ -434,10 +436,16 @@ Node BeamTopK::deserialize(FFModel &ff,
   LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
   dez.deserialize(sorted);
   dez.deserialize(max_beam_width);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
+
   BeamTopKParams params;
   params.layer_guid = layer_guid;
   params.sorted = sorted;
   params.max_beam_width = max_beam_width;
+  strcpy(params.name, name);
   return ff.get_or_create_node<BeamTopK>(inputs[0], params);
 }
 
diff --git a/src/ops/cast.cc b/src/ops/cast.cc
index 2a845cb303..e514236a31 100644
--- a/src/ops/cast.cc
+++ b/src/ops/cast.cc
@@ -112,7 +112,7 @@ Cast::Cast(FFModel &model,
            CastParams const &params,
            ParallelTensor const &input,
            char const *name)
-    : Cast(model, input, params.dtype, name) {}
+    : Cast(model, input, params.dtype, params.name) {}
 
 void Cast::init(FFModel const &ff) {
   assert(check_output_input_weight_same_parallel_is());
@@ -409,6 +409,8 @@ bool Cast::measure_operator_cost(Simulator *sim,
 
 void Cast::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->outputs[0]->data_type);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 using PCG::Node;
@@ -420,6 +422,10 @@ Node Cast::deserialize(FFModel &ff,
   assert(num_inputs == 1);
   DataType dtype;
   dez.deserialize(dtype);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
   return ff.get_or_create_node<Cast>(inputs[0], {dtype});
 }
 
diff --git a/src/ops/concat.cc b/src/ops/concat.cc
index 80935e387b..d4d8e525fc 100644
--- a/src/ops/concat.cc
+++ b/src/ops/concat.cc
@@ -147,7 +147,7 @@ Concat::Concat(FFModel &model,
                ConcatParams const &params,
                std::vector<ParallelTensor> const &inputs,
                char const *name)
-    : Concat(model, inputs.size(), inputs.data(), params.axis, name) {}
+    : Concat(model, inputs.size(), inputs.data(), params.axis, params.name) {}
 
 void Concat::init(FFModel const &ff) {
   assert(check_output_input_weight_same_parallel_is());
diff --git a/src/ops/conv_2d.cc b/src/ops/conv_2d.cc
index 7d8fd32570..94850a178d 100644
--- a/src/ops/conv_2d.cc
+++ b/src/ops/conv_2d.cc
@@ -389,7 +389,7 @@ Conv2D::Conv2D(FFModel &model,
              params.groups,
              params.use_bias,
              allocate_weights,
-             name) {}
+             params.name) {}
 
 bool Conv2DParams::is_valid(ParallelTensorShape const &input) const {
   ParallelTensorShape output_shape, kernel_shape, bias_shape;
@@ -1026,6 +1026,8 @@ void Conv2D::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->groups);
   sez.serialize(this->use_bias);
   sez.serialize(this->activation);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 using PCG::Node;
@@ -1055,6 +1057,10 @@ Node Conv2D::deserialize(FFModel &ff,
   dez.deserialize(groups);
   dez.deserialize(use_bias);
   dez.deserialize(activation);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
 
   Conv2DParams params;
   params.layer_guid = layer_guid;
@@ -1068,6 +1074,7 @@ Node Conv2D::deserialize(FFModel &ff,
   params.groups = groups;
   params.use_bias = use_bias;
   params.activation = activation;
+  strcpy(params.name, name);
 
   return ff.get_or_create_node<Conv2D>(inputs[0], params);
 }
diff --git a/src/ops/dropout.cc b/src/ops/dropout.cc
index 9b11c9d912..58cb82d53d 100644
--- a/src/ops/dropout.cc
+++ b/src/ops/dropout.cc
@@ -118,7 +118,7 @@ Dropout::Dropout(FFModel &model,
                  DropoutParams const &params,
                  const ParallelTensor input,
                  char const *name)
-    : Dropout(model, input, params.rate, params.seed, name) {}
+    : Dropout(model, input, params.rate, params.seed, params.name) {}
 
 void Dropout::init(FFModel const &ff) {
   assert(check_output_input_weight_same_parallel_is());
@@ -272,6 +272,8 @@ void Dropout::backward_task(Task const *task,
 void Dropout::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->rate);
   sez.serialize(this->seed);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 Node Dropout::deserialize(FFModel &ff,
@@ -283,9 +285,14 @@ Node Dropout::deserialize(FFModel &ff,
   float rate;
   dez.deserialize(rate);
   dez.deserialize(seed);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
   DropoutParams params;
   params.rate = rate;
   params.seed = seed;
+  strcpy(params.name, name);
   return ff.get_or_create_node<Dropout>(inputs[0], params);
 }
 
diff --git a/src/ops/element_binary.cc b/src/ops/element_binary.cc
index 42c6487581..4352f459b9 100644
--- a/src/ops/element_binary.cc
+++ b/src/ops/element_binary.cc
@@ -252,7 +252,7 @@ ElementBinary::ElementBinary(
                     inputs.first,
                     inputs.second,
                     params.inplace_a,
-                    name) {}
+                    params.name) {}
 
 void ElementBinary::map_output_tensors(FFModel &ff) {
   if (has_inplace_output()) {
@@ -1128,6 +1128,8 @@ void ElementBinary::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.model_id);
   sez.serialize(this->op_type);
   sez.serialize(this->inplace_a);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 using PCG::Node;
@@ -1146,11 +1148,16 @@ Node ElementBinary::deserialize(FFModel &ff,
   LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
   dez.deserialize(op_type);
   dez.deserialize(inplace_a);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
 
   ElementBinaryParams params;
   params.layer_guid = layer_guid;
   params.type = op_type;
   params.inplace_a = inplace_a;
+  strcpy(params.name, name);
   return ff.get_or_create_node<ElementBinary>({inputs[0], inputs[1]}, params);
 }
 
diff --git a/src/ops/element_unary.cc b/src/ops/element_unary.cc
index 9fb2e6dc1f..0e1d115557 100644
--- a/src/ops/element_unary.cc
+++ b/src/ops/element_unary.cc
@@ -212,7 +212,7 @@ ElementUnary::ElementUnary(FFModel &model,
                    params.op_type,
                    input,
                    params.inplace,
-                   name,
+                   params.name,
                    params.scalar) {}
 
 void ElementUnary::map_output_tensors(FFModel &ff) {
@@ -557,7 +557,7 @@ void ElementUnary::forward_task_with_type(
     assert(task->index_point.get_dim() == 1);
     int shard_id = task->index_point.point_data[0];
     std::vector<GenericTensorAccessorR> input_accessors;
-    std::vector<GenericTensorAccessorW> output_accessors;
+    std::vector<GenericTensorAccessorR> output_accessors;
     if (m->inplace) {
       GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
           m->data_type, regions[0], task->regions[0], FID_DATA, ctx, runtime);
@@ -723,6 +723,8 @@ void ElementUnary::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->layer_guid.transformer_layer_id);
   sez.serialize(this->layer_guid.model_id);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 bool ElementUnary::measure_operator_cost(Simulator *sim,
@@ -837,6 +839,10 @@ Node ElementUnary::deserialize(FFModel &ff,
   dez.deserialize(id);
   dez.deserialize(transformer_layer_id);
   dez.deserialize(deserialized_model_id);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
   LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
 
   ElementUnaryParams params;
@@ -844,6 +850,7 @@ Node ElementUnary::deserialize(FFModel &ff,
   params.inplace = inplace;
   params.scalar = scalar;
   params.layer_guid = layer_guid;
+  strcpy(params.name, name);
   return ff.get_or_create_node<ElementUnary>(inputs[0], params);
 }
 
diff --git a/src/ops/embedding.cc b/src/ops/embedding.cc
index 40d5b600be..e630563b63 100644
--- a/src/ops/embedding.cc
+++ b/src/ops/embedding.cc
@@ -243,7 +243,7 @@ Embedding::Embedding(FFModel &model,
                 params.aggr,
                 allocate_weights,
                 params.data_type,
-                name) {}
+                params.name) {}
 
 Embedding::Embedding(FFModel &model,
                      Embedding const &other,
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index 6a7d622e51..8c66f9c7bc 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -260,7 +260,7 @@ Experts::Experts(FFModel &model,
               params.use_bias,
               params.activation,
               allocate_weights,
-              name) {}
+              params.name) {}
 
 Experts::Experts(FFModel &model,
                  LayerID const &_layer_guid,
@@ -407,6 +407,8 @@ void Experts::serialize(Legion::Serializer &sez) const {
   sez.serialize(params.experts_internal_dim_size);
   sez.serialize(params.use_bias);
   sez.serialize(params.activation);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 using PCG::Node;
@@ -432,6 +434,10 @@ Node Experts::deserialize(FFModel &ff,
   dez.deserialize(experts_internal_dim_size);
   dez.deserialize(use_bias);
   dez.deserialize(activation);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
 
   assert(num_inputs == 3);
 
@@ -445,6 +451,7 @@ Node Experts::deserialize(FFModel &ff,
   params.experts_internal_dim_size = experts_internal_dim_size;
   params.use_bias = use_bias;
   params.activation = activation;
+  strcpy(params.name, name);
 
   return ff.get_or_create_node<Experts>(inputs, params);
 }
diff --git a/src/ops/flat.cc b/src/ops/flat.cc
index 669c457709..80aedbbb31 100644
--- a/src/ops/flat.cc
+++ b/src/ops/flat.cc
@@ -16,6 +16,7 @@
 #include "flexflow/ops/flat.h"
 #include "flexflow/model.h"
 #include "flexflow/ops/kernels/flat_kernels.h"
+#include "legion/legion_utilities.h"
 
 namespace FlexFlow {
 
@@ -317,6 +318,8 @@ Domain Flat::get_input_tensor_shape(ParallelConfig const &pc,
 }
 
 void Flat::serialize(Legion::Serializer &sez) const {
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
   return;
 }
 
@@ -391,6 +394,10 @@ Node Flat::deserialize(FFModel &ff,
                        ParallelTensor inputs[],
                        int num_inputs) {
   assert(num_inputs == 1);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
   return ff.get_or_create_node<Flat>(inputs[0], {});
 }
 
diff --git a/src/ops/fused.cu b/src/ops/fused.cu
index c6ba0b04c5..483028599e 100644
--- a/src/ops/fused.cu
+++ b/src/ops/fused.cu
@@ -537,7 +537,7 @@ __host__ void
                             Context ctx,
                             Runtime *runtime) {
   // const FusedOp* fused = (FusedOp*) task->args;
-  FusedOpMeta const *metas = *((FusedOpMeta **)task->local_args);
+  FusedOpMeta *metas = *((FusedOpMeta **)task->local_args);
   FusedOp const *fused = metas->fused_op;
   // BatchConfig const *bc = (BatchConfig *)task->args;
   BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
@@ -1097,7 +1097,7 @@ __host__ void
     if (metas->meta[op]->inference_debugging) {
       std::vector<GenericTensorAccessorR> input_accessors_to_save;
       std::vector<GenericTensorAccessorR> weight_accessors_to_save;
-      std::vector<GenericTensorAccessorW> output_accessors_to_save;
+      std::vector<GenericTensorAccessorR> output_accessors_to_save;
       for (int i = 0; i < fused->op_num_inputs[op]; i++) {
         int my_off = fused->op_input_idx[i + ioff];
         if (fused->op_input_source[i + ioff] == SOURCE_INPUT) {
@@ -1114,8 +1114,7 @@ __host__ void
             weight_accessor[fused->op_weight_idx[i + woff]]);
       }
       for (int i = 0; i < fused->op_num_outputs[op]; i++) {
-        int my_off = fused->op_output_idx[i + ooff];
-        output_accessors_to_save.push_back(output_accessor[my_off]);
+        output_accessors_to_save.push_back(output_accessor[i + ooff]);
       }
       assert(task->index_point.get_dim() == 1);
       int shard_id = task->index_point.point_data[0];
diff --git a/src/ops/gather.cc b/src/ops/gather.cc
index d7c1dee44c..85580ed803 100644
--- a/src/ops/gather.cc
+++ b/src/ops/gather.cc
@@ -125,7 +125,7 @@ Gather::Gather(FFModel &model,
              inputs.first,
              inputs.second,
              params.legion_dim,
-             name) {}
+             params.name) {}
 
 Gather::Gather(FFModel &model,
                LayerID const &_layer_guid,
@@ -168,6 +168,8 @@ void Gather::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->layer_guid.transformer_layer_id);
   sez.serialize(this->layer_guid.model_id);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 using PCG::Node;
@@ -183,11 +185,16 @@ Node Gather::deserialize(FFModel &ff,
   dez.deserialize(id);
   dez.deserialize(transformer_layer_id);
   dez.deserialize(deserialized_model_id);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
   LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
 
   GatherParams params;
   params.legion_dim = legion_dim;
   params.layer_guid = layer_guid;
+  strcpy(params.name, name);
   return ff.get_or_create_node<Gather>({inputs[0], inputs[1]}, params);
 }
 
diff --git a/src/ops/group_by.cc b/src/ops/group_by.cc
index 50871983f5..f2f402737c 100644
--- a/src/ops/group_by.cc
+++ b/src/ops/group_by.cc
@@ -99,6 +99,9 @@ Group_byParams Group_by::get_params() const {
   Group_byParams params;
   params.n = this->n;
   params.alpha = this->alpha;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
@@ -161,8 +164,12 @@ Group_by::Group_by(FFModel &model,
                    Group_byParams const &params,
                    std::pair<ParallelTensor, ParallelTensor> const &inputs,
                    char const *name)
-    : Group_by(
-          model, inputs.first, inputs.second, params.n, params.alpha, name) {}
+    : Group_by(model,
+               inputs.first,
+               inputs.second,
+               params.n,
+               params.alpha,
+               params.name) {}
 
 void Group_by::init_inference(FFModel const &ff,
                               std::vector<ParallelTensor> const &batch_inputs,
@@ -396,7 +403,7 @@ void Group_by::forward_task(Task const *task,
   // Create a vector of n outputs, where n is the number of experts.
   // Each entry in the "outputs" vector points to the Legion tensor that will
   // contain the tockens dispatched to the corresponding expert
-  std::vector<GenericTensorAccessorW> output_accessors;
+  std::vector<GenericTensorAccessorR> output_accessors;
   float *outputs[n];
   for (int i = 0; i < n; i++) {
     GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
@@ -522,6 +529,8 @@ void Group_by::backward_task(Task const *task,
 void Group_by::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->n);
   sez.serialize(this->alpha);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 Node Group_by::deserialize(FFModel &ff,
@@ -533,9 +542,14 @@ Node Group_by::deserialize(FFModel &ff,
   float alpha;
   dez.deserialize(n);
   dez.deserialize(alpha);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
   Group_byParams params;
   params.n = n;
   params.alpha = alpha;
+  strcpy(params.name, name);
   return ff.get_or_create_node<Group_by>(std::make_pair(inputs[0], inputs[1]),
                                          params);
 }
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index 8a3e9c96b1..7aa3503770 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -565,7 +565,7 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
                                 params.quantization_type,
                                 params.offload,
                                 params.tensor_parallelism_degree,
-                                name) {}
+                                params.name) {}
 
 void IncMultiHeadSelfAttention::init_inference(
     FFModel const &ff,
@@ -929,6 +929,9 @@ IncMultiHeadSelfAttentionParams IncMultiHeadSelfAttention::get_params() const {
   params.quantization_type = this->quantization_type;
   params.offload = this->offload;
   params.num_kv_heads = this->num_kv_heads;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
 
   return params;
 }
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index bc1358e49c..2218ffe392 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -56,6 +56,9 @@ LayerNormParams LayerNorm::get_params() const {
   params.elementwise_affine = this->elementwise_affine;
   params.eps = this->eps;
   params.use_bias = this->use_bias;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
@@ -198,7 +201,7 @@ LayerNorm::LayerNorm(FFModel &model,
                 params.use_bias,
                 params.eps,
                 allocate_weights,
-                name) {}
+                params.name) {}
 
 LayerNorm::LayerNorm(FFModel &model,
                      LayerID const &_layer_guid,
@@ -883,6 +886,8 @@ void LayerNorm::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->elementwise_affine);
   sez.serialize(this->eps);
   sez.serialize(this->use_bias);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 using PCG::Node;
@@ -911,6 +916,10 @@ Node LayerNorm::deserialize(FFModel &ff,
   dez.deserialize(elementwise_affine);
   dez.deserialize(eps);
   dez.deserialize(use_bias);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
 
   LayerNormParams params;
   params.layer_guid = layer_guid;
@@ -918,6 +927,7 @@ Node LayerNorm::deserialize(FFModel &ff,
   params.elementwise_affine = elementwise_affine;
   params.eps = eps;
   params.use_bias = use_bias;
+  strcpy(params.name, name);
   return ff.get_or_create_node<LayerNorm>(inputs[0], params);
 }
 
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index 6ca6038778..03c9e48af8 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -190,7 +190,7 @@ Linear::Linear(FFModel &model,
              params.quantization_type,
              params.offload,
              allocate_weights,
-             name) {}
+             params.name) {}
 
 Linear::Linear(FFModel &model,
                LayerID const &_layer_guid,
@@ -1258,6 +1258,8 @@ void Linear::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->data_type);
   sez.serialize(this->quantization_type);
   sez.serialize(this->offload);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 /* static */
@@ -1288,6 +1290,10 @@ Node Linear::deserialize(FFModel &ff,
   dez.deserialize(data_type);
   dez.deserialize(quantization_type);
   dez.deserialize(offload);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
 
   LinearParams params;
   params.activation = activation;
@@ -1299,6 +1305,7 @@ Node Linear::deserialize(FFModel &ff,
   params.layer_guid = layer_guid;
   params.quantization_type = quantization_type;
   params.offload = offload;
+  strcpy(params.name, name);
   return ff.get_or_create_node<Linear>(inputs[0], params);
 }
 
@@ -1313,6 +1320,9 @@ LinearParams Linear::get_params() const {
   params.kernel_reg_lambda = this->kernel_reg_lambda;
   params.quantization_type = this->quantization_type;
   params.offload = this->offload;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
 
   return params;
 }
diff --git a/src/ops/pool_2d.cc b/src/ops/pool_2d.cc
index e358448ddf..4621ab5909 100644
--- a/src/ops/pool_2d.cc
+++ b/src/ops/pool_2d.cc
@@ -269,7 +269,7 @@ Pool2D::Pool2D(FFModel &model,
              params.padding_w,
              params.pool_type,
              params.activation,
-             name) {}
+             params.name) {}
 
 void Pool2D::init(FFModel const &ff) {
   assert(check_output_input_weight_same_parallel_is());
@@ -521,6 +521,8 @@ void Pool2D::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->padding_w);
   sez.serialize(this->pool_type);
   sez.serialize(this->activation);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 bool Pool2D::measure_operator_cost(Simulator *sim,
@@ -657,6 +659,10 @@ Node Pool2D::deserialize(FFModel &ff,
   dez.deserialize(padding_w);
   dez.deserialize(pool_type);
   dez.deserialize(activation);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
 
   Pool2DParams params;
   params.kernel_h = kernel_h;
@@ -667,6 +673,7 @@ Node Pool2D::deserialize(FFModel &ff,
   params.padding_w = padding_w;
   params.pool_type = pool_type;
   params.activation = activation;
+  strcpy(params.name, name);
 
   return ff.get_or_create_node<Pool2D>(inputs[0], params);
 }
diff --git a/src/ops/reduce.cc b/src/ops/reduce.cc
index 7a443e6ad0..454a35caf4 100644
--- a/src/ops/reduce.cc
+++ b/src/ops/reduce.cc
@@ -41,6 +41,9 @@ ReduceParams Reduce::get_params() const {
   }
   params.keepdims = keepdims;
   params.layer_guid = this->layer_guid;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
@@ -110,9 +113,12 @@ Reduce::Reduce(FFModel &model,
                ReduceParams const &params,
                const ParallelTensor input,
                char const *name)
-    : Reduce(
-          model, params.layer_guid, input, params.axes, params.keepdims, name) {
-}
+    : Reduce(model,
+             params.layer_guid,
+             input,
+             params.axes,
+             params.keepdims,
+             params.name) {}
 
 Reduce::Reduce(FFModel &model,
                LayerID const &_layer_guid,
@@ -378,6 +384,8 @@ void Reduce::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->layer_guid.transformer_layer_id);
   sez.serialize(this->layer_guid.model_id);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 using PCG::Node;
@@ -400,6 +408,10 @@ Node Reduce::deserialize(FFModel &ff,
   dez.deserialize(id);
   dez.deserialize(transformer_layer_id);
   dez.deserialize(deserialized_model_id);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
   LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
 
   return ff.get_or_create_node<Reduce>(inputs[0], {axes, keepdims, layer_guid});
diff --git a/src/ops/reshape.cc b/src/ops/reshape.cc
index 45da190680..49f99e2cb5 100644
--- a/src/ops/reshape.cc
+++ b/src/ops/reshape.cc
@@ -140,7 +140,7 @@ Reshape::Reshape(FFModel &model,
                  ReshapeParams const &params,
                  const ParallelTensor input,
                  char const *name)
-    : Reshape(model, params.layer_guid, input, params.shape, name) {}
+    : Reshape(model, params.layer_guid, input, params.shape, params.name) {}
 
 void Reshape::init(FFModel const &ff) {
   assert(check_output_input_weight_same_parallel_is());
@@ -296,6 +296,9 @@ ReshapeParams Reshape::get_params() const {
   ReshapeParams params;
   params.shape = shape_vec;
   params.layer_guid = this->layer_guid;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
@@ -414,6 +417,8 @@ void Reshape::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->layer_guid.transformer_layer_id);
   sez.serialize(this->layer_guid.model_id);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 using PCG::Node;
@@ -435,11 +440,16 @@ Node Reshape::deserialize(FFModel &ff,
   dez.deserialize(id);
   dez.deserialize(transformer_layer_id);
   dez.deserialize(deserialized_model_id);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
   LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
 
   ReshapeParams params;
   params.shape = shape;
   params.layer_guid = layer_guid;
+  strcpy(params.name, name);
   return ff.get_or_create_node<Reshape>(inputs[0], params);
 }
 
diff --git a/src/ops/residual_layer_norm.cc b/src/ops/residual_layer_norm.cc
index 7de40fb389..ed9252c309 100644
--- a/src/ops/residual_layer_norm.cc
+++ b/src/ops/residual_layer_norm.cc
@@ -63,6 +63,9 @@ ResidualLayerNormParams ResidualLayerNorm::get_params() const {
   params.eps = this->eps;
   params.use_bias = this->use_bias;
   params.use_two_residuals = this->use_two_residuals;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
@@ -228,7 +231,7 @@ ResidualLayerNorm::ResidualLayerNorm(
                         params.use_bias,
                         params.eps,
                         allocate_weights,
-                        name) {}
+                        params.name) {}
 
 ResidualLayerNorm::ResidualLayerNorm(FFModel &model,
                                      LayerID const &_layer_guid,
@@ -779,6 +782,8 @@ void ResidualLayerNorm::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->eps);
   sez.serialize(this->use_bias);
   sez.serialize(this->use_two_residuals);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 using PCG::Node;
@@ -808,6 +813,10 @@ Node ResidualLayerNorm::deserialize(FFModel &ff,
   dez.deserialize(eps);
   dez.deserialize(use_bias);
   dez.deserialize(use_two_residuals);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
   if (use_two_residuals) {
     assert(num_inputs == 3);
   } else {
@@ -821,6 +830,7 @@ Node ResidualLayerNorm::deserialize(FFModel &ff,
   params.eps = eps;
   params.use_bias = use_bias;
   params.use_two_residuals = use_two_residuals;
+  strcpy(params.name, name);
   if (use_two_residuals) {
     return ff.get_or_create_node<ResidualLayerNorm>(
         {inputs[0], inputs[1], inputs[2]}, params);
diff --git a/src/ops/residual_rms_norm.cc b/src/ops/residual_rms_norm.cc
index b447a2a3b5..f4f5bb72d0 100644
--- a/src/ops/residual_rms_norm.cc
+++ b/src/ops/residual_rms_norm.cc
@@ -55,6 +55,9 @@ ResidualRMSNormParams ResidualRMSNorm::get_params() const {
   params.layer_guid = this->layer_guid;
   params.eps = this->eps;
   params.dim = this->dim;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
@@ -141,7 +144,7 @@ ResidualRMSNorm::ResidualRMSNorm(
                       params.eps,
                       params.dim,
                       allocate_weights,
-                      name) {}
+                      params.name) {}
 
 ResidualRMSNorm::ResidualRMSNorm(
     FFModel &model,
@@ -459,6 +462,8 @@ void ResidualRMSNorm::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.model_id);
   sez.serialize(this->eps);
   sez.serialize(this->dim);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 using PCG::Node;
@@ -477,10 +482,15 @@ Node ResidualRMSNorm::deserialize(FFModel &ff,
   LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
   dez.deserialize(eps);
   dez.deserialize(dim);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
   ResidualRMSNormParams params;
   params.layer_guid = layer_guid;
   params.eps = eps;
   params.dim = dim;
+  strcpy(params.name, name);
   return ff.get_or_create_node<ResidualRMSNorm>({inputs[0], inputs[1]}, params);
 }
 
diff --git a/src/ops/rms_norm.cc b/src/ops/rms_norm.cc
index 2a34f83be2..bf07ee6bb0 100644
--- a/src/ops/rms_norm.cc
+++ b/src/ops/rms_norm.cc
@@ -53,6 +53,9 @@ RMSNormParams RMSNorm::get_params() const {
   params.layer_guid = this->layer_guid;
   params.eps = this->eps;
   params.dim = this->dim;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
@@ -129,7 +132,7 @@ RMSNorm::RMSNorm(FFModel &model,
               params.eps,
               params.dim,
               allocate_weights,
-              name) {}
+              params.name) {}
 
 RMSNorm::RMSNorm(FFModel &model,
                  RMSNorm const &other,
@@ -437,6 +440,8 @@ void RMSNorm::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.model_id);
   sez.serialize(this->eps);
   sez.serialize(this->dim);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 using PCG::Node;
@@ -456,10 +461,15 @@ Node RMSNorm::deserialize(FFModel &ff,
   LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
   dez.deserialize(eps);
   dez.deserialize(dim);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
   RMSNormParams params;
   params.layer_guid = layer_guid;
   params.eps = eps;
   params.dim = dim;
+  strcpy(params.name, name);
   return ff.get_or_create_node<RMSNorm>(inputs[0], params);
 }
 
diff --git a/src/ops/sampling.cc b/src/ops/sampling.cc
index 463b15aadb..9fc2316f9a 100644
--- a/src/ops/sampling.cc
+++ b/src/ops/sampling.cc
@@ -88,6 +88,9 @@ Op *Sampling::create_operator_from_layer(
 SamplingParams Sampling::get_params() const {
   SamplingParams params;
   params.top_p = this->top_p;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
@@ -136,7 +139,7 @@ Sampling::Sampling(FFModel &model,
                    SamplingParams const &params,
                    const ParallelTensor input,
                    char const *name)
-    : Sampling(model, input, params.top_p, name) {}
+    : Sampling(model, input, params.top_p, params.name) {}
 
 void Sampling::init_inference(FFModel const &ff,
                               std::vector<ParallelTensor> const &batch_inputs,
@@ -325,6 +328,8 @@ void Sampling::backward(FFModel const &ff) {
 
 void Sampling::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->top_p);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 Node Sampling::deserialize(FFModel &ff,
@@ -334,8 +339,13 @@ Node Sampling::deserialize(FFModel &ff,
   assert(num_inputs == 1);
   float top_p;
   dez.deserialize(top_p);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
   SamplingParams params;
   params.top_p = top_p;
+  strcpy(params.name, name);
   return ff.get_or_create_node<Sampling>(inputs[0], params);
 }
 
diff --git a/src/ops/sigmoid_silu_multi.cc b/src/ops/sigmoid_silu_multi.cc
index 3b2ed7cef4..3ddd6b8d6e 100644
--- a/src/ops/sigmoid_silu_multi.cc
+++ b/src/ops/sigmoid_silu_multi.cc
@@ -52,6 +52,9 @@ bool SigmoidSiluMultiParams::is_valid(
 SigmoidSiluMultiParams SigmoidSiluMulti::get_params() const {
   SigmoidSiluMultiParams params;
   params.layer_guid = this->layer_guid;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
@@ -110,7 +113,7 @@ SigmoidSiluMulti::SigmoidSiluMulti(
     std::pair<ParallelTensor, ParallelTensor> const &inputs,
     char const *name)
     : SigmoidSiluMulti(
-          model, params.layer_guid, inputs.first, inputs.second, name) {}
+          model, params.layer_guid, inputs.first, inputs.second, params.name) {}
 
 SigmoidSiluMulti::SigmoidSiluMulti(FFModel &model,
                                    LayerID const &_layer_guid,
@@ -366,6 +369,8 @@ void SigmoidSiluMulti::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->layer_guid.transformer_layer_id);
   sez.serialize(this->layer_guid.model_id);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 using PCG::Node;
@@ -379,10 +384,15 @@ Node SigmoidSiluMulti::deserialize(FFModel &ff,
   dez.deserialize(id);
   dez.deserialize(transformer_layer_id);
   dez.deserialize(deserialized_model_id);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
   LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
 
   SigmoidSiluMultiParams params;
   params.layer_guid = layer_guid;
+  strcpy(params.name, name);
   return ff.get_or_create_node<SigmoidSiluMulti>({inputs[0], inputs[1]},
                                                  params);
 }
diff --git a/src/ops/softmax.cc b/src/ops/softmax.cc
index ba0a1288d6..03618423be 100644
--- a/src/ops/softmax.cc
+++ b/src/ops/softmax.cc
@@ -17,6 +17,7 @@
 #include "flexflow/model.h"
 #include "flexflow/ops/kernels/softmax_kernels.h"
 #include "flexflow/utils/hash_utils.h"
+#include "legion/legion_utilities.h"
 
 namespace FlexFlow {
 // declare Legion names
@@ -39,7 +40,42 @@ using namespace FlexFlow::Kernels::Softmax;
 
 /* Params */
 bool operator==(SoftmaxParams const &lhs, SoftmaxParams const &rhs) {
-  return lhs.dim == rhs.dim;
+  return lhs.layer_guid == rhs.layer_guid && lhs.dim == rhs.dim;
+}
+
+void Softmax::serialize(Legion::Serializer &sez) const {
+  sez.serialize(this->layer_guid.id);
+  sez.serialize(this->layer_guid.transformer_layer_id);
+  sez.serialize(this->layer_guid.model_id);
+  sez.serialize(this->dim);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
+}
+
+using PCG::Node;
+/*static*/
+Node Softmax::deserialize(FFModel &ff,
+                          Legion::Deserializer &dez,
+                          ParallelTensor inputs[],
+                          int num_inputs) {
+  assert(num_inputs == 1);
+  size_t id, transformer_layer_id, deserialized_model_id;
+  dez.deserialize(id);
+  dez.deserialize(transformer_layer_id);
+  dez.deserialize(deserialized_model_id);
+  LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
+  int dim;
+  dez.deserialize(dim);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
+
+  SoftmaxParams params;
+  params.layer_guid = layer_guid;
+  params.dim = dim;
+  strcpy(params.name, name);
+  return ff.get_or_create_node<Softmax>(inputs[0], params);
 }
 
 bool SoftmaxParams::is_valid(ParallelTensorShape const &input) const {
@@ -48,7 +84,11 @@ bool SoftmaxParams::is_valid(ParallelTensorShape const &input) const {
 
 SoftmaxParams Softmax::get_params() const {
   SoftmaxParams params;
+  params.layer_guid = this->layer_guid;
   params.dim = this->dim;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
@@ -87,12 +127,14 @@ Op *Softmax::create_operator_from_layer(
   layer->get_int_property("softmax_dim", value);
   int dim = (int)value;
   return new Softmax(model,
+                     layer->layer_guid,
                      inputs[0],
                      (inputs[0]->num_dims - 1 - dim) % inputs[0]->num_dims,
                      layer->name);
 }
 
 Softmax::Softmax(FFModel &model,
+                 LayerID const &_layer_guid,
                  const ParallelTensor _input,
                  int _dim,
                  char const *name)
@@ -107,6 +149,7 @@ Softmax::Softmax(FFModel &model,
       dim(_dim) {
   // Currently assume we always perform softmax along the inner most dim
   assert(dim == 0);
+  layer_guid = _layer_guid;
   ParallelDim dims[MAX_TENSOR_DIM];
   int numdim = _input->num_dims;
   for (int i = 0; i < numdim; i++) {
@@ -119,7 +162,7 @@ Softmax::Softmax(FFModel &model,
                  SoftmaxParams const &params,
                  const ParallelTensor input,
                  char const *name)
-    : Softmax(model, input, params.dim, name) {}
+    : Softmax(model, params.layer_guid, input, params.dim, params.name) {}
 
 void Softmax::init_inference(FFModel const &ff,
                              std::vector<ParallelTensor> const &batch_inputs,
@@ -518,6 +561,7 @@ namespace std {
 size_t hash<FlexFlow::SoftmaxParams>::operator()(
     FlexFlow::SoftmaxParams const &params) const {
   size_t key = 0;
+  hash_combine(key, params.layer_guid.id);
   hash_combine(key, params.dim);
   return key;
 }
diff --git a/src/ops/spec_inc_multihead_self_attention.cc b/src/ops/spec_inc_multihead_self_attention.cc
index 5d234df822..9c6ed0e0b6 100644
--- a/src/ops/spec_inc_multihead_self_attention.cc
+++ b/src/ops/spec_inc_multihead_self_attention.cc
@@ -511,7 +511,7 @@ SpecIncMultiHeadSelfAttention::SpecIncMultiHeadSelfAttention(
                                     params.qk_prod_scaling,
                                     params.position_bias,
                                     allocate_weights,
-                                    name) {}
+                                    params.name) {}
 
 void SpecIncMultiHeadSelfAttention::init_inference(
     FFModel const &ff,
@@ -853,6 +853,9 @@ SpecIncMultiHeadSelfAttentionParams
   params.scaling_factor = this->scaling_factor;
   params.qk_prod_scaling = this->qk_prod_scaling;
   params.position_bias = this->position_bias;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
 
   return params;
 }
diff --git a/src/ops/split.cc b/src/ops/split.cc
index 9298850a99..7c6b631b20 100644
--- a/src/ops/split.cc
+++ b/src/ops/split.cc
@@ -50,6 +50,9 @@ SplitParams Split::get_params() const {
   SplitParams params;
   params.splits = this->splits;
   params.legion_axis = this->legion_axis;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
@@ -137,7 +140,7 @@ Split::Split(FFModel &model,
              SplitParams const &params,
              const ParallelTensor input,
              char const *name)
-    : Split(model, input, params.splits, params.legion_axis, name) {}
+    : Split(model, input, params.splits, params.legion_axis, params.name) {}
 
 void Split::init(FFModel const &ff) {
   assert(check_output_input_weight_same_parallel_is());
diff --git a/src/ops/topk.cc b/src/ops/topk.cc
index b38ff85f90..7d30a8aff3 100644
--- a/src/ops/topk.cc
+++ b/src/ops/topk.cc
@@ -87,6 +87,9 @@ TopKParams TopK::get_params() const {
   TopKParams params;
   params.k = this->k;
   params.sorted = this->sorted;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
@@ -134,7 +137,7 @@ TopK::TopK(FFModel &model,
            TopKParams const &params,
            const ParallelTensor input,
            char const *name)
-    : TopK(model, input, params.k, params.sorted, name) {}
+    : TopK(model, input, params.k, params.sorted, params.name) {}
 
 void TopK::init_inference(FFModel const &ff,
                           std::vector<ParallelTensor> const &batch_inputs,
@@ -426,6 +429,8 @@ void TopK::backward_task(Task const *task,
 void TopK::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->k);
   sez.serialize(this->sorted);
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 Node TopK::deserialize(FFModel &ff,
@@ -437,9 +442,14 @@ Node TopK::deserialize(FFModel &ff,
   bool sorted;
   dez.deserialize(k);
   dez.deserialize(sorted);
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
   TopKParams params;
   params.k = k;
   params.sorted = sorted;
+  strcpy(params.name, name);
   return ff.get_or_create_node<TopK>(inputs[0], params);
 }
 
diff --git a/src/ops/transpose.cc b/src/ops/transpose.cc
index 500b7867af..7a179c4f7d 100644
--- a/src/ops/transpose.cc
+++ b/src/ops/transpose.cc
@@ -51,6 +51,9 @@ TransposeParams Transpose::get_params() const {
   for (int i = 0; i < outputs[0]->num_dims; i++) {
     params.perm.push_back(this->perm[i]);
   }
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
@@ -98,7 +101,7 @@ Transpose::Transpose(FFModel &model,
                      TransposeParams const &params,
                      const ParallelTensor input,
                      char const *name)
-    : Transpose(model, input, params.perm, name) {}
+    : Transpose(model, input, params.perm, params.name) {}
 
 Transpose::Transpose(FFModel &model,
                      const ParallelTensor input,
@@ -383,6 +386,8 @@ void Transpose::serialize(Legion::Serializer &sez) const {
   for (size_t i = 0; i < params.perm.size(); i++) {
     sez.serialize(params.perm[i]);
   }
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
 }
 
 using PCG::Node;
@@ -399,6 +404,10 @@ Node Transpose::deserialize(FFModel &ff,
     dez.deserialize(dim_idx);
     perm.push_back(dim_idx);
   }
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
   return ff.get_or_create_node<Transpose>(inputs[0], {perm});
 }
 
diff --git a/src/ops/tree_inc_multihead_self_attention.cc b/src/ops/tree_inc_multihead_self_attention.cc
index d5a8a1063d..d0efb01d54 100644
--- a/src/ops/tree_inc_multihead_self_attention.cc
+++ b/src/ops/tree_inc_multihead_self_attention.cc
@@ -562,7 +562,7 @@ TreeIncMultiHeadSelfAttention::TreeIncMultiHeadSelfAttention(
                                     params.quantization_type,
                                     params.offload,
                                     params.tensor_parallelism_degree,
-                                    name) {}
+                                    params.name) {}
 
 void TreeIncMultiHeadSelfAttention::init_inference(
     FFModel const &ff,
@@ -927,6 +927,9 @@ TreeIncMultiHeadSelfAttentionParams
   params.qk_prod_scaling = this->qk_prod_scaling;
   params.position_bias = this->position_bias;
   params.tensor_parallelism_degree = this->tensor_parallelism_degree;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
diff --git a/src/parallel_ops/allreduce.cc b/src/parallel_ops/allreduce.cc
index 027d15c929..5d38e28903 100644
--- a/src/parallel_ops/allreduce.cc
+++ b/src/parallel_ops/allreduce.cc
@@ -55,6 +55,9 @@ bool AllReduceParams::is_valid(ParallelTensorShape const &input) const {
 AllReduceParams AllReduce::get_params() const {
   AllReduceParams params;
   params.allreduce_legion_dim = this->allreduce_dim;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
@@ -79,7 +82,7 @@ AllReduce::AllReduce(FFModel &model,
                      AllReduceParams const &params,
                      ParallelTensor const input,
                      char const *name)
-    : AllReduce(model, input, params.allreduce_legion_dim, name) {}
+    : AllReduce(model, input, params.allreduce_legion_dim, params.name) {}
 
 void AllReduce::create_input_partition(FFModel &ff) {
   // Do nothing
diff --git a/src/parallel_ops/combine.cc b/src/parallel_ops/combine.cc
index 7c266c5392..acc5c414c7 100644
--- a/src/parallel_ops/combine.cc
+++ b/src/parallel_ops/combine.cc
@@ -58,6 +58,9 @@ CombineParams Combine::get_params() const {
   CombineParams params;
   params.combine_legion_dim = this->combine_dim;
   params.combine_degree = this->combine_degree;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
@@ -69,7 +72,7 @@ Combine::Combine(FFModel &model,
               input,
               params.combine_legion_dim,
               params.combine_degree,
-              name) {}
+              params.name) {}
 
 Combine::Combine(FFModel &model,
                  const ParallelTensor _input,
diff --git a/src/parallel_ops/fused_parallel_op.cc b/src/parallel_ops/fused_parallel_op.cc
index c0a97bdda1..1a76cbfc40 100644
--- a/src/parallel_ops/fused_parallel_op.cc
+++ b/src/parallel_ops/fused_parallel_op.cc
@@ -59,6 +59,9 @@ FusedParallelOpParams FusedParallelOp::get_params() const {
   std::vector<ParallelOpInfo> ops(std::begin(this->parallel_ops),
                                   std::end(this->parallel_ops));
   params.parallel_ops = ops;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
diff --git a/src/parallel_ops/partition.cc b/src/parallel_ops/partition.cc
index 353b3ce398..e6ab09d088 100644
--- a/src/parallel_ops/partition.cc
+++ b/src/parallel_ops/partition.cc
@@ -60,6 +60,9 @@ RepartitionParams Repartition::get_params() const {
   RepartitionParams params;
   params.repartition_legion_dim = this->repartition_dim;
   params.repartition_degree = this->repartition_degree;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
@@ -92,7 +95,7 @@ Repartition::Repartition(FFModel &model,
                   input,
                   params.repartition_legion_dim,
                   params.repartition_degree,
-                  name) {}
+                  params.name) {}
 
 OpMeta *Repartition::init_task(Task const *task,
                                std::vector<PhysicalRegion> const &regions,
diff --git a/src/parallel_ops/reduction.cc b/src/parallel_ops/reduction.cc
index 5dca591328..5ca2b1301c 100644
--- a/src/parallel_ops/reduction.cc
+++ b/src/parallel_ops/reduction.cc
@@ -56,6 +56,9 @@ ReductionParams Reduction::get_params() const {
   ReductionParams params;
   params.reduction_legion_dim = this->reduction_dim;
   params.reduction_degree = this->reduction_degree;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
@@ -89,7 +92,7 @@ Reduction::Reduction(FFModel &model,
                 input,
                 params.reduction_legion_dim,
                 params.reduction_degree,
-                name) {}
+                params.name) {}
 
 void Reduction::create_input_partition(FFModel &ff) {
   assert(outputs[0]->part != LogicalPartition::NO_PART);
diff --git a/src/parallel_ops/replicate.cc b/src/parallel_ops/replicate.cc
index 20face74e8..ba7bb6677f 100644
--- a/src/parallel_ops/replicate.cc
+++ b/src/parallel_ops/replicate.cc
@@ -55,6 +55,9 @@ ReplicateParams Replicate::get_params() const {
   ReplicateParams params;
   params.replicate_legion_dim = this->replicate_dim;
   params.replicate_degree = this->replicate_degree;
+  if (this->name != nullptr) {
+    strcpy(params.name, this->name);
+  }
   return params;
 }
 
@@ -88,7 +91,7 @@ Replicate::Replicate(FFModel &model,
                 input,
                 params.replicate_legion_dim,
                 params.replicate_degree,
-                name) {}
+                params.name) {}
 
 void Replicate::create_input_partition(FFModel &ff) {
   assert(outputs[0]->part != LogicalPartition::NO_PART);
diff --git a/src/runtime/cuda_helper.cu b/src/runtime/cuda_helper.cu
index fa6bf55fe5..57bc5a0458 100644
--- a/src/runtime/cuda_helper.cu
+++ b/src/runtime/cuda_helper.cu
@@ -287,7 +287,11 @@ __host__ void
   tensor_file = fopen(file_name, "w");
   assert(tensor_file != NULL);
   for (unsigned i = 0; i < num_elements; i++) {
-    fprintf(tensor_file, "%.9f, ", host_ptr[i]);
+    if (i < num_elements - 1) {
+      fprintf(tensor_file, "%.9f, ", host_ptr[i]);
+    } else {
+      fprintf(tensor_file, "%.9f", host_ptr[i]);
+    }
   }
 
   fclose(tensor_file);
@@ -313,7 +317,11 @@ __host__ void
   tensor_file = fopen(file_name, "w");
   assert(tensor_file != NULL);
   for (unsigned i = 0; i < num_elements; i++) {
-    fprintf(tensor_file, "%.9f, ", (float)host_ptr[i]);
+    if (i < num_elements - 1) {
+      fprintf(tensor_file, "%.9f, ", (float)host_ptr[i]);
+    } else {
+      fprintf(tensor_file, "%.9f", (float)host_ptr[i]);
+    }
   }
 
   fclose(tensor_file);
@@ -340,7 +348,11 @@ __host__ void save_tensor(int32_t const *ptr,
   tensor_file = fopen(file_name, "w");
   assert(tensor_file != NULL);
   for (unsigned i = 0; i < num_elements; i++) {
-    fprintf(tensor_file, "%d, ", host_ptr[i]);
+    if (i < num_elements - 1) {
+      fprintf(tensor_file, "%d, ", host_ptr[i]);
+    } else {
+      fprintf(tensor_file, "%d", host_ptr[i]);
+    }
   }
 
   fclose(tensor_file);
@@ -367,7 +379,11 @@ __host__ void save_tensor(int64_t const *ptr,
   tensor_file = fopen(file_name, "w");
   assert(tensor_file != NULL);
   for (unsigned i = 0; i < num_elements; i++) {
-    fprintf(tensor_file, "%ld, ", host_ptr[i]);
+    if (i < num_elements - 1) {
+      fprintf(tensor_file, "%ld, ", host_ptr[i]);
+    } else {
+      fprintf(tensor_file, "%ld", host_ptr[i]);
+    }
   }
 
   fclose(tensor_file);
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index 6d33dd9f27..f8e8240ccf 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -2276,6 +2276,8 @@ GraphOptimalViewSerialized
       case OP_CONCAT: {
         Concat *concat = (Concat *)op;
         sez.serialize(concat->legion_axis);
+        sez.serialize(strlen(concat->name));
+        sez.serialize(concat->name, strlen(concat->name));
         break;
       }
       case OP_SPLIT: {
@@ -2285,6 +2287,8 @@ GraphOptimalViewSerialized
         for (int i = 0; i < split->numOutputs; i++) {
           sez.serialize(split->outputs[i]->dims[split->legion_axis].size);
         }
+        sez.serialize(strlen(split->name));
+        sez.serialize(split->name, strlen(split->name));
         break;
       }
       case OP_EMBEDDING: {
@@ -2296,6 +2300,8 @@ GraphOptimalViewSerialized
         sez.serialize(embed->out_channels);
         sez.serialize(embed->aggr);
         sez.serialize(embed->data_type);
+        sez.serialize(strlen(embed->name));
+        sez.serialize(embed->name, strlen(embed->name));
         break;
       }
       case OP_MULTIHEAD_ATTENTION: {
@@ -2311,6 +2317,8 @@ GraphOptimalViewSerialized
         sez.serialize(attn->bias);
         sez.serialize(attn->add_bias_kv);
         sez.serialize(attn->add_zero_attn);
+        sez.serialize(strlen(attn->name));
+        sez.serialize(attn->name, strlen(attn->name));
         break;
       }
       case OP_INC_MULTIHEAD_SELF_ATTENTION: {
@@ -2335,6 +2343,8 @@ GraphOptimalViewSerialized
         sez.serialize(attn->offload);
         sez.serialize(attn->num_kv_heads);
         sez.serialize(attn->tensor_parallelism_degree);
+        sez.serialize(strlen(attn->name));
+        sez.serialize(attn->name, strlen(attn->name));
         break;
       }
       case OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION: {
@@ -2357,6 +2367,8 @@ GraphOptimalViewSerialized
         sez.serialize(attn->qk_prod_scaling);
         sez.serialize(attn->position_bias);
         sez.serialize(attn->num_kv_heads);
+        sez.serialize(strlen(attn->name));
+        sez.serialize(attn->name, strlen(attn->name));
         break;
       }
       case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION: {
@@ -2382,40 +2394,47 @@ GraphOptimalViewSerialized
         sez.serialize(attn->offload);
         sez.serialize(attn->num_kv_heads);
         sez.serialize(attn->tensor_parallelism_degree);
-        break;
-      }
-      case OP_SOFTMAX: {
-        Softmax *softmax = (Softmax *)op;
-        sez.serialize(softmax->dim);
+        sez.serialize(strlen(attn->name));
+        sez.serialize(attn->name, strlen(attn->name));
         break;
       }
       case OP_REPARTITION: {
         Repartition *repart = (Repartition *)op;
         sez.serialize(repart->repartition_dim);
         sez.serialize(repart->repartition_degree);
+        sez.serialize(strlen(repart->name));
+        sez.serialize(repart->name, strlen(repart->name));
         break;
       }
       case OP_REPLICATE: {
         Replicate *replicate = (Replicate *)op;
         sez.serialize(replicate->replicate_dim);
         sez.serialize(replicate->replicate_degree);
+        sez.serialize(strlen(replicate->name));
+        sez.serialize(replicate->name, strlen(replicate->name));
         break;
       }
       case OP_REDUCTION: {
         Reduction *reduction = (Reduction *)op;
         sez.serialize(reduction->reduction_dim);
         sez.serialize(reduction->reduction_degree);
+        sez.serialize(strlen(reduction->name));
+        sez.serialize(reduction->name, strlen(reduction->name));
         break;
       }
       case OP_COMBINE: {
         Combine *combine = (Combine *)op;
         sez.serialize(combine->combine_dim);
         sez.serialize(combine->combine_degree);
+        sez.serialize(strlen(combine->name));
+        sez.serialize(combine->name, strlen(combine->name));
         break;
       }
       case OP_ALLREDUCE: {
         AllReduce *allreduce = (AllReduce *)op;
         sez.serialize(allreduce->allreduce_dim);
+        sez.serialize(strlen(allreduce->name));
+        sez.serialize(allreduce->name, strlen(allreduce->name));
         break;
       }
       case OP_FUSED_PARALLEL: {
@@ -2424,6 +2443,8 @@ GraphOptimalViewSerialized
         for (int i = 0; i < fused->num_parallel_ops; i++) {
           sez.serialize(fused->parallel_ops[i]);
         }
+        sez.serialize(strlen(fused->name));
+        sez.serialize(fused->name, strlen(fused->name));
         break;
       }
       default: {
@@ -2621,6 +2642,10 @@ void FFModel::deserialize_graph_optimal_view(
       case OP_CONCAT: {
         int legion_axis;
         dez.deserialize(legion_axis);
+        size_t name_len;
+        char name[MAX_OPNAME] = {0};
+        dez.deserialize(name_len);
+        dez.deserialize(name, name_len);
         node = get_or_create_node<Concat>(
             {std::begin(inputs), std::begin(inputs) + num_inputs},
             {legion_axis});
@@ -2637,6 +2662,10 @@ void FFModel::deserialize_graph_optimal_view(
           dez.deserialize(dim_size);
           splits.push_back(dim_size);
         }
+        size_t name_len;
+        char name[MAX_OPNAME] = {0};
+        dez.deserialize(name_len);
+        dez.deserialize(name, name_len);
         node = get_or_create_node<Split>(inputs[0], {splits, legion_axis});
         break;
       }
@@ -2654,6 +2683,10 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(out_channels);
         dez.deserialize(aggr);
         dez.deserialize(data_type);
+        size_t name_len;
+        char name[MAX_OPNAME] = {0};
+        dez.deserialize(name_len);
+        dez.deserialize(name, name_len);
 
         EmbeddingParams params;
         params.aggr = aggr;
@@ -2661,6 +2694,7 @@ void FFModel::deserialize_graph_optimal_view(
         params.out_channels = out_channels;
         params.layer_guid = layer_guid;
         params.data_type = data_type;
+        strcpy(params.name, name);
         node = get_or_create_node<Embedding>(inputs[0], params);
         break;
       }
@@ -2746,6 +2780,10 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(bias);
         dez.deserialize(add_bias_kv);
         dez.deserialize(add_zero_attn);
+        size_t name_len;
+        char name[MAX_OPNAME] = {0};
+        dez.deserialize(name_len);
+        dez.deserialize(name, name_len);
 
         MultiHeadAttentionParams params;
         params.embed_dim = embed_dim;
@@ -2757,6 +2795,7 @@ void FFModel::deserialize_graph_optimal_view(
         params.add_bias_kv = add_bias_kv;
         params.add_zero_attn = add_zero_attn;
         params.layer_guid = layer_guid;
+        strcpy(params.name, name);
         node = get_or_create_node<MultiHeadAttention>(
             {inputs[0], inputs[1], inputs[2]}, params);
         break;
@@ -2791,6 +2830,10 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(offload);
         dez.deserialize(num_kv_heads);
         dez.deserialize(tensor_parallelism_degree);
+        size_t name_len;
+        char name[MAX_OPNAME] = {0};
+        dez.deserialize(name_len);
+        dez.deserialize(name, name_len);
 
         IncMultiHeadSelfAttentionParams params;
         params.embed_dim = embed_dim;
@@ -2811,6 +2854,7 @@ void FFModel::deserialize_graph_optimal_view(
         params.offload = offload;
         params.num_kv_heads = num_kv_heads;
         params.tensor_parallelism_degree = tensor_parallelism_degree;
+        strcpy(params.name, name);
         node = get_or_create_node<IncMultiHeadSelfAttention>(inputs[0], params);
         break;
       }
@@ -2839,6 +2883,10 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(qk_prod_scaling);
         dez.deserialize(position_bias);
         dez.deserialize(num_kv_heads);
+        size_t name_len;
+        char name[MAX_OPNAME] = {0};
+        dez.deserialize(name_len);
+        dez.deserialize(name, name_len);
 
         SpecIncMultiHeadSelfAttentionParams params;
         params.embed_dim = embed_dim;
@@ -2856,6 +2904,7 @@ void FFModel::deserialize_graph_optimal_view(
         params.qk_prod_scaling = qk_prod_scaling;
         params.position_bias = position_bias;
         params.num_kv_heads = num_kv_heads;
+        strcpy(params.name, name);
         node = get_or_create_node<SpecIncMultiHeadSelfAttention>(inputs[0],
                                                                  params);
         break;
@@ -2890,6 +2939,10 @@ void FFModel::deserialize_graph_optimal_view(
         dez.deserialize(offload);
         dez.deserialize(num_kv_heads);
         dez.deserialize(tensor_parallelism_degree);
+        size_t name_len;
+        char name[MAX_OPNAME] = {0};
+        dez.deserialize(name_len);
+        dez.deserialize(name, name_len);
 
         TreeIncMultiHeadSelfAttentionParams params;
         params.embed_dim = embed_dim;
@@ -2910,6 +2963,7 @@ void FFModel::deserialize_graph_optimal_view(
         params.offload = offload;
         params.num_kv_heads = num_kv_heads;
         params.tensor_parallelism_degree = tensor_parallelism_degree;
+        strcpy(params.name, name);
         node = get_or_create_node<TreeIncMultiHeadSelfAttention>(inputs[0],
                                                                  params);
         break;
@@ -2967,10 +3021,7 @@ void FFModel::deserialize_graph_optimal_view(
         break;
       }
       case OP_SOFTMAX: {
-        assert(num_inputs == 1);
-        int softmax_dim;
-        dez.deserialize(softmax_dim);
-        node = get_or_create_node<Softmax>(inputs[0], {softmax_dim});
+        node = Softmax::deserialize(*this, dez, inputs, num_inputs);
         break;
       }
       case OP_TRANSPOSE: {
@@ -2990,6 +3041,10 @@ void FFModel::deserialize_graph_optimal_view(
         int combine_dim, combine_degree;
         dez.deserialize(combine_dim);
         dez.deserialize(combine_degree);
+        size_t name_len;
+        char name[MAX_OPNAME] = {0};
+        dez.deserialize(name_len);
+        dez.deserialize(name, name_len);
         node = get_or_create_node<Combine>(inputs[0],
                                            {combine_dim, combine_degree});
         break;
@@ -2999,6 +3054,10 @@ void FFModel::deserialize_graph_optimal_view(
         int repartition_dim, repartition_degree;
         dez.deserialize(repartition_dim);
         dez.deserialize(repartition_degree);
+        size_t name_len;
+        char name[MAX_OPNAME] = {0};
+        dez.deserialize(name_len);
+        dez.deserialize(name, name_len);
         node = get_or_create_node<Repartition>(
             inputs[0], {repartition_dim, repartition_degree});
         break;
@@ -3008,6 +3067,10 @@ void FFModel::deserialize_graph_optimal_view(
         int replicate_dim, replicate_degree;
         dez.deserialize(replicate_dim);
         dez.deserialize(replicate_degree);
+        size_t name_len;
+        char name[MAX_OPNAME] = {0};
+        dez.deserialize(name_len);
+        dez.deserialize(name, name_len);
         node = get_or_create_node<Replicate>(inputs[0],
                                              {replicate_dim, replicate_degree});
         break;
@@ -3017,6 +3080,10 @@ void FFModel::deserialize_graph_optimal_view(
         int reduction_dim, reduction_degree;
         dez.deserialize(reduction_dim);
         dez.deserialize(reduction_degree);
+        size_t name_len;
+        char name[MAX_OPNAME] = {0};
+        dez.deserialize(name_len);
+        dez.deserialize(name, name_len);
         node = get_or_create_node<Reduction>(inputs[0],
                                              {reduction_dim, reduction_degree});
         break;
@@ -3025,6 +3092,10 @@ void FFModel::deserialize_graph_optimal_view(
         assert(num_inputs == 1);
         int allreduce_dim;
         dez.deserialize(allreduce_dim);
+        size_t name_len;
+        char name[MAX_OPNAME] = {0};
+        dez.deserialize(name_len);
+        dez.deserialize(name, name_len);
         node = get_or_create_node<AllReduce>(inputs[0], {allreduce_dim});
         break;
       }
@@ -3038,6 +3109,10 @@ void FFModel::deserialize_graph_optimal_view(
           dez.deserialize(info);
           parallel_ops.push_back(info);
         }
+        size_t name_len;
+        char name[MAX_OPNAME] = {0};
+        dez.deserialize(name_len);
+        dez.deserialize(name, name_len);
         node = get_or_create_node<FusedParallelOp>(inputs[0], {parallel_ops});
         break;
       }
diff --git a/src/runtime/hip_helper.cpp b/src/runtime/hip_helper.cpp
index fb94135c8f..613df1cbcf 100644
--- a/src/runtime/hip_helper.cpp
+++ b/src/runtime/hip_helper.cpp
@@ -266,7 +266,11 @@ __host__ void
   tensor_file = fopen(file_name, "w");
   assert(tensor_file != NULL);
   for (unsigned i = 0; i < num_elements; i++) {
-    fprintf(tensor_file, "%.9f, ", host_ptr[i]);
+    if (i < num_elements - 1) {
+      fprintf(tensor_file, "%.9f, ", host_ptr[i]);
+    } else {
+      fprintf(tensor_file, "%.9f", host_ptr[i]);
+    }
   }
 
   fclose(tensor_file);
@@ -292,7 +296,11 @@ __host__ void
   tensor_file = fopen(file_name, "w");
   assert(tensor_file != NULL);
   for (unsigned i = 0; i < num_elements; i++) {
-    fprintf(tensor_file, "%.9f, ", (float)host_ptr[i]);
+    if (i < num_elements - 1) {
+      fprintf(tensor_file, "%.9f, ", (float)host_ptr[i]);
+    } else {
+      fprintf(tensor_file, "%.9f", (float)host_ptr[i]);
+    }
   }
 
   fclose(tensor_file);
@@ -319,7 +327,11 @@ __host__ void save_tensor(int32_t const *ptr,
   tensor_file = fopen(file_name, "w");
   assert(tensor_file != NULL);
   for (unsigned i = 0; i < num_elements; i++) {
-    fprintf(tensor_file, "%d, ", host_ptr[i]);
+    if (i < num_elements - 1) {
+      fprintf(tensor_file, "%d, ", host_ptr[i]);
+    } else {
+      fprintf(tensor_file, "%d", host_ptr[i]);
+    }
   }
 
   fclose(tensor_file);
@@ -346,7 +358,11 @@ __host__ void save_tensor(int64_t const *ptr,
   tensor_file = fopen(file_name, "w");
   assert(tensor_file != NULL);
   for (unsigned i = 0; i < num_elements; i++) {
-    fprintf(tensor_file, "%ld, ", host_ptr[i]);
+    if (i < num_elements - 1) {
+      fprintf(tensor_file, "%ld, ", host_ptr[i]);
+    } else {
+      fprintf(tensor_file, "%ld", host_ptr[i]);
+    }
   }
 
   fclose(tensor_file);
diff --git a/src/runtime/operator.cc b/src/runtime/operator.cc
index 0b3813f41c..36ac02a3a3 100644
--- a/src/runtime/operator.cc
+++ b/src/runtime/operator.cc
@@ -25,105 +25,4 @@ size_t Op::get_params_hash() const {
       get_operator_type_name(this->op_type));
 }
 
-/*static*/
-void Op::save_inference_tensors_to_file(
-    OpMeta *m,
-    int shard_id,
-    BatchConfig const *bc,
-    std::vector<GenericTensorAccessorR> input_tensors,
-    std::vector<GenericTensorAccessorR> weight_tensors,
-    std::vector<GenericTensorAccessorW> output_tensors) {
-
-  // Check if output directory exists, and create it if it does not
-  char const *folder_path = "./inference_tensors";
-  struct stat st = {0};
-  if (stat(folder_path, &st) == -1) {
-    // Directory does not exist, create it
-    mkdir(folder_path, 0700);
-  }
-  // output base filepath, shared by all tensors from the same operator
-  std::string base_filepath =
-      "./inference_tensors/model_" + std::to_string(m->layer_guid.model_id) +
-      "_decoding-step_" + std::to_string(m->decoding_step) + "_layer-num_" +
-      std::to_string(m->layer_guid.transformer_layer_id) + "_layer-name_" +
-      m->op_name + "_shard-id_" + std::to_string(shard_id);
-  // save batch config, if passed
-  if (bc != nullptr) {
-    bc->save_to_file(base_filepath + "_batch-config");
-  }
-  // save all inputs
-  for (int i = 0; i < input_tensors.size(); i++) {
-    std::string filename = base_filepath + "_input_" + std::to_string(i);
-    if (input_tensors[i].data_type == DT_FLOAT) {
-      save_tensor(input_tensors[i].get_float_ptr(),
-                  input_tensors[i].domain.get_volume(),
-                  filename.c_str());
-    } else if (input_tensors[i].data_type == DT_HALF) {
-      save_tensor(input_tensors[i].get_half_ptr(),
-                  input_tensors[i].domain.get_volume(),
-                  filename.c_str());
-    } else if (input_tensors[i].data_type == DT_INT32) {
-      save_tensor(input_tensors[i].get_int32_ptr(),
-                  input_tensors[i].domain.get_volume(),
-                  filename.c_str());
-    } else if (input_tensors[i].data_type == DT_INT64) {
-      save_tensor(input_tensors[i].get_int64_ptr(),
-                  input_tensors[i].domain.get_volume(),
-                  filename.c_str());
-    } else {
-      assert(false && "Tensor data type not supported");
-    }
-  }
-  // only dump the weights once
-  if (m->decoding_step == 0) {
-    for (int i = 0; i < weight_tensors.size(); i++) {
-      std::string filename = base_filepath + "_weight_" + std::to_string(i);
-      if (weight_tensors[i].data_type == DT_FLOAT) {
-        save_tensor(weight_tensors[i].get_float_ptr(),
-                    weight_tensors[i].domain.get_volume(),
-                    filename.c_str());
-      } else if (weight_tensors[i].data_type == DT_HALF) {
-        save_tensor(weight_tensors[i].get_half_ptr(),
-                    weight_tensors[i].domain.get_volume(),
-                    filename.c_str());
-      } else if (weight_tensors[i].data_type == DT_INT32) {
-        save_tensor(weight_tensors[i].get_int32_ptr(),
-                    weight_tensors[i].domain.get_volume(),
-                    filename.c_str());
-      } else if (weight_tensors[i].data_type == DT_INT64) {
-        save_tensor(weight_tensors[i].get_int64_ptr(),
-                    weight_tensors[i].domain.get_volume(),
-                    filename.c_str());
-      } else {
-        assert(false && "Tensor data type not supported");
-      }
-    }
-  }
-  // save all outputs
-  for (int i = 0; i < output_tensors.size(); i++) {
-    std::string filename = base_filepath + "_output_" + std::to_string(i);
-    if (output_tensors[i].data_type == DT_FLOAT) {
-      save_tensor(output_tensors[i].get_float_ptr(),
-                  output_tensors[i].domain.get_volume(),
-                  filename.c_str());
-    } else if (output_tensors[i].data_type == DT_HALF) {
-      save_tensor(output_tensors[i].get_half_ptr(),
-                  output_tensors[i].domain.get_volume(),
-                  filename.c_str());
-    } else if (output_tensors[i].data_type == DT_INT32) {
-      save_tensor(output_tensors[i].get_int32_ptr(),
-                  output_tensors[i].domain.get_volume(),
-                  filename.c_str());
-    } else if (output_tensors[i].data_type == DT_INT64) {
-      save_tensor(output_tensors[i].get_int64_ptr(),
-                  output_tensors[i].domain.get_volume(),
-                  filename.c_str());
-    } else {
-      assert(false && "Tensor data type not supported");
-    }
-  }
-  // increase count of decoding steps
-  m->decoding_step++;
-}
-
 }; // namespace FlexFlow
\ No newline at end of file
diff --git a/src/runtime/substitution.cc b/src/runtime/substitution.cc
index e8b986582f..c0804d6e19 100644
--- a/src/runtime/substitution.cc
+++ b/src/runtime/substitution.cc
@@ -958,8 +958,12 @@ bool GraphXfer::create_new_operator(OpX const *opx, Node &op) {
     }
     case OP_SOFTMAX: {
       int softmax_dim;
+      assert(opx->matchOpX != NULL);
+      assert(opx->matchOpX->mapOp.ptr != NULL);
+      Softmax *softmax = (Softmax *)opx->matchOpX->mapOp.ptr;
       assert(opx->get_pm_constraint(PM_SOFTMAX_DIM, softmax_dim));
-      op = model->get_or_create_node<Softmax>(inputs[0], {softmax_dim});
+      SoftmaxParams params = softmax->get_params();
+      op = model->get_or_create_node<Softmax>(inputs[0], params);
       break;
     }
     case OP_REPARTITION: {
@@ -3749,7 +3753,8 @@ bool FFModel::convert_graph_to_operators(
       case OP_SOFTMAX: {
         assert(inList.size() == 1);
         Softmax *softmax = (Softmax *)node.ptr;
-        new_op = new Softmax(*this, inputs[0], softmax->dim, NULL);
+        new_op = new Softmax(
+            *this, softmax->layer_guid, inputs[0], softmax->dim, NULL);
         break;
       }
       case OP_COMBINE: {
diff --git a/tests/inference/huggingface_inference.py b/tests/inference/huggingface_inference.py
index 5b533bf3c0..6857b5cbc1 100644
--- a/tests/inference/huggingface_inference.py
+++ b/tests/inference/huggingface_inference.py
@@ -1,6 +1,7 @@
 import argparse
 import json
 import os
+import shutil
 import torch
 from transformers import (
     AutoModelForCausalLM,
@@ -9,7 +10,30 @@
     LlamaTokenizer,
     GenerationConfig,
 )
-
+######################### debugging helper functions #########################
+def pre_forward_hook(module, input):
+    assert module.name is not None and module.decoding_step is not None
+    name = module.name.replace("model.", "")
+    print(
+        f"Pre-forward hook activated on module: {name}, decoding step: {module.decoding_step}"
+    )
+    print("Pre-Input: ", input[0].shape)
+    torch.save(
+        input, f"./hf_tensors/decoding_step_{module.decoding_step}_{name}.input"
+    )
+def post_forward_hook(module, input, output):
+    assert module.name is not None and module.decoding_step is not None
+    name = module.name.replace("model.", "")
+    print(
+        f"Post-forward Hook activated for module: {name}, decoding step: {module.decoding_step}"
+    )
+    print("Post-Input/Output: ", input[0].shape, output[0].shape)
+    torch.save(
+        output, f"./hf_tensors/decoding_step_{module.decoding_step}_{name}.output"
+    )
+    print("===")
+    module.decoding_step += 1
+##############################################################################
 
 def main():
     # Change working dir to folder storing this script
@@ -28,6 +52,11 @@ def main():
     )
     parser.add_argument("--do-sample", action="store_true", help="Use sampling")
     parser.add_argument("--gpu", action="store_true", help="Run on GPU")
+    parser.add_argument(
+        "--inference-debugging",
+        action="store_true",
+        help="Print debugging info and save hidden states/weights to file",
+    )
     args = parser.parse_args()
     # Check if max-length is greater than 0
     if args.max_length <= 0:
@@ -64,6 +93,27 @@ def main():
         tokenizer = AutoTokenizer.from_pretrained(args.model_name)
     generation_config = GenerationConfig.from_pretrained(args.model_name)
     generation_config.do_sample = args.do_sample
+    ################# debugging #################
+    if args.inference_debugging:
+        # Print model and configs
+        print(hf_config)
+        print(model)
+        # Save weights to file
+        shutil.rmtree("./hf_tensors")
+        # Check that the output folder exists
+        os.makedirs("./hf_tensors", exist_ok=True)
+        # Save weights
+        for name, params in model.named_parameters():
+            torch.save(params, f"./hf_tensors/{name}")
+            # params.detach().cpu().numpy().tofile(f"./hf_tensors/{name}")
+        # Register hooks to save per-op hidden states
+        for name, layer in dict(model.named_modules()).items():
+            layer.name = name
+            layer.decoding_step = 0
+            print(f"Adding hooks to layer {layer.name}")
+            layer.register_forward_pre_hook(pre_forward_hook)
+            layer.register_forward_hook(post_forward_hook)
+    ###############################################
     # Generate output
     with open(args.output_file, "w") as f:
         for i, prompt in enumerate(prompt_list):

From 57d1883b5cef266371dd616f812abca44b37099d Mon Sep 17 00:00:00 2001
From: FelixBrakel <felixbrakel@quicknet.nl>
Date: Sat, 20 Jan 2024 06:07:28 +0100
Subject: [PATCH 312/344] Fix incorrect innode being checked (#1273)

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
---
 python/flexflow/torch/model.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/python/flexflow/torch/model.py b/python/flexflow/torch/model.py
index 65b1669e99..df4042748f 100644
--- a/python/flexflow/torch/model.py
+++ b/python/flexflow/torch/model.py
@@ -955,7 +955,7 @@ def is_left_scalar_op(node):
         if len(innodes) != 2:
             return False
         return type(innodes[0]) is float or \
-            type(innodes[1]) is int
+            type(innodes[0]) is int
 
     @staticmethod
     def is_elemwise_op(node):

From 317cffd82f2dc6559f3243217e617b110c90be05 Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Fri, 26 Jan 2024 11:36:24 -0500
Subject: [PATCH 313/344] Bug fixes and update Legion version (#1259)

* bug fixes and update Legion version

* fix

* bug fix

* update legion

* fix arithmetic error due to num_devices uninitialized

* update legion version

* update ci

* fix

* debugging ci

* Revert "debugging ci"

This reverts commit 0b3148ef6adfcb64935e6b1e83a88494910a7b22.

---------

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
---
 .github/workflows/gpu-ci.yml       | 12 +++---
 CMakeLists.txt                     |  8 ++--
 cmake/pip_install/CMakeLists.txt   |  4 +-
 deps/legion                        |  2 +-
 include/flexflow/mapper.h          |  9 ++---
 include/flexflow/model.h           |  2 +
 include/flexflow/operator.h        |  5 +++
 include/flexflow/request_manager.h |  1 -
 src/mapper/mapper.cc               | 47 ++++++++++-------------
 src/ops/linear.cc                  |  8 +---
 src/runtime/inference_manager.cc   | 30 +--------------
 src/runtime/model.cc               | 61 ++++++++++++++++++++++++++++++
 12 files changed, 109 insertions(+), 80 deletions(-)

diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index 3901d6b5f7..48dcda157e 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -222,7 +222,7 @@ jobs:
       CONDA: "3"
     needs: inference-tests
     container:
-      image: ghcr.io/flexflow/flexflow-environment-cuda:latest
+      image: ghcr.io/flexflow/flexflow-environment-cuda-11.8:latest
       options: --gpus all --shm-size=8192m
     steps:
       - name: Install updated git version
@@ -243,7 +243,7 @@ jobs:
 
       - name: Build and Install FlexFlow
         run: |
-          export PATH=/opt/conda/bin:$PATH
+          export PATH=$CONDA_PREFIX/bin:$PATH
           export FF_HOME=$(pwd)
           export FF_BUILD_ALL_EXAMPLES=ON
           export FF_BUILD_ALL_INFERENCE_EXAMPLES=ON
@@ -252,18 +252,18 @@ jobs:
 
       - name: Check FlexFlow Python interface (pip)
         run: |
-          export PATH=/opt/conda/bin:$PATH
+          export PATH=$CONDA_PREFIX/bin:$PATH
           export FF_HOME=$(pwd)
-          export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/conda/lib
+          export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$CONDA_PREFIX/lib
           ./tests/python_interface_test.sh after-installation
 
       - name: Run multi-gpu tests
         run: |
-          export PATH=/opt/conda/bin:$PATH
+          export PATH=$CONDA_PREFIX/bin:$PATH
           export CUDNN_DIR=/usr/local/cuda
           export CUDA_DIR=/usr/local/cuda
           export FF_HOME=$(pwd)
-          export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/conda/lib
+          export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$CONDA_PREFIX/lib
           # C++ tests
           ./tests/cpp_gpu_tests.sh 4
           # Python tests
diff --git a/CMakeLists.txt b/CMakeLists.txt
index acbe7e385f..43ce4f7044 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -413,6 +413,7 @@ if(NOT BUILD_LEGION_ONLY)
 
   # python related
   if (FF_USE_PYTHON)
+    find_package(Python COMPONENTS Interpreter Development)
     # create flexflow_cffi_header.py
     add_custom_command(TARGET flexflow
       PRE_BUILD	
@@ -424,13 +425,13 @@ if(NOT BUILD_LEGION_ONLY)
       # generate the Legion Python bindings library. When building from pip, we need to do this post-install to prevent Legion from overwriting the path to the Legion shared library
       add_custom_command(TARGET flexflow
         POST_BUILD	
-        COMMAND ${PYTHON_EXECUTABLE} ${CMAKE_CURRENT_SOURCE_DIR}/deps/legion/bindings/python/setup.py build --cmake-build-dir ${Legion_BINARY_DIR}/runtime --prefix ${Legion_BINARY_DIR} --build-lib=${Legion_BINARY_DIR}/bindings/python ${Legion_PYTHON_EXTRA_INSTALL_ARGS}
+        COMMAND ${Python_EXECUTABLE} ${CMAKE_CURRENT_SOURCE_DIR}/deps/legion/bindings/python/setup.py build --cmake-build-dir ${Legion_BINARY_DIR}/runtime --prefix ${Legion_BINARY_DIR} --build-lib=${Legion_BINARY_DIR}/bindings/python ${Legion_PYTHON_EXTRA_INSTALL_ARGS}
         WORKING_DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}/deps/legion/bindings/python
       )
       # create flexflow_python interpreter. When building from pip, we install the FF_HOME/python/flexflow_python script instead.
       add_custom_command(TARGET flexflow
         PRE_BUILD	
-        COMMAND ${PYTHON_EXECUTABLE} ${FLEXFLOW_ROOT}/python/flexflow_python_build.py --build-dir ${CMAKE_BINARY_DIR}
+        COMMAND ${Python_EXECUTABLE} ${FLEXFLOW_ROOT}/python/flexflow_python_build.py --build-dir ${CMAKE_BINARY_DIR}
         WORKING_DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}
         COMMENT "Creating flexflow_python interpreter..."
       )
@@ -567,7 +568,8 @@ if(NOT BUILD_LEGION_ONLY)
   install(TARGETS flexflow DESTINATION ${LIB_DEST})
   # install python
   if (FF_USE_PYTHON)
-    execute_process(COMMAND ${PYTHON_EXECUTABLE} -c "import site, os; print([pkg for func in (site.getsitepackages(), site.getusersitepackages()) for pkg in ([func] if isinstance(func, str) else func) if os.access(pkg, os.W_OK)][0])" OUTPUT_VARIABLE PY_DEST OUTPUT_STRIP_TRAILING_WHITESPACE)
+    find_package(Python COMPONENTS Interpreter Development)
+    execute_process(COMMAND ${Python_EXECUTABLE} -c "import site, os; print([pkg for func in (site.getsitepackages(), site.getusersitepackages()) for pkg in ([func] if isinstance(func, str) else func) if os.access(pkg, os.W_OK)][0])" OUTPUT_VARIABLE PY_DEST OUTPUT_STRIP_TRAILING_WHITESPACE)
     if (NOT FF_BUILD_FROM_PYPI)
       install(
         DIRECTORY ${FLEXFLOW_ROOT}/python/flexflow/
diff --git a/cmake/pip_install/CMakeLists.txt b/cmake/pip_install/CMakeLists.txt
index 7ce38c4abc..105133a310 100644
--- a/cmake/pip_install/CMakeLists.txt
+++ b/cmake/pip_install/CMakeLists.txt
@@ -1,10 +1,10 @@
 # Use setup.py script to re-install the Python bindings library with the right library paths
 if (FF_USE_PYTHON)
-    execute_process(COMMAND ${PYTHON_EXECUTABLE} -c "import site, os; print([pkg for func in (site.getsitepackages(), site.getusersitepackages()) for pkg in ([func] if isinstance(func, str) else func) if os.access(pkg, os.W_OK)][0])" OUTPUT_VARIABLE PY_DEST OUTPUT_STRIP_TRAILING_WHITESPACE)  
+    execute_process(COMMAND ${Python_EXECUTABLE} -c "import site, os; print([pkg for func in (site.getsitepackages(), site.getusersitepackages()) for pkg in ([func] if isinstance(func, str) else func) if os.access(pkg, os.W_OK)][0])" OUTPUT_VARIABLE PY_DEST OUTPUT_STRIP_TRAILING_WHITESPACE)  
     if(FF_BUILD_FROM_PYPI)
         install(CODE "execute_process(COMMAND ${CMAKE_COMMAND} -E echo \"Editing path to Legion library using path: ${PY_DEST}/flexflow/lib \")")
         # CMAKE_CURRENT_SOURCE_DIR=/usr/FlexFlow/cmake/pip_install 
         # Legion_BINARY_DIR=/usr/FlexFlow/build/<something>/deps/legion
-        install(CODE "execute_process(COMMAND ${PYTHON_EXECUTABLE} ${CMAKE_CURRENT_SOURCE_DIR}/../../deps/legion/bindings/python/setup.py install --cmake-build-dir ${Legion_BINARY_DIR}/runtime --prefix ${PY_DEST}/flexflow ${Legion_PYTHON_EXTRA_INSTALL_ARGS} WORKING_DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}/../../deps/legion/bindings/python)")
+        install(CODE "execute_process(COMMAND ${Python_EXECUTABLE} ${CMAKE_CURRENT_SOURCE_DIR}/../../deps/legion/bindings/python/setup.py install --cmake-build-dir ${Legion_BINARY_DIR}/runtime --prefix ${PY_DEST}/flexflow ${Legion_PYTHON_EXTRA_INSTALL_ARGS} WORKING_DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}/../../deps/legion/bindings/python)")
     endif()
 endif()
diff --git a/deps/legion b/deps/legion
index 626b55689c..24e8c45234 160000
--- a/deps/legion
+++ b/deps/legion
@@ -1 +1 @@
-Subproject commit 626b55689c77848b246e1da19678c7ad58899f0c
+Subproject commit 24e8c452341dea41427e0ce61e154d61715e6835
diff --git a/include/flexflow/mapper.h b/include/flexflow/mapper.h
index 71be1892aa..e8337818ec 100644
--- a/include/flexflow/mapper.h
+++ b/include/flexflow/mapper.h
@@ -83,11 +83,10 @@ class FFMapper : public NullMapper {
                         Task const &task,
                         MapTaskInput const &input,
                         MapTaskOutput &output);
-  virtual void map_replicate_task(const MapperContext ctx,
-                                  Task const &task,
-                                  MapTaskInput const &input,
-                                  MapTaskOutput const &default_output,
-                                  MapReplicateTaskOutput &output);
+  virtual void replicate_task(const MapperContext ctx,
+                              Task const &task,
+                              ReplicateTaskInput const &input,
+                              ReplicateTaskOutput &output);
   virtual void select_task_variant(const MapperContext ctx,
                                    Task const &task,
                                    SelectVariantInput const &input,
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index dd6dc76b4d..95be9ab581 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -202,6 +202,7 @@ enum TaskIDs {
   // NCCL tasks
   NCCL_GETUNIQUEID_TASK_ID,
   NCCL_INIT_COMMS_TASK_ID,
+  NCCL_FINISH_COMMS_TASK_ID,
   // Search
   STRATEGY_SEARCH_TASK_ID,
   // Graph
@@ -397,6 +398,7 @@ std::vector<ParallelTensorShape>
 class FFModel {
 public:
   FFModel(FFConfig &config, bool cpu_offload = false);
+  ~FFModel();
 
   static constexpr float PROPAGATION_CHANCE = 0.25;
   static constexpr float CONTINUE_PROPAGATION_CHANCE = 0.75;
diff --git a/include/flexflow/operator.h b/include/flexflow/operator.h
index 73c2c3e092..1b19bdb82f 100644
--- a/include/flexflow/operator.h
+++ b/include/flexflow/operator.h
@@ -406,6 +406,11 @@ class Op {
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
                            Legion::Runtime *runtime);
+  static void
+      finish_nccl_comms_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
 #endif
 protected:
   void set_argumentmap_for_init(FFModel const &ff, Legion::ArgumentMap &argmap);
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index 50a51705cd..4763eb1ef3 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -55,7 +55,6 @@ class InferenceManager {
 public:
   std::unordered_map<ParallelTensor, std::vector<ParallelTensor>> tensor_buffer;
   std::unordered_map<FFModel *, FileDataLoader *> model_weights_loaders;
-  int num_devices;
 };
 
 struct Request {
diff --git a/src/mapper/mapper.cc b/src/mapper/mapper.cc
index bc26a79d3e..d46bfc2877 100644
--- a/src/mapper/mapper.cc
+++ b/src/mapper/mapper.cc
@@ -661,44 +661,37 @@ void FFMapper::map_task(const MapperContext ctx,
   } // for idx
 }
 
-void FFMapper::map_replicate_task(const MapperContext ctx,
-                                  Task const &task,
-                                  MapTaskInput const &input,
-                                  MapTaskOutput const &default_output,
-                                  MapReplicateTaskOutput &output) {
+void FFMapper::replicate_task(const MapperContext ctx,
+                              Task const &task,
+                              ReplicateTaskInput const &input,
+                              ReplicateTaskOutput &output) {
   // Should only be replicated for the top-level task
   assert((task.get_depth() == 0) && (task.regions.size() == 0));
   const Processor::Kind target_kind = task.target_proc.kind();
-  VariantID chosen_variant;
+  VariantID vid;
   {
     std::vector<VariantID> variant_ids;
-    runtime->find_valid_variants(
-        ctx, task.task_id, variant_ids, task.target_proc.kind());
+    runtime->find_valid_variants(ctx, task.task_id, variant_ids, target_kind);
     // Currently assume there is exactly one variant
     assert(variant_ids.size() == 1);
-    chosen_variant = variant_ids[0];
+    output.chosen_variant = variant_ids[0];
   }
-  std::vector<Processor> const &all_procs = all_procs_by_kind(target_kind);
-  // Place on replicate on each node by default
-  output.task_mappings.resize(total_nodes, default_output);
-  // Assume default_output does not include any target_procs
-  assert(default_output.target_procs.size() == 0);
-  for (std::vector<Processor>::const_iterator it = all_procs.begin();
-       it != all_procs.end();
+  output.target_processors.resize(total_nodes);
+  std::vector<bool> handled(total_nodes, false);
+  size_t count = 0;
+  Machine::ProcessorQuery procs(machine);
+  procs.only_kind(target_kind);
+  for (Machine::ProcessorQuery::iterator it = procs.begin(); it != procs.end();
        it++) {
-    AddressSpace space = it->address_space();
-    assert(space < output.task_mappings.size());
-    // Add *it as a target_proc if we haven't found one
-    if (output.task_mappings[space].target_procs.size() == 0) {
-      output.task_mappings[space].target_procs.push_back(*it);
+    const AddressSpace space = it->address_space();
+    if (handled[space]) {
+      continue;
     }
+    output.target_processors[space] = *it;
+    handled[space] = true;
+    count++;
   }
-  output.control_replication_map.resize(total_nodes);
-  for (int idx = 0; idx < total_nodes; idx++) {
-    output.task_mappings[idx].chosen_variant = chosen_variant;
-    output.control_replication_map[idx] =
-        output.task_mappings[idx].target_procs[0];
-  }
+  assert(count == total_nodes);
 }
 
 void FFMapper::select_task_variant(const MapperContext ctx,
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index 03c9e48af8..0c7a0f78fe 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -467,12 +467,8 @@ OpMeta *Linear::init_task_with_dim(Task const *task,
                                        ctx,
                                        runtime,
                                        false /*readOutput*/);
-  // TensorAccessorW<WT, NDIM> acc_kernel(regions[2],
-  //                                      task->regions[2],
-  //                                      FID_DATA,
-  //                                      ctx,
-  //                                      runtime,
-  //                                      false /*readOutput*/);
+  TensorAccessorR<WT, NDIM> acc_kernel(
+      regions[2], task->regions[2], FID_DATA, ctx, runtime);
 
   // TensorAccessorR<float, 1> acc_bias(
   //     regions[3], task->regions[3], FID_DATA, ctx, runtime);
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 6588cbceeb..2a94df8b4d 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -28,33 +28,7 @@ using namespace Legion;
 LegionRuntime::Logger::Category log_inf_mgr("InferenceManager");
 LegionRuntime::Logger::Category log_offload("Offloading");
 
-InferenceManager::InferenceManager() {
-#ifdef DEADCODE
-  num_devices = ff_config.workersPerNode * ff_config.numNodes;
-  // Check parallelization degrees
-  assert(ff_config.data_parallelism_degree <= num_devices &&
-         "Data parallelism degree exceeds number of available devices");
-  assert(num_devices % ff_config.data_parallelism_degree == 0 &&
-         "Number of available devices is not divisible by data parallelism "
-         "degree");
-  assert(ff_config.tensor_parallelism_degree <= num_devices &&
-         "Tensor parallelism degree exceeds number of available devices");
-  assert(num_devices % ff_config.tensor_parallelism_degree == 0 &&
-         "Number of available devices is not divisible by tensor parallelism "
-         "degree");
-  assert(ff_config.pipeline_parallelism_degree <= num_devices &&
-         "Pipeline parallelism degree exceeds number of available devices");
-  assert(num_devices % ff_config.pipeline_parallelism_degree == 0 &&
-         "Number of available devices is not divisible by pipeline parallelism "
-         "degree");
-  assert(ff_config.data_parallelism_degree *
-                 ff_config.tensor_parallelism_degree *
-                 ff_config.pipeline_parallelism_degree ==
-             num_devices &&
-         "Product of data, tensor, and pipeline parallelism degrees does not "
-         "match the number of available devices");
-#endif
-}
+InferenceManager::InferenceManager() {}
 
 InferenceManager *inference_manager_singleton = nullptr;
 
@@ -296,8 +270,6 @@ void InferenceManager::compile_model_and_allocate_buffer(FFModel *model) {
 void InferenceManager::init_operators_inference(FFModel *model) {
   for (int batch_index = 0; batch_index < model->config.data_parallelism_degree;
        batch_index++) {
-    int expert_device_index = 0;
-    int device_index = batch_index % num_devices;
     for (size_t o = 0; o < model->operators.size(); o++) {
       Op *op = model->operators[o];
       if (op->op_type == OP_WEIGHT) {
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index c07c33efca..f9763627c8 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -606,6 +606,15 @@ ncclComm_t Op::init_nccl_comms_task(Task const *task,
   //     ncclComm, allRanks, myRank, ncclId);
   return ncclComm;
 }
+
+void Op::finish_nccl_comms_task(Task const *task,
+                                std::vector<PhysicalRegion> const &regions,
+                                Context ctx,
+                                Runtime *runtime) {
+  ncclComm_t comm = *((ncclComm_t *)task->local_args);
+  checkNCCL(ncclCommFinalize(comm));
+  checkNCCL(ncclCommDestroy(comm));
+}
 #endif
 
 /**
@@ -1578,6 +1587,43 @@ FFModel::FFModel(FFConfig &_config, bool cpu_offload)
   model_id = model_counter++;
 }
 
+FFModel::~FFModel() {
+  // Destroy nccl communication groups
+#ifdef FF_USE_NCCL
+  Context ctx = config.lg_ctx;
+  Runtime *runtime = config.lg_hlr;
+  for (auto const &comm : view_hash_to_nccl_comms) {
+    // Find the machine view that has the hash
+    MachineView view;
+    for (size_t l = 0; l < operators.size(); l++) {
+      view = operators[l]->outputs[0]->machine_view;
+      if (view.hash() == comm.first) {
+        break;
+      }
+    }
+    assert(view.hash() == comm.first && "Cannot find the machine view");
+    IndexSpace task_is = get_or_create_task_is(view);
+    Domain domain = runtime->get_index_space_domain(ctx, task_is);
+    ArgumentMap argmap;
+    int idx = 0;
+    for (Domain::DomainPointIterator it(domain); it; it++, idx++) {
+      argmap.set_point(*it,
+                       TaskArgument(&comm.second[idx], sizeof(ncclComm_t)));
+    }
+    IndexLauncher index_launcher(NCCL_FINISH_COMMS_TASK_ID,
+                                 task_is,
+                                 TaskArgument(nullptr, 0),
+                                 argmap,
+                                 Predicate::TRUE_PRED,
+                                 false /*must*/,
+                                 0 /*mapper_id*/,
+                                 comm.first);
+    FutureMap fm = runtime->execute_index_space(ctx, index_launcher);
+    fm.wait_all_results();
+  }
+#endif
+}
+
 void FFModel::clear_graph_search_cache() {
   this->graph_search->clear_cache();
   this->search->clear_cache();
@@ -6853,6 +6899,21 @@ void register_flexflow_internal_tasks(Runtime *runtime,
           registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(NCCL_FINISH_COMMS_TASK_ID,
+                                   "NCCL Finish Communicators");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<Op::finish_nccl_comms_task>(
+          registrar, "NCCL Finish Communicators Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<Op::finish_nccl_comms_task>(registrar);
+    }
+  }
 #endif
   // Search
   {

From d73bba1212be19dd8b07e0e8f591b6db2fe4189d Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 26 Jan 2024 11:41:51 -0500
Subject: [PATCH 314/344] Revert "Bug fixes and update Legion version" (#1286)

---
 .github/workflows/gpu-ci.yml       | 12 +++---
 CMakeLists.txt                     |  8 ++--
 cmake/pip_install/CMakeLists.txt   |  4 +-
 deps/legion                        |  2 +-
 include/flexflow/mapper.h          |  9 +++--
 include/flexflow/model.h           |  2 -
 include/flexflow/operator.h        |  5 ---
 include/flexflow/request_manager.h |  1 +
 src/mapper/mapper.cc               | 47 +++++++++++++----------
 src/ops/linear.cc                  |  8 +++-
 src/runtime/inference_manager.cc   | 30 ++++++++++++++-
 src/runtime/model.cc               | 61 ------------------------------
 12 files changed, 80 insertions(+), 109 deletions(-)

diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index 48dcda157e..3901d6b5f7 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -222,7 +222,7 @@ jobs:
       CONDA: "3"
     needs: inference-tests
     container:
-      image: ghcr.io/flexflow/flexflow-environment-cuda-11.8:latest
+      image: ghcr.io/flexflow/flexflow-environment-cuda:latest
       options: --gpus all --shm-size=8192m
     steps:
       - name: Install updated git version
@@ -243,7 +243,7 @@ jobs:
 
       - name: Build and Install FlexFlow
         run: |
-          export PATH=$CONDA_PREFIX/bin:$PATH
+          export PATH=/opt/conda/bin:$PATH
           export FF_HOME=$(pwd)
           export FF_BUILD_ALL_EXAMPLES=ON
           export FF_BUILD_ALL_INFERENCE_EXAMPLES=ON
@@ -252,18 +252,18 @@ jobs:
 
       - name: Check FlexFlow Python interface (pip)
         run: |
-          export PATH=$CONDA_PREFIX/bin:$PATH
+          export PATH=/opt/conda/bin:$PATH
           export FF_HOME=$(pwd)
-          export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$CONDA_PREFIX/lib
+          export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/conda/lib
           ./tests/python_interface_test.sh after-installation
 
       - name: Run multi-gpu tests
         run: |
-          export PATH=$CONDA_PREFIX/bin:$PATH
+          export PATH=/opt/conda/bin:$PATH
           export CUDNN_DIR=/usr/local/cuda
           export CUDA_DIR=/usr/local/cuda
           export FF_HOME=$(pwd)
-          export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$CONDA_PREFIX/lib
+          export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/conda/lib
           # C++ tests
           ./tests/cpp_gpu_tests.sh 4
           # Python tests
diff --git a/CMakeLists.txt b/CMakeLists.txt
index 43ce4f7044..acbe7e385f 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -413,7 +413,6 @@ if(NOT BUILD_LEGION_ONLY)
 
   # python related
   if (FF_USE_PYTHON)
-    find_package(Python COMPONENTS Interpreter Development)
     # create flexflow_cffi_header.py
     add_custom_command(TARGET flexflow
       PRE_BUILD	
@@ -425,13 +424,13 @@ if(NOT BUILD_LEGION_ONLY)
       # generate the Legion Python bindings library. When building from pip, we need to do this post-install to prevent Legion from overwriting the path to the Legion shared library
       add_custom_command(TARGET flexflow
         POST_BUILD	
-        COMMAND ${Python_EXECUTABLE} ${CMAKE_CURRENT_SOURCE_DIR}/deps/legion/bindings/python/setup.py build --cmake-build-dir ${Legion_BINARY_DIR}/runtime --prefix ${Legion_BINARY_DIR} --build-lib=${Legion_BINARY_DIR}/bindings/python ${Legion_PYTHON_EXTRA_INSTALL_ARGS}
+        COMMAND ${PYTHON_EXECUTABLE} ${CMAKE_CURRENT_SOURCE_DIR}/deps/legion/bindings/python/setup.py build --cmake-build-dir ${Legion_BINARY_DIR}/runtime --prefix ${Legion_BINARY_DIR} --build-lib=${Legion_BINARY_DIR}/bindings/python ${Legion_PYTHON_EXTRA_INSTALL_ARGS}
         WORKING_DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}/deps/legion/bindings/python
       )
       # create flexflow_python interpreter. When building from pip, we install the FF_HOME/python/flexflow_python script instead.
       add_custom_command(TARGET flexflow
         PRE_BUILD	
-        COMMAND ${Python_EXECUTABLE} ${FLEXFLOW_ROOT}/python/flexflow_python_build.py --build-dir ${CMAKE_BINARY_DIR}
+        COMMAND ${PYTHON_EXECUTABLE} ${FLEXFLOW_ROOT}/python/flexflow_python_build.py --build-dir ${CMAKE_BINARY_DIR}
         WORKING_DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}
         COMMENT "Creating flexflow_python interpreter..."
       )
@@ -568,8 +567,7 @@ if(NOT BUILD_LEGION_ONLY)
   install(TARGETS flexflow DESTINATION ${LIB_DEST})
   # install python
   if (FF_USE_PYTHON)
-    find_package(Python COMPONENTS Interpreter Development)
-    execute_process(COMMAND ${Python_EXECUTABLE} -c "import site, os; print([pkg for func in (site.getsitepackages(), site.getusersitepackages()) for pkg in ([func] if isinstance(func, str) else func) if os.access(pkg, os.W_OK)][0])" OUTPUT_VARIABLE PY_DEST OUTPUT_STRIP_TRAILING_WHITESPACE)
+    execute_process(COMMAND ${PYTHON_EXECUTABLE} -c "import site, os; print([pkg for func in (site.getsitepackages(), site.getusersitepackages()) for pkg in ([func] if isinstance(func, str) else func) if os.access(pkg, os.W_OK)][0])" OUTPUT_VARIABLE PY_DEST OUTPUT_STRIP_TRAILING_WHITESPACE)
     if (NOT FF_BUILD_FROM_PYPI)
       install(
         DIRECTORY ${FLEXFLOW_ROOT}/python/flexflow/
diff --git a/cmake/pip_install/CMakeLists.txt b/cmake/pip_install/CMakeLists.txt
index 105133a310..7ce38c4abc 100644
--- a/cmake/pip_install/CMakeLists.txt
+++ b/cmake/pip_install/CMakeLists.txt
@@ -1,10 +1,10 @@
 # Use setup.py script to re-install the Python bindings library with the right library paths
 if (FF_USE_PYTHON)
-    execute_process(COMMAND ${Python_EXECUTABLE} -c "import site, os; print([pkg for func in (site.getsitepackages(), site.getusersitepackages()) for pkg in ([func] if isinstance(func, str) else func) if os.access(pkg, os.W_OK)][0])" OUTPUT_VARIABLE PY_DEST OUTPUT_STRIP_TRAILING_WHITESPACE)  
+    execute_process(COMMAND ${PYTHON_EXECUTABLE} -c "import site, os; print([pkg for func in (site.getsitepackages(), site.getusersitepackages()) for pkg in ([func] if isinstance(func, str) else func) if os.access(pkg, os.W_OK)][0])" OUTPUT_VARIABLE PY_DEST OUTPUT_STRIP_TRAILING_WHITESPACE)  
     if(FF_BUILD_FROM_PYPI)
         install(CODE "execute_process(COMMAND ${CMAKE_COMMAND} -E echo \"Editing path to Legion library using path: ${PY_DEST}/flexflow/lib \")")
         # CMAKE_CURRENT_SOURCE_DIR=/usr/FlexFlow/cmake/pip_install 
         # Legion_BINARY_DIR=/usr/FlexFlow/build/<something>/deps/legion
-        install(CODE "execute_process(COMMAND ${Python_EXECUTABLE} ${CMAKE_CURRENT_SOURCE_DIR}/../../deps/legion/bindings/python/setup.py install --cmake-build-dir ${Legion_BINARY_DIR}/runtime --prefix ${PY_DEST}/flexflow ${Legion_PYTHON_EXTRA_INSTALL_ARGS} WORKING_DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}/../../deps/legion/bindings/python)")
+        install(CODE "execute_process(COMMAND ${PYTHON_EXECUTABLE} ${CMAKE_CURRENT_SOURCE_DIR}/../../deps/legion/bindings/python/setup.py install --cmake-build-dir ${Legion_BINARY_DIR}/runtime --prefix ${PY_DEST}/flexflow ${Legion_PYTHON_EXTRA_INSTALL_ARGS} WORKING_DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}/../../deps/legion/bindings/python)")
     endif()
 endif()
diff --git a/deps/legion b/deps/legion
index 24e8c45234..626b55689c 160000
--- a/deps/legion
+++ b/deps/legion
@@ -1 +1 @@
-Subproject commit 24e8c452341dea41427e0ce61e154d61715e6835
+Subproject commit 626b55689c77848b246e1da19678c7ad58899f0c
diff --git a/include/flexflow/mapper.h b/include/flexflow/mapper.h
index e8337818ec..71be1892aa 100644
--- a/include/flexflow/mapper.h
+++ b/include/flexflow/mapper.h
@@ -83,10 +83,11 @@ class FFMapper : public NullMapper {
                         Task const &task,
                         MapTaskInput const &input,
                         MapTaskOutput &output);
-  virtual void replicate_task(const MapperContext ctx,
-                              Task const &task,
-                              ReplicateTaskInput const &input,
-                              ReplicateTaskOutput &output);
+  virtual void map_replicate_task(const MapperContext ctx,
+                                  Task const &task,
+                                  MapTaskInput const &input,
+                                  MapTaskOutput const &default_output,
+                                  MapReplicateTaskOutput &output);
   virtual void select_task_variant(const MapperContext ctx,
                                    Task const &task,
                                    SelectVariantInput const &input,
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 95be9ab581..dd6dc76b4d 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -202,7 +202,6 @@ enum TaskIDs {
   // NCCL tasks
   NCCL_GETUNIQUEID_TASK_ID,
   NCCL_INIT_COMMS_TASK_ID,
-  NCCL_FINISH_COMMS_TASK_ID,
   // Search
   STRATEGY_SEARCH_TASK_ID,
   // Graph
@@ -398,7 +397,6 @@ std::vector<ParallelTensorShape>
 class FFModel {
 public:
   FFModel(FFConfig &config, bool cpu_offload = false);
-  ~FFModel();
 
   static constexpr float PROPAGATION_CHANCE = 0.25;
   static constexpr float CONTINUE_PROPAGATION_CHANCE = 0.75;
diff --git a/include/flexflow/operator.h b/include/flexflow/operator.h
index 1b19bdb82f..73c2c3e092 100644
--- a/include/flexflow/operator.h
+++ b/include/flexflow/operator.h
@@ -406,11 +406,6 @@ class Op {
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
                            Legion::Runtime *runtime);
-  static void
-      finish_nccl_comms_task(Legion::Task const *task,
-                             std::vector<Legion::PhysicalRegion> const &regions,
-                             Legion::Context ctx,
-                             Legion::Runtime *runtime);
 #endif
 protected:
   void set_argumentmap_for_init(FFModel const &ff, Legion::ArgumentMap &argmap);
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index 4763eb1ef3..50a51705cd 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -55,6 +55,7 @@ class InferenceManager {
 public:
   std::unordered_map<ParallelTensor, std::vector<ParallelTensor>> tensor_buffer;
   std::unordered_map<FFModel *, FileDataLoader *> model_weights_loaders;
+  int num_devices;
 };
 
 struct Request {
diff --git a/src/mapper/mapper.cc b/src/mapper/mapper.cc
index d46bfc2877..bc26a79d3e 100644
--- a/src/mapper/mapper.cc
+++ b/src/mapper/mapper.cc
@@ -661,37 +661,44 @@ void FFMapper::map_task(const MapperContext ctx,
   } // for idx
 }
 
-void FFMapper::replicate_task(const MapperContext ctx,
-                              Task const &task,
-                              ReplicateTaskInput const &input,
-                              ReplicateTaskOutput &output) {
+void FFMapper::map_replicate_task(const MapperContext ctx,
+                                  Task const &task,
+                                  MapTaskInput const &input,
+                                  MapTaskOutput const &default_output,
+                                  MapReplicateTaskOutput &output) {
   // Should only be replicated for the top-level task
   assert((task.get_depth() == 0) && (task.regions.size() == 0));
   const Processor::Kind target_kind = task.target_proc.kind();
-  VariantID vid;
+  VariantID chosen_variant;
   {
     std::vector<VariantID> variant_ids;
-    runtime->find_valid_variants(ctx, task.task_id, variant_ids, target_kind);
+    runtime->find_valid_variants(
+        ctx, task.task_id, variant_ids, task.target_proc.kind());
     // Currently assume there is exactly one variant
     assert(variant_ids.size() == 1);
-    output.chosen_variant = variant_ids[0];
+    chosen_variant = variant_ids[0];
   }
-  output.target_processors.resize(total_nodes);
-  std::vector<bool> handled(total_nodes, false);
-  size_t count = 0;
-  Machine::ProcessorQuery procs(machine);
-  procs.only_kind(target_kind);
-  for (Machine::ProcessorQuery::iterator it = procs.begin(); it != procs.end();
+  std::vector<Processor> const &all_procs = all_procs_by_kind(target_kind);
+  // Place on replicate on each node by default
+  output.task_mappings.resize(total_nodes, default_output);
+  // Assume default_output does not include any target_procs
+  assert(default_output.target_procs.size() == 0);
+  for (std::vector<Processor>::const_iterator it = all_procs.begin();
+       it != all_procs.end();
        it++) {
-    const AddressSpace space = it->address_space();
-    if (handled[space]) {
-      continue;
+    AddressSpace space = it->address_space();
+    assert(space < output.task_mappings.size());
+    // Add *it as a target_proc if we haven't found one
+    if (output.task_mappings[space].target_procs.size() == 0) {
+      output.task_mappings[space].target_procs.push_back(*it);
     }
-    output.target_processors[space] = *it;
-    handled[space] = true;
-    count++;
   }
-  assert(count == total_nodes);
+  output.control_replication_map.resize(total_nodes);
+  for (int idx = 0; idx < total_nodes; idx++) {
+    output.task_mappings[idx].chosen_variant = chosen_variant;
+    output.control_replication_map[idx] =
+        output.task_mappings[idx].target_procs[0];
+  }
 }
 
 void FFMapper::select_task_variant(const MapperContext ctx,
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index 0c7a0f78fe..03c9e48af8 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -467,8 +467,12 @@ OpMeta *Linear::init_task_with_dim(Task const *task,
                                        ctx,
                                        runtime,
                                        false /*readOutput*/);
-  TensorAccessorR<WT, NDIM> acc_kernel(
-      regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  // TensorAccessorW<WT, NDIM> acc_kernel(regions[2],
+  //                                      task->regions[2],
+  //                                      FID_DATA,
+  //                                      ctx,
+  //                                      runtime,
+  //                                      false /*readOutput*/);
 
   // TensorAccessorR<float, 1> acc_bias(
   //     regions[3], task->regions[3], FID_DATA, ctx, runtime);
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 2a94df8b4d..6588cbceeb 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -28,7 +28,33 @@ using namespace Legion;
 LegionRuntime::Logger::Category log_inf_mgr("InferenceManager");
 LegionRuntime::Logger::Category log_offload("Offloading");
 
-InferenceManager::InferenceManager() {}
+InferenceManager::InferenceManager() {
+#ifdef DEADCODE
+  num_devices = ff_config.workersPerNode * ff_config.numNodes;
+  // Check parallelization degrees
+  assert(ff_config.data_parallelism_degree <= num_devices &&
+         "Data parallelism degree exceeds number of available devices");
+  assert(num_devices % ff_config.data_parallelism_degree == 0 &&
+         "Number of available devices is not divisible by data parallelism "
+         "degree");
+  assert(ff_config.tensor_parallelism_degree <= num_devices &&
+         "Tensor parallelism degree exceeds number of available devices");
+  assert(num_devices % ff_config.tensor_parallelism_degree == 0 &&
+         "Number of available devices is not divisible by tensor parallelism "
+         "degree");
+  assert(ff_config.pipeline_parallelism_degree <= num_devices &&
+         "Pipeline parallelism degree exceeds number of available devices");
+  assert(num_devices % ff_config.pipeline_parallelism_degree == 0 &&
+         "Number of available devices is not divisible by pipeline parallelism "
+         "degree");
+  assert(ff_config.data_parallelism_degree *
+                 ff_config.tensor_parallelism_degree *
+                 ff_config.pipeline_parallelism_degree ==
+             num_devices &&
+         "Product of data, tensor, and pipeline parallelism degrees does not "
+         "match the number of available devices");
+#endif
+}
 
 InferenceManager *inference_manager_singleton = nullptr;
 
@@ -270,6 +296,8 @@ void InferenceManager::compile_model_and_allocate_buffer(FFModel *model) {
 void InferenceManager::init_operators_inference(FFModel *model) {
   for (int batch_index = 0; batch_index < model->config.data_parallelism_degree;
        batch_index++) {
+    int expert_device_index = 0;
+    int device_index = batch_index % num_devices;
     for (size_t o = 0; o < model->operators.size(); o++) {
       Op *op = model->operators[o];
       if (op->op_type == OP_WEIGHT) {
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index f9763627c8..c07c33efca 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -606,15 +606,6 @@ ncclComm_t Op::init_nccl_comms_task(Task const *task,
   //     ncclComm, allRanks, myRank, ncclId);
   return ncclComm;
 }
-
-void Op::finish_nccl_comms_task(Task const *task,
-                                std::vector<PhysicalRegion> const &regions,
-                                Context ctx,
-                                Runtime *runtime) {
-  ncclComm_t comm = *((ncclComm_t *)task->local_args);
-  checkNCCL(ncclCommFinalize(comm));
-  checkNCCL(ncclCommDestroy(comm));
-}
 #endif
 
 /**
@@ -1587,43 +1578,6 @@ FFModel::FFModel(FFConfig &_config, bool cpu_offload)
   model_id = model_counter++;
 }
 
-FFModel::~FFModel() {
-  // Destroy nccl communication groups
-#ifdef FF_USE_NCCL
-  Context ctx = config.lg_ctx;
-  Runtime *runtime = config.lg_hlr;
-  for (auto const &comm : view_hash_to_nccl_comms) {
-    // Find the machine view that has the hash
-    MachineView view;
-    for (size_t l = 0; l < operators.size(); l++) {
-      view = operators[l]->outputs[0]->machine_view;
-      if (view.hash() == comm.first) {
-        break;
-      }
-    }
-    assert(view.hash() == comm.first && "Cannot find the machine view");
-    IndexSpace task_is = get_or_create_task_is(view);
-    Domain domain = runtime->get_index_space_domain(ctx, task_is);
-    ArgumentMap argmap;
-    int idx = 0;
-    for (Domain::DomainPointIterator it(domain); it; it++, idx++) {
-      argmap.set_point(*it,
-                       TaskArgument(&comm.second[idx], sizeof(ncclComm_t)));
-    }
-    IndexLauncher index_launcher(NCCL_FINISH_COMMS_TASK_ID,
-                                 task_is,
-                                 TaskArgument(nullptr, 0),
-                                 argmap,
-                                 Predicate::TRUE_PRED,
-                                 false /*must*/,
-                                 0 /*mapper_id*/,
-                                 comm.first);
-    FutureMap fm = runtime->execute_index_space(ctx, index_launcher);
-    fm.wait_all_results();
-  }
-#endif
-}
-
 void FFModel::clear_graph_search_cache() {
   this->graph_search->clear_cache();
   this->search->clear_cache();
@@ -6899,21 +6853,6 @@ void register_flexflow_internal_tasks(Runtime *runtime,
           registrar);
     }
   }
-  {
-    TaskVariantRegistrar registrar(NCCL_FINISH_COMMS_TASK_ID,
-                                   "NCCL Finish Communicators");
-    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
-    registrar.set_leaf();
-    if (pre_register) {
-      Runtime::preregister_task_variant<Op::finish_nccl_comms_task>(
-          registrar, "NCCL Finish Communicators Task");
-    } else {
-      if (enable_control_replication) {
-        registrar.global_registration = false;
-      }
-      runtime->register_task_variant<Op::finish_nccl_comms_task>(registrar);
-    }
-  }
 #endif
   // Search
   {

From abf9fb8889504a7bb526401dc9f027e2d4640334 Mon Sep 17 00:00:00 2001
From: April Yang <114364211+april-yyt@users.noreply.github.com>
Date: Fri, 26 Jan 2024 11:39:42 -0800
Subject: [PATCH 315/344] Chatbot with Gradio, FastApi Endpoint, Langchain
 Integration (#1246)

* add a background server for RequestManager

* .

* make incr_decoding work

* make spec_infer work

* format

* update python inference

* fix python issues

* bug fix

* add a Legion future to capture the termination of the background server

* gradio finished

* chatbot gradio version 2

* chainlit1

* chainlit2

* fastapi done

* fastapi incr_decoding

* langchain example & wrapper class

* langchain example & wrapper class1

* added documentation

* entrypoint

* del apikey

* delete extra files

* rag search fixed some bugs

* fixed rag search issues

* updates before rebase

* minor changes

* reorganize files

* Add thread safety for background server.

* Simplify backend server design.

* resolve conflict.

* specinfer usecases with issues labeled

* specinfer usecases with issues labeled 2

* fixed issues with prompt template

* fix issues with rag specinfer

* Add server task timeout.

* register callbacks to terminate background worker at exit or termination

* [Python] enable decoding multiple requests

* update README.md and default configuration

* fix issues with gradio and prompt template

* fix issues with rag

* adjusted fastapi entrypoint

* update documentation

* resole conflicts

* issues fix

* adjustments on usecases and api entrypoints

* remove redundent changes

* testing CI

* Enable backtrace

* restore newlines

* version

* add back misdeleted line

* legion verion

---------

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
Co-authored-by: zwang86 <46699021+zwang86@users.noreply.github.com>
Co-authored-by: Zeyu Wang <zeyuwang@andrew.cmu.edu>
Co-authored-by: xinhaoc <chengxh_98@163.com>
---
 SERVE.md                                      |   3 -
 docs/source/chatbot.rst                       |  64 +++++
 docs/source/imgs/gradio_api.png               | Bin 0 -> 256263 bytes
 docs/source/imgs/gradio_interface.png         | Bin 0 -> 331678 bytes
 docs/source/index.rst                         |   2 +
 docs/source/prompt_template.rst               |  55 ++++
 docs/source/rag.rst                           |  90 ++++++
 docs/source/serve_api.rst                     |   7 +
 docs/source/serve_fastapi.rst                 | 106 +++++++
 docs/source/serve_gradioapi.rst               |  30 ++
 docs/source/serve_usecases.rst                |   8 +
 inference/.gitignore                          |   1 +
 inference/python/entrypoint/fastapi_incr.py   | 162 +++++++++++
 .../python/entrypoint/fastapi_specinfer.py    | 202 +++++++++++++
 inference/python/incr_decoding.py             |   6 +-
 inference/python/spec_infer.py                |   6 +-
 inference/python/usecases/gradio_incr.py      | 162 +++++++++++
 inference/python/usecases/gradio_specinfer.py | 205 ++++++++++++++
 .../python/usecases/prompt_template_incr.py   | 187 ++++++++++++
 .../usecases/prompt_template_specinfer.py     | 236 ++++++++++++++++
 inference/python/usecases/rag_incr.py         | 220 +++++++++++++++
 inference/python/usecases/rag_specinfer.py    | 266 ++++++++++++++++++
 tests/training_tests.sh                       |   4 +
 23 files changed, 2013 insertions(+), 9 deletions(-)
 create mode 100644 docs/source/chatbot.rst
 create mode 100644 docs/source/imgs/gradio_api.png
 create mode 100644 docs/source/imgs/gradio_interface.png
 create mode 100644 docs/source/prompt_template.rst
 create mode 100644 docs/source/rag.rst
 create mode 100644 docs/source/serve_api.rst
 create mode 100644 docs/source/serve_fastapi.rst
 create mode 100644 docs/source/serve_gradioapi.rst
 create mode 100644 docs/source/serve_usecases.rst
 create mode 100644 inference/python/entrypoint/fastapi_incr.py
 create mode 100644 inference/python/entrypoint/fastapi_specinfer.py
 create mode 100644 inference/python/usecases/gradio_incr.py
 create mode 100644 inference/python/usecases/gradio_specinfer.py
 create mode 100644 inference/python/usecases/prompt_template_incr.py
 create mode 100644 inference/python/usecases/prompt_template_specinfer.py
 create mode 100644 inference/python/usecases/rag_incr.py
 create mode 100644 inference/python/usecases/rag_specinfer.py

diff --git a/SERVE.md b/SERVE.md
index f6e34750cd..e64756e8f4 100644
--- a/SERVE.md
+++ b/SERVE.md
@@ -187,9 +187,6 @@ We provide five prompt datasets for evaluating FlexFlow Serve: [Chatbot instruct
 FlexFlow Serve is still under active development. We currently focus on the following tasks and strongly welcome all contributions from bug fixes to new features and extensions.
 
 * AMD benchmarking. We are actively working on benchmarking FlexFlow Serve on AMD GPUs and comparing it with the performance on NVIDIA GPUs.
-* Chatbot prompt templates and Multi-round conversations
-* Support for FastAPI server
-* Integration with LangChain for document question answering
 
 ## Acknowledgements
 This project is initiated by members from CMU, Stanford, and UCSD. We will be continuing developing and supporting FlexFlow Serve. Please cite FlexFlow Serve as:
diff --git a/docs/source/chatbot.rst b/docs/source/chatbot.rst
new file mode 100644
index 0000000000..fc6f616fae
--- /dev/null
+++ b/docs/source/chatbot.rst
@@ -0,0 +1,64 @@
+:tocdepth: 1
+********
+Chatbot
+********
+
+The chatbot use case involves setting up a conversational AI model using FlexFlow Serve, capable of engaging in interactive dialogues with users.
+
+Requirements
+============
+
+- FlexFlow Serve setup with required configurations.
+- Gradio or any interactive interface tool.
+
+Implementation
+==============
+
+1. FlexFlow Initialization
+   Initialize FlexFlow Serve with desired configurations and specific LLM model.
+
+2. Gradio Interface Setup
+   Define a function for response generation based on user inputs. Setup Gradio Chat Interface for interaction. 
+
+   .. code-block:: python
+      
+      def generate_response(user_input):
+         result = llm.generate(user_input)
+         return result.output_text.decode('utf-8')
+      
+
+3. Running the Interface
+   Launch the Gradio interface and interact with the model by entering text inputs.
+
+   .. image:: /imgs/gradio_interface.png
+      :alt: Gradio Chatbot Interface
+      :align: center
+
+4. Shutdown
+   Stop the FlexFlow server after interaction.
+
+Example
+=======
+
+Complete code example can be found here: 
+
+1. `Chatbot Example with incremental decoding <https://github.com/flexflow/FlexFlow/blob/chatbot-2/inference/python/usecases/gradio_incr.py>`__
+
+2. `Chatbot Example with speculative inference <https://github.com/flexflow/FlexFlow/blob/chatbot-2/inference/python/usecases/gradio_specinfer.py>`__
+
+
+Example Implementation:
+
+   .. code-block:: python
+
+      import gradio as gr
+      import flexflow.serve as ff
+
+      ff.init(num_gpus=2, memory_per_gpu=14000, ...)
+
+      def generate_response(user_input):
+         result = llm.generate(user_input)
+         return result.output_text.decode('utf-8')
+
+      iface = gr.ChatInterface(fn=generate_response)
+      iface.launch()
\ No newline at end of file
diff --git a/docs/source/imgs/gradio_api.png b/docs/source/imgs/gradio_api.png
new file mode 100644
index 0000000000000000000000000000000000000000..7bf1b99a5e6448ddebb6f6c68932da548f12446e
GIT binary patch
literal 256263
zcmeGDWmFu|wgn2K!CiwBLLfK<>EOZL-66r<8@J#=k{}5L_eO)$xCeK)hJ@hm{)%(X
zmGOP!a?Y>!>-88-7uB_QRqxt+t-0o$6{(^mjfGBz4hIK^B`YJL1_y_V4F`vug8B^D
z<1A5U0SAXEWGybPA}cOVqvGOdVQps)2PYGmsEwkd-bb9S|0Q13DoY-%8SMp6U;?h*
zCS|*n48lkJ_hKqPlO>U7*qBVjwIvA!Xgs=xvu7*Vi3t<jf0}47=LVMD^j{2L3^hO8
zZ43qs{}8Cdgd<~k`$AP1f+iYNq4EQlSb{n&Nr}N75eX(rzKO^b&Wy+Tdo3HTy8UEj
zZ%J_zYcJ)i!cNBB!&Eic7mWn&CH9&^`bT}ZqjzwJOl2|#sBo%1`bunseH?b8(wGDv
z!C9D=%ub1zmQ0664a#Z=7;D6E8j~OjXI{8%Z5n0vH4Aa9GvNrskAgwCa9I3Z_sGZu
zUbvQ`b|`)lxC5upzl&^scu;)fD)Y6okE$c8;g=%44h`PAYyN%4`sIpNJUitlQ^Zug
zSdid5UQ3-ieJ=t!a~-TTBU1|nmaci+0Nler_qaI;6xQI%4r-piayk_jqBv$GR16?|
zv-c6=p;w%$a>8%qar?ta%W&PIGUL;be!_QQTz!d`$QyZe)P-cuQY|b$XvTDPLh)0u
zjAa_p+K5ZN=z%|cL~Hx~cK2J^B3yNvS|<G5F3}R~pH(l}In}n_KtSO{Z#L<YUi~_*
z3kC(TV`8XnzL(Tp8%4?sunzj*)H0h-0WTmGc|r2`WhnD@NR89m<J(n(3T9v0H(n~?
z?9VBAKqOQmAPG*-l2mpDC5>%gT%u?6j6G|Fs{TL5sq0`H;eB9?h$VW-$o`*TIa-5w
zbU#6P4btS?Uj*#K>k?hBkK2=j7~2rq1F>@}%!4CoNKog!$-P$-vl$4T0!cq03OlKB
zh0v+33yFahkh)>Y5tpJ|+-x$-11OU55ByzBu}U=Z%la>=Kcl3J8Nj`GC)||OFO3$S
zofpUuk9SMQkHX6~$Vbhq`_Q_9GIxMUz@;iD#ZUUVjB`^KllB=wXJnRy&m!tYuip_P
z81v&0ktJ+7<m7T+87ybTAoyaD#tq*=8F!HAA;Fw`^W$|^zut#?9gM|iHr}vz_0$^S
z{q<B1NI#rBNy8&i+I~^Ro4-Cu(hR--dcI<D*tw)~{n_vrqizO;Ozn+VE;Iz%8y{6N
zEix_r+4iqWv#z+1NU!CciXWAr^!;umYZtc3Muqw;@-E{v+~zD=37&0tY~SJNw)YET
z!;mrjKUaU=QMQY$VJ++G($llmunDml6Z(bTzOMA-Hc=#0B*Lh4Mc-1ml!Q&piItr=
zL5rh{1>h<VqSwyOUK!mliJt1Ux}My_wH<V|wY7adFz7;qJNIhueK_<Sj)fPYguwj}
z8BC0dCZu2!z=i3HAqrcEwGrwd2!N=yVQ9YZXi(wtXoz11adS{vWFXEokSaWzXs1v?
z=x^hyAkzqpF~OLH_XxSmgr`6*Xw!8<Gl1u7GpzT9wqcB-EC-FC2FK$viHT$4z3C!z
zmN3A3wifr1MpXvkOV|gRxd`0PFD5>F$vm$_C=%tR<M}20hr<QEA+VaR?sK>d&N125
zN3%jQNJvU1?<Q(O5Z9OtHyUNQMb6hzGdE!<l3}z~PUEQeDWNx7bC5?i`=~#r3FI4<
zMeJKs%uk`+W?MSMuX-%Z@^s#6#Y~wh9ts<G^8Ym2rBmv%22pwjGlM9Udm1iZ`o3x*
zEpPLLoq;j@u>vA4R##9pf;rni!^BMpqzEd}zM|28bm`#jpzU~m$>NT;j29^(l+8MZ
zAslVpWw6G*X13<NMztnuCUC_0GehFV^Dh*#{<%8%;Tkebw54==FVbiX>D@mI7ZyUk
z71cvNLUM~yHUB~qigz{MmbqxIfA6=fd^MM{D;`UK@=Lu>zE8hT@z1~?wqwgE;_jq1
zY1!;QYJXLx)wUTe87~+eH8eF@HJUYlYa&CcG-n|DnnLB*DrY$<wJ9NF^7bVu8upR%
z9yMQW>ZX=eiZsY=Xn4}}WDLbhv(od0GyPQxiUf+Qro6VRCYh&prph6$lQgzEwj4Y?
zwuH6`wiKiFC1b_1)74`itX;S*ZM1BtrgukoXR@thCZnd9M)gW+)OUil>Ud=rqy!{V
z3xte)qR*}OdbvMY$i5$|ulA}gt$tI@MwuO3imlI}U7%oDr<AIcQC3^l=n%C}xFomq
z9-8L;Ej@-xpWWE8XxYCx)jQ)<@$~z(@15ke`?dDj3OVK*RBjk~0@*HSz3E|JyaTD(
zH_Q6PiuS`6JcmCfgpS;ERv}~0bCyl{JAK2Q!xOO=M0R62ZFWt5m<SGmqn(SLTO*5P
zzeWD~kk)7Y)ks}vLUh7lLNmWt(Pz-g;@$$GO4EX2Fnz*(OTk;%kF_~;+0wy|%7Kk%
z#ctW+ey(Hs#hh7LH&yga5}|yUdD1%5fW?3?^P6I;;w`NjEzgp^Y0Mpp9iHipl9h$o
z`P_My3hRokTAm8?1>%M2`Q@sddE{Be%HrBa2jyzZ*^RmKy4JNoelX|{NQ2+NLxNI>
z5;=B<av_``%m;@AyPRryHTQ3q8<Pvf-FvfSgJNB9rlI|69km#5i!Lb+#J83j9WLK8
zpq1Q6S0gR;>4!k2^&eYp6zwwGyd8Hwh<@P$OPy4m_I~WX?*-O=ouC!f7!`(KicpKU
zw^x+Vj-XFdNfTESq=}!D{}ZUktjEhS*faiu<sfI7+E36A-S7P7c75kh>PF*4oln9Z
z<9%Ui4%LnBrSmQCjr;Y)-J4s!E6-=&P@E7Th*ZdW&yEr5kcHpRzj6KE_>DcpAh_#Y
zc<^$Sug)7ChLE4I3fMTT7I!cHPkdB7N)~a}Tvkn%pDC5;M2AusK?hxDa=2%O;;exO
zRwH`{vze5He6HRHvk#Jgau~xIoi)_C$tdxfxvq^qxqsrwrzP&He6QWJ99I>SO6d7A
zos^oy`1u33>4%QfkFJr`U1*U41S|B&^sI`|RJ&vrMF*uZndhl$Uyp@(K<<(@8=H7J
zmY-S@ED~PH*eWpO734a~A5ar;S)6?<`$_d)zGs=jQoy0V9^-dR&qkaG@4NR1mK{Nu
zVp29e!=KoH=qT|Nh<r`cO`PjBcb;)FK1A>;1`GL$+@s%Dv9y*D=`PLr&oNi|xFERn
zyLuzDybFbCI)L|k7B9ShdM%thJ61orAS@*OKuAGsgK_eal|Yd}>H9333t?geKf{%R
zo=}l8#p~r)?_U0X857EXDBYrI!vHLSieIgTm7AS^68cc`trYQ;tkbqR+{Y#@yR*7m
z6*~)@3wV_IGK4L!JD(3ePqlpU=8YxqNaYWn0IiwbiaCM5Du4eBUHO#_EE2h{49lm@
zaIbv0-@S?pK)cDSm1veQ82{Pk+1?X+Dc0UmE9nqD&3diX&)lr@S53?4+?><%sM}cj
z9(q0#M6WA9pXAN9RPm`^p?>%8ap1aumQ^XE(Gl4EwEtT3R5P!5xh%cnTCBn6s)r|m
zXPhU^HfNf*tV*xWZYeqHM-+MDyF?$zr($BwX5$h40C#a%7&PV;`2er~{L5K4Ti4mY
z*EXr!$E;nflKSZmigVukd_9gl3!iEe?Qful_06u*9kEGd<tZs?Jp#$o*)`+y>4xt;
z4d*DE8h;KKIh;^63z_@08*MFb+;E*QEmAkMUcvnqU3#|@q8V-#F1Pdfy6DUg>n&DV
zjCIUjI2|@0-xV(<|C;ZI8`YDX#9p^JRw1Rg!Vi~ik!u8Z43Z2!%H|o~i-K8K`&(lL
z<#k<k)oGD}uJ?AEa}yiiHk5u`2n3u4kA!xTJSQP%^D=@so>>W<HufHb&kHVWv-=o2
zG_CpN75Qo092LWBD;r|8c%1X!T<4K<^36NGT4|c%tj#$gKG3?@yIm*;;^399=ebZv
z^Y~55#Q-&_Na20weVkBQdRi~lGZ8z#gv-tS_xry|lwT^hxD5r!`RUyc?&>Pm*<OsL
zkESz^^a>t$(|R8@)csK|6)85FZx+1Nh8dUo<=jAxB8{<{jBa}lhtBKv9aC?9UsE?R
zgD<Z9wop281cbSS({B>4x8^qbjAe|c{c9fPPg#!_nuCIa;PIpfKR=+GRAlMu!Zj^p
z!|`Cjku7GZ_As6YxQG+_XuU;vKx00Sa5+KB#J+Fsz36C7#fCd~2wh+=EaxN+1Tn$M
zF2lLIlG}v%@LaX1SxD65%o3jPRM8OJlB@5&4fu7l@g}|q8j>;cfba^@SCW8rxE!b_
zqRe$<Eff{un1F3mI3##7IAmZ89(W7GlmGX&6g(pw;y?Byz`=!E!y*0a7$xBI@f8oe
zAKU!%6Y)zJ918FsKJW%-BK+6UsMwi^|Fw;r0(=MePF-A97Wh<u?_zH5;A-XQmRoD@
z4D3L2lF@aAgCnMYe8bDCy*vc^pS9M|ann&$;D7IE&u03;(af9;Z142g51b&FAK0`v
zcQd5{+uJ#~@`Ht5{No6IVEb`5`wN<X9O7mx^g>5bg+|=b#hiwhjf0Kjg)lk|4UM47
z2Mc~R38{ZI2mTX!VdduL#Lv#|>FLSl`G(EW#gd)#?c2BP99-;NT&%zmtgc=TZl+*X
z2Uog(cJg2SNSM36cd>SIvvzc#dF<EJ%+cLV=*5f26aDw=pVw&)w*H?pIk^7oX8}Ku
z{qY-iPBsqq|Lz-TD)_jUU&R`1Zl^0@Z4ZnYa1LQk?l;_m|7h_4_tpQL@_#ke`Jbj-
z9K2lryXpV>>i@T?rmMM&xT8IAQa9oMxncim{J+2aS3^Pe$KU?H#^Rp?{g1uCNDHG2
zvj6v86GpEd#3ll6B!#tvvIg)8OtZ%q!VvI>@t>c-HvE-Hp|m?NDMaC9CEjU(;dhsi
z-3VvMP!4ervSgf+k%Ey?_xJa^4bchFyPHF6RYHi-6NvQ~)k?t5uM^DL(TGv8gFa>k
z(Rf{^I+}!yC4Q*def8jjz4TqcbC<8tYoqBV!-pVOCh>|VOB4<PHxLeq1`Zze=}laA
zWPBPBE_;T61KEGrga(}k6v&S7A9VhBb{Z-Sp#L~(VF$|pu>U|9TnplVcJ**UV3t6b
zsG$F4z5BoUq5nM+!HAdGPmjreABwd06D}C>=yLV<H0}TFd~#4xv0(!L;i0$@y$Gn-
zUBAQQ^uzy?TLp9r4E(`=c<BE(@c;Ks{(o!Wmuir?%m-x_?&mTaf2Hy{sx4hBZmka_
zL+uNJ#c3ekHp549Cuonq-nS=DMHR`&!tzNf=05oR*{*90MwjOQ{R4p3Yd_oi*Q1NX
zLS4A6k2S8H$2G!bG#HIz!!Y;Rsccv75wQiz#My?!LTErHi1;a@FhA7GOYp>f-~*<z
z;b`kiNeKy32XT5NnnQnNt`9QG(%2{}YZ8%eB;(ayw*273iZUvqrxzheS`-~i#?n;+
z94L;+tj&^y{o0>@tsa8dbBrF0_!E<Y8r!%@NA>u8*c4n$OFP4OIP2VLpTt!4p-;hF
zF1d12V!4NM)0D4ct0#v1^zw+HVL2UnA7(q6neLFxvHC3>n{sSQAP1ox-jeY*1+G(5
z8=rB2>{6pUui)Y5oS?}<XN*q!!jDg`2O1CL>MZyzJI<{?eCSx9wfb?+A7_!Uz^dHe
zhhA(y1SI>uGQ4T(WKd35*>AcJTVT<AMztjU{f&9$WS7%IGzt4_ZtetZ3PFiC7Q@*v
zm}}Txbz<w#?e`RJhr-hQVr}t4gHRi&x1|OR2!?6?0}&yXM5o0LPZOfEeAu?Sx~kFi
z0r}rw<T=uy7~=Tz90IBeLb8ZH=RCi(E8rsE)cl4ufUARI$hGvFs={J~b8~`vS!%}|
zFoh{)iq!JPwHBKF*ScPlaf3l=!UT5CE3HYlvYN#j<2CP`M5Tk#QM+_9--SR=PbOud
zza<zx<O)QDFx5IP$h-~R5=$^YTiLPNtWfP|>Riuwr3`=<Ju(LY0^cN?$r8tUti-49
zephT@&1j&TmQM#_?Z;=?t_IfBmH{t7FuNm=N6Ys&`KlAIVpx`^pl9SoGrf0@SM8?Z
z6c~4NeP+A8oP%S(+@$G4=0({K{~ZAXH^Mzgl`dTMLHTBL_$z&CdD*_7ra?1>LV9{S
zWa41<=hu19-F(O!z1Mox9QN~veDpH$qIF)Umd2xtUKnm?kE`j4s7&L56o&m=RQwrE
z#TBgfBg!rsmJEZ#Sfvp1?gD!$bdez#k?lfeaVK~fIfI71oRFCPdMu|mfiJ)`+P<2c
z@;L?Uy(>6Vx?I`ncMt2ldgKl&Hfd!hKElrz9KUCZCQGc}Fa0!p4Z`)f%P#x9G7W=U
z(Fw=4w_Z%nP_O*pnD6X$zlMBw)GK&xvseeckwSjzTHz3WGC0wlepy1PBczH@vI=Bx
z8|U0>Y15g7Zx7NDjbRUG(P@hVgB<ncO8H|L88@q06}x$pf)Pj3g}%mpWmJ73_l+Z~
z$-$bIi|flV38Td<Qaijjv4$9p7Si;6^AEXXwjzPrVkDIDJbC#7C5mao454;->y1Bs
zU(x7DUS>r^pcbKLJbmjys%^`7D7o@)wm0J(tODb<nC@uC@2o}eC`O}9mMq}YbDGQt
z{_@rsHyk@|&jeH`+BbaGbuu~nV$S_xQ)bE;A7eGhprxTu{DyZ@u0EaHdc3ffSsQFD
z99ByM$|P#%M>12UF*(5QPn?kUM9{vX9*iRDpNLwIcAFtdg9Yx>{G0pTwuKOjiqrLy
z+k{Zei9a}z;04G888vkXc^HW@Z?Z_en9QIF99j9Hj|FFh)!z3I27g7w!d9wxSIq#*
z6q;q9C>RYNO0_EPK0Dc9S4p&ScUv&v1jW-yd+^r>B=74rWM>A*HnrO^hRAv1a$GO8
z&+IX^2Mwq3kA6Jp-C+cV;d3U!Q(y<ii@=G7gM>tpnaE5my<@aQ%iYEo1{1BOV)r;E
zT0UH9^l8L4TfPm|Xk!;iWYyQJD|MNgcU$d{G;CItR0u}&ZEE(pr(ZF6>!qqWh=4ha
zjh(=x8!Qz|A=ZH0TWvj|hF}T}U8r-Icx}obF647D*3=O2#S&i`>a?G*eVs?-6M}f#
zBo#*?g^Yf!8g{z%+Il?qbbCr38t?$W1a*&|E?E+NjCjfH#&QJ_=aysHq1K0)_X!Nj
z4sz_6SLrOeE=LA4<>BLf>hHP&bhICu!>ELPKY(L-OZC;xcjw#|YV9AAW2r@oij$ct
z%?IS{7plK#t&ae4Hsa!yHY0IUlbXs1)sm*`oH5i*w!X#Pg&EuF(~S*gBBPN4YJV<%
ze$Qd%!`(rE+r_@2Uac>YV%m9hR%$^3Lky|#H!_|Q<*kVVg7D&i+e<t{sBb6&V%$VR
z(ZtsIp1`r!t}g674%uwn_GFQyE|+CCp^?$rejJr>u7KzMco1Uv=8hu+e!xm8k>deH
zhYTe(Bt^*YIwAjoOI@>fBu~41KS2}q8NKr7;LS5zsMiTGa)yw!eyu}JC`NMOJhL{C
zE!q94xh(r-o^yT3<jjc6mWUKgQ0!W#W>B1(a_%0Pu#9(!!Z**+C{k11nPx5g3ETbs
zTk*BpOOjIKR)2co91IfniAVwl>-&so#+QFmT(rHu7YMx8sen5=GshRy$DlIrPxw+N
zkI^I|;%fiaV;5xqa3P|37T=Dju`}MkEAn^l)FAi#=g|VIMj_2qvA#Zk=w*ZL1r@*B
zW`sd+Yr%*J`MdRxt?PC_UdrNopKjtAHj|0<#%AEA_bEU<_MnSY7*DQnPuvIxFb(wL
zFIyITiwF`*_D#a?D}Ryu!!!_2U{aRz*CdT52~M($^^JMOHA47#>t}8;%UWIBAdbH$
zpHF2ojG&#Z;G-`tmw%?F1eihb?8Zj4goll*9DDuIQJ+5L#-@q9NXJ+%oF$`x4exJF
z1XOwp3-_Louv>M8DNY_tw1-iyO3h@I?9Be8j3MRK*?p-!P0o7K&=dC%YcZ5wyg=c0
z9D$oZs?67(m7to_yFD*YG?dDdZyYe@DcI_L7FD_ai;hR#Z}_`V$o5QmF{ClzL70e9
zL#*V+`dEVY)2LdFVIw{fkz@>6UFL*k@VX+a9yi@`a={n}^WxhTs6E3Y0MaEeYz_}c
zQA|Ci<FOw9Rq@-fq0=_&{X^@6hiU<v5R350`JUcHE_JK+J`>x<DXXY&%wkZBRlC7Y
zaibX-)ppZR;?jBYblW><qDG~Jv!v|}@m+KRz8KtvhQN{IR&V5r+SWL|=9vZat<dFh
zu_I=y>-RU7`E7LY7L9tP8`u}Gh9<KT$+MC%FKkCE-Xf#FL$sym4QT8|#8K(_^jssk
z!gYqqW}&PK_miwlz~FV__S8h&VD@5AK<5(lY#jMjf_(+%Q}v&dB)nxP%HnJ8wh^>;
zc<tL-Xgg1upufz_I~Mo;0@<%&N*Uf4e<5xH7yFVbSsk_R$KBkZHphwKw3Adfn<)m*
z7p@H1l^{BhO0&1-wd=B7F=b2t4wrr{J!rJt(UDBZ=G(Ttch&FLJ6EiiQi^)tTGC4G
z1_o}=Z`LGTBR4|p>I|T6-^sWE1>#xln-Iik;=wF39!L>es({4FpR)oiG0VEv0NN?u
zDx&2Amqfj_h1r~spDC{c=6g$uAn5`ZBKvo*OZ8h-H65$JynZh=-{ci@sO9@AXDHu2
zE6Y?P$HFg)P>PO&$)Y_dti!cPH3tInmIy{d`{Xe-6&fC{e)NUN?JO1(`|!<`X$PN1
zi4NY9mt7Ia?UIql8iE~CujfQl8_;-r@%=%G86)o5M6Dmmnx*-O=ci7S=wudkD)fOT
zmr*iF#NJ_GW9YNXAX*UY*jRt2QIraL2fH_fVqjnkOHbKO6YRwB=Yz%Pjy3JK<72Iz
z0#`26h3zZ%$r?JWsLp1wu_ucR)hVporm=N8F|;-GFt8P_tX~|B9*?mu;u#e<(5+e8
z6dkHO+#1TH@z>;8<S&5QR7)h@PQ~9H2!Ps1$no&9c64}}BkRb6KU%*k!$>=I-<hnO
z)~LBl;*gXaTQk>mpC`H>+MBCU#I&}mo2#TE_6U(nDzloMWC69Q%O0N8)P17hk@`U_
z+K`bGj3~I?9{C<6F+6tqn6HByyT6Fk;57*LX{Bsz#qyrDh45aNjJ^|f!S0$Qr?xQU
zDOgtjMbr+MeVoATLk4EwwFk7X#`okbd9qpGa%qYw0IACVLGs6f;X=g5^Nm<ZTl)O=
zph$w2d?m_-9i`5b+?zkg6H~nwPJtWGL<rmxzPwU|2spYivmm1g+bw_e|1L}q4NtoG
zO?wkf$V#VVN~3K<e81EZiGI00GdbVFe_h3Hwcmscp){ZcWkP8fN~(88HGgQe?P>^q
z683cH&Gi*ol}_Q`(_W$-3`T^8@oJIA@WTpWaK;^3h>fp(&h2=OVw|fUD~IJ<$v>Z^
z4d_9zl9e)5r#7Ab+W9!|^Q;*1y4h*c(kGB990J=**ydqiW$R?9!$iLPJEyi+uejCF
zDKHk51?`}<gv>^<4$Dw_t&@t|Xp-%X^1Ags8(~oZ0W7KpY<HP<zMUHyrcP~#_b|b!
z>NxpDE$pJ<+bE*!V9cb}wX(gi56pZPU9JguQzW>mx-c*P$lnY~qwOK#ufKBq@zXWE
zzqXsJOfe+en{Q5@uipDmf7j^Pt2)C*iB;!JkJCx*drm<q<o)Rd9bJ(|(H9NK2WPMC
zk7)v)(c(F_IIyVpAn7=&380`wF1AbHE%lD@+&g2Q$q)%p+6bkEse60r?(PbE9TQF!
z%}6v9Hwn7;<4i&|F}w^L+UUe@&ll|UT1^QgCGX-OTBQn|;n-Za`>qQHEy$Zdm;K`L
zrS0(k=>W=znvnZ5lp22NX`y8^Z6jJRf;5oobH1x&$lr{1{8Bl6kQ>SQXpP>B+B!(!
zYKO<_mFICXtA5J8QH{nti~n)WQazs1yMmF?Eb;Je=<#~L-tE#I$eQWs0qlBoc$hgv
z{*cruBrGf(rXD3BDTx=ioXL9fmpykbU{GCi1$Al#gU{+Q{!$5)*$glb-|o$mQGjnR
z(F~z(k!pEzlFQ3)-DX%c53BxK#v(i!Z>8a-ff@f6nDJQc@SeBlExopX+u%@8szX<l
z*i{NYLayhhPQub01yT506YYw+UV<uYy78Hem%*E!Rm0n}=-7uU2bLog$pQm47rtA^
zM9y+>`<d#*_lP`Juz~~*Q!(?JCOcw^%e%U*$@<UEC{&(p(`5@fo2X4J)Zrv8R1e60
zlg-f(r3SOpCP5*gt>f;A{Fz?Ly&?VTJoSR$gzy)}D+blRTVirQK%9vzn(a>9h}yte
z{i+=%RHw!Swt5e`hdriZthK<i7g?QBV_#a62K4zo?4(5$E~SjL*$yXBZxw1n1?EOF
zgsd;`(1`LS3)Raxml{d3=3_4A8r~P1(&Rd}236af>1q1dw!`lyJe)UDTlEa;x@-b8
z!h@ZzGzAR@lhg!}%pOFuSWKRH=&P1yhSWqvAz72*9Mp@Ih;5fWOug3bDm)BzS`Wpc
zU;X1?2H(IYuG{@BGDNL3c9l2XKcpahG>KBcL+vJZsd_4G=lmJUkF$mK=o(^*df#=X
z8rzl7G9#?d2c_0urMQ72E^I|oL7V1{Df|<#eNlrZe-+*n2kY>?xKo>AYtz9_WpC_r
zNk8w4$u$3oeAdZkX==^8b9?e46ZpGoxYm&rabw@B8c3-}_c9F5v%+<Q@1amVU!h3o
zN0ZS{7e&L~w~n7mVS#xfT({>QKn_^vD_W2CZB(hYGF@fe<e9f|USa_`ow;y07qrwK
z${^-_e7m2AM_auxl<xua2w*jQ7xD~8dyfmO5<tf5mI+bPTU9z7H)sCJi%Dx=cfQ30
zj4yYoVI7{3@1=}qUosm~pJRb7pNnV?0O25f`+2-R9`-ql9fkPw9drcXjY;Jz4zo)W
zGEinlZ3AgN4A#B3;OVwdpAG(*UG3ayvsBv*e^Y2)j1BRYZ-=MC3RyUbAf4}^jc;zO
zvjxf}-Kvf8S@s@s2UiIv8f_)&?Uhz`zq_Fe0K^M*p2#HHYO&{Vb^IcmHzS^gc^uF^
z228e<j67IdQt3jWZJp7gf;Ml7u_S#I$;8x&74fq0)xRt5>!U?OkJqi%qq@hSi+(rQ
zqv5OzlD5X$^N)zeo6Nz9H5_N3)AwtG`bM19!Z{^GfMdttZ&r&udfIGKl&({tKwDxC
z(M$QHPnV_s{vk_xt92_^F+Mr?`t9)YCqGXJ;RJ~Sb&rmY^6%guo;&aYi^1t!u%uaa
zHEY-BeA~8Kw&Zt3d-ut^Fggh*X)r({LHy!Ss4_o2e^a=fo9IA&mOqqQCs*td02Olz
zEU0EQs%)|@{5^72Rpe1h2KD*<`PprB!mIrRUZ#xm9mO2!B5_hRft<R%p&zXo9Fh4-
zH<I&HhbO<XniF_ziKlpT_&SGxEIcj>q;ADdG+&b{Y%BS+kyuphLWll-xf6?+tr_EG
z1=&nHo1&_PIe<I6_n2$jZLlYna@?H0dr$w>W^T8!BL+ao@2`DSDUq0;gfJuo5wcdI
zP@+#D8d=yIBh<si{l%hU*2V7`oebr*DUZY<LoDUwlxt|fXEov#LS77PQmVl)Ie*(G
zgHT9V=l7HSpF|WKsb#D4H9H#l21L=?4vtPH(+908Ibmm5ak^q)fwYalIt`Y+jFIw)
z?V+2B9TKc?mJQlrW{nbuEpDy41~I3$agK9e#1-E=diR5AT~BrkIusc!a^4c@s(=Sg
zJx#wPCiO`0HM}_|`TlabiSrt6V4fMbdHC4bclT%d+d9d^19aGjzYynLc4yHbD;3{s
z^$g<nU~tM)D&<C$5Uo6}_2VJgmIfEK6mDzG@@|G?Y9XI<g}NbN_~cuKq#r!4EPz1|
z82qlB5qBlGL92QA3rjFKM0IscT}-U(xxE<WQ<P4dIWh$vS-ivWQYRv*v#9r%%W5VQ
zUc2k>uqut5eCO~QU6iTn49ii^74lZf5t6lEFt}Du<03iMXv&SBcoc^~irS&wz%tY>
z)f4v<q5M#<2&v`+necuBg}<u*y`s1JcF=P8o5gI2Y?YSV=4k4u%-_N9uMcGcO$BU6
zrkofQ^8}DkgtsQ5dwhk}T-PO}C{OyO?(ai4Ggx;LG>^GZ*g#;~#7CGg*4Z;GXcJ!3
z(N4K1Lm?O?I=$PV+1LZ5A^#;gCf)4%ZE%yBwHuB!3JN&oOPL`*en7z8?Xm6;h=fm;
zX7Nm(>&9uTswK)}tWDfs**&PN0ixTA|2m{*t0Ode{PiK)lljpLUOMbqZmRpnAt1Yq
zt9KP>!c*~P2vpUCuJ{TQx#{V%mT8x$ELWtjD6I2o3`NlaI7k-i{F|7J!-`SJ|F&ya
z!_3bP358_{Uc_|mLkgEWwA;4wajaN7riy7htT3in(xdtQ_I*wDIJoVtSQ=f;u^!8A
z?Xpke_xJHzjGHc9u>xc2GcVDCMoVoOuFuKuQs<_F5gS~tRoaZs5~#jJ^ZujS(Q9%l
ztDZB>c<YBTI#Hm!{<|9(B(tj*T-PxIbO3Hn@V%cywV8m@)60I5XrcBY{uglB@o@HV
zYSV2s+>**6r!YBjZD+{sEEHzeDw9oSGt`<gMSday(ZC=GKY^LFKV{g7h>9(vjGIA>
ztmf@CHV6AnyfE9y*=npB<$F2mRQC-DWq+|j-sk+;Xl~zxoj)QkZ!jW{tp-40{3TsB
zjx)*_4Z}*ss*_Cw5@Wr1oWObYI>4z<*2~J<*EpoDEMhl%ywe^b5>d{OUGe8rU7W6x
z<|Dh9BJK2$>f9setyYPIwUJZE4-;ROIP`xR(w^#}3_%oxww-1KJhCAg7iI@h0Ll0`
z4}5Vc;$J>_<BwEnc*POF6bOW&0LP|N3A3VOZmuLt#gdx+jA<qhxO7HWyzc{B`BuT&
zx}%e=Hp+w`>XK4Y<L;&om$n^@&lr@`@&V#<%0pkv45&t1e0A5n{>Jn(_@Rt$x5k8*
zB+vW!Y-A$dc*qq)MuP9@-7maeZ8GL5rRhz@YAgK!NxJXwjZN7yUzYAMCl5aoe*l$3
z6ilk#z5Xv&kG%E``Snu8Pg(k4L`Rc<0iGU-*WOd?MoqaC!d{vJjrvZR$_MG(9)pZi
zLZqdKn>c)q%lHK^3RQDbR0&)X0nx#~5g#EK@e7jh6KWz&3mS-yo8~)I9}L$Hzty)o
zk=?euv=AA-?D=8UwA2f1n`1^yq0{u?Io5MXhW_#<>G@>06c8dSmiuGDRXf$5UGP<w
zgj7^Y-SS!-0x<@U8q9pXX-!j^!RAtdNU3h4QAs6X1S!Z0#A;Y8)=<1OfQsEj%dB6^
zeb;PLlx6G|{t>4UPpMSTQ-yLOEg11Tmql)lG(v=QF9#C^@ocqMF$aGSPM5ly)6wZ^
zZgKM21m0ooHqVZ#)8Shq4I)cr&Br>(?JF=t@h_i{XM!$Y;(i@%Yw<&gxcRlqx=%<Y
z>eRMeK#sG(pqP@tmM$WRhX2xObE(z;F6H<yyFwhb$QUIb8xqQ8K6o=AM`@UdS!<#I
zktGgh0;CiG0dxf%R?{;vMfsi(j%xwLTk~q!u8CqQFP8I0i|Tj20NNNbp=qnHL+(IT
z1Vk&f6@Ns<xQQm+_t$61d^s-|$(#R49p#jKNhU#4mz^wBRWwQ_9?obL)r3ra)^g8S
zf_h{-wqD6;k5JAmzdhO6&Wkd5>&FOi)z+G4x>;uKP~UZkLGmj_vNdd@9JN|sO>{h|
zStkkS0$8AKTR0_nJI<*222aG%+&TOo^Wh7|zn>4N0FzDQevd=R6&Qv|Wy1Hpx^+o_
z-wOp;UYPr_1v_`nIM-&oR!eyz0Y|~pI?o+4JlA4Ra764N3mMEk0e3=o{J%YyYU}YS
zKt6v-^Ax_Tc?Q%uu4KLF?%&)_BmyFUe~RGe`C98D!H-Rg`SuL+H9qA{4%HQV8CV*H
zCh$3mfA+q{U3$sW?_NuG()8s>$8~c=OtSH31a*+F1C-VD9+c07y2dWgU*Bksu?!jI
za(VDaK)SFxxY$4Y_&le1SFSzi2T;}loNfMv%kd?xT!wI(!_9D7W0Cz08`QhZ>4THW
zMLL|#Qhv^=S9Kzv7`t_G*V!|yRCU<T-w=DC<~okVqfj|||5SKfs}H0TL&R4#z{a5g
z(FmFQrl9Z6wtT<6J>IIN=J!oV;pW*doaW{AiN0NIIMJx_Hnew*Vs3}8qWyIhCSo@i
z3)Ug1T01a~xSy*Wc5;39@P!ayPv*69BSh@ys<kv3N|Dlp#cOQ%5`dYIB!>P-F+mjQ
zr-YOC2a>EwHBcr>4uwvdZ3oVFvNWJ}=Jqx9=^)h?{9u!0Q&^j!GzE-&q4|Wm|0_e?
ze!AC(5HtGzv1Xs`gTS&ZEFyryKU~4TPc_rn=CP9NjmzMke>wd<2Buo)Pr&cImaytS
zhK6moQu`U5_;7-9WL}1_pK=!s8+1}PFcSd_JeD<m{zT?jg9hdZ+~oK)5wk9+x3%1{
z4aC3#2ZYIH>N)n^8eO(NtuCzRh};DK9o9FQ2)*Y$v9uZ2S#chkAo|m9sB)3yY=DM+
zdwimtpTi1(-0ps!t+^^o{!TS|`B6ZYVU+#y5^8T?N=N~_Cg{ah3&Y&<Qq_KjNg*|m
zR1RRnf|~$=+W2xuwk6&&QoehE6i(M98~wOA==h~`k2?P0FC@W^AYI1bR`sv`m$9|>
zEAMQl%d{zzwf_#?rEO0a<rQzB=g?kXfhl-@C9{{W3hz@;RB-!!)ZLVdhOMr?yA_zg
zUS+Rw^>7L--|+tBwRH*^*=ilkb!_3Gk`0n(TZILxzShnn16c6vg#<w_F1_Ysb|!;a
z<GL8;1a&7ya-e>U-kvNgD#1^_s_PFZA7n`sm?fZq-96TfuC$;wbjBx8GOjU_78^<a
zO<88f{=)d3eyR}-|0=v~Z?&7y@N5_$<0dR!Qdqb)oUmT~eJ!D?s>-`$nAlHby=B}(
z8^Za%cMKr(i((11gAoBu7hhnjeqy3<5$c|5Gi5C!=nkKpEBjTgJblTk>yS3g6l;sr
zq8;8gAh%vUNx(9%W9Fj#(8GPYL^qddY6H-#`}jQJr?`<90|f%g4bbx+bMamt(SG6m
z{tb0R_+&CVd9~fxkCq3AAK(nZmwrKF^lmFz&c-oW=|WK1#v);AL9pnMu$_2&`v#+Y
z(%@u+y3h7}9^F53rBcJ%a63G2qs!ZGphZ)Sj?T^^+lx4?m2u@{Hde*UeOrieEA}37
zeh~+G{|bPeTjJuGEnhpYbwTyl4v^wR%?J@-J=(|^*ilvk{}S*u-2n=GtGxT<wQl7H
zi1)hOkRI0N>30+J#Cky>k#0{k7L=tk-|InxpJ7os)GO**JN^ScwMZeMBq%@0zv9jy
z@1{Wj=G5QzVWnl9hsH#t#%jt)cijcZclC>O&ZQV!<h;TxyU!9?49Ci%u^POGD-b8G
zNbi71X_EQ8RVmLxkzBvp`}Q(&7R`~jBhbUL3Mk{bsoypw1L{xilBCfFM_Z|WUBpVy
zUjXMGcPAT998~=!<-N*PW+ywjlIgTpqxYO&X*qdC_?c7unIWm!z_k5jjXrx(!=-M%
z!fU-M@9z+$#*SVdjQ6B9LrHXTKxJZFZGt@oWF7;p``-EZQ;Q(7bg?!8OaJvOje&pQ
z&}B*pzjdBi_qN+rzoxb3J-0yeqNon+j?JK6MzB;uiQ3WmG=k!7WpNX;b}4JE>VEG4
zP-;7EwmI~t3#Fc`b-DZ30>WMv%ID92(&$j~<kF&={FW6G&8$W4jWSxD-cew+^)95U
z<;pmKea-W9oiZ(AY^qf*9lj-|b{vEk0L}!3<t8tyxynRtw^>F_S3pe!BJ>MTrniPp
z(Em;O27zfzY#CZhv*05KlYT?RtpX2F0EAPtrq0mjn0S)fE=5_5LBf`0N+&$A_r9ou
z<zpLV=v&vTqGg*n`Szd$BO|xJZkbs*^z8Br043Xm<4KCLJ7>yI7MS;&scsKzR+?4c
zT}5jvX{KCXmR_E4W@<rwtYR$Ojr;JMO>$e#4NDlcMoekR;l)5&2%@i#pdL!xJl<EA
zZ4KP1vSOTyrZ|{rV{NI`aV{F~$}qqqM5-I#a(lg~v7Z?Kdso84je&jW|BfL}Wxm?F
zgi>sAxE%}IpE0_*9e#NRK=l89LK-8LxF0W&lf^HxP|g^NA^NgEf_TCVe)uYENe7)`
zB|3C;{?dhBHObbN=B=u+9&ukBO5qe@)@%7?AvPeb=0C&PR_+YLPB>uC#{e{c-(7Ea
z+li8ufEW*O;EGYXZX@l{kNqU{IK7JZHx@rTC)5Pw7yb?z%j8JKY4ZGBXZ4xF?m&;j
zZ_6P+bb8Z|PXaIrn(fo9JAESuL#Y@2H&vDm8sFvC3X%H#2K_fijGN+DPPJ>b*~)cV
zBAB!o%YgtnB!=D}25^u$39r?eiWQRc4p0StV53)CbHlH<UkaEI237)jV2cYpkExFy
z=MfL^1Q2UC;9B7<Z#{q<F2q#wgs(|d5T9e`58x^g&3?mQCICn$!jC0^1-Ee3hm-v9
z&p4Z7ohW0o3um5l75+qzVzFly5K;f67Q~k=>q!FjdsjnE%sjyS1#k1&y>g5KD8`nb
zc%3K{ZSZ%0e5z|J%(`vR0d#vOvX^6P!wPB>xI`77E;nxcGG3ruu&|=my+%J^^-E<y
z9oOn2<L!Gg9{X__eS7D$jVkJ!?wQk#V9Bt(U9SQE-q^IsmiK(u_l-xBc~#yCAM1e&
z4eW^{mlqP=W-6V(?Nc|s74!?cj1x*&_d`Z`Br^ksQzZf2SIa1N^|--xqsZnAy2eZ8
zW!krP74{BpZ`iloccso@Dc`Z>Uaj#vpk&k^^%F(Azaw0Fx2!c;y7CdIRp=dK9h?Gj
za2FnD+@Ic$$WQnlBf=5pmF~ZVJ$os(?!3gx-F6WO3p{<fcRRSF{jEu@<vaDglojex
zYrWPW|G~wcfT*Aw*sUMXcV3H!ok9)iLazo-NWdg&90C{0>i+qWBDc8<BKbrCtXE$l
zT1B}6n4U;3;h8z;D4hNe_Wb4pNmHlsIMl+~{u$WWr4M!m{57`YzFDrC`gUm8hr)tO
zNZ~|K&mBAGS@-nfv;vGrEbu6_p1bjuYD09=rDDjWx}%BmkkIhI?RTa%1eEJ40|aLs
ze|GyXJaH@0hnD=_wZryL->a-Ty86t>b3UWjD=MuZg!SsY9DHw_BgM1COVykySHlnW
zF6!76Y}&gz+4z(8rgc)`;yZHz4)X3&R`EuZSg8DXvkzX_LPFvr3*u_}CpL<RS%*?}
z?f&lObRuEv^rqx(zj$F%F`!BWpiv&pn+-%D{+H`(DbZtpUfh1ceHthjxh#hjQh7^W
z+*fN<k8~~wps?z4$NBoXe&6rOv2fcT4*`<}y^y@M9>}kO)^<lF=cLv-Yyp`2_U5^;
zUHsI6Tlw-Gpm`4+mu1bck%p0zaoZ^c^~MhD4HBE3)R8a20s+T^VS`)GXvg$H`P^ML
z)e|6(24)9O)y;3R;vb%#)QJcWk3!*Z5N?#)*N#iU5%g1|6cbBkFP3VNj&+RyK?@no
zb~2ncub#fxk{|>AeI0@$oM}5#Hjz@ZW4$rFq;(Oe6asjJ)Drs>8I4;6*RBA8O%6yK
z`G5=Vk-hgmY~!S}%soBMwirr@*jSA{))r%=<vOON6!!gif8&@u``LEn?8FT<ky$fW
zE|DoBD4OuKnu^RX9!^+=+Z?(NHc`R+am8H>IbS9M@-1WCXwdKq9k$)!CM60sMQ%uV
ztPYk%Jvu519245Ri19o*706^!L~CkRR+bwe_8c`nCnK`}7v;$%WipAu3cyF%U8~8!
z^^G^Uk~|7~Kn3hjuk6Nj<=vmiEWX~Kl=UJMV+><eko{x)ubQ2#j)z0)OdxrG_IMe-
z`J>m4+Vak0XgJRM|6Wc%S=-pv>GAIa9L-mg&&*C9d^FQB9u;6I3Kc&THE{FuccQvQ
zX<==Q+-(y?KX8PL7O|cdi2r%6Kr946JqhFY(1`O`DihZ}3Y8%Dh*MY0RV^Mef<&wH
zMW;Hy4g!m;i6+@CuOWUGu2BvbhZn?xM?u9U8{Ibf4}8^}1fouXg;rx7+?MAG{V6=r
z5zhgc7kaU&*c<nIef^tXV?|vl!Vxd1EeFF%r;Rz!KLK9<h+{mkRLu(IDasBo-bGxW
z?#rg9M`{v2u2=2yu)=LSLu-KgG9UgiW^>Yb@nSP<6mLL1-l*P*Q%@Xra|u?j%8&Wu
zDinE5J(R*DZPY7vii}G^GykuM9tytvrE0U7n+L&W#*JVN0s{uTw!k@5#9A>rZj)ld
z`FBs6+Yeiix#%x4rLMlHu6;!7lJ`2@C1Mr4`c;&yndc&@cRho!^tKMDG1B-0a*OM<
zRR4v;YAm38<;Jb~`gM*IV{}2M>-CPW0dG!OjA}PPzx2)UB{ywN6>BH3N>h1JVvLah
z1Il<hkNoJiL&sa;Btp?L)1_HPM!_YESa&4E#(8qo0tZn4D1H4V%=+~U*}7srG@oI_
zSpD-#S@E`+k9l9Vmqw``(UNt#u%8@2Fm7&_Y99W){Km-&ER5_&VY$)sKv!_G{jQNw
zI(FBE+-<v`kkbgbpiPBQRXM;1(0_dNn<0TAqZP96SBgnBnK57OK%0J_hnw;oWJO9T
z2)^_)#2zNcKsaIo!6HWCL_)~3XxCbGz*L}@PchlRxJT5Ax{M%ch<I{A)=uCx&+h}9
z1g9K1<Wc;o+k=XeLqe_51@q)p{Azbb6Ca}hWOzObunqX8hvQJI0>azo-%|bj0!gQ~
zgjYS}z)gRI$=3i}PFx47ps{a1e`~lO*qTp8(Q5!K-qmTbR(W2_-Lw839jAaGFad>=
zhLx!IA8DNZ&%{Sha><YWYOzeSSR5<=2~4f>?z#4$6duS}2ePX|xh)XiCIK(U#GVxS
zr(i_Drt8ME`DszmIa?xu%}`J7>nkiTuRPp)FV$cq$9&s(@@B&bz_o-BDu)~Q(nJG@
zrfSX#lmHP(u`^jFYuM;U2vn-ZGWrj5`=ll)6zeN{sfB^Y{#P=n*uMy!EohgKP>!#O
zUX>>lQJlj#wgWpEooW8>F!NYxQoMvg+JnsHNz~Tmi2gKwii*kxs=)poz~o7nVc>rZ
zWyO$c4+8vXqZN1=-}lpb?a92~{PC8T`~0GzZ0UmF)!3wU>*jU?;GGsH4%Yx|xwt(#
zLcczX`@FWDW;uQfK$X{PgJMl+*a?j4eOWkrrhgFmseQ+@db`@6v@75SiYg%Wn=6Z9
zq?%WIqguv+a9!3}=#_rxw6Ib6``y<6JmzP2+nS#!<15J_pomxc1~}08y+MH>nM@Wz
z^LN6nFZ!9ho&&Dmj#Ug)Y|xL%Rg{0anVWrN$=l(>30f}@ds1P6IR#9jPO#<xPiOci
zN^jtih*`!%pPW+-x{XG@+qCBth1%uVLwE1<ee(d_&U5&d(CxSaLgzBF>^BK<M`=i_
z2?e<E%UPh>%tyTO#8bA+WbsFio(Ms~Nzh#53P$9|57$)qameGoJ!|CN<Ut7?4|v#9
zn=)O$Lo;Y_3j;aP5h0<xjI2L-?ih@C`-|c^Kw8r5-=aD(Jaw5t^=ya2A&AUL?Ad^o
zb)YMm%{VJ6(Pnh<ZL4ZCv}XN!V<aOw2%({)UrYfgO~89idj`F$$k?1#(N!UcSme_=
zWK+eeK+(nMckM<<Oe`fGOOa#Pcs_cMi1PSA!Mr@T;l<HWQXOF4Oa((w%^&0MRGDT-
zQ*)I%Iy*Z$T7wj@0J97mFUA4)N221Mk;7skyk@zPW_{cuFzNY^W^c~-3KUZxvRpTY
zqkG8(EC|oGmek$t0052c5BBzsx&fYg$^}?<uK*kzobA~x)~OQRG{D=*q!iu0(AnWI
zI-bY;sIa;$Y_e$-8GI(=E|hL*X<$s{`1nv|IkGi>w)5y<)vMoRhq`T5E`@6?6CC*d
zma2DJw9M~St(_q|R04dD*~4Nqo%-PWTS}<w1{<Y_fABf_%0YnVZZ+6$UDoSE?AKl#
z)sBy7>)Qdfck+TR5w(JT*Pj3`qGn3R6EO%(L;>4aEqoM^91iz-=*6DQ6*TBgBQVil
zQ?8J@Ys;Z@`S-1)>|xJ9f|)GTXS?F$d=9Ew-`NCSfDQo%{bZ%N>(txJ`Af2zZr%1E
z_&bp-<?GXIpbWBMe`geMcg=IhY1v}hTe`Tp*YU}?Kn+N8>)ROxBY@u_m9fm#@~$Ea
zu{+kiA;@BNvWUiJyrhQBF4H<+f8A&E!J2vs5aFfbsD$#D{e<ZQ9>lm^x^Sl~fVwwd
zk!)=6`NW@d%is~Un3S{bGoU>9!tc2)8j0`qYoP{%;s@zl8x~gm7PZE{?d!mMzas6C
zeW*2CwSbG0$t@p&)ydz|dBw1ud7m|@j8jU{;s+y3^_$Gh2@Rm){Aqu6Y;OIxe1h?P
z4`$en3w<1<eMA%8(Tdy!R^Z!E38@IIjTwXHZ3%yx&lz?{S~GMC+@i#Lr0U&Uy6W+t
zj$<qsP2~XjW@!}~HMMn|SZo&lXKKJwld|dNoH7$fzqZQvjbk1E3lN9RAC8}{`d%Hc
z)e9y*Mt)7yTywEQL3xCn<kRKZ2>w^@8@$D+fM-rIwI=&lIL=VYD71#TP@@n3_`G$d
zBnQY5W7){A5m@%GKY#wLk!M2*_1a0A`g>dZkkXp0+K1m=TAN6AcvSNa4R9`CYk#8P
z)R<4(Uy9D0wig&%3w34nNE#4mGSq?EA!AW+8|d5D@2@8Y^Ooq-$HJM;w&l8XM@^k>
z!MQVb6c(MQ*DD?f-&qgMpGghLE~Kv<vl~?g>xh_L;>yL-1g-k_%cb+?%Fm>S(Q*8X
zfqtF3Q2hxOsHng;$EbvY(!X(-d;IpxXp60KXu!6qpcxqz$n)<@A@9PBl^*&GE;jV1
za6a(V8|z_9Fd|^5APARFKD=VJYz;o(PpGrglb4LTluzBdiYDo(*sgWgdK}w;Wfq8f
zW4^Dy5in0MhaOx%Lt?ef-hkq1#l7bNLOR-UV~1_i9=WyVK)d4G)+F*gAV8;Oyi&C3
z|MB|k94*$))zB4SWZ+$VrFlFFe{;T{S<*3j$H{sQL{bAm^bppx_4%Fa)!x_KR|TFq
zBvy4N-mw&Okpkmi8I&!m=WNnkB#^3l=4s&Ssu)0rfBFdc0f(h#saoGIVc6M!DG{}R
z4UaDJgvgl}#8Dqif<<^QYcAI&p2Bjgp7iY_3Q)J?2ofeeA)Gxf^uPghfW?6u2`{5m
zHQ9q=ojM;Vn-}aa@e|;%ma`=B%O~zp;8CFB@;A7ypQ=(N4f2<~e*>zpoZ;<HThMl=
zZ0evK23CDOkPg(#4Bi5KEc#@{J0U}qtH+{q@$vvnVmS5;#SQCYRD8Ux+ijPu+&3Cp
zBF0T=z&)^?(hQiMkN=z$6ewqG*UAzF3}-0T*iOX*{w2Ye{(&6XT_+nOMLJ_I5<~)w
zmKYKHDF@RL>o~VRXzvdU2x_*q3V7hRY8q!taQ0`gQy&$=&v(pxW%hhG0Yk16aj_~l
zB@Jc`R?5h_yTOU-Wz(+xbV+g5Sk5ZQ+7TGkSv_?O9TU>MW+kmj#yR&0l6C>n_<B+S
zG28d*SfxD}8MA<jqw?=-Hl_r22CBY^H=K{0uKT6sNcz~_&2@4~xnZjk;D=VJ>5lS2
z?E*+Xj}P$nR)N&r{-%>b)A9$~>2huzh~M%>dn3@FUiAh#Fh3*|y=p6|iGrf=TgUmP
znpre9RX_^=$Yv~9x{bO~m!HaQ|C)#M?vu4sn^nO6hrdc6_6etw0Ee3|uQ%vyr`Z2%
zhO`ms-5g1^(<=U+c|70)eq`+*0ZvnlKr7(SGn*}P1RlD<!+S@`?@`e9zIXlo5nyuP
zvs$|_E>6dodEj2ROu6h-ZYpH1vC%3(4!F-Mjst*H?OtPHdgJ6HoxtroOOq;4wX#=`
z4iSZHjNDuts2B65Z35xhyr$lcy93Gb8@Cq|U>1aw32Fb63(R>CcEQb7YJSD<ik)q@
zRB3ePn~UhVJDFDdaFbCDx#mVkkl+Kgtz-bc^zm%TfTH2{m9&};ZhS%3u*x4G=cw&z
z$Lta{)?|RY`XME*+W^$krv1@D{Y)&44S@@Q8ITqp8#RF-pJ6nKSN>o#pE-VhmYk}M
z8~F>xQ@SxQ{hd&PF7POHS{?Fi(tZ2|1PUDC0hv<h0kZ70!MEV&vQDx>IK!i*LF#_%
zDt!YW$Jct#+4JQRqhe9^8L-(HA4&OqNBLeUr@)bbEwT8r-v;CrDn@kdCyOV72~CwO
zI`!Ye;w}wz>Df||Q9zkv*^>Is-l$7TV#wieAk0jb2lTXM%8$d2IW7u^g9)5DHUuIk
zOjFwtbYz9Rj9QP+f!rF7DW#d55;s++sxk;TF3^7B7|pX)p72@Yb+s7Dygu7G&Ncu;
z!<()!26n~~;#8c@2b~QA&Hg100z^*V3VXVDa6zU@(&3>K6A*VR<&1ct1)E4HAWXGJ
zhxh1MSYP8x4XkEri4@bh-|0#=DFaF#gnu1)CQ&Y?zHxWD9hlZ_yPVGz)idpFZNYF^
z@TC<0=J{SHcX+_nA}A=h*`H@3m+(tGf3C`ty2fVd9iR^bK7|*ULMz&OL?R-T93Qnx
zbV?x;WfBaaHcII4mg^rWe2#LF1oY!nYP)XB*CQT=LfTz`U|(1@J0E{O-u?JI8=z!M
z=>0$Jy=PQZYtjZPAfRL=Nrr=goFqwB1VnPqAR?KDCWj`q2q;QWGDwmPl5@@=Ij3%N
z&KVkLpzr3KGc)I`Z*=DVyKCL?2dmctd%wGOy;V;=_0+r50s2KP)<I***|LdAu+Vat
z3>cIP9ckTrY*b%c>exXxS`N%AWSiw-<p>%6sYu)ZmUDDoN%y-5-n{gn<(*xt3PA*X
z3!gw9>5k=vxFqb7yvK0}KOyhCJ<MZ~LA*A&NenA|O4H7DZhNpsP<2RBd{1$Xn98}_
z(F^G7wONw5>F9i_#|65=&CRyAo(99NCo`8*oV&F+vBNVnGxhrs*OXdqz5!P?`6t0-
z4F{BS1wMfw4==r_wDmj`s3coa%KxE=@D;u-C@eUT;Vc(-F#MeKv(6)?hDfi4iKiNH
zV8k)YIF;~PmYzB%0nkO)LoHJylD9bC^u#>%j2Bgi8(9$92BZOD6|CfAb`#G<A=wys
zUE6?EO3)KbxKD*pohQ(zjf7^(7it0^RL-X-jzIu&uylL5Z<Dh??z(bfoAgZYB@>q{
zFi>_boCPp*5E*AKJaG2as=#FAG9Xn_ud)J}My?kF3L~>w&eU+q*bAVEPKi23<g7@i
zGWEnFA9<aeMd!GfvHmWhtQs8y*bf;mF^Xh(+npvfJ^a#C&%HM7b46gH4We&f+|2HW
zvFzwJG{nD=BKj$jKuM29@$uk4&H@<lST{&j$Z$5BM|+1Q-&y!887g2}a&oW>SOUo}
z;`(lNuhSgH;4QM}JJH0+?Evw{I0xzh)ySP;Cc$LuHzt^Y_;I{yuAbJe!NGHl!2@zR
z!(W9+?-M*O$l=wQZ$!f;OgjKZGP~kLD@s{>D4oCPZQPG?B_X?(Uvz$X5T4u9d^?a}
zD`RW2q;uQNc#C||5)g&u2$hfm8{$u)y_EBl_=*e3>1v<vIm2RfSBB>}srY*&c;zIC
z8_-NoWwMfWoUatrT<3~^>e<t4)qk%6e^cbFGype_4fr07d{<Bdx=ya!u_O8yBY+Ty
zQhEQ?ue$w!83c&Ifc!u6M&)mK{`u56GrEDNz%))KFqM<59*9RHdp)Bu%B%%s{Oj^v
zHav3>=*}?_f-1Mx<|LxnV%OK^Z;Vz6Homep7e@Ad<yI*30YtbTWDJzaQWan8`C-5$
zWYpCoChYS?#5j|1#hw}(GA~&XaPO^QPt8OvY|Z%&^5Q*xnwhPcAbqfG<wsFF56qvb
zr)g7E1(#u7vA@$7&9pKjs|Qy3s&9)zy}{dH)OnwmTx8l`1yK6Gc(5~CWdMGq6Yr$X
zA#=AT@tumB#FJ6z;0cLg_77H57LR*pzO<sAug1>??)?%EqTQ<e;tLGW&<K|^?%dKO
zqg@aKX01&lt)A$Ou`TTyz0hzySYpmmEBF9Nzwb^1@Q%-Wwa<W?YY%8=bV=&!yEuXA
ztH<ruf2(oYmIZi>e5<?Ra}sldUJJa0Lui2ZaXddU^LcYAkt(<KBha|Fkg(vZk(7dj
zfE178oKm+GkJg)@N(l&^^d^H=pXx&Ehh>F}%Wj~bS<AsL_*ifc-jkFqyBIK(-KKOC
zTb+8}p>6vu27}~m@8RoyVzmH_2w+D0-i&yF?8jdThJL5i>|Zv<HbH&LzYqK0_~zG1
z^Bw3A4g#ZNc&-8)ZaznA+}E*iG%?iictb;o)F}XHnaH~C&ZvPZoZAMQptN+(>HCZA
zFb|J-nDfTP9T2=;a&(NM2@2>=nV-JBdEmYa6a_$wplfrC>?;lR+~%NRiOc;PsjDWu
z3D7bKu8{k?p$vsos})Aif+SJ3(Dxy8zCpKGcb_)qy~Q|DR7*Zy+Pe`AC9PGDKQV&5
z%!{7U_z$W+fW&AeMKj05{!@{kV~O+nwV=buy*O0ne%6hD5j|~75gAA!A;Ez^#dyPq
zQs$B^(sV<EjV3t;3BcTGy#{Ko3FClOTi=-`N)uQ<7p46i(A7{+R=$146P!r+7K4W{
zPq!`#P&S_Cqs!TH&S^G5*W}e+brY+GNWYSUl>VZD`@8*j?$3RnlR(%etj8BLINehi
zSbwaZTki3~d3|n&7PuY`>c^nOwZg;cql=I2bg_cKGrz}gF@Wqr94MXEoci1ixfHIM
zckM#Te=2L74S>@DvTV+B91;c(o76FRfMxD7E%d0?5)#n!5}DU`SKj$G;*`Jnm6ZC_
z75R{5F51YMR9xXq=U&uhRZgFc>0Yvu#$nU7hRordYyf|=4_N~N)9aOgcRHP;CB+OS
zYfQxwydGi$1L>zLjG=C$xCFAA4s;T7HhQj2_zxuE{6rV|he#GJhu?K)D!o}sE_Z`1
z?_RLY9*`ot!uyRXs4`f9+27_)^nD>g-vQt729V${rNKAQccmHu=esZa<^3=T(`t2t
z^CmwjyW!Xh#IWi$w+54u;;8pOW3Hh+0+=mt0fP7iL-aMD3b1Jh)r@3c?@*tbcMBaL
zIMb@9fT}tb(7|W@vG^EdhkTA!LCA)~*mnb^I^>bosAW=ru2#W2MN~5hDQUWudAVwV
zEhtWSRbX_bu#if<*hxx*rU1xVj8FZ;0b2f++u9q4uLS=g{s?Ma--e-R&9Ih{cYbxz
zpVVYFV4qTp!A}`V@!zc+9-gv|X6YDdbg<e3nwsAw*<H;E<5M5Dvlc$hHEzxNqzB+{
zW^?Euu^OyW&Dwx{{zucF{(*dqvNP$mE(M^#RYz%_ltveu^?u7KSrw)!bj4ooT2F=f
ztQV8=f(O9B>MI?<$$yS4jPlvd)J9f&jp%6vk|N07j{`GBPC%roLJ+r(O8$}@x`D=u
z-gk>&>)eiYxi=m-xhFDrECUcI<N!D2=H{mSBeEn%(I7FOUTf#=(b2lvXg+XTT**F0
zluus2->6R%aes!16Up^8@#*M5JE{3i>`%`aFQ#5b<h%eFXUzhqmU9jDZ*JTgHUDH8
zWm!*Lisg{|kFeDQlfSXqBnlS{9-*DD9$vKJcCmgEO1>0h3GL_x5`4M_Ym`N9Hqfjm
zq0HG$Dn%r2feL_bz1fw#0;PburV4-~*8s^qpcHwa5Xb9uK61xW;{s2_<txx)%+F~F
zg5XwafM0<zIVqVg9Mva%wwcQeJ;qf6TkQW6bd$qrbpg`@1LIEn7tE@PYD5$ivS+wi
z!hWEp$$AhYDcfA8m5}X)E3e54n}&h@ErPux0$}na`|VxNaLCC{DnCg04q>oe9(ZB_
zxRH!rz<cK^5Wu|9Qvh$M8FXAX#x=JCS`)U-u3I4sYj<GV02<{msFnx8UAea}Ru%<7
zL+{Nlgfxytm(R;K`3E}c#FwQsxFKRwmNS5aSq;$>`*_#~W%~`7z|IaKzv~d(6;+Uv
z6Rx?1k3Io66e9G2QBlu%HRl_tSBZKY#Q^Hko_OVj_r7|V*b^devOFrIVnhO&n|U$A
zxiy~3-zwt#byvieo(SFq_4a}co2QPp6cp$+eD?5~>bFg}CJ2E6arJH2-)EB)L?3xw
z8$=<5mhY?Bb|&4yB>)&kszEY11Y()RVVYeL%u>Yl$T&c=sFFKI(^?2ERXAJ!G<PGZ
ze@(dYcwWE`M@@k@8DL=zBXI*I$v6{b0CjG}X2dmKcQYc;?MbNcZTIFjB(J_Fk|mB$
zC8X?*V}AyS^_Gm%NUo=V0Lj~F&5v1G(7XzU6;8@~Y(m;BAmZr8jD0thrWR5rqlKne
z9*zNX1b41y$?S+4XHE`2yz{@VukNMc2YjLs4lzS<E4f>+)fD-{F|n!nHf}t_u)WA@
zOaJwDN+ym`6`;}R+J^#)u38b|FM%E}U8_;zm+&p6#D)x)Tw9ej$wPtGV8udLgv-Hk
zZ#rxwO^0<@QB^~-Hz-;QM~K|>nMQX){)NloVu#YwIUv)Tqk>hL-~w)>RWD!(-Hp%m
z5cGN&V>?}~fI`lyv1}PB<Kgb<ZL8kKt$F%DPAdXnV)}py9$CQKWPy2nt%M}4O39>x
z&w<SiUaJJ8oSG31OF#0hGrzxA1WUkBfPBDdxl02_3=&do-Y<QIsRzoe7;$NAG%mF{
zduchkH*7&kV0*gICWlky5}bdV@%CO8&Q){CJpDU|CH!^Ye@uXt<{(Q2ZoRUDEZ+v2
zBHDinyxi~EyW2I233;9}xx2fojIu<w_J3>Z-hibvA7f5&2o`=<5MqgzOc*GNrbt19
zv<>{S`F{gVi(Gq#hnTc~i(;{RtLlniyYjB-p?zg4YAbdzr*9}Li|L?O?Z=9V1r@DO
zq2AV>#+c8aBd%2}fVv1kHIl;Rb{W9r(hr3B?z7B3y20{oVW*lWkAZ;(v>pH-yW)?r
zRHljpioP5(?%M=e1aFK@M>onwDw4cO(6>1*JY9CDq%SBEniDnwDOO=+Zr#%x5ICz6
zZNi*H{#P-QLM_y#Dy^1ozH*U}0ohwBrkw`>{s2mzsm*TxT>qa-#{lHf=#IY2D#!(v
z5U1q!EZmTG{X>PJIXYQ#FbbTs0w^RkYWAp4NLj}tHWyUEzII(LEq<qYJ2@Jx-3W`#
zW}xq}z9@FdEFz*`@eu&ao(ECv@x!Ie;yG{cSASGh-+PZE@(xv$iqx1#0~BqUikK=X
z&oDt^yTEx4Llv_M>iQp++gd-|9Xv4om}N6L6h&oK4)dUe_}w@u*D}-uBu=%cDRDE^
zI*$!z$%u}~s7ytqe|-{{tZrLo{H;m_FnvY}^m06LNC}P5a<<Ie_P_!h`>UqW^-a4#
zji}Nxh3aKNvrTE~b&LdHbF1{AWeu6l6BU40bI;A`OC+UjzXE2;a|}-NoOZvSEeoa2
zHHL;~45f9dE%S%y&uyv@6wnQ;koM#U3!4QJQa#7Kn3>L1(WAXWH9{q?k7W61=PC?L
zi;r&r$5c43UYPCEp1NOgn~Qnz?da{Fyj7%CsT;Jj1N*`OIfthqaO_B%3FYPL#ThQ|
z^%OPGTa%8@8?)zny*7uoAR5QF!u&9V8b6J*{xmKGi}tZ~Moz^a-rxBR2)ibDfRG&!
zve|Jb?*rur@9U*|%gjYvSm?HQsJU?P!9>Z&LpADRfsgQW=1hgW(3IpFO%LEo0&Wj0
zpZ^*K(gVaeM;LGrfYnqb8W0o$9aef|l@djOLv4^wfTjRe^2isM`m}dvpoKM9M=Po)
zOL)JG<#|v?)=Y3sL;HFmE!T@9TjvAUNKzFYO|>7mAG}eoP-M?BsCnoPOppu=Z~+QE
z$@q6%-9VN~b$mGuOgArOoF7|-8(m#2MGk!wJDtO*X2I+C(G<Mu(y)GKPMQLLl&_v9
z7aavCrk(@+tqdSHsT?eIuAd((H=Xjb6DL|PwFq36*e`o8c6(KNf*VyWB+kMFC6d|i
z8A!0+Ejhl~yhD5Ytii6!+Czae6@kzf`sD!0pP1%Vw66*{xq?fh1yJ;C3lUHP(Ruf#
zzL+2p5ASA8E@@QSXDszdZTq0c+J_WbUl7;_RUxyU((F;Q5#vR3l<0n48Q*3es0EQb
z9`4KK)YJFu_y#hD%u`YVnj8uGdYnB^Zz-Po+oZOYd+)I9>ZpvE!LvW{=J$@*=iF7v
z1W`Glp+yrC;E`o8++(^}d^^yHylmgv_!3#{;r@dh3g}AbRdKskNv_r&XvC45A&#Fc
z+;d4H5xy1-g2N=@2=5N1&`vI;<_R9gNZU3%DlqveQ3AF@yNNx8Je%JzP-|TF!{})r
zCW`3){O%$4E3r?AGd@+9hlkGef_q{~0sB=Y?hn2t7!?1YTBU`&nBA)4EPxl!y*HU~
zNL(x5fAPX4G?{4Hv8v0Pwi%D1z%ZQa$$M)Ots2^KW&0hCy~l18-A1<(V;(lacN0^0
zIm!zfoST-8K*6O4rmjYico+W*CBu%N9+x;b0~n_gao93ili{m(6I(x=<H~^aEk-`7
zN1SCxDwQQ8inDYyD4yirmAqkvDMLmF6B{1BA$La&Gkf2(mm<pWL-F!RHUCtVHlvp6
z#$3`{&*A$S@|~jZ{V<gLX@^-6M#_5$t4<qZkIz}x?nu=Y&V20Z=!)hq+7TJdt9&4j
zS;TT`@8l{l%?TQMH&Xoy$7(0~Q*oyJbJ=^(m=GvLkm4;w&0H%Z%$@Hg9&rq9E0juq
z+asbPiq{_9Dvt9>I@t_Ybk~AfDAU0@tL3P1l4nS{zpCJtn`d%xGtoH%p`o^j8BYJZ
z5hgnxD;4@D%P$jN)N5Ud>3?!lG=DeS6ju_ueU)de6enM3!+9~5b9SH9+wKEX>K<gV
zxj}%o?#*T!ldkv59fP1k&pO!R0dQ)_31ODwXA<?_K0Zp9%MshDc2s(wM1e}A)>skf
zrAN_tFnf~X^wuhJ3VQkdbRfU=HsBx&ttPDsl`%lGnBzo3|I7g>_fAvou{_{LFQEcS
zgCiJ(HY*gW9HjQx{LzqSt1xrn9hH&8%2~@J*G>5))Jc6+Nxx6KbIq)3Xdic_N#R=}
zvU_Zm<h@7j2Cd{*C6^8)UbXWfrB;XLej=S~$T-Un!jJPvcO+<-dW`Bjx~SSpDAO}H
zo`mZPf9-`A$kZoW`OFkn)v@D?AIT}s-nM(`DABC?g!LxRDf>n|!Ill5P*Sczs8cYt
z*_!6a$7)<-3TABvP;S*6mO<GN1!q~=>f;I`!^t6r644rM04)#Gz<zW35l^aj>Fz@t
z;&ZWc%j2S_zQK7*pwNb8!?34&0};~y_)<CT6fqH1vga5#%H+4Ri%ut_R}Uj)2zXt3
ze3B2rK{y^PZXMKZ)t-x=TTFu>gnlPK+3CK%xWH+jbIpX<(JSTGe!ZRQc;zn)00_G~
zjvb-ur@@044Tjg{zwK^>zo+VhFK|91mvBWKJFAZ6FFdl(gkXo$UuUfSE8MVg6V^{i
zAR(VeyZttB6ObBSV#&oi;$gz;rK=@CgQfopn}JJNNwB=m)N;Ut`~K_lq+D$5fG8!Y
zI=Kwq8cze!KuJnAg3w4s2eH^(10{Cj*7q#Uh`b;K_QDH1p|A>4`v-zt`MQ+$z|j~;
z-W;FbZl+nW*BT$fks@(TUkD$oLXS>@TbtBIkMw=wccfxNx5A$IV}rKC+A{V+oj64f
z8YfV{rHxv69U$JAwHzJPw^U4jjQsp`iTKseqf#~CYKo6KZZATC5BqZr!W(3OXk|{(
zQY=XwAnmDlJ}c1n#fRRZdyCQQFEHwpb!@A+JJYOp1%Fp@xy^h+ZIZ_I;2GgO$j-Vg
zaqe1*Rr+1(VOLULC2_cLSCz#qmzJSqQn2e<l3Y7tdu^_99p0bSITYVDECY!R{FbCD
zkT8FBaVbCr^$m1g4SBu8<?_b9Y;)fJQ6Hk)c$mFf4V>Jvq31+@l)Y2$rj07n7+TwK
zcf#K(4fVJRI><zjWO5Af3o%g_)PeP_A9(Q)>W;Dy@6W>5NNA70&3^&67@P@I7kQa!
z_{vQV47r{k(%e}%V(dCOVN=RU2#H(qAs1ocX64n)$S+)t8zB1`tpNTG*eB$;b&$Rh
zaHBcMtCDMe)1Sv}D2_jN$r^9~@JTpzPRQ6P5%pX)&FQvJHVH`vv)f5|szFZ4iDf@G
zHNf3jGM59QN)iTx-M7S{7Av1$xNCdUQlu2`jh#JbU`oNi1IG3^t4axIDXU<KnaW@o
zPCsN34_+x>RaDy%3AUU^J~>k1A9ali?NsBGCl2r@tlf|Jf@>Er-gAuR#VT)-TxTv*
zo1RyT4J3nleyv*sX>uD+{kkT_etS1GBH;X*C7k_3@k_i)@PL$_+eom9=q!F2Cn%{F
zg?9Pyf*?ZNTAbm{W4+VuL-=JEj{{QFegoY!!6jCPk|{yMOJQndmR03wbN+=8Wc5ki
z-2<jJ9!O9_MPi#;PJL>^RlNc-AEgA*w)fKZS3k19T}Fzcp{qHh1(9Z$y(dB^!t`%A
zq>JAB7VykMTCc1Bb}C%S&?+}C{}8cM$)y|2+t$f!oEB@={QmJzhnpm(?yilN2zzn6
zlx}2rcuz(1+fIGUX~DTk|EdOfKIM9C$f!O%0`<E>{;PbQ^zm?DW=f#siC{9Dy{KRq
zlQBBZ#$|pgx5Qe{CY#g7q}rBfdzeFZmJ+jbNAlpA4UN4-CFcINIqFm5fwADt0hdws
z1p#F6%j-OkGaqcZTuL$(A}m@JKB|)bhmy~ARz_?`&{*t5++V_vF-Yas;=6(QNvk%6
zh28pMlHMg*R)5G?6pmwy4Q--fO@YhwXntTpKafpzAL)&s!Jgb|qghs+|BR8-L-?4Q
zx!Ix=`T-5Gjz}d;pVmm4lC7`M(>%D_{6O^yqtm&-Rks`O4ck<jzNF35ns!EdYO=R1
z(huxltqZ&KCJuy@h07cuK~!s2tRSo#x^qr1k0`6Kj3x?DAuFGs^W!;ch36><e-jCC
zh?OK@)vZT*c{U)#dI@-4)OG?*e}!ZvJOOnneZ3FHR;7<QP}j#;(%R~>0BQ@j)9uUY
zSp~<&j`y2QXo-hjA-`F0pU*-{w~kCc^k*o^Q2Qx4J=-q_@C$IVTDdIo1EN(uV3?k;
zX;yVjkPu>VmS+NzVW4{?)O35MKMS16=7UhfWx&kddvU|SUr|{mqP1BWH}mG>W%Zk`
zsfMb(nDa+#u@Cw7PTpMvoT&GfVmXG2r`fs8hVDP8f*otuq=fjZ4Mb~<N}hL&sbh}i
zx7k3(zZo96FOTH(MqNEr$c+x6TyjT{iJ{0?aGHqZ!c{CXqY94%!jtyJ7%Y-66c5|V
z3@m9W!#EOs2)&z0Zp$b%V@~D!#6~nXs1I>0WTqzvPnKdy`83!HI=tU#jEn4NNzbrt
zn^8zn-R`Gy5<T$GAl3Y}C}aRQt{OO0vO3$BUl7c+#au=_gB6X_P-H0Jsyd$sYh4QG
z`8;qZ&bM#MT{_cNJTtuc>r^>`a4$_(-8+W-vtXBO@S}STDj@aW{QE{%?K*Z=DzrY{
ztNq-YP;35fb08{<yZ~?ZbeW+u{hNr`_&(RdvBM+c-N!XrzbyzX+u_haq8SYbRz51N
zwKI0pOb^-9oSh|bd5RLYa7GT5NVcUkraSA2(b(gODFMei)rtpVdypXR&aU|EjZ`jv
zg)?_M%;PUEG{?8A&W9k1eeU@frSX@0TN#|zXxoNd)|;*7K9uKdveRe%$lesXoiH*i
z1YRwkw0rJuW8IzaB082oKI(@t`L5v(3a9@i1s>r1Za2|NiZve#HMQd^WuaDT%zE2A
zu8>q0vMw6&U5CwhDB3dSh_Ch8iJGG>^+X~RyS{U`>73*Odm@AtUZ0(cRHLI5ib*`V
zDA9}u#%fA;zV2sX9W?RbLaNOoGeL6$cS1LOe+s*PpZ)Q52C&z6s+2Z8G!R(AV>3>8
zQ=B9Aix}w)&uCv=ek=0jJy^nOjsT0u(J{ZVH)O_WvdL^jQ*Ye*l7>=MjCA>qP|ntL
zbYR@7fN`XM;H*{vne=VDT~6|unN@=Ac~Vt12#SQPzXckUf|^Pl2ppSrSSEUwi{9C(
zRe2JI&DpAg-ZR6aWti&nq)?0BJ?5aqHA$`I!HQ&rH6n8C`dMfKGR&dliNhz-Zt*oA
z_cSYtNxs@ABr-qp)3PnKuL|QT6(Qs<U^CkJl<fZ~xS^xVrJO_Qdt{W@5rq7F?$xvT
z+3!X*gWwZBvMHhlnes$<RssOr2KiVvsY$7sK0mlU3Z#$+FT;GV>h4NmKMM}r)JlX$
zEsMvSCgV(shs8TQ62cZ?^Aaed+5M;_`mG3+jZ*ByR%g2g2z)^|uxn0tKbP;V-4|(o
zuYM}5wGyga%$LQuZGL3QyU=|k`I&dwcR5>9(AW99mdnB&{IrAqbf%4xeE^Cc4-1dR
zhXss;WiriW<NSw4eIW-hFyzcw>c*OkPXJzp?ST*$(tbzkLe_WVzg~$UwYSvA`By3&
zTwOZ9<&|3kV|C%cp*O;PAlN#HF%{@De(1JadT9z|UYPr_4{x2fkZQ<tdXT{RQb^@V
zv;Mpc8{TR!%^T{dxq)};v^c4c)X4+JR{Es$K9)N|4z94Tv!9+TIUJ}1hi=cxfRk&u
zc+V`1-#eJj_vv`!ia#{9{P;;-bxk>{tL^=&x}8d8n?PoIIj}!`v^x9;pXjnRSUS6U
zr^XA%M7BkJ#);StjxyNx_>`}rvkFX24|01?A$(6O=)zy~24kV>78(+wx^{zy)Pldt
zE<c3M_h&_Nfdb3!jy$SisWs(2cpujL4OQYw{>qk0kE%ndWrRzTSs~mZp64;}@9?tA
zsk;JCmSQL(Ha3<U)TPiO+akX$P{6-PV{NMcXwnUJDDnZMLn$ln&aUIQ(nHwcB!}zW
zCBVfnetvw#Z~NXqeo7hFc(NNG8n#_C&<~03t}Xi9-8lcTo=~gKE6XSLaNmNw(WM&q
zw?io(nRCcDdfyx9xBmSP30pLDYzHdt4t=Pb-?t$NP8j&}TdJ+__QCv4C<YEX6K^>5
zN9hz9;hP;aTDzqKx>9)kR|^!93$m*(UO?NgUExo&9N@BN`thn|I}|99X-?0MwS$B_
zy>Nd6&t2f_#d^#IrmwR5<q6%!Cc!%#$lq>ZIi$o813{@dM=H*v7i-dc)7!21bXV29
zh4|~xPHCfUuZFDB;tMR{;h|4eQ&DCdht2fSO^iw3ylC$^9(A*C7HggwD_@j8qfMGA
z@yi>iceoX7C(~PMK-WuiBe~tqOZ=T_ri?VqcQBT!X%TuqHemC`x&A6~50R~0`Rb$U
zp2v^!btc^k+#$yluS-y!{K`*(6F$E!^&Agj_(r*Qypm4z`7uvKsAhg?&05t%LvoWy
z;s)Bk|M5e~w-I{rHKzM^D+cxglNFQCRdn`A_k@m0^;TI8ue>$y;USWN;KEvzrS2F6
zFH=z17_9cz?Xs%-oV}VAKslg%n`Y%?YTTs5EVAyj?7K&hQld`T{Kf~m%oq=Nz=K44
zdQYYPvZT-}uE`PHO7|9_u^Kf$CQ|oqY3GF!-SVPNJEuB_3g<e<#pUUS40uX^NQhG3
z>G?K>u+I3(@izo;I8Z%_^C`YQ5fsB}j<Ce=jTP@PJf?pU7wJ@*2x955)RHWvOq0`b
zntDS=X1ed@Fc$$<ZC|yc9_S=<U7z$i1OIRm-dn#A7xsRF(jG4Fu+u8<*uWxia+oFE
zrJ1VgVmWfH?-P{-ZSf+~-WMBINW07`ZVyF?oclLyABz{8Qw^Y>UwMd^D_GqU->Mq?
zAW3Ku%gS#Js;Mzn@^n8N&vv=!Ho52?SwvOMYlf^Ph<y*FoY3%L?&^h?mgUuGnaMFN
z+1VdHpn~T$xl6!HT3Q&lIvUKEr+B?kR#{j^Jf;=<yNB<8>f$%h*U@hhq(SyrK1!4~
zqVYKyUhKGy3ntC{h|1RT%I7_xyn6L9orNlC<o$R_{~Vj1*4bD+D{sk10b7kHO``C&
z<Ack-<CEUZH@MVpE1B6YJ9;J{*w&GBc>o6rQJ4Rj%ck~ZQx`R3%>UY9G~z7U4hB2X
z&M!{s?@wZ%XzX94TMSN=mE=5ie=HjHEu?Vgj7D&v4>Q5j$-<*$w?oow;z}tLM<6$O
z)!G$gap|hq&kx?wTilvQTYvfxQzMScama%wST3p1ZG<Zi%gQJ~{ws*8CWRx2oeu;#
zm<$D;MJc#R+=yCba*jIR5d%>nEHZB=@b%H~VIiVsMFn;_x^vIU-KjP-N51P@iU0@d
zRqgcgXqp8rYIcm{#`?;{-i=tE&{mA7h=k{d=ijzia$PJe<jQl%F{RfplRA2eQ+7%s
zuku!-U-*35MId${uB#%&Y*|r;9LlTi<b}jhCWaSqL!_u{q5s>5BqH<OcWht0uW-P-
zJ-@nq=O_E-dPDWxqMlO=tB}ZOgg(|MT+b{%3JVdqZ|RR+X*ft%H8U9dQURA*d9Inc
zAmjtjtv9e04`;F>q-#E<NSNgXICwdayKZqgO{;wZm%~v~Y&lGWtjuw&Kz=)c7w>t#
z$4eEN$`HWR;65z&?XbvUh;q`Jhc4@l)QN9f<ndKA{q<|7xmqsu%)^%sRkYzA+IAbo
zloyfaahJLLcA%P*96T}RG*{Q5^3l?5Sy=mNDPZTU`skBwi!O(|WSB^%wal2}H{Bj5
zu&edh`?jZV-cBD)w$|nj6XA^8jkcF>s_?OXC^pIx^HOqhg<nn?(hLWvRqYSoc3I5q
z+*FnLg#O%fpF)wcaxPPC+}0Sol0ls07AfaBl^bM$R~XrApV6<Aaku|%inI^k)vB7V
zK)y*5Z4_<mXFIGAh^vkHCa30|=cyorrpr1_^Oz5w<<agx4^vE!fH2>+Zqc{s^#Pk8
z%YNnks!Tj(VsT`G2Y-=uxkWgCcdXr~vW{skwBM~hu~%=*Z=<@>&eK50TD{+s<ggeQ
zD5cnaLi2TESet@EQ72a_XRx4um3SK#dPp^Exasyfl%U)pFo=6(G^=hQPx9_Kv8~dD
zJM+e^&96yNjF(DRohb&Y-Y|l6eWT+OhN#uTwfPL0e!h#==px!RLQjE74mWfCNcUV}
zhIKneE&dR20=ex-*9dq=&bh-GNCt}tR=5c>IyUd~78-bk0w!UW@zslQ69dVwBx-$*
zO>Ee0Z*|5h9kYVtck1zQn5^m>U|y~pmG?<axwT85o)a<8R?}WVM8tR~RUcT!0(=0@
zdG$ui?J=Kdm$5nxkG<zZ2j^nKi0z`23Bu0VSvuOGNmxG(zjQaNT(@O`1`Q8G_D=gT
zdC_jjM%>Am|ITiH0}|P-xltn#xI6986_xyjms+t+_#*TdfhhLoE$SclTaH-J_Zy*h
z(tV}Vv{X8#^`|%ar0a@}JkHl`L|>PA0$#6uzH$*DJ5b({z{@@i#`Nfaz)~oEOjbl;
zd+PU$vL>EiyS4sFaq(w`y3okH<S^ABp@q$Oz|5{ShV4{++ooF;l6BRiR5gIFV|KkJ
zih5Rj<6ZZ%M<Va{fT2mHn9oKShdP^Or7fCyJ>|*L)1HAxFJR?y<)X6idr6u>jc7*Z
zCJ5K8yL3UV4N3i}LYqFzR~+$`(qJP)=enKH-jeY;qjqtYtodz>;S%yw#6qZ1aEv8V
zl&{Oo?CiG>0$bMFq08{`g1f#%1;SUl6xxZ%Dl5&<)7b{#5PA<s8_)gL@pF!gvr1db
zU4zTPn>EKDm$q(uw<|<hP-A+Zj#r@%UwDfA_6yjOegldTNhZ?GKx9YMF94>`#zrt=
zWK2A<Gqsi1jlsZHbfLHzVwCD0XU4ENmdPHo+!oT!TV!4Fy=MtLCFcWYZCD0gU<e#=
z<^1k=-Mw~xFIYTdQiXFVI!DA%t9*Q)yO*y(HLJj9ch4%FNh`=bJq{riT(r?7${94&
zY*c8RTbiR)<&~x2BHDS#jH<Ae6aMD9j*e{wJ6SSO?rMa3jzwE1Di|=HY;!=KY9E~q
zu4WB<>pxA8FI7BF>o2S2c|d)zwf0@o08cQ(dO`VS{m!mI`&;b#BpZ{AD`HG>rjK1s
z95L;P6~rNPO&iRWFqp^l)Y9V<>QY?fRdE7R^J-GaTU1OGEJ2|i@!^5qSrS#TN%X59
zA)^K^f%}+du0J%zcNu<aKxHbx6SMGTs-7dYZRUJ6>Fn@^xG*<J<FeU$pcs^nh9>=i
z4`%JFTTC59wHDJTnY{+NF#S&=IHYL2FR!>~z=E9U*dw?|{P9LQyPhf3x=IG^NE;cx
z*WTIuy2<y|;l-+n;|E@vW7XE$W86zE&I!A32?(5;u<I=<gO-s5`<%Gm-vNNvPcTy2
z2<;XCfgo(-yk+ZM=!3cauaE+K4;mir+uYUN=oQbDvOEplnw}Ek&yCmqJcdXTXn!tw
z^L{T8isR&viAX}S-;<|wV^%3zYICwqxJ(W=YtZ4cKEZ~(A)b~bxq<GI=ImPvQJ<UW
zp=(`|QYgNDbpW0ID@kn*ce~nYWN#W+HF9;{wU02>92OGV6EBg(!fJ;8Gq`*M-Soc1
zoCF0;k9!^KO@gIIwTk1?E~vikA+tU{UP)Mwd#$qH8KI1;9N$-;4NByRGjkU%b9xq|
zrI#^d;tZ$roG*`dZLM8Lsr^V<;<I+u@e5hg8d`;|fIOBGL5oE9&+N?wkj?b?iC(?T
z0=raX0DM5U<dRK?Zj{QaV40OFd$e1(F7M-?sXvZPaPO)qVVLrG)X!&C2G{z>OuH9{
zZIBm7MEbIRbb1>${rB-am59kV!F~9|vAl1dsuD?D?5g30#)x#dI0SEZO?=KSwN@P$
z6DoCt!Nc{<K4};Pd@5}1C+0*6jfVI<X<$(QQao%CgMsfFmi>Jy1u9x36F34t<QaHW
zb~o|g*A&+QP&oj=ToLn66SQhb?1;Ktv(Q0Gwb9m3%&FH#GwMYflsZaV!mKR<N@EY*
zQlwju`h>5H`XG?6qDw;`$yI^eJ#@Z+AD)g!tz6h*QsY_}segV{$Rvg2Ck*)^R1OjJ
z$ynWwSdFu5gX=%U9;bpBMjVq{zd`J1yHl4D@XZl`>oN|Ry~;t>dK?<D&d=~0H)n;}
zlB9@NvjMNG{9N>bj~SetXRVJC9INzB+GIx=ja!S&4%KORK?c2i-c9oETv&ZE*njFk
zLutF@6JH@4Z?vg;@<HJozd}WA$PaA+ir=MN*oM(kLSQ#nVbEe_A^5S7sl|V6xm%7S
zD^q6k{3@OF?ntTjM~{;gv;@`ejm{4oYjaZMo?+Qvs|@9YJx9CdfqF;0!K+i9Zurhm
z3yiEhz>p(jj7F{A#DZaTx~lEa8vT~pWeUoxgIqqZd^e$^XG3sg+)I_f0#?tj(NK)>
z8k-yNn(sG^RZ^G9E(76(vg`P1^CD+rsHMWbu?%}toYM{d)>YlzV$des5t4}=ON|(s
zJ?XL=c3`KhLv0z-*i^YhJ|$^8vL)0~A1;41RW9Fetvc7pVH<N7GwIy}trl0og2dS}
zNnyCfzI1kHLvXyQo+#IE$3p9}j|6O*uFD)Gn?-%v%+-E>j~<Y+7!y&#*)W!2&E1g!
z+L=5r*wHpErLlN$Y-HS6zp0+ixT(Ru>5taQ@*><<KQg~hm!%xfKB>FXrx0&G9ICy7
z^qSMfVE+_JLj5&>BFz8z2fOb!0hL9m2M@u0x|``CS~zEg`sY_}HLIIji%x-us~%UQ
zpABpVu}Bx+qj+32N8n=PJo^Ya6`5Max<oA~hIzs45P?B@v3ZdZq6sLZ+Px43AHC#X
zhUX{tS)C?mrKeC0dr8>HyJE&L4ct$<OQ$5J^)OW5d8~B1v#ide;UOkLYhcL0322T-
z0?##;{(xCwgY)j?<-0@Lt0@ZzWZ(#_x^Q^DQ*s1s+97nKF9G?=0l217ds1iuR5Q^=
zQ9)_*IEr8&I!;Uqw7$vYbedv^<=Jc=%A>8v69pWbi?rQ*e3-ocruYI!?ScX~WmMN;
zwTX3JuS^5by*f5(qTc=jd-&rL2`X3W<QcpL3RZ$kip}!ER1X2A_^JWJ4oln)!&ZpD
z5vucM%~{EZqN?HsHYu9eF)kp=D{7}!C6sD@WXWYSdmq3O*^@8;KhE&x9g9C-aP81(
zu*0Q7|4r>OHX{&?I&Rf88Z_q??M$y_Ihhs045nxEze)41+rQr$cJdA$byN$ONTf&x
zTdzve6zi60i!uw!Q|@9{wVRYjU0Su>4>+;32K|=jlUaNL@GF~2sG(QD#Fh_BAl2Ss
zI~|{Avr>nPT)gMJ@ZxurYore&q`Do|{W=)cC79fUQT0+}?>DUhXaLiIGG_hO)#(eQ
z$8+x%&r?&k=RYgoC2l}*0Azf6e~BFk>)z^0JCjYCRz{O<S?Mkin>P_D3=NdU{mvUO
z_N|FgRt(~ZcK!99-vj#a`AZtX<eBb`Hfl~Uu_TLeZxIHus<m+l=WGwhWSR!-AYH`P
zk`$YBA$vO9;{$d{W}<EV8<U#R^i0C;dZpl?_6WjE((~F3kW&73fh-hbKlx*SKrdH1
ztiQsh__;}q3G&FK`l$Epcx+tAqcq=+b30z_sO_`uy|)6>;G6Y8T>m^>p(c#t@#sM~
z*8dS_B1JFCz@8StX>);(XYW~e1$@q}o!>B=%4><%m$VbvuD8~TK^h1<k2RDZfF#*m
zPyGrKWd1#|@q0kJg?Wqm7N1+9#w%|uf}_duJW!STBH-*5XrLt0xJe%YMY|g_$PX$f
zXL}Tu$EF^4c8_z;4h$+hsB*{cwO>vrlk(>W$MScKRkJqmF3$5u0_AW0o;x!J_7~M?
zYXc<|Z=0eI$fgozC9bsbp>D+hU=d2YW?-X+vd=J)c@sSxFs94H>P1Gz?ZClFh~jLe
zGZoxr{b4rcs4%3e-mll$p+NIGqFb9=y_}OU5$I`jm2p;pPd&m`EJD>LqE?;qIPkZj
z2C&T0qCu|~&|2D5-Eo=n5TakU;8PK~cWhivi6M=ENc*6H!X$>L`!T}OW$R;AiT-^|
z{;egkT#VOAqo=Noe-!EFgvsv-g_A)w=c%_{Hpx3D)fXf`iX0BB3vZXX3w(cHvGDV1
z7wSMt4^Gw(-4dB7IHM3u4p8TN74QJAJwER#D_W%F5^Ua&9c(^-vA;Tcn|iIm5u#UP
z-BQXzN5R$B=gtaQOd0A^0<X6^mYum+=#GmCra9(#r{B`b*?abqdE-ZUy<6%$m5+Q$
zs^O1mCW?Z`%-hu~?x=!wmn<rTXlT#IK1)fx_W<8S{yL>?OK}goUv62VXNWb#RbCt~
zBzp|?jq0&si{2ZSys6dYk_i9_YUIx>PrfX{a<)0&@+rwkzh>h=K1YVYqoW)%Xx*s9
zI=0M5c%+z0jUQezk7J0jRroyV%s&Tv3NmjV-bbD)-<V_>Ai9a;ds|Mm#e2wHG->{3
zM79J4ZgX+hwj}7F=V&etC_GJskH6zt4PI1jDB(;^9zf?$kd;fx9}FOTWk4C80E<YS
zcJ0~RsR{U1XluI-gto7GdHPm>o3?i3leyL7OUh;!<66E_!lACb3co!ze(b4Hup_^G
zW8A{^>Gwg!Lo+H@J<C%*=?V{2&JLA${HqGjsHqlB=Qb*=NGyZ(f!{Yd{QTt|!NNrz
zg)JC6TwSMEfYBUg$N_mSwpgU4BiQlobhTz+f4yY`S2RC#d!|WqJ4URwExRD3$lND?
zi+N|$6$C$t>9)E<N3b|&E+g}l)VqF9MRYPUC0SvydhpFLm)7o<JpK~E<1~AH5a*Pd
zlgKo4&MWA4SQwtU&QK&<2jlOSq&H9b*N!!(so?DJG{VQ=b>!l9V!@*ay@~d^7rQdE
zxK<K$5hi*hY2W(6#L;K;Y^+sBmt7urqkwEOL%};8;wI)Op}4DvzdblTRKmdYUM8u=
zO{dK(iq17@z0d+#;bZYm!4b;3UwrjCcx#4cI8f=-vWE@c*PE0*^+%QuqQ|1hTRU+y
za~=l0(WUqmUctP^D{uYua|}KSe9yU~Wnuy_yQ1}aFdNEU-9<xl7QGr0;5D=XeT5gN
z2sZd=o}Fe$dx{&5^=L{!I{proS!zbl?Ob`!L=wSd3K{uClg!HYDL2Wwxb;3qGz_b-
z(CBe}jBRcTRo{Z)vd_~EjvgklQT=4}clg(Gj3I4$fh1Fm0OQ$;c<f1Icgn`Q*yth}
zH-WF0P6rt+2xy(2-dD16!y7l+Iy`mREGga*^(Vwo>9N-s@C}ixy&o*<bC!{(ASw7x
z3V#|d5;OH92Wwf0VEao{oME@vT(O3J7=xaa0z46HwAe3qM{w^CxU>$XvRa$jx|-h~
zHT6v3ZI#TJ3;h&XDG;(TJ=LdOAq8VQ-%&}eug3@v3fTwfi`=`OU)a5T#1Yda`A7ns
z?m)>5xC)20)P<eAB>mKGadxZUT>|H)7`xST(6qbW{ig`NU1Qr=E~i(WQO8@$Ucwq@
zo@Ti3J`h$UZ;S1%=b+(v*Zs0y{uj-E9epA;j4IW)<^`u<pTyhyLnuW$<l{~1U}F{R
z(N?duyt(RM25qdK>{xV(5RvhfBF;R&;X61x=>UB3y2mY_9gj_;ohU-Nj7Bu^P)ZU~
z5w152HhMFB{8kokrKV5XKaN!-TD#Hi2GGA?A-9|AIx$GGDujB(<~DH~j#y;2gNzJa
z*0)0Yzx2)YlZ!=tBN&YyDVZ#g363#V8E8+_W^t@5FsT|RW*kPR`{Dt-s$E@XT8fN2
zJv`Kh<3eP=<C$t(ho9cai<*{}&fxw1<97wX{_~zJ#4bz9kU8Ga#BoV4(t3y$j7i5i
z$)jXbq`sIX;N?kiiJ#}JwbJ-Lu2j@2Lfka(sNJbSJa~H6UyRsz&|C`G6DozOA_-o@
zSRW?@WHhe~{JWXJ_mf^RvO9i(*AtIf&~n&fSGI43>ZiIeq}$g?ZEgDrr58)S>lWh!
z2Z{25bC{LiEPV2@$<{o!F%WQS%(kw`dYybZ+ic46BZAL(pX_)m7(>W^RHnbIfwOX#
z%u8U*-p9_m#)fp?*n~HghlF}10IyS><b8_oCpVQ#N`7e{6jjY9G%C)S%C6Z%Ek-jK
zZKyfHOZb2(Q>E|^VCFgAWP6Y<qgAWT`WH!@NdiE}=!I6u?}v}U5@XReLtQ6^^;Rt&
z7lK*b+n>e(2Iq~nFF~}@hDIVQm|kCO*pUyG-C<KMEorK*Z07IQ8F2-Hj1!~IlOJ8(
z=CGK1Fy5&3f?0}2*QoY$T^Q)rszJV;hsVAW!RFVASCkxTKMwVS<LmR&+85<JnmEJP
ziv|`qHV64@%Z)ObBpQ{vSNG#Wr@1IO=pU+04x2uz>@j7258xB-k+kh6GkiaizA^x+
z2BS$s1k$D0;9{q;REOmGQHXVx63ffT0(tVY2voI1ve#><1iX6Lr_b>WOoKz<ZrTu{
z@fNMw9pEcc>%~x$L6keYPRuA=cANlM<t#Y<D-jXNSY!nLZ=T}oRd2=k?VZhWDu;Nq
zY{p<NM&&%4?Ub$rW%d;4rC-LHcz<EdEEWJLY7l3<A&Qv=m=f2EHZS3aCo6;k+}W#6
zG{G3Vstv4dF8OzNHNFA?EMgYOZ?GRp>J{z8T1w~gmTi|jv6Pa#=T@qbY`1hXLaF?`
z<i;UW<iYC+mY+Ptl`e`%oU{5IaH(HxcqNd8-9^ZI7_8ajZ)*1(qx*oPPsRqlP7aw}
zeMCDsAmXAX(w<dm`zw4(`P@r<N(z&S@)@x9XD?OfeCt`gMKbgv4R>=~-N`4u-T3I)
z1(apL*|Fa*kRv=@YstHruY*)iXKNMoHYXp7I=;-W9@+EmVl~;?rhbZ1pID|Z4fPf-
zQ=0M-S31q=?|s_;sk|X`rNXGIIoSs9j6`P}HL}K(`mFq{L8w@6qc*I6RZ!2MHt-h(
z2q};l_GEwPz4FE;uxQb(Dn(pQO~Cezv73W6`_+#Hg9Ub(A!lt=73FnN1zWL{9GR<D
zBvaSuaylzEyJ7)~(M3B@(*H^gV=FR0(;A`KiSHh_J7f27GS5i9Cl`?$VB&^sR3ytd
z(HdxKzYLh1u*@$`wlMO(MJd3i{&r~inpX%kGMWIdW|AJ>>lfVnf=jYKC^T6SbAH$>
zn2dEGU}6d1J$3kEaAtfWeU=7dS*m=<UZ8%wYBMl&qFt`j-acg<zVcjjb<q+LzA?<3
z?yTj3C|rt{Zg^<ZUyDZ_*2$2|X0`f#mS?GmN<3li%Cv7OjK2hOhp=l9DQZVy<K9lw
zn)}hPMjXlX5n8SUy*U|#jz#OZeqMlj^L8DQ7B-Y&Zy?;qx3{~>^Y9HN)^q2XtL5j2
zOa4wXl$!SCX4O0i@4G;BCmvEvbA!FU%C9<jydpi1n}}{z@z}o6{S}WOL2m$r0VhJk
zQDwCB9m7$+se%QbTk@{#_Eu?hBK9u41QqRFeVRa<VUdTB_fu5CZZ&ysU{Mqemq&)z
zV~313cq0!c!Krhpg?5ML=E%U<+SC9UsPYA`CSrHd4E{(mlYHt`rqdp>a{iuf73izT
zp%G*a+4+IFdVB{qa9(o*$B4rT-{!I*e#>a(x<h=Rd*`uEeFq<vM)>*1i3~a3@(22U
z_Kf86$ygT*#H$nIjOH=zzMN@UXdcmq3aJ5b502QTVT{a`tx=kS2B2*6MCKrMMRx^s
zYm1P!XX7L>hdV}-!xvhvUj7^f45X#OUDAW)vIg;D$XTX6%cZ3!95u3St~x2sKy!1a
z9<J#yTO?OAmvy4Bsaq#x)?#qk5S(C2hnHxWM}I5N`pNiOgGVOTSg%(StA%wGk{0E7
z!3NpvU+1@%_9#^MgkNkv9s?Q69NX>~!2p^?X0|E&w#d_86q?@v%9SZ7*uP7Mo>nl~
z%iw&a3D+rlaWS*N5y3^3V4eeRm`~4Y8E<0*__IR#n-S?!&^Igq8sf(1ll<e0k96!s
z|8W+;zr7N4<GRZClC)xa42`=d2(YmRs*;pUEpI(0$#el$EoJkKHxS&C)zK65%l#1q
zJ7071XDh-}8H81d-F^kJrLMo1mj*W~SK_)ok)hxPu}=zN-ia5Bw-Bhb|Gg$o4Lj!M
zyypI_ppu$8BYipzra7>>#CxVjcuAi<dWnA#RhbL{=Umv<E|$l%(w%GUv@R=L9M7U2
zhQI@*C;CmyNYjjhgm82j9y0=z_5(6Ehkk-`RV0>5-s6=EYt|#0*Qh8r8ugz?9|_QP
z`BhHqej=QDeFJVFlw$dt?jY{E4kc8FW`m<eJE;Fi8YrdI1+Kv@)SZ3c`%@a^`45il
z(b~Okb>a0$?(FejKHrV&DnwK~ibE0_M<O^-Z)t$s3+v*pqr31fPC%Vhz8wLWrl+iL
z%&s3mE4uKp&FgWS!G{`~+?-dSf=e;><G4pZQEB|nsEPtaMb2u+kSUXLI65|&ol3tg
zth%^p>%z5ta-7kOEY0w*CYs2XAr{U-d{fCoRqo$Dad(JNi0_rad|;L#^t0yx)nx;6
z8@t%)mPfIK0uJ?ynP(Zl=)wFM>eGn<%Q{7ks6RvpBHz%7L6MG?-O7bY`4C7_wZQ#X
zPW8v#MuY>soMk88N%Eg9?61rp4he8M2`)34f9wB${Y${gU$3`ZW@=~s&xz`PwMdkc
zfpuWM<re-q`TwuSvwYnKctWFag8BDL{@YbS(E%QXiRjbh&uQL&@xT9Q)fRL9>uNv$
zM8X8D1Ny2b<QIweAOBn8$+d?n%7lCUB24}Bc9JCkf5W+H;_}}-l`dIe|2hc8ZQ=em
z#>2z`)<J)-<a#szV{t$Gq^x+|NEjY`WAyXx_Fs&re2sORVrc$(8~^r!{Qg_0!(G6Y
zzJ@$R{%0Sh_mzMG>ma$+zV)9Le0@*<bLqd?|9>w1H#h&EOaCpT{4YxXEu{SaB1*sd
z?94xTHj5r@{9mOPA|~Q%{nC;|G1cE}^^>GQ!q}*c*_Ks=_qT2LlVoH18<0U`sb9EY
z{4HkvE2sSR6ZG{pqL2<Y{jZYI|I0-K>)^Ix^ZUt7{T0GU#NGlj=tJx;(|=vu&(@!O
z4=`SkiV4Nvw%tz>W7l&agYrBH0|u@C3sbjUuj3PC_g@$Hv-K-Kyw2pE&^H4AmGPv3
zb-W(Y#`@V^{bl`7o;yG$mnXPi1O3^>|MKu9xUVyLYCF$=aeucWJ^-N5)Pa5y|GzO_
z(Dgd*@kRYt_)7lTmBKMPZT~CdeFE0;KbQW;L-?Od|IK;-=hA-*DgTSoe-A1Di_(8d
z7HBvB7p4D}B}o|nKLtE+Jp_Ok&X|H=u7$vhp7ek>6_6dR6auVe3^uwWz$*c-Q7++5
zm4?|h;C;omPJRib1p1mA<5ZJgZsce;SuiVYvrFeF{x5h53k5Rh856gXG?e2byRn?h
zuJQ5ac)uW_9Z=k#-R_Cw>%KbOCZ{?dPg<^U+`5B)YeWz&U%+aL!Pt*TJL_hptxgsJ
zIn~F%+3tFu;l2Qn3g%5Cf?R{@afh*9OoFVQMA44p=ZUt}%$YNy!1xf8IGQQ3N|<u0
zbnth>y6Qm!0v9Mo1Hnbgg-ev^vl~!K#>Qjm;3p(Dx6pATZ;Z3!j?TX}`9EY)GS)TP
z!XRjFuDrc*R`CfKj)>(4#VN${fQ+Z`%P9cQCb58(7V+6m3F@AklM70$K!0P<!9%-Q
zj03Lw92qEZM}l4nEnn~8-E01TWYT}`jI2=r7L9DQ7+v%gG<1@w^qaiJ3KDoDdy~us
z&4<`9R(i%~v&`Sibpm)4Sx|I+yOBn}=7$W0VL0IF;xJl4eyab2)K=mFlOG0Gduoo<
z$#Ck~0Hd$-x7$OLl*NSG0qv+n6FR$I`TGF&)6LM??Fu6-vRV<`Ym3I-tegR4@=k!^
zG<`RtUN37C{Gac(@&mrRY@R9Fjc#1uj?o%cnyrv1(w3o=q_P0Z2L7JxAr$Z*-4Zi}
zY48KJtzp6$of!TEkQ88T4#3*@;u1Er=(s7@)}DWA68?Xz{i+^d%eZE<y3M7iY|G0=
z^Yl8}gQ@HQ7gQ4y=BGPJlUtm0k?t=VjFaxqvW~u*c(_|;J8B=42RGB@MZr_!C-hR|
zmg;P(`rOuWfJ1v_mpf$fx4WQu;WJ$j825CCUWYX4@hs9D7iseHvNk%8{qaUkvPN#y
zplef&U9G;JOZ?^Y8_+ZQ#^ZKRiM}G7d_9L7q^JDj?3izR{U)nyW3jW;Kl~qWGzE5Z
z<1;Xmmae@!9PD@ejs5cIkaK%jN!%z|udXu+F1?9D?gnA)VODeFPIhTo^G){|xX71|
z5}S<{`H62vAZWkV_h{=CfTZRcOIqS4Me`YI%A<v~=!`*>J+g03r}++&P85)>h=YU)
zyWaV7i@Kn>n2+8T)<&UrF}vT&tm?}_tmwQm9>;CP6T4%1dXx2#-8<Xe1I8`e*_lbK
zA1`rSU&rTFl<vr}-%;>5$TkN}?A@7%>m-e1C4IkPda+_0NNW*H#aHZux*WG%hjgIN
zs^trioiY?UG}x{W+L*B<tHCmT;4=@aH%r_#Ds5x6iv36RY{%LCw?!Qpm6_-IktJsR
z<#5}Engjeq2IUp>(KB{+VhaNCEqd#b!jxdj%L>u+iEuvS@CmGc?gJ<fKnK2J5R4Hp
zM2QP8&0VIld(F2+gLb_Lb&~aZgD)1&x-YRj_j%gbt5C0rLF-cH8Dxez>)+KS#i1C?
zQKgSU3m%VbaHw*xuW<^)eylqW&v33tRZaUE`P4aYrIWMRHh!YygH>~usB*LMdBob)
zUkpU)T6J1bg$i!CK~6tE8Y)K|baNCZxWZ<{u1?j2x85&qCHb(FbdO*q@qW@hdfhyc
zqM4~EmAd|o{gBWmUh8>!?Tp3v|3lPwhqL{D@3+;`nq6qkPLvw8Vnwv7i`t_$^)_mR
zB36j1)l#&zx7stYS451WwNf*Ph*2|=*ek*>@6YG^{r;{i|L3}%*YlinpZnbBJ|3~F
z)?(bQg%NWgOOMI?$!&OupH*r<C7_Siyx6gLTAyfc$co$@$!GLg@+B=jctk&`ZBflm
z&jB&`?$Po1uodrQ?Z&IOnh7|Frt5w$*}mT8do^zIutoi(1@WPMsX_^}TvwxXo-0EQ
zPI$rs?%Oi2ImL}l%gv<$(G~DXuZrg0S3dYU6EhjWL!#oc<v)m)qh|v%HueAaZc`%9
zvC!pB1ao+eeZWKhM|_a=mwQA6+VOtVjOBVoV~3}FP&X^iixQe!)leg$+ex_RkrN@9
zb50&%2$;?0Yc9rviv7>J!1-&O6(aMJc?3zWB@9f1f`7(a(<?U|`TU&mKT0?{Us^Xb
zpbL$I55fc8+sb|%#hSZoRe%De{d=!d=X$c&`y|n^JY`HACDVf*t%sW}^0HqXk*4*7
zQ!Z0wlA!opRT^kHfA>iln`%iW!d}OD>h&-B+?Q-A6+s$;e0LiLJ71T&49XZ;e)!fG
zxehFF`t${BDS_xaY}V+Mnr>P9HTpvdletWvnpyUTo9iFn%(keScOohRUhI%TW)ohW
z>Gl}_0$>XT{%uSc)|9kw*loI<w#ed3+RB!}^vNqzI3Ii^rse-~Hg$!608y?fv^~$Q
zzw{4PyjJSX0ou|{EQFyz@vU{xNyzFnT-vtdDY4lPGi+#KBhCTzh^uqQ%A2i`d}kU?
ztpe=Fd0s){G#&@Iz-N?uReTThgeS6t*?XI<X8uPI8?wdqM&uk5Bkd&gfn0TOtTM&k
z9Yq6==WT7bA<7MUVuw_SZk0_zRQ!kXZOLB%>U3ZQeG~8GjNgJAa&yW28X&wa<Y`j4
z=UWK4t-%L%FMZ&3I><8sn7)ab1~0G_{A`(A(I<SMtn+ZLiEkljF3}USCA&)l&oIko
z-2cpeh_LXVYwFpaTA(l;+u$gTkuf)A<PnG4nGdol(^G$>vPce-+R9)@8Wo><2Q^pN
z>O=PDF0!IWiqXNO-`8lQOrNz&@{WU`Le^`kC-DD#uJi2W<OoKk0k+M&*$@l+wx1C`
zzvJArLe3|6hj_MvhnDSVP3mfFnZ}sd(^B=LK}@8HMZ@1`@RAS)Ubn_p;OV;E5W7~I
z>~AGsbD{k~spswIn&2;);Zn9Cg>c{1P#Ps_rs*U?Rgofh&#>x`_SSOHIi`m^Jkr@N
z1>t)(*zatZ{WJj1{YQ96?<vXI{1TtYz!etCT}*~z-&C!2xhyBQZgfNmZ5D+!(EMA&
zU(noh_2hMi-_}hZ42oueYyaOyX>kxeBR`zAQ*{`%9?y9k#4GKcB91(E{%o#3t9GaF
ziDH!!V3xa=KMTWaxkgt=`)@DztvS=hAFzvM59g=W*06}QLp6#Z?C<-%(Gg5yztDdV
zRbb}E3!c(hny+=V^giqRRKao6V6SwA_ixv3&;!lC2OF;`+0>@3a<by&E<61#0{BW)
zjwJL?6@7x3)i|$Gvc@6@A1A>^JA+L>UjEINd)v(ztcaI)0gYkaV%S|A_8Zq3{yl6I
z_}#+CM-+>or_PRu<C3}{mBROHyT<_?5KZvAf5*-fseF_0m#?ZQw(2q6%-GAX>k1CG
zRYMpY4z0w-k}%yJ&Dn<nJr?M2=c5xU{qhU{d-=_%>nP*{s2jd{cYTTouI__3HvfC3
zeL&ycI=nAV(d{#hU7<fKh}>2CZZ6tyR;_CPO$YkYIi@GJS^sT0=_=D3a&Ovtg611-
z;X|(9%s3Tvd*rT44E>YDi|~#RA9GD2{<b6(d~mlx>%6l$ZHx_BTda`A;a3FZ?otnk
znt=4xqmL#DAWNV#UokP@69VVZEI#R7SodxtE+%!gTiS;b^cQ@QNXyTC6lda%8)?<+
zy78-Yfdg<-)vYG*H!0JiP2m?C@z`YwZjbjX&*UAb&$hVR)v&-j<&k_p=PU09Kfb#9
zm1z9*L4SDcK>1OUvy#}9{B9c`IRHyr>Q5XFe!N$m00H>+bNk}z^QqXD6Hwt7x{=O)
zSK~AJiVp%gV@+of{pXZUQhRUgn?9873*GBV7rS5G9}Jm6H)F!OCkBlJ8Zlobj~))5
z_+D|DkHs;AA1);>#r7Phr^7MhDXG7Mg~f>`fmuPofEMS1p_1f=<MCd`*ClB$A9r$J
zuSOge9<v3H#_|GYxXe8#N9$L9&qqr-IA-|dl4|y|^wbgy>3bXdl)T9Tz%>X&Q<czE
z_rq4D<<Zyc3SS4B<PZMAorZ6sl-<!?dsALmr;$FO$E_@w)v^bhT>MTZuCD-u{uz^P
z<x6fd1`a~VFGZCi*IHW3&7VQut?*<LASbRkk61a6Wf*5Bdg-5+o;f5J{r&7Hf5%Zx
zH*6FcYPrzp>p@IigDXZf1*je%t6u-|fdBEgSpKLDKJfw5URyr9<Ay~0{Pwo`WXwlJ
z6k0XZdMy7TlPxCjmb|~-EZb)8!@S4~GL1id#25PR;wzuw8s}mRyPLdLY_om6C&RbI
zjv7}K#AlvjjbtkFkUoFvmMT|wNxZ(=0+|a_au%A3mJRoU>LD>j=$b_HK`Hye;kuJE
zz5@t!A6=~rY3SyB9DYKJ5BMT8R<Sj{BD6QWQFu}@x{#na2<jw&oeO7QwqnKG?-*r$
zf1ktr`-!sczsTviV5{U5jIIHg>U=|@M;o(}DY4v-{-R$g@5=|>fA}{u_#11_s%7c2
zOuBYP9>1l3g__A4%cZ^mPV~!})7iT?2V@lC{Y#`lDfHnS;d}_g%V90`|5O4wK6KPu
zc_z-cGlFfM@+~x1yjc7ullQd)Y2Wx6CZ@3C=J(L<2GVfAht+4~3D%fgGx>F3&`0DP
zg14#2@x|-%oDdnb3%6VXbr(Ej8$}wn_w-)C>u3f9w#O8ezW>TO@wMV%-m_11RC46S
zd%43O4T)hbT`sq>%l+-ls&G)FJ@@b(M$p>Psr1oZ65D?6*Q{^OuBv&<H_W^6wXa2;
zXB)}M<9ZAl!_;lhskDkB+ykI=(f9Fs6cK!taPqvb<s)yY7X$1PR_Z;zH&2>O)&SMk
zAuL1HR5f}|MX(}Q_8ej)eW?_2Qo$7?cNq1s1G6_|?Nghnr1MJ7^T2;cB(DtSY?mGD
zc3nF*i?Z6iH{)2<n>BCb@Jnj$<naLM_m5}?zlOEHbbPUVq(^iiqt<%&#(5>pGL<;n
zIUO^DLh#eeKBqoIafh(w@ra1cjc$6Sq7j_Wm3AT9f6W%>9UqfR65nqN*-qlOL*b<^
zhziEJxnhq;MVVWogzg<TSQh>EIrx4p*EdUGs-Mi8kOfhDd_h<OI4JLGlA76Ol1CwU
zq1_#Oko!TMOEKvB>V{`>n>B|1Edd33@JB7VwmaGYE9&wB5AH%AEpt;TpW-e~8vB;G
z%zQzTujSzU$nLZHt(v~doH=gK3pdAq61n91iPLqF%8~Y>O2)M5D*CeK*<9OfvZbBh
z8c$iA3`|^V(AXBh{m`QjS@^0scDL_A@n3o0Sj_dX`Q;Hi`W;{4d4<&%J(|{r#2nf#
z#jV6NodQ+=(SvRvmW*PvRpU(HZ*I=skccN8a$Mt`P$auQB7CPnH0zJ(^U#Gg9w^@f
zTc$|}*5ZnrYzPAjwn}V~Zf##-*bC7&S-r3YjQtnDA5}=SJflkz0A;J1D+0fi-HrYU
zhpsM~xW&f+s{h>y%`als(5K@1q=Z}*7JQ9f%<ky0;Qp%#YHQ&xt_xu(tEex{^zL{x
zj-u+1S8I4tcN++#yf{!Dj3!WP+bL#{+|BWr&Nz@p4PqNA>L>b@Amo4UKL1jSK_B!A
z_-$OFF5xH(HNve{Z$EdrW!7OUt$@kzA(@v4Wat*K{~{uT?Nd3YO5nzyydk1T@kht3
zp!Pk`hKI{YVI8RflU2XKjx&p7C%MhGWs`<_va5Th(H0u3H!#QO5!X}!O{B<p^Im5h
zXp%|^{-<FEmQ35$(U5F(g<MZpdV`vWd!sVBAplny&fQ^sjG{I3CB8<C+`3@x)2@MF
zbl~x3REXPpd``%&KKIWY0odX7-F}mW_xcD8akNkRyS-qbn897)v69&ff`(Ec`T+0O
z_f5#N=>ya5MLbnwDL_yZtM+@~ukrT|hY5DA>o#{SD18<MLen28YyFbm?RQ^=W|S4{
z5$QGTHAfZ(rWs$9Hcg@bvkdYxeQ(QEqMM29Y#RgFp%uKgY`%p$n@x!`t1z*nt|DJ8
z{)iN8xErV19;>``(S_WKSnf}?GoewAR!~}}nVwslLmZ@=G7eMmIzaP3zTg`QQl5WB
z%$t{c3v)s<eWqvjJW3dn&Ed&xM=q79{gX(aLr&~JQ(>b!N#f=cijJAKF6A@0sXBMZ
zYeHI;g7|&%qKTCq`s4`e+<Fj?_rd>8GIdyWQaPeSOyK~e3Bum>l(ttdE>HNmHeTXF
z2m-Z%J(pu8(MLk9e&g7=n2`LovzdbQ<zwHSGXK_0yv4ho2JKgiH%yG0)j6-$6PcjY
z%>CS|E0C6XjpfR_aSHd+%72J>vyZe|`X6@H*D6cK(Mvt}`v-TjgMUaDv<~8?D3Eb0
z8M(MYq>}Hu!~A)+=W!=EatpCl<i=wEX@;{hxv@eHJSw8(E*Lz&>N8#S{AqOL@=X4b
zlFzzLBwtJL&bT|8X6tP8tHJ5CmYfBIzS&+Ha7&=N1|6?1`%EsHq<8mdi*_l5?-q00
zH-IfIgyQ10aPVAoWC+M80Jt%mx0g&+DZ7Uc8zqohsq0sobW#+4w|ZvRMV~;MV)&IM
z%!F{k$n};`{(xU+>%;nlr0v%XsYgWjJUbo%tZN^40P07%9CncHj6qVi9lq&qNwMt|
zK!JE@=f$ww>TL=>A@bmYhMHcrf0*Q1<y6U;ui?6WRbk@`uYj!>cU!U5cxta0c{<R=
z13ZJ5E2Jbls-^INCHekz!`=gT;$OXP0sroqrbNU0M&DRCjpql2=A0Kto)%?VT+ULx
zG}#BY6q-C6z0Cck$ga>Xxh!D>qIp9hhnQYx?uhP2c3uc?z0oJ28%q~uN4*<)EnoW@
zfd6GoK{@YO9xvyh*S9g~+A?@+d!bgzufREw*ooP56x-?Y490j+ftFwVJQog0Fjjon
zl_68t0wbOfZWc`h5G&lGAw-@aUn2ChAlbSvP1Lk+O~osT8q>7(O6)0Cxif;jfkXB9
z*AbHNdy|+MIEY~q2+S{yfz>!R3k|{6rqmakiSG5QBaRbkE^siE(v<F2dD1MgLKUQT
z(2Rq-3;bb=iM{Xh<WASf&932#$#p;<!hIfs)rdE6^X~{|?VaHal%j6nj&Z%eYEkjf
zOvxAAbXYjv3@OXNYP7;EWx%MhrNXuZBV*IwX|iBf5bZb`wYvu$-yc_|xta>rfvA**
zWC(FeuGjTopn)*yf<UD<H(Zuj$52xvME@M=sBESb3y5RUr=9W>Y<8SUZ$U1l>eMn!
z$GACIz|vYLT^`t6NL#>wI*p!U+*?-1MS~@)(X%Zz<-Qc7^29P?1L3qX4s_BFMsEvH
zsgy@XYcJAtSL(ha)Pu#2pm_SERmE6c^eRO+7#HM@>a+@8a08j^#l23KhfpDf6(qQS
zU0m?-W)ao=Xad~$BTmk|HkIFJB}5O!p}Ld8=1JVKFDXdUvQHWI?RP<-7YVPRqjlvc
zRz=#W&VcDr0136B@uT%+Fw0BqJ~O-Z42@KBFQ~A?ZNe+g5)VY)&wII#-&gB~Lc#@l
zHX8o4M+&&<s2pnTAc<|X{i*>xB_=?^GUztCrW88BORfoqFO*<HSb61KZv@4uoOWpL
zZQRwFXhbs=1>`&OmgZdV(M6lHt9n@D#%L9Er^{bfKFgs<auaBm`WRQ{FM<3UXb!EA
z%Y%LaHB*M66rwww4T&IReu?Wke)g(VYya6c&EnmgbNFPV&Fr#`z^!&BK^&42^tCo^
z1zOfj7<tJ_2qy5?Z)@Y8yRRPmt`9wLq<oOe#h%Ed)mlI(RR>C)|5h_C%yIv10*+dR
znB7#^nCPUr5-S>BsH`0gO;b*oNC_i@rQdnXLC?G&6*1=f4SAYad*xXMzSM9JKcLPL
zrGm^9fPwI5@#Mbp>#vy^n0D^k{w>xUVoUIVom#L-od`u|F9|{x)(#y7Yam$DKAl%k
zLx#yhbJy%WhFfkCO_I#0ZxmwVFMQzsgK@dn0M0Qnoz64m^W8k!Yo^98W<OZR35>~D
ztj^LcO5$C9Sz_gM%WeY<W<P-W(2q*rCCr-ue-<`lnQbPf3aTuFz!;6Ovg;*)li^o7
zBT-;)Q03Bwq3(y7KtGRdk;Ez<62#8Ws3FewH>W}l@6o`Tk-X44-tBGaBPGHY25x1q
z0?^)~7gl5|LMFLST7rh)5$s@$uEDb%2wEa4{4Ko~ECI7YdTL#E@E=Fm-@BG(OU)8A
zO1a4WTInan{c&w)70Z|V@xN}Dcv|fDMpOk#vpWspjCsFt9nXW7nWOYLx-2c0&Jb{h
zV$Cx_Su^jm%ls}eFdajk!wx(H^NQPDu3@QitSx@~6d@lxW;OeDh5IANn@LiQ8Vmly
zY)sO><hqN8#0k>$nd&1v6uHXyrB|8K>aI*~NsbZNbacKLs?GtDx64W3NwN+)Om#Aq
z`_+0d>{62MH1sp<w1YBTX=?#^j!_{7BKOJWuL(akbJHO%707pqys0qNm>U0%_s<K!
zjYq2|dND+0O0&+W8l~v)`RRgXr=0g%b1m?+f1xCu2}Uo*j=he82OkMqTy9NXZ9<q+
zgz3tD-roTrn2hL-UJhPU62&9O?lO_-rzfAe3z)vc47*5RA?p5_PPT^e-;CTYZhyKw
zirSwVz<+A~Ggarp+nN~w|IiSxeHe#S+*NZ<3!dLMumjc;8^c!X&@c1-z2klRDtxte
z$zSc0y8;|se_<PwPaG=1LT(M6WSG%SLCC<@)rohvD-1%Uk}Z6U5|x<WmsVG%&qgl2
z2*BvD#Gygtslr5K%buA)(&5wnl99s6aooDAb(7kM{9Lu~0IMJg&hpFI&wY-ji8YxO
z*8@;j7#X^I%CWx3A@HKsYKq8Ly=9u9kbG^ArB7m>WyFmjlQrnkFG;0B`FG2M@gwK1
zLV`BJ(u04E27o8BP4$B26b)Ipt}1*r`v%P&B@vKWYoU0hsb(UlrDVw!IrG^MAA4&#
zrX(`4a_isWrU@GDOwuChBR?dd1}&qb#3a9kmO%}jMq=pWK?@WOqSdiIl}AQJT2z|1
z-ftxwI!p}JCBREMav$oit-@{Z%O-?J7*70l%N~D32WHMw|K_&Y%!Hshh%a8TJ&0Xy
z^!qvMz#+)SZHaB;#YA`$aV9wT@K`0lFd~NCEAqQOS83eGGd7^?2w<OZXJ|HvK;!}i
z58J`NFgP2wtbD8?t>m%m9FvNbI2BrV>yh~%F=Huv`@cX2^v;>|PuE4BWWnISCr%?m
zS}9JJ+?1O@#Gs-9`bu`d{9~8l{5434C|2<_M?Llnk3(MK08Ix+Yoqy2?%~|{wY7m*
z#YHld+z_urLyy+dlc1Zjq3qg$S3Fm&b$l2)p3@?@dsX;(2ulg)1)b4QFAR#~)$7Ce
zZQSE^n#-fad|}C!gX&d<f5hgRj#^<HZ-Bn2;xniDxy0OE`H7ZS8<x0wxAmlS_#?dg
zi{>nSOAu{GbH_Yr{^#E_Li}i90is|*leSp{9O66aCP>{wo-JuWRmAFT8yktM9?i0G
zTU1%dqE!*VWb=XJqq1#NgYYRUeEN&#R&6(%jeizrh*K2w>9;h`-(Aa-pC$gt{no?=
zQ3X7l5^cVXcC^PoK_u1|^N3JdYuvlhZv4vw_@Kleoe@kfy_6DZ8;fmppMEN~qrjWC
z8%rhSU_ST07tY|qBe%9KV3Qg?$5otX0fMld&u)wGvG2Y4o1C};mlduG<h_BnT?Y}t
zER%3b0}d=^4xY3c3dn|@+{gKzs$Xk(Oc1ww#`a3?>;6hzRE!6|@Ap?fdWM3TN+g1O
z`GVK=G-!jO^sQBa**iFc$8s+hF(4)l_2WYf>=-&EX@Ix$Bf9xcVhMqcLEu*T&FvN5
zWB|d{4lu2W{)x69d*6MUNd!C~RVksr4U48x=ld`-4FbUC=ZI?ixS@dOY^QhYbebup
zl%9>i?>l(wD9UO+X>a5iD{bt$Y(84k{)WOq4owRUG*UhMD}xIx<ENFsiwi%`{*zMW
zie3;XX{Ix7!LA1GTj&3$b?2O^R>8t|F<5KWiTJ#_d&;;L2}?P6SB9wjK|9_?47t!6
z2(8e`iXc&Fqq8DD|J{1-MyJ|24cBbwOjpU`_bfwUk6TvR^_{0S8<f>~9X2=Hp;op7
za!qaeU1zCO)u85Rb}Lz<$U=x|`Sa0~s}h2$k~_~@lg3`p@EYGtEL~Fct=R=9=K>zS
zGN+6jP*=n0er~tbO8l7`c~@=qyvCE@SB@fIk_%gqhwIVZ4Vm*vhi!7rM^>RHz|%&w
ziv>Zvaj1zRoavTkF7yzGOy7wdcnv9E<!;_gK)(lQ1`SOMBL((sOBXCc7+|KS#kX&a
zyO<9_#j@K%3Z~iCT|SOdo7*dDf7!mHe7p<y>gkGWD7Rr@<9;L=Jzmlcu^zSCc$@tD
zvA|~T4E2>4G+eWb&ZOfHa7I=pMax!+z0+YZi5ov1U499B*x<Ac)<50vDJpGVS{^Tq
z$gEtc@yMk<bY15;G1^H5{@vC#3ef7NJ5oNDG&7c0y%wU1Mg}JYE<E2px;hRW#*#<~
z)&*AT;kJMOK4ai*kTW5G7G5lzGEQ+90ZyEPakf;q+}Fdezp%-dHooH`bbF}Ui~ZTp
z79;>w5y6=cJlfFNq|GcSH63Qr6W!gn3)nk`Hh-JUc^q)2!#Xr_B1#NlbbmqfV8IfF
z9J3QQ(8K(UwQP2zk=c{ki0r(vG?kNQ)mA<3&%yy0XvZgd0Hx!mQJs+(2f1z{(7Hou
zRK|5c&ZMk5;~aZE-bYNC+CM^jJCrvFJ>s^;c#4%<6>w(|bOuhxag@U0T`F_%!TX$w
zx<R2mq7LEdBvjTi=HL`nJ1-QIjR8e$lUkQg6rn>a4hM0B;H**{HhxD@*Cr=c<INVN
zH(|5*PkQm(dybxQ)`s7pQ`$aA3$VGM5pvTy@W^Uv*&_QaKce!Ha~lU}YD!{7$o#?I
z0QH3;LR~;tll>Q$e3d&lYOE%G>D5orSY?)Bp!}^MLCV75rYKK3ija0!f4PTXVUr%v
zfbj?cw-#3&Jo9BYQm>NiI?ui`UGC-GQe4$s;_`y#r?u$+bR>{IXCN8>s^yz9>~*fa
z^E^beMGy2K@59ni)w-f@F=Hlm@3ht{(aY(3bRlULj%Ck;qLL`pkm=iKyk*0I)|1}9
z9wB{yb6g7j^g0_NL<0zxCJ{H`^V^5mMQ{974!#$?|J1#tmJIz7gq`Y83xlREzl8-H
z_=WdnEXFm!lve;xA)0i`adJFf%wyIK@b`OwWP}Exj9KJjFfu&mByB%@SwLqOhNU!Z
z6vEzMYji;K!#CV-yw+br=EVUg2bH#Kb1|vT<p<jhXZ7lZ&{-uC244oV12Ek7=2JdY
z{Bhq3(sFr9N<_!K8^L6#Ly;TTu^0HYe_Y<&;bm}~cF%QXsKxfPd*}>HL$K9(_AnxL
zJKs%L*9F@JEwJQ{;X8pQSki}-SIusZI6g6DBsVW4)nby?qO$uI?ChcD{Mml9A9z?e
zJWz-rAh8^6D%xoPQFSTRc`U>%zlrrcDyOYUD?a#ocVw3wRaWliEM@c=Q0fd4ex2qj
zZs8zpU9^PrBxdH8e-FqixgJoF|HagKf<tqdP#;SuEkh*N7(9CuCtYY6IHx$5zv8ZY
zt%Je_>TF@=6B!2(h~xH2t8?chkDelbJiN_Jel2=rK|S1ozN6C>FVe)*j91?85FVSo
z$v(Yjjh5yo<P%H_T9$T+!*+fG8zb?pn#a&hipFcnu1AK?GB&6L1O_B}<{+vJUgw25
z(J@AkjZfbq&6Fk~$nN*hY;$=5E7txRU8sqJCb<mBV_xI&x<z^qHb7Y=``!h1!+ogI
zbi{#|J(nM8G0GKi0{BjrDO(6rO+R9-e~0#)^6$jz;h_&(vo_p6ww*<E{5y9@S6|eb
z<cwcnXXQPv5pQ<VU<U6FnjE>%-stH$FKrJ3N8qh{jL7+37lZ653Gj=L6f{kibG6(%
zQkh)sD>`-Zb0Mx?^8^a>eq0p242Oq29hyyz`gnZ`={<&Xt<$K@STb-wb@MH5xg=x1
zm0%ba;CGftG-UY11K3%x2E+&i*9NZ%(YWEuOWo<lvhc%03UXN<2T6{)XymqVNjUQg
z8zN_)Q;|BDE}5EJU^II7DGDHy_yqiys-(?K?{|j62s%plV-?FIz;b?6eJ6Ugu~xQk
z@*o<l4{F}4G)#01!VWSvSA}-wR(YC_BAl*M$1kv2%${SK*8s#*eA$Lt`-yEKr$jmV
zL?PoPYLj70z?Wpdg~ug4@e9OFL?>xjb~ns0?w5YT1%C$Bnb~jNozs-OfJ-wqM;nIq
zk!6-2+L@}(gjR-F+Zml^Q>VN7u1ef`9wOL!??T<d{;}N~_mWshD`0k;rdP%rfo44x
z+RgMi2~U2u>X>X5@PN9u&5>(4#FiDCi4=xm*#);WOB)iwh9V+4Un$cYg~`4n1Er_U
zGZcCWTVCf2BoKTEsj9osVK&L#%Z;lMWwd!c$tsfX)ZMlFdAw51H;L$Yxe+?`_AXM;
zpKg!>ycFC*tlK+;BdL?(LGHdl_{o=uX1$|V*0Qc0_9lk#5gnZXR-%N)?1zA_*+GNh
zdWe?=rK2aL+6A8yBQY<v6i>z9Zvey89hA(ghL#LX>(c9Gr7nLc47m|WCYGgrW$>nU
zRl4S+c&4I$x?cdcF*Dk9Xp|h`+W_3ttT52&pzXLjnM*e9l#1-S_a%wv&A2$85K4wT
zuBJI2e7aJvh1ls9cukou$)oKom;~@x0{&_KeRDu+AGFJ8gwVAfZS*SbbINx)Z)x6g
zaD1&$HosNG?koIt;BV}2j9{=Kp6B}uK<;tO!N{P3GS9OPOc}4kiPA5?t%LpAOrBSd
zfg+qv2Y(p$(*igTzkA=+eO9ecXCBK*wS874Gqr1$2mJ<d`8<W+&+!N010K>tJt}o9
zr~GQ68rGDOG;=raAwz&pOxIcg2v<;O{p0XU?Xy$*wz&`(kA4sLg|Yi`*Ly-)SlIY<
z>-l4Lt=2qI$^a2)T$J=JpmgK>6c$k=WYr+jww*#wZ1+v=PxPPdHhOks`N$rlr)Ce&
zJ#&WCz;Q8fN<7aN?wNStL!%Up@7Z4N|K@V&N=g0?<Ms7{h<eZLTwO%L33)#C@%M7B
z@wT(sSJco*awE|SN!o+vZpU<s8B4Bi50<P43Cf?iEk(%s9sQ2H%PgltfB0{%M)zq+
ziEy@%c@4|F1`T_6#il(Ti<(h{(%s_MQsJ`e98KG#d2+*BjJ?Tg<Q{XdowF%T+nABR
zz}Y0Pr;9t&rH2pVm)Ng#n3Zkh=m(AheC-MrCYrrO+arz$5WR@=wAP^CnJzSn#n>_w
zPP8bfr8u9T@ylb|F&<T?t#3<2Wf4IINQ|7U&Tx|%dI(~f->>o#tHEvIZ927awP6o+
zyH{Tdb{zIgr<21O)eJ*z@1+|&zB2`4`%&OxZtWe|dbpNn=x!af1aCe%a{46XhK`8+
zgQB~SwC;Ie0nIa8UAWR2DGxdwy%!^W>)>#2lJd27F0Yi1{WIq_O{5~>Oruhzo_INv
zlmL90i1J5i*|7VrTH`w#GvOZ@JJz|;O>-h9rfw*YO;HR>lksp1U2y>uRd~!+hNILv
zdJmN5<mAPvjE?Gc0iK9$w^jEcjO{aDUK_nA&MkP5!_MCfN0auDZfQsXgUT*9ve$6A
z>EfZpF<Cd$Ryg&o47*_uVAcKh>X8+WN4}%92OaVEOR|YofKsCPc5fM6vwv_g`N3ZW
z=hO|EVr<v(py;9;qW<yy6JC9^=Ah#Kypza<3)$I$!|#W_N}YJ++RqcB3sfW4ba&|@
zk~+Xlpm6VbUvmPlLAF7KwMO=?j0K|#+w*#Sy}9`*%r_sFw;Gt^Dr{RqcF(VrIJIcM
z*gLi0wu8Uo@Md#6=-`A{KhNCvT$1x4IZ}-kBTP3Z8#~O}BM$ByY=rJV1qToa)IZx&
z(I3f{Wd=`M4EF`15t7I0w>;X)HvVhFtw!Q3hJ-Mvil?*t_ef|uYDx0L?sfcNOSq#u
zd2xO*76*=%$d$8vH#w--uoa;mXmzU8l7rdHlWzGiR=vr~mR6XqbE>%T4=_er<YE2a
z>LD*$QTMssTbm%8c<`uL%G+N#AwwEI_34JCh_AedY1a2!LTFPjuugmCeNlk7r($xn
zs`l3lPtGyHJY&ing=FE~#(JZD8;sCnp`w8Ms;%1gHjnFhdzU4YyN%P8ciLOn`BtvU
zCbX>eQyrw-*LkW0y#eooUasAz5X8C`@bKrwl-<K99Nb*S)#MS;>?>e)Of3)7B>6me
z@{vnY*g~>^V|r7TujtF0_c|C)%waC}h&b2zGHqZt2r3N2-xkk%=G;B|@{RjzR=z(s
zB6U>u)MVjsd2_%OWp69dvC2alAp2>_&D|_;VM&$B!)C>!6C^?-UKUQ%2O4XkGAX{`
z<HBU{_w{CKYYA^!sqU&A`XfWl|9Sy{4p%A+@vn-?cmrEmPrPgrem_G%YBbo&H$ABp
zfYfdi!=VBC4q|A2W_*Vr<;cpI!8I@gzdz$YW^CH@Rxlpi`xCor9SJcJ_E5tGt*tt0
z0E&X}CwiS4P7@as{Sa}DRbbIQGuW=7S{6b*uK93hp)GrOc;skbu66rRVpivVEBkAf
zeFKCf>NxmaNJv`YRUOk3fw!BRDRS#!=Pnq{ug2zmt~#A+&S?R`XsU9%bg5BHx&F23
zYxs#HGBM78jb}3_{7FVfzyhXI>(ZpYHI?x^-Fl;P&GLre-8Vq%(T#$u=#uLWj>Ck|
zlas(#3r=VEv#UKscq5}Ide=}d4iI07F&js7D%>qawWp$U-WN(TX+h?^k9<YA<Zg-4
zj<0$#aCNqYgeIq4F32?D-@MH#JHXB6l0UQ3N^er+*t9ZOmikmQj4meFTO{Sxb1tVG
z$f+Gq>lwh!6RMu4LJg}^i9z;NTk2d+7Yoya2Qt2CY?u9nA_f1h3k&_DT$+O1I+Z#w
znvC;?Ng6#UA|}z3Li<<dC@s;sDrBGiWk1#Dj3ME29%@uLV@{7iuo7vS{95*UKaY!{
ztVlQXTO8k>xv0A4ux~xbD_zSYxbYF#Itu8hy3+<M`N6n_%KCKLJ?d|;jPcXE>ve4L
zm2zkb312SsV=z5XHbsp$c(MIqR$-0ii9b17h%^i(rn{pS;3a$716LhNdy{6A>eSX>
z`oYH`dWCa&9mG2qE_$2inv@DzMy{g?GkPDKoad*7oxchkVRcHf(5H&qDnuwTvt+UZ
z%9++kwPLzgxPqkwS-OXJ;hd2{vmf9Egdl37;ez?_ZvC3bUQHow=wQ7W@Z%N}TMws|
zdKsAzd?+Djs2{1VS#Y6jr8T14&E$6iBaJDU^ztmHC@;9hsQX7^?#-o>WK7+#j1DlP
z*Q&tH%3;!|^n6knR<TscAkVK63=CfT9I4-)swAM?_~CpIAWS3M-mQp(F_W7flQ!8-
zxoYur`h+^;X}Ob%4P;iB@~d&%m96-4bJyhh3keSU)lb23`2#BZ8mc{dH4%iz|Ax|C
zIRqgYeR42lR#)0+Qh3Jdg3BuP&O>HZ<L>Lh!ICGaH@$W#JL$q&z6g@O?tT*Z%@;*4
zQ5k4BVSwjICv`6HL6`eIYm;L=^@55fhpy)Dt(Z<i;E_c*8r|up&CFLkxbGdPynyK3
zhAo5p@>|Oi{dI0y8G3_p|7`cR1zJC+3!IwBRmJcP_d6%N7)12{IxrRk&(%qIw8ilj
zsAq^dPX@Cdb8w-^bruvup);qg0uc45pcSKz>z{_gSWg#mpE#}BTDN+MLjxcD64x{y
zwb^Uveg+&z#_&(x!E`1#HGjKu8ZwVH{S_04?pKG~PQ@`~xJ_dP1{|i0#EkZGMDBUa
zT47z*Q&j>o4&9gqO?-fy4ewW7l$#zI;+mhG$!-Q^^nlQVF)tC1jDv<6%Nq9JuCfYC
zee5OAE`j2Lr;Bh;aW&>$Z0Y`VBg}`F)-E7&)z~h${v&E@cftT)URZ!L{cRChd$;#f
zN!`H6TD3AJC{4=P%{k&+_QPMi8$8dRbiTZ9kkI}l^<l?V`HjdJn>m#L0fA*N%g{H0
zDX|B~wkQ^954E#rTOB_K=y<RHX;*4Wztvh)O(46#Q9}|f2cD<Hv7SJGc<b8m3Piun
zNa4Cx%MW?Ne_(QemgEpB_xTg&yGyE<puJ&09`Bkb0P(;{r}zp|AEI?r(jd+`kYDvL
z*3kXSLCoYv54EZ%+j)OKSfs8z_-bL)z}Q7%@{rvdU&uM8j@tqqN4tT$W6<=7jE(!O
z@QX3KF#XO?))KfpFduO#B}!kR-r4+{VvpoCvg2`KVs;Nmb-zEaL?H4dAgv>zJKe2G
zU35FdTJ@wDQ=*CxZEh+*ld=(!mJQPKt$1hq=SfM%7V7gF@8w#4ah&(-=@}`SkBaWr
z0tcaXF}dub#c1Vgp4JB?2kSaK9cqAe>BJ{+0J|p}O&PhlXcT*#Yd5-4zRca!_91av
z(P}Y}TQ}zswljB*@u*o%IgyTo`mO9-#Q|a8qx1(|8dJ3HA6tpv^H5Xgd3Ph^ZB&Hy
zL_yy@gQc5v0-^l*O9+YtHwAlOC0hUGv9~Qe>?uv{iGoc6G?S(*T59iSi39DBGorn+
z1z!xBqRy#YU-|Lfy)tA8MVFt9qb45$>s%+pa&IypBQoIT9c>}P(~y5oSyN>t-jLnR
z3+%fH`EURPpIY&+)A;0`W-2+MO8frItUzH(EEA{GiAT!Ez=+=?(xQ`tskTwxa(flE
zYf47vdPJQ|j;$a3NaQioK!YHt>+UJ=3}u?>?d9c->Fe&dSb~Lx<#rD0PAI*a>vXO=
z+NxCebY4?@nNY3I$bQ|^GXGKem`9e*C8(7cb@X?Uu|xR{<s*b)eaHc{X>G4w)kAGx
z7IyQ%NYvwg$&i#uW&jB1D9##qX(TLiHzIozxUVY0JTXcwgIDWcAI({wgx~H+So~kP
zkNEexzs<(_l|=zEWt&!u5xmrirsY#W)!@c<W{I9ktBoJ#WolL|XmjV_;Sf>kQ}ZZ2
ze(j3?Z8l29(f<@utFx*0{xvIu6zp)Z!KpajX^HQ2Q7IO-xp9MYTe)l$+cE{`OtK#Q
zm(E6iuE(<@)1?dUbDlPo?RQYR^aVP#(4m~N`2t&_FH`qrfycn|e!jKZMa>7WyNAv5
zamwUMw*<)3k@%0jowm&M^+nsj?0+-9BQ<Mp`yMbN7_fO;v4f&d%Uo%>atgdjKQL&V
z29ERO^<{;x-uWpJ{~0q-BVGL$)op${CIp|}bxvS5V2BhvOTPu~YMl6srtLB6nI*-J
zKVZ5JM`!u0B?!;T10`(gtZ06^o1kOb(Wspo=$2tZ#q13Ah}tkLfM{HwH>8*pTs3fy
z&)27iDRFD892ZDHmdknx+!~zpqv{O+O}Q9A=Dez)t97>)+>%Y=VNyc&1V#tctwz*H
zZdQfKsd^U9gxWUa{BJ5;7POlCE{L1pUf?-=4d1#kb6xVULqKAbr`APYCs~&g9yraJ
z`!Cypl*mtaoz^(@qOqC<^x9W>=)`462Gl(zUAW|7Ib8}zy{c_+cSAggA|<Cvr@kO-
zo8>kPoI%1IJUb@NNtH$D04G*ntDB>AvH*Or0K~D)RsswskYfF3u3-YcPW@@pNhpPd
z?uvDP#>U*n-`cu=yqPuHh&W8BQcGnq^pyMZTxNhKX@XA$KYO<s7$ocNcTIMElXLtE
z1yZyq&AGcX;oLXihI4DE9)lvB`ITyQ?0x=7Z+4SCK#94hd&;6<&--Hp=vX2t^VE@|
zGMg_nC3Q0V`0^@hU-Z*Q*((}PuRMs#{q*S~*Hhi=m-QZSJ-z<)tX}2qPiz`z-)&8<
z+(CWbiM_*r_5p0WU)oka8IMEZfM812{ytJuI#o;PbR8@tgK42~$m~e;oAo1}*xsm7
zcKZl1Oh0}zHFK*qUDaS}8s9!cY5+%KSLl_#wDZml6zE6BF|!Hp51(8{B&Dz)BLow9
z?GDZbfM~AYXKUW|?>#$%oeXh^pyf{8zpT=X6D#DaVJ$)pnXoBYLtuXn>kq@bgwqWq
zzF?qDRT^gt18Za%vU~(^2E)G4>a`6fAv9DGK7L_;f9@jFRq2bFFE5>gCW2;JE0M(c
zI-tqGNd(}w-R~;=$L5%px7i~C>4gqI;*4sB7$$*Tu`h^sRBta4dgGr8bMA?x%+-Wo
zK2=2~H2%dHtoA$nDG-OT$vu4X=UheRgA)AP*5{2azJTRFcUXw}nMUTfzNdvT_{G+`
z4rzg115tZs^nKuGd!W(KTf8z1!IlT{4oh5NcZb*wKC}n0lKo5-Fk1c3B8&TOOxb3`
z_6k(6l&%lw&V{)(S4UuQ?Nboq;+hgRwR6ETVmpw1&y{%*cr&r7#o0b}zi+?U>PC6b
zY;;xrRrc9HA7n8sv|C$5(15$<sUO@}+<oje^Q&Zug7fu<d>m(L(5H`~9ZzQFyP_{K
zevi2zHuASBIikW}K=RZrYc^17|4dR)1{9cqNdqcGdBj{q&B|ZYxvdsHi4A+RhJpfr
zj6Ax1?)LST@<Ju9xtlf@ukCsy_n@i|3%anzAH@O#!7&%E!MsUZIqbY2T2|CMSm$jV
zICAe=ONBVghBJI#<OL%+XK=G!Z1S_=CV%BPzxSt*@MmXKZX2_8%_HLqS*ZY#+Z5Ap
z;O$&19pI#;)(s`e$F(KONlVCRh`GY$-_RQ?zzNv1CPJ#N;Ek5IuDBLs1Txs`?q+O0
z3;PD96#!Y2`#$CpxU1%)tQ7+FP#InRtmsyZ9uW$rTcg*XrF`(?u4OyNd+pAUIM)+Z
za|Ij0<vM}lxC{OyN?3Y~iK*7zvsZ8Z=l5dr{M#oAHpnUGAV=lYl6gKR8LE9dUbp|-
zg7o1_i05n<M!x0GZB>D{(rItd6YgS}q~rE+R6>Q-p*sIh=DM@czq4Qxyualj-D|4m
z-fOc!%?6gI%E1c!hYAv9o)=WCAf>$9X`7CFw%vRk=Weh(SNLP6p*ra~4M=f{<*4t6
z56V4(=%>GF_{GxD&Kql=fHrd68j^XJ+4*SJ-GPE+y0EsSdK+jY+*)Pq+;->dWX*8i
z1HNCGo8@1OLhpA=rSsQJF_;F+-MwbTZKIjcHhcfR?57B$-V;QN;o`^VpQ(xIv+B1S
zFR|B2aMv)L3=K0aMjW?J#(g4DgD!J$kco%tK})WWnD=lUAvU%g`cWQd(B_{AP4u^S
znq%>6k351Isgs<T;BUDm1e4$Z4fFrjhg;k{bla2+!1wV!E=D)`6q)3(U(5Iz>++6;
z$rZsQW(*(a&uZ2eI9(_B`o3VGE&_EUx#lxFP*M*SnVDQ~M*`D@4Z9g9*<yHJox*}3
zJ?Qs+@Af7&eTBgytfU3f9z%ygj+cN#^y8M6D--r95b7jxFT-{#rNC0>XLWeG-J8Y?
zEq`)BkY#&|^7*x}+CJ(ms-a+)Bo6sb|JYNveNGO>L&Ia3i%_<VN2K=P4BT;2z@=I(
zd_Sub^$pbL2#c)#-RKs=RCP_1Pc2nMnGagk3oD^lzAf@SZn_xX#=YmrdC<$e_(xvo
zoUOt$UMx)C?T{CCYZYP5caeehcPsbvxO$Q2J6^W^@j-go-bM+mWCM%Ybe>;Mk8oa+
z2|ETO41OeC5wU*d+%WOwiU7-P>6V9bmzZw(ge~9vneRg{8z=oPt;oB*DOteX&88vU
zFyk}j=QqZj4}M1a_+JWg$c3k*x`P~tR6D<{I*zvCKZdJPe3mTsyuim{I*Z?)2Qf4|
z1XmW&rddY2AN4Rn<tItSHUdnui<d%QcDw%gfrqp1-gNJ6m(Fmk!%KA7$TQZ(JZ{-M
zu0bu%`1mT?Ug}qczKb-gq>4(7>{MHX5Y$Q1{mr(~RF%W@60>rfy$d{}0BV)iisJy6
z?t~RmSLn#))?imZtihujY<JgPWQl8uQAwz^{`&w=R{rcuv9FWapAQ&6=tYo%nD@_R
z>rCrNMi+YAstP0#+4tD(;e9ZG7mHE<tfb#xaos!G3M>W@(3^xH*+cb1Hs-x7&Q*EI
zHMy+{Yyl1B2H`}_*uTbC$r3Ef=@&D<G4f(!C5)t>VRr5k(*`XZa6N_op+U-5kNy)9
zIA$)-a-MZKEmWV~S<VtS3k#>%XC2=^cA!LVsl5C}@&4ef^n0l$Hf$ih;n!mmC+3TU
zFGcb8eI{!gVuS6@_ftI15VCdY+bAjL!x`jl;qhlKeWm}@*6v-t))69C27}C7LLWTD
zHw<PqF#*C-y5{5?jn^lBpkzim*L$=&ghW-by+*3o9;e2<vx2ewDt<4b5_g)`*nBc*
zx!2dbZY3~29JI5t`lBHGi1{0P0pfFLBuV$-8}&ySv4LI^eta*MiG4}7ya{EeG;W9W
zbd@(;sJ~xYO!3RoH*oa4CSXug?aP>w7*jnx{w$oeQ8S!fD#G-i6eGVS^fsrQ@~CIW
z7&K$!0(ed>T=O*Xv5_QeM1#47ZmfAOL)nd{rndL~m7}*aufLxApbUE-ICEota3-}h
z&$o7MBPOB=_)4YZr$Bn=W#~_nqUg!9!N|133GIOoVUwXcn`4T9V9=a9_nDcV&@y-C
z86c<C_f;EW_SPv^+*^hA>(I{y=f^HxS#t*$XIh1XF~ql~<Tzf>y<;U2L2{{H;A+lh
z*z1GlXz$wao9+2e6E_q2i)EM>!+M$gNeY>JUrs%GKZrRtde^gMej^4Ga+qXhttQ{R
z4QD_FsKPbQiD1}CcH5<<R5MfbNk_Ss7kGadw#RsFVNL-$UWjk!WEb8)B$0HL^+NH!
z23EJ`&M^M+2y9$xb==#Ws|C28%^<yRQ$dFUy<)_?sSUh$0H5$SAQ6*OcQg12N$D+~
z%cBW*k=#-rDcE1!(|@EpfS*z0JM<mx2b-@r^{!dYeHa~tJaKOhXCQliS4Uppl$+-$
z?^%wSYn>OB)v&d8iV6}Qxs(+j(jSD<DX#Asmzol&&zW0rn_Mij47tD-vUXVnc)!kk
zz5ZS}L#uM^P4dbHAi`JHuh6`K?5hY@!A--=Sx|kN3Q{YJXFr<uNg>5;ksguh-i?|K
z;*T&|2@H}D_qc%0OUic1q^u@4(DD-qlY4JXc3H@jf{=Tqqd_s{_YJ9!MT~ZbEJ;^?
zazx%Q@Mr^bKfZUd>efT+)|P6|$#bCgGmJQS_nFd`tL6IHd7>XpTczj^Xy0hU?QQ0x
zuwZ#}#CrSmrtngY12p6*D!s1JpkZ}3<|4T@`np7Z*+T59TSFCUjhM(N8MRS(Bb$x{
zs!e+UdO!Eh&ymwNOPOFSmvhf^Io%rP<9<D-_V!RHAMYFqD>Gaa6%VTqzrOjol8w9O
z3q>_8@W(MDeQjCPvvlrV9uT;^)(I93pP%p2tX;ljV7)(lLZ151d;iSIK7ol1YrWg#
zKY^>~R-_`GBOiRYOzut(#Msamg<;~uPPEgvP)RXxw6Rd|ZV6TbBYQFGmS5X;dx|*U
z3oXHDTIR)ZLD#{)`~P{&|Gwv5p?}|V69|*!oNO}W`}UVhr~Pa+;yg->X`kZp_8Bh5
z2@(3oZ+)gB`mUCmfNVE&=?#k&tx9XN%jv|VC0{?zg=C+D4O{-QVaXx8yQ7cG4|pmI
zSJXPrhMB4Tx^TmyC1`iIVd?9KK8OoeIr9NoYtH*`y4@oxf6c6IyOQN2B7f#-ckTne
z8wGE9(kJ~=IK#EIB{j2`K!>@5V8>*r?yaI`iN+`LjLF+6lPmObTf9x^4XYkiBl3qf
zyR+*!{N(v3kv0y<akeFCF8j8=(9dzl-$Z?@ML|4_FS|`3lB^F=g%-kgvv>6!eB11F
z&xA63egv(wX`521KK>f)>WW-96Xo&|<lO5>0eaXEcbMucT+T?szw_A^Z}>g!&vHCn
z#VxM)_|Fx0b9!d~;S+G-D*Hr@#<bP>^&=a67H75dE>DU1DWh;SZA+lofS%Zs3|@Rl
zJm_T~y%|3LWHGeGXWA0V7+h?><2V24<{!$<>jiFWwKs=N!VweY4t6(ch-(62u@t4(
zHyu{xuH9FU*a`4qcCcy2zf50fN!qKy?%kP9#Af-+tjAp03Or5ruGdxcPkdJtKK0qT
zhIJIie2=f~aD8DDrSg6&-!evlcv`YIK5Q>GpPwG)F~yttN+8Lc`H1oRT)hC9Xd9YX
ziO9Hm&@Nz_X1$lS6Rhf}y`Q}mRcjv2>o%u`m1Zi?YYpCcU&iiu)lYLv`qLefhZb4>
zBQ@pcMW$OSVP~$?Kez13TMIbx%AP&m+gJ;JRizo28AXq?o^B1ZH=`UMJXA%T(MbS`
zux%ZYF|Q!OM;97FA}%@3CU;aASZ9)F!yoX;bX?`Tw(6lxFCo59g)zjqH)^*YZC#`3
zZFy>_22Gh9`G02ZmfM&$iG0_v_@c~w*%_!71(BRn%Tj5&V7p<nx9)JQ@J#5pL*}HN
z?S$kB$3oS~!(cyOz8(EwPJ!ZYG9y=zLa?I(m4gjCrDQx8FLmbm*3WpIY>?84h62Ws
zIyn!M4?oIs?V<T_{1u`{hce3qAk>E+e9KXrfD~bDKH>;8g{sTe3`TN5jg)4B5sWS@
zOmLS8wOc|V;nFphj<qL~uHRVYooZB$|1c<V561mbzuYpBG=VW|_FnZ4q_+4=s+hl*
zVEx4t+7ns^2hU=&8gLV6aZ8EI1>KHFA5szuDygM)F#$x!3wX)vf-X4a5S+_L?BN_-
z5KOh*OmqvTOvgLBwto}<0Lk87xt$&PT&e+OcrVHQ$y9}V9G?)0+@xu;8OqVa!uXJM
z)_Y&B8PSE}|Nr>GKG^rp(2@qqitiwUoc{BuJ0^WGs%*`6Y-D{KhmL;vp5vMr->09-
z--WM>4RO7@{e`__b%NG=(d*;>E8It*&ed&Yx9m>T$!`AVDKD1cO*{xXjvKkyA<N^g
z<~Kf{>hh)ItoldI|EU{pg}k`>>C)VXiWiZ>XBul*{;6}eyzk}kdI+iR|59f0miA8Z
zl}^6)kk5}?eWzwMlpM2iVdV1u%}b^cN}o8(&$?s-zIxc~eQ_`FA*CsaJ!RO(pMDK`
zGeP_}V04gDq3N;qUyF<bI97Zl{9mMT?LeXyCY+d=)^C19h$PoVClJjfkrohnj>?~`
z<i}_CZ4N~4tEKR_0n6}*d~S0efKHXOl!seul%^I5ooR-Pp+>FYqQSNOKBs)El^5%b
zCO*w9cRma2!x95JudrY5^?cUjD8IO4mTGeO<E<ZD;&UHJw7do$m5^xSPqQqQR?Ij@
zO)HC;VZN2~`>W9IGY(gQf10ANJ%6P8T=V||g$?6z+ewgI^nnALc*ZHn(U{PmN?>^+
za6{8IGU-8&%T4Ra5T!g_<Kn<5t_KfYOeEiHTmR5!o2<iO^=>-f+<SNrk(wwn4R@iZ
ze-TX9z~@0tZ!iZGFZ?EuLVLgE7dP{Z3o(hA(TIj6@}|jh_<bQ&10LPxKbLuHRNFAU
z0DtLSGOw0Gr7!lGWBotKz0AMq?nRT45hwv|Xx?Y$2Rk0`vY!ho-}^2;VeWOFp}%Rd
ze9`n5yNn$RlbM*Lv;tSeh75^|dwAxbX>L6OHgAyK=k95@^S&qaXyD3Ck=YlesP*DL
zBwObGyu2_NeY=uCPc(2+64huWWJ&b=Syrp-WCMYWbC>Skns`dRz@>G3Y4iM)dUuw=
zxzMp!PM2dRv%duo7AEdRvm69PbUf(G1kjN|?tQ+>PA{$LEK5~Fs$U$(k9zaz{l5Rl
z-djf1wQO6XSa2t}TY%sY+*Tk2m*52V;O_1a+#z^^1b24}&LX%w!CAP=H?#LX_nrH_
zbKgGa-}`Y}TaC6tl36uJjT+KNuTd-Yi<B+bhe>C+6?QI0GZ$Zygd3g+Qd`>XIfc>}
z26NOlaL_3#NNwBGuq(tOO;#M+OxIssrJ2uyON}ax_Z##+DZokAh+}_8S!pvM=(Tox
z9Q6=N^gXQ;JLCuuN*DE3s7GjK=Yt|ch@?%j>s)5xs42M@e9Y^F#YLrxA4-{xr<U*n
zlPmZCc5a;@&nW`<+XkCuQ|?Wj1*^FE+B%;bpD)_Zs%YL107o_#;pC_r`(Cprat$)Q
zgK*ri8~}Z>&ZJeZ?M~U)qd*XNzG!_Y<asUKgpA+r>hg$PO{S+cc#JQ4>(VmgExbtF
zv-%oUD|`Z9FsAX`kl1=u%opP1lEkDeeg)~EkaTtVo}}Lm?YTy1zl>EsISeEL*uy+i
zS8Y0Uy*3i4uBmCv)}kKz6kM+D8_>XMmF?8ao8xbT_(QgeZ0n%B#n$imcQmV{kIChR
zUS#hMA?3@a3ZFewHP%5iD{&*<sI|4eoc-Pp;UGW5SE=)cg7-K2;Dp`>`NbW(3SxGO
z3F0?aREXkhCgi?v-hZtBRN&fl-%CB+Z|F<6Yu|am!WIQ5>G%7igzuk<iC$~rUJ`kK
zqT_AG=BC$VA$Qb0a-inT;~cN8+)=&~>=ube%yl{RD=p+bKhZ&DFp6)|51w28+tCP=
z2@x`p593ATNR~d9%4sL3p3U@boS+OnR+JgPx^o1;6_aY&nX49Csfuj3>%6D`!&;oN
zp<vcPN4W>%c8)wLs7U&unzK6LNGS8_V<5-OrE<zgx+|+MI<ri)!oN6t>(RIpisIAI
zw0sdNP)S<e5A9h`vyVN1Yp=z{<`7Cm!Hze=+&-9)N(=A8)@f9Ff96&Fn2l=6ImS^&
zw9f0gPK{;Ok*O$(hKX7Ok9d4vmqYS_JsZd3%8W)h2KGChAdmK!l|t-(KSB6kI2J#F
z83!`k($6l6FyJqR*C`6DQC})W+!?;d-hdYMj!Ah|*Cl=Zm~}qt#F?3Oe1Lq(!!spc
z0jOLf`#UQ`BY)jinWWbYZf|*JayNT8_DXC=3RXe|D>W{7p&BCWIuL7?-x&(L{1Hak
z<k=5zJWCpK6-l4z_LRMBj|Uj%qZMpYPP%ERKtclc%!jL6*s?{iZmrIES7aA$!#t_i
zfO@5*=G$~AJY+gociqJ+Gp_M#*#3E@BYDY|5kTLxoT{uBU5b>BEbhlEXM4<TRmOaz
z**Xzx+73Ivbt0%AVKEuBBuP*NZN1g_3h(|Dcec}prJv1AVizh;R6`qzZWiQK|5gLh
zKbO6NJ77N4#4rd};Wb$766{Il5CMJYxKs$grj<qRC(*3FvNdPZRkuzQ)mF*Uz$8SV
zJ{69MjhRP;@@nodzc<J^@jE8Gt>OtXZuxxRJ@1teuA!ktEGAAdUk-C(fee5$yp!P_
zmvc{PJZ^Oj&sI%0(TJ_2-1*txf>^igu$`p7n+gHHR^YKAE?c@?ove?NuNOn2=z4lw
zZFP@ODOvaAsT)QV=N&IQ=sBB+c)T!}Y)_}`kA9@KK5mt>6?u?!O=CNCEF6#&<jm~W
zW+Yfz?yxQ4ByP0|-uHlS&=DbVFe$Ty%Ssky_w=JuB<@edIh=pF?^!K$Kjq!AMzs<Y
zb>g6By^r;YaKDCMv1P!=<qP5LvEzK8etkdmR!z^FA9N~CDV8;TJ4o4#1Pj#!BV1%q
zhjz+wH>GK59hgXoEb6LtJDmI6n_v4nZrzg{W@ndw*!;%q_$;FZv;ykI%o*n&MY}{P
z<^qQjI?`TWugvnT@Xy1BWqUs*IeDA_ZL27Tf)QW*%8Ggh^<SO+81M2R7vxT4(37iJ
zd_L?lZ|L{$Jwv-}(Vs;)IH`xKKw(>&WECN=n8i8sM%@<vdZOqP7=VOu2(hMFX#I}U
z9rw_DLRV_ha$bIKd>5%{I;pwgiIf|j=5Nz5pRhspN)5m#sB!M1w>l9k4QH_^kDFaQ
zrG=j_s56OWyJoDrvgocJ<p&_O_u6wd6I<}NXEiaG<u|X0=T@1$Y}f4(y(uasFRSKO
z!$FVucR>#lFf^b)KC!P6dxPwt(2ShaawcKwz5C^hR9kW<t89*^zQs5ttHbN;&e?ZJ
zz8!o#kKw%R92qwdrmf(^lhL}h=-}<R+Lt*S4<vO~dt(Jr<P>ewRdn1LqfO&9aWGX`
zF!3x~v~R8=mv*9`SjGc_lpQo6+ID`fbB*Z1*moR3WJi;0LG4}d1xc}?6jHAy!hY!N
zuVZmqGI~X5YD}EcH5W7HilZ?1I|uYzo`0S#a+(ltdgucMu%p7cs$@cbTvkb46TP%^
zecggUz`?){r@c+&I!Mn5q<jx);Gtb2eE6cZp=<GJB;UKGU`sfNf70^=%a;#@lAchY
zG@Ic9_!)LLYdESKCRFWoEpCsIv5KtC#0$khM4_Zm<X*ODuvN<B0Ez+%Vkl<uNvDnv
zZ#Oi_!4nBZ9-OG-TsEU4`bc7{cvD8Zru*Ed2KwXDp-)HvVu?=x@>Hto)7La)nnJ&k
zY@7PhykNt`KK_NvQtila`lxw!3*(Y!)`wj}LTt|=C7tRa*`@!b;EPTpzp7QdXR7U?
z+g|-$#Kz|1OCQco4zn>D8N5fPFn?r6u#ec6KNBU5P`n{TW0(2kE(8)ISDMAl4|8Vc
zU9vgy7%rDMf)p71YwVp?{IyG81zI9Ok*tI9;%whWHNFws;`ZLZ35h;1S8jJQeM=>T
z-3^^+WXhOp^y_fG=I(Yc>%(WSu93&XzQ{KIOXAzUymtuetRiFBUS#?<T}Jd70n=TF
zoTL|XPbSA+<_m`|HN&=qhwbT+T|uzU7PIl1oGf8_@1w}5Pu8}$D;f04OI?WfSIlff
zCs#m?q+t#Ei-`nB_O#NRE_G+fC$-zSop~)O^>$GAcd84lZs>%bQbJ;<8E;$~uveDN
zksz_h)9=}Ct7IeXa#YuiCfXYnf{<7d3E+5+=pE6+D6{BY$F27BQ|vk)Tcy#D@C3t!
zD@EyYGvP2)?^TIM39>T9Se}QGd~ru${j@662x6qKykYO-(jA5{e1G7s;0}1b_jp|e
zBPiO5BkGkLzrYMQm^FbA2oclxj<E39@ndeS)}6?z1e**g(0>imN+;wga_}<n>c@<n
zWyb39Y-oFt_ArLS)ncG4ru7c9;sn@8Cut}N&d_!9%L=0kG;&SPj{emia4PqLogRlh
z`ZSUwdCu(BMuQPsp><2N{n7-r6|}ZYkDa`r<*8NeL8!Nzysl260f|5V&?rzbaCaUc
z9w->K35B!ROl|GTlDqQc=tk-?;nh}J<lY#a-D<zO=9LO_jd`nQ1Qxlkz3>|1(I;DF
z(sPV#tIeK9GRL0}fT@^&yk7DyY|St4x(IFzhOG~Kap_U4u19LqSx#*_97A>+;^gtY
zWc88V>SuqPkQwDYrbxpc!CF6)o13WQp&1$-J0<Z5s$&OEe~tf@<L#M=GfVBWB?Hga
zu_E$ZxC`%uLRRYu35J>zy)~_C2PPb}4Mf^#g^<#<u4#PiPpHjDtWx>F8;8z|;?r!;
z312|r>spkkT!q6L1>wYW8w;!W4Im<Zi_OtBEhJb)*wV1P45NNk;2jOA(MnAxXuoo$
zRJ>oA>eJn5gN7kXbua9>1IpwStMW+4KhbZkP_~7seCa#hcCFM<E&t-0g*xSfe>U)a
z%wNb=pE*AV1qe%M8^v|ww^tmy)_qzP^HdZb_v7)YI1vh6PYd1&sgi7^POA=Jo-Mtb
zMv`hV9#ra&_<Wx^k!T>IKrz!&a`b4LLUZN1z%cMJ?QC>s;$*?nX(*DgW;?oNLCbTq
zd|`uXlM=s)>W>JnH3;@5s##YKS)<0IY{{ix$OjzXSZ9L#U!YMb4v^?UQHWd`yP9z`
z)SsR;J8ZvB<MGYae{U+cEsbF_7Wq~i3Jh28&3!6n?%{}&S!=YzawMcbl(-l0gJ<Jr
zd7?J_9Q%bW><K@VSPveW+ZHFc<<;{RPX3TyjZ3CVg_`Qe)fpul6?Tdb<@c?>2(GbN
zfh)a&X;F`_bjk0M*Jx2#dn!=LiYEiP^qoV_pMmhVa`Cvco10%;mz-PF=jPOG@H^4v
ztge<GzsUI8j=V;M&e+v@JN~ny&5z&bZAqs<t=6fT6?Y7Il@8}Nrmze5Kn<yKnP@Wu
zK~->T&>{!lJ}$z9kNI+HglB5lS~n18_s|FIkRD-#d8fa<KH{KxSL0y4;tL0RTMqz2
z#vf{^7GGXE$1dC+6cakSbKVYh<_w&PwfnzH*hwYwd!E>CpU%n*^9l=(gbwOZr4uyO
z)O8j1sbToGc=k}enSEi(X(7}5>3yl`A|BZQl`qL?4jk_1jx!R!yR@_%UHhUVqa$ap
zA19ieA^sF69D&!C=w^xG0@dlu9-34K=H}mz;}*X#C=l+A#S~GmaNNv?D8ik;R9HOp
zchB1trUqvhP7HTQ*ZPB121}ps!i{ax^>~2>6M(T_I;5o0bfo$Aw3L33nhP)38bo5+
z;YlcsAQ&A!B~!-N;rT;&LcL6v+WBBrzxsw*>~R#WZjuow5M(B$vK#uWo{kXRKZTxc
z#yIACTo#|51Y$^*Yx8B^IUi1mx8Iyunh`Vp7vAj?+{Aqt{h9CiUW)ACD$mC!&8mQ!
zaPfGIK0Rg-<2aSnS#)%)<Ea^b-+lk!rq{=b9+y$`r$VV|3RbBRmM-l`4*waNuVZ3!
zzh%Doxz^Tk3uHWVwg6q@y)^H5$<F4P_UekuPmaHkvWJO{#Y(d&3fA)VOm@id7p{Zt
z=8)N4w?0z}sLWo~L{CGUG3Z;d?V#4Kk!aV?@*C!>qf>#%VY33a=?u~OY;)c`+Xz5X
ziDBqNebrDU@-#<-i8+$pA&Fvw$x2*hHJLBN*e9cUb%4s%pK8*06!n4YO6o0_9f~6c
zwvnl81u{a$<3Ql5NTX1{u;BSm^xeihC>L|agd;s6N$dKmUPq`btFxk=D*Gf`$h8Ia
z-2D;sZk5HayIKm)*`v+M<EsF_w^J3aI<K{+Iay+e6am+smp$G^0-^n#WaHJ!G$-+W
zDlQMUc6=Hs&f46|zo9jAYT1r=!iSex4nWue)t!Z%**R^xV@NbMd{TaGjKtwO0Q>T+
z<&3FTI-KLw-H*OnrGC;ubu6LTD=5y-jpC&Y!%^~YrO5VV)2WyfdlLwOvN}JF%p!a1
z<+=HUk-vQQ69F<{UG_x)!RW;L>iT&yu)+HDp{bXSq|5fTAoASt`jNlOODLWvYKgWI
z1XwI?B(M#qUFaiF2$?f$iR|Y-+|m0r$lP$(x^=7M^^9{j^3FSjIjuzOYTbiPj403<
z^I%=`UU4US43sQDGBw%eDY+^vlxeY+CUW&?&*6FuQ}nSee#zdGQ78frcJh+=jY}3!
zZmqp+?w`)(Y*X-ewcm6!i#lzJ>5AL>BTCTek0ltPJiXaUe{^Nz9m3+Q+ZU<?P^ebE
zPkrj9DLWHBYU!w$`@VPcG(w0TV&6jEE{cPNCuKaYJ-SJX!J$4O6ZtZO%f(NxjQs}J
z@X&KI;V4nyn14`U2jMe%)!SH1Xdv;YAAnho8Q@1F3F~#cp||Gi-ODC*>qK0U9!t~C
zyT84J%VE2apqSx>mpZ)-%v3Spb2(a|UfbnH^rsx>vbG`#R8%6^6(g)m3Ojv5KZ1iH
z_2dX^A-Q$|JkkY<^^;Lj51fgYko#vm3{Zx>-hI7N-B2)Ci`RhaRJYP()1u?x%gLbG
zSqafe(D=ob8Z(XWlb6r5i$dbtbcfYrx#$77uSm6-2BTk=w}K=%gZ(nKcw_(YN*ebo
z8LPTqSAMzT?zy=RWkS03YchG}Jm{~n`a{o%U#@zp(JZ$9`eKFkVq)Aj6ntGUs+Fg^
z%zsBZ&`O+Uv;?vE*&Yg%CURE7y(Kti$*lH#gef6Eze(gP{&dI+od@GI02R-UNnN^H
zvFYWR<}x1__iavd%#m**FG75F7c2~6n3TMku3WpBNh*bSHZrJH(hI<xkCoE@4<jKL
z&hR}i)YBD6qVnD!9fcme&M{Jd{Ub6_0CLjgT06OXa3xbUANn>Y`-w-V+GN-?9){&7
zLqKCf?pz-0tAVH}Z!}>65#1HXUkt@&j&PQp3;l4ww$Apf5B4r?v*8gva;hP-k!a^b
zALbU18PXvO+<1k-zjTDY3E+!%V_mAxXXh~b`v$B#-w92C8Z<mL3>tExN+6h(akfbp
z22q&|zA~Z&8d-y49mFzyi-9F7TAD=USI^w?#Xp=dAzx*Aqeedya!N{k?1QR7;q#`O
zCdd#dVqz}dP7gm{y!2kvK4~3S=;N&)6;d>SpwzdkBI#vmtOK`Z{)%C2XjcCYouSCg
z5Dcp?GC`z$Uc3p1D>lb0dOBn_A-d-$vGO}UKQ}b*zwNERr^Pp~4?asLwkT9*TZbA8
zCp7%_9^H{2>d0g6;5aSPG#d!M&DWt?clBoy*<DFgCgUO>f16(neiFI<GKOJY!w{+S
zWNYK&))y`g1F##gcS7IHyzWS?to17&0WzC2KM^%8i5>WBFGEC1F-__yL3vx5Ff0K*
zhUwZ|drzRfY1w>f&yimpICRX)$!QT*)l>xj9og=~_Z3u^Rk^2|AlTj7tY?6~ldwpF
z^NH`Ftf6oCMdKj3jc1RGL5%-~d<SmWrak;dtCDo9vt;<xTC=clkFERaXI}v-4p*OA
ztk?9p=~zVY7SySm*wiE-LS0>S*?H6O6A?^PqPH0-c2MpK05Jhfk9xyXFG`el;J~_G
z|1=uKH?_tdeZ~`n7H|zi{e*%y*7-cpsfGCh6iZl|X%>wx!5gdeNBHc=&|82h3}0O*
z4K?ptXB%RgBk1Bm4}|86YGoQ*BWkrV4YO^nSNhL_mja(KG#2~yNh!Um%{o+`Spa7-
zM|m$x=nqeT4H&ktEL%EXmK2>|tfgE#oWmfnQ=@PDZ2_?yH<)(CnjPn9nVozWh|uk2
z-~M5|st3tGA%T6kEM~5~k{4mOu1*D9kCHzpRn#VIlrDnzc?EQkbWz#YI@~vlc?~7+
z72O=^^MX*>8tkCVG4V%Iuj;N~{EtAtT=Z<`;IYvg#c@po-inG?7U+uU5z}M}IJ2cg
zrw|D0Hh!vdQd=oIv{Oj^`8>903vV6xb=(d<Tg;l#0F(St^opWk_C;sJCfDrBZWv|j
zS>xnVg2~eT@}kW;)K!a+Vq;9#Rw|V^$^qfQZ(FB8uXo>qY18676_yJVgZLvLIDpN)
zH92>s9{>mdQ1)H*sHL8a*JIXA`$kRFHE!y?4x0JT*3dXi^qlB$cZu%PQ$imttf4-i
zXQWrJs<Y{UViJu{;nCd!>}l?kd@d`o_X3+2d}K=BAL&1mYxYo13WDS;3kH7*=15>>
zLOA1JNB{_iU5=t42$mvBqf;pR@E84*^_|;k*Bac0YT8Zbl~1XdJ37xNOqe+|$-|zA
zhhBw_ahBD}BknhN>qNvg3~lhzYseM-%HD!K1dYQSi}X0GSwEJur24B3z7;G8Ew8D=
zOQ(bi9O&rDe_^^7ISI=g)#T~+2eJAMg#GxHlX53e^FAYR8oB)0k!!Qgtir4gdv?XF
zB6Km%mOR3FBqQ|xx!S@MZ)w`7etdyCZOe1|wtYj<w11lIY^A9(HrvuWZ{8F<<RgiO
z`C#5uQ+NL2qr{G_0GHblx`f|DYB;aXDBivPfeFXiXK$t5)@%RSqytZ<Zcjq^$9vT~
zEpTeX^(GNriKhR-6l#&#G!z_a78<`MC$Zd<Br<~HtL90FYI)T9#@w)COiI$d2`UFo
zodKR^Of>===TjRhtcV_Dr~ndpO0bp$&J6K~akKXG-0vRp3?k$OwXY_on+I7{qH)S)
zS8u#tybmbzL_(1DX^imseqm5$_Wp~v#s+7VhP&pCrgt)4aV)Y;jmTmb+?(v#m7^eU
z&<%#$+c5A+o7jV;wksu<z-&+yTYq1?T_^g7z*XT*;aTknPr@PFW87)hSp#c3E4J$k
zAg3<3Uk=>lZC}_{g{#4nDbX~t5kuhCCT|f!OZ7U@@EenwTfSbZFf&T?HZ^zsWW91o
zDlxxRmtsfQdU~BCADZBK6>Lv=Fdb)gzQ?m>Li!bf#b>hcnmkC{d!hDdZ7*w@g_^)<
z>UR03?cNyceOi<!nm^e_PJ5X)ga}$UdP)3Y>1}BD_%FkX#Tx!@1IrYHnV(p96DVK-
zn<6>>WILIq<97M*U&bkWb<rA2yNS*XdRDBYUB@j9lX&QGpHIVE!-kjl{O<)3L{Hp_
z&+gI}A_5s^Ez@GJ;IpdKv$8KAm$OPaTx6o*z#Kfz0c#aHr_>85=<s<4H;;OyS#;S9
z7~Dn`O9yV`Zf}M3l0UAa$`YCaj52JF)F?B4_-TP8L6V&YVsH{yu@KiMZ<~&Kv|cpo
zM7GJ{Kd4#nw6LfIug{V0$AyWT7(yTNf?)koty>nsp>c?KV-(}3{uAq(P~GrT;9=QC
ztSkz21_ij>kJ6tS=Ezc39>jtj5bb=klvjTe?R0ztm?K2=U`3u^&l1v%>oHob(5%|9
zGj|c9fmImdyndVPEd&rBIoo#jF<ZJUG219Fx||y%@O;s#PthW@iw+yek8lV>Xks+2
zDN=JHe@Lya=C*9{IJ`}ics>n?0efo<^q<=&G=p*d7(E&cFi(<yl?i354n$mOteSav
zw0{#DiMe(Z2m<kfcl5!pJaZ82OE}HON`(;TE+w?!abS<FCUrwYs;|?Wd)2c!J*6|G
zU~*A+=K}LTO|E&9!ZIE2SXa7W!9QUgEL_=zH5=5QcH$!p&s_^UEcy8Ico)<*wFDM5
z*93VwHdc3>4KZ$9ID$U$SzKuB-5)~HiKwA2>OUeNme|WZHsA5y*L)cV6Cnp^Y)ecd
z7&aVTAi+EY?jQt7gThda8qGc#rPo(W^<!Uqt$)?amzkw|(7s%BZ=C@E+4V*MqZ;l-
zf>^Q~TY`8c-BKKCuK2Uni3C+-37&m2Ae68AFWjnQ1h3|LqIaNJ*P(=6afE%qNS^v*
z{vO^>eKdV}p$})1Oh;Tek0SLb?g{wAK__U1-nQ8&2Pb5A{de2)9IeG`p6QqXq!0qc
zZ~H*}w$OTfaCm-^aOPA&X73|$b-Y}->Z?m|lX0%KLrVg3|JfXRlNpeLLm-@Ti;^^R
za3vxrg7Mg<OxJZTz5+vgxIE?|x*C@Ov!Q7pakEB=*wLqpr`KT#*yvGr>#pU87ZG`b
zqs*h_ellJS)-iP$uI}1vNi+-qjNoIV(J*p5%1u@6m$Z%kUzOriI!s5Pc1#k;{;3g{
zRZRu`HNF=yx78F2(&-sa@p|7c_-*;?M2i7=RU1!OE{f&tF0MJWsPY8qq}RLXwBPIT
znY3RzJP5kF&;3BLO(3=%59GBQMhIp!&3-p*C){hoSfs6Nvs5eYbLVbDf`R5gmKhuU
z05a(sg-~+wmfkhj&D;1dSB1bPVTC)5VE1=I!B@v*OHm)F^m{f^!L^X>YJ{YFyD@Zv
zSe5|Qdp0D3C#LZ6yY?UE$e2F9Z}{$y5yaa#m&`KitMqOf4JP35^Rn>vjBmpiq-M^b
z`5gR~<I_xXPNemX#>Qsu*dIIltd|W3??NJ;(!wf^bB{6VV1=j7x(7p{Eqe=snRO2#
zK3p1nQjh6cvO*=8J(Y^NFdoV4Ubv=oD&RL=<<#u=YuI(8nGGnWQJqm7@Eq7ib(XU#
zS#bLn>x5YhxxJ2PmtMQ2pPanK7}V=)A8sbKA4f##T;Ck|))Y#QereYXfz@>r*Y)&v
z`>GHc?I7sMI_gv8(slpM0UUuTA!R~<D%w)$u>HCC8zksyj7g)Bx45w14_TCddo*1l
znMI2-H5a>hCnTtr2XkUahbz_=^=l*k%&!?Tc-fDJ$)8v=6e;c4Kvsvt{4FH@A5-#g
zH-qZfZ>gGkJIz1PMlya~U^bgpH)!!Fuu`7=GG6fB!K%RzKM3tpL(XFW8&-OZ$q7o?
zX5UMzAJa>lVd%mu$vW*yu(xq<mL4C9qe4%RG{_XK=iBHe&EHD#iuOy+FesT+En}z9
ztUO`{AatKQnNJQjUv>;%?A5@ai!RdUwAp+2SZ-I7%wIZk$AjPB3to8`W~ULn6xT?5
zy{}ni_Y<3|=TV}=PVA})Fs>rAlyFHh&W#$+*~p=ARbsUxc<8ce{5lKu2j9g=x?o`z
zcnIvWin{R*S0Oky2qg&cCKh^S3mlgRyZ$@Q2R^enFdGMYmBFy4??r}0TW^O;io1>-
z&750k6Fp;~DQXL&$pu*S=%HcYh}VhUF@EAyEmhQQ7_@uL%@9~Rr|=aOwj>zIxE{7*
z<_%`sK&RaWX@oKDykNX(pZ@+qXP?0b@tXnDIEZ5($_95RMfs5~)JXu=`Y@;-rw1@7
zEdeL8v@*%#J6cT+N%{p|G^h}C#C-RM8<FCp`w0Db<dH1gLs}BH9qwy*E3*<XNOV<z
zYIJrA+}3+puDNHK08bR@LXKl4ka15?nqhZETQEwzE4W)@RVtV$YWLKak`NejgRJsi
zX}JfqgF*Xf*g+kvB#}Ue-7#5Es_{{j%|Y+pQ-%JUxdBqO;U1Bu`hRV56gWdQUb}Vd
z#^fnD?1?yX3sPIvEJXfdO{YrznkF&km|LJe{8eGi5D8(Np~dnZGIq!|BAm@<DSyG5
zY9@IK$HrT0{1fb<_JThP1&;-1+CSzc#v6b9)bXqLI9$}v23(9wKncFTsLQBVTw;+b
z9<~KD1g+w!kT0oLSCO|btUDv(a}}=JR8vJz1vAo5)0VzqI71a8Bmx-xl4Zj&u*nwU
zTsL%s<=#Lht(#Q69fkJwVV8`2ny1Kznmt=<mzws*FLf1Y^cElia+@D=l75omyhfSD
zqy@~Wb`&$^jx&+AwT*a}=)dHJXUZckY5&2X|IMTK*PsEdgP2z8BD8mcT(-<qIS0?b
zrx`7(9O|$J3M^n)9y@Ed^oTz;TBo?1n0&;>{9ds%*F$PWb6Ar(KW|Qs6gyZO88Hq0
z{MF%c<*`cQ4Q`_~lUA+=2W_uKACZ6X`SVVre=uFh6)8)vQ)HcG`1aka+BSd75XRfA
zZ45VE;nsHjt2_H`dxWn6wL=GT9^2Ta1CXYz49g+mAZP)VmcFFJM9a|kIcq<=96qSu
zy;i?Dxr0k@rc3u~r><UsXW8#N-NK@@t6E^jDiTCFr3S70kw>S_%>lSZ=YeYF3F0qN
z?x%LqGe!t*CCH#fc4ewsHoV*aV_kVXUyWB5_@s$mw^&J~&9)#Jj9iiM7aibFQUJEJ
zU$=iyyi8v|Z7ua`5GBa$(FxbptqvK%?=n)F&CgqB>acT3S_4W<!slKO#i8<+%4ZB-
zWra0G&*e20SEJtYu$|%K`>i}Cnn6Sw69mB}e;eg;eh9>_BD&CW<FhbOoD~wF9c1}J
zC;b6#+#hYW$u4T4W0g~WM6q{3d}&Wno1~DQVsOh4dtrrbS|a_ca#4?xfcht!YAsg!
zyw(>tU|9)*0Og&Dp;GUZfv+7k-`P0#wrht1*`TlSM5t8Dc8npa?k0g}79aqnkX(U_
zuU?LCmFo35q9+M!^SoKy&~uu@nDV+w|F$*1qj%C8W>4PESoU$H_?q&)NA6b>+V)DU
ztQYx}y@^yLAo>`Q=R2A5B0Y6o?`?5XL%0SDpnU4EqjQ~K+45tU^1tcT92KBfR?8K}
z9~J?<B3=j4<FgwY$)}y~(B>MOWYJ^g*ilI9E9+NDO+&}<c6G2kFratYwr9RNT5$cG
zFb0Q>nA8bHi?@5)Yh+(7GV{oAd-4s*ej+XQ4ICg0;3%VKh@(RtHiin=UfNT5D08pW
zSY0=E&72~00;x0ek&hO>(euMwg>|U2UNezr=Wx_}YBR6-#%wrA3PMcDViy^X#;KQj
zFOU%oA$ZsOw~d0c4Gqet0MTV=s)*BR<WM$^(>z9@fxBf8>4P8PE~$WXoRpsTCP~5<
zb>O505CmGsGbD7(Ib3J8DII-YfXPMt2bJVc-H}||0A6uzqbg>eldhJU{MaW{?Oxe+
z0-^aP@VOwNYe@A3l2L_^_#r;u2+st`8BAqRb7i8+$t_0U9^N~s;lLd}{*PV&@8fYK
zi_zVjIKI~WBrpy99S1H=U-=~T(jw7>b+U?##_vxT^Y>@*Ilj;Gw#kX~@{COQk(5Ul
z3s@i;OaAg1vL=;qR2af{2;X>i5+O+vFhl^Q*6I&2SdE7reFUha>DRUwi#^*}Es)5D
zvqjg##B|#xxq3!hqc`OKi4-LC$_0r`S{z_Vvdwa{oW-mqO@9pewagCuKZ-4X@$M&Z
zfOXwV>wh4`nT*R;iz4kg2fe`c#A69^{I2QO4=#wae(iJOa(UhV6V>6z_AB0B{--dK
z6v4k=@W!z3vvlaywPaVo?Y6JT0~5dokWR^Gc&JHINl|Zck!vb5aU4u#|K`PKUOkf8
zKv5(=dJab!n|k#=*05(qm3Nr1DC044OF0YKAp@hRR;*5Q+-2U4DUd`Uf%}ld9hhQg
zA9bwCQF4T9aM8}l_E1tB-l*+Qd_l_@63r?H=XgCqQ#n`9LoDwVz+a{mO`6iUlNz1|
zHM+vyT_zE670W~qSIgX85IPNfFI%i1{*24G9ZK$-n*tp}98qaKU7}Zh?R9ml&dyNW
z2o#d{mWl#9(@EMnH$`q`(MfoB?dxQz{&|x?V>c4O(UUY1Oc_074CYgd{9v!Xqlq;{
ztb`TrTawmAM51AYv9hHpS?n5$1%0OMbdmYol+=p(57+h2&+<q7E%|PcvY7qhfC8Fp
z+N>l@E{;9|5OAdeR*k|5cu>&TXFe%EI8i#_L4W@G5AM@n3j61G3g_QD(|H*Zrp+vH
zMja3r{Kv@XH!mF--6?5eOA#yE;!1507{y>1LZB9z8GfmqiT<}I{NtHavViqOgq1_<
z<ND;3kSCL(hE66(V+PKWK}#92q=Cjp1VMGY;B)*n-tj^NY#=)em6|FGLlX=2`<0=H
zFaUdkDD8KYoa5H`-_7!0qfsRNe&ZxxC~Sw@x_uo+%^K4rqyFgO!GuC=CAb*ize`fW
z{VwUxSDPel_QwowxQpb+mTZ^+2SjKPeh(7b(#a1{%c%fy3^ixB68%fL4qyYLR0}GL
zo97R!#TwGe45o3KZI9>n6m5KQj{^Xm6*z~jM%jr%1-iust7JLf((AEamEVt&go3W;
z!G?+o1qOtp1qM+RT$1_+8RSn&$X~>eAtXiK*dY-pq_&5<S*~PMLXLrO9J(plO&lcV
zkp4I*q+T}vQq3C4WG2n6i@iyX>(F_2FWORmU>7^kc3!=AXyYu!N9rYmuGcbzWL5q6
zFPQ0{zevdd>yfveX*j0VsDZ?wo*Umz_8CEG#CjW8;sH3>9Rc*YN}saBg?6qjqqMl+
zo>27n!@uXH#sCUL06aY4=eqE}5)w4_37|E8*+FnP^xuMD#gqJ?LMmU-DP&D?#(=Yg
z3MX%VKfwe`GKHn=>P<YKqbX??lzM|05<K_ob*MiK=T~vRqo_}DCQUT4)ku}g@zoI4
zis=95jsLOiXTX*T6P#30r80#{X3|l^cvVo0veOq2dQInd0;k3O_*Mb7=)tjbn9e_s
z3YfoA+%I=vaBTe+T9XxZUEKd}vHr4K#=r_-YGxJH*8+@m$z!iuTE|~Z0rNs{fDkEB
z0&3-*e3l@k?{kv^_hXgtwhl!_81O>#IQpK{^Q%;9v2gKdfOz6Z%k;(n<z6rhf(nLZ
zclf3u_pinG=aI($>t`4|G%~{1w@D`Pe@^n>`3Z`|1l0At&C8O1scHYLb^rAJCk5cF
z-+Zr@{ZD3x1@jWUcOc4;3ot4F@}>X9FDZzAFCM&V@_#Zrc2Pia37S5XzWP^7_diJG
zT_7OwpE*Mu|H<s$BLZ4L&GUI0uulKiV*HPP^#Al*;zTN%|H<rn5rL&O+<IU2<)3%x
z-+aeJ10?<~@b&P2GCKlFU}+<l=+*wE4gDWh?(17X;-3^v(*9;f|D-}RnAE?QHjcQ@
z;y+Q>H@_v0R?PID%<g|T(_gOoe>c+~oBw||)1NjF^uL?w53?Qi|98&>l0`u{+hL_p
zEm2M2Fc|{!o#3sB!+BbrW~ZNPy&TGj{xxRcp`X+e#^9{wYWvOinstW3hl>q7n%X)A
zBbqdx(HZevS}ubbx7bqIl!19t39mG#qLL{5gD`J^BOO~Kdy@`lTOtk*b69*1yEz&B
z?o^cGrv(3oOY^744wG63g=5p^f7m46cAzE7i31rTm8xv`^VOIQ0$0CcYpDc8chFdJ
z52km-Vxw(IkDm&L!5M~k#)%<pRd}~-XK(f!7A=%A{=Kix`vk*IN74w~3*}&xkbWV@
z=X#v+(Cijhs@3wo-gcEG6rJql2z_B3hyvzBGLG6zo<XfNRi#u#(_*Ii<3xd6Ne%c5
zpICw1E%$it2Pv@L_wQSbiW(_V^YfwThw5Zl=!4<D(ZhSb3P=;5XfR9Q*4U}Ve#pje
z$CnOK%c2j)F~)3)Z-U!ej8~6It31q0dH#(l)5EaSk~BX1k10KVX1qYVF&HCB6Y?x@
z@Ez4GVc5q>>%~vt(&9E>Y7Ez&{T?TLer7Vf6?pxFMvD1!(rdbu%xjLyXRy#&3X!Cc
z<1g9xjC49m|A@B~-gg)A>PRMMTa4cod^Oz3=i1$S`o1HB|D7;NA1jP--46?mL|N4T
zbW>PG7k=hrN|!3OB#A#Trc}!nDNQ;yHchZwXBhlg1|PFPgUy64Jhtl#!7p%zp-`<D
zFBv|3oG1iSyu|1o^EQ(E+ki=l<@Z^c)Dt*Nv`C`Ug2RO-&g~T}-Fb0p#YRc2y@|SX
zJdAgoR{lr|P(M3oL}rG=ar#*oxXycN?5Yrr2jf+x6U%b?U{ST~s*Yj6GXE+g`scs`
z1S1SHsLQMP^_`UaMp0IC{WpoIoI+?Hhi}qQSqNmu6RO!pbCzPp2Q$oALaVfzHBx(L
zs!nNIJmrOj{$Ud)237BYe<z(-lvC2ScRhUuwhze)uk#$Z``b7r5B2xJC!n3stuu@1
ztx!Hk<FnZWC3t6D@#<IO)ze1~I^W(`JM<yD+l~lem06xDZ3BB#yBb*GYO|gCu;kHh
zNeVoqmrP39z{=7~pp(X0r}Ok~&{mH9ePD%o4i{f%N8$Sfb2j1#9&U2n*_t=YO5S{}
z0v!eSRgS{4-s)^)xI%KF)_i*#AAYFa+mqU1NH(oTvPpV+tK<18;j+Xh0VqDc%hSda
zg{hMLtz=5M`$_Sy<cQ`gU4nm`g=E%HXS%<Qb^TL;ygwM0XKC)8jrEEs9<w$@cH}ef
zE9jbuDyban7SHYd1!v=-hSh=V8q@b%RA+efG%t{G69RpoX$2arKTD=D1;Hu7_*3=C
z$c!zyn?R0_&SqDZ8P?<7(EbfUDE}73+B!>&bf0w6cF%SHP<6hH5i%1a@giLL_YY$H
zPKPuHGv#qVzrBCIWr#UU%D&uSdn<-c{vbeQQjLi%i3G<ooTl|TiHT7nh9tg>c(yP|
zW`pZ@pNRkO4@eeEa;DoKnzfaN&*4|1|6_Ja$2BB|p|aG<3TGgbE=F+GH;07ZP4P}>
zmWK*oIaeBOFqZw>L%V6ygXg~SyCGu$Fu_JN9!ZoMQg0WPf4;9M)su_UkZvq&h5tKi
z>_12KTj*k;9khEB`3Ypp<OzUR_<^T6!(D*1<`@bl7k0gQ5brM5wy%rcZ1<R_x&>@M
z)d!kk3jddHDdfJq34kE9<KOs<|BF2A{}uPgCxfc-&{4_Rr6+e+>SR>Dzod6;V&U;M
zU!4#hY?os+f&55vQ7YE8^@Rul`TMIbyX#bTNFg#_+|z?<*#|90tvV-zxreLL6H?+U
ze*-eb%8xhBDCaLn<YBVlu+JY)m}0~KeyKq)lsJ+}-Oz~e#avAi$Zm-6Ru02v^0By_
z{fkmXF5a`zQSks%();lRN{Tct2|bA<ZUbMRj&V}4>UKf8Z5%AZQ!;DEjdnDNFbU4A
z<T^-p>6Kdi-({y1!Pvl{{`VpBvkf@ielRA*@VJ<Vs#yr8(TAjUi_d#><We(MnwyEw
z6`wEL+$Zrgt1Rl6G|$ql<|;poWeVWa=_%0y0FK*4I3a-?5*fmRYoi|E*O>qSBo?s9
zhK(V;zIhvoQ1;-G3XB8*-P!e)@ztUt_r@e969t451{;9%?+C{LOR}yTni}!@OkSpn
z`U*n8yo8VqdcDAh`$Onk{THNs4)2a_7T*GuP%<X1x%>U;GU^zitFR0KPqk*3gIrSv
z@(ZS(aylV&H>%G(?Ch}L7~b--9gbo}&wkDlBEt_e`V>bS%c8^Y{usqW3n)<YnjA6D
zP`WK@)S;A$`RJF1SnVc<!8_*z<I}GLK@E~4*VG&M12BK<FeE9G{+RjFj-ntsg`N@;
zf_%1c)MPl(Wx|C8)Hv$XEw(s#oQ(4dc5n7sJRxz{q+=&LE|h#fZ@8&rQ;fstmlc?U
zf#jqYTg}iA{yhT;B8qeInAbV;Xx>k>sO@aur?~4Mt<;P4Hc`AWlwzx~k%XK>D{Y>}
z;}NXy@*aA<M5vUY0UP+YGA>F572}}?d8{T#^C~ueBJ8k(OVM#jb83W;x$kx%(3p*7
z$UCPuw2JvWUh<d;urpGx61{3zo)N`=yY444xK90kFX&jO<pv_TruN4~0o;`g4;RL^
zl}iaF9Y~Lnb@8PCei~Bp6spJwFdy1&cb&jGnCMd_>%@)O4O5Fr9XtM%Gz*-!%iYk9
zZZoAR1GXJwIEYC4=f7BEXI$YhD)ghHY;X5^?H#NG@A!#>VV`R0Nltd+=9oiXOEPtB
z*$Z}4qLMx(m!k&54sK>u;{B~iXks;B7y$2^GqOFAH@x=Feu1~W%!{)+MEOVTb^X9v
zReI)8Z)p%v9=Ziz?9s+JduwD{?2PFso$p)bnNPk_suF#Xd9`PzH&CwAa@joFvG|cI
zC7xDhUk69{R+gpWqb4#w3(azi$m`ql?a94W`LtI6!@>#u`5{88+NfW?&3d**e_e^c
z4B+xQ^plq5sg-?kxES~V;Pv^a9^1}*ZfuQ>Ft9P10?VvC+%|a!ej3+{4UkxNh&R2+
z(@l+|&-D=Qbjjf5EYH*+_50{#<wE%)-UGh;(abWgh*tNrfe;byp;<j&YCVOlujjPC
z$bm*^x%k&}ioviikns|MeJouxk)N;MCF-y{{&v3II-Tibts?rvV}o87P(euXdU1A8
zi#wb=3~-4bt`>=tN>t)9njH4>wq;U=s*L(Gmgke`3$5lI?lSs5;{$Yp`6}y{QjK<5
zpsCB&*7?V`P1D7*u@ATBQXenp-|O($F3=38Fed@F-h=e(<cZLCox<|O3dIj+-@z=R
zC{_zMp{1H_AHB)zZ%GT&5}8XT@kY`shJ>gauMUW~;z{@%2ZeDt)($FO4X%rY=81}{
z>aMi%Lxyk}w+7aG<TW*`jpG<CXQmbpW=i8aa22%gx2KDxwue-=CS+=c>#eo6W6+3=
zw?A(`ktsTC#ZrlXmejrU{JCF0(~QcN@wBW`_#n35(%~`v+DsrLsn=}_aYu0E--zL8
zFjGLE@z7N)C*+HHq#j1R05T{6H7!{s!WOJM&=|zVdPZf%+YC-^dmxTlsol`|)?f^^
zNHI4<K3&+m!0GTJOxN{UCY`&?YVoWkPa#_#QtTscty%Bn@4|IFW@+nsG$Zy(?n`Nc
ztkCm4M5IU=!k>0`M8h?gwm4QktB}D<$!u#$&8S`;U4wyyDbOn9&=?(aoMdo)EHqJi
zdsJ-(Ug2#CMfH(dsB6(G<Y~)KdSmHQ<K({8#d{meX0q>kwkD<{bRGN!@G9T)M2GRS
z?Q-IY8rwI=xZ@dJm%zAVcE?M6w<nKP7Hqyvj@`hGD)Ae%(z{3GzBk!kLVGf1*=+%D
z?`A{L@V)T$y*(~fU@!Zp^?jku9bL5;bP6Ifmu(+IpGV^cEfiO*(>P4x`#l9|gOTxF
zAQOv)@>z)ruOeq*U|d5!s?R33EYv4C?M<|}?j3QJs1Hhzw^sDAOMdc@;WT$}RBnUx
zK|dy~<wP&p8R4{9KVAABYtk<8Q7Bw`eEf{ZSdg&l?wMGs<G9|Uk@xAt-h4~U3XkP4
zROctBiQSMN1&AHAtw^Yz)?pbcv(SMWIqR3R_uKZi4{g33sE5z30(^PaKuf9aUfI95
z9hkT<3?F$h=`TQyG;Kk!^wbKOeCv3)bRC4T{n7f}{{1bkNh@t0yPG_=D^!=|<}^U*
z`SrIc3PIEwh)iPf_u1v=L$4oNUB{W}*fb=ddBFZUze7BBH1Hgru~t$KM_F?54fWjK
zPJzFn{Z<M{<Zk*!4Zy1TvFOj&iHF`<@^&nv{RC?c<E_}2H|DZxZLOPQp1&#MKIZFI
z0Pu)jc5@DogFa<D4hn}qK4XNte(7skxq9eT51x!R^DnWOi3cuw%yE6Ic)rA`kZ$EO
z%xIy_K*}$iGwA|ZpbbQ5qiIS4t=~ek-fZ{43;Pms7@x?HU#}yaEyn9TPBaVs6q8PA
zr{L|he<l$rH#<oOQ<-jEdpD=7+BejHV&Hkx{*!g|;3J)vpgbNUD+<uqiOu$yRjJ~M
z%cp;HNkQnRPGRtCk`qRdH7Ir6)ca!h!|2P)Z+4w>k&AyX{8$IXyx)BiL|?9PLzZim
zinBc=JcJcF#&m2?ca_o_-ZW}G@gg)~i{he>q~D7$s8$CFFJ#F9q-`SqdwY#SgqDF?
zbIyzAN82;??7?aE`=ta7&rN3Fq$C@I=GVqNnQYzm%!ejUsAt(#pR?hm+p%1N#!w1q
z(^;Iw6Q+}egPs=#7;MzHJ=d#oA!x+<DfO1+)=b1ax^}10=cA7%(VT3*=|2u;=`PhO
zO)34QJJF<&1n9>*{=nxGK|7OCj{@GdT7a(95AGOA;0cL|eSv}}6==CX2weH(3h$l5
zs>i^yIx%64<_SO+a{~cnn6kWn^Y?+eq+f-}_ono3scuhwSBH<6Tb$kVrIV7&ms<pC
z&e>C=-#Qb(H|zOs%I!D?&)@hyUKXyHJs&I_*)wRBXUN|@Ooj(^xoSYnvXVrDkq47U
z(@pjhZ7;CbUz}|XGR6olOxxdL;6FTO9hAg$iFobk5}q~J2>r_ZIVAop-4+FQj8JQk
z%51*ex}*#=fn*8Ew*!2@VKE&t=XxxUb;fO4XkBPKT{j)SPUuT_&n+$a-+eBzU9DDG
zI17MFH)hIzQiX{;U+B0t0u4NjQn^h&1K5wc9r>3AE85G7rW2j4@2#(xwAp|dbBsxo
zwdtLs)na*D`H!cLr}#MA+g=$-KR;;0z#sx4bebTd--Xcsv3T+4U-=JUN>+9IO9nG&
z2s;L#TD7a~PdBo)Eaxa7uY;~+Sd*}*L!>r|SsD==UcmH(w7+((GcPNtwYo*-;%rJP
z%BopvzjPH!jn?eJRS65Ep6OiqY!X4EC#)xUaW5cD!)ZF^5?!NiwcaVr1)ARtDR?b>
z2Q3g`wcIL?AxKqa25IN;d3a~`T!_;@SckTMaOC^^s9rq#{o7LUeFTe*)sm#}on543
zq<5yI6AFSZ*+p?Hmtk!JIpfI?6a=+W?DdLg-w@Y@hv-wj%6ca&%Jnc;-MJeTgT^RN
z&$6Q#6;2=$f}&GewaE+EpN+OQC0Z5j=nQ^N4QBph7(!I4#cI=`Zo!P5pmro>KL`j+
z7IOe?LjvUws+Xx5oMG0wIK2{SkboK4?eF9r!Gj`EyYzmVH#-!AEx#td`MNcfBm<G4
z4}1cP6pFo?L!j{L@_o*nB!iM|*5ZZAh3>|5)BN5IT?yh1GLi9(P#%HJBu^YJQJvij
z#UM}KxxecsrpPtSmp-$@Uv))YM}==An6(tkfDw}fs!DK@BmYL!`hhC8I2iWiRi*1@
zvEQfbqDP2e+=}uWzrc{z266b9Ws;K{MVC3)Gvz|L>n2l$1hunYqtx!xem<v$;+gYP
z^cb-B1ZzCWB6`BOV#_>pDC(Q}Ln<z<a1=2@1Rds+rbVl3@Q&YgU%lg1%+t^m5?H99
zs5@P*t=Rs&Kkan3>-uBJ&!6?cc?5a2*`&=_kqlk`+lr66uG=YY+wl{R?+V5OG0eoW
zD54hc$zulj*2)z|BSy+s@rZ$qV37kS)H6KB55n?Uia3U<yif+9$(CRH!w<)kchQn-
z+dMPF6qjb{ZRC6SKv$I6;WiuaiHPS_<i+mF=<jZ(?(VheV7U%06+c;*)PTRT6=xs@
z-p*IoO|qJ=-m|J`KdS~HD&-2jVmKjIbfVH(cBmL{M1RbYGkkgqu;6`bg2@15pz+Qa
z>6l9;t`@H!<aSah`{F)pu|MQB$&Kf;58>RisP`cU@=GRq?>pfg8lj(MCDg__cAZ__
zxPP~|02%;0oKn6WRDiz`if-K9Py}e1(E+YCO;;EGa3l^7eGcf|08Z}!HC=bi5_WRB
z`=oM;y;eDCGVnDyvE+CdMd6G)N_!$0==W>4Mgkf>F=-F6bZb7J1iI!AMhP2q1L$wQ
zWdoT9dG|{Yrhci$se{Aa2w}}$gIA@a1mXCzW~R%<E<1zzx`SB<(BA}wUiMYkONt+U
z2A~GTxCvABx#2__k`rt+0*ZP!iY7#aHQF4fJr1R}qc*In#kE^QnOZC@haAc#RS4B_
zH~W@ib&TGn9c($-SK5BgsiXyKk5xu+<+re!>r~=-hJDgQq`vO7D}#(p=h`PDCr@*(
z(^bQnV%897$=(s~#)oU<B)`YmH;rl^SLfkN7961k34$!@?baG-WsH|XAqawRfHny)
zg^hQK<JpbgduOG<U*Y2*`*-{M?KTDeT_W!XXP6B7jEnvoyLhv=k&b1xN*V_Lm*1O^
zmml{4+=<<u@9wyPW`j-J#qoKD)nff}P1YY_$NRgDNXSx?jD@auR022%qm#lTTnYDu
z$pW6#dgtP|5Sd}ThW!noL)XzI)DEj|b%4%`j!S;$^5ly4i(p<}$6uu{nRRF8$$>t+
zX|9kZ8uN*~Tsu$|+gB(pUOOjCnbDW#h?@GL%#Cy1{@AoK(vzkQ$gPNLWbhmfc5CG=
zkU0L!{k=n%Mi>EEXhB@T%ic}<ARd4o6QBNtJLyZE1yVO0Ts6iDaY?Hule3GFn$I;|
zR-z0`Q?FFd5a8psTZ)v8r-yKT_R4H5nb9h)gGu~%VB8oGrvbwo;C{X}8IA)(M#Qk*
z*_i^*XBfo}iA<g@QQLO}$X}R3u73lC0YDjO1Y6R%+kcyrZlLp*C2R;e;*Na1n^Vz<
zmIqsg*v3|!8175p!uhcr(+pS`8mpDY_iJOME~;gB)t0k1MS2y{UZ+jAe)gC9ToaAq
zwu-APQ~>kd8q%(;>pP171*&{&SpA|;zTv=NCZcE@H3IJ;k7t<-mY#$yF@UvA6qmvY
zdV&($FO?!zM|K_bjhIO0Jh|+l7~b`6vB5UMTB|{Nc+tl7swo)Og#b!G+n=;RAIM_P
zR#IIvIVxdtyElch&Ttq=1YBfYtX9j%n#6;z8fTDHfpfBJHvrjhnAElQcVcvb!Vut{
z&TX9tlwWuaGd+*3S?kKnqjaSGDrJS;Y$J6swpYcm(1F`+wUc{x;<mqGtfb_3F#lA|
zx1&fD_#ycBaT%r-oKmSBRKt3E?&RiDRN6O>;r*ENA5sdEqFMZo*bb?y>~Yw@Wqo(W
zOVb5)ES?WH;S)8kdW84K^iA8z=}rp?3PQ};vJXp;r8!CDbw6f(J5MY-^?@sSySoc>
z2DPuP3Blda2;$?otm}T6A%XXTx^J^S_}Tz1eb=HI-t)s=2zd$~qkjK}UUx8+)B-Wz
zQ89aJZQ^jea~<0JK}lylmrkA0<qqU$Y49Immsu~=*O9NDX?4gBUTqKGm!Frd+YbB?
z;pW}OeXSztA^aGr{Oi|fy75__)KE>o8XY*H%|oWju<x=SXcl5T5=$BQruEok`$J9~
z^_xy%H*$i9vj~2znqSO$r%`ej{A27+10}!vo8gP`o-9<Z2OI>nv0re_SG(8f7TSS~
z)<pgd3;O|1sn#y%V}grP+n|sS50erQ%mguj`lx702C`YRzx1^#>M_D=0qw0R4`x{=
z%YU$I=(QTVE7-zIQ34&g1yV|N_tMKEk!Ko<%YlP0>a)|2klUTR0cs4_nLz|}lEfj^
z3a4sC-nAUWX2S?L+3zqU`k{<$FB)IK0ews;;5x_GZTBa;6X4*Vs@_};#m<t(5CRCf
z27r|7yYLMIXGwuTRo14tsc1~Z^A~Cw|F)L5e8&A$k@CdBAYDdv<(XoNM7~n~5dY{f
zF|<q2Ym)KcjAvKnNv$o@OS8khEQKL}59UPwB1pwAliyv*Luk6kINUXDs@q?Nb(Dn_
z-J`E)w#GXv`I|({E|8s(FlqlAQQu233UL$!yOgC3e@R3HDy*-aUIBo_K<*+VX_UCH
z6DP$RS{lAZKHqq^wY!~SoB!OG2ON6CVZ*Hw&@Mmop*x~t;CsWPPE-1Wix9wkH;I2t
zwv8cTVb;3orj-5iMzh(ag^kVP9V+iyKe?}3&9J}?sU<hJjRv!3&7I*7g-mW8evzB+
z|A)Q542!bu+JIpJX$6#0X(<r_rKJS{X%vtyX=&*i8l<JAQ96h25>UEh=<b0TdVpbu
z_w;_A=f}5gx0l!7@7>-%^9Qzb&N+@_t+lUxUuzw+%w$A@PXfws0~2BBxsLoeINwA%
z&{uz&2LQUjKn<JP#{Mi1$mR7LKi16sqKSP~%s0J25$K(VS0PJoK+etabd;*x_Xr=C
zv-R{H-;AghT`&nQ>93f0yBMTcAR*;oav13^WTN0<9&k-(U^hb`Zr?DC@b$R~BLgsF
z2!c$pz^1)xB*-;v4;fL0q^w;g1Ir4eee{}BrFqtyZHB*D9@%CW2r`;ZoO9&#d=cW#
z$*{DjVSUjlSgNx}D)H0n7SG@P=Pmr#krLsQL=WC!_v@8wBJA|okd(aKeV~CiL9~bL
z&x7uINwhhPac3G}NIsFV06I@oB0)%{RuGUR4d1#3aAPdIEp1nOa6d&YSDt*i6naTW
z(SJ}j@3~bCO(9wBP~bXGjz-i&%uMn<wnJ$X0qAy-Vcnf3wRt|TD`W*RfV}3nx#*hB
zcj$O^&lwn<-9c?hh*w^eAxlr|$E+@>TI_7)u`$+DgLjMbV0CV(&Q9g@%Xr?vPVTa=
zAy>}Qv5#`>Ew>AY2>UzbsMWRQ2SM1x&Y(9>)k`hoY8q}m#;TviI=6<DCdnt3>^y^U
z$6AK+f6Z?p9eig%U{j3?jkODX3XnUYz)UaW%e4~~v-#<=b7N1`<`1b!1Xqbc{o*wO
zHlayC&RIGET-j^r;nQn0+iVfDd_+P$S+1)Bj9w*VT`V8?-(Z&R14}IM6y=bPAfM=i
zw}{Gj{LqU1F0Jt(Ud)qpE!s`CodXIf<7qy-pH2rGpTcK<;We!Ya6$sgndvW`<ZdXv
zS1G?(iaZs3c)vk%RRZ(J(euB%n$NfV)fuTPw0{rR_1HhNBp?8&_imtTbsH%BOj6)H
z8k*@j-<>GP(+WG*I;(*gdP&bM9h}Jc`Og4lqXS5~$oQ)>Xn#V{gxOGP?Ui72CV=UH
z+E`_vXZslt?49>s09=!fh@UEs?R;Hqe<J6dJHEnZsUoL`Cdvk-fC~!kvd8*>fp^QO
z?#ar|`z#VH<Pl<Uoje_wgT$v<!0=;3q0phj)iCB5s5qu)PvVMa3?)_=($N$S+?)|O
zUv&G85wu+PrywEnESr_LaO^RDXPwA%m<HBO;^rK*+^zG$S1gjf4h2Egn^c@nvT4nV
z{H-FMr-dT(1@(rH`01UWf4F^TZA5*$n_lQO2{73LU@r+TXiS2z0LT-&eRcQCf`@mD
zCRm59okROEl>nOIXE=GX^&>rKLd1_t+QsIVn;V)-qF1Lr!w(ZeKX3H_tk)S7BDXcD
z{U4pRzvScIH3_Z+)2)aQ2MNkjwC%M?;4_1oH=$02s^7j76&anQPDaF27iX(2l;X;f
zfb*3DR8W_>EaZ9LDLlXL$fSn}OpwBjNY2V=Sp^o2gotD7|EKNczox|gze{~P0=HZ8
zaLv$FQsXE7ah~?i@Nq-h#I#^-P@?VPfM9G1mOFD`oud+-FT2!*@7u1fbUkXI>q2am
z0Bi*k673YR18Z^PK+c6T;t#=8_8)02jJ|eaP!^t~$=n*14a20TeQ^5AQ~Z_Rf&VQJ
zqu$W<LC+7OMA_-@>+6$3K7JAZiaI_~Io{mP`q?*rcm>UyvMpQBO}l-kBTMKEd@_sA
zMD2&b3=-{FX{&s>Jdy-7?%VQbFq@;huq2)fA0n0kGSV*NCmt>^3Ir@kFT%+z?-{yZ
zF@UsLW99bEjH#9j{j!$nHIJMc+pkU*B<kq`W?EN_Sb?RSZ`<P=Fi@-B00d)QHPi)<
z!PD9I*|3{{vP{fv0$h>o=V5=x-*KOTs!Q7J(Emw1pDjn0GMs(fNYJ`Zw4uoZO6F=N
zVQe|0LG-p<5{i@`OTJ4J)*Tpy7&@Ahq={Njm&a2*TK+CjZ$D4}aJ+!>&K-)U@8(R8
zblXHfHq_WSmMBw+gT8+Xqjgi|Zw{BbK_heW>@wyYag<*`sg{Uv?s(6F^{QVubU2MS
zPM|!Ujs?^<VmaFcq2}${u%$-1<fw<chihL{sl+}ch}C#OIPp0;;SJq)B4OJ1+`dec
z*?B#9Zlxv3WF&IucK`ZtvT6+0R*TEtRQ&rgJGU0xug=dj%e6S+Q63QGV_o~%J$@^9
zAIA0(Y}jhZvTt&Xn7bi9sht~62^K&%tmG^<vB&mfb5Wr(ePoDegf`qbtKXu+A9<3{
zt&-RPkQFRuQLfjh@g^YjwA@WLCXTO!s{s{SAHeTc>k@>0e#EMr{>70Fv_i?!u@v(K
z1F_(hMgPoyKDsCcN#}d&Z;0prOMpMtd`NevR2+2?X!rmNakS_q!j>n0*_LB}*H_Am
z?77FjDt5y!X+nyfPf>_l@%BCE2Tyss9$f0;v$ov9jFP2;axyFYBv-lPxf?9FO4-uy
zP{6!}T;+`T7xbb8=IXuQvguNW{L7`=Ee_0iJs98<R+ci$vBy>J-$pb97b256p%F*4
zhAF>A2WYu9JvqBN$sJG5OWUGn1}#i&UH4n)Fax0F&F|$Cp5$Awf^}Nouh1~O)Go!t
z?YPtF*SOtvuOm&u=gi_YR!EUB@px1+W;`okX==(x_nC76Nk*u<14Qm=1Wn@jbh>k|
zT6l%qdb;%E^QM}OzBJi7o4IGeLQi~1^uv8^gp2bdBKZlMbU4|)hQ%9weDal5diAbs
zudxq5CoLLtX)QycH}R}0A<h?OFF##pwIcn%-}^BIz2hXF;486VP)TEB6Bf=iKY99o
z(#6&Y-iiolMHo1|)vQDqyw{|pD)b9@bC2AA^tB|H*GNX=iTT!$f`R1I%VqtO{Paei
zlh$Nh@!=G&p;H`d1?aS`>95ES4{rwCQ^ebuN=(@AlW|gieXI8@u)J-Y;$x{XthKPP
z6{VlfYxRBS4dE;=O_Xu#*>o~ae&G%m564eICwN3v3&Q;dsKA!ilD&m-n?&LdAH^!!
z1{6e3?6rSlJ<7qpEs!>bds<swqiIO{wAIVrj>~Q5gsVTrBEwLVvvpeELjNgs;j@;0
z;IkC^Evug#kCJGR7n=s6=OVqCX~gWA<6y*mC`k4XUr3@Q=kKX2m~AI?_lN6NyE_tW
z_(V0C0OypJf4MZd1wBW2?&|y*ao5YnJPR{=nGQPpyZIr5^sS35P;}gMV&ItfpF7L{
z@FC$sFuB+1KM!w`Jw86(Nas-zkP780QBD?eD(9$QkPMHo=;fccVTKqu1@nHK>@`4o
z!F``#;m{gdz;f#J3qi2clY%T^)U}2Tbj(RX_}O*gJ;V2xhsZ?7*3-&8{7InTBR!pZ
zY&nLU{rzV&X!MUO`=37)Yi7TvB+?Vz5we;sPNY%R4V}u*BfJ)JjNI7XmUUIk5Ynid
zGq=#Lv3zSP%sxw4y3|yw=Qzd3ZE<eXczmo-Enbn(YbWX{Cv{>FMT5!!!dykd8&?KZ
zKFnI6`e&I;#N}W~E$NxTGZUG+;MBAN%|CB7@IwBPn6*s~E4gaQiFf(;IRk;qvt{nE
zrjYqk3cJCWvV6~tO;5n>%1QdjeP(9n6UKRMwk(MegI3d(7d?F{;?YUC@OH2_uEl3q
zgPnlYbW5IMrl2x9Rg_1HEbU&QkpG;H;OO_My(-s&vkiEolj%5@NimUM=Dk0izW=Pz
zee91es~vXDa0cXlbC&nZec$6jHL3gd*<$uK<GEpXs2zez+tHrfuKOd$3!{`~bsmzL
zb;p>YG>*A8jZ@RdSJvQuTzG5qF-<D%9GT0P??l!E`zb$<k>GXqJQbl=*&>)i*rA~E
zTBR&8eb7UMlLryFYK9N8`?&1AJ)>HIV$xcXTJgS!bL4;Sy!+F~muIRagt&9H>~RX5
z?UG4chQLIePq7JuY02J{HqzPmu?YwW0eobiu&|)l2pZ+%ww;@l-)()n&QgUANt^Ll
z=!v|3pTw!J!-g8i$8^!oeieu_Zksd2#L6lQLLYf)*Eqb=Z=)%v`6uHkjQ_oX64EiE
z=-0FE@k$%(#Nr8>2B1pi$4+A|3Pv|rR|CV%u&3hQH?1P)y;6yuM^I-2!_;~`C3D3a
zHS{$KB7cxJOi~zuc>vLq)v34Ta@rn@Gi05NzDKh6oe}bnYfu^~QN~5RGgBF#?z41x
zPD|HvW5Bb09mDR_P8}gpgh^%7@GafB-->@LTGu`nC_7DhWVn=}L`VQkkDxt&o-v@m
z?Oed1YKWc6XU|3hIWV{Py`Fi?-5&JTY!7PTkCgd?llpyfQ^^a@g0cFm5n{-GnAd5d
zhk0=T65gtdzCa;THP-h_ayuSbm$Mb5yM~aZ77;9YA!s~K&LG7bV)HIq3Ud@?#`#aR
z9>@QRip3_BFWwMw4wtZ{upG~o5Gsc#J>s=|GEsnLn8?3=pT?DJE%oOY!MOe2%3tWM
zU^cvCtcR8>?R?)V0ypytVkASWl_#Dw<?AFg-f>U%ZjCh7a?}F`;NIsqi3Z(s=KTQ_
z=KYu)v==_(?lQE6?`(y@wwS=brqVReeD`l3B*TtR`JP?ZDy>J1`3K(yoXklce<3yC
zyCc|XM>k`{uT__PZ}iz-<dBS#6c$SOKh)1w$r3f))_1GbSC<|0YksdOk`3j_zhV2i
zRRqmbNN!qed0f$t&ucj<G52+hAJ~6;c+_`)4H(B($bXFSzkg&$6HFF$V(__6Q0yEZ
zZw_oi!EL-b#F0sT@vH;sv(;um4_#A4h{SgZ1B1*On<@Ee125ZIqb^vLG@OH3KmhXV
z{pRWIFiI2tCM!bc8=x`Lbhz}P>#0BXiGpe0nzXBKzR7H~ge_%nUtes<WmK-*1m@UV
z9G&uM9p^OueAdDPI4vafPnPL-3-e4adzhSPCvBqAgmt!d1Xgv#k~Ud@2=^*`>`&Kr
zV<6^zBbvf%^?^L&+o@d|1(|%BD@|@=N|RqmM=|Gfh@z6Jh;8^FmvPNk4OHtE`oFKj
ze-1@93~#cp6QgIoTtC*vG#qzY-%a0Yxh>G+du`(m=_c=OZv36kWWFOA?7rxi(!k}O
zln<@Kaq^YYQrTK`>IFV7bdwR+#07M2jW;-|S&dd0A3D3%8sM=?WyjriCX32bNb2nj
zJ{hXvb~1yd&sJHk2FUMa*!{x`0dMtGAzPV}NSy)`MGvgSpHI*K{1vdjC)9;txCkQZ
z@Bi%Q_q%g12IH?!{k;iVK!o<Z-g1Ke?G=8%rK(_u#Xp(Z|NUft&u2i3k|^k;(d8dw
z+yA=FC)6uE|6&pRBt$8)9kOZLFBgRV&2J+kI(+z#QS5(TH=CAFRZul%+1u_P{rLYq
ziU9ZG&cE8TnBRNWV=q=8{V(<mNV2?f{%`&MF`V=OEn}1G0$IBM2onGIQGT5mVp#uX
zYbQ;B_O-pEw2?B#f3X!3tGBZL=_UVft#0pC0zd5RVrYB%p8>`Hye@ETNB+%P{r~^5
z?M$Ss{=ZoO|L}|dzavZ{@&DQ*Y?Szv`ibSV9zj~|7ZxSLTmW{CXTOr_8yYI>vFG|X
zUZbK4b0C>382|~r--8KFe_Y>BK_Cp@9U~SJ59+3=4Yz@&q({78rftJ>r}k`fjX^m&
zSOdZT!g-Z8VJc8?#m(|Wn8_Te10{J@8Es=i`huhR`nXo}pdll5|Gcdsts2X3&$O#%
zuItqSY|X;{zO-<{o`f>y9}e{Yx+2wT%$F};vT$Xv-lgJyezU2NBNH`*cX4-Lde`#y
z#LcySc!5&UY=mA|H3SIU86iedwZd|*jGerogp`~Km*#?>f98J=4Eg&P`AKLHZlv8i
zO5^AF@+*pJUM+Djjonu<)3Si4aL-B8^~R;#A-h7GP`i1;^Sc_^4jz_ong^qE0>-0%
z6Je$}vU7-et)~~FC9>5hekWF2D3qp);V=0NurfK3<(Nc|OLG_zR;9x#<|P#TQc=3%
zoxM2jzwof7rG8r#x;2(oGIW+7oMz%d57i37arYEg{ghQk%}_AcT>s0H?SX|xr}yWr
z>+b(1%05-f_Bcs0zY56z&PW`2<Kdi<QkOkUM&xYZE5-K2#!mLpR~`%3yjDl&pntQj
zX81KWv;EN`s@(SFiWiqX{d;xt$Rg5UEZaFCpW~ZO%FBOhvNiYtK!W2jw=@35Z&p{A
zDB#fYIpYVc04wFH$CNFTKkvJ~#=K)~n*;rbkt=je;gge-+4;V9mE~CH$F9}a|0c2}
zXlB37`88fV^|8wP^3y|}j|~}3*)2Zm7T!Q&WC;N&Sy`iX8yvn3rtp*q*$Ptrn~f*G
zZ#nykkH_qlNeX%!&OLOknWp<Y&6>_B;2pGQsx}`=_!&VtWv)<u_uqs`_AmCw3ngWB
zP0wC<z+U9YOnyw%(HB%5Ep2o*u$R(q0u=eLFIwMAeRBLaKR5_mr{0eJE@1fh>!5_V
z_U#b2sp3uGfurSJI^%VgciGrdSbZTMx^>Q?KfU<d6ICsMESVs;qCyp@w|sngdC9+<
zo|dL-0WaX!y8!ZvgRZ>@O0FcJkgvDJ<3y3DDOZQHEX6~sEjwE^Uj_BMnXgP|SUWcU
zH^&nVb&Uu3&HnV4)uyYR!Q_qN(XajrC_mQzPEktRuJ*=@HQ23YDvZn8rZqO#fYBL`
zftu<hK!xcCMlTod*F6%jd&Z$#&H_Mr#@{AmwyixIZS4YFE=Vh?M6Sfh#+hliRGP=`
z1*ZPHlbU?$&u=^T8BIy2VFaihOD=l~(Qhg;clQDXsW{mOZ{%&qU_3nqXHd^Gw}z7-
z&4aThC|*yq*~z15gr<}i4^B4`A<Y{6ZGF(m_Qr<R`oaSBnB-l3NPf;eGD^z%8_5if
zxeo>gSSRSZMBuRW&AerNTDIH|D+Jgl=jEDupObtgWc9vbP=C@l@xK~)cKGc_d>@%;
zgq)vu%}}~qJjb_J^0D^!%dc^HS&4n=7&Y+15gno^Yf422Wtp?@B)4j@0wzx>#KvLx
zR%eY6>zh3jqyF;cf;fw<h+D!-!R{O3a|~E%qer9bBRr1Bqxou-iYeUE6dXFH5O!!N
z#giIq$P&eqNHnYju>5gk(Nr)N)!AJC(jg#$KSll8CHd>YFU0rn?3C2DF00*-hkK&C
z$8Ph+!YFZa32xsn=kJY3e*0#Hd+XbUdVsi;u>_Mp9h6=j(+Di@mPQdRzi>ZY+{Kk^
z7^R4J2=0=8ZJ2YkdKGAyu1okcO{o#M=~%q|8;!q2!Ly5l`eoCl77xybcLovRLcmSt
zM0D@jP#V&#WJK!0PkkQ$7470<>hM+!3qjqbHq)rjkI4tvpLa?~_JG6|HcxUGaZICC
znCDDrx{2g|HU{~IxcfQ@E<vACWK}#8H4~)Q`0-^4Ed12_1JC_HeCJIP*p#$Pd5`N?
zlW^SQA-vlj=M9FwsM>cCxIiaKf3jE9J=}h!Ul@P2Nd;_Y&j6rLNmlj|-tpq<J*@k7
z^c*n;(e4xa?}Kmim&XxcEpXgMY+pqkIGB)iKgB$)uvEaRXztP_T}O5LIWWB99X8}~
zyo{=G&-UNx#Uf=<EUd921iG)tMnH_gShKqK!u}QnYIU=L#*25VszyC0kXRgfThNvs
zDSB2(W99xyirVhEHyWm%DJJD@Q(f-KQODRa`>X&SWqYKlw(SO?fj!}sk&tYOh-?WF
zJ_R#YiMM?}%KureT+<*WOZ$Y4Efy$__!Uz;Din-G{y~A}^{PaF0Q29Bps*R!cCIEC
z7;isIHCnK&|7*_c{?eT?dx3;cz6P1|zcl0-UJ07OMsBZUh_)~~i=wx*Kufn1?q@X!
zP-Imuk2boz@cwY)DYc1RxuVrlo-g~lK8OH6mEY>|%f^=gH^|Gz$r=4i!zilLpCCJ!
z_?rWL=@0I|g^NjP|CScL-MQMdjjgTJ>w30(hw+o=1_9k3u8f2YB0eeDxUbq_VIW_r
ze6pr2Z58RfBt7CWXp{|K^M@n+F!YXBGBur8>EOkTcFqwx^<b3D{3~Rf@UCLZT`dL=
z^QHg**7N~>*ld61h523pw@m085yy|f9<oIcaJ&^%W#A{0{ELhA*I^n3+C;`~c<am6
z$V}rqqA75gsAH4dVr)NC;$1YWg<X!Xt2vfS&`Wviv=fO@(7{H7c9tv^qGM<%M7zs9
zdV&eD?$^BQnI#(FWU{o$f7Z(bz@aR$MRf9B_O${TQNr@GPrz;7_lVyAEyc|q#xJeN
zxyx%a^IT}oFN-yX0?)LqQ5{pXITpY3i1UnYSCl~oen1Szqq(PN|G}O`6-#o+aA-6Q
zKN2UmTwqex{RIVyu&&^^Zrza?C0+y8dN6LIhsSuXoCzRVh0(ZlG+R^Zw`mgK_HQRr
z0M{cw!l(M{I}zcNk?|%fX9&%+Pk)2+)X~QnEOp*W?j89e4;k9JcdfOwXcPGp>1gL<
zWB=>o6tqYq<AvA59D}#ggM{3Rb`zB`u=Vpb+0~@PuVsH^Pe1tjo_5T|XpI%AaBFvW
z7-?><DabQR+YUHU3WbWsWJIQM#=?I+SRjA$ae&dPv6}crWoy)!UpAooV8vp5$T5tA
zV=R+FjAQuhy?hJ4+%naCT;;OX&8oa#w`9n>H5An0-WX&Q`@*p=7$5x>^y8I#kiVsG
zQLRkWv9xUX6Hd+~tBL$nnmMOSpxta!AcFeUszgvA`CrXX0h2{;u~Lnd?b)+PWwmTX
z_N5*2om}v3{7Y{)903;pdf3gK&H0?Lb1hlU1shjK7+>X0B&w;J_4Zey1HW6GOuJKD
zB8P_5hVOFghv3gI?Ic67ljFti1FX9TK)soy2-s&TrV5VT+Q~?62aYzVy7wM1K1WdN
zZy3T~h$&m8*6m<U<M`y{H}RQg=<%h)75|F+-BQzhjk@~BzWMc=Q-K231(T!IsqWVx
zL3)=pU>|2m*VICpnb0Wr_O3xx6O#KVwU_v3GY@OqoFI>ezsJ;RduG|B`PwI^lU%D;
zq}na+m60^U)9KNj{_lp0Ke7g6X)r6a|J9w>Vw%6hjL(2AwKmI1Z1)2b2K1%<M9Y-5
zNoGmfANbY}xuyA-{VZ7113$b{fkH9_f$*~TxD^uQr%o%*@Pba%@#;**i&*}#jS&UD
zulO)kQ%5(e-m8r}u^^rvN(zeJ-~QorXAJF!waG<m)b0P-`%?1>^^^98vVThkC2UC!
z32^!6EE&CC{P>JDcHOAtu>I9yg@>hybWPt%VuO?P_+kk?L*%Ba(_Tqa+3n>T2AYul
z1=7DkTQ^AERA{|+o{9ndMATUA%5_mJwmgk7J%iYSRkeArtII}jEE!Rdaj{cl9XU~H
zy8-2_4<y4h_F?#1Y)_~<EB5wZU6&B^7r<&j#IM%o60t6*K7@HClemG4ZhKN3ZKXfj
ztbMnpBoWez&QzD!yM{HjE~$y5c&=zd*418o%hU4nb$&u$S9p|vxflxLqP3Vlc!O6Y
z8K4zZ{|NTv^GIx`Iku}f&^-8Ys=5+*!F12H7oXM~WoJFO_;*{K&gdN|{%R9}m_Qpw
z-oWFBuJ%C~@!y6Mj?a0vi@aSwvIVT#M{h2oK%`eA{9>*``cZWbenU0$i>qZ}N9U3`
zYQ#)>c`qm7Yz$&^;P$PaMC)Qq-`vn~8E;_!ULWi&0$poop7l0kdPEEDSwJo(nTbXa
za@%@3o*77xXO;m*Q?(6ieiH+u>J<h$CmGx5G=eQk#PumD$a=4!Zfs{EvN5zKvb#_C
zdiV9}6<Dp7TC{&v%vNvrcFV={z$|2^@ST^lOL#vn^in8AUD%mUv+5+at5wP1VV^JL
zhHiX)S;}3z3_?nUTMQ1?2$vkR3c%Tf;SCwU6lg6ER2ia5D1`n`>*N3Q{_`*!C7%KS
zE+|tDN2J+K8N4AGJ}fv!!}j*c^PbXN`%NlHHcEX8T`l`ItcKFeeNNA+<4$q_F)YcI
z40yBZ=W08wzw};x@&_&Vr;CbXS{>V?m%$w2r>(__W&A+$EqStbGV-Mrd0yF9t$#)P
zgvVm2JkgH4u~095@M`M>@tSmh&RHmgqi(VFvHn!QiNV9GTxVE~vV$!yHMi<7m2|Sw
zYSkD1Z9cBCY2fznlYzLI4k35wj--lSG@W$S8z%6VX^uP)xU65!TlSYVT^NZjCcT*R
z7U1n4sb`&WkI1MJ8Y@O;#F0xr+X)4WhuMaei`|S{bMJ)A=THq)x{i5R^cvp?J{Mg3
zCVRt-5IuFT7{>gQ)0f~Q1WM9=OObonGa~h2Z<y!Q6k@SZL#yugzR$#3bj*z<_PTcg
zXBsMex~>*##>sRjJh%W}Zom6RzYy?ITRq_C;M9ID_N53OY}_s1ykE$Apq`$Ot0vjF
z;OQtc0dA>mExK^G6GO>c-(lFQ3PRgFS8%v4a06LrJU%$2`#nuI$=J|`YFWQvT41)Y
z`HshRTQ46%_|PH6Ceu%!eD1R`oxFj8fdf0SIR9&y&taueD<`M3r6CizU9j8W>dA@v
zjo-Qo_<SB9@#p%iH-gC7sI{ir)t(;9r~_)UHP@ZkXlN<9-kgdFD9M-FL$bm^lTyrc
zo7u`Z96|9+>&g5<lZt-p-Eyk`o?7hX_{mvX6A3+Vlqh)md}u^r{<iC07^rywd5@`F
z&8zjb+g`7#^XRvs93)CssLJBhEr@$-PPgXgl}bZ&xBE@^>Pe_FsSwkgv7i`Pf=&%a
zKC2Jk5He*hqt0}_-|)c-`F;1EyfZ8Q=W7yi@_hCs05#=ve3`eM`MfWDOMCI`i$!L#
zF6=YQQngS;(rrH5xz}h!pKiW{jBk{55{E8}u1$Stg2tsfAVv=kd=?)9EwF9(Y8n!A
zoixl*SDfou_fm0*+HxI1`r7-%P%)+F15@{&5{cLN=01_)TARTL#Wwst8!cGj0ah|K
zQR}#GmwJ2AH%s(@MTQ!0Kpp-`ngI9x89X7p1q*e)&j=J7hEdPej|`8OK|NjP`=bRN
z=A$$fvh>~VT>0)!32YWy+v86|_X3dDyIBgN^>el5OE{1}=u2mBJD95YW)BE($B*rr
zcoK{e-xqNZj{;73wkx|7C2S(vKc2vLy(a3Jx<iLk!-?H??4y1))>?*EcIm0^OhpjK
zP=9ei6uHkE^Q)16m9miq-IyiPT7I=UlEf64;%6js7vnpwW+B8~@;J~QV{Ot;6Gqsl
zv>W-8)mmE%41Im6paX78owqd<zt~ZGx!pM)Y8ykXI`IB{uQ}~H=LW>R4Q@PMAO!bP
zcD0q8X=)t}%sK>~ZSGH~#BB~F4}@lUvq%}b*REwu#W7k-txB+j*BhehOUJ&oE@s%S
zO1v|ix2X*lagRy9$aSEXEA*^u>@LgXm@gvWb=5#Ck0DDUU5CgiaelsF*A*PCl6Gp`
z=&a7Qg-&x{BV&&*RxC^n<mAls%%jd%#e4yIW@o;m@4pKk*^e<<ev~!tIIK!U_nFEP
z-j<~Cy0k_5`S3cz;GbFB0$;o3qC1=)M2yUUh213m8vO?GZ-U%!O3Qn8te-5!L@XKd
z&IvnG1Y^J|o^mo76=UM+2ZH%D1S^ns!hK}|dgKe2Sj5ChxU>(S^$>|D4vU=KPV-)J
z9?;+S-bXBe0xjRo)e>?x$}D-@FxL08V`{JfQeEQM`@(ga`ehl{1rT&)hSC6}54zsn
z1`L?1p}TBJ$^+1bjzu*gwVLLu5-$2qE?GT3Xh7Yv^BDev#LLb>!bPoBHR-xrFvec*
z*P(JM&~N{Q$_36M+T@ma203^(lt$SPbfcQCf!q6__CEAN<X+m?7(;2~y<4sPNlN^4
zs?$0-fzR}6dN)LV_0=y&CD8Rm5>^HgU|yfpzaTaM;M~t&z?FCsA-)3g&IxNY_4DuQ
z<~<1k^!X(=2NX9F>SJ<s#VoQSS!fu`F?dNOU}svl`8&96BE<8r3}P#c@?Hgs%r?1k
zQGto?`@Y!M)o%OXQ6XMMqIXU((X83KYQX4-CSW9DDpEhGO9d+UzhiLFj^@)Xbj66x
za`q77?#rC4$0F?o+C|cOYXz1VxY~|G<_Cc_eLCuOl6ky?<u>CqIjN4FVpq`?CFlUB
z5$GqHw<TX~I9UqaJYvlXvneTI=X5NAsH{qCwnYGW(!u3oGM${AU3rFNXc0mG`D4ug
z?(06rO0+l_6=@2R=zU|UP%0^v3<x}5R)`im{!+u1-&(zchskcbz(u+_USglr=sQBF
zOwGw8c;VN&+29|FGm+M8vS@u2neyqEhi3m^O7($D^T867;AN+xqv*;Z+SMhNO|W4#
z3Axd)FrvI~AID}cxVb+7%n13JFV;b2+;N8JoFJAjN#fZ5=y;^~(s{)SO@e2~gvqrE
zUqhyOiJt`lou28=znG6t8jj3c_d9PPaNO0H8$fC%kAd3Vis=POC32wS2Hs;Ps^*_#
zd#E<jci<*!l*|KE1Sn@fMQsi4d#P`tcIGW8*`8Q_WcPR0xox{RZK!!Z>qV^F@Z8q3
z@)|y1ztKu87MoISZXr?$YC!H+nfyXEnOwMu&+KK42M`bv*!W9FUrJ{_cZ`d?03|5F
zY+5(Bs_Ih)ycUOP4!Ab9&HDpm#L$Wq9Q^I4Q=`uA$aCof?#$i#<(n_ywuiBf?emoy
z@S%X!^W~cz@$VBF)D>`ps*~t>c`u$QX~&~Gm&O}0#|shQ{{2~}1>?N7kH-qgoklt0
zU89g=NO7@TzWm3AqR}fjrD5vFBDSy|DD}>wz|N!niFLF`FUAk&N7aK!pAoDWY-AUq
z(9d7<aL|J#GVN(L?C6W_SL0S0wPt72C4K2Hefuu(<2SIJMwai~h}};+=r7h0%+4XO
zsaLYs1}j(qoandf=X<i3`w_;Uwub^0r*zlxR2m$z--6mu8KcXIxm#j}O<c?Bn0BKs
zKD!H6G)QEP(W;~eG=n&fsJb0-g>26+I-gjE7O55VH5`!wy_QRZ7uxcBg-Xz=19%l^
zYyPV-tR3wdR3zj*a)YIjTiWU0f2AB|n1-e;xui(5eG1TcA&QyT&E96^2jW>EhASUU
zQYGKeT1$(xGOslG0oaz)s08}jDHR2qddt#3|5Qh?!Y*0){5oY=a~kfGzkZrox9rM3
zJLxUU_ae&*6$y2lNd6rgM;bs|UhQvlWWM{}^Iktd99Udl<isQ>@xwSdh74gf9lP_Z
z;=QUT8AVf>M|D>p%S;Ps>hAJyr|gaDyUiJ#j*!`U4rWu?5uf)^F8SQ7Ykc?^a^X|?
z2T|Tdi~hY}MK_%zeeX<<8vIB6p_!uS%A4!XK$fjAbhBOCJLj4`n^YEb&vmJs3#5f~
z+2Jg>N_!+~;a4PBA(^xKCvKN)WDVsbP7%T5EZo#i|G)qfTW&Ea(Ca`n_hr35Yx+7l
zcSDY1s4U$Xv09LW-~3})TDPR@7iJ$T>?pmt%&3oNGFZUdN>bpLtthmk9`Ad|^~L1b
zUdX%D_GXU=bAC%8Ys$a#qvjoqRn1;nnx;i8gm{4L-TJ%}fi77h!#gL4mRc~DirA-^
z(}hW7p8M4-<!1gotP(GeoJc)%oY>I!gG%)%(|xy{>h_kiexC8UJBWMssd|kY{ZJkj
zDlhvn1zNrwri5v<=&6|+hO?#>!?^DaC|`0%ger%T=T6g+tB3g^a24`nkWt_D<)<0H
z`2J@ypXoGXT@cP6^G#d?<55J)8q{XtYKBU^AB9g^6gGjItCH$$bqa#5fAqQtENX9A
zlJ?vYR8$r-&bGY&QVlt;?v~*?{FA$r?0(R^e!YPOAw}nWmHspoT6<<^wW{NNcp>FB
zyB1%QfevwOSA32DX*b4=dhQgz7tEHXs$X=DVw>#M`|=&W2tZ8YCk4tGv`jC~TE(F?
zqyauh!KBKf5cLbCFKOk?oh*4>$oLQo2(%GCOl8IwZ>jY0D)f+*r4fW?*6dsRsSqa_
zV2eD5vP1Mh{v7Y{_^${jlpF__kaR3JsEeo-r!?L*2{WI9pb_7$Yy~rTn@?xj;{kBn
zQM4ZDEGpJkqxJj5_|6kL9p1!A0JU0*W10L43AK_BSF|m$T<riLp8lTUt#~nkqUwAu
zm*+oK1L+!d!{=(1maXb`+%DKG^o$6*?_&+hAQnq}acCR|i?}aVn{AIIL_ouaPMaGO
zBgtdpQBnKjoq<qrBX3oi2z%&V5p9_$bdg9XNyHy$TlF%(ON6IVw_QzavYQ^zTwa7b
zD`kfDh<t9fyni`e-nqy1LR8Obwvna1qG;Yqmf~Xn1Z=vo^MZR(q^$i_y^C2qE!CXn
zT_H6>+`);9RZu;5*R`S3?8{iOCFG&nrFl2;__T;~1Asz$g}!wL&2GJ#l!_Ml8Ka`V
za}TKRzB}6T6PNA=B9eQaQCcYzyI-$K7r$=#FdZ7Na>EK)a(3&L+7J9_-*)l(`8)q#
zdQR*5a`OC!Le9OYSH2^yhfN}<GZXpZt>y1@_Nq{z`1Oa5*<@XNa~i-=*VK1yqi$GU
zI_KX`Oz3rO-Z#l|E>#M~x>7KBKlLR#A)Aq<J55aE`p~ETr-1DA08q-T5=W6z5U8LK
zZv7bgIY&iKfkIkY51*aWBeAF?oQ%lQEDrgucM|@BH8bT1AJsKf@r*JvP5!Ah-QG8R
zewwn!Xr`+Ha4WMWQPWF74Kqq2%e50!eP(h%zEYsmPJls-*jpMqA;?g4zN$3BZ2o;7
zkSRR6S%hQ}5_~u%u5a|cvCV8VVBr{4LtmjAUC&(VSt!0Vz=<d+eMPqe*k8B1#fh05
z-L4QjD4)pb7Uz+JFIIrt$T{SDC!>Y0@LsMb1cf(`VhAaIVM%mhx@{{LjFotn@f`*2
zy=&ics;(2O{7!l;%RDI9=ZfyFxnt0IbJf8YG;(h3TZ31NVFuW$zLkg|TxJcq4khQH
z#-rr_iJUyU*k)n-Wjpa!-A*9*g@=cST|7!5JvFqQ*cnxhr0o;L4n@MI8h$DyC0uR)
zxL@t7dty;S(b-s66^s>1?bwn~VA++C{HJ2(?Ec$>?a3dX&H(|wJxV4utKj?u0{T8r
zPST+16hvp#6u~^KIrBCS-ik`i*7XT6B*a3e^NYTFkc~lw*kRGs^G@=(b;)u$tEf#v
z<i2;*Jk&k}wnL8jnusCRtd*4E7VU;`%<|SXk=aiXnP~o4sC}!7*ww~~kv?Ud40VI|
zXc_nZ!0M|<hO#c8<JI{*eO<V}zNle)U^GAD9B1^xvVOfDGk{Ock&rPv#DcFM@rr&7
z`yD|<<a*w6=8{y+mHp&gGTN(E_}j0|uQ!bsz1Yxji2moU<rTNl@6t|Qc#K53eHzOl
z08rHOZRI@f<S8;<KHKdrDR0#la?#WM4-%JH1dw<!ai@4Zm19T71=PMhUKr-_2E?mk
zTVA{Ms0zN+JWvVX_xqw(xsLDy#2bYR;ErEXpCi`|V_aNDj)Zy#3FLTpo*4G^p^4OM
zQqM(!{ii)df_kpAR?REwCQ4`HKSF7!N;Q854D)3zKfhA<Mci$EnAWww`}Cb)HtrrT
zX8n>!J5614#{*jD4zW++4_|dK&zldXGdG`#K0iuoyIi2E({+o!a*WjbC=)aab+Fat
z*}p7erC}5ubon^3i|M*koi%SO?xio}a%bAbSZduX-J`wM%D77dvh*Q&UHr85v-m8s
zV^JU?Q!Op}&EbZc)aC&~tVU|WI^ZImN4ZXop@GTDBMWAbNC1rf5YkFVk?}C0-u7gE
zEIu*U5>_hSo4C4~Y~x4Kj3ShlV;m;duxK#F7C2jXY{tIL)}mf)ju`3OK?N!T-1?mw
ztE2I-0uM&7ovQ-678VYac=oB&@l5>4%$T&ZGK1*I-9XNWNF9f{S<1eG8=Cx3nN$i9
z@5|kJ*M989Z@y2&uevA9!voxgEKn*ZxJNi!P7d!5GggR{fA>qk$wWiN9Lw=dZTBwW
z-?(O><GY%t=$e_;(Le+-0qdGH|9OWz`rFSthF{-O>cxI;GPFV~UR?VcrmV$oed+*t
z^}P+HxlaZ%MbhLXYmasMM|s-NAI#OrHBZdjHO<YL0-h*q^~UEoiPvg;<~%Q0a@)|m
z)^aS2pT=d=zu7*{W!hk%9O_jC%|wwFbU6lN@sD1Q7CFJ1;KuQTH$P7&43vd0wZ_=o
z^pJ<~BOCiCTy7=jPOTnbb?MUiRhS&4wwI-7H-Yx*k4+E$I?P|R1Xl<!7p!-}`3!A!
zcx^K(m=ktD8*OQ(2YjvfYWR*D)VRnp>gLU7x)O1=oSRZ7o6489VU1_0MiADlyYW!_
zwjPx<+_a(g`0YL_E|Gg1zw(vYlYl{mJfB*RI{mW-+wWz8qA%->cv{+7&KC8pUv*@d
zdtyT}K`^tEmAO%MW52Lv=k>drbyV+eqP@@Vy7l`G)?yF2xgT8i1dIjv(h9s%7Fl1T
zXR2CR_Vpmd|5{A{U5keu$a=HgO1j=c<6GsF#3xfLd{IMgr17kBJ?g*e99I2?^L&QR
zc5`qn<7Bg@T~xxBZbnIuS8`O$U9KED%O3}06=XSuU7DdDALy;J-F4o^2)&bVM9P}?
zQ)3f{gQWoxO?ALlrL-5EwUco@Pd5&i;F6<j8+K@K@@dvb$SFJm1M~q+lOe+TzI$3m
z%h)q#(WM&q^%X2c?Szn}jg`_i17vltcK0(e@>IO4=CD^RgANrI3Xd}n4*qnCZ^1+)
z4m!HDm|MdTb?DDh%Y(Ot%3M9MHPZk_l%Pvu0-0)A6!~7!+0(V0Ngf8Z5M_abDa>jw
zR8MrCJFJ=o-uDgd^f{=8!1!mc5iR#;t#5q$MNS?8U1&F4W0I`4DdA$u0&)xMF-KxN
zsdttJ6y>tvPAzwvjvvpCa7B*#05RjpWWm#;U9IN%3Q8c0xUHQ?{K|C9N_7n&Hlq%n
zUo`21eF{X0Dt_`GHT3JW!}b(jFV-sYk*8iYXK&vXph;XEO3teD)gB+|1>w>pP8DMP
z4klT`E&F2NSzzd*??|nY83GiVyO?%<(?80Z=TzXbUlfvNT!fPfk8&rZBx*U`OAGs{
z2uU4@XRjICC9Yd?1iK4ZK{s0qYKUh3B+XAI`1P@UEdLMDN9mg4bW$AVUB9RQJ!{q#
zQd08GZ^oe7DYylFP5Ptohmd5)OG*P$xsB%X7R`3tc0)Hb7GhpaSqS!-{`9lSNSxI~
z1d32mzwp;G@6LzW(rp?3_p%r>%{OB|96bRodfE_&8l+lr5dNyZZ@a4vf4YkhEPm6#
zYdhC%_ektRZo1p9%j%-*<<z&B6z})``m`1@a)L*v5ksgvCjME=t~VH+W{`!)S-!@@
z7F@#3u{e5e2JH+EHy<B3(jV9sq3`l(3ucEQgzae6w_1*`5-tZ=UVQ>GLXDTI4Gu;p
zwn$UzOk}viaIH!g6nmF++y{Y@eGhrR#AMh&FOh|_G|L3%u62kz<%?HuElu5KA!fZ`
ze<$cLVT<UW7-{?B?v>So{PY~+JwCCx>SX;vIrIfMvW`0#%M;||sk6-ki6x6m6}x*=
z*(hKu<QWXws<JJSUzMmYhxUyY&{o!$g`vt^7kFanMH0Jp;okI=`XJj6dhS4uEg3(G
zA`*GL?sZR0Ir*$r`-4pQ=NOxnwN5q0$jeL0mm7ztyLg>HiSoz^cIjri&?j}!CV4{K
zPPtRAc3RG!thiJKwuW22t4E=*xFIjw50FgXUA~9TT?a>B<aKY(BM^bH54p*CcKQHH
zifXJ~WXDafj>CH-(UERbsVY=f>gC~R&SvrvDJhq}EVVo8CxdGi#fa^=*LF<<VEWN5
z-xzti)1sFSrz|p6@<D4o35d+Kp6WkjeRz{!0eGyg<cJ%LC8tK-AX2O3+ymxKq_6h^
z)T@auXZ3vn!$&r5yD_pjH@XJymqSLPi6k+Tbh+pAe$+3KH6~^wi*9xEF2!4-#DY)B
zNOgD-P6=!Tqi?ZmcH2+RXIZaSY`wevMTs969V?Ep;pxT1EO^CxSPprSyrWyAabIiP
zI&WdaK1H9ps)#!JoeBisojdhLQhP@Za=n-!(F!GZeH~zsc3y#`<m8=r7zAEK9NSOO
zX32F5`(IiiUEUhta_I0@H>VVLa8C}#q&}l|a9i+-Fxcwyt)TJgxVyQ39&C7qf5jLh
z##h3s*wvG0F$*BE^wHLOc-qk@jLJFD_Xf()++Jg9(Gr-*Mm<^(!1pbwNZ%c{`|08v
z>Hv0cIVKLHCnJfiM!qgI9szLog2PPD+quIAbI%vPgqj7~LFe_|mTw9lzDE_k`O31x
zceE3N@;xrv-v3N~#G1s2YgSnWKt=6zNxe>GaIMIMQ|Z%StX0-|1uvniXkDDXa$#G0
zxn<OfiSVSCcH3&FzfBBViAufr_3YQ{d3fEE9|un0)Rrlx^1AW+zna9;^~(G2;bwXq
z|1fHb9uIdpO~s-0D9n(5mE2DEQYTtuOI^S8G=Ji`_fZ%kx%8M~)YRz(U~D9u1Z>v4
zWUa}E7BaGhpDAe?JN>KLxZ2RyqE-o6_8#0(YxnA$mZfH+zmte1nf*b)%9g?Y5R8>7
z;l{Q*X}w3F)UZ{ipE=*=>DBe{P+dZk2X(brZ$RVhFt#bs?+_nK==s^Dute@43CdYJ
zfw|M>!F*zN<4aAcCo9r6!Z|+>yq)_g0LbF>^HXpw7G3BrN6_4dcyI<CrBnFyh$6Ec
zm{CZ>|GZ?|C5LjSD-L<H?oQXyY{=0(I)>vsiIHsKb=9c3@m7ug8;1a^=8_kx$Y?L9
zei^A{*M!1o=Gv7FXKaqe)ANo<8nSgG0|?Fc6LoU{5!W^qA4B(qHS77P-T1dvh>lZ~
z(Hq;vLMO>AhrLEuUybYDItK|^h0)v5byfETSD~f-oftG*x}nJF{F6p_<Fa^HLHY4!
z@iS`o6<C_te3{q0m;1`<kK+!;zzG<u$Y4Ee5@DAAuxt&%re<~>6vn;Q9D8iYBaQ(0
zvhnDl8isUgPPjVus@R#_TGWvDu663A{TyX&{B_9Pz(udK#Uak*ZKqt^{~VOu$|VR<
z^8vdPI<+Js_I%iSL@xCFV871VzC}Nz?Lx=YcU-=~VP!52_T?K_ODfs>y}Hb_(=VJE
z!n2p_^EFl+9$RjPX`J?zDFT|_`JEWaky95{;TWA^OI06g#UcI3jPHzkJC+1<H6#**
znB06B@-hVpWAAOyl2z8sQ5*Nfm-%&V8HkshA{O;h7(*IPCQVm6_;u5~n&+DZP&7Bw
zimz04=AGAJKY9s)yinT!bWrxjy)GCl3v`%T!^_BHIblT?m*0!$wl7u!sNNb{|Gjt4
zUx>kodn6T;ScZDEh(PgVd~K;@kz{!dx1rl5{{o=2WH<$d6T2a-=Qq4LvDV%-%+8jW
zdJ9r+%OoO~;sYDSXvax5bNjt9<e`hrlC??WQEEg0Y@})B<3m2rNPGkVRy5%Mv91AG
z+Wd4w^jzWV$9dPUjK4Fi{f5P)IxZh~FdSW}byIbAHLY78AC)GG<a&8nLArm8M(#6M
zWPVa~;J~E=Rqa?Fp^dku7L7^PI4&?&k;epdaqB6?^jn&wCADP^9d~aI;tDx*>%N4-
zTQ!^oogh_m0Sz<9ZRP;#MK!&S;IyxvSkjIPQU!vUdvQRO4E2mz!NJC`Zp-R?wMUf(
zxS3m5gMw(m7ot?P$iI}V18ka46>@Vs^9!F)4cA$nGy2qPun-&Eer8bQ*yLnJh<kND
zD?KcP>ZV`SpTl3YXsh{p*anPol7O@6kv%tF1App%Q2>;wGXFTpbowQCzU#J_o#-T-
z!X{kBb_*ZK;(x?a(3;H;3!b@OZZqJ%c{P!5MjNLtNCFzy1HZJIxpe56(hwxcye|<E
zQPcZG4LV+w(<0(rv8YeZh|zG;1ozPghkq{syszMH1IDNRFxh5Z4hS?SFe|AUev*IW
zfcs8xg~?s|5A|5y7$^3Jso}1{SWBO=7-+=(502+|t)LsX>TA_{YKO2sKyYac91m<+
zmY++KQmnSLA1o<E;(kL1KqjIfdX|~j%QJRq?MC1Bt@E+o*yJy_UcsJjr)Q=<ZoDyO
zm7#4?eB>zMbWd)(9rbHq=nd}TK@qx&k!a@)?pP6l^LCxCJtxG#5#%7(lj+^2_?1^1
zeYTTPHT}o{c2F;lPWX-IKUWeG$r~!2EJfwAADxFT<8t*wvzZx*E+qIa-pv!@Cdg#L
zZm!n_0&W}BsZePK)qW4g5)x=-neP7xEZiX=C07AlLXykN#HRLqLfnO+9hW;I$5~YX
z5j_6gquNM|ynea$|6qF4R5t{OM0k`w4Z~+v2B`FB_(R}{1-+cQD?P!{93;+fUW{3M
znJVm6M!r&(vHJTrfFi*x5-c~aPEPTBRTdb9)H(6E!R|~{*9NU?zC|;hKVf3&=vUVS
zY$>Pe6P48t%#-A=9B#cLJ`ur%D=}TfqHj1wAZa>g8tl|~Dv0bX2Aa1F^ZCnfk1$yY
zaI2;miT=ABvlk_yv)U1-g(=EWeLy?~$G^OUk!bQ7#P7pfgqUW;FLo(69`Ypk7GECW
z2j4Dw5Idnl`vhQ9dhEtU-Wbv_cbE>Ny7a^rVdAbG;u~4GaEs(x`s@+0P%nS;h)fPW
z!R%KkA|ajA<s;h(BB@}E7;*QK((3b6R|q)XH#tW|Xe6fE_}pJf^UdM3f(p*d6s`~-
z#`+~xMa$`6mqE*=$NXZ<SKoSmwNOC%rq@?b7}2wLmy&$t595z2A`l6Egwm!Yz$M%1
zlZBJhaO<TJ36yt5Yf29Q-apF@(pXrVXkobxxOu^iY}7^-;Yb~XcNem3x*YgHDr!bl
z1Cdh)j4gnx7U1kO?#j3p2QIoUF<f*`y!HW?xmDvMFJ9RBm=WNj5n1&CACkojl;Z&f
zlEqQ$!iLlzmbw5f=3Vn!QcIgI8HgAWyLSf+gH5#V!DoS~Xsm8aX;)bN2Lq=%v7P=z
z2N8pKcq2IaAiMnfhOMjl*UMcFgv8)1b;0aPSnJegRd_@vKB_pqc%@Y!ME-4aou}NV
z@rT<3lsCvZPFB>6N004hxh}Z6x%lxn_;6#N%%WNEI%0MTxM*_z9`iz5zk6BVJ>1jg
z?LJvpW&MlGdhy(4|1B;z_OS(v;!;UQpdT6El<2?PuYVJ>(f!R-FCrOgtr|fS$))BO
z;%W!5al@(PpqjebCP@RTs|H@Xg<jgDW{*AegLv<lvo+6%_m~&K7)?%Dt*#MwE`8@-
zCJ%hg>OmeYk==$}BbFV@ob}ry4xCmyrK{X-{9R|!&k<f5#wfFud$_psyx(rNgz0dg
z2I-epLf+en3_k+X41G>A^xQA+h5_lzc81IM{Y5v*X5X+B%+)eCu{hM#0c|PVnBYMY
zmw-Ro#{-h4JxseJmG}Lf!Ybj|+nw4d>X+kf#6lcW9=dPe;(GN06UO_!ENg#mlhr*r
zmMcC;*Ul;gWP0ZZh#2&V_J*8~fT@cJ+cCHY#@A)(4nQK2mV<KKs<xiv+f4wl3fTlM
z9yUJ)nAh3z8?;xZO|wFKsd6<CfJ}Zx$4f;EimiK;w_RhtG+J)mNB>V|@JadCO!3TH
zUBG$~#n^Oo?Z|guM!DD>bpQgz;aHpfho^mg=rbJ~bhf<ZEDPp(Xt{haR+&z10ut8n
zs>yz4D4OJ(oF~U;-O3M**XKyGu@UsTiWup`5LQ@hjRA0s{txrG7C4>mk0UyA%bC-F
zM<4Y9+ClQY<tW8{1%Z$PlEU9$XZBmNIN7);u?S0yNM><dq~SslD=i}{ty{w4b>gM+
z%kuCxHRs$gdokbT%mR^Mtt04AjX^wsYrQ7mejIgY=zzpsoq@T`0|a(3mYG}?-G6r=
z?;rZRuS$r}t#23c!B?1@*4=28)<f3yu4x4H85RY!#03u@$9vPE7YhL&Gh-{mF&v+V
z#{0GO1@onAgRjrka_w(?e!|tdRE7f{B1i>vTe16*g`#63&%77dC~qTO7{t~(HkR{y
zJ4i?5n%e=bU%tHMqI6|OHq%`u^Wjx-*h&6VJl6|CU?D$8J||haY4jjD0@P!C`{Seu
zZ`9p~^6cY2t?v0x-xQRcbMOJ(^lHQlzS~MwL({r5#%Ty~Q;FwU9`9EDi15*uvi7%C
z!m~V<@{W&u#lZL3H3hRX;G-7eDLmWY?h}#om5i#N=4o?2?U7keaA`fAKj?X{_XG0x
zU>27ye1{yT8>umI13GOYqad5nm&)`ouxsq{3J{>x)qwKp3pz}hZ4Xe{x3U6iXxpT&
z_qieQKnOY+dEh4gBrr5LlQV`+YpfIFz;Gm|tj5&1xz2V2;5X_Wk3KwXu1ugSdAHgD
z<sy2~wNYw@CeeQydRMSdeFpWeKf|KE1Ym`POxuVuzz029pd_gnA%>%%-%8c6(9nFc
zRX2v4;oJ{^icbU-C4ovXAZZQY+P9MIm-Kh~^QefvI`w)#54hxbpDPR66sGHkUMsNx
z8tw`_aMU<jA5dAwZ(9d9ol|%K^*5v{6F`DyP8MXnIV}uJrZn_me8JLI2^iO@PA4|g
z|3SzL<~bJ>t?$_-tJ!qv%TIgSlzlC6aW#TKCC-~aF(haDzeUX6NWqo+Xj&z~Slja;
z9tevBLPpoq8#-OKvD*X3kGo7AdEmUhc>FVYIaMm>2nB$Jf=u^>bVsxXx7|X}n;YUq
zr$Fc3nrP7sF?Y{xpO`)>d*26oV6n*a-d2IWRO=dI&fSHG@<g~y^m+Nb$^{)cm7_!;
zpz$~zPgZjw5y^}t;OYLz&tA>Ewrfhwr4zd_<9ylC6PeWZ;&pz@S3gLJmsw~~MRz+L
zWwYGNE$>N%b9pa+>z&z}{D0Vc&#0!_t_|=}1Ox;u6s0Q)2m&g-gD4<K5kxvsklt%(
zNd!fdj;Kfn=^(w=&^rR5gdTbc5IO+@$sFGI{oZfZ%p=bHn6>7|^Gnw9a5(2a``-87
z*S_|(M@=LqZsN@qm>k)J4)lShvYDHEd&7hn2^}g{kD_SKW9ryGMDsV5AHtozQGiyy
zyepTD-O=kQ_a*2jGFrxh&oYhvL^5HF{G`n8w)$bDnDTPV&ts)7d^L}x0RmCEK6(`}
zH_NtnJ(d*ZoWW(66C#b)f%H8w>3Yf_MRs%iDYOXsA)n~=LOhmV|HS8bbtU<RVrt*a
zCJMSY`bz0rq?(9)DK$<!#ZNjqSKZQvho^%9^Z44^m}!^wxAG*N2cIG*tT&H#uTi%v
zNC_9LVgy*%?wQ_<8)Wuqyz$Vdnc9pgqDCT?b15?HXH72Ojcl0ZdKFUc28Da4cPmhV
zT2|r`0m1yGzWyRjP5HD8`l~V5ENF3iv8z|<lsW5?-slU2cN`*ARrf@9i*g*kAg4Cd
zMahI?{G$S>gkjH@uiIt={)@L6@wg0HZe5MTD=zeNCXoMHr*j=7W`@X(H~LeU@o1H#
zCiZ7rx3RjUMx#1#bwfMMJ_lR-U_Kvd-V)E%uNJAVn?AS~s}Z(-;j&Q0j<z0^K-|^{
zTU@aeR%CJsWPZZ#6H>*5m*(P2cnzbUeSiU{{oDxJ4i%j~$_>22I*YCUU9Y}I)_D$*
z)XF7*!Xz^LHZff7PSvDd6WQ7t1(}+RXVO~nl6~GaTy|xT(;R2VGXYA6s9&o}oIBz3
z);XmmI5in8xdg56VxHkmdE}mW?3M5NA-h{aV$d(1;e~tX+|;P(vRW%G{{DP9ao)za
z*G$-hW4o~F+?y<Zm%zf%#{7rqwn9Xioy}<Xv$PyBL8P(Qo?RujfivXm6ztKCp8L3`
zcjd0%z^!w|=DiU_gcTXf=m>tGYsBMU{VY}Q8qY0h0>mr850-l$wk)+bkYX4sUE;^R
zvZC7z6YGXRx8e<af_l73$oMFs7=NAls#r`glTI|x4B(k`61QP{d*C(4m7M4qv0buV
zdm|);TC|n4J+s$Iql;SPM9l=-OM2HTViEYk2JG1bc#Y{T9H%<I=@=nRXS)iA$y9D5
zcKqCo`YKyN-aAIo65xcNwZjYu3nX(-REM=(H)kT0&mzv-s=%0*f<7Lsu-US7<bW*8
z-4z5`jxF|r*b<?5nQ|VFp~s*KtE-MZLgFK;;+LwZ0ulx>@Kugc`&iy}J_uSb5$dk0
zsOPcg5Bo$%T#+u{9mcd5>2tDv@y5x3E`XPE{1{NlgyTNnv%5fw3{$fM05{_wA_G!Z
zKkMj`Qy$e4-F47oOjlWqijJV(!3vDP$?9`_+RvyZyjuF{cqg3b$+f<izXl%>opi5i
zt&H(iqe<=xJB^*f0LAJu{fshg_FK^1Q8UGkuC8Jp5JcdSc~1iK7|%mY)F-Q^K5Eff
zR&(*Uc@Y(%i_{OW(Zi1qVR+n=H}Jd(n-3*Ond9tiN?h-Fgv`a#x33Bh`6uY2#e8-l
z5P%hNEpfycAU=!Dj4TiANZ6OFZqihTK7L@DZoz=TqU1rL&u;eBcnTb@y+itC%K<6=
zvJBxXwG6)7W2uu50IL>nj!7vQ+knKg-_zM2?;#B<rxD8*$Hmm3NV=X_(u~39m+-ij
zsE6ah<_M>Fp|r%6oFuD(S8%@D01;yt9JtTQ!YhXa3LX6O|Dy$v`9yK`U@k1HXfcL)
z?ZgdTQHCj6UmV}~nt_jJxYA&kzox^i*Gg-;ywT##>T^qcJrIA#3Onikuu0ZUs7XSo
zAR}JXs%Q<o`P?eXvE|N^^6O-g?ZEL$fW@@F5tFxyU25-_sWjSmE6kD}`Vs0Ou{%xF
zT|&j!A`(OwWjTNv1<M?W+7VLJC3*Ed=<GLY9|#^`z_7ZN0=1pRp2*2=fC~ghTlAJz
zW4v`)7>|PuD2<K$;6*?#w<I_qRY_5?u#fZG;3yCIZ6R2JxEnrXO%4=-fvG!OUSd@P
zf)FP%pX!?jGaC<1EZ-77e>3jw=qM!H0~meWqD3Xdyi5mHKX1GqbzcVCQi;xtG%bV^
z;l8?OPGW(&huBUHj~QYfHDJ;N<g)NpwESxfs&~MzhlH0)^srmStOIdpA5|uxs{JZV
z=+Z_l-Zfl(z)l{2@>x>+0ObxIqh1i`(Gkqgy5kT=7(g-Y?@duV1gJ$O*#R`0eaOR4
z421eMP+(w9+#C=K7s+JCu%Gg5R+y2UF9GgB;FSawNyfNBjw>#XjTiqKWs0>6=3(mN
zG?qD@7Z|N}NDL0JcHU_o_@%<c016m@?&2+PiJ2-UGm8uPsYOidS2)TBU3zIVq%2<I
zu;iXmYi**Pq1rCk@@VWF?ZotFodqe$gv+_Xjpu4fRBKQk>t=F~@_()(Qe#7fr?2j%
zwNOLQ5p0DCchwS=HcH(}I-e<a93V}xBxK8}rftE@oEx$I+!K+*e2d}iq0|XVR5Ir_
z_APeA-Nsx;Yf(2N`lwOR2b!<0jOukNYpYTJ$l%=o`{FT19xH4HA7}W+Rb6I>iy<NO
zKbD<<;2=28!_Z4pd}8So(U^+e`w}8Dc7G&pSFF#Eme=R*I`x{4G0b3p!W5aL#Etj<
z!FgIj1s95E`>DLGwtJfIP;*je=-lG=w3-_dtG2ZT5F{^X<-HMaK*4$=rBA5Jh?Tdl
zW0_e{#$#3ZH0#JIi46bu@I-|Bx1yU?;^%q8y|(+ki;hlk%aMdmy`>C=?2Cz=5bR6$
znfe<UEc|Vhl9E2z%?nN4%d#mZ{`8-GZ6E&zYROiqKW5D5Faf?`kg3JKz_4)V+IDeS
zVQ#YNu@v-!MBMUllB&p*1|NL+nH45XnMu5l58af?3f-=p!1YCbe%YLKC0!n3xsF!p
zC1ZgG1450|DGNV%?639&j5HEODkH0Rudd$$e7#iLjr98IJcGP%K%-tu_2)2|lSg@#
zGkJsin<24Od#Ls~{|n$LpR~%}LCejPBkC`oKNFXQ1q1xvOICG-*IK9kS{nb{c#c!o
zCI7Tk1g>2lu3Z4i=%4q7*W<3pWjyTjT#ihr>-Nwf23Mp;(oyYB)#Xn>2ZV~|_6-yh
z_=fX@<Y3MH8SP(WGB^^lGH&4KfaLb+gw9wif}C`h%!~Jh2l^B4Ng~N`XSyQ}6Y$)*
z`;$c)We!Vd*3X42P12VV-1*fLx85)F$S0O)U9x0NyOU~Py=5&?<k!0Lf>PW}UUT5_
zvZqC&iDItOSUv~}ip|&|o%B!~yTAN&t4dW-umT`jr72?VtrCgA!T6g6hh-~IIF1hM
z_OpZDMUWcSaGY>FJ07Ca%WIqRnWQZmpc=o>vEVpU5BOLh|98%n5L`v3Hu_RedEHD=
zwPMyWn|VtIG4z_z`=RxA`6BsIKob7u75k&-$Y$>Yf&8aOM*C~5G#vnxyOiJww1)ir
zCICq&xjZvJ7Z&<r&??{vda_i^KM#biU);JaDUl$^rxV-d(mOys<Ux!e%k}{Tc+grM
zUJXQqsOuXF=9ybsSF4Naw06A=2T)Nw{1W_j%|w&=?9PVJp^%8#OJGCoIy4PAHu_Oe
zPfsS((db7JUN#BbaaYggGp*U`wIeJD!gLsSo1{h9{2>geRP9TJ`bSm9ybztHs`}+)
zygvbnng&nWA(3L{&4HvW&_}K`!O!dt2+{>@=0`s(=Ng|pf?%Zt=MuH~j6wX>o3^9n
zD3*Pf>r*VozXaEnML+zuN}*5uOjB-v92jMHqd~O2V7%GGdZ;>2_tv;s-pRz{drz)Z
z(Go;uKK1uKBPwvhQg(kCoa}xF=Us2_F>O-~XMHB!D?Fb6^dMHJXZg<Fc(xhEs7bME
zw`Koo*V-to<Ku>6^jupzd8DFpAofTIpaEf{d=;5&bxIwRHt<tT;o^aAiAH52DVxHP
z{P07yI-!(1{6<CHGWTj_>oJZpkIJ!_9C^Q6?*U@BKnktl?2j5oClQ*hJ&BJXPg@ss
z-46-Zc{96U(eNL6`)M(JOpYQyo7x;EOy$J@cy+%+e-hfn3;rbSDF)DiDRQ=v9y4zx
zlBpKz#(znSyxD0p=YH#H?h%f*oVh|;;yAsTQrn!#F(`O9x1-si=kl6(Tsg;Q%Y?Vk
zO54KGbm7-IpW36%uM+@zVR&M9R4kqU3-G|}UAGJ8RoMs|UHMNk=#o6oQ%^yHY>W5k
z+!torK0HoGe`H)Q>!NaArPLuNTL734DhUv2m(M~_A5Ubd?&}m5#*vNmbk!K31q*gt
z{4w-NEY%Y@VBj&2A=f0N8owv@Tz*oTWaSjBMvO>vQ52vbxN!I=ppQQ*VWR?J4_C<u
zHTU|?n^td#0tmow0A_Rh?(B^;W=)Iz70}e~)EGT&H2fLfKI6qFbq5U#`wtX<k4>Gs
zV69nydr^p(nTBd4i~Op<c*Bbe9Z{>CMRtuS?>^L?rg;t7$MlA4q3u7y>se@B=XpKA
z^y~ZpW{^O7Nr_2}&Ff3~A}XPBYW~rAUdaj|Fn%Y`Uv;b?;D>c&WaV!tkZahB5rT);
z%S4tpbb1)9smn;aF;7VYn8J;rK@+>XOpe%%4;OoPFJuPgWFwyejgfA3MMph=MES7O
znqpGkMIT%X&iytiWXvmIa-VmnXruCkM1uSy$$xsLw$;fr7oT4Iudvkry=T|A3aFd(
z#RLKHIfYxZuae3y+kkR~MmvWr#g!&9%={xiM~<4^D<o^4wgG%i7*)B;QZU<|FsuUK
z=4_bw8k^Wr`^ZP42D4Q1^Rrr)AA3>F8j01Dcl3086)|S8Wqmt1^7)YB4L@@ao9mp{
zcjPe@&}9Ei_GoH^4mNaHrVq64$JvI|0;4z5G91~^4GibC?<TR|UzXe+Ta1<QDI0U@
zeW(uZT}J{?lb!9v3ANNsYU!gl(QTJC4$tck4(2Si(xMMy0YX?5$UEmzoAc%0^@9C%
z{>r&X&taw#9wyy+b)elIQN=&jNM;*VudeJ`ozi#%<4i~L-6~WiHoHEdf&bEdUvr^q
z;IlDZzs}F(7`1BL6lGWDshmvymrP#yjRx-!s`c*nQN~W7yu}jT=m~J~yRON9sA8!_
z-cMXdu7|E)bl9K!VG-5}bi5MfG$6-biuM7>h4X>TQP8j6JT2N6;1tKCsunR2g#P-2
zHTlyx{Zfho;kHHe;cDcEl#M|rJ28NWYqrE(PT5W+xodf7cHI0b-XDF<W3huYt?k1k
zw`=2uVkkfv5-a_~oBIOu&#aq$EltLx&L>tT)o%#VCDnczvu%WzG!hXk3C^8-x9@N9
zHQBE+xL!Dy4+AsbP-H4_GBYfMkHeV&-m(-T86tsn1BAHeW!_AaS#%XGWbJq(XF`MH
z+fYn%#X4WAlIOLhR;+_XlP(F3TN}*C_E>)e1mXrZ{#wd+I4^Rk>cu{0oYQ$6V0#0?
z9Z@58m6c-YRlFcTn}+>CIqD?o63e#j8%CZX&du&=(o{t(<>~7|uisH*_SW|gUHENN
z<hct#bC6c9*eWplW!%t@j;i_E`qlwkJ;x%u_khmvGY_vvl2U{A{jvkcl2wpW##tG^
z$KKozSg8wFXF}KZ^1_=N&w(BL@>P%l5{`0NNQ(p|ex~pDor;*eI}ZWzo9!2`^x^h8
zKM9-J8;lT{#&hY^#WAMNazKr)V2M%6s|4cR96YS?H%*l<l3ogvlm2j^@F#jsJ$yNn
z%D0P8(qJD2&TrooiT-6^C@Igvd|Yzuz1$W3XvCQE{OZrzZ$HcJGsxptmYn9ywjE$E
zmUYh%B4FcwMNayRqs#`Gw=efNK3i6W>>=k-(<d95Vmt9m4k1_vt<AC~XEmwtp%=u9
zw)+oD-m=AJkv|?QF*XX7T$456df+l_>v;_7eZsGYJZ4lDyN#MThui(?R_$7%#T}e@
zkmIwtwe%2-L1j_dDkftFj@)pcao~WA4OKh9V7~&wCf@^;>AOY>O;2I~DZDt_(tqt`
z3{cQO6vz?bC>|^>fqqEXyvlW&Yb|o3-pHCl5e~G{kHtz!^8B=JX-J(Pcc}jAx>}V`
zVl&=~PeuZg1JP#q`dDex^k=az@3BI*qmRYh^!E%eS)9?Z?kmnVO-tsA9(+npL1EVM
z`A(5-wDeup9><KU%hC27LDcGZlCo?j8SG}D#dmMtR~!#L#$WRa-eq+KDcqF1yaaYQ
z;w{}|yE(-i?Ft1)|I1TNgpMq_qUH}A<92#_9W1A+&;P5HK29{E@tlRhWIiB;QZBl5
zrh+QqZ+$zj0IlEvQ$14HZah#epvJWW;o&9WmhHGWW~+LqRqJNN9T{nN-P^ZoG~H)>
zS=X0_Y7aCO7(Onb+ywob-@~gvCV}X`KB*BCrv0k#Y&3=}flf~8`ZQ(-?HUgd#n1^}
zfqbv>IC6~^w_^YdtpIHR_?4rdV%L7}3IE+%|04aZj;Mx)23x!YxJ(|y59F2Y@1vqO
z!-y^Qs|V8oWf25wB><>V1AR#EAzqHzO^!ZRPI<F8a~}D<z%CYC(qS>o=Mi<xA8qqS
zG6t#ZhD;&J1yto+0LzFZyT+mP^eGweKuQ14A1LoF$9SpR>aZ$<uq{^*9q%`w3o)9P
zLp#y!_1namUsd<(o0q;=WS<9%O_ieeILi9WJp4)Y0K(F7({bb5_X&V`J}AU%G2a0Q
zg3fJ6Imv+^bscUHO;|Aq+OqY;iWF--112K3y2qIs@*n~MU7My;U7LueoQ3akjdV{|
z6o#D9Me4u|j8TQhe{AvRrM=$)Rc$R37@#c?8lb&rQ1*<D-}q{^u8j6N{nchPnMq+4
zL!f%@Xf9bp@+Pf*o`!iG#b%ylp`wH7^24ILw=be}xTR+T5l3#wB#B2oVJb!rmWf8s
zF5b_e04eT%wDfuXI(dFc<jabAjGvXbsxOI_=;b>(c|zo**(xzRe|)|LitoGC9g3@t
zSaGy0&>MG8IECt-Knm3xwO2Tu*F>7p_C~y=hg(x$&Zp5_tWdKJFn@D?2hOwu5B5I~
zm6j6MmRo!e<BnieYqkh2kFv|_kbnod<YP?i-WomKi_tHVznrRO*!l579%v^<-0AYh
zuXJLfo*3Gg{+r)|LWPrvS&e(%vVicdAOGKoVVIt`ukr%~q?DdNkLb|J5BH~_kFLJ>
za2pURNGrYO(9cnI^1dAAY7#fT+@^R9Z*OsABbwJrPS$Pa-*v7gC)n;&kv5mK7q*{j
zZz{Ij(mY5iT`iuwrKLr<=EnfdaswcI(b83`Fe6*pA^Mvn_kUv~>#uJ`&~J@3mwv^k
zB_-8MH`KKUOJ25$Sr*~_#u4`ZJyFeLSj+5ygsO~_>xH-P*?%0myG%~)Wjsl5soXmE
zaKh?Q4btMC^lKq6%>3Jt;l7(w3FiL9pHW;OWo6|zjql0a37x^hNz4GH$Rw{FsG-n4
zpS%7W>ePQ9HdFO{%sg^9^EvwpA}t6K0|EXi^4R*^9aVYN|H7yE4+4ws(|&8|T#kEx
z>Cs;OehsJ_>jxT!!AGe+YUukMIKq<rmp@*bd8?$j?^-1?b`_9%@UW4S)3TbVh~Qnj
zE(5K(r=Q9$|NRkZzH>dF&OAWwqkT@n47C4VeD~y!PnU8&>p3algVRjgLWOVC+KxWd
zOC6y5-t6je!M8cKB-&l(o&AS_-h=mWi4i&$52vrvd$P9yBde{Bj75%^8|~@aDtZ*_
zsR8mUv-#=tEbk@Azh1xHT&=V*M58f3ubh0Bp)Z1D7xG=u>T`FjNH1pJnxq6CC_+xk
zZEq2l3aIj*6Jz@OYT^Is!v?&4s$@fD5KBk>vvz;Xeg2&4i`90buI`H$^krW?L@sdO
z-Xy2W27-FS50%5g?34#&o>42vu6=!vfN^u<lb-$k<DrLuU;weZoT9x-E3|g%-NEK3
z=3+9d?<kEJVLKBP1@HWKNl)i&OWEp8Zc;-FTCX(6q(`<{@2VWe3{Lg<#!6)D%oMGu
zRsN)N@>Z7l+WiijD3HUO1bdKah|sAmPQB;Ijk>329newEX!}DVDB_}zpW`{-sLkG2
z*KUvHyvp{|cqFawc)98p;h5@HX^g(}9g2i^hc{M`lREdL4X?j?<myoJWR6kTk}V`w
z@bmGp593Qs&0DbJt?KB6SA|AMp1j~6=i(QWjH>tlB>;FbsZ+KwcEFxd@Z@=w9&aTg
zPs%GsBs+qJUR?yvmfrZ`&$5z(dgmfz_V631268|tC%43Id{|l|mr<zU=aUOv-*`o+
zb@)YAq2fB%=I}Jc$$~W~_2m|dVruj1yW|r#T->GKFS9<Ks8*8sWi~HBNAiBI#~EEP
zsF_NbK90zZU|&ygd@U<RK_=*#7#VA-NNf3uoMgL)iwJ1R*;gL&KH6Oo=3F=OB@E;M
zBu}jwWK9jpzLar|M?^5Q(2vHG7kj>d-h9$r)nuyP&bNmaz(Cmw$Jg2heKLPKM%gr4
zfcO)0f|BVak8HMQ%QYzf_A*!hY10SFoP%T6{PQZ`?nM9-db)t4=Qv=*F70i6!p&XN
zw8H<3?p`tCL|dEm^dXD_gwpK#V>C4%s^jtA_S!f4`2YM6wdWVfydWdeLp7y-evg25
z?k|88_elTf9+_wSRQyY)bIjVW09Wxt{iHV$E(;8*vvBD%4l{0e%jf;>QtB`dv~@6|
zCq_tQ;5kj_ZWbJvHwMpeA1q2cl~jCnSt7qY8FI~{`@3=1as|_$ynyU0vkT9*WJ|p2
zUFpUz8yH0w53QOGpwIna?6xIIe^RdfK?fN9@gzuwBN+Ew*?OyK`&8>6cDHJ8`3~g{
zW5-WD0Xt$Pvl_8o-`_Om{qN~F$l{v{j01OjK_&X>tG6m2d1kiXx!Pf$$R%UD(jl`?
zH&$MCXU>?bYzzIIfN1~f2UIbWjBur?b~qt3Kui(%(my*ZZM@EiE&t<9tmEI_y}F49
zt>)QkS0xQjpVy9UcL4M(0l!&zIwmDFDkU5D*D-r-gtF2jw)eN+PepKOrUtoQSULaW
zW9CQ1+AVIbi#1BmFKc8gT?yx|ea9wr`SWEZHs8xicS1_Qy|a80SWNBcpf}jFmHJnl
zfW?@A_fGHOFR=}HY;5}UWVy?G6|7g#PH2p$Bij$NoNtxSNrgLl#~(P&zW**{vp6f6
zZ%THVP4?|y=gwca_;){O5TAEbV93<^=|^hGQm&hyUuWE+S=n1=H~ysDe$o`s`>X6H
zNeHTRS>*e=dM_(d7&k2&IJmnuB;ti#r*~QG{zNUqlo-3z1Zw$wbWW7|cYo(Uk8n@S
zcfomw6;MzT&@Z*7-3YnCJl7V|5$`j4fsStPZZ?}}IEx+h()AiO*R?@05wnKii7&+0
z==VIC6@UK@|GxLP7+GZAq_Y-HNthL@>ZgdN5A%5gHS$DcKdk+T>|6?nNb_T3tCF+<
zH8rX9XVE2t#;Mn?owYQ;ZGHV|mnSN1T$lT9iU>8td6<syJmA5;u9>cH<Q5)-LS6Oi
zRCZZQUZy59Bif082{{k#<WkJtubzF|dIX&kWW=b-wI@vQJ`8{CVbg50)j!x#*(FTq
zC;6=UHCR-`BP8)X=~1q*sLXbKoT0KQdhqT8o8j(9L^i+qkpKP01>G0M%IxU7_)%i|
z3ktpJ?3BS!7hP?ClB+Mi5|bi$d&30n<WNweAEp_<vTlhS)pt+q5)aJIg;^|g;lqAw
zDF5>TRZq1%7t`-7e`hpHGQvL`kdC=(su1=wW`#`IF8jV{xIGMtzu~oyX5`t|6VorT
zjNs3>auKmiRBQo@!#St{2Q=~piRTT%pFU_1cX;|O%l;o`CH9ltSWv7|%B9pRB#4I&
zQ#BrhNwCRr#RGx_#O;~-COoz$KU+{V9CH%6Dckie*TkO|_qd!zD#eYj|MkuPF3fL!
zP%(JrZvXiB6KiM~^%P8G@mKr~yh|Ho$u{XhOG=7Zhh1e+GO#M1+cx^4Wsmu|&n&TU
zm1R9edv&;_|KhgYG3y^p{<5x;uV8jPFet)>eY*GKjREPvuynOgR$81(UK1+nU+#Xv
zSniK&voLWTe7kT_Q#;-y`K!<$?|IMH>+r1?ZIIhhx@d)h9}%(mCttt!fBL<9s=jFI
zOEj+5_W%pK_eWEbO}cun!B_c9$sZR{h?`ARBZYt1^vc<$|Cg`wg$tzI&k-N~WN3q#
zZ>MEL>U6`N{AuHJU%AYb`S>a0pEia@%6UH`p(7J1x<9RM=3`mMq^o!A{?=pupUg-$
zg#02PQ4_SM`}fZEe=q%KA^&$R{^ooBvygu<-hV9e?}C^A+SET=`w#B)A0K(9hyLfV
z`R`Wx+aLZpwa?yP|Aaqhy668N#E~Pt2-8ygNpbx$+X&BjV9<eCCwUNOU!Ku;H<@{F
z!ZnwrUp<3&&wLAwcp!cpI-Htt`&1u9fZQUvq?@ZN0OW7W6Lx7Pqph=KwkL<Yb9oZ>
zzvAX&YzQoEEZ|4!m|_iGvxU0DHXmI4gGB$fz2GxEQQ{RK-tKJ=%3EloVbZN~&~aol
znF|sAXp>hb`4WSB%C->yz;rHLJ}i(RO_)WrfZflE8@gnZvi$%>8J}0XD+AT-4{b*_
zE7tcVf)<oTfMvMR2E)Zhe5l~RXOZXveLYasdEwhj$0Qg*+mvv!Z+wdZR*fF>Ae?Ne
z%o}zc-S#88LOlgmw5?icy>Vob;3@1r;u-cV{`?uSw68TyX3TW`Hv?Nb>=eYNRh056
zeCmTibLR6DfjtWD<D=ljHgK4X@PO@M9^|2!Kl+NUeuM8)B1DpelA+)++rG?nU&YcC
zE~>rq+uqX)q_;TKuV3TUFKO@VjTPaqawWV$`*l+hpS1+q92!CmzRcheKKsg*Dz6&;
zx?N@4+8(t%G-HnF2DL>?zan#j)h*HRnau1)1Uc0u&z0z9q{G)cCO1V39$$}LyPbma
z;jMC8jj6-~^58$fD7omWbnZB>&QDI3_K&}nbjM4Ggi2xFdu(S}#Gu^`qkiuw0O6i&
zY0>Z+>?C3O01Kgh`HWvw<AJue;OVE%@Ayb`#Uc(ra4-c9>yicebeK79XUX&o3Te*(
z78SaiK;A`3s1OU4UL5!TaaNw^t3YghOLTK4;MxyDy&D6h4-xN2l*TXwuf6w<s3`zm
zsPqaXfsWlmbjj1LjHF8|IZj846pZIdv^@Y3^y?f~%ye3T_Ve+<{B(~KfU3wgtmmC;
zqUV^T^!nWyFL&NI<|0+<((zD!Zy@RfUqj9!_Q)~mR(iHo$xlC`#38YDV$v8wVxx_G
zLeN)S-iw;&4ZgShDS!X*e913ZbBJzkwH2qJtZkmefPLhGrtAIQXWPK1>k$x;ACU?Y
z{50-lz5Ig$G7p$@bd`xqbL5QlGgCIn+>dBQ&!KibRCISUpMSHEn3PWGg*K(J2WIQK
zsH5yw!cuP{YkW22XwS{5?UDWeSi|h|#GxysWn<1e6-#+AI%Y(x5E3tS`q`hwKN=tl
zhHd0pBJ=FFNG^~D(g>fCHF96h9Gk9R8!a}SZ!b3q5qillZH~S_<+@{MGE#7*rOKI6
z<(6o{Y@pQKatc)#rHC&7%e7H~D)0uKRyvf1zwSU&65p)lL?EJW!)=7|gAa?`n8(V)
zXuWfFCq%q<$0NkEDY~+A_Jde`2oi;W4({XL1fJ&kyIOO(<q8W+dT`7UBSjB7SIc7d
z6Q>WSFv@3OxxAD6!Cp$(?BNn9Sdj%HiK$wh`Yvs%P-{w;Zjvtr4vPmLnf!d<v3Crq
z6)?9wUXtl;A)=Q44E_#`&25b18z=*+vs*o;p~1Zn`^f8pmalH7=zOSQpq4teoN!u_
z+M4p7+g@M&wP9@6;EO-e;g!bX=BDzoYE)te^&@u3_**9=;{2$)Qw&1l3DBcakIiJo
z*^Z2ayDZgQjEoK?a!k8J`OW&3C~XEbwDJ9?t;d)+FzRH(1Gs1h-r$DRlSuG6#&@sK
z(=aVpYbIJwrmNz=-_=T=?==vW1BwW9?fJ|M)oUg4KWmgx$KI+)Rd{@ki|>1HOl5wb
zYXp*r<R_itLS6(k>g1)-ov{-8ND0FC>kmxc9Iu8}Z^IHPytfe+%58NxOf>+(wNWOd
zmq3i(x%Qp<HAQAmkDtSE5Z=M!_<(vAUJ36BVD*&5R1<s^dX2pLS){7k+GqF`fx>m*
z(8@`?D_T8hp|Q2C*t}%~jN+kL%>|Eo1{_0jYxiR+ap*)8VOAx-*)&Y%3U<mHmeMvX
z5lw!^7RkN>*pn=pX$lim-O@xo72g2eD@`su{5EcZM$^%8if)D&D(>Iqgve+*zLM+O
zgTe2H9xiTCSbswij%<3{lp$X9<52q`JJaR9*M-O1U2S&dhODvnRZdQz$q-<2NXt1=
zW)^j+y~OT36n-)4Fcdp@4rKo{*;i^`oGrm~an!k*F&8&OT}RL9gRNKwn0N2i5fWAN
z>ab6dU9PW$Jv8hU$uGva>^scX6YU3mz(_GCiu+=xHj*l4i-NXi{2Ik_?ut6LfcQdB
zu;bN^t6Kps{2vnu+aibC*t(tEgZ?nJPH!5<!BM67Dv6CEi`oLYc=NqLiS-Id+(|V^
z5&g=+5;)D(;`VSZa}Ka-VZ=tUtJOWx0#u!M%hxE7rmgh+5Yi+lx9&TChE00CYR=2t
zK-{W*Dr(^qX95G#5G+4wL~(BepJp_t13!KW3`eS07*9`X^rt6?L9w_U20NV*J#4h*
z$#aklAKqz>*PkQWZE~N#R`Rwq!Jm1@4lzjGk)iWcgUiJ+@4gjce#8nXwL>5ooQ&!O
zPe4smcfNce?kvqQ5OG5f>RNqmaLX~pt(Se00d2$jtHJqRIAtE`PU0{%={*alp&{hg
zm*X6N8-xGrpv`pl&8DQfjZLV<wHXnrDvdLaZU!(jmrp`1-sPJ=_ag#H%!Z4e(93+X
zpR5x0m~xg-2=x&tLpfo)>5&U#A&fW$0L)IVSWS`-4SwCE*es7lMN?DLfCUR86kd&Z
z#m2J}b81@5PJ*XC6Pzo27hBMS9r(#>YJofiFV(`l!jQo%Lj4K2S==UnNVmAV&Q)Dv
zy+|iDKaalTXOT0?<G3Hk?XH&c5SRfbGFEaZ$n;#b!50`+ECtLRAGp;OB61>ddW1O*
z$mD$jj^#XE)JW@mht@W`9gV^(%b#{*;3Ix06G|qzNLIy~urFbHt2PReRyZw7{`L4c
zBZDp$b};jP#ASnMc9AjPuB5oeqn;qlP^~aomUX<O!q*;>Pynkmq8zTpA8j6^EYKPb
zwpqAmS?kD9abf$a!{MTUA-lx7ZIEeh$gLs58fQkca~H49eg&d)cU*cpiM=zlesedH
zdQpK@ueikX$@qdF(NZF=dZL{)K-<+P`8mV-ZB>d$KOVX>b|soV6AkRjkE?x!@{)wL
zxoDAyx?!U<SW~<;1tXKkY$491)(zQVX!@GmO7t)uJekukk0v2SXv|40){#4`b*)u#
zGJR!igm&eEgEO3)I<c$e%9E3n-z<K`(bm3X2#;n+Hk=deY;@_BWH73Bzgu42U$vXI
z-I<ejBSh6G{6jNr*|++K-MIRP3WweIA!|Pur)7`CWmLWUGq4#c>Vn&uEr9XNVU%7+
z67%Yu>>)<H^ZEHRN6%wLhO<EB1CsIgY9p1!yH<@4knj^ooaZnr`lUtZU9KIV3$HcC
zW|;6<dZ56!5r~LPB6}e>TZ19xzH|{AoBWjWsUIk=F@2YYcuDT<!e)cU9mc1HI@gs3
z;x94PKx>UuxJ5UIh_FE_gxxl;rTo;{m5H6T?~Ln>kNyT0{7<-{adKXpnThMt5)79s
z((FDCy}2U{h3y|Y9o?`nN0a;eQ&OddmJT+&1V06NQTK+BZ@#e4Bs{3hFA^Dfbu!|B
zl3JzAPZU>0>TS3j@|UkBq-f+ZGI0&k53j7wwXwh+A|#h>einM+g9y&dg;w*vRZX~z
zU&}Y;jf1pZUi*azkKNyKgU%ew9ImW5;fd+#1I>_xlU`G^fVb*P@bxkYcH-M4REEI(
z1M}4po8HM)H=2x{jMXm&noAoWk)ZD0J!3Fz+k3Z=bM}zlI54j=>x%G{N7MD1BQzz+
zrED=#4eY3v81W-K?l|Z$;`XqSMQ+^ITdy8O$$7|27Mi;k5Pi-g$)qh$VE0gDiBKKv
z6jnCa+rjX3Fnq*f1%JGF3Py}x7`V-WU{5pL1sNNQGjjMA`@uA~beKz`sI`r?H<T9l
zbJ%ivo<GX?I;oEtsw%3T^z{d77&{AWHcJUK27~7CnoJu0m1$I6wl@|E#l;_^ENhtw
zIb8G~biYr_R_>(3WD<O~SH4S{SxfI0OjX%L#e2O<oN#3V;#rMF8mqt{e%o5@x;)ib
z;XQ@r??S6{6RxC@58F~3m-`*s=)p&VqT5s7uk;t1wmqvB-0QdjKQxluABj8+@8gr$
zxIDgyhfLnaf^~Ee-g-8Zs<((4@12n;4e@IXHTbT(0}&B+V&~Aa5(L|WN2`?&`cA>7
ztIPu0KqJ5wv}6+S@+fSQa+_w2k3~sR$`}JCG6#RKwqP>ehz9}y{(YH(89+*wf@%V{
zK{~sc4`D|{_50uHae%J!!t%lKjrbBZY<Zh8=+o;a1)7|J%ya6}?yyw16`->h_rNlQ
zQaR`0_`-*B^;Q|t6-B3(uR0cE>5U|-`LT(7$-q>v7D!fcp#yxV%iSL2(IDn@@S2o<
zoKE=EE4z<FP+r4UFZ|%fTNz3&V@M<GJEHerH#U!8c>?BPb7{RE^GK=?!5W{*>2^K1
zga~TJV63blUg5!Y>D?ADc+?v=w3SR)5MO0UUrB|U)}7QV<jSbmua|z1kZNYQ9;tp~
zoW*}wB`{R4SGmkwZP|0^mE?rFERMD~uPAsCkRb0TR@zXBlU&>4le}mYbSwfYLM`I~
z9?cTwgU@CkOkvgYz<DnUZ@(j2*;s65O?c_x6}~ItvLRLeB!(*0^{H>PUD<eA33qX=
z6`#k}Gz9zxZGX_#b9k5k;a4~Eccj#vVQiZE@#)pNkRElS^JzGQTV5ra|4_E04#yft
z0hQFP8W;Y3{wPaJ@xsmVRc|eIFe$6o?Oqs0%%T+;CVgv%n*sgv^!tjhIJL1{BW3lG
zWx}psn@x)fc$249u7T;o2)^*l|4K4!r++Vsf+|&Qk~QIY?qDZvPeNh9HzWS&-9dkr
z%)NvZ*OX)nbvwkDztk7g1-Oh5^sAFExnyeP$kl=wB_3YuR%%OMp+|5LQSw?*?F*)Q
zt!U=C2t&4xF%nIyZtpYl5h9a5u?lcu)J)KLE71S)b>%V$NMR96nQtUQuJ)&SqZDGN
zU>oa&qvo;0Hjy8EQR`i}C+IhP<r4?k9Fr&`_wF_2bCD;`a_^kGP<h8LYsFZWXrqpm
zkL>Up<;Oew&mdMe-AYi7Cnz*!A)Kqhcd*}QT24{$;MqzQ(iq~owzV*+>~IqyNDp~w
zETyHxmHM39YfryWqdR{<XVXgXGfj=9W#!(t)m162?d5nJWBh4k-}LQ;BirP_@c7!`
z^fLPbeqE{Ur}(RNFYJp<-9g}}C}%%m)T~N<t7!@k7%Wo^!)yWBq%w7}>KQ(I;nYVf
zxm0CTP7WY|A(Gc|`vpLxA;0+5_VAE-_Up}jb2Qx@(Qq+2Vt<hjwO<aiVRG@KZtsY)
zPRc_iZst{DK9J;p6L&+wusvSPM}(R^kkiPOHbD==v8}Q2C6k3Z9<wpmjnRDD4Esv8
z0as8Pbk#e0u8Wq%YdWv{@{(2NuG=u`-oP%<TE-9EkJJ)yyW1XK=YyYqM=h|oK+ccH
ze!71DRq1RVu^v4m-z(F0mEOnjiCwCo;(Mr4^^^d>P$uyC)w9#`Vb;49LP#bif+u?B
zS?sQaIvne)GKtc$c9~Np1ha?XUsf(gR|!_N7=b6^vJ6J1>&0LP@Pn2Wcu!o4;Z2Ag
z!QTGhSkUdsiu3XeD9pg23#twJ#l~EG5?b9>+>0;Y-Sir_5)Z?+)<lrSr7FPj>l<_3
z#c1^<4UEGpV2F%|Mfb>vYq8x!_JG0aLc<o)IR&%y86|eNUEM-ZW%^;&6H2N$rz7<_
zZ<G|D%T(gYEYb<%3F|%+z#6QR)g~oHLzxXQHj}$UM+&h}=^c)!Cys2C%n9PV%27ik
zx#O=CJtjjZiB$pq;l^p+0;G>Lfrop3;yGF=u?{uD?qg24Zl{GubXg5K`I3w|KaW?U
zcCy%uEjI9nV)Fu=Tv{V8Vf+gLBK&LIBHN8T{L;)hc`@tPPX-eCd&9~!MDq&Wa*0W~
zJz*WD+wUJlQ|*6%3XD6Ht4{3q!YwWiNEljul{?L{qK};Y?_6QB{25t`5$f{4`-=b%
zn&p(iX{TGoD7@aNt&7W28F02O8l`{eMoEiz+;^D!o)6<KmQdX&Y}IEpLu<YU5F>6O
zkD1Cg)9Lzi(cYG8B88a^zVcMk_xUQ9Yr5T9!w77{<BmbZ9~d8!o(28AsFhU(m=oh%
zNHWOo15~Ks68QC9kz6@bW*7fCx)Ka9JJ`0eWy$1Z!f+u=zDRvzDq4Pj6i9J4@Bt6q
z{2Kv(jK?Lmnd}V}Yq7o9zDIBDsKx{xY4Gn_Lb|=X?jNtkS!*x??AYU7tBO74Z#1Gx
z4euH??FHZ7z1B7yoBnEgdXJq_4Ag-zd`D!}jx&Z7G1t2#W*BmM-r3-f&%ijO8*;Ii
z;&$%PH_L%0W$fspP7`@|6uW`Wgr0?|9w{l+L1*1olnQ_ML<=)`iWwwz(EiM*(u$k`
z$JoUb$MYrDFJ)pwfVmuih!&vNtad}NQ;a&;E87czrR^GJsb7MW;@dCXeYV{c38T@$
z@5K}$wVs~g4ZP0_(KC%$Hto$t1YkO9vIG^qP*58hcsOC*0eYj26&vy_R$0PEg<2Uo
z21HDz<921Cg0^0O+PpFtIW8@%D&=Um-?i~5r7FIj5+Y@63DPCtFykgchPuhFS@U{o
zQVY!oTUMN3S?Jt|=&UR%f3;*J9H|?+cBDm{GIFQhT*|LG{@jgm6B&_I2w{lNH-H{4
z>}WmvBCO==OT(1us`nD`rCAfOY4NX9FY!6+#E^baUS!2*Y?S>E`!-K`Ie!Uz_=B>;
zNA80m&Kp(9qz1zczRp^gYj(H8502^GyC-HVz={enV@a+nh+2oOjhd3W<n{8Y>sO_`
zTzl8}==Jr!HTc@(*GcXlY}-eBD-U?5T1j{E1~D)xEmfTiGn!P}b%phX<0os5J9Fkl
z;8NokFDy(C{hmKzt(3F~z*mzKUR`@zE$ihyHR&?OyGx?$iZZ>(lX*qXw!54#nPNEN
z*Vy3mXz@unboWYxcrCrT9s}^?@r_?4yRhn_(rSd3FoAMVo`7c?b6JpqeHGt;y%Png
z&)&z1RgCve#$Dvf;e<<Xo4bTh)@;|koauUC81XH)XZ!#l=||M`K|1lq(2wNl`qSLw
z^oXBuH)ZaR{!rOiL`4NKb;LP>3Ac4ME25m`Vyf7+Q^Q-yYhUs*Y4#rhYCj(V6=t3R
z;gIHVg*RMA-^?7R^L38z?oV3uBDxe!H*zLW8Vs-RoJjFoS^=X4k9QVV87@($&JAqf
zlLJ_LPH=}o9ss;SA)a<}Mr5eXr4iZSi`hp%F8J#&(ekH{<z7ryw=gyt2LcRCS`aV;
z#AO>)sQ&%_gHE>?9mFWKpOtXg%6M~^_T<OCq3cWs!-b$QRD5*20rYu7?e6yzYRP+;
z%B4D=Aq;3tC=b3Lh?qQtWT~bBXe6g5CEyrPje$J--Hv?SQHNdP00FARo+}9>c!^oU
zJs8^>+%7rL82TcDs%~pTr-iTjjp9SmnP#n7{wM;k3r3%kiiYK(e=^h+O}(mmLvsYA
z3qS4*KR`rbgPulm&}aWVgT7}io5TUcX0>r!If*T&Xh}EE5t13)CKteT10}lHF1mz;
zcdXgm6Af3mahjN$^d+5(HYN8DlSyFauh}%g<V>{P>S@6@2JtI03{3+EXMW#pxb(gO
zD##|U`X&%f+(W-0R`G83oeP!X_$9ux+i1rZv9~XQVd<5|bxfcQ>?%DcT#zyXOOWY?
z0MmR(T}+nEPd3rbPrn*3kb3Q7SOqM8SqGO^H~=oFGeq>h(`@Q;`B(-!(M2j6kovt}
zABhqZ?wEZ2id)1F!)SpxRg1$_dyK;_12t-lW4dnDd6nXf_|Wd+psgbtkna7;Opac;
zfMD9Q$*Xm;g-;4Qb+jy5OuaH~@P$q8hmE+$<_fH9&4h?3v|7pF&74L~5F|3Vjx3=o
zOe0op>vI5<zzZok=!GQ&?eJHKYL(yjm)NKh0qR2WGN}_j`|<%)LA`bn@zy^IcPOZQ
zehg?hviTbigB;>7%?OXLU+sl&YNqEUpKbx$l9{8ec6sa@dyB!${z42%EP%v?Dg)$e
zbx-d2?CAk^=}GJHGSxWuPU_iAcIq$yr-4?byx}=9@S2tb@!%XlPX%JnGVfa&#SOmm
z@c-ajpFL@*rFWGKJ^B;pS{d_x4T{h(abchMh;PoS@C8MxpI9w2rTOcVQKjaGgCGl|
z2*s{2x^M+b-K#3(9?uf)bGT%0&B=T`my;j$pHHVI-{8BNS9z<h2A6lEu~h-yF4#@`
z&CPMTK%P2KkXLEtvqEMjE|w9CX;(_|{laJD{gVl(p7G{dy8`L?hsR+olLB@x8B6Sa
zHX8z>tMn7I*>(!<_%qj4*crOccou3VPTeU@wB_p@yu7FO!|#leg5JeJS4TE78EkjT
z1CPz5OZ&+IFsVHJxLI`72LP5infWPtl-VR;N7!BJnhW40h-&GSYw$Gq?ivCIYOH4s
zFoLI5Ip@-^L0+|)cTOp{APa`Ni`~)Jcy`esC(;67`#J;L7rIqEFiXk_Ew7ISft(hG
zwg9xNb5Q7o?y19<3y8I^6RL9`EQ~f_lHT=So~+hMw+Ha|pwr}03#oBa6?}hx{dGhm
zkN+LWQ&i=+vcHMbi5{@6|ANAXZ#b=qgz?b?t@^%0hS9JUoKatVQ7+p9Y!XU;0@_C2
zbiH)AyQUI&%P^_!4FJS&6R`8fGSdvCt9A_z@eXPNW)JLY7A_-APJ48>(bX;hX9zZ~
zec2s{)`3g&oC24panS`*=?E(>Q4Ra~kd=W9MIa>-ejJkp0!}7i<aOJ)L+!VfZgr93
zE_?5`YwFVRmHAzGpVv$t^>xuz5$vd7O5rJP;2mee2w-<6r-Pf(lPQXD=GC8Yy>vd>
z7#GJ^k*dOh0T{S|OYbS1B)S~VF5nhqz(wD9gl<r51tN{wiVSzjGq&(Gia{SownO|$
z70;YX^*Vyf4Y0oF?4S^!ag#Po_4KUP?Q@<XUTU5RV2-mI9@*TSYpuHi3}@#mV->-i
zTrX)QX>pckJVjb<cl>)T+(mZprG?bN8n>K|_={3Fm>}Kd>^&jIV6l||R1nR3V8z;8
z;6uZKg89d@d|>=)`a$FH=&vcj*|u??6wib@BcI9-!5<u_Ed%4%oxt*-5PHTJ6%Xdq
zEPjCC+JU)Cz_c}^Dhnc-miV9wCqiv`n|Z8Vj93*AIZ#~}-aT9%zzy7-XC(hm*aUzQ
zHmQwRn4`7feiVE-C*Qzn`zdF$I?P8o{pi0%;yexA5w-nBCo9NGBK|r^$`Ovpw&a@c
zgA=m1wkg!j07wDjy~Y|QdE`-hga`!YaxW?{US|Q?3ixtE6OVUyMG1aE0&ZCa1-&H&
z>ni*QNFF>54pVGlr7hhZ{)lqn+wO+e5jfk`6FA9CtC{Ow=$DR+FC?stqYmYc*RyTt
zaT994N1fUFO3o*Kny%mO;!j-FWz@`%EcjBF{A<h^RE%Algf~#_07DsDg>;PQs$o`0
z#K2OymZA;Xk+)oM2>@Z<FpIdqsm-rvh0YhABDd^rnf#Vd`6zp&K=v;_y4I=iS3guc
zp0T1#sIo!wZLJN24Kn5e1Wf7Cci71*r^N_!MRYjIwrkxKaH-Kph{n^RF%;6;tCF)l
z4j`(hwVJik4V{$aUmLCn!H12suu9Qy2KJTRd-in;Wumj~4yQ1obIR+~z79GAJ66+H
z^NbNLrbuWIcGAT_Dr{FmP3ui}f>bqtqwpcErbaRuDaPwOk|$al0a&(BizBqB0<zn$
z*l)2gq@r%%AVJKZ0Nrlzn4f9euDk1j7;)b6UusPb@DUmS22_B<EE02Bl{*AA&nQM(
z?w_uxtQUoh_+Eh1SeA_Craw>!u9!K3x7t@@;>0jO3G5Sq4fAM4k!KMBh=ctnpqPXl
zkK)c2I;A>C$q=5$9h_{W_H=(<6hWEh6WvlJXxIZYTY6?|TzWgzDYq7+;8*Y3YS<rQ
zC(B#t41DsY^1KNrvTN9{^5`J|ydWIFU>^ad|KK>Ms7Bar5^5G2tIWfyu2Z;h5<9`4
z;DwfnHoE&|3%iPEI6dpr>i|0iU>82OZo(mgXZFhg^d-NoGx{!PYnZx3mgCW^c!*`;
zSdtq+SI=sxLWDREaHXECR2bEjfK&N5RH6iF8zaL|tS2w^Doe!SC%EF?uz_CDVq-|Q
z?g(3bV;O(#@{bFoXp%6*Ay5y=aN4>P^);cYV)Dn6pzHf%J1u=Zz=*xs_Zx{!r-hqB
z)s<FYVE1KeDMuZSxN!V0ub&mxqe)Lz3d_!jnquJf7967C#!n`#NR>hAfWMgw!zmo^
zi@@*M#h?;Ioiytr?K;2QEi}ZyyfKGqx)$rD=u)2COaMgp3MEMHIZ87<KYC^*;l@VA
zD16KK#<q1Zu&m$3OwCUL*~0xXn^t9rG_x`R;A)uWx(R1_d(=(z73^49pf5mIbDuxh
zp9GtZm8=|EQC7LG8174EIa?8vGSs{xmH_I8$s-o<cj!_>IxSinK7D)TkBxPw2Q>0S
z9m{}A9mH9S@h5yrJX&q`QFWsiQ1J0L)zY2m5kYkZsA`hp^=)z^qSI6Q_;MLzr&9Vb
zSc~{8ZP1<NM}-w?@ORkOkf11IpF8?x*0ec$8}vDOWBmFHWvhI54~jhPcl|$n0}Ar@
zY;lNHK4r)0beQ2aiH+SB#K3&{z!yq&nG;)AOpT9^6V7gDRgkz7sIGlxok_-=yPLFi
zwAwVc#hDPO$O?Ptm0Mx5R=R{K90(mp;-n-ur<)3q(xX={q7&4k&p7VIFGy=O_zF79
zGRP%OAb=37lzHnYsD<C9i`gKLkCF(LEFaLFXH89&8bOl)oo(<h<9aeesBfB0@W$}u
za@&KP`#qfi^*Fk&ulA|Q3o1+54xzyPnCq(;2MJy<JrYvD>>MNs6W7cXtt`96J=4=%
z$$eYMs07_}5fG8%xkb^V?+#Hfg(@IOW)VdO$gAhyXktcAi}OI)nUbZhK<=%-9ms3u
z2^rO;>jnC$R@&Tp!Xq9zqUiRfTdMNUkJNa?%KA7$GzxwlB?bx3e)K=%ZI6gg-*&f(
z1-4svj2v_W83EC%Ah8_!zIv0lPSJ!XQp)K7S$D;u_Q7p&H}nh1)G;8|mqQ$HuB<Me
z22)#=+>=ULl0Lj5IwwFa*=93bg-=?BN^JQp2^Kl&G|*GtTDf%cfW><r)nepF^d!)W
z(W=u=k+n_)5Xb^KfGPvSq>s4v$FNBU@EvH>jpwGX-w^@)n9lQx54dXatiNj6p!hD-
zmzTVb)yXS@3=;QGIKU`V0x?xN{68xZ7Ic+KsSO0~p#@+_Ft3#M=z8OqOIBaPZ1Rp&
zMq$)lEC=w;6#?_+yy|u4(;(TjXN~>$$4ure-)ta)hR<QP)`|&6T$n+<eZ-Esd0mOB
zOFnpIs=R+EHNP~!dcX5DB4V_S5^oN}?US9-A(qDfhpS<N<KH;^>TwX!7Px>2sdD)e
z#)yTc-fW>S8C-w!b6yW2M*TlnNE|fE&|>;D@X4~t3>W8uZO=st#CI%=rQ@D19q)so
zm)RBT^zxq8Rv7^*%y`!=!V`v>q+~NhYR74i7-)d^^p@_vztRK_1n{9i8Z(ixQX9r7
zkh{|wP)=sJ)O5RP*Fb7BNAWS53*WW}3o-&vW_i?|maD870A+3Dl6W~O6_bXf`ecaU
zGd#80(ermOPPcI+uR~FXg40WT>xdrValsuC<8mX0bF<|Z36Y8RshB$Fh5u|*o8gmK
zHQcZstoXXr(K^E13}}N!Q_l@*soCz15}XfFv+u8|-(^WuFga`zgNK~bZhrEVN8rB=
z!0iH9++Fb^&+|gW&#Gje61ZetW+pvSC{5ZXd{D8rHLpu-`yVd;ie&_*GX?`yVYlG+
zTp1gcjj39b#9Hh}A>?%?B9h%O!6)(z+b1g)2_XS2(0fx}HiNe!QzKYHkH?Y=_4(FL
zz3ci|d6z%+RA8(_rCo%?H~K?!>&<$>+NR_Hrt66)>#pU244r3*!cykHVrcnmkChF#
zGrHJ&z;G^=O0}JLRALYDZf%o?18!?04_Ng_c<CQ6!>!>S0L^Y|n@4_jA2vw~ByI*@
zRE8zefxyCP`W$ZI9dAx<nRR#E0|5^8XombcVL`-4HWjq^9^b?z?w7jBil^Sqw2N0b
z=<7=~a|dp{9Mw^ayy?_aD$@Mru2$!i*+YrrzIP_;Zo{1c7tMQ)L|J98OSs!g9uC50
zkKm~5r<suVPvx`Lln!WD!C;p#WP%dD&JDi#%x<=+R(H-Sc3rqAC<71!7qMy+SA4Ti
ze;<upT0G;7lYR$K6%!kxFcD<;RDs`2%UYc{Bd5IZt>*1?{bvz3h4YD4rwqj1RqW;&
z*K2bD-9G;OJ-pW}e*u4}=WxA3<o9oU?))AxaHz*--jsdy0O<aqBkD~)<K`D)WP#w1
ztk3APEH4GnUb8*EXM4uwrKisl<S-;~#qtsG=p4;ptFs;@h>cCO;G!kfP1&T^|33Hu
z7NP|MlY8?6r}1^LIhy7S`qstEmMo|5J112^an>I>ecZm=z?G_vm>*|6`@jAx$@Ahx
zD#0-9G~bzj8HgoiBTug+s}A}@f8k%gi#ORs`y{8{Ri6=o{`<dFZvj`{UgJ~#J(&A%
zhaD3D^keOKP-D)>*#CVG!B4=Ikp<OUzt8*reJ=j9nEx#1?`{4c%lv1X|IW$&f8#SZ
zqsgdBtS80A-O)_z60X7S>*9}N%k0>PfI*TEPw|AsE#V2`KX|o!TE2%nOKmltE~dZM
zMz{VC_P#PK%C-Af7!?EoB~{V@L`u5D1d&p@5kx?`dxlUcX^;-3yE_J?OG-Kh=^k>1
zVVIfou=jq?|6K3c8~6EsK5+SPdGS2=z3#PsEAAD01zJ1~D~EABUfS|#Gr1<~_&IqB
zy@D)15D>fxESl8__@P%X;~$!w5HMkKjz&L|leAlxvXs#Gv*Z)5MX`8Z0}85jL&B7Y
zB*xzY;lKxj#_e-Mg&qTU9?J!K@;ljQ(1<y79O}M)`wrXwBT-CfSn`}$`X7MoiMTjS
zc*Ln)_4)9Pdt%l0H$5~diflxT6UNNvj%mBHxY&w>^@crHwvZE`qC3m8J=`dlbKKlB
zH#FRDBfE<cGTDEM=cA22a%cFbllxOea4`E&-d~%^)Nx!NyNfgU#Y-VY$GAA>CH4-Y
zD|YwVPkGxknF0NwdU)Ot;QF7UPv$W$i>-U`<<+$N4bs1@TP`WVx0<R7VUY0XBw|N&
zGm4(ojNA0(=%yale3Vctw=_6v@rmBobQ|><szejH&GXka*Oc0H7R;z#JSVa5&yz37
zxCqq0^R876KWM*B$f9t}G<Wmp`Dhr}07yvUhdzalUVerqO}@h{+R=o0m+|KI`Ia4U
zu7>7U95;vf)U{12PXmtmvLKY{FuDj@5~#bBbup0NTaTbO8pX4CdW+ns<IsE$p>x-0
ztncQ_%|<cq-!S8~`$QF1<C5y@sgjQHIAW5%ARx9H7SESOgVY##t_B3RWI_2P+U$(C
z;zUhee`XNjkXn!yXsOpY|M;%uSo;8N-kw77{ESgQ^bUUc2+1_4$J`}T)w4CMUH%g6
zV^I*5n!@z)^4u++iaN-Pos@s}g#X}(Jnb}GngH-3eybMRVzNL$gfvDEfY&jR91Q|T
zgj&DyoRrom!zb^gwpQ!>)%{G7zU5}vJb#Gi*%`<G%g+^EcwOx%T#bruZKzzMprYqJ
zs-!vKD|cr>JYOEsbpLN)R@&+h8eT4})z7%rGEoitOx78epFmIuct)E*Tc6!2+LZ_x
zzyk88ww|L*^{>uf-L)JqA8QHsj-GtdKFC$6tx*~yL?@$0`x6ZXTc%$uOWhPwpNDKn
zi-~lF&beU!!zN4R^a1A=GU(MEbwRGCN(L2w%6#ApGG_?j&v>H!iNx*pyZ!_%lB%7E
z-w<EY7~g8TD!66SG7hqF9q876b0k~9!zYiBv|vU`Xi6HHve$x!chti_zenU)hyU(v
z^+495zJR)BsgiusL&-U}d{mg|;MSjjCon!Oj0<-6>N+?>#?)DZSXS154hWo?s6Oww
z2eYiEHI0))_K_lo%eaoMNk*Yf4{Jn=PfDYD(3}^#eJPN!V@=3k$U<J|cU>heMoL3R
z)x)@E-P=5jpLZVH87B(Jm6MTP)is`78!S~hlK~c`guw!yS-Rf|mn^<sopTr%bh-1;
zoUxs@7&=_=D#6J%4QLHfI_93(c8WSM?jjyo8t>O0>Hp`8{Xb10pQL6W6PaeyvPKJx
znd%*A2O35s7QQSeCCzw4JG@Jxk}V%p{rsv`Re<&9-<$y9PpUO3vwqDchw&SjmEAb;
zz1F(=M1@-5685ZVi-boZC4jZ8a|0OD-!^s_y;EY88k4TE1KnHf=m1D2G(Bw%+>BvC
z4(q{Odd5Gy-td?Ve|Q(X*747#+@CIxw4M*3>pJrQdI7yoULjy+P3c=goAb@{l|lhk
z+f$vp<N84WHjN9YpOXRqr`yu64m9i`Ej`iRJd<LhiF|IsX|yG<u1cW^exSIGs<`RU
zvM-r0d-6^l&u;{hNm(P!BwxK0agx{pr1C6`(xevF*H1<#0?CK7A%bDcUv#+i-LUI%
zQV?+YBZs@cbLb2o;paldjy$rlJ3ryGy0P!*=`?K?Irpu(amd`2jn$^#63P#MbP&!d
zJUG8ueoo2NU#c_(aNQSB&jc=Tt=tt&`VDKm*G#*0(ikGF+$tp<rmlkz(lFq2FPLBl
z0#}Sc^U|C`e~a(gzz7Wez9f;mlAaLV1|Cl{in+j-=XA>X`3+csQPb%A3%Y$Wj>0~d
zhz_^MrPOI_+<|-$cONSOO>rNf*Hvet&DAiTbeMJng-F6V%WTG7%=-$P4gi6RE+&*V
zrwNRQssUk=iawyC0BLgCC!0LI&hFM5d0jSLC`0*qz4P`rwfrxrsHS9M($6<eHX>`i
z%g?!I^~?f-5!44q8lZV2$#1P!`0s~5zjY%C$PzW__<WPcYU=al>8aAU7e$>d8Mmja
z2U0CHxr7aue3%zE{#lXx43tR=9D2~&&6l4NA8qw(8*Xj`qqnbc^Osl}sN5D0f9~wM
z)dJz34z9oT&!{5Ze}#~gV}-r&a&x=qQ-6y4><?{^1c2%{(EbR8d;)*1C2h=0r8FRx
zg)%384i({@yCLbguGbZRj@|fP|E~i-ka|L<8G@ha1)g35TC;i{4pqd7IH(IqK30P{
z)H_?Ht7M1PuHVjT=L?h49UWLWFT9kXE^TYbgUQFU<zXE9b+L!Yvb?ousLUid4!Au5
zDk6*jSSZt^%jTGX4Xz90!re$L!gt=riB+FKtFIHh$C|F;<-amSCqtv5+hme)$|2PT
z6v&3}M6(A2d-IJhV{Heng#RqhK3PC77)^QPe^{{$h{2d>eKF6RZ{}Tg{%0VN?kD<d
z0f^PrmOL#W0JRQFnU@}cf?WPtJ>^^i0#5Co!J`*y;=<N!@l7s$d24Iv$5n2$Oj>?0
z?)K(&{SCf!wMh#ud6P}*1LNc$jHaY+4%(Y>;`Pt6iV}!{a^h3OjMzUCCJjaS=duz8
z;3hsU_EWj6?Z7=arAjuK5-N-tw_8m{a_rt9$x|_WahZT?`mk|r=$$pgLf)(7#TA}j
zZb3P?v%|tdNT<mUhaV+7dlLlPd`_dfK>To}dUfufxu##{?0jK=Vv4%w@q3I$2rC1m
zWJ2;I!R6vwaH(Z_)kPqOIL(9W;cl$1ZCXjv?)M;`_wJjI?IOl~LBaB?(&rq~K-{0g
zk|qa^MsGFB0BIqp`1<V;7wN15Wifo9M5LrOXk_vD5yinnzEv(70*S_9@<;D~wD=s^
ztMC<^Kyz;nw@RKo@_&}_xFrDeaw&V^-amq}&%jx1(+GPp?~GeZ7g}{H%&yxs?Y#$z
zS6Co@?8R3Dlbt8i7ZwEyxO|wY=!8xBuarJR-bDFB+#lBqJD7zr;}0eIfuOppewtD=
z4EH%$p+EUPK@PiN3SWyNE9a$|<)+TT8xGk&1+XNodg3#p+G<)50fVF--xpG7DXhli
z-<*xt(HcJ6v+eAPak^eF3N>B77E-hax1*2kDimCuZ~jOd5*#x%z$TeJFCFpy@;`Em
zw=@M1ALL+h|4S7}Yxw{fv}>`nMYvNE7<US8a{v)aCS|R~!Tsa811V|rC+1;3B2tbY
ziOwAV{L<!yzeIx?$tjl7{Q8<Ed5e$N37FEqSX2b!LgC=!lMcYM+?OiO6&duG1Eb-s
zPfsobWmBePn+#!)K}m-|Ypa!xjG0QQn+Htg`3sN7#~c>ZML3OqoGw$l%D=ZeP&ek?
zzDU4JNA!<}h=<>+dB&10iJ<whR2VN}V)13^&?nlbI4maJxRVrcvHNbE6{n(`2o^L<
zlP2d?tbuHh&T6QaB^YQH2BX!`byIWP9OG<qI4v#h7u4z8@VopRsLEW#AYoy*i<_t+
z4ZD%9EAghZ;xM;WEEmulG71K1xkS?r6k|>rPPb3)6&i;H0;A1XAVK9nL|K7i9pa(P
zm$Ao_N=m`A&a-S^44NFku(m*o#nBlr$YNq=XLPO#ZR1<uBMa<kcp_xyXk3T&1fj<^
z{F7KEOFnQY9R^eZI=js{j!4mp%hY;ko5aK{_Q8@E5^b8aDr{g}Krb>{3RcCS-r{46
zBpif>Y9OY_Yo@yCdZ#C*Yi+L4qY3LrCKZ4?U9A<yim?K9J`i2Y>A~lTf>sOuQo^^9
zS3P9H7$m-#^nT%S+h1}uUP`p<<*Z&VLREhv?H?~5gN)t~IN6R9ve8f9CK8K%YCAu^
z85&k82HCenhHPG=X&NfDJ?Rs5s<N5#dbc&Vny%@A3Ip1z35S2FtsT`F(e8AJnraV$
zb1;^#dQI6Ga0%~jj=Q%VL``-4Xw2%&ntj*duJ?{=K*0HV{;3E99qcw_=M%OVXaQ(k
zpTY+uOqYVhyy(_NIdLwN-Q_xM0bx^ZCN|E2$ahseNq1(^^UJ0(L^m^xfy{xP$L45L
zmI|QG!uf&KYiEy-RFbGdaaVY<2{QlQKVvkLa-g)s8d87I>y}*_9+06669l`g+$`Pi
z@uD@`dvO$S-KK5FV6NJ-6Lke9CaEZbYV&M8yKL9ccXLXz>ljFP%D2om{e^$9IuHhA
z+QgDLKMtegxi|g@+f4&7)&X32KgWieRPWoS7}m+bvSH{G$|1#L?$X|xu~M7UxNbar
zjoalbkbTt&Wbn`e7gFriVlZ>a0uq`?rWb9s3+(|;Tc8P(43D*XjZD#ZcazmU$tF%$
z%ilL>H*lY%+AB}RJ%IFkz)>1N!wJabLDp_7jmwP0oCmzI46R~9<gI&D4Sh;P#$S<f
z?Yjo4IRCr;9%t=r+g6~6Gl7`Hv6p}nY&&djw-{2*@0ehOSpdp|2u@+uH*~ffr2u?$
z6&-)0@1pf}d*--Xo3SIW)|}*)PS#4(v6O`w@&<3FRg+fjd^4krW3U%mF$6#&^Ig^I
z&+C*B+R@B8ET#HH<#@&MduZ;^ZK0`0#xIHZb;Ik&TA6Qua1e5pI&rZ)y-Bp{$szRM
zyGZTOb?OQLqGY?k=ctE2JH)-uP*A}GFUF-W#6pi>+;#afdvr{p)PXe+xu+A)9&?#s
zW7{%gVH_wT10VX-DJ0wxeh5A#DE&?(VN|;;iJ5BH@yfI(dhTiGKfAGAx5qf%wpu+^
zrtkHHN($Y6({4R8c6?gz7SPoHjZxFxCjIotAj<E;Tf6CtVKk?=>zuc>%d)X6tz=TS
zfL!^26ES;%vvjH*y45icEMUya0K*^oIvY@9ITITPK(RHKFfM5Vg7XS;VoNI-V$q@M
zC9&eLwlz%tQNHlmN$P$IHZ5BtDBhtQZo8~YfODe_W&cDR6hb>8Yj6VF+hH}>0LoAJ
zZ8aM=jB(Rq9sPZmC7T3nUt4GRnjcLGs@wHBG%osSr6$SPrtz?$&v76UUZ>@rG}5fZ
z12+D1c9LEkFu!yK`cCOdFU)Rr)^1!6+2)0mibMN0ssJSjkM<hjU@@V7>EP3$+$i_-
zkm}ENwQK}(u|Vb_5{t&xY~)!iM#wORot5^T9(QK9X<HP%5_dealnn<(+wI?^vjHh6
z7TKoqcgbdU!xHzOoHBY2;_c1C>0;NFVMh7eMnKNi$0z%n$u3j3vF^*6sBL~;plBa=
zSE{|0qSl;xOxvUXc!fvitiE1N{M~TIi_$SsTAJREA;a_1U%46+>v!ser21PLY7Z7%
zplGL#QXsj-pN#Q3r1rFUPnqkU?cpn#rEJdoTS^08isG|?oXE2TlpQTb_Rwn)Q+mLi
z@j^9F#M+m_$0}s<B)jI68xq8y{Orw(5ka8dN6EhmvWu-Z?iV1Saqa|i!;NFqG`PRe
zPHE1}H($?J3~fY%qopuw>xGLR+y!y9s`XzE7QcmbJgXLT;5*8F=w%)3>fxS$+J)C!
zeX_KPqhYNMF}SMrb)qVAUK*$lc)0y&uX(0J0`Bzr<@0x~bjv?teM#>+s4!P_Ez_$H
zDCj81m8IDh$=Kf|O%gkeTBms}Yh+ub5IiGG>@=NuooJ;W$Il;;^|IzTWb24{l|zr#
zE={%doT|CzZ$M8%j=ULMsD)fJ<<*HThr~9QCZwONLCv_{#wUDi5?T(sT3fvQGPcg@
zbtmeV3>}5}2j9A0J(p8H!5LeOk&~!~sOkE!Do`NtBBg0g$zUaxOA6DSi!vu9a)OFu
zgixVJk84X5TYReR4Hi?e`7pq3J`&5@{Dkj3WfJDP9CQ0)>%nH7)i5wD+G}~<GvI5*
zuad9a%VLKwH;d{{ri4+^TZH6JGWa>uzfwb?m?~Q15d}#So~?S^qrIglrPvfvs24DZ
zy+d8cIsyg;TF{iXJWr&V{z>1s5Dz32G$KUOYM@_3+JP!4=r8mT95O;SBmNFm^Imne
zFOzgzh#8^d_CAZtsU$U-_B$?@Oe&uA?)FUS_~C>{X0BaNuY|ES&{F>U>!Nh2?U!Hu
z9Q>VvDfwkvd<r$<u1nnz|7xoVmU#C(Ul@zhkFQfbMl=VaHYEhUdg&(D!+sW(WNc=>
zy7YSftK%dxu<4cdLG2FTqKpMtbLyTVIM?(lF6Wmy3vb9vB3}^m4Z(l5vM*9=rLmzK
z*&EI8lBzyX%bHz#)f!}wE_FQLY6tYdc&9x|LVER9gSC93pu|X)@>yFN*OP94;`SRN
z`~7D%DEGgNJXg60fH{VyYBqOH7JnTq>b!OB?x)5`!2_V2u#QDh<S6^2QTrx|peFZD
z)4`Y#8YqNJuUSdh3|_8y1(c#7D~<%kI)DOQ)2WQ_BBrS~&G|okw?~Mqc8WlRp~@UZ
z9>^W~0V(9u(o-N=FIXxG4QaPWBeoYqeic*7sMf4!K|1ze5~Vdz$Ml{0&HA1++4S2P
znSjB8Vq-^4IUrq8F&c}eQc@C<rw^wi^xccTBNi?ah%Ska7f*Ux{!-mr)Nt>}SCQNn
zR)WnLG@|N<zAm#OHO*YLx#%7`Ze(v09W9Rm)?~W<UD{J|p$9EXlc|@l4wsr1<G@$9
z`0HI0_#>qgM8EDt?$kSM*6z*qDS<$lR-ugiJkFXtXr#kod86_7&Qy7g@F^nF=%C4S
zLQ7_(fV&usqE28p1S}|{S*Nj3$c(MiS@&ODG|;*`%&Hp3e9#8eEP9=gc5M~wxFX^^
zzuCZ)L{+op<H;=wD&J(i01o7j!ZMg`d7oD_^>gUaSr|mr;0U)h>m{#dLPxM`;Mbt7
z`?SW_h~(*RW}iaMm5)~B-<HPY^`8!7*DfhM%+d18<SY@SjhwG2lYMwsJDUA_sXBz;
z^d+0A%bt7oeq@I=1sy1&n%FVLL2N)`b*|Uz*Ib7QItB9MAn9OcReTkMlYkwFSAD10
zud3?7z87dWOV6##i-d9EDqhDKLj1?I9x>3B2xS!%(5xwcb#wA*3(?8RtW+3^Rb6j#
zOC|tKP+xT`Zn`~trx&bVJT#TOYkC{B4r!U=LxJchXReU8T_SmfB~lUgDZCSIXMUx$
z+_6A4Z1|Uq^$WGVf=!iIuY%p!@!J(>sdQR=kRL~h!0SB4>P#383v)&*E%Ezm?d8jI
zctMHOR3Yz^zJDC05aeihx%VCD&c3K{n{wy@@iQi2CSZmy{x$Cl7nv^L0n@7f_OY4v
zVuRD1j<p{Z!O|_2=t-L8dgphqJw53PHJfx#hv&+2TMW}GdBWJa>Tl8Ipz?xJG;KCo
z&FHcTTE9_Z+>C9dVR?5UkP+TvOX5!zhsi-aI_hJEBd^^z1cO4nqQAGcx~@sj?bJ_+
zP9-L@LYIJY1Q9n1wG`2Ah=mO~G(SB=lkfw*)9OZ`l?D@ircAIoP!gt@oRpMNX3UzQ
zBREjJ)yraFFcJ$#8*ry>a9dbbIUv4?wcw#*QT><)q7xZcFWw`h*sXolvn>?523psc
zq`nl|u`XxJq&GqSOY4orMO1_{k18QwNhMhUSrvUt)b}2I9=z7Wa9qGB;^Mx6<|nFa
zbm5z6SO1Yle^G9p1fP(!2Bi^a-mLH<&~aB<^4YUzqMj5=7YTagg4vAg&C3!b9*P@L
zg?#?JYwBTan^uV;x^(ekfN=#-$rpRTyFH1yW6uBR)GO;j4F%mqT%2@jsz`f%6%E~*
zr44h89CKCWRZ>sAgG+^Bkk80Pxfc6rkOr8&(g{c|{wgr&E3#;$kuA2WVpW~`v(R;p
zOMb~zTYd?eMVzJhCLhm~Ov4w%_VV&t?ZeI%Jn9=0%%9oahUoW8li5mc&AoaP<40Vk
zMtY5|<j(g?|HKXd;Sryk)N$)>Hm3TF?4<Hv4~P6a*MP~=>^o)L17h{qJ6?$?x4`xC
zB9k7+Pit6xL5y_VnbFaOr}5V#$VLXk-OLe_H|Uh}F>C%O+Q6`w9#}9{$LHsONhm5H
zDER70D_qrn=^;$8nbsGyUwEAo<nnFb`B(kn3%8FHoY~gAv-1~p#-QRI&0;@BKMsb}
zH#Phqvb2{}BP8nzYt(q$^{~K_6>6h}aI|g4&0TR<nvi_6r<=Z<-sTR^A;a)(-7S!Q
zm{$`v@9hhs`rS_PxGAM=oBO4D<ndOPSCk)N!ICGXr97e-EvlI4=vO#zx9>;aQK|QN
z?c*nYP_+2e!J)UU<SQl^iP=6#8gA&^>ax5_nv^g0l4r;wQzI=UMgIY(7?-=Ey!`H_
zP+ie}Cbsdmu(H-353`Np0wmZfSL|4mo=RI=+uU$I6lin~R}vBqr{tBL>^*5~^6!Ly
z?fayhzbam77Vaz)Hzg|+tj(XX$yeCKq*v|&Y?ukMY!yVz@Ben9+$Q9Ba5C||D9nMe
z)a6RNm?CR>|5w7X%Pn|W-k`sg_5YkM!0641m)^afo2H^D5H@_Wnb#C?db&dcFX6^c
z+9T<c_0%~f=;;PAc7cz5{ZI~*L7;u(s!IgEzWBN81HGqIQ`2H*PrkpitHcBEL4B()
z5s*?fKGWis81S!k5BcKmVRLYT(~GmVoo~+5ALhD2?e9|R!a%hND*W``LIh`nL!|TR
z9TZL}I<-W#__%$izBF1o8zduu%+Dzi3HThfB0-!5bQdwxl|Ath3Bo4ln(?#Lr$P!`
zvP7o-0mlB%tz|V^5|W-0U$}t7DYHE0|Iaw%t=TILY9lnwd!xFyUX-(ayMMs(^l4=L
zTiI8i2)mDC*}6G0q6e8C-^zI_yK?)RS(;heQwQ@wU0mZ2^VIr*#??8YnQ4#4)oLk7
zvU#f401B|SJ#f`yTJ^HEL8H|@q*J8gTQ}f6S@LwLrW%@gs%$7P1b54(#B_SB_{oGy
zOI7`TyQy)eVzO6*9x*jX_!Baz9}*n&Hako%b3<$s8tG$mE$*j1*Zmn;(w~!(IOC2N
z--;~uIrv%W#Y;FO0J)PL(?~3V@iNe)hJ=3LXGeXyfA1TAh6R#p*FAEPwea*vQcQ0}
z;OpGi%<y9k1IS$(eMhZ9WaJl`7szY|;wmMxpHJTb{ckMm*$=SC3PCj7E8Fhq<X6Mk
zlf>E9$XN@~qv$A;L3VC})fD^pd?-}xI<V+(2BsKy3t9p9&$<p){`0$~oeZ3<{!I*)
zP~J6x+JhnwzwPZt`+f8NhFHzAw^~&Oc>(LF6&}coz;D=U$FO*@Ue;h|IbrDIKu+G>
zF6a}qP@>9|e9rBBAu5t>rK(qrhb-$}6W<4aWrJs*HR&!urDj2^<J!!H2;KFaNMdL%
zTVnMFRq#)C=pzOZTf4R6?Wp{&zES2U=x_Sv^=|##N#o)r3+`?u*vLUQ?t$F<={PQ$
zso3NYAXT`16VdH&TsD#{`I~VtPl=XfX2kX%zuw|_ydbS<3dJB|1|(5T6K;Cw#HHkj
zbU&;5GN5}|H|yeDY?%qB+0vPuU}I}sdaM97PI_G%j9vFHgEu+(dePg|KAEE<e|c{Z
zbcxe0?O@hL)}OYBc!y1Ep^Ys>Y2O#~Ea=#0iT<{oH22B)dQ_&To78-R)26xz(3Z{w
zu_e-idFzt-JY>V(3vKbX&x5f`2<DksIAR|qT%s`<vVYhT?7LT-q^zfIc^Jjxn>?*v
z7dL<Mh^1?%N-O`RY;3AajGE%Ubi9$ya$ci)*Fe79$H;5ne2;4t=!7$d-D`2)wk6Pk
z0=fN`?`18^YFxEiI}(PuTeTw{hN(qutfZ=Jm0BkZO-w&mvmtWbpb=-1?cN`k13{Co
zzLA|fE=5`${~qaE=IHjl(+j{b?VP?;A-<Zjz$kDuUt%hw<z|mbY-O|z<IXMd+r{WI
zU^jM)&)w2q3ayXhs3h7g+JmT~BH#^F;=hW;Gzzsjk4S}|R#{FixJ)5z9=)U!&UfQm
zM?W5zXGn3~zqyWe3^UZxNO3!{tF3AO2n<n_TWIbVnq_jCb+fRw0tWXT<&k^x??f4<
z>ecQ{IorQZr^r~&EZpX@ar107UM{>{d<k8qQ_Cb22%_1llH-E4LdqcPpNxig&>JnA
z9mQJ)Z~Vk(m`<ai2$YM%E0m?(O)cX{0)9=1<#Ofgse5E*&wTTnif^+EolsrjjTbHn
zc1w;8BP2i{i9YY+W<9`i-qwCLU-90;SB_|>5g;q2KrL%)XfoV+Zw#WZ^;(iQkT6EU
zs3p}Rxc4|SFy{J#(j7Y{{SQ{>&VccmAv|N#?C}@vK7^&_D&TNE=SdOaZ)*5WI4r^S
zgQusr2^jBFv8!JVos8MKM>^5Ou2B>%g^go>rZC*x^e)dYlDU<6lG}Px4(NT#J}se1
zUD1Z;G@N_Yk{Pe@dh*HqG@M1YP+MTx8?$*y<<dnVb9LwFHoV5Hu#P77BeDrtqj>xQ
znvr)_9#Ue7A{rv1IwH$q7296YNU7NltzWJjpCddWTZ3sRN^So%)PcR!cDs}RC9%y%
zMxhp0m$d~I^wKs+ol+X*@0N}tDVuH*Y(cQTJ6=Zf#S5nu!v^k=ZdsBO+D|P|5FDN+
zBK5df)dGvQzIJ98axf$1`|I%W0zrAt&Yuk^tKr=SRDm22?`A|PMvoiNhVO3(Sx?=g
zfW+OCVf4xv=N1bDY46ODe3NNx1}f9<c^PccIOQ}esHF+*t=-kjJfezyHWxNqYdLAJ
z)#zTiRob~TS47WdmnI+2%e%jQdpPZpmq#sItO58aMEB<%XQ;N7bUx`smKrglDC$U4
zM1k(U{@eTpr!517NyapH%rbg8({DS6D)|P`l@b@>U{M$<np9$Qe7euO7DhCOm1iZr
zm+w8V-v-+Z0$iua1QWqa_37jUhg0qhb;>~~K7)&1+d=9|HEW65M$~Myfgm<F;ec}|
z_=GF?oCbNA9_%+*tJ2ASb6RKST>53LN1hS@t1vH@PZEAHrR!8kH!**~?I7gQ9HAC7
zsoAjfqRK!x9_FM6C<cny%_FAfik`Mcr+!8sk9;t8?hMtmo6mj$lN-%bYj{bA9_qAz
zw&{$p_gkh2b2`X!2>>!am`+OG*z_jj>NQe47p~W4EI*qQiI=An-iV_xnQM^pv#`?u
zr($029?=8ZM2N)4V@3~JInr<6KdK@3kqA6LBayYK{o>bG>#*+d>Q5g@1$akj8hBg{
zOW>m#2C>udEjmk9oo@35?=J@s0PYQIUN#l7Z3?mmCJ{8A#`yKu#wKil&{p~C*IYES
ziXX5^nC@^KC<H>Lzh%+5Zj9?K^)d&lTu3soh^d$wNqyXs0{JB*(0@qqYf}t>#`Ovq
zFPnk5_%r{x&Ms(gcjCc=xZE4qh=Zi3{yA-UULo2nwQ0e7gX`1_i7cdR{G{xH)WK4e
zQ!I8&Z7rA2$40J8vUFX{NfMk;JSQTbju55DRx+`tV}&~0j3H=E@QHa)V*^L*e{6xZ
zGh1M;PSJ0$Kud*hyXDb-J(~wE#!b#^I85pihG<c4xu?D>H=F;97h+Ne=*hqa6p};(
zsWM7kG|?WCTZ2!QcJGo#ZH(si0CV0=POB-FbPiHk9^JDLc&{3(9&2#Nz!O#JdC*_o
zUH1{O%5OK{(};~Iw>XIbfeln1TcdK{n>B1%nuU8IlLfnrG6j2|Q`C<?^^wAIz8P!9
z!)|?!nU>TRc~e|QYvMw23^OAq1`E6(4j#)U-DUOQY}|OCb>bbG-A%ZufdBpbQM<{?
zMkI^*?Mbat%stXJ4$bogxT{eb+}T*}u&heg75bVBeeWe**RpLAf|0z-d_kI9B?0zj
zm+{2Z&CSZ%(c}Z}+MB6rxdrK|4_Cd<l?lU(vUIWsR?62dsLUGaGn0A(Dtj*KG`EO3
z-&n$<kqM{_eyTnzoFaoS@`CQZX-XEO<4;&i%&b6WP~StPjgesrCOakxsUOe(_sl@)
zzj@ldMD%zjF$grhH=Cdl2!bl6asbmdUv4Vu?+7XH)K<ULHnz22xo96LJZL*!X+I6_
zZJ-$^KjrKgkK~-Z-=12V&zW>LLReWCS~Np-9#4gj1L`(|P5(dJnQ>YzEYm5}&gEk6
zHTE*tU<F1g^_MZy?>}c^4Fm~o*Xt@4?H9YeiNdilBbBBFY`Dt8p+te8kEg_a+qcgn
zo!dR-YYTI#bQ7UApBm(Vf2x}YQTM{5+I)zeb(o!ctPYC~qn?R%yY$Mfj;PTT#WLHa
z*?LLT(w?Wwn4o9Jq0+>3A*=2gIl=37TaFlMMc^T%wRDC!TsYiA?8no;q3{3DJm3oD
zhZ-R&0waUs&&8uTuk=Di_X%xgfE1jroFQXg?5(Ss!e>&4D`pP_p>P88ME^6X@c(}D
z`OYN0Ae~^)?t39_h0|UXKLQ}{)3T*?U`_kci8SZ3EK#BKqW}*TyR^Y3OiigT2k<5=
z<miuY<7u2nT0+Xpc;p1brw^zvHuKv=j9d?(1eh$6S;-|*I6Ql%;l_C!pltRRuYE*p
zcZN{C1>Ure%a=L(Hc1WsdBjh9NC;4PMWYm;zFTlosC34KKu`pSTODww;>#=T|2KL5
zXY`}bWA;DU;eLgUlyw0UagwW?3Y&UC4u?V0V?mp_*Wosq()#sN@CFCw0qlVtoTkfT
z{@eBcIk&%ga=!Wp6+|ijHx-2Q-rQx=sVXSYZ+s4*B;%xi^0X4rC+PL-B3&)5@^>Mg
z$Wha2_{SSJ|7T@?^OQD7{3nwTVWz`rIRfy}TRKXJoW^R)sR}Lig5zwaxyL?DD{?Up
z<n|WY-|i$$@@`hIUpmpRaXpWI7ko~sfOAs7{fAjzTnd${4UE43>hV~So<)kML1G0X
z0WZ5U&>|k_qWsx%rsh@C>08Tp1g8AwzZaMECnwEIA*+^v>n-U*2}C4jgMMC*s~hBY
zpjQ3@bn+gmh|^jbz)0BW$7!5DVDEm#8AzZqISIYZ=k8?R4S$^$`hsp^_TDwK5p!aI
zu&WYRpl%1$HjKCoZsh{aSH)#dfN6$}>sK7x+*sZiX1$<GI~N-WnZk?yTrtyZG4JZ#
zlH^Mj`_kK9h$G+WX;dcmpmp=`qQg7P^GqMysTkgc^LEeVaJE=;t!o!X8lEZ2Firn)
zS`Rb|S%4gY>t1pxUvA<R&XritYHQV*eeFB3a({Q(gz~&M0{Bt&7fQI+-#J$hng00S
zlH@Z~qNw^yF3!~_fBb=Rz<*@$n53)lH>5iIi=|>f)XYz4{^In%5r+Q~KBCgUu;m&Q
zuU6nUy9NICzghD)jxUq9^lj?<gmyL$NGTVDn5ut2Z<Hw<dUj6h27jH?xgh<={_eNo
zU%I`c(C+j2^zzc!f9>z@e%=4WgvSu$8zxkDt^alh7w|u7rZKfO<_aqZz`SQ}od=qK
zGJ!Of2mrt=$fFDL2h<|;e}f$VwX3vi{{fOc+Hjq7mBF7I>M}Tkv_tN{1n<w!p2ts=
zMn1mRkXZ}Tx4|HLi+{0a6#JRN!d}9A*srtX_%9gaF~?uP-DV?gP4fFaGeH3LDLVrF
z|H5$2Y5ad-`1is98^Y`TQp~j6qY=$378CP2vsZR+fjI*hP-#9VkbU>}GLk_)0c6Mm
zy8G2wu@1WhPVa8M2Ij7XdZE0NToe8D(Bd4?lXf4vCW#;_ZmxRuTrM$<qC3oTUwVE`
zI?DW)ME}jN6AbvYLIttQFKK!s+lk*EWGPH9GTRHV1cGXff|D!K@zitGRr1CrICCD9
zbT>?n6&tY93RyqISw(W{2=)Tn)L5wb-+)iYr65W+qlK#WjHiJME6~W-d8+0rx0`B^
zqS_&bLoi6s!bgb7sgncWd?+<Cw2t5b>C@b{?Gbar_uH>@dcNe((`!{*C!bpM=vh9z
z$$q{?@rRiEoYLGkf6xJcn-$NkS6AV}W1(IgjdECZ9l5!*IvN2WAvW}aW|8N!$#g{1
zHx){=k3MSe^sg53O8<+)o!GlraUzY{r)nU&C~DF&BLeN-P{S=vf7~IogBMt*1cBH-
z@S7VJiyl4g)h*DeR>z`DFR5J5*j>2xTc9qvOKA4F+Nd39^dx<gy915xTSt8nKf^tE
z!0E-G>sJty#Z4OK^Dqc5CWc)j!%ZkD^gNLLQ_F|P;!{0P1!4<Z_q5#%$BIYxO{RQL
zKYN&tCj^0BWFY3?7ua-)d^OAs+k=*0xR=uY9xDxHsB=`!O^f%N6Gquh5XDlfs7%0w
zXK@4n$u#3rPXyx&qB397@JT#MFpyFFJv;8dl+NbN(X9=l<kr`v?n`A4roqN!$3`01
z!INh0Q4uUu1jP%zY`pCM0x0k^LG7EAfiZP843_`G&Y`^L^Ey+m_lFq#jt(%)X<dcY
zU4>?8^e7781V``%_59LARRJ7OU8$&Ep!sEm-d6OtC*|E7%A}k-%=NCvcerc~E@ko+
z#a*loZfkUKw^5}FpvWJeS7v)v7R{kkr7CEt$><WT@Gn%B?|tRrHXoPC%rZ+LNCB*K
zd6E-Q+$>J|pf8*Tj}UXn3zHS*Q5;%j_xtl#|BVu)e_=STmoI0>=Y`pVfxigktFLrt
zE<4SL2?;%G$CD}4?w`$kf23XZuK&GOjEoKW>ay0ezk!PX({A&jmrt{tECW0fkuzgI
znnP=tSd@lS+mWEY$Japwpzt2U(p<?KzXH8_b@gI>tA%ol{jJMAiT>TdXcg9A>b}^I
zkpAANac01!SZTOCldmYjX7Dw#K(kaH0F~I4QHS5spYo}XQG3vf<(?Rm)nu11<jiuE
zZ94ar#~XkkyH=BDEr(v6D&U+o=oL2t%~oFn2UYfdnF!^za=3k>?Y!F%>M=du-yInQ
z3RR!I?4Q8#^>vx+-kpO_GfQ-DsD8)(SYmv&Jk{$M?xwtEV8QLD1N`vR49cl&+3O>{
zo0jU4hhazMPu6Rypn6lrqAB#_I}Ye+uhLB9eyKwF3L-2dRk%okZN>oJ3FY<>2ggrH
zHTlnS8C`y$t%_rRk7Zve+~g^IUgElE1ecl?8tDagnpkY3Hd*qfu`f=PZKPEu6!3cQ
zy+pXI2pD3XgznEJ5z}BBw`oPt<8n&BW3&4;_?dDskqH783A_jszr<ZXT+2H%=KQt`
z(<0PyWCUZ26huZCU%vhzlHKV{i4|7zwkk(X_tQ4JZLMEeYa?k#U+I0UbK5R&DdgDI
z@+Ac!aIwasz5XasQEzwL0MdPOv}v5oTaopGcr<TxH<B_7bFBC2xq^heerKbKfx_Xd
z2c*JW2;wTk7K0!9>gRjP*QC=P5=XOZC_2NukW99Pj}A4PXGy$SHM$fakcyv+ogE<%
zD+%tg*T`PQg-4bgkbXufRLw7}7AwO&xJ{VZf^>Hzv%HDlow?{s2P^$iqxl-stv7W5
zt{kDY=xN)#Ny|4XEl8TIQ5?IW9Z7%Jt~sLA;2}8y9p&#91{nDX{3WX?9_}sg8x^3D
z(hDS=_-nZ!3_^YzUi}keyf}q*zIk<i+ZN4SOlUZ8#7_PcS?)#NSuOJ|77Rg(enX=?
zW}o`1Vzzjokn00b)!ayZa{nFlVwe<f3V`|EYGIr&=mN9|13{#h^UpEK&g=+Ed%WZn
zLwF-{jyhv3aa0ZjEaXeu=89FuPU;P_upKypnBcU0$ELX3;1jxj@e_KoaOP+LY~(G~
z1b=V9hZ<(A4$yE*bKP6eUp}k6GIgB7Cnq4syr8p{m!-3PsQDXENDC+aS)>OjYtGGC
z6Hh}iYFmJjq9V*7(99i1S|KM~8(0fjE%Ci~_vjwuc*-);g#z?F@M=}69t)yc<~8SH
zWBSQd56EJyAVS1p<*8Hms3h?DN#N7}?(^4(RdZiI%Tvo=nf-dX6eI0?y}Zz8w{7L}
z3`V++@!^0Xz%6Uootj@73dN9pyY2iBo#WWtL>NrrzU(LrzN#b<F1pvu*uD)9)ya~-
z$);Tqz@b~COwFyo#n5vk8VCw>yhkd`0{q-4_>IC*mc0~2#r^=8aK(qW{%xB4vXRg&
z;u?R@W+?+!yC78}(g`x{FirR_A}%K!zyWsgrfF``hp7!vdY%UPEk;QO=rVFZ?~YHZ
z@-?Y%^;Q&D4lPvc9NB>G#=(7YJhSq8CGFc^@}2&l$P-SaTBxmdC`F>U33<g?B}S(l
z2H(8Ai!qL02e8O%d2P>l+yXsmQUlP&3IbVYx%iZo<sO_-lDsjdPok+>-zJ_nGefh~
zsLX8W4jg(cDKZP(0=)X%hS&L_4UfQ2?Khx9l-aCaJS81S&YaZd)5eNhw2?T2nuYX}
zkD%=#%<Khl4V3=XK(IhH#Im@EnNezn8{GS+BwOEkbS!(Qu1F3#MU%mb#qwB4%tn1e
zXocL>2u|fltizHD0X4q%Y{A?3@q)Ks%Y)yj?vKiV@=DHd-fnCZ8`($haZ<~Mk#<dE
zOTjG+<&olekI?=)hsS}7Q{~?=v*2zDGNbWDMD^WIu{+0FO3a27)TbYO3()@P_9Avq
zl2T5oy=Daa9kFfIDd4i|N75vqNTH>nwVHSBn68KXYw{#F1EzLi9l*mTI+b{hEgu4!
zT*j@_BoI#<NZzu3ufbr_t(he2Ag;yJQV7wr#m!(>xcc5X;y+Tw6@V}z3Rk<#aY-!X
zfHHnuA=kFh9&GaK`=ynvpZ8rt+I*f00f<Hc{9OGls#)T*)HP{rPn~J^$+Bl4xK5*Y
zJtXm$wC8Cd>*ba59Y%(`b&!P`M1d`C2@{DtLo@6#_ySBxJYZ)P?gYZ*Qc#kkvu}+v
z5Nq5h@i6XPXm_duY$W%i_b9I)bW$(xI19^I+#|hbA0a#+7cM++SQ2!;2`hb@VsPGZ
zw$3T@ZFeNVcH#<;j0`2|YQnMyvA?KirR;P))N7!BBSZ>!9-Yd*nzmke^wX}Md*xaa
z7U&F-uujy|^@)V`Es&6&RfkVSP@u)~1(55Ye<j;F7f(0vk2c3?NFD>$#pFzKGI=u>
zg^e(ES5@bCylunc$>d~j=rpXzKlaxig@M$JnD{eq0}-YZ(JeRZ@ub2v+s^8{8QNKi
zOyTdh?3a7ouP_1)dJhU5#Psl}2*_jpHQp*;ISvF7Fu10<XjCmo|3Q!Hi`GzEL&;67
z^HoTE1EeN(mI&!m+=?LN#$an-TqT5QxT@C2%(i(aA;M-gj=|f)bwAtitbn?r+jh-S
zT{BVu1<ok(dxXom_&pE=ZuglW>A)X%HrT&Vh4`<d@ct9e4$*MgD;GubcjxDd4X%Il
zMA^@AMhaiU%9$Dkx8cb|{44B;kyc%hK2f36{I(qr45GZ-;0W4$6?pa6+)gy;nfyCn
z7RrqG)+Ro{u9yk$K`!Br3ZZ~j31e2Zqyj+Fi?`Ar_>{ejBHctbLjQH?>r1QeF{9=q
zS-mGDwB(3#kk1z3R;dT)q|<m$nNu%y{Nc#Yt)zt`HvNX0Bs*<mb7cs`4cBTXA}Tb^
z{n}fU!QB?bX0-BHZfvDLkvlk+L%~^C2OTE5pbQkN?Cl?L^S%8UM^^4cnrzRloNIJR
z1UIt+q$oXe+dleQW;?VnL)H<GyW(SS(%S<@Z%6Ixk6_~aO>N}#N&i-{gjae8N?YX2
zD5@E<leXcHI0x8DOHNogPs?3!UT5sBgVNv4gDh<NdrW&np@$R~zZWykN(seWUXTfz
z3e_u~bJ<@(^y)7>>KkViusc;=@OFM3pj)vqYT<6G5HBoAW4d}uN$dY3f4mn(b*smo
zDxWoI^<Boct)f0?YFwvezIfYKsFrrW1-%pPkRT)gN398Ac3tLT2pHV&xcE5$*&Xx!
zkGxE9?r1ksml;f2gA`)XGQL6LZQ7Qe$3Pm~jdQB2Km<xKjjN35rjS%{>$M?aWYc3@
zPbpK%^K+SXj?#7CLp_S6(RY95-Z;oT@s7D1|Cs`L7t+A%{;iDBtZpqCL2=G<?(b$|
z4c<*;p~9!v*xrM&SYfvWz`N#J77(%;)?|PjH${6*={iKoC-IAzq^c62wiGg3dHz-}
zmEAVHGkNPqh!S0Z6d(0&mCRv58|wlE+GG|62utfC>whd1-bC4XXsE$;AeCg_WXt`i
zF0xuv3J_fk7Mo*7Mc`-}dE@<l{%#oHqTPQAD4?=*X3~n9UAo%UA390w^1AexIn7#h
zlXW1$grBtF#hEsrA4sXBZPrQF5JpxY0f<=tE4<e)!!$M4ZyPt&gHWWqA>tT*)(91E
zlY0ab6Re|0VM+5d2IzmwMa3Q+TWK-gy_cO-**eqFLNFHl2;=^-C>uyy>(*5f@%^IZ
zGbh17Q<(L&P;Hu4{#l3t9~xhTt`P8l_WKs~mc2n6?r;Smb0rE{eR^@#l<iR=`=1T6
zboW1}HVRm%#=dI3?3SgXK$SVB0lTr@tN6F1<Go{eXZ%)PRUimRcjwg+yxq)YT)cF-
z4$}y3mTbcJmUsfFPe)vvU90KjUbTUdH$-nz>FUIW#8Q$PZo;b;Ne{6p-Hy}Pz?RxQ
zd!TxMmE@sG4<(!(@Mrq?W(5Eh)k4o{XLwAD$^0Q%*~so$3S-hbfNP(LEW9c8o=P?*
zvLuzB@U09}bs%VQj+RBOkCLFOvc4(GQ|QgN+0y~e#MGgudFqAab?__&#V_to$Rk9i
zj@^8&OucNB%B@R_G+*TIQuL`{GJ&ZnoR^%|c(N}dV`1!o3V+^&a+FtIe^w0dT2!LJ
z(R7_Q)qOuY*)dh#bf({Tnu^L(bB_61jHF1;x}&C3;Tp&<h9n2PGUJ>?^_-f5<x5{P
z9&8U*9c8v8>8z{&L0D0fA8Wsg-M&Ejl37jl1|KZ-{C(oYO{$02%}8E#k`oAe*qI7F
z+=l8qGKrO@Hr6d+tipDAX8^AT!2yLP${L0}<u=BohxsE<7O5i&$U$3LliQ5-#k-g(
zyM@>(m`yjDPt8Z5=QI+qJ{)CU(jA|sM?AW)7|q8e>k;a>s;>2{nZnl3StM83wi%1=
z<`mLrJqwE1rGjri`PAfRmgKF-XTPIm>gq9~KsPA8GV9_Tomao}fC7>Lj9tC@Wz=G<
zt<k7udgc`cfohr7h|2N;@s9{9TtT#ue-o!cSgP`_H*qsned;4rys&crJ?xqaT-&a>
z3MlaCwJBe5y>b_wcrOh|<eFrN%#~7#eW_zWW0|e(22UQ(RPVo~AL~d#K(uJe9SF*u
zlc4*%fLvFNcc8q5tmqfvG(czSaLm&~I07s^2xh=TDwhDORjLe1Pa4;WzdqEM{($1%
zW-hv%cDLI2IPhX%%#AI(`p+UCieU_42JfmN1*!CJ@_~Dlx#_e8Z-MTaGosm_5zT%k
zXTBe@zrNc2nxZXjxluZuA~fnbD;;ga?%?(G{l+9`TORYGnn(3XXBUoTxWEx0rAt|}
z#d)dC=llDn^x0VS&FIuXkdnAPGzq-X%@BsYGqYWqZPHZ|al1%SNRQP@yYebx)(+{n
zkDUnf+kVRqWDdz9Ze4Pd3Itt3<#$&8O@R24a`P!h>B)3yn@_);&~^G_#jA$XBi}LU
zC+pFT{&bGsKZVFlcFK_{uM5mx#p95V<M*aH+>ni7CQ-TWi4CYljbin7d9-^8zi?Vg
zE@5LZhgMym`21nMClV93AA6I1>=X<3^=2UoKqd&}X&lv^HX26sC1Ctj3twvig|4n5
z`z3yFTRTGbTie+7Q5vuw-;cq@Ped%VOP!!z3Nem+DUzxuqsQ>%^uT=V=FV*ZSojEn
zT~+XKJjj6$p@I6?BlMN)S7sa0Z}NPf#>#I4rbom*yXF?dQHnLxVY>aoUgrn?l=VrC
z6B0VQDGg<znKb%9P(0=V5M8WX4TFI>p7nFficP6r(lQW{;AKu@-Vm@Y;DiF{V-mu@
zddYwgGx?m8_*`Rl!^w%VjRZC|HU-WF%-oHu_Sk7a4WFL&F4W(%1Y8Db@+rHY*Zq55
zHl`vFJZg^uK9T$l<oRp^%3}0Z0)Tix?3*a-0U=b^@q!r7pw)ofmO+CiPi^|hk-brC
zx@Go<OcoN)H~5G!ag^th6D5zy)g5SkI-SemuPdul^c3LZ7dvjdFSyfekSHG)$cE2q
zin}tRSf^9$u=jI3ufrJJUcFq!STDJfhtczn($U)H)}DrvNbc7eFAsl1$SRjo*D;(W
zD{0E`a1i@V1!R$UfEKUK!)(7(NRAXbBB}mB-|}Q!m5%VG$sfiQ4?vTREfpP7$&w}q
zX6#0CwKHK4iwmTxx<ETwGvPFwZKO}=IB9<737IvM$M_ukgtNv9?x-5Yg1tSFnHf)J
zSpropm>*a@T~tyr8B2osE$+zG+M6sN8;5-{?jwl$VyWMB%7_9FEA209ESj7Y^UW50
zJ-RiT-)+}Px4!KGZ?&_RZp37aW^y*L-I$|8gf`%Qb<Pn?{t(lM?CqZ!WaSs{=oP&s
z{<h{!Y4eXEW(M={JAqK?R{g-7{;t{n&(!7M;?7>aFc*@h%ZQ`dHoW9ij65H-5o{|{
zS;`1u0n$D9Nn<#)zE5nMHc0}ZnBmIJvF<peRFG&tyM-5unMQ6~0vX=J;$Ybx1d+cy
z0pE|f2}cJ?JxigeROz)Al3aH+cP*IHu|kc$Ee_!^@ZW=B=W9(_?WCdL6DRqx6^sb%
zZH0oIv#>qH8m1KCXJVFpnM}ajDXDZA-bv0J)C*&I2~V_v(iHMWjC`4H^Ld*}fH=Yd
zk<U4_VbW|L;x+sQ6iUjIdflWC{TQ}r0LB!0ioN-!5hO7x-QVxg0Qh`BAlv;WU@8nD
z_eV9VBK^qnxMLouQIa4q5ADj_9;1_M4CGH=u_uzlS(7Iox&|7x2Y0ivCNp(1czvi=
zDyOKI9F`DffbO?UC{<1WysAB%^J4M&9{0_u6d<Gi;3Yt5NtY+9RZ{tr=5xqOFa($%
z^Q@?5%SfaIEO8UPx5|6m|7IT!wU7`>Zu(Zco<HqwaQAtro&Wxr1-#Oq&bjN+Tpjq`
zrfD^pJN3*UwwJpL=hK0LQ@!?_*7zjeq}9-$con2N$uNKewyb@R92A^aU8LkA2PARY
z)LcP7?u_2%JrZ%5o9q|A>!Af?(6ZAcO^Y9&(mh-wInbBu6CTBCd68_z)oSUF?LQt$
zt)3dQnP57z`qm$+ITv!kuX;V}2t~`MxYorMgdW$@LF}z52&y_wi@|UPkHd($0h50D
zvD7D0amcMz1MuAuaQt=1`d2HYM>|&Xt5(Oj-t5#{j&Xz}-;rq_YpU0BqtFvpo9P@=
zFeC>GnVk>Ea@1tByRmH6)Kx2G`@0q)dt2;Wn5$F0c5W2>4GI%7rG*t(+@E40wVa|%
z$piAu@bcnstRX^>`Q<?A!#vKnxfUvPV&GL%G>Izge<U?%lP!K<r|NUV>1kA1?+>bU
zB}W9-*yxp&f}wuw-gYf(y=<dZAjmn-_gHcVp`-%-qUa(~!5Q(W@)R)_pwR$z*!;r6
z<hbTo?1IA{y@yUjU-oCvHArz^(#JhLfJY59F(pKYuhG&<t!)+DJK<IHX^q-b1B|KR
zQ#rb|v1M!SwIyA-Dh+`E7o^v$FLqJNgL~aS9Qzgb*?}v9nkI>}Ixe!;#AS+2SV^OT
z<KRgc%VoH>u4`!bojMW9T|1?p(k*J^PFL}lc1k4&B(C2h^*ri#(Z4V)A-UekHk@w*
z8Oj!(&0^HmFo3aj;+eaA-YT%Tu$bG)Fr)r}`Q)=&zWU3}e4DGJTn|ljw@&vpDw|YA
zooiTxsiF4$B-K4Oe5Sp|vpWaA!#jI9*#!at!|;!$nR8(9N-W??Z@LP>oWo8<aNPCm
z_PKa#8fXasbtcSue(26@+*(I8<K9A|`o3~%wd0{xU6+F6l5Z(XtbSvUq*t6s{efnC
zQ*w2C(5>|-a2)Wto`==|RatO}hh7~v5uNGID}r{-Uif0~XL67Vs#5hzAbXJh*6q=J
zlu5uAxL)@F4z<T9xOCl%5{@pIM0#I7=7w%uzByPev)k+A@goSLE{CSIQ6iLnztGZ3
z=ImU*Vul$O+&0;$FtB%2bQaqjS=>vN+FNaseEUIszpZ?)-p>jn-?&<&I9J6oWQHF!
z{j;V!o~E0X@$;_l?oKHUnnaE;8nLtIx~nx=KG3Tl*+QRe6rZ$%I&rf#-`s5QuCA8?
zV<L)@m;1657F-CX;h(_<JKOtaCEG=BHyo_@KPb(<aj1|y?*FyF7A5h=BFGp9b#DEH
z!8VIj$kr$?##;il5hXB}?jq*w)W!tipO`%Yia9^$Qy4C8)$0eRLDTmgBF<Sj6$W*%
zGU)O&+a^FR2@T-8y_Ns;Qz?oW#8%Yo($e$Ndv}nU>YFE!c~UV!QDV`22a&(MjFe_F
zTu}PMXVA7|n)!}r>%qY@Pfy3gUg}-Dja*?LNc3;+nO2;Gxk+J+8r*W=GzS;v)DPyh
z^bW$uTUKn4Y7Kb}rb*+XYZe+iTR-Q-KhU5(5;`6{he|1C#j_Dr_%_EY&<1zJSdOfN
zb|5+RNFgzoJpAef@9lgtqENbn2q6LFqm|o>E2c^0swSh7WR4zF;y}Zw?H$g_1@A@%
zdgvs|s)2y?Nph8y*|0YYnb`<*TR>#9%u41v@n+^rXf2j!d_G4+xAYrat{pEwvX(gz
z6l(HDmhKpFfXtMSAO4}&t}Xz$En>z?9SAF9vE<5}HXjBhCt?Y<g4y)4h(or1b(XXn
zjGA6wSEE`~+JC(KsD7mD^-Z8jLGY$Rtbvo)>CR`X&8T$7&+aOR=5MUr4cIjbc^M58
z8_68%4Z@t(5gAuKJSvJlX-^Br_Vf$gQ=(gQ?DX1imZ&B$QJINa1U28PU=Uj={P2O4
zWNc$(*BWiQENA|6X{IZ?zA{x(uc&3gDC??XS=A45^E$J=;WT+yeZX=>gXNsL*SE&g
zY*xi=0<VH=7dI#tvIXlO%HFaIdsetAXlK|r?PpT0Es*}{5YY~`iFD>C;Flhsz1L9#
z2YID#LUugls#CX*jE32SEib5`*L7uH!HN;0{A`(T7R#T)45~5{g$Eb*^C={CwkFoO
z!bCP~*QYmgqg&s`3mZn}@9@CCswzYgEJRgSK(XIk4g(dQWY-0PUIh|<{qgRJUwKGk
z3Zs_DV|J>~4A{K*;`if&<|mb($^I96?-|royS0x?7Zp%>Y;=_(AfWUf>{3Eh6r`ho
z^xkVgL`0+r(n|mZM0&3wARxVl9!Nk+=%FP6LXzL+ocGLo=0Co3o{#?z=fj?HMh5oY
z>)z{L>sr@!-TM@{Syq}y%VPPf)?ZIBS^@nzaq_pUw+zwjl&sS|gTF}EF=t{sG9*U>
z7@H2?ynjdtn>=@($q}*0sI!619t>C+xER0&JOh~mU!97|9{uz?HB~+n7FON%(jU~I
z;@8jX>KL&_odgQh)zUvPb35f|c59xpfKhEUhAz$PvQW{8AAFf`a~k^^({hTQk#CmK
z)bF&}i_i>8>a@#1Yi!atK3B>lcu{%Rw7^r&kL=;^a7e5<S3+c=1m?xl7dLLo>M(dz
zDXi)V4t}I3S6*uok8gC_!!=zpMyo#eP$S}{buLVNq?>Y?smH%5G_>4~wM6?I4meiX
zc51?TPQQKwO%1b_a9T5s+xW(IqiIZn5Hlkh64n)@hmj03SDn(EXX9;@y72+*e}Jd2
zt69@Q`5O;x`S=#E6`<Zk9}Ez76Aidu0D23adk?9=bI<jb02LR;2cbxk*ZW;!D?pn{
zztwyXa$j|by4I_2VgvOnr@TVkt#kF%Arw{AR3dUCYv2|ul0&g`9Q=bpEt0#>=dvGY
zHfjlOY^4b2Z6x%MXMUx8#>k4<P?p(M8duKj(P@SR*QDl|Ih-BRl`bWFtN=;_okNb8
zL7{!q&0Vdt--iMXQfjH9B|TLRB{6oW14xP8?Dlu|pENQXsrj<6J5Njks2<uGnjE{Q
zR|#*SA5Qc}9cB>#<G0SqKJvI;343Z<+?LGXLdd?2pd!X20$WIzuU?cQ(|B8EFnfND
zY^TE(a1ALd_wqaFJ7bgLeRp4`qUFrR9Hp5NwCIX`h;n|$Sx+3eW4wHd48F1j0}I;*
z&>BZN*m#f*yUsIdD^o5D>t9Qoc#8Q_J7$($y{?K+2`9$E$F#&`z8~U+zJ~C=Qxs?;
zv#E$1aNo<@lE<aJaScs2Xr-L(-h{8>7iC@4^4Riqb2NU6sp4N=!uiQHgwq}JP?nIl
zTdY0^rcP53;&*KPz}m|*^S3A6qG#aa!^C}ID<eKlaQ@c*8+NAk!1SiMNs|EZEod&W
z=RQ;1r;$o^bHA6r0uDo`UHuB_pXPkLu<)Ukl{pG^!4Fbjq%QjuteL+yZtf=oo)}sP
z-p{==c8^VA5S1R+Mne`@Cp0u94ddn)!^3d9xs0XecIVYPP`J<LQOZU<avk=r!z)(C
zH#sV6`p7p215%6zN$oT{gzv;g(`8oB9-owiF4K@Oi~X9MbLq0Q$TnD1W!b7qmdt^0
z%nkO*r`n;%^+AX!W1qUp#^veRL`b^g9Hlrq?0we=HcdPAS><DS=GCSKCwy+h;H8n(
z(}*O~%&$|4ODeO1U+?3)HkwL60dn7EUGH@?^!mS^cT;-4-~()Fog-Eyy09yhht%0A
z=@#6@U2-l6R=M(A7NRmG@R)uOb3yu?KvP{fov#)Ka_`Y6LX#ta-d;%e{T<w2<A?A9
z4jQW`W)0#l9A;F3yc}S3y*?XL`;)&EtD-4Q?4x^r`~@q2W%rx&{&B)|m1bAYh~)v0
z4FZyWIXKQL>c3Vir+88uTA3biJFt1KVrmEMe5wxoQdD~{#3z{zlxu>Xped`mu4w%{
zRJsYniJ}{4F|4Z2P@kPSzqd2EX!3~G>9Z6=7ytHPN(ed@K;?MS%=Hw}gJW$`uU~*l
zBz1VLbB15enpg~K4kXnkg7C}3mZA$kdn!fpIkzw(SeV=UX>VgrrNYWO!kAf#!T30C
zR*;cCk6v^NG+hmFe=al{^RvFQlq>_LXJ3;{!|D13-svK^<U~%s%<w<-`Ah>JWIo4f
zAZe&s3V7`eAYzpiz4|0iezmNU8B#MW&-@~I)?d}r;z_lUrm|hW6$$`2ujUqR--|vN
zca381^nz2xOAP(r2BkaR2{|9e#eMqW)NQG%qm>58TeD<FEt#!z7*!4_Y42xxJ>GVu
zss$HKZB5u2HyiWph818N-W<~_7^1$g(|J&F<5F(t@HSOS=i##d;1uQ1FIZZoAxA~!
z<*GE(Jrh6SiKY%CV&{i7)vE1qG;+Dxyu6JDP+Qrm6=0Fkz76G^S_5sQF8F(`!Up8K
zn=flScSnfnDCwc!Gv`Wtl3fmY6tF)<%U^gLql%k$4Qm8)3eas5;n~chc`{CO42RRV
zJ;)nZ=`3+me!dMt+9@|3di^Ah7gH<7M^3Vo7;_L<9WHz5PA-c~X=jToO-K4^TsBkM
zbf((`<Td-|o65T*fugu>>D!A960c!b`ugG0Nv|ztHC4dLxr`<VPeri^_1^M60CLNt
z4#?+OE?|+n1FC{RJ6!2yaD@H7ITA#j@WPz>p=so4>6iSv+pN8&RqNVYZBP~%LlsJf
z$)((n`>{xH6A#oP+EB*;Bl^J2c39lXMmWa*FMbzk5Vib?q=}%3DDa3+OVU#Z&|YX?
zfya^uTVElI)l`+3Tkb~#JDa&XKZ9z!Pj83QZS?&m^i*ACbKLzW8%V=YD*ow@T%8+x
zzQ3qGzXPe?6vNE_NJ>~R;JfO=XZz#r#BzA>=EQBN7}sR+Q+UcAZr5UPWl;|;trHr}
zTD`%(7x-dgA)FrKzGly3gwK09dWy!%*!{)XOfSY=-73l8^m4Pql8S|2hPYi3HdLVF
z@1Um5<V%&zA_J?{;4|OtMJ}DWGJ?twRPiOsxs<WN9o90#8B)y5Qg!bD?;GZcEVz7Y
zdC|(E#-WSB;NbALsN=1UR&4^kQnA++bpHf?LbcwVbo)iHXxyX+&?^m4f%&m218VLf
z$P72_`*RgQF@ys$c43D|p%c-d#lm;0o{!dgBoYjr9B~f)>BKzXmAd-fcn+j*$<oDW
z4^^9VJ%iMK<6^fY6k%@pYK#9m6Sq(7O!|-|yq?q@qi4GJYowWSJF@=+7e=h0aP;!t
zN>^bD=MyAfnlG@dCv6Vt%M*On$4uE3q)(K9={`P^)=H~5+IA$WBauh%A`0Ig!l2U6
z_H3LTP*N^@IyfQRU8(&6Hq&U9rFHd-&qovO+<&^5Fd9CmeOTVpH7<W9<zHR^xVB&%
zf`gNPFAcM!k*r{+y^v$u9()Y>ckEqy7ZR<gkOc$EpLn_Kx8060%9HZjbeDd$1s@~2
zGdzBRwJ$ioM6s=drtmyAV<Q98pQvazb|%$>b<w(m>i!n*&5w+JGA+Hj;vd)+>T!39
zF1uB!KY2WM2;VBqKjl*DwO=%MJ!kFuOq>UvkhiOVWnE`X-o5UkChE3KLdk-E4Sy@t
zsy@;J);_6<Hd408XsFa>w^LYbZ(qj2P(5tz$aKHz6a-lzF*b7t_`{X2`(1?6uW-5P
zNe4e>53jU|KT-7k^ACX7sqyDUdF9eADAV|$yMH^4+%4`vuw0A-PZ8$g3CI{ieSUti
zI<<u5{h-i}Uh)b<CDi?NG>&QK0V839=lLeZ9PMx8Mdr>zR>5??k6D)FHE7HP5Vxc3
z9t<TEDbWYuy$3dpEvfY$jR6K1NJcs|SM`y?jO&=RN1u+=GS-lwkr$@OjopJpOgDLE
zFY6UmRr<he*)HI%o5?!0{tVBK=Z!5KuRBg@nP+H#Cjy^$j6?qeyss=3VqFev{oDb&
zXmL)VCZqHRlCu&~57^uG*wxrUHSh8^e0`SlF?Y3D3H|2Cf5x#rI6=?ITw{^CibqPW
zC?+<@f&~Y^(W0b3*!1K%0ks^F8TB0U2t>ZGr?B{qy-|}i`xVmo3`bCm6PpP#@ElN=
z)g1}sv<K^co~xq3AN0)Fahl}{Eu*g!Xt+Tcf)MNTq1F4dmj0$*N_i0Yn^p3H$-VkD
zgKQJcFLs&<?>_h2)!sp^)4#6p6(e~JXt&d_+^}0@b;zgnC&=LQy;+Xz++ZJTIvjqh
zl@rr8<mL+4Lh?0ZUu>5KcqGU9xeoM1;HP!Dyf-4Vb|!RGLNqG{w_%aQ=}~n9Bj@UI
zNFL*$Fs(fh{|smrV$a7WQ{_vkyXeE^=L`nizp7j4NRR2HiayA~1>w~eMc{&jH;P}@
z8e6wvT~Dz<YaG=Ud}C&T<a#)X+R5Hs08YmwF!rum)#>W_Ko>YoFnCVc&d)56)5afw
z524H9Q2*Sh`=LMp)H(u+d4v~o;nN5W_*23|ft%a9rRlk~xk{O7Jg)@)RPh%pJ5jBg
zk7L?0Czl`&PbrXk1<}I3g)4OiSz}S00EI%X5l`ThU_?e7Pcf&_2XoF$R%<POj`8Nv
zs=cTR01wo8I;(;Go-BTp&lJ)Y%y9Zr&!U49+H;12uT94U?h5E!X(+5&YrsLjG;I3W
z8|H*e1bD%5vNqnm=S+ChSLgQJ3>avjMGt4u2%ZQS>s^Snw9AFRUeEi{Igy0QU`b3W
zJ${dpe>BH;_X6yuDDzhkuFfB>LHDi>C~wCs`;SchhGlw?COtS`j<DS!hA&!#(^c7y
zoeempgNlyJ>%QP%J_+#w7#xg|cn)o4yuJSRfQB)PjNEtp;MW<jLh|RV`KO$YYT&##
zgTfrHQ_?QK`Ph#z4mBy+mJS*TH_n}T1$(A_vCTtNwhh94?o7GE;=iWIhX2fMdHZV+
zD^$_j%$y^LgXb&7R)MrsV4l*!Z71@6Z%g$3GHHQHis8-=0G-5#0Q=P)dzFDesF2^l
zWZBHAi<3UCBv87%GgfT)_fI$FdT%#5mrP*JnuF^Jd~kAYUEEK36s)aSmQ}O1@f6n;
zz@~bU%QKJ3MYM^YJMDs(L2COFY3|F-CSJ*Hg**vd;IE}e?KJTB>hm2wI-i$)pa1@}
z3CUZuYNts*|2U6vI9J_O)<<HJ%;mFxwdHD&^;h*5)s}KDY9vU;R=$^ke-4Y2)iJ-K
zEx0uN4`i3p00u2C&3hvN7DeVvqW+va;rV=4(LZ>OLc|0_98VBTE^#*;gwF9b1xRAR
z@+YIQPH?%`W?Ku?OQujEW1c`k@j)J?HA2*Q*GgW-^2VS`YMMuK;$<_x+6zoeN2-vi
znX?5ZnPl^DmTOM%sSYi3lP)EX_sN9JfJcaHj=ir6h+DXzORtf)mG}1DBsb$E;BF6_
zMkO9AC+#7n>lXXPv$o;d{UCIY5^Ai&^cQQJiRrgz0*F}IaJt(tts-C{JibV13qF97
z9hSPA+Un*P3R+EYLZq=t)Y@@(Fx-F(T1f9ZS97zzA6K;dmmLb29_~#|2aT>PKsy)p
zj3o;6N`~&4AoHB?!bT2<E&02F5&#f|(#A(~K51BbZ)kbs1^Twiqc{e1HY?uqRlsy{
zu%$NA;*L?kun|mt{Gw^Svg66Fg0^5SIP7-`D1D>aK|DUysrDD=H6aY=WI!LVztjS1
z#X8E=zUjkquSE$KZ?Ny4@9mM~w%~I+o$LeewWe9XCu%$RX{~!a+k?*tu-59twSk^)
zYPV;>$cL(svFTXCWPbDKer%c_%O=)25KvX`PF@ynKx(5c7x$!4@I;F>VCp%mo2l*@
z&_#f`4PD4a&P+V~9Tac&r@%kSWYB7SbZ-%;ZStFVx9J<<J-`71EM_R4&7D<QvBjUe
zM>eW5)!!h~d5)C*sd1Aq0<Y>mgRp5+n%C+V8>w$dV>aKlK!kHn(4+ckVE}+H_441S
z_i!Bx)$>_9j3#&iZ~0EQ=G63Mt{PE7)5GLuMC9#&-I@C<N6quqn$`!unoXWnX;?a8
z3MZl7T_>5wN`zE0M()!fX53L^NuSld!GHs18b*KA2qR@UBWs+~kT`Axr7Gu&e30v&
z2Erc&U}3k<)U<hMvolSfUsQ7atrl`f>IrI6dFwM<MSt}3f##W?x|4O!1OT$Q`-$QC
zgT#d#N(mz>U)L3g?CkWCD-?^mdv8s~=Insj{IjgLrf&uG0m}o-_{URI#SJT-2ZyQ5
zS+{2*0WEgt2vEcm+{Y#Ce6pr}3QSkBOMxI+V)5{=h?5pIHa163%~j8M2)SgM@v|-y
z>jMW+Z}QX!H-I6nMP8%7BM7@*HMtlCu+DUCeAe@^T00%L{CuwHFIoL=ZoUMIJMMuS
z*wU*PU>~{_yBy0s8aVI4xB;?S+-uMux<0kw^S3_Rusi_zbqc<L#ugN`!MMYY8^Ylj
zkE#&ba#IJMAVMbA$afT6ZqX%KkuU*r>7B?349NI0V>i0x*-P4Ws@thIG-sM0J5(l>
zj!arfIF<aW6NgKtU7i(WEi~CJNke8AB|e$e<tV)uD8D14vyz!qqp+S%1Xv@%DAv#b
z@w#QMx+M{)qK=HUW9)@`_ofF?^6Pvh)b1Ari|Y|nDIO{kWs~<qUuLU$`};k74H98}
znYvL1%v_%W{QLLYkH`C6-{?SD6TBWGB#53q(w?_o_a$&ev%SG}0<ALV@c^b3y$npG
z4lTjIoxpTNI@16h_sy;K>S@N2={ysvN$C^!6q<B9<tEDuZQQ#Av&kY|Fs^d{Jisbl
zeDPZ?7Y*4ShxHTwhqB^x570zR7u@*V@4by(0#Yc;U$)IpP}4rUIRKTV-P9ziy25v0
zvL)#UA5N6D7FM>6?5?HRE{y%4?KtuzBcME$nA59$4SXC-zjkr2cR<rw(sTpAy18aN
z{7+`mPToQ3c+#dMh@EM(t{|?mcGjMXM#~b%#E8U)zt!q-^!<O*qfA_-*Wx$0HxeFB
zx2<=H)#4FDX{*&fxvG~sOQB$}`2Fuh)mW@A+et5c^$~@`J=!+f6RydMAv_t(1*a~2
z+BG0qJ=o)w@;BRxS+6t=1hNmbS@X<|*OFI$i?S~BVNG2lk1AY8tGBfdgVenT0~I4Z
zsj6j&tE!{(4}6GZ7ZVUEI^X~xZ+4TM*iPjJ2iUbW0Pp}f<XebbSY(2#1dHT6qgBcU
z#Ot7$ubL_u9&aD6pV=6A&Tu<gs|3iw9{_G$tF_xf`|!#V0Ugz)6G-UZ?}&OoF8#Qu
z#nz!fi}7jeuf7mg$0r4g7sly#MaO^W-;++t-stGkS^QXCwq9`D5%6mJu4i6{47YpQ
zDB+CMeO1UGMnIVv2Tw$<aTJcTr2#sb&PEV5c10>ME|89?=OdSLR{o`w)F6XCj?umm
zW+!iAK5zdcZfJcWru6DgQ^l#@wiiNMS@BZ!@6T`wv#Cs}xN^;`XkQ&XpoFn!NJBic
z-}K`Bryznu&&CXf6<_p>kc3C=7WQ5O-2Fyj**#_OS%tkM9aqKs-IU|(icW2cj<WYQ
z=(g)yHPgi@_^AR60SK2jz!lonT<l4Zf3?Dx<DnQj9`@<vVJ(b7@qJW$;f(Xf3s(mv
zDrvugnLTF)pB@YJBG@H2aoc9Vn<}%_!(lO{I<T&EANFc{yilOtgm?dK<M!Bx7!QAt
z7mCbLRktLVEN@fpC;w<ofxNDQTYodWXaa32hxJik4Z>RM9Qaumbfb3vr0?~-LBk$0
z^wRUDOLKI)wf_yppdz?KGm5S45wXIn?gjeFPWcz%4ZSKfU{;fcDo-yo<>lVJ{ZyFU
zUcylX;<WSnh3x0qkD3x^$ph6H0gRofuOR8$H`9lkO&*;CD*5+22$W;#jKwm_{2MW%
z48dSWHGzQmN#jNAdp>?6Ov7KjsAj0*X(}RWc=?_AdTzdvbKE7R)1LC8tN4Z1^pI0@
z{a0}usixjJg||mp%CQ_uN=jtW7eAKM|H;mp514y>&%&?B*MoX>TA01Vij?NAI3@3H
z0yl9ijtAJ4eSs|(Z|?U@ra}u$qc{bsZ<4$6U_zRGIztK$kGNgFH;#~OaFy%I4{SS1
zYD~GW>`ZB*a}yMuMiz{QBs-phL(X%g4a(xNE3Uwd>#ZZOi3EY43~GtNmsSw{XNr~5
z<EQCISSO$$pZWMEbWiT7J>3F>2fvy~3F8t?^&#*#>2}6gqw(rti%;CpZhgX&pF5}l
z3|p?nL<X=ld_e-!YAH(7r188@c$@j}xil44F#pHL5Z4s~Vfni_GigT(uqXRfWcK;T
z&V4{$wwPYS*j)~QY44-F9t6Swwg^<`g4X`rBO5>Cj(5bw&B677&-YBX1Jy?y<P<b(
zoSNo1Y*0(jjN?H|{c#oITOsr4s9NastfyygURNL1Xj;=ZRS9rf%a0XUL`k48kxd52
zR-#A?Um>c*v3aV`eoO!G(HR8CK(D^r!cl_WFE8~8PlsJam&}KF+ntv0a&Wt0*cC;~
zP{FPTGGN*f5oyI2U0)%D$IHMkrDaz7)2cg_eN2-QQImJ!Q@qWmc!zK8{#(IFNDNBJ
zgmd|(Atid+6-&3|<Q4(XtXIioK2d{quS#?OS(ZBj-FJ%gU7vYH&H>moCSH-FGtND5
zNtAN04QjJt^o#0%XB?oX^J$P)pDT<g-pg&S4sc)5evyefyk(h3^@tbNu}Tty^M3vs
zt^AxPa5icd*C%B~6(4u6?Kyqq$K4n>)`ig-;J>~X_^ZTX4Yy4tI{@q#Jj<b)PA!6`
zPaBY>e595TqK}nym%9E{Ww5^2A8n&y*|$yILq4w?Ru;|=W~$)^*tl2BG_u#2lBzEz
zR-I;;^;&47;XE_ShSEtfz9Fi6G><kY9(QAZf((i`iFUwNSzoVMI&zc?S+pbj^#rpJ
zh}Cg`8&vM76>k%_KN!tRDwEr|bE~sDzQM6UT^zoDWJV+a$i$_tHj;4d#F-+afES{5
zWdVjxm4L*f>p`ON2E)slIT`(XqP7#f{feRQQr?X2D7mP`J(3Q;j{=zH@E?FT+V!S7
zTz-2*qBrLBcECDO<G2BaAwSZ2PH#NjZZXkuOmqx-3Hv>scMvBtepn^<zS|svKU1&0
zzj|+|d2gy}ZDE-`m60?<58H2x0(hQ@?>l%F@uT*Gc1qKN^9a&ac|E=Ec+s^NXNH<f
ztG}0|zsa|y4R30y<{3cnOW>iShF(+~D45d*>cQ!h7|6?o{I37g3XU=zciUCC1bPqZ
zFDUQWZ14#)s9BpO7lyCaz=?IBf<5vCC0FTuugoho%%y4%+|VP&Grp~kg2q6_6lC(n
z&k0I~KQS;u_iKu{NxTGXjjJBim0QARc>VXnkLMPSmnKaB_pz&w3e2s0L|O#g@7VuS
zlluP=KgVze*R};O#GhE74O~$4X+{CFsK5s&J_o{K(nyW*ldP+hD~P^?WWn!E?a!Og
zd4!B|uML&PZu&#HF64l^|5kx<s^+)F(6X?5RhTa}NXw;lP~$FJp{Ya?hnlJNNK*7d
zvWbLW$(06l8!$n;Q-aMCMs%(#xLINp{nSI~RvBFcRM1&Scs7!!t!AQ@@)?-R#ix4_
zL{CgKv8nES`b65ZlgfbIFe8#Q<+iV-J&u{75b)pS&nEP>T?DG&*FZ0@%)73HnY^9E
z)MhfAF9chT7aH1tfT$W{MW#+{K0OLcsrs-p9;pebXg3Jx<X4g?t~}znV>G$Max&ns
zecaK@DPU#TGD|IS<B4C1N^e|e$plzpaBFPqsiYl&i@j1rNGRPqjmxX|bIbNI8+K!g
z6s*yJWO-Q&Y27@jbKw(pU1g{oS#3kx!ng}V0itmU%})b%PG{oIUGJz3Ys4#(Mp!kB
zP$7{~AaU=HRDcMTyqh?6ujLut=eWSM^MGj~Kt#A@T9OVA;8-Rf^*A-=nIzuS7YXC_
zEHxVb?Vta=?CqsN<b68wlbV(`KOXP<7gGbP@hjW!xV-Gw?Y?#ZG@ahmw|6?^*Lson
z^By@H0ysSQ)<k=6*L=0@i-M1Wk=7(4rs|kFSQ`fSU@2`7W5)@3HEI<>@!QtNeT`fi
z<1f(Bvd+QS7u#{-FPpp!emt>+)1Ox`HDT^}C`4PgDZ}kHat=MNNwleo7DfiTu=OzN
zBrIo$N53bmJnV_+m(l@qC6yv<;(no3$@O+mB%0tORG9;Ojege5CKu5ct%vcqqNMTx
zJ!gUrr`%4{`|2Oz8T<AnO*=b5Em^nSTN(GI(&e|>Yd=3LyUT!sb9q1rcQcmJqI;BT
zl2qA<uqHr6xbyL%C<n)8ObEwgyzL8k0JNXlQ;_@HGfBy-X>Wa=N?WZ0jOOfCvF!lo
zXl1nfM+MPjc&}3DtwKR1q#TDSFfbM2Rx&aV+dd!rFjc4<J7CJ!kZeCvk&-TW2)9Aa
z&-is0l(1E$q9x;CZdt*74`J9|tI=xM^+PF($(`kHMW<+gND~j}DrFBK52&zmAGtp9
zP(zr$NfMC;CD}0SS+(AN#4Qd~#+;4lYjGBCKh)*jQUzV6UB7l+BkV4}y$9|k8kD_m
zZ`}CqcjT~?)@j2piJvTh9UShqn}nbT0C<TXlmvq)rQWajB?RMR8Y$pxgzcdvB-Mkq
zVL~WTm&{7xNkV%5ex}&u0J}=H>*DGc9h^1qpIrg;PbDFsHp_}eE_|K|3TY2^m8=oV
zYBkV$%Em@nF*OdJmSkKWEORw;rB2T~43Bg36rqh|P}$ulFX6n(5MV*hd+g^O8#kKX
z+0sp6isVcC+u$0B1ku0vIoG(Q1b#}v4;_>Wi3QNTPw(qiKStz?3Y3LC$K#^G{q@RO
zP}h>JeMf{frs(H$22_(Y>eU@UFO~vKy&RK$v99Gtqxq-ZPtn!X<&4je^T%YeX1}w)
zhWxA#kg##dnD$wVymPBvWvO@#xm|>sN!t2rJ}ON<6Ed+HS3T))_{z%)Tby-%%z)9T
zCm36a-&Eqex-vgYx7H&nK|EvW-X2{5`4mmw-<=iq@oQ{f)QccV*9r2S@q@#d_etR=
zt6>dkN={A8!$+L-t+5O|4ucaaa!PB!{NUN$8g~qYneL5QSRi%9orj=~vbeW8jRmKe
zE-+O823T=hHb=!bYw%&zmPhGngOCDF>#nV|>ixViyg#?qtmc4vys@a2!gL2LP?*~Z
zAyf_vV6#wkna$-aPVjUPkMIY3VRIa&dPZv7P7}Qq*Boz23(Z@H#<HjG>%6reXbaA|
z{;*4-FO~6vM0W90cH`ovCY_P1PMCQ%jF9X$zm1Ta*`A;I;wGtHz`bh$YjiZ5lC*m$
zD$$11p5QrJ+UndnVCF_nWQ|L1<z(DBp)&czKqY%cK@5=aU&s=-EgVyD0IU~dktsEg
z<@*9L0$iQ1AB|Yyx*|Ec+1Wrbi|`d}tYEZtxskscLQgt5cd{<=mlt#OhSlpI7>T$2
zZ!9|tBp5*v)8x&1ZBh4$vb_3+mw)Q+)cCNpOHOA0AR?{7!#o|#8b1&-Q(0c3EcYVz
zX`DcVym$*ZbSxAr6IWnR_4rT@y}0Dmckg{<Le0Z>dCxrAPl`9}E7z5eKKQ(SeM8Q>
z6ScFWmR>%BezgD5PlX(_?v#6BkN|Lb1^e+iMo^D}*;m(5hU}Mp_ckT2W4P_OezRXc
zB1J;@1}D0$rE=anzyfcZ9P^bXKW)MQC8(4S6xAx8FK;Fwi2&O3+kF6HA295)&spXq
zf{lGv{1AXTc2n|{Cl!)Lc?o!%=in2i5R77;FXXjt&>c<LM=}87h#eo3Y@3oUErO`o
zl3aG4*JV2}IT=&0$k@lodDRp@Vo-C3)`Kf5E4y0{uxTp+w``vU1-`5UL;0-pos?KY
zc#zEx=B30>=E_(H9JITx^=-@`%d61jNwnnb3-VbuIWY)jkdAs<gl*z0M`^kWmaSyE
zQTMucBPzh8oe8e$01OW6ODww14^u;VT1FV_A*oR^J-uMJ$@uY}9ziq5Jk`eu^0#b`
zYTxnlP#)(~!GtPJEcwgf1vlt(%{rnl;kLrh=bnSahyJOrG8Pbv1iuF%mQOeGaH`C3
zNcLeH4#~Up6d2NyK$NuSDBxe!&>C^Co-27WtRg}a<a#3jh+dhgL0Dh-Wa02zj@JkK
z=0Yte5nalsp0zS5wpfC=#Lp=?Q6fMZa15;Pa=yvE9$~63>+#4RF>TN5+Zil5s8th-
zOt|Ti321ZPYS1g@lC}CbfEmN+Y^oC?5nyf0Up@C2k!X75C}A0^t_u#CB4XT9zs%U=
zy(_lUq8);>DRXFibXBrEbnE9f9QQbNBB0(x6wu?<ID(4aWnH*k?S=e7BcV$DV*P@P
z^sb4N0)r};Y}V%$6q;20n%O8iW+nS9g@>IdSXEuu2LKe1U)7Ep#ss2nEXDBjO9jQh
ziJB#3k)2<Db`;?CnKH6%VeAffm!~fleXaK)xu(cxQnA_NQqdZ8ItG2(r`bWZly#--
zS8@9@_J5?a#z+BFCLb22c0hi@uVCsI%FZ0?K3%Oe2Kr&zergeXVfHY$dpi(~;qmww
zl#l3*Q9zJfD!#k9o8BC38Z9t!u02St{-qyCHP6UTQhczKl!Kb4$bRNib(wu{cocTh
z!}smO4&Li_eRRJ7{&RY=#;d5NY$c;o9?tR29bC<*09G9}Cbpqn*SOIqn6OjhHbaQP
zfC2%_fv=<n@?);jhsma~fLe4(?{|<Jv(nxV#^=$ukUU(TTfrs=fnqr&iz%mHyJ;SD
zFdhEJVMl%mb;m_3pQZo88+fGeGheiDXKa7ht)i%l-ym2GcA2__V$NPHazjbi%}#uc
zzSVWPA(>ar4bJzCk!!bM<2x=dz!oO}kkbviQ`8a!Uuqq>xCRHnI-rp<H+~RxzxsM4
zE8!qgprKFiTo<;nrRhXkxSz6k%KdL(0Bx1hNY#dAF`sx*ur6ZiFM}o>`Y^d}MKfAQ
zgEp-vt#I&#8vTkzyY%{N*G^`HTs`feN4_baKjb3VY4SYq$mXL~#-W=<a>?71PX_qe
zxUA6TfLX&|=>+T8Iz(v1#Y=65b18qcOz2EL)(M_eN|2w0ux~Qv0#r|?=87NEW*yF=
zOcMe52~!xxBOPMJ1)68X@wp7Bppnb$VHB`bumaWh!$#(#y~z*Cf{#KY5*|nB9+o=1
zUJL;oAMC<9AZUp((>%U0*<+zrd@rxdMhll%fgZ5{1OfDekFbl?6_NL_qic&xihz1`
zWc`wT%iHC=kLksQ7oCH7n|Rh#M!!Q0Vcx5g`shBl8Q#x;ie?S(XSe@&<?us-e%7&x
zT=FF#Da0J;y}thk3C6J<$1F(D>>85eN0b0-n;zE|-6SAreXLRyj7#GUr+*5VV$vKs
z&#F>p&aPQSw;h_gQ<7a<Wr{XvRt|ou`Pg}TcQb(QT&)PFmwg)C796B%E(+*ezZ`2_
zL%m-BU6;>76`6!HP{<v+qL1DHZV~{tJABChGiNkQzz$yBr3FaqMyyJEnMN!}WHwOu
zhtKA&9^yh*0e2k$`N@$j3H`%l2Y5EB@NsM7v3B&4uItP+{o8dR#w6#uU*i=+N2loY
zy*@E)>9BFFS#?a?im<xJk=MqyJ&z>KbB!=%6)Klq(#zU{GUN1zTtszmN<@O=$95LG
zyKM5(ZZzO@uP>K7l6?U%swZTlZLKuy=e!Uuv5_j?@C4v2TKKB}4!W)ZlsHd2^=9h6
z=4q22D5e~&ea$r<^mz@iuXO=9_10Mh#9}<4JxMc5jc;VXtXvumD1%IjO|}4a$hXlK
zato_Q+IRURj(tTn9ZXLD*%^hRLo4{KC~NIydvF@~#jN0Yiw-elI1NF@oW={Dx&S6E
zy8n2)Wv$p`dV99?9>-(iBiw0TSwr7wqQ{0f42myuWFS|WuPb_p{#a}T>0G$4@a7FK
z&{JIpoG%_;H4XS?XQfbK6E|q=I8`Z}gs2BR2%eQ&r~@Vq*54sSo&byHOu4(HiB6^9
z7CK)|VETYvWq_tBzbLjwUDd<7o~QK@1}v0JY<CU*G`~H`w*>=We0!D`<0Yn;2pR!h
zE@!&Q2aTEDw!8=g>`9CV)fv%tp0ZuCD8w@n=y?Ux!!j6FVoG=Lk99|Gqiimh1zt;$
z-`X>u19Vxbay|E=@iEaL(v%YTA7%o8?F7ZM2Q)z3!9k({T@WwuI*x5yf#XCQzc5xH
zGroMa#IMT0DLR5t14BM_8}{>qK6u}{I>3vSONPV%sBk5$Bnm=b%w{M#eRdmgd~=>&
z!@?&b;*!MYM8-zJ61FR!Elm~eLBT4-31dQ$j*_0l)|yj=1t55;Q%sCI+o^f%mHI4o
z{O%vEeS)b8LF!z$Zm-mPtogFV6q_QhMl76=3rhER9mKebXC^zpRdbzlMl6KWc)pwF
zKhNbd(c(JH+~Iu>NLCU4@|$i-X;$Y{7($@D6!QLzS5ad`W!=#=32lULA7ZC{oZX^(
zWCit0W4(mwJUer>$AG0JZNL^_b9HLz&Mb?h`L9n73UvIeFGt-Iflu=7@n=cR8fE9;
zxel~0qN6`_KZ`WzCP-Rp^psonSPsSJlsnJ8KG;V}EZ`VUQ}11y20R}Y^3+B}8oEvV
zHaCrb4glKO(Sq>>?BdqcpF<9~K%U=XXR;kH76Uwl;s85|kE${-Jo}dF9r;0+Oa$-p
zfHo)~#RPDtpz&6E>zA&uf!JW}z2@`w?(0m@q3`rs>G(yNz@0!s;nu!BUP8aTmgr#!
zxTgb0P6KlDo}?^bEXK<Jx2#)4Xh1HRzE!r*a%^7!?oJg4PCCwEfX~ie-2NRsr}mA1
zxNy999i$?9Q4Mfa*#HEL_|t@>_>pj$Ia0T;zfw5@C?LJL|JRbiy$-2u`3-Q7E%zR}
zreErOHJnadn{f<C&u4+_KbyJy!(0H+YsLe9GAO^FP=IeNygA6`ZzXq!@8V^Q?b|7R
zh{IVPIiF^XNoEwT#u+&9sH$hegWj)K<M)0zSrQ4zRfp!SYM_9jSPoztBI!r42V87f
z!s!yE?r8$6`Y~|*XEO>5T8a+!8h&*&4lsB+Hf;dzsc%WVf_2aEqjNK66KwR0_V=;n
zPVe*{aR96mXg@t0->dQFJoEa8Im><D^MC;ZN^5x5I2!juM>eTIDltzJrSav4_+k$U
zsi_51ok10KU8!>b*2<oCx}=N0V_4^q&p+*ezDA(NlK&0b?)gu~A}9YkMZ+FB=It&c
zWqjv_lyM7S4**}Fp`xcxc#ehBPlEYM9Rr8ovP=M`N*sn17@QQ;Q07l3A80ASFS3zS
zRFrM6uTIc-_~ogF#k&}|-sf}b77xnrO<KIOwu;YI*U^1OrMk`JVH=6bI0dXq2{9lV
zL&o8h=L5%xKK*X~)8hd%>MYodT^G(V6<Et^9m~e&apJnb!J+yiWd1BZu7A9y8cKE!
zrfD+tjWQn}&kP1!yt-+ulHS7HlW1pxnrTd{|LQ*{Z$@)o-t5(_Kh3NE4YgDI$?W}J
zbnpu?#e)y9kkFoOW)=#X#RQ2~(a}A#S`MCN*`^4^j@;sH3Va5CNyj{W9o6BILQU7F
zo;i_`;tBtz_F)hoKy+eathIX^P(R5?Arno9?CChx=fbbtnxkuxRrkDdg^4!&Bv+{x
zaNSD!6AAy{e98D|7%E!~G@JYn7P2G6T{(VHg*u|Cma5n5roX*+83?@VU_KskbE_E<
zta?Bu@hEwdzwK@naf^opL%{=$ILbZT_{@|J=)l)A0Fuij_vFq@zXH~NNG+Nddi0c)
zN7-5=&jNT&G{JPmKEp!6bm|xH&IX0H@c&^h{O^STv+!(}VrHTzepFAhKTU!B{^piZ
zC8t>o*PUmrwN9<|R8MvM^oiikHLBM`N`v$+AuvFc9s}J!9D2k0STTE3&VT4sQ!vfk
zY5_v&e#__Uj}{6_nj}YcQXJI0?#`-ZDhJagFbC6JWQ_YiGTpy!hW~pI=U>jiamC#-
z<3{Gbl`v(W;Vad%PPhwp+;TcWq!r^U7C(ziSQaQMhh(|!v=GAq@?OaW`|l?pbd6NX
zb(WLP(P!(kFkaLw;@V7{)Mt0f=P{zUPw~J^964FainS|)ti?XEy_jg)Z3-n@>gGwK
zf;QhZ(-=-kfoFp(|K8gYjrroir&ny`I{HE{nJ*YhIq0y-R6V!%BaWjjfO9NF*Yn~p
zrCZG^+QUBHiSq2~EJSopzl|-<zX)ge76vs_@e;)x26uR^)xk0jyBHX2t5j&tswbb^
zGXUIHt^y`XQtyGAtKw4ipLibqsG4Tx91zLF&A))CzS~v*I{^*9Ia?Xj;IPV}?A(4q
zFR7PqYPKkuNt*5szd-)gnHj^aqS)2CwYU=8*q*;H$ASvWhPoXsajjTWpFBunX@VB<
zHhK388L8c=w$~SU6a^glH^>(iKq3e*uq^khe5RXYV{b8_WupE3w-^2pL)w^Q4V=^~
zRne7`Xd(zWXi4i8v5W(ExU+zu;-}frXK|1(BeR>ElZf|Ls`(iWsz($$&ZUrXwrQs=
za#-;t#NlSfTc~fpDIGJg$6m9_NS-<9wf(`P;Cdf8_Q}wRz|@y_wj`5g=0Y&tk6A<D
z)|CI&H#x_U_RDSnN;O`g@|!lDUU++2JO(&cB-xTmA(dF4Z2?h_*1q+R+pzF&eH&xz
zhy(IPV=xA42t<?iV$!HO317tRBS`C|gdvBaOPt6HYoR42p2?EwugXsWZb0qyr!4@}
zCHrq<OsrfnAxv!YyMji|yLm#c%`+|^LCjny`T3ojC9gU+|1>-Q=i>EWle1vt-DVp#
z;t>%uN*S;j>A!}BL7Nu(QuWH;;P>8w#BK~PUjuI1=>RwndI9)9Pg*JW4<ANOa|~+o
zJM(QlWS2KfKKnQFX7dXFta}b|EySr<)vDhpR#Z>C>+}50Jg=kVZ1}>AJ$)WKq_Ox#
z#i`}9XN9zn1c1}H<66VmdOlwdqoUwKW@=W->Wr~V^B(>)Y{7KFDfFx_1%d0b)*szt
z{x@MePch54&@~OwMFnAK5tGQM8$6e|&a%xmG+*g!7H;bK?efx#m!7ruygH1Ym0$nl
z-$^NH)wC_NCymZrV=@Y#0EI9yeDiD$@@x9v-vYc4{r|L)oS@Z?3BrPIJX7Zru2b7G
zdpjb36L_#6#}8)lH}d`o8qH=2WDutC#pkXkv@~TjG^g)6Tp3@aXQg)qHnP7J6d*_P
zXPyB5s$6_CO%IT>PKT)fAD!s`R?xtPbCT<1WB%Wb01yl28)~y^vtWV0xh8=X`&f+z
z$OTR!e>ckm{^qo&&dQ(l)?xme`zG)}=br>M2REl`{M{@KxZnrT0`C|7oR;Y(J8+#5
z{39muZ@cq}VEVuKfbS&tzajb0rObar^53uIzlrNV75xAGO8$TTmBa!?#JEYEsVi0$
zRWE|+!UU3x34!nduUB8(^h{jpo|o(dajCk#%+-d8LDS{WE%JO1tY=>6PSz<#P*O@0
z$&*$}&-QLEDhSn#6q@MoEGRt6?Mo5^am!yOco+UvxBY(2V!g8^Rz~yU0ck-!AC;NR
zb##yzBb{jM8*b#>a<D_hKzoE>fv;8p;NXR0U0qNzWpdIJL&4p3gyD{M7j}9iWY&mE
z_@CUO3)(L~i_nIUyb`mCe@T*x=ard2NBcTj9d-NJr!B`S^%l-xp`3C~@m8?43&_BU
zlfdTuB-k1)EKH8<&QNJ+RPjnlOBPE_a}LBBD36*D{Ob}qga6fh{Tt~eCi5R#=SyJQ
zjJto5>t)%3*wC-KCzcqBQ;uuj`z&3dh9iQZQ-U!2Bfqr(O1pSI@$qS#GJ9T_TCP^|
z!e+x}jFwf}RbaM}%moTmUJuo~Y5K78m86l)aCVhFisDi$a&>&=z}}czY~jMuTxESr
zGwbz*yJJ?NoqY_Bw=kA6Bn*`zWbC(>_&_ruG$)xb^|B6s5fanf8m%l23n)X<^Y*43
zew^Gy4tPB#|AM@mel*}XpwVZ`mV$R%LWrr5Sef+`FXU;fadx3iYo71<x$k$L6E>J~
zi+-&T5(uw<9IugqL(k5AwfMo_<|fi3b5Ig%S6rvzxq0}kX|jg;oagWhmu3lWSW_aF
zDCea4H1mZrL{=q3N4Z1-zM&Z+SJEJhIHHhv%gwPoyXoLHH)Y&(<FhS-;bI6I=pxIL
zNUQLr^w?p{4HYMH<mymWNZQ;H`C-TchqR5blIKP^R-jDc59M31`?cfpE0XVj%CD2R
zC##TBJ5M%N(N*EYY6bA((-`AHBfYP=kZ{KPPy87wh0qZpq)sq!&?Z)1Uu=(ebS8Ts
z_zmpxZQsU*POMZF9n%q=!QO1Vo$N^zX$DJ=T+#Y^=&_Kjo6(#W9%t3L?7}|pnmcal
z71_9bD9>)ajYCkoksI}$_4w4-87~b^%V(m_d>PuJiT$?+h-Ky-Io^{ZT`Bx`Lob3k
z)eD4DQZ$qCW3($u&fdL=Rg=tWgI?`G%XHoAf|$gif2b(ic+u4jl=4a=B-XY_zvk(b
z$0=UxFV79X870RK=gdoGM<x>d)ahOaQWo`A(0(z6nA%Bnn^J&P3u+;LsI_r-NUJv;
z@$!(>_i76G^^byq8p@`L>vkx5_QuRm);*{qOGiUatDDLq5yaYFiF+xh5sm#eem)v2
ztjj(lUX_u@h_~%x@8eX$<xbP&<zcGCc>Qmv9G;0%)cHV>CHgjf-8Hh5C5>ub|IC=U
zib+<i4A3a9|1G(j?gi1JV@6QkAkJJ?d{zzJ4{wlP8u;he<O(UD4iK<hZq5))TKyIm
znWs&Dv$KdUnHlx}Q;);{;U9&2EKs=fpQB~kY})m#>+3pYmRL}{cSbC;=UIwNGlFIx
zg=<RG7+ph!^~4~h@;)Wf%9%Lz!(A$L%gJ9MQVSm6#?(z?aQ?|E=Gn{6C+50?LqJLc
zt*x%V+c2u5m3j@b{uce~Hfhd!vJOV3{i;fd$zb(g!CVUcv5^Ir{5V;vuI4=1COx3G
zfUaM1=pB7%ELQPmAlmSHPI~gU-Q57o?cv39w{t3=3RclF{a&eT?=s3#*}`8D@phX0
zU?l0Ab0NY?Qx&UJobx<%^)~VH7~|1gh;J&{exmY0hWDYq6!&U$LSO3Ro{L~wUAv`o
z0lfF02}W^VJ#0uc(yw|0uUr|F$uuat7TV{`O(S~kWvS1ar_ETo1HFuS$<B0zgO<5>
zt%`NR2Ln7$ME#Kbv}$XSCJ;+3ClJeNk4NR==z+MV2y}*=@t&M~U3ReKj4x|UXaoja
z{6ilH1t74MpcP}@uCtPd#=MHn$WoqFGY;vI+<S8R6^{45i*$)c6aMi<lHS=W+~c)b
zq7k#z$#OOJlR^FomSX1nM;~<Do2vue)|zW$+yk5#zXW1IojGH;nPw)R5G3y1;ULJe
zR}hygbYIb$mZ>pXv$-ww(n4IQ6L@>&>Hb;?qRY{0+SDOQ!nxJMwHS#U7wgI?@LB`-
zA_r0n!<yo<5zo%cXDWSvUY4f(ydY)8N6C$#JoLWjlgaN%zD<KlpC6&p4!@ZR`XscV
z&1iK+gUIB-7uoK!@-a8Jg-e__WDYF*IZKk~ZKJ0+JW|{ISrskXBl}5e5lUYkd{6h-
z95h%3Jx4Ye(8)|UXFsN6V%%F1Vbi^dn+bcPda!_$NV`dg=*+ofdQ<K~ExG|xG}1u5
zm8{~GRnw$B!2(Z7IAY7Y1g(8-CF2e4k+q>%G&qmyR2D;``=1rLKESE&9TGOl4+CA$
zh!mMNo`lEaFN#KQjD|1`&npN&QO*#Oa6cvZo2(3mN$Wb+O-d<$%1A(C#k8BdDNYEv
zJ6?(lT9ks~t&B3+F}t(suJCzN9)<fKFA6WrXmb*)K7;DcT&)kLjIl1yj0!!$0aULT
zxGB!9e^H}ueK-OP2`DOPIWyq7B7hS&Evk5$2z;CMyI&{|4`8#R=I?t{LN}!&I-+3w
z=BCLDrlCH6O1Ecj9!I(F`v0U``947akO^oFJF|S1nAkAzeDGmVpth|e*vc`{vj`R=
z7`f_m$zy%kFhSgKC7n&?+(2{ila9{Lo_TKh%sYIzn`t&29@2e2D<r%7@$px4A|>fr
zzajEm+6Dt%P4izbwbc`rd0m_=siIvQXH3f-4``7|--90<+J}nJk=&&sqc?pW)-iQ{
z(IdrkS2(W4HV517m<qUAfnB{`(K7M`G*&^X*&SX&-KOZB%;MhMt!sGsEHl{AUT$yo
zEHk9WufG98W$v>te>I9iKOC|y_t?h)@@Jzu*Y3mkh{nhY-hiECY2S5WSYPFwS8qf}
zBlc@#g`)i(+xR_iZQr78?~LD;7YDGykPJ7Ajq(Gu4ryy1lB2#mMiWU=v<Q-QZfJEc
zG$Lmx@7l}ZJSpr&FkA7y6zMJTjN5j_XD&<rRDw;n{qR~!d3C1}%^Sw5J~|b>Zy`K{
zn`zXKgHOJb4!JYQWGhgE3c?RH>P$!K9C9vhc944$0IhkTR|Zg5A!`$%rBU}|Kex<e
z{OO#C;61V9h>-!j>>rpJ5V1>r$%1-Df%$c|??oQhA0$g!#){$K*MVV<%xNYzUI87e
zUhN-dV6ZcX_$lhRloL=}rMbk$aR?ULs>ac??mN@>?yVmdjucWd^?9PRPB9YKj;(BO
zlh!7^KJ+G2J)3X0iaoaZs%6W-+J;<dCF-TTpFqC)PD>(j7d};)u9!stUZjO?+(eU}
zcj`!sg=M{?f+QbmMnBHM+cd)-sh$BXP9MqF9~}t?(#a-sVKPJ`p+qo@jh9(|si@|!
zTkx2f3x_7d#5lujo8^rWijCC5M@PSf<)^~We#ADU)<UbDkk2^e{5#i)B;LR;A78}L
zR;-7_3mY4ma1D>&)L2oeBy!p-0_90#MxNO?XHU7eDuiWqG(mgAFd6ySaX-CD+w<cO
zs%73jB@C8^ZQotrHw|HAwkeG<ToQkI6W9(tt>VZdH+h^IRna3zx8W?X^vOPi^<e9d
z9Jj_RAlos&=LC8EkJ-YXn{?I#a`)uA(TPgNCE6@2!)1}l#--Nz?rSoG#_d9X7&WLd
zUOI+V7>{9<Z+Xo$V4_j>1l%=IiodxIyBH4(RJ@_&xtY)(S$gy@F91CuNaB1)w4qh{
zkwxLX3(MXFOPuHx!U^0>LjlDmSLp|w%bM{wM5Z*g{nT(%<Q#i%XhC6sllkC#UOx=+
zVpC7*RN!Q{%o1;*-SZ*~-(C~{?FX(~vjaQZLa?6RnkCX+Pz5myU)9npCWmnkS$<jV
z=mb~SK|8-U-5)dF*sa@WjRq^4z(Sdo&E<@&KQ7#D7kSrcuwf|=C9IX(w{u+C`MGR?
z%h|k<&`h%t`m#wYKL(p6`nnD>HTd+0_qn<bpI^oBLlL1xBF$u@N9yv#@|5$XVrv{$
z$q~{1{MgR|oU;7ZYg&X&iG>wdyvbZDo?5CT|FA~5Me_PYmC$nW9?3D<JYf65C1ABx
z^mjY1+L_yaFDoEIN$GCIsF2NZlYPomPBsbY^?2^Qy71tJ;#{uI)D8BV&U{5_(u@8p
zvF(kCsS28JgbnN8{Z)r`tkBZ&Bwo2S-GGK(n`kI`eIOYNj6{&9y$-so-o$a1Aas8y
zdn2X;up2wb;E?hmpK+T3XRsVExQ;xQn&Y@(>*|PB-Wi*IQ0^aZMIBmiMHCaZaOfPk
ze%dg4bxrqXjGHS~Hoq(4OEEtH3Gaf^CWxkbtGk8ztd;jU<)363+1N~GhZ}8td&rC5
zx$k57`>zU^8Pwhwp;d`3O`wE4>g06l$LmJqW{s06%fI6C`oFxo{>zuhjtj5SCNPp&
z#)kDO8hf=@eKw(mECm=@m23|mjq->4xN)c|JY7c_CPcLx^&$J+4K2?}U%zY#7K}&~
z($cQpR>~MaviEWH#6^Q_wKsxxy;5D{ZJCt76<Qb-pr4XM9?mq>jL^||RE-}^E$#|v
zCft0J&RNO+<aY1dvg=H#H@OWSU@W6+R?n6b-jzutA+R=~qjuw(YXswaV=UFzV!b|6
zJ%KK32LtP0b1U_kQCi~8hGN7Frr3Kg6^i%#3&H<)d|xu*xF{q>92bQu^sLq*vt1>P
z{Nu)cRUU8D<ED~wBFm9zZ&909k~(FKtP^nWd)#+*gzQc&KK@8C$1h)E^5tAQs@XO|
zUB*tmC0dUkMqt5SzXsrK_EWj{^j4<wiy-C&4UmoCDW}1Row3FTo7ZsI4ntkPyszm=
zs%}wdxD+L)`XucG{QNDsebvJFK3IhdIIC4~SbK&z3rvmlOr6M&ly=<uKy9jeT4g?t
zrV-Ab@%5xjAp8bV8+X51Z2QfOs=}sPEA$XqG^BDQh-81ZrB|=N7GPS*vKk^iQ>AbY
zE0a!-Ck|V5bAhr_Md3wYX5*gMua&5(5vSp2s^s<4u)Z0u2*x*GZko<Cmh^*gMleOi
zuef?~?T~}tIX!e^42GF^nAkfGa?eLE&2ZYo>h0$Ybr!ls#pMbLMr;@8wKmvZ$gI1v
zPzEt#Vv6f(A&(3hi%M{g;8(?w`#QM@o4}swk3)>CwWxHU^SwfxNoOP2$a#~Zb&Ac~
zqFn<MD|=0A@0)Nfu7EcXu#{0A>0q{cBOC^<T^(#4vVTOpVvE*(TGCNp@whIC7z%el
zm>7T45P&=xUlK!on~d97A9YFAj>dlB7>J9^xg)c=b*0{jYT{DEuAE2Ye;$tAwXljC
zyh@|-1#hu%($ik4Q{wsik0t|Nf3c*ExUNsQ2tO_UI55c5LRdrC&!@D<N<Ct&cnOmV
zK;ON<@*auUwK>=wXnj_wwfN)(UBaV7?QP7h9K=%!$ql>li8V46B!&VVwf$d-_u_Hl
zT>|Fi$=^I?oAKku*L8%V64obGR6Z5y>?V)6ETvXjb8mx;esReU_Nm8hN+-M%ol^V8
z@}TQN-_5PDPvP0{_Koa(M=7g*dx=;U&YDhO&&TU8^-l!TrSObHp^hrV-Lei;=a>U;
zUBwd8VR~2p^4uq=x!$`}%L!Y}OTAw-#hV7x5QO4Ulj`l8Wxzro3*Y`47OD~n6wJ~a
z<+-NSnx)uhejh+jHs&%TLp?*h`3EdZPki|T{OBobFavk-Cr+6W&dRUz;0{S`w{h)(
zPV(ZW6pIxLPr$P#(*I-ct>2>T+Vyb}1(i|}krEXF5d@_>M7ora4(V<fX%GdJ5<$AV
zyI}xDKsu$Fp@*S{93<zv#>eN~@7~+z-QPdp^8?4h!2!d4uejEAo!5Du>kOacTgS+I
zqn<RlOS!@x%`N_1Iw8I+PWx2b)@25Q5Sz^=?Mku3mM{8^ttsO!>&Ur2h^6ucIFm=v
zWyo<<cF*Yg&2Dm!H<jK$w;Ai2yTmt(GtMeKZq`^%O?2L_U|JOB#BH^ynV}x=7anc#
z`-oru(t4_PdaC;<&y2sjem||hf3nAH$eTRiICN*?L3`XAMf9gmQpva?It%+BcZr;D
z;XKmcJk_!su`$eEIFxc1WP~=2cqZ>1zcTY1T&S|1c`<4?T^PyqFhWo%{_ZUFGXa$1
z)2h(WQ(=su`oKb8Jogukl`c2MbMgl;f6rBm(!OjixkflH(fJXB7V~bj0&}B}*>EA(
z+#9n!lo_f>!<;xxjGXcusRckF3{f0lwV<2Uk#cNx<HpiMCP&`G2h<n;JrMm4PIndv
zuuT~fY*S{4ALJ>gd6@6~Un%IcJVb9}*50btHy3hx)>i9yD0n-y$8$G5U8=u3ysaHW
z55kkVo$#rY8)gV<g>MHU6fXX{o`Jhft7Ib!hgm;|(9b>Ej^n*`>!G&|9jhZn;Vf=u
z?*!IPD{=9i=W5_yY~uRVbn%WnITf@UG(R(kJ*J5ye;&r@XUVt4!!}%=dTg8U(?#~P
zZ)oNUJ*+bCT4QrvM{A<`8WEhg-W~@!*63BHOcIm^E>OxH4pOw=8+qMcw%!kGSM;N?
z@=t(@V2}XH+H)J6#lfU66j-rIJc__0t~8&N))E>VX(%}C``P9n05uNK9N7C7F08DS
zY&+32WuJjWOu6i2`lD?Z<;RKU>vdEl!f*4u;B08=jKsvQ;|kR~f2`>5GvOY-T`>9D
zE~jA3NrcT#uL5=|-n<LB+1T5&dX<_#M6z_}Fif|TIA@mo4YCYXn<HO3lX+CWx0q=$
zi)z{p^R>Foog2fm`>Y|%??8)(cliR|1uH>kT>R-I+rwFLx4A3_MI*Rk-ATDz)~Y{Q
zrbQ$k3?b8z$)+=ZRw@+hqTgR>c{iM^7_~X-8J4hB@7C^lQ}T(?fp8e7@7?juDlz5Z
z*J}q$-v=|4zaih#%E=V9;53X?B&!b|-wrXqMRrVyMIFu2WHsikjobq{F9*w3s{$*c
z?H7JDbkulcTZw*b(w^4^CEdG*_Sb?+c8We~w)W@wH<XL|=$LL7KZr-jP<^G%*PTgx
zV|sZ&{s|f$y2CFXvj<^UT)BE#>kM?H86!o1_@+JOukz8N9N85lKSui?F2r*=oE7io
zUS<&J@BHAn`2EEM6v0fYn$hh4<%4&Jh$o!XIu)m|hP;VQgDb^^)<$p1D+Ts4x3a(f
zImfnp&f7_!LSX;%eo=s8?a4UtA6E422)50*f@OAmiuS|JlD+XcCcvZJeH7M5d1Dq%
zr-2!CotU!w5Jq3(hpSYDyfIk24A!y+r*I^w<e2!+>Z7I4<F9j0x!aHxjB*%x9j}kX
zA*a)-Mtr^xe=i|=-nLmlJ&<aOPrM@HtzJCQ;=_|2;W|Qq3+)b$DY`dFAgEL3f#I?p
zm8}+77)j|;{wrTrkPkdL4Hs7)vUngJYIrcBX2lhbJ$mnqY;$ciqVJ7e2P6+uv<7N#
zxhI~hV1hxl^uy_irO|uh%cTcvUZzwBBn@IZRJMD^R`?gqg=hkdlQ?Yas7BJo!_4u5
z?b{T^ij5N2G!SJsA)aVy_s1RXA&b@BmlSOmJ~kCxfoXHs$?a&`;S={HH#~PgAn6H7
z!_f?0mfy!C386TMUl~WveLw?4_f1YdMu@G70#$M4oD#08;iJi8Ucd!;R#E{#B!#Q$
zEXPB>ctq9%*VnGzs<#oObaxRsYa@ysToQozFuANUUc7QRM#P0VD#%z2o3edU;KGYf
zGkTXxu6tSGS)kG&08VWO*KcZZ@~&=YhsQ!X!$oN9y)l&W$JsdElM6b*+^lew^7Obc
z1TAtq@vE*rfD>qJm*0Ky>alx^rvpW0F8MU7S>t%4>m-i_k#G|JD!ZlAje%J?BL1!@
zBw-4n+7YBZXG(~ili3e_0^#69qKtZ1Nj?zoUMn<bh+|CNy!F_*lb&4vz8v}MH)DH0
zA>_L!FiY+aVyE>9>x7iPsT3L0@~X7f8q24lP}CVEPIK^=FxnD`Y^hg{ah!m>xa|2%
zWk=8IKixYQ)QnB;vax-43ku#;i<6QDw51bwJh9&JSA6Cpk{W)`me}o*i=6rR1tr}e
z+!~CIs4uot6?5buM4BqS`Y3OeIqVzqtrf1DI+RAWxX!kuzRED3q)JwuLVG*A?+Z9B
zO*;ueYa->6iuQ;3?L|EjtoqR!U46O@NqRfUm7`_Ww3bv2khIZ3UlJMtzGV7GxcFKk
zKXl^xpv_e)8vFdFUb%*5J(r^I!ECR>8(kVWttPlviaB|u{ohuyXqC&?JEO=elN%l<
z`{CO9*WwA8mrPVXpy*`E^243X%?`Et@<GVeofE3w?*y}uN;L3`G8L*TQGG)3WMp^U
z!pPjotZ+x8yCK-LQ-WO2fIHmf65$N*Z6fH|m;p(D+8U)0I?8je)9mcW*FGzTcrH}m
zE;>GptIcEF|7THUg_yaeyTXf-Hk(@Kf&*H?r?A&f#X6Cghj9W{pERkvoz^zlrp??1
zbL<gRB?uWGd@c<YswJ-1ce3b55i+>rdR~VTD5n*l+wqT5M_a=W+0cCeJ<?6}%ds8s
z#jCe)z+LGH*$rf6Q%kE?awYbNy)z>PIuP<MLM2Zj^d@!_m4~<%+o~QFeZ<t}(<jKF
zfbkDw0&URf*Iumg9KD1hk<pqS^Dd9p@&6EZTIjF{MWpEOu(PJlx|97RT<W3DTKSM5
zI9HL;Iw&6n{2~j_sta;$Hu%JxPLvJY0-<_ex_X!vvRXpN64dBA<Ud|6Q6PHR+rUzU
zi{HrjDU9K|kiEgl$}8Ai61-oi#s!k6gW84%)m2nG(^DoqLH%)<>b-S=Z@Npnd9C+W
zwk~N^;;2xuw|;(ok=Wem$E3+_ZyIMpfawqE;7_omk#9Bz!C5$?y}YSJ$NXoITt_EA
zaO2q8LXTxHrM+Dq{!=xD&r8FM%`7$3&KVOBmQduT%u@5}l{n1unkjb{4%4>fic5bl
zao>Q+TvN;@_ZMN8@8=YTOO{mkIjh4hnn6-?chjw2Tppx~c|UUFZufV(TtZWz5KQAw
z3^h#!BzFWYOcRBL_+>z~1{K3~563tLly-fhuTb)DHmyTWRy13W*R~->)=_y4hQ0Nn
zJ30qVu$FVZl8<vyyI>S5VIb-3Gzw=lc{((AwLOg5+VvGav3wG*q;11K17xh+=D1@h
zQ^JY^#5!})B)rjg%;>u8y`<}#yk&(IxR-*XT>}L99PdZZloI_3w&1^x&7MsGK`1WM
zWY#x~s(`2}B8<u^$+bMvBFUk}CTN)S$CKt(vflbsqi`!ML_27W<NBV{UKHanMFYH6
zqj4c{EYqkdWs0Y0D_g2q724!^Jaf=Qrpy}?O@Yt3RBpO8u=4|E_ci<ZXfjM4(L6MA
zdU_y|X?$pDI(bSrgtx8rgIO-TI9YY9(}ZuptAp8o_A9|o+$%-r6pFjpN`IuoOFzqW
z)|VzKQi}-c{^*NraU!3|X}(1EHTJC5L_*pT?XJ&E7Q`7}*e7{ut=^l7mt-G~8PL|;
zAETNoLSXU^EV?~Vuc^!!72L!F!aXONwWbjp=Q2Qw^(m0D>TySD=pIZhA6;tE*mzcN
zWsKfaS4diX^U_dg0$_%7#ckE)ROPKUk&|obUdhg{6Vw#Z_jv?bzW9sCm7Iz9!b7K>
ze(>uG2+@7sWJ3_K#4Z{a4W(YM87Y1t!TGWM(Odwu%%{7uX-3q$Z7GJowNRd;p$r#)
zkLIznsM0P(Ll>6jqyzwb|2#8%;wYa|#erA(@@<&2AcR00%uX<SqXp+w!1qko_syUB
zm}S4{Pd>lGFd1)Z=%=IbRxRa>YfK;*vNo+ebu*ijm*d-!@vt_76o9O?J>=H?wqTeM
zHvoix1fLBnh8E=oa$R%~l+(f^w$`f|G4ouJF6q8KH8Im}YkhgFLNkzJuwF|MERUJz
zr$~fAruPElw2DYp3UWr~iK4`;uNQSvH5I~Hn5&zkNGmApZgE?)-;>D&TL5|h7Ng}*
zJY22Pvohg$BwStGuD`fHetT*r2@7eB*o+HibM7io{)luf5`vSR+BDUuX5Anmol91)
zRXP?*`=UizxpZ^G?+i5TeiHh>DE|p%Uw!A7{Q=ECR<^kCcfuy5G#7SlquxA)@fh`F
zQd)P}Ps?#<u`@N$=6OlAvn8tYenx*jF;#m1o14ebf@b}9a?`Xs$FsE40{}(9wrwWD
zPX*>N5H;Nxq2su83f1-bCMA~%n|HEP1#c8Pc9X8}onzAAwVJ$8w|!*Qd;4Bp^bP6{
z3V$M7DMnxq#eu(PL#Um*aA$9157VKswr7|u-`(QZ=(ZcXowmQomGJdI<mA@23%0j(
zM0jgcMdSr8{uP*auvyPGN8eT*OxhH*X+<WY4kFeWHE28v=fqm|K3Ui`k`-$8bPuuH
z8w|(Of1>NqT%IQ372=yIOO9-a)%QMBpcF=DDseTuVi3Y3Ug@+2m7I)Cl0@a0<%DdN
zS06^T*Z2ZsO&T*72XStV2X#_YgN9p5fPrqbmPBCTKpOL&mrkL)iCzAVdANG73>@Ae
zvruBvw(2s3o<L;Gyi+=T&AHbk=oob4k@EKj{odm3+(>p^A9W+9f+XK2r=%9)M{7K`
z(ZH3ny*weehRG8m7WWu^v0?^`mA@}nYu#+M<vcq|I90ByHsg&drIM&)2dHkXTu{gE
z4O>iEVKCaQ9QOc^km4?fsoQyZaT)<tuPMX7`|_@@qNkd>0qVgdu6Jvr2xZzabg>g!
zvv;88V^;NSM>zCAppBY0%*Wif1n&rs;C9Hut8ubFguWIgED`Q%0v4Jo0+rK^^{6e#
zv<ky=05P@?1~M80eQm)v_pWo<r|Kn94rLipp@f1>?`0v|TWPHR&SccSas>rWN!7Zz
z;=T)eU&xeY^yt(B^0|xTwY!iNZZLP{TV?`y{5>qqBJX<Vc=sIo^EJwEW32iH0XQ<<
zlHnn<i`*+xLjy|~dCx|ZD$OXJ`qvv=#T0Cn-yEqcUJ?3CyUXDWI!|eVLOEu{<6Go;
zkpSIJY@?wSGLk#>tZDk#g{5KJ)`-VeGC@lZ*U+?4SkcyA8QowqHxJ3O3P0Pl9!UXt
zp5G<gyqAb;gHOhkB<k+K56eBbt(_ihyz(}SaC}8FRpca)r`=7ebG1l!oJN~@c!5td
zhx~EeCj^s$nS;jF?%l<v;Jqz1ORnog*9p~O@lRej*D^kGB4>%d?S+?M;jt2<Bz*dm
zQgCvJg=9bQv_S;4_>ep+5_Ufh##ldNq1|O#??s2h_249!%NglKRIM6A^UfztPizBV
z-gy0z`uwTlWk{jMXk9Do$*QsAgQP2(LWX>d)nfm}^!(R%(s9^L=KVYKoaJ6cB3DFK
zS4B443jhY>JJqUIBBjD=wYsDsmySmq_3(viWg1;Hmd0T5V{~|zCwimR2ApQ6h?GDD
zlBMVSRgk%m&V|KL9t6V_$Iy%v2!!UApuJgSGW~YUWUu!9riH|59GJKb$+*|}j1pI(
zuO&{m*K1Jj&9wL}zTwz><QWq}E7Vg;e*pb3!u`qJU0$d<+AMhk+>F#r-f4>CvOed+
zsV!B<Yg`&sm8Q;t?r~e-s$2O=(1<u38dqQX{9dJTw@kh#`7B=tqkrcO_qb*2MjneR
zu1$mDj0wQ5?~<U<Z%422S3`-#A}Hy>e#u=6*>}5A)f~kdzT{T!alqqIo@5Oxf3$AF
zqWf5dweIIr6|+%of=raCQhT;lNvB;CUHv?`mgh4&nN`3{coIdLQ4Flyc|z6>Tov2#
z-KGX+ybRZDl1=t1j)5d$z6FaP$;J(}_0BJz*HT_cn)eZAiW|GD>3r+rBmNVajUxq>
za)CdV1=5Vah&7k6#F|P%>er_~UO0Bx)WlY}*|i?;7$+!>#?dP*12PdytdPXZB3(A<
z5mD#^4lyl!;>M$$VC9u!fgXuMz@kXDJ<u7tc&K1e;-K*U<lAt6S2EkdQ4yKUNQ<8@
zfdV5zUr)3G4B{@i_OnfE(#4sw^yNjnmU54iHE4k*YS6gk9ykFhf0WSmS9^6O8aWDG
z;))a->$Ay%U|y9kCXwNcVfW(3osY!*`%#dX65`sh5xtMs66de+riRgXtCP~i2x^qU
z-$!_>SE`@ll66T7=kOezypwBOh{2!oDK)7-jXr=y0I69wpo}afe<Jf&3pUq0VBN@a
z4Skrs`TYs0@mDJqx=B`@EDcI`w#GXt=4@-zb^Y88qlMf_4g32RD}<1q=WDFcMZ-Zz
zr1lAw(#%qX_bSSDNtSH!8z4<3y4eL%=fGeo#JFjBQ&sEZb=s@k*0v>RMY!s$yW7J4
zwyB=K?iI3Tk@Qo>E<U%rCk%#e$tSL_OpP3N;7W!4ku+C7>9nWl@HusPFq7k*7LCH~
zX!0dRT!KF3SJ7UMgU-gEsCOpDm2^^Ih!RvAt;zVDSCmln6LF+x{0>hynO;0ufs5~Z
z?Ve52f8w%wSz+U->4jYmLP%bDRfneLQ+Jmq9+dk#1?*=(qAoJD%|(r0{6n-ArM>`2
z+RuJ54Z1-((=l0B!Qj@<pg|&jDh01WD3YE^nLp~>M>|5INBwZ!n<i(06v(;1N&Fe+
z+H`ZJ_24rtZac%93EMR&r*^oo<F_0w(5hsK=TIxIJz;k$Z12^29~P>xeF*@msvoAE
zYT^b1m}n3l!^<R|uPa~a0;q}IbFrJ<qKj(N`g=cEm;;gSc5P4XG8W3otTMe2w{Z~p
z$Y^jQDALQ@pX*-sOaI!LpIlaGPo%(ij!m}~8Oc&ns_4-YE#qSG;VvupLls^2H<44_
zJoFU!BV4K_BLG*w;bJdW3V}BCo%Z<rATu>TcR-VmlIn%+%p8c+s(m`Op5D4^0dJ2?
z_dH9_+VL#$>$D}!e<KiG&pkrU>d;KFE1)_f9W&MM?g))^Nr@*in9M9o|DvG9+1;8E
zUK1u)oqSFFxYH}^L)_`A-SfdAl6a)X+3P|FFSl$p0#tT{Y3x91kcnM0a>h29lw}Bd
za0k_>xB{nw#qz_fO1Dpoc3u|{3%k7Oy+6cvu|Zh(=Em*~YmqYkLlpBU0+}_3o2mN#
zo+;!gY0P(MpNi)grB}&wQkX~DC?04&b1#dzb1<W$(dC%m?|~YI;Mw7J4lY9}YU>re
zS>NJZpAMr(AReOyFcYNBGW_8V^QtA?JkUpQQArgA((bz9uRxSB!X6V@F|i7qTcWsE
zzmh>xwmoy+3g}g?O{ay9pp!q51QAP#|0&>q|M@GXi2sf$1H-W(qZpoo3DMgKYHk?c
z{P_b}rPU<QRCioFMQ;{HZCZui%YR;1e1e`r*}ClJg^FWap#9|qi4M~<4y#o;$oK>9
zpM_&_FBB~iUdPS5n%)OVHF7hPKRlz6@)nFmO<{vY5-NzZqXraTp<aX7O*UQI(FPyF
z^<jmFYVwphnp8hH_jktN>oJBB1Xvcvo($LNTt`Y5oq~2<f`^C-s9~030)p@~%t3Fo
z;pAw_4rVk-x_gr)f+(SSJovh|)-bhIya~^m?^)|%pRUIuF5>WH3Mp2Q*FS@hd-5iW
zwHXi|vo?mqgA?bvv-+#hzN6QBybh9~I7}V8%e{0-lU1MO<2Vl2<vCnykzFplAxa|f
zxe9N16Y81AmB}nDckAaY3??xtu0y3Ja_pI7t^~W@_Z;uAr17iA2EU>c$i;Bo_pl2+
zOuKj?#%fS<UP+ih_-$uLiYKdz+3WUa2YR4FS3njYs04FgvS=O1W1;wBG4tV~qvGat
zwplTr*}I3JoQn1r!OT}o(&V@3=Jt1k_-KNufp^!r^+#N9+uT1az8{19I-^vA5ReVc
zZ(8u5%KJX!J}11vxx7SMNQY&S7Q26UaVN^q-@8Dw0(t3iT}p*>R|5G-0+)LbRh+;l
zO0{(26Yh*lQ!zuMGGnXy!v&7niUiUz4aU}JpQM8^C&icNiIOkBtQ>TT99Eh1VpB*I
z)Wx>D25Aeu9lO_OAJo_`EGu=RNkkmX#Jv@%d7kb;#ve`29;cCxpgYpUm1hIidhMVd
z$&<5MB`*jj<{A?sncq7rZo4PHiOc%dIioKNfVlwi3gX%?PwJJtY{z(gI)+eo+z3r*
zT?>&iy6HMB`BY0P5IHc%zn*?PUV3C>2aRM@ik}@$YG}HFFfoJ4k#&8(*?S{Z!Us_>
zX2asq3^PNu%k$VM>rV=PzCoCQstXrBl1F>*hAuX*%0>#w1+qGJe<YXejzY?aJ>GOY
z;K)MVfQaPnyMY?AE1hq+XLJ8ptwyY3g#X6zpWr#(Hte2xgB3(!lcF=a?KM(KH!5@?
zwkd}9CLmmhJ_XO>nGPVnc0$hFg!k#<EQZqx3biU=Ir%f+5f%61;;K+KpI+Js9FGj$
zb}*78L|+cs$}{LS$9=wW6wVha+60}elm%gUMWm_!wO69c%`c2O{fTtAfnkJA?0zx%
z{l<uik>gv%<_5BDmiy<=Ydwr+qXWHYk{XKvm&xbZIP9)W>lfnWZ!J(XOz0&~SK?hX
zKYEQxC%O~P<vpJ8qQwU)Q1XR8yxN>}&%?||{cBcKwMW9*L5(-55{do6t+SNLpbViW
z8v%3}etryq806`cN?p+G3SPxb163f0_(H+`Ez*6WI5K{i;!EDXN^h2CBwi=`3Ut>8
zzX4!;TTsJ&ez#J?!;i;<sZ<*@O)gVXch_o}*EwOE<rEdmUA}kerYA~MTw7z%SBsSk
zUW^~jy;StDDa5AbDp@kYqv<%dgHeDZ+`Ul)qwZyZ)w@=cU|MkOvMw>KpZ-)ITR%5B
ztP^}TYWdLhbhAUN^2>|UjiK4W=xb(@1CXSq-LGUe7e*n&QYoG{i{l}>_mTj;g^?|c
zD?*uZMol&)$57%*w_NM72i0EDFabXWYpfL2ivF!>#tFEC*JfboEvo9W=7|iVto_JN
zo>USDn!{qXCl#^EDvuOsn^Cg#Y7!i}%<^ddGRwwDk<!522j#W#b@D#|dUsr~Fv1>I
z5+$?Nf^(oc$%o9O5>y?Y;^@&WP7%TE6zowvW=V~J7gd1Lp>DRBvtqMcTG$`pZc1hw
z+tfCfZ}QG=iUU)VI7TQ1!SvEmUS2l&Be$^-x)O{%O<_+0*F-`Xk49@!LvN`cG}CiJ
z*_8W}PwnW3c-v;Dz)?r^MBP*Fd(He7^&z)tJWwhJC+zb%rbMqzdLDDA226GTXd;H9
zl9GH>4`}tCu0{PO1{L2PbS`bdq2V{!VP=!4gz7S>&ianlEiIpCchnH!!!$Z=DD+gK
z8>e@^1P<j{p*}8jK`b$qoVn`VBP8THhWO8)eG1cs<T6c25wD?)RlXy7Jq?JBPp>Jk
zNjE%^4@|lgeKa}gqQltWV!769_$fJQPq5%+lgNrk*TuoK+b14HQ+~MblJF2%nyBi+
zCNF%m`slXZ&y~n)W}X9cdd{(wJZpj6H?W=GpbAjb4v25EK~nfU;eM?W6=dI(E6KOp
ze+2g)zwm%sp+mtf2c}8p)io(&X}Inm&>zFHD%Zw!qf4}?oK-w@4(*#w#CV9ypTh}`
zyg{lF!m?TaJSE=YDJo?qSbJ?1wMZgzcE2dujdfO&u!>DLSsHPp1i=)mE|@sKEr@)~
z0d0V=H)m`Lv|v2<lhP^pMvLH!&0S`C74GH%^h9{hfx>0X=2zp1-(QvCjt8imKpcL2
zHy>gVJrQ$edbZthm((+r!t?9r*NrM)H$<}5)|(s50}Au2j7aKbk#(g)f6Dw$unUXx
z*TQ1+!`);`g4pWi4Cdt`i*hXzM9%h{CU%$fAT9xCBkNb%f~OZUJD{VP$D<<$Q;8$J
zY3K3S_u3d{JM{rD&ZL{4JFM}sQzq&3y&E^z7F`DU#+(lzQD<)HUR+u!GwM6oV9o)T
zM2Pv{WnZn*LlWwi8=%*+)1*AwWAZeZ(~8+1p@My8eLYzDqXLP8)1as7e69T#y0hm;
ziT06A94_X!Xznq@mz$h6Fj&1a<$Iudauy4(P^z(h*h{<1nW*4lR82_9{V;x**Jf=M
zQtZ1+xPEA9_rbfhYOux{dEK!oQqA0-V-zZ2EzVN<-czyc_1j4XJ;gLM?S>=K>~ILp
z;jaE&pEI{{<Kh8?sQ>%)M}QJ{H=gsV{TlvMQV3Z}$DZu~T%k84we{F@nebZWtKre0
zenz2Yl^tH3Yu)6{ChVN%kH7hIQ3etFKl@XrBu$MKDx&CtP*KL6fVxyM6sw@TV|yM8
zPm=s7wnf)?^s6g(P*lXFCPnQAT%ndeOg4i1n<^vW4FwZovVl4F9!gepTJIgzmIl&9
zj6|MPKRf3)tak_6q{3OzdcwmPj2C7e#||!G1N^YzGjE*#61V>AyZiCj0v!_dZz@h{
zb3ZK0NH5(zB0jm^^)&n1!F2`m*c&=J?x0AtYJXO@Ia$!Fh7^KT9e2kTKUYb>9w`&9
z9ep#(HLrGK(XEnz!t8q`a}3fIH&NcHZ71(s?xkyLJ7UQwC%=YHo@L&o{?qz1yo_!6
z0}=AS{0scvlHYn#nKG@OA6wT)>%%`A0zU~_*}51teql&^);D`nuffx=E*7LU_e^MW
z$)?`%X@^ogk^Vpq?XZT=)g|w2?)-Ry3MK;hpWoh3#m--{6SMrqZb(y|*irKE0nHz|
z2Ty(hwIx{80(@bW!Yvkev5YZ30d-cVA{2{0J)leSJt`L9Vr7SdxLUuls&@M$M<1`a
zGqrQ?jjL95`_bnePpiga3vcX_KMHl>u?_@?@GZZ+BgH)Byf?;9<-{irD<4_(>!KU}
zWP|jv<yRW51JdY!lZ&Qbm$vi6eUT*i`A>l6U(5;KP;C9yIPq@}5B~Er`sZ6=+Vob@
zERHJ!Ddk3E$+^{8?0=Yqzj5nCe(dTj`nS3G!%_4vm<Ov{{ePO+|0h%a{~_lG3+#U=
z$LVMkm;aWqnW2G%ZLx%u@$2ZTr95(8vIEwBzPc>a{jN`p{e0{;?be6LmM<zkY1B_%
zUEHgy=f`|rK5|{3egr6<!9TTt9O?NcvziXTU~^b>PHewTnN)t*Umf}QQc2KM@fb^2
zt|v+`tCXAd{Kp-nNcu}a&iPwFF3F!*sL>QcxCs|pkK?i!)T*|@@LJQnOm_DhX@X$s
z-9>9~aHD#8Z1C`G1YqVS9uX`BU1lCweV;v)Zb9ed)%~(C0-faX%(*B@pfdW1<j3A9
z4bPklg^+DJMEC^*rLc}Rf3=kfE8^$&!p`%Io8^F3@!ru*2mhb8r|6qsfl~bM%{eq@
zY{@MgPQ#~Bsa_f_sgUC6j)#&BJWp{DrMwHv>jDWc3vkLp<K*j9_^nT2lKRU-xQBDS
zX|P~~(<CWlzw~!JM2Mr(dW+w09w{CF{>6%%?`rCLn?=WMVY=BbW*TO1C}xiC?%B^!
zV)ZdSpHB`EukyB^lk(YbAyi(QP+$4S2;sMajY)g=ezWAI10yFB8pWVmpZJ_iQ!1<`
zYnu|iTv;nvMniD_RvMuPYc-iC&IWUYI}8|1&gZ$I_Iex_dF8l^^;paj9Rm0Ufzyc;
zz|-^<lLh0-NtG6gHriJ;D-d#UF}BQYilnB%8k7W>#8y1?ryUbHx4GpWA8mIu&3ux`
zXHqoRw>7seP)n7sZ}3P|c&{8310aNu)bXL+!;U|Deu0+@k^!oJQSRR{IfRh2&iIV5
zZtqiYF9j*@M?c#{r~K_&$R?S3zJ}uMd^H7c%)-Z>L?I<^>&f}zuF{me!GVNVPlkSe
z+wi!iFe{qu<R}*d_=6V_DQr{1N6#1(<5>g4sbwMy%1Z9)`QcV%D|`ez=usV|5^wRP
zBDdh7#Yx@=|FkI1ogcgej?Y}s<@@Cv6XD0OF!)ox-LJB44m_2G({j#oE_ebD%Ra&F
zFhh7SAUqC5zV#y7zC@j?RhPcEF*u<!zg#qxrP*DLL^|@3|3RVhdxoE4nM~5+|Ls3D
zn)h+m&F{$ds&S}($!j<S|1)RPTIn<b*aN+^eCabljpbY9oL#w&2y)HvkR+lGI@qnm
z7AT;{vD1t>RgzW9Wo^csNzG5&7hm|NwR9)#*VzpH)lnehwKuJ{-kHT+f-Y2O=NL1@
z6zR|f5}#URSD17^yl7jiSKQ~5MWJ#uzP(WX8tI5pXxyE=rI-Kg1-92!xAn%e-0C2v
zeD1WU91RV1{As_4EO!wBxfg4UzUzA(=edhJITagbDX5PM+QJ`6gnvo{sP(IdJm&ID
z^?>fh-ueEfaiE{vM3>AbjomKPtT2u^1^mH;8tYwF5}s=|3r?Z=pF@%w`V;Kx#VplI
z*7s95mxvBc;We9<Dg8FI-dJz}QL*kE-}#v%=LVa5__X#<Rwnxe7srzl(w!owl4UlX
zdy@;ilh-$(!>5Qouj(kaNKRAFQloaq6s){gmW=J*0q>aW#t-#Q5|P{X#TE$w7SL<L
z%yk$9ZnHKpVALEtHfmxINkooRK?|ztM&rUuw^~Ia#yd;weD3S9hfTjZ{v8cTLN9<4
zBKz8?t}EdA%VKqzg%#xq5>wSaECl4uYsKipY0L)X$>H(({T}(Y9h3WJebhSulqvUI
z(o#_w9#(hT@~%7Xo9c~4QzadAHFT?Yvo)XHbW~dEii!ekeByeT%kXDx$UITkdzD<q
z(JweW;$wE0{}ELfH7#&#`~jvdEz95EVpDVDqrT6vI83)}QfJr!Aw(rJ+fp^Q7&B!D
zoq%QaR|@0H!8GS8SUypBL1G>v8#|H?Rz9oi*;1}FADT8dE;kkcDsEtEgY*Uh`6-y~
zQx*a2amU$S1zV<fWVBen|GPhF?Ed;$rqr*r{0cTL*Sbh7I9l5zIGq2^g`p|(QL-gl
z!+|Hg|B(w1&N=ktuLuOw9@R6>uHX$tW$05skl3sfFi2wk33SvZ-wBKWMXJKT7(#C8
zKW()j6~rA9z$^#XWlBmxS)teTOMb%~rrTXVP@Nq8uDd0M%fVz!EJjkq+{5|;p@wQ!
zJXf^(eO^_D_S4#FZZro6A%4R)A+_H3)JA4MAX2Olq|UGO;Z3J-nIiY_0HS+kYirJx
z2Z}XJIxC8Ck4<Y816Vjrdq3ldOTN`XHK&^dGwc9&a@g!O%>LvZSeX?nwZCR`W1_c{
z@Of_}g+bp*&C<zkpA%&&Y9AgNm(pNRwxY3hL{r%fq*PsQh~+AB3BgkU;bgkcv|k$w
zuTDQs8pPZCv{cYN?=}o>HR3VgaaYiF-y@;yiQ=)lt+~6|=xZ~5u~@FA&ql)EgWare
zy_h}aZ?d>qTwmrM3@Kc0*3Sy`K7ALAk&Qk`k=JkQU^f+nP?^su@Yj3j&yEKUpQF|c
zTxLwX64TD*^Wmtab^YBAC{Q_eD^EEzRjLl=9ble)runbx=HFE0fBj695*s9g6tQfm
zmwvbk2_rGwO78%zYOJimB6cKs^o(9ZJPNJo1<IUZj;Z1jms6?*ZtLlLN|oND#mh;f
z@|Wbu`}Qn)MxsU-m6AC_JI;=e0DW@j+c3@IE}N^{K^iGw^O}=r61fh1(!<5imiHOH
zTzku=Z`=9E$R4wq4(*F%c1NuVT|d%9!-auhr`Pqd_ugZS?qQD<Deo4bJS}CPA3L_D
zU2jMiLel1<OU)PRe9EX^a0y74qVk~%STZ{2-sYiW$%ykCZsh_%Xu>Bxo2MD28`%yB
zzr`Gx-M6P%BzDa`H0=W(v5rgI5`&6(DgPIsqIE#+3Dp>OYQI9oH62uYZl&?qGXoF?
zPgMuV7QZOMSqRWg#A=%U%{P1F9!^$>)PYtJ6Z`6tx>tS{dUp@@;a&Usc-exZQs;ml
zkuYN$;XfZn$Y)rG94fKj1AW*h!gdGhqMkEWG<B?@@<QLevu#;E{I(DScy<<So!vt#
z?D*`q-H$KzS0XG*LO*LKsZMECM)-^e#elmh+)TApdJm8jnqASXb2Hg0HNs-UW>$~=
z@wm(f@k-Lz!af5G@U@350(2`mZ8iEcRmSe#s04Sr+f-J`f$I8!N`0*{U~PMS7=p@q
z46a|%(u?DjXd1uf$@}hr+m?9Je!ZgNmT6_6OL%e9!IPnxlb^$4c^dm^(gjkwN`ZCQ
zE(Xdqg<o8CkLu@}l~U69;--M%;U?Rnd|2uYuhAnS_d#uu>1V)*>4?y3%hzYH@{C{5
zHyW^bD)H;GQz6|a5^^R3r7`ldo(eIT6}tUJWOQ$%=1oooAJ90SS%oPH*o%^{9yo&@
zc6#U>qtcmCImzD2kQi1uJt66_9OIQ5t)%4x1P(h#rqt#??QQBRW^GIp!bJ{soNt91
zEbY=Xe4<gjJMJ36>I8adN0UKkU*#4O@1!O5ZP5cIH$F2j>I0r$4k_bV^jG@LgC=HY
z0h>!~8-xjlG43w;353_{d%XLRXe@wuGJgVpbd)^w>dEx=5|6PwFJ=qC&uP%+=y{8W
zkG#raw#3^_(Y`3=)`+BIVD{6-LU~OPww{>&qUBR+Kp^il#b!7)iZ)oK7R+m<Vz294
zUc0D&At!E7Q}^`F2uG61%#p%o;UR10^6uW?vf6Sy=dkord~ygo%%9^=HW0rzF#lij
zy<aL4wOL=6D=-;M)Y#<JJR&ozQJbyN%iL)Tp-R*UnZe>vRV-0@A^do3;}=ajH~TLZ
zgR8ztilnga6R(|a$8H6lcz*wY&?|g}V#PXqCIKqy9xsmZiB{T?kL+7?KEi2%YQ)(c
zt!Ez1{Riswh&%~>w_2#hlr(p_4Yu_Zkhujfmd&~{RH9B^q0v!)Kw`RGg6iwI&O2+n
zhM8!FsOO!Cx>fK3^}T{pv-i@|&iEgsd)FWOwx20l^gGd9H$aUYdlCbZ;K}I$Tp1|B
zQ&P_r6~ZH3y2)STvQ#=~acI0{w#={AGVM)f^TMaUX#aMK6}ARa_X#I*S=5;y1#M*x
z6#a3`m*A06JCuP<DV7?o>h9_i@Y<eoc_tl)Y(dXUw>>Onk@d<EMTtia;^?eCD_s-6
z5}P<oI<HXL%lFQwPh6NbqgS03Z3)0UvZtD$Bck5&dC93E;s5fadrJ(O1^g10XM{{o
ztkUD~0m>+(M7}7XAI*j)blN?Owi%kH$p0e;?)M~0{vtEl{+h(G791P-0-cI9B|Gi4
zN-qX81uqHP#yS29c`A5&6MLr_R3L-MluDf~8cR;O`AecA07Y)>gmK7!X(M-|9CoRF
zyHs$Vs(Ae<EgJ}?=_4z3{u}=|!*GIg!e&o%$V@gEeV)x-pMICZx)rFWJF%3_oD{EX
z)-D4kSRRo`jC<dHLM5SlSp7iXd|6AU>_E|&Xi7aGJpay&h1X`{Vge3glrj7D`jy6U
z&PZ6lF4-Q39uZUwa=Y!Rfc@;I;gYy8ZhTz^;1-zngASNVdEDa@TzvO^s)u&H+EMFq
zZEG-#@Kf@@J+6*n-|+M-+Nfs5#7picPw4Puw$l${UGivn2bvV*7!$h1mo=~{N7Zd_
zmK8pvht8T}ET@9^@y0=_%lbRe^;&;ra_{m`S-+pfKd0+M{=YCjKP-U?ibvd7;rUtc
zSch#*UR<euLD4F7-lQNXtmbyU{BL1==9k*bB?%*|t}_7ImVM`#)te6Y!H5H{wk%}h
zY^eD9VCBsB8pnN)ot}!BH@0Rxl3u61-g#OLF9zJt2td_geUPsd9D;i`7NxgLHBvyI
zG$~@EX!aW)tWDMu+)VO#I%rCLOT;}E^4<SSt5oL*Me^;D&9n9X-<}OU>HW>)^x*dF
zS0y(E?6FBnmKppm7<~$wn_?>KR);H*{h5PCN_7QqyxR-Xcvku{G*<A4fx*i(#hX;a
z?~m+Q?frWIE~#0fsl54UU-Wx@{a0dY-W9?x%GJt4A93cmL&l&U>6%7vJKIvdX?rs-
z8@z`~$<8`_>P=KE&SDX;EHLYDpR_{7dCi}<d>>4nrNKCTa23|;kHouNWp(<N?<6>*
zz583|aE1`s>L0HO__f+UW@DkeonPHOu+|lniY>b6m~3UOiwYJ#1~OwMmW$xj$^#{c
z!ce}AS;{JZ7*M`UNKoNoO(Z-kP}+xIDb#g`hkWMuMn?-TrGeZu&3Fj21Dg?$*?*Ya
z4$ta-DcivcU2q=)i@4PJ3sv9N4f43PLrWA7jyS<MxjU@RZE5vHJzj$HnM%3m(D-is
zV_+IV6VoI$Mr<mA<?_k`{xlc9{1@6^*~?E7xV}YLChD!gCKD+-*L7BuQ(WiU8jNUV
zSnYP91}yP!D#qRZG2$a>Kzlv*i1=j9c1BJL2=KTMI6pom@WVap>iNfEF~0CC&A$E%
z{U)L|2lRF<&3#SYUum`UJb$Ao3%#n{PJLCr?3kj>QV2)irMfB5rsZ#?wvIs5AAD{N
z48Jf!XMe}{ek;qrh)cUkAX(j8;ovPs*z$bj{tebFpGqY-7*udnd!g5p)A-Z*a)~EW
zkw+WXEoMcr9zAz(XSlBcl5hR`EWN_1&rj)D0kJg;K>JO1YnpdKF(}=lzi4+L2>%k0
zx|NuP=vSfO-2z%?*em0EUYIEar6oTo)_*)yj}jIV^fTqB4kHf!BQ@eLbH6)uzrdRs
z;07ws?mjCDYjiX2ZP@K0J4N|mB2hj+2kYy%BB{7-B7|`R@QX4vFW-hJyRSVzPp<pg
z&$v69%Nz>F@EQk@58R$`1-=8LmxPN#W9S0Vq>NALUcY-R*Zda~^%XZsgXPz8^31K7
ziwa5Rl&-CtBU*7lc$6^85&>LT*v*_;WFkw9rlpj<50`i>evU^9t6ip+o-f74=WKb3
z`{?Os4P1Qi{_6;j-yE1UMK!=JZVC8dCkI&Fy>*!#Eq+vXwTh++`-CZ1d!O^)b<q6h
zle>iptN*;3h>b!SK%|sq4X=C(iUI2YVrf=|S{LLC1<To%UY?l;?>6hjyJpmtE3b7v
z+P%pdu?fYm18PoUYK;op48fUAzLfpV5Ilwu@4;dFgMA(#|9R8EI&CIMnG(Yqi_9!)
z9-z+t?NifA!@jw;`XleIE`RlVi)PBw7vS2W*lGpajN+u^h(Jqqo*(H7{mIi!E?(H6
zlxWUD%;IVFK?k(%O?OQnO?82=KNDiA<?y!`fUd+T&_e~vbMTsTpL>Kk*$uzZSW{>w
z5hP*+5REY?*sY~=TI<8YpZ#zNOqC*lr;cC();bDU!&E8JFCzg^HURf6T8oL>z4W<=
zVL8%R{GTJYq8~PLf5(Cy@2~Qfx=wg@Mk1)4)IR5r#n?3;!|K0|#8q}QjI!W^OlOzx
zd4&{}>>6W2oCz>>il`?N1dovzr%eB$3pAz^+Hye4MDKXFziOB9y}5TspU_Z#5u?rP
zXH?H#<h|VQ8p^Q3uV{mn9LQAhhd(QG*-;w?%w-@T%L3x+UKy;KFXT4QlS5MC7p=Cw
z$s8CUr-n!m#8Y_XzA<R!1YyQ*uE7{+LQDr!d~Qb@nmn8;z|H<^SgeKspK2^Si;t~$
z`bE~u3|}W_a&w`g68gzIlsp9D_rKhz$AG4j9Ps0DQ8w*~XT}W(c|6Q?N(Z)<`|T-i
zR&c3W`S+6MGlncwNyLzfk;i`+v^?yfP5&OWt<`R}c=>bgnse?4YwjCqMHVY5z#a(O
z%G6y{xdL-2z`CmKt@4Z*Ki<-`=+yz0Nj9REmEUnM_Xd+%rxvsF9_;DPj$CrUh{4)S
zmuu@Z67<h0Gi#KNVXIr@WDmzarw~&Uy2o#5iQHAY-Kei6G^{CnY-l#Xe?|aCF!jYL
z|Bm%kP7f3P*iX$vzn!5fCvD`6Pb^k;iZPLvyi7e10K<P672$c<7jvlS`cXeo5-#0^
z6~`BRX3<wT38ZsSpG47m<%|>_<TgB9F)Q@L-L8l5Kl{FTIisfzxm)z*CEN=mKH%i_
zH-+<822m;FWwEPD;KWk(a`(B((P9j}Q?@*oSe8B^1#&h#;+{lyy(`nNp}E>+#}B*b
z=%l{V#Jl_lXoUF}GLDap+4q1RS{wxmer#-hte!2DQiWgXgLPD>w1$0SAs*dQ$us1m
zn7wdw#k<m>44Ag03px6eH4Lg!&D;h>tr8bafp*8bYj<vp{^#uyMF+E91i%(t`aA*>
zU0%9!_~hf_W2;cC8wH=M7NOd#e?*^YwjwoM&5V2GK@$)p=!DUVY&t~)woWw2Q{qjI
z1j(3mWx{R?Evqn&%L8Wc%3))TVcH@<&G@QJm`A0L`-ILbs^FS40P5hW;@`$OD*b1~
z-#8Y0P1AB!hB*k^3MY26P^sjeVN|_XKcJ6p6$~CFbaera9&nHl6a$74pww>sFrDnn
zP9>OhS!L~3FDA-0V+-Q47d^OE;!(4jRF{sTeROn|uhOh3N>@vq0hACpdJQAQ)ZZ5`
zoVV72jvosX?#u5Z2Q~A-og00pvtLrOtg|Lf`A2BCJ(D?OCH?y=<$rasmoK+ma<Pv7
z$7A%)$K+q_KB~X*P~gFoC7}YpF_HCwe4m@rW(FN`a?;H<8t2Zy^==>VsxE5?mn!iL
z2KdyNi>GkUS{QkjrN3KBehTRV%DCC$XuwNQy=^hsB~U_&ReMw`iEP?D09O$DU<=H}
z1tsB_P?X(gfOYa(z=DI&<1QWV$2NZB4kI!t>{hGHjtfL%ZZS5P6&1}Y_av;B$Y#?T
zF%v{zCK5eabd|+^c0QPu6LCK|_EJrL6q|}H_7qrlNj%c`+1-$Udi3kLnWWpLzJV-Y
z7&z(Pm`V;@x2DCYMY<70e-BX5o}L(<-z}G8ivVQQU15TbFq#-QMLQQSTie=AN+#X%
zSo4fZs>16mRqlc)U2wc+sx-X(#N@<4>$5?$DLlsitRp7{wWZl?2ZyAKF}n^TZ2w~4
zHT*i~CJ+Kx07mYz*#mz7Q{J8YSRlb+8udV14Kx~%Gm?zJfG!o3{X<0+W|s(TM$Q&1
z*gV75`c@7cS3@Q?tq1ynokA3)npcHikGqxM9u2RcxtB*8aAfNK@#^erRyk%0wKUy`
z2;wfBf};#5sDbe2;Y^AZ+eBZ_^31+X&Gh{k9nXk34DiMQ!!5E~?8I2@y_L4&b`<k^
zreTsRUmEb1p$(X|Z<jTXHf0Z$D@u9&R7_;a4@@cTncrQZ&Q;F|nAY5SSrdOy0c=%F
zwfwnYnoV5|(@C*glbnMGmAaH81&@*@8KE&Qw_+uNW8&5yO9bCwM->nx_FU6)ZZ4V>
zW?UP!D~DWrOw*5$ft-B_FzK@s8%>QfJx|<s{+}c7&@V|1kN<C_#(L$*DDu7lpX<qe
zisP<KU-wB-9@B3I9E4&mvdtGKHPjo<j2wS%U2EpLR|9viXcV*zTI`9SGte!)nBsZ#
zj`Q^hhh8nl-G+KZ{*o<jA;vukUglI&v;9P4)|b192z2DevtPxW{v5`MG!)UvN+6iN
z!=Xn@Ui?9m$7`9Ig4fx&eE)jU8}4FPC*}RX1|Roc%B$%VR3~y^UA$u4GWi<2NY!xK
ze^<2&qHr0bu@DILBRQL@+nr23F%Rb6vG~}2JaUD4AnhV|u_lX|shp)Xq`%|r1Z369
zP+KF97cG_CVQXHMa;0}jJfH#_0QSp%Po~(??@!j<P;g!tYknTdt&f|$o(?^#g7{QQ
zK-YLKpXt5tfDZ4*@!Gz{n%mq}+W7Xq8QjqVk*IiRei_KZP`pHy@2f!;s{zcAs7vF7
zDn(mlt-k!`s29<HVO%&AL|)UQ6c&~J{J@ZS6jZ31vlnKb|H;<nub+Lt^ovbE|BIA+
z1!zdI<YtD~t+6idIFV`Y2MuIZ5Q{*w<S5|9fyB%#9U-~jB4an=74E1G+60oUnv~x#
z?;kRd==hP$YoRqDkL&8yD-Tf1=YueW>maN=IGP2R%r!3*(we@!NI*T1+{{Ldw6dcd
zbiVJ0TTiC|ov9PI;yYf~xl0wHpTwyv8FHI;(1EmQh%82bbvk9P@3i4gi&V<pjg9GS
z@tV|r6+u)IG0o${&oSxCL|{k+>i>-;hKnxfN8HRA^T;WN_LkD%kR@IO_2naAFvVW*
z^<vC8&JAqCLP4vNxLP2^WK2MlM)EJd7&*JWQAe?ma*Y^A%EpPA^DWX|>Nz|g^U(`5
zFBfxg@lOlzdax8RIaO!aWvGIG8Af0ZE5ir~7iO9ifHg06I)xSLa>IQb%6B{Yvi4wg
zjHw4(bM;(}!kdmX`AfioL#ESEVzIM>mMd5sP~Jfzsf2eELfh#D$U6fYoE1+|x09X)
zdTz5(_OLtbI1k<_mzD!0LZM{h-LlEcc!RzdP8FEc^P*Q!IDg`${6)9$+hfHldTFrT
zRG9+c1$aZ*gk8NjQMvKEkfPn0)zWN#^LNFZ2!{lYZ(_B+eg=%`t=Dy&T)g=XrUe1r
z+7VXf6mG8d)BJ-e?E}aD8LTcXJ+y9(yU|WKV*=l07}%61qwJI4-Ft_MUhtubnek}4
zzM<>Aw^CLqkjG1-NhOM6d7W^hsUVd?(x^X1zY{YdK=L#9Loo@h`wA5D{6c0PCxPqL
z(u{kCI5^iXmO=DI_PsVfr{7U{&Lm5A^~Kez1ZtwsL_a)$LNXV4%)aWHS#fs;Sbuf;
z8IdHw0oj~JME9~GL=Y?*Kdqkk9p9qaj3QZp61Z-{9yuW%1s(nL`-)>HrJ$4=w$VIV
z9Es%cA*87Lww5rOQdaN!@Yw(-Ss)1wx5Y)%AW6+2e3ffs5(pm7doind?%^FrI@3{C
zj#z7v)x>4O7Z$|MoxkdP?!ujOIG05K*SCg>=jKEoE5F4hj_i3zZLb({5B#E^G3g~n
zYH76S`bVbAA+-DNRr57q$x|PdL?UZE_Bx{woihL7Lq(VG`r6<5sdbOqKK2f^y}|Rh
z;Gf%nI`<XF_MP+v&d{%~BeTEA?LTqsd3}f~Ks}p$$Nh%~``6=&)?XLpy&6J0=i7Q=
z&KKAJ*8@ggxJqo#d|yITrQdwf?|NJCM6pUvZ<JKBr*PhkdEh_2E%rk*32@%xei^?;
z%qxGDnD_C6r(jHYWzNl=t9i<K!EvdFNxjDWp=P;pgnuA$XJ)5L#zd&_KaU?6ER|nF
z=m>_86nqhW!2Yr#c;=R(KaTi+y_o4e>^NEek8x_@+qaYpTc0pN!Mw^n+aA{b?@9aD
zM_}L6k5B<j;ntEk@9bkSUSL{q=}+_g-~I&r!W~lVsCvHmZ^Q79tK{#${{9w>`vrZ~
z-|rei_?+cMdgfw(iaxkUg$daI^`7G}{c!avpTqoHz=(f_-k4(4uCc|r{12<|@6YvZ
zVPXJdaf|mWPT=LQIQWv(<OJlbEWi{jYMlYWkLMR6KRaG#1hR;m6IE8~lEOsG#Q(=z
zvfsc?a}2@nWkaVJ{P5NTy~f(48LT>LAWhtHZ{-D__sO%wzE}&fmK4#yE?%Mj^zoy?
zH?|4ug=(9rLf@8VM(zJJ`M(~*LJYfy)czh6UKYztKk%rNaWsOjp947VR$zs(?A4%T
z0E5)ggRSoxNJPbb)$NYE^B#6<{HIm&*Rat1YglfA%c*ULN$*ewwFb9FDa*Hzl9*4v
zS?Z3-c}?y5e|^~1ps;ga{R|W@;Zrk!uUif;v9lNT;DrvS(3i~_k9liXdHnNvbkB32
zizQSWtc}`~yR1cz5Vgbp&mp*W`407^c7OYpS8wcF{H~d`<*W5SzB@x|j5)&vWV|`v
z1e#$#(N%Eq%Hk)_!=0`#{(;8(t7>^vA<(=3>HV?)_};JmkN@{X_I=>88jS+Ec|7%2
z!_v=fQU`8<Y+S#QYu|yT<qcLHX~jg|yK*tC3Nr@lME}PkxpOrFJ0gPrH6n#-1<^@^
z=na7dYf~^7Wp|$!YFrZ-_(U&f$Z;p*|JaH+m)_pTE@Ohf=PQxy8u7P@i?8^fFoK^i
zOH*9^51|;l5dPQStI$zDh+TNQ*zNr^3`19b_}taQbfP>cN|x8O8$ZnC^NdtQ`viql
zvSQqH$G60%8pFGTyRuzT!8@1DSS#$k6l;zu>r<{0C)z@kmwDm9mQ*Hm^#@pl7c@`S
zN*rff;BoWcIJp$x&$n&VtxrO=iD`usnfihwrD@MkD<NBj>ZE#O*isg|6UH{HU8cAb
zgdfxy4bcAaE$%E_#fFq35LJIg*7?F%$~n;*4%bdH`s+!Wx;LXfJqj$B+1BaEg1aSb
zXez?vrQC}jQk$7kyYU;bjbANm_2s&_)U9xM4?WmEx^&QKvvd%!0oi+Y(?Y00ejGhq
zcDHDg@hxu7!c0_IKOb-m+*w=*mqo9?e^W>&6$Y#fp^;@utBdO(cHGxRtr^z5EYf>K
zCrlOh-`@zjIcb%txbba7BeE%;1za;NyLol*&u7MW(O&_N<zIW7IXlPRK=ict6UUl}
zV-N43Ko1*PL{A41&ji{gu%a`gIVxzJhbuHE!TwIn92~BLU)3CL5^+o({fU&}%`@5c
zmvqs!^?Tk8YXemm7uR~<7Z7C7fEe}tRCg0_&2~FM)G-;Dy?ayl{q?q`O;^aoP7m<l
z1(dI6!JNfMGd?MNJQb^ZA2naWGR#o5@!E|Fk|k~kMViy>9~EQA<q)`VbA3qd9KSn8
zV>gG8O88#q@bes_&{ea;qtM#|iZ6?_Hl|z&Y;2(t4`1dQ6aaLARfw=ALn^#p_kr2H
z^GtOqh7L!el-wVIc^R*o_{L0w`jO|jh?-GiSCZ9OKK&zY9TO5hn<K(F9t<LvB;5Xv
zrK<B=(fF$axwN{ys8^OgCuNe7VYee0I$k~hU&p$y)VVodsd>24TU<=}RWPU_yx0M4
zaT$XDRGA1eZfv5Q$1H0`97|F^c;6m>F-+Qzy5rP6Nq_O9j*j4y@~4&8@UO&jUgRRU
z5IE~yIH@@3OuT*F;m+MD5%$JGN%$d*y&#18m{GYLPk$`+DdJ&6mP8(IwO$7MgM!6z
zBrEm6$Ekk7{kIa;E^9B5JO&>hjRF5d3vV?J?K9KW8g|HL<Dx-mLX(mp8dPa<DkE{n
zt7~@cy^Zq@_b4qy>4?o2akxy-M+tUjAGTmj4tv$mjhA`Kb>%2!o9Wt4#=>p2_@{cL
zS5D{fY3&OZlMdXw;698%mP$GP{l*1lN0GMqZ)%+OgYU>QEptQAtkwgmO*%jJWIg&G
z8V+LyDZl!e%M6m7w-8SiJv$jX^(%JWvWKTxI2lX6`yU5|-|%M;xn`Ne{}pm2-r@qU
z^0lt@m<HyJGMWrB;<r@$yX{o;ftpKTnqmjQ>pxJ*u5>ns_q`cRL@zLUT67n;E@gb7
z?G6aVToHQ1)NV)g)o)QZAz$tPWA81)s!aRn(Lq!~1yK-b5u`)9ySqVpK)P#Fn-Hau
zF6r*rbeDj1*OuILcWq!3=V9KN|IF*0_qxvcaz33ee)0mIJASc#YpuJer~Yia7lv{d
zCl>O`^ydz->lE;{kI_+_23)|WQOGDS{G=C{67}5tHl^*L&oSy)nf1Be!Byy}CW^E*
z7;GF2dNNes#70CcT8{TT$k<){{$<R2Q6eL8xdLNJP)F|-#Ur15)Hj5I=r2=#O@MFw
z@9$iP=%4jWVCCC(pKL}{;2%75%(ob#-PAe|e-k#-%IG4l*2L@T>!#l`_6kXN*qoYY
zXd%s!1{x`3gk|xERd<muBy6dc+6Z5|eGCq2TS{~ZuLq%`=-`{HlqzO4sg|nta$H2g
z;`+jfcsyp!H6?p*V&YCl%ZE9$3aiXLL-+=UQW{skw2<VUkt+0FprXj5nP5EdVZASJ
z<;s|;eoft?Z|;LX#y^8Uxu?)`4DvxqFz~5iDs_4sdfq7j4ODKnxJa?qYTB?Lzk**P
zj1T|_4BSrkTsroM;b)2dLgP$ERflu-nCxHV-oFc5P;B@4Grq0xAOJ#{h)wgF39Lp#
zkaICoGHKWnQm?f=Rj|i#(aG2vCDwYqtP!tH09@rU3x<Wd1U1gZT+=sdJ}%XlzJgtE
z6dRnVw_IJoJetZlMqe$v=zdASMote<Q9eW7{QVg$S$6j~%t5?`OnLAc@@?ar6<4yH
z7c5>yeSer59Bv|ajuS|^^vQ%560wn=oB+G#*no#m>zNPJ2NWZC0_Nq1&}fR5LT{gW
zdiNJIJM5D1NgqF35<E_*2Rm)eNd@E3niT1Ioq;Za7t};W^mb@0s!uNf(;NlPldmk<
zc1!J1jQV=h&ERmWpJjk`;|Ips8td8<^y^3-m(QxjilZ7S?<`+&6=|^*fRwTAmpjq$
zSk9m5gMT+TBk=}I_#`|hFOS!v9gO?0YUbO4^3P~;d$NUQO>OS|glC0O?_2QsexzIy
zJ7Q*~Jl(NWx!$3(z<Q=h^L$rIHvUDy3Z7aKkYuKRtYiv@o(%DIANMD5K&)n4bf-%6
z8G%Y8gjF`NCZ}_B2OULKQ3ZH|n5TPKJS-}fR%6-$;p{SVGO=L--Je(PoU62uLPK%F
zG5HaUGkABbTqY<qZPj&m0%<h@9#hR+_BE61E>PRCLKI`ud{D$7;x|f-mGg&lPdB-R
z;0%cJsGn61MFEwi<dU$TRS%+MwkE;U=1a<WizgzJNW4&uM};QAQDq%?&oG*3)}<$|
zWY(zHwsjgzzU?C`5lW+2F8rvY#kaXTCfvbdc3r(UmNp)y80m}bt`JA7p-vOSXe$s-
z$VFobEv^1&&2b`AnzQO9z0VXiEAXn_XTt7y0h#-tdS|K^7?cy8V@t=<ymN0Y+?%h3
zdJUV^d(=B*9y}dB#_eH@XRYsv|7>u1(Ap0aPR%B*!-@yG9BV__5Q_fKej&S_syWie
z1zzfGz0s86&8^Vu%RE~QuP^@7BV6jmAHFXr{0M$keZa|Q+MI_$i0Zwt4~BONP#XOR
zjx`92_)v0SHZLIu!)hGlSy%l4V4nk(@vdG!LU1cLvPXGiV7E7jtW;rXt}UjJSJW0T
zKX>cX1@(-P`;v3v`m$oONnzrYi?=&_Y7}9fC6$+LopAvsJiEC74&StA2sX9VzE5Sg
za*p&lcwfOWSzxNTyt|Aj>LLSnW-J|FliU~2(MtPG|LYlepV1L>6W;1YDaw4{7IX&B
z6%QUec;y-Au+G|=mE@8;B;_4H4*T*}(_%w4TM~;}iI+(^mRRCozAF^}+osyPT?3aS
z7-g<}$}0!-D@6P)vH!ojYGs-G-a_c_`on~MNif<FW$inQi*(KVmV+hBCp|r9m(gp#
zhvO~@7WjTV_825mp7HRnc!pBhFC!Dut4<aZIQ75}nS)@d?dUZs3WZf4<(DaPZnDf2
znLn$uyAhbN5cRYJRTB0vNardgeiQI7XA3{oiQRnq)me5=11N%LJ$s|x^-j~vAqrI_
ziR??w%`8Dzh0zizDHgFbYB4-B3nu+n66YjdSG{p(0A9`Wj!Rw?7N&&lWIQ8RVspwB
zBfOUxiA>?a)yo;~bz(Us;96VH#w1&-FA_sQa!#^HDQ)I?A~%JEZ{c#Y(wJ*IBH*v@
zvNx%`oh>rGlSFLz<lyJ1S3}Wn9eXS*jS0sc;dgonyPKwbjJ}+^HX#R>#zv1J1{adS
zdVZ@;)2J5`B|P%deL&V~X!l`SX^Bwh(6PmA{?3`tkAGcmZ?_&9K(cGIGgW*!&PnQs
z=zO%~3$WS>S;k*hJxmQ@CKNd8Pe<^SrEw3Qd1-7Yk|*)lw#bz{?+sFe*yu)=t_DXy
z2MEA-KFG`-of|EI<a*5r%`9<H{rPsBLAO%($b@a)<yb}?;&EIE4y}bNY*8lu#m~}N
z?mSWw?`6xG*1Jz>7u}YM;<eT0M9zBdd}nhQMBJ-;QLCoX`+4Lja>fA@=qSn^QmrDy
zUWZ6&-$YUdJo$G?j=u)uOEjWSO&k@npUrMDgNF#U_uaj5X?4m8dauj9ZXV<9&S5ry
z)9nNgzV84}=B)Mr*Eu?)LxP;T#@u}kXDr{~OT<UBHHAu({;Dk&;hG&6aiD(mus&J8
zqto|h`BA&~YKSi{74W#2(_s63<ae^i(qN&PwRl|`++^5Km$|m~>onY+RY)sZF~*Gi
zvpf`%O`6M4D(RGMnol$uL!9eGN$>5WaB%bhx}|){PuNFy?-343kFz-zg=sH*p{;r1
z=Ij$bBG0#sF28x+6~4DR+wQ@z!eO6t18dXr+QZ>}S2kCx;|5qNd7W2a6~7RdD(jV(
zpWPjg_|IIL6aqruXNHvMsg0OgY&e1X*VTKlSnaTJ+)MPqD<xF!V~_sTn><gr@A3Hm
z?(t+p?b3m=(80JD*@P{;N2Wh`dh*)OAvxl1LRKf}dT*+U*?hc}cIttG=k6l{4>gY4
z)w^y<{f^$xP<S2J)L^ABe9vp0p}x584!u&OyE2fwTUXooEhg`cWqH2FRQDIVbgw0m
zW7RVvgGX2km(*z*ak#OM8ecROk_%)RB(1*571=pPtkxWZt)U8`f*-4}%*eZy!2*6f
z>b&SE4~Ve#=Rnn~-Dyv&)$aKaX0Drx=PL@8Mps`CgxPWm<u&f+!3va(!qWtjcYzRZ
zS@paaZXI1j2d9NZDDjHp^K5m_Lm`+~h2w@ij8qF|=!<Ncx&>7I+z_NM{892m`xuGw
z=l!VdNTJ&!8J;}ws?UABI2iekT11Wu=+o&)a(*?fH#Xr$5ME3+b%*U2FJ5G;bT^9W
z#`eeGF{pe+=Am}<Lr(0<ntTQg;^v!N*c(-0Fq`{;&t_p(8{lzWz}i}9F1qvy{TVlC
z_swPKmu@zkj?F#~s2AJkEXFPcry>vIz1g(|@HJs^pI#b{r~HF%<?mf1OKE;ih6SIN
z9!HmUvZaJCtX$2x4e3Jo=1yQEoXSaf0T$_7O%J+XTZ+DJ6$|7ClD~~ocLuS(T=$6D
zQ1?JnOo|4?I!inpN7s*dXacD)Oc8oI=On-1blP%l*3;b*J79CCxE3>~kkJ)ntZU(m
zT)v1+C62x(sIflZIB%QM?!LcWe0MS4c|bHTA8OZjgE3w{p|jLBX562Xi&ZPi?5RF+
zR1B9)-|}<`cMEVm_zl80!B-k-uPTaTkt{g1{reQoQmHwsKjNSf3coqttHNWpJh!Tq
z8R);--<-&3wgtInBYW@}7Y?vwW-GpWB9G~O@ai<xDLh9>lQlL9@f5tLXM|>}Eug#9
z2AGOwI~6F~I4Zh*#<IPsxPYd+m*iW&ZQAt2+5WkY;jaG`Vd(MGB?WkS$*bUIVIrUI
z%5$v+0n)iSxZTg5)t65sWY3YY*zmP$YeuFL`33kDbjJdEby?!SL6rh5jO=q&-hk?`
zXsx9-KZ>!okCV3`c8uG~blHVu4UDw+@@OnxS(zwnSY&iPk!(t$?+ta4fCt5#!uC#I
zVdNh!WnCqCJP7;&cIXwXOw?C-nIFqh@Pu1qn#>fJ)2ddD&K}w{<}i^AW<9s>kc$#P
zpiP6wlbpVhT!z<0c8!}M;j;<u&Byu~uh;NKHl$V5xME{W0NvTjoYkwS?{oDht4Rg0
znHov?6T7gEh%Xdb%4CFQ*~o05g-vu@U7_s+ZsiH7qK$O#GK~!rnAeRlw6t?%u;GC=
zk%o^m!rI!yd-2Zc=V6;kV+n=^{DW2j>BbXmx<x3AKqf_KyN6CO{nKzkz2gQ0pcu*D
zgABa~CH|-^7#HgpL(%$jG8A1Yi)vfFijLA$9(P@%3W!f6cJikbuQoVr$e-a)z!R<O
zEJ6F7jgQb#q!a8ep?Z$hDd)*tj%$RKZ$F5=XlOX)s|;343D)EOqKJjUD*OpuXW}$9
ziF1oKsYU33vYEI+SmOs@>K4s~Vn!0Ey7FA@3676Qnx8vpr{^6m$59YxJJ$}|yCBNb
zk&kj$+m@}T*lPpQFbZ5<Dzzfj^6v2ooaTjtkNpdnpi_ZkMHiT3?o!LfP>SvNZ<}rw
zo4ZLiP2V@{CQl|~b25?(xlI}y_YcLCM<Q0Q=G+Yq&Zad;KP{+OaCd1RG;O?mKHV2B
zFqi+ER*n*B%eVKVxE8v@dsEsruTokQxv>Q{PcrCDJ4vW<Fgl}D(l=$v9L+>ghIP6#
zxxHaK)3XONTPIoOraI#;E&eeY+VvK(157Zr3|X>-hyJ53e#i~s;<4YDL5Vm?o0Tes
zs#5jG!TmR5WBK`#X$OLq7FTY<q|FB{NtexT@$^+0duPOBr*u~XZWwEluvop|mwe(>
z7&Q2YW2wF`L>~^(znaD6sFyr#HRbjWWk|>JXT=xWo2kBDP@st$8@cuYu34#_VA?Fx
zN*5ln*y?$WwZ{Q%vlk7wQe+osy;-N(eVH%Q+*jO#eau!X)vm2br^cgx;QAJY;6}VP
z>y$^~0C~8#6uLTC3#*15Ebw0y9P~+$c#UkNL*e7TjIC8lSXH{-D5LeRTWL;VS6<2n
zg6VGZ?hyVQSdx3|R<i0qb}rO18%wS5lad@6$DD%-tx|b<;zA>h$9NT{PuvU_4r^=P
z7NV0av|=f!?>qsP)bd*3yY+eO*|c1^nP>}|;;*p0kF3Z&;-B+(hiuq{io*Y4?+&F@
zP!_Hs=OpbP%o)MgFTkAt-DKx_>L&HJx{eMO&tiv49gp~S%554_0=3`2td9Z3p@5#|
zOWH08&Z2|Y;v9n9O1yujYA@(TzIGS*J@L3xlV{C?EJATS=4qNl{qo&>gLaPcLRMzv
zYhwLtTltB$qv)AZmBX?oS7*bjAk%p4_#E&Th>-HfY%ws9%O>hGNZa@<9Y)0{hCSak
z7KFJoqIlMp!l#{(8n_2_pA`~KDv@j^mm_B%2kf*>2vh|;At)vNY|Fm&l%Ir+VikS6
z&72o;8qJ^ay$I5Z_cOV8uT7xPl6WODOFW5iK4@5~;&I6MQ0X}3yLKPDp$b}t)`5*(
z(70hI^<$nA!KF|Bu3iB1buZY(lbshOqZXet%1+SHZpT884McIad*jukGgrF8Mo9S#
zFjhM5#-o(|eFg*k{6r*0ho&ci#l@ya4RYT)1`PD+u?;>c9m=*-Z&ar*(7)5UblN<O
zkbe*QR@f$(#q|}Rg&i<<7dN8<D`ck^Avmlqpc%XSi+q(@d85=A#Io03_J}#tw+ybd
ztpX%mTI$6*TkNwHJIT**U+8H_6m5P_(#VeO5<&^A430rZF&va4OK_E!e)bHq{2M5_
zf!YpxKK;9h$Izf8)nvx(g^>{^=zROmY!FD>EFZ)eGxjOvxK#3-t$B)vG*h}tw_NfT
zT2nuAy{`_1YK%{r8NFl!jcnf(tvpH$2D29WyTEQPq59|3V_y50{x5JIhT()*rv&Ug
z*C-FmrADuMH3+GAfX2rmr&0F%(%V*s@?{|IT|Ilf`UK(~D&?1%NyVn|CfzU^xCcE`
zwhI+vkH4WZmDaZ-;ZzrFl8sD!zx{MM-`&`yFL%pLRT50=VGq$<{7`y9J=fTM<N1~i
zmbC98o{deqchE2%e=L+$WmXj@7&4hWXRqdz$veR;%u3<1AM*<?A^7IwA0w;zzwzbQ
zi~wL(?)w76%>99!O8WWU6z>>VZK<qdE7(;R55nFl`tEh@sDLUcpJ-g0^U!T2lwJ9A
zDq@}@s;%YYZN_pl7cQ&$+s7P|I@8&skF|y|^nUD~fdtY@%0*al+KY+m*Fs?;Aur}`
zm->vqzF)bCZvP4nrTVzDWVO_gI(7vlsD}^ih$5QZz2ATbq`lb=!n+$BN+cj~WEYue
z>tRiRgB!2!$!F4i*rjG_P3MQ)IM}zdfJ6)V$iC%7NLAgA1gi6Mh$;ATUO-7)Y5Ho%
zGFiP2=+v~oiby+#H7X&U>gai&SQ7}n0gi2!nrf*|ue=(OO+yq%GT(WRNXukaVkO^u
zeE-~2MWj$IP89vR^7*UdwNR0bA<+PN@_^_@h3tw__Q}A9O9P=s%s)gq(5fApBqQHC
zc*hSpqk;|#SJ-0eF?cz&f}t8@G5Nnq%ZW+iBMGOZWDLkHWzq&Bp1pous67V-LQTZ0
zWT&-C?jLG&nYowC65&LqVl=5)I^*;Cm8|%VL|Z`pK&MmH<8O`$lJykWa?DG!@EJ}K
zuOGoiwn#J)A#?R*!Kra8f^~2efb^d+dT$U}dv<Jsg|b+jni`uS3|jVnwgK3$hHU3P
z02X@6jkV$fXxL91I%rUEp8CFk{|JtzBt*Sla86nEIZ!%i<ezY<q$PA+tLA8LdBTen
zlWLpq;sbAtY=NsicWe_)LNlfj9x)Y^gYmcz2%dC}T}^n{He~k05vONj2I#zcLN7_T
zkfJF>>E~SRiq}_(36?&|d}00-(Mv|Z$HJ(|{+wiYYBI5)qU@JeNles3&W|fHnZ4t^
zU3GCU#VB&VXHlx)%W`C#f)gXIq%_^pQP5vAwM9f5ehNjYl!5xaBa^Q^s87l<YPX-=
z2&>Oo6MP-%!_&hT>mt)XhGNu&rQ~7MiA`OtL-DK=mCQl0(M=tX>sBEy1_NjOhWRrP
zw&X19JmHwL_%*eNUIACjo+ASaj;n$)MB}%S0kIcpPjvZ;FXu(L(xZ8BhZCM}ev;hh
zoPphBxmys{P;;FZ%uuqmBf<I6+4P~`v25PC<=>1IF~r!ldGb5y?e`5zwj&K=<szDn
zrg*%TrmKglXKmQ99u-pLKEAk0qRymM*KI7+R54e)<JHayyUOSg|M?zalV;Y}P;tIR
zNdgZ^eh(f>PCuL*{fZ+;0!1Pm%GfUbiGgb`6uySeDO|EyqFL!*)v)BwLqBLO(8XEW
zkwD-kq~W@A)*Bf2Vo6ZT9{npr`WEl;+Ms25;d61KlhH&lEL)uOxy7S;9uya`a{${s
z?ngcd-hC@}IdTNxogbAGtExmGI`z{01YCW5U-hR$J2QuLLI)yV*!#iKseg``iXA*+
zlhe#LOpf_b%;|O@BL~Vfm*X9Wr?%Wpv?Q}?sy<y#Xz2$KHIpAQK3l51OM>}kFBWdE
z3a}CyoLaioAEC$3!9|q;zSwV}i|JUeCxks=ZmkO0>)>&mRWX*lZW7NAtTTRz!NO{U
z+gfz%t6_P@zQ{hJKmC7&>#OeP+uz>*4XUn)aURY^b*d#T9bQAGoM*9VmfN0C@OtUK
zq|moMADXK;vD?JCoY5nPqM7TEGtC{7pg8mZ<E4@9z_`?QAN)sQJ+##|)0czu32z__
zcN|Tg`BHb?qL`deQA|Z}dp6Mr^D#_vV~)6aMi;d?GGr)rOi)r(Sle^+CZ!GAh?nB;
zpIcXbk^K0hkbc1zd7J!H{geAfJ}n*FTtiZAlX&PhJ4yYy(#Cfe`446wi%pXH@%Fh`
z--QdX+(Ta?9_K{Du34j%^}&jvV&Buux2~R1SF*HApSW2j3L>ZJ=>3pW6~z*^EC#D2
z-LU$1u%tQDS6p^S^rVv}kS%Op?*XUnfPcc1wbhxNRy+4A&Z$|N{;NA0e0~_)Gi1op
zqOJ;Myr+7NZRKSR8@#Ucn_QocX~FsAhW2=**~8ED6l`BgKdDRD=1=~}=$e9m9cukO
z<8vmh&dF*oS!zrX0NyEQiW+Jq+O;EjN|<w_4!4(d?#&fs+0y9_whRO!>o{ug7yY&b
zskWS7Pj>(&qMo2gb#esv4+B!5kf>UnIPIg&R_b`{m96?M1EYU6u-)(-;kVPt)%208
z{nb*NY2l#)4XFAJt7VOB5`PDD?(CL9xlWO^u>_0yEuVJc#zF{w`mj+NCgQRSO>J|m
zKHB~R;*KFv$6hSoK3Zj?rBRtII0PrpuHENqBZYPlVqu~{uQ-PVOagEDvkxq)1p``w
z>s2Rmau0rlKlZljU-GJhz0CL~zLOn(+N@b)g;(D=uj`D?4TEVEqjC^wdy7vNw!n}D
zILzbJiw_l!UW9Nxx~HYQ!K(RJ8ZEh>)l+=^KZBzmu2>jze~jO{^vb^11iZj_n%}A!
zye_L_OkyALsf$mdQX2g7N`P8MVd+z@+Q=!o#kd^4e=644d$Y8FqP?h)kaxL;uEU}#
z7ek_Il6_57Pa#RHk1FLFK2Lnp3;EcUHg7DH$->C?@rMP>^(96f#!{Q3PJLf-@HMZ!
znh}+0I8@*e^GwgPn17NqJ<LZkSH5l9aXpyZIg@GFfS^AR*$2bVY&}xxst(@!^}wVL
zVDHAPPK>utN304d2n7I(XfZhyGsOWTZ*)G0g9~i#Bn9nwjE`KnLkic}XiL}x+@-As
z69tSn53z(A3)>_#(2BBXlMBj>du?UblBiWW#5qTBid<?NRiqQ=b|bA2=X=bc87IwZ
z3s8?ugS3{00<=VB7I&Y|s5?3qzzJt|gC9)za04)-*NN?1eq=AQcLI@=hWU=gf}nv&
zlC~`tC@QDZsoEhs<_R_4iRy0jeS~v7CTv@{^giAyBNrpo(?2*-MMFtsYgWc*&$q=S
zc%38sgD&-ufqFDL>6SDR_0^S^Yd)9*R#^;VbXTC1&{-;%-pWfNe#f?jW%#4F(e?ou
zMs~HG;H6tDi<##5NdE82d)Hl|yFBv!MRyl~59WnVh{0Z1O>L0)g5tQ#;hfva%~jVj
z_@v2kI1(uEjtMwsLKP$588YRyt&kC-lDD(}n*FlbkN^se?_U%lV4jcXi)`b1n*(<2
zi+s66#K~~G2h6+?MJqgNLN5W>0E@9&nAs267N4|DK?xP9aFvf{_?zUTJ6$c++bbR>
z+=_l`E@K=9LJnY-_Yk8OkEPm^CCYBGF##6BeLS(>u;N^xnBmbgu3)+JiC8s-VIzsK
zFP26<LfFJF&z~5>*e38oaZfL0;~_Bk!V0<$vRl;Wzuyj#aR%8N=R_F#I&k3!FH6I?
z*g#IUY_ykI)i@Lr_55iWvLf<DWO643xb(`MxXZj{5b^zsvb(mxu%6?!eyOa-&qTBE
z%)IvPKKm*zEmR+P!ky1^@Q=bE^5bM(Te%y>alfzcaOsnwp#<YHnrMu=lg^$^PsYyr
zr-pW>^YT4;s<A%_13Ek4@fZtd6%p41*a1n@><;d>W4_ezauC08b+@Iiv@f!GuT)11
z3;^$1!RD98Fyo1D<-Nk+h}(Vi<LSz`9GZd}%+;f?F}@v?*iZ=jB%*6AxNq>;ev3%k
zNL3lmU9cly>kAYo;8Ht3{4yWfMy+(105B|yIe&!MwT1F82fvD<B}6?-4fcy(kPFFp
z5Rk%i#)p?8$I;#<Ncw?p9oyCE|6y`s`C_-IxpG?S&CKf!7kg(s51ald&BaHCk*{*M
z*AO&RqJO>`h3j>KnML55nK-tz`yj}ifLKfQ?WFLhwj-8h=O#21Rt_+zQhK^l+{D;e
zXeC>Nz=Y7)yIAvMe>m^Nygx2fExe)qXEiV+n|Z%(qpKA^>Gq+*2rY@SR(?;*i!_Bz
zwaou%m=P+<+fg(d5za%#Xdq{Va;MAVddl-Yp(Gq}X8h``C0;bbiUf>)I0_y}hxji5
z#XuC7L*^rYJ@|Hq=QhnIkO`#Mq+_%7=DC--c0>mCv!3dJ2Pd7WaL{CxgnoSX6Dr`H
zE4u(@VB8Vwk2O*s$u@jZ%r*RM&e9UiMR6rb)mYanmU%bHYT++F+_U?iN@Wau^c|()
zGI^8%0l=9N`tjH6>SA<hG)ryIp!$^6L#5^$%fVY!?Q)cdqt8#8D@m{6@;}gVR)=_I
zX6$RMrr+M6cp3F)cwsYrPDAWBcPr>*+?;Y<r5^<3?IO<i&t0am$=r9b(!!rQP+5Ai
zzM_@idPg{dN~geg^o>u=v%Bf)Dyd~$T_^{gc2e~^$K2v=0!hg8)}qdKDM+N@DPKWN
zZ?+>or&$?&-l@d>wp;zb*!H1daE{t^r`p$pQYt!@TFTO?V4Uq!Yz%TEgoHnb^mWGt
z`%BV{li^5}-<~oTJU~yAogHy^#^b^_KK1)h9^7reEXVo0C%+j@L9f)xun>bWye<i*
z;g}4+Ec0Hp*=q5$+(}v+U>Pbq3GBiPwtM3i|8%LXwdpMy%I)5nEj17hd`jV$zTAl`
zp0JipjkY_m?`rH^?7%2zLwjiH5bI!N3Z=rbi%$BA>WP=-t!?$AC%8fDQJBV~!1OiS
zF3WxyAY@E)tJYf2+7K1oT{{Zb*uo45jkJxHGR3gSs9d+morr0ImF-ncYGY7Q#)4If
z2y7z~Dg7*XT=pxVZ89QR%h8xu9#oC+-JtELPHE2PG&)T@NbpM{p8Y46)?3W_C-?fj
z$zkq(o1L2yxErS>P!!h##qn&@#8;-SuQ+|GI!B+}N{=`CO_Mh6n%dAo!LR5IYtM)>
z%vp5omGkWlm0aelp@HZp6Pa>KFSqN;mt)j{kf<zS))|YjH#@B|3%EiyL9^lySlQb9
zSHk(NYO{jKm&En$RES-XyMS$mM}%d?P1L(}ho0gAsXh!KctoJi{z}t}n7U_DycGXG
zObSDj=NPP14w9(_Egez1%>n_uHFcsN`q-WjM%tL}My1j|=|A@5>Ns~K7*pX)KY2a(
zdo=byWL@I9&`Yu3t-m=vh?R5t>>@8t`SU-}t)|gpN*4Mvi&cTQ+M(|aCT};txgr|U
zG%Ew~Hp*5x9Ce#`gl_q5fYLS-2czle_(Zwgcm3RIJ-pI*B*I|9B+=8IE0nFN<W@<$
zL^S9HMXM`{cG&7+8Ij?2mUBtvV4&uJ^u#+X3Fj2%(QH}(vBol0By0Eaj_g$Cv;#KI
z3i~%A&r!w@<K_71TRufWDToiZ4`}V6RJRdX>xbwfm3d0V_+T(XGH#fYoXw>n(SN~v
zqd8S*p0V-tg{Db+w=H{-8d*ZWVSA?(#n&rCeYmsByaCx~vma2HY^2+X_jz@_-+f`R
zov$8(Z7)dVvfVa*y?*ofDeF?LOMQo^+EgGKrohFgy`nG;981FYVQq@J1$f-fW{f9;
zO>Epk;??(O?DP0En`KWZFo0yDLBK;Le-Fn(b7EP>lM~Czooxo{6`79)v>n%hv39>t
zAFnaH57b3SP@BEg-n?$YCZb7HIZ8IYr)1><hC&=1Hgn|oLjuY54}5#|y~$`$QH^bU
zk#W#YcW-<)S&H70fl!Mc<;tS6$<u9bPnOU^b>`bKa-iamo-FOwu$Mf`EB0Ue`Q}Kz
zm@_BVPH?#QrL;e{0GzMcd7k_7B09rsUWZ9AI|ie)k~djIKwaLQQ94Hc^h7Dk7?{3$
zIi9nhF0=rpr+O9pkm$__?B)Tzx}!rkNR#|*w+^B7Yuf{`tz+(oZw`MC-v*wxBZ<vq
zEvOenP#%Tbc0h3=hM{YiZ*|$>Oyjm8Mm$@?URTg%r680sZB9GQpw^s5ES~%uV^L&<
z1UC|NyS@$fNVJ9GO0`qM$puX%(H2<hY#iCmrm9=Gj;?zvq~BNW(r6@6G~hFYIrwuh
z=2cqlbocp%fT8b`9OHx0PJspqCecJtkT_@hkdK&S?&aXpSuMDK1S{)$+pu}5RC%@m
zlmr^uVw%J0Q_1zBbzC0`Im-|U%Ny!{!pI4$xw%E4HwvqCJPcq49mX=mQppEVEPsLr
z9JZBpWOT_F4guo?gG2-;3qa=bh7|75LG4!Xoq40`F+@OPMU@LIAXNSfL5;MJ4y*Z0
z$B1AYy~=~}!K{*{KA7tckpPOqWT9HN+>Z7x=Y27&AV5R`uv5<V4qnY|(7ZQlXhCM(
zb*^_XE;(_YIXy6%+MV9tZ>h+Arf8a*`%LMHEY?`&rJBP+{l?E4yZTm{1k;)?XaS|&
zY9Zu=hp8+eD|7zKj)0fri$95?k2*jD+hCi+?zEq3_507=<pIj%@{<BcCJK&#k*G`%
za5`Axk|&U0Ky%Zwb3M5VSu>5U5tb7}hQnMSkiGaHt$n^h`oKs=fT6xFh_!xGc-D9w
zE)aMdJ~bD6dc|vA^%SJnkPH9Bts0VseYp3td|Y&PYs0zRQN26`{?xZm6T(wB3|XkP
zZ9dVHv==?wHtiiOv8n1Far6A?{V6mz11FI|2ohv^Kh(qN&8c=X6y_TW7Z{9EY$xZi
zkkoRJmRV}k_b!Q5@P8b_GF+%G2fV8pi+PgQ;oqO;eY-Y0^_ljoVz~s&3;FYc0zOkt
zh?GF&aA5pIdyqsETt~T8!K@0G(Kw_96Mk?9cQGYu^$*&$j}AJ_$bIXF^yM)@`J{Z~
z-mRJA4!r}=VAaq}RFC_A80_V<p(b<Mabiw+(2f-U)c9ALqa^J;YSjA|uOC2-Dp65}
z23$lJ@+$`=;Ni$zt3`vCMnF-OlWd=xrg0H5!Extk#71oWF$u#s-sXu+Ur?tU%xhaz
zgR;pI_Z1&i?0|(=wOFHLuPxZIe$Zhc8~JrD6H{jiH2vnx)yEm^C)ypwJtgtlM<o5m
zuuC7WY+E0M;W;!<_wMBjqB?JqVH&cj^>{W)GE7yb?uL?Uz0s=276h0k@ull?ndQR-
zwx>*^w=|M<*76Bv&SyI-!L&{Ox0dL=*>XYNWoO%CD=a{rdE>a#myQX($ju9@c#NwX
zyPgpQke}WW9oX20@06NN@UA67bm-p`)|bd;k(4@0U}j*%PkI+eR$D^*+@ob06f-_6
z=QtRjNF30#2&7xKnhCcQRjO-X7deV+U<Xtt2wYR4U=p9QX_P4cARg8*KtGd1wXhZ2
z241L|r_k3tDGku--Pn0f`3PjAW0h>baOpZ;2-JJnv~jPIK33YtK(rf&EGyD@LMyos
z=YZ~T(PhMGCNRfNP$45hvwUu(Sm#`p=z~l=eWlVP8nr^I$syj3ZaqZthk9jx60VsY
z8-X1FRML11hRUVLTi#x)OqFOeHVCT|om>?I0+`X#8Mw1LN(r|GUw<T7KyT>0P%t+2
zu39fJss-2(x6H%y+|v!#jer%n7L7)!Q5y2F0X~g`4|moC^;*Jy>i{P=NZw7(9r>A$
z-gvPv)O6$}h8ea`XcGIhDewDTL>8t16^;6#Y+7EM>2_ejY$Z5+Ac2E%7hU@qeQA+B
zVD@JcFvg_%x(wiWuy}n21jKCpy*wN#`e`jUbSMWu@wQlU+I>DaD31yP^e{U1wPM3(
z(7D(>EfRCTs@k-j*J?;#7xXh^5AyB{Rw(wxd}b(({J5zM*&H^l`b4l^6IgJTZLAw0
zf1U&_j{M~XP`zpD<EUTj)qH*252=8nx}f7LiOx4vdv19<bu$hW?zdf<HRGzaH8M^L
zLBiajbDM-T?&F(JxAWy?ii|UF=j`UITSUy<qx~qj`!J%3MPUl231*}Kt+aaYs(91F
z!}z&b`C?35J5mayrF%W`z)mhcvb)KW^+su}FIHA2)7<mmy%O#mJX%~#$!G2H2{>2_
zAh>1QXZg3d4EZ2?_c!vnQ()j9vc$oXbh%xQJzX}dM`1g+0RNeg%cE1=t-!*|<yhHp
zla<2jGB(KLM5gWQ7!dsnY*O8qnZR^6M3z!*EZcI+iy0!lFCMuej?n(48bH0L^+yC=
z(tc?9oO9hA{@rt|q|0&juHnsTVa*4H0iK2R!65IEptFmw@eU6X#5mI*IvIOG3mZL(
z7CMwh-`@_?QBx#^y1p3!AQsXxnqF%hq&eQAV*OTt=B{blqHl~%kXB0nCJVZOxvfdF
z^o>{FF(8ILEmHOo79#^ag*L`JZnL*%lQkdEP*m+QMxW^HAS6gH-5tB0V>lhShdWt#
zH`-oB=gCG>rn>dkrl|Wpezx7OCI_kNXe?Tq!x@LP+~)dfpQXJz8B>efUOgfVks?~z
zp;q}q_%q{NNuq??3V1Z_sD6-BhR@P71g*%+#P9<M!jL$uNc$jb`al(K|AVZT%Q^r3
zRJqe9a#IHLd5)=eq~==CyYhGh-`I6WNd(kWI);kDrK(x(_;sEKYmLR31>VtgPlWCn
zU;4opGg&e8ZBz`M@)ATtv2bY4P_fUK$NfaLFbW#2BRW-1JD15CDC1Zj`U3#Wr7;7Q
z?W+K6#ro>A!Is$NrLNJ-f-DyRt?2*-A+CS{*=eWY_kv5c!QEgmkpfX6pZgiRVe#*z
zSzySf%UAy&m^xx5A6;{YLmOvcMVQx5->KU9A>*$Jr!>$cqM5eR>r#B|_QWck_OcZ}
zX#!qM(#ZALA(87LIK5?nUp?fp=_G;Z3QSHHnu|A?iutjVoZgJ=MNt@Y(2Hgx`-apl
z?!DXtzaz}6dV!HorKIx1Z1s~}?m;xEI5rl8XNY)i-N|{4RExJ-^5IdQh-W1EgK*sb
z134Ut?PML&4~s`l);Jb&R~8kuTX4L7u6kscmo|Zbf&c7!>{-gu41uj%lE=L$?Z3yq
z%Ch%FK<>YZfcHX#iA#dwXn~j&zUR>!BMOBO?w=(5j`6Df-sE<uqn?yWR1Z78I^G_9
zQoPeMwUu9RW=+djcXF)vTo%I(G<gb9;9UAtV>)~s4jR(8dH6za^`UKR7RB~=4(;PU
z3GY|$H{6(Uzd&CvRqFoWa}b&K?kKScMv*&<(4mc3@qPNf0KLi0T-6us%|ML^H~y;n
z2pQ2r`E00YgJ-X(v{{YaI*brw9?FH|7e}8sTlJ9J*T4GgR&c*0dt9K@l6X<Yy20Ya
zos5`DzeQ(6+SQhUfZZmhKqb#lXKV8e?Yar*yr-1XX)QYvN*N~9{8P<en?IvW(dnmZ
z_lctLC_@*Evdr*BZb(!l(v`Ydf`PsnKa?;1qLSjg-4tSk|3l;vo`p{V`rM7vqcb*o
zZOMFul8D?+;f10>`#e*OOaCj4dnrr@w=n44sS8UhJcM;IY$=va_`BL*>1heY`F67c
zsE|>+MyDl(ozF_^p)Q~2+FJaj*xKPa3~0|}lh{RG0Z%Qf0)$mg{UoiUFEuFWD6CPR
z`62f_xzZUm%2Z+)+g{ejftc<HdovuMNzqbS)zwg&dZvOVs~W>=3JRVJ6Pe>1kdY+;
zxXngHn3Gq*Qnq2-Pzv{zKW2Qe2v7dXEubVg4B`^zy7oj)p~I%u`C!vh5F7gZxx7xU
z!5UjrlO<5#3p+h(N-V8dD6{{96*Xr#PEmKGik&q)S3K=Fw;f^Zsb^DnI};K15%emY
zsr^gabNGTFKwF^$Y$polCqAC<-Uxjd_05IfbCmXq1cb#X4%xcO(uaFPq520huqBL=
zgFN$b(;k5LS2s!8U$C@_hH~nfSo(t{G%!0da^iu;puo-Q%6SUbHqUmwX=(++wRP6a
z9VgWH1=ZWpd|G@d(x?bAlri{lsQ5$Y^#s$0K}2T_3>-@Is)5*29tp2tNi^4rOR+<Y
zBc}*K*b+?`nyEPxC10Gwl-Vn_LRAdI{lRyKTHv$)n`;sE2S1kSzplj_dL<*amJ^5i
z@EL4miLWZ2ML-)d<a?-r0yZgIt`C!0i{5(4O5btbF)H>N6||q&N2+lClA=TegX^`p
zB9=vKTLUnK^Bs~B!?RS#RYKj3CY~M5rulYz_JP`+S@oiD(lT2usd4;cp}mVN=&5;+
zKF$mB*Li8&m@eOvn`h;ERz)b1=^y(H2nu#&#nWo52NUG&AVt@@H};n72f0Q$dcBj5
zDWjERTdhgtZe<MsIfx|fY@6WlW78>)aHdxDBCR}BEAIp-w8bC!6S=myVp&g=B#sSM
zPPOYD)Fe&4>dH%7_wfsKi{h;1X$k|mIcIC?CpYR;0`|sG<(Y_7HCENB^uMR30i98a
zwrEGt$J>X@Jd~hf3+}{w@tr=!yD%@{G1>_{tri_FvN~$R)OjNINB&+K#;;Vwfvk&z
zlaRB1gN>OC%%T_AXq2-9RoM)#T@qY!bK4X*Kn`+gIL(+7KzT%hTOfbDK1hp06BGY{
z;>CA{Xg#yWpxkWOlh?n3$%2bc_wtAfntu#aE74JwpR$ZgNdUIa_eLn|j_!QNt0w^V
zKH!wh6mZ{7MzlOk^|)4Qe5<C>y=}3Zy_;C1ortprvf_9q2Elsu{=W8R@Bv`oTFigd
z;XnXoM!AQup;&+O+yL=l6~?%3qjQpCD&=2_#|V0Db!wfu2(zA<92t>~fl_A^H9R(}
zbiRnvUB0`hxB?z3@I8gDr|luD0{jc6Q?;qx;i8ZmVxCwkHIyLuwy0OXfB4BOih4{U
zK#@Bh0yMqjJMNA(zXb6&cJ43lHF7t9W9lEOxACF?9YZgfdz&w@0HJB+NABm6L_WU0
zI_wXR|I|s6qU?;6mheuLR9X{o8&);lIzu9E^8e6PH#|Q)j@h{^)w>DsU^2)wTeuJ$
zX9ZYct}V$bkW|Rl4Zo*c&(VB~HTwPE0(9d@`^djGET7u8{$LbU{{txsdhyO0WA$Tq
zSpR=3Lk+_YOSEfy)uTmtVkS$~L>R0ce5|iFSFkGX+I$q}^S=O_W;gTP>_1dv<kk~D
z=iP6v^(%lj*g^$wGtcrRg?yC$D@Ny{KS+sX077L)_HSLKJjov_6kufiry%%V`N}X|
zX^Q(y%44zZJ7+Sf%4fl2wAI0+S<&$x`t4n<77w>$l;1J$KQ52SCnQOSJd}Vf2B6?k
zNEvj8r7)i$4%TXO`lEJbP*4RIPl1wd@w90_neEq;nw<KF=FjE-#1y($3_2hB;^-|+
z{axQ+Fg{n2W=B$BP3N)sS@zv`a3OY==_k@3=~}ceo|Y0oqgl-LkEL#}FUd{AlEsZ&
z1<&_jws#QCle~F<9N@S4NIsN~qq~<&M|K2Y_7A08>%9uXvHta}{O0rZeuQ_3^M80=
z<C(Wi5Z9w+XXnJ4ML@#LPJVQ>Lb>eJCHv&T?ZXOVnWrf!fPDF_nNejZAd!it*A~vB
zI)o+B|7*j49Zyf(Q)^_O|8-5mLh#)LA3aR0`R$9KI7Rvvn(BMOY@e?lI0-zzuGW8V
z9bPDK@)v3S{~RtxA_W7Xj&&&z(30qI$w`hD<Ne+xi}m0wrF`=HCEM^GK)GVHqn`QH
zPT{|Q&cD|}<zD6f-u}-``H#x}SLN8hiY8{#`|FR3^XGT{;T`a=;{LzuEMR+NCGVGA
zOzi)ALH+;#S-<X<4>>Apv3Hn`bFUciI_v?n!5D|sX)YJb^PWVuB0y`{pW1hIMqs>C
zvsa^2F6>6FRaHjMcnc~Z<Z-5(%;PaQrM#cZPgjF$b-?2(1;mVVzoDU_DOZZK%{H0B
z^)#E;hwXG(oIEpxALU4|1)mefF=&$pU=UTTX_-PJfZ*}dx}^JmpR;6)KVk(y`uK<W
z!`tVs+vWRX=Tqt}#3UFO9~SQHB5ad{*U1$tMC}uf*CfFX-o=+PHfHlfaot}pB!}{~
zrsK4Aypybc)={hdmZ<ad!-Dq#8&B8V<&&IoPs}`vCP^L+E4$LC7mGx*#y9?<W5@nA
zkqxFlYlespVr+D|XD%^`n6&h~8{_F2zp<&^+l&K`EJQxWW$!QB=<fWL0`T`eArH8R
zXSM!<XR+`9r|6saUK5nc1%__=;l}+MJtZ#A=hiAc$q(fLe0o#DGuycY|CJ$PXx{jH
z`w#QStYoMtSEn8#tnC3aDMXElR3yFOPk~H7XhZt=-+1t!*PQvy9~bl4KQE>a>ca)E
zJu!3lAMaX-Kek*b>s<g`SZnlz=(d9A7^}U}+9reF$nTvw_`q=KXxdU4m2Y@LoQKnt
zH`(H6olfX`+@NT`Ryrwmz=xw(ybI%BLFCV?FGz7u#<^Jj3!wYMpyauaV8-W1s|l1O
zQ7?W3_kIREafH4E^xh()yxkR2F?nN0<BN<r2UXhNvdjCy=F~~`Qn}S7F;j$7u<$c$
z^Y_<;zcy@t9hyLy`%K38mnXnuvHt{PLBKeKl<<$5QY*Xc`eayOY_)I42r&IXstnwt
zXb0A(ygBRjv;XyDdr<#4dGG$~<N?9!w+H6*gq)3Cn#|WLn0rd`cP+|VFnfizr-rQw
zSiZ<FyPw9Qul3JFQ>qE=9w3STPtOQ>fj<&3*PjXa{?C4+i)NMzZ=9*AaT}D0rva`B
zNgSJZX>1xUL)_6zN=mL;U|N4K9RBH5xp7Mev~y9uz7NeucOCBc6i_=NX*L-Zc))KI
zGWQ~PzZS*<zS)%>&X<Tqp-Vt!-BFV#*1<-fC|#;kzgo7$d{jgo#bSz4zp>AgW0O*u
z1K@|p&>7J2$>$%(mz#{Mok1^^<T7sSL2ENbkSIXiDe3dz()eVZzQW-QACF~UMzhu6
z<4>mh%K)vhq5#ru?Bx?LCfYTH9^G0PP4#dogG%mTj6qsxT<aab*@kOJHT^37xJGSj
zD)YT}G`6!2L};3$zN{RGGcpcImif@VfVB0VWVa`)fEkHit;%u2RJ%_LA1vm{knQio
zYvp<R5w^KQfmcn1X`tLSr_}m`5Nvun?Ha3>I3!OAnPmZm7q)XUpymY(Yoy}AGg6Z@
zvF{|pb}J0mED~<#!_VE&coYRYLZQ_$Cj^u6%sDba3uKm12*-)0@qPdk)<za$t9f;L
znr%2L$)-*mkgggQJ@#g9pM&k(i!2|7yqbmk>aX>N{uLHVGRVY}u%9<uxqYX5i{ZO0
zM)beZcSQX?E2yRAACbVviR`dXX1H&15OT_ej!ao`?^(C+r(v{?S&5wFG3)8xLW-LT
z8?k}!^Nes8rnzP(LFVa;b<P5+tf68UBwWkth`xObQ~ewjPOs~_<nasiJc_-LkagM0
zAvK&wbE6qWPxqnY-0R5U#l`#JMf*$Z=>s3R7Hi$L+gmV13hO1YK#Y0MH6Dw1RCk)2
zP#7T>{zT519JJR_fzNPfV@RLs*-qLDbfXRCEi+zZi}mb#8m*~(Yt8K!{zyH~$5)eX
z1lxARbFFzXG@9*2$A}60gM(XNx@+SgeNQc$>>Rr`bVjf1F7D~cQCOMONxu9${gx)?
zY;Q)cldm+Sh#kJ;^~Qq`?tT%?bi2h$CH)?<`9@!l+c<iCQn)i%_Ou1vw8XYWFV(e9
zy9c2J=W;*IKP5RWI3;>dzWO|5V-Qu7L@p=zg&w%bw5JpmMc6Ro#s9j^oN|9G|KWcv
zKk0ibN&Nz~$_7~Zr2SqA`#Jsup1VpCMuq!enqDj{4*(6;2F`b^*e9^u-A>d=HOdt5
zIR;AGG3UBx<pHi%1(zXVxetb$t<6<I*vu2gR`yjIThKB5ZZRdoV_pr$9VTwFId`T+
zf0e);oCZENXl-bF20GptjHWEp!XV})4`sjrj5?ir{f>ur7^MK_f(K%=e%sqcuVH@W
z=9amqxKIEmj?q>x;r+TwuZeo+a4Ni#_h>-oyv(-w>NAckAqN~F=+2WO;3SggPBylV
zmAsc`nRQ}WlDsF^{Ze5{djo~XTj_9X)=<fmSe5&fvXrU+r2$})hd#_0<$pU(VtE@y
zpjG>1ItL5|XR9D)zs#Io_zWKw*`7x%rG-D+PQqVmqwEmZiWD75&t2~8XN=oOlW+0{
zdvi+ib38z+M#~Z?$C6~XnR#oyziqX1f%HGizc-bCv}S&PwPyFmP<hFpfX7^0O-W9O
zT*g)lm~Z<bB^_FR4@yc~wNky7h0>xuR&oc&t{d1}Zf(BfV3;*?=Oa!@=vF8^j0rab
z)|wo*1I6Er#5_(dIJs<IxM`AuneJ(^Wg8tWw^&0C&vzKLOw9nQa8vz2A`6Uj1Tn36
zxYidJX9EYttjjUN6W3<(VEus7wYzo?$3&ip(GUGqSyH3RLAk+RETU$QC)>3=^LX1k
z?Ih&Q$lg-k=eK-y0IB@B!0kXt&2SQg_g;$K#uJnOX(gjOExPO3P&9{Zl0QVFaeGGF
zI9e)XF##R<KC9L{QvNIi(rVv|LhGgsbw&X;kkWN&)TwM|&lc)3f5=sQ++eUpZJhB0
z9??eBL~G|mH-UpO&yjP}dSzG_L$5NkUka~YfJr5AH}hd6)(DAV>u>UTT?AG&ZKKz(
z)Fg?iSm&FIhMGXD;(+EG@eB~lR|&a=;q#1&KDy{!KuM%o^fLu`#Ab&R-nW$QX?3~q
z{t2lpj|V=0@pn&NheY4R7EF6II5&C3RDAqR{+2yHdp!+RF!21a9y#zR5hwuIdAEt&
z#S!TgXvG@s%}jGBiOJwI>WHJ6%m10>fP^V}pXUx9{v(gJQB$TD)uWtyYFMa3DEI_k
zzd`1|Vl~5P5cU#GbFpsbE&zPw=<>tWfwg`Hfh}LLPod%ey!=88=@-Lgt(fdZ!-Vi$
zGrPF!prUkn9OX0}wsIgV$lb!d6?#EX^3ruE&fSLo7<2w`HGNXA%&-78VgUUzj$`hX
zL(VlWnZP+3UCTF4&D)b@ORtr>b|1h1j)ivrplT1OT$$mB-j)`6TQk}n4y&qJk;kWT
zj@wfeYw~b`w}5fn;Tibq2xYBiieqLEum{jKt>sQYww~J%$p(ts8h4;za~5lcQUY%p
zG2eAlFPKya?6B6cP9w5S0GfTiouKtz!!rlDqD3`?&q@(h7L*6_(*g&QPbK(>q_hC_
zV_!U3396_cvM!0o7&_-1zfZdlLiQ?vBovu{gd+S-wl9XkylCU5Ns`;yjjAl<dSgps
zHBKGcd;O?YG5}2S)B<Yi(Z#XiVg9ti$y>)Ok&Q85|93y|u5(I5%GfEkkD~#>|B8^G
z1Wo>fAN{jx8w>p;j`ZPVW2US-jm5FTmhCFEWHvxnV-X!C*BhS2d-1c9w0pd4SHOek
zd+ilp@;K|n(9v7My1K2i%+UuA20?QYFEp{~l|O_fPHuzY`%ehlZCtEi>cqQ=uiHH@
zgVn~a&gH#s01>EZR#$I7q;<nm|Gj0QF#%Pd>!2vJ+4Qya?7{RMSd2pUs;f4f`+D*S
zGF3P@Utw{Eub-qn5_{gTtVe%%Jz=m=3r%X-+1`&=y$rN3b8%Zd%5L~kHNS?%;Oo7J
zB!Nk?8uH-%>iF>L9<k?x#-DpY?w>XzA~{9$lpbU50`i-463#ccI_{v~aT`nCV&i1x
zoBN`MVq^71xqAr^|J2@|l)?^uO2|7P-iOK-rX66{mLr7szt?j6KHZoE{@JDrVLf;r
zsQsYyrP4{wj>U-}AnzsdxQM(@WMv_?v%2-A1?a5CLaeVa+mUpGNT`c%n@C!Za-2u(
zZhdISvbcsRaM|PFFqyB+WzO^NmH4+9t@FT|0i23efLno>X<o4`3>3$u6c-rj+DLU5
z)q**t?7_Y7JVk&q%c!4b_1n$7Mh#(akTuUY68urYM=vaFM3J>4eY{+gS?2|Bo+SA>
z9ipTTg^yE61F(wK*;(xzj*`{OI!NOlfVsc*b$Duw(-$8b^wEDNw`~Wn(7Uc7Uf)BU
zb<A(3hiPT471Hvuv<R}`xgNy1*dhEMu;#D&{GaW=VDSCAhy$zlhmYC)x=3m~@I%MJ
zmXk@p-0hE}e&=?wdNe5Em<}FVHuFVpMqtEvA-~kfMLf1g=Yx4^GBjTZYqJck26*4*
zKvSj;e|&vI_>BwH1Q>d>rHY>H%=C20C3U1m<YMG&<y08xX$2?oo=y)Gda}`Ta6(e)
zyJa~KS35F4BeQ96+I_!#mTf!SS@nb__=3xqs&n7zSfZKRR3?ltXcTSEevbc0&t~D&
z!EGgWV~^GQ!aQuwb_`AQBT!+z3@v{C+L|=cbDkgI#W|(@I5GLDi%cf@Q+h)JurgV@
z7C*}ozH~VEqEXHNWW;ng0Z@hZWZXUh=56A@NB?t8{s9%WQU76Y#{OSD0jerbWnt6d
z?nejb!EM0qBQuL>Ow^E+&~;^PBgd_>f6rhYsMJ#S!JK2Hp4Px@bfkHQ&p~^K;HDF=
zCHg59Kw?gp$#ZtNYj!~)WNR2i`Vt^L3`a;nxx(B-3E35gnBmP@J3RZ5z&6S{I49~E
zUO_)vw`OO`le2vQG*y5;FE;-6BpYj4=eb%UD&T^oOEmMpJKpSP_noKCe`k5Y$-Y>l
z)iNY63<+I1Pr!_a3t;Ei@^2?k#7<e1zrwg?wM=!|BG&an47?$9g%95K;l#5al~1+<
z<}z!6m)_Su?X@9A-E4lJw6va}%)q9_iMJMh5X)?ogJzwz!`1_Gv%kIHBA8X%;I%&f
zX6F24dSjXP<v5kE)mMWY@h=xPeYoo6m7d-5^-XR?`QlL1#k?*3nHC^ajhH$BK{p3T
z^IjY2!=?NkS9C>dLn(_PFMRCUFmVX}*H!@*lz8_an*ZM)+P3J$w>Iav{d1+T^2qP5
zne=6A;tSSrNXu)RG2ED%v-0N{9zPNE1nRmd*H#mpZkK29&tZ6lZ?m4D0I~gDba(h+
z%1k)$61@zhi9U(l_Gr?4>2nu_ry!*B6zRV4%+s^R8*7c{yPW|MtR|}0A_m{hgaR;1
z&o#-HgA_A3WPEYVtTDF`rV<W{uc@U7e#B3BSl)EEl%C(M&56+NjiXQ6(}#?%Wj^=}
zh<4s$RJ8(c`K^9O>|(2uzqjjopY&FA9KY^->_nmO8MLNM4e)bf{+CqnZ-672`#!yE
z{xx*CZ}sK5eClBeaX@Pdo})}dKs<nOLb?(0f3f$TVNqsF+vq4NDheh*0YL;oi6Tf&
zCW0gt5Q&X|AUWsIwhp3XK><mv5+zE`-H1d<l0yTHq$W4Hflg<&GtSJr_lSF+>-;$H
z_stKuxI~^_Ppw*aRoxYq!B=_m6}VEaEY-Eplvj%$xrl*lPoaq?cgxPxax-5lcNj%@
z4>tQIpil+R3kQi>2dNDL$Y7j&@<;#Hi1I`1DA#p-GU#ky3%uUo)u?`-=W^$jpgDV*
zE+*708zSM%-h&e*>g4+9!k6;g-pNU=@sdU&Ca}Q;cQiLrK$qdYcRwY&|Mc)82dE&v
zAGW#>jGg@2Kt8?_vvcSGW@nxQbjC@sznsd^m&fk`J0+-grI~r~^Y&rpYi;*8+#y?6
zF^b0>jYrypl1-xnu7+v@#_W{btSK{(kyK$>W&xjJ@mVu;_2*y#7LSz<J16hBxCP4@
ziMg_XeA<P<&)0^Jp*khU9<f4u-6J{e6Q$jF$T+l^+5D#R+tdeL+CD-~&*q29^vh+}
zUe3!ooH0XsWZT>$vz+>ZF_fx;_z~3>=f7Om)g*ct+rQUIiyFpI!f7I%>?tQGJtJk#
ztSWpfsd95g|H_L4pyB2ue#^MSg~RH_J8p1My?)#KIC1;4wD$}MKY%An=Hc@<01y2O
zfQwJ=5#jdDdv{~rk>Z;BZXc$NeNu7Lh&kyf?Zf^x?+O_%z*fwQB~CqOlko|EDWKii
zYmX{6%z5~FS_wCI(wqY*f2>%Q!HCDCr?(p@QHlVelmf`kO}Q7(x{#daFE+tJ&!`-I
z4XjrTBG@jo^+6^vHLEn~6EUBFd*!#<8S<8G{l#F>F`ZIw+~D5BQMB|=Wart}+q131
zhEnk3D_vQhO|kxxGd;T40S*mWK`_d8O>`km!D!QI{uab4EH_O(x&iLjk*ksQD;2hq
z6k*`GRp&N;P9<6e<z`3-O=9*!@I-y_e1C(NB}RNo^ZhME{BW9KnqB@<^ts}eZz+)<
z0EN;wlo<NnQ~O)cBOg{`6xA$H_Jvg^fyi`W6g49}iF=hfNug|P=k9_kt{W95gU-?d
z`iQG;*a6;8vdkRdZiYzvw(p!kNw&X#kl(8rH1P~q<)ir9DG?&}ZvGD+`m`q!kve8I
z$@Y{`C{Ew*rE~lH1=PmDSr47AvW#n@U-tQkXx)t|OY`TC6>gP;T+XeUDxtHm6UR^W
z6}<q(QuuPKX9TQTDW30Xz#y2<W)}N(bzu#APQN(IX)8r-Vlb+eQ!x~J%5wV=s0?pr
z{X}?f0m;Xgg^~al(llp}D_-9=9SK7#f!kef_#X%nuv^U3x&LS}je#elTI{%7^qq4m
z{ce-^@vO2bvh)BFigZ+mnCN895oG3;{p3!Gd&HES!ofeAg(|nc#pNm7EFJC4)D*FB
zt+Afi-M%*1a`DApFvXce?Qq&Qrf2<z{TJ)L`Pklk>pr{O3S#gphtXIDHDIw4*F&nD
zdf28s@g4i!rc{>4>L%*v^lm2Y!wh2Ty!}dS(d?Obb6>z2NoR@s{KimXAHDz=^4$gD
zZi+dTa$h(&Z&K0_LcZx2n;^YQp%L~i9SG>#ze%KoH+^Fls{hI^XsVxKXTO5Lo5xSI
zB^=r4pM8YDk1Spq8~5|`l|3bTXT%5R3rXN*IeFRbu>n-gS&q6icf6^FLVhLU*$!kC
zqd+)GnW^@xO_0{9&+M%4p-zLq?0*?|ttxpkgqq2D7QlMZBV9xq%ko~cA~hGTz$K0&
z@GiIkw)rJ4d{-4Ec14&z<yDPaej>fL>HIZzJRjlQAeEvY9qMKW4`UT1doLuMXw^(I
z_p!N3&iud?@xFS3HuB*8Ci~{c<#nK^kZR6Zw?Lujjj0Dc&+an(2z81^m>40^nVzoD
z%DJSEe|mME$)af~OzuzyUDmB#9oF{ihqBCn9Ao^l2VC~Zvi}zo(Z8C_nXB@r>%p;m
zrzJP1iX6}U<cJSVSZO@o9yIl&@8w?i5x*eHfYc38V>><U{sx5d5U(mCC=R^SZ*Sn5
z?q_qI8oM?<u7kBxJxP2H2G)&a2WG@a)xh=^q*4aU*;?&thp}1RLHk`E#Q4w!i;u2j
z`w`h+Jxd^Kdu_W!b}`j`?MNfFCz5#uWhvIdj^o6y$7!cC948kBvannO^w_2l@zDix
zzJz&@c{Iv-eYR2~M5H4Pt$2yBnrEc_bc^8DdA{Nxgxg2Cfcf#eUpR5sSv{9z%ZR;q
z+3SS1hX}Zyl7(6Ft?@+7+~Pws=w?x3-jrb3Ti1$P!#2ZXp2G8(x7Pxa??*y8lsu#!
za{7}IOD_#vCm$e`7>rOLiI;+YqhZ#V27mpKfwAd$nDm(kH@Q;}D1$9BeR%yz8ta^0
zm$}F7OO<(58X=NzJGj5)?SBAC&%RYUvHc|=2P44G>%J>Jpa{_i)rmYzD+Zbj=^Rpe
z&Y&TQ14Z*Bkz2#A;{???)#)`XG@c*HkCz!_7j~7SXYU3X>e=p$3!YAxs3y(SrdYYY
z`c{c(0qr{=%c68Mn&+H#Up7#b>`wXQb!BUpM?xI3`2ip+q*0dVijO&+pMJF7pmSn3
zK-8?Sg;y8^b*(ga)z1HNn>P8yk+rQJrCs<9ws1jijTggQzPtDR?dkjNOfFM~L@&95
z&b2?Lbelcg{q<L>Q`^ZgKB;HEjAutr=Bo%4VpfKNa+@}vM+(<@Iv)Fhj3^c`+>xTI
zh`WD1)rZv1fNox~VTX`-Z}o%|LJ8#6v!|r|?gVZ;NZULce%bo&Yuu+k(UeCDU(%uX
zyEbFb6u|!C;Qz~yu&&3HbZ+zaUQtRs)c9o&=<xZSne+;bA+5~WJ6QzeTo{Z_7z>im
zoXd@3O!OX7pN)GjJOLQ-XSoM1G5;MX{SH;){NLW9<zL=n@mH!Rc%|$D>*QxM@9I=0
zazcmi6bee!F~T}iZhqby!rZUi8ncx&-(SXy;A*t_yI}73ml-Ym#v5Gvs|$EZ1O^&W
z!AUe~lTLC9jLErIrq`Q;3V-K2aNvj0&u`D$L&=mYT?eD+{}@Lf{`SDj^G2#X+I;ry
z_h(k<^PyzeAzxWl)}K78Hjt8hi}=f%@1Q^56~XN4w{#NEU%b6Pz1_dT{@=v>I-IhR
zL4kkqi+=1xeK#WVT$FHc^W9$=mmLKC`!d20d^0xb|GXBE<NvDNnz=x^HAUKUu7`2n
zrr2hf%NFJO;*(;ictO&Cbf>^CyWdkHkr>M8SY^O!yD-^T5-Ne?SC-JxYm1sJkHfwM
znYQVcaLOGH|ADS2KcyTHFN!A3@Uwh*FTH-x-O}5dS1QvMj5pQp8{q+SCY{Zdf6Q3?
z4?w$flTtz=0Srr|#}V3T7q6<-3;^yvQU%J9X`eO8TX12OZ?`x6d~xA-D5tQA9SjDk
z4RSc+y)l1@I449&aY|K)y1PaJ&RSeJ<v*0#1<F9-7$%C;z#J!+n?0Ec>~P;f2xT;F
zZ2o8<gP6qsn`cRbQL}o)5vV?sm~?yF5@J!K5k&5i1^?-?n!au3$#2U#K%J4GtF3UD
z`JsilJL&3-3;I)=&4qujQvNQvP3Xp=lzQM<+h3Mc6yzTttk)FcHLv?s0u$fnU?MG)
zD3Q3;;x+r;WA?qfd3zRI_j-%OyJx5B9-UWGuMry_I#eZ9QQCZ_LRglFZ@R0av#upG
zOwzVT-gxxOuHAd~A2}oc2C;iLbzt2dS~FE9{ZaW#g$=Bg!c%eXi<^_t5R+F$qR+u>
zSqp_Mr9b}S?|)c7dPMwI);WhWrky9j?X{=7g}qMq3!k2xv4EV!$!sc_*9Lz3yubfz
z%CBy*?SfI&>FuVz#1$gsV4T2eU8^0P01sXH7{C^!*&eUgc1Zul_htX!F|+5-IJ`M|
zb5y=QS!f@v%lsGFZJBjr$<JbFFEKAxm+SxSD$bl5LFKMJPgRSn?|XuL&R>G&5H`8-
zo8*45g#Aa-!@zCkCj2m}Q<3#d;!Cs6VK?S_vrW6FJMwzB^&k9Kvh1g#RtP(F+&ZV^
z!GE{*%MPRKjETWf{Q9+D*r0)j#n3|k-O5jje<`%=^1#26ojFf^h`{MKy!xo+8T|pE
zGe3NDpiZ(Bbt?L%PNt*PcU1To+=sn<B|jsGM$b4xCC>e~i}=vBq2Dl*#u690k{XA7
zrjlFA_1`|iq3#?sXuWUYMW|Er0`6HZH8k>6-r3*v|3~lAtqAT-%8ROo1uL7<usj6Q
zkt?@{OkWU)_ou`1IvAuLC}jThNYH~L!N)~868*cWX@~5w;+1`*nf+wfE?dVf?LPDW
z_7N0ars#C4>g!{3HkG!)CxtEv>-|(6b1CX5^i3U4h&%LJa@TI4Y+i&ewpC!mkcJMr
z=E*-hnin}JyV~<@S5-!<^{m~(taD1wpB`9(E7oqu*|CAkcH4rres(&|uTx|i`%R|%
zSz;<wFdmx-{Uq(?sF_B}>8#x9t$2N#=h%)K_NY4e;C`0#QOCu@g)FD5VK*uSSW3v4
z*oVXAu96w60_D<n$T>vI{-0{<2@2eJQQ+n<xCgmABB&u-%;+?~UZIkr%M@B5)O!&s
zE-d*o>7Li7ywe-XJ6-z?aYP4=hh0SAzN8zK>uvbgFE0G-eOiuCpz}OMPr_kTukWA#
z*&o<*Qc&(LK)LIq^82p+MC|kwOx%2XkfkwZKTD(WPoDl}_uf6UC*-t%x*P{zhko+@
zT5o`IjRo+4#h-OJ^W^Q$X99Nc1b9`#t-Zk70A;#(VrMkD1*51PTLuvB^J>_kr$0Hf
zJh#ABEMKDsig8pt{NpXooq+0*{9cM0`K4170DPVN$r(tOr>F~^_Wx}{uXhQg;ol7C
z_lx5<>7Ksr*lg?GuzBEkYFD|BV3DP;{*ad@c3K(}Kf~E3LB=lkNBVwtzj|1F#myE~
ze@ul>a`@;PR?avIsREUlf79<7VB6^^LmuOG9D}sKUOZ{I!ycW7QY7Af>vxGKMU5S7
zb`6TNFU@dRe?muHzX+8~cQCr(Z}t}d(c3PxY$~23p_51_!<3fbdL>2GKC0bxRZTRQ
zrd`Ii9En<e!!g!cGLm2y_u4nlb*|SDogh|ESZ$3P*?w&SdBzbY^T3=Oj6eEg>=8Np
zO#`m|xt<H$gmZ2vPkc=eCrTd28pqIP@!&qf6Z1U4DG1-R?6+vW?n^7}lS=Suj^ZC%
z4p<D7z)Zg!!9Ine8KMn67gWn|*mW-CgHd^S!(s^Sf<+j(Q=x8<S*?}z78{1*bQqQx
zFsks$Ugo$8N3=IULZymiOTI+?*a><QyoYjn`F=mW!Fqu`jE|741T~v7B5P40$u^Ub
z@QJXzR8^8Hw=(%A*CZ}sBk_WqN7I%?Jr{F!^vK-vwC(yl?gSytMZ7mcd3CDQw0+n;
z(7ZKP`+h$ZE@QGWfJ$){j&&R@VoZE?mtVhL5J@=3o1J(26~1qs^8oAg>a>hd1Nrfd
zP}#4A9vK?Qa<{(F|9rtSCn9~n>gYLcDKX4Z?Boo3MugldKxBYXHS<@v40)MiU0URb
zB7CAlCTTI!o-6jE0cd;(oA2mGjp!}_<l)i*6pMfxa=gZQWsma4V^`4;E-uxWO>gM+
zDUBal`y=V%l+6v(`o6h`0+BaH<<SjT6{IBm(u14xr6|Pm3<mNNc72OBPiQYKXCQv^
z(iu*eP}4G~HmDckPE3p<Ui;zm&)kxrU>Q8+cPvvlbwWqqHKi1RLwCJs3(h_$Y5-j*
zoqy-tiT`#y8eed~gkANdb2Q&WTS>eL7g3SFpigf`4~K5QeTeqk5b3JTkP!`0j^uhE
z$b0<9O8c^mg3r|7jZ4$nO*V!YxznxJ!lV;Zm9U+jIsN9DYNlX{O5pS3-1T$zl?i@(
zWvX&Vb@c8J+)JLTd9AC)OG}zUd2IEF9i(@5pJ7q9B7xZ|X|DFjRliq)^HOdP*_drV
z*uC{t^KXFra4Cea8g`{zHO${%(e!jK1+yi@=`6Kb?Q7C;qg)|~q1AM>0bVcMjyTdT
zi!*r(DW+In#gde0J}uDSE=nq$qZL9|t|q%S74Ifb6LV|UZSJ@9=Pgf<YglAj@qv0D
zo%+CL!8jw-{k}wPKCAigOq-tk2R21@Tph{EkxX&Y1DJu6LMCQj+2E49ytN3GiNyA+
znq6PRm>I*QH?%^C5uZ7eYP{yM=$k5DNN3hg*XbCA`L!cYBq^w&rM<f*WGfabeHV$b
zf>W<6RDxU97swwUd2AJljfIGfJYPP}WfrG%f!nttH~)@aANf<5Nwp%IPFbSNfZJSa
z(v8)r<(^Udv7Ww>7Nd+J19&wI9QhM-xu_(ET=UkrI)%Ah;LIbe^rCGpIBs}GGvw$9
zc263rZL>H|!yM(?Wx5s_jl3QVIpK$U>?h-QIym3#v^2%7dwPgv8rS{g1z$IJ1DF27
zF^hOFgSC6kMJ>~*^jHM;t@zxKN~*TmO+h*Q!$N@Bspfh@x`k+y3c30mDO+a6(~b^>
zwq53fbp|sz-mJmSZSdkHulfrOb)hJG?G&~3$SRza$cSeybbXcwlj#bP$U%C|`Xbx-
zdC;CXDo2+^oVA_}*`d06bM<~hJ@5&&${Hpa$^4@C><8aDz6wG*MfeCIR$`eoO0-vp
z9^>W&rC$h4(`{Qh*i?;o`;X7KeKu@KEzW(va3z5CI2&|D*I=ontMivfHgSW9aE*GW
zo(C94hS~z(2&a5`zYcV6s6IA^^w<rM7Gw3+f??pm$Gc>%d(1zVrPvi^tbWyPx1&`W
zXw0}^LxNtFvR7hdW>s$KMSke=q)y&Kn|EJ-j@JX<-PFZxdmqMo_g?6+zl~Xy@!AN)
z;h~$E3z5d*I*HzVzKrGyTtN`xmBW-s`3Gm){5{3JwxjGr{W0+`C1@ILL{{6OyjwmO
zaFd?-)kZ{*6tt-jinWU`>iaAJo9s-TG>r0SbrqfTu>jm4vVQIcjH+zZ|8z;5-)MCr
z9xP-8PBO6(buey;$t&6?IzhcYfPvI+R4hiysgX&&Fsh2hO2c@sn%gt>hK}p&j>M1>
ztu5l9`UbX4k;QZRN|9k`QW&`CcDHiAfR>!qK^CP;G(*n#!<HEY8+@`Y=pxJ4ULI4)
zt^26RqLU&3jo|Z>+xU|3!Y2hT2jYu})M5L<Ld%Y-2>FmFbaJAyn-0bZ&+U>N7}ea`
zJ&wa}N|Kj*t6_#XNr&=N$McUP7tnpR`OSQ<?q(N#yu1E+DZDD|(vL$d`SIfvN08zK
zsxqkn+9BB<L6j9h%x8EkZbc`lp+xii1RfBV8(8k1Q;}DrdE0c>7w@)kut3iz@5Z~n
zD>7ZHZ^7_F0ZwknHa8@jEMntv=+q^Vh#NB#rR#0p8Od!BW73w%`*RE`xev$^3olJ+
z29C}$i-!+!Z!J_{y~T4XzD{j|P_D!F^*N3vyYS%4P)<m-Mc1agp~uH}f|%&0_2#sf
z8pTxN<MBZ&!<hu)Mg^8bxj?RJyv9J`5g1%`(bh>mHwm0{bga>8O;MY3>nUEozHEoY
z6Y3Jn={1jik7WsweO6QZBHuh`mpc^lf<rL{)5Jj6^F+?BD$l*#_j>1<rk4&)lYJAH
zM26r|s3Kct3%H|6Y@%G%l|}e*b(xBK+mjK-PdU@sB_c51%MYr?!S?f;(JSTa&lmJ9
z=HXZ?uIKw-b&7ZIm@E^;rA!j!LM}L*IklR>n;XNX_Z54NF<!UP=*1qZZkOOzTbkt>
zmE2yJ_x0t-1WzZMg2~jGA|pi>NG{^?$gOib>{Swl+990(9{s(^MYN@SM)L~izppcc
z;ht068WN7)b0r0u?;uxYTBNNLIOk2Sx*5rt^l>>Y{`9z0(0gGg=|p^l?}+D=dPSSk
zsJtyrUYLxBMT;1=8;{tiN9B<}LSHW~<wMG%WABinm~%oWqxHFnRhN5FXCrQqPRXz$
zaJ~1I=vEoaxp6lcHsQXDbyp45{I$WQ>vo%%$(a<hJTT$eJq#N_xYfN@YZ~@U#tkKu
z%_d{6y4G(zcU4{<;kXgBMI%s_-)nn#u*jOZ1cS&y0xSr6yf4E0a%we<FqA>|#q?No
zR>Nv-QZ9>T_<25U!wp!Mh)*@XC)*o(d16avqNFUQWhHlV6J@`-tspY1PtMyz8}BoS
z9{Z{YZwa>16N=lAQ<g#2STU<s+`IPPYg8U-u<yyIP|3WfQLec>fIQp!?3cZ6Jwh@@
zWs8M5tHULWIaR97QS+k1S6W-DVLo4KTJHI@?W5%!ppQ5c4www#;WAD}Z24sQJ*%d=
zF1M=OstaBacTK$<l16?{wTds>1smntnr9R?PMw2%m0MRu&X&CI+QMFTIKy1)h@~Ry
zSc?WpvRhsM0k{F&`;z|6rKJ5G;KKQ0xM?s&r|l7IS|au%(p8lssi=kzLs3*krw6KG
zoL}DH2jl90J#gIG+9+*%{+)}jFfAv|w7#9(Wq-eQHWfst2E%Zq>3qLq-gbGMj{TiU
zAM<^*m4x}Ej?`8g%TyTWxcmi0QHRmxw8ZD*>XHTOCElc&fOo$5fv#d}`$9ENlwh~p
zkeep<UNNe3W)f;dhL_I5#k4HFmOU+MQ<-z&y@%OI&MXd%9YRav8kvRfo0}-_+m!yI
z64Ug;M*oEk<m(U79I$tXzU|-b-}lcZzenJ5YI-|e5q2C$U(74Mximgj7Y%8K@NCB&
zW>I2z7rA%lP8b?Qz^D2ua@W-YqHU5s3`!OVIE=pX3rm44aib2lfW31T*z_K9#Zk?~
z`z^qIJ`<A-^R+*%h1N0ZbAmBvaMAY{f@+yEvyb%|xhlWX=XAy|;@Ovhi$4Bo7u9$Q
z@KJEv(0hfgSBfL6Vb8wvnNc@h|7R|O(*YKb*%uW_Dwwj)7Z8t`SB}jK?iS{^i((G5
zoFufC<kh)Bvj&a#webi!yg^6OT?e++gz)Quj;e-K;WwAERYb?DDaKh4xm{lvRP-_*
zQrg#<+&jCA&6lNO(bc$P-OzndR9)h0`oqp-<&GksI^c|r`9~WCMXF12D}*p5<O&do
zRr_f923^0FVsql|1f*@R1tn>SXB)r!k!hun!Xw|@X5dE!D@*L7jdv!cIQGfVnS+&|
zcX*SbXlsERaWv&Ce%QCRvNGJ4o2{ELYr*O8Ml&sRdHy&q4X083a&roWon6ycPU0M|
z9l#jsnc_KlKf>wyxg%^(Q+&Kan}K)rZl9p6M^THF?wlwlvoN&vXmwPaJqrfzYjtxu
zH_k4oIk#N2`JL*I&&jR&Z)8OxWu;|%Xr;+(*E$fy`I$!C2=<Eyri%1hSBw83OZx0>
zlrEN6AehxUC(3BVJgv%khJeh-p2_WP2e|0eRbu2P8GG3}%I@@su~}x)EVf1I33wsY
zC6yaE?YqGtV)w+N^qiJ!Y!{)^9pVdFGzT%t?9Adz^Ui{G0B5u&y-1t~R7+>`SG&3d
z5d@yYR~sR5BWOjoQkf~Z{Yas5{%QGqetF+80s|eAu%ePxSg)|YU}TCn4V|aQ&ll-?
zExhb%4+&uP1VZ82fuQ-UL7`iOzwvM&;6xTX5I1;z-&uC0&NTMjvky|*$jMy*mLpEJ
zXZv`lg!IOcZ(3n~xBu9w!z_*V(cy<oerIDfUBi(d2VnSx)4&yyt8$K*GzLhXyTVI7
zU!lX|*tpAb_z?_Vo8zs{uVeXAO4mN2XpAj7G48I;)lqrTaI=PCT!@A&v2y!m!cLJ8
z#ZMcf=BChW_jXeYY~!^ZS8d6y0GA!HGH%buLnTGBl{V5Ko~<EihFNcc%=f)y%E<Q~
zlv~z9i*F<gTRqe+$pDMr?7JMD^7@wu$m@|lV$-^FyX3hD3-6_`4LzmlRh@y&b%0(y
zYC&2U6M1r_GcA>4Yfx@$R!-tOkN?WtI=e$AXRF~xkx{#ttR&9gubu4s7IFYa<;#W?
zoQg@(3}zM+xT|lmN)REQ`|;sO|K%GY@g1pxPfH1iqTEW}5vL*xS4u`aTnirxxx%*_
z;9gvzQZp?rhXR9Mv50?Ix!K&H)@SrWU2;J0OjGx*&&#TIc^+*;Cd;4^FbSZyn)^pz
zFQjl1jH>A@i35jbP>U5&wujbBFxFMk5g;8J>yqgfYmy%<^yD6VemR}@u~*1yZTe~j
zzZhD)t$8m4CvIyw?S98<HHX!(*Vkapu%Oc=D4qqW%{Y70pas&sQjI$g`-*KV``rgm
z=2T8W92bywIh|ZW-V-F0Y4Lzw+IoSc!x=ct)ZA7(+&A~;;j`~|PyV_C&fVTmVe$@r
z%NzkCdg@O8{_SpI;uw)c_0DtEJg@U$bAzPJT|qt`ZW<8c7GFEWEGjMh<k>ZHC4{f=
z%WnU22~14V6214zx(ga(#AndV=to#iD;<sCT}|^xX6960oiAT?^I!G3Pc+cm?#)gU
zIELIFj9czn$}pWqVe33VfyPR!Y0)BY!@3S6Hj#S<7b!w0I*mp2idAVv3syx6QL+b?
zc(aP9eu9-+<F<;yC+RWqa_cy2n<eCD&d6&K9qbYURh8~TF3kz#iaU6C9m4_>^#bIw
z@%^fzJ|4bzNYa#)&{_jqkevhG5Lc&fkJQnEk_OTg@|WOp`}_!&(miPq&Y)$PUOoQ1
z?YeEk?$Lxv5BxB0Tm#Q`S6t(u3~odwRFcr{@BUzAqG|c#BiQnyH(M<zKu)BQwq%{l
zsWM+o&=Y0QTcYzv6oKi_`Z+<I56?j<EcUW08e;;&@Vr?b-uimxtT=DQIE-ML>989n
zgKHIhmSk!S)A8F6DIxz25L<Mv>Oi2peoUfS4*VB<2u&Er;ltWg^cf<J3DUT=CmnBn
z@k%7P(ql_2DS`5}jLrKGmkZKI{_y*<i`A~Up2qwzVF+7cq`0JqC_FMHe8_(km+S{0
zajfg<YgiW>xzjxXOfNk{c91~to!h9hz8ltSdgZ<MhOt}G;~$dL`3&&cyQw4C(h=!~
zn;oie1@t93TcuoQPbvp)PpA;#PLNq{*eRsjJlZ)-eC5j%zii!(^^v}j6IHnt@6!>0
zS8!aPWK2aJIboP}cNtu0)X?TV&j|Q~X3=o_{2Hg>u~=Tgz+&6MiOf_yt_mj?EQ8D5
zN{F)`@$6LH4=zZ}US|cJP^Cu<ZfVxTTEzw~3P|G$_3(XeUn{TywW<18J=A0&>De{9
zU@EUgiDA*EIuM(F-aF<aKI}%JU^JwCbhc>^weIb<DcuU~vc>MejLUBwpqvi#-%p2e
zWVYLLO8BCthz1VV>!S+6@QduBa$7APQv-|{-53ocuZ<Uyf(#gZH-ost>~qBiz!AjR
z-^Cz%sHmeBid`taS0UK~4n2j!mTP3=GBoO86I{wX#7qGxIq)B}?$ZR!ioq}5H^~|_
zjhyYdoCtTkDd0-p(A31CUE7}^W8WLYtK5Q2{mwNerLtu#%#nOhwZwiT%bmvg@LUZN
z*Q)1c2lrT(v*7DRw}Z+GPgMlPg<J20qesqq!;_^6n4_RNyo6-s=Fchou}H^|MS1Gc
z{0pB+@=}sU{WUVqV{!Z3OiJu->hGLdzTuo!4p0-PBux!*o?=R8P1TBA;inv#@ve4c
zBfNJL*Fg>L>1%#AAwC+O#L<+#ql3uz%|X<pIEa7<^pTqga4|EKY^T?^FS7(ldUb6E
z@8bh5A%1<7x6KANk-6=sA$w#2)t)%wg_L7E)#OHX*tHOFUA;!m>qC8npcKmuIi^kJ
z%Gao|GXs8aWEJ!IKfVic36YqZj&W1jExylZO_@_)u^Xe5PnT7;o$+E%;UVDRO5?_O
zXVBY2NqNO;kLgzQohvsxtsR$+HeBv~%fz@tJa>TNs4RaA=S)ZC%{>AOl#D}q?q2Yb
zk#n0b?RUb<)rXa3)3Cha{qWICW^5&h9HoA-Y5Kz=7pgu+$duQ;#$4fte$eJ=8j8AY
zeow0)SI0)Y=Z`g<c72!;zK3o;A43wF&isgUe)Tz?Bw7~Ciivl;BVyUf$)z5D(tFWc
zNr3rN!z&5hg0nw1eER`aD+v3Z6*8GeG}AhQ+o@8IHR()yFQ9n$O%xw=&<d?)b020`
zm$Vxc9wBN_*Kx!Bj3kbW9RG3l9!6pKZ*a1IPiDm&%qkpn%4@8lNtrA`d&<cY2{f1J
zIY0EjGc@&|EKd>k0;H(Pk{J5#mw8qH9Sjr~MPqori{wAgG$pfBQ8O%*JG4kxP{?kl
zN?-$C-~M?*@fbiyK0pQhlTiGhoBe-ALeWLvvFITn=X}V-5+UG$wb1`0NqgkHJB&*$
zwsy$5of%~6LrL~XNtM({@*`rE7$or=Qj9|mByW?7C-Ql3G)HBR1+YB@mjtPPHn_b*
zdX5r8!<-l&_GWpyEDoLHQa#DWRz>dRdmUO0JNDY*@@P#EKYc+7_T;Ak@`>^K5MFSB
z@DA=dg<zF8Jx0mmyUdF#2D1oBBR0*d`A!XH8Q~INC^w0R-;VP}?0wfPO;bDFkz_K_
zc=R>zPma==TZ_93+DBvui)|UNA@Gt2^3<H}rPDB~bC=q!s*B5_&0f?+KL<&aIxqz4
zCQH@g4?T|G;Pgw(o~hVO6$<Ymi{E^5QYJ{23*Iv~B0R=FE>B-{A+I~1S1|}kFb(df
ziYrQY8aVJ{9R7wEFH_{3ha{I+oLf#E=ME0rg+;!OyB4W?iSFAPy{az=;VPle1Xcx(
z01*a#{RHK4-1l=a9+~cU45f(j(3WV4+Q$;e<Wo+EGh_oZmPQo<*1lk>)k&B7?zgh0
z5BKHjHkZdUiX3kK5YvBSOC~wLWN6P#cUy*1phy5!&Ai;43^5;AvLI5guERlD$Jv4l
z9iEF@riojO!4#o}$&rp|rm9}BN_qTaaQybEOi1}iE;W-j2`NR8avZPt_+%^qOO4ql
zW1WAPQ*t-;O&>)jT8Eo_`PWMxqH=ugnjhzt@zXqgC4PK(hX|Fz+P`7nBk4B(67|lw
z_@s>0bsy0WP`mvF0uRr;w*Qpv-Djv@4`a$sy`DJ~R4{$4S)st7y9wAhliFurFBfYm
z|3oAqns0pZp&cMoJJh=;a;yu6ZP*+N7^fuqUV)@QB)LcRxm$tzGk->X$%t-x<tZ2(
z%4&yttXE~Q0|P}l3FAkUdOf6Eren;Rl!{Zy;3fsr?nb!tlenURea8-;0s`S?Vs)@u
zs(x%3tt3pR`uWD&U>1q9^<iu}V=XS+KenBe&xN6{zR}L?6~fOiBzX!{_(WJ5f5A{O
z^8ukiKIM9o%kzV&kX9nDsK;B32AqS%*6?ChF*^f0{NoOx`!$=8h3s8FQES4+ZhrmZ
z&$cRGM57<PaosjeQVe<a@rkT;_`-qw0#KpR69aP^-xVJbidY?5RgCszd<KM=ic#M8
zm=j+O;!r2DT3}NoH1E~NL(&$8JEUJI91$DLjQ274doT;R)tOur%-Jj-asP}2mqsGX
zH3U)8Z_{syY$q{S!o7*6OM^1Cm%F=ZX*XY@)mo2f8|WT|f$VmJf#Fn$y0cp-L)kNW
z>Yu!wNM&`cLH*`^px)O4e3+4hOEXX^tNu4Ivm+E$6=Px>1y6O+D>Fe2NL{ZO8aY`|
zWE&l1{F*<u<l*f`g<E6Yu0Pu%y*&|GyCb>OTOK@PV>VR`3%t#tSUdefPEqUm@pPv<
z%?W<^+4_=2Lurds)PZWVw;~UmQPR_q%Kmg%g#9PG|C;^Q3AS5WLc)Fzo?_V@jGxY=
zy4esOo!xiSr}ih<V$5|wB<B%~kjz9bcNe&Qt%7z{WUvS8^h=AJ4fH1`@sYeM%;_GE
zLHri+y~Iymf7fndWxy^y51;(y-q?ws3hN-l`2bh@Q`9`0dqpn)Pm}*|vUqq8IAiCw
zqp6IaYj!961ebX3y<zFCdccxC%J`*wXDyU}b01`6Urs}4ADvUb?f#Qhq#ILY5#{*i
zF+^UI<KGtfKhOd8lu}6e4l40Wl=zLG;@#uDpYIO?R6FRmOD*Ilug7$kB4pA(LI#-l
zkC6W`cK>MdpXvU8;Nnl8_#e3V!!h^=F8;Jx|G>pRaPfEU&i{J2py&R8%8_cg!I;1t
zCbMxp-fdfAdDtD@y2PTRZ`&ijx~7?=Uy@>)qTL(J1|?WN#inrl0TBQG1MKOM-@H_&
zvDT%yJv{e}tEug8fDyT!r)0OZ;G12t)GbRka`R+!m-&971$3GQy5AW~G~YCm+^Hep
z;eLugoAJ$`jlVD~HuCUEzdc&6$0PTGW@>HU6Y7Qv?0Q(AkvGRaT0$vE=~}3cW<Uut
zlCH7k9}Lk_(yQ~%j>E2E-6i@-c2K3<Cu6y3iT6&9&syg&KH2B1EuL%t^}{u~P)&7N
z*@dXeX6vjXKV@7d7Hj?EYFZF>YyIxucBc*P--f$RLB^}8HnO{vC_$M8+}Y1ywS8``
z8zCDaiuUOeU+hPoD7Qgu6$?3bCf9hLW7y{_aZyjiUiO+MehQ=wUoFa*r`ww@tSu{I
zZ&bM1c73f{>*UQFZ-erAro;URexOx}t4afjF?u%ahOU_KF5f9ah3TFHEfLpeoPObR
z3=~fB28Dnta+`}4*am@$#Zw##p)ESE2)MDJwjdc?f3^es2E!Z!7~swyuVZp$w7M{@
zoU}bxzfdxwl|G%<rm#F<0cUKpD0Em+ZfN)#a5~-%E;18+&#WVbSN6;Uh3vH*-1~<<
zyC**^0`h3w+kRH&-7HAC>X1J9F-47}X=g^w^bLY`l=J1-;~KK3@oUl_()|>87fTn=
zc_UtPC(6mJyQ%m2EZr@%lv=03*VH=u&+6{C`dqoR+yJjtV77m~aJP4onypl-Jh$9Q
zGT`ksXz=9SX<5ywE^s-><|t9@AWo7P>^wGj5H<GpqQu_6JHx-lJg`7Yx!xEDKXvu|
z2@C8OA<5Q(bA!ckGO=Rt@>_D2owa~lF*}5JR0<||dK7P|^6JpBcr2`onW7fla-7K8
zI=Y}{lr#%kexk4X=G%TGK<{Na7+Jk-?+UB$RN>bxZ3Thon~MXgZ=Eq^W5Xp7{%+1I
zR5SvG*S}UCqiK!39CQWZa{^?})Y9Bh3+{D74T<7isoUF`?G0e!Z}bRuRS*$e<YjZQ
zYjHv0Plx5-BQ`&k-}KU$t7_M(VE^T*80*EEk%hFk=!VfNDQR}OBo5aDEK1v)5IY<c
zyG|))`O3hXTYlFEzu-<u0EfvfGEuXBfV7CAr8~e7h0QI@(dCZnu<_ubz7aMb@iS<?
zDz~u%4Ye%JE`bZh!;&)X5TDr@3zIu`9numJFV`u`uP3|o$k#Nxs8^}ENzNj{)s8dh
z<ACX~t5+=oPkMi=Cl|fyIIbqf*j6D>c`M#+u*rY*xCX)6N6t)1@+r}Y7^R=1uNp5d
zB!E~8EET}HZVM^0ooW`SP#q+JBIQ7^UM@+O=_4|@0bbEzmn2XdcFts|ba~lQvTb#&
zs4vy`tI_5QNrqV_@ehMmnF_g2(jNG1PDE;q+hdIGjpw>x5jR;n=iby5kw<*(rB@oq
zZx4T+&{Pk@BH1ERH_&F0Atp`dq8cSspTVf)o>Q}JBTK*5lTR$()_<GRE{lSWhloCl
zBd_LO?eSu^iNd#r(O?E@OoI5Cpi-FNdo~?6oUmpMC*}Nnd{$;Gmc0Z<Cj+5tq4z(f
znm0FYfT6LP<8P>NDw*bP)hZkAFL&Y<T5Krj7btqdICp6G0#}?3%W8|TMuNG++-aNw
z5(CN6M4``mya8paO~1%(FD*PoBYf{?RbcZpr1A64{;Lz2i;83{Nr?ezEk$zbUUtM7
zx~D}SPXgr=dBv&z+w(fOFu84GJ|rRE-x>pPP&V+Z)AnCYcIbTGP<J!{$J4Fd{_aD^
z)42vv{cx)kf%Sui@)!4uxD7u@yJ~nxX)$hyT%?m2v=>y}SBaW6(m8G(RcwHge0^WZ
z2lzBlAo{i<{8o%90+9oq1N-siDouT};6}C+>OquYO1=LosPjG7tLvS871b<&yd+S%
z)S12*?lXhziHb|Pa@4>6b<L_^<%x;~gga*twkK>`7H>li5|k9&7&0v><iTeZ*hZ{K
zSio8F*b<HP*_y3nW#mLL`=$<iBPW#oK)%N)qGBa2ueDgJ0Tlo1itGFj>fv9k*q3{I
znXHB@WLW`s)>Xbe3#|?0&AF9bywQc*rhCTgt)X9?Q#D!03-OUOPPNm&1<JOrKxl&*
zTH_e^6|{N9U0+G@cH%^xtlXG&?s!+%ZOd>lB!fQU28O?6gnh&lQzcURPKeU*uu)Nl
zDfTIPp<q)%6tLWQWHTy%JBf*>KKRt}AOTta(zj2!ithG+s=l%-$Hc?;9GM7%8hEP3
zdmB0S!USdUAC63f?-Au2ww*L!cm@vw@Q!;ug2p65h1`a1b9vOvCk8C+mxc;76e5(*
zNFcVRQ1?>2!{#RoD?e?ZYI}4HjkF+DXAel<b9zs2GT)!)uhMjPKZGte>f>lE)QHVu
z>XNqjzhldv|03c>(Ms93x`$)TnEJi388jJ4QGcir)VXqN!yDO~^?4n%1sw5(dsW^v
zyuj^xm_=MBdXPLS$98KnZ7Ko!qGl^dP&zUd(XPX}Yd0MkowU4#fz*1<<!C;*FRR;a
zXqIO;6TJZLF?JX{N4^0?K=U8Plk>sAy{~yq=BVUozo1~MEwn0$3%T{_%UdDu3b(w?
zh~_j*5olZq>IMde!LZz=ZR9LJTU7H+hjtkpV-H#H2C#!0TV08cBu@)QyDi}9)ZNTf
zZRQI%xaa!n)%aWLG;<H7wn$qxudIUGcd~%=2U5R&qLT}p;*U*3T@<k$6tRU9BKNRz
z(%=X9d4P}^?P7R+wwLh~hP*Jt9__c>AmeQ=m^PUP_u`Dw^?HAmNC!%zy%($GK#R^v
zX4^tP7k%@YwLuc~#?6xZ=S2vR`=gKCO({)B7J`U1r}@HF)}A==o!G-K(|gR<%W=WK
zG=hv#1#YBbwo>K_0+q*|c#1<Yqz&FXV~-LosB3PQ(@ZONwbYVv82z-1txi^kPPL*<
zNHOi6+kjmjR@VDQiCwc++3=%XRHjctL^bAm4bv2dJR4g5=b9dG50=%<TzP`v=^l2(
zL!EZ*v1V+Glz)UnV<F;fgdXk}hHun&)8s=!FwCSV06o#uO}%@@8^YSj2HPc|(m0Of
zs}k?BVmY&(LnC;isb<5bp!M#w`zn7)-7<H)o_MbHTUi*@bDapaGjWsmi!S$u<RZ4q
zmz;GBJ$2_xKNb707PL#q<t+NzdKvj<K2Baqi8gv}MiY48I9IZ5ga{co?5z08Vzqx<
zLm|KFno~=#1-#YFk%+VlL?*i3^}^1}4U9fc_M6o1%Q#jU9?apX=nZi;EY^QZsBzY4
zI2+`m)-Jc{Aa7H+9OZ9)a3_1plnJWpj=@{9_W3N=`K_}q!|9|DBfb%|*s86SL+hFE
zHP@?Qv4dK<DhNrmS6l+62Txsa7>Z5E+nyb!X>CJ}j+GJuGifl&_cOCa!{%}m?&?&j
zT?6gXpjq2-=s=p*DQ8l$*Jw3b5U*(9(Scr#?m{*VMMzAAS-^b-3?H?_`_}D&=0<pr
zIQU}wO@dkvmLS)QrN;Zm)p_EfOC;tF;O?wRd)gT?8m1mOd0PgQSqDP5=yiD4S{c84
zQxh7dOQZHCJw2)5x~X6ba%&%40c4~)@!T-xXo#cs*OC=~F(Yqw;EawCEIHffevKsQ
zHQu~kdP{|!*<oe9?@1DVwrfgLg|TNxaTyrj&Gl|?{Ph7#W4iXudRWU#D?VCgQNE2~
z@~Fq;tG<JMcqC4NbKt;A!(lNJw?Y^zrQbu;x>tm@$rckXx4kyQ42}zgB*Jvb;f!)C
z@}a<|D-jporX~Rqu?Mi8!VQyey-J13tk?3adIO)uG$^|`w=-3MdmR)jBi?BsQrp>@
zifL8c^(AByproy_bscy+B#^}BbCTIUU;Aq%cuqLGT<t;LY@^ad!TAqFQO9-dXpDww
zON>z7^jLE$CPfy1H(M`7_xOsK+{R|)c&|RT5zas|^7tr`hcnVHVN}XLD@|BRa_k+z
z)Zwl@Ju%p;wTU$>sUMW-RTU(@L>aw9Ic0WttDgQB^YSO90Qgu1ijQ8~Ae6bwdy=6J
zH{zY^6|xQQL$iQR5u>W@774|GX?*wi`mAtO{W{1F4=0}SZWokeI|33<Eq94lTLta1
zVXS2fhgK9pV|I73aUz?(;cjY@)5Lwpnq@^yMQsHZ!4_vLWE=FT#vgK_TMSr};Y>kX
zkR0JYtR`U<B_HoM*yOkbr#s)xeTqIpaD7$Lkcv8DfhW<&NAJz`h%#fuUIsOL&DjEt
ze0EOVqbm*f6<JQ>hMb|K!X@`M3CuG;UwGEBHxbB~U`&V@I*^K1Jh}Im$NKgNcF`dR
zVqx>MqZ}qpDLSgnq@8j$Ut;!tL$rI1;<wZmW;4l0d2>py77Y$+py%Yy<jnhCTR3c0
zx>A=$WirwJ$-4BCsWvFpir7nhLMtm>HK1#e$Yh;ertr1CiE(Q<%1}ZfltnvT<zNpZ
zG1DMxGI^VEs|TB>BtTUSE@KGtve0bfX0*O(3;piltoi=#$P2{xxqg&Jzs;kjW%&SY
z7sqFHt$Yf>vw58NI_+dux#R<<Gz?l2!3`s(AN`|)A%0saUvhG2yJ%R_Nka$4;OcL;
z3&?Iu7XH0y36AOp?uM;ojTTXqjbmSeSVKmpYHRwf=`~~xNJpCnoOTZ@8SzWoPVrbG
zkri-@ngxfzskm!kIp}TJeQ)oMnsb(-In*7u9)X0bn&^NyxG67DvURjqYB2;f`Wd7Z
z%N-`l?xWkTRJWZQOb2ZkZZBj8{6?$Xje>xoVz9&Yn`$KM)1TmR^4HjhV6#OPU(k|S
z8vP_>)jeI~spgMK^k$E6+e+Hr?E(}+05P#rI?-uqxfY2hj_jre#oG*U=*IoRha=LH
zge?r*^z{Rs=eY=$dme6J2lVX=G!vzW`hC@~1h+xioXWAzt7x;JNB-pkuM*qmEueLB
zUJafYh}LFy>_J0Dqw{S<)a$&(a%;w^X!~fJlou^k+Z|vYxamwvlxk+CMMe5Zuf$H`
zs6YGV*4)VYYh*ChdPl4}YKw86$+_h+&PDG!f#C{O6P>ys(0sp+z0jbljcwCAs$rb`
zgz`CiCb-XvC4y(fW5GYh9^pxYX-ZtJ$}P)rFp9nkK>a~9<T9m7_FWF0jEDOx!8Wq<
zYPMs|b7*$w;>*aeuurryrMIFFKULzHD>qI=UNLPK4-Z}i{TU&xqQl~H6Pt6E7TQf$
z9UO8wGWJ+;9-f<Z7(Yx7ZWTi%J79m0RTC52f$17v9Br#u3`MfI`g|=()p-am_BL?b
zs>@pt)z`Kx2F9ZfI1$-*qEA~yyfALgc1w2}-l^;YR!<p-P@8s#_R+wFwvo4{F0lnF
zg|=eepseF;6(~jf9?UkX0!+bIAQ{BJ<UeRWDL$H@#9+DF@ViIQ4zJ(BB%H<*EZb{5
z^XsZ9fLWMw<?WTj{(?@B77J)n@yqo-((31a^ErMR_h~fwNxw%|HZXL0L`7DFm|kIw
zRgA%=%pO|4yxOtldEqcdmWV>4XFKS_O+}qJAwbH#1$>h<_|qFDlNo;5a+rAM+6sH5
z-efb$8|!<9R)&ziCLlaM0OHgT&=SVkfXCv()I?ES{1)VyA<rC<Pt`KGA$YcWvmjzg
zl~Z^BO2cz*;$;#MuD_Z#g9ZV$mIpVh@7i)d_K~H&u9oHW4mH+~<T;N0&R%uU2q#_J
zDyoJ}AOhIj9O8ZM^yF3pvooqx%&!z`<|r}H`36*f%y_P7L|l@!T>Z?Oo8qd>L^KVP
z;UN{`*i7RV+}=mzov~cn&=+hNGAvKFjf7HsaKLu?avZp$#85{~OAxP$3g$SavEi|t
z5<LzPBS`fcn6CF*z^e{kz^~f+f%=#x0|<0|D+buGl`a8-@8TAtY2WY$PdtW(f_~dr
z1X)&H{A>3#i1YFmC1u9oeFTod!q>%zZ*-bh9Tw%44tu>kPxkK1&T|X99I2o7kxPZI
z$Vab@6iG+BNeB{5>SI@|mBLm=8zs7rc#ge_#%p^{q3n<<l^cW1{)@_At{fwT%Y{mP
zeOWpgg<4G`?a0y<f}+ctJ|f>ztrj<N<$Gv3<<>sp?XRb)Ya$P7v<1+yu~Llkg;Yf~
zn(Ze4=b(Njd595P&?<`Rep&{#-p(Lo@CpW<cJD9#!Ua((R)|?^7R(#Hs*<ctBd{6Z
zF_~hq8a=m$!yOZM_yWV%y|#$gGg|@vwgMVK44kz-$a3CFD|;-j0Uqp&!#lqkyaOk)
zSJ48G(97g&VpD<oNF2ejZ6K|IgkPZe9O|)aDxA9XgT>iQ-QnH*m5rU+gNwy;ZH@zI
zLB4MOf_WZGW0kj8VLPOl<vHko*O{4SP56CEyf(mkW`OIAw}I2lq~r3rXvPe?QiQur
zUY)uB>fk};i`8Q)0*pzDVHZS{@APo%(!`3|>ZLa`hz@!*Zvr>nvL`Z3?nG16o}$yr
zJlhm#FPXenP}qb$=kNwxOSJ51*BroEagCI2$u0xUM!={5fk{7?RidmKbCDeyRD-^g
z=(}zlo)jj*ZigI4`g^nab{}<Y=}_$6wmZQzbx`@%wPQo!GK-btQzG71??hKR2l40G
zY~=6I$qF15UJ9HjYEtt4j;SuWtl~=q8o@e1CF+h>t<H?CGFt1sB#kdt)GBkcGAes*
z&NcuGIX+-;kYE}rbpZi_-Pvf<qMo}UQg(RvSMz(e6b5|f^oy+M>Et}zZ!b~I@;JCv
z{n@HuDW~jrdf3QU9Sq`^Sw!O62-&~;uDt^BI)dNru>WioxezM7z9tOlid#f$vJS*o
zrWkb1^VrTh-I2-mTbcBgMO`)AMtkEH@<3S|W2`KxR<pwy{p28KfP(O5-p?p*VVq6n
z{bF6t_J!pk6T&X))3H&R1}*U~SLO@a=YTgKnq531<cv`&FkC~-=HKHjNx33=@htlM
zfXUZJjxb<wtHN`62*j1uT^#^L*9gzK;i0}>toKS&|LX4js{wl>MDy}fc}Xx;$kt)2
z(L6w@yvx(WX}?p67FY&Xd^OMrB3P)X{Ro*!H!sm<eIPh>aFoao<rtziSDLSMq_r0;
z6T{hW_>z|b_L_V;+#6Ij70bI=LH@W2Rvk1*7~vW5oO>1TiK!`!+`DPUj-dF@^7)&H
z&d=7VFy=V>Vn>0^B<Dk?B}EdwW?!EaaxzmZNzb!WNc0tbbZ+3O@!K4gUZ&)WWWs7)
zJ+p22zNd$nM9zyL-8*r~sUNc{)Wei6(N2WfOa=NRAa@K1ev6+}f3NM(Iw}sBK@QzV
z?QF{XVA|z4;8+v0S;a2`<|wb`W>-G_3D?cTyppc7Cx~conOG6a2-4>ni}*<Mu=DHO
zY@Z*bQbP4El*k0(W<mgIhfhXo{6>V1;<oH!T{(^^6}z95@lsveUfq>9?1s7y%J2>*
zNf8=N#{e(R3-n3^#I0sFWZY6!-pWnh)K4rDPFj3<-77r-2Dz)>!q^R_t??`%-jP0o
zXu0+1oq!>U(!Vjr!9!hrEG=CMc9Ie^+hA`IH`lt_O%`0ma*PZoEAs$ZK|>UjMyG|l
zj#B7HX8YLUR{2*S`@T+$RM>}I?u(DTa=-T3(Y%RH%_qlZzi97J+r4Xd$kpF!c^;m~
z4ZK1y+8c3#pv*&>Z2-NhAnxl8W%E0!N4)cDwVpvd{Lo@3ihO)7yTVQN^`&z;TbT71
zW(Q(A#+Mb@g27xo(FIa;QfQbImZvzj!+TEgkIIRE|H1e!r8((#8Otv!@$VLq&am+?
zDW1!^6Su$50tnr1{<_!SEUyYmrZedqCZG89^e}IC-`(jE-&YjhmqCDzX-zu|G3DjI
z`t-cZqO=Z+^V$nX;9&P!(jrCc?S`YCQ+Vb!8Eg&2dRFpZPtsqO1XJL?MLRcgiB_b%
zul|vr{qClkO=)NM=b)ATB(|zg4&-JC-W(SpKTZVf+D-o(+UfsO<+T6EKeZu$0?hyV
zWbdD^@+Xh`XI}rGdc8m8^G{La9~cY!|5N2Dx_=j{4KzEnj<B0scZup1CGy9L*&hX2
zQ+~(ZpA_~!s$SbeNzDV!GkAHtzP?{5iBfQGy4HBKYp&C{j|pGyzMErQUIr2d#uzmi
zBw(I@tCr^1?<pvm`cpUl?(Cdd(%-Kde^K@+ar4?C;@67J2c602F>dqe#NE{9&usP5
z>i6}7wt;uel{6>v52}8yvH?_i5D0@ONO313xyi>s55a5EUFUW(OJD^tGrK{fa#J=+
zG>Cye7DKW=m91CQ_TZU)B1t_W#JI5p(m;oX3U@)>73})^d#kKtp9E7~ey^3OQp_F$
z{g~5HY=~d`T<SP(qAD<4_p3o|;FBF(7|O4hjNUvDF!hNW5?uvXxvNtPdv!lMDLuXF
zBK71cO9J4<*O{q|D+Z)$9~&};nFT%O{8ZgIggB`jwd<!9=CUwQ2R~m>q9J^QQ=j3`
zHevka<rU06=7*;DaHOK9X7P)s-*P@Q{#q9m$k|#~>S#KSfd`-hjU|l)c9=~9@a&Dy
zeopJk(~>SN57=V(4abRNk-H8vNK-->v3KmdA{P!Y7{1ewwFGmAgoI3LmyTH^N&TVj
zfB!?vP1weQ)KszH!{dN()1cn454WXZavHA4>AghTeYU9aSo3w1+d`Kr6}Y86Gv$@l
zPd4&l%kI-sZa0PLf>|%0m1W-i$VV9gd8~=~;0MqwP$#`Acrw!IHn$vU^U1=2n?9jG
zQSCQx_e9vzOvM*CQ~Gug%+jDckrbyZ`SPhAE~lLn6nCfg@Zs|LisnCefHIPkqVs7W
zHEmGDpuSV$nIg*gJ$gk}rxPSwk5am-D7`y&h8HvI1u3;9Pk)K`9@+a&WfAE(USGFF
zw#OnqO`Ok>9buc)Zj-Rsb=CqSAIe1?>AcSZUxjPOBShPbpENabJ!vwg+85s>p>*}?
zDeymMdULNIE|QTckdmsZD9E&z33Kx@_wve+8}1sOm2|bzb$xAJ-EdU?mtA{~?D&o6
z${WQnBfG}OJo@7Hq5KYHrc99=74Gln6zXBW_W%04Lce0;bXK|7bKCw8vdaP*|G^_;
zljOboXooU&>`~K$Fzzby-K6Z@FscW4#6*oTIm0&H{ikiaQq_t*mTN9qxBo|rRDPoY
z_v`IF3?Vl)uno?>;$=#)3K?EBgugmFE}z^B1x%)x@rP`qs?T>tJJpZ*%0%uz^XM0F
z*T_!a4xj(h<I05{DhuL|m+NEjk*wH-oLRkbTzskQMpY^kvqNpnf!-p0I&kyNU~jg*
zPOjuC`%k0^WDWa#B0VD`pH;?d;4^)*O?|g=$epHoJD^fGUpSt*!z}0M-c`x~ps27l
zPV5Hu;`5&^bN`tyLwiA6pS3T3qu?-eFKPmZwtCqE>S9!<>h}#<miT6Yxs}DnAEi;{
zuGX)MFylMF_P5`@qBL#s&Y_`iYzOk|WIgab3h(tyOT7CmQX0jNy!SsW3MHj=WU8Ls
zNr1n7PT>jIE~<T7+Md|fXyym6u1dL>`a*o~23EtA_-!ukrapUu>!(TsW8efG2c&w?
zjdlsN+13~z`<dPzc?jFRhjzkV3w*$F@O9`v`H=IJ4^aT4ApZG~f5f#TH2#01U3$s#
zppMff;K1=L(*_=IF!I4>efBcHlZ@_#J)h}8BW6(u)8)>6Ygl_t*+eTEMgcze7xb%J
zi^Jt*rt*rY4~|LNIyyS4Rq0BrCyb$1tSGgHORvB<%)u3U-dM$y_vii{;l4bg9E<T|
z;zwQ|5kGRD0x$gPpsVlhMiQG(J7{>F>$3$+!p16uR9=_O&HJl7!)}WN$MVCcE{T_<
zqaiqI{bC=_MNjAdr@i-#YI1AaMMXqhAYcQe2&fB1s!9nRlm#eAZ_+_Jp-OLwfPjL4
zN)e=k^d`L%6s1La2|e_Z03q}ivM0XZ*ynS7YoFzh^W*&3j)7x@k&x$k<~{Fn-Pe81
zWMRTs_UQU_^AYFK&M0~eaN0g@VpMl;(Sa+Op;B!vCc=q}t+1|bENYAoww)jf3my5N
zvBp1^>txeao@~0@Pfh+eBZbG^$4vuH+>WaTJOfLcvysGA{CQ_}Y~+V-*-GOf>l<6N
z@2yDDjdQ43ulnM3o~j8`#aM0|$(Zb{a{}p2U6*f<nuf5fAn-x-#-%7Dct(LE4pm%i
z=rma)80)->D=MSq(i!p$za7Kw)c&1b55;R}mjqp@X-T5dQ_r2-{GtNeB87qo6meMG
zE#X+)u;YDlzpt3QvCq#hjn|YJy0^>LXc?_^jaAiddgv|VyaiL-T5M{nT*v$HVSUfZ
z6edzi-!6?+MJBln#ar;$0vUgI0u@9szbXEC7de>rs;FBxJ<~y#GY3sB)rlbcH4JrX
z0&c_+mHd>nx%y*&(htVoC2qLM30I9xINZCU*n%GA<T^<EVSjnK-)eYbcanavasNrO
zcSpOB?c6!z=>&(GLfK5XgQULyM<H_mhTTadwdDFK<3ae*rg0X0{)z>oY72=4i|R<d
zSD7Ip%y|D)=JQyj6_fT<2%1<#c@>JQLa7uV%QnMwZ}K&~?<W6X;F`9L8RWnH9J}f<
zT<^8%(w(sRS1wfpI7qsJiw{xW!io09u7VH~z*xN8?%WDP(u7=^-1Ed}))D<fzG|@O
zr%LA@YS5h_C8z%E(k+?4B0J%VEL;<HRU1Lt6p%%`NP<MNr1BCvP`Xx{-FWj8Do*E@
zpx__NcVZ?&Ko$R|nGpB!G)l8v#ZG2#jSdg7emu9|usXJ~db~+F?uHvXR7&hs+gw_8
zeR4zfFE(rwiQga?{kDsoa4!>tqK3yD5l|N?Lir;q&-_bgI&3)dULMfr%dn@=c<-*+
z8}Dy?@I8f|yQ8s^5qXPNKgM#~2;8fUKPf13DnpKs9))jfJH6l0F+{usLQ-$7Ya%n(
zRCFJ0VFr=PV%u{8VHl7NtVtLu(sOzcmRa;G?R3+sxYo9RF1_aX!l#F0@h3NFXO$2z
zDEo_>d494vIi6oW`TqwH_Dij+8}Zt=_^|g;DM^S2^5+)_0`E2kNB9x2G~!#ImEt#?
zH4hi~+m)gg$_jIA`Y8l}eqeu*+C-xv!^K-`<r&!339em#IN?yLvDI%aXw^DBF*sep
zYR0!mKtE?7c(S~Sger3jZ1zzh`_X9q*L!iaMj*&O5*Rl-@k~{Q9wm8soJ96~o#ILq
z+OurB@oveS`fm2OR;D={>pxLni3sAMZlJHc26uVl=7YPsxZsBU@5QkGD}#$-7l(_;
zsuxCzAW~eB|2>PL<vdx-U=Yaf=SDaAU-KCM5<wX1ZM1au-so@i3k|<2IgU6^fEHB@
z=A-_qaFmQ%Om>N-V!qp?6PHHuvD-Z(E1Yk=q8RqQaqBzZ9$!QxS-5dj3!&w%rs7c{
z;%M8^9?Y=g6~{VV+oUtn*!4zL$r5QkT0(d$(jYue(t<>+OZOPGxFK2pHFEr}q6GMH
z23IrG2CD^r_;5{2XCXMX7gAtYHv}9Pw3JwST9Mlg&iOg+i7|EfoSwBJ=!z}+UU&k8
z@m+PyOwSGIzJMl+YTUc|i^J`)K3PtU%fQ!aDoiy!AouOx0R%$hG9R2zQ<mSx>y+cJ
z7@en!T}dC!6R{2szO%0{dz2<i_#DXjyJ1ly<29RhJBcG8)d~oZ@NW%gf)?ugC6`vi
ziLl1&0&hx=kI+WkaW~v2kM=8l_czArZ2Pmq!x<!MTRQRM2@W$+%l#+5{FpuS@mha&
z)%H?vGo09>#AH8OZXbcS>PT{E6K(gcro6%+>6_z*8=6?CEBR#gBhjYJs=K|=D(wKe
zV(cep(b39!cy9&h9GTCyM7R-KhHs%xiS+Y8M{oC29$?D|2is*v4hh*Yz^e{tr*t73
zGX2UN(T&=Jruvbs`woXZVU@-Xa*(uDe)BdHCLz}x`1ohj3_#9Cg0tJdE6(UblZGy^
z1d`K~COhcoSIvKw4YTVSubH%&?}({@N&ZM>NoWqCav=sEY#UYj#`CKuS&o2c^VKdl
za<m%+M;yA}U43-+cx}I^Ze?Y+nF<T3zD}|*GIuAcu-4lKb3d4xVFrdya>2Q+4h=S9
z`aXrQe2TiIQn`yJ-ra?Xm-v3)s4qc{RXI9l$VI%dLMA95w`^GMt&kDcq5}*h!eYo|
z#~iyQ+^en!k{^ol>D3Qkqg)scVTEa0U-T-*UcGDj)ssoUDRpxVicNaALt>BMS3U%*
z5`IxQRWw(!c^r1vb;+cxZ~+C)%Ky+(iLM=NP)%)<SLVd5az#FrJ%oY~#N%b4PCB)2
zIu_8pHKJXpKeFdM>$^iHp+kd{lG=#7r4iOe%LH*Kz$fpJtWt_vcE{c8N1*a`RQhq2
zpqFucRm`mAJp9O@t`baU?>Me5a`Ibsx>7|gZ(=+I`gnBMz0S97_)a0%nxz8CYwTwt
zYJwC-9l7l%9|WG&t122({}kf#e#mDf?%vwb2w-Olc&ugb_#YMuSg<_-?$3GZMTF^S
zh^FfsBEb#5-Y;rw;4~=$^Y#~`#$3%&2S)(0C(~ejI%jo+5Bf6|Ka6`x2UF}B%tbhB
zOl-e`v1VSm#@YfpF`|fF_mQWuwVQ9cW)BQG+qiiFw=~+t?;>0!j@J!NkpgXN?Riv$
z%W<4~(WO*N-M?Q06nu|sA1;y_9xizr<a}%O|E@@<UxH<{U|?G6662g^&R-4|W<3)n
z?360GNIJ+D{k$tdS2)O9U?5{i1tDU{YAa>kUm4D0So_1c*tR;hHugYtc~98#hcyu%
z@3pzGk9`X|SA&LPH2CJl`rYG07^2q~KuKju6U0GRiEW?{o*TbhTh~-{p}r7mVTi^Y
zSPbO6TdOrmTqaT+z*}5B3@;eZqAHU+E(kuWE=meMz<yPkxcd|cn(d$-wqxJVmCg{@
zkeikwtu@>j&32S{yM2?(FQuZ14;`Bm8ytJ$D+IKrUN|V{nBI;Kq!w<1d|Iwie~met
z(m~veV%?W>nYaMkdnZqT9%RVn0p)_lWGj(0xzs2X(JyFjuF7#8!^q~vWTL)NvtIRM
z-IcPSNuOmL@owgA8VlgfD{fLt35a+4)UQT}O?1|0x-VT18IBNpl7olIY!BGK5?x+E
ztI4yxgK`&?+*o_<pe=Pgr%`lqKX6XJW>Kd)jrZ$bV}~-n)6uuteZ=e88o_fWg?La!
zAg~hO7<VYaabh~P38-r>-LroPo}V~L3IfX{x26J*I$QP#4<+W@X1AlGR0>METT>FS
z4nmwJS(S2vBdo4d5K3Noq`^FlNiP<oSFlpC$l|{KfSm5Uf)`+strT}l>Ns6ACXVW?
zh8Yi|5kwsE2=&lRZIpcLIE;@Vfh$zxt7#*bnrl!Cp<nnB5A_(|Ze?`A$nDlxrD)Ao
z%tg&Pa__@DS-gd9(RKSnV=F8C-H+T*!hO5r9`IhdOFSA7jY!d%bpzGE_LBFUH|Fl_
zfM)!hQD68$FgGZy?+L<|v%K_r8@J>kbUW|am;HHa8H%6$!D-u5w|2nPM>lIs*}5_3
z{MesdbaJR_+;fx1Ycas-{E*ii1a;KKD@+_8Fk!PFJ7o3EF?lgqr6Mu{=ycQh?q~wd
z!Kq8cKk<u9#>9_)rbNO~zG%_X-X(<`MNgv+GsE3M^;m{(rXBoVg{K}Bx5v2dCWH>b
zn$<0~yJB$R-OdL<m>LFo%eBcai9G-H-qz&1WM>3r?|@K8&8%wn9wYUGOgH!Cj|Z(R
zn}y>wyYJ*#%giK^iJII_seN7K^G2I5?Q@~Emm{UR$QFHB&Rv<LjI`DCnJZ~6<Rx)1
zKJKGeBD(si<{ZrzcQ2e)f;f)aajBnPEUj*Qba)IhfpQCTf}U^v9YH7Q#r1w=i4n5n
z?Z<^ffX%j|vO8`Cik2sSQj$g(VfZSpSh4d`)>J=883jBh)jrR#;u>4|%0Px`nu(Nf
zw4A<z>AMgq>dy66&A-G(7L{8y;rxN}T%od$*sh+4a&3!b*EM}D$s=p^wW~~YMSl3*
zHSgIxE?#6Eug{Rh%U)vlOgho{C6Pv)@Wa^m^K`HLHHPl@2}AcVYd$!xtIS0VP%%qe
zB7Cm5H7prhD(PtHoQO<U#^2)z(QADj+_;cyCKyNc3$ifGdj`aK^p7*tf8A07?mR)Q
z<IlI+u4czpQp8NSA|#1doLFBz;+v7f=v2mAo95LUw1~3)p&6+^s0gvxf*A~0dxEkK
zW&M<EF{>T056p@CIAl$6PT{*_@OYrL`-6iM>q@caq=p-W1Ig}M<x$oyvE9UaH&sH^
zB*tP3aIv$rC8(J_LF#SiffCDo>O~BsF}yi6>s97Utka>j8`m;BVsdPpXKbNvKTI@w
zM9Hign9fKyn|@Yt`&%DEbwF%+M-2BIGEX1$!B$*(+(!Ozs8@c_Q%O!Q)?4{IvhPU{
zBX)Z-H#;#J#V^&VAN~b0=^BP6Zr4<Q^C#sp#1)qN-A$HS4K@++CoQw=uB<!u^f;o;
zdhyAnOSG&7+J4(+`%zcMVw##30&brm+;c|+F{u-3ckOmxN87ubPr}L4+VrRl?8ooP
zhDVu>+34rpcF~*F*|XD*#H3{>EKk=_^5|fT(XYM3ZY#2%p*DawD|t~}oxWPo<Zny=
zl-8T^7M3+xYC7Qkq}Oi4y1?#L$ojYs0{K#dEf7h9J_=r~!bu*x=mK@?Zt|K?3xSI}
z_=jQnDpS&i5oA^4?(*#t-IRkR(I_|O$#$x+PbWppN5+)U81tznO1_3UMr{>5t6H}<
z*@L4ca`YzZtf+(3{#Jj@tV&vwzk(R6xpU{ux9+Q>`)ujv7v4wMv<Jh<s0={Su^GTS
zYww(jd{}|A(#_ebz0U<22cwYT?^GW}<qe4;Oq9G_`Pi^(2h-XC!X4kD>#WTsDrhx@
zsTba{*jl#6g}xGF;>>FHqKX88-sdpMV?$eJv90<#<c!`eD@`Y*y=$1Oex0}?q(w9*
z#3}W9H@RLU_ep4DS1R)^I_pElq%-E`A5gQ+#5<7RXpjx!Ur+7wUXu8vwGo*RhrWiv
zOp|}P^h-}8B`ndM;z<vlOLq(2UoNdq5PI)$K>W%N--kZGc<eR)$au|*KY!MM&Mh?Z
zK`xik+;^}U?raR!2mSZ7{hS?8CjpS!a{#ABWu0SIExt8j@PsSO@BqhTAd{(3au)Lt
z@@IdnZU?kht&nMm({|ivCN~?p^<0N9YQlZud*eY2-y-9sLF8QrO{TRz?OTp4*Sz*j
zv*d(mw}aJeH_FqE2ApRzyc?l8fz`~g;k25jvm!4C+G^ir%iWjAE6}f!tS}Wf()P<L
zD~j@F3UOW3+Xd=;E!l7sm6)KMwa-e)p+ikxi;V7^k?UoUu^8#dbd_~W;rb(OMKE`~
zUzUYA3S>=~YZtrOFRC6?PwIqJubk%G7+gO!+L)K3uFWM2udc~4I&hv%?{hWw#><+j
z3HcqI_gQ&;+okywI4NLQS#)~OAefZLIGoL99+b-t4k;SmJJ~7w&~Q_pa_;ReW(nJ9
zVs&u+-h|b1`RsiAeQICT)X-9c98)=L1(vsNkEJ=SB(*2JTi8h&iGuB}xWHXxE<eGu
z$b?YiAMhATGKEUZb)31F?SpE}ANc01cI!-Lw2s>B7*}y49U>_~n{jT=iDI-%;dKhP
z53VK~oNj_rq+&jYR8M{F{XT!ULH)}b0^L{%i0?sFtAJ<aJ~qc!vuOG-LTYc)<EXI!
zb!8x(sogXsH!p8PVomT&fP(M&Ek1!JRzU-fGCAu%`yA(AXD4sSd|twCF{!%0?Ag?8
zeK_$-Md*?_@PFu!jeNQT)~pd36mJ!{M2(i>;<?+IP_}bgs*yVk_I3E#)_BIlX2~Ky
z<9G+xSt(v!pcm;S`3f8Ry&RTd%6blo#i`>$Tui{^ML9E-VY;2T0-?Z9X~Zdd;!j_l
zl39Zsd3Nzzq~y`li*-7N)7{q(2#xDA=n2@Co3WN5dCo<#GrXB()S5H<Y++Cql5bQl
zAd77N(aNf_z4(OCb>(gvHfud$$V)!_FB@5zmpLR{(ekYD^cJ@`#<ebSLb<^Ubp9GM
zzF-X9r=X3Zw?P(tL(P~O13q@SlB;A-%_CX=Yc!Haiv}I;1ZrjBwWq9c*}MH+^WKKC
zi^hU^!SBV<wo5seRfKu#S5JGc<=mT71-L<}sH5#X(yfEUQaJ6DCRrCoO&0YwQVJif
zQdhiM8pve1j5I!0=Y3S(vwxiuY*gt*3k$ct{kgY+G+RW-`TRn*7q=&f{Z|CMH(uYK
z!xTM{>3Bk~;OpB5rQii8ThRN;oiaq9zuJQ~zWfq<w{vqGZS+~k$V)3qF!c1O+j(`h
zDI}QnT`jw~T%CPg^NQ*fs}~xU1?AZ2>UTy+&c*upL1*4DQLPQZ$izE;L;uHq2Dr=T
zm|s2lc*98=@@}?8BHYEh$0~fAwYo(lvqVdc)N4tw=&VTi9hMFd)}dP)G{qkdb6hvl
zrUkvqM2#vP-sCP$1N+pwY0Z{=JGpVH-o-`c-pebk_`}R6DL!4gg5EuOU$h}!F-B#%
z3Vv7tlcrN*-Gz~%4wJMB_J^5#u<MZI5^n~=K^5wt`x|_wi6p$Uh^enV-4FLZjIW#}
zh0NJ{#XFOYPrI)VosZYCIdaSR{8R+{qn~H|6?gQ3F~nx@YNnq8d*QANvt0&0eejfV
z&WgBm`f3G=Whc81*9l!3^vLy>rdr_)3b;G7nx0UJ@ybkSbAC-qK9E{qPft!}Jvm2Z
zZV{$B^y(S=T0>Iom$YFk$_9^A=%16jWh~R}!EYX>y!J7p@0eT%+3y7T1#5<&9Yr$N
zM7NgZV`%gNv1%>Yy|nEyWJN}1=LA0M6{u<N{%~-#-c0S>I%NMvn19@JdQ_*c12Al3
znM&D#hB#19T=m)3OG~4o=wwB(K$2-0WB&>_Wwg8=#}y~@;J$M^c!!ZuT-S#0h1mGP
zjDSA|IP%qVOgZ)qoz0rXA;E+~-VEu|Z^%I(DdK#wOT(L}P3?}&@+SX1gDc)~m_3he
zKA6_c*~fZQ(wRv#bBTk3kpVX<Ga)#;4vu%RU6PgkhqZJHTzF@#2k{ggkLajEE|f}L
zp?DwGZ8mRY{3imTp3>UdSbLWG+nB7sGrStVFfiEf^<<HsmI|`b(;WG!YnK*PT>wuT
zpD7K@RnvSBpkoBnEppcR!Y*1hl&Sf3pDlmW@+msli2_;FZRWeG#qmN7l`iVYc@Fdp
zb6Hy+w<4;|r>~GxTgP1`v(H^(+-a3Mf~{er3vZnFNjFs&_%mAJJ{vp8WK&ZEY-QfM
zIhZ=k<lLn3kYQX|F;-W7ahhWGzU3Pxy>>E=9BYvdflM>SQtPXHhBx!umJgUVNCV15
z9WA{Qk$K9GBNZAK9uLJV{;~m@c5a-2QL!h$q7CRtEnx|tysw6^OyGy3@l@xjj8*k-
z+CQ(^_F~!nQ;iSBz;8KZb<ZoMeIx7f_@m-v<606rhs1e5=bH_xXwmOfE{yqmKuMbW
z>8$5De=&9Mb&x`RZ@C#sN;0s%iI8fjo$|nhd%`4i6kG(?P})}#o#N}h<fTt4QMjLL
z_z{&7UUn*HcUP%uT+b}Fy0>sRoWRJc;8hxl%()og8qM%v8ATaWP2LYThJ8QY`5Go@
z84e5>i|vjS*PA7*&%J7<>D<1cf#cbp;nbc<K*d}FDQj!(>qKt6(#pd_^~8_99nq1i
z{vj;Nye(3ZA@)7OcmNY9B=LpO%c#D@9F0NY#u-*d^+(mynulvd!pb6kOfoE#@uKFy
z*nud$iF!`-=(+~x2*2ABZk6YfhEDR9=28q%7{&2QN)CGD1XLTDiXt~3Jhjx0#Fu1&
zX~gfR*IdQVKhXC$#;Y`v+h}h)yqf=Z2)C|Re;axK)yw3~gUJh;muX_&pJ&ebw&{;a
zo(DGSBwBZ#Kd4B4!0D&~XOLOE9qvHE@|epi@!0++fP`(&PJXNu#s|N4Q<LJF&n()p
z21S1y_VG)~-mngskP%Mkb%R%biRCqnt<9RKb1Osg)qO+gw2AxPZG`EN7BYI$E?qoL
zGeD}3a(3g1aguDq)H4*j3@PJF6_bWOb6wBbYDsV`kqwii8H)IjxnkHMy<URkc&}aR
z6iP~dd>jcsuv3|?yCR$lEjDj%EV6eC&wq|4r5PQ_?f)uoYyOuPcD0J&#8d;x_=5-1
zRr~e`0j55ZlaL#+KZNLcT2z8p1iUW=Sj~9N*c*3w@grvqwB15c8vQZ8olyl`-M?br
ztFk8z0Uo83h5%6ecUHNu&Dl%k9pl8W(I84OVG^Ou9`!g=1B|*!5K0HaR@Z#iHgnyP
zhMutyr5U+{9uqYOLI=Uu59^xARGOZT{qjj&pJqTq`S}Q&oTFlM@#L}I?n$oSE|7`$
z{YVXA5iGp2Vmr*I2^{eRw~pibL#lW9`|hr0Hqe5nG0&*5-cns0Zz~b`4;F4q9Xu#1
z!8r2OoAV(y6pU=$c=DeD0qP99>?HTCGVz5zDa7tEIhj=?skdaj<iuLd?lI$Li$7_Q
z_Z*f~VG+LWPrlcUk=rEDNNSpiwBL>aEZQLx7L*8c_SQ%56n3AI@8SL5y=^!z%M~X}
z5Yo%e>xE+TmOYL0d3=Hvbb=|URMOuYAQZrqkloXDu8V|afOHzVe%U{!wTBcM8_Y0m
zoT2`9Uod;NCD>f0+p|k!V*N6J`PTVt5?uwSG@m~P^^%{8DBhDv%<@SQhN7|e^PTUf
z$vN@9skGKP&}3%iXEy{+(Tf!&`&1(Hwno<3Z5TYi-jKQJl_s~sUCj5@L;Jw&u9^fE
zwA9EEgY&+rsSJXQ`QI8E2$a37N&H3iM|}qFBo<?TG}A3J$|D#ghALhX<QnSSsI(RS
zxHX?hQ!4J*;?_NS$H@IoKgCtmsTT^Pg4Tu~Vq!Fyh2Q>oa<Qn!b)pEnt2%R@nxaQD
z)sh2G<nJ$~4BFqiYBlueEN>8Q$hYHu)Q`$kluYkB3qY<mRr<R;bdw-u;$0S6*(MiQ
z%8sO*p5BW5#q*syJ^#lA;kUSxK2zVYKPiSii^a!TO>YiHI5_z55ZAM3ndKdj=kbiA
z)_GWUgnWjHIDI&fT5kThf{D}g9V@BtPNGPohpi`qH&S;};5E}St9wJe)boahgxY~B
z<!Q^$m}2L)u$V7_XLTW{Sta&D6uh&^A8N>l5hSCh-}P-EMAX@>Wv9?30;J;UGGj=Q
zGo&7?F3^?hosiEF?q@I2<^kp}s)pCa+8U;A%_PKo8&dIM7;?^^p)?q^Dh%|-(^3Xh
zgKT5mu`tEBV8O7)HZw)}u)jhPWq@lc*X#iU@^N=z_1ECz_l~)2k<U}(KLVh#9vyV{
z+px=Rdg<pstVsUk(k^h45j9{%tY*8__fsvu6+&F+FW}gddmzj?YE@38=fXRRG4%9|
zlakLEA#JGQ&rnwzeeoEY<f<+TrviE#_7Y8Dt5M<GMxb8YOT1uZ@v4~hJrI?|`?9rG
zcYUcChq7!x!C{M*qb(jRu2k|CdU2%5JB{Laeq_vMMkH|J8h0C+tO)Jv+G}bOsOAfI
zJDgJGR?OQs4sO(}DEP53wre54+>iC}=dy0`=HiITcF>y&EgFsM&2VYxiwZAmr-@(`
z=~I@N|1^g@PSjZW$b}<a3;N8%bl)j;c>e@=d`>8JRp6~F>UQ(<+tD4{34C6vXE8qj
zjtyo!SnI5!ATRvhJV#hW@Qne8BHHXcqPTV?#P|@S^Q8Gj&L=W2E4Rt>2r5678e(Ke
zo^qa|K`Ah(dV{QA{1nL<%t@235$Ghpdu&Ed{mtfWhV5Q^_3kTmQ``FS^852<AJz`P
zY`LOsHa{GEba<MZUF~p#j+4T`6F?eDGF$_hD9sa>6<jYYBa>Du)Pmj4jZ$ZXFLofY
zS`Giz?bMkqb0%GLEV{!Y?1T?m)W=OW5Eh|WFILDU9;ex@$(0stq2g-|0?OjplZ8qu
zt>vIP$9aE+U!^<qaX30GTTp0q)8VOquG+_;b=bK6-Fod0t>rA%z*MeEIV2`I9hDqI
zD_g<Lf~xd=vB1d>-Aig?r8Wbx8wlR9{9$n*hf!>E-Z{o5rFxokjZ54hXhF@}Cj55M
zB^vgO#ZCz)Y3v2GtI7@==%Qhp{JUEt9lHEUM;!(J3fUnFUzQy|m-3%LHzdQJ4`mU2
z!MV<LCcr`8`vCpSpHwE~d<lQIa3@@K<c#YZ^`QjSTDMhOFu|u?MDC-9!55tP8=V6)
z>tW3khx2)nrEV-OgxR2Y(0gYeF_K^0sJ&I@eBqU)?`&t)6NyGeo@rsj4`;{bN&_F;
zGmvl9tV?{1=qA@qhExCp>$p=hUMq>VM;R(LE96E$Pf9R=X)7x+2s^z+zO9HvMrU5K
zqSTP%un1OvTz6~7@h|v}Tk|dErC=4+$A?mi6HLpLDUdSBE(^8nS8R~@d7{4yrN!xA
z@H6RDZW17)v42utZ~|rdH9{>Bc39I=SS%|@@GVUvCErp~_@1Y^dimCys>ufLd5g#A
zD%5CZ0H7u4cC>jnlBKNPMm<IDpqiKJo?(ipmX_9j$zNKmg4Eou4GUPktm^1p#$5qk
zFr}Wu1C{XudsHB^1NJ%Z5$@PiLcp(ziB4LVqAxVSac9EE5v`#q@r;tJ`ctM^cz;*E
zj;<lUM}d=sC=Q;waDns;wcVH~9`+&DS=vP@u{!FS-`vF-`^>X%=8-zp9+i509=>Yp
zFG6ADka5?r?i<s_)-R;+7p`Oi;HiJL5+vQ`Sv04~0WMPOMoX3UNxDH*;0#g+ag@oJ
zTN?JClC>a=1=+ChnjiUcKJT4QZat({8maoV=PwX&1RTe)I^8i^CKY10D_vR@uJJc}
zsVqLe=21~!ZSLoHk+1H3w#>~M%+n9x_(YG9?-AlNcM%Gs+Jl3GZbl9C#N)_;Q{O+o
z5aR8B36n|^b)(>m59Y2OvIu$PP&|H~?AF6Tm>J097X!Jw6WX<Y^xdghsg*<tc2q@(
z_H`R6Pf2SlgKTkq@(?#>7U_ueyhPKiYC9!8de=}_pwG(h1SqvRG>9dVE9*-ZU;mZ%
z70r9H?-~AU-*eDbc?(xOkL0`=OjQP0j0el0bKE~bsW!i77Ksnv`FM;%5Y3?DP9$mE
zafsBRa-8X80gD!{(eH3{>H(?Joq72P=6Cw8_hT&9!mV#06K-wWe2UELV~g4@>_6dV
z^egp`GG4@}FISUPRlXs`$E89ho<n=nZiAB=FGN=5`R%cLL^WIw^=765C9_<_RnxlF
z+OTE0bcK)0B34Puq|{rml9IM<n0-)_zx_izOozis+J%#Logo`OhQrxZ+MYVWzx}$)
z%XiDXdAb(TO_EMn6-()SwNv8Q{_Mz<+ad+>AUX>r%GOV*Gr<&+q>hVvJhk;{G|23Z
z_CnCRtV+<gAXSW>mwN!UVP`RtAyEP?3q-#qvLSYUpRKCr&8?XNX=ldcXJL*xEy2&w
zBUf>>jCs=N!p)%^wVO&*57VxI`S)*|4{|(4&2mxV=mt!v0VzIRHf*9~rDR|eLj>Og
zdlXx~sZq+}eA9eGLLvp?*eG$dC~v2GLrf(Og2aY>{-FRr-zqs+#_LZ?INYt;?3NfS
z9;)BpTpb!)TkqFBdL3vnGylDzdKML?1lj&itdJ=CPppVx|7($*mXHj?l^P9Zo6iqK
z`;($Y4>%I4`y*i6QHz_OSvlKII4N#w>4657{&xiwM~RpJpL#3qU+b+EP;ccEKDEFH
zgx_*v2Gb_5aVn7KmcMnY5t)_hX@l<!`$5E3dSs43Es5tjF$DWhj*rq0hVFdw(Vh^H
zEAgfss`^G%jc}Q5<MS9{qloG8OxuMrsWgHaPKs9|_`O+Q+GxvtmJhP2X<>{H=P!8g
zO~4ing+On!rdVR*RWtB??mOMYgB2Ip_~3W~yYdC$&s5x#I0`cA9A|K(R^%4dy6s*4
zYU_8byFN)s@y~5a-N_QD@OgsKYyDJMS-w?CaDnRUkdQm&<*YDbUCkRVXN+Yhy2MOg
zgN`z0)O#w3Y0ZXe3r6x<Dzl3fE-sKfsGVJ%rXyhr_vysVd>?*%o7oYF#Nmr27W<wf
z)Y*8d`Yv+ulqi&@eL=+SMFCqWSt?BdJ5$881jLiY17FU`l=m{U00EoY{D_j&TKRZ;
z?R7p>C`n^mOoeNDTwi~xsjG;*9Ht}s;m)ZX?`3r;x+tmeX-OZe)I4Ys|0pkR12(uV
z>ySn(c`?E-&l1R6TwzPMPgftq_jPNwN{Oi?TFbM#y-d+R3}}f#ZOd~+*0PCE?P{U=
z27dYvyr|Xc6~4OYWlyObtca-nzOIO%IXEY$EpyJB<E<RZjx$pHAkJ@nTE0ei=2WgR
zac49j{>zrXhKfkLfNz+>=y9^vO~2UIngYz6j_82~=!mKb#{cyT6{eEwByd0=Cr(8J
zBokEpD8lqv{aV-fV#B2e?}p+oYe{WBp5PvJ4*6qeMiI_eyRs)&<4u7*t6uVcUMcE8
zsE<D1xCS>^rQCY$kSFEK12hrzK}MrgBn&@ulGm0*wZ37n-<4Q5agcg#6~W{*%NFg)
zqSOkpjma|(Xa25m5=%<t2Op(3y&5cXzF(N*uMk{}I1cXq{7xv65hL|cU}T}r$p5>7
zZy5mXQYt+r{U8vZ`n8H}P9}cu@@sB$(~_z3cUGfLoXianSLlROqep8;3gmV$m`wN0
z!m9nPiO1b7zAWUV9E94w&)G4a1^9>I3Tf9>Q;6YEPnEIO*%E*3D91ZlnRl2iaG-G3
zl<Ivv-fC!N#2v+o8<KxM|G%4tn~$SzkIB$Tz4zfu7M?A4Oz_sryCCcog8PHz@TJW)
z70|8KpL$<Pc?YS={(+nHXLfqXUF3Dbc%nD<Y(z%~MO^kSb6Hg00d%|dO<GFk9{kKq
z81H)X#Q}H2DSGWGm7~KVdyxu5<12fip*}SOO(ccV<5v%wWO&OuqPKo<ihfA)TVRlE
z+U#vj;qYX^_BPbf9BY}CD_HwV%&a&2YX8}gwF;kLb#Rs0;YRiADYE~peQbl6zUFGT
z-QYiIXU*T&me}h_vEPWklk0;0xECFz?D~ZbE|^3g#ZH+G4y@j@?)&pY?p&{V1z{8L
zAV(}d7$q`M%+o+74a}BuK>zW(+?%Uwi-cAwqQ$`n?a?Yn99+lrDyN0hBTKpVymyj6
zOKpXZ=KJuexl*r)Um6^2s!}ILH}Mk;6$N0Zwd*E#7xx9UiB4px)P#$p=4@~RvxIka
zlJCqP$HBdQ7RVJ9cx|>x@pg4@Iq$50vd@lgR)RgJ0#y+=*)|VwSH-y9!FiYM!l=`C
z1<pELEw1kA>=3pn*@;OZZlJs%g|lZ3wm%&w)v0AChdTETw_%h9y0#58y*dR4@)!L|
z)X_~OJp9UDwNBGF>Sl|i4vaw8bNTFSCcW_-lh&4ZsdDXpQE>ZpnX`vz&|W;AI6mA!
z;%_|fw@uW>-Q>|=kJmFQHuU;#LDv!=5klVUla_ODS)9J@LS<MfI|uZk!3??yLEJ<K
zd=Z*$4KKSKAvFYd9W7T`nLK2DMIQwr3>N#2G#+L09iYM{;yMpa-q8<ml;au?_e2ED
zUj|3y6uvx*e@11XCs&UKu)K9$(g_@jUEq6aQZ?@FV{be$h0FJ-_ukCoKmui=iTAtu
zy>IF1Yg(Fk9XQU%Jfv#C9}BpR3e@3_$q7gJlxoukpt<)2QMB2LriUbVCW;`BJ$EJW
zV=&Q4zU_c6{&tohVr$ib*A5Fa2uGr8N7F3{zUv|I=`yL&Myq6)-ddG9NRYU@$(;>L
z<8IA1Erx=|pmlDHJAimT$}j#QxDxz+=uy_LvgGm^4e5^xC9|0S&8hSK-o*n8z5y?-
zZ{*kzq}|r`UCCE$A<>d__@p(}%HvQSfWctuw?nJY@7V{BJ>wD|AAZgJU@%vV-8S-7
z?x}cFq_S0~t|o(VL!qaNp+}Um$0rCVsJ~=HXs;J+7YgUUDoS#!-5;talHS={ELG&~
zGL*?SWCERUTolFJkTYBKg}Apr;;zt;N1cBmf@!;H&@=iM;#?9kCY+1mZZ6i6tYvGp
z&fYq!+^=3GWzxNuY%Jgt=%ct*wo!FnqPHK5QWlr=DA1T%ZP=YR-nATjlrrzkn=ksE
z<zo@xnwlH_&EW0$es=V1es=Vzna@E;2R$=cMmU`n(B;n8GcZ=7HK1oTd@+ReBlJ{X
z`06shWwpSJ%aaB*w|)(q+w$jGlbLQC(R$9bXB!l+&DgX=N@5<N`u%Pj8;9d+y$ACK
zYPsC7<0?`rJm@kjnlY>52HPKXWp(?RauP9*i^#q8yoptYeph;WF0f-ozt6tNYqVWD
zT+fK~)h5|qVOUfT3b{A5-Ppo_@|<nI1ewA}2nsg>`bOh!eq|ElH`iHJ$hM|yKTZcx
z(~=F{<@4RK!Zqw{HJiUg)w-^}M~0>*<l?gIpcXB!9PNU;IqmbkH*Li2V#1jq2Td<T
zTo!6smb8RmN5TlHpkNqU*eej4=xP%$qxQBLz;$K~-rMK-_IIti042_{)7>V4ek|3W
z)E*omv?e#7W6&d=_T=h)t>RqOfms|teK!sj5io*5QVU391CNf2yvmscUtxDId<dps
ze&u)-$~q*P6{E7)=^~Tht2)a=;BA}<p#CaE?HB=$V5y?X#lzg6#SikTE>)n6Xvz*-
zo$NS=nlc$?3A})`m|Iyv^G!CKzr+1v2VE5(rec4Sei%MZ^?a}-EiCw|YU=AyOuE34
z>C><;f#f4F-kuvPRe-hWJaVS5EYJG9F(Ft+x8Ad)0l%Q%_$AFTMe?LYI3GYGpkhc$
zaz*vi*;|BL(XTU9_gfLi_E1z&A>Mu5GYe8qgTPc4Gv<lbxUq;?z9BZeq@nF-Oq&h%
zHf=$u3|b5&ia6xFt~{<vKlRcRo)1pT^Xn#0Yt)sn%}MQYAih!bpl{1|`5bD1Ryk_f
zIxtT0F`}vIQw^u8;j>PET>t{ns_$C>`7(z2>?}=JMMqeO3SkWj(aBx6JH~rEw-*NS
zng}jJkqm_s8SXp6bP(HilNxF7)|v0(=u17i5?l7AL1>UHgRncVW2fa0%_}J4dmfX!
z{`w~nOj6h<OP}~bOuj?EIoR*MUoijVR3v%EM1|}*;ejI+$?Z4DOWP5*pwZ1VV&B}+
z_7LL79nz%B+gC#aATdcdnEBD(hxR_0WyH%WN=fan`_eH;O#O(eG8qYWuLYbTo-AgJ
z-OZX(Hw;`B)f^cHlpfPGdO~823!qmK<7(%gC(U4+z)e03x~-Bt6RBodINpdJ0}`9N
z<26Q`9Cafnc=1Y&Jk<lbu6N#eK<0)}C6zii%VAezGg7lJIOU@IDjb%|%Zb?*UXwpC
z!XGS>o|`zNs~36cke#PLb&AdG@m~)#XGHIX{}RaTa3}j3NAi=l!XVt!DM(>B%^0FN
z!@}U~z4TC`Cqt{vwbU5V*r+D>=A!Y~*V#$U?+b%Uxjl-R!@lj4J)mI9r?KSNi7(%!
z*rrxas2V_(7DX{$9Js6jVTW=Bd9Pw!oJorUL}u`={jvE8gS9qE+|IQ_b3Q@I`D!wE
zdiy)pO`Cmj89jS(LXk%OR4uIr2k3{h$1J{6B#jp<dlqL=Zp}I)RPQD7zKUZmy1&2%
zu{unKprRscr;C$y+gY?e7N-GqzVM26(V#_&#vaiY_Acs+2&1v`fZNe&H+XeHw241q
zd@EfA^djG0o597QF&wuj%%PWTU|MNAPYlc_9NhaB)>#ycs5^G8;xVfKG-Y?)<w+XD
zm2<slvP^4uK6Fa@K3iH(sbl?qY(0TrAbHs%_saYznv#}mb9_0NgG1oVtIC8*<C1hg
zwRmz(%q3w}^yY&S(SgN=&ygPvM$7}vWdwzy^@<A?yFtFNonOBBKpQ2l7jb$#G)W_?
zF4#Kr4=GT<*xKb`X}RgQolrIE;m9;A@9=m^@z=%IXLU<!8()3UZSS8R&KA7|&;E|#
zfhN(+ocjK7lZ$P0*=mF7Fh=R2?jH{yBWKcguOxZ_Qe5x|g;39erPJk@=aOwR^&@YU
zOLYCR1Xo_&KXa!{x+L91*MjafDckHm(#^K5$sb;8B10w@{KL$-p}9QZqrf*gJ+)JD
z!65o+mZW3X<ym~jC7*wpv0(>sN*fRqu~&*+G7UDrxjke21<DzoBs-x(k^W4M?mL-m
z<*2!LwBJ4$U6PAnG|-%xWDaWivBNLa!@8X%veFai$G7<q602SCbQ-I#pXFa2TC3|>
zjkHcp<_K~qlG;5&`*x$(MZ(DoozoO~+}Z<FG54E~sI+cRaEQ-*mQjMtzn7&NRshBz
zAEdx6oI2SH&Vq7Z9!9*wYF(4ewwNF`$q2a&6|Ad=w|ds286B^9sdGC?v-XQ#gRk7n
znmo1{Gom`Gy=bhj;$l%Ryq8M)1me*j8bIS3wE@}{aUY%ui69(SlBc|tZN!(&@yK|A
zk>q`(v4KjDTYD8@lMiMJXBAJq-Tvak9%){gLuuX>rrVOoZ!oS$&aDSVCbic;YWD@-
z>%Bn97@9uto=$jumKBEHE$9!&rx1=lkkNa!%hE3}>Qh)S3%8N^JpsHc#GC3}i>En5
z_qJvzi*1B2Q$hRQ%A&pAP>wQSOTGV0a_jebkA0VILMOOG&joDA&HZ^UA<7~c`6g|e
zGTP`VS`7uVLHXQ}!KD=UC+E;nv2+pw$wBCO00FL)h5s43*s%f#bBr7V`Xas|u&UeD
zgnPO)WY@&k0;11W6O<9;F(){3<3S?LRt+~2Kq-L++OO4P6YSm&s4`!7y211ICifxW
zB;2PG%jkQ%n6vITF9~`z7`OaWAD_t{`ZF474v=as#+R$xERqsnWz`G4lBvm=*Egk~
zdR$W+5Yx5k6fBgR1@M%J#}CD`)aS3>ZK8HTi~x%9!3$AB*LztvWtOr~iyY3~gB$yV
zm;-U<Lsx1dI>pHFxgf1-4m!s-N*2{nTX`=2#(NwQ(6Nw$Eu1DN-9F{6_dYB%#u{TH
zLcTfUoBpMG96)Auk#r>5Wzx<%drAu}Z^77y^9(?~ia83mi5Ja2(U{C_SenIgx84E$
z<KP70o0`>f#W+>6+M(pt(z8i(!CC#PUe3Mv$HZ<`x~S36u6;&ruGOk^w#CEo&jwuD
zMcmbK!NQKQK8es*qGT@=su%uno4)wVrjTxW16p$ppg-64=?*D*x~=BQC-tg)^4LE8
z{G7DMvqo8&Nd?0()|Rvyj?I8Ru5XMARFe_qcApILCT-1+J<qJ_?M7=6c@^Sb0R22Z
z7n~fY3%zMt|06hV=vcsR>8?jvNjNK?-<PjsbQnDpE<Z2t{&o>=vars$%NE5|U#oYx
z@IFAIiGoKT5`4IeTVy;A-UFlQc^~$o_ie%jgJQp6gUB9+S_sDFlP|1{xTsqVxvQ%D
zAk8Qz>JVpiV4h(EH0DR?JIFK#R#mlYv(xu62U-WKwsC>HNp-^uJPCvza*7V?l}n7>
zVAy33me~#_SEHHETI8xA66wBOTu|~ESah@ND={C;8*IcsprX2R2E(Ol18{;OFM&ig
zB8*Vzv+Dqh%LYtqRJ?q1c8;kkiMy!#_?mheJ;h3|m#Tk^C?dbW6-9}v9@qnQcQIcm
zPZ@h7YJ{vBNSqEtGuY)aby$@!UCNbQe5p`*XV*8?4LMV<+b$<DzJ9ZL0+xynKgMND
zX<J<9tPrT^2mIyfKyocdGHMQJa3~{z_S<Bpq7~~C1Maf-MClGz3#+RO_ru&=TQj^i
z7Z0&kWNQKz)556e17FCm;~U~XsWHkYK@|L4eIf+)f9Oxz>7AM5TSlj9c`kEYyH~gx
z(0t4bu`c_W^mS*e>>H*WYPNUu%2Wqxn^v8I!TZOqljXmWF1xh%_4qJ8IA7gsX<FVl
zmXY|WiPhqw8jS-j8U6^}4Kp%PHj+E#zp9n0I@Pp;`Qm-^SB#bIgr*<~{xb*b@bZg!
z86b?O>N+;k>F#@SFWzB=+tG;cITd2P;whQWExRN<%Zb(F8a{6c-o;?|XWlF6&=<iK
zz3W1pCs|Jep-b$Ji{J74V86X%kKzpmiuVk1k||+#&RiHy25x>hxk?iIx7zsatrL)!
z0^l*A2YvBuRHq)Wddr4=J@fg)nrR_kVcht5Enzl=So(9^$jWZ*d-tvA8Dc6a&1cX9
z+}E)_1H?lKfJEw6^-TE;=VNKJVE8td@s3vCI&Y--PBl<r5Gf92>@fNI67RnBg?xYd
zl|b`=P5*fH49!9(lJXqeXFp1S&-ppRhgg2yg>1&)T6|CDeE&1+n^1A;WT7@IhC7Ts
zkG+Pf98(yvRi@2nH8SE95`^rZELRR*pbMR>o39+Rf5)WrQN0#?ATt5~#~Cp24#dLT
zm%q~=m_5shY@tNm(~!BCV{P#K8vksm@BZ_;=`4LaaH=LA`Q&7Y<fcvmp@YA5Rt3Q`
z%vnye`fsKKfQ66S3(%4n9h0UKwCHF{#5FUZ{=i$CY|EA)VHF{9xUwk({}PbCxnXGv
z-b^vJPJKFtw<klMMr^v;tN>0tuF!S^Q;9<Jv$;D1{oQe;<*Fz1<e$KmKfaj!H*@*#
z8Q^~zFNvU#>&jD$qSe8L?i6$ZDyXAMoP><(4U0rad5XJRgKeGb@``q83}CT#5cL~<
zgOm>EE^EkK%@ijQ6s~lb=z#pGt;5ITXzB|RgO7hnFK&Xf1@%xx6XOWpp&A#f6gBDA
zA2D1yqwg`c2_i1qQ3K(8vZwqPZuaDA+{R8eBowcMx>+*t@n)`s;IDIU7o^#IPLLO+
zKR}-dBp7$&egy;n=iDgC8NF0+<NHi8!1cat@;?{&_?Ll-U$Dgg`gkfC1!#C9)c)_6
z{QvWDxsTejLc!28&(pizz}^@en*aR!#`@bn123gr=z+3p%r;J{r_yfZ8EZYkHlsj!
zsp)t!fe+HLJGiI_>}jAyWqe|^3TN{FnXUr!J<9+vPSzaDlV1ts6=HOKB>(0w|K`4b
zzEpjD8gwv+GUWO6Yo5h-#);;t<qZw5PHyYoxljF<ErFb>1V$P>j2X<goA03Q75g21
z1pyELBEve}#V$j;=_8TKseY00Qc*Bt+&(`1B56YTzU@jxB{=0qzuwdI_r)KwRivO}
zm4$vA_>julccM`c_c{;1`gUPe8T)*txayD!DEdoY{)ath9^3lP%m2FbPWfBj>6xq`
z-Ng)!2{}A<jGBb^7s}+z>4Ju7hq;4qQ{fPN3TSjVy#g+=3p`U^7pgts-&lP1b6ZQj
z$h^EfyJ>OAlP~onMG9xAU#>oE@n^%2m?c!&8w~kN6rSi`xY|?{8Y6h`k^h!NNfa2&
z*BUCb;u|Zq2tx|32is4U*YxJ0_pU7{8VdqX^`lY`eH>`tG-dkp;g*`e12d<Bj=V<y
zuWBm)aYQ-3{y+#_7dPow2sEOF;A`Ca<t9b>uCwM$Z>fP0%GymO^6Ejk@UeDLkL876
z?x$Grqqp#J-T5~jbk+qh>YUA#o|;i;RPj|Ze#1Zi;Vc=IwO>NfMBUn`IrF26QQK?d
z5&Yice?e!{m4^y+&A7C=6_cXq|HkI{C#TD)k*Z(CG6WntMBvM<1fh99eVk~-W#Cl{
zL2(G#Ux_Ik%7l6_-LoXuz))DQJZ<!4Xr{ZeHAD5Um!5k6%s|UngAYxLjkF91ZwK!R
z^=ihoik!=+9s$KAi?z#2G}SzwCc|yclABGp=z~h1&r|3lV21I~mfsPHVSJb>6T*od
ztw^YF8<~%>F&WyrqeLf=x(z*W$Bo7S+s^N;G^IRC!(@?E=ep@q3@nk#`17cc-BV+1
zc09?i8OJ}ymuWKKW2S=HmsU#8Ywq*uH`oSsCT%~CI<In}n8%;AL{1`$i`*%{*bkUa
zA-d`M5D;V`8ZexT_A{Anp;|-V0@lVa!!Tebwt4a2pVt)<D%qY|H>MM??hrK@Z6VEY
zR`bLMQZ9Cu$WkuAD%)CElc&n~c4%Vy*RG-R76cf`ZN0B}Rq}YIDkW47Wuv9BBXz|U
zE*H73{Oi}9^3S3lUb^4HXIR=s$Cqf80C7Ahc&NlAkg5PQITsq$yk3k2kRRFBw09ZS
z>C;1m<XXE74bCXaL&u5?d6^!>=Xd?iDp8!{$ZyIDXEF@ltEhC}=G3ov9#m*lGhQH<
zC>?&AEOua>Psgav<5)DxnGOAky7(`UiiqLMsVPn9e&ZIn&uq+)ZWy)A=wlkrpC-pB
zRjmfb&^-Dk9iI>v`L_(}S5bzafrsG_P3<P>r@0-DyY8<UYh77YOA67KJ<uqi=VXCH
zY=_!U=#>nfA4`z`_iG_J^Zc|ePP?vZv~F<CFgG)ul-zyXjSuKf6#DJ0VJp4*vlIkB
z8U4?I_Y2VX^CIW|D7P6Kav!(g8>{z<^4sgedf{|BC~2<=-*sp;ER@lbKitdku%8$e
zjCm#}@lV_O@4w5@O3gF7%~aRSTM3)cOW2qetLQ>&@@u+IHNEP+Tmao=5!#HpQ~6BS
zO@jg7@H^KS&D~Qd&&MQbn^<Vj_`~u^g675|6PEPk8co*kV#nZbdEy|gbhYr`utc!r
zVbTbHnF7RNmGzfw;6MvP3*BYOsa<g+W5MCfP%fS7rLf!>CO@?j{STpkBdh$wx}Fn=
zZ+dl)7YVCk5rQ7HR{Ac#zm+d<Z*0&D(EhQCvTN>>{U9N+1<6Goyud!lll9-70oX5e
zCyB{w`Iux@YviO)vylDx@PHQQ9s%5Rs$L|ERIjMp+Osmr_-DuuTJ#1NCx0V!NT;fw
zsoh<&XqF2v6U^5c0UFji3Ki;DHM~Em-yuyYNnpr+Ih6uh`oTXrsK5O#wU6xNX-)X-
zRPMW2jii&MXuG;`Njjw(*6j$HE=q{c%+XAiQeja#0vs_ifBW!1yc}*M8}(Q+ne`Z*
zxcS5zr!-dWEF&AJ={xmeEBMV-dkLTIitpe=uX+)FF2?AN-&htq^l8$N^Hq|Bv!i_&
zSs|;I^3YamI)Bn@Vs4f9F1zo<X-ImG4HX;f;6H0#`1d6-IlR2olh)C)TApBx&yAWa
ztAJ|jh(9bl$NYBY?KCe|8rKMx{!)S<VKy`*GvGJOdMu^s^E<ObpYF*@*Vjm)yJZ_?
zRMwP&2~Ga)t7Bu;*F4IA6o`+(b&bDouzy<WoGT=5!8+M{;2@IWXc}~7IFpd3!eHo7
z#s~oIc)WL49Rq_Sw%QbyKf@+Q)45s`e&Yhq2?R@r<V6Tse(h@HKgur49(ylK$v6w;
z-;c1Q6;2go5q<V%dugyWk`&(_P2+pv!L3W&Xa4<3p7QrT$Ki6E<1D7zs+?r6yZtOd
z!pv48w$GK-#@(M3RFI{;vt*OswTqrw@@FaAib^yx{QF-usiVL8Uum`53uBA^TW}No
zDhGS*Tb;a4(zUB%nj>xZ#Hw4VB|S}sZfmrO_Y}B`afba*fB3f@E&wO7V7w}1n@Gbr
z{2A7ulydOS{wbnpr0{9kdFHpzwOW;hd<Q&P#Xq}u+NNMk3AGiS4y3B4|L(&57jE~Y
z<z-M^yVpXalA7utpYo*A4T=&#&^ik`RQi+lX)pMj-mJJ@yZ44Pr7PJ%@dLMQEK`8O
zzXzIg0yO@~4TqztX*ZP^$OXi|6fA2bSY-L9PJm`o`K6QRd%am+KhntWNR-F8_8SnV
z8ykW&Z_$`$tiSr#2g0W6b^4mY;?8j(kTOhe@SBg-;;R(l&mIBB%2iy-K9Dm)PW{qt
zb)pJEbya*^-gW8czI`vdX{gzHaF_D$Jo10EL*VcmWyrA;9xt|+Aw6(+WGoMG)K5^i
z8dB#hv}VZlo=m-P8mn-0B#=`JW(J*;WjMFx_<bX@Q?lb`!R6oi3M#JDmEDQj-K`O_
zhruL%vwiGgcAx^NbZ!m~E|k8>+aOCueWofRNmL&PBQ3Bh?j}7K&G>AvW4_W7<P}x!
z;jG5bK-yJlv1xgl;xzNWe`S;VEr2-;*^fT0b6+iNU<y46lGuToFt_E=i7g`z#eDja
z_d%QXs~-oaGwC*mZ;+CI9qJ8U?ahyL!}cN_hu1~_{Y${=4ctnNSmuh=8Y{(o&x%;)
zsVHA+^7qWBut#-)g21vvPE~8LT{hJ9ZUaal6ByNQ;H~21{=pyr&B<7gobE6}SRgIO
z%AGTi28c<p+_PmA1)xko43(l_W25$fZ8g^1Vt(y6DuD|eS^#rX{~q^SvGAvUALVFV
z0mZ);b*D~e0-Q!Q@9O4nY!tSh0D#h3KVXW|`mK<s31B7#S~J+c?{0uFy#)vpkF{AT
z=RaEb-`q^}iK<cVvmd`m9sM6ZC{1|@;Id@)PqfMY-7TK-R|jw+ht`|@-&q#x2cY#^
zo*Les_qXf&$Cs*kC%9+mJ*nSW7M@37#p%lL>C*nr(^H@Yx2Sn<LH^$@Q#zFljH2`e
z2;IsL_;>I1LOK`RVl-#V(f{G;{_-cv*}#hH^|Y94{Z0)2zefElY!%J9P9$}A?4Wr*
T^D+Ds`1e>=`LCjfCISBoaCY0a

literal 0
HcmV?d00001

diff --git a/docs/source/imgs/gradio_interface.png b/docs/source/imgs/gradio_interface.png
new file mode 100644
index 0000000000000000000000000000000000000000..9584d76fb3532a3090516e3aedd60208185435c2
GIT binary patch
literal 331678
zcmeFZXIN9+);5ZW^eR<40)o<{*HBfYqeyRtDpEu5h?EEjsEDBS2LX{Ty+#QE0i{bX
z5`@r;lu*N2k!QbqUweOHf9LNxFV_{aNY<KV%u()f&oPP7*Hxz=WhTYL!=uo+d+R<P
z9#JeF-lb7uLf{j<R+T0^JaUkenwq|bni{9Rr@Mobi#;CR-I!!!A`^p7hD`HUFO(nU
zXpuCNT$OzCn%ZoU?aQ6J_>q@wRrM=UZeJP^zVT4a_%@w9r*B)&U!&zB40Nx3Djph7
zzkgDC)P?Rre{ViLL46DBNtdrB$7AM`y?RgaBZ+c&xqdn|!!3@CH@bX27YTkUvn*b`
z0TrMTokRYGSM_CkW^GDmkz(y#lJ-j0$?1<O|6meEJRVA<c4nkG-j)j9=8e+37Q}e>
z+Rb%^={j$^D65mxM*8QFI|_ItlRMtnw5r#;k57hVz<V$x!wQkYTQ=s@6G1wtQS2%{
zvy4;-r^cg@Yr|Z+L>oZusO&-%a*Miq=gM29MY~fSaj&~c@J{yD*!r(Jye6D9^IrLw
ztoi*JqZcA<&%qbd%o1c2RHPhDYRv;^x$R9TkXB#^ZNav2>M-ifUl{7#*Q`$dpISL2
z7c@=E9h9kT7}@z`F5B2XQ;Rwfy{D-tu0`Dy%~VS59h?0kgP`I<8`;6D7q{|yuWhvv
z*b7!EYJIc0aj?x=p-?I~e9_5D%%Jd84%%z9Y`ct*)hMJk;H<fE`F)#mF=a(1kBI2~
zCGn3kP<ru2?l;%I{;qv06D~qdc7M_KwkfiYATP`*+|HwAG@tc?{GAvy;{s2Vz;Z;j
zhwSg;S&MRkU@q|heW=J4Hc1&qb|slxqJG6`BHFqSmV>G333>V3k#zS$(+4<ef1;qB
z{$$UlcyGsaRrqUiS-c<(QP6t8l=A*7tw_)Ot+wmGzodlof5!jvgz|m4{nHpuM&j{6
zmcZHMzxe1po-o;6RP?wn7Quag9;E88O@R2R_iSHTOhWkXbT`rM7pHP<HxhI?wWiH^
zI9?KEs#@S(RZ(nu)1^)V{VVSY-wT>!ZaE?;;cwC$Ql_Uc6w%lQIjz_|%{y{TFH1!i
zHORRLY2h(Bw}K{#(H$XM{Ql&T-{~EHPDgC-uj~11KH^ijI?3sM*-el78~y2Pdx^!!
z!<;TNJB$h0B;n)0pDJ}651?Ij>}~|<9)3*F7^2T#*<aXS-+p5lg-P0*aoB`U=^wtd
z{K{{d#d^2qDByiVL_^1m*y3TOVfB~J3;NBbY9OT!#}oY!b_I3JYK%}D<wI1t!RVz`
z{$aeuQIcXBXGB8hX5Vt)Rcp(L{>#4(eyOm1Q9@Eoo0{_S3Req*gstg9qK>bB@{@R|
zL#IPe_Q{KMNqhhH&%rU((ru51qPQY?yiXf($lcv*R+uT}9W$8MHU{tWM%(AlpI>fR
zw2|QL1$^l^-Sq28xS+)L5iecoTXJk19jmZB^-puvi;7OspXp5S<z+aGf06{Na1vjj
z;bh<mm$=F9kacmSo=KZ<@C&Oxe%EKQa^?q5;vbTYUhs`L$-cmPso=Az2Z_Z6>CcvR
zfeoL@`iQ2(dx@XEpuVB1MouH%#tgY-K|_d4jO4s`7ynhX9p~6H>X%msUk2R0@(I6C
zS&CcotKzSlo}~3ps<>-kLhn-jW<H3t`M~@!;$61XBJt~RvHrUfBy3QJ+@wAmZ^Z@z
z%Q&Ol#=gKEx<HcVaNoZ~`a;PceoSR|NRS1SKaWD#ESWG|Yj?28Gm$ll{{hz7RJ4Z6
zRamWZ>$W+`u=za|kYUwpuixhhzShE2_Sx^}u0L5QMc6a+><saPr=nk8{#1KNdx!QD
zNfHTfq-U#CD_854eL)|ZX_}Z@pudFr$rR(9+ANR~NE>7zk{zjGBflkDk#+0pl~=49
zq3=yDLm%9|!BxV&b~S_3lGo>@;)f3(Qw!@pMt*!>L~OY5@paMa1KCnf!}+&ej-RfL
zy<1gF;NAXe(5cmF-l_Ae`<L)<$5;l$8>G6%U%&1z=nvmt=6B>r^SeJVG!%N!Y&d6l
z>0_ng$j5a<P}!mWZtlC9cM;55uEp;jxW<h8Rwq5K{V}ay_<-dxr(}lNT}#!HoXmX1
z>`?uJLiwV~9|6miLjpfmew2NL4RJb~INy|PccycG?abO&SKMEuF<jMe=j18j_}J(%
z`|xVt>d0SC@k6mcZuFTIR~xK6HL8`;n7AW<E3E)z9Td0cwALZ<+(E;(zpg5vs-#N1
zN|^1hgc3?~KH~yy$6DPq-K^4@(nhz~b-F3dDcgpOz|_omc5@MH_rmGW=Cr`99i5%G
zhruVe4}A`ecV}40#fc?;vb<(q6|DnrcD`_9vPpHUn=Jpb*+S#?>mi-H#Mq;V{wulD
zU^#d&6ar1AoKRX#5PiJ*F#VyzcmFs@5d;=fsF51;)h?scDapzJG^jjiF=&|Ip%e7&
zkpsp7ztYfw?_1`e&yseaVu(<4)U>0U3%i@J<c!O-17@ss`0AKVDS|!j=nb7#wEdg;
z8{H1wiUQ(AkBXLzs*U`LJBP_vSXU&6QN=S8qvP+#1<Revmue)-?I#!}hR3HXbH^`@
z>U=7yX>`-8avVjCmDR$KPvrb%e#tzLv+%ve24cIEu);P0rHu}vVx%l%pPqfc(B^%^
z^P^ATVlj$!USXvE%fUQx5zP|!n?xCDWLg|ltEJm0rIEW@{m%1r`A<&2oQ;W$OP%vp
ze55~`f0z)gy;Ezvp0FN_rdY34c*Ne%PNwh<)DjpN5DQvS2x=;B5^MU{B*!H8T&CTo
zJ;42`-wU+hM(#96h(ZWy$llTM{K~I1RO4W6(CamR%!iU(_9N4M$g$Ls&*9*S__6eX
zA7Lty2mZ&4?3c_4f8*C)QnVcx_j=oyDiUGwv`q#2bh<LwMBIcgqT*-y&w-yc)N3z(
zy@-85l*5oSmQ$S*0%ivfw(3UHwsON$pnl~#qZYmtjUufAHg|4my*IP7vAg{%mmkUx
zd0-&H%tq5Jc4+n7=lRWiE{3*Gw#Mz#iIwqbbbdUUOdO2XS576scC9;+UNKc|Br)=|
zGrX60g>)LyTv7ye+;sczUP-&3^jlF<#^?59)FMr;<MWo+4zI7>b=Ky~D|qj&wZTCv
z=CGSuTET9s)jrMYDDT!)M>ZGVj!IOLQnAH%Yz-$@z4N%e=ebC_iLPXUQc{L#@>qvG
zWW>XI6F;EH9~7*FA;nY*!iwolr^Z6Z1S*3(@jbh|0xt=wMEx{$^IvbDL<dv^Ol%YW
zHrPhfeW0_WV`X?uwjC)%tHY=Jc2wAtF8P@p-+{Ins8Emf`t&swo;jZQD7j7b7Q@GU
zfC-d;g?;$62><oElPLd@4vnr;#_~;{{vk(14g#hFFMt$C>PcrQIv&EWe7ln7cvW27
zQL6V-x@4Hq$ZGkR{DS_%ukQyTrQMVCUNb#f86y%ic9_+J#4wVhyqa6hw=4!KKKp%X
zkJ?xL(pq!dEpAxo(5OqG*<|6qk=35PsNWXCS{>7{HxkZksx|&5P<X2Rd7XCM>ca0Q
z^YTWIO8Bj|{OxzT4h?q<^NOZRGs_QE>w^y3C0|PpNM<<a4oj6*n$@~YrNpMkvLve{
z2Yq~A#9-KL-D@7^qxLhpA^sXmw^ZmjSv*XY9G<Fw`9LTy5~%`@F}#sb%++ubE6
zp4TM19yM6jHG8SICcI%Td-pD*T|Q;_uj+yEOiNoo%Q3d5#)_Uow{7-jkbTe>tEFkw
zk=WkUBu72$0B=rtN@XR&5c&wJx$^R`a5scPmLenGDSi#gO(`vXAjKw!47NMEx1F2Z
z;hiW1(v?*_-Txeeq&?xg%@?F+pA|T%kaMuU)L&3m+g4kZ5u@ORaakN2M5Us1)6w!_
zJ5PI~;EY!oS%d?uKDzHd0_`+*Y(U2qCYD8lEZv%rA$f%%5018qE*R@slC}8m$sHZ$
zv4~2KyI-4W`XO4AyUnm+gkC$IC<FZ9L9pK*sI__E=pDM7gGuQF298MtWn^Y_uoEh|
zguLEgT(@1HW7Ol(Yw`XbrWs;}`L=4RQ|pZG&+N+-=<QJ02;>Ufs;~W}SE5v8HQubS
zZ~W7`BqaB!!79d@qRHyGee?TX?Yeu~(cB?NlYl?^AY_RMP9?7>rkHv3`fzCs)oFd#
zdN{QDbbLqX_e68})9?#4>fc_Tl0GcYF*U_&nx@2)q`+gI%(~akzZd4IMi*oxi+@TY
zu=mV!n;@GK1M5Jy!qO=5_S~W-L_U;>GCYyFfu}Kz=i|llI3h^$pyj^9tvaevx^2ly
zPTFG@gH_qEuSY2H7ljQGS-q$D*DeO%rWNWb1M-PjdlL-@9UZ(Iz%?-*!3Ac#OTg6y
z;H7wh<$td4T;RvM_~&zcJUplq9>L%D=mPK9pBKOj`^?$<#aGdIM8IE{ftP<a{y**}
zip{?GkLydLz;}2m25K4_z`KF1r@g(K*CTiDLoVH6-~$qmyQW@vcnrMQ*9DFHJexrK
zqfQS@yiIhp<!s$ug~4|2Hul2)t{&KS@D%*zfJ;|<Z!o97tBaeLoImL5pF8A$YwX7&
zS2_RO;_VE&YNDghspjr!&nYE*Q~2gpMN&>qP6bap2f6#V?)?2Y@E7RnBX4gHIS~;*
zKR;nVabb5)M-fq3Sy_>rVj^N<LckqDUIA|2V1FSuFYdEO{?X1YdoNp0Cl7BYcQ;OK
zyI>o4A8*jrtJseI=jUvk_Wn-)?8(jR?`Z)O6v2KYA}V}S<bT=*9#z18DyQ${Z|`Dy
z%gGgx8PJEKsD!MP!k-8J<Ewvm`7e)}{L7=V;y3^G(SP~s-yb#fviDSTcLh52R{ZCJ
z{r&L2e);!<3L@CK|BEcn1pVhzK+=k&3L^irYKo*C`Rp6OLb5vD(t7~B18Ro-!CwV_
z@t?f|*Z6jly7VwWb(HZmZmB%*zpy$*l+Jd0mS|I>zB|uYbumYa<~9KxSuDN&3(Bj8
z%F34r2=e$pa9V!Mmbg9;L{C6)o8bNN?LZ32*E^XOU15%MEg|UN(^HMV4ns!temnR%
zPWYjOL-(8CE{Q(e{BY@u>Jz*R_yok%oXY>_i>W)=(CoU2CTA+m|MLxhKO6o)S-+SI
zXET59%1$F8j%^$xL)V?tA@CJ7o%6->?^txee~NV5YXu3PJ9q*D#Q6EsBWQU0B)cxH
z*&|Ww-059VsgS}Up}$8O?skonf89Z3a_%xNS^l{b5EI4!is}E~VhVSor$aA}3GA$n
z$+z{ggMy;jJ5N;;e<enpr>)`ZyyXv7?w(4Ag__(9vr1J8b2}Wfq;3e-pUhS7?W^>2
z1)3yzmh|b|RxaSr6EFy-axC<wu`Kjv(Av}sh*(PTufN=(TmR9h$9&muo^f#uw?hDw
z_)$PO6GLyBygbQs#;W5^`OjAx?er%rjdd0+4IE9DDEmH7;-6!e;kp7ZBHO%H9C@3c
zugI@)KWNwzW~A$QB10+Z%5|=hDQgk8O(R5au4`(gkj4g$>}jE{u4{^XtvuJD`Y`yA
zb!5GlL)B?~RUe!8+ia7&ld3|kPUlXNU!X6!6)8+Z$KuxDB47RT+?8QqSiAw(_dCq4
zb1Zw;*I46D2D2*QK7TF&;lPlh54M-PH&%Jf<$bWLn5aMKs7%~h@LyKY^(vqUAF@C~
zf_D|=R|X0rY}9o9h8<8XB<Bdi+bz6Dk-(>bA~tAe@yg@nSJQ0_=Xrht;;IPclj6}L
z|4@00fKHJyrwF8#q)(3V#yBsd2jTgT3Pyi!s`qMbIy8-g*d1{U0MCx5$?V;zIcI>t
zSJ@x}8+YVrQJuJOh8X{Pf2Hw<r9qf@V58%?-8H;WK3QD?e>o1wSdWpj*Pkr%%jzr2
z*DHYg!p{vP-a_F4yOr>!`bzmJHJ`5RIzLxfU#0PeE_5yWJXumNn&EGwzEgOizAbuF
z{kR@svrX&Q;Ja|{L*5$UJ#u=G0`ger6~gGgT=f)}yX>*&>Xj}Ju+XXE&X4&TW}|Ay
zWh0O+5prx*EZ5Fct!!t~Z*OJu20^LW{v=kWGodG{uwQzXmNWY1<}86DLy?)FAmJ}p
z*v<{;%Cg}H+bC%L?k>0|T^2lC{1)8){0i9NcLBHHQ>0WNS@qgzZrwGKNGSOgW<m;f
zx<GX4^#J50t|imV=drFPtCyLI&J(?v#l!W<!<+WMU*B{ZXw%Ok__|h296NEh1@sg-
z-5dm+<$gn|7ELLnFkj_l0N-&MeC00qO%v8k4MR|$nh<*vhD(l^$v1yT&xDnUPnHJp
z;F3r~y)x@qtz)m1hGWn4(j!=Pb;y8cyO<NQ?PlntI(U7uek@<=h>ot7#>bop5dkG9
z;Z9*srW9af8Ezw)QzMT-eJiALVg#n_mcrHd3cww2hP;JwsUx7k$er?#qdl$Dwv`Uu
z435yv&{PGd`)Sh&*>&-C6Jq>UfkR?ZR&84>#1;2`@Y!aW6MOrHEAWR(2hhRu{PxgG
z7#xbH?8orTpq-NG=FOoWKk~>c{I-ZT5?#eFt3X)p)f(zIP5u^$yl|1|8VKrGFr$#F
z7!o)TQ5VlXU{752NtuhEJ&gdd@WajCwSW(osK!;Ztzn_yzHF|gynLMu=IIdBT1}k`
zHC-)<7qKf1og>%Q^DBdc?kwNlPK72}*U}Vqdy9t){%M-b%ceQD(Uf)*7q-jRB5j-f
z0BFm*9>+-|a0MWaclVu%5L$`M$>h=?LG3I>q2Qao#X0#Ci_Hz%6QmNvv2%I5H{2!|
ze?G>gNy<eeZ8;yH6fAF|5lPo{@5)8D%sd{6<zt|$z2P4Edzd_yi0aDaJ3^H%%#^V0
zy)+d)<fLVxGZuypAMHrsY*sCNw9<dHoMx#V-O<8$P4C@Mxhh#HNvt__Wrabtk^W?(
z-$wcGk43yQf{Ryd?ka?siSboLDKpYj)A{u?u2kTPEa6X;r5v}854PbfWzEbBJsIYs
zBd;#0K(ro9d6o{7##V9_bR-_}KR;T`y|eyV7(c^WS%30iCWj9vq<qJ~BxYywp{R(g
zM3$gByKV{HcU97io4>TMgrumrA@ES>X>EHG*b2!IV4yqj@)7}p?O?4=8mIo|5g>yR
z+;;?%GuL-VtVnjfmd%%kqPB@+$>>VVAH`?;7rx|%m(Oyys&j-=Uwh6m(?Ioel|b$Z
zfTAxp5!B*RE#j(}&p*GYsm`>VykhmRctsRCiW~uqPR8kgwkBA=iL<z2oH@r&M@LTT
zAYIn0%X-uZ-|{Xn`6#P=b)2Apnf^mb2?ablp4e+;1@2tdl0LN7|LA04osLf0*hO@u
z)?0tF)_SHKsVM+;8qAOOn+XjP-RJ@n$fW?|^=cOJ!-@I@-+q2Z!>zV4-3&K(Z=rGM
zNv*fz6Oc92x4<7TD-vR(qv8;~`rPEP-Tu#$icX$kTJx2fj1*<)Wk3TyjLbUV)Bqy}
zCW%KLiz8)WOz3_n__z)t6ey_ziSsm4H0>rtkhOYtmoX8NvocMyZr@3jth9%L^bfAD
za`m+Uu4ix8&j;tyxn5dcK8)s4i;i|ONV*q26ChCU-%X(;#P62tH#VTM)m2o?@c3v)
zqn$g9mo23!o*fRjh9W=^mIs#UxWdpQ+wkdT=hkO5T2Zo<j!<c<Fv<FcY=0FNSOjm2
zg%%N_sI1;-ajeqO{~(VM{`6owWgnCNMA;EY;{2j(f3f3mW_aOmE<X$S`SoRP>oE^i
z@O&QQt3lG(#t{9c1+$gNOJoc@6jw=Nlk~{K*ExZ-iqd^d9A{dEz|XxSlvdiZ)9Te(
zkX<*(n=3SxD?^BY1T00N2KB;d7AXPIt#7^oapOXz`huMNJ(7XsObQ=ah!A8Pmip<^
z#Chx7K-Y>J<4HKXCcDH8^kd$=b0bsSOS6ERfsU`Nxa294t!APD!Tfbwq=_yw2!mjd
zw|352%xrWcmz0zQAMcZZp&4kGwQix|19><|csRmP=B~cQg?0y=Yuimq9J_5Sz^^Mu
zUsmtCLJ4Z_8RsB_$t*mxXpYkC<x|<(g30DZ^$a%+7B_S)mQM$+L>n4eU2od%37VaT
zDN<k4eP^-7a~g7(wbUZ(wG1a@2`jW|-ka>dvR=U(LVyq|T(ZFF4jrla2@t(}UUUT+
zF}wWh<QpX(i9*uqkXM&$RrG_`3{&2tL*enY(WA6=yl>WOr*0Hy5cF-OkMM<!KORFL
zHA1KSCS=L4DEPnB>PZz9pA24Mn|*K4V_|0<1T6;z?P+f~VU7>tCe3Sdnm0tJ)qS%n
zCP$mwPqZ3{V^bdVZQ&jmEj1m=T{{tJL>XH--B!|nBu&^?0-0_K_?4$vT|K)jAVOMH
z*7CTeLUrkfu{BlWnvZg-l&e|JouKG)7WXQZx<x9-0<`DhMh{t7!|}(~5PHV(ZT8Be
zx}&`n`0s8JmVCV|8pZ8{GW#_1c?12)8^yXfVUzd63n~zdCjr70aBO#aXKKh}H(;nY
zH$8vdk9s2>@cXsL%9<aP(K=Z6IeW9s{<n6P=v~DYU-0QmB_-j>-4qzZ@Pv5e)Zs)L
zbmn+Db;n9BQ2)5^#4i#Ik0y;J6H*VyWu%;ao`8l=-q)YhRoSAPaLs^4-Oz%JE~8!r
z#8l=1`e=P^Tfp7g8-|`dQkFUXYFjzMAKYHPKUt|qf}TP@+#l=jV65p-4FZ(8ZZ#rw
zCt@cQ+xb2>8rl-FLV%z!OQgr8n@^OxiHT#q)Kwtz1c)(@p#$d+r4Pmh>V=*nXW`H&
z*vW29Uv5WhOw&x@QAYW^k-VWF{C4%HZ2!G<+1Wvsu=;XG1pOPTtdnoivtuYLViBI^
zq@s)z>FE)a^q5TBHt2AX7Ci8)Gs^1?LulwPy;eWJX~n6@$!wXPD^2~;ERptaOyv}g
zH({;nbL}aaEyzGiOUwPXz?DctqbqER`#*Cxvm7%i<~sB~m?*9LAI?xk0RWRMmc{T>
z5>A1Z`(p*Fqd!Th0{N8)-a-nxPUY@zs)f<*jk>1n7}@e4{U{47=-00q5Vu#^`u4VR
zpx#dpw6wp85OKL|llo3*d*M47?D&Vq?C`{Tmz3oGb1w>x-AXk$X}1XD<HwJgSL0N+
ztd5TP+YVk<&iAIAiWcuyNDlmzBx_(4ylds(@45dHMvTVnhI?!ICRRFpCpC9#_L4yt
z8??T2E@rSXNf+{37=jw;$_rQooqQk5zpV(Ryuzxhv>Um(M4@O(JX)zK`bcT7juvj9
zcfvP8hx9@?BOI516d8kqwwe>zjzag_-;lxARik(XQ*-@EF0kq1V!*uRu!`M9fLNoW
zLzO+;(sJ$3-NyvEQ*fs+znuPMy%BbkHE_Q_&IfKvY;JAMaZT^-<vZjYR$B@|t0Bt%
z%S(>TtFV)WqQUwXEG~kkG0iV)M;~`=t~c5af)Hq{`_<)vzwUKF8`oQ;Eqm8ROWXPy
zWU7Q%fffBRGRdT?aPWNK`w}CbaO2K#UqOxU%aE~XCcLb`L)qC_CF?Y|!*Sylx*nOe
zNEg4c-ci~EE$b8Cv5>gNd-_dvo(VX!a5*6K$%J`5wNZggGk3klY{bAA@dp8cHd4F2
zDI8zSM^Z}}JqIs^Wrc7l?4Y6W4|(d*Yc*3J`@E!k5KV)AXg80Rp!Fs$!NygwB?yEV
z)xjPn)^s?&0v;3z7IwjWFJoBW%1TsV*gKugS*n-_Mwx@*dSx6fzvp$-V4)#{t`Pqf
ze~TIm|Ni;ecv1KKqC7N{+8WU*rgt;Z?&}iPe`gc~D4$}+a%NZ3+*#UNPF295y@b$3
zj6CT`?3Y~~=^1v+?kFud{)aI|<7$;904*MxDJh=11+8aMs)HVWe&X?KmMALxB2i?S
zON~=Q7?AGFt_Q6Pq#wmgPm?oR1qXnec}ansM&Fwfmw{)C19*A6mY3fRh^~b>1#!^S
z9&2OxeP=X(f|~FtsxypE_%LJ5m!hm$F~58|T@^yi0xh3jIa1PoibRnWj5<MGTSe8`
zGD|yVGo(lNwW2~QHe+^&DTq$}Pd&bg=n-!;*Oqs97=e%0YA9g}3(veI_Xse*3Sg;g
zno1&#`{-GNtixMor49*5ldWCp_DB#~@uqhA>)sGnwdtVs22nfk7W_0=f^{<&KCs;m
z(^cF`0mprZ0Uc)hjZC4*M0a}LFd5AR&KZJ-KD=DYr&3~OZ27%gQaJ_w`t!>y2bD0Z
zZ_we+l_lz_sEiVQAmPFPXn-^5vzaODr^DF)_&ZS^4C3_Z_hUl|!6}cqlG(#wdbV0X
zR?{s4bHT=tLGx#zha*QrD3->IJ7{|q$f|v#>E(p>oYz_@Oq!0{7s7&1dXv}PyiW={
zI0V0$H_bZ2E+ZA-V*`MH+vC9u-LdYXbl*HUY4#<9vQ~vP2w8Dk37BI}%8tmqgspuM
zKW3}Md%pY9E6$~Nj#!2`ftzK58R-~J=x_nh3-~2h0kC6w32V(|&BN~w%=rysLHE*@
z4JXG{wmiFqXfd806iZXp5A-ccYd!Y%6O}x}7AI<jEl*lgYKW7rp_&6K<q%mM=3cwy
zV<|8uBr4zf*n-P$+6Ns17eD<TBp@x#@3zYB?Cji{ln6?lzEjcJm1|5|I~8o$0E(Vv
zaXFr+4x&#n|I4W=zB@0)lD<b~yQxZ$U-!!KZCpNx`jI5ygmeY?-JsbrDC<wy)G<#@
zZ=<f;imPX<QATSxx2}SEZ<c6-GJ=RoQ|}b<y@s5YPuJ|%{h8x-<JJpGqw>X7NYbc)
z7%hRd##64@{tk@g=;SLEh=LPjWBz+fjp6>I$^FeAWiHI2e&aDqk_FmtnH6i7q{&7^
zgwn&Nmu9!qg0D>lZ-j)AK~Hv4fdLCAf5PcBsUMjF175$*&p?MN$<baq&D;;-dg1C4
zIwJ;^8m)S-0s+EQ-S)6^>(`fBk}?}Zg@di~8!e1R)~?BYKziwI4a^XsrtLU;;MTZK
zmmqVTy>qzHv~4wdJRvVp*NaS+$?{A$mKD}hIPe~I&f>@ew5#i<2resr0_4g-m^M>^
z2oND&%IzJ;cbA2FX(qun3h0aWouNFBo`Y?*GAk$TIrdjv!G$#NK})pKroPOt^4u;%
zXU~aO1PD>QmhBp6_^0mYnq{;o!j{?miPiv=HEX_3+8eh<R1Zt*r*2`^p8Dztq+@2F
z%+6vzck{X<Y%_j`-9`^(pm%84AVm3=4cb#$mF~50eO4<?I6dMZ9CiX?4PNXW{P+~9
zX;VXsGuJh{0~nq>Y3u}`zp7K|&7MvL8|#*%^?#u7-M}m(v&=9I!Xx;yV(r53N^VM$
z#`RC-elFyXq%o5ts_7B6_1(ZEl;k|JHX}mNnj%-!M%~?;yRU9DV)+v!X?H=6Pt#kZ
zY^<?Xpu|k@3H=hNCrw%;_;Id?p?3oiz~GDh0{K27u;1ezKu|0AzZEzO0pg{6bc=IY
zwS%yAj`vA?EyG?LSL}#xLSxP&bFkxm{!;U%X5Mbd2h`C<eV#`b5bDKQgC<++{mEG3
zNGs4=jEbjY9)m)DbgmR&ji*R0VFhWI{iWT(?TmoEOS4EVM#4`B#z%tuE&GY6$atya
z2WBT-MWtkXS%F4dIZ>XH=>3lEUUDqNS`yu8k(UbIHlJWj5Xo%ZpPaE~!g$PPksf_g
zh4iu3B18xkPFuB>)<aJYqdPDG)@GUVer_gVaGgO<=acFMGv|T=cKN-j7kh~qYmuel
zhRki8j*?*99P23oGhn%dkPYz3E0%_s?=ZV9CxmVn*|rYPOgHJ5)G@k%ZSVg<!`nTI
zl0(D8@4+tQ_LX_>{%Orr2S^9==onhQym<kUBQ-3z%b!Q)ysPv&eK-SxQ&Ei;++^KR
zRFdIW*xOGUTh|Xh1s3V?s9Oh!^eC2W4Ah?43Xxfaf%X%TQ%-p7St2aHhw0lGCX9c-
zeUzNz>H7Q4d65t<%Pf$i?tYJNW3-Glqz2fX5ufy&O9s#P3*@C;(@tfQI_awYG_~Zo
zRX#kiT5j&Y`(uP<)xDD*OW?>c;z}<2t^oUx2j-XQ{Q9zGR&*xEy{J(-IiA-E)5EkD
zZm>(aJjwy!twF1$->Kvu_)wBq@^WYY<beqUF;B*|9ArB~H8X0{sCpt8nIT@F=u*Cw
zLOKygmi!c%3v30A26VU%euS8y;)Lt3PKKhaTiaROsC~zr8mXZn!d99n{^@@NV51nW
z%?!UO7UAaAk5wtZxlaQXnnV}Adt3V^j@4%#Y;4cAr@84w*JoaCX<9<Ths|B@`M1O*
zU4x2**3T-mMG#VuLv&F<VzqRAd1YlVC}gK14En>^TyiyqU>pkuGZa@(;c9Rtj)3BF
zcCyppMG>w{K4Ff~{d><qA7%p3&6^d8CG4dw3+>)PS|<RaxUPZ1$?nL-VF8-KQzRu5
zoue0X2Uo#_jsH@U>;qv0_+=SvL63_vV{+*Cs+Y(gK+tAYJ@zW9JdPHiW)uY{(J5(I
z_NH=B=(nuTa@9?bpHIAlob*{E*27L$!mA3rmcnbNeT`)nQuyAdRR%o=dk#C-RfSq4
zUfA^Wn~-kW9}tLJo%YYAXuX8W=wEDZk3g0WLHw5o=J|-&sQ0E<g7VS^4-)3|hvLMQ
zcCPXr%@C?Uc&|+0Bs@xQ0B&oh7~shW5hGSU8i&!y<7zginDCYGqYbu}#%;<d{hEDD
zJ`i=>T6PmW#;>3l+;zLhUUZ2&_K>o;{!YHV*Fixw?HBYc$HPMLD9Sw&;I#7Q_kld=
zKwD<*wKWuTaztN)Xsz3tgZC!LDHc~8KAwFBr_w|x1Bu<-wX7-r^q}GEIr;h5N|H`?
zRmGGx6HdK)*0&PmH%LU9_V3H^khp5CbWC>;9WRzsqxedzu-JAsU0hFdqp+%He~Y%Y
zOjky-jjO6#sDHnetmnqJLJJGW4$D2w^_6*~j@APPIuV+z2%Iv|<p*S7{qBzpAfd=Q
z1@v*;LE7@eJVWCvY{OP7wpe^N`@MFWgbK9d5y9S80%;Vzb+YOxr45B-%0O)PS5By+
zuZTMsg%pl*ABeMr$Q3v5y>lx2d8)AO@+Z>(Vdhp!*%X_<@C~jUuk?pOYo|jC`VSHE
zDa@h@6dzKo0_{@YMNaD}9%NCY?v^^lfW27P<p}3Ef;YkbiyMhNY7g~F7y3S~5XTnf
z-^aP_w|Esu5RY$@#>zj$f<a#V5<X6TH;}m_&aD}_e5^W)oaGy@8<GLy&Ai!-3MT`}
z19Z@Ig*f&SBEVUH*$DW{ZMOj=h|9~o0Fv-+2hKlmL#5ChOL6~L*(=9MonS#=T6ngJ
zetIooo*OT~bQzURz;XKW7+~=3g#Q?PyfQ5G1WqbYLbvekEn9mc2V-Cx-^NSKlq<Oc
zKduq>onZZ-JR?xOvOSzV<Vp~oXmSIfP_L^%Y6IrjU*k%~pJ4^T_76cw;hX9!xQ@TR
z>9hO*6x;Yc4V{f+j@dzEfJo3He~V;-*lwG)16(k-IY_3SA+_UO3q%53oq8K!Q(ojH
z1kkl4zYkeB5W0d#D{N<UvP|_Sg{+#PxHg=otbmv&4b+PO@}kh3QspFztpqw%Ba3ZB
z6ro?>8tVjhtUv_`7A>k2c9Yq0L4x~${xmS_;83LS=`e^Bmt0=}Yb_qb!^?cr|H0*C
z-_pFAjckU7*<bya5JGlK5*aF-X=!yT?nwVRvPOWERrg55F^DI4;RptRQ1kxBGFK@N
zr}_7!j{%fr;w#6smx^WJg2o+Zv<I#RlwSgB(n0<A3fo^YGJ)jvm4%(|9DL#`nA2pY
z2g0BIOd}D_q?{SxIlZX<7M|t(hf&F|UewLBz5sHe1W@emwe?qJ<7zax5TXv2h~oUm
z)0&*oaCi#yJz1Uvy&`EyN+60o8kdeevH(`?=pQ<E89(pBR{B_HdK)b=y$y0O)70h!
z0n1LUo`bHX0md68VyZ95-(wzezku#*baFy7bnaD2$M32_gVrG@0~=A(ST$rYXlnld
zq8ST-Y7x{VkSqJV`kn|9B1W|}#KVKJmP%K6{-SQX<(?nT#G~ppum&k~f3LyyOUS+f
zNM|5r!AjJ<JhG^$dys~A?klgUR`YRr=?nOA*8%4+OMtkovNc+<aZRi<y6$+xb~YA9
z;*B4E`}a(+S|$~0LhcJ~{cYUoMjUo20Y37o3Z(7jWt7gXLN5{t@~4;DGFH~=&2c@K
z?E`F4)t6=0@$-i&E!`8m+QS09kD{lh_M7%Y_23$E_%N0Tu6c??X78WaEiRq%BJk&$
zUh?|{hpQ?fZ<Dc|E=+OZvLEH_c)&5qR%O?z=pS1NC-Ju5Hm4);wg^{MorJjeXW&#f
zf^kzUzQt34AhKoD?_b5a`Gu`)*v1;TAOD$w$KcXKK(mz@u{J1Te5Og4agG|WR$=V6
zg>~tf6X(SxQfx|XX@VW8#owlZ%Y3n;YADBssrtWN0B#n6fY=+1^^u-``$*hUBBow!
z#RkiH(z950o}BukfaO2vra#l(TR7POK%it;fu;!juR!(xzb8=34-bG^mBXDSTBM`V
zI<ULA2=La=vc|I5L4n>m1$+FsG+5dAvI(|iMky?Gwznx@d*Ju#SS1|TQ65k-trr0K
zIV;9x%Z!|<SD%KK=<3=GEDYF;wVpM=o7Aw*pTG&<-U(4(oClC+<kDaPqvD)Y_g{cc
zPu}`trD}XPehdvoeu*H00#s}MtjAJGhx<sI`;TvFDIx9dqk_a+DK>k2ktV{R0Xduo
zoo!1j$jVf${*3L{CnaE4?5?_geC~(6<>bVCv%n5fiA*`4$EgYdo*&A}M5d-(M=l`_
ziq61P-xn=N-J(haAw514IgtS*?7y{yj|{S+zaWm1arsQZDHw7_f2~Ne)X~}4(F1ZN
z7KO*;&jHr!RdjnrrKO)0V2Kldcc7vLDV+tjbD%kD(EOP<oo-%xt5LQay>GdhdbERa
zqDBH64-0eiq~k)0ki#JcW#oq<fRZDh>qw-6xXrEC0R~(v{KtTEB9agH*3t;u)S}6+
zPnxnaa}l;}C06W`36kPkYP|4I_@WXCV8}6T5SwH7dyS-l&;9@$9m{vyx(>L-%0F%~
zn)3cKu)Iv7Hn-%ydHZSsJ1LYvKBb9b>!~@wh2elMKUi`0I8WBPTYe~7F_7V>)H>-`
z=ZFH<pRUGd{wd%g8_zuCcs(78(<*Q&ZxE>IF?!Wc)mm&?Iq;;eF)?MPr>uP*m-NGh
zd8ozTMukHx#nw=*L~-zYVVhrwa*7<q0K~~f_Qz8`>bRdCCKKH@_G`HUz4`o#IEBbm
z!bV#j&NfShsG)i5BW3Q)%pH7KHDG4w2zcJOeDzP_iG}*nzWfM{p%hEsv75l=z|JzT
zhg5I@a(vqkXBG~WdxnIMz7!#BudXIT-OL1bPyIKV(XD_@nVlkCgD<H-DF0r=crAc>
z)m1~vu!pj?bMA2_c+r@j6F|lR5nHleoRg8*#ae2)|L<R&u3_9I{<l>i31@yihe9j&
zPCP01o#%JUWP<k6Z@P|q!?kO3U|P7tO&1AJXGBE4$Z@z+sN<K&A}!o>iaDD9=-cHA
z1fgn@Gtoxe*U`~22|busJH?y~7U^Uua<?5k6T+!%7x3BCv)yMJczTyoru%l52I2A>
zO|$?DBHu$HypRDv9htM>T4M1LD8>;eF1I<Pcr9b`rOHXXp-tqqk%Lzt&H%04NZdyG
z<Rak?8HBlCMs;<<9hR)kJzg)5M;g1G&vRxW^jZ}}Td@MAshF!VGg5EG?BC_&oA*x?
z;?jl-_(ELN(7)Iv9w|S|fvghm51YG3jl%0Hg#j^q|62@s1KBDOuQJ;NBKPBXLMQB&
zhnz~hc?)=PLzzbu;ed~OpW7~MQqH+#dh9!J-9yvaBL7D(V01BOV4zC%dURU_AH>4p
z`@0Ns>8Su1cz{$vR|97_UzETHW>4kg6EbiV4~mnwH349BTH2WfGYBJQ^VJjCGxm5g
zWxb5V$iF;iXn8t_TLXxz@_<dV6QJ10XNfM?w*C2%H(Vc^bY4A^<RvX1A0P01vav3T
zXE>?u5;y~Q6=q)#zG*K~#&L_qz3Jui8}daN8y^n4$zr_(&X!x~L2T07MD}J+Io)R2
z7<1wu=TsH5-Q`THlyOk8ZEvE%YEIvjVGF<=x^bTkD@qd(8LO`xMiub#kI6F5Yl=Yb
z6;MxgQEgROCggCZ$`PX8P^*as?A)H<Ps&=Q>@@V@9=Pop4Hu;(P+|GnJNS@6ro`Z!
z@>}nl;Xrha<WeKdGkBTsx7o0*QZhEP0b@K99hd}b;*@}Ps|LOqO{%LT7cGxWT=T%K
z*|qe~K(V&H$hxMJy@}38l}YkdQGoXZoq5kU+1NO5Wa;x`hlP8vpqE(O(Kl10JLPA^
zIn}9)d-x$o!@Ps9_O#T~L)NNCu)avHI0k4|@*mAg1nw+iJsdTkV3wTE_~rD@oO4V&
zL+9bo&lhs^vc>@iQ+3nfTPkJH5nv@h&JseCZv%ZfYH(m{jB%kii{qMZx{DPO;qA?Y
zJCs+FwjIPmDcM*9_g1e=hoGl;#NUl_aoh$#IK!FZ#NCTkT6He2xU)Fb==YoA<q}Y1
zI~E6FfS$KRzTpiGik-w&C-BL7FF3HtnC>gK`ly!&@bAygj0M3jRQXK|yuUfyX|lZw
z?s{Dq2O&JSP5N*EI7E++zq=WFynoYob(9iq0?a-6Z0?U73b8ez$%aN6iSHzwG!NHa
zIAp5gEJDL3B|OyXIc#Ef`iHm5V3@#EQQJGvKsg{&kULXNiOQ-0O#$qlbo5(s$Ec-2
z`C+O6agN*PwaIXKaRz3M-Gsan@2ly*Qc`QSSS;kl3~aESWmGv=@>)WUq798LB?a#u
z16+M-@U=^1IM?TiaxLRxf37+cK)&BqY;`Vce&a0%@EpK@f;cETqc8fN4*>N)S>!A?
zZ@D8KQVVgG{ZKCo<C~TtHIlAH`Ar8Dz!ho$MWjDd#E*izOM`sHEr-iaYb3PSqJWZW
z<AC=#%UOZ^Yf2^Cu{Tqr49T^W+w!|h0KB(4#)hl_u%7eTxb*Fv#_UscLd&61rj-uZ
zvPR>8*XOpV0oVa1r?ga0EPg3+b2@0l=b1VqP{^TjhF$6N_SX`ths^}87__LT%0N6*
zrQNOQ)eFx#8P+#N5V*Tc9}Va?gP;kumH%uMrKn~Jz<5RdJ#T&rHaQ8w+DXrxmKH_r
zOoi%L?g!^UjKxxXz^`Dd<7TJ)W_0AZbY1)aIvqoLrZNxinK|Vpw|)-4I0(>4eS_zo
zTSz8A_6<UamkSLFqNQhoEALlJO$hV%6rP19iF>g#dnR7rB?rxbiXd$$$s;6nBkmAN
z&`_bA-s8Q$nN#>#OQiXAg4skS>r<qK^_lEw^Juv5MBdB26E#+e;+Z*29lqsyUTegW
zc2(nl9L*-?XafqFYp)gn{1)nOlzqzy2uhSEM;$pA^7FtD+8=8;(-8nyy@+lT70d+c
zy#43mrN<3#>8Ef1jT_(7K`)s&X7~&+M`ySZbm6R42dtG49|6}>LQi_F$u$@L(}OZ!
zr(n9t`J5dj_bo$STKk<u-phBs=R{oUNBlSKzGh=LuCea(rmNYJ4&(;lmg3Ib(j851
z^#t;*UZ7Cw75IXK#Qni@26X|S;?f~{gYj^$gbdg_0v{I4PS=>z(xHaWw2S$={Wh)M
zTQQ+;Z^aA#>$tF|9tbHOp9TQH?;wcg53|sB_j->WYe%BA5`_EidGmTr|8?QI6_8Or
z+or1>0pjcYnHoLdN4WbJSF|&Ofx<;_YorGK<1uZV@CINjK7B3+tEu*8g0NnD(v5o*
zKz8WA1HY=%&(GoDyksNNUEsLI?_Y)gy)kU;2LP=9_IGLcP~lpVEXlt%2Y7$*Tl+U8
z*korgU#CpJ8)s!HcFf6_2m!bZ6c0yM*mhhS%t$D+sGvs!koIrBh+b2aCjq>*vn1XM
ztly2HPj9hA5e{UpY#$Dk45|Y7Yv6@UG-9m+XvgO)<k4#aC!8oR5|R@e<ZJ7+$Cdr}
zfjtIlNU~KfCegSQM2XtAKPVlI4Fb5jGs-KPG|$k;ly_%kL<G=KUO-c8RfW>dF=pZi
z4A^K3RLtvR!;=5W?udY~3j#QD!g@xxsYMMe7nQMNi3cFcvo3s3GtPPQ9oJN`Qn*33
zv;0GVoJ~&VTP8@p3Gmp-0yRjWIOrc4jH=Uj$&o*GzkrrtwdKDqt}<3ju-Xz565_v<
zmvZCZhiK+pLXVVIXiv;yVi3IhS@68^y}J$^G)lY~yx-?dFu`c$pYv9|R@>*FaZ}YP
z!)KUei^vbCO4iV~$a!_{Y?*29B7uB_{f)17@OnLpxo|A75uj^J&WxNi&u7F^dP>}F
zGLlr%<viEbR|Qnp!v{2b6^~p7lg)FY0si!il+n-O;V;Fr6+cJ8Dgn0kJM!_5F0405
zqR`f#<avpkCAffZ2<!?JDL>A=@#lUWps4eI@Bdc={$Kg<+>0Ou$`@$fSi3#&Up~!r
zEuSI{A7&U`9LypYY5pAu<YSu7)?EiARUeeI6hm4GSHct&Fl~dt>9GKz!1V;*PaEr1
zI-|BDYh<-Pm?+~&bGK71aI*k|Vr73p>sAM=k$+Xe>9))MSOrX|Si~tu{+)2)+qwVn
zRBOP#i<{m_^aukGrC4g7iOJZP$NuAg0XRQJit*D+WgMsFwjO4gNKeTJ?X7xz{-O@R
zPB!zLn(qW=cOFhvkC0ca0c7NRzTm}KbvOxM)|42Z9|L}g;AV41Ek$F9UnABblt29P
z)T8GhC0c&Hr7XE@JhVXR@EHeG2evuZN^!jPN(sv1)>2tMO;46JV+Y@i%Q}6(`KVXn
zNLA(-1rz>%Glf6HwwDqDc@}yg5RQ_g+llJzR4~liTZ$Ufr6&B7BQ#l>YlDUf_`n_x
zq*=hhqIjyZ7O87Zn*##i)gz9YiHHoJ@v>Gk=Tf7(Q1XeIv4E_bw(Z|qr7q#K8UCzU
z5upHh1JYV)F!Fu*_Bs*6aHCm{eDu4g$kO3h5Y@jsl82pu`_Nh#d8Lj8OFA`tfDgIl
z6y-B=U?Ma3-df_r@$!moYq&<4jTVZ*B(&cC)wBmRGTF#Nac$RR-AR#IS}{Ff{r2pP
z9;RS&-NE&!^%_eQPy-_iS^#Qzp|F#amv<6jJ5-L5^KaOGWcRcXVI-Ok_8PIXHN&59
zue4{9@K8R~PgK~m^WVxdmY=^k?KP3ba%}NqWCSWyJC$pos3j>a#7~)1$d35#Ix*E>
z^{ytL^55r?oeS)*$@ipT0Zp1q{8Qw$7*cw-=Ji*70BH$6c|X`gMy0UR+uERtq8$x5
zDrvQ9+!*5g`grxa*<XwYyo~9Y-@KZ&1K-McA50&iyn@~|`jQ*&O$3d!mSQV@GJNH;
z%S-ztFRi!C$MzK&m+j2D!B$%AzAk9V%|~SJP1wQ%S4s`*(CX|VS6Tg9uSD&Z8Z9Q|
zICuroN!PmisSlR!dCdm=8%O|-umgn#G8^Uqe0KXJNgA8RbK?P%oSn!1y6!|IR|HXX
z(0UNR!q$*@R0wH?-p}L8P=Fn<&%5oWK)I&iwNU)$2rJr(X^7s~Y(Q4Mto|4cHW91x
zvG_<5Yun7!7JLww7Kv8c=eGzsDFKgHEkP>t$jByxjtrv;R=%k~(#?<LXAbWG;8+r#
z1k}Y(9;6Vp0_X9_dWV0IPKge=xam($)=aVKG>-R1{YPn11NPY1T$4KhXX-kK`T5;m
z-Hj5y;ql#G<Dt9@_#q3&R`tjX`N*UPQ1#0`w^;{?nO)5xS_3vRI#DL^D!-*`F;>sA
z;wtIT+GSGwR_QA;`P-!AOnpj|-n&szM2o-xXSo_Qu-Xd{bc_X9F}nSpLyG>JrwA7Y
zYKhimM2!9^#``&Oq;2fT6l-sXaj*T4&h8{BCkKb0^q7O#PBGtTS;+NHlDHGddYd;r
z#}0K|n^qROlQO%S2OmF0=2tbKFry1LiD(z#jOS&x)5?GCKVfFzKetY^KLLXHq+`Bu
zrhQ&h*ZHlm_R9yHXEE`8oA-yFnCLt%KRq6S!2#wv&3l=j9*gM}Uw%W^A3iSP`C?D3
zr?hRczfmbtbEschfm*x65-j%I%IV;yeOJ}yVQOvboZhiDV&%>X#jv%=bF;u({=3!E
za99$TBcER8CzIzT2j8|7k9gFyVTXsQcQ)40ju}iw=Jwt>J%%GwmoeT5pQzmhy7l_C
z-l)EM;1G<=@y4~R18)=AfG|i5JijBmvA+4QAf9-)`D7zvpqjb594G;euGk1;Vn0F;
zF1;B2F8U$gZ545{Wmkt}5~N^}lem(9)V%q-$UQQ}DzxMsJgwNk+?-YlvvUaES)^BW
z)p7OTJ79#Lg0_QGK|#Jr9a06Y1KcT^%}B3rn$Z$r$R)?t?y{!o#p{0pLs<f-N#7Cj
z6ls4aUi(;);f+;bVP9>jaMNpx?WNNr_f#<-v)QJM!p+XzVU5s@64q!wSe#XWtM+&_
zBg(Jqr^-cmbmzvW`4sDGLqj{193c{1Y`1^H6Wgna)tx>Be7S8Lnda8q=&`O>T<dGX
z4HS{T@1@a`@hqg7om&YNEdKO67Ci9&dS~Bs?|WDp8Kd(ZE{t|r%ktu{bgig>ZB*WA
zslxUuSyVqgv%I0#QzXJ^!qsVf)N5S*KQbNt3_u~|3Ti&^0$ir_SWknRep7#e(iKW2
zyHh*2SrvQGjVSvqrB|mrA7<zh>i3TaTYq;8C6xkDm(K+~bwYYdbMlHzm#SMx{-Zv+
zsuDwu2|S%4TS+D*TCY_fJv6r#S;b7rGDgFWcfYg-8ksmn&9^2}P0CY*+L#zOXltsD
zS|1-)Z6dYG-mHHNY~DY>?Cu-P*3G1|BX8!w4(4gVYl$T-UjvYv-ykj1<{Ndj<?h~>
zud*LiMyQcL)Jnm!GZA5j-J4&a9Lei98mAe0E%sXNr851Gds_>Xs;$6!>A8nHzu1f`
z+g|K_RLV%(u_z^xY<6aNi>|9WiDyybT5T9fBr8Z*Lyy4roxq^LQ%qtC{cvTgUTBm1
z{=!Jh>r&lx8QImQj_@37Sj#M<k`hnxX^aoqthbSpmEUn>%q*${BZZ9>V+)_MD!#8(
zjtGM%N~EZo1BK+=w}Cy9Ru=abw$PIa@xjfyRgI66OfyGR=o#^o`|9;I>=Bbkm_3iW
zpMMFYk^6L4FUf4|^sBSd**r8{H??^Z+SboU7g|%)w08TWYt0g>Ri(4nC738r%OPx`
zo-xn5?%9#_n16)F=oh8C6B_9pjXPsn6P@rx1@_R80aFTHwu`eD(G#HHSud89X18Jm
z=i$}Ow4~k}7Pb2Xd9aQixecVp2#AW#_`3PDS1lV{Sl-2Q)c824xX!Y@J|<BXGqh=U
z`Av#2V%Mhecs)}|v#2d#)^9qrNZ&Yx>NJy09y0LDV{;bvVL6U;>oh&{cqO+B;}(k&
z*!^BggSwaqTPd>CRQoR8+sHqe{H?pGJHedq&WtG%^$bljv5q-feG|G=xYL64YRf`!
zzY1%7cX(g<cwmT2X`HXPaqnH!Jxa}9bbsB}ET1|n2Q%3~8fk1wm22($B{0z%V+-bo
z4q4*c6LaHH{Tyl-zxVW8KDs^3N(CPr!k2!}#P~l8j=o~cRBi{QU<s;g6Az84Vr%yo
z9A<xBgu(7E4)AE-=h_nkZT`$9HMAX-w%IRlJ*;V5WwCiiouZa>x}P594LQj(wjxtf
z+!-}-@vg`8h7ngl&1+WCx!my7UrN6jMXZmy7~!)TPaZI{(vQT<Gf^Keb*%s=qNdCm
ziazclQE^{p0d&XKBe%9+C2f;O+vdEEhI0>OixR%;;P5gT+Z2)y1@P%?2b3+ThbY}u
z06k{ZYq35)Ut{Sve~F^y5w%(u;2w%Be%!7>JlRiRVWjY7EZm1t^goJo^%YokyAj!W
zg8_Pdt2sURa3kp_1onQ!PRA&3)sZ~F_Vdx*%fYYBZOQ}Z5h#h&-g=AXIw31GhKPf*
zARQ8#cO%~Iba=s<LP_yq*|mv4h0ZE~JkWb3!Y;w!nNqW4o2bN_9&%X5($wuKEfLT)
zR6giN^k7xgdOa2C+QAm`Xgs3P-#qVkQCTxh=$pu0>uK+#O*qG@Y2o<Qi5bn%J7`&t
zSw><T7I}{uP^)xHjZ>~t7=o{U;m{n;n__L=be-ZYY<ta}p@!Z%x4c4owo9u=H>lR3
zaqo1imlR|kH(@`?0kiOgfA@1RB+EkVB6~j@$**3~1#OL%_n0};Ex#6MYan9tb;-@e
zZ=0TU%s4EPh!pWlXs<ztw7Jx;vBw)am6z?yA`=FCF}9<}E7rnC_G!qAMF9yWN}+Fm
zvfNg2+>(v$2KHC^a*nTSh#a6|r3>aqyFr+=%R$nB6A6-Ej~wg{t><K)8QS=;Z~p<|
zI<a*u<is4Ln-wx%hIAU_Rh)P;v2L{$hi}@<O$E9cJl~zwYXq;Bo@5tpSzT^z!2fql
z_(WM4C<qc7Z^UjHN{<mXdg?cIl*&h1`c3DDtE|TFuLo^FWr|%_b$*!a9}b;@(g<Yu
z7!pJ%Gm!1bY#9s`Eg;+zghqUJ+1^+ke$+=-c3Pl>DfPfG>8_QpP?4@IN!Cm&tjP{P
zwEc7$+LLe^-e@7x$fP}KkZ<g{B&#_Rmn9Mn1xgoOhWO+a_vl*o+9w8%T)v4HaX=|C
zkjtwN%xYZWj-}pIh>1DsmJ~~Whpl{l)=0_Gdk%R33nNzB|0`cDQ9<!a=t17?<&4)m
zt;a)rBd+D3Xh+cxY^ggky$j|&H(on;jJ32Y+V=K?V6|#vH?~lP789{+5~20THNR<r
zAPY!Zf|3X%=8K<X_k36jmqoyLogWWe_4x=(DvaH?E^jC`4DrJJG{YR`TBgvlJWIR{
z7#pY)AFJOjxpdDh$x2V&#=5ZD4UWldXc+6lNq&)tph<`A+{XL%z<f$(8O}+M9~_n4
zQH7m-!w8UvmRbvdqWnMkfA?R1{6^+gtBOW1(o@T&5opjZ0uQ8UeC(Iq66z+V+4kWM
zOq&KqP8T*}-1u72y}APt7!OjPJe{yU5o8-sdJ~tjzhQP9VtJVNVn4lc^#D#Crp_p`
z6=L|QWXK9hM=>+Dbc86l{(3@=U)Z89R#kS;xlBf>O?J6*{`s$&Z=T!%c1Lrl_?WTJ
zf9)}a2_t)}{_{TxJ-l~8W$UkNYt^^^pvN_zAKCsMV&8UrI>X3?DO1>ilbo9q2E9U&
zwW5=t?V-6>^;e+`>B!($i3*3e8rY$DJ*|0lIWpd{D+m>c#p!k)Dl+d5c_PBwX<13J
zBge>AuhOOdq!bqI)dQ0-*MZh2sG%5?;E^#&t@mIug?;8Cgcm#5PLc?@{vY<fJFdxW
zTYKz{VnIQwjs=h=N|P$0qC|?Ibcl$GbdXMfj5>gVfQk^MB&ZaTUPF&c2^|T&MuL>k
z0)!+$2>JHwxo6J3<B|Kje}Ct%$qy%Q_Pf{GYpuP?^IZ3M95M4Kr48kbdDEQX?|SB$
z_sllF$DfrFTxMc!+CSBb8Ggf2<UcXQNTD{Zucc|Ye05Y7HsLq8I}xUZz>b}@>&aR=
zjQAbxPLR<8#opjkIk<&;z3e0mZ+HBu8U~}NrRuq{h5F%_DqQd5rQ9b6!`Yp=CjB$X
zqTjUG%O=Jt4a5FswK|(_&Y1Cqa<4a4B4MG)5o&TiI&(IooIPz^x*APtCLA{@739V3
z&hudzE*vJ7fwm*PO8Qg!$b6*o4Ns0Y`NHGDyKnO3+gODILuWE`l#N1&aI}keKZUO?
z585d@xz&}pP7HBN4jjuhjE_9Y_Mds`=5u>-%F&j9e#D%ubbNf;-5nXJgXCTleZyFO
z4No-ZJE_9OEfl&CS(!FUMSHBDINGWys4Y>yd8PNgdTSb5iVcP}!a44;t<PvI6|_~p
zHhx;|1z%<w6-?R7Of!X-5xz@#X@m!BhB_6)-o(ClpUa<l+!UcTMeoMfemQqFYFfU>
zv?y0<eGu=4B^a&-C*0=`MYqNhyv>{q5`;tsG-nP9gbGA?G~)eGwv<*S$)JV(p&ui0
z1uzuBV5u@s<hYi&2&y>URB@e)MU&yupV6>ZT1vkoJ)tD&YkB+DP=enK45O$*eyNVf
zVxLsbGFtUeL3J|THR3z+Ur3SIn>47eM){ZKBHQ*OGJ%Twd>uy2B)Ehz4o<I)VxmMf
z4(O*!PoJz)aVogG>~u!Zf8izPd#ehmSjcfFJL9R?Lb6M_6R$UO&U>Mgyjb@dTg@F5
zaHqJe-fqoDoT~{fmB%?-O4QH4iTOD{dII!r?SJlV3FRE)or0|7#iTiHY@@0vB5upS
z3+I_!=ZMZP)e)HHG~-tWvlA%~uNqbBqqtP8_&sZe>tw$*#6D1apC70#=zo5B3dI}p
z!rj6n<Z^54_0<4(rV1sJbI0*&SG=%eEsR`wmwCJ1TG`ch<~pLO2qib!;5U+D5<Kl%
zc1$I6-pqfvJ81k%aP$R^S(0iuOiEtWsqnLC^+^oNlV9&p&r@po90&<M#vLeHF3A+s
z>L;Gi)GNM7tYm0NT1YYbZtRQ}x*>h-=?G<{!7|0{`Kzu7jJsGbX(ey8I57I{v+&Rd
z>!b-qF1(<h+hB}zL}e7M+e$*HUoj-A#Y(5TtJii#^eXoR3ho#9!suYAWnXK&D-))~
z{?b&?^~J7KL1@A}LaPx)e;MInfG_<Jj>_`sRcTI;&+s*RKh_(v{$M&L__V_Mpi@l3
zu@LtZ*qR0m(>HH468U}4!4w$BR@>9BrDU%}K73%?l-FR{>39PE?Frl<eTj=c#4Nx1
z+j7<yds1MaZHCpJ={$p}y%QS51q4&^gHeUy>e+Ip`VPhA6)|TNxD4B>JfYTTut^fN
zsB59sIC9*cJvi)W>+-s-ikLO&YhxPP?V62|;8PoBvgrNNZ;Yv?R>%32x6a<fqSy5O
zTNHi71BZRrUaD(z6u6eJzuewtu^JpfVpfny1=WOO+R5=GmB_c_z2C#P)xrd&Rq1l-
z3!NVP6*(kjq|(Iq+{MX*yW?-m%v1)s-M3MbxWQC8)eTQ59wMYJ5R(U7!Bt~Ij=vV!
zCQ(Ttur=Jt2YaOHJlt>I=>NS=a^3`V_xdDYq5dYtKK^nCgMik<S940bsMhXy*7#DG
zM=pA48lyO=duSq5YVK;n(by2Z6is(9FJ9f!W7+vlL*0ZwsLZpM%&jhnTFO@wE5E^4
zv}8E47{2&6)0Vql$Y%iO^l2Y=n3g^9!R)2rBOr}r7`*4;K^+W*%vKeMR6Qx;U;e>i
z**`&X<$1_RyS(DyA?ebYIFdu~gM{*u5+8HH@w3~_Yheggj|Cdrcdo%^NyksjutFx5
z$o}@;vwo)Gs#|dh%wl_Op2^~_w1keytU8;JaKt_J)ny}l?%J6oLg^&|F!o>@$1J@-
zXi}#CE@Q2yKFSzbPu^jlav}s-OU*EzVp;U3+O`cIi&TH><R*}FQ@O%PuvJOjqX<Sm
zJt`}<PNySoB7ENtlm4_1ejG107*w4?ri5qq(}_c_FTSp&erNRlafffpDP6A9pG>LX
zQ=J1ht3DgDoqfHDvw`52DHiu?-|y8Y?L=jSLRPv}<~S!<Bl>-FOK0i)5tZ5nV-G{u
z59=w<RyY-XwzH2KQd+GcuCHHttlX6eTr*5nn~XYEcbwXbKiVT9C6I};R=(y{j7zs3
zF{>oB5yTIYCih!VdUH)YR8zAalVVS+js5w)TC~R^ZN5H&#k{F{!;2$k6s4hqQ@yG5
z;@^a7kQ!Wu20s3w2A2I=d2*dnA$>>;CD<7|{4SR~k6|nSxPa3#4S*d|v9ssS)B$#g
zZV;xmQYU=7&#+$$O7-Z4j8v)*SkbAO9YHa4v1cl_t_^&@$=jumujEr}-&W?}79Tmu
z&&p!QiV-~BuswOawlgiSrN%By(tXEgf=G6PWr|!Q7A{XK4UlgF`o4iAmL#@(%Gvoa
zkIC-uVXpK~Ec#C33SDt`ybeMMZ~Y~WMeqHx&iAtBt&0dql>|G(%*8mn`KP-uRvAm-
zhujgR2H11X%IMLV?{*)2O=-1nC`|Ogy5(~I71arvB5|K|#rKb<nf~@INy`L{gnh9V
z-Zw_9NvbpM>U7fBAAvsH15UJ-FR4o3sSBd(*}3S0-u>$XBTU51%dFJu4!pNX#j7f!
z&TM|ae_tsMOD(oxSYg|YI~4q!&eZrUEEZHF`4k40Jc4y&E}waFko0vNry;?<-E7q`
zzvBL3Y+O2PL9kZs&rw#*^_`?P2iqp+9=Q2yZYId-iV6k}HbmUaDak2O!(-S4;mL(h
z#av+$MQ>-0ezX^G_oXQ{`xn>P3z7EHQ(%JT8uY5x*xHr-#@?AfpLL&okdQ$x_n$%z
z7^dj$%*ZKzFtTDx$>`maF}T=~Z0D44K+b||g)GB+cuH<A<D_RlNgzI0E2vQ4`=f#V
zGMNPChmZkL)d`2VL-{APo>70l*Cfmo&aeOawy$c2Y8QIqZ9VEx$nOy3NS>mHN2~)n
zXE}f|j1Gmn-|wn>L?RqHx;=Y`;Gi3t2qaFLum|0BQ)(+qXRm&Hpksrcc0v?kgrvkG
z)jrtjPdSOtz7d!ZtD=>`2!56Y$_vy|UTdxiYd7-#9TN+dDU`}QbYNakv8DIO8=E)R
zj}>$Qk=J^N;)PnAJ5tn$qo}halw4earCaM&o0xV91*PMy1FX>S91bLMIdA)bL{{M)
z13}!{d~lnyV7HZBi|1TF-+tb<ZB{Pz<Lg%e{NsRX2Cuf<a<_MQ(7x~QzBe6|I22fV
zJM_+zDS|MgYkOK(cT+RTfVt3gqR%iJiy(Xc=3c_&JA|@O82ol%<j>JX>#`J&I+RN4
zU~#u^WVvhUyVK?uQ+%%b%hbYSKg!WAkYyJF@#m68DbroXR_7$;Z~NNpoX&J99qEN3
zad;W?S{ch2i$iJ7*bw^)ED6jGS9(seN@hQ?y!ETDMI-G=gL~F_T*|4#B~3qf$rxy!
z2Ut$2LJB|X3kv1g{5+`bTO(-oQi--_xei*mm^L_ENCOy*Au6tAne!qv+ntumYXC~S
zUP;txjk~k9iPMB7%fYXdlq*ipcXD`2E4U@vowXzw(`wX0Jt$%^*pZo@R3djI!ee3%
zX;7V1qJ}PA_9K-GD0p7sQ}%Q-Roit{q2G;_8+1m_9)!iUT^Bf5Ral1R!B80&gVH-G
zoo@?wxL&1s7WMB<Ew#~6_2YO%DO(Bqa<?h)^O5ZjG*}Jmoc+e$=LOHOrlwtY<uS%c
z(kT>H4^Hju+UN^>yy{Q`?%b&#xhvWnb3o&ZxLpF=G%9$!n5>lGFKDc0A<d?8jx;*D
zG#Y2DKGU+t%Y5wYqM0QJ36?P;af7_zpCj%f@ppDe>b;H?5<u>7DjMr~xsrx^!C|A3
z|9SA6St6+|T&7&v5>Y){8&7y(PnjYx43*m)1>@9O^)1V83`l2Wp%QVP(qj)a-N}@G
z6FB0Spl^M9pE!R&Y~*5Y$-`SP4Q+DU{R*<fx*DJA{aYg|I=J5qdtdO7=0^}guAxg!
zTNfDc1>DhETK<DlnJth@N87shd&A=IwHfwPm*0kpaEc}*FoYv%VaU)LWE*zSn~`s1
zbZ27e=SJ4O9BM-k`Jr*j!8;x^9|6vXJs(2w9xTDb7li(%ccfbhrQQMp^x|a=K0Gy6
zz+c%#CQ+lvbD8Y0`DwXJmFg~Ee|(1&-Oy#Oy-v?~mU?&MJ{gkiIYexox=)|`^zkcw
zd76JbU|KPP!Nn>$uexz=`o5-nMFWY!*E9MxUv{s!b+>6?j9dRxd@QGiZRK)pSVm5{
zyrtKWRBh<Zo6>=l@<8@CD8DK1H>0^@PN=GA#bgg{o!U$tNz-Phf`M&tfTi~F;HT^S
zFt%UKRZpECL`$_ZUT9;kj6YW|cbY6zvN2a>a3gc=dPxFs>*O82-a`*CU=BU?Q7>U7
zLn3&pD<lA%PW0P!X4BM=`{>=HA^m;(L(`;%l-0Oo0zm!mU{KvCv(Fv7<q%mYG4Xv~
zTWnBd?=jU#@7&|C($ZktoCWyW+H+6zaO#&4lA}*bQVEz=9&{hY?50$D>Man&4>blJ
ze%pKb=N6P(Z~qXk6-qk+^)2ca*MVb)-w{RC%`R@7e5AP+^(hZOQr!>`UsP1oFc_zj
zQaKmKKDM%r*J__j8Ex*1Y;CZERvO{A_dp~Bn=}|g5bs!Ljm{J8dnrjATt&3-|6bZZ
z(KMH?bj#_faP90ub6<fRt#r0KK9t312wjZSG%PJuj#t(PWkuV8C`z91$|{yxnjDU0
zfDXW!7tOoM$Hw8i0;l=u`K?p6N7JK}R{!*DopQ1;!lY0F(~c*_E7?CV3O%9qMIiyc
z(l-I$9V+Y>@OU(CAk_jiQn}m?cXc`BJ!Bv6xs&K*u`rPg5Cb$rg#>Q94w6zzHQhNb
z$S5(B^FMo5)KMD{Pu2C+Sj1dy0%EB^z}29{G9^jLxP%-R{^gJ32G3wlRN`<@+ul(1
zNZ10UrzFR7d9BcJ(WL0JeGx668oQ3p;vvmeGWBdGgo<0aV3<)5Wn4vk>FH_Xgb&Q@
zA$xABg*UI@?9i|Q_mQM~Jm#zCNH`nd1QbV&ci)6fWJYPV;$_afnx?ITlvCR57_P07
z4}B%1pUrwB8gjHDVX2P*)Moiw%CQ4A=Xyl~*V32VVFRsK(-L`weJ3%8gMV_SzdhUy
zE^WI{&*nlimM-~yUSmm0A)-B&bY`IsT=pV|d|35}6I?JzKICLf?D(I0SSzIch{hNE
zbnRD#AZbv3E}Ss;j+lT4oTxeX0)|r3xIYu~TFO0g475?+&Cm@xiTe1_<le&5IBLK`
zNi0{`!04NB3@-11V61ZM0rNo@l3<g2_Sm@O4@YS|D)_nYjL+O)ZmmMOUB*ETTm3aF
z?=`(A)S*~u+57#|J3?b!vP-O2hnr~2l0I$;`U<TQ@lxFDEci%`QCov?M;ow~;8zOb
zpHf&%#N2+8ox4C7^SvJj5kStpxamrtuYeL#w-*||EadG)n8E{A<d1Iu0B)43%@Nyb
zcg&O{dhcZf1a&LnToWb~)wO1J4QKRxktwK%;lSYZL8Q|spTVgInMrJal2W$@t;Y5X
zRG;&{{~jY#xn{1Uw34WbTwl99eY3xh(6$ek<j&+o9g^n7%@<O*qr@^zj6e}fZ={KL
zVF=0?zxBO8wd~pf7g^R`?l{;J>^>?gr*t=SAm%X%BopM<G!Q<UU8irbH~9|vp($Q1
zw)M}?91^$JOL=nTh4|CGM=#tt^=46V&(X%$vYdZj5r2E9{`on}In}mxiYs-_2NOs?
zXNN&hN*M`(7zXtmy`K_<x63MUO{A1}D>Ii4G%_q#J~gz-sJ>ql;(h<pslaL>*T8Sb
zw!dGnetQUU1Kc|fa|(v6@x4*U?@3DI*3d;Su9-Hl|B9p9Q)*!U0c9at<(3X(i=ZP!
zd4b#XnWZ%5dR$fBgtR?=R^7xJu12w2*W`#7s<xYGdYYCHGsmJ57qLQ%{b*+R9@9?E
zg_k80^z)aK%+I}=_v5vC0j!A6?755LVyaY8d<?^k;K74*nwIKdaP{Q`s2LUHK42y?
zq;akpdn<+X)z_b#)HIy&_|6@aAl&GGth?Yw5A&{xHR`tBLUAmtRYR&a;M2<fYHRJU
zH%kk#x;{4y65vLvYwiyYx#1AAK4Td=IXK)X+H;j{b;G&`EnM5Bd0X(fpgI5c3N>I0
z^aVA8gk2`MH#sdl)FrrUALQPWz%Gy=L|{ADtv)C!W%-l~rmJZ#MCmUF^-l)Y26V5;
zeuUdznesKTv5Ac=iE5<u@APtvxNw~!k6b+<ay3-2MBk748nuSd#v}*_&NM8RHC}kX
zqt-pg1nzEaAG9hKs;w&7@m`y;6c2}AcVQNV6i3ben{k>JP&aAOjqT)zYUnM+J@uOI
z&C`5TmAW&ay6-vdO1VNowE5fD9z-?OUDvg5>`YG?G0iDkty@}@$SJn(LVpzxp;t^M
z7&YRX+4TW^m+Vr<Py$xw#D2GyE}PcJ+$;$pFH84|#fQ8$Z`ByQX;~aH=H;l~;xf@$
zk2c(Ey4rmG@`nn^rwD0GMdSsq(|zVj-Gq^kLW|$BQf6&gu@+8oEhqfl{GxYya;fD{
zZbBiy4*zkAUOqo#L~zK+ekJm|+8dg>+T>S}SHvEpCwmu6P#6m?^V^td*EQX;NkXcY
zIo30CH0qpO;H`p)Mv*8#Tc>`noGnch$Acl9LWaA27JoZie2(-wx&vUAWj2h@I(G;O
z@l5dY9(DXPYh`h5k4&1Y@O<T(bAfOzZe>WM!)(IZaJ?emU`QQ}7)dFlY|_5rLP)k`
zA-c_@NWHQlV%Z$Uwk~wvl5ebd7gJ@IttiY;5H`+33csCJ+~kjyNR(shS8BT7&6zCe
z2I(CwbFY|#9sC(thH*`P0QD?|!gh2iIl&qoSrvAv&w1PJs6D9dWy<XEkk-Sp*R##j
zTs^F4v`gFzlj6e!!@#*qYD=Du&MLUnDaS}k>~f^NeLB|pI}_<VG27wNm%F<1;4=N|
z<t4Ew%Hx1@tDzcKk!-vM6>I&sE(TD&Fb5YT?4yF$8v8*aZouh51V4|qD=9u({87xM
z1?^#ah+YixR@4zMX3k8sOX(cp0e8v{kyX1x>+8w)gtCgpr^pFs^_&*_9-94OqV~)w
zn)A@2E`s8EeMfCL6aC)AYHK7O?du<3-CTEiyd8aNLN;Q>&Gt2cF4+!K_5V5!YZhUS
zIrWZo$4(t_yS}ZqXk4Auo<5OWPGP|uQAX4PHC&ZPzh9_x6Xp_SW%3fd%`jsahn$JB
z;GF&VxchKl?hL%wz3pC_qiejiB|s9B+|M2H9mc^ZZ<-^v67P9vQeIb;QN70)vUU#5
ziRO-du9zVLuLhihTS#*fT&s*7I|yY{!$r>9YP;TAsG1(|@McW+U_C4B(1Gf+$ocD1
z=$zr_Im5Gy2X4YmU>-asLEHdFCositifZdw0|bSyLLjBi5>o?8W!IKa-hFARaL<*;
z%DZ{(xDB$_TDRQD^Rr-Q-{9uN<!ZVk`n`ixglytORICxSsTh~?k^DtmOM7ZH=!6}%
z>X#fJTOUMKS(k>N`MI(r0j#RA+aanp)I}Mun|=K;$ytNhurwR!BSU1{XeXM+6%<t5
z-n4s`Gw~E6zm_})xZTL_Edp}`#)}`-O=p+oHmJS?jlV7aLc;A%Tn&qx3N8d}0&Uz`
zOWJddG}@~H1TtJ%EYi`^l3{snZ3+|&2oH%Y%?uA^ww!>p|BzEqU%*rJQw-6Dv2C}*
zx|?G=LMD=0D?^F-ebUL^>}%3;OWtU{b+N|BJ`45Di{Y)TtI_nEjzJ_o2j(Dvu-TWJ
z=<)e(ieIs#mEF?m2%Ajm7`WbC1+5%j>%}cSQ~pub==N@W#lpRUK<xVbA@UO~hD@k(
z-e(GB%}AM*3EI>Kh7~HoJ~rPK;@(`bGTyuNcxKa|V9-FmJk@kxrMv#}XPdFM+u75v
zsmk!;)vx0z=#mxY)RA*=k(_;BwGA*b+-xc_#lMX>k>l=+4`P2STwyA<n#5QS><+Vi
z4~GZ3^S|cQ5`uB)qfw(Q{Z=Jhr}{ff$8^Q-89wD}f;0fZ=1Gs}E1GB$LRKgyu6FGC
z;ga?-WPQJWBKX+e<z5v<2Pg|Ys9DHT|Gr<Vz$7a6I?KwNzJf}%aK#n8sjUaNZimwZ
z<70)?J~r5a2S%x_V+cj^eG7?-v-Sfk>p#>3sWw(aN#i6k>GR(gDh0I+Cb+k=Xs+Bb
z!eWhB+RvjfU&}!IhZm-HCH;rbML2dQ`4;F7qx4ki^NXw~%;`KiPmir<_LLPWdh(yS
z<5o7;*#EZX*<my8dKpE^CNn>0%FwML&#9~0CfTQ03#(sX*^MFktib56(*B{sg=}m4
z*`n?%$cFU~ftH61i+t=UEU$|I-g9n+E|4P@`rC+{&s@dQfW}~AcF9zkoc-dfGgiLB
zUds<#zP!Y#&PRC;UbTCLb<`i}o<^c?TLV3^Y2emaO*Ra?ythzK0Xchs?RS#x`!Ez8
zx#i+Fcf1wjF2gI(|JWWG&|`U>e{nh2=}K3l;}hriybep3TTnX>+0M1THB*T^A$&t=
zx&mf6i0~b264juOEDb%b>N^f__fy*?a)!qO1u{`V4-7l3)Aw0oUIssB46(6>e23l=
zv*CSJSKAtug4U#G=et}}CyU^fz|qS%83>NJsvq~@vs%dzAhh6CwBlleGgk7)%Z*`a
z?8zPJuEckomOi!$Ym}7QEnB<P+H8r-s>R_aE?)zUSJ%Zu-bC8Gwe_8B9OK1R9366_
z&WdklRJ3vry5_`Di+T?5m@w|Qv>jydRqJW1INJZ0W~l;2SYR%d$LC05TS|sSFhP2u
zt&HJ)jD3uXHZ)vU#fj0kMu+7r9J!$SeD7zcvHdnPii}l<uw2Hgv#l^>1+#4|ioqVA
zBk#d5@2mu_4X=G~-g72;hYpR8dLK#e5NYu*LY8)VHwsi4eK^SDn!Bz{E))?m8unaU
zeri9FLoo@0o88wRXk|=`b*wEfm^<Eiyhf!6dOJl^z6VsA{2b-=1AEjj4Z98Xo)6wD
z2O3wRe5C&9@SM1u2Et;i0CfTvvkmTHv?Li}jZ++6ERR#$G$5c{dro5Fcx%p4YYJ$3
zlgw4ZKDgPk7{m-v6ELP5wWx<PU&jWYZ=V+TXVAcaScPst@xU-Ky-%Q^;(Ejd1SRL#
zBT`9bt$UjYaaGH#q*VU^HsScAXtO?p_pJOQIRtt38pxiC(bk{sb<vES<h1B3P>tNT
zsT;Jw8U88P?rkgFTcJ4hh%T00Rjk?^K58P<rp~y~Pf4OEnh9wQT|RGGS>v91XH!?Q
zQ}4{=8^IpS(#|+!*&;QzaYuk-)Y6Kxdi%_%61<t$JVTmP@Hl^OTFTMBfq_)slVXtu
z(yb<rPlZQE>vXTMm^4^*D7SO|RSw5;mI>XZTZQ!zgGsy`A=rLrfRD>ZuiKd9qu#Gw
z82zCwKBuzq>U;u)XMiy`R4({xd|CoNy({cka@5f$83V1jb=F1Y8K!P%eU7U4t7*=a
zsUc~NAP{FdA)t<4#Mfipc#7p1ZcCm^YeK2LKOMp6@db{k&LYRKD-UH16nS<A)?B*5
zEszK|T@$X^BHg~l`#gOwXbKyfJx){*KBde^6P52fsUB`ygL^E?;o%6&O7gA$rkNt#
z7Q<{wIG3^HYN={!SlKyHOl2t(<TSJ^>K@Bhhsv{9nG<ib8*RmY292yxTeMeFrT5yx
z{<H-Hb25pHbWvgb^reaUapVE`^F8ruwu_HuiZ3#t7RCXmKS1b#kHA+X$|5HoNfw2O
zIlE5sOboe~x23qwl)?&Nz0($<3Ih8J`z}*5d+(;r<_}w`$T6#fU;}s&CWr~d$(X2n
z@JF+z{RpJcK_2`GnMj0iBCTF^x>H19&z$+O@ZZG8%Oef$YNB?U9DDwO!{cL=*YG8i
z<aigBl|AhdKxm7|N<5}9Vbr#!DC9YrCm)(S<j!nMQS**K2dhzAECM4w(N#i4OsJ+=
zbIYxv<#rSOV@>c(yAH!#eviZWgcd0&5KHbkz=M}}su<Z$Mi7T`2KSVwOgHwRLZUTJ
z3+M&SEC<|Nkr%$FwD#OJhS+mz=6Q>e%DHK>l~7!Fze0CyZo3`E$6k3c_qO_X|3{==
zMSm%6%2?xxaoxz3XbX#}e~8|MriPW%cHjEm4IWe4Y?ZP5~cwF1(XT|Ll+R+&;K
z@xMp0ui}NQ9qgp6JZP);MapNYkkLE#aV>YF`?L;=<O~<~F?r$ZaR1{1jTH~LW&kYd
zjBmA!jLzfyqxljjzLb&X0;F;2#~UvC1Cc_?gu+D<iI_NqE4Cf`SSB*%kRPr1_p0v0
z6wC8bq}Gn#pq4BJ3)^EmYNcpToDPg7a^8;YdhI9=?+3>}s9j~cSU}owfA6KXu|#iY
zwci@s-r%yCbMi(UhgY-Zjh!E4u2Fp>&`+@}dZg#VU7UX!)^aS(83n?V7)^JJ%Iw?O
z&ESTX6|gT#ZQ(}Pxi|}pLwGgq=lp7B??YWVCI$%m)z0RyXwKpxOIAEhA2Tvv-Om0R
z+v*3<-;)d4*nZ?2(>aVe&$=k2fx7e7_aM!4VI|P|1D8>de`~Fo+u0+C`dj!oP1ixA
zB{Xg+%yChxGa%yVM{ZWDVh3o_%e|M=)hpgV3`)QTaXH1~n*DiaLPXf~Dn#;4WAnG;
z*8BcokB%T?LYgA1Te2XP=+ctJS2SbqXlY}8p5`)P@WIqUtqOlO->z>fyl_1tYj`26
zRll+&P2HT|u*&$G2$!~ykIub?`{enB^PfQjvqgb!?aI0*+*rd74d1OMf%KW?49f_m
zMxhy)q4nu5Z1+r{S9!%GA%j3uT)+1a+vJnU6(+JiVcR#@EIJ{Ag4-@HFI#1F9jmOk
zE)ncsm2t`^hY>^#oT`ipVEVE;Mb!=YLjplDLBd2)T)#O;Q5vM6nJgiOoEZl9^t@-9
zQ_!@zbi2TEzC?~Lu4)BqAMT_#JsP?0Qf1*FE*3eGjl-z@VbEthdi2#6F7c3LX_4a+
zg=x+*TpcCF=4@-EEw0*d>-f)eqYqcXeUxV5wG{g!taZ)=VQpf8#vhawT4ECeNrbPX
z-=XHiBqUAv!{pgXJ~?Q!D1wdstbEUvjO_f|(HakMtNpJFL8W>k-aD*^k3`+lCo*^J
zV)#*{-94@T%g^^w2aQ{^2E?Vk_gU4D$|iQc>b9_(<?*;rpN;11iKh(<oE>jjs>caS
z9F}=EATDxpJkp9W<e2iB=<(+6<ye1l8~~yuqd{)sc4Qk}y30oAZq9dkWB3W@(v^GA
zxagIfD&>=EwB`bG8`3YgGOa#jbS_?D=zFF3I8S8KBH2lpv?Kpqp31w~OFQWgTNHFM
zvdRp_o8!)SIrz`5pmaPAX`dcC7(2OX6-^^1Dhw<KrVx8fto@{h*q<JYS6NJ1{r-XI
zIm$^mDNv<ItM9+YaeciR39o-d#3_(Z@Z-auOOIcP^j7t(Pm)s+&{-kdVI%?>wev%J
z3IcwQ4_6*9Zbbp$)ho*5%SKde;-XijSNExw#Q4y+w!?h!dK%MT3U%m+)3?sc-tmvh
zM2Fl{W0`;^@RwF=F5|F5s=hO`Yt1>$KVpa5J6?pP&(f-hM$m;-#;E>X4SfYifg)+u
z5S}Pv-m>si49kKKXA3&cM^oNn9i55YWy=iOs0hn|{{<&ekcjbNlV!+nwTFYAzwNF9
zv2GC^-Z@QT&W=w@ONl5{^>{arYhZt#zAw}VG&Jftk%Q(?-mxH19+d2v5xDwww{^M*
z(_-qOS%lG0fkcSg@V)YF0%c{Zy~774??0SMDoH`d3k3>A5?^ob@?Z%EEW48zL@{%n
zip&D4o)qI+RH;8MpNTbEN_KUAdM+9HqQ%kjoJo##O4d{PRy(4a8^+Leb}jOhws(Dx
z-_M8~_W`)>U~xOC|H6-TWy#+*5L8Q!)ENJ|SSjK=$!*vSH)~rQh!46h9A;!-8THy3
z0#q$2=)5>;rA<r7ca0Q6Rh8j4C9Yo12;JwRKj}l>mWH~FsdsfFZi&1CCIt-FyB)Xe
zuGz8~S2i=a_~G~V=z#J>h91Caxc{l#3-*%%j)drsGF=go5FQM+&zfIWO#S%u!6mX2
z7d{{ztJu3bot@aKG}aq{?L7G9`C{!UNg9aaQmS@&?mW+77uX?>N(QjQu~A5ZeycQR
zpp|v|u067<tNMD%9|P|8-1T_Io|(W&;#||goN>-fkc?E+mG(EGXcw|@rYr7z^A-{6
z=Ly&~6ZbDsL2<Z$cTM2}h-E6d%DzTFvQH<wpJ=+%EaQHJU~CobnDHCVyN-{qsj=BX
zH{vE_iQ^Nvl9Q~d{&*;P;pqUroR*E2_HdWgcWe$8)RM<DNDX+A7a*p(UbWs}l$t68
zF5qib1&4004_M@|{Z<yiEc6?CFXOrK1Uu5YzCGU8Q^C%+N_7EaNATg25I)k_gP85#
zynr;Wixh&#sjN*>gkCH76A_JyJls2GDh7h=ztmhE^ZGaAjWhs%HjSN{l!6A56$VU?
zZLjUxq<Q3-h=!~cbK0Uq3c5O|_*nOyc=X(LuF|pJx0>-PG~pRHK2iYV-7sEIxOegt
z*!^rnqeP}M4)Im7BTc>PCi!#Rq^@P@#Xsmn$0GG14>vZYXHi9O+(Y<!^l?*<B0%Bs
zWKt+PChJonJP&=UI2wxkoKZ3{m*0Izi1!7|EA~B=+^4pMtrT0ASA7Cd#Lt6Xsr|NZ
zwzMn)KV;=S=0!&J4EEAoJB5BaYO&A%0E~5?dz7G<-txVfoK+VP(BMdRp9sr`)rg84
zo>8HYqS(}lHvO1~=f^^1zb_3Fl_gtVpDTD!bmpO+6qt(X?CQ8HJr@?<rqdKD+%@BW
z>;`i^FD)5(*}^_B5`T$9Be3x)G3W61I#!M966jUUT!9#;fH*Xy)u=PnL>k?)XY=j=
z#dtKy=wOG@4dL;)X;)p8<$6Zr&Bnj${HD#bJRpU2Aajc%G{ZmOWc?$Kq*PQF+hcR)
zOwo?{QqLys14gBAy1a0DhH+@R%e0cZXzp=n3hhGWLaQIJCHLux=T1xqGNaG7=_3*I
zFQk2{WhpaYZZK{;*Cd=#1pK*nhj<z${-iG2kfE+Hqr90H<Ktj{PCz&L!PC&~zaOt!
z`#62dMB?W#SQ0RE`EL5Ee4qD+%BOaLgzI1cheYYDoyLpel}<bXOd1pZSZ5i6&>yC;
z5IO=tIZ~j|tc*IxBmlH%)b0C*dmd(sLDMk+r`IemfE=Z<P<T$EiGMe3_cQBzH&#F0
z6G#P|Drx6D##7m<ET`2rqqgpHMB0!`bcDhch?v4WsIT4r(;q=8%<vZ{-r2baP;hT_
z72PNpkt^7tpfqB<o<(^0_?J~Xw#v81@vd<p9Kx>vgbNyt92o;A;UXgUCvDj&Spi;c
zgp;>x-;aoIz!2o4oj3RXG@J4-ETda5z$h^9uF>DmL1-z1_q6u&V6WcU^3&z=uk6=D
zWgsT6BT}ilKYk(}AQ$WYF7WeG{`yPj(IaBnTkK_>A-o)HUnd{~+TXXqijp9UBy=U*
z{=h%Pb5hJDx_<l5TK3mpyucewpEti250yEc734uK?xMoa;|YKL<%1UJM%Y2P-47wv
zxfG=D3L7|{zv-_R{OQAaAz%}fpC9Tt`HwuGb0w`CHdN*X8?B4bcfD)<a|rd{9<c|2
z3R~|jitN+=@nd(h3R;!Z0df;S>;;f!Cu*G^ZMYWzAi3mZ(|$9EGXdK--))VU?F5sD
zazSe~a-dM9fW>aG@ZTPqgO!_~g568}A=@Sk0P<l3rgaH_?usUW;hFxy;f*$Ss{?@1
zbxfCh<MrdkrCe!UCi-AFRUaVM>3K}FI(r~C68zo|V6rhgCI3!0gskOUTmeDRa0)7&
z)<vtHXhEx`wahyIOA&w8h@@EX^0AFC%|w5^{9>$yOR3!LnkRD3{Y!FS+V%hV^5M^w
zzL21k43d*YrInn2o5TEXGTXYd6L8k`7@C~{JWtTYX&4}a5l&@fz64l$(I<7|2;=mP
z6zqrr3}_haZbRmQ9|q8`62Z`O%qlXD0~n0_8bP<?2L^tA-GBY%yc9SAQZXkA^nlJ}
zXN+ZGhyBwnurBt4CA-L3*fVk)p!odu&>IZF4(#fF7!Nhuc**B<8Cys}$R%Lc<-x9(
zX9qfM2qJ0-)}EesrwNj|m6RI*&A7U77Hl`P?Pc`5eg9*l{yOD9K0MR`3s0$gDfQ#0
zivT#yj#NnKEdVe@H$kcN|Mt_T$3-Lk!fa*r-L38@Yyjx_0SL?Fq2y;QwBn%_8BCfl
zz<9FnmZb9ZaN22YV9H(s1*6Jsh3w2+x6*^}^@TI}O|ch9JH!7?neH!p191JpOnQ_t
z-UaGd?HT$4fPZ43lS!b5V6x*|LjLuC{-k3RV5?O0jUe2jfi8X%v%4{J_rE5|0W^L&
zQ0()bb+p}JxhYV1>o)}f?YNjY3MzZvH+Qc+*a5lf<f}&gML7{amy`ZlL97dq%|tp9
zdReQiJOpD7g1NW~*|7sBujznBIme!Lg$)oYO#Q*VFfnZo3a-4dbzsC&ol``;LT<^E
zLvurtYJ(`S&B7_Q1rd-Hnv3mD)5jE!$2rE*1;AN=&O~{X&5n)U8@g`zO<98XwodBi
zqw?SbYR}$lzSg1dKlS;aSOBTI@Fd&b4N!z{ks%^V^eO}-!23a-4j@vp09p+>tJxI*
zee^jR{~Le$FZI5E39Mmv>+SU`&?>&2!~$58G=Oe8eY4`zBky0MW=dKC6WnS<1iHDf
z8CwVF2+{!SUS%P>=4o^XKrG{3Hr?Rcd+!JQkeV%!n(tflQGmCGy8Mjq#l1Fk^hq%B
zYk<$+2o}T^1jH)(EC^(HPZvJ`B0_fqpp?!6yS9I7T(B}aaRa5{H~F#i&``DYWVe!2
zZ*Jk2-4e+Fvnvfuho)eM8x1x*DIY<saPtUk9*SNouEY^PW@Ll-P4G1Yf(Te0%C1C`
zk8E&SBB0TDRT|{{WL|dnf)^;P<9AF3n0(0q<SPw8k4nEBRo?k)i*$bU$9c1Yb|5@c
zp6l?L<5>V|EoD>}faA0PXYfL3;Nf3K<mV4%Rgi_~eEVbh7Nda5C;oDz;2QvfgMuLM
zsz{eUPT%_F3p~t*qHk3i<iBJVyG!~VGEz2e+5XC(N4xFzhBh3c3PpQEozUQWy};q~
z*tj=aKoh2NcN;q|1##{8wZ`q8^#7r9c91y?Evy3|aIs%V(4PI5^Yg0r6Z{p(KT!Cj
z>3{4Q<g|sl`E8fUkO}vi?v`o+M3uVn3YFEZW1oKc(wqLl(Caq^9hAAR-Acam-wMHD
zLAAcMa}PCCQTnB{k~)5<>%kvCJj{Pg(i$L~>8ORbm<^5$>is%Wm@NG9z7Wvi!fpEq
zSq`ry$;flz6OgagN5>8OOH}`x9L8TqTT=eV*Smgv-7x|XRZ9ieLLM8KM3_;Uo=k9E
z`0VC{C;uHE=6}BZt*5}{qQsEV(LefI`7dhY$N-!fGR{Uzrz7tI%mw?pXK#c8&GEk^
zng)pATfsW?40cg0A3^GN(fpt4W~S@|WbZX4r*&QCMVy=AFD>OK5`cV{QJ*eug@zrm
zU6++-sDS%68JOxSIai2dxdQ-J5ddJ7@=O5N2H0G=cYvvfb>kLiARW4kFr68DodcpL
z;Ll@Q!Tm77@RllQ^r{V#(!27nu;uR?^feE>P$bQ{4X`c%p58(f*MN6#u8lq5z)A;z
zekmR`6}9cv%URg`-T8k><L3`@e?n*Q#(T(l*qhrzcQTs=Kt!z5!*dw0OrACRvrbm7
z=;xunzZRC{_zyD(=~ZHye3i!uD24?fx;l@ybDn}*G+PNiTmaE<<Maj$aa+rvXq4KC
zf|lWDZrc?DVQgKZkO2B~tOht)dU5iO-ei1k=iNg;H(>o!=g*^loNNcEw?jqW(P=~n
z;A$D|er78?>M~RogAM!SOP^VOV=FzHAGZ0QU;6vL0^ocI=R|)9y6=D&Dt1318@llP
zs21Vd=g09JFrjiN-fDRh&E6R~khCQG%jevB3Qjs|C!!@9vXAltm+jzvz}6Vv7o_rW
z^PNuW8*9aA;N&o1b5^D+z<t9a1&x=zLmQ|z#yb{RW&L%d`uW4;5#YCWe3t%X1Id2d
zeT76v6knwB7ZPxQD7ZxEhdE1=X@{Q;?q7cqM$F`$c$5p`F;pwF^FUPEjktxv*K|)C
z>HG9&4SNch`}-h#GV9+tbKdLs1JA(YA%J(Zj(nSeSekr6l4tJ|^YPSGQvc=4CzS$u
zmNt;AA;dYEIfaRU|9PnYQlB3mVxNFc+HK`P_?Cs+H>4Hd1Ox=qr=Yb-n?K(F%b$mE
z2Eo`9ZwwSe@@8pn5V-ttehX0G@J47dFT6Wx!{GfPIJlR7unJsq+!zG^6F8jjelQih
zlNZ|%#t`E0z5av!pq>BKUjq6!ALIZ}LdgdRA+O{<r_M&($q%>}EN?)Nb^qDUUplt`
zY$s$p{-d40^7l#qIqd(joxf5J$ZP$_75&E*{r~IPzeXBH39A_aI4#0Jjv6cnpxi=P
z`?erb(Xu_>#`))#&3}4gQ>V?Yl{90A)w3Ec7`AboqN@ui8_ucZP<3*`XWu1!&;n7`
zwwxc)OUNOeeXI1TE*09GkVarW#=0+d$h^1T;g{#~{OB$S78hh<C75p#K|<MT_iF))
zv;aF2L~cUR1@e;P2QkoTcZ@bWAVVV``0R!W(;t>@eREc{MLh6m9iYt#ejO;=ny4sK
zDX)Pp6b~Ya3;sHrkaTwUMY~ea!-hhZ-5o=lT_$97y3ft(c~<5}dRF>h5-m%G{aFWK
zk#ztEOufHgo8#(RpG0FQK7;agmM)wNclk!#g!iH}>US@kPz2lxa>tlYdseFEPx-z2
zRqhA`x0C2#Jao}w<zsv!BvT$VY#FUL@_d)^iX3nk1eBuC)l#9yt!)P8d>-)8Anjd7
zD*Ud!Q9Y;o=FB-=j6zHFX+S&tt9`tc&imwr8Izmu`F2kJgzcQdmh>mjee0f0dMakg
z;oVoZ1nYq;t@OtW1{FLzYGo<&1Do6zI$?i)*~g`Q#p(5*B;HHE4!I3rM=p%2o{pSX
zg5PU?(r%s>Gk&(U$IogJikZ2<)!4>BaMJ=vZx^hDGGi^i)I2>vs96|=*^*Hvr+&V{
z{`HqmsjndSDF?9A<vb^I7uCV8UjrG2gM6q<u}+!>mdks>Q18HK&JkfHH#h$I)(%P8
zwa<S_3Zj*40_bCMY4;Cq6jkq$gg`05)!eCfez6eKUaoZ6OFndAbAj|rp>4I>-Y5Br
z1JH=|5x{MbGB<>H<$zpUcDG;a%?m+E2k~wY*@xda5|SdU{@@P3dcZ|;38*zUeIbdb
z_&wt#KNZY`^2(Zkw{||ML^}#?U;q4Qx(`J?#T=vH?7+{gi?<(dK72`Hqsz$TX@HN-
zOnK4ttnqT7kf|~r;tTrTaKLMF`t(99H@HbTZLQ@L<iVp_zkSxqx2_q2GN(G57Lu<X
z2=6!9pfmtZGGI@V+ExdW7CK<vZC^-Nl^IeBEUf-<G3ig+YB~9NxcPZJ_TgAJ8ecU;
zcf9U_Q*Y?B&&B+k>&<_O5q9xN$a~?+nFsb?zkN=j;_v6m`sCeR09WZfcAD;wx799;
zow-w=>-2#<oMIkCjgYlpD{;RRA+doamUMqOa_n;Q^`>XiR(Qb9)d612bJc>Q=yx&c
z=U|aMJowYwv_iRH;5Du-1fLl%>LCEWov?o64c;9P$gr5)SKgy6vO71q%?*~?lWKOQ
zkT0sVY*Y9a3@(&92YD2)fCiZ-fRw{JF3NYc(4O4It|X;Lzf0U;waO{ypB*Y++bxm0
z4sw~}Qh<XtAYJQLT1D^n5;1VFpFSdO-x<bSBFBet3Rr*a;;UZoGO-qSF#Yv;I}cKS
zk~mVB{nsSygcSO;O#n!y+)KlaXZt<`C$4*It(7Vm>3J%8w|ZX%np1J3as$YIHr=Z>
z;BH7g9C68XP!?ogr7gGBS}B2+xYST?5wnji3!`-@ibOu6&dd$&=jTxe_==h*<pOG+
z5WJ#9G`dfBhL>yy=jcOHN%;0!Ac@8cq<typp3;s>^B4a5K}i{VzN>{#v|%uS6Baez
zn%L3hn%-fF12^T}n(n+DVYY@;o9fHSVEX-}$9~=jvtMu1SFz123ALc`+7j|s7zL8h
zJ!076ixe#b%XvVhddontS{I+&(UGPLlff<Bz8=4kvEV$GOK8kUhC~>GiM073wMPb+
zOAfG6l45`#$&LT?ty|<hBPqOS#?qDc*bUAD=ZU@Vo3ksX98$Rc1jzbQ5pn|tiX~fJ
zE*n@Tfn^yO0Lm~NWbX`TE7wTj_Nz<wmvm2Ua2n(i09DZzf=))JVOb7fIEV7qa)WBp
ztpfXbc>5obr1$gS4;%voSUSL^>$_ITo{SJt%>Hm`gS5=Ukb`{cw=eQT0tIDrIhVm+
zr<%S}PDGASpzR~l1(4Ib^oRtBK|OFaSv*=a&4kU+x&C;=9hAw14uR(59d;ejtvaLl
zX@ioagVJKs-+{V<ygzVhV6Njnh#d6%M@lD}VU~sPUoY{K;nBVC+p^16r$BDh+Mba7
z6r_yFu-ZVGsdye9-gh81EX?BrlJF7yMb{L*dqyp-X5_>MErd@QZD0dT&9}a@9mxlz
zEu5NaGL<Xi0-%1JpVUN<21fhy39-5FnhU_B8eTJ0ckb_8YJ|xgluz3r!Iay%E3;&=
z5wxv5H1n2|0-oAFy__9fX`|_WR7`BHM$<jVy0QZ#XJJJ&616Q2NRH=!d*BiXbF%XL
z9a5OWiY`uZXYJ^QcDbh&fz@9E^+qKzzy|L-)sg0Ee_>G(|4iIL_tyvH{H^qZeDeOD
zke`AqNZe_gHN)xLBZ@#OpzkD6POKGi0N=aF4jd=Txeiyn>)ycYZH+aD*q@T+yDcT4
z>IeDeU=<*fmah2mAmKB2OhMFw8LqixadQI+_-fzkJOj9J_8lXDfd^2hJy6mKAkC$d
zz*A0(%>f=q{&NrB7)q%zX3qBYE_#IVZz#{HZBVh<7}*ndA{0;|UjfFzYD#x%6UZd$
z02Sfm;TBdsPNQfX0p<3i5q`5p?}|5i#hn$$PWzXR0WPO%$e{qI8(jkR>qtKb%aas~
z%=?ZqyVpl}y(pu~AUf?|G`r+1zQM`e>#Lolk5RYp>gu@yMbQ4E5k0URH*;RFJaw?V
zLp)%VPlNOD895N&NmZ^9!Y}D=_`DDMP3^~S8nQQS$@dEry+=K$pR?LI0CgQ6{atMC
zj^;wH%`rn&);=vg{Qp9MBejb|NCC{fc$X5yiVmE7=4gL*ng~WMd37}n27$|hBn?Pw
zP!1D)X&9&)F5#fFfuj9!KIZ&)7{%Oime8+A6g&q1xR@R!Atrqh?3<XFFfg9{z=+13
z@q6G;L+0=lC2w%3&L?eqIA&rh3*y+j*Njf4fzoDiZcG;>hW>|1B?q?ER)<Di0Tn6n
z;F^7hHlh#QS$JaaQTIP<L4g<8BY~hYc^OUjx5vchjsre%mm$JrdsB=<U2eyvEgPxq
zeXFDg%Vb$wYnW?g%(h#xaUkk_bje`w>Lb$RRYA2dyVisk)&c7)??N_It-_<ZjiBHO
zBD<I$1y7hW5Zee4+i^`0IzKjCt8x3yHS(}g=ks4XPmm>7*m^la*lOyPlGoHL9*tON
z#_7vH7Bf<<eUEy8p~psyjmde1!H3^H-N>yJo;dCHHL37Rn8aNwPg|?<$w+5MY6{&0
zge)|moBMetA{O63vY!C5zp|n11vU>MmaaHv7kL+VS&(Txa7Wwe6vn7(G-B#0-e~F&
zR|;EFu72ilH18^3IP*8~^u0Wc$@a65?FI%;&wsAZ?vRgwoBFSAH&At8uPMvQG1a=#
zAH*sF$6DeQv76@Zw-X;Fm7G4v;{*N!owVNEefCh?Hioj6bkN>#(TSTSvMO|@G;W;-
zX3-LuN8?0<lvVt$uyD{40X+}N-ef=j?WjHJ&t3M<-u@QWoxXw68el(7-bKN*LOEg4
zqWU@=Y5ExmT#CIG*v)|-@2h=9&}Kovwk~<sDE?s4`wbp-K1uJPO|^FN-OEwZKQufJ
zlsonu&~z8w8D`r{<_lUy%HUq5>Lr?YMsBDo%G;pc0sw?PM#$}uT`Nq1N<63cK`-Z9
z^W;Te4XLstTt*dhul4oy|MgL;^l6l_nOBjVUF!@KFDNt2%M=dq@Y1Bj=C*1s)W2wg
zLbg<1G&AREZFuoUd-av;A>U_j$S4AHt!s;~YL8Syp>@Gc-wKogH4Ri9Iwv~;1I5x{
zLE9aD-)8auRg#tdG@T5bV+-WOmd4|4rv@F#{nrdEJF&oCY^`mQEO43v-KYL^a+(gV
z<PvSe0?!BiBg!YMKz~{XR3QeWj@CpySf4QnyuX0@;t?@m8cRE~EU-&UNc1&e60DwY
zP;C9<yvnxUUCpP5re7_l0vqBuF$}|xgJ+?CJWE=!UKAtdaCt*bRoT{UZ8t;^23&a#
zDhx|y1(}Hl`l@I{Y{>)xd1!UquI+WjSG?)q4ycWa*C*a%qjSUsx_+=+z%&Oyy?h&2
z6FlvKiJI;LH-`WG&w$MQ|GVArd;t+0#v8+(W0oeE?Cwk1y>}JDK6Q)qol#qz9JL=@
z-WBlxHfJlo5Ab8VuFl8Cr)dlaf*}PT7cC-f6BBtXkfFkip)7=oqT_;sR%Dte0(tWb
zQ7$pkRr6_M7U4({Trsn1jIqbUlwX&(yLtWZMbd{SAif(bILHM-)%{D3lbciE*6uc|
z-wsh^tjHjQ>`)k(dxb`<*GjvMN#{xIaVl#F5%0GKT-7kF`@k&n3RA?_*QDx1PZiHD
zLC;T$9iMm1#g}<a#{!;COys#aZE_>rx+iz@M1q&j>YAO#%_`ghr03<;z7r;|h>EvI
zIxwrIW%Gj_O<4LTqKJ;lY`)0~>&v0o%N@b;1sZ>^XWzOCS`jRIc%k?X<n!A3mHi-~
z5`6~I0}-9EHcOei#tdS9Jvm)LF53*+Ev~@_z2gh(rZQ4Nu$9_ljZkAT7eqUbMXjk+
z0yq=cOr1;FdRXBIQ$Y;F27RwO)2=0V<CMM3{Sr4nY&|vq9mkGaWlWn?Re-1~UZHPo
zbc_*UY|5{ttLgr}=r%*^f0pfc?lo0{j&u+R8lVPjX>%=68G!YFnOp|9>i>R91WD2W
z!FghQCN*_>SB(LQ_fF+Vx4B1zVGiEhXWrouzldMwE;1TSIn&(By938NMD!_U$V39b
zlA<}4t#lKM%h+l@!!M03yv9xr1gv!oqye0Y>;`35e%Lnw#B40cff$yhtIU;%sx9Uq
zeHsJ;*2$qppoyiaM;#2(7mk<3#}F0GH4PFBE!4sW28vOaJ1#RT-8BBD8J`HC7tW=!
zYFlk^)ISo>(gyw{I3o>eD9c&;q!oEhkx1~bHyJj4YqWa?OF@%!wW@}W*E`H!;JqZX
zSWYP^m22}#5Dk$gt{#BjpM52MA?AIQYH~$OZ{8@OPGs41rSgL9?lnews9~G1nvNnP
zJR@6ITLkd{RnhJk<aZSsX+Y($7(RoE^p)<<|F!Qebh?;}>wq=CuD~qg3+t~`=RcEW
z5IqbH1Q`F+kFxXj-|P30Ke2ExLbyd@v&+}VA($b;w(R~B#mDEtjL_BT>;mtCDBJrJ
zP>&x7A0a=hzzndN5M<%u6iH5Jp&i+xVv)1IKUw)Qp^<1Ew9@4{w+#i@&QIbUU|aT7
zEYD~(`Sbt~rq>n-#!%JE+u5^-0!lO7IxrCA@`F}}`LlB6LgHpQ|1bLux<10qzJ10G
zzKJ!vcV{J2Uv=e%GUXA>Xvz24h`TMclxV$kE4`gLaN?pjG>_w0fr#eG*^_^Rel15)
z%=$UCH*I=1$Kf+dYO7x>#{?!DHQiTE#=iVQ;BzPz1^-@LDHkVw0w?Vf{kM*v`v#B>
zAN=n=%(QuPyVhEp4?DHfV|m5{8LP)8`^o1V@fRWnHFfEZ%d8Xh%F~dlH<p$&OKtZ^
zU;-CELxTf^v`3^v&tn(6+Q;AF5mkVQ@M$Z%4B8Apu9NI66Oo#TODVtb_qg<Y69~Iw
zok<`l8-e;|c(ZI|Uv-<>7C~SgSHak)VVoKi)|T=TDC=$};K26ZR${(8R||*=VT^e+
ztw(AbiovE)$P{k%&JnHB%WVT$*i{42jVe#5*>#{J8h}j<vC^34s;;I;-=>z1FbQdl
zFmg?Utj`$6)J0%&&+ioSYjaNwWG-C=vo;vx9H~bnT6dt2UwlDZxl*Ec-MKNwta!zI
z^Rcn7e(u|9W!ETa>Umz~h%BENY55Rc<m3plsNBR8>L0`V5)nQ66#t$nz$IvX)n_OW
z?!OYlE(%S`25=UPd+|=Mx~+U>3!6W@NU<qnvw9DZF>L?LY}P>k2Yq9T$k3`5dFaj6
zSAfnW6rg|ko(7$f1zA=DG`}@2r{!VBtB`YG%EI5iepQ>zx|o4qUe?Cype#L&{o=Rn
z3Ins8wM*+@>{KE<H$VaF&tA&W7STsmu^-9-zOF_0azmT&7DX6jXPkKcxK7T)qa`_Q
zD~}Mxt3x?;Mfx0?3Ri&vRj)*(n7{?1BYt-?@uzk5@b1#~`rx;AH7yku6m)Z?Hy(Mb
zqwq7L+iH^eWQ#OzEuRdqkP?criU_^#qi3UW_lPa}sJ1Tjg~E2)S>nN1xO59BDX~}-
z04S7?3GfW=j_g7w`D*slNpjA!>VcR4Zd#8RV8G$_0&HRbr4w(rz$}n=nmkv<@oD>x
zh4iSxU|Kubtk0nxdhnt0iZ&}8PByE!|5OU&tX+!^Wym*UQKX$xH9BtiTcT?~?>>C$
zG&0a}y|}hVWc?cg42#X)SYLbcUhhf|K=%Oi;HGEyjOnSae~{$q{UCT|98)`8B6+;m
z5%ZXEjJ@hJHsu{7L7}vk&*>6-87kr-yDDc$9)!yRE?;L%_Z_JTs6??zQ;T-{E~1h2
zbn(r-Q)3Z|b*Zye6&C(rXgEXT<4TbGphwGr9#g;Cwl<hW;QjDL(VlxAH?)O%3NBt@
zVwvpc!7nNcZhiDA@QcbAAWqv3Ux`Ofc8qChGb@+gu_bUgQlldw505bn!terPu!G#B
z5|Fn92&5P6JEYXn;Ck|0T4`cw>9dpqY~P}>v@9?6wc_wKICHg%{KgKGvG&3299?a3
z{xJcK2#})9w7>70*e9t*>pW{uWO3^Pj5?iywt<4*r&!CjQCCFjg{MALjVtMGEyY!l
zi#@+Iq!k^W>UQXmr7Zce8PQ95QO-B1*6-4mO}vNF*2;&_jyZ$$Jp(}}69d-TQ<Ohg
zii{1eKY1Ui??a?c5b&6_Wo<&b#=4DoVPvskAf;>eyAN{NcC{PJ?f77F6KGu@jXbC7
zOnsx@sp{&a8d&$Nkhm!{rp?0dk10wXMa1LwYL`4NdocOl%2%zbL^{!@ZP6}<Xd5&8
zAgFts-a9=&9@bzNRXAIJ7@Uhx#HTWl^U*0$T=nC@L>U!tb`Wb(w<*UK9|^|sZLnp+
zH%wjn+Q}cAWIn76@$AT?x9FeoTYR-NtXtejEM74eauD`g+SOOlteEVIbfgrrgAh_n
zfi>GM_WCzp4^>!E6vgG1M5UpF6avQ_iT9~*{{V1(+M>cnaT>}ZV@EXf)>o$-bJF-U
z-xeLI1n3$z1N3)tYBX(picnRda}YwDjm@rj7koig?EkU%-Cs?nTiX^C6p<<@y>|#U
zdKD1qBGOBwi*!N@B@7}U9YlIlq*v)ZQF=#uC-e@1KnN}HJ<OT2X6BrC-ap`5?+;<E
zEC@;Vz1wx|eedlurHbJ7^=xOj`24TXcl$r0GvKfT09*K;s|8Thzc1AUGNIgx?mn;*
zN4ld+uVZDA=5x@HUDZr&gWd<9?g-=TGnjw4R0?pJ$k6j5hJh~GZPKY8Z8hNKFtv@)
zhaq3hN8_Uu2b%f7lC`~ev!u|gs72SHZ7J~WsC@r#U3M9?^F!8FDam~zfKo?pc!Ht6
zq_jJ}bMxzMn<XzuB`YghM5Oi-L9y@K2%do8yM;;f2Jj1@Y&Nu7eflos_%~og!<a<1
z8&Pb!#94KHlK5N4CdHhrP+yqEGCN<~x9W|d$cv)Z{sJk2Zwc2$z>~L4(A(V2p9w<Y
zkTs3<3SN(}FLjk{&t@IAFJ=yc#87#)dUyrCjaYZp6-aTdN!6pt=5V14b~^910Y1CI
zjgyk?GBeTn8kXdM%u2VAD-Ne1-^P)s`Z`rqDfa663Jq)^li!BU%X`!Y7DMb^(MrEx
zd6;MDK5%Rm=jo_ZY?F63zNjA8bYfS2{GEld#2tEw=+BAt+1N&<yfq^w@rAYnOVdtu
zpj!}74J&S`qMS!3HlnnB%$=*GKwJT85&o<qa&0CFln%`E>XtCznX>SvCyqbc`owdo
zbg@&ds2`J?zKlkYkyh)NaHP&`wl-7MjN55Rr6{-b9d~cdLnBJHZKDOhgr{ROg*!9c
zC>A%-t&YV(AQ$!N4YK1V*6;UeIouQY8Sj4dY`OSpcX?S*qFevuDY#67BR_s^nI1_r
zP+yzIR&0mb`uX+jYv6{@<VnQINwFBnaVi4Br!=%C;-h&;7X@;1&_M7>a7H;`hlbRZ
zrhMkhkEdMD1EkcYBr%0(umA2Z_In1@>ve~@Z-o%v`&Z8k-OH05_d{iTm{&TxLd5Jx
zP{Z!4jbtL5`mQdXD(V-w<8wq-2@IFKjN_5b(baoE(atc7LaZL5tM(LD-HXZ<3uH78
zR!)W(LXF!=)$D546}s9#HW_<)KgG@EW;fn6!=>1+ZHY`U)YxFkLf<S*ZrX?RPFB92
z1%C*dsdu#*;gIq;ppd-CNVgh;zBTgmzC(8w0P^8OHco6VG^|>3l$0_D?lz)!rjop0
zJ^1kS_)A+d8!5$DO_-q0_V<1I^`E}tgSPbr{0ITN<DXa|J%)Kbyvl*ahB^+@BDZPt
zRmxep{sCFyS;R^XskD3dq#1^6`w4yVkppGYsD4t#`WBWgjsU)?*C)Jr<}x}#HCk>R
zW5@h9{8yE8Fv|bd1j-$l;gf{xYqMfFSp%G3)%otVAnSOrvzoQ=au;M}Ic{rVpBQGI
z%r0?emVot@@&-?c9)_bbM*|D!fw9sjt5WBm)A?0<0;`I*{0!*OBfylIp9?8YTb^<E
z73V|2la(vk18zViu7UlkXF@yT`okMPHzqhqizHM?iLbZ1`!p(JaHI8L+p$TX7T{L>
z*4bdxxkj<!0<w}`qE4tjG8fS+c@#{69EepO)={qFtBg;`Flog4d`Al`qZjUmbaNDc
zd)a;P75_ZJG~&ct<g9~Xl(v)QLfrTwHj$|4ZRDO8Dbn@7Z>RdL0Lk16d#nv!Ye3+?
zu!OuJ^+Ru6PtMI7`VaU4rDquQ!)MUA>%cON!&JuS3{0fNACv7Xp3g^kDLH_>d{jba
zpC7+^Alh2j^+kC00s}A9nQ@jcsjE6aqLnS$Nx?knj^`<^6QqM|bskT>`fab>wq~;{
zt;NAowrr=a9kx8{N$PmEb@n*vgWNWeAevko35LTaE3C6jDnMPHSMNR$7fy9)(#R6g
z+3zm^o8<yIGA18vtdj&j+)7Uy%p7yE1=GD;ZvXhp(rFd~n~gL6#<76W0VnnDiGFG5
zj8T_NmBbx`;*r%_A5TsP-O_pNs(=-Xae)K9*x;{_0<SD!h7!-rNiuRZIkW0nf_HP=
zwfr@``_1@ZpY8Ch*$o<pgV_qC5SF*MKN&?+Qn|zPY{V+v`+Fy9Ao0Ro=EV9i1~d?J
z(4(o&OLUL!sv%yr9g#&UDjCuCy%<q@tfSgT-Y$yk*&iI4c)2xCF-7}X;%F~V9rgrS
zbU>YMSJ%q%?vTJXPc=yK;0yd@5*)wsYj!6zU0Hz+`XWZaNyaxaAAxT=yC?y7l7=R1
zt$p=v!NOzUhp}`@h$#gt#QsBkr!ei^uY6K3>vHI-kX1{G$hGUfrwWH+9?Iuc2PdY2
zQZ9EQ8I<pg`K+Qsm@=9#0%;sn-7T9JpNr5d1<y_bgJo^V7ZVCRtG7-wookN+c{F=u
zQb7Z!LQOMqaU1x~O$S~`DR=|awZ2e@vyYhMr^P`?_<Wn0+Hr5$Jl5B9QZXxt0&TbO
zG%!EHWU3&3<K;mB6_}qWi*}nm?&xm#*BQvEt~(OA&;HQdg%{W!ZaXG^ID$10eQ}r`
z&=_fiI9YaCAV#D!6dzC%yKP~5{kvEUT6QP*9P}+vJ2mko+i-^%oGB*?Md$g(+Q@Ls
zXJUG!`r<HxqM0j5`97)~Yrjs;aQY$!hc>B5F6^1Dz|d6+*opO3=BgqfbMW=KEe`N`
z3{mn$UjI%4!tRjzg1`0q)-jpg+k!|RN#D)b|G-(m-6ti$kKTBN(SB+8+rRi1-IlBk
z5<yQ|*g>j^K9Bmn#t>$eu2mzuA|Z3vwbyhMI{55%L{df)TQ07@NE^dh<~rl`CBC8i
z`^2|fDtsv2mX*DLEjZXbI70VgdLLxj?0|ZGw-#+zP{IekI2GHm7j!T?$n^n`ywG|l
z6wPIoP3Y?eg&Q1Kp48C!^e>ZJ1rWFdSrOmoMNF?%U=$=@Q;P~WbprFJ+;K}*Zn-vU
z!(BME^PO*A%}?W(9hBh)z8M%3^C=))`;Xk#WImf&xABVi&-9-12seo^dokX%yqG=<
zSL`^Quq~e2FB8ex&#F8*y2SQ@hvB=WjmoYy)Dm%K#>1D;rCe4k(C|1Y-q=m+WInjn
zb!F40avhi(HR<9Cnn>^$UCAgm9G!U+`o!+!pi8SL?i-N=c35^<K+w~(_;i-<UEnzB
zhR@bF1~nZ^;@7W1qy*0e5<sM^3SXutoqvktWD%9uwh&7#)C|9(qjhchsdwcFgEnCf
z1KSmaccH$$+$PyicQ`oDp7&n9JAx=TfGw4)!ld%2EWF+?yv2X0eg-UK)Q5HrIvzzz
zI)jhB#3aK`BHdorw*2bS0Uwv6^X~`G`{=3vTB9>)Ji~$9pFrQf#SvAj03$bxW(#|<
zBUl<S-Yp-w1RTICO)kL-7{+rOz9Y`otE~g>#qkt{Fdj8C;JnLgo6Tx=A3DGj?+UMd
zWXEVhQ;-)cbq70@W4tAvlA8gz=tu_xAm!h{MTBf$!svHHM?&jTiB@OuHnQiai8Wci
zQFqKmnlR=7Lg^6_G<XXa^q;!-YYy<rqdY*z-5<;!pm_!`A1zPR&CS@zlW<#DYuw74
zMsyir(gAzuu?deC*(!eC-PC;l%WGMg?exbG5!Mir?5z2mf}qrM<b|=afh{KS?6q~)
zJ)IZ6@KvE@?7;O$O-cG!6>Nt=G)kwXzLqAok@Q(UlN(H0l8*9UPtJEPx{-tY_4i~Q
zbZnE{&IYU2D>Orl{r4uIRE9}vBHI_-LOk(6HkqU9nPU`#Aq%G;i|q!cK6mY3%pYzJ
zP1-aTIBUhAyGzbMK1|7kt^i@GI$FKjyKpDun-02~_{6v%9=j%s6<kk*t{V9&d2K^p
zLen>D<qZf!y2UEXzqe5rWYw3Y?Z<Yz!@XWx7cX|X#x4_FaIfmv<zXFMlOxh<!4t0O
zNk8pq5uP3s_xpr*YG<=N6ZQx~khrvJuUlhYVdM5PO%<Mz7wNuIFHhhd)xJn}gQtYO
zz(q#jzV32zW?Z0t$$4KWQ-sjW!s0S6<0TNgX($w==_IfPL8^Vk#u9h-mk~9hxVa#y
zJ}Lgj=OqJc5=kH-Bznqaj!9v~A-O>tI}U8JWEtwMKCkK&#5Cl=k@8LqBg6{gn1k}H
zv{OE#{-EmVh9@en=TL*jrv2@Fa6!)Nj{|I@J`TWY0V?;G4V)^zn9$Hc%47#^`10sE
zE}u4E^x3kj;CRDCv*z-3uK#4x@Cbk+?q)dPpZ?U34f>FgulCF95uGceGhUIVebcFK
z6Fd^T*dT5puGj+E9R2pf9lw#m-JubQ&!(KnHKsVwh{OkAxR2F(#pC{7sp4bLA&gEY
z5wcoly?l-D!PS>uah^LMDdRiaxLqWw4;km#Q&eler+`J{qbM?{%nmGj;`NyhfFnQi
z1RVcPIFq*x-vHs$Ko6gV&YX8XhS<8+2Ncy59a_d)#J;<Y6{q%Ku96V?rC5oSZ}GcN
z5e=DV&=0I$JCHYZn>(jno0L^A=?W`H3#6oUF#eRKaP8cwG(o!dn)N{NlLy*9GApMr
zfH3WrxVM-<W#kPNU2nH~Ub>UT;=kav)4*0#wb8X~6AT?UlRWHN9{)zH?6q?~g3d=;
z$x5Qikxa{2=)3`PnuX3uckhi%k#t!d%-~%-#y&p%^viX?oJH0Qfb=9ej0w&Ye<8N0
zuueEdNjz8a<de)6`8WJ&fJ$4QF*`c*K3Ye2iQcAjVu%G+<d7}6KY{5O7-Zl(O9tU2
z0DcM%Up+6fn_aMq-LBOpJ{Wg$0tW3>em!H~u%>y~;CZJ!4fL?6nLSy^r-Ml{)TH4X
z))mg%A**`~|L+0N%9j(VFiC$hrj$<WRmrf#+4A$c<!@~bc>{z6qt3tps25_k;2xox
znTYzQG#gJ23piX(y40p}7}5{?(boFFLM-R;bpoVm!cf<2(?bT+p3npk!{iC1H}Gz+
zR5!R^6t{HH3bNJo6my?#sA!v{S!Ec(==bBa=+|1UF7#kDvISL?KzO@FS_50z7mLM4
zHeDJz;afh=zUq2xzprXNs?rylw(0HDSdt2C%Ap?~h!F+nd#$w5wyH~>#1D!W9}DiC
zL<XHFUX~pQ=~CKD^EVqSflWC+@M(9f9Wbg*y9XIZUy++4CL;OPA-Q<xn4Z|GMV5M7
z59U5qX`Sj`GGZQ|P<`4GqpptVT=6Ti()$dIls@~eD)`|jo5n$xIzsr_p?AkjO`QJp
zXS~vX&jOGYB&L2MAYZcJ9f7?+@TLeei`*JCliYK+kZ9Vs_|{uxKe`B?ovQ$bNJCnI
ztvQa0@ZpVZV+lF{=rNc$6)m$coWH3%8(c6+*$`Q@+19i%0>(=Fme2R>4>0TJhi=&9
zdF$q9<x%BhgWXCe*lFV4BQawJ95jKx6KImr<EqL)vyyXIB!1C?Ux9x2`-<%dfpD9G
zEiPJALC|cZYdampV{&n`UaqvF1v`6B$2jJH8qM|ca!$?lEYsL8H9syZouQ-OKPm$Q
zt!yNm3s%R&zM7hKjBjM6{Q}0x?5wYI(DPnsAVvXGZ)8e`9@Y*r<nr_b$8^R8Z0XKy
z;P%w3s%$xgekY%*a$(@3%Sk&en656%(KC>7a+RirthRkG`@@wh%!E^mJPN0N`ltvo
zTR)^weeQTNx00L<R2p8}$1xwA&S_6o2zxulgcr=d7JH4IE1GOLsG23oZZuJ%6@Nc>
zalXp1JT&V0gYjDJV>OAdic?+gADM>w0j7eY5k%#ZSB&*R_`E#<ibJ;hj);bZCV&qM
z*+q{D&BWc6JXm8tt*lmUciebb=m}488a-YwEC=-<M={jE)*OFss6$^@s_EKn0nF7W
zWO4K)qO;m4N`Mb3)C9l(T*Nb^q+#&3>dMXj>O61UUY=Ffg%wKlM<sjNVJX$Q>sVQ_
z>o$=*Fq)ZBKFSy`de)1I;s)LgnRVujC!{3b83{rLGhd)Sz9_A?LCv_1%t$$mE3PCb
zFDb*5r{ANXX<k;JRM=yL_Eo)BQ}#QS9-MHA*}v0CM&7WjBHo$V8YWDz4DvPAY#QzU
zzW(|=8)N~>7`L^-!r|a|!%k1vw2TQ<d59Cq-a8?Jj%noenh)@EQqHJYD_f_pWc0Co
zINpUf)=wtiQmdYnY$P5S%BvZ({O!9P1-c{CzCAq8lS*^{D1a(nd5pfgpxZ6CnrW@S
zl&P!xseG5JIO8?B-v~&qGE3uqyh8eyCqEcyuadR?y!V@2X((~9DOsz%-A9p|s<Lls
zxqmj<2M@-U9W6ZZ*}j?BI6@T`T@t@;og#$GNm|KiCLwd!MzXilLhh7x>o#~t-n5`R
z#J#3>B5$qT>)SAT-(;UUrHGU?(j@pi0ZEJV^AEzGS%LDEkhXGWp3^yb|IBJFi<;A+
z;(nX_<&as*iTFi-5MR^LSH&U6`-(j%<Em$_$8-LXgDXzR#_O4SF@b7zs>#)gi<aA|
zW^x&$>%t#R#Q_DDR7^{j5^LqY(#LakzQS~wdfhbom2svfyE!!)?(XR8r{!-JDWNUF
zZMUXCk;7uDdNBga^wj+XvK0l^T6N_NHtwBJUd=1QTgg)$S{DE{nDmB5WIrtwr>ORB
zvRa4~-@*R&T)2?VT%p06P}as9-E3wHM%D#F>sD#i<Q~E}#<#xAA`iIi>vVS~!=mnj
zj5+>M)TEc92B-ch>KBYRePedT^6)}`G@cSs98HPu)R-+tz$I*p#EkqmW>24Y9z1{y
z^KqHz4tBB%sO%5bO<04%&BQ76(|)mbM;LnOmA+vA)C^DOj!_e6`>K&bgDRY5Ga9dQ
z)vWcBmg0B-ry&^0{WSK`l!WytqAtbVi4^xMINh;n@0u!(y?U1ShMM?*NQuImPbZ@*
zbhhauC&yoEj%Pv*Xhh*h3*BD~wrsL}m+hw9JA1<oa;B*&)!OAL3Z6Z&o|dk2w{u9|
z)mlB+?FJz}i4r9dRyer^D^d6p1a#WW7&dkh_m9K(wXRBT3faa@dAdh)$8zU(FDOv3
zT<uX$cNt9Is>t1sr{ZQ2@VPTEr32bOc4OWI>n=R86^$*K=sSt_sK##d8;R9gMrmm4
zCL|nnxEuq$R9P~ONsmm&zkCiCp%JpH+${Cf{w%PA74YFu;0jf;IVlY4guV^)vODv@
zHu`qlEr8q3RB0OPRcplYCUNAXd4_Z;-Q~!*53<l_e>?Rxr_iu+6b3HeIaq__@ams^
z^1s3IKO4%W)yxt^aUQnGr?P1jMv*XSsAP;65#4H$PP3h=X&T)bD#zFO64Sgv-Ba@Z
z$zBX+=Fs_=ph)O0qb`44!-t|QXrGAHM3T+M12Ok)(jz%Ri~b0mS6xI5-BP%N^28qO
z5dw{Tsh{Y1Q)8AG+p0>j+9tM%VxS1p+o(QtaDUPtMJX9KZzB@2^fcps3$r&K&s8V4
zy?bmUUmXZk&x+%+F*jB(B$TO1RPS-uuOyeV3aBL@XOtI*YFZ^fNa-ELYLy)YWDPdz
z_`1Fg(%5vFmMi7H1NXXsN!<84ad>4vBhCSdLR`qOMcSshuN(xw`syvR3X}U{g8Pws
z>)JIfsv%+siH5kx8!79d{5*)**=bWhNbr7xwVuRF7zF8gYLxf7GA%|e@&lV%bG9Zl
zh%F@gJWpgO(<P5=WAuk37GPCi-zcL6C)OUc;poS|IL%e|_OX1Q&+AepN?8<$PQSo_
ztoCofXCn9t<b+hiB{wDlKpktP<jXPYQp%mqIkAV1>>;5Pa3xBK(+~T7CxJ0fd8owf
zXrEjRL~8!st^L)<4YEjQ2;XNRYvq?@4N;`1uVnJO?+q%h?g`$2!*KNEnTmxw!Ouh`
z#7#1X3t`{twCXSovT5Klm751BKDx<Dm%e0})X0s5-oRs9HlsRh3>&EEWl-=3;FxZF
zOy=whcaONnN}y$A2I=?}{m5)(np1CFZoXVyVrM#LN-|_~B#&vaeR}otYCQ@b|E#qb
z5-}wIWn0**Et7)z7WRq5h@P<?f@@~`&~?8)k{<iLXfJVRMXQ_g_Ssb)zX=->qdK{w
zAw|;Gd=&vjqWAT0=bvqSrjx|=Kn78LOntSS)UE8%A60(yPk*q>Dfh64T(&?rdg>jy
z^a!_5$7cng@Y!fJ&I#Rea!|fw5<K*MeOUGzNh`!sEza4($aj>R_^~&1ga_EdLcH&i
zxyU*z>tItlu%6K!YNcY19Q>XZM*DCa%5lWz@J{dQc!O&YL@knbNABUQ>uGjum4j!C
zUpw2V<pYupfzXl-c)Yb&X3qZ*X8t%2bNS!ooU~OA9<zoRJ$XS9!|7%td+p(o>jz(j
z4t1#uUUglVMfYcZE-GUW_{Yle^X+Qn)QT>Hw?{~WopnnVU{mBOUi`jJ@R%%pbK_I=
zzVkVBb#m3e=V`KeUy_dCi*7-q)U!_?<)BjHU=Gmx*&EiXs*|`=WYoJ#>iJJBKxFD`
zmX%X6ee{ubzq_wRhSUMJ?gZB#QK|xI#NPbS$ERwjS-0W+`u%Mzp8-0|5H`WaO*m2M
z6*=4}QV>`l^MmEuGmFi@<+}s#Sv7O|Kbf$!d1m%`zB~DhpXJ<&?h7E6I@2xY^NoRQ
z-4ofa(6n<_h!%b^RAHgeU4f4Kyad?YAYga2FSMhIl<v}cYvzwS;`ox~_EMnx%f&Ly
zuhE}>6*8O>>mrJh@(_HuoBQsRnHpiIZ!&Z_s^*h@rgKeR<t<>`s(w9h%$$3g29Jwo
zv~9eT+y~3WfOs_uZRGvUQ$<b{YY#q!X3pJ<?<|cYe9r*C(3pj-8u`fwSH|TnZz++X
zOg>fO@TYn9)AXY>G<wl8vb0GHFjGk}`=KEjSA*D2-p7-a6%S!#Rra~3UT!E(A5S;!
zpv!$sx|Gr|stSB1{mM=Dg0VuKpgX~TwY9%l;WZLQ4caRauEBo>JRrBQTNrb9aC8ng
zix%Qu&jfw<e{thynQuS4f~<A#BxbP8PADhLb7|w*jpgHjyvcl5K5%yS13g^YR@*l?
zcv{X$4e_{Q<J@!7dazitzhV+9V0M18gW-ay%o9^tDt#lUX!$BrfOl>d8k?VcS3)+1
zAS{&g5bZPht$Nvi|9DMOcpg=+oFk}q{8fUO??hk$Gh<M(L-t}aQEoF*3dee*1TNUU
z2;>(j%ps+Ec*)N{|Cn~jD=WTn?dbi^K#_l)?Wsxt>NV)Wqcu0{nX+KWExENB>@<ot
znN+i0kWRz)lRdy?k{)gGzx?uBD#peOtJqt&v){WKz;@h}t$CchjNaEMtZpVu^OEtz
z(&d)DU{zU=xJk6ev#l=#=_1@83Q+#+ekLzQ^-RvV>d78x^vT{3h9}$lXp5{>W24G5
zl~q6s%5piUe|c`UH^S!Xu=N{n)lOO1+I;-!AkUCZ<|g!!+JB^Z|2`u>sYlmXL;Mkv
z!KPFUWUZ_rGm|8cLiut7^R+0kR6`me8;8>^7d3N|U?tJ@BwLT^j8>3h>SS@YxoC#d
zSk+T57%Sp<#lT?m*8x)=q6?s~RN=>m242wyQVi_$7~BGTh(=qAr`62a1{K(w%hleV
zer*W)bLerFM`_dDuwNMs4KEYJJ|<z2lc}HjwdA{QeN>a`{LFd2wy2(&XmM>)*?^w9
zmdDsrFbf7f<_OH&rb<iZ>6fgQyJ@h*GCQUG22O2R7^~uW@DTdu0M9i+@Co7+usKdG
z8^MD!cGq_^ti%y?JGM2_E9(7VR@@13A37!1RkU92p|@U%L8YAJ*_xTn^=F{&cR$_r
zx;~KKbEr|XRPpJky$K%Mg%)LMhv!$Z7mEr8o4e985qOedltzn?wmw+3jbFDksybuZ
zlwy_cr9eJrvV=t6T**-vU045jyC<eVI6|i3{co6<@2uc)mkkk<kERKIv-RC0*HRI4
z(Aw=o8SYTICf3>OJLJ1G15el7x4gBeXD3A+V+d8slM%k<d^ExyH9b{@b_vdHNVWK5
z_1-8*zlhlKtNR%qn^mdW6Vu@=KxVK}RR_AIqBYB%B4$(ex$%(XL73Z)dp92DVLPoE
z*mw_3Z9P^RuhbRwKjr$rD*+?Xr2<@K*4SE*%}9_dHJ~w#n0fg%MO?BMqjPe+3VuP@
z?edr)QH70r-DQJ|qr0!DK!O3g7%8Rnv&llDBrirF2De16Ir5dR$#>!VyqWEOo~Skc
z_OE$ae5L3nolbPDO=hF~EBV-5R6L$WiYDp~GA0D?iW&lUm~7YOx^<+89vMRl|GKIk
zMZvCDX50F1{a0;u48PLS51Zs0FpJn9ywDg*Iy*8-%apyI)cV8R?gz<f&u<D;5<1&%
z`Nu4Mi<FE89+QGlam%G&pC2*uRlNKfo{!hEP!-NYchNkadu6}f!+kC*)5L%B(Z;#g
zs~5a)6Q1#a3Jncbs1t>}l$4xF#u%BvhILKs&C(~BjR7wCax$U0>erb|MAwRZGy&@e
zj4e_%aW299=JQ1kaqdWi1lR?RSZ(08k=Dz!G$A83@p-(}>Ce`Wm*J;I`-ton5wZo*
zL76uXuey?1W}8q_uY7fVU?t%`X;yyYL;cALR&U!s9&sojSDH7FpBCW$VZyqR@737r
z`*BNz$!g0qft+oq^;Cbcl)7N_GaE@oUzB14{w#DZ)hE+u>UH_<_{ZOfZZTTAUVR|8
zTReql?ocvyv!h8~Ii(wWcL&6mEaVokSHC{w5EXt4&T{rv2uRRR4tL&-(Q(XQFdNG`
zt=oijYeI6w6s1nL2)Uqk7OT3Ea(Po5@Js=%W0r$5+b_jqHsj1$s@kg$$o?B9{^377
zfK+OnhRQWguJqZn4{{HKO{)c4Xs^rc9{O!Za4E)0e0==&Hq-0(t$Sc!oT_B?6J;ts
zV48Ze$e1R%0QdTbGuQN%4Jbjn!9m7B!!|$ev(;HzJt|6@&%W20Xc_+)Z{hx=j{<}1
z=a`#gT{AD6HED(vmq>$8V2UKIoZ4y)5M13;i{b0o%(-mFt4=`2B#xPbQg~qhMC$z5
zuLyUGjGsJFz)dd1QUra)FW_vKPs80L+tB)(Wxj@OoazYFh({v}>Vv$RXFSCg=}4b#
zFGG^_-Wy&@kYB=EKJiQCW@%<<{Dn2H4(z=q;jS2(t>?4307V!eG#Voc#2t&$mNh5(
zS-pluQ|U79XVRvvvi-V$aS+qb`yP9-bTFi@taz=wDj>utU0%#*s4mNSG|?(EGeE?U
zWG$B?mjQTyN)UBS0Up{yOt`&vhE<ZRjRyKarVyDy*@E#xvE*voc!Q*>q4I7rVr6uI
zY7RX~Am{T*j7^;R#G2p!QEwg+FM{c4`(k%d{aW>vNHwV8EEJ2ArD8r)-;j8TH)LDE
zO?mRYq=<-r{Or9$mM@2v`fGh#ZvC>i#!A$Nvh+XjEED`&LOCUumk{IB{U<(BxU=$u
z4M==rshm`#$9P@Qjxw1h=FW#Hp(2&N$_R*wpeqwyz&|>ZA3#1=8XBMz2K>DJFZKX{
zw20JQWMZ&KB4@ag=zJ}ZL4UrAD}R@!U8oNVReXtXc0)}X&y8t-&#=m&`;4EyNHjVP
zjearLE0*^`WPUWI;N_S-PJ#4&3Q+IwdNyrw^|@H-N-WV}oe@@=NQtl3iehO4u=Fxp
z(_iGo4@6&C>e5g$CX%%>{%jgf)WJ6JW2gnOPfVsteU#V7atuNaD~;72-)*Xr`4*Q3
zO|))|IMwgpm}N`wc#ZXY696(hvOSCeLWG#y!!Adk+DF$OPhY}BaP+G_S><~D-sfmw
z2SIj9`&GfmVKfrF-B6qyX}9|Jm^MATb$-skq5ut%W;1zPxT9JSQ%LlE{qA4Jqc>nN
zI>q`0>0SRm$2aiu^hi^ZZ=qCud(&^fpwWaTRkcc(o6#GPS17+n&$=)6)`_PuJtaLW
z&|%^uL>o%JQ@}>^IV4i`!A9L}r1vJB9>N3?LTn4lxW5jbfoq?eCU%T2cji!a(7DeP
zq?avfYzW%FAk%DgTyy`TSfo6zYIGtIM*a_`JQo>pC3s<u8ZhV9pnushE6M)Q$2+H-
zN4fzeT5KAM9MkyQh5lYbIZ^L-gAE#7*kbK+zv~VZ++de2sYBleqlx8yY}NL6e8g|d
zNw|3zbA?A^7&{ca;G(ay8(aHs;#m&oR27Qs=<VH4DIQjD&6?s}XC_DNAaK~SpXJI@
zUL>K)NgGqVk!R@-9ZnSjuTI`>t2M^ZU;c)gWeMVs`-_4YpF3C&3U=GECl31lXcTnv
zSG`%6Xy?i@yIz_IF<*K+rc+#(9V8G#bnPC@)fLj|Nj)r)upf}OwspHFaxvM^c`qPM
zPiB8F)|JK%QVWJ*Dy^tpAH7QzROKb6e)P;zV()VozY9TGy;1T?RaGUG9<lNjd}27j
zh*sY^Q1{v7!&tO@mq|lFZSme(+Y#v5m|XoC`2OLjJ33#}W0nxa8zWgwT%p*Hot<7@
zdJxAc*n2E{N@<xh6s!jd3ct?-0E8}Q10WrE9>ZyjFagS-6B<Tt&k~${M^B2N)|q0#
z*O*Nvxp9Y?v$DR=zXiHxxntFwNA>ckS3Q$JeBl?TMUq?VR%t`(VooF(seBis#x>G3
z9tY#Wk9^u_YfGJPB%Z8!tV&8{++Qg!y?WIypUn1Io)IEXROQyU;q8<k6alinxVBA$
z6y(i5tzvDkbi)4vlbe2r$vl67$t${4HdoI8HY&vstY0^HIO6&9#_B}2?nuC5VSq`(
zdp>WB)-|*mhwH4@MfxlFE56t#>K_F5^d|Ic5W~y^Z(xTx=`c!?2fL7h)6rh?fbcvL
z5lkQBXC(?AX5Wib5$C48_HI(j`8{C6c4uI?fo+(XCmjdPQ3Rhx;rGwnTF?5b2pC9w
z9U6|S#1ZC+KiaKcKkTG1;;Fp^Hma1-1n7GhPi$Ianaf1C1_Kj7WodAK2J!52oiP+N
z?8-JcFDJ=u(7*WJb+5a7Io`<hSV^Kwu(HA7f+ntiA(m@0IvUK3@9^8rwWn;M-9*dX
zdYOCaOWW?V@yk5g6G%qehtk9G2zX)9(=btg)dyZ+q{B$evYz7=MV-<n*H;-Hq<)bH
zVBSaWk(lr_qwm6>v<r16?2Ez5b5r`A`6HW|uBSU20_uT3uEHVr9-PbvF(@O?{kM@<
zC)L>$^s-OY%PW5Do&J#cp?6D=-O$ncp=(0UGut12l&7uQ9z72grnYaM-E$~CcOf!G
zJZn~Y3Nvdha$6fWi!AjuqY<>fr>oW>$6s+Wc7l1=i9GjAnt}1d&e@<AICf-V#;_ey
z#kAqKLpx-eEDb1%?_@ZGji==Z&r<#$k-^R1k-_7?B7-~U!6T-K^qbkoFEnL|*i%68
zjLgKab~#3M<~L-mu%u*Y*)H$vG=(1rn5nrq?J}SC9dV<bSY;~Vr1jkqgZ%06YpN%V
zKij?%*%+(rjVKolGPc}JxB2$`4(VGPo&i3wT*&`|AOD-UX}kX<Gg}?{tFzSJf92Xm
ztjW^0zZmWIW3pBg60@X+_kd4pK(pONI44M2NSz#!b3u$M#c>(g59T>DksHhXodHy7
zs0N0!7bvOSKuAx=e9#p^0$V-A^utslRW!iO#4x~)_IADW;G};g$^VU>E}bdabAZAS
z_yG_Y-hU7nVWrV5H@o?WHbq1NM{e@yW#snwItN0)Fh<#wrbp-?h2P}%7~r>AuU+ZU
zL(NpG-KKEFS-WonOH!F7qVd~4bM<`dPnKxyv_lUkK05Pr>MI2=)htHD_>|Z?^1k}P
zdUhO7fl=<;54v@2_c~BDRhlc#(5!}UL^1u-XZ$FQhxdX4-(UVu@7{9%v5z$zj{0r5
za7ykA(-Oz7>ha*dx*m)^(&<we^<xco$w$2+mLCX~EP$7;E|<jkcHNXJQZP8TH_3mn
zy-@fdW~uOTzoYTorUN{dnXOB#9s2azMK!+h)D{IXJeB8l9{Jh@jeduXHt(nMe#xO)
zht*<<S0yHds|nG~*Zm&%A0>OAb>_sOc4L<2@fEsUmzBgofxTDRx?abD;75ZZ?F9e)
zbv!P=j@jS8&aG?axCtw8$2U!@j-CniP6q^TMVv^k<I7c_<r8O%rH?ETj(xu9b*oqT
zTj6~VS>zZ?E<Id{@7FU8xCR!<5^i5?=1}M-Sjs<cJCv(vFj3_b4-@TgbGO%HyUYMI
z;b7RY{E9@Sbep=zYiSQ25zOb9ES>(o!Ev-YVVN%Qju-sPT{_jb<Xt07&K0iUa9iyR
zdxeW0^#hCaaY6KHNf+SH4*ywk`L{Cp89uwzq}{)0Qcvlugs38DvtRl9(FMb%ItSi?
zi-3qx?K_|2y`1!ep)hhk@o+%L#c@!y>ilSl9`kA%#4Qf}th-EplONr6qN-QCJVGuY
zC1JJlEdr_6n8MgtYE7WcdZ7A@yBBeRbI3#H#x_*Br;E1k3dp<}{>U`gF-bAU7O9fP
zgpKt4wMo`b`VSeyZv-FYE<f+fzkJ?nrTnRr9d?a%!f^H>iEEiZfnvp$`~u_Sk#+RE
zD{~YLz?b(C4HF}*;687>;sp0;luxVN5q@RwFm>M8rd=^HAGE*oprY?>qr=KgL8TH&
z_f8$KFZl^Qdyf=BLxb&CL+^nbTsO`E-v0*cUcz3?tG@mJv5fUEXe)Z@!5*^w32n(j
ze!9Hd&koO2T)c@M8&Zpv!mVE{b$pBX#KQM@h%wOjWZeq7U*vB769VceCj^ruuxF9@
zoqhZfK$XG~Z|qsBd9W?!Hq@T&f0M<8RCqO|Jadp}tQ$z(IWEqzC1qY%o3hQ3v8LHH
ztD#uLj{f>=Wn&5!3)zOv0Tvv4p{qZ5QTZg)_jnmu1zl$Y@yAa<(&tg^{jgS#+lRgv
zI@0+wx*BSd$L2PgEgH^qbIItCN|8A%@`AkodII4;8N~S<AlSRbSN=ST>t_F4wfNg_
zj;SweQ0b9>QgUy?{xQA(o2VJVm*#V{AI<5u_ebp`?4Ol|<gaS9WOHf1zLJ0D7Jd)^
zs}lKdyZGx1N&LJo^?j~i;ZIK{@cbVl*xz1wl{u<}6rdl^j$csJA4PGpYiy0)Z2KEM
z`Oi<#PcIcois8>t_~ZURoyFh(i!}T)JnXLiMF;P*T>IMz{L_<;vCBg}_x`^_{a;k$
z{|@zk5svg9hVg%v`cF2-_@^oUe`BdYFrWpdp<m(=F0HbJ6zB?asTrV1FN^kVss<Nx
z9lMx+uF(MQs{{1A<9YR;j>j*7RCo74g-iS39miM`TUU2A61GZfMa|`+B?E=c)2<%+
zJ2bFq**tNHcpUu1X7FX;-CE5EadZc7H3EAsmF1nKuh+LPr;T^mSSO<<z9)CuBs5yh
zZ|Vb4awfR5hBTP0wwo7!v$DluvD-*2+#W{aCqR(mI{LtQ{>EzO36Vh)s}(hK)GEn~
zcMZ|2#;<u^VvDzztBj3O9%Jv&usycybB!pcIc70UGV1Y=0{n9j=o&|gV}l{MIIN+;
zGxh9n%0UF3p;*1|1eaS5S+<y5+Ea_WuPJCV(s`Nb{vM*7@h{_H4N!^vdr&id{-!%{
z`I3uwcW$gZ!jzJ<%HIaFg{Jv5bz*0*=S=sw$J`>mJ@@=qaqO_sZo4jgFr%{m{$_F%
z)l#F7dnc&^tqIHCAH;dE(tCnw2$pUzzqP23e5EHD<W5ArLi_j`-XN2J`=~jWmmQbb
zM8DL9a{d@x{*u*msooPM?a(A(eLCBr39_cJT<|A;QADkkTHgFTEH-b*N~C=v{EYNr
zFTZ6&Isu7aGx^n?dtTTz^M0rE{q&2DFH9^;!L|LY=ViZ3K)NzN)*NVFN#PZ8m|?1Z
zV!e6!=D$a;T7MwMzL^F}<9`IoKs-|)FZbBzM4O@_LO^}`%dtY|DFFqa;R~gBekQ6k
z-!xjt)<g8<tWTNi6#pfm`g4hsymo1UFzZBBYw2viuM&M!(qO|U2l6~;J6^?Su>3@a
z>cl5tt?anZq2YZnpwN9TL36`0$MqQ4K5>b5%GEJzJ~>7@n9VS+-$~~9%)T~xii_iZ
zj)`Otpgnl?xl`_2ar`r<Y+AM}$qFQw*_e5A5|yUX{@`HjV4eZ;GX!XJg3|eAw$VV3
z8)Mi>&IuCYcnp-<!e}>a9h1c|PKlDumAWzU2&rx$iIDDN`hHQV>b!6(sI9|eV>R8E
z2>>H%4Of1b7a$VZx6VXQ`t(~H04aUEeyJy%pZ?U7TP?=MRWJGBYu7kd1FNe_JK9nK
zlmR976D&$ninOO&T0)#nlshs8=cuLgH8b2_h0biU5-jLNs*)vC9ek>uh3O<!t#PJ%
zpCpc1q;<FdA)Gtqjn`3Ii(l?&n!YV?+X0qIMJva1^Ct^B#2|h9ZT&yQ>@l!D%MiAb
zaxs*1N<rkM$TOnEx3k~HX8qFA8NVUwv0LO_TDwHu&2aj7pI-SYDNR%Un0<=#j-yyd
zB$7MEVfQlctaEv{I4#;sjqt%>g!=a8DHH)Ci+>pMjM4lR6(F~^k)V}j&!)0kf;T<B
z=+2;(8XoP!XrmJNim`bZ0UqP-4vm=RG&xXOzlc-5ZA|W{AReDlv9FPSAFInLMb@fA
z*<kqYb&07gwwYL}D^o$Uy+z}pyl1hW<$L|}29B6gt#fb9I8ns!IVIuW#47wk>B=x(
zc?!BiI8T2$@TK|>{z;kwWQyC*y|%7<=IG2)E^?j{{NGXvydZ=Ikcmyv{$+K%Px|Iz
zF~gp3&v38mEuZ4gS*02A`k-p2L@ZgUfo$&EeC*7y6Q6VYadOv=*z(w^PKmDh>9PE=
zN!@WEw=24};75sv-?bYlWru5KdM|a)K0&;NpQAUcLr(aVC_v2pl9(EZfxm(Nt->3$
z5ub)VSU_g?0;D@K`OioN!V8FdyD=XuAfz6rb9Y5fa=&enm#>QRUB@SO2R(X@ca6m3
z-Hr>FkE#<#YuUYmEZNoBKBrgFoZH^Rk6I)syCUWGzI*L_T2ZB$_=P(>ML7>x><C4K
z<S6w&eHqX)&tUneO7u))o@Pb<_dNREpLsOU%7U+W>$fE7xba)qv!>d<Yt^236+xxt
z=%dBRZqqm_>+gj109V2djoU@7rm+<0@H?|FasRxWos;b0UzN>&SphJF*xfrmKV<+A
z=Bn8rl6+rcwv>a%u4CdE`{@B7z{kyeL-h;#OA-4*vFr6q*wZQpeJ)?zruCuC5=X{S
z1puz-ji$P}a#DEvd%&!_ov<2Z7*1OQL3lQ18m)IL*cA9Cq|cd19_0}#hR>tPPMk1b
zq3fx-l)iYgzTGpNvKiwH9LAj?R}3jC-#Hb0=GAy@T-v4xNl!^<8O;WCOHY~3n|-JB
zC5$zMAyruaiyje^2CX63<0;Rz#IT~Wm8QpXjL_eS0-!PLPga{nBjrl&E%REZZDr@f
z2`f<%p8Y|Vc5&8U2LUPX_!#?BCFJ=LTVxz`%rl;|O#L9eIA=9F@#B`)T$**6q80n^
zCaMYwk>6V-gJg~~Z?R}rgr|F2ew~J`O7uyDEjj!lu0eOr>)XliW|&V88G4XER!!Fx
zDOP!p{?Ir*JapfXOYiiV9K|Xf9;BGn_p^gVoi?LJ3dEI{BaPyBMPhv#*nP{kNs^^l
z^2yeI0za1IXg^*3lZ2SD(`|sK_j?~L9wz<SO>)ELUpiA-%%zqg{Eo=<M5RqzE}UTL
zcLGm?<1g^{V>G84U`u6%ny2hg#~w$6ZmM%P>Y2&WF{>fvekryaB{e-<t>@PrUQ{Lp
z^<acKiaMOy={NvVXDRB(1rFuAeAyKUF7d1rt+fAiYw@{o&KE6j`LB-vPj^h?mr40x
zk+o7KqsF=N1ifN_T5_0!lpe5#Kq${@C~FtbRF`?LL07H+=o1YyVkB#YuGV|RE=8h?
zZq809eE*pB0jMM{>=Jw<AxIn!$ZT_j-on+K{AxH*;|&$MmVhv&FSz`R_a?^A8I{Bs
zFcJ&&gv$yU9uuFeXypljh6o#yA*)AK%<tqFg)X~I!bJbXY*Es@iWxOPyOi^YmQDw-
z%GNqLc%sfV$hPWS+Qm|*E0&K<KGcxUS8`n)eJF;SSX%KyT?{=oNKh|!X?A@z{>bRG
z8*~xpx+&DTql3L&;k-zh;LPu;`cPzbtDM*OJx5o8mvMCkM5ucV>7Bf-;K#c&mXrL%
ze$-g<XpRMW)+dEB)B}2y`Y<T?sqyW5^?f4R(P=YcO6h5-BVT!8CV4KX5v0f{%YJ%_
zNwU+cRZ+J_)i{1HJ-U_P-NN#|s8?*E2CT<f=+=0!9(#`9trut&*1S4G@`YG#V^BbG
z!?W|feqxJ}Bv(J=Bclm*;dzhRY`KSAy1S1=W*+6-URbPbJl#4;-7$8R5DN{nO4}2v
zZOcdL7(3N^pSQ-BnJ&N6Ks0yrH|oYAguxPRl3;+sUlmqj1)3!&(?Y0tY?JMM7kjHM
zFi9A6XHL32*L$nU>32cr2RRopx5wgRA^j3l=Q|FKxZ*+|i*IN9{=^d9)@eO=HE35+
zJ-qQy?_mvvF3gw_50#N4JjEIZM||HH2Y7yS)Fyt}49x7CihKdMW;#FTqr(h*Xh#8d
zehjvJ_>2zhbewgK;RThkV_MNR9KBqrR_{AT*O+B?8mA@+N%z*?p%oq$xl5z?iL=i>
z^|mK|#f_t)FW|Ge=1B9goiTHOc!XD9R*^>HsLFlNme~3P;(<+=Tkt~76r{Y+iJ@I@
z6;!u&jY~8C!<&XZhi<J_F<^V$I$EoWC#<H6uD$wwr+vZ~-nTf(Qkg5;7kx%0qPW+F
z7V?q`^w7*N#f$Eqd#zMmQs;Yqh5C*BcJ*PZzqxL{b`SY<OCx1Cp_S{k3Mr()$s)Q;
zE!D5{Wmx3GyO_ldZ21(i{O|5hB-mPIgwa`0k*rm*Zwmbixr%?Xo|Dc#7SF>%1$Oy*
zb~L1Zc%MfMVtzo>8ba|&8C3fM1~64#;uUtM{Kp%c4rd`z&TydL?2%8Ge_w6p#|7aP
zbu}jPk8e~0C98gE-Pl%Lpb@l-Et+yOp9*_~=5YuwD1BZE?RJxacRkX(RuZidr`YKA
z(gYYn0lMt-tle$eU#>BWjE<B%e;rq(%f{eyp!mzK?`e4|0t?r;EH|x+7FHV><$g(l
zoq#P+v$!g~EfC^lvX-7A*o-%GH9df{YU3xL>XeA$?G%rU;asP0hNif<y(uG`qMS2e
zY*rs;`lGFW_3J*-{X3@v$9|k@&MI*RHpCimuW6i8X@<^}9n%UegD*O9q=feS#>&nw
z%p)L6_>8sCXC|S#<YS^)|LWO*2H9`d86Mh3H45ZZxb>L&9_(?v5BUD&Czj}5SErdK
zyKprnuXoX#s|cWV+!;`xtsCa63m43cH)x)`vru;#sl1BwQr?VHr6po^rJpR1VV7cO
zQIN`1v!FGVmN5Ud{R)@O{XW19<VR^Azk{=V-?iyEy?SVn)WnhI_&$|y7IUT?VhR1Q
zvwxGyX2gcs%XliDjZSU2#6YtxoPNd7e*&CvLBukC%L}lA2}PN{=60uq&H+e&UtCi_
zaRurWhec)?22iIh(No?7+P`c-y2;Bw_wT~@;-=q4Z?1QoWNz$O=)_hDDNN5+*UM8@
zD(&HKW9@pd0+FCn%C9K8X|R$(D1mN@;0;9Vjs8YP*`UZOU!fIO+_<560{~gjK=<Uj
zVp&TGA0+$^opVm*cNdvB8(l{alTK&on;yK0gD$}55G(;rqwHlYLBv%!2md(%dAkE?
zUF-^_pp1R?`e<#c%iFPMZ@T&@KJUwS_m?792r~O^wqFLh@nsn$TcU+*zW!7efWpkt
zcOFQ%WsF&@roh*B|G+${Hn8X#m=)}JbG7ti0P;Y7^nJJvt_^jQ(6CqE^{(NZekH*0
zz9FrSiY+jXK1}tzC3yE|3M@-$SrZnzaSWvUReU@jW`2D*zmaUOcHW(?MXC1D&38B<
z*v()XRb}6I+#pBMu9b7(b`G>on$Kzy+BVq^e$e2uC#N6)>nB4eUDl$@@@|as{3^z^
zURSn#WHXszHiy-QZZdUnQ~;6Ay|D7gy%2}PZ06HxtbX^)>~S3#Hi;8tRPib{^E+Ey
z+drr~1KIp6cHBd!CGQ-#C=Np_g3ah_bkrm;6!<I>rVDw+b~9CvEtp=Vjx}$=cqB?_
zcyyw~PA~^s-=cQ*`w>wJ**!1xIz~{DWC}E{tJ@M;s+*Q+cDE;&{qd2X)r?N{X<8(|
zm$xO9$~5Y`HMV#$IJJ;+MLuzA!1Xbqd&)yK2hH7kKFLX_a(!v{6Pc}<8#HyJAuf2T
z<xsd53?3E~smH;&-3)P2ii~$?9%^T+rDxHb^)r-dQZ2MlB%@!Je9o;hq&p4pDN-#o
z603CL$1(`Kp37$E4^HNcfXrrJL{J!y^M0E0NsnmMdC)Ji%A0u7QA0uadV@Z!G+QN^
z4ZtorYFR{k^)^HK!462rAMdWC$~Vq=MlJ0$e;G&CUC?_C(Vx77Oj}h2DaRvtQ|mF0
z%Wt`+%pAuY)2xsAe(wR#+4mjt;B7dDTJAJVpoHF|iR#^dYt-x8qKXn~Q?nC0IH=?f
zd~zcECb815K(ksFvXmI9s&wqb!e^+-6mBoFHTSbRQ@^M%t|N*b-O-})YP(G-=x*T!
zP+`AY$Wst6#j%=x;VuT4)CFULm8T*t>ioxUebzv)>-N@#*~sFkT|IPE1mkV%k@k3B
z<L6C$(8J9%C4bc;px06-$h2yI{7y)zB#g?azQT3XJcXu^KoDVi{>~m94&lv|Qg2nw
z@R&L29rezSnI0_&eNw%VJLY{8(t6dMI6fdWF4wl~1JL2kalf7C!6TQ<o)lcBXb+hn
z(1Nv7zESt-;Uaryi$ZpuEY$v-*Q@!~uD}>YFY3Jr4s*{&k98rZ54X;2c)fR)`t2a@
z_ULPT;)a=g&5<qm&$G1L>zlk5DSq0Gugz>ERB0D&C8XMdrPUZO8`>@YiUM>E{aICn
z6%1m;XOMO;ogRL%vErMQE$>(Ek+JQqQ_a*0HCSFb`AHqjNc^3LjQYwYoGEhMibaUx
z+eMCU*B3OuVCvwx^Njjw;bv{ka_mHNq*`P^%3+s*l+~vn@y2@G-Np4l)8_W{r@oXY
zyWTbzZdT~?f-D&q;08kKsXw#j<!l!52i~abGS%au#}2^Yjzg%f?pqf~>W>CTQZW;Q
z%1wTnqST>mRwH+Z+*b<kMhfFH8jHGi!?Uc5)t`(Ue<4X`lO9YW<TA#-VFo&`x}_iY
zt}vU4X51(5q@NM>kl<gYWskjayM~4%gRIrgKq$5z|APU+#=xnX-oY7AA1x)QdHa+6
zy?l_%dm<hTb=B_lhbW!NuK*mMB=<msbFPT(j34LYW_tHGgt;|n+fgbKVw^2E@ob+A
zQsw&(%F1TdRhqOqm`ImQ324nuzPnDTNAvRR1wV#&$sog}Rl1kx>^v>$vFaCGlA1IH
z9S+g^=tVNs#|75SVYA5o(#ns|Bkq%pt9|w1epS{GzE9`l^@1w=?QRnVVJ2Hi5$%yt
z&*?991aRAEzXJ8Jjh)KKxT)5@>Z-})KI@5iBmXx?*mgx4|Bh&+d?V0HY031I?)x?7
z5|kL@h>g(Q7fu~?&)wj$UEWROq}K>}P4JeR+FDikZoOH&B`7E3#hm(^_fKXU6#Tly
zPGRS(!^v0c_D;o{i`g}8yo$q`IX@&x8)3}11S9!Uqzu0F-eWbHT&g+2)toZLNDBln
zYz^OdL&=eyF!W|WhD?{|@+ODq0nr}KZ<VBMj_xse@(i&-^Z*~j@z7zYT@#vz8rpl@
zU1Pm37`jE1YO(kkM!aBSJi*8}<?>WLhgS9!vRAG?o|M2v<$X6T;WSKMcqZPt(qg~u
zkiGPC%vF4o&8$Ru+Wnk=70zdnc)UR)#mHgr*KvzRQ=^$cPOXiYnC&R!Xrab$n_6FS
zUsHY_=_4HQdT4)O3h%%vJgFj<Z!_M@-V*<7?NZh~F4$L@A8*Jb(|-h2z^@9ug#}^!
ztBJQ9+lbzFhsG5~v2E7ON*H++NZr@wkbdrI_k45++FF`;@ag@SaD30|VY#6D%w#TH
zn*7lVft5ldMB<znSLaTR*771%(xSdDi7;k3W_cRYcUa#l5-GToX7Vk?OyZFp+9U5(
z-h0T#xd!oMa(pWJ^Oh7~Qj3dx*UhLgx8j%>-flmWEH!^iu4MJ08LJ3CpyRh~a1xog
zQ^h;BNF9?G){Bav8k5!-Wj(#8D+zD}Pkz?$r@o1p$w5l%Rg4?qH%Uy;8Dx3!myr9h
z{tj=r{|0Z0Wd?V)Z6w?oGddD}d2EN^fF6?@ma7ddw5&{ax}VJF=H>@$Wo^{?*h{P|
zHc&3Wt)8kx<`Qw->;vm=?c6jzNV9SO<9<K$*1IYMH(yd2X^XSna{Fa(jOY=;w<|Iz
z3^tGYky6R*xC=AZ?=r@k{iGzUR{AnwAU73I(6`CNzJJ0$bXm9!9W^>&eRR5~U<<M4
z;wZY#dt_>wKMOWeNG#zpke38nPF=h1#uV58q8-2yZxFYe5~&0S#qJnQDI;fRLj_^3
zcaaQ)WDW*|Fyjmm=Ug4bRX>|wXj?05RcJ7BUu*J90AB2K;@(@Cu->pu0G;eq+vz8k
zG5Q~HBGu#c8W$s^Bm*j%pCST68-Cq2k-1H%X-xK^*7{Hd0ZyOJ8sd!DbkCMT@<bfs
zFf%j_{1dBZvrpHAGRN$A+oWGgHFb>RGeqMvByA<X#>OuvcdS0MCvR08<FXZhMak#Q
z=%|J;x5hA7N3UrWOwXkdhJ+>W=7v?DHz~PMP4`?T3u$ucIb#+L^<c50oY3<B$KGEB
z#npXl-*6HjSbzj41WR!D#+~5q?hrf#3)Tb(!QC2{;O;KL-Cddv9^BpDMecil&;Hl9
zYahG^@6l7$#R)|<YpprP8gq>6`ppp!+t(rnw}2`ta*Y8GY3u$z<yZIqIbp5jWIPd^
zppHu$4yyssSzjFfHtTn{@cPraq0Q0l;W#vED3N=fv#3-M1GR4s-pAib1@+@O$Gq0B
zVC$y}VA|m*c=sG@c36&G|1#fE*!GL=Js9)p#ZNAWZGor~3D!)}aOAu*7utc>TKBmi
z*vXET<rFIPxbLV3($uEy%~x8cb1$BFcY<NL6nCDouVe2BHk0e@-RB*_2eZqo1WY=(
z`i4qkQu4369fs3|P;50%vuGRlUv8|@NyA@|KzMf<GgSqDn;MJXZSu`Q?u$6U=WkVf
zLV+IU)|t&-{qjhM8qSjFFNWX*LxFJE<p@KOGN%$}9sR{uOYd~|f&NOz-JRHCA$k+P
z)Pjv5u}yrGg+ZdmGpPo_5m$xT<wC?xPbT)_bGa01!5(%LCPyM+XvpjMI%aegV*!m+
z46Fn9bB=<=jD{HY@QTQoM2W6DN@A%O3P$fj!9%fvKvtiH$gWs|)0^vG23Jx}m;JK2
z6tRX2cpE^i`}*ZMo#vx|(F=-s0*fL(d`zE|zfzvnf94*K8taw58ViA*C;bwPtlapH
zwCiB|s%CD@*f|m$Jf&B1q@Uo0$AUVs`$A^Wr*Y!bKYF|wnP~Jy*7V9Fo1mTK3*0qE
zk3O?LO7Qi0=EBq2HEd{&*eozMJ83-jc(S8mnq-E%?KNnin=oRVBR;9>C@n1JmzF>f
zP`f&igPJlqw(RDza{2-m8)#yT)KLXU5^4O1m?kFs$$ubG`Z0&)bXkwT#3HBvOzXDN
zy)jYKyT3EW_MPU_tL51I{u~~36pZFtt@4Zv_@)mlGP4T$U+qfwL&WqD6N3-4vm4IQ
z0-%lwJk_F8A+<yvJmxXNKTO6oXTK<J#+?y5RvvWh-9Q{L7F&x}KyPyAd_A3aHkvDc
zZ&aF&H^(-9zd=)xQ_!Y-IN}veN{g>$lI7a*wWeT*f$7J5^%8!5dG+S?9Q69GgPUfw
z*Pdt-Apo7k<d)#OVC@eyD;-qg;mXLDN<qe+f>SDz-h<z%J>_T#Y>lph%=J;?pT}~a
zYOztyKh&ve$G%z6WbP~pe0F8h`5iaLfnpOLZtGNp7k=2crD>M8$*LmbG}~+j@1evf
z8Vj|F^ugWvFfyxs|GY`#&`SQ`PFA7!npb5M9mP2sF~kHFujNx6%(|qOcwJ_AM=eJq
zLY@Xy|Eg7=P(Hsf=)YJ1LPzha?20TpJAMJah4m*n?QVSAntQzE{d3m~scnfNaZ+a{
zkun5{NOO$PG}5XxE>rUo)8nj(<(*T*%Ej0v%HWt%m7Cj+>}9~hwa?>GvmyOkc(AKD
zL5tTJ19vE`{Khqu$Z9&DmK4e9i{K}}!~s!^<5IMp>1qYNukF_~+Jm3)GLJI`+aAtC
zY=f0jQLW&77f$PM`KlOiYbMQk&WYy>PBrnDjTqkVhH&Duo&ABrELAGLhQrG2a7mKY
z;>$Em@SbZw2G^^bu|DlUT9`E4ezq<-UoscHE86GGUaHA43slP+5<iVAnpxQ7oAxpi
znUaAlPdc!GSPk!3?53C(<=}4&Y!*7MUbmu*8;A@&*iQV6=;u9bwJ=b5G^BVTP(ya(
zVeZ;Y<jSwMagG|3pZ--n<sQ8BlzJdy4lX+{mig^u@w65)nNy3qBCr*K6h;0=<FI~L
z-<dm}nK6qi$SqkQZNh-F?pC0M9&Gj<8T=_mWDw8G0K=M%w%BwVv$`KKz6ofwXHnH{
zag1?&_b<aL4od{76_JaUTqj960sb}qaJLh-2bV@&jneAW(cyFJ#r>QC?CT+eNGlhT
z(`)J^Z->!zC+`C4ya&d@C3hspzA%P;Ws0g|mJ!mBDMjB0q+OOjaB;sE+3PqZ>4rTc
z<5frqk}HLw_9;8Flo=Sli8f}qt$<I7)on-iHVQ+BQOiobO^JWm#d+*9yeZWLXM3rl
z25M1Yg40oh+B2OC*(Vt?H1W%bu7^QA)8>~8x02S0H}lIGeI3Z)zjh)d6((>6aKIPq
z2)90L5_&9KlW0B;Z55vW`Drx#>L4Rto1DA&br^}4LGVY;iFjI%pC<FPO(taLHf>|}
zx*?TW{J%Egiq+cRxr**y&J~Cj#X6vGS|sSH4G=sQY<0<DYc#L$v|nLm=}?RC|KLSe
z(bvBCG5}&JOYYT$!|||X2=4F=H^RI}0lPL8hf(K#d0p*q6!+#}y<7kuRRR*SyJkNX
zauR37Yo1@lTRQ=Zb9f)A@-zzmxUjNu(Zcuzeq!O#*B-^;946?E_g-yTS_Ci*Ib?CL
zmI`B{AWxd4gC8244(A0!+HlS>b8%;yW=4il;;f4X<^OO5c0a>y{U$4D%M5_1uvAh#
z)Zn{byu8na>Aemm6^gz4WJ!SAe537*PXo+AplVaBbWR?RWEU9=yXIF?KS(4g@cZBs
zos_p((YA)u-ZQ7>b+H5Xz1*HsyBS5O#Sb<T4^3L#L#uCaI<M7?Osh90U&Cib<1m#)
zxe$32bjH5M%C5txH!qc|n!^|CK&)!z{-v8T&9+p3K_Suf&KXI-M%I8*YF00{cbE6i
zhAbWkkMeE@bTW<?t=0<O%o;*K5PZ?W&JgH%k1N3(m~K5S>ct{Jt5iG?_L`97toe@p
zozOE;ICbP!kgUB&)G=vMt<HKtp@e=?jav>;M+Y?0=YG9CNF_y_=scXZYqb-Y#Hj?h
z{IU2blfLBE0<x1|b&Xf%ih!F+R-;R+y3a9U=^1=SKcu+7P|M@Lj`#){_AM9UOgL*~
z)$G2nQ~61<orI$ArQR4*hW8i(p*}ECXE77Tc&i&{S4@|`mTOqmi9LvsVJARW7i1jE
z($AB_{Hp_hXm7`NnBZ0)8Y%Ly$^$Oa)J<b?EKOU|S7qDfU|-6J!cr^G2=lk4AYC?;
z=8<e(c$Td&o7OwOwc=*3cVV43>{JhGa$eS5|KS`QOuYH2A`x*^!?rMC273VOV-}e1
zuC+Y#qrs<M518hfxsQUFN;A99itn$YGUh|IUJkp$_c6p@<d~DRg=vX8CT6kg7U}6*
zlZ-Fyje67_!n9UP^ER6jd!?pE>u>+rha7!i{H8|fOlBuL-1?gGF(ghJ>Y4AY0az4A
z5{eW%UD5Mlcof8VN}(1#{7>7EozxR;*p}MIHaEyT<(2J-FV5>wTPH1Z+rB498F(PP
zv-<7?Z)?!t(LKo#%@k|ty^(xz2)9IU&u5$Uq3|w#Z&r{*Hk+VrQtFJ9aC5>nA<B*n
z(7dBOFBuM#{;>?w&K>?LLbQ;nk^HQ=NSkuyzF5Wx9O2d){g2BxecIoz!BRKpk`T)l
zTHi4*^uu9UJONLE41W!L$-EDck>G8DHP@u4oK?<F))v&n2i?MHhPK`_Y;J!JFb}6=
z)}ODkPGwUU(GK-yQ2<fwX!bS3cIT{hL*x)iUtR7CLN;)-C7KFizF-w!|A8DAIOf&|
z8MlzylPs<L_UBHpq)|{H<Q(Bptk|kgEcKxrFN2htjG6z^OHC-VF7_}SR)NWehCwtx
zuu{ZS#3dp|{Lig}6u)fdZZ<j2>nQ9^QrskJIUOf#h~x#PBj!t6o~yo-6Fti$b(y4k
zaW}b=FzSVR{li^X^aVQ7kLT^pvsuG>u4nP#`+6ttKwqx4HGHZH7`G>_ez>V!M4ac1
znLf{W-PFzEpyt~jbFe6pDxp~>k47N4DX<mGea$YVxX1WCK0F-~61ZLc;qIir`ry6b
zCv=UH@iC^|>aB_**SMNR-30wQwDNnRovkx2PK7@Lot+1Km+wh`*L}KAqHw>6mPaLe
zOEV^`v|2|ariXzt{JfO}Fhai|6QoZweABHUYhVJ>dayf}`U18N7(z(7Js_b{$t9Y=
z9b*}zas}Idw!0rW`*PC_*qkA&r-Vrqq}_5Xc!L><U#w5jwQwn?y~?yV*&dB;NflqH
zeAX<V%+c9$nE=|4H#Ab0I-%B4ydyBx0aW;RrpkGd&?j60fH2{6{1N{#C%Cj<fc~bs
zs#v&KziOGS#S-%kY-|wLyfwVgFN+Io9iGkmTaK>nogT?nF?!TY>Tj>+pN8NK0X9mK
z$~`}eD@*j11*{0cq%0pe$JlN5Acu4srM9?+&k@}@tGEq0^m35vHT>KI=Mn^_kPrHo
zzyfKQ%INlTj?nl7gjt|*ndgwBQ4hVttV-3Z%?hoEwfuC4%Ukor`|!>SQA(dkcBOZS
zxn%^cWcQxvYnN57v+fon&u1BrK9JOPO$U6W(U^OBZ;L#*RUEPnB3+`*8SYZ#S{ex|
z_f+4(%MGpO(7Bmerk^HBeAPMu+KKYU52iC7#UHK`f%94Ali`blP>a0{O@826B9m5V
zIh0Mi7NBYAuf3^C?e+qJ>=??MamaZHw#0W<mqGflRhy}$wnwyv)nJ)@`WDVuh&m|4
zEP?}>LaNyVa#34nmWVVH6f2}tA(75IZ6y6kTYW;0Xd8KW>qP|M?l*IA%{gF!-h4x9
zx=p*CHlqsV!Tn<QDiE@!ZBy7(YCQa_BB`NaWH4-wB#|2Z+hPN@x$KXw&CC8G>kO$g
zI``Wb^oBXl9MJ`jS#=Edk_an9?_=It+{T4$1qtQ;eJh6lAI+>JY5b%Zi~b4}<iev(
z0wyovmXzKSon`m-N3fEexrcu%hXAPj84dLFtMe|BVn~yt08+&uz~_MWBedQaj?me$
zxNiEMy|^|T5M4V=Sl}q)&bz;R$BkSZSU^BjJ(dB>TV<X^tFo8Aqtw}~E7otSXa=<V
zjl+~3qXM_GTljB{2FQOpP6P_UX(jUe^`FGsHom3lATn2WjjAH4AUG({lGFAdpJK(M
zI-+M<9n@7kdQU1VG995i1*4Kz9(?!PV+9#)4sdtz+M?p>WR$!n-+b@(`22E!Z?L#3
z`fdgtjf6)rX?e#k>Dx8)U9H?W5GgR_*{<Gu?rUDQL2KgVg~`p;7-^DRyP|3&IpwJ$
zJ>9w+gzMXeEv~v8Kmx^FDt^G_tulg|9n__jH}z9?(*F}|eB>6HJ@|My&X8r;+O?ta
z0MESgw|VXJzQv;ZV|R01FX9t)odf_LvVo?uC1*=tCLpq5aZ}NjBc%gF1Md)*G4Ir|
z!UzwLwCfHJ;%Xd6iUTx5;VOvKGbrw+mbT@;&=+?eQl=4!4?Qq2X5pJ5v6%-|rR93q
zpYkG1Q>@38f+@!j^E?op`E3MEF_EOOy63yG4?%O4h7-AJD(8i@aTt?j)Qm}OnX({b
z9*mP9AP8<u58Zh7ni+<^O7s8fqRYE!r8X1Ol8e6U7!1z&<kP{5)U$Y#Yg%?3?QV~g
zblOx$zl$CBY8M;eAZ;Epm0rhKk`0e`L|aC6rtl`e?ZDvYQ~Rw?C7D)r=Zeelr6#p2
zq?~PWUa#p=5}K?7Z)R!0cKgCn1!C7obWfzKzOBw7YpXN4^TSe(D##VoR;S@%ZN-4@
zZJ1J4LkVH<b~q+WV13r_iHKkY*($6?8V>siHi^$SA-g94J2>hRniH!GRi@P)C2GmX
z>+iaf2NQku{9x2$s?-)SU%EN<_S4dR@b&U16Y1E3J&4~WoHHyfj7GhwxtN@i8)(_%
zjbi!8{%t(H{g1|zWfs2qv$6`$imcPNodLSP&XA#JMYG4OhnDEL6KKXPO6}jpq#A{z
zxr0!ej*3nc@Qhj2ptKlws=ib3mU+oyXKXC7jIfN|BgX)7Bntelgc3z4CvU+>!BIO)
zXO3O!&W@t2?@&XA_z;4jtSL(-8lAHhj2x0eGk<#nE>PN1cmDI8nYU!9@2h3|4sTj#
zq)(rw!JiAZ<ZbNV-cj{CrL%VSr&`<L!_OH#@jFPYcvz$un6RLm_U+bD<GQbX`W@)a
z5v5YH<F6m|+cX?mQ%A5<XqyDaSzMjA&Rvj_NI2-zjW-73<4+&J;VlH>mrZ+H-g@2^
zf>~U7V2d4Icz<Rr{ccuA&0JOFhF>Qe7p^j$_fskg4tB?EVfeXryos7`9HTmm!u%8_
zOv1T)8qfsnND}!vxi5mdYWj$_><5ZcxDrfLl}Fj}FeVw|lTkk#Eef9V;Uw9LQRe3T
ztln}sccb>6YkbF<+CeUx3gYNBY=?{IYwoJ%!<<g38erS0n^>e<UzwK3Z&nKw(06t8
zIR!jEN9_`{Qig#J17K?(6w@5WKO~4~1X0GRB5ig(!w(E9SzMDWGAZX%o}g2%gB#14
z7_J+ys-YdONpPP{TXP`ld8q7;$Py%rK6itnt)iAY;A~=D=`cQ(84#u9ze*fg><G=9
za&#;@3{n0VJ6*l1)Tld+jjBgc;&y*W1$9t}jH5n3Kw7~?&J~IK)q=!nwTlT-vU$ku
z2q&2sPPc2xX<hP$LFLEq7l@&&1c4Zl1&y`kTCKZw`H9{9(WjA*;%D5=2|aZ{L8k@J
zeA?1t@4CHEP~zx*j4G4k0f0FxTG5XHF@n_m$uxqAagC870NtTE5G79Jk}lM6oHZXB
z9{Bsdn5h<eAvjDL($dA=Z+nxVe)-+4R66AKW~Xp0-Eozq@r8p?PYJC;8}rVR`i9Af
zw=4y!BVVE&*wo4|33q+U@y(72Ul~tX9vUI&mPyc6&ghhF(u{{P<i_iZH5&T?c%#(=
zajx_jI~+W~2sm`*%zi-24&nd|R>7dlr&^B0@G2G7jpuJ9pFQaYGyX&17L8BdPObu5
z*0aqza~dRxN)o!lfms`o?T}gme$$C;2e_>_+kwW8zh0XwjrT8o@NFj@!g|s~<=DE^
ziaNQI*C^x=^4&tWT!{s`f9pv0zFkL1Tchy0b&5IATi{OU5x5HEyBagynxo57kaZw3
zPckf}3I5YG#bVUDy2DD7w6y8!?f&q7k*UW0C9Zizd65jhLEKS9PFIMh`s|mV2Za`h
z{!I)q^_tnLfUeTO&2n4X`48bpDu>p9{;t)u`?VY!9(Hr!>VC3%?iDU-l4?;$mz0(N
zb;~lq3o@+CfImm&-JcB72gy$UH20FNGoqkcAcH6$PBw+;g10GZksC8EPd}VZ${j>M
zq$0#=>2<D3_Fj}^+ayNQ%#chu^Piov0dJPwYe?&L^FlW;cPfDyC%0UF7*_50M_5!)
zNj4P3lOs4f)g>!|os8Nm?3MiRjxDX<S7(azm#4YQEnl3$-{2Vl0l|Z(=Et5UTSU1j
zlI3pK$UIPYVpTTMR4>^mF*hrR)l{<Je9GZ-5J!gV(Hs6YiS<Hx+tAo)^~0nM8oBcb
z9s6w^HL9jVsFq@G{Z7H`?e^AcX}Z+et-IUWpMb2t%B6Z1wL^O=$K*A6m7=N9%76hT
zUL#$veElEwo3`6MDmQHZMvN;USVb^bj*D$*)gH(-i6IBjU!xmI)_NjOyV|2+lzk=&
z{JeB;DJ1~XW$vA>N75}doF2}zBk5)W<Lrg6PPn$5tc*!`l&$hK+N_3P?3{X4rH3t0
z=3^Kp^>DP&>5{g`f=pMkC~6nuh>{KBC*^sk1uPnU#<#+c;5>n0-M-U~0p=lbZVN|S
z2&~6Bc5(`-m$F<-fiFkD9l4WlR?0?P*5C-xXK+GKAtr#-(71{1`e(6E546mX2#b&{
zHrvr5cOucwQ1<jeGNFG?dSf&aX`TE@pfL`ZZ2k)>f*IH?g>8a(vmVep2UcQvjzQ<}
zx;xixD1|)uNx8sm$yp=qyDTW5btNLxY1b_?nj1N(zuA0t0tvA;qFl`tOw~S5>Pwrw
z*q+Y~%hQSF3>pSn75z^Nt$q!V$3{vh{_#Y{&~PJR?$svaa=Es`=7B5|+9We7O5?U&
zEGTsQj7y5a@!MfdMdwsLhF?))kM4S)G$zG7I){y-&cO~$!pV4%zRfL#2GHyPa;5ZH
zmZ4_3H1?0bo9K(zv6XC+XfIh?Hq|!&S#X&t+*)}~y0S4P0c=VsPyvM%+}zZU3joKl
zb$cMdiMa-SpO%7oT({#y+|sT~*h>T~-2u5$wH#(fQL?Gk053#rvVFF>V7OccN#~A2
z*5alvm!|zufCm@nfyzc!y-8e)WD+XV(nasraJA#CkYa+no?c3vO_=N!H@>U8bj}t8
zCfNwDBKb$5yV|4bRp%u3qk(I;rb2on4hrOF)wmBMZaT5uCrdlGS+Q^Mb3OzQ!&1{Z
zOFDEgoQH){K*Kn_a@bVd-tH$s1s6#H?t+tdPWaK|^yve1(wf;~*Rc;=R>>KHGOoi2
z?@87fZ#)C-IPn-$eh)}dA$s3jTQp=T67Vw2i2b%#eY2py-~;5@xr>=Ie-sUz+{M7E
z5uVNmhI|f&-%3j-B=;K{28)OJkEpl0&I*keYB?dSxXPE=s6R(+)xf*6^iqk*iRXG{
zsP$A(?b(%VKr#lQ-?^0fvM=oAQO0}#HrqZ`;1w7>=9`pl(;)afQvG?w%#0q`#==g&
zrXi6BJt@|m{zI|u@TU6-Ca^CvWSzP9q|oPeX{9AK`WO9|U<{CgFuUjE+Rps*5X4Go
z0B>iUP2IBF;)Py3)9Ub-<ecZ4Im!rBT8-^hG0bxCaFf7*G3V2g4}1HF9ke<wF|0xJ
zjp=~|wCQX6I~vdPxE;k(dS%Wd0(lXJFMxcjzc#Fta!-Q9`@LDIqZdV6gME=`z4vi<
zg7T7f=uGz+PPPFmA?Tia!v%__Vh4Q(nt;Rm9V0)~%`w%ROxU#9@8AtVK+s!6x>T+9
z3~vAK8VRJ-L^w~TEKN`lu4-w9we?JCLcDDgx75ji>G0WF4hoV8yy?-1o`-2?ZpoKY
zv*9N{=T4;;TDBj}Hl?f7-N+E@S0a#=rUr4j>~(=S0RTAL19((}2O0)3Vaav#wmZ8`
zp!~sT6=0$k#@SLi<z}bp7_xczd8GOJ%Pi^adP<B@lH`-b9O!TtCEky&$YNX6jjGi9
zTjoV^0+>d79$&>AzX*Y9RB0jb#Q|vSLeG84p?3fneb3>lO=U4pn29tN-u<KxPuh=b
z)hszVMIC1O99bsP#`pQ*J61T}Cw)+bXP2n;h|HKeY@yjN13K2d2b*})?GT}*7!M@d
z2YvnH`dtgmr)IMv_6ssAy=OfRCWYQ0y*1+dqYYf-?+%D!_E<t05K8BB&q~6GA`Cg>
z<#;>3oHh@;b1$WVz?0mkFd*v5_{{eD<IuJ2cr=dKY*tt@HD@~B)?GjOt!#%bh<887
z;Z^g{iGTZ;tjSGe_yXmh>%`=arhh<yL$!Q<)~}lf#S;?BJ9%p8>y+1Y>y)kh>fFE`
zT{NubcjWg<L4RX`y(*0J)r>OWrPj;1U&_#z^NFK|P7i&wPV*O7lIal8fLhO_-emyo
ziNH1fMyEq68GY?ceHydLXY#o^yF9vqtM$F6Zf5)K*X06H^|x^wOe1)P1*Sk}rB;pD
zc@Hni(WH#S2ax-MN7vlmNB)y_DgJxbO$;$jyxRJe^#DK=mD!=pL0?@~P+8sg#C%8y
z^<-fZ*KyQo++JC#)CTh296mjpa6c)LUfwl|LCp$ayLi1F>y2tm*%0`b2Q|B(D#<uQ
zIRi+LZv!=j5#=@EZ0q_}LeKXBcD&pZX}nV1Mxl)7*<y+8Y<P<1Ln(AeuGy%|1lc*5
z^y(T7{T$q-BZ&TjkGlrw{YiK`c8XflHGq^kO7QWT+?iURH$62(yNi9z<R)2U0!Z5C
zN#T0-F*$=vH$V9&f|B4|ZSV^e8)_Z-rMrO5>YHwcB<Oq5fTeBI5QOAXemmFjPO&HO
z*pq5KCELxY@@348X7Lz;0Q-s{UM|du#Y^9;Q0d*}p)Au+gLm2?)&}}1BA9+hK8cQy
zx9TC2J76e$^=$U*?IHJFGj+X<0OnVgxeB43wSG^E?epY;FrJ(>o7!_A*@s?^$fxIh
zM*X`nz5Y>fDv9cAw%CJ1bN_l|4Fmu`xe)uO_^vXW#IpcM5n;7o?Du=U_brw;m4M9u
z32zmr_K}ResL937;x-h-cC>>C)Zu|ZuVg4|0AGS%&F$LXVfLv9N`8|`4KEVgn86%Q
zs1nE2(GGVjm8>q8s$%s4VP_>d-X0jr@C>xZj|4{n<GUz8CjB(hh5Q;cj(Qkqn7$OJ
z`7n?iPR;4<O5$Z|ds8!{l85yv(O9$`v#gfKE{m)G8f#g!u09(pKbOFw&8=3e6>wG1
zKfy<Rsco+euFDMNGi0VXh1+IRBz_IQ85-G5Mm5?-{mu+uN|HfP-1EHf(A#PCQ$vBa
z8I?7Yj3$u&V=pfLC49;g_`N^!&~8&gy}rME{7M;eqH7un7-+rN1eaHGwd;`ByW_<4
zc6r_bgXkVpHzOd=Pi8#j`H`W1<<jC^M!Cc~3|hF-#M0O02fBb`pQg@?wN|?S8=@F#
zz|#)&75jheK+&`2*iG&h58Gr^ta~Z$+}!(Dgs_vvP?oW>>(edU^ZhKCmd+d@kP^KH
zuI>PA%B6jti)df~wj<@W#xou*&o;tNhSOdBQ|p;yLd8U>$6wz_ZqwNBx?LTRm%nT4
zpOe*AEYRuvrh|TdlX+ruxX}d`Dnwcc(|F5~XZ&7@tRz9|0$8}YWsMn)r32V_1^#zK
z&s*`7JZ%%LO_%p*c8*T~Jb@&@!WBo^68SEv4=GL*>)B*j+=$QJ=Yw_V{sy>rA2%Hy
zM)**zQ`qr7XBsJQ_cYQZQQk1P-^RrNq%ggR{`>|4X(p=Ge^+G*PtNE5lI|1g^`ErX
zQ=CH3yny-r(?|`73y(C9T5CB#xmzi%yHoD~+86!dlobQK|LhWhU7FhURg8j~OKYa(
z%X7f+vYzS+yObl@c)^|uoR=JHER1;h<n#har2YK^dobUp$3$O9>M*4emtcTjOI&n2
zIsKoDH27(eifA(Us#m=Cnfe$|sAd;Q6A|hdz0774%XjgWJ!XGonC!j7S*FzRVitY;
zmO2bCC-mwau(LUJ4UlU(ib<9a#$`0sAyL_G-b@4fB~l~lN5mKk_%s|vP1)Zkei4ne
z)dBKT<(5LZT3;uQZu<0s9Lrn`$9FYyW2fv}w*x15#oNCM(Yu^9a_q?kKOe~zX#dRo
zvvt?==kMB_A<uPscXl-hh)X$%-2dcNcKzhT18sq_@OS0Mz_S|@bTT<Ms~oe9l>9dk
zK4y1cu#EKGXVTyp{21|6*LRG$c@p9H^uJVs(&JkiOGWCVztO#-&`*wFBhV?hd(sd5
z1tKi`AK#?tiwb~B?fCf>8uK2{WlSefL?b%fVl<OYTXCLvZ1in@^<=ALG`xK8iD~cz
zHt4^Ba*L&bHydIdg%LO5_v0yTz54IX<=&#)L1|gM8VXO1L{n{)ax<K<^Z+nPg|5y6
z<>=nf%_M+BVm&NCNVA+w9YS>m=@B@1{YxN~pCI*A1<tYRl#SK?-RZ^z>oCH_rVJ$_
zbGB-Nt^FpnM|NpJl+w+{O*2A2Y5}m&1Rky>uFH7INJ6;TAC7&O+wW3MPEo;BV9ZNX
zw6=3s^n=gK$eUxonT8YqrNr7@>UErkp#6+!b>1h9d-A%#Rk_{b?n*WchWJdINpn6j
z(L=(04cS}IcOgrC)Zs8yyBQh;Wjmn3vHtTtziLBsN51Vh4Pvf@Q~`|3<Teb!{j2ir
zNGfuoH?Gubh3f3=_vw(+>iy*74%E>A?F!G^{ma^-Fhr8H=oto|0XFK;o06dms|Vk$
zjoL*O1{TO@Qv;ZRfbC1ZqxS4eM|pELU)bUd+Mo)3n{29p%#Seq-F2G_d*OJmX#6TJ
zgo^j`C3)`u)D%nity-;IH)N;DD~mtTze)j#_W(4wH_MrSX5@WJ+tQ%)`Z|J;LzY&p
zd0E~UHVl|$9PS{6x2vz#{)i6O@|C*jU}JLDJ@o^-TxEbwXdCa+WT75NtHqo@tJQeK
z?BTjSK)F;TEcT32shAThk39IZp#a;+HCFI*l>+9(LiqUZw*YTbtItjU$trSNjYn2G
zk-Yx)?xEw+-i6#M*-$`+%I)~J^(q(>SL)A*_zwFg^9JAf-KCcaAm(`tA3+mH&J4(i
zMmB};0Z(cb+F4uISOY(VXE6d+W^7r1PxH0g>`U>6{93@FcWfQZZMHVNa^_2NygX2d
zY{bwgy)$1bOk2TAvNdXKU^rm`34Cq1Vh(B*4>5=)_R^IxFn3$1v7=-*DI@PgOVUqQ
zq++VChBPv)MOtSBWSnZNAj4S!?L%(LfYtG7@v<tY3_@J*yGIiSZ0oE>Q`XvvLyHuo
zb?m>={r}t<vPiO?<}YTr;Z6>^kISiuUXP!hMGDtFsqs^0JK)z2JPusLhXWg|IZ|P`
zr(ow$afz$1Jz^gd%E5eR9*W@R08EI^_jz$9t+PEWPN~dNgs1^pIYlmj^_UH4epARH
zs)E<wi^z621|=yty-bX#JXSC_R9tEbtG7Fv6<sIe-prOUsw$=#aDgZ+0r497rxO%g
zj89(F$BW}c=EChMLu8{)NgB*;K?qV5^NCAIaGq^aVcW2mlof_==~RMv62pN4vW@pn
zq*Jgu9kThX>gQk6OIh=c8&rXiG60a$>9(a{24IYNc`W%S?@ihAuQ8+k$t~b1>&E0)
z=pspGZP!xmb;w0c2lmAcT6sqYkxSb20ctO8B9%`7PpnjhGR}0S1%3_M(NGspA`mTZ
zKP>ZpW{YY|LU=Hgg)Whaf4t_3_1Jv;38wQJ$5TM7`UQVUIH#D?Ro0?9%Z9en)&Nj$
zNA`~{kxJMonD{^%Pv}ab1$a=P9g`GLd<arCovV%x(h&p6-J^4Al<U7&Akr^X;y@xX
zW52H6B^d&<jPjWFX*qyn>nYi$(VZFg67bFh`BBSTE#sP1@ck15AZY;Y9%fm%9C9Yk
zL-BNQ!F+>rP1W(6t(MJ>qx0pTI*886wiHFS0cj%+Q-R!@?e~DjOjXM%>qRy*r^+6z
zs^4vv!+KU`uon7+K`!##o>5X}J>m*npoC~a90`h9&YJcWuW{ZK!&EB8loB7;Uu|Ja
zzK!gaeu++OXH8aQf<t+HV6>=npUm*}0AU;InnA1n(P(a~aA??NTET;LM^kcx1p6b=
zEV1)cl#ADoWDJVI__Anpy_<Yd-aSCuadx=%pniE+7fWsBMyK>kyL;1l5PnUDLRgGt
zDdf*6qSC7lE?(pCJYUZ3YyRG$4^aEd&zf**nq5F|Bn%6tb&2|Lb|*ej_GozCM^6@u
zpD~mXl8|@{)a&kP0J|sUFYssLzrQb79KXf%lUn`@$d%u|qlCA(+jmNQoO;E5nNpQn
z9k?!$g&zXeyi=*PyEnI-DU9K95_wfhrSO(cjaKdR2-zwJx4hJEM?-X{$h~8&Q&Yf7
zf3>vY{npH5?YyMcn=HE{d_jFi47VxKxt-C-tK$-Ih0Mno^2<$K0iGlCYhEY0&twW4
zes~+ys(X#t1{LlP%wEX*CVDC^y(1bqD<vgxa*76~mWF<xCMlSv^ji3Y9rV`TZiBB@
zBnq^vjBsJ9^)Ioa0qSm=ZxqaMQCE@LIO<^RWTx9XI#8VKD&VD(Jqnnl4mQKTaowmu
z$L7_zRxVZ{CI10dfg$i7Lx6q$@(l!XcfVAHu)#*LW4fTLd(3)XBKQI7;dU=y{%nIn
zA9DMK#E8-rD3zKAtkWj%n^%%F_`BR7eDKF8Y|+wRqN!hI`nhQ0wdtMa>#*hWljD>!
z6;UNLC<xHGqC0UAs4%{K*CmX-WuB^B7OxYs@wK%yC|o?ZC^!~%sf4%&P4V#45B>T8
zppr_Mm%p_{`yrP%fcGPi4U}PMg2(<nI-VLfP}Jgk-LP<;?1rg|@v2SdEvPX41ZBI=
zFScu@9iRnS)FJ#sDJDd?$7Se^Xi(UhE?8NzOEO{i;!YB)bo`0)6m(nZQ1`;E4IG6m
zaL@c9)i_2Xe23R%L=4TOxqJHur5)b^(!Y4$@7LQg@;5PFS5Q|NuS3eS_7_>*G62w(
z)^?FS21|iU_{hU%wjkkGx~=NJacIt$vkdwhiDFuvue<fzcqg@e-R)oVF)@IZnK4v+
zFHS0pq)`La^q$0MSHslDC!m5-f3%n+!Gf)1!Z>EisS;-BQhklBgJ=#&w8|5v>BtPR
zN3RTY+9dFfv2VSfaYV<hkz*b-!K|kqHF(%^=}^EjfSH~G%;0Rz@%l<hEsqf^0mNR1
zwx;=I_a{ysGODU{hbF0#<$VY9==33)4E9<Y^?%K#P+g7rZ<Z)z5?WF=aEDAbwFs|e
z3}PDH>eO2(E4OOAXtwQ(b%k>Uc$T>X&Qkz-ovD_}uiQ5_M>o3$3XT)+F~zVuMUv85
zO=cJQ29u+WlHf{xh+p*CpL)H$A`b$0FKLE>vwqf)8C?%>Xa)N{z@IvVGR0omY7Us%
z<eZpF!hgYhYR!N8Z|Dc)u2p>U#8xuq?OlMROYdgs-}3oK_ZVduArkJZ@}i~KJ4x(h
zaQu<{8YLg?ByqB>!jGf0vCU@tKSB!W;6$Loc@5$_9j;rB3Lr_eyL|)a;QPEK-7wM&
zGlwl#fE-{=k2E0g`s>v0(*lQLRE$p77X<Sg&7S&`uwH!_EQM&3(zZEi$4G*XMg%5W
zZBd;=h<t5&-eV6L?*g_4A6F>lT>jW@?eogd<Ct4tfPIO)(S(?6x}hYxN|$DK=lTxd
ze=(W$)92?wX8-1V4PdHrB>M>~>HA2-?1<5N!4DPgI@j;*^?pm#R&i)8HhLx8>o955
z#yag!%}}16IR$RPD}`>+{|mkk<nh%T9`l{V(>o&Ex3pxawqDc?ufwg7*4GgS4hNCh
zA{HC!cj7tK1xj~nKRY|r-Z5Ex!~Ky*;MA7S)Xd}Vm*2q3S37k3Cim%pBIEY7ON@B4
zxTV@_^(J-O>?9=lq1uSJT&Ilp$*_6BFsBBq@{sVcq*Vdpxu*(`2@-=~Z=>F@R_d|G
zNg%NNy9(WFdEO%35*MTqWQ<K2#DinjPFjaMczn=ksrSzB$YvtzCls8S4o6V7^R86F
z7VdLIx@q1hYSR%RXDY1;e%93wl#TUcORQ-IU-93#@s_fhHj>JKj>)lt*i1ATRtk9i
zW<J0Z;z&d^g9fvxz-{M*HPw^fuLFiv=Js563i9UqD<Z+O8AdM#>D_fuSP`@vZ+bXC
z85ExUHa{!+V-P1q*jTX<08XAR6Bz+~RM+=)Fx&J&sZgycM>R;Qd*R8^KibK^vhA@z
zBfmZF$PReN5201f<kEVImsI`*10<Q2Mq+xRdI9s6WpbGM$sk`&;e5W94z9q}>`mM2
z%%{QIZxR3t%%f6-zh$`nC!F`t!LtjG&b>yqs_(<J`g=6^R+$RR9&8mq%-Qo{oG~FW
zUgGtnt|7L9>lpWug1i(PYndVw{;s<s!<DIF-y7#H;K+qUV>Q&RF^pG)0zI5T#gDC}
z^j{kcOMNO(HqZA<+{$Q_7U569@1DAvhV<40fIBE5>L&@Sf=6w;<aal<W8j>iYz?Ya
zK=$;Vp~t;Zhosts-yLRIrc>}m9Ica2W0Va=>76s+rRt@#3%6EF0_NR)-<kpzlifd~
z+irffo@`*vES)e4Ln<wnW${{A<LUW`Z({QE^^RSLdDvc<W1~y?097D0C&Oa<``1YF
z#iByxL6>15Sh%TPI8cp7j>?F!?7S|%|8owvi;YDk7bB4;a8O(^Q>r!mRtG~$OXFkX
zTW34xox{vJ-ZMd<jSLoC6C=(0JKFxw#zMF-=1VYhKrz$z%zVh4;n6<F_?Q6&K(v6E
zHb3nAh}E;%NzE{FyF2bRYZuj%zz6zi#+DQsEi7|lxoK@0o&cTo1)79j2LB5KvBpF^
z-ClT{FK2)QH1h^g&KJ{+R^n}7k;m|B?J}&MoTL!pw^z5{VWUpQGkS5v=Lgo-tKVEZ
zzNwTY<Z?Oz@m;uN)RB3)M8S|`&aw8r{rGUkBN>M3wyNEdtaFv*=WV`hQcI(G?)f_a
zIn`47wKMqe;QU2ZTkdayE77-t{WL)75Ti*xPDM~COFF}1$zaI9zRj!X03D?L#+^8V
zmNjSXhcpm^#x0@Urch=dzWZ7*>udV73r$s&B%*Gbr+enFx8G?TfJQQ3OStfh%k6pY
zL5ef7{21YTNqMa91YOU}eJXu>9o6=67h<z}^ybn6_J#tbP*!rKyexXLElMSu8y!UA
ze3SCAXJOpcMvb+0Q=HGPuccgWn#)n!j3x_M0r<5Ka<%`^1@yqR_$FKt8C=x%aFgt5
z$AHeHeV4_@=~%kacE#(=t&D%JLv}hnn2xn*UwKR(i)!2oH)2Faf;z81!}1v_)4aq&
zN>qN;;|?n;7MF$8sB5p$Vlb(M{!tmPOEMEp<y-ChuqU9wFht2>u4JZS1jO?|CzEUz
zcvZ{c{8s8r6yQ`>-}CN3euJJ@U4HU#3R1?K@{%$tJdyY#{_OYNQ{x8LTE#EnYvT7;
zqDgKWIEYH2Fb&Mp+Pkr**4q(=47MoS>+?}-Pu!`^o5XoF82DcVI8a@R-G)}s-dH*^
zCPa^Ikp^AIJWxAMmNZ^0W#Q#)*}4{p!p4f%XvuD3ffIPz(-PL8=PZJyaZQ;&svK0I
zST%Brm)n^zt_lFDl!gnrx!9(JHksO@`t}K)H*>-G>5ZDe!_oA(2a3ei{Wp-8Tg<SV
zmEQEdu*QE8;a(~7QRSm*AaSx_HUiXwt*`!@^)s?Rmtoe#elR14qQj2nL7B9#cS;SV
zy4&;#k$H(EoF_(DZP6Kx##VG|#Opz|8A3i-`yA=Qq8|ZUR+{pB4%+awEu}gR&@4%W
zQGsTNCwwg^Bnu5#KzTc6?T4q-*882sGLme|%5y#w;R(Qg@MIuhD^O_Sua*ipc;LT|
z8<Ql(?IlI-erx_lbC@5AzN&BRo8A-Z+8YMEZP!|cgj=smcktI~k?>Qo!=$m3VNx4J
z6lbR<o&c+x^|T_Oie5R%%_K{;#l=L&WTZKMyP`n`7Zp`Mx3Bpm;N$4pBnfV;VDYc)
zF9nsL+}F?sJ=e~7y`0nJ(4t*HBd*Mx7bNu~U1*WyEmPxf-d~RqG|bK~ZKZ9PC8_4N
z^@}CRdJ#?KfiuhSDAPi4`Jz~#%W3GBA&fRNYr&0wgVt=Cqn~;SDGD%K`JNrj_mj2X
z2d+N(8TJ#>0$`UxPrjo;CcC6n;H>qq;;K=e$>ZcSKsq*n;5ac!8KH2iS04F%m;h?8
z@#Hv~DxgMv*&v1O*SuKkAa3XlGW{c&X!Ir}66l$Dsr+h_z5O?A-UDG1RqH%R`GO=p
zQ8L$@2-pP1qQ$@89P(6^PN02Ln9uB|Q*}^s0!-loq|2yw=2~;ks&IQJYle4-BR`<g
zmzZfjGH*l${mgc+q209H!e5iDU;oy{Z|*>xCC*xsr;VF7p1ngwjH}T`;wtzZIHNLg
zvm-Yh`I6fC`C%$~Zl6IAo&!9rf=;7EO-flrlg@Ygy`E6{l44Fcm{xU(JQ^Te*;^k4
zG-}Djb~Q5yo&lp6r1}obZb^?BEsMU>ndWEbe4zk6L4LtyZ@a+1^q|b3E*Idd%M!W&
z03S&4VLcw2E}c@{Yv~h;d~PwGcGoI)+rHdB20UY^p6toC{%Id0{I~*~Bf^qvck({e
zA=7{!51*+w8LCO*MSf4f8<2kSJ}iNfYeaNye$a-#bQ^QFDS*O8_=rKDi^~7&>>w6)
zz(y7AG-3AHhEaOa3CChq#xPc5sQ;8>vxuW^NW=SLl^m?d$|LS~>jKXfdYN<xFV4`=
z^si}WNuTg2p_#sc#_P}N7=?E+u85X^+12bC-)N$>HBbfiaUHNEUVA-!5@TWRzIrar
zYSc3ev53Iu)~8fBciHy2BUS2E4>(x$eji!&6b(Je|2-Pa(W6;81bwsGhs-SoK?SqF
zj{rRY?x$+`bQXyrJs*9siiXH{&XKY5bU1IvH1yp3{iypyq4Xt=WODF+4J;T-bj<!{
zD1pg%`kItpb|jw^D9?i2RkP*>rwXo{oqEAyEC+t+5%UppC+so7yNIx_gPcUBNt@j@
zdwqZw5f2h^?R_x<cVMOMy(T#8ynEg_>x`jz5zmi}^IA+y9D#tA6&{BwgSzuM5;b~!
zAe@+(&_!gJ?DOXY2hLEBhx5WqSY8q*Ro=eksO3sZ0#*9xE$6<}<k=#-+zELbb-)j}
zu0Pc1*3_`Eh8C#SiYu`!Hq;`BV^jgMM_?+ksW%F5#)YJ!*Wv+Xgv|fhAU$KO9cpWb
z_k^H-o?LprTC85=V_1SWX{6qhZzKx;L7;_)?Whzs{xiaM)#FDECBfUZ&&(?B`aflc
z{)p@+A6i4cplt71CcbOy8X&pZ(>nF-TdZ?#qv~ENMu}nCc)dIt6@hk=LKE;3b0)}Y
zwl&1_;W{B}wCe~f*l57%U??a&BlNaA!&hZAKiiJqmax|&9=E{Z*$1!^uwPQ?yxJ&(
zjtV@A@HjV2b261hlt;(_7<g;*x2fUiApkEYFVRdT=n?3=?>obydY#z7n{RVyJ#$MM
zJ~}WSsxG-nKen1Bal~KfBMeEyVa1OA5mPON-TSe+Amx|qFHXwy&+G3_?>2=UDe&Jm
zpWS)5cxh{w2!j%;Kkee!=9|oePdkEzjXDduehi<2**>Z9CDww?KeDCbZD?&f2+tij
z>FF38zktz9A(n^!NV?8VCz*+$5G1YrsWMotoVhAAAKcEMN%_7HjbKh8iCqB3hGedk
z;?zh7?$xq5ZZxdDo}y#C*Hpe%(fbg72wsAbWe@Adzv%TfZxicBm0}auUK!F7z~@7$
zniL+<^*+nhaYuO>F6Nx8n6eMTo(*e)sw2T#sV(6@Ox}4?D&fMR+%7@&7#qto^EgPl
zf^N3I2}kr@A;**_kL$Tesd&6D(%^+VUsjJ7LSdU#(p%c6a`qZ3T&}egA0VxkHBXps
zxWUbBtmt}nL*0BpWOOX&=Dr8taQV<~sg8W)F~$0P3xW=Z0%~sL+F+K&0#(qfUUNH!
zxq9jxLs4$S!q%2MQEKxQ6g<J97U^-Y`|aKecKDezb;dnswXZ7F>gu9Xhnt*>jgbTx
z7sKuhFMs&mmrJ~KpGiEr+iY#_+fn(m(lk>ICVKVum!YlZJ7%I)cgr1mi+KJMNM&=h
z6!phcubu1)04Ud+IKFTT3H5#ODG&F`@Qxa&#bDn)M4_b00DGy&q0np;K6o1CY=!gQ
ze!W=vvl1&P4V6yqWI(o2c!3@4XQ@K%a;-?6tGKuM<Hb=spH>SGM~?2iay(5TzfBDD
zpuQFbDjpNvw<(JRF(=vS0yQXcSdeotxQ0i8Q*(Dk&ht1Yc06~!yVYxy*5#&Pra0dH
z%hgJNc3dUYCiC;e`t}I`+^2|+RO$?vyA~G*pYFGKcI)Ew*rTq%RfQ<j)&e-mCMb>1
zd9a4I_a{}0Fa8i$mS~bg!kKlb*CllC(zZ&?GL6MrKi^{}(U75=HAe=8rxh3^IuhI+
zm4`ZH7-{9XpmE=giQ2HK;tvy=uh)a2`zvL-6)CY56Ydj1RCAYS4~QgMlvo;rxwCaY
z4t~uMZx1=472~O$7fWA!Lmx^J{rR;6H3org<0sGh<sf52A1?RhqN{;cm5Ud3j9x>l
zh0#RN`4(yO-1P!0i@z`*lUy=R5r-f1HWJ}WqVLomRx`!4kL3fzuSOu8Uh=Ef^*`hc
z6zjQ8RmYr9_Cd{p8zt`26xN&D<LcbO;TFaAKRDROGgD(jPLmT<-wuD})r5OyzwgrG
z_%-+3%V*BfcUmjJj5Bs|(j9~OYnEz18$xQ5J5^nJ_X}scG0p@FwMsFErXjxL?`tKM
z#JhK3#@$(a*=%_fpNe?3mxla9f+cs~oddVD;yI??x(i?CgFA;Zt9EB%rDs5>=kWlI
zO<lc2iw+f+QB63-HrhE}WGD|E(#GEazFd1iCo@Q~W+1D&)c2U*{~o2lw{O{@29=0y
z&KQyUvRG{Sf#6EWehU*quyC_8GSZrWxc`$*TbI69t7<6i9ovZGQRb|h6bYU5er>jv
zco>Oov@*qLIRbDrj6X$%%}lj~M|Q4R3qsc0)eh2Xxib5T)=5X!S_Re|-jNHHTx+va
zUa?wt;D~{OnQw-Wln0>Ov*)~<P^L+=og6(}<9fy|1>-dz4JY9pcoXyp0L!u$ZC&U6
z%G$NLA@%(0zrE*s9neoQzP#pZp$G8eF>{;Bcqqxl<@Tm%znS#+RIi7%Kf<3w2xf#p
z^!{(AjWWK5?Wpa|Z#Eq?hS)$a;-S537PUM!clhK6qlHwN`T>=9Eti6k30q7fg`vnE
z!^|tu#WDU3U?nuaLm|J@k=k2$biUuunjXGCpK~m^apsKiJSnkLQ%xs4q~m>xt_G$5
zUv#~^k<37P^Q&)cc831TTYU(N-#oIB1Th{Nb~6qp>2pj{pZD?^ifwM1>6*@w=9LFo
z#F^YWFDY3S7}bUEhir+lsHZ%WdL=`|CWbipnHtw=eWo#ap8k-U{Kctx%OA~kU+xX*
z>5(^(Y4k7n@Q5*cH||SD#X1Px{V>UI@J}BhDxplxyr_db#XZ(cMcK@`VYIU-p*QcD
zSC89k3BEYX#N-WqmVHxTvK0LcITH8?DUm7$!uW>JJNJ|~l60MN3>jLO5B6=#c-UO1
zu>;8BNsLff(l-$svXW68hc)So6muGzY-Gn<9G3~6{`&p1%*(J@4IW&Dvz(8t(5)BN
z`%o+ezGY+=yUxu@vt7aw0e*6!7f+u^)aNMO?Pt{3O`g=)Ku&Um^CDLiLo)PAyjJ&<
zNzDB|Kgx<@Wo9N)7f8Bd`}EH}L&jEm;eRvi@q4+c*m;@BDNTBgfE{NbAqp>za6d)D
zs9!j0HcezW&ke2S7Z&1VTJj7-lvfD_ZS3yUhWesx+rn1-(``ZVc^3Z+|MKiJRRI7y
zjRId{e7U&i^Ehb8vjN*Cn&<&N*4}jG9wx4cn1Anz>C>Z)`p-uzglxzk`E;ZyxN62;
zU{o8<t?yT>@5h8MsCW!<>bATEdUjI(JcSHHWb8Qmv<AlQ-Q+syPD+Ls34y<E9N6;0
z6ZkLYI^Dqci0E;d5n)aj+x-|X#3_LLJDe4TQVamrh?`JlD_8ZvR%buIOhrj>fi8#Z
zU{c#B9I0OJPY*al5y`M+vV>5BtG~N(wr0eRKHd8v$8qS)5ci~`L1q2V&j=^5Ho$1q
z{puiNkxu+~-95+bi+kq3YUqm{tS5jSOoQFj;3I%Zt@y&qmM!#`T2<h5iKn$Q&vgD`
z-$AT$Z#@ODR-cxu2!*0*tDAWqZ5kqvDhUaTb`KxFK5%fE>((1#)t&j4<f(jhiVfb!
zZHsi7oWd=xl|TI?e=i4PyhB0i@%A8obNKC|pD=T>rmOeEbsoF@xVn0oRvt-i`rpU$
z<JUsm>Beur$BpdESp)Alhc$!Pb`1VB<N3Yc-bCbjO}YRze~H}8b`|z`C0aPmXCQEW
z#zuwy_f7yegH+?`F(E7eM+6EXH{bSXv+$;Tro->oX>k#KBAlU|jX-Svy%&-cim|P3
zAYGV#qqes`I#I5-wl~CKZNu<OqyByF$>gY@$Ni8AFGNUbAdeT{EUKaTEuZ1?>zD4e
zHc(+)COx}{F0a2)iT{FG@O}@{%YRG3jQ<kuH((EYHy2L$-K;uyxGXv>nG<j5o;CBI
z)$cF-O~m2IF-vjp<p0Da5ZQV=vWcw6iPf=frw6was{__t??GX&F#cWrv_4r^!@Fax
zVM|jrepLbnxfXumGfF?x<8E&-kl9sIX^0=v-uYxf6k>kXoOaz^%y3v9a??L9eRjl1
zY%}a1f%A2henGBiimY0!sQwX+@IB(Ya_>JLy4CAA+wN;bC+8s84}pN^|1Min`lkTR
z{?7o-fFFpZCBvbM$FUaiwKaCX4xWB`-{bs&GSB}T*uNDrsKKX(IO_w0$uc1_Owpnk
z+?p3KZ^3!zI;iQao=b(r@4LHGrYELjUr0<|f0xuG{N}sulVl;Kp}cE3zDE^T;D8z_
z=mLjnS<6MW`RKjIOc{)NSAP-mh-`uK^zV_r_eq)_jUFK?i(h;2D%Q)JcO3QZOINq(
zek@Mxe(Le?L%eQ6xlhjKke>#g;-RVS|8-e>PnT8vAD8t{M*3fWBFH^Gv9+K7{fYgP
z9sZY}=lC7$|HT3TvKRZ)H%CN>R15})u=pE;Kw}brQ{n&m#pH@(@YL9df&wVrj3g-C
z*ul^xA(Fqz`hWRi;8#MzSQ(1%?ymknxzPW6asShU{J&4`|9^@8-(~qftd##($>smX
z-2ZSV|A%ZD8PMwPY&Fnl<d+&doLHw=+HmmFLXdED+2fFcqfjj>0gpZk=KaW@O#M}U
z2;OS8kdlzInbE-OUapwM9w-R+fCHyoQefcAmRLpuwwWse0%UAjpJ<BULExCVCY$-2
zkD1FaCiUQv_Cn3hLPjH^D$S&M6v|@H^=?LP1iCj|KIS@9$grkiTHq!W#H2YhR_uq>
zWrO`ffEw;3L`doGBc<NO`Ye{I)!&jm+p)K3Be#_39k%P`Hq+1EQ0I$n8rc_Y`tI_<
zc)Y_>o>ekBgGm~*ytilnlm*$C8Hy<bolC&03G?4#!tD=l9axXxqECp*4A{)asN3@J
z+$!<w@fgrO6*?~SW_Z`9qk=gWWgZ)e6<ApxJC9i2<SVv@hI&~+?$$^i%S}=^O~Rd;
zAL1d#cy5Qo&KFf5zXN;l7;Gjrj@o*HH^|uUeE{`<o;pMF2Sk!PCf;iR>RO>%;tVER
zMw!(8=VnOn-t(>=b*AKLRO*Il`md%&6~M7Y@aM>+(x^}htYsfTF9jmC&l&$8w%)=o
z%C_qoRzW}-1wk5%knToWV5GZ42I=mW5=26}ySp2tWd?>Gx|^Y4K>9touKW4!=X-ze
zUobQ09LGM_UVE*z?fwP6mt;v!Gci;OQAH1M^KruO5t<9R95iGaiuZxHqExsCWTv2i
z^;xT+=dV<+v1jtDEbXN~0hSj&QxNh`yF>i|YgH*XDT9m?FoKLRdu?p~h#Sm{9moHK
znr5_JxE!4QU}=v%QQPIaKC?1-5@X;d3yF0xQwOrB?_)Tisxef)H}vs=mEH4HCJ!48
zmQmU$XuPMt)0$3vb*+!NPrAvAdggR6BHz3)O~3IH;N{eSM9egYaDlg#LJ$AH)0puP
z?2nV@`lN1!Xcn)=x4EsG?3<sU=DitV1-gq8!PE6MhutFD8G_rt-I2-#cR@|k5E9^j
zKlufG^;R!NKH6eBj9zp~H$NdiyA1EU-ISj2ZQL|lSQ5^gf1U~pfN|Rj8~cIRI^(~6
zlQ`wo>dUYtZ<DgUW<)tG?GD&X;UIe)2DDmp3BSACSq7f<-wSMHBVpDIw(UrH2-{w&
z(v6e3-QCQ&J;neK$}6Ewa{5SM@bl|~y9L)p293JbLB6BCM&k8|bnjGe5B3+0&DL^!
z+nFf)evVtrvCb9NgI;5}xT6)WcuhCeVEQ7rzoXIY%bi*D{b956G{Plbo@g_%ok<5q
zW{f#G-??U3mtG}-A!e6H0zs=@ZkS2qim@HhN|5xy+<JxYr?4{GcQ8h<fz@1n!xzXz
z5}(1}{W42bj{X%xz1=_+=q5Ssn?DLqX1v5tPvsMft)3D7QcRW5$t!F}krbr^x3SJO
zG_wxNWeck$zD?YvkOY7ltNVY^5^(<;gI14Cq-B6L9jO9oLaw4POG<(0(HBXNNF{`9
zI!5^pp)4K09O4lC*UbgP3$B0S5_lT$Ztwc39LCHK94ESWd|VO{oXWR^VJhxlYA(*}
zHB2uSTxt}&uV%LL`t@$BL%}WSjzARepOfC2R7>NRzVnv3{Lx#{1^5|ilq)qczdpZ8
z-Jx{pW9JXkjKMigi#E^qipT4y5oe`J7u)0{+_3!;TTRPRwEx1mbDsWz<C`J&+*-KE
zJD>UK*v=ZXno95zgbF+Xtj*2D5k*u?89MpwGG)~z08wUDi=b=}_`ludaCh<q$v(z^
zfPGQ_g?;~?kE)l<U?pSg`Cd8w=qe!3*Z1bwjB@c37V}nct?wr+?jdx9(%mceQ2S>j
z9tAZ?D7thO@5K#ph+TsZJL(oga}@)P-!{5cjpte;KA^rnHtCjz&e?V#=B1U8gu6A6
zf~{!aN7CO4<P^S=EFB2Gg#F=E5r&2=(GzZUt6(GqXJ7pcS3VDX6X#XP1>G9R3ZXPM
z_%3FD()weTsQNPaB^R2&_3eNETEZ~bbDox?1Ch`x(29~_nCsgI^n3<%tN-B({{3C2
zM=z6dqfpOgmI=ee#jr4>vUnfKf6u5a9|_hV7NEhBp>uiO7UTA}bk%+2;Y^mda)c!-
z^(0#*9)^QBHfp^7ris}L3kIbL-~b2Gi>B_f&a@hcRG%HlQcPu0$g>-Z9^$FBJBXmi
z5zkZ%T+N+jkVH}dkNEus2S}LUQ?_u7!bN}Wy2!(~8~*-ZY`>lrDP~V897_?KJ2OuE
zXQv>|*Z}yb13Z5*dmC)FwXd5K$MSCp!zc*dw^nMxwxYkNpqVwF!00Tb2rR3O+Bw*V
zVuw#wTrqnuj|g23I3?&kPl6_Nbkw1go_j{LA!7FJf^l6k(%efUT}=Y{oY?+i1Yt22
zC4`f%zy(O0A7;Ijpa!0u@B-ENuls*mh&TW1QdAx$nne6!&y$@7D*(;7nbwyipT$ah
z$7QusH9FxESxI_(FdN@qrMT&MK2!ZGL`D1E`y+k!+s3VQPuaBD$&E7=g_nOd0A3NQ
zQ5p~U-8w)82O~?aOWv+?v91HpdpAbJapN_ntfK%C7Bo`ij?l6>o+as>G=+O0g&DUP
z+nA%&PO*G4Zq=A}NuQR(i3}}7LET6993rcAKl>hdJ#FXzi7~ER^0}5>;OENidDXif
zfOr4ql$aUF5x<&l3egpm!R);kJ|`(sttusVJX3;$qP*AZa4Mi<rXSW*Y&)Ru2F{xb
zv<{_#Qoh$Hay8r!s2ruVEI0T>G^)h3ioV<$Ny(-jssaSK>BJEY%+!%6tcv;ds^CGR
ziD^Ku<;tpQJ9s+n$HB*8qY#SM09FXyxb5U%P&)zf%^Ld&o?Ibx_FL13TDF7UmYX?`
z$<Th98GE-rp(6haU|}S=ZD-z>OqIq|bX>v_)m7v_YOH2_?{7=lD~f@YN}~>mrjS!6
z==$I6-ikjVRJXLM+BNh69FnC!l7p0`wjgZ(REqsx&heU`r>+we!?nA*!1D6kwzHmM
zwF(F(;t<%F1ifUphi^p)uG$rS^}dGDxiotnZ)mW)E<SNTyv5t+T%F@G>%)@wux|w~
zNWpxV(|Mtxx?@=xKWw%0FgHs1?~5LWxH`!7jR$hhBdYWUsKm@%B^jnuOzNe&Zypq^
z05)3SVUC^4lT9^Bn0o*LgDD-n@lM;s^UhOxPlt&E9s@fDB`yJB)|b0)@3NrkLd>x&
zY7B7=vn0Ky2|&MpXgj&9VWRcEpV1S>sPg$i+_`mPMkunNzq-+K*q#8;t<N!P1ZH<O
zwA!(HTlVWqCMr)hWoXG+q_r>a<w~$W&Kbw36%5n~2e_>8AuVRCw?#@_ASt%()(t|p
zyOZem2<jrel4POZ=W7bWHFNWGCP~q}(DAm5MLC9emJhu@GQd+>M>jk+vsMk0U7Jv=
z_AH|{sYa_S?(7~ajp;&b?C<eF97FXKx^Fkc5+KUs6hy8C%h#=@+(21>)7x)NC$`Pf
zI8}>uMMpxSEi>fH4}Ep5iMIOg&U=n=dybitcObQR=|qsYXl1x7GAiKy9Wc9&>s7!1
zReUj&eBMeZaH~q2ET>&thX{iCKf=56tHjo`M|fdNh*27}9B>u1zqGR`6?w<!$2wIn
zJMuFdFVkgc_W>ykG^mrgLE${6o!Rf&k%SZ7BW8Xl&#iAH)v2V*Z}UZWx^3+*O8TPB
zeiaVW;o8H+)ly}wb0*eKtGr_f6ZQ#M0HP1_U!sqO#$XK#7UOeqhW}kZzne4(z!*XE
z@LS3j0^>VMNjj+<w}Efw)fbDN0;7VgM@H^e(_hW*?|fWkPr;w}Zbiy08*JtV%ANQh
z-<@x-2;Z;D6{#Z0uM-}a7~K82Kf<$I6HVLrU&l&K4f{uKW@6R>CuWU;sM+M?eha3s
zU!?Gv-$a>?ip!EU4^di;-s!GK(;mb!HLU6?>%OfmcSe%9P_N|_>)6y`8zY(9z4V3E
z0rbauGQ!60yxZeQ@UZ=q+uT^lU_M}n+U}yoH%bs0E`S)r4v-J04Hj7^mzr)lXj+=d
zxam@H*`kEUt8-vZM1l*j_%SUf%-=q&L&ALR5wxcx=f|Mdo}XDIcyiqN1UFyYhg|rC
zUI0k&(7%>p<=r2IoY%DH>6kU0@0KW^ppLoT(3`gYdVZ-1fXVjjy*F(hi?6pbT<f=5
zB2e#cpe$oqr$gz7%|0k3_Dyq3hg}px*MAz1S!O9JBZVgnB80C#2^H?&Lv{mg9EXtf
zY0^K*(r7Q{ol|a3Gtl#cLVnx1LoHDR62|4LaWiAe?|~ZnGg9c{CL~k2T!2FXmV8>R
zJGBF*{jOi0*_|hgbli8{8i*Fp^QeQ!^ST{*UZi`Q_N)b@uHjQMq&wHwP_6sBzfpU+
zYf1tey|nRMW8!NtavUx^v)kp%jOJOb5_K`lb61|Y*aG?tVBI}anbU!(lxamq_}|v~
z-=dL_k$x$U+jVj%Qj3p3D_wr7E{0p9E-Iib0+Xe|c`jw_Vi8@a<DLFWH~EhoE2XKX
ze7z6mQ=6E4^Q6=38>~lYO9PMba6e!3O|kPbiLHI4i5+DaXtGnaH?$1ndIz2S^osD;
zhg069UDHPpo>&nhe%JR3Ub8Q^>^gikFH5w`(4qyBA{)?#=I06u7Lv?-?g?1t`!l>4
zi1i%eyl##Qd?}9pRwT4|XeC;D%Xbj=L@&14G@!v!GpXut3sXQT!qNv+f1?-;1fiEg
zxLLdj4r2FG)Jg$Vl<&n$MOZ>?7fL>CK}E{m5icwH+Q4rZv@T}*YL~b74gd~&`7#OD
z9b+jKTHeTSx16Z2kuGG`UVC_^;boHU#>un@tVWY7U~b6Q#iSVISr}2$)}006o)n@`
zQyjKk_}A9#w(GAZr5^^gM=v{EGwJ1iMto4-wP0YQ(`nFJ3OT1}(F(W~Rt^zrDA0W3
znBmzxhcZWvpMr}_t)Fr_{$dl1oa2F}$H=qT;{EoziGEx^Vh!Jj_Q7y;(-#d;A3g8-
z{c!`LR{Vn3&tko@Q@OzfM}Rk7G6#zV*p<BUX!rUP?XIS$whzZ=j0yp@gt17|la4m$
zpD$Qe1y&}iljNV>P@oV;Z7J{{|E=|)k(baz3m`3T+-?5tQDC4Ibgn<1|8wkwWHs$%
z47B4gP9cA#m_ceYIa;hyW`)OT=Tj+&uUWqD79;dsRD`nkFrkkZs?v&8*r8F621-O)
z<r29c_YREbx^_HHzhs}X{YpaFbY_iBIju1wrBtqQi2h}8e7I<#*7|`JZdaelOf{g;
z^yS`d`+dDO)u-r9#-MMdwA7ZbC+Gj_%lL{8w+UQuXCBFYS`dDXC*)SaX`#9FEabY^
z`<m~2iZr=T;^}D+aRbPFjZZ|AGWKGQyUc0!XNh`6oE)?57AjlN>YV3UeAV#h+QT}N
zkb13)okFbjle_*Ib)}t7?s8Y^DOV*06-^P;_7;zME94ZHJmOlE+(7fzfug*l_v+jw
z?xB+(4JHWdyoRT=xWOk?=Ob~b(%7SZH+_7P{x)#6ahAbD2!zzi*8S+7?Wm!7<h^53
z7lf?FM%kwHZ0z_5#9RQ2-{^_CZIi}PF)BE-2ch`}lc0>*;djGUkyoH{<OnaqHtbdX
zRn0&?Wrp0flmhx~5rEYSPFODh1TXQQ4)2LDr#d1-Pe64rMStnFMy*B0m^-05U7xhW
zO!g~SxQZ@*8bcftjnq%U9=4h)Kg^-;N(w6lgasku-59G2f6b(2FCFq!x{?GiJVnPp
ztRshXhBEfN+hR5!)a3Aeekfsy_@siLVzgnO_9etwS!&lP7>C~^uDecwUY~8P(3w+_
z#cKXz8W;=p0_kcd#V>;Drg)sfX%t>#qxn%$tMO|Q)9UT9w8a)Kj4gu&RZ#UTZm!WK
zl-%z3odwTY{jsD*F6Ub$t|P{!kjKIYarC7vC;Usv?=z`ovrcE%Gs5YF0kdX2^`zrl
zke_<xaxLx8TY$`<)sMPjY@|;3-%||c-<G|AvS>vL3d>TG991q2(?7X?p&)GON-b>Y
z9P92(QuL|){tlg9FDw5xVt#ht!}DXv)sW?nldLW+r1Bzth22$^x`w`mtNu>^x0}Q&
zt%kcGdHgnA(Wbx)qMw)Sc?-einAktCG_+8(7Ux?T-gR&{Z9~E-dMiP!9)VC-XgtsQ
zyi_?!X$Ntlky>l4z_`91m5va3ItnAXAh**;S&y?L2-W7Tdk-o3_|c8y1buWpo(TV#
z%EZK*0i+fUb9kSR`6`FQYG^+~>G~?;m4ImT(#+JwMWslOT77NPu7f{GWS=_8#qR7>
zuKB4ty{IEofXeIB>Csco_V`hIy9ryp3iRbhpqYXQ%ID{schF{#Ca@>Ub+Bwm)8asw
z)b#H!I_~3QeyAymn9UorLLOOu#06gl+818e)}Rd-^~EHNLl<}vj=S1!{pE*FKWC8(
z*`;chWv>;>#q7&BP|<Rntq$Q0)R^%NsKOPm!d&M)0=Vpkn8*}qnN+gWXWNXaiTGVP
znhbnz)yk`PJ1R75{M%CRA~J;+=8FNpK7W4=qe|KxL%K;M-)wmXrG?h#KkL-BIK3BN
zM&8hiB3=I+l7)KVu26AUvh(Shjm7Rbh&NECi>7G3rk*Zx?c<1Y#y`e(JBkiR$-99~
zHN74b7Y~suz};upCw5l&-sEF^p>2upzZgNUQ{}Sk_iHQtRrHCE_;$!LUI_mNSw%(d
zt<l{|TJSPOZ|^%o6F&^J8aJG<BU!w~lv6UjU+kG`cxLfx@1XD~fP_QteVH0YEV%lG
zli!B_&h7+R#-~j!V+h?Wcwb@dI?eEM{Isu&RMRg1YF{O^{eHZ~@2K!12lnl}_Q2sb
zc-P+j(s6(8_s38`W#N!5MW#zNad30gP+*OKZom$B1VYRPlT+9+)NV6HQdq6S<I4mJ
zRh|ZT7qtEj|41^p&dQ3_#niK1i94)D+@ch(TCp&4>f~6akNU0hNA)5!E92R)L{mbU
z|6dZp(p1>few+5T1YLM5U=hfJb-px}Q_PSjKlCNHCK4KgQ1uJo_qP;|y>R)_`4}Jx
znKwM2pU;ED*w8*0`bm?7c%Y-vpy5PezEH?#wa4t0saI3%bE)mQlu^%k3c(Z!;fKs@
z>3vBUNW^A$n2!40PSa{~^^vW^?KT48oUD7T)>a;EnJ&{T{6boY6LysXQ}pFlLL4{M
z+nza%WXJ-YCIg-$Fwv3={CA?&vuC+b9K=MuGitnk&Z92we&~HJPu3Z_R6J##$X-22
z`1}_2dx4aQMM}2Hlo-lDs$SUAV4oOC7RgrD8ly@#*~&6&_Y>oYgmIDNLh{a)H&lH>
zyz5o9Gn5tOZd!(zl1(}`9XfpqiMcL94HactvFy<2Y2Hepg08{gTKcsy1|K({4owcJ
ziz<ewO)HF=(fsFN;ib1h#?C{Pa~@mVpAlY)Tki)Rp%Ak|$DpExEfdKz1R+1<=qNcX
z3MY!ShB#!tvL?EVJ}uQo+{C)-QS_@H=Jqmvsd#nc;kJ=s{?ln`GC7po#SW4gLYdGB
zH_%M54A5us{f$OJm0$oLJUxMMCeP5+jgY#HLY_wj%#SMwgHzm;jRqr}(kcvSd0|}L
zJFi2+=4{E%?ppuekj&+#`7lE=?=|y#Mw=>zUypRt`6^icmX6AM5(wZgBXwBv28$==
z3(?Ejic%Hx;o6@iRu8*SH~c*hPg->quhiOAX!}NIa#v4gcijgO7nvra?u<*kyBAqg
zD0YG}S(+U-Bpm~UX%^dbO1REhWAUaD)MhRiCL=!<X(*hSeROOmm2P%*eB7rvb;=FI
zSzPS}%df~+yBND%;8w~kTM6n!+{9VD<u`3taqjeD1zPCh+N1Q1M*FL=%?zdUiLWaz
z7nCkSBh&}~b`4@K_$%}ln_+?D66JlRE9d)c;f4V(?(6$Zf+c-aSGl_e)A-oll`#nJ
z78XV(IzRtTu{p@!rh9TNB`g3=Y{L!?qtdArqShDPW;N@)4n^c+<gRu<`f;zlk6Lks
z7Z|Zc3sM&qw{<ShQn(VJKG+W*n^Z<yD&}3?`wD6{Au^8;r|WxEIyJ?jf-zR_bLgum
zw8&TzmC%J9-%A~d3orFdwQV;ue^!ILoF>>N0U%y>N{(?7Gxsp9fdxjnNBXcx+JoEF
z)08|-v`^KG&!w08&hf)KKY++kN=NakJT3(<r$p~TqLI9ns?+J7`*HBiix0!fuSZ-I
z3l^L0gB(#e*wEYzE%__h36>t$lC`BK(N=V<xFoSV=f9Y^S-7ML?5|LuEx!<%st;RY
zTED{WK{8+E4I_BlQ%LYP%}gOTE-Ch?&wBOu<(=CNX1;Zn6y~^nc2eBhZ2l=n7f~`)
zuoS6p@R6^jM9mkI!w=n=e-P3>UQA`?0dAy>_wJU6w9=I&HQCmf9LJab-`7?FxVF2;
z_I0*rwIheXz+kWX=mgNS6#YjC2n@@U>AsWxT!U-4x=3who$l1@v_OdB6~Bc^N48u&
zgI`Xh(ZBV0)(bX$NhCZd?6*TRp7b-QQmiTr-9E<=`+WsiYxAhGeslS;_c(|%Yka^m
zx9o0I)!z8W43Xm|Q|wl{@2GyuTGxA=yz70Qe9pm2FbRLG^Az&x+#vv2Kn}`;+uBvl
zexA#IVGS^#u;W6Cxa~bp=Z$Z%^14oxqM3bG&o=mVI0y~T71Z!M_e+zv@{&S0Gb(0e
zLX)Cd>2V8&=_I>PUY6txI&qkFq*ilRF9KtMpqcC)jx9{^qr0X1TZSo}v=@m4B`tYS
zb;w3p`6S-VUGA%G;y|q-e>jM^^!P`e(~(yId~I@gXdRH+_HCcK*XTPjhY+Lzrk^<X
zcp1mPY~xS5L|eEu_%9#(2lSwHYz5b;W>8#w6EsW8X4YE8e#O4M7~8u2cGVV-^zX2y
zDdu1akA>nAdz_D@EV@HfqhVi=H%1~v!l@>ocp7}H%9}{!wbGj~QQqdgq+OuM5;Axq
zjTdhBRnyzJ>|KabW23ZF&u`rqgBNtfU>8d8TBiMz5Z8@$;|&$kW`2VXdArn-knVPe
zrdAQK$xG92A-ENZw+j}0R8l&5aWtZnM|0~WQsn;A2Wi#jGwbqUi`Boh<BXq{Z@WR{
zf{3=Vh#G)>|Il{W{-*4W$e<sEP#J{EZ04KoZaz{jEqZBtP%^!Xe@hegs3z~2vDu~l
zy=i=oc^&l>yXHd55_hOzd?Y#Yng{V1kmP<iZA=0%@L{9nbZ(G!gn9?<LS!CO<z1`;
z$$a3Ifo8~tkRj0%+>P$%mfqK|;1{GDjSKc>lP!j%DjCs1m79Jf<N>E2Tpi1XS18%$
z6eb<*n0i7xJ=(5uY7wtVh<vN+BtGfLfw%>xv*8{1BD$%UWEYt%lHdMT)DEs0Q+(W@
ztQ$n*u8faWgvo6;pPX!t^)p~Ohal(X^yhlnN+M<=w%xi<s31&Q&0XyM2)NOt{V9b~
z|FMwgN^cR&?^9_OpH&aZwV9p&QQ5FnFJ7g(lg`DWOS&XUDGe6KN}_u>Y<Lz)S}+tl
zxkOW8`!<j$u>hXY#&?8$!B^-@)spV#Bt9sX_Q|y{#suD;&U575HkQ0o0Cx;N0y=JV
z6|{BtI`lKQ+Z!L<QGIt{rO5{0heP8b;|Wm@O>2DCF$y&H?1eAQyaJ@1tJzrh$>wgr
z6reyer1RQV`=c0z{*V;+_(lU&h+=pnGUCg`(EHCxG%PHdRuvuJ>y^4s5m>Y4SJddS
z1U@KlZy*fo<4umlf9!sUq!SIIT;s4yG_(G80K~a)Wqy;rcb~412hrS~W8{Rvr(L`q
zoSWL|#(bGOaOy9&X<eQu9MC@rZs!=|z153~_o@8!GQGA$rKSY<l*~X+C%fJ!Pwq`N
zCr-!x%eq0bb(RFf47a|&CJ>3Ac&`5X6`WYIS#9pgmOFB8xiLcr37L<5r^xDuZ7n+P
zKG_kS5A?QMxzZxiEK~TnFF_NAUV(B9!+pnhTeIq;eA{=ri~hVzl0u)8Zeo}|xL3v(
z2%H7XTOir8<iGiJlXAg+>DcV8o9_%L(7_S03^uj*hmAFngH;f<*vUy)F=Jb)@RPPu
zscH99;u$&N!qe5ozITNElbhp*3ceL*YlSbeD1#42{n5#(fgR)uo;DtCg5ucP?(kj5
zZjVzuymk?5McI+{$3o2GKzD0(t)_NkzmfD7!C^lszE;{n?=yWRlmbHj<-JZqo{iiS
zKal=>{{JQYd$zknj?)0SB#v;nKC}KVV*x>d0cM)CGh(7rQs9>NCO_&cX0IkOc<@Ce
z?^GwBXw49Seh9Njh-6CLO)#C$t$sMmDNE>y)adI|eNMFFzyBte`ih_top+v$)VBG9
z{t4sd0O>*rIjNNn53?(O(#S^!rTXTD(VVVrol*m*B2ycgraP1nDRv|D7nYhIWcXBH
zmQ3&t?_j9*SM~Bc=LEOBFQX~nwnU=|zx4W?MPd}|IR{a&z%g@5PIc1eL&hAcAMUC6
z1A=tLS-m;6eg3(}7fU9t+r=n8uZ_pBCy=+GA4N-!3&2x-LlLR7`5mf>KwWUqVHuVZ
z>2m7WM=NpcAZo1_mmIa#<E_{V?tGO$Bem{ZTJseK>G$+=wL43!+I2X8i6Zbm-1GH@
z=EN)H?iZ)997kO~YzNT-nJ5k@6%qINUZyFQ8OC5013K>V%7$S%5tt%Q-2Leb`{waW
z59e<sl^(p#j8hk8qfix<K~7_)9AKS@g5;qU&0au)!znRi6*_6rE!|w<Foe@2#B!*f
z|3xd@p&vV(k3+xGOss@6tNZT+2ZOuMp(;s*^}Hz-TE|&6{F2l-iCE1z%w4a-b#)aw
zn~QCyxCKmQN*r(NW!9^_w!XqqKv|k*aX3J!OJ0)dV1KkDwSe~;yWS3;F)Xgo_&Vn%
zKxS#U{jV6mYtv`ekAI*;>B6G&BKw3}1+HaWW|osJzh^WkD;#(tuE@s<f2232FHsXr
zIQ9z*3Ff_E*U92NxVf#YBkz9-cOZrsDTXF<MI6G$o{p#SbMr4jwKt1sR2k4|9Dk_c
zsUbPYc_dYcUe0N}9E#0}6dn@}wB;(jPkjG#$Q9LJsT^)QEoi!#Ninc=4`SveS1s5B
zJ9CRmq?_Wfa;Dwkx_iH&NfrO70keg_@_EqCGnKnNd%bzVN|!E*a`j2Y62Hg+GG951
zSA$#)^T+wqkRMPe?0JPnpZ|6A(xVwE{6SPcEk;%PP5ib0*W7vF@v~^AztbR2Pz=BD
zxSJpNhP+@^?1h5pXTKxVSw0a=vo0S4)8sLm?vhfmS7H7Rnjdsr^)D$p?zcoTG!F-Q
z&G$cIKZi@=W3PX8F}D<gDEd@z_9>@pTaHmW=L&pBweLDZ1piDKAKRD=jqD6AyhveA
zu`PTRG8<W9YvPI3D{766@w*Z&iyZPL@s#_T|44w*yR>R>u%vpi#7gzp%^F>JM8^<p
zz*pfy;lqJmP;}HB>ft;{C^u4|oELm8B;J^NVl{v0J5e8I9A!?1q+mrC2f!Ix-uNDe
zn5L&;=5V-v>|-9CB|Eh#2{)E3k_{HLq1}}zX_)y4V_CQaxjqNyXz;lQ6~6F4Pr<2Y
zVe_<@Wtl8oSngEE3~owDTv1=6vGlp)8vU|fMNL;<r-E~HtRl?vZJgO^`EZXK-sj@G
zO{7&ee9dv+>>R=&aLx8mUHtxcbrFB}(ZGa3heIPjst~KUFq1`#mB|#IWDpY4%vDo`
z4^ToL`I>9vPzlOa?#~C8p;VjFFIMS6f0NRf8QSubzE&V*`nA#`HEE@rfG|n11FEB_
z+0Qe(`Ng9ojOx|0+NLZUs3z!X{>`rhD`cB|Fw=)SB7xn_fe`;D`K(K?0DfdPx09Vx
zTMgbdD@Qmkh$SQmYN^3w=X3HRCkE_?`X%|*!CQ88g;X*7=`V>teHXsuQifd4qY3h=
zRx+0*cpCo|KmYgwNtUi7VEHm;$s-ONGz|^R5Bu;n<#WIyqc48P5;n!{Y<^M8kWT%8
zJDlHD-v%JIH&Q+7QZril)t%Z!DTF+DB}n?ObB0}{UO8oREq7Pk%pL6-_iLkowc;w2
zhnp(s(t(SgN)QSQ17`YH`p;|1<C&e97^n>=l3w!C9#lWI54PW=yKBF|sWy9^v;|f{
zOR-P9{+}!U>t&duw=LV+Q*(9Pv|vqx1*qP1qd&l6PF>OuJXXMGWBV?}*HJyl=(<)o
z?A~@d4j!zUvQyb%Yp{35=u7Ju9mO3V+a_0$-$;^qkuIAQy3N%%LTF9>)#$u5gCpo!
zg>B|#1U2(_ZTyCt)Pbi+BxG{<IMsiXIE24EK~Db?NI)cgdsNIjRF)J%-6a;-Pc6w3
zqIH|XsM0T+JCL9L)uF9^?Q^<VQ?qb<y=aT5t9}5@pobc>B_U!eti?pFmm)#2bQM~=
zKX$3zR0VaGXVr}A^kW=PG9}ujbW3Qzx+3E!WSTA0X&ZUf<NxSS2(i}djO3@q8G)i`
zBvzTaBcxRf;Ztys3He5mIUoAezK6;Mp`036d(gT37Ch6hWgGf%<uH5oH%eg28ALzU
zG!di$iZ|r(oc>&-8zV18Q{IMipuhJBZLSo1I{FOPIzU0>cK%h=2G^${Lb-Hbqp*3e
zIX(ITnb*Vly42nB(-$HZI`6to(=u{eQDoYG$bS<Q1nZ#$j9F--+#6QIhdW982jVB0
zHd@h|76Ik6uB{f0BJMuS0qzPf0jU{P<~{=b_^@SmDRG+)<u3OyiscNnK21UfnO2m>
zzGNC_+FzNiObrmtYsT7*<b?hP-8Oi%HZK7`@U~cHBdHO1yHALBvKL*YTw2+c6(axY
zUMJaqZdL`9HY)Ckp1|<z^}i~48t_t!ZRzJ%o#-z#xBVhkK{QIwdbg*wo19!ASFJ|y
zMpiN`qafoByIuW3DZiyXp3|IH6QbdbLy**|Lc^M0JG6y{n^@rAbi{Qr&+@m^$@x^%
zY=(Qjj{IdeTY{pzm`JS4BIi#S9Vkt`^ojv=KK$3J{1b3Ob_KyQE7=g}xuIWeB0{40
zthZ@_K<xNG(w?~{oW%3sP}_0S-Q3A;16OOyru|K3Sk@GeZJkt${_b81<shAuS&&2G
zP?$f3k{&mXN6k$qD4Ii74M`-cmdyH`^hpVOZ+P%Ql4-HK3!UxaQP}v(Ar~)-eeebu
zcdD#e{sry+Y`in7rp%FJViDGOncX()Ns9l0Ydb&XhE~=aySaQK`m_rDjq)%Z>(46g
z4@=u8$_`!fi|l;n-a=k>SSIxw#Vhlegx0ax59j|FoB5KCXrOYX{D2yvwEK95H8O=h
zog$w2H#-U>$?{S0+NP&pHHoQ%vV4WvRU84hiA>rXw#SI4(!q+b@Zrb|(0muy!PbZo
z5FRT|YmIP8QvoNtmu>twy23WvGwGuRr=jxcO{gI~gjz2nN_9F!lR4$;!m~m`l7>d#
zP{Q%F^1mW3aSuSxwyR=xD7qL|0C5nX*=oxCW-{Wb^L-^OmFDK?&6_WNbrYYWQh-sS
za=w#{z<1$Ofo<|zo*2t~ZVVWgz*-x)`~Bo7iEDqcaaCK8u?lrSTp+M3q;Q>guFy12
ze@XnU=piLI!1&g6qw<c8QBl%aX`CeA+p6ys_*O?xQT1Y(E0G^~iG>YYmiRgzd2)M`
z<$rqOxEqN>w(rb$o!A7fSbD@5W0KE}Rw|m=UINxJuEZ=|LFIE?p0-{%jJAhYzc)&|
zJII>n9FoZq3UQ$z2f^E$&$&EzsP|Ija+VXDIKL%S8ajmL;QCpHI2$e9(^<z=PDwS=
z9r_J0z+6XJhAQ=s;V-A2<8+yNNMV@xq_hSapQdb0iG=)(<+vtNr0VjRm1*SN4N@8>
zsvk0|#wrGaQ<%P?#lCK<WJQ;Agggx$0g45;EUCRuqK_H}tnmaik4)m-%`*I@dONh9
zSVWnjdX0ARY3u*RIn?9}v1mr=yB3~ZRKab!uPTjF>E9OP<^gsd>x!A;)!&5(*~#64
zQkfi|@dohI>5A8++^J!6<VE{DEx&KRqNz3GH_RkT&_3sn0Tm1r_Sx!-nN*}VV1VB<
z5P!+m2^wtxqeu<$j&>*djK@aJeCNqHjCdI~1W`8qpx}M7V+OOf#zRwj>P2f$AO!R?
z!IgIHrrA|uP3-kWGERGixX<2B4NG|D%WL1N4~?!T0gq+@m-M*Up#LnzorY|DT!}w1
zScLnN;d3p%3VG9-&YcFBi)K4unB_F}@Wq$UP}-yYQu5d7ahGjy2PRqV&y&*1m%QyP
z5L1i2V!O)SM+jVqWL>sVK3l|zT3+vbw&>FGjbpC%B*bC9Ba#4n(eGn<>J(}2UnW_z
zn6MAy+y{c{800w<DAh)kJSu|SeZ;A>4`Z=YUZd(M%gn^ZXL~%|(9pNp=t~h{@as^I
z?j$q9nxR;R7kvy2j_$bRJW#I=kBqQ4Aa59_=TGMjqxW2Yk~SQ<#q57w&XG%)F3RO#
z>9{5PPo91y$$EUeo6odVk2X2MhBlda_@^m;z`PDzk;J@bQua4~RvF(%F2pSj;mkNL
z5ZGC)Q!1*3uk94#<=5<-_{t@petEZ!EI(-(z838J=eN&T?(yaMidB2)`zeq$zV3E}
zj%}1>g^j7fi~Cl7ry<*Wm~akB_TG%TcbRP7iNm)#Tx17R$(yU$8J|lI3#}loCOm;X
z{H+;)8pFulLR31F(Vlb&JzOV2uBD(#q{D&*(XTDj6MdG9YIn22>&P72ZmT)kcZ6mZ
zCW&3WmSp+~SjqY}iw?8x>5(^#g?VXb7yhqUgv=_q%6$5NF|#U^qzZpL%QLUp<N6Z4
z70Z!;HMaD)V=F}>U2W%h7JPk|vIH#MlC40b^k@I`k^(nR_#7J-3=9^nO_sL>5z(IQ
zKW$<atMWPg4lVH=Y(?8mE`;vh63vunS@u~U^eeG&u5n(}Sf5Ikv9#X9J+{V@+F8K&
z22pvOw90r26P(GW6&f8D%I<xPwvKwTZz4SCqTZ|da%6nY_h{9+dpCo(8Xf17EDkuF
zsJH-qE8f5Q*6%aur(CQnMJWvG3BUKS!exE!{+RgZM-GLd2CiDqEz0iHeoVzr7jSCV
zl00m|nbX7|lh^yBtH8^gHLXjA-x@3^2-1VkB)_R|15xi%Sq-*!?&*jB!bbFklQPs<
zs5^cW$GF_MzZ;&pIN7V4N~a%Q;_SB&UZP+kOtI`VPJ5Hsr)(q5p}6ziBqdNWT#5+3
z-&VX~8b5HHGY-e)9^aqh%XSs}l3ZjOQ8@UPFoj4dd{vr1o1Y_{73ZpOBP{)WDN_hq
ztHXl~MO6@CRcC2C^tYmQmtU*Z$z7IYFYw_F)ci630(}Kk1M~UmGCl}q&Q^&vbDnwk
zd857EwOHpl3k(*Sj1JaeYmw#~jOD$HWd~-C+@aNy9dv_ji*DlRe8BD$RI7m0jO{$0
z^jrS*Z>z{FrhhII(v~d|H53r2My3=2yBm5Rt=l^8V4iv&m_AYNC33+!^<A*p{))%T
zzc(VT48HR0U3sUNv|;={ix=c=Gj!rkkN9PRV^>=Ba(#6hAH?oU<+l9TC4_)K1H@yt
z2p}|Xjnm58pVA@42dpUcG2OEV5cjx!rA2}s6Ni~b^BPX8RormZDa;m}Q(VzUo|V3~
z!-ApC#v#Jo%6-B-qZhvt7oLfVHnGm*`v5vBr2<XFQw>}zalXg*=Mo!X<J!6&(S}00
z8?F32F}q*G0qnOBAe`Ad{M;Xt%;iU|z9&*mxlZ=!jH|(vRngR?$fc%AsJ40%LJa&o
z40$M%@9&|%(^pk!j;)fOd?<D;zwl+V)ZItME+P_;fvXBZ(;g%0Hp_g5?I(0rx93=U
zF+1v`nn$h72+gkGoq?RCCUhZ({ES3j96T;5CK)Tt%?I}?Mlv)IB?5Em1;7*)BJ-Sa
zT=Y>$_eTnBVKvk2rD}AUbuC&^U(Z#y`<z;}K?M3f0>shw0Q!8)ttK+t^~wvEy5m0s
zrFOz}@M^%GHbFh%*}RQziv%vOp)c(qKuBCNn{S{(x?V`PjUcM+YcI3m#7>r255;+|
z-4sf8{@hpp;<*!}1t|xz<b9Iapyzq9+|z}UDcdHvIDwfmvY~Leue85^ba=1V%1i{1
zi}Io?{(p|aU{tSdx8$3y@h8#U&@6x9sa?NayIZF8?7W%d@AB8(cmkYE44gJF;ltPN
zr)92VKI3?S){KET1*^E@_)^n_R6`&lQfKdRuUNj6A<k!O5B0ybz9wIrqvuB+4F3X?
z*a>92Oas8XQ$4!HQS5KiQnyStfW)lD=EZlbP3)9Rr%UIEz@1#R<K*{kVa1B!*IYr<
z$<AcJZVKN*#qW!iT+m0fQ5(;oJXX9!4N1a|nNPbG?7Tg9EN<zy%)Z$JI>skIP$5BV
zx4B)(b98Ae%`*Z$FI<A3cI~FIO^3K20ZG3Ei{Z?n)lZ3go0VMWU2?W5Jd>WQ{1LOK
zu?ttm8#z_Y#}!8E#<<xMxaMDdpE0+MS77iqs=q$$$iVjek_m|5XiU|m^Bo(2HX}t|
zD)}Z}X=I#CI>b=<QYQ~sXygjX8%inG^ZfBRhz@%6nT?_}_&1|FGt81zGu9P#in~c7
zZ3CPyvL~Pl*xKh%>!$oPd!B(KHNPEqM@De67$wc>?laOxpPT$a$%9T|zuPO^&UWZ^
zpDb4YW!B$_qS^-1r=1*4l;~$TpqJ138@^fqt&~Q`gs0*nR-cCrZRldE(QyMWg_?`2
z#c{od32wjwlvI{`Ns(5JN}=4F?D92X3Q{j)4o7gWVX=NmX0v%qQ;rgf`g>=e?+mYV
zo~7R7GCPHZ>#0;n(zXn8hkD4q{a$I7p%Dmy+@Sb$qIV`&!RPk7LhoyOh727yg4T#B
zeVKoAaM$zdJOQv{a>YaeX=X?<Ap-mQhvOOcO)>RLx=gWfjGPdmyEKbI)!}4Bm;FY%
zCpd6{Tje^fd7eR~U|78c#%*!OhB%g&AP@wLI0mY?CTIR%<^I!12*FO8fWCDK=2`Qg
zhJiQJPnKq7MZSmW%x*`LPx!J($)@|}O6+YVFr8UZT^G;>vfKvcX90Cl^aCd<(+a5C
zcBb3QWXpAZ*Y?>r@{(XaB#}0_3?R1()`oeXhVTs5fy)7}_Dg2M!>?$#jU<Bh&w5$4
zuvDz{14NJXE2`iL+HK%8E(Wil`7c9X1zT*GXpw|rRIvm(=?-pRPHLM^l>MnI=GW;t
za-pAHr(3{lX!-MoV?)rOeN;T)?eivF5&QAi$q$Yyj5uCrqy6Vs5s5gDIKlv>oQSFU
zV{Fu7wZm_OO1gR+gWR%Pa>EA;xq65Xsb8nc=ctMG_d2-qUyPh=rw#MkB>x%jPQC*g
z3`ZQ0^Jk~{kJx=}Ogind5p`fd4AGEqHFGxv4Y!Gfy{E0lPH#Nb1Wx#v8!Xs;9yIx;
zr{x((B*ch5nqhKSt>v4Rh(#to2(8P>kQ)~$>J)4&$2gnGRbU$a0%8_-$$W)Z3C3fS
zB>`_juTq6uNG~wP2UxSn|0(;geM>mIU;k-V!&=XnWz@I{evC;}G7$qPrlp=b*KfZK
zp&!*vO*kUipy;go%<Kbq?aJqX2%uu&@Hp>NGcjAfuVh@=P+Zh^+2H!7#SKYX!g3ab
zocD}FAb=g^)m3bvE`j};RQ$}PX!(r0-n0_2d~pt2QG{BWH#0{VAdQhYXkd)melOdJ
zYHu@ND+%wYSJKz2nk~O?Z}&;+dPf*m;iUOHM+9##giYXw9asR(`X@M{zE2?nx=FU1
zn%Ws-y(HC+(F^wG>E8FaYqc9yHlM7I*|POPH>fG4FFeHFz0f3nWoq(24(@^-<CP<6
zs@SWoiK<A1afT1M$Q6#fTsE#BqWAVr+Pq}>%1AHPm3jbZFxv9fT0to7Ky*x?agEP6
zu9hEhh1v3W^U3zz#@LMgJ^QPL#KoMw3!6W*4d^fdAnN|U=n6aCw;rjOnxcBk^v{L(
zq@!wf&LJ)2Ylfka#rv23e<hggFLz5nf1_EYmj7+S)W{+q)H_ShQ3*8WLA@`(nTT7a
zNiOtE`Jsn+M9gb!1^rv9htRX8ORaWsz}^#l;1I)D8`Y3kPZPB=$>9-hz%0muXW}K|
zc6YOUXe;GV>^K69kLmE|BN!bE)VVZTqwuF@!7#sw<mQ{w?Zt)fCss#2S0e%GY^Sl^
zHzW3CARJH)jXqs|fxYc^cwkZ;VDLw2p-=mH>v0hUEsL<&AT@9bnv`jh+0VD?KEWZA
zm!y=UlhWkuG5j{Wrz;r}eW~{`#4^RQe0X3z;c_rwFtDL@_4&>M!o^vxe#d<<9JWp!
zwX=C_$D#x*B-g7?+!O=UfhU@g=76AvzQLrNM)MCx7?!_DY@cH+P{$QxJZuR>z>&s^
zVGa-rKP}uyN)B}oq|e8vSZ$I?N4t<qdX8l!G*Bw%XT^?dU|p2TD&}}+w1hXzD|pJK
zRR%od!}rd5GeS!m3jVp;c-oLIRg*g5ds<WK2c!SK2{A%rD!rDl*X-)i{V}pm_9dNS
ziXC0n*cuAcTM$)K8VjgYTB0Em0iQaxmZupmxQ-_cdv=%nc*^l2PGIW>d~!P6QMeF3
zcRz5y$1Y^@k?EsqId9$E&ooqy_Sm`R{m(^9zteg{*Nhg$orUX-%yQpORu%uCnfX`v
zuXT1JM~@`IAi#g2SP__+C*XZ6h1pvqR&~kzd!4oP&ld+kvnc^2((a<3dK}hV2J;gH
zpGoY`Va&Z$PEdfH)oLwC@-2;4AH4)5g$u6qx7<cBu0w;NPoAcuAik^ZH~Vyk_4ntL
zZPpz#8kzB>qX~W(&mYGWqP#r@`hn%ldRY<}1L&WVu9Vk5pFB*AY?W0TW(&yMPcc5|
zO{l9vCn)wK`4hoi<DfKan*Yqkk;$6Ktb7h=s6UB6w{9;)24zzd(k7YxDjrUBXO$Hq
z+yXHFk7VCpR!fQDE}Px}0j!YmUjo=lnu=d~<o5@aVhM;^Mh2_agEGi*uvD;^Dz+%+
z!AJ#ocQSG3IH(kxI0e#F{r-Imv|dsZzG3pnc~<jLp8h;xMk?{S@{{lcb7p5MQJqqg
zKxB9<Rts}2=3yOIhAp7L7fALe?zW2Tr6Ej7>-i)%Vu(}Y=*JP3Gen1G;E390L4qJU
z0ZNk$jBej0eMNBL-@@KYp-vZ^luQ32LuSWN&3;=4o3d*UU!+q9k8C}1?9xF!E{y$P
zXGPvg^nGjE$9VK5_Q7we%;Q%ehSb?U;3TJ!e^4)vmSc7mxSn*bVv>CTBoj+&M|jUW
zvz?A;m>Y8!b$YB}%&I8il$2f>x+5bLiUclFB&!o?P2ktNYzaCXY)U*w4o3XEfEIp5
zZwgT%x+D~Lz{`)i23umV?x%7sHT;-WOq&h(10ompxxT9<k~JgoOCMYCw>jcdRMDpC
zGmkN9a0u^7yG!FQa{fp+|4jmW<^Y^v4rc6N50A4P`kDoTO-M<3Os`zRTxSAf;(L6u
zSj5OBShS5_hB)rS7(0-x;vnCqEngkatYe;{?TV{Oc`BqT7D1WEnyUFfSpZTO#80!P
z$=`-@<s*Q=z8iRQzT%Ar?veJ@A1`9o%>5N<sco&kaS`A1x1GtIkj@?fi1C8yDbD0@
z<SO1=gHe6Z4d{J|CD7jjK!(NgF$0dh%}_g;rgZblCglmNUL(yGzjW4c<n_Ew%f7`B
zzpHP+yZ5CXr3vF#%WfQHG82z~{R_Z7v1cPsaNk}6B9!C8oQSB6A7*?a=%IJ=)X*3p
zaZ0nz=i4o0au@48(-#MRj=-TWa1j+RpAMj#m6(_L7kk5#W`E~@O=htq49N4LnvVQ1
zoOnUrPulw_BLhnXueV8Naw&T=BX^d^$IAu22H=?t!T+|e(~sL%B5{6QnN7KrTSchy
z1WBL<hVEF@kxl2fRpN~Yn58RW>(5!w*J_b+n`gPG)EfZ|Yj@F~Q%N8Q?cz6TKVY;m
za?LKP)t@X^QLi}#v2{XqGn=KR%PzgTF?)^79&P{pRN;Iy=mdV=?81q{(blxr4;<@Z
zTfkDWJ|8^f9b@VeLHI69^V$1$9@|^|I^E+itoQ9zF25XDui>NGR8l;a-(g-(yVp&X
zhmzBFyZlLuRDt3l!}XsJO1E7X-4!09m587Tac?38ySPO{038&})9UZn%Y&9fwKFZ-
zAy`7DSsmbFg5*2PrNJ0<IYCM0<wd0_Ls&6KywI0}kO_f#>c$K!9MTiV&ARSEI$RyJ
zYdsZ;NP)<ti(gPz2Kopk(qRuXHO)<X4z*!fYv&qh*kSV|R+`ptqxi>4_DMQ5;XQkT
zi8rT?VD$cTcA?vmfD73*tob~7LvAV#u>f6iif{ItwnAl_9$xrNk-V#{O*Pj;@~lob
zam)tL`Y$WwwSt=*jb+zD>^5FDh?l_Wk9z6Ijk6ec62Iff;yB|mdwT<1f(kc9pHgjZ
zX<VT*{4KM0cFTTRRN9ShNwpT^qt8+TX&E%UDvsMf#GHImx%U@0Ev!4JJ^<OT?4IkH
z!dinoq6qIFl*k*h8)+sMQdy46wvjVc7BC2RcgRAdiB#3Vb7zAI|6B5))s8=IfYRue
zevk*%a>3ZHmURBxbQ?Tu7=SAm*xi)F6AeZ#-%aT07@uuyRgz;4N_^lkf$KJv$LMgE
ztZiPrFt!*u;RbsXqj*z?CB_S=-q>3!mABTJ{^Za+3&0ck1z1E3q$1s>+XE9eYVxoO
z1Q33JM@!(`YV9FN=q>$MoS8!1uCpDW%mZkKmxr?J#Xq<oTekRaNV1W-M3W&Mpn9}K
z{NJ^v*z6Q#AI)=H&VE7@KAN&}LH+10R+g~uE{2P~R!F=luJaVb$-gctXf^i)q>N0;
z+)F5;40DVr?npBIGLrc<_f63`&T78nGoT68a=QdX->UzLzPoXcj9zwUC+MB_<~O}k
z`TlKMW5A;4<_Jhfwut1tVbyB?5<kBD8&A)6Hyy11qQ9H_Wmm9xs+|!j5e6|b#~k+S
zPwfFIzhk|%_DZGS*N7w<R;*_Q75gSs-;eO(a2EEM<cByh`Bly~PjQ}y*;^+DDjfi3
zTmFEj6KswpJc6tEVXmAgw|6c}-WP-%i&wTrH})9455|`=ou&ZxKEd16dG`zN_5_|G
z2w}BiIM=fZKvnEmp@~P1_=esDa61ON9wE;bcOC~&#vL>?AqdR0SvdAQ2_7a2Bw3oa
zemTe9fK8ci!^C+%(|W?pG<j<1?bRJ3(-)#`X|2%KJ;q{toyP&Ie#%i_AWw?W#k4GV
zt?-v`{3bI)G4=DSJ=f39g8x5C6j?f<ZXk`{&)l|ZF&A5Ub(@vdZMwWHJ!z9$Hgi0+
zp8a7wo^|96=g?almaOT$M(JesAzptz-ie)9sMJ{)hi{3~L-*3O#XJS7NoQUlr0ZhQ
zY8ESREN<hUTuesjX2Z0Ky@oi)Tj*&`r$bL7s2MQuY_0T}S`O<|UN~}Fnia?7w2SWw
zI(k|*Ao9eoxnV1SUj$1+iMJ-TuL^WYVdP-1)U-HOR^w!~1aEp9m<tSHK9e!B+TX;S
z{}N*`9Qj50kY}~kAK@@d&)cs+*B5T-WXy0esbL^DBkNnHRvckk^HZD-zUH?P5F`I#
zD}}IBug$&t1MHAfD9yrS7NPfbra6GI8lH9Gm`{S}=LF^pOI-il8T*C0vVGG=RWH$+
zorgFct*S5eA1Bn9nX^ca0ZzzfvHCO2(kZlA)mX<-hA|N*MDfuU*HQ7I(85O8OW&l{
zkf@v7$;BR5%_eGs*A{ahKpFDS|CyIJUx4Q54nO`nG*;y2>8NKkrEhXZ@O+8^GkGg?
z^7tY@oGO>P&|&FZ$+#jLwPtmln;bDrod?(_$J>qMA3;xd!xEmND8-&yzF4`?y*368
z-jLZ#jT9CO@2o<MUSL9(yUW3lab+E_o5f38bfq(K6C-im7dZg)0>;co<3PCC|AZ*9
zT`BtOu=_UOY^^Eerg2rz+p22<Uez>$+{V_Kk8D8_9RwGf(iE%D_=`u3@>>2yNAnLi
zh76hWN{z0M>#S~;y6477Eo?G5-_byyZohm#%uuTd@Rq#=G(2`N$r~nZeai|N1UaYR
z*ZG5*;l(F0>iHZQwow2XGASi!1V;^@ogtRmo{h$~TLQ>KI_o)In(Mu`hBiu;#fk?X
ztcauoaFMnjNj_Bt#s*(*f=>*mbMPQD&Xz@)=WqqkkCXYqIyR1^R8DCtbmy=6Z{gGC
z05v9bBtgLq+^e-KZi}YujFRi22=CYmi?VK3iXx-SV4Q-nmz%ev=vbLIyloP3si;r?
zbE`1<zw2Z?%QwIZ&;Yle>4sg3&rg|~sn?rHBaApM*BEqg0cO1gMN$v%5+&`cKJMWW
z6OXezLDMb2WHo(2TX_+c-0R2<0qGh_#o6K#LvVQlG}!$)2wCgC!J>Be@e`mw@_-l$
z-_C>Xh%>0(05(d8Z^*`y48t_xaU;KFtTkx?j_`@YIY3XzV+{@7pbwa0%|u0<CL`r@
zhY&)ZfKN3KFsCx?WHs1t*y`dVYmjg&J2mMZHoa0#0qWxxbEB0^UrM?}rE)yL=&^6<
zaBTXpHKh9sBR^+b>SY9K=%d}6XKU$pXp*ZWC#w$%emL~pp-{lEk_>c$2v8v49v47`
zQUZy{aiK8<P(AoEZ|tSM&C&062ctDKn8N0=toM82C*GEED4O>?U!|6!rOBB!i6=f}
z@DZOJC+ZrZwRnf52nq}t#h>rcQppi4eJ)YhW#7d1)O<>>k`;e7Gb8pkc*fkR9060H
zlOpkc&&->l)tqeRf&9yU=^Tx2Z@g@-+F-io&_Y=bJN?k#NpQ#*Z=nQJm<ZRFp6KQ7
zNi(ku6Ru&6$s>qUcO>KbX*Acr+2Z$3b(g1g+L6MB(Vum_(}&&^cFF>ZPO)u)f@~na
zK!4dlb8Jk%I`DcX8y>41u<n$TLl|0Fz(S7#@M+d})t}kPr;1f+c=L>BIyr6MUr*;e
zU8=N7o3Rb3KFokOpu(WPzS9?a14~44iA`sESeRtiXWlN}7g`f_TysTAmr1`z0>0L<
ziy={&zc?JeY$(%C4@TQ0Hs{t%%EA`F%=%d;zo*3Ko6k33wz9(a>GD6^-|lGGR3?$8
z_@1MytEe~0lBK4yR;8Ue#NEhc(5nn@0?Sdj%WZOC?d!vg9)zsSeoaUlXLeM&TKXRq
z%>QBUEu-RUwsm2GTX0Qq2oPL?OXCFh;1E0ncXtR9G`LI9;O-DeaA*RA#v!<C)41Hl
zd-gf+-rwEle)r$~bH?bwfTmZkT2-@VRn7U#=ON;G3{=TFeECy0RT-!-5X8R+*gR5^
z|B>;SC?P&4xfZy}A2^)I^|n%s<o-MYU6(0((-0m<M(cO%GKQHUQIHEHBQONpHLYIR
zZ*E?HE*j&hiU>3NYx_v8+*0#=6^PZ^hMHE#c6O`3c3$mcwK!~h{*mvDh&GdRQayL>
z^V|1(7fnZ<8i<r{9DP>&!m}JIY42e(E2t2bH`xFbCe*aTItsnf8RusWR)!un=JhV1
z7@#aCSqv5>Or8IP+vZM(P(55ODk;4rn`TEQQQOMKTqQK<JtHf6+K`tBfNVY}!VZ@t
z<K3qS>r`!HG5b364<tyD!?CV_3L3#a0+Zj)eX)b<xih5-ge+4P_MsTJMnI&wihS#y
z^i5tIw+-C3$(U=JfYxzs6f@Y47l6EIMW4TSAE`_c2x#omn&Wz9Q8+#4ankcBFL!j0
zKv7r8T1bXji*Geo;DNe6nPxb%gtsJmvtuUoiX#ZAzOG0<Cn1Fkl+T|Dlx;e%i{Sxv
z1OmNL=$2%!i5qyWc}El9f1CW)w8cW_1_<XO6M`K+r&p4oekB{7S@LvI@i}~lDp<PS
zGs=Oim~M&>o->l*taAGSJ1i=Pl?Wx7&A4?8ag}s~iLlGHD$U0SLv_sCY{S<0q0OQ-
zIJ-U;*G#RWdiZ)CanBDOrq{vlSUrLYL(V)Jg1SD7{$CB2c-=0rkxSoGEqt4{$#z*4
zxAKe=vab{Jy03VYs$`}$a(%(BFU&1H`}1_pWlN!26q_GmPg&qvs)vj9EehFWc>3Em
z4DWC%qFwHED#yhM05zJ^P8EiRNHW?rgXGHc89@Owto0P!<`s=K>(|KjM?hL}HVo|d
zcDb);BiQTV*vEu|)v|{Ox7W#izH>2%*xyODFMqmo(;68;tY0{9kR1JHR@w8}4W?*?
zPIh$<FcB!&*p$7D;D=Q_D;{IFH?^}V{#mw$h8N|gafuoyh=5!g{CrR14{oC&ez>Y_
zRUC%PP<Gq$ULg_;YlB-yjgvfV?Kf%PAG4~|&t^FFwbAII6QGAHjd(t_tvzlzTr3Oq
zUGzo~lx^T-D4k`*R@L=<aiG6ZL46r1iFR-Xr}m_(xuc*}Wbmi01Fa!Y{1f4DagOGE
zV_ounpMTW3Kaa}q7kXE#A&Y|i;k?mnAKef-<}9}+-|J0nuz;E{W4PM*g|oj+R(GR?
z+i)Jen|<*a$A7K+ymo|rR38AG+}k}vOnKU_^6Kh<R~BN=dqLN~`Gb;Qu+TmWB3Z%x
z-Py5>0ifla(n9bYF|S|XGyJ|JIfOmKUZhQCF4p_>J+HZVOn)_rz$$7tqFR00MZGt4
zE)uBXaQpI?d&rh%L>{L*!(59g7sa;{dGpuuk09#Q<bXqIC<wrBcNNcR0ff$re;{<|
zDFtm#oKBoSkOf@qZl^@l<%+;7V~6N|e>Dtwi+iI;Jpp)V;l_`e$($;}1+uR#i#Tn~
zsBQV(YB^%iLt}0xMrD9|k4}8$C+a`v>a}og(RPFg#s3xnJ)V8OGe-+0A*>iz?Kw8$
z4jJ8k2_!UWYj7C^tA3HT0-PbUGy8M<MqYdAr&mMn;@N&o(Ou7JU8(P4O#^vwInPu)
z=0s=sLrq;LJMGgy_a0bInKX?U`5f-1t7y(j5Jfp*b9e<LHC9y}Ij-z13jPVaKkO)r
z+l$ew+Bwa5ScPC7-fS0UzL%2JI-cbm|KUG-Ndq)IhT~Wz=A+huuKXTZqjU*-1?A2W
zpwv?%^gvbm-f)%JC<~8YQVBG3F6;M>WGDDc&p1=9uT1bb;ZbS3@gawl{sXA0&f@H6
z2@-;UB8u93?GfQ}`+{lAbp`^fCtzGA0F2`_pv@J?;HFH-{Uv~jJLEdYp%PV=!#ld;
z{XuoF8MXWJNJva3)?Wtu#ZVm9*{()^kssf8)DW!BW!Zc91r5gj+ivT7^&nl{seJoj
zP&JoC*cbp+yms1fsAu^krrY!4mlf9hGw6(wVbWQ4c=|7}p`pw4+eB+#vVlJ*2VJ#@
zuD{VH&<bbB?<>fGx&G+(Dq)1pn&}eOsR6`MPYwGUJCRA!LKs7qsoCq-TX1qNo8S4J
z+t}dHj=tMN&^~R?_0p|p1MnRY*daEj2CBKgMr`liRk|Zs{TVm5GJkMz<{AH9e>PIT
zW%~hYFooH1LvB5tD-auSH&pW4t%NFnHtR4Lsz&slgQkV5GhML8DfS51rc%SN%x(&b
z=q<!G1evMoO6T(%G9n9Ove|oiLEjV)N(SgC!aT%~dL4-M=s&7mo;d>qKAmfk^$rN9
zAb<!;y;E<qLBXq&y>x27o?)FRiZh<rA|&<dlQTZeMOO`$WdrQ4;%(7V()crtH{vyU
zuj(vyAU>+H9EPgbK{aX%Mps>;JU43FTt=`Py5#@^j*t3%a^`^ynI2S;9-LH>7b?Zc
zTq455TGbBC6#WO#sQ`TrtGX=DwbL8wg}AyG;QjXS2SP<>j!F+tw3~<@<qwhT;=pl$
zKaw|B*Ld(eo0W+>Y8o2FJzmPc{%!oHA+}P%1F$wT$~ZMRXc{aQ0|b*<U@4G9{%nzW
zewsvW=1bG_d<1m*nbGuj{;6WLPXU(fbUh{j)q{-I$3I|T_3SjIOlN^KnX;)C=jj}n
zCWF)~bN|7TnZV=7vrz<C#jzKLG%VkyW*+^*wm2MMNe2L1SO=&Rw6Z@gfv8wvrTz!e
z6)NDwVnT$XcyJ})!mFrim8(r=63XVb9Q*!##z$E_j&_8ttpdS%7d#0v%RVVL%jHX<
z$J^t88WfD3HHmzTJ{=VdZu5{V`&f>Tt#}0Nidd{^La$z-3L2Mdg7`MmW&lLuUo)%b
zI8KyVGW(_FXXJaO=0$6L4pe+2Y<!sR>f+Z}L5bq7E8Af`E$^)20D$*o@?xG1eA#~|
za^O#9fgy#i6TpFTkY*i->J;!8zVV6eFk4v+1e7_-u!fB7r{BtLavCrg3z*6rbozN0
z=ZP&}a0k3d_WGg-lgiBQXbHDftlD?#bzsAO|4?<Y;=50-3oMom_M7MjM&xd4BZkn-
zt!cT6NjUEB?79|Gs-03{eHA5jMGE|za%>WuYoo6MzH0n#=v}us(kNQ8=?}6mc(Kay
zV|7R^4t4L*gxoUI)Di#ZvnA<D=KXC``eTI4i?f5P=^w8_6?N||xdjW7N6xVfecYH^
zultorN3;nk&wfcmD(FU|&Yer^Gr2uGd&|sl9Q2xYKa9g^5A@o)Rehio|IUMCSM8~2
zqhe&zG0ao#$bls4-)o-EGsg3plI~p0)%bpR@%#2%`6WUZeSha94p7YEsfHqH$dZ^T
z>QY7K_d6k0iw?bSS%Q<_y?(hIOg?WR@$oU%8Nt$I!X49Dtvlb}sc*VD=*mQE!$P6s
z46hru&&=Jb&#JNgO_aD<HF{q>BIj(4`*m<b4i@`kRI-ij)V)!6m;mpxUio5HPwPXY
z(&QD5$DxS`#VGxNt@=`az-r;t$aP93YNjSR)zKxT^;mIbFqEs+b~%V{xleKTCo~Mz
z0gH`m{KwDG?f&kxx(CO2Rm_CzInFo*Ae1#$DtuX6sQrUJb&flI430!K=u(Y1bs|Nu
z(KGD3?}z@7`<Bo(x_Mu3zh~A<bD_X)2lJ|@Pd7KRo+3l)DZO?5`Iqsdi}lLR>95@X
zeY5-adw9PQP;NF)j%$=Gs#(!w=cB>a)ey6tp|N%I709Wj73ntm8p;1qI2J?w3*1A^
zEku;crvEy%x$WKkf$dlSH$LviDW;|)S)BV)ww@ec?g4)8V$FtoMFG;1Ps`F4+g)8E
zMebuCyS@rfI04B&uGYrer5qa|M#`6{is=GWm&U*j)5Hfjk2G2pfi*2_K4a^RTY?IJ
zt`iClvOXGgcupyjZRD@P2!5mglNrkmGx+iQ?Q!iGYq{CS&mO+>4Rg-xtRe@<Ne_x&
zaH6=~48EJc7PLs-_jsi85n*Yhbo)%Ih~w8W%;);Pp-#}nq>hB`W9ygKtd?G9CtqnT
zzK2M1XQ#|Yuhkr5%j|s}9qkXY4(SKFo8xN^<)&^~3$_1y@^7EnY<C0}-~mROI|WjX
z9o%xL&lf?~Z98BpLg2`+XQ{^3&i}NStXqz}u_YF|zhU`AmCyf?Gz%@%h$6H$7Kb;k
zY=4VccFLA|Qor&YLXTi`@#kS->tZH9peRU%?ZXb1qImelHF1mOSFIM?CdQKLddT?2
zo|G&K^>8bY^CxsER>YI2HTF|pA{NAu1-O+PZM2|wSX7-J=R35C#frp!GQR<pr;QGo
z)Y1=i^Ol+23qT;mPEW;<0HL*}$u*vPO#7x%+a~kV!QwK-hjn7g6s*>9u8GHvS0vs7
z(1nz;kjZESOC`>Fl6^xTzf4?;;^6A8Bjj-hxik+{8?Y${1M*2a_o1dYmAN=w==Gu^
zmICSb^BVvH2vy=<^ZAFA#p_=8;+E-SLG84St|}M4CvyLwFu2Ys{jh=NLxAWA$<&)9
zyhw(^ucg~66V7_zjEti!Cf2<{EeQiJ3U{jkApNQ^j;;GOB4SZ#wmhY$M_n-$W~wvC
zU*y?leZ}F_lL0r})0Sdw$9_4tZH#*Kd}|DrE+vQ7mv&ENj!rT<U7^<f#&ap$pXH+n
zukEc)H?m^g<&j(aACU{^5Bh9Pd(%28aP-#Pt)(l!6i+wjoAcKOMx`R^Yu=j)F0LzR
zSP39>z(|edQ2Sa$hXZpUb#SRVTYzlD%&nnhi=9J<MfK2&=?x+9^ine9zzGv`ioEOa
z!-%H<=BQrnn?@E10snVn(2iiCfiJ`LPTh}8J#!6OzgztmY*&I>R;0VncL$ut)P5k}
zZizRjafof4{J>Ts<sdK4#X!IiGMs^s)|40%`~RL%Wp8a)dHgQkoyHR6(CvH$HX}_h
z1rtQMlo9tYZB6ZCv{Wm?IQ(RsiZ93}quk@2%PTkaG7RVS4nHl+D4Frze{<R-b<=Qy
zSglor_ZtR$zOf~sY#eLy`wHHMWWt4+I<W0AhM7uB{G+U%Zb#C}rw@J8R_*jV!euHT
zw`{yMn$4c3CQb}`_Qr_U;YuM(;(+6oPO(Jg6}x#~gq06?&aDs-VHK?Z$U);d$6OAu
zr-9@*GIoSZwVR7ykx)AD*{=9JBKRnM)U5FcUC6=w72jRZ*XNwY^WuJpb6q$rjJyYK
z_nSs}+xtTe%-O5yJ>P}*m3@3bynrUIW(jw9d^4l8bf!UZ<*Otnt?Go>{P_)0xr>|f
zykeO_m03=^`{o@%`SbJ_PFvSPrjM;wGN^*jlJ;GWL(Z;=jb|+x-ReylfBbr_S!+5+
zfS=6oaNvT!3FKO}2ojoFg_$d=BY6BKJjL~<qx<PbviXOJ((<aj-@STD%VxW(c$(C8
zx|`E^>izL$4rwg(@`fhRT8gH;Hk>p{Jk+p}i|xV2#$aJTi@7dcl|0~)B|OP=INoHw
zE8|dW;?Ripz%pF{J=BKV4O7C<F-b<XQEID|4_`Q6<%iFPP?~Haaz`e*J8c}dOhv?s
zjeZxJn?I@@IJyWVK(%D91VwyW_>u2&XJ8YF>^f@FKZc#sy4LsEIKcwqGGT?Yok8SV
z{c*bDV|D#a2@fjDJ_Wcwr`@_=Xw;4B#dNv0f^y?tD@WxWkorayRIBB6;5`j%rSE-j
zx#G1AskdVF2aw6{$o-4zm+fcyaj+1ynBOtdYL#n#k;HmPy{7>1>}th|*`%*B8fvb#
zQksW@<ss2EUs-J^Ne<5YGaVLaco7fDcWb&{Ng-4~0R<ioLQLpEDeW%{6}WeXC(mnI
zkGeANpU>J>W(%1?Ix2?aTe|ZZJ=S*?0tGgK_MwKZ8+t5BH`)7)JOD}|D{5Gq;-vdN
z?oYxh6)TT_Xmx9y8>gG*UNGhzmYyFC?$ZOco0IR*OcM@;a4y?Pl4M{nyTV99HR?9f
z>i|^|0J-Kzwcf9S$-^(zx7y6AThOw^CIOm!%G~L`xif(1uaq&u6h^&;tNlgN0oK`j
zzl(Org=mgcri0Ilq^J>ltnk+(W`N0%4EC#V&tb2tes0U`mOk@#FxBOW7#;0zRzor4
z1nOUp%SOSv<ipbBcGci@K=6SIgqCJg*9`^xsNa%ZW{(eOrt;UfC}s*n<X%XvJ)xEW
z^@q#Lb`3VWBR%vJ{r!n!UkZk2coC^^h%Har9hO)Uu0JY-M}rG!|3eAkUw;l_1BD_X
zxd?w}HS?<9;(XWhVon7+jSl9o6VW3DG+3(tN&py}pTp|}5OM1#+xRFEr}G6Q%#V#6
z#s}RO%B@2W8+z!j<w}w<l9fj%GvD+OCfzIMe2R(=0_b6#>Hm`Kn6o0B0B}`g`00Bj
z&Htd=|5x&Op_C_Ohljrj--5bm#NYR}FtBLoSY-R8Tc_`QTq(<}SHT7t;!XY{cHMQl
zjR6C)K7Fa`UGgGUAY%~)BE@>8eQLi)fEO32HLpV3%X@R#S<-H2Zy1&iP(!so^e;@a
zJvCq<;d>+l83S}%(H)`|hNi<}cM1qp*bQi&sQ=sMrK74cV$n<G&u&Wo$AMvo`7ON8
z0RDcY$$g{jCt<4TaxM2G1o9S~_^!J%=53NEwU97rI2%bnfcNWSK48Y9O-2xK#JJXu
z4F5o@y*_prHkdlEHTk;P^&km9^&J0(qo}$aAp6*y4-mw;k)slauQ52ezXT0BK-!=>
zKU@K!jyizGQc&9fATDb7xG?me1j2x_z(2pJKu^u}$NJ~q45n56sz>N`Gc<7E_RM3+
zZKmNIo8&w~_--(wVO<y)3{?`u6Qd{6Emq9qI^dKVX#}9<-n2Kk&7b-T|7wtv1cG-e
z@{>jjCvC!STs@=a4wl>(v;c-J8j+(GIUr#5GwB4-8+w)9zMS$zEGz~;gsao$*hc0v
zIuRUXWl4Ho$@95IW=ZA@;9q7)h3i-RcQn}Xgioc(vwyR|BKRT6!f_vRtb<3w(kr*!
zDB=Kf+`ta{sKq=~Z}!QH{=?M1exdmKh;YEjOo)yRi4B&IK-$+&IE}YQ?LPM`_1mMV
zHi9km%_0b=RDkVNAT9%p!=BHjZULe1Lhr**XVWt)KfOg{Wd2=qaIl}6L-sd$>r-?7
zYy$Lv8;Qzq<@kOQMf^lS0cAL6Jw0%k?4Khchvag-;;5dqx#kZ;%#&?~Rtp(o`AdX~
zsxy^_w07<VD}LV(?Ba~>5pD3NfJd<f!T*C-I?=tyW7*GG&%i6D^FVq&?rBi|_g6ge
zUzDiG|Li<^aAzI5{Wcd}_6EgK$j!%k7nA@us6nI;KMBBHbR92y5dlS*Li|9|t$Chu
zh1w~V1c3MybbSD2H$R=+L~_`3d%V9)teR;~ePSFJe-u`|Sn{B(O){ICzPSZr$B6ZW
zGgT{$fHzFK#z-j)S;YlpRSqTc6wC0`YfW`W&KqVo!Doc!o4{H<&o;9q{V(SDpQc#{
zsQU1yk^hswiThW({m&2n%hh>#K#Cd5-}j%4S@a(gD1Q-4|2Mw}1=9m}yE^?B@tc2p
zgMWP!Jp*t=e+Fd#X{!HQ@A?0^H{*vVXG%%=KM(i!;Qi0Y{p*7JWHSF_mj7nT|G$}Y
zkK@a3feLEoOE$6P`x#R&RMF(Y;#^Tdd8p_#R8&k6xHyD}ku*JsUy!6!H4&rV#%FQk
z{jAu}aJl3A^WgWQyuH}SWBgq4(ueyv`=;x%t*xZ3ZBMgn8^Vg$$0kY_B}dTS7$iy~
zh8O{dO9d|#h>G*<zx^X9OD0gt$?-IS(fyQKO|f9M^7%RLfB*4+{?Eo6c)F;N&vAdN
zrRK%`pKkT{wNxdzRBB`fzI0KBzHbQ<8QpCV{Ql3){I6>TV&Edz{;bie9jr+f0J6pU
zFL!9+|F5ncv_^bOfI>_eX-Z6q*GCt%G%rT^|Jyx(-B(PRR;+-(<?1a#`&B$6z1jif
zlf)kzo$gr07mpE%iOJ;<xdkjf0e~U+84V6A{PBSS0}7>Y4f!r0cVR40V!rtSgri}*
z)V@UJv9vrLc^@SH!(zB09V{a9Ukw+#psKN1U=je(N{5K|C+jNeRqELXa%37`h~SIZ
z8DFuFr>}OjZ)aa_tc~ai0(T1H$6<`J32d>Tlg6Fm-=klrgO{T6!SOt8wN}sfC1nt|
zsPx*7gWM&?qHfSUjgvym-{ZuH*ws(W7k_FdBPgKT?w@F|RGjFdf(`V>1kK6A!pqI?
z2-pp@_v>+>jS47})NN3j>C5{a4r}MRKIMauPqAMj6LX!9cB%iX<Lgj@;+B_aZV#Jt
zv-6(#4&{?8(?uf9<R>Na4CXM*mk&y^JwSIm_+<+<WlwjCKnN;mL5|RuQ77Px`D)Ll
z3>YZzC2r+JgK`Wxf9Og9SUO!4`J0^~o~KbuCHZ^QR8f7M*n`oZNsYqeMi4y1>r3bz
z8U!r;EpCt=Px<g*II`f+iK|Eri!%ZbE4`=*4iezG1cCvxA$whlGeoCG2G4>VgBeut
z_G3RQ?Q8Tj3cqu;CexACa7xRWK0v=%e&$GowmdaD0u?9dKmwQ@?#U<`iKI`Rc=}Iv
zhaSX!B(0i+v-GPho6Kc&!aWItm@S!gVR@MU2C9%8Kf-2bJ^%%D5{B{Db4K~W1tj8R
z78*KEKm!7Xh+sFKa_gVeZ-T$@{_?r#V1OF=i{SnGELf!$s1t7nMz~yI1r*TT>p0ib
zi8q$JLb80k(TU-0tHa8Lr-qcOaQd90b!92MLR~w{z9K9X4ov~P-~o<DF4Kt^Qch%>
z>6M#Wnm2O=VjnZySSq6FYz-OF0pxptMT*ezlq{9)%eRjTzTEn_gM<bARWSYqu_nmq
z`J{9KKMCL8J|rLKs+TPooonRyc#aN*!Z9#AbeB6PQS|<kc~+J<plm#2xG)^M-R*NJ
zU%N)g9b3;RgCjdf@QzH5V8FOex>J-*mtO@ex{vvC2V3+`XOHJ25!#M4`3$2N%OGdC
zloP?LG$E&&&Mjr#zT`;*>Zo;+dL}IvhI%U{w>H<TXxCIgRFv5uc=IdgjU(nYzf
z=!M0)1HHp<dm&*3f!1v2+Lo<QQ9s1qrl9lgpM3R%K~LYJ7gzt>+-6LX-4GZtr+*!>
z1DaB*`nyw~sz3&&0?)-AT=+2$e!RZjRC_XuME{R<w@P?@r>QDx)p0LpSiS%g0E{ds
zU(iyz{z7_;^}lO$hJkx+V1!z%RILQfgALgxX~4IsTM4yYtIzOd){wv&t}iui`Hb)7
z3uY^{!fr)vUotL!AQ)TRL{}r5@y@c#bDZ|U>+9K+E12yIm*R{xZRRC_H=dPN6}KR@
zTC`nhSiJVtlsc_QPb|_)_G^!jBM>_IboNt=Hy<xSG6?8veVvLpn)as3FSN1zy~u)0
z1!*lZ8V(rFqtt3-N~Bv7EVk9Hs`95LoZ1m<{QWFxkNYm;*;s?X{9-h{1Uk2tK`;iJ
zpvb?8F+RhR5S5lzu7r&MNl}g<v+>)>a>*1jI{OQ0KC4y<f`M8JtCx(vupD5?NdNNp
zk`eZu*b-MWevVbEuBGGQjD-PB4Y$vs<EA5t(Z7nEJ<=3qSv99+m|l~{nUN!M%@gA@
zOl_lc>E%XV2v%KCY!oAX)x__GU^17t1hN{RT5&KIY}k_2@2p1w^Ni)hpyM1g-F!>H
zOt;qEua<LKB6vp}r4G_3c&k*89GZ|&s6iYBUrZM@rl;k3JY|g#MjTU+S^s1TI)Et<
zba|@)-WzzFfAZek#Nsv(`*@rA<v$w-i!R`ly=kTqQmZVsT>qPN7UNc#<$y=Y?MsfF
zGYf?gB;uqb4HbboUTBB^J-x2Y{r&CAqw))-A2)91XQ8s$j=;m(yc<o`P!=7E<ufd}
zs`-JH%#_UZwoJWm6LDmbIU>E;{oqUGf;<0i%nz60*9>yg!-PeeL(nJDg~Ux}$lwtm
zQn{}&r^9P0^WcAD{Zxc1aQIuJV(ClxNYkN^#pbuhvwLh%hPdPkG3c0#`6$X6k{*z%
z@^CsHy?31;OJQ=TUQK5)lI2ihHdL2f=QZNapwtF;2*Bs!>%rxJ?o!4mH1as#pE#xq
zTYO41KgYL_PyK?g%x~m=Fl#qGFnxCDu_Dx6vL^r}(Tgs^cnW8At%ir*kw0!_I#^8a
zxz(9%FTi(vX>GZQ$~%UX8cECR`{@^Z4e-SZ9qE)AlyxLAIpru_bO9=i@9yX5DgEx^
z^62R9iW3ol&QV*{1J)#ra&_loo?_pJKJ7Z2%Y{0V^>^1Z-4Ds};fxLsXQ{MB-qZ3I
z9+wLaAl*jG&We>9xr-wuqufzf^LcD(&aE_Sd6=kj0l$Vp@R@44rPgcXs%RhqX1sBa
zEs8g)aX0@X2!(?2`JN%8#fZ`S>9T+kbQ^GREq`(sE#vbcf1%aT^+NZ`J!j?G`puaY
z|N7es#V-AdSzYyf18affMbondhi?5t^SEi{ra_OD$9R_47sqOi+TC&F&V$tM0me<|
z*Y2Rs`^xM(*Ey!^(}CPOqt`XtusulK?e7&<vQ#!>yYcZmJbVk|)ytSW->NvI?z^+{
zEaR$Ts8=+Po6Sr_A=q;M0p=>hV<{r&9P!4%y)1FXHF7POq+VHcSE|f(%wwEgSE8$F
zOAJs%b-EEA)h6z^2u@@_4|99*#_1^0>x>qpmSjcXl5eiF)1B)+|2nu42eGqT*YAqU
z2CMzP($G6z_<`|ePH{mwN2>3fsv83L*1xI3L5UR2oJhNQcO%kK(2W|z2~%_x6^>41
z?DsTmc2^R(Ki9Ck9`Q->{g}?v|F}LCV41~zUZ3V8v30Tw0wuEQugL3+WKx!@w+6pT
zEPJo-qSx(IFQRgPfBDEABJCaLrQ>JQrQa*he3$Oex3HZJ6ux%n8K{<kYc~>eeb34|
zTFs^DHp#7fbP`Om^#{IKh#57yFUj~UU9UVo%s{zyn%^&BlMbIkI&2ePare$6xilHL
z(yK*#l?;#cpir_r-<yg3tM7pMT*8gzne0?-H^Hnds(=lw{yi=Kv~|V3c8rCXVPm_Q
zF4S*}ST7bPyEu6F$5ODxuz&m`oWt+chDmx+1H6~QlE!SMhe)zG4tk`qV1l>@r+ubk
ziC!>Vna=UVemSqAEO?5@P;qv*4SGzdTJjkVmR6XiU11&!%n!Ml$ERxiF@|~fl&?YL
z&-J^I?o}b?sbKy=>H9tBj>37cCm5~ZNU`Vm4(apemcI9%xbVG;vF9*Rmua18@lZ5=
zV%t0{Qzx`P)oTqtQZ&!lq0AB&$8sKr1S6DqyNd=PJi6xIi{>r#89lY%@xBQ@t0lqP
z#~hF4L<rGbZnW4~e;p^(<>zX+!edwG#-zdvG*lh-%Z20a1(?&&WU>)xVVsK5-?`Te
zd|WgPsTn~W4}ZSPz@WELyxaTRr2~U{s;1|@&@zSzo=e{25%6WU;sN2{=E1r?c3>Ao
zZuuB}hAv4!Y;J6V{^n?xTh&rjNZ-D-wcd4qerPB$$05FBtomc>Bn=h@)9-y#tK8kW
zoIq+KeLJB=mMv4}sxFC5i`n?wqG_$M!-c1s&To*8!3&RL_Yh#SV%F~^Yd-j6NyMQ(
z^ulV+Df6+bsY}ScHwn?%C`{b=QyA&ZkR%I;D7%gOwvoN-PX3$mtPb|tZXCLH!;-(B
zw_H7a%;Cf09m!;Kulmi7%Oj40+PVgGyWx037W;)`E^7zp0v*jgM7?JB_a^UL-C^Z-
zhbRBRvxP{{6-N1$K8m|f`qf-@fc-*o(W1}gVJxW|A%!-hbmNEV9(s#u=&kn(^-Qxv
zqLqQ{%IVK5hRuB3xbi$}!~6}G@6S+XkCzub;)S{QrQ26>`7cZ|4LE4~JQx(cnH>Es
zyFwls%))t{4{8Ir1L}@fmZ4Rc6oSL=EV&S*rj5otVYg-v-VMTBA0tF$f9EoT2p);p
zjOaaJd;0>%UIF9ubC2Vvr$Pz|rKUU{Y~^des$afiuS>GJFfjoe!yLWm7X4P>ypFD0
zgRc)u!;v@2Kz#1)3R~T^Ist|Sd(3z=jrMt0=isX6$~pNRss*k*+-WWW)5%H)Ue(?;
zE;9?xUQpgW-f<YUP0n(iH21B*jauk5A+lTV5sE@tm2HtAFB-S?BCWH38J^b~hK3cl
z^`ldaZW?=2OF^Uv(b`MPZim>g&ZAxS@p1px*jPwBmg2j%?;m}Hx1Xh5cAV|Olk%Q%
z>el;qC2na(0F{sU7G9QI#Li-9tJaWnJW{T_xa}7RhpQviT`9}&atk0NYUlOo4dmuZ
z$H%HA<-b29eKFlyoSQ-#7IE~sJWAGcW5*vw(QtCAeir}9R%c~TCyfg)krCX$CKb7R
zl7GMXjYuhbgWcPub<uI^5ZsxIvi_af#Yzxlc6a0qB?tQz=kQ0Yv1KnPY{%M(%pARC
zCwLr)&84B0iNR9rT8{mlg|+LqR=fJ78MEz0Z1XAB&|Ya4^;gBvt0tD6YRKZCYbpCo
zQ#<E)#xy3e>*Ll-myL>ga7{=lSKo`{$N`Ek$j|o%g95;EFn(V9d8W$h{V$U;m>sEy
zQ02kdqg}U5*N(1AD}S|RpNiH~r6q6ADr#*OuRi)aLK(tx2)1Th)|&@hg;m$w3W9r^
zMCPhS3;sPnx9O3s7$k>brRIagF(sd~NMWwFRAWC$`_@By*f+nvmb>rwokguY$m#p;
zh=F9dXG<kH?yOAoQaFzF&b#Fo{bYoQ&f>pi*~49J7g|OWI`49eS`6!4-Kz60xX-8X
z2U?xC6R<(lUk8+(do!gtHw+jh2iw@YO1rE`Ka~OF@yHKZPme{wa!g@JY$_d)3~)t_
zXT<9N^7rX6V$dqbDo{=i$1Akn`!v>BTml}oY&pOuk(Q;$KItrZ|C_d*`1}<oZT2l6
z5nHWXHW*^glKzt4GgL9-tig&S-jbH(3voN9h7(SpYZK9%kJPaq^Tr-ABG<~BexX71
z)*+v(-@dr39An;Kw6RkER;By73GFj{2g)<vPyr*vTGC^H9gRi1=_C7b*JaSP#*Pop
zc4gH(0|BNtX**QV^@y#!GTWtiWUEfiI?R#<(Z5oU_cBZMo8yh!Xv<KSRAB3DI0s?j
zehgp3%-551lxY_j{97;sgXosPgtm!epQ()T?^ibaH|;0?;R3z&;31I8DuM%LH0KWs
zO4YW^IG#QNfNq*1d|#L**-ec?ra^XI2d=hp{^Zwf^6S_B;ymd*W?wYF=_n(ecF>Qs
zd+*k&Nh0+QYmzyJn#NR>#a^6&!ER+8_Tl1f01al+8()GJiE?kqs2qIH2d?l7C#!K$
zuH&MaL?oq~b{c~(un8Q*I1(OulZ0}bxNnqErlV@s!y7LM)yN3hnAnZ(UBcZfkt|3y
z^7x%$joEfw_7@dp7gg(dC$nCT_s^F?f)O8z6YW)$vrUdkNQJzmCjA3;&$K4H%$mQq
z<dZ&59+Yg_DyY#DUY?I`Z+6|HFd)Vhbka+GSQPu=7vyFTo+>ti%B0%x;{6z|(zBU?
zV>`EC(`~mhE}kqO_Hl4!IUZ^jH~93(1y<*E7byo}OWZtLbD7F&t)}4XigaKmmNw2`
zJ8P4GE5S&h{tnB?TwNla>R)J2(-a=sLM;{pk7mYV5H#PMQ!;&}^y084MV_8xoDVQC
zgN&B+>koTt5&FtiYvg*%+&m{q!KupYuV}YFW@=uZd_~P_#0O|s+XSCU{(6CPye;cr
zz%;J7En(z|B$E05^|irbsgWwqb~Cw<hr+@IpWGBEl6pIwj>6CGh4eztHj(~DLY3x@
zR@|6*{))fHjJMTNl;};?m$J$U+*DEQem_kcxSvR=tosXoWpkG+S(#~4PQ_;SNol5h
z!UWHfeh5D<s%w4G10)VN-nSOaS?uv-zV~x%vFRDRrdCo(l5!frnnAyj!_hBmQOazd
zJ0tF{xw(oEAZKY7Hpe{@-$x#F9oDKc)2C}|AE<1qt1-Uw#By$Rj`?J*%h7v#LxL?Z
z2}`lH%FzP*4~Kf9VA*T}>|QATe8gMXJI#3{NaZ3!WDpmZtxhHYGn0tp3T@-VKl!Fw
zWRzz*R<EL>7;hZ>2Wi4au+z4N*TF*frB1VRkk!5BFpLT7AUX$n*AQB3aBpb@pr5Rn
z8AEG>dHnWt7KRg|Y#>mV!Wj|l(uGi)_9pEGE~R^F7KSU_kvM&q!Q#~R;VqG)E|B=D
z@&J-k@7honaq-AX>@|Rf6n-#w<BhtY9Pk#Na)J|+njnJ04WlGb0pT+enZE-I)DpP@
zk*(l)9u)5JVxbF%fx#`90v?5AJYqhms+gNt;FstAButqh?YbQ*iB5q-=r2Uuq!-M2
zAbjeaHkhvWfNGV|_u2Fh?8d)15%GZLz$v`>*9^M@l^9#w`L~8KcUsD=LY2+un{Z)p
zAI|r&tjpBv6MSLQd^cu8fLB1v=Jjg$U8$k4L~n4<A(NNk#@?t@$k6eADGf#@WaHXX
zNov%M{cRf+<%{QhqM7i%tE%3qJr^}cZ(3E}4Z232Nip*dg%EFMa|@da4$Fl&;*|jC
zP7(jw2}a0dXt`Xgzfv8baa>w%ygYqO#m)4NvD_ZN%Ktk2JEfgI>x-{=lk~oeZ9@dw
zs8w4!L}VQ|KHVME&;4$m<C3w*SM9srH#$H1i9kEBdUgU>R@3Jvs!;-e;kV<s5o>{x
zcGJF=yv7gElycH+DeXwR=iY)ZLx)$>wm)+2+&;o4?Dn^ty&7&vZgR~pkb~^3oSdQf
z5f5nF8r08nkBc9g*EX7=w(BR2G<1IR?5M)YvR|rsBQA%#8u;V!ex-YZL;=nmUAr^l
z`i?4!n9b-T#^5jZ3~-i}%(Qme%EWQ4P?1_l8~E$CQ5u7Y&!x+eTbx|<I-kyUP$T7(
zcwiK{+P8qP=}7tMm-L8J`?kH<uNSZWF`3^LOF4<h=++dkmE^trjgm(a60vqStU|C!
z+GoHR_VExg2!_U3xQFF(cFY>QS@Q#Xgj?mi12Lp~aoHN#M!ifhn=!WF@K3uc3u0Ln
z*;e5ui_J4}EOc-PD+crMYYfvp(Yfg?6b6jy#~fRVETw&Yk)^FgI{N~hM|ZAn;^IsQ
zTT@)M+Ho)myg0#zqBOlNJ)8-C^5-bVuC`4=qR4#_dt_L`7N?wd*ZC<fWT*pz4Cq$`
z_&w0ft;`Q)e)}@?BQ7RUwxZiLOSvuRE?hxc7kgDkMDQJjpRaI-mjT<TP{IcdFRbzR
zt;nGwN!v;zfu-#?pGZRaHtC&k`uKB>S0FE-2Oy7t_4YQ&#|oDF<c8Q3Z;NGaw3jG2
zL}sJMrQs>2jTtj#{G-=h-bWstb=R9`ClTV{agG5j3_K$+T|X{z$~!SQAAwHgf<tjH
zBao>4Bl&S=CSAvx=J?&7t>z&p7Uo%OQ(Zb=&>KJV;VH--&F~+Q(?|T*Mti<56WF`1
zMx}w{xpLTICo^UDi{p}h9eQ)N?sJ-LT7QJ|F+L;qPF84PaflZ+yT-4rUMx#Bjvg(r
z0b<#9ORq2aXqE`KO%rRVpX15Bm*O<6(VZbpNaloXv{qsY4=WKhjnMB97S<#uk-1R=
zcG{h6H4Hw%G;xa&O6%;ZdB-E%<W9uXs3g3=2LT<>d9U_Kxj0ekTO|XBeO;u}&NX3T
zoFm7!Ek^ne9FkUTGpzVwd$!NhK6p>JO8*4?Cl^4*;x0aa2TDEjxZY>Zjpruz_3lXD
zJED$G^esk&NqWNpjl~6dWD!S)UK{@EnyHv(0W0`5MQ&6*$EHMQfH9#_5w=`te`v#-
z8Y9m*D#n)aSkTspbX&jO!Sb0UQRi1_-;oBYh@eLYTRzJjBBj%`OFR_d4j-%6$Ai^d
z9X~Xo(S7LY)$~2iY2KP3lQu-Hqxb`t=Y{^Qn&TEPnXbX%AT~H1cAY|l4z~6-|M^Ea
z6n>P)C%t7VEQIQ8Yt%=HNWZ-&MYsK=hNR<e^7H0}zJt7u?`mcno|J)K*sz&_*UUn}
z4be@8&oLz(2FpIyU_j-I>B7f*4~7j&6XMR+QQk~U5NZaIwgFZ(;n67KbB}YOts^)b
zA*1;Tcf|Q_MMvp{S<}}%>7kVF7-p9s#f`7yA6=9%g3e;*N+8z1eouv_r3kCA6Yb90
zeNB8vrCL=#NM!Ma&^nXfT{D;q9sF)O&O&TM4JMf$Es&G02sQZ+Z)1xH8z<S$dlN_=
z%W*n0j(4#Cj#QJZr2r(o!Z{=uivSI(;`8|84w)?z(ioC@WKB0FX4*4R>o#iK;+x(4
z+~iiSm22``(gRR>Ote{8DFr#-%|5r&V+f4gML~Yvye$|`?p<my2~Y<&Y{3;%X%Hh?
zO&VqYyz+dnXIEfRr6YjKV$wvuSwMF4Aj?|+yClo^3+sm}+k_PPnzG&v6t#-3FlK_z
zUn}nc8?x9%MvSl1!LcyT512YPo@~jFu6NI2MhT)xnpX@z3ke)^eS2K#v1}#^{t9;q
zNLUswR7U>PCi`ponn?@eeyGs^7Ti}^F6E0r{5}Z?V830O*FNC?kv`}M9DPg%jz?T9
z>7s+u)&u{L@|zcSK8WS$=~-F`=|XbOYoG64&_+SILFp-0nl99T62481GyD`HdHLQ6
z-Vd3qBJaE@R`kQd4bw}PqVFkkpqJ7MK$Y3O&uwKR{Ih!Jnxu0GRzNH2D8|>S*B&tz
zQ3PJf(|tVH;3imQY`6d)XXKjV9()%*Pq7a3lF9w+aIc>LcZz1SR}~3DDofV3@a4Wj
z7M!(b0Zr7zz`<<Wq^?7Vs}Dr*VSTKK8PU?FmKNK5@^Go0uA*@|0mDe{@+GDCw=vHx
zB%uecqVZH&*2Grv;U22P+@`HEj)mto7HKy7=2c~RTggP-R`k2Yy+LUqi^p@@MoHO1
zD=Ew@rYBuKM~Z2bK9x4VZ(BKz-z2ZbyC=GakM6IohS-u)L*QnUO!Q7hunTlnqnIa8
zdq1-a$-huVrUW@<kR!en;;q#GqMBO+88Dz|&rjZ8ZmeIlu#;D_F&jnu_`8*EoYRk~
z!>jKKTfuD4uW-mgW1{M?Jlnl!t*187NLDl5BKRw*<9X20T4}vn<3G+XYK_vJm^*P;
zPZ1&=!H&hMY?@o@ihK5}A_D*W%VSUx4pV#ZQ!<ZCA*MpVy||NEP5NOxz~5d4^>=3*
zxN&q$Omfk+ddzsoOZ4~#;Ev!n;22_jS5Q!o@!ScB6$wl7XO#<i4P!3Sw`eIC*N<;#
zV26ZOaS%c`XN(mt7rbwC)NVdm^w&t8x@ftct;*)UUHYVy?X&qzE~>B48HdblBB$(!
zmzVqwW=ykbA2YIyH98STYY6G=p~I$OmJgcf`+3yf6%MS#&LxLRr^!f<vB)}#l|74U
zq4sjs6n?Wg;Y)7fVdUWHvlQKRBcj#4#!O_d{`4gNaw!4D(9VdNmc3T%I*i@#_Qhbn
z<*F|m2Ar+^=@M=5LB`(MslviY)7qYBZ&V*mZrq?LhiI?E0_|>72+`b#U=*+wS1ODZ
z1AguIhj39e@^1lEJYRiY7CHVEqR*aLuPxg6Z=(3mVui(b@-h6Jly9X|4J~qCIc$w6
zl;1?99G<<$?nV2IwMm6oJyV+ArgZy)NP8-j?uI7qDvS4iPS_f*=X~@W4K0|E<-GPQ
zYsC-JKW(Hg)rQ1O${+M4_w@wWxuI$ol2^*JoU%o%Q8t=VoRfI3*!=Ig-3>Fg!`JvR
zK6Gb-9awnx?U=S=$6BU4Q&lIbyD2$s1C<U+J?;_1W)t9{C2c=&sf?@;du<njXN=<4
z<2;m3#9OyIpygX?V%*T|-K^cnf$$NF)RtZ<P-Vad0^Rj|<4fqM(22f3ULTID_$s2?
zj}hr5ZBIXhaVipDhfA4~YFT5?CZ3s}SJgrw8=e|;gsJ3W?&N+kXA|P)C+mv<4PQ{s
zq#?mett^GK3Zf!`v{lWBw$|H%8751Z19x`&e65Rl-tAqV(R!dWflNlYt6Jk@Gj|6%
z_7QCEOG0<jJW`nSX;m_R`h4#Yzn^cSi6>PNytmb~8z3{g>!&Fsz4m*wYsT(98p`8l
z9P?chjrDSDs&*J_jg%wU=P%MAF6bu^x?O47K>BDHR9oyCh9NRT@b<Qb`f`M)a?$JJ
zB;l(_oXG@~6haB`iXNNVPjsuOc)6Y<hI?{Pg}{D7$A!~RS}gWsb6%o#^vg1eWEOu8
z+OM)J$Ad6l!JYKYy90S^v=yj4f_rOmy~e_4*B^SPlf~LXLYmV9CaVW!uT@I*Z$DDV
z28FkB9skV2cTw34hPX_B(`>LnG&(D|ql@BX=)O98*F}Wr^qYvFFgZjkXAj`G=JhMx
zZdqgbGlXxzeX`d=E&`lgQc-9OfUqPT*=e{He=Js=Ay5lvW@iG<RqB(CUua(0)cYnT
z?DSjr=S#QSI5QCnce03bR(STd4>(Wz9@@V%#yGVqlr<b;nT2ekD2E)1I;-x-{<88Z
z!s8d~m`Uhb_#QPGdd5bUvZK;C?g4-9@Y(BUuHvoR_Wbq@{@lFI!mwqST+bB{?+Go_
zoXhZ%_(bjrmHGn}8xST{i-uk=H@JV>#Y&_#L{NQv?mv~K5bs`cUDd{iW_9p0q`xq?
z+_1dOu2}D0)aguv>%$JCTjp6~-U$74XoeoF&5M#y)&NF^*wys|L&!2e$QnIROVBZ_
z2H6gujl6*5co)Xo{dD385-o8`eCMT@N$clW{8|7f^b&OPr;BpxDnS48<tBK+-hDX~
z2FLQCL@aBJE4w@fMOBL>tQ5UlIPT)B-&oAFl<Q<c4kervOkg+-?bD(x$KiRiVshO(
z?v);>WJxg^y?;KXoSdv+7-Rck(ab=Th<fy7Hm3dumtR#<*q6gDj+L2Xjook@BZu~(
zeln2<#yd5<zOrHlLW7Q*ZJULq9UoB$(FkIlKZMXd`b`recW%I`MUJ^iDw<-<YYD0)
zQDWRo3F$Pv(8-ik?l`nlW*e7OViq{f3dnb6`P+2efm78(*C}K41tXY8=UuVf3RS`E
zz8{RGJ7Ue;ZsjMZ?v>(gRMBUnFZJNN_TZl7)(>CWybXVCUwWbqbfn2^0+CW@@S$Yq
z#XKvXY_=O$LNG(}(^Mo(VFZ8T#EADk#GJ`jPWF5qaYvQ?k9n8A%co@V)$W?S$h@n3
zMRsX?&xyfCs2B+z_1uZRGW7>(gQ~3-Sf$nA{>UxHj3VoBU*E+Zk57%PuMJ&3mFHVK
z3@(M>Q;g?m`CDl|tr(uS06_;dnmdR6lV{q;079DKLh&&r!VpSd9eTz2=C2w7b7YjV
z(JxrzK%8>eYgf5hCux-&1r+a<XXfhmn#_0QVT`LEza#>2L{lK+f|}GDBi9zhB4yz3
zj69XZAL|F-^G(RFDrkF7@c50=4Ki+@_k&`$F3}JqrTBm?87MsDt8Ux!4thlgvKo#F
z2E)scF{gCU1c2_}2nojjG65%3a@E8c*y#RL1%LiMJz%WUE&%(Tm<_`tpwHva7t*l)
zy<hs1f3G6vllg<@LIBzRX^l&8%e*O9^p(%vUqQgAe+mN5qG+^pC=_K`E9>#;hM|cl
zj_zi-6DL(C=ka{}xHjhN-qdNP(idlwCXLf8xlcZSJnWT?RN$`wyIB>=BtO&!QQOZ3
z@l88~r_-f<-q1XY&9<9uED)-eYkz3p<>P^`6;e$f=Kk@`$BzbmD*jN&T>})>Mr1x$
zn4zixhXKvufR?rM?+FmC>BR4Y$2;mM=+O&WsBX~fA0)5g<Wc>>bnczt@^hb={noPl
z!=kI;%e5WmwZZn*czGmB=*~07i$JnphC0-h5BBjO%qmNtAD&_L+|<#i&c)Z|Whx?O
z#}ZiHvX5hn)OS~Dkz8x5oKMNMRtV|v=16jFZizG4I0yB?H(nkTnrG5a*6mPq+d&nv
zrs>GJuMp2c<i$7UDqe%~EI0Rua{N<X{(A1StBXJ8$&Q3HsEGI8P2*R9`zbmak)hbT
zgSlD=?(iSO>iRku|0*A}Iyb1S_mg$?UUpu2D+c^9aq64ad6yYSRpD!C0u(gggs!_I
z<{RDiJVEysNKpSs)*JB4ciV@nX=$|(<rhVN@+e1w-zrM0b{iI{&FC^9y!KZAE0k{%
zVOozpT+NALW#4P?&AIHHxeSLLDVcJE*4C?^hgd!B#t;U3-W&K9KA)gp8ki3&%0-81
zHbMHwEwWpkcWo3ghkOIk3YkW<LLQyj3<keK__uoIy1IB4)P60}Ww+s=6k9(2adQ_L
zo=e&`FJL6qbQnFq(v8K4qCIe+7r$79x*WD9ld7bhP8bB_-{+BE3mkmxZ_^TBl=soq
zRPVku9DBf(-FQD0l*=v0<)WOf098J~%i(dUOVo-UA#Y#I7;uil|2~jtEOnYvxlnYi
zb?B>3tzK=<nl3nGSbi|us?TNvndcMs4@BFe@K|084dRM#9hteFIQdih3@2gOD?Ksi
z@yrEWOgpMj{;rZyRU#NF2p-c^J+E6McFWe<Re@!E{A(?-B#WqLEsi4m@k$l|0CC9t
zjZ~BT*<~csrqG-zC{WvVKJ2^e@8huDb?hfnSnnoENaoH4sc<Q?0NaPqzTE?z<Re1)
z%w(}s6<)R%!*`+%b9|=qCEkjzX?e$1LBzXUtzOolq-yNwFL%o#^r3neJff(a7Ni}=
zoDLeL>md+CvfkZWnQnY`Dm-Z0@Q`!1Z~e21I4xLi%N2jF?C1vERChW;OF+-oIEt%P
zrLzq2MI@~rwOu7=#~*O|4Hbpxit)KR6C;*oyom{BWQ*vcsSrb;_oI&1W~-p*0Ec`u
zPq(NvYW$LAk^L3sVbi=*JMf?+ZFP(%(rxgdLm5GP?A<O?{N8d-SbJ#bAeZ8|%aSh@
z#d?LphiA;h@7|U#E4V+OLcykR%(e5A=xepPq{!4%zx3DE_|WCHfMpFaT}j)%jD1)<
z_{v`4;iXQqKan6==vD8x9d>hg^Se9$ZueZ$Q=9#gV?|?SY$JnG%1N*#^e|T`=E7X6
z_I1PCqDrq-GMUndOQluKMm=JN1Me!^u`nY~_b6yt9=Qp?xo5`o+H34bZ-cgoJ*fNj
zfiyqrq2;)j^e16{reAo$6juH?ePsu2gX3NB*E577PH_Ul1S3g8-I{1#hedvt*FnrI
z=m0s_cTVmu?=f#5;so?K7aUGDfEc=#c2BUpYuiJq<bHt1GTnmA+`BEWp9OkFp4KlT
z7?L$d)ESW)Jd8a_-Xsj;#62#V1eI_ROBjgTKQN~RcKj4AH((+|+zqL4$#>fFWnvrl
z=gn@Ks@Q!6kH0>Ajf;KLMoT{OE&_Dq<;Yv*@MBbIvJAuNeN^3~2m1PQxe^SZ|EY3V
zK?W^UIXvc{{hq4-ZD&5Cc~h<kLdIZAHS|sZq*s-|SGU$pFsyiv;cN0lB1_*le8zON
zQDb#VT9$>A6;)ezJfv#E)_1g%rQ(LLwn`R^BHc}A>t(dCmL<q_D~DROP;_ExwT^!A
z+Gwk%fl!pm+y@|yd__NWKpR|vSN2vBI%QO6KnU5tIjVwT`G2%;^*E+fR`s*}p1@Zl
z`V2bh2)aM7w`(&(k`ef>9;yERJds_-&}#bfzG}BA!0!lm+Ix{@J<lv)&Gxgu&Z(E@
z6PC|R=5L&n)B(5Bz5n&}44^2baNc{sIZFBCHI(|s^!uB>Hm5Nf*})A4evEol^|@&V
zh!MOzp|W9|@EPi^lPq86qEL^ZzKRmZ@8hj$8+c;NKRoLgZP?s$vu#f4fgS2tLZU{w
z-EWs}jFb{%jJ8*<I-}*d=$+aWHltrIu~@~cQe}?FY?8uLXQ?dZ8`_NAfy-j&EMe_l
zevVgPx!gOLeFu)6e!FCG7t>E&ArqnK(9yZv6fQcT_|@^F7gTc)cMiD|WLmu{k|2=$
z?z#S)ywDOhj3xxvd2&L#wZ6k#0B+ZA7hTVCHkuoSVp_V!3GT6jU7(}+H4=IZ1#~$a
zEy_O5(SKO%Hov4#YOX4Bn?2rbZ>xU=zuMa_)UJ<HE~=Kwt%{TLZ&&)d6CNMLVWvEZ
z8IFmAqDF?qW^!xg;$g#8FiRKR5n5a(RyOXZK6f4N()~-DS-aEStY^-7xUuU--U|rR
z?Y$cn$c2Wi_N3>``c;#Kf~<1%jh5zTI1YJM`vPA=6%`2yR#uw)N-)VUYN}fu33)-l
zGB!*P2J-mR9eXK8fuxG4y-bLUf&QIH_mpINsC($(s{U&WN6Vbi>+lt<p3?n_Y?4D`
zf<sUh=ZNj4_+N3}8^Px_vAO(8pL7lx2a6;+2sHiUk2p3-w+$FkCGS4L-ni@U4h)of
z{93jYh6aECDGF)zXG`?wjcN*U-A!TsRh_mKGIk1UCEk)7U%tPq+qe}5ZS|Cm&YijV
z*_dko5{l9=)J`YL?%4Vxm>$x|=+5-*bg&t(@KloNUhBmKdhA>qG`328t-}RLRuWMF
zgp|dx{<XCom=U%Y&*K%uL~$Xzo1q?wxP4o~W5V=wGh5lJf|NYI?|TK6Od@#J0Hqs5
zBK!~of84&IVaxfA3H4@WR)#VXeg8+$<0;ZJY?1T$P|o4~Qc?y9>^OTK4A6ev2!IyD
zaL@Z;au682wwZ!gQ01%HDkHfa!KoqcG?`QaQ0w7d+}?Bp9Y)c7COh%)zu0@LsJOOh
zT{j63EC~=S2^zs2g1d#_7AV{;K?_Zx!QI{6-Q5EuSmEwg!KHA$lPul)?0wI<54W{*
zZ#z$`t%oGD#vHScK6?NEuLFXX#9cl=%8*Jr>ZGp&g!k2o7yr`LF`e6D`{$5~vqvH+
zb}&*EnLfKcz1mj*+PU0HITNvqAtk_p60PZ?M<jx?YSsn_dL>T2L}S}K7ks@gnU=uW
zHhLItZ$pu)?J70k%0Hl7dN!a*sihmi%Yqbyl8SEVX)E+Kz&|QqI$-ho{+Dj7%|ff9
z;|D4I^uEV0x`>Vmy&=Ni$$546{bPH5cz%NhdBA{u@|Fymjy_r|@)KhE$lQJ_9rU+Z
zc3Kkc*hYt$i4{U)`6kkDlkzpu;Wb)~-B=TS@h(-MI0I<YAP3O9?5JH;i6ifeyyX3o
z!9lIjF(@omsaG$7bG8RbY)eYFCRI<=f)qDAZQ43Pc{q?M)=@RthVhbL=(Fj)(!kpu
z1&t+^cW=)aDjN*ioizhAep@t6M@1<E2~6Szs(8#%qtNEjf&P|*l|E}wX^WoP`Vj6@
zTMs4^iUvOIvjp^lsytKX^~bo+CiCt)j4_<bKq3v)^EP`C+Qznj;qXjqQh%2eTu0sn
zW;}ogy>0uiuf<4QqWWEQ8<Nabiw~_yhw$jts5Of-Q<^?j*<MZO%{&`P3VOjD9libD
z<PD<|$%JV0W5zx{Ge^vYLfJrT7Xl-T2pLVkSBl=RC;B-i9`&MF<rF>UK42@=&hVHu
zp3=+JBczYMrS5l7uQ8!MJ8e<4^>#Pd7Zb!u>>*jFmQM<V4>D&<PLt;~M>)!!<}K>e
zcDyis$Ph~>QqD>5l+8NLLKwPa2Y~sV%0y5Dqk1=CquZub*>O*^(J4u&a!FS8s3|Y0
z=DWpl#HMdg>^=$Z+;6yoqg7U$-vRmKKLPpsQX-#SQ88J5hO);y6Paap4q6Q`Jz2>>
zf{IZtvHgHdK2qAnb@?#1!P;BdJd<P~y$^E~$LEO;#K6rthrp)PzGy{q#fi^WK@xS4
zkMEsX;}Gb(xTpc;3>Av=FlfN|t9QIM*vnGO*FM4OYXznn%Zwf8ob!a~+Q1$euwl1J
zH`8H8Gg@x)Vh0$o$!1ks7*-nfUyA1pKLgu2<|vr5riw8=IDak<9Qj+DqrO<E6*}b8
zJm_%fqI&hZ^(vqa@fFbWkJX(h;UXK7Q$=L6+?}FRuWcqPoU|zGbA(MOZ5jVG%$PEp
zY={Vr6eNM_^;LZ5bW@8Fz}(^MpntdCf%18rJ71#{r5z6t;H9O?Tb%zGu9>K9IBQIJ
zMApiD>ZEO{?h1THlhE+shJW_-JYis&{?<ZE3FIp-{WR;B`|WMJ{CFgxP^8>73FW99
zkY(0qWIH82Ou68!EQu}E03FY(=*|=_vR|jHnswf~?8iJlG3^7UtuDRnw=_1W!R#V;
zO^N?_B)3l!fmr=pv?KtQ<5bCN-+LD1@-g%k0<Nl`eNL)w@y21!n_ueO_CMDLG_f<N
zT{TWF8u0Toe7*Sr4ei$NyRZ)>eIAqK;#0KiZEa`owj}*9mL742(NW+Eki{(p>E^^o
z>lgxb7p!zyPPGI(t6}|%R-txcEP)@ddUEfi&N<Ea3G8MC^<+4fIe>7`8xND)$`Nb5
z*id)cE$Hy6|L}X?OR0UDs++9U-5}T9esqM%nuCU~A&ulNqiGQ-YDr(|8P|h9@0e>>
zQ*Foh`S-pb-(TT)ODPxstha{LlgU@jkZ2UB-@BNd58cWzKJQv3qP4bLKz#%+nQfFv
zoB*K~ZGGj8vf18lSmW$uSNGGi(KziDt}t%ig9sS$@>8fX!W<}t%>mhT{Uj8S@*XRR
z32HCyq|v<Df=k{&!aSTbM8IReTV-)z(!rWvI2^n$?+qR=g#Oi`ew<qGDS#Sr+>Vvd
zM(VY!QzOZrs}f(sRNZoI-|C}^n7^~-LBWvmqN7B5dqHaG6iD?dchcg0DyMB@dlBjT
z+X{P<`$>!<zWL*kYxHWm2|GY+exliJJF!Z)#T(0BwV2%Kd^vr%{~@*t#gPnZ$!LnO
z{6M25D)@5>^5-6z9o<fnO4d|xX;MoeG4v>qk`4cyq4m;7p!{w8DAHIwX4l0$DDEP-
z<M?<{mR~xC&h;l&7y@@#4(ZFGSl!ndjh{aH09D#N_%q$tgBSA8Cf-VomT$4cza&U?
z#S2-|+B!V;!Wu~cBhUM`+jUnRPN?cCCI1?eM;$~U3H|Kzlc#4C#tJK+7Sp!fRJvEj
za<@{zuVrsztrl#?ZZKO&jQYi67Rp-1L~+D|C8r=CbzcX}RyWTqBp3F|#}g_8mjFy}
z%v&1RxSQAKQtFg4(6N54-ToW%l6vZ8m1nr2v2TQ^UFsZ3K$OVKeoxk~rH;4ZBcD))
z^RCdMTha<YGi#vkY>gL_0Wg&sZB`g!L!0@T#rD@g^5XCB?{fFg8Cyy4VgZ?1-YgKs
zm0x7k0m*r@v%LMElDH|_Zm+9PzccjbuX1=+lhDb&#jHFX3DM-M+Y(b)vLjsn1bDYE
zE@0Y8Qyr(3^0h?KVWM#DDySgntoQO;J-Rhe=^Sxe5~fzkGaZ93X{apv#3y<cqd(yP
zB6aeJ^$Jx}T(efkJ^5(L88en;bUAw}qPI4^-(6qK_6#uiP8%QS1*db{xB!+aGGILB
zg1>cl$%qBJL(F{zOKYcQvCuX9jq%u9$J0&!8di}LDf1cmv#l>7i$A4g6IYpw%-cPr
zUYr5o2S>G9lmKC9YlX6Z{RXlV8|UiWxH%W6SkJGU2(E^qD0a)~2F(QR_2Q{lc(De`
zOkuSgGxx<C##MnNbEZ7LgIcTK#hbu?6>r*&_i*GA+D&7i_&Y1#SfJc0%{zAY)u7$Q
z1wgf^;jAh-oQkyDi&lwJ!LM^OiX^KgayU*`8s_VBs@RUS!BbNG{@SW0G<KAN@tjxP
z0jE^uD8TN+-e(!S4?H{{h)Gz6>(Ai7j3wVnRm{s8@ihDdOC4DG{8(sqi)&YCfO=Oj
zc_aT&2_vma^V5Sr$x9Qj)Zzey;=rc<g^s*NftE3alb|c6;Tf1fu@f{}F6nK6!XiGo
z`s}DD+@V=>b$0xVCauZ?a+}MJ$GY3BU&u+E&&%OzFJ2eJ70`gxI^#}EJ5z%irude&
zpQ*rx3!K_tMbPnUa3{0TexIter9}=SqJlrf6@_H7kAYedly5|hmcjAtK3=1t%WGsh
z;zEor5p&O*HWYzLSz`R4C!x(!7`~rN)y6(My{_}bJOhji)+^sgw~`{FpKs7OlI%rW
zz}ESB!GPHP6xS%hb8oU#i;^P6s)+~@USAmqs)8;y0tz8OgSY-`G<q~zB)Uz;&ByBU
zrS%rC-8gJJAM@8wzZKxk{k@x$F!I!MP!qNbn5DhHQsrHf2LDmF?4U`eiSkHaD~x@*
zGVGwa%qPW9AT}%bYDtPlPeL4aC`KHW6U)AU|Kl>XfQ%M~G=P1^!$I&zK;H83V0|W~
zG*`F9{eWqar*^F+v+ellW8IL>kyV-TR0+3e35}eHof$iV^(|9wrxw8alJ6M^`2f~U
zaOj|JKc<p>r$Q#uUAk>m2}IWJ_O>XN%XleehVP;{z@DARRmtt%?dCZR({SAs9W>U_
zTnfFrd96skSLtC~B5JoT+GHypS-AckJJbQ^)nR{?k&kh2mmp5h??l-5B{FbLETH|b
z(%=i*2oUPbg4^u)<(G+!V#5$SU$|Y|r2B<3NA}AC3|GOxZ$Kh^BB*(=MmF^xpU;&X
zMag*sksdcgh0a5Xa8t`JsXv*}C@GSHhx+OEB$&7m&Xa^poU$6iJ)xDinXuVglqO~c
z6(i?s-X|c1_B#%<m{s`J%dr_H&)w8i2W|iz3soA*jPnd1JHwSau_RkTKlN*m0#qR|
zOl$xf=%rA?D@z%-WpG5w>*EACGn;ObWSGyX+TtRQDes$Q7B!}J^x4`Aht~x(i9hZ=
zYJx+?`T8hh!ipcavo(u>)6=JYT#5oO-LO~NBoQ6sGRNPaD(a~tervo-`^b7>mP?Pt
zPc8U0@BOAlW7+shPV4C_57@w#^tw^AnN4c1>N|vR^mBJY=xB(7UDs-bVd@5e7~EC0
zHZ{=(D^9pr$$?}zPwUC3);M>(7I^P<(a&FSB9u7$-Gx<=;z%LV#}TRuQ`P3tgkX_l
z?tsi4nxy{hCBeJkTY1hnaY9bBZ<#1uC;7%%i{Es&jAxk<?9(Zcu}3*9J`nYV?+`k;
zv=Af7o7Id{ZWsfqVRHGo3Oli@9|Ydnu5@`!+kpNtTXj@2DQgD;<8>zsB8^2mRFJz6
zZ0L;1<=hiv1u_rD@kR0=7ZrMoPf*m7sPb`7#v3z2bFpj$(0oum^Uo&3PKBNZ5Vff?
zFW+b?34F;+eKElh?>#%JB0f$HSf^m6d;F7$&-4uc?UZS%X>mt3GfYl*v_5A<n=BB2
zV(552RN`~*KJW9cTM@8sqC<v7k#@B}2>&fdE|*l&byRVG32|J2JNuk%BW>AW%9%~2
zkyOMNrFqR$`CVXSRrXfy%?Q>wyrJ53CP0>&FRrB92q8P|JjHHK6k&S`ef?X$D`9V>
zqVd!+*g3#jt3vH0k!n`FW|V6>WToz(fGi)4R2u&~+YtU&wn3gsh1hiw!n@zlb(`?U
z<3tuz@=5D=ohuK<dxJe_v^i?&*Ni@mng;2h^%yg4So#U11kfQfi{x!DB16}~_YZ%u
zUbNM}14NNs{*Pcg0&nRRk>RC`E;)pQfk+oC>%CF*_a@T#1I5Pe#$M*_Btw2<w3pXE
z=vvPX=Xg3F#l;qXq6k%8NaGl@1or*S)oH}`Y$I$}I`Ot>?yk*~8XZ!SLzQ~X%xj*4
z?&C!^`_vlX+x(b`w&d_QHt0o#Fq`rKWwtlZ+<jyc5?>X6P~K(nw>Ni~P0&^k$Seg)
zi8q(WQ6WSnb`|kx@eQAM_1usAt+h7BbWR=w>aAPVXn7Z$jGF^xi8?)b-xj4s&GR{Q
zc$V?LYs;c<8KIEP`~^{bn(y$9mWyr0p_rTYS<f)W>sv<skQCx`-Ai<vZ?>8^fb+4=
zE7>>hMvIw-h+H?yjNP52<#LV!ZRF`9leCXxc#EUst$n|?A^ehT@P)@>Q+E^Nu2Lw!
z;@vg_G(v$akb5{T$9C9v8`g&u-L+f0@XkTSts$`Y*fz?=JEg_IbrgqogPoB-_s0oP
z1=m+s7+M|nR%Ik|0zmOQEe~{+i!^A=x!>t!wG!AR2WQ?_4x5=Ba-v$&q7ZsCn=daD
zAhdZ*h42&eUCx%skA3=TsKaiaB#mdURg?xLUlyeudA|3igVt>bp`}Wd7^i?6?05o9
zUyboRd;2@c55w86+mW-zl}cDW0P7m*)XUr?u2qeB-{x*6jKR|r^SFBPxQ4W{Py|I>
z_7YN0t3lpN1db$jw3m;%U)QDCeAs<3(JBQ?2I9uX*I=7Da7tq;i*$oyarA)&P?RTZ
zj8x@eMty7dK1n;_CPhrTVVT?8d;#JRs-C?qO+<t;klAJgP545?nEyb~@L~Lx4GRUg
z`Qv>NQ5>h>KG`5A1)v)yMMhUs$QO#p<UEz`%QZnsAq`P`{ERsKz}#it>%fW5dw&I%
ztnYhoph8?LO$}@q>>j^mQ4PIX=iTAJ1gRfOlBD|nF1j22tLQGpXCrV8ICR%b-FRni
z6H-rGWa^gYSTrm5uB};-8lN?3++ResQ&pU>x)}J_rSCPD9)TqCPe*pVRTbBO=B8ao
z$0~428CS#yo_L`M&HXZpKS-b&d!IQ{U3o}g)qH*wg9=kCaL_^98I~6&d`Ox?@m6xI
z@$%$F;m)BZ*~jmeiENgUF~y}AbIodiZOo%9YR@{|jB&arOPiBl@Yh4+9fsA^7i7V&
z#*_qi3uA|PLL5Uvn@>k7AB~Fjwnvd8Hs8zD9oIApmGUV^b3>}}_qKEaO{D87E*Ry#
zeQWiHXZ$;iNWM{(IHYO1rd)9_2w>qkji29Q=LcMnEpI}aoT^Pxh!eD?CnBE^vaPw+
z=Zr^FU!9K2%8M>Sg1PJk>(#^^;N&7ZU~D{46v*>(Pw4q(UHNu$irU<-LejCxZ6W54
z{<r?8Z!1H)&;3_lFdCiLN6K=^yPhA4sejAq_zrwhdu9617VZnIn`7n0!5CW~jU@?)
zVbeZ#zYm+|HE#4$BIV+jX;K68m<37cW2X(Q8)?myzV=Gj9$#uMKA$|9EZbFbo9qjP
zx9@Gc<W|p~2x?b6-QVoVT3UGLF<Dd=BF_m~WTHNIIZW)!*2i~f>S3t^Y#Qo|jrxnh
zr~K3zFXREWsmV{tpM}uLlZ)m>dMeF!Xwss-?+bh1b57u(@wOHw+$H%Os^9;L-O&qB
zjHM$4Q}Nilo{uVG0(y(`#@bSGIhC%d$zKt8sH@=;Gza^3pfj(NHZhVr;jQ;p4*7*;
zNZ}+WyT9v^AG3R!9-ZM@wou<)@7MrErlr}w@luC${S@rhPOe8q?<nzeQiBV3^Qz){
z3x8lsnRK>03U8v}lP8rHEl8duXai@F+G2uD<Ou<rx~XMs*ho3LBL0}u{h6dZ87~_g
zo4{HyQya(d?Lb~42_2sy`d*OZL9S6A={kgPhPs8j0iD`S?w=7CLUdaY5yWvCH|Njj
zEew4pzoSMbSiaWVgdL+;#+Jl;rnG5n{zBm9#5y#HaAzl^YoGk$i`rfr6KI`g5=cWn
z>QPP#a0)p9nY7=isfNYq-Us&+F@E3VTwfB`xO)M#t6&7*B&s;2UmAuS+B>a@x#N>J
zI8pArII>H?_$8`c?%mn8wUgyM|NAqGYa3j8y#?(EK>$~a@=6~Y`v4|-o$G&L5MH?K
z@2TxS`EhC79h69m5j^FP<8^x-3`&iC-US^enZC7bxtQRKq=aI)@iF2H3K~U!BK-60
zibsUl8$(-8Rm0;<be7T5-+C=>7(7`#coQJ~)Xt0Gda09HcjWz7q)1B4K|v$a-EZBk
zkjhj%TD_>wJ#G{>CV#I^3oig$v^d>tnnK~uh`BdEoEh50=9Vr!ce~CYhGyTPllyIt
zG>ZmQuSM)$Lfj2qgr#t=`^fA*clE)1;Pnu%q@nX&HniCR)$e?Ezd;s|W{zKQ;`es*
zxMBIbotJ}|H-B!jF@*vHUUrt;T@W9UkFHb5YgBxPFyBSPo=1F3PCq++`OZe$aiD}9
zmSR(5Yci=;V(y~kVTHkv&Z~p(L{8rdB!7snHZJBFgB|*I9r^&ErTNF9JzXwo_VN6(
zqqhM-r(op=_mS>iRyzxd0coB420!6tH5SHGOv+cko^@2ws8>&taJtSTz9!at7~oC0
zMS$n?3y#x0C@IdP3l`<~BN}SxdW=FN28ar}rIWU*43kpXuiI}?^&fU<P88XtB-@Ec
znA~Xq<YX_+_h0?kI8A<hY~SP6Nh6Hn5#V}+5%=1YlX-pRmoKKn6jP6+UrNw{9E7p-
zvV){GTR(>Pk2?{ze311J5=Wh{XLdv*-E+BQbuGZq8*e~lX9bwuX7QJxcT@fk(&IKe
zYCv$88{)>TvPJ>a=zE=w<JrqFD?~Kc&Jecd($hD5J%AfCmdzqd%(AvG9b=cfdl|@x
z)r9(u6l(e}P<6+oqX1>Qi?@V&0Z6f3su@-*jOxYdXTtyj3~jPP^4`E*={^!wxn;42
zF!jxahk%z}ZA<k%C8(V`NCGUe6=$tZ$!yAi?#h1PZE-{AtF;Xaho6o##V;xW#31#&
z#nw9&&$z)*pcZyb>hi~x%0Iec()$F{gI}+hDMt<N36S<gk;*6Cpu8-cg6>aEWr}#C
z(MO@(<MyA_tTYd1&<9HxZXgvzagHkdZW_SnueGSRz}q*YnKuW*llNp<Zq@*f;e}9i
zMO?toAXI)ki%U0qQGz5TT40NNoJkrGZsa2NZck8o-dMH&>Ub1tWxD^O`K~1;#RmC#
zm%j+pLGLMqA_~G*q_x%$N&n<vxhQzl-9d)hJ4QOgcs9naxa9Y&+UJ9o^wBeDjrk(g
zq`FwM0B3W0_E^x{YpbRtVvLS<QStjz`Mf*OM!P(U=`q*Q2OdwPba#w7(}8$`UWY{&
z5=yA(Iq77fn1j<ZT_5+L(>VnQ3|H%j?xciD{S$PY^-IQ!!|vhR&XOLbTaS{>AOvt#
zSK9ld|Dv8S%<gb%+nzCEJM_v|uFaNruSvAQVb_eW=4W4`<z_sr-Vsw-An?q#JrZC3
z$?{bpJmn|Lv_}~Nx^;GV&WMgyv!9+9lS9VR%N7jXHF>cc(TI2<!LOt7u>KW?FdV;a
zzqik7S@$kaNvLIcdHW!^ku~-)oBX58&CSZh7(7c4;1t}0G$mi~O+2`vlHCX{Apcuz
ztDA-A)Pmf=q(heoQ@sduLj-rY%(jM*i$i)ZL+{m)FoyV#%u8uaIN*b3AJCkkCaTM5
zaiS8=W29`9@?W{$qFKQ-iGvwaX-MrVooKXPVs)Wl+uf_Hl(c@^hf`g08th8)2&@8<
zz^-LHnCBos%@j+@Se<)F&*+VWcpUA=G952?c^1V_TLSpRBl06Z6i#B7e1tw!*3Lfz
zQ9tmik$WaS8Sj-Bfb8-fv7PkEH_rvoYOUG{y^WU)_*nR(81PB<y>p=U3hk|QWd)1-
zQidSJmche1KHvzyKx_|~oTJPmX$vQ2EZ&0wpI+<Ne)!BMj;vjpK98r}>j1NWO7^lx
zHi=x=r#=g9fhAO14h+#8CVx#h`ty*|U(b2e44axr_Y&<yreJb!-l7bbY~Ua?G@kM;
zF|j^hjYF7ley^=ymNy!35G!u7E7Q413#3s44aQZ(Z6x3mbfy8|4CI3jW}5NFPr5kj
z7H_Yn$%jBCY7~<-t@4H-G`;>uIUjQ^A~eZRPB7h2R$<q`i)Qe<UTWNoGA6Wnoz-Rg
z%X4Vak+Yws^?HRy^5XoX6Gb-h<Hj-xP+l_WkDmSf(@JnP5pQsrfj3LPG;(DIBSV6J
zpbc?S@wR%<0I8JSz3&-_tP7^t%9l3hipA(#%^XZhi*4g`oW90_tM2&I?he;$EawAI
zQBj<$Vmm?GUCUy!<BO(vyysmI{}r=T2S=j5Z`NI3&ppX9uLftP+%w~%#u1e^<P6N_
z-jxOo@@&X>i#cy_0kb|^KbARTlL5-fiTW}h7o)NZ&1;|Ab&zSuBgu#_F#eRz3ssZ3
zGt&b%%H&dwEek^VbcdZea~h*Ur<<*6tcPEd9bCuTq#3~X0qm}98%&f)>NW)?EvW$@
zptmtx_lTMDH~*lG^p17UD67ouV4}SRi#OyaQ?I>~6<q0yzTqAI@}OvaA8%ZF?m|ND
z2&{Ob6?yTZ&|2?CY+vWw#}}f8{AVnh1jo<c<LOR(hZbv9YN=^Yk}Vta>+!uFN@d5S
zZxf-lH#J^K)8w=}dXcYL=-4|fpjh!`An-XN0dN6~6X9oF_s_bx25OnR{+0AEep+U{
zSZ8+WRq3e$$z||g^yIQ(W!rlL=?V;_jTI{(%#Tcg(g@PlHVMa~;KqC40n}!JR?Jbz
zwNSWDcNJKn_)B)$4tHz&+QIsOdS5M``wFb=>q42MZkkp7U7If=Ow$Lvxr8<vj7^Ju
zxZyFm-Kg?S&-gV;jug?47fHBl)tF}i1ZZNrT=v+<XT75H82Mj2gE(_GCBGlG`;yGU
zR0_@&niH~AxI~y*a9QbfVXwV|DIe$Ls)%g&F${j>@FaxZ%q2=Hf6OJYl$?5P=_8%n
zoB&=TR(|M%u?z4c-^<kVA|*d$*WKx?QNk>>%r|~PV7a%TNUg@5e==VskKJ{yg##Q+
z4%DF0pcKbk<@r8DBj4tvdSPtcjppNqIY$_;R(rDXr8BSJ3poZrh=E1FbsEaC`l_<Y
zzHHU0SN9oeWK#o;9}{{HNs~eKU0SuD#M=p5+}>#W%K%b9?1>}dIzk2I0B(OQ@BllU
z{^%_UN~0IRX*#WwqNw_H$nE|N8n!>KYO_4W{UzBPLczEwX-@*<;YggUon@o93As~v
z!Fx3qXnod<Fjj2yR1yC`At{c_zk)}rSKJ2HOkO*0S4!M}sNe54%k}CbNY3439g<Cr
zObl5UNrM1x0YQ`w3Hgd@#1T%jbA9U`b9PQN*t-Du^DfE^vlNFnF6;|KT8?T2x)ITw
z9UX#@3U9;Dru$lx)?+Q&-)jswY~{3p4o6qRSHM4rUDPEijkCI1_MF*pWfg)$d-L4q
zgeeMDj4wiiZ3DlD-W0nVON=o5fF-ITJ!yBnpQsiE;d%3=cW^Th#8*fIR!#0cTE(5z
zMYg|7DO-Jz5tvCwE>7+ygLU5|7x)+Sf$5TwROm_?=$=}{ZcLPX0t60c{$0A|&!Zn9
z`72R_!eFW30X!d8Uh_Sb@zKYlBkbz1&ydd$A$^PQdBe<*-XI?CA|Nn*pTFFqLBi%`
zSmq~}-=!1emtyk)GpgSlCB=JG$~6)GFpJA%BkIR{w&NDsR#g^@aNAd0)wW}gnZJ5s
zF~kzrQ=fSyeVWz5KqzIxZxWy7JeaWKSg%1z5QhBL_i5QcKq90~=pY)j5XS9vQjU+<
zz&I8NG-6W<tClt1VJd2I`-LwUrzD$4&NM{0r~V|tHKv{fP9bJolQ?dNPYY#%8$fMW
ziUX>A<Fg&B?P8wj;^A-S5-WizA9R+nL$lJ$J(53nvOD{Oj@`l9t97fsAp<Jn<f=1t
z(8j0f&EUGgd1~QsY^k-E{}L*$-Djq*68o$K(<8KO#yWT_8XHmevNj#bb^pfGd0=T%
zSMj7%gQ0)-UYiDGLO2u%H@@tL8U890d)^<PZz(d3k<ZZ?!kL5G*64Whl!rpurKc%D
zq#P0w`;zY$pM*xoDU@73$*dNKHYx2HCGvWH8cU%P2fQGZB|pp}=jD(=fEi}Ys#F_b
zVoK4e(3C~C57(RgJXBxhcy2pWc-yk)EA-~FLxBtm$DPxy-B>~v`zdAGgl;Xk5d}6t
z>)#jtHCeJde##@+g^Mg7RG0aS=F=<1`h-UHq1IU1-BQF~hV_W>`RqOrk}G`)7lGjw
z=%t@&zoYFM=I4bSV5+1S4XwIPvOxm?UlHh)BEHLOMxQbb_T=)=m$pg@vS^v(VV~?r
z-$Q@HzZqjZX7ieXXN*N<Wozz`%L$Z#zY*8CKMgObYRbvf8Qg?*99M#?h<G*QWLH08
z0KF`rp{v-u(eu0P&Zv%VXpsEgdwM1Zq_vHz8P^a-689#&O!?jdjtbZL!AiP#U_)A-
zW{^P`W!I?ItFD_Yj*~m0ec_U+QeJ5gk!`YJ=#9#pwrjat5wg}Wz}Kg=IF64j-vl63
z>Swrm+n|Djk36(ERY2lmsBE;G6K5^NsA8${%7>pE$5;Uzi!YIVUbCx+=5fV)UuPX6
z-%Ee}B@e<7I;WMx<rM2z-`(|*tVFPI$cD6{0zD}|%*o|BT3Ko5gK}ex6EGiFe9!Jv
z{yBff8#es1%Wr!#e|4=xZG6ct=`(BhMf;IJi5*ZLIuSda!8RQt#Rnw^H{86%(4AZr
zyqIu9XL*))wqg=UZJ{;#yQE|PPe}*CMI7rJl|j;le7TUSX}Wco`3Piu>qOjJT@Xuu
zL?zc=+6jd4krTyCmur0;g#T_Q>1jacHalj^Q-ZN_lvS2pq-8M@w>N={8uTh-h@2+w
zuR}TBUIO5{GI(9z8(yu%R?5s{L>KH<-44X!bDN@V08ncpODdRCTzSj5EWH8LZps)-
zwa<jEcGC6l?1QfRn3<~Qxf<<G0~sJ+g2?-9T(3jmgaoWb#?gK8r?7>Ya`hA!ix3Lb
zXp+sJ(Uxtr&+$C$xhwkp+<!neqc7Y&f(#&mg{2=)=cQbGAbPB(pQ^9Y`ET1U{I!2h
z6kBGG8)vu`8JsjL70>rFK1CNq8`S7|SxcHUVz;>xa7N#l6|UJWMq(E=pK{g&Pob@{
z|ClX2m!04mXZK~QtR%_!<dBi`2I$1j!al9+7}*iK$Z3F2g!4l<&s}HP=+>VUTE=tj
zzFgGw6@>V$*4A11zb&rEqu9XV$i??~SEX<0LN@LEohEg&22@%%#u8^K>ZVy>0KURP
zRP6(mpuQK&T~Gp1a_T-)9OpuQZu5e2>@{(}K3cEg3<&2_1NurMkg?Qt(^h4En7Agk
zdkS9##y7Qd-8od!sx~lVHh8?MOskV?)iUQiJYO~QcpgLVQ6!9HBy`2p3Xc?reBi_%
zAw4)25>U^!7FE}AJ05lmKjS}F!J~B^h38Q~QHp$ZFQ++XLL?^FP(x=-73>z_DYq>W
zozzk_nw91*=%Pn7r6zi{JvT)cQ<4m=7NHKVb>8{tu3(W1LbUqEnnsD^xU-m24fain
zvhBl&K!RSHQaa53*vhVD6SksA8Qv2EW7p$rbemncQ6*V$eOw5T_+=1J7AuY_aFx7q
zQ`uHc5^nmT#-CFWqPYGr+n+kRPjX;OX}wPW&M350y@>Ucr%)O{s`K1NKJ!wc;5#Hl
zDI6erp{!+>iHODe2@vk`kDq+ilknJQeu<o67TBJ@R{Ha|69w}hC(3_MoJ2!;2-rsR
z4KR<brkLC;r~*Hg+h-5sY9d<MBHEkM#FmJ@KH)3<ix(O2=r__a{-2iae~;co@@o4I
z4xQ@Z%!eW;3m0}AsMTS$)x)-x>8+%Ug+D)lRjkILaQzJkZ6g8B*W0Nj{D0aL|2<0-
z=fNY!(CZD4`a#YrjxUHC-mQ1bJ&!&<<&URB;koONjLDxzld;yS4e4swj3NFv@bViw
z@C%y3^0MLp)=lJp1_AwnjA*rY3Sd9XQqkQ2ZsO6eAMF5@%a=o2tHCV0YTq`{MpkxM
zU<qJjM?qW96+-wfDPO{W30vzHf05}<=aI{I6utmRX356)j81_+z^DsATl}<Jl$T7t
zD2!B|R_OnheM(A#sRBqzIB%*Hk=6iV(r)ZQ7fF%k_iBRo;Q;EIYMIj#jr|cY!X$Q6
zv1i6uVZZh67Q)O8*anUO`v4>b{t%#0{_*<4@PQSEFb$`MQQ8kLh3Gx+vM~SeU*E;I
zHs5_S`@!UK{<H1U)?V)u`dG`>D=jxEH!J}iKqE6!U}ytP3L)YbB__PhgIPL%{G0o_
zCJKnxwWN+IfUx`if40VcFWs#T8Nz@f+aNspp4T{|G1<k&n*<Z%qdZ2Tb=40^Qrs!>
za=rzSSXg1--;zMy06+R~#H_o{y_RfM_#Z9Vkl5c3^3S5*FM+$WK$`RPh(fjm(mlYN
zJZG|Ko;3A(b=3KsnLoT3g%GlaHFBPDY2DA%^8<joky`FUKry8%bWUft;l<)c4S)Tk
z26XqIL7>n7%4hJ`r}M|3{r^0H_VMLki|`-U_V3;O*YCA{b)PSHiTy9Um;dx<!$$9Q
zBlLX#D}mrYKE(gKP+_-GGL64j0RQQc1^(P||L67o6>R=mk^d0_{lDw${Xeht|94;P
z|K6`O45?*O%TZY(nszS>5G0qx0u1Os5!=7@Fs|pz_GA3l=aEr`pD04021-f4JIqlG
zt6BL)(J+$YCb9K^H#zdUJzs&C{DTki)kNvr$Zr0XcV_Dab|W>N(m>)<@89OqydOru
zRc-T}-~6(2#IlVMmO}gn6ZsJs+P?D9CI@T}5EAF?oIn%_01YFSYSf79EZ!0Li{tgW
z&-{VE*aERGWpM9EoWkyJB6!2Uh~W2&ydrS#Rx9}DmL-gLj@Qa0Hb`Y36B!Xx%-wtW
zG%?x95lB~2oR9bLrY&1<cJkbAPC!&jHAaM~KMOb}i`7UelD~RH<}l-$ib>$$i%JnO
z-lM+LhF%YyuRLaU?f*!jZ8~WgQ8;T0K)`=WBNEr$S!@oKR7ak_gf@|$of56hjS2(L
zLb}JPLil;`{oruuvq<t-%^eXI!2cZ2aX|&+Q<Rne{$8>FoDWEgrh^|$j!tXxZDy7H
z1q%oL8x{`4GSX-F*+nLRQ2q;%Y~UU$0>;A;!jck_*YN71lcPb4JFUx1tokxN_nB$Z
zu1+-#R|?2L1eS$?HCd)nT=N6|Lpx~(RhqLYGwbK~U+I_3Rvsu|K1z2FvEKfh7`~yc
z^8`3N4X_`H>hdN_e}##ueZ+ww_g+5+9+ezOIHX0M?*lO5uYaQ8X%E&P$v?sN?jf|P
z3ZCfjmNe|EsjYZW|0~i8ASqf;X9w^2xd9V`A$oI>!*1^+^=JbE%NT`vZMTHv+uq|}
z7Sev!<4g^D8_FZpurN0Kv*&M^_a@af%Gz^z!X6&7WH2fI7g2hkZX9LI79%acW!%}{
zUQu2&BChx%gCn^?4u^5T`<6Pnq1~Ygi;~)<)nV@f2W73-@iL<OY4$M^*{;w%5jFno
zX!|9;4%ezcH_3o6inTjsNG1>b;Y<}@yDJ;r)Vad5H-HejZs=bv-us_-cyya0ZM_8G
zFHNLV50j2J+25gu1@fVK64!xB8f&774&4A?BS5kEa2HPN&jiBLmG8j)kQO8JCv_ax
zFqx_stOW4z0Qtz4z|hLpvkLI2GAt#fBUFGMs|(z(IPwzNI$e3~(cyD3h>`v@K%-{s
zC!{6lqXtSRuLDN&(M2DQYWyl4$tQ5`A#l$aIdg)g$hr%Z6y*ZI6AI&0J0DGxdlBfE
z=@{+mBPnCTALp4Dn1X+-7@t7m1jQ6I2Z=ztSMYu#;lKLlP6mAb8l+l$u23>$G!}Ut
zi(?dbw%3IIE3_trSQM{=1n80*!f4QErF8BWIP&^X6aQgSA<FAo>vsXT&qZMgl7Q+6
z9%b9@u8~LdC#+nBO*B9CDGPF6cZCE6;3iu6`(4{^JzhNgkd}9RvrrFHBn_k4-V8Ry
z`+3+yVvMf_P<DVfLqC?F0aQOJp=NXhr<K!c%u=AS`$X(R)IVwNk4M@y*bMi+lzTk5
zU;!g`SEZ3m%onB8-8aB|0vt&Cp%+#jz=N<h)J+t3H*#`|7GF5Gc=L!+avW%aC;Q&B
zzXO6O03dkX1{KiRtC!=fNdD?y$WvKv2B5VGjGn~=8%E0{bYOOEj@`4?YtBHMW9Tib
z!2<GISIt;Ue>}V9tnyEwh^zZQK0EFGv#U@`DQf(F_L%?t?Aa1{v6I><>!eC?{wwTS
zE?N>e{F8$;{(8AT(1R)dS#`AcvsZ;uN8JwCSP#UXxO@M#>NFx?jlWiXTBhl{QVIai
z{x4S@`17_~NcXEwd2+LWazKUoBl_gnsgeEn$fEy8Pma8JukwkeiHWTMZc3{mH;KS(
zIaQ$Q@b>QZtaY~(>bA~FrMkjHK?cB<-vKewde4)mhsdGm6Cmf4P~F$hxEyTUzZU_l
zWrp5i9joOn{yr-xc($4%>E$(mo;sC_AQdM(XmlOU&=R59xEKR8wtHJ|PZ%in@_2j+
zt^J~?G$ndt__SsC*56IvPRIaLZlkZyS7qH(RVwvblB|!!?c;3y^rGx`(M>;=R}NOS
zUJbA>_7;q98}tm;t^+`Dlxus}yF7*tS0E^HwrWUIpyq)9Jaw2&Kr&tH?P+4NFHqOW
ziuOgo;2A2(qzqjx{>pAXO;1yF8EWZc=XTK-uH5jY7w8L7Q>f&mEI8c>tJXMI1J^gV
z92}(=?rH#Hx|LCys*(vQAd-?^yQWIRN>H5hBr4K;bbq_p71Jesi)M7-`K4#zs|j4%
zpi{No1I@xzjTXIX=ey3(6nWySTKz1od9|96AI7O}RDDHd`|5Ud7NF}Uo2&xE;iV#$
zJ9^-@n0m?){?mbF*M@|MQzU`CaqOr4n8+cM8?Rb#G>!SmIIJ&S`DL+Yt^9<FTYOAy
z<dPrH{lJ9xdD`j{soEp-vFx!WVL(ZtpZ!#^h$;8WdVsPEw`|MBDR*H>arnGt>nZ_X
zq8mV~XEkO2!D?=472&+cX)Fo&>(-x`Y9N!x&1R|JGjinz6qAB(HpPtz8CN-W%7n8e
zve6U@K7pO)JQxp)i5e00za%|_OC$l3WjG+VeH)0!U~}2zwBI6Z(Ujf{zletp#yDL*
zu?4ouMR;mnZzWLm&GH!UNpi4Yy4VF~!x6HX&AnN4xf7Pd8@)6K=4Ig@FJt<o=vN2I
z@?Csd(5QH`32;?h*&=Hqm5oN7e<peAF63``+>aochsKmKevfN*T{RMPgJ136#ZF8z
zE`W;UCQ9y92<TKB6k5)Y3WvakT%{PoIJt`WN7$o7OQOd@Ng{`UuVf&>K`CrhhPP|x
z<<~m1*%n3R61DB)=y-#4;M`Pb(Rj&unb-Q`ip1Gq(zx}6b3y{3ubcFt-JX=X&2DGe
zPHO6oICr4-i0`V6zg68|Zj3*zmp{32eUU{&auCQc2vhMD=!Q44+S64}G{mu=a~6db
zf{G3LR8Ri{1Ac&h+Ee>-0CrKGGFWx9y%`ihDFZC_VW&%usX!@5Bro?x7It>PcxsAv
zg_pDW&o;oHxANm16Tcdu)R4jXg%0@gR^}++YXBXT5_%mru%(iG&ratg-Qa0eW#;}t
zThqF}2wIx|O->I<LB8}CNctVMV*iO+e#5?9A6xl&@2S>==E4Ba+wCUUwz)cXZgkt;
zi8<F*(wp+}CfETwTjV{jx>fB(vqH?R8z7a!{B{{q!0zXE?ujwgks$nxQ-$=wXtKED
zpmv#xMN4)r@%K~VwuMqzhR+jO<wUVB9~>5y;jOvsk?5f=@w2);bHP|y4wn};V;<f%
z#Kc6W)7=Dwq+A`j^$a|Q=vc3_6x7nUG+9#bCl6-Z-;m=C-(;idX>Y5nSuI{U0s#Qp
z?}_{9df)A?Qar4N$O7+sdgHS2Ri6@F0#_(rbG?Q|-KITk0cr!}Do4F@@q^GGpxDHH
zD}XkC{PO?<Pgl7{f#_j7699(xsFU{Pk%~Kxx@V|gM8bG`Z{4q)B;h%+D2Svvo(C9U
z-jk|E_4y~6dyTdh49VOz(b%#aTD%f<9%Cfjt^q+WSh<$#A^K=zy`PGb(|E!@Yx+G`
zG^r-GYI|spCx-zbpx-UJo;Am3^PJfj%huw)JLuFxj|Di;l9C(=6f68BBGNd*V1r+2
zEj5ha&D^M;rn=mEf6Kbwsbm<-<eAhJ-mATw**Jxl7TuNtjchainaOAnTR6hqcZFuZ
zOCA8IyI#|{rxc2a_`|ClqtBbQ5EYTGL3k0YU)yNb-g?UuL?V<*LBX@pq)=e?w2`C(
zt}A>Anb-%6+598bPO_?HCi!r!Fp5#WTDL{5k(B^)WjB|yG}-rH#;fmIXUDNH<5rxg
zES}bMH}?ZV#F$tFFyr8>R$@0jg_Kl=#w_`c`k$oNvknbpvK%K%ew`SxMCzadbxErl
z)smK)N}Ez1qiLMhv;=9Dv#sIzH)CAy#z@AJS)g>KT6QHWU-bzElG%u?X5oWQBQtMQ
zZ*Xw>9maSEX`FVJ)3=mQcObH_*gvn&C8m^T`bw?_zTya_kVzq)vSd(Y1PxY2VK2Gf
zUf>J1<|T>a2tOF!yDT|<!EI*3&$;;>`;#2(RnDN%$ZcjqE(hw}XyhhG+6uy-XnIu3
z0ZyC_ohQ!VJsM`KA1KCr84CkzjxJYh)&P763I2NY1~4TvJFl5=UYB)d!89!z#l0y*
zxcTK{U_dJ}CWL6_M|q5OPOOs?w2}GiFG}_D_U$u9s9eq2af39M)*@SasvKCywW8;8
z0l;K)z~}Bi#F=N81^%mZ^@NBGar#*+Itho2g|}^+`sUR82{vWGObeabr^lA~+MgD&
zTknVV0Di!%A_1?8{gL|QwyKOx#yeN@+c)=g4tOrlS$zNY$&U!EuJ{RWN+!(;E3J-m
zyL(Ype-Zx4&euz)IY^*wV}2%FegEolZxIZ}0bIQ@$OD)d9_+=c!BP9;n+Pu@`kT{q
zmSFu5&xFxx^HGJp<}3T2cg44SQQc})TRJq$1+cS|7U3bwL>rxc)|3}_Sv>Doz_{;=
z3tLj;4AHE0Ggudq>UA2*wt1UU#Zw6k7cDnL=X2kZ$nCFO0tt4-UFx>Seo?hb*Oxs)
zNsQcU0BRJm8Zyg%8waPxeGF<g+iS7>#&dS9(cWY_CX8@2Mp7jB2mYOr{+@lGouu*_
z>P+;owK@uy+pb=^#>|Okx!HhSE(~Hk`IrJKr$s5>kg#tGQr)Kg5gavJzinRM1R=0X
zgk6TQx|vO9#NQCY^#LY4b*6@FA_+9>Mqks558pIPn6{N_k#X{)oJ@hMu09JYWRHai
z`IA?C$wMU`-BQ*9P`LZe{$Z4)-ki(&I1;njntp}Rg)_z0Ul{ldl0Zea?FVPMx$$J$
z1ot5L7e0K~e}Uk;%l>%Z5yfW?CN$G;W|_;^U6$_$FIhqU?S;P}<#E}~Hg@s;B$z7w
z0f(RMOP-E(SU{%;5u&6@@b&4Wran4{;>F_*9b@Brgg8pbd?%0<KbNA8;6xeO+nMem
zw}|jQxgt{QN2eVf-pHD#;X#~6cpO?L-doF78kR|GzW+(H63;w2Ss?C(=i1Sm$4x7p
z^fC8%Z-Mv1=$LCM)^T#F>ID)b^NoN2mlpKCQL5PpI~(Jf+gQEq#xTC_)Wuxxo!rZt
zAD-fe>J84(Rr^zPjE*M3gAiA>6w#7NNy*saD1bA6GUm89wX9aZeOi(dsZ(0VX1+iU
zs<CzukJpuQPY}m3R=__fretD8od!rmZ*LwyVX2I=3T?Q%$8b=&JG#pJ>_ydOZe|)C
z2V6FZ&gcXTUZ395ra!WOo3k=R&!vur^QB$CB@<mAt47Lu=IAKt<>}sImLgaFp)F)`
zK#-q?bkkrs-yWzj+{w>qQpdx|%8Nu8Y3r$j_%5xbQuZ!p56JdY<AGTsbARfW6XdTJ
zaupa(VrMl*JN8&kj9pz(>f|;O>1YspHK(twAz#0f+R>0=F?L^YqP(=X&|JU19tSOc
zTz~ZxfF3gS<!EIZjjSDYTf@xR3rPo+s3tftXfY5C<j^EHbObYnVS5!bGrQphEYOIK
zl~;&?sk1GgA&<nL1B6Y+gPU4*&PN}D<N=klT?QK%qQCsy$=AR*5Jz&uW6KQSP6R*#
zK*Y>M$e0v<k5C4hQ1sx5_hb@Yi{`5Z<PF*My~AQv7IJZ1Nu8vA-N9@cD4@=P-w#uv
zuvcn+fAyL3YKJ9KQ0MOUPXKx@&IAo+w+0GdISoU+=aR)>6KFkz*yY_He2NB-dJjHr
zi-nbjECV4I)1K8RfBMhWPG{Wi5;WxG8-!09{WqEzHSe7!18JydzhbGC3iml>KRqm;
zh&x*uWdmoVTxh1-+Kcwtr%2e!1EFbu%Lbc=#DI$O-id_$F0$d<$Bged21qE9>rE5(
zTkJOhY!5^g*I#KbP`e+?Lr0rGh~fyl6F|(yD<DF5_)#THtK?VDt2Y3+xaK_zK1(&s
z^8|;oNcTFK*R-H{n}d>v7F)wj_$-aoy>-(RyI;Fp(QW4!7V7RIjmM`6C;8)g`Qsa{
zO%QY>8YAxvd~@DhJV-}t9!;&-S$}q<vye~oIteVpS*nA&{ee=frQV>v>3r_Ju}n^@
zm*vWAFO@ahG!KG4)K6aD;CQO3H<p^dbh{?FZ>=<;<0X#$^+pLxPB8vX8i;<HXMCr&
zziHEsjryf1&MpbKsnRC7*Jy-hBC|{4lf)}}fE!NYr}s4OeLC?&(%kx!7<%H?cYK#8
zliJv8LV~8)P4Ofb{sla6VYb3d)a=thg7Hz3i%UReM`u2}_)a=eBcjHP9e{`+CNO7x
zGC;X_J$r-{%8!Hg``Z6+D4-{X(7YWD{#4^=|1Tz0b_bJqT@OD!T4EiEfxe5bU{w3)
zgy2U=v_{VH^fLmkgXQ*Hj_czL$sdJNU4;>IiaWVzBWf&E5=aTf2;-t|7w>K)L(0A6
zHiRVTnnrQa5)r-Pjar=(a<~r{a;gLA23GZxDIMqG0t)8NHV=`PU0>J)T)yeQunI`=
z2`<IqPiO1bY+>Gy=Mj2A`^v5M{V_(Z7sRMp#cVg@v1(Ccp}N-VA&ygP*Qqx<-`YD}
z97Yn+M>+iUN^OyOS(v<;QSgX+b@BB$O(z|~JQ>}}vQ<lxW^Qu#GV2l|uYnmu#W4>$
zLZeP-v`0l6Qb-hEpdXRpB4J{ZYg%sV?kjj3ftiuB6G@9N)6S&R-=K(TqF^6eRP28k
zhkbZmbkK)v&)2pSw}78n1b+A65-}=vnq7cEZE-kCTZ9Sm;_{;3F{Pi+`EsnhX7dB@
zlWR&A6psN%ZytTA$Dfl6W}Ef~5W6b3X}570;bskY#{1k$&6FiIJvw}>8`2B!Vy2uP
zie{sJWOzgAA%TUvDT*kP@C_y7TZZlD5fL*#QsDo?GEgWf15je}{F%C+OY1FsKa=De
zV24Ijay#vr#ox_0;~yj~?k^<Y?e*{MRI*gE<aU@}ZkJl1BzMoDf4~h%`kJZ%zjhqo
z-EehfbDeJudxJG;T>0XzOEXu5S18@|Q9-E#wB(C`b|bUW*qjd}Z+M*!-F`OMDe*8W
zpYC%g*kdKaF=eGi_N&)a`H45CO-c$snuA7dF+YGS4rl2JCt094xM|n=rj8Qv<^y<R
znzsAd%+Hs>ax(zB;~TSciD#qradOr7NgWN{*Ci>ak;ZvH6^+y?zlGPiY&X1lWZdLX
zr^mB%&>2`HzNs09YgAv7>v%Eq&QcHzX7nDyfRniRx|5vZfwdURLWEP_RZuAmR||!z
zq6WaA$pu>z`Jc@{%n{0G?yXN)VP9YQu@+DfRxSMErzl_C9WKt~0!Cl0R9sA+6So6D
zU3c%Su8chY>zqqvf=wXzSr4x;_#DBgnd~*C)>X#`OFGo_CloDrn{$VcS)G3gq(}=2
zo@=Xdpq9Q)di(`LpiD(Z(#A+eA(ky~+t}^Pp*5>jnTz%y(kdn5KFgG^b%*oQKA{BT
zC8Sd8ld?y-)5egCtVMYjw!p*GXq|9=VekZE9!()HsU>K{@~eD+0%35XqP%5NT3uEO
zMc|pLLX)Z^zTAdKN2K`F;*BcJ7|~(m+khY!z%|vH|IA#jQAZGrr;ofluMJTrkBQ(r
z$HWu_UvuLMg1?2L1l$#majp--F)wy1Wf2S{7}p(sG&@Ngl#tmJ8qRRxpc6(eaoL68
z-MW{f7oW{=-EN!DD8&wJy_S%3uC(7~H4#vW^9k<U?G($0RYzmQDY7!;=X`iV^67gv
ztl=b)XHwWGab={;uSCfvH84G9@;zLGLc!HUh(YV<$<1*{>uCAZ(g-$U&biD$-bSKf
z9mLy+ZO*d85hKP>M_}Z`L&Ng8{L!@d{S*w?2<BXVKQJl7Kdl`VBst_m?h!p;up9G=
z$*-NXAcLLk2QoS;<D}r(B6kPAUK*WMVejW^`zypb!HpHn#7aQdmXBY>c0lf;-4vP=
ztDR%fyq+_3)z%S@jvAI*di&Nx{d-@Di70;{;c^8o{fgfT-fWaFNhX`_R9Ue`vvT{$
zW1&;^V{VVrX7NOASJC;QmPSagq%h^t3=M(MBY~v{?d-Il{TvtPL{BDzY#q<q)*`s1
zg-X23>wWuFDn24-Zi(+c!Z;Mv6-DvE^ZHqPx`#I+7p$)UCMUzk!Ovw_ny%<RPOh!-
z#*xt}#>CG=EBTS`F6pI`f%(Ny9N4!57f<#{=zoDWU6Jv(Qmg}sORY#gGgBQ9$_ITO
z49YfsJZf8<LSp>6okZhXJMY5N$?B{=(GV;4I@@W9T_cwkm=-)G+`&r-Ax$8OStuMW
z7&|H7MB}K)aw);Iy(5>mdpT~nGqCO(Nlx*tdC5#=k`0z5A@M^2PrI)OitdJ&o*4NU
z{FlWJ!ME)JB;fiH%*ncLr<MjKC%2ZKYw&zE-58PZrPIxV(SU-2haMbqa6=5Rs_`2!
z4_6rZBctKK>=@<Dy@vVz5=?|@n=`%^btmWjgJMRy60Mmg>FQm~{)==pTK*hftJd3;
z_eZ5|^Jm`#J8u@FehoKgo-O=hC&C(R+h|D&O-!sB`Tk`$A)2z3FR|;KVUWu^1!_+_
z=<vW|9P~w$>ar%?wTP@+HmM|KtVCrP7M>eg)AFrQGt#O!!2T}qy2Jo`LrBhTu@3n-
z=`ahV87+bP3B;S*vCEiCDF_zllLaqQ(84hzr{4uBeRXeZI6<MKH3Jaqukw3nj5BiO
z2Z2#m2`r6ZixmWn0`bdG6n)o~Dfxw0ul8|!AIMeE4Duv)O$lD<7}mN<FA;MDBR^MB
z2**T#+89mu%1GonKmEYbKKf`Qmm*ayW5M-`$gcX7kjeIAYnT;2nrM!?Gj-tVTX+sl
zT>yDU!lM{!t8E!3E-YVM4~#GTM>A21m1>iU>gR-gNL^i<=yhTfarBdT7k-t}h}l$C
zoB?&LFBg{6X7@vSwT3Q=5WD1*)z9Xhw?2IlD9fO^++`{DY9T$%YC3x~IGvM6Vv~9A
z%FpfrPHK6`=MuX5y|Eyd(Lm2dl;k#*js<YYGi>*p;{jf-LVHJZ-RB@VmQu3p%7w(C
zn~L9IP|?Y(XXOC7|58Fo&TIi=(eglQVv~1Rd<Fp<QD7<aTN^@~R{y7l?+Z5{=;FxE
z2Bz@)Q<z?7y})AkO*qT3jqH9p?m2Um^ea-9Pf0Fe$?MD);)gxsB-#4<x(cS|v{7|<
zdtnUXEp^<IGb3LgzCV82n!3iNn{!fJXY$b&_1_dN*BP@P$O9%~VbwRGT^G*`>XC!Y
z($*iHKRuW;EO9v86`gVqKMOkhYB(iZGqOC+Wy&C8<R)q--&7dke1AOI@P5Et?@G+R
ztZm8S{c55`j@9z?fWw^=0kLIThv+h`c*Ab#!X#NS3BndwF1$NW0#P4h<0MW(@k`^l
zZN9Xw=e4A<LpgH1TS3pRyM$V{iiext^}g}Y!@_}0ylwxM$W60zi;vzz8K_0e`1p%^
zdHvT4)PTcb-=Y3~<jK#$B_^9)IBOUNmDb-9S@kU7*WlK6L}ZpE6asBpt_(kPgfbJa
zzPXFgJ$>bbb<!rygI`5qS2Si5=})(WMstId{4{~959C2Qtj3(%c^NUf9gE4&<SoX-
z(U-7K%nbPA!Vk(^cbSoBXi>^c!i|i+H_q0(2>WrKoO^VkfiwKt>KtLk#kW^TM!-nT
ziWc=KL7oY=VuT<}o1yXSD0A$`<{R|$mf1!ZJ>awX|BJo1jLPa;--Su(l5P+sq`SMM
zAEX;WKpF(3JEf&NrAzvuLrS{4k?wqG-i5n<`;7nI=e*<n_Kx%EaX56Xx$b%Abzk?K
zhm04ya5Gl<=XO8Q;Gtf9D%Yr3>cUSNbtSpcq|~r7C2KCh;v0tiE~=g!oI4+q^CI&6
zH0Bq4zw%B(tKoAH5k5|8JopMeZiq-F(tYx-qlJ~*<761U4MTJlfWw`1`{Sx!;^ZpZ
zX<XkV8Wb;kz5r4cYqU-E&*TqR#%lE+s$XgGvf~l@Krfn$@pivnR@$8>e>{<P(wb10
z>>-U~8+2(jgsQWe_!gQcG@leouy1I(u>Py9**@McRXK-N>Vv)mleZ1nB`8KJJ0QtA
zKWtk2GDUm)1EOK$m)0@tY3$g{Bdu}2b+wT)H9<GD?+d|^hNcHo=UkrbcHdA!2Vr!$
z%C5?SPnNNcA2(LKjZDAF&y?wj4|#t|@h0`e?dMFh3bp9Nz9gxz(c16rkxCursgGgS
z6m4j}W!M}3eBV^AV)w-H`<8SSm4sII!{UKkN#XnN5gl;#S(sLhn5B(Z%?;g|cglGC
zi7z6`&j{?BnZUsToOE;_*4*N<z#JI}hxVSCb{)ZHY)CfaO_w{C8E4~m4yYq9p4(d9
zXkz2lBPDyUzxSqKTPnTk^67%~NKG-7|1N{Jo>mJStk#MkeT?wcvFaMC!|Id}xS6$j
zdU=ICs{zI|@XuzrVoT(1stcKV3)hATmD;rw3)GbDKOCt$1%fbN*FB(@8aRJCM&&Rw
zj?g~pBvPH^H?1u%kiD4?KnbNIj|{vBEM?sUQ^84e7k|jZs~$?#*Th0@Q>i|}{kG3r
zohHXeFUop^)S(fGj9<6_00`RruP}^WIPZ^>$wX1~)dsqU+zNH>z3kVeK0Otm$!W#%
zK$qV*O4|F~TMD5r6t3V+6n1_&;ww!5l#c72^%}k#q!=(Ra2phHofLL=MWKo^JtSdI
zDN2h$n%#Vp+S1Yb(qVr$h1u`aFh)TcZDx(L7jG|+UP!DDp4s-<nJ9ZFY><bVgAyqG
z#u+-NaT0agU|kQPV>A4NNkkrL^Y}e9GDq))9GFSp&@z>61A@=%NQJN179T2ky(VxS
zxyjW0y)UV&32F<tYx4?K_+;U`*w$QW&+ua(fW~~g=m_>f4Bc2MLJWoVkN`3Gt!Ht6
zOw(@M`4)Xi$e_OeDf>kYOD=81YM`Z+aizYD?PA;Q?TGS}n?0dIiM|F3b@8kd>j!O;
zEObqz_7u8MtE1Sr`nt?lb1r&|CQ4~pNr{}^O>BWfRrb3=Elt5jdY!jKo$|31EYemS
zuQZQ4i29`RODrw|tMFCpk&CQNc1czOI*?z8p%dFX=PQdjA}Ywsk*1FOYdy&kXQ<I+
zI_5aPjo=K^nwEE1>)T<)7Nm?#Mlc@+4d{S$b>$lpxRPFk7+6zvl}IgG<j{6t>M>s=
znYO;IvC-j0l<gR#u44USAHi;%odvtkxIltrda8I>oWZ3{iy<Y4GNilZC!@R3DT4^1
z`0e;+ShWk1og1lP=|CCY*g$`Z;mB}(%YY|vw#m8O$VNY!z~d(;H$mz`iE8r5bQY={
zzWwg(pdH>5^iCu*>=o1KyQ<0c%cK>W!8_f;uzOPjk^9jqlaZ_9O4hpu$=}DqH~yXc
ztaKGZmdjL3>0h3$ZvDtypPe=8_DI>wCj0Ao{S`UUS-z<2E@DS2VZqYWI>KeUTxa`Z
zOQGy>lH&@8U*fnMnSjs!-S1@%mM4wkX^McaHyhuvl|ZT7FZ31dB1)MCJ?zbom^dS~
z$TgIv&l#5Jhi2E9P$37N8k`Mh+QqLN17^rHx3Mnw*lFYQa5j6tRdi%ggn$!uPee>y
zLU46ROeSCmHi7YJc~OFwl8ELowj2^J`U3Uzd0I2MimhC~bU<nF`S&`cxDEvFgG>C}
zca}x89nti40^TV%p^0=ywl<dmqs)u&^@n#Z;!Q^u3ndj=woy(6gi*v~(LRUd!gtN@
zypCQ7$ZG0+&)SqAyK8CQ(w%8oIRj^_Xq_U+%7RdjkwJqLBPQ9wW5U<<^mM{FzrO6d
z{Q6E3TT{LXSpXjqI?Wf++!a`h=~Xi)0q69H6_S-p*uIU(F<21G{XJ&(5d7}jJN8FC
z_%J$~eG_{<?4*4!RnSWh?qv*ngH#iqVeAeScmZ`xNjk5@p7Sh)^5bd_m+D0|t{!#D
zwI5X(X1nR@NgQ9Uq?Z%syky8d{)E)@&@7&IX}IoJwCHZ)L3HJ=UyC;gU>x^3{P2f$
zv#%RfgAe=kKw`AM-C+6#2I}j4!a=L9bm$4D$g6|-msK{t13a3P1#fI9L(uS&gw4xp
zcZ8VaKfI0I>MPT?Ms;oVsp~%IXj$#Y)J~HqPZfF#oa>zvU>k=o-Fm|RkQPdrt=-bd
zIrY;a|5ox#TZ@L?*gfA<JtH*!By5eOAXY$@GSOsQ@0S2~!-;ejBNj?LY#O1+GaMW<
zU%Gh=Zdbb-aYwloN{gFN&!gTQlE_8)#m%Al!g@%vvFWeZ>87pyzon$!khee@Z5i>q
z85}<J<X8x8i=YVf2eL(V1YgJgxORRcB<z=rXc9`hZoGu2@@*!0Gi|@WG{g;^Z=?(`
zZ{3MTf0$f)#`y19Ja2~yYo}^3dm6w(5+?E{M5&h6{bu}U4L(h=TzdZ5<n8g9=BF-R
zfhm-ht~OZa)o(W+=);68-Rr;(<~?l#d~c5Q?^6a+d`3j;PW$(ROH{&9Vy!w^&iRy5
zku|^x7m?945vzGMK-_U~%`{AFX>w0xE)~1ss3f@IKIhiPD)5!WLb#kmRPRK|Oxic-
zOxmA3On8-`>=hIuF@0X@n)<yG7Jx8J=n~j6pw9yo-hJ?5M^QU)(DGm71;3>5t~lBA
zaaLMRIAQcPaUrp%-dxRg-jBxc<zEL^ZPjw@yZzqYptUj3d}q){q*8OEc=)S8C73w+
zBBZyx;M^l~xA<P-@-^wipoWYSSbrOaEnq=(mNZtkEy`m!nawkjh?{bjJK2e<WqT-5
zJln}ij9b6wihut>Kf|GXVA0lH-HVC-QA7qQbc}qIIVVI1Q7M^ACt@O7dHvJey0mIw
z7}H6W$Q-mRhWXbKcrNGh5N`Pu%mC)(Y(eYjS4<fAUAQ>8rLxsW)#jOrXL*EA<$jXI
z{JT46q^k~~1ow9Em(PJE90C}_+d#%Ax9@sVT7Des?JgI}ZCSoQY7@}!=No`xA~=!)
zQDpye?NwLfs$+Wh#`A=d!f*ZB`K{kN6gd`7SQgI?8ex8ayr6WMekBV4Srf$sd^d+<
zrmlX;{m#gc3d314%prsk+iWRZAWat!JNKAuPpd<j)P5Q%4newg)nj95sn|8F&NN|`
z!@%PeJKlg2v#0tJyQ$w)@u+(CSBIF(=rVzHf5YAPhsc#~Q~i4!q;fkSty|7Y3?5>b
z+~vXNOvp`5KP4yL6SP?$y9Pu$z|&*q6oT^{1^0Fuk=*r~_SrMDwTA}8v`?BdyR;_W
zr-JWxYfwLH@)%@qI8B!-E2Muu`<hY5PJl0=%;a{H(^>=HEt9nFn!;_Fvl{f3Ru&4Q
zeqz?gAGuOC_ck`te5>R;-+H<6a-(LiZ@1~`{dvEey$f)HCK!a3dMAT#%J7z*bN-ZH
zrq3)gk!QeW5?9g#HtqE&G~O)c%Q=qV^E3wl5Sr`(ZyfsH79Z&?1Xryl=MN?2nhv_n
zh7poCe!5Y9@3+o@%(De~72yLDW!!icQH5DAQ0Kf?2i>AJk_yx9XO`iqc-iXoBhzzs
z6uLMp6843dz!8xX(~J#l{T*r(7S*xF`Ihk7b|$M+X=AfJW>p8*(-z<pUueDzjP!nd
zpet{ZwMe;%jGcz_Xzp@_&%U+)?YGPW*)-*qO_kS96Ay1DWZxb$*=PNmg`s_M%?u%K
zz5cc8Ix#$QvI?WbBvE%0Up^Oky?it!8;Pl&0>_M?nV47mev=1(Z@q1_5;k$kj!Nz$
zw!jG|7n~_(T0_hL5vmha{z)F%-fg|F2;3pndiWBzb4yu@9yTHm9l3DIibFs*q1OyS
zMqb~s*vuu9Wvtk(*mTl*M+2wjBqX8&L9ay=7n*lnBIV|7&ZoTzP)(z5Q>-+Db183j
zmp`jyKr|F0nqka7<Xe-d;!B)!XUhfbl*6yGsSkn?A~fc<G23bTY!GR|3fGJgJ+L|=
zkf_0Ro8#DBlVIU?c6S+`UAs@J4MDo`6t#PkHlw+4F;9st2Z}j~D0jzPH;2_qGUo8L
zQNf)PL-eVc5OIF1x!dAxPQNn)*KU&x05FP7@dnJzv8~XUawF5*TlVLrV}^S>ZK+*G
zaG>njQ2?6<!#rGf-lf2&%>6qK2m)=UsaFqoH!60}=kn&c?F>)ZctMC2&Lz^(p7btw
zlwPCaa-{oBRhk(JA^#n*Ej>DY!<SX6KlVraH~V|iDRSsf-=;j9Gs}F@7iZXi9PJK?
zTh%*n!8N$g*E-3S^vE6BDDfi<lnj(9NOS#m!_GFe6zsG!E@wRp=4ER;^cygOVa36c
z`$qc<4Q+FS={{$j`MuY|x8CL~fmyJRtK+dJHr0}^vcALEc4KlUOtt$Ada=~yTS_#$
z;spVz?v(ZN1FP%ga9B-^PGtP)_4411NE?+0#WOYs-3h?-eI~!!RGCVwms@#$>%+>^
zrT4;1;OH97J~gMbeQB`u;S9vo>1fW34m=*3TZk6+m9#&xE{g|A#Z77=h4>-4iD-MU
zxB!n?Bjj5G!kZzDz(wpM6oiYzUDn;mF?%W*Y{6nCV)pSs!Z5c6C(D?u*)-zu;lt*K
zd%-tIp~}l71ze(184gTl?{MF?Q;@7WZ3J=-h}j(M5N-Xa<&*EAEt|zI7*qx9?Ypz_
z9n()gj<53dvE|65i}45B1|CIBt*<dJ$_=VjJM>sS?ViPFEEucYgaixBRyw7R42JDZ
zxL#;QD&uXen51_elS39rATpMI++VETV^U*vRGD5n?C+TU{?^nZ5w6)4svt)VOKh_G
znAU5u?UaYr95;QQRmOCD-e_5&Y%GNVA^#SI@&qGC(MnSK@#~4T;AJWD1^X1%`B*?D
zRoMzdsd0hD8v@O}Ugf{x(MB(F&?LC-uOXK`=z_1rsX>Buxqyjn-ZW+e$NQp~)26&!
zBmE3%cN`K(Ik(f*%wU+lBxxG2qgCvTvs<5D^bp!m&*M^(QPr@IGT)+~argP)y@6Jy
z7W`#q7n6tPIy6D~au&x9h*yh^oHC%n?H~?6M4h`Kr;kLy+2_lzM|fvUj_L(V4oQyB
z<9Y*y4ZX~AuTE5%BW*36N0KtX=3H}?9|w6SPL%RjGO<F`$`f|;X-Even9jWwT3I{d
zN1#8k6A9tQSoSIM=(;0bPvbIQj5ZuQ-922c(6yJ@tA0d#itRJHZ$id%CC>3Ww<oWM
z^gCb>ObMlNLolud9j-i_qPD8Lm4W4$3u4S4o(WmIw->Swv(hoy;@t^=-MPhE#spcG
z$pB)`hcdVfQ5;;ej3J|gEWJByTY6*~UT-^!XJdlw3~XLCmrYXk?LUMu$F1)Pw>?lx
zmIKKMVyGl2O)l!UjpKw(N-P|+ZYsNM^}-d%qtX?!Q)zM3{6ngyEX{S;g!Ob0xoq<)
zGbyByDngC!%>M8rxTRWa@s%yfhY8`&UD2aKeS;Xz!>})widN4iq@I&L4D0#iiC%Ym
z{~g_NR*TqQOFQ-*m{GX8pX3E<nD-S3ydg3Kv*kaX&~<l`CW|H6o$gk>vcdXWPCB=S
z*f<W<2xbYNMa9!!XuJiV_xs0e(I>ihT9^Q^lzzCPmB9FWJU^o&qFoVOoOAoc&9s3w
za{Iy1nq%~ve0ieW6i#art&hk2$F7yB*7kQ-_@b;&OwvN~gYd&5VZZha*z}Y?2c_>u
zmU<RsEISX^^xgH=uM}5pmbg2u>A)sdcL{`_J+Ad5N^fq}2YUa!M;QCc&<mt&-B#l7
z=S>va8Qmwek?c@HX`=}0>OONfDwp55&OKKyE@T!319v0>Kcf6lbaQId^ZIOC4eqy&
z=IoiiGSM0gJBV5v&u26AKs8fKG+;A+%ozH7kQI^kYj_5e+L+x&KDV5wUmG;I;<?z8
zTW$|e^n2j5o_7{<=>BA*gdm%3BL?w`tsT5UE7K*4Y4kgGgNDTyos5Y54ctCpzA8+d
za~58N;;f{oCWdX@#0KFb&r{3pO^gF(Kch#zt&!xdddB51x($I*K&e|3%<+m{sHGuM
zyZK|_p7#Pv_snj-Q3IV}`1#|9a;k~a_#5uQW}4d6NUaEO{Ek;k{6k|V3enqSEaheS
zXHaKzy65L-=6`edB?EWA-P>cfh8_Xpk;(v`aB<d-8Px%NmWO9Gy68uCYC6Y^A&Y~o
zAwV$)g0j>2UH&vdnsENs1d#-hTm+%2EE3_Iie}R#OUU@)Pn2Qou_d>ZJBcq~XnQmL
zu1a$8nlf@4o-@0hiXs)BsxCZHl6ZZ+&MF&Cq%7b_WG^U<O8lK@vZ4%~QH9zu!b`$j
zC`JC~>wU_}sm3X_Jt6B~oq@WVSuM5h6>b|t^^*zK3r@Nv))`+|mxPaQz@rro^+Fa)
zw+i~oM{XAhUVQq8?2;Q(<DTo0TDG0nO;JtGleG&$i+KQ5Z_i+>GHC|}?>FX)wpNEk
zH?5{xJ{cX@@D^t{y{mH3!tP&zGQ0Emb`_<pc~|5PgUT5tA8*m{#iuOc{pui)<~{c2
z)jcx6G3I=~d3)%|s?=`O-J=`KUp%Alt>Wu@w=SnM*}sV*W-|f^CTp-)FTtT4rTWz;
z<wl%!e)O60n1M`#VQnbl1+w{9=dLYdoL||qa^l1aQ5pCQ=R_~M@x9-xF(H)_?lhN(
z#CazcktOC@mhwzK?EGZMX{N`-`iZ`6hZb-=Lb$Dd6**KfS-wy6qI_Qls%u1;#VLVE
zm<|&e^iU4YO5??lLW-{<dt%zhajWByPCWM6eI$1(Koa!x&_%5B>{XnqQlPk&$e>-f
zAKW0QFeSau_#p!JoTX(C+y3=J9b4kfsemJMBE-B=SK74{rQBvJvN%-m%vn8KRxiFs
zEKCELndZT^MN7|HPYzzrg!n^w<57<d@^Rnm8CS0TO8+{$>=nQ!RWl#!-G_dojsd*Z
zLL0%`l&EOF!>SkJc{1S=k4GxpU43Bt3Dc=o2j(Yv;N}-tH4v(ZJUq0A#_&|Al%_Yp
zhQM19#f(eHG174-4836<@`&HU`{5U~ph)cSP*TyV&VSK}ea?Jk^-zmIHF4O07%F^D
zxwXMG@Eiaj#BprOB#-TnuV}YcO5>u)`oG-r;!ZuEM#YB@$vwO*!@-#kS*3#~d(nO;
z;vRw^)+u&m?K7RID|%YC<gPkVQeI#oF6}^?9G}Ire|r2%6ID>R6C;sR6iA)GrYX}|
zeHu?yCAgitU0B<fbGk~2K-64fI*vVtmP_H5<1tvt58PX-F2T<a8%~z?m`SMzD|fj3
z`iF!Ll$sf_iT^|SJ`CEl*Uhnsf9=xIOPC-mF&kar6xFMT<J$mB9fbna?_`<6D!mb9
zdm2hd%n#UDNJl+y8NXmnxfb~9WG*jFURrAhEsDM;q&L1;n(<is9Fuho%qveGS!SMc
zzbnK?kwnbKB9Bg@b8M?gm2ZvaO76+uVuGW?e1RkT$7q60sA|IW5b*-O--L8CFV-Z(
zCDw!}2YZ>k*IxUE5<4y_B4YiENTnFR*J*_D)JSrScRV4e-5LO`cWUtcaVp>av5+Cp
z4pkS0-e#^PVLzm=N$VTb@|Q-2$(JWC<^W7Fy7p(I0=2Me`WT%SE25^zU~h}5`KT|W
zyze(&1@eD6ESt7<`6ZnBrBubY8Lk@>)mK>z&UYtIL3?yWRT{h%Y!r-gx=j<5UZe_Z
z3xkR1PqE_<kF15hu>cpu?fisq^3XrSDZ|uYujD{hgA{sB@N5q?tc(pF2wz&Ra{Lm6
zv5uP@GsqiC1j*b}wzu09nkULJCJ^;yfuhrc>9|^N!BS9(EdZsV4d^RNvy^3jl#IjU
z?<aQ(z>muiY%B!$$_?-Eh>a&rGKP!~vc47K-=U`XE0{>xz|S>H>XgAXH1$>I@vZ?X
z?<oU#@}m!Pvno2H;8BCeTaC;5wudN<*HKOnz6`Xj=aIg}D!~+6>~zGrZOs*J^xwnp
zh#4t9Wx>O{Dg#x;P>X8_Nt`c2@Li8kmLaQk%x(niHsECtLvO$XpNE~2?}i|oF-!r%
z(O)o>4*Lc!Ii8rPCcA_mPZ^iEPOoh*k7rMq>X2QMUbvW*=(c1RYt-kvxeTjTAYR!O
zr0b0_+YDd2Ls|=n4Cb^?F|B8hC0*xPW;lWVX*J+R{3OYfaFG74`uQox_&1G^gNh8D
zb1~g-s;tjN`lwwZL~FiT3!P&gT?vC{+$-vgq6QQgwturvlIEOlR!zn~S@#fFFM0TF
zqvPuzh_~dg5O30Y0;zfJz&N75d}7R}&$TIubg4Ruk37_|*fTMUC1+>XhgC@;r7T^j
zRO{vaI|9NftTuLxWt?0UG<)0x&X{~Ju~Bb+6!BJDZAPn?ebtD`N@7ki3>?oIQ~Nee
z%akfV!HGR@pAd-v*AxEh#MxfS{O6lLsSHrdsBuHcJ~cTNJLvxUut3j0S<CHMnXuUz
zOG_`_TFDDC!r91ffTy72v*T_xFKaCo$>&KnZIvw!>cy2HZxhwg7DY6n!one6?=Zq{
zJbg}S_B%^|v~VXnB(0p3`TB)4{Mw`>xz>#OoGcF+mIH;~4jr=v$eX3<&|L^-bA5FE
zjYs%f&u~9%gsxOnBueNpPORBEhcQ*X1Y413`0fUn<0t_-?0JI@`Jj;gQC195d$Q-e
zUTh>`Yp06Z#r$VA-}L5JuUe2r3Y&G^6aU)}Jqc17ubsa)liAEE*GlES>gQ^fC+d)U
zPDc06gqVxGDz#5`7@n}K&%b+*y;BAMXx^UkQ_QRF$-kG8)=U#9)`L9mX|$o5Y@T}R
zZOsYvpmW+xUm)#ONnP$1SUBm?jFbd7*u3RnKvlDt4s@`$WYJZ6E^Em*Sz(;=vIV9u
z5vsBXn1(;7$*+8T?+88^che_%-+584Y&<27A*?9OE}WlS5o6OI-xMvZ2zukUzTx>!
zhBaRC<d68+AS&*m4)O!!ERYlPR$N!4&>LsMJFA2G^L&l^Qng+(hZ<+%QfDRMf|wMR
zFW(y*Z*Z3zfF^r-uW`<or2a5WRm$>8SM;0JB?O1Mh^j5+->i>%aA9?3;e6Xw)O~+T
z)q|y3O0z@Ox8C>vM5Eks7n`wXDBJF6(OW5KK#;hJ`8~Am#pPG^Hcn~C+22EnQ9J(y
zI^i0=eX`j(0smz5e^KQ$HvGCmzKAVPq7D@NI1ot^c&om7OP2HT@tYSOqSP<aJa0Bh
zKW6H8A|~|x$4Jnl@VFLqEIAt?!sG^{UGWO;Xs4bZy5FH<#94mctVQ;F@hX;Xu-2Fk
zgOvAYiT%VhawTVO-{Qv})-C0XCe~oNE#Lr%VdE6#2hzri_rzQ_`I*Dg)fJ}MWdra$
zfnc?~V4u+)aqA_8<4~?-$8_?WmTEj4noD>KrRk*iEsh-UFagKIhs2%(i^BJ7QF{RS
zg4Ug>m*ZS*Jc4(FqaRmb>gP5>B`x*GxPFJ>%|YasByi3nLQ~DjU*ZKQ?cxV}h0H)P
zSscZ03>}Y`2?t}9{Q|_`a+(d$$=vF-f7r>Ws<83fBD>10?fN_W-NaPzuO^Tmsfzyo
z+Ic_SO-G9B7siV*PtfNY?w#lqIuOQUFMEqVn9ixiS!&Q*AvEOSF{#}49)y}}ONtzO
zC)Jh{&^4V{6Vq;g7Y7&ZG~C=f**CUfB=`5Kb&cs5yPtw!gF483TKfJ5{9cy9hmP5Z
z@qBM!q$D>=sGphD{fNq9vIYBoh3VXi%s7|`#<}?u3YIP#<ba*_ccb^ODl@eeXlD@K
zHkAQ4z6Oxd3&If?PIuA|Af^mJK~craNQkN`Q+6#Rb~k3Uu{XP4Kod7yz`q??0Qx;e
z`h1^#q4qL)zQo}#Be=3KXQ&++tq^0z51avAAK6Cor-Tn}K@eieSG19MK>34!3J|08
zwjK+ex7~!$yxVb*^G<~-0oZlwn>5)j_huYB^Vx)Hr!I5eT-do+!)bS-+MS}{&|3!?
z|IC1g7g(LN;cdq@2BN2H(s+gZ$E{IJ?#r8oq_S}M6Nvs|HY>4lkwC#3s+`t)z3nHN
zx*D6YvI*d<&lWIadNA?BfXWThvO=p_-}}#6^;YPH?8j@@YI~lI`BFk`T%5*`cQQ#{
zO@r00;iMJ_k$14R16EPrF@)eGKqOC!KnPl;dhXgIv`}u~tPmV{7$-Isn>d!%u$g%M
z?k3}8M7J7rIeMgzfV!%+W~ODK{F)PB20)-8V9WZ8y)6T&X5Fr#TC60a{5!tiu75~g
zC+T$u%e+hk?Z0TblfK1&Z~o!dEv8m}!0Tmm^cKN7n4j<!SQ!SpOUg8jqB)Aa=8H9s
zeZ2w@U^OG2q4wixB72W^yWrFhn2Xw(p8Bin{ClnT+ttefbIT7G2;}b}5$+V_gwvMz
zam)qk44$2BL118N23v9wO<UE#`9mSFofaB@jDv)Ki)pIS#NoDRz6R*ac`*FY%;f=j
zy+~;1hmpKAPguHTM-gSM*mz4S9NhH4Zab`3_BD$~q?hXmV0vWgT}jXe**z@;@ixU`
zXr~C7^ek?n^0Hj$dpr3X5aPeS!+(rjl|N#D?-o!b-`YW;pP_sC#izaq+}1#^*_B5&
z>unIO@DeT+Quw~XPy7D2z!OeQ|4`D=51}C3st6u`3Y3|NznRS;Z|*RV)m%HHIMwaD
zRL_6kD3!)C+j?DwW_8Kn;SpJ^UR&i&7r~txY$~{l;szSchtkv@@xKDMDjl^l$?Syv
zKuD67U#l9bWte}jOT@8?=X9=+es2K~L~=28()#}7Hz0ny#b*0FK46HWSw+(<GL=UU
zZ7Lf&WW0;=d-LBAo>+#^Z^6AB@@H(mY|3%HjmwgtgK_*F!n5|cy`D<NGPy~rdA1D1
z{lQ^U+mk>;dwZ!OR51#WCL!PU=Rq-$fYGdVvGLvh!@{ulg$(C?IqRcs#wruY`rIFY
zPQ9CAo2Bi1m4Eik6hgeuDQzv*j|Hx%U56UV9lY0n77Rvrk<V6J%F#Z0EH;5J6H-+T
z9?agW`xz}b^O|Fr)a8zHU^oPv`nPa<iZk0z_nf~lo3?#BKa~0u(0Cd&jqCuulQ*=W
zx`6&6e6UIj0z^Gwfxh<6RK!z5dUdqs&!et0xdYA=BZ7vyO-+tgB|i|@=zdvJmO@Sy
zXsVE=pOYZ!8HiR&vsNd|p35E`&F+Z{{r!Nz_sju-)ZW=s;(YAxP3vSQ8EwoTK(E4x
z_-zL-U^ki}S(<R&qPBfJP76NE#oG$$;<Zw&GaV=TdGLvCLRU$kN6U(1-7ffj=Eu8j
z<OKg33TbGtnavjko&Bx5R`;M1uCfZGsno6?s3u%qCrNA`l^;G{#-u?bWvfC`?~1l(
ztbc1w5t^mt|DbpTMrf~RVhB9Eq^O{s^TZJ#6Z56UM(~9B?ut0u#DWu>?Bx!kY{OWG
zo|cw{OZeu{(4_*r9Wdxg?M^7lM5ZU$QG=?SOmj4-FM?LgKX5b*Kl3=J^6tu1^+bD1
zxj%dg0O*n{<xTjo48`9@<)3~jMItt2@@*yM3cw@3J)ddw+GwEtzOsddI=gTSL63;2
z@mnu+4!YI5g{h^%kT0?!u?B<W<q;?QHA-<qMa4}jPgA(>pw+5PosK6__6<}+H1rYe
zrD_!_-xMvsQ5w>Sf2+S^7WPv0gN<&pUB(DFALbP;_3JBA>kXzb-o)O@O_)eK`WWwy
zTJxLpfg&dECGCK0i9A;F_Nh0w41HVcBP3>h?1rOuwL80J(HBUYYhEQ+-nRmJeeXe5
zcT8<px2f|cmc5$zlh;S0H+i7-@XofK<6-Z8P8iyL*?t@!iq<sqHJ4>cPMlJHtKR_b
zM7niXsfDu*Bpfqzb!N5c4iD%_WMm+6yOvUOdP{i`ux_frTE=KSz09wl(^BDdrMdFj
zkAoIY0DEhTj``3NWlLTe7?DNPb6@{eFcr-YgTdig2~b!dUpzC@puh5gH<^Zgvrxge
z$uupO+pX+(aRtM?Z7JL<qYdAw7;=5?CI-}t`D@$hWT7p`ug6;56(@h;?&v-zagjG^
zhqhL^n8-nhmdx75A3NYi#0$;cA=uO-px6SqX{!qX$1WZoV8jt;y&)Aa-wc#c>8RvF
z)1hSB<!PlRAj-ud<g0R%o+>=fjXVzA-3)PipHJ{Wqc~`$EPN7K$tZRxs9V-Ya##1b
z!y1{62XHOp3aC7^99mIa9I)A5Z9mXrd9Qv9^axJet0S5io?Gj}7cmUNRqGgbBc!v^
zPJ4J4G>uO6Oo!tAoQ^^O_hk=AbxWbK-oGA>?X+(bQl}*2pZ*va(-6rqldg=My5;q)
zf`5(9dMzjKn*!_1H*<zEzzG4R-lyhWMs!P`bLQgY9ZBZ1>?engOaAB?00c`<qJbRE
z6S0*;JspixGnRS|_LOu$>J|OlWz&x|h(^RAKu@Vo&~Uj~YxQybHhvEy^KtAh!zjWu
z_x94lymbWU>7_=N1CR(3@lS%qTy<3SBmG2P0*V(Y{SK}hTIdxmo~ZpOF`MEV?Bf-&
zj+mI}A`FvjR^Y?bjJG-_=1;WOH3|y*Y8Igipm0lF2ej=UbUy8vL`xK!FyT#4Hfo3K
zKb+{3W@c(^jyLUrn>`Ld%O4$mDx>aV7EHjm0i4x0R+vT#=|a+iJa-?W?2#kJO%;eO
z8LO~bztHVTw$i5<;L}NnkSUI)_)l{p;awehDxtM**j)CcHa(PrUqo<DSjSi!SKsgU
z;^=N*`m(<Gz_yOz-yZFG{D2`4#!9AvX+!P4#P_ZRz{nEu!5x7$u1d##kBL&C!9ZwL
zyxtO>+Vf-M3}+d$7Nnmo*2iSq9TG$WjvxER(eVVSoaDy`h`Ch__U(OV8>y31`gkz7
zL&R%07icm)_DuZ4vev{Aicy$(Mi{p8a^bp1%O$)iL&FY#kK-4%3b5og?)H_L?Rcb3
zac&V$_+gr?$59k2E{rW+Z@5wV8Ii@3bhdlJ2D{qV{TO>;Of*Q!LMU^$XaxY`3LFQ2
zY+gsQ-9e0)l*Z#OGF=~5QQ*|&a_Q+#@!_<3<R@CyedE!*<s`t^eV`u^xJ%o%_UU0~
zGE{VNTl=|pF`;yMZttuG{^2>mr)2KOmaPYiuvC;FSS?GMtJhrD(i$(upkyV)YeGjW
zwd9PtThRE$2EP%F>&P&qt?}V<)YWS67~IlUK=Q@%Dcb_*%4F{|3CovQRxj2dY!~14
z!Vf|>)|qa;assBi$CRF~3xqw@J|0~%?@5sPtqb(D?elee^nh#joqd|5q?a@;MUtxa
z8fr6Opj%@Jbbj=)APtU&6;C?6RDXYCmLQ=2TPMV61>mfnF^sO}ec#=TXy%PyS5wg<
z0mKUQ@&cQcY}SId{Wu{ML(%!X#YTZBlW7PvxL=7;M`$ot^WT(SvSNJWreGPeCFhbY
z(`o|3IMN5?>5Tjs8eO~b6jI2ujuY^2u^X2Sw!n;CzDAMn$9Eo-D>P4C`GN1ludCwX
zcPT-BNLeJeO+2-x{UNLWP2$@@UkTUJ{bN$jL7kCNK};naOQk;vawdMhs&M3@`wKn)
zc$P)Qg}B#N@)u(9L(kxM(r=fbuNVS_TLKq_ZOnls!(&v(pilfXSUAD(-R(3{y!Fuy
znQip9>2JIZdnPO0+T7^W4oO*QfD-{;GcTQ`m=>#rZArHNRHcv;wZF7b6I=dnhf(S;
zy~M7ct+3@HP_fv6oN%yeE%KqQL_ZZzwxq@ncW(o3jesGPw}TiSZkvm*-h;D5<lC8P
zOXjfgeQsI)g6_Q(Ek14E2I;Ch^5R$KfPM46OMb(RmXDPP@)q>hNuNq&RueCG<_ubj
zAz$0GOe2ajpwXsd(sKUUNM$fzE~S&`g*eAN1__q--mg4f2@5r^stMH^+VmyC_nWUS
zy=(yT>IhN`l*qu7y1}y;Jh=5|fSrU-7RV$2$>%`__&g@dFyv0Dt3L;^-_S~Bpp7u2
zu#OdxSR=pFl-;(6JI4|OuYdaXSwVX;?6w^$FoC!Jy7cc5&qsQ(_AL2iHp(7ClTJSb
zVrTqy8~h>$mK!l0#q4w%k|#@esUn#=aA5?|v|2SM_SkENx>FBnvK#D?9Ou~(_bI9<
zMuwNtN&TxgcD7!^jgiJgqO523meducUYVOrs5-D~&GaTMNV#`E6-XIw<a=oK{N)DQ
zEK%q++rBw*=mE{VMH7Zif6%FP;}c2oQx2^xsQFWec<Y@_T(^7Y3;b{$MJ7+*{;fc|
zsVJ(_QOxbH*hcSPapgr=i3M0!9DrslvNP#TC~05he%L&Nm%K$>M(9ymoE3GK1nFLs
zZL)56nmitHbKS}EIBIChke%g<3vhb?vj*K^MY1zFkpc{`n?JeX#M0P=-{wa0AI*-o
zus~j+6A>^|cX*Pn)8|o6MtMnw%4wm5j=d0~F4O}bXL3%!Igk>NZ>9CMC96^&vRZfr
zd=aXT5l@G`y?ozd%fz=#*?cfIz*HmBAOP15B;hqvPU(JZGOB&fP{^P|NAgYJa+35T
z>^fWga=o&jaa|3o+n330BYfwMwO=kLvW28(Iz*Uq2@_18axERhU*c@InG0YX?cWMz
ze}c(QKD_g-M64?N=F6+=+!#G{_^N+H@KLe?zinDJ2=PH|8m!74kQh;c3PDSB<*ESq
z)jzQ^$eAovCp}H4h$6(qG^*w29reW&5U)VoL+7UMCulwtPw!kRSex-FG3wt2el`Qn
z7Z_aEZ{*o`OAVyl@&?mNwopHpv59}I^xCVVIBA5^e*c}0W;REH@0KTBdSDiT@sl+v
zcLD@@5%#X@Cx&oo-}%^sJ<tkL7PZ%RDBoYSZKYucOcaVNvd&r`dqH|<`5IjWItAye
zosisfBsYfH76EeyNL?TK3mcbn+m)HN(0c^#d%hWeItGyP0;?W5d4Nh3OqbN7<gU-3
z<?)lwg4AYfz)d*4_gdQBwNyXtXLF?I%adNu*!7;=aG5|4gtJ-L6zi(IQ>$63oR+lF
znUi1vWgNgn9)XVDVtw?VF`q%v>*WPRkM0rSJF$n00%69S*AXnQ0OmG2p=DNN&AFAn
zaj!?Dn2V07s|*T^{WGBsofHcvb>~lNZtC6l291%Qh2%OvWd+r*ng*XqIh}8D)gTlb
zN4)R;`W`|2bm!hL0Z!M0vt^HOBxde2?`4r?xkWK`Br$GkX47fl0yaw;SY%Wk2`_fE
zKk#HazMa6Y_G2|YG0nPy(?}BU$il^h?Rj6>)S%@%TY$Sk(=3wG8`a56+~Kzxun~1$
z7C(U;YMokT0u18_Jxn0USXpN~07!kIK1sGHaw0cZP+4-+xXaV*r^rl>bVXNGb<KR5
zOLD8AW8yoXy@hS+OlUwRLGf=(`Q>3?2`dY&fp7~FQj#CKvX9UZ5Kmi>Ke~PCBzV>J
ziqrA>Q}w*6ITH?jR}KNUUls;T+iNj_x*=v;l<ov<(Mr-<fi2xs+(1`naCX4J`D?$+
z(?Ro%shjP1h5kLgUhvU)OVs=i`)bZMg|9(oaJl&aWMwftDAUSmjpJX8=}WtWF&&68
z!nn7UQoaz0r~=i2!gUgeS(@}=$m(U%(vR^U-xS<QZVdH|P*6mjaGv2Isam@I)2J)F
zD#h&WaQ;Rw1dv9Y;qn*q3+R9sqW9bDn2R#G6*Qjgr!9f-hrs<g_Y2)fq2G!)G76$0
zuFdMmy4htVl;0J^_qm(D^X<C^!TmDt2W0>ZrxIUnXeuPzehgnnl*760rsFH5vR#45
zKgdw86^gEfv9;xRf%m<<TE*0?fEtKTDVsW}a3E1Y{dJm>uDG?|aOuqDPS~~n>4RZv
zon9ENXm%NsC-lvE7tSU2TwE-l^M3Ah*@}dgm^2_?eBh)pXJmT@y{{<UR;*JKlfO0?
zrQ<sqU-Xyczt2Yu4MPs~H6U}ap>$|F)H59-PvSJr@tblbS<@L8cSkM!-lCB-UGv9F
zogiXb#*Hv4ANr5WHz^7V3Q4JEfX^2t88*wbAjt6bKe^WL)P8?Oj`)zk4dlc)@-ezf
zxkshF!h2o!t)2t(n!Y<B-yrl|pT1De97F958)GC*nu0lk*&2uZv6;hKq`JfU@Aj*C
zp7{$(l*iQo9)wr`ml0VM&}q-*EiQw8XLwd@tpB(Cz*HxC%R%y`ZCGOBik}G1a~>>a
zy5d?%i++M7T8S9yzZ`9hT<*JNk-r3>TIMY%0a}LWWbOxJl=-Mpsh0GMl@FK28d1ZK
zMq%5&P`5>r1Cx5WJ$PME8<%U`y1`<7rVG(Nr?dLDLaSRNuNf$Mmz?Vxzq`fvNpdhS
z*pLhL&v8b%l7H_&lxFzx*<>X0<D#e?i`yXF$j~chrM5L$_wI2ToFo%2zg6U8L^#HN
zy4apV;Ogszs^aJKdjYC(pM$7{1zkQaj`%1tw-5D}`E775>%sSZ>hPw(wNU6%w+h=x
zLP7bd5*7CGP_nT0h*W)b|Da{uP-S^1%7kqaU>-wnY@G9=LC^MZj7k5_#YADKk5-hm
z|MQF=4}R@0r(Kjn8e4gL49r^+-Fj@vhKHPe!{3J33Mnn^EirYbl!<$B%tOGWMA!uR
zns#GwB(a%AvkEawa6~GL+E6+Kysqx)iWs`))Zr*9bC^ZdL#aidN7|;E5Q(o*RA@M*
z2-ks$<G<c_pkiJMI!|(-iE5M9o4WsO$)3&Y-O~_XHe*GT{YL1vJX^9fn2x#UGSR>*
zZ{GQ+2vdbFl!aU9X7&J7YRS&r16TUZcW&d{%&nguOa{>Re=j9L#OG1y#_p)2?E5Rm
zYy;Q{aswT&h46z7i@^J}_~L4R@IG0cJSnWGwy&;G$LPJZZ-Hi^C)dEK(joK5bTO0M
z$nq8FVg$?fZ&X3Fns@Vv;I_gUdAp{lAFs7Albpiv22lbvS@r|lE5x_;_m&`Dx$=-r
z0h@BIpz*xZ=OmWaCVbpMKCC45)`3e9mXsBv9p){Q)T_-1elq*6wPhlFRPEHfSN&pG
zQ2l;(!er8aw_aj=A;qz5;}bz9rc<|AhBEMg@!1ac6nd$BkU8XWX3vgT*_}B~@`+sF
z!e+mfD#}Svw{6)@Zva%iAwb)35!lR{C*^>`>;my!*yUNTRJ~i_l4sPfdQ~2B2~6Y^
zBv+K;?#6<=h$<j?Ni)2nqK9*4GlgFDOKWtFNh@rrS+kdSeRra1G!!*x8P4*XjbdfM
z!9wq-937U9fs_T04RQ{VX{%nx$ZF+r?w=K>AR&nJo3Cw|zI#+5KEuSxwFyuWc?WZW
z9jhS%>Bd^glCJ%H(gIO<yWZVCm`EMrRIp12>s||V*`@LH&L;0)?K_@?akXB5{z$0X
zS2AMC`?w1|%zGyvxLq?u*LU8xp;Yui`?M=ww-r{^nao|Jn13(i_-HXXR*>FMhg^cZ
z;UQ94A51#o$qU$INgLohM<H4<%~~!Yd*i!OwhZ$uz4Zr6&MO*a^Nyhr$%kwsTdZFO
zosaq#*al>^F+;>f;JWR1LL@7{Mn031tgeC=C+vpcMAzZ*(<&l)?(HrYR=i4qL)iJS
zdnndtr@`Ng@hmcmlUqV?Zvx#mBI;k_uLcTnBpEr?Od)d&WQhi&Z6DP`igD>PqiVy&
z8t7AW_q3cI?#+NJG&R@>+6%QxYEg!+KLpl=CHk8{6F6`7XKd*Cv7B`e>7*My`8F*4
z5GBRXVes?5Yl@lzpraaOX3Shdh&bvy#Fi8JkPf8m&-RF@C4x;bYy5ETxW$u<it%ss
z@lXS#5~npbhXogAcqH$466>3bg&rShist>VX?M0m%0j#lbnzMW^9|!Q5Gid8pUKWf
zU%m5t2fx#?8{bvP8PI+gEH~L2PALV>Tid`V=J_a*vx-DKTkfU;ox-{OZ8pN+z#i%K
zqg)e5SG8)fOLm>eQzgx;_{uw@S8*Z}=sP+e1-HcpZr=-%tG9q-xYb)9Z<+aCOznTe
zYcp@BFWH7;$yDOKkvMh-9|bC?_ju~+{ZI`G;?%7YbGbk5ZPOUg5J+^h`C8I6Y6-Fv
zO&y->C4agGDe*+ObXV-Oi7|$tSPwkvGew;m?C`xoDiLdg1x<F4Y?oo6Gj0soyVv+F
z7H>~)PLs3XjUwz%7G*z19r<HQ2$#&5+xO$kj3~{>-MWUJ3;Es!;-_uXm5<FslfA8K
z_dUs?nznS}Tn_1mw5Yp?lB_$qMeOH9Z~oDf9W8xt6VE=QH!@jrn^y(KoDXHiS%I`>
zX<jMZ!(Nb68jA(`h0Bc1bj?iyx1i^kiXTxcXL|r!i6CaBtCIxP*d}L?#pX(;qwkPM
z<o)#S3GYYG@oa7V(?UY~auLAgn4~L6`%ae8MlrrOs?Igy@JZvLu~v0c7Qe{g;S7KI
zZZ@xXe?l&!Qu}^;F2TR-h+%tieegjUY}!HYlZCUQQ5sy?^Am#W@uKuxHmu$9`5pv5
zopYwuvui+l>ee&%Mp%vAo5ZTxhs?k3wpbr4TMJ7em1-sGSDopiyO%8x;nDj_PIbxa
znh~8HXNrA6!}%*Q`)se4`MufPsIzO-lTQ5YT3YLtHxB~cu9<IsrNT!YuD^{J$PLeY
zx^J6AAb(U8Z2RJQFz;u4^haief<Q@FSV{u#%k$i72?oqc!SQ(_%BWiSoi^sIEtZd*
zwPq0(ZgITq=BCRk6_oFBDnHka`uvZb05$0}wN>Az$ul@V9|{UYL>S;Fnj6OMgV0kp
z#q#f9@<;V4OPo^i^VYV>Ht$zITsLIl*Lan~Ect0&j<H_C!9k0PU}8T1WP#uU>eXmJ
zzh^@GgK){{Dj{6|9kPy&qxg~e3JO1_!pckNHxogn$eNJOPH<TJ0RoL{c@mOusgb&h
z=VzRMKF*h%8m7Y9of2o7nhE_713R01S>;?aNUOW_agCBriQ#VxeO@m$Oy>gIShVBx
zb23h*4B+Jd{!$;!{19)+8ttZ{=As#>Te@Cy3Yd`8md6_tFOs+5IzRd|F+IB{D9Si#
zynntO8U;p=zg`6ZZnh0>&IW{w`lpC*+uof16o)FOc0Tr?!#Quz$P~?xn<6J8I_vt2
z<Zyx2^drj@(I7)(;Yd?fA2<JnyYNmHb5;qH=V+#Pk6<E`zDp>D>&8p1#FVqm1QXFu
z3j&}#o0+j)9Z^t5*q-M@E6ua>3PjwhvAt31z<nu6Ppib-*6N4+kTY*NvA@aukLZ0l
z5Gj@~3NpR6x}DqdG`Ocqq|FSl&^B#}KPPH~KbfZ#zaA0wgEF!vFWx8z&cR!u?K1KH
zxa{ZzjKW@JqKAIPS1aFmN(lJJ_CHJ2920X{oha_LQo<jxD*P{EC8q#2nL1qpbhBoj
z>e1zG4x4ojPLp{nFKsXK--sZ29$I7);4Xyhf`>5E=_wn#yxu_+y=d}(35o)-i^8XN
z3*q?SWE#)I(-&yH9H=rbIEELAGLeQOhLbuZS}avHI0>IUKvqhoXPmEYdpfQU&gB2~
zh-mU>S!3uF%|!w%kwfsP78VZnO8^e}(<FJ;IC2V>t7WWWr;?IV#$;B93?lX~RhKDg
z0${A`otBvgf~l?8N8pG$joLj<H3QEFv-6to@c&e25zKcI&sfdg=?#0?%|Aw!_BnZ7
z?WjcLbsytEnpQKXrkCqmW%n`nf6*OL3M}X~>o;Pr3E8B8P<QI{mw_w)?{K~kP`>!n
z3~Inl%G!l*o^EH_a00qEXcREg6Ul{9;g}jvfO9K%dqV{dg2^8g^}LO_M-*JYg?;|F
z9fyNEA`*J%^a&sDg*X9tH;=K{IB_{c(p(Jp^9_Xrl=@aMncJtGU#lJY$L;)+w`k0P
z!vh%qFw|$I8K<CVF5{q;$tcAFP$YpIfM)fN9Grqq)KFMtwLn<#J*N%O8C%D18%0fF
z+e-&RI<ti-5ZOK3$ZHf+K-!4Ue2~WL^-$S!8$tXDoqB5x@~6kxaf`@BjeqGUIt*NY
z+|9RQ;O?Hc?nhdC3${-ho{!y$8MU-V6UYyCSUjg)8*2V;wNt=d%K48sBi=>a%Pw+<
z9_MA`OcZCo|FYvq&pQq$Rn!FySXZw<zy|r}1W(LgUD4k?(tr5j$$I|g`+e+xQBz;Y
zAU!+2zx%)c{zEeQY!Z)`f5F{=ZT*Yh{PBkW;oX>U=%4=d!*2mk{f~aQ===ZEcO$|e
za6CI#Z_j_<u>bhB|7Bgiutd+2YZLl+d;aeq{3j;-`6unr5zmAygUo+-YXAL%|Fwiw
zpFajsq4byD$Llx$a^?RUDcFhp8626R`M=x#Tq^^1`hU0mUm^QH3FEKUKJtVB1@-hK
zx|}}!kIOm^(h-`cYF2vuLtqyRL)_`X5GeR=U-xw~TCk)l39XHN7&d|*EJS@#M^$x^
zIPGa|WhO8*D}-Wap&%unrv8vu5R&G8+~9G(HlD_%Fkw4h^DFj#+$gdE|8`(9Db?hv
z;ceXd>a@Q%y`wH&_%U!-RynBoCP(X2cHmEJAwquYm9GIoP;eAb(1;>XFql67^B+aR
z+mT86g4&4WAfa#aWZbCqYzC!!YCtc4KJBGX7sb*{^G60nX2FZGirI_f^OYm~*QWvR
z0FlBVcF*Zzg_4p77@6WUjr(By$Cv+oNm=<w6gXyP<YJW@{-AKsfh?@he_QhN|ME?t
z_5r1(dm?s6VgO64q({5{-+U+(oJ9(hnEjV4N*sP6#BRjya*kF1|5+yg`rAVD=Z~2S
z1|3{e;86Yl?PEajD@hQ2t}>l^bmK?YPKoN<dA(x0_<Y>W2WJdm(zVheu5ilFJp*&m
zJ#R6*ujc(h2m%b|CpS2*g_<xzuHRL(A9D4*h7KmqM|Ze0=3ld9J+W?O>EB6yCHERg
z-@2$~3h~<T72!lwy(2CqGB3AH^Ni%_yWqb)p-o{&(En&d;^ltP)S5x~&D=BDUI>n2
zv<7K3!)E?QMR8AEt0C9*+IJyGMfm2zp?Z@`FlWW(?_13N7CK=4AWfR~iw9;XR;ZqN
zq2IA^W{a_Q%_poL0rT<K6ZW-=YGB!k(6idaOg5BS9TwTiVoPgX<!l$Jk3=0^u+WGc
z{4h)P2c|)~oV1M<V-;;CUsg&qE{K(^U-F#SU@MF~T!p{%ULb{}#43>zJoLc&T3{Al
zacgpp>#p!17<l>4*`zY&etMDN{FTt{VQB35*3DER|I(!A2Gd7mf?CAA(R^Epw@Amc
zHhw7N&L%?f0pi`tp~t--bQ=N4@Yxtya$kzj4iCEq81*7#6J*cE2fe*E?UK^0<)1W#
z%kL$12$(DDja2@+Sik*2D%Z~*c<?!u4`}iJOw~C6v?y?1TePB9+t!h?{y>E@Bdo#a
ztUZF-cyjQ`Za+GkJ9*#Mk$qy%8{P<bSISFY!fe5%I2UdSZOl+&Kem}a-oRJ;^|KLK
z{>zBePKH7veh8$;(L3pmSyf+dQQjDMr++MOy$Z@{V4-61y!wSOST(?aTe(xY?Yni!
zy&UPaVJ-v*kZU4%??+*CiHW{EFm4r`3QM=0a(KhkzQ!4dJ8M24CN=G!P>SL>Zia}q
zuotF5L|T~Vp|B?XK)Mn4R!}t!%&b&X)vm1_pZ%?JXntdb4$z^n!%S!wR-}A7E&26v
zh}Owl!Bi3UO{4n!gpSk7U}@Fo;OKs!oo^#0aPQKB6n{=u2$3YFfC*TC;WPN=kD_Ez
z|8XnC|8y(jxE{6Rh$X+vws%3qE?d7$S6ZA=n1TCA9IFSBEpZk4!`pGP!Jk+^aY0Y(
zTRJ(c=y6Lzst1k)hf-}@h#z_;?vW;AK=<7=w#mslb*Su{2@6MD1!-P3|Mp2I@BiO_
z(ulBNCqv8ROUiifhr2e@*dgaa?(EOYu$Qf$U?qS(hl*~1`{T(cUq7q9mH1y&ze1hp
zLwxh40I9_cdh6_`?>|VyDhJ>Jt;%V*t0~XnYbX<^t$S^nX3dDy{q(SiW>gpl(j9is
z!jqL|L}Z@o8_7@NW`8f3x=mb4x248w-cN;-sDcNmU@gcXUWJQ?Cb>QQJ%naO&|NZ1
z{g!sw<C3tt9p*eZS)DE$4D2Lh98ti!cHf(E#6O`SLKG^SCzbDi6nfMC)&9`!{-a<R
zpzoV7VwJ{Yi=J#x&iyjIQuSX!B-u$H1ZrR5j0i$>w;t;C!_V^Gi`nxY`_f`5%uY-O
zCR%KosSL&t7G(^bqfO(S7pHM-{zFyr^?}7Q{aLIkga+HN0&!B7y!+X`S<lxXv6ubr
zLE5yOh~2f(a^JE3*dUQV5D~bX{%V01d06VdbVeq!uYTu3l5jONnVJRuCC}F{OMZ6p
z1sKU0^~_C&f)*=(B5$1rABVE#|9@QQw($x}nRYGm|M^1KBYr%arn+{EievoEwyk9&
zaKOISm*l*m?<-#H%xz~Wu8<atp-k^bLZGS5em=;a>NKtYv$RoGx>^MDSm(IeR-fpy
zc#QMBk#{?d>YWBn^{i1?5<IMmQl|H*?RjTdMbeY!rS}`j_yY06sl*HxlzIc&@OqML
zaEiQK<J?>L;(SnZk3~sRyvC6so)*~i)6w1K%nDnsf7}1V*MGRP-L`+=_}wbH(5hBT
z(N^tQd+Vh3-XliE-XgZDw(e52_MWxHioHUuwnog@Qj{PFf*=y#xBGsc&++_z-{biH
z1CB%9*L9w+^EIxsM6U>ibpvNY4B<Usi)fjgLTbAsII>+>sC_^3-WmRVx8LlLWaacX
zXN*Tq$0Rz)-tzMIkedm0PA#{SK&W!Y0UMCh&z`~LGom8iW+!7D(+qT@QWLwC81PSy
zJEG_yV%t5@LtA`rIxdYzuQ0)fFPTnea<j1ur8A{^tp`6O+F%lVVDPTlnnTp=i*i0F
zaIBT-bV3r5f63^FXy1KT^#%<|iL&zXhXctNrS>=NCmY!DDMm}bhwud%XUY{<e|%T0
zBBkAyf#~6~mR^_S3Prp2>BgGm04wo61BZW;U9tpoIU>g75x1?4ZnlV7HYOCV(UO9#
zY>`tnDtNyH++CeV<lO-Uq6>JwZc>azw&F&6!+7dZXN2u{XenEL9749dv30~0YO3fy
zFr_shifq3z;m?)r_gVT+4k^EXJ_HlI`b}>rCdA&KX(@y^F}t51o?s$cY?}mfyN923
zkAFey-g+E!?0AYaX)s1rr-IXd7SkHpuhn#V@2(_+QZZSfC2Ir~j*aOPIa#}TmsGA}
zwAIOWE&3gNKt#<LS#ei*T$XqsiIymJ=hPy%m6xptBT#8&A6CxBerKMY{?J*S#kC_@
zjQW#AQ==tkhWX*+afQL!4QD%Dv5S(s5p2QcqmrJiKoO`J{-W;PRW^KOf+3O-<TCQR
z#aRQs_UIb5D1})%Vd3n@=Ky~neIpd+&Uuq6uRbXSZ#S)qfljfC*8XH<=vngJf*I9$
ziRmBZcgETD3e{<5Re;Cq>4m=3cz04_B$=TLIghsFE%MqSZUr0UgjpKwojPTsYwfZJ
za)`4|W$>SCLg`m-aTaEdIuIvlb%_36JKIe6Y9R;nUslHz7OdLpy4=Zk1WZ$aP15tN
z<X$uI$^PlqVXd>+AM(eI{9+uQP0Rk@&!*z9hnBF?&FDF-0~KeQNET}uZB*smV{GLE
zXfS_UtXwdg{J~V44#Nz(VAgj8XOq?2m~G>@B=s-S&Y{0_BNEQ@=>I^bekY^*-0A(x
z;4;{J&+FfJeYfnu1u=Z6rX^sff?Wl(FI<}NP7QlsZRVlp%D~u3I!gokS20C5bmLUd
zToSzj4m-Bq#Dxdq+ymGeV;viQU-UKVG<?1-{=!X+5hT)Rg*fZNX`4Y{(br_CSz8IK
zRWD3fl6>D+MRzg&EYe5^ODy=bJbg<XqT;!G!2(psR4@l<_`+@$f%7zyl8R(8g=WJv
zOefLpitJOLpn#47?@8BR8}~J$5TnnlUk>1@vY3279u2rMwUbxP*uU-pTRH1mHe7_H
z2x9Qr3fYfD1REjTq;l*|?pYpwNLUuvnwfgcmUQ?s5p$DH-tFX2c6wWc{%J+asxDlo
z=pb6gbV+k*<)QNaHCgg95q~tX?%f43dRgRS?%Gv#%bW=O;r;GCQXgArN*D3IdsYDW
zjgMuLGID;sD8tHksv>ae;cA3|NdV8<CHa+FZ;BB--&vLP^7yR*L0MPE4B4m=@88}#
z+2OY|WxD3P(JvrNKWB1JUS(qFtKu@=hdWocjF|f$RLMj%OgrJ<LE<@%aA@ognZ?Z*
z00^hkp;_!gsaWjY)8`4>ETno?MR!AEf0A~U!eXOBSPlxFb6UK~-!#W`IPOqJJETW_
zpYbYwWGGZ_>F{S!cDg*pS8><3??Pipu!CO}jr(%Mv7o)5m_nj&%PT}MQaoHpWWHhT
z&K7F`Ng(y$5U(ZgkaV4j>j!DCzf$QS57Mq({_GZ!#lug^3iA%HDG5N=VXEkQ|6eY_
zS)nxK#<f$?F0YC`-dw@$)0&fRJ!D!}jGO}N;}H;=@HSfi(TPbBK@v-y*$^_rpoHrH
zc9nEz1aJ4)MOh!3?rvQm;_OZirMn#-e8h#M%T1e$IaE2y6E|0nLbjWDUU63(lJrFs
zW97;lq^mHNg|4&5L6;VBv5Ln78Qu#Viya@k|C09Qb=Q)~t(4w*8+>)+3iF3{Erlx;
z(6yU=uOM#!mYUMCkCxc>mGRs%_s_Z+>aIhq32aSAE%gcBB=@R<B#>y3gg(Nxsi*MM
z=|T|J0*+~?PL_N7+CS6-NBXQjb)t!Ojg{a1yzcE2dZwL;wz%kNd~htHCX{+~x*?y_
zsX^SA8{l3LGg9ZSa5pJ_Jch|;)!8A-9FK>s#<Xl}wbVJBdG@h7#z^gVtU=E%*r&H_
z`#(6b0BIF`unA`Tn~3Tpyl+p9%h*s24s?9`EDeuf-jtkI2s{u5s;|$RIEj#Us_3m6
zGo;6jig`s~q)|GkKcguZ@jdv$Jn(@L<QSe*7u~?+k|o%@_8si7(^hujcKa9vUrX=_
z3Er4fMUlvDQ|JITOW&VOiw#lpjOY#Kvvn(B1H>&&jUcwr-JfRQ!q6E?MM~G|IusOb
zyz5tf7HyRE1dlu;5c|$5YOHIcF@v8dhD4xfe9j1Tl7lhJpy;%iX0JOQ*{dZPAVeqU
z{8U)Vb5I72y?SITY+OCr89XS93)c3qtY%|+fL~9M%nL;Q{&3sKMDd{3BHTBry|0|;
zFwh4ECYl;Wtc%d~cDBIHniq{Aw9{2)Hf@tZg~$`RGbhH9p$SP$c^Ddp-a*KUOF4!|
zH%~T&hAIc6DJ0rY>Myv;`8P1TRaHn6KgYkjz@;`JZGh`jW)1#jF1&UXzY(SNvQO=1
zBr`T7@8we1zjL(MUjSrv`SHI)Mh~-f+C$G@_b{oQ$(f*{k!4W8pD3Yp!20_gZLwpP
zuf*19@0Y3M_ADnf<a3a9g7nVse0pVhwkdD-G2B|0o~+mD(Lw-G9*%c&OG*fx!)fC`
zEYU55{2aLb`BZ3PtEyjt68@d{=Q!gV_vT|-?-LWoH=G(YC}eLdE5u2)%A~$aCKdBX
zeyymiFN^x)lG%daxC+E`xFl!#?*b`tu|T!}AEzRVR#8K1BMWa^{0>FK2RL)hk|Hr9
zYOspgU7U%Mbi@wjisakHBk%itZCWgxU20K1B<7{dC_TQ|Ykyeq3OttTYfcmoJgS(D
zxCeR1;7u<SBM)%<{IL;jq}7LoV;`|SP`eW~p5)!jhcmXx9#&6-KxrTr^I!M|3cgFI
zt=8rG)zK*GnQWy;@2GBmlZJ=@I}H0r7J;Z;XE}TkJmQYs#h;G~!n3Zk^Y>>7!px6n
zW}ZD5iRs9vt(o^FwT$t#qY2IuP~<}J0AHs|tZpU(oGp|0xaylUY=W6lrAEef{N7Pd
zpZhD8&uNZLy)qX0#leDF3Zx*Z7d6lak+;1~?CR-}XJq2`&8yWtqt>zg7hg39Kx-8B
z8V-W#xNWXbZiuPT|4q84m2sqYv~aSC4?T|XBBAQGn_W{(B-exmSNBi*sF4h}BAEdU
z^EEro;9xkoA+3PIvyuUd-6Eu1D9Y4R9qtwmz?3fQ!S^DiKMB!&_8Y(NJ;zh1aNxp`
z#gceCn6F#52|8zo&a?Sm*!j7SIYMT{X>&?Tlp1!Ve(Ekf$Qkf^!E7K1KeS9Oa0Cl*
z+&YldIMuAZaInDac?Qe%uptz<im$m8u@X6G^YkJbs47+d7V6<~HFIwW?9Ayr^51p8
zwZ(S#y7paQl-K!kl0f-NSEZ1i@3FC|kyB=g{Zk4J7`A=OjWREG9<*Jr`@9-lie-gj
zt8Jf=k`pV+D%unbiVx7SCxzH1be2+{Nz&L~6g0+TL_&Lu+f{oO`wz)>?<i<D;%`63
z8@IaV;fw~y5#XI3N@S?+rGi=luMWmAZ(B<hF<)ddq(#|(r3Wh;IDjsl_c0t6+@XGQ
zM!-Y!b82cQJSS-K(JHLL&|d0?{MDNqD!{Xlcbz@{cq0)G+lWBFeT_ScDwE@NF!+*7
zHST&_pkVtSUeTkp=5QfbbCp@bLQv<xEoP6x3$l*riUt}s8?o?(W*c-#NZSh9taZS!
zG&YYOiC8+?&!60My)$1b-#ifM%t&JdG#5ebPZCxm?>R4ND-P-?vu1dF^O*dm5`XpN
zL(L4Q47_@~NO<D(-M=?pKl^;Fvi;w&3Yb<}N8C}t_VK6^0q^A4&yD$-T%Vbu<HK*B
zz`}>*LX(!@$hNzYJ-a@e3$|SOH~UmHqb(I_nYYWm1w|&&Dg1wqX~vwc0xP-;+=2^b
zFNs!HHg*p_8t3nx2sc5SXl5Q`F0uE+;PA6eoT>{S2LpoH=jr1?KRu?gy-7(73xW+H
zYPh7vlZUtz-xVt-m{Cyrb*U!<d;t*RkTPhTe!}m&xc5J08m1t20sCQAN<pLEUwic?
zWmopSqX+g)jXn)sWlly+3{a=CL_wW+Tt$wHeE1Nj`vf|$akssgc!G9$%<0j|z;58~
zpb*+?OgwkJ*YECeqW#9@!~Vo=|9Q=H=1-`C<_1t;g_ZB0_D+6@RR6=wfkFi71W(yw
zKq$>uHA5fU?fopu5~XGfabXxxWM$#*j5h%D?VcKyc{jB`_snLe73pJ%mrLQ@GSQc>
z?LoDm`p1KU<X7lxiXOa9(w@^M=%G&&Ui~cz3a-!bURZd;1ZB}WAy;8;&z@v1U#(1a
z3^;SB`l$F~n6|rEOWy30z4Cg(!Dj(U^vi`|$6?DP2o>cXRwk9tXqsmNm>0-zKa~3k
zHk~qgA1A(`4}bkv!14s}9}WE?pf6h6p{BuQcnv4~Bi3BSD((<<a;?`N#H}UFF`9GY
zP9(NVKQDVjk;sZ7IsMj7x_v#kuSDH6S?tR%Rz9d1Pp;q5LAb`GVCJp(uSpG8=Sr}s
zPyHH4IOX8{-k#3xYb3ZH+A@MA=&i|{uZJd`dA1?U4`sC9aV;$1d(v!*>@6B}A#TA~
za(Un|VYS8mGyh$=qMfB3B2I6hwevyZkz`2>#}z!yLk30C=8qjSU7K&X(?hLFibIJa
znqudNubvaw!lZc09=6LWRQ>hsUVlNe^$S7KbSRdI5<y(Jxq3wYx#b1AJE>BmkndZJ
z(+4?o*1_z1DGhT_3ppNt*|!dyU>J#+hUcG0(jd1{*R{jOg|uAL{8hq3tW48D&g8kL
z?R;!#=;?o0c(F_8jquk$jc^y#TR!Yr@a0DXI%MmISdI|y7u&H(N~exL`un<$(Zb?W
ztih*_`Kc04FWGMU1UT;p&qW6ui^B=zh;HbIkWY`?+YW=m{wmfS18}ZrhKjA$nzx_(
zn9$nmhUk~#oD!Qg24RlY;&XN)sG%5r<%!I&D{?TpQj_-^!*MA=KH1^dl#0O+-Q&yz
z0CG-?(3}1dl*4^4#y`CnrM`Kxz1wjqg$ai;NL%k?`%F9daP~;t?4fgXsWNM;{QWTJ
zE@uH9h?U`}fhxCxoUoqXlBe<q6+LqQ{XN@fP4VlJ(X5l@QmL_@p}O22rhT>Od(JqM
z%t9?{_=C!8?-f)3iuZ4ABg{>(R=^XRI;mNM#DrTU<-{uex2KEl!lD?UCgC@i7K0Gz
zlDmq6@y;THkUk5-2bKs-wznzEt(_t&IGJQZ8~Nh-AK5UeHK_Kl+In!;k3ZF5b!Umn
zmu$qjb@Rk6!TI`F^*pC736o1-u%SWd4j;?e;mR|B%A~?qhMsYq2*iSSoh>SKGpH0C
z{(2Ajg~<%qWV0|k=*w!s*=S0afQ+}}!EmtzZI`iPn0hu{^M0wv)^ivm7rf3l3Ev)w
z15;)Bd&&7#(eBF@PCg7~hacKh-g~rr&qyemi6w<!zV>%(Ih&D%XYRBwRv_<z2qAdx
zQ_(8~3{&-j_A-8uTt6HBE_GUEwV#Ap9kv?oUJi3K#FqYZ-TOBWlrqmGJ~U#7W+OPW
zT${yhu?s}D8pW=y&~R~EyMWe|GGyRW@B|wTmFh8aDo3qS0!meAY_NK}&|R4LywG=9
zvk!G;;EeOi$*zYA`SBB@=Oju-(9Q9C(2qssa1_&OPL5{cv^BcmN)L^{;=!QS;J{eg
zfM=1tf#CyvRxn-ncUUu2)SenyhW=FHp3qw8MH+ImAdK==h$mBqqSjLp`*~s3)B5dB
z!f&ajCyKIQ-SGT<Adc*<C4=uMFn%zi&dX=B7Lv48<-5uc>hE+TxeK>|lJ4j$&ifNc
ztNB)2=*)}#Hz_n_>YvU{yv=Jg2@0&Jmqh#3eJydo?rS`BW)#7?O|Fg0l+!D?oZLpS
zaTf%ameti)XQappFFnD#2>0VYbfm?!+c(SysCn<}MBL%e%)u7Wkaw}hAnpn+6Ky8G
zL7$hx>>#X*S<y2+Rqr&seLN4HmfUf9?QgrSN}yzSIw9peLldavqX_al9*rR_r)jS$
zE+n_n%{AoEYBBqy9)yfT-%>5E%Yq}e>P3pEMN^jz@8`X|#44}GYuokC?$Lgh%xRS+
z81Z}d(RK|Ldv_PdG2gsI^<=SrrWv{!UC8Cg2S>dK=SVCcyRMaLW7uw7blAHRX0q{N
zR*0bjgwT9o%4<F+{$Be&B5MJC5)#Vka7*Bhu~k~z!RA-W2LiKs^~UDE4QGSVPgCkv
z(<cP)1`KjgQn1%-3?J3OLd&+(Q=P+8F{t2!iOI#BE5up1#L&`+pdyJMI(=DxaI_lE
zbWKj$wP#=ZvP6{cL!R%OWjQ5GtID0(wD)Vyesr`5DB*}+=tHeDZ=Xg9HYj$%PIOp9
z_J6($R#DslSoJr|!aS~yM6qR~q?RRgO911B*~X?f^#>BWlh)ysUEmmB)pG`+%1BWS
zZntuxN{iOvi+|O|QjK#W*yCG&^zo0BJ6D;>$-%l;l#4X8jGq@5-o6A#9*w0OA|*Eq
zM+VyHq??BzLhZlHcV3`bca$Y&Ng|V6PkzZnPc2w2!ya{ZZ%-O#PE3L@O!_DWGr7-~
zHbgb07t9roWJKSr?HuL)sH7sxL+5UglDG!%*PwG(ul4M{u4PT!8vi=g2ypv7bX+HV
zgX5U2Bt_NFOje+vQ}FnW_}|mki8S<MCfS*Z^pS~FseGqyb5dhP?q|apuDZ>qCSGS`
zWO5-EJUe-11KP{`_U@02!uO+%K!{iVF!YQNJ?%Bix+nwl&8|0X5Ngk=kogNbzx>wk
zOWdhSW~7sTnW(Jeozs4HHc=5#Cks>MT%itL%~T#h8$)0GDi1P~7lO`tS%h6tfP8Vf
z)Q&qPCVjG}8RedI9IS8rgo>7!mZ1N%?5X-zx_GiZ*VtY5cx(6Lok+I8rS)-$>qP34
z!*HYgfai|;A0DN<xq|!`cO4GD?7eo*;DX&^QS3Wuahv;j9kIwu94jt&@`%Q<UPp0H
zz79ec%=cj{<yc_RFfjr6lIho~JSm{)+=g;whkiPs--78;x4q0cX>P@Z8G){<S5ajS
zqEw7Wz42sf2z7c7r6RK>_!)=Gs%IJyk8Cr_YX)I9GACT4Sh`}Q6a`Zw#$9w}FRS&9
zy<h5WWGmou4{-vQZ}V)w;UxX;iur`QN)qwr@29%PFC6Nl{_gi4A1qnz+hoAH5omo+
z)%od0aQq(>2ny5AQBSil(3CeTvF{7*19q081~t7*IhTgaB9tP;jFnc?@lt2Z>X={G
z_ffMrOM6u5d(f2*PfR-3#1r7r^>vrbjVA)nY^d>5q#36}Y<d`kis)M8J|0sBiKM<l
zZ6HtB4_89n78BNZ7meHBY{mEDDf95I&^hN?avAQ_{T7HjCPJu)Uq7t`X`%MCyvcGg
zC&@1j<afAuQFK1D#V!6so>5UK76A+c6+Da1(N;U?D<tIWjICl}Q_-W}3&ehAnJY~y
z{qo=1*u=5A;Y~|Jp&^^qwb1t<>Li=(sor&WpiJnTPLz6+h!waNb4cxm6Sju`R`H;8
zz<&BCv>go(gR@5-l}D+|W9hTh{s4kQ$(>+Hv*fzRf794DFtr{Z8&6i~&o}!F-$CJT
zKvgIve9R5K<B|e)sTF>eH-kO<EX046FIE1*SB5z<@mpt74LVJy{qtd+>MlghM<D*Z
z{a!@VJoa{aHoV@xRUng-K@vq`XaU9i_XfW@zrp<fE9Hc+tHZ4xdp(v$XE>&L@QyrI
z(6cAB1*8HBY9fPOBd!3$_9RNE-eFD1PD0J}WxJHu&~fs|NAYY6IPJ1}ZF5i|ncEe@
z#6Rh2aaR8wExT0}-Q@Dc%=wANT~#^hz9H4CJq6~5&r4+BFtv@Ti6;PPXKxV?#P((P
z&g$jEWTMbl)JJ-hpOxj?CFgigGjc-Wgfvy>;(w%09%n|TReL<GvUH8RV%@WqPJi~u
z*cLMOUfggQ-s+PD20KzYrm2aTG^{qKk6R};z#nY|_#)g#8!~9^6opFbl&VL|r~fu{
z8|&gk451iL#2!4e6C6B#r&OJ48Y1U8BBC;GaO7t)e3Hu|!_TG^KR%5^{(XuzI<rsU
z@-%{pFe8+b5aSrcXlB2JhUcmyPM#T+om)auCNOJTX>@(8GrQux3z@+W9qGu`#CZfE
z*j*DA>!%=UH!Yd4AwCrT__2n<+>=n)LCbC7PiMw1Bd-REzsB}LIfeuUF8?O&3>JVP
zsKBB-r{zBK&g?=f(<1@3rtpd8C$@@D%qX#2oYI58#x~`!F`I!lDxw80ey%{vrMWTQ
zoZP-+h1{L|p>C=ytw3Rnp=sGQWPkE_&{5@<Nq)5^p^P|$1$e=4Ry2Voe8Uf3q5sA2
ze4XQ=Mny1bem+jNc2VAwB-L9VgE;*|lXXEW(QsowbY5&y$gYM5R~s8)0rzFxH@01N
z8SB}9F>WdZzXgTFEvH}5x>bhFNU6$a+G=x}X!6IB-_Ht6t)w3#=_9Xc?uP*AiXVHG
zDdlE^;cczRvu)lxmJ~k~uA|iI!)+sjCwnV7&VJalil_-R`PIs*j7KMbID!^wj_S&j
zt<sNjbP}=O3Uo?!!1?LioqE6UX#MxV>)Qx77y!lj)kCE9r@o~w?n=EWd47klT#fl?
z{w~3GtozQt^84`JbE3Y4{r`uke_!y)eYgK4y0E~=82(g$_M5Z4_gGcu2vD@eP%iMU
ztP$MfSaoeSXgT(G(&aRXcQWfiEn2H#%d79}sNzvJdzokz6OG(PdiBJR)SvN9{MZ<o
z)yJYsi+x*22W<M=S%9<}P_|Wwi81;$HvGJLl!Vhl$AJ3_AW19hpA9l>7eWiHlrojV
zic+-?Cx4Hf#Fv#fea-v1a;o`?CU4j(Qj7~;z*OyOF`5<`l0ko?4wd{qjvs?Y4EQ+R
z@tQL*?bxw@Rva_s-;kxmVo}iiks)#nB@K6sM&3ZRmy5hXexfT>5rMgOak!G2J0!VS
zB+H7t9_WSa-izg{9BHzuZ&hR$aWpIewe#wL<F^HzK|ILN0@-BOfW6B-AuI{|tuuaG
zhJ~63=G_)?ckd`}6PGC}e9DbkdDMBns{zx_Xfl_go$66MowBk`;*gM?fYMp!vA^(*
zBD3#L@AoAC5mN*Bu*z84^;B7a)7u#M9C`7ZAFl<nS4eMj`YQ)L<kw7H0)(!VEAD0F
zk!=24STJA;@L?lAc&Z4pn|S8$u3@@ik(at?GQ{?FGPJ{_GmdWPz9*__*S1|e{acvC
zRh*(SFnYq<ofETc)Nilucf=vX<OxZVKIEALUj$<O*+Qq5M3&90?nar7=O6j)Yi~^5
zl>4{4Efxs*APk@k2z&2xRLnEPnvtL2+RUqJHRIM+v*Y($Mu8KIYVzM8e+xVy9N&4b
z-{9!+x&&qJ5=6tnP$pMw{!Kdc<4&RxjW{E<T0XGM2-h}!u5?-7pz$5fiO|giF+NU>
zM+I~pvgEC(Ra^mk&W1ITy`GW(>Zvs;NECz@EL74M0f(63y$yo4^bPZH&Fh&HiVD?r
zJol@ApjET-;j@3C6;tFn!Q%M81k0Yp_XXO4gF07PP(s{+th<Tu)dlxC`@zDxuScsz
zYFiH`uVY-_9mvQ+P0{?-M|q15n4@NIN6rAekM8Qt%bO&i(=AP;Rfu%Gu}J$%2tMZY
zwm(snZ?G5SV&<A_%+ijf!giEaH}0vjJQuBq;va2)V4||hh4<;@tvUMJmn6u!*MpaE
z1~)9JdWTRnrsS~S*;s4P%-@^PxeLW)h(E~icOlpfUWQxO9xxx{+6lSS*2%$3&o)x#
zDk|64<F({^?|TiCDJL&aTDO2xnt&p`QGUhf#!faH@cSl<U>{j3Cp^+#yR%dnGzR{g
zYrf$y)5Dz2yF1s-s`Evxob}25dBv+C8*i7@aaJtC(y+eyl73X!bcbXfZHwqo`|zC9
z=^^*&xdLMbg>v4D-#`N}nES$&EU)a)Gm;+2J5j=MS58nOe~R(6wy*(pS#UKdSF%6I
zU)OwB)0AbB$$#>C(-R(t+DeASg6eJMPXqDUrjn-%vh$=QK*Me9Y|gzGa*d-Tq^>Wn
zJ^&p<Lv>%J{Ijfy^l-pl!I18Obg~&TiMaXWO~b$s)8xl;M=Y)M1CKLSAix1<Xh1P6
zw3<z>iO|1HP{5wXoSciME(rK7DOagb=Fn{CPansI<j{1wm<FoPuB;w2fTB65+sTw0
zMGYTaMt3`^)%-b@;Q0ryxXon`rX7ah5!CVg@#7avdSigIE|Mo8^@;*kPpi)0EC3Dm
zcDfOp#e=PV{5FZ|@0M1aGWxpLliVrftWEgjl4BHcd8LivS&?yIWg5gSt64E5)-eRJ
ztt<7(5tx$xmL{C4Z5WTLL=`=Jzobj``v~%KhF)-&*cde21ny(0r-j}o#(c`=3Jv-z
zF9bX5)uw6ogSk0Trow?Wa1CeY)@{(A+$ynA;@}uzWEm`9%Vgc<-Y}T7`1>AF7Dk5o
zq}ENU%_iYbiMZ@uVR?%|2`eVPEkg1KUhupM<_Kvs`gy6hnXQ2CKUPEs{&SBW;28o8
zhf9dhCb`S155Kx2NHbp@pMvxs^u;)Klt~N}02k!6Zc}2aF|e^dLt|?POPyX}Au|hf
z=#rm^Gggx3-hjkxIb~sKUEw#Gqxg)0de*>!MR3nbvZzQw;>su!e@KxUY9LDPVwi?n
zLF$a(GQ4Tx2Ciy@in6fvbf~li$6{TpWGbG4ev(qp>XYT%AGGM%cmJmEsKDKFW=G|`
zqMong_fm^Q4R=rAW>HsqcK5VZ?KO30NI|@u416(usjBoMwQev}WnD$ex)Ae_WO`cd
zDh&P5pyI7{Wy!%%R`6cuMN!|wlmQP#mXrb3yFPP(#UUUVt^M4yy7lYpZ=Lr%i|&2v
zF`wIfvv7f>oo5=?&SsCAAHLFtls|s^waKc9T1k#6O+LhV9}XrT&weBZjTO7MpQw+g
zCL0!(>43YsyUAtUc+mQgU3%-0H>f=PU|te*dGcu;#tA&QtR-g~TId!$mSW0o=-iXE
zvBWYZqr8eFL8eKKs{eqP1eDxy6J}dB9gmb2Xnu9p^f#>^D@?S^qz1J<-~7kRc`BR3
z)qu^yYh?Npj(?&gJp7q(T1ocGh91&zX?i3rOf?*$a(YU@w#(D0S%`G@#@7N)pF%t^
z8S;<WCU4~z2f?dF9>Sh!p?K(m@g0Z8LClpAASUsda}VOt;t!#RzrTbBq-ipj>j}d}
zuin6agFVE;oj33G^rXy~?b)*u4^kD&#9Wo?qAL~7dqC^1+9g!;p*&$$)cB(PSBD%s
zQ#ln1kG*y_(lo3GsKjm#+_{bacM$|CPe~!E4Sfb62alirjOJ-hf^#3E5%yzQ5N5;K
z*o)rC(rlQS&GZDU!HW5;SLjtY0o`8^1a<nN)@qRm1qaO0$D|0%T4y>~Va}ymC#@fj
zZT<%|-PCNygm2>S8aCQZx*rUl7+4DS{BrT>43$gtBc}r{xj~5>BtKbpA!L~R@I^$r
zcQ}T-Kk?ByUVl@NZu_sfH_Yi4U?}9gzwTwLAX50@`^Pi8Z2j*efQL8fMyVs^Gj1jB
z3a3xyKJ1&HB5*ONE`G^H%;R!_a?S7YL^iXk3Zv?y^mOe_sMk?uLHqD9;BHV_Z7p5o
z1?CXcuP<d(ADn%9?cEsEpd9aQ(B;Okt370IqhIPFy9f5~9}j-qljXtkG0X<F?bYB1
z4`+QF0G+Wf<kYdz*L$=%SmPD<p}om?(<gf0BNhja3|*_pQCwA2dg}aH2m5Drvp)Mj
zBnkhT^{QV~i*{nybUE!^G1fEc`>iaCk#b}=6{a~W96SygDlU_pI0QJd6yXhelQ2<g
zd1G4g^+>U(yAnY`*z^$%(LpvvWwP%3WMKMCACfzsK09hx;`D&=K@3a2_u-8Y!T8M?
zqXAg6YTxiB2zJ_D>$($+^IPgI0f55#1J8d+%-kePz6=_iDYuuo`P9W8P>mIFw#mHH
zSh}2%PiY*Ie>R>eVTF@6M!WM(Z%4Mc)aEuF_m<_)5+;8iQl}rI3r0TO-bny3a?|H-
zflrz3;&02Pcpowl`~QrWYHun+6U)8v<0O;g6}GXQw{WBs&&ld;Y%DV&Tzb2EtP96^
zmJ%X)J9jEnh^wG(s{PwRJ$$GMTW<{}b;P}c>>jKyyOspvLZ|j+7xkAzi~6XO`Y3z(
zv244zAG+;{B&hLen#8=XSqTQgbGc{2g~HTQW%lUz1r{xlL0q;G;8`;!EEgrB|8rzM
zo;yG_m~*Fg&yR<1LGIOdRmtyJ0h^Za?|c0yz5=ccpTZ_=7ImJ~X<f?Zh1AaYyQhb;
zxb$QSxM36}{DPni?s}k<9H&k{)L({YndL_hIBpsXfQe`*;M}3p;Fv{&LT`PZS@?0q
zH9Oj0eq(2Jrq&sT9;AXDohxa-BEjX4Ar<}iC(PUt_T%Rdm{+DKE6?dzE#1tWvMW2A
zvk-Iekct}o@cQtW=J1>5w%4W4f66B2%MMtyuBmfW)_C<bQ-{l^SqB*lv*Sywl04^*
zS+pI)pKnU1jpU}Xpn}gxbl^;yc^9e{#mWavk`4CDKUxM`3^SGxD}~OV%lVA$WjAZJ
z`u;q=BM4ubS@ezAx;S=_EHids_}3l*^aS9T)<n3jP95RBM*MdJgf;X__wgXu(25)`
ztnoP1Q(NBL1?KSq|LTk6LQvmkbHpu$+nj^P*c5w6Ywz+-rT>3j#B}sSDGmMi)}FqY
zi`96Vb^1BoeDe52aH^y)M51&6mTm7`J~ojc@}fUh-%#^}CAe|g8EFv>=H-%}FbLcZ
ztkPlau~-PGA4SHDE=7gV#rO^EZ$Z6M)I+rg;<XgrX%#k8jsy}mkwC?K9Yqs|$G87^
z-+eI#(9fq4lV3-&<^whz1TTY&iQ$v_l_5Ke#`x_(wiF{J#LaRe+2-H#ar?9e-|Bc7
z__lU0Tx>qO9Ui81LQaZrGHIh;5p&>ib;Sxll|SPvXy;v_PopGtvqPB&^9b{?isUy7
z*V|<c&UoF4ly^Qafsr>O5z$|ckro`-IXOsZLJqxr04U3I<5S^mA#*xlomH3Pa|OTA
zyBSG>8ZK!tOgHUcbxvC!JL9MS#j;>u$*M##QyyQyU~*TRrDT7qc{K7vd))<M@H(CL
z>F=&5|Cks??zk+YzXH4+AL&$*67VFtcD%d38`3S1xjtNIw*96yLo*3Ko2gP*1eg(O
zMhBn#n<#i%ckT(k1swJNvyNAeMpw;#q`QK;ZYiW%0+w*{@nkK!_n!XmKY%RH$S&&Y
z$rWE~ny(2qSgz3D<<{b|V-4#lEErXHZJklTcas)Pb$qi~1Oz&_vSi(=TDrtv*WGcf
zGY5(!gtzr}xj&2KS+VA8*gfA}j_@w=s-<<pB(Qqe*XI;7ly=|uVO((g`qR+)Cz**x
z9k1JU4;K!v)m`JKx^G*574^++qSPR>gZln>pBw<XM##F^kih44?`^KU*x;_#e7Cl0
zwq+BVRGa7sRJ?A#H)PT*ZOc&(lgX_w5BRxqwM4Zy2drThWwh?-Q_#%jq!UmP{K#b!
zO&J*Z9kQ8FS`#LV@0TEAQ;AwG*4+sS3Y@uSiLpOzWA7|v!2c|`EEEk<Z0-b_I$EJ6
zLbQkft}}U*tT|gcW*S~z&X<@;lU<*9JAs`R>zZWhwJY;1PDTko4xjMzO?chIca5T+
zHYO^I%>No@S1G>L?|F`NL(gGm;Gm1#Qt>S>jxEfUTLVIfQ>HBVkxdj;zpfm^6}A~3
zwd?e;`cTua<CZxLyTwT#md3QC7w%7u!H)UI@@#VV_Dpsxt8Hd6VNZtzZd@&0Q7x%d
zZK_ASj2Ze$8F5Xp`MX1}&s-18(?Rih^{q$}rXubi7@Gz1Kc&A;Jd~Dlu-`VVGJhY<
z?)Y1u2iYtSnsrLeIz;!IIxRJzIs1e%*U$P-4dM#o{T`D=Xwrh)4yn>pHJW`TBx#uM
zQyDP3m8?vD){L4wu<Z+RYIbi(-<{+#3=|q1RXS}sw*nVrpA|k}FoM(EwFAH7%0kEl
z{kTaQxTU3#eq(ft_n&djv!wgK0M_puzz+PIn0aqw#8mpb%!gea+wIsUg*}%6z5TM6
zw~%vYp)7?Xm2Hl`=oYArT)SVKME|h+)c7x^o@U2Ts+_GKJA+3_GFZNwZ?4Gl0SyOx
z)v5Pzp;Mg?b}jwSjmR_0@Q04Rg=cfes}JM-oIpVqPe^3I6Qtz)p~r&t0(*$1bO=PQ
zEL@x7WqEOl-zkKSWG_GXrbgohaNv5_BoFw%I;P&9{3Wi|Rrmyn%KmB%yViQLbV~_t
z_osHK1r^w^oyf>435<pcr^mZo*{K2z>()!erMxfleQsqB8H|>XD-AJTthq-3Nq7a-
zY(AcMjauBoe`0tIn#R>$U;CXwRC%Ls8M$c;xCtRtvqzYON3CKg5;x3$&%28TC4Nqq
z`$VZ6yzvoUHL<NTcwTnL*Qf+u?RsQmHdx=vAv`}@zZFFJjC2tE?<sUys%SZ(hp*g8
zpUEyfclsF0FQGM5)EHiJCH(%>SMb{eZ6#x=&V7hi7_@o6#M^WH{2e$MI&0H6Zn9eN
zw{jgnLw|P@`1UNchGng4Wi|ah_KRtuJ#FicIgc^dL;IeFf^nlB!40}?-6Q_otGRxQ
zmrGbuoS;YlDSZeHt>Aj5sr+X@eZPEOid$=PiKx5Qj#)wm@ZchyuJn)tO}1R>8p^gT
zLsuNf+&U@0_pb#)*KeallFfbUryV0)zXzY45JIDqcB%yx{C0s-dwEhk2B#-wLeR;~
z{KGr1tP}m;M$fqtHP01gb@H)BuuQPdTJ;|rmJ8GL^Z#%L|8K85@BC#vWro*4>C9|`
z!+xdKLZnQQ3;P%=p@Ce-C%`~tFCbxO(TQNE<+|C%2Uf@J_}(85;O#RKS`yqPXg2-Z
zVA}9G_o1xjn0nhZ^HXk3#z^SAzpUumcensA`$+JFxP%D(Sxp9Ve>;#>tS{R~sgtMu
zt@VfScTaDVtGf=vO8%&2l)O2cCdhKbw9}HVLwrJyhKkob(!OZNJlGK3RQ%2F4M@Mr
zlch;qf_pQxgF*_v2L+1DTHs?lO#{t4%x{up1mA*TpUh~J{p3@|!_1>GXq<UHh2us#
zwWns!0>vZ<+BEGlCOE>ORuYTJM!-hWf(`#3`H2d$Wze~aEEA#(zch0u|N7~(h<U#<
zX~5qlisXIe=U7hE`HufnL>0bvFIIGOn)n)j`kFAu)wzR1vL(d%Xf6bwB>9t8iUuxT
z8(_<n**{4i?7$0t3c-}vm+fv&z5j8)a?~bMU4(6f(0vjAi=cS)xAbbGp39fHS-_tj
zvY^&sjKC+oqE`LJF{cG0xI#s30V}S6p9(hV#J{lB=-z8D|6lLq(OTZYJy7P#`IC2V
zm(CT}++)iRI&F>SeGqo%r-!YoZfYf!krv3%WFAl=!jU#t%7XhaTlPu0er9^nwpM>j
zD-kf-yF09KlWC`&TIQpv9+_h3uJePNYzG2`(t&Km)Yu?>e+BFDa@G++mq*l|<R!h=
zlRQYKX1y6(!y8g3I=)b)+0T8w`FFX)+a(Q2w6&%p_F|w^t#ILVF6w7@ZPK%9Fgl7x
z=2w5g6w`To3C^9O{Z>sd-<CiI<^XNEe7`KS@GuRM9dyz(vU$k=F9wZIbc^{9oAs|y
zDEz-NL!#UJk{4ob&DtvMCo{|gfO7p+_Mog{bVTm7V{63Ul%Rw~f0IUEHwC)veAGa^
z30J)7#*KcjMDPX(n}<h=wQOxDx!|gi&sK-b=0A(K&?batkzjIhe7<ZFL8JBb&#T$`
zVp=xM`ZhtQGwmhf>RPfgD#-bHLX2=9L2;gPFR1-)S(i#-1e^cP;XCp7#7qw-H}AcL
z0=1KSAn#d8>N48422iL%WFKQ(KE;{espd8yU65sh>0cR{wWzV+zlEf25N9PR%OEAO
zI0Atw-SBb@$TqWXQkbydZ(FNIadFAH+4-;<{E$l;;jIBDLxKF6?yv)>l~tWSvTXO%
zIe02RMovn#OBC5=6~Hnld16t)g$(Qnbze^d9KwzM4~>EHYyllCP=e#j`_txKyN+gC
z+?c^Ako%THgZhf^Wfc9Om!vuL)#H6`^SG)7V?zG^pFyoq$B#C7l}Ym2^7M>Uaq9iN
z0tXN-R%pUM`7H-P`c=uV>w)zHBl+@l_4=^y_z&eln<zp0?YPvHD518Q>z9+Lswxs7
zmtCj6xr)Ek2-WDaG31OJwIlRQo{i^}*}XIIb{vxIOFP_Ly%~v5piHlD60Y-fp0&%T
z864~!@WbwBPGjG;vESr(&eREvNqSn<|7$APzdrFsBvR_&l6MC=@KrL)d4jN36d4;r
zWJO<c(j|Q%kk$|_Q6{lFl=*|rI2Q%tDJVoYiX4N8SG&m`^~tT-s%~Sh6%sm<F7%{h
znGS6y<7@oz>Q?$F3!cnJiACD4^o%I8IK^BcFI507dNi=fn3*>##*0K2Q4R<hKdi@T
zn>>!Q%WI6Ht8MW-+WIFQmi$5|C0Qw2g1FEBhC#7m)UKWhiQxa?@Ua16iU}G#$S|O7
zQN;cCr27yQtl07;wC5a^n!rg#(t``hi8ruu?+*aJDxI_bKQmYFgY%h-<^ONyN_dID
zo4osDNo1j~xRB&~jVX1Z`CyZBwdjtyM+m-`5Bai4Jw^D5n9kj;zx~HA1U^S7=-3)W
zsNRk=qI=0QIH2K`wsJe0@(+~hai$(k;V$;EXSK79s<xTkV02#H;S#1~5wbkYr;Zs4
zjiN>>5b~stgeQ-g>C6UjQ2k`l{(W*wM0y>{T%cJ$O}kFJg>tYBI)4{pK6~p%q`)Uc
z18_SYMzA@b`|+(ieou<@^V^MI83{O?&bM{Ui$ui0ggjo}Oj!HsIA&nD?GOMsXftU!
zm_KY#q&DlPCaQ_-GKLN@tTx`#5+%$LzO;TFJ2oXkmP3EF%4@6S`YrgcN~Ddr%l`6-
zZdeEr5}pot8us&fplgc(tHX|3(-4mPRJyop^~&g@WC=B1!M6^<O@8zBqZ^r@!O+J|
z=Oh7pmZHjYPw}kK(5;ql;tlcJl~e72hTZsqx<{bG%x#w4Q{$-sm&Y*&=1xMkO}Jd#
zXqmk#(q}H(Z_U$tyqc>A`hmP-A-t(N23gjm>~lll6}(4zhD5^Tr|uH+oiT%22nt=#
zBT;CbmL^39Yv|fgmEdV05*=Q29uTN%uO>#iii@hw;R1JbyaOIc70`4vy9`Tz_1ElK
zr_1^GI(<T8&b_pPYF32x+5Qk){k&VPOnG441(4UV`05_tyo*GjqHh_-YPaXk6H}!8
zc5ldzQ)kPQEoPl0f&GO<X+13Py^+#qy593ui-)!ET(fGdw92XUm>cFdGUX=Cy+0~)
zX`XWIIY)p~oD2QqWVch;)hj6oS5j49j<$fX)2k5RmQ5HA=g?qB-<Ku{*o(Y)=bkv&
z0;zk}CGgzSx}8HFnpo_ON0BH~6Lwzor(RzRbrGIDI2{O!*<F!kh!(m;Op+ask=d~_
z%GxZT+inZ({LR#IE`u-O(fub><8hBpwpF~h7@h2ESzFqF{(=C+#1Yhf=Ix+g;K<pw
z+~POUK?{Q1m$ZZ<=o=0yN&V$xBVaAl&jXsOy^YK$Qy<l~^-$VB!F2j%G%1Oi6Y;j_
z&^oK9Z8LG{?saN5_tZAZMu-h+l9FokmX%Mo`z+H1{*%0Uav2!y^!_&$42*Wd96Df2
zG!x0?S=Te-#HaDlj%iBKEwOyerj^Dhti>H1a^l!JGSlqI$o8q6BoZ$5Am#XQ!Uz=6
z`DSmu_CjC!grNmbi0PWvtw=!pw}$_rk9xHTNBJ^&qG3wlxN<$N5*gZBaAt-K2Jjh1
zy$dX*(hCf3Ij~129P|AA?^^&<Bolarov(yKxHbT4gJv6-XZ^ZB#C~7`KJetAVhubk
zS(GtzawxMk&6M4EGp^2ne#pQ`uM)5==3%un(KS%_!u@IwujgFI?Di_q-?*(xJ!Utn
z?DIUZ$jD*f1+jOK?`S`KrtpO*!RD$|1=r?dAiQ<;R>F=mavmyiZk+S^ldGI{8AdaO
zF`?GynuAVifY%F>KYyPVhvc(_DTlunbNDV(fIYgUB}u2SpJE~`yxWYll>dG(x@_$-
z1vEFHl*h-2Qy<JAmDt=kDvDp60`XtLsY=>mJ<V-<vA>qqLMR3(*jWXnvM|a)D9C9m
zV2oZc_uEa}wa7jDsf>HVS5al2Nm4xBvCV9jWG!a;_qu{3wjT=qaQN#TSQVW5H5%P;
zfC;8MDjc~TE2G0vD0kRBw)odY`AT4k96S5=_`T*6ne;#Od|StK^Py&$&|E5k48Oh9
z#p_})*S0N`*?UN-MdeIZnQPiP)1{{waw0nC14<hVwi$ltiY*qOG@iKLa#$mSrRv}N
zbZJgEQ%1#rZu%f%!ZBp8gklgNQb5Aqx;BygVcpd6KQ0x4txb~wX0R7-JC+N(q>mQ)
zEN|&TRY;Ru2TLkW)kj3L5FH(8B?YtA<fkO7<c3=&+rjl#9UU^vZf^S2rkF}bLHsTd
zkjV2VW)iv{@FoWn@9SE<o5)J%WN;?w1tX1%4qhH?rT*DVpbQMDOPM*UJAm0w*`{&u
z!^c#@AIDMYCdy8g1Aqm=*|fcQ?!W7DYvedlii1RW4=MC;Z?(VR7G#L*DPn@SNkb6X
zMu!bEfoX}b01ZvZ^E166k#nt$hMrZA1rU2P9tT;99_8h<HT(Ny$(7zhw(Qh+petnE
z-2;F$NG735J~!_9E)}*?&q_meau~YP0XV%JBNb!M^WYAgEi-T?xd81QSJR3>{<~HM
zM?po;9;E4P%9`YV@yPmPXl_S(`E2AP%qOrJXp^H%AbM3qT|yMq4?a5m?e6(@MW0rN
zWP-dlOv0+V)(O=*$^_kDm)`t4Wc45?lbb427G@tKRhvB0@C`Q#_=lR=6odcIJj-xy
zo*n()6p2CeO>jK7C?xGCBkpcp-y3>wUEwZOING$%$qpJ}7HU}HE`p*;DwfjgPXe$0
z78(S+j)XbS@UO@G*zv!0D2!Md+GlOx6<~+q-1|`aiN_b~9LHqT&r0kw?A_WAD!5<Q
zr6@68mP`9k2+0a666dLtu!~cpzo~>cES#3VLE39pz1*|m;OEoL0{Qj#-V2skdhwe3
z&pj<<(tWmE+?XU9x5KPrQ|hm0C4aNutI5gN&n!^UEEHD^g6fa|1a~<ky@^USeGfiT
zYCAP;EG(5zsy~=?hA)mk<hoh3qAs98JlwikQGn6F=9DaRY`<yO#7-qHF(7^=inD_p
zbB!H$vah5IT0nz_9rKzsS=c<uCWiEz$0oD2Cp!6fl8IL&rqMQ5ESR>E*s9hl2S|@2
z&oKrsxGQ?`m9;0LA+=g?dwnV~=8F5PE3MRGe>ov?KA&i=_y=fn#w}RL)Q?pV?b3b|
zmZQ!r-KGl$$70b&+P#~ekOvLdW%!p@kgV`ov0URm=H(Ed`PSo-Fi!fxxCOR=J1gZ@
zH^@gA1ayJe@x#ZSHTjLN4u+2{l(zk5$W^K&N0Or~^JK3;ZXVJ1gB?3yLWkM+6>6E8
zgiLuwHLr?JVryTmey;Po??`s~ltzEZ&;Y|MPfp^69wMU4C%gF_xj!qG=|9@34yKFB
zW<5EeHMpnBYbN25rkx?yr49M2p1`}%*sphI(|^LoX?fBRCp5@=i2YKI`|*uKP&M`5
zT|~u!(Q|GT{7k3HtsF$<L(|3uPIpDg5bP@}fgWg)+h_`LTWD6y((*(g_`~H3?T?8a
zHIaM4Uq3LG;?3#q$;@R0b{0tZHBS767|G8X;AcO))CT;3GqjIK$>)_48Om9!r8!9k
zVz@6BjnVSEI2smg>raW1w^#&{n{=k2e4l|<0*`FmE6wc`p)@*fc~Qo~6tvt@i`(&Q
zRBb2%@IPN0*|cq@D8ORt@$Muf3dUUNy;K3j?Zs!_?uv07L)@L%dE46cOvbXme`^B1
z!y@n<Mn`{!{D1PCe)Qt+_Iq=UP>w-;UEL%n_2OLVwVJa0`3<Xy%{L(Jn2V>&I$TGT
zj26~0>wymA7ZQLfWf%d5c4x|5uO)lL;q3)atS$Wy4zz#N5X*j!TfQ(0y#(KW*zZ#4
zexmC+2l!jS9gdhE>HWuf#?qpZkY`td=}#j8IbLF8WrWhX{~-gH-mFi2^mk3N4f694
zO0+2T#`)x?0_R>@wEL*biHwpSRABX*cmM~i29cCBvDl{V;MX8LkVpQs7#!cB5;m?g
z7CbvYQ1vkR6&$#*#lLR8+!7aW*(t<g)0*o0;_F5Hg%)37-zF`KMVY`;mo+o9(h9!*
zi36{5XMmF*r*b!VCUkLF(iIkzi~?1v1s^k;rY6Md5TDhkA<B_{_b5BlA59@6ppl~0
z9P{ffN(6O+Jn$6Zg4I}V9#6t6@70oGam*HiYTSl7K=#*b&wDXv>}=7>x9;VP?i`TC
zc@sc+@OdHEfBqr$mU|2xl@-IX>vH0QwthDvS6Tt`-^t2x+>o<Q{F>1Ad9D`TsWiXb
z@@vmXZ#?0P=n~oNMHEc|C$JT1fAWJyl$vNbBap9u<IkzVZD=x1{KaTOn8M`9gy;Cc
z<m{d;mi^S<HA@zgQo(jO%O5>1!riQ+SklBAIkEJ&4l(w`q4b3~G(+2fwCuh`erMV4
zv((EykPkMyWlEW5n)BHS$xKp@oK<JtC)<Yb$qbgnihEwRQrr*Lk06ugPGVTO{&fp4
zW2+}tu#SLNK@zTjB3AJ1I}GJ>h)t^9cN`uFp=Pxn_Z8?n?q{2pl7Y_m{@4Ug%52%y
z_<Av=(^CNF@ldF%ni#d5|J-FKBp~cK#PAX+MSPwwo`!F1#a-yJhz44MSpT;ss(daJ
zk3FP;neE_&(WiD~&A)wM@c;V2|AZ+1dH2U)XT|mXF=uQPq_J$*hb&!`rqS#pC=6jn
z+!ilZZr`bq_UuTdbY_?pHtqK|9u|&G&#UVjpC*y1Z7<%c4DRw?W*;7VZ<C2lzcb!m
zt5h+Nr~q&b)_o=4k2N0^4(ON}xfUME7+Ly;I4Dh#HARVbv1RPa(GIdTMst%_!Ej^I
z83}V9GZ6RT<Ss7<EwfT#0o^rJbX2TgL!TJ&bV-dW9qZmYcmzKweaO(i?>~2`KqF%Q
z*ZrbQSOV&yOIM+*c)A6A1{N<|OSEj;M0UHjswaxD>qZ|&2}$t@<LfjN&>`Jv6TW+n
z6lxL?zQ;M<gE6u$Tgtb{s2|66hUT)n#-p0i^op2)3lK2fY*j!-Uo>%K6OFwr3f|=M
zg=WIQzVrUr;dgZv%VGQK4iYsf^AbU?9mwkECS9*R&Jg)yyCqVJLc~XwBJvZW8RsUF
z?qzce&VP8D*SRcA42L+d>1@Ka65FSrq$H-T0=UnBjvH62;l1L)Q#W9^ciga^{K*?g
zB5X(*OwTB;Jx-Kfk`u%QcJvD1zu0Gc#*Mh3A9HOBQ8|8{Cb5N2D<^tvl(%4Fn6D)n
z|J}#eS!rL%KFF0F;<f~2At2t%7~@deIpBfWk}zh9a2arNW_|RAOCX(ZS-?}#oEp^Y
zT5EW{X};kBOvWJ|%)4PubLmSlH-6bf5a=b*_FP#KprBR}<KCyZ<r5jj1shRVP<&te
zZAL};lU`|YVH_e*o3X)htXJ_q$?zDb_`AFtngdo|XD$QODdolGtaIDMxref`_GyrW
z2?`pfj@WL)RO~vaCyB?(+2zityXKMZS=MZ`!^cd9Kx%d9D@EXnTj_U_g%|*DWI<0s
zr&jnod&7ffoY>Q?ugY0seOVr=QaS8oK{fhFJYX&G`eJwGwPXBB=F#tFFZ+W&Tt35y
zfO}x&e;{1;VFT4Kn)cI+W7S;%C=C>=+R4BRT}igC!f?342YAY8Mu=bXU-Um9ZovbO
z$PJ$QFSrfoOf{dW(HCbt4kmDaUU=4UDLfq6^1DXH@Vbv&>=@L3PWR)C6N};W1Mx^A
zj@1$)Yk{_A2L(wV+-E5^OojcyySrO`SV<OdMt+ldW$gyU9lf1|cOF;v<5{abjq+(6
zmNjQL+5$;m`nyazRP40v{vY<fGpfmLTYD=_rFSU;R*)*aHxUq}O794pB0cnufPjRi
z(tA@Py>|k-F`z&|q)Shv*AQADknd%ebM86U?cv@Z-x%Nc{GkKJAS>^hYt1>I*`D{?
zH*La*p7js#l#<wnVXqd5BGZOT%+V)R3ZkojaE|GoCOSxgTJ~SX<%qx)xiL$$npzia
zO1x60ec;;^bKj`|Onb$HX2CL^p(h=?F(Z0IjP6u+n@#)j1%|%!Vr5K?ohv1bp4&l3
z>-!7UT#>)_t!XRcY^Iv=Ls75t4)$_zK~J)QA$QfQC7B*ceto;6rp^FC)k7NWK|&t~
zr&Q57|IZ=88KbSvV{oOcbhY<zhE$;;XldPo{d<xfy}U|DwN@#0-tE`W+Yotc|BNyb
za@#L`(xWCe4?Y)_^r0YOlv5~SriV}>QtX(N58;ThciEO9W*L$bCj53<Jqu<0p!G_q
zgnU;2L+&;^jznqn8gbN>eM8Wb!tKs1(F>z$2|n2Q6rA97mZ1D^%{RF=+~S`+js8;W
zSm`uuzo3~p;s>iB2%hg_;}zvmJ8rd?!f_s%hK|>zOXu&0OLWR&?Mi(Q1|Tc2_R0OH
zge!031{ntg`zHlTk)8Nq!YuxXG`~0OTrRuZZ%MqCzkKSYN|e7i5Rbo~BYbd;tL>mF
zqAlm}8>F$Ke&xX&3Ej~;8!>ItEQRg0cKpurb1r4DecL-6@~afG)I$xvgul-Jk-_%&
zJE~i})LTeL?Xm8w_M|0ftK8^1g;uhmU(uHM(I&tz0+gaChX`10$>OT^bA{o;zpw>3
zhrMCinGRTb$^P4>2Ggy6z4?59i!c6r<2J-IT}DizPtty2vISBW{Y49U4vl00S=AC%
zdTj7J`M`W&to7oBqqX4<Zpu<x|G_QEN48gPWf{W*AB+~7iV8SX)HOemoN0X=)XFMV
zu|I_aUW10SFMQJkGX-WgWjuo!^$l4*yH5dxJV3*xUJz)gL<x`efhX02-Js$9$~M$a
zkgn8Wp943$;4FakhPhd5^{uxLfMQ>UXsD-UoyWs$Z%wN=?N=*|V;9Y5=pBgG$96}I
zC53FuL!xqm_7u0KFux+?4jyebOzz9QnRxo9P#=$8Wa?L|LFW)mM-U<0tiRew$G#OP
zn7%2Dcl|TfcSr$r<P`o3eH@PB#q7~^2H(A!THyli8i{Hfg7g1m$fLQ=M!nGC;<~DK
zvTBaw&v2}=su~oV?!6eph<W?c$9amkWnZXzI_%$>>q53qlOOK?<b`@i6cT)a1iDxK
znWlzdd-i#k>P!&(M2_R1stJ&Z8RAa^X_4B9+-o0=BI`?uT_3?Iw?<>ihJe8iqEP%l
zX8`_U)qBf!8h@q!GyXbYqo6PVW`}y+HKZ?>Dcl^?1KJnr9H}Se!vDdacg<C^;<)!V
z`xU15mqj;-YJe)LVmqqW2mjZ?-41UvP6M=|1K{*I$^M-ou$vvQ9B{IKSdMcuBr0+a
z)M~((d85~e-jt{y!1vSDE3sNi8U2zkM&M{)Lf{|7YJl-cyeqe=7JR(hpyXi0>iO;c
z!p9CjMZ5uzlZ)(GPd1ttLmuT{Qx&|LTUT#OHe#A}=W+f(^V;d`nPKDc-GQlCoNuUM
z;5zSsi_{+n`A^bAO_ozRIR6(p*xWzwr6vYvb{@!AJQtP|*4G@{;zaMYK+8N!^hah2
zD8PMW%T3Ea9XmR3nhQ2xs{Nx?r0X05zw29Zs#9JMxO2;f#R(RzQ6NC&{k37j4EkF&
z<xD*5zl&!3w8_gR;-8F!E)h4jfG+a#K`nNQgj;F?OitBh7!(90c!S=V@y}0(Y+v-)
zsLgJ2I(YHnf(&3##%&^{spG3^e5ot(XpUQkp2CjF#3ozCR&;R`?f<wVe;#Bm$!UT5
zGsW+ej;96cEx0Sbp1G5?AfnB9b#lM`<k-Asw2dgkrR})9kKgMbbdw>L_<d6A_XgeD
z@A4a1&Jy!MEy<Rq*fX_^xXI!~WzVNu%K*Go^pmOFW6bW@+Y3#L=A2{w<o{0o$npC;
zx#U0Eoe2X3Z-fZz8N*6jHqvh`wUDZ*wo4q6qUUjK=~oS12md-Vod~&8?jp5j$6qB%
z8#B|SFy82?edKTB`9>LZqDU$OkAZNt1~n0p8n{SFn#3+SdZUFk6$o1`IthNu`gaAO
zIz9Nx|8nqusm9+hYyKph{J+JXdGm9=B5@5Ce5Lo4QmO4|BO@IeZ-0w9Z)`yE_pY{c
ztp8BNzd0;9IF;Ra^&3Mk3~et!nf9a&cQWz6T4cC5$<S|nzISJN5Z(xy8D0z25u5`q
z4eyy*N|WD}*7VsYoA@yZI(-#FcaYDF{%;m>tm$`7HgLO*?qb!31C0ZkHTzodXTZ2i
z^O?y{4bQvx@<$r}S_OkA-q!9tK*^5$Z=R$T4aB+i4z@u@POs9$KzHHO%EHufnrlnf
z&Pu6jbFtR=Ei}z`+E?MFfhB)A?>WF0oKBFAB@qVvrS1Q)I{!4*f51@ThZa?^lsjb;
zwHM*)Jy@at`Nx;7Qv?BaJ^^HBpi7}fj^6)Vlq%;1>l~jX8wZ8oS)U0y@>H8vP`JUE
zH>Ra@)(fgem1@-|4!;)7Yg4G6Wgm379GTu48F63eZdF0dnOSphRLZq@*|cH4rUR;S
z6I=2r!|v%l;8FneJZEIYRXP8VyDl-!seU|c{DUlE4Hz=?O<L$)KG42o{mk-r@9<|`
z|L^VN5OYZK`@;`CCp9uCfb`w!<dBQvoof^@kadObf3Sx5VtNmE>&N^#RZBQW=NrH=
zdO7|<2>b3o(-gbo-=KQP4W#IzY`(lUci=rHO|y7rsmyfdTcyb6?BzGvxOuAT4xGoN
zSq8wzna}=li)`OT;dMHDmqOJv%g*?&HIJ%Z0KYvu^A5D}>5Ky|4mPVX2|oU<-)8&U
zj6LUi?90=~xN_#lP_P&=v=x5H3yr}5%x=B=Gr>&G4!2OTiJH$WiCE6QOs?tCo=vvz
zf^hq>$S2iIu{@hEQ>hmfIlOi#f2Zg@!--JipJwip&AgiKlmSH|Xqt$Vk=pB)D(WcB
zHMd{R{3!AkAzteM8&DnT$jxl#QVprLTVEz=s7@C-ch*JJvH|440~hGwaREq$9|vJk
zM5lH%BOpEF!Ffussrs4Opg&Pp)<i*6F;g+DIPC-t7wrdZ0G%l5S#P<}lk)&LX)&}c
zdh?r*K!#Yb9zb7hb5>=w`+`qr8UPwBgflMyp-x&9HM`JqtqAPHRhkx)KN`Nz;2INd
z-r1i-r-sv+jbSm19)ix3`wJEA=kthDqJOzt)e(MH<8w<T*BYqAe0q~20)(&Ks;OHw
z03>U;mDX37&GF1KMd8fbdWBDC_N$iQqKSJN!2X$vLIyj&dQuvG?{r&t&uUN;uHP}A
zsJ96rm>{?X!3oKpi1n%F$Ur~6snVl*23(d)XTB_8xz!P;UdxBvl!eQSIb9hu!8wz!
zzvw$e$#Zy#N1Rza3UaGdd~M$z*(4j<@F(0lwhzKsTPCO&m)*h#*m9ZA3Lw%+LSS^}
zztuVqcB*Dc3}bf&$<=O|)@4!vBKAMCh^YV(djKNNbWeLSSeOQg_*YZJrTI&DtMH=E
zx+5j_N=?8jYyegv_yl8nC*hz=j{BrwU~tHU>M0;$s<TQs_JIX(Olg>}^`wJr?t=o7
zu_er>5a8?!D81{up?AJB9`{K#ZQH-#&6_5(Qwn14vkH|l{HbYz0lo5#ax*$M8p--I
z%Te<@k8!;aF<<rDCsT!Ljki$!vbbkW%bW{<>V!p~Rg#3)KR0_a4VDM`3j#E-si!BB
z6U@Tu2yi*A_CKe;%i+}&cjmRO{&nxeN7E%di_`8rZcUR3^b0fbS8BTe7^lFq8Yi8k
zr>bfVr^w8`yy>@9)%2Yb4B$_7p|@U20uf`}=}QC7#LQo;WU<k-$dBf0e46IFpf~6D
zftp?YPCHJf$$s=YqWKgTP@nmsGT%AYz*#PRaQfOy*(vS0lK5_D=Na&?7Hl4Up$2IG
z{~yr*Up|+XmhEzafuFh)Bo^Jj9Fn$d-uvxSyY3p}y~KFn5RqrLe}2?<Ky(10SWIs#
z8gBbLTfHd2R*zn-poW_V6Ch~H2Y@V&<jz?y7e~hLp~Aw&4|Bc?X`*1O?!+0qkOTcw
zS5*+`!+835R`F-O7bf_>n)&rLEeN>xiKm=iR*#KupAz6M?P_<~;+_kUk^@(R=&Ywe
zbCV5ZkYD-Xany&APo=dZtjTgxKs3{m;Y586P<;Wsv#P%5h29&F8$BHa{kI_Nz`>eP
z*mNh}Uf7>uj|?uAH+fq4=@@{0hM{NM<sCdqyMg@hv?qmW`R#Ne!3%OU&cZ#Vrxy1j
z&WK<_ugqvTPr!49#)<&3JO~*T?~5x``2{c(#CJi|RAAHk|NP1bI|=*~0d2?$C06a?
zNnyk)nV@^)@;CMDMBrqN&Umtd6z8I#;laV_vN&uH;FNewtPVEUceeIPp1m=g;RFuC
z>>1(~8%@jFe}+{+45V}Fr>~#Y*Z}WFumZG~*Zr)(?UxW6RX|48XAW`MKF0uR*wTB}
z;2d~?0Y6~wQ<}~wJ|MX%2)rI-O@RKaw~WHB6EHHS3ulc;e>o3N1!US|a#nqi%VjtX
zPttxK!oMf?{!2pU=OO&3G}TW{ID^6aX^#G50_LYV`p;>@pFZI~X3c+^qyJaU(H3rP
z>f)BQejw{XiJtdEdzC4kqTyFBC|>=-bjR%7+8CiDzIvvrz(WDua~e0PZ4sXY3>~O!
zi&PL}Y3Zs|>~SS)DmIR`0!2EO$V6(QN<6~Wr{k@^P~BydYcVRDe(hZ6H<;-@b2N1f
z^`61uPJ)YaWJb$myv6r3-DUT&O!~n`t?V4-=H<BtnkM~({`eOt*yNu6a_;<hei$*3
z(==%}k*~^a%qHFY!5>~It$Lc<7}OMMDG!onTBH2i6)#X2Se=sx9lH_0LJ@u<W7q%g
ztAQ`8>^vWeIGn!(CV=faRx1C^GoC(`MJxe6Y`2G&h8Vm$ZV~_e&HVoO?-+?MfLBwv
zIOu3bYu>Ybch`UHGenq<f@YLYUz3}o+%`=5d*b=y56_)<;AZ<N(4PYRc|-q3oqnqP
zPaFEvhW?Fm0Iu?<Q~K%Uf5N7}(9};H`Y-7DCl37y?0-f|e;=d%3_X9w@;{2@e-WsL
z{>24wYFK~T)Bl(3Dd-Z|`~<8|C+W4uL3YKjw$XL&Zkg4OGCaS8)KPr&oqZoBn(R9Z
zHE(U<;QbV@ds4r=D2d*QQfsK1BE0}kI9T^?EgcISw}#Di#M3YKWle2(=gR&l$%9{S
zV6oU|3Jbv-rMJ!YEj(BWG|%3<#W8KUH!RYA1cq`sZjB=rjGcMPn-5nIV^syP<w1>#
zN+-1+Wy9FE0w@}>+g#w|ql(+ve%qfAc|@BU3Px)8Gjrfzgp*%K2^qMeW#bU>?tK`n
zNSi&Hnmx{CP<tuj2T879Le{CqTD;AxZ2Oa7a|)4Q_G}+1Pc9DinJ@kzr_%)+Ej2)^
zP7RRwESVIUpu^9w@W-{^!Cn7^WZX1juCo?Z?u&hhlZwDPpTlMCqPE-v0#+J&mDx9Z
zxCqO|a#PsL>ygodwtd{0_c?!HuqoJFK^NAhp)HMjU-4i~HMY?elSgl!C~*TxIrflM
zm&Uxty=J`mb{4T9>==x{AokS{_Zog47}n?8hLEuOB3w}iR`D0X31c_)*IQ5oEHsP0
zXvZpt(G5gg3bZxzUL?6}woJsKW7DSS56_y{EF??Po0f>o#9ZcGpm|$^n7>GH^VW(U
z^<qT7RA9a%&hk)A)1<8|F$rQWI_aTZg-dsc9)xJncg0<4N}VpKqWTvQ_iwS^9k$9~
zTphq~ZEnUa>G#@a?WM9_Te_I{Z4Q>FGhpqOim?`i4ZA$*&2mo(x)^aq(u;;&otaBL
ztJ~bt=|?G3xmin^u^L;AD(}q`#Bbrmie_p7CzImxs2xQkEfe^Xib1OjP8b%;=cnbn
z_wi*1EKSgNxheLC@{Lxp*x#6f)s3=nL}HgZ$mzS{uS~sqA?9tNh!TOv3|DaU;pO1N
zmiG~z%gUPOjjq6(N4`DZ<eDzrFJ}6YluIZ+&O8iQuNy7YplYkdeq2@_R8~)!d0>L8
z2Rj#w;KOKPBO8utnwecDk+6o=gAqh=NrigP=YGg0myEqNYNYK^8TAjuY!D@9rqU`K
z2zDil$~jf7_e2{rUtWlj8)>$_(r;*dSw;+YpE<4+%h}C>8NOHgL4tV}!$mQplBwKi
zdKI+sP&1RZ{_(_iu9$4c4Zd=j2#Fktz(WtzkhaDl$4boOA05z^6y--&;lN>Cefkvh
zAYbu(E9H2a_4tfFNKb#(^eakYaKp2@nWYgzSW`Pz4VG|ibN<aTkxOfyNp`k|?D0;~
zb~~V8-xQes?MD4;8ofV6?j&`Yt9(rRB&DU_oXdY{psTwg*(vx6Y9#zales)dZ!E%T
zH4K5JSg-T}tRF07wSsTY+}&yS8SvY~8B?q(<{0KHtI<kK&#N=K{zGl9WDEgrXd<zs
zyK@R2VycCYYdgr%mlieG#j24*7Eq4L`hZy(iTKb&^vC!5ha#|S>wwsAw_^{}9l%ik
zeOgKH^=^pc4^5C1(fP%`Y##MYu~Vg~HJMC{tjywyLcSz`U9E!6?-9UIY`5=}3nIk~
zzwvcU*DQ7;wz+t7u+ibBk|ptwa?bIq|0<<_{Wgoi^O(WF{;aG3#O5-f$Po1`Ra{o_
z*Rm1Ph6KdQq29&?aKod9fxSH<SQ9$vk(Bh{<uubD-EaK*hq;#`-6MzP>uO9pwgv_#
zZXQqK1FzYP^=YiisPG~~65jmbF>+BXDZVSCE(@dG5ox=~1@1C-Dqe7Bq7jXhxz3mk
zYW9T${_y*iF7@_4wKcmuzGYv05v-4FtV~+e(3BF=xs7@OcK_Gy|Lf%!Vc)`D2#?H`
z*OYo)O|Y0fBafn!s=RgaNB6*I`Vt_a<ze8zi$<b9TKxhy4FwI~4I?!Id6YeK-Q9ov
z?teO+({FpX0F-tzM45*}bA4zM9{g}w$FQflK1?s%=|d4tp(CU}lr1r^EOC^cw!CI5
zqjK4g_Qh7|drls;K&o8F#=!!6P4&ZNC)n6HrU}1IhUfZZ<a#RnaA$XcW$)$>>rl{C
zbZT+^cxPsEnytPaT09rP%KSz5ez>g21>gkEiF;q=n7(B<_2Zps0?WRz6Q;$7m4JpW
z{cvX)^b|BM)2=$ip$IKi&L3i$N>ZS3=Oou>`tvIMyb3?B!nyPRA6SL{l-vWbv_DvS
zxxI(4J%0@9?_K3ST5bv8;eu@Wn?LkZox~=Mu6bhKdyb%m-ZaF{G9+3XqE4#;!DW+Y
z0ETq>H+Ke_%?BY{C&!~S{`>1ZUK^8jY8s_KM3?x@09?r8QD>IbVwUu(70WpPZPA{Z
z#w7vkPD!&l*;LcG@opD(;!s|cy$y_!!36s=dHZr?jWcDv+dksJS8=xA$8jOi`m=@f
zQ;*0_=%=xoS|+c&a!l82zAfaBR|o8kBVIk^z5VEA_mHV4^P<1Ehw){xY{3P7cx<C|
zG56r)H(#QNiStp(wn+n4Ch^FZ)}*GPDbv7faHf`}U*lHEApXqK@tj>G4mt`QNpvFS
zaEM=!r;UYu<I%I|xX7+Y*`{K-dr&RuzD`uDzzSKif+(3@rl$bo^Hq>k0du-Wl#81L
z&SZa4ySDX}o1H<1ozL5*5l1_n=du;If?eOJ_kd$BJ?t-8dU9|sJ8<t6VhHmP%-*-o
z%_0RYIrvi41D^5U1|#NdSHiQp;#hdH#jrl0jmf4trTVSXTpwakhMJ4FCJ;iLAZAHL
zlUcd4!e)VZH0c~F9DR3g!M{r5d!8x8lcI51Q8XnU)z%<ovUXp->xP(PqV@U2;@%#G
zdMZn^c1lerd!H;a33-F-199K@cj?Y)B%b>$9fz*zQQz#CQgbnH+Z{jF)Az%>ub*GQ
zQPS<p?wp#r22T<2aqi6tK{huHy?2*tCp7m)-bOyju$DgI_lHX&ed!Yg&E;_6_g48|
ziIsQP3SJaj6-bXqgEo^Bhvgov@?-TFXm3GX9A)Yl9i@~cWQE!ph4rA4VmX$VwF=dd
zMea>&Uj3hXz~rn=#Rp3RCEdpE$=*v<%F)QKIG%~2!WCk$C`|NZVVwl*(ugXwr$t2}
zyTIBSIjXV>OlgJ491XSaU;Hu45b<ERKT?g4QxX?0D*K4=L9`OpIprZHBT6Yl{?^`0
zb9OxEbHrG*I-f2ixu>Uj8+!{)A*;vp2p4un<DTckZg%T!37fu8b9N!nDZ=GFR^)S!
zY*<2Qc0_Naxd*;&x@>D$NVE!v+!rfgR%g?$7<fdI>(9Knn5cl~sKeUK4DID)YS{Pg
z5*lmfa(<owk}8j}5V7g~wkW<Z=n?d$Fr!RS0~G*j&8r@F6&mA7vGW1B`@-B$B1s0v
z2M*t>Tv<fgPkRsvtonH3aYrVkGYNu;)Hiv9HmZ(c>>6vgiC*Z_%kC{*e@J5Eu1f&R
zKr;pIdlA4yXSNZiVH|G?gjM?R9%p|XO9A-%(8rbX;x`)0<|$X?4UQ9X7nO4zaWpSU
zZqjJ^(pp1~KR&s}z(Ae&;m)lpHKEJ4NFODJD<VB+cW9gx@6dEb_n1{I-}{zU(+w+g
z&hP9!_eP|r%R&G7tZSN^tH-*{#HZ0&(h_loiaOz(FYcX~YE@I=NYVDiw+wX%AESE4
z4KE?-IO7suy)1*q!R0dHjg8f4jIO7)p1~MwfpdrOGW#ufT$(avulo7P#&$!Ih%u=v
z{i8fg!=fz{tGrnk7K>H0gjRV*ZP9%jVXu*t=+$=Srsjhba#MY;qoD*1I&$fQcWw$}
z7Ebag!ntIqlVm93LKNDYVv(=C&2<i2-Jz57{h*vzBqUL*HWZQg@Y`F<>5*vRM=u7B
z`sRin2(p3M>;f3BKcBr3rwvfTOVAJJJL+t1bgqMB;ue#%8n`1l>p8h4o)hMqG52%O
z<0~r6Tx25AQqq`0ipe%GGmcC$CAW+@$Yi}e-zYTe2lLC^oO&q{!=9nrnTqgZCQnp=
zlj}rlD-0K;7+OynCtESvO;s+jF~<0Tq)bNIQ0`Kig@x(f$~{b+8Kkl2(`OzE(F4-7
z8E?FkW*bXQyf~15u50(Q8fTYK`>(r8H@gG;PsCP&58u5<ER8>mUcVGg0E?w>NNO>@
zLetfyw)g_jxa;$*&Bhq1ueZJ%xrHn~V1v-DuSYOBb829JGiKr8jiQCEb7n{yQ6wgc
z+pRp7uN&FL;DM71>*(;y=E2bLa|3HElF+(NLqhSQyOIZ`6ZVACyW?sbFhI@9c)!wS
zoC_}9GSL}<zhP(e%kvB$-mHt1U6zTUv|g#xF7uQM)&$uOfss$dh1!++AtxlyM{IXQ
z4g#PXh=no^tEX@`by=&0!O7fq;T)UR&*H}}dtW}U#x~Gd?+gIu4BhiIbA)m2PPV_%
zp4q|c#iK!GEnHZ|lx75M0>wWRiom#dS?f0la7;G@2fu6&Mqn{$AVC@V<pF}2i>V>v
zUqhq6F32o~^F>G0Cpvl5(HCWn&D2}z(9LIAl&VALG-~TZ-rjI~<!db@tJ&95CYing
z8lTj}D+|iMn;C;7P0pGvInJu=5O;`??7sXdqC4-g%iFw9Y6@_eSdW0Ti;K+eEA+^f
zqPY#!2<aU&<(<kc-+W7}#8_=K^|DXtdnUxURLXk_yWPi2jnX+0?N*I#{%-m^t$A*}
zuD@H1Co*qvB`Z$X49XVAsqkWohkyAJMQGOxVMtj8i8@E$Qcfaf?Bj~Y^#vvbW6?|3
ze@`wk4X-J2UIdHg*N6Dmb8<{Kx!Zz{9-8Z|0XbD4EUK$}^Vamct;xR$8|mN3sWSs|
z5Y?xFyt{78(&PAY@ZS0A08Oe-$~%l*g567%x`qBdD^GSX*jx1s&`u<2#nR-xU}Beb
zQjRQ+un`Yi2F*II7{mADrdOrBN!AziUvT%Wmu-`7jW}etO>b8rQH!D}<z&)w4dI<A
z%}8BVtqO@MSKG&%v6o)vh=z5!9T5AE-wRj5tz(3qxVxi)m*9<>udo*@Hbr$UPk;T>
zK8OmhdQPMUPqqrO<Z6+@A;n0Yirq!sN&WrC+})8z<OaD~dyN<$+3|{gTdOrD2WYR<
zFm7(pl?MfU+liv?0w=I*>}6lo;P{(VkjdnEal2Hgv@ro}(;r>%<gr$9T4?n2rO#%s
zs9%0474VB$1!YcX;9$#!)&+jvqRxO{l&Xknwief^(tSK2FGR76@KI`F<KWbPT3Bc^
zX__6M9m*A_oP=ha)(l%WqZer(Mi)tEVqW0&x42@9jvINp^-})DD0F(0DE}s7qX?>%
zI*<Z^9L0r7tM&{1K>m|dU4lKG;VRSV>N}yMKGjv$J1o0MpIpZsbF~<yy1br&mC|aE
zf3UY|*l`OuH~{w^q0PQWV~n8$bmZJYnOGgIJgR)EC0g=}Jpx;C5vU9Z9b;bFe*LwF
zx^A*KODylk_YFq0y2asW`|iwn(VSc|aL*=(dN5z>Rz-y5d&RUck@Pi_^3dD`%-igv
zm3S_DbqAgcM(kYM`ENKD_bK$<$Ct|_;?N3HUB^??2y9_@F>>gE$7denE440TJC{ED
z<iTx>kIN2n$2I)=u5NB1z2g_-IV7GNfuwkdB-cn@?_bL=yR5?O;wqyks5JsF3#vdL
z;K@EMlj-V(q`s|sBpuh|W+wx4R~lad)e%{lxsY7%o>!vC1?e;Qr<p@BG}6ipPB7)@
zQFQU(;cSk66Nc!^J}s_dzwNE#Qd@2D!CIQ&z*6@Ec~m#YqG&B3qFo{vj&kTmGvWYM
z02B`(#pk}=Ht6f$R`t~}t@)ee1bu;A9Nm{>@bdIGpTi?k(Mf|1=q5Zqkt>RQ=7d4F
z`MqLhjyBm%hU>-3NqG~%t2~sZwtdo=5S@DBg&|A6xsC*n2REOo4I7=)U2!qvE1To?
zzcaK|?Ig6apRpRu?&t!;eBqKP=-7%uhE&Vu>XD6S4QWXmfsww}Lsz&Lr^LjtjaQAL
zksxdQ8h)#<T+bkAPT?s>9zP?MaYwQ23S-`Z0mMRn=T2RHkn5u^jL+lBW=}lFV;{)N
z7zQ|%R0nCF6Ppr65~9)k<XhM%J*%{rF6dhnJGhHnnohK|l!m4v#w|#}n3AS_XP%D_
z2qko-_QtNy7bB!Xu~s*3^j#47E@msukRzk~LoQ;+Eb=J6*YVkHudz$ZJNmHLNo!Tj
zN5Xm=_bez+p@=x=WpI5mpFgyay2cGI)*it3aFSmr_mFQ<TVeeYC37Divi#Gf4<mM8
z;fgS?@#e>ML<$w6nI+ZeA+$0DIn5~uiCeCumr^o57BGtE0!h_4nmk{O_HTIYxHIZs
zy1m$F`uIc&Ok28M&Ek!HubH!~I=a`&_;$L{U7=-o@O9SKdQ#DR@$?tyhb)j4vqp~=
znrmYn&%?+eR?xnon_u*vch+{cb_#v)VjI(-H%$&to7*Ndt0Y5~=8q)LX_08G2GY2D
zvw;?(k;5AY&}cI&WP9wYd(zk@{S9CnAb$PfY9!f{47&LseAqfItn6)msVKTZ4WFS2
z&fm~~1+IxFNF?cTmGQX)5U;G^D^?-gx7h}1VZ_;7e&9tgQfvNmrP7pG`J)PqNB)%$
zFmHn{%=DF_0>DJfXI7C41HeJCz)o0n$h;wBgfyD0Q^>&kPMXHDk3@eratQW1>4GcL
z=MgXC`^i<S2+@X+J(wLY5G(aodtX(LalWcsdi?boNapJUz#mpjTI_~QGxDf;M;@+^
z8X<Z$!}wo41h>0w!eJf#Yn&Un!%;AVDd$e>JtD!9OJLhCrF*{>hapzUm^sKyf-A*9
zSOd`Z&?mP_-|j?N<%Ai%qhE~vCS+WUlDkBEtGyU?PjeEe!<d>%=s%fcXvtzLpstNO
zvKzPKI{!j!BW1wYgkh!pN`Mlahto<<u&0sYxC`}~x#ql3X!W6_WkK0D-Se-JHZ>q$
zu5KIIfxw0}6835P#D}B~L&R}^#grn(CQeDqzW(SU-8^T9hkFv!^Zw2rG-!5p7^<~e
zHiwaXC|zSYU{!4QRaeb#JS=?a%mGu&mP1UO$Z3#u?VU2|vBy&TwQB^!q!ncMYh{|5
zi^VqNyNzUzKGwmAvd4^>gRq*Y4|5$4Cz~3JbA74?9@v*kaI|5P>FM=N13f|CKF%T1
zY_o57r9yz1@n*%t>)*XDJ}ktqhaPX2Fk0cm5@=z|72wFwsPQIc+RyjGdL~)moltA>
zp?4PHV&WbOwNm+O_@-e^nk)8ZeEhFSlN3mQ$0^4P*~rby8!``rpO!I##MS?diqXz7
z%LC2)r(sQNm4IGm!-B4T^SIGY?JFRdkuq;E$uEGx6=R>YPWpWw0?DvkdEF_eFZ#|+
ztf+~<U<}|cWptKSkGTOX=Q>WjGl=Kee!X>{oHl=1CkT6x1dEsTsq|U-#2y{V5|9hB
zMz@3_;7oD$kB8+^KvlW+&#H1HxW=|W+3I70xu(>L=iBe*Y(t_A*up6j%!dVs<UxmV
zh@BJ|ro#ym{8*}t8bB&}7ItQCTDwxtwn`Pl92w#|9+Ktrq$4W;PI(?z;D~Pp&1H|3
z(mNTk{-%}?Pv;D9belIbM(HJ%G3oi=S=jBolb<OY>XZAH_H?mxAIfO&dFD4zmvx4V
zWgCj{lC<`HiUxPq=R5Am`nK*xfzY>Q@|z`d2&Xk$FsaYi-NO6F{{$<?!mIF28GEHN
zvFtyv$~Wzk5Gto#s7>uxMwdxi>sq~J1=3p1(!JS}!4`1)-h4*1;FGx}{mrB92Tb%d
z6^ZU%R)9@0KZ&j2@LC(wIyJelaANxIIP|YPxOZt-5&t{o-_KRQQ{;Z}2>hvHg`qh2
zKrNmoW$k{jZtJfv_;sYuzcREQ_MK+1&jk?6driC=KlMdPd9Bie%$Vy04$Fs`Ej{-9
z`ETjF3cB;=;+jDwZ_Lok_aup;X`?`G-pVT+*^YV)R#8CmL^JM58)zbRWxydZb|P|7
zTPLR4vm-xjUP&lTqo`n6%Ap@}!F8g;L@2arw2Q>W84u0J>)3Ya`(Qn>Z8>i5Sv2v(
zME*ibK1aK!Ab-wCUgZ)krQHosrb|)}5MhHx-eU=^WZ*p7gK)ic=`5-Cf&*>y0F^YN
zY5#uuj1&<lAIG%NTqB|06`Eiqm$|MNcBz0o1s9e=zWvPwn;ic)m9a{%^S9MgvBlY?
zm%ua3T;P(2gIPBCFHc08E=7F7IJ41oL38=PGSkBD%~!AO$czQ9M(DEc5WbLj-o?@L
zmg35v)`c;KwsYW-Z`+Q#Z905}R<C_@&30sUg9HMra=kYouM_ioyz_N-xf3PrW#q!&
zxf=b1X`Tw+rQq1g%xF<imnsY51Y*oN?S4pvzJtsgbQyB!Axl4<vqD7!fAh(ap&$1-
z2`H$t!)N2kxc}S~<#5>Z5#<ys&JnmvP{rU(xCb_yZ&I(`A9!PiQ`@l;P-7tM)Z1{@
z)x>_hPOjV0r`?7XPsQqGHT(@|S-tV%Q5bMV@``iCDmZv?)jo%#utCPG$;Y4<HFHds
z_pKP02*qQOdRx29WfaaNwl(jK&9BQe`!Ny~F0KdJKH+<3e(geZ!=0Knat^mo&5n~&
zg@=z!6i7u5S2sIJK{w;Nk`j_K2c?9MpVr1VT(!L-*y~dpBH$eV5G2)-X{G|ZAy(mq
zxMyE{)Jb<mdGmVrI38Dv697sU=yc4n$OazLAsOh?b}S}Kwq5BhyllIx&DG!6R5P>i
zv+j{|Zv{60D?W^VcvZmQyWm4Ap5Tl5ON}61tI|+}=whx|nLKwwDvhI1Pq7z1%Wzb<
z<janGus?EKuU7=z-iopAJF6Iy-l#K^G0S{DjqrK27n+UF$R!G79v>OjXE3QZ8;O?g
z<zkFFM5k9u-A*phNqx46EP^axio-6;pPC6M?9@z<nLf{G$Y0w{QBV9_RI`oxO552B
zS&ki$vl_xPTL<1kUjphX_RgrNO4krH+k9uIOk%qflK)0sIhv3nxKhZ^^s}Gra~5}n
zg5#u3uR}iE++Dx&Ll0d4bzlgL4j=aEnvCC9Fv8FB`;%brh!xmi7Xbr_)RPC<DuS*^
z?N}8nscJ6->YjXQe$o6KS=_)cIp97Ni)657F9L6F$FR9ky(U?#Vq!ES;R51WSRHL5
zbYU>ci$yQzc@j)GKx!^ufRJ$)A(jL^_u5^HryJ1I4S@!7kp@+~sXn6kg7=M=yE?3U
zA$n=fSwlf5!HZj4+OPwn?rBme_3|=OEtaQ4Vx<d2Ab#hCis*d&{=v$;f7A*d6!xZ>
z*{}6*<vG-jt@zY+q$@8I`EH2`3pe=-wCB&qCWj)7)HO4?fl;+*-ydfSp-+|rvjRY&
z%b5TsS;z&ZCzJ;rAvg-@Q(jZA=hg%>m$|5nGkwOIS;B1ZiJr!5Y-J{onN>zL+oLfH
z<j%dr>g`!3fv+GCFNtBJE_6$jB&3c|@;>=jsrD!gEfmf@7`}l`mpxH4%MyPvwDImJ
z)|VOzxXo&34o1hseiYWeZKPXT+9cs-wx^YKtq|0|vO^Kg<ww>a<{U3rUf;bWlY|Nw
z_KyX7x|hs2?98l+?#=`sSLKV@z-z*R7?md!@#|HNa`tE6pO|Z{#DBDM2cs+Pg%6XJ
zHPy<ji60T6(IL@$o}eIlFJB<v@g{2(!kO_o3E}kt7yRqHsJBr5jw{2TUEc(uv)I_B
zT}tuesvo?zxutE|HP@z`wN75?Iq`Ykd2<S>hc^|*Pg=hb#f12kIi8FCoFjf{4;-=t
z(w<L!+_%i;9M1_TYYf+5PGp{iCkKc*#tR8o0(5mLNNM~Kr4EO`9g&dDA8qc|4BH(J
zf#xwGnvSgbKJx_!A^Rb77~#*$E9#`A?SqG`EvtLmF+lVvOWjsrpgD=bxZeM6=9~V7
z+=El#XB(G$5GWXm_;?i&ajK=%zBY+36?D5mXuZ=+G}5}98qc1&>*=F$V!tnGC*H)$
zPlbzS7`-ammmpg8&Iar6H8)1%Yb>z||IpN~-!)a`pPJg&`ohRy($u3Sz;HLit2>JM
zSeL$=+G;_YL}<ZKIyHpIPIM;dCEoCAy-59NKr9OVm8W1n*0X&!B$+{u<h2&B9h6p#
zJTCZch|&?)%=(Ug@Xn4$`px)M_L}ZgjhddzyWgV9ILP8}+&Uee9Q>Q%Ni)0ix8DFR
ziA5?DVXp{c|HzS$T)dZ>WyiMCiHfPFrcnz`@Nh8<Y`)7!W}7%Lc$#x^dYd<w;RlCM
zud|iQXq9o4Q+<A3PnR^{JroVZh@!b660v`#9g%x;xi$V)s}URWF>HNZsK#nC1S402
zwst}bl9lWO>UB)Eh)x{C2o-7klXBR2OP=?&-RWkl52(y@e0FVEl=Ea;uHR~W#${{d
z-pPgl>E5QgZGOn9!q3kJJdpidhSn{?!+pNdJZ=XhD+rtnwM_7UcCzsJ>>u9f?musI
zv>pxlJhk<U1m4=P{^I4b@iaimOiA8Org^Y($y}#64RZ0H%!AwRH!tkA2x~BsQ*_+!
zQ7@O-y7H!MrEJ#8ClzG@5{`q+Yeo`>b=sA%?s^(kST?T&d|ie^>~3}21#xxTvlXF2
zPAsSIjRN{#$^<54ng?nh5oRt{9@iH%?)P#^=7wD<WXV|MI=HM-J0%^Lvx2c+-RN`G
z+j=^Hbrl~nmr|1QYOX1#;{scad;pntCXHK@Sbqu06_a|EN_#q&EAe;MSd9&K3RlCF
zHL+-yfY&5T+l-AWzfkHTe5|bf!(CToga<#W6i=s@Dfesf0l6Z0M1F{~cyZp`gX4wk
z@6u%S{oWZcFwZB;fP&?YHyGmu{+pLAOUf92(6`+B0FO1@d|>baa6NbjTqju?J^)c1
zL#`L~j@Wc}&f7G+hZ=V}{70}+Xw+KReCSEH>>Wavn1lhjeX+iV9<z7mC)mz_^l}<?
zHQ`Ngvi>6xCbC>-aYzAwLwlDujeck-;@)FLkTC1ocR}YY!L1jT;Q*j$D#;ZKR7S-;
zk)y<DCqkKvoBatSi4)>5w0`m$e(yHC{X0330n91$*ah~BTB{MmEF=q0i=ury?Bm(&
zJI7DqvRA5E06IWO7kaRA&&5`Wuck}ZL!n}rHv95Q1?7jN_wIgu{OGsYvI&GM$jdH5
z%w0vyEA1fPnwEip+QCyjo!}|hcxQ)vRIs-Dq8yfmH~;w;zuf{%qikGcQ~rnrLq~@G
z2)qKoQ7+OscZ+a~TD=(@1q*A{{A=pLRtqV#u)3UFF+*VN`Qqd6H_q~Lha?K92I<C|
z62OMRh?OrMwyFXH&s`<t2X2T({lam+NsNWJ<$9{Wl#P!&Q))1Odb|<HB<TqRh|r_N
z%!gIggfa=Kvm05Up7DbiemHC$Z$5RRV3flcP9prdxN_~iX4rr`XXJwRd6zP7byIaC
zhHUemxVO5&@3*?+j7588FAtg^mwOg7RV#;_eIGB=Av%>9tYWeOCrzBrXWn(N675U3
z)6f{wY0*7pcLz}XQ|~(ED=ZzCOjwKf(%F;um}lVY=XL%*4#0fK6Tm**)ilw#@crR-
zpT`$p8vv1~-<pkPtCg}uR(S)Utt%sIBsZ^=W#|9)?blLl%snmu(3U+Fc~xFLPV=TV
zPMZ~j)pJIP4Z6KOy5N%^Gv^VH3}}fVE41w)Lx|fZ6639Tk;4m?oNUr~r54e*XY(DU
z<fL6JlO2C0uoJr6w%mA;Dy1Qp8SRIxDwv$SgLq$97Q^r^6C;eOP^KyC=Vqd}G}}$D
z$S^)OE5H@cDDfTlFr{gr3Y*bI{+SYeS9r%tIm$x-#PlC_rt|yGBshY^2>cSr6=FYf
zrzFsN7aa<nW9SWE=_#AMhKMV!;g=i?%5Q(~rYb48vXiliFTQ*Z*%Dsh=%+(b7NTg&
z<bybQdN`$sE@IY}R-*jfTBZ^jd&5XU0ss`&y<?zPv8eB0_D7wN>vjeyk!C~Ypw=V{
zU<z!;{VInBK7*3Pyoji}28;oX?7wYG#yv&dq0)jbR$OIT3T&LStK=?N6l3T@c1tYf
zoG_=zw!fE>YR`x8+>VTph7{zj%t@6v3X2NmT$9g9-fTLG+fMf1Xe;qtwIT153bd?I
zb38f*l$e)ede0Z4@O{**f&Yk`AEO%!Ap^7C)(={6wbVA|!z^XphmTU;=UY<2i`m?W
z5$GJ0=I!ry38K<b#52|;TM#PB0rZ#r`akqnDr2#rsJlsGU?OdxXAMO@_1VEQoZavE
z4Yl<z$%h=Q{sQKA111B~d)wb*hOYQk;8faqayO(i#GKnY)u%;$*RTgg#|xDU-t@u+
zdO+<hlJHJV*Qsr0(KpF5?z`McMQ-5T_7bX&+f~-mfEaE+_Z28vYk#>xO-@oexLKSn
znjXu7u8Pkli`^+K|LSce()6}|N`K9C*@pneH9vIuyNz4C*FtvmzX8@dbv4(gIlqyb
z1_nlaT3)^c_3%FF*>h&5>e5A8c`XRn<`GV0DWO3kaU}vo^0!}>uu7Vy-SR-{({#xd
z#7sALf!eh6@KhE>45XbibVd9!aESchvu_bBY>X=@o)q*O;?FZ=OBDeN5!k!6Ao98G
zG8_ijK0`fft|={<rQUR{$M+bZktWO#H+l5DYo|V6hJ%iItK<+4(ZVR4A0kHky94G7
z&R)gP@{roW-o&OTbQtB=0SV^JFzd|-k9;he)6;1BbBU&bmPtE>Jg6EVXQ2M=`veYV
z2Ip_zJH;R^WMI+8{KlMzLm{?Yjj0|CfD;}#b;2d@Pd%`)^c3Bi$Dyf>7$vrsRoCNA
znJz)>GFIr_MpDLeqk@LCdASDY#)9nUg>o{|(g8%PuV4_M%&F6#1^9%VC+;y+h@PJo
zb51HczNO$H>MWzU&Qb7Y8B|i>bD}Pe4u=F=ygcEHzg}+_=pnAd&o}{gd)xjrrc3>J
zWOy45b0<qF1JZHcBa29RLdoaRT(?(28vYvW)9(B0))O**5@`ln+#F_~G}4v6TlaI-
zy7YR;0!W|*0#JHCA~O1l_#G8v-t-U!U$=sGVWt%k<}N0u7QsFhcgnSUny&~ylN$JI
zT*gb&<>h~OGsin^g}=F}fWh8%nJFIvo1X=vJ&d`6*IFS>9fo^|FZ~l67E60g8m7_)
z_K?z4BLlx6*yVf((30RqXhH@7885o6E;ddW?>7#pLR(bBc1>fU{G=c56NZlMJQa3n
z&W_h!h3he8IR!P0yEYVvWe@fMJ|Rto!CRH7Y(Zawm3-PC;YB<cmCE=W&HwIG6)kM;
z<um;M06)UX{{cTT%Q@mE^En6A84O+<cTeUuYi2*E&7z$80JO$P#3%WIOp<~46kg9+
zdXPIfqp41f>H*^1=Mq<HuayrWEF!bex<ve;r#@NU#dEU=(aT&sx^hVaDDLB_1SZBy
zUp!37(3qpLj%jdom2hESAN?g3`L>N<{!xXu4({CLq|-dV&{Iy$H9y4+Pw|3bI;$aG
zW8;O0Mo^M91gBD&iMNzWh$2_9Nztm|wR(zY=Go!7`<BjnvMt2zF}mn3mRWgxy%UTu
zx(CFB0XrVjSHI7jG8=yL#iLU!QgxlfY#fXT|D-g$8{w6YX%q((cKx1(!0i&Q<>dR$
z$vg!OjeK$1;)R&gnD&+n>qh&;r%B{xc^&X+c<jTBjT;*p`nK`u(tw?>93O8iUu1;v
z$%Yv`Z^1ItI*oH@LEHD5FfFZ!R7E~yx^jh@n9!gtPRIYWir$P00gjh+QshWS=&~@7
zPw158h+@B-t+AfeIq+pxRwydks%OvD^76WyqjAx6>H?ySTq9@bH}E0=Kz4~~XxO8H
zE*bC5Y12v9EsJA9k;eUZVdTzR>J8s-C6(iOarZf}X&vBl<05MFeU!U7B3{K6dre1O
zN=TsG;nr5Ct{;*EKj^$+nowT<ZU3V*vMQND9bX1bG_uFo5GrOAC*Zfl(uHY`nYKw@
zJ}vfdPQ8Mr;i*7LrPQV45!-7?Ii8xANl6nG_&gr6czjs`LVyl1x`b7osBw6p7J13<
z9VGMM9MveY@#M+o4wWqLynC#3o3odvzXF~^?Q}acx+vScssS4Srq7UY^cq?Uu4#eW
z^fV->djKJ0nd12R;Gf4^FUZlh2ei72wlAygGL6kn^FeXPOs#`X-%X9PX%fFq1l+g;
ztvtv~D--WIvq){d*`t@`O4lf@S0m=h4&mORnMzxpDvTCppfOfCk{jKZ6@GWKDNkgC
z1q=ORu62t;$weD?NCyTHZq=cJo*67R0#Zox7sy-&VEj+BMD|+u{G*R?!{+u`(nklQ
z;I3eV26=1zIJzjO@n(fnw)q=>q)MpO{*{W`d+kRWv@I@yx}b#<KAJ9>13s|e{;@hH
zKudbsnVCF!V7Aq5t5ZyTv-7gN>4-dTNLt#$MMf<R8L(6P#cjHB(L-pn{_u8&Y$2$t
zcHk5FBdi>03RG6Eg{SKm06UW>4jk9UY#@oQvbOI>dnbwl2GA6b)Db(B2GMZDE-Wso
z%Y#DcX=IgaG#b7uFP}bwNA^Gn7JDNUk;4~;P`N|NwQ7?DatB)Msxt}cD0N7ZPgCL)
z@+u{&roF&V_*#NMStzD@SZkX}BCb#=QP3|<`XrA@X{Sat=^^igwn_7*1?c1;4>3Ln
zkq{4LluJ8!L)X)lga7R6G%?v=!iUzV>Ol)DJ3M*A73a;Y;OepcBb;M_nU;x|Z>!Ie
z3$(z~nHDJO37+rcNLgh!Gnl09@@ztOJAjQ(P9krW>(&v&@Pdz9Ug17@+%n0Jd2n3q
zTo<grzj0biJ)CknQH9{PSp{A%UJ;BJk;w7OJV!l$E4vsicASIMxw@d02t{!Z2k%@K
zl{P+DTCTi50?a${6PxNxY;f(Bd$dk4(3pcT^RTjpX$i5Dl8UzG-Krt;qr=f?V1jFR
z<@D7rifuN3Q>}tudfk342V2Yt&TTZ(Vixact#0<mWZ8*q#2|}RB`H%?yH_4G-+Yx}
z-LvGB%RGpE=LE7(o3I)Jxft>e%B^;aJtqV}Lr{?TPFAI)Hb=m2maOI)X2hFLa&Il8
z^+hqpHX5xVqa}5WiKk(gInbUDGGWy1W9_?PZua@}w0B|d!BIpQ;xtw7B9p}ah<%=T
zd5V%gnPZW}M;>iWk>%{7*Rm0R0!I`#oOnZ(G_c(`ZRTSQ*=b4H{d+ZY?=On&Z+P%C
zJ_j0;ZeM>F>!*M&+Kbn~Ppz%XoBMFbCTV>xHeCZ=7~vcbB1?uceTiCh4I+iJbAeYy
zxjEG70O5`997CC$8}odo9L$YP4`wT{-4>cAx|M&Ee$Jq|f3@?Q{;;|r$Mj3QIGw9{
z3vf=zMdRX(74n<ZQ}^DiIPFSSAq2Nets|&AGG&X^sc5eBaruXM?Nl~)sk@*IJkvOb
z-cLM}H8NLh+V{sTT5d|>x`tE^e_K(U2uH)J%&}F7qWI&CVjKL(U3YHroNo5mg^0yb
zJ-`W$GR}e~IS02^7Ne`2YaQ!_e5W07NA0>MyUDov(OGR)TsY!m`?3FWKyQHxa0icJ
zb+=8Not00f;$Q2IbQvKXXM~;J3?9#t!Xxyd?YTHVMUa$duna8e0L>X^n}VXC-Xya%
zF;N-!Z}rGOLQhDWsdNq8PjB2r4GaREhoEE%8h!M8vhSi$GmAg+LD?<9B&RG=5?qqr
zAxZh{!!VErqtO|f36wO|5>rz`VAtf>^ULg@zxOBtDY2|Zs8;eh3*;WbaMz+8n$dn|
zbS9Pw`QS9M$0Y&51iCr1YV<>X?^7fSn$4lpZ(Wf@x_bETz2u{h$9>CDDTyX;U?N)_
z;31u1f!}L#0bDH+T3MrkYRW@dhQ$vRc7C9vlc@D2W@vr=3zP_K9CV=H42dSf?PV<^
z+Y>+}?nY)PwHYmD>>%LdB7^rL!3jASIeXx3_vxqY30JThcwcv(dRAh9lEQ{mu++Gw
z_{MFAHzw_MPIfXp{O|N^mvaSY^EO(_yyIKcfVywAfmS9rZ#~c`%~j6ftXdLp<-e2{
z2^O^N@0_#nJ>DG!3aGx;zUxu!*&OOpm|vTM=d-0@@56|Cjti9I>AK=r`A%zRCf-w?
zun_D_2;Mx%cYUl1@lu(Ur;m4ui_jIAE2C|g@iMLw4Sc;fzkIzxBU{R_KKNj34&ln!
zVN;LAaj#D_RE*`|CfeI4`(+QhG%`8jAhwOTlOw=1^z%(A2JNM&$}(bsckJ=91g=$8
z$4-u3!5BXBeNybsY3k2ydgQmV2uv30%C>l|b8a*q?|oU{?&0Oi?(WZ=Y&)#0ptbGG
zELwq2i~}9upoxcOk4*gG!m#X}pzS~m^qUup-@)8AE-KACIA~OK%Et=ixy?7Fk;SPN
z_j=!dN%OER1`Anwm#pRzh>DJ0Er-@O3QV;)0Ar`0gf!v`gV0Ca$NdxA*zV1IET8!N
zqR(~_q`Qq()qO{Yu`8b^elC5ev+fCr?}=&J*IswY{&uP0<_XMB+-C4>$i}i;-?SSV
zu4wiqXX0aj=AvRyL?o;4uRASE!fW{d?e@N71neMR22foqyL8$rl>MvbFsya(B5yZR
zFPxUu<B$nxKfSO$ld&){Vf;r6s`$`j(X{BoV)Ss-bYF~_{fJH;+4Pr#Nav-x=HI9X
zPxg*aWX(;ErGo=HNOL3)@1vH;aUnY<#4Hv|Zmo?R^f8vx${OA->z*m<9?*gbjuxk0
z**KPbJ)nUj4~Q(~Ccma?_$s2Ny#s=)(C>I);~nHQ8bM38(GVFFE1~Cp+c6X-jN3IY
zGWsMLi5n)Tg*?)f63aoz7dTEe<%f|ekhEeWiI>G!dyZ*;s}d0FHWM%tCzX<$+FF|s
zK|MdMlWeT6vAE>7csNvadGKaSCS5;GAnh_y0QfDMhog;~;Ke3(W3zl3LBH7qIp_}D
z*X>e}+-yVlS=wGY+4kyBY10Y7aGBrUH{Z#pr>($@xbW<=`fR-yusGh^L5+%AFn@Kk
z+ec{x<oj?EJgupJ$Oo-Gs2{Qs?A;iFhb(ReZn&4ds57=*5+jP@YhEry=vD++Gu$H^
z{<OHgFBXhw2r415w;g7X$mxJfwlDg3KV;Xg#Jr3Ts`Z)YGSiA^SJ-vmI$&bO`S{+B
zTy+UJUL9n8iXnf!m)!0kF=;NI@)s9CJUh`ix;_QE^9Cjw)FIki`YLQxBWOh%nA(Q;
zd%E2}ju?fOli2&yL)hKk9k;aa`vc?6%0{|w6eou+xV>xrWrh>Tcv-W64PtW+x2MyS
z<tiawL9F7nId${6yrW(hoEJlRe{q7s;piKFlbjRKZ(}?-tEc2A+k6ehi%0H~P0&1^
z8FbOFsbTKlY2gbI@VMWk5XWL!5{ghO=g4NT1ukPxaJ<1HgP=p<RpIk5n$D@j$N+^X
zpr2M&Q(B$J{YY-J<5(G4&<z0oIOJS4$u#399p;AaAszIFop@*Pr@ko|95*`}{g5{c
z3-vSUpRZZ$qp@XaENOIIxmUG1`w;xFqN(WPuCcLSQ)Cb#m@~U+Q!pXUh(1NqF0O{r
z+&*6-$7^p&9DC(7O*nwItBl0pl@q=yhONg+M(`@v8UCIqdQMnzTo7E)cqn;te{~vg
zCaWGm*D-+fG`bDsnRkuQZ?WPVL@fhf9(4Z^Fhs>AKPeB8g);fEKiaIB{#J_SpKWC6
zDl+*TfLUBX*q7NbmZh}l(TrXLic6p>0vKi&iXwI4&^K8)W<EJyQI>h-P1L}AKB&uh
z`jP3;R>g@uYDdV<kr0N8G}Z-ms+aGtwqr72Q6ZlNBa>Xz0_T&u;ZASYTa9+D+D}&D
z_Qd<`Xvww$lf2eS%i<S!@6FX`(3wXpEy7`lfEnuBns6@TMJMyd)$;9@*X_H;ZPsRW
z0+Yv@)j4(0g^9K@lJ~Zz@n~NHbmZVs-(w$l|J96{N#dxQ_kA>zq74B!qDPI4yqL5Z
z)Luiw%De-n-FYls+HLmAL@R~#ick->4eh__>^t4M9P8o;onS6s^i9|2BoE(giZx*m
zPVsj1RooG6KO6>$HDHGzvZl-r<{JL{$o6bF?~9WY*X@!}I|A4f>ECW5ao{R@tF$bv
ze(L;T!lXvG8lq9R@Zn&OwRron4g7-TLSk85A>Lbw=SRiV#NKp!({Cw!o%w8y#(HjX
z3LWO`WT+?NrPZc|y)T*Bo3_NU9`-=h)q_z;7!tSLPoHA)v2Nw*R<)#=HuC{B?(N5!
z*o+2b`wkKoMSi^V?Zhm2*`rcPyr^kzX0eQe#Sc2*^nVz8&$uM}_7AviWokpSoRyW9
zrI~xuQY*{RkaAXL?iC6yAhWVC<uXglMQUl~z`ang49$TvH;7_FE)Y==5qQq-`~QEQ
z7x#7jpZoLSh5E*ip1<F5eAjWDuiL}w$78mbUNP720xNT^cNST{G0Fm4QOYWBu*YRY
zoTa3RpoBip+gpg3tE%RiicV7l`)`SG%Zsdvd`A1^(zkTZ5yvfE$Gz<S!h`u{A(4)?
zFBtP?ZnOH$T|w343$W<{H}tg2<kvLLr_m54@W!n?C~$wa|A5JQq2hHkEZ$nUtt|U2
zd;6DfsEIbma_favqitU(!BzWZQ|0mqQ|KEAJ$Of`n{hqBRB2P%$Ou28w`gU?E_yMU
z<lH8#Kdx`lW`g;lYMcQ+#gHp8-qA4`&Tn^fr0_<8BQ#~b9<081?pJ?RM1R28Vv85(
zFAJy<QtzSY*5q0UQM+L>aWOYO_gxoU#EDhCsx*l6)YS-dYtLR8eAUYS33fBixEfcb
z<U&WkL!5wrhlqYp2VI(AGndGv@EKjqF_6eOF}FiiUw9Q8c~dE+i;E)&aGvj)MihHn
zVi^aFH}uu7nqq$>o<zEEoUhp{Ipec7&aL%yL>!55^AyYkt>!(HgBl(nu_hIJ1qmms
z(^*~4Zg(?4-;8k#v5ug>;#*y9nz3{JF=6i0`l)`pI}ko@=Or~PTB8|JkZ?t3kp`<P
znp+-n>rKSwRgzCwlt0E!GnJ#%;p~<zI!Rq4740;~`hqYUSZk%^(r?Dd?-8Q7O{G&X
z_Gs%V<j)9|sH_&MC~Z)dpF7G)!Fad@tIliu=Tz~4>w%}c{|G%*k7+hXcUgw%%%6C!
z(?&p#tf3};>qxzy(@B(Qd%Dq=3UJ*e1y9`5&K~>N%;OxH+!!G2)a0rB{p0MheW*#t
zcWJ(3$|up0SvUA~JkiBcMkPTzP_x|&81_<GoAq&UET6EA6^Iwyk3n4!Ku(k@q6`2*
z6;54xybZJxG|VQKwxGQ1FiQSV@E7;FdjD4*b}H3Iu%#Z_H{Iz1kwVPym?`r8kQk0M
zs5{oqu~R;#vg*vbBIw$i>IQ#5#7Q%a*K~U)k`7}O)81i4w(KPa$T6c<EIGA2kdPUh
zIXHIB<<(v#;<_%3(KQ#N+sK;}Z-Q2vh;rC)NXT@h;YWti%?$XOh}Mc0A&JB1-GiE=
zrshq1x6c>!wOG4D1=V{^i}6)Pu-_seJ_d5lSS4G}7{o>QQIlCF;m(=zwk_e@9#MV~
zy+qVZSm`4cD_#>eLzm>mw<GE3Jl!w}Mxq(;i#eeRUYk(y^u7;nxx*yZK+|W8HvQ&n
zNaTyr+{;Q`nz@0uxyQM-AAEKG0@B($mnZ*a&EzjX_U#!tGaKRqeYc8anZsTW0#beP
z@UlVhR7W2NbQ8MqY9RllqpUg&xPF~tyJp-NzjJ2t13|QmmB-k99q&#7T{f0@AAy@?
z;@S`B&V<F%l<MK9iz+&(j1ls~TkpU+3>GP2K9|7tD?-2Ty!$}(gF5uko?od~%!CR8
zfIz&Tn_PNR-5O}zqe@AE{-}P3M?O`RT(2FML**pGZfNmy(?BWB#!$uWs5pNPZy#g4
zvUZBqEhNd_F(AYn#l4~mxz*tQhb!;Schd*vb>liPwlNQ3IFrrU)c&pKfCU^|FG0E$
z*GE@%XnyAS(&#DFyQ1*lOlvJe@F4~-3mgxtR@%pCG>w8*E79m)1nsBa&$CKvSIw#E
zU|q&K(<-xKDvt?kxyujam<0qz;0g0Me1X&FvCNiQ<|vh0H4}-DF#g$jHw4noQAhem
zMem3b?PIQ?_y0}qOZ$Gz5-d5{UG7`X`<gE`J(+8R*-614%942fF?YW7ejYH%qK1+G
zHOC|k9ol~p^2oER$8m>Q;%rFsJKLb;n!cyLU)}Zgc#`Yorhvhy&Mm85njjg`JEVgP
zw``S#<CJ8<>G#>)GH@`E5!$!jgJSPnvP3e}8^LfP95mv?PzZ4>G<z&joR3U#R25%=
z=aj-Y=ntz=dk0mW9HRfICf&f>o@lEe;T~e=Y*0Xj6U!n><R7vk78MZtU?fo#aQsvW
zNsno*8#1C9(@~&z7LEdm_;$iX0&y9%fOa07N$JbaMsQ=NcpFkxwnegFNMtEX=0pF`
zu@lSy`Of@0WVzAu=yczyJ~7en#Y4u}Mj{F1f~>nwMvC3Tuj;wi{|>6xe%e&s^3h>x
z4xOtKCirlTVcs%}-g~qwc_aPpk>$%v%(ZEi7UiPTCZ81jUA0V6ord;S<sp7bV9${k
zm`RP?z<R9F*scBMS6O4fFyQl?RupZO1S}6C68Fh6z(X#srn4R?xCt6I`uF*w1Lcac
z3|7?qmX|uN#kQIk2(zXHUFr6nMsZ(D^*4T1vZCL_oOd?-)v21E39^W~=?r=5FM2!0
zLoUSTrZb;ax!3W=Xk*&QS{PDViNJGZed%P#RTv)*-10s|2fIYlL~v3F3_}Sv=_K|s
z0>G>u5ywXv=q;dhM}~9&Np6(X-%EO5Bk1WpKd;vXAeWZDnb9@n9|dG?zE>Cg`+!hl
zOT-j=RDp9`qCVnjI1DGOT2<W_3O>r{|3>8xta@Bn<XJITXqAz)f@<9Sj(%9;|4tbF
zzuA^Ml+D*P07uQ-dlOM?@y8fH&3_yH+8;vn1s!|w{J!IUQp>VY)^#hl(>DwP<J<og
z3v_^$WWXlJ7bc&1pG-7#w9Uwm@S6$JkdM!Dye7Q^0sspeVm~lb>c;uQ+fM@6i#^7t
zzlfoK8Rw+LjPr(&SI)BIka@z!KGQ&c51RX!R)*MrV$ggZVCVH>fyf22FIniN{ozKC
zwK$s5QR=?>g7#fo+<rQEE|RdKDte%~qf_&#orvC*kEV-klE0VqIdT?$2t;?CT-Sn7
zvtt|{s$gtEB0Y5r550y{J(jh$jG1+@(ahnwxsw-pg0t*Faq8fQx;=5};!dO%H18&<
z-QQRPG1JF#r>9KK4q!hoxyt^sTK=u^uTi@-cH!gxQ0T*Zi-2Uuahef5f}wNsjXm@E
z52|}cavs{w3T-k)d3^`-h#%(2o|Yj}hXCD4-p@V*96|3-Dh&f&Gr|NtYvrq@A$2!<
zlZy7sGQ@0Qm+D1K7s$)6c*Or1iXRnBrEIm0Ywq<oz?yYx{>4d&Z6yyJuc|lE$8rM@
zdZE%NNVv&^*)7C~umD(CSOvt(sYe-@*##THz+bHz>S<hJHTjx~#T&;l#FB?<yp1QH
zTYt>}E)z7ixP9)yid&Zd+JH-I26$miNYqXN<Ieg>pW#?v?Ao58cr`_JQ2A__1*VCu
zjhxb)7W3PXb%BBHVvPe5UrBGeDYZ%9&jkL}pf4tA%lN=QM6PmrvYL|uK85@+@fK8N
zD$y9Bcv?&Q3bLJw$z+6#)u|FKigNyQolp4LZ662{e`vS~pzhiLinvbd`2^1@$5XEY
zRm^Oq@&fZi#&ZU89{^z?ALF63`IBGr*Yx=KVdn}Jz^4Gl5ABOiy$sBG+3e^5q&dwU
zhuv}K8gj}BuXG)Qq3x7vd|l0iwx~eloxGf^Dlq(`wW(XK#xqtoHv^+MgmN=o=+j`b
z#SM@I(Jt>!Eq{df@qM^EBR4-cp>%2j!}lY8rncVoAI0Kw!u_K>8}xoatW}Of-3<Ar
zi<Ue$qp+Ot@whRA&jb6KKMJH}t9KM?WC4-)8AU0S9U?C|UT>Ae(aebbxE8l#`dfX3
ze$>5C^@}_sa~nVb4&O!IJs1Tfqu3Bd&o!5uEjAVIpflv3vpTNN8G-90LbcKdo!3pc
z@lM~s^+e7xA6}RS5`*>WhvEHr#qtTu%6Vq=iKYh<$kHuDer<X|xXefNiB4+FD0#6(
zr3F@IK!`G!IRO-|_gWIr2-A0taKzyvQHL{ZYSF6?CWB!`&jsBMSsgXZldIsHdU6bA
z)xPB4WbCa?STnEX3tn)LyT}GXZK?s3H8%>qk|{cUHbkWHs~~SZtNwk>{s9IW)v3Cl
z0{k{D#v{`pzDKdl$D1wXRcpd7;}f0EJh&m~o|$`>*y9bsZ$*<wF|0XfIN0jUn=Iwj
zuHYxu9ELr<(WC9gv<Pd9v@?;aY+LRXf=u|su*E2t3RIl*wU9O1NxhnRlEeL;q()Rn
z%vK+j%A-;jRtHn5O&NB-?ttPb<yHQ|c`Q62!WcW=S@8RBJeNN`^^a99cMd3PqA(xJ
z5K#ec2^J9Ha3Ry<7r~KbwX0nPOj(9KOJfaw>D+PCT`z5hUay<?ze6bKk{x4*l8$FW
z-YYgKNI%<~aEH09(_|x6zoPol&Yc`Gedl^tmg)73)eb?thnS5Spca`H8Dsf;P1N;`
zQ?Y|5{Q;Wnu@un}5yl?32IWUG(B@8NO9UZ)Ec7>^73$R<!NnozSb6on7DvNsn?7s1
zAfOvzE@`6rqFkmO3HV{;m5%A)j``)TmS2ny{>61V^RGd6)Bau-Bo+H=A~R%%Q751k
z6d=@vL`-rB-i!&3Z};3^Bvql3I#br?UXbko?8Woz&{G3)$Sf3X?U0Nc63)+TU|$2h
zC8R?Yx(&d#^jVUh19JHN${TFBWk}0>b!xRCXrR_K(HnW?9T+>t`KX=n*=eBlEcK)z
z)rFj7QDzL9%n1M}Sp8)KiC+=v^0J1Y?Kt4PdHEnftQ;>NH&Duk9;$aVW?{<bDPNJg
z(tNx=aDb$`Sv0k@Yoy#U&^_64nO>qFS4El6j#JeF?*r*C2){e<RyRtZQu7Y*>SPDB
zN9xXo6jOIlR1v?DXw`inJ@3Hb>8Rcr{z}|BQvXkiAf1;mEdI#Du86no>-%i-pC(e5
zTFh$`AOYopdLO=oqS*%T`ePLp!M;=`7Ia$AhdTL&y?*s7n*7`;E-Eo`wYBXV?)p=!
zVpFoK9zhPsV<`&1U+w}@44k$F)Ego{oXQj3Ddo8$kEiX|N?v{^fwxz(Q>8?&+APyj
zCfY1@D$a!uvoy58vdG_FP8_c>6iwG%938UaE}o~6C*8H<!uaid-_ljrUVLp_>9!Nr
z(w1BaJ&|8Ij<O(Ot^3JDf;b<gD}ywKORxbO54oUyg{i#ZqG~Lh)+7!Jp{a@M!nxCX
zh%q3(9ZJ)UpW;TkPT*wI*ceekk&h`zgQ@R8UbVC6kHWvBTAS%%Xf5|vCtu5W6aeY5
zG|}bdn$urSAQ9JRr;PHHt-LffCfPZkvq4&spe~1qBc5KHI9o~<x{4-{M!n&#M?7}m
z%v33cmo-u6HAwbn*+gXk9`Tu`tP@aXMl?T)6Xln_-jm~zGdt)m+YVGBwag&Gd{x<t
z2li_@6>Tf}edx`BRiFo;xbMa%RLZC13W6e=6u+Q-6M=0M6H3pTTP`rpm{u_$_GH(u
zN**fLrQtH6B5(rV6wN{EsHX)?$u&nL?tmADiZnQDt}T3zGKeXq$hey3BppnccgBBo
z@>F4PE>qNe`h!GS<CD{ZbPi0j#Xwe;a2W2t^oL2cq%h9A$z`;>OIX}KzP78sbn51?
zaVYvEa#NIwxXd{a+0#;_J({=rpJzut{mf+<AmbYYgd$n)JbOOO(>U!@_36k@GA(oZ
z8&Jn3e8}>tlQ;g5DCQl&CH*?lBGu!h6jYc|xYM?9nj5&Te;yyDq;~6zl5WQl1%Cq=
zB??hfvlvD-oMCd*rRA+f^Hj|&{OsU0VR#wTIO^$woeWo}8sYIiimJb$Oq|}VByP0Z
z+hVbRT(*J?+u&<!*xEdhli(c|SscEkDwZiKC6DkEX^Z!K1uvEg?cg*}#RiI^h-@d9
zifmGJ;xS_X#fXKaAcu^IQ^?GF<_l%>?IV)kvH+$^%oQ`Dt{3^NOJ5zS4H|&SB1eCz
z9uJL-ZbifE0ADuCQ3gZ)F*6ZaQ|{(h!26`4J{j(|KdgQD^h#`Uv0fK%%sVQ}GHUtJ
ztga-_WMcr-S!kAT^(UV$DR>LM`)ML#xgaa|8ZO3Hg&2K#ibv)2mMxmYsB(ryAIy?P
z>%SALwxRkIac@D9CU!MS%qe@LAoXh+JU>E`sL~EVt9l&kv!GXwzR+sVSQ;HB$p|)x
zD~V{=yhMHNSl-Na#;n~Bfp%KkSvR=Q8(AIimXhQptCZa6UcSYLI=fzjQ|bMcrSsHk
zZ1}A64D#txv^0vND-^MWWBVfaCw2;cPk*^L()xf@QW0^oI;t<hFr|RNJA$Tjzwfb=
z#av{04Ww+OJG-yZ7RLftR*6x}W1uz@rjQOM)D<eWsAol&)fjHBM}I`04SLqY->(*}
zvK_?{lF<5HEqu|RU7~A7v(ZY<JkvxDpA|jp9KU8xiU6S0y}9knKpTGkOK0>y6F_c1
zHXOSFgq(KHyf?CljD(KwXI}~9jN5LK579~VdVRk23fXD%1;B`~tx%Bv7Y^Ea*1n%q
zBk{7>z|jDZ_eL#rWS73TQEz*i|Me#v4$27cmy#V^Gej2E%mC7D+NNaePJb5#GD$OB
zM#xdsXhTQZ>ZegitG}n!O*Nn7PB<f$)QE}Z$ppbm2w+RRxIq}pI>{a5ZzPI3VY2Rj
zobZJpyqef^ws8~wLk*vWD5=rgTtYe-N0AZEo2KWZve8)<+<1_qlDNBzo7egV8vzR$
zM~hiS0?yai&m>NZ4DVrkENG<*5K)!~9EA{Tb=4S(S?y00ZK<YOG}MTqDaj(a8>gt|
zU1^3PcopvsOyIDRs~3U)Ew!eoudSoWjk6JJ=yqk9V^&_7E!lJ4C4O@MRQDQc{SD6w
z{XokFm#Y0u-op2mFkPU2`RxOeWi>;920@>ads7Pk-K46e^+B~`EweJBJ!TY`w=SW}
zHBthA7C3MGDHEX`#K}eTKA;~VT1Lkl^~J4ra9?_h68KFDur%kHB5Lp|!P$TsIY@z}
zs`AMJ^n1XAAEFA2VK;$qg%_uo<pIBpkcFYpc1?(f;Ej0Ey^VD+aq_mO^h<Z)RqBnW
z^(1s>XUs!4l8Upa^OqfxTRs&n5D!P~@oq0J$8$a%{e1t@&6E>1RfoG0<0{ne>+Vb6
zw?R+&m0R}t-F26?HuU;9ZlSMJPJZLI?fS+`b*3>7iq525>XqDj^}LDZo;#<GHea{j
zn)QTz*rrTh=H`)`mp*>EhK#}pOa*grt_5Q*s;hx@a~dfu6bre-0!4%uHG7QL+3+%Z
zRu6SMzD_u+Kt>O}nVcrMhD7Ji%fL)M6Wn>`Ep;y*ZGHZ?pGLC{17Y6Cy6J2OG9f3t
zBCMxq8FpN8KP0aUWkJ{I4F0A7dHvvCf~r8df?$8Y|CDdQYI4Ek-cnZBp%``(+`1`r
z<jkas6`D>~Eo1#?U}_7!A^doEs)4Ju`4CT-75%A}ffTUPB=adxkAI!~E%$9qeRJh{
zD~3e%fJT)jO8krZylgRnR!u09H?IIuzWa&iM$-#iH`c?VRzH`MGLgD2vUKUGVhzM^
zdBppOxdwugX+^DdV8l&MJ&RwP)xu?FQu%rGX%542@*vw!yhaTy7WHD$bax}jm)cnY
zzGE>f#FAZ&|JoI=^tQA|j(D)aUNwL7)s5Ua<MxnPZptWBM+V>Imy7sjqQZW;`(R~&
zS%_VDbAx$C^IfdknDLE)!-!uc^<Q9{BzD}b9+_8z%!zk4ZeNW@e$qr`f3zx1su@xw
zGVddj;7S}wF|HE>hV|#;MwTkE5ee0-2HqIGiYhQif`oQgb64KFmh$)F9ws}BaZf4f
zkFcfB@&y|AV1jx$cAf>4Io+^baKJm809_k4o^>Z>m=J~(h(ZXX_<b1o49@VH%~&t!
zsD^8Qdi*;?p^>T}I&<ETr!!7Q2n`Xr;hrlua)<OkQ2JY$bo?HErzy)n1Id%v%AEYJ
zT81u#N{#oD;6YIFWHWV{2{ZgNOn!B+<{wVSqpeF@hgh@`OyCJUR1{ctw5MwRufafe
zq3H{C6J7Xx@%P-)WM5-@8vJeb)$z;cLw6R>AvkJ#wyj!~+kKMK_g?B=m_DZ5FejIt
zRlr{iN$|LjZT51UD)u)Q<r8qmt0N$b74ONPPX(Pc3B(Nc86HE_c0E|n(L^P%`hx_`
z^kH`%#b<<+NfkZwJ^{02Hw|c5EaTl({L{~a-3Q4_v8<N^rjwnlGOJR7?6oSkZ!;S!
z^dpsuSFsm3KC(OsFINZhD43{;3M$t`;o#>@3bxz>B27P!T%l<U%W?Pg+2?7$7v^tM
zA$-=_na9|mQjmRnoBfKtvxv`dc(BK;QfM^2^k%c}O|Yzly|1idyiK;l8hI8QG`7@i
zxT-4{nnVlGhw&ogE;f{z8#%neCwGM^p26--e_ed+cN&a5CLASDYHpEx(FYM!0hL8C
zd^?%$E6#n<Vqsw%pul9Hv!GYVZ%UY`TY;FBU+O|@dyg)M!S|rZC2vkREBeDMo)!?q
zfsn(+Y9FvAn!Oac-yhLpi_nGlgqi(FW-f_hoq=PWrlWU}6{~w;!a6h_VZ+L8gj}65
zM7E~tby*<DapC!{yI2Zz{puxL76qmz?i7rHCv(!HfG7fxTd^24%(qdUhkq=^4_E{W
z#{^8jPC1Kv6xUXGtt&ATu>&T55q9Csroa7gx2>Nwr~tWIWIN0O+$jB$=ng^Wti;B7
zN3`LYw^_bH`~~JM7bVMrTa5>}W&zl(1}z28?EO3v-46oxiXMF?L(e+8G~?Ki=hTlc
zA#eSje3WY1C{gs4f0Cr{&Q48hmyWZ896lP^g%;M*KX)NF^eGToTG6kUOv@A*bk+Tx
z$nO@Bt3OSt6IB7J{iWaJh_GQf;>Xc9Sn(J7s+irfC5|N;<?8fscl{*0E%2zLF3?{Z
zd4o*Uy`ZO8q}{@b`d89>T)b*DQQ8^Ew#BLKOHh#csD+kbXmE!j5r$wntEm<{M7PUG
zDR#r63tT5MYZKfYlzOGs>00c&7wM~;b)6nL&rQB9T7OS-OQx%e@e!h0OR1OltM_&-
zDMy-;5(f2i5=^tEf=}p<g18{jfx`t28z`2EOulBrG>UfSLc%?dkYjo%$}!;=AlgKK
zu3x)q$O~y;dgMc7HW^~68qg}-H6CwH@KTitug69mXqX7Y`epIz8MVhmbPEx$VPGqh
zN`^@gig@fkEiST3^POw%iH2HwHV(C<rYiK-sSdp=#=UhlX98Pcv<(Nlqcf*kt#|6;
zsfxrztRKxSgedo6j^M$&ju9<AO7NS(FMZSwVAf0~(%EBj<w4=XSw+|s%WM8Jc~m?u
zlg43m!SG~dp0I%#6<u44egFmkuG>;B_z?^vvaLZ}9YU7z?|2||K<~#!zA>a2has<w
z2M#)^E!p5#;)QS?hOBzHzT+XBsLEHPD8bYRHJB`l_#QY1SAg;h!d63&eH;w+B;+cY
zD(;Tkl0c5FvU6MdCcg@LSkpyc3Ie;s!#JKn5jKXu2B^Z?uCOW`=bL<eBT}gv$KqxS
zVqb`AgD0!;6H=rEu5u5Po;Fs@FG~N1Lf42ma_8z3ZobVaJrqdQ5QW=6nXp4Z>?zr$
z=e=XXzYcOv&+(3YW%xQ7$=O?G?kammYLXMO+}crA_CJi8BzbTt$-M;m%&}OBG!HS!
zz4{s3P(MK*-8b6mE}W+KAjQ`y3nY*k%QSBKPKshXXclpHc)r{ZUkA{IAo0Wa`Nk)T
zZ;K;m4fO^QLf+Gj1yL|WHGFBQww!YN2T;NEQOSKF3tznC6^RqM`R9L3BEJ=DbOI*^
z$fp?Etc;g3^bE!0SlD?of3AAi+D=h|yUi(3RxIJXJqAzf*}mu^+4m~)_RZW2o>I_!
zsMkVhDXQJbZ?I46)ye$#SzPYT)E{@;o|{bsysqM%ZaKTP`iHrzgVL!l4*n;!-dKeY
zlG=_zuWAj>9jEkK>2Sz$x$1M`;-ufjSC~jbQB*HHRo|y;DXpS#7Ww3qNAdJp2|TpK
z?{pojvZ1s1duYNvm?pgIl%HT`apjv~!)L{ZA~KIw$GQv!2h{<&)G)(V<{Zzev|T^I
zzOJ;-t8-<Q{03kAZqDMGAQJbGOi>9RkD<o`?y3k8X}M_Zw;QxF9-CF`_rY|4dEAfD
zL?O$S5LRdBC4D31YSP7zio%dvgU43tH2qvRrltGg#~x76&jn7yWN|vMV%I>XS}tWo
zgb!(<oE+2uqQTXx{P~x85ewOIYyCaKXVs=uJM-n&LBY7mKvix~@%lLhrtodzQ^D^r
zp3cue(M_;xzgd?;O(4cdnmJjP=^n@wymeK3>&z4+QdG~^fKcNp2y6xJ5Wip^ZLnG$
z5bXt{5}5ISi@+Xj^*`5$==v!NwLO;`9%dO*oYX^78Ed`Ds=Uj6A9Bv>7b+7>4KJsv
zTlw0I4!iWkQI2N~_C_oCNxYrZGEr^V9H3Tgc*^@POU)wk0DkR=dpCI@Kpbi>dWWvZ
zMT~pla}~P`5Mq*@o;uaX4}2Gn39P)Q36{muTm)WtZ0%}0KD(VnjaWU$84e=oD>%=g
zXb`AnNEwz3eD&#DNN%Lz6|J`!ceYLOZtqiVH4b6%u6HR5G~YFIIVLoCxOc~{khlUX
ztKc89bB+>7?|Yj+3bxy>O{~k>Hz-FmKLl3B^&~ZX3bamiEBD5yUd{y;_BcsQ120^C
z6tpkp(HjNgM?N#*tAxeMS#fFoN8@R0P%6DPghwf7RVy*Z@ZA<}=?{E-5^!I*dFg?^
zWVvQ0R7Vfxn#J^JaD~@Cs5TuV)Y9|(xF%uX{bDdzh%eSL4TB`~@rJEWV_e`=te*u=
zGX%3-=ymnvvLCtjA;~FF8{tqh^0xGbYAHGfirw4-Ry~>NCyRT)O&w{m>+7(Ef2b-L
zbq!maKt~_;-G@U{p;SIO=vSVfpbB?<OrHqUyk4m4XA%kinin)I*CZTO6)$R|i$(a!
za?CQ=Lswn6&)-ml3B-{Mh40kl*6-T+cb_4<O>^L1^LD8>yk+fN9XeiB#oQ$nmRURz
z8l1>4R|GY6wzWn5{BbvB@XF9xqie3`)c2rbyNB+|MqTmweZQZhALJ3S(_b>pw1H_x
zUTSJ8c-l1<76oB}R+_cq(~&E#+@8Mqr#E(Ft<GbDRQOY>EqWhI7GVmQwFFE8cUa%u
z6D%ukC5&-;^yF1QJ!JEm93#Eepp{PKn2RW9@Pc2KMO0obCu)qGP+Mn()nGoTg6(a{
z*|#GPfK-J3VvQ<srPNtyd*4+qiiYG?r?nufLoGvCyWWhtU&>5>+fX(V_gU(7mcc&i
z;j!R=S7!sy%VeF|fJrfQYeHPEhvJ43ARM>mqr0DN9<`4b%ZnC{jB#3m#6vl|I<t&x
zKM`DwfPF+(5d;IE)~#`|(2VkfKm)=5a4(&ubFoS%i{=ect|xdpby)bkpQ)-ajCs5h
zJz{OiBc#?K>ycDAwNUV5LIhLbp>YMCAQ2mFh#@etL<_&*Fu4N3zF!Dkv?cTSZ}d=$
zI<6Tbc<advX=hf&Td~za%g4kaJ->Pf5tC#%qe$>$4uH;U6_a#}bH;;uVF_b)w+p+5
ztnGN%sxT4xW`80{r@+*8R$)zju5EU7F1JyjI(Stjk<sqPEo+AJ0wW;;nhNgtpnf<+
z(9_Rr1J~c%+1J0it$n!|$6VB}MQ1~+U2=znNlmE@%SEwhTRX_5d9oa*xQBVKVZ~B=
z5p16CrzBa;lmW3{tdCz(t8-ObwQVOLA*#+oYakpF_?seTgACB-+*@8aQ>Ne>h4&0M
zdfTs%&{ymN4GG)xcP9`ymP6=Gb36m!5Gp0m-0PPir1gU}C5poMS5@WP#bE@6<0tQ%
zIkj!rQp%WqpX5PE&zbo7xt1BFcFjOpy0ahep_FGbm`X~Ars{2{uxNGXPL_x%E@_Rg
z1KbHbDP(@_jHGxJXo4JcdNP6E)wUnIyMC%=%!@juh`-l;(umUoGvtYrS-)+?SH-i0
z0BKi6{JAcYv2cRwtFrcv^>QY3QUXowCi`>x&=pXsL-b-MEBN|IIuXR}M-D3xk+Hk5
z06-h0Mmp;aDA*ZFU~BQfHa0}j)X($@g;Czx3NlD7#!iHy5e73>Gu^oac_=}!iI-gf
z^iM(oqqIRV%nJ8N7XF_8Lmt>zJ|>qh-<je21)m#Eq;7PHh@24fF#r;6cJJpeVAq=H
zz#16NbI7ODV_pvDD2Or#LgR*Or$#2_q7H3Pxt`A6H9zRp4mU9{-=FATU$iTL%svt4
z@vi5VO3xUAc6nmG+jf`hK&fAsZ&g}4q@6$ub{Zh?J_aGm#n10C4mR}aFe(AiXGa$^
zK{bRtACTjaz6#~dJEmHmol~+7&!Nv4Bh(pOSKo~1^}BjTG!`$Idy-rRZ$PBFt_Buo
z&!j~bmrh%#47paO`P~cL?V&wbSC9>d7od%xbFP_8k53G8ahc{5id;SO(oeWvwTDH%
z!*p69GrCsuB_+D0Uq3oOusDWQydA1KzxH8jrdXEc9${8BHZR3%Xbi;GjK&oj&vMhF
zvKz>Wwdw8ce5eljO`qO3*F>hw@rRYQ#-~EflucnrmT#CdqwqmB6I;YOBTN*HOk#&n
zd*&=qxEqX0?ylM5qr9HM+O>xW{i7QW9r(LXiTtL*&po2huRgM3(0~TM!-SYR%*uY2
za4^pfX6v0^vH|yrxRHL>MCtCpV6hvGxb3N?kx#eun+rCoLWLvpxGuvlIh)h>yBgun
zW3>DIL_^|kC2<{Lcyr_ozDtiMc1KnkBWa?*LL_5laD*p|?009%@CE9Kd9SoRVy5~$
zB8nEclGt&x-YzSUxr(p8MLC$gk?Tt65{umTyTIo%>a5tGVR$v)9V+ER0Q;NH?=--O
zqufU`O!@D-J_^uJYuPx_JJ+jgBZ1FNWrSpEfJ&5@@NFqANLGA?GZck1PGh|6(L~M9
zu2bH^6ZBTC_m)3%JJ(2{Or#1t9o>h(#ij6enM(K1Lo$(Z02&P3XXV^kz4il`?`YY-
z6uHVnme-2C@S0gFq_<ur$hQfU&y-8NJ!t3V+opEx4*$8wT&_dv)@`9E>|Se|1Xq)y
zyOk8p54#eqB~$dDO_c?G+GzSofjFV`>ECd#)Gw!js6Zqm1m-L@$#O0uMFHq{3VUJ#
zb_RpRbp@X&^8if<<w!t3@`p(JC<;sg0#TK6_5FR?`uN{H#D6_m&kX}pfYJo;oI!j}
z_+;}o>5JQ<vYuIG=vx))_K!H`on-k#C_JkVl@+W{KSRC*zcft&FgNUd!1v`Xb<MYq
zl}@bmfRR2Bp*!DNdhf9cUn*7b%L~+NCK8FU#!-XT^V^3xq$Fpz9v5L%kZ&USrzla^
z=}sd{B+?G*9DUPpp;nZRtf*a-a#y|zX-<Yk*F^kgh-@L_KYHk248`y0w}V!%lRV=_
zC4G8Z(QAIVoE5{dU73w!IU*u+DtggX41>@HMLv*;rB-@(n4xok_`UJs+FiUI2Kl9y
zgToK4)k!w|SSic<38)mNV%8mya^1`bovz9!=}kSz1s-u|9k8ZwDsIepA*!VskDvNW
zDMB=gZ1s)4ZRUG|$&aIw&Dif`_%qT<$Uw+Mk07@t1{+xd_iqe30ZGL)#%xcx9$$Fa
zBEf$5a@EO;d6v*$*nuC$#fvc;_X5h4c;h;8++jz1UVTL*{+>W5G5_O@1lpNvfB5BR
zJrva!>{(ZEmI8FKGJ&Z7bGicY`jgP;(M@D)TlWC4ByKcnOyDNoHSD27;T^|mGHQi&
z@Inq*v*`9e0+^jKXByMw=j{wH<QmoGyzR7fxNRFN6;+>op87c;xOmke#Qn(VR>?8>
z8pB=aX6dAomI|u3($1mC{P-)J%abRsrEh<xNMOmQH+9*hy^H|o=6YGIj*>Qlgv#_G
zGpy}`+`tnAvwH3O@4C;i5UfVlVzLTyB^6O&ygW+yOBx_Vv+fQ`(3Xc_Sx$|v{@9?9
zUu_5`EO$xyhHNapix|#s;_6ITrwc^vYCSItQOsO@?*YMwzTik>(#Df~r=a?H|Mt<y
zxb;zHb(xf6Kh^3BbhY<QBD;D)|6M39Gu|%tiRV`Xy-Ov$h3)%J1isx{e3-sR`lp7p
zy4C;Cb^$eZ)|Mr(ScswD6|7MIzkll=;l?kq7_Vr|6B30hOl%yPCw3EOFjnpk9)Kp?
zqx`L&^5=(l;2Q>Py^$vJ0L7Cd784kesy!z|51ec9t2p~@L;anu>%}|sCib}>BpU>7
zMep|6MfzA9Gnrw!$W5DH8%h$b%-PCiG1Q}nlQh#62^_DY+iQ#b_*d^3Dh<_qGF3Q2
zFO!tdu}V*ea%4nSkcAn)WVr~=bh%gb`Euk>cZao3*wVACDwc)_vqjaMl71?JH%CEs
zM~kcpU%63{n<G6E?(rz?)@rIU!g{!M2tZ1M_(?EJNan6TdfU1d@%;%?6oFBcgr><6
zk(0{}&+dd9snoAsZWovv1Rq#TR>&XY*pOmD;*ADDFhP9471~(U_sCmYaOw54FwT?7
z!t<vO0;!F7<f(g4rFhqIgoS!JQvUw+qIgXBXBi=T6jbHC9dOB9ep0nEK0Elo)@}wQ
zK-(c_!nkA_@a8W8>oAl`Y@7cYr{Zg|@Kxqs;ui&CZg^<0#3naE+Mr%FIT|8A%>ylE
z(;*mfeFFp1MW29Hx}FsOK~i)R0n<H@z;hSbaQIQoudh-6z}=oVDgfBYe%`J+#i|r|
z&w|3S;?!OO>G%2X30dUF_@<962CZl3>E#5v+cTmSI%Z<KnN#rBqdrO=>2w-TS{t6)
zJo@RVPXeQRZ}6HOJRM%R<nFCy8txq(`EY5DQVjs3@6~z$7AaFZhG|dpYGB*x4GN#$
zgq*%TYS<P1i$cm3bJf!s!*ZR%Q8HlP`~gkH(WKE;n{pmzZ7wc7O3VwYvI)?>k4^<-
zvQla(OXC5EzXj5#RK{}b1T=<BDm#z<7+w)J1Uf0tqja_q=-3M(%GIWX>OqaFJ_mnU
zd0;7+aXojIkY7s=pzh<_O7SRtFmdA`zx;dYS8ip@S=D!~e#ds*dfCw1lQ0)EdX6iH
z!s-|Ad~hu7L-}$GWOvXli>~uG5|m%7K>#5YQkF1uvn4Pze>|s7*;pYh$L26X#{kvG
z@_E|yVvqV7P>nRqvUO!{=I-0w+i)oO4Sa6NnXqJ&zER?vJG52^Y<t>cXECf~5nWTe
z*ru7T2?i*p8AWke2Dy|=a)nVU!9JSB|0MMsIp2t|9214g^=L4QHEb33ryJTHRXUpa
zio5+@@si7D&(X+M!)JB(25NPavSeH)<Y6biYWac*MGNo}+Lfan_Br_p`iiO{$l)Y4
zQn`4Erw7K1G}AYBnIt9`W<{-J(SKn@$@HHB@l9?xasdU7PJ(Y*22~whnh=!`#7le#
zSNS_=)NC~fQC8}nVW7PR3XG@kz-k1h6;KzKNtH;Zps8MxF@Jo_IXxE}4dG-E)+R|Y
z?HIYlBBnW<yG<aXA$!d3g?xL1nHSwF%MEKs<8j8pQ##M;$HaZq;S5nXE=R{pX#u>5
zH&m(SM6^^>eKWubzg1X3D`VJM43U?)*q6~tMv*r;k5#KRpCpeeKh;DTw-44&b&a&x
zi%*VPPw=|n@(eq(Au^u}3OrwU3(Rhd^zU<P(0WN7Ynljky3eb>O1(<6OgueJf(>>4
zlCja)fxE65T!R^DoRHa^m)n_DYSmDeW7K^!cj%VO%LE#@Vew6ZpvET<coT>pu*Miq
zR~s-hMUKIH*6M*?#4++2fNrZPcuEZ|Xz-cVkG0ulmub?!#tf*|&+p1OcD3i9eTo}9
zOSH}l`iin0>bY`6dQkA@LsAMA@l}nPZB~~CyGy$ROeWgQ6pTNg)-9;*9Nggf#$_cq
zSdW<ab1$!SJl=DNQ?VSnkjBuncIQlyvS$N*rR(z8F|j0mvWy->r5*>c5tzQb?eO5)
zhctCX^xomL##F-ZFp?a0Z8z>7ca=U3@k-BU)-@O}e??N@_x1Ua^YaBUf*0qcU11PT
zp);YGftXl&L2os+AR9#bj3pMaVqfkqvwR?9Cw?V3rg-PX=-1MAX=NWRWb16Yrkkjl
z-p!sBvh!8eTp)BV&%ledcB{hfT4zS*4T-Y`3hNfyE>$Ffmt|~gx_<6`0+RIsODJNE
z6M9Kkw=zd1u2tN*tM&p!wwo@uz17IMVdC+#YMrla9OM%~IcoL+b`@49QQ34rsS5ob
zDplU1iZsjUM@2E!3Tv<RnOC^%u{GQ^q`3hw59({D^U~Mkz8Cw<acgmPE0=I(L#}t{
zMEhtx)~b|(C0X#_`vMonUmd<f*dKtboAH(v)8qlEQ}5{8$L4lE9ldq_*qv_rLyqwG
zMO;t%hf6-Xp(7MutKtdEmVggzIauBST{WG&D~F9J&%Zf%8$M0i&wI$WPMz9o&$A!4
z%XB(>M+*F~S>UI)mL~z3Mz3^SRdsC5Ju)UWHa~>l@O>{&eq#C*s}*rM#<Kok#{sAt
z4t{@gPk4e}`M>+fZSqb?UVaV!64im6X`+vkA`*u*n4RyLfA5n1Z}Im((>StY-j0#$
zCre$erJotO+sJ$nG|_p1;W5nG*ZB*yi)#4ebo+pE4%^@hy&f|Ve&WGtN!<I~nE5BT
zNlHM?`t5GH(YL3<Iv;C|?PVTj^SvRvA0QL-cb=Ct|I+b_sM2csf-sHvro5}vw9<45
z-J?a?KTR_P=FPs^hWfjgR@i({9M^k!yu5r`-RHjY#2rbK6X{#@a2riEtm%H*Z2g&j
zIbsY(f!KU5fmU)b)b1Z1&A+UitlOIk+q*@fp0ETOz|EN5Gr-x}bTWf$>fZDwOLNq$
z(rr;yF5RlIjPU_HvGZSLaPU}}oXYu-qkA4`^h}@vOj?AieNmc{FbG@nI;Y8KTm$On
zGnaTQ>vV-t1)koA>S}t<Gj4A+CBQpkSu0L|t!<Kisj+SMHq+co-w;uw75Bq`c7~sn
zA%(aA8xS8iad#ruo!LB;=@c`~k;{ZO>z*}GJw(b#4DY(iC``ElcyR9l4^C1a)%2{}
z{O=XDf6Hv)4|bIp00rR<B}jI3@JFxRi^}wdr>3=?*4kHqa!^{eYj<%+yv6B(?M)9J
z*ej*Q8E0w(M&RqXf?}+{L=8<hVBu71$XrC)g^n#xnl6LyZ`3}Ndk~=eeu4LbtJfM_
z%-U|f8PyFKd;)J0U8?NZZ1*}zs`0Dk>&0M$*`?DFCzUVgY5%<1@PdoRsb^$S7LO*a
zsU|J~pt6IjfQ!fE-`aQb*3d<o9Vqk3=D7k3bo6@J4d8;WxJ&c>D;Hh>Rdd}nplW_{
zP%?PJ{73g5IG2sO@sGk3M=-^6-5U5&_uC97L!p&b)RFv?<#&rqW)(7KmrvFWl{3Fj
zS4bt_mK?oQJJn!t<yuiepZrKOdrxW9h+p*bQKvIz$#;BpEpje>)62P)q@+Ucy3lvK
z$4`kH9fyM`{k1LOYnD^YUC?kiwdz2pAg9`RI&o7*x!H}`MK5BTPc^|m;~P#_4!gta
zl(PES=2G3uD{ppZRn!Nxzw$}SWSbzpJJ>ImT6AaU)!K&)?+HbBRVz&zO+kXycW;&l
zu5{68PoRl&(gNR))TP!`zKI1w&@wZ-|8@wsqctg4!1+so2zC3ZF@{OMe*6FYZ*aHW
z+LJAuKKIm$&4@;R)mJm93zL%M&`cHew46o_H$-KoFBktl+~hWUe`o4S2PF{-S7__-
zcD=v-t{n6%WZTk8Rf0jZROPt-sK&2QX);8i`|jH*t5;8k?e2z4fVW;(uR9xdkaf;^
z=;&cMK`N*A<Av{1+{+Mw&tL1F_I)CP7qY_VbLv6@!@qLVocCS*^Ngk1-NQi<yBic<
zt=zV6n7$5!FqeAzV$%NmTbl6amd07JXHc{c*L&S2_Pb|W$Ht+rNpWvDmq|L~lV?L;
zd)cY9*2XVZZc~Gw()8|)o!S}EF{I{WTf@t5O0l~VpNPI78P}}z?6xj*;`!&HqQ$s%
zH~ym7K{u>UhTlWp#eNJi`LN6H>7+3;hjQxHosEd5+xDQ4Q!yLmOs<`wA^Zd{WM75%
zG;i7g@j50w+8QgozkWy^5P@+<en+~CI>!z+=#aGhC0bHQZP4*Y>mOTCexvT)8amJX
z;$diVPQHKsM~~lL5;%co8PfLdAF$cK>a5F!|B=KY-m=&TOC9(No%x*F1wE)Y_Fn3n
zcehDl_(*mNezvLSs}9h=A9F+eQ_fSb9~_^v(ti>6ayQFi48i^NWZX}aca$b$2NFD|
z>{jZw|8>z(EpDNz?Qyzg`yB2mY&A|YLqBwQ(}~!#XJ*`{e~5flyT-SH_sPtZeJJOn
zuXbqN`m}n}MWs4}`g_Uw6PY9Trenm;$SQYTFgGR`=Mb|o!(ibmCi*k)Gdj!QyRYml
zik6^q*XhJR3Lt>MC9l7JRsrzJ<@8YEDMe<WbWL+dZ}nNmw+-Fv&RO3p16=U4k_l)1
zek^3R#aay=Sik%1i<FU<Xzz<1gT|ES$0y&)nZK|G9q&yF^<k6xyN#Sfco_keQ|nn3
zEF%R(Uu^BFbu>M%$rxLB%XsQZ;<N#G@VL~shlqxN&q<!P*1=a)+l;TAwR8i#c&M9%
zp!In6`gXZ*<M-VsA~b=O!CT0ZF1pJ84O38gnF0sfVE6T>oF}&e)o8&Us7Ak0|5Z;p
z2FP`ueHtR7_AOV3E7Y9pxJgsJs_!Ps(ds9p5?ih82DeTtK}*laR~Y^TcF7ek9SuTM
zQ_<PG-W+$Je>}gw@SE1}TN_+Gwz{7`8J_T|yp7>r{^+TV?{17x_F1x3_RZb;(z$KD
zy01o3!h@Bn6#KfRX3|50_G}TnsPVoTeW+|})JG4&iwkvdx#D$N;q5e!Km+07Oa}?0
zkqgP;O^a~?uSk%?{>zU)2TWdCD<m!MH)&D69ZouVkp}#Q>;Aa$*;XM#JL}Z{uSeN+
zV#B~qK+h`kk<|v=vf_|kVFq>G<;;!{`C68VB^^I>>4oE|kPFt=GB0-Ld$g<PS+=~e
zN*TIMGVZiJAw_#M`R_Z}E!LWtko!IllbZB#6kW+G2#E}Ef((w-lOHa2%-o5QT6tDr
z%#qx($H+e0pfc2k98`w6d@zT7*lq8viaTx3m8H4Ko1ZIGJKh-rvk^|~G23s!%xtv@
zXRXWzPIw_LnOmg&9|@<_rH>A2WL>`egj-Xr@hmP0h^!YlC{@M&|1_6`NBYV@a|u=;
z5>~bVde|f3A@jl1-w$w8z<mVY0q*135buPS|I<AgMm30d8O#^uds%&?K)9XH`^Ug&
zQc?_w_wH^>#6!Jax0Q~~A3x*9!#_tgti+Z@^XC+y5>WfZZu^YKw~zntE`aY^nyrF$
zO+HF)XC$VE*Jaq$of*oCKO9Sb)*0hIzrba8SZoLHQ+I1e$CbYD|L#_0L;dKoTgf7`
z1U<Cn-~=!TajsYRdc-jkLil>}zBT^E$dgd_t4{$VDF$dH&F8?faZ=e)f3G+HTZCTd
zICRJL88=@u-KrFqGo*jO#pZC7;_RLK^1mcPnjGeGdbcU`C0X4f*M{`hUX-gotfSx%
zeo?v)i+WvKUNLe|av{;&?))UO-@bgqd9~yC9Eeop;hO`-J}F@9jMkvbYOq?kel4bV
zYf?*y+Gj&~i{-45$@NDQkFxVsrB5_!Lks3G+z`v$+I$44Qt({!>DSTWnz3ii)2|-z
z^cwG;^BC0dYk;c%Jb|QjTn|5Uo2<~4!Pofqspl!{sn7-!`OcjKC?p1TRowAmU3I_I
zIexT0YF_q}Lp?)azwQ45xs58jN|<K_eMFWaN~Y%7Ga%N5dsS?5z`(HY$J;)M>6{=$
zTyS`s{^c$3wEkaLxHZ$$2OcYXe4H+P)WE;w75EK@$t+IvS9<A#O(U|7hNSX4Cq8{M
zngWiieSJ>b@w)1b(-z-~x1W0J^3q#3p{Y>#^twXDkZ59zTC`mAaC$SZooWNLOa}jj
z^<99t$XT~t9+}hi?;F=T!BQ@6NQYS8z#7EBpGe!@3h4G0^(6qS`PMo7_gLx3AFPA`
zGIGaVIEU({Oq6?`n5Z!V>qG8oMoSQB-M9CLUOOanMakje1LZ0ot*<Yd!jJg?8Kyuj
zw;Asm-}{^5u6zv)3*P)Gj8;=t{vq7y!er>t2s>h72%}Vb@2N9~=M+3os!NZCeoF{?
zVrv&qUaGgFW<F;r+eJ;28t<BZM=1RMfp;?hi*)uGSi9E=b}8seRN}klo!qyl4GEYz
z4Np?~Us^wg94_p@>h%sE7=i<ke*L@u9xMp|lwY1AG2Pw4KXVr~`xLMo%tk(dZz_DY
z75qyov?o-<|E7&rOwINCdvZG+WWFhYAMGA{Z4%FnO4^GXjc3sw*0C{4RRN81@6S%?
z%x<^e5Z==8NO)$G`x!x?@OJrnBbaZ<D#t)FKL1TB88Nc~JENKrjQMQ5Rq%N^Z6su@
z5VfeDiMQIb*I+foajN#=dZkR!sgApS-_I7A@4XXqO=5WX%yj5!JaDTe0l6@?2k;&A
zerhm-wo&B&!J_<w>SMfiub;gJbk82w+?C}$z_6jy*~yI(Lza{hc0csxb1R8$QP1}7
z@f%E3c2jd299NhJTlyrgj~(KKc0bo2)61wix39~uzlrv$^HO=mKr`cnI?M5P>BG9;
zB85w@&p&bZF<86cTH|DsymI?dlE>at&nd?Rak?=SpFmKN?N-5#F6SO2*WQ<v^5LCJ
z;h^Qc0$lj51cvRx#as*9mlu6rmSsvxFl+;iZ<}P+{mFG*{O>!7<DX7~vtlc5PoN>J
zbMUMl;xWos^A?8Q<+rBVnP)dScecHx?>=y+x>#`^`QV6urf$ei&#y6uMMnh6P0u<o
z0R`25HN%fgDe08mj~pa}<PJ!^9dX?-vHi}oqxAys4${oq*ty425<mltyIxaf){tXX
z*^a*c@E1EiAniM5%TMR@+JE1zyTK;8+xF+*JillEj`h~tYFo+`i0f<q`|~&bKa{df
z6Qw>PKX1L;x#_$9@ey0p(+}mn`YwHmms^jzCVF^<9@4?s1`U5-nzra`mX2&)!5Q6G
zGR5Lc{W8Dk5c?eUQXMVdlOJ}TMwtf5>>X;npD%59B;nAVU-~b)5SO2o3oqv|l;y1$
zMp`FGGLt3dBd*5&`};m6{M`PlEmUvCwIHX&42E86uBcA**>M+r3{pNUvsZeHzp*A`
z=HmD7a9*g-B&Diqs<q-rbJV4N4e9$oH4OFw63Ktj8|MG?2ArR)KoeDD`Fb`wtUQ&F
z9Psj%_=rMviO}kj>)yiqa@@<gXMD!rm;(tizXZ)QQ4>C!<S2U{T$(4cXxud!8F_{0
zP%CeZM1#(Uf@Aa8Wm-@q>@R{;W9^4@;^9MXj@%*qOk@6mZwTLp570HEJNiituR7ma
zNgC+AGI~wg2n}ByHk?cQzFv|sb81~;Y@j{uKD1%m99HU^XUgt7VOtwLMn>J`{f7;a
zGanIbAXIUyS-g7wk7kZ!s}un-;YPxm9M)f2$*3C`({3Q~ISk?FV7sFTYK55Xv5Nk`
zK>G8>k5-Lo((`uUeL!ZQL=z>m;=VUdbb0joWd&0YDOB<GbCLxgo-mA{R@2F{p|+Uk
z8s0}QM||38IOFjKJem|D;nLG;HfLLOrX=TybAig<)KD{u0jbwX5mTN~@9bLid+&(y
zcFU*)Y{agMe_b5fKTjLcNzbB;K{ej(9o~=S#63*32A4m&G*na;^kX0HIsrq|?3M@*
zX^=|j3+PjNk(}On+tNCPXZwk?DA}PV*si>;QTOtbpAYH_A>2I$vkm2C`P)ibx>UVI
zBg)!7S}rx+(X>fqcX|!qRUc*OWz^o3lsnjwW(ezzcVFzK|CmZOlralNLYU<1h<BsW
zqL6NpSFtAPpE4EymLY0BZM`KA@X@k7hc#_4#8PN=NpPIS=D6~N-GYx5s@0bQ5tM+P
zUsL+-ePuu4GVJc3snAJS?7I5$=n4N{G)p7zrBpe@l;)Gx{VhXzd)Vp=T%{?NG+?j@
z8(z`PNy<kKaZ14^b=hD+;>W74kuCFPSN7L&_Cnbyg!8o-UUTo8;Q9@iPqIf?KdacA
z#56(cxt;w5L>t~svlth~@y(}HO?%db>cxbEuClPWP8A=#xL97#3lm+&@5l#P?v4j+
z;rKfl(6Z3nmAv#IpW?dJ8Tv$=s()5R!bD&ohbNjm@y{;Szf>kI;|&8DKy_>LmX!zc
zL(94&TToIfru4_1ZSRwJSGv75%5gPmGHqCKeLGf2p7{K`VX6s`9HhYsFUS8nHdF)!
zM~=K;Cph`-W4o4Qj`TvIqx-(~9a6|Y|NfTshCjJsk2dle_wJGM5<`dRceXWbVcoP(
zQhF9|8dtm0S77zvyR_H5dej=1&}Z`hu=kx&O?KV378Fqg1r_Nk(whR(iv>ZDjx^~V
zX^|2L3B`i+UPQWrl+Z#)2mt|U(nLasARQ7Q6q7(`_lfUU&becp_nyCZjPH+1#)v%6
z-gD12*IaAwExjDis3O_KRKT<|Anhm{THcvdZ$ZuIX5}(q#B8B<AhXZ^y?Nxx++)_E
zpRi+iaawl6amP}HenHy6bbwJQX>iZ^O6;7;#;>2zbGWRXj3t>-r8*hE?ZKt3PEJyI
zL+P5O)#R~IN~8SWxfHL?t#SR8JY+agl81^t5bJj?=fVBMXpvO#MwEHD>Miro)DEp8
zDmtT;yFUlS%@^0ZX&@5`K+WjkyAJEgv*&!iFeGtRNnrh%Uw74h70EsWdb{oVYAAvs
zX6G#`%>7IAbIevC??8fzAN>hs)fA}&$oRIf^M?*a8&WV=)Uy}W*@pWrZw0!~GL2<U
zuoEwTAA0Oq1-Z<<{oRD_4vn1zX;*liOX^6Jqp@j^z}T5ay{;d^3EgaYEbuj)r9Ez}
zQe>J>5xSV%cfn#eXDOVwUm{k1yL<rScCC44;@GwRR{h_Fa-ipk_0-5`02Z4P5ka$H
z-+L+JDOW6)SeR1JK5o8;7T#ET7vBvF-!Bxki%e`Yfr+UEJ*;_j?H83CLc+a^4X883
zg)l}qvdE7`Iw@-YbOGP~k+HZiEg)#9CCF;&@esnHc1J;ZH+iXbzUDK$M?fx|(`~GT
z>)OjpNCV<UUZ7CXoSh)}W~lWgg)pMEEqN^5p#}}(jLsb7`RN@UEOYudz4Wb0V%z4f
zX7VrrV=_L}_c~QPMGdxZxn^5{_rpH%T6V-c^=BydZQd$U*}8STAX8|X&*!owc{@ca
zl#bnf1BvH2J~I;76MU?}o5%cj`3B$&+&qbU2xyxPiHQ1~G4^wAAzwHXC7+bbIaY1_
zps^MM%&E+@2Y=<n!la!dCR*FFdwO9wrCVdzb(VKNv3LfR7i$HQ^EWwt9n3#sN-x#X
z7S{Q60F59NwcP)5GW{V{Ncn}dNo^_>k6{lG`~gTExmYh(U+uYbjV0HtpV#LHn5eJ*
z%8t2H()<f1LoNqeLzAIWJ-3>ZBJCUgVIqo`<!gvCl%_h?wtVwTN55cvRa!89=ctW0
zMpEhbUV56>a+b3qAza%o1teCevc>aTV8lIF*Z<H9<V3mla_L*RYT6KyiE5)|XkYuW
zPul<7D?%Boms^+0%O36z<!R)OQKanE(FUg=YqQ);<ZLF5R1?Ccm<LFyLmxo7yx0i&
z+B59F(oVmgKbZEtz&cPn_%y)H)=Ac(J!<Rs#8<8j<NhmackM-@>n%8Y=f>4%K2@3Q
z(Xd?~<U6HO@{WpWM%&|=*20&37nSudaVGoW0X08=VNTO8F_7kdZ-Ys5cQS7RUw1cT
z8rOdLAUtV8GVAulyE>2N(oCMA&Dt=YtpG)X7>^$kN{3&)(n%Q&`F^{fLer=>ni1c7
zGP<3w41B8on&Bn^+*~g6vvDC$bjOHM>E$u%=-qex8d2$joiNkiqhmkz)xFCT*&_E?
z+JSxmpGKE3V^zETXa*Km!M-zW)ehfFSsHb3_~=Gb_nx+XS$nas9p6q9{pcsZ<;m|+
zx&(jWSFt@b9TqP{kMezil=^-{b65qf`>nFZCF0PHleg&aHJ$SQp{lVT(bmMVx{%bG
zg1)U)>mSLKUy(g_Z}uG5kow6UJa6UAQ$X{0fwwHP<GPsoLUNsum2^op?AGl0xo7*!
zwol~JrCuzcuT6o8Pj>3?fv+vetJ(pTe%Q6~l61|p!+e-vi}nd%6wG&7-Tf`R4#o%E
zwX);~GXf7Pe3s$5W*!a_27gzu5Rv?gHNU;MQU~-e2O3PV_f2)*<AEO56w<!{92R<3
zm(;jHoqlVHoA->rN&~fs-h}$*TVt|X6%)Fq{mE?*OvKXAZIq$vsZk+PL4}Kd>X6UZ
ztLiPKL>5brTd3$unS1e6Lyy#2&1JJl0vAmaH6qv0i-ihHVV({$R(fl3htHk~-udN5
z8b2XgR`<!HL3qp}W6HWbsk+V|QYZJxr%SH<+{yc}H`FK8<F9juSO*`B-!R_|G*0i8
zFPO?liF+yU$9R0ec5O>nRkxVc9uEdcN!BR@8UU9q$4Zc<VFOOVVEQ86Mv?mO;7R8z
zoU-19eih~h{=dGyUTUGnld^R&iUNX+Xz#x(eq4GT8T<+?4B%x3C<-8Dez9C1t_#<C
zQY&uznmli=A<H*?AN_T9B`IXsM>NGk!WyU)s-`YnZt{W*^H!bque<X-9_=7+M;m_U
zVa5|!s1zzai7B(AdL|TQ()&Q!OLaQ`ME?t^SX!r&#k$7>F3dB^vVk{eYd<Eby}7r~
zKNs@0BthE0kE1w!)n(;_X^<ihZ^>ne=Lu9NHb406J7WTGvF%@wD^`;=*%*Iky=l&i
zco9f!Ste^=J&H2d^xv4OfBCWn=6pr;oLBE~Elaz|QpJ2{I%_uRVCi7btM3uL!irR%
zv54&d)HC>(hx76-W4Va({?OISEbYE~f_COOt_A~1ktK}+>o+P}dbTlb-hGA9k9e%>
zWWQ_=v8b5IOu>cS9P6TQ$qVOr$WldsZ(r(3eWQ@yOOX8_eZBleMt!|H)sk&GV5uKA
zguj6FK$dk(ytaC(#8qE@y}4!xs0>^o31Qr+|BLO9$Qa$`^hismTTW2f;9=L$y5pPo
zB#QBFO{u)s0H=_*^H68boSQJam%Ii@jA}nLe2n|BjknAxaAikof0cyU*<1RS8(Zn^
zVUP>)`0N)t>3Rhj=1)aP)K(mnC$DfFb@OG1t33W6c4ht5S|s9rYNQ>AvSPs2f+4{O
zBay01W?bCwPC*tWw?}r36_0@9n#y#C43I!+41x;IXU$v`1a4Wids)-au|4+Db!zSu
zGDsGAc1nPK>CH))0{5IV!Pts{dE9a<FwNsJ-)yHhs&%PUea@jrO52)cKYW@o=8j%o
z{Y81voi(A#*&6^~gbsz#Y4Juf4H_&IQH_nS9;vMp8>8~a+iOf(+>V1|MDU#6Gfxjl
zc)!4%mAyx%hg~mhiganig>kj4?IMTi?oE01SZp!tsF0$^oUXY^<D!=U>F?;WT#Bkh
z5HLYzfqdF!J!0;(q-&>n^P9;x0Z}9NfQabr2@_mjsrHV3V3Y#Rnh=y)FRU|d2d@75
z-RXUMb4-k^E(CHjEK%8icTEli5#Yb<z&C4@cEK{DbvKG{kzdV!=7I1)Em!>+yNB~2
zWgvs8Y(9Ijd2pANqc?BHtJ^w+qAGR15+^csst%}juAC_0&?yn(=a7j}c(%RpgsF*h
zgicJfpv3&C7o8d_JD5%G*WQa-@*Dmir-<toQ`+(#)qCChpx>Hvom!dBioPUsRPJPb
zvC5Xu7rMrc9No1yKZSfa9~}aBF@n~`d#KMi|1AcTtyHN>UI62<1vIMS$eaqA)WIF!
zf_*T?qZhp|vZ>6~sx`H=nc+(vPF|22yv@N$qj7Uq&br>y>$ws8y&i$Z#0g36@a!6?
zLeMYF*`JD*&Y(-~4If>X2fqC7L{d48^|vK`n)JhN(7y6kt@RA8lt!$Hc6jXzuCWTF
z>FGIUjn~V<LQQmwZQW7(7%HLx>5j3WB3<_t<j0e)V=E}C2Bq6~eLsumDfc_yj1CL(
znT5U;nF5tIC64)x86=Li1BFoCu@*O@Xd9#RoR8KwvgQ49WW1KDk8uKyxc@f?ynlle
z7<1!33LNG0F}i}J3!lzs;a=VHF_>)@F>bg~bKxmaxL)A%DSj(RDAE0vob^|d0r~cS
zB^hRjx8ZM3roYd6#h-qzw@othC4S$VacJ}XR{y6;t#7fCu#pRN(qYrsl0!TCj31j|
z+?P^=%aJ=Q1*6*o1HW_YSM3abc1?c;9Q_zX-!|PJM_>0_*T;b##kLr<;qR)iCkfU@
zFJ^AW{5Y?=#z|>@HM%}v^tO4ySO&Sjw%CV|hq`%9&KvCkCrtZ&uE%3w=W4(JJK(}5
zParAm031mT%7V2;_q{$%eW0q7Eemc{OdzWTun}VV>stTT_T8p38*OvvDTbB09j~*r
zBao9ME;F2j^KBvvlX;s><zU$Uy|NRUtp%&J=Wn3((!P-vN&cZ{>61c$ey#<v`GqB0
z$K(^XL(nZ3{M>smC8;R;t(=Nfv5d-7;Qr~%SC@S*ijK&%F*2qt^jNI`!8RE}oWK6V
zb?=&#hOJVCY3pT`B8j?Y$-+d}m#={a=2?lH_Mz~^=;}yUi}SCjY09gH08f8whr2k(
zJ8=`m$gHJbZRIsjpZz7rj|6u~BaIzTuLCDx_Z^a^Co>?w2m3OOAUe5UPL1&B`vSVW
zo&$)b^&2vyQk~g{Ya#^REa{;P1z4>Ir)I#>!5Nqs(hAxnS0?v&%yQ$@e*7z(-B_O;
z7*S(%oTq!R<MVjy<R}dswaCJqt7!c7_F7{|$6C>AhiK8V>I=>_<J)C--{IVxMEc^T
zH5|_a9`C4BenYEkHT$`DK4*qn1zs#%w$0)R_gNi-@IRMT6#e0B$be|t3OSu)Qztv7
zeeG39(`fHeD`1CdAp+uJPT0xTTT#3$mQ0-s8CARk5?N|&u);6PjW(*zJ!Aqc%Jt4q
zUyTO1%7zJ0;wuKc4s8v2%QG2*m@iuB^<Hr%5f=_c-!FSp`l@N#&)@EHIhMI@RP0Yp
z8GNHx*!`O2pIO4vp7Bl?XCV>6zq$#uxNXf3xR=TJ0NWYq#fAQ-eN2DZ9sl}s?Cxty
zGN6?uJx&Q#efmDHmo27&0{-Pal<O7JQ+Z0}m`pqtER&vKt2n#;sV(%dQ=hcF()72c
z(?9!g!oDt1O?9eg!?66v;msR~LE71h(-{@V_)wsYOiuQ~ex7b)uIE*izY~-H?!C3*
zWYo!psPd{t&#}KYy#BY!>R<NsYqe9(SF~?EcX-3n-t#hv>3{jHJ{q6~BhzNWf#%D4
zr<VBdhxl6x_ql%`c((gKHz_0N^zQP%p5kx+@!|GIm95)3_B_C^q*e9%Uw&&W;}uJL
zx_HLogXlSv4-#ts%Q2*;0-o)p9TU)Z^q)bz{GUPmZ|mVdNc?ZB=s(N(zw*}W|8U}e
z8;<`3mj4<Ht^Pj>EX1d|yJ@zg5}h&ZE@chaqNSC=+`f3O6e((Y_NmKf{vEd=JeQ<{
zHvGMaYl(fS;*M#Z9Iz4@k2z(p?Qh+V4_B*P(6Gw!LJ8e}vWC^^Q&3CEi`w{}eC8J+
z|CC5y9jJ&qFfpK7C0AEvgtyP#jmR~UkitN0y@1PWq*O(k{eAk=`2O9*^z^dy{z78k
zX?pn|Q!qTLkI^y9`1|_fMOA#aNYPN9-9Nm9UkThFN%oq#B>R*#qM`La1o6wkOJkz=
zZXn7Jz8?p+N6&JprZF}CdcV}MtN_wk9MV>rHuD*`j~+Vo_gXbcd+(_Bh#j3+R9eko
zp2<BecMARZ?AQ*tqzn#~(fYlZEV~(Ho?GIU3}tRF(;X494AL}TbE!-%KzF+W4HRxD
zJx;+2AdSWi_c$lX0y}DDzE6D8qgJJ));;LZx`cjsY(Vs!U`=P1(bIvt-HBv9(XI03
z7yGin9ppInW%y_1IcXw>56r-h96rK9$PG-cSkP5%WZ}T#*JFAP`5$c3FMk~2iPkVA
zDGQb+hi@zfj7pObkr(VRZOLt(PNnOI^|hos+LOl(UM|%WndK~a*AClh{V!W1Zc@23
z!S9pZXozBLIZ!z4BYJeCxf$z%6F?DY30wW>e%wdJenG+(Tg*oJT+3d15u&umab-Xh
zoYMxCIYqtp5siFD9)-tBR1)5mOunG9VneD(6=vW0@-+*7q!3q{DKkC5^{lwW?g~=H
zMDCHxRKILcM%_od7Rj&uF7^*ieku$kZ;Z$Uq2Cd65FWmn!Qrm5x+g*dY=(vkR?2i|
z&<URdvtK^v49{H}60KSeO2=D>sAWJI5p4Ye%-dPLa7@a*zOj8VOp5gMfK;u%2@KD=
z-bljD9oj)0aBkI3yzA^IvA0gI?LFUl@+mMUPjbG8AN=bw@HCSG1hEKU=FFRp(ttzW
z8O<gPq_B3EeWELCE#R@qlwuqKYkyBY6W+JWX1}fjf6GPr%pTijs<w>oY*N`uo+z&4
zl$1B*1b>1|M(c?VmM`<;MJLFRfa{2qCop}{L0zoIx{o{w+KIFH@x?-ZJx4L+^zjUc
z0zL;`R}&zcYnts~O=D`_<z@v=YlFNTH+^z^yS_iYPq=OR>*4Q2MM4PKPrNVjf{%&R
zlb3CILj+wTorj)HJ>V@H**u7u1)P3h?B4f@#_hSP@Fj%-<~+J38=$3XbO?;)Vc0(f
zd+vgrXpgKzxs`v0+m`9^?o`Z6-CR)0vnGga=!#YVPYjZr98TFt*CalM1T27CS9kqF
z){fA-^2@mS#vJtIgg%&E`sGI%@0Ga2=ELt7Nbz#nKuI-ye**<_UVR)OPs-}unyxbS
zFOms=On_PE#CMBxsJj7!W(d~Fe#{jgr9v2gD_wa3Jby<*vhKO=S_b)gyGUV>n|;}E
zEPMW>m(eG!4!D%lz^9<nZ<seB%8zz2ehaA6qT_AkpZ4gUUF8#Os_L1y-=IPaL$b?a
z8{Tx7T#nNP*48?0smJ7GHpXj!!|Tzto&Jswyz-xA89x0qKMcIM9ADDqkd<(ws=`r#
zwO_Q3wp=h}AfxG>Bjc@sl5EB+@X~h8oMh=7@`zkE`mT`|jTeXLPS981l^@n9(ez01
z)a4n`UD8FOG{JcPnCBPDvm{+HC-F+HvkLv&ayMu+BlaReKReK<gUesN&iA}bkn&ex
z`7hn`3*=YOjfq+Q?{mTXkGYuhWf-!MO094`+($GeT_lJB-F1_r7e=-lbPks5g0j{f
z5LrPLBo%n#3eZ#u?PBFwGhQBk8hn_y2c0KNBlrll#Agcoi@x?i&Xx&(7lW_VJ@}b|
zl4yt+Q<&Yhasz+Lsr?ngL~UkEz1ZjUV^t~_QXF*GVNp+=eYcH6e`!0G9-E2Cq(;t5
zojz?kTG0U6NpQ}%qTLZiflZ3iaXMOc+AhTi3;0Nsl~89n^Gxd=*fUUHxYM{mv7hxh
zvFTfU9~LxI9V|Zrmny+T!oY;(na^8GLI{}d@WBU<!#y&DF+y*-Q7U)G%fu%i#^}Gh
zc@vqF=XM=g9H~U;))r>9%Z5CiN!+XE;fTs`31nP$GacJFCs#*o{wdBrFDIN`s;;x9
zwH_1nvzkWn!J6SDxv==N$6@e9xE^&&xubJotgrjVK{D30Gqqd(Azs;Wq-G*coUGCY
z4JA}~J#DaBM29|IdqWN_?jwW>qq-dYpIwMKDg9K<CxjseK6YktHB17F<I+*P@S5g>
zfqw;Ox%l(dz&-NMj3;3p6xKcr$yLN#FKt^$1WA^U>SOKh`8*hZ6+bZ%zRFgBY5iT8
z#f%L9EcN3yBQ}Cz>Dxzi`UFmXrX+<dz88=x_joJBG<H_R5Ip(fDy^K;F1yJ@p{AQf
z=pzi$FE|*|21B=8rc~kfK|2duo%8O`<mi1mL1)j_mf3>0kRi|JKNqI_0r>WEP$Ic7
zeQjGklZ_HxMsP%2`geG~RzIj{@j4FO>G!AypuS3z!}aF6M;tgbt0BG})j*zvuFs?z
z@*$`*3KBLR8|>J25IVtmU>gL+$fU*nC=j(ypoClBYH^=ozQEyP%V9IvG`OmGt~>6`
z*n@rTTk>CQE`r4T23t&>#hZLtu$3jks85<Gw%Ba{xgcd7%OZ5AG?554rUxe_mptb{
z_fXK{<Cmu>Zwq)jGBaa-d0H_PMB$QUjl(G{tL=i-Ao)6LJL>3<HttBVi)TGR{lQ!)
z0i-wMgXK2*6CFL=W}+6eRF@TJF8Lyo$YHV50w760OlJ(ZF;E__nisQ0o*UiYjE%6z
zm;q>tWs_Okl0W$IsBfJU8K9K&T&~~<Ce{gCXEkM{rdW4b5@Of^g0gLb<DDcOSdO{*
zwaj1@Z;OCh$Mv8W^Y?0e^+4bN1=^0A=pIO6BvjAdK}X<>5b>0Hz?W8lq)P3|5TbT!
zJ{5YRJLh8@4{bhtWnEE*U@pYb5wwJC8%Cv(X~}VIk0?7%l4o<sLS}ZRA2N{fE2yiz
z-~B$8B~-qjA5$QSPwT~!bWALHprY|V%^BvUi5lFqsY64I)%~7g<|@1lB$|is854@^
z^<Gwy2%5U;3<a3fi6)CHJ)BlDPWT?+nDQ`ftX`0%<YNpwwYXQs+ihfS<+l3OE1)&g
zHPon1iha6bRHJ4ln>KOTN_8<te|ZD<hbw)?%dmA^w5dzj+_D7Xdr|)s^2<n|613=V
zyPOP_p#;EEBdirSW%?9K;fXuipDCS1_rQH}L5s$FT<D%ZKrBDf#7=6V79#W<fmba%
zB8+}7gC{;g!egDd^Auxj>n27z{e%zuo&L;HrjaFlBXXZYQg|m-!02xr6TK~ECFak-
z)|AS2lp`ZwzcAw(e`%-O7lBr_TdUl*`<|}3#=<>8OqLA`rpT$9KNzp*<StEX7=cw_
zCdpE85DGd}RW(f}H8oXZ&=v)O{+s!>2Ypuojr5QByOS2Q^BA>*<^6f2gT2kVW(fB+
zgEt$<o71vj&m(+SaRJUq%UU*hNa~^9w&!t5Y06Jg?je%hs-UT}R}6C}CcMLRSTg%D
z_hp3S4_Lyi*^a0sX!1=Um(N(Ct6<Bz7WURT!e_~OM%jWUYt*v{27hW<U2SOKp$k0E
zz`_B)n7Gq()|yR@5A6Qw$TR1rytQU7Sx?SX>g3B%^ITT6_H{EWrX=#gZ<9Z9yhi<o
zN`*^OjktHKFrF~>5iM5{wQAvLH<+$BpBmk<4YWF``%WTa&2$+w+&XwA)FIH*V$-VW
zSsa<owB`wz`*3=uF+l=NqLZ4No0vjnn{|k4vW8C%T2;k?vs@eI(Pu--TGtD-tYvIc
zyY!NJ82^33=+-_W2*Mq!L|iQ7iK}z+#GHFg8E|kW)Q?BmHumZBd*H2s;D%k8=`jzX
z)Ci>Rh$P?x0$!ltD6PZY4<zKRetosATGl*^9P8zpeG(D7N3oF0D&E+nZyASID<#Qx
zpG6vA*+&n}IKhke&{r++KWC!zYGDCWku%9~-3+DB$XIuzZbo3WHAMGUpChmV-0_fl
zb#4){9w+<qmAN67mcGe4pb;*>Kj?#4Y$$Xr^mu=`V_YQ4-g$a{tOv(K*qY;TeEb)G
zNFlPxn_&Q?`$jtl6ZCjHDI-ddHDn@ue$Hv{dIl^;P0^lc6aw@?UtUk2cVBKLLn<Y2
zrxTJfP*%D{ZcD#w!Q{!(JpNh4d-Uq?w_L^IukW{F-|^>Rd@M8@-TJ|th&EAf(RZ<*
zHkx_8mS4<IS`|;8NJm#sUMS`j2JuFtHoNNfh|N}Ya!&JXQXY2-2QnVh=z-+25U~y0
zEI->ku8)&Z-Q<Y|L;6MFIGdeH??)&rk7d!aM6M`X>S>!~fXQEM65a{H+J0^BCo?aS
zw*^h=bP4EC#<f%|=lfcpC2yrzozjsKA&)SHnCHo}lJHnp)gAb)6sU$<WVKqrl6xW`
zG8g!0@&RzFzX{y)ZcQGl+U@dY&Qol(W<oRF&nzr8*Ia&S7urS}E0DUTk|@h>^^CvE
zg2^>Y_j)O>LRN7PN)$O4L5$rMsUg{yVP1)oKyR;h4(}Il%ATrct3Wa5(&gBuBtuID
zj$f(~CrdIPRZqLri(r|ZGZuLW?#BlpJ<emHuF;+q%!qb?x#W8~zm%kUw$7{qbk9Fh
zAyD*)DzoW>%-$9tn9<ebml67B?l??8(ae-@dP^SFKbDt4X%CV0kRtdzhuG1X5vFEL
zUbH%vZ&feVy^Wr*6>|<|<`?wCb6mv&w>w3^e@F9KEDM!ZIHX6<vAQ>Y@*D55+^F(Q
z4@{|BWunGJovkS_dFtUL&au6$CL6Uz#&`#`F<ta@&DQA5&hYygQL|&^TMJW!$A(c<
zv?2Vju)DOJExQ>8tcuKkWpN|u_Q-&Mq>8Ke!1>EkHK87oaF84!U&h@qXg{BOH$z{v
z%2%IrPzS5&)?vG-$vohTo*d~;e<tVLQ^;#@Yn?t%v9iTI8QOWTj7gj6ZOmx<UR3g^
z-_hlth@D>#NKd;34}S0hr(rEM!SFcFCZ~-8e7BS97Hz1W4iJG2?28$wkihmMPJhW3
zhTqF+9iO9BCFf5s#=Gy-9aw~j$>!0WEx+*HD@I$qD23exZ$eF|0pIQK{YW+Q`WiMT
z>sbKmy`kTDIYx&`PSOBt#|Aqo%$ueuSTvA5uvTqxNM*(06Ro$*LKqGH#L;SHx_eh@
ze!L>Vgfc2ob0Lq$#P7*wFWL5sJ?tBj;edS|qJ0u)mAqkWQ5B_Q_YRdcqU_L?=Nx~*
zo!HdGFQ7K3Xx)_$w$T?wgce_4wa(XEaVEHbE(Tqtlgr)sZZj(6Q}=W=V7zEM^T}D4
zZBWLhT*W5l%XARDPw?53#!RNQ>6!GhfyyP13cX6#&csg3)$rRac=<8*x<Hr|mg^Kn
zni^p3DM=-AZ?Aw(o+34t`N3kWz$d1Nd*BKXE;p*Q5H7CJ3|EM%QVW=bOZ9nFktb&q
zsItAV_C$9q7mGRy-Ulf;aDOND44ABXXmbUWBQNV2g~G^Pe<;i-*Ln!f`0x4J+az-e
zOfOPkM>kam1(`<AwW-EP)M215UYkE2WCyv6(@C+4imezvo$2yBR(s7GYTN@VgTtOn
zse9zM4-rg=-H|6xPHydXzh_F8ZJ*z6@C(qFS$8|cp^ap-^^=!k5&BA5`JBh-&hwNE
zM@$_BX#>{Ec1{#~GmYASem7mQuScwG_&ZA85ZWO7FTS-nh8(rU+$-bM&ahlNEJWY6
z;M{L8z;>a=7sdkhnyPjW>Ua9w>ZV8J!Nj#db&yyJAe4NYTJbe&is`-8aw)~U`XG9i
zcp-qvl(H%YyY1d*e0_8=d+c$Zh3T)EHd@wL3FD{gg_|5AQLcv;6=k(qFD*<bvsI9+
z?{!7Tfpp^>;SZPHRzJ7)Muo7q!(3^n)WL!k8f8M<Nd6@g^=u}W?wSpgH{s5jmen)F
z9-j~{THMy*E9Sd3>SfC)E%$*&DFP%weM+1jn8ox#7O4=?BGH<@fPQx16k*HFumWZl
zZu#|oZG3%Zm46l4*!(BkphQcQ=1s;k8f+X2*?Cb+>;-gUEgS|tUu{iMoL@8G3-ktS
zZiO(*CB>~pJ&5Jf?j~?)xjcO+>3iJcx(7bY*}0RwKk=g`WwEkP8#Kyrkkqn){w#zz
zpU1>j_%bg?U2a6@B6tV5-*93Q@Hr6PiUk6FoR$TF@>`Iv90CLnDhdRn^h7b`K-4*a
zU7b|O4(>F8W~uuaqatBwHK8@X2}R41VYSbPpU`TOl%&q;>I4;_-#rc?a|bqfRX{A6
ziGqViRaJ-u8`wXZY2^S^tZTNv71GA*yKf((fNhiZ(IMS#O;oe+rSeeupwl_UbT>;r
zHP$>=oWa!TJYkj&rjeQ+<cWY+Rnv!+H^vM<R)CM#SJV+e%}x9)ICQKw@ib9K3Ld*7
z`@5n09AWM>@Z3G=QM-Lt{00mf*MWr7Y0R&$c{~T>M__yr#0Rb&U%&y9Q7@=?Kex=!
zL<baoc3>!$bjP;}wy_^UKhD`~9>obZ-p_KC<gaztUB8c4>&&*rAjhSNdE4x*jkTLF
z-~@@ma^+CGn`3q~IXpwk&}QJ7C8AVVduF~v2>fYLIdp6tZr{-4&3y8DXPIt-`6HS(
zJqmV84Mbn-oC3TWucR7gdzsMk3+e%Z<XeQxUp~K6R^hnWqQ6vA@{^q~B6MMEv|jc0
zh|K`{dvNZm_yBLJ{fej4={zknD+HQXBZs@D=5Y0k4OF_f`U!04P@1R(EbVi!{8~h;
z`5uIMxVp^o=YHi)!$4jKgj8U&74>3rVF~{rswxx^Xlj0q9)O?aYa~jzd>I(vo=K-Q
zLl<oI#e@L6c8-+l4hpg2=J0NZlL$~mhb&<}@$i)bS`$0pNQZJ4dx+YlSOVL~q~U#k
z3y|Pd5K<R=o5jcC5LYaBxwtdHMIYZt{<DB5UAHN}58ga{s5{yyR9L6-){*$&`uGUS
zypdNw7h>utx`m8Z*}AHVaB>frXAQVrmr9!Jh-9s(=wZP;3vHhG^}s-{(Tfd6dR`VO
zH309>u5AoM^Ml=+kI3Y%($7yvEF<m)Wsr?u1479h-#6xtE1>i201SaLBhKQd>WAr0
z-M$Ar!3PD^Yi_KnlJImXOE6gP3|l!#r4u*MOp}Z8KSWn3VY$*9mngXCAS^53V|BBP
zx_Hn%xL=!utkD3p!^HNH;tLiMyO8SoVKj0YxJGnR-eZX-D5&|E7pm<ud+JgnR1)o+
z&LrnP^{_Q&@;Jnf7<d2pN?v$sU;Xkk%KzNBVGVwjT?(94-O6!+Fv)!3!_;0Rj%|Z*
zW#Jl4@VES-O+xjMzls8Kjfd^ihRJK_H_4)`P3aa9C(=}nEJvpHj;`^wXvU&p8A0{s
z^sO;lyV<M<YpDRwQi-hgDpyj86O0-rKR0Ro){94ZFxUZLNZ9OM)F5GmXS*ahy>b|w
znKQ#y7=vBYUOI<D{oUKzU^<rS;ZWvI3w}aOQ7K_)9o(`+SXp}um=Yh~Blgc>BaeWj
zUkUco*7On!vZRgFKZGcNI67M6EqcHvSLK_y7PpkkD4}$H)Y6i(J~>HNCI(O!(`Imb
zZNO7B>lY=;=V>`m_CgjU%YF!_%n?G-Fr_+Qi|AX#JySe7y0T>mWeeG=taD=<FF7L4
zWCOF)?$ghUS;j&R5B6mZvF51kC;g)FB-H@B#L+Jz*wmk2jvAK_?|$DoKOPMAYrJTQ
z-(zQX7I*Ut%3fQd@Ql|;ZONq5mFAUpQD^stJ%{Z2N$+~r^s17!KAEYgw!ZNW8+j%_
zDci*c$Y$R6w^4vIl2`lZ6~Je>Ck^3=e^SFG^#DjKfb)L9C6NT$Lh6qE^{F{1bl9_E
zoQX~mh-dEPaMm<O`t3Xf5=h{^7d0<Pg7i9)$C2<9Cq6JBSu3`e-brzlqO$*jmM)Vz
zYMy1(GNPKZvlC~d)ai_1GgOCImK%ZVV`aQKOLyv#c=wInUUpcriop~U3PM&GcMY94
zt*hhj%gq!EDqD{M-I+|(v=h(btJhGf68CzLr)Xxwgl?|ABULH|k5sWQ5^{{ChEbEw
zgSYUC7IIvZKhO89-Cf1qhOK>M;}-<G&qjqR_sr7Z1}s6(omIi&u_w^4fQL7K<kI>Z
zyA=;5eqgPvTs>;Et&^=yxT?<riz-nk4eclI7>@8Aeb!C2!pF~xhh^OtGR~8GKPr?i
z1b2R@x!~QFN2Davwxb5g;xehw)G(Bu<gY?KUO*`gDMoW46}s$r)y=8eMEDS-rq&HY
zvwJ$Dvxev}$^J~qI;Y+4Ap?dnCCH<P>*PB-KpDzqmJMWa2W0Za)}bBzWAtW-I0TS&
zyh(5?MtA-(WxN1W#`>S~2w*YOpeFcfdI}oty-T#PPm{Z%Z0T$AML1F(i9U_d5mlt*
zPX}5jCoMvIFM^Yj#@RYC(R#dt<vZW;hLCq|>szv0jZ%cmsLy+{6ibpj8YlXAB6dDw
zfTf1rEiagK24*l?JCg_pI#<Mz{=hMkOPZFu@A@w9hpE(6_=4xVvmj&k7wL2MKxKaM
zkHc$W!lMR(gOOEiLEDRJ5Hm^&nvRyjx4UPO;V*Y~nh(icSMxBGx2yDN2*lc+p?DR4
z@*3c++S2J%oUv(jN?VOddb~&F%c~hu>F9S1FM?JenR`;!8IBl#n>uy#eI!QmDYmND
z?G?1+9(uID4HNr)K6a`wWy^}*lGKAZhC~v6wVdv|YGgK;5wP98q!h6E*5`);=f<)r
zUI94sG6QydO#;SngU{!IjPF4tX0qw-i)GJz250SR9V4RhnBg{TgyCXOK5l_C#D3al
z@#df>1S9sDkmvJEYUAOFekox4FN&(e;?bjBPw7@2ZD&W^`Hik3bCvslEP&f@GIggs
z0WzW^xfDjOz!?M(R7;fk8%eUKwH^S1O0N6EfuYoJ@VolGDIptsAioPhTU2*BG-|<9
z493n7XdX$HO4XdE!v{d5bH;X9q7%n`l4OlARfPCmoyk#EQ>15A_uiCN0HX!mH-8DZ
z5$yc?VS{$2#eFeg)0Mjw51WrkC_c3ydv-{b;ZNRO5;5D>trXB<vb{U?#~A>;;lug8
z5`8I-aq2Nb!y(|876NC>06NwC@Lz&8^N(OHvj}1j87|E)^V??}c*+l+qlaZ}L(TMg
z<B6d$qvInfM;l=~z0y9#=o+cz#1-y54B)hzEJ@y1n2%WAMBY{*W><=KM?snCiJM?0
zbmtCBM4fTnArf#cZ84@*@7=Fhdab1`-9rSF4ve~eIm%BD^s28BD`pR+*4*p6tqm;=
z;Y}X{Fk@IyPkcirKjg#Gacy8S$Pm2;TX7Rn2m}tTYQ6&T#@b(_WD`w+*tXLYU@7Ej
z8B&NiRGpoTlBK$<!Wr?D)v~L3bswbOhDCib(szU;w(ltKH{7w1GH5vo3vx13LU?%u
zd~%N=CCd^W1ME^p1KAt>GJJCr8UJ|}z|UXsqdk$5={^*EnVEDq6gaz9>EILnJznjM
zDNQ{W6}6c}&E{v57zh0{vX{bmoc;2oKj%kHAMJh#dQFHmlLT6Id??z4<vri0R@l^?
z%3THQ*SkIs4lNwYGB2&&$%J-u0B0wCSAQk!^hAO+t5aYfYHaDlJY=+=oY_$3u0v7|
zKq&{@)D0Nlkty+&M}DXJ8QiD<R7(^HezC~}528wCH(Qa$ouayw8(D(Wx}ZL>houF|
zHh}XT@Fs437*|kGyQeYbs>i9@?aj>npwSwU1XaC<u0IB>#Wyh{?R&HnO^Rh&E~G%K
zmuW*o9OLgau5mVfm`Neb=+kGn_}%^(nQJ;}z38)z=ba?4H3z11$2L1H>wt<}3QSSu
zO-+~H)D2pHo1Xk^A^nX*s$v8l+wfy+7u_R7apVII(V^57s6o{;OFDpwp-YyPenW|(
zF?zfh3TF{lD(u&g^(+(%JWaL@9|g&BvSjMO<qJTp@buBRWw1z@D7tT}Nw4#$BzA3k
z0%42wwPT~t!e--JC#I*;q4MrK3c&t!q)cZYur1Ei;^otwH%v`G9Pu1Cyg;s!OSUQZ
z<oAN9ndplW<}&BUCXKK+7%1Qw);azS9AyI4mm@X?8vy<`ZxEJSj`FZe6mz=~+I=;z
z|1Sc2?n^1CcmWbIXIEo=Ge43!9UU2KpA6lK05Uo$ULZIc7s9kqB^cH`tsL9sd&dq@
z&>h0OUyuMG$rmXCNpBQ70MuQgD>=g@3oI;1-vRP6wE&#(pTIeSh4njC*=`#RJ7tTf
zg;wH8b}{gMquNOmIaIspxM%r_Jhx+#*MK}oTe4{VuGKNCq`R*UKjG4OSUwpAa%uC%
zo?rw{u}Dg`tNjQt7*L60ACamNqB^%+wOp<$0Ljr>vPOIgcI5YYkV_Www@Z(0t;9%+
zJDgoBWgCf&y<AGGs(_h)PKaKZqc`ArW~#K|C_w1X*r-Y^dU*iRyiN4g7G#XcACS*p
z(0;aN@0}BveJ4EU+PLV`_08R#`iu0j8yx9PU-wErKMb%7Q7HO!L?n3h@AN(&xR%^*
zm+u9YK@Z!X=J=xdOVe3p2XVXyomOS%Q1su;fm$w=e_>h1eC_mKtMojzcKCM7&9-9b
zX@qZ#Eyxo7_6cPT8$LRmy?o!CyZv-$MapPe0|XM~_yE;QkuUBRfZf?woMHylY~4DR
z0VM_oocKivpynkQF@W|N&|Du97pKUYNnLEa98sQt5G`{Jn)l`Zv>^kogo2V}!(%c>
zYb~(KaH*O}4|%+HUcV&LKLDL<gnf?R3mHc061fJK0JUtfN8kkY;3R{L@>RCBmj!Vi
z<0@N2eZ>~Qah(&mvK^4hbVzLh^S+X(BHTfLBJlx-Kc(NGx<3Jh)LR}MZsK<um^KdF
zFAl_V*#dQ>4X7v`vNT(^i}_D7TBffQ?<a2s#PmP*+S2Yh0&sL2CEdG<$><w$ubK7o
z_krbV<=6n|TC#7{lE*LkGq{!MIm%^|OK!3L^4EG{c0APuyBpidSplz8F=4ehZtDs}
zs-hn3<*^__$4WV>V`UoWB6`w8IiZF1hqjzmo>N{EfsO6>ZvPP1MXhx@dRhITnCYzA
z<1P9NEI!=RL*J3ILKiHatDv)O8HfXUhP;GpS2}xbW#(Hjttc=SH>{0nxkyM*_=7%K
znqX8&!u6*Wj@a@h&k?s;X$$d>LH&;FEb6<d&n+#x_=9{L&RU>qYY-m0y|9JCQFW4T
zz>;ER-z=N2?!oKV)O1z=hr?*ZBxXaP2fs1f;r6=I!OykBzd5g^s-K)pZCcF@&r$Kd
z<zdOmoBw$!aFM6A<@d`EFXCfv*Bw5p!sf<plJOTdF!bJws^D<}kiIg-hFj0XJPM_k
zOqm?bGIz!IO!23wLW*xY${?n+jt&>lg4@5hOyI&|@TMksIqIV9@<r?lm#e_YZx5_3
z4<L<Gf_SV3hNeff*%v}6Qc`6Up4~MxP<Rhq>U-2>Uj`JJ{t{p9S?q2yd)hDRpoGd0
z6om<_fw_`P-hyt?Qm+9{!nnhufW{{4SQoS7qe8*#Gy4g-^WchXTYEPMJ1y7#ItSrw
z%?#_93fsi`?q4{I@#zFOP4o+4WN9VYs0_pQKJr|;^G2dl`duf8&X!G@z!p&dXwu`1
zFJE>!u<J>5&14AJBg5aGqb!_85tAUrhkZ_(<~@xNd@UegP4h9oU3HFmSp4-k|1?Id
zqeDpv?s`(7hjUV<Xx*QBJTP%Zi=d;v>x3oTOuFon3gD*)HYsAi3&uNbSmRaM6*nN}
z%ZDcb*?~BI)^LDh&(bAT3~g|Mfvu?12g{T0Rn|;iN|-Enh_+8lQ#NEo7!#2Qk~y$g
zWU?YIyqRupO*!kL=D1i>s)jbzAqq4%@6;|b<WF+c97hi$Q(!eID|aq(2q;8jtG2p`
zV13bzQ#301$%$%KYxk<f<O#b^#>pY$i3aJyC;#;B^#5R~L!UNuy`VquAYaU)efv!(
zdV{+oNu882kY*p8RseC3q|p6Qu&bVBh-COPK5!)!@}r_PR@rTR%$rVId!XTF)w)xH
zG$EeG=fUJ?n}NfAWfP6_y9Q`8b2YEVc|p_>lXi1~bbQNN+eW~6vJnTW5R+1Wc-N=+
z+f38(T)>!mD8k97X{>pW*~(ui*FIL4)1qQoFm|B-?ewRZ`tQ$|Y(Zt{*SwU7XpvH)
z#QDjgI$tD9()oaXdE+0`l5~Oq%4y*x+@<XJn$`+{h_3R0caT?Lk`hut=SQ9f(ZRnl
z@c5|hd<4+6)aeceVLz}YLnrq<%+cay%0Kbn-v^=I3ODpoiZ!&0!Z-?UjuNCO&0nq#
z$9kT9WaljOByT{LnRC)Y?XlG@hUb=?f_@dbS{)Sl_KY_B1uPiqVHcz+qxGkm27nMD
zN!BD9Ks~zv_~jqhj2$R99%edsmE?<H>_UcN9*DA|gY?qfJ}&U5XUP*$_|gub!@|Js
zMKVTN4+P6NAOXT^RA4_*7h9@35@J~y9DnE&3w`@jhYk^Rz;)sxI4{=AwFqGEx3bv-
z(2?Z6J+I|-QZpXq^R;w5wyq!@a6DPkU}-N7ek|NHdDa{n!1Z4INp59H?^GfbPTvKH
zXxP{ixve(()?{o7j+Rj2_*7l&0w4I-dE`fVl|9t&a>af_wF@yGlum++rL>lmSe{G+
z;n=lPvU04ZC@JmnLs|J)<;?hKP41h9l)TH4=ZTGm_PT{(y%2Qp7CCAZI9~Xj`Hzd7
zRv80tNE@!dV*#OF%?bB@2%XnG8D;7qC^a~Hr+2nQk7@D*Oimpoh|d@RiouF{Whmd8
z<9L$Uw3hi9gj)Tq)NjcdUROrQklS}$GoswFGw8$cNYK|9OTWuaqJnYH?I25%=L=ed
zjbYRk^Vie@-Y1gDZzg@xbw%eXYkCnk)2Qev$Pe}eOfJARKURW)PVuSfjqV*c>=SUK
zq~8Ig-@kuP@rGuc`d;+vg5bG`^MxPJ6@GkEe53H3zzv~@H)XeOg^k`ip92wUI3Lv`
zMB8cBJFGB7k_qr_CXv|>k009w2#AS^i-{Kr6kF^E$sm?Zo4a<|XTFFD<cKi_I^F8L
z(U5sleo!Umf%nci`u-ch&wW<3+7rIl%<b+rCLAq$Q}6J{1Z|~7SOlSI{VUIj{)~4#
zOFo$Gj5;;0y4zot%)KZf?p(<i;g3Y`eUem8iCHTrlVf>1PA<qx)*DI!WkylFiXIfD
zdw?!b=<7&zy}}z^82)a;g6VALS!9>}6O7%aV>$O#nX`kX8~zJxS9%~GcYAE=MIi|n
zfX~)Bkh9eIFMKvYJDHTA5o|-Lx#$D5r<pMj&1!tr!*_W$^6CQggGR#-H{lQ`@vzxw
zqSd7=h^khcnmwx9;VwvMKtpKh0$x^H-0!ODW8{LXLSXloYfVSCZkr#LnT~#@M2Rxl
zcPF$<ZcZv5`#o+0^KdW$7inMpwjyQU;CcxTGaM@|IXHZ0YPl2{Iyoj3mJ7eVYt32D
zGg14gK?G?MM%uHt-<AF5cTmI8H?eXGyy0Q`$}iC5-fqGM+t+k)>)X&%_cu;t?w89=
z@fq&)q~9$1MoXvm7#MMv8xGwOZ1;D^*UY!u^I}hS!a3qaTb`X6^XHHJz(phT>b>Q6
zHviM(7jjz-9IwywU*(HeKFgM>VA_zWD>Pj6OZ$vp;n~vXO%GZJ8hW$y(ek(D)tTy<
zgF!tFosqBFKA3SD)U_+sE9N6Oby0cD5ig3F8#bPXIaHo0W8T#>c-207?Ai2!ggWwn
z(chEso;^#DciFt>6Z(m&JI5*=<e|u;Z82XhNSylVs0ZHZ%a$F*ALYh29(lK))9$Ar
zXWCZk;1?&;W7+}NLx)A@fx~5^tNNfl-_}^@>Ec@(8}j}YZ_MZ?NA-&pk%orPW|G!=
zm7B8?$)7oJv%L!jY*z_w<FfwsWkC2bW|d#sOV*+%K*y$@kFTkCWKTS*Vr|b%3<E`t
zcVOwY7A;Lb_}f+N?AqR&WqrG-=y2`$y2W_+Q$vyEzHzPH+^2H)%T#vb8S81gCz+M1
zAM85V|HR#B7(VEMwD3k6gU-%|f)}nU8>wC}=;^TJmRo<||Ax0IKC%L`t=G@mlXQB!
z_kOnH-R8B=SDHR^@k)zBuBx6?`tzC^dYSUO+P{@<J@Dy5aIO|~(XoqmR0-Lj#2Y1;
zZp+P2B)^}zSK|e*aW(jCXWE(8?l9y%nSada-a8>yb5Pkn*b_Zo<}9L{-*o4l86%4P
zjCI&~A<W~61q*}c#kFtj?&oo$rrCa}g?HX&+&I~O<64BU=ZH<zxXP~IVB!7ypSggc
z-dbuTj&sjEyK<RxHvGKjiTZPT?i{bL9KV+>C?&k!d~0;>w7fzf701I))~2h574CPh
zm{|UV52SrCqc@FTwPUM~5|yw1O&+Kdy2Bdh@ayU0bZx<(Nx<c!(YlZJ3a&GkwjY}W
zepSsgxX~Bl+C`|Se1nz{<_(5`IB+|jeMRy`sqM|If!?{EP2*LWo1JIZPu8={s%kBW
z-3B=x{5U(Co~(v=yJEN_I)5e`7#ZeZ&XIWAOXlpM2EwdC$!pcrTQpg_Dk2?o_mVv^
z#`$b<0Ex&)?p5%dZIu$_T@`<8<Z)$lUdWR+2Uqr1#QsP2O3=60YjOAPlKCqibw+Lp
zMH=I2)1M2bPxEb*DCX2a>vUbua&}Ll65L!(QeUb8h&AWU+4*+st#Abenkdy>Yi58x
zgjFD(*Z$CmErhT%$KIAm%xot&?hhaYYBAfPoEGstag8XrcFAzN^ilU`s>$|5VMy?$
z^_Cm{TQO!)?TO`2eJkPdf*wObiMby*3D2We8Z0j+i0#~&!GCz>nW^maAxYbUCxEA-
zcL$gRc2Vp=_5q7eSwJssS$<#slAS&|#^&N+t@*Vh@A3ykCYyWa$6mfsJW-XN2@{*g
ztI&J#4S7AXfod1?{A3inYh(m-2l*aBW~u6Vo;MY-_G>A$@?<2k`Q84)VfA_6IdIk~
z@p-hjv2nuXMy_eU1J~o;9W_YsP)}|oZP#|^t*rQ~cU2iYPs}=2Nwvn_e|Y^|iRR}O
z`P!n>wFi9p*tK^STO+K&^doVn&z+<<s1t(idVgYx|4mKPxY#%U_>BGKhX7t0?B=~s
znAX=9-6B$dnp8QwL}t*9%QEAHyO-^EwU2Sy2#apE@_Vw*7Bg2jiPZazSNHc!2&>X0
z5pVSCU+=Rm-FT$LuPhK@3?N_{!*x&|#rAgP8kf9GB=EOS?A^xeA`Lq%f6c_@-`SQ1
zz$u~hN{zQtZu-IWvyF=*Jr33hUC){oo{!GAdT{%vK7!pjXW7WbWZTM=_0i&tgq+Jo
zG;7#mYWSu`j^GmYfK4#dLA>LwrG0jn$JN?)p=NmY=KfA(e$VXzdW)Oh^0TAp3|F7r
zFRK%vagcK^M4gGd?_<ZHnr*K5uxjJrY8)(fvqcQRUiwF+FV})hUKyRM=<-|GxEo^R
z$W+w=z=ZpqS;)eAl<0(&=$`G+P5CDe0B$6PaE?4YcYOVuVG}B4>y7rciV@CWUQ8VB
zX5wlvZ=x_yN_!YDgp2;{Y`E_N6;4wmAj>$7`5-L+I=d2&>0bBM#F9(bOtYBbzm;+x
z_!#%qksD$ON4c{V-Y>|5Lp*22>H0pm{mw(HRG7!D-B4_HG1Ss@ogArr>HK`ukj}QL
zOfIZS|0<J{BCUupf3=%&fXO{gl3jY%a=7*PljApA=FinrkI^W#@+~aqXjRU>@?N+e
z%o`K$a>KnV!i;f;KplH$PT&Dsd<12BZa7E-<b<3xLP$EFO<=ja&3!?p{fSrK&eL|o
z-HOCl{3h+^Pi54W6<0A`v$P&lc-p&JchYh1vUFj8X<9mxLE2y3P{uq=Ay=>GQhbeA
zTOAM2sA^h$y;d6TjOX2v^TlwDA8xsU<%zCfr_(@m#x>jL?8O~&I_=5RWP0A;ph|z9
zw08Tw4ZD7vyM-juaKu?FP~6!q$w^KvLeL<Ir=|J|9l+mpOu}@gG$U+h)pz%Z+YItD
zZ-IyJ*a_vl7Drjgd+v1FC6x8=7fkK==abpcnoAv<y(1t)Ei#kGXuFObFsMwpF2WCs
zpd=r?Aor%bURXwpo58%mfleB`ErP+Dq)vS-YmfM4cBL{#S<9ba&7n2&jDD9H*Y5}>
zT7){f+{))!nKAhWJs#Y2axSF+OPc^VgEnrLv;&}I_V&K`mziNLxh&y4%xs4(hN0RD
znd@c-V%K1?nVYshsC#m;!Ju0C?+Qto?>PP9fHl%z&UggLVT&sU0EZ$M6HT&m>kb?_
znt|n+5MxH47<sQjL+_xQiEy^o%f;*NqWIY9Ealf3Hxe&*Jh0=$ZMC=cw%Rl)Dq*h%
zgKiB7DJ~8!?AvB`dyAFbrSavM>y#^)>@ARQUL$ZeeMXXf4}M*JXtONu`DXo0_rR)L
zgyuES*7pIq>uNGMPOnNhoIhG;veNv6NM~^5duzcU%lU$$mw-%}ye5HAC?)*rmYm*t
zrG0G{cWJpDJTM+}iGz=eI<7YBlF%H0vz&LLt0&v83n{<BojiU*+9SVJy&f+4fGvT7
zvXQUXtKh^J!UYRr;>x-R$?rneHzT<@ZuPa-8Tlj0V1BUT<r{wSF1IfB7mb$0J=^+Z
zF_gaUraZy=O?)KI)Y$muCY6CyZphR{rHJsZv=)tDo2B7Cbl3B>?<U!ZH=Z*5)U$d%
zi>BF7b0vk*E{Nk&Nnj7FQ9uiu5<&fu!2PAo?sq{k$lP6q)D%r$^693uWZgk|K1uq!
znf@tx4;vl`5jo^$JAJ*&<%`@QLsmWi*Azu8bG88{(dDNFW2Q&qv6i)Fzn;o^Drj`r
zdYg{2x}CLeoUAw9i=%$K`ArTOU7V(i%BwY7g(k=c6XV{|WmVLhP0fYW_5%4df27?y
zUzEm^spkxe!2C$0x5_I;V{oyXx2K1j=cy5w7!&|Fy8c1enCNoH=X}YCy<|HRu6NIV
zI+@RZW;C<~x+3q859Pi?_A=x8Q=%^dss+G3pqQ#MtpHhOxxtjR@DLE0^A&!926x*x
zKL=J_Cl1mmVK35};@eX<c6k%8F{$$UXA*BHwr`1MeZDIr*zuse2tTxJ*&D0IcW&UR
zhgh0M2VXWI(T?i7Stg=RcfD05bH?A0>(y47J<}=`Wy~qhVzF+iW`Vts;Qct_Dn%5#
zN+rQ%N^v7+z0P&7URn<Ln$|eRT<&JvcD{IVul2%Fm-X6B(5d#@o+lInWvd~c{Gc%^
z+LWa0X>>HTXXj!{x=sei_F*n7vAw(V>r0YSt#j03{L(CIu8IWVQqKY<QJEL~HgBY_
zu-G?p-qZ1%c6Iz|r_($-I^dp4+Xh)=r)m{U%mEsi`gNB2rX9WM>#fB%_g%K1+T%|*
zYrJTAYqtQ1A|RG!BC$axiYClPpSeh9#D{T)yTizfPsFQn75AhNUodT_gH;WAP^_-b
zx|Qi4{LO`x4!x9qJ<Vz|8p-&f9id?K0GgISYyGcT$V-cNaj4(?^|ZI^ZkWj8+bIQ~
zHu|GQ-LHvezz6Q~l7QmKzn+B#U29X6omEA>w#K2PhuDwpN?Y0oX)FsA!n8dOB1a9q
z(fZ<OqifVHMU=b1?kbIR-QVT$46uAVKm!O+kw;}g?!q)~Kz7x_wI25*jvdIrbR`X>
zk-BCE4;5r*&?+8?AnsLJT}V0o#iRd2*n7vb{k?I+-%eGER;?PLl(sfS5z=MVs;b)5
zZ0(8_yH%rRjM}R;YuBhPikcCd*oxRIL`VqkPx}4+?(sbL^Lqa5t9X%f&UL-7_c%vI
z=9A#15a8e)aLk8T0botIF(&+aMjCneSiH{h@Azj%-M`s>hhJBTj=Z^bj`v-DCB6bm
ztyDjN_)yq8ujw-MllP%&ym!>9*SRu|+Gw4)0zts`v>eLqeQ+TTDUg8c*i-xMMXK=e
z_2k{V+Wut+t|r;mg^`KiayrrM#}%be)E;ajz#>sWbS7y^LLI73kD-N0$~6V0-`mtf
zZ|hXKg=+Gr2Dxl`rzBWDb?-{XcJN<jeRRI<0rVf6BDw%4&IW52a2x66rO#%xl%*GV
zL|(<%nM*)y`?*SQ6t8tHrV7%|nHSt#D`oY2rhiNGp0I%B_3#{S{#G~-<{vN8NE%;$
z@1>CvS)<XX0x_(0yf?n;l+ipC^KKvv4bs^-(INGo(tN%1k0yB&g=jJrURUuKp@(rn
zU;%WtsKGS7qNY~W61M@9!EL%J(yO`4UrEH+7a!cWC+lyd_=KvtrEcWZnQ$KaDDQ|2
z^^JVjsEV1oVv2h43xrTWKQ0Zyo_E#>R815r@2)Xkhy3Bct;=09Gky2q*5`>F>6gwq
z{}ZtS(~GLdQ=$KW)<`AT*HB>f+=E5Im2zVL|4TGxurHG{@ww*e?lXBz3nvL1mG%Z0
z#vF{{67PpLu$_Bq&tM|ikD^+VyZCQvBhuG>?(1gyomBG**$(}@(1XnU7}R(mEZ1LF
zXj*@uAsy)13X<1Pb_M+lybq9dq6Gz!=D4IbAB#_lO&to`8qs|LLS*2?nI1~sGc|`K
z3z(a`b1)wpxv|0QGfZ{VfL|V;8jnN#>16pkFW^JnugoJofiF)C7lKabRIvC7B`j!S
zF#=GzVsXzvrqB7wAF({Q$e8K&iC4!^FGkgsa%@ql0e}tZsrE$4x3Rx#pQv@w2yb<Z
zgIh`Kni&OX0TU=ytoCq1fWy>LP`;1Z7(`RLUhMt7NdLVMj<aKy#Ic)`_2{p~DS6%%
z>N}Pej0q2)Y@c)Q>h}`Dtk~WQWuyQK=o==m#q_TbbH&$(qSmB$77w(e<lqPe%~o(|
zmxSn?d_lg*LLtW(^>1Lug?!0ZcA3F)hkZGuk$0zm?{;CIpz~H(V2MUK{`;>)fiA(S
zbJ`Ub(-cO3P8hndsl`MNOI*jFa{3s~{xPJF+pv&YRQK1bZhBM`dGt}m{hSxtUv3At
zRKJ7kWGcB_Cp^BKJA38VQv&Y_85*(cM(UnTv$t2;SrNl>s|wy>w#%1+`@?+NJ#$;K
zg2*Vy0!Jz|51UUenJZ2^yaegv1OPP)O^o*^Z2K)>jizqF)kUkK#7wZ=x9d+H!xpa9
zaZGN&_af&*|ND6Zq>9}Y-&4IT697(+Ew13K8#9ghi#T>tN?nfF{h~Lr=VnimEn3S8
zepXCGn%kC`**j*}9y!ZU2XMZkudCk`9S^)7-qd-NuAEI}bdij7AdC$lpFbfA<jo;&
zp8x@WzD6F$uC+4Rk?SJB!@vej{tKMVq~cI5*dRW=zPN5?CbLZ8zvCCBFdbs)%3L7i
zj_19vi|zPtagq8-%g3^BF9(e-Uh`r1FJ0V5UTA#s@UFW`L&FG%TsjF>Mq%|@{?%a6
z)VryG`k%H2@zq;Xk+!zrMrS0u0><?U?c`-BEuCM|6B<sEy*sjBLB&<RHPPo>Tae*%
zz1zUB736&+Hvg;UN#rKu$z6*FfZwsgsqRIX>&mXSM@BJCSTDno17FtT^S}pd_zTjZ
z76$*B6pQTr0$X`SX`U?5B~h+%>4gBcyJx*VuO{H&`E<H@&|9Q1>-#X}OJ`xjL5;Fj
zL&+w=5Fa~pXwz!(>D|%3h3yyoPit&1O&ilD(<g6S@Nsi2I+F&DpKL^xxCG%_<h0_+
zo90(Gm!~4)Hqs;YhUF0M9MNfq{<W8z10kjBZ?wZ>-F(o<?4@jf$84B;NyN?{E&*Y*
zd)u(Rj$9B<ueT=$trRT!;9tzCe~RUlBrl8971Lra06P$m;PVRJ?FRk;fA+LA#GRxw
zDGJ_wz>I)VAU%0W-_c|EJQOgkFMU`_Zh^mhvWg3Fl72Zyc^18toU{%5na42sUZ4A_
z*{RGw;**#5{*>2)TG6{9AW}@*!-pBcrrLH^0Hxzwh+YO>XoE}JBV2|i?vj54smGTs
zUj7{xEvU=-g#1Lo1#<%KeGROB>AR?oNrAH#9C8oUGqbBHwB2Vd<&z%o=XZalAJgu)
zC>75BJlegpeX3h+$Y+x;)z%byhYuQn6;vXeoY{#z_tl1qUtjb89lVJh%8W=k?U;v&
z)|EbKZW=B_VuuW)(}rT6ALkjvggQw~G|#JPne`c}OC^ebq*QNFI}u`{*g81&XebO;
z5h<o7k?-PI^mCpX#v(4|7<`r$<EEhVlWe#g!PaG>*I)abPM!QW7%x|Kg(Y#3$vawW
zuU6VlE*`o*GBOJjwe_7(3@gD}NS)KA|LSXi9-U~|QV*g&c}9p0n|^ZZ&Aq}>)b?`4
zi0r?k)UzR`K&HNEyR7u#C(XPIwwy^tSJdwkD`K$x&9ipm2kX~O$k4@wG{XP!=9`4M
z*xYc3q{N=={1XuN@sGOLJi|ZdfTN}!eU+O`u5QV7V6#};6|T3%9ihzAI$gIN32q%y
zTQfe631@$ZRz&M102A8X|6d<)Ce~$(9YLunHFtM$MpJSW@kdnyb8+4<YSQk(aqbWI
zi>d>==94XxTFiAHOt1RbghUC0AH!s%`}=<$F6>_4IO(+Y!(RP1HychQlK#WpXdl~<
zD~4{YyuvL|0l5O~l*jcc+{E)*h=SJw9cYhQRz3V4^b51H`lu)YFr{+ou@^JI_?g+I
zr+wtBCw~Wr1<Y#d?dv|n9fhml@*pGHlWyL)Qs{4Of5N<A;1YPoGD1b=`q(0C*qi7z
ztZIiKLg4p2=VIBO`WZK<qAlxapD0dr{rr=#OM}WA*uAPQRJpdamFYguJ$RT2A$|VU
zrGE1K252Vxa)JMLU;G&S@OJnt6#XVGrP{b*_c`(z8K5ZIA8rOPUim`Zb#9+vGrVUB
zmnvrK7lBOPRTcr@(v?7p`+t$FNjM1nm>TVxWP4BVk+^V!c#CFjStzz7xv8U<MfKTd
zpl~z3iAc6Tv9gjdwWKLa|B1LAu2=XmhT(}jtBWZ?ONOiXkJAN>_zM*wwz6+7BR&oX
z*?v=IRSBVp;Y_^kW9V}0cghvo=M4Wg4Eui!#C>e;K9WuRiEi6>`?&u4^auog1hcdn
zVpX_xOCy?$OTM0K?H7A_+O-6E_{l$@cAY}<=iP~h@t;2UeiYIg-E-Hlo(U>i&03g|
zN1?-&&=tZ4r>1>J=4Uo`xuvem6{~r%Ka<MvXAve?UUzDGOfVzYbQGBlPOq6n-h`Rc
z*KzRL3CdvJxi6GF0msmKis<!;&##oF|KM8tk#_b5Hj2C2jCpR*UP<tg)BMz}(C}Nf
z;%Pd>=4lRFn2107F9Q-R#9Dh5Ho67>e=JQ&Jj(H=cF#2n7uI%Qcr8-7DIp~ElI!<<
z0FiFyxC|CNnll%^L+E&ucGj{7pVu++cecmX$<D*$*N=9BO~rje**By7p`t>WMlIZd
z&xSyO!n4ugF~If3x<J2)g`UDvSg!Q*q?nWUZoh{$wvg$PkHvs~>GqD$&Kr3hxD>Jb
zLEKy3i7uLXG1w`V`!+_T{vaa)0&LBiK7y$iRjjj%*z^1w_n>08(a#J!0TwUA<O8}K
z(5X!)-5<VK$>7b^LkSlJUl@w9i0)ba$70%&Xtgxt6=W)@c%GA;i~(D?naG3;+oSb<
z>m5o6TZjmqvQ0zh>vLyUT_VbpLY#tbO$aVDiT|db1aOJi8)0wM5l@9RU51{LBNxM~
zu)@^7r~+lbOC=PlD6@OQR{{t7h-|)L-)^RIYrjce$J~Un;-9Xne#zq_#cpsw)Uq=6
zphMK}73499H>rtU+#hZTEGI5)Ah91H6)k6*II()FG%{2AKpb<Co4@$STOy<Py?8R`
zwMe2(@CSg$^KAOl@f-{8m2y@9M9kU>Yu7Jk7E4zx6AjpAuv>SEeh3m`FVryu5W{7|
zYh*b&KAgB{W6cSUdlyCoSQq*J<d!0no7l+5Z<F2sytJOoUq6)sR0BKnW#g5CrM~s%
z0%<@O5XBFP0Gg6o_Ej#-L-@3JF$Z{WZnP&GD=g_XF|djK9uDJ#K*6oF>VKhToG8Kk
z60kQ*6k*Z-l?I+N|E+*s)euUqQ@XxXi0QJh9?#P@ZZQwQV=bk*+$(VwE16!Ux+uFW
zLUL6xX;Hf?q@j-7-_KFg)aV-dU2DWF$EO_^C#mVv@OF=(Gj8=B1*YYV=LtGBkVu*r
z6(?L*7X{#|+$Uh%H%E$d$2$kTW1Gv-l$M69HQto8{yRHkT}g|_a<fNpGXRifgYKN9
zkAx@A24Hd=Z@v|Ne5pc^Ki7t3!*gm(r+kwp%eL){;RWT<k!OSnWr60x)pWBO5#tx{
zb6tK3!DJ70K2GAQ+*&_6MX*37nbmtPQ2{0Brg;VrCS_a>!uIK5Ur&ziB3ru8HDM!x
zw(x|mfq)=)6YJvSq17d`+oB-=9TJh57>Zl5G+MD{64sd7zm@BRBc6Q%O0<M%#goR(
zTR-^huDCVcuyOj)ntd%g7Iir-o*l$$c)I@&!Ag}9ARlVz5V_y$CB5xRL-go(!F2Yx
zmpj!4@mJ!o=l4rPyyRn$Q}-H+Jp=vB@?>z=`c|kQ$nU7K^`p$_WJ*#BfN+i7Y&<tI
z8?whqAK<Z6T(i=^^4fb)H0$#$R@4j2m~sT&+AH+|PFct{ksiWG-j381U3j{TzobCX
zbq>rkfRuIbpxpupKQh}<VLZ(-AJbmvveGp$5KXfq14)JOxUBTWQyNbh{CESn)FZma
z376`=moh~PeDTCB_Yi_8H{R?nC`j&9-FtQ-KDW!~da^-U{Z3sFIX_Pn%XL@m?7)+%
zBEC0KF$r~f#^bB1Po>4=<sFava{5N|^3{_^_?cum?9{CAiAySgmj%o$u#$|mGggxL
zV?MD$3n$~Iu<|6$&wOkD-5c&I52DJ}_<||yl+4shY1iBXB>qnKK5bVtJ0WBOn+@nI
z!UW79Ji&|SXWd`q-BW7@@Qx4JeE1?`!q2Z7_Dl6WcGn<W=O)8Z+G8Y$<99H5?7ut@
z`UJE7q1XoitA&H)nhE0`1!Et!*gO2_o&^RwOUqrTe$~5g0?ZuMapT+eOm?YMr?ttX
z3{ZTz%UjI!ZX0x&a6O$#b5g~={Izz$i1<MaP%6VT3}11{vRJ%a=1w@)&V&_(V|gIZ
z6cG5SUN2L)I7>l4Gsf$WB=oIN+xl*B_xCn1q~j+YO_aX`#46h?1V`L5cDbKSr#VEH
zjo@vnE|0~cEX*9kQsTPK<<Jz|<}WHmmO6|_bf+YYP**(d3ygW=rCp;}xq6<ep|iw1
z!!-UD4VKI&x_=OLd`T+K|6*hv{QWL3<|6XJ;P)qUS$qm9WsYS_cxh9q&xxgzoZ$&&
zBOq*KS8EWrSQbu9_N(Vdyz;<@PFE928JWD)b_?j~NH%nN@Dud0R3v}M?-YEZ;0cGq
ztk|&1rGi48B3`;V5W6g_;fsk+fN*uRq4EU*g;9sy8W+yrG%?CY0oYa+=s)y+B`E_c
zkNJF@N11YDoPz<h{z9zoW7%1oKxyK#j7@2H7bSq=$YWjQM|~DVHxXzt_Z2&-D1`1D
zuR*371qKA4FLw}^mlCftDBdSeY;vu%s$|3?7syvf#>cjS6w-fj@*6;M^+)y)Kbylu
zsh3Okg{)vO<*^b&ZmNV;AN%<mGb5wwbHp~WigyLn8zlR8u#ZWRf9|L<_OxDldgO$l
zrbWeEs{hvLYN@>9h_lQXlJst%KRRxpiW|=IZoO}M^W^R#y>>kpm@Av9x1)SvwN_0-
zZM_4VblULsLe=aGQMp_f@pQO))Y{~PinRZcR`Sq(+cCUHAGl@U;45M`z$n7qN0K2<
zO(b@sB+LpQw&XX$hgjzZ4?fZWX1P^d=TPp4rA7nXy^>m2c_9oi)b4+38Fkff&Tfte
zX3RA-Fz?M`ooqG8wO&pl0%-ZeT~Ef@>NI4S1_#!n!<~PmmwEcN7aQAFlIBAo|N9tY
z^d;s*<;qqW^$N{3<huHl)kF$lE8e;_f$&T()~{3Z?|zu0sP1pKFc7)0t0E00Rc%gs
z=tZ$f-_M7$f3Z0B=pG3Ybz@#%iQ4(IUN*INw`^sfC%ikpsM-AV8NjOm+=P18M^GFU
zMl6tG=_8mv#$CleiYZ*E{$W1D(hv@cII(b8<^s+y1USFK({pj|Vh?A@Ri1m0_ax>3
z)RD*A{CiN&cJrt+oj>k~im=IEuF=8j7B>A)aCp^^(24pHkycyld86aJWtA+COg0EC
zh%O^dY5N~%`2D}yUXeHE(ZS7rfw>eKDuJ*1RFo0Dz{wF_kjwx@Jz;(y(PqG0QL=V@
znMu%;t4PxH9#x_duiaQNM_1$K>Y#;~*K!WqsOQ9L!Q$w}+x&r>)xT}4b)VNzG*M~a
zEB?-T>uX4%<LKVSF2$y{npUa_!Mp&wKin}@YD|}@%jjfI-8DYx(HmwQUtp<sY&V#h
zx}3|B^o;3EYrhewR)bk!XN-;;1U02YJl-cV;;44-%&g2YnLPZc`<fT%h?Nr#E*fZV
zA2uQ5>fhE)TP~TJlOZJzX{d{@0**Qx?QQQbM=i{D_G7PqdiEHg!aCG~Ca=e4Fgy`(
z=8z^Mf1>3QY)3I0m|nU6kLh)?EdFx=MHI7%q7y1Cx4uA@mmB$ds=*JHS26*Xlro@R
z3*H4Tb+tmw8iOBbT7Jxum)Fc3h_&DD)48x*YOy#wo>Js-JJs!jr`OvGqP=<Q(98mr
zb)2455Ff8APA_xX)l6+i?KNasq&Q@`KkkmI8@Jc9^wrC|b(Q%`1BjW5g+11#ZEts5
znnkXAAVLTB)e?*A7qkn&zg>!NDy)-W#9ZWhyZ#H4s!!n)_x(?PjO}?+&vkjMQbwq9
z1CJzN7qJ|63ir&P@_wnIm+H9+OFl@hf`I0`Jtv=1(?oelKw#25lR0dKo{~Swz8W?4
z2NCKHH&es!P^4d#ZdvchMZK&{Si%Xqa}VnO_y`D=g3Fx~bP2mxcRLtYViwCIn0zXj
zcYsF_^iOB7pFH&UcUS&|^Fpb4>s^-Dg?Va>x%s8+<JhMpk&(I%vB(6$u{f8_GPd1;
ziz%U%YjJ#<nQ;xEX<=Hq3e6~x&odebw7IVtmHquG1y~wR*2*KZ!mAo!T27o9)_}S{
z-$@AG<n~Fn=OVi)M#EcIE@eVp6B<A}X(iV3OP#4CjHs+lslP8P*q@-~)n%5`Gz<Z%
zn-hu~j14pjMhbObQn6yzzBIXS&jPcZtVS`tQCBtK{o4>?w;xaO(y84>{{}a|AHk|a
zT~`MZ*y`EesGGcc0fsPXJ8wO^{AX9NdKJ9R*Bkel?GZdP<q-3w?n6BjyO8g*xL1}S
zCIOS%8`Y-5s)=O@{KBBkM*Ed*U+4iwOS)=<^<Yi-*(^&dy#pqNS)VIr!fpiQ>=DKQ
zcKG$6k*;tjfrT*fu4`K(4)ydldeiq$cn#y&0!7SNTB)0r2)~{CHaaYoQ2AMDDCRie
zm2hA5)OQf!rPc>Zh>M&n8Un*Uy~9VFb^0ZV@<TRCmA>M?{Xidqh~Ou1A6_6+e#V;y
zh@(!$-Ax01o$l9?dJ@qNUE@6L(j43&&6g!BQkLefL4w-|F9nA`2>;a)r7IlqR#2ZE
zwB`P^esYGmK=$(P&{0^m8LnP(MnK;GwAgP<-Kc2_1~qSWbWC;=!W~tA8(S<uS?_{z
z&!v3Xey%m-Yi3q&7*p+EAI;lJj$9_X2=~;*@r|6;MyxJZZr_=ze&hGmPBK%SK0PBP
zx}7QnI8Rw%d3TfQITCf9Kl)sN0~c6@Z1ngU|62;L9Ry5MtGK{SL73n(OAwj$z4-QW
znU@x!@sD;?AM|iBy>hfSp9IUs@j84JVxKVc^9kWoE(YN1DHj;~nN4xBp#oUm6J1;o
z-{+d;>l}b9sV#4;$66|^ASk%JAaVht8;k!WY-jl`+^Eh?hP94NZfyfY2o@fGJDBg2
zI^%|SAm|p^XVypf#@-5;J}73%U*qW9epFIn!o*YKG<Cbiq;f*u(W{kof8xb<=Qork
zLL&ub@x9soOnw62WnvuNs4ErWaoFaq4qC#Sf>|t}-8t0KkJ+S#P0DBQwMq>NFH@A6
z{}yLW=>q5`kKfCL`ff(>lcdZDGqTML5cI?fmcd)!sOP(D;nV(sPSi(Q3A=%&jOC92
z0kLtPkq1TV`6s2_D^0eCL0_W!+IQ}vJTot`H4YgHM>82@+4Jqs`dOIikZ`Fb4*A!0
zj1VSPYojpYO_mQ*T6e2gCpyUl^>u_qrT5_ckdnY(P5*wD;ti<!1Jd$(*22*ix;qSS
zhzUc!?P%PbpYdM${jCZ50zmuuDA{nsz}x&hVhy_f5(Z4U93L4NEG~3ZW+`#<Hw;UD
zAlW=Gxyc={!^!VsSQtdQ0)}@_E4#@S`IX7bUO{*>5MEL{=+h@f<PYpgQ1u*v&=&+5
zR+-EXAG@1<L#aC4yu1#qzg13Sj4wjoKdTK4HT@Br*`K;?Yf*`kHipX!>oyCW3^iug
z`l-KqaAsLsxwKrbROfd8^IzfYa2(j=AIbi|p-&ZhbKInXNB>3n2LPLl{R?x?qYlp;
z49B`>(+|6)eQ(b$$v_Oh!c!CGgZ5U-Esj2~+343>CbMfK3K-^junK>n&+qHO1mWuY
zB+!mWCe_fOS!wW{{HRPiUu>0c)&3VmIIN}1JX!p~ZDfK#tmp7z{hH4#A`xc0?US7C
zZmA}fkMCPp%<t=Z;v0y6;_I>d9dW}F-FLjyVVJ?`O~ZzkjYc~DSXH2WHF3A>%<^=g
zzVDqrZv|swVcky#%*EYtHScz>{3~<Mnv+1_@az45dq6X{WM|^W1z-&5)l~Z-3Hxg(
z`dj^3TH~BSb!S)RnD?^<7Aczr%s;wfyv9fV8s(byc4Tz50WQQ;h4=B$LrSviX^X=`
zhJ~p?paWq0#HUy)p+DaO);RKiP|t@;l4k@IB$x^R8UL3t09dve9{X9+^$GVysqQ0n
z!=(hfn)Qor&v<*oUtWIS3rgY7?~m$6?@V!r&}_!dc+5G@#Uuuv*E|m>RlLGIuNacj
zq-PcI;Y+6@e6#CW{guF9^>h_iw&BT(`Q${M;+20&pGK(`W^vaRUe$InIYK5d^B8)4
zLDj2#$1mqK&LVazy7mw4+|hXTSCHD7&GrWnN3_L{0#lV6+K1n*zWYztnKQ~jjnz_9
zmLe*@Y$}R4v{|c-fmQxeaUu&}&$)hNsL$8n`e*K{L<Rp?zdrMa(VYN~9B;U(neTG8
z09;7yL+jrCT{;^MzcF*3=A4s+-!EZ>GQSj%ue<Y#oDzPrO7;k%d!s!kPP{Q)Ef*?w
zK9+5GhoiW^Z*XAmK%oDq%IdjY(#kxyky}zwc@(I7B{UG%B^c;*uh3DZfnG&O0W8%<
zyKzonNx@g9$^}eVYoCi#Df{(^2gReEuIGdsy=eF+g-aq?l~84yh3Yq=oxzv6RlB7>
zSle2!!ABH*<n;MOmN<NT{eT_-rZahn!rIzu-S7Zd$YTFqGAmbcC#B%U)Tau$`}`K4
zTrsve$8rC!C2ivzOMMJ8X9t$r!8dczylby<?WhQo<VX#Y^XqWzb2MsxGA9M*nkua|
z;P85rpZ3tRN8Z{Cxs0zc${djLc=wUL6Lr`q&c_k2q?wVxt)$trnlvj4u6R`KIKh)T
zRua1wD(d;lw9|U~rF<!CF9j_}Y<oCk&%u_VRUfInejZ$y+Qo$VGj9RiB;2c;uP<7f
zw(*@rX0KSOIn?oAV(amo+MRf%R%FTp&2UPA{AYZWpELI>@w|kdV>=>kcx6x$|FC{4
zpZjyUTYQGb#$SHj=bm;ZmYaQoD`J(Ri%cuua<c~C?%|nnI@{lX+8YkgDmK?$@Ph%$
z=6`xa{NLVCC>v&RizQv4^zP*;V*Nat-Sl~Z{%Jb)6O(cdKwFxVX-l^_nwK*3;f})2
zYlUtVTSuK6Ww)h})sg&otzq8RZRP6&p$Uwns{3kdGk2D0;=+%@m0jl3v*DxV@G;Sc
zowtg`tou{LYdstLxQ~juW{$qM&CJz4)nJ#?Q>{5x8{tog20W%W6y?Mz6*TCO;`H;$
z&vbifP1>&rOR;cUEpwf~yVy*5&1Tdj%Vk{X5N6akw>TT#L15~i6A@k)hx=7kojDHF
zF!LJ&%p&_KRIcK)!;Gz2@M!Oo`Y4qYKAYri`g^0w4ujP(vcHrMv6UGka?oU!tUY3^
zK^{;mvJ5Y9qlTplzQO<-h{9!z@AW*km+~TjOHjSIjkb)l^p}L8M^`X^X&kb~F)S_7
z?3>3b3VE=JmJMs>QaS`HyNx}`qTF5bk;}Q=70LF9JRKM&$oa_RSP!F%4em7)S)1)a
z>?*DRa){SG#q@I@{3HIcExarG!n+ljXWtmiD+|)f4en>pGVzF{U4q?tHa$HOw}t<>
z5!eDn)ZV(%D)rebK)5MP#W!WcG{y9Fuv4r&u>Y^^4N+fWxBw|~oU&ulB-{zEeaejP
z`>0xQRAoQ$G8N!Um7J4w6b`>l!I-OGyYf~9Y$<<Yzx59k?A``<WLRN9yd#TRqa@jR
z3Sl~crH1`oZa@oH15{8ALe><Ii8qP{czce=PPc5Z!LQS@Z$C$#*X#M~QUfmjvEsx^
zFZ52j$87G&I|E6lSsq<emw4*6lq63!JU1L{o|*QxBRi6H3>n2fh1an3y@)Ruh93IL
zS}8lF=rus=W{eOb5`xEvpn<wS)+|FFT$;vdd`FTN#Ez!J?v&9Y%Sb@Bmgi}p%^1ty
zQ-7e6d`nABCwi;7YU-ltVTx{7TqZ$JIHCV^g9-B#bb`cq<xa$UjqVyi2814KI(JZ3
zZSefy@q>*#y^8`YAUDJ*iaJ?`O-{Vr0cIT(I84!5lai@8vz@5|!Dr{5czi;%>lOT!
zZ5PH<Rz>`Qj&Zv9U^RmMvi{dG^_6eh3`y#D1`Cw`T84;iv{Yo?;jg;}z)IlOPvYc%
zi~prgv%&>}b@h*pDy>3{{I*Iebo}wKi3$bxVYKHiB>7!$kdwigx|&+gKBiV6N%l@S
zV{hDbU+O5&;;7J#fLR-B-rf~Hp`IM-HE(^!)ds`m!UX*uktI6$<+W!=7~pcQw{u(*
zxL@f9#_ii#y_gE-a)XXU@QG6MX|mCM`fKf(t{5WkN~ovx9(Vmko6MY6De@r}OcWcI
zZ$Wd#sqh*D2JJF?h*Gc>VBi5_=q>qIZFVqE0oOxsfBWlckOhnv?_D6MoFdIaRjyw=
zS8XiqP72NH_y;hXAWObU>Hl~!^XMR8|46!R>Cq4NH#y!&sW8CD5OZ$)#&7G$a)F`7
zPEC|I^n=H<2luGnDO^rkGUfh-Ld(A%bEtc{Vzpt5Lhcu4wIusng@nrbS}yHNpH-$N
zvM028gJPQweRaey_O$F}XV|?~UYTeb!e?*Cf0@_s5}qf1;gd7*TM{fgWJ{GLW#9r5
ze})$+;-^voxWL&SI8D7!XT^??80_19B~c#RdlV`gi2VcLDUqjAERP=C7!q#;I4EWO
z0({eHByS}CV&g9awv`fGA-2X62)ClcC^a#1mtGEFkuT+txOJa1h<N%=QM+^FrT6~+
zra`jJKWwiaKqZD|y8rc@Ja|(@=9>O5YrpFu{g(e^EsVbg`2(Ru*bKdJaPs>Yo)%A4
zPiY^e&N|k`plcr=q$(6QNM+r=nYHOncr5*X^|OHfgWHKtb3#R~;+{qzR=EdC0PVe+
zT>&JPrG1yvY-LYVrAp&sE>XFn9F!B*kEZ)VIL6e|!Yj7Iw!|bQG=oEyyISiOp)aM1
zY2{^jR}?#AH)0r-Se#gMPRnRaU4}b5u5ADWx_PFY-9nN4?BRAz4<2o@WJMZcH%&B!
zZ8*Vf+5;AyF57#{iG8f@xdbFwc!}kPAs|nRpb`30Uy~?*eVO|0^DBV<z(<g=RF63L
zyg9H7-TH74%_#s7(*CZ%+!9pfvB%Z<<_y+>b17#y>}1YRIr(=a-&`*o)I>Sl)ch%I
z+a4*X8s4EK^OwgvK)C3%-)s|?t+igdZ)%jYNLPekkDGQYuOZ16Kwux;xOW6VK7)!v
zosqJR(J0+n&W*9sSOqG#C$@8PiQ`FPg<ielsK>NT_8ZUiq$u{wrR);>;*e;;#A`*m
zs}^nv<K3I!8EVN8VwRT)U-9yw46q#0av}X)p}W%VZR22*$-XxZeWbJAoPE-2Et~w_
zcc8%Q9;{hAH!WuQ%!Qw(k`kRxmWMWj=gKWQt<Y`Wn2#au-7|BrM;d7l86@h2+(drF
z`N<`!-=9&ef>5&St+GGN1Md3_5sp(QaLfLl{3F^ASFyZed=f$wEe(19z7Y^@{i>px
zi~0egw>&ytWruxiespBf)vK%3=;BNGL+WXu;Qe6+JcAW4XWqNJ+!-oY#qmh2$d~^@
zCX3uKqFtY@qitx5G?!>@WPup`$3gn2H<m&A14pwEabc+Q!{V#(uEaNm=j{<+6nbL<
z*&ZE<ZG#cE++UY-7w-p7IeG;YPq`}0Hwxru(?^7Eul)Be05$OyF^|HeHiEF+@+$mb
zf3DFJx1TAG&oyY1=L+_mm_MOKa(m2f?^4EZ(>7rg_NwybTc}nJgnf173G<M{p|C)J
zO-0Ji9Vi~_DfXrEp&Cz&ceF(}MDJ)n<|qs+VMZkuh&<ci_OFlT+x^2pyr=1v*0?3;
z^r-5cWLV~j4-jJ@d{y{K4QsseFv8t2(8+<nOHZ)X-TmZE-yxopGp(9v8zA@|^((RP
zycz*8gP<utm8{cpmL3I2`>p?c@F>$sw3%*>hux(1@itX!4X=#fP1SmiN^rPUXOVY@
zy5RGA=7y7;OGW-`N}6vQ6zVAM2mfcD+TLE5M{@Hl#^bv1BEfH~<*b%$;s5vO&K4nO
z)DQI&z2+U<X}Lgh_I<Gbvgz34+w8SsO#>})7yKX$ZRC+Hz>&<4WTZusE`?(<oWSpP
zs7)GSp+>%Vca}l*SxVoC{R%*9IBUs<&iT^PMYmsLmF&tBOtm6SQ?kf;8#w(QXb4@Q
z?!F*<xXRw88#bHAm5LUKje~Q<*D>*75XK?7>)olL7hnrC(k*}vW4`Qgwq%%bADJLD
z*pP~Uy)tH2n>mPD==Ys>C$47tK9Pc>CiM}S?loEwHF*OosU!I&N?)$n@#&1evQ!_>
z_4{EQ!l!FO_Q;Q2hI{%E54vh&zZRW|KsxY%N+AWPz3{PJ4?N3)iVP!AJe%5N8dLs_
zo*2s|7}z>yKm2i5|CTzzGQDG!R;Z70O(?f7AD~4E*IA$}u{Gj;?>=EsfY;`+YY|2M
zU%wTA$_ZwFQF)1jjp%Qz>*Tzq;lATS<Wy-41HTZx_~SH5n%-|BI}4YR2Rdif`dQ2A
zzjsqDRyc-smB@}Eb*3bHTHCw1>uv-MoC!~ws?MGanAE*JRFM{!=Al~duYu<{dhXp^
zvAttF(7BTK(D^0Jw%-f)Id3H_@^;wBh7yF3T48o#5NnsM-*sHme`ZQdKO=TRPf70_
zn)V|6<e1d^ObDcv@k8YMa)gpp31qk1Us?V2$&t{Z)OaP9`zpY&C+@x9`vV!=`FwGL
z%Tz2W=eDeCBXfVnXM9UGkoviw(?l;zE_Ps`EQ*TG*51V319sOeJrS_kxO&_?{OO=Q
z@(Sp&1$Kp9Jz5gM^C>hX+<Pz4T@pX&J!-WgfbbYSkbaV+q^|qNqSw8<O!2`j&U4rK
zfuETwrmH<OGRGh#r!wX^nTM-bI&BoNN`M1-O1PV92qsK|>Or@C+D*{10k{BHS56fN
zJ({jflPP<chij;7^LpF!;=P7-F%VU`Ck=RDXy@D-@~W>)TvqBnV%Xm{^{<?U4&zN8
z9nPFZH*UZ6msY`5dLLWCy*E*NQKq|~3HxnZVn!mOqY~}?t)0qGKhWvi<(<1@kqcLg
zW{I;dVL$YK@js+Qhkr|7Ebv4M^T%a8&iXdWd3cGR|B3kf7$=;KLP~77R90N1Dy&z{
z?-u(<;77z}jJ$3A1TxX#@;MF|0g;_P4zq<D6&q|bQK{`Pn>j5tF1M(dwvXxle<B?N
zjcAQgmbVHEy{}2#u}H>sjb4F3$(9V+#SqE=STbr-{<UOmpg2iCq5yr&w)yo>dy-DY
zaOv5aOp}Fs|LjbK^NfM?x1Ad%z7w|_xO@~>bnK+;zjT*Z?qS<#kp;smmQ!PqQ2b9_
zB&O>0yVF7dn;h(sl#j<0AI|uvZ+NkBjpEL&4B_L0Ep&r>f6tghBJzpv^SSQDPE3p(
zg{3`^Mi=)@F0Qi=HDWX12~QA;ujB)b$|fWt%iE5v))v~KI~U*=J=?;dk2JFDR2CCw
z_qF%F@X2dzCAq)yOHyAuJnaMZK+cdWP?kl>uoJJ+8tZ3rHOrt|j`g!H=TKiS60Y9>
zw!}uq(?qdV&5;YvoU%Zl_6r00v^f}gdyE1e#pF{MeW0;PMyxpI{{Hq?;Mw0m1jPHc
z)L-I!bG`K6F0J!heUY2>Z-aIpu9LxWv{lyP+6h}g#B|jQ3G#y}08|qrZB&}W)kVNA
ze<P*@EvGTIc8pCBFy_U%mJj5lriQKb(|e9tNc9lLzms;#)}OiUWq}=!p`INUWeHY^
zC95BPE2O{LN%SYi%2#7^x&kiY+{A3n4`{_7rw=t)^kqm3DjjUcDs2;EGr8^>e}R)8
zzh!MtdcZmYIURNy>onOpL~KG4XhJz{ljaVy!HlH0kyNKC=@Voy0SS3Ar&5}vl6TBt
zoRu1nJfT^(N6d*9SiTJ2jPA}`Ok_X2+?LyAmjP;gvI+|(1`%RSZmNjeVB5&3B$aau
za=Cl}4CE+{gj0^<d5Rm91no}j=IXLE6Gb-M6N+xpq64dS8t7Ev)GItn91U=U1J_Vf
zXBp#Mb^aIy8<0%_LQ!8!5|Z1EuFk)eQ`~E#9%Qtzd{lkMtl-y$<*oprAK$)q6Y+7=
z5=W=|*S=pGdg~8^6hvigRnghYB>1O5)cWlO?b12Uxzpcv75V4)s?;Lj8|hptOJ=_9
zooEg)&#~r4nv<UCb#o5F%db|YqP@tdZS>*B46!}Hh^IvxGt+!vU58&LkzeRkbmj*!
zV7_%Ng0flLf%))AgtcARtGnpa)TOEf0ds&gF|k-<Z|8tS@^DVorCqjG4Y3EDn&`&o
zTXpLi6_;QwQuF9SN(WsIQ}1*Uba=&vip>L5W}p)t{vs1zvbiu)7XXYYd|C@!U8-(Z
z?*|`M*;Y3}n`pU%$G-}O<{jqWCQ1NaDp~XA%4d@}v6Fch;^TAC|K^zagQ<eA(KZ0d
zx5}?AOeS1y*YTOA4-+tIPQbWT1`yOH!77;3H*Eg0h-B+Gv^Ao2&z(w{hnT3!3>#X=
zj3oBQX6^cO->u0U0mFv^rcF2wZ<Zukj|?L>JPk{RREfvs%pnivvV<U2-JVah+Z7(n
z7Q{T((!qx4veEoT>TZObH>R{<$3ZSkrn}r>ilG9EvXw@haW#cnJaOj$7r7K|SkARP
z74y;n$r>N?hJepTi(dB}&mFt#7o?fPh1coL{fN4A8*-5%KnonRu=gYIda3xngyZSp
zjwL}~l0%4o`Dim)S~G)y%^$vUjwoFqpTL&kNp?~#uB{6{D2<~bo5x(PK)~drIpxr)
z1sxR%2cK`pXZ>p_UT-q9x6K}Jq>op8$@J~HAI3a~-kBWWjO^5qp=$gEE3=7Y&Y<Sd
zSDV5?+TedZ=Pa91&5-1g9S7SeuYzzC_I^!0UIr)BxK;74TP#@|4K`oSLRi2IUJIuS
zL-rb-VuQG;Fm{Jv&bO|&k1&R1F<i!Ky&Qnx4PEH<OnxEP=4J^~el2X8hO%Cw=ZiwV
zMZ5=)|2rd)u3WKA-t=&Y#&jNjaP;UqyUR)sw}-#9Z^gb#zQ@h{$P}fADX2;9{QmK7
zog1d_#8l+?R?46Ha))4@Ag4-4wL38fHkDeWCgJ1V>S+uGFOmR|*}RdC6+x1V|Lpa)
z`S@GzDMJ+8ugr=3_j6<2F#<keu0Y|HnAA>~pHSYy=_(;)gDHbkvQlg<J$t^!$8#?*
zcuM||$ivfcf2s~OYiApMw8F?^C%+Vw#mkBLXR@BRj8Ov0+0Yd5f}3)ze{EfUNyI~a
z!AQOMy`~{A7Unnc@Vzp*B&e#~W_lAb5w%|S>#fa=b1{^_2d@*MrMg?m_!8ih8iSsD
zPhFeKVQo+J#)-LBz)YBUGu;=hJ;&lU9B&>o_NB>i)yy@iB4Bf($tewwc7(=4v{Dt<
z*d0yWUC$iT6Hl5A+V?qtM_2CDYHdn)QNn3wwMe!oyXR5d+CxF?5n<<a(1lh@fEd0&
zcMo`JbE2MfaSo8$#-7P`YU>n_JU%a(>$rD_@4EDz(rAQAWIlgO=gfjz48BC7Xr;}U
zMtB7T)Sx8htyu1!dHI~|{n9a|lYjWMG_+bDu#}j*E~C^e`_;&(`uK*Lgo!OH*-W3?
z_9<QSHQGy`27Lp!6>*>wWOhuwh<OB%;;Aj$gsI)0o0=P+=iA@Ix8I1&H=Au;ZTe>Z
zJfUQci)r7ujhnme=*sFnY44+)UeFNQOF-}TV!fk-V^|XNFuE-LA-7Ug`WJ<xs0DUi
z`<R%Za7>mwYDvo%QtpZB=pxlYk1(RXS+hCzla2a$E4}DWEyz1oTvSnM3|019{F;vv
zrfYDq!fnyE?x92;>nPRI^lzVJHc-6pF|GS6wp1yHXj;Ts`Yd;z#kG^Ix2H9vz8zn^
z(b$bar{)#ifStRN_<m9Gb--aKYExF)0-%M(07JtT$;I>k?ltvZ$#zRbOJjBr_S$0a
zd@@<5s^9G!<-;>SAwW6mJR??C%<pf*qx@_A<|)m^`Qv7#Z~3YJbzpj!2y3N~<>zZ`
z9uI~It2}Ol?Ze#w3P#M*a+IgdhjWlyOc`L^=B}n|jU&$*$zQ$}nWpHJILhA19Cpv_
zRotCK>B6XDmqn#?oeYHL&e&_#y@OU7dXqJQ=ZfPRJUC*~k3j$to$dswo>YsKDmLLo
z+Zzi?8I_MYvgPY&W`McQHY!aMoA~nf(`M^8*<}Xpf!|10m!ob4>E6b8YSkDn8P?g+
zVTI=QE~apaF|B~b2#g+<3Yb<`{k*;@UDJ9-oIZ;;^*=nu@zp=y-I%}<^EFRGeKk3)
zC+=E{#VYI>Urj3G<4rXy&Is&fTmIMWd6aLmfkVMP2o6{0Kl);huFO?mI{61)|5=C_
z;|<4q);ZUJ!(gY0n1CF{^J?rB(W;RR;yJG@Jl7P{BVC=Qo^X}DANd_uHKH7H>CWdS
z1Ln29#r$&sp(N!zvJo0{PG`51?J*|>oxG&Cx*w1o8fCeBo*$EpPrB$sjI7scET2`}
zT_ps9mpTOZ*nkT*ekNLfow8bXofo}x=G@t|Cu}PF2BaXDvonr^k2G$6n7FF}S-XUI
z$7wnu8#Z?Xkv;zURV&)~R+<q^X;-Bwn~*!|ag$!fpANym+RkAL<E1Lv8sgQz&}n<U
z6}g&>^Ob|1vpH`nb~XBv4x&m=|AI#EUH=nW4lcGUkhIH0+smv!`XTec<~brcOVIW1
ze$o|{@iU^Wn+=IcvmZZ<fBOKErT%{6&dCLNuU9+I!6FfZO;qKwJ24Eak)L--4fCB?
zG%G@HO%T{EK!~2K5_=^XISq_DzaIUbSif4;mMQ6E#2vn@xe<&NlNLl;wa1#(o%NNi
zUZanza75kLudpwVh>Ge7TS6|)&m8anw6@47k7Pw7-E>X4;+R%egLiIAH#%ib`|kLr
ztYje;VHw~x6*&559skn!papb!{BhkO>)eYe?Vgn^BmWtlisNq$md6MDORbGoS#a-|
z;~oEjQk$0M2oIU)W>Oc0<x<arY-nVO(u0F+I7gy{7kZaBa-uOy$Tv;e<u&4LsVshX
zmud^My?ys!LwbG~py@A-#Y}xPIuF{z=b#6#W}Gtg2$xw}i@JPngMW^0TP3`p!4o^+
zhrdVfwO;uD-c$b`zC`q^{yxc{T1G3nvCcdTtZxyx1yORG;>QO7l37)Jnr4yw>j5MK
zv}=&!pdX2()YORJtQ~o|`R1ki&aTPGsr_`m?Wl#pauv@#{Kit9W^>&@WZfd6G(7|}
z*Ic0;l>xlG?yBYdZg%>>a#{`3+YpJ$`gNerkI~nxH;^pT-=3H(fqy&2_0I}sYd<~O
zP#yMv=z1HVH}HeQO0?SvGl$bHq0a>-@1COl&uBe6z2(2w`}wBI=9(T{5dN~`+2W6y
zkk}FMt43%?sf0aUmrgFu8dvd_*!e_UX+B}*6{yhKymO%ZKF&^Pb~H|_b82NOJKD=O
z*!fa6V7+Et&IHY|pdT00a<B^%UU6+Tvu=WR0F9&Et*zk@PYcPCglad({#H8t{&?MV
ziM>5WVMZuCAtPR5Tul7Eifx_%pIf5B-1(P+zuA+4Fd@6&w|Df357$NhF|1f!pwtJr
zs2ME(XI=(oPy_YAV&+2l#8vx@OvDY$QD=9`HNz%Pmd(nCB|CRbs$n0C_3FEXgf08?
zm+EA64eRW`+0XoVQaWAxoN+yyeg-&|1Y#M|;gI8J_(yA##i;#8d-&!c2pi8p@3jQa
z;MEm<J*PDt_UrW(L8a@`AG(c{ee*`sm7(_-m5j=@*j|RI(_*jgR{KnmsyOgK0El5P
z;#xsI(dC*d{U(oL)A%oPa{VW>jlAVqlzE}-yk_H<3jizJ38+j-Rl1Q?xw^e@FToBn
z8B7BB42E~9HS6{Ec}<MC+fAb)ulNnK^^?D@TLAGPJoopWf;+kY3XVpeZhJG+Hn`A)
zq`$X&EKhN_NlX9FRDCNP2TWL{k~%uv+rSy6*eyuPuM>wITl>0=W6hgbJ@l4Wo685C
zrF}`?XSo_*<neakod+x`7Alr1EZYsF-8YjqC+mi1>wss*(Hjks=&n$U5X-~awhCDH
z=VHAklQ{)2R|pN;7ae}xadd3Dtea6L*5mQAupz%UXg1g5CMc0zwz_-&cTy7$b~>$+
z%wgh)M$)i>Zx}x;^Pk~glAb#i4Dvc731=qKl3J8pKOHw_<j?fQ<jWIx_YyL_OP0*W
zdQ48&rMkYgDaCD+zW!b(AGCAVFR|q8Nr*U4%tnb_elh!KC(Dyu5o(z8jR`I=`SO?H
zEiT_&_cc8bSjGff(7JGH(mRZ&I`cV$b>fP`9IS!FlNM{;zi{?>-CsD{oc%E4nU+P7
ztO}QDBf3h_Ul!zJA;Rvk1Mz6hyvrOB(~xR^kSA{}fCr-3n!Nma8oZ{z*<0Nm1%<SC
z+@b{0vxOd|tBU2m`}<&T-5<m(V!9^cWd;<f6U56g>HFxEAZ{A7Ti{t?A9J?RS{0!G
z3tUD&r-Nkd4$tt6bG%jdJTqYm0WBj9CmyaF|8%h`<+7q(l996l$@y;n;jTEIEz6U%
zKk;(9SM|*&yEYwljBOJ>;qdGZ&)msnnGb?s@B2b}Cycyg=AGenDjB4}&Ym&B)cx|O
zRQoZHI``#zDKI;yyQUbzE`17v2Ct)3_pLFHiD}r$=pJkH5tWV0*jzt}RQCOK#a(la
z6jPfNm4_k3rInYyYS%lz`-zJBNoN!`Kk;1_&$zv@uiCY`n&h*_Z<^SAl-l2wfMV@3
z-)%(nFRzv_ni#xh9+GWC2`dkWc*1clPl>`jMCXoOl;cBg@d8(|jJ=a|@lUPb=A$@u
zVE=OkvIDqTi7-!DCohKhDY!}j8&PoWhEL12Uij;*6?N}FBgeo7vc8s9=ovl#`LaRa
zxnchL6>+x#cu|yMg462*!Gz~A+x7EGUvhV!#T$*8zkaPbgVhG2pMoph`saaAoi67&
z1N=JhoO`p8RG2RC63SSkz`bV+xWO;AM6-;#sho8Y1j=mL$Z$+3?k$99Q0H?J#-nxS
zf3V3yjO(A~I)=lM=XY#`*F2L?KkUqwRo%}^+iCEZ^H<uH+V)pAISe+v@4(2*35*VX
zo3des9ye<)IQowN@GJ4iN2;LSnt)oJ7xCz>O2ih6`ChUo@GhsEfQJuW=)@zRXHHQ4
zUiJFKYr4ig*oHb9IowPPmD!p4F5`kJ_1=z~I-AqQu+naR>74cY)D(WJ`SKPmZSzL1
zUQL&0<84!KeEeQSzMM+6<LuqUweyw4-9H>BTDhJ*sHd_ZE<=y;<$P=Ve|lv1bDs=v
zO~*SU1hoyijTksM&jI%@v9^b8r%>O$r7xS=4?>(Oii2Cecx78&ji8sxkG3<H^TVn|
zZ}=QFP;Rq!rZj%n>_GoW@sk=n8^WiqC?V5_$FnSVdengjc>W^wyyXqh*8Gdn=fRJq
z?0+Yhfs|$Qo&QW`LWTl|w3fjYwo2Fl$Ryw#vlfl=uc&_V3~+>sIEVa5Hw;I9(ai6>
zhBmnu0_PZ${SdM=U8kjA<DB02O#@l4Q{-y$6&~rx&WbKexRxr3+#6-JjFAsJ!o-}&
zP)yi>6x2@~Cx2*^4ypffHWp7U!&ROfZO^B}H!FRr9cJ#@)oe!NR$Mj2{azky%ihm-
z^<B?nbsz84fDpR4Wc%Nga3ND44%PY)#fU}l6BC(&6JiZsbSU$*_w5w);L`-j?^yVx
z*axF|_8j5biLT7QvmIr=E-PxW-rswYkz;3<nELbQrTXf;)Xj#&&BW%jeE(4;w@l>{
zN?v?A6=(d9cY{wndr?wdC@B+u+0tq2jpLSd+9}T|^fusHYgN*&!+|1CQ%3ol=y@5V
zwx+6kJp9p>TQXlmPiBufzBCgEb6z;jy;~2qP-U4DKgBv^CxxNR_XbI@&g8u4qc(Y{
z@BWnR34~^M*83Fu>jHr54I^f7PXAtgQrqE`F$r8zGtsyQ-)2p964nS?dth{P0sLwy
z*q_?G((C=lf8BT11atO?`Shg?-Z%$4+o;+NatN6~4j~`K0XOI2M(efgXM<|Sr?tSE
zy!rW7@A?#o2&ZQK(phW9*1gU;m$yq)rU+dGDf)EM*{ifyyxkC*#@fVb_gW}kcU2ay
zyPj7ro##qVJXNCU;X6AqVQCV{rMHN9XK$TNn6{C2f3#y%w^JmD#M*}zU#%Lz9>+mQ
zf(>-aG@s6noNBsdPdj%eyWOizP(<R<yDfi0Dm)23yX)dabR+hlw-1Ks5IFt*FCgMK
zrm0TdxCBLdq;LH@LPAZGl194Bj68na(CLdu(}}u!?36|^;g@lT$_c9b<mE8<VCB->
znMH-y=v8mWty?EScIzTu{>0GcxE=37+{*&%UFgdUys<EDsG>DI<1BqIMfb?F_xvW6
z>0Y7zSm{!Q^PPg4qqw#8ZY%V>BI^fGSQkF#VD8#NlV@>1GO}Sw%dM3)d}23qzpwm|
zlyV$zxgt=RVnA_(Hi>@VA|_~H$Y`nFJ%4MFS`Ns8I**_0sQpN*eno#KA(`v`NHo2`
z@U!fzzTp{xo;QG-SMd7c4T2O#qixK{Z%}2=um|XCkSrC?oj(?CzYI$~i;HJ#bLE6p
z4GbwtufB@#IOax_Q|dQBLrDYvzG=nAF^!-Z%jPZq!|u0;TGbWBr$-m$scSta1}}J9
z?fBMf87<yz&aTy=q0Za?o<M?~aLvkAu(r!&dJU?^Drp)X-pcGg_3+1=9b3pfIhsW8
z#AN#7%DSsdQZdFypTI658iQub;$_4&)9<9gv_aoqL8-3(linh?!GW_DZg*72{u!wa
z-re7PD#4?Vp_JHqM##fXWe^__%M;HYVXsFk9<B~5m7Mq=w=(h9T%SZ--sM6!N^r>%
zHM-p$QzvS(GwZI&`8Tp(EUE5igUBtO*SM9ll$g`jFE-$c*;mY6ELhRzzQ5)$cS3m4
zEsR7bvO~h|G>cLRN2k%S@?3=&aZ>y!P*9onfZwV;6%|f3=0_&H`)Xb{d-JyB>Ufu@
zCG!e3pb;gS(bbV@tF8V#W&@?aIm#K}W`NybBii{?tbHW9r}^_?{FHFwaDLQU{qW@(
zW-uR9hemggjvYQ`a0>G~J0DXjyYmIOtmkC@)SwR9Nuw{416dv3QD2N>!f!8xxDAUF
z%TIN5x1zTIEk4vGe_wRedn=NjD#3_1Un3*-sZvzWk|935qm60HJ3NF*C|<VtNXIvF
z(tM)It%zDPGp1pCjzV7n78?lMA>kBdJVo3-JFpk~xeJ0E@9aTl505!aHC~o=aZ%4`
zk@8Iabd}rlJnE|xBy9<T2DJlw$JI_J);kn|Yd*`B-N&bMXP<rchR^JI8YJHi4RzA4
zM)E-RJ_&2^0TB|_Ew;(xm1MW3&0Q)d-^A(D+%l^;@7qj2pRV6|-1#XIEl|H9uxQBW
zeZy8s@lS{txga%c(2B18y`FB!z%KIXk`{2o&1^XURCn0C`^)~Oq!#)%q@P!IN16|-
zJWP4#GcMF&4d5<p<iEkFa0znq976bwEtGn=P^5cBbCV0*W+`UPd)x7Sh|-na-<}v=
z=iyPQDOp`cA(O)9Ft(x2X|?WkD=JJ#W>IQ=q99enSm)C-BE(k#QMz-NgGB>^5Xl}Y
z^s3Y+{bm(T>@;mw;Fv6e{~0{I1(NmD==dLOy=gd<f854hX;)OXWD7;Ig)|sU5h6@T
zcFMlXzMD#=tTC4CiR?`FtP`?tF=JoGzKmrs2D5rD{qOsJj^jC=SKj1BX0G4${hi<Q
z{G8rHY1olMc{Rb8aLGbsn!L~Jn2mbKkyBe_SoK&JSDPx42SU`rnKcV+n&GGl#Em23
zyATa5xL`nbcLa14`L*6>opYJm34H%S>j((r*akF+QnKshMy-`A+?01_hJQ(a1J%^*
z6gJ0W0HoTsn9(<6Loc^2@17uLJ7O1DA&3WR%+UG|x{$CrpHv3OsJVDI?r0ypA$|`P
zzU;b&2{;PdI1Pr3-?D2$dfGl)_4`2LhdcGxhxFe953ps-ej96xl8O{plxrH6pG$39
zKGcH&uDeHGKp=;5IVP7oPp`KI{`|7;(bPL@K=#t!IOBD<@SU8U!k=!(LZv=1E--p9
zr_YKPAZfh=hN_jMs1GNe9Ou004?Di<cpn-?2-Ws#e)iQ)xS81X&Xnnbi~zXpIUJMd
z<eH$*QGFg?p5x8r#`u$EU=6>p8=qR;MSs*Iy6HcbmEExvb42U$u=N_68ISYp>F@En
zD)Jj*CXXxdS98Cb{S_Pz&<Du-Jn_&VEYG4h!ry<15#JlLY!2*FVk!9p$UBnkUskB2
zZU~#APhkL=fIedR8+#6(I+Plsk+IVU)euYwp{>A(Y3Z4Xwi=ne!*GGqekopHHuRHC
zRa=wXI+Ha=h}{cR_~8#_hefHkFF9+YNX@%irvUr&U%(%Jr3EA#Q`B@*{`E&wrn&X<
zfuB((es9H|jefH?JoA;??V`5e=GXlxrAr2G&n*IcnNy?gpr&M<iTTG#w~w(b_G;JU
zbwWG;q0Ine&dklAvSau2GO=U3yfw{za+EGZMx`{YYeLy>)AL@?oRCLr6lit%r(%l#
zZgHBtzwUBO@fW%<h8|K?(UL}Epm$d}i-$Q<Kr1??J1ZD4JOnaKj8?jgS86|Sofg0^
zi^tbW3bCmUbn-Ta`r+R4??+oMydqckmD^iC&Rw~@jxt;B)(*ZH?yoULAbG`~dHMny
zFwMyh34Yw(pYesvt<6o{;47l-xi_XBN;VeB1b>w-VhcJF-kk1Q+uI!oQAj2Amg=zw
zd#>z=HxNK^M3q4Kq4ffX*#Jtni8*FxB1QV!kx7GJY{ULAL<B?H6I>bD>(qNMQ2ke6
zpD_sM+a)Z?(FP$gLBx@}%cJW|2O})W@Rf$yu)V=qHZRVPJk%SHMTOytGR53(fPwZa
z#4EaQSey`c?l>-Xol5KPm0^ew9aWc>|8Kotsz;~LiJDTCh=@Bqu5P6Q0&LVqKD%)V
z3ymC6+J_!jPqk*88xZF-@yG?!G*x$oE?YS7vGouIDfuhb9!mAV-PRf;gz+2J0tC8z
z#r@^F9)m7Mg@ezMzUCoxhpV3}%Jo40zFUFM_c`UnR`v!vmbu!N!o(yU-=>-_$A;OW
z#{Pg|w1yES>+-`mLv`^dTW~7lPn`__v~i<o>yB9XpnN;gjW!=zs|P9NXjtBPzm{!3
zC>7kaichXsS*#~STQJ#yING**wSQ}o2CZT=_O&f7i6paw?sd#z(e5B)6X@W&1O8Lm
zD3<?b1Ov*Jwx$P*OLayrvLNu>AIx%01hraA4SNp<B-nq5%$o2}_s!iX9UKcMJb(z4
zfi6w}3Hy%@1(1FK-R{>@uQop&L1b6b{_zH4ksQV)5#h-wpuetkG^Ogk%bzJH{kTEB
z4?Xye;nDw!Ep+zl#`p;ob_Q@rKQz7liT@w_!`a_n&h~g^I3XD@jc;{7e*th<1Nwqx
zq%jmLzEqzbvvbm|j>I~BXJ%?jwQNa3tzAqLTOY;NUDQMtD*sNXOxoFTCvNAtC7GSm
z&YgM1nUci9az03fr<HQNAY5<MJXp)lvmjR>r?7_4pRocmRZMN|UbJPy^<G!zKnADt
zM`Q~K&s0$GgkI)NBqcYq^wkfUr{ri$IrEDce6&Sx0<??;LO7bCu>@Q8)o-%2Y~$7+
zH7_s&kNMjO^OF;`&Q7h-QFZd9X-<PP**tkEtq;V#ADy^u7{i0{4=<CIJd-%rA+&hH
zqw(kXTJ_yu8`I8@^?sg40X!>B-qAl#anbYRRprK9(!-W`qJxOP=4FgctEr@$Gl8-A
z9w#3tRGP!*4Xk`*mT&zdqGD(Ox<p|LiIf7mfQOb&aNtW{;k_E@^B5<qO4<Nl`{-63
zCZh>kSY(}`Snk(Wel;O%kHG9ZW}yBRUi6|Qo`ay%31{o?iKjhtnR$16mu0$`lS_*`
zw856(SUcY>yx2ly^3b)oT5UgQNu8T{?|O@;94Bw?N%StaB?bW<Jl`};uO|g^k2wVk
z9N~$rpr~aQPTNM2z^|$NGX>Du_5DuZ=?=6>Et@Vb(OTEL0+-f~T~S;~-j#w7v$;MT
zwOa&*H5G1(4NEVrM1Kc|_pLwd6<!IC#v6wX1P%&^YkSA5)+@7*&jA6b5Q+~KtRUr1
zyrZ?t3yLY7xt}sZ$ht_)U&Z`K&sqV(P~C4=!^{4A_0M0!`8xuHh%Usfo*TT@Sm_5I
zVfS)THeiz%48+%KHVw0ImAvT)=yn_H@t)%NxBaXDY^~r(EP(G^zn<ZT1(2k~U+x`I
z<sOYR4;|c{jBH=#7%bQwxo`oz2+r`(1223=tt{~d3wBduILlI71^Xi>I!Z<Uf<K3O
zEsVZK$n`#U)e!Uo9&FW)$}65<Z=aDGe6aFyZwH0n+ZjdaG3}d)bTF=|?u6RTzrd|7
zM$cOWEkL_a-n{n$<;g^Gl-gM>6IX%#6$s8~mk9z~6`l7fis=ohYMO3n-`-+VcO$U@
zK?oJPzw=<)nc1q+{#1W09|eUx<RET$D2gq|Dk5Mdkhc#A`&>txHr>rTi#>l(nWV=O
zzI8b<YB8DdxZq^}V#{in-BRVqOT~`8)|{i^^%YtUlPh(F5yE$zv>^qlryEh`2BWoG
zpUyMz`*($zMs6=1gL)?wZZrX)lydUw&u@>gnUlZ^GcMo{bFvSMNlmQd2$T$qWoQ(q
zNt5m_?}YtBi*j;BgD>TWLzbN^amUPu)9wC?DNlY&4>xWoI3Q$7V^a6d1+DoT4Rv)B
z%qG<pWo3))mSt=e_ge=7-#KF%Mr`ln-^K)yB0PZpr~tJdN@BTKJ{E4?3*PN*aK_O2
zevHcPXBIt?;>#Qs@+~o6fN-M$*d>$RJ!<*@JNOLQ2hdO#vqscB4R$Ir5qNM(&_a5v
z{EsC#Nx5b2Rrgz|3n^MJv%!*auoQY(lrJ;f_UGy_cNz$PPY<*lmS9UW@@hD!f!Jfl
z?N*$7yY9R3B{BAl6`@o+C#8xvs#AFNk!_T4km2;liUFiu*{H;6$S!~YIZRYYnb^_n
zenhX?_=9V<;pCsoxxh_p!AT}CB%3{CTh-^uJwUKM@KdL~fkreZdY%wssblxByI!hp
z0727#$^%yB*Z*Ox|3PrX|3PpvU;u3;>c0RFz-kK8J7zVZ0nZA3)<Ufo1{z4(U>~ns
zmX!5d%qcck<fCU5h1c@;c$-T@_i;0~1)=HXzUL5TNS*!|v%lbv;;V9_m1z)94WCWL
zm-yuRu%uGM5?l{gg)d(02K$hj0Z*a=Il40+>pa<@&6*EnJ%p|2Y@BQYHgYuA8#@J~
zxrR98mU~Lorof)cI(aDMk^?jjbTs9JQs2iz8)$4xZ_oKI4WTZmQwLp5@Rv)j4_#(0
z(ffhBqdgh;R*@$6tGe1^bVS<#QSxImnFG>$`Q}>dAFur>|KN>-_tW;`DSBLr9-6&T
zS1O<GAuVus`V|9GJXP#xU=-|VqY<>$XMR`5^%xutytGiqCf%R6cs%gu#pQVcj}(08
zY}5Z76O4@V$6U1asJ!jR|M@a5BmT>b)FU#DSyLwOxQc3wg!8#x(?wLEy{7tEQJ>30
z)n2%AxWMjkoCc1Kcy+a{|G}4u!5J0<2<lt5hp!agZ!gLNEKmU>g5Q1|<|7xV^KQLP
zv2R6RvM^KKHeq_8LB+K;AVQIw^mVF!{Tq-u*W_Ueej(sJ=Scf9b4H%oyy0Cii?&6Y
zRj`(pcIQ0Mzdib$R~8~`fSLa8a%8z1J--mPujaxWwsnU_I0(AQ7VQt(iCHK6W*($t
z62W!?@dL23$>-@{-_oFE1cXnyTOs&shZ1s53+c!s+INfCCLWa0u)BoG?9XMQO89Tl
zTez}OIuDo-Bwqiwu8Mh#R=7ZOED|FYJQGAqKiYXvOPeSv2a>1Ned!WBL=<$ai@=0j
zlkgaw#$2grb`oe`HtYT9OFG=dkbeeYalK?C$^u}=p(kyz99W(7++ToE4|W4d42lz(
zF_c1y$T^iz>`s47>A|%Hp~TpAtHzMhC=)YlqOHyMRjwAgh-1UnyX~9*(W(GjQl-`R
zg0SsdpyLyI_D9W4hh=ND8Edesj;`j_LKBlwnI~N~wz}huQCYVdHKlr_ZY^Y;kQfkJ
zOgWE98K*y-lX)+ZI2Tj${LB|-hf@EL)2uD7r?ht%zZSH*E$EZzn!Ho_Fgm?yj=DVh
zG8Q~q`H=ad{9vg(juGNiPv*hnS|v9A&8(BO!91Gs){OrX452;f(aIvK<k%nVG22`(
z1=k;T-qFI-yD%fQGp(=P$?*Bp95tWRBxm4m<I9ZM8LnSMC=%HN)q0k-I2MC(Aw?n<
z%QIb(Wd@B~TIHUjt}(!BEcu^syJqc>4X7-WGdm_8lWe%3^f~->S(N2WSc&}7=NPAz
zxzNUJLmq|nWvAshTWwh=8@!^!B4i%5dk(f|_h7tta%Q{Epxd))!K7k*<80OV)B}7|
zK0nu|2c!Gl`6V(F2xYL{u=@<=S5BR}n)bcB8RmBVJ9_651@qZAR3Nc)cKoAW)|uk+
zOt-9i`2gc0@pgm#>peA&)RGquEQMID!_o?7zPh}TpxlcBE-xJYTY#TTry^-SJI`*k
z+g|Q0U8}K!94S2*^bq{MQu812tYoMA{^*EKn7DuHTo~a$6Tsi-0Uu7M%L|2PW3J2>
zjQ+Bp`&4XJZwe9v<`rCn!HZ%;vGoVVY}ACLCOgALK%aE1Zy+wOTU$5F*GtGtORHgC
zk@Xc;+LPS^ruxc_aJtfz{WY#4i@F8vdRO>%I)BZSN5uy0@KNn<xRwWblqWvbtxi=t
zQ<gt)pR*eG$Q4|;Gk2RbGo6Io2y9GiAE<%gZkrqDDcNU_$<MGWp6#Ou{;J+@ujw%l
z{_v^Gu6vDa{`_ZkZp?hhR)qQ12V$?C{Ex;9A*<V0iPMa<&tC<9eg(($z2b(tm>1b@
z74~yO4!bjBsR0XWq&s!lGQl(Q$vEGm*=)-PpWN!^jAeaYpJ%H6DzXk5T#tEx_L8+;
z@~Ypqdr_I>b(%_bE^OVCVpt>@A~MMhJ0tQizuBvR1xM@3|DIkvtr0s3_E=u|u45HL
z;J*lHnMHq;`f=*O)-pFX_87MQ!dFp_>BjNn<OU$2l!5Ct{(5UsMKeE6O6*LAJ)m<e
z@^Ky9J_VJc>+zSoFlV`rw~6B`cO?_b9n)*G{eVc>Kvm2qz$1DsFsZBAD$iPzN5zG;
zs`u>9)ZWIoP^G^dVKz!^0)5Ndf72X{8ok~+V=9$ge|f;2P3v`O`_<${Cm<Pk)$Er%
zY^#!U^h{SM80X;s&W(?CM|k3nVrgnl=26U%-KeG}rHG*OaDAjW5lEl)yHJ$Y4j_AZ
zyE{l?;A8(eJW|gbpWOvse&UQA-P&W1n>YmH{8LSRH>0ba6)9uTCLI`|HZOf24v5EF
zy4pPB2Uqh3nrrM&x$Y+8A&8iMiHPr-auskb&x1<hZ3mK{-+?)Ckmsn@D~?J@M$#6h
zz%dqwbci8~j*R}LO%)}AU+bb=a?XvWZTg+1hF0^(6Uk8k#m?hXo^_CS5EoCWiT5$!
zQv1+-`b1Cm4H4LX%pH!F+>qPsyKI@I-rr!G;BfKPch-+k6*lkO6=FE`Lh}W$XRALn
z?Cj1-dYMzdMYOTvJpsVKu1ueblz^8Yi;I^ddgrP_hZqh2=w6O2zEVE<mE00DbYV`#
z2)3jpCq8Kym_3Gm>+jMzaT~vQBiOq$^jv?}PKA|Zj%QuD)pPQ8dqTughxuV&xwAvL
zzg(`v5q=@F1{!1Z>n2i%lAoNU0GPI<qyMV91NO&irDeb&83=E{ySVK(0K$N=`Ez`<
zrIgy?Zyf9~O*L~h&Q;m~TTj=g^lJZ*;ES}N5iqV5o5`M;v_qaXD;_pJ<NH1q1-N`E
z&%BLS%U;V|{%hH*(epU!)=GC#$Svd@@(RyUJOE}nn$kLD%+>*-po{hj?qO0MI6;n<
zag?ke5|3i)e4b|@RlIMs@-o9QCP9Vn^jkyprNlhd>~bNCinn%ZtXgVflfMYPgb&ZV
zFHoK+F?@5GS=8DQ1xVTgpX%yQ)W^3&&iJvIpBI6!+2}&msd7@C3>7#0*%Q(79*lp_
z*iIjV?LwcJ2;6^3bsFf|<7%Uw<o$Qs#O?w>P-`cy|L-$0<D1?Pv!y%x87P&p@31Ht
z0B!;)?8oprwR%@Gw~3$%4_$_B<I2}>i%k_pgh6J4R(9H*b%b?-_8gPP-Zn3pIZoxN
zL058xolRSJkM-V$I<V+|Pc5TW_tXH`EtPU#+(|Rf)Wl5#Q?Z2==o;hj{#YK|)U$6G
zU=P7@hr3*NV>-P-Ga@V6TuI93_PhAf<3!D>AGha<VJCshZfq#o+f1O5;SA<hH(v;(
z2>;m*Mwa^aYOuj$v6j?n4bN;XDfyzy7%@^1&aE*0XCmeE(Pac#f;h$Inj{V*^jp(@
z%YXkcYF42<b2L-4(n*<cTjkuwxZ#I-9)urlz=Aat_hOOTyCBi$2g;4n#u)*`azK`P
zSO>?C>XRO!L|XQXh|N8`BjrJ@lv#GAf6Vlx?QXnibg4G=qaWPdxmNowrSrJ#;p5N$
z5{J(|AILP;M$PY9sJGu&k~4EF08Pr)&y8NfIInrP0P8)t#C&OlA;+aeym(5ntU2Kj
z)a*pvU*AX<re_l!20z=|I@_pi`d2(<+5K;8ovbO9HW!|cp81p0)T-jb(3c#?60y=V
zLP+Y8o*e0lF5%eY5-UPKEdNS8mwDJQRgZrYd1(MXh$nqguGa~2`#|Sg2b}lmB?nz%
zk8QUMh04jX5UMZ{4mny!CkcWskaIg`_;5jF4uvotY6Wx*9J~n%5M9g+@^%AEb-v%e
zf_1tX@buj=!K=aMtSGU}0|mri--XC36rz!&LHzATb2NFt!@w=aCr*vcyt}yGq<IS-
zS-c_O^mQXd^4$;Z*d6BJV?f=ITMrpb*!X{8?zQeuvWI?tp{~w8{YQWzlb{`16#cPi
z)m918(mDCAW703{!hgficwKLIn`tBZE1&Z)i}{3i@mZ^0KiXtUPP-xBH81)ro@vLA
zOwVH9?(p85l%(hYg<`9#88;IvJiOoR>7V-OrpfGwyR`HEfrl35XbjBwMm=1TI=Y<Z
zY5n&0UA~*=+oe|02Bq@!23~)+V`a({{Qk8y`CeLpZS$M8(-K+d<62w9HpEgr4<8(1
z3NtXz4SWrJhcyp+YYvVA*fRW!)-OZ#y}e!Z4Qc>5@);FdP@ALy_iU;decPscvij{A
z=I%2;Ed(wRZeesh1@Z+I7H1p>-_>GKm|9a&IH)DkO?)rcYi}TN=1s_C7d1vdCTP|{
zZqVAe%oa|f_=>|v_qx7nnFptFk~rGV884I%JN9kvp0FtTHEXwP6Q1pu_3Im<lF|hV
zhc+gOFxM~Sf8R-dac4q@LKKJT1+N6M)ofP5p8Qrp6w>M<SDN@1<Xqo%bidop6PHJn
zv@=T05lb1BFwNvle;&e&Z&PgX*$CEf<jxQJ;VIdzXjZE6pAPw@GxO$b#eu7!X4Bn9
z@fDw&>uyVps|hQ=k{#M}_-b@QD#6-!d%qKF!Ye=Qe(3QbaL|6;ErRZ%qg~7`lTT>e
zi_GlF{JP2TTsPp&AVs(BWnsb@!=YH}6YYrYoR_gq4-a2m91pdjULLGH4;}Nn1U4wI
z`isuF<yEgX#}C_7+WBj0q<)}!uyxb>4Y!BX^-)?}M&gr}<?z`#<zm9Q9%3rZ=-f;l
zH<QsV9V^%7j)*<;ofMf@X(>`JkqrsB^HuIgr=_iW6$wcY3x_FaY}-^@1Y1GLt|L~c
zJc97R==2C)WE=c+Mp4pr-cQ=6g}Evi72rL-1arirGV5fhktlSe|5NmcR_gEs*i8q7
zsh%2BnEREDb^%eerq|=ig~6>IJ?ka7XB^hbk9)H^^aFwt6sz4ZSsA-&NqKNNnpyR;
zOR%T_#k=(t1_LE#dwsYFoEKPKX;1>T8obpS+BKCDIms83NuB*ZC8!e48WK$3Hfjc|
z2$)VCa5>=r1)UJu)X$!R<-E#`1z%n3WG!p=elr#Lo-yN?5ZFcdTB>&V9N_d*{*oGj
zwuC{X^<WgkfAds4lgBY$#4kzhB-G<LEZ#PTHXZ+~<nHc2nlZ7VRMuoKV|l}D-?FEB
ztg^H1@kQVwV#4@8<Z6IL^}(CfpJ)2VAAmL}DgavB>oZ}L>#>=?&Eo<4nFb5E(lW~*
zBWBTO)gRl@)1Pq0QG~uNIknuCjchaMml+i1lGE_iZZAK!d9SKeQ6QQ<m$f(TTeOk<
zQ&9!Wj1*yTKthng?ch}d6Bua{sc*7G?jV`8(FJ7rP2Wuh{%6*q7LxX_&zWtD82{BG
z=aZ-hPNjM{+HbWbuta@&u?oUj@t`55u+OAgj(9~Nng^lyy0rf30UNSTGx*Rd^L9kx
zgiacg8{TX?cp``#onB&KGr6A;&$RW#-~$~V5o9JF0E_9xmaH@wD^PeD?R!XSl72P*
zX>hLd{vqS*vCY!|QFHm;8qsp@M-5YEZDPO1(f;SAO*roT0qlpD*P&Mbs@oQ1Ip^M<
z1^$8@;bD{S7tP20pQzVAnQrC;2HeZXsm}3GG%x;&DytcEzs1Xx#VYc4&0-G7UPae=
zJV!MJk!hjsoPPSN=v?QUE?3j1JG@COOqWh+q!wQ_Tuwewac4QoI4+}M&8ErMRP`Pm
znIZqxxq||!=*%K+>Tf+X+5wd?bCpuyMtvb_(WpMo)ogDM3Xm7Xj7-<7rTa{A5_&tP
zEX+GVW$APCJ+v$_YAa!x{3pOUfwN1gj62E2w1_Pn#kk#ElQ8`J%?LQBAA(EA&K$^<
zdGo#92ZeX7JU4W57BuQpa<|oeCe94e@?jPn*&OyzZw7^nAHEN2Jy=1y2k}z|Mj_d`
z(A04I?L6dR38}LKg3%6a*W<}ECtf?yk|Zs9nr|Z<r$1ia4BAXq68cEa)GvQFHDA<G
zjyxP3^~gL)?8DK%DQ;)Q2=+ZJ)+@Y0$m)o<OLuqVtE55h{Zv!fFA#q{<j6Mk)|!5%
zGwy9_-8c54r<Xs7-iM11)c9~KhHfv&m!F%nE2oDodNgfoUNNXXGZ{YtYo=@M<X$Y#
zIVqQvH}+HhbH)e5h_oI4=KF8B0d$>ZMkWU#zF^l#K(_SP#_r<#wcs0{>aE~PhO|2R
zHd4#tCy^_94_7^!0RZeYaG&~Ob<eFTmHE(;4)}QctS*VywKXIN=vn&dB3ZRy0+yGc
zV|!uZGtC~f3y`(24>vv4{Jn@)vOQ3w3+_E|!e-57509zqEd@4Pp~G!z@;7%iR<ol`
zi}x>Y+{fI?xbI(n1LROwx3CXh9R36DbIQqs-Y9Z4@hJ*Yn*Y|@+?U|S5c3Q){W^Ps
z7cZ;U&9IOiEw8&dRjsbr;q!14ETc5-KIszI^lWpoLU`@1^%Tfsp0moMjjKP}(l1&2
z5hje@uW4oT$hQ6N_E7$j!ojb+#=ncuJm1}V`;0<+HTQH+r|QP#b?*ZCy@PM$%vXwe
zxe$n?4(rzD*oY*B%7b{03pqOT;86&RDD%4HFo)nsu^DdBMd@e5;=Z1rSxXZBAJ&*J
z7R7iI6!Y)d$&cH8BmNJGO+610;Ri&j0=GrW$bUS4(~T?<7VgDIz)eoMtf00$>%;ut
z8>^BQdh~6!x&Wophuu-NaXdnF`FocSgOMzgUl?DI&hc86J+iYz4gI<1;^ah0fC`{n
zF}ZcN8Qvc&oKI4S$!mUlVZca@bKUID3_n<dq5IU%`!arXTrGS!Blz5KI3a*H$xL8L
za}V^0K_k?Uq>TH~FGuj}+8C`58NW+d;xQL%H4a|TwaqewJ}EWH5MfUJ6Mp1f_pI1=
zVfD;B(p;aCl44=Ohd8yd`?s1<lqGA<j}R<g2eMfwXsqLNaf-X6uOz<)wOH|FnIB=<
z@+u0e)*s}rG;B-9C0@D_vRxuBgV{#8Sm5NU=~sb|?n%s<!#URR7}L=`C@{JI4-ZUv
zcL;Y=@IN$#Q<-+bKhE6>5=l`$)KU-;y!C^XFJdHKCFh2>R>WiNdy;QDKmRQ~RR2A_
z?d{Lk3=)QOzgx{cb*n&$OHm+Dqfx0(NY&K)qn{Fo>=oX>nm&2nS6_+rE6&SQWRH<g
zWL}?={%N4a1u|9GZR#jImk|<o<AFz|dqwby7@@$;yzoWw%pJ_1r;sm#3AbScI+&h7
z<cmB`umu&Be4xuDAVAM+?7x}o0*pDNstEx^i4V`kO8T}`Yt!m#X)z|xA3+ex+nNGB
z?WVlX5l7P=lU!JR1PuJ04Hrlf!qVYF;GX7?v;$yXiA(k4i10bT{=u^G(5Zc^q%4Zo
z@i|eP)S@>0j_AoX38{b18ZJ%=N*!>rAXpM|Iuu&Evb}j|hZX6Sl~?Mrf7xpi*@=l6
zv_ucGQuFJg^rqR3yrLDzfkV!X`#bVmvYQ@nc)%8-mM;!_c(9kfA|Hspo}N259^uh4
zMNxTlDpzsy-H&BD0DHzl{1W)i-26hOPjJodQoZ0IJE?@^>F?3Ln{C^CHW}#Hcx;V@
zuLhroMKq;7;A%QHj~!gR>Jy`TayRM2d{%Aw)>CxVLps4@<u76Vh1m86(xz~++GjoB
z(f@p9zix*L=967&<!WbyuRufT%rdqYq60RD_|X9MbdhDS9BgRLq~O0FROLUdG5)H|
zKosee?k^Rw9Naq?F&t;59bcPJP=3Mk2Pq;b+Yr)c+}r!VEPzEs%$lA+0g-+=zd&la
zlP+Lk_(>IXI$*K{I|6>uW%BrA5o$nQ&qo0Ff`8vtzXxZU?bCT3_s5E@$bCT|A8F=k
z<t5RGT^cZe2G3`E1_U@OE4W{4k~sVv(_oP9N0In?&+tA}|2~69{HgaFQ#bBP*=ZUe
zSThdbH4Uq0s9zQeix7G%4V%;<ZSQ)miS_Y;ptyi8`i#wdx5;W{1>(4P!u^7=jmuM=
z)<9_&4nW|k?(=V^uLFN9Kq6|PgC0i*N&Jhat$@ST$V+tOf5F@bNwD+C+~w|%tl<mB
z8XdK%#&<>#OX0Hi&a1}~cx~sG_2vL^MZYWmBCs3)6<zWP5h*p+%ODnh?$x#^x3iwx
zbmeGrL}E2-xL`LZobXa(RBzsQu=s*wL6Gv{82?Jq?OnOnrJ~V-0oc(+|2iEX)}G%_
zJ50Sd;CZ)WjPIK$5atea=<VvkGDCGp3W|UYL()<&#i<o3m;aXk=@d3`2OK_%_*Ers
zU$n1Z`K%auJ1wMSH%HxP<q{2noMXjbWM90GZC<WvB6WG`sv-ST;sQddg0jbu&w9V{
z<L-K$$Qaes1sK#TkcKB``?vbH^LiGGGTsjdA%h3=IK8O>t!z#6ocI`d?dJzlB%W5E
zpXrq>ejoT|0)RvJ`ePHX?2Q~`>#3zsQ;1J1;urF*_`mwd>ElMZ<N2|TBD1dS=fN$@
z$=Gv2JqsvMRg<wJGrEYJMk_4qJYsl^I{O%OFYqJ)**5I%&I!9&_s&}Ig6x(0Iksn{
z#|cWO_%8rFcVTXRy6E05w1pkz({PxL{9Krwb(syi+(VbsHp_2ceq3iGx@S*;@cSe?
zPgkqU(-ke<n4>&B>r=aT1n*JZeyqEi+Y0a!ZdsA8^I}9YZega<!GU!t63R0hadLZN
z3*yvS5AQxv-@?xe)||NuPCOpsNd{1$);`yJ_XH-~WWsJj%JIIb-lGc$-=-yRY%`-g
zYB|9|*kHQE{BRfcbZB?4>^nELGc4cJe5L84`!H4-OB4?bwSodMop4~_Ug=Si=pbVV
z0^TFR(_9S!B1FG&Z>zJ)n~q65C8_Py0lCJ*VH7kdV_So@&bIe!ZWF!=x{w>?7JKdj
zL1s{Bf8Xc__wKifc(H+vEDM7Y9-rb(d;GNsUC8D|hdh&}lp1zaoW$+cn)9Do@SO_H
z4;Xh;PuzY2v$BK-ZHvw)nB`YV_P%~Ub)tn4)%o_k1<a@Zr4yh+gq?2nUu5|5`<V*E
zAIA{a3K@A{W<8nVC%#($s!59`m5VRX2}@!mJ|6)g`*Y35Lw+L=>l5_6)FtzdRM0ZB
zeUYHs51H#oyAFit({dJ)Jsy_Qv2{<4{r>G*<=3>a)fgChL)tPkh0m%;NYAcF7(q#$
z5a$rf)k@8c2JbwU_Bm9na_O;^w%mAJ<vGgjjqj_;rz0OELp9Puu#Lli$}~#g13{Yx
z*=RGTk)HlVF2}W@?D&uwD4rYSkXtub=hU}_S%`+b;F@SOQXKX1O;wd#`QC$|_=SsH
zTUSAE=!}Yumvgn5`g-@5`~YdJO8Q~I13GpY?%~Oy-5w%vg3?av4DF=g)4}L@7n1b!
zKu9v2@ni^KgqCOMOBfGHrPW^)GTY@HjUkfa?Au(7<aE9;%0422{t01Q#8zPO0?;un
zL(&Mm0LYayTB|SNvM95j;AJadydVj6Z86;7eQ}J;#70zX@GZ=D^Zg%WP84^mqTx%4
z4<w|S3Deou`SSVKaHXADCUZb!kX)mxBneV%S3g+#pOQ@eqA9>asC}zIM#Fgm!UO(L
zw}u(Wvu~-`RJJ2+vk<~XX&nI$>47iGkPEf;{r3qeEApCJZks7RShKwaOcBI1xM+;a
zi48a|UT|1v$?V-RzC-IfGSBJ<AL(^1MxUm9fQCHbs<qbXUtFK@Dy^fnn@kYB*jEEG
z1$IIXI5PW|Vzds&e;gI{Bey+Ws_J~1kH}z%p@iS7djU_<g%Mmsh&gqhBWgNNfq2l8
z36^LF(Qn-LA9#|fn@OUmU;_j4p7O-Fl2D5QUXzefZ&{^Zbx1+Gyz`K~V<q?W+<$_N
z0?hB_v1Wf+*)NU*_!-r4-F!+sB|t+`F(C6}d^*KurCU)!Alo7Sn-IN(gNFI8EP!X)
zQ~8q9fzA^Dd5sY$yR#Be1=v<`_7}BP&f05mOT9gL?fQ5{`PYcgr*P@K8GlvxZ?f@R
z)qNxYeor}_wn1|?^wmf@U*DD-5u<~$D|_b57DzBLR*kul)i3iZBVa5Ts;jrCkMiau
zc@JY6_cRD$NX+;4uGWBna?!v_o>>!EO=OQQecO1XkP%cBtKPL&rrwly(7S@XoBsTe
zTssg@9xw=jpk#gVB|YdOi=*f%O)WySWlbZAH5>&*3h~h}J;pB|Fnh09!!v2$z2fj-
zYqg!q0=<hJ@owM)W$b`~`84*XH<$%gcf)v-_=>S9Ghj0HXm}^@gBpaGIo#Apz8x5F
zlF^%36LGwrvdc-j;9@?H-tPHseGk-jYno!BB3Vc2UNRr*A{H*L?Didi)&fM9)tiZI
zj-EQhNq>1EOmAFA>H<`@Q_Jiqlx|Tkm61Bo+XvD@<NA@&<)=kp>`9mV5@bK1-ae#z
zcsyvhRQXN>-!$F~q5La?j;*~_y82jbCCY}j87eRHcgd(1O0rq&+>>#jwVZKm-&=D$
zY%0NSNjsre-FN%uxa!dt1Ua*9`%+3q+$KsHE_3|waWl(y{pFB6{z@L!uUYkSE=bw|
ztLZ<y$B=w*BYS^qBG=W(CuyS6zsOhyRt?-$<Hk~Q7`VquMv9wEO3aW(=^nVi{8%f&
zF5yzO!cC6R{1T2Ah58(4zejBDp|oEd?PS0P)`I6NEOa20F7Zp^haX;6t1*uMo#i;U
z^sewpXMagB0nc`a8sLD*!bH}PwyGSrrpA|9&}%_J)GsHb)rZ;Y1NoW<u1wn0dhGi9
z$H}HKuH=<Ev5x99#4JK8c=n$+4)h3UBm#6sAB&^y-+aec_K*K<VL5>E-d`5?r41fb
zKI622aXH+tdS+Uc{R`f%noS4h+t8oq<3G*^IGr=g@oHh4o&l=l&ze29UAmrO&&VLM
zVj+L{JtKk$h`a6YZaYqFsFXhw!EAh)79jmSlHnPvFyJbCSsk#6=l;<iU0n|axlZLb
zQK*<glNT=fOzlxRtxM7$Q=abst$C_24!Ch}(^B8KU+-QcRH{K9nkPt!rRr}c2#P^=
zqMi<y*N>za+!kPpt4HS&gooSfT?dv9ZpVu<XM6scKZA|Pq}{XR7<C)FgRtm_wya%3
z)*Ys922uWEB**z}(25h6^>up<A9cTvR@sirJTf-(+|=@rWDiQj-ElSPqn>Afvl1_P
zA>c~MIn<g}--I`|Ry-t~G}UpWyoRfNy;?U6ei3eNm-u~@rlwbCR&!BFQ^K!MsbQac
za(Ly1$=c1ysB%gG^y~n20dO8+$CpwQNXMP_+ovib=NGjP7kC}m!Z7cx3y(rIuIk=T
zQ{Mkp@N`#W@Md5+o3>20d89;Q(5Q2n4cz!uMzzK)0WbVn^wz^uo>x+LScU>a{#?}M
z1<wCVx{nybOS=*QFOQW1Y(hxIm?;)00<sg6GuBG2`purS=1E>m{UepD{R|N>(u&?l
zMs?1x%m^%$W?F<q)zPXG9D7%Fmi5C_tmN8lQb!TG99s<~U)X|v+bL{bz%Gd^PJVVn
zZkUFk;ky``x8&z<7T{pp<<tfhgg83j2RJ-EAinc)(<)Li5k{zN$R!04Rm<30KlLRw
zY>#6%>=cbs-FQe-t&92t+jL#u*upUfrJh$VJ2u4x&3mTbr*^k(SW@hehu(yAoY}_W
zQ+n}475s|AO2OJKruA0tA`1o4u1#AJNUxUGkfxl+y9*HZnjRk3`Q1;ow|KPOL#LRW
z@$aCr#vvt^U*vl5!YddifJ1L_%%RVfg&W*GJ#JgHoa%7TGAiYa``;525Am+<nLu{z
zZq<`>`z`7Tp-T$-+#7#8<_J-i9I*W)A*c|>^`27&IGNOPtOYvx#|~Y9dIg3`$is=O
z(~W{*308jJ6=Z&<A=d^z{ER?Lt#w}5j~l&4%-D`ht{5)WDnf^|)D-b2W#pG4*L<XH
zd+og^*zNMW;O)Y<84sx>gCk-5EAs8i_qcf#di3W5dGpPwI-{sWgBKRTeOitS?OGpK
z6t?`o->8PwOw_rDrpUYG)~#<5G;o%~Rv+Qo$jp@cuZkz!4@#CjUxP&9qo!)y**0l;
z9h&13ow<FxS1=F*$RC5H(jYZ=$#c1r>j?3k-jXgmeNEY9cTFAg&#R`p5tz;?<6Y8b
zQsb&Db{q=(t}ssef%&x?VPTfr<TY3`i6A%4hT?PuGriuyYx;qm+WJ)*YtfcH5wAU_
zz(Q%br7;lPcKK(%q8^CSLU!M8IKGqvKyLAvJmfzb=g%~Y;c@LlD=CL_|1)d!|C==e
z53n3+)fM@1yiXMu<$XMM7E92{Ep6|$0Ke`i*JJlG1Kx>6<^R1AUgDcGlJ|Rm?$Z+B
zkAe*@b=^#UBv2l)M2R@mw0ND9qG$qrqHQnEydE^M<;q^HK)7m`uQrX@x;wJ+0ux+A
z+J_>Zfl9}6R3mTPMr3h2oIPL1NytL{2tCJGpiutQ2E84MeVfNwkg>O2fi@&&XbhHV
zH$@!mAgHD;<4t-|H>As}vi<TViUFrbRqrKRvkWvM!s2NDgJXvL?XQYJIFA`N7VNzT
zYdUhlR_bYM*hwM9DSJui7;&PFm>IIrKYm-2hv%p_X*fo#>3%vhfh>*q;>HZw(TR=@
zA>dK{AvR7wZO+98+(Qu8X*f8Ke~jGDdn>L+<f<EUUK4C1ZSOpWvMY$5lC7AqtD<)F
zXeaXolaXnox|q8drl2+_%tSvMNja>?o8@D5V;*s6ruE+ax-EP&&?*Al8N2CZAN4?J
ziUz?j&tUzh+cyRO9re^Dpyl`%t;LY!$)yWOwK@KNkI%2AEIcvh^Hx7zN^$(Hw(1R+
z)f=@`R2Ah*iMOe=lxNviQTWSA(cA~Pe3A?oWUka6=3hPUhvu)a8g7<REUQ&`%XIRz
z#%oebwsn>va;=Rk$$^Q?$ob6EI`&YVQC2_Q%bB)$$7YcGi~G2_zck^2e@{=LcPiSu
zrug~jOh8^NL3@5~sCI2NA{v<f*a1P-2-x+6kFFim`p)$y7&OjtVG~UflOMffpPYL}
zW(y8xp*(EogA3GIsWwik-~#4m9fi#92zXu$28W{%86o)_v%!JQ3^RE>*In=<B?SzR
zHF~F*tqm|n2SOo)O7rV(2@%T&5j?@7pj<Q~PZK$q?Fr!YMwL7X3!(Yrp5@I<QfDe=
z<|s1MyBl(hoK{SLGV;C6!oXA)R>$SQ{pwRu#<A6(^Hc5(l~G&7a@W`B-QUt{FI;Dn
zE~D!fT7-VfBa3eUEqB$O?2s1ti7()Xhgsnpj}DVJavMq6=s_-5L<V<?F#dTEHoR|C
zCMs`Q3uShWcOsVqy%iYnn=P-i&7Nd8p>Qx+ZQ9GzL!Arr<*Acr3L$lC4aJ(hw{vQU
zox|au$Cs|8sYY=i1R}?>eR}Q_(4Vc)KVx?r=Y=YUt1tWZ%;N&Q<3$9Z32loUZoiC5
zERg10;)p12kZq3hN5i}qi0S<0-i$0(uG;6Daico8Bm*7Bjj>zx@X;dCNuR>(C6o&(
z`}O1jw=UeSSD(rHV5d2l?t8s)yGJWJJi)hTla2dTzP~l-%<s*{Blj%QH16pA*wv4&
z_UDsLq^MPT5RXiWpryMH);hz`Z5VR-jm+`La-Zq5gi}QH=SlIqgh9r&5A#f1AsctJ
z1+k#XMWjxHS(A<_1-n-1+KH2g_!0kB`(hO^ndAEd-m{iZtO<*6c}9+N>TT4hC7yv)
zk7nhA^Nb?Lm%mqI7Bq>5@OAOX9}ojiPa9?WHkvMipy^59wwuyAGWdL9y#dwbt7xkE
z=XiVJ@{wmGcuajIRP?OirKXlEo5vxoXw%58n^HYM6DFl>DwFi5o{=d7wagQ%`J|gq
z3>;qdG1@<-p<f#&1=PVpbh)ZtM_bvGM?|qTuqIV1fyCmtP<^rrcVa0Q@m+aWD`C!Y
zu2>!WD31%V6^K<p|Gc`Tw65h_tQ)c1f4@G?t;wp2goar-3VhuI?e)H2+_F~kKou@U
zV<fYj0m4-s3Q=;nH43pho9YlqDrgl{#NS@#c(X=&P!C<Mr37QTpH2#sOMJ&yrys0Y
zjc!e2FF;}LazY1_pc5;@s5?2tA=*$rTLHn+oAej4?cd9PB$S?`NGTf-O3%0?DVu=9
z$)K29&XGIk>?iGx<@}u)`J>n7T~&qnB%bYCY`}r=Ur!NmqD)A5TyKF-9h)koTSC)1
zZN|{+UZ1i8<ICfa`z&FkxyE<=xlfjKziWQ&kShNwDiu2VQ~2uBf1u`q-%r9N=rHlg
zSG)oBm6!WY*Yh{+Mj8zFnRH=7Zn+tADsmonPrljn2Yxxb`fW93!=KhTo5wSonroq8
zc25jN^JUzKtwBV-hza=Jg^fLc7)5CYM;MBqJ~{-!^omB^V!2xQg-+wQGiVHDAt!(x
zjoWmYp1{DOli%*^jF9xIY7?I^_wi{*xCnEg2C4w+f*az2O$UXFyO2Moy6PX1+I@e(
z(=bgc6G=_jK5R6LudIJn>(izq7HOZ2>w?sGF|bE#(*m0ex%$We=e&+^fXnE;d-NPw
z1R*j;=*=}mzkm>{XO=d0dN8J?G-X9QU9b0BcSd|F5Nc>}3=bK-((`!dZQ9z-Zb4Ee
zWgyAJYGl&Yq7)z$)L7Hj?w)DU()}B0L&xTfr%$eZmIA%wWaxE8=>D+A^JR}J`b41C
z_l&9>Hpis)tws8_@T?O64_%EF^=OaT{&Usi+>@92eCPNG>|f2qU>-iJ_eQN=2{yOx
zoK(F2_wvor(0E^vJ->r@&*o{sm*6Qy`MK4q?PpcwS9+dX@o_!myhQ^)n^nNp`wt>L
zMPDI_U19PvS2EP^8-=7SNT`WETUg9$aw=^!5;ebX5p@Hs9hD^elfVH=J!4VgKPB-L
z9oxZawS@y$JL`gaLOoJzoI$FB-E{7G=>c)_*9G17IUbmrQDZpJX1*oboZUxI8K2J+
zw-FT?{8ouhh<YO~;d0vEz~yq!TGWCLBkW56YTY7PZxo{vGABHfU+p|Sb3?T=__55y
zx<qUyEgsP2XK<H(KqhlzylM}Z3x+V)M&wi&H@xL)9+)mOz=&`+`-=XZ;uWN^%a`;C
z&h72ZJBlkVJoY<@^*^Q<TFn*uf|>r90QhLx_dpdv>!1s6>F8RR1?!HsoCo!Kzi<IG
z9ZAWD!)o)s0B}t4W9nxGt+IwP_o(;yOMkpXmZ<uB??KHo&hqRrXtb&t!*S+_z4%~0
za&FkjPS;oHH{=p3G>-D}J_uxeR`#*H%;B}mtGge0Kn{zNe{?S)9X#2J96YU8G;Ec0
zCx_s7z`i)0h~>WLh@gFb^u`+8eXyOdK2l&}P^|0QbD-zbiTXm)N23<?!N9-LeVQcl
z1y{W2O$(rIVk0orsEv<C#r+`^I<!7$N(>x-^wK=g-ZE))?@}dOxIyLFf=e$%t3&Uh
z0>YlJMq8Hn_OF|ZMSN#06EH@KB^o@2?J*rK<v=#oV{{O4ZkskSZZMo67H`pwloL#a
z_KdIZ0H4aw06fRkqq@>bLHUI?4cxUsWQ2e>c0#8Zk!(R(T`vzbgcKPEaehgE3e5L-
z<1*$IUg;i$@kgFe(Bkz!<XO&053YBQQ*X+vANSMOt6}N?AsVi?1MEh(7p42>89k1R
z(g`m!j^^Zf*Amq;Omr;T8$}-hVysJ!zg~ysO#WwoHDJ2GI`~EUL+nX8rs20Ibu|k%
z1m47(vYu(SJX`y(F_U}oyVW~Lj?(%2Uo7s{>(xCr6mO}psrth6HZ*QD-)1Q%SUVH>
zSSww+=Cx^V<7(MBx6zf6i157W1$*GCIb+c07&YLtG4+FnkAUcq5{4FRBx-{{376#I
z)cCDm`TzNJ)$x7gs1hS<culcI_Jb00*Wuaq<^glR47@BoGr`0tBxpzc$8~E>!O!vY
zd_*72isH_r9~LoR70+6`Q+CP&U##?SYi-;aQQWgr+cOjj-bfl%Q^egyz|$W|675eV
zeY!Oe>7a+UyS=rB%FV4vl?#aHR%6eQoVyFl*!~(;0HQdBsCEB9lF~`DXENRQs=isY
z29E?odww8sp=^a1^ZgFffaj;q#9S*s*N1$RFEJODwwyO<lpI;q^ersu^i&~~4L=Qc
zMd(w8MC&?VhxSHHCA_DDFvTt^?*sbEov@a7o)?*$PQRNvX?!s3su$EkthGII187G{
z;At7zW3kZo%h@;H$6xy483)0)_EqE^;g5Dju-r^nD_J)~bsrSZO-2SUVk$X?p>h}l
zEF|Qy^EG>)j2!2SZ#$B6FFVf7^P@{QQ_%wB>hd0o_Ty&qswD}~Kv6}@EV-X*<~*Wo
zLwm`dXjP+IP1I->Z0GH#=pdrN&N9JicoWFo(K&mf-32r9w+us)>acDw1N?HIo*Iv5
z+C+m-t=uhAc02UNr0?bYGN#-@6W69L`3<|3hY{->P1SaA3nkh-E=2a=O?rP3NUMR?
zhtsL)<X9>XGykH1n*s?_)2)Ij)RgsMS+_tWyu?215Me-7rUowe`Pz6oWs<*h2eMS@
zfzO?H>vNiWS6h3I?8Wgn^J1CWkao1ZWh`m&3=R&Ri>k_7G!XY;?%2z|0Gp^Ul``Y*
zlsMn_9-_;19q4^zo&GiZZ{GgD8o>XbCjqASZ-ybD4SysovxaX*&v)N^C%MRx*))D{
z?2hUsIAiUqtu455KGlrYP&E=^;ZA`+Vsn?c{&^wF2X>{&PYtMQdL$4OLA3IJ%_k3E
zodp@0gB7%B9C;S>(<D`i9aOh(_o?l{h?V>m2=S3E+r1UM-?O;NL>l7o5G7qx=w{~e
zVWP>iCb`&D#_r>dFM|9v-A;LZu9hVN^lkNkI9;djxIU54_VJ=_k1un5Xiw~J-3IV_
zWAj8Dp_X=w*&2+^*(#0XZ{5BZba<Xn!4p*VT8H2UL%v84oKag!cvL@mb#3(dI#+9e
z<n{op(YTRJWvd+6QHGr}M3MvpO+7a+W24-Hk?fbSDpTrAg57#~$D^Fi{S%{@O)Iss
zBipUrQF%hm-X6nsjQb`5)PwqtOGH(kw&-6*Q5$Z_T|lfhaIgRXspH)lOB-%MMUDoj
z*J3^`9Q4zpK)LNFmiKOeXmEP4WEpb-g1zjF6;e0!iqW;*tpQB=u<Udv#s#6;;`e&v
zeR~WZ5{X9NUCTe+9*RA~-=|Zv$}T&k*&X;Bdg_+2$IWXmldx}RPGMsnDqS5|RNKGF
zviNN^(dHmi>^XnjyOBQyH+H_HJaGG*BI)Tm_e&Ez<i2{uCG+~(rX(Z2PZtV92M;$!
zgO#}A&owCSSwM7qwv6-k)^ku{gYeU4_XpLSOsl<>ZL@y0JR4MY&oBPv`J-;v?dTb-
zZuhSD#!xnzYAvz%ej#ZYFsf0I^%N+!vHYH6dugP44j#P=MIH@Ly<brSv|H#>GxEFb
zH_Ww)pD)#Rh-@Lze=jwWOArQ(A+yQaDXe==2N*&VK7qComf;+9sLXxG&E7x66`(IK
zH|dC+ybM1>`aUX#rI4y(0zj2B<Jp3b_tp^+iV5G@`gzFlZ08}3uhl)1cJD=2{ZQmm
zIpa!q>+b{I%okdCb-%-VwE)mPL$d1aHB}+G>9Tmba%n67-)x~q$zDB4@2Z5%j)1~6
z-(MGi3)EeybeZ?JPx79-xz!oI(VQ!A+a05zF}qu%AO>$Lm}%9!mz$YIsd#c4D5#x4
z-b(cu;x%?^JY?y>?AfJM%Z9InU&oXGZ>+yy;r9;h_CkB8OkU<{hPqc9WmdY^IoeRt
zH!kJA=UcgZuF*GqUlx%fBJK7hoR*(U!{#ijpo&BZ$}G3hSfiOaTcd>{Sz0gM3lUg&
zHCynGe^vyEoM2FxP&9g*!6ZO1J;)7M6fyf>Ca_ikD-Ul}Nl#z@{1V9GM`DH_kN0cz
zWAByCo(as9i?AByZ)W-5OiN+8`#2{AvP<OjI#>VG7&)bM|Mmjgpv2%t`~i&ONhlZy
z*6&^Y2zwH|-RR~Ze#^=Pc67)-KxTU!8ZZbfF@EJI)=Fcd=QAmL1{$yz+W0~L3?jOt
zD5+_C+%{|Kg6e73aHBUPW7E;|K(XPHHc20JcLD}lH7?e}0tsptfBE$7cFQ4JtX%Ul
z(I)$y_}ahm{z&^!$L-~Rrw`hybquYv!<`(Dj(VRBZ~q7sg?Q??OBiXM<$qA#+%eGp
zf+8FZ+nJ4Mwvk{ZbBPp)!4B6R!MWvm>(37?%4@D(icS5aF3Bz%yv3Kikzy}^2oG{N
z3tqaQN;PW`RNPR+76<a!eGFCc4|bUJWyrUn%{dZ!glSoO>x=~95=ISvKs+80xgIl;
zZ8N>PBy%eiJ6-SF$rLX<JmS4i04q-BbO5hYIlFbY82KZk{F)uP#)qV3&&hJy&M!5H
zCUp|ogjQGn>s_aBj;e4W`$&6tTT45{#oH8B46S64=SK^qcOMId+D8Sf5C&j}RV^pW
zXUe{_WmKh0JB>!roZN3??u59BV(yHbjWKL^7EG*Isd2G`HIV7p@_Ry#*annDHqFMK
zfO7qFiRv0}(g<T|#jOi<7gfIVLOkB_Qk;)6;?J=@QQP7^ZmanzfAKKxIGh#*D7PZV
zq}+5~`9W1+D8lFaYr?r4NWbRGd*Dxn>XP~<OF$~`;*mZ|lGH>t`7>x2&DhVfz$m1s
z8fD*drRQHa@);|%E+z5<(2{%B?c@)wk!vFO_hHO(EV^9xM(-@m=RbX}GIN0y(Mh<;
zUG{ORrRB}s1wb~=NVsh@^cl?j`E;6`TWks+CR>;zDb^r61Ruezr?56>myg2vSCTer
z#1cS_#S#u{LDLjl;P_d%QDs9&|3Fw?DC%I3U=v*(Yc&5ljCqd&n}tUYakV95hgqx@
z1>=nF(2^ShNR$}ZOr(wBw^R{EEOmC$!aimtJjme35^K20MMiQSnJt8lJ&<B@QZ@n?
zgd<|ZA=F{>ht{1t2}}jy5<co*QXwAW3@^Ls{^&!GS+Dyq=az(l8tRZ&tmfbJUaB&!
zFyHc^v#09|drM}1aRAzGGtCLDBdXPfWePdWMFGXZ#_Hjp({lL2Ug^Q(9-|a4G7@`!
zIop?NPRMTl37t;z2eGzHa4E1JoMbZ@ZT_}sp#MM&=J#P|6JwejlaR44>%OMs{mh(Q
z!Kd9)+WE-bdpH61U>qtxXXyR%$hFGtKur2ow`P^^(LL{j>7vEq!Kc7Zm>-?kmpc4Q
z9X?D`&PI!ZW^$@sCvCSnP=Gb$Kz5V4DsY8C7Npta5|o`HZIvQvaZUE80oNDu!LI^5
zI%?FcXpipyq3kciqHM!0U|0nSNkQpGKqZEdjzQ@bk&;rnyHg~U&Y@B17Nlzgqy?lK
z98!8<h#45*y$7GYzx}=c-hUj(fy{MZ_ZjP4Yn^6`bWT32WfQCn=RX`()6y`+o*1G<
zF!X8?q@&@#!0IY=)^Fe}1@Hk&a<7kql3XH^7grfBU#1%jLXG4&cj~`vPSp=A%++=_
z)lFxJ^3y#G$P;m}8c0?uFcYQtR9!TB7PG=3xnq%XsX9h7y0irWNPYC0-=Ra7ljBv$
zb8VIt3D*yN65TF~t3<+7Ks_q6nZ}oXAEv?&U;>%kBx3-N&Gr9vd;iUjvOov&uQJ{|
zu4nwpv706jX`893X=m>CqLF>IAnIDr6AC(w@8YG7_UQQzs9e`?2pAoW9hNSlZ+)Ci
z`Aobc-rldmAGa)_Mo^ShuX1D*?R`3muUEmzXI=LQE6Q@t_x%x|{<3$VtYCck2dfE9
zgX3~RWxGvNGrCH+cwT3Ld%1IbxhqKymbm&k@Z`9X-gZ1geA3e=Kx6F6yhbK4`S2J3
zjt}~`js_XQ=qbuyAM8(~ul5H#gco)nL9dO@PlAfXY?wdPcX=81Rb6B@<Y-AsPy3(T
zGR!-ES@RN|lNe@tE=cMGWUPX#3(nlvZk8jp_!TC;)o-Al&Ep|g0R7)t75O!Hf>Gkd
zeTO5~={Q*HZa|^Lr;ctYZD95yczeync<kK%0JUx=25{IsX8VH--${jXZze?X{bWh?
zPpgR*O^lbcp1b4IEm6ba#~d^v-bJNRaw`T{kjE!uzyV)E45r=-PK@1sjwkZCncXiZ
z=o-VAfZJz7-gAuT7Z(o5_%pBam+vQZzrMT${2rAk2CuCHsvY_V9`w<J^?k7`X~J#R
z*Way%k~Kp7%bkmy75z5@kV)Iq(95<apA5dwkJ$>?&0e6i>heT(Sltz>r~DAKS8|f)
z_eq8`@KWaqx?j7sEIvJ{7lz7vvVxgrD5ybKvsKAUd=8XCqT^VhxRvo(d?jEbrv+iX
zzGGI=i-BnzRgo~g#bu<=o4~QS0_DdCk)2hyVPQ|qNjgW&N4y#eG&#y8!m*w?h?3gh
zT8S<13-(6tJ>Iz8PK=-FD-H3CT%aM*JP3~Tw7RB{7JpEpcf=a;Wh?iNPX|Yo_dZD{
z`9U8(JGxkRIZN3`5~z9q-6pQ8yi~4a(J}|y;nush=zJU7gJ2ok-i<ojk$s06WQ&5s
zLaUKlu9!Z(Tc?X{<*$al`8I7Mm+suP1!6&;G3+|)4laG(oJznCuJG7#G0e@XY|^Xh
z^>rgm$Ya5!xA>hIM;X@qbV=RON8t*Api^%_r>le``J|u+==nOp%<MEzN!<Hve(5uV
z`?Y|nO(wco;-v5c=hb79iaKIRjl#{rPqEi28WybwGK^m89s&)gb8f>9pqX=uVtOmK
z7r$Oq2Rc{BhQOHW<GT`0m+G0oyC+6cu}qB3z!>nHHw*GD-r4=?$jtfhAl!s%+1_TN
zA8aQMI?FMU3jfCtLs%>-Dg%5E2{!#HMdpdw?r_h?Q+_U~haWU3WLO>88PUKCnZ<`R
zcm8A;{gcRPts|J{Aije`LJuB_yVckBv-*e#Mokd=YL!DZQAzIl%vMd+b$kg_CAc67
z@Fl5)<uS8eG0T1l>WSgxqD%H-mm@XNHWj@C$5|$<)pg85dN@s;?Vh}cG(}Kv9Cgy}
zn<+V6S2~HuQl5^wJGx6eRg2YCMm(B)MQDQV+~d-#@sQzH2WYPrGf4E#l+)`GADG>%
z5V$$~avK7bmON34V>e*i_B_PQt*#JxsDoj(43Xynn|8T6X8DE#vAR%TWYCl8B%lvq
z6skdpV-9dV{9^FjkKZY<*N6BT*})N_{w>;~ZSxOh$ol=p>6T-?M0(>ddi%^9T&=&K
z1Lg>xQ_Jq1!UjCDFJt~qPYg&rI~hj+F+YP~RbfuzFTb5<nC!f3SWR-URii}zW+GWM
z9&2=>`Y(=URoc{}$Y-YM&wwUbmsehGpui`vWaeIwCmF9pW5)ZgDlxxzhY!Pz3{1nJ
z_#%UGKM>YEzCSx{5(IRB;Z%T#F`%WX1mlzO^K?c2{MxJUdscDPUUiimf&T$v#IjnW
zwxd&OlsTn<Flc<6GnPA?#^t1pFG<|zjljA_DIvr*__I6dyKCZo`$2)@&41kGKHj|@
za65eeu_a9Xz}u(QUpaqUuf;JWePN7Xm2NN0l#Cx)Lz!KXgNWv^d=(|Pc*=9$b2gz1
zMJ+yH?6>oNXf|f-5xypIbe%%~v)&j6;f__OuvD{Q!`W$#tks`m<^ewWmWkFzxtRYG
zT)*(sU({eSLn7<Ni^YODCqbZ;7kT7~Ig9jZsNI&c&-mbP!}MAb8;wHxy5Ccl;K1(M
zmfZzC9Z#PQavk7WUws{1UI=>h+cnfGF%F5#0Y)`s`m>m#L#u74CX}{M#Se5=IbvUp
z7Y)4xoYEn8m+LleHzjFE%Bj(S<+n7vqO+NtvT6BrjJy_!jy`_e8#9goXtz?vYMBz<
zt(s0l=S17#nUE4uw~ao#(xNh%i?d?D@1rc!sZrfwp;nGQXhGBVSLD0x4BAx9XGW`9
zxkzgP%6v0?Nenb}oT+x@vKUjc!=28FaOl)?nSOfmRX2;3XTkF@Lw5prf!mw{hbI)M
zaTib95BC^LHzhBgsMmiDGripCfVBUaRd08gujd5(d?C82R%yG9cCQuBk_=6>^%#Et
zSs?+N$^+N$6>;CY8G|c0)6F7uhTTwb4mBRjrY6GHw$k4Ei-^fmOg_NS*i}~^OEVpP
z726b9lP#xHuak*>=yk{z!n^YBWzU~7s`;h@JrC6J*?W*C6GtCYQYKGL6r5`#ZoT6p
zu<72-r=y5Y#yf^e@Xe5+e{BY@ODWBh<td_U@>$Sw&pc~Y!YCjr?KD$}bA-z4AJ~sx
z?<E<P_~IT>rPn?aH+VslQrmWE>Q&?qu~^L>oM><B=iH1!3K;$9^c#I~7{`MuIB)dN
z&EIYOOTeg2z+c5YfjZeKI<YJM-rLWS{rPI$;+kvOUf&c4Ig5BRMV_UL-g4UR)CkaY
zNGOsGxE%V4Pd>rH<6ZTp)j2SMI?3}YELRsiNuI+`i_AR;Dr+7oIdeU_+VBc`dEk}v
zJKw~;=Hb0&<3Nu?VYkgC<kVTZ)A*XYH`$+Fn>A<mdGTovx)sSRFpV}I39#f1kOb**
zT$_^cmGHH0H!*fXX$h@nh@iemOEXD#J#|HPF0m2;B&A_l!iK6*;V))Lx{?J++xi!l
zNQ=aHtb|)FuSt%lZiDY2-i2B5@C@M3KCj;6lR5NOr!2j1^W1LbbxhjFUof`&ulp>y
zR*RgFF$u!0s<}a-sv_ziX&{q|V}fk8$Bp(7iN*$(N!L2BGj-5Ns7V=n{&!UbJ@@L+
zbnDUG?JoeEiUu5*wZqD`)jbI{am#Kkghv5PrPKL<60YG9%uLwTDcooJLh5VabuVYO
zKb{=0-1BlVw|FFAi}vo`t8D}Czq)eJt&^%}QSh1DC$xIUSiy`5)pJcwkVR3FMo>{A
zFqeM5bdU9k=a<TWIkX5WpM28pdR=b2n3b}H<4qz@*L*6s@bX*>K)bt#z~->baDv_K
z4l~bi3xwTgkeX0k{6H96c@aH|PPC3O>k_7wL~|!%UG-6Xc`nK{{k{(IU6W(9GwE0{
zqVRdgcdV<%E^JpOPq%AD!<EMg85zl;#%GTY2bNcGk&mzSYBjYNhVMCfSqls3^fZ%{
zKzW~?aTrN#yjAb^^Aqr&Z<5o1XatdXlikH|LJY3^csd(^nFTIKr|`$&bzlqqZt64|
z<u;LTBQW_bnEME@(&S$jeAVNaG|}0uP%OURsNzYWq0LIXrzzYg9ON}%)qNb|-%Hn~
zw?reL0MI$3)UtTh)iOoYxlO8HY{U|mmelk~nEuiew4K1K^PE(!LstrJ=bVWctK~?k
z&?h5yrYm)D&vsvXl^a5$tA2^7oZF2v6kH3{$oaaCahuG^CGuMwJwgQ@xS5x`LC1&)
z&&RF7*OLbmMc|->L#Mr26O}mQuTrO9yaqS5dgf$Nb#`ZtC!s~q86_EBH#<;Dli=tH
zw;m8xsx<<uFH85IL4hrP#b@oSF&O4Sr#-F5e52dC?Mb~?P+v4>&}m4Om;|V0Wn_DS
z#J@J%<k}k}!B~Q4KtybOzch~1cOMr~$r39xv}F#1g_ph>2Sj=evwFqBe_&QG8AN*=
zflf)2Xu8UBE|}3R9nRs4@UjRep{b1<viWz5#rTB@pd?YQY01ls`t&?J=5uCL@0+dl
zDv_)Hw`KltMUGpiiE4EqWFom}$G49BK}MAbtj;*Sged1kLY<<)GGc`|dMEap-}qfJ
z+n@clX3$nV_X@&QLVgp()0mO84Zb`0!Gn@Id|IcL(|SyA7?cGJ(V3cj;lG#!;`BiB
zZLG*&0_xf-v3mLJ8adWE*ln;vg9&Y2ld7qH@-KY75<Zi^pKvV8WIMOES}I=c&Qxo0
zLlHc)N(d{IG2%U{_wlqoRrB7WaGJzkvR^4;#4m!p^lD?sEa%9dqr#?RiuOc1=4Wy;
zuK&%bB9m647jCb>3bSrI!pd2@S)qF0*cvme_}|7Ik7O9r3Q0-qvOhXWE1wi<GJP?s
zi_^Wu=b?xVP{$J)Y=$TJY)yv~ltw;B8qr}#;;%`&-zg_f+wC#%ICX^FX43uue?;I)
zp!NfMTV`~qn7M1(EyJFeOiAPA9Xct~{MJC<;0zY>kUaS~gnGuwBL<^nvhnt|mPwsi
zrB;g}BmODTnYx|TILSGGd9#jI(SGx6q#j#~)4pE&i%V41^dqTzIO3Lsob(!~SiOdG
ze4RH@CAw?s&OOH^+ksX&m9eREMv^+s$HI`3`GdxBr>9@P45jgD_aqmU<UzP}%+@l;
zTh{j^2KV*80Cg+9<5KfvG*OgKm+%wHAYP)ZV8+4($-Wb-n#@6AC~yCra*|846ERyV
z7KUTEs~BM?FZyV-P`zl555+?7zW7x@f^~6ohnyksr`apw1Y-L3<VO@(ykm>7)9o!l
zF!EmLWd>Vi@FTaU=L}EwjP`XaRhy#<_Wc6M+C}8md0|)}#!irETtU}um_j)~b{UZm
z043sH77b<O;nbIF3NN{bh;20bVf032a#57UW*Q>T_aH<hx<)A7It?LGLRu+h28MZ#
zec}>U2;G-d2DjQ)SKl(O$ICVwF+H)=4njN&ZN7D_roM&E7AT{m?A4GOPM=0GSiWDs
zT}4D0(O{KkmqLs#=UPR8w!#>X1CM!Bx0^+8KXP}bK%tZ^it=e2vXpUYoMi9vq||Pr
zVo)ay`2^Q)@v?yOBct=w)^-jDgO#WD!R&X1%R`Xv$C#i-YJpe6Zg%htuv2Ap!9I5;
zFGU}E?fG{XjDSSYEoJ}Pn8QJ{F&Ahbr2pvc7{>Ozn@N+c6{dh8?HGUoL!AjTaT<Ju
zo&TBJ)5gJN{#zmb5wjIOQ^DIA2Y{VU-u=V%+R3U!+xo*y#ll{O(x4JDpY!mSvqrq*
zfBf#-B=t%YSZ^4ZB?!MWryTS-i_lHe^-e}0h-xmx8yTct87B#NC1i+r6wbDFCiyp;
z9dv)G(g^s=KhdJ&X+K*mRB6nkp}w!7ehj;w6s|-6$>?Ca_Le?n{khF(|86z{evw-h
zq_g#L<oGZt_v)1q{3B=p?7O&=AfY5SEq<etL!f~Tqq4fu@U?$#WIgb&#+dC|0tQh1
zCb2|E<m4bkZ)d#<B`AnwTiMsVsl!LF|DK&WOz=gXm2+(+$l1)@xq0QPq($jnNSU7Y
z1uMRnZxj2|w;R^2kblA?Q60YfT;^8J{|}>Iddm)f5eUa-o}fYK^A)$*8t1Kbv{BcT
zc`t<ahnO1H8?<)-x%wWeJ!hA_Q0w6{Gn31ok(DL&svd(rsBy7*`5_I)e2!OfSGgs_
z{#YvBGwy58016A~75-_Y{t8Z@h#ax(_IK~+&1oRP{!X4szYoEHHTt<Ol!joM0)e(}
zk}6MV0>A8ZB@JZ1gHIy5pz5u@L)D&)>w41;Gla(VFWm>z1&a&}D4oNEc~-d%Ux_Dc
z-0jRl_YJ-E@oACd*y}gtpB}TFeh9eWbz6Fey$K8AV@KEc7c8fQk1V`M)zBf1$!A3U
zc`nJ?`xd;ygYcP1l(UVaVJ2wLoO~|$N-cw5rCnP>&J&kl5DRO&IBeWp_mHd3XY={&
zJMp<zHH)<`ZMGNT;**WltG}$|PwD9@Jqi2fk3A1kMk00-e7*tocATK{$jBb8REPhm
z!`y_8?ckh+?P9iYzvDW9hYjkahD|296@q!%h;15<73vqqbM^v$*89yVe0T|y0DQf`
z|9ri6$o?t0hY+CEls&8XkCjxgetpc;(XTugSlP@c@%<z-rOdy7l4ZXb^77|XRD!q+
z@+-zXX9Hyys20-?h@+mIg;)27tu+2Nqp_&x<A3~}p`{5~o??9UX*HK{?5{c3HUCnZ
zxz-**`x+o0v?tv@>U|}d%`uhnd@wE(J467?FESod2Rl;!vE@ctil0<ecAuY@UdX<&
zY4#a;g`IXowM+!@fL0Q};!?ewLn=Mz#Tl_kx^=`O7K39%G-LEiffpW$1WQET{8E8z
z_k+tfd{R3$8ZWE-w-C-YFB|fDCHKNCDZjgYwPens+-rLJ-nLzPU2~mz!(SLJw&NrQ
zBVnDxbrtN40|+;YOT)-7M4kUcjT@-05IPK6|5!*6Npxb8tugTWYA(z)J^n#KT4Lqt
z7q?Ko@}sPy2SDm^F@NCA`gCphThjaP@8cqu*kTwUTEO_r8|o|gS0g5IyydBxhq@04
zim>jV+z{KiL_CjP&zA6;08}x}9t+lsXFT&&r+q8%jXKWB_pQFoJFHr5^^2b@#(zA*
z62^ZnP@h7+P5^PN8uf@?r0T<L3F;i-#amPHj_B&-f^g%R7^w1lRuwO!XNFRxUm^Mg
znS$Tl6D1u2@Z76icv#AilBjb}9QO3>6=Ll*>GBOo9F1=OCF^fZC45s59_yk7N-bNc
zyHPZ&U6bxL&z@?+UGwd`7UH_HpPqpCTY@7UgLq@1ThO^y%mclItt0N446||o%0dW9
zK~U1Jrz2Z+w*&29$bD`wJ#^!~lvnaP0dzGst4wHb=1bwP(Oj2Idxrh-T%vRdk5V)P
zK&aEP?a0zEY-NvT_)@4!mxn#E!EG=R{4UP|a;PZy%?mo$cJO|#-7XiHk4hVBayNQJ
z(ZnCz+L0#NXMAZEaiDWiU!~0nF)Hin-(0C|7lr1fc`DlXQFNg;{9K>#Zl3q59FQ`2
z-xOky#S&aBfOl1ErQ8z{5(T*b-8^~?{ho#(<h$E|$ZVb(T>BgetX+@+mUahu$77V&
zMBV?;9T~gNgZ^qf58OtP-v)oPPBt~Zlp&VE$^0l3!iQth9m#=YJ;Q~4^jgEF_IDwd
z_Z(gSSkTcCXYG%-yw*Axb^eRRKgm6JJ+NShgOX#wONU)Gn|WEDnl(hXO|RUEaEQKn
z;n<Gw>>!Ebv9MF}wNT#&mxikJxVVP%!X6;BQ=Mour<CDBP?-+?KV4`tma&GL<50xg
zvDxC2G7R3S2ztr#EvNG>r;GJLtiUx{VA8Rpu+ojekqx5xBubXKC=7^|!f<^sN}J(t
z4QMm(lZ`-4P!Lj+@{OY{JSy%cynBApJ9wPRT4POkrYN|oaMk-Tj4m8o(Q!@s(I07#
z8rmJQZ>&)<q*aZjxSSFhx1P+}|InX3;;UZQI14tZPyVAK=1KrF`1IATrlH3<GB|Qm
z%(>RT%6qI<-?m&;I(CBO@Wj=So#cRMcc!r3=}pn;?p#94m9?M;oUlFth~^<lgbNR_
zhi0<+v|ML91*(rz7@xmBN{Pm{tyG{+8p!1joJGXm*7_{sbPE<@16<*K4Iqi(I+;gd
z%RFb9ejnUw-8+f4pHQlWvq_G9(ORa5$GPKzwQ366$h<_F>t5WtF){SX65{q*9fQ@r
z%-X)Xcf}3aoUy-m@}6>yS9L?@x5LS1EiFmCTf^}GJkoS=Q}f7OQ@e!}m<$H;1fJzz
zL*of63Rq@7iMp{+saf2c{HcXQuR2}h`vJ}~ih{1kdf)XVOpmRB8Cdi(yBa?&v%K<U
z47H?u3>6R9T%gBV6ht^gH-ndOvXkB5Fkj*cfOkuh=eH$0f)^97<0T$@zdRy=EaOg|
z?uk!kv1;gCH`+82eN})eM+_AP@N=*~FyNPLF|vk`FTn5J=U<a?WWbmTML7C_Hu0fc
zLcQdH-Z!@5_pcV;R<Fmu_Kv3nuJayY3rtNM?~JaiO!zFy7u6L<HtPDXR!Mg4npt?^
z(q~7^-1`|T{kei@Vv8^(`I0nGB|r}sWe=%x1=JOX&qR1b8BexlAlHBXJfx7D`7^to
z&FCM7Djg7X{iTO!GmT+YsAXrjaDByS`5D5`tEy|z@1nSTcFc@Q^n^U76Z2+5RUQTh
z9PPE-P7hruAjV5g!ScUMYuxU=j&ig#w0ftvbftE?&<bnl4^82_kSM1>6uEK`!K~L`
z-F~TcQ4nZBZ9x)Ru8T~>Ea(kC<nY4l6vmO+os)n+x{De40eZ1olU6{cu}TU!wE-=I
zPbi}mhRk{b@5&%SNRag6_nUh9I9^GK`|W+QfBM8ibc}AB&-RIvAUgUmYsGG&rY1Cr
zZ<+{dZ!;||^pI)l)17b#Nd<KT<Lus+y~~3E*)j5Gw|5d9==&I+nb937TZLpj5sa9|
zLs=dcyR1%9&FV|MVyB6Si{E=}De?Y`*kQc?>FWFF!PDY4V5l0@vM};~?M@1|*buOp
z9A5*~^&*?6;wK>>b(rdBpVNuW)%$i^<vm<&j6QJhJXDvDjNCH8??Vcj%=nqK4CKe7
zw}TK<rD?lPh`@w!jU1uS`vmkK{LX2oo{?!lFCH*+*Xa(X`PV@Ve*dA}$^QHPUEAMv
z?;nI>?BX}&CnxgrcM52g?kQe1lfY4P^jpZJ9qoInUh{N?XjuRh8(U;O!?7Xt2I3ns
z^)Q4o5^y<K2UyV)Wh9H|^mMJAU-4Eqj|vsO6QsOr|Kv)P6z=vopre*wE&bW^7#h(9
zbP<%J)$Bq@(B|loo5TJ>lT1u5Z^tj6t>x98ffq-OF3R-D%@fl(GxKc#N-!Ay@gq5V
z|5rF(oyt*6iob7bgPbQr9JRpGasGw*^kF*|?j(i&%P9p-pC8k4@^zr=)#ffySCQ0)
zAgw?9?}>Cj%wB;!N(*!0Kj<(OIMct5a%U6Z;D5h*kmHPb3s$Rvk<j5#51z)2X`Do7
zoB$@%`y$^BMfl|WlTci2f8IC-7(hEq7K*ERx8l3t*N_f&VIv4AgjZ6L&x|f4+1yEt
zq&1A?BxB9WdHo1TzbhrN9qjeKVeq<>f@>GOUrFxb#ic>cn!-+lgY^n??>@lSCH8{d
zIX8XIa)SiH-un5`u<Oj+z`+U8Eq(v-`4O$4wrv`va3_lIG$;MpaJQX?r>XJhLq|gc
z+EVCE*gw*v00x(QjJswF_<u_380@htw4pQqc+IFO68ClaJ&PfGX2GUyWh;FngxoDG
zY%21KX1-mBOkDg)*H0p_csOLMTkAp28+`uK-uKs!X}9K=+_dlV_|cKrO%Gu6G~~=U
zEdCiK8s&c9hE#?#Z{=J5eNFH?`YxLp2SLLnP{l9;zWWDo@~haaRW;GZAz;ha{+}0}
ztTni59)LimeUwU)?SH%g_`^?*KIBFf&l4{cKD!$1iW(G*g4fx?*?i40W++^=)}ul%
zp?(V)=PEVnk*{i&39WeJ=tAHJx6Bsuk)eq1e4464a@U^-Kl4KEMiclqGBc9h{XN+f
ze;iHoJRliL@zBl^T~`h1tL50xv4(u)N-XAsB(@Q)esBi{DgfI0WMjIy$~9<+N#akO
zzX+56eAiRdZ4$;Yas#?nRc_FtlueNhunX3PB;R26sGtbvq8FOM*vdub@QQ&M{bx&t
zYbq`qJ~-v(^ZF840AY&Bq~cwGp6ui4d&3yM*5Y2<vc<JxNDw*T%)v?f=J9^vqU>LQ
zrfOK5m-d6IHs8tfl>JAyc9`A{NvcT}p>gP!PzWGSiyHg_ZuK{YWoCgkFb66idVqLF
zH4d{A*A&OQfIg!t*yYx!9F#Cwtn|1D2iM4zcP~eemJ`52ByViaNJg*BzBxP(v~Gj1
zhOVZTY6R_Kh26t7Kl=^v)gPYZsqk<E8_Nd0QRmvzRR8#&J5|??$d25<pYG>mVfdh{
z)jomRe885E!0&(0Mlm$3V}q(yRl(~nuNO5LnR{I&S_7}mwS4+MJlrU@JNjb$MgFue
zN8q9E1xJpeG_fqlp9ev4%}H&|-nM^$k3jZ#Gr>UdZpv4-J7BYlW)Zr;*(q7s7}F;p
zJU#RBUbTt7)b?>6SQ4<5!#qYS8=wzq2L868c-yJbvv$-AeZOVA(YTG@iDlInOw}{8
z9>+O=)x<&77Zu)jVm(=`;Ok-zP8?@ZwVB0~v8I5B7hGVrNmUMRu2E+;gLF$|{og`1
z)ak9K7IC98uRNx6ovkx`EZ4jfZsOvO9WOgQk#Ej?7E8uvi~^+35gP-?ba!;!U9TT1
z4MaADeVC_cunM8qmN8Ry^ixHeqfi@tie4yT3R|pjSms3T2J;zx$q)YWx@(8`T62$D
z6=mwvHVME3w`W<VtU3DH6ukdX1BGLzVNvZhmAyec<C`ikU>S`GbX6W#<3=5Rz5`67
z;T+ATp&VA2+RNKM=ccOyDzftc_s%$9tjnn#5v?KUKTjI5ZO{*SKuWPF#iqZA+*K3u
z8|4GQf`{P`be(v3T2X*2*6in~4m=5I2@8ucT=Gs3^|P0`E+T12bF(i94*FTsz;8A?
zf=?p+FM4UFv0Sf5j}nX7T3ZQCh9M0>b74{NUCC<+MsH*_eZ><JBzp;o&u{&02PfYc
z|J9e!npco%<~l9ovo_Q2ryl!0j9Ropj>)gRKd{@eUWYLDVEh~=gkAZX(Tl!eCJ+B_
zNlALe7s)Yjw}}QY^_n!P(-6k}cL@=|k^{<tGv~~Bx_J8T*~Ec?WNXo$3C*dHzCzcZ
zGN04?c88zIO!<j|mi6zf1HMW&{-o}BYbduly^-7=<tJqN0(c{-CoclAb9&9WIGVWy
z;N7-(LS3A{pZa5s!c#bhjJzGji>T-bqw~}4Qywx=|9x;5W<^zC4yhW<{ZZgSwFI~!
zC<l_=4KBz4J;Yw-59E3rl1drwpu7kD6Y*|M`j<%@KZWof#Pm5vMntAcgoXtx0pCU-
z6tZQb-eG1K9iH#`9IdNX*k29xAIQ&sWaGk~5C+UEPMH8S4i}y+bP2zZ=aU<y_PsY;
z@@|_gZXp-T$;lEapS3^{e-VONGEi|raaKk*aKdU?<6q+%giP@ZW0bt*N|@^R_dtI;
z>~TCdzt@_AuWOXvs;~4u_>FPB<QOq|D97gDJb15D&igdyCV$u~aKg4dxvdn*WMhF<
za6@2Nggy`-Kqt|Fsr(I$13*&J{~#&AHEiBXr!tl)TvzW>`@-Gr-`)w~5#UCC@z1=8
zUWLZAJ%tpXPVyfqSevl~Nm9AppMCyFINLnFz)AVk@-9id2*!q>+x6;Qh$18?2=&v4
zWYubCkywf<bnA$=RYAW+buMqc<Bl7DV+~*(2g`(}I~VHe4T1cOI-`z{06oz@%Wek1
z!jfRIazP^xZGXbw+0LJ4?*;v&0JuaB2FZ+YJUREBUal%qQJzm%M<g(rwqO@@scRP)
zr&{SkdYBb05`qyDrGku2y{%BLj6YKSmRYa3)WHA{Y+zQ?_m$s+OO8CxQl%!z#QO#1
zY{;`0Ebezwn?2Vg5<ZRVdBpeCaDP1B2Yh^=J2LyLXu6NjRsgF(SDL5;_0E`DBS~jN
zEXyOFG$|$s6ol8kkZt2od@EvyNW|9qlgK<d`^f)|;OGX2#5xH<(u9_=ddBU_^AGS7
z7Ju?9xChDt)$D5G4VxI`ge5sR7dDTkd?J7i>cyVR)kk*Ve6tG_Ql3|zU(_n3=Qw#&
zkN{r3>x6uFN0hW=<i~EI=%1$@RBFnk1i&!%foaa8HR)YU*b>?2Wh%l(Fl5ZNy{KKx
zg9A>>j{zCmPP=T&cWFN^`Ejt@^2yiz-U8jkjp9RRu}-8Cl<OzjO(_K8(rjGJNXZQX
zgU_i++ks!Z^iB{w&qKZhXKQO*EIRmob>RSXObQ<{&^mr6<YxVQAW&C`$41@xS1ljT
zNI*-|Om8mF@WqFJrE~Tq$D9;qg}NE3(LPq+en1@Z`#+UNbwz}HkYL@*Rx6Fs9rwmQ
z>EhWQT~9s>TE@9c0PegIy~KCF{dx3cBhKQ8nS?mhii`+NWr*Rc<8Xk#0v>$DER#ny
zA>0O46Gc&19TYmaBswM$ghJdKD3|PuZ$bWLD9tL0k3u$8wbzcMQ72|+=u*?|P+=h(
zlD<Pc@Uwp{t^WT`aYI2<82Y^bWiNbt<nm6Avq(PiCccthDD#52tX9*?lb4JAJZjwu
zl9qoGob<D{a5(RP>|3!jIBqeLYhJm(<GUY#QSUrQ-lukb@`+o^zJia`l*yOHhCO||
z+cy*PDD4h}&|U1Vb<c;yQKK0yr~Srljet&o7^F5#i9j5xjp5z}fA}0IX<eGxy5XD5
z=TIs2-QS4%L?@)$lpOje*uk7+EGv6Z*WJMrNhVn%H;hbpOCwENyevtXSOWcQPkb#K
zGQ&zwqw?4DeZv0HUR?%AQ&Y7MUmhp^sp!sZ-CxCo4GhaMCIVokere*LkIgqp!HLgR
zv5CQ2zsk%~P>(<D*`xMxW}=h^&iZd~!XPO_ND|{{hlZ_|Nn}OWk@8rD;p-8l%ffk?
zSL%AS{(YB|aXvXdfm;mGr-?mRho^|IQV7LbB|kMp@yeEXT=#jkA5c30PP3T+Oe)by
zf)Nxq2-v5BB_fG{o~r^E_HP@Q$u(c=xf}F72VF)craCH&zKJj68cIT{Uo51SMFt&v
zx<ek~<aUQ>@`!yCZhg_#h=x%LP=!%aZTs-9g*Xw;H6pUBC51%-wU_C{sG~b8u7Ue1
z+ZR~72duaNu($>Ql*5X{fO5bz2V+A~!D!~~F|~{_k^DX*df<rk=n<y1`;NXC0Ra+2
zuU>GIhF)ei+yUU6(`q+B^P|^5;<~4Q8(Pglw-boG3=7uM$mH8@bS=Sn!Im{%Erhp9
z$jb2~id{aTQmKnX?(8J}v1S0$2vZ=bP0Wx@-&lHv-Ru~UbV3z^kRQG1D8Ig@6At^=
z%$ZU0mN<?jkcT>H#BW3in1ecnpFm6l;ZNlaHG$vp98?t=Hx9S1cO59zjC)1^RK?Zk
z8ls}-g+eboAIqK7l4~+Amp89(ZEmir_)-E6(D>#gJ%~Ys+N(SCg>OF9g*xJ*C0p+;
zVo&DAJmsRf^ZsU?<a=s?>uZT0x-Ti7D?Ok}2PkgToGM^0$`3|AQm#~MHZ8`Cevbc<
z_GTab5ye2$M29N?J$l8nnNqPSTTjtd>75BZgC=@zO~r|qD>s-SF)X(~7^|#6z$z=x
z;Xp|g7`-h4VH`kNZvscs{|y{0;T$KK-6C;Y3ybibXeVHVy~uTag%||7n8ibleab0I
zj{nk4{mIzhDj?sKc|I6N0>+?uckes2qE`rLqnkpgUlbR){d^-p)dLd$8wv{fZfRQ9
z^>mNSAhqhMH(?`z(S9!IS;vUicQ*Q+wqA^Am9#wz<aFIFyt#z<$?6Zh^8Z=L7=U}=
z1E(PUCXr^UoY~XtlqkvMg3dSzOv}d`xP}AEOi>~M>R}WF!_7L>A?YNs!`vqZ;Knc}
zW!?cQH*SVN@<gl`;q`i9@Kpc88rk{@l_6P6VN2kr$sSL|OX|%~!7~5ZLNtF%iwu3G
z;D`g8tugKcSVn2l4zdjvIPH2w9hTlc<z%Eq;;{KbPBUQ?U`9r&E7?H@KHSD;r~Wnc
z-hB;QE#T9Kmfu+^CHs%)jT@iu<97;^a)Up~O`D{eG%aBK7IZOw3x+}LEwAxvhIED?
ziGZo(#Cz=UC;wF`wIkA9?$%+7-{{}wUw8)!6|U^?@!#rV%<QHRwc{O=Ku0^i^BbDx
zxVrN-p&UDu!u5lin(|78U$V%$)5Y!fPYnkyV4-zoADy>nd{Z_Z6^sT!O1_;M=T^*V
z*)r9xWy^Ml>|$3$p%PTpS&%qk|0G060wv!lPlc-FfQREY!ED^(DIU`C4&oovw7vDx
zswzU(@q<#D8nWlJ9reEn!-*MTmHl;MN>pAH><Ojf?q%bQjrhaBM;IryE@T4je+rSI
zRNSpVuGPD_T;~-Yt~h~zF&EBf7Yy}Rb-V}El=c6K11*+#h3a0?0f?{s-FIuITnzqv
zjZfvd#%(a7D4$MH)5lOEcGz8FV&iU2y}*8-HLBXwRVN;u24Uz?c0eGn&9&xFF!7)D
zuBD$0D{Lci&ud6*4zd(tJL3Dc`?0{~n5`#KRlQU>L(@QzqXyy(QP<T`98B9V=p7fZ
zE)W(cI0vxQ{&{dmW9~V5_nFVi2+RHW*o7wyj^v5Hs`7*VrbQO<f90mwVv_JpSfkkD
zsMTpr$V33T>6i3<q_&N&?49LTwP;*M=)J3g)?(hMjk)f8!{|PXf|=o^r|fGvZ+Uo?
zc(WtDg(=AZDh8ul=bDTsrLE0==W^{#sFF$<N9~;YAB8(Ll;k;v*4+R^)PC2%@B|wc
zEby<g^{mnZq{PvlQie&6>o|dTk7`b=^1fa+;h7vU8>~e$!aiE85t9ZMv-riI3(R&)
z)^Lb-C%$mS5mU99JCYW@#k$y0<OYQP`!9v{R#?Zl`~z$w=F5tJMoM{39`>YRW9U+0
zInH33z9y<-C+867QksBZkuXu#o0J$pW9Bu3%v1c11`U_hFZ%*|CNgE6#uB*S7$<(2
zziN1w>Jtb*V&2OJwv^5AmL&Ti6GDMPPi>nLKN>dcf7z8spB<{O@Fmib>J$P7)_q6o
zT2}(57n!H;vjB{50;B`1Vm~qULML5dpFw#aT{R;GZ;W+R)dZsfsD8ZfM|g>B1_+7-
z%=iq=EBd(wtgD6b?@%rHCq0frb(B$YLjkhg+n@fMBcBt`U!3NxJ+R&K<o8bNjEjuF
zOxsMy#9*<d44})y7o{s{04#oP$Gwz=p!-hDL_l*++JqiQRY%$Z3;^JM!)44p#Uw;b
zM~E3E1mIme{<g}zcuRL)A?Q*_yR>jUfElG$R6WZl#N;3x90~DHYOLL5#~yvba#ZPy
z3z}L>bm_+;k6zXS5yo2+qaoN_4#J$0gux~ZLi*I{=NKxjnyC<RT>a`(@fo&&d(x@$
zA0P8_mG;mocq-Vlqe}bo#Vv%*E<PwX$(`v1i1D-eANH}z5iY3f>}E5^Rtoyjrw2}z
z3gnq3`|gqyh@ZDk9DLr*6i!@~*#*jy+zh@}NK*yjz4Yt}SPAEZzZ@&)LwzEMhwg?t
z-Xf#YPr%~KVT>&{;pBkcp%<sWD|BaDe9WH%9eL+bv*{zIVHV0&U}&0zi_B+I6|E;N
z48e*TOsBnnrb`K9y{slh9I^&D!yny4veyg}NUcY*F<dDyM5j4=DFysJA4BI~^X=WA
zjjJ!Z*Yed*pBVmwqlOV70YnyjQ%TOGCAv;5l0MkqdaueIk)M7DbeGR);K!i|kE1gb
zo<_vKJ;}r8<4Z>oxO^A`Sn<_}dJ@<&(Yd`FW3&vkj(ym@3wR=;(83;bz_~!JHsVeu
za8)Q9RoJ=(hgUk@_^kfa7sw`<5|@L3(V+=cYb%@z5+v$@m@#=w2l{Qr%;{T2?v^dK
z6Ay19`R^8QhDM0T{$x%tZaH2QEkal|35Po#Pctjl{!el3mw)vw6a!RaR*nGIJEqFX
z`|a(UnrYCx6BOmmPA>|WLVcRITC((d0`JDy;tU3SLkE(8zEyB{7Y!Ee=aqCg1-RU^
z!5|obK5^gwWrQBkd&VSvv}28`<nR-c<ZsdBsIlZF_hyFb<mK_X;%~0$WD<jjBN#0+
zVO!PrmZhJWwF-foQrAgbE=WhR6!!5gOQ(m^K6#PHn_Ewtl{t->c@C+Jk+;LK2Q&RN
zykXcF`#ZwUUS9Z7h!x*TDJTubIyq6=Yx?U<xVeo2!O}MI*=2?aaZgIW9WHQR$xj|5
zYh6K2Io~xno9xb7As-%@QX}IgR>GL*Vgb8JyAAJ^?SM?|fs@4kiJ36#k_rM8KfcuE
z>o)rC;JcGg|E`FpOnLC^^(0&2l+ZZZ^#LxWSMa=dKq$Ux6*znNjrR_5&ekb<j1RkW
z{F2^GFq9NwYpp&7L0?DwU2sx5AcC-fCeiuzSvv`*fYO|hObLNr1?D0wqwIM90Ga*!
zfqEEzQ5R{>8ioSeGc7Ff?LF{-ra}N)Nr;?8QY<FA7(#qFJqmwNW&(vlC0bk#kId_F
zeO&?49W@c~Pl93SrRKAH;`C*P{G~&`p*fW-paboo3fW$XA{h)Jho#Hv{vt8%77_7z
zs35mFqCW`fhz$DH|JK0ulh}Hp3!DxU{J!Km<yfT(yIv!^gmD(F$4~Hb^)MRBZup92
z+;us?$jOHH-dPW&iyJ}=_F$Xbpx3rn+3>t2>DI{*_)nUf+X4dh!t3YSkasownIqnD
zgzOaJKzaW%gted@Ko1U5>AS~j)#yJReoIt3@?cb%yOW~?sC?e#A;_JPcaPW-w>fjO
z7MUargzlm4i#+y;d1F@|ez9v)W5JuUm<ALiFB)QwLezP04b{zVu%g#VPS(0|;GOub
zK=|D|Pa$M~3km8ZF_v<#(lzX0Y~q;N00@G$XeyuWbHt(QSie#`@Y71qppV|<@jP5P
z1}FaAHw0}EnP9lfcwkj#KT^Oom>C>2p>%OfB_w&DTO<lwLCh7GYKx(r&lcEAtTzBu
zl6P}hhPp=d$Pj%NmT(%<81rtjH<+Sr!0_|=@z!|s(L;#QQZui|M93B?%Z++b;{)I<
z{r2OXCaR?Bnq#vu=QQ!^2A45|z0%3{Z~x?pJRoH9>Yp`jx|F6RElB7(CnTz*%Ds)f
zbqiJk3>CZE&l55>0j%>J^(L_Shc$=X3`yZf4WOu@b-17Vw0#y)*)3K;Wqd4y92v-O
znZXa@dP&@eX`t;@;cWDnm;9gJ^{0U(o<=!l7IiA6pv>Vvx_9Fv{Vr_*#C1U0{-1|a
z#Epkji^Z$NsH~2#lqg#2*ZmO-jB8&z#9cplI;Sw2uc7$++<nY^cv;XleHVSS;-)+>
z?=I2Bf%H+7;U?%E0MHS<<V8c9%HTsX!h0{Oy;@-r3K$64C1@Of*}mz|7r#*4)EjRX
zz?l_5w#}kkrDJ>fF&5>m5dIiTlvfwYlEr9mZU`s?bHIm}v5f&UQ>hzygGCLv5{H0#
z;ap0@tOq8<yybJ^Uhh=olIUpu1hVqgTH{$}qTM9Dr1axg+e0@rA8g{z>3R#K?gQLe
zI{R?Q$WwnHkI_b2M&n+de#mJ!C(<x^B&ihPNV^`fW&X3p<~>GR@`hXMh`EKpm&e2#
z@LBc?aR5G1r)fJ67{(o>7a2zB>J(Ym`h%pXFW7n~?!IjX!0%>B8fO`Pg1?5t8&65E
z=n;fvGNXrEF9logqVaiihW+}}BwBe=O}uhIGeGJC82u6mpJ-LjCxPY~o~4V=F<$uv
z@6UVbhU2lS0|T*FWQ4x~LfC+%)o}nf9>na3NYBx-F``_En|DoQ04x*6dCwTtK6_vY
zi6QrgPVBeXE+Jar=Br~7WncZISo`X!s|MJM8VO*Hp5wI{&pyzlmlUMAmQ=ke0duhc
zi7Dwc>cJ;IiIcE=gc~rb?5e);+;)_FWc3|DOmPoLDPTT-qA+g%Wfw!om!PKQ`wb+3
z1$iJ<lQ5n}D>G%@#`Hgz3=hC1qwb{y>1Fbx7{X4#n_L2Km4&k%`QH@>6u8>a@UL#q
zfh2o?-upbpQ`;gzZST5tw0&i1=P-#N2-K6Q$1}nC0-$$03gu@xKnZh8ly32qLAdxA
z@Z!m8Glm0jK$-t^KXgF%1a*$mMui3m>#cX?L@++V^i-DT<Br~&^Wy)?<UJzK&fLC6
zkTaA-rgo>Z%k{;pzKCRhBa7sj4pyB6pmVam49?uW8V~dT_$Y|YrBMABoNJ9E!Fy~-
zk2KI+hWMx0?CZG?Jk*k{e=^~AlcDbQecc4<-FuX}0nd@Xn(EHvhezZ<h7XgRWBZ4_
zsqoK8&p$NVi5s^u*3bE<IxJyAN2-cNH3a%NCCdU^zhFdm4v2jN+LM3R;XxQM3E2j8
z&!F{Sy7!H&fULX+(RF|QJ?l+?y>-QB*==}+jvR`>26mX=h)cM;NeISCT5yr3fIqG@
zuRM?ZIHTLLjaiw|+S()f{|We2g0a>JHw*868@B)^68UG-puL69*{r5KTv5lW`3A<O
zKMdar6)Z#lD9{0?%~>vi{{KJnoEtUU!J0xPW0#L+t~TGq|EDuQU^^4tF1j~bN$?Nd
ztt<<Fx{J{-0Mmp8Ma~yH2%EDNbKU_pnkGW#A95chs1no@X9m1yJFLd=4XF40H-Dvf
ze1O+^dy~k2U$^y{?V#HGMr8y1J+U434~F^=(e_;Mh9~Eg|FHcQV2f7=L39*LxYg<T
z@W5maOhNqy7YYT<VIqehK$y&)WULNlk?03ze19pHmtioOvc)(P_)lPp;0n&q{q3ry
zp+u&6_So=$3t|G=B5x4SC-aqbc98YN<!rXilZoa{9ZP0%5j0ciE)(`q=nLS#<%+62
zb%X!lb!Ez^CkoI<sZemWO)f{Ahw2dsOwK#T@42HAw%y5qB>RqPS@qFSB>aaMW@`f#
zo|Cy3Y_?ZisTa_@G5~s4rlFZ8f52eO>fKb_7!zGgt12(iXQF2Z^-Nq{4J>bTxyPO_
z>N@B9A=48nSb*$PoDwQ5dP7^r;_cyj7&0pzSR7nT$$Hy`0*LqzWn%ywm#_rv9oz``
zSwqZx-U8irYVQL#ofQZ)dN6!rz&(H+x4~hpBeJk<CwyM)*JbKOCGHjy=&5RS{dEdo
z`$bGxiHuz<RwyHzuS%Ak>3*T@?YpO0{re+;Q}m33oyZ5Q^YMK82X2%}b^*LK;JB^u
zOlmP$s4d2yYo4Qh`-QhD3Gf#=#CWMe6PzO8{a+{ddqLhSv`th^jQrmw{v&=&D0S(b
zy*NxiYssbIa}AyQZWV{Z{S5Y}p%#rN=d!gYtl>&Eao1zW!dreMhV1!+$(P#g2+VO2
zHW&YwChvj$SuYaK8_?V!$3pG@77GAn7I`gDqnic0KCc8&Iu|Wa+@1CtdUp%3Fc`|)
z{_|d^z|Hyq9mIho*c8Ex7Qx(<xeJCTi|}sw?^Ipi>t?=`&C=<_!ajPE7au5%7piIE
zo-)1+I`3jk<oU%V{|r{4mHBGp2*Q^hI2grX@{{qQhe84GYV_`B?~^pXS#%M><cg?!
zUIP9Cj4h`2g^*b@F-rT)eGz{2*An25*m27ac)*Sv3UuLTvSX_J=x?zL@~C%?u8AG5
zooa5`&^Tu@w)+1S@-jTRJKsts6-N1hh`W2blnp&dk%KU6WB_ayHo6oKKL}sOeEba`
zDqTk<c0pOG+C^k5Z`*C+(vso=r8Md82dhY*Pj$CSMyLcFYprkWVJVm_MZ)MJ7vXu0
z&PLI}!OpiInhv<;H(_3@pDhd!z_qQ*#!%>)uKXS<9w#L$E}iwen}XDQ2x!reWb7OF
zoG1&@JRv93-8?EJf}=GOZ#HfM%8d)0!smPcIokvG;zMeXh!fXK9-wO_1PPQ+xhs<(
z6Y+tIv4>fK+leIO#2Wz^K6qaZhM+e=57=)4<Q=;U%~#E^s2EGWaI2l=`R0tFcNiC1
z;o$R}iGNFe$OU!YexC|6tq$6@DJpSU?ad5Z3BmOUIhgF|4g;@Yci}+XpZ0f${||?}
z?{gP1&nSbxVv&M*9|g7SJ<hFXQQlqCasQ`k!N<eL!IuK&UJ04K0F=ePEeuoe#RFU=
z{sO!_@!owP`GkW|7<}J*H<U5Nl6T4O4OUM6|I&Pbf3V~Y=hzdE5~`sxKAFfpS)2t#
z6LM!*-pFrUmG@cYi%YaP$`)HZOUkZJ8+3Gx+C#Q}Tdc+QyNjkZv#a7$H<il*HYC}1
zn;6hRyV<y(>9m`AHRjY5BW}HVk+LNF9Pd>!%UfLRZVrvyFsl&hzmdnrT0fS)agKcW
ztVjAlj_FIJqNW&r8}<tojU`d5Q?P@TrPb;Few!D9R<Rv5oOODgJ)7Pi=r>$!G06_K
zRLRb&w}0x_8Ar_7^t+UUzIv>Pp&w*(*|eB@QovjoE_@ney&<Fi83bY~J9b7&$_bWm
z=AdI|!~*KIJsx$Xj&o$!jL{<LM+@ZhL3^B%7MC{VtyjKz(&gX!Mj8gFXZ6B9-q-a7
zm7iBVU4zt)W#$@*6|jSgTqg`XD(}{tB4SR~&xAxSIfc@wOak6N{aZPcb&R4wqux|0
zw8d*XjRnS65<iBZpXyi$yeWPa^QpJ|Sf@n3?TMB4ch^CX&145z_u`{4msOl4H|pgS
z8|Qha%gZUr<7pw3oR03TcFyrInd9@N^TCik9Up_E=Df|rrKKR>kHxJ#eyLL;#r;1Z
z#svdarrPx<tIK`?+Xgu)>hutk?oxY?`Dm$_Jo^)!RknOBo1-$ll!}J2B38^74sjJ<
zwKl!x<R#0#mI<y>)-5g=3trBib*${zX+q~vM%2M8EJxfDQ_a%VI}@(oQ4|Jg+U%;l
zQ54)lgQ?sIn|<c8Ne&Z&`_Hsfj{ok^ptS9^h|V;>oJZwd)^r))jXK_jiPdbk@^l_u
zEKTi1F*LhZYs~#!;UrE_-%>HydfkjZHQ3TpIf^Pj!f7thExGxlpjRwL{Vvfx`fY>t
zV<mZ*@9niYw6)6zlztVEY`1}G8g!Ge#q?<O(l)$eQ?NS`76=?;GblKlL?~A&4}h#f
zE<OxwOKCb7YBxKTyO(;Pg7>zlE#>1FEH>KVADRx9{2bW5V$XWHQL6RsTVrI|$vPG(
zxn=?ymIn2yMiJzJ?t1-UI+9z_YFo+gUvNIJb2D;Onx{4rtq5)2bqOk|Kle!J|917g
zqOVAj0ZHSyGk@*g4bdL7G1+pcD}j}RNAraZpvM$L#VI_q_1j9iJORoOld;tCA{Qe2
zJ=yA2E|VCqAE^@sE~iBedpd!9cO6*`sx(+Ltqh9Ap?TXnokCNPzMPIPrXlS(TMtQ4
zY~>kRIw(<{bAQkIEOgc`_4!16xpHAZ0i^nA<`<Lh6uCg9dA|T#k&#kXF&^kAZGF44
z2T?J(wvV+8eFUs`;v2dm&ItQ9`P(_apWXLc*=b3xRU>o-d!aXVH=7zz&H3N2?r|r?
z412HdWK~RC`Q`r3Jk8VaZa3aaPRXgQIzH9k(jvHdN_6@E=PCKDmM&QsY)xpQw95wo
zwYRZJo|N`zI>U19a&g5RBA#1EuE=&0Ip7rIP;vFNIiJJ9Adj<(Vr$X`wQldctfjw*
zn@OuNIi}B<ZL1ylb{=!#O!=I?J9vEd&i0rV+^KBH(Km&d8@778(E3#+X{z;+*pJE-
zG3b1aQi8)?t0_a486EO9NG#SF<qM$T?N_<(Zi*MmamSlGl|jfUH9eg=uO;P(H>oB|
z>?3Cb*KaiZXY-6}M^dK?5KWpU=a8$Vzjph+<I#b96@gbOxwi2p<|z%L0Z+L(+kmHO
zQ9dxW10i0I$Gk^=<;NwSm=CJshvzValyeYn;K+W;4W74LX8hz)w!!bK5JO`lA5G<G
z2|i6r7x1g+-X1QwYUCC^w5nk{P3OwgJ0fObJIQ@OZ&RRlqR1$A@;b0{?lho!4qQG#
zKmRUQEkfnZ!-L2aVnKFr@3!HT@a-iM5B<wiaEw-twpM_tRu?Bd%~D?j^<D(%H;0jr
z(1rgV<GDTP2&XeQ*Rj=>T6sIAGWbE-NkHsYjCzQ4kmjE@hPSdzR6Z!~Z`*05i6&!0
z?MsSPuT#oJ&fgbX4e1LOjUB1X^_=H(*4RE38B`HU{%vsK|JUv7y}_AJLxOo#Zw{V%
zK2DNRZ7kJFMALBwNVQx`$gd_(C2W?JY}l*!@_Y1%&B#V55dX$pF1!6-PqmasG_KtK
zXn_1Arvij~x5>ZyTg+{hNsJYot}E2H8gErLl(r#s#3pLcNA)Ww9Ej%psd=ZtotnJY
zErt|lr9oQ<G3~Ct<IgfitHj(Dl9y+cb6p2OH3RcmQYon^OTca9*Rj|+QHgNv!-P9Y
zo%7c%n6PTM%rPNlMUyKp^mLKZZ>*$#-D>{t6%|zD!H&+*3KMv+9?`;or(6H$eEih5
z^x=%l>aVGJ`&H<!extJ{ydX|8^FtD!&ykXPdXk#Y#qhQa#WB-G7hCph{lU3$+xmG_
zAetqy2-H|I0XCdowl6&^u4CIiks~qcKs|0#o<?#?9_=uej{A-W+SQp)PU+>kuLEz*
z-c3krOOcx70^ZA6d(LdJr<gCcb;Mr33Vc{rGc@~D%p<VK0hL<zcl+1n*Shlp4cRqH
z{q?<Q<2rT&HR%4qbDKrR#52FGcx@HnQU=&Xoy5@!_cXG3TzO0zZLIqs>~$BLmKht?
z*{@VLmbB~{d-!?I>kmW|15VLh>D^+=FMKD+QDHhCY&T065_QhqyOWmh({9&Ppoq<5
ziX>kSZh|v~%=meWU^>m{AIb{Lf6KOBacmE(Y!MwP<sLM(rS)lSr>M``x7pTI==e@V
zqUp+DvFc72gl~j%#!?(6U+;x}Tu|R#|C^Xod*bT={c1W^wlo-59=m3M@6bg}@9_-k
zBUlz^Q7(SsJ3d)_yI`=&bn-2Ey|RGXR#IgjyPtkFR<!^}Rgdgtsqsh5ja;QXc~KOc
z@zhGi^O2U9ue5#C!?K;2_KoAhlH>z8@^BSr4U;BkFH$8(x1r+7xdfLZXSpN+zglD5
z6*cCzKYcz{)V7o2(+p@^F2e-065XxQO~EnXt<kxha6#=g#GEMU=A;;(Xk#7%CL?C7
z>jKf#p+HLk^M%2pa)k0tJ{2{PD;hqi<z9AuXmp;HTGf`GRWS()*#3xSDQnFhEt@hg
z+alR_ds=pp6TtO-viRDDcB8&1W^fu>Z+f|hu8fv;i5L#m!Tq!dezDZNN?d4#biT-0
zk*iz(f7pBXcqaS*54=)TlFpK(`z}#J5i6&0cTk8_PC3jWQy2-uW?OQX+qn|M%#`!_
zyg6-4g~TXwm^qZw%&;8CX8bO?PoK~C^Zowr-#@><KL7N1wAppN53l$0^?W{G@9TYK
z;t%4D_M8A0O^004w)tX>ihnGQbv?9Iy)83b&-2I$KEcs;_>1b&^ZYKiYuyv3Rm&f8
z)cbCaaLJKA_qE#1t6nB+4WzbSG_CT1+hLqgZTqd})r;EFZ?B;gv47zT!DFzF{K9zT
z#UDI?^&-FDwdT@(yau&h-45~)!h5+MjSJoVEE650af$_vsBb~Plgq;P+b`#6Yhfo%
zb7#b)HNH?pJR_{i9=xjb9X*ZQ=%dD`-s!j`$}S$VUu{L7P+&yV-&`8$a?cjWD@wH%
z<eXNAXldlRZ<A`8Y9H}?Z$LmCr>4y_;X<g9!a&%Kyl=NVW-hw<`P}+Y6r{sXC||w2
z(MXKcHX>qv{Td0NWjC;}>(cT?bO4zc1|j|*IKSoRDZ}SW4*yJkyH}=5i+ukP?Di>?
z>o4f2j`=zlF7S7)28B_~+j;CD(s;!A51v7a?KO#t=_XY_<0hQzgps*aNAHdX)thog
zreTa*B0u`Q!#X{&dvPhz5gqHQf-rrSmbjKmb2pw$(0*^*G+^X4f6k+tS!r}M-56~z
zn5XxLgy&aBF<Si;3G4GT!h=-HsC~*+pzD5;iZDF4XXaQgC+cS)nOmq>bzm1_`~B40
z(x;68s)Lvbj4o)s%xdcj5Uj=C-44bZ1MJPUSYsd<Qm9%c$&`?GYiW2r_|#KPs_y2J
z4k??i2VZ0twim1OgWqWr{dmFr%U?=QRoziVn=)vVX6?%4AY*NjF*E^&V_R?x%lQdF
z)NvZJZi`KB-3PqCN*FpBx;GLjlZ>?Rg195Pzg&E}?3gQV_5B+=91UVX1$Cz4kflx?
zV)y8v#L4mkpCyzhdmY>A>@;GJbjfN*=J}i={KeJ`FlUktCL_@upEVSub4=0C&H5jL
zX8Xrr0)Gh>fC91oqwX&A+$#hhQ0A@lG|;31Il_$2o96tWraAyMZ8;&M?mLhR?RYrQ
z?TD{xWv`q7-w&T3Wj*AafOFm=2d5iosp8<9)e}|TSzwR27y)?N2#R?lL7nG&+uD*;
zh9&kMpufrSN9G}3_pHZWt|Gg%YsEp9lxEh1a=eHl`eL$6e(~8&D_S{Bl0<#&JR-h4
z?9U35Q?UJ=s~Ks%fR4rL6v}_GXjkYvnY+Tx*71G)$_{5LU2cwu30k~@aN6&m;#wnS
zj<{XE{DL?=U$4XHigZaaVQsVDMjlLQDPLo9vlYb@A5O=kHef#6=)bO<qIHj_w~`Ld
z=H5>27dDrTU0-H9a$S9{qN8AB9knDEZ;jV`PqpV1L`)Z0;^)jyW_038U9Y8&V9UyP
z0#udIG{M#to>)UU*5-S;^O@lVxBADcQv-7qyzX|?MYQ5}&I7>Ug2V&RCJS~6Wk<dD
zwWH2ui~K83BggIpQqPA|h4ofwV*WaT23J2hm3?`Qj^%!V5J;swBoJ+EwcFR8+r>U#
zg9^bSm#j0d*lLg&)uikqpi=WDpgu(C@)r&iR@|aXs4rhY1x;48HI22ht*WUC$8IF)
zQ|egxV*9FF6iJ*Z>qd8O=OoHRqQ?r<6j!-dEuiFt$=kVWC&5eK=JxM=M*YZ&X?ZjL
zlh0AXDV5d1gw;>dtZ*e`*6gwGe2=1ZL+xkle9aw&%7kbnc4fW@AW8~y3~h$F{RW=<
zt@F)TW+&H~SeLSGj^0}Eb!s(V&2)`jYdp|l>E~-SPK|f_FBLRH$y@=In6fC{xvy_=
zwOK}d1Cu-1dqkG-WgeBR>7fSR2~X<0dZ~SFU^PdlP!Q0BJki81t-sj-MAqjJ<KR@o
z_<2F;v;2=(B8yV7`~uJizs2gTF*RYH>*IC=KUIhI;<}h;DrUE#r^*8>sev;oa^ND@
z920lE4kP^gavA?yg)ocGn+R}Uy=AWgOE+ZAXgW%bi~6t#_I3ptqu}T^+0y`k9D7dL
ztlQCf#M+eL^U=T)t@gYn5Otq?pDNMTan|f7Y8ouhBvrynZGV<L{n;bvoes;l=I#Yt
z-l6$y$B-IyNA|2PrF?&Gj1D9?-xvTk$9!zJ8SUdKYMPmdA-uwI!6<P2e)41ivt;=E
zBL8`^!b8}E`e>MVN`8`#K<cNWsu!0BWalBZE6ZI>jrJbC$yCLOc>_Q4q^1B6)gP2S
zW0=Sh(R+i4JiD?MgAmu3YokttU7@;utXLhp5km}9LiX_ZX5|@a7U}D7W($O+FrZ@t
zaP7HmC2a`{v3B+UW1`kD0l3irF;RH`6UT1!zS<4bPwDO>4OC2DfkvuzO?2luYP<JD
zhs$P)-#V5nZt<+};s@)th`B2gtI#9r9kJse>sWVeq!0abo_56X{JC*|pXrW^eu8&p
zJ|Bs>+(<Sso>f2R-Vxf_miv3^G$6Rft@jGh$3u7`T@8CJcIU`?czF{`dAVb4%(4r%
z&W38K5MQ>|vqHYET5j8)TtEWg0*=M~XGnD;^;Ay~%S?G##GHGPaSNx%Ycog0Dp6}F
zXPvI#l9L@qS((Wy;@aQsAB0bv%FXA3?=-z%A^4vtEe#X8xpD)inIGp$8*_Yp<U?!m
zw@T~WdY4kO>`oOTZBuw|>*xJj<nuS#Udo$C^j!dg>Z^f8o|biQkh%=){02I2dF$x-
z^>OSb7It7a;|5{!i3T*k#bf})X=pf`t#D}IE+Wlvzy3+ZffyaL)6}%se);OT?cvKG
z#;;P$T<)Ymq;JInR1ASyBJV`xhQ*oyM5#sHA@|%+tI2$6z*<(_xu{U-Du1>=$L{hl
z(=w9K+Mi~p2Jpe6s5R!K-l->RmVLs!#^9`4N0OQ0DMe~p$A<Zz`Q61+m3b~-!B}5=
zbFWGlXC$~}=r!l&>xP)4w#T%0xu?Ce8(3x@D^SS4#dEKJzc=IMDO>b__3HFzrcS$o
zXBxx;5m~q#$nevUVgvLshjfUei@j-RcTc4O;tPZ%;m?pPZ1JW~BsQfPgv|Wlatteh
znGdU~C#j$$9S|5*>;@``r;%!b!scgyD<D~UQ{v^AE@wMPENO+eSDH1PJePBQDX2qm
zg9}=^ra-3i%)FmZzV~z992R~h<w--&e)%I%nH~}Yja0omwyV^C+L7;aO%&O;lJi35
z5Xv$P_WjK35EbsL399u_I4bR!;7r0oy5>!5jCW|1FSM|jGWNOvXVG>-xu7cRfc1Sh
zDw=gGd`&Zm<;|U1=ceQ?<+Th8u+$MC2b0#MPA=nAl~1y{XL=Su<yh0#`SX)k2~i)`
zM3NoZHGPdAJQ;7hXkKhKwJ>&TGQb?+YlFU^K(1Y6Q7nxM?@U-L;K!dVzk&9xTHLw+
ztE8H1npM@^>`DQV(F_n%*(8yxDdz=7#P`}Utl`|!I76{enV}D64`1!?sJ9Rvaet*)
zmGy;{hp%pPiRKpr)&{YN8=2ddos$G)&aXj?9cS@D$vszp<>eXkA^WnvJW#Mj+jrb1
zSh8s4ZBk>{{xludM<VLAVdUue_PI3hJ)RbC5N_EtmXAO9%^wgB8tuXiH<YQeulBW`
ztd02ANP{mjoF`LROFY*YX_{8Sbl%PDB_uP0oQpX>0cIW4jQj#H<;b70eVS^$cSDv%
z3;>ty#=I;{mG>nl4{@s{$LS*wefixE&fI+Z&L(C0oySB(uO`kNI3)cD-$p&hExBp2
zAkWW5Ki7~yYs*Asj8vC2OIh=3Wxu(-Osw9N<0F|neamhw>j;~7$^4*VTweM`we`SC
ziZvctM+{%<%h(mk+vM2Sd(3<?8bFg>q+=+JpMeDIiJZ@g?PqaU?Ys`UT0bu+1B?}o
z9=CLh{13`5>7Y;dR|WU|(vG#}q^~%n-y%Pk>DG<**+RTE5W8ExGro*Y)VVRC;cjx2
zzbe&f^Ul3&y56q#7tLU2dWrK{H4XaX<9K&Uia_HckPe+qzur74XdQRVO1@k*aV(B}
z?+RLQ(Iw3UBx%*rxtcdO%0S?0V0S<@P?REF$Y#oF{T=hJz0PJ%Y#3)=Z9GP2)hus(
zf(!&><hp=uG5?J3#4WIqN2P(z0Q$All4S;4`zpT+av6K1<+im8V6~~O`8t>f+)y4n
zY%VST&dsW2N^zZr@2X+{YPv<M(2S6RH2xFFXY7WmNAJOb;b3ts`{aOe*4LTIW8UM}
zFvK{j0K8&Ev=2fmUR_SeyDsRuma7~#EOCb+f%*8Q-VX5LPRP<b#=mrazJa~|9eWC=
zCwKqpJd=VPEnhwPDP6$^a7q9R?3g*iJAY1?S2{n!5^GCO#Q<qm)|hD-(!{zxZZX}n
zZExjdcY8&)$I^vPLd!=tkxS^8w#<BlGPp$Jg=dGZl>3*@%cH)poyXm78;NCc)(7FO
z`TY|at)zXk;W?&-zg|Pzha2QvI)=+T`^_xRj+t4Qng(#dJ(D1xQ}9oa^SAHk1sml2
zpmrH|oTSPoG!Gt28hc=bF;)wmAikS+fA_SKS@PBFXy1%Yy`S>}f^CfL$-qdBoeK*@
zVu~e8mw5_AS2jkyZU0ySm+cD}s3^)F!me~KehQ%-ppoh`ukLRXg&9oG%rT41Cy~3l
zvP@`W7Wl#A)T&sW*!8^ZO(X+Bii%mwW^Q?NIqGW>+!>7lv@A2nl^qdlTz-O@BsL{d
zj>)uKa-PdcrvQ@HIox*~ohkP!&8|;8rpnA)Zq9dR%{)0oS7*S5!}?ehQ`k0FKb0=<
z29lM{lkxd);Yz3G#a&n-ZM=~3?PBorZfOdLgYB1(70n~q^Q??x3cCTujW2D>JTStv
zwvDK}2mo4VPa#C(%j-2n6H>q%tfyBtY`?8Wbng5w8fFG-nAZXGoKwpL^)>u(Nvc{t
z020C!Qo==KLd0EiszC@deHU0Ux=%b;D`LFn<z!y+mHcakGmYYTb5JYpS9YBGVJ-h6
zNY8h@>fti}@%Jk?(*@mk@U^R<E+v=Y=5r<K>XwK3_xRrQQ`2|d5pOLJ9~ZK}hso%G
z>-V^ubiV0INQR}G#1H$u7tXu~ZwL%=7Y0s`0WL1`dVi6T`M_>l*Gs%MN*g<Gu4mKA
za#?G^0yT}|2)Uk}v{qiw4vK2#_^E<1ZMo6;Yq>Se#HGMpDt6%tB*QNId8E%MJI2_G
zb)9ceXrFGfmPT#CsD+!nv|Hx;vF>MPFWsb{n9E&yVU93_a>-_#l6=>;b-NYXeX8Sq
zy@^`v$%2~epGcRR%2E<l-Rm}*0&j7M2TsbGGbR`?=@W4wJ0#r+P4zw_Yf54SFFI+$
zWl~%CMs6H1!XwYhHhVUom*1MX+yWT!O*6CkIv8_2^Cw`5yG;U#$8|mN1jQQvURwaT
zonSWQj&j<qAIz=~=!Z9=9hJ9UN627DEK|B9=4FwEKn~*Eew~O+1?8m2AnSNSsL%d}
zo++gZg2&o6Y1J{Vhe)#Ik0-%JZ8&F5!J6+IX^Mj(H`NuiFQjc>0a?3OKCyCsyLt6V
z@6Y_52SDMn?Bj;uzz#mIXp0O*J(XoPUnQUQ;;QFdky)XM#C||O=p4y7)s9ViHL!$7
zpxR<x<{#t_HHMp{DCdJF4Kv$DNCSX)z)i&do>%ipW<KdMlr}V+lQU)%?b*}n@k-u|
z_fmgd%<^7Zn<LsOZA}2e6;Q8Y*U-!@60q@3tf3!*!R3wfUm86J#$~PE@MOwwB=1gJ
z#Yc{mb)IUK%sAy4u!Q`6!6Ls)t3qF{syv($RgOn;D!T?yP8i?UQi`tcqON_%3?{gL
z`vp|m9cck;p8IA1Xc8-M-1sZ<?WK37u$=TyIsSz1m&tE2pXuTjDP4E?giU5uzcA@K
zK$XhvT_Sjcda%-=O5V(zFw50|2ly=NUtEx{qO5YKXHnrxjnhWsW?K$%u3}F`-MmAw
zFohtJ*x+al&vXOyUEkva#2e{z*#=9pKxt*!P9$}|+2P2{`m?P$-T;1XlTsVVN?q~y
zMVS&_AY$!`g;svON#Da$FjqzaTcgR#r#iCy=;msythLpfZ+2F;v9-8usFZY>pz#8b
zwg<Lfljcfyp10r>&1JaK+!VdwBPXwBRwulllJ=i!K=$$0A#a9h0!BjGyst&&Q=g4T
zd=5BGomF2x-;o$c@Jt7_K?+T(X7YT-E0z}+fwpb8JY&dhu@`?-iO7?Yl&^svUouZ=
zv=8AHq{_`OHawq8|KBH%^TM??6290pW@dQEVhQCG?kmijpz7xrE%WV*r;NwO!#N+f
z?(=iJ3zM1@-KV*6L1@>q4EikVW}nda7qVoei`R6>3I4^Ao}I*T(B9aIm$1O%T<X0s
zhno_6m!6w(_-oc2E99E35kUOICX@amcs{=qJW|`M#C4qnWZ48AYCF2}z))q*m}~1h
zeI($aK#=pU`_|wt#sNmunAdDQRT$O8iHHU4VK8GHJ?2@Ve(GnkS-qL!yf`jjHQPjE
zHjf6&y$@erD@FiiuMw{u%gV>pat>Vmj%gw^e))ymVc8k=UgUD{Eqg(wd$@3UcQJ95
z6=v7j$<2;Dd9w2JwR?;?X`-YfLI|ZMt8R-{d2mudCq}xC=N7cf+0xZ34p^bey;?gn
zy=cUF{Fr^%TwIx5#-!cLK71j)>ZP6L*^-UC#GWkB_`M;Idj~u4@dU_qpR}s}9_BBT
zYEG%6hOBV0q*e$xIWosIcsy?{hz!Rp%1`|akhB65u@Nh^yrH$6TW((W5^xTIx!yC^
zksGf_FTN4qRG9xo<doN@b&sqA;cbpEyMvCJmo{%&6UlJKjgE!y-@j>Lx9Lmf@;&!U
zb>w=5-Q+QnjWYwA{G3BYuMAeDPG7f<ECC>)-?jI4>3RanWk>xm<B))%b#0w)yZ<29
zBX=U0Ij;>@cZ6X%0`%`Q5@y4h6X9;_*uPSGeKoMD>|@^%RF3wV2ieq0tP&ruy@|+;
z$h|Wzqi*eT6Ecb1f}-AVi5ap1&i+GLTuG@Izp9o%oeXm9Qbr!BzGc;PqdG0!5Sv&R
zj`bOp4k&m^`Ih>}Spc=dIHf%wGs3Su?|5f1^d`@B5^Ro`g{{0R_W==6nIH&uvK)2b
zqeel$a6`B<rB*UOBu6XvkhNzikC17|8o%6QfoM}tg{b`&vOG?dL;<zZKOGeHPG!`o
zHMCzNbhp<DU8D}gAp3Q0<@7B>TF=_z$_**H>L*F2EtF}Ggw3;cve<Sr-!!bLJUVD7
zyK^>gPPk!+_jHG(>y@a(4hRHdxi*u4_;?(PgEvkcKKL819R_miwF96o6m_B${M8yt
zpgr__0Y9U*K-sjU7pr&p%M^R>3l~^i3#{=~6zVEWB2WY-j8Bv7WS2`;%Ra!N7aKdV
znV_p(U+)J3Am^%O*mIT8(o`R0z2%(qF<a>yr)^zt0};SIG*aFdBjb$i4-~AkIMF<f
zj2u81%=2cD(h=s3VZow_lV;{<U*a~L8QwT`hqW!_i=3H6dIdR5`a?6}2b1FkN)zAB
z02~iV=lPs#J<ySNsNLK*cEY~Ozgam|Ij*nWf=#nxncWAtqu-g%;7cJe#9NYYM$Y{Q
z=keOFO!9LwFT=+^{j^Z&p1z+`8NvA&W*knGX>T|-Fk@?#s`+4OXi}<v*{hV?Hlpa<
zAtj9^z-~#rZ&pYy@F~eT30S2yFu*u%jPs<8ytIp5H}9PQ>t)Y635|?3{*i-vCOaIm
zU}ipQAhc_?mGxy8L|`gMJZH?Em^pdUA`iTXzErhVjXJY3?lKUOd8f6sP3mwoo6TN>
zGiIb!csoN%9**~wv$F5)KjfC@px*u9qUw8{xoTLb;9(n03EpJd0J6RGG9#uGh>x+K
zWDQuJ$Tle}?Z9z|E9kq&Y(HN<Sryt<fqbRW@0WATwypic6^YERgD2Ne&TdV{0%d*Z
zz~Qu8m22q6Kv<_4BHD;|lyk<uEa8bAz_Rk7QvBVl_>&z2Qm8{+d3GeFd`W?;Hs8TW
zpyXy|4H&}$U@akJ7HcnNqAR{!br~4@=w^lp9-{Nk6$GefgA3DZd`L;JaQTC1X%;bk
zfj;~^L`K~NEGUbX6UI~?o6=By25RW>=&T@@wBDr{sbb7(x)+NrG#8G?6{;R@dP<*+
z((M1Nn0qnQ`Z;YE|BNugRq_{<d8WW5s4>g`nUXe8V&1KQay3F1#M)WEfm<SCcx{Ln
zO5*r>ofar+WReu6oTH<iZer^}6;CfMeJN`@MioPv>ZgwSI68MDP?2GmtJ)B=h6b4$
zN2%KsP^V6T8w?1oQ>|Ugb~%36a>ESO4{F|e9e11fYks%Qy8P1kB4z#QN}X#u$)Nag
zr{Uq8wwp7}(?gKrcOR!T&1V8*x0WkW)rdjp0SDjPoy3Xobith}4XAjvteAc`vjhOY
zY1;%%?TLWB$fWJb%FEs_+a?A2t!8Rcwl0&~%=`r%Uie3N()?Q4WPCOgfZFaB)=Qmo
z`E{ch5bNo;e$TRsZL-?;t@9<!e8!iJ8Lo=;-XsX5raVuuFwTk8iF7kBw8nNupvyg0
zQI1=32(&vLogktmCPi6eAO_LI;z-#B<QsTC(6U}DhxX|Q4+SWWq;s)9V(<nKgEI1P
zX}BERzBd_{T{?weC#rSYw98dfdo^d`6s=ud4vBD-;c`@ddqMunU|~qpn1h0#C}9C+
z%+N;N8$y{Osu2SfK(rYzEfMW7WWZP`b<LkuhhXbV`%fSxWg4_lET4`PpQSZ{gq@0+
z1H2?aR{*XGYQ1h@r`@}zzi(BpS7N#iLLROQdNp$mGu&EYSQ8|)NC*noadRzhrRl@(
zGLBS*<@35gh>j}vVzhSP0Y;i#M=y9T8?*%f@a!k(hiA3W?jnbU)*IC_%l@?32c^Hc
zfYlk46HcbP4!|#RNDuV434N)WCgIdPl=%tn33%I@=F{b^&QnXx;ApxyJU>mj|2fqr
z__MxpKpX3>0#Lpnnr-gr#vG)t?&(O+<@}aqd8{q-_|mI#O*?|dDKJn(1Nz-2W2x35
zr~XA&yN;MdN%O#;F-<86Hc(*S@^pJQ@w5XD%BjZ}UPIjn+rIAie1-NkGW*zCykeyr
zkbh?B0^O-9{dJ&m><#aEv`^ZcUEOFd+mL%n?8kU%#0<LtilhE_#UYDuD$Tj_1Do=y
zUeu|fDNg~_G3W|-$RjPKmld<0#G8enieE^#D0o!g&X})B24M>hOlEfUGoSA8!aU_|
z@G@yVvu?Unw&&bExjOAd2<bTiUV}&<NTlu6?S+S5=Pu7!d(Jk{Y$2|#GAFHj!^e30
zhS#L*lYTZ<r(-=@=YR^uKc79TRSxM3^SZ`N9uJ6me*FQq_#7QWpa&T>{Pr_ApznFq
z$}1CcBS|p7CU=*dI@^xnx9zJ|sus7lcSS<q8z>~Gb=kbjBlfsvG^{wj6x+1x(T2@O
zH*DPMllbQK6H%IXtF}urV*Gxo{Yv0K4WAhm-E%2<fE`8kKf#Xjy0m5eZ*^1nTff^t
z0mF%J?6yyD!}>*p4+pKx7y;DaVx}>3Q{A4s)T9Us;r44uO^+l=;8bl%ZA6(>qwq5%
z;%P|Jt&oK7pdUBZ-LQ##^lMzKUD>@?37$f43n{#u09Jay+Qxvlhft5Y0~)V-`PWp#
zfff`@UlRM#0(<-2Un@`R*lA(w?iYz~+zMP}*CSo#);XpN&~a%EaSdQ$z8ybSSN?Km
zc827S?|~cc+O;+KU5gn0L1xq0X`{{&p$M%X-@SSC^E3ZVqWA|cy7#mDt&*E^R8u$q
zxYveFlSiNV^R@#&lD-b@yq0o)uOWLc@=C-uyWUT{9K$aMMa3K7wzV&<Un`ZYH)O46
zLG_!*kGSpKwk^}k**50b!tj2E@61h)F8M24|F|s5BxR~m;rX)%JW8oFTW^A;Kx8MH
zR7$gVi~T;RM?dv#9#5{?16;-X=!E7g2}S>O@5%D4biLGu{Ig$^=}#jM!XR(7D=u$E
z+`7KADrvaC?2^?Vy*1a}RM}cyDPpdB)%an{I}78P?c2A}|CsT)r@B)^7E?j}W$KTb
zMztP|92d8L<s<!jL<CWeKI4zYB2%2mHk7~wtD3JJQRQ7ZPlfNM_}^>2s_OsYllj?u
zUfNnq#Dnr3zc<(X!6wvdisl)SM=m8n7d++;{kYgC!nW@=oxNkgKZijEe{}8H^%RUw
zjG}eb`_oo)2soDSHU4PFK5<En-W`(aH8M`=Zhy4&&oTXdp8pJ-U60;`>DsdfpFmkJ
zo(LJQ|NfBHd*IMv*Eh8p@BYE>b^Uf*)_hkh4WzeilylV;4wD{PnN1$t2paV{`1?rw
z&zt^r|9cyQf_P|0In*2Bu#g>64o`PX-mm>``uj5Zu`t$F*MI6k(D>#!C9At}N_IEM
z_F(z5_Cj^R!eR@hVf>93tNxeY{L7W{9&J9L?B7vgRVU;nRTShXg3Q93X~hHoovul3
z{eSQL!B3mx==Ar7!ej1^B4}NaFcGmscb|&Mz|3|W`Xsj-AM#f}e+P;G*$v@cK_gAH
z!6zQ-(=!{tu<lxj_@s1SlhnE!FWFOi^XC2|f5iI#)tn&p-IgWyC{{!tFPtmKs9XrJ
ziq8~p_H{8naOW?S_}{MZCd}AAMfpPhG&@YUc&}=iOB&u*>vmPq|MvI)(yKcL_VhMc
zXyfZH>pLzGvraW&7@ygDLGV|~ME_;5|7X{MB|dfH({(*Z&`sO@^6<x&PkT)5ga75~
z|9R@~Tu!l$!$r-G0ozjdg8V<6kvXFtEL>M!@&}InpVvsyS{v~fb)wBB>ETUS$)gvl
zRc=gli<jsP{&X<}S9=jD{Ncu@>;Ez2{<TLb)LlSo$0}Lfi(}Y(fjn%b<U8%f4xQ^3
z2^SHUbPa9@j*WQof41fK0DpG0C~!$d6X_r7rRPW*pjmf`gbf9Q?tR~->R%*w&|34}
zcYD<jD-APWyndOu_<yeopo#WdezJGj&R>mFRBgg4ssTH7r{P;nJ<YRpr^8gT#(w=L
zO}cUEk*?Qn>8L-z=KowzW4~<L99I3{#`DepIza!qr76E{0Jart9R4R$ee~0l&4Bsx
zE#>EJ{{T%M>F(aRsqV7RdEtN54$*D9<fq>1UEcGL*4WQLAH&BU?D$9Rkl1tdM(>m0
zu;c$Aj5ch#4D?ar^S6Wls2xhjbyF%tMfP9&N9!|e>n?ev*YD2$qjuO{1twi$=cyO}
zdENcnr~7svy<u}H#OWWkqv{zj=}L!hAOA-ICI2(f$KQ4~{M#M>6NUiH>nC8+ZO><2
zef;0RULUZO{|5HIh5LU4``?z%e-ZoNa+B_V5&Pe8{J)6(Z>0UdROH|CYtVnG$iESk
z|5A~E(+U6oQxW^RpUxnf&(Dr4%$gsrm0#0epA0wYPigm0RD9lA+MaQYRtBcr%MdKo
z*>zs^`a4nBVFXZok<p6JZh!w2$ed7GdDlGVaF`~vZ|n1oSHCJUV4hc^4zZAErnFx?
zP|@?<kaN!yYhmlFR!TpB<6jx2oayRCw)RcJ9&E`$t$D(kc)y+dSJ?&C%{5rN?E()*
zLRswt)quijXlA7TLDjp@B+vOgBY9wYIPPy2b1M5zNNWEbkLA}$|1NQnpZ+$!XU=Th
zap>HK2}(oqD9w}JqV@faU{svCinpq;uYEJ7MLvD}D|Cljc<bRPk<dP`O?9uoU?#Fm
zQ=2Iq1jz~$EJkZi0O6!od0ka4c+9st=;BtXvJ!?^*D8H^+yY$Kr21(Ou?Hbl%1=fn
zVqtHlNmM~(z)B?(A?rXQQQsYY@KuizHPVE|os1D@o1ykaZOtodGZ^g^RocE+X|;t!
z!>?8xo9i=9m_2WrBBK%0N!mE*7on<2w|cK6?;iN5J6`Xiu=POCoj2XI)5(YtQNfLk
zwtpw_x=291c!*oL{!K-XZP_Ss*Z-YV|5rEv(FB*~zSXMS+b{-f)m#<5>`&kl86K14
zR;KrldYBJ3tT6XF%!px#8#5sb(U01dswbgOxjVQh>yo>nmEV*xJNZ^+rHv<WiN2k-
zAk}cu1KRwF($UZc8IUr?(nHv?h7vG4n!xbD$6EPeuJ!tt=A$g?BO*7|DSgY9gYtbO
z<U2>(UKW(?ubVo5{{`UC8fEl4H^n6|laZZTOYiqWr+ObUuR$+gKY{K=pBQil<9d{E
zXK7lCZ-gF_uWt_He`czGZrt87_BoYi#Y~oo^XIWLn*&@3`+2m9Ip8VC@(yzl@BjqP
zs;?h=!YJPUO83`sb|DpNm&AWvIkdoNo?Ji=wUh@{#BSS%y%5bWU67G3$w?^F3luIE
z-6f(Ly8q}xX}HtI;rrBNw~Un+kGwEPEO>vD$Da-XF>n3u`JKNZ*`2Fj$DE?Yg?<HI
z7OgG;Ik-hSEHMGj!oGVqu*|cdY5NtPZ;C<BJ&R5tO;tE$tv1RL&PgO8;bYv67O76l
zcS-(jjiIB;mESk1A{U%O%T6<Ig`n%*$uxDVkUjU6?k)GY6((r97uD13nsL{p3tJWQ
z5#x<=vg0h}D4bqR<EY-V3L}E~@X_KS?}Y$~Mak$$%gWhdXFl*QNWoYB=n8+eT^?x|
zMS#~^L6<)&g!uM-XR;^7&!czqJme(h3%~`<d*uq8p3d(m<)orJM5wX-0~0u6UuWRp
zt&pdEA8{KeHhs*^r&P6a7n3ePrw8jC66TB{Tf#trLsGOL8IA6|^3FRfCE36(t|w-e
zJvzYc!(NryYMh|!l`vZYcE#7s9`t^%<g{1y>Hec|)iBS1yFm#{AAa#3Mw;(*+1C(V
zEy$(@_S-zHn-!QILH$ci8?MFlwkxOpX3X7_1r%(@{i;Xx!^fhxi`oGXNj3X+2~N)O
zU75k~%5K}qlHzGtXR~#4G-ff_|K=!Ks|c6y)3MK6+%xQag1mxe<_;7VQia2UN7A~k
z`Du4y#zQYCOc*)pos^O{N4u;BFu}_gDjs}$>;JHc3ocsSh`#1;Hi52rt^*nh8l-mX
z&ctTxmVC5R5!_Vu|85^6;crHv5HCL6p(bIc(!uSRA6YA_wrASebmjYznc7eSYGATG
z+^2d6YPUSPVG0>9*tuwLOAX)C>$=Tjx%Z&h%Y37hispb`!ravP;)cUI_sbH>l5HE`
z3L{b9Eex-VOS^jnxW7v95@>lhU94qG+N3Og;1=8zmG6ps9Ys4&S)z2&6uC4Ib~(+@
zFpDd9Wp2ygjTgWlusr^Ehf?qq@E1m(I+Eu*LDn#GdBEIfeICtyJnv{SZW_5<tPk2J
zDLzs4sNc71<ug|DZm_e5`rzWU0uCtWwC7dzxQ156DcL$wd<M5cSC*GT=loHEvo~zi
zu1>t~!wmGnpR#IxZP`x?B{(T<)nv!vv>w+63*$_k>KA8+BNsyUO(&3*-l4etZj_ad
zd;5W7ro1^j2S%?m63gX`=Qt=|L;FlpNzmY8*f#wmD^GmX1RwnhH*}*zq-l?r3ULXf
z-WM0F7cYun-q*mGwt-a7Wd?-STDWLc@U*Xg1<sEe6ki&`Z+)35lv?26XItspd3ts+
zi4NZq+%<{J1f7wBl@(jLO_oPWxsWO;_<)|1sFLPNj_zK}4`9IEs~Wi+_{hKEGqj-`
z86i0l7YFAYiQ0mO6)mP>!AzGuE^6puzWLc(3xu!1O|_a4A_=uR_J?cUExsW1(Cffx
z^<4S;f6qt<ivZI~y!%z^(4U{CAlD4FsAAuy@*{qZMK!Yug*A@A9wdjSVp5}Zm6A_A
zG8{ges~55RC3#c=zXnw}f5^etN_AgTr-XUiH#}*g$a~}fBw)#T_6>E_tkMRw|2N>V
zNn|EwQNVHj=nYOgKbV#JE}=lF{hHiiCRVZa^ru(vRe}b6&J<Eb!kSX}!<pjqdOlbZ
zcuQD&u4=`KV1&n}by(Qm53V!B<GO($D{9nFe11$nk+3`_qH`ws!>3mKT&3@lA7v8r
z<x^|5Z5O!_E<Ej^8KJIpmow_k7zo{58Y(av)EjN1QXMk}zCX0B%=`5u|N0sIBL_D}
zh;)7ACp4A|4AFCWmBS*NBTBoU{|#Nwd<Pc$5r3yE(SIgx-LAcWH7I@YFyX8}J1+qW
zyz>*<PE+R&dXPAKS8BOR%KPrf7O@|H$|L|!J$d9aZ0vc%%E`~Ns0OIe$I=hg``r~(
z>nVhaari3LV#2D<S*R|GorWKP?$lXK{b{h!MkCdUqp(xz`s7QXaw(&iw3t3-JJ7dF
zK3Qu-zVzEu&$)Algv0zwRl~$xS0ez=`)Pb>i}pap*K8sIGJQ+x!wRm~h|%8eq)zwQ
z>&>N3wP^Jd_KF}<{7dk9ffa(GWA8Uj{#@sArC4mD1>yL-axTMS`C+?8O;7hvqo9WC
z=W?TqKi`$&6Beo^Xmf6mHV02R*x9y;yQ@Y^MYhFnTaDnVFDF$xbu8U+rF@Yi^S@Ot
z$rPUW`0ei&g?$QOE^2+c60!2jA3{B7|07+uO?8msCgp*cYi@%Y?09m2Wwez*%(JMe
zEea$$ar1+T)=CBb8}C`=QU<k4(JHCn?nH$bbij|y5V_F1vZ?z0bkYUy=6B-SV=nd1
zG!4V9pD<WkKeeHWJs&-gquH6wF!e`w$|@J&<$8Nbl_T+mtL^1bV1s@AmQ($etrQ(p
z;|tkQ6U=fd<Wz^;-DNeeK@DhXBuHJVTbHI0*RWOUV8F@}vpI=gN*h=~1PAmiq>~sI
zn2<3SdL@D~U0&Ed^12~@Rb!ZnDhCeHP-&3XPA>}03F=#28qTB<J<+9w?Po8H|MqV0
zyhXmUX@yYBJ*ngU?}fv2JvN6apGmzEInx~m-B-P1XoA@%NYQ0Pqrao7lfD~O_E(KC
zx~wrmRF2MGRZq$VFRiJGa;^>(c-HvH?dnSI5wJ(0&@_#fgPDah_-PV${{6iVZxx+}
zYnhm)_&4Pf&nXmY)mG3ydG>iV6m^$lmM>Ot;73ryuX@>d&8f#h$ccGl5}RZ_iF`{y
zsUxopD^+*9wSBBrYqZ_VA<OYK#-aTll)5+y#fL(oI{B&gDDfwW))Q*;PbBQV^8qLb
zqx;8PUv8U@!sDK>iP*{J#RSsv3#%)MZg1V<t4C31j@_uK15Oy};|6A0q2@biXOLon
z-<Fs(r)X_gVBejYSm6-m+ZPDKbJg7YL&K_^k${WhCKRGZN<MkQ^|j*Yl8w~rQ4%E)
zcr3oP216AzA95=gaXAHsLL|TAJyELeZ^_Y!p-9kKDa#fq_lj4xP>dq=eR;LIW+bMB
z`Ka12mfl%pILF}^aN|Sa+vZH+^c4w6;OAsjaVaikkshrL?d2Di+pgd}>5_G;&)6`4
z+S=JS#}`8j$=n4)@9NehM(@K_ajgeb%#%m_pG<OzA}0#Jx$Meh<K~BdR&^T9g?1)g
z4!sCYEQt$X)Gvr!R@bcw%#M_2fSa(J;q~RS&2!*Z!(qb1PdU(!`sQMf-<N+a6+g_-
zou>J<f<&aJZ~P42`S&`3@F9RZ2*KWuDgXJY<;JaL3O6SDOBX{;P#QK<=S0&*&)Ci4
za%sNm8`%Azg#LxquR--F7J)>=fm)l3nocR4d4V-y5x{{Z^t&<F$?X21faaISR2gO~
zTnb09Ai9XEVe^<X)el)4x}8-s5=3PDb?bhqrjOzhf_3J0t2&tR>-<_q$9)a6S`rg>
zq>S7JmU-=>Q<Nxlu8J3>^RPsGxFRK<SfexU-|=QjN8Nw5z>lh5M|;^AB5P@$ubh_^
ztV!D(4zO79eGRRKpggQG!Sx8@d+qzJ)y~bNtS!3Co()XN1w8QNnP^evqhto!yQ7ds
zaOHe9U#Z!U8Kr5xPoDC1FndM+==8D`f3=FOG&|{u)@DC5ky5#vRe5i`?7MAMfU19A
zL{E5zvH0wM7TEFQXPrl^L;jzHHz?!IYP*9?+K(WooP$&OAxmL!W38$9Gu=|mu>wDc
z*2?)=daKL<BB7vxEP{F}ZOs)*ImLJmzdth%>i#6*)s?S|_YX9TI}ts5ej)1^&3YnQ
zL}%vn#XYv(oZEhheM@Cc1=R`MZZ|Ue*JmFry_4z<Gfh;Z!O6>Bzi1WaHYrY%J31Nf
zWA^g>deJye^q$g9bzUn`;nl=Zn2gr<qor)dz;nOuOc(N@lp@{QT9K%t!ov?puA1LK
z9?JOnoCL3?T!+R~@pyY3LCZ8$R_d$Sqwd8G#i9q5MK?8UKM3&@s>g`MWha-7T=jm5
zH>+vKO++8+jd0{QSb?nRlZAqX>bL5D+fxE;4bTNdr~lEYL#U^J8b7wiM}Y^*hs;_M
zv>R-I#hJd(r21Uq(mbsY)zKT1xXtfVh`72Yr^N8J5{TcmMZXOvibxa6hn!#Dsww3$
z<kP8vp_hz|=Czxsc{5w`HRFuCUD^4~nXBAVhZz!pkZ(r}O*Ds2tD;BjpLSwaW@TnO
znjR<E>!mE_6(#4bU;x!Yw+hw#HQ>;s5qa!quy?*GC2vS%wM(CthKJ9D90^$5J=A|~
zLY)*iB{gB>K@to_X*P2yd}%6S-eOmGUyn>8w@u3%&>POqqV2#Gt*UDpZ-?3n*G9a1
z=j4&;iVA%T^Er{<?gURf-)ls^5bw-<T<0M<Ucvx-2$1wV+XQ7xghqS<f{{-erKEO;
z`VrK)3EntOedF^B2f?bqF(fP7H`Q7DdrpaZ8*UD>{q^IPu)>eq_Q?!KyWnG{ba!3a
z0hL`HX~n2ptjtL0Q27b~krEZu;4yvkg>Q9>75v^_gQx%-GJ{>=$Zty$%?S&KV*82R
z4-IFj1cA-ZOTe-!a2i&z@ozlGZ<&6j!%@bpc+Yl8tqgMeAOVSwb*Iq|l-KyZ(VFV}
z<#(R1Qki8c7nP<3JCDwe-#Z6qJ=8mcay@vw@FC|~SM0)&7WzAxlW<XIp}0tT1od@A
zq#3J>_ZaN*mu@PZTJi1utRJFUIJ9K*Y_Vc5^<Y%MvgPNMkpUt{o>)3GWDS%Tb)x&k
zi=(u72Q~R9vj68^LC6ur2OABT>(q3KNN-zv2pyb#-fJ;xP>QLj>Pbhxlmxx)XWAa^
zuKyLQoW13#n`)RX;-D5>H8LMOq&(aFOzkNnJyULTlV$bMVhFrvOBl=sF=nsYLCIVk
z<mlWY<_`b8cC1TXGe;mhMe%>>ECuzAGV(;#n|-5kK1$N^$-71OVYDUXcLr}LmyqNo
zP}`NJRWW_Vks!K!{C!P_$CX1-3>sH?)x&XD@6Gn9Xd-q(C2^p7nE_vF(T5e?ji<LL
zS@B*4ixbO5^iq+W>aM_{T!`s{4Vz*^{W@saT=Yus%ve8?Q`~e8qo%rgDmTy3_`+nw
z_iiAleZ9GTt1}eweT<_e#3m(Q)vy><*}fN51f4lmou=1y;S(whP=d(RYP9V`zC-C$
z6+02{hpMK#=F00XeK=<N$YMUOoC)!Nju(^I{BVU6Mo6FzEP^0DfC}5+!t+I)pBhVj
zm^&9_%K+H_wCg^3xclK_BpT!^lqt>T&RcZwZWrL;AB~-wcY8_=;m$8^uRiAmOZZY!
zJD5pGa!N)x!ZoYAIcyz%%`7eJd3k!~WZNWod4)U9n`j9apTIl{XvY!7qWc1v_<CBh
zk*Cg$ngGQc?wAQvtyKS~sQs?6E5)``=e@5K;~iM)Qeh>kXJf#24_MQ!A0aC*cI@-4
zVr9TXm(`k~I8P5^uL{q7Wsteb413DhYf_QUk=ZH8lLlR!$8&l$wS0VFYLCy<PF19T
z^XvZU&R~x;e}$_A^60!D=xr!Tc;GnqF7nny^m#iX!4wvd*jpV3Do*Sr4s7J(ehLoO
zopmaeQ6<q5(+B(e=eSaW7tJlxK_3q__-Duw0^2IM_-dK?JmBG8VvEq*=?6<0Ce__`
z14lw78vD4MAY!c#j7piY7;Wu>$dN46TQ2Ueoc(s7I<Jz=F9M#{UScNCce$?~!(FS5
zcJD=v#^F3w#C80s0ppFC%?B0^cOwT-G}qjM4A*AQ$?XSO=^y%Pg-#dtxfY&$Kyl-k
zblI^Xg=fC3oOcCS<5>=x!*3olt#xS_@nZN<XJOO`#MdpDh9xGxfj_ybHyhRGCmyb7
zO=-3fupv?)MqeM3*bkMO?dMX#XLSk&3RcN|@c3@06Zw5kI|=7BvOd-ai{zhszr)I<
zLbBvz(b28$m^bBt#o8$&8TsVN+9%LXp;;QU-(f(^6Q!u9eJ@F|`i{vNWcQYkNqrkV
zM;Fg3zOU4AbW87Y>%IDio@zIa{9SaTE(6;GAkQ;x|FTDeY&HQWjCgtoDH4`?CElvr
z?&{j&-Oh+pzkwJab9vmA@pz>2cgbRIq7HO`b$;?i_@1Ui)ivyVYI4HE+xwEVn0cxX
z2ZVB}@B&UW=B+!a53X~cr9xVsds$W0r$?ReQT$Zu-{>fF*SB<EpZSR!6El_c$E{j|
zvL!&*xwQPE*&>YTEYUj(YmmWd<8CyR=HX1$N5+18w+(*5jBMCW-rGZqZ(oRQg2wYX
zREWo0^KBDTZrG&$F5y?@eU1Zuympz@s|6&pal?J?ul9=X7*KI}m2g)`vL|C;&ft7*
zcY5r$16&gQy|qVWy4VNwr-;L9ZB#ji;#tO&;t_fD<a}52UK6cvxWg*`zd4`pp^94s
z-JKr^;43jiTQnOg{G2mM20?@O)o-}FcvMY-0Pk?2R6};Y-`zs#$R#5{-g=QH7Z&{D
zg(gb4JyA)4@o+<HZZdtyc+oL_6$hVxjGUrq&h@phT<}iyk<z%U)xgnaC;IX1ol~%Z
zkd-NJO&8O<*+k>p;-v(Y#1`t9qiT)Z`Bl#{@bRTef!?+L1LC(&wRXU>J-K0z7KwBy
zZb>#fcEJU?A^_gy{?hs$sR+FDfm31rSWlXkGb|}YVaU$wLE~i!sFIX+;QOsefmS^g
zqvN)O;Zj(tEjn_`UZ1u2Xyz^IzR29%0kSCXOMB~s>Thvs{ZqYyPqi{<V_bvoV=Em}
z&JSrBum093*g7^Ss{EasSR@2*5WM-C<rJl+{SNVVcrJR!TcPU{_u$i?=0k9=*b!&c
z&GB0|i0C;wC1dV~Uf@b7$3wbDvdg85ndiOV_YcuhK3{B3F%5nvn*q3PP1gqk2iVY_
zXaWed%2wO|?oXw-wgu`9pt7~ThV0t-mpj4VTA^Ev#AY#$6rM@-cXhooO)gH)?2D-J
zPgxukZ7uZ$+imX`nb1@lC~ipBDMW%tvmqKMx#ZYeQ5Wi4T5JcHzN+afcU_FsdV1aa
zPc|HufO<EXWD1?1`kL*MbiY0tLT6Ub$}~FTY*Wr3c_b)7>U)j%<vIv$(VRjx5;RXI
z&Raf-$q|fUFwO3(o%W$@7eYXN5^^CyV|enu3mz713Kz!qP4Spunjckgol00~+5+!8
zeGg#i+!q%nhwl*yhEl4~Jn<GPpUeTd)jwuTbyrI2@vh8QKAh~edFDUEa8>QUDMqVc
zbzFL884~`u&IEjc(Q+a=HBa!??!j}s^uXRNLB`+_!+KhnI}^T8$z;6od1!vu6sb&}
zd%ZLhAqij{p{aTF@e^DZbRYG67ddtDOLL&o^q^(RBI!bqBdD|;Hl;7E@4O{Ux#GiI
z_tzAL$5opALg<3Bggl(1-(@}*WjWGVGCl33ca^L35T>*tpk+w{!TlB@qaxMqH(!;I
zBHCN+9UYBc{HAg^;EU-(Dd|-!zcnI(&cuEij&qulJhC~gFH8tnDuZK(Xw_G$oTiE4
z1<FdEfs6pGE#S}c9>n{!B)G&gCr%H{5f|Q<)82=&Gh!}cS|;>qG4KV?z;JG3dbKRK
zPpyVdBa8TBd)yr)eBhi%(Vo-DI78~UR(J-l5WTx~&s0N0pR8T7YO3XOX^WFz^Oo6i
z!LUBKj8j3q?D2MLj)+G+xD%?>&FSa#g-upOQ)>_NR$^&erM}D?UgP`iWW1^A*IVY@
zEM1OGhw@|~D(!{g&^Mfl&jzC(xRIb3bs0(F-}*Fvvwh%SBp8ZIv{P{jvf>q?l;@22
zQ%?Mlzc!Eq_DA0@0Kk$Wj%)mB#_LM#z6YFkLQAT;H$L~B{A_J=_fni~au02%M;Sg~
zp%M-qJV;QKPPvZtHB_jk=X-b?zJ@9W<CKP$OWljyZYy^CLh5JQJ?c9fi=8uFy8TwF
z(qEOQ3)Nxiy3-f;1K!bR4R(Q3u&(KiF%ik8mK>TEGFfbcSmBmO=+$bsW|;}X;sNnf
zr|oLG4`Z556I8Q?f^04Nx3J19N8Zi?dai+ua|y;~(vLzjiO|RI$F0qaD!{^_U3ZX*
z-V@V}36U1%50>nvuQC>0<WPAZ{0w<31Fh&pOYJu!(IR2Y9^L5#*v@?fm*5<a1KEro
zY5A22rnoAu$BN{EWYtN~fCEw{09va#alSEdI5ot7K=7fCrh+dT&*=vbeYw>fuG})u
zpDF|-T`31Ht`lsf*Q$~@*cEyzXfRLLx%+Ij_ge`Q6;I1!mirxAk{X(2C4_4^{>ga)
z@`S6HM}P-xO1i}x;;-j%4;=U%lW@%wX+4(dx3bVB)vSEWFt{P0!mo<}_^B+%bQCv7
z2$YHhr2e+13b%WK@EZQ-XVr2QiVDvTA1Kqz-@1<w&=P<irQ~wwyC5Xh=2RJ-I>tl(
zRD%e!N9Oogl4o7{VhrEpjJ|Y9qGa_8d>{48iu}bUL%wdY?M+0jO6kN>9W+5~pLos|
zG#>BO*R)_;AKX05wKVVKHURaqg?6UY-8dcchtmP>6v?t)#Q|9RB%ujPxl+_Ec0%e;
z1K^Ra#V){P-2d*kt$(KKPqv$*h^20FJyt{yWZ;6k_w;3nmwPPFrFNTrUwS7FlJcy%
z|60jnm4m@tAKhW+9MO8HhE4G6;ez_JFZwQAXHe+wvl*bJIlu*R&9DnJwN1|3%tbel
zIFxGe@TS)dM`CTzJ&KxS7Z{zj1b;dpaZ7bMaofH^*8y)9bfW6bTAWD;=L`vQ4~==3
z?vgVJ?bl3FOZAy7?^16#jB)I4?xOOXXF2>SQPkvnp=tw#5|4!e<rU8MSpsHNQ`NeL
zV!l~UMXK>y;BeNx3!J>uGD}p6x7@weLouDKvzpfrA8ApE5((!!J?oyQ3qHNsvTAeG
zka58!*~7&d+S+TD+~4D$(k*y4<N{vuvP>7fl3z0O5gNNKH*vDRicEJeReUQGUSTvf
zyWHoAQE2ACSGe8;z$PWl-B-FXw&`hr^>WXriHJe}UB!JtgVM0?U1T8(Yppl_V=g-E
zfgpAi9@)u)Mw1uRm8gutt{|X<)P5NG%N%;pUs|VBkQ<Q!-x4N{)1udSrCtxTNJjHc
zdaqn?$+dp6kiXE^JS9!*p#VfhrBD_?J`DMr@~8!Mu`*|xxFh;fP<-hMkBw6#_4M>t
ztE;;eXn&r251mk8&|Q*}<A0J7AFgJ<#!2Hz<v-sDY@9QE*V;i<i92ONl3tCd<oBIj
zK+$O)`WQ!F@8O?3x5mX6Z22uxY?p%NGH10JgefWw0aJ5rX?nHx5}Sz|9kvAbMK~y)
z%`dZ_B6vc<6>lcMpD9D#Ej<gSj=m)a&Qc~0Y^wj|@!zVl2P@X90lmek%)j!j+qMe7
zgH><R8Oeb&*Sue$u=i4Fw3`nh=5F4cqZH-&osJT3cylf~fYE$B-ZZnOrON6CrgBBY
zTi}Z+QMH(SnbtG<(dNPQ?aJ5*(FN@+7rfV<Y?a)+k`nycKxjOOTsEGa$#Bkuy=j7h
z1cEEzy(-P_emQ{RK7$<aqcZYLalR6Ta%36tUFp%zOEP?dNj!)u>pxJUIR#aO!rBI-
zDxHb={<#A{VaUk?nnWB~7>Ow)FH|MCV0XhgIPww)16uR)cDnTVqwqWS@#*h1os}<0
zbH?-wifRWNBoh45>2<U7OaW|Q`9SHwib(vc1#j=6ffZLYhUUrW@AFTo_<R~Iu}^c_
zFtgjaDR}=T8>Uh*=O$j&1>W82zblsk>{r&)+oIand|P7K7kC@r`^=s5Hh}Nypo$uo
zMPmqncRk^@TA>&nJ^nCY=JCMf_I;QsQOFsbdsU@d&+Tpds9vd&%?>fCk49pt%TGAf
zh4Kqs8tgnb$mJsa({=G6ST*eYyQ=*`j(!6Hd`&nBe5B`CQa0}1nUN$IM|DbLOr0An
z#uXBV0mf7HQZ1LFKx#RF-}`YQF1E!Q(X*wXm1NlBRz1}N=5c+ST1z}6eMw1G>Lefd
zGOu7x1>OQ7MgcBmdIpw}o<YDkgkIp!Fq@TE51c-Wdhg*xbEu9k-sqso?%wj$wy1kc
zlwil8{lJo{Op<2?MDV(DWMKB)XkT?SwP+~oQ#8k2V<@4bN#`#p+pt;q@S4Nv@nP)D
zpP!DQH?8umG*dmp?XN%(0bjJ{mA-pFwf*@HqmIe&+XbGk=>64~bJeHmVzjiT`tzy7
z61qtqSYLGUfv<;w$Ehv|njfmRwZ&@BHn)$~l(rhkF?n+Mz#J>z@{Z+c{uG%JIOL}H
z{hahAomR>$SCT(9u(+l@9*a+D)0B?x8R(5DkW2P|+gx0lD-*Ej0JzaQM~)O6l80{$
z&Xe?Xcp|B3rJ7|+G(qt&G;`pPS;MlQix}fPm9)Dj)Do{BRz5d7{RFD78Dq(q!$H*A
zJ<ykx)Pr?n0q<w3ABL)@e~vb33(8-dms8%A<FTVmvaVoYS_a?i#fPc?=3j~Tf?<hZ
zwRm5|s$lgjggkK*tZD;(5!%Yrni+FyMzHfayN4Ae`>;WSt>_g|c<is^L4)Uo<fcY(
zD;@=lER&j+E11d+r3JZUF#w;je4sKk_C8wDhVLO8DmU6(TxjV3#ZO<s=)Bw!`6CW4
zp9yYQ)vmbmWopy~21D12cf@Km`CD8Ix(nGa1%H?S?Ax4LsrCvM);uG-pns`YHZu}$
zHSz!Sb=`4ICQn}}f}nze0#X$VN*8I;!g+!MQbejiC_<!#CJ6#DA_CI&PI?I*2Z%`T
z1VRTXNkF6qh=6oL2ps~+`*_9kclT=kdOrKf?#%AYvop`kcW0fr4ff}KoRY2c&tPtk
zJESVx7kWL`^5T>!V2*Kb@Eehr-WBmurN?jublWN1teqNB>mBJU=WB(=Q!XT2Ah%LV
z{^zKJtq5S!R5`W6)xY}rK_{c01Q=uofU^mwq|9ygm6j7jnFi98dIfw&58Gjk^{@5T
zuIhL_!Ae%w;xS|eAmndnjw4lNya&>U9;c+N%oSCDlOPYf2=T)<<)j?Onj6zFqJzO2
zZGUsiVzRLhUcZHyNeduP_03{aAo?oGmYXIU(fk^?RG1cb56)lPOVx0pvsz@2ycC81
zf)Yu@o&;-^btljkn)ww+hH&pyeuAD)N!KK?wNq6L8C!pKdogiQIN2~f<O<ihQ{nb0
zN4W7NWM=wfuY&<sZDwq!`YRrfNqKfj*GU{E6>s(pv-lZX(<lxl2M+Lmy7jZ>T^7W)
z?OH_|oZ|1RHtc|}>!zv~p$vSwE}(652$+YR&JzI<IW~c>liZ2(Lg0aI@dVua)D8_!
z##a48_9(RQ$Ey5ZGz^hF0?udSMh`dSpnUc1PZb9Y)&}4M0$ZO&D~`8dbnLu`LI6{F
zzO8Vga&!-l76^FUfUXRhTt6~XE6njMtz3l?P^*i&vQxAT6fIG4R~fPL>fLR8XO9)L
zaT2YPGI!f|HdFP;-apGH0XwSqIOixYS#BIJmQK^AG8Vhq=#-(SYMQYV9{i3l^St&!
zE~IwxWJ}oI>J7QY@EhUYN?(l#ko@C)@Wr&09nY-)+G@)z!pWqybu2C&)|s%RN3`8}
zFC$w%75~%NtTma<IQE)-i3Mg9kw)-Kv4!*@X4b-z`dvyNS%;%&+wD#>l8V$OP1}|N
z6X!~TM_vEk3QIJjk-AT7JrHQ-3C+Uz4?DJDm#LE-InNO2%~<5s!M&LUnON9Ukk{3K
zof5vjXm*(g>`xE&qSJ*-52AE)Zr_$D&96<+LmkI>tiBa5yo#*Q^-dU8r-d5;f~d{M
z*LXHIH65tGcX_W#H+y8-lCfZGJiz0u`RwJL-_wk0HxytNM(An^d{)z=!gSCqTN-;P
zB8Onn(zoPhU(v?&G=qE-RlGF2*6o8UZLG4rGz`Qti1-W>UCj(Xb~0wQGp}ub?wkkO
zZ{#7};RJlI(hTfQyPq%??a}y49n0=HxSIE1*7_+XlQ8OM+oTzAcImdG{}%ldOY=H_
z-Qw8FTV~Rg(AJpy5=e9rKU&*scCvn4$P-8s0T&T$3|d1V!{ZM|J6WJU{-bEe()c4%
znU~D{M{pm??r~bxHjyFwCZU;~%yJRIgY2sN>wQ^7qovOFLOWb6ktG#X$s9EK1T2%e
z%@h94(XWc3G2j=D!(Frv8!|G*tB!-AwO845bAD5>RhmiH0Nn&Z!Grjez0ZRUcK42n
z7m|JluA@WFs?4C^G|`v&$LZT@tBou|GT;gg5wVe&B62Ypz_JC#--tX#&B8^lCMYXR
zzv#!lqL+w!S8Z`qpA-WnvGFD;3M3u{+ra73D<(-D=xEt6vTC+ztR&e<qP;>Ff^m{c
z>)22ZefDi^>!98f5aoc7YR$2)$BAm<8frH8Ta1@hvqxwvRM&1Ya!aK;X+WCbmaz1Y
zV5MTb+1;n#(QWq15BTU!jMHKQ7ig^aTyMj6`VxxUQ4a<zT_x-5Jtr7^K7?Pqf5;pW
zYD4q=Yy`C!+z6C}k9wi2Cm|a0vuVQ2u?A|>=hjwh6BaEgL6dzBL6f?_22JKyjJM%>
zj*crXu+8>Q#aP=DJ?0szq3DIdX~tF_tH5wRg{z6taJ2P@%`hT8y-<`aE!;DFm32;{
zlq{gW`Q}o1#;+Vp(7JNzWr%vkS;Nt$-PMP!ebyP<?YFzd(v=~vciz+E*j-u(_l|Gj
zuWhNyx!mVmuLCl<*x1v1FC40@lND)6yJ*Dh))#ona~vKvYNt(>wka8^0=W##IHjip
zP{IjFEA#pl#@0>5JLp=FJymL89X8I)lRVL^y?tL;jAo*rvHe8MFfbJnwldio*=G{B
zItC#yZyw?((On)Pxq|mg_Kn(JXG6?mlj?0TJ3uYqkPWx(HpS#-S2D?0bCBO-FHd=;
z0RY87t9K)%l%%`)iI*}jrRVf+G_hRf_q<D`EOz$6cIa#Pa8paebk#+(8_%&H5nsY}
z9bnbsiP)IHjG+?m6d)+S#ou08HBc)H+nJiR@t2s~*a1=Oia`{<4iKdnxMc2K`AjnA
zIl3a<b4j*(wo6AmT4pwtXUsv04%N@7dV;J~gQo+b<-;_=Rf@VRvF<`s9ZqvAvE50-
zDcf2=GA=(5J90_bqF=!41>)3m$r~i6Q`7?`M|lnEU7%yDA6#5lmmRPZ3O5Bl!w*ho
zq_ST{J7z<M;qSo;i}Fs#*?CX>6NAkV2k<1z5q3X+Jz32;r_L~I?e~&zoU6OU2S^F*
zW=SUlh*U}AH>eQDguDURnD1aR(aJY&v<F($7&`M(Tj<#SIxgo}Ik{!*GOONh(u3JU
z2SWuflI|a)y+?)&_XTCGfY@Ob1X}*g3py>au!A|PaCf5+t0}x&w1s-KnKTL)Qe@+%
zW;qh+2f+q54V{8|EIOS)S-30XsB*H#z~)J6OyBmMT%A}#m1zQPj2zfCx`9WATGX5|
zTx!|-oMF-(v&b~-EmqKi3r$cpIm=@Kc<p0Xs<jE{7f$}{vyP#rc@Wl?ah#vksmrdL
zh{1rL=&7YR8NAw-)f`%o=kqlH2ZZ(C)Rr6>;S(GG0<$s*Ts3y-3|!*}%WaMO7|fZC
zh0{f*aVq4i1StPICQl#(bA?EoQEXb6)O3W8Rn4ZOn_chsa`<&JY5kFK#9<i6-GQ8>
zJS6?G%MjE*#~3KiQxFi+2!Is@VU1(#Qfcb_(l-PzWWy{^ip30a)w5(Jmv%ivHY^pl
z+t{rR=YlA-O>Jg$-M-)ig-8&-w|{1~-4uF020;?%EtBUG(<h2Tu*uGkS2Km*c0N=4
z>>#X2aIZupZtjz<p)@-rcYmjQXP9fFz3^PQ?06PTtB74-kfFYEkLoM8M%$V2?o)v(
zHC2gFjx7!^mK|jiM-eM&-P%0KT}u-7@k!8WF(aO@9`X|q@(hp_tB+#Z|K=FOP0k@A
z&c?g(pga2vUJ*cZ4xR|IQOxw1wT5kw2R<&H<LOpfEHlPNO4q&lZ5-pUrM5>!qRJZw
zJdjh1zCpr@d7X7raC3tq?u8B5;bG#(_`Qc+qJU0R1Emof-5ks&zQA5~%F}idY+$}|
zCZ@9F@`J;!^p$|MkH-Cs2&os-<G;?oBiICxOypcXKBy;;_>}gRDDZeH_aCw;LnzB<
z`mJFrWuUjL-Jt{1B-mz_LOYp}D*S>~s>;EPzH0`XpI?lV9IVM$HZ32n(OuHhR-7vC
zooT~MYUCCBbh#l(T?rwrlfD>L@_F?7ddEbu6U@>YJgk0IF3<0fu0cYpD^W2p-P#HM
z3Qxw(zvF9NUMp+<{T6^|+?1bcD-;+Yse_?y4+4EOhw0(Wj$^U97`FuPK?tHdu@{y*
z)7))YZ2Oxy@O4*EA{S8@Z8lwKw`@710C&H3%|VNz3`?@LzUPEZbxu$z;3&#>hJ@8v
zq>PM~Y-><EVy8_j0+y<C>hwuwX1H?FE+;Wtz~`L>B+Yl~)?<1g^?EYIjZ@y$M-KQ~
zw|ix^Ydjj3rN{%+#i{Urssd{&)=mMeTvq8L;u!mBue+LxnSQ^H=rH5&rW!3R@Tx%H
zDNmQlHM<t+-n&mUqXUSSKGp3{jKB?uAI2VSNKr?E)yAvgeu6##<9c{8smA91*>T~z
zJ^~DerUiPDg<zTw-IvvUfp~^TnOo@xz$k<aedrU_I#P*>WIu7bV0+l0TT*fC_p`Ji
zdf;l`gzr5TOoCiy)pO*4+G?l<!K?m?@-j7xVQ6i(epvtR_~U!pCf)F@C~kI=3?
z%1O0oggO;*@UjF=@ztle!pxD+_PLmz2V1mDWmvIG5cU$rwj-)v4IU_Sx%r0Wn|)9C
z%XwN3mJq3Lj*l{d8&KZ6e<0`%3oNrw&$<=CpIM*vAKj*eJK%P(CT6>E=Qa+##G<!I
zd?CXx%R|NnYR*CxUAh{SmMN#E%Us<BuuT&K$(u_tIl&@Q850cr6d)R9Be#r*Dy&^C
zK@JwMXX{x(1X0rz05*1>$C?vw<4^ws%v{}X8onp>e!Z0|Mt*s$-r`;+sF+<QRq&q8
z$9~GYqrZ*9i3q2SeltaWjF%{SFMq#8wH$zAsuVzn=K;vw?uV_hfLM-&oVT41W3SCr
zy-4CGOvS{+qheTKvvupgDDQt9V2-$F1kTQgY7vE>cE3QrdSU7&?1bi|o7AJ+WkhqP
z7ITn2&x1fmn|1ZI*PHFE;?V+0+irP630tn<>TcED_o6zh1I%=sS5V#1MgwAC4B{Ux
zKXB6uK0146FwV80B4|<rhy$aC56o&}#%n>81bsE^JNrUSs1L%M%tUV{7f>*?&V@cT
z*k&PBHUh0s_aHdjgrR-Py=d=MAKq}|wOWUb!weqGxeJAm>$YU6nAy7UtAhqSLs$Z?
zd~fsw5!%JhO|G7`nNce@IcBBazFlEax)kdhnuK-B*y>8a%1Dn4vR1hdj-B>d=Ocl`
zL6km&Vb>kyYj;O#gzNr5Ydi2u&&4+)y_VS(GE{L&F;KTj0)S2n-T{JiTn1OZ_>&$Z
zo7hdY4%CsZ8rMkxEM_khur3QA9r;IGr)zvk)!p-;VqI#(W0u4(!Aio>%4#}sysoX&
z=%nWXjR%pI+n`HXPom>19z2m|(|St@dd~ES@8uKDpZ7BEo_+Nj2o!ij^k6XCGhPi|
z&KF|LOlNj)H1$2J&=Sfodv#C3{T9g5-4djiOG&L;g2Bnlb?5-d3~rg0eG9D;Fw?DE
zFISl|N>7z59+R%$^R{}6&?3}Wvb1th>*3?IMfaVj<X^s1a33{SM%L)3)Z+{HJNhSD
zu_>;kuEo|HD59c-vg1HvQd1`WN=&2Ye$*7b)$kGI$aCRgp@P^m#nA^2GBB}nih!Op
zWU#YFuppjo#QxRP)6PI8DXLgitxpzhjc3ZaTwLhvROqr^<_iupHc$}_+<wzL8>4?0
zuLdXbq2zW}67A=e>z%Xhd}L&@ZAV`|ZbY^^5+fS%I8)(Rw6q#>b<r1((hE_94skxF
zmAVpy6paj1kExysRcmkSfz*=X%xHX@&ykxcYUn#ln1IQsNtSk$QQ(|iSi1!@(zSnl
zwCt4!DfpDM`c7`9Lk1;e<YMJ$pt0X-c)iIu$4`b<hr@Y%g-)Q#-E{o|eYOVmj(W0!
zKeDu@!I0SG`mlRb<(pb5{L(Rza<Q=*6D?kOXbtuHfbl)%a=xUxL#+^$4^(OLy(mAf
z|8kKU<@aBkbEdlcO$o@UsKG92_u7|PCe^zLjhcl8C7}3>``{*t(7aW@MjD|mL=IEv
zPrC~Dpd0SfMBl}Mwqd%W!crcx@0QFp#BQ062)M5CciJ{^0b9T_8;8cWp(7lwN!jtz
zqP&iqvWd{7$g456&VRb<u=n)5?!9r4ac=E=;X_dn+w&BZaax4$q*4BIN`lqtaW(jQ
zXyyWD25F|Ye^+T~rP)<+wu~*JPl8yO4!6PnRvoiIb(f7I%8j49TX)L;XoNB1(j4tW
z0zPd;<qAS0n;hPsmtLSCx`pJaqo+;0*{TzlQ1&8*@--jTz1^PF-i1Pnj;{1<76m#i
z4wI@CKOX)=H~!EFZV3@FDc;ffuPrrPH|?5obJB!@UvY$#-Sx_IUyPTWz-WvTR#JOS
zr|+x;4h%!u`TW)_X=kZGMx#)ITI1jU)-=p)Gb<~rZ#Bc&xo<(QX}1XttK*}s4mnI1
zAZzPMOT^t(lFc9sdu}(Wa_ls%#`^|(GH%#?J_*&I|7d=GfyS*M=(7ZAD^uIpZ&c!6
z4Pv1Q;GW|h^zo^B_bzHuk|;Yp^UA%>x^^AsdB7iwR9&Zo6_CKr9JSIc47R4O=Wf@2
z1QXZuI;ratU00W#yX+5n4s4j5R=|NTox@~Eox@B}dWW4is2?W86=HEGG<=4a&pWl}
z4rt$IaPHVxD21k|zpcIf`eTKXs9OHdManoEEA&iK(c}BSoAibv+6A~0Ahgk;=_F$@
zDuICHO7~w4_jIu`-F5J?_*}M6D{%C>wX1!4VeZ@~08i{xwG<)F?<7NC<xvcU3>LV*
z5wBC;kA#HY5Z;+f+@GJ73h5#}CCjq32+pQb<5q$=gp8<f#!AL=8%zdUAZ>&BN}gM3
z@MrBph%%VlTI4RhegrF~-!9<SqdC#U-G-5;R$<b2r^{8m-U*?%_r^3SZ9J1l6*SzD
z!M8UOVf5^jC?M33+1yL9e1o&}kV<g^5(ksno&?FtyG}4gWcoOK;bmubzwiev<NTr2
z8A-|ObrMo%(h8!*>$ifHxDZ60m!_It8$%BTQJ$-p958Di;QgIS!Bm{eV;)R}pO>T|
z)R*Ktg@Q`lB%X1Oi!dduEox8V@g%#hcr!~xDiw47BK8PRpn{YJD*knWdb5(0e4YL0
zXwQ8{!sOa>=9X%Xr(9q5s6X`Zl@7?z>g_}i?_V3&fglRg2OmD*(p=+5Le6Z?mC&)%
z37<zfuV=K)9*;HC-Y8vX-wX*8IDx#RAu83nbH^&w|M$G%`gy(=EO;<)g1f$)2hm0M
z$az?c#Un?eQ;RwtTqS}_OyRHCr-CPv`tzFeyoSy0RWK|j2$|=t?DC!fn{B0b-SB}E
z*KH4ZMdv=09zTx6&0-_z<Ry)ZwTO|j&R;h01=d_1&)-+%UJ}p~Kh>RHhxGGpk16t=
zUX|4anc)*n&CQEeUdXr(yeo1YEO_CBjZv+X!o=WBNX;a74}xfS8Z~_=r`MKJJ_u`}
zMO{@*sXQ{K6Dy<ise$pQnh7!Yj{T6M^tsEa<ZR)2m4#1LqYrB?D7cUC4yd6OmPU7+
z6iu$ax_uD3i%U^=_xF>sk#-(lRjquOh65LgJl4h?o^L;|hWBq?Thv{%F8#cXXi|(J
zT$BKBp^7G}xlfR7O4JQ_e7XK!bxyIACmB_4qQ9vzT{-@KThT13?AG}|EysbNi4*4a
z>lr#>eR5%i0j>%Z&%<+)f7_M6tcju1K~1kDZEZrRA*ey+S#UwuUuNe3yMR0#UldrH
zrN`p;-1i@Y^hd|_e1NJ)n0|BDMUl^v#KZ?cg_ggl{^tQC4v-K(No6hL=47h8U;OJ|
zr2o>JuL=Y_WRRJdS`mu(Pp6`uh$v~?lmBO)Unl(c!>e0>zGe6J#4|8IYht!nIr$&L
zU+I84fML(`b7DJmK{BZc@B9ycOY~3m{kvt?0Ax6dbjWTMJj@!ZVt?oP*HQlSU<-H+
zt=E;8f`@?ORw6NP)sO$p+uwtI-IG~Ai;9Th+D-C9SXsl^?O-RqyIKc=g19(=oZE|I
z{$bCWgVmdMwf~pFf5zk#c~So)LkZ~sNi1u45!QTteE$|${qpyj;N%6k5V~%!t;}@j
zs-R#GG;S)nm+c3v=mQf>)462!0wjDP7cunt>7hR7Z|VO_ggTc2Q#9Xj1YD|<S`lC6
z+zd~fll_5MPBA>4l;G}{Jsfl*tLVH-=Q)s|&i5w^vi<3xCgs`BZ1<%NpZ;9Ibo>2y
zIU@S{z}P0I`k8-m@(q)3SXm>iS((}N?5vbSa+Xh3#U_uq55Bti{T^cBfO4N>lpVq*
zKArPn(;s#@qWdAr^mggrF4+Im)%N)pT~OWLf!BRXEX(LS`7n7etex*0KK?D1P*aeh
zYT0!Zq@6wLj*qHIjLB?xA@uvgILN@o#u{<)+?@=Spr@1l0{XvRj~nZ~bo&PjmLUSX
zd73@J$Ycil0RjD&*W-dUKKkGMevh6lKq467rrc%FK_l1DocBd<b3@^ef5em;;GPC#
z``EH7w-xZ2q#4N{O8L)=@(;lV&|$!vby133($hb_bS^LL^TZ8?YdqiAkpn@OfY-r*
z521ll3R8leFwvjvc`U@_{sZxe^ppbfgVflm%7oplXulkw>c-1*8});Co;B(?CpX}A
zXO@H7dfj6CH~h>OrH;1PoMn`ax~BOL_y3xhm^rWm$@n4DrKV&`x)y3A#=}~IiOuQ)
z+_x|MKPvL)I7iB!WcX!-DMsQPdF^2qCJC*jb8h;+NAwN68Seahcm8G+P$M9kr;XIb
zhkVSbYIpmZ&luk%fb-LS63h8MG0wkK*$CrwpZhV);&wtSyS+Fhk8Pp0@4tK0*Ont0
z0FMV)d{?bIMR-Xi5mJ!`n8>LC!-9b*!d>8-{TsIawIp+z!0yR7@=53yBhbhVd24R$
z%Q}Jl_r<|)f54<jkBEpE^b_xlB40?BplP37aq6M_F8FlgoV&W;U3|b;H~`w+emB@k
zCi7ESv&%J!c-ifbsq$0$Z({z%)wc|TE&%JO$4jmL<p{&aV|jB$=AntLDB0$=yoew5
zf&#rpA5dRU9(np_FRcfy>5`dRd7(e*Wye5gK{c$8^s3&{IRN}_-O&HJ;3wOs{|B3A
Bp7H<y

literal 0
HcmV?d00001

diff --git a/docs/source/index.rst b/docs/source/index.rst
index a7ea2ff3ac..6aa47d157b 100644
--- a/docs/source/index.rst
+++ b/docs/source/index.rst
@@ -18,6 +18,8 @@ Welcome to FlexFlow's documentation!
    :caption: FlexFlow Serve
    
    serve_overview
+   serve_usecases
+   serve_api
 
 .. toctree::
    :caption: FlexFlow Train
diff --git a/docs/source/prompt_template.rst b/docs/source/prompt_template.rst
new file mode 100644
index 0000000000..4e0f1beab5
--- /dev/null
+++ b/docs/source/prompt_template.rst
@@ -0,0 +1,55 @@
+:tocdepth: 1
+****************
+Prompt Template
+****************
+
+Prompt templates guide the model's response generation. This use case demonstrates setting up FlexFlow Serve to integrate with Langchain and using prompt templates to handle dynamic prompt templates.
+
+Requirements
+============
+
+- FlexFlow Serve setup with appropriate configurations.
+- Langchain integration with templates for prompt management.
+
+Implementation
+==============
+
+1. FlexFlow Initialization
+   Initialize and configure FlexFlow Serve.
+
+2. LLM Setup
+   Compile and start the server for text generation.
+
+3. Prompt Template Setup
+   Setup a prompt template for guiding model's responses.
+
+4. Response Generation
+   Use the LLM with the prompt template to generate a response.
+
+5. Shutdown
+   Stop the FlexFlow server after generating the response.
+
+Example
+=======
+
+Complete code example can be found here: 
+
+1. `Prompt Template Example with incremental decoding <https://github.com/flexflow/FlexFlow/blob/chatbot-2/inference/python/usecases/prompt_template_incr.py>`__
+
+2. `Prompt Template Example with speculative inference <https://github.com/flexflow/FlexFlow/blob/chatbot-2/inference/python/usecases/prompt_template_specinfer.py>`__
+
+
+Example Implementation:
+
+   .. code-block:: python
+
+      import flexflow.serve as ff
+      from langchain.prompts import PromptTemplate
+
+      ff_llm = FlexFlowLLM(...)
+      ff_llm.compile_and_start(...)
+
+      template = "Question: {question}\nAnswer:"
+      prompt = PromptTemplate(template=template, input_variables=["question"])
+
+      response = ff_llm.generate("Who was the US president in 1997?")
diff --git a/docs/source/rag.rst b/docs/source/rag.rst
new file mode 100644
index 0000000000..4b869c2352
--- /dev/null
+++ b/docs/source/rag.rst
@@ -0,0 +1,90 @@
+:tocdepth: 1
+********
+RAG Q&A
+********
+
+Retrieval Augmented Generation (RAG) combines language models with external knowledge. This use case integrates RAG with FlexFlow Serve for Q&A with documents.
+
+Requirements
+============
+
+- FlexFlow Serve setup.
+- Retriever setup for RAG.
+
+Implementation
+==============
+
+1. FlexFlow Initialization
+   Initialize and configure FlexFlow Serve.
+
+2. Data Retrieval Setup
+   Setup a retriever for sourcing information relevant to user queries.
+
+3. RAG Integration
+   Integrate the retriever with FlexFlow Serve.
+
+4. Response Generation
+   Use the LLM with RAG to generate responses based on model's knowledge and retrieved information.
+
+5. Shutdown
+   The FlexFlow server automatically shuts down after generating the response.
+
+Example
+=======
+
+A complete code example for a web-document Q&A using FlexFlow can be found here: 
+
+1. `Rag Q&A Example with incremental decoding <https://github.com/flexflow/FlexFlow/blob/chatbot-2/inference/python/usecases/rag_incr.py>`__
+
+2. `Rag Q&A Example with speculative inference <https://github.com/flexflow/FlexFlow/blob/chatbot-2/inference/python/usecases/rag_specinfer.py>`__
+
+
+Example Implementation:
+
+   .. code-block:: python
+
+      # imports
+
+      # compile and start server
+      ff_llm = FlexFlowLLM(...)
+      gen_config = ff.GenerationConfig(...)
+      ff_llm.compile_and_start(...)
+      ff_llm_wrapper = FF_LLM_wrapper(flexflow_llm=ff_llm)
+      
+      
+      # Load web page content
+      loader = WebBaseLoader("https://example.com/data")
+      data = loader.load()
+
+      # Split text
+      text_splitter = RecursiveCharacterTextSplitter(...)
+      all_splits = text_splitter.split_documents(data)
+
+      # Initialize embeddings
+      embeddings = OpenAIEmbeddings(...) 
+      
+      # Create VectorStore
+      vectorstore = Chroma.from_documents(all_splits, embeddings)
+      
+      # Use VectorStore as a retriever
+      retriever = vectorstore.as_retriever()
+
+      # Apply similarity search 
+      question = "Example Question"
+      docs = vectorstore.similarity_search(question)
+      max_chars_per_doc = 100
+      docs_text = ''.join([docs[i].page_content[:max_chars_per_doc] for i in range(len(docs))])
+         
+      # Using a Prompt Template
+      prompt_rag = PromptTemplate.from_template(
+         "Summarize the main themes in these retrieved docs: {docs_text}"
+      )
+      
+      # Build Chain
+      llm_chain_rag = LLMChain(llm=ff_llm_wrapper, prompt=prompt_rag)
+
+      # Run
+      rag_result = llm_chain_rag(docs_text)
+
+      # Stop the server
+      ff_llm.stop_server()
\ No newline at end of file
diff --git a/docs/source/serve_api.rst b/docs/source/serve_api.rst
new file mode 100644
index 0000000000..6a607cbf0c
--- /dev/null
+++ b/docs/source/serve_api.rst
@@ -0,0 +1,7 @@
+**************************
+FlexFlow Serve Python API
+**************************
+
+.. toctree::
+   serve_fastapi
+   serve_gradioapi
\ No newline at end of file
diff --git a/docs/source/serve_fastapi.rst b/docs/source/serve_fastapi.rst
new file mode 100644
index 0000000000..0aa6634670
--- /dev/null
+++ b/docs/source/serve_fastapi.rst
@@ -0,0 +1,106 @@
+:tocdepth: 1
+***********************
+FlexFlow Serve FastAPI
+***********************
+
+Introduction
+============
+
+The Python API for FlexFlow Serve enables users to initialize, manage and interact with large language models (LLMs) via FastAPI or Gradio.
+
+Requirements
+------------
+
+- FlexFlow Serve setup with necessary configurations.
+- FastAPI and Uvicorn for running the API server.
+
+API Configuration
+=================
+
+Users can configure the API using FastAPI to handle requests and manage the model.
+
+1. FastAPI Application Initialization
+   Initialize the FastAPI application to create API endpoints.
+
+2. Request Model Definition
+   Define the model for API requests using Pydantic.
+
+3. Global Variable for LLM Model
+   Declare a global variable to store the LLM model.
+
+Example
+-------
+
+.. code-block:: python
+
+   from fastapi import FastAPI
+   from pydantic import BaseModel
+   import flexflow.serve as ff
+
+   app = FastAPI()
+
+   class PromptRequest(BaseModel):
+       prompt: str
+
+   llm = None
+
+Endpoint Creation
+=================
+
+Create API endpoints for LLM interactions to handle generation requests.
+
+1. Initialize Model on Startup
+   Use the FastAPI event handler to initialize and compile the LLM model when the API server starts.
+
+2. Generate Response Endpoint
+   Create a POST endpoint to generate responses based on the user's prompt.
+
+Example
+-------
+
+.. code-block:: python
+
+   @app.on_event("startup")
+   async def startup_event():
+      global llm
+      # Initialize and compile the LLM model
+      llm.compile(
+         generation_config,
+         # ... other params as needed
+      )
+      llm.start_server()
+
+   @app.post("/generate/")
+   async def generate(prompt_request: PromptRequest):
+      # ... exception handling
+      full_output = llm.generate([prompt_request.prompt])[0].output_text.decode('utf-8')
+      # ... split prompt and response text for returning results
+      return {"prompt": prompt_request.prompt, "response": full_output}
+
+Running and Testing
+===================
+
+Instructions for running and testing the FastAPI server.
+
+1. Run the FastAPI Server
+   Use Uvicorn to run the FastAPI server with specified host and port.
+
+2. Testing the API
+   Make requests to the API endpoints and verify the responses.
+
+Example
+-------
+
+.. code-block:: bash
+
+   # Running within the inference/python folder:
+   uvicorn entrypoint.fastapi_incr:app --reload --port 3000
+
+Full API Entrypoint Code 
+=========================
+
+A complete code example for a web-document Q&A using FlexFlow can be found here: 
+
+1. `FastAPI Example with incremental decoding <https://github.com/flexflow/FlexFlow/blob/chatbot-2/inference/python/entrypoint/fastapi_incr.py>`__
+
+2. `FastAPI Example with speculative inference <https://github.com/flexflow/FlexFlow/blob/chatbot-2/inference/python//entrypoint/fastapi_specinfer.py>`__
diff --git a/docs/source/serve_gradioapi.rst b/docs/source/serve_gradioapi.rst
new file mode 100644
index 0000000000..ed19e05347
--- /dev/null
+++ b/docs/source/serve_gradioapi.rst
@@ -0,0 +1,30 @@
+:tocdepth: 1
+*************************
+FlexFlow Serve Gradio API
+*************************
+
+Introduction
+============
+
+Users can also set up the API endpoints with a Gradio Chatbot Interface.
+
+Requirements
+------------
+
+- FlexFlow Serve setup with necessary configurations.
+- Running the gradio chatbot interface.
+
+Example
+========
+
+In a running gradio chatbot interface, hit the "Use via API" button on the bottom left.
+
+   .. image:: /imgs/gradio_interface.png
+      :alt: Gradio Chatbot Interface
+      :align: center
+
+Users can easily access an API endpoint for sending prompts to the model.
+
+   .. image:: /imgs/gradio_api.png
+      :alt: Gradio API
+      :align: center
\ No newline at end of file
diff --git a/docs/source/serve_usecases.rst b/docs/source/serve_usecases.rst
new file mode 100644
index 0000000000..4aa3fd2807
--- /dev/null
+++ b/docs/source/serve_usecases.rst
@@ -0,0 +1,8 @@
+*******************
+Serving Usecases
+*******************
+
+.. toctree::
+   chatbot
+   prompt_template
+   rag
\ No newline at end of file
diff --git a/inference/.gitignore b/inference/.gitignore
index 8ab99cb1eb..1da34a668b 100644
--- a/inference/.gitignore
+++ b/inference/.gitignore
@@ -3,3 +3,4 @@ weights
 tokenizers
 prompt
 output
+.env
\ No newline at end of file
diff --git a/inference/python/entrypoint/fastapi_incr.py b/inference/python/entrypoint/fastapi_incr.py
new file mode 100644
index 0000000000..34f61739fb
--- /dev/null
+++ b/inference/python/entrypoint/fastapi_incr.py
@@ -0,0 +1,162 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+
+"""
+Running Instructions:
+- To run this FastAPI application, make sure you have FastAPI and Uvicorn installed.
+- Save this script as 'fastapi_incr.py'.
+- Run the application using the command: `uvicorn fastapi_incr:app --reload --port PORT_NUMBER`
+- The server will start on `http://localhost:PORT_NUMBER`. Use this base URL to make API requests.
+- Go to `http://localhost:PORT_NUMBER/docs` for API documentation.
+"""
+
+
+from fastapi import FastAPI, HTTPException
+from pydantic import BaseModel
+import flexflow.serve as ff
+import uvicorn
+import json, os, argparse
+from types import SimpleNamespace
+
+# Initialize FastAPI application
+app = FastAPI()
+
+# Define the request model
+class PromptRequest(BaseModel):
+    prompt: str
+
+# Global variable to store the LLM model
+llm = None
+
+
+def get_configs():
+    
+    # Fetch configuration file path from environment variable
+    config_file = os.getenv("CONFIG_FILE", "")
+
+    # Load configs from JSON file (if specified)
+    if config_file:
+        if not os.path.isfile(config_file):
+            raise FileNotFoundError(f"Config file {config_file} not found.")
+        try:
+            with open(config_file) as f:
+                return json.load(f)
+        except json.JSONDecodeError as e:
+            print("JSON format error:")
+            print(e)
+    else:
+        # Define sample configs
+        ff_init_configs = {
+            # required parameters
+            "num_gpus": 2,
+            "memory_per_gpu": 14000,
+            "zero_copy_memory_per_node": 40000,
+            # optional parameters
+            "num_cpus": 4,
+            "legion_utility_processors": 4,
+            "data_parallelism_degree": 1,
+            "tensor_parallelism_degree": 1,
+            "pipeline_parallelism_degree": 2,
+            "offload": False,
+            "offload_reserve_space_size": 1024**2,
+            "use_4bit_quantization": False,
+            "use_8bit_quantization": False,
+            "profiling": False,
+            "inference_debugging": False,
+            "fusion": True,
+        }
+        llm_configs = {
+            # required parameters
+            "llm_model": "tiiuae/falcon-7b",
+            # optional parameters
+            "cache_path": "",
+            "refresh_cache": False,
+            "full_precision": False,
+            "prompt": "",
+            "output_file": "",
+        }
+        # Merge dictionaries
+        ff_init_configs.update(llm_configs)
+        return ff_init_configs
+    
+
+# Initialize model on startup
+@app.on_event("startup")
+async def startup_event():
+    global llm
+
+    # Initialize your LLM model configuration here
+    configs_dict = get_configs()
+    configs = SimpleNamespace(**configs_dict)
+    ff.init(configs_dict)
+
+    ff_data_type = ff.DataType.DT_FLOAT if configs.full_precision else ff.DataType.DT_HALF
+    llm = ff.LLM(
+        configs.llm_model,
+        data_type=ff_data_type,
+        cache_path=configs.cache_path,
+        refresh_cache=configs.refresh_cache,
+        output_file=configs.output_file,
+    )
+
+    generation_config = ff.GenerationConfig(
+        do_sample=False, temperature=0.9, topp=0.8, topk=1
+    )
+    llm.compile(
+        generation_config,
+        max_requests_per_batch=1,
+        max_seq_length=256,
+        max_tokens_per_batch=64,
+    )
+    llm.start_server()
+
+# API endpoint to generate response
+@app.post("/generate/")
+async def generate(prompt_request: PromptRequest):
+    if llm is None:
+        raise HTTPException(status_code=503, detail="LLM model is not initialized.")
+    
+    # Call the model to generate a response
+    full_output = llm.generate([prompt_request.prompt])[0].output_text.decode('utf-8')
+    
+    # Separate the prompt and response
+    split_output = full_output.split('\n', 1)
+    if len(split_output) > 1:
+        response_text = split_output[1] 
+    else:
+        response_text = "" 
+        
+    # Return the prompt and the response in JSON format
+    return {
+        "prompt": prompt_request.prompt,
+        "response": response_text
+    }
+    
+# Shutdown event to stop the model server
+@app.on_event("shutdown")
+async def shutdown_event():
+    global llm
+    if llm is not None:
+        llm.stop_server()
+
+# Main function to run Uvicorn server
+if __name__ == "__main__":
+    uvicorn.run(app, host="0.0.0.0", port=8000)
+
+# Running within the entrypoint folder:
+# uvicorn fastapi_incr:app --reload --port
+
+# Running within the python folder:
+# uvicorn entrypoint.fastapi_incr:app --reload --port 3000
diff --git a/inference/python/entrypoint/fastapi_specinfer.py b/inference/python/entrypoint/fastapi_specinfer.py
new file mode 100644
index 0000000000..416aee6dc5
--- /dev/null
+++ b/inference/python/entrypoint/fastapi_specinfer.py
@@ -0,0 +1,202 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+
+"""
+Running Instructions:
+- To run this FastAPI application, make sure you have FastAPI and Uvicorn installed.
+- Save this script as 'fastapi_specinfer.py'.
+- Run the application using the command: `uvicorn fastapi_specinfer:app --reload --port PORT_NUMBER`
+- The server will start on `http://localhost:PORT_NUMBER`. Use this base URL to make API requests.
+- Go to `http://localhost:PORT_NUMBER/docs` for API documentation.
+"""
+
+
+from fastapi import FastAPI, HTTPException
+from pydantic import BaseModel
+import flexflow.serve as ff
+import uvicorn
+import json, os, argparse
+from types import SimpleNamespace
+
+# Initialize FastAPI application
+app = FastAPI()
+
+# Define the request model
+class PromptRequest(BaseModel):
+    prompt: str
+
+# Global variable to store the LLM model
+llm = None
+
+def get_configs():
+    # Fetch configuration file path from environment variable
+    config_file = os.getenv("CONFIG_FILE", "")
+
+    # Load configs from JSON file (if specified)
+    if config_file:
+        if not os.path.isfile(config_file):
+            raise FileNotFoundError(f"Config file {config_file} not found.")
+        try:
+            with open(config_file) as f:
+                return json.load(f)
+        except json.JSONDecodeError as e:
+            print("JSON format error:")
+            print(e)
+    else:
+        # Define sample configs
+        ff_init_configs = {
+            # required parameters
+            "num_gpus": 2,
+            "memory_per_gpu": 14000,
+            "zero_copy_memory_per_node": 40000,
+            # optional parameters
+            "num_cpus": 4,
+            "legion_utility_processors": 4,
+            "data_parallelism_degree": 1,
+            "tensor_parallelism_degree": 1,
+            "pipeline_parallelism_degree": 2,
+            "offload": False,
+            "offload_reserve_space_size": 1024**2,
+            "use_4bit_quantization": False,
+            "use_8bit_quantization": False,
+            "profiling": False,
+            "inference_debugging": False,
+            "fusion": True,
+        }
+        llm_configs = {
+            # required llm arguments
+            "llm_model": "meta-llama/Llama-2-7b-hf",
+            # optional llm parameters
+            "cache_path": "",
+            "refresh_cache": False,
+            "full_precision": False,
+            "ssms": [
+                {
+                    # required ssm parameter
+                    "ssm_model": "JackFram/llama-160m",
+                    # optional ssm parameters
+                    "cache_path": "",
+                    "refresh_cache": False,
+                    "full_precision": False,
+                }
+            ],
+            # "prompt": "",
+            "output_file": "",
+        }
+        # Merge dictionaries
+        ff_init_configs.update(llm_configs)
+        return ff_init_configs
+
+# Initialize model on startup
+@app.on_event("startup")
+async def startup_event():
+    global llm
+
+    # Initialize your LLM model configuration here
+    configs_dict = get_configs()
+    configs = SimpleNamespace(**configs_dict)
+    ff.init(configs_dict)
+
+    # Create the FlexFlow LLM
+    ff_data_type = (
+        ff.DataType.DT_FLOAT if configs.full_precision else ff.DataType.DT_HALF
+    )
+    llm = ff.LLM(
+        configs.llm_model,
+        data_type=ff_data_type,
+        cache_path=configs.cache_path,
+        refresh_cache=configs.refresh_cache,
+        output_file=configs.output_file,
+    )
+
+    # Create the SSMs
+    ssms = []
+    for ssm_config in configs.ssms:
+        ssm_config = SimpleNamespace(**ssm_config)
+        ff_data_type = (
+            ff.DataType.DT_FLOAT if ssm_config.full_precision else ff.DataType.DT_HALF
+        )
+        ssm = ff.SSM(
+            ssm_config.ssm_model,
+            data_type=ff_data_type,
+            cache_path=ssm_config.cache_path,
+            refresh_cache=ssm_config.refresh_cache,
+            output_file=configs.output_file,
+        )
+        ssms.append(ssm)
+
+    # Create the sampling configs
+    generation_config = ff.GenerationConfig(
+        do_sample=False, temperature=0.9, topp=0.8, topk=1
+    )
+
+    # Compile the SSMs for inference and load the weights into memory
+    for ssm in ssms:
+        ssm.compile(
+            generation_config,
+            max_requests_per_batch=1,
+            max_seq_length=256,
+            max_tokens_per_batch=64,
+        )
+
+    # Compile the LLM for inference and load the weights into memory
+    llm.compile(
+        generation_config,
+        max_requests_per_batch=1,
+        max_seq_length=256,
+        max_tokens_per_batch=64,
+        ssms=ssms,
+    )
+    
+    llm.start_server()
+
+# API endpoint to generate response
+@app.post("/generate/")
+async def generate(prompt_request: PromptRequest):
+    if llm is None:
+        raise HTTPException(status_code=503, detail="LLM model is not initialized.")
+    
+    # Call the model to generate a response
+    full_output = llm.generate([prompt_request.prompt])[0].output_text.decode('utf-8')
+
+    # Separate the prompt and response
+    split_output = full_output.split('\n', 1)
+    if len(split_output) > 1:
+        response_text = split_output[1] 
+    else:
+        response_text = "" 
+        
+    # Return the prompt and the response in JSON format
+    return {
+        "prompt": prompt_request.prompt,
+        "response": response_text
+    }
+    
+# Shutdown event to stop the model server
+@app.on_event("shutdown")
+async def shutdown_event():
+    global llm
+    if llm is not None:
+        llm.stop_server()
+
+# Main function to run Uvicorn server
+if __name__ == "__main__":
+    uvicorn.run(app, host="0.0.0.0", port=8000)
+
+# Running within the entrypoint folder:
+# uvicorn fastapi_specinfer:app --reload --port
+
+# Running within the python folder:
+# uvicorn entrypoint.fastapi_specinfer:app --reload --port 3000
diff --git a/inference/python/incr_decoding.py b/inference/python/incr_decoding.py
index 6706cf3c29..f7707816c8 100644
--- a/inference/python/incr_decoding.py
+++ b/inference/python/incr_decoding.py
@@ -41,7 +41,7 @@ def get_configs():
         # Define sample configs
         ff_init_configs = {
             # required parameters
-            "num_gpus": 4,
+            "num_gpus": 2,
             "memory_per_gpu": 14000,
             "zero_copy_memory_per_node": 40000,
             # optional parameters
@@ -49,7 +49,7 @@ def get_configs():
             "legion_utility_processors": 4,
             "data_parallelism_degree": 1,
             "tensor_parallelism_degree": 1,
-            "pipeline_parallelism_degree": 4,
+            "pipeline_parallelism_degree": 2,
             "offload": False,
             "offload_reserve_space_size": 1024**2,
             "use_4bit_quantization": False,
@@ -64,7 +64,7 @@ def get_configs():
             # optional parameters
             "cache_path": "",
             "refresh_cache": False,
-            "full_precision": True,
+            "full_precision": False,
             "prompt": "",
             "output_file": "",
         }
diff --git a/inference/python/spec_infer.py b/inference/python/spec_infer.py
index 8b9a116dc5..fcb1b8f891 100644
--- a/inference/python/spec_infer.py
+++ b/inference/python/spec_infer.py
@@ -41,14 +41,14 @@ def get_configs():
         # Define sample configs
         ff_init_configs = {
             # required parameters
-            "num_gpus": 4,
+            "num_gpus": 2,
             "memory_per_gpu": 14000,
             "zero_copy_memory_per_node": 40000,
             # optional parameters
             "num_cpus": 4,
             "legion_utility_processors": 4,
             "data_parallelism_degree": 1,
-            "tensor_parallelism_degree": 2,
+            "tensor_parallelism_degree": 1,
             "pipeline_parallelism_degree": 2,
             "offload": False,
             "offload_reserve_space_size": 1024**2,
@@ -75,7 +75,7 @@ def get_configs():
                     "full_precision": False,
                 }
             ],
-            "prompt": "",
+            # "prompt": "",
             "output_file": "",
         }
         # Merge dictionaries
diff --git a/inference/python/usecases/gradio_incr.py b/inference/python/usecases/gradio_incr.py
new file mode 100644
index 0000000000..2735b665bb
--- /dev/null
+++ b/inference/python/usecases/gradio_incr.py
@@ -0,0 +1,162 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+"""
+Functionality:
+1. Configuration Handling:
+   - Parses command-line arguments to get a configuration file path.
+   - Loads configuration settings from a JSON file if provided, or uses default settings.
+
+2. FlexFlow Model Initialization:
+   - Initializes FlexFlow with the provided or default configurations.
+   - Sets up the LLM with the specified model and configurations.
+   - Compiles the model with generation settings and starts the FlexFlow server.
+
+3. Gradio Interface Setup:
+   - Defines a function to generate responses based on user input using FlexFlow.
+   - Sets up a Gradio Chat Interface to interact with the model in a conversational format.
+
+4. Main Execution:
+   - Calls the main function to initialize configurations, set up the FlexFlow LLM, and launch the Gradio interface.
+   - Stops the FlexFlow server after the Gradio interface is closed.
+
+Usage:
+1. Run the script with an optional configuration file argument for custom settings.
+2. Interact with the FlexFlow model through the Gradio web interface.
+3. Enter text inputs to receive generated responses from the model.
+4. The script will stop the FlexFlow server automatically upon closing the Gradio interface.
+"""
+
+import gradio as gr
+import flexflow.serve as ff
+import argparse, json, os
+from types import SimpleNamespace
+
+
+def get_configs():
+    parser = argparse.ArgumentParser()
+    parser.add_argument(
+        "-config-file",
+        help="The path to a JSON file with the configs. If omitted, a sample model and configs will be used instead.",
+        type=str,
+        default="",
+    )
+    args = parser.parse_args()
+
+    # Load configs from JSON file (if specified)
+    if len(args.config_file) > 0:
+        if not os.path.isfile(args.config_file):
+            raise FileNotFoundError(f"Config file {args.config_file} not found.")
+        try:
+            with open(args.config_file) as f:
+                return json.load(f)
+        except json.JSONDecodeError as e:
+            print("JSON format error:")
+            print(e)
+    else:
+        # Define sample configs
+        ff_init_configs = {
+            # required parameters
+            "num_gpus": 2,
+            "memory_per_gpu": 14000,
+            "zero_copy_memory_per_node": 40000,
+            # optional parameters
+            "num_cpus": 4,
+            "legion_utility_processors": 4,
+            "data_parallelism_degree": 1,
+            "tensor_parallelism_degree": 1,
+            "pipeline_parallelism_degree": 2,
+            "offload": False,
+            "offload_reserve_space_size": 1024**2,
+            "use_4bit_quantization": False,
+            "use_8bit_quantization": False,
+            "profiling": False,
+            "inference_debugging": False,
+            "fusion": True,
+        }
+        llm_configs = {
+            # required parameters
+            "llm_model": "tiiuae/falcon-7b",
+            # optional parameters
+            "cache_path": "",
+            "refresh_cache": False,
+            "full_precision": False,
+            "prompt": "",
+            "output_file": "",
+        }
+        # Merge dictionaries
+        ff_init_configs.update(llm_configs)
+        return ff_init_configs
+
+
+# def generate_response(user_input):
+#     result = llm.generate(user_input)
+#     return result.output_text.decode('utf-8')
+
+def generate_response(message, history):
+    user_input = message 
+    results = llm.generate(user_input)
+    if isinstance(results, list):
+        result_txt = results[0].output_text.decode('utf-8')
+    else:
+        result_txt = results.output_text.decode('utf-8')
+    return result_txt
+
+
+def main():
+    
+    global llm
+    
+    configs_dict = get_configs()
+    configs = SimpleNamespace(**configs_dict)
+
+    ff.init(configs_dict)
+
+    ff_data_type = (
+        ff.DataType.DT_FLOAT if configs.full_precision else ff.DataType.DT_HALF
+    )
+    llm = ff.LLM(
+        configs.llm_model,
+        data_type=ff_data_type,
+        cache_path=configs.cache_path,
+        refresh_cache=configs.refresh_cache,
+        output_file=configs.output_file,
+    )
+
+    generation_config = ff.GenerationConfig(
+        do_sample=False, temperature=0.9, topp=0.8, topk=1
+    )
+    llm.compile(
+        generation_config,
+        max_requests_per_batch=1,
+        max_seq_length=256,
+        max_tokens_per_batch=64,
+    )
+    
+    # # interface version 1
+    # iface = gr.Interface(
+    #     fn=generate_response, 
+    #     inputs="text", 
+    #     outputs="text"
+    # )
+    
+    # interface version 2
+    iface = gr.ChatInterface(fn=generate_response)
+    llm.start_server()
+    iface.launch()
+    llm.stop_server()
+
+if __name__ == "__main__":
+    print("flexflow inference example with gradio interface")
+    main()
\ No newline at end of file
diff --git a/inference/python/usecases/gradio_specinfer.py b/inference/python/usecases/gradio_specinfer.py
new file mode 100644
index 0000000000..08cde3f00b
--- /dev/null
+++ b/inference/python/usecases/gradio_specinfer.py
@@ -0,0 +1,205 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+"""
+Functionality:
+1. Configuration Handling:
+   - Parses command-line arguments to get a configuration file path.
+   - Loads configuration settings from a JSON file if provided, or uses default settings.
+
+2. FlexFlow Model Initialization:
+   - Initializes FlexFlow with the provided or default configurations.
+   - Sets up the LLM with the specified model and configurations.
+   - Compiles the model with generation settings and starts the FlexFlow server.
+
+3. Gradio Interface Setup:
+   - Defines a function to generate responses based on user input using FlexFlow.
+   - Sets up a Gradio Chat Interface to interact with the model in a conversational format.
+
+4. Main Execution:
+   - Calls the main function to initialize configurations, set up the FlexFlow LLM, and launch the Gradio interface.
+   - Stops the FlexFlow server after the Gradio interface is closed.
+
+Usage:
+1. Run the script with an optional configuration file argument for custom settings.
+2. Interact with the FlexFlow model through the Gradio web interface.
+3. Enter text inputs to receive generated responses from the model.
+4. The script will stop the FlexFlow server automatically upon closing the Gradio interface.
+"""
+
+"""
+TODO: fix current issue: model init is stuck at "prepare next batch init" and "prepare next batch verify"
+"""
+
+import gradio as gr
+import flexflow.serve as ff
+import argparse, json, os
+from types import SimpleNamespace
+
+def get_configs():
+    parser = argparse.ArgumentParser()
+    parser.add_argument(
+        "-config-file",
+        help="The path to a JSON file with the configs. If omitted, a sample model and configs will be used instead.",
+        type=str,
+        default="",
+    )
+    args = parser.parse_args()
+
+    # Load configs from JSON file (if specified)
+    if len(args.config_file) > 0:
+        if not os.path.isfile(args.config_file):
+            raise FileNotFoundError(f"Config file {args.config_file} not found.")
+        try:
+            with open(args.config_file) as f:
+                return json.load(f)
+        except json.JSONDecodeError as e:
+            print("JSON format error:")
+            print(e)
+    else:
+        # Define sample configs
+        ff_init_configs = {
+            # required parameters
+            "num_gpus": 2,
+            "memory_per_gpu": 14000,
+            "zero_copy_memory_per_node": 40000,
+            # optional parameters
+            "num_cpus": 4,
+            "legion_utility_processors": 4,
+            "data_parallelism_degree": 1,
+            "tensor_parallelism_degree": 1,
+            "pipeline_parallelism_degree": 2,
+            "offload": False,
+            "offload_reserve_space_size": 1024**2,
+            "use_4bit_quantization": False,
+            "use_8bit_quantization": False,
+            "profiling": False,
+            "inference_debugging": False,
+            "fusion": True,
+        }
+        llm_configs = {
+            # required llm arguments
+            "llm_model": "meta-llama/Llama-2-7b-hf",
+            # optional llm parameters
+            "cache_path": "",
+            "refresh_cache": False,
+            "full_precision": False,
+            "ssms": [
+                {
+                    # required ssm parameter
+                    "ssm_model": "JackFram/llama-160m",
+                    # optional ssm parameters
+                    "cache_path": "",
+                    "refresh_cache": False,
+                    "full_precision": False,
+                }
+            ],
+            # "prompt": "",
+            "output_file": "",
+        }
+        # Merge dictionaries
+        ff_init_configs.update(llm_configs)
+        return ff_init_configs
+
+
+# def generate_response(user_input):
+#     result = llm.generate(user_input)
+#     return result.output_text.decode('utf-8')
+
+def generate_response(message, history):
+    user_input = message 
+    results = llm.generate(user_input)
+    if isinstance(results, list):
+        result_txt = results[0].output_text.decode('utf-8')
+    else:
+        result_txt = results.output_text.decode('utf-8')
+    return result_txt
+
+def main():
+    
+    global llm
+    
+    configs_dict = get_configs()
+    configs = SimpleNamespace(**configs_dict)
+
+    # Initialize the FlexFlow runtime. ff.init() takes a dictionary or the path to a JSON file with the configs
+    ff.init(configs_dict)
+
+    # Create the FlexFlow LLM
+    ff_data_type = (
+        ff.DataType.DT_FLOAT if configs.full_precision else ff.DataType.DT_HALF
+    )
+    llm = ff.LLM(
+        configs.llm_model,
+        data_type=ff_data_type,
+        cache_path=configs.cache_path,
+        refresh_cache=configs.refresh_cache,
+        output_file=configs.output_file,
+    )
+
+    # Create the SSMs
+    ssms = []
+    for ssm_config in configs.ssms:
+        ssm_config = SimpleNamespace(**ssm_config)
+        ff_data_type = (
+            ff.DataType.DT_FLOAT if ssm_config.full_precision else ff.DataType.DT_HALF
+        )
+        ssm = ff.SSM(
+            ssm_config.ssm_model,
+            data_type=ff_data_type,
+            cache_path=ssm_config.cache_path,
+            refresh_cache=ssm_config.refresh_cache,
+            output_file=configs.output_file,
+        )
+        ssms.append(ssm)
+
+    # Create the sampling configs
+    generation_config = ff.GenerationConfig(
+        do_sample=False, temperature=0.9, topp=0.8, topk=1
+    )
+
+    # Compile the SSMs for inference and load the weights into memory
+    for ssm in ssms:
+        ssm.compile(
+            generation_config,
+            max_requests_per_batch=1,
+            max_seq_length=256,
+            max_tokens_per_batch=256,
+        )
+
+    # Compile the LLM for inference and load the weights into memory
+    llm.compile(
+        generation_config,
+        max_requests_per_batch=1,
+        max_seq_length=256,
+        max_tokens_per_batch=256,
+        ssms=ssms,
+    )
+    
+    # # interface version 1
+    # iface = gr.Interface(
+    #     fn=generate_response, 
+    #     inputs="text", 
+    #     outputs="text"
+    # )
+    
+    # interface version 2
+    iface = gr.ChatInterface(fn=generate_response)
+    llm.start_server()
+    iface.launch()
+    llm.stop_server()
+
+if __name__ == "__main__":
+    print("flexflow inference example with gradio interface")
+    main()
\ No newline at end of file
diff --git a/inference/python/usecases/prompt_template_incr.py b/inference/python/usecases/prompt_template_incr.py
new file mode 100644
index 0000000000..8bffe9ddad
--- /dev/null
+++ b/inference/python/usecases/prompt_template_incr.py
@@ -0,0 +1,187 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+
+"""
+This script implements the usecase of prompt template upon FlexFlow.
+
+Functionality:
+1. FlexFlowLLM Class:
+   - Initializes and configures FlexFlow.
+   - Loads configurations from a file or uses default settings.
+   - Compiles and starts the language model server for text generation.
+   - Stops the server when operations are complete.
+
+2. FF_LLM_wrapper Class:
+   - Serves as a wrapper for FlexFlow.
+   - Implements the necessary interface to interact with the LangChain library.
+
+3. Main:
+   - Initializes FlexFlow.
+   - Compiles and starts the server with specific generation configurations.
+   - Sets up a prompt template for generating responses to questions.
+   - Use LLMChain to run the model and generate response.
+   - Stops the FlexFlow server after generating the response.
+"""
+
+import flexflow.serve as ff
+import argparse, json, os
+from types import SimpleNamespace
+from langchain.llms.base import LLM
+from typing import Any, List, Mapping, Optional
+from langchain.chains import LLMChain
+from langchain.prompts import PromptTemplate
+
+class FlexFlowLLM:
+    def __init__(self, config_file=""):
+        self.configs = self.get_configs(config_file)
+        ff.init(self.configs)
+        self.llm = self.create_llm()
+
+    def get_configs(self, config_file):
+        # Load configurations from a file or use default settings
+        if config_file and os.path.isfile(config_file):
+            with open(config_file) as f:
+                return json.load(f)
+        else:
+            # Define sample configs
+            ff_init_configs = {
+                # required parameters
+                "num_gpus": 2,
+                "memory_per_gpu": 14000,
+                "zero_copy_memory_per_node": 40000,
+                # optional parameters
+                "num_cpus": 4,
+                "legion_utility_processors": 4,
+                "data_parallelism_degree": 1,
+                "tensor_parallelism_degree": 1,
+                "pipeline_parallelism_degree": 2,
+                "offload": False,
+                "offload_reserve_space_size": 1024**2,
+                "use_4bit_quantization": False,
+                "use_8bit_quantization": False,
+                "profiling": False,
+                "inference_debugging": False,
+                "fusion": True,
+            }
+            llm_configs = {
+                # required parameters
+                "llm_model": "tiiuae/falcon-7b",
+                # optional parameters
+                "cache_path": "",
+                "refresh_cache": False,
+                "full_precision": False,
+                "prompt": "",
+                "output_file": "",
+            }
+            # Merge dictionaries
+            ff_init_configs.update(llm_configs)
+            return ff_init_configs
+        
+    def create_llm(self):
+        configs = SimpleNamespace(**self.configs)
+        ff_data_type = ff.DataType.DT_FLOAT if configs.full_precision else ff.DataType.DT_HALF
+        llm = ff.LLM(
+            configs.llm_model,
+            data_type=ff_data_type,
+            cache_path=configs.cache_path,
+            refresh_cache=configs.refresh_cache,
+            output_file=configs.output_file,
+        )
+        return llm
+
+    def compile_and_start(self, generation_config, max_requests_per_batch, max_seq_length, max_tokens_per_batch):
+        self.llm.compile(generation_config, max_requests_per_batch, max_seq_length, max_tokens_per_batch)   
+        self.llm.start_server()
+
+    def generate(self, prompt):
+        results = self.llm.generate(prompt)
+        if isinstance(results, list):
+            result_txt = results[0].output_text.decode('utf-8')
+        else:
+            result_txt = results.output_text.decode('utf-8')
+        return result_txt
+    
+    def stop_server(self):
+        self.llm.stop_server()
+
+    def __enter__(self):
+        return self.llm.__enter__()
+
+    def __exit__(self, exc_type, exc_value, traceback):
+        return self.llm.__exit__(exc_type, exc_value, traceback)
+
+class FF_LLM_wrapper(LLM):
+    flexflow_llm: FlexFlowLLM
+
+    @property
+    def _llm_type(self) -> str:
+        return "custom"
+
+    def _call(
+        self,
+        prompt: str,
+        stop: Optional[List[str]] = None,
+        **kwargs: Any,
+    ) -> str:
+        if stop is not None:
+            raise ValueError("stop kwargs are not permitted.")
+        response = self.flexflow_llm.generate(prompt)
+        return response
+
+
+if __name__ == "__main__":
+    # initialization
+    ff_llm = FlexFlowLLM()
+
+    # compile and start server
+    gen_config = ff.GenerationConfig(do_sample=False, temperature=0.9, topp=0.8, topk=1)
+    ff_llm.compile_and_start(
+        gen_config, 
+        max_requests_per_batch=1, 
+        max_seq_length=256, 
+        max_tokens_per_batch=64
+    )
+
+    # the wrapper class serves as the 'Model' in LCEL 
+    ff_llm_wrapper = FF_LLM_wrapper(flexflow_llm=ff_llm)
+    
+    # USE CASE 1: Prompt Template
+    template = """Question: {question}
+                    Answer: Let's think step by step."""
+
+    # Build prompt template and langchain
+    prompt = PromptTemplate(template=template, input_variables=["question"])
+    llm_chain = LLMChain(prompt=prompt, llm=ff_llm_wrapper)
+
+    question = "Who was the US president in the year the first Pokemon game was released?"
+    print(llm_chain.run(question))
+    
+    # stop the server
+    ff_llm.stop_server()
+
diff --git a/inference/python/usecases/prompt_template_specinfer.py b/inference/python/usecases/prompt_template_specinfer.py
new file mode 100644
index 0000000000..dfc92e9ac2
--- /dev/null
+++ b/inference/python/usecases/prompt_template_specinfer.py
@@ -0,0 +1,236 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+
+"""
+This script implements the usecase of prompt template upon FlexFlow.
+
+Functionality:
+1. FlexFlowLLM Class:
+   - Initializes and configures FlexFlow.
+   - Loads configurations from a file or uses default settings.
+   - Compiles and starts the language model server for text generation.
+   - Stops the server when operations are complete.
+
+2. FF_LLM_wrapper Class:
+   - Serves as a wrapper for FlexFlow.
+   - Implements the necessary interface to interact with the LangChain library.
+
+3. Main:
+   - Initializes FlexFlow.
+   - Compiles and starts the server with specific generation configurations.
+   - Sets up a prompt template for generating responses to questions.
+   - Use LLMChain to run the model and generate response.
+   - Stops the FlexFlow server after generating the response.
+"""
+
+import flexflow.serve as ff
+import argparse, json, os
+from types import SimpleNamespace
+from langchain.llms.base import LLM
+from typing import Any, List, Mapping, Optional
+from langchain.chains import LLMChain
+from langchain.prompts import PromptTemplate
+
+
+class FlexFlowLLM:
+    def __init__(self, config_file=""):
+        self.configs = self.get_configs(config_file)
+        ff.init(self.configs)
+        self.llm = self.create_llm()
+        self.ssms = self.create_ssms()
+
+    def get_configs(self, config_file):
+        # Load configurations from a file or use default settings
+        if config_file and os.path.isfile(config_file):
+            with open(config_file) as f:
+                return json.load(f)
+        else:
+            # Define sample configs
+            ff_init_configs = {
+                # required parameters
+                "num_gpus": 2,
+                "memory_per_gpu": 14000,
+                "zero_copy_memory_per_node": 40000,
+                # optional parameters
+                "num_cpus": 4,
+                "legion_utility_processors": 4,
+                "data_parallelism_degree": 1,
+                "tensor_parallelism_degree": 1,
+                "pipeline_parallelism_degree": 2,
+                "offload": False,
+                "offload_reserve_space_size": 1024**2,
+                "use_4bit_quantization": False,
+                "use_8bit_quantization": False,
+                "profiling": False,
+                "inference_debugging": False,
+                "fusion": True,
+            }
+            llm_configs = {
+                # required llm arguments
+                "llm_model": "meta-llama/Llama-2-7b-hf",
+                # optional llm parameters
+                "cache_path": "",
+                "refresh_cache": False,
+                "full_precision": False,
+                "ssms": [
+                    {
+                        # required ssm parameter
+                        "ssm_model": "JackFram/llama-160m",
+                        # optional ssm parameters
+                        "cache_path": "",
+                        "refresh_cache": False,
+                        "full_precision": False,
+                    }
+                ],
+                # "prompt": "",
+                "output_file": "",
+            }
+            # Merge dictionaries
+            ff_init_configs.update(llm_configs)
+            return ff_init_configs
+            
+    def create_llm(self):
+        configs = SimpleNamespace(**self.configs)
+        ff_data_type = ff.DataType.DT_FLOAT if configs.full_precision else ff.DataType.DT_HALF
+        llm = ff.LLM(
+            configs.llm_model,
+            data_type=ff_data_type,
+            cache_path=configs.cache_path,
+            refresh_cache=configs.refresh_cache,
+            output_file=configs.output_file,
+        )
+        return llm
+    
+    def create_ssms(self):
+        # Create the SSMs
+        configs = SimpleNamespace(**self.configs)
+        ssms = []
+        for ssm_config in configs.ssms:
+            ssm_config = SimpleNamespace(**ssm_config)
+            ff_data_type = (
+                ff.DataType.DT_FLOAT if ssm_config.full_precision else ff.DataType.DT_HALF
+            )
+            ssm = ff.SSM(
+                ssm_config.ssm_model,
+                data_type=ff_data_type,
+                cache_path=ssm_config.cache_path,
+                refresh_cache=ssm_config.refresh_cache,
+                output_file=configs.output_file,
+            )
+            ssms.append(ssm)
+        return ssms
+    
+    def compile_and_start(self, generation_config, max_requests_per_batch, max_seq_length, max_tokens_per_batch):
+        
+        # Compile the SSMs for inference and load the weights into memory
+        for ssm in self.ssms:
+            ssm.compile(
+                generation_config,
+                max_requests_per_batch,
+                max_seq_length,
+                max_tokens_per_batch,
+            )
+            
+        # Compile the LLM for inference and load the weights into memory
+        self.llm.compile(
+            generation_config, 
+            max_requests_per_batch, 
+            max_seq_length, 
+            max_tokens_per_batch,
+            ssms = self.ssms
+        )
+        self.llm.start_server()
+
+    def generate(self, prompt):
+        results = self.llm.generate(prompt)
+        if isinstance(results, list):
+            result_txt = results[0].output_text.decode('utf-8')
+        else:
+            result_txt = results.output_text.decode('utf-8')
+        return result_txt
+    
+    def stop_server(self):
+        self.llm.stop_server()
+
+    def __enter__(self):
+        return self.llm.__enter__()
+
+    def __exit__(self, exc_type, exc_value, traceback):
+        return self.llm.__exit__(exc_type, exc_value, traceback)
+
+class FF_LLM_wrapper(LLM):
+    flexflow_llm: FlexFlowLLM
+
+    @property
+    def _llm_type(self) -> str:
+        return "custom"
+
+    def _call(
+        self,
+        prompt: str,
+        stop: Optional[List[str]] = None,
+        **kwargs: Any,
+    ) -> str:
+        if stop is not None:
+            raise ValueError("stop kwargs are not permitted.")
+        response = self.flexflow_llm.generate(prompt)
+        return response
+
+
+if __name__ == "__main__":
+    # initialization
+    ff_llm = FlexFlowLLM()
+
+    # compile and start server
+    gen_config = ff.GenerationConfig(do_sample=False, temperature=0.9, topp=0.8, topk=1)
+    ff_llm.compile_and_start(
+        gen_config, 
+        max_requests_per_batch=1, 
+        max_seq_length=256, 
+        max_tokens_per_batch=64
+    )
+
+    # the wrapper class serves as the 'Model' in LCEL 
+    ff_llm_wrapper = FF_LLM_wrapper(flexflow_llm=ff_llm)
+    
+    # USE CASE 1: Prompt Template
+    template = """Question: {question}
+                    Answer: Let's think step by step."""
+    
+    # Build prompt template and langchain
+    prompt = PromptTemplate(template=template, input_variables=["question"])
+    llm_chain = LLMChain(prompt=prompt, llm=ff_llm_wrapper)
+
+    question = "Who was the US president in the year the first Pokemon game was released?"
+    print(llm_chain.run(question))
+    
+    # stop the server
+    ff_llm.stop_server()
+
+
diff --git a/inference/python/usecases/rag_incr.py b/inference/python/usecases/rag_incr.py
new file mode 100644
index 0000000000..15e7f3d092
--- /dev/null
+++ b/inference/python/usecases/rag_incr.py
@@ -0,0 +1,220 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+
+"""
+This script implements the usecase of rag-search upon FlexFlow.
+
+Functionality:
+1. FlexFlowLLM Class:
+   - Initializes and configures FlexFlow.
+   - Loads configurations from a file or uses default settings.
+   - Compiles and starts the language model server for text generation.
+   - Stops the server when operations are complete.
+
+2. FF_LLM_wrapper Class:
+   - Serves as a wrapper for FlexFlow.
+   - Implements the necessary interface to interact with the LangChain library.
+
+3. Main:
+   - Initializes FlexFlow.
+   - Compiles and starts the server with specific generation configurations.
+   - Taking in specific source information with RAG(Retrieval Augmented Generation) technique for Q&A towards specific realm/knowledgebase.
+   - Use LLMChain to run the model and generate response.
+   - Stops the FlexFlow server after generating the response.
+"""
+
+import flexflow.serve as ff
+import argparse, json, os
+from types import SimpleNamespace
+from langchain.llms.base import LLM
+from typing import Any, List, Mapping, Optional
+from langchain.chains import LLMChain
+from langchain.prompts import PromptTemplate
+from langchain.document_loaders import WebBaseLoader
+from langchain.text_splitter import RecursiveCharacterTextSplitter
+from langchain.embeddings import OpenAIEmbeddings
+from langchain.vectorstores import Chroma
+from langchain.vectorstores import FAISS
+
+class FlexFlowLLM:
+    def __init__(self, config_file=""):
+        self.configs = self.get_configs(config_file)
+        ff.init(self.configs)
+        self.llm = self.create_llm()
+
+    def get_configs(self, config_file):
+        # Load configurations from a file or use default settings
+        if config_file and os.path.isfile(config_file):
+            with open(config_file) as f:
+                return json.load(f)
+        else:
+            # Define sample configs
+            ff_init_configs = {
+                # required parameters
+                "num_gpus": 2,
+                "memory_per_gpu": 14000,
+                "zero_copy_memory_per_node": 40000,
+                # optional parameters
+                "num_cpus": 4,
+                "legion_utility_processors": 4,
+                "data_parallelism_degree": 1,
+                "tensor_parallelism_degree": 1,
+                "pipeline_parallelism_degree": 2,
+                "offload": False,
+                "offload_reserve_space_size": 1024**2,
+                "use_4bit_quantization": False,
+                "use_8bit_quantization": False,
+                "profiling": False,
+                "inference_debugging": False,
+                "fusion": True,
+            }
+            llm_configs = {
+                # required parameters
+                "llm_model": "tiiuae/falcon-7b",
+                # optional parameters
+                "cache_path": "",
+                "refresh_cache": False,
+                "full_precision": False,
+                "prompt": "",
+                "output_file": "",
+            }
+            # Merge dictionaries
+            ff_init_configs.update(llm_configs)
+            return ff_init_configs
+        
+    def create_llm(self):
+        configs = SimpleNamespace(**self.configs)
+        ff_data_type = ff.DataType.DT_FLOAT if configs.full_precision else ff.DataType.DT_HALF
+        llm = ff.LLM(
+            configs.llm_model,
+            data_type=ff_data_type,
+            cache_path=configs.cache_path,
+            refresh_cache=configs.refresh_cache,
+            output_file=configs.output_file,
+        )
+        return llm
+
+    def compile_and_start(self, generation_config, max_requests_per_batch, max_seq_length, max_tokens_per_batch):
+        self.llm.compile(generation_config, max_requests_per_batch, max_seq_length, max_tokens_per_batch)
+        self.llm.start_server()
+
+    def generate(self, prompt):
+        results = self.llm.generate(prompt)
+        if isinstance(results, list):
+            result_txt = results[0].output_text.decode('utf-8')
+        else:
+            result_txt = results.output_text.decode('utf-8')
+        return result_txt
+
+    def stop_server(self):
+        self.llm.stop_server()
+
+    def __enter__(self):
+        return self.llm.__enter__()
+
+    def __exit__(self, exc_type, exc_value, traceback):
+        return self.llm.__exit__(exc_type, exc_value, traceback)
+
+
+class FF_LLM_wrapper(LLM):
+    flexflow_llm: FlexFlowLLM
+
+    @property
+    def _llm_type(self) -> str:
+        return "custom"
+
+    def _call(
+        self,
+        prompt: str,
+        stop: Optional[List[str]] = None,
+        **kwargs: Any,
+    ) -> str:
+        if stop is not None:
+            raise ValueError("stop kwargs are not permitted.")
+        response = self.flexflow_llm.generate(prompt)
+        return response
+
+
+if __name__ == "__main__":
+    # initialization
+    ff_llm = FlexFlowLLM()
+
+    # compile and start server
+    gen_config = ff.GenerationConfig(do_sample=False, temperature=0.9, topp=0.8, topk=1)
+    ff_llm.compile_and_start(
+        gen_config, 
+        max_requests_per_batch=1, 
+        max_seq_length=256, 
+        max_tokens_per_batch=64
+    )
+
+    # the wrapper class serves as the 'Model' in LCEL 
+    ff_llm_wrapper = FF_LLM_wrapper(flexflow_llm=ff_llm)
+    
+    # USE CASE 2: Rag Search
+    
+    # Load web page content
+    loader = WebBaseLoader("https://lilianweng.github.io/posts/2023-06-23-agent/")
+    data = loader.load()
+
+    # Split text
+    text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=0)
+    all_splits = text_splitter.split_documents(data)
+
+    # Initialize embeddings
+    embeddings = OpenAIEmbeddings(openai_api_key=os.getenv('OPENAI_API_KEY')) # fill in openai api key
+
+    # Create VectorStore
+    vectorstore = Chroma.from_documents(all_splits, embeddings)
+
+    # Use VectorStore as a retriever
+    retriever = vectorstore.as_retriever()
+
+    # Test if similarity search is working
+    question = "What are the approaches to Task Decomposition?"
+    docs = vectorstore.similarity_search(question)
+    max_chars_per_doc = 100
+    # docs_text_list = [docs[i].page_content for i in range(len(docs))]
+    docs_text_list = [docs[i].page_content[:max_chars_per_doc] for i in range(len(docs))]
+    docs_text = ''.join(docs_text_list)
+        
+    # Using a Prompt Template
+    prompt_rag = PromptTemplate.from_template(
+        "Summarize the main themes in these retrieved docs: {docs_text}"
+    )
+        
+    # Chain
+    llm_chain_rag = LLMChain(llm=ff_llm_wrapper, prompt=prompt_rag)
+
+    # Run
+    rag_result = llm_chain_rag(docs_text)
+
+    # Stop the server
+    ff_llm.stop_server()
+
diff --git a/inference/python/usecases/rag_specinfer.py b/inference/python/usecases/rag_specinfer.py
new file mode 100644
index 0000000000..512b973955
--- /dev/null
+++ b/inference/python/usecases/rag_specinfer.py
@@ -0,0 +1,266 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+
+"""
+This script implements the usecase of rag-search upon FlexFlow.
+
+Functionality:
+1. FlexFlowLLM Class:
+   - Initializes and configures FlexFlow.
+   - Loads configurations from a file or uses default settings.
+   - Compiles and starts the language model server for text generation.
+   - Stops the server when operations are complete.
+
+2. FF_LLM_wrapper Class:
+   - Serves as a wrapper for FlexFlow.
+   - Implements the necessary interface to interact with the LangChain library.
+
+3. Main:
+   - Initializes FlexFlow.
+   - Compiles and starts the server with specific generation configurations.
+   - Taking in specific source information with RAG(Retrieval Augmented Generation) technique for Q&A towards specific realm/knowledgebase.
+   - Use LLMChain to run the model and generate response.
+   - Stops the FlexFlow server after generating the response.
+"""
+
+import flexflow.serve as ff
+import argparse, json, os
+from types import SimpleNamespace
+from langchain.llms.base import LLM
+from typing import Any, List, Mapping, Optional
+from langchain.chains import LLMChain
+from langchain.prompts import PromptTemplate
+from langchain.document_loaders import WebBaseLoader
+from langchain.text_splitter import RecursiveCharacterTextSplitter
+from langchain.embeddings import OpenAIEmbeddings
+from langchain.vectorstores import Chroma
+from langchain.vectorstores import FAISS
+
+class FlexFlowLLM:
+    def __init__(self, config_file=""):
+        self.configs = self.get_configs(config_file)
+        ff.init(self.configs)
+        self.llm = self.create_llm()
+        self.ssms = self.create_ssms()
+
+    def get_configs(self, config_file):
+        # Load configurations from a file or use default settings
+        if config_file and os.path.isfile(config_file):
+            with open(config_file) as f:
+                return json.load(f)
+        else:
+            # Define sample configs
+            ff_init_configs = {
+                # required parameters
+                "num_gpus": 2,
+                "memory_per_gpu": 14000,
+                "zero_copy_memory_per_node": 40000,
+                # optional parameters
+                "num_cpus": 4,
+                "legion_utility_processors": 4,
+                "data_parallelism_degree": 1,
+                "tensor_parallelism_degree": 1,
+                "pipeline_parallelism_degree": 2,
+                "offload": False,
+                "offload_reserve_space_size": 1024**2,
+                "use_4bit_quantization": False,
+                "use_8bit_quantization": False,
+                "profiling": False,
+                "inference_debugging": False,
+                "fusion": True,
+            }
+            llm_configs = {
+                # required llm arguments
+                "llm_model": "meta-llama/Llama-2-7b-hf",
+                # optional llm parameters
+                "cache_path": "",
+                "refresh_cache": False,
+                "full_precision": False,
+                "ssms": [
+                    {
+                        # required ssm parameter
+                        "ssm_model": "JackFram/llama-160m",
+                        # optional ssm parameters
+                        "cache_path": "",
+                        "refresh_cache": False,
+                        "full_precision": False,
+                    }
+                ],
+                # "prompt": "",
+                "output_file": "",
+            }
+            # Merge dictionaries
+            ff_init_configs.update(llm_configs)
+            return ff_init_configs
+            
+    def create_llm(self):
+        configs = SimpleNamespace(**self.configs)
+        ff_data_type = ff.DataType.DT_FLOAT if configs.full_precision else ff.DataType.DT_HALF
+        llm = ff.LLM(
+            configs.llm_model,
+            data_type=ff_data_type,
+            cache_path=configs.cache_path,
+            refresh_cache=configs.refresh_cache,
+            output_file=configs.output_file,
+        )
+        return llm
+    
+    def create_ssms(self):
+        # Create the SSMs
+        configs = SimpleNamespace(**self.configs)
+        ssms = []
+        for ssm_config in configs.ssms:
+            ssm_config = SimpleNamespace(**ssm_config)
+            ff_data_type = (
+                ff.DataType.DT_FLOAT if ssm_config.full_precision else ff.DataType.DT_HALF
+            )
+            ssm = ff.SSM(
+                ssm_config.ssm_model,
+                data_type=ff_data_type,
+                cache_path=ssm_config.cache_path,
+                refresh_cache=ssm_config.refresh_cache,
+                output_file=configs.output_file,
+            )
+            ssms.append(ssm)
+        return ssms
+    
+    def compile_and_start(self, generation_config, max_requests_per_batch, max_seq_length, max_tokens_per_batch):
+        
+        # Compile the SSMs for inference and load the weights into memory
+        for ssm in self.ssms:
+            ssm.compile(
+                generation_config,
+                max_requests_per_batch,
+                max_seq_length,
+                max_tokens_per_batch,
+            )
+            
+        # Compile the LLM for inference and load the weights into memory
+        self.llm.compile(
+            generation_config, 
+            max_requests_per_batch, 
+            max_seq_length, 
+            max_tokens_per_batch,
+            ssms = self.ssms
+        )
+        # start server
+        self.llm.start_server()
+
+    def generate(self, prompt):
+        results = self.llm.generate(prompt)
+        if isinstance(results, list):
+            result_txt = results[0].output_text.decode('utf-8')
+        else:
+            result_txt = results.output_text.decode('utf-8')
+        return result_txt
+    
+    def stop_server(self):
+        self.llm.stop_server()
+    
+    def __enter__(self):
+        return self.llm.__enter__()
+
+    def __exit__(self, exc_type, exc_value, traceback):
+        return self.llm.__exit__(exc_type, exc_value, traceback)
+    
+class FF_LLM_wrapper(LLM):
+    flexflow_llm: FlexFlowLLM
+
+    @property
+    def _llm_type(self) -> str:
+        return "custom"
+
+    def _call(
+        self,
+        prompt: str,
+        stop: Optional[List[str]] = None,
+        **kwargs: Any,
+    ) -> str:
+        if stop is not None:
+            raise ValueError("stop kwargs are not permitted.")
+        response = self.flexflow_llm.generate(prompt)
+        return response
+
+
+if __name__ == "__main__":
+    # initialization
+    ff_llm = FlexFlowLLM()
+
+    # compile and start server
+    gen_config = ff.GenerationConfig(do_sample=False, temperature=0.9, topp=0.8, topk=1)
+    ff_llm.compile_and_start(
+        gen_config, 
+        max_requests_per_batch=1, 
+        max_seq_length=256, 
+        max_tokens_per_batch=200
+    )
+
+    # the wrapper class serves as the 'Model' in LCEL 
+    ff_llm_wrapper = FF_LLM_wrapper(flexflow_llm=ff_llm)
+    
+    # USE CASE 2: Rag Search
+    
+    # Load web page content
+    loader = WebBaseLoader("https://lilianweng.github.io/posts/2023-06-23-agent/")
+    data = loader.load()
+
+    # Split text
+    text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=0)
+    all_splits = text_splitter.split_documents(data)
+
+    # Initialize embeddings
+    embeddings = OpenAIEmbeddings(openai_api_key=os.getenv('OPENAI_API_KEY')) # fill in openai api key
+
+    # Create VectorStore
+    vectorstore = Chroma.from_documents(all_splits, embeddings)
+
+    # Use VectorStore as a retriever
+    retriever = vectorstore.as_retriever()
+
+    # Test if similarity search is working
+    question = "What are the approaches to Task Decomposition?"
+    docs = vectorstore.similarity_search(question)
+    max_chars_per_doc = 50
+    # docs_text_list = [docs[i].page_content for i in range(len(docs))]
+    docs_text_list = [docs[i].page_content[:max_chars_per_doc] for i in range(len(docs))]
+    docs_text = ''.join(docs_text_list)
+        
+    # Using a Prompt Template
+    prompt_rag = PromptTemplate.from_template(
+        "Summarize the main themes in these retrieved docs: {docs_text}"
+    )
+    
+    # Chain
+    llm_chain_rag = LLMChain(llm=ff_llm_wrapper, prompt=prompt_rag)
+
+    # Run
+    rag_result = llm_chain_rag(docs_text)
+
+    # stop the server
+    ff_llm.stop_server()
diff --git a/tests/training_tests.sh b/tests/training_tests.sh
index 2d1f00883b..a6cab7d117 100755
--- a/tests/training_tests.sh
+++ b/tests/training_tests.sh
@@ -2,6 +2,9 @@
 set -x
 set -e
 
+# Enable backtrace in case we run into a segfault or assertion failure
+export LEGION_BACKTRACE=1
+
 # Default to single-node, single GPU
 GPUS=${1:-1} # number of GPUS per node
 NUM_NODES=${2:-1} # number of nodes
@@ -87,3 +90,4 @@ $EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_concat.py -config-file /t
 $EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_concat_model.py -config-file /tmp/flexflow/training_tests/test_params.json
 $EXE "$FF_HOME"/examples/python/keras/func_cifar10_cnn_concat_seq_model.py -config-file /tmp/flexflow/training_tests/test_params.json
 $EXE "$FF_HOME"/examples/python/native/cifar10_cnn_concat.py -config-file /tmp/flexflow/training_tests/test_params_40_epochs_no_batch_size.json
+

From d21ed66a5baf2bfdeb06fd74e080abbd6eec9ce7 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Fri, 26 Jan 2024 23:01:16 -0500
Subject: [PATCH 316/344] Bug fixes and update Legion version (#1287)

* bug fixes and update Legion version

* fix

* bug fix

* update legion

* fix arithmetic error due to num_devices uninitialized

* update legion version

* update ci

* fix

* debugging ci

* Revert "debugging ci"

This reverts commit 0b3148ef6adfcb64935e6b1e83a88494910a7b22.

* update mapper interface

* add ncclFinalize

* Only delete nccl communications for training jobs

---------

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 .github/workflows/gpu-ci.yml       | 12 +++---
 CMakeLists.txt                     |  8 ++--
 cmake/pip_install/CMakeLists.txt   |  4 +-
 deps/legion                        |  2 +-
 include/flexflow/mapper.h          |  9 ++---
 include/flexflow/model.h           |  2 +
 include/flexflow/operator.h        |  5 +++
 include/flexflow/request_manager.h |  1 -
 src/mapper/mapper.cc               | 47 ++++++++++------------
 src/ops/linear.cc                  |  8 +---
 src/runtime/inference_manager.cc   | 30 +-------------
 src/runtime/model.cc               | 63 ++++++++++++++++++++++++++++++
 12 files changed, 111 insertions(+), 80 deletions(-)

diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index 3901d6b5f7..48dcda157e 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -222,7 +222,7 @@ jobs:
       CONDA: "3"
     needs: inference-tests
     container:
-      image: ghcr.io/flexflow/flexflow-environment-cuda:latest
+      image: ghcr.io/flexflow/flexflow-environment-cuda-11.8:latest
       options: --gpus all --shm-size=8192m
     steps:
       - name: Install updated git version
@@ -243,7 +243,7 @@ jobs:
 
       - name: Build and Install FlexFlow
         run: |
-          export PATH=/opt/conda/bin:$PATH
+          export PATH=$CONDA_PREFIX/bin:$PATH
           export FF_HOME=$(pwd)
           export FF_BUILD_ALL_EXAMPLES=ON
           export FF_BUILD_ALL_INFERENCE_EXAMPLES=ON
@@ -252,18 +252,18 @@ jobs:
 
       - name: Check FlexFlow Python interface (pip)
         run: |
-          export PATH=/opt/conda/bin:$PATH
+          export PATH=$CONDA_PREFIX/bin:$PATH
           export FF_HOME=$(pwd)
-          export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/conda/lib
+          export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$CONDA_PREFIX/lib
           ./tests/python_interface_test.sh after-installation
 
       - name: Run multi-gpu tests
         run: |
-          export PATH=/opt/conda/bin:$PATH
+          export PATH=$CONDA_PREFIX/bin:$PATH
           export CUDNN_DIR=/usr/local/cuda
           export CUDA_DIR=/usr/local/cuda
           export FF_HOME=$(pwd)
-          export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/conda/lib
+          export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$CONDA_PREFIX/lib
           # C++ tests
           ./tests/cpp_gpu_tests.sh 4
           # Python tests
diff --git a/CMakeLists.txt b/CMakeLists.txt
index acbe7e385f..43ce4f7044 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -413,6 +413,7 @@ if(NOT BUILD_LEGION_ONLY)
 
   # python related
   if (FF_USE_PYTHON)
+    find_package(Python COMPONENTS Interpreter Development)
     # create flexflow_cffi_header.py
     add_custom_command(TARGET flexflow
       PRE_BUILD	
@@ -424,13 +425,13 @@ if(NOT BUILD_LEGION_ONLY)
       # generate the Legion Python bindings library. When building from pip, we need to do this post-install to prevent Legion from overwriting the path to the Legion shared library
       add_custom_command(TARGET flexflow
         POST_BUILD	
-        COMMAND ${PYTHON_EXECUTABLE} ${CMAKE_CURRENT_SOURCE_DIR}/deps/legion/bindings/python/setup.py build --cmake-build-dir ${Legion_BINARY_DIR}/runtime --prefix ${Legion_BINARY_DIR} --build-lib=${Legion_BINARY_DIR}/bindings/python ${Legion_PYTHON_EXTRA_INSTALL_ARGS}
+        COMMAND ${Python_EXECUTABLE} ${CMAKE_CURRENT_SOURCE_DIR}/deps/legion/bindings/python/setup.py build --cmake-build-dir ${Legion_BINARY_DIR}/runtime --prefix ${Legion_BINARY_DIR} --build-lib=${Legion_BINARY_DIR}/bindings/python ${Legion_PYTHON_EXTRA_INSTALL_ARGS}
         WORKING_DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}/deps/legion/bindings/python
       )
       # create flexflow_python interpreter. When building from pip, we install the FF_HOME/python/flexflow_python script instead.
       add_custom_command(TARGET flexflow
         PRE_BUILD	
-        COMMAND ${PYTHON_EXECUTABLE} ${FLEXFLOW_ROOT}/python/flexflow_python_build.py --build-dir ${CMAKE_BINARY_DIR}
+        COMMAND ${Python_EXECUTABLE} ${FLEXFLOW_ROOT}/python/flexflow_python_build.py --build-dir ${CMAKE_BINARY_DIR}
         WORKING_DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}
         COMMENT "Creating flexflow_python interpreter..."
       )
@@ -567,7 +568,8 @@ if(NOT BUILD_LEGION_ONLY)
   install(TARGETS flexflow DESTINATION ${LIB_DEST})
   # install python
   if (FF_USE_PYTHON)
-    execute_process(COMMAND ${PYTHON_EXECUTABLE} -c "import site, os; print([pkg for func in (site.getsitepackages(), site.getusersitepackages()) for pkg in ([func] if isinstance(func, str) else func) if os.access(pkg, os.W_OK)][0])" OUTPUT_VARIABLE PY_DEST OUTPUT_STRIP_TRAILING_WHITESPACE)
+    find_package(Python COMPONENTS Interpreter Development)
+    execute_process(COMMAND ${Python_EXECUTABLE} -c "import site, os; print([pkg for func in (site.getsitepackages(), site.getusersitepackages()) for pkg in ([func] if isinstance(func, str) else func) if os.access(pkg, os.W_OK)][0])" OUTPUT_VARIABLE PY_DEST OUTPUT_STRIP_TRAILING_WHITESPACE)
     if (NOT FF_BUILD_FROM_PYPI)
       install(
         DIRECTORY ${FLEXFLOW_ROOT}/python/flexflow/
diff --git a/cmake/pip_install/CMakeLists.txt b/cmake/pip_install/CMakeLists.txt
index 7ce38c4abc..105133a310 100644
--- a/cmake/pip_install/CMakeLists.txt
+++ b/cmake/pip_install/CMakeLists.txt
@@ -1,10 +1,10 @@
 # Use setup.py script to re-install the Python bindings library with the right library paths
 if (FF_USE_PYTHON)
-    execute_process(COMMAND ${PYTHON_EXECUTABLE} -c "import site, os; print([pkg for func in (site.getsitepackages(), site.getusersitepackages()) for pkg in ([func] if isinstance(func, str) else func) if os.access(pkg, os.W_OK)][0])" OUTPUT_VARIABLE PY_DEST OUTPUT_STRIP_TRAILING_WHITESPACE)  
+    execute_process(COMMAND ${Python_EXECUTABLE} -c "import site, os; print([pkg for func in (site.getsitepackages(), site.getusersitepackages()) for pkg in ([func] if isinstance(func, str) else func) if os.access(pkg, os.W_OK)][0])" OUTPUT_VARIABLE PY_DEST OUTPUT_STRIP_TRAILING_WHITESPACE)  
     if(FF_BUILD_FROM_PYPI)
         install(CODE "execute_process(COMMAND ${CMAKE_COMMAND} -E echo \"Editing path to Legion library using path: ${PY_DEST}/flexflow/lib \")")
         # CMAKE_CURRENT_SOURCE_DIR=/usr/FlexFlow/cmake/pip_install 
         # Legion_BINARY_DIR=/usr/FlexFlow/build/<something>/deps/legion
-        install(CODE "execute_process(COMMAND ${PYTHON_EXECUTABLE} ${CMAKE_CURRENT_SOURCE_DIR}/../../deps/legion/bindings/python/setup.py install --cmake-build-dir ${Legion_BINARY_DIR}/runtime --prefix ${PY_DEST}/flexflow ${Legion_PYTHON_EXTRA_INSTALL_ARGS} WORKING_DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}/../../deps/legion/bindings/python)")
+        install(CODE "execute_process(COMMAND ${Python_EXECUTABLE} ${CMAKE_CURRENT_SOURCE_DIR}/../../deps/legion/bindings/python/setup.py install --cmake-build-dir ${Legion_BINARY_DIR}/runtime --prefix ${PY_DEST}/flexflow ${Legion_PYTHON_EXTRA_INSTALL_ARGS} WORKING_DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}/../../deps/legion/bindings/python)")
     endif()
 endif()
diff --git a/deps/legion b/deps/legion
index 626b55689c..24e8c45234 160000
--- a/deps/legion
+++ b/deps/legion
@@ -1 +1 @@
-Subproject commit 626b55689c77848b246e1da19678c7ad58899f0c
+Subproject commit 24e8c452341dea41427e0ce61e154d61715e6835
diff --git a/include/flexflow/mapper.h b/include/flexflow/mapper.h
index 71be1892aa..e8337818ec 100644
--- a/include/flexflow/mapper.h
+++ b/include/flexflow/mapper.h
@@ -83,11 +83,10 @@ class FFMapper : public NullMapper {
                         Task const &task,
                         MapTaskInput const &input,
                         MapTaskOutput &output);
-  virtual void map_replicate_task(const MapperContext ctx,
-                                  Task const &task,
-                                  MapTaskInput const &input,
-                                  MapTaskOutput const &default_output,
-                                  MapReplicateTaskOutput &output);
+  virtual void replicate_task(const MapperContext ctx,
+                              Task const &task,
+                              ReplicateTaskInput const &input,
+                              ReplicateTaskOutput &output);
   virtual void select_task_variant(const MapperContext ctx,
                                    Task const &task,
                                    SelectVariantInput const &input,
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index dd6dc76b4d..95be9ab581 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -202,6 +202,7 @@ enum TaskIDs {
   // NCCL tasks
   NCCL_GETUNIQUEID_TASK_ID,
   NCCL_INIT_COMMS_TASK_ID,
+  NCCL_FINISH_COMMS_TASK_ID,
   // Search
   STRATEGY_SEARCH_TASK_ID,
   // Graph
@@ -397,6 +398,7 @@ std::vector<ParallelTensorShape>
 class FFModel {
 public:
   FFModel(FFConfig &config, bool cpu_offload = false);
+  ~FFModel();
 
   static constexpr float PROPAGATION_CHANCE = 0.25;
   static constexpr float CONTINUE_PROPAGATION_CHANCE = 0.75;
diff --git a/include/flexflow/operator.h b/include/flexflow/operator.h
index 73c2c3e092..1b19bdb82f 100644
--- a/include/flexflow/operator.h
+++ b/include/flexflow/operator.h
@@ -406,6 +406,11 @@ class Op {
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
                            Legion::Runtime *runtime);
+  static void
+      finish_nccl_comms_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
 #endif
 protected:
   void set_argumentmap_for_init(FFModel const &ff, Legion::ArgumentMap &argmap);
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index 50a51705cd..4763eb1ef3 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -55,7 +55,6 @@ class InferenceManager {
 public:
   std::unordered_map<ParallelTensor, std::vector<ParallelTensor>> tensor_buffer;
   std::unordered_map<FFModel *, FileDataLoader *> model_weights_loaders;
-  int num_devices;
 };
 
 struct Request {
diff --git a/src/mapper/mapper.cc b/src/mapper/mapper.cc
index bc26a79d3e..d46bfc2877 100644
--- a/src/mapper/mapper.cc
+++ b/src/mapper/mapper.cc
@@ -661,44 +661,37 @@ void FFMapper::map_task(const MapperContext ctx,
   } // for idx
 }
 
-void FFMapper::map_replicate_task(const MapperContext ctx,
-                                  Task const &task,
-                                  MapTaskInput const &input,
-                                  MapTaskOutput const &default_output,
-                                  MapReplicateTaskOutput &output) {
+void FFMapper::replicate_task(const MapperContext ctx,
+                              Task const &task,
+                              ReplicateTaskInput const &input,
+                              ReplicateTaskOutput &output) {
   // Should only be replicated for the top-level task
   assert((task.get_depth() == 0) && (task.regions.size() == 0));
   const Processor::Kind target_kind = task.target_proc.kind();
-  VariantID chosen_variant;
+  VariantID vid;
   {
     std::vector<VariantID> variant_ids;
-    runtime->find_valid_variants(
-        ctx, task.task_id, variant_ids, task.target_proc.kind());
+    runtime->find_valid_variants(ctx, task.task_id, variant_ids, target_kind);
     // Currently assume there is exactly one variant
     assert(variant_ids.size() == 1);
-    chosen_variant = variant_ids[0];
+    output.chosen_variant = variant_ids[0];
   }
-  std::vector<Processor> const &all_procs = all_procs_by_kind(target_kind);
-  // Place on replicate on each node by default
-  output.task_mappings.resize(total_nodes, default_output);
-  // Assume default_output does not include any target_procs
-  assert(default_output.target_procs.size() == 0);
-  for (std::vector<Processor>::const_iterator it = all_procs.begin();
-       it != all_procs.end();
+  output.target_processors.resize(total_nodes);
+  std::vector<bool> handled(total_nodes, false);
+  size_t count = 0;
+  Machine::ProcessorQuery procs(machine);
+  procs.only_kind(target_kind);
+  for (Machine::ProcessorQuery::iterator it = procs.begin(); it != procs.end();
        it++) {
-    AddressSpace space = it->address_space();
-    assert(space < output.task_mappings.size());
-    // Add *it as a target_proc if we haven't found one
-    if (output.task_mappings[space].target_procs.size() == 0) {
-      output.task_mappings[space].target_procs.push_back(*it);
+    const AddressSpace space = it->address_space();
+    if (handled[space]) {
+      continue;
     }
+    output.target_processors[space] = *it;
+    handled[space] = true;
+    count++;
   }
-  output.control_replication_map.resize(total_nodes);
-  for (int idx = 0; idx < total_nodes; idx++) {
-    output.task_mappings[idx].chosen_variant = chosen_variant;
-    output.control_replication_map[idx] =
-        output.task_mappings[idx].target_procs[0];
-  }
+  assert(count == total_nodes);
 }
 
 void FFMapper::select_task_variant(const MapperContext ctx,
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index 03c9e48af8..0c7a0f78fe 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -467,12 +467,8 @@ OpMeta *Linear::init_task_with_dim(Task const *task,
                                        ctx,
                                        runtime,
                                        false /*readOutput*/);
-  // TensorAccessorW<WT, NDIM> acc_kernel(regions[2],
-  //                                      task->regions[2],
-  //                                      FID_DATA,
-  //                                      ctx,
-  //                                      runtime,
-  //                                      false /*readOutput*/);
+  TensorAccessorR<WT, NDIM> acc_kernel(
+      regions[2], task->regions[2], FID_DATA, ctx, runtime);
 
   // TensorAccessorR<float, 1> acc_bias(
   //     regions[3], task->regions[3], FID_DATA, ctx, runtime);
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 6588cbceeb..2a94df8b4d 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -28,33 +28,7 @@ using namespace Legion;
 LegionRuntime::Logger::Category log_inf_mgr("InferenceManager");
 LegionRuntime::Logger::Category log_offload("Offloading");
 
-InferenceManager::InferenceManager() {
-#ifdef DEADCODE
-  num_devices = ff_config.workersPerNode * ff_config.numNodes;
-  // Check parallelization degrees
-  assert(ff_config.data_parallelism_degree <= num_devices &&
-         "Data parallelism degree exceeds number of available devices");
-  assert(num_devices % ff_config.data_parallelism_degree == 0 &&
-         "Number of available devices is not divisible by data parallelism "
-         "degree");
-  assert(ff_config.tensor_parallelism_degree <= num_devices &&
-         "Tensor parallelism degree exceeds number of available devices");
-  assert(num_devices % ff_config.tensor_parallelism_degree == 0 &&
-         "Number of available devices is not divisible by tensor parallelism "
-         "degree");
-  assert(ff_config.pipeline_parallelism_degree <= num_devices &&
-         "Pipeline parallelism degree exceeds number of available devices");
-  assert(num_devices % ff_config.pipeline_parallelism_degree == 0 &&
-         "Number of available devices is not divisible by pipeline parallelism "
-         "degree");
-  assert(ff_config.data_parallelism_degree *
-                 ff_config.tensor_parallelism_degree *
-                 ff_config.pipeline_parallelism_degree ==
-             num_devices &&
-         "Product of data, tensor, and pipeline parallelism degrees does not "
-         "match the number of available devices");
-#endif
-}
+InferenceManager::InferenceManager() {}
 
 InferenceManager *inference_manager_singleton = nullptr;
 
@@ -296,8 +270,6 @@ void InferenceManager::compile_model_and_allocate_buffer(FFModel *model) {
 void InferenceManager::init_operators_inference(FFModel *model) {
   for (int batch_index = 0; batch_index < model->config.data_parallelism_degree;
        batch_index++) {
-    int expert_device_index = 0;
-    int device_index = batch_index % num_devices;
     for (size_t o = 0; o < model->operators.size(); o++) {
       Op *op = model->operators[o];
       if (op->op_type == OP_WEIGHT) {
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index c07c33efca..440ae19047 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -606,6 +606,15 @@ ncclComm_t Op::init_nccl_comms_task(Task const *task,
   //     ncclComm, allRanks, myRank, ncclId);
   return ncclComm;
 }
+
+void Op::finish_nccl_comms_task(Task const *task,
+                                std::vector<PhysicalRegion> const &regions,
+                                Context ctx,
+                                Runtime *runtime) {
+  ncclComm_t comm = *((ncclComm_t *)task->local_args);
+  checkNCCL(ncclCommFinalize(comm));
+  checkNCCL(ncclCommDestroy(comm));
+}
 #endif
 
 /**
@@ -1578,6 +1587,45 @@ FFModel::FFModel(FFConfig &_config, bool cpu_offload)
   model_id = model_counter++;
 }
 
+FFModel::~FFModel() {
+  // Destroy nccl communication groups
+#ifdef FF_USE_NCCL
+  if (config.computationMode == COMP_MODE_TRAINING) {
+    Context ctx = config.lg_ctx;
+    Runtime *runtime = config.lg_hlr;
+    for (auto const &comm : view_hash_to_nccl_comms) {
+      // Find the machine view that has the hash
+      MachineView view;
+      for (size_t l = 0; l < operators.size(); l++) {
+        view = operators[l]->outputs[0]->machine_view;
+        if (view.hash() == comm.first) {
+          break;
+        }
+      }
+      assert(view.hash() == comm.first && "Cannot find the machine view");
+      IndexSpace task_is = get_or_create_task_is(view);
+      Domain domain = runtime->get_index_space_domain(ctx, task_is);
+      ArgumentMap argmap;
+      int idx = 0;
+      for (Domain::DomainPointIterator it(domain); it; it++, idx++) {
+        argmap.set_point(*it,
+                         TaskArgument(&comm.second[idx], sizeof(ncclComm_t)));
+      }
+      IndexLauncher index_launcher(NCCL_FINISH_COMMS_TASK_ID,
+                                   task_is,
+                                   TaskArgument(nullptr, 0),
+                                   argmap,
+                                   Predicate::TRUE_PRED,
+                                   false /*must*/,
+                                   0 /*mapper_id*/,
+                                   comm.first);
+      FutureMap fm = runtime->execute_index_space(ctx, index_launcher);
+      fm.wait_all_results();
+    }
+  }
+#endif
+}
+
 void FFModel::clear_graph_search_cache() {
   this->graph_search->clear_cache();
   this->search->clear_cache();
@@ -6853,6 +6901,21 @@ void register_flexflow_internal_tasks(Runtime *runtime,
           registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(NCCL_FINISH_COMMS_TASK_ID,
+                                   "NCCL Finish Communicators");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<Op::finish_nccl_comms_task>(
+          registrar, "NCCL Finish Communicators Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<Op::finish_nccl_comms_task>(registrar);
+    }
+  }
 #endif
   // Search
   {

From be28d718c06c199866126a8bf4f1e35dfc4509a1 Mon Sep 17 00:00:00 2001
From: April Yang <114364211+april-yyt@users.noreply.github.com>
Date: Sun, 4 Feb 2024 19:58:39 -0800
Subject: [PATCH 317/344] Docs Modification for Python Usecases (#1291)

* modify README

* fix link issues

* update legion version

---------

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 SERVE.md                        | 69 +++++++++++++++++++++++++++++++++
 docs/source/chatbot.rst         |  4 +-
 docs/source/prompt_template.rst |  4 +-
 docs/source/rag.rst             |  4 +-
 docs/source/serve_fastapi.rst   |  4 +-
 5 files changed, 77 insertions(+), 8 deletions(-)

diff --git a/SERVE.md b/SERVE.md
index e64756e8f4..e9bab3d702 100644
--- a/SERVE.md
+++ b/SERVE.md
@@ -182,6 +182,75 @@ FlexFlow Serve supports int4 and int8 quantization. The compressed tensors are s
 ### Prompt Datasets
 We provide five prompt datasets for evaluating FlexFlow Serve: [Chatbot instruction prompts](https://specinfer.s3.us-east-2.amazonaws.com/prompts/chatbot.json), [ChatGPT Prompts](https://specinfer.s3.us-east-2.amazonaws.com/prompts/chatgpt.json), [WebQA](https://specinfer.s3.us-east-2.amazonaws.com/prompts/webqa.json), [Alpaca](https://specinfer.s3.us-east-2.amazonaws.com/prompts/alpaca.json), and [PIQA](https://specinfer.s3.us-east-2.amazonaws.com/prompts/piqa.json).
 
+
+
+
+## Python Interface Features and Interaction Methods
+
+FlexFlow Serve provides a comprehensive Python interface for serving with low latency and high performance. This interface facilitates the deployment and interaction with the serving platform for a variety of applications, from chatbots and prompt templates to retrieval augmented generation and API services.
+
+### Chatbot with Gradio
+
+The Python interface allows setting up a chatbot application using Gradio, enabling interactive dialogues with users through a user-friendly web interface.
+
+#### Implementation Steps
+1. **FlexFlow Initialization:** Configure and initialize FlexFlow Serve with the desired settings and the specific LLM.
+```python
+import gradio as gr
+import flexflow.serve as ff
+
+ff.init(num_gpus=2, memory_per_gpu=14000, ...)
+```
+2. **Gradio Interface Setup:** Implement a function to generate responses from user inputs and set up the Gradio Chat Interface for interaction.
+```python
+def generate_response(user_input):
+    result = llm.generate(user_input)
+    return result.output_text.decode('utf-8')
+```
+3. **Running the Interface:** Launch the Gradio interface to interact with the LLM through a web-based chat interface.
+```python
+iface = gr.ChatInterface(fn=generate_response)
+iface.launch()
+```
+4. **Shutdown:** Properly stop the FlexFlow server after interaction is complete.
+
+
+
+### Langchain Usecases
+FlexFlow Serve supports langchain usecases including dynamic prompt template handling and RAG usecases, enabling the customization of model responses based on structured input templates and Retrieval Augmented Generation.
+
+#### Implementation Steps
+1. **FlexFlow Initialization**: Start by initializing FlexFlow Serve with the appropriate configurations.
+2. **LLM Setup**: Compile and load the LLM for text generation.
+3. **Prompt Template/RAG Setup**: Configure prompt templates to guide the model's responses.
+4. **Response Generation**: Use the LLM with the prompt template to generate responses.
+
+
+### Python FastAPI Entrypoint
+Flexflow Serve also supports deploying and managing LLMs with FastAPI, offering a RESTful API interface for generating responses from models.
+
+```python
+@app.on_event("startup")
+async def startup_event():
+   global llm
+   # Initialize and compile the LLM model
+   llm.compile(
+      generation_config,
+      # ... other params as needed
+   )
+   llm.start_server()
+
+@app.post("/generate/")
+async def generate(prompt_request: PromptRequest):
+   # ... exception handling
+   full_output = llm.generate([prompt_request.prompt])[0].output_text.decode('utf-8')
+   # ... split prompt and response text for returning results
+   return {"prompt": prompt_request.prompt, "response": full_output}
+```
+
+
+
+
 ## TODOs
 
 FlexFlow Serve is still under active development. We currently focus on the following tasks and strongly welcome all contributions from bug fixes to new features and extensions.
diff --git a/docs/source/chatbot.rst b/docs/source/chatbot.rst
index fc6f616fae..c41307e231 100644
--- a/docs/source/chatbot.rst
+++ b/docs/source/chatbot.rst
@@ -42,9 +42,9 @@ Example
 
 Complete code example can be found here: 
 
-1. `Chatbot Example with incremental decoding <https://github.com/flexflow/FlexFlow/blob/chatbot-2/inference/python/usecases/gradio_incr.py>`__
+1. `Chatbot Example with incremental decoding <https://github.com/flexflow/FlexFlow/blob/inference/inference/python/usecases/gradio_incr.py>`__
 
-2. `Chatbot Example with speculative inference <https://github.com/flexflow/FlexFlow/blob/chatbot-2/inference/python/usecases/gradio_specinfer.py>`__
+2. `Chatbot Example with speculative inference <https://github.com/flexflow/FlexFlow/blob/inference/inference/python/usecases/gradio_specinfer.py>`__
 
 
 Example Implementation:
diff --git a/docs/source/prompt_template.rst b/docs/source/prompt_template.rst
index 4e0f1beab5..7f987b0f18 100644
--- a/docs/source/prompt_template.rst
+++ b/docs/source/prompt_template.rst
@@ -34,9 +34,9 @@ Example
 
 Complete code example can be found here: 
 
-1. `Prompt Template Example with incremental decoding <https://github.com/flexflow/FlexFlow/blob/chatbot-2/inference/python/usecases/prompt_template_incr.py>`__
+1. `Prompt Template Example with incremental decoding <https://github.com/flexflow/FlexFlow/blob/inference/inference/python/usecases/prompt_template_incr.py>`__
 
-2. `Prompt Template Example with speculative inference <https://github.com/flexflow/FlexFlow/blob/chatbot-2/inference/python/usecases/prompt_template_specinfer.py>`__
+2. `Prompt Template Example with speculative inference <https://github.com/flexflow/FlexFlow/blob/inference/inference/python/usecases/prompt_template_specinfer.py>`__
 
 
 Example Implementation:
diff --git a/docs/source/rag.rst b/docs/source/rag.rst
index 4b869c2352..640b2fe131 100644
--- a/docs/source/rag.rst
+++ b/docs/source/rag.rst
@@ -34,9 +34,9 @@ Example
 
 A complete code example for a web-document Q&A using FlexFlow can be found here: 
 
-1. `Rag Q&A Example with incremental decoding <https://github.com/flexflow/FlexFlow/blob/chatbot-2/inference/python/usecases/rag_incr.py>`__
+1. `Rag Q&A Example with incremental decoding <https://github.com/flexflow/FlexFlow/blob/inference/inference/python/usecases/rag_incr.py>`__
 
-2. `Rag Q&A Example with speculative inference <https://github.com/flexflow/FlexFlow/blob/chatbot-2/inference/python/usecases/rag_specinfer.py>`__
+2. `Rag Q&A Example with speculative inference <https://github.com/flexflow/FlexFlow/blob/inference/inference/python/usecases/rag_specinfer.py>`__
 
 
 Example Implementation:
diff --git a/docs/source/serve_fastapi.rst b/docs/source/serve_fastapi.rst
index 0aa6634670..62a28e5937 100644
--- a/docs/source/serve_fastapi.rst
+++ b/docs/source/serve_fastapi.rst
@@ -101,6 +101,6 @@ Full API Entrypoint Code
 
 A complete code example for a web-document Q&A using FlexFlow can be found here: 
 
-1. `FastAPI Example with incremental decoding <https://github.com/flexflow/FlexFlow/blob/chatbot-2/inference/python/entrypoint/fastapi_incr.py>`__
+1. `FastAPI Example with incremental decoding <https://github.com/flexflow/FlexFlow/blob/inference/inference/python/entrypoint/fastapi_incr.py>`__
 
-2. `FastAPI Example with speculative inference <https://github.com/flexflow/FlexFlow/blob/chatbot-2/inference/python//entrypoint/fastapi_specinfer.py>`__
+2. `FastAPI Example with speculative inference <https://github.com/flexflow/FlexFlow/blob/inference/inference/python//entrypoint/fastapi_specinfer.py>`__

From e24eb03235a185d8ce1c92d5519a27c8add072c8 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 22 Feb 2024 10:40:33 -0500
Subject: [PATCH 318/344] Add support for docker machines with cuda 12.1 and
 cuda 12.2 (#1308)

---
 docker/build.sh | 12 ++++++------
 docker/pull.sh  |  6 +++---
 docker/run.sh   |  6 +++---
 3 files changed, 12 insertions(+), 12 deletions(-)

diff --git a/docker/build.sh b/docker/build.sh
index 6603d919f5..8ecacbc6d4 100755
--- a/docker/build.sh
+++ b/docker/build.sh
@@ -50,20 +50,20 @@ if [[ "${FF_GPU_BACKEND}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; the
   # Check that CUDA version is supported, and modify cuda version to include default subsubversion
   if [[ "$cuda_version" == @(11.1|11.3|11.7|12.0|12.1) ]]; then
     cuda_version_input=${cuda_version}.1
-  elif [[ "$cuda_version" == @(11.2|11.5|11.6) ]]; then 
+  elif [[ "$cuda_version" == @(11.2|11.5|11.6|12.2) ]]; then 
     cuda_version_input=${cuda_version}.2
   elif [[ "$cuda_version" == @(11.4) ]]; then 
     cuda_version_input=${cuda_version}.3
-  elif [[ "$cuda_version" == @(11.8|12.2) ]]; then 
+  elif [[ "$cuda_version" == @(11.8) ]]; then 
     cuda_version_input=${cuda_version}.0
   else
     echo "cuda_version is not supported, please choose among {11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0|12.1|12.2}"
     exit 1
   fi
-  # Use CUDA 12.0 for all versions greater or equal to 12.0 for now
-  if [[ "$cuda_version" == @(12.1|12.2|12.3|12.4|12.5|12.6|12.7|12.8|12.9) ]]; then
-    cuda_version=12.0
-    cuda_version_input=${cuda_version}.1
+  # Use CUDA 12.2 for all versions greater or equal to 12.2 for now (the Docker machine with CUDNN is not yet available)
+  if [[ "$cuda_version" == @(12.3|12.4|12.5|12.6|12.7|12.8|12.9) ]]; then
+    cuda_version=12.2
+    cuda_version_input=${cuda_version}.2
   fi
   echo "Building $image docker image with CUDA $cuda_version"
   ff_environment_base_image="nvidia/cuda:${cuda_version_input}-cudnn8-devel-ubuntu20.04"
diff --git a/docker/pull.sh b/docker/pull.sh
index e5b6f26f3c..27bf245c12 100755
--- a/docker/pull.sh
+++ b/docker/pull.sh
@@ -49,9 +49,9 @@ if [[ "${FF_GPU_BACKEND}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; the
     echo "cuda_version is not supported, please choose among {11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0|12.1|12.2}"
     exit 1
   fi
-  # Use CUDA 12.0 for all versions greater or equal to 12.0 for now
-  if [[ "$cuda_version" == @(12.1|12.2|12.3|12.4|12.5|12.6|12.7|12.8|12.9) ]]; then
-    cuda_version=12.0
+  # Use CUDA 12.2 for all versions greater or equal to 12.2 for now
+  if [[ "$cuda_version" == @(12.3|12.4|12.5|12.6|12.7|12.8|12.9) ]]; then
+    cuda_version=12.2
   fi
   # Set cuda version suffix to docker image name
   echo "Downloading $image docker image with CUDA $cuda_version"
diff --git a/docker/run.sh b/docker/run.sh
index 76ec1e1ceb..666c8e1121 100755
--- a/docker/run.sh
+++ b/docker/run.sh
@@ -62,9 +62,9 @@ if [[ "${FF_GPU_BACKEND}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; the
     echo "cuda_version is not supported, please choose among {11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0|12.1|12.2}"
     exit 1
   fi
-  # Use CUDA 12.0 for all versions greater or equal to 12.0 for now
-  if [[ "$cuda_version" == @(12.1|12.2|12.3|12.4|12.5|12.6|12.7|12.8|12.9) ]]; then
-    cuda_version=12.0
+  # Use CUDA 12.2 for all versions greater or equal to 12.2 for now
+  if [[ "$cuda_version" == @(12.3|12.4|12.5|12.6|12.7|12.8|12.9) ]]; then
+    cuda_version=12.2
   fi
   # Set cuda version suffix to docker image name
   echo "Running $image docker image with CUDA $cuda_version"

From 0d75c1042bf87e45684bcb3679cfc9f39a87e589 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sat, 2 Mar 2024 23:14:34 -0500
Subject: [PATCH 319/344] Fix NCCL tear down issue, update docker pre-build
 cuda version list (#1318)

---
 .github/workflows/docker-build-skip.yml |  2 +-
 .github/workflows/docker-build.yml      | 12 ++++++------
 README.md                               |  2 +-
 docker/README.md                        |  6 +++---
 docker/pull.sh                          |  4 ++--
 src/runtime/model.cc                    |  2 ++
 6 files changed, 15 insertions(+), 13 deletions(-)

diff --git a/.github/workflows/docker-build-skip.yml b/.github/workflows/docker-build-skip.yml
index 02b703467c..e5d7de858f 100644
--- a/.github/workflows/docker-build-skip.yml
+++ b/.github/workflows/docker-build-skip.yml
@@ -28,7 +28,7 @@ jobs:
     runs-on: ubuntu-latest
     strategy:
       matrix:
-        cuda_version: ["11.1", "11.2", "11.3", "11.4", "11.5", "11.6", "11.7", "11.8", "12.0"]
+        cuda_version: ["11.1", "11.6", "11.7", "11.8", "12.0", "12.1", "12.2"]
       fail-fast: false
     steps:
       - run: 'echo "No docker-build required"'
diff --git a/.github/workflows/docker-build.yml b/.github/workflows/docker-build.yml
index 05c94c7e84..54805cc325 100644
--- a/.github/workflows/docker-build.yml
+++ b/.github/workflows/docker-build.yml
@@ -103,27 +103,27 @@ jobs:
     runs-on: ubuntu-20.04
     strategy:
       matrix:
-        cuda_version: ["11.1", "11.2", "11.3", "11.4", "11.5", "11.6", "11.7", "11.8", "12.0"]
+        cuda_version: ["11.1", "11.6", "11.7", "11.8", "12.0", "12.1", "12.2"]
       fail-fast: false
     env:
       FF_GPU_BACKEND: "cuda"
       cuda_version: ${{ matrix.cuda_version }}
     steps:
       - name: Checkout Git Repository
-        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.cuda_version == '11.8' }}
+        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.cuda_version == '12.0' }}
         uses: actions/checkout@v3
         with:
           submodules: recursive
 
       - name: Free additional space on runner
-        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.cuda_version == '11.8' }}
+        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.cuda_version == '12.0' }}
         run: .github/workflows/helpers/free_space_on_runner.sh
 
       - name: Build Docker container
-        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.cuda_version == '11.8' }}
+        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.cuda_version == '12.0' }}
         env:
           deploy_needed: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
-          build_needed: ${{ matrix.cuda_version == '11.8' }}
+          build_needed: ${{ matrix.cuda_version == '12.0' }}
         run: |
           # On push to inference, build for all compatible architectures, so that we can publish 
           # a pre-built general-purpose image. On all other cases, only build for one architecture
@@ -137,7 +137,7 @@ jobs:
           fi
 
       - name: Check availability of flexflow modules in Python
-        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.cuda_version == '11.8' }}
+        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.cuda_version == '12.0' }}
         run: docker run --entrypoint /bin/bash flexflow-${FF_GPU_BACKEND}-${cuda_version}:latest -c "export LD_LIBRARY_PATH=/usr/local/cuda/lib64/stubs:$LD_LIBRARY_PATH; sudo ln -s /usr/local/cuda/lib64/stubs/libcuda.so /usr/local/cuda/lib64/stubs/libcuda.so.1; python -c 'import flexflow.core; import flexflow.serve as ff; exit()'"
 
       - name: Publish Docker environment image (on push to inference)
diff --git a/README.md b/README.md
index 318d2e38da..95790a90e5 100644
--- a/README.md
+++ b/README.md
@@ -35,7 +35,7 @@ If you run into any issue during the install, or if you would like to use the C+
 docker run --gpus all -it --rm --shm-size=8g ghcr.io/flexflow/flexflow-cuda-12.0:latest
 ```
 
-To download a Docker container for a backend other than CUDA v12.0, you can replace the `cuda-12.0` suffix with any of the following backends: `cuda-11.1`, `cuda-11.2`, `cuda-11.3`, `cuda-11.4`, `cuda-11.5`, `cuda-11.6`, `cuda-11.7`, `cuda-11.8`, and `hip_rocm-5.3`, `hip_rocm-5.4`, `hip_rocm-5.5`, `hip_rocm-5.6`). More info on the Docker images, with instructions to build a new image from source, or run with additional configurations, can be found [here](./docker/README.md).
+To download a Docker container for a backend other than CUDA v12.0, you can replace the `cuda-12.0` suffix with any of the following backends: `cuda-11.1`, `cuda-11.6`, `cuda-11.7`, `cuda-11.8`, `cuda-12.0`, `cuda-12.1`, `cuda-12.1`, and `hip_rocm-5.3`, `hip_rocm-5.4`, `hip_rocm-5.5`, `hip_rocm-5.6`. More info on the Docker images, with instructions to build a new image from source, or run with additional configurations, can be found [here](./docker/README.md).
 
 ### Build from source
 
diff --git a/docker/README.md b/docker/README.md
index b7ec7c3631..010aadf762 100644
--- a/docker/README.md
+++ b/docker/README.md
@@ -7,7 +7,7 @@ You can build and run the FlexFlow Docker images on any machine, but if you want
 ## Downloading a pre-built package
 The fastest way to run FlexFlow is to use one of the pre-built containers, which we update for each commit to the `inference` branch (the `inference` branch is currently ahead of the `master` branch). The available containers are the following, and can be found [at this link](https://github.com/orgs/flexflow/packages?repo_name=FlexFlow):
 
-* `flexflow`: the pre-built version of FlexFlow. We currently publish four version targeting AMD GPUs (ROCm versions: 5.3, 5.4, 5.5 and 5.6 ), and several versions for CUDA GPUs (CUDA versions: 11.1, 11.2, 11.3, 11.4, 11.5, 11.6, 11.7, 11.8 and 12.0). The CUDA images are named `flexflow-<GPU backend>-<GPU software version>`, e.g. [flexflow-hip_rocm-5.6](https://github.com/flexflow/FlexFlow/pkgs/container/flexflow-hip_rocm-5.6) or [flexflow-cuda-12.0](https://github.com/orgs/flexflow/packages/container/package/flexflow-cuda-12.0) or 
+* `flexflow`: the pre-built version of FlexFlow. We currently publish four version targeting AMD GPUs (ROCm versions: 5.3, 5.4, 5.5 and 5.6 ), and several versions for CUDA GPUs (CUDA versions: 11.1, 11.6, 11.7, 11.8, 12.0, 12.1, and 12.2). The CUDA images are named `flexflow-<GPU backend>-<GPU software version>`, e.g. [flexflow-hip_rocm-5.6](https://github.com/flexflow/FlexFlow/pkgs/container/flexflow-hip_rocm-5.6) or [flexflow-cuda-12.0](https://github.com/orgs/flexflow/packages/container/package/flexflow-cuda-12.0) or 
 * `flexflow-environment`: this is the base layer for `flexflow`. The packages are used in CI or for internal use, and contain all the dependencies needed to build/run Flexflow. You may find them useful if you want to build FlexFlow yourself. We also publish four version of `flexflow-environment` for AMD GPUs and, for NVIDIA GPUs, one for each CUDA version in the list above. The naming convention is similar, too. For example, the `flexflow-environment` image for CUDA 12.0 is tagged [flexflow-environment-cuda-12.0](https://github.com/orgs/flexflow/packages/container/package/flexflow-environment-cuda-12.0).
 
 The easiest way to download any of the Docker containers above is to call:
@@ -19,7 +19,7 @@ The easiest way to download any of the Docker containers above is to call:
 where `CONTAINER_NAME` is `flexflow` (or `flexflow-environment`). By default, the script will assume a NVIDIA backend and attempt to detect the CUDA version on your machine, to download the relevant container. If your machine has AMD GPUs, or no GPUs, or if you want to specify  the CUDA/ROCM version to download, set the environment variables below:
 
 * `FF_GPU_BACKEND` (supported options: `cuda`, `hip_rocm`) to specify the GPU backend of the Docker container to be downloaded.
-* `cuda_version` (supported options: 11.1, 11.2, 11.3, 11.4, 11.5, 11.6, 11.7, 11.8 and 12.0) to specify the CUDA version, when using a `cuda` backend. If `FF_GPU_BACKEND` is set to `hip_rocm`, the `cuda_version` env will be ignored
+* `cuda_version` (supported options: 11.1, 11.6, 11.7, 11.8, 12.0, 12.1 and 12.2) to specify the CUDA version, when using a `cuda` backend. If `FF_GPU_BACKEND` is set to `hip_rocm`, the `cuda_version` env will be ignored
 * `hip_version` (supported options: 5.3, 5.4, 5.5, 5.6) to specify the ROCm version, when using a HIP backend. If `FF_GPU_BACKEND` is set to `cuda`, the `hip_version` env will be ignored.
 
 
@@ -44,7 +44,7 @@ If you only want to build the `flexflow-environment` image (the base layers of t
 After having either built or downloaded a Docker container by following the instructions above, you can run it with the following command (image name argument of the run script can be omitted). Once again, you can set the `FF_GPU_BACKEND`, `cuda_version` and `hip_version` optional environment variables to run the docker image with the desired GPU backend and CUDA/HIP version:
 
 * `FF_GPU_BACKEND` (supported options: `cuda`, `hip_rocm`) to specify the GPU backend of the Docker container to be run.
-* `cuda_version` (supported options: 11.1, 11.2, 11.3, 11.4, 11.5, 11.6, 11.7, 11.8 and 12.0) to specify the CUDA version, when using a `cuda` backend. If `FF_GPU_BACKEND` is set to `hip_rocm`, the `cuda_version` env will be ignored
+* `cuda_version` (supported options: 11.1, 11.6, 11.7, 11.8, 12.0, 12.1, 12.2) to specify the CUDA version, when using a `cuda` backend. If `FF_GPU_BACKEND` is set to `hip_rocm`, the `cuda_version` env will be ignored
 * `hip_version` (supported options: 5.3, 5.4, 5.5, 5.6) to specify the ROCm version, when using a HIP backend. If `FF_GPU_BACKEND` is set to `cuda`, the `hip_version` env will be ignored.
 
 Leaving these variables unset will assume a GPU backend, and instruct the script to autodetect the CUDA version installed on the current machine and run the Docker container with it if available.
diff --git a/docker/pull.sh b/docker/pull.sh
index 27bf245c12..f641e1a591 100755
--- a/docker/pull.sh
+++ b/docker/pull.sh
@@ -45,8 +45,8 @@ if [[ "${FF_GPU_BACKEND}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; the
     fi
   fi
   # Check that CUDA version is supported
-  if [[ "$cuda_version" != @(11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0|12.1|12.2) ]]; then
-    echo "cuda_version is not supported, please choose among {11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0|12.1|12.2}"
+  if [[ "$cuda_version" != @(11.1|11.6|11.7|11.8|12.0|12.1|12.2) ]]; then
+    echo "cuda_version is not available for download, please choose among {11.1|11.6|11.7|11.8|12.0|12.1|12.2}"
     exit 1
   fi
   # Use CUDA 12.2 for all versions greater or equal to 12.2 for now
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 440ae19047..40f758282c 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -612,7 +612,9 @@ void Op::finish_nccl_comms_task(Task const *task,
                                 Context ctx,
                                 Runtime *runtime) {
   ncclComm_t comm = *((ncclComm_t *)task->local_args);
+#if (NCCL_MAJOR == 2) && (NCCL_MINOR >= 14)
   checkNCCL(ncclCommFinalize(comm));
+#endif
   checkNCCL(ncclCommDestroy(comm));
 }
 #endif

From ea31426f76fd4bd4709fd774becb3b303916e2be Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sat, 9 Mar 2024 21:40:05 +0000
Subject: [PATCH 320/344] add expansion config param in specinfer

---
 inference/spec_infer/spec_infer.cc | 15 ++++++++++++---
 1 file changed, 12 insertions(+), 3 deletions(-)

diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 7578721dd0..5d584de1ff 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -62,7 +62,8 @@ void parse_input_args(char **argv,
                       bool &verbose,
                       int &max_requests_per_batch,
                       int &max_tokens_per_batch,
-                      int &max_sequence_length) {
+                      int &max_sequence_length,
+                      int &expansion_degree) {
   for (int i = 1; i < argc; i++) {
     // llm model name
     if (!strcmp(argv[i], "-llm-model")) {
@@ -117,6 +118,10 @@ void parse_input_args(char **argv,
       max_sequence_length = std::stoi(argv[++i]);
       continue;
     }
+    if (!strcmp(argv[i], "--expansion-degree")) {
+      expansion_degree = std::stoi(argv[++i]);
+      continue;
+    }
   }
   if (paths.cache_folder_path.empty()) {
     paths.cache_folder_path = "~/.cache/flexflow";
@@ -270,6 +275,7 @@ void FlexFlow::top_level_task(Task const *task,
   int max_requests_per_batch = 16;
   int max_tokens_per_batch = 256;
   int max_sequence_length = 1024;
+  int expansion_degree = 3;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
   char **argv = command_args.argv;
@@ -282,7 +288,8 @@ void FlexFlow::top_level_task(Task const *task,
                    verbose,
                    max_requests_per_batch,
                    max_tokens_per_batch,
-                   max_sequence_length);
+                   max_sequence_length,
+                   expansion_degree);
 
   get_model_meta(file_paths, model_metadata, use_full_precision);
 
@@ -304,7 +311,9 @@ void FlexFlow::top_level_task(Task const *task,
   rm->register_output_filepath(file_paths.output_file_path);
 
   // first decoding step: 3 results
-  rm->push_spec_infer_tree_width(3);
+  if (expansion_degree != -1) {
+    rm->push_spec_infer_tree_width(expansion_degree);
+  }
 
   // Create LLM model
   FFModel tree_model(ffconfig, ffconfig.cpu_offload);

From e03dec04c2949fc79bfcc7f49b99b624ca100026 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 11 Mar 2024 23:28:39 +0000
Subject: [PATCH 321/344] parametrize max_spec_tree_token_num

---
 include/flexflow/batch_config.h              |  1 +
 include/flexflow/flexflow_c.h                |  3 +++
 include/flexflow/request_manager.h           |  3 +++
 inference/spec_infer/spec_infer.cc           |  2 ++
 python/flexflow/core/flexflow_cffi.py        |  4 +++
 python/flexflow/serve/models/base.py         |  6 ++---
 python/flexflow/serve/models/falcon.py       | 26 +++++++++++--------
 python/flexflow/serve/models/llama.py        | 27 ++++++++++++--------
 python/flexflow/serve/models/mpt.py          | 27 ++++++++++++--------
 python/flexflow/serve/models/opt.py          | 26 +++++++++++--------
 python/flexflow/serve/models/starcoder.py    | 27 ++++++++++++--------
 python/flexflow/serve/serve.py               | 17 ++++++++----
 src/c/flexflow_c.cc                          |  8 ++++++
 src/ops/inc_multihead_self_attention.cu      | 10 ++++++--
 src/ops/spec_inc_multihead_self_attention.cu | 16 ++++++++----
 src/ops/tree_inc_multihead_self_attention.cu | 13 +++++-----
 src/runtime/batch_config.cc                  |  4 +++
 src/runtime/request_manager.cc               | 15 ++++++++++-
 18 files changed, 160 insertions(+), 75 deletions(-)

diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 5c126293cf..009d1c250a 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -46,6 +46,7 @@ class BatchConfig {
   static int max_requests_per_batch();
   static int max_tokens_per_batch();
   static int max_verify_tokens_per_batch();
+  static int max_spec_tree_token_num();
   static int max_sequence_length();
   friend std::ostream &operator<<(std::ostream &os, BatchConfig const &bc);
   void print() const;
diff --git a/include/flexflow/flexflow_c.h b/include/flexflow/flexflow_c.h
index cab3d14ea7..0b74b7fce4 100644
--- a/include/flexflow/flexflow_c.h
+++ b/include/flexflow/flexflow_c.h
@@ -972,6 +972,9 @@ void flexflow_request_manager_set_max_requests_per_batch(
 void flexflow_request_manager_set_max_tokens_per_batch(
     flexflow_request_manager_t handle_, int max_num_tokens);
 
+void flexflow_request_manager_set_max_spec_tree_token_num(
+    flexflow_request_manager_t handle_, int max_num_tokens);
+
 void flexflow_request_manager_set_max_sequence_length(
     flexflow_request_manager_t handle_, int max_seq_length);
 
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index 4763eb1ef3..a38a3b2671 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -114,6 +114,8 @@ class RequestManager {
   int get_max_requests_per_batch();
   void set_max_tokens_per_batch(int max_num_tokens);
   int get_max_tokens_per_batch();
+  void set_max_spec_tree_token_num(int max_num_tokens);
+  int get_max_spec_tree_token_num();
   int get_max_verify_tokens_per_batch();
   void set_max_sequence_length(int max_seq_length);
   void push_spec_infer_tree_width(int tree_width);
@@ -259,6 +261,7 @@ class RequestManager {
   // configuration parameters
   int max_requests_per_batch;
   int max_tokens_per_batch;
+  int max_spec_tree_token_num;
   int max_sequence_length;
   Status request_manager_status;
 
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 5d584de1ff..36d54eee64 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -275,6 +275,7 @@ void FlexFlow::top_level_task(Task const *task,
   int max_requests_per_batch = 16;
   int max_tokens_per_batch = 256;
   int max_sequence_length = 1024;
+  int max_spec_tree_token_num = 20;
   int expansion_degree = 3;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
@@ -303,6 +304,7 @@ void FlexFlow::top_level_task(Task const *task,
   RequestManager *rm = RequestManager::get_request_manager();
   rm->set_max_requests_per_batch(max_requests_per_batch);
   rm->set_max_tokens_per_batch(max_tokens_per_batch);
+  rm->set_max_spec_tree_token_num(max_spec_tree_token_num);
   rm->set_max_sequence_length(max_sequence_length);
   rm->register_tokenizer(model_metadata.llm_model_type,
                          model_metadata.bos_token_id,
diff --git a/python/flexflow/core/flexflow_cffi.py b/python/flexflow/core/flexflow_cffi.py
index d6f84833be..14cf4eebf7 100644
--- a/python/flexflow/core/flexflow_cffi.py
+++ b/python/flexflow/core/flexflow_cffi.py
@@ -4200,6 +4200,10 @@ def set_max_tokens_per_batch(self, max_tokens):
         return ffc().flexflow_request_manager_set_max_tokens_per_batch(
             self.handle, max_tokens)
     
+    def set_max_spec_tree_token_num(self, max_tokens):
+        return ffc().flexflow_request_manager_set_max_spec_tree_token_num(
+            self.handle, max_tokens)
+    
     def set_max_sequence_length(self, max_length):
         return ffc().flexflow_request_manager_set_max_sequence_length(
             self.handle, max_length)
diff --git a/python/flexflow/serve/models/base.py b/python/flexflow/serve/models/base.py
index 025008ec78..e7f3914037 100644
--- a/python/flexflow/serve/models/base.py
+++ b/python/flexflow/serve/models/base.py
@@ -21,9 +21,9 @@ def __init__(
         ffconfig,
         hf_config,
         data_type,
-        #max_batch_size=1,
-        #max_seq_length=256,
-        #max_tokens_per_batch=64,
+        # max_batch_size=1,
+        # max_seq_length=256,
+        # max_tokens_per_batch=64,
         weights_filepath="",
         tokenizer_filepath="",
     ):
diff --git a/python/flexflow/serve/models/falcon.py b/python/flexflow/serve/models/falcon.py
index e9cd789bcc..7a55da26ef 100644
--- a/python/flexflow/serve/models/falcon.py
+++ b/python/flexflow/serve/models/falcon.py
@@ -19,11 +19,11 @@
 
 class FalconConfig:
     def __init__(self, hf_config):
-        #self.max_seq_len = 256
-        #self.max_num_tokens = 64
+        # self.max_seq_len = 256
+        # self.max_num_tokens = 64
         self.max_beam_width = 1
         self.max_beam_depth = 8
-        self.max_spec_tree_token_num = 64
+        self.max_spec_tree_token_num = 20
         self.bias = hf_config.bias
         self.hidden_size = hf_config.hidden_size
         self.layer_norm_epsilon = hf_config.layer_norm_epsilon
@@ -54,8 +54,8 @@ def __init__(
         ffconfig,
         hf_config,
         data_type,
-        #max_batch_size=1,
-        #max_seq_length=256,
+        # max_batch_size=1,
+        # max_seq_length=256,
         max_tokens_per_batch,
         weights_filepath="",
         tokenizer_filepath="",
@@ -63,15 +63,17 @@ def __init__(
         self.mode = mode
         self.generation_config = generation_config
         self.ffconfig = ffconfig
-        #self.max_batch_size = max_batch_size
+        # self.max_batch_size = max_batch_size
         self.data_type = data_type
         self.falcon_config = FalconConfig(hf_config)
-        #self.falcon_config.max_seq_length = max_seq_length
-        #self.falcon_config.max_num_tokens = max_tokens_per_batch
+        # self.falcon_config.max_seq_length = max_seq_length
+        # self.falcon_config.max_num_tokens = max_tokens_per_batch
         self.weights_filepath = weights_filepath
         self.tokenizer_filepath = tokenizer_filepath
         self.maxint = 2**31 - 1
-        max_verify_tokens_per_batch = max_tokens_per_batch + self.falcon_config.max_spec_tree_token_num
+        max_verify_tokens_per_batch = (
+            max_tokens_per_batch + self.falcon_config.max_spec_tree_token_num
+        )
 
         # Sanity checks
         if self.falcon_config.hidden_size % self.falcon_config.n_head != 0:
@@ -86,7 +88,11 @@ def __init__(
                 f"Number of q attention heads ({self.falcon_config.n_head}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
             )
 
-        self.build_model(max_tokens_per_batch if self.mode == InferenceMode.INC_DECODING_MODE else max_verify_tokens_per_batch)
+        self.build_model(
+            max_tokens_per_batch
+            if self.mode == InferenceMode.INC_DECODING_MODE
+            else max_verify_tokens_per_batch
+        )
 
     def build_model(self, max_tokens_per_batch):
         ffmodel = FFModel(self.ffconfig)
diff --git a/python/flexflow/serve/models/llama.py b/python/flexflow/serve/models/llama.py
index 900ab48bcd..6b33030f62 100644
--- a/python/flexflow/serve/models/llama.py
+++ b/python/flexflow/serve/models/llama.py
@@ -19,11 +19,11 @@
 
 class LLAMAConfig:
     def __init__(self, hf_config):
-        #self.max_seq_len = 256
-        #self.max_num_tokens = 64
+        # self.max_seq_len = 256
+        # self.max_num_tokens = 64
         self.max_beam_width = 1
         self.max_beam_depth = 8
-        self.max_spec_tree_token_num = 64
+        self.max_spec_tree_token_num = 20
         self.num_hidden_layers = hf_config.num_hidden_layers
         self.vocab_size = hf_config.vocab_size
         self.hidden_size = hf_config.hidden_size
@@ -46,8 +46,8 @@ def __init__(
         ffconfig,
         hf_config,
         data_type,
-        #max_batch_size=1,
-        #max_seq_length=256,
+        # max_batch_size=1,
+        # max_seq_length=256,
         max_tokens_per_batch,
         weights_filepath="",
         tokenizer_filepath="",
@@ -55,16 +55,17 @@ def __init__(
         self.mode = mode
         self.generation_config = generation_config
         self.ffconfig = ffconfig
-        #self.max_batch_size = max_batch_size
+        # self.max_batch_size = max_batch_size
         self.data_type = data_type
         self.llama_config = LLAMAConfig(hf_config)
-        #self.llama_config.max_seq_length = max_seq_length
-        #self.llama_config.max_num_tokens = max_tokens_per_batch
+        # self.llama_config.max_seq_length = max_seq_length
+        # self.llama_config.max_num_tokens = max_tokens_per_batch
         self.weights_filepath = weights_filepath
         self.tokenizer_filepath = tokenizer_filepath
         self.maxint = 2**31 - 1
-        max_verify_tokens_per_batch = max_tokens_per_batch + self.llama_config.max_spec_tree_token_num
-    
+        max_verify_tokens_per_batch = (
+            max_tokens_per_batch + self.llama_config.max_spec_tree_token_num
+        )
 
         # Sanity checks
         if self.llama_config.hidden_size % self.llama_config.num_attention_heads != 0:
@@ -84,7 +85,11 @@ def __init__(
                 f"Number of attention heads ({self.llama_config.num_attention_heads}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
             )
 
-        self.build_model(max_tokens_per_batch if self.mode == InferenceMode.INC_DECODING_MODE else max_verify_tokens_per_batch)
+        self.build_model(
+            max_tokens_per_batch
+            if self.mode == InferenceMode.INC_DECODING_MODE
+            else max_verify_tokens_per_batch
+        )
 
     def build_model(self, max_tokens_per_batch):
         ffmodel = FFModel(self.ffconfig)
diff --git a/python/flexflow/serve/models/mpt.py b/python/flexflow/serve/models/mpt.py
index c0f995bf22..92867fd498 100644
--- a/python/flexflow/serve/models/mpt.py
+++ b/python/flexflow/serve/models/mpt.py
@@ -19,11 +19,11 @@
 
 class MPTConfig:
     def __init__(self, hf_config):
-        #self.max_seq_len = 256
-        #self.max_num_tokens = 64
+        # self.max_seq_len = 256
+        # self.max_num_tokens = 64
         self.max_beam_width = 1
         self.max_beam_depth = 8
-        self.max_spec_tree_token_num = 64
+        self.max_spec_tree_token_num = 20
         self.hidden_size = hf_config.d_model
         self.n_heads = hf_config.n_heads
         self.n_layers = hf_config.n_layers
@@ -41,8 +41,8 @@ def __init__(
         ffconfig,
         hf_config,
         data_type,
-        #max_batch_size=1,
-        #max_seq_length=256,
+        # max_batch_size=1,
+        # max_seq_length=256,
         max_tokens_per_batch,
         weights_filepath="",
         tokenizer_filepath="",
@@ -50,16 +50,17 @@ def __init__(
         self.mode = mode
         self.generation_config = generation_config
         self.ffconfig = ffconfig
-        #self.max_batch_size = max_batch_size
+        # self.max_batch_size = max_batch_size
         self.data_type = data_type
         self.mpt_config = MPTConfig(hf_config)
-        #self.mpt_config.max_seq_length = max_seq_length
-        #self.mpt_config.max_num_tokens = max_tokens_per_batch
+        # self.mpt_config.max_seq_length = max_seq_length
+        # self.mpt_config.max_num_tokens = max_tokens_per_batch
         self.weights_filepath = weights_filepath
         self.tokenizer_filepath = tokenizer_filepath
         self.maxint = 2**31 - 1
-        max_verify_tokens_per_batch = max_tokens_per_batch + self.mpt_config.max_spec_tree_token_num
-
+        max_verify_tokens_per_batch = (
+            max_tokens_per_batch + self.mpt_config.max_spec_tree_token_num
+        )
 
         # Sanity checks
         if self.mpt_config.hidden_size % self.mpt_config.n_heads != 0:
@@ -75,7 +76,11 @@ def __init__(
             raise ValueError(
                 f"Number of attention heads ({self.mpt_config.n_heads}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
             )
-        self.build_model(max_tokens_per_batch if self.mode == InferenceMode.INC_DECODING_MODE else max_verify_tokens_per_batch)
+        self.build_model(
+            max_tokens_per_batch
+            if self.mode == InferenceMode.INC_DECODING_MODE
+            else max_verify_tokens_per_batch
+        )
 
     def build_model(self, max_tokens_per_batch):
         ffmodel = FFModel(self.ffconfig)
diff --git a/python/flexflow/serve/models/opt.py b/python/flexflow/serve/models/opt.py
index dc3f841a5a..b715f5f35e 100644
--- a/python/flexflow/serve/models/opt.py
+++ b/python/flexflow/serve/models/opt.py
@@ -19,11 +19,11 @@
 
 class OPTConfig:
     def __init__(self, hf_config):
-        #self.max_seq_len = 256
-        #self.max_num_tokens = 64
+        # self.max_seq_len = 256
+        # self.max_num_tokens = 64
         self.max_beam_width = 1
         self.max_beam_depth = 8
-        self.max_spec_tree_token_num = 64
+        self.max_spec_tree_token_num = 20
         self.do_layer_norm_before = hf_config.do_layer_norm_before
         self.dropout = hf_config.dropout
         self.enable_bias = hf_config.enable_bias
@@ -47,8 +47,8 @@ def __init__(
         ffconfig,
         hf_config,
         data_type,
-        #max_batch_size=1,
-        #max_seq_length=256,
+        # max_batch_size=1,
+        # max_seq_length=256,
         max_tokens_per_batch,
         weights_filepath="",
         tokenizer_filepath="",
@@ -56,15 +56,17 @@ def __init__(
         self.mode = mode
         self.generation_config = generation_config
         self.ffconfig = ffconfig
-        #self.max_batch_size = max_batch_size
+        # self.max_batch_size = max_batch_size
         self.data_type = data_type
         self.opt_config = OPTConfig(hf_config)
-        #self.opt_config.max_seq_length = max_seq_length
-        #self.opt_config.max_num_tokens = max_tokens_per_batch
+        # self.opt_config.max_seq_length = max_seq_length
+        # self.opt_config.max_num_tokens = max_tokens_per_batch
         self.weights_filepath = weights_filepath
         self.tokenizer_filepath = tokenizer_filepath
         self.maxint = 2**31 - 1
-        max_verify_tokens_per_batch = max_tokens_per_batch + self.opt_config.max_spec_tree_token_num
+        max_verify_tokens_per_batch = (
+            max_tokens_per_batch + self.opt_config.max_spec_tree_token_num
+        )
 
         # Sanity checks
         if self.opt_config.hidden_size % self.opt_config.num_attention_heads != 0:
@@ -84,7 +86,11 @@ def __init__(
                 f"Number of attention heads ({self.opt_config.num_attention_heads}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
             )
 
-        self.build_model(max_tokens_per_batch if self.mode == InferenceMode.INC_DECODING_MODE else max_verify_tokens_per_batch)
+        self.build_model(
+            max_tokens_per_batch
+            if self.mode == InferenceMode.INC_DECODING_MODE
+            else max_verify_tokens_per_batch
+        )
 
     def build_model(self, max_tokens_per_batch):
         ffmodel = FFModel(self.ffconfig)
diff --git a/python/flexflow/serve/models/starcoder.py b/python/flexflow/serve/models/starcoder.py
index 4a6f191abd..37edaa4c40 100644
--- a/python/flexflow/serve/models/starcoder.py
+++ b/python/flexflow/serve/models/starcoder.py
@@ -19,11 +19,11 @@
 
 class STARCODERConfig:
     def __init__(self, hf_config):
-        #self.max_seq_len = 256
-        #self.max_num_tokens = 64
+        # self.max_seq_len = 256
+        # self.max_num_tokens = 64
         self.max_beam_width = 1
         self.max_beam_depth = 8
-        self.max_spec_tree_token_num = 64
+        self.max_spec_tree_token_num = 20
         self.dropout_p = hf_config.attn_pdrop
         self.hidden_size = hf_config.n_embd
         self.layer_norm_epsilon = hf_config.layer_norm_epsilon
@@ -45,8 +45,8 @@ def __init__(
         ffconfig,
         hf_config,
         data_type,
-        #max_batch_size=1,
-        #max_seq_length=256,
+        # max_batch_size=1,
+        # max_seq_length=256,
         max_tokens_per_batch,
         weights_filepath="",
         tokenizer_filepath="",
@@ -54,16 +54,17 @@ def __init__(
         self.mode = mode
         self.generation_config = generation_config
         self.ffconfig = ffconfig
-        #self.max_batch_size = max_batch_size
+        # self.max_batch_size = max_batch_size
         self.data_type = data_type
         self.starcoder_config = STARCODERConfig(hf_config)
-        #self.starcoder_config.max_seq_length = max_seq_length
-        #self.starcoder_config.max_num_tokens = max_tokens_per_batch
+        # self.starcoder_config.max_seq_length = max_seq_length
+        # self.starcoder_config.max_num_tokens = max_tokens_per_batch
         self.weights_filepath = weights_filepath
         self.tokenizer_filepath = tokenizer_filepath
         self.maxint = 2**31 - 1
-        max_verify_tokens_per_batch = max_tokens_per_batch + self.starcoder_config.max_spec_tree_token_num
-
+        max_verify_tokens_per_batch = (
+            max_tokens_per_batch + self.starcoder_config.max_spec_tree_token_num
+        )
 
         # Sanity checks
         if (
@@ -87,7 +88,11 @@ def __init__(
                 f"Number of attention heads ({self.starcoder_config.num_attention_heads}) is smaller, or not divisible by tensor parallelism degree ({self.ffconfig.tensor_parallelism_degree})"
             )
 
-        self.build_model(max_tokens_per_batch if self.mode == InferenceMode.INC_DECODING_MODE else max_verify_tokens_per_batch)
+        self.build_model(
+            max_tokens_per_batch
+            if self.mode == InferenceMode.INC_DECODING_MODE
+            else max_verify_tokens_per_batch
+        )
 
     def build_model(self, max_tokens_per_batch):
         ffmodel = FFModel(self.ffconfig)
diff --git a/python/flexflow/serve/serve.py b/python/flexflow/serve/serve.py
index 5c3cac9303..14555bfc12 100644
--- a/python/flexflow/serve/serve.py
+++ b/python/flexflow/serve/serve.py
@@ -186,9 +186,11 @@ def download_hf_weights_if_needed(self):
             os.path.expanduser(self.cache_path),
             "weights",
             self.model_name.lower(),
-            "full-precision"
-            if self.data_type == DataType.DT_FLOAT
-            else "half-precision",
+            (
+                "full-precision"
+                if self.data_type == DataType.DT_FLOAT
+                else "half-precision"
+            ),
         )
         if self.refresh_cache:
             print(
@@ -302,8 +304,6 @@ def compile(
     ):
         """Compile the LLM for inference and load the weights into memory
 
-        :param mode: The LLM inference mode (InferenceMode.INC_DECODING_MODE for incremental decoding, InferenceMode.BEAM_SEARCH_MODE for beam search, or InferenceMode.TREE_VERIFY_MODE for token tree verification), defaults to InferenceMode.INC_DECODING_MODE
-        :type mode: InferenceMode, optional
         :param generation_config: The GenerationConfig object with the configurations to use for sampling, defaults to GenerationConfig()
         :type generation_config: GenerationConfig, optional
         :param max_requests_per_batch: The maximum batch size to allow, defaults to 1
@@ -372,6 +372,13 @@ def compile(
         # Create file data loader, load weights into tensors
         model_configs = self.config_class(self.hf_config)
 
+        self.rm.set_max_spec_tree_token_num(
+            self.model_configs.max_spec_tree_token_num
+            if "max_spec_tree_token_num"
+            in self.model_configs.max_spec_tree_token_num.__dict__
+            else 20
+        )
+
         self.fileloader = FileDataLoader(
             self.weights_path,
             model_configs.num_attention_heads,
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index 9ad58695ad..5714c8fe3d 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -2582,6 +2582,14 @@ void flexflow_request_manager_set_max_tokens_per_batch(
   DEBUG_PRINT("[RequestManager] set max_tokens_per_batch %d", max_num_tokens);
 }
 
+void flexflow_request_manager_set_max_spec_tree_token_num(
+    flexflow_request_manager_t handle_, int max_num_tokens) {
+  RequestManager *handle = FFCObjectWrapper::unwrap(handle_);
+  handle->set_max_spec_tree_token_num(max_num_tokens);
+  DEBUG_PRINT("[RequestManager] set max_spec_tree_token_num %d",
+              max_num_tokens);
+}
+
 void flexflow_request_manager_set_max_sequence_length(
     flexflow_request_manager_t handle_, int max_seq_length) {
   RequestManager *handle = FFCObjectWrapper::unwrap(handle_);
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index 42933cee27..a0d31bb6ef 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -1125,6 +1125,12 @@ void compute_attention_kernel_prompt(IncMultiHeadSelfAttentionMeta const *m,
     }
     tokens_previous_requests += num_new_tokens;
   }
+  if (tokens_previous_requests != (num_tokens - bc->num_generation_tokens)) {
+    bc->print();
+    printf("tokens_previous_requests: %i\n", tokens_previous_requests);
+    printf("num_tokens: %i\n", num_tokens);
+    printf("bc->num_generation_tokens: %i\n", bc->num_generation_tokens);
+  }
   assert(tokens_previous_requests == (num_tokens - bc->num_generation_tokens));
 }
 
@@ -1352,11 +1358,11 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
         key_cache_size = num_q_heads * kProjSize *
                          BeamSearchBatchConfig::max_requests_per_batch() *
                          (BatchConfig::max_sequence_length() +
-                          BatchConfig::MAX_SPEC_TREE_TOKEN_NUM);
+                          BatchConfig::max_spec_tree_token_num());
         value_cache_size = num_q_heads * vProjSize *
                            BeamSearchBatchConfig::max_requests_per_batch() *
                            (BatchConfig::max_sequence_length() +
-                            BatchConfig::MAX_SPEC_TREE_TOKEN_NUM);
+                            BatchConfig::max_spec_tree_token_num());
         break;
       }
       default:
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index 2d80ed2221..a00ea9c95f 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -382,7 +382,7 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
         m->vProjSize,
         num_tokens,
         BatchConfig::max_sequence_length() +
-            BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,
+            BatchConfig::max_spec_tree_token_num(),
         /*root*/ curr_depth == 0,
         m->hidden_size);
   }
@@ -392,7 +392,7 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
     DT, Dh, Dh_MAX, THDS_PER_KEY, THREADS_PER_VALUE, THDS_PER_BLOCK, stream)   \
   smem_sz = smem_size_in_bytes<DT>(m->qProjSize,                               \
                                    BatchConfig::max_sequence_length() +        \
-                                       BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,   \
+                                       BatchConfig::max_spec_tree_token_num(), \
                                    THREADS_PER_VALUE,                          \
                                    THDS_PER_BLOCK);                            \
   compute_spec_inc_attention_kernel_generation_kernel<DT,                      \
@@ -408,7 +408,7 @@ void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
           output_ptr,                                                          \
           scale,                                                               \
           BatchConfig::max_sequence_length() +                                 \
-              BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,                            \
+              BatchConfig::max_spec_tree_token_num(),                          \
           m->qProjSize,                                                        \
           m->hidden_size,                                                      \
           m->request_infos,                                                    \
@@ -493,11 +493,11 @@ void compute_attention_kernel_prompt(SpecIncMultiHeadSelfAttentionMeta const *m,
   int kt_block_size = m->kProjSize;
   int kt_req_block_size = kt_block_size * m->num_q_heads *
                           (BatchConfig::max_sequence_length() +
-                           BatchConfig::MAX_SPEC_TREE_TOKEN_NUM);
+                           BatchConfig::max_spec_tree_token_num());
   int vt_block_size = m->vProjSize;
   int vt_req_block_size = vt_block_size * m->num_q_heads *
                           (BatchConfig::max_sequence_length() +
-                           BatchConfig::MAX_SPEC_TREE_TOKEN_NUM);
+                           BatchConfig::max_spec_tree_token_num());
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
@@ -695,6 +695,12 @@ void compute_attention_kernel_prompt(SpecIncMultiHeadSelfAttentionMeta const *m,
     tokens_prev_requests_squares += num_new_tokens * total_tokens;
   }
 
+  if (tokens_previous_requests != (num_tokens - bc->num_generation_tokens)) {
+    bc->print();
+    printf("tokens_previous_requests: %i\n", tokens_previous_requests);
+    printf("num_tokens: %i\n", num_tokens);
+    printf("bc->num_generation_tokens: %i\n", bc->num_generation_tokens);
+  }
   assert(tokens_previous_requests == (num_tokens - bc->num_generation_tokens));
 }
 
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index fc86e1498e..50c056c816 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -392,7 +392,7 @@ void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
         num_tokens_to_commit,
         m->num_active_tokens, // number of active tokens in previous batch
         BatchConfig::max_sequence_length() +
-            BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,
+            BatchConfig::max_spec_tree_token_num(),
         m->hidden_size);
   }
 }
@@ -528,11 +528,11 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
   int kt_block_size = m->kProjSize;
   int kt_req_block_size =
       kt_block_size * m->num_q_heads * BatchConfig::max_sequence_length() +
-      BatchConfig::MAX_SPEC_TREE_TOKEN_NUM;
+      BatchConfig::max_spec_tree_token_num();
   int vt_block_size = m->vProjSize;
   int vt_req_block_size =
       vt_block_size * m->num_q_heads * BatchConfig::max_sequence_length() +
-      BatchConfig::MAX_SPEC_TREE_TOKEN_NUM;
+      BatchConfig::max_spec_tree_token_num();
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
@@ -795,7 +795,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
     DT, Dh, Dh_MAX, THDS_PER_KEY, THDS_PER_VALUE, THDS_PER_BLOCK, stream)      \
   smem_size_in_bytes_tree<DT>(m->qProjSize,                                    \
                               BatchConfig::max_sequence_length() +             \
-                                  BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,        \
+                                  BatchConfig::max_spec_tree_token_num(),      \
                               THDS_PER_VALUE,                                  \
                               THDS_PER_BLOCK,                                  \
                               bc,                                              \
@@ -813,7 +813,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
           output_ptr,                                                          \
           scale,                                                               \
           BatchConfig::max_sequence_length() +                                 \
-              BatchConfig::BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,               \
+              BatchConfig::BatchConfig::max_spec_tree_token_num(),             \
           BatchConfig::max_tokens_per_batch(),                                 \
           m->qProjSize,                                                        \
           m->hidden_size,                                                      \
@@ -847,7 +847,8 @@ void compute_attention_kernel_fused(TreeIncMultiHeadSelfAttentionMeta const *m,
       m->kProjSize,
       m->vProjSize,
       num_new_tokens,
-      BatchConfig::max_sequence_length() + BatchConfig::MAX_SPEC_TREE_TOKEN_NUM,
+      BatchConfig::max_sequence_length() +
+          BatchConfig::max_spec_tree_token_num(),
       m->hidden_size);
 
   dim3 grid(m->num_q_heads, bc->num_active_requests());
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index c432208eca..bd96dbb141 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -95,6 +95,10 @@ int BatchConfig::max_sequence_length() {
   return RequestManager::get_request_manager()->get_max_sequence_length();
 }
 
+int BatchConfig::max_spec_tree_token_num() {
+  return RequestManager::get_request_manager()->get_max_spec_tree_token_num();
+}
+
 std::ostream &operator<<(std::ostream &os, BatchConfig const &bc) {
   os << "@@@@@@@@@@@@@@ Batch Config (mode " << bc.get_mode()
      << ") @@@@@@@@@@@@@@" << std::endl;
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 46e17d4fdc..f2d6cc0d4c 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -54,6 +54,7 @@ RequestManager::RequestManager()
   // ffmodel.compile()
   max_requests_per_batch = -1;
   max_tokens_per_batch = -1;
+  max_spec_tree_token_num = -1;
   max_sequence_length = -1;
 }
 
@@ -75,15 +76,27 @@ void RequestManager::set_max_tokens_per_batch(int max_num_tokens) {
   assert(max_tokens_per_batch <= BatchConfig::MAX_NUM_TOKENS);
 }
 
+void RequestManager::set_max_spec_tree_token_num(int max_num_tokens) {
+  assert(max_spec_tree_token_num == -1 ||
+         max_spec_tree_token_num == max_num_tokens);
+  max_spec_tree_token_num = max_num_tokens;
+  assert(max_spec_tree_token_num <= BatchConfig::MAX_SPEC_TREE_TOKEN_NUM);
+}
+
 int RequestManager::get_max_tokens_per_batch() {
   assert(max_tokens_per_batch > 0);
   return max_tokens_per_batch;
 }
 
+int RequestManager::get_max_spec_tree_token_num() {
+  assert(max_spec_tree_token_num > 0);
+  return max_spec_tree_token_num;
+}
+
 int RequestManager::get_max_verify_tokens_per_batch() {
   assert(max_tokens_per_batch > 0);
   return max_tokens_per_batch +
-         BatchConfig::MAX_SPEC_TREE_TOKEN_NUM * max_requests_per_batch;
+         max_spec_tree_token_num * max_requests_per_batch;
 }
 
 void RequestManager::set_max_sequence_length(int max_seq_length) {

From c85668066afabf804fa21bcc16595cf08233ec22 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 13 Mar 2024 19:46:25 +0000
Subject: [PATCH 322/344] fix

---
 inference/spec_infer/spec_infer.cc | 2 +-
 src/runtime/request_manager.cc     | 8 +++++---
 2 files changed, 6 insertions(+), 4 deletions(-)

diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 36d54eee64..3ff32ef3ea 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -275,7 +275,7 @@ void FlexFlow::top_level_task(Task const *task,
   int max_requests_per_batch = 16;
   int max_tokens_per_batch = 256;
   int max_sequence_length = 1024;
-  int max_spec_tree_token_num = 20;
+  int max_spec_tree_token_num = 23;
   int expansion_degree = 3;
 
   InputArgs const &command_args = HighLevelRuntime::get_input_args();
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index f2d6cc0d4c..16513e918a 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -1577,9 +1577,11 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
         }
 
         if (new_bc.num_tokens > get_max_verify_tokens_per_batch()) {
-          assert(false &&
-                 "Exceeding the space available in the TreeVerify batch");
-          break;
+          printf("Exceeding (%i) the space available (%i) in the TreeVerify "
+                 "batch\n",
+                 new_bc.num_tokens,
+                 get_max_verify_tokens_per_batch());
+          assert(false);
         }
 
         if (new_bc.requestsInfo[i].num_tokens_in_batch +

From 8d82c91a8417f88c95389206752beb9741f93259 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 14 Mar 2024 00:52:03 +0000
Subject: [PATCH 323/344] fix

---
 src/mapper/mapper.cc | 4 +++-
 1 file changed, 3 insertions(+), 1 deletion(-)

diff --git a/src/mapper/mapper.cc b/src/mapper/mapper.cc
index d46bfc2877..d7aac4e37c 100644
--- a/src/mapper/mapper.cc
+++ b/src/mapper/mapper.cc
@@ -501,7 +501,9 @@ void FFMapper::map_task(const MapperContext ctx,
   output.task_priority = 0;
   output.postmap_task = false;
   if (task.target_proc.address_space() != node_id) {
-    assert(false);
+    if (enable_control_replication) {
+      assert(false);
+    }
     output.target_procs.push_back(task.target_proc);
   } else if (task.target_proc.kind() == Processor::TOC_PROC) {
     output.target_procs.push_back(task.target_proc);

From 0479a64c66fc9002f7d674184da2e3a82e96a393 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 14 Mar 2024 03:56:41 +0000
Subject: [PATCH 324/344] fix

---
 inference/spec_infer/spec_infer.cc | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 3ff32ef3ea..b6c1e408cd 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -314,6 +314,8 @@ void FlexFlow::top_level_task(Task const *task,
 
   // first decoding step: 3 results
   if (expansion_degree != -1) {
+    rm->push_spec_infer_tree_width(1);
+    rm->push_spec_infer_tree_width(1);
     rm->push_spec_infer_tree_width(expansion_degree);
   }
 

From 5bd71236c76ac497466602550b1bc9de884fd1b3 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sat, 30 Mar 2024 14:09:26 -0400
Subject: [PATCH 325/344] run CI per commit only on inference branch

---
 .github/workflows/gpu-ci.yml | 21 ++-------------------
 1 file changed, 2 insertions(+), 19 deletions(-)

diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index 48dcda157e..7bdb6805a8 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -1,25 +1,8 @@
 name: "gpu-ci"
 on:
-  pull_request:
-    paths:
-      - "cmake/**"
-      - "config/**"
-      - "deps/**"
-      - "python/**"
-      - "setup.py"
-      - "include/**"
-      - "inference/**"
-      - "src/**"
-      - "tests/inference/**"
-      - "conda/flexflow.yml"
-      - ".github/workflows/gpu-ci.yml"
-      - "tests/cpp_gpu_tests.sh"
-      - "tests/inference_tests.sh"
-      - "tests/training_tests.sh"
-      - "tests/python_interface_test.sh"
   push:
     branches:
-      - "master"
+      - "inference"
     paths:
       - "cmake/**"
       - "config/**"
@@ -194,7 +177,7 @@ jobs:
       
       - name: Save inference output as an artifact
         if: always()
-        run: | 
+        run: |
           cd inference
           tar -zcvf output.tar.gz ./output
 

From e0a6e4fee228ca31a74e69dd84d73e01762214a1 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sat, 30 Mar 2024 14:29:47 -0400
Subject: [PATCH 326/344] fix

---
 python/flexflow/serve/serve.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/python/flexflow/serve/serve.py b/python/flexflow/serve/serve.py
index 14555bfc12..cbc4122897 100644
--- a/python/flexflow/serve/serve.py
+++ b/python/flexflow/serve/serve.py
@@ -375,7 +375,7 @@ def compile(
         self.rm.set_max_spec_tree_token_num(
             self.model_configs.max_spec_tree_token_num
             if "max_spec_tree_token_num"
-            in self.model_configs.max_spec_tree_token_num.__dict__
+            in self.model_configs.__dict__
             else 20
         )
 

From 1210256080072935fecd71dbf7cbfb31d9f99efa Mon Sep 17 00:00:00 2001
From: Zhuofu Chen <59316330+aetiurf@users.noreply.github.com>
Date: Sat, 6 Apr 2024 22:02:15 +0800
Subject: [PATCH 327/344] fix: 'model_configs' AttributeError (#1358)

---
 python/flexflow/serve/serve.py | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/python/flexflow/serve/serve.py b/python/flexflow/serve/serve.py
index cbc4122897..ac622b3337 100644
--- a/python/flexflow/serve/serve.py
+++ b/python/flexflow/serve/serve.py
@@ -373,9 +373,9 @@ def compile(
         model_configs = self.config_class(self.hf_config)
 
         self.rm.set_max_spec_tree_token_num(
-            self.model_configs.max_spec_tree_token_num
+            model_configs.max_spec_tree_token_num
             if "max_spec_tree_token_num"
-            in self.model_configs.__dict__
+            in model_configs.__dict__
             else 20
         )
 

From b4a639c8990f2d031ee4938f3e7dc8140e4eb324 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sun, 7 Apr 2024 23:26:53 -0400
Subject: [PATCH 328/344] Changes to support Perlmutter environment (#1360)

* .

* remove deadcode

* add benchmarking mode, initializing weights randomly

* better logging when running out of memory

* update

---------

Co-authored-by: Gabriele Oliaro <goliaro@login27.chn.perlmutter.nersc.gov>
---
 cmake/cuda.cmake                              |  15 ++-
 config/config.inc                             |  12 +-
 config/config.linux                           |  14 ++-
 include/flexflow/config.h                     |   2 +-
 inference/incr_decoding/incr_decoding.cc      |   4 +-
 inference/models/falcon.cc                    |  20 ----
 inference/models/llama.cc                     |  10 --
 inference/models/mpt.cc                       |  15 ---
 inference/models/opt.cc                       |  18 ---
 inference/models/starcoder.cc                 |  10 --
 inference/python/incr_decoding.py             |   3 +-
 inference/python/spec_infer.py                |   3 +-
 inference/spec_infer/spec_infer.cc            |   4 +-
 inference/utils/download_hf_model.py          |   4 +-
 python/flexflow/core/__init__.py              |   1 +
 python/flexflow/serve/__init__.py             |   8 ++
 src/mapper/mapper.cc                          |  46 ++++++--
 src/runtime/file_loader.cc                    | 109 ++++++++++--------
 src/runtime/model.cc                          |   8 +-
 .../python_test_configs/generate_configs.py   |   3 +-
 20 files changed, 159 insertions(+), 150 deletions(-)

diff --git a/cmake/cuda.cmake b/cmake/cuda.cmake
index 68e4ca07b1..45ecc1798b 100644
--- a/cmake/cuda.cmake
+++ b/cmake/cuda.cmake
@@ -13,8 +13,19 @@ if(CUDA_FOUND)
   # set cuda runtime and driver lib
   # override cublas and curand because the FindCUDA module may not find the correct libs  
   set(CUDADRV_LIBRARIES ${CUDA_TOOLKIT_ROOT_DIR}/lib64/stubs/libcuda${LIBEXT})
-  set(CUDA_CUBLAS_LIBRARIES ${CUDA_TOOLKIT_ROOT_DIR}/lib64/libcublas${LIBEXT})
-  set(CUDA_curand_LIBRARY ${CUDA_TOOLKIT_ROOT_DIR}/lib64/libcurand${LIBEXT})
+  if(CUBLAS_PATH)
+    set(CUBLAS_ROOT ${CUBLAS_PATH})
+  else()
+  set(CUBLAS_ROOT ${CUDA_TOOLKIT_ROOT_DIR})
+  endif()
+  set(CUDA_CUBLAS_LIBRARIES ${CUBLAS_ROOT}/lib64/libcublas${LIBEXT})
+  if(CURAND_PATH)
+    set(CURAND_ROOT ${CURAND_PATH})
+  else()
+  set(CURAND_ROOT ${CUDA_TOOLKIT_ROOT_DIR})
+  endif()
+  set(CUDA_curand_LIBRARY ${CURAND_ROOT}/lib64/libcurand${LIBEXT})
+  
   list(APPEND FLEXFLOW_EXT_LIBRARIES
     ${CUDADRV_LIBRARIES}
     ${CUDA_CUBLAS_LIBRARIES}
diff --git a/config/config.inc b/config/config.inc
index 1121c114c4..7d7b2db9cf 100644
--- a/config/config.inc
+++ b/config/config.inc
@@ -62,6 +62,16 @@ if [ -n "$CUDA_DIR" ]; then
   SET_CUDA_LIB_PATH="CUDA_PATH=${CUDA_PATH}"
 fi
 
+# set cublas dir
+if [ -n "$CUBLAS_DIR" ]; then
+  SET_CUBLAS="-DCUBLAS_PATH=${CUBLAS_DIR}"
+fi
+
+# set curand dir
+if [ -n "$CURAND_DIR" ]; then
+  SET_CURAND="-DCURAND_PATH=${CURAND_DIR}"
+fi
+
 # set cudnn dir
 if [ -n "$CUDNN_DIR" ]; then
   SET_CUDNN="-DCUDNN_PATH=${CUDNN_DIR}"
@@ -231,7 +241,7 @@ if [ -n "$FF_GPU_BACKEND" ]; then
   fi
 fi
 
-CMAKE_FLAGS="-DCUDA_USE_STATIC_CUDA_RUNTIME=OFF -DLegion_HIJACK_CUDART=OFF ${SET_CC} ${SET_CXX} ${SET_INSTALL_DIR} ${SET_INFERENCE_TESTS} ${SET_LIBTORCH_PATH} ${SET_BUILD} ${SET_CUDA_ARCH} ${SET_CUDA} ${SET_CUDNN} ${SET_HIP_ARCH} ${SET_PYTHON} ${SET_BUILD_LEGION_ONLY} ${SET_NCCL} ${SET_NCCL_DIR} ${SET_LEGION_NETWORKS} ${SET_UCX} ${SET_EXAMPLES} ${SET_INFERENCE_EXAMPLES} ${SET_USE_PREBUILT_LEGION} ${SET_USE_PREBUILT_NCCL} ${SET_USE_ALL_PREBUILT_LIBRARIES} ${SET_BUILD_UNIT_TESTS} ${SET_AVX2} ${SET_MAX_DIM} ${SET_LEGION_MAX_RETURN_SIZE} ${SET_ROCM_PATH} ${SET_FF_GPU_BACKEND}"
+CMAKE_FLAGS="-DCUDA_USE_STATIC_CUDA_RUNTIME=OFF -DLegion_HIJACK_CUDART=OFF ${SET_CC} ${SET_CXX} ${SET_INSTALL_DIR} ${SET_INFERENCE_TESTS} ${SET_LIBTORCH_PATH} ${SET_BUILD} ${SET_CUDA_ARCH} ${SET_CUDA} ${SET_CUBLAS} ${SET_CURAND} ${SET_CUDNN} ${SET_HIP_ARCH} ${SET_PYTHON} ${SET_BUILD_LEGION_ONLY} ${SET_NCCL} ${SET_NCCL_DIR} ${SET_LEGION_NETWORKS} ${SET_UCX} ${SET_EXAMPLES} ${SET_INFERENCE_EXAMPLES} ${SET_USE_PREBUILT_LEGION} ${SET_USE_PREBUILT_NCCL} ${SET_USE_ALL_PREBUILT_LIBRARIES} ${SET_BUILD_UNIT_TESTS} ${SET_AVX2} ${SET_MAX_DIM} ${SET_LEGION_MAX_RETURN_SIZE} ${SET_ROCM_PATH} ${SET_FF_GPU_BACKEND}"
 
 function run_cmake() {
 SRC_LOCATION=${SRC_LOCATION:=`dirname $0`/../}
diff --git a/config/config.linux b/config/config.linux
index 30edfa7dfe..acffc210f5 100755
--- a/config/config.linux
+++ b/config/config.linux
@@ -36,12 +36,18 @@ FF_CUDA_ARCH=${FF_CUDA_ARCH:-"autodetect"}
 # or all available architectures. TODO: support autodetect
 FF_HIP_ARCH=${FF_HIP_ARCH:-"all"}
 
-# set CUDNN dir in case cmake cannot autodetect a path
-CUDNN_DIR=${CUDNN_DIR:-"/usr/local/cuda"}
-
 # set CUDA dir in case cmake cannot autodetect a path
 CUDA_DIR=${CUDA_DIR:-"/usr/local/cuda"}
 
+# set CUBLAS dir in case it is not stored in the CUDA DIR
+CUBLAS_DIR=${CUBLAS_DIR:-"/usr/local/cuda"}
+
+# set CURAND dir in case it is not stored in the CUDA DIR
+CURAND_DIR=${CURAND_DIR:-"/usr/local/cuda"}
+
+# set CUDNN dir in case cmake cannot autodetect a path
+CUDNN_DIR=${CUDNN_DIR:-"/usr/local/cuda"}
+
 # if not use PREBUILD_NCCL, you can set NCCL_DIR to use external nccl lib,
 # otherwise, we will build nccl from source
 NCCL_DIR=${NCCL_DIR:-"/usr/local/cuda"}
@@ -102,7 +108,7 @@ fi
 
 function get_build_configs() {
     # Create a string with the values of the variables set in this script
-    BUILD_CONFIGS="FF_CUDA_ARCH=${FF_CUDA_ARCH} FF_HIP_ARCH=${FF_HIP_ARCH} CUDNN_DIR=${CUDNN_DIR} CUDA_DIR=${CUDA_DIR} NCCL_DIR=${NCCL_DIR} FF_USE_PYTHON=${FF_USE_PYTHON} BUILD_LEGION_ONLY=${BUILD_LEGION_ONLY} FF_GASNET_CONDUIT=${FF_GASNET_CONDUIT} UCX_DIR=${UCX_DIR} FF_LEGION_NETWORKS=${FF_LEGION_NETWORKS} FF_BUILD_ALL_EXAMPLES=${FF_BUILD_ALL_EXAMPLES} FF_BUILD_ALL_INFERENCE_EXAMPLES=${FF_BUILD_ALL_INFERENCE_EXAMPLES} FF_BUILD_UNIT_TESTS=${FF_BUILD_UNIT_TESTS} FF_USE_PREBUILT_NCCL=${FF_USE_PREBUILT_NCCL} FF_USE_PREBUILT_LEGION=${FF_USE_PREBUILT_LEGION} FF_USE_ALL_PREBUILT_LIBRARIES=${FF_USE_ALL_PREBUILT_LIBRARIES} FF_USE_AVX2=${FF_USE_AVX2} FF_MAX_DIM=${FF_MAX_DIM} ROCM_PATH=${ROCM_PATH} FF_GPU_BACKEND=${FF_GPU_BACKEND} INSTALL_DIR=${INSTALL_DIR}"
+    BUILD_CONFIGS="FF_CUDA_ARCH=${FF_CUDA_ARCH} FF_HIP_ARCH=${FF_HIP_ARCH} CUDA_DIR=${CUDA_DIR} CUDNN_DIR=${CUDNN_DIR} CUBLAS_DIR=${CUBLAS_DIR} CURAND_DIR=${CURAND_DIR} NCCL_DIR=${NCCL_DIR} FF_USE_PYTHON=${FF_USE_PYTHON} BUILD_LEGION_ONLY=${BUILD_LEGION_ONLY} FF_GASNET_CONDUIT=${FF_GASNET_CONDUIT} UCX_DIR=${UCX_DIR} FF_LEGION_NETWORKS=${FF_LEGION_NETWORKS} FF_BUILD_ALL_EXAMPLES=${FF_BUILD_ALL_EXAMPLES} FF_BUILD_ALL_INFERENCE_EXAMPLES=${FF_BUILD_ALL_INFERENCE_EXAMPLES} FF_BUILD_UNIT_TESTS=${FF_BUILD_UNIT_TESTS} FF_USE_PREBUILT_NCCL=${FF_USE_PREBUILT_NCCL} FF_USE_PREBUILT_LEGION=${FF_USE_PREBUILT_LEGION} FF_USE_ALL_PREBUILT_LIBRARIES=${FF_USE_ALL_PREBUILT_LIBRARIES} FF_USE_AVX2=${FF_USE_AVX2} FF_MAX_DIM=${FF_MAX_DIM} ROCM_PATH=${ROCM_PATH} FF_GPU_BACKEND=${FF_GPU_BACKEND} INSTALL_DIR=${INSTALL_DIR}"
 }
 
 if [[ -n "$1" && ( "$1" == "CMAKE_FLAGS" || "$1" == "CUDA_PATH" ) ]]; then
diff --git a/include/flexflow/config.h b/include/flexflow/config.h
index 17a3f59e29..2c11ae1131 100644
--- a/include/flexflow/config.h
+++ b/include/flexflow/config.h
@@ -145,7 +145,7 @@ class FFConfig {
   Legion::Runtime *lg_hlr;
   Legion::IndexSpaceT<1> all_gpu_task_is;
   // Legion::FieldSpace field_space;
-  bool syntheticInput, profiling, perform_fusion;
+  bool benchmarking, profiling, perform_fusion;
   bool inference_debugging;
   size_t simulator_work_space_size;
   size_t search_budget;
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index f88af3bc43..aae7256ffe 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -107,7 +107,9 @@ void parse_input_args(char **argv,
     }
   }
   if (paths.cache_folder_path.empty()) {
-    paths.cache_folder_path = "~/.cache/flexflow";
+    char const *ff_cache_path = std::getenv("FF_CACHE_PATH");
+    paths.cache_folder_path = ff_cache_path ? std::string(ff_cache_path)
+                                            : std::string("~/.cache/flexflow");
   }
   // Expand ~ to the home directory if needed
   wordexp_t p;
diff --git a/inference/models/falcon.cc b/inference/models/falcon.cc
index e00f4e9cfd..a529411ddb 100644
--- a/inference/models/falcon.cc
+++ b/inference/models/falcon.cc
@@ -252,26 +252,6 @@ void FALCON::create_falcon_model(FFModel &ff,
 
   InferenceManager *im = InferenceManager::get_inference_manager();
   im->register_model_weights_loader(&ff, fileloader);
-
-#ifdef DEADCODE
-  // Compile the model
-  std::cout << "------start compile ----------" << std::endl;
-  InferenceManager *im = InferenceManager::get_inference_manager();
-  im->compile_model_and_allocate_buffer(&ff);
-  FileDataLoader fileloader("",
-                            weight_file_path,
-                            falcon_config.n_head,
-                            falcon_config.n_head_kv,
-                            falcon_config.hidden_size,
-                            falcon_config.hidden_size / falcon_config.n_head,
-                            ff.config.tensor_parallelism_degree);
-  std::cout << "------load weights ----------" << std::endl;
-  fileloader.load_weights(&ff, use_full_precision);
-  std::cout << "------load weight finished----------" << std::endl;
-
-  // init operators
-  im->init_operators_inference(&ff);
-#endif
 }
 
 }; // namespace FlexFlow
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index 14b8c31fa1..517f534438 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -277,16 +277,6 @@ void LLAMA::create_llama_model(FFModel &ff,
 
   InferenceManager *im = InferenceManager::get_inference_manager();
   im->register_model_weights_loader(&ff, fileloader);
-#ifdef DEADCODE
-  // Compile the model
-  std::cout << "------start compile ----------" << std::endl;
-  im->compile_model_and_allocate_buffer(&ff);
-  fileloader.load_weights(&ff);
-  std::cout << "------load weight finished----------" << std::endl;
-
-  // init operators
-  im->init_operators_inference(&ff);
-#endif
 }
 
 }; // namespace FlexFlow
diff --git a/inference/models/mpt.cc b/inference/models/mpt.cc
index 7e8fc8358f..70e2b5e9c5 100644
--- a/inference/models/mpt.cc
+++ b/inference/models/mpt.cc
@@ -259,21 +259,6 @@ void MPT::create_mpt_model(FFModel &ff,
 
   InferenceManager *im = InferenceManager::get_inference_manager();
   im->register_model_weights_loader(&ff, fileloader);
-
-#ifdef DEADCODE
-  //------------------- compile the model --------------------------------
-  InferenceManager *im = InferenceManager::get_inference_manager();
-  im->compile_model_and_allocate_buffer(&ff);
-  FileDataLoader fileloader("",
-                            weight_file_path,
-                            mpt_config.n_heads,
-                            mpt_config.n_heads,
-                            mpt_config.hidden_size,
-                            mpt_config.hidden_size / mpt_config.n_heads,
-                            ff.config.tensor_parallelism_degree);
-  fileloader.load_weights(&ff, use_full_precision);
-  im->init_operators_inference(&ff);
-#endif
 }
 
 }; // namespace FlexFlow
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index 3ff4c96fdf..5677d5658e 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -266,24 +266,6 @@ void OPT::create_opt_model(FFModel &ff,
       use_full_precision);
   InferenceManager *im = InferenceManager::get_inference_manager();
   im->register_model_weights_loader(&ff, fileloader);
-
-#ifdef DEADCODE
-  //------------------- compile the model --------------------------------
-  std::cout << "------start compile ----------" << std::endl;
-  InferenceManager *im = InferenceManager::get_inference_manager();
-  im->compile_model_and_allocate_buffer(&ff);
-  FileDataLoader fileloader("",
-                            weight_file_path,
-                            opt_config.num_attention_heads,
-                            opt_config.num_attention_heads,
-                            opt_config.hidden_size,
-                            opt_config.hidden_size /
-                                opt_config.num_attention_heads,
-                            ff.config.tensor_parallelism_degree);
-  fileloader.load_weights(&ff, use_full_precision);
-  std::cout << "------finished loading weights----------" << std::endl;
-  im->init_operators_inference(&ff);
-#endif
 }
 
 }; // namespace FlexFlow
diff --git a/inference/models/starcoder.cc b/inference/models/starcoder.cc
index 2327c86119..8b0dc1098c 100644
--- a/inference/models/starcoder.cc
+++ b/inference/models/starcoder.cc
@@ -232,16 +232,6 @@ void STARCODER::create_starcoder_model(
       ff.config.tensor_parallelism_degree,
       use_full_precision);
   im->register_model_weights_loader(&ff, fileloader);
-#ifdef DEADCODE
-  // Compile the model
-  std::cout << "------start compile ----------" << std::endl;
-  im->compile_model_and_allocate_buffer(&ff);
-  fileloader.load_weights(&ff, use_full_precision);
-  std::cout << "------load weight finished----------" << std::endl;
-
-  // init operators
-  im->init_operators_inference(&ff);
-#endif
 }
 
 }; // namespace FlexFlow
diff --git a/inference/python/incr_decoding.py b/inference/python/incr_decoding.py
index f7707816c8..05599ea6b9 100644
--- a/inference/python/incr_decoding.py
+++ b/inference/python/incr_decoding.py
@@ -55,6 +55,7 @@ def get_configs():
             "use_4bit_quantization": False,
             "use_8bit_quantization": False,
             "profiling": False,
+            "benchmarking": False,
             "inference_debugging": False,
             "fusion": True,
         }
@@ -62,7 +63,7 @@ def get_configs():
             # required parameters
             "llm_model": "tiiuae/falcon-7b",
             # optional parameters
-            "cache_path": "",
+            "cache_path": os.environ.get("FF_CACHE_PATH", ""),
             "refresh_cache": False,
             "full_precision": False,
             "prompt": "",
diff --git a/inference/python/spec_infer.py b/inference/python/spec_infer.py
index fcb1b8f891..a6dfa8042e 100644
--- a/inference/python/spec_infer.py
+++ b/inference/python/spec_infer.py
@@ -55,6 +55,7 @@ def get_configs():
             "use_4bit_quantization": False,
             "use_8bit_quantization": False,
             "profiling": False,
+            "benchmarking": False,
             "inference_debugging": False,
             "fusion": True,
         }
@@ -62,7 +63,7 @@ def get_configs():
             # required llm arguments
             "llm_model": "meta-llama/Llama-2-7b-hf",
             # optional llm parameters
-            "cache_path": "",
+            "cache_path": os.environ.get("FF_CACHE_PATH", ""),
             "refresh_cache": False,
             "full_precision": False,
             "ssms": [
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index b6c1e408cd..f7edfd7696 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -124,7 +124,9 @@ void parse_input_args(char **argv,
     }
   }
   if (paths.cache_folder_path.empty()) {
-    paths.cache_folder_path = "~/.cache/flexflow";
+    char const *ff_cache_path = std::getenv("FF_CACHE_PATH");
+    paths.cache_folder_path = ff_cache_path ? std::string(ff_cache_path)
+                                            : std::string("~/.cache/flexflow");
   }
   // Expand ~ to the home directory if needed
   wordexp_t p;
diff --git a/inference/utils/download_hf_model.py b/inference/utils/download_hf_model.py
index 94a8c23e68..7b4f4d6fb0 100644
--- a/inference/utils/download_hf_model.py
+++ b/inference/utils/download_hf_model.py
@@ -1,6 +1,6 @@
 #!/usr/bin/env python
 import flexflow.serve as ff
-import argparse
+import argparse, os
 
 
 def parse_args():
@@ -12,7 +12,7 @@ def parse_args():
         "--cache-folder",
         type=str,
         help="Folder to use to store the model(s) assets in FlexFlow format",
-        default="",
+        default=os.environ.get("FF_CACHE_PATH", ""),
     )
     parser.add_argument(
         "--refresh-cache",
diff --git a/python/flexflow/core/__init__.py b/python/flexflow/core/__init__.py
index d7b1a595d2..2820cf485a 100644
--- a/python/flexflow/core/__init__.py
+++ b/python/flexflow/core/__init__.py
@@ -41,6 +41,7 @@
     "num_cpus": "-ll:cpu",
     "legion_utility_processors": "-ll:util",
     "profiling": "--profiling",
+    "benchmarking": "--benchmarking",
     "inference_debugging": "--inference-debugging",
     "fusion": "--fusion",
     "disable_control_replication": "--disable-control-replication",
diff --git a/python/flexflow/serve/__init__.py b/python/flexflow/serve/__init__.py
index cf467280bd..5af077273d 100644
--- a/python/flexflow/serve/__init__.py
+++ b/python/flexflow/serve/__init__.py
@@ -45,6 +45,7 @@ def init(
     use_4bit_quantization: Optional[bool] = None,
     use_8bit_quantization: Optional[bool] = None,
     profiling: Optional[bool] = None,
+    benchmarking: Optional[bool] = None,
     inference_debugging: Optional[bool] = None,
     fusion: Optional[bool] = None,
 ):
@@ -72,6 +73,7 @@ def init(
     - use_4bit_quantization: whether to use 4-bit quantization, defaults to False
     - use_8bit_quantization: whether to use 8-bit quantization, defaults to False
     - profiling: whether to enable the FlexFlow profiling mode, defaults to False
+    - benchmarking: whether to run benchmaking only, without loading real weights, defaults to False
     - inference_debugging: whether to run inference in debugging mode, saving all inputs/outputs/weights to file, defaults to False
     - fusion: whether to enable the FlexFlow operator fusion optimization, defaults to True
 
@@ -106,6 +108,8 @@ def init(
     :type use_8bit_quantization: Optional[bool], optional
     :param profiling: whether to enable the FlexFlow profiling mode, defaults to False
     :type profiling: Optional[bool], optional
+    :param benchmarking: whether to run benchmaking only, without loading real weights, defaults to False
+    :type benchmarking: Optional[bool], optional
     :param inference_debugging: whether to run inference in debugging mode, saving all inputs/outputs/weights to file, defaults to False
     :type inference_debugging: Optional[bool], optional
     :param fusion: whether to enable the FlexFlow operator fusion optimization, defaults to True
@@ -132,6 +136,7 @@ def init(
             use_4bit_quantization is not None,
             use_8bit_quantization is not None,
             profiling is not None,
+            benchmarking is not None,
             inference_debugging is not None,
             fusion is not None,
         ]
@@ -157,6 +162,7 @@ def init(
             "use_4bit_quantization": use_4bit_quantization,
             "use_8bit_quantization": use_8bit_quantization,
             "profiling": profiling,
+            "benchmarking": benchmarking,
             "inference_debugging": inference_debugging,
             "fusion": fusion,
         }
@@ -201,6 +207,8 @@ def init(
         configs_dict["use_8bit_quantization"] = False
     if configs_dict.get("profiling", None) is None:
         configs_dict["profiling"] = False
+    if configs_dict.get("benchmarking", None) is None:
+        configs_dict["benchmarking"] = False
     if configs_dict.get("inference_debugging", None) is None:
         configs_dict["inference_debugging"] = False
     if configs_dict.get("fusion", None) is None:
diff --git a/src/mapper/mapper.cc b/src/mapper/mapper.cc
index d7aac4e37c..c293aecb19 100644
--- a/src/mapper/mapper.cc
+++ b/src/mapper/mapper.cc
@@ -487,6 +487,25 @@ void FFMapper::premap_task(const MapperContext ctx,
   assert(false);
 }
 
+std::string humanReadableSize(size_t size, bool mb = false) {
+  assert(size >= 0);
+  char const *units[] = {"B", "KiB", "MiB", "GiB", "TiB"};
+  int i = 0;
+  double finalSize = size;
+  if (mb) {
+    finalSize /= 1024 * 1024;
+    i = 2;
+  } else {
+    while (finalSize >= 1024 && i < 4) {
+      finalSize /= 1024;
+      i++;
+    }
+  }
+  char buffer[256];
+  snprintf(buffer, sizeof(buffer), "%.2lf %s", finalSize, units[i]);
+  return std::string(buffer);
+}
+
 void FFMapper::map_task(const MapperContext ctx,
                         Task const &task,
                         MapTaskInput const &input,
@@ -637,16 +656,19 @@ void FFMapper::map_task(const MapperContext ctx,
       }
       // Report failed to creation
       log_ff_mapper.error(
-          "FlexFlow failed allocation of size %zd bytes for "
-          "region requirement %d of task %s (UID %lld) in memory " IDFMT
-          " with kind %d for processor " IDFMT ".",
-          footprint,
+          "Out of memory! FlexFlow failed to reserve block of size %s"
+          " for region requirement %d of task %s (UID %lld) in %s memory (id: "
+          "%llx)"
+          " for processor id: %llx."
+          " Total pre-allocated memory capacity of this kind: %s.",
+          humanReadableSize(footprint).c_str(),
           idx,
           task.get_task_name(),
           task.get_unique_id(),
+          Legion::Mapping::Utilities::to_string(target_mem.kind()),
           target_mem.id,
-          target_mem.kind(),
-          task.target_proc.id);
+          task.target_proc.id,
+          humanReadableSize(target_mem.capacity(), true).c_str());
       assert(false);
     } else {
       output.chosen_instances[idx].push_back(result);
@@ -929,15 +951,17 @@ void FFMapper::map_inline(const MapperContext ctx,
                              created,
                              &footprint)) {
     log_ff_mapper.error(
-        "FlexFlow Mapper failed allocation of size %zd bytes"
+        "Out of memory! FlexFlow failed to reserve block of size %s"
         " for region requirement of inline mapping in task %s (UID %lld)"
-        " in memory " IDFMT "for processor " IDFMT ".",
-        footprint,
+        " in %s memory (id: %llx) for processor id: %llx."
+        " Total pre-allocated memory capacity of this kind: %s.",
+        humanReadableSize(footprint).c_str(),
         inline_op.parent_task->get_task_name(),
         inline_op.parent_task->get_unique_id(),
+        Legion::Mapping::Utilities::to_string(target_memory.kind()),
         target_memory.id,
-        inline_op.parent_task->current_proc.id);
-    printf("target_memory.kind() = %d\n", target_memory.kind());
+        inline_op.parent_task->current_proc.id,
+        humanReadableSize(target_memory.capacity(), true).c_str());
     assert(false);
   } else {
     output.chosen_instances.push_back(result);
diff --git a/src/runtime/file_loader.cc b/src/runtime/file_loader.cc
index 56558b3185..43ce9d7005 100644
--- a/src/runtime/file_loader.cc
+++ b/src/runtime/file_loader.cc
@@ -725,60 +725,69 @@ void FileDataLoader::load_single_weight_tensor(FFModel *ff,
 
   std::string weight_filename = removeGuidOperatorName(std::string(l->name));
 
-  if (l->op_type == OP_INC_MULTIHEAD_SELF_ATTENTION ||
-      l->op_type == OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION ||
-      l->op_type == OP_TREE_INC_MULTIHEAD_SELF_ATTENTION) {
-    if (weight_filename.find("self_attention") != std::string::npos) {
-      load_attention_weights_multi_query(
-          data, weight_filename, weights_folder, hidden_dim, num_heads);
-    } else if (weight_filename.find("attention") != std::string::npos &&
-               weight_filename.rfind("attention") ==
-                   weight_filename.length() - strlen("attention")) {
-      if (weight_idx == 0) {
-        load_attention_weights_v2(data,
-                                  num_heads,
-                                  num_kv_heads,
-                                  hidden_dim,
-                                  qkv_inner_dim,
-                                  weight_filename,
-                                  weights_folder,
-                                  volume,
-                                  tensor_parallelism_degree);
+  if (ff->config.benchmarking) {
+    std::cout << "Initializing weight " << weight_filename
+              << " with random data (benchmarking mode)" << std::endl;
+    // If benchmarking, we don't need to load the weights
+    // We can just fill the weight tensor with random data
+  } else {
+    if (l->op_type == OP_INC_MULTIHEAD_SELF_ATTENTION ||
+        l->op_type == OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION ||
+        l->op_type == OP_TREE_INC_MULTIHEAD_SELF_ATTENTION) {
+      if (weight_filename.find("self_attention") != std::string::npos) {
+        load_attention_weights_multi_query(
+            data, weight_filename, weights_folder, hidden_dim, num_heads);
+      } else if (weight_filename.find("attention") != std::string::npos &&
+                 weight_filename.rfind("attention") ==
+                     weight_filename.length() - strlen("attention")) {
+        if (weight_idx == 0) {
+          load_attention_weights_v2(data,
+                                    num_heads,
+                                    num_kv_heads,
+                                    hidden_dim,
+                                    qkv_inner_dim,
+                                    weight_filename,
+                                    weights_folder,
+                                    volume,
+                                    tensor_parallelism_degree);
+        } else {
+          long long value;
+          l->get_int_property("final_bias", value);
+          bool final_bias = (bool)value;
+          load_attention_bias_v2(data,
+                                 num_heads,
+                                 num_kv_heads,
+                                 hidden_dim,
+                                 qkv_inner_dim,
+                                 final_bias,
+                                 weight_filename,
+                                 weights_folder);
+        }
+
       } else {
-        long long value;
-        l->get_int_property("final_bias", value);
-        bool final_bias = (bool)value;
-        load_attention_bias_v2(data,
-                               num_heads,
-                               num_kv_heads,
-                               hidden_dim,
-                               qkv_inner_dim,
-                               final_bias,
-                               weight_filename,
-                               weights_folder);
+        assert(false);
       }
-
+    } else if (l->op_type == OP_ADD_BIAS_RESIDUAL_LAYERNORM) {
+      assert(weight_idx >= 0 || weight_idx <= 2);
+      weight_filename += (weight_idx == 0)
+                             ? "_attn_bias"
+                             : ((weight_idx == 1) ? "_weight" : "_bias");
+      std::cout << "Loading weight file " << weight_filename << std::endl;
+      std::string weight_filepath =
+          join_path({weights_folder, weight_filename});
+      load_from_file(data, volume, weight_filepath);
     } else {
-      assert(false);
-    }
-  } else if (l->op_type == OP_ADD_BIAS_RESIDUAL_LAYERNORM) {
-    assert(weight_idx >= 0 || weight_idx <= 2);
-    weight_filename += (weight_idx == 0)
-                           ? "_attn_bias"
-                           : ((weight_idx == 1) ? "_weight" : "_bias");
-    std::cout << "Loading weight file " << weight_filename << std::endl;
-    std::string weight_filepath = join_path({weights_folder, weight_filename});
-    load_from_file(data, volume, weight_filepath);
-  } else {
-    // default op
-    assert(weight_idx == 0 || weight_idx == 1);
-    // handle exception
-    if (weight_filename != "embed_tokens_weight_lm_head") {
-      weight_filename += weight_idx == 0 ? "_weight" : "_bias";
+      // default op
+      assert(weight_idx == 0 || weight_idx == 1);
+      // handle exception
+      if (weight_filename != "embed_tokens_weight_lm_head") {
+        weight_filename += weight_idx == 0 ? "_weight" : "_bias";
+      }
+      std::cout << "Loading weight file " << weight_filename << std::endl;
+      std::string weight_filepath =
+          join_path({weights_folder, weight_filename});
+      load_from_file(data, volume, weight_filepath);
     }
-    std::cout << "Loading weight file " << weight_filename << std::endl;
-    std::string weight_filepath = join_path({weights_folder, weight_filename});
-    load_from_file(data, volume, weight_filepath);
   }
 
   // Copy the weight data from the buffer to the weight's ParallelTensor
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 40f758282c..1fa281777a 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -4065,6 +4065,7 @@ struct DefaultConfig {
   // const static int iterations = 1;
   const static int batchSize = 64;
   const static bool profiling = false;
+  const static bool benchmarking = false;
   const static bool inference_debugging = false;
   constexpr static float learningRate = 0.01f;
   constexpr static float weightDecay = 0.0001f;
@@ -4100,6 +4101,7 @@ FFConfig::FFConfig() {
   // iterations = DefaultConfig::iterations;
   batchSize = DefaultConfig::batchSize;
   profiling = DefaultConfig::profiling;
+  benchmarking = DefaultConfig::benchmarking;
   inference_debugging = DefaultConfig::inference_debugging;
   learningRate = DefaultConfig::learningRate;
   weightDecay = DefaultConfig::weightDecay;
@@ -4137,7 +4139,7 @@ FFConfig::FFConfig() {
   export_strategy_computation_graph_file = "";
   dataset_path = "";
   substitution_json_path = tl::nullopt;
-  syntheticInput = false;
+  benchmarking = false;
   perform_fusion = false;
   base_optimize_threshold = DefaultConfig::base_optimize_threshold;
   perform_memory_search = false;
@@ -4290,6 +4292,10 @@ void FFConfig::parse_args(char **argv, int argc) {
       profiling = true;
       continue;
     }
+    if (!strcmp(argv[i], "--benchmarking")) {
+      benchmarking = true;
+      continue;
+    }
     if (!strcmp(argv[i], "--inference-debugging")) {
       inference_debugging = true;
       continue;
diff --git a/tests/inference/python_test_configs/generate_configs.py b/tests/inference/python_test_configs/generate_configs.py
index ebaadade32..41703cf431 100644
--- a/tests/inference/python_test_configs/generate_configs.py
+++ b/tests/inference/python_test_configs/generate_configs.py
@@ -18,6 +18,7 @@
     "use_4bit_quantization": False,
     "use_8bit_quantization": False,
     "profiling": False,
+    "benchmarking": False,
     "inference_debugging": False,
     "fusion": True,
 }
@@ -25,7 +26,7 @@
     # required parameters
     "llm_model": "tiiuae/falcon-7b",
     # optional parameters
-    "cache_path": "",
+    "cache_path": os.environ.get("FF_CACHE_PATH", ""),
     "refresh_cache": False,
     "full_precision": True,
     "prompt": "",

From 7da197e71e31a1840d9404a63d5a9fdd20d4d41e Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 23 Apr 2024 20:26:33 -0400
Subject: [PATCH 329/344] update workflow to build rocm docker images

---
 .github/workflows/docker-build.yml | 58 +++++++++++++-----------------
 1 file changed, 25 insertions(+), 33 deletions(-)

diff --git a/.github/workflows/docker-build.yml b/.github/workflows/docker-build.yml
index 54805cc325..d16179434b 100644
--- a/.github/workflows/docker-build.yml
+++ b/.github/workflows/docker-build.yml
@@ -20,26 +20,22 @@ concurrency:
   cancel-in-progress: true
 
 jobs:
-  oracle-runner-start:
-    name: Start an Oracle instance to build the ROCM Docker images
+  rocm-builder-start:
+    name: Start an AWS instance to build the ROCM Docker images
     runs-on: ubuntu-latest
     if: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
     env: 
-      OCI_CLI_USER: ${{ secrets.OCI_CLI_USER }}
-      OCI_CLI_TENANCY: ${{ secrets.OCI_CLI_TENANCY }}
-      OCI_CLI_FINGERPRINT: ${{ secrets.OCI_CLI_FINGERPRINT }}
-      OCI_CLI_KEY_CONTENT: ${{ secrets.OCI_CLI_KEY_CONTENT }}
-      OCI_CLI_REGION: ${{ secrets.OCI_CLI_REGION }} 
-      OCI_INSTANCE_ID: ${{ secrets.OCI_INSTANCE_ID }}
+      ROCM_BUILDER_INSTANCE_ID: ${{ secrets.ROCM_BUILDER_INSTANCE_ID }}
     steps:
-      - name: Checkout Git Repository
-        uses: actions/checkout@v3
+      - name: Configure AWS credentials
+        uses: aws-actions/configure-aws-credentials@v1
+        with:
+          aws-access-key-id: ${{ secrets.AWS_ACCESS_KEY_ID }}
+          aws-secret-access-key: ${{ secrets.AWS_SECRET_ACCESS_KEY }}
+          aws-region: us-east-2
 
-      - name: Install Oracle Cloud Infrastructure library
-        run: pip install oci
-      
-      - name: Start Oracle Machine
-        run: python3 .github/workflows/helpers/oracle_con.py --start --instance_id $OCI_INSTANCE_ID
+      - name: Start EC2 instance
+        run: aws ec2 start-instances --instance-ids $ROCM_BUILDER_INSTANCE_ID
 
   docker-build-rocm:
     name: Build and Install FlexFlow in a Docker Container (ROCm backend)
@@ -66,8 +62,8 @@ jobs:
 
   docker-build-and-publish-rocm:
     name: Build and Deploy FlexFlow Docker Containers (ROCm backend)
-    needs: oracle-runner-start
-    runs-on: [self-hosted, cpu_only]
+    needs: rocm-builder-start
+    runs-on: [self-hosted, rocm_builder]
     if: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
     strategy:
       matrix:
@@ -148,27 +144,23 @@ jobs:
           ./docker/publish.sh flexflow-environment
           ./docker/publish.sh flexflow
 
-  oracle-runner-stop:
+  rocm-builder-stop:
     needs: docker-build-and-publish-rocm
     if: ${{ always() && ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
     runs-on: ubuntu-latest
-    name: Stop the Oracle instance we used to build the ROCM Docker images
+    name: Stop the AWS instance we used to build the ROCM Docker images
     env:
-      OCI_CLI_USER: ${{ secrets.OCI_CLI_USER }}
-      OCI_CLI_TENANCY: ${{ secrets.OCI_CLI_TENANCY }}
-      OCI_CLI_FINGERPRINT: ${{ secrets.OCI_CLI_FINGERPRINT }}
-      OCI_CLI_KEY_CONTENT: ${{ secrets.OCI_CLI_KEY_CONTENT }}
-      OCI_CLI_REGION: ${{ secrets.OCI_CLI_REGION }} 
-      OCI_INSTANCE_ID: ${{ secrets.OCI_INSTANCE_ID }}
+      ROCM_BUILDER_INSTANCE_ID: ${{ secrets.ROCM_BUILDER_INSTANCE_ID }}
     steps:
-      - name: Checkout Git Repository
-        uses: actions/checkout@v3
-      
-      - name: Install Oracle Cloud Infrastructure library
-        run: pip install oci
-        
-      - name: Stop Oracle Machine
-        run: python3 .github/workflows/helpers/oracle_con.py --stop --instance_id $OCI_INSTANCE_ID
+      - name: Configure AWS credentials
+        uses: aws-actions/configure-aws-credentials@v1
+        with:
+          aws-access-key-id: ${{ secrets.AWS_ACCESS_KEY_ID }}
+          aws-secret-access-key: ${{ secrets.AWS_SECRET_ACCESS_KEY }}
+          aws-region: us-east-2
+
+      - name: Start EC2 instance
+        run: aws ec2 stop-instances --instance-ids $ROCM_BUILDER_INSTANCE_ID
 
   notify-slack:
     name: Notify Slack in case of failure

From 002fdf017c7dd665b703da37494093161c3d55c7 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Tue, 23 Apr 2024 22:35:42 -0400
Subject: [PATCH 330/344] downgrade to python 3.11 for now

---
 docker/flexflow-environment/Dockerfile | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/docker/flexflow-environment/Dockerfile b/docker/flexflow-environment/Dockerfile
index edbf9a7e52..6ca337f58d 100644
--- a/docker/flexflow-environment/Dockerfile
+++ b/docker/flexflow-environment/Dockerfile
@@ -17,7 +17,8 @@ RUN apt-get update && apt-get install -y --no-install-recommends wget sudo binut
 
 # Install Python3 with Miniconda
 ARG python_version "latest"
-RUN MINICONDA_SCRIPT_NAME=Miniconda3-latest-Linux-x86_64.sh; \
+#RUN MINICONDA_SCRIPT_NAME=Miniconda3-latest-Linux-x86_64.sh; \
+RUN MINICONDA_SCRIPT_NAME=Miniconda3-py311_23.5.2-0-Linux-x86_64.sh; \
     if [ "$python_version" != "3.8" ] && [ "$python_version" != "3.9" ] && [ "$python_version" != "3.10" ] && [ "$python_version" != "3.11" ] && [ "$python_version" != "latest" ]; then \
         echo "python_version '${python_version}' is not supported, please choose among {3.8, 3.9, 3.10, 3.11 or latest (default)}"; \
         exit 1; \

From d54e4b6a747f3940a19989a56095a71540e4c0d8 Mon Sep 17 00:00:00 2001
From: Zhuofu Chen <59316330+chenzhuofu@users.noreply.github.com>
Date: Wed, 1 May 2024 01:51:57 +0800
Subject: [PATCH 331/344] doc: fix c++ serving example (#1372)

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
---
 .github/README.md | 2 +-
 SERVE.md          | 2 +-
 2 files changed, 2 insertions(+), 2 deletions(-)

diff --git a/.github/README.md b/.github/README.md
index 4a2a881c8d..c4f6baada6 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -178,7 +178,7 @@ A C++ example is available at [this folder](../inference/spec_infer/). After bui
 For example, you can use the following command line to serve a LLaMA-7B or LLaMA-13B model on 4 GPUs and use two collectively boost-tuned LLaMA-68M models for speculative inference.
 
 ```bash
-./inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-68m -prompt /path/to/prompt.json -tensor-parallelism-degree 4 --fusion
+./inference/spec_infer/spec_infer -ll:gpu 4 -ll:cpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-68m -prompt /path/to/prompt.json -tensor-parallelism-degree 4 --fusion
 ```
 </details>
 
diff --git a/SERVE.md b/SERVE.md
index e9bab3d702..9472d50a62 100644
--- a/SERVE.md
+++ b/SERVE.md
@@ -126,7 +126,7 @@ A C++ example is available at [this folder](../inference/spec_infer/). After bui
 For example, you can use the following command line to serve a LLaMA-7B or LLaMA-13B model on 4 GPUs and use two collectively boost-tuned LLaMA-68M models for speculative inference.
 
 ```bash
-./inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-68m -prompt /path/to/prompt.json -tensor-parallelism-degree 4 --fusion
+./inference/spec_infer/spec_infer -ll:gpu 4 -ll:cpu 4 -ll:fsize 14000 -ll:zsize 30000 -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-68m -prompt /path/to/prompt.json -tensor-parallelism-degree 4 --fusion
 ```
 </details>
 

From b90771a376fddbddf09af3f23e4ecae57911438e Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Thu, 30 May 2024 14:24:42 -0700
Subject: [PATCH 332/344] Update README.md

---
 .github/README.md | 6 ------
 1 file changed, 6 deletions(-)

diff --git a/.github/README.md b/.github/README.md
index c4f6baada6..5aba2295d5 100644
--- a/.github/README.md
+++ b/.github/README.md
@@ -4,12 +4,6 @@
 
 ---
 
-## News🔥:
-
-* [09/02/2023] Adding AMD GPU support, released Docker images for ROCM 5.3->5.6
-* [08/16/2023] Adding Starcoder model support
-* [08/14/2023] Released Docker images for different CUDA versions
-
 ## What is FlexFlow Serve
   
 The high computational and memory requirements of generative large language

From 385c118447a8b1451de3641c8ecf437245b9248b Mon Sep 17 00:00:00 2001
From: FelixBrakel <felixbrakel@quicknet.nl>
Date: Thu, 30 May 2024 23:39:10 +0200
Subject: [PATCH 333/344] Add examples for every layer in the python layer API
 (#1297)

* Fix incorrect innode being checked

* Add example for every layer on the FFModel python class

---------

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 docs/source/python/layers.rst                 |   2 +-
 examples/python/native/ops/add.py             |  45 ++++++++
 .../ops/add_bias_residual_layer_norm.py       |  78 +++++++++++++
 examples/python/native/ops/arg_top_k.py       |  61 ++++++++++
 examples/python/native/ops/argmax.py          |  55 +++++++++
 examples/python/native/ops/batch_matmul.py    |   0
 examples/python/native/ops/batch_norm.py      |  36 ++++++
 examples/python/native/ops/beam_top_k.py      |  58 ++++++++++
 examples/python/native/ops/concat.py          |  43 +++++++
 examples/python/native/ops/conv2d.py          |  45 ++++++++
 examples/python/native/ops/cos.py             |  44 +++++++
 examples/python/native/ops/dense.py           |  38 +++++++
 examples/python/native/ops/divide.py          |  48 ++++++++
 examples/python/native/ops/dropout.py         |  49 ++++++++
 examples/python/native/ops/elu.py             |  47 ++++++++
 examples/python/native/ops/embedding.py       |  39 +++++++
 examples/python/native/ops/exp.py             |   0
 examples/python/native/ops/flat.py            |   0
 examples/python/native/ops/gather.py          |  60 ++++++++++
 examples/python/native/ops/gelu.py            |  51 +++++++++
 examples/python/native/ops/identity.py        |  49 ++++++++
 .../ops/inc_multihead_self_attention.py       | 103 +++++++++++++++++
 .../inc_multihead_self_attention_verify.py    | 103 +++++++++++++++++
 .../ops/inc_multiquery_self_attention.py      | 107 ++++++++++++++++++
 .../inc_multiquery_self_attention_verify.py   | 107 ++++++++++++++++++
 examples/python/native/ops/layer_norm.py      |  48 ++++++++
 examples/python/native/ops/max.py             |  54 +++++++++
 examples/python/native/ops/mean.py            |  48 ++++++++
 examples/python/native/ops/min.py             |  54 +++++++++
 .../python/native/ops/multihead_attention.py  |   0
 examples/python/native/ops/multiply.py        |  45 ++++++++
 examples/python/native/ops/pool2d.py          |  36 ++++++
 examples/python/native/ops/pow.py             |  46 ++++++++
 examples/python/native/ops/reduce_sum.py      |  48 ++++++++
 examples/python/native/ops/relu.py            |  46 ++++++++
 examples/python/native/ops/reshape.py         |  41 +++++++
 .../python/native/ops/residual_layer_norm.py  |  93 +++++++++++++++
 .../python/native/ops/residual_rms_norm.py    |  80 +++++++++++++
 examples/python/native/ops/reverse.py         |  37 ++++++
 examples/python/native/ops/rms_norm.py        |  64 +++++++++++
 examples/python/native/ops/rsqrt.py           |  44 +++++++
 examples/python/native/ops/sampling.py        |  55 +++++++++
 examples/python/native/ops/scalar_add.py      |  53 +++++++++
 examples/python/native/ops/scalar_multiply.py |  53 +++++++++
 examples/python/native/ops/scalar_sub.py      |  53 +++++++++
 .../python/native/ops/scalar_true_divide.py   |  53 +++++++++
 examples/python/native/ops/sigmoid.py         |  46 ++++++++
 .../python/native/ops/sigmoid_silu_multi.py   |  58 ++++++++++
 examples/python/native/ops/sin.py             |  44 +++++++
 examples/python/native/ops/softmax.py         |  46 ++++++++
 .../ops/spec_inc_multihead_self_attention.py  | 103 +++++++++++++++++
 .../ops/spec_inc_multiquery_self_attention.py | 107 ++++++++++++++++++
 examples/python/native/ops/split.py           |  47 ++++++++
 examples/python/native/ops/subtract.py        |  45 ++++++++
 examples/python/native/ops/tanh.py            |  46 ++++++++
 examples/python/native/ops/transpose.py       |  38 +++++++
 56 files changed, 2898 insertions(+), 1 deletion(-)
 create mode 100644 examples/python/native/ops/add.py
 create mode 100644 examples/python/native/ops/add_bias_residual_layer_norm.py
 create mode 100644 examples/python/native/ops/arg_top_k.py
 create mode 100644 examples/python/native/ops/argmax.py
 create mode 100644 examples/python/native/ops/batch_matmul.py
 create mode 100644 examples/python/native/ops/batch_norm.py
 create mode 100644 examples/python/native/ops/beam_top_k.py
 create mode 100644 examples/python/native/ops/concat.py
 create mode 100644 examples/python/native/ops/conv2d.py
 create mode 100644 examples/python/native/ops/cos.py
 create mode 100644 examples/python/native/ops/dense.py
 create mode 100644 examples/python/native/ops/divide.py
 create mode 100644 examples/python/native/ops/dropout.py
 create mode 100644 examples/python/native/ops/elu.py
 create mode 100644 examples/python/native/ops/embedding.py
 create mode 100644 examples/python/native/ops/exp.py
 create mode 100644 examples/python/native/ops/flat.py
 create mode 100644 examples/python/native/ops/gather.py
 create mode 100644 examples/python/native/ops/gelu.py
 create mode 100644 examples/python/native/ops/identity.py
 create mode 100644 examples/python/native/ops/inc_multihead_self_attention.py
 create mode 100644 examples/python/native/ops/inc_multihead_self_attention_verify.py
 create mode 100644 examples/python/native/ops/inc_multiquery_self_attention.py
 create mode 100644 examples/python/native/ops/inc_multiquery_self_attention_verify.py
 create mode 100644 examples/python/native/ops/layer_norm.py
 create mode 100644 examples/python/native/ops/max.py
 create mode 100644 examples/python/native/ops/mean.py
 create mode 100644 examples/python/native/ops/min.py
 create mode 100644 examples/python/native/ops/multihead_attention.py
 create mode 100644 examples/python/native/ops/multiply.py
 create mode 100644 examples/python/native/ops/pool2d.py
 create mode 100644 examples/python/native/ops/pow.py
 create mode 100644 examples/python/native/ops/reduce_sum.py
 create mode 100644 examples/python/native/ops/relu.py
 create mode 100644 examples/python/native/ops/reshape.py
 create mode 100644 examples/python/native/ops/residual_layer_norm.py
 create mode 100644 examples/python/native/ops/residual_rms_norm.py
 create mode 100644 examples/python/native/ops/reverse.py
 create mode 100644 examples/python/native/ops/rms_norm.py
 create mode 100644 examples/python/native/ops/rsqrt.py
 create mode 100644 examples/python/native/ops/sampling.py
 create mode 100644 examples/python/native/ops/scalar_add.py
 create mode 100644 examples/python/native/ops/scalar_multiply.py
 create mode 100644 examples/python/native/ops/scalar_sub.py
 create mode 100644 examples/python/native/ops/scalar_true_divide.py
 create mode 100644 examples/python/native/ops/sigmoid.py
 create mode 100644 examples/python/native/ops/sigmoid_silu_multi.py
 create mode 100644 examples/python/native/ops/sin.py
 create mode 100644 examples/python/native/ops/softmax.py
 create mode 100644 examples/python/native/ops/spec_inc_multihead_self_attention.py
 create mode 100644 examples/python/native/ops/spec_inc_multiquery_self_attention.py
 create mode 100644 examples/python/native/ops/split.py
 create mode 100644 examples/python/native/ops/subtract.py
 create mode 100644 examples/python/native/ops/tanh.py
 create mode 100644 examples/python/native/ops/transpose.py

diff --git a/docs/source/python/layers.rst b/docs/source/python/layers.rst
index 91f12094e6..1be91a8b17 100644
--- a/docs/source/python/layers.rst
+++ b/docs/source/python/layers.rst
@@ -3,7 +3,7 @@ Layers API
 **********
 
 Layers are the basic building blocks of neural networks in FlexFlow. The inputs of a layer consists of a tensor or a list of tensors and some state variables,
-and the outputs of a layer is a tensor or a list of tensors.
+and the outputs of a layer is a tensor or a list of tensors. See https://github.com/flexflow/FlexFlow/examples/python/native/ops for an example for every layer
 
 .. automodule:: flexflow.core.flexflow_cffi
    :noindex:
diff --git a/examples/python/native/ops/add.py b/examples/python/native/ops/add.py
new file mode 100644
index 0000000000..50b9d16fd0
--- /dev/null
+++ b/examples/python/native/ops/add.py
@@ -0,0 +1,45 @@
+# The basis for this test of the 'add' operation is generated by ChatGPT using the manually created conv2d.py as a template.
+
+
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+def test_add(ffconfig, input_arr1: np.ndarray, input_arr2: np.ndarray) -> flexflow.core.Tensor:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor1 = ffmodel.create_tensor(input_arr1.shape, DataType.DT_FLOAT)
+    input_tensor2 = ffmodel.create_tensor(input_arr2.shape, DataType.DT_FLOAT)
+
+    out = ffmodel.add(input_tensor1, input_tensor2)
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY])
+    dataloader_input1 = ffmodel.create_data_loader(input_tensor1, input_arr1)
+    dataloader_input2 = ffmodel.create_data_loader(input_tensor2, input_arr2)
+
+    ffmodel.init_layers()
+
+    dataloader_input1.reset()
+    dataloader_input1.next_batch(ffmodel)
+
+    dataloader_input2.reset()
+    dataloader_input2.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    out.inline_map(ffmodel, ffconfig)
+    return out.get_array(ffmodel, ffconfig)
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input1 = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    input2 = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+
+    _ = test_add(ffconfig, input1, input2)
diff --git a/examples/python/native/ops/add_bias_residual_layer_norm.py b/examples/python/native/ops/add_bias_residual_layer_norm.py
new file mode 100644
index 0000000000..6e8dffbc9e
--- /dev/null
+++ b/examples/python/native/ops/add_bias_residual_layer_norm.py
@@ -0,0 +1,78 @@
+from typing import List
+
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_add_bias_residual_layer_norm(ffconfig, input_arr: np.ndarray, residual_arr: np.ndarray, axes: List[int], elementwise_affine: bool = True, eps: float = 1e-5, use_bias: bool = True, name=None):
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+    residual_tensor = ffmodel.create_tensor(residual_arr.shape, DataType.DT_FLOAT)
+
+    output_tensor, layer_norm_output = ffmodel.add_bias_residual_layer_norm(
+        input_tensor,
+        residual_tensor,
+        axes=axes,
+        elementwise_affine=elementwise_affine,
+        eps=eps,
+        use_bias=use_bias,
+        name="add_bias_residual_layer_norm_layer"
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+    dataloader_residual = ffmodel.create_data_loader(residual_tensor, residual_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_residual.reset()
+
+    dataloader_input.next_batch(ffmodel)
+    dataloader_residual.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    output_tensor.inline_map(ffmodel, ffconfig)
+    layer_norm_output.inline_map(ffmodel, ffconfig)
+    output_result = output_tensor.get_array(ffmodel, ffconfig)
+    layer_norm_result = layer_norm_output.get_array(ffmodel, ffconfig)
+
+    return output_result, layer_norm_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    residual_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+
+    axes_to_normalize = [1, 2]  # Example axes to normalize
+
+    output_result, layer_norm_result = test_add_bias_residual_layer_norm(
+        ffconfig,
+        input_data,
+        residual_data,
+        axes=axes_to_normalize,
+        elementwise_affine=True,
+        eps=1e-5,
+        use_bias=True
+    )
+
+    print("Input Array:")
+    print(input_data)
+    print("\nResidual Array:")
+    print(residual_data)
+    print(f"\nOutput Array after applying add_bias_residual_layer_norm along axes {axes_to_normalize}:")
+    print(output_result)
+    print("\nLayer Norm Result:")
+    print(layer_norm_result)
diff --git a/examples/python/native/ops/arg_top_k.py b/examples/python/native/ops/arg_top_k.py
new file mode 100644
index 0000000000..79edc5dfad
--- /dev/null
+++ b/examples/python/native/ops/arg_top_k.py
@@ -0,0 +1,61 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_arg_top_k(ffconfig, input_arr: np.ndarray, k: int, sorted: bool, speculative_decoding: bool, name=None):
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    arg_top_k_output = ffmodel.arg_top_k(
+        input_tensor,
+        k,
+        sorted,
+        speculative_decoding,
+        name="arg_top_k_layer",
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_MEAN_SQUARED_ERROR,
+        metrics=[MetricsType.METRICS_MEAN_SQUARED_ERROR],
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    arg_top_k_output.inline_map(ffmodel, ffconfig)
+    output_result = arg_top_k_output.get_array(ffmodel, ffconfig)
+
+    return output_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 10).astype(np.float32)
+    k_value = 5
+    sorted_value = True
+    speculative_decoding_value = False  # Example value for speculative_decoding
+
+    output_result = test_arg_top_k(
+        ffconfig,
+        input_data,
+        k=k_value,
+        sorted=sorted_value,
+        speculative_decoding=speculative_decoding_value,
+    )
+
+    print("Input Array:")
+    print(input_data)
+    print("\nOutput Array after applying arg_top_k:")
+    print(output_result)
diff --git a/examples/python/native/ops/argmax.py b/examples/python/native/ops/argmax.py
new file mode 100644
index 0000000000..dda0e6b0bc
--- /dev/null
+++ b/examples/python/native/ops/argmax.py
@@ -0,0 +1,55 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_argmax(ffconfig, input_arr: np.ndarray, beam_search: bool, name=None):
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    argmax_output = ffmodel.argmax(
+        input_tensor,
+        beam_search,
+        name="argmax_layer",
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    argmax_output.inline_map(ffmodel, ffconfig)
+    output_result = argmax_output.get_array(ffmodel, ffconfig)
+
+    return output_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 10).astype(np.float32)
+    beam_search_value = True  # Set to True or False based on your requirement
+
+    output_result = test_argmax(
+        ffconfig,
+        input_data,
+        beam_search=beam_search_value,
+    )
+
+    print("Input Array:")
+    print(input_data)
+    print("\nOutput Array after applying argmax:")
+    print(output_result)
diff --git a/examples/python/native/ops/batch_matmul.py b/examples/python/native/ops/batch_matmul.py
new file mode 100644
index 0000000000..e69de29bb2
diff --git a/examples/python/native/ops/batch_norm.py b/examples/python/native/ops/batch_norm.py
new file mode 100644
index 0000000000..b243e79d37
--- /dev/null
+++ b/examples/python/native/ops/batch_norm.py
@@ -0,0 +1,36 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def ff(ffconfig, input_arr: np.ndarray):
+    ffmodel = FFModel(ffconfig)
+    # TODO: convert input to ff tensor
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    out = ffmodel.batch_norm(
+        input_tensor
+    )
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY])
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+    ffmodel.forward()
+
+    out.inline_map(ffmodel, ffconfig)
+    return out.get_array(ffmodel, ffconfig)
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    _ = ff(ffconfig, input)
diff --git a/examples/python/native/ops/beam_top_k.py b/examples/python/native/ops/beam_top_k.py
new file mode 100644
index 0000000000..cb2fdfb3d2
--- /dev/null
+++ b/examples/python/native/ops/beam_top_k.py
@@ -0,0 +1,58 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_beam_top_k(ffconfig, input_arr: np.ndarray, max_beam_size: int, sorted: bool, name=None):
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    beam_top_k_output = ffmodel.beam_top_k(
+        input_tensor,
+        max_beam_size,
+        sorted,
+        name="beam_top_k_layer",
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    beam_top_k_output.inline_map(ffmodel, ffconfig)
+    output_result = beam_top_k_output.get_array(ffmodel, ffconfig)
+
+    return output_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 10).astype(np.float32)
+    max_beam_size_value = 3
+    sorted_value = True
+
+    output_result = test_beam_top_k(
+        ffconfig,
+        input_data,
+        max_beam_size=max_beam_size_value,
+        sorted=sorted_value,
+    )
+
+    print("Input Array:")
+    print(input_data)
+    print("\nOutput Array after applying beam_top_k:")
+    print(output_result)
diff --git a/examples/python/native/ops/concat.py b/examples/python/native/ops/concat.py
new file mode 100644
index 0000000000..0088d7b848
--- /dev/null
+++ b/examples/python/native/ops/concat.py
@@ -0,0 +1,43 @@
+# The basis for this test of the 'concatenate' operation is generated by ChatGPT using the manually created conv2d.py as a template.
+
+
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+def test_concatenate(ffconfig, input_arr1: np.ndarray, input_arr2: np.ndarray) -> flexflow.core.Tensor:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor1 = ffmodel.create_tensor(input_arr1.shape, DataType.DT_FLOAT)
+    input_tensor2 = ffmodel.create_tensor(input_arr2.shape, DataType.DT_FLOAT)
+
+    out = ffmodel.concat([input_tensor1, input_tensor2], axis=1)
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY])
+    dataloader_input1 = ffmodel.create_data_loader(input_tensor1, input_arr1)
+    dataloader_input2 = ffmodel.create_data_loader(input_tensor2, input_arr2)
+
+    ffmodel.init_layers()
+
+    dataloader_input1.reset()
+    dataloader_input1.next_batch(ffmodel)
+
+    dataloader_input2.reset()
+    dataloader_input2.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    out.inline_map(ffmodel, ffconfig)
+    return out.get_array(ffmodel, ffconfig)
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input1 = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    input2 = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    _ = test_concatenate(ffconfig, input1, input2)
diff --git a/examples/python/native/ops/conv2d.py b/examples/python/native/ops/conv2d.py
new file mode 100644
index 0000000000..02b3646aaa
--- /dev/null
+++ b/examples/python/native/ops/conv2d.py
@@ -0,0 +1,45 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def ff(ffconfig, input_arr: np.ndarray) -> flexflow.core.Tensor:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    out = ffmodel.conv2d(
+        input_tensor,
+        32,
+        3,
+        3,
+        1,
+        1,
+        1,
+        1,
+        use_bias=False
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY])
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+    ffmodel.forward()
+
+    out.inline_map(ffmodel, ffconfig)
+    return out.get_array(ffmodel, ffconfig)
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    _ = ff(ffconfig, input)
diff --git a/examples/python/native/ops/cos.py b/examples/python/native/ops/cos.py
new file mode 100644
index 0000000000..26f6307685
--- /dev/null
+++ b/examples/python/native/ops/cos.py
@@ -0,0 +1,44 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_cos(ffconfig, input_arr: np.ndarray) -> np.ndarray:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    cos_output = ffmodel.cos(input_tensor, name="cos_layer")
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+    ffmodel.forward()
+
+    cos_output.inline_map(ffmodel, ffconfig)
+    cos_result = cos_output.get_array(ffmodel, ffconfig)
+
+    return cos_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    cos_result = test_cos(ffconfig, input_data)
+
+    print("Input Array:")
+    print(input_data)
+    print("\nOutput Array after applying cos function:")
+    print(cos_result)
diff --git a/examples/python/native/ops/dense.py b/examples/python/native/ops/dense.py
new file mode 100644
index 0000000000..ec0a3dc65b
--- /dev/null
+++ b/examples/python/native/ops/dense.py
@@ -0,0 +1,38 @@
+# The basis for this test of the 'dense' layer is generated by ChatGPT using the manually created conv2d.py as a template.
+
+
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_dense(ffconfig, input_arr: np.ndarray) -> flexflow.core.Tensor:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    out = ffmodel.dense(input_tensor, 64, activation=ActiMode.AC_MODE_RELU)
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY])
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+    ffmodel.forward()
+
+    out.inline_map(ffmodel, ffconfig)
+    return out.get_array(ffmodel, ffconfig)
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input = np.random.randn(ffconfig.batch_size, 10).astype(np.float32)
+    _ = test_dense(ffconfig, input)
diff --git a/examples/python/native/ops/divide.py b/examples/python/native/ops/divide.py
new file mode 100644
index 0000000000..419bf714ab
--- /dev/null
+++ b/examples/python/native/ops/divide.py
@@ -0,0 +1,48 @@
+# The basis for this test of the 'divide' operation is generated by ChatGPT using the manually created conv2d.py as a template.
+
+
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+def test_divide(ffconfig, input_arr1: np.ndarray, input_arr2: np.ndarray) -> flexflow.core.Tensor:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor1 = ffmodel.create_tensor(input_arr1.shape, DataType.DT_FLOAT)
+    input_tensor2 = ffmodel.create_tensor(input_arr2.shape, DataType.DT_FLOAT)
+
+    out = ffmodel.divide(input_tensor1, input_tensor2)
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY])
+    dataloader_input1 = ffmodel.create_data_loader(input_tensor1, input_arr1)
+    dataloader_input2 = ffmodel.create_data_loader(input_tensor2, input_arr2)
+
+    ffmodel.init_layers()
+
+    dataloader_input1.reset()
+    dataloader_input1.next_batch(ffmodel)
+
+    dataloader_input2.reset()
+    dataloader_input2.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    out.inline_map(ffmodel, ffconfig)
+    return out.get_array(ffmodel, ffconfig)
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input1 = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    input2 = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+
+    # Avoid division by zero in input2
+    input2 = np.where(input2 == 0, 1e-6, input2)
+
+    _ = test_divide(ffconfig, input1, input2)
diff --git a/examples/python/native/ops/dropout.py b/examples/python/native/ops/dropout.py
new file mode 100644
index 0000000000..3aa44a5a5b
--- /dev/null
+++ b/examples/python/native/ops/dropout.py
@@ -0,0 +1,49 @@
+# The basis for this test of the 'Dropout' layer is generated by ChatGPT using the manually created conv2d.py as a template.
+
+
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+def test_dropout(ffconfig, input_arr: np.ndarray, dropout_rate: float = 0.5) -> flexflow.core.Tensor:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    # Apply Dropout layer
+    out = ffmodel.dropout(input_tensor, dropout_rate, 0)
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY])
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    out.inline_map(ffmodel, ffconfig)
+    return out.get_array(ffmodel, ffconfig)
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+
+    # You can adjust the dropout rate as needed
+    dropout_rate_param = 0.5
+
+    result = test_dropout(ffconfig, input_data, dropout_rate_param)
+
+    print("Input Data:")
+    print(input_data)
+
+    print("\nResult after Dropout layer:")
+    print(result)
diff --git a/examples/python/native/ops/elu.py b/examples/python/native/ops/elu.py
new file mode 100644
index 0000000000..7a6ef1f621
--- /dev/null
+++ b/examples/python/native/ops/elu.py
@@ -0,0 +1,47 @@
+# The basis for this test of the 'ELU' activation function is generated by ChatGPT using the manually created conv2d.py as a template.
+
+
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_elu(ffconfig, input_arr: np.ndarray) -> flexflow.core.Tensor:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    # Apply ELU activation
+    out = ffmodel.elu(input_tensor)
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY])
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    out.inline_map(ffmodel, ffconfig)
+    return out.get_array(ffmodel, ffconfig)
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+
+    result = test_elu(ffconfig, input_data)
+
+    print("Input Data:")
+    print(input_data)
+
+    print("\nResult after ELU activation:")
+    print(result)
diff --git a/examples/python/native/ops/embedding.py b/examples/python/native/ops/embedding.py
new file mode 100644
index 0000000000..34bced3798
--- /dev/null
+++ b/examples/python/native/ops/embedding.py
@@ -0,0 +1,39 @@
+# The basis for this test of the 'embedding' layer is generated by ChatGPT using the manually created conv2d.py as a template.
+
+
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+def test_embedding(ffconfig, input_arr: np.ndarray, vocab_size: int, embedding_dim: int) -> flexflow.core.Tensor:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_INT32)
+
+    out = ffmodel.embedding(input_tensor, vocab_size, embedding_dim, AggrMode.AGGR_MODE_SUM)
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY])
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+    ffmodel.forward()
+
+    out.inline_map(ffmodel, ffconfig)
+    return out.get_array(ffmodel, ffconfig)
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    vocab_size = 1000
+    embedding_dim = 50
+    input = np.random.randint(low=0, high=vocab_size, size=(ffconfig.batch_size, 10), dtype=np.int32)
+    _ = test_embedding(ffconfig, input, vocab_size, embedding_dim)
diff --git a/examples/python/native/ops/exp.py b/examples/python/native/ops/exp.py
new file mode 100644
index 0000000000..e69de29bb2
diff --git a/examples/python/native/ops/flat.py b/examples/python/native/ops/flat.py
new file mode 100644
index 0000000000..e69de29bb2
diff --git a/examples/python/native/ops/gather.py b/examples/python/native/ops/gather.py
new file mode 100644
index 0000000000..e13b6e4c75
--- /dev/null
+++ b/examples/python/native/ops/gather.py
@@ -0,0 +1,60 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_gather(ffconfig, input_arr: np.ndarray, index_arr: np.ndarray, dim: int, name=None):
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+    index_tensor = ffmodel.create_tensor(index_arr.shape, DataType.DT_INT32)
+
+    gather_output = ffmodel.gather(
+        input_tensor,
+        index_tensor,
+        dim,
+        name="gather_layer"
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+    dataloader_index = ffmodel.create_data_loader(index_tensor, index_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_index.reset()
+
+    dataloader_input.next_batch(ffmodel)
+    dataloader_index.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    gather_output.inline_map(ffmodel, ffconfig)
+    output_result = gather_output.get_array(ffmodel, ffconfig)
+
+    return output_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    index_data = np.random.randint(0, 5, size=(ffconfig.batch_size,)).astype(np.int32)
+    dim_to_gather = 2  # Example dimension to gather along
+
+    output_result = test_gather(ffconfig, input_data, index_data, dim=dim_to_gather)
+
+    print("Input Array:")
+    print(input_data)
+    print("\nIndex Array:")
+    print(index_data)
+    print(f"\nOutput Array after applying gather along dimension {dim_to_gather}:")
+    print(output_result)
diff --git a/examples/python/native/ops/gelu.py b/examples/python/native/ops/gelu.py
new file mode 100644
index 0000000000..84fabd36e1
--- /dev/null
+++ b/examples/python/native/ops/gelu.py
@@ -0,0 +1,51 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_gelu(ffconfig, input_arr: np.ndarray, inplace: bool = True, name=None):
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    gelu_output = ffmodel.gelu(
+        input_tensor,
+        inplace=inplace,
+        name="gelu_layer"
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    gelu_output.inline_map(ffmodel, ffconfig)
+    output_result = gelu_output.get_array(ffmodel, ffconfig)
+
+    return output_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    inplace_flag = True  # Example inplace flag
+
+    output_result = test_gelu(ffconfig, input_data, inplace=inplace_flag)
+
+    print("Input Array:")
+    print(input_data)
+    print(f"\nOutput Array after applying gelu activation function (inplace={inplace_flag}):")
+    print(output_result)
diff --git a/examples/python/native/ops/identity.py b/examples/python/native/ops/identity.py
new file mode 100644
index 0000000000..fbf63e717c
--- /dev/null
+++ b/examples/python/native/ops/identity.py
@@ -0,0 +1,49 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_identity(ffconfig, input_arr: np.ndarray, name=None):
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    identity_output = ffmodel.identity(
+        input_tensor,
+        name="identity_layer"
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    identity_output.inline_map(ffmodel, ffconfig)
+    output_result = identity_output.get_array(ffmodel, ffconfig)
+
+    return output_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+
+    output_result = test_identity(ffconfig, input_data)
+
+    print("Input Array:")
+    print(input_data)
+    print("\nOutput Array after applying identity function:")
+    print(output_result)
diff --git a/examples/python/native/ops/inc_multihead_self_attention.py b/examples/python/native/ops/inc_multihead_self_attention.py
new file mode 100644
index 0000000000..dce7bd565d
--- /dev/null
+++ b/examples/python/native/ops/inc_multihead_self_attention.py
@@ -0,0 +1,103 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_inc_multihead_self_attention(
+        ffconfig,
+        input_arr: np.ndarray,
+        embed_dim: int,
+        num_heads: int,
+        kdim: int = 0,
+        vdim: int = 0,
+        dropout: float = 0.0,
+        bias: bool = True,
+        add_bias_kv: bool = False,
+        add_zero_attn: bool = False,
+        data_type: DataType = DataType.DT_NONE,
+        kernel_initializer=None,
+        apply_rotary_embedding: bool = False,
+        scaling_query: bool = False,
+        scaling_factor: float = 1.0,
+        qk_prod_scaling: bool = True,
+        position_bias: bool = False,
+        name=None,
+):
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, data_type)
+
+    inc_multihead_self_attention_output = ffmodel.inc_multihead_self_attention(
+        input_tensor,
+        embed_dim,
+        num_heads,
+        kdim=kdim,
+        vdim=vdim,
+        dropout=dropout,
+        bias=bias,
+        add_bias_kv=add_bias_kv,
+        add_zero_attn=add_zero_attn,
+        data_type=data_type,
+        kernel_initializer=kernel_initializer,
+        apply_rotary_embedding=apply_rotary_embedding,
+        scaling_query=scaling_query,
+        scaling_factor=scaling_factor,
+        qk_prod_scaling=qk_prod_scaling,
+        position_bias=position_bias,
+        name="inc_multihead_self_attention_layer",
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    inc_multihead_self_attention_output.inline_map(ffmodel, ffconfig)
+    output_result = inc_multihead_self_attention_output.get_array(ffmodel, ffconfig)
+
+    return output_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 10, 20).astype(np.float32)
+    embed_dim_value = 64
+    num_heads_value = 8
+
+    output_result = test_inc_multihead_self_attention(
+        ffconfig,
+        input_data,
+        embed_dim=embed_dim_value,
+        num_heads=num_heads_value,
+        kdim=0,  # Example value for kdim
+        vdim=0,  # Example value for vdim
+        dropout=0.1,  # Example value for dropout
+        bias=True,
+        add_bias_kv=False,
+        add_zero_attn=False,
+        data_type=DataType.DT_FLOAT,
+        kernel_initializer=None,  # Example value for kernel_initializer
+        apply_rotary_embedding=False,
+        scaling_query=False,
+        scaling_factor=1.0,
+        qk_prod_scaling=True,
+        position_bias=False,
+    )
+
+    print("Input Array:")
+    print(input_data)
+    print("\nOutput Array after applying inc_multihead_self_attention:")
+    print(output_result)
diff --git a/examples/python/native/ops/inc_multihead_self_attention_verify.py b/examples/python/native/ops/inc_multihead_self_attention_verify.py
new file mode 100644
index 0000000000..f6dc8e3933
--- /dev/null
+++ b/examples/python/native/ops/inc_multihead_self_attention_verify.py
@@ -0,0 +1,103 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_inc_multihead_self_attention_verify(
+        ffconfig,
+        input_arr: np.ndarray,
+        embed_dim: int,
+        num_heads: int,
+        kdim: int = 0,
+        vdim: int = 0,
+        dropout: float = 0.0,
+        bias: bool = True,
+        add_bias_kv: bool = False,
+        add_zero_attn: bool = False,
+        data_type: DataType = DataType.DT_NONE,
+        kernel_initializer=None,
+        apply_rotary_embedding: bool = False,
+        scaling_query: bool = False,
+        scaling_factor: float = 1.0,
+        qk_prod_scaling: bool = True,
+        position_bias: bool = False,
+        name=None,
+):
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, data_type)
+
+    inc_multihead_self_attention_verify_output = ffmodel.inc_multihead_self_attention_verify(
+        input_tensor,
+        embed_dim,
+        num_heads,
+        kdim=kdim,
+        vdim=vdim,
+        dropout=dropout,
+        bias=bias,
+        add_bias_kv=add_bias_kv,
+        add_zero_attn=add_zero_attn,
+        data_type=data_type,
+        kernel_initializer=kernel_initializer,
+        apply_rotary_embedding=apply_rotary_embedding,
+        scaling_query=scaling_query,
+        scaling_factor=scaling_factor,
+        qk_prod_scaling=qk_prod_scaling,
+        position_bias=position_bias,
+        name="inc_multihead_self_attention_verify_layer",
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    inc_multihead_self_attention_verify_output.inline_map(ffmodel, ffconfig)
+    output_result = inc_multihead_self_attention_verify_output.get_array(ffmodel, ffconfig)
+
+    return output_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 10, 20).astype(np.float32)
+    embed_dim_value = 64
+    num_heads_value = 8
+
+    output_result = test_inc_multihead_self_attention_verify(
+        ffconfig,
+        input_data,
+        embed_dim=embed_dim_value,
+        num_heads=num_heads_value,
+        kdim=0,  # Example value for kdim
+        vdim=0,  # Example value for vdim
+        dropout=0.1,  # Example value for dropout
+        bias=True,
+        add_bias_kv=False,
+        add_zero_attn=False,
+        data_type=DataType.DT_FLOAT,
+        kernel_initializer=None,  # Example value for kernel_initializer
+        apply_rotary_embedding=False,
+        scaling_query=False,
+        scaling_factor=1.0,
+        qk_prod_scaling=True,
+        position_bias=False,
+    )
+
+    print("Input Array:")
+    print(input_data)
+    print("\nOutput Array after applying inc_multihead_self_attention_verify:")
+    print(output_result)
diff --git a/examples/python/native/ops/inc_multiquery_self_attention.py b/examples/python/native/ops/inc_multiquery_self_attention.py
new file mode 100644
index 0000000000..33390ab1f6
--- /dev/null
+++ b/examples/python/native/ops/inc_multiquery_self_attention.py
@@ -0,0 +1,107 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_inc_multiquery_self_attention(
+        ffconfig,
+        input_arr: np.ndarray,
+        embed_dim: int,
+        num_q_heads: int,
+        num_kv_heads: int,
+        kdim: int = 0,
+        vdim: int = 0,
+        dropout: float = 0.0,
+        bias: bool = True,
+        add_bias_kv: bool = False,
+        add_zero_attn: bool = False,
+        data_type: DataType = DataType.DT_NONE,
+        kernel_initializer=None,
+        apply_rotary_embedding: bool = False,
+        scaling_query: bool = False,
+        scaling_factor: float = 1.0,
+        qk_prod_scaling: bool = True,
+        position_bias: bool = False,
+        name=None,
+):
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, data_type)
+
+    inc_multiquery_self_attention_output = ffmodel.inc_multiquery_self_attention(
+        input_tensor,
+        embed_dim,
+        num_q_heads,
+        num_kv_heads,
+        kdim=kdim,
+        vdim=vdim,
+        dropout=dropout,
+        bias=bias,
+        add_bias_kv=add_bias_kv,
+        add_zero_attn=add_zero_attn,
+        data_type=data_type,
+        kernel_initializer=kernel_initializer,
+        apply_rotary_embedding=apply_rotary_embedding,
+        scaling_query=scaling_query,
+        scaling_factor=scaling_factor,
+        qk_prod_scaling=qk_prod_scaling,
+        position_bias=position_bias,
+        name="inc_multiquery_self_attention_layer",
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    inc_multiquery_self_attention_output.inline_map(ffmodel, ffconfig)
+    output_result = inc_multiquery_self_attention_output.get_array(ffmodel, ffconfig)
+
+    return output_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 10, 20).astype(np.float32)
+    embed_dim_value = 64
+    num_q_heads_value = 4
+    num_kv_heads_value = 4
+
+    output_result = test_inc_multiquery_self_attention(
+        ffconfig,
+        input_data,
+        embed_dim=embed_dim_value,
+        num_q_heads=num_q_heads_value,
+        num_kv_heads=num_kv_heads_value,
+        kdim=0,  # Example value for kdim
+        vdim=0,  # Example value for vdim
+        dropout=0.1,  # Example value for dropout
+        bias=True,
+        add_bias_kv=False,
+        add_zero_attn=False,
+        data_type=DataType.DT_FLOAT,
+        kernel_initializer=None,  # Example value for kernel_initializer
+        apply_rotary_embedding=False,
+        scaling_query=False,
+        scaling_factor=1.0,
+        qk_prod_scaling=True,
+        position_bias=False,
+    )
+
+    print("Input Array:")
+    print(input_data)
+    print("\nOutput Array after applying inc_multiquery_self_attention:")
+    print(output_result)
diff --git a/examples/python/native/ops/inc_multiquery_self_attention_verify.py b/examples/python/native/ops/inc_multiquery_self_attention_verify.py
new file mode 100644
index 0000000000..69a76f68bf
--- /dev/null
+++ b/examples/python/native/ops/inc_multiquery_self_attention_verify.py
@@ -0,0 +1,107 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_inc_multiquery_self_attention_verify(
+        ffconfig,
+        input_arr: np.ndarray,
+        embed_dim: int,
+        num_q_heads: int,
+        num_kv_heads: int,
+        kdim: int = 0,
+        vdim: int = 0,
+        dropout: float = 0.0,
+        bias: bool = True,
+        add_bias_kv: bool = False,
+        add_zero_attn: bool = False,
+        data_type: DataType = DataType.DT_NONE,
+        kernel_initializer=None,
+        apply_rotary_embedding: bool = False,
+        scaling_query: bool = False,
+        scaling_factor: float = 1.0,
+        qk_prod_scaling: bool = True,
+        position_bias: bool = False,
+        name=None,
+):
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, data_type)
+
+    inc_multiquery_self_attention_verify_output = ffmodel.inc_multiquery_self_attention_verify(
+        input_tensor,
+        embed_dim,
+        num_q_heads,
+        num_kv_heads,
+        kdim=kdim,
+        vdim=vdim,
+        dropout=dropout,
+        bias=bias,
+        add_bias_kv=add_bias_kv,
+        add_zero_attn=add_zero_attn,
+        data_type=data_type,
+        kernel_initializer=kernel_initializer,
+        apply_rotary_embedding=apply_rotary_embedding,
+        scaling_query=scaling_query,
+        scaling_factor=scaling_factor,
+        qk_prod_scaling=qk_prod_scaling,
+        position_bias=position_bias,
+        name="inc_multiquery_self_attention_verify_layer",
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    inc_multiquery_self_attention_verify_output.inline_map(ffmodel, ffconfig)
+    output_result = inc_multiquery_self_attention_verify_output.get_array(ffmodel, ffconfig)
+
+    return output_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 10, 20).astype(np.float32)
+    embed_dim_value = 64
+    num_q_heads_value = 4
+    num_kv_heads_value = 4
+
+    output_result = test_inc_multiquery_self_attention_verify(
+        ffconfig,
+        input_data,
+        embed_dim=embed_dim_value,
+        num_q_heads=num_q_heads_value,
+        num_kv_heads=num_kv_heads_value,
+        kdim=0,  # Example value for kdim
+        vdim=0,  # Example value for vdim
+        dropout=0.1,  # Example value for dropout
+        bias=True,
+        add_bias_kv=False,
+        add_zero_attn=False,
+        data_type=DataType.DT_FLOAT,
+        kernel_initializer=None,  # Example value for kernel_initializer
+        apply_rotary_embedding=False,
+        scaling_query=False,
+        scaling_factor=1.0,
+        qk_prod_scaling=True,
+        position_bias=False,
+    )
+
+    print("Input Array:")
+    print(input_data)
+    print("\nOutput Array after applying inc_multiquery_self_attention_verify:")
+    print(output_result)
diff --git a/examples/python/native/ops/layer_norm.py b/examples/python/native/ops/layer_norm.py
new file mode 100644
index 0000000000..b3cca93d6e
--- /dev/null
+++ b/examples/python/native/ops/layer_norm.py
@@ -0,0 +1,48 @@
+from typing import List
+
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_layer_norm(ffconfig, input_arr: np.ndarray, axes: List[int], elementwise_affine: bool = True, eps: float = 1e-5, use_bias: bool = True, name=None) -> np.ndarray:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    layer_norm_output = ffmodel.layer_norm(input_tensor, axes=axes, elementwise_affine=elementwise_affine, eps=eps, use_bias=use_bias, name="layer_norm_layer")
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+    ffmodel.forward()
+
+    layer_norm_output.inline_map(ffmodel, ffconfig)
+    layer_norm_result = layer_norm_output.get_array(ffmodel, ffconfig)
+
+    return layer_norm_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    axes_to_normalize = [1, 2]  # Example axes to normalize
+
+    layer_norm_result = test_layer_norm(ffconfig, input_data, axes=axes_to_normalize, elementwise_affine=True, eps=1e-5, use_bias=True)
+
+    print("Input Array:")
+    print(input_data)
+    print(f"\nOutput Array after applying layer_norm function along axes {axes_to_normalize}:")
+    print(layer_norm_result)
diff --git a/examples/python/native/ops/max.py b/examples/python/native/ops/max.py
new file mode 100644
index 0000000000..bf9c629406
--- /dev/null
+++ b/examples/python/native/ops/max.py
@@ -0,0 +1,54 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_max(ffconfig, input_arr1: np.ndarray, input_arr2: np.ndarray) -> np.ndarray:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor1 = ffmodel.create_tensor(input_arr1.shape, DataType.DT_FLOAT)
+    input_tensor2 = ffmodel.create_tensor(input_arr2.shape, DataType.DT_FLOAT)
+
+    max_output = ffmodel.max(input_tensor1, input_tensor2, name="max_layer")
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input1 = ffmodel.create_data_loader(input_tensor1, input_arr1)
+    dataloader_input2 = ffmodel.create_data_loader(input_tensor2, input_arr2)
+
+    ffmodel.init_layers()
+
+    dataloader_input1.reset()
+    dataloader_input2.reset()
+
+    dataloader_input1.next_batch(ffmodel)
+    dataloader_input2.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    max_output.inline_map(ffmodel, ffconfig)
+    max_result = max_output.get_array(ffmodel, ffconfig)
+
+    return max_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data1 = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    input_data2 = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+
+    max_result = test_max(ffconfig, input_data1, input_data2)
+
+    print("Input Array 1:")
+    print(input_data1)
+    print("\nInput Array 2:")
+    print(input_data2)
+    print("\nOutput Array after applying max function:")
+    print(max_result)
diff --git a/examples/python/native/ops/mean.py b/examples/python/native/ops/mean.py
new file mode 100644
index 0000000000..df8c3f642e
--- /dev/null
+++ b/examples/python/native/ops/mean.py
@@ -0,0 +1,48 @@
+from typing import List
+
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_mean(ffconfig, input_arr: np.ndarray, dims: List[int], keepdims: bool = False) -> np.ndarray:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    mean_output = ffmodel.mean(input_tensor, dims=dims, keepdims=keepdims, name="mean_layer")
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+    ffmodel.forward()
+
+    mean_output.inline_map(ffmodel, ffconfig)
+    mean_result = mean_output.get_array(ffmodel, ffconfig)
+
+    return mean_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    dims_to_mean = [1, 2]  # Example dimensions to take the mean over
+
+    mean_result = test_mean(ffconfig, input_data, dims=dims_to_mean, keepdims=False)
+
+    print("Input Array:")
+    print(input_data)
+    print(f"\nOutput Array after applying mean function along dimensions {dims_to_mean}:")
+    print(mean_result)
diff --git a/examples/python/native/ops/min.py b/examples/python/native/ops/min.py
new file mode 100644
index 0000000000..df81f4f2d2
--- /dev/null
+++ b/examples/python/native/ops/min.py
@@ -0,0 +1,54 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_min(ffconfig, input_arr1: np.ndarray, input_arr2: np.ndarray) -> np.ndarray:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor1 = ffmodel.create_tensor(input_arr1.shape, DataType.DT_FLOAT)
+    input_tensor2 = ffmodel.create_tensor(input_arr2.shape, DataType.DT_FLOAT)
+
+    min_output = ffmodel.min(input_tensor1, input_tensor2, name="min_layer")
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input1 = ffmodel.create_data_loader(input_tensor1, input_arr1)
+    dataloader_input2 = ffmodel.create_data_loader(input_tensor2, input_arr2)
+
+    ffmodel.init_layers()
+
+    dataloader_input1.reset()
+    dataloader_input2.reset()
+
+    dataloader_input1.next_batch(ffmodel)
+    dataloader_input2.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    min_output.inline_map(ffmodel, ffconfig)
+    min_result = min_output.get_array(ffmodel, ffconfig)
+
+    return min_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data1 = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    input_data2 = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+
+    min_result = test_min(ffconfig, input_data1, input_data2)
+
+    print("Input Array 1:")
+    print(input_data1)
+    print("\nInput Array 2:")
+    print(input_data2)
+    print("\nOutput Array after applying min function:")
+    print(min_result)
diff --git a/examples/python/native/ops/multihead_attention.py b/examples/python/native/ops/multihead_attention.py
new file mode 100644
index 0000000000..e69de29bb2
diff --git a/examples/python/native/ops/multiply.py b/examples/python/native/ops/multiply.py
new file mode 100644
index 0000000000..fb4f489150
--- /dev/null
+++ b/examples/python/native/ops/multiply.py
@@ -0,0 +1,45 @@
+# The basis for this test of the 'multiply' operation is generated by ChatGPT using the manually created conv2d.py as a template.
+
+
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+def test_multiply(ffconfig, input_arr1: np.ndarray, input_arr2: np.ndarray) -> flexflow.core.Tensor:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor1 = ffmodel.create_tensor(input_arr1.shape, DataType.DT_FLOAT)
+    input_tensor2 = ffmodel.create_tensor(input_arr2.shape, DataType.DT_FLOAT)
+
+    out = ffmodel.multiply(input_tensor1, input_tensor2)
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY])
+    dataloader_input1 = ffmodel.create_data_loader(input_tensor1, input_arr1)
+    dataloader_input2 = ffmodel.create_data_loader(input_tensor2, input_arr2)
+
+    ffmodel.init_layers()
+
+    dataloader_input1.reset()
+    dataloader_input1.next_batch(ffmodel)
+
+    dataloader_input2.reset()
+    dataloader_input2.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    out.inline_map(ffmodel, ffconfig)
+    return out.get_array(ffmodel, ffconfig)
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input1 = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    input2 = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+
+    _ = test_multiply(ffconfig, input1, input2)
diff --git a/examples/python/native/ops/pool2d.py b/examples/python/native/ops/pool2d.py
new file mode 100644
index 0000000000..b4dc8b219e
--- /dev/null
+++ b/examples/python/native/ops/pool2d.py
@@ -0,0 +1,36 @@
+# AI generated from conv2d example
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_pool2d(ffconfig, input_arr: np.ndarray) -> flexflow.core.Tensor:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    out = ffmodel.pool2d(input_tensor, 3, 3, 1, 1, 0, 0, PoolType.POOL_MAX)
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY])
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+    ffmodel.forward()
+
+    out.inline_map(ffmodel, ffconfig)
+    return out.get_array(ffmodel, ffconfig)
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    _ = test_pool2d(ffconfig, input)
\ No newline at end of file
diff --git a/examples/python/native/ops/pow.py b/examples/python/native/ops/pow.py
new file mode 100644
index 0000000000..cf5bbebd80
--- /dev/null
+++ b/examples/python/native/ops/pow.py
@@ -0,0 +1,46 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_pow(ffconfig, input_arr: np.ndarray, exponent: float) -> np.ndarray:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    pow_output = ffmodel.pow(input_tensor, exponent, name="pow_layer")
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+    ffmodel.forward()
+
+    pow_output.inline_map(ffmodel, ffconfig)
+    pow_result = pow_output.get_array(ffmodel, ffconfig)
+
+    return pow_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    exponent_value = 2.0  # Example exponent value
+
+    pow_result = test_pow(ffconfig, input_data, exponent=exponent_value)
+
+    print("Input Array:")
+    print(input_data)
+    print(f"\nOutput Array after applying pow function with exponent {exponent_value}:")
+    print(pow_result)
diff --git a/examples/python/native/ops/reduce_sum.py b/examples/python/native/ops/reduce_sum.py
new file mode 100644
index 0000000000..7e7b41b799
--- /dev/null
+++ b/examples/python/native/ops/reduce_sum.py
@@ -0,0 +1,48 @@
+from typing import List
+
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_reduce_sum(ffconfig, input_arr: np.ndarray, axes: List[int], keepdims: bool = False) -> np.ndarray:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    reduce_sum_output = ffmodel.reduce_sum(input_tensor, axes=axes, keepdims=keepdims, name="reduce_sum_layer")
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+    ffmodel.forward()
+
+    reduce_sum_output.inline_map(ffmodel, ffconfig)
+    reduce_sum_result = reduce_sum_output.get_array(ffmodel, ffconfig)
+
+    return reduce_sum_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    axes_to_reduce = [1, 2]  # Example axes to reduce
+
+    reduce_sum_result = test_reduce_sum(ffconfig, input_data, axes=axes_to_reduce, keepdims=False)
+
+    print("Input Array:")
+    print(input_data)
+    print(f"\nOutput Array after applying reduce_sum along axes {axes_to_reduce}:")
+    print(reduce_sum_result)
diff --git a/examples/python/native/ops/relu.py b/examples/python/native/ops/relu.py
new file mode 100644
index 0000000000..d855b27164
--- /dev/null
+++ b/examples/python/native/ops/relu.py
@@ -0,0 +1,46 @@
+# The basis for this test of the 'ReLU' activation function is generated by ChatGPT using the manually created conv2d.py as a template.
+
+
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+def test_relu(ffconfig, input_arr: np.ndarray) -> flexflow.core.Tensor:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    # Apply ReLU activation
+    out = ffmodel.relu(input_tensor)
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY])
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    out.inline_map(ffmodel, ffconfig)
+    return out.get_array(ffmodel, ffconfig)
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+
+    result = test_relu(ffconfig, input_data)
+
+    print("Input Data:")
+    print(input_data)
+
+    print("\nResult after ReLU activation:")
+    print(result)
diff --git a/examples/python/native/ops/reshape.py b/examples/python/native/ops/reshape.py
new file mode 100644
index 0000000000..348d6bd935
--- /dev/null
+++ b/examples/python/native/ops/reshape.py
@@ -0,0 +1,41 @@
+# The basis for this test of the 'reshape' operation is generated by ChatGPT using the manually created conv2d.py as a template.
+
+from typing import List
+
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+def test_reshape(ffconfig, input_arr: np.ndarray, target_shape: List[int]) -> flexflow.core.Tensor:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    out = ffmodel.reshape(input_tensor, target_shape)
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY])
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    out.inline_map(ffmodel, ffconfig)
+    return out.get_array(ffmodel, ffconfig)
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    target_shape = [ffconfig.batch_size, 500]
+
+    _ = test_reshape(ffconfig, input, target_shape)
diff --git a/examples/python/native/ops/residual_layer_norm.py b/examples/python/native/ops/residual_layer_norm.py
new file mode 100644
index 0000000000..e12f2e53d9
--- /dev/null
+++ b/examples/python/native/ops/residual_layer_norm.py
@@ -0,0 +1,93 @@
+from typing import List
+
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_residual_layer_norm(ffconfig, input_arr: np.ndarray, residual1_arr: np.ndarray, residual2_arr: np.ndarray, use_two_residuals: bool, axes: List[int], elementwise_affine: bool = True, eps: float = 1e-5, use_bias: bool = True, name=None):
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+    residual1_tensor = ffmodel.create_tensor(residual1_arr.shape, DataType.DT_FLOAT)
+    residual2_tensor = ffmodel.create_tensor(residual2_arr.shape, DataType.DT_FLOAT)
+
+    output_tensor, layer_norm_output = ffmodel.residual_layer_norm(
+        input_tensor,
+        residual1_tensor,
+        residual2_tensor if use_two_residuals else None,
+        use_two_residuals,
+        axes=axes,
+        elementwise_affine=elementwise_affine,
+        eps=eps,
+        use_bias=use_bias,
+        name="residual_layer_norm_layer"
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+    dataloader_residual1 = ffmodel.create_data_loader(residual1_tensor, residual1_arr)
+    dataloader_residual2 = ffmodel.create_data_loader(residual2_tensor, residual2_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_residual1.reset()
+    if use_two_residuals:
+        dataloader_residual2.reset()
+
+    dataloader_input.next_batch(ffmodel)
+    dataloader_residual1.next_batch(ffmodel)
+    if use_two_residuals:
+        dataloader_residual2.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    output_tensor.inline_map(ffmodel, ffconfig)
+    layer_norm_output.inline_map(ffmodel, ffconfig)
+    output_result = output_tensor.get_array(ffmodel, ffconfig)
+    layer_norm_result = layer_norm_output.get_array(ffmodel, ffconfig)
+
+    return output_result, layer_norm_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    residual1_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    residual2_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    use_two_residuals_flag = True  # Example flag
+
+    axes_to_normalize = [1, 2]  # Example axes to normalize
+
+    output_result, layer_norm_result = test_residual_layer_norm(
+        ffconfig,
+        input_data,
+        residual1_data,
+        residual2_data,
+        use_two_residuals_flag,
+        axes=axes_to_normalize,
+        elementwise_affine=True,
+        eps=1e-5,
+        use_bias=True
+    )
+
+    print("Input Array:")
+    print(input_data)
+    print("\nResidual1 Array:")
+    print(residual1_data)
+    if use_two_residuals_flag:
+        print("\nResidual2 Array:")
+        print(residual2_data)
+    print(f"\nOutput Array after applying residual_layer_norm along axes {axes_to_normalize} with use_two_residuals={use_two_residuals_flag}:")
+    print(output_result)
+    print("\nLayer Norm Result:")
+    print(layer_norm_result)
diff --git a/examples/python/native/ops/residual_rms_norm.py b/examples/python/native/ops/residual_rms_norm.py
new file mode 100644
index 0000000000..9027dffada
--- /dev/null
+++ b/examples/python/native/ops/residual_rms_norm.py
@@ -0,0 +1,80 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_residual_rms_norm(
+        ffconfig,
+        input1_arr: np.ndarray,
+        input2_arr: np.ndarray,
+        eps: float,
+        dim: int,
+        name=None,
+):
+    ffmodel = FFModel(ffconfig)
+
+    input1_tensor = ffmodel.create_tensor(input1_arr.shape, DataType.DT_FLOAT)
+    input2_tensor = ffmodel.create_tensor(input2_arr.shape, DataType.DT_FLOAT)
+
+    residual_rms_norm_output1, residual_rms_norm_output2 = ffmodel.residual_rms_norm(
+        input1_tensor,
+        input2_tensor,
+        eps,
+        dim,
+        name="residual_rms_norm_layer",
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input1 = ffmodel.create_data_loader(input1_tensor, input1_arr)
+    dataloader_input2 = ffmodel.create_data_loader(input2_tensor, input2_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input1.reset()
+    dataloader_input1.next_batch(ffmodel)
+
+    dataloader_input2.reset()
+    dataloader_input2.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    residual_rms_norm_output1.inline_map(ffmodel, ffconfig)
+    output_result1 = residual_rms_norm_output1.get_array(ffmodel, ffconfig)
+
+    residual_rms_norm_output2.inline_map(ffmodel, ffconfig)
+    output_result2 = residual_rms_norm_output2.get_array(ffmodel, ffconfig)
+
+    return output_result1, output_result2
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input1_data = np.random.randn(ffconfig.batch_size, 10, 20).astype(np.float32)
+    input2_data = np.random.randn(ffconfig.batch_size, 10, 20).astype(np.float32)
+    eps_value = 1e-6
+    dim_value = 1  # Example value for dim
+
+    output_result1, output_result2 = test_residual_rms_norm(
+        ffconfig,
+        input1_data,
+        input2_data,
+        eps=eps_value,
+        dim=dim_value,
+    )
+
+    print("Input Array 1:")
+    print(input1_data)
+    print("\nInput Array 2:")
+    print(input2_data)
+    print("\nOutput Array 1 after applying residual_rms_norm:")
+    print(output_result1)
+    print("\nOutput Array 2 after applying residual_rms_norm:")
+    print(output_result2)
diff --git a/examples/python/native/ops/reverse.py b/examples/python/native/ops/reverse.py
new file mode 100644
index 0000000000..25394d4b9a
--- /dev/null
+++ b/examples/python/native/ops/reverse.py
@@ -0,0 +1,37 @@
+# The basis for this test of the 'reverse' operation is generated by ChatGPT using the manually created conv2d.py as a template.
+
+
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+def test_reverse(ffconfig, input_arr: np.ndarray) -> flexflow.core.Tensor:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    out = ffmodel.reverse(input_tensor, axis=2)
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY])
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+    ffmodel.forward()
+
+    out.inline_map(ffmodel, ffconfig)
+    return out.get_array(ffmodel, ffconfig)
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    _ = test_reverse(ffconfig, input)
diff --git a/examples/python/native/ops/rms_norm.py b/examples/python/native/ops/rms_norm.py
new file mode 100644
index 0000000000..3983d7f891
--- /dev/null
+++ b/examples/python/native/ops/rms_norm.py
@@ -0,0 +1,64 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_rms_norm(
+        ffconfig,
+        input_arr: np.ndarray,
+        eps: float,
+        dim: int,
+        name=None,
+):
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    rms_norm_output = ffmodel.rms_norm(
+        input_tensor,
+        eps,
+        dim,
+        name="rms_norm_layer",
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_MEAN_SQUARED_ERROR, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY],
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    rms_norm_output.inline_map(ffmodel, ffconfig)
+    output_result = rms_norm_output.get_array(ffmodel, ffconfig)
+
+    return output_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 10, 20).astype(np.float32)
+    eps_value = 1e-6
+    dim_value = 1  # Example value for dim
+
+    output_result = test_rms_norm(
+        ffconfig,
+        input_data,
+        eps=eps_value,
+        dim=dim_value,
+    )
+
+    print("Input Array:")
+    print(input_data)
+    print("\nOutput Array after applying rms_norm:")
+    print(output_result)
diff --git a/examples/python/native/ops/rsqrt.py b/examples/python/native/ops/rsqrt.py
new file mode 100644
index 0000000000..3d9ab65449
--- /dev/null
+++ b/examples/python/native/ops/rsqrt.py
@@ -0,0 +1,44 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_rsqrt(ffconfig, input_arr: np.ndarray) -> np.ndarray:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    rsqrt_output = ffmodel.rsqrt(input_tensor, name="rsqrt_layer")
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+    ffmodel.forward()
+
+    rsqrt_output.inline_map(ffmodel, ffconfig)
+    rsqrt_result = rsqrt_output.get_array(ffmodel, ffconfig)
+
+    return rsqrt_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    rsqrt_result = test_rsqrt(ffconfig, input_data)
+
+    print("Input Array:")
+    print(input_data)
+    print("\nOutput Array after applying rsqrt function:")
+    print(rsqrt_result)
diff --git a/examples/python/native/ops/sampling.py b/examples/python/native/ops/sampling.py
new file mode 100644
index 0000000000..2219f09eff
--- /dev/null
+++ b/examples/python/native/ops/sampling.py
@@ -0,0 +1,55 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_sampling(ffconfig, input_arr: np.ndarray, top_p: float, name=None):
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    sampling_output = ffmodel.sampling(
+        input_tensor,
+        top_p,
+        name="sampling_layer",
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_MEAN_SQUARED_ERROR,
+        metrics=[MetricsType.METRICS_MEAN_SQUARED_ERROR],
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    sampling_output.inline_map(ffmodel, ffconfig)
+    output_result = sampling_output.get_array(ffmodel, ffconfig)
+
+    return output_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 10).astype(np.float32)
+    top_p_value = 0.8
+
+    output_result = test_sampling(
+        ffconfig,
+        input_data,
+        top_p=top_p_value,
+    )
+
+    print("Input Array:")
+    print(input_data)
+    print("\nOutput Array after applying sampling:")
+    print(output_result)
diff --git a/examples/python/native/ops/scalar_add.py b/examples/python/native/ops/scalar_add.py
new file mode 100644
index 0000000000..48a316ea8a
--- /dev/null
+++ b/examples/python/native/ops/scalar_add.py
@@ -0,0 +1,53 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_scalar_add(ffconfig, input_arr: np.ndarray, scalar: float, inplace: bool = True, name=None):
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    scalar_add_output = ffmodel.scalar_add(
+        input_tensor,
+        scalar,
+        inplace=inplace,
+        name="scalar_add_layer"
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    scalar_add_output.inline_map(ffmodel, ffconfig)
+    output_result = scalar_add_output.get_array(ffmodel, ffconfig)
+
+    return output_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    scalar_value = 2.0  # Example scalar value
+    inplace_flag = True  # Example inplace flag
+
+    output_result = test_scalar_add(ffconfig, input_data, scalar=scalar_value, inplace=inplace_flag)
+
+    print("Input Array:")
+    print(input_data)
+    print(f"\nOutput Array after applying scalar addition with scalar value {scalar_value} (inplace={inplace_flag}):")
+    print(output_result)
diff --git a/examples/python/native/ops/scalar_multiply.py b/examples/python/native/ops/scalar_multiply.py
new file mode 100644
index 0000000000..ebae5cce01
--- /dev/null
+++ b/examples/python/native/ops/scalar_multiply.py
@@ -0,0 +1,53 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_scalar_multiply(ffconfig, input_arr: np.ndarray, scalar: float, inplace: bool = True, name=None):
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    scalar_multiply_output = ffmodel.scalar_multiply(
+        input_tensor,
+        scalar,
+        inplace=inplace,
+        name="scalar_multiply_layer"
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    scalar_multiply_output.inline_map(ffmodel, ffconfig)
+    output_result = scalar_multiply_output.get_array(ffmodel, ffconfig)
+
+    return output_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    scalar_value = 2.0  # Example scalar value
+    inplace_flag = True  # Example inplace flag
+
+    output_result = test_scalar_multiply(ffconfig, input_data, scalar=scalar_value, inplace=inplace_flag)
+
+    print("Input Array:")
+    print(input_data)
+    print(f"\nOutput Array after applying scalar multiplication with scalar value {scalar_value} (inplace={inplace_flag}):")
+    print(output_result)
diff --git a/examples/python/native/ops/scalar_sub.py b/examples/python/native/ops/scalar_sub.py
new file mode 100644
index 0000000000..2dc467b573
--- /dev/null
+++ b/examples/python/native/ops/scalar_sub.py
@@ -0,0 +1,53 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_scalar_sub(ffconfig, input_arr: np.ndarray, scalar: float, inplace: bool = True, name=None):
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    scalar_sub_output = ffmodel.scalar_sub(
+        input_tensor,
+        scalar,
+        inplace=inplace,
+        name="scalar_sub_layer"
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    scalar_sub_output.inline_map(ffmodel, ffconfig)
+    output_result = scalar_sub_output.get_array(ffmodel, ffconfig)
+
+    return output_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    scalar_value = 2.0  # Example scalar value
+    inplace_flag = True  # Example inplace flag
+
+    output_result = test_scalar_sub(ffconfig, input_data, scalar=scalar_value, inplace=inplace_flag)
+
+    print("Input Array:")
+    print(input_data)
+    print(f"\nOutput Array after applying scalar subtraction with scalar value {scalar_value} (inplace={inplace_flag}):")
+    print(output_result)
diff --git a/examples/python/native/ops/scalar_true_divide.py b/examples/python/native/ops/scalar_true_divide.py
new file mode 100644
index 0000000000..f1b64df506
--- /dev/null
+++ b/examples/python/native/ops/scalar_true_divide.py
@@ -0,0 +1,53 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_scalar_true_divide(ffconfig, input_arr: np.ndarray, scalar: float, inplace: bool = True, name=None):
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    scalar_true_divide_output = ffmodel.scalar_true_divide(
+        input_tensor,
+        scalar,
+        inplace=inplace,
+        name="scalar_true_divide_layer"
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    scalar_true_divide_output.inline_map(ffmodel, ffconfig)
+    output_result = scalar_true_divide_output.get_array(ffmodel, ffconfig)
+
+    return output_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    scalar_value = 2.0  # Example scalar value
+    inplace_flag = True  # Example inplace flag
+
+    output_result = test_scalar_true_divide(ffconfig, input_data, scalar=scalar_value, inplace=inplace_flag)
+
+    print("Input Array:")
+    print(input_data)
+    print(f"\nOutput Array after applying scalar true division with scalar value {scalar_value} (inplace={inplace_flag}):")
+    print(output_result)
diff --git a/examples/python/native/ops/sigmoid.py b/examples/python/native/ops/sigmoid.py
new file mode 100644
index 0000000000..0fbe21df45
--- /dev/null
+++ b/examples/python/native/ops/sigmoid.py
@@ -0,0 +1,46 @@
+# The basis for this test of the 'Sigmoid' activation function is generated by ChatGPT using the manually created conv2d.py as a template.
+
+
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+def test_sigmoid(ffconfig, input_arr: np.ndarray) -> flexflow.core.Tensor:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    # Apply Sigmoid activation
+    out = ffmodel.sigmoid(input_tensor)
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY])
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    out.inline_map(ffmodel, ffconfig)
+    return out.get_array(ffmodel, ffconfig)
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+
+    result = test_sigmoid(ffconfig, input_data)
+
+    print("Input Data:")
+    print(input_data)
+
+    print("\nResult after Sigmoid activation:")
+    print(result)
diff --git a/examples/python/native/ops/sigmoid_silu_multi.py b/examples/python/native/ops/sigmoid_silu_multi.py
new file mode 100644
index 0000000000..cecc3e102e
--- /dev/null
+++ b/examples/python/native/ops/sigmoid_silu_multi.py
@@ -0,0 +1,58 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_sigmoid_silu_multi(ffconfig, input1_arr: np.ndarray, input2_arr: np.ndarray, name=None):
+    ffmodel = FFModel(ffconfig)
+
+    input1_tensor = ffmodel.create_tensor(input1_arr.shape, DataType.DT_FLOAT)
+    input2_tensor = ffmodel.create_tensor(input2_arr.shape, DataType.DT_FLOAT)
+
+    sigmoid_silu_multi_output = ffmodel.sigmoid_silu_multi(
+        input1_tensor,
+        input2_tensor,
+        name="sigmoid_silu_multi_layer"
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input1 = ffmodel.create_data_loader(input1_tensor, input1_arr)
+    dataloader_input2 = ffmodel.create_data_loader(input2_tensor, input2_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input1.reset()
+    dataloader_input2.reset()
+
+    dataloader_input1.next_batch(ffmodel)
+    dataloader_input2.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    sigmoid_silu_multi_output.inline_map(ffmodel, ffconfig)
+    output_result = sigmoid_silu_multi_output.get_array(ffmodel, ffconfig)
+
+    return output_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input1_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    input2_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+
+    output_result = test_sigmoid_silu_multi(ffconfig, input1_data, input2_data)
+
+    print("Input1 Array:")
+    print(input1_data)
+    print("\nInput2 Array:")
+    print(input2_data)
+    print("\nOutput Array after applying sigmoid_silu_multi:")
+    print(output_result)
diff --git a/examples/python/native/ops/sin.py b/examples/python/native/ops/sin.py
new file mode 100644
index 0000000000..4b60a4e1d4
--- /dev/null
+++ b/examples/python/native/ops/sin.py
@@ -0,0 +1,44 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_sin(ffconfig, input_arr: np.ndarray) -> np.ndarray:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    sin_output = ffmodel.sin(input_tensor, name="sin_layer")
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+    ffmodel.forward()
+
+    sin_output.inline_map(ffmodel, ffconfig)
+    sin_result = sin_output.get_array(ffmodel, ffconfig)
+
+    return sin_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    sin_result = test_sin(ffconfig, input_data)
+
+    print("Input Array:")
+    print(input_data)
+    print("\nOutput Array after applying sin function:")
+    print(sin_result)
diff --git a/examples/python/native/ops/softmax.py b/examples/python/native/ops/softmax.py
new file mode 100644
index 0000000000..b5481bcc80
--- /dev/null
+++ b/examples/python/native/ops/softmax.py
@@ -0,0 +1,46 @@
+# The basis for this test of the 'Softmax' activation function is generated by ChatGPT using the manually created conv2d.py as a template.
+
+
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+def test_softmax(ffconfig, input_arr: np.ndarray) -> flexflow.core.Tensor:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    # Apply Softmax activation
+    out = ffmodel.softmax(input_tensor)
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY])
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    out.inline_map(ffmodel, ffconfig)
+    return out.get_array(ffmodel, ffconfig)
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 5, 10).astype(np.float32)
+
+    result = test_softmax(ffconfig, input_data)
+
+    print("Input Data:")
+    print(input_data)
+
+    print("\nResult after Softmax activation:")
+    print(result)
diff --git a/examples/python/native/ops/spec_inc_multihead_self_attention.py b/examples/python/native/ops/spec_inc_multihead_self_attention.py
new file mode 100644
index 0000000000..bd1aaa189b
--- /dev/null
+++ b/examples/python/native/ops/spec_inc_multihead_self_attention.py
@@ -0,0 +1,103 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_spec_inc_multihead_self_attention(
+        ffconfig,
+        input_arr: np.ndarray,
+        embed_dim: int,
+        num_heads: int,
+        kdim: int = 0,
+        vdim: int = 0,
+        dropout: float = 0.0,
+        bias: bool = True,
+        add_bias_kv: bool = False,
+        add_zero_attn: bool = False,
+        data_type: DataType = DataType.DT_NONE,
+        kernel_initializer=None,
+        apply_rotary_embedding: bool = False,
+        scaling_query: bool = False,
+        scaling_factor: float = 1.0,
+        qk_prod_scaling: bool = True,
+        position_bias: bool = False,
+        name=None,
+):
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, data_type)
+
+    spec_inc_multihead_self_attention_output = ffmodel.spec_inc_multihead_self_attention(
+        input_tensor,
+        embed_dim,
+        num_heads,
+        kdim=kdim,
+        vdim=vdim,
+        dropout=dropout,
+        bias=bias,
+        add_bias_kv=add_bias_kv,
+        add_zero_attn=add_zero_attn,
+        data_type=data_type,
+        kernel_initializer=kernel_initializer,
+        apply_rotary_embedding=apply_rotary_embedding,
+        scaling_query=scaling_query,
+        scaling_factor=scaling_factor,
+        qk_prod_scaling=qk_prod_scaling,
+        position_bias=position_bias,
+        name="spec_inc_multihead_self_attention_layer",
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    spec_inc_multihead_self_attention_output.inline_map(ffmodel, ffconfig)
+    output_result = spec_inc_multihead_self_attention_output.get_array(ffmodel, ffconfig)
+
+    return output_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 10, 20).astype(np.float32)
+    embed_dim_value = 64
+    num_heads_value = 8
+
+    output_result = test_spec_inc_multihead_self_attention(
+        ffconfig,
+        input_data,
+        embed_dim=embed_dim_value,
+        num_heads=num_heads_value,
+        kdim=0,  # Example value for kdim
+        vdim=0,  # Example value for vdim
+        dropout=0.1,  # Example value for dropout
+        bias=True,
+        add_bias_kv=False,
+        add_zero_attn=False,
+        data_type=DataType.DT_FLOAT,
+        kernel_initializer=None,  # Example value for kernel_initializer
+        apply_rotary_embedding=False,
+        scaling_query=False,
+        scaling_factor=1.0,
+        qk_prod_scaling=True,
+        position_bias=False,
+    )
+
+    print("Input Array:")
+    print(input_data)
+    print("\nOutput Array after applying spec_inc_multihead_self_attention:")
+    print(output_result)
diff --git a/examples/python/native/ops/spec_inc_multiquery_self_attention.py b/examples/python/native/ops/spec_inc_multiquery_self_attention.py
new file mode 100644
index 0000000000..0b731c99e0
--- /dev/null
+++ b/examples/python/native/ops/spec_inc_multiquery_self_attention.py
@@ -0,0 +1,107 @@
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_spec_inc_multiquery_self_attention(
+        ffconfig,
+        input_arr: np.ndarray,
+        embed_dim: int,
+        num_q_heads: int,
+        num_kv_heads: int,
+        kdim: int = 0,
+        vdim: int = 0,
+        dropout: float = 0.0,
+        bias: bool = True,
+        add_bias_kv: bool = False,
+        add_zero_attn: bool = False,
+        data_type: DataType = DataType.DT_NONE,
+        kernel_initializer=None,
+        apply_rotary_embedding: bool = False,
+        scaling_query: bool = False,
+        scaling_factor: float = 1.0,
+        qk_prod_scaling: bool = True,
+        position_bias: bool = False,
+        name=None,
+):
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, data_type)
+
+    spec_inc_multiquery_self_attention_output = ffmodel.spec_inc_multiquery_self_attention(
+        input_tensor,
+        embed_dim,
+        num_q_heads,
+        num_kv_heads,
+        kdim=kdim,
+        vdim=vdim,
+        dropout=dropout,
+        bias=bias,
+        add_bias_kv=add_bias_kv,
+        add_zero_attn=add_zero_attn,
+        data_type=data_type,
+        kernel_initializer=kernel_initializer,
+        apply_rotary_embedding=apply_rotary_embedding,
+        scaling_query=scaling_query,
+        scaling_factor=scaling_factor,
+        qk_prod_scaling=qk_prod_scaling,
+        position_bias=position_bias,
+        name="spec_inc_multiquery_self_attention_layer",
+    )
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY]
+    )
+
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    spec_inc_multiquery_self_attention_output.inline_map(ffmodel, ffconfig)
+    output_result = spec_inc_multiquery_self_attention_output.get_array(ffmodel, ffconfig)
+
+    return output_result
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 10, 20).astype(np.float32)
+    embed_dim_value = 64
+    num_q_heads_value = 4
+    num_kv_heads_value = 4
+
+    output_result = test_spec_inc_multiquery_self_attention(
+        ffconfig,
+        input_data,
+        embed_dim=embed_dim_value,
+        num_q_heads=num_q_heads_value,
+        num_kv_heads=num_kv_heads_value,
+        kdim=0,  # Example value for kdim
+        vdim=0,  # Example value for vdim
+        dropout=0.1,  # Example value for dropout
+        bias=True,
+        add_bias_kv=False,
+        add_zero_attn=False,
+        data_type=DataType.DT_FLOAT,
+        kernel_initializer=None,  # Example value for kernel_initializer
+        apply_rotary_embedding=False,
+        scaling_query=False,
+        scaling_factor=1.0,
+        qk_prod_scaling=True,
+        position_bias=False,
+    )
+
+    print("Input Array:")
+    print(input_data)
+    print("\nOutput Array after applying spec_inc_multiquery_self_attention:")
+    print(output_result)
diff --git a/examples/python/native/ops/split.py b/examples/python/native/ops/split.py
new file mode 100644
index 0000000000..d03a52a769
--- /dev/null
+++ b/examples/python/native/ops/split.py
@@ -0,0 +1,47 @@
+# The basis for this test of the 'split' operation is generated by ChatGPT using the manually created conv2d.py as a template.
+
+from typing import List
+
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+def test_split(ffconfig, input_arr: np.ndarray) -> List[flexflow.core.Tensor]:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    out1, out2 = ffmodel.split(input_tensor, 2, axis=1)
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY])
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    out1.inline_map(ffmodel, ffconfig)
+    out2.inline_map(ffmodel, ffconfig)
+
+    return [out1.get_array(ffmodel, ffconfig), out2.get_array(ffmodel, ffconfig)]
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input = np.random.randn(ffconfig.batch_size, 10, 10, 10).astype(np.float32)
+    output_list = test_split(ffconfig, input)
+
+    print("Output Tensor 1:")
+    print(output_list[0])
+
+    print("\nOutput Tensor 2:")
+    print(output_list[1])
diff --git a/examples/python/native/ops/subtract.py b/examples/python/native/ops/subtract.py
new file mode 100644
index 0000000000..5f829cbae1
--- /dev/null
+++ b/examples/python/native/ops/subtract.py
@@ -0,0 +1,45 @@
+# The basis for this test of the 'subtract' operation is generated by ChatGPT using the manually created conv2d.py as a template.
+
+
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+def test_subtract(ffconfig, input_arr1: np.ndarray, input_arr2: np.ndarray) -> flexflow.core.Tensor:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor1 = ffmodel.create_tensor(input_arr1.shape, DataType.DT_FLOAT)
+    input_tensor2 = ffmodel.create_tensor(input_arr2.shape, DataType.DT_FLOAT)
+
+    out = ffmodel.subtract(input_tensor1, input_tensor2)
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY])
+    dataloader_input1 = ffmodel.create_data_loader(input_tensor1, input_arr1)
+    dataloader_input2 = ffmodel.create_data_loader(input_tensor2, input_arr2)
+
+    ffmodel.init_layers()
+
+    dataloader_input1.reset()
+    dataloader_input1.next_batch(ffmodel)
+
+    dataloader_input2.reset()
+    dataloader_input2.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    out.inline_map(ffmodel, ffconfig)
+    return out.get_array(ffmodel, ffconfig)
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input1 = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    input2 = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+
+    _ = test_subtract(ffconfig, input1, input2)
diff --git a/examples/python/native/ops/tanh.py b/examples/python/native/ops/tanh.py
new file mode 100644
index 0000000000..ba4ba7d6ff
--- /dev/null
+++ b/examples/python/native/ops/tanh.py
@@ -0,0 +1,46 @@
+# The basis for this test of the 'tanh' activation function is generated by ChatGPT using the manually created conv2d.py as a template.
+
+
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+def test_tanh(ffconfig, input_arr: np.ndarray) -> flexflow.core.Tensor:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    # Apply tanh activation
+    out = ffmodel.tanh(input_tensor)
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY])
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+
+    ffmodel.forward()
+
+    out.inline_map(ffmodel, ffconfig)
+    return out.get_array(ffmodel, ffconfig)
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input_data = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+
+    result = test_tanh(ffconfig, input_data)
+
+    print("Input Data:")
+    print(input_data)
+
+    print("\nResult after tanh activation:")
+    print(result)
diff --git a/examples/python/native/ops/transpose.py b/examples/python/native/ops/transpose.py
new file mode 100644
index 0000000000..6f514d660c
--- /dev/null
+++ b/examples/python/native/ops/transpose.py
@@ -0,0 +1,38 @@
+# The basis for this test of the 'transpose' operation is generated by ChatGPT using the manually created conv2d.py as a template.
+
+
+import flexflow.core
+import numpy as np
+from flexflow.core import *
+
+
+def test_transpose(ffconfig, input_arr: np.ndarray) -> flexflow.core.Tensor:
+    ffmodel = FFModel(ffconfig)
+
+    input_tensor = ffmodel.create_tensor(input_arr.shape, DataType.DT_FLOAT)
+
+    out = ffmodel.transpose(input_tensor, [ffconfig.batch_size, 10, 5, 10])
+
+    ffoptimizer = SGDOptimizer(ffmodel, 0.001)
+    ffmodel.optimizer = ffoptimizer
+    ffmodel.compile(
+        loss_type=LossType.LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+        metrics=[MetricsType.METRICS_ACCURACY, MetricsType.METRICS_SPARSE_CATEGORICAL_CROSSENTROPY])
+    dataloader_input = ffmodel.create_data_loader(input_tensor, input_arr)
+
+    ffmodel.init_layers()
+
+    dataloader_input.reset()
+    dataloader_input.next_batch(ffmodel)
+    ffmodel.forward()
+
+    out.inline_map(ffmodel, ffconfig)
+    return out.get_array(ffmodel, ffconfig)
+
+
+if __name__ == '__main__':
+    init_flexflow_runtime()
+    ffconfig = FFConfig()
+
+    input = np.random.randn(ffconfig.batch_size, 5, 10, 10).astype(np.float32)
+    _ = test_transpose(ffconfig, input)

From a83effedd6e0185a7e8225f445c0aaba840c1aca Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 20 Jun 2024 04:08:29 +0000
Subject: [PATCH 334/344] add code to keep runners registered

---
 .github/workflows/docker-build.yml | 41 ++++++++++++++++++++----------
 .github/workflows/gpu-ci.yml       | 24 +++++++++++++++++
 2 files changed, 52 insertions(+), 13 deletions(-)

diff --git a/.github/workflows/docker-build.yml b/.github/workflows/docker-build.yml
index d16179434b..eeaab0e0af 100644
--- a/.github/workflows/docker-build.yml
+++ b/.github/workflows/docker-build.yml
@@ -9,9 +9,9 @@ on:
     branches:
       - "inference"
       - "master"
-  # schedule:
-  #   # Run every week on Sunday at midnight PT (3am ET / 8am UTC) to keep the docker images updated
-  #   - cron: "0 8 * * 0"
+  schedule:
+    # At 00:00 on day-of-month 1, 14, and 28.
+    - cron: "0 0 1,14,28 * *" 
   workflow_dispatch:
 
 # Cancel outdated workflows if they are still running
@@ -58,13 +58,28 @@ jobs:
 
       - name: Check availability of flexflow modules in Python
         run: docker run --entrypoint /bin/bash flexflow-${FF_GPU_BACKEND}-${hip_version}:latest -c "python -c 'import flexflow.core; import flexflow.serve as ff; exit()'"
-  
+
+  keep-runner-registered:
+    name: Keep runner alive
+    if: ${{ github.event_name == 'schedule' }}
+    runs-on: [self-hosted, rocm_builder]
+    defaults:
+      run:
+        shell: bash -l {0} # required to use an activated conda environment
+    env: 
+      CONDA: "3"    
+    needs: rocm-builder-start
+    steps:
+      - name: Keep alive
+        run: |
+          echo "Keep self-hosted runner registered with Github"
+          sleep 10m  
 
   docker-build-and-publish-rocm:
     name: Build and Deploy FlexFlow Docker Containers (ROCm backend)
     needs: rocm-builder-start
     runs-on: [self-hosted, rocm_builder]
-    if: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
+    if: ${{ ( github.event_name == 'push' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
     strategy:
       matrix:
         hip_version: ["5.3", "5.4", "5.5", "5.6"]
@@ -106,19 +121,19 @@ jobs:
       cuda_version: ${{ matrix.cuda_version }}
     steps:
       - name: Checkout Git Repository
-        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.cuda_version == '12.0' }}
+        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.cuda_version == '12.0' }}
         uses: actions/checkout@v3
         with:
           submodules: recursive
 
       - name: Free additional space on runner
-        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.cuda_version == '12.0' }}
+        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.cuda_version == '12.0' }}
         run: .github/workflows/helpers/free_space_on_runner.sh
 
       - name: Build Docker container
-        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.cuda_version == '12.0' }}
+        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.cuda_version == '12.0' }}
         env:
-          deploy_needed: ${{ ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
+          deploy_needed: ${{ ( github.event_name == 'push' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
           build_needed: ${{ matrix.cuda_version == '12.0' }}
         run: |
           # On push to inference, build for all compatible architectures, so that we can publish 
@@ -133,11 +148,11 @@ jobs:
           fi
 
       - name: Check availability of flexflow modules in Python
-        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.cuda_version == '12.0' }}
+        if: ${{ ( ( github.event_name == 'push' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' ) || matrix.cuda_version == '12.0' }}
         run: docker run --entrypoint /bin/bash flexflow-${FF_GPU_BACKEND}-${cuda_version}:latest -c "export LD_LIBRARY_PATH=/usr/local/cuda/lib64/stubs:$LD_LIBRARY_PATH; sudo ln -s /usr/local/cuda/lib64/stubs/libcuda.so /usr/local/cuda/lib64/stubs/libcuda.so.1; python -c 'import flexflow.core; import flexflow.serve as ff; exit()'"
 
       - name: Publish Docker environment image (on push to inference)
-        if: ${{ github.repository_owner == 'flexflow' && ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
+        if: ${{ github.repository_owner == 'flexflow' && ( github.event_name == 'push' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
         env:
           FLEXFLOW_CONTAINER_TOKEN: ${{ secrets.FLEXFLOW_CONTAINER_TOKEN }}
         run: |
@@ -145,7 +160,7 @@ jobs:
           ./docker/publish.sh flexflow
 
   rocm-builder-stop:
-    needs: docker-build-and-publish-rocm
+    needs: [docker-build-and-publish-rocm, keep-runner-registered]
     if: ${{ always() && ( github.event_name == 'push' || github.event_name == 'schedule' || github.event_name == 'workflow_dispatch' ) && github.ref_name == 'inference' }}
     runs-on: ubuntu-latest
     name: Stop the AWS instance we used to build the ROCM Docker images
@@ -166,7 +181,7 @@ jobs:
     name: Notify Slack in case of failure
     runs-on: ubuntu-20.04
     needs: [docker-build-cuda, docker-build-and-publish-rocm]
-    if: ${{ failure() && github.event_name == 'schedule' && github.repository_owner == 'flexflow' }}
+    if: ${{ failure() && github.event_name == 'workflow_dispatch' && github.repository_owner == 'flexflow' }}
     steps:
       - name: Send Slack message
         env:
diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index 7bdb6805a8..c7d0cd72cb 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -1,5 +1,7 @@
 name: "gpu-ci"
 on:
+  schedule:
+    - cron: "0 0 1,14,28 * *" # At 00:00 on day-of-month 1, 14, and 28.
   push:
     branches:
       - "inference"
@@ -43,8 +45,28 @@ jobs:
           pip3 install pygithub
           python3 .github/workflows/helpers/gpu_ci_helper.py
 
+  keep-runner-registered:
+    name: Keep runner alive
+    if: ${{ github.event_name == 'schedule' }}
+    runs-on: [self-hosted, gpu]
+    defaults:
+      run:
+        shell: bash -l {0} # required to use an activated conda environment
+    env: 
+      CONDA: "3"    
+    needs: gpu-ci-concierge
+    container:
+      image: ghcr.io/flexflow/flexflow-environment-cuda-11.8:latest
+      options: --gpus all --shm-size=8192m
+    steps:
+      - name: Keep alive
+        run: |
+          echo "Keep self-hosted runner registered with Github"
+          sleep 10m
+  
   python-interface-check:
     name: Check Python Interface
+    if: ${{ github.event_name != 'schedule' }}
     runs-on: [self-hosted, gpu]
     defaults:
       run:
@@ -119,6 +141,7 @@ jobs:
 
   inference-tests:
     name: Inference Tests
+    if: ${{ github.event_name != 'schedule' }}
     runs-on: [self-hosted, gpu]
     defaults:
       run:
@@ -195,6 +218,7 @@ jobs:
 
   training-tests:
     name: Training Tests
+    if: ${{ github.event_name != 'schedule' }}
     runs-on: [self-hosted, gpu]
     # skip this time-consuming test for PRs to the inference branch
     # if: ${{ github.event_name != 'pull_request' || github.base_ref != 'inference' }}

From 4f82aaed6317cef0a2587848a3b6d57f1d709381 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Wed, 10 Jul 2024 23:15:28 -0400
Subject: [PATCH 335/344] fix docker

---
 docker/flexflow-environment/Dockerfile | 1 +
 1 file changed, 1 insertion(+)

diff --git a/docker/flexflow-environment/Dockerfile b/docker/flexflow-environment/Dockerfile
index 6ca337f58d..cef619ad68 100644
--- a/docker/flexflow-environment/Dockerfile
+++ b/docker/flexflow-environment/Dockerfile
@@ -37,6 +37,7 @@ RUN MINICONDA_SCRIPT_NAME=Miniconda3-py311_23.5.2-0-Linux-x86_64.sh; \
         chmod +x ~/${MINICONDA_SCRIPT_NAME} && \
         bash ~/${MINICONDA_SCRIPT_NAME} -b -p /opt/conda && \
         rm ~/${MINICONDA_SCRIPT_NAME} && \
+	/opt/conda/bin/conda config --set solver classic && \
         /opt/conda/bin/conda upgrade --all && \
         /opt/conda/bin/conda install conda-build conda-verify && \
         /opt/conda/bin/conda clean -ya

From 25fb40772f587892510bfe0ca296ae54768ff35c Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Thu, 11 Jul 2024 15:16:40 -0400
Subject: [PATCH 336/344] [Tokenizer] update tokenizers-cpp repo

---
 deps/tokenizers-cpp | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/deps/tokenizers-cpp b/deps/tokenizers-cpp
index 4f42c9fa74..c0fab1e14a 160000
--- a/deps/tokenizers-cpp
+++ b/deps/tokenizers-cpp
@@ -1 +1 @@
-Subproject commit 4f42c9fa74946d70af86671a3804b6f2433e5dac
+Subproject commit c0fab1e14a9421c1501acee5b7703e5dafa60479

From 6a1a1886909fc864aadfb10823077f94fe03b72e Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Sat, 3 Aug 2024 08:31:37 -0700
Subject: [PATCH 337/344] minor bug fix (#1456)

---
 .../ops/kernels/inc_multihead_self_attention_kernels.h         | 3 ++-
 src/ops/attention.cu                                           | 2 +-
 2 files changed, 3 insertions(+), 2 deletions(-)

diff --git a/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h b/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
index 9bf2f581e2..26dcf12425 100644
--- a/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
+++ b/include/flexflow/ops/kernels/inc_multihead_self_attention_kernels.h
@@ -56,7 +56,8 @@ __global__ void apply_proj_bias_qkv(DT *input_ptr,
                                     int num_heads,
                                     int num_kv_heads,
                                     bool scaling_query,
-                                    float scaling_factor);
+                                    float scaling_factor,
+                                    int hidden_size);
 
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
 template <typename DT>
diff --git a/src/ops/attention.cu b/src/ops/attention.cu
index 9b8b90da70..18fc810aed 100644
--- a/src/ops/attention.cu
+++ b/src/ops/attention.cu
@@ -206,7 +206,7 @@ MultiHeadAttentionMeta::MultiHeadAttentionMeta(FFHandler handler,
   checkCUDNN(cudnnCreateSeqDataDescriptor(&oDesc));
   // Currently do not support adding bias to key/value projection
   assert(!attn->add_bias_kv);
-  cudnnAttnQueryMap_t attnMode = CUDNN_ATTN_QUERYMAP_ALL_TO_ONE;
+  unsigned attnMode = CUDNN_ATTN_QUERYMAP_ALL_TO_ONE;
   // Assume no beam search for now
   int maxBeamSize = 1;
   // printf("batchSize(%d) qSize(%d) kSize(%d) vSize(%d) qProjSize(%d)

From 9784b5c6516bafe272fc6555daaa9b867a5eacfa Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Mon, 12 Aug 2024 11:02:49 -0700
Subject: [PATCH 338/344] update legion version (#1307)

* update legion version

* legion version update

* update legion version
---
 CMakeLists.txt                               | 2 +-
 deps/legion                                  | 2 +-
 examples/cpp/AlexNet/alexnet.cc              | 2 +-
 examples/cpp/DLRM/dlrm.cc                    | 2 +-
 examples/cpp/InceptionV3/inception.cc        | 2 +-
 examples/cpp/ResNet/resnet.cc                | 2 +-
 examples/cpp/Transformer/transformer.cc      | 2 +-
 examples/cpp/XDL/xdl.cc                      | 2 +-
 examples/cpp/candle_uno/candle_uno.cc        | 2 +-
 examples/cpp/mixture_of_experts/moe.cc       | 2 +-
 examples/cpp/resnext50/resnext.cc            | 2 +-
 examples/cpp/split_test/split_test.cc        | 2 +-
 examples/cpp/split_test_2/split_test_2.cc    | 2 +-
 include/flexflow/graph.h                     | 2 +-
 include/flexflow/operator.h                  | 4 +++-
 include/flexflow/utils/recursive_logger.h    | 4 ++--
 inference/incr_decoding/incr_decoding.cc     | 2 +-
 inference/spec_infer/spec_infer.cc           | 2 +-
 src/mapper/mapper.cc                         | 7 ++++++-
 src/ops/beam_topk.cpp                        | 2 +-
 src/ops/beam_topk.cu                         | 2 +-
 src/ops/inc_multihead_self_attention.cc      | 2 +-
 src/ops/tree_inc_multihead_self_attention.cc | 2 +-
 src/runtime/batch_config.cc                  | 2 +-
 src/runtime/beam_search_batch_config.cc      | 2 +-
 src/runtime/graph.cc                         | 4 ++--
 src/runtime/inference_manager.cc             | 4 ++--
 src/runtime/model.cc                         | 6 ++++--
 src/runtime/optimizer_kernel.cpp             | 4 ++--
 src/runtime/optimizer_kernel.cu              | 2 +-
 src/runtime/request_manager.cc               | 2 +-
 src/runtime/simulator.cc                     | 8 ++++----
 src/runtime/substitution.cc                  | 4 ++--
 src/runtime/tree_verify_batch_config.cc      | 2 +-
 tests/ops/batch_matmul_test.cc               | 2 +-
 tests/ops/concat_test.cc                     | 2 +-
 tests/ops/flat_test.cc                       | 2 +-
 tests/ops/linear_test.cc                     | 2 +-
 tests/ops/reshape_test.cc                    | 2 +-
 tests/ops/tanh_test.cc                       | 2 +-
 tests/ops/transpose_test.cc                  | 2 +-
 41 files changed, 59 insertions(+), 50 deletions(-)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index 43ce4f7044..7079fdadb8 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -425,7 +425,7 @@ if(NOT BUILD_LEGION_ONLY)
       # generate the Legion Python bindings library. When building from pip, we need to do this post-install to prevent Legion from overwriting the path to the Legion shared library
       add_custom_command(TARGET flexflow
         POST_BUILD	
-        COMMAND ${Python_EXECUTABLE} ${CMAKE_CURRENT_SOURCE_DIR}/deps/legion/bindings/python/setup.py build --cmake-build-dir ${Legion_BINARY_DIR}/runtime --prefix ${Legion_BINARY_DIR} --build-lib=${Legion_BINARY_DIR}/bindings/python ${Legion_PYTHON_EXTRA_INSTALL_ARGS}
+        COMMAND CMAKE_BUILD_DIR=${Legion_BINARY_DIR}/runtime CMAKE_INSTALL_PREFIX=${Legion_BINARY_DIR} ${Python_EXECUTABLE} ${CMAKE_CURRENT_SOURCE_DIR}/deps/legion/bindings/python/setup.py build --build-lib=${Legion_BINARY_DIR}/bindings/python ${Legion_PYTHON_EXTRA_INSTALL_ARGS}
         WORKING_DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}/deps/legion/bindings/python
       )
       # create flexflow_python interpreter. When building from pip, we install the FF_HOME/python/flexflow_python script instead.
diff --git a/deps/legion b/deps/legion
index 24e8c45234..02eb1010ca 160000
--- a/deps/legion
+++ b/deps/legion
@@ -1 +1 @@
-Subproject commit 24e8c452341dea41427e0ce61e154d61715e6835
+Subproject commit 02eb1010ca9eb449d345a0db97eab17efb0e5af0
diff --git a/examples/cpp/AlexNet/alexnet.cc b/examples/cpp/AlexNet/alexnet.cc
index 128496eab1..3507882329 100644
--- a/examples/cpp/AlexNet/alexnet.cc
+++ b/examples/cpp/AlexNet/alexnet.cc
@@ -26,7 +26,7 @@ using FlexFlow::ParallelTensor;
 using FlexFlow::SGDOptimizer;
 using FlexFlow::Tensor;
 
-LegionRuntime::Logger::Category log_app("AlexNet");
+Legion::Logger log_app("AlexNet");
 
 void parse_input_args(char **argv, int argc, AlexNetConfig &config) {
   for (int i = 1; i < argc; i++) {
diff --git a/examples/cpp/DLRM/dlrm.cc b/examples/cpp/DLRM/dlrm.cc
index 7dc49215b3..d7dc167557 100644
--- a/examples/cpp/DLRM/dlrm.cc
+++ b/examples/cpp/DLRM/dlrm.cc
@@ -19,7 +19,7 @@
 
 using namespace Legion;
 
-LegionRuntime::Logger::Category log_app("DLRM");
+Legion::Logger log_app("DLRM");
 
 void parse_input_args(char **argv, int argc, DLRMConfig &apConfig);
 
diff --git a/examples/cpp/InceptionV3/inception.cc b/examples/cpp/InceptionV3/inception.cc
index b2070cc52d..6d0fa7ee53 100644
--- a/examples/cpp/InceptionV3/inception.cc
+++ b/examples/cpp/InceptionV3/inception.cc
@@ -21,7 +21,7 @@
 using namespace Legion;
 using namespace FlexFlow;
 
-LegionRuntime::Logger::Category log_app("Inceptionv3");
+Legion::Logger log_app("Inceptionv3");
 
 Tensor InceptionA(FFModel &ff, Tensor input, int pool_features) {
   Tensor t1 = input;
diff --git a/examples/cpp/ResNet/resnet.cc b/examples/cpp/ResNet/resnet.cc
index 455eb743ae..49ce934a6a 100644
--- a/examples/cpp/ResNet/resnet.cc
+++ b/examples/cpp/ResNet/resnet.cc
@@ -24,7 +24,7 @@ using FlexFlow::Optimizer;
 using FlexFlow::SGDOptimizer;
 using FlexFlow::Tensor;
 
-LegionRuntime::Logger::Category log_app("ResNet");
+Legion::Logger log_app("ResNet");
 
 void parse_input_args(char **argv, int argc, ResNetConfig &config) {
   for (int i = 1; i < argc; i++) {
diff --git a/examples/cpp/Transformer/transformer.cc b/examples/cpp/Transformer/transformer.cc
index d61a63cd03..b04093b0a9 100644
--- a/examples/cpp/Transformer/transformer.cc
+++ b/examples/cpp/Transformer/transformer.cc
@@ -17,7 +17,7 @@
 
 using namespace Legion;
 
-LegionRuntime::Logger::Category log_app("Transformer");
+Legion::Logger log_app("Transformer");
 
 Tensor create_emb(FFModel *model,
                   Tensor const &input,
diff --git a/examples/cpp/XDL/xdl.cc b/examples/cpp/XDL/xdl.cc
index 2e6c3cec98..a2272f36e5 100644
--- a/examples/cpp/XDL/xdl.cc
+++ b/examples/cpp/XDL/xdl.cc
@@ -18,7 +18,7 @@
 
 using namespace Legion;
 
-LegionRuntime::Logger::Category log_app("XDL");
+Legion::Logger log_app("XDL");
 
 void parse_input_args(char **argv, int argc, XDLConfig &apConfig);
 
diff --git a/examples/cpp/candle_uno/candle_uno.cc b/examples/cpp/candle_uno/candle_uno.cc
index 779b8e9c14..e9f4bf876a 100644
--- a/examples/cpp/candle_uno/candle_uno.cc
+++ b/examples/cpp/candle_uno/candle_uno.cc
@@ -21,7 +21,7 @@
 using namespace Legion;
 using namespace std;
 
-LegionRuntime::Logger::Category log_app("Candle_Uno");
+Legion::Logger log_app("Candle_Uno");
 
 void parse_input_args(char **argv, int argc, CandleConfig &apConfig);
 
diff --git a/examples/cpp/mixture_of_experts/moe.cc b/examples/cpp/mixture_of_experts/moe.cc
index a707310885..a25f94abd9 100644
--- a/examples/cpp/mixture_of_experts/moe.cc
+++ b/examples/cpp/mixture_of_experts/moe.cc
@@ -20,7 +20,7 @@
 
 using namespace Legion;
 
-LegionRuntime::Logger::Category log_app("MoE");
+Legion::Logger log_app("MoE");
 
 void parse_input_args(char **argv, int argc, MoeConfig &config) {
   for (int i = 1; i < argc; i++) {
diff --git a/examples/cpp/resnext50/resnext.cc b/examples/cpp/resnext50/resnext.cc
index 3c28ca27b8..9b71b37cce 100644
--- a/examples/cpp/resnext50/resnext.cc
+++ b/examples/cpp/resnext50/resnext.cc
@@ -7,7 +7,7 @@ using FlexFlow::Optimizer;
 using FlexFlow::SGDOptimizer;
 using FlexFlow::Tensor;
 
-LegionRuntime::Logger::Category log_app("resnext");
+Legion::Logger log_app("resnext");
 
 Tensor resnext_block(FFModel &ff,
                      Tensor input,
diff --git a/examples/cpp/split_test/split_test.cc b/examples/cpp/split_test/split_test.cc
index 97b98c3214..ac9d516a59 100644
--- a/examples/cpp/split_test/split_test.cc
+++ b/examples/cpp/split_test/split_test.cc
@@ -3,7 +3,7 @@
 using namespace Legion;
 using namespace FlexFlow;
 
-LegionRuntime::Logger::Category log_app("split_test");
+Legion::Logger log_app("split_test");
 
 void FlexFlow::top_level_task(Task const *task,
                               std::vector<PhysicalRegion> const &regions,
diff --git a/examples/cpp/split_test_2/split_test_2.cc b/examples/cpp/split_test_2/split_test_2.cc
index 69385d14cb..fef078adbc 100644
--- a/examples/cpp/split_test_2/split_test_2.cc
+++ b/examples/cpp/split_test_2/split_test_2.cc
@@ -9,7 +9,7 @@ using FlexFlow::PCG::Graph;
 using FlexFlow::PCG::GraphSearchHelper;
 using FlexFlow::PCG::Node;
 
-LegionRuntime::Logger::Category log_app("split_test_2");
+Legion::Logger log_app("split_test_2");
 
 void top_level_task(Task const *task,
                     std::vector<PhysicalRegion> const &regions,
diff --git a/include/flexflow/graph.h b/include/flexflow/graph.h
index 2e0cf1ca4b..9dc6572593 100644
--- a/include/flexflow/graph.h
+++ b/include/flexflow/graph.h
@@ -24,7 +24,7 @@
 #include "legion/legion_utilities.h"
 #include <unordered_set>
 
-extern LegionRuntime::Logger::Category log_dp;
+extern Legion::Logger log_dp;
 
 namespace FlexFlow::PCG {
 
diff --git a/include/flexflow/operator.h b/include/flexflow/operator.h
index 1b19bdb82f..311699d926 100644
--- a/include/flexflow/operator.h
+++ b/include/flexflow/operator.h
@@ -19,7 +19,7 @@
 
 namespace FlexFlow {
 
-extern LegionRuntime::Logger::Category log_measure;
+extern Legion::Logger log_measure;
 
 class OpMeta;
 class Simulator;
@@ -233,6 +233,8 @@ class Op {
                                       std::vector<ParallelTensor> const &,
                                       MachineView const *mv = nullptr) {
     assert(false);
+    Legion::FutureMap empty_map;
+    return empty_map;
   };
   virtual void print_layer(FFModel const &model) = 0;
   template <typename OpMetaType>
diff --git a/include/flexflow/utils/recursive_logger.h b/include/flexflow/utils/recursive_logger.h
index 2c43b42309..d073f58f3e 100644
--- a/include/flexflow/utils/recursive_logger.h
+++ b/include/flexflow/utils/recursive_logger.h
@@ -26,7 +26,7 @@ class DepthTag {
 
 class RecursiveLogger {
 public:
-  /* RecursiveLogger(LegionRuntime::Logger::Category const &); */
+  /* RecursiveLogger(Legion::Logger const &); */
   RecursiveLogger(std::string const &category_name);
 
   Realm::LoggerMessage info();
@@ -42,7 +42,7 @@ class RecursiveLogger {
 
   void print_prefix(Realm::LoggerMessage &) const;
 
-  LegionRuntime::Logger::Category logger;
+  Legion::Logger logger;
 };
 
 };     // namespace FlexFlow
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index aae7256ffe..ec3dda3158 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -28,7 +28,7 @@ using namespace FlexFlow;
 using namespace Legion;
 using json = nlohmann::json;
 
-LegionRuntime::Logger::Category log_app("llama");
+Legion::Logger log_app("llama");
 
 struct FilePaths {
   std::string cache_folder_path;
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index f7edfd7696..60233ac8d1 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -26,7 +26,7 @@ using namespace FlexFlow;
 using namespace Legion;
 using json = nlohmann::json;
 
-LegionRuntime::Logger::Category log_app("llama");
+Legion::Logger log_app("llama");
 
 struct FilePaths {
   std::string cache_folder_path;
diff --git a/src/mapper/mapper.cc b/src/mapper/mapper.cc
index c293aecb19..4413d516ac 100644
--- a/src/mapper/mapper.cc
+++ b/src/mapper/mapper.cc
@@ -20,7 +20,7 @@ namespace FlexFlow {
 using namespace Legion;
 using namespace Mapping;
 
-LegionRuntime::Logger::Category log_ff_mapper("Mapper");
+Legion::Logger log_ff_mapper("Mapper");
 
 FFShardingFunctor::FFShardingFunctor(int _gpus_per_node,
                                      int _cpus_per_node,
@@ -296,6 +296,7 @@ void FFMapper::select_task_options(const MapperContext ctx,
     // control replicate top level task
     if (enable_control_replication) {
       output.replicate = true;
+      output.map_locally = false;
     }
     return;
   }
@@ -560,6 +561,10 @@ void FFMapper::map_task(const MapperContext ctx,
       assert(output.target_procs[i].address_space() == node_id);
     }
   }
+  if (input.shard_processor.exists()) {
+    output.target_procs = std::vector<Processor>{input.shard_processor};
+  }
+
   // Find instances that still need to be mapped
   std::vector<std::set<FieldID>> missing_fields(task.regions.size());
   runtime->filter_instances(ctx,
diff --git a/src/ops/beam_topk.cpp b/src/ops/beam_topk.cpp
index 18534455a0..8545bea7cb 100644
--- a/src/ops/beam_topk.cpp
+++ b/src/ops/beam_topk.cpp
@@ -25,7 +25,7 @@ using Legion::coord_t;
 enum class HeapType { kMinHeap, kMaxHeap };
 enum class PreferIndices { kLower, kHigher };
 
-LegionRuntime::Logger::Category log_beam_topk("BeamTopK");
+Legion::Logger log_beam_topk("BeamTopK");
 
 template <typename T>
 struct Entry {
diff --git a/src/ops/beam_topk.cu b/src/ops/beam_topk.cu
index a958786be3..c24bdf7c74 100644
--- a/src/ops/beam_topk.cu
+++ b/src/ops/beam_topk.cu
@@ -25,7 +25,7 @@ using Legion::coord_t;
 enum class HeapType { kMinHeap, kMaxHeap };
 enum class PreferIndices { kLower, kHigher };
 
-LegionRuntime::Logger::Category log_beam_topk("BeamTopK");
+Legion::Logger log_beam_topk("BeamTopK");
 
 template <typename T>
 struct Entry {
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index 7aa3503770..8688585788 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -46,7 +46,7 @@ using Legion::TaskArgument;
 using Legion::TaskLauncher;
 using PCG::Node;
 
-LegionRuntime::Logger::Category log_inc_mha("IncrementalMHA");
+Legion::Logger log_inc_mha("IncrementalMHA");
 
 bool IncMultiHeadSelfAttentionParams::is_valid(
     ParallelTensorShape const &input) const {
diff --git a/src/ops/tree_inc_multihead_self_attention.cc b/src/ops/tree_inc_multihead_self_attention.cc
index d0efb01d54..9b8c88420d 100644
--- a/src/ops/tree_inc_multihead_self_attention.cc
+++ b/src/ops/tree_inc_multihead_self_attention.cc
@@ -46,7 +46,7 @@ using Legion::TaskArgument;
 using Legion::TaskLauncher;
 using PCG::Node;
 
-LegionRuntime::Logger::Category log_tree_verify("TreeVerifyIncMHA");
+Legion::Logger log_tree_verify("TreeVerifyIncMHA");
 
 bool TreeIncMultiHeadSelfAttentionParams::is_valid(
     ParallelTensorShape const &input) const {
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index bd96dbb141..7989b0799e 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -21,7 +21,7 @@
 
 namespace FlexFlow {
 
-LegionRuntime::Logger::Category log_bc("BatchConfig");
+Legion::Logger log_bc("BatchConfig");
 using Legion::Future;
 using Legion::Memory;
 
diff --git a/src/runtime/beam_search_batch_config.cc b/src/runtime/beam_search_batch_config.cc
index ff7bf1a819..0509c23afe 100644
--- a/src/runtime/beam_search_batch_config.cc
+++ b/src/runtime/beam_search_batch_config.cc
@@ -24,7 +24,7 @@
 
 namespace FlexFlow {
 
-LegionRuntime::Logger::Category log_beam_bc("BeamSearchBatchConfig");
+Legion::Logger log_beam_bc("BeamSearchBatchConfig");
 
 BeamSearchBatchConfig::BeamSearchBatchConfig() : BatchConfig() {
   this->beam_width = DEFAULT_BEAM_WIDTH;
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index f8e8240ccf..cf75235ae7 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -66,8 +66,8 @@ namespace FlexFlow::PCG {
 using namespace Legion;
 using FlexFlow::MachineView;
 
-LegionRuntime::Logger::Category log_graph("graph");
-LegionRuntime::Logger::Category log_simplify("graph_simplify");
+Legion::Logger log_graph("graph");
+Legion::Logger log_simplify("graph_simplify");
 
 const Node Node::INVALID_NODE = Node();
 
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 2a94df8b4d..3d299aeedd 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -25,8 +25,8 @@ namespace FlexFlow {
 
 using namespace Legion;
 
-LegionRuntime::Logger::Category log_inf_mgr("InferenceManager");
-LegionRuntime::Logger::Category log_offload("Offloading");
+Legion::Logger log_inf_mgr("InferenceManager");
+Legion::Logger log_offload("Offloading");
 
 InferenceManager::InferenceManager() {}
 
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 1fa281777a..5cad628743 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -82,8 +82,8 @@ namespace FlexFlow {
 
 using namespace Legion;
 
-LegionRuntime::Logger::Category log_model("Model");
-LegionRuntime::Logger::Category log_measure("measure");
+Legion::Logger log_model("Model");
+Legion::Logger log_measure("measure");
 
 Op::Op(FFModel &model,
        OperatorType otype,
@@ -6748,6 +6748,7 @@ void register_flexflow_internal_tasks(Runtime *runtime,
     TaskVariantRegistrar registrar(SGD_UPD_NCCL_TASK_ID, "SGD NCCL Update");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
+    registrar.set_concurrent();
     if (pre_register) {
       Runtime::preregister_task_variant<SGDOptimizer::nccl_update_task>(
           registrar, "SGD NCCL Update Task");
@@ -6898,6 +6899,7 @@ void register_flexflow_internal_tasks(Runtime *runtime,
                                    "NCCL Init Communicators");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
+    registrar.set_concurrent();
     if (pre_register) {
       Runtime::preregister_task_variant<ncclComm_t, Op::init_nccl_comms_task>(
           registrar, "NCCL Init Communicators Task");
diff --git a/src/runtime/optimizer_kernel.cpp b/src/runtime/optimizer_kernel.cpp
index e71adc87a8..59efaf5256 100644
--- a/src/runtime/optimizer_kernel.cpp
+++ b/src/runtime/optimizer_kernel.cpp
@@ -21,7 +21,7 @@
 
 namespace FlexFlow {
 
-LegionRuntime::Logger::Category log_optimizer("optimizer");
+Legion::Logger log_optimizer("optimizer");
 
 __global__ void sgd_update(size_t count,
                            float lr,
@@ -247,4 +247,4 @@ __host__ void AdamOptimizer::nccl_update_task_gpu(AdamOptimizer const *op,
 }
 #endif
 
-}; // namespace FlexFlow
\ No newline at end of file
+}; // namespace FlexFlow
diff --git a/src/runtime/optimizer_kernel.cu b/src/runtime/optimizer_kernel.cu
index 5f654fbb5b..df37e3b135 100644
--- a/src/runtime/optimizer_kernel.cu
+++ b/src/runtime/optimizer_kernel.cu
@@ -20,7 +20,7 @@
 
 namespace FlexFlow {
 
-LegionRuntime::Logger::Category log_optimizer("optimizer");
+Legion::Logger log_optimizer("optimizer");
 
 __global__ void sgd_update(size_t count,
                            float lr,
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index 16513e918a..d21285eef2 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -29,7 +29,7 @@ namespace FlexFlow {
 using namespace Legion;
 using tokenizers::Tokenizer;
 
-LegionRuntime::Logger::Category log_req_mgr("RequestManager");
+Legion::Logger log_req_mgr("RequestManager");
 
 std::string LoadBytesFromFile(std::string const &path) {
   std::ifstream fs(path, std::ios::in | std::ios::binary);
diff --git a/src/runtime/simulator.cc b/src/runtime/simulator.cc
index d943376416..b71af0d47e 100644
--- a/src/runtime/simulator.cc
+++ b/src/runtime/simulator.cc
@@ -31,10 +31,10 @@ namespace FlexFlow {
 
 using namespace Legion;
 
-LegionRuntime::Logger::Category log_sim("sim");
-LegionRuntime::Logger::Category log_ps_sim("ps_sim");
-LegionRuntime::Logger::Category log_xfer_sim("xfer_sim");
-LegionRuntime::Logger::Category log_xfer_est("xfer_est");
+Legion::Logger log_sim("sim");
+Legion::Logger log_ps_sim("ps_sim");
+Legion::Logger log_xfer_sim("xfer_sim");
+Legion::Logger log_xfer_est("xfer_est");
 
 // template class std::map<const Op*, ParallelConfig>; // for debugging in gdb
 // template class std::map<const Op*, MachineView>; // for debugging in gdb
diff --git a/src/runtime/substitution.cc b/src/runtime/substitution.cc
index c0804d6e19..b86964049d 100644
--- a/src/runtime/substitution.cc
+++ b/src/runtime/substitution.cc
@@ -54,8 +54,8 @@ namespace FlexFlow::PCG {
 
 using namespace Legion;
 
-LegionRuntime::Logger::Category log_xfers("xfers");
-LegionRuntime::Logger::Category log_xfer_matches("xfer_matches");
+Legion::Logger log_xfers("xfers");
+Legion::Logger log_xfer_matches("xfer_matches");
 
 const TensorX TensorX::NO_TX = TensorX();
 
diff --git a/src/runtime/tree_verify_batch_config.cc b/src/runtime/tree_verify_batch_config.cc
index 841c735f59..49d42bb6dd 100644
--- a/src/runtime/tree_verify_batch_config.cc
+++ b/src/runtime/tree_verify_batch_config.cc
@@ -21,7 +21,7 @@
 
 namespace FlexFlow {
 
-LegionRuntime::Logger::Category log_tree_bc("TreeVerifyBatchConfig");
+Legion::Logger log_tree_bc("TreeVerifyBatchConfig");
 
 TreeVerifyBatchConfig::TreeVerifyBatchConfig() : BatchConfig() {}
 
diff --git a/tests/ops/batch_matmul_test.cc b/tests/ops/batch_matmul_test.cc
index 7931f44129..f61048febf 100644
--- a/tests/ops/batch_matmul_test.cc
+++ b/tests/ops/batch_matmul_test.cc
@@ -5,7 +5,7 @@
 #include <iostream>
 #include <sstream>
 using namespace Legion;
-LegionRuntime::Logger::Category log_app("bmm_test");
+Legion::Logger log_app("bmm_test");
 
 struct BMMTestMeta {
   int m, k, n, d;
diff --git a/tests/ops/concat_test.cc b/tests/ops/concat_test.cc
index c67b718e0e..b0489d1adb 100644
--- a/tests/ops/concat_test.cc
+++ b/tests/ops/concat_test.cc
@@ -5,7 +5,7 @@
 #include <iostream>
 #include <sstream>
 using namespace Legion;
-LegionRuntime::Logger::Category log_app("concat_test");
+Legion::Logger log_app("concat_test");
 
 struct ConcatTestMeta {
   int batch_size, i_dim, num_channels, projected_num_channels,
diff --git a/tests/ops/flat_test.cc b/tests/ops/flat_test.cc
index 428893a0dc..61de83b6b0 100644
--- a/tests/ops/flat_test.cc
+++ b/tests/ops/flat_test.cc
@@ -7,7 +7,7 @@
 #include <sstream>
 
 using namespace Legion;
-LegionRuntime::Logger::Category log_app("Flat_test");
+Legion::Logger log_app("Flat_test");
 
 struct FlatTestMeta {
   int i_dim, o_dim;
diff --git a/tests/ops/linear_test.cc b/tests/ops/linear_test.cc
index 5b65de3a56..7c84ad1078 100644
--- a/tests/ops/linear_test.cc
+++ b/tests/ops/linear_test.cc
@@ -5,7 +5,7 @@
 #include <iostream>
 #include <sstream>
 using namespace Legion;
-LegionRuntime::Logger::Category log_app("linear_test");
+Legion::Logger log_app("linear_test");
 
 struct LinearTestMeta {
   int batch_size, i_dim, num_channels, dense_projection_o_dim,
diff --git a/tests/ops/reshape_test.cc b/tests/ops/reshape_test.cc
index e8f4586b23..a8aa046a64 100644
--- a/tests/ops/reshape_test.cc
+++ b/tests/ops/reshape_test.cc
@@ -6,7 +6,7 @@
 #include <sstream>
 #define PRECISION 16
 using namespace Legion;
-LegionRuntime::Logger::Category log_app("Reshape_test");
+Legion::Logger log_app("Reshape_test");
 
 struct ReshapeTestMeta {
   int i_dim, o_dim;
diff --git a/tests/ops/tanh_test.cc b/tests/ops/tanh_test.cc
index 1c24d96aaf..1e86934f86 100644
--- a/tests/ops/tanh_test.cc
+++ b/tests/ops/tanh_test.cc
@@ -6,7 +6,7 @@
 #include <sstream>
 #define PRECISION 16
 using namespace Legion;
-LegionRuntime::Logger::Category log_app("Tanh_test");
+Legion::Logger log_app("Tanh_test");
 
 struct TanhTestMeta {
   int i_dim, o_dim;
diff --git a/tests/ops/transpose_test.cc b/tests/ops/transpose_test.cc
index 10481aa14f..045f28479c 100644
--- a/tests/ops/transpose_test.cc
+++ b/tests/ops/transpose_test.cc
@@ -5,7 +5,7 @@
 #include <iostream>
 #include <sstream>
 using namespace Legion;
-LegionRuntime::Logger::Category log_app("transpose_test");
+Legion::Logger log_app("transpose_test");
 
 struct TransposeTestMeta {
   int m, k, d;

From f747438f0927ec528d481cfd6b9c7f15465677c9 Mon Sep 17 00:00:00 2001
From: Zhuofu Chen <59316330+chenzhuofu@users.noreply.github.com>
Date: Tue, 13 Aug 2024 10:49:54 -0400
Subject: [PATCH 339/344] Managed mem support (#1466)

* feat: fix missed compile definition

* feat: add func  `get_proc_mem` to process memory allocation

* chore: minor

* chore: try to use get_proc_mem

* fix: proc_mem allocation

* feat: switch to use get_proc_mem

* feat: update Realm::Logger definition

* fix: now all memory are allocated by get_proc_mem

* chore: minor

* fix: no memory allocation bugs

* chore: merge file

* chore: don't use ManagedMemory for now
---
 CMakeLists.txt                               |  1 +
 include/flexflow/model.h                     |  1 +
 include/flexflow/ops/batch_norm.h            |  1 +
 include/flexflow/utils/memory_allocator.h    |  2 ++
 src/mapper/mapper.cc                         |  7 ++-----
 src/ops/add_bias_residual_layer_norm.cc      |  5 +----
 src/ops/argmax.cc                            |  5 +----
 src/ops/attention.cc                         |  5 +----
 src/ops/batch_norm.cpp                       |  5 +----
 src/ops/batch_norm.cu                        |  5 +----
 src/ops/beam_topk.cc                         |  5 +----
 src/ops/dropout.cc                           |  5 +----
 src/ops/inc_multihead_self_attention.cc      |  5 +----
 src/ops/layer_norm.cc                        |  5 +----
 src/ops/linear.cc                            |  5 +----
 src/ops/residual_layer_norm.cc               |  5 +----
 src/ops/residual_rms_norm.cc                 |  5 +----
 src/ops/rms_norm.cc                          |  5 +----
 src/ops/sampling.cc                          |  5 +----
 src/ops/sigmoid_silu_multi.cc                |  5 +----
 src/ops/spec_inc_multihead_self_attention.cc |  5 +----
 src/ops/tree_inc_multihead_self_attention.cc |  5 +----
 src/runtime/graph.cc                         |  5 +----
 src/runtime/memory_allocator.cc              | 12 ++++++++++++
 src/runtime/model.cc                         |  4 ++--
 src/runtime/model.cpp                        | 15 +++------------
 src/runtime/model.cu                         | 15 +++------------
 27 files changed, 45 insertions(+), 103 deletions(-)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index 7079fdadb8..d7a6391e06 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -496,6 +496,7 @@ if(NOT BUILD_LEGION_ONLY)
     if(NOT CARGO_RESULT EQUAL 0)
       message(FATAL_ERROR "Rust is installed, but cargo is not. Please install it by running: 'curl https://sh.rustup.rs -sSf | sh -s -- -y' and following the instructions on the screen.")
     endif()
+    set(MLC_ENABLE_SENTENCEPIECE_TOKENIZER ON)
     add_subdirectory(deps/tokenizers-cpp tokenizers EXCLUDE_FROM_ALL)
     target_include_directories(flexflow PUBLIC deps/tokenizers-cpp/include)
     target_link_libraries(flexflow tokenizers_cpp)
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 95be9ab581..ea64f65a95 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -22,6 +22,7 @@
 #include "flexflow/node.h"
 #include "flexflow/operator_params.h"
 #include "flexflow/utils/hash_utils.h"
+#include "flexflow/utils/memory_allocator.h"
 #include "flexflow/utils/tuple.h"
 #include "initializer.h"
 #include "layer.h"
diff --git a/include/flexflow/ops/batch_norm.h b/include/flexflow/ops/batch_norm.h
index c923dc1097..01cc0e16ec 100644
--- a/include/flexflow/ops/batch_norm.h
+++ b/include/flexflow/ops/batch_norm.h
@@ -2,6 +2,7 @@
 #define _FLEXFLOW_BATCH_NORM_H
 
 #include "flexflow/model.h"
+#include "flexflow/utils/memory_allocator.h"
 
 namespace FlexFlow {
 
diff --git a/include/flexflow/utils/memory_allocator.h b/include/flexflow/utils/memory_allocator.h
index 8e50a4c3b3..7091b159b2 100644
--- a/include/flexflow/utils/memory_allocator.h
+++ b/include/flexflow/utils/memory_allocator.h
@@ -62,6 +62,8 @@ class MemoryAllocator {
   size_t instance_total_size, instance_allocated_size;
 };
 
+Legion::Memory get_proc_mem(Legion::Machine machine, Legion::Processor proc);
+
 }; // namespace FlexFlow
 
 #endif // _FLEXFLOW_RUNTIME_H_
diff --git a/src/mapper/mapper.cc b/src/mapper/mapper.cc
index 4413d516ac..d7b9a5e99d 100644
--- a/src/mapper/mapper.cc
+++ b/src/mapper/mapper.cc
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/mapper.h"
+#include "flexflow/utils/memory_allocator.h"
 
 namespace FlexFlow {
 
@@ -81,11 +82,7 @@ FFMapper::FFMapper(MapperRuntime *rt,
       if (it->address_space() == node_id) {
         local_gpus.push_back(*it);
       }
-      Machine::MemoryQuery fb_query(machine);
-      fb_query.only_kind(Memory::GPU_FB_MEM);
-      fb_query.best_affinity_to(*it);
-      assert(fb_query.count() == 1);
-      proc_fbmems[*it] = *(fb_query.begin());
+      proc_fbmems[*it] = get_proc_mem(machine, *it);
       Machine::MemoryQuery zc_query(machine);
       zc_query.only_kind(Memory::Z_COPY_MEM);
       zc_query.has_affinity_to(*it);
diff --git a/src/ops/add_bias_residual_layer_norm.cc b/src/ops/add_bias_residual_layer_norm.cc
index e670380901..a17e156f18 100644
--- a/src/ops/add_bias_residual_layer_norm.cc
+++ b/src/ops/add_bias_residual_layer_norm.cc
@@ -493,10 +493,7 @@ OpMeta *AddBiasResidualLayerNorm::init_task(
     Runtime *runtime) {
   AddBiasResidualLayerNorm *ln = (AddBiasResidualLayerNorm *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
-  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                       .only_kind(Memory::GPU_FB_MEM)
-                       .best_affinity_to(task->target_proc)
-                       .first();
+  Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
   MemoryAllocator gpu_mem_allocator(gpu_mem);
   AddBiasResidualLayerNormMeta *meta =
       new AddBiasResidualLayerNormMeta(handle, ln, gpu_mem_allocator);
diff --git a/src/ops/argmax.cc b/src/ops/argmax.cc
index a52ce1886b..1892ac2353 100644
--- a/src/ops/argmax.cc
+++ b/src/ops/argmax.cc
@@ -233,10 +233,7 @@ OpMeta *ArgMax::init_task(Task const *task,
       ctx, task->regions[1].region.get_index_space());
   int length = acc_input.domain.hi()[0] - acc_input.domain.lo()[0] + 1;
   int batch_size = acc_input.domain.get_volume() / length;
-  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                       .only_kind(Memory::GPU_FB_MEM)
-                       .best_affinity_to(task->target_proc)
-                       .first();
+  Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
   MemoryAllocator gpu_mem_allocator(gpu_mem);
 
   ArgMaxMeta *m = new ArgMaxMeta(handle,
diff --git a/src/ops/attention.cc b/src/ops/attention.cc
index 97afc94341..203662d3ec 100644
--- a/src/ops/attention.cc
+++ b/src/ops/attention.cc
@@ -514,10 +514,7 @@ OpMeta *
          acc_output.rect.hi[1] - acc_output.rect.lo[1] + 1);
   assert(attn->oProjSize == acc_output.rect.hi[0] - acc_output.rect.lo[0] + 1);
 
-  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                       .only_kind(Memory::GPU_FB_MEM)
-                       .best_affinity_to(task->target_proc)
-                       .first();
+  Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
   MultiHeadAttentionMeta *m =
       new MultiHeadAttentionMeta(handle, attn, gpu_mem, num_samples, num_heads);
   m->profiling = attn->profiling;
diff --git a/src/ops/batch_norm.cpp b/src/ops/batch_norm.cpp
index 106e5ebad2..7dee6fdaaf 100644
--- a/src/ops/batch_norm.cpp
+++ b/src/ops/batch_norm.cpp
@@ -61,10 +61,7 @@ __host__ OpMeta *
   int output_c = acc_output.rect.hi[2] - acc_output.rect.lo[2] + 1;
   int output_n = acc_output.rect.hi[3] - acc_output.rect.lo[3] + 1;
 
-  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                       .only_kind(Memory::GPU_FB_MEM)
-                       .best_affinity_to(task->target_proc)
-                       .first();
+  Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
   BatchNormMeta *m = new BatchNormMeta(
       handle, bm, gpu_mem, output_n, output_c, output_h, output_w);
   return m;
diff --git a/src/ops/batch_norm.cu b/src/ops/batch_norm.cu
index b77e9d489f..929ebf81f8 100644
--- a/src/ops/batch_norm.cu
+++ b/src/ops/batch_norm.cu
@@ -58,10 +58,7 @@ __host__ OpMeta *
   int output_c = acc_output.rect.hi[2] - acc_output.rect.lo[2] + 1;
   int output_n = acc_output.rect.hi[3] - acc_output.rect.lo[3] + 1;
 
-  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                       .only_kind(Memory::GPU_FB_MEM)
-                       .best_affinity_to(task->target_proc)
-                       .first();
+  Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
   BatchNormMeta *m = new BatchNormMeta(
       handle, bm, gpu_mem, output_n, output_c, output_h, output_w);
   return m;
diff --git a/src/ops/beam_topk.cc b/src/ops/beam_topk.cc
index d2054cacb0..5f4547ace5 100644
--- a/src/ops/beam_topk.cc
+++ b/src/ops/beam_topk.cc
@@ -271,10 +271,7 @@ OpMeta *BeamTopK::init_task(Task const *task,
                             Runtime *runtime) {
   BeamTopK *topk = (BeamTopK *)task->args;
   FFHandler handle = *((FFHandler *)task->local_args);
-  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                       .only_kind(Memory::GPU_FB_MEM)
-                       .best_affinity_to(task->target_proc)
-                       .first();
+  Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
   MemoryAllocator gpu_mem_allocator(gpu_mem);
   BeamTopKMeta *m = new BeamTopKMeta(handle, topk, gpu_mem_allocator);
   m->profiling = topk->profiling;
diff --git a/src/ops/dropout.cc b/src/ops/dropout.cc
index 58cb82d53d..190d6fd496 100644
--- a/src/ops/dropout.cc
+++ b/src/ops/dropout.cc
@@ -164,10 +164,7 @@ OpMeta *Dropout::init_task(Task const *task,
       ctx, task->regions[0].region.get_index_space());
   Domain output_domain = runtime->get_index_space_domain(
       ctx, task->regions[1].region.get_index_space());
-  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                       .only_kind(Memory::GPU_FB_MEM)
-                       .best_affinity_to(task->target_proc)
-                       .first();
+  Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
   assert(input_domain == output_domain);
   DropoutMeta *m = new DropoutMeta(handle, dropout, gpu_mem, output_domain);
   std::strcpy(m->op_name, dropout->name);
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index 8688585788..aa60d0f19c 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -698,10 +698,7 @@ OpMeta *IncMultiHeadSelfAttention::init_task(
 
   assert(attn->oProjSize == output.domain.hi()[0] - output.domain.lo()[0] + 1);
 
-  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                       .only_kind(Memory::GPU_FB_MEM)
-                       .best_affinity_to(task->target_proc)
-                       .first();
+  Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
   MemoryAllocator gpu_mem_allocator(gpu_mem);
   if (attn->offload) {
     // cpu-offload enabled
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index 2218ffe392..b19f400eb2 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -380,10 +380,7 @@ OpMeta *LayerNorm::init_task(Task const *task,
                              Runtime *runtime) {
   LayerNorm *ln = (LayerNorm *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
-  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                       .only_kind(Memory::GPU_FB_MEM)
-                       .best_affinity_to(task->target_proc)
-                       .first();
+  Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
   MemoryAllocator gpu_mem_allocator(gpu_mem);
   LayerNormMeta *meta = new LayerNormMeta(handle, ln, gpu_mem_allocator);
   std::strcpy(meta->op_name, ln->name);
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index 0c7a0f78fe..44b56d623e 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -480,10 +480,7 @@ OpMeta *Linear::init_task_with_dim(Task const *task,
   //        in_dim,
   //        out_dim,
   //        batch_size);
-  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                       .only_kind(Memory::GPU_FB_MEM)
-                       .best_affinity_to(task->target_proc)
-                       .first();
+  Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
   MemoryAllocator gpu_mem_allocator(gpu_mem);
   if (linear->offload) {
     // cpu-offload enabled
diff --git a/src/ops/residual_layer_norm.cc b/src/ops/residual_layer_norm.cc
index ed9252c309..8dd670eea3 100644
--- a/src/ops/residual_layer_norm.cc
+++ b/src/ops/residual_layer_norm.cc
@@ -489,10 +489,7 @@ OpMeta *ResidualLayerNorm::init_task(Task const *task,
                                      Runtime *runtime) {
   ResidualLayerNorm *ln = (ResidualLayerNorm *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
-  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                       .only_kind(Memory::GPU_FB_MEM)
-                       .best_affinity_to(task->target_proc)
-                       .first();
+  Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
   MemoryAllocator gpu_mem_allocator(gpu_mem);
   ResidualLayerNormMeta *meta =
       new ResidualLayerNormMeta(handle, ln, gpu_mem_allocator);
diff --git a/src/ops/residual_rms_norm.cc b/src/ops/residual_rms_norm.cc
index f4f5bb72d0..b3ee7179d0 100644
--- a/src/ops/residual_rms_norm.cc
+++ b/src/ops/residual_rms_norm.cc
@@ -347,10 +347,7 @@ OpMeta *ResidualRMSNorm::init_task(Task const *task,
                                    Runtime *runtime) {
   ResidualRMSNorm *rn = (ResidualRMSNorm *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
-  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                       .only_kind(Memory::GPU_FB_MEM)
-                       .best_affinity_to(task->target_proc)
-                       .first();
+  Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
   MemoryAllocator gpu_mem_allocator(gpu_mem);
   ResidualRMSNormMeta *meta =
       new ResidualRMSNormMeta(handle, rn, gpu_mem_allocator);
diff --git a/src/ops/rms_norm.cc b/src/ops/rms_norm.cc
index bf07ee6bb0..79dce65c57 100644
--- a/src/ops/rms_norm.cc
+++ b/src/ops/rms_norm.cc
@@ -294,10 +294,7 @@ OpMeta *RMSNorm::init_task(Task const *task,
                            Runtime *runtime) {
   RMSNorm *rn = (RMSNorm *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
-  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                       .only_kind(Memory::GPU_FB_MEM)
-                       .best_affinity_to(task->target_proc)
-                       .first();
+  Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
   MemoryAllocator gpu_mem_allocator(gpu_mem);
   RMSNormMeta *meta = new RMSNormMeta(handle, rn, gpu_mem_allocator);
   std::strcpy(meta->op_name, rn->name);
diff --git a/src/ops/sampling.cc b/src/ops/sampling.cc
index 9fc2316f9a..b38c68843b 100644
--- a/src/ops/sampling.cc
+++ b/src/ops/sampling.cc
@@ -226,10 +226,7 @@ OpMeta *Sampling::init_task(Task const *task,
 
   int length = acc_input.domain.hi()[0] - acc_input.domain.lo()[0] + 1;
   int batch_size = acc_input.domain.get_volume() / length;
-  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                       .only_kind(Memory::GPU_FB_MEM)
-                       .best_affinity_to(task->target_proc)
-                       .first();
+  Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
   MemoryAllocator gpu_mem_allocator(gpu_mem);
   SamplingMeta *m = new SamplingMeta(
       handle, s, batch_size, length * batch_size, acc_input, gpu_mem_allocator);
diff --git a/src/ops/sigmoid_silu_multi.cc b/src/ops/sigmoid_silu_multi.cc
index 3ddd6b8d6e..3d1c8d9094 100644
--- a/src/ops/sigmoid_silu_multi.cc
+++ b/src/ops/sigmoid_silu_multi.cc
@@ -237,10 +237,7 @@ OpMeta *SigmoidSiluMulti::init_task(Task const *task,
                                     Runtime *runtime) {
   SigmoidSiluMulti *ssm = (SigmoidSiluMulti *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
-  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                       .only_kind(Memory::GPU_FB_MEM)
-                       .best_affinity_to(task->target_proc)
-                       .first();
+  Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
   MemoryAllocator gpu_mem_allocator(gpu_mem);
   SigmoidSiluMultiMeta *meta =
       new SigmoidSiluMultiMeta(handle, ssm, gpu_mem_allocator);
diff --git a/src/ops/spec_inc_multihead_self_attention.cc b/src/ops/spec_inc_multihead_self_attention.cc
index 9c6ed0e0b6..68d3a4c205 100644
--- a/src/ops/spec_inc_multihead_self_attention.cc
+++ b/src/ops/spec_inc_multihead_self_attention.cc
@@ -640,10 +640,7 @@ OpMeta *SpecIncMultiHeadSelfAttention::init_task(
   int num_kv_heads = attn->num_kv_heads;
   assert(attn->oProjSize == output.domain.hi()[0] - output.domain.lo()[0] + 1);
 
-  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                       .only_kind(Memory::GPU_FB_MEM)
-                       .best_affinity_to(task->target_proc)
-                       .first();
+  Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
   MemoryAllocator gpu_mem_allocator(gpu_mem);
   // We don't do offloading for SSMs (small speculative models)
   SpecIncMultiHeadSelfAttentionMeta *m =
diff --git a/src/ops/tree_inc_multihead_self_attention.cc b/src/ops/tree_inc_multihead_self_attention.cc
index 9b8c88420d..df722a3d51 100644
--- a/src/ops/tree_inc_multihead_self_attention.cc
+++ b/src/ops/tree_inc_multihead_self_attention.cc
@@ -697,10 +697,7 @@ OpMeta *TreeIncMultiHeadSelfAttention::init_task(
 
   assert(attn->oProjSize == output.domain.hi()[0] - output.domain.lo()[0] + 1);
 
-  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                       .only_kind(Memory::GPU_FB_MEM)
-                       .best_affinity_to(task->target_proc)
-                       .first();
+  Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
   MemoryAllocator gpu_mem_allocator(gpu_mem);
   if (attn->offload) {
     // cpu-offload enabled
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index cf75235ae7..b023aced6e 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -1914,10 +1914,7 @@ std::pair<std::unique_ptr<Graph>, std::unordered_map<Node, MachineView>>
                                     model->config.workersPerNode,
                                     model->config.cpusPerNode,
                                     model->all_valid_views);
-  Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                       .only_kind(Memory::GPU_FB_MEM)
-                       .best_affinity_to(task->target_proc)
-                       .first();
+  Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
   MachineModel *machine;
   if (model->config.machine_model_version == 0) {
     machine =
diff --git a/src/runtime/memory_allocator.cc b/src/runtime/memory_allocator.cc
index 06a7c468a4..cb4e867165 100644
--- a/src/runtime/memory_allocator.cc
+++ b/src/runtime/memory_allocator.cc
@@ -19,7 +19,9 @@ namespace FlexFlow {
 
 // declare Legion names
 using Legion::coord_t;
+using Legion::Machine;
 using Legion::Memory;
+using Legion::Processor;
 using Realm::RegionInstance;
 
 MemoryAllocator::MemoryAllocator(Memory _memory)
@@ -51,4 +53,14 @@ void MemoryAllocator::register_reserved_work_space(void *base, size_t size) {
   reserved_allocated_size = 0;
 }
 
+// Now it's for allocating FB memory, in the future we can
+// add more types of memory allocation if needed
+Memory get_proc_mem(Machine machine, Processor proc) {
+  Machine::MemoryQuery proc_mem = Machine::MemoryQuery(machine)
+                                      .only_kind(Memory::GPU_FB_MEM)
+                                      .best_affinity_to(proc);
+  assert(proc_mem.count() > 0);
+  return proc_mem.first();
+}
+
 }; // namespace FlexFlow
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 5cad628743..f1e222e6e3 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -4273,8 +4273,8 @@ void FFConfig::parse_args(char **argv, int argc) {
       workersPerNode = atoi(argv[++i]);
       continue;
     }
-    if (!strcmp(argv[i], "-ll:fsize")) {
-      device_mem = atoi(argv[++i]);
+    if ((!strcmp(argv[i], "-ll:fsize")) || (!strcmp(argv[i], "-ll:msize"))) {
+      device_mem += atoi(argv[++i]);
       continue;
     }
     if (!strcmp(argv[i], "--nodes")) {
diff --git a/src/runtime/model.cpp b/src/runtime/model.cpp
index ad2b781567..62f6b89b7f 100644
--- a/src/runtime/model.cpp
+++ b/src/runtime/model.cpp
@@ -112,10 +112,7 @@ FFHandler
   //  handle.workSpace = memFBImpl->get_direct_ptr(offset, 0);
   {
     // allocate memory for workspace
-    Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                         .only_kind(Memory::GPU_FB_MEM)
-                         .best_affinity_to(task->target_proc)
-                         .first();
+    Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
     Realm::Rect<1, coord_t> bounds(
         Realm::Point<1, coord_t>(0),
         Realm::Point<1, coord_t>(handle.workSpaceSize - 1));
@@ -133,10 +130,7 @@ FFHandler
   }
   if (handle.offload_reserve_space_size > 0) {
     // allocate memory for offload reserve space
-    Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                         .only_kind(Memory::GPU_FB_MEM)
-                         .best_affinity_to(task->target_proc)
-                         .first();
+    Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
     Realm::Rect<1, coord_t> bounds(
         Realm::Point<1, coord_t>(0),
         Realm::Point<1, coord_t>(handle.offload_reserve_space_size - 1));
@@ -157,10 +151,7 @@ FFHandler
   }
   if (handle.batch_config_metadata_size > 0) {
     // allocate memory for offload reserve space
-    Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                         .only_kind(Memory::GPU_FB_MEM)
-                         .best_affinity_to(task->target_proc)
-                         .first();
+    Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
     Realm::Rect<1, coord_t> bounds(
         Realm::Point<1, coord_t>(0),
         Realm::Point<1, coord_t>(handle.batch_config_metadata_size - 1));
diff --git a/src/runtime/model.cu b/src/runtime/model.cu
index 23b7f0efbe..fd39ed0db0 100644
--- a/src/runtime/model.cu
+++ b/src/runtime/model.cu
@@ -108,10 +108,7 @@ FFHandler
   //  handle.workSpace = memFBImpl->get_direct_ptr(offset, 0);
   {
     // allocate memory for workspace
-    Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                         .only_kind(Memory::GPU_FB_MEM)
-                         .best_affinity_to(task->target_proc)
-                         .first();
+    Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
     Realm::Rect<1, coord_t> bounds(
         Realm::Point<1, coord_t>(0),
         Realm::Point<1, coord_t>(handle.workSpaceSize - 1));
@@ -129,10 +126,7 @@ FFHandler
   }
   if (handle.offload_reserve_space_size > 0) {
     // allocate memory for offload reserve space
-    Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                         .only_kind(Memory::GPU_FB_MEM)
-                         .best_affinity_to(task->target_proc)
-                         .first();
+    Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
     Realm::Rect<1, coord_t> bounds(
         Realm::Point<1, coord_t>(0),
         Realm::Point<1, coord_t>(handle.offload_reserve_space_size - 1));
@@ -153,10 +147,7 @@ FFHandler
   }
   if (handle.batch_config_metadata_size > 0) {
     // allocate memory for offload reserve space
-    Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
-                         .only_kind(Memory::GPU_FB_MEM)
-                         .best_affinity_to(task->target_proc)
-                         .first();
+    Memory gpu_mem = get_proc_mem(Machine::get_machine(), task->target_proc);
     Realm::Rect<1, coord_t> bounds(
         Realm::Point<1, coord_t>(0),
         Realm::Point<1, coord_t>(handle.batch_config_metadata_size - 1));

From 6d710acd79f968f65397874f62b8ebef20590620 Mon Sep 17 00:00:00 2001
From: George Stelle <stelleg@gmail.com>
Date: Tue, 20 Aug 2024 14:06:52 -0600
Subject: [PATCH 340/344] pip flexflow_python typo (#1461)

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>
---
 python/flexflow/flexflow_python | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/python/flexflow/flexflow_python b/python/flexflow/flexflow_python
index cf247b9ede..8a9b65a404 100644
--- a/python/flexflow/flexflow_python
+++ b/python/flexflow/flexflow_python
@@ -6,7 +6,7 @@ python_packages=$(python -c "from distutils import sysconfig; print(sysconfig.ge
 pylib_path="$(python "$python_packages"/flexflow/findpylib.py)"
 pylib_dir="$(dirname "$pylib_path")"
 export PATH="${python_packages}/flexflow/bin:${PATH}"
-export LD_LIBRARY_PATH="${python_packages}/flexflow/lib:${pylib_dir}:${PATH}"
+export LD_LIBRARY_PATH="${python_packages}/flexflow/lib:${pylib_dir}:${LD_LIBRARY_PATH}"
 legion_python_args=("$@" "-ll:py" "1")
 
 legion_python "${legion_python_args[@]}"

From 3b59f0577cc6fc3a109921f72ceadef3458cf635 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Thu, 29 Aug 2024 00:04:28 +0200
Subject: [PATCH 341/344] update legion version

---
 deps/legion | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/deps/legion b/deps/legion
index 02eb1010ca..0d32b35542 160000
--- a/deps/legion
+++ b/deps/legion
@@ -1 +1 @@
-Subproject commit 02eb1010ca9eb449d345a0db97eab17efb0e5af0
+Subproject commit 0d32b35542bc0e9aba5950e485b8fc3413ae664b

From 28aff70cc98d065390eb58b7fd15dcd24f3fb786 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Sat, 31 Aug 2024 06:00:57 -0700
Subject: [PATCH 342/344] Fix nccl-induced segfault (#1481)

---
 include/flexflow/model.h       |  1 +
 src/runtime/model.cc           | 68 ++++++++++++++++++----------------
 src/runtime/request_manager.cc |  3 ++
 3 files changed, 41 insertions(+), 31 deletions(-)

diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index ea64f65a95..6dda67bbfe 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -1079,6 +1079,7 @@ class FFModel {
                      bool use_propagation) const;
 #ifdef FF_USE_NCCL
   ncclComm_t *find_nccl_comms(MachineView const &view) const;
+  void finish_nccl_comms();
 #endif
 #ifdef FF_USE_PROPAGATE
   void propagate(std::map<Op *, ParallelConfig> const &current,
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index f1e222e6e3..4c67de1aa9 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -1589,41 +1589,47 @@ FFModel::FFModel(FFConfig &_config, bool cpu_offload)
   model_id = model_counter++;
 }
 
+#ifdef FF_USE_NCCL
+void FFModel::finish_nccl_comms() {
+  Context ctx = config.lg_ctx;
+  Runtime *runtime = config.lg_hlr;
+  for (auto const &comm : view_hash_to_nccl_comms) {
+    // Find the machine view that has the hash
+    MachineView view;
+    for (size_t l = 0; l < operators.size(); l++) {
+      view = operators[l]->outputs[0]->machine_view;
+      if (view.hash() == comm.first) {
+        break;
+      }
+    }
+    assert(view.hash() == comm.first && "Cannot find the machine view");
+    IndexSpace task_is = get_or_create_task_is(view);
+    Domain domain = runtime->get_index_space_domain(ctx, task_is);
+    ArgumentMap argmap;
+    int idx = 0;
+    for (Domain::DomainPointIterator it(domain); it; it++, idx++) {
+      argmap.set_point(*it,
+                       TaskArgument(&comm.second[idx], sizeof(ncclComm_t)));
+    }
+    IndexLauncher index_launcher(NCCL_FINISH_COMMS_TASK_ID,
+                                 task_is,
+                                 TaskArgument(nullptr, 0),
+                                 argmap,
+                                 Predicate::TRUE_PRED,
+                                 false /*must*/,
+                                 0 /*mapper_id*/,
+                                 comm.first);
+    FutureMap fm = runtime->execute_index_space(ctx, index_launcher);
+    fm.wait_all_results();
+  }
+}
+#endif
+
 FFModel::~FFModel() {
   // Destroy nccl communication groups
 #ifdef FF_USE_NCCL
   if (config.computationMode == COMP_MODE_TRAINING) {
-    Context ctx = config.lg_ctx;
-    Runtime *runtime = config.lg_hlr;
-    for (auto const &comm : view_hash_to_nccl_comms) {
-      // Find the machine view that has the hash
-      MachineView view;
-      for (size_t l = 0; l < operators.size(); l++) {
-        view = operators[l]->outputs[0]->machine_view;
-        if (view.hash() == comm.first) {
-          break;
-        }
-      }
-      assert(view.hash() == comm.first && "Cannot find the machine view");
-      IndexSpace task_is = get_or_create_task_is(view);
-      Domain domain = runtime->get_index_space_domain(ctx, task_is);
-      ArgumentMap argmap;
-      int idx = 0;
-      for (Domain::DomainPointIterator it(domain); it; it++, idx++) {
-        argmap.set_point(*it,
-                         TaskArgument(&comm.second[idx], sizeof(ncclComm_t)));
-      }
-      IndexLauncher index_launcher(NCCL_FINISH_COMMS_TASK_ID,
-                                   task_is,
-                                   TaskArgument(nullptr, 0),
-                                   argmap,
-                                   Predicate::TRUE_PRED,
-                                   false /*must*/,
-                                   0 /*mapper_id*/,
-                                   comm.first);
-      FutureMap fm = runtime->execute_index_space(ctx, index_launcher);
-      fm.wait_all_results();
-    }
+    finish_nccl_comms();
   }
 #endif
 }
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index d21285eef2..bada87ab19 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -2365,6 +2365,9 @@ void RequestManager::background_serving_task(
     // Registered SSMs: perform speculative inference
     rm->serve_spec_infer(llm);
   }
+#ifdef FF_USE_NCCL
+  llm->finish_nccl_comms();
+#endif
 }
 
 /*static*/

From 49523d62691039a9a8c29891acc5d48641048cc4 Mon Sep 17 00:00:00 2001
From: Gabriele Oliaro <goliaro@cs.cmu.edu>
Date: Mon, 2 Sep 2024 03:05:25 -0700
Subject: [PATCH 343/344] Fix python install issue caused by new Legion version
 (#1482)

* fix

* .

* .

* fix

* cleanup

* fix

* cleanup
---
 CMakeLists.txt                   | 20 ++++++++++++++------
 cmake/pip_install/CMakeLists.txt | 20 ++++++++++++++++++--
 pyproject.toml                   |  3 ++-
 requirements.txt                 |  1 +
 4 files changed, 35 insertions(+), 9 deletions(-)

diff --git a/CMakeLists.txt b/CMakeLists.txt
index d7a6391e06..c82a53644e 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -37,13 +37,24 @@ if(NOT CMAKE_BUILD_TYPE AND NOT CMAKE_CONFIGURATION_TYPES)
       STRING "Choose the type of build." FORCE)
 endif()
 
+# option for using Python
+option(FF_USE_PYTHON "Enable Python" ON)
+if (FF_USE_PYTHON)
+  find_package(Python3 COMPONENTS Interpreter Development)
+endif()
+
 if(INSTALL_DIR)
   message(STATUS "INSTALL_DIR: ${INSTALL_DIR}")
   set(CMAKE_INSTALL_PREFIX ${INSTALL_DIR} CACHE PATH "Installation directory" FORCE)
 else()
-  # Install DIR not set. Use default, unless a conda environment is active
-  if (DEFINED ENV{CONDA_PREFIX} AND NOT FF_BUILD_FROM_PYPI)
-    set(CONDA_PREFIX $ENV{CONDA_PREFIX})
+  # Install DIR not set. Use default, unless a conda environment is in use
+  if ((DEFINED ENV{CONDA_PREFIX} OR (Python3_EXECUTABLE AND Python3_EXECUTABLE MATCHES "conda")) AND NOT FF_BUILD_FROM_PYPI)
+    if (DEFINED ENV{CONDA_PREFIX})
+        set(CONDA_PREFIX $ENV{CONDA_PREFIX})
+    else()
+        get_filename_component(CONDA_PREFIX "${Python3_EXECUTABLE}" DIRECTORY)
+        get_filename_component(CONDA_PREFIX "${CONDA_PREFIX}" DIRECTORY)
+    endif()
     # Set CMAKE_INSTALL_PREFIX to the Conda environment's installation path
     set(CMAKE_INSTALL_PREFIX ${CONDA_PREFIX} CACHE PATH "Installation directory" FORCE)
     message(STATUS "Active conda environment detected. Setting CMAKE_INSTALL_PREFIX: ${CMAKE_INSTALL_PREFIX}")
@@ -64,9 +75,6 @@ option(FF_BUILD_FROM_PYPI "Build from pypi" OFF)
 # build shared or static flexflow lib
 option(BUILD_SHARED_LIBS "Build shared libraries instead of static ones" ON)
 
-# option for using Python
-option(FF_USE_PYTHON "Enable Python" ON)
-
 # option for building legion only 
 option(BUILD_LEGION_ONLY "Build Legion only" OFF)
 
diff --git a/cmake/pip_install/CMakeLists.txt b/cmake/pip_install/CMakeLists.txt
index 105133a310..217d7e14f0 100644
--- a/cmake/pip_install/CMakeLists.txt
+++ b/cmake/pip_install/CMakeLists.txt
@@ -2,9 +2,25 @@
 if (FF_USE_PYTHON)
     execute_process(COMMAND ${Python_EXECUTABLE} -c "import site, os; print([pkg for func in (site.getsitepackages(), site.getusersitepackages()) for pkg in ([func] if isinstance(func, str) else func) if os.access(pkg, os.W_OK)][0])" OUTPUT_VARIABLE PY_DEST OUTPUT_STRIP_TRAILING_WHITESPACE)  
     if(FF_BUILD_FROM_PYPI)
-        install(CODE "execute_process(COMMAND ${CMAKE_COMMAND} -E echo \"Editing path to Legion library using path: ${PY_DEST}/flexflow/lib \")")
+        cmake_path(SET CMAKE_SOURCE_DIR_ NORMALIZE ${CMAKE_CURRENT_SOURCE_DIR}/../../deps/legion)
+        cmake_path(SET CMAKE_BUILD_DIR_ NORMALIZE ${Legion_BINARY_DIR}/runtime)
+        cmake_path(SET CMAKE_INSTALL_PREFIX_ NORMALIZE ${PY_DEST}/../../..)
+        cmake_path(SET WORKING_DIRECTORY_ NORMALIZE ${CMAKE_CURRENT_SOURCE_DIR}/../../deps/legion/bindings/python/)
         # CMAKE_CURRENT_SOURCE_DIR=/usr/FlexFlow/cmake/pip_install 
         # Legion_BINARY_DIR=/usr/FlexFlow/build/<something>/deps/legion
-        install(CODE "execute_process(COMMAND ${Python_EXECUTABLE} ${CMAKE_CURRENT_SOURCE_DIR}/../../deps/legion/bindings/python/setup.py install --cmake-build-dir ${Legion_BINARY_DIR}/runtime --prefix ${PY_DEST}/flexflow ${Legion_PYTHON_EXTRA_INSTALL_ARGS} WORKING_DIRECTORY ${CMAKE_CURRENT_SOURCE_DIR}/../../deps/legion/bindings/python)")
+        # CMAKE_SOURCE_DIR_=/usr/FlexFlow/deps/legion
+        # CMAKE_BUILD_DIR_: /usr/FlexFlow/build/<something>/deps/legion/runtime
+        # CMAKE_INSTALL_PREFIX_: /opt/conda/ or /usr/local
+        # WORKING_DIRECTORY_: /usr/FlexFlow/deps/legion/bindings/python/
+        # PY_DEST: <path to python lib>/python3.11/site-packages
+        message(STATUS "CMAKE_CURRENT_SOURCE_DIR: ${CMAKE_CURRENT_SOURCE_DIR}")
+        message(STATUS "Legion_BINARY_DIR: ${Legion_BINARY_DIR}")
+        message(STATUS "CMAKE_SOURCE_DIR_: ${CMAKE_SOURCE_DIR_}")
+        message(STATUS "CMAKE_BUILD_DIR_: ${CMAKE_BUILD_DIR_}")
+        message(STATUS "CMAKE_INSTALL_PREFIX_: ${CMAKE_INSTALL_PREFIX_}")
+        message(STATUS "WORKING_DIRECTORY_: ${WORKING_DIRECTORY_}")
+        message(STATUS "PY_DEST: ${PY_DEST}")
+        install(CODE "execute_process(COMMAND ${CMAKE_COMMAND} -E echo \"Editing path to Legion library using path: ${CMAKE_INSTALL_PREFIX_} \")")
+        install(CODE "execute_process(COMMAND ${CMAKE_COMMAND} -E env CMAKE_SOURCE_DIR=${CMAKE_SOURCE_DIR_} CMAKE_BUILD_DIR=${CMAKE_BUILD_DIR_} CMAKE_INSTALL_PREFIX=${PY_DEST}/flexflow ${Python3_EXECUTABLE} setup.py install --prefix ${CMAKE_INSTALL_PREFIX_} ${Legion_PYTHON_EXTRA_INSTALL_ARGS} WORKING_DIRECTORY ${WORKING_DIRECTORY_} COMMAND_ECHO STDOUT COMMAND_ERROR_IS_FATAL ANY)")
     endif()
 endif()
diff --git a/pyproject.toml b/pyproject.toml
index 4b8214f3fe..373c53beb8 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -5,6 +5,7 @@ requires = [
     "setuptools_scm[toml]>=6.0",
     "cmake-build-extension",
     "ninja",
-    "requests"
+    "requests",
+    "pip",
 ]
 build-backend = "setuptools.build_meta"
diff --git a/requirements.txt b/requirements.txt
index 1037661337..ad65622367 100644
--- a/requirements.txt
+++ b/requirements.txt
@@ -15,3 +15,4 @@ onnx
 transformers>=4.31.0
 sentencepiece
 einops
+pip

From a0f1ed783e3ef48ac374563cf3f4fc2388f34b4c Mon Sep 17 00:00:00 2001
From: Zhihao Jia <zhihao@cmu.edu>
Date: Wed, 4 Sep 2024 14:15:06 -0400
Subject: [PATCH 344/344] PEFT support (inference/finetuning) (#1153)
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

* .

* .

* Update the default cublas behavior when CUDA_VERSION is not specified

* fix bugs in IncMHA peft_bwd kernel

* uncomment softmaxbackward

* add layernorm to align test

* add peft test scripts

* fix import

* fix

* add code to convert peft models

* add script to download peft for c++, fix bug

* fix

* add script to fine-tune models

* implement loading lora configs/weights from file

* remove peft_bwd assertion failure in embedding

* fix download script

* add peft dependencies in dockerfile

* fix softmax backward

* fix bc print indentation

* Temporarily Revert "Update the default cublas behavior when CUDA_VERSION is not specified"

This reverts commit 4ee710a76ee4f47b4574c57519e2b0fb96efaa6a.

* Fix cublas default (#1220)

* Fix Legion prebuild workflow (2) (#1208)

* fix

* fix

* fix

* fix

* Fix Legion prebuild workflow (3) (#1210)

* fix hip error

* use CUBLAS_COMPUTE_FAST_16F for full-precision gemm

---------

Co-authored-by: Zhihao Jia <zhihao@cmu.edu>

* fix bugs, work on align opt-lora

* update scripts

* add code to output peft tensors in hf

* update, fixes

* linting

* fix printing of tensors for numpy

* update save_inference_tensors_to_file

* linting

* update

* fix issue with save_inference_tensors_to_file

* fix layer names for save_inference_tensors_to_file

* fix peft

* fix bwd bugs

* linting

* fixes

* fix

* fix

* fix

* add bc fields for peft training

* linting

* fix

* remove ptr check

* fix

* implement save_operators for bwd

* fix bug

* implement save tensors for bwd

* .

* bug fix

* fix

* align linear

* fix

* bwd kernel updates

* undo use of CUBLAS_COMPUTE_32F_FAST_16F for now

* only send dataset entry once

* update peft test scripts

* loss

* .

* update generate/request api to take both inference and fine-tuning prompts

* linting

* alignment fixes in lora & linear layer

* alignment fix

* diagonal

* fix

* alignment fix ssm

* sigmoid-silu-multi now fully aligned

* rms norm kernel updates

* fix

* in-place residual rms

* bug fix and linting

* align backward of o_proj, attn_heads, qk_prods_softmax, and v_proj with huggingface

* cleanup

* finished all alignment fixes in attention backward kernel

* fix

* Update inc_multihead_self_attention.cu

* Update inc_multihead_self_attention.cu

* use grad to store peft in/output (#1241)

* use grad to store peft in/output

* format

* .

* format

* enable peft request

* several hacks for performance measurement; some of the changes should be reverted

* Update sigmoid_silu_multi.cu

* RoPE backward

* PEFT bug fixes and alignment (#1269)

* Revert "several hacks for performance measurement; some of the changes should be reverted"

This reverts commit b9c392631b596db788ead74fe76d08d80a487b7c.

* backup

* backup

* updates

* update

* backup

* backup

* backup

* fix

* cleanup

* linting

* Fuse bias + relu in OPT (#1271)

* fuse bias and relu in opt

* fix

* fix

* fix

* fix

* Peft alignment & debugging tools (#1288)

* Revert "several hacks for performance measurement; some of the changes should be reverted"

This reverts commit b9c392631b596db788ead74fe76d08d80a487b7c.

* backup

* backup

* updates

* update

* backup

* backup

* backup

* fix

* cleanup

* fix

* fix

* fix

* update

* simplify tensor names

* fix

* fixes and updates

* fixes

* fix

* cleanup

* .

* restore softmax

* cleanup

* update alignment scripts

* newline

* fix legion aliasing error

* fix warnings

* fix

* fix pipeline parallelism

* fix tp issue in combine op

* fix lora weight loading with tensor parallelism

* fixes, implement Combine::peft_bwd_task

* fix

* replicate peft bwd

* fixes

* fix

* fix combine and fwd-bwd pass dependencies

* fix replicate bwd

* fix

* let user control amount of peft memory

* only run peft_bwd if peft is enabled

* fix rms norm inference region reqs

* fix in-place fusion (part 1)

* fix inplace fusion (part 2)

* fix

* disable automatic inplace rms norm for now

* fix inf fusion inplace

* fix rest input grads for peft without inplace residuals

* fix

* fix

* fix residual rms

* fix

* fix

* enable inf debugging in fusion bwd

* hack to silence warning in fused bwd

* fix

* fix

* fix build

* fix

* fix

* add draft peft test

* Peft python interface (#1306)

* update script

* less model renaming

* fix

* fix

* fix

* backup

* .

* update

* .

* fixes

* fix

* fix build

* fix

* fix

* fix issues for downloading peft model

* solved issues for download peft model

* added printouts for debugging

* fix

* fix seg fault

* add test, separate peft script in cpp

* fix

* fixes

* fix

* update peft python interface

* update

* update

* update

* updates

* fix

* fixes

* fix

* fixes

---------

Co-authored-by: april-yyt <aprilytyang@gmail.com>

* fix

* update

* fix

* fix to support prompts larger than max tokens per batch

* fixes to support benchmarking of finetuning throughput

* many upgrades and updates related to finetuning

* add ttft statistics

* add warmup phase

* add benchmarking code

* Add scripts for evaluation with Microsoft Azure trace (#1363)

* Add scripts for evaluation

* Add absolute request rate value

* Fix script for target arrival rate

* Fix cpp req rate benchmark

* update to use new dataset

* Fix infinite loop

* update

* add data

---------

Co-authored-by: Remi Delacourt <rdelacou@catalyst-0-9.eth>
Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>

* fix

* fix

* add peft tests to ci

* shellcheck

* fix

* fix python requirements

* fix

* fix

* update ci test

* update alignment doc

* fix cross entropy loss bug

* update alignment test

* update test

* add llama peft alignment test to ci

* Fix values for unused params in incr_decoding

* Add PEFTModelID NO_ID singleton instead of None

* Fix PEFTModelID::NO_ID reference

* reduce logging

* fix

* fix

* Add peft demo

* Add readme for demo

* fix alignment issue

* Peft optimizer (#1290)

* add optimizer config, only allocate weights for training

* sgd 1

* sgd 2

* update

* fix

* linting

* .

* .

* fix

* fix allreduce bug

* update

* update

* add optimizer hook in hf

* update

* update script

* .

* fix

* fwd

* bwd

* start grads

* fix gradient misalignment!

* update

* Add support for llama3

* various fixes

---------

Co-authored-by: Remi Delacourt <remi.delacourt@gmail.com>

* Optimizers python interface (#1441)

* python interface for optimizer

* update lora linear config to support python interface

* update python interface

* finished lora python interface

* fix

* fix

* update

* update

* more fixes

* fix

* initialize lora weights where needed

* Add notebook

* Update demo to use dataset

* Fix'

* Save weights after end of finetuning (#1446)

* support accumulation of gradients without update

* add code to save peft weights

* fix

* save configs

* cleanup

* Fully use notebook for demo

* Parameterize generation and finetuning configs

* Comment out inference for now

* fix bug in lora inference only mode

* fix

* Add finetuning or inference only flags

* fix

* fix

* fix

* PEFT model upload (#1450)

* upload test

* fix

* Make demo_class.py executable

* fix

* add base_model_name_or_path

* fix

* fix

* support llama-3 tokenizer

* print output tokens when not benchmarking

* Use Llama3 in demo_class

* Use Llama3 in demo

* fix data loading for llama-3

* Add download models to demo

* return/print loss at each finetuning step

* fix

* Adjust demo parameters

* Fix for finetuning

* pass finetuning losses to python interface

* Update demo

* Fix upload

* Refactor demo

* rename demo_class to demo

* fix

* remove epoch from loss print

* Finish demo

* fix test

* rocm fixes

* more rocm fixes

* fix rocm build

* docker fix

* fix inference test

* fix workflow

* fix makefile

* fix peft test

* fix all-reduce issue with lora for TP scenario

* fix bwd lm head

* fixes

* more fixes

* update

* fix alignment up to input ln

* finished aligning all backward (tp>1)

* align all peft

* fix

* fix broken link

* formatting

* fix

* update

* Revert "update"

This reverts commit 90b2c876ca3ea9c29e59aa7ae9904f254298660d.

* update

* fix hip build

* fix gpu ci

* fix gpu ci

* update default gpu ci version to 12.0

* update ci to 12.0

* fix

* fix

* update

* fix

* fix

* update

* fix

* add cleanup

* downgrade to cuda=11.8

---------

Co-authored-by: Gabriele Oliaro <goliaro@cs.cmu.edu>
Co-authored-by: xinhaoc <chengxh_98@163.com>
Co-authored-by: Xinhao Cheng <99570243+xinhaoc@users.noreply.github.com>
Co-authored-by: april-yyt <aprilytyang@gmail.com>
Co-authored-by: Remi <54138269+Flechman@users.noreply.github.com>
Co-authored-by: Remi Delacourt <rdelacou@catalyst-0-9.eth>
Co-authored-by: Rémi Delacourt <remi.delacourt@gmail.com>
---
 .github/workflows/build.yml                   |   12 +-
 .github/workflows/gpu-ci.yml                  |   10 +
 .github/workflows/helpers/install_cudnn.sh    |   23 +-
 .github/workflows/helpers/install_nccl.sh     |    8 +-
 .github/workflows/multinode-test.yml          |    6 +-
 .github/workflows/pip-install.yml             |    4 +-
 .github/workflows/prebuild-legion.yml         |    4 +-
 .gitignore                                    |    5 +
 CMakeLists.txt                                |    1 +
 conda/flexflow.yml                            |    7 +
 config/config.inc                             |    2 +-
 docker/build.sh                               |    9 +-
 docker/flexflow-environment/Dockerfile        |    2 +
 docker/run.sh                                 |    2 +-
 include/flexflow/batch_config.h               |   42 +-
 include/flexflow/config.h                     |   41 +-
 include/flexflow/ffconst.h                    |   77 +-
 include/flexflow/fftype.h                     |   25 +
 include/flexflow/flexflow_c.h                 |  136 +-
 include/flexflow/inference.h                  |    1 +
 include/flexflow/layer.h                      |    2 +-
 include/flexflow/model.h                      |   61 +-
 include/flexflow/op_meta.h                    |    6 +-
 include/flexflow/operator.h                   |   95 +-
 include/flexflow/operator_params.h            |    4 +
 .../ops/add_bias_residual_layer_norm.h        |   63 +-
 .../ops/add_bias_residual_layer_norm_params.h |    1 +
 include/flexflow/ops/aggregate.h              |    4 +-
 include/flexflow/ops/aggregate_spec.h         |    4 +-
 include/flexflow/ops/argmax.h                 |   11 +-
 include/flexflow/ops/cache.h                  |    4 +-
 include/flexflow/ops/element_unary.h          |    4 +-
 include/flexflow/ops/embedding.h              |    5 +
 include/flexflow/ops/experts.h                |   17 +-
 include/flexflow/ops/fused.h                  |    9 +
 include/flexflow/ops/groupby.h                |    4 +-
 .../ops/inc_multihead_self_attention.h        |   23 +-
 .../ops/kernels/batch_matmul_kernels.h        |    4 +-
 include/flexflow/ops/kernels/cast_kernels.h   |    4 +-
 include/flexflow/ops/kernels/concat_kernels.h |    4 +-
 .../flexflow/ops/kernels/conv_2d_kernels.h    |    4 +-
 include/flexflow/ops/kernels/flat_kernels.h   |    4 +-
 .../inc_multihead_self_attention_utils.cuh    |   27 +-
 include/flexflow/ops/kernels/linear_kernels.h |   31 +
 .../ops/kernels/lora_linear_kernels.h         |   77 +
 .../flexflow/ops/kernels/pool_2d_kernels.h    |    4 +-
 .../flexflow/ops/kernels/reshape_kernels.h    |    6 +-
 .../ops/kernels/residual_rms_norm_kernels.h   |   30 +-
 .../flexflow/ops/kernels/rms_norm_kernels.h   |   23 +-
 .../flexflow/ops/kernels/softmax_kernels.h    |   46 +-
 .../flexflow/ops/kernels/transpose_kernels.h  |    4 +-
 include/flexflow/ops/layer_norm.h             |   50 +-
 include/flexflow/ops/linear.h                 |    9 +
 include/flexflow/ops/lora_linear.h            |   99 +
 include/flexflow/ops/lora_linear_params.h     |  150 +
 include/flexflow/ops/residual_layer_norm.h    |   41 +-
 .../flexflow/ops/residual_layer_norm_params.h |    1 +
 include/flexflow/ops/residual_rms_norm.h      |   16 +
 .../flexflow/ops/residual_rms_norm_params.h   |    1 +
 include/flexflow/ops/rms_norm.h               |   13 +
 include/flexflow/ops/sigmoid_silu_multi.h     |   33 +-
 include/flexflow/ops/softmax.h                |    9 +
 include/flexflow/ops/topk.h                   |    4 +-
 include/flexflow/ops/transpose.h              |    2 +
 .../ops/tree_inc_multihead_self_attention.h   |    2 +-
 include/flexflow/parallel_ops/allreduce.h     |   19 +-
 include/flexflow/parallel_ops/combine.h       |   13 +
 .../parallel_ops/kernels/allreduce_kernels.h  |   14 +-
 .../parallel_ops/kernels/combine_kernels.h    |    4 +-
 .../kernels/parallel_identity_kernels.h       |   41 +
 .../parallel_ops/kernels/partition_kernels.h  |    4 +-
 .../flexflow/parallel_ops/parallel_identity.h |   83 +
 .../parallel_ops/parallel_identity_params.h   |   22 +
 include/flexflow/parallel_ops/parallel_op.h   |    2 +-
 include/flexflow/parallel_ops/replicate.h     |    9 +
 include/flexflow/request_manager.h            |   44 +-
 include/flexflow/simulator.h                  |   56 +-
 include/flexflow/utils/cuda_helper.h          |   13 +-
 include/flexflow/utils/hip_helper.h           |   33 +-
 include/flexflow/utils/memory_allocator.h     |    5 +
 .../flexflow/utils/peft_weight_allocator.h    |   92 +
 inference/MODEL_WEIGHTS.md                    |   28 -
 inference/README.md                           |   42 +
 inference/incr_decoding/incr_decoding.cc      |   11 +-
 inference/models/falcon.cc                    |   16 +-
 inference/models/llama.cc                     |  112 +-
 inference/models/llama.h                      |   11 +-
 inference/models/mpt.cc                       |   23 +-
 inference/models/opt.cc                       |   27 +-
 inference/models/starcoder.cc                 |   19 +-
 inference/peft/CMakeLists.txt                 |  139 +
 inference/peft/Makefile                       |   37 +
 inference/peft/peft.cc                        |  387 ++
 inference/peft/peft_bwd_benchmark.cc          |  391 ++
 inference/peft/peft_fwd_benchmark.cc          |  363 ++
 inference/peft/req_rate_benchmark.cc          |  518 ++
 inference/python/ff_peft.py                   |  189 +
 inference/python/incr_decoding.py             |    5 +-
 inference/python/peft_demo/INSTRUCTIONS.md    |   25 +
 inference/python/peft_demo/demo.ipynb         | 1907 +++++++
 inference/python/peft_demo/demo.py            |  240 +
 inference/python/spec_infer.py                |    7 +-
 inference/spec_infer/spec_infer.cc            |   11 +-
 inference/utils/download_peft_model.py        |   68 +
 inference/utils/upload_peft_model.py          |  142 +
 python/flexflow/core/__init__.py              |    5 +-
 python/flexflow/core/flexflow_cffi.py         | 5024 +++++++++--------
 python/flexflow/serve/__init__.py             |   43 +-
 python/flexflow/serve/models/base.py          |    3 +
 python/flexflow/serve/models/falcon.py        |   41 +-
 python/flexflow/serve/models/llama.py         |   48 +-
 python/flexflow/serve/models/mpt.py           |   46 +-
 python/flexflow/serve/models/opt.py           |   51 +-
 python/flexflow/serve/models/starcoder.py     |   47 +-
 python/flexflow/serve/serve.py                |  446 +-
 python/flexflow/type.py                       |   11 +
 rdelacou/generate_trace.py                    |  121 +
 requirements.txt                              |    8 +
 src/c/flexflow_c.cc                           |  382 +-
 src/loss_functions/loss_functions.cpp         |    8 +-
 src/loss_functions/loss_functions.cu          |    8 +-
 src/ops/add_bias_residual_layer_norm.cc       |  607 +-
 src/ops/add_bias_residual_layer_norm.cpp      |  748 ++-
 src/ops/add_bias_residual_layer_norm.cu       |  609 +-
 src/ops/aggregate.cc                          |    6 +-
 src/ops/aggregate.cpp                         |    9 +-
 src/ops/aggregate.cu                          |    7 +-
 src/ops/aggregate_spec.cc                     |    6 +-
 src/ops/aggregate_spec.cpp                    |    7 +-
 src/ops/aggregate_spec.cu                     |    7 +-
 src/ops/arg_topk.cc                           |   11 +-
 src/ops/argmax.cc                             |   42 +-
 src/ops/argmax.cpp                            |   81 +-
 src/ops/argmax.cu                             |   86 +-
 src/ops/attention.cc                          |    2 +-
 src/ops/attention.cpp                         |    2 +-
 src/ops/attention.cu                          |    2 +-
 src/ops/batch_matmul.cc                       |    4 +-
 src/ops/batch_norm.cpp                        |    2 +-
 src/ops/batch_norm.cu                         |    2 +-
 src/ops/beam_topk.cc                          |   10 +-
 src/ops/beam_topk.cpp                         |    2 +-
 src/ops/beam_topk.cu                          |    2 +-
 src/ops/cache.cc                              |    2 +-
 src/ops/cache.cpp                             |    2 +-
 src/ops/cache.cu                              |    2 +-
 src/ops/cast.cc                               |    2 +-
 src/ops/concat.cc                             |    4 +-
 src/ops/conv_2d.cc                            |   17 +-
 src/ops/element_binary.cc                     |   10 +-
 src/ops/element_unary.cc                      |    4 +-
 src/ops/element_unary.cpp                     |    3 +-
 src/ops/element_unary.cu                      |    3 +-
 src/ops/embedding.cc                          |   18 +-
 src/ops/experts.cc                            |   17 +-
 src/ops/experts.cpp                           |   30 +-
 src/ops/experts.cu                            |   65 +-
 src/ops/flat.cc                               |    3 +-
 src/ops/fused.cc                              |  234 +-
 src/ops/fused.cpp                             | 1257 +++--
 src/ops/fused.cu                              | 1410 +++--
 src/ops/group_by.cc                           |    6 +-
 src/ops/group_by.cpp                          |    6 +-
 src/ops/group_by.cu                           |    6 +-
 src/ops/inc_multihead_self_attention.cc       |  139 +-
 src/ops/inc_multihead_self_attention.cpp      | 1782 ++++--
 src/ops/inc_multihead_self_attention.cu       |  756 ++-
 src/ops/kernels/batch_matmul.cpp              |    4 +-
 src/ops/kernels/batch_matmul.cu               |    4 +-
 src/ops/kernels/cast_kernels.cpp              |    3 +-
 src/ops/kernels/cast_kernels.cu               |    3 +-
 src/ops/kernels/concat_kernels.cpp            |    4 +
 src/ops/kernels/concat_kernels.cu             |    4 +
 src/ops/kernels/conv_2d_kernels.cpp           |   10 +-
 src/ops/kernels/conv_2d_kernels.cu            |   10 +-
 src/ops/kernels/dropout_kernels.cpp           |    2 +-
 src/ops/kernels/dropout_kernels.cu            |    2 +-
 src/ops/kernels/flat_kernels.cpp              |    4 +
 src/ops/kernels/flat_kernels.cu               |    4 +
 src/ops/kernels/linear_kernels.cpp            |  423 +-
 src/ops/kernels/linear_kernels.cu             |  268 +-
 src/ops/kernels/lora_linear_kernels.cpp       |  576 ++
 src/ops/kernels/lora_linear_kernels.cu        |  579 ++
 src/ops/kernels/pool_2d_kernels.cpp           |    4 +-
 src/ops/kernels/pool_2d_kernels.cu            |    4 +-
 src/ops/kernels/reshape_kernels.cpp           |    4 +-
 src/ops/kernels/reshape_kernels.cu            |    4 +-
 src/ops/kernels/residual_rms_norm_kernels.cpp |  438 +-
 src/ops/kernels/residual_rms_norm_kernels.cu  |  454 +-
 src/ops/kernels/rms_norm_kernels.cpp          |  396 +-
 src/ops/kernels/rms_norm_kernels.cu           |  444 +-
 src/ops/kernels/softmax.cpp                   |  284 +-
 src/ops/kernels/softmax.cu                    |  275 +-
 src/ops/kernels/transpose_kernels.cpp         |    4 +
 src/ops/kernels/transpose_kernels.cu          |    4 +
 src/ops/layer_norm.cc                         |  181 +-
 src/ops/layer_norm.cpp                        |  479 +-
 src/ops/layer_norm.cu                         |  352 +-
 src/ops/linear.cc                             |  154 +-
 src/ops/lora_linear.cc                        | 1316 +++++
 src/ops/lora_linear_params.cc                 |  221 +
 src/ops/mean.cc                               |    3 +-
 src/ops/noop.cc                               |    7 +-
 src/ops/pool_2d.cc                            |    4 +-
 src/ops/reduce.cc                             |    2 +-
 src/ops/reduce.cpp                            |    2 +-
 src/ops/reduce.cu                             |    2 +-
 src/ops/reshape.cc                            |    4 +-
 src/ops/residual_layer_norm.cc                |  521 +-
 src/ops/residual_layer_norm.cpp               |  695 ++-
 src/ops/residual_layer_norm.cu                |  690 ++-
 src/ops/residual_rms_norm.cc                  |  512 +-
 src/ops/rms_norm.cc                           |  168 +-
 src/ops/sampling.cc                           |    6 +-
 src/ops/sigmoid_silu_multi.cc                 |  187 +-
 src/ops/sigmoid_silu_multi.cpp                |  297 +-
 src/ops/sigmoid_silu_multi.cu                 |  264 +-
 src/ops/softmax.cc                            |  261 +-
 src/ops/spec_inc_multihead_self_attention.cc  |    2 +-
 src/ops/spec_inc_multihead_self_attention.cpp |   17 +-
 src/ops/spec_inc_multihead_self_attention.cu  |   66 +-
 src/ops/split.cc                              |    2 +-
 src/ops/topk.cc                               |    6 +-
 src/ops/topk.cpp                              |    3 +-
 src/ops/topk.cu                               |    3 +-
 src/ops/transpose.cc                          |    6 +-
 src/ops/tree_inc_multihead_self_attention.cc  |    2 +-
 src/ops/tree_inc_multihead_self_attention.cpp |  654 ++-
 src/ops/tree_inc_multihead_self_attention.cu  |   58 +-
 src/parallel_ops/allreduce.cc                 |  287 +-
 src/parallel_ops/combine.cc                   |  151 +-
 src/parallel_ops/fused_parallel_op.cc         |    2 +-
 .../kernels/allreduce_kernels.cpp             |   52 +-
 src/parallel_ops/kernels/allreduce_kernels.cu |   48 +-
 src/parallel_ops/kernels/combine_kernels.cpp  |    4 +-
 src/parallel_ops/kernels/combine_kernels.cu   |    4 +-
 .../kernels/parallel_identity_kernels.cpp     |   97 +
 .../kernels/parallel_identity_kernels.cu      |   96 +
 .../kernels/partition_kernels.cpp             |    4 +-
 src/parallel_ops/kernels/partition_kernels.cu |    4 +-
 .../kernels/reduction_kernels.cpp             |    2 +-
 src/parallel_ops/kernels/reduction_kernels.cu |    2 +-
 .../kernels/replicate_kernels.cpp             |    2 +-
 src/parallel_ops/kernels/replicate_kernels.cu |    2 +-
 src/parallel_ops/parallel_identity.cc         |  474 ++
 src/parallel_ops/partition.cc                 |   10 +-
 src/parallel_ops/reduction.cc                 |   17 +-
 src/parallel_ops/replicate.cc                 |   91 +-
 src/runtime/batch_config.cc                   |   65 +-
 src/runtime/beam_search_batch_config.cc       |    4 +
 src/runtime/cuda_helper.cu                    |  200 +-
 src/runtime/ffconst_utils.cc                  |    5 +
 src/runtime/fftype.cc                         |   25 +
 src/runtime/file_loader.cc                    |   92 +-
 src/runtime/graph.cc                          |   88 +-
 src/runtime/hip_helper.cpp                    |  274 +-
 src/runtime/inference_manager.cc              |  204 +-
 src/runtime/model.cc                          |  840 ++-
 src/runtime/model.cpp                         |    4 +-
 src/runtime/model.cu                          |   45 +-
 src/runtime/operator.cc                       |   36 +-
 src/runtime/operator_params.cc                |    3 +
 src/runtime/request_manager.cc                |  768 ++-
 src/runtime/request_manager.cpp               |   45 +-
 src/runtime/request_manager.cu                |  123 +-
 src/runtime/simulator.cpp                     |   22 +-
 src/runtime/simulator.cu                      |   26 +-
 src/runtime/substitution.cc                   |   36 +-
 src/runtime/tree_verify_batch_config.cc       |    4 +
 tests/.gitignore                              |    1 -
 tests/align/test_all_operators.sh             |    2 +-
 tests/cpp_gpu_tests.sh                        |    4 +-
 tests/inference/cpp_inference_tests.sh        |   64 +-
 tests/inference/huggingface_inference.py      |   14 +-
 tests/inference/python_inference_tests.sh     |   35 +-
 .../python_test_configs/generate_configs.py   |    5 +-
 tests/peft/alignment/align_test_utils.py      |  510 ++
 .../alignment/llama_alignment_tests.ipynb     | 2651 +++++++++
 .../peft/alignment/opt_alignment_tests.ipynb  |  450 ++
 tests/peft/hf_finetune.py                     |  129 +
 tests/peft/hf_serve.py                        |  140 +
 tests/peft/hf_train.py                        |  161 +
 tests/peft/hf_utils.py                        |  352 ++
 tests/peft/peft_alignment_test.py             |  730 +++
 tests/peft_test.sh                            |   66 +
 285 files changed, 35212 insertions(+), 6650 deletions(-)
 create mode 100644 include/flexflow/ops/kernels/lora_linear_kernels.h
 create mode 100644 include/flexflow/ops/lora_linear.h
 create mode 100644 include/flexflow/ops/lora_linear_params.h
 create mode 100644 include/flexflow/parallel_ops/kernels/parallel_identity_kernels.h
 create mode 100644 include/flexflow/parallel_ops/parallel_identity.h
 create mode 100644 include/flexflow/parallel_ops/parallel_identity_params.h
 create mode 100644 include/flexflow/utils/peft_weight_allocator.h
 delete mode 100644 inference/MODEL_WEIGHTS.md
 create mode 100644 inference/README.md
 create mode 100644 inference/peft/CMakeLists.txt
 create mode 100644 inference/peft/Makefile
 create mode 100644 inference/peft/peft.cc
 create mode 100644 inference/peft/peft_bwd_benchmark.cc
 create mode 100644 inference/peft/peft_fwd_benchmark.cc
 create mode 100644 inference/peft/req_rate_benchmark.cc
 create mode 100644 inference/python/ff_peft.py
 create mode 100644 inference/python/peft_demo/INSTRUCTIONS.md
 create mode 100644 inference/python/peft_demo/demo.ipynb
 create mode 100644 inference/python/peft_demo/demo.py
 create mode 100644 inference/utils/download_peft_model.py
 create mode 100644 inference/utils/upload_peft_model.py
 create mode 100644 rdelacou/generate_trace.py
 create mode 100644 src/ops/kernels/lora_linear_kernels.cpp
 create mode 100644 src/ops/kernels/lora_linear_kernels.cu
 create mode 100644 src/ops/lora_linear.cc
 create mode 100644 src/ops/lora_linear_params.cc
 create mode 100644 src/parallel_ops/kernels/parallel_identity_kernels.cpp
 create mode 100644 src/parallel_ops/kernels/parallel_identity_kernels.cu
 create mode 100644 src/parallel_ops/parallel_identity.cc
 delete mode 100644 tests/.gitignore
 create mode 100644 tests/peft/alignment/align_test_utils.py
 create mode 100644 tests/peft/alignment/llama_alignment_tests.ipynb
 create mode 100644 tests/peft/alignment/opt_alignment_tests.ipynb
 create mode 100644 tests/peft/hf_finetune.py
 create mode 100644 tests/peft/hf_serve.py
 create mode 100644 tests/peft/hf_train.py
 create mode 100644 tests/peft/hf_utils.py
 create mode 100644 tests/peft/peft_alignment_test.py
 create mode 100755 tests/peft_test.sh

diff --git a/.github/workflows/build.yml b/.github/workflows/build.yml
index d05856f1a9..ef5961bc87 100644
--- a/.github/workflows/build.yml
+++ b/.github/workflows/build.yml
@@ -52,13 +52,14 @@ jobs:
         run: .github/workflows/helpers/free_space_on_runner.sh
 
       - name: Install CUDA
-        uses: Jimver/cuda-toolkit@v0.2.11
+        uses: Jimver/cuda-toolkit@v0.2.16
         if: ${{ matrix.gpu_backend == 'cuda' }}
         id: cuda-toolkit
         with:
-          cuda: "11.8.0"
+          cuda: "12.1.1"
           # Disable caching of the CUDA binaries, since it does not give us any significant performance improvement
           use-github-cache: "false"
+          log-file-suffix: 'cmake_${{matrix.gpu_backend}}.txt'
 
       - name: Install system dependencies
         run: .github/workflows/helpers/install_dependencies.sh
@@ -156,11 +157,12 @@ jobs:
         run: .github/workflows/helpers/free_space_on_runner.sh
 
       - name: Install CUDA
-        uses: Jimver/cuda-toolkit@v0.2.11
+        uses: Jimver/cuda-toolkit@v0.2.16
         id: cuda-toolkit
         with:
-          cuda: "11.8.0"
+          cuda: "12.1.1"
           use-github-cache: "false"
+          log-file-suffix: 'makefile_${{matrix.gpu_backend}}.txt'
 
       - name: Install system dependencies
         run: .github/workflows/helpers/install_dependencies.sh
@@ -169,7 +171,7 @@ jobs:
         uses: conda-incubator/setup-miniconda@v2
         with:
           activate-environment: flexflow
-          environment-file: conda/environment.yml
+          environment-file: conda/flexflow.yml
           auto-activate-base: false
 
       - name: Build FlexFlow
diff --git a/.github/workflows/gpu-ci.yml b/.github/workflows/gpu-ci.yml
index c7d0cd72cb..00ca2df603 100644
--- a/.github/workflows/gpu-ci.yml
+++ b/.github/workflows/gpu-ci.yml
@@ -181,6 +181,16 @@ jobs:
           ../config/config.linux
           make -j
 
+      - name: Run PEFT tests
+        run: |
+          export PATH=$CONDA_PREFIX/bin:$PATH
+          export CUDNN_DIR=/usr/local/cuda
+          export CUDA_DIR=/usr/local/cuda
+          export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$CONDA_PREFIX/lib
+
+          source ./build/set_python_envs.sh
+          ./tests/peft_test.sh
+      
       - name: Run inference tests
         env:
           CPP_INFERENCE_TESTS: ${{ vars.CPP_INFERENCE_TESTS }}
diff --git a/.github/workflows/helpers/install_cudnn.sh b/.github/workflows/helpers/install_cudnn.sh
index 7c11a4a420..73b8e88418 100755
--- a/.github/workflows/helpers/install_cudnn.sh
+++ b/.github/workflows/helpers/install_cudnn.sh
@@ -5,8 +5,11 @@ set -x
 # Cd into directory holding this script
 cd "${BASH_SOURCE[0]%/*}"
 
+ubuntu_version=$(lsb_release -rs)
+ubuntu_version=${ubuntu_version//./}
+
 # Install CUDNN
-cuda_version=${1:-11.8.0}
+cuda_version=${1:-12.1.1}
 cuda_version=$(echo "${cuda_version}" | cut -f1,2 -d'.')
 echo "Installing CUDNN for CUDA version: ${cuda_version} ..."
 CUDNN_LINK=http://developer.download.nvidia.com/compute/redist/cudnn/v8.0.5/cudnn-11.1-linux-x64-v8.0.5.39.tgz
@@ -44,8 +47,11 @@ elif [[ "$cuda_version" == "11.7" ]]; then
 elif [[ "$cuda_version" == "11.8" ]]; then
     CUDNN_LINK=https://developer.download.nvidia.com/compute/redist/cudnn/v8.7.0/local_installers/11.8/cudnn-linux-x86_64-8.7.0.84_cuda11-archive.tar.xz
     CUDNN_TARBALL_NAME=cudnn-linux-x86_64-8.7.0.84_cuda11-archive.tar.xz
-elif [[ "$cuda_version" == "12.0" ]]; then
-    echo "CUDNN support for CUDA version 12.0 not yet added"
+elif [[ "$cuda_version" == "12.0" || "$cuda_version" == "12.1" || "$cuda_version" == "12.2" || "$cuda_version" == "12.3" || "$cuda_version" == "12.4" || "$cuda_version" == "12.5" ]]; then
+    CUDNN_LINK=https://developer.download.nvidia.com/compute/redist/cudnn/v8.8.0/local_installers/12.0/cudnn-local-repo-ubuntu2004-8.8.0.121_1.0-1_amd64.deb
+    CUDNN_TARBALL_NAME=cudnn-local-repo-ubuntu2004-8.8.0.121_1.0-1_amd64.deb
+else
+    echo "CUDNN support for CUDA version above 12.5 not yet added"
     exit 1
 fi
 wget -c -q $CUDNN_LINK
@@ -55,6 +61,17 @@ if [[ "$cuda_version" == "11.6" || "$cuda_version" == "11.7" || "$cuda_version"
     sudo cp -r "$CUDNN_EXTRACTED_TARBALL_NAME"/include/* /usr/local/include
     sudo cp -r "$CUDNN_EXTRACTED_TARBALL_NAME"/lib/* /usr/local/lib
     rm -rf "$CUDNN_EXTRACTED_TARBALL_NAME"
+elif [[ "$CUDNN_TARBALL_NAME" == *.deb ]]; then
+    wget -c -q "https://developer.download.nvidia.com/compute/cuda/repos/ubuntu${ubuntu_version}/x86_64/cuda-keyring_1.1-1_all.deb"
+    sudo dpkg -i cuda-keyring_1.1-1_all.deb
+    sudo apt update -y
+    rm -f cuda-keyring_1.1-1_all.deb
+    sudo dpkg -i $CUDNN_TARBALL_NAME
+    sudo cp /var/cudnn-local-repo-ubuntu2004-8.8.0.121/cudnn-local-A9E17745-keyring.gpg /usr/share/keyrings/
+    sudo apt update -y
+    sudo apt install -y libcudnn8
+    sudo apt install -y libcudnn8-dev
+    sudo apt install -y libcudnn8-samples
 else
     sudo tar -xzf $CUDNN_TARBALL_NAME -C /usr/local
 fi
diff --git a/.github/workflows/helpers/install_nccl.sh b/.github/workflows/helpers/install_nccl.sh
index ca88668d84..ae6793ea2a 100755
--- a/.github/workflows/helpers/install_nccl.sh
+++ b/.github/workflows/helpers/install_nccl.sh
@@ -8,13 +8,13 @@ cd "${BASH_SOURCE[0]%/*}"
 # Add NCCL key ring
 ubuntu_version=$(lsb_release -rs)
 ubuntu_version=${ubuntu_version//./}
-wget "https://developer.download.nvidia.com/compute/cuda/repos/ubuntu${ubuntu_version}/x86_64/cuda-keyring_1.0-1_all.deb"
-sudo dpkg -i cuda-keyring_1.0-1_all.deb
+wget "https://developer.download.nvidia.com/compute/cuda/repos/ubuntu${ubuntu_version}/x86_64/cuda-keyring_1.1-1_all.deb"
+sudo dpkg -i cuda-keyring_1.1-1_all.deb
 sudo apt update -y
-rm -f cuda-keyring_1.0-1_all.deb
+rm -f cuda-keyring_1.1-1_all.deb
 
 # Install NCCL
-cuda_version=${1:-11.8.0}
+cuda_version=${1:-12.1.1}
 cuda_version=$(echo "${cuda_version}" | cut -f1,2 -d'.')
 echo "Installing NCCL for CUDA version: ${cuda_version} ..."
 
diff --git a/.github/workflows/multinode-test.yml b/.github/workflows/multinode-test.yml
index 226f953b38..2fc527bf08 100644
--- a/.github/workflows/multinode-test.yml
+++ b/.github/workflows/multinode-test.yml
@@ -38,7 +38,7 @@ jobs:
     # 10h timeout, instead of default of 360min (6h)
     timeout-minutes: 600
     container:
-      image: ghcr.io/flexflow/flexflow-environment-cuda-11.8:latest
+      image: ghcr.io/flexflow/flexflow-environment-cuda-12.0:latest
       options: --gpus all --shm-size=8192m
     steps:
       - name: Install updated git version
@@ -87,7 +87,7 @@ jobs:
     runs-on: self-hosted
     needs: gpu-ci-concierge
     container:
-      image: ghcr.io/flexflow/flexflow-environment-cuda-11.8:latest
+      image: ghcr.io/flexflow/flexflow-environment-cuda-12.0:latest
       options: --gpus all --shm-size=8192m
     # 10h timeout, instead of default of 360min (6h)
     timeout-minutes: 600
@@ -138,7 +138,7 @@ jobs:
     runs-on: self-hosted
     needs: gpu-ci-concierge
     container:
-      image: ghcr.io/flexflow/flexflow-environment-cuda-11.8:latest
+      image: ghcr.io/flexflow/flexflow-environment-cuda-12.0:latest
       options: --gpus all --shm-size=8192m
     steps:
       - name: Install updated git version
diff --git a/.github/workflows/pip-install.yml b/.github/workflows/pip-install.yml
index 3562134987..d5acbfc2e1 100644
--- a/.github/workflows/pip-install.yml
+++ b/.github/workflows/pip-install.yml
@@ -44,10 +44,10 @@ jobs:
         run: .github/workflows/helpers/free_space_on_runner.sh
 
       - name: Install CUDA
-        uses: Jimver/cuda-toolkit@v0.2.11
+        uses: Jimver/cuda-toolkit@v0.2.16
         id: cuda-toolkit
         with:
-          cuda: "11.8.0"
+          cuda: "12.1.1"
           # Disable caching of the CUDA binaries, since it does not give us any significant performance improvement
           use-github-cache: "false"
 
diff --git a/.github/workflows/prebuild-legion.yml b/.github/workflows/prebuild-legion.yml
index 267daaee6b..633fb00eb8 100644
--- a/.github/workflows/prebuild-legion.yml
+++ b/.github/workflows/prebuild-legion.yml
@@ -23,13 +23,13 @@ jobs:
     strategy:
       matrix:
         gpu_backend: ["cuda", "hip_rocm"]
-        gpu_backend_version: ["11.8", "5.6"]
+        gpu_backend_version: ["12.0", "5.6"]
         python_version: ["3.11"]
         exclude:
           - gpu_backend: "cuda"
             gpu_backend_version: "5.6"
           - gpu_backend: "hip_rocm"
-            gpu_backend_version: "11.8"
+            gpu_backend_version: "12.0"
       fail-fast: false
     steps:
       - name: Checkout Git Repository
diff --git a/.gitignore b/.gitignore
index 7f6a3c4137..cc34c1a7b6 100644
--- a/.gitignore
+++ b/.gitignore
@@ -187,4 +187,9 @@ gpt_tokenizer
 python/flexflow/version.txt
 
 inference_tensors
+hf_peft_tensors
+lora_training_logs
+
+Untitled-1.ipynb
+Untitled-2.ipynb
 tests/inference/python_test_configs/*.json
diff --git a/CMakeLists.txt b/CMakeLists.txt
index c82a53644e..f06969ae04 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -567,6 +567,7 @@ if(NOT BUILD_LEGION_ONLY)
   if(FF_BUILD_ALL_INFERENCE_EXAMPLES OR FF_BUILD_ALL_EXAMPLES)
     add_subdirectory(inference/spec_infer)
     add_subdirectory(inference/incr_decoding)
+    add_subdirectory(inference/peft)
   endif()
 
 
diff --git a/conda/flexflow.yml b/conda/flexflow.yml
index 67ef6b3419..091ba929e4 100644
--- a/conda/flexflow.yml
+++ b/conda/flexflow.yml
@@ -25,3 +25,10 @@ dependencies:
     - sentencepiece
     - einops
     - requests
+    - scipy
+    - bitsandbytes
+    - datasets
+    - accelerate
+    - loralib
+    - triton
+    - peft
diff --git a/config/config.inc b/config/config.inc
index 7d7b2db9cf..6431eaf136 100644
--- a/config/config.inc
+++ b/config/config.inc
@@ -197,7 +197,7 @@ fi
 
 # set ROCM path
 if [ -n "$ROCM_PATH" ]; then
-  SET_ROCM_PATH="-DROCM_PATH=${ROCM_PATH}"
+  SET_ROCM_PATH="-DROCM_PATH=${ROCM_PATH} -DHIP_ROOT_DIR=${ROCM_PATH}"
 fi
 
 ADD_ROCM_TO_PATH=""
diff --git a/docker/build.sh b/docker/build.sh
index 8ecacbc6d4..b68860712f 100755
--- a/docker/build.sh
+++ b/docker/build.sh
@@ -56,15 +56,14 @@ if [[ "${FF_GPU_BACKEND}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; the
     cuda_version_input=${cuda_version}.3
   elif [[ "$cuda_version" == @(11.8) ]]; then 
     cuda_version_input=${cuda_version}.0
+  elif [[ "$cuda_version" == @(12.3|12.4|12.5|12.6|12.7|12.8|12.9) ]]; then
+    # Use CUDA 12.2 for all versions greater or equal to 12.2 for now (the Docker machine with CUDNN is not yet available)
+    cuda_version=12.2
+    cuda_version_input=${cuda_version}.2
   else
     echo "cuda_version is not supported, please choose among {11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0|12.1|12.2}"
     exit 1
   fi
-  # Use CUDA 12.2 for all versions greater or equal to 12.2 for now (the Docker machine with CUDNN is not yet available)
-  if [[ "$cuda_version" == @(12.3|12.4|12.5|12.6|12.7|12.8|12.9) ]]; then
-    cuda_version=12.2
-    cuda_version_input=${cuda_version}.2
-  fi
   echo "Building $image docker image with CUDA $cuda_version"
   ff_environment_base_image="nvidia/cuda:${cuda_version_input}-cudnn8-devel-ubuntu20.04"
   gpu_backend_version="-${cuda_version}"
diff --git a/docker/flexflow-environment/Dockerfile b/docker/flexflow-environment/Dockerfile
index cef619ad68..3434916d6b 100644
--- a/docker/flexflow-environment/Dockerfile
+++ b/docker/flexflow-environment/Dockerfile
@@ -94,6 +94,8 @@ RUN conda install -c conda-forge cmake make pillow cmake-build-extension pybind1
 RUN conda install pytorch torchvision torchaudio -c pytorch
 RUN conda install -c conda-forge onnx transformers>=4.31.0 sentencepiece einops
 RUN pip3 install tensorflow notebook
+# PEFT-related
+RUN pip3 install scipy bitsandbytes datasets accelerate loralib triton peft
 
 # Install Rust
 RUN curl https://sh.rustup.rs -sSf | sh -s -- -y
diff --git a/docker/run.sh b/docker/run.sh
index 666c8e1121..cf105a10c8 100755
--- a/docker/run.sh
+++ b/docker/run.sh
@@ -58,7 +58,7 @@ if [[ "${FF_GPU_BACKEND}" == "cuda" || "${FF_GPU_BACKEND}" == "hip_cuda" ]]; the
     fi
   fi
   # Check that CUDA version is supported
-  if [[ "$cuda_version" != @(11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0|12.1|12.2) ]]; then
+  if [[ "$cuda_version" != @(11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0|12.1|12.2|12.3|12.4|12.5|12.6|12.7|12.8|12.9) ]]; then
     echo "cuda_version is not supported, please choose among {11.1|11.2|11.3|11.4|11.5|11.6|11.7|11.8|12.0|12.1|12.2}"
     exit 1
   fi
diff --git a/include/flexflow/batch_config.h b/include/flexflow/batch_config.h
index 009d1c250a..873fed0bdb 100644
--- a/include/flexflow/batch_config.h
+++ b/include/flexflow/batch_config.h
@@ -16,6 +16,7 @@
 #pragma once
 
 #include "flexflow/ffconst.h"
+#include "flexflow/fftype.h"
 #include "legion.h"
 #include <cstddef>
 #include <cstdlib>
@@ -36,6 +37,18 @@ using BeamSearchBatchConfigFuture = Legion::Future;
 using TreeVerifyBatchConfigFuture = Legion::Future;
 using BeamInferenceResultFuture = Legion::Future;
 
+struct OptimizerTasks {
+  bool compute_gradients = true;
+  bool reset_gradients_to_zero = false;
+  bool update_weights = false;
+  bool save_updated_weights = false;
+};
+
+void set_optimizer_tasks(OptimizerTasks &tasks,
+                         int max_training_steps,
+                         int completed_training_steps,
+                         int gradient_accumulation_steps);
+
 class BatchConfig {
 public:
   using RequestGuid = size_t;
@@ -43,6 +56,8 @@ class BatchConfig {
   BatchConfig();
   int num_active_requests() const;
   int num_active_tokens() const;
+  int num_active_infr_tokens() const;
+  int num_active_peft_tokens() const;
   static int max_requests_per_batch();
   static int max_tokens_per_batch();
   static int max_verify_tokens_per_batch();
@@ -56,26 +71,43 @@ class BatchConfig {
   // Maximum possible values for different parameters
   // These maximum values are used for copying BatchConfig
   // across workers
-  static int const MAX_NUM_REQUESTS = 64;
+  static int const MAX_NUM_REQUESTS = 65;
   static int const MAX_NUM_TOKENS = 1024;
   static int const MAX_SPEC_TREE_TOKEN_NUM = 64;
 
   //  Set by update
-  int num_tokens;
+
+  int num_tokens = 0, num_peft_tokens = 0, num_peft_label_tokens = 0;
   // number of tokens in prompt phase, start offset of tokens in inc_decoding
   // phase. num_tokens - num_prompt_tokens = num_generation_tokens;
-  int num_generation_tokens;
+  int num_generation_tokens = 0;
 
   struct PerRequestInfo {
+    PerRequestInfo() {
+      first_token_depth_in_request = 0;
+      first_token_offset_in_batch = 0;
+      num_tokens_in_batch = 0;
+      max_sequence_length = 0;
+      request_guid = 0;
+      prompt_phase = false;
+      batch_config_request_id = -1;
+      peft_model_id = PEFTModelID::NO_ID;
+      peft_bwd = false;
+      optimizer_tasks = {true, false, false, false};
+    }
     int first_token_depth_in_request;
     int first_token_offset_in_batch;
     int num_tokens_in_batch;
     int max_sequence_length;
 
     // request id in batch config:
-    int batch_config_request_id;
+    int batch_config_request_id = -1;
     bool prompt_phase = false;
     RequestGuid request_guid;
+    // PEFT fields
+    PEFTModelID peft_model_id;
+    bool peft_bwd;
+    OptimizerTasks optimizer_tasks;
   };
   struct PerTokenInfo {
     int abs_depth_in_request;
@@ -102,6 +134,7 @@ class BatchConfig {
   BitMask causalMask[MAX_NUM_REQUESTS];
   PerRequestInfo requestsInfo[MAX_NUM_REQUESTS];
   PerTokenInfo tokensInfo[MAX_NUM_TOKENS];
+  PerTokenInfo labelsInfo[MAX_NUM_TOKENS];
 
   bool request_completed[MAX_NUM_REQUESTS];
   bool request_running[MAX_NUM_REQUESTS];
@@ -129,6 +162,7 @@ class TreeVerifyBatchConfig : public BatchConfig {
 struct InferenceResult {
   static int const MAX_NUM_TOKENS = BatchConfig::MAX_NUM_TOKENS;
   BatchConfig::TokenId token_ids[MAX_NUM_TOKENS];
+  float finetuning_loss;
 };
 
 class BeamSearchBatchConfig : public BatchConfig {
diff --git a/include/flexflow/config.h b/include/flexflow/config.h
index 2c11ae1131..dd9d657117 100644
--- a/include/flexflow/config.h
+++ b/include/flexflow/config.h
@@ -65,6 +65,25 @@ constexpr ParameterSyncType CHOSEN_SYNC_TYPE = ParameterSyncType::PS;
 #endif
 
 class FFConfig;
+class MemoryAllocator;
+class PEFTWeightAllocator;
+
+struct CombinedBatchConfigMetaStruct {
+  BatchConfig::PerTokenInfo tokens_info[BatchConfig::MAX_NUM_TOKENS];
+  BatchConfig::PerRequestInfo requestsInfo[BatchConfig::MAX_NUM_REQUESTS];
+  BatchConfig::BitMask causalMask[BatchConfig::MAX_NUM_REQUESTS];
+  bool request_completed[BatchConfig::MAX_NUM_REQUESTS];
+
+  BeamSearchBatchConfig::BeamSearchPerTokenInfo
+      beamTokenInfo[BeamSearchBatchConfig::MAX_NUM_TOKENS +
+                    BeamSearchBatchConfig::MAX_SPEC_TREE_TOKEN_NUM *
+                        BeamSearchBatchConfig::MAX_NUM_REQUESTS];
+  BeamSearchBatchConfig::BeamSearchPerRequestInfo
+      beamRequestsInfo[BeamSearchBatchConfig::MAX_NUM_REQUESTS];
+
+  TreeVerifyBatchConfig::CommittedTokensInfo
+      committed_tokens[TreeVerifyBatchConfig::MAX_NUM_TOKENS];
+};
 
 struct FFHandler {
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
@@ -76,18 +95,18 @@ struct FFHandler {
 #endif
   void *workSpace;
   size_t workSpaceSize;
-  void *batch_config_metadata;
+  CombinedBatchConfigMetaStruct *batch_config_metadata;
 
   // request info + token info + topolopgy mask info
-  size_t batch_config_metadata_size =
-      sizeof(BatchConfig::tokensInfo) + sizeof(BatchConfig::requestsInfo) +
-      sizeof(BeamSearchBatchConfig::beamTokenInfo) +
-      sizeof(BeamSearchBatchConfig::beamRequestsInfo) +
-      sizeof(BatchConfig::causalMask) +
-      sizeof(TreeVerifyBatchConfig::committed_tokens) +
-      sizeof(BatchConfig::request_completed);
+  size_t batch_config_metadata_size = sizeof(CombinedBatchConfigMetaStruct);
   void *offload_reserve_space;
   size_t offload_reserve_space_size;
+  // PEFT related fields
+  MemoryAllocator *peft_activation_allocator;
+  size_t peft_activation_reserve_space_size;
+  PEFTWeightAllocator *peft_weight_allocator;
+  size_t peft_weight_reserve_space_size;
+  // Quantization fields
   DataType quantization_type;
   bool allowTensorOpMathConversion;
 #ifdef FF_USE_NCCL
@@ -98,6 +117,8 @@ struct FFHandler {
 struct FFInitInfo {
   size_t workSpaceSize;
   size_t offload_reserve_space_size;
+  size_t peft_activation_reserve_space_size;
+  size_t peft_weight_reserve_space_size;
   DataType quantization_type;
   bool allowTensorOpMathConversion;
   // int myRank, allRanks;
@@ -155,6 +176,10 @@ class FFConfig {
   bool cpu_offload;
   size_t offload_reserve_space_size;
   DataType quantization_type;
+  // PEFT related fields
+  bool enable_peft;
+  size_t peft_activation_reserve_space_size;
+  size_t peft_weight_reserve_space_size;
   // Control parallelizable dimensions
   bool only_data_parallel;
   bool enable_sample_parallel;
diff --git a/include/flexflow/ffconst.h b/include/flexflow/ffconst.h
index 512645e624..24b722c36f 100644
--- a/include/flexflow/ffconst.h
+++ b/include/flexflow/ffconst.h
@@ -46,6 +46,12 @@ enum LossType {
   LOSS_IDENTITY = 54,
 };
 
+enum OptimizerType {
+  OPTIMIZER_TYPE_NONE = 60,
+  OPTIMIZER_TYPE_SGD = 61,
+  OPTIMIZER_TYPE_ADAM = 62,
+};
+
 enum CompMode {
   COMP_MODE_TRAINING = 70,
   COMP_MODE_INFERENCE = 71,
@@ -72,6 +78,11 @@ enum InferenceMode {
   TREE_VERIFY_MODE = 2003,
 };
 
+enum RequestType {
+  REQ_INFERENCE = 4001,
+  REQ_FINETUNING = 4002,
+};
+
 // This is consistent with TASO's OpType
 // https://github.com/jiazhihao/TASO/blob/master/include/taso/ops.h#L75-L138
 enum OperatorType {
@@ -172,6 +183,8 @@ enum OperatorType {
   OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION,
   OP_TREE_INC_MULTIHEAD_SELF_ATTENTION,
   OP_SAMPLING,
+  // PEFT Ops
+  OP_LORA,
   // Parallel Ops
   OP_REPARTITION,
   OP_COMBINE,
@@ -179,6 +192,7 @@ enum OperatorType {
   OP_REDUCTION,
   OP_PIPELINE,
   OP_ALLREDUCE,
+  OP_PARALLEL_IDENTITY,
   OP_FUSED_PARALLEL,
   OP_INVALID,
 };
@@ -193,36 +207,37 @@ enum ModelType {
 };
 
 enum PMParameter {
-  PM_OP_TYPE,            // AnyOp
-  PM_NUM_INPUTS,         // AnyOp
-  PM_NUM_OUTPUTS,        // AnyOp
-  PM_GROUP,              // Conv2D
-  PM_KERNEL_H,           // Conv2D, Pool2D
-  PM_KERNEL_W,           // Conv2D, Pool2D
-  PM_STRIDE_H,           // Conv2D, Pool2D
-  PM_STRIDE_W,           // Conv2D, Pool2D
-  PM_PADDING_H,          // Conv2D, Pool2D
-  PM_PADDING_W,          // Conv2D, Pool2D
-  PM_ACTI,               // Conv2D, Pool2D
-  PM_NUMDIM,             // Concat, Transpose
-  PM_AXIS,               // Concat, Split
-  PM_PERM,               // Transpose
-  PM_OUTSHUFFLE,         // Transpose
-  PM_MERGE_GCONV_COUNT,  // MergeGConv
-  PM_AXES,               // Squeeze, Unsqueeze, Reduce*
-  PM_KEEP_DIMS,          // Reduce*
-  PM_EPSILON,            // BatchNorm
-  PM_REPARTITION_DIM,    // Repartition
-  PM_REPARTITION_DEGREE, // Repartition
-  PM_REPLICATE_DIM,      // Replicate
-  PM_REPLICATE_DEGREE,   // Replicate
-  PM_COMBINE_DIM,        // Combine
-  PM_COMBINE_DEGREE,     // Combine
-  PM_REDUCTION_DIM,      // Reduction
-  PM_REDUCTION_DEGREE,   // Reduction
-  PM_ALLREDUCE_DIM,      // AllReduce
-  PM_SOFTMAX_DIM,        // Softmax
-  PM_NUM_HEADS,          // MultiHeadAttention
+  PM_OP_TYPE,               // AnyOp
+  PM_NUM_INPUTS,            // AnyOp
+  PM_NUM_OUTPUTS,           // AnyOp
+  PM_GROUP,                 // Conv2D
+  PM_KERNEL_H,              // Conv2D, Pool2D
+  PM_KERNEL_W,              // Conv2D, Pool2D
+  PM_STRIDE_H,              // Conv2D, Pool2D
+  PM_STRIDE_W,              // Conv2D, Pool2D
+  PM_PADDING_H,             // Conv2D, Pool2D
+  PM_PADDING_W,             // Conv2D, Pool2D
+  PM_ACTI,                  // Conv2D, Pool2D
+  PM_NUMDIM,                // Concat, Transpose
+  PM_AXIS,                  // Concat, Split
+  PM_PERM,                  // Transpose
+  PM_OUTSHUFFLE,            // Transpose
+  PM_MERGE_GCONV_COUNT,     // MergeGConv
+  PM_AXES,                  // Squeeze, Unsqueeze, Reduce*
+  PM_KEEP_DIMS,             // Reduce*
+  PM_EPSILON,               // BatchNorm
+  PM_REPARTITION_DIM,       // Repartition
+  PM_REPARTITION_DEGREE,    // Repartition
+  PM_REPLICATE_DIM,         // Replicate
+  PM_REPLICATE_DEGREE,      // Replicate
+  PM_COMBINE_DIM,           // Combine
+  PM_COMBINE_DEGREE,        // Combine
+  PM_REDUCTION_DIM,         // Reduction
+  PM_REDUCTION_DEGREE,      // Reduction
+  PM_ALLREDUCE_DIM,         // AllReduce
+  PM_PARALLEL_IDENTITY_DIM, // AllReduce
+  PM_SOFTMAX_DIM,           // Softmax
+  PM_NUM_HEADS,             // MultiHeadAttention
   PM_INVALID,
   PM_PARALLEL_DIM,
   PM_PARALLEL_DEGREE,
@@ -268,5 +283,7 @@ enum {
   TENSOR_GUID_LAST_VALID = 3999999,
   PARALLEL_TENSOR_GUID_FIRST_VALID = 4000000,
   NODE_GUID_FIRST_VALID = 5000000,
+  PEFT_MODEL_ID_FIRST_VALID = 6000000,
+  PEFT_MODEL_ID_LAST_VALID = 6999999
 };
 #endif // _FLEXFLOW_CONST_H_
diff --git a/include/flexflow/fftype.h b/include/flexflow/fftype.h
index 1cd90fda26..3e482b8d67 100644
--- a/include/flexflow/fftype.h
+++ b/include/flexflow/fftype.h
@@ -3,6 +3,8 @@
 
 #include "flexflow/ffconst.h"
 #include <cstddef>
+#include <functional>
+#include <iostream>
 
 namespace FlexFlow {
 
@@ -18,6 +20,29 @@ class LayerID {
   size_t id, transformer_layer_id, model_id;
 };
 
+class PEFTModelID {
+public:
+  static const PEFTModelID NO_ID;
+  PEFTModelID();
+  PEFTModelID(size_t id);
+  bool is_valid_id() const;
+  friend bool operator==(PEFTModelID const &lhs, PEFTModelID const &rhs);
+  friend std::ostream &operator<<(std::ostream &os,
+                                  PEFTModelID const &peft_model_id);
+
+public:
+  size_t id;
+};
+
 }; // namespace FlexFlow
 
+namespace std {
+template <>
+struct hash<FlexFlow::PEFTModelID> {
+  size_t operator()(FlexFlow::PEFTModelID const &n) const {
+    return n.id;
+  }
+};
+} // namespace std
+
 #endif // _FF_TYPE_H
diff --git a/include/flexflow/flexflow_c.h b/include/flexflow/flexflow_c.h
index 0b74b7fce4..52b4b3d362 100644
--- a/include/flexflow/flexflow_c.h
+++ b/include/flexflow/flexflow_c.h
@@ -55,6 +55,11 @@ FF_NEW_OPAQUE_TYPE(flexflow_inference_manager_t);
 FF_NEW_OPAQUE_TYPE(flexflow_request_manager_t);
 FF_NEW_OPAQUE_TYPE(flexflow_file_data_loader_t);
 FF_NEW_OPAQUE_TYPE(flexflow_generation_result_t);
+// FF_NEW_OPAQUE_TYPE(flexflow_lora_optimizer_config_t);
+// FF_NEW_OPAQUE_TYPE(flexflow_lora_sgd_optimizer_config_t);
+// FF_NEW_OPAQUE_TYPE(flexflow_lora_adam_optimizer_config_t);
+FF_NEW_OPAQUE_TYPE(flexflow_lora_linear_config_t);
+FF_NEW_OPAQUE_TYPE(flexflow_peft_model_id_t);
 
 // -----------------------------------------------------------------------
 // FFConfig
@@ -270,6 +275,7 @@ flexflow_tensor_t *
                                            bool elementwise_affine,
                                            float eps,
                                            bool use_bias,
+                                           bool inplace_residual,
                                            char const *name);
 
 flexflow_tensor_t *flexflow_model_add_add_bias_residual_layer_norm(
@@ -281,6 +287,7 @@ flexflow_tensor_t *flexflow_model_add_add_bias_residual_layer_norm(
     bool elementwise_affine,
     float eps,
     bool use_bias,
+    bool inplace_residual,
     char const *name);
 
 flexflow_tensor_t
@@ -565,6 +572,7 @@ flexflow_tensor_t *
                                          const flexflow_tensor_t input2_,
                                          float eps,
                                          int dim,
+                                         bool inplace_residual,
                                          char const *name);
 
 flexflow_tensor_t flexflow_model_add_arg_top_k(flexflow_model_t handle_,
@@ -590,6 +598,9 @@ flexflow_tensor_t flexflow_model_add_argmax(flexflow_model_t handle_,
                                             bool beam_search,
                                             char const *name);
 
+flexflow_peft_model_id_t flexflow_model_add_lora_layer(
+    flexflow_model_t handle_, const flexflow_lora_linear_config_t peft_config_);
+
 void flexflow_model_set_sgd_optimizer(flexflow_model_t handle,
                                       flexflow_sgd_optimizer_t optimizer);
 
@@ -613,11 +624,16 @@ void flexflow_model_set_transformer_layer_id(flexflow_model_t handle, int id);
 
 void flexflow_model_generate(flexflow_model_t handle_,
                              int num_requests,
-                             char const **input_text,
-                             int max_num_chars,
-                             char **output_text,
-                             int max_seq_length,
-                             int **output_length_and_tokens);
+                             enum RequestType *request_types,
+                             char const **input_texts,
+                             char **output_texts,
+                             int *max_seq_lengths,
+                             flexflow_peft_model_id_t *peft_model_ids,
+                             char const **dataset_filepaths,
+                             int *training_steps,
+                             int **output_length_and_tokens,
+                             int *num_finetuning_losses,
+                             float *finetuning_losses);
 
 void flexflow_model_set_position_offset(flexflow_model_t handle, int offset);
 
@@ -978,6 +994,9 @@ void flexflow_request_manager_set_max_spec_tree_token_num(
 void flexflow_request_manager_set_max_sequence_length(
     flexflow_request_manager_t handle_, int max_seq_length);
 
+void flexflow_request_manager_set_enable_peft_finetuning(
+    flexflow_request_manager_t handle_, bool enable_peft_finetuning_);
+
 void flexflow_request_manager_register_tokenizer(
     flexflow_request_manager_t handle_,
     enum ModelType model_type,
@@ -1036,6 +1055,113 @@ void flexflow_file_data_loader_destroy(flexflow_file_data_loader_t handle_);
 void flexflow_file_data_loader_load_weights(flexflow_file_data_loader_t handle_,
                                             flexflow_model_t model_handle_);
 
+// // -----------------------------------------------------------------------
+// // LoraSGDOptimizerConfig
+// // -----------------------------------------------------------------------
+
+// flexflow_lora_sgd_optimizer_config_t
+// flexflow_lora_sgd_optimizer_config_create(
+//     double lr, double momentum, bool nesterov, bool weight_decay);
+
+// void flexflow_lora_sgd_optimizer_config_destroy(
+//     flexflow_lora_sgd_optimizer_config_t handle_);
+
+// // -----------------------------------------------------------------------
+// // LoraAdamOptimizerConfig
+// // -----------------------------------------------------------------------
+
+// flexflow_lora_adam_optimizer_config_t
+//     flexflow_lora_adam_optimizer_config_create(double alpha,
+//                                                double beta1,
+//                                                double beta2,
+//                                                double weight_decay,
+//                                                double epsilon);
+
+// void flexflow_lora_adam_optimizer_config_destroy(
+//     flexflow_lora_adam_optimizer_config_t handle_);
+
+// -----------------------------------------------------------------------
+// LoraLinearConfig
+// -----------------------------------------------------------------------
+
+flexflow_lora_linear_config_t
+    flexflow_lora_linear_config_create(char const *cache_folder_,
+                                       char const *peft_model_id_,
+                                       bool trainable,
+                                       bool init_lora_weights,
+                                       char const *base_model_name_or_path,
+                                       char const *precision,
+                                       int rank,
+                                       float lora_alpha,
+                                       float lora_dropout,
+                                       int num_target_modules,
+                                       char const **target_modules_,
+                                       enum OptimizerType optimizer_type,
+                                       float sgd_learning_rate,
+                                       float sgd_momentum,
+                                       bool sgd_nesterov,
+                                       float sgd_weight_decay,
+                                       float adam_alpha,
+                                       float adam_beta1,
+                                       float adam_beta2,
+                                       float adam_weight_decay,
+                                       float adam_epsilon);
+
+void flexflow_lora_linear_config_destroy(flexflow_lora_linear_config_t handle_);
+
+char const *flexflow_lora_linear_config_get_cache_folder(
+    flexflow_lora_linear_config_t handle_);
+
+char const *flexflow_lora_linear_config_get_peft_model_id(
+    flexflow_lora_linear_config_t handle_);
+
+int flexflow_lora_linear_config_get_rank(flexflow_lora_linear_config_t handle_);
+
+float flexflow_lora_linear_config_get_lora_alpha(
+    flexflow_lora_linear_config_t handle_);
+
+float flexflow_lora_linear_config_get_lora_dropout(
+    flexflow_lora_linear_config_t handle_);
+
+bool flexflow_lora_linear_config_get_trainable(
+    flexflow_lora_linear_config_t handle_);
+
+bool flexflow_lora_linear_config_get_init_lora_weights(
+    flexflow_lora_linear_config_t handle_);
+
+char const **flexflow_lora_linear_config_get_target_modules(
+    flexflow_lora_linear_config_t handle_, int *num_target_modules);
+
+char const *flexflow_lora_linear_config_get_base_model_name_or_path(
+    flexflow_lora_linear_config_t handle_);
+
+char const *flexflow_lora_linear_config_get_precision(
+    flexflow_lora_linear_config_t handle_);
+
+void flexflow_lora_linear_config_set_lora_alpha(
+    flexflow_lora_linear_config_t handle_, float value);
+
+void flexflow_lora_linear_config_set_lora_dropout(
+    flexflow_lora_linear_config_t handle_, float value);
+
+void flexflow_lora_linear_config_set_trainable(
+    flexflow_lora_linear_config_t handle_, bool value);
+
+void flexflow_lora_linear_config_set_init_lora_weights(
+    flexflow_lora_linear_config_t handle_, bool value);
+
+// -----------------------------------------------------------------------
+// PEFTModelID
+// -----------------------------------------------------------------------
+
+flexflow_peft_model_id_t flexflow_peft_model_id_create();
+
+flexflow_peft_model_id_t flexflow_peft_model_id_create_id(unsigned long id);
+
+flexflow_peft_model_id_t flexflow_peft_model_id_no_id();
+
+void flexflow_peft_model_id_destroy(flexflow_peft_model_id_t handle_);
+
 #ifdef __cplusplus
 }
 #endif
diff --git a/include/flexflow/inference.h b/include/flexflow/inference.h
index f24a797ffd..ba4101c173 100644
--- a/include/flexflow/inference.h
+++ b/include/flexflow/inference.h
@@ -40,6 +40,7 @@ struct GenerationResult {
   std::string output_text;
   std::vector<TokenId> input_tokens;
   std::vector<TokenId> output_tokens;
+  std::vector<float> finetuning_losses;
 };
 
 #include <string>
diff --git a/include/flexflow/layer.h b/include/flexflow/layer.h
index 69a57e4e1c..c3dbcac422 100644
--- a/include/flexflow/layer.h
+++ b/include/flexflow/layer.h
@@ -49,7 +49,7 @@ class Layer {
   Tensor outputs[MAX_NUM_OUTPUTS];
   Tensor inputs[MAX_NUM_INPUTS];
   Tensor weights[MAX_NUM_WEIGHTS];
-  bool trainableInputs[MAX_NUM_INPUTS];
+  // bool trainable_inputs[MAX_NUM_INPUTS];
   int numInputs, numWeights, numOutputs;
   bool profiling;
   bool inference_debugging;
diff --git a/include/flexflow/model.h b/include/flexflow/model.h
index 6dda67bbfe..4ad735ef7d 100644
--- a/include/flexflow/model.h
+++ b/include/flexflow/model.h
@@ -108,19 +108,31 @@ enum TaskIDs {
   LAYERNORM_FWD_TASK_ID,
   LAYERNORM_INF_TASK_ID,
   LAYERNORM_BWD_TASK_ID,
+  LAYERNORM_PEFT_BWD_TASK_ID,
   RESIDUAL_LAYERNORM_INIT_TASK_ID,
   RESIDUAL_LAYERNORM_INF_TASK_ID,
+  RESIDUAL_LAYERNORM_BWD_TASK_ID,
+  RESIDUAL_LAYERNORM_PEFT_BWD_TASK_ID,
   ADD_BIAS_RESIDUAL_LAYERNORM_INIT_TASK_ID,
   ADD_BIAS_RESIDUAL_LAYERNORM_INF_TASK_ID,
+  ADD_BIAS_RESIDUAL_LAYERNORM_BWD_TASK_ID,
+  ADD_BIAS_RESIDUAL_LAYERNORM_PEFT_BWD_TASK_ID,
   SIGMOID_SILU_MULTI_INIT_TASK_ID,
   SIGMOID_SILU_MULTI_INF_TASK_ID,
+  SIGMOID_SILU_MULTI_BWD_TASK_ID,
+  SIGMOID_SILU_MULTI_PEFT_BWD_TASK_ID,
   LINEAR_INIT_TASK_ID,
   LINEAR_INIT_PARA_TASK_ID,
   LINEAR_INF_TASK_ID,
+  LINEAR_PEFT_BWD_TASK_ID,
   LINEAR_FWD_TASK_ID,
   LINEAR_BWD_TASK_ID,
   LINEAR_BWD2_TASK_ID,
   LINEAR_UPD_TASK_ID,
+  LORA_LINEAR_INIT_TASK_ID,
+  LORA_LINEAR_REG_TASK_ID,
+  LORA_LINEAR_INF_TASK_ID,
+  LORA_LINEAR_PEFT_BWD_TASK_ID,
   FLAT_INIT_TASK_ID,
   FLAT_FWD_TASK_ID,
   FLAT_BWD_TASK_ID,
@@ -128,6 +140,7 @@ enum TaskIDs {
   SOFTMAX_FWD_TASK_ID,
   SOFTMAX_BWD_TASK_ID,
   SOFTMAX_INF_TASK_ID,
+  SOFTMAX_PEFT_BWD_TASK_ID,
   CONCAT_INIT_TASK_ID,
   CONCAT_FWD_TASK_ID,
   CONCAT_BWD_TASK_ID,
@@ -163,20 +176,26 @@ enum TaskIDs {
   RMSNORM_INIT_TASK_ID,
   RMSNORM_FWD_TASK_ID,
   RMSNORM_INF_TASK_ID,
+  RMSNORM_BWD_TASK_ID,
+  RMSNORM_PEFT_BWD_TASK_ID,
   RESIDUAL_RMSNORM_INIT_TASK_ID,
   RESIDUAL_RMSNORM_INF_TASK_ID,
+  RESIDUAL_RMSNORM_BWD_TASK_ID,
+  RESIDUAL_RMSNORM_PEFT_BWD_TASK_ID,
   BEAM_TOPK_INIT_TASK_ID,
   BEAM_TOPK_INF_TASK_ID,
   INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
   INC_MULTIHEAD_SELF_ATTENTION_FWD_TASK_ID,
   INC_MULTIHEAD_SELF_ATTENTION_BWD_TASK_ID,
   INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
+  INC_MULTIHEAD_SELF_ATTENTION_PEFT_BWD_TASK_ID,
   SPEC_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
   SPEC_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
   TREE_INC_MULTIHEAD_SELF_ATTENTION_INIT_TASK_ID,
   TREE_INC_MULTIHEAD_SELF_ATTENTION_INF_TASK_ID,
   MSELOSS_BWD_TASK_ID,
   FUSEDOP_INIT_TASK_ID,
+  FUSEDOP_PEFT_BWD_TASK_ID,
   FUSEDOP_FWD_TASK_ID,
   FUSEDOP_BWD_TASK_ID,
   FUSEDOP_INF_TASK_ID,
@@ -224,10 +243,13 @@ enum TaskIDs {
   REPARTITION_BWD_TASK_ID,
   COMBINE_INIT_TASK_ID,
   COMBINE_FWD_TASK_ID,
+  COMBINE_INF_TASK_ID,
   COMBINE_BWD_TASK_ID,
+  COMBINE_PEFT_BWD_TASK_ID,
   REPLICATE_INIT_TASK_ID,
   REPLICATE_FWD_TASK_ID,
   REPLICATE_BWD_TASK_ID,
+  REPLICATE_PEFT_BWD_TASK_ID,
   REDUCTION_INIT_TASK_ID,
   REDUCTION_FWD_TASK_ID,
   REDUCTION_BWD_TASK_ID,
@@ -235,9 +257,15 @@ enum TaskIDs {
   PIPELINE_FWD_TASK_ID,
   PIPELINE_BWD_TASK_ID,
   ALLREDUCE_INIT_TASK_ID,
-  ALLREDUCE_INF_TASK_ID,
   ALLREDUCE_FWD_TASK_ID,
   ALLREDUCE_BWD_TASK_ID,
+  ALLREDUCE_INF_TASK_ID,
+  ALLREDUCE_PEFT_BWD_TASK_ID,
+  PARALLEL_IDENTITY_INIT_TASK_ID,
+  PARALLEL_IDENTITY_FWD_TASK_ID,
+  PARALLEL_IDENTITY_BWD_TASK_ID,
+  PARALLEL_IDENTITY_INF_TASK_ID,
+  PARALLEL_IDENTITY_PEFT_BWD_TASK_ID,
   FUSED_PARALLELOP_INIT_TASK_ID,
   FUSED_PARALLELOP_FWD_TASK_ID,
   FUSED_PARALLELOP_BWD_TASK_ID,
@@ -327,6 +355,7 @@ class ResidualLayerNorm;
 class AddBiasResidualLayerNorm;
 class SigmoidSiluMulti;
 class Linear;
+class LoraLinear;
 class MultiHeadAttention;
 class IncMultiHeadSelfAttention;
 class TreeIncMultiHeadSelfAttention;
@@ -349,9 +378,12 @@ class Repartition;
 class Reduction;
 class Replicate;
 class AllReduce;
+class ParallelIdentity;
 class FusedParallelOp;
 class ParallelOpInfo;
 
+struct Request;
+
 // TODO: Move to an appropriate place
 /*
   This is used to create a type that recursively replaces value type
@@ -561,6 +593,7 @@ class FFModel {
                            bool elementwise_affine,
                            float eps,
                            bool use_bias = true,
+                           bool inplace_residual = false,
                            DataType data_type = DT_NONE,
                            char const *name = NULL);
   // Add a add_bias_residual_layer_norm layer
@@ -571,6 +604,7 @@ class FFModel {
                                     bool elementwise_affine,
                                     float eps,
                                     bool use_bias = true,
+                                    bool inplace_residual = false,
                                     DataType data_type = DT_NONE,
                                     char const *name = NULL);
   // Add a sigmoid_silu_multi layer
@@ -599,6 +633,7 @@ class FFModel {
                          Tensor *outputs,
                          float eps,
                          int dim,
+                         bool inplace_residual = false,
                          DataType data_type = DT_NONE,
                          char const *name = NULL);
   // Add a beam search top k layer
@@ -808,10 +843,13 @@ class FFModel {
       bool position_bias = false,
       char const *name = NULL);
   // ========================================
+  // PEFT Layers
+  // ========================================
+  PEFTModelID *add_lora_layer(LoraLinearConfig const peft_config);
+  // ========================================
   // Inference APIs
   // ========================================
-  std::vector<GenerationResult> generate(std::vector<std::string> &prompts,
-                                         int max_seq_length);
+  std::vector<GenerationResult> generate(std::vector<Request> const &requests);
 
   Tensor create_tensor_legion_ordering(int num_dim,
                                        int const dims[],
@@ -1103,6 +1141,9 @@ class FFModel {
   Legion::IndexSpace get_task_is(Legion::Domain const &domain) const;
   Legion::IndexSpace get_task_is(ParallelConfig const &pc) const;
   Legion::IndexSpace get_task_is(MachineView const &view) const;
+  bool need_to_add_combine(int layer_idx) const;
+  bool need_to_add_allreduce(int layer_idx) const;
+  bool need_to_add_parallel_identity(int layer_idx) const;
   bool is_mlp_block(int layer_idx) const;
   void create_operators_from_layers();
   Op *create_operator_from_layer(Layer *layer,
@@ -1117,7 +1158,7 @@ class FFModel {
   void clear_graph_search_cache();
 
 public:
-  size_t op_global_guid, layer_global_guid;
+  size_t op_global_guid, layer_global_guid, peft_model_global_guid;
   size_t tensor_global_guid, parallel_tensor_global_guid, node_global_guid;
   size_t current_transformer_layer_id;
   // positional embedding start offset
@@ -1137,6 +1178,12 @@ class FFModel {
   std::vector<Layer *> layers;
   std::vector<Op *> operators;
   std::vector<ParallelTensor> parameters;
+  // PEFT related
+  std::unordered_map<Layer *, Layer *> base_layer_to_peft_layer;
+  std::unordered_map<Layer *, std::vector<PEFTModelID>> peft_layer_to_peft_id;
+  std::unordered_map<PEFTModelID, LoraLinearConfig> peft_configs;
+  //   std::vector<Op *> peft_operators;
+
   FFHandler handlers[MAX_NUM_WORKERS];
   Legion::Future current_metrics;
   // Cached operators: key: operator hash, value: operator pointer
@@ -1195,6 +1242,10 @@ class FFModel {
           SigmoidSiluMulti *>,
       std::unordered_map<std::pair<ParallelTensorShape, LinearParams>,
                          Linear *>,
+      std::unordered_map<
+          std::pair<std::pair<ParallelTensorShape, ParallelTensorShape>,
+                    LoraLinearParams>,
+          LoraLinear *>,
       std::unordered_map<std::pair<ParallelTensorShape, Pool2DParams>,
                          Pool2D *>,
       std::unordered_map<std::pair<std::tuple<ParallelTensorShape,
@@ -1245,6 +1296,8 @@ class FFModel {
                          Combine *>,
       std::unordered_map<std::pair<ParallelTensorShape, AllReduceParams>,
                          AllReduce *>,
+      std::unordered_map<std::pair<ParallelTensorShape, ParallelIdentityParams>,
+                         ParallelIdentity *>,
       std::unordered_map<std::pair<ParallelTensorShape, FusedParallelOpParams>,
                          FusedParallelOp *>>
       cached_ops;
diff --git a/include/flexflow/op_meta.h b/include/flexflow/op_meta.h
index 60785a1e29..d31c12b16c 100644
--- a/include/flexflow/op_meta.h
+++ b/include/flexflow/op_meta.h
@@ -9,7 +9,7 @@ class Op;
 
 class OpMeta {
 public:
-  OpMeta(FFHandler _handle);
+  // OpMeta(FFHandler _handle);
   OpMeta(FFHandler _handle, Op const *op);
 
 public:
@@ -17,9 +17,11 @@ class OpMeta {
   bool profiling; // Measure the run time of the task
   bool inference_debugging;
   int decoding_step;
+  int bwd_step;
   char op_name[MAX_OPNAME];
   LayerID layer_guid;
-  bool trainableInputs[MAX_NUM_INPUTS];
+  bool trainable_inputs[MAX_NUM_INPUTS];
+  bool reset_input_grads[MAX_NUM_INPUTS];
   DataType input_type[MAX_NUM_INPUTS];
   DataType weight_type[MAX_NUM_WEIGHTS];
   DataType output_type[MAX_NUM_OUTPUTS];
diff --git a/include/flexflow/operator.h b/include/flexflow/operator.h
index 311699d926..1a5af67b36 100644
--- a/include/flexflow/operator.h
+++ b/include/flexflow/operator.h
@@ -7,7 +7,9 @@
 #include "flexflow/machine_view.h"
 #include "flexflow/parallel_tensor.h"
 #include "flexflow/utils/dot/record_formatter.h"
+#include <filesystem>
 #include <vector>
+namespace fs = std::filesystem;
 
 #include <sys/stat.h>
 #include <sys/types.h>
@@ -29,6 +31,11 @@ enum class MappingRecordType { INPUT_OUTPUT, INPUT_WEIGHT };
 
 enum class MappingOperation { PARTITION, REPLICATE };
 
+fs::path get_dst_folder(std::string const &subdir,
+                        int step_idx = 0,
+                        int shard_idx = 0,
+                        bool before_kernel = false);
+
 /** @brief  A class to keep track of a dimension relation between two tensors
  * used by an operator.
  *
@@ -236,11 +243,18 @@ class Op {
     Legion::FutureMap empty_map;
     return empty_map;
   };
+  virtual Legion::FutureMap peft_bwd(FFModel const &,
+                                     BatchConfigFuture const &,
+                                     std::vector<ParallelTensor> const &,
+                                     std::vector<ParallelTensor> const &,
+                                     MachineView const *mv = nullptr) {
+    assert(false);
+  }
   virtual void print_layer(FFModel const &model) = 0;
   template <typename OpMetaType>
   static std::string get_op_name_without_uid(OpMetaType *m) {
     std::string op_name_without_uid = std::string(m->op_name);
-    size_t last_underscore = op_name_without_uid.length() - 1;
+    size_t last_underscore = op_name_without_uid.length();
     for (int i = op_name_without_uid.length() - 1; i > 0; i--) {
       if (!(std::isdigit(m->op_name[i]) || m->op_name[i] == '_')) {
         break;
@@ -248,7 +262,9 @@ class Op {
         last_underscore = i;
       }
     }
-    op_name_without_uid.erase(last_underscore);
+    if (last_underscore < op_name_without_uid.length()) {
+      op_name_without_uid.erase(last_underscore);
+    }
     return op_name_without_uid;
   }
   template <typename OpMetaType>
@@ -259,31 +275,42 @@ class Op {
       std::vector<GenericTensorAccessorR> input_tensors,
       std::vector<GenericTensorAccessorR> weight_tensors,
       std::vector<GenericTensorAccessorR> output_tensors,
+      bool fwd_pass = true,
       bool before_kernel = false) {
-    // Check if output directory exists, and create it if it does not
-    char const *folder_path = "./inference_tensors";
-    struct stat st = {0};
-    if (stat(folder_path, &st) == -1) {
-      // Directory does not exist, create it
-      mkdir(folder_path, 0700);
-    }
-    // output base filepath, shared by all tensors from the same operator
+    // get operator name and print it
     std::string op_name_without_uid = get_op_name_without_uid(m);
-    std::string base_filepath =
-        "./inference_tensors/model_" + std::to_string(m->layer_guid.model_id) +
-        "_decoding-step_" + std::to_string(m->decoding_step) + "_layer-num_" +
-        std::to_string(m->layer_guid.transformer_layer_id) + "_layer-name_" +
-        op_name_without_uid + "_shard-id_" + std::to_string(shard_id);
-    if (before_kernel) {
-      base_filepath += "_pre";
+    std::cout << (fwd_pass ? "INF " : "BWD ") << op_name_without_uid
+              << std::endl;
+    // build the path to save the tensor
+    fs::path dst_filepath;
+    if (fwd_pass) {
+      dst_filepath =
+          get_dst_folder("fwd", m->decoding_step, shard_id, before_kernel);
+    } else {
+      dst_filepath =
+          get_dst_folder("bwd", m->bwd_step, shard_id, before_kernel);
+    }
+    if (m->layer_guid.model_id > 0) {
+      assert(false && "Model ID > 0 not supported yet");
     }
+    std::string layername = "layers." +
+                            std::to_string(m->layer_guid.transformer_layer_id) +
+                            "." + op_name_without_uid;
+    dst_filepath /= layername;
+
     // save batch config, if passed
     if (bc != nullptr) {
-      bc->save_to_file(base_filepath + "_batch-config");
+      bc->save_to_file(dst_filepath.string() + ".batch_config");
     }
+
     // save all inputs
     for (int i = 0; i < input_tensors.size(); i++) {
-      std::string filename = base_filepath + "_input_" + std::to_string(i);
+      std::string filename = dst_filepath.string() + ".input_";
+      if (fwd_pass) {
+        filename += std::to_string(i);
+      } else {
+        filename += "gradient_" + std::to_string(i);
+      }
       if (input_tensors[i].data_type == DT_FLOAT) {
         save_tensor(input_tensors[i].get_float_ptr(),
                     input_tensors[i].domain.get_volume(),
@@ -304,10 +331,17 @@ class Op {
         assert(false && "Tensor data type not supported");
       }
     }
-    // only dump the weights once
-    if (m->decoding_step == 0) {
+
+    // only dump the weights in the forward pass, at the first step
+    // note that we do not save the weight gradients, since we only support
+    // finetuning LoRA weights, which are not FF tensors.
+    if (fwd_pass && m->decoding_step == 0) {
+      fs::path dst_filepath_weights =
+          get_dst_folder("weights", m->decoding_step, shard_id, before_kernel) /
+          layername;
       for (int i = 0; i < weight_tensors.size(); i++) {
-        std::string filename = base_filepath + "_weight_" + std::to_string(i);
+        std::string filename =
+            dst_filepath_weights.string() + ".weight_" + std::to_string(i);
         if (weight_tensors[i].data_type == DT_FLOAT) {
           save_tensor(weight_tensors[i].get_float_ptr(),
                       weight_tensors[i].domain.get_volume(),
@@ -329,9 +363,15 @@ class Op {
         }
       }
     }
+
     // save all outputs
     for (int i = 0; i < output_tensors.size(); i++) {
-      std::string filename = base_filepath + "_output_" + std::to_string(i);
+      std::string filename = dst_filepath.string() + ".output_";
+      if (fwd_pass) {
+        filename += std::to_string(i);
+      } else {
+        filename += "gradient_" + std::to_string(i);
+      }
       if (output_tensors[i].data_type == DT_FLOAT) {
         save_tensor(output_tensors[i].get_float_ptr(),
                     output_tensors[i].domain.get_volume(),
@@ -354,7 +394,11 @@ class Op {
     }
     // increase count of decoding steps
     if (!before_kernel) {
-      m->decoding_step++;
+      if (fwd_pass) {
+        m->decoding_step++;
+      } else {
+        m->bwd_step++;
+      }
     }
   }
   virtual bool measure_operator_cost(Simulator *sim,
@@ -448,7 +492,8 @@ class Op {
   ParallelTensor outputs[MAX_NUM_OUTPUTS];
   ParallelTensor inputs[MAX_NUM_INPUTS];
   ParallelParameter weights[MAX_NUM_WEIGHTS];
-  bool trainableInputs[MAX_NUM_INPUTS];
+  bool trainable_inputs[MAX_NUM_INPUTS];
+  bool reset_input_grads[MAX_NUM_INPUTS];
   OpMeta *meta[MAX_NUM_WORKERS];
   std::map<ParallelTensor, OpMeta *[MAX_NUM_WORKERS]> inference_meta;
   int numInputs, numWeights, numOutputs;
diff --git a/include/flexflow/operator_params.h b/include/flexflow/operator_params.h
index 5b187839ef..673f78ad46 100644
--- a/include/flexflow/operator_params.h
+++ b/include/flexflow/operator_params.h
@@ -23,6 +23,7 @@
 #include "flexflow/ops/inc_multihead_self_attention_params.h"
 #include "flexflow/ops/layer_norm_params.h"
 #include "flexflow/ops/linear_params.h"
+#include "flexflow/ops/lora_linear_params.h"
 #include "flexflow/ops/pool_2d_params.h"
 #include "flexflow/ops/reduce_params.h"
 #include "flexflow/ops/reshape_params.h"
@@ -40,6 +41,7 @@
 #include "flexflow/parallel_ops/allreduce_params.h"
 #include "flexflow/parallel_ops/combine_params.h"
 #include "flexflow/parallel_ops/fused_parallel_op_params.h"
+#include "flexflow/parallel_ops/parallel_identity_params.h"
 #include "flexflow/parallel_ops/partition_params.h"
 #include "flexflow/parallel_ops/reduction_params.h"
 #include "flexflow/parallel_ops/replicate_params.h"
@@ -67,6 +69,7 @@ using OperatorParameters = mp::variant<AggregateParams,
                                        AddBiasResidualLayerNormParams,
                                        SigmoidSiluMultiParams,
                                        LinearParams,
+                                       LoraLinearParams,
                                        MultiHeadAttentionParams,
                                        IncMultiHeadSelfAttentionParams,
                                        BeamTopKParams,
@@ -89,6 +92,7 @@ using OperatorParameters = mp::variant<AggregateParams,
                                        ReductionParams,
                                        CombineParams,
                                        AllReduceParams,
+                                       ParallelIdentityParams,
                                        FusedParallelOpParams>;
 
 tl::optional<OperatorParameters> get_op_parameters(Op const *op);
diff --git a/include/flexflow/ops/add_bias_residual_layer_norm.h b/include/flexflow/ops/add_bias_residual_layer_norm.h
index bb470376c3..9510ac0f28 100644
--- a/include/flexflow/ops/add_bias_residual_layer_norm.h
+++ b/include/flexflow/ops/add_bias_residual_layer_norm.h
@@ -24,8 +24,10 @@ class AddBiasResidualLayerNorm : public Op {
                            bool _elementwise_affine,
                            bool _use_bias,
                            float _eps,
+                           bool _inplace_residual,
                            bool allocate_weights,
                            char const *name);
+  void map_output_tensors(FFModel &ff) override;
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
                       std::vector<ParallelTensor> const &,
@@ -38,6 +40,11 @@ class AddBiasResidualLayerNorm : public Op {
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
+  Legion::FutureMap peft_bwd(FFModel const &,
+                             BatchConfigFuture const &,
+                             std::vector<ParallelTensor> const &,
+                             std::vector<ParallelTensor> const &,
+                             MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
@@ -61,6 +68,14 @@ class AddBiasResidualLayerNorm : public Op {
                              std::vector<Legion::PhysicalRegion> const &regions,
                              Legion::Context ctx,
                              Legion::Runtime *runtime);
+  static void backward_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
+  static void peft_bwd_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
                              CostMetrics &cost_metrics) const override;
@@ -76,21 +91,55 @@ class AddBiasResidualLayerNorm : public Op {
                                T const *gamma_ptr,
                                T const *beta_ptr,
                                ffStream_t stream);
-  static void inference_kernel_wrapper(AddBiasResidualLayerNormMeta const *m,
-                                       int attn_bias_dim,
-                                       int residual_volume,
+  static void inference_kernel_wrapper(AddBiasResidualLayerNormMeta *m,
+                                       BatchConfig const *bc,
                                        GenericTensorAccessorR const &input,
+                                       GenericTensorAccessorR const &attn_bias,
+                                       GenericTensorAccessorR const &residual,
                                        GenericTensorAccessorW &added_output,
                                        GenericTensorAccessorW &output,
-                                       GenericTensorAccessorR const &residual,
-                                       GenericTensorAccessorR const &attn_bias,
                                        GenericTensorAccessorR const &gamma,
                                        GenericTensorAccessorR const &beta);
+  template <typename T>
+  static void backward_kernel(AddBiasResidualLayerNormMeta const *m,
+                              T const *output_grad_ptr,
+                              T const *added_output_ptr,
+                              T *input_grad_ptr,
+                              T *residual_grad_ptr,
+                              T *attn_bias_grad_ptr,
+                              T const *gamma_ptr,
+                              T *gamma_grad_ptr,
+                              T *beta_grad_ptr,
+                              ffStream_t stream);
+  static void
+      backward_kernel_wrapper(AddBiasResidualLayerNormMeta const *m,
+                              GenericTensorAccessorR const &output_grad,
+                              GenericTensorAccessorR &added_output,
+                              GenericTensorAccessorW &input_grad,
+                              GenericTensorAccessorW const &residual_grad,
+                              GenericTensorAccessorW const &attn_bias_grad,
+                              GenericTensorAccessorR const &gamma,
+                              GenericTensorAccessorW const &gamma_grad,
+                              GenericTensorAccessorW const &beta_grad);
+  template <typename T>
+  static void peft_bwd_kernel(AddBiasResidualLayerNormMeta const *m,
+                              T const *output_grad_ptr,
+                              T *input_grad_ptr,
+                              T *residual_grad_ptr,
+                              T const *gamma_ptr,
+                              ffStream_t stream);
+  static void
+      peft_bwd_kernel_wrapper(AddBiasResidualLayerNormMeta const *m,
+                              GenericTensorAccessorR const &output_grad,
+                              GenericTensorAccessorW &input_grad,
+                              GenericTensorAccessorW const &residual_grad,
+                              GenericTensorAccessorR const &gamma);
 
 public:
   bool elementwise_affine, use_bias;
   int64_t effective_batch_size, effective_num_elements;
   float eps;
+  bool inplace_residual;
   std::vector<int> axes;
 };
 
@@ -105,8 +154,12 @@ class AddBiasResidualLayerNormMeta : public OpMeta {
   bool elementwise_affine, use_bias;
   int64_t effective_batch_size, effective_num_elements;
   float eps;
+  bool inplace_residual;
   void *mean_ptr, *rstd_ptr, *ds_ptr, *db_ptr, *scale_ptr, *bias_ptr;
   Realm::RegionInstance reserveInst;
+  // PEFT related fields
+  void *input_activation;
+  size_t allocated_peft_buffer_size = 0;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/ops/add_bias_residual_layer_norm_params.h b/include/flexflow/ops/add_bias_residual_layer_norm_params.h
index 87fe2fb562..840f521b01 100644
--- a/include/flexflow/ops/add_bias_residual_layer_norm_params.h
+++ b/include/flexflow/ops/add_bias_residual_layer_norm_params.h
@@ -12,6 +12,7 @@ struct AddBiasResidualLayerNormParams {
   bool elementwise_affine;
   float eps;
   bool use_bias;
+  bool inplace_residual;
   char name[MAX_OPNAME];
   bool is_valid(
       std::pair<ParallelTensorShape, ParallelTensorShape> const &) const;
diff --git a/include/flexflow/ops/aggregate.h b/include/flexflow/ops/aggregate.h
index 3ba4f414d1..283e9a4290 100644
--- a/include/flexflow/ops/aggregate.h
+++ b/include/flexflow/ops/aggregate.h
@@ -11,9 +11,11 @@ namespace FlexFlow {
 #define AGGREGATE_MAX_BATCH_SIZE 64
 #define AGGREGATE_MAX_N 128
 
+class Aggregate;
+
 class AggregateMeta : public OpMeta {
 public:
-  AggregateMeta(FFHandler handle, int n);
+  AggregateMeta(FFHandler handle, Aggregate const *aggr);
   ~AggregateMeta(void);
   float **dev_exp_preds;
   float **dev_exp_grads;
diff --git a/include/flexflow/ops/aggregate_spec.h b/include/flexflow/ops/aggregate_spec.h
index 4302dd0733..a9f651b620 100644
--- a/include/flexflow/ops/aggregate_spec.h
+++ b/include/flexflow/ops/aggregate_spec.h
@@ -11,9 +11,11 @@ namespace FlexFlow {
 #define AGGREGATE_SPEC_MAX_BATCH_SIZE 32
 #define AGGREGATE_SPEC_MAX_N 12
 
+class AggregateSpec;
+
 class AggregateSpecMeta : public OpMeta {
 public:
-  AggregateSpecMeta(FFHandler handle, int n);
+  AggregateSpecMeta(FFHandler handle, AggregateSpec const *agg);
   ~AggregateSpecMeta(void);
   float **dev_region_ptrs;
 };
diff --git a/include/flexflow/ops/argmax.h b/include/flexflow/ops/argmax.h
index 298059e3ed..eca9943d20 100644
--- a/include/flexflow/ops/argmax.h
+++ b/include/flexflow/ops/argmax.h
@@ -17,6 +17,7 @@ class ArgMaxMeta : public OpMeta {
   size_t temp_storage_bytes = 0;
   int *d_offsets;
   void *d_out;
+  float *d_loss;
   Realm::RegionInstance reserveInst;
   ArgMaxMeta(FFHandler handler,
              Op const *op,
@@ -89,18 +90,22 @@ class ArgMax : public Op {
                              CostMetrics &cost_metrics) const override;
   template <typename DT>
   static void forward_kernel(ArgMaxMeta const *m,
-                             DT *input_ptr,
+                             BatchConfig const *bc,
+                             DT const *input_ptr,
                              int *indices_ptr,
                              float *prob_ptr,
                              int *parent_ptr,
                              int length,
                              int batch_size,
+                             float *loss,
                              ffStream_t stream);
   static void forward_kernel_wrapper(ArgMaxMeta const *m,
-                                     GenericTensorAccessorW const &input,
+                                     BatchConfig const *bc,
+                                     GenericTensorAccessorR const &input,
                                      GenericTensorAccessorW const &indices,
                                      GenericTensorAccessorW const &parent,
-                                     int batch_size);
+                                     int batch_size,
+                                     float *loss);
   Params get_params() const;
 
 public:
diff --git a/include/flexflow/ops/cache.h b/include/flexflow/ops/cache.h
index 1fbb1fa059..4f0b94ee5c 100644
--- a/include/flexflow/ops/cache.h
+++ b/include/flexflow/ops/cache.h
@@ -5,9 +5,11 @@
 
 namespace FlexFlow {
 
+class Cache;
+
 class CacheMeta : public OpMeta {
 public:
-  CacheMeta(FFHandler handle);
+  CacheMeta(FFHandler handle, Cache const *c);
   float cache_score;
 };
 
diff --git a/include/flexflow/ops/element_unary.h b/include/flexflow/ops/element_unary.h
index ddef59549c..043b5d19a7 100644
--- a/include/flexflow/ops/element_unary.h
+++ b/include/flexflow/ops/element_unary.h
@@ -12,9 +12,11 @@
 
 namespace FlexFlow {
 
+class ElementUnary;
+
 class ElementUnaryMeta : public OpMeta {
 public:
-  ElementUnaryMeta(FFHandler handle);
+  ElementUnaryMeta(FFHandler handle, ElementUnary const *unary);
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
   cudnnTensorDescriptor_t inputTensor, outputTensor;
   cudnnActivationDescriptor_t actiDesc;
diff --git a/include/flexflow/ops/embedding.h b/include/flexflow/ops/embedding.h
index ed89fcf37a..c90e1773e0 100644
--- a/include/flexflow/ops/embedding.h
+++ b/include/flexflow/ops/embedding.h
@@ -60,6 +60,11 @@ class Embedding : public Op {
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
+  Legion::FutureMap peft_bwd(FFModel const &,
+                             BatchConfigFuture const &,
+                             std::vector<ParallelTensor> const &,
+                             std::vector<ParallelTensor> const &,
+                             MachineView const *mv = nullptr) override;
   // void update(const FFModel&);
   void print_layer(FFModel const &model) override {
     assert(0);
diff --git a/include/flexflow/ops/experts.h b/include/flexflow/ops/experts.h
index d68957d890..1ed4678a5b 100644
--- a/include/flexflow/ops/experts.h
+++ b/include/flexflow/ops/experts.h
@@ -6,20 +6,11 @@
 
 namespace FlexFlow {
 
+class Experts;
+
 class ExpertsMeta : public OpMeta {
 public:
-  ExpertsMeta(FFHandler handler,
-              int _num_experts,
-              int _experts_start_idx,
-              int _data_dim,
-              int _out_dim,
-              int _experts_num_layers,
-              int _experts_internal_dim_size,
-              int _effective_batch_size,
-              int _num_chosen_experts,
-              float _alpha,
-              bool _use_bias,
-              ActiMode _activation);
+  ExpertsMeta(FFHandler handler, Experts const *e);
   ~ExpertsMeta(void);
 
   // Thrust helper arrays
@@ -138,7 +129,7 @@ class Experts : public Op {
                                      float *output,
                                      float const *weights,
                                      float const *biases,
-                                     int num_active_tokens,
+                                     int num_active_infr_tokens,
                                      int chosen_experts,
                                      int batch_size,
                                      int out_dim);
diff --git a/include/flexflow/ops/fused.h b/include/flexflow/ops/fused.h
index a8326e9ab4..02ab1db7b5 100644
--- a/include/flexflow/ops/fused.h
+++ b/include/flexflow/ops/fused.h
@@ -49,6 +49,11 @@ class FusedOp : public Op {
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
+  Legion::FutureMap peft_bwd(FFModel const &,
+                             BatchConfigFuture const &,
+                             std::vector<ParallelTensor> const &,
+                             std::vector<ParallelTensor> const &,
+                             MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
@@ -60,6 +65,10 @@ class FusedOp : public Op {
                              std::vector<Legion::PhysicalRegion> const &regions,
                              Legion::Context ctx,
                              Legion::Runtime *runtime);
+  static void peft_bwd_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
   static void forward_task(Legion::Task const *task,
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
diff --git a/include/flexflow/ops/groupby.h b/include/flexflow/ops/groupby.h
index ec6cdfb9ab..73025216cd 100644
--- a/include/flexflow/ops/groupby.h
+++ b/include/flexflow/ops/groupby.h
@@ -8,9 +8,11 @@
 
 namespace FlexFlow {
 
+class Group_by;
+
 class GroupByMeta : public OpMeta {
 public:
-  GroupByMeta(FFHandler handle, int n, float _alpha);
+  GroupByMeta(FFHandler handle, Group_by const *gb);
   ~GroupByMeta(void);
   float alpha;
   float **dev_region_ptrs;
diff --git a/include/flexflow/ops/inc_multihead_self_attention.h b/include/flexflow/ops/inc_multihead_self_attention.h
index 43dc527bc8..f77df7c456 100644
--- a/include/flexflow/ops/inc_multihead_self_attention.h
+++ b/include/flexflow/ops/inc_multihead_self_attention.h
@@ -96,6 +96,11 @@ class IncMultiHeadSelfAttention : public Op {
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
+  Legion::FutureMap peft_bwd(FFModel const &,
+                             BatchConfigFuture const &,
+                             std::vector<ParallelTensor> const &,
+                             std::vector<ParallelTensor> const &,
+                             MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
@@ -109,17 +114,27 @@ class IncMultiHeadSelfAttention : public Op {
                              std::vector<Legion::PhysicalRegion> const &regions,
                              Legion::Context ctx,
                              Legion::Runtime *runtime);
+  static void peft_bwd_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &mv,
                              CostMetrics &cost_metrics) const override;
-
-  static void inference_kernel_wrapper(IncMultiHeadSelfAttentionMeta const *m,
+  static void inference_kernel_wrapper(IncMultiHeadSelfAttentionMeta *m,
                                        BatchConfig const *bc,
                                        int shard_id,
                                        GenericTensorAccessorR const &input,
                                        GenericTensorAccessorR const &weight,
                                        GenericTensorAccessorW const &output,
                                        GenericTensorAccessorR const &bias);
+  static void peft_bwd_kernel_wrapper(IncMultiHeadSelfAttentionMeta *m,
+                                      BatchConfig const *bc,
+                                      int shard_id,
+                                      GenericTensorAccessorW const &input_grad,
+                                      GenericTensorAccessorR const &weight,
+                                      GenericTensorAccessorR const &output_grad,
+                                      GenericTensorAccessorR const &bias);
   Params get_params() const;
 
 public:
@@ -204,6 +219,10 @@ class IncMultiHeadSelfAttentionMeta : public OpMeta {
   //  typedef hipFloatComplex attFloatComplex;
   hipFloatComplex *complex_input;
 #endif
+  // PEFT specific fields
+  void *softmax_activation_buffer;
+  void *query_activation_buffer;
+  size_t allocated_peft_buffer_size1 = 0, allocated_peft_buffer_size2 = 0;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/ops/kernels/batch_matmul_kernels.h b/include/flexflow/ops/kernels/batch_matmul_kernels.h
index 4de774ee06..c3923c4d4b 100644
--- a/include/flexflow/ops/kernels/batch_matmul_kernels.h
+++ b/include/flexflow/ops/kernels/batch_matmul_kernels.h
@@ -7,9 +7,11 @@
 
 namespace FlexFlow {
 
+class BatchMatmul;
+
 class BatchMatmulMeta : public OpMeta {
 public:
-  BatchMatmulMeta(FFHandler handler);
+  BatchMatmulMeta(FFHandler handler, BatchMatmul const *bmm);
   int a_seq_length_dim, b_seq_length_dim;
 };
 
diff --git a/include/flexflow/ops/kernels/cast_kernels.h b/include/flexflow/ops/kernels/cast_kernels.h
index 3001d913ca..d601601ea2 100644
--- a/include/flexflow/ops/kernels/cast_kernels.h
+++ b/include/flexflow/ops/kernels/cast_kernels.h
@@ -7,9 +7,11 @@
 
 namespace FlexFlow {
 
+class Cast;
+
 class CastMeta : public OpMeta {
 public:
-  CastMeta(FFHandler handle);
+  CastMeta(FFHandler handle, Cast const *cast);
   DataType input_data_type, output_data_type;
 };
 
diff --git a/include/flexflow/ops/kernels/concat_kernels.h b/include/flexflow/ops/kernels/concat_kernels.h
index 4da6aaf5e2..4562ae871a 100644
--- a/include/flexflow/ops/kernels/concat_kernels.h
+++ b/include/flexflow/ops/kernels/concat_kernels.h
@@ -8,9 +8,11 @@
 
 namespace FlexFlow {
 
+class Concat;
+
 class ConcatMeta : public OpMeta {
 public:
-  ConcatMeta(FFHandler handle) : OpMeta(handle){};
+  ConcatMeta(FFHandler handle, Concat const *cc);
   int legion_axis;
 };
 
diff --git a/include/flexflow/ops/kernels/conv_2d_kernels.h b/include/flexflow/ops/kernels/conv_2d_kernels.h
index 7b2a0fe135..f83e4687d7 100644
--- a/include/flexflow/ops/kernels/conv_2d_kernels.h
+++ b/include/flexflow/ops/kernels/conv_2d_kernels.h
@@ -7,9 +7,11 @@
 
 namespace FlexFlow {
 
+class Conv2D;
+
 class Conv2DMeta : public OpMeta {
 public:
-  Conv2DMeta(FFHandler handler);
+  Conv2DMeta(FFHandler handler, Conv2D const *conv);
 #if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
   cudnnTensorDescriptor_t inputTensor, biasTensor, outputTensor;
   cudnnFilterDescriptor_t filterDesc;
diff --git a/include/flexflow/ops/kernels/flat_kernels.h b/include/flexflow/ops/kernels/flat_kernels.h
index caf817512d..6aa5a13b42 100644
--- a/include/flexflow/ops/kernels/flat_kernels.h
+++ b/include/flexflow/ops/kernels/flat_kernels.h
@@ -7,9 +7,11 @@
 
 namespace FlexFlow {
 
+class Flat;
+
 class FlatMeta : public OpMeta {
 public:
-  FlatMeta(FFHandler handle) : OpMeta(handle){};
+  FlatMeta(FFHandler handle, Flat const *flat);
 };
 
 namespace Kernels {
diff --git a/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh b/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh
index d1e0e050b2..3d122d4bc5 100644
--- a/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh
+++ b/include/flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh
@@ -385,6 +385,25 @@ inline __device__ void zero(T &dst) {
   dst = tmp.raw;
 }
 
+template <typename T>
+__device__ __forceinline__ T WARP_SHFL(unsigned mask, T var, int srcLane, int width=warpSize) {
+#ifndef __HIP_PLATFORM_HCC__
+  return __shfl_sync(mask, var, srcLane, width);
+#else
+  return __shfl(var, srcLane, width);
+#endif
+}
+
+template <typename T>
+__device__ __forceinline__ T WARP_SHFL_XOR(unsigned mask, T var, int laneMask, int width=warpSize) {
+#ifndef __HIP_PLATFORM_HCC__
+  return __shfl_xor_sync(mask, var, laneMask, width);
+#else
+  return __shfl_xor(var, laneMask, width);
+#endif
+}
+
+
 template <int THREADS_PER_KEY, typename K_vec, int N>
 inline __device__ float qk_dot_(K_vec const (&q)[N], K_vec const (&k)[N]) {
   // use float32 to get better accuracy
@@ -401,7 +420,7 @@ inline __device__ float qk_dot_(K_vec const (&q)[N], K_vec const (&k)[N]) {
   float qk = sum(qk_vec);
 #pragma unroll
   for (int mask = THREADS_PER_KEY / 2; mask >= 1; mask /= 2) {
-    qk += __shfl_xor_sync(uint32_t(-1), qk, mask);
+    qk += WARP_SHFL_XOR(uint32_t(-1), qk, mask);
   }
   return qk;
 }
@@ -423,7 +442,7 @@ inline __device__ float block_sum(float *red_smem, float sum) {
 // Compute the sum per warp.
 #pragma unroll
   for (int mask = WARP_SIZE / 2; mask >= 1; mask /= 2) {
-    sum += __shfl_xor_sync(uint32_t(-1), sum, mask);
+    sum += WARP_SHFL_XOR(uint32_t(-1), sum, mask);
   }
 
   // Warp leaders store the data to shared memory.
@@ -442,11 +461,11 @@ inline __device__ float block_sum(float *red_smem, float sum) {
 // Parallel reduction inside the warp.
 #pragma unroll
   for (int mask = WARPS_PER_BLOCK / 2; mask >= 1; mask /= 2) {
-    sum += __shfl_xor_sync(uint32_t(-1), sum, mask);
+    sum += WARP_SHFL_XOR(uint32_t(-1), sum, mask);
   }
 
   // Broadcast to other threads.
-  return __shfl_sync(uint32_t(-1), sum, 0);
+  return WARP_SHFL(uint32_t(-1), sum, 0);
 }
 
 template <typename DT>
diff --git a/include/flexflow/ops/kernels/linear_kernels.h b/include/flexflow/ops/kernels/linear_kernels.h
index a5fdc7c602..90e50a0c9a 100644
--- a/include/flexflow/ops/kernels/linear_kernels.h
+++ b/include/flexflow/ops/kernels/linear_kernels.h
@@ -35,6 +35,9 @@ class LinearMeta : public OpMeta {
   float kernel_reg_lambda;
   bool use_bias, add_bias_only_once;
   Realm::RegionInstance reserveInst;
+  // PEFT related fields
+  void *output_activation_buffer;
+  size_t allocated_peft_buffer_size = 0;
 };
 
 namespace Kernels {
@@ -48,6 +51,23 @@ void forward_kernel_wrapper(LinearMeta const *m,
                             int in_dim,
                             int out_dim,
                             int batch_size);
+void inference_kernel_wrapper(LinearMeta *m,
+                              BatchConfig const *bc,
+                              void const *input_ptr,
+                              void *output_ptr,
+                              void const *filter_ptr,
+                              void const *bias_ptr,
+                              int in_dim,
+                              int out_dim,
+                              int batch_size);
+void peft_bwd_kernel_wrapper(LinearMeta const *m,
+                             void *input_grad_ptr,
+                             void *output_grad_ptr,
+                             void const *kernel_ptr,
+                             int in_dim,
+                             int out_dim,
+                             int num_infr_tokens,
+                             int num_peft_tokens);
 void backward_kernel_wrapper(LinearMeta const *m,
                              void const *input_ptr,
                              void *input_grad_ptr,
@@ -73,6 +93,16 @@ void forward_kernel(LinearMeta const *m,
                     int batch_size,
                     ffStream_t stream);
 template <typename DT>
+void peft_bwd_kernel(LinearMeta const *m,
+                     void *input_grad_ptr,
+                     void *output_grad_ptr,
+                     void const *kernel_ptr,
+                     int in_dim,
+                     int out_dim,
+                     int num_infr_tokens,
+                     int num_peft_tokens,
+                     ffStream_t stream);
+template <typename DT>
 void backward_kernel(LinearMeta const *m,
                      void const *input_ptr,
                      void *input_grad_ptr,
@@ -85,6 +115,7 @@ void backward_kernel(LinearMeta const *m,
                      int out_dim,
                      int batch_size,
                      ffStream_t stream);
+
 template <typename DT>
 __global__ void build_one_ptr(DT *one_ptr, int batch_size);
 } // namespace Internal
diff --git a/include/flexflow/ops/kernels/lora_linear_kernels.h b/include/flexflow/ops/kernels/lora_linear_kernels.h
new file mode 100644
index 0000000000..5360b5f8ea
--- /dev/null
+++ b/include/flexflow/ops/kernels/lora_linear_kernels.h
@@ -0,0 +1,77 @@
+#ifndef _FLEXFLOW_OPS_KERNELS_LORA_LINEAR_KERNELS_H
+#define _FLEXFLOW_OPS_KERNELS_LORA_LINEAR_KERNELS_H
+
+#include "flexflow/accessor.h"
+#include "flexflow/device.h"
+#include "flexflow/fftype.h"
+#include "flexflow/op_meta.h"
+#include "flexflow/ops/lora_linear.h"
+
+namespace FlexFlow {
+
+struct LoraLinearWeight {
+  // weights
+  void *w0_ptr, *w1_ptr;
+  // gradients
+  void *w0_grad_ptr, *w1_grad_ptr;
+  // v values for SGD optimizer (when using momentum)
+  void *w0_v_values_ptr, *w1_v_values_ptr;
+  int in_dim, out_dim, rank, num_shards;
+};
+
+struct LoraLinearModelState {
+  LoraLinearWeight weights;
+  LoraOptimizerConfig const *optimizer_config;
+  float lora_alpha;
+  std::string cache_folder;
+  // Huggingface model ID (for download and/or upload)
+  std::string peft_model_id;
+};
+
+class LoraLinearMeta : public OpMeta {
+public:
+  LoraLinearMeta(FFHandler handle, LoraLinear const *li);
+  ~LoraLinearMeta(void);
+  // PEFT related fields
+  void *low_rank_activation;
+  void *input_activation;
+  std::unordered_map<PEFTModelID, LoraLinearModelState> model_state;
+  size_t allocated_peft_buffer_size1 = 0, allocated_peft_buffer_size2 = 0;
+};
+
+namespace Kernels {
+namespace LoraLinear {
+void init_kernel_wrapper(LoraLinearMeta *m, int seed);
+void inference_kernel_wrapper(LoraLinearMeta *m,
+                              BatchConfig const *bc,
+                              GenericTensorAccessorR const &input,
+                              GenericTensorAccessorW const &output);
+void peft_bwd_kernel_wrapper(LoraLinearMeta *m,
+                             BatchConfig const *bc,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &output_grad);
+
+namespace Internal {
+template <typename DT>
+void init_kernel(LoraLinearMeta *m, int seed, ffStream_t stream);
+template <typename DT>
+void inference_kernel(LoraLinearMeta *m,
+                      BatchConfig const *bc,
+                      DT const *input_ptr,
+                      DT *output_ptr,
+                      int in_dim,
+                      int out_dim,
+                      ffStream_t stream);
+template <typename DT>
+void peft_bwd_kernel(LoraLinearMeta *m,
+                     BatchConfig const *bc,
+                     DT *input_grad_ptr,
+                     DT const *output_grad_ptr,
+                     int in_dim,
+                     int out_dim,
+                     ffStream_t stream);
+} // namespace Internal
+} // namespace LoraLinear
+} // namespace Kernels
+} // namespace FlexFlow
+#endif // _FLEXFLOW_OPS_KERNELS_LORA_LINEAR_KERNELS_H
diff --git a/include/flexflow/ops/kernels/pool_2d_kernels.h b/include/flexflow/ops/kernels/pool_2d_kernels.h
index 7f73a8295d..c5a954763e 100644
--- a/include/flexflow/ops/kernels/pool_2d_kernels.h
+++ b/include/flexflow/ops/kernels/pool_2d_kernels.h
@@ -7,9 +7,11 @@
 
 namespace FlexFlow {
 
+class Pool2D;
+
 class Pool2DMeta : public OpMeta {
 public:
-  Pool2DMeta(FFHandler handle);
+  Pool2DMeta(FFHandler handle, Pool2D const *pool);
   ffTensorDescriptor_t inputTensor, outputTensor;
   ffActivationDescriptor_t actiDesc;
   ffPoolingDescriptor_t poolDesc;
diff --git a/include/flexflow/ops/kernels/reshape_kernels.h b/include/flexflow/ops/kernels/reshape_kernels.h
index e6c8c4d569..5b6fa5be19 100644
--- a/include/flexflow/ops/kernels/reshape_kernels.h
+++ b/include/flexflow/ops/kernels/reshape_kernels.h
@@ -7,9 +7,11 @@
 
 namespace FlexFlow {
 
+class Reshape;
+
 class ReshapeMeta : public OpMeta {
 public:
-  ReshapeMeta(FFHandler handler);
+  ReshapeMeta(FFHandler handler, Reshape const *reshape);
   DataType data_type;
 };
 
@@ -44,4 +46,4 @@ void backward_kernel(T *input_grad_ptr,
 } // namespace Kernels
 } // namespace FlexFlow
 
-#endif // _FLEXFLOW_OPS_KERNELS_RESHAPE_KERNELS_H
\ No newline at end of file
+#endif // _FLEXFLOW_OPS_KERNELS_RESHAPE_KERNELS_H
diff --git a/include/flexflow/ops/kernels/residual_rms_norm_kernels.h b/include/flexflow/ops/kernels/residual_rms_norm_kernels.h
index 0eef4ca72b..fd4e0ecf1d 100644
--- a/include/flexflow/ops/kernels/residual_rms_norm_kernels.h
+++ b/include/flexflow/ops/kernels/residual_rms_norm_kernels.h
@@ -2,6 +2,7 @@
 #define _FLEXFLOW_OPS_KERNELS_RESIDUAL_RMSNORM_KERNELS_H
 
 #include "flexflow/accessor.h"
+#include "flexflow/batch_config.h"
 #include "flexflow/device.h"
 #include "flexflow/fftype.h"
 #include "flexflow/op_meta.h"
@@ -31,13 +32,14 @@ class ResidualRMSNormMeta : public OpMeta {
   void *rms_ptr;
   void *norm_ptr;
 
-  float alpha;
-  float beta;
-
+  bool inplace_residual;
   int in_dim;
   int batch_size;
   int num_elements;
   Realm::RegionInstance reserveInst;
+  // PEFT related fields
+  void *input_activation;
+  size_t allocated_peft_buffer_size = 0;
 };
 
 namespace Kernels {
@@ -48,6 +50,28 @@ void forward_kernel_wrapper(ResidualRMSNormMeta const *m,
                             GenericTensorAccessorR const &weight,
                             GenericTensorAccessorW const &residual_output,
                             GenericTensorAccessorW const &output);
+void inference_kernel_wrapper(ResidualRMSNormMeta *m,
+                              BatchConfig const *bc,
+                              GenericTensorAccessorR const &input1,
+                              GenericTensorAccessorR const &input2,
+                              GenericTensorAccessorR const &weight,
+                              GenericTensorAccessorW const &residual_output,
+                              GenericTensorAccessorW const &output);
+void backward_kernel_wrapper(
+    ResidualRMSNormMeta const *m,
+    GenericTensorAccessorR const &output_grad,
+    GenericTensorAccessorR const &residual_output_rms_input,
+    GenericTensorAccessorW const &residual_input0_grad,
+    GenericTensorAccessorW const &residual_input1_grad,
+    GenericTensorAccessorR const &weight,
+    GenericTensorAccessorW const &weight_grad);
+void peft_bwd_kernel_wrapper(ResidualRMSNormMeta const *m,
+                             BatchConfig const *bc,
+                             GenericTensorAccessorR const &output_grad_0,
+                             GenericTensorAccessorR const &output_grad_1,
+                             GenericTensorAccessorW const &input_grad_0,
+                             GenericTensorAccessorW const &input_grad_1,
+                             GenericTensorAccessorR const &weight);
 } // namespace ResidualRMSNorm
 } // namespace Kernels
 } // namespace FlexFlow
diff --git a/include/flexflow/ops/kernels/rms_norm_kernels.h b/include/flexflow/ops/kernels/rms_norm_kernels.h
index 35c5aa69fa..475b6d94ed 100644
--- a/include/flexflow/ops/kernels/rms_norm_kernels.h
+++ b/include/flexflow/ops/kernels/rms_norm_kernels.h
@@ -2,6 +2,7 @@
 #define _FLEXFLOW_OPS_KERNELS_RMSNORM_KERNELS_H
 
 #include "flexflow/accessor.h"
+#include "flexflow/batch_config.h"
 #include "flexflow/device.h"
 #include "flexflow/fftype.h"
 #include "flexflow/op_meta.h"
@@ -31,13 +32,13 @@ class RMSNormMeta : public OpMeta {
   void *rms_ptr;
   void *norm_ptr;
 
-  float alpha;
-  float beta;
-
   int in_dim;
   int batch_size;
   int num_elements;
   Realm::RegionInstance reserveInst;
+  // PEFT related fields
+  void *input_activation;
+  size_t allocated_peft_buffer_size = 0;
 };
 
 namespace Kernels {
@@ -46,6 +47,22 @@ void forward_kernel_wrapper(RMSNormMeta const *m,
                             GenericTensorAccessorR const &input,
                             GenericTensorAccessorR const &weight,
                             GenericTensorAccessorW const &output);
+void inference_kernel_wrapper(RMSNormMeta *m,
+                              BatchConfig const *bc,
+                              GenericTensorAccessorR const &input,
+                              GenericTensorAccessorR const &weight,
+                              GenericTensorAccessorW const &output);
+void backward_kernel_wrapper(RMSNormMeta const *m,
+                             GenericTensorAccessorR const &output_grad,
+                             GenericTensorAccessorR const &input,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &weight,
+                             GenericTensorAccessorW const &weight_grad);
+void peft_bwd_kernel_wrapper(RMSNormMeta const *m,
+                             BatchConfig const *bc,
+                             GenericTensorAccessorR const &output_grad,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &weight);
 } // namespace RMSNorm
 } // namespace Kernels
 } // namespace FlexFlow
diff --git a/include/flexflow/ops/kernels/softmax_kernels.h b/include/flexflow/ops/kernels/softmax_kernels.h
index 8cfaf3c586..0b7f1090f6 100644
--- a/include/flexflow/ops/kernels/softmax_kernels.h
+++ b/include/flexflow/ops/kernels/softmax_kernels.h
@@ -23,20 +23,30 @@ class SoftmaxMeta : public OpMeta {
   bool profiling;
   bool inference_debugging;
   int dim;
-  DataType input_type, output_type;
 };
 
 namespace Kernels {
 namespace Softmax {
-template <typename DT>
+
 void forward_kernel_wrapper(SoftmaxMeta const *m,
-                            DT const *input_ptr,
-                            DT *output_ptr);
-template <typename DT>
+                            GenericTensorAccessorR const &input,
+                            GenericTensorAccessorW const &output);
+
 void backward_kernel_wrapper(SoftmaxMeta const *m,
-                             DT *input_grad_ptr,
-                             DT const *output_grad_ptr,
-                             size_t num_elements);
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &output_grad);
+
+void inference_kernel_wrapper(SoftmaxMeta const *m,
+                              BatchConfig const *bc,
+                              bool is_last_op,
+                              GenericTensorAccessorR const &input,
+                              GenericTensorAccessorW const &output,
+                              GenericTensorAccessorW const &output_grad);
+
+void peft_bwd_kernel_wrapper(SoftmaxMeta const *m,
+                             BatchConfig const *bc,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &output_grad);
 
 namespace Internal {
 template <typename DT>
@@ -46,10 +56,28 @@ void forward_kernel(SoftmaxMeta const *m,
                     ffStream_t stream);
 
 template <typename DT>
-void backward_kernel(DT *input_grad_ptr,
+void backward_kernel(SoftmaxMeta const *m,
+                     DT *input_grad_ptr,
                      DT const *output_grad_ptr,
                      size_t num_elements,
                      ffStream_t stream);
+
+template <typename DT>
+void inference_kernel(SoftmaxMeta const *m,
+                      BatchConfig const *bc,
+                      DT const *input_ptr,
+                      DT *output_ptr,
+                      int num_classes,
+                      ffStream_t stream);
+
+template <typename DT>
+void peft_bwd_kernel(SoftmaxMeta const *m,
+                     BatchConfig const *bc,
+                     DT *input_grad_ptr,
+                     DT const *output_grad_ptr,
+                     int num_classes,
+                     ffStream_t stream);
+
 } // namespace Internal
 } // namespace Softmax
 } // namespace Kernels
diff --git a/include/flexflow/ops/kernels/transpose_kernels.h b/include/flexflow/ops/kernels/transpose_kernels.h
index 7ff6163b30..a2c8ff0483 100644
--- a/include/flexflow/ops/kernels/transpose_kernels.h
+++ b/include/flexflow/ops/kernels/transpose_kernels.h
@@ -7,9 +7,11 @@
 
 namespace FlexFlow {
 
+class Transpose;
+
 class TransposeMeta : public OpMeta {
 public:
-  TransposeMeta(FFHandler handler) : OpMeta(handler){};
+  TransposeMeta(FFHandler handler, Transpose const *transpose);
   int num_dim;
   int perm[MAX_TENSOR_DIM];
 };
diff --git a/include/flexflow/ops/layer_norm.h b/include/flexflow/ops/layer_norm.h
index 9e48d81190..b5e9538ea6 100644
--- a/include/flexflow/ops/layer_norm.h
+++ b/include/flexflow/ops/layer_norm.h
@@ -37,6 +37,11 @@ class LayerNorm : public Op {
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
+  Legion::FutureMap peft_bwd(FFModel const &,
+                             BatchConfigFuture const &,
+                             std::vector<ParallelTensor> const &,
+                             std::vector<ParallelTensor> const &,
+                             MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
@@ -67,6 +72,10 @@ class LayerNorm : public Op {
                              std::vector<Legion::PhysicalRegion> const &regions,
                              Legion::Context ctx,
                              Legion::Runtime *runtime);
+  static void peft_bwd_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
   static void backward_task(Legion::Task const *task,
                             std::vector<Legion::PhysicalRegion> const &regions,
                             Legion::Context ctx,
@@ -81,11 +90,6 @@ class LayerNorm : public Op {
                              T const *gamma_ptr,
                              T const *beta_ptr,
                              ffStream_t stream);
-  static void forward_kernel_wrapper(LayerNormMeta const *m,
-                                     GenericTensorAccessorR const &input,
-                                     GenericTensorAccessorW &output,
-                                     GenericTensorAccessorR const &gamma,
-                                     GenericTensorAccessorR const &beta);
   template <typename T>
   static void backward_kernel(LayerNormMeta const *m,
                               T const *output_grad_ptr,
@@ -96,13 +100,34 @@ class LayerNorm : public Op {
                               T *beta_grad_ptr,
                               ffStream_t stream);
   template <typename T>
+  static void peft_bwd_kernel(LayerNormMeta const *m,
+                              T const *output_grad_ptr,
+                              T *input_grad_ptr,
+                              T const *gamma_ptr,
+                              ffStream_t stream);
+
+  static void forward_kernel_wrapper(LayerNormMeta const *m,
+                                     GenericTensorAccessorR const &input,
+                                     GenericTensorAccessorW &output,
+                                     GenericTensorAccessorR const &gamma,
+                                     GenericTensorAccessorR const &beta);
   static void backward_kernel_wrapper(LayerNormMeta const *m,
-                                      T const *output_grad_ptr,
-                                      T const *input_ptr,
-                                      T *input_grad_ptr,
-                                      T const *gamma_ptr,
-                                      T *gamma_grad_ptr,
-                                      T *beta_grad_ptr);
+                                      GenericTensorAccessorR const &output_grad,
+                                      GenericTensorAccessorR const &input,
+                                      GenericTensorAccessorW const &input_grad,
+                                      GenericTensorAccessorR const &gamma,
+                                      GenericTensorAccessorW const &gamma_grad,
+                                      GenericTensorAccessorW const &beta_grad);
+  static void inference_kernel_wrapper(LayerNormMeta *m,
+                                       BatchConfig const *bc,
+                                       GenericTensorAccessorR const &input,
+                                       GenericTensorAccessorW &output,
+                                       GenericTensorAccessorR const &gamma,
+                                       GenericTensorAccessorR const &beta);
+  static void peft_bwd_kernel_wrapper(LayerNormMeta const *m,
+                                      GenericTensorAccessorR const &output_grad,
+                                      GenericTensorAccessorW const &input_grad,
+                                      GenericTensorAccessorR const &gamma);
 
 public:
   bool elementwise_affine, use_bias;
@@ -124,6 +149,9 @@ class LayerNormMeta : public OpMeta {
   float eps;
   void *mean_ptr, *rstd_ptr, *ds_ptr, *db_ptr, *scale_ptr, *bias_ptr;
   Realm::RegionInstance reserveInst;
+  // PEFT related fields
+  void *input_activation;
+  size_t allocated_peft_buffer_size = 0;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/ops/linear.h b/include/flexflow/ops/linear.h
index a32df80537..ed2fad580f 100644
--- a/include/flexflow/ops/linear.h
+++ b/include/flexflow/ops/linear.h
@@ -52,6 +52,11 @@ class Linear : public Op {
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
+  Legion::FutureMap peft_bwd(FFModel const &,
+                             BatchConfigFuture const &,
+                             std::vector<ParallelTensor> const &,
+                             std::vector<ParallelTensor> const &,
+                             MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override;
   bool get_int_parameter(PMParameter, int *) const override;
   static Op *
@@ -66,6 +71,10 @@ class Linear : public Op {
                              std::vector<Legion::PhysicalRegion> const &regions,
                              Legion::Context ctx,
                              Legion::Runtime *runtime);
+  static void peft_bwd_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
   static void forward_task(Legion::Task const *task,
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
diff --git a/include/flexflow/ops/lora_linear.h b/include/flexflow/ops/lora_linear.h
new file mode 100644
index 0000000000..9e83c3f90e
--- /dev/null
+++ b/include/flexflow/ops/lora_linear.h
@@ -0,0 +1,99 @@
+#ifndef _FLEXFLOW_LORA_LINEAR_FIRST_H
+#define _FLEXFLOW_LORA_LINEAR_FIRST_H
+
+#include "flexflow/inference.h"
+#include "flexflow/node.h"
+#include "flexflow/operator.h"
+#include "flexflow/ops/lora_linear_params.h"
+#include "flexflow/utils/memory_allocator.h"
+
+namespace FlexFlow {
+
+class FFModel;
+class Layer;
+
+class LoraLinear : public Op {
+public:
+  using Params = LoraLinearParams;
+  using Input = std::pair<ParallelTensor, ParallelTensor>;
+
+  LoraLinear(
+      FFModel &model,
+      LayerID const &layer_guid,
+      OperatorType type,
+      ParallelTensor const input,
+      ParallelTensor const output,
+      std::unordered_map<PEFTModelID, LoraLinearConfig> const &_peft_configs,
+      char const *name = nullptr);
+  LoraLinear(FFModel &model,
+             LoraLinear const &other,
+             ParallelTensor const input,
+             ParallelTensor const output);
+  LoraLinear(FFModel &model,
+             Params const &params,
+             Input const &inputs,
+             char const *name = nullptr);
+
+  void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
+  void forward(FFModel const &) override;
+  void backward(FFModel const &) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfigFuture const &,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
+  Legion::FutureMap peft_bwd(FFModel const &,
+                             BatchConfigFuture const &,
+                             std::vector<ParallelTensor> const &,
+                             std::vector<ParallelTensor> const &,
+                             MachineView const *mv = nullptr) override;
+  void print_layer(FFModel const &model) override;
+  void map_output_tensors(FFModel &model) override;
+  static Op *
+      create_operator_from_layer(FFModel &model,
+                                 Layer const *layer,
+                                 std::vector<ParallelTensor> const &inputs);
+  static OpMeta *init_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
+  static void peft_bwd_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
+  static void forward_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static void backward_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
+  bool measure_operator_cost(Simulator *sim,
+                             MachineView const &pc,
+                             CostMetrics &cost_metrics) const override;
+  void serialize(Legion::Serializer &) const override;
+  static PCG::Node deserialize(FFModel &ff,
+                               Legion::Deserializer &d,
+                               ParallelTensor inputs[],
+                               int num_inputs);
+  Op *materialize(FFModel &ff,
+                  ParallelTensor inputs[],
+                  int num_inputs) const override;
+  // size_t get_params_hash() const override;
+  LoraLinearParams get_params() const;
+
+  std::unordered_map<PEFTModelID, LoraLinearConfig> peft_configs;
+};
+
+}; // namespace FlexFlow
+
+#endif // _FLEXLOW_LORA_LINEAR_FIRST_H
diff --git a/include/flexflow/ops/lora_linear_params.h b/include/flexflow/ops/lora_linear_params.h
new file mode 100644
index 0000000000..70539271f2
--- /dev/null
+++ b/include/flexflow/ops/lora_linear_params.h
@@ -0,0 +1,150 @@
+#ifndef _FLEXFLOW_LORA_LINEAR_PARAMS_H
+#define _FLEXFLOW_LORA_LINEAR_PARAMS_H
+
+#include "flexflow/ffconst.h"
+#include "flexflow/fftype.h"
+#include "flexflow/inference.h"
+#include "flexflow/op_meta.h"
+#include "flexflow/operator.h"
+#include "flexflow/parallel_tensor.h"
+#include <filesystem>
+#include <fstream>
+#include <iostream>
+#include <nlohmann/json.hpp>
+
+namespace FlexFlow {
+
+class LoraOptimizerConfig {
+public:
+  LoraOptimizerConfig();
+  virtual ~LoraOptimizerConfig() {}
+};
+
+class LoraSGDOptimizerConfig : public LoraOptimizerConfig {
+public:
+  LoraSGDOptimizerConfig();
+  LoraSGDOptimizerConfig(double lr_,
+                         double momentum_ = 0.0f,
+                         bool nesterov_ = false,
+                         bool weight_decay_ = 0.0f);
+  friend std::ostream &operator<<(std::ostream &os,
+                                  LoraSGDOptimizerConfig const &llc);
+
+  NLOHMANN_DEFINE_TYPE_INTRUSIVE(
+      LoraSGDOptimizerConfig, lr, momentum, nesterov, weight_decay)
+
+public:
+  double lr = 0.001f;
+  double momentum = 0.0f;
+  bool nesterov = false;
+  double weight_decay = 0.0f;
+};
+
+class LoraAdamOptimizerConfig : public LoraOptimizerConfig {
+public:
+  LoraAdamOptimizerConfig();
+  LoraAdamOptimizerConfig(double alpha_,
+                          double beta1_ = 0.9f,
+                          double beta2_ = 0.999f,
+                          double weight_decay_ = 0.0f,
+                          double epsilon_ = 1e-8);
+  friend std::ostream &operator<<(std::ostream &os,
+                                  LoraAdamOptimizerConfig const &llc);
+
+  NLOHMANN_DEFINE_TYPE_INTRUSIVE(
+      LoraAdamOptimizerConfig, alpha, beta1, beta2, weight_decay, epsilon)
+
+public:
+  // Adam
+  double alpha = 0.001f;
+  double beta1 = 0.9f;
+  double beta2 = 0.999f;
+  double weight_decay = 0.0f;
+  double epsilon = 1e-8;
+};
+
+// Serialization helpers
+template <typename T>
+void serialize_to_json_file(T const &obj, fs::path const &filepath);
+
+// Function to deserialize JSON from file and create object
+template <typename T>
+std::unique_ptr<T> deserialize_from_json_file(fs::path const &filepath);
+
+class LoraLinearConfig {
+public:
+  static const LoraLinearConfig EmptyConfig;
+  LoraLinearConfig(std::string const &cache_folder_,
+                   std::string const &peft_model_id_,
+                   bool trainable_ = false,
+                   LoraOptimizerConfig *optimizer_config_ = nullptr,
+                   bool init_lora_weights_ = false,
+                   std::string const &base_model_name_or_path_ = "",
+                   std::string const &precision_ = "fp16",
+                   int rank_ = 8,
+                   float lora_alpha_ = 8.0f,
+                   float lora_dropout_ = 0.0f,
+                   std::vector<std::string> const &target_modules_ = {});
+  // constructor used to support std::unordered_map
+  LoraLinearConfig();
+  friend bool operator==(LoraLinearConfig const &lhs,
+                         LoraLinearConfig const &rhs);
+  friend std::ostream &operator<<(std::ostream &os,
+                                  LoraLinearConfig const &llc);
+
+  NLOHMANN_DEFINE_TYPE_INTRUSIVE(LoraLinearConfig,
+                                 cache_folder,
+                                 peft_model_id,
+                                 rank,
+                                 lora_alpha,
+                                 lora_dropout,
+                                 target_modules,
+                                 trainable,
+                                 init_lora_weights,
+                                 base_model_name_or_path,
+                                 precision)
+
+  std::string cache_folder;
+  // Huggingface model ID (for download and/or upload)
+  std::string peft_model_id;
+  // Lora parameters
+  int rank;
+  float lora_alpha;
+  float lora_dropout;
+  std::vector<std::string> target_modules;
+  // Training parameters
+  // whether the weights are trainable (fine-tuning scenario) or not
+  // (inference-only). If set to true, allocate space for the gradients
+  bool trainable = false;
+  LoraOptimizerConfig *optimizer_config;
+  // whether to initialize weights randomly (instead of attempting to load them
+  // from file)
+  bool init_lora_weights;
+  // parameters only used to upload model after finetuning
+  std::string base_model_name_or_path;
+  std::string precision;
+};
+
+class LoraLinearParams {
+public:
+  LayerID layer_guid;
+  OperatorType type;
+  std::unordered_map<PEFTModelID, LoraLinearConfig> peft_configs;
+  char name[MAX_OPNAME];
+
+  bool is_valid(std::pair<ParallelTensorShape, ParallelTensorShape> const
+                    &input_shape) const;
+  friend bool operator==(LoraLinearParams const &lhs,
+                         LoraLinearParams const &rhs);
+};
+
+} // namespace FlexFlow
+
+namespace std {
+template <>
+struct hash<FlexFlow::LoraLinearParams> {
+  size_t operator()(FlexFlow::LoraLinearParams const &) const;
+};
+} // namespace std
+
+#endif // _FLEXFLOW_LORA_LINEAR_PARAMS_H
diff --git a/include/flexflow/ops/residual_layer_norm.h b/include/flexflow/ops/residual_layer_norm.h
index 0e9be82125..33a8e8be51 100644
--- a/include/flexflow/ops/residual_layer_norm.h
+++ b/include/flexflow/ops/residual_layer_norm.h
@@ -26,8 +26,10 @@ class ResidualLayerNorm : public Op {
                     bool _elementwise_affine,
                     bool _use_bias,
                     float _eps,
+                    bool inplace_residual,
                     bool allocate_weights,
                     char const *name);
+  void map_output_tensors(FFModel &ff) override;
   void init(FFModel const &) override;
   void init_inference(FFModel const &,
                       std::vector<ParallelTensor> const &,
@@ -40,6 +42,11 @@ class ResidualLayerNorm : public Op {
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
+  Legion::FutureMap peft_bwd(FFModel const &,
+                             BatchConfigFuture const &,
+                             std::vector<ParallelTensor> const &,
+                             std::vector<ParallelTensor> const &,
+                             MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
@@ -65,6 +72,14 @@ class ResidualLayerNorm : public Op {
                              std::vector<Legion::PhysicalRegion> const &regions,
                              Legion::Context ctx,
                              Legion::Runtime *runtime);
+  static void backward_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
+  static void peft_bwd_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
                              CostMetrics &cost_metrics) const override;
@@ -78,7 +93,8 @@ class ResidualLayerNorm : public Op {
                                T const *gamma_ptr,
                                T const *beta_ptr,
                                ffStream_t stream);
-  static void inference_kernel_wrapper(ResidualLayerNormMeta const *m,
+  static void inference_kernel_wrapper(ResidualLayerNormMeta *m,
+                                       BatchConfig const *bc,
                                        GenericTensorAccessorR const &input,
                                        GenericTensorAccessorR const &residual1,
                                        GenericTensorAccessorR const &residual2,
@@ -86,11 +102,30 @@ class ResidualLayerNorm : public Op {
                                        GenericTensorAccessorW &output,
                                        GenericTensorAccessorR const &gamma,
                                        GenericTensorAccessorR const &beta);
+  static void
+      backward_kernel_wrapper(ResidualLayerNormMeta const *m,
+                              GenericTensorAccessorR const &output_grad,
+                              GenericTensorAccessorR const &added_output,
+                              GenericTensorAccessorW const &input_grad,
+                              GenericTensorAccessorW const &residual1_grad,
+                              GenericTensorAccessorW const &residual2_grad,
+                              GenericTensorAccessorR const &gamma,
+                              GenericTensorAccessorW const &gamma_grad,
+                              GenericTensorAccessorW const &beta_grad);
+
+  static void
+      peft_bwd_kernel_wrapper(ResidualLayerNormMeta const *m,
+                              GenericTensorAccessorR const &output_grad,
+                              GenericTensorAccessorW const &input_grad,
+                              GenericTensorAccessorW const &residual1_grad,
+                              GenericTensorAccessorW const &residual2_grad,
+                              GenericTensorAccessorR const &gamma);
 
 public:
   bool elementwise_affine, use_bias, use_two_residuals;
   int64_t effective_batch_size, effective_num_elements;
   float eps;
+  bool inplace_residual;
   std::vector<int> axes;
 };
 
@@ -105,8 +140,12 @@ class ResidualLayerNormMeta : public OpMeta {
   bool elementwise_affine, use_bias, use_two_residuals;
   int64_t effective_batch_size, effective_num_elements;
   float eps;
+  bool inplace_residual;
   void *mean_ptr, *rstd_ptr, *ds_ptr, *db_ptr, *scale_ptr, *bias_ptr;
   Realm::RegionInstance reserveInst;
+  // PEFT related fields
+  void *input_activation;
+  size_t allocated_peft_buffer_size = 0;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/ops/residual_layer_norm_params.h b/include/flexflow/ops/residual_layer_norm_params.h
index 949ae0c799..166d4b2b4e 100644
--- a/include/flexflow/ops/residual_layer_norm_params.h
+++ b/include/flexflow/ops/residual_layer_norm_params.h
@@ -13,6 +13,7 @@ struct ResidualLayerNormParams {
   float eps;
   bool use_bias;
   bool use_two_residuals;
+  bool inplace_residual;
   char name[MAX_OPNAME];
   bool is_valid(std::tuple<ParallelTensorShape,
                            ParallelTensorShape,
diff --git a/include/flexflow/ops/residual_rms_norm.h b/include/flexflow/ops/residual_rms_norm.h
index 0d92a236e8..bf75cd573a 100644
--- a/include/flexflow/ops/residual_rms_norm.h
+++ b/include/flexflow/ops/residual_rms_norm.h
@@ -20,6 +20,7 @@ class ResidualRMSNorm : public Op {
                   const ParallelTensor _input2,
                   float _eps,
                   int dim,
+                  bool inplace_residual,
                   bool allocate_weights,
                   char const *name);
   ResidualRMSNorm(FFModel &model,
@@ -32,6 +33,7 @@ class ResidualRMSNorm : public Op {
                   ResidualRMSNorm const &other,
                   Input const &inputs,
                   bool allocate_weights);
+  void map_output_tensors(FFModel &ff) override;
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
@@ -44,6 +46,11 @@ class ResidualRMSNorm : public Op {
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
+  Legion::FutureMap peft_bwd(FFModel const &,
+                             BatchConfigFuture const &,
+                             std::vector<ParallelTensor> const &,
+                             std::vector<ParallelTensor> const &,
+                             MachineView const *mv = nullptr) override;
   void print_layer(FFModel const &model) override {
     assert(0);
   }
@@ -74,6 +81,14 @@ class ResidualRMSNorm : public Op {
                              std::vector<Legion::PhysicalRegion> const &regions,
                              Legion::Context ctx,
                              Legion::Runtime *runtime);
+  static void backward_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
+  static void peft_bwd_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
                              CostMetrics &cost_metrics) const override;
@@ -82,6 +97,7 @@ class ResidualRMSNorm : public Op {
   float eps;
   int effective_batch_size;
   int dim, data_dim;
+  bool inplace_residual;
 };
 } // namespace FlexFlow
 #endif // _FLEXFLOW_RESIDUAL_RMS_NORM_H
diff --git a/include/flexflow/ops/residual_rms_norm_params.h b/include/flexflow/ops/residual_rms_norm_params.h
index a4e4de59ab..8b8f666dc1 100644
--- a/include/flexflow/ops/residual_rms_norm_params.h
+++ b/include/flexflow/ops/residual_rms_norm_params.h
@@ -11,6 +11,7 @@ struct ResidualRMSNormParams {
   LayerID layer_guid;
   float eps;
   int dim;
+  bool inplace_residual;
   char name[MAX_OPNAME];
   bool is_valid(
       std::pair<ParallelTensorShape, ParallelTensorShape> const &input) const;
diff --git a/include/flexflow/ops/rms_norm.h b/include/flexflow/ops/rms_norm.h
index 1dc940ebd3..384404d8a0 100644
--- a/include/flexflow/ops/rms_norm.h
+++ b/include/flexflow/ops/rms_norm.h
@@ -34,6 +34,11 @@ class RMSNorm : public Op {
   void init(FFModel const &) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
+  Legion::FutureMap peft_bwd(FFModel const &ff,
+                             BatchConfigFuture const &bc,
+                             std::vector<ParallelTensor> const &batch_inputs,
+                             std::vector<ParallelTensor> const &batch_outputs,
+                             MachineView const *mv) override;
   void init_inference(FFModel const &,
                       std::vector<ParallelTensor> const &,
                       std::vector<ParallelTensor> const &,
@@ -73,6 +78,14 @@ class RMSNorm : public Op {
                              std::vector<Legion::PhysicalRegion> const &regions,
                              Legion::Context ctx,
                              Legion::Runtime *runtime);
+  static void backward_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
+  static void peft_bwd_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
                              CostMetrics &cost_metrics) const override;
diff --git a/include/flexflow/ops/sigmoid_silu_multi.h b/include/flexflow/ops/sigmoid_silu_multi.h
index 604438260a..ac60ff15dd 100644
--- a/include/flexflow/ops/sigmoid_silu_multi.h
+++ b/include/flexflow/ops/sigmoid_silu_multi.h
@@ -1,5 +1,6 @@
 #pragma once
 
+#include "flexflow/batch_config.h"
 #include "flexflow/inference.h"
 #include "flexflow/model.h"
 #include "flexflow/utils/memory_allocator.h"
@@ -27,6 +28,11 @@ class SigmoidSiluMulti : public Op {
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
   void backward(FFModel const &) override;
+  Legion::FutureMap peft_bwd(FFModel const &,
+                             BatchConfigFuture const &,
+                             std::vector<ParallelTensor> const &,
+                             std::vector<ParallelTensor> const &,
+                             MachineView const *mv = nullptr) override;
   Legion::FutureMap inference(FFModel const &,
                               BatchConfigFuture const &,
                               std::vector<ParallelTensor> const &,
@@ -55,6 +61,14 @@ class SigmoidSiluMulti : public Op {
                              std::vector<Legion::PhysicalRegion> const &regions,
                              Legion::Context ctx,
                              Legion::Runtime *runtime);
+  static void backward_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
+  static void peft_bwd_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
                              CostMetrics &cost_metrics) const override;
@@ -65,10 +79,24 @@ class SigmoidSiluMulti : public Op {
                                T const *input2_ptr,
                                T *output_ptr,
                                ffStream_t stream);
-  static void inference_kernel_wrapper(SigmoidSiluMultiMeta const *m,
+  static void inference_kernel_wrapper(SigmoidSiluMultiMeta *m,
+                                       BatchConfig const *bc,
                                        GenericTensorAccessorR const &input1,
                                        GenericTensorAccessorR const &input2,
                                        GenericTensorAccessorW const &output);
+  static void
+      backward_kernel_wrapper(SigmoidSiluMultiMeta const *m,
+                              GenericTensorAccessorR const &output_grad,
+                              GenericTensorAccessorR const &input1,
+                              GenericTensorAccessorR const &input2,
+                              GenericTensorAccessorW const &input1_grad,
+                              GenericTensorAccessorW const &input2_grad);
+  static void
+      peft_bwd_kernel_wrapper(SigmoidSiluMultiMeta const *m,
+                              BatchConfig const *bc,
+                              GenericTensorAccessorR const &output_grad,
+                              GenericTensorAccessorW const &input1_grad,
+                              GenericTensorAccessorW const &input2_grad);
 };
 
 class SigmoidSiluMultiMeta : public OpMeta {
@@ -80,6 +108,9 @@ class SigmoidSiluMultiMeta : public OpMeta {
 
 public:
   Realm::RegionInstance reserveInst;
+  // PEFT related fields
+  void *input_activation;
+  size_t allocated_peft_buffer_size = 0;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/ops/softmax.h b/include/flexflow/ops/softmax.h
index 61094f7361..82aff53766 100644
--- a/include/flexflow/ops/softmax.h
+++ b/include/flexflow/ops/softmax.h
@@ -33,6 +33,11 @@ class Softmax : public Op {
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
+  Legion::FutureMap peft_bwd(FFModel const &,
+                             BatchConfigFuture const &,
+                             std::vector<ParallelTensor> const &,
+                             std::vector<ParallelTensor> const &,
+                             MachineView const *mv = nullptr) override;
   void backward(FFModel const &) override;
   bool get_int_parameter(PMParameter, int *) const override;
   void print_layer(FFModel const &model) override {
@@ -58,6 +63,10 @@ class Softmax : public Op {
                              std::vector<Legion::PhysicalRegion> const &regions,
                              Legion::Context ctx,
                              Legion::Runtime *runtime);
+  static void peft_bwd_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
                              CostMetrics &cost_metrics) const override;
diff --git a/include/flexflow/ops/topk.h b/include/flexflow/ops/topk.h
index 47144bf6d7..4b67692032 100644
--- a/include/flexflow/ops/topk.h
+++ b/include/flexflow/ops/topk.h
@@ -8,9 +8,11 @@
 
 namespace FlexFlow {
 
+class TopK;
+
 class TopKMeta : public OpMeta {
 public:
-  TopKMeta(FFHandler handle);
+  TopKMeta(FFHandler handle, TopK const *topk);
   bool sorted;
 };
 
diff --git a/include/flexflow/ops/transpose.h b/include/flexflow/ops/transpose.h
index 3e6fb575c0..bca0b83460 100644
--- a/include/flexflow/ops/transpose.h
+++ b/include/flexflow/ops/transpose.h
@@ -6,6 +6,8 @@
 
 namespace FlexFlow {
 
+class TransposeMeta;
+
 class Transpose : public Op {
 public:
   using Params = TransposeParams;
diff --git a/include/flexflow/ops/tree_inc_multihead_self_attention.h b/include/flexflow/ops/tree_inc_multihead_self_attention.h
index 02df0c0137..168ad5f618 100644
--- a/include/flexflow/ops/tree_inc_multihead_self_attention.h
+++ b/include/flexflow/ops/tree_inc_multihead_self_attention.h
@@ -144,7 +144,7 @@ class TreeIncMultiHeadSelfAttentionMeta : public IncMultiHeadSelfAttentionMeta {
   ~TreeIncMultiHeadSelfAttentionMeta(void);
 
 public:
-  int num_active_tokens;
+  int num_active_infr_tokens;
   Realm::RegionInstance committed_token_reserve_inst;
   TreeVerifyBatchConfig::CommittedTokensInfo *committed_token_infos;
   bool *request_completed;
diff --git a/include/flexflow/parallel_ops/allreduce.h b/include/flexflow/parallel_ops/allreduce.h
index 045f9b36a0..7e0e4362e2 100644
--- a/include/flexflow/parallel_ops/allreduce.h
+++ b/include/flexflow/parallel_ops/allreduce.h
@@ -34,12 +34,17 @@ class AllReduce : public ParallelOp {
                       std::vector<ParallelTensor> const &,
                       MachineView const *mv = nullptr) override;
   void forward(FFModel const &) override;
+  void backward(FFModel const &) override;
   Legion::FutureMap inference(FFModel const &,
                               BatchConfigFuture const &bc,
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
-  void backward(FFModel const &) override;
+  Legion::FutureMap peft_bwd(FFModel const &,
+                             BatchConfigFuture const &bc,
+                             std::vector<ParallelTensor> const &,
+                             std::vector<ParallelTensor> const &,
+                             MachineView const *mv = nullptr) override;
   bool get_int_parameter(PMParameter, int *) const override;
   bool append_parallel_op_info(
       std::vector<ParallelOpInfo> &parallel_ops) const override;
@@ -47,10 +52,6 @@ class AllReduce : public ParallelOp {
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
                            Legion::Runtime *runtime);
-  static void inference_task(Legion::Task const *task,
-                             std::vector<Legion::PhysicalRegion> const &regions,
-                             Legion::Context ctx,
-                             Legion::Runtime *runtime);
   static void forward_task(Legion::Task const *task,
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
@@ -59,6 +60,14 @@ class AllReduce : public ParallelOp {
                             std::vector<Legion::PhysicalRegion> const &regions,
                             Legion::Context ctx,
                             Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
+  static void peft_bwd_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
   bool measure_operator_cost(Simulator *sim,
                              MachineView const &pc,
                              CostMetrics &cost_metrics) const override;
diff --git a/include/flexflow/parallel_ops/combine.h b/include/flexflow/parallel_ops/combine.h
index 2e4fdb86a9..1db776f59d 100644
--- a/include/flexflow/parallel_ops/combine.h
+++ b/include/flexflow/parallel_ops/combine.h
@@ -40,6 +40,11 @@ class Combine : public ParallelOp {
                               std::vector<ParallelTensor> const &,
                               std::vector<ParallelTensor> const &,
                               MachineView const *mv = nullptr) override;
+  Legion::FutureMap peft_bwd(FFModel const &,
+                             BatchConfigFuture const &bc,
+                             std::vector<ParallelTensor> const &,
+                             std::vector<ParallelTensor> const &,
+                             MachineView const *mv = nullptr) override;
   void backward(FFModel const &) override;
   bool get_int_parameter(PMParameter, int *) const override;
   bool append_parallel_op_info(
@@ -52,10 +57,18 @@ class Combine : public ParallelOp {
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
                            Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
   static void backward_task(Legion::Task const *task,
                             std::vector<Legion::PhysicalRegion> const &regions,
                             Legion::Context ctx,
                             Legion::Runtime *runtime);
+  static void peft_bwd_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
   template <typename T>
   static void
       forward_task_with_type(Legion::Task const *task,
diff --git a/include/flexflow/parallel_ops/kernels/allreduce_kernels.h b/include/flexflow/parallel_ops/kernels/allreduce_kernels.h
index bdf7aae501..a4ccbee8a5 100644
--- a/include/flexflow/parallel_ops/kernels/allreduce_kernels.h
+++ b/include/flexflow/parallel_ops/kernels/allreduce_kernels.h
@@ -17,11 +17,6 @@ class AllReduceMeta : public OpMeta {
 namespace Kernels {
 namespace AllReduce {
 
-void inference_kernel_wrapper(AllReduceMeta const *m,
-                              BatchConfig const *bc,
-                              GenericTensorAccessorR const &input,
-                              GenericTensorAccessorW const &output);
-
 void forward_kernel_wrapper(AllReduceMeta const *m,
                             GenericTensorAccessorR const &input,
                             GenericTensorAccessorW const &output);
@@ -30,6 +25,15 @@ void backward_kernel_wrapper(AllReduceMeta const *m,
                              GenericTensorAccessorW const &input_grad,
                              GenericTensorAccessorR const &output_grad);
 
+void inference_kernel_wrapper(AllReduceMeta const *m,
+                              BatchConfig const *bc,
+                              GenericTensorAccessorR const &input,
+                              GenericTensorAccessorW const &output);
+
+void peft_bwd_kernel_wrapper(AllReduceMeta const *m,
+                             BatchConfig const *bc,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &output_grad);
 } // namespace AllReduce
 } // namespace Kernels
 } // namespace FlexFlow
diff --git a/include/flexflow/parallel_ops/kernels/combine_kernels.h b/include/flexflow/parallel_ops/kernels/combine_kernels.h
index 456013cd81..4b2227b178 100644
--- a/include/flexflow/parallel_ops/kernels/combine_kernels.h
+++ b/include/flexflow/parallel_ops/kernels/combine_kernels.h
@@ -8,9 +8,11 @@
 
 namespace FlexFlow {
 
+class Combine;
+
 class CombineMeta : public OpMeta {
 public:
-  CombineMeta(FFHandler handle);
+  CombineMeta(FFHandler handle, Combine const *comb);
   DataType data_type;
 };
 
diff --git a/include/flexflow/parallel_ops/kernels/parallel_identity_kernels.h b/include/flexflow/parallel_ops/kernels/parallel_identity_kernels.h
new file mode 100644
index 0000000000..fd6778a37f
--- /dev/null
+++ b/include/flexflow/parallel_ops/kernels/parallel_identity_kernels.h
@@ -0,0 +1,41 @@
+#ifndef _FLEXFLOW_OPS_KERNELS_PARALLEL_IDENTITY_KERNELS_H
+#define _FLEXFLOW_OPS_KERNELS_PARALLEL_IDENTITY_KERNELS_H
+
+#include "flexflow/batch_config.h"
+#include "flexflow/device.h"
+#include "flexflow/fftype.h"
+#include "flexflow/op_meta.h"
+#include "flexflow/parallel_ops/parallel_identity.h"
+
+namespace FlexFlow {
+
+class ParallelIdentityMeta : public OpMeta {
+public:
+  ParallelIdentityMeta(FFHandler handle, ParallelIdentity const *reduct);
+};
+
+namespace Kernels {
+namespace ParallelIdentity {
+
+void forward_kernel_wrapper(ParallelIdentityMeta const *m,
+                            GenericTensorAccessorR const &input,
+                            GenericTensorAccessorW const &output);
+
+void backward_kernel_wrapper(ParallelIdentityMeta const *m,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &output_grad);
+
+void inference_kernel_wrapper(ParallelIdentityMeta const *m,
+                              BatchConfig const *bc,
+                              GenericTensorAccessorR const &input,
+                              GenericTensorAccessorW const &output);
+
+void peft_bwd_kernel_wrapper(ParallelIdentityMeta const *m,
+                             BatchConfig const *bc,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &output_grad);
+} // namespace ParallelIdentity
+} // namespace Kernels
+} // namespace FlexFlow
+
+#endif // _FLEXFLOW_OPS_KERNELS_PARALLEL_IDENTITY_KERNELS_H
diff --git a/include/flexflow/parallel_ops/kernels/partition_kernels.h b/include/flexflow/parallel_ops/kernels/partition_kernels.h
index 81b190603a..1e77090d11 100644
--- a/include/flexflow/parallel_ops/kernels/partition_kernels.h
+++ b/include/flexflow/parallel_ops/kernels/partition_kernels.h
@@ -7,9 +7,11 @@
 
 namespace FlexFlow {
 
+class Repartition;
+
 class RepartitionMeta : public OpMeta {
 public:
-  RepartitionMeta(FFHandler handle);
+  RepartitionMeta(FFHandler handle, Repartition const *repart);
   DataType data_type;
 };
 
diff --git a/include/flexflow/parallel_ops/parallel_identity.h b/include/flexflow/parallel_ops/parallel_identity.h
new file mode 100644
index 0000000000..b3ca789f08
--- /dev/null
+++ b/include/flexflow/parallel_ops/parallel_identity.h
@@ -0,0 +1,83 @@
+#ifndef _FLEXFLOW_PARALLEL_IDENTITY_H
+#define _FLEXFLOW_PARALLEL_IDENTITY_H
+
+#include "flexflow/layer.h"
+#include "flexflow/node.h"
+#include "flexflow/op_meta.h"
+#include "flexflow/operator.h"
+#include "flexflow/parallel_ops/parallel_identity_params.h"
+#include "parallel_op.h"
+
+namespace FlexFlow {
+
+class ParallelIdentity : public ParallelOp {
+public:
+  using Params = ParallelIdentityParams;
+  using Input = ParallelTensor;
+
+  ParallelIdentity(FFModel &model,
+                   const ParallelTensor input,
+                   int parallel_identity_legion_dim,
+                   char const *name = NULL);
+  ParallelIdentity(FFModel &model,
+                   Params const &params,
+                   Input const input,
+                   char const *name = nullptr);
+  void create_input_partition(FFModel &model) override;
+  void create_input_partition_inference(
+      FFModel &model,
+      std::vector<ParallelTensor> const &batch_inputs,
+      std::vector<ParallelTensor> const &batch_outputs) override;
+  void init(FFModel const &) override;
+  void init_inference(FFModel const &,
+                      std::vector<ParallelTensor> const &,
+                      std::vector<ParallelTensor> const &,
+                      MachineView const *mv = nullptr) override;
+  void forward(FFModel const &) override;
+  void backward(FFModel const &) override;
+  Legion::FutureMap inference(FFModel const &,
+                              BatchConfigFuture const &bc,
+                              std::vector<ParallelTensor> const &,
+                              std::vector<ParallelTensor> const &,
+                              MachineView const *mv = nullptr) override;
+  Legion::FutureMap peft_bwd(FFModel const &,
+                             BatchConfigFuture const &bc,
+                             std::vector<ParallelTensor> const &,
+                             std::vector<ParallelTensor> const &,
+                             MachineView const *mv = nullptr) override;
+  bool get_int_parameter(PMParameter, int *) const override;
+  bool append_parallel_op_info(
+      std::vector<ParallelOpInfo> &parallel_ops) const override;
+  static OpMeta *init_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static void forward_task(Legion::Task const *task,
+                           std::vector<Legion::PhysicalRegion> const &regions,
+                           Legion::Context ctx,
+                           Legion::Runtime *runtime);
+  static void backward_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
+  static void inference_task(Legion::Task const *task,
+                             std::vector<Legion::PhysicalRegion> const &regions,
+                             Legion::Context ctx,
+                             Legion::Runtime *runtime);
+  static void peft_bwd_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
+  bool measure_operator_cost(Simulator *sim,
+                             MachineView const &pc,
+                             CostMetrics &cost_metrics) const override;
+
+  Params get_params() const;
+
+public:
+  int parallel_identity_dim;
+};
+
+}; // namespace FlexFlow
+
+#endif // _FLEXFLOW_PARALLEL_IDENTITY_H
diff --git a/include/flexflow/parallel_ops/parallel_identity_params.h b/include/flexflow/parallel_ops/parallel_identity_params.h
new file mode 100644
index 0000000000..6eeed662ec
--- /dev/null
+++ b/include/flexflow/parallel_ops/parallel_identity_params.h
@@ -0,0 +1,22 @@
+#ifndef _FLEXFLOW_PARALLEL_IDENTITY_PARAMS_H
+#define _FLEXFLOW_PARALLEL_IDENTITY_PARAMS_H
+
+namespace FlexFlow {
+
+struct ParallelIdentityParams {
+  int parallel_identity_legion_dim;
+  char name[MAX_OPNAME];
+  bool is_valid(ParallelTensorShape const &) const;
+};
+bool operator==(ParallelIdentityParams const &, ParallelIdentityParams const &);
+
+} // namespace FlexFlow
+
+namespace std {
+template <>
+struct hash<FlexFlow::ParallelIdentityParams> {
+  size_t operator()(FlexFlow::ParallelIdentityParams const &) const;
+};
+} // namespace std
+
+#endif // _FLEXFLOW_PARALLEL_IDENTITY_PARAMS_H
diff --git a/include/flexflow/parallel_ops/parallel_op.h b/include/flexflow/parallel_ops/parallel_op.h
index 0bf573996c..39324c2a51 100644
--- a/include/flexflow/parallel_ops/parallel_op.h
+++ b/include/flexflow/parallel_ops/parallel_op.h
@@ -41,7 +41,7 @@ class ParallelOp : public Op {
 public:
   Legion::LogicalPartition input_lp, output_grad_lp;
   std::unordered_map<ParallelTensor, Legion::LogicalPartition>
-      inference_input_lps;
+      inference_input_lps, inference_output_grad_lps;
 };
 
 }; // namespace FlexFlow
diff --git a/include/flexflow/parallel_ops/replicate.h b/include/flexflow/parallel_ops/replicate.h
index 65d69d8564..c27616634f 100644
--- a/include/flexflow/parallel_ops/replicate.h
+++ b/include/flexflow/parallel_ops/replicate.h
@@ -54,10 +54,19 @@ class Replicate : public ParallelOp {
                            std::vector<Legion::PhysicalRegion> const &regions,
                            Legion::Context ctx,
                            Legion::Runtime *runtime);
+  Legion::FutureMap peft_bwd(FFModel const &,
+                             BatchConfigFuture const &bc,
+                             std::vector<ParallelTensor> const &,
+                             std::vector<ParallelTensor> const &,
+                             MachineView const *mv = nullptr) override;
   static void backward_task(Legion::Task const *task,
                             std::vector<Legion::PhysicalRegion> const &regions,
                             Legion::Context ctx,
                             Legion::Runtime *runtime);
+  static void peft_bwd_task(Legion::Task const *task,
+                            std::vector<Legion::PhysicalRegion> const &regions,
+                            Legion::Context ctx,
+                            Legion::Runtime *runtime);
   static void forward_kernel_wrapper(ReplicateMeta const *m,
                                      GenericTensorAccessorR const &input,
                                      GenericTensorAccessorW const &output,
diff --git a/include/flexflow/request_manager.h b/include/flexflow/request_manager.h
index a38a3b2671..f0fab957ee 100644
--- a/include/flexflow/request_manager.h
+++ b/include/flexflow/request_manager.h
@@ -39,6 +39,7 @@ class InferenceManager {
   Legion::FutureMap inference(FFModel *model, int index, BatchConfig const &bc);
   Legion::FutureMap
       inference(FFModel *model, int index, BatchConfigFuture const &bc);
+  void peft_bwd(FFModel *model, int index, BatchConfigFuture const &bc);
   void load_input_tokens_from_batch_config(FFModel *model,
                                            BatchConfigFuture const &bc,
                                            ParallelTensor const input,
@@ -65,15 +66,34 @@ struct Request {
     FINISHING = 104, // finishing request, but not yet verified
   };
   BatchConfig::RequestGuid guid;
-  int max_sequence_length;
+  PEFTModelID peft_model_id = PEFTModelID::NO_ID;
+  int max_sequence_length = 128;
   int initial_len;
   int ssm_cache_size = 0;
   int llm_cache_size = 0;
 
   Status status = PENDING;
   std::vector<BatchConfig::TokenId> tokens;
-
+  std::string prompt;
   std::vector<struct BeamTree> beam_trees;
+  // PEFT field
+  RequestType req_type = REQ_INFERENCE;
+  size_t processed_finetuning_tokens = 0;
+  int completed_training_steps = 0;
+  int dataset_entry_processed_tokens = 0;
+  int max_training_steps = 1;
+  // how many gradient accumulation steps to do before updating the weights. if
+  // left as -1, it will be set to the number of entries in the dataset
+  int gradient_accumulation_steps = -1;
+  int benchmarking_tokens = -1;
+  std::vector<int> finetuning_tokens_per_batch;
+  bool warmup = false;
+  std::string dataset_filepath;
+  std::vector<std::pair<std::vector<BatchConfig::TokenId>,
+                        std::vector<BatchConfig::TokenId>>>
+      dataset;
+  std::vector<float> finetuning_losses;
+  friend std::ostream &operator<<(std::ostream &os, Request const &req);
 };
 
 // store the result of beam search
@@ -120,6 +140,8 @@ class RequestManager {
   void set_max_sequence_length(int max_seq_length);
   void push_spec_infer_tree_width(int tree_width);
   int get_max_sequence_length();
+  void set_enable_peft_finetuning(bool enable_peft_finetuning_);
+  static void set_inference_finished(bool finished = true);
   int register_ssm_model(FFModel *model);
   void register_tokenizer(ModelType model_type,
                           int bos_token_id,
@@ -143,10 +165,9 @@ class RequestManager {
   void serve_incr_decoding(FFModel *model);
   void serve_spec_infer(FFModel *model);
   GenerationResult get_generation_result(RequestGuid const &guid);
-  RequestGuid register_new_request(std::string const &prompt,
-                                   int max_sequence_length);
-  RequestGuid register_new_request(std::vector<TokenId> const &prompt,
-                                   int max_sequence_length);
+  RequestGuid register_new_request(Request const &request_);
+  RequestGuid register_new_peft_request(Request const &request_);
+
   // Methods to start and terminate request manager's background task
   void start_background_server(FFModel *model);
   bool is_background_server_terminated();
@@ -156,6 +177,8 @@ class RequestManager {
   bool is_request_completed(RequestGuid const &guid);
   void trigger_request_completion_future(RequestGuid const &guid);
   // Methods for preparing next batches
+  bool check_inf_req_completion(BatchConfig const &old_bc, int i);
+  void check_batch(BatchConfig const &old_bc, BatchConfig const &new_bc);
   BatchConfig prepare_next_batch(BatchConfig const &bc,
                                  InferenceResult const &result);
   BatchConfigFuture prepare_next_batch(BatchConfigFuture const &bc,
@@ -265,6 +288,10 @@ class RequestManager {
   int max_sequence_length;
   Status request_manager_status;
 
+  // peft benchmarking
+  bool enable_peft_finetuning = false;
+  static bool inference_finished;
+
   // tree width in each speculative step, if not specified 1
   std::vector<int> spec_infer_tree_width;
 
@@ -275,7 +302,8 @@ class RequestManager {
   int bos_token_id;
   int eos_token_id;
   std::string output_filepath;
-  std::queue<Request> pending_request_queue;
+  std::queue<Request> pending_infr_request_queue;
+  std::queue<Request> pending_peft_request_queue;
   std::unordered_map<RequestGuid, Request> all_requests;
   std::unordered_map<RequestGuid, GenerationResult> request_generation_results;
   std::mutex request_queue_mutex;
@@ -304,6 +332,8 @@ class RequestManager {
     int llm_decoding_steps;
     int ssm_decoding_steps;
     double start_time, finish_time;
+    double registration_time, first_token_time;
+    bool first_token_time_set = false;
   };
   std::unordered_map<RequestGuid, ProfileInfo> profiling_requests;
   double total_request_run_time;
diff --git a/include/flexflow/simulator.h b/include/flexflow/simulator.h
index e410f66325..6cda96aa8b 100644
--- a/include/flexflow/simulator.h
+++ b/include/flexflow/simulator.h
@@ -33,21 +33,21 @@ namespace FlexFlow {
 
 #define MOD(a, b) ((a) % (b)) < 0 ? ((a) % (b)) + (b) : ((a) % (b))
 
-class Conv2DMeta;
-class LinearMeta;
-class Pool2DMeta;
-class ElementUnaryMeta;
-class ElementBinaryMeta;
-class LayerNormMeta;
-// class EmbeddingMeta;
-// class SoftmaxMeta;
-class BatchMatmulMeta;
-// class BatchNormMeta;
-class ConcatMeta;
-// class DropoutMeta;
-class TransposeMeta;
-class Op;
-class FFModel;
+// class Conv2DMeta;
+// class LinearMeta;
+// class Pool2DMeta;
+// class ElementUnaryMeta;
+// class ElementBinaryMeta;
+// class LayerNormMeta;
+//  class EmbeddingMeta;
+//  class SoftmaxMeta;
+// class BatchMatmulMeta;
+//  class BatchNormMeta;
+// class ConcatMeta;
+//  class DropoutMeta;
+// class TransposeMeta;
+// class Op;
+// class FFModel;
 
 /**
  * @brief Costs of an operator.
@@ -751,19 +751,19 @@ class Simulator {
       strict_hash_to_operator_cost;
 
 public:
-  Conv2DMeta *conv2d_meta;
-  LinearMeta *linear_meta;
-  Pool2DMeta *pool2d_meta;
-  ElementUnaryMeta *ele_unary_meta;
-  LayerNormMeta *layernorm_meta;
-  // ElementBinaryMeta *ele_binary_meta;
-  // EmbeddingMeta *embedding_meta;
-  // SoftmaxMeta *softmax_meta;
-  BatchMatmulMeta *batch_matmul_meta;
-  // BatchNormMeta *batch_norm_meta;
-  ConcatMeta *concat_meta;
-  // DropoutMeta *dropout_meta;
-  TransposeMeta *transpose_meta;
+  // Conv2DMeta *conv2d_meta;
+  // LinearMeta *linear_meta;
+  // Pool2DMeta *pool2d_meta;
+  // ElementUnaryMeta *ele_unary_meta;
+  // LayerNormMeta *layernorm_meta;
+  //  ElementBinaryMeta *ele_binary_meta;
+  //  EmbeddingMeta *embedding_meta;
+  //  SoftmaxMeta *softmax_meta;
+  // BatchMatmulMeta *batch_matmul_meta;
+  //  BatchNormMeta *batch_norm_meta;
+  // ConcatMeta *concat_meta;
+  //  DropoutMeta *dropout_meta;
+  // TransposeMeta *transpose_meta;
   int segment_size;
   int max_num_segments; // simulation could be slow if the number of segments
                         // are too large
diff --git a/include/flexflow/utils/cuda_helper.h b/include/flexflow/utils/cuda_helper.h
index f8bf67b3e1..486a65eb3d 100644
--- a/include/flexflow/utils/cuda_helper.h
+++ b/include/flexflow/utils/cuda_helper.h
@@ -75,8 +75,8 @@ inline int GET_BLOCKS(int const N) {
   return (ret > BLOCK_SIZE_LIMIT) ? BLOCK_SIZE_LIMIT : ret;
 }
 
-__global__ void
-    scale_kernel(float *ptr, Legion::coord_t size, float a, float b);
+template <typename DT>
+__global__ void scale_kernel(DT *ptr, Legion::coord_t size, DT a, DT b);
 
 __global__ void ones_kernel(float *ptr, Legion::coord_t size);
 
@@ -156,10 +156,13 @@ template <typename T>
 void save_tensor(T const *ptr, size_t num_elements, char const *file_name);
 
 template <typename T>
-T *download_tensor(T const *ptr, size_t num_elements);
+T *copy_tensor_dev_to_host(T const *ptr, size_t num_elements);
+
+template <typename T>
+void copy_tensor_dev_to_host(T const *ptr, T *dst, size_t num_elements);
 
 template <typename T>
-bool download_tensor(T const *ptr, T *dst, size_t num_elements);
+void copy_tensor_host_to_dev(T *dst, T const *src, size_t num_elements);
 
 cudnnStatus_t cudnnSetTensorDescriptorFromDomain(cudnnTensorDescriptor_t tensor,
                                                  Legion::Domain domain,
@@ -179,3 +182,5 @@ ncclDataType_t ff_to_nccl_datatype(DataType type);
 cudaDataType_t cudnn_to_cuda_datatype(cudnnDataType_t type);
 cudnnDataType_t cuda_to_cudnn_datatype(cudaDataType_t type);
 #endif
+void check_device_vs_host_ptr(void const *maybe_devicePtr);
+void check_ptr_alignment(void const *ptr);
diff --git a/include/flexflow/utils/hip_helper.h b/include/flexflow/utils/hip_helper.h
index 5d3c831d4f..805cc46b4c 100644
--- a/include/flexflow/utils/hip_helper.h
+++ b/include/flexflow/utils/hip_helper.h
@@ -75,8 +75,8 @@ inline int GET_BLOCKS(int const N) {
   return (ret > BLOCK_SIZE_LIMIT) ? BLOCK_SIZE_LIMIT : ret;
 }
 
-__global__ void
-    scale_kernel(float *ptr, Legion::coord_t size, float a, float b);
+template <typename DT>
+__global__ void scale_kernel(DT *ptr, Legion::coord_t size, DT a, DT b);
 
 __global__ void ones_kernel(float *ptr, Legion::coord_t size);
 
@@ -86,6 +86,12 @@ __global__ void assign_kernel(DT *ptr, Legion::coord_t size, DT value);
 template <typename DT>
 __global__ void copy_kernel(DT *dst, const DT *src, Legion::coord_t size);
 
+template <typename DT>
+__global__ void copy_kernel_discrete(DT *dst,
+                                     const DT *src,
+                                     Legion::coord_t size,
+                                     size_t *index);
+
 template <typename T>
 __global__ void add_kernel(T *data_ptr, T const *grad_ptr, size_t size);
 
@@ -135,16 +141,28 @@ __host__ void updateGAS(float *para_ptr,
                         float learning_rate);
 
 template <typename T>
-void print_tensor(T const *ptr, size_t num_elements, char const *prefix);
+void print_tensor(T const *ptr,
+                  size_t num_elements,
+                  char const *prefix,
+                  int shard_id = 0);
+template <typename T>
+void print_beam_tensor(T const *ptr,
+                       size_t num_elements,
+                       int skip,
+                       int channel,
+                       char const *prefix);
 
 template <typename T>
 void save_tensor(T const *ptr, size_t num_elements, char const *file_name);
 
 template <typename T>
-T *download_tensor(T const *ptr, size_t num_elements);
+T *copy_tensor_dev_to_host(T const *ptr, size_t num_elements);
+
+template <typename T>
+void copy_tensor_dev_to_host(T const *ptr, T *dst, size_t num_elements);
 
 template <typename T>
-bool download_tensor(T const *ptr, T *dst, size_t num_elements);
+void copy_tensor_host_to_dev(T *dst, T const *src, size_t num_elements);
 
 miopenStatus_t
     cudnnSetTensorDescriptorFromDomain(miopenTensorDescriptor_t tensor,
@@ -153,7 +171,8 @@ miopenStatus_t
 
 miopenStatus_t
     cudnnSetTensorDescriptorFromDomain4SoftMax(miopenTensorDescriptor_t tensor,
-                                               Legion::Domain domain);
+                                               Legion::Domain domain,
+                                               DataType data_type = DT_FLOAT);
 
 hipblasDatatype_t ff_to_cuda_datatype(DataType type);
 
@@ -164,3 +183,5 @@ ncclDataType_t ff_to_nccl_datatype(DataType type);
 
 void handle_unimplemented_hip_kernel(OperatorType op_type);
 #endif
+void check_device_vs_host_ptr(void const *maybe_devicePtr);
+void check_ptr_alignment(void const *ptr);
diff --git a/include/flexflow/utils/memory_allocator.h b/include/flexflow/utils/memory_allocator.h
index 7091b159b2..fad7630770 100644
--- a/include/flexflow/utils/memory_allocator.h
+++ b/include/flexflow/utils/memory_allocator.h
@@ -54,6 +54,11 @@ class MemoryAllocator {
     return static_cast<DT *>(ptr);
   }
 
+  inline void free_all() {
+    reserved_allocated_size = 0;
+    instance_allocated_size = 0;
+  }
+
 public:
   Legion::Memory memory;
   void *reserved_ptr;
diff --git a/include/flexflow/utils/peft_weight_allocator.h b/include/flexflow/utils/peft_weight_allocator.h
new file mode 100644
index 0000000000..dae46a8af1
--- /dev/null
+++ b/include/flexflow/utils/peft_weight_allocator.h
@@ -0,0 +1,92 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#ifndef _FLEXFLOW_UTILS_PEFT_WEIGHT_ALLOCATOR_H_
+#define _FLEXFLOW_UTILS_PEFT_WEIGHT_ALLOCATOR_H_
+
+#include "flexflow/config.h"
+#include <mutex>
+
+namespace FlexFlow {
+
+class PEFTWeightAllocator {
+public:
+  PEFTWeightAllocator(void *_base_ptr, size_t _total_size)
+      : base_ptr(_base_ptr), total_size(_total_size), sync_offset(0),
+        local_offset(_total_size) {}
+
+  inline void *allocate_sync_weights_untyped(PEFTModelID const &peft_model_id,
+                                             size_t datalen) {
+    const std::lock_guard<std::mutex> lock(peft_weight_allocator_mutex);
+    void *ptr = static_cast<char *>(base_ptr) + sync_offset;
+    off_t model_sync_weights_offset = sync_offset;
+    size_t model_sync_weights_size = datalen;
+    if (sync_weights.find(peft_model_id) != sync_weights.end()) {
+      // Assert that sync weights for each PEFT model is consecutive
+      std::pair<off_t, size_t> offset_and_size = sync_weights[peft_model_id];
+      assert(sync_offset == offset_and_size.first + offset_and_size.second);
+      model_sync_weights_offset = offset_and_size.first;
+      model_sync_weights_size = offset_and_size.second + datalen;
+    }
+    sync_offset += datalen;
+    assert(sync_offset < local_offset);
+    sync_weights[peft_model_id] =
+        std::make_pair(model_sync_weights_offset, model_sync_weights_size);
+    return ptr;
+  }
+
+  std::pair<void *, size_t>
+      get_sync_weights_ptr_and_size(PEFTModelID const &peft_model_id) {
+    const std::lock_guard<std::mutex> lock(peft_weight_allocator_mutex);
+    assert(sync_weights.find(peft_model_id) != sync_weights.end());
+    std::pair<off_t, size_t> offset_and_size = sync_weights[peft_model_id];
+    return std::make_pair(static_cast<char *>(base_ptr) + offset_and_size.first,
+                          offset_and_size.second);
+  }
+
+  inline void *allocate_local_weights_untyped(PEFTModelID const &peft_model_id,
+                                              size_t datalen) {
+    const std::lock_guard<std::mutex> lock(peft_weight_allocator_mutex);
+    local_offset -= datalen;
+    assert(sync_offset < local_offset);
+    void *ptr = static_cast<char *>(base_ptr) + local_offset;
+    return ptr;
+  }
+
+  template <typename DT>
+  inline DT *allocate_sync_weights(PEFTModelID const &peft_model_id,
+                                   size_t count) {
+    return static_cast<DT *>(
+        allocate_sync_weights_untyped(peft_model_id, sizeof(DT) * count));
+  }
+
+  template <typename DT>
+  inline DT *allocate_local_weights(PEFTModelID const &peft_model_id,
+                                    size_t count) {
+    return static_cast<DT *>(
+        allocate_local_weights_untyped(peft_model_id, sizeof(DT) * count));
+  }
+
+public:
+  void *base_ptr;
+  size_t total_size;
+  off_t sync_offset, local_offset;
+  std::unordered_map<PEFTModelID, std::pair<off_t, size_t>> sync_weights;
+  std::mutex peft_weight_allocator_mutex;
+};
+
+}; // namespace FlexFlow
+
+#endif // _FLEXFLOW_UTILS_PEFT_WEIGHT_ALLOCATOR_H_
diff --git a/inference/MODEL_WEIGHTS.md b/inference/MODEL_WEIGHTS.md
deleted file mode 100644
index d78fb37be9..0000000000
--- a/inference/MODEL_WEIGHTS.md
+++ /dev/null
@@ -1,28 +0,0 @@
-To convert the weights of a HuggingFace LLM to SpecInfer's weight format, we first load the model and modify the tensor names to match SpecInfer's convention, and then convert these tensors to numpy arrays to store them in binary files.
-
-```python
-from transformers import AutoModelForCausalLM
-model = AutoModelForCausalLM.from_pretrained("meta-llama/Llama-2-7b-hf")
-
-for name, params in model.named_parameters():
-    for name, params in model.named_parameters():
-    name = (
-        name.replace(".", "_")
-        .replace("self_attn", "attention")
-        .replace("q_proj", "wq")
-        .replace("k_proj", "wk")
-        .replace("v_proj", "wv")
-        .replace("o_proj", "wo")
-        .replace("mlp", "feed_forward")
-        .replace("gate_proj", "w1")
-        .replace("down_proj", "w2")
-        .replace("up_proj", "w3")
-        .replace("input_layernorm", "attention_norm")
-        .replace("post_attention_layernorm", "ffn_norm")
-        .replace("embed_tokens", "tok_embeddings")
-        .replace("lm_head", "output")
-        .replace("model_", "")
-    )
-    params.detach().cpu().numpy().tofile('weights/llama_7B_weights/' + name)
-```
-
diff --git a/inference/README.md b/inference/README.md
new file mode 100644
index 0000000000..14c94e22ac
--- /dev/null
+++ b/inference/README.md
@@ -0,0 +1,42 @@
+# Inference Examples
+This folder contains the code to run inference examples in FlexFlow
+
+To create a sample prompt, call (from the `build` folder):
+
+```bash
+mkdir -p ../inference/prompt
+echo '["San Francisco is a "]' > ../inference/prompt/test.json
+```
+
+To download a model for use in C++, call:
+```bash
+huggingface-cli login # if needed
+python ../inference/utils/download_hf_model.py meta-llama/Llama-2-7b-hf --half-precision-only
+```
+
+To run the incremental decoding example in C++, call:
+
+```bash
+./inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model meta-llama/Llama-2-7b-hf -prompt ../inference/prompt/test.json -tensor-parallelism-degree 4
+```
+
+To run the speculative inference example in C++, call:
+
+```bash
+./inference/spec_infer/spec_infer -ll:cpu 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-160m -prompt ../inference/prompt/test.json -tensor-parallelism-degree 4
+```
+
+To run a PEFT model example in C++, call:
+
+```bash
+./inference/peft/peft \
+    -ll:gpu 4 -ll:cpu 4 -ll:util 4 \
+    -tensor-parallelism-degree 4 \
+    -ll:fsize 8192 -ll:zsize 12000 \
+    -llm-model JackFram/llama-160m \
+    -finetuning-dataset ../inference/prompt/peft_dataset.json \
+    -peft-model goliaro/llama-160m-lora \
+    -enable-peft \
+    --use-full-precision \
+    --inference-debugging
+```
\ No newline at end of file
diff --git a/inference/incr_decoding/incr_decoding.cc b/inference/incr_decoding/incr_decoding.cc
index ec3dda3158..c9ffff5c07 100644
--- a/inference/incr_decoding/incr_decoding.cc
+++ b/inference/incr_decoding/incr_decoding.cc
@@ -264,15 +264,18 @@ void FlexFlow::top_level_task(Task const *task,
                                    /*parser_callback_t */ nullptr,
                                    /*allow_exceptions */ true,
                                    /*ignore_comments */ true);
-    std::vector<std::string> prompts;
+
+    std::vector<Request> requests;
     for (auto &prompt : prompt_json) {
       std::string text = prompt.get<std::string>();
       printf("Prompt[%d]: %s\n", total_num_requests, text.c_str());
+      Request inference_req;
+      inference_req.prompt = text;
+      inference_req.max_sequence_length = 128;
+      requests.push_back(inference_req);
       total_num_requests++;
-      prompts.push_back(text);
     }
-    std::vector<GenerationResult> result =
-        model.generate(prompts, 128 /*max_sequence_length*/);
+    std::vector<GenerationResult> result = model.generate(requests);
   }
 
   // terminate the request manager by stopping the background thread
diff --git a/inference/models/falcon.cc b/inference/models/falcon.cc
index a529411ddb..195d6ba7e3 100644
--- a/inference/models/falcon.cc
+++ b/inference/models/falcon.cc
@@ -76,7 +76,7 @@ void FALCON::create_falcon_model(FFModel &ff,
           falcon_config.layer_norm_epsilon,
           true,
           DT_NONE,
-          std::string("layers_" + std::to_string(i) + "_input_layernorm")
+          std::string("layers." + std::to_string(i) + ".input_layernorm")
               .c_str());
     } else {
       ff.residual_layer_norm(
@@ -89,8 +89,9 @@ void FALCON::create_falcon_model(FFModel &ff,
           true,
           falcon_config.layer_norm_epsilon,
           true,
+          false,
           DT_NONE,
-          std::string("layers_" + std::to_string(i) + "_input_layernorm")
+          std::string("layers." + std::to_string(i) + ".input_layernorm")
               .c_str());
       token = res_ln_outputs[0];
       att_norm = res_ln_outputs[1];
@@ -116,7 +117,7 @@ void FALCON::create_falcon_model(FFModel &ff,
             1.0f,    /*scaling factor*/
             true,    /*qk_prod_scaling*/
             false,   /*position_bias*/
-            std::string("layers_" + std::to_string(i) + "_attention")
+            std::string("layers." + std::to_string(i) + ".self_attention")
                 .c_str() /*name*/
         );
         break;
@@ -141,7 +142,7 @@ void FALCON::create_falcon_model(FFModel &ff,
             1.0f,    /*scaling factor*/
             true,    /*qk_prod_scaling*/
             false,   /*position_bias*/
-            std::string("layers_" + std::to_string(i) + "_attention")
+            std::string("layers." + std::to_string(i) + ".self_attention")
                 .c_str() /*name*/
         );
         break;
@@ -166,7 +167,7 @@ void FALCON::create_falcon_model(FFModel &ff,
             1.0f,    /*scaling factor*/
             true,    /*qk_prod_scaling*/
             false,   /*position_bias*/
-            std::string("layers_" + std::to_string(i) + "_attention")
+            std::string("layers." + std::to_string(i) + ".self_attention")
                 .c_str() /*name*/
         );
         break;
@@ -187,7 +188,7 @@ void FALCON::create_falcon_model(FFModel &ff,
         nullptr,
         REG_MODE_NONE,
         0.0f,
-        std::string("layers_" + std::to_string(i) + "_mlp_dense_h_to_4h")
+        std::string("layers." + std::to_string(i) + ".mlp.dense_h_to_4h")
             .c_str());
 
     dense_h_to_4h = ff.gelu(dense_h_to_4h);
@@ -203,7 +204,7 @@ void FALCON::create_falcon_model(FFModel &ff,
         nullptr,
         REG_MODE_NONE,
         0.0f,
-        std::string("layers_" + std::to_string(i) + "_mlp_dense_4h_to_h")
+        std::string("layers." + std::to_string(i) + ".mlp.dense_4h_to_h")
             .c_str());
   }
   // final normalization and linear
@@ -216,6 +217,7 @@ void FALCON::create_falcon_model(FFModel &ff,
                          true,
                          falcon_config.layer_norm_epsilon,
                          true,
+                         false,
                          DT_NONE,
                          "ln_f");
   Tensor ln_f = res_ln_outputs[1];
diff --git a/inference/models/llama.cc b/inference/models/llama.cc
index 517f534438..cf26194597 100644
--- a/inference/models/llama.cc
+++ b/inference/models/llama.cc
@@ -58,7 +58,7 @@ void LLAMA::create_llama_model(FFModel &ff,
                               use_full_precision ? DT_FLOAT : DT_HALF,
                               NULL,
                               embed_init,
-                              "tok_embeddings");
+                              "embed_tokens");
 
   Tensor w2 = nullptr;
 
@@ -75,7 +75,7 @@ void LLAMA::create_llama_model(FFModel &ff,
           llama_config.rms_norm_eps,
           llama_config.hidden_size,
           DT_NONE,
-          std::string("layers_" + std::to_string(i) + "_attention_norm")
+          std::string("layers." + std::to_string(i) + ".input_layernorm")
               .c_str());
     } else {
       ff.residual_rms_norm(
@@ -84,8 +84,9 @@ void LLAMA::create_llama_model(FFModel &ff,
           token_att_norm,
           llama_config.rms_norm_eps,
           llama_config.hidden_size,
+          false, // inplace_residual
           DT_NONE,
-          std::string("layers_" + std::to_string(i) + "_attention_norm")
+          std::string("layers." + std::to_string(i) + ".input_layernorm")
               .c_str());
       token = token_att_norm[0];
       att_norm = token_att_norm[1];
@@ -94,10 +95,11 @@ void LLAMA::create_llama_model(FFModel &ff,
     Tensor mha;
     switch (mode) {
       case BEAM_SEARCH_MODE: {
-        mha = ff.spec_inc_multihead_self_attention(
+        mha = ff.spec_inc_multiquery_self_attention(
             att_norm,
             llama_config.hidden_size,
             llama_config.num_attention_heads,
+            llama_config.num_key_value_heads,
             llama_config.hidden_size / llama_config.num_attention_heads,
             llama_config.hidden_size / llama_config.num_attention_heads,
             0.0f,    /*dropout*/
@@ -111,16 +113,17 @@ void LLAMA::create_llama_model(FFModel &ff,
             1.0f,    /*scaling factor*/
             true,    /*qk_prod_scaling*/
             false,   /*position_bias*/
-            std::string("layers_" + std::to_string(i) + "_attention")
+            std::string("layers." + std::to_string(i) + ".self_attn")
                 .c_str() /*name*/
         );
         break;
       }
       case TREE_VERIFY_MODE: {
-        mha = ff.inc_multihead_self_attention_verify(
+        mha = ff.inc_multiquery_self_attention_verify(
             att_norm,
             llama_config.hidden_size,
             llama_config.num_attention_heads,
+            llama_config.num_key_value_heads,
             llama_config.hidden_size / llama_config.num_attention_heads,
             llama_config.hidden_size / llama_config.num_attention_heads,
             0.0f,    /*dropout*/
@@ -134,16 +137,17 @@ void LLAMA::create_llama_model(FFModel &ff,
             1.0f,    /*scaling factor*/
             true,    /*qk_prod_scaling*/
             false,   /*position_bias*/
-            std::string("layers_" + std::to_string(i) + "_attention")
+            std::string("layers." + std::to_string(i) + ".self_attn")
                 .c_str() /*name*/
         );
         break;
       }
       case INC_DECODING_MODE: {
-        mha = ff.inc_multihead_self_attention(
+        mha = ff.inc_multiquery_self_attention(
             att_norm,
             llama_config.hidden_size,
             llama_config.num_attention_heads,
+            llama_config.num_key_value_heads,
             llama_config.hidden_size / llama_config.num_attention_heads,
             llama_config.hidden_size / llama_config.num_attention_heads,
             0.0f,    /*dropout*/
@@ -157,7 +161,7 @@ void LLAMA::create_llama_model(FFModel &ff,
             1.0f,    /*scaling factor*/
             true,    /*qk_prod_scaling*/
             false,   /*position_bias*/
-            std::string("layers_" + std::to_string(i) + "_attention")
+            std::string("layers." + std::to_string(i) + ".self_attn")
                 .c_str() /*name*/
         );
         break;
@@ -175,54 +179,56 @@ void LLAMA::create_llama_model(FFModel &ff,
         token_ff_norm,
         llama_config.rms_norm_eps,
         llama_config.hidden_size,
+        false, // inplace_residual
         DT_NONE,
-        std::string("layers_" + std::to_string(i) + "_ffn_norm").c_str());
+        std::string("layers." + std::to_string(i) + ".post_attention_layernorm")
+            .c_str());
     token = token_ff_norm[0];
     Tensor ff_norm = token_ff_norm[1];
 
-    Tensor w1 =
-        ff.dense(ff_norm,
-                 llama_config.intermediate_size,
-                 AC_MODE_NONE,
-                 false,
-                 DT_NONE,
-                 nullptr,
-                 nullptr,
-                 nullptr,
-                 REG_MODE_NONE,
-                 0.0f,
-                 std::string("layers_" + std::to_string(i) + "_feed_forward_w1")
-                     .c_str());
+    Tensor w1 = ff.dense(
+        ff_norm,
+        llama_config.intermediate_size,
+        AC_MODE_NONE,
+        false,
+        DT_NONE,
+        nullptr,
+        nullptr,
+        nullptr,
+        REG_MODE_NONE,
+        0.0f,
+        std::string("layers." + std::to_string(i) + ".mlp.gate_proj").c_str());
 
-    Tensor w3 =
-        ff.dense(ff_norm,
-                 llama_config.intermediate_size,
-                 AC_MODE_NONE,
-                 false,
-                 DT_NONE,
-                 nullptr,
-                 nullptr,
-                 nullptr,
-                 REG_MODE_NONE,
-                 0.0f,
-                 std::string("layers_" + std::to_string(i) + "_feed_forward_w3")
-                     .c_str());
+    Tensor w3 = ff.dense(
+        ff_norm,
+        llama_config.intermediate_size,
+        AC_MODE_NONE,
+        false,
+        DT_NONE,
+        nullptr,
+        nullptr,
+        nullptr,
+        REG_MODE_NONE,
+        0.0f,
+        std::string("layers." + std::to_string(i) + ".mlp.up_proj").c_str());
 
     Tensor multi = ff.sigmoid_silu_multi(w1, w3);
 
-    w2 =
-        ff.dense(multi,
-                 llama_config.hidden_size,
-                 AC_MODE_NONE,
-                 false,
-                 DT_NONE,
-                 nullptr,
-                 nullptr,
-                 nullptr,
-                 REG_MODE_NONE,
-                 0.0f,
-                 std::string("layers_" + std::to_string(i) + "_feed_forward_w2")
-                     .c_str());
+    w2 = ff.dense(
+        multi,
+        llama_config.hidden_size,
+        AC_MODE_NONE,
+        false,
+        DT_NONE,
+        nullptr,
+        nullptr,
+        nullptr,
+        REG_MODE_NONE,
+        0.0f,
+        std::string("layers." + std::to_string(i) + ".mlp.down_proj").c_str());
+    // Low-Rank Adapter (LoRA) for the second linear layer
+    // ff.lora_linear(std::string("down_proj"), std::string("layers." +
+    // std::to_string(i) + ".mlp.down_proj.lora").c_str());
   }
   // final normalization and linear
   Tensor final_rms_norm_output[2] = {nullptr, nullptr};
@@ -231,6 +237,7 @@ void LLAMA::create_llama_model(FFModel &ff,
                        final_rms_norm_output,
                        llama_config.rms_norm_eps,
                        llama_config.hidden_size,
+                       false, // inplace_residual
                        DT_NONE,
                        "norm");
 
@@ -244,7 +251,7 @@ void LLAMA::create_llama_model(FFModel &ff,
                           nullptr,
                           REG_MODE_NONE,
                           0.0f,
-                          "output");
+                          "lm_head");
 
   Tensor output;
   if (mode == BEAM_SEARCH_MODE) {
@@ -261,7 +268,8 @@ void LLAMA::create_llama_model(FFModel &ff,
       output = ff.sampling(softmax, generation_config.topp);
     } else {
       // output = ff.arg_top_k(dense, /*k=*/1, false);
-      output = ff.argmax(dense, /*beam_Search*/ false);
+      Tensor softmax = ff.softmax(dense, -1);
+      output = ff.argmax(softmax, /*beam_Search*/ false);
     }
   }
 
@@ -269,7 +277,7 @@ void LLAMA::create_llama_model(FFModel &ff,
       "",
       weight_file_path,
       llama_config.num_attention_heads,
-      llama_config.num_attention_heads,
+      llama_config.num_key_value_heads,
       llama_config.hidden_size,
       llama_config.hidden_size / llama_config.num_attention_heads,
       ff.config.tensor_parallelism_degree,
diff --git a/inference/models/llama.h b/inference/models/llama.h
index ba1f0236f9..edb78f1300 100644
--- a/inference/models/llama.h
+++ b/inference/models/llama.h
@@ -36,6 +36,11 @@ class LLAMA {
           num_hidden_layers = model_config["num_hidden_layers"];
           vocab_size = model_config["vocab_size"];
           num_attention_heads = model_config["num_attention_heads"];
+          if (model_config.find("num_key_value_heads") != model_config.end()) {
+            num_key_value_heads = model_config["num_key_value_heads"];
+          } else {
+            num_key_value_heads = num_attention_heads;
+          }
           hidden_size = model_config["hidden_size"];
           rms_norm_eps = model_config["rms_norm_eps"];
           intermediate_size = model_config["intermediate_size"];
@@ -61,6 +66,8 @@ class LLAMA {
       std::cout << "\tvocab_size: " << vocab_size << std::endl;
       std::cout << "\tnum_attention_heads: " << num_attention_heads
                 << std::endl;
+      std::cout << "\tnum_key_value_heads: " << num_key_value_heads
+                << std::endl;
       std::cout << "\thidden_size: " << hidden_size << std::endl;
       std::cout << "\trms_norm_eps: " << rms_norm_eps << std::endl;
       std::cout << "\tintermediate_size: " << intermediate_size << std::endl;
@@ -73,8 +80,8 @@ class LLAMA {
 
     // int max_seq_len, max_num_tokens;
     int max_beam_width, max_beam_depth;
-    int num_hidden_layers, vocab_size, num_attention_heads, hidden_size,
-        intermediate_size;
+    int num_hidden_layers, vocab_size, num_attention_heads, num_key_value_heads,
+        hidden_size, intermediate_size;
     float rms_norm_eps;
   };
 
diff --git a/inference/models/mpt.cc b/inference/models/mpt.cc
index 70e2b5e9c5..e4a7e0056d 100644
--- a/inference/models/mpt.cc
+++ b/inference/models/mpt.cc
@@ -58,7 +58,7 @@ void MPT::create_mpt_model(FFModel &ff,
                                       use_full_precision ? DT_FLOAT : DT_HALF,
                                       NULL,
                                       embed_init,
-                                      "transformer_wte");
+                                      "wte");
 
   Tensor intermediate_output = nullptr, layernorm_output = nullptr;
   Tensor res_ln_outputs[2] = {nullptr, nullptr};
@@ -74,7 +74,7 @@ void MPT::create_mpt_model(FFModel &ff,
           1e-05,
           false,
           DT_NONE,
-          std::string("layers_" + std::to_string(i) + "_norm_1").c_str());
+          std::string("layers." + std::to_string(i) + ".norm_1").c_str());
     } else {
       ff.residual_layer_norm(
           intermediate_output,
@@ -86,8 +86,9 @@ void MPT::create_mpt_model(FFModel &ff,
           true,
           1e-05,
           false,
+          false,
           DT_NONE,
-          std::string("layers_" + std::to_string(i) + "_norm_1").c_str());
+          std::string("layers." + std::to_string(i) + ".norm_1").c_str());
       hidden_states = res_ln_outputs[0];
       layernorm_output = res_ln_outputs[1];
     }
@@ -113,7 +114,7 @@ void MPT::create_mpt_model(FFModel &ff,
             pow((mpt_config.hidden_size / mpt_config.n_heads), -0.5),
             /*qk_prod_scaling*/ false,
             /*position_bias*/ true,
-            std::string("layers_" + std::to_string(i) + "_attention")
+            std::string("layers." + std::to_string(i) + ".attn")
                 .c_str() /*name*/
         );
         break;
@@ -137,7 +138,7 @@ void MPT::create_mpt_model(FFModel &ff,
             pow((mpt_config.hidden_size / mpt_config.n_heads), -0.5),
             /*qk_prod_scaling*/ false,
             /*position_bias*/ true,
-            std::string("layers_" + std::to_string(i) + "_attention")
+            std::string("layers." + std::to_string(i) + ".attn")
                 .c_str() /*name*/
         );
         break;
@@ -161,7 +162,7 @@ void MPT::create_mpt_model(FFModel &ff,
             pow((mpt_config.hidden_size / mpt_config.n_heads), -0.5),
             /*qk_prod_scaling*/ false,
             /*position_bias*/ true,
-            std::string("layers_" + std::to_string(i) + "_attention")
+            std::string("layers." + std::to_string(i) + ".attn")
                 .c_str() /*name*/
         );
         break;
@@ -181,8 +182,9 @@ void MPT::create_mpt_model(FFModel &ff,
         true,
         1e-05,
         false,
+        false,
         DT_NONE,
-        std::string("layers_" + std::to_string(i) + "_norm_2").c_str());
+        std::string("layers." + std::to_string(i) + ".norm_2").c_str());
     hidden_states = res_ln_outputs[0];
     layernorm_output = res_ln_outputs[1];
 
@@ -198,7 +200,7 @@ void MPT::create_mpt_model(FFModel &ff,
         nullptr,
         REG_MODE_NONE,
         0.0f,
-        std::string("layers_" + std::to_string(i) + "_ffn_up_proj").c_str());
+        std::string("layers." + std::to_string(i) + ".ffn.up_proj").c_str());
     layernorm_output = ff.gelu(layernorm_output);
     intermediate_output = ff.dense(
         layernorm_output,
@@ -211,7 +213,7 @@ void MPT::create_mpt_model(FFModel &ff,
         nullptr,
         REG_MODE_NONE,
         0.0f,
-        std::string("layers_" + std::to_string(i) + "_ffn_down_proj").c_str());
+        std::string("layers." + std::to_string(i) + ".ffn.down_proj").c_str());
   }
 
   // final
@@ -224,8 +226,9 @@ void MPT::create_mpt_model(FFModel &ff,
                          true,
                          1e-05,
                          false,
+                         false,
                          DT_NONE,
-                         "transformer_norm_f");
+                         "norm_f");
   Tensor all_final_norm = res_ln_outputs[1];
 
   Tensor lm_head = ff.dense(all_final_norm,
diff --git a/inference/models/opt.cc b/inference/models/opt.cc
index 5677d5658e..b3f2ef4e17 100644
--- a/inference/models/opt.cc
+++ b/inference/models/opt.cc
@@ -94,8 +94,9 @@ void OPT::create_opt_model(FFModel &ff,
         opt_config.layer_norm_elementwise_affine,
         1e-05,
         true,
+        false,
         DT_NONE,
-        std::string("layers_" + std::to_string(i) + "_attention_layer_norm")
+        std::string("layers." + std::to_string(i) + ".self_attn_layer_norm")
             .c_str());
     Tensor residual = res_ln_outputs[0];
     Tensor hidden_states = res_ln_outputs[1];
@@ -121,7 +122,7 @@ void OPT::create_opt_model(FFModel &ff,
                 -0.5), /*scaling factor*/
             false,     /*qk_prod_scaling*/
             false,     /*position_bias*/
-            std::string("layers_" + std::to_string(i) + "_attention")
+            std::string("layers." + std::to_string(i) + ".self_attn")
                 .c_str() /*name*/
         );
         break;
@@ -145,7 +146,7 @@ void OPT::create_opt_model(FFModel &ff,
                 -0.5), /*scaling factor*/
             false,     /*qk_prod_scaling*/
             false,     /*position_bias*/
-            std::string("layers_" + std::to_string(i) + "_attention")
+            std::string("layers." + std::to_string(i) + ".self_attn")
                 .c_str() /*name*/
         );
         break;
@@ -169,7 +170,7 @@ void OPT::create_opt_model(FFModel &ff,
                 -0.5), /*scaling factor*/
             false,     /*qk_prod_scaling*/
             false,     /*position_bias*/
-            std::string("layers_" + std::to_string(i) + "_attention")
+            std::string("layers." + std::to_string(i) + ".self_attn")
                 .c_str() /*name*/
         );
         break;
@@ -186,9 +187,10 @@ void OPT::create_opt_model(FFModel &ff,
                                     opt_config.layer_norm_elementwise_affine,
                                     1e-05,
                                     true,
+                                    false,
                                     DT_NONE,
-                                    std::string("layers_" + std::to_string(i) +
-                                                "_add_bias_residual_layer_norm")
+                                    std::string("layers." + std::to_string(i) +
+                                                ".add_bias_residual_layer_norm")
                                         .c_str());
     added = res_ln_outputs[0];
     Tensor final_norm = res_ln_outputs[1];
@@ -205,7 +207,7 @@ void OPT::create_opt_model(FFModel &ff,
                  nullptr,
                  REG_MODE_NONE,
                  0.0f,
-                 std::string("layers_" + std::to_string(i) + "_fc1").c_str());
+                 std::string("layers." + std::to_string(i) + ".fc1").c_str());
     fc2 = ff.dense(fc1,
                    opt_config.hidden_size,
                    AC_MODE_NONE,
@@ -216,7 +218,10 @@ void OPT::create_opt_model(FFModel &ff,
                    nullptr,
                    REG_MODE_NONE,
                    0.0f,
-                   std::string("layers_" + std::to_string(i) + "_fc2").c_str());
+                   std::string("layers." + std::to_string(i) + ".fc2").c_str());
+    // Low-Rank Adapter (LoRA) for the second linear layer
+    // ff.lora_linear(std::string("fc2"), std::string("layers." +
+    // std::to_string(i) + ".fc2.lora").c_str());
   }
 
   // final
@@ -229,6 +234,7 @@ void OPT::create_opt_model(FFModel &ff,
                          opt_config.layer_norm_elementwise_affine,
                          1e-05,
                          true,
+                         false,
                          DT_NONE,
                          "final_layer_norm");
   Tensor all_final_norm = res_ln_outputs[1];
@@ -243,7 +249,7 @@ void OPT::create_opt_model(FFModel &ff,
                             nullptr,
                             REG_MODE_NONE,
                             0.0f,
-                            "embed_tokens_weight_lm_head");
+                            "lm_head");
 
   Tensor output;
   if (mode == BEAM_SEARCH_MODE) {
@@ -252,7 +258,8 @@ void OPT::create_opt_model(FFModel &ff,
     output = ff.argmax(softmax, /*beam_Search*/ true);
   } else {
     // output = ff.arg_top_k(lm_head, /*k=*/1, false);
-    output = ff.argmax(lm_head, /*beam_Search*/ false);
+    Tensor softmax = ff.softmax(lm_head, -1);
+    output = ff.argmax(softmax, /*beam_Search*/ false);
   }
 
   FileDataLoader *fileloader = new FileDataLoader(
diff --git a/inference/models/starcoder.cc b/inference/models/starcoder.cc
index 8b0dc1098c..cd8bf3a9a7 100644
--- a/inference/models/starcoder.cc
+++ b/inference/models/starcoder.cc
@@ -66,7 +66,7 @@ void STARCODER::create_starcoder_model(
                               use_full_precision ? DT_FLOAT : DT_HALF,
                               NULL,
                               embed_init,
-                              "transformer_wte");
+                              "wte");
 
   Tensor positional_embedding =
       ff.embedding(position_input,
@@ -76,7 +76,7 @@ void STARCODER::create_starcoder_model(
                    use_full_precision ? DT_FLOAT : DT_HALF,
                    NULL,
                    embed_init,
-                   "transformer_wpe");
+                   "wpe");
 
   Tensor residual = nullptr, c_proj = nullptr;
   Tensor res_ln_outputs[2] = {nullptr, nullptr};
@@ -96,8 +96,9 @@ void STARCODER::create_starcoder_model(
         true,
         startcoder_config.layer_norm_epsilon,
         true,
+        false,
         DT_NONE,
-        std::string("layers_" + std::to_string(i) + "_ln_1").c_str());
+        std::string("layers." + std::to_string(i) + ".ln_1").c_str());
     Tensor hidden_states = res_ln_outputs[0];
     Tensor ln_1 = res_ln_outputs[1];
 
@@ -124,7 +125,7 @@ void STARCODER::create_starcoder_model(
             1.0f,                        /*scaling factor*/
             true,                        /*qk_prod_scaling*/
             false,                       /*position_bias*/
-            std::string("layers_" + std::to_string(i) + "_attention")
+            std::string("layers." + std::to_string(i) + ".attn.c_attn")
                 .c_str() /*name*/
         );
         break;
@@ -144,8 +145,9 @@ void STARCODER::create_starcoder_model(
         true,
         startcoder_config.layer_norm_epsilon,
         true,
+        false,
         DT_NONE,
-        std::string("layers_" + std::to_string(i) + "_ln_2").c_str());
+        std::string("layers." + std::to_string(i) + ".ln_2").c_str());
     residual = res_ln_outputs[0];
     Tensor l2_norm = res_ln_outputs[1];
 
@@ -161,7 +163,7 @@ void STARCODER::create_starcoder_model(
         nullptr,
         REG_MODE_NONE,
         0.0f,
-        std::string("layers_" + std::to_string(i) + "_mlp_c_fc").c_str());
+        std::string("layers." + std::to_string(i) + ".mlp.c_fc").c_str());
 
     c_fc = ff.gelu(c_fc);
 
@@ -176,7 +178,7 @@ void STARCODER::create_starcoder_model(
         nullptr,
         REG_MODE_NONE,
         0.0f,
-        std::string("layers_" + std::to_string(i) + "_mlp_c_proj").c_str());
+        std::string("layers." + std::to_string(i) + ".mlp.c_proj").c_str());
   }
   // final normalization and linear
   ff.residual_layer_norm(residual,
@@ -188,8 +190,9 @@ void STARCODER::create_starcoder_model(
                          true,
                          startcoder_config.layer_norm_epsilon,
                          true,
+                         false,
                          DT_NONE,
-                         "transformer_ln_f");
+                         "ln_f");
   Tensor ln_f = res_ln_outputs[1];
 
   Tensor lm_head = ff.dense(ln_f,
diff --git a/inference/peft/CMakeLists.txt b/inference/peft/CMakeLists.txt
new file mode 100644
index 0000000000..e0bad79cab
--- /dev/null
+++ b/inference/peft/CMakeLists.txt
@@ -0,0 +1,139 @@
+cmake_minimum_required(VERSION 3.10)
+
+project(FlexFlow_Peft)
+
+# Normal PEFT
+set(project_target1 peft)
+set(CPU_SRC1
+  ${FLEXFLOW_CPP_DRV_SRC}
+  peft.cc
+  ../models/llama.cc
+  ../models/opt.cc
+  ../models/falcon.cc
+  ../models/starcoder.cc
+  ../models/mpt.cc)
+
+if (FF_GPU_BACKEND STREQUAL "cuda" OR FF_GPU_BACKEND STREQUAL "hip_cuda")
+  cuda_add_executable(${project_target1} ${CPU_SRC1})
+  if (FF_GPU_BACKEND STREQUAL "hip_cuda")
+    target_compile_definitions(${project_target1} PRIVATE __HIP_PLATFORM_NVIDIA__)
+  endif()
+elseif(FF_GPU_BACKEND STREQUAL "hip_rocm")
+  set_source_files_properties(${CPU_SRC1} PROPERTIES LANGUAGE HIP)
+  hip_add_executable(${project_target1} ${CPU_SRC1})
+  if (FF_HIP_ARCH STREQUAL "")
+    message(FATAL_ERROR "FF_HIP_ARCH is empty!")
+  endif()
+  set_property(TARGET ${project_target1} PROPERTY HIP_ARCHITECTURES "${FF_HIP_ARCH}")
+  target_compile_definitions(${project_target1} PRIVATE __HIP_PLATFORM_AMD__)
+else()
+  message(FATAL_ERROR "Compilation of ${project_target1} for ${FF_GPU_BACKEND} backend not yet supported")
+endif()
+
+target_include_directories(${project_target1} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
+target_include_directories(${project_target1} PRIVATE ${CMAKE_SOURCE_DIR}/inference)
+target_link_libraries(${project_target1} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
+set(BIN_DEST "bin")
+install(TARGETS ${project_target1} DESTINATION ${BIN_DEST})
+
+# FWD benchmark
+set(project_target2 peft_fwd_benchmark)
+set(CPU_SRC2
+  ${FLEXFLOW_CPP_DRV_SRC}
+  peft_fwd_benchmark.cc
+  ../models/llama.cc
+  ../models/opt.cc
+  ../models/falcon.cc
+  ../models/starcoder.cc
+  ../models/mpt.cc)
+
+if (FF_GPU_BACKEND STREQUAL "cuda" OR FF_GPU_BACKEND STREQUAL "hip_cuda")
+  cuda_add_executable(${project_target2} ${CPU_SRC2})
+  if (FF_GPU_BACKEND STREQUAL "hip_cuda")
+    target_compile_definitions(${project_target2} PRIVATE __HIP_PLATFORM_NVIDIA__)
+  endif()
+elseif(FF_GPU_BACKEND STREQUAL "hip_rocm")
+  set_source_files_properties(${CPU_SRC2} PROPERTIES LANGUAGE HIP)
+  hip_add_executable(${project_target2} ${CPU_SRC2})
+  if (FF_HIP_ARCH STREQUAL "")
+    message(FATAL_ERROR "FF_HIP_ARCH is empty!")
+  endif()
+  set_property(TARGET ${project_target2} PROPERTY HIP_ARCHITECTURES "${FF_HIP_ARCH}")
+  target_compile_definitions(${project_target2} PRIVATE __HIP_PLATFORM_AMD__)
+else()
+  message(FATAL_ERROR "Compilation of ${project_target2} for ${FF_GPU_BACKEND} backend not yet supported")
+endif()
+
+target_include_directories(${project_target2} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
+target_include_directories(${project_target2} PRIVATE ${CMAKE_SOURCE_DIR}/inference)
+target_link_libraries(${project_target2} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
+set(BIN_DEST "bin")
+install(TARGETS ${project_target2} DESTINATION ${BIN_DEST})
+
+# BWD benchmark
+set(project_target3 peft_bwd_benchmark)
+set(CPU_SRC3
+  ${FLEXFLOW_CPP_DRV_SRC}
+  peft_bwd_benchmark.cc
+  ../models/llama.cc
+  ../models/opt.cc
+  ../models/falcon.cc
+  ../models/starcoder.cc
+  ../models/mpt.cc)
+
+if (FF_GPU_BACKEND STREQUAL "cuda" OR FF_GPU_BACKEND STREQUAL "hip_cuda")
+  cuda_add_executable(${project_target3} ${CPU_SRC3})
+  if (FF_GPU_BACKEND STREQUAL "hip_cuda")
+    target_compile_definitions(${project_target3} PRIVATE __HIP_PLATFORM_NVIDIA__)
+  endif()
+elseif(FF_GPU_BACKEND STREQUAL "hip_rocm")
+  set_source_files_properties(${CPU_SRC3} PROPERTIES LANGUAGE HIP)
+  hip_add_executable(${project_target3} ${CPU_SRC3})
+  if (FF_HIP_ARCH STREQUAL "")
+    message(FATAL_ERROR "FF_HIP_ARCH is empty!")
+  endif()
+  set_property(TARGET ${project_target3} PROPERTY HIP_ARCHITECTURES "${FF_HIP_ARCH}")
+  target_compile_definitions(${project_target3} PRIVATE __HIP_PLATFORM_AMD__)
+else()
+  message(FATAL_ERROR "Compilation of ${project_target3} for ${FF_GPU_BACKEND} backend not yet supported")
+endif()
+
+target_include_directories(${project_target3} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
+target_include_directories(${project_target3} PRIVATE ${CMAKE_SOURCE_DIR}/inference)
+target_link_libraries(${project_target3} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
+set(BIN_DEST "bin")
+install(TARGETS ${project_target3} DESTINATION ${BIN_DEST})
+
+# Online peft
+set(project_target4 req_rate_benchmark)
+set(CPU_SRC4
+  ${FLEXFLOW_CPP_DRV_SRC}
+  req_rate_benchmark.cc
+  ../models/llama.cc
+  ../models/opt.cc
+  ../models/falcon.cc
+  ../models/starcoder.cc
+  ../models/mpt.cc)
+
+if (FF_GPU_BACKEND STREQUAL "cuda" OR FF_GPU_BACKEND STREQUAL "hip_cuda")
+  cuda_add_executable(${project_target4} ${CPU_SRC4})
+  if (FF_GPU_BACKEND STREQUAL "hip_cuda")
+    target_compile_definitions(${project_target4} PRIVATE __HIP_PLATFORM_NVIDIA__)
+  endif()
+elseif(FF_GPU_BACKEND STREQUAL "hip_rocm")
+  set_source_files_properties(${CPU_SRC4} PROPERTIES LANGUAGE HIP)
+  hip_add_executable(${project_target4} ${CPU_SRC4})
+  if (FF_HIP_ARCH STREQUAL "")
+    message(FATAL_ERROR "FF_HIP_ARCH is empty!")
+  endif()
+  set_property(TARGET ${project_target4} PROPERTY HIP_ARCHITECTURES "${FF_HIP_ARCH}")
+  target_compile_definitions(${project_target4} PRIVATE __HIP_PLATFORM_AMD__)
+else()
+  message(FATAL_ERROR "Compilation of ${project_target4} for ${FF_GPU_BACKEND} backend not yet supported")
+endif()
+
+target_include_directories(${project_target4} PRIVATE ${FLEXFLOW_INCLUDE_DIRS} ${CMAKE_INSTALL_INCLUDEDIR})
+target_include_directories(${project_target4} PRIVATE ${CMAKE_SOURCE_DIR}/inference)
+target_link_libraries(${project_target4} -Wl,--whole-archive flexflow -Wl,--no-whole-archive ${FLEXFLOW_EXT_LIBRARIES})
+set(BIN_DEST "bin")
+install(TARGETS ${project_target4} DESTINATION ${BIN_DEST})
diff --git a/inference/peft/Makefile b/inference/peft/Makefile
new file mode 100644
index 0000000000..0e4b79f51f
--- /dev/null
+++ b/inference/peft/Makefile
@@ -0,0 +1,37 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+#
+
+# Flags for directing the runtime makefile what to include
+DEBUG           ?= 0		# Include debugging symbols
+MAX_DIM         ?= 4		# Maximum number of dimensions
+OUTPUT_LEVEL    ?= LEVEL_DEBUG	# Compile time logging level
+USE_CUDA        ?= 1		# Include CUDA support (requires CUDA)
+USE_GASNET      ?= 0		# Include GASNet support (requires GASNet)
+USE_HDF         ?= 1		# Include HDF5 support (requires HDF5)
+ALT_MAPPERS     ?= 0		# Include alternative mappers (not recommended)
+
+# Put the binary file name here
+OUTFILE		?= llama_pipeline
+# List all the application source files here
+ifndef CUDA_HOME
+CUDA_HOME = $(patsubst %/bin/nvcc,%,$(shell which nvcc | head -1))
+endif
+
+
+ifndef FF_HOME
+$(error FF_HOME variable is not defined, aborting build)
+endif
+
+include $(FF_HOME)/FlexFlow.mk
diff --git a/inference/peft/peft.cc b/inference/peft/peft.cc
new file mode 100644
index 0000000000..c55f2c0bfd
--- /dev/null
+++ b/inference/peft/peft.cc
@@ -0,0 +1,387 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/inference.h"
+#include "flexflow/request_manager.h"
+#include "models/falcon.h"
+#include "models/llama.h"
+#include "models/mpt.h"
+#include "models/opt.h"
+#include "models/starcoder.h"
+#include <wordexp.h>
+
+#include <nlohmann/json.hpp>
+
+using namespace FlexFlow;
+using namespace Legion;
+using json = nlohmann::json;
+
+Legion::Logger log_app("llama");
+
+struct FilePaths {
+  std::string cache_folder_path;
+  std::string prompt_file_path;
+  std::string dataset_file_path;
+  std::string output_file_path;
+};
+
+void parse_input_args(char **argv,
+                      int argc,
+                      FilePaths &paths,
+                      std::string &llm_model_name,
+                      std::string &peft_model_name,
+                      bool &use_full_precision,
+                      bool &verbose,
+                      bool &do_sample,
+                      bool &enable_peft,
+                      float &temperature,
+                      float &topp,
+                      int &max_requests_per_batch,
+                      int &max_tokens_per_batch,
+                      int &max_sequence_length) {
+  for (int i = 1; i < argc; i++) {
+    // llm model type
+    if (!strcmp(argv[i], "-llm-model")) {
+      llm_model_name = std::string(argv[++i]);
+      for (char &c : llm_model_name) {
+        c = std::tolower(c);
+      }
+      continue;
+    }
+    if (!strcmp(argv[i], "-enable-peft")) {
+      enable_peft = true;
+      continue;
+    }
+    if (!strcmp(argv[i], "-peft-model")) {
+      peft_model_name = std::string(argv[++i]);
+      for (char &c : peft_model_name) {
+        c = std::tolower(c);
+      }
+      continue;
+    }
+    // cache folder
+    if (!strcmp(argv[i], "-cache-folder")) {
+      paths.cache_folder_path = std::string(argv[++i]);
+      continue;
+    }
+    // prompts
+    if (!strcmp(argv[i], "-prompt")) {
+      paths.prompt_file_path = std::string(argv[++i]);
+      continue;
+    }
+    // dataset for finetuning
+    if (!strcmp(argv[i], "-finetuning-dataset")) {
+      paths.dataset_file_path = std::string(argv[++i]);
+      continue;
+    }
+    // output file
+    if (!strcmp(argv[i], "-output-file")) {
+      paths.output_file_path = std::string(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--use-full-precision")) {
+      use_full_precision = true;
+      continue;
+    }
+    // verbose logging to stdout
+    if (!strcmp(argv[i], "--verbose")) {
+      verbose = true;
+      continue;
+    }
+    if (!strcmp(argv[i], "--do-sample")) {
+      do_sample = true;
+      continue;
+    }
+    if (!strcmp(argv[i], "--temperature")) {
+      temperature = std::stof(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--topp")) {
+      topp = std::stof(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--max-requests-per-batch")) {
+      max_requests_per_batch = std::stoi(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--max-tokens-per-batch")) {
+      max_tokens_per_batch = std::stoi(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--max-sequence-length")) {
+      max_sequence_length = std::stoi(argv[++i]);
+      continue;
+    }
+  }
+  if (paths.cache_folder_path.empty()) {
+    char const *ff_cache_path = std::getenv("FF_CACHE_PATH");
+    paths.cache_folder_path = ff_cache_path ? std::string(ff_cache_path)
+                                            : std::string("~/.cache/flexflow");
+  }
+  // Expand ~ to the home directory if needed
+  wordexp_t p;
+  wordexp(paths.cache_folder_path.c_str(), &p, 0);
+  paths.cache_folder_path = p.we_wordv[0];
+  wordfree(&p);
+}
+
+void FlexFlow::top_level_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  FFConfig ffconfig;
+  if (ffconfig.cpu_offload == false && ffconfig.quantization_type != DT_NONE) {
+    assert(false && "Doesn't support quantization in non-offload mode");
+  }
+  FilePaths file_paths;
+  std::string llm_model_name, peft_model_name;
+  bool use_full_precision = false;
+  bool verbose = false;
+  bool do_sample = false;
+  bool enable_peft = false;
+  float temperature = 0.0f;
+  float topp = 0.0f;
+  int max_requests_per_batch = 1;
+  int max_tokens_per_batch = 128;
+  int max_sequence_length = 256;
+  bool enable_peft_finetuning = true;
+
+  InputArgs const &command_args = HighLevelRuntime::get_input_args();
+  char **argv = command_args.argv;
+  int argc = command_args.argc;
+  parse_input_args(argv,
+                   argc,
+                   file_paths,
+                   llm_model_name,
+                   peft_model_name,
+                   use_full_precision,
+                   verbose,
+                   do_sample,
+                   enable_peft,
+                   temperature,
+                   topp,
+                   max_requests_per_batch,
+                   max_tokens_per_batch,
+                   max_sequence_length);
+  assert(ffconfig.data_parallelism_degree * ffconfig.tensor_parallelism_degree *
+             ffconfig.pipeline_parallelism_degree ==
+         ffconfig.numNodes * ffconfig.workersPerNode);
+
+  std::string config_filepath = join_path(
+      {file_paths.cache_folder_path, "configs", llm_model_name, "config.json"});
+  std::string tokenizer_filepath =
+      join_path({file_paths.cache_folder_path, "tokenizers", llm_model_name});
+  std::string weights_filepath =
+      join_path({file_paths.cache_folder_path,
+                 "weights",
+                 llm_model_name,
+                 use_full_precision ? "full-precision" : "half-precision"});
+  std::ifstream config_file_handle(config_filepath);
+  if (!config_file_handle.good()) {
+    std::cout << "Model config file " << config_filepath << " not found."
+              << std::endl;
+    assert(false);
+  }
+  if (enable_peft && peft_model_name.empty()) {
+    std::cout << "PEFT enabled, but no PEFT model id passed" << std::endl;
+    assert(false);
+  } else if (!enable_peft && !peft_model_name.empty()) {
+    std::cout << "PEFT model id passed, but PEFT is not enabled" << std::endl;
+    assert(false);
+  }
+
+  json model_config = json::parse(config_file_handle,
+                                  /*parser_callback_t */ nullptr,
+                                  /*allow_exceptions */ true,
+                                  /*ignore_comments */ true);
+  ModelType model_type = ModelType::UNKNOWN;
+  auto architectures = model_config["architectures"];
+  for (auto const &str : architectures) {
+    if (str == "LlamaForCausalLM" || str == "LLaMAForCausalLM") {
+      model_type = ModelType::LLAMA;
+      break;
+    } else if (str == "OPTForCausalLM") {
+      model_type = ModelType::OPT;
+      break;
+    } else if (str == "RWForCausalLM" || str == "FalconForCausalLM") {
+      model_type = ModelType::FALCON;
+      break;
+    } else if (str == "GPTBigCodeForCausalLM") {
+      model_type = ModelType::STARCODER;
+      break;
+    } else if (str == "MPTForCausalLM") {
+      model_type = ModelType::MPT;
+      break;
+    }
+  }
+  int bos_token_id = model_config.find("bos_token_id") == model_config.end()
+                         ? -1
+                         : (int)model_config.at("bos_token_id");
+  int eos_token_id = model_config.find("eos_token_id") == model_config.end()
+                         ? -1
+                         : (int)model_config.at("eos_token_id");
+
+  assert(model_type != ModelType::UNKNOWN &&
+         "Invalid LLM model type passed (or no type was passed).");
+
+  // load PEFT config
+  LoraLinearConfig peft_config =
+      peft_model_name.empty()
+          ? LoraLinearConfig::EmptyConfig
+          : LoraLinearConfig(file_paths.cache_folder_path, peft_model_name);
+
+  LoraOptimizerConfig *optim_config = nullptr;
+  if (enable_peft_finetuning) {
+    // float sgd_learning_rate = 2e-1;
+    float sgd_learning_rate = 1.0f;
+    optim_config = new LoraSGDOptimizerConfig(sgd_learning_rate);
+  }
+  LoraLinearConfig peft_config_finetuning =
+      peft_model_name.empty()
+          ? LoraLinearConfig::EmptyConfig
+          : LoraLinearConfig(file_paths.cache_folder_path,
+                             peft_model_name,
+                             true /*trainable*/,
+                             optim_config,
+                             false /*init_lora_weights*/,
+                             llm_model_name,
+                             use_full_precision ? "fp32" : "fp16");
+
+  GenerationConfig generationConfig(do_sample, temperature, topp);
+  RequestManager *rm = RequestManager::get_request_manager();
+  rm->set_max_requests_per_batch(
+      max_requests_per_batch +
+      (int)enable_peft_finetuning); // add one slot for finetuning if needed
+  rm->set_max_tokens_per_batch(max_tokens_per_batch);
+  rm->set_max_sequence_length(max_sequence_length);
+  rm->register_tokenizer(
+      model_type, bos_token_id, eos_token_id, tokenizer_filepath);
+  rm->register_output_filepath(file_paths.output_file_path);
+  rm->set_enable_peft_finetuning(enable_peft_finetuning);
+
+  FFModel model(ffconfig, ffconfig.cpu_offload);
+  if (model_type == ModelType::LLAMA) {
+    LLAMA::create_llama_model(model,
+                              config_filepath,
+                              weights_filepath,
+                              INC_DECODING_MODE,
+                              generationConfig,
+                              use_full_precision);
+  } else if (model_type == ModelType::OPT) {
+    OPT::create_opt_model(model,
+                          config_filepath,
+                          weights_filepath,
+                          INC_DECODING_MODE,
+                          use_full_precision);
+  } else if (model_type == ModelType::FALCON) {
+    FALCON::create_falcon_model(model,
+                                config_filepath,
+                                weights_filepath,
+                                INC_DECODING_MODE,
+                                use_full_precision);
+  } else if (model_type == ModelType::STARCODER) {
+    STARCODER::create_starcoder_model(model,
+                                      config_filepath,
+                                      weights_filepath,
+                                      INC_DECODING_MODE,
+                                      generationConfig,
+                                      use_full_precision);
+  } else if (model_type == ModelType::MPT) {
+    MPT::create_mpt_model(model,
+                          config_filepath,
+                          weights_filepath,
+                          INC_DECODING_MODE,
+                          generationConfig,
+                          use_full_precision);
+  } else {
+    assert(false && "unknow model type");
+  }
+
+  // Add PEFT layer
+  PEFTModelID *peft_model_id = nullptr, *peft_model_id_finetuning = nullptr;
+  if (!peft_model_name.empty()) {
+    peft_model_id = model.add_lora_layer(peft_config);
+    if (enable_peft_finetuning) {
+      peft_model_id_finetuning = model.add_lora_layer(peft_config_finetuning);
+    }
+  }
+
+  // Start background server
+  rm->start_background_server(&model);
+
+  // Run workload
+  {
+    std::vector<Request> requests;
+
+    // Add inference requests
+    if (!file_paths.prompt_file_path.empty()) {
+      using json = nlohmann::json;
+      std::ifstream file_handle(file_paths.prompt_file_path);
+      assert(file_handle.good() && "Prompt file does not exist.");
+      json prompt_json = json::parse(file_handle,
+                                     /*parser_callback_t */ nullptr,
+                                     /*allow_exceptions */ true,
+                                     /*ignore_comments */ true);
+      int total_num_requests = 0;
+      for (auto &prompt : prompt_json) {
+        std::string text = prompt.get<std::string>();
+        printf("Inference prompt[%d]: %s\n", total_num_requests, text.c_str());
+        Request inference_req;
+        inference_req.prompt = text;
+        inference_req.max_sequence_length = 128;
+        inference_req.peft_model_id =
+            (peft_model_id != nullptr) ? *peft_model_id : PEFTModelID::NO_ID;
+        requests.push_back(inference_req);
+        total_num_requests++;
+      }
+    }
+
+    // Add fine-tuning request
+    if (enable_peft_finetuning) {
+      assert(!file_paths.dataset_file_path.empty() &&
+             "Dataset file path is required for fine-tuning.");
+      printf("Finetuning request with dataset %s\n",
+             file_paths.dataset_file_path.c_str());
+      Request fine_tuning_req;
+      fine_tuning_req.req_type = RequestType::REQ_FINETUNING;
+      fine_tuning_req.peft_model_id = (peft_model_id_finetuning != nullptr)
+                                          ? *peft_model_id_finetuning
+                                          : PEFTModelID::NO_ID;
+      fine_tuning_req.dataset_filepath = file_paths.dataset_file_path;
+      fine_tuning_req.max_training_steps = 2;
+      requests.push_back(fine_tuning_req);
+    }
+    std::vector<GenerationResult> result = model.generate(requests);
+  }
+
+  // terminate the request manager by stopping the background thread
+  rm->terminate_background_server();
+
+  // Execution fence
+  {
+    Future future = runtime->issue_execution_fence(ctx);
+    future.get_void_result();
+  }
+
+  if (peft_model_id != nullptr) {
+    free(peft_model_id);
+  }
+
+  std::cout << "----------inference finished--------------" << std::endl;
+
+  // free tokenizer space in memory
+}
+
+void FlexFlow::register_custom_tasks() {}
diff --git a/inference/peft/peft_bwd_benchmark.cc b/inference/peft/peft_bwd_benchmark.cc
new file mode 100644
index 0000000000..86d6d8cbbf
--- /dev/null
+++ b/inference/peft/peft_bwd_benchmark.cc
@@ -0,0 +1,391 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/inference.h"
+#include "flexflow/request_manager.h"
+#include "models/falcon.h"
+#include "models/llama.h"
+#include "models/mpt.h"
+#include "models/opt.h"
+#include "models/starcoder.h"
+#include <wordexp.h>
+
+#include <nlohmann/json.hpp>
+
+using namespace FlexFlow;
+using namespace Legion;
+using json = nlohmann::json;
+
+Legion::Logger log_app("llama");
+
+struct FilePaths {
+  std::string cache_folder_path;
+  std::string prompt_file_path;
+  std::string output_file_path;
+};
+
+void parse_input_args(char **argv,
+                      int argc,
+                      FilePaths &paths,
+                      std::string &llm_model_name,
+                      std::string &peft_model_name,
+                      bool &use_full_precision,
+                      bool &verbose,
+                      bool &do_sample,
+                      bool &enable_peft,
+                      float &temperature,
+                      float &topp,
+                      int &max_requests_per_batch,
+                      int &max_tokens_per_batch,
+                      int &max_sequence_length,
+                      int &max_requests_to_run) {
+  for (int i = 1; i < argc; i++) {
+    // llm model type
+    if (!strcmp(argv[i], "-llm-model")) {
+      llm_model_name = std::string(argv[++i]);
+      for (char &c : llm_model_name) {
+        c = std::tolower(c);
+      }
+      continue;
+    }
+    if (!strcmp(argv[i], "-enable-peft")) {
+      enable_peft = true;
+      continue;
+    }
+    if (!strcmp(argv[i], "-peft-model")) {
+      peft_model_name = std::string(argv[++i]);
+      for (char &c : peft_model_name) {
+        c = std::tolower(c);
+      }
+      continue;
+    }
+    // cache folder
+    if (!strcmp(argv[i], "-cache-folder")) {
+      paths.cache_folder_path = std::string(argv[++i]);
+      continue;
+    }
+    // prompts
+    if (!strcmp(argv[i], "-prompt")) {
+      paths.prompt_file_path = std::string(argv[++i]);
+      continue;
+    }
+    // output file
+    if (!strcmp(argv[i], "-output-file")) {
+      paths.output_file_path = std::string(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--use-full-precision")) {
+      use_full_precision = true;
+      continue;
+    }
+    // verbose logging to stdout
+    if (!strcmp(argv[i], "--verbose")) {
+      verbose = true;
+      continue;
+    }
+    if (!strcmp(argv[i], "--do-sample")) {
+      do_sample = true;
+      continue;
+    }
+    if (!strcmp(argv[i], "--temperature")) {
+      temperature = std::stof(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--topp")) {
+      topp = std::stof(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--max-requests-per-batch")) {
+      max_requests_per_batch = std::stoi(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--max-tokens-per-batch")) {
+      max_tokens_per_batch = std::stoi(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--max-sequence-length")) {
+      max_sequence_length = std::stoi(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--max-requests-to-run")) {
+      max_requests_to_run = std::stoi(argv[++i]);
+      continue;
+    }
+  }
+  if (paths.cache_folder_path.empty()) {
+    char const *ff_cache_path = std::getenv("FF_CACHE_PATH");
+    paths.cache_folder_path = ff_cache_path ? std::string(ff_cache_path)
+                                            : std::string("~/.cache/flexflow");
+  }
+  // Expand ~ to the home directory if needed
+  wordexp_t p;
+  wordexp(paths.cache_folder_path.c_str(), &p, 0);
+  paths.cache_folder_path = p.we_wordv[0];
+  wordfree(&p);
+}
+
+void FlexFlow::top_level_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  FFConfig ffconfig;
+  if (ffconfig.cpu_offload == false && ffconfig.quantization_type != DT_NONE) {
+    assert(false && "Doesn't support quantization in non-offload mode");
+  }
+  FilePaths file_paths;
+  std::string llm_model_name, peft_model_name;
+  bool use_full_precision = false;
+  bool verbose = false;
+  bool do_sample = false;
+  bool enable_peft = false;
+  float temperature = 0.0f;
+  float topp = 0.0f;
+  int max_requests_per_batch = 8;
+  int max_tokens_per_batch = 128;
+  int max_sequence_length = 256;
+  int max_requests_to_run = 1000000000;
+  bool enable_peft_finetuning = false;
+
+  InputArgs const &command_args = HighLevelRuntime::get_input_args();
+  char **argv = command_args.argv;
+  int argc = command_args.argc;
+  parse_input_args(argv,
+                   argc,
+                   file_paths,
+                   llm_model_name,
+                   peft_model_name,
+                   use_full_precision,
+                   verbose,
+                   do_sample,
+                   enable_peft,
+                   temperature,
+                   topp,
+                   max_requests_per_batch,
+                   max_tokens_per_batch,
+                   max_sequence_length,
+                   max_requests_to_run);
+  assert(ffconfig.data_parallelism_degree * ffconfig.tensor_parallelism_degree *
+             ffconfig.pipeline_parallelism_degree ==
+         ffconfig.numNodes * ffconfig.workersPerNode);
+
+  std::string config_filepath = join_path(
+      {file_paths.cache_folder_path, "configs", llm_model_name, "config.json"});
+  std::string tokenizer_filepath =
+      join_path({file_paths.cache_folder_path, "tokenizers", llm_model_name});
+  std::string weights_filepath =
+      join_path({file_paths.cache_folder_path,
+                 "weights",
+                 llm_model_name,
+                 use_full_precision ? "full-precision" : "half-precision"});
+  std::ifstream config_file_handle(config_filepath);
+  if (!config_file_handle.good()) {
+    std::cout << "Model config file " << config_filepath << " not found."
+              << std::endl;
+    assert(false);
+  }
+  if (enable_peft && peft_model_name.empty()) {
+    std::cout << "PEFT enabled, but no PEFT model id passed" << std::endl;
+    assert(false);
+  } else if (!enable_peft && !peft_model_name.empty()) {
+    std::cout << "PEFT model id passed, but PEFT is not enabled" << std::endl;
+    assert(false);
+  }
+
+  json model_config = json::parse(config_file_handle,
+                                  /*parser_callback_t */ nullptr,
+                                  /*allow_exceptions */ true,
+                                  /*ignore_comments */ true);
+  ModelType model_type = ModelType::UNKNOWN;
+  auto architectures = model_config["architectures"];
+  for (auto const &str : architectures) {
+    if (str == "LlamaForCausalLM" || str == "LLaMAForCausalLM") {
+      model_type = ModelType::LLAMA;
+      break;
+    } else if (str == "OPTForCausalLM") {
+      model_type = ModelType::OPT;
+      break;
+    } else if (str == "RWForCausalLM" || str == "FalconForCausalLM") {
+      model_type = ModelType::FALCON;
+      break;
+    } else if (str == "GPTBigCodeForCausalLM") {
+      model_type = ModelType::STARCODER;
+      break;
+    } else if (str == "MPTForCausalLM") {
+      model_type = ModelType::MPT;
+      break;
+    }
+  }
+  int bos_token_id = model_config.find("bos_token_id") == model_config.end()
+                         ? -1
+                         : (int)model_config.at("bos_token_id");
+  int eos_token_id = model_config.find("eos_token_id") == model_config.end()
+                         ? -1
+                         : (int)model_config.at("eos_token_id");
+
+  assert(model_type != ModelType::UNKNOWN &&
+         "Invalid LLM model type passed (or no type was passed).");
+
+  // load PEFT config
+  LoraLinearConfig peft_config =
+      peft_model_name.empty()
+          ? LoraLinearConfig::EmptyConfig
+          : LoraLinearConfig(file_paths.cache_folder_path, peft_model_name);
+
+  GenerationConfig generationConfig(do_sample, temperature, topp);
+  RequestManager *rm = RequestManager::get_request_manager();
+  rm->set_max_requests_per_batch(
+      max_requests_per_batch +
+      (int)enable_peft_finetuning); // add one slot for finetuning if needed
+  rm->set_max_tokens_per_batch(max_tokens_per_batch);
+  rm->set_max_sequence_length(max_sequence_length);
+  rm->register_tokenizer(
+      model_type, bos_token_id, eos_token_id, tokenizer_filepath);
+  rm->register_output_filepath(file_paths.output_file_path);
+  rm->set_enable_peft_finetuning(enable_peft_finetuning);
+
+  FFModel model(ffconfig, ffconfig.cpu_offload);
+  if (model_type == ModelType::LLAMA) {
+    LLAMA::create_llama_model(model,
+                              config_filepath,
+                              weights_filepath,
+                              INC_DECODING_MODE,
+                              generationConfig,
+                              use_full_precision);
+  } else if (model_type == ModelType::OPT) {
+    OPT::create_opt_model(model,
+                          config_filepath,
+                          weights_filepath,
+                          INC_DECODING_MODE,
+                          use_full_precision);
+  } else if (model_type == ModelType::FALCON) {
+    FALCON::create_falcon_model(model,
+                                config_filepath,
+                                weights_filepath,
+                                INC_DECODING_MODE,
+                                use_full_precision);
+  } else if (model_type == ModelType::STARCODER) {
+    STARCODER::create_starcoder_model(model,
+                                      config_filepath,
+                                      weights_filepath,
+                                      INC_DECODING_MODE,
+                                      generationConfig,
+                                      use_full_precision);
+  } else if (model_type == ModelType::MPT) {
+    MPT::create_mpt_model(model,
+                          config_filepath,
+                          weights_filepath,
+                          INC_DECODING_MODE,
+                          generationConfig,
+                          use_full_precision);
+  } else {
+    assert(false && "unknow model type");
+  }
+
+  // Add PEFT layer
+  PEFTModelID *peft_model_id = nullptr;
+  if (!peft_model_name.empty()) {
+    peft_model_id = model.add_lora_layer(peft_config);
+  }
+
+  // Start background server
+  rm->start_background_server(&model);
+
+  // Warmup stage
+  {
+    std::vector<Request> requests;
+    for (int i = 0; i < 100; i++) {
+      Request inference_req;
+      inference_req.benchmarking_tokens = 128;
+      inference_req.max_sequence_length = 256;
+      inference_req.warmup = true;
+      inference_req.peft_model_id =
+          (peft_model_id != nullptr) ? *peft_model_id : PEFTModelID::NO_ID;
+      requests.push_back(inference_req);
+    }
+    Request fine_tuning_req;
+    fine_tuning_req.req_type = RequestType::REQ_FINETUNING;
+    fine_tuning_req.benchmarking_tokens = 1024;
+    fine_tuning_req.max_sequence_length = 1024;
+    fine_tuning_req.warmup = true;
+    fine_tuning_req.peft_model_id =
+        (peft_model_id != nullptr) ? *peft_model_id : PEFTModelID::NO_ID;
+    fine_tuning_req.max_training_steps = 1;
+    requests.push_back(fine_tuning_req);
+    std::vector<GenerationResult> result = model.generate(requests);
+  }
+
+  rm->set_inference_finished(false); // reset inference finished flag
+  std::cout << "----------warmup finished--------------" << std::endl;
+
+  // Run workload
+  {
+    std::vector<Request> requests;
+
+    // Add inference requests
+    using json = nlohmann::json;
+    std::ifstream file_handle(file_paths.prompt_file_path);
+    assert(file_handle.good() && "Prompt file does not exist.");
+    json prompt_json = json::parse(file_handle,
+                                   /*parser_callback_t */ nullptr,
+                                   /*allow_exceptions */ true,
+                                   /*ignore_comments */ true);
+    std::vector<int> lengths;
+    int index = 0;
+    for (auto &entry : prompt_json) {
+      if (index == max_requests_to_run) {
+        break;
+      }
+      int prompt_length = entry.get<int>();
+      assert(prompt_length > 0 && "Prompt length must be greater than 0.");
+      assert(prompt_length <= 1024 &&
+             "Prompt length must be less than or equal to 1024.");
+      lengths.push_back(prompt_length);
+      index++;
+    }
+    printf("Total number of finetuning requests: %ld", lengths.size());
+
+    // Add fine-tuning requests
+    for (int i = 0; i < lengths.size(); i++) {
+      Request fine_tuning_req;
+      fine_tuning_req.req_type = RequestType::REQ_FINETUNING;
+      fine_tuning_req.benchmarking_tokens = lengths[i];
+      fine_tuning_req.max_sequence_length = lengths[i];
+      fine_tuning_req.peft_model_id =
+          (peft_model_id != nullptr) ? *peft_model_id : PEFTModelID::NO_ID;
+      fine_tuning_req.max_training_steps = 1;
+      requests.push_back(fine_tuning_req);
+    }
+    std::vector<GenerationResult> result = model.generate(requests);
+  }
+
+  // terminate the request manager by stopping the background thread
+  rm->terminate_background_server();
+
+  // Execution fence
+  {
+    Future future = runtime->issue_execution_fence(ctx);
+    future.get_void_result();
+  }
+
+  if (peft_model_id != nullptr) {
+    free(peft_model_id);
+  }
+
+  std::cout << "----------finetuning finished--------------" << std::endl;
+
+  // free tokenizer space in memory
+}
+
+void FlexFlow::register_custom_tasks() {}
diff --git a/inference/peft/peft_fwd_benchmark.cc b/inference/peft/peft_fwd_benchmark.cc
new file mode 100644
index 0000000000..9ff042c157
--- /dev/null
+++ b/inference/peft/peft_fwd_benchmark.cc
@@ -0,0 +1,363 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/inference.h"
+#include "flexflow/request_manager.h"
+#include "models/falcon.h"
+#include "models/llama.h"
+#include "models/mpt.h"
+#include "models/opt.h"
+#include "models/starcoder.h"
+#include <wordexp.h>
+
+#include <nlohmann/json.hpp>
+
+using namespace FlexFlow;
+using namespace Legion;
+using json = nlohmann::json;
+
+Legion::Logger log_app("llama");
+
+struct FilePaths {
+  std::string cache_folder_path;
+  std::string prompt_file_path;
+  std::string output_file_path;
+};
+
+void parse_input_args(char **argv,
+                      int argc,
+                      FilePaths &paths,
+                      std::string &llm_model_name,
+                      std::string &peft_model_name,
+                      bool &use_full_precision,
+                      bool &verbose,
+                      bool &do_sample,
+                      bool &enable_peft,
+                      float &temperature,
+                      float &topp,
+                      int &max_requests_per_batch,
+                      int &max_tokens_per_batch,
+                      int &max_sequence_length,
+                      int &max_requests_to_run) {
+  for (int i = 1; i < argc; i++) {
+    // llm model type
+    if (!strcmp(argv[i], "-llm-model")) {
+      llm_model_name = std::string(argv[++i]);
+      for (char &c : llm_model_name) {
+        c = std::tolower(c);
+      }
+      continue;
+    }
+    if (!strcmp(argv[i], "-enable-peft")) {
+      enable_peft = true;
+      continue;
+    }
+    if (!strcmp(argv[i], "-peft-model")) {
+      peft_model_name = std::string(argv[++i]);
+      for (char &c : peft_model_name) {
+        c = std::tolower(c);
+      }
+      continue;
+    }
+    // cache folder
+    if (!strcmp(argv[i], "-cache-folder")) {
+      paths.cache_folder_path = std::string(argv[++i]);
+      continue;
+    }
+    // prompts
+    if (!strcmp(argv[i], "-prompt")) {
+      paths.prompt_file_path = std::string(argv[++i]);
+      continue;
+    }
+    // output file
+    if (!strcmp(argv[i], "-output-file")) {
+      paths.output_file_path = std::string(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--use-full-precision")) {
+      use_full_precision = true;
+      continue;
+    }
+    // verbose logging to stdout
+    if (!strcmp(argv[i], "--verbose")) {
+      verbose = true;
+      continue;
+    }
+    if (!strcmp(argv[i], "--do-sample")) {
+      do_sample = true;
+      continue;
+    }
+    if (!strcmp(argv[i], "--temperature")) {
+      temperature = std::stof(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--topp")) {
+      topp = std::stof(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--max-requests-per-batch")) {
+      max_requests_per_batch = std::stoi(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--max-tokens-per-batch")) {
+      max_tokens_per_batch = std::stoi(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--max-sequence-length")) {
+      max_sequence_length = std::stoi(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--max-requests-to-run")) {
+      max_requests_to_run = std::stoi(argv[++i]);
+      continue;
+    }
+  }
+  if (paths.cache_folder_path.empty()) {
+    char const *ff_cache_path = std::getenv("FF_CACHE_PATH");
+    paths.cache_folder_path = ff_cache_path ? std::string(ff_cache_path)
+                                            : std::string("~/.cache/flexflow");
+  }
+  // Expand ~ to the home directory if needed
+  wordexp_t p;
+  wordexp(paths.cache_folder_path.c_str(), &p, 0);
+  paths.cache_folder_path = p.we_wordv[0];
+  wordfree(&p);
+}
+
+void FlexFlow::top_level_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  FFConfig ffconfig;
+  if (ffconfig.cpu_offload == false && ffconfig.quantization_type != DT_NONE) {
+    assert(false && "Doesn't support quantization in non-offload mode");
+  }
+  FilePaths file_paths;
+  std::string llm_model_name, peft_model_name;
+  bool use_full_precision = false;
+  bool verbose = false;
+  bool do_sample = false;
+  bool enable_peft = false;
+  float temperature = 0.0f;
+  float topp = 0.0f;
+  int max_requests_per_batch = 8;
+  int max_tokens_per_batch = 128;
+  int max_sequence_length = 256;
+  int max_requests_to_run = 1000000000;
+  bool enable_peft_finetuning = false;
+
+  InputArgs const &command_args = HighLevelRuntime::get_input_args();
+  char **argv = command_args.argv;
+  int argc = command_args.argc;
+  parse_input_args(argv,
+                   argc,
+                   file_paths,
+                   llm_model_name,
+                   peft_model_name,
+                   use_full_precision,
+                   verbose,
+                   do_sample,
+                   enable_peft,
+                   temperature,
+                   topp,
+                   max_requests_per_batch,
+                   max_tokens_per_batch,
+                   max_sequence_length,
+                   max_requests_to_run);
+  assert(ffconfig.data_parallelism_degree * ffconfig.tensor_parallelism_degree *
+             ffconfig.pipeline_parallelism_degree ==
+         ffconfig.numNodes * ffconfig.workersPerNode);
+
+  std::string config_filepath = join_path(
+      {file_paths.cache_folder_path, "configs", llm_model_name, "config.json"});
+  std::string tokenizer_filepath =
+      join_path({file_paths.cache_folder_path, "tokenizers", llm_model_name});
+  std::string weights_filepath =
+      join_path({file_paths.cache_folder_path,
+                 "weights",
+                 llm_model_name,
+                 use_full_precision ? "full-precision" : "half-precision"});
+  std::ifstream config_file_handle(config_filepath);
+  if (!config_file_handle.good()) {
+    std::cout << "Model config file " << config_filepath << " not found."
+              << std::endl;
+    assert(false);
+  }
+  if (enable_peft && peft_model_name.empty()) {
+    std::cout << "PEFT enabled, but no PEFT model id passed" << std::endl;
+    assert(false);
+  } else if (!enable_peft && !peft_model_name.empty()) {
+    std::cout << "PEFT model id passed, but PEFT is not enabled" << std::endl;
+    assert(false);
+  }
+
+  json model_config = json::parse(config_file_handle,
+                                  /*parser_callback_t */ nullptr,
+                                  /*allow_exceptions */ true,
+                                  /*ignore_comments */ true);
+  ModelType model_type = ModelType::UNKNOWN;
+  auto architectures = model_config["architectures"];
+  for (auto const &str : architectures) {
+    if (str == "LlamaForCausalLM" || str == "LLaMAForCausalLM") {
+      model_type = ModelType::LLAMA;
+      break;
+    } else if (str == "OPTForCausalLM") {
+      model_type = ModelType::OPT;
+      break;
+    } else if (str == "RWForCausalLM" || str == "FalconForCausalLM") {
+      model_type = ModelType::FALCON;
+      break;
+    } else if (str == "GPTBigCodeForCausalLM") {
+      model_type = ModelType::STARCODER;
+      break;
+    } else if (str == "MPTForCausalLM") {
+      model_type = ModelType::MPT;
+      break;
+    }
+  }
+  int bos_token_id = model_config.find("bos_token_id") == model_config.end()
+                         ? -1
+                         : (int)model_config.at("bos_token_id");
+  int eos_token_id = model_config.find("eos_token_id") == model_config.end()
+                         ? -1
+                         : (int)model_config.at("eos_token_id");
+
+  assert(model_type != ModelType::UNKNOWN &&
+         "Invalid LLM model type passed (or no type was passed).");
+
+  // load PEFT config
+  LoraLinearConfig peft_config =
+      peft_model_name.empty()
+          ? LoraLinearConfig::EmptyConfig
+          : LoraLinearConfig(file_paths.cache_folder_path, peft_model_name);
+
+  GenerationConfig generationConfig(do_sample, temperature, topp);
+  RequestManager *rm = RequestManager::get_request_manager();
+  rm->set_max_requests_per_batch(
+      max_requests_per_batch +
+      (int)enable_peft_finetuning); // add one slot for finetuning if needed
+  rm->set_max_tokens_per_batch(max_tokens_per_batch);
+  rm->set_max_sequence_length(max_sequence_length);
+  rm->register_tokenizer(
+      model_type, bos_token_id, eos_token_id, tokenizer_filepath);
+  rm->register_output_filepath(file_paths.output_file_path);
+  rm->set_enable_peft_finetuning(enable_peft_finetuning);
+
+  FFModel model(ffconfig, ffconfig.cpu_offload);
+  if (model_type == ModelType::LLAMA) {
+    LLAMA::create_llama_model(model,
+                              config_filepath,
+                              weights_filepath,
+                              INC_DECODING_MODE,
+                              generationConfig,
+                              use_full_precision);
+  } else if (model_type == ModelType::OPT) {
+    OPT::create_opt_model(model,
+                          config_filepath,
+                          weights_filepath,
+                          INC_DECODING_MODE,
+                          use_full_precision);
+  } else if (model_type == ModelType::FALCON) {
+    FALCON::create_falcon_model(model,
+                                config_filepath,
+                                weights_filepath,
+                                INC_DECODING_MODE,
+                                use_full_precision);
+  } else if (model_type == ModelType::STARCODER) {
+    STARCODER::create_starcoder_model(model,
+                                      config_filepath,
+                                      weights_filepath,
+                                      INC_DECODING_MODE,
+                                      generationConfig,
+                                      use_full_precision);
+  } else if (model_type == ModelType::MPT) {
+    MPT::create_mpt_model(model,
+                          config_filepath,
+                          weights_filepath,
+                          INC_DECODING_MODE,
+                          generationConfig,
+                          use_full_precision);
+  } else {
+    assert(false && "unknow model type");
+  }
+
+  // Add PEFT layer
+  PEFTModelID *peft_model_id = nullptr;
+  if (!peft_model_name.empty()) {
+    peft_model_id = model.add_lora_layer(peft_config);
+  }
+
+  // Start background server
+  rm->start_background_server(&model);
+
+  // Run workload
+  {
+    std::vector<Request> requests;
+
+    // Add inference requests
+    using json = nlohmann::json;
+    std::ifstream file_handle(file_paths.prompt_file_path);
+    assert(file_handle.good() && "Prompt file does not exist.");
+    json prompt_json = json::parse(file_handle,
+                                   /*parser_callback_t */ nullptr,
+                                   /*allow_exceptions */ true,
+                                   /*ignore_comments */ true);
+    std::vector<std::pair<int, int>> prompts;
+    int index = 0;
+    for (auto &entry : prompt_json) {
+      if (index >= max_requests_to_run) {
+        break;
+      }
+      int prompt_length = entry["human"];
+      int sequence_length = entry["gpt"];
+      assert(prompt_length + sequence_length <= max_sequence_length &&
+             "Prompt + sequence length exceeds max sequence length");
+      prompts.push_back(std::make_pair(prompt_length, sequence_length));
+      index++;
+    }
+    printf("Total number of prompts: %ld", prompts.size());
+    for (auto &prompt : prompts) {
+      // printf("Prompt length: %d, sequence length: %d\n", prompt_length,
+      // sequence_length);
+      Request inference_req;
+      inference_req.benchmarking_tokens = prompt.first;
+      inference_req.max_sequence_length = prompt.second + prompt.first;
+      inference_req.peft_model_id =
+          (peft_model_id != nullptr) ? *peft_model_id : PEFTModelID::NO_ID;
+      requests.push_back(inference_req);
+    }
+
+    std::vector<GenerationResult> result = model.generate(requests);
+  }
+
+  // terminate the request manager by stopping the background thread
+  rm->terminate_background_server();
+
+  // Execution fence
+  {
+    Future future = runtime->issue_execution_fence(ctx);
+    future.get_void_result();
+  }
+
+  if (peft_model_id != nullptr) {
+    free(peft_model_id);
+  }
+
+  std::cout << "----------inference finished--------------" << std::endl;
+
+  // free tokenizer space in memory
+}
+
+void FlexFlow::register_custom_tasks() {}
diff --git a/inference/peft/req_rate_benchmark.cc b/inference/peft/req_rate_benchmark.cc
new file mode 100644
index 0000000000..43008e74fe
--- /dev/null
+++ b/inference/peft/req_rate_benchmark.cc
@@ -0,0 +1,518 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/inference.h"
+#include "flexflow/request_manager.h"
+#include "inference/models/falcon.h"
+#include "inference/models/llama.h"
+#include "inference/models/mpt.h"
+#include "inference/models/opt.h"
+#include "inference/models/starcoder.h"
+#include <chrono>
+#include <mutex>
+#include <thread>
+#include <wordexp.h>
+
+#include <nlohmann/json.hpp>
+
+using namespace FlexFlow;
+using namespace Legion;
+using json = nlohmann::json;
+
+Legion::Logger log_app("llama");
+
+class ConcurrentQueue {
+public:
+  std::queue<RequestManager::RequestGuid> inf_queue;
+  std::queue<RequestManager::RequestGuid> peft_queue;
+  std::mutex request_queue_mutex;
+  bool producer_finished = false;
+};
+
+ConcurrentQueue *common_guids_singleton = nullptr;
+int nb_millisecs = 1000; // Default bucket timeframe is 1 second
+
+ConcurrentQueue *get_common_guids_queue() {
+  if (common_guids_singleton == nullptr) {
+    common_guids_singleton = new ConcurrentQueue();
+  }
+  return common_guids_singleton;
+}
+
+void consume() {
+  RequestManager *rm = RequestManager::get_request_manager();
+  ConcurrentQueue *guids = get_common_guids_queue();
+  bool producer_is_finished = false;
+  bool queue_is_empty = false;
+  // int i=0;
+  while (!producer_is_finished || !queue_is_empty) {
+    RequestManager::RequestGuid guid = RequestManager::INVALID_GUID;
+    {
+      const std::lock_guard<std::mutex> lock(guids->request_queue_mutex);
+      queue_is_empty = guids->inf_queue.empty();
+      producer_is_finished = guids->producer_finished;
+      if (!queue_is_empty) {
+        guid = guids->inf_queue.front();
+        guids->inf_queue.pop();
+      }
+    }
+    if (guid != RequestManager::INVALID_GUID) {
+      GenerationResult result = rm->get_generation_result(guid);
+    } else {
+      std::this_thread::sleep_for(std::chrono::milliseconds(nb_millisecs));
+    }
+    // i++;
+    // cout << "Iteration " << i;
+  }
+  rm->set_inference_finished();
+
+  while (guids->peft_queue.size() > 0) {
+    GenerationResult result =
+        rm->get_generation_result(guids->peft_queue.front());
+    guids->peft_queue.pop();
+  }
+}
+
+struct FilePaths {
+  std::string cache_folder_path;
+  std::string prompt_file_path;
+  std::string output_file_path;
+};
+
+void parse_input_args(char **argv,
+                      int argc,
+                      FilePaths &paths,
+                      std::string &llm_model_name,
+                      std::string &peft_model_name,
+                      bool &use_full_precision,
+                      bool &verbose,
+                      bool &do_sample,
+                      bool &enable_peft,
+                      float &temperature,
+                      float &topp,
+                      int &max_requests_per_batch,
+                      int &max_tokens_per_batch,
+                      int &max_sequence_length,
+                      int &max_buckets_to_run,
+                      int &bucket_timeframe) {
+  for (int i = 1; i < argc; i++) {
+    // llm model type
+    if (!strcmp(argv[i], "-llm-model")) {
+      llm_model_name = std::string(argv[++i]);
+      for (char &c : llm_model_name) {
+        c = std::tolower(c);
+      }
+      continue;
+    }
+    if (!strcmp(argv[i], "-enable-peft")) {
+      enable_peft = true;
+      continue;
+    }
+    if (!strcmp(argv[i], "-peft-model")) {
+      peft_model_name = std::string(argv[++i]);
+      for (char &c : peft_model_name) {
+        c = std::tolower(c);
+      }
+      continue;
+    }
+    // cache folder
+    if (!strcmp(argv[i], "-cache-folder")) {
+      paths.cache_folder_path = std::string(argv[++i]);
+      continue;
+    }
+    // prompts
+    if (!strcmp(argv[i], "-prompt")) {
+      paths.prompt_file_path = std::string(argv[++i]);
+      continue;
+    }
+    // output file
+    if (!strcmp(argv[i], "-output-file")) {
+      paths.output_file_path = std::string(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--use-full-precision")) {
+      use_full_precision = true;
+      continue;
+    }
+    // verbose logging to stdout
+    if (!strcmp(argv[i], "--verbose")) {
+      verbose = true;
+      continue;
+    }
+    if (!strcmp(argv[i], "--do-sample")) {
+      do_sample = true;
+      continue;
+    }
+    if (!strcmp(argv[i], "--temperature")) {
+      temperature = std::stof(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--topp")) {
+      topp = std::stof(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--max-requests-per-batch")) {
+      max_requests_per_batch = std::stoi(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--max-tokens-per-batch")) {
+      max_tokens_per_batch = std::stoi(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--max-sequence-length")) {
+      max_sequence_length = std::stoi(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--max-buckets-to-run")) {
+      max_buckets_to_run = std::stoi(argv[++i]);
+      continue;
+    }
+    if (!strcmp(argv[i], "--bucket-timeframe")) {
+      bucket_timeframe = std::stoi(argv[++i]);
+      continue;
+    }
+  }
+  if (paths.cache_folder_path.empty()) {
+    char const *ff_cache_path = std::getenv("FF_CACHE_PATH");
+    paths.cache_folder_path = ff_cache_path ? std::string(ff_cache_path)
+                                            : std::string("~/.cache/flexflow");
+  }
+  // Expand ~ to the home directory if needed
+  wordexp_t p;
+  wordexp(paths.cache_folder_path.c_str(), &p, 0);
+  paths.cache_folder_path = p.we_wordv[0];
+  wordfree(&p);
+}
+
+void FlexFlow::top_level_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  FFConfig ffconfig;
+  if (ffconfig.cpu_offload == false && ffconfig.quantization_type != DT_NONE) {
+    assert(false && "Doesn't support quantization in non-offload mode");
+  }
+  FilePaths file_paths;
+  std::string llm_model_name, peft_model_name;
+  bool use_full_precision = false;
+  bool verbose = false;
+  bool do_sample = false;
+  bool enable_peft = false;
+  float temperature = 0.0f;
+  float topp = 0.0f;
+  int max_requests_per_batch = 8;
+  int max_tokens_per_batch = 128;
+  int max_sequence_length = 256;
+  int max_buckets_to_run = 1000000000;
+  bool enable_peft_finetuning = false;
+  int bucket_timespan = 1;
+
+  InputArgs const &command_args = HighLevelRuntime::get_input_args();
+  char **argv = command_args.argv;
+  int argc = command_args.argc;
+  parse_input_args(argv,
+                   argc,
+                   file_paths,
+                   llm_model_name,
+                   peft_model_name,
+                   use_full_precision,
+                   verbose,
+                   do_sample,
+                   enable_peft,
+                   temperature,
+                   topp,
+                   max_requests_per_batch,
+                   max_tokens_per_batch,
+                   max_sequence_length,
+                   max_buckets_to_run,
+                   bucket_timespan);
+  assert(ffconfig.data_parallelism_degree * ffconfig.tensor_parallelism_degree *
+             ffconfig.pipeline_parallelism_degree ==
+         ffconfig.numNodes * ffconfig.workersPerNode);
+
+  std::string config_filepath = join_path(
+      {file_paths.cache_folder_path, "configs", llm_model_name, "config.json"});
+  std::string tokenizer_filepath =
+      join_path({file_paths.cache_folder_path, "tokenizers", llm_model_name});
+  std::string weights_filepath =
+      join_path({file_paths.cache_folder_path,
+                 "weights",
+                 llm_model_name,
+                 use_full_precision ? "full-precision" : "half-precision"});
+  std::ifstream config_file_handle(config_filepath);
+  if (!config_file_handle.good()) {
+    std::cout << "Model config file " << config_filepath << " not found."
+              << std::endl;
+    assert(false);
+  }
+  if (enable_peft && peft_model_name.empty()) {
+    std::cout << "PEFT enabled, but no PEFT model id passed" << std::endl;
+    assert(false);
+  } else if (!enable_peft && !peft_model_name.empty()) {
+    std::cout << "PEFT model id passed, but PEFT is not enabled" << std::endl;
+    assert(false);
+  }
+
+  json model_config = json::parse(config_file_handle,
+                                  /*parser_callback_t */ nullptr,
+                                  /*allow_exceptions */ true,
+                                  /*ignore_comments */ true);
+  ModelType model_type = ModelType::UNKNOWN;
+  auto architectures = model_config["architectures"];
+  for (auto const &str : architectures) {
+    if (str == "LlamaForCausalLM" || str == "LLaMAForCausalLM") {
+      model_type = ModelType::LLAMA;
+      break;
+    } else if (str == "OPTForCausalLM") {
+      model_type = ModelType::OPT;
+      break;
+    } else if (str == "RWForCausalLM" || str == "FalconForCausalLM") {
+      model_type = ModelType::FALCON;
+      break;
+    } else if (str == "GPTBigCodeForCausalLM") {
+      model_type = ModelType::STARCODER;
+      break;
+    } else if (str == "MPTForCausalLM") {
+      model_type = ModelType::MPT;
+      break;
+    }
+  }
+  int bos_token_id = model_config.find("bos_token_id") == model_config.end()
+                         ? -1
+                         : (int)model_config.at("bos_token_id");
+  int eos_token_id = model_config.find("eos_token_id") == model_config.end()
+                         ? -1
+                         : (int)model_config.at("eos_token_id");
+
+  assert(model_type != ModelType::UNKNOWN &&
+         "Invalid LLM model type passed (or no type was passed).");
+
+  // load PEFT config
+  LoraLinearConfig peft_config =
+      peft_model_name.empty()
+          ? LoraLinearConfig::EmptyConfig
+          : LoraLinearConfig(file_paths.cache_folder_path, peft_model_name);
+
+  GenerationConfig generationConfig(do_sample, temperature, topp);
+  RequestManager *rm = RequestManager::get_request_manager();
+  rm->set_max_requests_per_batch(
+      max_requests_per_batch +
+      (int)enable_peft_finetuning); // add one slot for finetuning if needed
+  rm->set_max_tokens_per_batch(max_tokens_per_batch);
+  rm->set_max_sequence_length(max_sequence_length);
+  rm->register_tokenizer(
+      model_type, bos_token_id, eos_token_id, tokenizer_filepath);
+  rm->register_output_filepath(file_paths.output_file_path);
+  rm->set_enable_peft_finetuning(enable_peft_finetuning);
+
+  FFModel model(ffconfig, ffconfig.cpu_offload);
+  if (model_type == ModelType::LLAMA) {
+    LLAMA::create_llama_model(model,
+                              config_filepath,
+                              weights_filepath,
+                              INC_DECODING_MODE,
+                              generationConfig,
+                              use_full_precision);
+  } else if (model_type == ModelType::OPT) {
+    OPT::create_opt_model(model,
+                          config_filepath,
+                          weights_filepath,
+                          INC_DECODING_MODE,
+                          use_full_precision);
+  } else if (model_type == ModelType::FALCON) {
+    FALCON::create_falcon_model(model,
+                                config_filepath,
+                                weights_filepath,
+                                INC_DECODING_MODE,
+                                use_full_precision);
+  } else if (model_type == ModelType::STARCODER) {
+    STARCODER::create_starcoder_model(model,
+                                      config_filepath,
+                                      weights_filepath,
+                                      INC_DECODING_MODE,
+                                      generationConfig,
+                                      use_full_precision);
+  } else if (model_type == ModelType::MPT) {
+    MPT::create_mpt_model(model,
+                          config_filepath,
+                          weights_filepath,
+                          INC_DECODING_MODE,
+                          generationConfig,
+                          use_full_precision);
+  } else {
+    assert(false && "unknow model type");
+  }
+
+  // Add PEFT layer
+  PEFTModelID *peft_model_id = nullptr;
+  if (!peft_model_name.empty()) {
+    peft_model_id = model.add_lora_layer(peft_config);
+  }
+
+  rm->start_background_server(&model);
+
+  // Warmup stage
+  {
+    std::vector<Request> requests;
+    for (int i = 0; i < 100; i++) {
+      Request inference_req;
+      inference_req.benchmarking_tokens = 128;
+      inference_req.max_sequence_length = 256;
+      inference_req.warmup = true;
+      inference_req.peft_model_id =
+          (peft_model_id != nullptr) ? *peft_model_id : PEFTModelID::NO_ID;
+      requests.push_back(inference_req);
+    }
+
+    Request fine_tuning_req;
+    fine_tuning_req.req_type = RequestType::REQ_FINETUNING;
+    fine_tuning_req.benchmarking_tokens = 1024;
+    fine_tuning_req.max_sequence_length = 1024;
+    fine_tuning_req.warmup = true;
+    fine_tuning_req.peft_model_id =
+        (peft_model_id != nullptr) ? *peft_model_id : PEFTModelID::NO_ID;
+    fine_tuning_req.max_training_steps = 1;
+    requests.push_back(fine_tuning_req);
+    std::vector<GenerationResult> result = model.generate(requests);
+  }
+
+  rm->set_inference_finished(false); // reset inference finished flag
+  std::cout << "----------warmup finished--------------" << std::endl;
+
+  // Now run online workload!
+
+  nb_millisecs = nb_millisecs * bucket_timespan;
+  int total_num_requests = 0;
+  int num_arrival_buckets = 0;
+  ConcurrentQueue *guids = get_common_guids_queue();
+  std::thread consumer{consume};
+  {
+
+    // Load all requests in advance
+    using json = nlohmann::json;
+    std::ifstream file_handle(file_paths.prompt_file_path);
+    assert(file_handle.good() && "Prompt file does not exist.");
+    json prompt_json = json::parse(file_handle,
+                                   /*parser_callback_t */ nullptr,
+                                   /*allow_exceptions */ true,
+                                   /*ignore_comments */ true);
+
+    auto const &lists = prompt_json.get<std::vector<std::vector<json>>>();
+    std::vector<size_t> bucket_arrival_times_s;
+    std::vector<std::vector<std::pair<int, int>>> buckets;
+
+    size_t index = 0;
+    for (auto const &list : lists) {
+      if (!list.empty()) {
+        bucket_arrival_times_s.push_back(index);
+        std::vector<std::pair<int, int>> prompts;
+        for (auto const &dict : list) {
+          int prompt_length = dict["human"];
+          int sequence_length = dict["gpt"];
+          assert(prompt_length + sequence_length <= max_sequence_length &&
+                 "Prompt + sequence length exceeds max sequence length");
+          prompts.push_back(std::make_pair(prompt_length, sequence_length));
+        }
+        buckets.push_back(prompts);
+      }
+      index++;
+    }
+    assert(bucket_arrival_times_s.size() == buckets.size() &&
+           "Bucket arrival times and buckets are not the same size");
+    // for (int i=0; i<10; i++) {
+    //   printf("bucket_arrival_times_s[%i]: %i\n", i,
+    //   bucket_arrival_times_s[i]); printf("bucket[%i]: %i\n", i,
+    //   buckets[i].size()); for (const auto& prompt : buckets[i]) {
+    //     printf("\tprompt: %i, %i\n", prompt.first, prompt.second);
+    //   }
+    // }
+
+    // Add fine-tuning request
+    Request fine_tuning_req;
+    fine_tuning_req.req_type = RequestType::REQ_FINETUNING;
+    fine_tuning_req.benchmarking_tokens = 1024;
+    fine_tuning_req.max_sequence_length = 1024;
+    fine_tuning_req.peft_model_id =
+        (peft_model_id != nullptr) ? *peft_model_id : PEFTModelID::NO_ID;
+    fine_tuning_req.max_training_steps = 1000000000;
+    RequestManager::RequestGuid ft_guid =
+        rm->register_new_peft_request(fine_tuning_req);
+    if (ft_guid != RequestManager::INVALID_GUID) {
+      const std::lock_guard<std::mutex> lock(guids->request_queue_mutex);
+      guids->peft_queue.push(ft_guid);
+    }
+
+    // Replay the trace of inference requests
+    auto start_time = std::chrono::steady_clock::now();
+    for (int i = 0; i < bucket_arrival_times_s.size(); i++) {
+      if (bucket_arrival_times_s[i] >= max_buckets_to_run) {
+        break;
+      }
+      // sleep until bucket arrives
+      auto bucket_arrival_time =
+          start_time +
+          std::chrono::milliseconds(bucket_arrival_times_s[i] * nb_millisecs);
+      std::this_thread::sleep_until(bucket_arrival_time);
+
+      // create inference requests for the bucket
+      std::vector<Request> requests;
+      for (auto const &prompt : buckets[i]) {
+        // printf("Prompt length: %d, sequence length: %d\n", prompt_length,
+        // sequence_length);
+        Request inference_req;
+        inference_req.benchmarking_tokens = prompt.first;
+        inference_req.max_sequence_length = prompt.second + prompt.first;
+        inference_req.peft_model_id =
+            (peft_model_id != nullptr) ? *peft_model_id : PEFTModelID::NO_ID;
+        requests.push_back(inference_req);
+      }
+
+      {
+        const std::lock_guard<std::mutex> lock(guids->request_queue_mutex);
+        for (int i = 0; i < requests.size(); i++) {
+          RequestManager::RequestGuid guid =
+              rm->register_new_request(requests.at(i));
+          if (guid != RequestManager::INVALID_GUID) {
+            guids->inf_queue.push(guid);
+          }
+        }
+      }
+    }
+
+    { // Notify the consumer that no more requests are incoming
+      const std::lock_guard<std::mutex> lock(guids->request_queue_mutex);
+      guids->producer_finished = true;
+    }
+  }
+
+  // Wait for consumer to finish
+  consumer.join();
+
+  // terminate the request manager by stopping the background thread
+  rm->terminate_background_server();
+
+  // Execution fence
+  {
+    Future future = runtime->issue_execution_fence(ctx);
+    future.get_void_result();
+  }
+
+  // float* data
+  std::cout << "----------inference finished--------------" << std::endl;
+
+  // free tokenizer space in memory
+}
+
+void FlexFlow::register_custom_tasks() {}
diff --git a/inference/python/ff_peft.py b/inference/python/ff_peft.py
new file mode 100644
index 0000000000..a7d38a66b6
--- /dev/null
+++ b/inference/python/ff_peft.py
@@ -0,0 +1,189 @@
+# Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+import flexflow.serve as ff
+import argparse, json, os
+from types import SimpleNamespace
+
+
+def get_configs():
+    parser = argparse.ArgumentParser()
+    parser.add_argument(
+        "-config-file",
+        help="The path to a JSON file with the configs. If omitted, a sample model and configs will be used instead.",
+        type=str,
+        default="",
+    )
+    args = parser.parse_args()
+
+    # Load configs from JSON file (if specified)
+    if len(args.config_file) > 0:
+        if not os.path.isfile(args.config_file):
+            raise FileNotFoundError(f"Config file {args.config_file} not found.")
+        try:
+            with open(args.config_file) as f:
+                return json.load(f)
+        except json.JSONDecodeError as e:
+            print("JSON format error:")
+            print(e)
+    else:
+        # Define sample configs
+        ff_init_configs = {
+            # required parameters
+            "num_gpus": 2,
+            "memory_per_gpu": 14000,
+            "zero_copy_memory_per_node": 10000,
+            # optional parameters
+            "num_cpus": 4,
+            "legion_utility_processors": 4,
+            "data_parallelism_degree": 1,
+            "tensor_parallelism_degree": 2,
+            "pipeline_parallelism_degree": 1,
+            "offload": False,
+            "offload_reserve_space_size": 8 * 1024,  # 8GB
+            "use_4bit_quantization": False,
+            "use_8bit_quantization": False,
+            "enable_peft": True,
+            "peft_activation_reserve_space_size": 1024,  # 1GB
+            "peft_weight_reserve_space_size": 1024,  # 1GB
+            "profiling": False,
+            "inference_debugging": True,
+            "fusion": False,
+        }
+        model_configs = {
+            # required parameters
+            "base_model": "JackFram/llama-160m",
+            "inference_peft_model_id": "goliaro/llama-160m-lora",
+            "finetuning_peft_model_id": "goliaro/llama-160m-lora",
+            # "base_model": "meta-llama/Meta-Llama-3-8B",
+            # "inference_peft_model_id": "goliaro/llama-3-8b-lora",
+            # "finetuning_peft_model_id": "goliaro/llama-3-8b-lora-dolly",
+            # optional parameters
+            "cache_path": os.environ.get("FF_CACHE_PATH", ""),
+            "refresh_cache": False,
+            "full_precision": True,
+            "prompt": "",
+            "finetuning_dataset": os.path.join(
+                os.path.dirname(os.path.abspath(__file__)),
+                "../prompt/peft_dataset.json",
+            ),
+            "output_file": "",
+        }
+        # Merge dictionaries
+        ff_init_configs.update(model_configs)
+        return ff_init_configs
+
+
+def main():
+    configs_dict = get_configs()
+    configs = SimpleNamespace(**configs_dict)
+
+    # Initialize the FlexFlow runtime. ff.init() takes a dictionary or the path to a JSON file with the configs
+    ff.init(configs_dict)
+
+    # Create the FlexFlow LLM
+    ff_data_type = (
+        ff.DataType.DT_FLOAT if configs.full_precision else ff.DataType.DT_HALF
+    )
+    llm = ff.LLM(
+        configs.base_model,
+        data_type=ff_data_type,
+        cache_path=configs.cache_path,
+        refresh_cache=configs.refresh_cache,
+        output_file=configs.output_file,
+    )
+    # Add inference and/or finetuning lora
+    lora_inference_config = None
+    lora_finetuning_config = None
+    if len(configs.prompt) > 0:
+        lora_inference_config = ff.LoraLinearConfig(
+            llm.cache_path,
+            configs.inference_peft_model_id,
+            base_model_name_or_path=configs.base_model,
+        )
+        llm.add_peft(lora_inference_config)
+    if len(configs.finetuning_dataset) > 0:
+        # lora_finetuning_config = ff.LoraLinearConfig(
+        #     llm.cache_path,
+        #     configs.finetuning_peft_model_id,
+        #     target_modules=["down_proj"],
+        #     rank=16,
+        #     lora_alpha=16,
+        #     trainable=True,
+        #     init_lora_weights=True,
+        #     optimizer_type=ff.OptimizerType.OPTIMIZER_TYPE_SGD,
+        # )
+        lora_finetuning_config = ff.LoraLinearConfig(
+            llm.cache_path,
+            configs.inference_peft_model_id,
+            trainable=True,
+            base_model_name_or_path=configs.base_model,
+            optimizer_type=ff.OptimizerType.OPTIMIZER_TYPE_SGD,
+            optimizer_kwargs={
+                "learning_rate": 0.001,
+                "momentum": 0.0,
+                "weight_decay": 0.0,
+                "nesterov": False,
+            },
+        )
+        llm.add_peft(lora_finetuning_config)
+
+    # Compile the LLM for inference and load the weights into memory
+    generation_config = ff.GenerationConfig(
+        do_sample=False, temperature=0.9, topp=0.8, topk=1
+    )
+    enable_peft_finetuning = len(configs.finetuning_dataset) > 0
+    llm.compile(
+        generation_config,
+        enable_peft_finetuning=enable_peft_finetuning,
+        max_requests_per_batch=1 if not enable_peft_finetuning else 2,
+        max_seq_length=256,
+        max_tokens_per_batch=128,
+    )
+
+    llm.start_server()
+
+    requests = []
+    # Serving
+    if len(configs.prompt) > 0:
+        prompts = [s for s in json.load(open(configs.prompt))]
+        inference_requests = [
+            ff.Request(
+                ff.RequestType.REQ_INFERENCE,
+                prompt=prompt,
+                max_sequence_length=128,
+                peft_model_id=llm.get_ff_peft_id(lora_inference_config),
+            )
+            for prompt in prompts
+        ]
+        requests += inference_requests
+    # Finetuning
+    if len(configs.finetuning_dataset) > 0:
+        finetuning_request = ff.Request(
+            ff.RequestType.REQ_FINETUNING,
+            max_sequence_length=128,
+            peft_model_id=llm.get_ff_peft_id(lora_finetuning_config),
+            dataset_filepath=configs.finetuning_dataset,
+            max_training_steps=2,
+        )
+        requests.append(finetuning_request)
+
+    results = llm.generate(requests)
+
+    llm.stop_server()
+
+
+if __name__ == "__main__":
+    print("flexflow PEFT example")
+    main()
diff --git a/inference/python/incr_decoding.py b/inference/python/incr_decoding.py
index 05599ea6b9..f888982f2c 100644
--- a/inference/python/incr_decoding.py
+++ b/inference/python/incr_decoding.py
@@ -51,9 +51,12 @@ def get_configs():
             "tensor_parallelism_degree": 1,
             "pipeline_parallelism_degree": 2,
             "offload": False,
-            "offload_reserve_space_size": 1024**2,
+            "offload_reserve_space_size": 8 * 1024, # 8GB
             "use_4bit_quantization": False,
             "use_8bit_quantization": False,
+            "enable_peft": False,
+            "peft_activation_reserve_space_size": 1024, # 1GB
+            "peft_weight_reserve_space_size": 1024, # 1GB
             "profiling": False,
             "benchmarking": False,
             "inference_debugging": False,
diff --git a/inference/python/peft_demo/INSTRUCTIONS.md b/inference/python/peft_demo/INSTRUCTIONS.md
new file mode 100644
index 0000000000..9b2a7a53b2
--- /dev/null
+++ b/inference/python/peft_demo/INSTRUCTIONS.md
@@ -0,0 +1,25 @@
+## Peft Demo
+* `git clone -b peft --recursive https://github.com/flexflow/FlexFlow.git`
+* `cd FlexFlow/`
+
+* If you wish to run the demo by installing FlexFlow
+    * `conda env create -f conda/flexflow.yml`
+    * `conda activate flexflow`
+
+* If you wish to run the demo using a Docker container
+    * `export FF_CUDA_ARCH=all && export cuda_version=12.0 && ./docker/build.sh flexflow && ./docker/run.sh flexflow`
+
+* Then, install the Llama2 model (the `meta-llama/Llama-2-7b-hf` model is gated, so make sure to add your HF access token)
+
+    * `export HUGGINGFACE_TOKEN="[Your token]"`
+    * `huggingface-cli login --token "$HUGGINGFACE_TOKEN"`
+    * `python3 inference/utils/download_peft_model.py "goliaro/llama-2-7b-lora-full" --base_model_name "meta-llama/Llama-2-7b-hf"`
+
+* Run the demo
+    ```
+    mkdir inference/output
+    cd inference/python/peft_demo/
+    python3 demo.py -config-file demo_config.json
+    ```
+
+
diff --git a/inference/python/peft_demo/demo.ipynb b/inference/python/peft_demo/demo.ipynb
new file mode 100644
index 0000000000..dfb5193a1d
--- /dev/null
+++ b/inference/python/peft_demo/demo.ipynb
@@ -0,0 +1,1907 @@
+{
+ "cells": [
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "# FlexFlow Co-Serving Demo\n"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 1,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "/opt/conda/lib/python3.11/site-packages/tqdm/auto.py:21: TqdmWarning: IProgress not found. Please update jupyter and ipywidgets. See https://ipywidgets.readthedocs.io/en/stable/user_install.html\n",
+      "  from .autonotebook import tqdm as notebook_tqdm\n"
+     ]
+    }
+   ],
+   "source": [
+    "import json, random, subprocess, os\n",
+    "from datasets import load_dataset\n",
+    "from types import SimpleNamespace\n",
+    "from huggingface_hub import HfFolder\n",
+    "import flexflow.serve as ff\n",
+    "import matplotlib.pyplot as plt\n",
+    "\n",
+    "%matplotlib inline"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 2,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "def create_datasets(finetune_dataset_size=2, inference_file_path='inference_dataset.json', finetuning_file_path='finetuning_dataset.json'):\n",
+    "    \"\"\"Creates the inference and finetuning datasets according to the data from https://huggingface.co/datasets/databricks/databricks-dolly-15k.\n",
+    "    Only the 'open_qa' and 'closed_qa' prompts without context are kept.\n",
+    "    The datasets are saved into the files given as arguments.\n",
+    "\n",
+    "    Keyword arguments:\n",
+    "    dataset_size -- the number of prompts to consider\n",
+    "    inference_file_path -- the file in which to save the inference data\n",
+    "    finetuning_file_path -- the file in which to save the finetuning data\n",
+    "    \"\"\"\n",
+    "    dataset = load_dataset(\"databricks/databricks-dolly-15k\", split=\"train\")\n",
+    "    inference_data = []\n",
+    "    finetuning_data = []\n",
+    "    for row in dataset:\n",
+    "        if len(finetuning_data) == finetune_dataset_size:\n",
+    "            break\n",
+    "        if (\"open_qa\" in row['category'] or \"closed_qa\" in row['category']) and len(row['context']) == 0:\n",
+    "            inference_data.append(row['instruction'])\n",
+    "            finetuning_data.append(row['instruction'] + \" \" + row['response'])\n",
+    "    with open(inference_file_path, 'w') as file:\n",
+    "        json.dump(inference_data[:1], file)\n",
+    "    with open(finetuning_file_path, 'w') as file:\n",
+    "        json.dump(finetuning_data[:1], file, indent=2, separators=(',', ': '))"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Configuration fields"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 3,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "configs_dict = {\n",
+    "    \"num_gpus\": 1,\n",
+    "    \"memory_per_gpu\": 21000,\n",
+    "    \"zero_copy_memory_per_node\": 40000,\n",
+    "    \"num_cpus\": 4,\n",
+    "    \"legion_utility_processors\": 4,\n",
+    "    \"data_parallelism_degree\": 1,\n",
+    "    \"tensor_parallelism_degree\": 1,\n",
+    "    \"pipeline_parallelism_degree\": 1,\n",
+    "    \"offload\": False,\n",
+    "    \"offload_reserve_space_size\": 8 * 1024,  # 8GB\n",
+    "    \"use_4bit_quantization\": False,\n",
+    "    \"use_8bit_quantization\": False,\n",
+    "    \"enable_peft\": True,\n",
+    "    \"peft_activation_reserve_space_size\": 1024,  # 1GB\n",
+    "    \"peft_weight_reserve_space_size\": 1024,  # 1GB\n",
+    "    \"profiling\": False,\n",
+    "    \"inference_debugging\": False,\n",
+    "    \"fusion\": False,\n",
+    "    \"max_requests_per_batch\": 1,\n",
+    "    \"max_sequence_length\": 128,\n",
+    "    \"max_tokens_per_batch\": 128,\n",
+    "    \"max_training_steps\": 100,\n",
+    "    \"seed\": 42,\n",
+    "}\n",
+    "model_configs = {\n",
+    "    \"base_model\": \"meta-llama/Meta-Llama-3-8B\",\n",
+    "    \"inference_peft_model_id\": \"goliaro/llama-3-8b-lora\",\n",
+    "    \"finetuning_peft_model_id\": \"goliaro/llama-3-8b-lora\",\n",
+    "    \"cache_path\": os.environ.get(\"FF_CACHE_PATH\", \"\"),\n",
+    "    \"refresh_cache\": False,\n",
+    "    \"full_precision\": False,\n",
+    "    # relative paths\n",
+    "    \"inference_dataset\": \"inference_dataset.json\",\n",
+    "    \"finetuning_dataset\": \"/usr/FlexFlow/inference/prompt/peft_dataset.json\",\n",
+    "    \"output_file\": \"peft_demo.txt\",\n",
+    "}\n",
+    "generation_configs = {\n",
+    "    \"do_sample\": False,\n",
+    "    \"temperature\": 0.9,\n",
+    "    \"topp\": 0.8,\n",
+    "    \"topk\": 1,\n",
+    "}\n",
+    "finetuning_configs = {\n",
+    "    \"learning_rate\": 0.001,\n",
+    "    \"momentum\": 0.0,\n",
+    "    \"weight_decay\": 0.0,\n",
+    "    \"nesterov\": False,\n",
+    "}\n",
+    "# Merge dictionaries\n",
+    "configs_dict.update(model_configs)\n",
+    "configs_dict.update(generation_configs)\n",
+    "configs_dict.update(finetuning_configs)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 4,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "random.seed(configs_dict[\"seed\"])\n",
+    "\n",
+    "configs = SimpleNamespace(**configs_dict)\n",
+    "\n",
+    "create_datasets(inference_file_path=configs_dict[\"inference_dataset\"], \n",
+    "                finetuning_file_path=configs_dict[\"finetuning_dataset\"])\n",
+    "\n",
+    "# Clear output file\n",
+    "with open(configs.output_file, 'w') as file:\n",
+    "    file.write('')"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Download base and peft inference models"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 5,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "/opt/conda/lib/python3.11/site-packages/huggingface_hub/file_download.py:1132: FutureWarning: `resume_download` is deprecated and will be removed in version 1.0.0. Downloads always resume when possible. If you want to force a new download, use `force_download=True`.\n",
+      "  warnings.warn(\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Creating directory /root/.cache/flexflow/configs/meta-llama/meta-llama-3-8b (if it doesn't exist)...\n",
+      "Saving meta-llama/Meta-Llama-3-8B configs to file /root/.cache/flexflow/configs/meta-llama/meta-llama-3-8b/config.json...\n",
+      "Saving goliaro/llama-3-8b-lora configs to file /root/.cache/flexflow/configs/goliaro/llama-3-8b-lora/config.json...\n",
+      "Loading tokenizer...\n",
+      "Creating directory /root/.cache/flexflow/configs/meta-llama/meta-llama-3-8b (if it doesn't exist)...\n",
+      "Saving meta-llama/Meta-Llama-3-8B configs to file /root/.cache/flexflow/configs/meta-llama/meta-llama-3-8b/config.json...\n",
+      "Saving goliaro/llama-3-8b-lora configs to file /root/.cache/flexflow/configs/goliaro/llama-3-8b-lora/config.json...\n",
+      "Loading tokenizer...\n"
+     ]
+    },
+    {
+     "data": {
+      "text/plain": [
+       "CompletedProcess(args=['python', '../../utils/download_peft_model.py', 'goliaro/llama-3-8b-lora', '--base_model_name', 'meta-llama/Meta-Llama-3-8B'], returncode=0)"
+      ]
+     },
+     "execution_count": 5,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "args = [configs.inference_peft_model_id, '--base_model_name', configs.base_model]\n",
+    "subprocess.run(['python', '../../utils/download_peft_model.py'] + args)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Initialize FlexFlow runtime and LLM object"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 6,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "[0 - 7f4d49d21280]    0.672934 {3}{Mapper}: Enabled Control Replication Optimizations.\n",
+      "[0 - 7f4d49d21280]    0.672995 {3}{Mapper}: Enabled Control Replication Optimizations.\n",
+      "[0 - 7f4d49d21280]    0.673107 {3}{Mapper}: Enabled Control Replication Optimizations.\n",
+      "[0 - 7f4d49d21280]    0.673118 {3}{Mapper}: Enabled Control Replication Optimizations.\n",
+      "[0 - 7f4d49d21280]    0.673124 {3}{Mapper}: Enabled Control Replication Optimizations.\n",
+      "/opt/conda/lib/python3.11/site-packages/huggingface_hub/file_download.py:1132: FutureWarning: `resume_download` is deprecated and will be removed in version 1.0.0. Downloads always resume when possible. If you want to force a new download, use `force_download=True`.\n",
+      "  warnings.warn(\n",
+      "workSpaceSize (128 MB)\n",
+      "Creating directory /root/.cache/flexflow/configs/meta-llama/meta-llama-3-8b (if it doesn't exist)...\n",
+      "Saving meta-llama/Meta-Llama-3-8B configs to file /root/.cache/flexflow/configs/meta-llama/meta-llama-3-8b/config.json...\n",
+      "Saving goliaro/llama-3-8b-lora configs to file /root/.cache/flexflow/configs/goliaro/llama-3-8b-lora/config.json...\n",
+      "Saving goliaro/llama-3-8b-lora configs to file /root/.cache/flexflow/configs/goliaro/llama-3-8b-lora/config.json...\n",
+      "Loading tokenizer...\n",
+      "Adding layer layers.0.mlp.down_proj.lora\n",
+      "Adding layer layers.1.mlp.down_proj.lora\n",
+      "Adding layer layers.2.mlp.down_proj.lora\n",
+      "Adding layer layers.3.mlp.down_proj.lora\n",
+      "Adding layer layers.4.mlp.down_proj.lora\n",
+      "Adding layer layers.5.mlp.down_proj.lora\n",
+      "Adding layer layers.6.mlp.down_proj.lora\n",
+      "Adding layer layers.7.mlp.down_proj.lora\n",
+      "Adding layer layers.8.mlp.down_proj.lora\n",
+      "Adding layer layers.9.mlp.down_proj.lora\n",
+      "Adding layer layers.10.mlp.down_proj.lora\n",
+      "Adding layer layers.11.mlp.down_proj.lora\n",
+      "Adding layer layers.12.mlp.down_proj.lora\n",
+      "Adding layer layers.13.mlp.down_proj.lora\n",
+      "Adding layer layers.14.mlp.down_proj.lora\n",
+      "Adding layer layers.15.mlp.down_proj.lora\n",
+      "Adding layer layers.16.mlp.down_proj.lora\n",
+      "Adding layer layers.17.mlp.down_proj.lora\n",
+      "Adding layer layers.18.mlp.down_proj.lora\n",
+      "Adding layer layers.19.mlp.down_proj.lora\n",
+      "Adding layer layers.20.mlp.down_proj.lora\n",
+      "Adding layer layers.21.mlp.down_proj.lora\n",
+      "Adding layer layers.22.mlp.down_proj.lora\n",
+      "Adding layer layers.23.mlp.down_proj.lora\n",
+      "Adding layer layers.24.mlp.down_proj.lora\n",
+      "Adding layer layers.25.mlp.down_proj.lora\n",
+      "Adding layer layers.26.mlp.down_proj.lora\n",
+      "Adding layer layers.27.mlp.down_proj.lora\n",
+      "Adding layer layers.28.mlp.down_proj.lora\n",
+      "Adding layer layers.29.mlp.down_proj.lora\n",
+      "Adding layer layers.30.mlp.down_proj.lora\n",
+      "Adding layer layers.31.mlp.down_proj.lora\n"
+     ]
+    }
+   ],
+   "source": [
+    "# Initialize the FlexFlow runtime. ff.init() takes a dictionary or the path to a JSON file with the configs\n",
+    "ff.init(configs_dict)\n",
+    "\n",
+    "# Create the FlexFlow LLM\n",
+    "ff_data_type = (\n",
+    "    ff.DataType.DT_FLOAT if configs.full_precision else ff.DataType.DT_HALF\n",
+    ")\n",
+    "llm = ff.LLM(\n",
+    "    configs.base_model,\n",
+    "    data_type=ff_data_type,\n",
+    "    cache_path=configs.cache_path,\n",
+    "    refresh_cache=configs.refresh_cache,\n",
+    "    output_file=configs.output_file,\n",
+    ")\n",
+    "# Add inference and/or finetuning lora\n",
+    "lora_inference_config = None\n",
+    "lora_finetuning_config = None\n",
+    "if len(configs.inference_dataset) > 0:\n",
+    "    lora_inference_config = ff.LoraLinearConfig(\n",
+    "        llm.cache_path, \n",
+    "        configs.inference_peft_model_id,\n",
+    "        base_model_name_or_path=configs.base_model\n",
+    "    )\n",
+    "    llm.add_peft(lora_inference_config)\n",
+    "if len(configs.finetuning_dataset) > 0:\n",
+    "    lora_finetuning_config = ff.LoraLinearConfig(\n",
+    "        llm.cache_path,\n",
+    "        configs.finetuning_peft_model_id,\n",
+    "        trainable=True,\n",
+    "        init_lora_weights=False,\n",
+    "        rank=16,\n",
+    "        lora_alpha=16.0,\n",
+    "        # target_modules = [\"down_proj\"],\n",
+    "        base_model_name_or_path=configs.base_model,\n",
+    "        optimizer_type=ff.OptimizerType.OPTIMIZER_TYPE_SGD,\n",
+    "        optimizer_kwargs={\n",
+    "            \"learning_rate\": configs.learning_rate,\n",
+    "            \"momentum\": configs.momentum,\n",
+    "            \"weight_decay\": configs.weight_decay,\n",
+    "            \"nesterov\": configs.nesterov,\n",
+    "        },\n",
+    "    )\n",
+    "    llm.add_peft(lora_finetuning_config)\n",
+    "\n",
+    "# Compile the LLM for inference and load the weights into memory\n",
+    "generation_config = ff.GenerationConfig(\n",
+    "    do_sample=configs.do_sample,\n",
+    "    temperature=configs.temperature,\n",
+    "    topp=configs.topp,\n",
+    "    topk=configs.topk\n",
+    ")\n",
+    "enable_peft_finetuning = len(configs.finetuning_dataset) > 0\n",
+    "llm.compile(\n",
+    "    generation_config,\n",
+    "    enable_peft_finetuning=enable_peft_finetuning,\n",
+    "    max_requests_per_batch=configs.max_requests_per_batch+int(enable_peft_finetuning),\n",
+    "    max_seq_length=configs.max_sequence_length,\n",
+    "    max_tokens_per_batch=configs.max_tokens_per_batch,\n",
+    ")"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Start the LLM Co-serving system"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 7,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Background server started.\n",
+      "2024-07-22 06:45:43 - ###PEFT DEBUGGING### Starting background serving task.\n",
+      "2024-07-22 06:45:43 - ###PEFT DEBUGGING### Updated models' configuration.\n",
+      "###PEFT DEBUGGING### LLM Model object exists.\n",
+      "###PEFT DEBUGGING### Model object exists.\n",
+      "###PEFT DEBUGGING### Model object still exists.\n",
+      "###PEFT DEBUGGING### Entering compile_inference.\n",
+      "###PEFT DEBUGGING### Configuration check passed: At least four CPU cores per node.\n"
+     ]
+    }
+   ],
+   "source": [
+    "llm.start_server()"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Generate inference"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 8,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "###PEFT DEBUGGING### Launching graph optimization task.\n",
+      "[<flexflow.core.flexflow_cffi.Request object at 0x7f4ce8e13250>]\n",
+      "num_nodes = 1 num_gpus_per_node = 1\n",
+      "[0]10445\n",
+      "[1]649\n",
+      "[2]6730\n",
+      "[3]2053\n",
+      "[4]18167\n",
+      "[5]369\n",
+      "[6]1317\n",
+      "[7]2085\n",
+      "[8]3090\n",
+      "[9]30\n",
+      "No small speculative model registered, using incremental decoding.\n",
+      "[0 - 7f4d49d21280]    1.600215 {3}{RequestManager}: [1000000]New request tokens: 128000 10445 649 6730 2053 18167 369 1317 2085 3090 30\n",
+      "optimal_views.size = 262\n",
+      "views.size() = 262\n",
+      "###PEFT DEBUGGING### Operators reconstructed from optimized graph.\n",
+      "###PEFT DEBUGGING### Starting inplace optimizations.\n",
+      "###PEFT DEBUGGING### Mapping output tensors.\n",
+      "ndim(1) dims[1 0 0 0]\n",
+      "###PEFT DEBUGGING### Setting up NCCL communications.\n",
+      "###PEFT DEBUGGING### compile_inference completed successfully.\n",
+      "Loading weight file embed_tokens.weight\n",
+      "Loading weight file layers.0.input_layernorm.weight\n",
+      "Loading weight file layers.0.self_attn.q_proj.weight\n",
+      "Loading weight file layers.0.self_attn.k_proj.weight\n",
+      "Loading weight file layers.0.self_attn.v_proj.weight\n",
+      "Loading weight file layers.0.self_attn.o_proj.weight\n",
+      "Loading weight file layers.0.post_attention_layernorm.weight\n",
+      "Loading weight file layers.0.mlp.gate_proj.weight\n",
+      "Loading weight file layers.0.mlp.up_proj.weight\n",
+      "Loading weight file layers.0.mlp.down_proj.weight\n",
+      "Loading weight file layers.1.input_layernorm.weight\n",
+      "Loading weight file layers.1.self_attn.q_proj.weight\n",
+      "Loading weight file layers.1.self_attn.k_proj.weight\n",
+      "Loading weight file layers.1.self_attn.v_proj.weight\n",
+      "Loading weight file layers.1.self_attn.o_proj.weight\n",
+      "Loading weight file layers.1.post_attention_layernorm.weight\n",
+      "Loading weight file layers.1.mlp.gate_proj.weight\n",
+      "Loading weight file layers.1.mlp.up_proj.weight\n",
+      "Loading weight file layers.1.mlp.down_proj.weight\n",
+      "Loading weight file layers.2.input_layernorm.weight\n",
+      "Loading weight file layers.2.self_attn.q_proj.weight\n",
+      "Loading weight file layers.2.self_attn.k_proj.weight\n",
+      "Loading weight file layers.2.self_attn.v_proj.weight\n",
+      "Loading weight file layers.2.self_attn.o_proj.weight\n",
+      "Loading weight file layers.2.post_attention_layernorm.weight\n",
+      "Loading weight file layers.2.mlp.gate_proj.weight\n",
+      "Loading weight file layers.2.mlp.up_proj.weight\n",
+      "Loading weight file layers.2.mlp.down_proj.weight\n",
+      "Loading weight file layers.3.input_layernorm.weight\n",
+      "Loading weight file layers.3.self_attn.q_proj.weight\n",
+      "Loading weight file layers.3.self_attn.k_proj.weight\n",
+      "Loading weight file layers.3.self_attn.v_proj.weight\n",
+      "Loading weight file layers.3.self_attn.o_proj.weight\n",
+      "Loading weight file layers.3.post_attention_layernorm.weight\n",
+      "Loading weight file layers.3.mlp.gate_proj.weight\n",
+      "Loading weight file layers.3.mlp.up_proj.weight\n",
+      "Loading weight file layers.3.mlp.down_proj.weight\n",
+      "Loading weight file layers.4.input_layernorm.weight\n",
+      "Loading weight file layers.4.self_attn.q_proj.weight\n",
+      "Loading weight file layers.4.self_attn.k_proj.weight\n",
+      "Loading weight file layers.4.self_attn.v_proj.weight\n",
+      "Loading weight file layers.4.self_attn.o_proj.weight\n",
+      "Loading weight file layers.4.post_attention_layernorm.weight\n",
+      "Loading weight file layers.4.mlp.gate_proj.weight\n",
+      "Loading weight file layers.4.mlp.up_proj.weight\n",
+      "Loading weight file layers.4.mlp.down_proj.weight\n",
+      "Loading weight file layers.5.input_layernorm.weight\n",
+      "Loading weight file layers.5.self_attn.q_proj.weight\n",
+      "Loading weight file layers.5.self_attn.k_proj.weight\n",
+      "Loading weight file layers.5.self_attn.v_proj.weight\n",
+      "Loading weight file layers.5.self_attn.o_proj.weight\n",
+      "Loading weight file layers.5.post_attention_layernorm.weight\n",
+      "Loading weight file layers.5.mlp.gate_proj.weight\n",
+      "Loading weight file layers.5.mlp.up_proj.weight\n",
+      "Loading weight file layers.5.mlp.down_proj.weight\n",
+      "Loading weight file layers.6.input_layernorm.weight\n",
+      "Loading weight file layers.6.self_attn.q_proj.weight\n",
+      "Loading weight file layers.6.self_attn.k_proj.weight\n",
+      "Loading weight file layers.6.self_attn.v_proj.weight\n",
+      "Loading weight file layers.6.self_attn.o_proj.weight\n",
+      "Loading weight file layers.6.post_attention_layernorm.weight\n",
+      "Loading weight file layers.6.mlp.gate_proj.weight\n",
+      "Loading weight file layers.6.mlp.up_proj.weight\n",
+      "Loading weight file layers.6.mlp.down_proj.weight\n",
+      "Loading weight file layers.7.input_layernorm.weight\n",
+      "Loading weight file layers.7.self_attn.q_proj.weight\n",
+      "Loading weight file layers.7.self_attn.k_proj.weight\n",
+      "Loading weight file layers.7.self_attn.v_proj.weight\n",
+      "Loading weight file layers.7.self_attn.o_proj.weight\n",
+      "Loading weight file layers.7.post_attention_layernorm.weight\n",
+      "Loading weight file layers.7.mlp.gate_proj.weight\n",
+      "Loading weight file layers.7.mlp.up_proj.weight\n",
+      "Loading weight file layers.7.mlp.down_proj.weight\n",
+      "Loading weight file layers.8.input_layernorm.weight\n",
+      "Loading weight file layers.8.self_attn.q_proj.weight\n",
+      "Loading weight file layers.8.self_attn.k_proj.weight\n",
+      "Loading weight file layers.8.self_attn.v_proj.weight\n",
+      "Loading weight file layers.8.self_attn.o_proj.weight\n",
+      "Loading weight file layers.8.post_attention_layernorm.weight\n",
+      "Loading weight file layers.8.mlp.gate_proj.weight\n",
+      "Loading weight file layers.8.mlp.up_proj.weight\n",
+      "Loading weight file layers.8.mlp.down_proj.weight\n",
+      "Loading weight file layers.9.input_layernorm.weight\n",
+      "Loading weight file layers.9.self_attn.q_proj.weight\n",
+      "Loading weight file layers.9.self_attn.k_proj.weight\n",
+      "Loading weight file layers.9.self_attn.v_proj.weight\n",
+      "Loading weight file layers.9.self_attn.o_proj.weight\n",
+      "Loading weight file layers.9.post_attention_layernorm.weight\n",
+      "Loading weight file layers.9.mlp.gate_proj.weight\n",
+      "Loading weight file layers.9.mlp.up_proj.weight\n",
+      "Loading weight file layers.9.mlp.down_proj.weight\n",
+      "Loading weight file layers.10.input_layernorm.weight\n",
+      "Loading weight file layers.10.self_attn.q_proj.weight\n",
+      "Loading weight file layers.10.self_attn.k_proj.weight\n",
+      "Loading weight file layers.10.self_attn.v_proj.weight\n",
+      "Loading weight file layers.10.self_attn.o_proj.weight\n",
+      "Loading weight file layers.10.post_attention_layernorm.weight\n",
+      "Loading weight file layers.10.mlp.gate_proj.weight\n",
+      "Loading weight file layers.10.mlp.up_proj.weight\n",
+      "Loading weight file layers.10.mlp.down_proj.weight\n",
+      "Loading weight file layers.11.input_layernorm.weight\n",
+      "Loading weight file layers.11.self_attn.q_proj.weight\n",
+      "Loading weight file layers.11.self_attn.k_proj.weight\n",
+      "Loading weight file layers.11.self_attn.v_proj.weight\n",
+      "Loading weight file layers.11.self_attn.o_proj.weight\n",
+      "Loading weight file layers.11.post_attention_layernorm.weight\n",
+      "Loading weight file layers.11.mlp.gate_proj.weight\n",
+      "Loading weight file layers.11.mlp.up_proj.weight\n",
+      "Loading weight file layers.11.mlp.down_proj.weight\n",
+      "Loading weight file layers.12.input_layernorm.weight\n",
+      "Loading weight file layers.12.self_attn.q_proj.weight\n",
+      "Loading weight file layers.12.self_attn.k_proj.weight\n",
+      "Loading weight file layers.12.self_attn.v_proj.weight\n",
+      "Loading weight file layers.12.self_attn.o_proj.weight\n",
+      "Loading weight file layers.12.post_attention_layernorm.weight\n",
+      "Loading weight file layers.12.mlp.gate_proj.weight\n",
+      "Loading weight file layers.12.mlp.up_proj.weight\n",
+      "Loading weight file layers.12.mlp.down_proj.weight\n",
+      "Loading weight file layers.13.input_layernorm.weight\n",
+      "Loading weight file layers.13.self_attn.q_proj.weight\n",
+      "Loading weight file layers.13.self_attn.k_proj.weight\n",
+      "Loading weight file layers.13.self_attn.v_proj.weight\n",
+      "Loading weight file layers.13.self_attn.o_proj.weight\n",
+      "Loading weight file layers.13.post_attention_layernorm.weight\n",
+      "Loading weight file layers.13.mlp.gate_proj.weight\n",
+      "Loading weight file layers.13.mlp.up_proj.weight\n",
+      "Loading weight file layers.13.mlp.down_proj.weight\n",
+      "Loading weight file layers.14.input_layernorm.weight\n",
+      "Loading weight file layers.14.self_attn.q_proj.weight\n",
+      "Loading weight file layers.14.self_attn.k_proj.weight\n",
+      "Loading weight file layers.14.self_attn.v_proj.weight\n",
+      "Loading weight file layers.14.self_attn.o_proj.weight\n",
+      "Loading weight file layers.14.post_attention_layernorm.weight\n",
+      "Loading weight file layers.14.mlp.gate_proj.weight\n",
+      "Loading weight file layers.14.mlp.up_proj.weight\n",
+      "Loading weight file layers.14.mlp.down_proj.weight\n",
+      "Loading weight file layers.15.input_layernorm.weight\n",
+      "Loading weight file layers.15.self_attn.q_proj.weight\n",
+      "Loading weight file layers.15.self_attn.k_proj.weight\n",
+      "Loading weight file layers.15.self_attn.v_proj.weight\n",
+      "Loading weight file layers.15.self_attn.o_proj.weight\n",
+      "Loading weight file layers.15.post_attention_layernorm.weight\n",
+      "Loading weight file layers.15.mlp.gate_proj.weight\n",
+      "Loading weight file layers.15.mlp.up_proj.weight\n",
+      "Loading weight file layers.15.mlp.down_proj.weight\n",
+      "Loading weight file layers.16.input_layernorm.weight\n",
+      "Loading weight file layers.16.self_attn.q_proj.weight\n",
+      "Loading weight file layers.16.self_attn.k_proj.weight\n",
+      "Loading weight file layers.16.self_attn.v_proj.weight\n",
+      "Loading weight file layers.16.self_attn.o_proj.weight\n",
+      "Loading weight file layers.16.post_attention_layernorm.weight\n",
+      "Loading weight file layers.16.mlp.gate_proj.weight\n",
+      "Loading weight file layers.16.mlp.up_proj.weight\n",
+      "Loading weight file layers.16.mlp.down_proj.weight\n",
+      "Loading weight file layers.17.input_layernorm.weight\n",
+      "Loading weight file layers.17.self_attn.q_proj.weight\n",
+      "Loading weight file layers.17.self_attn.k_proj.weight\n",
+      "Loading weight file layers.17.self_attn.v_proj.weight\n",
+      "Loading weight file layers.17.self_attn.o_proj.weight\n",
+      "Loading weight file layers.17.post_attention_layernorm.weight\n",
+      "Loading weight file layers.17.mlp.gate_proj.weight\n",
+      "Loading weight file layers.17.mlp.up_proj.weight\n",
+      "Loading weight file layers.17.mlp.down_proj.weight\n",
+      "Loading weight file layers.18.input_layernorm.weight\n",
+      "Loading weight file layers.18.self_attn.q_proj.weight\n",
+      "Loading weight file layers.18.self_attn.k_proj.weight\n",
+      "Loading weight file layers.18.self_attn.v_proj.weight\n",
+      "Loading weight file layers.18.self_attn.o_proj.weight\n",
+      "Loading weight file layers.18.post_attention_layernorm.weight\n",
+      "Loading weight file layers.18.mlp.gate_proj.weight\n",
+      "Loading weight file layers.18.mlp.up_proj.weight\n",
+      "Loading weight file layers.18.mlp.down_proj.weight\n",
+      "Loading weight file layers.19.input_layernorm.weight\n",
+      "Loading weight file layers.19.self_attn.q_proj.weight\n",
+      "Loading weight file layers.19.self_attn.k_proj.weight\n",
+      "Loading weight file layers.19.self_attn.v_proj.weight\n",
+      "Loading weight file layers.19.self_attn.o_proj.weight\n",
+      "Loading weight file layers.19.post_attention_layernorm.weight\n",
+      "Loading weight file layers.19.mlp.gate_proj.weight\n",
+      "Loading weight file layers.19.mlp.up_proj.weight\n",
+      "Loading weight file layers.19.mlp.down_proj.weight\n",
+      "Loading weight file layers.20.input_layernorm.weight\n",
+      "Loading weight file layers.20.self_attn.q_proj.weight\n",
+      "Loading weight file layers.20.self_attn.k_proj.weight\n",
+      "Loading weight file layers.20.self_attn.v_proj.weight\n",
+      "Loading weight file layers.20.self_attn.o_proj.weight\n",
+      "Loading weight file layers.20.post_attention_layernorm.weight\n",
+      "Loading weight file layers.20.mlp.gate_proj.weight\n",
+      "Loading weight file layers.20.mlp.up_proj.weight\n",
+      "Loading weight file layers.20.mlp.down_proj.weight\n",
+      "Loading weight file layers.21.input_layernorm.weight\n",
+      "Loading weight file layers.21.self_attn.q_proj.weight\n",
+      "Loading weight file layers.21.self_attn.k_proj.weight\n",
+      "Loading weight file layers.21.self_attn.v_proj.weight\n",
+      "Loading weight file layers.21.self_attn.o_proj.weight\n",
+      "Loading weight file layers.21.post_attention_layernorm.weight\n",
+      "Loading weight file layers.21.mlp.gate_proj.weight\n",
+      "Loading weight file layers.21.mlp.up_proj.weight\n",
+      "Loading weight file layers.21.mlp.down_proj.weight\n",
+      "Loading weight file layers.22.input_layernorm.weight\n",
+      "Loading weight file layers.22.self_attn.q_proj.weight\n",
+      "Loading weight file layers.22.self_attn.k_proj.weight\n",
+      "Loading weight file layers.22.self_attn.v_proj.weight\n",
+      "Loading weight file layers.22.self_attn.o_proj.weight\n",
+      "Loading weight file layers.22.post_attention_layernorm.weight\n",
+      "Loading weight file layers.22.mlp.gate_proj.weight\n",
+      "Loading weight file layers.22.mlp.up_proj.weight\n",
+      "Loading weight file layers.22.mlp.down_proj.weight\n",
+      "Loading weight file layers.23.input_layernorm.weight\n",
+      "Loading weight file layers.23.self_attn.q_proj.weight\n",
+      "Loading weight file layers.23.self_attn.k_proj.weight\n",
+      "Loading weight file layers.23.self_attn.v_proj.weight\n",
+      "Loading weight file layers.23.self_attn.o_proj.weight\n",
+      "Loading weight file layers.23.post_attention_layernorm.weight\n",
+      "Loading weight file layers.23.mlp.gate_proj.weight\n",
+      "Loading weight file layers.23.mlp.up_proj.weight\n",
+      "Loading weight file layers.23.mlp.down_proj.weight\n",
+      "Loading weight file layers.24.input_layernorm.weight\n",
+      "Loading weight file layers.24.self_attn.q_proj.weight\n",
+      "Loading weight file layers.24.self_attn.k_proj.weight\n",
+      "Loading weight file layers.24.self_attn.v_proj.weight\n",
+      "Loading weight file layers.24.self_attn.o_proj.weight\n",
+      "Loading weight file layers.24.post_attention_layernorm.weight\n",
+      "Loading weight file layers.24.mlp.gate_proj.weight\n",
+      "Loading weight file layers.24.mlp.up_proj.weight\n",
+      "Loading weight file layers.24.mlp.down_proj.weight\n",
+      "Loading weight file layers.25.input_layernorm.weight\n",
+      "Loading weight file layers.25.self_attn.q_proj.weight\n",
+      "Loading weight file layers.25.self_attn.k_proj.weight\n",
+      "Loading weight file layers.25.self_attn.v_proj.weight\n",
+      "Loading weight file layers.25.self_attn.o_proj.weight\n",
+      "Loading weight file layers.25.post_attention_layernorm.weight\n",
+      "Loading weight file layers.25.mlp.gate_proj.weight\n",
+      "Loading weight file layers.25.mlp.up_proj.weight\n",
+      "Loading weight file layers.25.mlp.down_proj.weight\n",
+      "Loading weight file layers.26.input_layernorm.weight\n",
+      "Loading weight file layers.26.self_attn.q_proj.weight\n",
+      "Loading weight file layers.26.self_attn.k_proj.weight\n",
+      "Loading weight file layers.26.self_attn.v_proj.weight\n",
+      "Loading weight file layers.26.self_attn.o_proj.weight\n",
+      "Loading weight file layers.26.post_attention_layernorm.weight\n",
+      "Loading weight file layers.26.mlp.gate_proj.weight\n",
+      "Loading weight file layers.26.mlp.up_proj.weight\n",
+      "Loading weight file layers.26.mlp.down_proj.weight\n",
+      "Loading weight file layers.27.input_layernorm.weight\n",
+      "Loading weight file layers.27.self_attn.q_proj.weight\n",
+      "Loading weight file layers.27.self_attn.k_proj.weight\n",
+      "Loading weight file layers.27.self_attn.v_proj.weight\n",
+      "Loading weight file layers.27.self_attn.o_proj.weight\n",
+      "Loading weight file layers.27.post_attention_layernorm.weight\n",
+      "Loading weight file layers.27.mlp.gate_proj.weight\n",
+      "Loading weight file layers.27.mlp.up_proj.weight\n",
+      "Loading weight file layers.27.mlp.down_proj.weight\n",
+      "Loading weight file layers.28.input_layernorm.weight\n",
+      "Loading weight file layers.28.self_attn.q_proj.weight\n",
+      "Loading weight file layers.28.self_attn.k_proj.weight\n",
+      "Loading weight file layers.28.self_attn.v_proj.weight\n",
+      "Loading weight file layers.28.self_attn.o_proj.weight\n",
+      "Loading weight file layers.28.post_attention_layernorm.weight\n",
+      "Loading weight file layers.28.mlp.gate_proj.weight\n",
+      "Loading weight file layers.28.mlp.up_proj.weight\n",
+      "Loading weight file layers.28.mlp.down_proj.weight\n",
+      "Loading weight file layers.29.input_layernorm.weight\n",
+      "Loading weight file layers.29.self_attn.q_proj.weight\n",
+      "Loading weight file layers.29.self_attn.k_proj.weight\n",
+      "Loading weight file layers.29.self_attn.v_proj.weight\n",
+      "Loading weight file layers.29.self_attn.o_proj.weight\n",
+      "Loading weight file layers.29.post_attention_layernorm.weight\n",
+      "Loading weight file layers.29.mlp.gate_proj.weight\n",
+      "Loading weight file layers.29.mlp.up_proj.weight\n",
+      "Loading weight file layers.29.mlp.down_proj.weight\n",
+      "Loading weight file layers.30.input_layernorm.weight\n",
+      "Loading weight file layers.30.self_attn.q_proj.weight\n",
+      "Loading weight file layers.30.self_attn.k_proj.weight\n",
+      "Loading weight file layers.30.self_attn.v_proj.weight\n",
+      "Loading weight file layers.30.self_attn.o_proj.weight\n",
+      "Loading weight file layers.30.post_attention_layernorm.weight\n",
+      "Loading weight file layers.30.mlp.gate_proj.weight\n",
+      "Loading weight file layers.30.mlp.up_proj.weight\n",
+      "Loading weight file layers.30.mlp.down_proj.weight\n",
+      "Loading weight file layers.31.input_layernorm.weight\n",
+      "Loading weight file layers.31.self_attn.q_proj.weight\n",
+      "Loading weight file layers.31.self_attn.k_proj.weight\n",
+      "Loading weight file layers.31.self_attn.v_proj.weight\n",
+      "Loading weight file layers.31.self_attn.o_proj.weight\n",
+      "Loading weight file layers.31.post_attention_layernorm.weight\n",
+      "Loading weight file layers.31.mlp.gate_proj.weight\n",
+      "Loading weight file layers.31.mlp.up_proj.weight\n",
+      "Loading weight file layers.31.mlp.down_proj.weight\n",
+      "Loading weight file norm.weight\n",
+      "Loading weight file lm_head.weight\n",
+      "Loading LORA weight layers.0.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.0.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.0.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.0.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.1.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.1.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.1.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.1.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.2.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.2.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.2.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.2.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.3.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.3.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.3.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.3.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.4.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.4.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.4.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.4.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.5.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.5.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.5.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.5.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.6.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.6.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.6.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.6.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.7.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.7.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.7.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.7.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.8.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.8.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.8.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.8.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.9.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.9.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.9.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.9.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.10.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.10.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.10.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.10.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.11.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.11.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.11.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.11.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.12.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.12.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.12.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.12.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.13.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.13.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.13.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.13.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.14.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.14.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.14.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.14.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.15.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.15.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.15.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.15.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.16.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.16.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.16.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.16.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.17.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.17.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.17.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.17.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.18.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.18.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.18.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.18.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.19.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.19.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.19.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.19.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.20.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.20.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.20.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.20.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.21.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.21.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.21.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.21.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.22.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.22.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.22.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.22.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.23.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.23.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.23.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.23.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.24.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.24.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.24.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.24.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.25.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.25.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.25.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.25.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.26.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.26.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.26.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.26.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.27.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.27.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.27.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.27.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.28.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.28.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.28.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.28.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.29.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.29.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.29.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.29.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.30.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.30.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.30.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.30.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.31.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.31.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.31.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.31.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "[0 - 7f4ce019c740]   24.015346 {3}{RequestManager}: Output token is: 3639\n",
+      "[0 - 7f4ce0178740]   24.062661 {3}{RequestManager}: Output token is: 374\n",
+      "[0 - 7f4ce0190740]   24.128376 {3}{RequestManager}: Output token is: 279\n",
+      "[0 - 7f4ce0184740]   24.199797 {3}{RequestManager}: Output token is: 2944\n",
+      "[0 - 7f4ce0178740]   24.255941 {3}{RequestManager}: Output token is: 4920\n",
+      "[0 - 7f4ce0178740]   24.306545 {3}{RequestManager}: Output token is: 279\n",
+      "[0 - 7f4ce0178740]   24.357210 {3}{RequestManager}: Output token is: 2144\n",
+      "[0 - 7f4ce0190740]   24.407958 {3}{RequestManager}: Output token is: 430\n",
+      "[0 - 7f4ce0178740]   24.459366 {3}{RequestManager}: Output token is: 6730\n",
+      "[0 - 7f4ce0178740]   24.510618 {3}{RequestManager}: Output token is: 2053\n",
+      "[0 - 7f4ce0178740]   24.560416 {3}{RequestManager}: Output token is: 649\n",
+      "[0 - 7f4ce0178740]   24.611335 {3}{RequestManager}: Output token is: 18167\n",
+      "[0 - 7f4ce0178740]   24.663808 {3}{RequestManager}: Output token is: 369\n",
+      "[0 - 7f4ce0178740]   24.710965 {3}{RequestManager}: Output token is: 1317\n",
+      "[0 - 7f4ce0178740]   24.756020 {3}{RequestManager}: Output token is: 2085\n",
+      "[0 - 7f4ce0178740]   24.805719 {3}{RequestManager}: Output token is: 3090\n",
+      "[0 - 7f4ce0178740]   24.858560 {3}{RequestManager}: Output token is: 30\n",
+      "[0 - 7f4ce0184740]   24.910607 {3}{RequestManager}: Output token is: 3639\n",
+      "[0 - 7f4ce0178740]   24.958879 {3}{RequestManager}: Output token is: 374\n",
+      "[0 - 7f4ce0184740]   25.002851 {3}{RequestManager}: Output token is: 279\n",
+      "[0 - 7f4ce0178740]   25.050780 {3}{RequestManager}: Output token is: 2944\n",
+      "[0 - 7f4ce0178740]   25.104554 {3}{RequestManager}: Output token is: 4920\n",
+      "[0 - 7f4ce0184740]   25.159509 {3}{RequestManager}: Output token is: 279\n",
+      "[0 - 7f4ce0178740]   25.211003 {3}{RequestManager}: Output token is: 2144\n",
+      "[0 - 7f4ce0184740]   25.261411 {3}{RequestManager}: Output token is: 430\n",
+      "[0 - 7f4ce0190740]   25.312357 {3}{RequestManager}: Output token is: 6730\n",
+      "[0 - 7f4ce0184740]   25.362253 {3}{RequestManager}: Output token is: 2053\n",
+      "[0 - 7f4ce0184740]   25.412284 {3}{RequestManager}: Output token is: 649\n",
+      "[0 - 7f4ce0184740]   25.461502 {3}{RequestManager}: Output token is: 18167\n",
+      "[0 - 7f4ce0184740]   25.513610 {3}{RequestManager}: Output token is: 369\n",
+      "[0 - 7f4ce0184740]   25.564433 {3}{RequestManager}: Output token is: 1317\n",
+      "[0 - 7f4ce0184740]   25.613662 {3}{RequestManager}: Output token is: 2085\n",
+      "[0 - 7f4ce0184740]   25.663786 {3}{RequestManager}: Output token is: 3090\n",
+      "[0 - 7f4ce0184740]   25.712708 {3}{RequestManager}: Output token is: 30\n",
+      "[0 - 7f4ce0184740]   25.762206 {3}{RequestManager}: Output token is: 3639\n",
+      "[0 - 7f4ce0184740]   25.812755 {3}{RequestManager}: Output token is: 374\n",
+      "[0 - 7f4ce0184740]   25.863367 {3}{RequestManager}: Output token is: 279\n",
+      "[0 - 7f4ce0184740]   25.913378 {3}{RequestManager}: Output token is: 2944\n",
+      "[0 - 7f4ce0184740]   25.965063 {3}{RequestManager}: Output token is: 4920\n",
+      "[0 - 7f4ce0178740]   26.015739 {3}{RequestManager}: Output token is: 279\n",
+      "[0 - 7f4ce0178740]   26.065768 {3}{RequestManager}: Output token is: 2144\n",
+      "[0 - 7f4ce0178740]   26.115556 {3}{RequestManager}: Output token is: 430\n",
+      "[0 - 7f4ce0184740]   26.166644 {3}{RequestManager}: Output token is: 6730\n",
+      "[0 - 7f4ce0184740]   26.218528 {3}{RequestManager}: Output token is: 2053\n",
+      "[0 - 7f4ce0178740]   26.269681 {3}{RequestManager}: Output token is: 649\n",
+      "[0 - 7f4ce0178740]   26.320250 {3}{RequestManager}: Output token is: 18167\n",
+      "[0 - 7f4ce0178740]   26.371698 {3}{RequestManager}: Output token is: 369\n",
+      "[0 - 7f4ce0184740]   26.422587 {3}{RequestManager}: Output token is: 1317\n",
+      "[0 - 7f4ce0178740]   26.474391 {3}{RequestManager}: Output token is: 2085\n",
+      "[0 - 7f4ce0178740]   26.524817 {3}{RequestManager}: Output token is: 3090\n",
+      "[0 - 7f4ce0190740]   26.575224 {3}{RequestManager}: Output token is: 30\n",
+      "[0 - 7f4ce0178740]   26.627207 {3}{RequestManager}: Output token is: 3639\n",
+      "[0 - 7f4ce0190740]   26.679366 {3}{RequestManager}: Output token is: 374\n",
+      "[0 - 7f4ce0178740]   26.729921 {3}{RequestManager}: Output token is: 279\n",
+      "[0 - 7f4ce0178740]   26.779766 {3}{RequestManager}: Output token is: 2944\n",
+      "[0 - 7f4ce0178740]   26.832104 {3}{RequestManager}: Output token is: 4920\n",
+      "[0 - 7f4ce0184740]   26.884087 {3}{RequestManager}: Output token is: 279\n",
+      "[0 - 7f4ce0178740]   26.935580 {3}{RequestManager}: Output token is: 2144\n",
+      "[0 - 7f4ce0184740]   26.992909 {3}{RequestManager}: Output token is: 430\n",
+      "[0 - 7f4ce0184740]   27.043722 {3}{RequestManager}: Output token is: 6730\n",
+      "[0 - 7f4ce0184740]   27.093960 {3}{RequestManager}: Output token is: 2053\n",
+      "[0 - 7f4ce0178740]   27.144937 {3}{RequestManager}: Output token is: 649\n",
+      "[0 - 7f4ce0190740]   27.196991 {3}{RequestManager}: Output token is: 18167\n",
+      "[0 - 7f4ce0178740]   27.248143 {3}{RequestManager}: Output token is: 369\n",
+      "[0 - 7f4ce0190740]   27.299549 {3}{RequestManager}: Output token is: 1317\n",
+      "[0 - 7f4ce0190740]   27.351395 {3}{RequestManager}: Output token is: 2085\n",
+      "[0 - 7f4ce0178740]   27.402975 {3}{RequestManager}: Output token is: 3090\n",
+      "[0 - 7f4ce0190740]   27.453662 {3}{RequestManager}: Output token is: 30\n",
+      "[0 - 7f4ce0178740]   27.504152 {3}{RequestManager}: Output token is: 3639\n",
+      "[0 - 7f4ce0178740]   27.554072 {3}{RequestManager}: Output token is: 374\n",
+      "[0 - 7f4ce0184740]   27.605613 {3}{RequestManager}: Output token is: 279\n",
+      "[0 - 7f4ce0178740]   27.656807 {3}{RequestManager}: Output token is: 2944\n",
+      "[0 - 7f4ce0190740]   27.707595 {3}{RequestManager}: Output token is: 4920\n",
+      "[0 - 7f4ce0190740]   27.757815 {3}{RequestManager}: Output token is: 279\n",
+      "[0 - 7f4ce0190740]   27.809557 {3}{RequestManager}: Output token is: 2144\n",
+      "[0 - 7f4ce0184740]   27.862148 {3}{RequestManager}: Output token is: 430\n",
+      "[0 - 7f4ce0190740]   27.914188 {3}{RequestManager}: Output token is: 6730\n",
+      "[0 - 7f4ce0178740]   27.965942 {3}{RequestManager}: Output token is: 2053\n",
+      "[0 - 7f4ce0184740]   28.017837 {3}{RequestManager}: Output token is: 649\n",
+      "[0 - 7f4ce0184740]   28.069997 {3}{RequestManager}: Output token is: 18167\n",
+      "[0 - 7f4ce0184740]   28.122560 {3}{RequestManager}: Output token is: 369\n",
+      "[0 - 7f4ce0190740]   28.172513 {3}{RequestManager}: Output token is: 1317\n",
+      "[0 - 7f4ce0190740]   28.224002 {3}{RequestManager}: Output token is: 2085\n",
+      "[0 - 7f4ce0184740]   28.276536 {3}{RequestManager}: Output token is: 3090\n",
+      "[0 - 7f4ce0184740]   28.327091 {3}{RequestManager}: Output token is: 30\n",
+      "[0 - 7f4ce0184740]   28.377124 {3}{RequestManager}: Output token is: 3639\n",
+      "[0 - 7f4ce0190740]   28.427226 {3}{RequestManager}: Output token is: 374\n",
+      "[0 - 7f4ce0190740]   28.477499 {3}{RequestManager}: Output token is: 279\n",
+      "[0 - 7f4ce0184740]   28.528489 {3}{RequestManager}: Output token is: 2944\n",
+      "[0 - 7f4ce0178740]   28.580135 {3}{RequestManager}: Output token is: 4920\n",
+      "[0 - 7f4ce0190740]   28.631761 {3}{RequestManager}: Output token is: 279\n",
+      "[0 - 7f4ce0190740]   28.683392 {3}{RequestManager}: Output token is: 2144\n",
+      "[0 - 7f4ce0184740]   28.734001 {3}{RequestManager}: Output token is: 430\n",
+      "[0 - 7f4ce0190740]   28.783914 {3}{RequestManager}: Output token is: 6730\n",
+      "[0 - 7f4ce0190740]   28.835832 {3}{RequestManager}: Output token is: 2053\n",
+      "[0 - 7f4ce0184740]   28.885271 {3}{RequestManager}: Output token is: 649\n",
+      "[0 - 7f4ce0190740]   28.936179 {3}{RequestManager}: Output token is: 18167\n",
+      "[0 - 7f4ce0190740]   28.987163 {3}{RequestManager}: Output token is: 369\n",
+      "[0 - 7f4ce0184740]   29.038264 {3}{RequestManager}: Output token is: 1317\n",
+      "[0 - 7f4ce0184740]   29.084248 {3}{RequestManager}: Output token is: 2085\n",
+      "[0 - 7f4ce0184740]   29.129864 {3}{RequestManager}: Output token is: 3090\n",
+      "[0 - 7f4ce0184740]   29.175946 {3}{RequestManager}: Output token is: 30\n",
+      "[0 - 7f4ce0184740]   29.226707 {3}{RequestManager}: Output token is: 3639\n",
+      "[0 - 7f4ce0184740]   29.277372 {3}{RequestManager}: Output token is: 374\n",
+      "[0 - 7f4ce0184740]   29.329588 {3}{RequestManager}: Output token is: 279\n",
+      "[0 - 7f4ce0190740]   29.380856 {3}{RequestManager}: Output token is: 2944\n",
+      "[0 - 7f4ce0190740]   29.431483 {3}{RequestManager}: Output token is: 4920\n",
+      "[0 - 7f4ce0190740]   29.483399 {3}{RequestManager}: Output token is: 279\n",
+      "[0 - 7f4ce0190740]   29.536268 {3}{RequestManager}: Output token is: 2144\n",
+      "[0 - 7f4ce0190740]   29.588317 {3}{RequestManager}: Output token is: 430\n",
+      "[0 - 7f4ce0184740]   29.638727 {3}{RequestManager}: Output token is: 6730\n",
+      "[0 - 7f4ce0190740]   29.689708 {3}{RequestManager}: Output token is: 2053\n",
+      "[0 - 7f4ce0190740]   29.740987 {3}{RequestManager}: Output token is: 649\n",
+      "[0 - 7f4ce0178740]   29.791166 {3}{RequestManager}: Output token is: 18167\n",
+      "[0 - 7f4ce0190740]   29.841776 {3}{RequestManager}: Output token is: 369\n",
+      "[0 - 7f4ce0184740]   29.893514 {3}{RequestManager}: Output token is: 1317\n",
+      "[0 - 7f4ce0178740]   29.945509 {3}{RequestManager}: Output token is: 2085\n",
+      "[0 - 7f4ce0178740]   29.945878 {3}{RequestManager}: [Done] guid(1000000) final_length(128)\n",
+      "[0 - 7f4ce0178740]   29.945889 {3}{RequestManager}: Final output: <s> <|begin_of_text|>Why can camels survive for long without water? What is the reason behind the fact that camels can survive for long without water? What is the reason behind the fact that camels can survive for long without water? What is the reason behind the fact that camels can survive for long without water? What is the reason behind the fact that camels can survive for long without water? What is the reason behind the fact that camels can survive for long without water? What is the reason behind the fact that camels can survive for long without water? What is the reason behind the fact that camels can survive for long without\n",
+      "[0 - 7f4ce0178740]   29.945900 {3}{RequestManager}: [Profile] guid(1000000) llm_decoding_steps(117) start(23696232.0) finish(29945893.0) latency(6249661.0) ttft(22415078.0)\n"
+     ]
+    }
+   ],
+   "source": [
+    "prompts = [s for s in json.load(open(configs.inference_dataset))]\n",
+    "inference_requests = [\n",
+    "    ff.Request(\n",
+    "        ff.RequestType.REQ_INFERENCE,\n",
+    "        prompt=prompt,\n",
+    "        max_sequence_length=configs.max_sequence_length,\n",
+    "        peft_model_id=llm.get_ff_peft_id(lora_inference_config),\n",
+    "    )\n",
+    "    for prompt in prompts\n",
+    "]\n",
+    "inf_req_res_1 = llm.generate(inference_requests)\n",
+    "with open(\"before_finetuning.txt\", \"w\") as file:\n",
+    "    file.write(str(inf_req_res_1[0].output_text))"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Perform Finetuning on dataset"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 9,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "[<flexflow.core.flexflow_cffi.Request object at 0x7f4ce3304c50>]\n",
+      "No small speculative model registered, using incremental decoding.\n",
+      "[0 - 7f4d49d21280]   29.957050 {3}{RequestManager}: [0] input: 128000 10445 649 6730 2053 18167 369 1317 2085 3090 30 8215 2053 1005 279 8834 304 872 305 12055 311 2567 1124 10409 449 4907 323 88000 369 1317 18852 315 892 13\n",
+      "[0 - 7f4d49d21280]   29.957061 {3}{RequestManager}: [0] output:\n",
+      "Loss: 2.6536\n",
+      "Loss: 2.5942\n",
+      "Loss: 2.5360\n",
+      "Loss: 2.5083\n",
+      "Loss: 2.4783\n",
+      "Loss: 2.4570\n",
+      "Loss: 2.4420\n",
+      "Loss: 2.4194\n",
+      "Loss: 2.4050\n",
+      "Loss: 2.3949\n",
+      "Loss: 2.3841\n",
+      "Loss: 2.3764\n",
+      "Loss: 2.3676\n",
+      "Loss: 2.3535\n",
+      "Loss: 2.3396\n",
+      "Loss: 2.3299\n",
+      "Loss: 2.3287\n",
+      "Loss: 2.3215\n",
+      "Loss: 2.3058\n",
+      "Loss: 2.2978\n",
+      "Loss: 2.2885\n",
+      "Loss: 2.2852\n",
+      "Loss: 2.2660\n",
+      "Loss: 2.2619\n",
+      "Loss: 2.2594\n",
+      "Loss: 2.2479\n",
+      "Loss: 2.2379\n",
+      "Loss: 2.2243\n",
+      "Loss: 2.2245\n",
+      "Loss: 2.2057\n",
+      "Loss: 2.2035\n",
+      "Loss: 2.1891\n",
+      "Loss: 2.1817\n",
+      "Loss: 2.1703\n",
+      "Loss: 2.1592\n",
+      "Loss: 2.1548\n",
+      "Loss: 2.1383\n",
+      "Loss: 2.1321\n",
+      "Loss: 2.1179\n",
+      "Loss: 2.1138\n",
+      "Loss: 2.1062\n",
+      "Loss: 2.0934\n",
+      "Loss: 2.0856\n",
+      "Loss: 2.0758\n",
+      "Loss: 2.0656\n",
+      "Loss: 2.0532\n",
+      "Loss: 2.0497\n",
+      "Loss: 2.0410\n",
+      "Loss: 2.0258\n",
+      "Loss: 2.0161\n",
+      "Loss: 2.0047\n",
+      "Loss: 1.9940\n",
+      "Loss: 1.9820\n",
+      "Loss: 1.9737\n",
+      "Loss: 1.9614\n",
+      "Loss: 1.9486\n",
+      "Loss: 1.9378\n",
+      "Loss: 1.9281\n",
+      "Loss: 1.9174\n",
+      "Loss: 1.9047\n",
+      "Loss: 1.8922\n",
+      "Loss: 1.8798\n",
+      "Loss: 1.8674\n",
+      "Loss: 1.8574\n",
+      "Loss: 1.8485\n",
+      "Loss: 1.8301\n",
+      "Loss: 1.8213\n",
+      "Loss: 1.8091\n",
+      "Loss: 1.8007\n",
+      "Loss: 1.7850\n",
+      "Loss: 1.7784\n",
+      "Loss: 1.7606\n",
+      "Loss: 1.7496\n",
+      "Loss: 1.7320\n",
+      "Loss: 1.7216\n",
+      "Loss: 1.7067\n",
+      "Loss: 1.6954\n",
+      "Loss: 1.6781\n",
+      "Loss: 1.6667\n",
+      "Loss: 1.6551\n",
+      "Loss: 1.6425\n",
+      "Loss: 1.6272\n",
+      "Loss: 1.6096\n",
+      "Loss: 1.6030\n",
+      "Loss: 1.5824\n",
+      "Loss: 1.5724\n",
+      "Loss: 1.5558\n",
+      "Loss: 1.5399\n",
+      "Loss: 1.5266\n",
+      "Loss: 1.5109\n",
+      "Loss: 1.4952\n",
+      "Loss: 1.4829\n",
+      "Loss: 1.4648\n",
+      "Loss: 1.4496\n",
+      "Loss: 1.4360\n",
+      "Loss: 1.4154\n",
+      "Loss: 1.4010\n",
+      "Loss: 1.3958\n",
+      "Loss: 1.3719\n",
+      "Loss: 1.3562\n",
+      "[0 - 7f4ce0190740]   38.933268 {3}{RequestManager}: [Finetuning] guid(1000001) completed_training_steps(100) processed_finetuning_tokens(3400) latency(38933176.0)\n"
+     ]
+    }
+   ],
+   "source": [
+    "finetuning_request = ff.Request(\n",
+    "    ff.RequestType.REQ_FINETUNING,\n",
+    "    max_sequence_length=configs.max_sequence_length,\n",
+    "    peft_model_id=llm.get_ff_peft_id(lora_finetuning_config),\n",
+    "    dataset_filepath=os.path.join(os.getcwd(), configs.finetuning_dataset),\n",
+    "    max_training_steps=configs.max_training_steps,\n",
+    ")\n",
+    "ft_res = llm.generate([finetuning_request])"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 10,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "image/png": "iVBORw0KGgoAAAANSUhEUgAAA04AAAIjCAYAAAA0vUuxAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjkuMSwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy/TGe4hAAAACXBIWXMAAA9hAAAPYQGoP6dpAABm/UlEQVR4nO3de1yUdfr/8fcICKKioqgIJKaVHe1gBw94KA9ZmYpKiqVW+3VLLcnd2tq21O1gWdtWW1m2pZ3QjDTL7UQlHlK3rNztaG1KKmIeERVFGu7fH/dvBoaZYQ4MzAzzej4ePMa5577v+TB+UC8/13V9LIZhGAIAAAAAuNUk2AMAAAAAgFBH4AQAAAAAHhA4AQAAAIAHBE4AAAAA4AGBEwAAAAB4QOAEAAAAAB4QOAEAAACABwROAAAAAOABgRMAAAAAeEDgBACNUEFBgSwWiwoKCoI9lIi3aNEiWSwWbdq0KdhD8cpPP/2kIUOGqFWrVrJYLHrrrbeCPSS/FBYWymKx6NFHHw32UAA0EgROABq1cPhH6znnnKOTTjpJhmG4PadPnz7q0KGDfvvttwYcWfiYPXu2LBaLOnTooLKyMqfX09PTddVVVwVhZOFn0qRJ+vrrr/XAAw/olVdeUc+ePV2eZwtM3H099NBDDTxyAKhf0cEeAABEugkTJujOO+/U2rVr1a9fP6fXCwsLtWHDBk2fPl3R0fyxXZs9e/Zo/vz5+sMf/hDsoYSlY8eOacOGDbr77rs1ffp0r64ZP368rrjiCqfj5513XqCHBwBBxd/AABBk2dnZuuuuu5Sbm+sycFq8eLEMw9CECROCMLrwcu655+qRRx7R1KlT1axZs2APp0EdPXpUzZs3r9M99u7dK0lq3bq119ecf/75uvbaa+v0vgAQDkjVAwBJX331lYYNG6aEhAS1aNFCl112mTZu3OhwTkVFhebMmaNTTjlFcXFxatu2rfr27av8/Hz7Obt379b111+v1NRUxcbGKjk5WSNGjFBhYaHb905LS1O/fv2Ul5eniooKp9dzc3PVtWtXXXzxxfrll180depUnXbaaWrWrJnatm2rsWPH1np/m/T0dE2ePNnp+IABAzRgwACHY+Xl5Zo1a5a6deum2NhYpaWl6Y477lB5eXmt7zF9+nS1aNHCZbrc+PHj1bFjR1mtVknSpk2bNHToULVr107NmjVTly5ddMMNN3j8Pmpz77336tdff9X8+fNrPc9dDZgt/WzRokX2Y5MnT1aLFi20fft2XXXVVWrRooVSUlL09NNPS5K+/vprXXrppWrevLk6d+6s3Nxcl+9ZVlam3//+92rbtq0SEhI0ceJEHTx40Om89957TxkZGWrevLlatmypK6+8Ut9++63DObYx/fzzz7riiivUsmVLj4G1pzk+e/Zsde7cWZJ0++23y2KxKD09vdZ7esuWKvnhhx/q3HPPVVxcnM444wwtW7bM6dytW7dq7NixSkxMVHx8vC655BL961//cjrv+PHjmj17tk499VTFxcUpOTlZmZmZ+vnnn53OXbBggbp27arY2FhdeOGF+vzzzx1e9+fnFkDkYcUJQMT79ttvlZGRoYSEBN1xxx2KiYnRc889pwEDBmj16tW6+OKLJZn/sJw7d65+97vf6aKLLlJpaak2bdqkL7/8UoMHD5YkjR49Wt9++61uueUWpaena8+ePcrPz9f27dtr/UfohAkTNGXKFH3wwQcOtThff/21vvnmG917772SpM8//1zr16/XuHHjlJqaqsLCQs2fP18DBgzQd999p/j4+Dp/HpWVlbr66qu1bt06TZkyRaeffrq+/vpr/f3vf9ePP/5Ya7OAa665Rk8//bT+9a9/aezYsfbjZWVleueddzR58mRFRUVpz549GjJkiJKSknTnnXeqdevWKiwsdPkPaV9kZGTo0ksv1bx583TzzTcHbNXJarVq2LBh6tevn+bNm6fXXntN06dPV/PmzXX33XdrwoQJyszM1LPPPquJEyeqV69e6tKli8M9pk+frtatW2v27NnasmWL5s+fr19++cUexEnSK6+8okmTJmno0KF6+OGHVVZWpvnz56tv37766quvHObQb7/9pqFDh6pv37569NFHa/2992aOZ2ZmqnXr1rrtttvs6XctWrTw+NmUlZVp3759Tsdbt27tkFr6008/6ZprrtFNN92kSZMmaeHChRo7dqzef/99+8/Pr7/+qt69e6usrEy33nqr2rZtq5deeklXX3218vLyNGrUKPvvx1VXXaWPP/5Y48aN04wZM3T48GHl5+frm2++UdeuXe3vm5ubq8OHD+v3v/+9LBaL5s2bp8zMTG3dulUxMTGS/P+5BRBhDABoxBYuXGhIMj7//HO354wcOdJo2rSp8fPPP9uP7dq1y2jZsqXRr18/+7EePXoYV155pdv7HDx40JBkPPLIIz6P88CBA0ZsbKwxfvx4h+N33nmnIcnYsmWLYRiGUVZW5nTthg0bDEnGyy+/bD+2atUqQ5KxatUq+7HOnTsbkyZNcrq+f//+Rv/+/e3PX3nlFaNJkybG2rVrHc579tlnDUnGp59+6vb7qKysNFJSUozRo0c7HF+6dKkhyVizZo1hGIaxfPlyj78vvpg1a5Yhydi7d6+xevVqQ5Lx2GOP2V/v3Lmzw++dq8/HMAxj27ZthiRj4cKF9mOTJk0yJBkPPvig/djBgweNZs2aGRaLxViyZIn9+A8//GBIMmbNmmU/ZpuDF1xwgXHixAn78Xnz5hmSjBUrVhiGYRiHDx82Wrdubfzf//2fw5h2795ttGrVyuG4bUx33nmnV5+Pt3Pc9v17M4dt57r72rBhg/3czp07G5KMN998037s0KFDRnJysnHeeefZj+Xk5BiSHObe4cOHjS5duhjp6emG1Wo1DMMwXnzxRaffY5vKykqH8bVt29Y4cOCA/fUVK1YYkox33nnHMIy6/dwCiCyk6gGIaFarVR9++KFGjhypk08+2X48OTlZ2dnZWrdunUpLSyWZ/4P+7bff6qeffnJ5r2bNmqlp06YqKChwmYJVmzZt2uiKK67Q22+/raNHj0qSDMPQkiVL1LNnT5166qn297CpqKjQ/v371a1bN7Vu3VpffvmlT+/pzhtvvKHTTz9d3bt31759++xfl156qSRp1apVbq+1WCwaO3as3n33XR05csR+/PXXX1dKSor69u0rqaqGZuXKlS7TE+uiX79+GjhwoObNm6djx44F7L6/+93v7L9u3bq1TjvtNDVv3lxZWVn246eddppat26trVu3Ol0/ZcoU+wqHJN18882Kjo7Wu+++K0nKz89XSUmJxo8f7/C5R0VF6eKLL3b5ud98880ex+3LHPfHlClTlJ+f7/R1xhlnOJzXqVMn+4qRJHu64ldffaXdu3dLkt59911ddNFF9nkiSS1atNCUKVNUWFio7777TpL05ptvql27drrlllucxmNbvbO55ppr1KZNG/vzjIwMSbL/HtXl5xZAZCFwAhDR9u7dq7KyMp122mlOr51++umqrKzUjh07JEl//etfVVJSolNPPVVnn322br/9dv33v/+1nx8bG6uHH35Y7733njp06GBP67L9o9CTCRMm6OjRo1qxYoUkaf369SosLHSoXTl27JjuvfdepaWlKTY2Vu3atVNSUpJKSkp06NChunwUdj/99JO+/fZbJSUlOXzZgrc9e/bUev0111yjY8eO6e2335YkHTlyRO+++67Gjh1r/0dt//79NXr0aM2ZM0ft2rXTiBEjtHDhQo81VN6aPXu2du/erWeffTYg94uLi1NSUpLDsVatWik1NdXpH+qtWrVy+Q/wU045xeF5ixYtlJycbK+jsQXkl156qdNn/+GHHzp97tHR0UpNTfU4dl/muD9OOeUUDRo0yOkrISHB4bxu3bo5fVa2OWX7DH755Re347S9Lkk///yzTjvtNK+6TJ500kkOz21BlO33qK4/twAiB4ETAHipX79++vnnn/Xiiy/qrLPO0j//+U+df/75+uc//2k/JycnRz/++KPmzp2ruLg43XPPPTr99NP11Vdfebz/VVddpVatWtmbC+Tm5ioqKkrjxo2zn3PLLbfogQceUFZWlpYuXaoPP/xQ+fn5atu2rSorK2u9f81/tNrYmjXYVFZW6uyzz3a5ipCfn6+pU6fW+j6XXHKJ0tPTtXTpUknSO++8o2PHjumaa65xGEteXp69zXpRUZFuuOEGXXDBBQ4rVf7q16+fBgwY4HbVydvPwiYqKsqn40Yte3K5Y/v9e+WVV1x+7raA2iY2NlZNmvDXuCfe/B7V5ecWQOSgOQSAiJaUlKT4+Hht2bLF6bUffvhBTZo0UVpamv1YYmKirr/+el1//fU6cuSI+vXrp9mzZzukcXXt2lV/+MMf9Ic//EE//fSTzj33XP3tb3/Tq6++WutYYmNjNWbMGL388sv69ddf9cYbb+jSSy9Vx44d7efk5eVp0qRJ+tvf/mY/dvz4cZWUlHj8Xtu0aePyvF9++cUhhatr1676z3/+o8suu8xtgOFJVlaWnnjiCZWWlur1119Xenq6LrnkEqfzLrnkEl1yySV64IEHlJubqwkTJmjJkiUOn6e/Zs+erQEDBui5555zes226lDz87CtaNSHn376SQMHDrQ/P3LkiIqLi+17INkaGrRv316DBg0K2Pv6Osfry//+9z8ZhuEwp3788UdJsjdg6Ny5s9tx2l6XzM/q3//+tyoqKhzSH+vC359bAJGD/6oCENGioqI0ZMgQrVixwqH18K+//qrc3Fz17dvXnnK0f/9+h2tbtGihbt262dPLysrKdPz4cYdzunbtqpYtW3qdgjZhwgRVVFTo97//vfbu3evUYjoqKsppNeMf//iH25WSmmPZuHGjTpw4YT+2cuVKpzStrKwsFRUV6fnnn3e6x7Fjx+w1WLW55pprVF5erpdeeknvv/++Qx2QZKZJ1fw+zj33XEly+Kx+/vlnl+2lvdG/f38NGDBADz/8sNPvS+fOnRUVFaU1a9Y4HH/mmWf8ei9vLFiwwKGea/78+frtt980bNgwSdLQoUOVkJCgBx980GXdl22PJV/5Msfr065du7R8+XL789LSUr388ss699xz7f85cMUVV+izzz7Thg0b7OcdPXpUCxYsUHp6ur1uavTo0dq3b5+eeuopp/fxdbUvED+3ACIDK04AIsKLL76o999/3+n4jBkzdP/99ys/P199+/bV1KlTFR0dreeee07l5eWaN2+e/dwzzjhDAwYM0AUXXKDExERt2rRJeXl5mj59uiTzf88vu+wyZWVl6YwzzlB0dLSWL1+uX3/91SHdrjb9+/dXamqqVqxYoWbNmikzM9Ph9auuukqvvPKKWrVqpTPOOEMbNmzQRx99pLZt23q89+9+9zvl5eXp8ssvV1ZWln7++We9+uqrDq2bJem6667T0qVLddNNN2nVqlXq06ePrFarfvjhBy1dulQffPCBevbsWet7nX/++erWrZvuvvtulZeXO6TpSdJLL72kZ555RqNGjVLXrl11+PBhPf/880pISLCvwEjSZZddJkl+76cza9Ysh1Uem1atWmns2LH6xz/+IYvFoq5du2rlypUe67fq4sSJE/b5sWXLFj3zzDPq27evrr76aklms4T58+fruuuu0/nnn69x48YpKSlJ27dv17/+9S/16dPHZaDgDW/nuD++/PJLl6syXbt2Va9evezPTz31VN144436/PPP1aFDB7344ov69ddftXDhQvs5d955pxYvXqxhw4bp1ltvVWJiol566SVt27ZNb775pj01ceLEiXr55Zc1c+ZMffbZZ8rIyNDRo0f10UcfaerUqRoxYoTX4w/Ezy2ACBHEjn4AUO9sraDdfe3YscMwDMP48ssvjaFDhxotWrQw4uPjjYEDBxrr1693uNf9999vXHTRRUbr1q2NZs2aGd27dzceeOABe4vpffv2GdOmTTO6d+9uNG/e3GjVqpVx8cUXG0uXLvVpzLfffrshycjKynJ67eDBg8b1119vtGvXzmjRooUxdOhQ44cffnBqNe6u3fbf/vY3IyUlxYiNjTX69OljbNq0yakduWEYxokTJ4yHH37YOPPMM43Y2FijTZs2xgUXXGDMmTPHOHTokFffx913321IMrp16+b02pdffmmMHz/eOOmkk4zY2Fijffv2xlVXXWVs2rTJ4bzOnTsbnTt39vhe1duR19S/f39DklMr+b179xqjR4824uPjjTZt2hi///3vjW+++cZlO/LmzZu7vO+ZZ57pdLxm63PbHFy9erUxZcoUo02bNkaLFi2MCRMmGPv373e6ftWqVcbQoUONVq1aGXFxcUbXrl2NyZMnO3w27sZUG2/meCDbkVefj7bP5IMPPjDOOeccIzY21ujevbvxxhtvON33559/NsaMGWO0bt3aiIuLMy666CJj5cqVTueVlZUZd999t9GlSxcjJibG6NixozFmzBh7y/XavhdVaxkfqJ9bAI2fxTD8qGAFAADwUnp6us466yytXLky2EMBAL9R4wQAAAAAHhA4AQAAAIAHBE4AAAAA4AE1TgAAAADgAStOAAAAAOABgRMAAAAAeBBxG+BWVlZq165datmypSwWS7CHAwAAACBIDMPQ4cOH1alTJ/sm2+5EXOC0a9cupaWlBXsYAAAAAELEjh07lJqaWus5ERc4tWzZUpL54SQkJAR5NFJFRYU+/PBDDRkyRDExMcEeDsIE8wb+YN7AX8wd+IN5A3809LwpLS1VWlqaPUaoTcQFTrb0vISEhJAJnOLj45WQkMAfKvAa8wb+YN7AX8wd+IN5A38Ea954U8JDcwgAAAAA8IDACQAAAAA8IHACAAAAAA8InAAAAADAAwInAAAAAPCAwAkAAAAAPCBwAgAAAAAPCJwAAAAAwAMCJwAAAADwgMAJAAAAADwgcAIAAAAADwicAAAAAMADAicAAAAA8IDAKYisVmn1aovWrEnR6tUWWa3BHhEAAAAAVwicgmTZMik9XRo8OFqPPdZTgwdHKz3dPA4AAAAgtBA4BcGyZdKYMdLOnY7Hi4rM4wRPAAAAQGghcGpgVqs0Y4ZkGM6v2Y7l5Ii0PQAAACCEEDg1sLVrnVeaqjMMaccO8zwAAAAAoYHAqYEVFwf2PAAAAAD1j8CpgSUnB/Y8AAAAAPWPwKmBZWRIqamSxeL6dYtFSkszzwMAAAAQGgicGlhUlPTEE+avawZPtuePP26eBwAAACA0EDgFQWamlJcnpaQ4Hm/Z0jyemRmccQEAAABwjcApSDIzpcJCKT//N11xxVZJUuvW0siRwRwVAAAAAFcInIIoKkrq39/QpEnfKiHB0Pbt0po1wR4VAAAAgJoInEJAbGylxowxd7996aUgDwYAAACAEwKnEHHddZWSzBqno0eDPBgAAAAADgicQkTv3oZOPlk6ckRavjzYowEAAABQHYFTiLBYpIkTzV+TrgcAAACEFgKnEGILnD7+WNqxI7hjAQAAAFCFwCmEdOki9esnGYb02mvBHg0AAAAAm6AGTnPnztWFF16oli1bqn379ho5cqS2bNni8bqSkhJNmzZNycnJio2N1amnnqp33323AUZc/6qn6xlGcMcCAAAAwBTUwGn16tWaNm2aNm7cqPz8fFVUVGjIkCE6WktbuRMnTmjw4MEqLCxUXl6etmzZoueff14pKSkNOPL6M3as1KyZ9MMP0rPPSosXSwUFktUa7JEBAAAAkSs6mG/+/vvvOzxftGiR2rdvry+++EL9+vVzec2LL76oAwcOaP369YqJiZEkpaen1/dQG0xCgtSzp7R2rTR1atXx1FTpiSekzMzgjQ0AAACIVEENnGo6dOiQJCkxMdHtOW+//bZ69eqladOmacWKFUpKSlJ2drb+9Kc/KSoqyun88vJylZeX25+XlpZKkioqKlRRURHg78B3tjHYHpcvt2jt2ihJFofziooMjRkjLVli1ahR5PBFuprzBvAG8wb+Yu7AH8wb+KOh540v72MxjNCopKmsrNTVV1+tkpISrVu3zu153bt3V2FhoSZMmKCpU6fqf//7n6ZOnapbb71Vs2bNcjp/9uzZmjNnjtPx3NxcxcfHB/R7qCurVZoyZYj2749TzcDJZKhdu2N67rl8uYgRAQAAAPigrKxM2dnZOnTokBISEmo9N2QCp5tvvlnvvfee1q1bp9TUVLfnnXrqqTp+/Li2bdtmX2F67LHH9Mgjj6i4uNjpfFcrTmlpadq3b5/HD6chVFRUKD8/X4MHD9b69U01eLDnRcD8/N/Uv39I/LYhSKrPG1vKKuAJ8wb+Yu7AH8wb+KOh501paanatWvnVeAUEql606dP18qVK7VmzZpagyZJSk5OVkxMjENa3umnn67du3frxIkTatq0qcP5sbGxio2NdbpPTExMSP0Qx8TEaO9e73479u6NVggNHUEUavMY4YF5A38xd+AP5g380VDzxpf3CGpXPcMwNH36dC1fvlyffPKJunTp4vGaPn366H//+58qKyvtx3788UclJyc7BU3hJjk5sOcBAAAACIygBk7Tpk3Tq6++qtzcXLVs2VK7d+/W7t27dezYMfs5EydO1F133WV/fvPNN+vAgQOaMWOGfvzxR/3rX//Sgw8+qGnTpgXjWwiojAyze57FVXmTzONpaeZ5AAAAABpOUAOn+fPn69ChQxowYICSk5PtX6+//rr9nO3btzvULqWlpemDDz7Q559/rnPOOUe33nqrZsyYoTvvvDMY30JARUWZLccl98HT44+LxhAAAABAAwtqjZM3fSkKCgqcjvXq1UsbN26shxEFX2amlJcnzZgh7dxZdbxFC+mll9jHCQAAAAiGoK44wbXMTKmwUFq1SrItpEVHS1dcEdRhAQAAABGLwClERUVJAwZI999v1j2VlEhvvx3sUQEAAACRicApxEVFSRMnmr9etCioQwEAAAAiFoFTGJg82Xz84AOpqCioQwEAAAAiEoFTGDjlFKlvX6myUnrllWCPBgAAAIg8BE5h4vrrzceFCyUvmhECAAAACCACpzAxdqwUHy/9+KPUSDuxAwAAACGLwClMtGwpjRlj/nrhwuCOBQAAAIg0BE5hxJaut2SJVFYW3LEAAAAAkSQ62AOA9/r1k7p0kbZtkx54QDrrLCk5WcrIMNuWAwAAAKgfBE5hpEkT6aKLzMDpwQerjqemSk88IWVmBm9sAAAAQGNGql4YWbZMWrrU+XhRkVn/tGxZw48JAAAAiAQETmHCapVmzHDditx2LCfHPA8AAABAYBE4hYm1a6WdO92/bhjSjh3meQAAAAACi8ApTBQXB/Y8AAAAAN4jcAoTycmBPQ8AAACA9wicwkRGhtk9z2Jxf05amnkeAAAAgMAicAoTUVFmy3HJffA0Ywb7OQEAAAD1gcApjGRmSnl5UkqK4/G4OPPxqaekPXukggJp8WLzkS57AAAAQN2xAW6YycyURowwu+cVF5s1TWeeKV1yibR1q3TSSVJ5edX5bI4LAAAA1B0rTmEoKkoaMEAaP958TEqSpk0zX6seNElsjgsAAAAEAoFTI2C1Sn//u+vX2BwXAAAAqDsCp0aAzXEBAACA+kXg1AiwOS4AAABQvwicGgE2xwUAAADqF4FTI8DmuAAAAED9InBqBLzZHPeee9gcFwAAAPAXgVMj4W5z3JgY8/HVV6UTJ9gcFwAAAPAHG+A2Iq42x+3YUbrwQmnNGnO/p9LSqvPZHBcAAADwDitOjUzNzXG7d5duuMF8rXrQJLE5LgAAAOAtAqdGzmp1HxixOS4AAADgHQKnRo7NcQEAAIC6I3Bq5NgcFwAAAKg7AqdGjs1xAQAAgLqjq14jZ9sct6ioqqapptRUqXdvs0W5rRtfRgb7PgEAAAA2BE6NnG1z3DFjzM1xXQVPMTHSySebwZUNrcoBAACAKqTqRQB3m+MmJUnR0dK2bY5Bk0SrcgAAAKA6AqcIkZkpFRZKq1ZJubnm486dUps2rs+nVTkAAABQhVS9CGLbHNemoEDau9f9+dVblVe/DgAAAIg0BE4RzNsW5EVFNI4AAABAZCNwimDetiC/7TbHlSkaRwAAACDSUOMUwWytyi2W2s+rmc5H4wgAAABEGgKnCGZrVS55Dp6qo3EEAAAAIg2BU4SrrVV5bao3jgAAAAAaO2qcoMxMacQIMwiyNYAoKpKuvdbztd42mAAAAADCGYETJLluVe4NbxtMAAAAAOGMVD245E3jCFtrcgAAAKCxI3CCS940jvjtN7POqaBAWrzYfKRZBAAAABojUvXglq1xxIwZ0s6dVcc7dZIqK6Xdu6Vu3RyDJfZ4AgAAQGPEihNqlZkpFRZKq1ZJubnm4/bt0pw55us1V5jY4wkAAACNEStO8Khm4wirVbrvPtfnGoaZ2peTY3bqi4pqiBECAAAA9YsVJ/hs7VrH1L2aqu/xZLVSAwUAAIDwx4oTfObt3k0rVkjXXecYZFEDBQAAgHDEihN85u3eTY8/7rwyRQ0UAAAAwlFQA6e5c+fqwgsvVMuWLdW+fXuNHDlSW7Zs8fr6JUuWyGKxaOTIkfU3SDjxZo8ndwzDfMzJkU6cII0PAAAA4SGogdPq1as1bdo0bdy4Ufn5+aqoqNCQIUN09OhRj9cWFhbqj3/8ozLYgbXB1bbHkzfBlK0GKjVVGjhQys42H9PTWYkCAABAaApq4PT+++9r8uTJOvPMM9WjRw8tWrRI27dv1xdffFHrdVarVRMmTNCcOXN08sknN9BoUZ1tj6eUFMfjqanmapI39u51fE4aHwAAAEJVSDWHOHTokCQpMTGx1vP++te/qn379rrxxhu1du3aWs8tLy9XeXm5/XlpaakkqaKiQhUVFXUccd3ZxhAKY/HV8OHSFVdI69ZZVFxs1j717Wto3TqLHn/c96lltjI3NGOGdMUVv9HKvBbhPG8QPMwb+Iu5A38wb+CPhp43vryPxTBsVSfBVVlZqauvvlolJSVat26d2/PWrVuncePGafPmzWrXrp0mT56skpISvfXWWy7Pnz17tubYdmutJjc3V/Hx8YEaPqqxWqUpU4Zo//44SX4UQkmaM2edmjSRDh6MU5s2x3XGGfsJpAAAABBQZWVlys7O1qFDh5SQkFDruSETON1888167733tG7dOqWmpro85/DhwzrnnHP0zDPPaNiwYZLkMXByteKUlpamffv2efxwGkJFRYXy8/M1ePBgxcTEBHs4AbN8uUXjxpmRjmFUD54MeRNMJSYaOnCg6ryUFEOPPWbVqFEhMV2DrrHOG9Qv5g38xdyBP5g38EdDz5vS0lK1a9fOq8ApJFL1pk+frpUrV2rNmjVugyZJ+vnnn1VYWKjhw4fbj1VWVkqSoqOjtWXLFnXt2tXhmtjYWMXGxjrdKyYmJqR+iENtPHWVlSVFR0szZji2JE9KsjjVNrlSPWiSpF27LBo3Llp5edKIEebmurb0wIwMRexqVGObN2gYzBv4i7kDfzBv4I+Gmje+vEdQAyfDMHTLLbdo+fLlKigoUJcuXWo9v3v37vr6668djv3lL3/R4cOH9cQTTygtLa0+hwsfZWY6Bzm9e0tdu5qNIHxZ6zTrn6QpU5yDMTbVBQAAQH0LauA0bdo05ebmasWKFWrZsqV2794tSWrVqpWaNWsmSZo4caJSUlI0d+5cxcXF6ayzznK4R+vWrSXJ6ThCQ1SUNGCA47EnnjC751ksvgdP+/c7H7d148vLI3gCAABA/QhqO/L58+fr0KFDGjBggJKTk+1fr7/+uv2c7du3q7i4OIijRKC5a2XuoZmiW2yqCwAAgPoW9FQ9TwoKCmp9fdGiRYEZDBqUqzQ+q1UaNMi/+1XfVLd6DRVpfAAAAAiEkGgOgchUM43PajUDHV/rn6pzt6kuaXwAAACoi6Cm6gHVRUWZq0OSWf8UCNXT+EjbAwAAgL8InBBS3NU/paZKbdv6F1DZ0vjWrg3MGAEAABB5SNVDyHFV/5SRIa1Y4V83PpuiIrNhBPs/AQAAwFcETghJrtqY21ajnDfVda5tcuW222gcAQAAAP+QqoewkpkpFRZKq1ZJubnm486dZhDkKY3PXeOIZcvqbbgAAABoJAicEHZsq1Hjx5uPTZv611SCxhEAAADwFoETGgV3TSWSkmq/ztY4oqCAjXMBAADgHjVOaDRcNZUoKpKuvdbztVlZ0oEDVc+pfwIAAEB1BE5oVGo2lSgo8O666kGTxMa5AAAAcESqHhq1jAzvGkfUVL3+6cQJ0vgAAAAiHStOaNSiosyUO3/2f7LVP6Wmum9jbrU67zfF3lAAAACNDytOaPTcNY5ITPTuendtzO+4Q0pPlwYOlLKzzcf0dNqbAwAANEasOCEiuGocYbVKgwb5fi/bqtUjjzi/VrM2ihUpAACAxoHACRGjZuMIq9VMuysq8i2FrzaGYaYE5uRIlZXSbbeZG/Ta0K0PAAAgPJGqh4hlq3+SfG8eURtbbdTYsY5Bk1S1IkU6HwAAQHghcEJE83fjXH9V79ZHdz4AAIDwQeCEiJeZKRUWSqtWSbm55uPOnf61MfeGbUVq7drA3xsAAAD1gxonQM71T5L/bcy9VVRk7gtF4wgAAIDQx4oT4Ia7NL60NOn2282AquaKlC8rVLfdRitzAACAcEHgBNTCVRrftm3SvHmug6rUVGnpUu/S/NztD0XwBAAAEHpI1QM8cJXGJ7neG8qWbhcV5XuaX/VW5lddJa1fTxofAABAqCBwAuqgtqAqL0+aMcOxJXlSkvNKU3W2xhGpqY7nsf8TAABAcJGqB9QTV2l+f/+7d9eSxgcAABBaWHEC6lHNFamCAv/uUzONb80ai9asSVHz5hYNHEgaHwAAQH0jcAIaUEaGmXZXVOR7i3PHNL5oST312GOOaXxWq+uaKwAAANQNqXpAA4qKMoMcyf/Ndd2l8d1xh9nSnBbnAAAAgUfgBDQwd/tDJSX5dz/DML8eecSxEYVEbRQAAECgEDgBQeCqccTOnd7t/+QLWzpgTo6ZxgcAAAD/UOMEBImrVuZPPOH7/k+e2Gqj1q513TodAAAAnrHiBISQQKfxVVdcXPd7AAAARCpWnIAQk5kpjRjh2B2vd2+pa1f/uvHZtG9vtkOn4x4AAIDvCJyAEBToNL64OGnSJDPwsqnexhwAAAC1I1UPCBPu0vjS0qTbbzcDKneNJY4fdwyaJMeOe1aruRq1eLH5WL2RRG2vAQAARApWnIAwYkvjW7XqN7333mYNG3auBg6MVlSUdMkl0owZji3JU1OlkhLpyBHnexmGGWhNmeL6Ott+U+5eY6UKAABEEgInIMxERUn9+xs6erRI/fv3sNcpuaqNslqlQYPc38swpP37nY8XFUmjR7u+xrZSlZdH8AQAACIHgRPQiNSsjVq82L/71FZDZVupyskxAzUaTAAAgEhAjRPQiCUn1899q+8NRQ0UAACIBAROQCOWkWHWJLlrGlFXK1ZI6enSwIFSdrb5mJ5uNpwAAABoTAicgEYsKqqqyUN9BE+PP+7YOEJy7NYHAADQWBA4AY2cuzbmqalS27aBD6hs9VE5OdKJE6TxAQCAxoHmEEAEcNVxLyPDTLVztalu9ee1veaOrQYqNVXau7fqOK3MAQBAuGLFCYgQto5748ebj1FRta9Gvfmm+eXqtZwc796zetAkkcYHAADCFytOQIRztxplazPu6rW1a836Jl/RyhwAAIQrAicATvs/eXrN1q2vqMhz2l5N1VuZu3tPAACAUEPgBMBntm59ruqjvFVUZDaMcLXKZbW6XwEDAAAIBgInAH6x1UfNmOHYkjwpybm2yZXbbnPdOEJyvidNJQAAQLAROAHwm6v6qN69pa5dPafxuWocMXq063NtTSXy8gieAABAcNBVD0Cd1OzW17Spf5vu1hZkVd8bir2gAABAMBA4AQg4d23Ok5L8v2f1phIAAAANjVQ9APXCVRpfUZF07bV1u29xcWDGBwAA4AsCJwD1pmYr84KCut+zfXu68QEAgIZH4ASgwdRl/ydJio6WrrvOcdWJbnwAAKAhUOMEoMHY9n+SnBtHVH/urqnEb785p+rZuvGNHu0YNNleGzNGWrasbuMGAAAIauA0d+5cXXjhhWrZsqXat2+vkSNHasuWLbVe8/zzzysjI0Nt2rRRmzZtNGjQIH322WcNNGIAdeWucURqqvTmm+aXq9dat3Z9P7rxAQCAhhDUwGn16tWaNm2aNm7cqPz8fFVUVGjIkCE6evSo22sKCgo0fvx4rVq1Shs2bFBaWpqGDBmioqKiBhw5gLrIzJQKC6VVq6TcXPNx2zbzuKvXFi2SSkr8ey+68QEAgEAIao3T+++/7/B80aJFat++vb744gv169fP5TWvvfaaw/N//vOfevPNN/Xxxx9r4sSJ9TZWAIFVs3FEba8tXlz39ysqct9UAgAAwJOQag5x6NAhSVJiYqLX15SVlamiosLtNeXl5SovL7c/Ly0tlSRVVFSooqKiDqMNDNsYQmEsCB+RNm+Skiyq6x9XOTmG9u2rKp5KSTH02GNWjRrlR5eKMBVp8waBw9yBP5g38EdDzxtf3sdiGP70tgq8yspKXX311SopKdG6deu8vm7q1Kn64IMP9O233youLs7p9dmzZ2vOnDlOx3NzcxUfH1+nMQNoGFarNGXKEO3fHyfJVecI2x9jbrpKuHzdPPanP32uiy4q1nfftdXBg3Fq0+a4zjhjP6tRAABEgLKyMmVnZ+vQoUNKSEio9dyQCZxuvvlmvffee1q3bp1SU1O9uuahhx7SvHnzVFBQoHPOOcflOa5WnNLS0rRv3z6PH05DqKioUH5+vgYPHqyYmJhgDwdhIhLnzfLlFo0bZ0YzhlEVAFkshr0JhMXi+JqngMpiMZSYKMXFSUVFjX81KhLnDQKDuQN/MG/gj4aeN6WlpWrXrp1XgVNIpOpNnz5dK1eu1Jo1a7wOmh599FE99NBD+uijj9wGTZIUGxur2NhYp+MxMTEh9UMcauNBeIikeZOVZe7j5LxXk0WPP27+uuZrSUkW7d3r/p6GYdH+/c7Hd+2yaNy4aOXlNc49oCJp3iCwmDvwB/MG/mioeePLewQ1cDIMQ7fccouWL1+ugoICdenSxavr5s2bpwceeEAffPCBevbsWc+jBBAqMjOlESPMDnmumjzUfK2oSLr2Wt/fxzDM1aucHPOepO0BAICgBk7Tpk1Tbm6uVqxYoZYtW2r37t2SpFatWqlZs2aSpIkTJyolJUVz586VJD388MO69957lZubq/T0dPs1LVq0UIsWLYLzjQBoML504yso8P99bG3MCwrM+9KNDwCAyBbUfZzmz5+vQ4cOacCAAUpOTrZ/vf766/Zztm/fruLiYodrTpw4oTFjxjhc8+ijjwbjWwAQwjIyzM1zLe56RnghK0saOFDKzjYf09OlZcsCNkQAABAmgp6q50lBjf8yLiwsrJ/BAGh0oqKkJ56QxoyxNY7w/R4HDjg+Lyoy79dY658AAIBrQV1xAoD6lplpBjkpKY7HU1Oltm19X42yBV85OWabdAAAEBkInAA0epmZUmGhtGqVlJtrPhYWSgsWmK/7Ezzt2GE2orBazTqoxYvNR4IpAAAap5BoRw4A9c1VUwnbalTNNuaJic4peq6sWCFdd13N9uhmemBmphlEuesACAAAwguBE4CI5qrFudUqDRrk+Vrb/lHV2Wqg/vhHcxXKXVAFAADCC4ETgIhXczXKajWDnKIi3xtK2M5/5BHn12gsAQBA+KLGCQBqsHXjk5zrn+rS2pzGEgAAhC8CJwBwobZufDk5/t+3emMJAAAQPgicAMANV934tm0za6Lqqtq+3gAAIAxQ4wQAtXDVjS8jw/8aKJv27c325XTcAwAgPBA4AYCPbDVQY8aYNU++Bk9xcdKkSWbgZUPHPQAAQhupegDgB3c1UGlp0u23mwGVu0YSx487Bk1SVce9ZcvYVBcAgFDEihMA+MnVHlC2lLtLLnHeWDc1VSopkY4ccb6XYZiB1pQprq9jNQoAgOAicAKAOnBVAyX5t7GuYUj79zsfZ/8nAACCj8AJAOpJzaBq8WL/7mNbjcrJMYMxmkgAANDwCJwAoIEkJ/t/rW3/p4ICM3CiGx8AAA2LwAkAGkgg2phnZUkHDlQ9r17/ZLW6rrcCAAB1R1c9AGggtjbmkvuOe55UD5qkqvqnO+6Q0tOlgQOl7GzzMT3d7NIHAADqjsAJABqQuzbmqalS27a+B1SGYX498ohjJz7JscU5AACoGwInAGhgmZlSYaG0apWUm2s+FhZKCxaYr/u7GlWTLR0wJ0c6cUJavdqiNWtStHq1hb2hAADwETVOABAErtqY21ajau7jlJjonKLnLVtTidRUae/eaEk99dhj7A0FAICvWHECgBDiajVq6dK633fvXsfnpPEBAOCbOq04HT9+XHFxcYEaCwBAzqtRVmvdu/HVxN5QAAD4xucVp8rKSt13331KSUlRixYttHXrVknSPffcoxdeeCHgAwSASBeIbnyuVN8bqqDA3KC3oEDUPwEA4ILPgdP999+vRYsWad68eWratKn9+FlnnaV//vOfAR0cAMDkrhtfWpp0++1mQOVvUJWVRRtzAAA88Tlwevnll7VgwQJNmDBBUdVyO3r06KEffvghoIMDAFRxVf+0bZs0b57roCopybv7utsbiuAJAIAqPtc4FRUVqVu3bk7HKysrVVFREZBBAQBcc9WNTzKDqhEjpLVrpeJiKTlZ6t1b6trV99qomvVPkuN9MzKoiQIARB6fA6czzjhDa9euVefOnR2O5+Xl6bzzzgvYwAAAvnEVVD3xhLl6ZLH4Hjzt2CE98ID0/POO7dFpZQ4AiEQ+B0733nuvJk2apKKiIlVWVmrZsmXasmWLXn75Za1cubI+xggA8FNd94aaNcv5mC2VLy+P4AkAEDl8rnEaMWKE3nnnHX300Udq3ry57r33Xn3//fd65513NHjw4PoYIwCgDmy1Ufn5v2nmzE3Kz/+tTntD2VaucnKkEyfoyAcAiAx+7eOUkZGh/Pz8QI8FAFBPoqKk/v0NHT1apP79e6hJk7rtDWVL5UtNddxclzQ+AEBj5fOKEwAg/NW2N5Qvbc2rB00SHfkAAI2Xz4FTkyZNFBUV5fYLABAe3O0NlZoqzZnj3z1J4wMANFY+p+otX77c4XlFRYW++uorvfTSS5rj79+0AICgcNXGPCPDfO355/1L5SONDwDQGPkcOI2wbepRzZgxY3TmmWfq9ddf14033hiQgQEAGoa7vaH8bWVu4y6Nj258AIBwFLAap0suuUQff/xxoG4HAAgyd6l8SUn+3a96Gh9pewCAcONXV72ajh07pieffFIpNf92BQCENVepfL17S1271i2Nr6DAXOmqnh5ImSwAIJT5HDi1adNGlmotlwzD0OHDhxUfH69XX301oIMDAASfq1S+uqbxZWU5bsBbvf7JanWuuSKoAgAEm8+B09///neHwKlJkyZKSkrSxRdfrDZt2gR0cACA0GRL45sxQ9q5s+p4UpJzbZMr1YMmqar+6Y9/NLvwVb8nTSUAAKHA58Bp8uTJ9TAMAEC4CWQan+3cRx5xfo2mEgCAUOBV4PTf//7X6xuec845fg8GABBe6iONrybDMO+VkyNddZW0fj1pfACAhudV4HTuuefKYrHI8PA3oMVikZVWSQAQ0dyl8SUmOqfoeYu9oQAAweZV4LRt27b6HgcAoBFxlcZntUqDBtXtvuwNBQAIFq8Cp86dO9f3OAAAjUzNND6r1Vwh8qeNuTvV0/hGjCBtDwBQf/zex+m7777T9u3bdeLECYfjV199dZ0HBQBofKKiAl//JFWl8a1d61xvBQBAoPgcOG3dulWjRo3S119/7VD3ZGtRTo0TAMAdd/VPaWnSuHHSo4+az/0JqoqKzI11aRwBAKgPTXy9YMaMGerSpYv27Nmj+Ph4ffvtt1qzZo169uypgoKCehgiAKAxycyUCgulVauk3Fzzcds2ad48M6hKSXE8PynJu/vedps0cKCUnW0+pqdLy5YFevQAgEjl84rThg0b9Mknn6hdu3Zq0qSJmjRpor59+2ru3Lm69dZb9dVXX9XHOAEAjYirNuZS3faGonEEAKA++bziZLVa1bJlS0lSu3bttGvXLklmA4ktW7YEdnQAgIhjC6rGjzcfmzY1a6MkszbKW7YgKydHOnHCTONbvNh8JKscAOArn1eczjrrLP3nP/9Rly5ddPHFF2vevHlq2rSpFixYoJNPPrk+xggAiHDuaqOSkpxXmqpj/ycAQKD4HDj95S9/0dGjRyVJf/3rX3XVVVcpIyNDbdu21euvvx7wAQIAILlO4ysqkq691vO1pPEBAOrK68CpZ8+e+t3vfqfs7GwlJCRIkrp166YffvhBBw4cUJs2beyd9QAAqA81a6P87UnE/k8AAF95XePUo0cP3XHHHUpOTtbEiRMdOuglJiYSNAEAGlxGhpl2589fQbY0voIC6p8AAJ55HTi98MIL2r17t55++mlt375dl112mbp166YHH3xQRUVF9TlGAABcsm2qK/kXPElSVhZtzAEAnvnUVS8+Pl6TJ09WQUGBfvzxR40bN07PPfec0tPTdeWVV2qZj3/TzJ07VxdeeKFatmyp9u3ba+TIkV515nvjjTfUvXt3xcXF6eyzz9a7777r0/sCABoPW+MIf/d/OnDA8bmt/ongCQBQnc/tyG26du2q+++/X4WFhVq8eLE2btyosWPH+nSP1atXa9q0adq4caPy8/NVUVGhIUOG2JtPuLJ+/XqNHz9eN954o7766iuNHDlSI0eO1DfffOPvtwIACHOuNtXdudO/NL7qbcytVvOLVD4AgM9d9aorKCjQwoUL9eabbyo6Olr/93//59P177//vsPzRYsWqX379vriiy/Ur18/l9c88cQTuvzyy3X77bdLku677z7l5+frqaee0rPPPuvfNwIACHuuNtV94glz9chiqX3z3Jps9U8PPCA9/7xjC3RamQNAZPI5cNq5c6cWLVqkRYsWaevWrcrIyNAzzzyjsWPHqlmzZnUazKFDhySZzSbc2bBhg2bOnOlwbOjQoXrrrbdcnl9eXq7y8nL789LSUklSRUWFKioq6jTeQLCNIRTGgvDBvIE/InHeDB8uLVli0cyZUSoqqlp6Skw0dOCA56WoWbNs0VbVuUVFhsaMkZYssWrUKB+isTAWiXMHdce8gT8aet748j4Ww/Du/+CWLl2qF198UR9//LHat2+vSZMm6YYbblC3bt38Hmh1lZWVuvrqq1VSUqJ169a5Pa9p06Z66aWXNH78ePuxZ555RnPmzNGvv/7qdP7s2bM1Z84cp+O5ubmKj48PyNgBAKHNapW++66tDh6MU5s2x1VZKc2a1deLKw1VD5qqH2/X7pieey6fVuYAEMbKysqUnZ2tQ4cO2bdccsfrFadrr71WV155pZYvX64rrrhCTZr4XR7l0rRp0/TNN9/UGjT546677nJYoSotLVVaWpqGDBni8cNpCBUVFcrPz9fgwYMVExMT7OEgTDBv4I9InzfDh1f92mqVFiwwtGuXZBiuAyMzYHK3KmXRvn3xat78SkVFVW3I27ev0SgDqUifO/AP8wb+aOh5Y8tG84bXgdPOnTvVvn17vwbkyfTp07Vy5UqtWbNGqamptZ7bsWNHp5WlX3/9VR07dnR5fmxsrGJjY52Ox8TEhNQPcaiNB+GBeQN/MG+kmBjpySdd1z+Zz73rKJGdHe3Qla+x1z8xd+AP5g380VDzxpf38HrZqD6CJsMwNH36dC1fvlyffPKJunTp4vGaXr166eOPP3Y4lp+fr169egV8fACAxstdG/PUVMlFhrdLtDIHgMhRp656dTVt2jTl5uZqxYoVatmypXbv3i1JatWqlb3RxMSJE5WSkqK5c+dKkmbMmKH+/fvrb3/7m6688kotWbJEmzZt0oIFC4L2fQAAwlNmpjRihLR2bVW6XUaG+drzz5uBkK/d+CwWs5X5VVdJ69c73rcxpvEBQKQIauA0f/58SdKAGv1jFy5cqMmTJ0uStm/f7lBP1bt3b+Xm5uovf/mL/vznP+uUU07RW2+9pbPOOquhhg0AaERctTGX6t7KPDVV2ru36nhjT+MDgMYuqIGTNw39CgoKnI6NHTvW5812AQDwhS2Vb8YMx32cEhOdU/RcqR40SVVpfHl5BE8AEI58bo23Y8cO7az2N8hnn32mnJwcUuUAAI1OZqZUWCitWiXl5pqPS5f6dy/b/xXm5Jhd/QAA4cXnFafs7GxNmTJF1113nXbv3q3BgwfrzDPP1Guvvabdu3fr3nvvrY9xAgAQFDVT+axWM+3O1/onqSqNr6BADm3MqX8CgNDn84rTN998o4suukiSuSnuWWedpfXr1+u1117TokWLAj0+AABCSlSUWaskmfVP/sjKkgYOlLKzzcf0dDrxAUCo8zlwqqiosO+L9NFHH+nqq6+WJHXv3l3FxcWBHR0AACHIXSvzpCTvrqeNOQCEH58DpzPPPFPPPvus1q5dq/z8fF1++eWSpF27dqlt27YBHyAAAKHIVf3Tzp1mGp+vK1HUPwFA6PO5xunhhx/WqFGj9Mgjj2jSpEnq0aOHJOntt9+2p/ABABAJXLUyr2sbc+qfACA0+Rw4DRgwQPv27VNpaanatGljPz5lyhTFx8cHdHAAAISburYxz8pyPI/9nwAgNPicqnfs2DGVl5fbg6ZffvlFjz/+uLZs2aL27dsHfIAAAISburQxp/4JAEKTzytOI0aMUGZmpm666SaVlJTo4osvVkxMjPbt26fHHntMN998c32MEwCAsBKoNuaGYab95eRIV10lrV9PGh8ABIPPK05ffvmlMjIyJEl5eXnq0KGDfvnlF7388st68sknAz5AAAAag7q0MbfVP6Wm0sYcAILF58CprKxMLVu2lCR9+OGHyszMVJMmTXTJJZfol19+CfgAAQBoLNy1MU9M9O76vXsdn5PGBwANx+fAqVu3bnrrrbe0Y8cOffDBBxoyZIgkac+ePUpISAj4AAEAaEzqUv9UE23MAaDh+FzjdO+99yo7O1u33XabLr30UvXq1UuSufp03nnnBXyAAAA0NoGqf5JoYw4ADcXnwGnMmDHq27eviouL7Xs4SdJll12mUaNGBXRwAABEAlv9kz/7P9nQxhwA6pfPqXqS1LFjR5133nnatWuXdv7/TSouuugide/ePaCDAwAgUrirf0pK8u562pgDQP3yOXCqrKzUX//6V7Vq1UqdO3dW586d1bp1a913332qrKysjzECABARXNU/7dxprh7504lPMuufTpwwU/kWLzYfqYcCAN/5nKp3991364UXXtBDDz2kPn36SJLWrVun2bNn6/jx43rggQcCPkgAACJFzfonyf80vuptzKt35CONDwB85/OK00svvaR//vOfuvnmm3XOOefonHPO0dSpU/X8889r0aJF9TBEAAAiG23MASD4fA6cDhw44LKWqXv37jpQM8EaAAAEBG3MASC4fE7V69Gjh5566ik9+eSTDsefeuophy57AAAgsOqjjfnatWbr8rVraWUOALXxOXCaN2+errzySn300Uf2PZw2bNigHTt26N133w34AAEAgGuBaGO+YoV03XVmEwobaqAAwJnPqXr9+/fXjz/+qFGjRqmkpEQlJSXKzMzUli1blJGRUR9jBAAAbtS1jfnjjzsGTRI1UADgis8rTpLUqVMnp+55O3fu1JQpU7RgwYKADAwAAHgnM1MaMcIx3a53b6lrV//T+CwWswZqxIh6GTIAhB2/NsB1Zf/+/XrhhRcCdTsAAOADW/3T+PHmY9OmZrqd5LwHlDd7QtlqoAoKpNWrLVqzJkWrV1toJgEgYgUscAIAAKHFXRpfaqq5muSNrCxp8OBoPfZYTw0eHK30dFL4AEQmAicAABoxV23Mt23zPgWv5k4j1D8BiFR+1TgBAIDwUbONuWS2HPenlXnN+ifalgOIFF4HTpkeepKWlJTUdSwAAKCB1KWVefX6p6go9n8CEBm8DpxatWrl8fWJEyfWeUAAAKBh2GqgZsxwbEmemOicoudKVpbjeez/BKAx8zpwWrhwYX2OAwAABIGrVuZWqzRokOdr3dU/5eURPAFofKhxAgAgwtWsgbJaqX8CgJoInAAAgAPqnwDAGe3IAQCAE3d7QCUmend9VpY0cKCUnW0+sv8TgHBH4AQAAFyy7QGVn/+bZs7cpPz837R0qXfXsv8TgMaGVD0AAOBWVJTUv7+ho0eL1L9/DzVpUvf6p6uuktavJ40PQHghcAIAAF4LRP1Taqq0d2/VcdqYAwgHpOoBAACf1LX+qXrQJJHGByA8sOIEAAB8Vpf9n2oijQ9AOCBwAgAAfgnU/k8SaXwAQh+pegAAICBs9U+SuYLkD9L4AIQqAicAABAw7uqfkpL8u59t5Sonx1zRAoBgIXACAAABZdv/adUqKTfXfNy500y782clypbGt3ZtwIcKAF6jxgkAAARczfonyf825jbFxQEZGgD4hRUnAADQIOqaxte+vVRQIC1ebD6SugegIbHiBAAAGoyrNua9e0tdu9beja9FC2nyZDPlz4aOewAaEoETAABoUP6k8R05Yn5VZ+u4l5dH8ASg/pGqBwAAgs5dGl9KihQX5/qa6h33TpwgjQ9A/WLFCQAAhARXaXxWqzRokPtr2DgXQEMhcAIAACGjZhrf4sXeXedu41zS+AAECql6AAAgZCUn+3cdG+cCCDRWnAAAQMjKyDDT7mrruOeOLY2voMBcybKl/2VkmM8BwBcETgAAIGRFRdV949ysLOnAgarn1D8B8AepegAAIKTVdePc6kGTVFX/tGxZYMYHIDIQOAEAgJCXmSkVFkqrVkm5uebjzp3m6pHF4tu9atY/Wa20MgfgWVADpzVr1mj48OHq1KmTLBaL3nrrLY/XvPbaa+rRo4fi4+OVnJysG264Qfv376//wQIAgKCyddwbP958bNrUTLmT/AueduyQHnhASk+XBg6UsrPNx/R0VqMAOAtq4HT06FH16NFDTz/9tFfnf/rpp5o4caJuvPFGffvtt3rjjTf02Wef6f/+7//qeaQAACAUuUvjS0z07vpZs8yVq+pI5QPgSlCbQwwbNkzDhg3z+vwNGzYoPT1dt956qySpS5cu+v3vf6+HH364voYIAABCnD8b59bGMMwVrJwc87504AMghVlXvV69eunPf/6z3n33XQ0bNkx79uxRXl6errjiCrfXlJeXq7y83P68tLRUklRRUaGKiop6H7MntjGEwlgQPpg38AfzBv4Kl7nTp0/Vr61WKSUlWrt2SYbhKo/PkOQ+v8+Wyrdq1W/q39+PVn4Im3mD0NLQ88aX97EYhj+NPQPPYrFo+fLlGjlyZK3nvfHGG7rhhht0/Phx/fbbbxo+fLjefPNNxcTEuDx/9uzZmjNnjtPx3NxcxcfHB2LoAAAgBG3YkKyHH77w/z+rHiQZLo65lpOzSW3bHtfBg3Fq0+a4zjhjPytQQCNSVlam7OxsHTp0SAkJCbWeG1aB03fffadBgwbptttu09ChQ1VcXKzbb79dF154oV544QWX17hacUpLS9O+ffs8fjgNoaKiQvn5+Ro8eLDb4A+oiXkDfzBv4K9wnjvLl1s0c2aUioqqgqTUVEM33FCpv/7VcwTUrp2hffuqrk1JMfTYY1aNGhUS/3wKaeE8bxA8DT1vSktL1a5dO68Cp7BK1Zs7d6769Omj22+/XZJ0zjnnqHnz5srIyND999+v5ORkp2tiY2MVGxvrdDwmJiakfohDbTwID8wb+IN5A3+F49zJypJGj3asf8rIsEiK0osvmo0gavsv5OpBkyTt2mXRuHHRystzrqvKyKAeypVwnDcIvoaaN768R1gFTmVlZYqOdhxy1P//EypEFs4AAECIsbUxr+mJJ8zueRZL7cFTdbbGEVOmSDNmOHbkS00175mZGZBhAwgxQW1HfuTIEW3evFmbN2+WJG3btk2bN2/W9u3bJUl33XWXJk6caD9/+PDhWrZsmebPn6+tW7fq008/1a233qqLLrpInTp1Csa3AAAAwpS7VuZJSbVfZxjS/v20MQciTVBXnDZt2qSBAwfan8+cOVOSNGnSJC1atEjFxcX2IEqSJk+erMOHD+upp57SH/7wB7Vu3VqXXnop7cgBAIBfXLUyLyqSrr3W93vRxhxo3IIaOA0YMKDWFLtFixY5Hbvlllt0yy231OOoAABAJKmZyldQ4P+9bG3M1651nR4IIHwFNVUPAAAg1GRkmPVKFs/dyt0qLg7ceACEBgInAACAaqKizCYPkv/BU/v25srV4sXmo9UaqNEBCBYCJwAAgBrcNY5ITZXatq09oGrWTJo0SRo4UMrONh/T02kaAYQ7AicAAAAXMjOlwkJp1SopN9d8LCyUFiwwX3cXPB07ZjaYqI6Oe0D4C6t9nAAAABqSqz2gbKtRrvZxKimRjhxxvk/1jntXXSWtX8/GuUC4IXACAADwkas25larNGiQ+2tsHfdSU6W9e6uOs3EuEB4InAAAAPxQczVq8WLvrqseNElVaXx5eQRPQCijxgkAACAAkpP9u862pWVODt33gFBG4AQAABAAddn/qfrGuQBCE4ETAABAAARi/yc2zgVCF4ETAABAgLjb/ykpybvr2TgXCF00hwAAAAggVx33eveWunY1G0HYappqat5cmjzZucU5HfeA0EDgBAAAEGCu9n964gmze57F4jp4OnrU/KqOjntA6CBVDwAAoAG4S+NLTZXi411fU73j3okTpPEBwcSKEwAAQANh41wgfBE4AQAANCA2zgXCE6l6AAAAQcTGuUB4IHACAAAIIjbOBcIDgRMAAEAQBWLj3KIiGkcA9Y3ACQAAIMjqunHubbdJAwdK2dnmY3q6tGxZwIcJRDQCJwAAgBCQmSkVFkqrVkm5uebjzp3epfG5axxB8AQEDoETAABAiLB13Bs/3nxs2tS/ND4aRwCBR+AEAAAQwvxN47M1jigooP4JCAT2cQIAAAhxrjbOLSqSrr3W87VZWdKBA1XP2TgX8A+BEwAAQBiouXFuQYF311UPmiQ2zgX8RaoeAABAGPJ3/yfqnwD/EDgBAACEobrs/8TGuYDvCJwAAADClLvGEYmJ3l1fXBz4MQGNFTVOAAAAYcxV4wirVRo0yPO1tnOrX5uRYa5mAXBE4AQAABDmajaOsFrN+qeioqqaJleee0667jpzo10buu4BrpGqBwAA0MjUVv9U/fmSJY5Bk1TVdW/ZsvodIxBuCJwAAAAaIXf1T6mp0tKlUps2rq+r3nXvxAk2zwVsSNUDAABopFzVP2VkmM8PHnR/na3rXmqqtHdv1XHS+BDJCJwAAAAasZr1T5L33fSqB00Sm+cispGqBwAAEGGSk/27js1zEclYcQIAAIgwGRnedd1zxZbGV1BgrmbRxhyRgsAJAAAgwti67o0ZY3bZ8zV4kqSsLOnAgarn1D+hsSNVDwAAIAK567qXlOTd9dWDJok25mj8CJwAAAAiVGamVFgorVol5eaajzt3mqtHNfd/8oT6JzR2pOoBAABEMFdd9/xN46te/2QYFq1Zk6LmzS0aOJD6J4Q/VpwAAADgwF0aX2Kid9dnZUmDB0frscd6avDgaKWnk8KH8EfgBAAAACeu0viWLvXuWuqf0BiRqgcAAACXaqbxWa3+tTE3DDPtLydHGjGCtD2EJ1acAAAA4BVbG3PJv+YRO3ZIa9cGflxAQyBwAgAAgNfqWv9UVGQ2j1i82HykAx/CBal6AAAA8Elmpplyt3atVFwsJSebAdCgQZ6vve02ae/equdsnItwQeAEAAAAn/lb/1Q9aJKqGkfk5RE8IbSRqgcAAIA687f+iY1zES4InAAAABAQ7uqfkpJqv47GEQgHBE4AAAAIGNv+T/n5v2nmzE3Kz/9Nf/+7d9cWF9fr0IA6ocYJAAAAARUVJfXvb+jo0SL1799Dn37q3XXt25ud9mwNJzIy2PMJoYPACQAAAPUqI8Nz44joaOm66xxXnei4h1BCqh4AAADqlTeNI377zTlVz9Zxb9kys3EE+z8hmAicAAAAUO/cNY5ITZVat3Z9jW11asoUKT1dGjhQys42H9PTzYAKaChBDZzWrFmj4cOHq1OnTrJYLHrrrbc8XlNeXq67775bnTt3VmxsrNLT0/Xiiy/W/2ABAABQJ7bGEatWSbm55uOiRVJJiftrDEPav1/audPxePXVKKAhBLXG6ejRo+rRo4duuOEGZXqZvJqVlaVff/1VL7zwgrp166bi4mJVVlbW80gBAAAQCDU3zl282L/7GIaZ9peTI40YQRMJ1L+gBk7Dhg3TsGHDvD7//fff1+rVq7V161YlJiZKktLT0+tpdAAAAKhvycn+X1t9/6fqwRhQH8Kqq97bb7+tnj17at68eXrllVfUvHlzXX311brvvvvUrFkzl9eUl5ervLzc/ry0tFSSVFFRoYqKigYZd21sYwiFsSB8MG/gD+YN/MXcgT+8nTeXXCKlpERr1y7JMNx0jvBgx47fVFHhpl0fwkpD/3njy/uEVeC0detWrVu3TnFxcVq+fLn27dunqVOnav/+/Vq4cKHLa+bOnas5c+Y4Hf/www8VHx9f30P2Wn5+frCHgDDEvIE/mDfwF3MH/vBm3lx7bbIefvhCSYak6sFTzeeubdu2UQ8/LB08GKc2bY7rjDP2k7oX5hrqz5uysjKvz7UYhrtu+g3LYrFo+fLlGjlypNtzhgwZorVr12r37t1q1aqVJGnZsmUaM2aMjh496nLVydWKU1pamvbt26eEhISAfx++qqioUH5+vgYPHqyYmJhgDwdhgnkDfzBv4C/mDvzh67xZvtyimTOjVFRUFSilpBg6dkw6eND9alTTpobatZN27XK87rHHrBo1KiT+mQsfNPSfN6WlpWrXrp0OHTrkMTYIqxWn5ORkpaSk2IMmSTr99NNlGIZ27typU045xema2NhYxcbGOh2PiYkJqT/8Q208CA/MG/iDeQN/MXfgD2/nTVaWNHq0Wa9UXGzWPmVkWLRihdk9z2JxvXnuiRMW7drleGzXLovGjYtWXh6b54arhvrzxpf3CKt9nPr06aNdu3bpyJEj9mM//vijmjRpotTU1CCODAAAAHVl67g3frz5GBVV+/5P7hYIbAFWTg4b5SJwgho4HTlyRJs3b9bmzZslSdu2bdPmzZu1fft2SdJdd92liRMn2s/Pzs5W27Ztdf311+u7777TmjVrdPvtt+uGG25w2xwCAAAA4c3d/k//v+eXS9U77lmtUkGB2fq8oIBgCv4Jaqrepk2bNHDgQPvzmTNnSpImTZqkRYsWqbi42B5ESVKLFi2Un5+vW265RT179lTbtm2VlZWl+++/v8HHDgAAgIbj7/5PK1ZI113nuIFuaqr0xBOk8cE3QQ2cBgwYoNp6UyxatMjpWPfu3enqAwAAEOG83f/p8cedjxUVmXVT1EDBF2FV4wQAAABIUkaGuXJk8WPrJ2qg4A8CJwAAAISdqCgz3U5yDp68Caaq10AB3iBwAgAAQFiqreNeTo539ygqonEEvBNW+zgBAAAA1WVmSiNG1Nz/yXzuqr6ppttuk/burXpO4wi4Q+AEAACAsFaz455UVQNVVOR641yb6kGTROMIuEeqHgAAABqd2mqgakPjCLhD4AQAAIBGyV0NVFJS7dfROAKukKoHAACARstVDVRRkXTttZ6vtTWOqF47FRVV70NGiCJwAgAAQKNWswaqoMC762gcgepI1QMAAEBE8XbzXHeNI5Ytq7+xIXQROAEAACCi0DgC/iBwAgAAQMShcQR8RY0TAAAAIhKNI+ALAicAAABELBpHwFuk6gEAAAD/H40j4A6BEwAAAPD/0TgC7hA4AQAAANXQOAKuUOMEAAAA1EDjCNRE4AQAAAC4QOMIVEeqHgAAAOAFGkdENgInAAAAwAs0johsBE4AAACAl2gcEbmocQIAAAB8QOOIyETgBAAAAPiIxhGRh1Q9AAAAoI5oHNH4ETgBAAAAdUTjiMaPwAkAAAAIgLo2jigoML8WLzYfCaRCCzVOAAAAQIDUpXFEVpZ04EDVc+qfQguBEwAAABBA/jaOqB40SVX1T3l5BE+hgFQ9AAAAoB552ziiJuqfQguBEwAAAFCP/G0cIbFxbighcAIAAADqmbvGEYmJ3l1fXBz4McE31DgBAAAADcBV4wirVRo0yPO17dubtVK26zIyzJUsNBwCJwAAAKCB1GwcYbWa9U9FRVU1Ta7QcS/4SNUDAAAAgqS2+qfqz9113Fu2rH7HhyoETgAAAEAQuat/SkmR2rZ1fQ0d9xoeqXoAAABAkPlT/2TruFdQYK5cUf9UvwicAAAAgBBQs/5p8WLvrqP+qWGQqgcAAACEoORk786j/qlhEDgBAAAAISgjw1w98mfTXIn6p0AjcAIAAABCUG0d9zyx1T+tXRv4cUUqAicAAAAgRLnruJeY6N31xcXmqlNBgVkzVVDAKpS/aA4BAAAAhDB/Ou7Z/PSTlJ4u7dxZdYzmEf4hcAIAAABCXM2Oe1arGQAVFVXVNLkya5bzMVvziLw8gidfkKoHAAAAhJna6p881UPRPMI/BE4AAABAGHJX/5SaKs2ZU/u1NI/wHYETAAAAEKYyM6XCQmnVKik313zctk065RTvri8urtfhNSrUOAEAAABhrGb9k+T95rnengcCJwAAAKDRsW2eW1vziE6dpN69zRbltm59GRlmIAZnBE4AAABAI2NrHjFmjNkswlXwdPSo1LmztHt31TFalbtHjRMAAADQCLlrHpGcLCUkSIcOOQZNUlWr8mXLGm6c4YLACQAAAGikXDWPKCyUmjd3fT6tyt0jVQ8AAABoxGo2j7DVNLlja1VeUGBeS/2TicAJAAAAiCDetiDPypIOHKh6Hun1T0FN1VuzZo2GDx+uTp06yWKx6K233vL62k8//VTR0dE699xz6218AAAAQGPjbQvy6kGT5Fj/ZLWaK1KLF5uPkZDWF9TA6ejRo+rRo4eefvppn64rKSnRxIkTddlll9XTyAAAAIDGydaq3GLx7Tpb/dOUKVJ6ujRwoJSdbT6mpzf+hhJBTdUbNmyYhg0b5vN1N910k7KzsxUVFeXTKhUAAAAQ6bxpVe6OYUj79zsft61G5eU13lS+sKtxWrhwobZu3apXX31V999/v8fzy8vLVV5ebn9eWloqSaqoqFBFRUW9jdNbtjGEwlgQPpg38AfzBv5i7sAfzJvQNny4tGSJRTNnRqmoqGrpKTHR0IEDPi5FyQyoLBZDM2ZIV1zxm99NJBp63vjyPmEVOP3000+68847tXbtWkVHezf0uXPnas6cOU7HP/zwQ8XHxwd6iH7Lz88P9hAQhpg38AfzBv5i7sAfzJvQFRsrPfmk9N13bXXwYJzatDmuykpp1qy+ft3PMCzauVN69NF/6+yzXSxL+aCh5k1ZWZnX54ZN4GS1WpWdna05c+bo1FNP9fq6u+66SzNnzrQ/Ly0tVVpamoYMGaKEhIT6GKpPKioqlJ+fr8GDBysmJibYw0GYYN7AH8wb+Iu5A38wb8LH8OFVv7ZapQULDO3aZQZC/ujc+RJdcYUP+X/VNPS8sWWjeSNsAqfDhw9r06ZN+uqrrzR9+nRJUmVlpQzDUHR0tD788ENdeumlTtfFxsYqNjbW6XhMTExI/RCH2ngQHpg38AfzBv5i7sAfzJvwEhNjrkL5U/9kk5YWrbr+ljfUvPHlPcImcEpISNDXX3/tcOyZZ57RJ598ory8PHXp0iVIIwMAAAAaj8xMs8nDjBnSzp1Vx1NTpWPHzDbl7gKq1FSza19jFNTA6ciRI/rf//5nf75t2zZt3rxZiYmJOumkk3TXXXepqKhIL7/8spo0aaKzzjrL4fr27dsrLi7O6TgAAAAA/2VmSiNGSGvXmhvmJiebAdGKFbWvRp10kpnuV/M6f5tFhJKgBk6bNm3SwIED7c9ttUiTJk3SokWLVFxcrO3btwdreAAAAEDEioqSBgxwPOZuNSopyVyJWr9eSkyUjh6tei011Wx/Hu5tyoO6Ae6AAQNkGIbT16JFiyRJixYtUkFBgdvrZ8+erc2bNzfIWAEAAACYAVBhobRqlZSbaz4WF0s5Oebr1YMmqWqPp3DfIDdsapwAAAAAhIaaq1FWq/T6667PNfd4MgOrESPCN20vqCtOAAAAAMLf2rWOqXs1GYa0Y4d5XrhixQkAAABAnRQXe3deUZFUUBCejSMInAAAAADUSXKyd+fl5Ej79lU9D6fGEaTqAQAAAKiTjAwzCLJYaj+vetAkhVfjCAInAAAAAHUSFWWuHEmeg6fqbHtB5eSYDSZCGYETAAAAgDqz7fGUkuJ4PCmp9uvCpXEENU4AAAAAAiIz02w5vnZtVQOIoiLp2ms9X+ttg4lgIXACAAAAEDA193gqKPDuOm8bTAQLqXoAAAAA6o2nxhEWi5SWZp4XygicAAAAANSb2hpH2J4//njo7+dE4AQAAACgXrlrHJGaah4Ph32cqHECAAAAUO9cNY7IyAj9lSYbAicAAAAADaJm44hwQqoeAAAAAHhA4AQAAAAAHhA4AQAAAIAHBE4AAAAA4AGBEwAAAAB4QOAEAAAAAB4QOAEAAACABwROAAAAAOABgRMAAAAAeEDgBAAAAAAeEDgBAAAAgAcETgAAAADgAYETAAAAAHgQHewBNDTDMCRJpaWlQR6JqaKiQmVlZSotLVVMTEywh4MwwbyBP5g38BdzB/5g3sAfDT1vbDGBLUaoTcQFTocPH5YkpaWlBXkkAAAAAELB4cOH1apVq1rPsRjehFeNSGVlpXbt2qWWLVvKYrEEezgqLS1VWlqaduzYoYSEhGAPB2GCeQN/MG/gL+YO/MG8gT8aet4YhqHDhw+rU6dOatKk9iqmiFtxatKkiVJTU4M9DCcJCQn8oQKfMW/gD+YN/MXcgT+YN/BHQ84bTytNNjSHAAAAAAAPCJwAAAAAwAMCpyCLjY3VrFmzFBsbG+yhIIwwb+AP5g38xdyBP5g38Ecoz5uIaw4BAAAAAL5ixQkAAAAAPCBwAgAAAAAPCJwAAAAAwAMCJwAAAADwgMApiJ5++mmlp6crLi5OF198sT777LNgDwkhZO7cubrwwgvVsmVLtW/fXiNHjtSWLVsczjl+/LimTZumtm3bqkWLFho9erR+/fXXII0Yoeihhx6SxWJRTk6O/RjzBu4UFRXp2muvVdu2bdWsWTOdffbZ2rRpk/11wzB07733Kjk5Wc2aNdOgQYP0008/BXHECDar1ap77rlHXbp0UbNmzdS1a1fdd999qt57jHkDSVqzZo2GDx+uTp06yWKx6K233nJ43Zt5cuDAAU2YMEEJCQlq3bq1brzxRh05cqTBvgcCpyB5/fXXNXPmTM2aNUtffvmlevTooaFDh2rPnj3BHhpCxOrVqzVt2jRt3LhR+fn5qqio0JAhQ3T06FH7ObfddpveeecdvfHGG1q9erV27dqlzMzMII4aoeTzzz/Xc889p3POOcfhOPMGrhw8eFB9+vRRTEyM3nvvPX333Xf629/+pjZt2tjPmTdvnp588kk9++yz+ve//63mzZtr6NChOn78eBBHjmB6+OGHNX/+fD311FP6/vvv9fDDD2vevHn6xz/+YT+HeQNJOnr0qHr06KGnn37a5evezJMJEybo22+/VX5+vlauXKk1a9ZoypQpDfUtSAaC4qKLLjKmTZtmf261Wo1OnToZc+fODeKoEMr27NljSDJWr15tGIZhlJSUGDExMcYbb7xhP+f77783JBkbNmwI1jARIg4fPmyccsopRn5+vtG/f39jxowZhmEwb+Den/70J6Nv375uX6+srDQ6duxoPPLII/ZjJSUlRmxsrLF48eKGGCJC0JVXXmnccMMNDscyMzONCRMmGIbBvIFrkozly5fbn3szT7777jtDkvH555/bz3nvvfcMi8ViFBUVNci4WXEKghMnTuiLL77QoEGD7MeaNGmiQYMGacOGDUEcGULZoUOHJEmJiYmSpC+++EIVFRUO86h79+466aSTmEfQtGnTdOWVVzrMD4l5A/fefvtt9ezZU2PHjlX79u113nnn6fnnn7e/vm3bNu3evdth7rRq1UoXX3wxcyeC9e7dWx9//LF+/PFHSdJ//vMfrVu3TsOGDZPEvIF3vJknGzZsUOvWrdWzZ0/7OYMGDVKTJk3073//u0HGGd0g7wIH+/btk9VqVYcOHRyOd+jQQT/88EOQRoVQVllZqZycHPXp00dnnXWWJGn37t1q2rSpWrdu7XBuhw4dtHv37iCMEqFiyZIl+vLLL/X55587vca8gTtbt27V/PnzNXPmTP35z3/W559/rltvvVVNmzbVpEmT7PPD1d9dzJ3Ideedd6q0tFTdu3dXVFSUrFarHnjgAU2YMEGSmDfwijfzZPfu3Wrfvr3D69HR0UpMTGywuUTgBISBadOm6ZtvvtG6deuCPRSEuB07dmjGjBnKz89XXFxcsIeDMFJZWamePXvqwQcflCSdd955+uabb/Tss89q0qRJQR4dQtXSpUv12muvKTc3V2eeeaY2b96snJwcderUiXmDRodUvSBo166doqKinLpY/frrr+rYsWOQRoVQNX36dK1cuVKrVq1Samqq/XjHjh114sQJlZSUOJzPPIpsX3zxhfbs2aPzzz9f0dHRio6O1urVq/Xkk08qOjpaHTp0YN7ApeTkZJ1xxhkOx04//XRt375dkuzzg7+7UN3tt9+uO++8U+PGjdPZZ5+t6667Trfddpvmzp0riXkD73gzTzp27OjURO23337TgQMHGmwuETgFQdOmTXXBBRfo448/th+rrKzUxx9/rF69egVxZAglhmFo+vTpWr58uT755BN16dLF4fULLrhAMTExDvNoy5Yt2r59O/Mogl122WX6+uuvtXnzZvtXz549NWHCBPuvmTdwpU+fPk5bHvz444/q3LmzJKlLly7q2LGjw9wpLS3Vv//9b+ZOBCsrK1OTJo7/nIyKilJlZaUk5g2848086dWrl0pKSvTFF1/Yz/nkk09UWVmpiy++uGEG2iAtKOBkyZIlRmxsrLFo0SLju+++M6ZMmWK0bt3a2L17d7CHhhBx8803G61atTIKCgqM4uJi+1dZWZn9nJtuusk46aSTjE8++cTYtGmT0atXL6NXr15BHDVCUfWueobBvIFrn332mREdHW088MADxk8//WS89tprRnx8vPHqq6/az3nooYeM1q1bGytWrDD++9//GiNGjDC6dOliHDt2LIgjRzBNmjTJSElJMVauXGls27bNWLZsmdGuXTvjjjvusJ/DvIFhmN1ev/rqK+Orr74yJBmPPfaY8dVXXxm//PKLYRjezZPLL7/cOO+884x///vfxrp164xTTjnFGD9+fIN9DwROQfSPf/zDOOmkk4ymTZsaF110kbFx48ZgDwkhRJLLr4ULF9rPOXbsmDF16lSjTZs2Rnx8vDFq1CijuLg4eINGSKoZODFv4M4777xjnHXWWUZsbKzRvXt3Y8GCBQ6vV1ZWGvfcc4/RoUMHIzY21rjsssuMLVu2BGm0CAWlpaXGjBkzjJNOOsmIi4szTj75ZOPuu+82ysvL7ecwb2AYhrFq1SqX/66ZNGmSYRjezZP9+/cb48ePN1q0aGEkJCQY119/vXH48OEG+x4shlFta2cAAAAAgBNqnAAAAADAAwInAAAAAPCAwAkAAAAAPCBwAgAAAAAPCJwAAAAAwAMCJwAAAADwgMAJAAAAADwgcAIAAAAADwicAACohcVi0VtvvRXsYQAAgozACQAQsiZPniyLxeL0dfnllwd7aACACBMd7AEAAFCbyy+/XAsXLnQ4FhsbG6TRAAAiFStOAICQFhsbq44dOzp8tWnTRpKZRjd//nwNGzZMzZo108knn6y8vDyH67/++mtdeumlatasmdq2baspU6boyJEjDue8+OKLOvPMMxUbG6vk5GRNnz7d4fV9+/Zp1KhRio+P1ymnnKK3337b/trBgwc1YcIEJSUlqVmzZjrllFOcAj0AQPgjcAIAhLV77rlHo0eP1n/+8x9NmDBB48aN0/fffy9JOnr0qIYOHao2bdro888/1xtvvKGPPvrIITCaP3++pk2bpilTpujrr7/W22+/rW7dujm8x5w5c5SVlaX//ve/uuKKKzRhwgQdOHDA/v7fffed3nvvPX3//feaP3++2rVr13AfAACgQVgMwzCCPQgAAFyZPHmyXn31VcXFxTkc//Of/6w///nPslgsuummmzR//nz7a5dcconOP/98PfPMM3r++ef1pz/9STt27FDz5s0lSe+++66GDx+uXbt2qUOHDkpJSdH111+v+++/3+UYLBaL/vKXv+i+++6TZAZjLVq00HvvvafLL79cV199tdq1a6cXX3yxnj4FAEAooMYJABDSBg4c6BAYSVJiYqL917169XJ4rVevXtq8ebMk6fvvv1ePHj3sQZMk9enTR5WVldqyZYssFot27dqlyy67rNYxnHPOOfZfN2/eXAkJCdqzZ48k6eabb9bo0aP15ZdfasiQIRo5cqR69+7t1/cKAAhdBE4AgJDWvHlzp9S5QGnWrJlX58XExDg8t1gsqqyslCQNGzZMv/zyi959913l5+frsssu07Rp0/Too48GfLwAgOChxgkAENY2btzo9Pz000+XJJ1++un6z3/+o6NHj9pf//TTT9WkSROddtppatmypdLT0/Xxxx/XaQxJSUmaNGmSXn31VT3++ONasGBBne4HAAg9rDgBAEJaeXm5du/e7XAsOjra3oDhjTfeUM+ePdW3b1+99tpr+uyzz/TCCy9IkiZMmKBZs2Zp0qRJmj17tvbu3atbbrlF1113nTp06CBJmj17tm666Sa1b99ew4YN0+HDh/Xpp5/qlltu8Wp89957ry644AKdeeaZKi8v18qVK+2BGwCg8SBwAgCEtPfff1/JyckOx0477TT98MMPksyOd0uWLNHUqVOVnJysxYsX64wzzpAkxcfH64MPPtCMGTN04YUXKj4+XqNHj9Zjjz1mv9ekSZN0/Phx/f3vf9cf//hHtWvXTmPGjPF6fE2bNtVdd92lwsJCNWvWTBkZGVqyZEkAvnMAQCihqx4AIGxZLBYtX75cI0eODPZQAACNHDVOAAAAAOABgRMAAAAAeECNEwAgbJFtDgBoKKw4AQAAAIAHBE4AAAAA4AGBEwAAAAB4QOAEAAAAAB4QOAEAAACABwROAAAAAOABgRMAAAAAeEDgBAAAAAAe/D9KcbfSZkpy3gAAAABJRU5ErkJggg==",
+      "text/plain": [
+       "<Figure size 1000x600 with 1 Axes>"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    }
+   ],
+   "source": [
+    "epochs = list(range(configs_dict[\"max_training_steps\"]))\n",
+    "loss_values = ft_res[0].finetuning_losses\n",
+    "\n",
+    "plt.figure(figsize=(10, 6))\n",
+    "plt.plot(epochs, loss_values, marker='o', linestyle='-', color='b')\n",
+    "\n",
+    "# Set plot labels and title\n",
+    "plt.xlabel('Epochs')\n",
+    "plt.ylabel('Loss Value')\n",
+    "plt.title('Loss Value vs. Number of Epochs')\n",
+    "\n",
+    "plt.grid(True)\n",
+    "plt.show()"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Save finetuned model to HuggingFace"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "subprocess.run(['python', '../../utils/upload_peft_model.py'] + f\"--peft-model-id {configs.finetuning_peft_model_id} --upload-peft-model-id {configs.finetuning_peft_model_id}-dolly\".split())\n"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Stop LLM Co-serving system"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 11,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "2024-07-22 06:46:20 - ###PEFT DEBUGGING### Background serving task completed.\n",
+      "Background server stopped.\n"
+     ]
+    }
+   ],
+   "source": [
+    "llm.stop_server()"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Inference all over again with the finetuned model"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 1,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "/opt/conda/lib/python3.11/site-packages/tqdm/auto.py:21: TqdmWarning: IProgress not found. Please update jupyter and ipywidgets. See https://ipywidgets.readthedocs.io/en/stable/user_install.html\n",
+      "  from .autonotebook import tqdm as notebook_tqdm\n",
+      "/opt/conda/lib/python3.11/site-packages/huggingface_hub/file_download.py:1132: FutureWarning: `resume_download` is deprecated and will be removed in version 1.0.0. Downloads always resume when possible. If you want to force a new download, use `force_download=True`.\n",
+      "  warnings.warn(\n"
+     ]
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Creating directory /root/.cache/flexflow/configs/meta-llama/meta-llama-3-8b (if it doesn't exist)...\n",
+      "Saving meta-llama/Meta-Llama-3-8B configs to file /root/.cache/flexflow/configs/meta-llama/meta-llama-3-8b/config.json...\n",
+      "Saving goliaro/llama-3-8b-lora-dolly configs to file /root/.cache/flexflow/configs/goliaro/llama-3-8b-lora-dolly/config.json...\n",
+      "Loading tokenizer...\n",
+      "Creating directory /root/.cache/flexflow/configs/meta-llama/meta-llama-3-8b (if it doesn't exist)...\n",
+      "Saving meta-llama/Meta-Llama-3-8B configs to file /root/.cache/flexflow/configs/meta-llama/meta-llama-3-8b/config.json...\n",
+      "Saving goliaro/llama-3-8b-lora-dolly configs to file /root/.cache/flexflow/configs/goliaro/llama-3-8b-lora-dolly/config.json...\n",
+      "Loading tokenizer...\n",
+      "[0 - 7ff1caf83280]    0.270628 {3}{Mapper}: Enabled Control Replication Optimizations.\n",
+      "[0 - 7ff1caf83280]    0.270673 {3}{Mapper}: Enabled Control Replication Optimizations.\n",
+      "[0 - 7ff1caf83280]    0.270699 {3}{Mapper}: Enabled Control Replication Optimizations.\n",
+      "[0 - 7ff1caf83280]    0.270744 {3}{Mapper}: Enabled Control Replication Optimizations.\n",
+      "[0 - 7ff1caf83280]    0.270753 {3}{Mapper}: Enabled Control Replication Optimizations.\n",
+      "/opt/conda/lib/python3.11/site-packages/huggingface_hub/file_download.py:1132: FutureWarning: `resume_download` is deprecated and will be removed in version 1.0.0. Downloads always resume when possible. If you want to force a new download, use `force_download=True`.\n",
+      "  warnings.warn(\n",
+      "workSpaceSize (128 MB)\n",
+      "Creating directory /root/.cache/flexflow/configs/meta-llama/meta-llama-3-8b (if it doesn't exist)...\n",
+      "Saving meta-llama/Meta-Llama-3-8B configs to file /root/.cache/flexflow/configs/meta-llama/meta-llama-3-8b/config.json...\n",
+      "Saving goliaro/llama-3-8b-lora-dolly configs to file /root/.cache/flexflow/configs/goliaro/llama-3-8b-lora-dolly/config.json...\n",
+      "Loading tokenizer...\n",
+      "Adding layer layers.0.mlp.down_proj.lora\n",
+      "Adding layer layers.1.mlp.down_proj.lora\n",
+      "Adding layer layers.2.mlp.down_proj.lora\n",
+      "Adding layer layers.3.mlp.down_proj.lora\n",
+      "Adding layer layers.4.mlp.down_proj.lora\n",
+      "Adding layer layers.5.mlp.down_proj.lora\n",
+      "Adding layer layers.6.mlp.down_proj.lora\n",
+      "Adding layer layers.7.mlp.down_proj.lora\n",
+      "Adding layer layers.8.mlp.down_proj.lora\n",
+      "Adding layer layers.9.mlp.down_proj.lora\n",
+      "Adding layer layers.10.mlp.down_proj.lora\n",
+      "Adding layer layers.11.mlp.down_proj.lora\n",
+      "Adding layer layers.12.mlp.down_proj.lora\n",
+      "Adding layer layers.13.mlp.down_proj.lora\n",
+      "Adding layer layers.14.mlp.down_proj.lora\n",
+      "Adding layer layers.15.mlp.down_proj.lora\n",
+      "Adding layer layers.16.mlp.down_proj.lora\n",
+      "Adding layer layers.17.mlp.down_proj.lora\n",
+      "Adding layer layers.18.mlp.down_proj.lora\n",
+      "Adding layer layers.19.mlp.down_proj.lora\n",
+      "Adding layer layers.20.mlp.down_proj.lora\n",
+      "Adding layer layers.21.mlp.down_proj.lora\n",
+      "Adding layer layers.22.mlp.down_proj.lora\n",
+      "Adding layer layers.23.mlp.down_proj.lora\n",
+      "Adding layer layers.24.mlp.down_proj.lora\n",
+      "Adding layer layers.25.mlp.down_proj.lora\n",
+      "Adding layer layers.26.mlp.down_proj.lora\n",
+      "Adding layer layers.27.mlp.down_proj.lora\n",
+      "Adding layer layers.28.mlp.down_proj.lora\n",
+      "Adding layer layers.29.mlp.down_proj.lora\n",
+      "Adding layer layers.30.mlp.down_proj.lora\n",
+      "Adding layer layers.31.mlp.down_proj.lora\n",
+      "Background server started.\n",
+      "[<flexflow.core.flexflow_cffi.Request object at 0x7ff16b115bd0>]\n",
+      "2024-07-22 06:42:43 - ###PEFT DEBUGGING### Starting background serving task.\n",
+      "2024-07-22 06:42:43 - ###PEFT DEBUGGING### Updated models' configuration.\n",
+      "###PEFT DEBUGGING### LLM Model object exists.\n",
+      "###PEFT DEBUGGING### Model object exists.\n",
+      "###PEFT DEBUGGING### Model object still exists.\n",
+      "###PEFT DEBUGGING### Entering compile_inference.\n",
+      "###PEFT DEBUGGING### Configuration check passed: At least four CPU cores per node.\n",
+      "###PEFT DEBUGGING### Launching graph optimization task.\n",
+      "num_nodes = 1 num_gpus_per_node = 1\n",
+      "[0]10445\n",
+      "[1]649\n",
+      "[2]6730\n",
+      "[3]2053\n",
+      "[4]18167\n",
+      "[5]369\n",
+      "[6]1317\n",
+      "[7]2085\n",
+      "[8]3090\n",
+      "[9]30\n",
+      "No small speculative model registered, using incremental decoding.\n",
+      "[0 - 7ff1caf83280]    1.100415 {3}{RequestManager}: [1000000]New request tokens: 128000 10445 649 6730 2053 18167 369 1317 2085 3090 30\n",
+      "optimal_views.size = 262\n",
+      "views.size() = 262\n",
+      "###PEFT DEBUGGING### Operators reconstructed from optimized graph.\n",
+      "###PEFT DEBUGGING### Starting inplace optimizations.\n",
+      "###PEFT DEBUGGING### Mapping output tensors.\n",
+      "ndim(1) dims[1 0 0 0]\n",
+      "###PEFT DEBUGGING### Setting up NCCL communications.\n",
+      "###PEFT DEBUGGING### compile_inference completed successfully.\n",
+      "Loading weight file embed_tokens.weight\n",
+      "Loading weight file layers.0.input_layernorm.weight\n",
+      "Loading weight file layers.0.self_attn.q_proj.weight\n",
+      "Loading weight file layers.0.self_attn.k_proj.weight\n",
+      "Loading weight file layers.0.self_attn.v_proj.weight\n",
+      "Loading weight file layers.0.self_attn.o_proj.weight\n",
+      "Loading weight file layers.0.post_attention_layernorm.weight\n",
+      "Loading weight file layers.0.mlp.gate_proj.weight\n",
+      "Loading weight file layers.0.mlp.up_proj.weight\n",
+      "Loading weight file layers.0.mlp.down_proj.weight\n",
+      "Loading weight file layers.1.input_layernorm.weight\n",
+      "Loading weight file layers.1.self_attn.q_proj.weight\n",
+      "Loading weight file layers.1.self_attn.k_proj.weight\n",
+      "Loading weight file layers.1.self_attn.v_proj.weight\n",
+      "Loading weight file layers.1.self_attn.o_proj.weight\n",
+      "Loading weight file layers.1.post_attention_layernorm.weight\n",
+      "Loading weight file layers.1.mlp.gate_proj.weight\n",
+      "Loading weight file layers.1.mlp.up_proj.weight\n",
+      "Loading weight file layers.1.mlp.down_proj.weight\n",
+      "Loading weight file layers.2.input_layernorm.weight\n",
+      "Loading weight file layers.2.self_attn.q_proj.weight\n",
+      "Loading weight file layers.2.self_attn.k_proj.weight\n",
+      "Loading weight file layers.2.self_attn.v_proj.weight\n",
+      "Loading weight file layers.2.self_attn.o_proj.weight\n",
+      "Loading weight file layers.2.post_attention_layernorm.weight\n",
+      "Loading weight file layers.2.mlp.gate_proj.weight\n",
+      "Loading weight file layers.2.mlp.up_proj.weight\n",
+      "Loading weight file layers.2.mlp.down_proj.weight\n",
+      "Loading weight file layers.3.input_layernorm.weight\n",
+      "Loading weight file layers.3.self_attn.q_proj.weight\n",
+      "Loading weight file layers.3.self_attn.k_proj.weight\n",
+      "Loading weight file layers.3.self_attn.v_proj.weight\n",
+      "Loading weight file layers.3.self_attn.o_proj.weight\n",
+      "Loading weight file layers.3.post_attention_layernorm.weight\n",
+      "Loading weight file layers.3.mlp.gate_proj.weight\n",
+      "Loading weight file layers.3.mlp.up_proj.weight\n",
+      "Loading weight file layers.3.mlp.down_proj.weight\n",
+      "Loading weight file layers.4.input_layernorm.weight\n",
+      "Loading weight file layers.4.self_attn.q_proj.weight\n",
+      "Loading weight file layers.4.self_attn.k_proj.weight\n",
+      "Loading weight file layers.4.self_attn.v_proj.weight\n",
+      "Loading weight file layers.4.self_attn.o_proj.weight\n",
+      "Loading weight file layers.4.post_attention_layernorm.weight\n",
+      "Loading weight file layers.4.mlp.gate_proj.weight\n",
+      "Loading weight file layers.4.mlp.up_proj.weight\n",
+      "Loading weight file layers.4.mlp.down_proj.weight\n",
+      "Loading weight file layers.5.input_layernorm.weight\n",
+      "Loading weight file layers.5.self_attn.q_proj.weight\n",
+      "Loading weight file layers.5.self_attn.k_proj.weight\n",
+      "Loading weight file layers.5.self_attn.v_proj.weight\n",
+      "Loading weight file layers.5.self_attn.o_proj.weight\n",
+      "Loading weight file layers.5.post_attention_layernorm.weight\n",
+      "Loading weight file layers.5.mlp.gate_proj.weight\n",
+      "Loading weight file layers.5.mlp.up_proj.weight\n",
+      "Loading weight file layers.5.mlp.down_proj.weight\n",
+      "Loading weight file layers.6.input_layernorm.weight\n",
+      "Loading weight file layers.6.self_attn.q_proj.weight\n",
+      "Loading weight file layers.6.self_attn.k_proj.weight\n",
+      "Loading weight file layers.6.self_attn.v_proj.weight\n",
+      "Loading weight file layers.6.self_attn.o_proj.weight\n",
+      "Loading weight file layers.6.post_attention_layernorm.weight\n",
+      "Loading weight file layers.6.mlp.gate_proj.weight\n",
+      "Loading weight file layers.6.mlp.up_proj.weight\n",
+      "Loading weight file layers.6.mlp.down_proj.weight\n",
+      "Loading weight file layers.7.input_layernorm.weight\n",
+      "Loading weight file layers.7.self_attn.q_proj.weight\n",
+      "Loading weight file layers.7.self_attn.k_proj.weight\n",
+      "Loading weight file layers.7.self_attn.v_proj.weight\n",
+      "Loading weight file layers.7.self_attn.o_proj.weight\n",
+      "Loading weight file layers.7.post_attention_layernorm.weight\n",
+      "Loading weight file layers.7.mlp.gate_proj.weight\n",
+      "Loading weight file layers.7.mlp.up_proj.weight\n",
+      "Loading weight file layers.7.mlp.down_proj.weight\n",
+      "Loading weight file layers.8.input_layernorm.weight\n",
+      "Loading weight file layers.8.self_attn.q_proj.weight\n",
+      "Loading weight file layers.8.self_attn.k_proj.weight\n",
+      "Loading weight file layers.8.self_attn.v_proj.weight\n",
+      "Loading weight file layers.8.self_attn.o_proj.weight\n",
+      "Loading weight file layers.8.post_attention_layernorm.weight\n",
+      "Loading weight file layers.8.mlp.gate_proj.weight\n",
+      "Loading weight file layers.8.mlp.up_proj.weight\n",
+      "Loading weight file layers.8.mlp.down_proj.weight\n",
+      "Loading weight file layers.9.input_layernorm.weight\n",
+      "Loading weight file layers.9.self_attn.q_proj.weight\n",
+      "Loading weight file layers.9.self_attn.k_proj.weight\n",
+      "Loading weight file layers.9.self_attn.v_proj.weight\n",
+      "Loading weight file layers.9.self_attn.o_proj.weight\n",
+      "Loading weight file layers.9.post_attention_layernorm.weight\n",
+      "Loading weight file layers.9.mlp.gate_proj.weight\n",
+      "Loading weight file layers.9.mlp.up_proj.weight\n",
+      "Loading weight file layers.9.mlp.down_proj.weight\n",
+      "Loading weight file layers.10.input_layernorm.weight\n",
+      "Loading weight file layers.10.self_attn.q_proj.weight\n",
+      "Loading weight file layers.10.self_attn.k_proj.weight\n",
+      "Loading weight file layers.10.self_attn.v_proj.weight\n",
+      "Loading weight file layers.10.self_attn.o_proj.weight\n",
+      "Loading weight file layers.10.post_attention_layernorm.weight\n",
+      "Loading weight file layers.10.mlp.gate_proj.weight\n",
+      "Loading weight file layers.10.mlp.up_proj.weight\n",
+      "Loading weight file layers.10.mlp.down_proj.weight\n",
+      "Loading weight file layers.11.input_layernorm.weight\n",
+      "Loading weight file layers.11.self_attn.q_proj.weight\n",
+      "Loading weight file layers.11.self_attn.k_proj.weight\n",
+      "Loading weight file layers.11.self_attn.v_proj.weight\n",
+      "Loading weight file layers.11.self_attn.o_proj.weight\n",
+      "Loading weight file layers.11.post_attention_layernorm.weight\n",
+      "Loading weight file layers.11.mlp.gate_proj.weight\n",
+      "Loading weight file layers.11.mlp.up_proj.weight\n",
+      "Loading weight file layers.11.mlp.down_proj.weight\n",
+      "Loading weight file layers.12.input_layernorm.weight\n",
+      "Loading weight file layers.12.self_attn.q_proj.weight\n",
+      "Loading weight file layers.12.self_attn.k_proj.weight\n",
+      "Loading weight file layers.12.self_attn.v_proj.weight\n",
+      "Loading weight file layers.12.self_attn.o_proj.weight\n",
+      "Loading weight file layers.12.post_attention_layernorm.weight\n",
+      "Loading weight file layers.12.mlp.gate_proj.weight\n",
+      "Loading weight file layers.12.mlp.up_proj.weight\n",
+      "Loading weight file layers.12.mlp.down_proj.weight\n",
+      "Loading weight file layers.13.input_layernorm.weight\n",
+      "Loading weight file layers.13.self_attn.q_proj.weight\n",
+      "Loading weight file layers.13.self_attn.k_proj.weight\n",
+      "Loading weight file layers.13.self_attn.v_proj.weight\n",
+      "Loading weight file layers.13.self_attn.o_proj.weight\n",
+      "Loading weight file layers.13.post_attention_layernorm.weight\n",
+      "Loading weight file layers.13.mlp.gate_proj.weight\n",
+      "Loading weight file layers.13.mlp.up_proj.weight\n",
+      "Loading weight file layers.13.mlp.down_proj.weight\n",
+      "Loading weight file layers.14.input_layernorm.weight\n",
+      "Loading weight file layers.14.self_attn.q_proj.weight\n",
+      "Loading weight file layers.14.self_attn.k_proj.weight\n",
+      "Loading weight file layers.14.self_attn.v_proj.weight\n",
+      "Loading weight file layers.14.self_attn.o_proj.weight\n",
+      "Loading weight file layers.14.post_attention_layernorm.weight\n",
+      "Loading weight file layers.14.mlp.gate_proj.weight\n",
+      "Loading weight file layers.14.mlp.up_proj.weight\n",
+      "Loading weight file layers.14.mlp.down_proj.weight\n",
+      "Loading weight file layers.15.input_layernorm.weight\n",
+      "Loading weight file layers.15.self_attn.q_proj.weight\n",
+      "Loading weight file layers.15.self_attn.k_proj.weight\n",
+      "Loading weight file layers.15.self_attn.v_proj.weight\n",
+      "Loading weight file layers.15.self_attn.o_proj.weight\n",
+      "Loading weight file layers.15.post_attention_layernorm.weight\n",
+      "Loading weight file layers.15.mlp.gate_proj.weight\n",
+      "Loading weight file layers.15.mlp.up_proj.weight\n",
+      "Loading weight file layers.15.mlp.down_proj.weight\n",
+      "Loading weight file layers.16.input_layernorm.weight\n",
+      "Loading weight file layers.16.self_attn.q_proj.weight\n",
+      "Loading weight file layers.16.self_attn.k_proj.weight\n",
+      "Loading weight file layers.16.self_attn.v_proj.weight\n",
+      "Loading weight file layers.16.self_attn.o_proj.weight\n",
+      "Loading weight file layers.16.post_attention_layernorm.weight\n",
+      "Loading weight file layers.16.mlp.gate_proj.weight\n",
+      "Loading weight file layers.16.mlp.up_proj.weight\n",
+      "Loading weight file layers.16.mlp.down_proj.weight\n",
+      "Loading weight file layers.17.input_layernorm.weight\n",
+      "Loading weight file layers.17.self_attn.q_proj.weight\n",
+      "Loading weight file layers.17.self_attn.k_proj.weight\n",
+      "Loading weight file layers.17.self_attn.v_proj.weight\n",
+      "Loading weight file layers.17.self_attn.o_proj.weight\n",
+      "Loading weight file layers.17.post_attention_layernorm.weight\n",
+      "Loading weight file layers.17.mlp.gate_proj.weight\n",
+      "Loading weight file layers.17.mlp.up_proj.weight\n",
+      "Loading weight file layers.17.mlp.down_proj.weight\n",
+      "Loading weight file layers.18.input_layernorm.weight\n",
+      "Loading weight file layers.18.self_attn.q_proj.weight\n",
+      "Loading weight file layers.18.self_attn.k_proj.weight\n",
+      "Loading weight file layers.18.self_attn.v_proj.weight\n",
+      "Loading weight file layers.18.self_attn.o_proj.weight\n",
+      "Loading weight file layers.18.post_attention_layernorm.weight\n",
+      "Loading weight file layers.18.mlp.gate_proj.weight\n",
+      "Loading weight file layers.18.mlp.up_proj.weight\n",
+      "Loading weight file layers.18.mlp.down_proj.weight\n",
+      "Loading weight file layers.19.input_layernorm.weight\n",
+      "Loading weight file layers.19.self_attn.q_proj.weight\n",
+      "Loading weight file layers.19.self_attn.k_proj.weight\n",
+      "Loading weight file layers.19.self_attn.v_proj.weight\n",
+      "Loading weight file layers.19.self_attn.o_proj.weight\n",
+      "Loading weight file layers.19.post_attention_layernorm.weight\n",
+      "Loading weight file layers.19.mlp.gate_proj.weight\n",
+      "Loading weight file layers.19.mlp.up_proj.weight\n",
+      "Loading weight file layers.19.mlp.down_proj.weight\n",
+      "Loading weight file layers.20.input_layernorm.weight\n",
+      "Loading weight file layers.20.self_attn.q_proj.weight\n",
+      "Loading weight file layers.20.self_attn.k_proj.weight\n",
+      "Loading weight file layers.20.self_attn.v_proj.weight\n",
+      "Loading weight file layers.20.self_attn.o_proj.weight\n",
+      "Loading weight file layers.20.post_attention_layernorm.weight\n",
+      "Loading weight file layers.20.mlp.gate_proj.weight\n",
+      "Loading weight file layers.20.mlp.up_proj.weight\n",
+      "Loading weight file layers.20.mlp.down_proj.weight\n",
+      "Loading weight file layers.21.input_layernorm.weight\n",
+      "Loading weight file layers.21.self_attn.q_proj.weight\n",
+      "Loading weight file layers.21.self_attn.k_proj.weight\n",
+      "Loading weight file layers.21.self_attn.v_proj.weight\n",
+      "Loading weight file layers.21.self_attn.o_proj.weight\n",
+      "Loading weight file layers.21.post_attention_layernorm.weight\n",
+      "Loading weight file layers.21.mlp.gate_proj.weight\n",
+      "Loading weight file layers.21.mlp.up_proj.weight\n",
+      "Loading weight file layers.21.mlp.down_proj.weight\n",
+      "Loading weight file layers.22.input_layernorm.weight\n",
+      "Loading weight file layers.22.self_attn.q_proj.weight\n",
+      "Loading weight file layers.22.self_attn.k_proj.weight\n",
+      "Loading weight file layers.22.self_attn.v_proj.weight\n",
+      "Loading weight file layers.22.self_attn.o_proj.weight\n",
+      "Loading weight file layers.22.post_attention_layernorm.weight\n",
+      "Loading weight file layers.22.mlp.gate_proj.weight\n",
+      "Loading weight file layers.22.mlp.up_proj.weight\n",
+      "Loading weight file layers.22.mlp.down_proj.weight\n",
+      "Loading weight file layers.23.input_layernorm.weight\n",
+      "Loading weight file layers.23.self_attn.q_proj.weight\n",
+      "Loading weight file layers.23.self_attn.k_proj.weight\n",
+      "Loading weight file layers.23.self_attn.v_proj.weight\n",
+      "Loading weight file layers.23.self_attn.o_proj.weight\n",
+      "Loading weight file layers.23.post_attention_layernorm.weight\n",
+      "Loading weight file layers.23.mlp.gate_proj.weight\n",
+      "Loading weight file layers.23.mlp.up_proj.weight\n",
+      "Loading weight file layers.23.mlp.down_proj.weight\n",
+      "Loading weight file layers.24.input_layernorm.weight\n",
+      "Loading weight file layers.24.self_attn.q_proj.weight\n",
+      "Loading weight file layers.24.self_attn.k_proj.weight\n",
+      "Loading weight file layers.24.self_attn.v_proj.weight\n",
+      "Loading weight file layers.24.self_attn.o_proj.weight\n",
+      "Loading weight file layers.24.post_attention_layernorm.weight\n",
+      "Loading weight file layers.24.mlp.gate_proj.weight\n",
+      "Loading weight file layers.24.mlp.up_proj.weight\n",
+      "Loading weight file layers.24.mlp.down_proj.weight\n",
+      "Loading weight file layers.25.input_layernorm.weight\n",
+      "Loading weight file layers.25.self_attn.q_proj.weight\n",
+      "Loading weight file layers.25.self_attn.k_proj.weight\n",
+      "Loading weight file layers.25.self_attn.v_proj.weight\n",
+      "Loading weight file layers.25.self_attn.o_proj.weight\n",
+      "Loading weight file layers.25.post_attention_layernorm.weight\n",
+      "Loading weight file layers.25.mlp.gate_proj.weight\n",
+      "Loading weight file layers.25.mlp.up_proj.weight\n",
+      "Loading weight file layers.25.mlp.down_proj.weight\n",
+      "Loading weight file layers.26.input_layernorm.weight\n",
+      "Loading weight file layers.26.self_attn.q_proj.weight\n",
+      "Loading weight file layers.26.self_attn.k_proj.weight\n",
+      "Loading weight file layers.26.self_attn.v_proj.weight\n",
+      "Loading weight file layers.26.self_attn.o_proj.weight\n",
+      "Loading weight file layers.26.post_attention_layernorm.weight\n",
+      "Loading weight file layers.26.mlp.gate_proj.weight\n",
+      "Loading weight file layers.26.mlp.up_proj.weight\n",
+      "Loading weight file layers.26.mlp.down_proj.weight\n",
+      "Loading weight file layers.27.input_layernorm.weight\n",
+      "Loading weight file layers.27.self_attn.q_proj.weight\n",
+      "Loading weight file layers.27.self_attn.k_proj.weight\n",
+      "Loading weight file layers.27.self_attn.v_proj.weight\n",
+      "Loading weight file layers.27.self_attn.o_proj.weight\n",
+      "Loading weight file layers.27.post_attention_layernorm.weight\n",
+      "Loading weight file layers.27.mlp.gate_proj.weight\n",
+      "Loading weight file layers.27.mlp.up_proj.weight\n",
+      "Loading weight file layers.27.mlp.down_proj.weight\n",
+      "Loading weight file layers.28.input_layernorm.weight\n",
+      "Loading weight file layers.28.self_attn.q_proj.weight\n",
+      "Loading weight file layers.28.self_attn.k_proj.weight\n",
+      "Loading weight file layers.28.self_attn.v_proj.weight\n",
+      "Loading weight file layers.28.self_attn.o_proj.weight\n",
+      "Loading weight file layers.28.post_attention_layernorm.weight\n",
+      "Loading weight file layers.28.mlp.gate_proj.weight\n",
+      "Loading weight file layers.28.mlp.up_proj.weight\n",
+      "Loading weight file layers.28.mlp.down_proj.weight\n",
+      "Loading weight file layers.29.input_layernorm.weight\n",
+      "Loading weight file layers.29.self_attn.q_proj.weight\n",
+      "Loading weight file layers.29.self_attn.k_proj.weight\n",
+      "Loading weight file layers.29.self_attn.v_proj.weight\n",
+      "Loading weight file layers.29.self_attn.o_proj.weight\n",
+      "Loading weight file layers.29.post_attention_layernorm.weight\n",
+      "Loading weight file layers.29.mlp.gate_proj.weight\n",
+      "Loading weight file layers.29.mlp.up_proj.weight\n",
+      "Loading weight file layers.29.mlp.down_proj.weight\n",
+      "Loading weight file layers.30.input_layernorm.weight\n",
+      "Loading weight file layers.30.self_attn.q_proj.weight\n",
+      "Loading weight file layers.30.self_attn.k_proj.weight\n",
+      "Loading weight file layers.30.self_attn.v_proj.weight\n",
+      "Loading weight file layers.30.self_attn.o_proj.weight\n",
+      "Loading weight file layers.30.post_attention_layernorm.weight\n",
+      "Loading weight file layers.30.mlp.gate_proj.weight\n",
+      "Loading weight file layers.30.mlp.up_proj.weight\n",
+      "Loading weight file layers.30.mlp.down_proj.weight\n",
+      "Loading weight file layers.31.input_layernorm.weight\n",
+      "Loading weight file layers.31.self_attn.q_proj.weight\n",
+      "Loading weight file layers.31.self_attn.k_proj.weight\n",
+      "Loading weight file layers.31.self_attn.v_proj.weight\n",
+      "Loading weight file layers.31.self_attn.o_proj.weight\n",
+      "Loading weight file layers.31.post_attention_layernorm.weight\n",
+      "Loading weight file layers.31.mlp.gate_proj.weight\n",
+      "Loading weight file layers.31.mlp.up_proj.weight\n",
+      "Loading weight file layers.31.mlp.down_proj.weight\n",
+      "Loading weight file norm.weight\n",
+      "Loading weight file lm_head.weight\n",
+      "Loading LORA weight layers.0.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.0.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.1.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.1.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.2.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.2.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.3.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.3.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.4.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.4.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.5.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.5.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.6.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.6.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.7.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.7.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.8.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.8.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.9.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.9.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.10.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.10.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.11.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.11.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.12.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.12.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.13.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.13.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.14.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.14.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.15.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.15.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.16.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.16.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.17.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.17.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.18.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.18.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.19.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.19.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.20.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.20.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.21.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.21.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.22.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.22.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.23.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.23.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.24.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.24.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.25.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.25.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.26.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.26.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.27.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.27.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.28.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.28.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.29.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.29.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.30.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.30.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.31.mlp.down_proj.lora_A.weight, num_rows: 14336, num_cols: 16, num_shards: 1, shard_id: 0\n",
+      "Loading LORA weight layers.31.mlp.down_proj.lora_B.weight, num_rows: 16, num_cols: 4096, num_shards: 1, shard_id: 0\n",
+      "[0 - 7ff1680b6740]   16.224181 {3}{RequestManager}: Output token is: 3639\n",
+      "[0 - 7ff1680b6740]   16.321885 {3}{RequestManager}: Output token is: 374\n",
+      "[0 - 7ff168092740]   16.407712 {3}{RequestManager}: Output token is: 279\n",
+      "[0 - 7ff1680b6740]   16.492788 {3}{RequestManager}: Output token is: 2944\n",
+      "[0 - 7ff168092740]   16.563500 {3}{RequestManager}: Output token is: 4920\n",
+      "[0 - 7ff168092740]   16.624616 {3}{RequestManager}: Output token is: 279\n",
+      "[0 - 7ff168092740]   16.675778 {3}{RequestManager}: Output token is: 1317\n",
+      "[0 - 7ff168092740]   16.725625 {3}{RequestManager}: Output token is: 13272\n",
+      "[0 - 7ff168092740]   16.776205 {3}{RequestManager}: Output token is: 315\n",
+      "[0 - 7ff168092740]   16.827883 {3}{RequestManager}: Output token is: 41389\n",
+      "[0 - 7ff168092740]   16.878348 {3}{RequestManager}: Output token is: 2715\n",
+      "[0 - 7ff168092740]   16.929025 {3}{RequestManager}: Output token is: 288\n",
+      "[0 - 7ff168092740]   16.979287 {3}{RequestManager}: Output token is: 30\n",
+      "[0 - 7ff1680b6740]   17.029879 {3}{RequestManager}: Output token is: 8595\n",
+      "[0 - 7ff1680b6740]   17.078696 {3}{RequestManager}: Output token is: 656\n",
+      "[0 - 7ff1680b6740]   17.127942 {3}{RequestManager}: Output token is: 1063\n",
+      "[0 - 7ff1680b6740]   17.177796 {3}{RequestManager}: Output token is: 10099\n",
+      "[0 - 7ff1680b6740]   17.227023 {3}{RequestManager}: Output token is: 617\n",
+      "[0 - 7ff1680b6740]   17.277136 {3}{RequestManager}: Output token is: 1317\n",
+      "[0 - 7ff1680b6740]   17.328143 {3}{RequestManager}: Output token is: 64614\n",
+      "[0 - 7ff1680b6740]   17.378508 {3}{RequestManager}: Output token is: 30\n",
+      "[0 - 7ff168092740]   17.430618 {3}{RequestManager}: Output token is: 8595\n",
+      "[0 - 7ff168092740]   17.482129 {3}{RequestManager}: Output token is: 656\n",
+      "[0 - 7ff168092740]   17.533479 {3}{RequestManager}: Output token is: 1063\n",
+      "[0 - 7ff168092740]   17.584503 {3}{RequestManager}: Output token is: 10099\n",
+      "[0 - 7ff168092740]   17.634591 {3}{RequestManager}: Output token is: 617\n",
+      "[0 - 7ff168092740]   17.685727 {3}{RequestManager}: Output token is: 1317\n",
+      "[0 - 7ff168092740]   17.736768 {3}{RequestManager}: Output token is: 14535\n",
+      "[0 - 7ff168092740]   17.785909 {3}{RequestManager}: Output token is: 30\n",
+      "[0 - 7ff168092740]   17.836515 {3}{RequestManager}: Output token is: 8595\n",
+      "[0 - 7ff168092740]   17.886526 {3}{RequestManager}: Output token is: 656\n",
+      "[0 - 7ff1680b6740]   17.936502 {3}{RequestManager}: Output token is: 1063\n",
+      "[0 - 7ff168092740]   17.986222 {3}{RequestManager}: Output token is: 10099\n",
+      "[0 - 7ff168092740]   18.037888 {3}{RequestManager}: Output token is: 617\n",
+      "[0 - 7ff168092740]   18.088468 {3}{RequestManager}: Output token is: 1317\n",
+      "[0 - 7ff168092740]   18.138261 {3}{RequestManager}: Output token is: 25212\n",
+      "[0 - 7ff168092740]   18.187102 {3}{RequestManager}: Output token is: 30\n",
+      "[0 - 7ff168092740]   18.237270 {3}{RequestManager}: Output token is: 8595\n",
+      "[0 - 7ff168092740]   18.289979 {3}{RequestManager}: Output token is: 656\n",
+      "[0 - 7ff168092740]   18.340895 {3}{RequestManager}: Output token is: 1063\n",
+      "[0 - 7ff168092740]   18.391145 {3}{RequestManager}: Output token is: 10099\n",
+      "[0 - 7ff168092740]   18.441155 {3}{RequestManager}: Output token is: 617\n",
+      "[0 - 7ff168092740]   18.499716 {3}{RequestManager}: Output token is: 1317\n",
+      "[0 - 7ff1680b6740]   18.552423 {3}{RequestManager}: Output token is: 97814\n",
+      "[0 - 7ff168092740]   18.603261 {3}{RequestManager}: Output token is: 30\n",
+      "[0 - 7ff168092740]   18.654986 {3}{RequestManager}: Output token is: 8595\n",
+      "[0 - 7ff168092740]   18.706227 {3}{RequestManager}: Output token is: 656\n",
+      "[0 - 7ff168092740]   18.756543 {3}{RequestManager}: Output token is: 1063\n",
+      "[0 - 7ff168092740]   18.807690 {3}{RequestManager}: Output token is: 10099\n",
+      "[0 - 7ff1680b6740]   18.857508 {3}{RequestManager}: Output token is: 617\n",
+      "[0 - 7ff168092740]   18.907649 {3}{RequestManager}: Output token is: 1317\n",
+      "[0 - 7ff168092740]   18.958208 {3}{RequestManager}: Output token is: 41759\n",
+      "[0 - 7ff168092740]   19.009971 {3}{RequestManager}: Output token is: 388\n",
+      "[0 - 7ff168092740]   19.060626 {3}{RequestManager}: Output token is: 30\n",
+      "[0 - 7ff168092740]   19.112370 {3}{RequestManager}: Output token is: 8595\n",
+      "[0 - 7ff168092740]   19.161425 {3}{RequestManager}: Output token is: 656\n",
+      "[0 - 7ff168092740]   19.206435 {3}{RequestManager}: Output token is: 1063\n",
+      "[0 - 7ff168092740]   19.254004 {3}{RequestManager}: Output token is: 10099\n",
+      "[0 - 7ff168092740]   19.306102 {3}{RequestManager}: Output token is: 617\n",
+      "[0 - 7ff168092740]   19.356853 {3}{RequestManager}: Output token is: 1317\n",
+      "[0 - 7ff168092740]   19.408861 {3}{RequestManager}: Output token is: 89435\n",
+      "[0 - 7ff1680b6740]   19.460391 {3}{RequestManager}: Output token is: 30\n",
+      "[0 - 7ff1680b6740]   19.511207 {3}{RequestManager}: Output token is: 8595\n",
+      "[0 - 7ff1680b6740]   19.565692 {3}{RequestManager}: Output token is: 656\n",
+      "[0 - 7ff1680b6740]   19.617057 {3}{RequestManager}: Output token is: 1063\n",
+      "[0 - 7ff1680b6740]   19.669739 {3}{RequestManager}: Output token is: 10099\n",
+      "[0 - 7ff1680b6740]   19.722325 {3}{RequestManager}: Output token is: 617\n",
+      "[0 - 7ff1680b6740]   19.773583 {3}{RequestManager}: Output token is: 1317\n",
+      "[0 - 7ff1680b6740]   19.824646 {3}{RequestManager}: Output token is: 68550\n",
+      "[0 - 7ff1680b6740]   19.876650 {3}{RequestManager}: Output token is: 30\n",
+      "[0 - 7ff1680b6740]   19.926939 {3}{RequestManager}: Output token is: 8595\n",
+      "[0 - 7ff1680b6740]   19.977325 {3}{RequestManager}: Output token is: 656\n",
+      "[0 - 7ff1680b6740]   20.028247 {3}{RequestManager}: Output token is: 1063\n",
+      "[0 - 7ff1680b6740]   20.078419 {3}{RequestManager}: Output token is: 10099\n",
+      "[0 - 7ff168092740]   20.128614 {3}{RequestManager}: Output token is: 617\n",
+      "[0 - 7ff168092740]   20.179748 {3}{RequestManager}: Output token is: 1317\n",
+      "[0 - 7ff168092740]   20.230542 {3}{RequestManager}: Output token is: 18311\n",
+      "[0 - 7ff1680b6740]   20.281634 {3}{RequestManager}: Output token is: 30\n",
+      "[0 - 7ff168092740]   20.330089 {3}{RequestManager}: Output token is: 8595\n",
+      "[0 - 7ff168092740]   20.375491 {3}{RequestManager}: Output token is: 656\n",
+      "[0 - 7ff1680b6740]   20.422220 {3}{RequestManager}: Output token is: 1063\n",
+      "[0 - 7ff168092740]   20.475078 {3}{RequestManager}: Output token is: 10099\n",
+      "[0 - 7ff168092740]   20.526058 {3}{RequestManager}: Output token is: 617\n",
+      "[0 - 7ff168092740]   20.577651 {3}{RequestManager}: Output token is: 1317\n",
+      "[0 - 7ff168092740]   20.628505 {3}{RequestManager}: Output token is: 7013\n",
+      "[0 - 7ff168092740]   20.681354 {3}{RequestManager}: Output token is: 30\n",
+      "[0 - 7ff168092740]   20.734160 {3}{RequestManager}: Output token is: 8595\n",
+      "[0 - 7ff168092740]   20.786299 {3}{RequestManager}: Output token is: 656\n",
+      "[0 - 7ff1680b6740]   20.837268 {3}{RequestManager}: Output token is: 1063\n",
+      "[0 - 7ff168092740]   20.888265 {3}{RequestManager}: Output token is: 10099\n",
+      "[0 - 7ff168092740]   20.939708 {3}{RequestManager}: Output token is: 617\n",
+      "[0 - 7ff168092740]   20.990707 {3}{RequestManager}: Output token is: 1317\n",
+      "[0 - 7ff168092740]   21.041260 {3}{RequestManager}: Output token is: 18742\n",
+      "[0 - 7ff1680b6740]   21.091386 {3}{RequestManager}: Output token is: 30\n",
+      "[0 - 7ff168092740]   21.145432 {3}{RequestManager}: Output token is: 8595\n",
+      "[0 - 7ff168092740]   21.197149 {3}{RequestManager}: Output token is: 656\n",
+      "[0 - 7ff168092740]   21.249242 {3}{RequestManager}: Output token is: 1063\n",
+      "[0 - 7ff168092740]   21.301514 {3}{RequestManager}: Output token is: 10099\n",
+      "[0 - 7ff168092740]   21.352632 {3}{RequestManager}: Output token is: 617\n",
+      "[0 - 7ff168092740]   21.404018 {3}{RequestManager}: Output token is: 1317\n",
+      "[0 - 7ff168092740]   21.455101 {3}{RequestManager}: Output token is: 56994\n",
+      "[0 - 7ff1680b6740]   21.506371 {3}{RequestManager}: Output token is: 30\n",
+      "[0 - 7ff168092740]   21.559369 {3}{RequestManager}: Output token is: 8595\n",
+      "[0 - 7ff1680b6740]   21.611370 {3}{RequestManager}: Output token is: 656\n",
+      "[0 - 7ff168092740]   21.663655 {3}{RequestManager}: Output token is: 1063\n",
+      "[0 - 7ff1680b6740]   21.715270 {3}{RequestManager}: Output token is: 10099\n",
+      "[0 - 7ff168092740]   21.766481 {3}{RequestManager}: Output token is: 617\n",
+      "[0 - 7ff168092740]   21.818563 {3}{RequestManager}: Output token is: 1317\n",
+      "[0 - 7ff168092740]   21.872108 {3}{RequestManager}: Output token is: 29505\n",
+      "[0 - 7ff168092740]   21.922670 {3}{RequestManager}: Output token is: 30\n",
+      "[0 - 7ff168092740]   21.973973 {3}{RequestManager}: Output token is: 8595\n",
+      "[0 - 7ff1680b6740]   22.024297 {3}{RequestManager}: Output token is: 656\n",
+      "[0 - 7ff1680b6740]   22.076266 {3}{RequestManager}: Output token is: 1063\n",
+      "[0 - 7ff168092740]   22.127594 {3}{RequestManager}: Output token is: 10099\n",
+      "[0 - 7ff1680b6740]   22.179008 {3}{RequestManager}: Output token is: 617\n",
+      "[0 - 7ff1680b6740]   22.230414 {3}{RequestManager}: Output token is: 1317\n",
+      "[0 - 7ff1680b6740]   22.281805 {3}{RequestManager}: Output token is: 993\n",
+      "[0 - 7ff1680b6740]   22.282235 {3}{RequestManager}: [Done] guid(1000000) final_length(128)\n",
+      "[0 - 7ff1680b6740]   22.282243 {3}{RequestManager}: Final output: <s> <|begin_of_text|>Why can camels survive for long without water? What is the reason behind the long neck of giraffes? Why do some animals have long tails? Why do some animals have long legs? Why do some animals have long ears? Why do some animals have long noses? Why do some animals have long whiskers? Why do some animals have long tongues? Why do some animals have long claws? Why do some animals have long teeth? Why do some animals have long hair? Why do some animals have long fur? Why do some animals have long feathers? Why do some animals have long scales? Why do some animals have long sp\n",
+      "[0 - 7ff1680b6740]   22.282250 {3}{RequestManager}: [Profile] guid(1000000) llm_decoding_steps(117) start(15892528.0) finish(22282245.0) latency(6389717.0) ttft(15123707.0)\n",
+      "2024-07-22 06:43:05 - ###PEFT DEBUGGING### Background serving task completed.\n",
+      "Background server stopped.\n"
+     ]
+    }
+   ],
+   "source": [
+    "import json, random, subprocess, os\n",
+    "from datasets import load_dataset\n",
+    "from types import SimpleNamespace\n",
+    "from huggingface_hub import HfFolder\n",
+    "import flexflow.serve as ff\n",
+    "import matplotlib.pyplot as plt\n",
+    "\n",
+    "configs_dict = {\n",
+    "    \"num_gpus\": 1,\n",
+    "    \"memory_per_gpu\": 21000,\n",
+    "    \"zero_copy_memory_per_node\": 40000,\n",
+    "    \"num_cpus\": 4,\n",
+    "    \"legion_utility_processors\": 4,\n",
+    "    \"data_parallelism_degree\": 1,\n",
+    "    \"tensor_parallelism_degree\": 1,\n",
+    "    \"pipeline_parallelism_degree\": 1,\n",
+    "    \"offload\": False,\n",
+    "    \"offload_reserve_space_size\": 8 * 1024,  # 8GB\n",
+    "    \"use_4bit_quantization\": False,\n",
+    "    \"use_8bit_quantization\": False,\n",
+    "    \"enable_peft\": True,\n",
+    "    \"peft_activation_reserve_space_size\": 1024,  # 1GB\n",
+    "    \"peft_weight_reserve_space_size\": 1024,  # 1GB\n",
+    "    \"profiling\": False,\n",
+    "    \"inference_debugging\": False,\n",
+    "    \"fusion\": False,\n",
+    "    \"max_requests_per_batch\": 1,\n",
+    "    \"max_sequence_length\": 128,\n",
+    "    \"max_tokens_per_batch\": 128,\n",
+    "    \"max_training_steps\": 100,\n",
+    "    \"seed\": 42,\n",
+    "}\n",
+    "model_configs = {\n",
+    "    \"base_model\": \"meta-llama/Meta-Llama-3-8B\",\n",
+    "    \"inference_peft_model_id\": \"goliaro/llama-3-8b-lora\",\n",
+    "    \"finetuning_peft_model_id\": \"goliaro/llama-3-8b-lora\",\n",
+    "    \"cache_path\": os.environ.get(\"FF_CACHE_PATH\", \"\"),\n",
+    "    \"refresh_cache\": False,\n",
+    "    \"full_precision\": False,\n",
+    "    # relative paths\n",
+    "    \"inference_dataset\": \"inference_dataset.json\",\n",
+    "    \"finetuning_dataset\": \"/usr/FlexFlow/inference/prompt/peft_dataset.json\",\n",
+    "    \"output_file\": \"peft_demo.txt\",\n",
+    "}\n",
+    "generation_configs = {\n",
+    "    \"do_sample\": False,\n",
+    "    \"temperature\": 0.9,\n",
+    "    \"topp\": 0.8,\n",
+    "    \"topk\": 1,\n",
+    "}\n",
+    "finetuning_configs = {\n",
+    "    \"learning_rate\": 0.001,\n",
+    "    \"momentum\": 0.0,\n",
+    "    \"weight_decay\": 0.0,\n",
+    "    \"nesterov\": False,\n",
+    "}\n",
+    "# Merge dictionaries\n",
+    "configs_dict.update(model_configs)\n",
+    "configs_dict.update(generation_configs)\n",
+    "configs_dict.update(finetuning_configs)\n",
+    "\n",
+    "configs = SimpleNamespace(**configs_dict)\n",
+    "\n",
+    "\n",
+    "args = [configs.finetuning_peft_model_id+\"-dolly\", '--base_model_name', configs.base_model]\n",
+    "subprocess.run(['python', '../../utils/download_peft_model.py'] + args)\n",
+    "\n",
+    "# Initialize the FlexFlow runtime. ff.init() takes a dictionary or the path to a JSON file with the configs\n",
+    "ff.init(configs_dict)\n",
+    "\n",
+    "# Create the FlexFlow LLM\n",
+    "ff_data_type = (\n",
+    "    ff.DataType.DT_FLOAT if configs.full_precision else ff.DataType.DT_HALF\n",
+    ")\n",
+    "llm = ff.LLM(\n",
+    "    configs.base_model,\n",
+    "    data_type=ff_data_type,\n",
+    "    cache_path=configs.cache_path,\n",
+    "    refresh_cache=configs.refresh_cache,\n",
+    "    output_file=configs.output_file,\n",
+    ")\n",
+    "\n",
+    "lora_inference_config2 = ff.LoraLinearConfig(\n",
+    "    llm.cache_path, \n",
+    "    configs.finetuning_peft_model_id+\"-dolly\",\n",
+    "    base_model_name_or_path=configs.base_model\n",
+    ")\n",
+    "llm.add_peft(lora_inference_config2)\n",
+    "\n",
+    "\n",
+    "# Compile the LLM for inference and load the weights into memory\n",
+    "generation_config = ff.GenerationConfig(\n",
+    "    do_sample=configs.do_sample,\n",
+    "    temperature=configs.temperature,\n",
+    "    topp=configs.topp,\n",
+    "    topk=configs.topk\n",
+    ")\n",
+    "llm.compile(\n",
+    "    generation_config,\n",
+    "    max_requests_per_batch=configs.max_requests_per_batch,\n",
+    "    max_seq_length=configs.max_sequence_length,\n",
+    "    max_tokens_per_batch=configs.max_tokens_per_batch,\n",
+    ")\n",
+    "\n",
+    "llm.start_server()\n",
+    "\n",
+    "prompts = [s for s in json.load(open(configs.inference_dataset))]\n",
+    "inference_requests = [\n",
+    "    ff.Request(\n",
+    "        ff.RequestType.REQ_INFERENCE,\n",
+    "        prompt=prompt,\n",
+    "        max_sequence_length=configs.max_sequence_length,\n",
+    "        peft_model_id=llm.get_ff_peft_id(lora_inference_config2),\n",
+    "    )\n",
+    "    for prompt in prompts\n",
+    "]\n",
+    "inf_req_res_2 = llm.generate(inference_requests)\n",
+    "\n",
+    "llm.stop_server()\n",
+    "\n",
+    "with open(\"after_finetuning.txt\", \"w\") as file:\n",
+    "    file.write(str(inf_req_res_2[0].output_text))"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": []
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": "base",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.11.9"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 2
+}
diff --git a/inference/python/peft_demo/demo.py b/inference/python/peft_demo/demo.py
new file mode 100644
index 0000000000..9e01b4645b
--- /dev/null
+++ b/inference/python/peft_demo/demo.py
@@ -0,0 +1,240 @@
+import json, random, subprocess
+from datasets import load_dataset
+from types import SimpleNamespace
+from huggingface_hub import HfFolder
+import os
+import flexflow.serve as ff
+import matplotlib.pyplot as plt
+
+
+def create_datasets(finetune_dataset_size=2, inference_file_path='inference_dataset.json', finetuning_file_path='finetuning_dataset.json'):
+    """Creates the inference and finetuning datasets according to the data from https://huggingface.co/datasets/databricks/databricks-dolly-15k.
+    Only the 'open_qa' and 'closed_qa' prompts without context are kept.
+    The datasets are saved into the files given as arguments.
+
+    Keyword arguments:
+    dataset_size -- the number of prompts to consider
+    inference_file_path -- the file in which to save the inference data
+    finetuning_file_path -- the file in which to save the finetuning data
+    """
+    dataset = load_dataset("databricks/databricks-dolly-15k", split="train")
+    inference_data = []
+    finetuning_data = []
+    for row in dataset:
+        if len(finetuning_data) == finetune_dataset_size:
+            break
+        if ("open_qa" in row['category'] or "closed_qa" in row['category']) and len(row['context']) == 0:
+            inference_data.append(row['instruction'])
+            finetuning_data.append(row['instruction'] + " " + row['response'])
+    with open(inference_file_path, 'w') as file:
+        json.dump(inference_data[:1], file)
+    with open(finetuning_file_path, 'w') as file:
+        json.dump(finetuning_data[:1], file, indent=2, separators=(',', ': '))
+
+
+configs_dict = {
+    "num_gpus": 1,
+    "memory_per_gpu": 21000,
+    "zero_copy_memory_per_node": 40000,
+    "num_cpus": 4,
+    "legion_utility_processors": 4,
+    "data_parallelism_degree": 1,
+    "tensor_parallelism_degree": 1,
+    "pipeline_parallelism_degree": 1,
+    "offload": False,
+    "offload_reserve_space_size": 8 * 1024,  # 8GB
+    "use_4bit_quantization": False,
+    "use_8bit_quantization": False,
+    "enable_peft": True,
+    "peft_activation_reserve_space_size": 1024,  # 1GB
+    "peft_weight_reserve_space_size": 1024,  # 1GB
+    "profiling": False,
+    "inference_debugging": False,
+    "fusion": False,
+    "max_requests_per_batch": 1,
+    "max_sequence_length": 128,
+    "max_tokens_per_batch": 128,
+    "max_training_steps": 100,
+    "seed": 42,
+}
+model_configs = {
+    "base_model": "meta-llama/Meta-Llama-3-8B",
+    "inference_peft_model_id": "goliaro/llama-3-8b-lora",
+    "finetuning_peft_model_id": "goliaro/llama-3-8b-lora",
+    "cache_path": os.environ.get("FF_CACHE_PATH", ""),
+    "refresh_cache": False,
+    "full_precision": False,
+    # relative paths
+    "inference_dataset": "inference_dataset.json",
+    "finetuning_dataset": "/usr/FlexFlow/inference/prompt/peft_dataset.json",
+    "output_file": "peft_demo.txt",
+}
+generation_configs = {
+    "do_sample": False,
+    "temperature": 0.9,
+    "topp": 0.8,
+    "topk": 1,
+}
+finetuning_configs = {
+    "learning_rate": 0.001,
+    "momentum": 0.0,
+    "weight_decay": 0.0,
+    "nesterov": False,
+}
+# Merge dictionaries
+configs_dict.update(model_configs)
+configs_dict.update(generation_configs)
+configs_dict.update(finetuning_configs)
+
+
+random.seed(configs_dict["seed"])
+
+create_datasets(inference_file_path=configs_dict["inference_dataset"], 
+                finetuning_file_path=configs_dict["finetuning_dataset"])
+
+configs = SimpleNamespace(**configs_dict)
+
+# Clear output file
+with open(configs.output_file, 'w') as file:
+    file.write('')
+
+# Download base and peft inference models
+args = [configs.inference_peft_model_id, '--base_model_name', configs.base_model]
+# hf_token = input("Please enter your HuggingFace personal access token: ")
+# subprocess.run(['huggingface-cli', 'login', '--token', hf_token])
+subprocess.run(['python', '../../utils/download_peft_model.py'] + args)
+
+
+# Initialize the FlexFlow runtime. ff.init() takes a dictionary or the path to a JSON file with the configs
+ff.init(configs_dict)
+
+# Create the FlexFlow LLM
+ff_data_type = (
+    ff.DataType.DT_FLOAT if configs.full_precision else ff.DataType.DT_HALF
+)
+llm = ff.LLM(
+    configs.base_model,
+    data_type=ff_data_type,
+    cache_path=configs.cache_path,
+    refresh_cache=configs.refresh_cache,
+    output_file=configs.output_file,
+)
+# Add inference and/or finetuning lora
+lora_inference_config = None
+lora_finetuning_config = None
+if len(configs.inference_dataset) > 0:
+    lora_inference_config = ff.LoraLinearConfig(
+        llm.cache_path, 
+        configs.inference_peft_model_id,
+        base_model_name_or_path=configs.base_model
+    )
+    llm.add_peft(lora_inference_config)
+if len(configs.finetuning_dataset) > 0:
+    lora_finetuning_config = ff.LoraLinearConfig(
+        llm.cache_path,
+        configs.finetuning_peft_model_id,
+        trainable=True,
+        init_lora_weights=False,
+        rank=16,
+        lora_alpha=16.0,
+        # target_modules = ["down_proj"],
+        base_model_name_or_path=configs.base_model,
+        optimizer_type=ff.OptimizerType.OPTIMIZER_TYPE_SGD,
+        optimizer_kwargs={
+            "learning_rate": configs.learning_rate,
+            "momentum": configs.momentum,
+            "weight_decay": configs.weight_decay,
+            "nesterov": configs.nesterov,
+        },
+    )
+    llm.add_peft(lora_finetuning_config)
+
+# Compile the LLM for inference and load the weights into memory
+generation_config = ff.GenerationConfig(
+    do_sample=configs.do_sample,
+    temperature=configs.temperature,
+    topp=configs.topp,
+    topk=configs.topk
+)
+enable_peft_finetuning = len(configs.finetuning_dataset) > 0
+llm.compile(
+    generation_config,
+    enable_peft_finetuning=enable_peft_finetuning,
+    max_requests_per_batch=configs.max_requests_per_batch+int(enable_peft_finetuning),
+    max_seq_length=configs.max_sequence_length,
+    max_tokens_per_batch=configs.max_tokens_per_batch,
+)
+
+
+llm.start_server()
+
+
+# prompts = [s for s in json.load(open(configs.inference_dataset))]
+# inference_requests = [
+#     ff.Request(
+#         ff.RequestType.REQ_INFERENCE,
+#         prompt=prompt,
+#         max_sequence_length=configs.max_sequence_length,
+#         peft_model_id=llm.get_ff_peft_id(lora_inference_config),
+#     )
+#     for prompt in prompts
+# ]
+# inf_req_res_1 = llm.generate(inference_requests)
+
+
+finetuning_request = ff.Request(
+    ff.RequestType.REQ_FINETUNING,
+    max_sequence_length=configs.max_sequence_length,
+    peft_model_id=llm.get_ff_peft_id(lora_finetuning_config),
+    dataset_filepath=os.path.join(os.getcwd(), configs.finetuning_dataset),
+    max_training_steps=configs.max_training_steps,
+)
+ft_res = llm.generate([finetuning_request])
+for res in ft_res:
+    print(res.finetuning_losses)
+
+# exit(0)
+# hf_token = input("Please enter your HuggingFace personal access token: ")
+# subprocess.run(['huggingface-cli', 'login', '--token', hf_token])
+subprocess.run(['python', '../../utils/upload_peft_model.py'] + f"--peft-model-id {configs.finetuning_peft_model_id} --upload-peft-model-id {configs.finetuning_peft_model_id}-dolly".split())
+
+
+
+lora_inference_config = ff.LoraLinearConfig(
+    llm.cache_path, 
+    configs.finetuning_peft_model_id,
+    base_model_name_or_path=configs.base_model
+)
+llm.add_peft(lora_inference_config)
+
+args = [configs.finetuning_peft_model_id, '--base_model_name', configs.base_model]
+#hf_token = input("Please enter your HuggingFace personal access token: ")
+# subprocess.run(['huggingface-cli', 'login', '--token', hf_token])
+# subprocess.run(['python', '../../utils/download_peft_model.py'] + args)
+
+
+prompts = [s for s in json.load(open(configs.inference_dataset))]
+inference_requests = [
+    ff.Request(
+        ff.RequestType.REQ_INFERENCE,
+        prompt=prompt,
+        max_sequence_length=configs.max_sequence_length,
+        peft_model_id=llm.get_ff_peft_id(lora_inference_config),
+    )
+    for prompt in prompts
+]
+inf_req_res_2 = llm.generate(inference_requests)
+
+
+llm.stop_server()
+
+
+print("==Inference result before finetuning: ", inf_req_res_1[0].output_text)
+print("==Inference result after finetuning: ", inf_req_res_2[0].output_text)
+
+
+epochs = list(range(configs_dict["max_training_steps"]))
+loss_values = ft_res[0].finetuning_losses
+
+plt.figure(figsize=(10, 6))
+plt.plot(epochs, loss_values, marker='o', linestyle='-', color='b')
\ No newline at end of file
diff --git a/inference/python/spec_infer.py b/inference/python/spec_infer.py
index a6dfa8042e..39529abda3 100644
--- a/inference/python/spec_infer.py
+++ b/inference/python/spec_infer.py
@@ -51,9 +51,12 @@ def get_configs():
             "tensor_parallelism_degree": 1,
             "pipeline_parallelism_degree": 2,
             "offload": False,
-            "offload_reserve_space_size": 1024**2,
+            "offload_reserve_space_size": 8 * 1024, # 8GB
             "use_4bit_quantization": False,
             "use_8bit_quantization": False,
+            "enable_peft": False,
+            "peft_activation_reserve_space_size": 1024, # 1GB
+            "peft_weight_reserve_space_size": 1024, # 1GB
             "profiling": False,
             "benchmarking": False,
             "inference_debugging": False,
@@ -76,7 +79,7 @@ def get_configs():
                     "full_precision": False,
                 }
             ],
-            # "prompt": "",
+            "prompt": "",
             "output_file": "",
         }
         # Merge dictionaries
diff --git a/inference/spec_infer/spec_infer.cc b/inference/spec_infer/spec_infer.cc
index 60233ac8d1..9689080825 100644
--- a/inference/spec_infer/spec_infer.cc
+++ b/inference/spec_infer/spec_infer.cc
@@ -414,15 +414,18 @@ void FlexFlow::top_level_task(Task const *task,
                                    /*allow_exceptions */ true,
                                    /*ignore_comments */ true);
 
-    std::vector<std::string> prompts;
+    std::vector<Request> requests;
     for (auto &prompt : prompt_json) {
       std::string text = prompt.get<std::string>();
       printf("Prompt[%d]: %s\n", total_num_requests, text.c_str());
+      // Add inference request
+      Request inference_req;
+      inference_req.prompt = text;
+      inference_req.max_sequence_length = 128;
+      requests.push_back(inference_req);
       total_num_requests++;
-      prompts.push_back(text);
-      // tree_model.generate(text, 128 /*max_sequence_length*/);
     }
-    tree_model.generate(prompts, 128 /*max_sequence_length*/);
+    tree_model.generate(requests);
   }
 
   // terminate the request manager by stopping the background thread
diff --git a/inference/utils/download_peft_model.py b/inference/utils/download_peft_model.py
new file mode 100644
index 0000000000..38dd577574
--- /dev/null
+++ b/inference/utils/download_peft_model.py
@@ -0,0 +1,68 @@
+#!/usr/bin/env python
+import flexflow.serve as ff
+import argparse, os
+
+
+def parse_args():
+    parser = argparse.ArgumentParser()
+    parser.add_argument(
+        "--base_model_name", type=str, help="Name of the model to download"
+    )
+    parser.add_argument(
+        "peft_model_ids",
+        type=str,
+        nargs="+",
+        help="Name of the PEFT model(s) to download",
+    )
+    parser.add_argument(
+        "--cache-folder",
+        type=str,
+        help="Folder to use to store the model(s) assets in FlexFlow format",
+        default=os.environ.get("FF_CACHE_PATH", ""),
+    )
+    parser.add_argument(
+        "--refresh-cache",
+        action="store_true",
+        help="Use this flag to force the refresh of the model(s) weights/tokenizer cache",
+    )
+    group = parser.add_mutually_exclusive_group()
+    group.add_argument(
+        "--full-precision-only",
+        action="store_true",
+        help="Only download the full precision version of the weights",
+    )
+    group.add_argument(
+        "--half-precision-only",
+        action="store_true",
+        help="Only download the half precision version of the weights",
+    )
+    args = parser.parse_args()
+    return args
+
+
+def main(args):
+    if args.full_precision_only:
+        data_types = (ff.DataType.DT_FLOAT,)
+    elif args.half_precision_only:
+        data_types = (ff.DataType.DT_HALF,)
+    else:
+        data_types = (ff.DataType.DT_FLOAT, ff.DataType.DT_HALF)
+
+    for data_type in data_types:
+        llm = ff.LLM(
+            args.base_model_name,
+            data_type=data_type,
+            cache_path=args.cache_folder,
+            refresh_cache=args.refresh_cache,
+        )
+        for peft_model_id in args.peft_model_ids:
+            lora_config = ff.LoraLinearConfig(llm.cache_path, peft_model_id)
+            llm.add_peft(lora_config)
+        llm.download_hf_weights_if_needed()
+        llm.download_hf_config()
+        llm.download_hf_tokenizer_if_needed()
+
+
+if __name__ == "__main__":
+    args = parse_args()
+    main(args)
diff --git a/inference/utils/upload_peft_model.py b/inference/utils/upload_peft_model.py
new file mode 100644
index 0000000000..7098d72f98
--- /dev/null
+++ b/inference/utils/upload_peft_model.py
@@ -0,0 +1,142 @@
+#!/usr/bin/env python
+import argparse, os
+from huggingface_hub import HfApi, HfFolder
+from transformers import AutoModelForCausalLM
+from peft import LoraConfig, PeftModel
+import torch
+import numpy as np
+import flexflow.serve as ff
+from peft import LoraConfig, get_peft_model
+
+
+def parse_args():
+    parser = argparse.ArgumentParser(
+        description="Download a PEFT model with FlexFlow, process it, and upload it to the Hugging Face Hub."
+    )
+    parser.add_argument(
+        "--peft-model-id",
+        type=str,
+        required=True,
+        help="(Local) Hugging Face model ID of the PEFT model to upload.",
+    )
+    parser.add_argument(
+        "--upload-peft-model-id",
+        type=str,
+        required=True,
+        help="(Remote) Hugging Face model ID of the PEFT model to upload.",
+    )
+    parser.add_argument(
+        "--cache-folder",
+        type=str,
+        default=os.environ.get(
+            "FF_CACHE_PATH", os.path.expanduser("~/.cache/flexflow")
+        ),
+        help="Path to the FlexFlow cache folder",
+    )
+    parser.add_argument(
+        "--private",
+        action="store_true",
+        help="Whether to upload the processed PEFT model as a private model on Hugging Face Hub.",
+    )
+    return parser.parse_args()
+
+
+def main():
+    args = parse_args()
+
+    # Ensure Hugging Face CLI is logged in
+    if not HfFolder.get_token():
+        raise RuntimeError(
+            "Hugging Face token not found. Please login using `huggingface-cli login`."
+        )
+
+    lora_config_filepath = os.path.join(
+        args.cache_folder,
+        "finetuned_models",
+        args.peft_model_id,
+        "config",
+        "ff_config.json",
+    )
+    peft_config = ff.LoraLinearConfig.from_jsonfile(lora_config_filepath)
+    print(peft_config)
+    hf_peft_config = peft_config.to_hf_config()
+    print(hf_peft_config)
+    if peft_config.precision != "fp32" and peft_config.precision != "fp16":
+        raise ValueError(f"Unsupported precision: {peft_config.precision}")
+    model = AutoModelForCausalLM.from_pretrained(
+        peft_config.base_model_name_or_path,
+        torch_dtype=torch.float32 if peft_config.precision == "fp32" else torch.float16,
+        device_map="auto",
+    )
+    model = get_peft_model(model, hf_peft_config)
+    in_dim = model.config.intermediate_size
+    out_dim = model.config.hidden_size
+
+    weight_folder = os.path.join(
+        args.cache_folder, "finetuned_models", args.peft_model_id, "weights", "shard_0"
+    )
+    num_shards = 1
+    while os.path.exists(weight_folder.replace("shard_0", f"shard_{num_shards}")):
+        num_shards += 1
+    if not in_dim % num_shards == 0:
+        raise ValueError(
+            f"Number of shards ({num_shards}) must divide the input dimension ({in_dim})"
+        )
+    lora_weight_files = os.listdir(weight_folder)
+    for lora_file in sorted(lora_weight_files):
+        lora_filename = ".weight".join(lora_file.split(".weight")[:-1])
+        hf_parameter_name = f"base_model.model.model.{lora_filename}.default.weight"
+        if hf_parameter_name not in model.state_dict().keys():
+            raise KeyError(f"Parameter {lora_file} not found in HF model.")
+
+        ff_dtype = np.float32 if peft_config.precision == "fp32" else np.float16
+        weight_path = os.path.join(weight_folder, lora_file)
+        # LoRA_A: [in_dim, rank]
+        # LoRA_B: [rank, out_dim]
+        if "lora_A" in lora_file:
+            weight_data = []
+            for shard_id in range(num_shards):
+                weight_path_shard = weight_path.replace("shard_0", f"shard_{shard_id}")
+                weight_data_shard = np.fromfile(weight_path_shard, dtype=ff_dtype)
+                print("===in_dim:", in_dim)
+                print("===out_dim:", out_dim)
+                print("===rank:", peft_config.rank)
+                print("===num_shards:", num_shards)
+                weight_data_shard = weight_data_shard.reshape(
+                    (in_dim // num_shards, peft_config.rank), order="F"
+                )
+                weight_data.append(weight_data_shard)
+            weight_data = np.concatenate(weight_data, axis=0).T
+        elif "lora_B" in lora_file:
+            weight_data = np.fromfile(weight_path, dtype=ff_dtype)
+            weight_data = weight_data.reshape((peft_config.rank, out_dim), order="F").T
+        weight_tensor = torch.from_numpy(weight_data)
+
+        param = model.state_dict()[hf_parameter_name]
+
+        actual_numel = weight_tensor.numel()
+        expected_numel = param.numel()
+        if actual_numel != expected_numel:
+            raise ValueError(
+                f"Parameter {lora_file} has unexpected parameter count: {actual_numel} (actual) != {expected_numel} (expected)"
+            )
+
+        if weight_tensor.shape != param.shape:
+            raise ValueError(
+                f"Parameter {lora_file} has unexpected shape: {weight_tensor.shape} (actual) != {param.shape} (expected)"
+            )
+        if weight_tensor.dtype != param.dtype:
+            raise ValueError(
+                f"Parameter {lora_file} has unexpected dtype: {weight_tensor.dtype} (actual) != {param.dtype} (expected)"
+            )
+
+        with torch.no_grad():
+            param.copy_(weight_tensor)
+
+    model.push_to_hub(f"{args.upload_peft_model_id}", use_auth_token=True, private=args.private)
+
+    print("Upload process completed.")
+
+
+if __name__ == "__main__":
+    main()
diff --git a/python/flexflow/core/__init__.py b/python/flexflow/core/__init__.py
index 2820cf485a..b8ed15eaea 100644
--- a/python/flexflow/core/__init__.py
+++ b/python/flexflow/core/__init__.py
@@ -88,7 +88,10 @@
     "offload": "-offload",
     "offload_reserve_space_size": "-offload-reserve-space-size",
     "use_4bit_quantization": "--4bit-quantization",
-    "use_8bit_quantization": "--8bit-quantization"
+    "use_8bit_quantization": "--8bit-quantization",
+    "enable_peft": "-enable-peft",
+    "peft_activation_reserve_space_size": "-peft-activation-reserve-space-size",
+    "peft_weight_reserve_space_size": "-peft-weight-reserve-space-size",
 }
 
 
diff --git a/python/flexflow/core/flexflow_cffi.py b/python/flexflow/core/flexflow_cffi.py
index 14cf4eebf7..7692ccb88f 100644
--- a/python/flexflow/core/flexflow_cffi.py
+++ b/python/flexflow/core/flexflow_cffi.py
@@ -28,6 +28,8 @@
     CompMode,
     MetricsType,
     InferenceMode,
+    RequestType,
+    OptimizerType,
     ModelType,
     OpType,
     ParameterSyncType,
@@ -36,6 +38,9 @@
 )
 from flexflow.config import *
 from .flexflowlib import ffi, flexflow_library
+from typing import Union, List
+from peft import LoraConfig
+import json
 
 
 def ffc():
@@ -1243,1009 +1248,935 @@ def get_weights(self, ffmodel):
 
 
 # -----------------------------------------------------------------------
-# FFModel
+# SGDOptimizer
 # -----------------------------------------------------------------------
 
 
-class FFModel(object):
-    """ """
+class SGDOptimizer(object):
+    __slots__ = ["handle", "_handle"]
 
-    __slots__ = [
-        "handle",
-        "_handle",
-        "_layers",
-        "_nb_layers",
-        "_ffconfig",
-        "_tracing_id",
-        "initializers",
-        "attr_tensors",
-    ]
+    def __init__(
+        self, ffmodel, lr=0.01, momentum=0.0, nesterov=False, weight_decay=0.0
+    ):
+        self.handle = ffc().flexflow_sgd_optimizer_create(
+            ffmodel.handle, lr, momentum, nesterov, weight_decay
+        )
+        self._handle = ffi.gc(self.handle, ffc().flexflow_sgd_optimizer_destroy)
 
-    def __init__(self, ffconfig):
-        """Constructor of FFModel.
+    def set_learning_rate(self, learning_rate):
+        ffc().flexflow_sgd_optimizer_set_lr(self.handle, learning_rate)
 
-        :param ffconfig: configurations of FlexFlow and the created model.
-        :type ffconfig: FFConfig
 
-        :returns:  FFModel -- the model.
-        """
-        self.handle = ffc().flexflow_model_create(ffconfig.handle, ffconfig.cpu_offload)
-        self._handle = ffi.gc(self.handle, ffc().flexflow_model_destroy)
-        self._layers = dict()
-        self._nb_layers = 0
-        self._ffconfig = ffconfig
-        global ff_tracing_id
-        self._tracing_id = ff_tracing_id
-        ff_tracing_id += 1
-        self.initializers = {}
-        self.attr_tensors = {}
+# -----------------------------------------------------------------------
+# AdamOptimizer
+# -----------------------------------------------------------------------
 
-    def get_layers(self):
-        return self._layers
 
-    def add_layer(self, op_type, name):
-        layer_id = self._nb_layers
-        op_handle = ffc().flexflow_model_get_last_layer(self.handle)
-        self._layers[self._nb_layers] = convert_op_handle_to_op(
-            op_type, op_handle, idx=layer_id, name=name
+class AdamOptimizer(object):
+    __slots__ = ["handle", "_handle"]
+
+    def __init__(
+        self,
+        ffmodel,
+        alpha=0.001,
+        beta1=0.9,
+        beta2=0.999,
+        weight_decay=0.0,
+        epsilon=1e-8,
+    ):
+        self.handle = ffc().flexflow_adam_optimizer_create(
+            ffmodel.handle, alpha, beta1, beta2, weight_decay, epsilon
         )
-        self._nb_layers += 1
+        self._handle = ffi.gc(self.handle, ffc().flexflow_adam_optimizer_destroy)
 
-    def create_tensor(self, dims, data_type, create_grad=True):
-        """Instantiate a FlexFlow tensor.
+    def set_learning_rate(self, learning_rate):
+        ffc().flexflow_adam_optimizer_set_lr(self.handle, learning_rate)
 
-        :param x: a shape tuple/list (integers), including the batch size.
-        :type x: list of int
 
-        :param data_type: the datatype of the created tensor. Options are
-          DT_FLOAT, DT_DOUBLE, DT_INT32, DT_INT64, DT_BOOLEAN.
-        :type data_type: DataType
+# -----------------------------------------------------------------------
+# Initializer
+# -----------------------------------------------------------------------
+class Initializer(object):
+    __slots__ = ["handle", "p_handle"]
 
-        :param create_grad: weather the tensor creates a gradients vector.
-          If you don't specify anything, a gradients vector is used.
-        :type create_grad: bool
+    def __init__(self, handle, p_handle=0):
+        self.p_handle = ffi.new("flexflow_initializer_t *")
+        if handle == None:
+            self.p_handle.impl = ffi.NULL
+        else:
+            self.p_handle.impl = handle.impl
+        self.handle = self.p_handle[0]
+        assert ffi.typeof(self.handle) == ffi.typeof(
+            "flexflow_initializer_t"
+        ), "Initializer handle is wrong"
 
-        :returns:  Tensor -- the output tensor.
-        """
-        c_dims = ffi.new("int[]", dims)
-        c_data_type = enum_to_int(DataType, data_type)
-        num_dims = len(dims)
-        handle = ffc().flexflow_tensor_create(
-            self.handle, num_dims, c_dims, c_data_type, create_grad
-        )
-        return Tensor(handle)
 
-    def map_tensor(self, tensor, parallel_op=None):
-        op_handle = self.__get_op_handle(parallel_op)
-        ffc().flexflow_tensor_map(self.handle, tensor.handle, op_handle)
+# -----------------------------------------------------------------------
+# GlorotUniform
+# -----------------------------------------------------------------------
 
-    def create_constant(self, dims, value, data_type):
-        c_dims = ffi.new("int[]", dims)
-        c_data_type = enum_to_int(DataType, data_type)
-        num_dims = len(dims)
-        handle = ffc().flexflow_constant_create(
-            self.handle, num_dims, c_dims, value, c_data_type
-        )
-        return Tensor(handle)
 
-    def exp(self, x, name=None):
-        """Exponential activation function.
+class GlorotUniformInitializer(Initializer):
+    __slots__ = ["glorot_handle", "_glorot_handle"]
 
-        :param x: the input Tensor.
-        :type x: Tensor
+    def __init__(self, seed):
+        self.glorot_handle = ffc().flexflow_glorot_uniform_initializer_create(seed)
+        self._glorot_handle = ffi.gc(
+            self.glorot_handle, ffc().flexflow_glorot_uniform_initializer_destroy
+        )
+        super(GlorotUniformInitializer, self).__init__(self.glorot_handle)
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
 
-        :returns:  Tensor -- the output tensor.
-        """
-        c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_exp(self.handle, x.handle, c_name)
-        self.add_layer(OpType.EXP, name)
-        return Tensor(handle, owner_op_type=OpType.EXP)
+# -----------------------------------------------------------------------
+# ZeroInitializer
+# -----------------------------------------------------------------------
 
-    def sin(self, x, name=None):
-        """Elementwise sine function.
 
-        :param x: the input Tensor.
-        :type x: Tensor
+class ZeroInitializer(Initializer):
+    __slots__ = ["zero_handle", "_zero_handle"]
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
+    def __init__(self):
+        self.zero_handle = ffc().flexflow_zero_initializer_create()
+        self._zero_handle = ffi.gc(
+            self.zero_handle, ffc().flexflow_zero_initializer_destroy
+        )
+        super(ZeroInitializer, self).__init__(self.zero_handle)
 
-        :returns:  Tensor -- the output tensor.
-        """
-        c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_sin(self.handle, x.handle, c_name)
-        self.add_layer(OpType.SIN, name)
-        return Tensor(handle, owner_op_type=OpType.SIN)
 
-    def cos(self, x, name=None):
-        """Elementwise cosine function.
+# -----------------------------------------------------------------------
+# UniformInitializer
+# -----------------------------------------------------------------------
 
-        :param x: the input Tensor.
-        :type x: Tensor
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
+class UniformInitializer(Initializer):
+    __slots__ = ["uniform_handle", "_uniform_handle"]
 
-        :returns:  Tensor -- the output tensor.
-        """
-        c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_cos(self.handle, x.handle, c_name)
-        self.add_layer(OpType.COS, name)
-        return Tensor(handle, owner_op_type=OpType.COS)
+    def __init__(self, seed, minv, maxv):
+        self.uniform_handle = ffc().flexflow_uniform_initializer_create(
+            seed, minv, maxv
+        )
+        self._uniform_handle = ffi.gc(
+            self.uniform_handle, ffc().flexflow_uniform_initializer_destroy
+        )
+        super(UniformInitializer, self).__init__(self.uniform_handle)
 
-    def add(self, x, y, inplace_a=False, name=None):
-        """Layer that adds two input Tensors, :attr:`output = x + y`.
 
-        :param x: the first input Tensor.
-        :type x: Tensor
+# -----------------------------------------------------------------------
+# NormInitializer
+# -----------------------------------------------------------------------
 
-        :param y: the second input Tensor.
-        :type y: Tensor
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
+class NormInitializer(Initializer):
+    __slots__ = ["norm_handle", "_norm_handle"]
 
-        :returns:  Tensor -- the output tensor.
-        """
-        c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_add(
-            self.handle, x.handle, y.handle, inplace_a, c_name
+    def __init__(self, seed, mean, stddev):
+        self.norm_handle = ffc().flexflow_norm_initializer_create(seed, mean, stddev)
+        self._norm_handle = ffi.gc(
+            self.norm_handle, ffc().flexflow_norm_initializer_destroy
         )
-        self.add_layer(OpType.ADD, name)
-        return Tensor(handle, owner_op_type=OpType.ADD)
-
-    def subtract(self, x, y, inplace_a=False, name=None):
-        """Layer that subtracts two input Tensors, :attr:`output = x * y`.
+        super(NormInitializer, self).__init__(self.norm_handle)
 
-        :param x: the first input Tensor.
-        :type x: Tensor
 
-        :param y: the second input Tensor.
-        :type y: Tensor
+# -----------------------------------------------------------------------
+# PerfMetrics
+# -----------------------------------------------------------------------
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
 
-        :returns:  Tensor -- the output tensor.
-        """
-        c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_subtract(
-            self.handle, x.handle, y.handle, inplace_a, c_name
-        )
-        self.add_layer(OpType.SUBTRACT, name)
-        return Tensor(handle, owner_op_type=OpType.SUBTRACT)
+class PerfMetrics(object):
+    __slots__ = ["handle", "_handle"]
 
-    def multiply(self, x, y, inplace_a=False, name=None):
-        """Layer that multiplies (element-wise) two input Tensors, :attr:`output = x * y`.
+    def __init__(self, handle):
+        self.handle = handle
+        self._handle = ffi.gc(self.handle, ffc().flexflow_per_metrics_destroy)
 
-        :param x: the first input Tensor.
-        :type x: Tensor
+    def get_accuracy(self):
+        return ffc().flexflow_per_metrics_get_accuracy(self.handle)
 
-        :param y: the second input Tensor.
-        :type y: Tensor
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
+# -----------------------------------------------------------------------
+# NetConfig
+# -----------------------------------------------------------------------
 
-        :returns:  Tensor -- the output tensor.
-        """
-        c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_multiply(
-            self.handle, x.handle, y.handle, inplace_a, c_name
-        )
-        self.add_layer(OpType.MULTIPLY, name)
-        return Tensor(handle, owner_op_type=OpType.MULTIPLY)
 
-    def divide(self, x, y, inplace_a=False, name=None):
-        """Layer that divides (element-wise) two input Tensors, :attr:`output = x / y`.
-
-        :param x: the first input Tensor.
-        :type x: Tensor
-
-        :param y: the second input Tensor.
-        :type y: Tensor
+class NetConfig(object):
+    def __init__(self):
+        self.handle = ffc().flexflow_net_config_create()
+        self._handle = ffi.gc(self.handle, ffc().flexflow_net_config_destroy)
+        cpath = ffc().flexflow_net_config_get_dataset_path(self.handle)
+        self.dataset_path = ffi.string(cpath)
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
 
-        :returns:  Tensor -- the output tensor.
-        """
-        c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_divide(
-            self.handle, x.handle, y.handle, inplace_a, c_name
-        )
-        self.add_layer(OpType.DIVIDE, name)
-        return Tensor(handle, owner_op_type=OpType.DIVIDE)
+# -----------------------------------------------------------------------
+# DLRMConfig
+# -----------------------------------------------------------------------
 
-    def max(self, x, y, inplace_a=False, name=None):
-        """Layer that computes the max (element-wise) two input Tensors, :attr:`output = max(x,y)`.
 
-        :param x: the first input Tensor.
-        :type x: Tensor
+class DLRMConfig(object):
+    def __init__(self):
+        self.handle = ffc().flexflow_dlrm_config_create()
+        self._handle = ffi.gc(self.handle, ffc().flexflow_dlrm_config_destroy)
 
-        :param y: the second input Tensor.
-        :type y: Tensor
+        cstr = ffc().flexflow_dlrm_config_get_dataset_path(self.handle)
+        self.dataset_path = ffi.string(cstr)
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
+        cstr = ffc().flexflow_dlrm_config_get_arch_interaction_op(self.handle)
+        self.arch_interaction_op = ffi.string(cstr)
 
-        :returns:  Tensor -- the output tensor.
-        """
-        c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_max(
-            self.handle, x.handle, y.handle, inplace_a, c_name
+        self.sparse_feature_size = ffc().flexflow_dlrm_config_get_sparse_feature_size(
+            self.handle
         )
-        self.add_layer(OpType.MAX, name)
-        return Tensor(handle, owner_op_type=OpType.MAX)
+        self.sigmoid_bot = ffc().flexflow_dlrm_config_get_sigmoid_bot(self.handle)
+        self.sigmoid_top = ffc().flexflow_dlrm_config_get_sigmoid_top(self.handle)
+        self.embedding_bag_size = ffc().flexflow_dlrm_config_get_embedding_bag_size(
+            self.handle
+        )
+        self.loss_threshold = ffc().flexflow_dlrm_config_get_loss_threshold(self.handle)
 
-    def min(self, x, y, inplace_a=False, name=None):
-        """Layer that computes the min (element-wise) two input Tensors, :attr:`output = min(x,y)`.
+        mlp_bot_c = ffc().flexflow_dlrm_config_get_mlp_bot(self.handle)
+        self.mlp_bot = []
+        for i in range(0, mlp_bot_c[0]):
+            self.mlp_bot.append(mlp_bot_c[i + 1])
 
-        :param x: the first input Tensor.
-        :type x: Tensor
+        mlp_top_c = ffc().flexflow_dlrm_config_get_mlp_top(self.handle)
+        self.mlp_top = []
+        for i in range(0, mlp_top_c[0]):
+            self.mlp_top.append(mlp_top_c[i + 1])
 
-        :param y: the second input Tensor.
-        :type y: Tensor
+        embedding_size_c = ffc().flexflow_dlrm_config_get_embedding_size(self.handle)
+        self.embedding_size = []
+        for i in range(0, embedding_size_c[0]):
+            self.embedding_size.append(embedding_size_c[i + 1])
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
 
-        :returns:  Tensor -- the output tensor.
-        """
-        c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_min(
-            self.handle, x.handle, y.handle, inplace_a, c_name
-        )
-        self.add_layer(OpType.MIN, name)
-        return Tensor(handle, owner_op_type=OpType.MIN)
+# -----------------------------------------------------------------------
+# Single DataLoader
+# -----------------------------------------------------------------------
 
-    def reduce_sum(self, input, axes, keepdims=False, name=None):
-        """Layer that computes the sum of the input Tensor along given axes.
 
-        :param input: the input Tensor.
-        :type input: Tensor
+class SingleDataLoader(object):
+    __slots__ = ["handle", "_handle"]
 
-        :param axes: the axes along which reduction is applied
-        :type axes: List[int]
+    def __init__(self, ffmodel, input, full_input, num_samples, data_type):
+        assert type(ffmodel) is FFModel, "SingleDataLoader ffmodel is wrong"
+        assert type(input) is Tensor, "SingleDataLoader input is wrong"
+        if type(full_input) is Tensor:
+            self.init_from_tensor(ffmodel, input, full_input, num_samples, data_type)
+        else:
+            self.init_from_ptr(ffmodel, input, full_input, num_samples, data_type)
+        self._handle = ffi.gc(self.handle, ffc().flexflow_single_dataloader_destroy)
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
+    def init_from_tensor(self, ffmodel, input, full_input, num_samples, data_type):
+        assert type(full_input) is Tensor, "SingleDataLoader full_input is wrong"
+        c_data_type = enum_to_int(DataType, data_type)
+        self.handle = ffc().flexflow_single_dataloader_create(
+            ffmodel.handle, input.handle, full_input.handle, num_samples, c_data_type
+        )
 
-        :returns:  Tensor -- the output tensor.
-        """
-        c_name = get_c_name(name)
-        c_axes = ffi.new("int[]", axes)
-        handle = ffc().flexflow_model_add_reduce_sum(
-            self.handle, input.handle, c_axes, len(axes), keepdims, c_name
+    def init_from_ptr(self, ffmodel, input, full_input, num_samples, data_type):
+        # assert type(full_input) is Tensor, "SingleDataLoader full_input is wrong"
+        c_data_type = enum_to_int(DataType, data_type)
+        self.handle = ffc().flexflow_single_dataloader_create2(
+            ffmodel.handle, input.handle, full_input, num_samples, c_data_type
         )
-        self.add_layer(OpType.REDUCE_SUM, name)
-        return Tensor(handle, owner_op_type=OpType.REDUCE_SUM)
 
-    def rsqrt(self, input, name=None):
-        """Layer that computes the element-wise reciprocal square-root.
+    @property
+    def num_samples(self):
+        return ffc().flexflow_single_dataloader_get_num_samples(self.handle)
 
-        :param input: the input Tensor.
-        :type input: Tensor
+    @num_samples.setter
+    def num_samples(self, samples):
+        ffc().flexflow_single_dataloader_set_num_samples(self.handle, samples)
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
+    def next_batch(self, ffmodel):
+        """Ask the dataloder to load the next batch to the :attr:`batch_tensor`.
 
-        :returns:  Tensor -- the output tensor.
+        :returns:  None -- no returns.
         """
-        c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_rsqrt(self.handle, input.handle, c_name)
-        self.add_layer(OpType.RSQRT, name)
-        return Tensor(handle, owner_op_type=OpType.RSQRT)
+        ffc().flowflow_single_dataloader_next_batch(self.handle, ffmodel.handle)
 
-    def pow(self, input, exponent, name=None):
-        """Layer that computes the element-wise power.
+    def reset(self):
+        """Reset the current position of the dataloder to 0.
 
-        :param input: the input Tensor.
-        :type input: Tensor
+        :returns:  None -- no returns.
+        """
+        ffc().flexflow_single_dataloader_reset(self.handle)
 
-        :param exponent: exponent to raise each element in the input tensor.
-        :type exponent: float
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
+class RegionNdarray(object):
+    __slots__ = ["__array_interface__"]
 
-        :returns:  Tensor -- the output tensor.
-        """
-        c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_pow(
-            self.handle, input.handle, exponent, c_name
-        )
-        self.add_layer(OpType.POW, name)
-        return Tensor(handle, owner_op_type=OpType.POW)
+    def __init__(self, shape, data_type, base_ptr, strides, read_only):
+        # See: https://docs.scipy.org/doc/numpy/reference/arrays.interface.html
+        if data_type == DataType.DT_HALF:
+            field_type = "<f2"
+        elif data_type == DataType.DT_FLOAT:
+            field_type = "<f4"
+        elif data_type == DataType.DT_INT32:
+            field_type = "<i4"
+        else:
+            assert 0, "unknown data type"
+            field_type = "<f4"
+        self.__array_interface__ = {
+            "version": 3,
+            "shape": shape,
+            "typestr": field_type,
+            "data": (base_ptr, read_only),
+            "strides": strides,
+        }
 
-    def mean(self, input, dims, keepdims=False, name=None):
-        """Layer that computes the mean of the input tensor across the given
-        dimensions.
 
-        :param input: the input Tensor.
-        :type input: Tensor
+# -----------------------------------------------------------------------
+# BatchConfig
+# -----------------------------------------------------------------------
 
-        :param dims: dimensions to take the mean over.
-        :type dims: list
 
-        :param keepdims: keeps the dimensions in :attr:`dims` as size 1 if True and
-                         collapses the dimension if False. Default is False.
-        :type keepdims: bool
+class BatchConfig(object):
+    __slots__ = ["handle", "_handle"]
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
+    def __init__(self):
+        self.handle = ffc().flexflow_batch_config_create()
+        self._handle = ffi.gc(self.handle, ffc().flexflow_batch_config_destroy)
 
-        :returns:  Tensor -- the output tensor.
-        """
-        dims = list(dims)
-        c_dims = ffi.new("int[]", dims)
-        c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_mean(
-            self.handle, input.handle, c_dims, len(dims), keepdims, c_name
-        )
-        self.add_layer(OpType.MEAN, name)
-        return Tensor(handle, owner_op_type=OpType.MEAN)
 
-    def conv2d(
-        self,
-        input,
-        out_channels,
-        kernel_h,
-        kernel_w,
-        stride_h,
-        stride_w,
-        padding_h,
-        padding_w,
-        activation=ActiMode.AC_MODE_NONE,
-        groups=1,
-        use_bias=True,
-        shared_op=None,
-        kernel_initializer=None,
-        bias_initializer=None,
-        name=None,
-    ):
-        """This layer creates a 2D convolution kernel that is convolved with the layer :attr:`input`
-        to produce a tensor of :attr:`output`.
+# -----------------------------------------------------------------------
+# TreeVerifyBatchConfig
+# -----------------------------------------------------------------------
 
-        The size of input tensor is :math:`(N, C_{in}, H, W)` and the size of output tensor
-        is :math:`(N, C_{out}, H_{out}, W_{out})`, which can be calculated by:
 
-        .. math::
-          C_{out} = out\_channels
+class TreeVerifyBatchConfig(object):
+    __slots__ = ["handle", "_handle"]
 
-        .. math::
-          K_{H} = kernel\_h
+    def __init__(self):
+        self.handle = ffc().flexflow_tree_verify_batch_config_create()
+        self._handle = ffi.gc(
+            self.handle, ffc().flexflow_tree_verify_batch_config_destroy
+        )
 
-        .. math::
-          K_{W} = kernel\_w
 
-        .. math::
-          S_{H} = stride\_h
-
-        .. math::
-          S_{W} = stride\_w
+# -----------------------------------------------------------------------
+# BeamSearchBatchConfig
+# -----------------------------------------------------------------------
 
-        .. math::
-          P_{H} = padding\_h
 
-        .. math::
-          P_{S} = padding\_s
+class BatchConfig(object):
+    __slots__ = ["handle", "_handle"]
 
-        .. math::
-          H_{out} = (H - K_{H} + 2 * P_{H}) / S_{H} + 1
+    def __init__(self):
+        self.handle = ffc().flexflow_beam_search_batch_config_create()
+        self._handle = ffi.gc(
+            self.handle, ffc().flexflow_beam_search_batch_config_destroy
+        )
 
-        .. math::
-          W_{out} = (W - K_{W} + 2 * P_{W}) / S_{W} + 1
 
-        :param input: the input Tensor.
-        :type input: Tensor
+# -----------------------------------------------------------------------
+# RequestManager
+# -----------------------------------------------------------------------
 
-        :param out\_channels: the dimensionality of the output space (i.e. the number of output filters in the convolution).
-        :type out\_channels: int
 
-        :param kernel_h: the height of the 2D convolution window: :math:`K_{H}`.
-        :type kernel_h: int
+class RequestManager(object):
+    __slots__ = ["handle"]
 
-        :param kernel_w: the width of the 2D convolution window: :math:`K_{W}`.
-        :type kernel_w: int
+    def __init__(self):
+        self.handle = ffc().flexflow_request_manager_get_request_manager()
+        # self._handle = ffi.gc(self.handle, ffc().flexflow_request_manager_destroy)
 
-        :param stride_h: the stride of the convolution along the height: :math:`S_{H}`.
-        :type stride_h: int
+    def register_tokenizer(
+        self, model_type, bos_token_id, eos_token_id, tokenizer_filepath
+    ):
+        c_model_type = enum_to_int(ModelType, model_type)
+        c_tokenizer_filepath = get_c_name(tokenizer_filepath)
+        return ffc().flexflow_request_manager_register_tokenizer(
+            self.handle, c_model_type, bos_token_id, eos_token_id, c_tokenizer_filepath
+        )
 
-        :param stride_w: the stride of the convolution along the width: :math:`S_{W}`.
-        :type stride_w: int
+    def register_output_filepath(self, output_filepath):
+        c_output_filepath = get_c_name(output_filepath)
+        return ffc().flexflow_request_manager_register_output_filepath(
+            self.handle, c_output_filepath
+        )
 
-        :param padding_h: the amount of implicit zero-paddings along the height: :math:`P_{H}`.
-        :type padding_h: int
+    def register_ssm_model(self, model):
+        return ffc().flexflow_request_manager_register_ssm_model(
+            self.handle, model.handle
+        )
 
-        :param padding_w: the amount of implicit zero-paddings along the width: :math:`P_{W}`.
-        :type padding_w: int
+    def set_max_requests_per_batch(self, max_requests):
+        return ffc().flexflow_request_manager_set_max_requests_per_batch(
+            self.handle, max_requests
+        )
 
-        :param activation: Activation function to use. Default is ActiMode.AC_MODE_NONE.
-        :type activation: ActiMode
+    def set_max_tokens_per_batch(self, max_tokens):
+        return ffc().flexflow_request_manager_set_max_tokens_per_batch(
+            self.handle, max_tokens
+        )
 
-        :param groups: the number of groups in this convolution
-        :type groups: int
+    def set_max_spec_tree_token_num(self, max_tokens):
+        return ffc().flexflow_request_manager_set_max_spec_tree_token_num(
+            self.handle, max_tokens
+        )
 
-        :param use_bias: whether the layer uses a bias vector. Default is True.
-        :type use_bias: bool
+    def set_max_sequence_length(self, max_length):
+        return ffc().flexflow_request_manager_set_max_sequence_length(
+            self.handle, max_length
+        )
 
-        :param shared_op: the layer whose parameters are shared with. Default is None.
-        :type shared_op: Op
+    def set_enable_peft_finetuning(self, enable_peft_finetuning):
+        return ffc().flexflow_request_manager_set_enable_peft_finetuning(
+            self.handle, enable_peft_finetuning
+        )
 
-        :param kernel_initializer: Initializer for the kernel weights matrix. If it is set to None, the GlorotUniformInitializer is applied.
-        :type kernel_initializer: Initializer
+    def start_server(self, model):
+        return ffc().flexflow_request_manager_start_background_server(
+            self.handle, model.handle
+        )
 
-        :param bias_initializer: Initializer for the bias vector. If it is set to None, the ZeroInitializer is applied.
-        :type bias_initializer: Initializer
+    def stop_server(self):
+        return ffc().flexflow_request_manager_terminate_background_server(self.handle)
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
 
-        :returns:  Tensor -- the output tensor.
-        """
-        shared_op_handle = self.__get_op_handle(shared_op)
-        c_activation = enum_to_int(ActiMode, activation)
-        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-        bias_init_handle = self.__get_initializer_handle(bias_initializer)
-        c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_conv2d(
-            self.handle,
-            input.handle,
-            out_channels,
-            kernel_h,
-            kernel_w,
-            stride_h,
-            stride_w,
-            padding_h,
-            padding_w,
-            c_activation,
-            groups,
-            use_bias,
-            shared_op_handle,
-            kernel_init_handle,
-            bias_init_handle,
-            c_name,
-        )
-        self.add_layer(OpType.CONV2D, name)
-        return Tensor(handle, owner_op_type=OpType.CONV2D)
+# -----------------------------------------------------------------------
+# InferenceManager
+# -----------------------------------------------------------------------
 
-    def embedding(
-        self,
-        input,
-        num_embeddings,
-        embedding_dim,
-        aggr,
-        dtype=DataType.DT_FLOAT,
-        shared_op=None,
-        kernel_initializer=None,
-        name=None,
-    ):
-        """Layer that turns positive integers into dense vectors of fixed size
 
-        :param input: the input Tensor.
-        :type input: Tensor
+class InferenceManager(object):
+    __slots__ = ["handle"]
 
-        :param num_embeddings: size of the vocabulary, i.e. maximum integer index + 1
-        :type num_embeddings: int
+    def __init__(self):
+        self.handle = ffc().flexflow_inference_manager_get_inference_manager()
+        # self._handle = ffi.gc(self.handle, ffc().flexflow_inference_manager_destroy)
 
-        :param embedding_dim: dimension of the dense embedding.
-        :type embedding_dim: int
+    def compile_model_and_allocate_buffer(self, model):
+        ffc().flexflow_inference_manager_compile_model_and_allocate_buffer(
+            self.handle, model.handle
+        )
 
-        :param aggr: aggregation mode. Options are AGGR_MODE_NONE, AGGR_MODE_SUM and AGGR_MODE_AVG.
-        :type aggr: AggrMode
+    def init_operators_inference(self, model):
+        ffc().flexflow_inference_manager_init_operators_inference(
+            self.handle, model.handle
+        )
 
-        :param dtype: the tensor data type. Options are DT_BOOLEAN, DT_INT32, DT_INT64, DT_HALF, DT_FLOAT, DT_DOUBLE, DT_INT4, DT_INT8, DT_NONE
-        :type dtype: DataType
+    def register_model_weights_loader(self, model, fileloader):
+        ffc().flexflow_inference_manager_register_model_weights_loader(
+            self.handle, model.handle, fileloader.handle
+        )
 
-        :param shared_op: the layer whose parameters are shared with. Default is None.
-        :type shared_op: Op
 
-        :param kernel_initializer: Initializer for the kernel weights matrix. If it is set to None, the GlorotUniformInitializer is applied.
-        :type kernel_initializer: Initializer
+# -----------------------------------------------------------------------
+# FileDataLoader
+# -----------------------------------------------------------------------
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
 
-        :returns:  Tensor -- the output tensor.
-        """
-        c_name = get_c_name(name)
-        shared_op_handle = self.__get_op_handle(shared_op)
-        c_aggr = enum_to_int(AggrMode, aggr)
-        c_dtype = enum_to_int(DataType, dtype)
-        if kernel_initializer is None:
-            kernel_initializer = GlorotUniformInitializer(42)
-        assert (
-            (type(kernel_initializer) is GlorotUniformInitializer)
-            or (type(kernel_initializer) is ZeroInitializer)
-            or (type(kernel_initializer) is UniformInitializer)
-            or (type(kernel_initializer) is NormInitializer)
-        ), f"Unknown initializer type: {kernel_initializer}"
-        handle = ffc().flexflow_model_add_embedding(
-            self.handle,
-            input.handle,
-            num_embeddings,
-            embedding_dim,
-            c_aggr,
-            c_dtype,
-            shared_op_handle,
-            kernel_initializer.handle,
-            c_name,
-        )
-        # NOTE: We must keep a reference to the initializer or else it will be
-        # immediately destructed
-        self.initializers[name] = kernel_initializer
-        self.add_layer(OpType.EMBEDDING, name)
-        return Tensor(handle, owner_op_type=OpType.EMBEDDING)
+class FileDataLoader(object):
+    __slots__ = ["handle", "_handle"]
 
-    def pool2d(
+    def __init__(
         self,
-        input,
-        kernel_h,
-        kernel_w,
-        stride_h,
-        stride_w,
-        padding_h,
-        padding_w,
-        pool_type=PoolType.POOL_MAX,
-        activation=ActiMode.AC_MODE_NONE,
-        name=None,
+        weight_file_path,
+        num_q_heads,
+        num_kv_heads,
+        hidden_dim,
+        qkv_inner_dim,
+        tensor_parallelism_degree,
+        use_full_precision,
     ):
-        """Pooling operation for 2D spatial data.
+        c_weight_file_path = get_c_name(weight_file_path)
+        self.handle = ffc().flexflow_file_data_loader_create(
+            c_weight_file_path,
+            num_q_heads,
+            num_kv_heads,
+            hidden_dim,
+            qkv_inner_dim,
+            tensor_parallelism_degree,
+            use_full_precision,
+        )
+        self._handle = ffi.gc(self.handle, ffc().flexflow_file_data_loader_destroy)
 
-        The size of input tensor is :math:`(N, C_{in}, H, W)` and the size of output tensor
-        is :math:`(N, C_{out}, H_{out}, W_{out})`, which can be calculated by:
+    def load_weights(self, model):
+        # Check data type and create use_full_precision boolean
+        # assert data_type == DataType.DT_FLOAT or data_type == DataType.DT_HALF
+        # use_full_precision = data_type == DataType.DT_FLOAT
+        ffc().flexflow_file_data_loader_load_weights(self.handle, model.handle)
 
-        .. math::
-          C_{out} = out\_channels
 
-        .. math::
-          K_{H} = kernel\_h
+# -----------------------------------------------------------------------
+# GenerationConfig
+# -----------------------------------------------------------------------
 
-        .. math::
-          K_{W} = kernel\_w
 
-        .. math::
-          S_{H} = stride\_h
+class GenerationConfig(object):
+    """A class to store the sampling configs."""
 
-        .. math::
-          S_{W} = stride\_w
+    def __init__(
+        self,
+        do_sample: bool = False,
+        temperature: float = 0.9,
+        topp: float = 0.8,
+        topk: int = 1,
+    ):
+        """Initialize the sampling configs
+
+        :param do_sample: Whether to perform sampling, or use greedy decoding, defaults to False
+        :type do_sample: bool, optional
+        :param temperature: The temperature setting, defaults to 0.9
+        :type temperature: float, optional
+        :param topp: The top probabilities (top-p) setting, defaults to 0.8
+        :type topp: float, optional
+        :param topk: The top-k setting, defaults to 1
+        :type topk: int, optional
+        """
+        self.do_sample = do_sample
+        self.temperature = temperature
+        self.topp = topp
+        self.topk = topk
 
-        .. math::
-          P_{H} = padding\_h
 
-        .. math::
-          P_{S} = padding\_s
+# -----------------------------------------------------------------------
+# GenerationResult
+# -----------------------------------------------------------------------
 
-        .. math::
-          H_{out} = (H - K_{H} + 2 * P_{H}) / S_{H} + 1
 
-        .. math::
-          W_{out} = (W - K_{W} + 2 * P_{W}) / S_{W} + 1
+class GenerationResult(object):
+    """A class to store the output of a generation request."""
 
-        :param input: the input Tensor.
-        :type input: Tensor
+    def __init__(
+        self, text: str = None, tokens: list = None, finetuning_losses: list = []
+    ):
+        self.output_text = text
+        self.output_tokens = tokens
+        self.finetuning_losses = finetuning_losses
 
-        :param kernel_h: the height of the 2D pooling window: :math:`K_{H}`.
-        :type kernel_h: int
 
-        :param kernel_w: the width of the 2D pooling window: :math:`K_{W}`.
-        :type kernel_w: int
+# -----------------------------------------------------------------------
+# LoraLinearConfig
+# -----------------------------------------------------------------------
 
-        :param stride_h: the stride of the pooling along the height: :math:`S_{H}`.
-        :type stride_h: int
 
-        :param stride_w: the stride of the pooling along the width: :math:`S_{W}`.
-        :type stride_w: int
+class LoraLinearConfig(object):
+    def __init__(
+        self,
+        cache_folder: str,
+        peft_model_id: str,
+        trainable: bool = False,
+        init_lora_weights: bool = False,
+        base_model_name_or_path: str = "",
+        precision: str = "fp16",
+        rank: int = None,
+        lora_alpha: float = None,
+        lora_dropout: float = None,
+        target_modules: List[str] = [],
+        optimizer_type: OptimizerType = OptimizerType.OPTIMIZER_TYPE_NONE,
+        optimizer_kwargs: dict = {},
+    ):
+        if trainable:
+            if (
+                optimizer_type != OptimizerType.OPTIMIZER_TYPE_SGD
+                and optimizer_type != OptimizerType.OPTIMIZER_TYPE_ADAM
+            ):
+                raise ValueError(
+                    "Please specify optimizer to be used to train LoRA module. Supported optimizers: SGD and Adam"
+                )
+            if init_lora_weights and len(target_modules) == 0:
+                raise ValueError(
+                    "Please specify target modules to be used to train LoRA module"
+                )
+            if not init_lora_weights and len(target_modules) > 0:
+                raise ValueError(
+                    "Target modules can only be specified when init_lora_weights=True"
+                )
+        else:
+            if init_lora_weights:
+                raise ValueError(
+                    "LORA weights initialization from scratch not supported in inference model"
+                )
+            if len(target_modules) > 0:
+                raise ValueError(
+                    "Target modules can only be specified when trainable=True"
+                )
+        
+        # Check rank, lora_alpha, lora_dropout values
+        if rank is not None or lora_alpha is not None or lora_dropout is not None:
+            if not trainable or not init_lora_weights:
+                raise ValueError(
+                    "rank, lora_alpha, and lora_dropout can only be set when trainable=True and init_lora_weights=True"
+                )
+        rank = rank if rank is not None else 8
+        lora_alpha = lora_alpha if lora_alpha is not None else 8.0
+        lora_dropout = lora_dropout if lora_dropout is not None else 0.0
+        
+        # If passed, check if the values of rank, lora_alpha, and lora_dropout are valid
+        if rank < 1 or type(rank) != int:
+            raise ValueError("Rank must be >= 1 and an integer")
+        if lora_alpha <= 0:
+            raise ValueError("Lora_alpha must be > 0")
+        if lora_dropout < 0 or lora_dropout > 1:
+            raise ValueError("Lora_dropout must be in the interval [0, 1]")
+        
+        self.ff_initialized = False
+        self._cache_folder = cache_folder
+        self._peft_model_id = peft_model_id
+        self._trainable = trainable
+        self._init_lora_weights = init_lora_weights
+        self._base_model_name_or_path = base_model_name_or_path
+        self._precision = precision
+        self._rank = rank
+        self._lora_alpha = lora_alpha
+        self._lora_dropout = lora_dropout
+        self._target_modules = target_modules
+        self.optimizer_type = optimizer_type
+        self.optimizer_kwargs = optimizer_kwargs
+
+    def ff_compile(self):
+        c_cache_folder = get_c_name(os.path.expanduser(self.cache_folder))
+        peft_model_id = get_c_name(self.peft_model_id)
+        base_model_name_or_path = get_c_name(self.base_model_name_or_path)
+        precision = get_c_name(self.precision)
+        c_target_modules = [
+            get_c_name(target_module) for target_module in self.target_modules
+        ]
+        c_optimizer_type = enum_to_int(OptimizerType, self.optimizer_type)
+        # SGD optional optimizer args
+        sgd_learning_rate = self.optimizer_kwargs.get("learning_rate", 0.001)
+        sgd_momentum = self.optimizer_kwargs.get("momentum", 0.0)
+        sgd_nesterov = self.optimizer_kwargs.get("nesterov", False)
+        sgd_weight_decay = self.optimizer_kwargs.get("weight_decay", 0.0)
+        # Adam optional optimizer args
+        adam_alpha = self.optimizer_kwargs.get("alpha", 0.001)
+        adam_beta1 = self.optimizer_kwargs.get("beta1", 0.9)
+        adam_beta2 = self.optimizer_kwargs.get("beta2", 0.999)
+        adam_weight_decay = self.optimizer_kwargs.get("weight_decay", 0.0)
+        adam_epsilon = self.optimizer_kwargs.get("epsilon", 1e-8)
+        self.handle = ffc().flexflow_lora_linear_config_create(
+            c_cache_folder,
+            peft_model_id,
+            self.trainable,
+            self.init_lora_weights,
+            base_model_name_or_path,
+            precision,
+            self.rank,
+            self.lora_alpha,
+            self.lora_dropout,
+            len(self.target_modules),
+            c_target_modules,
+            c_optimizer_type,
+            sgd_learning_rate,
+            sgd_momentum,
+            sgd_nesterov,
+            sgd_weight_decay,
+            adam_alpha,
+            adam_beta1,
+            adam_beta2,
+            adam_weight_decay,
+            adam_epsilon,
+        )
+        self._handle = ffi.gc(self.handle, ffc().flexflow_lora_linear_config_destroy)
+        self.ff_initialized = True
+
+    @classmethod
+    def from_jsonfile(self, jsonfile: str):
+        with open(jsonfile, "r") as file:
+            config = json.load(file)
+        config_dict = dict(config)
+        config_dict["optimizer_type"] = OptimizerType.OPTIMIZER_TYPE_SGD
+        return LoraLinearConfig(**config_dict)
+
+    def to_hf_config(self) -> LoraConfig:
+        return LoraConfig(
+            base_model_name_or_path=self.base_model_name_or_path,
+            r=self.rank,
+            target_modules=self.target_modules,
+            lora_alpha=self.lora_alpha,
+            lora_dropout=self.lora_dropout,
+        )
 
-        :param padding_h: the amount of implicit zero-paddings along the height: :math:`P_{H}`.
-        :type padding_h: int
+    @property
+    def cache_folder(self):
+        if self.ff_initialized:
+            c_cache_folder = ffc().flexflow_lora_linear_config_get_cache_folder(
+                self.handle
+            )
+            return ffi.string(c_cache_folder).decode("utf-8")
+        else:
+            return self._cache_folder
 
-        :param padding_w: the amount of implicit zero-paddings along the width: :math:`P_{W}`.
-        :type padding_w: int
+    @property
+    def peft_model_id(self):
+        if self.ff_initialized:
+            c_peft_model_id = ffc().flexflow_lora_linear_config_get_peft_model_id(
+                self.handle
+            )
+            return ffi.string(c_peft_model_id).decode("utf-8")
+        else:
+            return self._peft_model_id
 
-        :param activation: Tyoe of pooling function to use. If you don't specify anything, PoolType.POOL_MAX is applied.
-        :type activation: PoolType
+    @property
+    def rank(self):
+        if self.ff_initialized:
+            return ffc().flexflow_lora_linear_config_get_rank(self.handle)
+        else:
+            return self._rank
 
-        :param activation: Activation function to use. Default is ActiMode.AC_MODE_NONE.
-        :type activation: ActiMode
+    @property
+    def lora_alpha(self):
+        if self.ff_initialized:
+            return ffc().flexflow_lora_linear_config_get_lora_alpha(self.handle)
+        else:
+            return self._lora_alpha
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
+    @property
+    def lora_dropout(self):
+        if self.ff_initialized:
+            return ffc().flexflow_lora_linear_config_get_lora_dropout(self.handle)
+        else:
+            return self._lora_dropout
 
-        :returns:  Tensor -- the output tensor.
-        """
-        c_name = get_c_name(name)
-        c_pool_type = enum_to_int(PoolType, pool_type)
-        c_activation = enum_to_int(ActiMode, activation)
-        handle = ffc().flexflow_model_add_pool2d(
-            self.handle,
-            input.handle,
-            kernel_h,
-            kernel_w,
-            stride_h,
-            stride_w,
-            padding_h,
-            padding_w,
-            c_pool_type,
-            c_activation,
-            c_name,
-        )
-        self.add_layer(OpType.POOL2D, name)
-        return Tensor(handle, owner_op_type=OpType.POOL2D)
+    @property
+    def trainable(self):
+        if self.ff_initialized:
+            return ffc().flexflow_lora_linear_config_get_trainable(self.handle)
+        else:
+            return self._trainable
 
-    def batch_norm(self, input, relu=True, name=None):
-        """Layer that normalizes its inputs.
+    @property
+    def init_lora_weights(self):
+        if self.ff_initialized:
+            return ffc().flexflow_lora_linear_config_get_init_lora_weights(self.handle)
+        else:
+            return self._init_lora_weights
 
-        Batch normalization applies a transformation that maintains the mean output close to 0 and the output standard deviation close to 1.
+    @property
+    def base_model_name_or_path(self):
+        if self.ff_initialized:
+            c_base_model_name_or_path = (
+                ffc().flexflow_lora_linear_config_get_base_model_name_or_path(
+                    self.handle
+                )
+            )
+            return ffi.string(c_base_model_name_or_path).decode("utf-8")
+        else:
+            return self._base_model_name_or_path
 
-        :param input: the list of input Tensors.
-        :type input: Tensor
+    @property
+    def precision(self):
+        if self.ff_initialized:
+            c_precision = ffc().flexflow_lora_linear_config_get_precision(self.handle)
+            return ffi.string(c_precision).decode("utf-8")
+        else:
+            return self._precision
 
-        :param relu: whether a ReLU function is applied. Default is True.
-        :type relu: bool
+    @property
+    def target_modules(self):
+        if self.ff_initialized:
+            num_target_modules = ffi.new("int *")
+            c_target_modules = ffc().flexflow_lora_linear_config_get_target_modules(
+                self.handle, num_target_modules
+            )
+            target_modules = []
+            for i in range(num_target_modules[0]):
+                target_modules.append(ffi.string(c_target_modules[i]).decode("utf-8"))
+            return target_modules
+        else:
+            return self._target_modules
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
+    @cache_folder.setter
+    def cache_folder(self, value: str):
+        self._cache_folder = value
+        if self.ff_initialized:
+            ffc().flexflow_lora_linear_config_set_cache_folder(self.handle, value)
 
-        :returns:  Tensor -- the output tensor.
-        """
-        c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_batch_norm(
-            self.handle, input.handle, relu, c_name
-        )
-        self.add_layer(OpType.BATCH_NORM, name)
-        return Tensor(handle, owner_op_type=OpType.BATCH_NORM)
+    @peft_model_id.setter
+    def peft_model_id(self, value: str):
+        self._peft_model_id = value
+        if self.ff_initialized:
+            ffc().flexflow_lora_linear_config_set_peft_model_id(self.handle, value)
 
-    def layer_norm(
-        self, input, axes, elementwise_affine=True, eps=1e-5, use_bias=True, name=None
-    ):
-        """Add a LayerNorm layer
+    @rank.setter
+    def rank(self, value: int):
+        self._rank = value
+        if self.ff_initialized:
+            ffc().flexflow_lora_linear_config_set_rank(self.handle, value)
 
-        :param input: The input tensor
-        :type input: Tensor
-        :param axes: Indicate which axes (starting from the end) the LayerNorm should normalize over
-        :type axes: Union[int, List[int]]
-        :param elementwise_affine: Whether the LayerNorm should use the gamma weight for scaling, defaults to True
-        :type elementwise_affine: bool, optional
-        :param eps: A small float value added to the LayerNorm denominator for numerical stability, defaults to 1e-5
-        :type eps: float, optional
-        :param use_bias: Whether to add a beta bias to the LayerNorm result, defaults to True
-        :type use_bias: bool, optional
-        :param name: Name of the operator, also used for loading weights in inference mode, defaults to None
-        :type name: _type_, optional
-        :return: The LayerNorm output tensor
-        :rtype: Tensor
-        """
-        c_name = get_c_name(name)
-        c_axes = ffi.new("int[]", axes)
-        handle = ffc().flexflow_model_add_layer_norm(
-            self.handle,
-            input.handle,
-            len(axes),
-            c_axes,
-            elementwise_affine,
-            eps,
-            use_bias,
-            c_name,
-        )
-        self.add_layer(OpType.LAYER_NORM, name)
-        return Tensor(handle, owner_op_type=OpType.LAYER_NORM)
+    @lora_alpha.setter
+    def lora_alpha(self, value: float):
+        self._lora_alpha = value
+        if self.ff_initialized:
+            ffc().flexflow_lora_linear_config_set_lora_alpha(self.handle, value)
 
-    def residual_layer_norm(
-        self,
-        input,
-        residual1,
-        residual2,
-        use_two_residuals,
-        axes,
-        elementwise_affine=True,
-        eps=1e-5,
-        use_bias=True,
-        name=None,
-    ):
-        """Add a fused LayerNorm + Residual layer. This operator uses a single kernel, resulting in 
-        better efficiency compared to using separate element-wise add and LayerNorm operators.
+    @lora_dropout.setter
+    def lora_dropout(self, value: float):
+        self._lora_dropout = value
+        if self.ff_initialized:
+            ffc().flexflow_lora_linear_config_set_lora_dropout(self.handle, value)
 
-        :param input: The input tensor
-        :type input: Tensor
-        :param residual1: The residual tensor to add to the input before computing the LayerNorm
-        :type residual1: Tensor
-        :param residual2: An optional second residual tensor to add to the input (in addition to residual1) before computing the LayerNorm
-        :type residual2: Tensor
-        :param use_two_residuals: A boolean that should be set to True if using the second optional residual, False otherwise
-        :type use_two_residuals: bool
-        :param axes: Indicate which axes (starting from the end) the LayerNorm should normalize over
-        :type axes: List[int]
-        :param elementwise_affine: Whether the LayerNorm should use the gamma weight for scaling, defaults to True
-        :type elementwise_affine: bool, optional
-        :param eps: A small float value added to the LayerNorm denominator for numerical stability, defaults to 1e-5
-        :type eps: float, optional
-        :param use_bias: Whether to add a beta bias to the LayerNorm result, defaults to True
-        :type use_bias: bool, optional
-        :param name: Name of the operator, also used for loading weights in inference mode, defaults to None
-        :type name: str, optional
-        :return: A tensor with the sum of the input and residual(s), and the LayerNorm output
-        :rtype: (Tensor, Tensor)
-        """
-        c_name = get_c_name(name)
-        c_axes = ffi.new("int[]", axes)
-        residual2_handle = (
-            residual1.handle
-        )  # This is intentional. Data will be ignored, and we cannot pass None
-        if use_two_residuals:
-            assert residual2 is not None
-            residual2_handle = residual2.handle
-        handles_array = ffc().flexflow_model_add_residual_layer_norm(
-            self.handle,
-            input.handle,
-            residual1.handle,
-            residual2_handle,
-            use_two_residuals,
-            len(axes),
-            c_axes,
-            elementwise_affine,
-            eps,
-            use_bias,
-            c_name,
-        )
-        self.add_layer(OpType.RESIDUAL_LAYERNORM, name)
-        return Tensor(
-            handles_array[0], owner_op_type=OpType.RESIDUAL_LAYERNORM
-        ), Tensor(handles_array[1], owner_op_type=OpType.RESIDUAL_LAYERNORM)
+    @trainable.setter
+    def trainable(self, value: bool):
+        self._trainable = value
+        if self.ff_initialized:
+            ffc().flexflow_lora_linear_config_set_trainable(self.handle, value)
 
-    def add_bias_residual_layer_norm(
-        self,
-        input,
-        residual,
-        axes,
-        elementwise_affine=True,
-        eps=1e-5,
-        use_bias=True,
-        name=None,
-    ):
-        """Add a Attention Bias + Residual + LayerNorm layer. This operator uses a single kernel, 
-        resulting in better efficiency compared to using separate attention bias addition + 
-        element-wise residual addition + LayerNorm operators.
+    @init_lora_weights.setter
+    def init_lora_weights(self, value: bool):
+        self._init_lora_weights = value
+        if self.ff_initialized:
+            ffc().flexflow_lora_linear_config_set_init_lora_weights(self.handle, value)
 
-        :param input: The input tensor
-        :type input: Tensor
-        :param residual: The residual tensor
-        :type residual: Tensor
-        :param axes: Indicate which axes (starting from the end) the LayerNorm should normalize over
-        :type axes: Union[int, List[int]]
-        :param elementwise_affine: Whether the LayerNorm should use the gamma weight for scaling, defaults to True
-        :type elementwise_affine: bool, optional
-        :param eps: A small float value added to the LayerNorm denominator for numerical stability, defaults to 1e-5
-        :type eps: float, optional
-        :param use_bias: Whether to add a beta bias to the LayerNorm result, defaults to True
-        :type use_bias: bool, optional
-        :param name: Name of the operator, also used for loading weights in inference mode, defaults to None
-        :type name: _type_, optional
-        :return: A tensor with the sum of the attention bias, input and residual(s), and the LayerNorm output
-        :rtype: (Tensor, Tensor)
-        """
-        c_name = get_c_name(name)
-        c_axes = ffi.new("int[]", axes)
-        handles_array = ffc().flexflow_model_add_add_bias_residual_layer_norm(
-            self.handle,
-            input.handle,
-            residual.handle,
-            len(axes),
-            c_axes,
-            elementwise_affine,
-            eps,
-            use_bias,
-            c_name,
-        )
-        self.add_layer(OpType.ADD_BIAS_RESIDUAL_LAYERNORM, name)
-        return Tensor(
-            handles_array[0], owner_op_type=OpType.ADD_BIAS_RESIDUAL_LAYERNORM
-        ), Tensor(handles_array[1], owner_op_type=OpType.ADD_BIAS_RESIDUAL_LAYERNORM)
 
-    def sigmoid_silu_multi(self, input1, input2, name=None):
-        c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_sigmoid_silu_multi(
-            self.handle, input1.handle, input2.handle, c_name
-        )
-        self.add_layer(OpType.SIGMOID_SILU_MULTI, name)
-        return Tensor(handle, owner_op_type=OpType.SIGMOID_SILU_MULTI)
+# -----------------------------------------------------------------------
+# PEFTModelID
+# -----------------------------------------------------------------------
 
-    def batch_matmul(
-        self, A, B, a_seq_length_dim=None, b_seq_length_dim=None, name=None
-    ):
-        """Layer that applied batched matrix multiplication onto two input Tensors, :attr:`output = x * y`.
 
-        :param A: the first input Tensor.
-        :type A: Tensor
+class PEFTModelID(object):
+    __slots__ = ["handle", "_handle"]
 
-        :param B: the second input Tensor.
-        :type B: Tensor
+    __no_id_h = None
 
-        :param a_seq_length_dim: an int when set indicating the a_seq_length_dim dimention of A is a sequence_length dimension
-        :type a_seq_length_dim: int
+    def __init__(self, id=None):
+        if id is None:
+            self.handle = ffc().flexflow_peft_model_id_create()
+        else:
+            self.handle = ffc().flexflow_peft_model_id_create_id(id)
+        self._handle = ffi.gc(self.handle, ffc().flexflow_peft_model_id_destroy)
 
-        :param b_seq_length_dim: an int when set indicating the b_seq_length_dim dimention of B is a sequence_length dimension
-        :type b_seq_length_dim: int
+    @staticmethod
+    def no_id_handle():
+        if PEFTModelID.__no_id_h is None:
+            PEFTModelID.__no_id_h = ffc().flexflow_peft_model_id_no_id()
+        return PEFTModelID.__no_id_h
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
 
-        :param name:  Whether to add use bias in layer normalization
-        :type name: bool
+# -----------------------------------------------------------------------
+# Request
+# -----------------------------------------------------------------------
 
-        :returns:  Tensor -- the output tensor.
-        """
-        if a_seq_length_dim is None:
-            a_seq_length_dim = -1
-        if b_seq_length_dim is None:
-            b_seq_length_dim = -1
-        handle = ffc().flexflow_model_add_batch_matmul(
-            self.handle, A.handle, B.handle, a_seq_length_dim, b_seq_length_dim
-        )
-        self.add_layer(OpType.BATCH_MATMUL, name)
-        return Tensor(handle, owner_op_type=OpType.BATCH_MATMUL)
 
-    def dense(
+class Request:
+    """A class to record the metadata of an inference or finetuning request."""
+
+    def __init__(
         self,
-        input,
-        out_dim,
-        activation=ActiMode.AC_MODE_NONE,
-        use_bias=True,
-        datatype=DataType.DT_NONE,
-        shared_op=None,
-        kernel_initializer=None,
-        bias_initializer=None,
-        kernel_regularizer=None,
-        name=None,
+        req_type: RequestType,
+        prompt: str = None,
+        max_sequence_length: int = 128,
+        peft_model_id: PEFTModelID = None,
+        dataset_filepath: str = None,
+        max_training_steps: int = 1,
     ):
-        """Dense implements the operation: :attr:`output = activation(dot(input, kernel) + bias)` where
-        :attr:`activation` is the element-wise activation function passed as the activation argument,
-        :attr:`kernel` is a weights matrix created by the layer, and
-        :attr:`bias` is a bias vector created by the layer (only applicable if :attr:`use_bias` is True).
+        self.req_type = req_type
+        self.prompt = prompt
+        self.max_sequence_length = max_sequence_length
+        self.peft_model_id = peft_model_id
+        self.dataset_filepath = dataset_filepath
+        self.max_training_steps = max_training_steps
 
-        The size of input tensor is :math:`(N, C_{in})` and the size of output tensor
-        is :math:`(N, C_{out})`, where :math:`C_{out} = out\_dim`
-
-        :param input: the input Tensor.
-        :type input: Tensor
 
-        :param out\_dim: dimensionality of the output space.
-        :type out\_dim: int
+# -----------------------------------------------------------------------
+# FFModel
+# -----------------------------------------------------------------------
 
-        :param activation: Activation function to use. Default is ActiMode.AC_MODE_NONE.
-        :type activation: ActiMode
 
-        :param use_bias: whether the layer uses a bias vector. Default is True.
-        :type use_bias: bool
+class FFModel(object):
+    """ """
 
-        :param shared_op: the layer whose parameters are shared with. Default is None.
-        :type shared_op: Op
+    __slots__ = [
+        "handle",
+        "_handle",
+        "_layers",
+        "_nb_layers",
+        "_ffconfig",
+        "_tracing_id",
+        "initializers",
+        "attr_tensors",
+    ]
 
-        :param kernel_initializer: Initializer for the kernel weights matrix. If it is set to None, the GlorotUniformInitializer is applied.
-        :type kernel_initializer: Initializer
+    def __init__(self, ffconfig):
+        """Constructor of FFModel.
 
-        :param bias_initializer: Initializer for the bias vector. If it is set to None, the ZeroInitializer is applied.
-        :type bias_initializer: Initializer
+        :param ffconfig: configurations of FlexFlow and the created model.
+        :type ffconfig: FFConfig
 
-        :param kernel_regularizer: Regularizer for the kernel weights matrix
-        :type bias_initializer: Regularizer
+        :returns:  FFModel -- the model.
+        """
+        self.handle = ffc().flexflow_model_create(ffconfig.handle, ffconfig.cpu_offload)
+        self._handle = ffi.gc(self.handle, ffc().flexflow_model_destroy)
+        self._layers = dict()
+        self._nb_layers = 0
+        self._ffconfig = ffconfig
+        global ff_tracing_id
+        self._tracing_id = ff_tracing_id
+        ff_tracing_id += 1
+        self.initializers = {}
+        self.attr_tensors = {}
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
+    def get_layers(self):
+        return self._layers
 
-        :returns:  Tensor -- the output tensor.
-        """
-        c_name = get_c_name(name)
-        shared_op_handle = self.__get_op_handle(shared_op)
-        c_activation = enum_to_int(ActiMode, activation)
-        c_datatype = enum_to_int(DataType, datatype)
-        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-        bias_init_handle = self.__get_initializer_handle(bias_initializer)
-        if kernel_regularizer:
-            c_kernel_reg_type = enum_to_int(RegularizerMode, kernel_regularizer.type)
-            kernel_reg_lambda = kernel_regularizer._lambda
-        else:
-            c_kernel_reg_type = enum_to_int(
-                RegularizerMode, RegularizerMode.REG_MODE_NONE
-            )
-            kernel_reg_lambda = 0.0
-        handle = ffc().flexflow_model_add_dense(
-            self.handle,
-            input.handle,
-            out_dim,
-            c_activation,
-            use_bias,
-            c_datatype,
-            shared_op_handle,
-            kernel_init_handle,
-            bias_init_handle,
-            c_kernel_reg_type,
-            kernel_reg_lambda,
-            c_name,
+    def add_layer(self, op_type, name):
+        layer_id = self._nb_layers
+        op_handle = ffc().flexflow_model_get_last_layer(self.handle)
+        self._layers[self._nb_layers] = convert_op_handle_to_op(
+            op_type, op_handle, idx=layer_id, name=name
         )
-        self.add_layer(OpType.LINEAR, name)
-        return Tensor(handle, owner_op_type=OpType.LINEAR)
-
-    def concat(self, tensors, axis, name=None):
-        """Layer that concatenates a list of inputs.
+        self._nb_layers += 1
 
-        It takes as input a list of tensors, all of the same shape except for the concatenation axis, and returns a single tensor that is the concatenation of all inputs.
+    def create_tensor(self, dims, data_type, create_grad=True):
+        """Instantiate a FlexFlow tensor.
 
-        :param input: the list of input Tensors.
-        :type input: List of Tensors
+        :param x: a shape tuple/list (integers), including the batch size.
+        :type x: list of int
 
-        :param axis: the dimension along which to concatenate.
-        :type axis: int
+        :param data_type: the datatype of the created tensor. Options are
+          DT_FLOAT, DT_DOUBLE, DT_INT32, DT_INT64, DT_BOOLEAN.
+        :type data_type: DataType
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
+        :param create_grad: weather the tensor creates a gradients vector.
+          If you don't specify anything, a gradients vector is used.
+        :type create_grad: bool
 
         :returns:  Tensor -- the output tensor.
         """
-        assert type(tensors) is list, "tensors should be a list"
-        tensor_handle_list = []
-        n = len(tensors)
-        assert n <= 256, "Please increase MAX_NUM_INPUTS"
-        for tensor in tensors:
-            tensor_handle_list.append(tensor.handle)
-        c_tensor_handle_list = ffi.new("flexflow_tensor_t[]", tensor_handle_list)
-        c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_concat(
-            self.handle, n, c_tensor_handle_list, axis, c_name
+        c_dims = ffi.new("int[]", dims)
+        c_data_type = enum_to_int(DataType, data_type)
+        num_dims = len(dims)
+        handle = ffc().flexflow_tensor_create(
+            self.handle, num_dims, c_dims, c_data_type, create_grad
         )
-        self.add_layer(OpType.CONCAT, name)
-        return Tensor(handle, owner_op_type=OpType.CONCAT)
+        return Tensor(handle)
 
-    def split(self, input, sizes, axis, name=None):
-        """Layer that splits a :attr:`input` tensor into a list of tensors.
+    def map_tensor(self, tensor, parallel_op=None):
+        op_handle = self.__get_op_handle(parallel_op)
+        ffc().flexflow_tensor_map(self.handle, tensor.handle, op_handle)
 
-        :param input: the input Tensor.
-        :type input: Tensor
+    def create_constant(self, dims, value, data_type):
+        c_dims = ffi.new("int[]", dims)
+        c_data_type = enum_to_int(DataType, data_type)
+        num_dims = len(dims)
+        handle = ffc().flexflow_constant_create(
+            self.handle, num_dims, c_dims, value, c_data_type
+        )
+        return Tensor(handle)
 
-        :param sizes: either an int indicating the number of splits along axis or a Python list containing the sizes of each output tensor along axis. If a scalar, then it must evenly divide :attr:`input.dims[axis]`; otherwise the sum of sizes along the split axis must match that of the :attr:`input`.
-        :type sizes: int or list of int
+    def exp(self, x, name=None):
+        """Exponential activation function.
 
-        :param axis: the dimension along which to split.
-        :type axis: int
+        :param x: the input Tensor.
+        :type x: Tensor
 
         :param name: the name of the layer. Default is None.
         :type name: string
 
-        :returns:  list of Tensors -- the output tensors.
+        :returns:  Tensor -- the output tensor.
         """
-        if type(sizes) is list:
-            split = sizes
-        else:
-            assert input.dims[axis] % sizes == 0, "Split dimension is not divisible"
-            split = [input.dims[axis] // sizes for i in range(sizes)]
-        n = len(split)
-        assert n <= 256, "Please increase MAX_NUM_OUTPUTS"
-        c_split = ffi.new("int[]", split)
-        c_outputs_handle_list = ffi.new("flexflow_tensor_t[256]")
         c_name = get_c_name(name)
-        ffc().flexflow_model_add_split(
-            self.handle, input.handle, n, c_outputs_handle_list, c_split, axis, c_name
-        )
-        output_tensor_list = []
-        for i in range(n):
-            tensor_p_handle = ffi.new("flexflow_tensor_t*")
-            tensor_p_handle.impl = c_outputs_handle_list[i].impl
-            output_tensor_list.append(
-                Tensor(None, owner_op_type=OpType.SPLIT, p_handle=tensor_p_handle)
-            )
-        self.add_layer(OpType.SPLIT, name)
-        del c_outputs_handle_list
-        return output_tensor_list
+        handle = ffc().flexflow_model_add_exp(self.handle, x.handle, c_name)
+        self.add_layer(OpType.EXP, name)
+        return Tensor(handle, owner_op_type=OpType.EXP)
 
-    def flat(self, input, name=None):
-        """Flattens the input. Does not affect the batch size.
+    def sin(self, x, name=None):
+        """Elementwise sine function.
 
-        :param input: the input Tensor.
-        :type input: Tensor
+        :param x: the input Tensor.
+        :type x: Tensor
 
         :param name: the name of the layer. Default is None.
         :type name: string
@@ -2253,15 +2184,15 @@ def flat(self, input, name=None):
         :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_flat(self.handle, input.handle, c_name)
-        self.add_layer(OpType.FLAT, name)
-        return Tensor(handle, owner_op_type=OpType.FLAT)
+        handle = ffc().flexflow_model_add_sin(self.handle, x.handle, c_name)
+        self.add_layer(OpType.SIN, name)
+        return Tensor(handle, owner_op_type=OpType.SIN)
 
-    def softmax(self, input, axis=-1, name=None):
-        """Softmax activation function.
+    def cos(self, x, name=None):
+        """Elementwise cosine function.
 
-        :param input: the input Tensor.
-        :type input: Tensor
+        :param x: the input Tensor.
+        :type x: Tensor
 
         :param name: the name of the layer. Default is None.
         :type name: string
@@ -2269,23 +2200,18 @@ def softmax(self, input, axis=-1, name=None):
         :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_softmax(
-            self.handle, input.handle, axis, c_name
-        )
-        self.add_layer(OpType.SOFTMAX, name)
-        return Tensor(handle, owner_op_type=OpType.SOFTMAX)
-
-    def reshape(self, input, shape, name=None):
-        """Layer that reshapes inputs into the given shape.
+        handle = ffc().flexflow_model_add_cos(self.handle, x.handle, c_name)
+        self.add_layer(OpType.COS, name)
+        return Tensor(handle, owner_op_type=OpType.COS)
 
-        Given a :attr:`input` tensor, this operation returns a output tensor that has the same values as tensor in the same order,
-        except with a new shape given by :attr:`shape`.
+    def add(self, x, y, inplace_a=False, name=None):
+        """Layer that adds two input Tensors, :attr:`output = x + y`.
 
-        :param input: the input Tensor.
-        :type input: Tensor
+        :param x: the first input Tensor.
+        :type x: Tensor
 
-        :param shape: A list defining the shape of the output tensor.
-        :type shape: list of int
+        :param y: the second input Tensor.
+        :type y: Tensor
 
         :param name: the name of the layer. Default is None.
         :type name: string
@@ -2293,45 +2219,41 @@ def reshape(self, input, shape, name=None):
         :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
-        c_shape = ffi.new("int[]", shape)
-        handle = ffc().flexflow_model_add_reshape(
-            self.handle, input.handle, len(shape), c_shape, c_name
+        handle = ffc().flexflow_model_add_add(
+            self.handle, x.handle, y.handle, inplace_a, c_name
         )
-        self.add_layer(OpType.RESHAPE, name)
-        return Tensor(handle, owner_op_type=OpType.RESHAPE)
-
-    def gather(self, input, index, dim, name=None):
-        """Layer that gathers values along the dim axis.
+        self.add_layer(OpType.ADD, name)
+        return Tensor(handle, owner_op_type=OpType.ADD)
 
-        :param input: the input tensor
-        :type input: Tensor
+    def subtract(self, x, y, inplace_a=False, name=None):
+        """Layer that subtracts two input Tensors, :attr:`output = x * y`.
 
-        :param index: the index tensor, which specifies the indices of elements to gather
-        :type index: Tensor
+        :param x: the first input Tensor.
+        :type x: Tensor
 
-        :param dim: the axis along which to index
-        :type dim: int
+        :param y: the second input Tensor.
+        :type y: Tensor
 
-        :param name: the name of the layer. Default is None
+        :param name: the name of the layer. Default is None.
         :type name: string
 
-        :returns: Tensor -- the output tensor
+        :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_gather(
-            self.handle, input.handle, index.handle, dim, c_name
+        handle = ffc().flexflow_model_add_subtract(
+            self.handle, x.handle, y.handle, inplace_a, c_name
         )
-        self.add_layer(OpType.GATHER, name)
-        return Tensor(handle, owner_op_type=OpType.GATHER)
+        self.add_layer(OpType.SUBTRACT, name)
+        return Tensor(handle, owner_op_type=OpType.SUBTRACT)
 
-    def transpose(self, input, perm, name=None):
-        """Transposes the :attr:`input` tensor. Permutes the dimensions according to perm
+    def multiply(self, x, y, inplace_a=False, name=None):
+        """Layer that multiplies (element-wise) two input Tensors, :attr:`output = x * y`.
 
-        :param input: the input Tensor.
-        :type input: Tensor
+        :param x: the first input Tensor.
+        :type x: Tensor
 
-        :param perm: A permutation of the dimensions of a.
-        :type perm: List of int
+        :param y: the second input Tensor.
+        :type y: Tensor
 
         :param name: the name of the layer. Default is None.
         :type name: string
@@ -2339,23 +2261,20 @@ def transpose(self, input, perm, name=None):
         :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
-        c_perm = ffi.new("int[]", perm)
-        handle = ffc().flexflow_model_add_transpose(
-            self.handle, input.handle, len(perm), c_perm, c_name
+        handle = ffc().flexflow_model_add_multiply(
+            self.handle, x.handle, y.handle, inplace_a, c_name
         )
-        self.add_layer(OpType.TRANSPOSE, name)
-        return Tensor(handle, owner_op_type=OpType.TRANSPOSE)
-
-    def reverse(self, input, axis, name=None):
-        """Layer that reverses specific dimensions of a tensor.
+        self.add_layer(OpType.MULTIPLY, name)
+        return Tensor(handle, owner_op_type=OpType.MULTIPLY)
 
-        Given a :attr:`input` tensor, this operation reverses the dimension :attr:`axis`.
+    def divide(self, x, y, inplace_a=False, name=None):
+        """Layer that divides (element-wise) two input Tensors, :attr:`output = x / y`.
 
-        :param input: the input Tensor.
-        :type input: Tensor
+        :param x: the first input Tensor.
+        :type x: Tensor
 
-        :param axis: the dimension to reverse.
-        :type axis: int
+        :param y: the second input Tensor.
+        :type y: Tensor
 
         :param name: the name of the layer. Default is None.
         :type name: string
@@ -2363,20 +2282,20 @@ def reverse(self, input, axis, name=None):
         :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_reverse(
-            self.handle, input.handle, axis, c_name
+        handle = ffc().flexflow_model_add_divide(
+            self.handle, x.handle, y.handle, inplace_a, c_name
         )
-        self.add_layer(OpType.REVERSE, name)
-        return Tensor(handle, owner_op_type=OpType.REVERSE)
+        self.add_layer(OpType.DIVIDE, name)
+        return Tensor(handle, owner_op_type=OpType.DIVIDE)
 
-    def scalar_multiply(self, input, scalar, inplace=True, name=None):
-        """Scalar multiplication of a tensor by an scalar.
+    def max(self, x, y, inplace_a=False, name=None):
+        """Layer that computes the max (element-wise) two input Tensors, :attr:`output = max(x,y)`.
 
-        :param input: the input Tensor.
-        :type input: Tensor
+        :param x: the first input Tensor.
+        :type x: Tensor
 
-        :param input: the scalar
-        :type scalar: float
+        :param y: the second input Tensor.
+        :type y: Tensor
 
         :param name: the name of the layer. Default is None.
         :type name: string
@@ -2384,20 +2303,20 @@ def scalar_multiply(self, input, scalar, inplace=True, name=None):
         :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_scalar_multiply(
-            self.handle, input.handle, scalar, inplace, c_name
+        handle = ffc().flexflow_model_add_max(
+            self.handle, x.handle, y.handle, inplace_a, c_name
         )
-        self.add_layer(OpType.SCALAR_MULTIPLY, name)
-        return Tensor(handle, owner_op_type=OpType.SCALAR_MULTIPLY)
+        self.add_layer(OpType.MAX, name)
+        return Tensor(handle, owner_op_type=OpType.MAX)
 
-    def scalar_add(self, input, scalar, inplace=True, name=None):
-        """Scalar addition of a scalar to each entry of a tensor.
+    def min(self, x, y, inplace_a=False, name=None):
+        """Layer that computes the min (element-wise) two input Tensors, :attr:`output = min(x,y)`.
 
-        :param input: the input Tensor.
-        :type input: Tensor
+        :param x: the first input Tensor.
+        :type x: Tensor
 
-        :param input: the scalar
-        :type scalar: float
+        :param y: the second input Tensor.
+        :type y: Tensor
 
         :param name: the name of the layer. Default is None.
         :type name: string
@@ -2405,20 +2324,20 @@ def scalar_add(self, input, scalar, inplace=True, name=None):
         :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_scalar_add(
-            self.handle, input.handle, scalar, inplace, c_name
+        handle = ffc().flexflow_model_add_min(
+            self.handle, x.handle, y.handle, inplace_a, c_name
         )
-        self.add_layer(OpType.SCALAR_ADD, name)
-        return Tensor(handle, owner_op_type=OpType.SCALAR_ADD)
+        self.add_layer(OpType.MIN, name)
+        return Tensor(handle, owner_op_type=OpType.MIN)
 
-    def scalar_sub(self, input, scalar, inplace=True, name=None):
-        """Scalar subtraction of a scalar to each entry of a tensor.
+    def reduce_sum(self, input, axes, keepdims=False, name=None):
+        """Layer that computes the sum of the input Tensor along given axes.
 
         :param input: the input Tensor.
         :type input: Tensor
 
-        :param input: the scalar
-        :type scalar: float
+        :param axes: the axes along which reduction is applied
+        :type axes: List[int]
 
         :param name: the name of the layer. Default is None.
         :type name: string
@@ -2426,215 +2345,234 @@ def scalar_sub(self, input, scalar, inplace=True, name=None):
         :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_scalar_sub(
-            self.handle, input.handle, scalar, inplace, c_name
+        c_axes = ffi.new("int[]", axes)
+        handle = ffc().flexflow_model_add_reduce_sum(
+            self.handle, input.handle, c_axes, len(axes), keepdims, c_name
         )
-        self.add_layer(OpType.SCALAR_SUB, name)
-        return Tensor(handle, owner_op_type=OpType.SCALAR_SUB)
+        self.add_layer(OpType.REDUCE_SUM, name)
+        return Tensor(handle, owner_op_type=OpType.REDUCE_SUM)
 
-    def scalar_true_divide(self, input, scalar, inplace=True, name=None):
-        """Scalar regular division of a tensor by an scalar.
+    def rsqrt(self, input, name=None):
+        """Layer that computes the element-wise reciprocal square-root.
 
         :param input: the input Tensor.
         :type input: Tensor
 
-        :param input: the scalar
-        :type scalar: float
-
         :param name: the name of the layer. Default is None.
         :type name: string
 
         :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_scalar_truediv(
-            self.handle, input.handle, scalar, inplace, c_name
-        )
-        self.add_layer(OpType.SCALAR_TRUEDIV, name)
-        return Tensor(handle, owner_op_type=OpType.SCALAR_TRUEDIV)
+        handle = ffc().flexflow_model_add_rsqrt(self.handle, input.handle, c_name)
+        self.add_layer(OpType.RSQRT, name)
+        return Tensor(handle, owner_op_type=OpType.RSQRT)
 
-    def gelu(self, input, inplace=True, name=None):
-        """Gaussian Error Linear Unit activation function.
+    def pow(self, input, exponent, name=None):
+        """Layer that computes the element-wise power.
 
         :param input: the input Tensor.
         :type input: Tensor
 
+        :param exponent: exponent to raise each element in the input tensor.
+        :type exponent: float
+
         :param name: the name of the layer. Default is None.
         :type name: string
 
         :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_gelu(self.handle, input.handle, c_name)
-        self.add_layer(OpType.GELU, name)
-        return Tensor(handle, owner_op_type=OpType.GELU)
+        handle = ffc().flexflow_model_add_pow(
+            self.handle, input.handle, exponent, c_name
+        )
+        self.add_layer(OpType.POW, name)
+        return Tensor(handle, owner_op_type=OpType.POW)
 
-    def relu(self, input, inplace=True, name=None):
-        """Rectified Linear Unit activation function.
+    def mean(self, input, dims, keepdims=False, name=None):
+        """Layer that computes the mean of the input tensor across the given
+        dimensions.
 
         :param input: the input Tensor.
         :type input: Tensor
 
+        :param dims: dimensions to take the mean over.
+        :type dims: list
+
+        :param keepdims: keeps the dimensions in :attr:`dims` as size 1 if True and
+                         collapses the dimension if False. Default is False.
+        :type keepdims: bool
+
         :param name: the name of the layer. Default is None.
         :type name: string
 
         :returns:  Tensor -- the output tensor.
         """
+        dims = list(dims)
+        c_dims = ffi.new("int[]", dims)
         c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_relu(
-            self.handle, input.handle, inplace, c_name
+        handle = ffc().flexflow_model_add_mean(
+            self.handle, input.handle, c_dims, len(dims), keepdims, c_name
         )
-        self.add_layer(OpType.RELU, name)
-        return Tensor(handle, owner_op_type=OpType.RELU)
+        self.add_layer(OpType.MEAN, name)
+        return Tensor(handle, owner_op_type=OpType.MEAN)
 
-    def identity(self, input, name=None):
-        """Identity function.
+    def conv2d(
+        self,
+        input,
+        out_channels,
+        kernel_h,
+        kernel_w,
+        stride_h,
+        stride_w,
+        padding_h,
+        padding_w,
+        activation=ActiMode.AC_MODE_NONE,
+        groups=1,
+        use_bias=True,
+        shared_op=None,
+        kernel_initializer=None,
+        bias_initializer=None,
+        name=None,
+    ):
+        """This layer creates a 2D convolution kernel that is convolved with the layer :attr:`input`
+        to produce a tensor of :attr:`output`.
 
-        :param input: the input Tensor.
-        :type input: Tensor
+        The size of input tensor is :math:`(N, C_{in}, H, W)` and the size of output tensor
+        is :math:`(N, C_{out}, H_{out}, W_{out})`, which can be calculated by:
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
+        .. math::
+          C_{out} = out\_channels
 
-        :returns:  Tensor -- the output tensor.
-        """
-        c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_identity(self.handle, input.handle, c_name)
-        self.add_layer(OpType.IDENTITY, name)
-        return Tensor(handle, owner_op_type=OpType.IDENTITY)
+        .. math::
+          K_{H} = kernel\_h
 
-    def sigmoid(self, input, name=None):
-        """Sigmoid activation function, :math:`sigmoid(x) = 1 / (1 + exp(-x))`.
+        .. math::
+          K_{W} = kernel\_w
 
-        :param input: the input Tensor.
-        :type input: Tensor
+        .. math::
+          S_{H} = stride\_h
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
+        .. math::
+          S_{W} = stride\_w
 
-        :returns:  Tensor -- the output tensor.
-        """
-        c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_sigmoid(self.handle, input.handle, c_name)
-        self.add_layer(OpType.SIGMOID, name)
-        return Tensor(handle, owner_op_type=OpType.SIGMOID)
+        .. math::
+          P_{H} = padding\_h
 
-    def tanh(self, input, name=None):
-        """Hyperbolic tangent activation function.
+        .. math::
+          P_{S} = padding\_s
+
+        .. math::
+          H_{out} = (H - K_{H} + 2 * P_{H}) / S_{H} + 1
+
+        .. math::
+          W_{out} = (W - K_{W} + 2 * P_{W}) / S_{W} + 1
 
         :param input: the input Tensor.
         :type input: Tensor
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
+        :param out\_channels: the dimensionality of the output space (i.e. the number of output filters in the convolution).
+        :type out\_channels: int
 
-        :returns:  Tensor -- the output tensor.
-        """
-        c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_tanh(self.handle, input.handle, c_name)
-        self.add_layer(OpType.TANH, name)
-        return Tensor(handle, owner_op_type=OpType.TANH)
+        :param kernel_h: the height of the 2D convolution window: :math:`K_{H}`.
+        :type kernel_h: int
 
-    def elu(self, input, inplace=True, name=None):
-        """Exponential Linear Unit. activation function.
+        :param kernel_w: the width of the 2D convolution window: :math:`K_{W}`.
+        :type kernel_w: int
 
-        :param input: the input Tensor.
-        :type input: Tensor
+        :param stride_h: the stride of the convolution along the height: :math:`S_{H}`.
+        :type stride_h: int
 
-        :param name: the name of the layer. Default is None.
-        :type name: string
+        :param stride_w: the stride of the convolution along the width: :math:`S_{W}`.
+        :type stride_w: int
 
-        :returns:  Tensor -- the output tensor.
-        """
-        c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_elu(
-            self.handle, input.handle, inplace, c_name
-        )
-        self.add_layer(OpType.ELU, name)
-        return Tensor(handle, owner_op_type=OpType.ELU)
+        :param padding_h: the amount of implicit zero-paddings along the height: :math:`P_{H}`.
+        :type padding_h: int
 
-    def dropout(self, input, rate, seed, name=None):
-        """The Dropout layer randomly sets input units to 0 with
-        a frequency of :attr:`rate` at each step during training time,
-        which helps prevent overfitting.
-        Inputs not set to 0 are scaled up by 1/(1 - rate) such that the
-        sum over all inputs is unchanged.
+        :param padding_w: the amount of implicit zero-paddings along the width: :math:`P_{W}`.
+        :type padding_w: int
 
-        :param input: the input Tensor.
-        :type input: Tensor
+        :param activation: Activation function to use. Default is ActiMode.AC_MODE_NONE.
+        :type activation: ActiMode
 
-        :param rate: Fraction of the input units to drop.
-        :type rate: float(0-1)
+        :param groups: the number of groups in this convolution
+        :type groups: int
 
-        :param seed: random seed.
-        :type seed: int
+        :param use_bias: whether the layer uses a bias vector. Default is True.
+        :type use_bias: bool
+
+        :param shared_op: the layer whose parameters are shared with. Default is None.
+        :type shared_op: Op
+
+        :param kernel_initializer: Initializer for the kernel weights matrix. If it is set to None, the GlorotUniformInitializer is applied.
+        :type kernel_initializer: Initializer
+
+        :param bias_initializer: Initializer for the bias vector. If it is set to None, the ZeroInitializer is applied.
+        :type bias_initializer: Initializer
 
         :param name: the name of the layer. Default is None.
         :type name: string
 
         :returns:  Tensor -- the output tensor.
         """
+        shared_op_handle = self.__get_op_handle(shared_op)
+        c_activation = enum_to_int(ActiMode, activation)
+        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+        bias_init_handle = self.__get_initializer_handle(bias_initializer)
         c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_dropout(
-            self.handle, input.handle, rate, seed, c_name
+        handle = ffc().flexflow_model_add_conv2d(
+            self.handle,
+            input.handle,
+            out_channels,
+            kernel_h,
+            kernel_w,
+            stride_h,
+            stride_w,
+            padding_h,
+            padding_w,
+            c_activation,
+            groups,
+            use_bias,
+            shared_op_handle,
+            kernel_init_handle,
+            bias_init_handle,
+            c_name,
         )
-        self.add_layer(OpType.DROPOUT, name)
-        return Tensor(handle, owner_op_type=OpType.DROPOUT)
+        self.add_layer(OpType.CONV2D, name)
+        return Tensor(handle, owner_op_type=OpType.CONV2D)
 
-    def multihead_attention(
+    def embedding(
         self,
-        query,
-        key,
-        value,
-        embed_dim,
-        num_heads,
-        kdim=0,
-        vdim=0,
-        dropout=0.0,
-        bias=True,
-        add_bias_kv=False,
-        add_zero_attn=False,
+        input,
+        num_embeddings,
+        embedding_dim,
+        aggr,
+        dtype=DataType.DT_FLOAT,
+        shared_op=None,
         kernel_initializer=None,
         name=None,
     ):
-        """Defines the MultiHead Attention operation as described in Attention Is All You Need
-        which takes in the tensors :attr:`query`, :attr:`key`, and :attr:`value`,
-        and returns the dot-product attention between them:.
-
-        :param query: the query Tensor.
-        :type query: Tensor
-
-        :param key: the key Tensor.
-        :type key: Tensor
-
-        :param value: the value Tensor.
-        :type value: Tensor
-
-        :param embed_dim: total dimension of the model
-        :type embed_dim: int
-
-        :param num_heads: Number of attention heads.
-        :type num_heads: int
+        """Layer that turns positive integers into dense vectors of fixed size
 
-        :param kdim: total number of features in key. Default is 0
-        :type kdim: int
+        :param input: the input Tensor.
+        :type input: Tensor
 
-        :param vdim: total number of features in value. Default is 0
-        :type vdim: int
+        :param num_embeddings: size of the vocabulary, i.e. maximum integer index + 1
+        :type num_embeddings: int
 
-        :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
-        :type dropout: float(0-1)
+        :param embedding_dim: dimension of the dense embedding.
+        :type embedding_dim: int
 
-        :param bias: Whether the dense layers use bias vectors. Default is True.
-        :type bias: bool
+        :param aggr: aggregation mode. Options are AGGR_MODE_NONE, AGGR_MODE_SUM and AGGR_MODE_AVG.
+        :type aggr: AggrMode
 
-        :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
-        :type add_bias_kv: bool
+        :param dtype: the tensor data type. Options are DT_BOOLEAN, DT_INT32, DT_INT64, DT_HALF, DT_FLOAT, DT_DOUBLE, DT_INT4, DT_INT8, DT_NONE
+        :type dtype: DataType
 
-        :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
-        :type add_zero_attn: bool
+        :param shared_op: the layer whose parameters are shared with. Default is None.
+        :type shared_op: Op
 
-        :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+        :param kernel_initializer: Initializer for the kernel weights matrix. If it is set to None, the GlorotUniformInitializer is applied.
         :type kernel_initializer: Initializer
 
         :param name: the name of the layer. Default is None.
@@ -2643,97 +2581,105 @@ def multihead_attention(
         :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
-        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-        handle = ffc().flexflow_model_add_multihead_attention(
+        shared_op_handle = self.__get_op_handle(shared_op)
+        c_aggr = enum_to_int(AggrMode, aggr)
+        c_dtype = enum_to_int(DataType, dtype)
+        if kernel_initializer is None:
+            kernel_initializer = GlorotUniformInitializer(42)
+        assert (
+            (type(kernel_initializer) is GlorotUniformInitializer)
+            or (type(kernel_initializer) is ZeroInitializer)
+            or (type(kernel_initializer) is UniformInitializer)
+            or (type(kernel_initializer) is NormInitializer)
+        ), f"Unknown initializer type: {kernel_initializer}"
+        handle = ffc().flexflow_model_add_embedding(
             self.handle,
-            query.handle,
-            key.handle,
-            value.handle,
-            embed_dim,
-            num_heads,
-            kdim,
-            vdim,
-            dropout,
-            bias,
-            add_bias_kv,
-            add_zero_attn,
-            kernel_init_handle,
+            input.handle,
+            num_embeddings,
+            embedding_dim,
+            c_aggr,
+            c_dtype,
+            shared_op_handle,
+            kernel_initializer.handle,
             c_name,
         )
-        self.add_layer(OpType.MULTIHEAD_ATTENTION, name)
-        return Tensor(handle, owner_op_type=OpType.MULTIHEAD_ATTENTION)
+        # NOTE: We must keep a reference to the initializer or else it will be
+        # immediately destructed
+        self.initializers[name] = kernel_initializer
+        self.add_layer(OpType.EMBEDDING, name)
+        return Tensor(handle, owner_op_type=OpType.EMBEDDING)
 
-    def inc_multihead_self_attention(
+    def pool2d(
         self,
         input,
-        embed_dim,
-        num_heads,
-        kdim=0,
-        vdim=0,
-        dropout=0.0,
-        bias=True,
-        add_bias_kv=False,
-        add_zero_attn=False,
-        data_type=DataType.DT_NONE,
-        kernel_initializer=None,
-        apply_rotary_embedding=False,
-        scaling_query=False,
-        scaling_factor=1.0,
-        qk_prod_scaling=True,
-        position_bias=False,
+        kernel_h,
+        kernel_w,
+        stride_h,
+        stride_w,
+        padding_h,
+        padding_w,
+        pool_type=PoolType.POOL_MAX,
+        activation=ActiMode.AC_MODE_NONE,
         name=None,
     ):
-        """Defines the MultiHead Attention operation as described in Attention Is All You Need
-        which takes in the tensors :attr:`input`, and uses it for all three of query, key and values.
-        In inference mode, the attention is computed using incremental decoding.
+        """Pooling operation for 2D spatial data.
 
-        :param input: the input Tensor.
-        :type input: Tensor
+        The size of input tensor is :math:`(N, C_{in}, H, W)` and the size of output tensor
+        is :math:`(N, C_{out}, H_{out}, W_{out})`, which can be calculated by:
 
-        :param embed_dim: total dimension of the model
-        :type embed_dim: int
+        .. math::
+          C_{out} = out\_channels
 
-        :param num_heads: Number of attention heads.
-        :type num_heads: int
+        .. math::
+          K_{H} = kernel\_h
 
-        :param kdim: total number of features in key. Default is 0
-        :type kdim: int
+        .. math::
+          K_{W} = kernel\_w
 
-        :param vdim: total number of features in value. Default is 0
-        :type vdim: int
+        .. math::
+          S_{H} = stride\_h
 
-        :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
-        :type dropout: float(0-1)
+        .. math::
+          S_{W} = stride\_w
 
-        :param bias: Whether the dense layers use bias vectors. Default is True.
-        :type bias: bool
+        .. math::
+          P_{H} = padding\_h
 
-        :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
-        :type add_bias_kv: bool
+        .. math::
+          P_{S} = padding\_s
 
-        :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
-        :type add_zero_attn: bool
+        .. math::
+          H_{out} = (H - K_{H} + 2 * P_{H}) / S_{H} + 1
 
-        :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
-        :type data_type: DataType
+        .. math::
+          W_{out} = (W - K_{W} + 2 * P_{W}) / S_{W} + 1
 
-        :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
-        :type kernel_initializer: Initializer
+        :param input: the input Tensor.
+        :type input: Tensor
 
-        :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
-        :type apply_rotary_embedding: bool
+        :param kernel_h: the height of the 2D pooling window: :math:`K_{H}`.
+        :type kernel_h: int
 
-        :param scaling_query: Whether to apply scaling query. Default is False.
-        :type scaling_query: bool
+        :param kernel_w: the width of the 2D pooling window: :math:`K_{W}`.
+        :type kernel_w: int
 
-        :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
-        :type scaling_factor: float
+        :param stride_h: the stride of the pooling along the height: :math:`S_{H}`.
+        :type stride_h: int
 
-        :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
-        :type qk_prod_scaling: bool
+        :param stride_w: the stride of the pooling along the width: :math:`S_{W}`.
+        :type stride_w: int
 
-        :param position_bias: Whether to add position bias to the QK product. Default is False.
-        :type position_bias: bool
+        :param padding_h: the amount of implicit zero-paddings along the height: :math:`P_{H}`.
+        :type padding_h: int
+
+        :param padding_w: the amount of implicit zero-paddings along the width: :math:`P_{W}`.
+        :type padding_w: int
+
+        :param activation: Tyoe of pooling function to use. If you don't specify anything, PoolType.POOL_MAX is applied.
+        :type activation: PoolType
+
+        :param activation: Activation function to use. Default is ActiMode.AC_MODE_NONE.
+        :type activation: ActiMode
 
         :param name: the name of the layer. Default is None.
         :type name: string
@@ -2741,102 +2687,34 @@ def inc_multihead_self_attention(
         :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
-        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-        c_data_type = enum_to_int(DataType, data_type)
-        handle = ffc().flexflow_model_add_inc_multihead_self_attention(
+        c_pool_type = enum_to_int(PoolType, pool_type)
+        c_activation = enum_to_int(ActiMode, activation)
+        handle = ffc().flexflow_model_add_pool2d(
             self.handle,
             input.handle,
-            embed_dim,
-            num_heads,
-            kdim,
-            vdim,
-            dropout,
-            bias,
-            add_bias_kv,
-            add_zero_attn,
-            c_data_type,
-            kernel_init_handle,
-            apply_rotary_embedding,
-            scaling_query,
-            scaling_factor,
-            qk_prod_scaling,
-            position_bias,
+            kernel_h,
+            kernel_w,
+            stride_h,
+            stride_w,
+            padding_h,
+            padding_w,
+            c_pool_type,
+            c_activation,
             c_name,
         )
-        self.add_layer(OpType.INC_MULTIHEAD_ATTENTION, name)
-        return Tensor(handle, owner_op_type=OpType.INC_MULTIHEAD_ATTENTION)
-
-    def spec_inc_multihead_self_attention(
-        self,
-        input,
-        embed_dim,
-        num_heads,
-        kdim=0,
-        vdim=0,
-        dropout=0.0,
-        bias=True,
-        add_bias_kv=False,
-        add_zero_attn=False,
-        data_type=DataType.DT_NONE,
-        kernel_initializer=None,
-        apply_rotary_embedding=False,
-        scaling_query=False,
-        scaling_factor=1.0,
-        qk_prod_scaling=True,
-        position_bias=False,
-        name=None,
-    ):
-        """Defines the MultiHead Attention operation as described in Attention Is All You Need
-        which takes in the tensors :attr:`input`, and uses it for all three of query, key and values.
-        This operator only supports computing the attention in inference (beam search) mode.
-
-        :param input: the input Tensor.
-        :type input: Tensor
-
-        :param embed_dim: total dimension of the model
-        :type embed_dim: int
-
-        :param num_heads: Number of attention heads.
-        :type num_heads: int
-
-        :param kdim: total number of features in key. Default is 0
-        :type kdim: int
-
-        :param vdim: total number of features in value. Default is 0
-        :type vdim: int
-
-        :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
-        :type dropout: float(0-1)
-
-        :param bias: Whether the dense layers use bias vectors. Default is True.
-        :type bias: bool
-
-        :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
-        :type add_bias_kv: bool
-
-        :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
-        :type add_zero_attn: bool
-
-        :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
-        :type data_type: DataType
-
-        :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
-        :type kernel_initializer: Initializer
-
-        :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
-        :type apply_rotary_embedding: bool
+        self.add_layer(OpType.POOL2D, name)
+        return Tensor(handle, owner_op_type=OpType.POOL2D)
 
-        :param scaling_query: Whether to apply scaling query. Default is False.
-        :type scaling_query: bool
+    def batch_norm(self, input, relu=True, name=None):
+        """Layer that normalizes its inputs.
 
-        :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
-        :type scaling_factor: float
+        Batch normalization applies a transformation that maintains the mean output close to 0 and the output standard deviation close to 1.
 
-        :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
-        :type qk_prod_scaling: bool
+        :param input: the list of input Tensors.
+        :type input: Tensor
 
-        :param position_bias: Whether to add position bias to the QK product. Default is False.
-        :type position_bias: bool
+        :param relu: whether a ReLU function is applied. Default is True.
+        :type relu: bool
 
         :param name: the name of the layer. Default is None.
         :type name: string
@@ -2844,209 +2722,255 @@ def spec_inc_multihead_self_attention(
         :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
-        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-        c_data_type = enum_to_int(DataType, data_type)
-        handle = ffc().flexflow_model_add_spec_inc_multihead_self_attention(
+        handle = ffc().flexflow_model_add_batch_norm(
+            self.handle, input.handle, relu, c_name
+        )
+        self.add_layer(OpType.BATCH_NORM, name)
+        return Tensor(handle, owner_op_type=OpType.BATCH_NORM)
+
+    def layer_norm(
+        self, input, axes, elementwise_affine=True, eps=1e-5, use_bias=True, name=None
+    ):
+        """Add a LayerNorm layer
+
+        :param input: The input tensor
+        :type input: Tensor
+        :param axes: Indicate which axes (starting from the end) the LayerNorm should normalize over
+        :type axes: Union[int, List[int]]
+        :param elementwise_affine: Whether the LayerNorm should use the gamma weight for scaling, defaults to True
+        :type elementwise_affine: bool, optional
+        :param eps: A small float value added to the LayerNorm denominator for numerical stability, defaults to 1e-5
+        :type eps: float, optional
+        :param use_bias: Whether to add a beta bias to the LayerNorm result, defaults to True
+        :type use_bias: bool, optional
+        :param name: Name of the operator, also used for loading weights in inference mode, defaults to None
+        :type name: _type_, optional
+        :return: The LayerNorm output tensor
+        :rtype: Tensor
+        """
+        c_name = get_c_name(name)
+        c_axes = ffi.new("int[]", axes)
+        handle = ffc().flexflow_model_add_layer_norm(
             self.handle,
             input.handle,
-            embed_dim,
-            num_heads,
-            kdim,
-            vdim,
-            dropout,
-            bias,
-            add_bias_kv,
-            add_zero_attn,
-            c_data_type,
-            kernel_init_handle,
-            apply_rotary_embedding,
-            scaling_query,
-            scaling_factor,
-            qk_prod_scaling,
-            position_bias,
+            len(axes),
+            c_axes,
+            elementwise_affine,
+            eps,
+            use_bias,
             c_name,
         )
-        self.add_layer(OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION, name)
-        return Tensor(handle, owner_op_type=OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION)
+        self.add_layer(OpType.LAYER_NORM, name)
+        return Tensor(handle, owner_op_type=OpType.LAYER_NORM)
 
-    def inc_multihead_self_attention_verify(
+    def residual_layer_norm(
         self,
         input,
-        embed_dim,
-        num_heads,
-        kdim=0,
-        vdim=0,
-        dropout=0.0,
-        bias=True,
-        add_bias_kv=False,
-        add_zero_attn=False,
-        data_type=DataType.DT_NONE,
-        kernel_initializer=None,
-        apply_rotary_embedding=False,
-        scaling_query=False,
-        scaling_factor=1.0,
-        qk_prod_scaling=True,
-        position_bias=False,
+        residual1,
+        residual2,
+        use_two_residuals,
+        axes,
+        elementwise_affine=True,
+        eps=1e-5,
+        use_bias=True,
+        inplace_residual=False,
         name=None,
     ):
-        """Defines the MultiHead Attention operation as described in Attention Is All You Need
-        which takes in the tensors :attr:`input`, and uses it for all three of query, key and values.
-        This operator only supports computing the attention in inference (tree verify) mode.
+        """Add a fused LayerNorm + Residual layer. This operator uses a single kernel, resulting in
+        better efficiency compared to using separate element-wise add and LayerNorm operators.
 
-        :param input: the input Tensor.
+        :param input: The input tensor
         :type input: Tensor
+        :param residual1: The residual tensor to add to the input before computing the LayerNorm
+        :type residual1: Tensor
+        :param residual2: An optional second residual tensor to add to the input (in addition to residual1) before computing the LayerNorm
+        :type residual2: Tensor
+        :param use_two_residuals: A boolean that should be set to True if using the second optional residual, False otherwise
+        :type use_two_residuals: bool
+        :param axes: Indicate which axes (starting from the end) the LayerNorm should normalize over
+        :type axes: List[int]
+        :param elementwise_affine: Whether the LayerNorm should use the gamma weight for scaling, defaults to True
+        :type elementwise_affine: bool, optional
+        :param eps: A small float value added to the LayerNorm denominator for numerical stability, defaults to 1e-5
+        :type eps: float, optional
+        :param use_bias: Whether to add a beta bias to the LayerNorm result, defaults to True
+        :type use_bias: bool, optional
+        :param inplace_residual: Whether to perform the residual computation inplace in the input tensor, defaults to False
+        :type inplace_residual: bool, optional
+        :param name: Name of the operator, also used for loading weights in inference mode, defaults to None
+        :type name: str, optional
+        :return: A tensor with the sum of the input and residual(s), and the LayerNorm output
+        :rtype: (Tensor, Tensor)
+        """
+        c_name = get_c_name(name)
+        c_axes = ffi.new("int[]", axes)
+        residual2_handle = (
+            residual1.handle
+        )  # This is intentional. Data will be ignored, and we cannot pass None
+        if use_two_residuals:
+            assert residual2 is not None
+            residual2_handle = residual2.handle
+        handles_array = ffc().flexflow_model_add_residual_layer_norm(
+            self.handle,
+            input.handle,
+            residual1.handle,
+            residual2_handle,
+            use_two_residuals,
+            len(axes),
+            c_axes,
+            elementwise_affine,
+            eps,
+            use_bias,
+            inplace_residual,
+            c_name,
+        )
+        self.add_layer(OpType.RESIDUAL_LAYERNORM, name)
+        return (
+            Tensor(handles_array[0], owner_op_type=OpType.RESIDUAL_LAYERNORM),
+            Tensor(handles_array[1], owner_op_type=OpType.RESIDUAL_LAYERNORM),
+        )
 
-        :param embed_dim: total dimension of the model
-        :type embed_dim: int
-
-        :param num_heads: Number of attention heads.
-        :type num_heads: int
-
-        :param kdim: total number of features in key. Default is 0
-        :type kdim: int
-
-        :param vdim: total number of features in value. Default is 0
-        :type vdim: int
-
-        :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
-        :type dropout: float(0-1)
-
-        :param bias: Whether the dense layers use bias vectors. Default is True.
-        :type bias: bool
-
-        :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
-        :type add_bias_kv: bool
-
-        :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
-        :type add_zero_attn: bool
-
-        :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
-        :type data_type: DataType
+    def add_bias_residual_layer_norm(
+        self,
+        input,
+        residual,
+        axes,
+        elementwise_affine=True,
+        eps=1e-5,
+        use_bias=True,
+        inplace_residual=False,
+        name=None,
+    ):
+        """Add a Attention Bias + Residual + LayerNorm layer. This operator uses a single kernel,
+        resulting in better efficiency compared to using separate attention bias addition +
+        element-wise residual addition + LayerNorm operators.
 
-        :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
-        :type kernel_initializer: Initializer
+        :param input: The input tensor
+        :type input: Tensor
+        :param residual: The residual tensor
+        :type residual: Tensor
+        :param axes: Indicate which axes (starting from the end) the LayerNorm should normalize over
+        :type axes: Union[int, List[int]]
+        :param elementwise_affine: Whether the LayerNorm should use the gamma weight for scaling, defaults to True
+        :type elementwise_affine: bool, optional
+        :param eps: A small float value added to the LayerNorm denominator for numerical stability, defaults to 1e-5
+        :type eps: float, optional
+        :param use_bias: Whether to add a beta bias to the LayerNorm result, defaults to True
+        :type use_bias: bool, optional
+        :param inplace_residual: Whether to perform the residual computation inplace in the input tensor, defaults to False
+        :type inplace_residual: bool, optional
+        :param name: Name of the operator, also used for loading weights in inference mode, defaults to None
+        :type name: _type_, optional
+        :return: A tensor with the sum of the attention bias, input and residual(s), and the LayerNorm output
+        :rtype: (Tensor, Tensor)
+        """
+        c_name = get_c_name(name)
+        c_axes = ffi.new("int[]", axes)
+        handles_array = ffc().flexflow_model_add_add_bias_residual_layer_norm(
+            self.handle,
+            input.handle,
+            residual.handle,
+            len(axes),
+            c_axes,
+            elementwise_affine,
+            eps,
+            use_bias,
+            inplace_residual,
+            c_name,
+        )
+        self.add_layer(OpType.ADD_BIAS_RESIDUAL_LAYERNORM, name)
+        return (
+            Tensor(handles_array[0], owner_op_type=OpType.ADD_BIAS_RESIDUAL_LAYERNORM),
+            Tensor(handles_array[1], owner_op_type=OpType.ADD_BIAS_RESIDUAL_LAYERNORM),
+        )
 
-        :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
-        :type apply_rotary_embedding: bool
+    def sigmoid_silu_multi(self, input1, input2, name=None):
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_sigmoid_silu_multi(
+            self.handle, input1.handle, input2.handle, c_name
+        )
+        self.add_layer(OpType.SIGMOID_SILU_MULTI, name)
+        return Tensor(handle, owner_op_type=OpType.SIGMOID_SILU_MULTI)
 
-        :param scaling_query: Whether to apply scaling query. Default is False.
-        :type scaling_query: bool
+    def batch_matmul(
+        self, A, B, a_seq_length_dim=None, b_seq_length_dim=None, name=None
+    ):
+        """Layer that applied batched matrix multiplication onto two input Tensors, :attr:`output = x * y`.
 
-        :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
-        :type scaling_factor: float
+        :param A: the first input Tensor.
+        :type A: Tensor
 
-        :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
-        :type qk_prod_scaling: bool
+        :param B: the second input Tensor.
+        :type B: Tensor
 
-        :param position_bias: Whether to add position bias to the QK product. Default is False.
-        :type position_bias: bool
+        :param a_seq_length_dim: an int when set indicating the a_seq_length_dim dimention of A is a sequence_length dimension
+        :type a_seq_length_dim: int
+
+        :param b_seq_length_dim: an int when set indicating the b_seq_length_dim dimention of B is a sequence_length dimension
+        :type b_seq_length_dim: int
 
         :param name: the name of the layer. Default is None.
         :type name: string
 
+        :param name:  Whether to add use bias in layer normalization
+        :type name: bool
+
         :returns:  Tensor -- the output tensor.
         """
-        c_name = get_c_name(name)
-        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-        c_data_type = enum_to_int(DataType, data_type)
-        handle = ffc().flexflow_model_add_inc_multihead_self_attention_verify(
-            self.handle,
-            input.handle,
-            embed_dim,
-            num_heads,
-            kdim,
-            vdim,
-            dropout,
-            bias,
-            add_bias_kv,
-            add_zero_attn,
-            c_data_type,
-            kernel_init_handle,
-            apply_rotary_embedding,
-            scaling_query,
-            scaling_factor,
-            qk_prod_scaling,
-            position_bias,
-            c_name,
+        if a_seq_length_dim is None:
+            a_seq_length_dim = -1
+        if b_seq_length_dim is None:
+            b_seq_length_dim = -1
+        handle = ffc().flexflow_model_add_batch_matmul(
+            self.handle, A.handle, B.handle, a_seq_length_dim, b_seq_length_dim
         )
-        self.add_layer(OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION, name)
-        return Tensor(handle, owner_op_type=OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION)
+        self.add_layer(OpType.BATCH_MATMUL, name)
+        return Tensor(handle, owner_op_type=OpType.BATCH_MATMUL)
 
-    def inc_multiquery_self_attention(
+    def dense(
         self,
         input,
-        embed_dim,
-        num_q_heads,
-        num_kv_heads,
-        kdim=0,
-        vdim=0,
-        dropout=0.0,
-        bias=True,
-        add_bias_kv=False,
-        add_zero_attn=False,
-        data_type=DataType.DT_NONE,
+        out_dim,
+        activation=ActiMode.AC_MODE_NONE,
+        use_bias=True,
+        datatype=DataType.DT_NONE,
+        shared_op=None,
         kernel_initializer=None,
-        apply_rotary_embedding=False,
-        scaling_query=False,
-        scaling_factor=1.0,
-        qk_prod_scaling=True,
-        position_bias=False,
+        bias_initializer=None,
+        kernel_regularizer=None,
         name=None,
     ):
-        """Defines the multi-query head attention, which allows a different number of Q and KV heads,
-        and takes in the tensors :attr:`input`, and uses it for all three of query, key and values.
-        In inference mode, the attention is computed using incremental decoding.
+        """Dense implements the operation: :attr:`output = activation(dot(input, kernel) + bias)` where
+        :attr:`activation` is the element-wise activation function passed as the activation argument,
+        :attr:`kernel` is a weights matrix created by the layer, and
+        :attr:`bias` is a bias vector created by the layer (only applicable if :attr:`use_bias` is True).
+
+        The size of input tensor is :math:`(N, C_{in})` and the size of output tensor
+        is :math:`(N, C_{out})`, where :math:`C_{out} = out\_dim`
 
         :param input: the input Tensor.
         :type input: Tensor
 
-        :param embed_dim: total dimension of the model
-        :type embed_dim: int
-
-        :param num_q_heads: Number of query attention heads.
-        :type num_q_heads: int
-
-        :param num_kv_heads: Number of key/value attention heads.
-        :type num_kv_heads: int
-
-        :param kdim: total number of features in key. Default is 0
-        :type kdim: int
-
-        :param vdim: total number of features in value. Default is 0
-        :type vdim: int
-
-        :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
-        :type dropout: float(0-1)
-
-        :param bias: Whether the dense layers use bias vectors. Default is True.
-        :type bias: bool
+        :param out\_dim: dimensionality of the output space.
+        :type out\_dim: int
 
-        :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
-        :type add_bias_kv: bool
+        :param activation: Activation function to use. Default is ActiMode.AC_MODE_NONE.
+        :type activation: ActiMode
 
-        :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
-        :type add_zero_attn: bool
+        :param use_bias: whether the layer uses a bias vector. Default is True.
+        :type use_bias: bool
 
-        :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
-        :type data_type: DataType
+        :param shared_op: the layer whose parameters are shared with. Default is None.
+        :type shared_op: Op
 
-        :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+        :param kernel_initializer: Initializer for the kernel weights matrix. If it is set to None, the GlorotUniformInitializer is applied.
         :type kernel_initializer: Initializer
 
-        :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
-        :type apply_rotary_embedding: bool
-
-        :param scaling_query: Whether to apply scaling query. Default is False.
-        :type scaling_query: bool
-
-        :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
-        :type scaling_factor: float
-
-        :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
-        :type qk_prod_scaling: bool
+        :param bias_initializer: Initializer for the bias vector. If it is set to None, the ZeroInitializer is applied.
+        :type bias_initializer: Initializer
 
-        :param position_bias: Whether to add position bias to the QK product. Default is False.
-        :type position_bias: bool
+        :param kernel_regularizer: Regularizer for the kernel weights matrix
+        :type bias_initializer: Regularizer
 
         :param name: the name of the layer. Default is None.
         :type name: string
@@ -3054,107 +2978,128 @@ def inc_multiquery_self_attention(
         :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
+        shared_op_handle = self.__get_op_handle(shared_op)
+        c_activation = enum_to_int(ActiMode, activation)
+        c_datatype = enum_to_int(DataType, datatype)
         kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-        c_data_type = enum_to_int(DataType, data_type)
-        handle = ffc().flexflow_model_add_inc_multiquery_self_attention(
-            self.handle,
-            input.handle,
-            embed_dim,
-            num_q_heads,
-            num_kv_heads,
-            kdim,
-            vdim,
-            dropout,
-            bias,
-            add_bias_kv,
-            add_zero_attn,
-            c_data_type,
+        bias_init_handle = self.__get_initializer_handle(bias_initializer)
+        if kernel_regularizer:
+            c_kernel_reg_type = enum_to_int(RegularizerMode, kernel_regularizer.type)
+            kernel_reg_lambda = kernel_regularizer._lambda
+        else:
+            c_kernel_reg_type = enum_to_int(
+                RegularizerMode, RegularizerMode.REG_MODE_NONE
+            )
+            kernel_reg_lambda = 0.0
+        handle = ffc().flexflow_model_add_dense(
+            self.handle,
+            input.handle,
+            out_dim,
+            c_activation,
+            use_bias,
+            c_datatype,
+            shared_op_handle,
             kernel_init_handle,
-            apply_rotary_embedding,
-            scaling_query,
-            scaling_factor,
-            qk_prod_scaling,
-            position_bias,
+            bias_init_handle,
+            c_kernel_reg_type,
+            kernel_reg_lambda,
             c_name,
         )
-        self.add_layer(OpType.INC_MULTIHEAD_ATTENTION, name)
-        return Tensor(handle, owner_op_type=OpType.INC_MULTIHEAD_ATTENTION)
+        self.add_layer(OpType.LINEAR, name)
+        return Tensor(handle, owner_op_type=OpType.LINEAR)
 
-    def spec_inc_multiquery_self_attention(
-        self,
-        input,
-        embed_dim,
-        num_q_heads,
-        num_kv_heads,
-        kdim=0,
-        vdim=0,
-        dropout=0.0,
-        bias=True,
-        add_bias_kv=False,
-        add_zero_attn=False,
-        data_type=DataType.DT_NONE,
-        kernel_initializer=None,
-        apply_rotary_embedding=False,
-        scaling_query=False,
-        scaling_factor=1.0,
-        qk_prod_scaling=True,
-        position_bias=False,
-        name=None,
-    ):
-        """Defines the multi-query head attention, which allows a different number of Q and KV heads,
-        and takes in the tensors :attr:`input`, and uses it for all three of query, key and values.
-        This operator only supports computing the attention in inference (beam search) mode.
+    def concat(self, tensors, axis, name=None):
+        """Layer that concatenates a list of inputs.
 
-        :param input: the input Tensor.
-        :type input: Tensor
+        It takes as input a list of tensors, all of the same shape except for the concatenation axis, and returns a single tensor that is the concatenation of all inputs.
 
-        :param embed_dim: total dimension of the model
-        :type embed_dim: int
+        :param input: the list of input Tensors.
+        :type input: List of Tensors
 
-        :param num_q_heads: Number of query attention heads.
-        :type num_q_heads: int
+        :param axis: the dimension along which to concatenate.
+        :type axis: int
 
-        :param num_kv_heads: Number of key/value attention heads.
-        :type num_kv_heads: int
+        :param name: the name of the layer. Default is None.
+        :type name: string
 
-        :param kdim: total number of features in key. Default is 0
-        :type kdim: int
+        :returns:  Tensor -- the output tensor.
+        """
+        assert type(tensors) is list, "tensors should be a list"
+        tensor_handle_list = []
+        n = len(tensors)
+        assert n <= 256, "Please increase MAX_NUM_INPUTS"
+        for tensor in tensors:
+            tensor_handle_list.append(tensor.handle)
+        c_tensor_handle_list = ffi.new("flexflow_tensor_t[]", tensor_handle_list)
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_concat(
+            self.handle, n, c_tensor_handle_list, axis, c_name
+        )
+        self.add_layer(OpType.CONCAT, name)
+        return Tensor(handle, owner_op_type=OpType.CONCAT)
 
-        :param vdim: total number of features in value. Default is 0
-        :type vdim: int
+    def split(self, input, sizes, axis, name=None):
+        """Layer that splits a :attr:`input` tensor into a list of tensors.
 
-        :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
-        :type dropout: float(0-1)
+        :param input: the input Tensor.
+        :type input: Tensor
 
-        :param bias: Whether the dense layers use bias vectors. Default is True.
-        :type bias: bool
+        :param sizes: either an int indicating the number of splits along axis or a Python list containing the sizes of each output tensor along axis. If a scalar, then it must evenly divide :attr:`input.dims[axis]`; otherwise the sum of sizes along the split axis must match that of the :attr:`input`.
+        :type sizes: int or list of int
 
-        :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
-        :type add_bias_kv: bool
+        :param axis: the dimension along which to split.
+        :type axis: int
 
-        :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
-        :type add_zero_attn: bool
+        :param name: the name of the layer. Default is None.
+        :type name: string
 
-        :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
-        :type data_type: DataType
+        :returns:  list of Tensors -- the output tensors.
+        """
+        if type(sizes) is list:
+            split = sizes
+        else:
+            assert input.dims[axis] % sizes == 0, "Split dimension is not divisible"
+            split = [input.dims[axis] // sizes for i in range(sizes)]
+        n = len(split)
+        assert n <= 256, "Please increase MAX_NUM_OUTPUTS"
+        c_split = ffi.new("int[]", split)
+        c_outputs_handle_list = ffi.new("flexflow_tensor_t[256]")
+        c_name = get_c_name(name)
+        ffc().flexflow_model_add_split(
+            self.handle, input.handle, n, c_outputs_handle_list, c_split, axis, c_name
+        )
+        output_tensor_list = []
+        for i in range(n):
+            tensor_p_handle = ffi.new("flexflow_tensor_t*")
+            tensor_p_handle.impl = c_outputs_handle_list[i].impl
+            output_tensor_list.append(
+                Tensor(None, owner_op_type=OpType.SPLIT, p_handle=tensor_p_handle)
+            )
+        self.add_layer(OpType.SPLIT, name)
+        del c_outputs_handle_list
+        return output_tensor_list
 
-        :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
-        :type kernel_initializer: Initializer
+    def flat(self, input, name=None):
+        """Flattens the input. Does not affect the batch size.
 
-        :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
-        :type apply_rotary_embedding: bool
+        :param input: the input Tensor.
+        :type input: Tensor
 
-        :param scaling_query: Whether to apply scaling query. Default is False.
-        :type scaling_query: bool
+        :param name: the name of the layer. Default is None.
+        :type name: string
 
-        :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
-        :type scaling_factor: float
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_flat(self.handle, input.handle, c_name)
+        self.add_layer(OpType.FLAT, name)
+        return Tensor(handle, owner_op_type=OpType.FLAT)
 
-        :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
-        :type qk_prod_scaling: bool
+    def softmax(self, input, axis=-1, name=None):
+        """Softmax activation function.
 
-        :param position_bias: Whether to add position bias to the QK product. Default is False.
-        :type position_bias: bool
+        :param input: the input Tensor.
+        :type input: Tensor
 
         :param name: the name of the layer. Default is None.
         :type name: string
@@ -3162,107 +3107,93 @@ def spec_inc_multiquery_self_attention(
         :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
-        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-        c_data_type = enum_to_int(DataType, data_type)
-        handle = ffc().flexflow_model_add_spec_inc_multiquery_self_attention(
-            self.handle,
-            input.handle,
-            embed_dim,
-            num_q_heads,
-            num_kv_heads,
-            kdim,
-            vdim,
-            dropout,
-            bias,
-            add_bias_kv,
-            add_zero_attn,
-            c_data_type,
-            kernel_init_handle,
-            apply_rotary_embedding,
-            scaling_query,
-            scaling_factor,
-            qk_prod_scaling,
-            position_bias,
-            c_name,
+        handle = ffc().flexflow_model_add_softmax(
+            self.handle, input.handle, axis, c_name
         )
-        self.add_layer(OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION, name)
-        return Tensor(handle, owner_op_type=OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION)
+        self.add_layer(OpType.SOFTMAX, name)
+        return Tensor(handle, owner_op_type=OpType.SOFTMAX)
 
-    def inc_multiquery_self_attention_verify(
-        self,
-        input,
-        embed_dim,
-        num_q_heads,
-        num_kv_heads,
-        kdim=0,
-        vdim=0,
-        dropout=0.0,
-        bias=True,
-        add_bias_kv=False,
-        add_zero_attn=False,
-        data_type=DataType.DT_NONE,
-        kernel_initializer=None,
-        apply_rotary_embedding=False,
-        scaling_query=False,
-        scaling_factor=1.0,
-        qk_prod_scaling=True,
-        position_bias=False,
-        name=None,
-    ):
-        """Defines the multi-query head attention, which allows a different number of Q and KV heads,
-        and takes in the tensors :attr:`input`, and uses it for all three of query, key and values.
-        This operator only supports computing the attention in inference (tree verify) mode.
+    def reshape(self, input, shape, name=None):
+        """Layer that reshapes inputs into the given shape.
+
+        Given a :attr:`input` tensor, this operation returns a output tensor that has the same values as tensor in the same order,
+        except with a new shape given by :attr:`shape`.
 
         :param input: the input Tensor.
         :type input: Tensor
 
-        :param embed_dim: total dimension of the model
-        :type embed_dim: int
+        :param shape: A list defining the shape of the output tensor.
+        :type shape: list of int
 
-        :param num_q_heads: Number of query attention heads.
-        :type num_q_heads: int
+        :param name: the name of the layer. Default is None.
+        :type name: string
 
-        :param num_kv_heads: Number of key/value attention heads.
-        :type num_kv_heads: int
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        c_shape = ffi.new("int[]", shape)
+        handle = ffc().flexflow_model_add_reshape(
+            self.handle, input.handle, len(shape), c_shape, c_name
+        )
+        self.add_layer(OpType.RESHAPE, name)
+        return Tensor(handle, owner_op_type=OpType.RESHAPE)
 
-        :param kdim: total number of features in key. Default is 0
-        :type kdim: int
+    def gather(self, input, index, dim, name=None):
+        """Layer that gathers values along the dim axis.
 
-        :param vdim: total number of features in value. Default is 0
-        :type vdim: int
+        :param input: the input tensor
+        :type input: Tensor
 
-        :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
-        :type dropout: float(0-1)
+        :param index: the index tensor, which specifies the indices of elements to gather
+        :type index: Tensor
 
-        :param bias: Whether the dense layers use bias vectors. Default is True.
-        :type bias: bool
+        :param dim: the axis along which to index
+        :type dim: int
 
-        :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
-        :type add_bias_kv: bool
+        :param name: the name of the layer. Default is None
+        :type name: string
 
-        :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
-        :type add_zero_attn: bool
+        :returns: Tensor -- the output tensor
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_gather(
+            self.handle, input.handle, index.handle, dim, c_name
+        )
+        self.add_layer(OpType.GATHER, name)
+        return Tensor(handle, owner_op_type=OpType.GATHER)
 
-        :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
-        :type data_type: DataType
+    def transpose(self, input, perm, name=None):
+        """Transposes the :attr:`input` tensor. Permutes the dimensions according to perm
 
-        :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
-        :type kernel_initializer: Initializer
+        :param input: the input Tensor.
+        :type input: Tensor
 
-        :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
-        :type apply_rotary_embedding: bool
+        :param perm: A permutation of the dimensions of a.
+        :type perm: List of int
 
-        :param scaling_query: Whether to apply scaling query. Default is False.
-        :type scaling_query: bool
+        :param name: the name of the layer. Default is None.
+        :type name: string
 
-        :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
-        :type scaling_factor: float
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        c_perm = ffi.new("int[]", perm)
+        handle = ffc().flexflow_model_add_transpose(
+            self.handle, input.handle, len(perm), c_perm, c_name
+        )
+        self.add_layer(OpType.TRANSPOSE, name)
+        return Tensor(handle, owner_op_type=OpType.TRANSPOSE)
 
-        :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
-        :type qk_prod_scaling: bool
+    def reverse(self, input, axis, name=None):
+        """Layer that reverses specific dimensions of a tensor.
 
-        :param position_bias: Whether to add position bias to the QK product. Default is False.
-        :type position_bias: bool
+        Given a :attr:`input` tensor, this operation reverses the dimension :attr:`axis`.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param axis: the dimension to reverse.
+        :type axis: int
 
         :param name: the name of the layer. Default is None.
         :type name: string
@@ -3270,43 +3201,20 @@ def inc_multiquery_self_attention_verify(
         :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
-        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
-        c_data_type = enum_to_int(DataType, data_type)
-        handle = ffc().flexflow_model_add_inc_multiquery_self_attention_verify(
-            self.handle,
-            input.handle,
-            embed_dim,
-            num_q_heads,
-            num_kv_heads,
-            kdim,
-            vdim,
-            dropout,
-            bias,
-            add_bias_kv,
-            add_zero_attn,
-            c_data_type,
-            kernel_init_handle,
-            apply_rotary_embedding,
-            scaling_query,
-            scaling_factor,
-            qk_prod_scaling,
-            position_bias,
-            c_name,
+        handle = ffc().flexflow_model_add_reverse(
+            self.handle, input.handle, axis, c_name
         )
-        self.add_layer(OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION, name)
-        return Tensor(handle, owner_op_type=OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION)
+        self.add_layer(OpType.REVERSE, name)
+        return Tensor(handle, owner_op_type=OpType.REVERSE)
 
-    def rms_norm(self, input, eps, dim, name=None):
-        """Defines the RMS Norm layer.
+    def scalar_multiply(self, input, scalar, inplace=True, name=None):
+        """Scalar multiplication of a tensor by an scalar.
 
         :param input: the input Tensor.
         :type input: Tensor
 
-        :param eps: a value added to the denominator for numerical stability
-        :type eps: float
-
-        :param dim: The dimension with respect to which to take the norm
-        :type dim: int
+        :param input: the scalar
+        :type scalar: float
 
         :param name: the name of the layer. Default is None.
         :type name: string
@@ -3314,26 +3222,20 @@ def rms_norm(self, input, eps, dim, name=None):
         :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_rms_norm(
-            self.handle, input.handle, eps, dim, c_name
+        handle = ffc().flexflow_model_add_scalar_multiply(
+            self.handle, input.handle, scalar, inplace, c_name
         )
-        self.add_layer(OpType.RMS_NORM, name)
-        return Tensor(handle, owner_op_type=OpType.RMS_NORM)
-
-    def residual_rms_norm(self, input1, input2, eps, dim, name=None):
-        """Defines the Residual RMS Norm layer.
+        self.add_layer(OpType.SCALAR_MULTIPLY, name)
+        return Tensor(handle, owner_op_type=OpType.SCALAR_MULTIPLY)
 
-        :param input: the input 1 Tensor.
-        :type input: Tensor
+    def scalar_add(self, input, scalar, inplace=True, name=None):
+        """Scalar addition of a scalar to each entry of a tensor.
 
-        :param input: the input 2 Tensor.
+        :param input: the input Tensor.
         :type input: Tensor
 
-        :param eps: a value added to the denominator for numerical stability
-        :type eps: float
-
-        :param dim: The dimension with respect to which to take the norm
-        :type dim: int
+        :param input: the scalar
+        :type scalar: float
 
         :param name: the name of the layer. Default is None.
         :type name: string
@@ -3341,28 +3243,20 @@ def residual_rms_norm(self, input1, input2, eps, dim, name=None):
         :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
-        handles_array = ffc().flexflow_model_add_residual_rms_norm(
-            self.handle, input1.handle, input2.handle, eps, dim, c_name
-        )
-        self.add_layer(OpType.RESIDUAL_RMS_NORM, name)
-        return Tensor(handles_array[0], owner_op_type=OpType.RESIDUAL_RMS_NORM), Tensor(
-            handles_array[1], owner_op_type=OpType.RESIDUAL_RMS_NORM
+        handle = ffc().flexflow_model_add_scalar_add(
+            self.handle, input.handle, scalar, inplace, c_name
         )
+        self.add_layer(OpType.SCALAR_ADD, name)
+        return Tensor(handle, owner_op_type=OpType.SCALAR_ADD)
 
-    def arg_top_k(self, input, k, sorted, speculative_decoding, name=None):
-        """Defines the Arg TopK layer.
+    def scalar_sub(self, input, scalar, inplace=True, name=None):
+        """Scalar subtraction of a scalar to each entry of a tensor.
 
         :param input: the input Tensor.
         :type input: Tensor
 
-        :param k: the top k indices to select
-        :type k: int
-
-        :param sorted: Whether the entries should be sorted
-        :type sorted: bool
-
-        :param speculative_decoding: Whether you need to perform beam search
-        :type speculative_decoding: bool
+        :param input: the scalar
+        :type scalar: float
 
         :param name: the name of the layer. Default is None.
         :type name: string
@@ -3370,23 +3264,20 @@ def arg_top_k(self, input, k, sorted, speculative_decoding, name=None):
         :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_arg_top_k(
-            self.handle, input.handle, k, sorted, c_name
+        handle = ffc().flexflow_model_add_scalar_sub(
+            self.handle, input.handle, scalar, inplace, c_name
         )
-        self.add_layer(OpType.ARG_TOPK, name)
-        return Tensor(handle, owner_op_type=OpType.ARG_TOPK)
+        self.add_layer(OpType.SCALAR_SUB, name)
+        return Tensor(handle, owner_op_type=OpType.SCALAR_SUB)
 
-    def beam_top_k(self, input, max_beam_size, sorted, name=None):
-        """Defines the Beam TopK layer.
+    def scalar_true_divide(self, input, scalar, inplace=True, name=None):
+        """Scalar regular division of a tensor by an scalar.
 
         :param input: the input Tensor.
         :type input: Tensor
 
-        :param max_beam_size: the top max_beam_size indices to select
-        :type max_beam_size: int
-
-        :param sorted: Whether the entries should be sorted
-        :type sorted: bool
+        :param input: the scalar
+        :type scalar: float
 
         :param name: the name of the layer. Default is None.
         :type name: string
@@ -3394,889 +3285,1498 @@ def beam_top_k(self, input, max_beam_size, sorted, name=None):
         :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_beam_top_k(
-            self.handle, input.handle, max_beam_size, sorted, c_name
+        handle = ffc().flexflow_model_add_scalar_truediv(
+            self.handle, input.handle, scalar, inplace, c_name
         )
-        self.add_layer(OpType.BEAM_TOPK, name)
-        return Tensor(handle, owner_op_type=OpType.BEAM_TOPK)
+        self.add_layer(OpType.SCALAR_TRUEDIV, name)
+        return Tensor(handle, owner_op_type=OpType.SCALAR_TRUEDIV)
 
-    def sampling(self, input, top_p, name=None):
-        """Defines the Sampling layer.
+    def gelu(self, input, inplace=True, name=None):
+        """Gaussian Error Linear Unit activation function.
 
         :param input: the input Tensor.
         :type input: Tensor
 
-        :param top_p: The top_p parameter of the sampling
-        :type top_p: float
-
         :param name: the name of the layer. Default is None.
         :type name: string
 
         :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_sampling(
-            self.handle, input.handle, top_p, c_name
-        )
-        self.add_layer(OpType.SAMPLING, name)
-        return Tensor(handle, owner_op_type=OpType.SAMPLING)
+        handle = ffc().flexflow_model_add_gelu(self.handle, input.handle, c_name)
+        self.add_layer(OpType.GELU, name)
+        return Tensor(handle, owner_op_type=OpType.GELU)
 
-    def argmax(self, input, beam_search, name=None):
-        """Defines the Sampling layer.
+    def relu(self, input, inplace=True, name=None):
+        """Rectified Linear Unit activation function.
 
         :param input: the input Tensor.
         :type input: Tensor
 
-        :param beam_search: Whether you need to perform beam search
-        :type beam_search: bool
-
         :param name: the name of the layer. Default is None.
         :type name: string
 
         :returns:  Tensor -- the output tensor.
         """
         c_name = get_c_name(name)
-        handle = ffc().flexflow_model_add_argmax(
-            self.handle, input.handle, beam_search, c_name
+        handle = ffc().flexflow_model_add_relu(
+            self.handle, input.handle, inplace, c_name
         )
-        self.add_layer(OpType.ARGMAX, name)
-        return Tensor(handle, owner_op_type=OpType.ARGMAX)
+        self.add_layer(OpType.RELU, name)
+        return Tensor(handle, owner_op_type=OpType.RELU)
 
-    def reset_metrics(self):
-        """Reset performance metrics.
+    def identity(self, input, name=None):
+        """Identity function.
 
-        :returns:  None -- no returns.
-        """
-        ffc().flexflow_model_reset_metrics(self.handle)
+        :param input: the input Tensor.
+        :type input: Tensor
 
-    def init_layers(self):
-        """Initialize layers.
+        :param name: the name of the layer. Default is None.
+        :type name: string
 
-        :returns:  None -- no returns.
+        :returns:  Tensor -- the output tensor.
         """
-        ffc().flexflow_model_init_layers(self.handle)
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_identity(self.handle, input.handle, c_name)
+        self.add_layer(OpType.IDENTITY, name)
+        return Tensor(handle, owner_op_type=OpType.IDENTITY)
 
-    def prefetch(self):
-        ffc().flexflow_model_prefetch(self.handle)
+    def sigmoid(self, input, name=None):
+        """Sigmoid activation function, :math:`sigmoid(x) = 1 / (1 + exp(-x))`.
 
-    def forward(self, seq_length=None):
-        """Forward propagation of all layers.
+        :param input: the input Tensor.
+        :type input: Tensor
 
-        :returns:  None -- no returns.
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
         """
-        if seq_length is None:
-            seq_length = -1
-        ffc().flexflow_model_forward(self.handle, seq_length)
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_sigmoid(self.handle, input.handle, c_name)
+        self.add_layer(OpType.SIGMOID, name)
+        return Tensor(handle, owner_op_type=OpType.SIGMOID)
 
-    # TODO: seperate compute_metrics from backward
-    def backward(self, seq_length=None):
-        """Backward propagation of all layers.
+    def tanh(self, input, name=None):
+        """Hyperbolic tangent activation function.
 
-        :returns:  None -- no returns.
-        """
-        if seq_length is None:
-            seq_length = -1
-        ffc().flexflow_model_backward(self.handle, seq_length)
+        :param input: the input Tensor.
+        :type input: Tensor
 
-    def compute_metrics(self):
-        """Compute performance metrics.
+        :param name: the name of the layer. Default is None.
+        :type name: string
 
-        :returns:  None -- no returns.
+        :returns:  Tensor -- the output tensor.
         """
-        ffc().flexflow_model_compute_metrics(self.handle)
-
-    def update(self):
-        """Update weights and biases of all layers.
-
-        :returns:  None -- no returns.
-        """
-        ffc().flexflow_model_update(self.handle)
-
-    def compile(self, optimizer=None, loss_type=None, metrics=None, comp_mode=None):
-        """Configure the model for trainting. FlexFlow uses lazy initialization,
-        so the actual creating of all operations (including creating and partitioning
-        of weight, bias and output tensors) happen during compile.
-
-        :param optimizer: optimizer instance.
-        :type optimizer: Optimizer
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_tanh(self.handle, input.handle, c_name)
+        self.add_layer(OpType.TANH, name)
+        return Tensor(handle, owner_op_type=OpType.TANH)
 
-        :param loss_type: Enum of LossType.
-          Options are LOSS_CATEGORICAL_CROSSENTROPY, LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
-          LOSS_MEAN_SQUARED_ERROR_AVG_REDUCE and LOSS_MEAN_SQUARED_ERROR_SUM_REDUCE.
-        :type loss_type: LossType
+    def elu(self, input, inplace=True, name=None):
+        """Exponential Linear Unit. activation function.
 
-        :param metrics: List of metrics to be evaluated by the model during training and testing.
-          Each of this is a Enum of MetricsType. Options are METRICS_ACCURACY,
-          METRICS_CATEGORICAL_CROSSENTROPY, METRICS_SPARSE_CATEGORICAL_CROSSENTROPY,
-          METRICS_MEAN_SQUARED_ERROR, METRICS_ROOT_MEAN_SQUARED_ERROR, METRICS_MEAN_ABSOLUTE_ERROR
-        :type metrics: MetricsType
+        :param input: the input Tensor.
+        :type input: Tensor
 
-        :param comp_mode: Enum of CompMode.
-          Options are COMP_MODE_TRAINING, COMP_MODE_INFERENCE
-        :type comp_mode: CompMode
+        :param name: the name of the layer. Default is None.
+        :type name: string
 
-        :returns:  None -- no returns.
+        :returns:  Tensor -- the output tensor.
         """
-        self.optimizer = optimizer
-
-        c_loss_type = enum_to_int(LossType, loss_type)
-        metrics_int = []
-        for metric in metrics:
-            metrics_int.append(enum_to_int(MetricsType, metric))
-        c_metrics = ffi.new("int[]", metrics_int)
-        if comp_mode == None:
-            comp_mode = CompMode.TRAINING
-        c_comp_mode = enum_to_int(CompMode, comp_mode)
-        ffc().flexflow_model_compile(
-            self.handle, c_loss_type, c_metrics, len(metrics), c_comp_mode
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_elu(
+            self.handle, input.handle, inplace, c_name
         )
-        for ff_tensor, np_tensor in self.attr_tensors.items():
-            ff_tensor.set_tensor(self, np_tensor)
-        print("Compiled ffmodel!")
-
-    def fit(self, x=None, y=None, batch_size=None, epochs=1):
-        """Trains the model for a fixed number of epochs (iterations on a dataset).
-
-        :param x: Input data. It can be a Dataloader instance or a list of Dataloader instances.
-        :type x: Dataloader
-
-        :param y: Target data (label). It can be a Dataloader instance or a list of Dataloader instances.
-        :type y: Dataloader
-
-        :param batch_size: Number of samples per gradient update. It must be identical with :attr:`-b`
-          or :attr:`--batch-size` from the command line.
-        :type batch_size: int
-
-        :param epochs: Number of epochs to train the model.
-          An epoch is an iteration over the entire :attr:`x` and :attr:`y` data provided.
-          The default value is 1.
-        :type epochs: int
-
-        :returns:  None -- no returns.
-        """
-        if isinstance(x, list) == False:
-            dataloaders = [x]
-        else:
-            dataloaders = x
-        dataloaders.append(y)
-
-        num_samples = y.num_samples
-        batch_size = self._ffconfig.batch_size
-        self._tracing_id += 1  # get a new tracing id
-        for epoch in range(0, epochs):
-            for d in dataloaders:
-                d.reset()
-            self.reset_metrics()
-            iterations = num_samples / batch_size
-            for iter in range(0, int(iterations)):
-                self._ffconfig.begin_trace(self._tracing_id)
-                for d in dataloaders:
-                    d.next_batch(self)
-                self.forward()
-                self.zero_gradients()
-                self.backward()
-                self.update()
-                self._ffconfig.end_trace(self._tracing_id)
+        self.add_layer(OpType.ELU, name)
+        return Tensor(handle, owner_op_type=OpType.ELU)
 
-    def eval(self, x=None, y=None, batch_size=None):
-        """Returns the loss value & metrics values for the model in test mode.
+    def dropout(self, input, rate, seed, name=None):
+        """The Dropout layer randomly sets input units to 0 with
+        a frequency of :attr:`rate` at each step during training time,
+        which helps prevent overfitting.
+        Inputs not set to 0 are scaled up by 1/(1 - rate) such that the
+        sum over all inputs is unchanged.
 
-        :param x: Input data. It can be a Dataloader instance or a list of Dataloader instances.
-        :type x: Dataloader
+        :param input: the input Tensor.
+        :type input: Tensor
 
-        :param y: Target data (label). It can be a Dataloader instance or a list of Dataloader instances.
-        :type y: Dataloader
+        :param rate: Fraction of the input units to drop.
+        :type rate: float(0-1)
 
-        :param batch_size: Number of samples per gradient update. It must be identical with :attr:`-b`
-          or :attr:`--batch-size` from the command line.
-        :type batch_size: int
+        :param seed: random seed.
+        :type seed: int
 
-        :param epochs: Number of epochs to train the model.
-          An epoch is an iteration over the entire :attr:`x` and :attr:`y` data provided.
-          The default value is 1.
-        :type epochs: int
+        :param name: the name of the layer. Default is None.
+        :type name: string
 
-        :returns:  None -- no returns.
+        :returns:  Tensor -- the output tensor.
         """
-        if isinstance(x, list) == False:
-            dataloaders = [x]
-        else:
-            dataloaders = x
-        dataloaders.append(y)
-
-        num_samples = y.num_samples
-        batch_size = self._ffconfig.batch_size
-        for d in dataloaders:
-            d.reset()
-        self.reset_metrics()
-        iterations = num_samples / batch_size
-        self._tracing_id += 1  # get a new tracing id
-        for iter in range(0, int(iterations)):
-            for d in dataloaders:
-                d.next_batch(self)
-            self._ffconfig.begin_trace(self._tracing_id)
-            self.forward()
-            self.compute_metrics()
-            self._ffconfig.end_trace(self._tracing_id)
-
-    def zero_gradients(self):
-        """Empty the gradients of all layers.
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_dropout(
+            self.handle, input.handle, rate, seed, c_name
+        )
+        self.add_layer(OpType.DROPOUT, name)
+        return Tensor(handle, owner_op_type=OpType.DROPOUT)
 
-        :returns:  None -- no returns.
-        """
-        ffc().flexflow_model_zero_gradients(self.handle)
+    def multihead_attention(
+        self,
+        query,
+        key,
+        value,
+        embed_dim,
+        num_heads,
+        kdim=0,
+        vdim=0,
+        dropout=0.0,
+        bias=True,
+        add_bias_kv=False,
+        add_zero_attn=False,
+        kernel_initializer=None,
+        name=None,
+    ):
+        """Defines the MultiHead Attention operation as described in Attention Is All You Need
+        which takes in the tensors :attr:`query`, :attr:`key`, and :attr:`value`,
+        and returns the dot-product attention between them:.
 
-    def set_optimizer(self, optimizer):
-        if isinstance(optimizer, SGDOptimizer) == True:
-            ffc().flexflow_model_set_sgd_optimizer(self.handle, optimizer.handle)
-        elif isinstance(optimizer, AdamOptimizer) == True:
-            ffc().flexflow_model_set_adam_optimizer(self.handle, optimizer.handle)
-        elif optimizer == None:
-            pass
-        else:
-            assert 0, "[Model]: unknown optimizer"
+        :param query: the query Tensor.
+        :type query: Tensor
 
-    optimizer = property(fset=set_optimizer)
+        :param key: the key Tensor.
+        :type key: Tensor
 
-    def print_layers(self, id=-1):
-        ffc().flexflow_model_print_layers(self.handle, id)
+        :param value: the value Tensor.
+        :type value: Tensor
 
-    def get_layer_by_id(self, layer_id):
-        return self._layers[layer_id]
+        :param embed_dim: total dimension of the model
+        :type embed_dim: int
 
-    def get_last_layer(self):
-        return self._layers[self._nb_layers - 1]
+        :param num_heads: Number of attention heads.
+        :type num_heads: int
 
-    def get_layer_by_name(self, layer_name):
-        for layer_id in self._layers:
-            layer = self._layers[layer_id]
-            if layer.name == layer_name:
-                return layer
-        assert 0, f"Cannot find the layer with name {layer_name}"
-        return None
+        :param kdim: total number of features in key. Default is 0
+        :type kdim: int
 
-    def get_tensor_by_id(self, id):
-        handle = ffc().flexflow_model_get_parameter_by_id(self.handle, id)
-        return Parameter(handle)
+        :param vdim: total number of features in value. Default is 0
+        :type vdim: int
 
-    @property
-    def label_tensor(self):
-        handle = ffc().flexflow_model_get_label_tensor(self.handle)
-        return Tensor(handle, deallocate=False)
+        :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
+        :type dropout: float(0-1)
 
-    def get_perf_metrics(self):
-        handle = ffc().flexflow_model_get_perf_metrics(self.handle)
-        return PerfMetrics(handle)
+        :param bias: Whether the dense layers use bias vectors. Default is True.
+        :type bias: bool
 
-    def set_transformer_layer_id(self, id):
-        ffc().flexflow_model_set_transformer_layer_id(self.handle, id)
+        :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
+        :type add_bias_kv: bool
 
-    def create_data_loader(self, batch_tensor, full_array):
-        """Create a SingleDataloader instance.
+        :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
+        :type add_zero_attn: bool
 
-        :param batch_tensor: a batch-sized tensor. Usually it is a input tensor of the model.
-        :type batch_tensor: Tensor
+        :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+        :type kernel_initializer: Initializer
 
-        :param full_array: the entire data.
-        :type full_array: Numpy Array
+        :param name: the name of the layer. Default is None.
+        :type name: string
 
-        :returns:  SingleDataloader -- returns a dataloader instance.
+        :returns:  Tensor -- the output tensor.
         """
+        c_name = get_c_name(name)
+        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+        handle = ffc().flexflow_model_add_multihead_attention(
+            self.handle,
+            query.handle,
+            key.handle,
+            value.handle,
+            embed_dim,
+            num_heads,
+            kdim,
+            vdim,
+            dropout,
+            bias,
+            add_bias_kv,
+            add_zero_attn,
+            kernel_init_handle,
+            c_name,
+        )
+        self.add_layer(OpType.MULTIHEAD_ATTENTION, name)
+        return Tensor(handle, owner_op_type=OpType.MULTIHEAD_ATTENTION)
 
-        if self._ffconfig.enable_control_replication:
-            assert (
-                self._ffconfig.python_data_loader_type != 1
-            ), "To enable control replication, please set --python-data-loader-type 2"
-            return self.__create_data_loader_ptr(batch_tensor, full_array)
-        else:
-            if self._ffconfig.python_data_loader_type == 1:
-                return self.__create_data_loader_attach(batch_tensor, full_array)
-            else:
-                return self.__create_data_loader_ptr(batch_tensor, full_array)
-
-    def __create_data_loader_attach(self, batch_tensor, full_array):
-        full_array_shape = full_array.shape
-        num_samples = full_array_shape[0]
-        num_dim = len(full_array_shape)
-        if full_array.dtype == "float16":
-            datatype = DataType.DT_HALF
-        elif full_array.dtype == "float32":
-            datatype = DataType.DT_FLOAT
-        elif full_array.dtype == "int32":
-            datatype = DataType.DT_INT32
-        elif full_array.dtype == "int64":
-            datatype = DataType.DT_INT64
-        else:
-            assert 0, "unsupported datatype"
+    def inc_multihead_self_attention(
+        self,
+        input,
+        embed_dim,
+        num_heads,
+        kdim=0,
+        vdim=0,
+        dropout=0.0,
+        bias=True,
+        add_bias_kv=False,
+        add_zero_attn=False,
+        data_type=DataType.DT_NONE,
+        kernel_initializer=None,
+        apply_rotary_embedding=False,
+        scaling_query=False,
+        scaling_factor=1.0,
+        qk_prod_scaling=True,
+        position_bias=False,
+        name=None,
+    ):
+        """Defines the MultiHead Attention operation as described in Attention Is All You Need
+        which takes in the tensors :attr:`input`, and uses it for all three of query, key and values.
+        In inference mode, the attention is computed using incremental decoding.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param embed_dim: total dimension of the model
+        :type embed_dim: int
+
+        :param num_heads: Number of attention heads.
+        :type num_heads: int
+
+        :param kdim: total number of features in key. Default is 0
+        :type kdim: int
+
+        :param vdim: total number of features in value. Default is 0
+        :type vdim: int
+
+        :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
+        :type dropout: float(0-1)
+
+        :param bias: Whether the dense layers use bias vectors. Default is True.
+        :type bias: bool
+
+        :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
+        :type add_bias_kv: bool
+
+        :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
+        :type add_zero_attn: bool
+
+        :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
+        :type data_type: DataType
+
+        :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+        :type kernel_initializer: Initializer
+
+        :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
+        :type apply_rotary_embedding: bool
+
+        :param scaling_query: Whether to apply scaling query. Default is False.
+        :type scaling_query: bool
+
+        :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
+        :type scaling_factor: float
+
+        :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
+        :type qk_prod_scaling: bool
+
+        :param position_bias: Whether to add position bias to the QK product. Default is False.
+        :type position_bias: bool
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+        c_data_type = enum_to_int(DataType, data_type)
+        handle = ffc().flexflow_model_add_inc_multihead_self_attention(
+            self.handle,
+            input.handle,
+            embed_dim,
+            num_heads,
+            kdim,
+            vdim,
+            dropout,
+            bias,
+            add_bias_kv,
+            add_zero_attn,
+            c_data_type,
+            kernel_init_handle,
+            apply_rotary_embedding,
+            scaling_query,
+            scaling_factor,
+            qk_prod_scaling,
+            position_bias,
+            c_name,
+        )
+        self.add_layer(OpType.INC_MULTIHEAD_ATTENTION, name)
+        return Tensor(handle, owner_op_type=OpType.INC_MULTIHEAD_ATTENTION)
+
+    def spec_inc_multihead_self_attention(
+        self,
+        input,
+        embed_dim,
+        num_heads,
+        kdim=0,
+        vdim=0,
+        dropout=0.0,
+        bias=True,
+        add_bias_kv=False,
+        add_zero_attn=False,
+        data_type=DataType.DT_NONE,
+        kernel_initializer=None,
+        apply_rotary_embedding=False,
+        scaling_query=False,
+        scaling_factor=1.0,
+        qk_prod_scaling=True,
+        position_bias=False,
+        name=None,
+    ):
+        """Defines the MultiHead Attention operation as described in Attention Is All You Need
+        which takes in the tensors :attr:`input`, and uses it for all three of query, key and values.
+        This operator only supports computing the attention in inference (beam search) mode.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param embed_dim: total dimension of the model
+        :type embed_dim: int
+
+        :param num_heads: Number of attention heads.
+        :type num_heads: int
+
+        :param kdim: total number of features in key. Default is 0
+        :type kdim: int
+
+        :param vdim: total number of features in value. Default is 0
+        :type vdim: int
+
+        :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
+        :type dropout: float(0-1)
+
+        :param bias: Whether the dense layers use bias vectors. Default is True.
+        :type bias: bool
+
+        :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
+        :type add_bias_kv: bool
+
+        :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
+        :type add_zero_attn: bool
+
+        :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
+        :type data_type: DataType
+
+        :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+        :type kernel_initializer: Initializer
+
+        :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
+        :type apply_rotary_embedding: bool
+
+        :param scaling_query: Whether to apply scaling query. Default is False.
+        :type scaling_query: bool
+
+        :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
+        :type scaling_factor: float
+
+        :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
+        :type qk_prod_scaling: bool
+
+        :param position_bias: Whether to add position bias to the QK product. Default is False.
+        :type position_bias: bool
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+        c_data_type = enum_to_int(DataType, data_type)
+        handle = ffc().flexflow_model_add_spec_inc_multihead_self_attention(
+            self.handle,
+            input.handle,
+            embed_dim,
+            num_heads,
+            kdim,
+            vdim,
+            dropout,
+            bias,
+            add_bias_kv,
+            add_zero_attn,
+            c_data_type,
+            kernel_init_handle,
+            apply_rotary_embedding,
+            scaling_query,
+            scaling_factor,
+            qk_prod_scaling,
+            position_bias,
+            c_name,
+        )
+        self.add_layer(OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION, name)
+        return Tensor(handle, owner_op_type=OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION)
+
+    def inc_multihead_self_attention_verify(
+        self,
+        input,
+        embed_dim,
+        num_heads,
+        kdim=0,
+        vdim=0,
+        dropout=0.0,
+        bias=True,
+        add_bias_kv=False,
+        add_zero_attn=False,
+        data_type=DataType.DT_NONE,
+        kernel_initializer=None,
+        apply_rotary_embedding=False,
+        scaling_query=False,
+        scaling_factor=1.0,
+        qk_prod_scaling=True,
+        position_bias=False,
+        name=None,
+    ):
+        """Defines the MultiHead Attention operation as described in Attention Is All You Need
+        which takes in the tensors :attr:`input`, and uses it for all three of query, key and values.
+        This operator only supports computing the attention in inference (tree verify) mode.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param embed_dim: total dimension of the model
+        :type embed_dim: int
+
+        :param num_heads: Number of attention heads.
+        :type num_heads: int
+
+        :param kdim: total number of features in key. Default is 0
+        :type kdim: int
+
+        :param vdim: total number of features in value. Default is 0
+        :type vdim: int
+
+        :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
+        :type dropout: float(0-1)
+
+        :param bias: Whether the dense layers use bias vectors. Default is True.
+        :type bias: bool
+
+        :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
+        :type add_bias_kv: bool
+
+        :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
+        :type add_zero_attn: bool
+
+        :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
+        :type data_type: DataType
+
+        :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+        :type kernel_initializer: Initializer
+
+        :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
+        :type apply_rotary_embedding: bool
+
+        :param scaling_query: Whether to apply scaling query. Default is False.
+        :type scaling_query: bool
+
+        :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
+        :type scaling_factor: float
+
+        :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
+        :type qk_prod_scaling: bool
+
+        :param position_bias: Whether to add position bias to the QK product. Default is False.
+        :type position_bias: bool
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+        c_data_type = enum_to_int(DataType, data_type)
+        handle = ffc().flexflow_model_add_inc_multihead_self_attention_verify(
+            self.handle,
+            input.handle,
+            embed_dim,
+            num_heads,
+            kdim,
+            vdim,
+            dropout,
+            bias,
+            add_bias_kv,
+            add_zero_attn,
+            c_data_type,
+            kernel_init_handle,
+            apply_rotary_embedding,
+            scaling_query,
+            scaling_factor,
+            qk_prod_scaling,
+            position_bias,
+            c_name,
+        )
+        self.add_layer(OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION, name)
+        return Tensor(handle, owner_op_type=OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION)
+
+    def inc_multiquery_self_attention(
+        self,
+        input,
+        embed_dim,
+        num_q_heads,
+        num_kv_heads,
+        kdim=0,
+        vdim=0,
+        dropout=0.0,
+        bias=True,
+        add_bias_kv=False,
+        add_zero_attn=False,
+        data_type=DataType.DT_NONE,
+        kernel_initializer=None,
+        apply_rotary_embedding=False,
+        scaling_query=False,
+        scaling_factor=1.0,
+        qk_prod_scaling=True,
+        position_bias=False,
+        name=None,
+    ):
+        """Defines the multi-query head attention, which allows a different number of Q and KV heads,
+        and takes in the tensors :attr:`input`, and uses it for all three of query, key and values.
+        In inference mode, the attention is computed using incremental decoding.
+
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param embed_dim: total dimension of the model
+        :type embed_dim: int
+
+        :param num_q_heads: Number of query attention heads.
+        :type num_q_heads: int
+
+        :param num_kv_heads: Number of key/value attention heads.
+        :type num_kv_heads: int
+
+        :param kdim: total number of features in key. Default is 0
+        :type kdim: int
+
+        :param vdim: total number of features in value. Default is 0
+        :type vdim: int
+
+        :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
+        :type dropout: float(0-1)
+
+        :param bias: Whether the dense layers use bias vectors. Default is True.
+        :type bias: bool
+
+        :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
+        :type add_bias_kv: bool
+
+        :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
+        :type add_zero_attn: bool
+
+        :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
+        :type data_type: DataType
+
+        :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+        :type kernel_initializer: Initializer
+
+        :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
+        :type apply_rotary_embedding: bool
+
+        :param scaling_query: Whether to apply scaling query. Default is False.
+        :type scaling_query: bool
+
+        :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
+        :type scaling_factor: float
+
+        :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
+        :type qk_prod_scaling: bool
+
+        :param position_bias: Whether to add position bias to the QK product. Default is False.
+        :type position_bias: bool
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+        c_data_type = enum_to_int(DataType, data_type)
+        handle = ffc().flexflow_model_add_inc_multiquery_self_attention(
+            self.handle,
+            input.handle,
+            embed_dim,
+            num_q_heads,
+            num_kv_heads,
+            kdim,
+            vdim,
+            dropout,
+            bias,
+            add_bias_kv,
+            add_zero_attn,
+            c_data_type,
+            kernel_init_handle,
+            apply_rotary_embedding,
+            scaling_query,
+            scaling_factor,
+            qk_prod_scaling,
+            position_bias,
+            c_name,
+        )
+        self.add_layer(OpType.INC_MULTIHEAD_ATTENTION, name)
+        return Tensor(handle, owner_op_type=OpType.INC_MULTIHEAD_ATTENTION)
+
+    def spec_inc_multiquery_self_attention(
+        self,
+        input,
+        embed_dim,
+        num_q_heads,
+        num_kv_heads,
+        kdim=0,
+        vdim=0,
+        dropout=0.0,
+        bias=True,
+        add_bias_kv=False,
+        add_zero_attn=False,
+        data_type=DataType.DT_NONE,
+        kernel_initializer=None,
+        apply_rotary_embedding=False,
+        scaling_query=False,
+        scaling_factor=1.0,
+        qk_prod_scaling=True,
+        position_bias=False,
+        name=None,
+    ):
+        """Defines the multi-query head attention, which allows a different number of Q and KV heads,
+        and takes in the tensors :attr:`input`, and uses it for all three of query, key and values.
+        This operator only supports computing the attention in inference (beam search) mode.
 
-        if num_dim == 2:
-            full_tensor = self.create_tensor(
-                [num_samples, full_array_shape[1]], datatype
-            )
-            self.map_tensor(full_tensor)
-        elif num_dim == 4:
-            full_tensor = self.create_tensor(
-                [
-                    num_samples,
-                    full_array_shape[1],
-                    full_array_shape[2],
-                    full_array_shape[3],
-                ],
-                datatype,
-            )
-            self.map_tensor(full_tensor)
-        else:
-            assert 0, "unsupported dims"
+        :param input: the input Tensor.
+        :type input: Tensor
 
-        full_tensor.attach_numpy_array(self._ffconfig, full_array)
-        dataloader = SingleDataLoader(
-            self, batch_tensor, full_tensor, num_samples, datatype
-        )
-        full_tensor.detach_numpy_array(self._ffconfig)
+        :param embed_dim: total dimension of the model
+        :type embed_dim: int
 
-        return dataloader
+        :param num_q_heads: Number of query attention heads.
+        :type num_q_heads: int
 
-    def __create_data_loader_ptr(self, batch_tensor, full_array):
-        full_array_shape = full_array.shape
-        num_samples = full_array_shape[0]
-        if full_array.dtype == "float16":
-            datatype = DataType.DT_HALF
-        elif full_array.dtype == "float32":
-            datatype = DataType.DT_FLOAT
-        elif full_array.dtype == "int32":
-            datatype = DataType.DT_INT32
-        elif full_array.dtype == "int64":
-            datatype = DataType.DT_INT64
-        else:
-            assert 0, "unsupported datatype"
-        np_raw_ptr = full_array.__array_interface__["data"]
-        raw_ptr = ffi.cast("float*", np_raw_ptr[0])
-        print(
-            "numpy array: %s, %s, %s"
-            % (str(np_raw_ptr), str(raw_ptr), hex(np_raw_ptr[0]))
-        )
-        dataloader = SingleDataLoader(
-            self, batch_tensor, raw_ptr, num_samples, datatype
-        )
+        :param num_kv_heads: Number of key/value attention heads.
+        :type num_kv_heads: int
 
-        return dataloader
+        :param kdim: total number of features in key. Default is 0
+        :type kdim: int
 
-    def __get_initializer_handle(self, initializer):
-        if initializer == None:
-            null_initializer = Initializer(None)
-            return null_initializer.handle
-        else:
-            return initializer.handle
+        :param vdim: total number of features in value. Default is 0
+        :type vdim: int
 
-    def __get_op_handle(self, shared_op):
-        if shared_op == None:
-            op_handle = ffi.new("flexflow_op_t *")
-            op_handle.impl = ffi.NULL
-            op = Op(op_handle[0])
-        else:
-            op = shared_op
-        return op.handle
+        :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
+        :type dropout: float(0-1)
 
-    def get_output_tensor(self, ffmodel, data_type):
-        shape = self.dims
-        if data_type == DataType.DT_HALF:
-            np_array = np.empty(shape, dtype=np.float16)
-        elif data_type == DataType.DT_FLOAT:
-            np_array = np.empty(shape, dtype=np.float32)
-        elif self.data_type == DataType.DT_INT32:
-            np_array = np.empty(shape, dtype=np.int32)
-        elif self.data_type == DataType.DT_INT64:
-            np_array = np.empty(shape, dtype=np.int64)
-        else:
-            assert 0, f"Unsupported datatype: {self.data_type}"
-        np_raw_ptr = np_array.__array_interface__["data"]
-        if np_array.dtype == np.float32:
-            raw_ptr = ffi.cast("float*", np_raw_ptr[0])
-            ret_val = ffc().flexflow_tensor_get_tensor_float(
-                self.handle, ffmodel.handle, raw_ptr, False
-            )
-        elif np_array.dtype == np.int32:
-            raw_ptr = ffi.cast("int*", np_raw_ptr[0])
-            ret_val = ffc().flexflow_tensor_get_tensor_int(
-                self.handle, ffmodel.handle, raw_ptr, False
-            )
-        elif np_array.dtype == np.int64:
-            raw_ptr = ffi.cast("int64_t*", np_raw_ptr[0])
-            ret_val = ffc().flexflow_tensor_get_tensor_int64(
-                self.handle, ffmodel.handle, raw_ptr, False
-            )
-        fflogger.debug(
-            "get weights raw_ptr: %s, %s, %s, %s"
-            % (str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(shape))
-        )
-        assert ret_val == True
-        return np_array
+        :param bias: Whether the dense layers use bias vectors. Default is True.
+        :type bias: bool
 
-    def generate(self, prompt_list, max_sequence_length):
-        assert isinstance(prompt_list, list)
-        c_input_texts = [get_c_name(prompt) for prompt in prompt_list]
-        max_num_chars = 5 * (max_sequence_length + 100)
-        c_output_texts = [ffi.new("char[]", max_num_chars) for prompt in prompt_list]
-        c_output_length_and_tokens = [ffi.new("int[]", max_sequence_length + 100) for prompt in prompt_list]
-        ffc().flexflow_model_generate(
-            self.handle,
-            len(prompt_list),
-            c_input_texts,
-            max_num_chars,
-            c_output_texts,
-            max_sequence_length,
-            c_output_length_and_tokens,
-        )
-        #output_length = c_output_length_and_tokens[0]
-        #output_tokens = []
-        #for i in range(output_length):
-        #    output_tokens.append(c_output_length_and_tokens[i + 1])
-        from flexflow.serve import GenerationResult
+        :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
+        :type add_bias_kv: bool
 
-        return [GenerationResult(ffi.string(c_output_text), []) for c_output_text in c_output_texts]
+        :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
+        :type add_zero_attn: bool
 
-    def set_position_offset(self, offset):
-        ffc().flexflow_model_set_position_offset(self.handle, offset)
+        :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
+        :type data_type: DataType
 
+        :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+        :type kernel_initializer: Initializer
 
-# -----------------------------------------------------------------------
-# SGDOptimizer
-# -----------------------------------------------------------------------
+        :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
+        :type apply_rotary_embedding: bool
 
+        :param scaling_query: Whether to apply scaling query. Default is False.
+        :type scaling_query: bool
 
-class SGDOptimizer(object):
-    __slots__ = ["handle", "_handle"]
+        :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
+        :type scaling_factor: float
 
-    def __init__(
-        self, ffmodel, lr=0.01, momentum=0.0, nesterov=False, weight_decay=0.0
-    ):
-        self.handle = ffc().flexflow_sgd_optimizer_create(
-            ffmodel.handle, lr, momentum, nesterov, weight_decay
+        :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
+        :type qk_prod_scaling: bool
+
+        :param position_bias: Whether to add position bias to the QK product. Default is False.
+        :type position_bias: bool
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+        c_data_type = enum_to_int(DataType, data_type)
+        handle = ffc().flexflow_model_add_spec_inc_multiquery_self_attention(
+            self.handle,
+            input.handle,
+            embed_dim,
+            num_q_heads,
+            num_kv_heads,
+            kdim,
+            vdim,
+            dropout,
+            bias,
+            add_bias_kv,
+            add_zero_attn,
+            c_data_type,
+            kernel_init_handle,
+            apply_rotary_embedding,
+            scaling_query,
+            scaling_factor,
+            qk_prod_scaling,
+            position_bias,
+            c_name,
         )
-        self._handle = ffi.gc(self.handle, ffc().flexflow_sgd_optimizer_destroy)
+        self.add_layer(OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION, name)
+        return Tensor(handle, owner_op_type=OpType.SPEC_INC_MULTIHEAD_SELF_ATTENTION)
 
-    def set_learning_rate(self, learning_rate):
-        ffc().flexflow_sgd_optimizer_set_lr(self.handle, learning_rate)
+    def inc_multiquery_self_attention_verify(
+        self,
+        input,
+        embed_dim,
+        num_q_heads,
+        num_kv_heads,
+        kdim=0,
+        vdim=0,
+        dropout=0.0,
+        bias=True,
+        add_bias_kv=False,
+        add_zero_attn=False,
+        data_type=DataType.DT_NONE,
+        kernel_initializer=None,
+        apply_rotary_embedding=False,
+        scaling_query=False,
+        scaling_factor=1.0,
+        qk_prod_scaling=True,
+        position_bias=False,
+        name=None,
+    ):
+        """Defines the multi-query head attention, which allows a different number of Q and KV heads,
+        and takes in the tensors :attr:`input`, and uses it for all three of query, key and values.
+        This operator only supports computing the attention in inference (tree verify) mode.
+
+        :param input: the input Tensor.
+        :type input: Tensor
 
+        :param embed_dim: total dimension of the model
+        :type embed_dim: int
 
-# -----------------------------------------------------------------------
-# AdamOptimizer
-# -----------------------------------------------------------------------
+        :param num_q_heads: Number of query attention heads.
+        :type num_q_heads: int
 
+        :param num_kv_heads: Number of key/value attention heads.
+        :type num_kv_heads: int
 
-class AdamOptimizer(object):
-    __slots__ = ["handle", "_handle"]
+        :param kdim: total number of features in key. Default is 0
+        :type kdim: int
 
-    def __init__(
-        self,
-        ffmodel,
-        alpha=0.001,
-        beta1=0.9,
-        beta2=0.999,
-        weight_decay=0.0,
-        epsilon=1e-8,
-    ):
-        self.handle = ffc().flexflow_adam_optimizer_create(
-            ffmodel.handle, alpha, beta1, beta2, weight_decay, epsilon
-        )
-        self._handle = ffi.gc(self.handle, ffc().flexflow_adam_optimizer_destroy)
+        :param vdim: total number of features in value. Default is 0
+        :type vdim: int
+
+        :param dropout: a Dropout layer on attn_output_weights. Default is 0.0
+        :type dropout: float(0-1)
+
+        :param bias: Whether the dense layers use bias vectors. Default is True.
+        :type bias: bool
+
+        :param add_bias_kv: add bias to the key and value sequences at dim=0. Default is False.
+        :type add_bias_kv: bool
+
+        :param add_zero_attn: add a new batch of zeros to the key and value sequences at dim=1. Default is False.
+        :type add_zero_attn: bool
 
-    def set_learning_rate(self, learning_rate):
-        ffc().flexflow_adam_optimizer_set_lr(self.handle, learning_rate)
+        :param data_type: the data type of the tensors. Default is DataType.DT_NONE, which means using the data type of the input tensors.
+        :type data_type: DataType
 
+        :param kernel_initializer: Initializer for dense layer kernels. If it is set to None, the GlorotUniformInitializer is applied.
+        :type kernel_initializer: Initializer
 
-# -----------------------------------------------------------------------
-# Initializer
-# -----------------------------------------------------------------------
-class Initializer(object):
-    __slots__ = ["handle", "p_handle"]
+        :param apply_rotary_embedding: Whether to apply rotary embeddings. Default is False.
+        :type apply_rotary_embedding: bool
 
-    def __init__(self, handle, p_handle=0):
-        self.p_handle = ffi.new("flexflow_initializer_t *")
-        if handle == None:
-            self.p_handle.impl = ffi.NULL
-        else:
-            self.p_handle.impl = handle.impl
-        self.handle = self.p_handle[0]
-        assert ffi.typeof(self.handle) == ffi.typeof(
-            "flexflow_initializer_t"
-        ), "Initializer handle is wrong"
+        :param scaling_query: Whether to apply scaling query. Default is False.
+        :type scaling_query: bool
 
+        :param scaling_factor: The scaling factor to use for scaling. Default is 1.0.
+        :type scaling_factor: float
 
-# -----------------------------------------------------------------------
-# GlorotUniform
-# -----------------------------------------------------------------------
+        :param qk_prod_scaling: Whether to apply scaling to the QK product. Default is True.
+        :type qk_prod_scaling: bool
 
+        :param position_bias: Whether to add position bias to the QK product. Default is False.
+        :type position_bias: bool
 
-class GlorotUniformInitializer(Initializer):
-    __slots__ = ["glorot_handle", "_glorot_handle"]
+        :param name: the name of the layer. Default is None.
+        :type name: string
 
-    def __init__(self, seed):
-        self.glorot_handle = ffc().flexflow_glorot_uniform_initializer_create(seed)
-        self._glorot_handle = ffi.gc(
-            self.glorot_handle, ffc().flexflow_glorot_uniform_initializer_destroy
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        kernel_init_handle = self.__get_initializer_handle(kernel_initializer)
+        c_data_type = enum_to_int(DataType, data_type)
+        handle = ffc().flexflow_model_add_inc_multiquery_self_attention_verify(
+            self.handle,
+            input.handle,
+            embed_dim,
+            num_q_heads,
+            num_kv_heads,
+            kdim,
+            vdim,
+            dropout,
+            bias,
+            add_bias_kv,
+            add_zero_attn,
+            c_data_type,
+            kernel_init_handle,
+            apply_rotary_embedding,
+            scaling_query,
+            scaling_factor,
+            qk_prod_scaling,
+            position_bias,
+            c_name,
         )
-        super(GlorotUniformInitializer, self).__init__(self.glorot_handle)
+        self.add_layer(OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION, name)
+        return Tensor(handle, owner_op_type=OpType.TREE_INC_MULTIHEAD_SELF_ATTENTION)
 
+    def rms_norm(self, input, eps, dim, name=None):
+        """Defines the RMS Norm layer.
 
-# -----------------------------------------------------------------------
-# ZeroInitializer
-# -----------------------------------------------------------------------
+        :param input: the input Tensor.
+        :type input: Tensor
+
+        :param eps: a value added to the denominator for numerical stability
+        :type eps: float
 
+        :param dim: The dimension with respect to which to take the norm
+        :type dim: int
 
-class ZeroInitializer(Initializer):
-    __slots__ = ["zero_handle", "_zero_handle"]
+        :param name: the name of the layer. Default is None.
+        :type name: string
 
-    def __init__(self):
-        self.zero_handle = ffc().flexflow_zero_initializer_create()
-        self._zero_handle = ffi.gc(
-            self.zero_handle, ffc().flexflow_zero_initializer_destroy
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_rms_norm(
+            self.handle, input.handle, eps, dim, c_name
         )
-        super(ZeroInitializer, self).__init__(self.zero_handle)
+        self.add_layer(OpType.RMS_NORM, name)
+        return Tensor(handle, owner_op_type=OpType.RMS_NORM)
 
+    def residual_rms_norm(
+        self, input1, input2, eps, dim, inplace_residual=False, name=None
+    ):
+        """Defines the Residual RMS Norm layer.
 
-# -----------------------------------------------------------------------
-# UniformInitializer
-# -----------------------------------------------------------------------
+        :param input: the input 1 Tensor.
+        :type input: Tensor
 
+        :param input: the input 2 Tensor.
+        :type input: Tensor
 
-class UniformInitializer(Initializer):
-    __slots__ = ["uniform_handle", "_uniform_handle"]
+        :param eps: a value added to the denominator for numerical stability
+        :type eps: float
 
-    def __init__(self, seed, minv, maxv):
-        self.uniform_handle = ffc().flexflow_uniform_initializer_create(
-            seed, minv, maxv
+        :param dim: The dimension with respect to which to take the norm
+        :type dim: int
+
+        :param name: the name of the layer. Default is None.
+        :type name: string
+
+        :param inplace_residual: whether to compute the residual inplace using the input tensor. Default is False.
+        :type inplace_residual: bool
+
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handles_array = ffc().flexflow_model_add_residual_rms_norm(
+            self.handle,
+            input1.handle,
+            input2.handle,
+            eps,
+            dim,
+            inplace_residual,
+            c_name,
         )
-        self._uniform_handle = ffi.gc(
-            self.uniform_handle, ffc().flexflow_uniform_initializer_destroy
+        self.add_layer(OpType.RESIDUAL_RMS_NORM, name)
+        return (
+            Tensor(handles_array[0], owner_op_type=OpType.RESIDUAL_RMS_NORM),
+            Tensor(handles_array[1], owner_op_type=OpType.RESIDUAL_RMS_NORM),
         )
-        super(UniformInitializer, self).__init__(self.uniform_handle)
 
+    def arg_top_k(self, input, k, sorted, speculative_decoding, name=None):
+        """Defines the Arg TopK layer.
 
-# -----------------------------------------------------------------------
-# NormInitializer
-# -----------------------------------------------------------------------
+        :param input: the input Tensor.
+        :type input: Tensor
 
+        :param k: the top k indices to select
+        :type k: int
 
-class NormInitializer(Initializer):
-    __slots__ = ["norm_handle", "_norm_handle"]
+        :param sorted: Whether the entries should be sorted
+        :type sorted: bool
 
-    def __init__(self, seed, mean, stddev):
-        self.norm_handle = ffc().flexflow_norm_initializer_create(seed, mean, stddev)
-        self._norm_handle = ffi.gc(
-            self.norm_handle, ffc().flexflow_norm_initializer_destroy
-        )
-        super(NormInitializer, self).__init__(self.norm_handle)
+        :param speculative_decoding: Whether you need to perform beam search
+        :type speculative_decoding: bool
 
+        :param name: the name of the layer. Default is None.
+        :type name: string
 
-# -----------------------------------------------------------------------
-# PerfMetrics
-# -----------------------------------------------------------------------
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_arg_top_k(
+            self.handle, input.handle, k, sorted, c_name
+        )
+        self.add_layer(OpType.ARG_TOPK, name)
+        return Tensor(handle, owner_op_type=OpType.ARG_TOPK)
 
+    def beam_top_k(self, input, max_beam_size, sorted, name=None):
+        """Defines the Beam TopK layer.
 
-class PerfMetrics(object):
-    __slots__ = ["handle", "_handle"]
+        :param input: the input Tensor.
+        :type input: Tensor
 
-    def __init__(self, handle):
-        self.handle = handle
-        self._handle = ffi.gc(self.handle, ffc().flexflow_per_metrics_destroy)
+        :param max_beam_size: the top max_beam_size indices to select
+        :type max_beam_size: int
 
-    def get_accuracy(self):
-        return ffc().flexflow_per_metrics_get_accuracy(self.handle)
+        :param sorted: Whether the entries should be sorted
+        :type sorted: bool
 
+        :param name: the name of the layer. Default is None.
+        :type name: string
 
-# -----------------------------------------------------------------------
-# NetConfig
-# -----------------------------------------------------------------------
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_beam_top_k(
+            self.handle, input.handle, max_beam_size, sorted, c_name
+        )
+        self.add_layer(OpType.BEAM_TOPK, name)
+        return Tensor(handle, owner_op_type=OpType.BEAM_TOPK)
 
+    def sampling(self, input, top_p, name=None):
+        """Defines the Sampling layer.
 
-class NetConfig(object):
-    def __init__(self):
-        self.handle = ffc().flexflow_net_config_create()
-        self._handle = ffi.gc(self.handle, ffc().flexflow_net_config_destroy)
-        cpath = ffc().flexflow_net_config_get_dataset_path(self.handle)
-        self.dataset_path = ffi.string(cpath)
+        :param input: the input Tensor.
+        :type input: Tensor
 
+        :param top_p: The top_p parameter of the sampling
+        :type top_p: float
 
-# -----------------------------------------------------------------------
-# DLRMConfig
-# -----------------------------------------------------------------------
+        :param name: the name of the layer. Default is None.
+        :type name: string
 
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_sampling(
+            self.handle, input.handle, top_p, c_name
+        )
+        self.add_layer(OpType.SAMPLING, name)
+        return Tensor(handle, owner_op_type=OpType.SAMPLING)
 
-class DLRMConfig(object):
-    def __init__(self):
-        self.handle = ffc().flexflow_dlrm_config_create()
-        self._handle = ffi.gc(self.handle, ffc().flexflow_dlrm_config_destroy)
+    def argmax(self, input, beam_search, name=None):
+        """Defines the Sampling layer.
 
-        cstr = ffc().flexflow_dlrm_config_get_dataset_path(self.handle)
-        self.dataset_path = ffi.string(cstr)
+        :param input: the input Tensor.
+        :type input: Tensor
 
-        cstr = ffc().flexflow_dlrm_config_get_arch_interaction_op(self.handle)
-        self.arch_interaction_op = ffi.string(cstr)
+        :param beam_search: Whether you need to perform beam search
+        :type beam_search: bool
 
-        self.sparse_feature_size = ffc().flexflow_dlrm_config_get_sparse_feature_size(
-            self.handle
-        )
-        self.sigmoid_bot = ffc().flexflow_dlrm_config_get_sigmoid_bot(self.handle)
-        self.sigmoid_top = ffc().flexflow_dlrm_config_get_sigmoid_top(self.handle)
-        self.embedding_bag_size = ffc().flexflow_dlrm_config_get_embedding_bag_size(
-            self.handle
-        )
-        self.loss_threshold = ffc().flexflow_dlrm_config_get_loss_threshold(self.handle)
+        :param name: the name of the layer. Default is None.
+        :type name: string
 
-        mlp_bot_c = ffc().flexflow_dlrm_config_get_mlp_bot(self.handle)
-        self.mlp_bot = []
-        for i in range(0, mlp_bot_c[0]):
-            self.mlp_bot.append(mlp_bot_c[i + 1])
+        :returns:  Tensor -- the output tensor.
+        """
+        c_name = get_c_name(name)
+        handle = ffc().flexflow_model_add_argmax(
+            self.handle, input.handle, beam_search, c_name
+        )
+        self.add_layer(OpType.ARGMAX, name)
+        return Tensor(handle, owner_op_type=OpType.ARGMAX)
 
-        mlp_top_c = ffc().flexflow_dlrm_config_get_mlp_top(self.handle)
-        self.mlp_top = []
-        for i in range(0, mlp_top_c[0]):
-            self.mlp_top.append(mlp_top_c[i + 1])
+    def add_lora_layer(self, peft_config):
+        return ffc().flexflow_model_add_lora_layer(self.handle, peft_config.handle)
 
-        embedding_size_c = ffc().flexflow_dlrm_config_get_embedding_size(self.handle)
-        self.embedding_size = []
-        for i in range(0, embedding_size_c[0]):
-            self.embedding_size.append(embedding_size_c[i + 1])
+    def reset_metrics(self):
+        """Reset performance metrics.
 
+        :returns:  None -- no returns.
+        """
+        ffc().flexflow_model_reset_metrics(self.handle)
 
-# -----------------------------------------------------------------------
-# Single DataLoader
-# -----------------------------------------------------------------------
+    def init_layers(self):
+        """Initialize layers.
 
+        :returns:  None -- no returns.
+        """
+        ffc().flexflow_model_init_layers(self.handle)
 
-class SingleDataLoader(object):
-    __slots__ = ["handle", "_handle"]
+    def prefetch(self):
+        ffc().flexflow_model_prefetch(self.handle)
 
-    def __init__(self, ffmodel, input, full_input, num_samples, data_type):
-        assert type(ffmodel) is FFModel, "SingleDataLoader ffmodel is wrong"
-        assert type(input) is Tensor, "SingleDataLoader input is wrong"
-        if type(full_input) is Tensor:
-            self.init_from_tensor(ffmodel, input, full_input, num_samples, data_type)
-        else:
-            self.init_from_ptr(ffmodel, input, full_input, num_samples, data_type)
-        self._handle = ffi.gc(self.handle, ffc().flexflow_single_dataloader_destroy)
+    def forward(self, seq_length=None):
+        """Forward propagation of all layers.
 
-    def init_from_tensor(self, ffmodel, input, full_input, num_samples, data_type):
-        assert type(full_input) is Tensor, "SingleDataLoader full_input is wrong"
-        c_data_type = enum_to_int(DataType, data_type)
-        self.handle = ffc().flexflow_single_dataloader_create(
-            ffmodel.handle, input.handle, full_input.handle, num_samples, c_data_type
-        )
+        :returns:  None -- no returns.
+        """
+        if seq_length is None:
+            seq_length = -1
+        ffc().flexflow_model_forward(self.handle, seq_length)
 
-    def init_from_ptr(self, ffmodel, input, full_input, num_samples, data_type):
-        # assert type(full_input) is Tensor, "SingleDataLoader full_input is wrong"
-        c_data_type = enum_to_int(DataType, data_type)
-        self.handle = ffc().flexflow_single_dataloader_create2(
-            ffmodel.handle, input.handle, full_input, num_samples, c_data_type
-        )
+    # TODO: seperate compute_metrics from backward
+    def backward(self, seq_length=None):
+        """Backward propagation of all layers.
 
-    @property
-    def num_samples(self):
-        return ffc().flexflow_single_dataloader_get_num_samples(self.handle)
+        :returns:  None -- no returns.
+        """
+        if seq_length is None:
+            seq_length = -1
+        ffc().flexflow_model_backward(self.handle, seq_length)
 
-    @num_samples.setter
-    def num_samples(self, samples):
-        ffc().flexflow_single_dataloader_set_num_samples(self.handle, samples)
+    def compute_metrics(self):
+        """Compute performance metrics.
 
-    def next_batch(self, ffmodel):
-        """Ask the dataloder to load the next batch to the :attr:`batch_tensor`.
+        :returns:  None -- no returns.
+        """
+        ffc().flexflow_model_compute_metrics(self.handle)
+
+    def update(self):
+        """Update weights and biases of all layers.
 
         :returns:  None -- no returns.
         """
-        ffc().flowflow_single_dataloader_next_batch(self.handle, ffmodel.handle)
+        ffc().flexflow_model_update(self.handle)
 
-    def reset(self):
-        """Reset the current position of the dataloder to 0.
+    def compile(self, optimizer=None, loss_type=None, metrics=None, comp_mode=None):
+        """Configure the model for trainting. FlexFlow uses lazy initialization,
+        so the actual creating of all operations (including creating and partitioning
+        of weight, bias and output tensors) happen during compile.
+
+        :param optimizer: optimizer instance.
+        :type optimizer: Optimizer
+
+        :param loss_type: Enum of LossType.
+          Options are LOSS_CATEGORICAL_CROSSENTROPY, LOSS_SPARSE_CATEGORICAL_CROSSENTROPY,
+          LOSS_MEAN_SQUARED_ERROR_AVG_REDUCE and LOSS_MEAN_SQUARED_ERROR_SUM_REDUCE.
+        :type loss_type: LossType
+
+        :param metrics: List of metrics to be evaluated by the model during training and testing.
+          Each of this is a Enum of MetricsType. Options are METRICS_ACCURACY,
+          METRICS_CATEGORICAL_CROSSENTROPY, METRICS_SPARSE_CATEGORICAL_CROSSENTROPY,
+          METRICS_MEAN_SQUARED_ERROR, METRICS_ROOT_MEAN_SQUARED_ERROR, METRICS_MEAN_ABSOLUTE_ERROR
+        :type metrics: MetricsType
+
+        :param comp_mode: Enum of CompMode.
+          Options are COMP_MODE_TRAINING, COMP_MODE_INFERENCE
+        :type comp_mode: CompMode
 
         :returns:  None -- no returns.
         """
-        ffc().flexflow_single_dataloader_reset(self.handle)
+        self.optimizer = optimizer
 
+        c_loss_type = enum_to_int(LossType, loss_type)
+        metrics_int = []
+        for metric in metrics:
+            metrics_int.append(enum_to_int(MetricsType, metric))
+        c_metrics = ffi.new("int[]", metrics_int)
+        if comp_mode == None:
+            comp_mode = CompMode.TRAINING
+        c_comp_mode = enum_to_int(CompMode, comp_mode)
+        ffc().flexflow_model_compile(
+            self.handle, c_loss_type, c_metrics, len(metrics), c_comp_mode
+        )
+        for ff_tensor, np_tensor in self.attr_tensors.items():
+            ff_tensor.set_tensor(self, np_tensor)
+        print("Compiled ffmodel!")
 
-class RegionNdarray(object):
-    __slots__ = ["__array_interface__"]
+    def fit(self, x=None, y=None, batch_size=None, epochs=1):
+        """Trains the model for a fixed number of epochs (iterations on a dataset).
 
-    def __init__(self, shape, data_type, base_ptr, strides, read_only):
-        # See: https://docs.scipy.org/doc/numpy/reference/arrays.interface.html
-        if data_type == DataType.DT_HALF:
-            field_type = "<f2"
-        elif data_type == DataType.DT_FLOAT:
-            field_type = "<f4"
-        elif data_type == DataType.DT_INT32:
-            field_type = "<i4"
-        else:
-            assert 0, "unknown data type"
-            field_type = "<f4"
-        self.__array_interface__ = {
-            "version": 3,
-            "shape": shape,
-            "typestr": field_type,
-            "data": (base_ptr, read_only),
-            "strides": strides,
-        }
+        :param x: Input data. It can be a Dataloader instance or a list of Dataloader instances.
+        :type x: Dataloader
 
+        :param y: Target data (label). It can be a Dataloader instance or a list of Dataloader instances.
+        :type y: Dataloader
 
-# -----------------------------------------------------------------------
-# BatchConfig
-# -----------------------------------------------------------------------
+        :param batch_size: Number of samples per gradient update. It must be identical with :attr:`-b`
+          or :attr:`--batch-size` from the command line.
+        :type batch_size: int
 
+        :param epochs: Number of epochs to train the model.
+          An epoch is an iteration over the entire :attr:`x` and :attr:`y` data provided.
+          The default value is 1.
+        :type epochs: int
 
-class BatchConfig(object):
-    __slots__ = ["handle", "_handle"]
+        :returns:  None -- no returns.
+        """
+        if isinstance(x, list) == False:
+            dataloaders = [x]
+        else:
+            dataloaders = x
+        dataloaders.append(y)
 
-    def __init__(self):
-        self.handle = ffc().flexflow_batch_config_create()
-        self._handle = ffi.gc(self.handle, ffc().flexflow_batch_config_destroy)
+        num_samples = y.num_samples
+        batch_size = self._ffconfig.batch_size
+        self._tracing_id += 1  # get a new tracing id
+        for epoch in range(0, epochs):
+            for d in dataloaders:
+                d.reset()
+            self.reset_metrics()
+            iterations = num_samples / batch_size
+            for iter in range(0, int(iterations)):
+                self._ffconfig.begin_trace(self._tracing_id)
+                for d in dataloaders:
+                    d.next_batch(self)
+                self.forward()
+                self.zero_gradients()
+                self.backward()
+                self.update()
+                self._ffconfig.end_trace(self._tracing_id)
 
+    def eval(self, x=None, y=None, batch_size=None):
+        """Returns the loss value & metrics values for the model in test mode.
 
-# -----------------------------------------------------------------------
-# TreeVerifyBatchConfig
-# -----------------------------------------------------------------------
+        :param x: Input data. It can be a Dataloader instance or a list of Dataloader instances.
+        :type x: Dataloader
 
+        :param y: Target data (label). It can be a Dataloader instance or a list of Dataloader instances.
+        :type y: Dataloader
 
-class TreeVerifyBatchConfig(object):
-    __slots__ = ["handle", "_handle"]
+        :param batch_size: Number of samples per gradient update. It must be identical with :attr:`-b`
+          or :attr:`--batch-size` from the command line.
+        :type batch_size: int
 
-    def __init__(self):
-        self.handle = ffc().flexflow_tree_verify_batch_config_create()
-        self._handle = ffi.gc(
-            self.handle, ffc().flexflow_tree_verify_batch_config_destroy
-        )
+        :param epochs: Number of epochs to train the model.
+          An epoch is an iteration over the entire :attr:`x` and :attr:`y` data provided.
+          The default value is 1.
+        :type epochs: int
 
+        :returns:  None -- no returns.
+        """
+        if isinstance(x, list) == False:
+            dataloaders = [x]
+        else:
+            dataloaders = x
+        dataloaders.append(y)
 
-# -----------------------------------------------------------------------
-# BeamSearchBatchConfig
-# -----------------------------------------------------------------------
+        num_samples = y.num_samples
+        batch_size = self._ffconfig.batch_size
+        for d in dataloaders:
+            d.reset()
+        self.reset_metrics()
+        iterations = num_samples / batch_size
+        self._tracing_id += 1  # get a new tracing id
+        for iter in range(0, int(iterations)):
+            for d in dataloaders:
+                d.next_batch(self)
+            self._ffconfig.begin_trace(self._tracing_id)
+            self.forward()
+            self.compute_metrics()
+            self._ffconfig.end_trace(self._tracing_id)
 
+    def zero_gradients(self):
+        """Empty the gradients of all layers.
 
-class BatchConfig(object):
-    __slots__ = ["handle", "_handle"]
+        :returns:  None -- no returns.
+        """
+        ffc().flexflow_model_zero_gradients(self.handle)
 
-    def __init__(self):
-        self.handle = ffc().flexflow_beam_search_batch_config_create()
-        self._handle = ffi.gc(
-            self.handle, ffc().flexflow_beam_search_batch_config_destroy
-        )
+    def set_optimizer(self, optimizer):
+        if isinstance(optimizer, SGDOptimizer) == True:
+            ffc().flexflow_model_set_sgd_optimizer(self.handle, optimizer.handle)
+        elif isinstance(optimizer, AdamOptimizer) == True:
+            ffc().flexflow_model_set_adam_optimizer(self.handle, optimizer.handle)
+        elif optimizer == None:
+            pass
+        else:
+            assert 0, "[Model]: unknown optimizer"
+
+    optimizer = property(fset=set_optimizer)
+
+    def print_layers(self, id=-1):
+        ffc().flexflow_model_print_layers(self.handle, id)
 
+    def get_layer_by_id(self, layer_id):
+        return self._layers[layer_id]
 
-# -----------------------------------------------------------------------
-# RequestManager
-# -----------------------------------------------------------------------
+    def get_last_layer(self):
+        return self._layers[self._nb_layers - 1]
 
+    def get_layer_by_name(self, layer_name):
+        for layer_id in self._layers:
+            layer = self._layers[layer_id]
+            if layer.name == layer_name:
+                return layer
+        assert 0, f"Cannot find the layer with name {layer_name}"
+        return None
 
-class RequestManager(object):
-    __slots__ = ["handle"]
+    def get_tensor_by_id(self, id):
+        handle = ffc().flexflow_model_get_parameter_by_id(self.handle, id)
+        return Parameter(handle)
 
-    def __init__(self):
-        self.handle = ffc().flexflow_request_manager_get_request_manager()
-        # self._handle = ffi.gc(self.handle, ffc().flexflow_request_manager_destroy)
+    @property
+    def label_tensor(self):
+        handle = ffc().flexflow_model_get_label_tensor(self.handle)
+        return Tensor(handle, deallocate=False)
 
-    def register_tokenizer(
-        self, model_type, bos_token_id, eos_token_id, tokenizer_filepath
-    ):
-        c_model_type = enum_to_int(ModelType, model_type)
-        c_tokenizer_filepath = get_c_name(tokenizer_filepath)
-        return ffc().flexflow_request_manager_register_tokenizer(
-            self.handle, c_model_type, bos_token_id, eos_token_id, c_tokenizer_filepath
-        )
+    def get_perf_metrics(self):
+        handle = ffc().flexflow_model_get_perf_metrics(self.handle)
+        return PerfMetrics(handle)
 
-    def register_output_filepath(self, output_filepath):
-        c_output_filepath = get_c_name(output_filepath)
-        return ffc().flexflow_request_manager_register_output_filepath(
-            self.handle, c_output_filepath
-        )
+    def set_transformer_layer_id(self, id):
+        ffc().flexflow_model_set_transformer_layer_id(self.handle, id)
 
-    def register_ssm_model(self, model):
-        return ffc().flexflow_request_manager_register_ssm_model(
-            self.handle, model.handle
-        )
+    def create_data_loader(self, batch_tensor, full_array):
+        """Create a SingleDataloader instance.
 
-    def set_max_requests_per_batch(self, max_requests):
-        return ffc().flexflow_request_manager_set_max_requests_per_batch(
-            self.handle, max_requests)
-    
-    def set_max_tokens_per_batch(self, max_tokens):
-        return ffc().flexflow_request_manager_set_max_tokens_per_batch(
-            self.handle, max_tokens)
-    
-    def set_max_spec_tree_token_num(self, max_tokens):
-        return ffc().flexflow_request_manager_set_max_spec_tree_token_num(
-            self.handle, max_tokens)
-    
-    def set_max_sequence_length(self, max_length):
-        return ffc().flexflow_request_manager_set_max_sequence_length(
-            self.handle, max_length)
+        :param batch_tensor: a batch-sized tensor. Usually it is a input tensor of the model.
+        :type batch_tensor: Tensor
 
-    def start_server(self, model):
-        return ffc().flexflow_request_manager_start_background_server(
-            self.handle, model.handle
-        )
+        :param full_array: the entire data.
+        :type full_array: Numpy Array
 
-    def stop_server(self):
-        return ffc().flexflow_request_manager_terminate_background_server(
-            self.handle)
-# -----------------------------------------------------------------------
-# InferenceManager
-# -----------------------------------------------------------------------
+        :returns:  SingleDataloader -- returns a dataloader instance.
+        """
 
+        if self._ffconfig.enable_control_replication:
+            assert (
+                self._ffconfig.python_data_loader_type != 1
+            ), "To enable control replication, please set --python-data-loader-type 2"
+            return self.__create_data_loader_ptr(batch_tensor, full_array)
+        else:
+            if self._ffconfig.python_data_loader_type == 1:
+                return self.__create_data_loader_attach(batch_tensor, full_array)
+            else:
+                return self.__create_data_loader_ptr(batch_tensor, full_array)
 
-class InferenceManager(object):
-    __slots__ = ["handle"]
+    def __create_data_loader_attach(self, batch_tensor, full_array):
+        full_array_shape = full_array.shape
+        num_samples = full_array_shape[0]
+        num_dim = len(full_array_shape)
+        if full_array.dtype == "float16":
+            datatype = DataType.DT_HALF
+        elif full_array.dtype == "float32":
+            datatype = DataType.DT_FLOAT
+        elif full_array.dtype == "int32":
+            datatype = DataType.DT_INT32
+        elif full_array.dtype == "int64":
+            datatype = DataType.DT_INT64
+        else:
+            assert 0, "unsupported datatype"
 
-    def __init__(self):
-        self.handle = ffc().flexflow_inference_manager_get_inference_manager()
-        # self._handle = ffi.gc(self.handle, ffc().flexflow_inference_manager_destroy)
+        if num_dim == 2:
+            full_tensor = self.create_tensor(
+                [num_samples, full_array_shape[1]], datatype
+            )
+            self.map_tensor(full_tensor)
+        elif num_dim == 4:
+            full_tensor = self.create_tensor(
+                [
+                    num_samples,
+                    full_array_shape[1],
+                    full_array_shape[2],
+                    full_array_shape[3],
+                ],
+                datatype,
+            )
+            self.map_tensor(full_tensor)
+        else:
+            assert 0, "unsupported dims"
 
-    def compile_model_and_allocate_buffer(self, model):
-        ffc().flexflow_inference_manager_compile_model_and_allocate_buffer(
-            self.handle, model.handle
+        full_tensor.attach_numpy_array(self._ffconfig, full_array)
+        dataloader = SingleDataLoader(
+            self, batch_tensor, full_tensor, num_samples, datatype
         )
+        full_tensor.detach_numpy_array(self._ffconfig)
 
-    def init_operators_inference(self, model):
-        ffc().flexflow_inference_manager_init_operators_inference(
-            self.handle, model.handle
-        )
+        return dataloader
 
-    def register_model_weights_loader(self, model, fileloader):
-        ffc().flexflow_inference_manager_register_model_weights_loader(
-            self.handle, model.handle, fileloader.handle
+    def __create_data_loader_ptr(self, batch_tensor, full_array):
+        full_array_shape = full_array.shape
+        num_samples = full_array_shape[0]
+        if full_array.dtype == "float16":
+            datatype = DataType.DT_HALF
+        elif full_array.dtype == "float32":
+            datatype = DataType.DT_FLOAT
+        elif full_array.dtype == "int32":
+            datatype = DataType.DT_INT32
+        elif full_array.dtype == "int64":
+            datatype = DataType.DT_INT64
+        else:
+            assert 0, "unsupported datatype"
+        np_raw_ptr = full_array.__array_interface__["data"]
+        raw_ptr = ffi.cast("float*", np_raw_ptr[0])
+        print(
+            "numpy array: %s, %s, %s"
+            % (str(np_raw_ptr), str(raw_ptr), hex(np_raw_ptr[0]))
+        )
+        dataloader = SingleDataLoader(
+            self, batch_tensor, raw_ptr, num_samples, datatype
         )
 
-# -----------------------------------------------------------------------
-# FileDataLoader
-# -----------------------------------------------------------------------
+        return dataloader
 
+    def __get_initializer_handle(self, initializer):
+        if initializer == None:
+            null_initializer = Initializer(None)
+            return null_initializer.handle
+        else:
+            return initializer.handle
 
-class FileDataLoader(object):
-    __slots__ = ["handle", "_handle"]
+    def __get_op_handle(self, shared_op):
+        if shared_op == None:
+            op_handle = ffi.new("flexflow_op_t *")
+            op_handle.impl = ffi.NULL
+            op = Op(op_handle[0])
+        else:
+            op = shared_op
+        return op.handle
 
-    def __init__(
-        self,
-        weight_file_path,
-        num_q_heads,
-        num_kv_heads,
-        hidden_dim,
-        qkv_inner_dim,
-        tensor_parallelism_degree,
-        use_full_precision
-    ):
-        c_weight_file_path = get_c_name(weight_file_path)
-        self.handle = ffc().flexflow_file_data_loader_create(
-            c_weight_file_path,
-            num_q_heads,
-            num_kv_heads,
-            hidden_dim,
-            qkv_inner_dim,
-            tensor_parallelism_degree,
-            use_full_precision
+    def get_output_tensor(self, ffmodel, data_type):
+        shape = self.dims
+        if data_type == DataType.DT_HALF:
+            np_array = np.empty(shape, dtype=np.float16)
+        elif data_type == DataType.DT_FLOAT:
+            np_array = np.empty(shape, dtype=np.float32)
+        elif self.data_type == DataType.DT_INT32:
+            np_array = np.empty(shape, dtype=np.int32)
+        elif self.data_type == DataType.DT_INT64:
+            np_array = np.empty(shape, dtype=np.int64)
+        else:
+            assert 0, f"Unsupported datatype: {self.data_type}"
+        np_raw_ptr = np_array.__array_interface__["data"]
+        if np_array.dtype == np.float32:
+            raw_ptr = ffi.cast("float*", np_raw_ptr[0])
+            ret_val = ffc().flexflow_tensor_get_tensor_float(
+                self.handle, ffmodel.handle, raw_ptr, False
+            )
+        elif np_array.dtype == np.int32:
+            raw_ptr = ffi.cast("int*", np_raw_ptr[0])
+            ret_val = ffc().flexflow_tensor_get_tensor_int(
+                self.handle, ffmodel.handle, raw_ptr, False
+            )
+        elif np_array.dtype == np.int64:
+            raw_ptr = ffi.cast("int64_t*", np_raw_ptr[0])
+            ret_val = ffc().flexflow_tensor_get_tensor_int64(
+                self.handle, ffmodel.handle, raw_ptr, False
+            )
+        fflogger.debug(
+            "get weights raw_ptr: %s, %s, %s, %s"
+            % (str(raw_ptr), str(np_raw_ptr[0]), hex(np_raw_ptr[0]), str(shape))
         )
-        self._handle = ffi.gc(self.handle, ffc().flexflow_file_data_loader_destroy)
+        assert ret_val == True
+        return np_array
 
-    def load_weights(self, model):
-        # Check data type and create use_full_precision boolean
-        #assert data_type == DataType.DT_FLOAT or data_type == DataType.DT_HALF
-        #use_full_precision = data_type == DataType.DT_FLOAT
-        ffc().flexflow_file_data_loader_load_weights(
-            self.handle, model.handle
+    def generate_inf_only(self, prompt_list: List[str], max_sequence_length: int = 128):
+        assert isinstance(prompt_list, list)
+        c_input_texts = [get_c_name(prompt) for prompt in prompt_list]
+        max_num_chars = 5 * (max_sequence_length + 100)
+        c_output_texts = [ffi.new("char[]", max_num_chars) for prompt in prompt_list]
+        c_output_length_and_tokens = [
+            ffi.new("int[]", max_sequence_length + 100) for prompt in prompt_list
+        ]
+        c_request_types = [
+            enum_to_int(RequestType, RequestType.REQ_INFERENCE)
+            for prompt in prompt_list
+        ]
+        max_sequence_lengths = [max_sequence_length for prompt in prompt_list]
+        peft_model_ids = [PEFTModelID.no_id_handle() for prompt in prompt_list]
+        dataset_filepaths = [ffi.NULL for prompt in prompt_list]
+        training_steps = [0 for prompt in prompt_list]
+        num_finetuning_losses = ffi.new("int *")
+        c_finetuning_losses = ffi.new("float[]", 0)
+        ffc().flexflow_model_generate(
+            self.handle,
+            len(prompt_list),
+            c_request_types,
+            c_input_texts,
+            c_output_texts,
+            max_sequence_lengths,
+            peft_model_ids,
+            dataset_filepaths,
+            training_steps,
+            c_output_length_and_tokens,
+            num_finetuning_losses,
+            c_finetuning_losses,
+        )
+        from flexflow.serve import GenerationResult
+
+        return [
+            GenerationResult(
+                text=ffi.string(c_output_text), tokens=[], finetuning_losses=[]
+            )
+            for c_output_text in c_output_texts
+        ]
+
+    def generate(self, requests_list: List[Request]):
+        assert isinstance(requests_list, list)
+        c_input_texts = [
+            get_c_name(request.prompt) for request in requests_list
+        ]  # entry will be None for finetuning requests
+        c_output_texts = [
+            (
+                ffi.new("char[]", 5 * (request.max_sequence_length + 100))
+                if request.req_type == RequestType.REQ_INFERENCE
+                else ffi.NULL
+            )
+            for request in requests_list
+        ]
+        c_output_length_and_tokens = [
+            ffi.new("int[]", request.max_sequence_length + 100)
+            for request in requests_list
+        ]
+        c_request_types = [
+            enum_to_int(RequestType, request.req_type) for request in requests_list
+        ]
+        max_sequence_lengths = [
+            request.max_sequence_length for request in requests_list
+        ]
+        peft_model_ids = [
+            (
+                request.peft_model_id
+                if request.peft_model_id is not None
+                else PEFTModelID.no_id_handle()
+            )
+            for request in requests_list
+        ]
+        dataset_filepaths = [
+            get_c_name(request.dataset_filepath) for request in requests_list
+        ]
+        training_steps = [request.max_training_steps for request in requests_list]
+        num_finetuning_losses = ffi.new("int *")
+        # c_finetuning_losses = ffi.new("float**")
+        # TODO: set this value automatically
+        c_finetuning_losses = ffi.new("float[]", 10000)
+        
+        ffc().flexflow_model_generate(
+            self.handle,
+            len(requests_list),
+            c_request_types,
+            c_input_texts,
+            c_output_texts,
+            max_sequence_lengths,
+            peft_model_ids,
+            dataset_filepaths,
+            training_steps,
+            c_output_length_and_tokens,
+            num_finetuning_losses,
+            c_finetuning_losses,
         )
+        finetuning_losses = []
+        if num_finetuning_losses[0] > 0:
+            finetuning_losses = [
+                c_finetuning_losses[i] for i in range(num_finetuning_losses[0])
+            ]
+        results = []
+        for c_output_text in c_output_texts:
+            results.append(
+                GenerationResult(
+                    text=(
+                        ffi.string(c_output_text) if c_output_text != ffi.NULL else None
+                    ),
+                    tokens=[],
+                    finetuning_losses=finetuning_losses,
+                )
+            )
+        return results
+
+    def set_position_offset(self, offset):
+        ffc().flexflow_model_set_position_offset(self.handle, offset)
diff --git a/python/flexflow/serve/__init__.py b/python/flexflow/serve/__init__.py
index 5af077273d..fd29080a6a 100644
--- a/python/flexflow/serve/__init__.py
+++ b/python/flexflow/serve/__init__.py
@@ -15,7 +15,16 @@
 from typing import Optional
 from ..type import *
 from flexflow.core import *
-from .serve import LLM, SSM, GenerationConfig, GenerationResult
+from .serve import (
+    LLM,
+    SSM,
+    GenerationConfig,
+    GenerationResult,
+    LoraLinearConfig,
+    PEFTModelID,
+    Request,
+    RequestType,
+)
 
 
 def __check_positive_int(configs_dict: dict, key: str):
@@ -44,6 +53,9 @@ def init(
     offload_reserve_space_size: Optional[int] = None,
     use_4bit_quantization: Optional[bool] = None,
     use_8bit_quantization: Optional[bool] = None,
+    enable_peft: Optional[bool] = None,
+    peft_activation_reserve_space_size: Optional[int] = None,
+    peft_weight_reserve_space_size: Optional[int] = None,
     profiling: Optional[bool] = None,
     benchmarking: Optional[bool] = None,
     inference_debugging: Optional[bool] = None,
@@ -69,9 +81,12 @@ def init(
     - tensor_parallelism_degree: the degree of parallelization in the tensor parallel dimension (using the Megatron technique), defaults to 1
     - pipeline_parallelism_degree: the degree of parallelization in the pipeline parallel dimension, defaults to 1
     - offload: whether to enable offloading of the weights to CPU, defaults to False
-    - offload_reserve_space_size: the space (in MB) to reserve on CPU for offloading, default to 1024^2
+    - offload_reserve_space_size: the space (in MB) to reserve on CPU for offloading, defaults to 8 GB
     - use_4bit_quantization: whether to use 4-bit quantization, defaults to False
     - use_8bit_quantization: whether to use 8-bit quantization, defaults to False
+    - enable_peft: whether to enable the use of PEFT, defaults to False
+    - peft_activation_reserve_space_size: the space (in MB) to reserve on GPU for PEFT activations, default to 1 GB
+    - peft_weight_reserve_space_size: the space (in MB) to reserve on GPU for PEFT weights, default to 1 GB
     - profiling: whether to enable the FlexFlow profiling mode, defaults to False
     - benchmarking: whether to run benchmaking only, without loading real weights, defaults to False
     - inference_debugging: whether to run inference in debugging mode, saving all inputs/outputs/weights to file, defaults to False
@@ -100,12 +115,18 @@ def init(
     :type pipeline_parallelism_degree: Optional[int], optional
     :param offload: whether to enable offloading of the weights to CPU, defaults to False
     :type offload: Optional[bool], optional
-    :param offload_reserve_space_size: the space (in MB) to reserve on CPU for offloading, default to 1024^2
+    :param offload_reserve_space_size: the space (in MB) to reserve on CPU for offloading, defaults to 8 GB
     :type offload_reserve_space_size: Optional[int], optional
     :param use_4bit_quantization: whether to use 4-bit quantization, defaults to False
     :type use_4bit_quantization: Optional[bool], optional
     :param use_8bit_quantization: whether to use 8-bit quantization, defaults to False
     :type use_8bit_quantization: Optional[bool], optional
+    :param enable_peft: whether to enable the use of PEFT, defaults to False
+    :type enable_peft: Optional[bool], optional
+    :param peft_activation_reserve_space_size: the space (in MB) to reserve on GPU for PEFT activations, default to 1 GB
+    :type peft_activation_reserve_space_size: Optional[int], optional
+    :param peft_weight_reserve_space_size: the space (in MB) to reserve on GPU for PEFT weights, default to 1 GB
+    :type peft_weight_reserve_space_size: Optional[int], optional
     :param profiling: whether to enable the FlexFlow profiling mode, defaults to False
     :type profiling: Optional[bool], optional
     :param benchmarking: whether to run benchmaking only, without loading real weights, defaults to False
@@ -135,6 +156,9 @@ def init(
             offload_reserve_space_size is not None,
             use_4bit_quantization is not None,
             use_8bit_quantization is not None,
+            enable_peft is not None,
+            peft_activation_reserve_space_size is not None,
+            peft_weight_reserve_space_size is not None,
             profiling is not None,
             benchmarking is not None,
             inference_debugging is not None,
@@ -161,6 +185,9 @@ def init(
             "offload_reserve_space_size": offload_reserve_space_size,
             "use_4bit_quantization": use_4bit_quantization,
             "use_8bit_quantization": use_8bit_quantization,
+            "enable_peft": enable_peft,
+            "peft_activation_reserve_space_size": peft_activation_reserve_space_size,
+            "peft_weight_reserve_space_size": peft_weight_reserve_space_size,
             "profiling": profiling,
             "benchmarking": benchmarking,
             "inference_debugging": inference_debugging,
@@ -182,6 +209,8 @@ def init(
         "tensor_parallelism_degree",
         "pipeline_parallelism_degree",
         "offload_reserve_space_size",
+        "peft_activation_reserve_space_size",
+        "peft_weight_reserve_space_size",
     ]
     for param in positive_int_params:
         __check_positive_int(configs_dict, param)
@@ -200,11 +229,17 @@ def init(
     if configs_dict.get("offload", None) is None:
         configs_dict["offload"] = False
     if configs_dict.get("offload_reserve_space_size", None) is None:
-        configs_dict["offload_reserve_space_size"] = 1024**2
+        configs_dict["offload_reserve_space_size"] = 8 * 1024**3
     if configs_dict.get("use_4bit_quantization", None) is None:
         configs_dict["use_4bit_quantization"] = False
     if configs_dict.get("use_8bit_quantization", None) is None:
         configs_dict["use_8bit_quantization"] = False
+    if configs_dict.get("enable_peft", None) is None:
+        configs_dict["enable_peft"] = False
+    if configs_dict.get("peft_activation_reserve_space_size", None) is None:
+        configs_dict["peft_activation_reserve_space_size"] = 8 * 1024**3
+    if configs_dict.get("peft_weight_reserve_space_size", None) is None:
+        configs_dict["peft_weight_reserve_space_size"] = 1024**3
     if configs_dict.get("profiling", None) is None:
         configs_dict["profiling"] = False
     if configs_dict.get("benchmarking", None) is None:
diff --git a/python/flexflow/serve/models/base.py b/python/flexflow/serve/models/base.py
index e7f3914037..17bb894250 100644
--- a/python/flexflow/serve/models/base.py
+++ b/python/flexflow/serve/models/base.py
@@ -32,5 +32,8 @@ def __init__(
     def build_model(self):
         assert False, "Not implemented yet"
 
+    def convert_hf_weight_name(name):
+        assert False, "Not implemented yet"
+
     def convert_hf_model(model, dst_folder):
         assert False, "Not implemented yet"
diff --git a/python/flexflow/serve/models/falcon.py b/python/flexflow/serve/models/falcon.py
index 7a55da26ef..0e8fbcbd7d 100644
--- a/python/flexflow/serve/models/falcon.py
+++ b/python/flexflow/serve/models/falcon.py
@@ -124,7 +124,7 @@ def build_model(self, max_tokens_per_batch):
                     axes,
                     True,
                     self.falcon_config.layer_norm_epsilon,
-                    name=f"layers_{i}_input_layernorm",
+                    name=f"layers.{i}.input_layernorm",
                 )
             else:
                 token, att_norm = ffmodel.residual_layer_norm(
@@ -135,7 +135,7 @@ def build_model(self, max_tokens_per_batch):
                     axes,
                     True,
                     self.falcon_config.layer_norm_epsilon,
-                    name=f"layers_{i}_input_layernorm",
+                    name=f"layers.{i}.input_layernorm",
                 )
 
             if self.mode == InferenceMode.BEAM_SEARCH_MODE:
@@ -153,7 +153,7 @@ def build_model(self, max_tokens_per_batch):
                     DataType.DT_NONE,  # data_type
                     None,  # kernel initializer
                     True,  # apply_rotary_embedding
-                    name=f"layers_{i}_attention",
+                    name=f"layers.{i}.self_attention",
                 )
             elif self.mode == InferenceMode.TREE_VERIFY_MODE:
                 mha = ffmodel.inc_multiquery_self_attention_verify(
@@ -170,7 +170,7 @@ def build_model(self, max_tokens_per_batch):
                     DataType.DT_NONE,  # data_type
                     None,  # kernel initializer
                     True,  # apply_rotary_embedding
-                    name=f"layers_{i}_attention",
+                    name=f"layers.{i}.self_attention",
                 )
             elif self.mode == InferenceMode.INC_DECODING_MODE:
                 mha = ffmodel.inc_multiquery_self_attention(
@@ -187,7 +187,7 @@ def build_model(self, max_tokens_per_batch):
                     DataType.DT_NONE,  # data_type
                     None,  # kernel initializer
                     True,  # apply_rotary_embedding
-                    name=f"layers_{i}_attention",
+                    name=f"layers.{i}.self_attention",
                 )
             else:
                 assert False
@@ -197,7 +197,7 @@ def build_model(self, max_tokens_per_batch):
                 self.falcon_config.hidden_size * 4,
                 ActiMode.AC_MODE_NONE,
                 False,
-                name=f"layers_{i}_mlp_dense_h_to_4h",
+                name=f"layers.{i}.mlp.dense_h_to_4h",
             )
             dense_h_to_4h = ffmodel.gelu(dense_h_to_4h)
             mlp_output = ffmodel.dense(
@@ -205,7 +205,7 @@ def build_model(self, max_tokens_per_batch):
                 self.falcon_config.hidden_size,
                 ActiMode.AC_MODE_NONE,
                 False,
-                name=f"layers_{i}_mlp_dense_4h_to_h",
+                name=f"layers.{i}.mlp.dense_4h_to_h",
             )
 
         _, ln_f = ffmodel.residual_layer_norm(
@@ -239,10 +239,18 @@ def build_model(self, max_tokens_per_batch):
                 output = ffmodel.sampling(softmax, self.generation_config.topp)
             else:
                 # output = ffmodel.arg_top_k(lm_head, 1, False)
-                output = ffmodel.argmax(lm_head, False)
+                softmax = ffmodel.softmax(lm_head, -1)
+                output = ffmodel.argmax(softmax, False)
 
         self.ffmodel = ffmodel
 
+    # TODO: finish this
+    def convert_hf_weight_name(name):
+        return (name.replace("transformer.h.", "layers.")
+            .replace("transformer.", "")
+            .replace("self_attention.dense", "self_attention.o_proj")
+        )
+
     def convert_hf_model(model, dst_folder):
         os.makedirs(dst_folder, exist_ok=True)
         n_head = (
@@ -251,17 +259,12 @@ def convert_hf_model(model, dst_folder):
             else model.config.num_attention_heads
         )
         for name, params in model.named_parameters():
-            name = (
-                name.replace(".", "_")
-                .replace("transformer_h_", "layers_")
-                .replace("transformer_", "")
-                .replace("self_attention_dense", "attention_wo")
-            )
+            name = FlexFlowFalcon.convert_hf_weight_name(name)
             # Split Q,K,V attention weights
-            if "self_attention_query_key_value" in name:
-                name_q = name.replace("self_attention_query_key_value", "attention_wq")
-                name_k = name.replace("self_attention_query_key_value", "attention_wk")
-                name_v = name.replace("self_attention_query_key_value", "attention_wv")
+            if "self_attention.query_key_value" in name:
+                name_q = name.replace("self_attention.query_key_value", "self_attention.q_proj")
+                name_k = name.replace("self_attention.query_key_value", "self_attention.k_proj")
+                name_v = name.replace("self_attention.query_key_value", "self_attention.v_proj")
                 q, k, v = torch.split(
                     params,
                     [
@@ -278,5 +281,5 @@ def convert_hf_model(model, dst_folder):
                 params.detach().cpu().numpy().tofile(os.path.join(dst_folder, name))
         # LM head weight
         model.lm_head.weight.detach().cpu().numpy().tofile(
-            os.path.join(dst_folder, "lm_head_weight")
+            os.path.join(dst_folder, "lm_head.weight")
         )
diff --git a/python/flexflow/serve/models/llama.py b/python/flexflow/serve/models/llama.py
index 6b33030f62..96f0258572 100644
--- a/python/flexflow/serve/models/llama.py
+++ b/python/flexflow/serve/models/llama.py
@@ -62,7 +62,7 @@ def __init__(
         # self.llama_config.max_num_tokens = max_tokens_per_batch
         self.weights_filepath = weights_filepath
         self.tokenizer_filepath = tokenizer_filepath
-        self.maxint = 2**31 - 1
+        self.maxint = 2 ** 31 - 1
         max_verify_tokens_per_batch = (
             max_tokens_per_batch + self.llama_config.max_spec_tree_token_num
         )
@@ -106,7 +106,7 @@ def build_model(self, max_tokens_per_batch):
             self.data_type,
             None,
             embed_init,
-            name="tok_embeddings",
+            name="embed_tokens",
         )
 
         for i in range(self.llama_config.num_hidden_layers):
@@ -117,7 +117,7 @@ def build_model(self, max_tokens_per_batch):
                     token,
                     self.llama_config.rms_norm_eps,
                     self.llama_config.hidden_size,
-                    name=f"layers_{i}_attention_norm",
+                    name=f"layers.{i}.input_layernorm",
                 )
             else:
                 token, attn_norm = ffmodel.residual_rms_norm(
@@ -125,7 +125,7 @@ def build_model(self, max_tokens_per_batch):
                     w2,
                     self.llama_config.rms_norm_eps,
                     self.llama_config.hidden_size,
-                    name=f"layers_{i}_attention_norm",
+                    name=f"layers.{i}.input_layernorm",
                 )
 
             if self.mode == InferenceMode.BEAM_SEARCH_MODE:
@@ -145,7 +145,7 @@ def build_model(self, max_tokens_per_batch):
                     DataType.DT_NONE,  # data_type
                     None,  # kernel initializer
                     True,  # apply_rotary_embedding
-                    name=f"layers_{i}_attention",
+                    name=f"layers.{i}.self_attn",
                 )
             elif self.mode == InferenceMode.TREE_VERIFY_MODE:
                 mha = ffmodel.inc_multiquery_self_attention_verify(
@@ -164,7 +164,7 @@ def build_model(self, max_tokens_per_batch):
                     DataType.DT_NONE,  # data_type
                     None,  # kernel initializer
                     True,  # apply_rotary_embedding
-                    name=f"layers_{i}_attention",
+                    name=f"layers.{i}.self_attn",
                 )
             elif self.mode == InferenceMode.INC_DECODING_MODE:
                 mha = ffmodel.inc_multiquery_self_attention(
@@ -183,7 +183,7 @@ def build_model(self, max_tokens_per_batch):
                     DataType.DT_NONE,  # data_type
                     None,  # kernel initializer
                     True,  # apply_rotary_embedding
-                    name=f"layers_{i}_attention",
+                    name=f"layers.{i}.self_attn",
                 )
             else:
                 assert False
@@ -193,21 +193,21 @@ def build_model(self, max_tokens_per_batch):
                 mha,
                 self.llama_config.rms_norm_eps,
                 self.llama_config.hidden_size,
-                name=f"layers_{i}_ffn_norm",
+                name=f"layers.{i}.post_attention_layernorm",
             )
             w1 = ffmodel.dense(
                 ff_norm,
                 self.llama_config.intermediate_size,
                 ActiMode.AC_MODE_NONE,
                 False,
-                name=f"layers_{i}_feed_forward_w1",
+                name=f"layers.{i}.mlp.gate_proj",
             )
             w3 = ffmodel.dense(
                 ff_norm,
                 self.llama_config.intermediate_size,
                 ActiMode.AC_MODE_NONE,
                 False,
-                name=f"layers_{i}_feed_forward_w3",
+                name=f"layers.{i}.mlp.up_proj",
             )
             multi = ffmodel.sigmoid_silu_multi(w1, w3)
             w2 = ffmodel.dense(
@@ -215,7 +215,7 @@ def build_model(self, max_tokens_per_batch):
                 self.llama_config.hidden_size,
                 ActiMode.AC_MODE_NONE,
                 False,
-                name=f"layers_{i}_feed_forward_w2",
+                name=f"layers.{i}.mlp.down_proj",
             )
 
         _, token = ffmodel.residual_rms_norm(
@@ -230,7 +230,7 @@ def build_model(self, max_tokens_per_batch):
             self.llama_config.vocab_size,
             ActiMode.AC_MODE_NONE,
             False,
-            name="output",
+            name="lm_head",
         )
 
         if self.mode == InferenceMode.BEAM_SEARCH_MODE:
@@ -246,28 +246,16 @@ def build_model(self, max_tokens_per_batch):
                 output = ffmodel.sampling(softmax, self.generation_config.topp)
             else:
                 # output = ffmodel.arg_top_k(dense, 1, False)
-                output = ffmodel.argmax(dense, False)
+                softmax = ffmodel.softmax(dense, -1)
+                output = ffmodel.argmax(softmax, False)
 
         self.ffmodel = ffmodel
 
+    def convert_hf_weight_name(name):
+        return name.replace("model.", "")
+
     def convert_hf_model(model, dst_folder):
         os.makedirs(dst_folder, exist_ok=True)
         for name, params in model.named_parameters():
-            name = (
-                name.replace(".", "_")
-                .replace("self_attn", "attention")
-                .replace("q_proj", "wq")
-                .replace("k_proj", "wk")
-                .replace("v_proj", "wv")
-                .replace("o_proj", "wo")
-                .replace("mlp", "feed_forward")
-                .replace("gate_proj", "w1")
-                .replace("down_proj", "w2")
-                .replace("up_proj", "w3")
-                .replace("input_layernorm", "attention_norm")
-                .replace("post_attention_layernorm", "ffn_norm")
-                .replace("embed_tokens", "tok_embeddings")
-                .replace("lm_head", "output")
-                .replace("model_", "")
-            )
+            name = FlexFlowLLAMA.convert_hf_weight_name(name)
             params.detach().cpu().numpy().tofile(f"{dst_folder}/{name}")
diff --git a/python/flexflow/serve/models/mpt.py b/python/flexflow/serve/models/mpt.py
index 92867fd498..b350ae106d 100644
--- a/python/flexflow/serve/models/mpt.py
+++ b/python/flexflow/serve/models/mpt.py
@@ -97,7 +97,7 @@ def build_model(self, max_tokens_per_batch):
             self.data_type,
             None,
             embed_init,
-            name="transformer_wte",
+            name="wte",
         )
 
         axes = [
@@ -114,7 +114,7 @@ def build_model(self, max_tokens_per_batch):
                     True,
                     1e-05,
                     False,
-                    name=f"layers_{i}_norm_1",
+                    name=f"layers.{i}.norm_1",
                 )
             else:
                 hidden_states, layernorm_output = ffmodel.residual_layer_norm(
@@ -126,7 +126,7 @@ def build_model(self, max_tokens_per_batch):
                     True,
                     1e-05,
                     False,
-                    name=f"layers_{i}_norm_1",
+                    name=f"layers.{i}.norm_1",
                 )
 
             if self.mode == InferenceMode.BEAM_SEARCH_MODE:
@@ -148,7 +148,7 @@ def build_model(self, max_tokens_per_batch):
                     ** (-0.5),  # scaling_factor
                     False,  # qk_prod_scaling
                     True,  # qk_prod_scaling
-                    name=f"layers_{i}_attention",
+                    name=f"layers.{i}.attn",
                 )
             elif self.mode == InferenceMode.TREE_VERIFY_MODE:
                 attn_outputs = ffmodel.inc_multihead_self_attention_verify(
@@ -169,7 +169,7 @@ def build_model(self, max_tokens_per_batch):
                     ** (-0.5),  # scaling_factor
                     False,  # qk_prod_scaling
                     True,  # qk_prod_scaling
-                    name=f"layers_{i}_attention",
+                    name=f"layers.{i}.attn",
                 )
             elif self.mode == InferenceMode.INC_DECODING_MODE:
                 attn_outputs = ffmodel.inc_multihead_self_attention(
@@ -190,7 +190,7 @@ def build_model(self, max_tokens_per_batch):
                     ** (-0.5),  # scaling_factor
                     False,  # qk_prod_scaling
                     True,  # qk_prod_scaling
-                    name=f"layers_{i}_attention",
+                    name=f"layers.{i}.attn",
                 )
             else:
                 assert False
@@ -204,7 +204,7 @@ def build_model(self, max_tokens_per_batch):
                 True,
                 1e-05,
                 False,
-                name=f"layers_{i}_norm_2",
+                name=f"layers.{i}.norm_2",
             )
             # mlp
             layernorm_output = ffmodel.dense(
@@ -212,7 +212,7 @@ def build_model(self, max_tokens_per_batch):
                 4 * self.mpt_config.hidden_size,
                 ActiMode.AC_MODE_NONE,
                 False,
-                name=f"layers_{i}_ffn_up_proj",
+                name=f"layers.{i}.ffn.up_proj",
             )
             layernorm_output = ffmodel.gelu(layernorm_output)
             intermediate_output = ffmodel.dense(
@@ -220,7 +220,7 @@ def build_model(self, max_tokens_per_batch):
                 self.mpt_config.hidden_size,
                 ActiMode.AC_MODE_NONE,
                 False,
-                name=f"layers_{i}_ffn_down_proj",
+                name=f"layers.{i}.ffn.down_proj",
             )
 
         _, all_final_norm = ffmodel.residual_layer_norm(
@@ -232,7 +232,7 @@ def build_model(self, max_tokens_per_batch):
             True,
             1e-05,
             False,
-            name=f"transformer_norm_f",
+            name=f"norm_f",
         )
         lm_head = ffmodel.dense(
             all_final_norm,
@@ -249,18 +249,27 @@ def build_model(self, max_tokens_per_batch):
             softmax = ffmodel.softmax(dense, -1)
             output = ffmodel.sampling(softmax, self.generation_config.topp)
         else:
-            output = ffmodel.argmax(lm_head, False)
+            softmax = ffmodel.softmax(lm_head, -1)
+            output = ffmodel.argmax(softmax, False)
 
         self.ffmodel = ffmodel
 
+    # TODO: finish this
+    def convert_hf_weight_name(name):
+        return (
+            name.replace("transformer.blocks.", "layers.")
+            .replace("transformer.", "")
+            .replace("attn.out_proj", "attn.o_proj")
+        )
+
     def convert_hf_model(model, dst_folder):
         os.makedirs(dst_folder, exist_ok=True)
         for name, params in model.named_parameters():
-            name = name.replace("transformer.blocks.", "layers.").replace(".", "_")
+            name = FlexFlowMPT.convert_hf_weight_name(name)
             if "Wqkv" in name:
-                name_q = name.replace("attn_Wqkv", "attention_wq")
-                name_k = name.replace("attn_Wqkv", "attention_wk")
-                name_v = name.replace("attn_Wqkv", "attention_wv")
+                name_q = name.replace("attn.Wqkv", "attn.q_proj")
+                name_k = name.replace("attn.Wqkv", "attn.k_proj")
+                name_v = name.replace("attn.Wqkv", "attn.v_proj")
                 q, k, v = torch.split(
                     params,
                     [
@@ -273,13 +282,10 @@ def convert_hf_model(model, dst_folder):
                 q.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_q))
                 k.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_k))
                 v.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_v))
-            elif "out_proj" in name:
-                name = name.replace("attn_out_proj", "attention_wo")
-                params.detach().cpu().numpy().tofile(os.path.join(dst_folder, name))
             else:
                 params.detach().cpu().numpy().tofile(os.path.join(dst_folder, name))
 
         shutil.copy(
-            os.path.join(dst_folder, "transformer_wte_weight"),
-            os.path.join(dst_folder, "lm_head_weight"),
+            os.path.join(dst_folder, "wte.weight"),
+            os.path.join(dst_folder, "lm_head.weight"),
         )
diff --git a/python/flexflow/serve/models/opt.py b/python/flexflow/serve/models/opt.py
index b715f5f35e..02668abf59 100644
--- a/python/flexflow/serve/models/opt.py
+++ b/python/flexflow/serve/models/opt.py
@@ -139,7 +139,7 @@ def build_model(self, max_tokens_per_batch):
                     axes,
                     self.opt_config.layer_norm_elementwise_affine,
                     1e-05,
-                    name=f"layers_{i}_attention_layer_norm",
+                    name=f"layers.{i}.self_attn_layer_norm",
                 )
             else:
                 hidden_states = ffmodel.add(token, positional_embedding)
@@ -163,7 +163,7 @@ def build_model(self, max_tokens_per_batch):
                     (self.opt_config.hidden_size / self.opt_config.num_attention_heads)
                     ** (-0.5),  # scaling_factor
                     False,  # qk_prod_scaling
-                    name=f"layers_{i}_attention",
+                    name=f"layers.{i}.self_attn",
                 )
             elif self.mode == InferenceMode.TREE_VERIFY_MODE:
                 mha = ffmodel.inc_multihead_self_attention_verify(
@@ -183,7 +183,7 @@ def build_model(self, max_tokens_per_batch):
                     (self.opt_config.hidden_size / self.opt_config.num_attention_heads)
                     ** (-0.5),  # scaling_factor
                     False,  # qk_prod_scaling
-                    name=f"layers_{i}_attention",
+                    name=f"layers.{i}.self_attn",
                 )
             elif self.mode == InferenceMode.INC_DECODING_MODE:
                 mha = ffmodel.inc_multihead_self_attention(
@@ -203,7 +203,7 @@ def build_model(self, max_tokens_per_batch):
                     (self.opt_config.hidden_size / self.opt_config.num_attention_heads)
                     ** (-0.5),  # scaling_factor
                     False,  # qk_prod_scaling
-                    name=f"layers_{i}_attention",
+                    name=f"layers.{i}.self_attn",
                 )
             else:
                 assert False
@@ -215,7 +215,7 @@ def build_model(self, max_tokens_per_batch):
                 axes,
                 self.opt_config.layer_norm_elementwise_affine,
                 1e-05,
-                name=f"layers_{i}_add_bias_residual_layer_norm",
+                name=f"layers.{i}.add_bias_residual_layer_norm",
             )
 
             if not self.opt_config.do_layer_norm_before:
@@ -226,14 +226,14 @@ def build_model(self, max_tokens_per_batch):
                 self.opt_config.ffn_dim,
                 ActiMode.AC_MODE_RELU,
                 True,
-                name=f"layers_{i}_fc1",
+                name=f"layers.{i}.fc1",
             )
             fc2 = ffmodel.dense(
                 fc1,
                 self.opt_config.hidden_size,
                 ActiMode.AC_MODE_NONE,
                 True,
-                name=f"layers_{i}_fc2",
+                name=f"layers.{i}.fc2",
             )
 
             if not self.opt_config.do_layer_norm_before:
@@ -245,7 +245,7 @@ def build_model(self, max_tokens_per_batch):
                     axes,
                     self.opt_config.layer_norm_elementwise_affine,
                     1e-05,
-                    name=f"layers_{i}_final_layer_norm",
+                    name=f"layers.{i}.final_layer_norm",
                 )
 
         _, all_final_norm = ffmodel.residual_layer_norm(
@@ -263,7 +263,7 @@ def build_model(self, max_tokens_per_batch):
             self.opt_config.vocab_size,
             ActiMode.AC_MODE_NONE,
             False,
-            name="embed_tokens_weight_lm_head",
+            name="lm_head",
         )
 
         if self.mode == InferenceMode.BEAM_SEARCH_MODE:
@@ -279,30 +279,29 @@ def build_model(self, max_tokens_per_batch):
                 output = ffmodel.sampling(softmax, self.generation_config.topp)
             else:
                 # output = ffmodel.arg_top_k(lm_head, 1, False)
-                output = ffmodel.argmax(lm_head, False)
+                softmax = ffmodel.softmax(lm_head, -1)
+                output = ffmodel.argmax(softmax, False)
 
         self.ffmodel = ffmodel
 
+    def convert_hf_weight_name(name):
+        return (
+            name.replace("decoder.", "")
+            .replace("model.", "")
+            .replace("self_attn.out_proj", "self_attn.o_proj")
+            .replace("self_attn.o_proj.bias", "add_bias_residual_layer_norm.attn_bias")
+            .replace(
+                ".final_layer_norm", ".add_bias_residual_layer_norm"
+            )  # important to use the leading "_" to avoid matching the last LayerNorm
+        )
+
     def convert_hf_model(model, dst_folder):
         os.makedirs(dst_folder, exist_ok=True)
         for name, params in model.named_parameters():
-            name = (
-                name.replace(".", "_")
-                .replace("decoder_", "")
-                .replace("model_", "")
-                .replace("self_attn", "attention")
-                .replace("q_proj", "wq")
-                .replace("k_proj", "wk")
-                .replace("v_proj", "wv")
-                .replace("out_proj", "wo")
-                .replace("attention_wo_bias", "add_bias_residual_layer_norm_attn_bias")
-                .replace(
-                    "_final_layer_norm", "_add_bias_residual_layer_norm"
-                )  # important to use the leading "_" to avoid matching the last LayerNorm
-            )
+            name = FlexFlowOPT.convert_hf_weight_name(name)
             params.detach().cpu().numpy().tofile(f"{dst_folder}/{name}")
         # copy embedding weights
         shutil.copy(
-            os.path.join(dst_folder, "embed_tokens_weight"),
-            os.path.join(dst_folder, "embed_tokens_weight_lm_head"),
+            os.path.join(dst_folder, "embed_tokens.weight"),
+            os.path.join(dst_folder, "lm_head.weight"),
         )
diff --git a/python/flexflow/serve/models/starcoder.py b/python/flexflow/serve/models/starcoder.py
index 37edaa4c40..2d4471201f 100644
--- a/python/flexflow/serve/models/starcoder.py
+++ b/python/flexflow/serve/models/starcoder.py
@@ -111,7 +111,7 @@ def build_model(self, max_tokens_per_batch):
             self.data_type,
             None,
             embed_init,
-            name="transformer_wte",
+            name="wte",
         )
         positional_embedding = ffmodel.embedding(
             position_tensor,
@@ -121,7 +121,7 @@ def build_model(self, max_tokens_per_batch):
             self.data_type,
             None,
             embed_init,
-            name="transformer_wpe",
+            name="wpe",
         )
 
         axes = [
@@ -139,7 +139,7 @@ def build_model(self, max_tokens_per_batch):
                 axes,
                 True,
                 self.starcoder_config.layer_norm_epsilon,
-                name=f"layers_{i}_ln_1",
+                name=f"layers.{i}.ln_1",
             )
 
             assert self.mode == InferenceMode.INC_DECODING_MODE
@@ -159,7 +159,7 @@ def build_model(self, max_tokens_per_batch):
                 DataType.DT_NONE,  # data_type
                 None,  # kernel initializer
                 False,  # apply_rotary_embedding
-                name=f"layers_{i}_attention",
+                name=f"layers.{i}.attn.c_attn",
             )
 
             residual, l2_norm = ffmodel.residual_layer_norm(
@@ -171,7 +171,7 @@ def build_model(self, max_tokens_per_batch):
                 axes,
                 True,
                 self.starcoder_config.layer_norm_epsilon,
-                name=f"layers_{i}_ln_2",
+                name=f"layers.{i}.ln_2",
             )
 
             # mlp
@@ -181,7 +181,7 @@ def build_model(self, max_tokens_per_batch):
                 self.starcoder_config.intermediate_size,
                 ActiMode.AC_MODE_NONE,
                 True,
-                name=f"layers_{i}_mlp_c_fc",
+                name=f"layers.{i}.mlp.c_fc",
             )
             activation = ffmodel.gelu(c_fc, False)
             c_proj = ffmodel.dense(
@@ -189,7 +189,7 @@ def build_model(self, max_tokens_per_batch):
                 self.starcoder_config.hidden_size,
                 ActiMode.AC_MODE_NONE,
                 True,
-                name=f"layers_{i}_mlp_c_proj",
+                name=f"layers.{i}.mlp.c_proj",
             )
 
         _, ln_f = ffmodel.residual_layer_norm(
@@ -200,7 +200,7 @@ def build_model(self, max_tokens_per_batch):
             axes,
             True,
             self.starcoder_config.layer_norm_epsilon,
-            name=f"transformer_ln_f",
+            name=f"ln_f",
         )
         lm_head = ffmodel.dense(
             ln_f,
@@ -217,18 +217,19 @@ def build_model(self, max_tokens_per_batch):
             softmax = ffmodel.softmax(dense, -1)
             output = ffmodel.sampling(softmax, self.generation_config.topp)
         else:
-            output = ffmodel.argmax(lm_head, False)
+            softmax = ffmodel.softmax(lm_head, -1)
+            output = ffmodel.argmax(softmax, False)
 
         self.ffmodel = ffmodel
 
     def convert_hf_model(model, dst_folder):
         os.makedirs(dst_folder, exist_ok=True)
         for name, params in model.named_parameters():
-            name = name.replace("transformer.h", "layers").replace(".", "_")
-            if "c_attn_weight" in name:
-                name_q = name.replace("attn_c_attn", "attention_wq")
-                name_k = name.replace("attn_c_attn", "attention_wk")
-                name_v = name.replace("attn_c_attn", "attention_wv")
+            name = name.replace("transformer.h", "layers").replace("transformer.", "")
+            if "attn.c_attn.weight" in name:
+                name_q = name.replace("attn.c_attn", "attn.c_attn.q_proj")
+                name_k = name.replace("attn.c_attn", "attn.c_attn.k_proj")
+                name_v = name.replace("attn.c_attn", "attn.c_attn.v_proj")
                 q, k, v = torch.split(
                     params,
                     [
@@ -241,10 +242,10 @@ def convert_hf_model(model, dst_folder):
                 q.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_q))
                 k.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_k))
                 v.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_v))
-            elif "c_attn_bias" in name:
-                name_q = name.replace("attn_c_attn", "attention_wq")
-                name_k = name.replace("attn_c_attn", "attention_wk")
-                name_v = name.replace("attn_c_attn", "attention_wv")
+            elif "attn.c_attn.bias" in name:
+                name_q = name.replace("attn.c_attn", "attn.c_attn.q_proj")
+                name_k = name.replace("attn.c_attn", "attn.c_attn.k_proj")
+                name_v = name.replace("attn.c_attn", "attn.c_attn.v_proj")
                 q, k, v = torch.split(
                     params,
                     [
@@ -257,14 +258,14 @@ def convert_hf_model(model, dst_folder):
                 q.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_q))
                 k.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_k))
                 v.detach().cpu().numpy().tofile(os.path.join(dst_folder, name_v))
-            elif "c_proj_bias" in name:
-                name = name.replace("attn_c_proj", "attention_wo")
+            elif "attn.c_proj.bias" in name:
+                name = name.replace("attn.c_proj", "attn.c_attn.o_proj")
                 params.detach().cpu().numpy().tofile(os.path.join(dst_folder, name))
-            elif "c_proj_weight" in name:
-                name = name.replace("attn_c_proj", "attention_wo")
+            elif "attn.c_proj.weight" in name:
+                name = name.replace("attn.c_proj", "attn.c_attn.o_proj")
                 params.detach().cpu().numpy().tofile(os.path.join(dst_folder, name))
             else:
                 params.detach().cpu().numpy().tofile(os.path.join(dst_folder, name))
         model.lm_head.weight.detach().cpu().numpy().tofile(
-            os.path.join(dst_folder, "lm_head_weight")
+            os.path.join(dst_folder, "lm_head.weight")
         )
diff --git a/python/flexflow/serve/serve.py b/python/flexflow/serve/serve.py
index ac622b3337..132c50995b 100644
--- a/python/flexflow/serve/serve.py
+++ b/python/flexflow/serve/serve.py
@@ -28,44 +28,38 @@
 )
 from flexflow.core import *
 from transformers import AutoConfig, AutoModelForCausalLM, AutoTokenizer, LlamaTokenizer
+from peft import PeftModel, PeftConfig, LoraConfig
 from huggingface_hub import HfApi
-import sys, torch, shutil, hashlib
+import torch, shutil, hashlib, json, gc
 from typing import Union, List
 
 
-class GenerationConfig:
-    """A class to store the sampling configs."""
-
-    def __init__(
-        self,
-        do_sample: bool = False,
-        temperature: float = 0.9,
-        topp: float = 0.8,
-        topk: int = 1,
-    ):
-        """Initialize the sampling configs
-
-        :param do_sample: Whether to perform sampling, or use greedy decoding, defaults to False
-        :type do_sample: bool, optional
-        :param temperature: The temperature setting, defaults to 0.9
-        :type temperature: float, optional
-        :param topp: The top probabilities (top-p) setting, defaults to 0.8
-        :type topp: float, optional
-        :param topk: The top-k setting, defaults to 1
-        :type topk: int, optional
-        """
-        self.do_sample = do_sample
-        self.temperature = temperature
-        self.topp = topp
-        self.topk = topk
-
-
-class GenerationResult:
-    """A class to store the output of a generation request."""
+class _SupportedModels:
+    def __init__(self,):
+        self.supported_models = {
+            "LlamaForCausalLM": (ModelType.LLAMA, FlexFlowLLAMA, LLAMAConfig),
+            "LLaMAForCausalLM": (ModelType.LLAMA, FlexFlowLLAMA, LLAMAConfig),
+            "OPTForCausalLM": (ModelType.OPT, FlexFlowOPT, OPTConfig),
+            "RWForCausalLM": (ModelType.FALCON, FlexFlowFalcon, FalconConfig),
+            "FalconForCausalLM": (ModelType.FALCON, FlexFlowFalcon, FalconConfig),
+            "GPTBigCodeForCausalLM": (
+                ModelType.STARCODER,
+                FlexFlowSTARCODER,
+                STARCODERConfig,
+            ),
+            "MPTForCausalLM": (ModelType.MPT, FlexFlowMPT, MPTConfig),
+        }
 
-    def __init__(self, text: str = None, tokens: list = None):
-        self.output_text = text
-        self.output_tokens = tokens
+    def get_ff_model_type(self, hf_config):
+        architectures = getattr(hf_config, "architectures", [])
+        ff_arch = None
+        if next(iter(architectures), None) is not None:
+            ff_arch = self.supported_models.get(architectures[0])
+        if ff_arch is None:
+            raise ValueError(
+                f"Huggingface model of type {architectures} is not yet supported by FlexFlow"
+            )
+        return ff_arch
 
 
 class LLM:
@@ -92,68 +86,117 @@ def __init__(
         :param output_file: Path to the output file. If left blank, the output will not be written to file, defaults to ""
         :type output_file: str, optional
         """
-        self.supported_models = {
-            "LlamaForCausalLM": (ModelType.LLAMA, FlexFlowLLAMA, LLAMAConfig),
-            "LLaMAForCausalLM": (ModelType.LLAMA, FlexFlowLLAMA, LLAMAConfig),
-            "OPTForCausalLM": (ModelType.OPT, FlexFlowOPT, OPTConfig),
-            "RWForCausalLM": (ModelType.FALCON, FlexFlowFalcon, FalconConfig),
-            "FalconForCausalLM": (ModelType.FALCON, FlexFlowFalcon, FalconConfig),
-            "GPTBigCodeForCausalLM": (
-                ModelType.STARCODER,
-                FlexFlowSTARCODER,
-                STARCODERConfig,
-            ),
-            "MPTForCausalLM": (ModelType.MPT, FlexFlowMPT, MPTConfig),
-        }
+        self.supported_models = _SupportedModels()
         self.hf_config = AutoConfig.from_pretrained(model_name, trust_remote_code=True)
         self.model_name = self.hf_config._name_or_path
         (
             self.model_type,
             self.model_class,
             self.config_class,
-        ) = self.__get_ff_model_type()
+        ) = self.supported_models.get_ff_model_type(self.hf_config)
         self.data_type = data_type
         assert self.data_type == DataType.DT_HALF or self.data_type == DataType.DT_FLOAT
         self.cache_path = cache_path if len(cache_path) > 0 else "~/.cache/flexflow"
         self.refresh_cache = refresh_cache
         self.output_file = output_file
         self.rm = None
+        self.pefts = {}
 
     def __del__(self):
         # Stop the background server before deleting the object
         if type(self) == LLM and self.rm is not None:
             self.rm.stop_server()
 
-    def __get_ff_model_type(self):
-        architectures = getattr(self.hf_config, "architectures", [])
-        ff_arch = None
-        if next(iter(architectures), None) is not None:
-            ff_arch = self.supported_models.get(architectures[0])
-        if ff_arch is None:
-            print(
-                f"Huggingface model of type {architectures} is not yet supported by FlexFlow"
+    def add_peft(self, lora_config: LoraLinearConfig):
+        """Add a PEFT adapter to the LLM"""
+        if lora_config is None:
+            raise ValueError("lora_config cannot be None")
+        if len(lora_config.peft_model_id or "") == 0:
+            raise ValueError("PEFT model id cannot be empty")
+        # Inference (trainable=False): LoRA model should already exist in huggingface. Any changes of parameters from original model are ignored
+        # Training (trainable=True): Either an existing model (init_lora_weights=False) or a new one (init_lora_weights=True)
+
+        if lora_config.trainable == False or not lora_config.init_lora_weights:
+            peft_config = PeftConfig.from_pretrained(lora_config.peft_model_id)
+        else:
+            peft_config = LoraConfig(
+                peft_type="LORA",
+                base_model_name_or_path=self.model_name,
+                r=lora_config.rank,
+                target_modules=lora_config.target_modules,
+                lora_alpha=lora_config.lora_alpha,
+                lora_dropout=lora_config.lora_dropout,
+                init_lora_weights=lora_config.init_lora_weights,
             )
-            sys.exit(1)
-        return ff_arch
+        if peft_config.peft_type != "LORA":
+            raise RuntimeError(
+                f"PEFT type {peft_config.peft_type} not yet supported in FlexFlow"
+            )
+        if "base_model_name_or_path" not in peft_config.to_dict():
+            raise ValueError(
+                f"PEFT model {lora_config.peft_model_id} does not have an associated base model"
+            )
+        if peft_config.base_model_name_or_path != self.model_name:
+            raise RuntimeError(
+                f"Attempting to add PEFT with base model name {peft_config.base_model_name_or_path} to LLM {self.model_name}"
+            )
+
+        self.pefts[lora_config] = {
+            "peft_config": peft_config,
+            "peft_type": peft_config.peft_type,
+        }
+
+    def get_ff_peft_id(self, lora_config: LoraLinearConfig) -> PEFTModelID:
+        if lora_config is None:
+            raise ValueError("lora_config cannot be None")
+        if len(lora_config.peft_model_id or "") == 0:
+            raise ValueError("PEFT model id cannot be empty")
+        if lora_config not in self.pefts:
+            raise ValueError(
+                f"PEFT {lora_config} not registered with LLM {self.model_name}"
+            )
+        if "ff_peft_model_id" not in self.pefts[lora_config]:
+            raise RuntimeError(
+                f"Attempting to run PEFT {lora_config} before compiling LLM {self.model_name}"
+            )
+
+        return self.pefts[lora_config]["ff_peft_model_id"]
 
     def download_hf_config(self):
         """Save the HuggingFace model configs to a json file. Useful mainly to run the C++ inference code."""
-        self.config_dir = os.path.join(
+        config_dir = os.path.join(
             os.path.expanduser(self.cache_path), "configs", self.model_name.lower()
         )
-        self.config_path = os.path.join(self.config_dir, "config.json")
-        os.makedirs(self.config_dir, exist_ok=True)
-        print(f"Creating directory {self.config_dir} (if it doesn't exist)...")
-        print(f"Saving {self.model_name} configs to file {self.config_path}...")
-        self.hf_config.to_json_file(self.config_path)
+        config_path = os.path.join(config_dir, "config.json")
+        os.makedirs(config_dir, exist_ok=True)
+        print(f"Creating directory {config_dir} (if it doesn't exist)...")
+        print(f"Saving {self.model_name} configs to file {config_path}...")
+        self.hf_config.to_json_file(config_path)
+
+        # Save PEFT configs if the LLM has any registered PEFTs
+        for ff_peft_config, peft_dict in self.pefts.items():
+            peft_config = peft_dict["peft_config"]
+            peft_model_id = ff_peft_config.peft_model_id
+            peft_config_dir = os.path.join(
+                os.path.expanduser(self.cache_path), "configs", peft_model_id.lower()
+            )
+            os.makedirs(peft_config_dir, exist_ok=True)
+            peft_config_path = os.path.join(peft_config_dir, "config.json")
+            print(f"Saving {peft_model_id} configs to file {peft_config_path}...")
+            with open(peft_config_path, "w") as json_file:
+
+                class SetEncoder(json.JSONEncoder):
+                    def default(self, obj):
+                        if isinstance(obj, set):
+                            return list(obj)
+                        return super().default(obj)
 
-    def __get_revision_hashes(self, model_name: str, weights: bool):
+                json.dump(peft_config.to_dict(), json_file, indent=2, cls=SetEncoder)
+
+    def __get_revision_hashes(self, model_name: str, folder: str):
         ff_revision = None
-        ff_revision_file = (
-            os.path.join(self.weights_path, "rev_sha.txt")
-            if weights
-            else os.path.join(self.tokenizer_path, "rev_sha.txt")
-        )
+        ff_revision_file = os.path.join(folder, "rev_sha.txt")
+
         if os.path.exists(ff_revision_file):
             ff_revision = "".join(open(ff_revision_file).read().split())
 
@@ -173,65 +216,109 @@ def __get_revision_hashes(self, model_name: str, weights: bool):
     def download_hf_weights_if_needed(self):
         """Check in the folder specified by the cache_path whether the LLM's model weights are available and up to date.
         If not, or if the refresh_cache parameter is set to True, download new weights.
+
+        If any PEFT adapter is registered, perform the same operation for PEFT.
         """
-        if self.data_type == DataType.DT_HALF:
-            torch.set_default_tensor_type(torch.HalfTensor)
-        elif self.data_type == DataType.DT_FLOAT:
-            torch.set_default_tensor_type(torch.FloatTensor)
-        else:
-            assert False, "Data type not yet supported -- cannot download weights!"
 
-        # Use local cache, or download new version
-        self.weights_path = os.path.join(
-            os.path.expanduser(self.cache_path),
-            "weights",
-            self.model_name.lower(),
-            (
-                "full-precision"
-                if self.data_type == DataType.DT_FLOAT
-                else "half-precision"
-            ),
-        )
-        if self.refresh_cache:
-            print(
-                f"Refreshing weights in cache for model {self.model_name} at path {self.weights_path} ..."
+        def get_weights_path(model_name):
+            return os.path.join(
+                os.path.expanduser(self.cache_path),
+                "weights",
+                model_name.lower(),
+                (
+                    "full-precision"
+                    if self.data_type == DataType.DT_FLOAT
+                    else "half-precision"
+                ),
             )
-            if os.path.exists(self.weights_path):
-                shutil.rmtree(self.weights_path)
-        os.makedirs(self.weights_path, exist_ok=True)
-        print(f"Creating directory {self.weights_path} (if it doesn't exist)...")
 
-        ff_revision, ff_revision_file, latest_revision = self.__get_revision_hashes(
-            self.model_name, weights=True
-        )
-
-        # Download if needed
-        if ff_revision != latest_revision:
-            if not os.path.exists(self.model_name) or os.path.isdir(self.model_name):
-                # Local model
+        def refresh_cache_if_needed(model_name):
+            weights_path = get_weights_path(model_name)
+            if self.refresh_cache:
                 print(
-                    f"'{self.model_name}' model weights not found in cache or outdated. Downloading from huggingface.co ..."
+                    f"Refreshing weights in cache for model {model_name} at path {weights_path} ..."
                 )
-            else:
-                # Remote model
+                if os.path.exists(weights_path):
+                    shutil.rmtree(weights_path)
+            os.makedirs(weights_path, exist_ok=True)
+
+        def get_hf_llm(model_name):
+            return AutoModelForCausalLM.from_pretrained(
+                model_name,
+                trust_remote_code=True,
+                torch_dtype=(
+                    torch.float32
+                    if self.data_type == DataType.DT_FLOAT
+                    else torch.float16
+                ),
+            )
+
+        def download_llm_weights():
+            refresh_cache_if_needed(self.model_name)
+            ff_revision, ff_revision_file, latest_revision = self.__get_revision_hashes(
+                self.model_name, self.weights_path
+            )
+            if ff_revision != latest_revision:
                 print(
-                    f"'{self.model_name}' local model weights were updated! Converting new weights now..."
+                    f"'{self.model_name}' local model weights need updating! Downloading/converting new weights now..."
                 )
-            # Download model from HuggingFace, or load it from the local folder
-            hf_model = AutoModelForCausalLM.from_pretrained(
-                self.model_name, trust_remote_code=True
-            )
-            # Print log message to notify user download of model has finished
-            if not os.path.exists(self.model_name) or os.path.isdir(self.model_name):
-                print("Done downloading HF weights. Converting them now...")
-            # Convert the model to FlexFlow format
-            self.model_class.convert_hf_model(hf_model, self.weights_path)
-            # Save new revision hash to file
-            with open(ff_revision_file, "w+") as f:
-                f.write(latest_revision)
-            print("Done converting the weights...")
-        else:
-            print(f"Loading '{self.model_name}' model weights from the cache...")
+                hf_model = get_hf_llm(self.model_name)
+                # Convert the model to FlexFlow format
+                self.model_class.convert_hf_model(hf_model, self.weights_path)
+                # Save new revision hash to file
+                with open(ff_revision_file, "w+") as f:
+                    f.write(latest_revision)
+                print(f"Done converting the weights for model {self.model_name}")
+                # Deallocate hf model
+                del hf_model
+                gc.collect()
+                torch.cuda.empty_cache()
+
+        def convert_peft_model(hf_peft_model, peft_type, weights_path):
+            for name, params in hf_peft_model.named_parameters():
+                if peft_type.lower() in name:
+                    name = name.replace("base_model.model.model.", "").replace(
+                        ".default", ""
+                    )
+                    name = self.model_class.convert_hf_weight_name(name)
+                    params.detach().cpu().numpy().tofile(f"{weights_path}/{name}")
+
+        def download_peft_weights():
+            for ff_peft_config, peft_dict in self.pefts.items():
+                if not ff_peft_config.init_lora_weights:
+                    peft_config = peft_dict["peft_config"]
+                    peft_type = peft_dict["peft_type"]
+                    peft_model_id = ff_peft_config.peft_model_id
+
+                    weights_path = get_weights_path(peft_model_id)
+                    refresh_cache_if_needed(peft_model_id)
+                    ff_revision, ff_revision_file, latest_revision = self.__get_revision_hashes(
+                        peft_model_id, weights_path
+                    )
+
+                    if ff_revision != latest_revision:
+                        print(
+                            f"'{peft_model_id}' local model weights need updating! Downloading/converting new weights now..."
+                        )
+                        hf_model = get_hf_llm(peft_model_id)
+                        hf_peft_model = PeftModel.from_pretrained(
+                            hf_model, peft_model_id, config=peft_config
+                        )
+                        # Convert the model to FlexFlow format
+                        convert_peft_model(hf_peft_model, peft_type, weights_path)
+                        # Save new revision hash to file
+                        with open(ff_revision_file, "w+") as f:
+                            f.write(latest_revision)
+                        print(f"Done converting the weights for model {peft_model_id}")
+                        # Deallocate hf model
+                        del hf_peft_model
+                        del hf_model
+                        gc.collect()
+                        torch.cuda.empty_cache()
+
+        self.weights_path = get_weights_path(self.model_name)
+        download_llm_weights()
+        download_peft_weights()
 
     def download_hf_tokenizer_if_needed(self):
         """Check in the folder specified by the cache_path whether the LLM's tokenizer files are available and up to date.
@@ -241,13 +328,11 @@ def download_hf_tokenizer_if_needed(self):
 
         # Use local cache, or download new version
         self.tokenizer_path = os.path.join(
-            os.path.expanduser(self.cache_path),
-            "tokenizers",
-            self.model_name.lower(),
+            os.path.expanduser(self.cache_path), "tokenizers", self.model_name.lower()
         )
         if self.refresh_cache:
             print(
-                f"Discarding cached tokenizer files (if they exist) for model {self.model_name}..."
+                f"Refreshing cached tokenizer for model {self.model_name} at path {self.tokenizer_path} ..."
             )
             if os.path.exists(self.tokenizer_path):
                 shutil.rmtree(self.tokenizer_path)
@@ -257,46 +342,29 @@ def download_hf_tokenizer_if_needed(self):
 
         # Get local revision SHA, check if it matches latest one on huggingface
         ff_revision, ff_revision_file, latest_revision = self.__get_revision_hashes(
-            self.model_name, weights=False
+            self.model_name, self.tokenizer_path
         )
 
         if ff_revision != latest_revision:
-            if not os.path.exists(self.model_name) or os.path.isdir(self.model_name):
-                # Local model
-                print(
-                    f"'{self.model_name}' tokenizer not found in cache or outdated. Downloading from huggingface.co ..."
-                )
-            else:
-                # Remote model
-                print(
-                    f"'{self.model_name}' local tokenizer was updated! Saving new tokenizer now..."
-                )
+            print(
+                f"'{self.model_name}' tokenizer needs updating! Downloading tokenizer now..."
+            )
             # Download tokenizer from HuggingFace, or load it from the local folder
-            if self.model_type == ModelType.LLAMA:
-                hf_tokenizer = LlamaTokenizer.from_pretrained(
-                    self.model_name, use_fast=True
-                )
-            else:
-                hf_tokenizer = AutoTokenizer.from_pretrained(self.model_name)
-            # Print log message to notify user download of tokenizer has finished
-            if not os.path.exists(self.model_name) or os.path.isdir(self.model_name):
-                print("Done downloading tokenizer. Saving it now...")
+            hf_tokenizer = AutoTokenizer.from_pretrained(self.model_name, trust_remote_code=True)
             # Save tokenizer
             hf_tokenizer.save_pretrained(self.tokenizer_path)
-            print("Done saving HF tokenizer.")
+            print("Done updating HF tokenizer.")
             # Save new revision hash to file
             with open(ff_revision_file, "w+") as f:
                 f.write(latest_revision)
 
-        else:
-            print(f"Loading '{self.model_name}' tokenizer from the cache...")
-
     def compile(
         self,
         generation_config: GenerationConfig = GenerationConfig(),
         max_requests_per_batch: int = 1,
         max_seq_length: int = 256,
         max_tokens_per_batch: int = 64,
+        enable_peft_finetuning: bool = False,
         model_specific_data_parallelism_degree: int = None,
         model_specific_tensor_parallelism_degree: int = None,
         model_specific_pipeline_parallelism_degree: int = None,
@@ -312,6 +380,8 @@ def compile(
         :type max_seq_length: int, optional
         :param max_tokens_per_batch: The maximum number of tokens (across requests) to allow per batch, defaults to 64
         :type max_tokens_per_batch: int, optional
+        :param enable_peft_finetuning: Whether to enable support for PEFT fine-tuning, defaults to False
+        :type enable_peft_finetuning: bool, optional
         :param model_specific_data_parallelism_degree: Use this parameter if you want to give the LLM a different data parallelism degree than the one used to initialize the runtime, defaults to None
         :type model_specific_data_parallelism_degree: int, optional
         :param model_specific_tensor_parallelism_degree: Use this parameter if you want to give the LLM a different tensor parallelism degree than the one used to initialize the runtime, defaults to None
@@ -321,9 +391,6 @@ def compile(
         :param ssms: The SSMs to use when operating in speculative inference mode, defaults to []
         :type ssms: list, optional
         """
-        # self.max_requests_per_batch = max_requests_per_batch
-        # self.max_seq_length = max_seq_length
-        # self.max_tokens_per_batch = max_tokens_per_batch
         self.ssms = ssms
         self.generation_config = GenerationConfig()
         self.ffconfig = FFConfig()
@@ -355,6 +422,7 @@ def compile(
         self.rm.set_max_requests_per_batch(max_requests_per_batch)
         self.rm.set_max_tokens_per_batch(max_tokens_per_batch)
         self.rm.set_max_sequence_length(max_seq_length)
+        self.rm.set_enable_peft_finetuning(enable_peft_finetuning)
 
         # Instantiate the relevant model
         self.model = self.model_class(
@@ -366,16 +434,27 @@ def compile(
             max_tokens_per_batch,
         )
 
+        # Download the config from huggingface
+        self.download_hf_config()
+
+        # Download the tokenizer from huggingface (if needed) and load them
+        self.download_hf_tokenizer_if_needed()
+
         # Download the weights from huggingface (if needed)
         self.download_hf_weights_if_needed()
 
+        # Add PEFT layer if registered
+        for ff_peft_config, peft_dict in self.pefts.items():
+            ff_peft_config.ff_compile()
+            ff_peft_model_id = self.model.ffmodel.add_lora_layer(ff_peft_config)
+            peft_dict["ff_peft_model_id"] = ff_peft_model_id
+
         # Create file data loader, load weights into tensors
         model_configs = self.config_class(self.hf_config)
 
         self.rm.set_max_spec_tree_token_num(
             model_configs.max_spec_tree_token_num
-            if "max_spec_tree_token_num"
-            in model_configs.__dict__
+            if "max_spec_tree_token_num" in model_configs.__dict__
             else 20
         )
 
@@ -393,9 +472,6 @@ def compile(
         self.im = InferenceManager()
         self.im.register_model_weights_loader(self.model.ffmodel, self.fileloader)
 
-        # Download the tokenizer from huggingface (if needed) and load them
-        self.download_hf_tokenizer_if_needed()
-
         # Create tokenizer (this must be done after we have downloaded the tokenizer
         bos_token_id = (
             -1 if self.hf_config.bos_token_id is None else self.hf_config.bos_token_id
@@ -419,22 +495,36 @@ def compile(
 
             atexit.register(self.rm.stop_server)
 
-    def generate(self, prompts: Union[str, List[str]], max_length: int = 128):
+    def generate(
+        self,
+        requests_or_prompts: Union[str, List[str], Request, List[Request]],
+        max_length: int = 128,
+    ):
         """Generate tokens based on the input prompt(s)
 
-        :param prompts: The generation prompt(s) in the form of a string, or list of strings
-        :type prompts: Union[str, List[str]]
+        :param requests_or_prompts: The generation prompt(s) in the form of a string, a list of strings, a Request, or list of Requests
+        :type requests_or_prompts: Union[str, List[str], Request, List[Request]]
         :return: the generation results
         :rtype: GenerationResult
         """
-        if type(prompts) == str:
-            if len(prompts) == 0:
+        if type(requests_or_prompts) == str:
+            if len(requests_or_prompts) == 0:
                 return None
-            return self.model.ffmodel.generate([prompts], max_length)
-        elif type(prompts) == list:
-            if len(prompts) == 0:
+            return self.model.ffmodel.generate_inf_only(
+                [requests_or_prompts], max_length
+            )
+        elif type(requests_or_prompts) == Request:
+            return self.model.ffmodel.generate(requests_or_prompts)
+        elif type(requests_or_prompts) == list:
+            if len(requests_or_prompts) == 0:
                 return []
-            return self.model.ffmodel.generate(prompts, max_length)
+            if type(requests_or_prompts[0]) == str:
+                return self.model.ffmodel.generate_inf_only(
+                    requests_or_prompts, max_length
+                )
+            else:
+                print(requests_or_prompts)
+                return self.model.ffmodel.generate(requests_or_prompts)
         else:
             assert False, "Please pass a non-empty string or list of strings"
 
@@ -446,17 +536,6 @@ def stop_server(self):
         self.rm.stop_server()
         print("Background server stopped.")
 
-    def __enter__(self):
-        # Start the server when entering the context
-        # self.rm.start_server(self.model.ffmodel)
-        return self
-
-    def __exit__(self, exc_type, exc_value, traceback):
-        # Stop the server when exiting the context
-        # self.rm.stop_server()
-        if exc_type:
-            print(f"Exception occurred: {exc_value}")
-
 
 class SSM(LLM):
     """This class creates a SSM (Small-Speculative Model) object based on a model from HuggingFace"""
@@ -482,13 +561,7 @@ def __init__(
         :param output_file: Path to the output file. If left blank, the output will not be written to file, defaults to ""
         :type output_file: str, optional
         """
-        super().__init__(
-            model_name,
-            data_type,
-            cache_path,
-            refresh_cache,
-            output_file,
-        )
+        super().__init__(model_name, data_type, cache_path, refresh_cache, output_file)
 
     def compile(
         self,
@@ -496,15 +569,13 @@ def compile(
         max_requests_per_batch: int = 16,
         max_seq_length: int = 256,
         max_tokens_per_batch: int = 128,
+        enable_peft_finetuning: bool = False,
         model_specific_data_parallelism_degree: int = 1,
         model_specific_tensor_parallelism_degree: int = 1,
         model_specific_pipeline_parallelism_degree: int = 1,
         ssms: list = [],
     ):
         """Compile the SSM for inference and load the weights into memory
-
-        :param mode: The SSM inference mode (InferenceMode.INC_DECODING_MODE for incremental decoding, InferenceMode.BEAM_SEARCH_MODE for beam search, or InferenceMode.TREE_VERIFY_MODE for token tree verification), defaults to InferenceMode.INC_DECODING_MODE
-        :type mode: InferenceMode, optional
         :param generation_config: The GenerationConfig object with the configurations to use for sampling, defaults to GenerationConfig()
         :type generation_config: GenerationConfig, optional
         :param max_requests_per_batch: The maximum batch size to allow, defaults to 16
@@ -513,6 +584,8 @@ def compile(
         :type max_seq_length: int, optional
         :param max_tokens_per_batch: The maximum number of tokens (across requests) to allow per batch, defaults to 128
         :type max_tokens_per_batch: int, optional
+        :param enable_peft_finetuning: Whether to enable support for PEFT fine-tuning, defaults to False
+        :type enable_peft_finetuning: bool, optional
         :param model_specific_data_parallelism_degree: Use this parameter if you want to give the SSM a different data parallelism degree than the default one, defaults to 1
         :type model_specific_data_parallelism_degree: int, optional
         :param model_specific_tensor_parallelism_degree: Use this parameter if you want to give the SSM a different tensor parallelism degree than the default one, defaults to 1
@@ -527,6 +600,7 @@ def compile(
             max_requests_per_batch,
             max_seq_length,
             max_tokens_per_batch,
+            enable_peft_finetuning,
             model_specific_data_parallelism_degree,
             model_specific_tensor_parallelism_degree,
             model_specific_pipeline_parallelism_degree,
diff --git a/python/flexflow/type.py b/python/flexflow/type.py
index 994a85f57e..0f4726837c 100644
--- a/python/flexflow/type.py
+++ b/python/flexflow/type.py
@@ -46,6 +46,12 @@ class LossType(Enum):
     LOSS_IDENTITY = 54
 
 
+class OptimizerType(Enum):
+    OPTIMIZER_TYPE_NONE = 60
+    OPTIMIZER_TYPE_SGD = 61
+    OPTIMIZER_TYPE_ADAM = 62
+
+
 class CompMode(Enum):
     TRAINING = 70
     INFERENCE = 71
@@ -153,6 +159,11 @@ class OpType(Enum):
     RESIDUAL_LAYERNORM = 2306
 
 
+class RequestType(Enum):
+    REQ_INFERENCE = 4001
+    REQ_FINETUNING = 4002
+
+
 def enum_to_int(enum, enum_item):
     for item in enum:
         if enum_item == item:
diff --git a/rdelacou/generate_trace.py b/rdelacou/generate_trace.py
new file mode 100644
index 0000000000..986dab37df
--- /dev/null
+++ b/rdelacou/generate_trace.py
@@ -0,0 +1,121 @@
+import pandas as pd
+from math import ceil
+from random import shuffle, uniform
+import json, pickle, requests, os, argparse
+
+class TraceBuilder(object):
+
+  # trace_type: either "conv" or "code"
+  def __init__(self, import_times=True, import_prompts=True):
+    self.req_times = None
+    self.imported_req_times = False
+    self.prompt_data = None
+    self.imported_prompt_data = False
+    if import_times:
+      self.import_trace_timestamps()
+    if import_prompts:
+      self.import_prompt_data()
+
+  def import_trace_timestamps(self, trace_type="conv"):
+    if not self.imported_req_times:
+      # Import Microsoft LLM 1 hour trace
+      df_trace = pd.read_csv("https://raw.githubusercontent.com/Azure/AzurePublicDataset/master/data/AzureLLMInferenceTrace_"+trace_type+".csv", parse_dates=["TIMESTAMP"])
+      req_times = (pd.to_datetime(df_trace["TIMESTAMP"]).astype(int)//1000) # Timestamps are in microseconds
+      req_times = req_times - req_times.min()
+      self.req_times = req_times.tolist()
+      self.imported_req_times = True
+  
+  def import_prompt_data(self, shuffle_=True):
+    if not self.imported_prompt_data:
+      sharegpt_filename = "sharegpt_opt_text_completion_length.pkl"
+      sharegpt_filepath = f"./{sharegpt_filename}"
+      if os.path.exists(sharegpt_filepath):
+        os.remove("sharegpt_opt_text_completion_length.pkl")
+      sharegpt_url = f"https://github.com/sosp-ae-39/sosp-ae-astra/raw/main/datasets/{sharegpt_filename}"
+      response = requests.get(sharegpt_url)
+      with open(sharegpt_filename, "wb") as file:
+        file.write(response.content)
+      with open(sharegpt_filepath, 'rb') as f:
+        data2 = pickle.load(f)
+      os.remove("sharegpt_opt_text_completion_length.pkl")
+
+      prompt_lengths = [pair[0] for pair in data2 if pair[0] <= 2048 and pair[0] >= 4 and pair[1] >= 4 and pair[1] <= 2048 and pair[0]+pair[1] <= 2048]
+      generation_lengths = [pair[1] for pair in data2 if pair[0] <= 2048 and pair[0] >= 4 and pair[1] >= 4 and pair[1] <= 2048 and pair[0]+pair[1] <= 2048]
+
+      for pair in data2:
+        assert(len(pair) == 2)
+
+      prompt_lengths = [pair[0] for pair in data2 if pair[0] <= 2048 and pair[0] >= 4 and pair[1] >= 4 and pair[1] <= 2048 and pair[0]+pair[1] <= 2048]
+      generation_lengths = [pair[1] for pair in data2 if pair[0] <= 2048 and pair[0] >= 4 and pair[1] >= 4 and pair[1] <= 2048 and pair[0]+pair[1] <= 2048]
+      num_pairs = len(prompt_lengths)
+      assert(num_pairs == len(generation_lengths))
+      print("Number of conversation pairs: ", num_pairs)
+
+      print(f"Prompt lengths: min={min(prompt_lengths)}, max={max(prompt_lengths)}, avg={sum(prompt_lengths)/len(prompt_lengths)}")
+      print(f"Generation lengths: min={min(generation_lengths)}, max={max(generation_lengths)}, avg={sum(generation_lengths)/len(generation_lengths)}")
+      total_lengths = [prompt_lengths[i] + generation_lengths[i] for i in range(len(prompt_lengths))]
+      print(f"Total lengths: min={min(total_lengths)}, max={max(total_lengths)}, avg={sum(total_lengths)/len(total_lengths)}")
+
+      self.prompt_data = [{"human": prompt_lengths[i], "gpt": generation_lengths[i]} for i in range(num_pairs)]
+        
+      if shuffle_:
+        shuffle(self.prompt_data)
+      self.imported_prompt_data = True
+
+  # Delta is in seconds
+  # Rate is in req per second
+  def generate_trace(self, target_arrival_rate=10, debug_verbose=False):
+    self.import_trace_timestamps()
+    self.import_prompt_data()
+
+    microsec = 1000000
+    avg_arrival_rate = len(self.req_times) / (self.req_times[-1]/float(microsec)) # Request per second. Computed that way to enforce working with numbers of reasonable orders of magnitude
+    if debug_verbose:
+      print("Avg arrival rate of original trace (req/s): ", avg_arrival_rate)
+    scale_factor = float(target_arrival_rate) / avg_arrival_rate
+    if debug_verbose:
+      print("Scale factor to obtain target arrival rate: ", scale_factor)
+
+    # Buckets are 1 second timeframes
+    nb_buckets = ceil(self.req_times[-1] / microsec)
+    buckets = []
+    j = 0
+    k = 0
+    for i in range(nb_buckets):
+      bucket_size = 0
+      while(j < len(self.req_times) and self.req_times[j] >= i*microsec and self.req_times[j] < (i+1)*microsec):
+        bucket_size += 1
+        j += 1
+      bucket_size = bucket_size*scale_factor
+      prob = bucket_size - int(bucket_size)
+      bucket_size = int(bucket_size) + int(uniform(0, 1) <= prob)
+      
+      # If used all of the prompt data, loop back at the beggining and reuse some prompts
+      if k+bucket_size > len(self.prompt_data):
+        bucket = self.prompt_data[k:] + self.prompt_data[:(k+bucket_size)%len(self.prompt_data)]
+      else:
+        bucket = self.prompt_data[k:k+bucket_size]
+      k = (k+bucket_size) % len(self.prompt_data)
+      buckets.append(bucket)
+
+    if debug_verbose:
+      print("Avg arrival rate obtained (req/s): ", sum([len(b) for b in buckets])/len(buckets))
+    return buckets
+
+def generate_and_save_trace(arrival_rate, output_file):
+  builder = TraceBuilder()
+  trace = builder.generate_trace(target_arrival_rate=arrival_rate, debug_verbose=True)
+  with open(output_file, 'w+') as f:
+    json.dump(trace, f, indent=2)
+
+if __name__ == '__main__':
+  # Set up the argument parser
+  parser = argparse.ArgumentParser(description='Generate and save a trace.')
+  parser.add_argument('--arrival-rate', type=float, default=10.0, help='The target arrival rate for the trace.')
+  parser.add_argument('--output-file', type=str, default='sharegpt.json', help='The path to the output file to save the trace.')
+
+  # Parse the command-line arguments
+  args = parser.parse_args()
+
+  # Call the function with the user-provided arrival rate
+  generate_and_save_trace(args.arrival_rate, args.output_file)
diff --git a/requirements.txt b/requirements.txt
index ad65622367..64f1808934 100644
--- a/requirements.txt
+++ b/requirements.txt
@@ -16,3 +16,11 @@ transformers>=4.31.0
 sentencepiece
 einops
 pip
+# peft-related
+scipy
+bitsandbytes 
+datasets 
+accelerate 
+loralib
+triton
+peft
diff --git a/src/c/flexflow_c.cc b/src/c/flexflow_c.cc
index 5714c8fe3d..e39cb29037 100644
--- a/src/c/flexflow_c.cc
+++ b/src/c/flexflow_c.cc
@@ -67,6 +67,13 @@ class FFCObjectWrapper {
   FF_NEW_OPAQUE_WRAPPER(flexflow_request_manager_t, RequestManager *);
   FF_NEW_OPAQUE_WRAPPER(flexflow_file_data_loader_t, FileDataLoader *);
   FF_NEW_OPAQUE_WRAPPER(flexflow_generation_result_t, GenerationResult *);
+  // FF_NEW_OPAQUE_WRAPPER(flexflow_lora_optimizer_config_t, LoraOptimizerConfig
+  // *); FF_NEW_OPAQUE_WRAPPER(flexflow_lora_sgd_optimizer_config_t,
+  //                       LoraSGDOptimizerConfig *);
+  // FF_NEW_OPAQUE_WRAPPER(flexflow_lora_adam_optimizer_config_t,
+  //                       LoraAdamOptimizerConfig *);
+  FF_NEW_OPAQUE_WRAPPER(flexflow_lora_linear_config_t, LoraLinearConfig *);
+  FF_NEW_OPAQUE_WRAPPER(flexflow_peft_model_id_t, PEFTModelID *);
 };
 
 Logger ffc_log("flexflow_c");
@@ -649,6 +656,7 @@ flexflow_tensor_t *
                                            bool elementwise_affine,
                                            float eps,
                                            bool use_bias,
+                                           bool inplace_residual,
                                            char const *name) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
   const Tensor input = FFCObjectWrapper::unwrap(input_);
@@ -672,6 +680,7 @@ flexflow_tensor_t *
                               elementwise_affine,
                               eps,
                               use_bias,
+                              inplace_residual,
                               input->data_type,
                               name);
   assert(tensor_outputs[0] != nullptr);
@@ -679,7 +688,7 @@ flexflow_tensor_t *
   DEBUG_PRINT("[ResidualLayerNorm] input %p, residual1 %p, residual2 "
               "%p, output0: %p, "
               "output1: %p, use_two_residuals: %d, elementwise_affine %d, eps "
-              "%f, use_bias: %d, name %s",
+              "%f, use_bias: %d, inplace_residual: %d, name %s",
               input,
               residual1,
               residual2,
@@ -689,6 +698,7 @@ flexflow_tensor_t *
               elementwise_affine,
               eps,
               use_bias,
+              inplace_residual,
               name);
   flexflow_tensor_t *tensor_outputs_wrapped =
       (flexflow_tensor_t *)calloc(2, sizeof(flexflow_tensor_t));
@@ -706,6 +716,7 @@ flexflow_tensor_t *flexflow_model_add_add_bias_residual_layer_norm(
     bool elementwise_affine,
     float eps,
     bool use_bias,
+    bool inplace_residual,
     char const *name) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
   const Tensor input = FFCObjectWrapper::unwrap(input_);
@@ -722,13 +733,14 @@ flexflow_tensor_t *flexflow_model_add_add_bias_residual_layer_norm(
                                        elementwise_affine,
                                        eps,
                                        use_bias,
+                                       inplace_residual,
                                        input->data_type,
                                        name);
   assert(tensor_outputs[0] != nullptr);
   assert(tensor_outputs[1] != nullptr);
   DEBUG_PRINT("[AddBiasResidualLayerNorm] input %p, residual %p, output0: %p, "
               "output1: %p, elementwise_affine %d, eps "
-              "%f, use_bias %d, name %s",
+              "%f, use_bias %d, inplace_residual: %d, name %s",
               input,
               residual,
               tensor_outputs[0],
@@ -736,6 +748,7 @@ flexflow_tensor_t *flexflow_model_add_add_bias_residual_layer_norm(
               elementwise_affine,
               eps,
               use_bias,
+              inplace_residual,
               name);
   flexflow_tensor_t *tensor_outputs_wrapped =
       (flexflow_tensor_t *)calloc(2, sizeof(flexflow_tensor_t));
@@ -1469,13 +1482,20 @@ flexflow_tensor_t *
                                          const flexflow_tensor_t input2_,
                                          float eps,
                                          int dim,
+                                         bool inplace_residual,
                                          char const *name) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
   Tensor input1 = FFCObjectWrapper::unwrap(input1_);
   Tensor input2 = FFCObjectWrapper::unwrap(input2_);
   Tensor tensor_outputs[2];
-  handle->residual_rms_norm(
-      input1, input2, tensor_outputs, eps, dim, input1->data_type, name);
+  handle->residual_rms_norm(input1,
+                            input2,
+                            tensor_outputs,
+                            eps,
+                            dim,
+                            inplace_residual,
+                            input1->data_type,
+                            name);
   assert(tensor_outputs[0] != nullptr);
   assert(tensor_outputs[1] != nullptr);
   flexflow_tensor_t *tensor_outputs_wrapped =
@@ -1529,6 +1549,21 @@ flexflow_tensor_t flexflow_model_add_argmax(flexflow_model_t handle_,
   return FFCObjectWrapper::wrap(tensor);
 }
 
+flexflow_peft_model_id_t flexflow_model_add_lora_layer(
+    flexflow_model_t handle_,
+    const flexflow_lora_linear_config_t peft_config_) {
+  FFModel *handle = FFCObjectWrapper::unwrap(handle_);
+  LoraLinearConfig const *peft_config = FFCObjectWrapper::unwrap(peft_config_);
+  PEFTModelID *peft_model_id = handle->add_lora_layer(*peft_config);
+
+  DEBUG_PRINT("[Add Lora Layer] model handle: %p, peft_config handle %p, "
+              "peft_model_id: %p",
+              handle,
+              peft_config,
+              peft_model_id);
+  return FFCObjectWrapper::wrap(peft_model_id);
+}
+
 void flexflow_model_set_sgd_optimizer(flexflow_model_t handle_,
                                       flexflow_sgd_optimizer_t optimizer_) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
@@ -1584,39 +1619,83 @@ void flexflow_model_set_transformer_layer_id(flexflow_model_t handle_, int id) {
 
 void flexflow_model_generate(flexflow_model_t handle_,
                              int num_requests,
+                             enum RequestType *request_types,
                              char const **input_texts,
-                             int max_num_chars,
                              char **output_texts,
-                             int max_seq_length,
-                             int **output_length_and_tokens) {
+                             int *max_seq_lengths,
+                             flexflow_peft_model_id_t *peft_model_ids,
+                             char const **dataset_filepaths,
+                             int *training_steps,
+                             int **output_length_and_tokens,
+                             int *num_finetuning_losses,
+                             float *finetuning_losses) {
   FFModel *handle = FFCObjectWrapper::unwrap(handle_);
-  std::vector<std::string> prompts;
+  std::vector<Request> requests;
+
   for (int i = 0; i < num_requests; i++) {
-    std::string const text_str(input_texts[i]);
-    prompts.push_back(text_str);
-    DEBUG_PRINT("[Model] generate[%d] %p %s %i",
-                i,
-                handle,
-                text_str.c_str(),
-                max_seq_length);
+    if (request_types[i] == RequestType::REQ_INFERENCE) {
+      std::string const text_str(input_texts[i]);
+      Request inference_req;
+      inference_req.prompt = text_str;
+      inference_req.max_sequence_length = max_seq_lengths[i];
+      PEFTModelID *peft_model_id = FFCObjectWrapper::unwrap(peft_model_ids[i]);
+      if (peft_model_id != nullptr) {
+        inference_req.peft_model_id = *peft_model_id;
+      }
+      requests.push_back(inference_req);
+      DEBUG_PRINT("[Model] generate[%d] %p %s %i",
+                  i,
+                  handle,
+                  text_str.c_str(),
+                  max_seq_lengths[i]);
+    } else if (request_types[i] == RequestType::REQ_FINETUNING) {
+      Request fine_tuning_req;
+      fine_tuning_req.req_type = RequestType::REQ_FINETUNING;
+      fine_tuning_req.max_sequence_length = max_seq_lengths[i];
+      PEFTModelID *peft_model_id = FFCObjectWrapper::unwrap(peft_model_ids[i]);
+      if (peft_model_id != nullptr) {
+        fine_tuning_req.peft_model_id = *peft_model_id;
+      }
+      std::string const dataset_fp(dataset_filepaths[i]);
+      fine_tuning_req.dataset_filepath = dataset_fp;
+      fine_tuning_req.max_training_steps = training_steps[i];
+      requests.push_back(fine_tuning_req);
+      DEBUG_PRINT("[Model] finetune[%d] %p %s %i %i",
+                  i,
+                  handle,
+                  dataset_fp.c_str(),
+                  max_seq_lengths[i],
+                  training_steps[i]);
+    } else {
+      assert(false && "Unknown request type");
+    }
   }
-  std::vector<GenerationResult> results =
-      handle->generate(prompts, max_seq_length);
-  // If the prompt exceeds max seq len, check that we return the prompt with no
-  // additional token. Otherwise, check that the output does not exceed the max
-  // sequence length.
+
+  std::vector<GenerationResult> results = handle->generate(requests);
+
   for (int i = 0; i < num_requests; i++) {
-    assert(results[i].output_tokens.size() <= max_seq_length ||
-           results[i].output_tokens.size() == results[i].input_tokens.size());
-    output_length_and_tokens[i][0] = results[i].output_tokens.size();
-    std::copy(results[i].output_tokens.begin(),
-              results[i].output_tokens.end(),
-              output_length_and_tokens[i] + 1);
-    std::memcpy(output_texts[i],
-                results[i].output_text.c_str(),
-                results[i].output_text.length());
+    if (request_types[i] == RequestType::REQ_INFERENCE) {
+      // If the prompt exceeds max seq len, check that we return the prompt with
+      // no additional token. Otherwise, check that the output does not exceed
+      // the max sequence length.
+      assert(results[i].output_tokens.size() <= max_seq_lengths[i] ||
+             results[i].output_tokens.size() == results[i].input_tokens.size());
+      output_length_and_tokens[i][0] = results[i].output_tokens.size();
+      std::copy(results[i].output_tokens.begin(),
+                results[i].output_tokens.end(),
+                output_length_and_tokens[i] + 1);
+      std::memcpy(output_texts[i],
+                  results[i].output_text.c_str(),
+                  results[i].output_text.length());
+    } else if (request_types[i] == RequestType::REQ_FINETUNING) {
+      assert(results[i].finetuning_losses.size() > 0);
+      *num_finetuning_losses = results[i].finetuning_losses.size();
+      // *finetuning_losses = results[i].finetuning_losses.data();
+      std::memcpy(finetuning_losses,
+                  results[i].finetuning_losses.data(),
+                  results[i].finetuning_losses.size() * sizeof(float));
+    }
   }
-  // return FFCObjectWrapper::wrap(&results[0]);
 }
 
 void flexflow_model_set_position_offset(flexflow_model_t handle_,
@@ -2597,6 +2676,14 @@ void flexflow_request_manager_set_max_sequence_length(
   DEBUG_PRINT("[RequestManager] set max_sequence_length %d", max_seq_length);
 }
 
+void flexflow_request_manager_set_enable_peft_finetuning(
+    flexflow_request_manager_t handle_, bool enable_peft_finetuning_) {
+  RequestManager *handle = FFCObjectWrapper::unwrap(handle_);
+  handle->set_enable_peft_finetuning(enable_peft_finetuning_);
+  DEBUG_PRINT("[RequestManager] set_enable_peft_finetuning %d",
+              enable_peft_finetuning_);
+}
+
 void flexflow_request_manager_register_tokenizer(
     flexflow_request_manager_t handle_,
     enum ModelType model_type,
@@ -2730,3 +2817,238 @@ void flexflow_file_data_loader_load_weights(flexflow_file_data_loader_t handle_,
   FFModel *model = FFCObjectWrapper::unwrap(model_handle_);
   handle->load_weights(model);
 }
+
+// // -----------------------------------------------------------------------
+// // LoraSGDOptimizerConfig
+// // -----------------------------------------------------------------------
+
+// flexflow_lora_sgd_optimizer_config_t
+// flexflow_lora_sgd_optimizer_config_create(
+//     double lr, double momentum, bool nesterov, bool weight_decay) {
+//   LoraSGDOptimizerConfig *handle =
+//       new LoraSGDOptimizerConfig(lr, momentum, nesterov, weight_decay);
+//   DEBUG_PRINT("[LoraSGDOptimizerConfig] new %p", handle);
+//   return FFCObjectWrapper::wrap(handle);
+// }
+
+// void flexflow_lora_sgd_optimizer_config_destroy(
+//     flexflow_lora_sgd_optimizer_config_t handle_) {
+//   LoraSGDOptimizerConfig *handle = FFCObjectWrapper::unwrap(handle_);
+//   DEBUG_PRINT("[LoraSGDOptimizerConfig] delete %p", handle);
+//   delete handle;
+// }
+
+// // -----------------------------------------------------------------------
+// // LoraAdamOptimizerConfig
+// // -----------------------------------------------------------------------
+
+// flexflow_lora_adam_optimizer_config_t
+//     flexflow_lora_adam_optimizer_config_create(double alpha,
+//                                                double beta1,
+//                                                double beta2,
+//                                                double weight_decay,
+//                                                double epsilon) {
+//   LoraAdamOptimizerConfig *handle =
+//       new LoraAdamOptimizerConfig(alpha, beta1, beta2, weight_decay,
+//       epsilon);
+//   DEBUG_PRINT("[LoraAdamOptimizerConfig] new %p", handle);
+//   return FFCObjectWrapper::wrap(handle);
+// }
+
+// void flexflow_lora_adam_optimizer_config_destroy(
+//     flexflow_lora_adam_optimizer_config_t handle_) {
+//   LoraAdamOptimizerConfig *handle = FFCObjectWrapper::unwrap(handle_);
+//   DEBUG_PRINT("[LoraAdamOptimizerConfig] delete %p", handle);
+//   delete handle;
+// }
+
+// -----------------------------------------------------------------------
+// LoraLinearConfig
+// -----------------------------------------------------------------------
+
+flexflow_lora_linear_config_t
+    flexflow_lora_linear_config_create(char const *cache_folder_,
+                                       char const *peft_model_id_,
+                                       bool trainable,
+                                       bool init_lora_weights,
+                                       char const *base_model_name_or_path_,
+                                       char const *precision_,
+                                       int rank,
+                                       float lora_alpha,
+                                       float lora_dropout,
+                                       int num_target_modules,
+                                       char const **target_modules_,
+                                       enum OptimizerType optimizer_type,
+                                       float sgd_learning_rate,
+                                       float sgd_momentum,
+                                       bool sgd_nesterov,
+                                       float sgd_weight_decay,
+                                       float adam_alpha,
+                                       float adam_beta1,
+                                       float adam_beta2,
+                                       float adam_weight_decay,
+                                       float adam_epsilon) {
+  assert(cache_folder_ != nullptr &&
+         "Cannot convert nullptr char * to std::string");
+  assert(peft_model_id_ != nullptr &&
+         "Cannot convert nullptr char * to std::string");
+  assert(base_model_name_or_path_ != nullptr &&
+         "Cannot convert nullptr char * to std::string");
+  assert(precision_ != nullptr &&
+         "Cannot convert nullptr char * to std::string");
+  std::string const cache_folder(cache_folder_);
+  std::string const peft_model_id(peft_model_id_);
+  LoraOptimizerConfig *optim_config = nullptr;
+  if (optimizer_type == OptimizerType::OPTIMIZER_TYPE_SGD) {
+    optim_config = new LoraSGDOptimizerConfig(
+        sgd_learning_rate, sgd_momentum, sgd_nesterov, sgd_weight_decay);
+  } else if (optimizer_type == OptimizerType::OPTIMIZER_TYPE_ADAM) {
+    optim_config = new LoraAdamOptimizerConfig(
+        adam_alpha, adam_beta1, adam_beta2, adam_weight_decay, adam_epsilon);
+  }
+  std::vector<std::string> target_modules;
+  for (int i = 0; i < num_target_modules; i++) {
+    std::string const target_module(target_modules_[i]);
+    target_modules.push_back(target_module);
+  }
+  std::string const base_model_name_or_path(base_model_name_or_path_);
+  std::string const precision(precision_);
+  LoraLinearConfig *handle = new LoraLinearConfig(cache_folder,
+                                                  peft_model_id,
+                                                  trainable,
+                                                  optim_config,
+                                                  init_lora_weights,
+                                                  base_model_name_or_path,
+                                                  precision,
+                                                  rank,
+                                                  lora_alpha,
+                                                  lora_dropout,
+                                                  target_modules);
+  DEBUG_PRINT("[LoraLinearConfig] new %p", handle);
+  return FFCObjectWrapper::wrap(handle);
+}
+
+void flexflow_lora_linear_config_destroy(
+    flexflow_lora_linear_config_t handle_) {
+  LoraLinearConfig *peft_config = FFCObjectWrapper::unwrap(handle_);
+  DEBUG_PRINT("[LoraLinearConfig] delete %p", peft_config);
+  delete peft_config;
+}
+
+char const *flexflow_lora_linear_config_get_cache_folder(
+    flexflow_lora_linear_config_t handle_) {
+  LoraLinearConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  return handle->cache_folder.c_str();
+}
+
+char const *flexflow_lora_linear_config_get_peft_model_id(
+    flexflow_lora_linear_config_t handle_) {
+  LoraLinearConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  return handle->peft_model_id.c_str();
+}
+
+int flexflow_lora_linear_config_get_rank(
+    flexflow_lora_linear_config_t handle_) {
+  LoraLinearConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  return handle->rank;
+}
+
+float flexflow_lora_linear_config_get_lora_alpha(
+    flexflow_lora_linear_config_t handle_) {
+  LoraLinearConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  return handle->lora_alpha;
+}
+
+float flexflow_lora_linear_config_get_lora_dropout(
+    flexflow_lora_linear_config_t handle_) {
+  LoraLinearConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  return handle->lora_dropout;
+}
+
+bool flexflow_lora_linear_config_get_trainable(
+    flexflow_lora_linear_config_t handle_) {
+  LoraLinearConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  return handle->trainable;
+}
+
+bool flexflow_lora_linear_config_get_init_lora_weights(
+    flexflow_lora_linear_config_t handle_) {
+  LoraLinearConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  return handle->init_lora_weights;
+}
+
+char const **flexflow_lora_linear_config_get_target_modules(
+    flexflow_lora_linear_config_t handle_, int *num_target_modules) {
+  LoraLinearConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  *num_target_modules = handle->target_modules.size();
+  static std::vector<char const *> target_modules_;
+  target_modules_.clear();
+  for (auto const &target_module : handle->target_modules) {
+    target_modules_.push_back(target_module.c_str());
+  }
+  return target_modules_.data();
+}
+
+char const *flexflow_lora_linear_config_get_base_model_name_or_path(
+    flexflow_lora_linear_config_t handle_) {
+  LoraLinearConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  return handle->base_model_name_or_path.c_str();
+}
+
+char const *flexflow_lora_linear_config_get_precision(
+    flexflow_lora_linear_config_t handle_) {
+  LoraLinearConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  return handle->precision.c_str();
+}
+
+void flexflow_lora_linear_config_set_lora_alpha(
+    flexflow_lora_linear_config_t handle_, float value) {
+  LoraLinearConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  handle->lora_alpha = value;
+}
+
+void flexflow_lora_linear_config_set_lora_dropout(
+    flexflow_lora_linear_config_t handle_, float value) {
+  LoraLinearConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  handle->lora_dropout = value;
+}
+
+void flexflow_lora_linear_config_set_trainable(
+    flexflow_lora_linear_config_t handle_, bool value) {
+  LoraLinearConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  handle->trainable = value;
+}
+
+void flexflow_lora_linear_config_set_init_lora_weights(
+    flexflow_lora_linear_config_t handle_, bool value) {
+  LoraLinearConfig *handle = FFCObjectWrapper::unwrap(handle_);
+  handle->init_lora_weights = value;
+}
+
+// -----------------------------------------------------------------------
+// PEFTModelID
+// -----------------------------------------------------------------------
+
+flexflow_peft_model_id_t flexflow_peft_model_id_create() {
+  PEFTModelID *handle = new PEFTModelID();
+  DEBUG_PRINT("[PEFTModelID] new %p", handle);
+  return FFCObjectWrapper::wrap(handle);
+}
+
+flexflow_peft_model_id_t flexflow_peft_model_id_create_id(size_t id) {
+  PEFTModelID *handle = new PEFTModelID(id);
+  DEBUG_PRINT("[PEFTModelID] new %p", handle);
+  return FFCObjectWrapper::wrap(handle);
+}
+
+flexflow_peft_model_id_t flexflow_peft_model_id_no_id() {
+  PEFTModelID *handle = const_cast<PEFTModelID *>(&PEFTModelID::NO_ID);
+  DEBUG_PRINT("[PEFTModelID] new %p", handle);
+  return FFCObjectWrapper::wrap(handle);
+}
+
+void flexflow_peft_model_id_destroy(flexflow_peft_model_id_t handle_) {
+  PEFTModelID *peft_model_id = FFCObjectWrapper::unwrap(handle_);
+  DEBUG_PRINT("[PEFTModelID] delete %p", peft_model_id);
+  delete peft_model_id;
+}
diff --git a/src/loss_functions/loss_functions.cpp b/src/loss_functions/loss_functions.cpp
index a87aaade84..99c13f5a67 100644
--- a/src/loss_functions/loss_functions.cpp
+++ b/src/loss_functions/loss_functions.cpp
@@ -86,7 +86,7 @@ void Loss::sparse_categorical_crossentropy_loss_backward_kernel_wrapper(
                      num_classes,
                      k);
   // Scale logit gradients by op->scale_factor
-  hipLaunchKernelGGL(scale_kernel,
+  hipLaunchKernelGGL(scale_kernel<float>,
                      GET_BLOCKS(logit_grad_volume),
                      CUDA_NUM_THREADS,
                      0,
@@ -116,7 +116,7 @@ void Loss::categorical_crossentropy_loss_backward_kernel_wrapper(
                      label_ptr,
                      logit_volume);
   // Scale logit gradients by loss->scale_factor
-  hipLaunchKernelGGL(scale_kernel,
+  hipLaunchKernelGGL(scale_kernel<float>,
                      GET_BLOCKS(logit_grad_volume),
                      CUDA_NUM_THREADS,
                      0,
@@ -146,7 +146,7 @@ void Loss::mean_squared_error_avg_loss_backward_kernel_wrapper(
                      label_ptr,
                      logit_volume);
   // Scale logit gradients by loss->scale_factor
-  hipLaunchKernelGGL(scale_kernel,
+  hipLaunchKernelGGL(scale_kernel<float>,
                      GET_BLOCKS(logit_grad_volume),
                      CUDA_NUM_THREADS,
                      0,
@@ -173,7 +173,7 @@ void Loss::identity_loss_backward_kernel_wrapper(float *loss_grad_ptr,
                      loss_ptr,
                      loss_volume);
   // Scale logit gradients by loss->scale_factor
-  hipLaunchKernelGGL(scale_kernel,
+  hipLaunchKernelGGL(scale_kernel<float>,
                      GET_BLOCKS(loss_grad_volume),
                      CUDA_NUM_THREADS,
                      0,
diff --git a/src/loss_functions/loss_functions.cu b/src/loss_functions/loss_functions.cu
index f78311980c..636ef9c4c3 100644
--- a/src/loss_functions/loss_functions.cu
+++ b/src/loss_functions/loss_functions.cu
@@ -81,7 +81,7 @@ void Loss::sparse_categorical_crossentropy_loss_backward_kernel_wrapper(
       logit_grad_ptr, label_ptr, num_samples, num_classes, k);
   // Scale logit gradients by op->scale_factor
   scale_kernel<<<GET_BLOCKS(logit_grad_volume), CUDA_NUM_THREADS, 0, stream>>>(
-      logit_grad_ptr, logit_grad_volume, 0, scale_factor * k);
+      logit_grad_ptr, logit_grad_volume, 0.0f, scale_factor * k);
 }
 
 void Loss::categorical_crossentropy_loss_backward_kernel_wrapper(
@@ -100,7 +100,7 @@ void Loss::categorical_crossentropy_loss_backward_kernel_wrapper(
       logit_grad_ptr, logit_ptr, label_ptr, logit_volume);
   // Scale logit gradients by loss->scale_factor
   scale_kernel<<<GET_BLOCKS(logit_grad_volume), CUDA_NUM_THREADS, 0, stream>>>(
-      logit_grad_ptr, logit_grad_volume, 0, scale_factor);
+      logit_grad_ptr, logit_grad_volume, 0.0f, scale_factor);
 }
 
 void Loss::mean_squared_error_avg_loss_backward_kernel_wrapper(
@@ -119,7 +119,7 @@ void Loss::mean_squared_error_avg_loss_backward_kernel_wrapper(
       logit_grad_ptr, logit_ptr, label_ptr, logit_volume);
   // Scale logit gradients by loss->scale_factor
   scale_kernel<<<GET_BLOCKS(logit_grad_volume), CUDA_NUM_THREADS, 0, stream>>>(
-      logit_grad_ptr, logit_grad_volume, 0, scale_factor);
+      logit_grad_ptr, logit_grad_volume, 0.0f, scale_factor);
 }
 
 void Loss::identity_loss_backward_kernel_wrapper(float *loss_grad_ptr,
@@ -135,7 +135,7 @@ void Loss::identity_loss_backward_kernel_wrapper(float *loss_grad_ptr,
                            stream>>>(loss_grad_ptr, loss_ptr, loss_volume);
   // Scale logit gradients by loss->scale_factor
   scale_kernel<<<GET_BLOCKS(loss_grad_volume), CUDA_NUM_THREADS, 0, stream>>>(
-      loss_grad_ptr, loss_grad_volume, 0, scale_factor);
+      loss_grad_ptr, loss_grad_volume, 0.0f, scale_factor);
 }
 
 }; // namespace FlexFlow
diff --git a/src/ops/add_bias_residual_layer_norm.cc b/src/ops/add_bias_residual_layer_norm.cc
index a17e156f18..7a1da2e974 100644
--- a/src/ops/add_bias_residual_layer_norm.cc
+++ b/src/ops/add_bias_residual_layer_norm.cc
@@ -43,7 +43,8 @@ bool operator==(AddBiasResidualLayerNormParams const &lhs,
                 AddBiasResidualLayerNormParams const &rhs) {
   return lhs.layer_guid == rhs.layer_guid && lhs.axes == rhs.axes &&
          lhs.elementwise_affine == rhs.elementwise_affine &&
-         lhs.use_bias == rhs.use_bias;
+         lhs.use_bias == rhs.use_bias &&
+         lhs.inplace_residual == rhs.inplace_residual;
 }
 
 bool AddBiasResidualLayerNormParams::is_valid(
@@ -58,7 +59,8 @@ AddBiasResidualLayerNormParams AddBiasResidualLayerNorm::get_params() const {
   params.elementwise_affine = this->elementwise_affine;
   params.eps = this->eps;
   params.use_bias = this->use_bias;
-  if (this->name != nullptr) {
+  params.inplace_residual = this->inplace_residual;
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
@@ -71,6 +73,7 @@ void FFModel::add_bias_residual_layer_norm(const Tensor input,
                                            bool elementwise_affine,
                                            float eps,
                                            bool use_bias,
+                                           bool inplace_residual,
                                            DataType data_type,
                                            char const *name) {
   // In PyTorch, axes must be the sizes of the last axes.size() dimensions of
@@ -171,6 +174,7 @@ void FFModel::add_bias_residual_layer_norm(const Tensor input,
   ln->add_int_property("use_bias", use_bias);
   ln->add_int_vector_property("axes", axes);
   ln->add_float_property("eps", eps);
+  ln->add_int_property("inplace_residual", inplace_residual);
   layers.push_back(ln);
   outputs[0] = ln->outputs[0];
   outputs[1] = ln->outputs[1];
@@ -189,6 +193,8 @@ Op *AddBiasResidualLayerNorm::create_operator_from_layer(
   layer->get_int_vector_property("axes", axes);
   float eps;
   layer->get_float_property("eps", eps);
+  layer->get_int_property("inplace_residual", value);
+  bool inplace_residual = (bool)value;
   return new AddBiasResidualLayerNorm(model,
                                       layer->layer_guid,
                                       inputs[0],
@@ -197,6 +203,7 @@ Op *AddBiasResidualLayerNorm::create_operator_from_layer(
                                       elementwise_affine,
                                       use_bias,
                                       eps,
+                                      inplace_residual,
                                       false, // allocate_weights
                                       layer->name);
 }
@@ -215,6 +222,7 @@ AddBiasResidualLayerNorm::AddBiasResidualLayerNorm(
                                params.elementwise_affine,
                                params.use_bias,
                                params.eps,
+                               params.inplace_residual,
                                allocate_weights,
                                params.name) {}
 
@@ -227,6 +235,7 @@ AddBiasResidualLayerNorm::AddBiasResidualLayerNorm(
     bool _elementwise_affine,
     bool _use_bias,
     float _eps,
+    bool _inplace_residual,
     bool allocate_weights,
     char const *name)
     : Op(model,
@@ -239,7 +248,7 @@ AddBiasResidualLayerNorm::AddBiasResidualLayerNorm(
          _input,
          _residual),
       elementwise_affine(_elementwise_affine), eps(_eps), axes(_axes),
-      use_bias(_use_bias) {
+      use_bias(_use_bias), inplace_residual(_inplace_residual) {
   // overwrite layer_guid
   layer_guid = _layer_guid;
   outputs[0] = model.create_parallel_tensor_legion_ordering(
@@ -348,48 +357,57 @@ void AddBiasResidualLayerNorm::init_inference(
                          false /*must*/,
                          0 /*mapper_id*/,
                          machine_view_hash);
+  if (inplace_residual) {
+    assert(batch_outputs[0]->part == batch_inputs[0]->part);
+    assert(batch_outputs[0]->region == batch_inputs[0]->region);
+  }
   // attn output
-  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_inputs[0]->region));
-  launcher.add_field(0, FID_DATA);
+  // added: attn_output + attn final bias + residual
+  int fid = 0;
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[0]->part,
+                        0 /*projection id*/,
+                        inplace_residual ? READ_WRITE : READ_ONLY,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region));
+  launcher.add_field(fid++, FID_DATA);
   // residual
   launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
                                                     EXCLUSIVE,
                                                     batch_inputs[1]->region));
-  launcher.add_field(1, FID_DATA);
-  // added: attn_output + attn final bias + residual
-  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_outputs[0]->region));
-  launcher.add_field(2, FID_DATA);
+  launcher.add_field(fid++, FID_DATA);
+  if (!inplace_residual) {
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[0]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[0]->region));
+    launcher.add_field(fid++, FID_DATA);
+  }
   // layer norm output
   launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
                                                     0 /*projection id*/,
                                                     WRITE_ONLY,
                                                     EXCLUSIVE,
                                                     batch_outputs[1]->region));
-  launcher.add_field(3, FID_DATA);
+  launcher.add_field(fid++, FID_DATA);
   // attn final bias
   launcher.add_region_requirement(RegionRequirement(weights[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
                                                     EXCLUSIVE,
                                                     weights[0]->region));
-  launcher.add_field(4, FID_DATA);
+  launcher.add_field(fid++, FID_DATA);
   if (elementwise_affine) {
     launcher.add_region_requirement(RegionRequirement(weights[1]->part,
                                                       0 /*projection id*/,
                                                       READ_ONLY,
                                                       EXCLUSIVE,
                                                       weights[1]->region));
-    launcher.add_field(5, FID_DATA);
+    launcher.add_field(fid++, FID_DATA);
 
     if (use_bias) {
       launcher.add_region_requirement(RegionRequirement(weights[2]->part,
@@ -397,7 +415,7 @@ void AddBiasResidualLayerNorm::init_inference(
                                                         READ_ONLY,
                                                         EXCLUSIVE,
                                                         weights[2]->region));
-      launcher.add_field(6, FID_DATA);
+      launcher.add_field(fid++, FID_DATA);
     }
   }
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
@@ -420,48 +438,56 @@ void AddBiasResidualLayerNorm::init(FFModel const &ff) {
                          false /*must*/,
                          0 /*mapper_id*/,
                          outputs[0]->machine_view.hash());
-  // attn output
-  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    inputs[0]->region));
-  launcher.add_field(0, FID_DATA);
+  if (inplace_residual) {
+    assert(outputs[0]->part == inputs[0]->part);
+    assert(outputs[0]->region == inputs[0]->region);
+  }
+  // input: attn output
+  // added: attn_output + attn final bias + residual
+  int fid = 0;
+  launcher.add_region_requirement(
+      RegionRequirement(inputs[0]->part,
+                        0 /*projection id*/,
+                        inplace_residual ? READ_WRITE : READ_ONLY,
+                        EXCLUSIVE,
+                        inputs[0]->region));
+  launcher.add_field(fid++, FID_DATA);
   // residual
   launcher.add_region_requirement(RegionRequirement(inputs[1]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
                                                     EXCLUSIVE,
                                                     inputs[1]->region));
-  launcher.add_field(1, FID_DATA);
-  // added: attn_output + attn final bias + residual
-  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    outputs[0]->region));
-  launcher.add_field(2, FID_DATA);
+  launcher.add_field(fid++, FID_DATA);
+  if (!inplace_residual) {
+    launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                      0 /*projection id*/,
+                                                      WRITE_ONLY,
+                                                      EXCLUSIVE,
+                                                      outputs[0]->region));
+    launcher.add_field(fid++, FID_DATA);
+  }
   // layer norm output
   launcher.add_region_requirement(RegionRequirement(outputs[1]->part,
                                                     0 /*projection id*/,
                                                     WRITE_ONLY,
                                                     EXCLUSIVE,
                                                     outputs[1]->region));
-  launcher.add_field(3, FID_DATA);
+  launcher.add_field(fid++, FID_DATA);
   // attn final bias
   launcher.add_region_requirement(RegionRequirement(weights[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
                                                     EXCLUSIVE,
                                                     weights[0]->region));
-  launcher.add_field(4, FID_DATA);
+  launcher.add_field(fid++, FID_DATA);
   if (elementwise_affine) {
     launcher.add_region_requirement(RegionRequirement(weights[1]->part,
                                                       0 /*projection id*/,
                                                       READ_ONLY,
                                                       EXCLUSIVE,
                                                       weights[1]->region));
-    launcher.add_field(5, FID_DATA);
+    launcher.add_field(fid++, FID_DATA);
 
     if (use_bias) {
       launcher.add_region_requirement(RegionRequirement(weights[2]->part,
@@ -469,7 +495,7 @@ void AddBiasResidualLayerNorm::init(FFModel const &ff) {
                                                         READ_ONLY,
                                                         EXCLUSIVE,
                                                         weights[2]->region));
-      launcher.add_field(6, FID_DATA);
+      launcher.add_field(fid++, FID_DATA);
     }
   }
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
@@ -478,13 +504,11 @@ void AddBiasResidualLayerNorm::init(FFModel const &ff) {
 }
 
 /*
-  regions[0](I): attn output
-  regions[1](I): residual
-  regions[2](O): added output (attn output + final attn bias + residual)
-  regions[3](O): layer norm output
-  regions[4](I): final attn bias
-  regions[5](I): gamma
-  regions[6](I): beta
+  regions[0](I/O): attn output AND added output (attn output + final attn bias +
+  residual) regions[1](I): residual regions[2](O): layer norm output
+  regions[3](I): final attn bias
+  regions[4](I): gamma
+  regions[5](I): beta
 */
 OpMeta *AddBiasResidualLayerNorm::init_task(
     Task const *task,
@@ -517,10 +541,6 @@ void AddBiasResidualLayerNorm::forward(FFModel const &ff) {
   assert(false);
 }
 
-void AddBiasResidualLayerNorm::backward(FFModel const &ff) {
-  assert(false);
-}
-
 FutureMap AddBiasResidualLayerNorm::inference(
     FFModel const &ff,
     BatchConfigFuture const &bc,
@@ -546,69 +566,94 @@ FutureMap AddBiasResidualLayerNorm::inference(
                          0 /*mapper_id*/,
                          machine_view_hash);
   launcher.add_future(bc);
-  // attn output
-  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+  if (inplace_residual) {
+    assert(batch_outputs[0]->part == batch_inputs[0]->part);
+    assert(batch_outputs[0]->region == batch_inputs[0]->region);
+  }
+  int fid = 0;
+  // input
+  // added_output: input + attn bias + residual
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[0]->part,
+                        0 /*projection id*/,
+                        inplace_residual ? READ_WRITE : READ_ONLY,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region));
+  launcher.add_field(fid++, FID_DATA);
+  // attn bias
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
                                                     EXCLUSIVE,
-                                                    batch_inputs[0]->region));
-  launcher.add_field(0, FID_DATA);
+                                                    weights[0]->region));
+  launcher.add_field(fid++, FID_DATA);
   // residual
   launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
                                                     EXCLUSIVE,
                                                     batch_inputs[1]->region));
-  launcher.add_field(1, FID_DATA);
-  // added: attn_output + attn final bias + residual
-  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_outputs[0]->region));
-  launcher.add_field(2, FID_DATA);
-  // layer norm output
+  launcher.add_field(fid++, FID_DATA);
+  if (!inplace_residual) {
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[0]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[0]->region));
+    launcher.add_field(fid++, FID_DATA);
+  }
+  // output
   launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
                                                     0 /*projection id*/,
                                                     WRITE_ONLY,
                                                     EXCLUSIVE,
                                                     batch_outputs[1]->region));
-  launcher.add_field(3, FID_DATA);
-  // attn final bias
-  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    weights[0]->region));
-  launcher.add_field(4, FID_DATA);
+  launcher.add_field(fid++, FID_DATA);
   if (elementwise_affine) {
+    // gamma
     launcher.add_region_requirement(RegionRequirement(weights[1]->part,
                                                       0 /*projection id*/,
                                                       READ_ONLY,
                                                       EXCLUSIVE,
                                                       weights[1]->region));
-    launcher.add_field(5, FID_DATA);
-
+    launcher.add_field(fid++, FID_DATA);
     if (use_bias) {
+      // beta
       launcher.add_region_requirement(RegionRequirement(weights[2]->part,
                                                         0 /*projection id*/,
                                                         READ_ONLY,
                                                         EXCLUSIVE,
                                                         weights[2]->region));
-      launcher.add_field(6, FID_DATA);
+      launcher.add_field(fid++, FID_DATA);
     }
   }
   return runtime->execute_index_space(ctx, launcher);
 }
 
+void AddBiasResidualLayerNorm::map_output_tensors(FFModel &ff) {
+  assert(numOutputs == 2);
+  assert(outputs[0]->get_volume() == inputs[0]->get_volume());
+  if (inplace_residual) {
+    outputs[0]->parallel_is = inputs[0]->parallel_is;
+    outputs[0]->region = inputs[0]->region;
+    outputs[0]->part = inputs[0]->part;
+    outputs[0]->region_grad = inputs[0]->region_grad;
+    outputs[0]->part_grad = inputs[0]->part_grad;
+    // map output 1 to new region
+    ff.map_tensor(outputs[1], this);
+  } else {
+    Op::map_output_tensors(ff);
+  }
+}
+
 /*
-  regions[0](I): attn output
-  regions[1](I): residual
-  regions[2](O): added output (attn output + final attn bias + residual)
-  regions[3](O): layer norm output
-  regions[4](I): final attn bias
-  regions[5](I): gamma
-  regions[6](I): beta
+  regions[0](I): input / added output
+  regions[1](I): attn bias
+  regions[2](I): residual
+  regions[3](O): output
+  regions[4](I): gamma
+  regions[5](I): beta
 */
 void AddBiasResidualLayerNorm::inference_task(
     Task const *task,
@@ -626,30 +671,72 @@ void AddBiasResidualLayerNorm::inference_task(
       *((AddBiasResidualLayerNormMeta **)task->local_args);
 
   assert(regions.size() ==
-         5 + (m->elementwise_affine ? (m->use_bias ? 2 : 1) : 0));
-
-  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
-      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  GenericTensorAccessorR residual = helperGetGenericTensorAccessorRO(
-      m->input_type[1], regions[1], task->regions[1], FID_DATA, ctx, runtime);
-  GenericTensorAccessorW added_output = helperGetGenericTensorAccessorWO(
-      m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
-  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
-      m->output_type[1], regions[3], task->regions[3], FID_DATA, ctx, runtime);
-  GenericTensorAccessorR attn_bias = helperGetGenericTensorAccessorRO(
-      m->weight_type[0], regions[4], task->regions[4], FID_DATA, ctx, runtime);
+         4 + (m->elementwise_affine ? (m->use_bias ? 2 : 1) : 0));
+
+  int rid = 0, tid = 0, did = 0;
+  GenericTensorAccessorR input =
+      helperGetGenericTensorAccessorRO(m->input_type[0],
+                                       regions[rid++],
+                                       task->regions[tid++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorR attn_bias =
+      helperGetGenericTensorAccessorRO(m->weight_type[0],
+                                       regions[rid++],
+                                       task->regions[tid++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorR residual =
+      helperGetGenericTensorAccessorRO(m->input_type[1],
+                                       regions[rid++],
+                                       task->regions[tid++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorW added_output;
+  if (m->inplace_residual) {
+    added_output = helperGetGenericTensorAccessorWO(m->output_type[0],
+                                                    regions[0],
+                                                    task->regions[0],
+                                                    FID_DATA,
+                                                    ctx,
+                                                    runtime);
+  } else {
+    added_output = helperGetGenericTensorAccessorWO(m->output_type[0],
+                                                    regions[rid++],
+                                                    task->regions[tid++],
+                                                    FID_DATA,
+                                                    ctx,
+                                                    runtime);
+  }
+  GenericTensorAccessorW output =
+      helperGetGenericTensorAccessorWO(m->output_type[1],
+                                       regions[rid++],
+                                       task->regions[tid++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
   GenericTensorAccessorR gamma, beta;
 
   Domain in_domain = runtime->get_index_space_domain(
-      ctx, task->regions[0].region.get_index_space());
+      ctx, task->regions[did++].region.get_index_space());
+  Domain attn_bias_domain = runtime->get_index_space_domain(
+      ctx, task->regions[did++].region.get_index_space());
   Domain residual_domain = runtime->get_index_space_domain(
-      ctx, task->regions[1].region.get_index_space());
-  Domain added_out_domain = runtime->get_index_space_domain(
-      ctx, task->regions[2].region.get_index_space());
+      ctx, task->regions[did++].region.get_index_space());
+  Domain added_out_domain;
+  if (m->inplace_residual) {
+    added_out_domain = runtime->get_index_space_domain(
+        ctx, task->regions[0].region.get_index_space());
+  } else {
+    added_out_domain = runtime->get_index_space_domain(
+        ctx, task->regions[did++].region.get_index_space());
+  }
   Domain out_domain = runtime->get_index_space_domain(
-      ctx, task->regions[3].region.get_index_space());
-  Domain attn_bias_domain = runtime->get_index_space_domain(
-      ctx, task->regions[4].region.get_index_space());
+      ctx, task->regions[did++].region.get_index_space());
+
   Domain gamma_domain, beta_domain;
 
   assert(in_domain.get_volume() == out_domain.get_volume());
@@ -673,23 +760,23 @@ void AddBiasResidualLayerNorm::inference_task(
 
   if (m->elementwise_affine) {
     gamma = helperGetGenericTensorAccessorRO(m->weight_type[1],
-                                             regions[5],
-                                             task->regions[5],
+                                             regions[rid++],
+                                             task->regions[tid++],
                                              FID_DATA,
                                              ctx,
                                              runtime);
     gamma_domain = runtime->get_index_space_domain(
-        ctx, task->regions[5].region.get_index_space());
+        ctx, task->regions[did++].region.get_index_space());
 
     if (m->use_bias) {
       beta = helperGetGenericTensorAccessorRO(m->weight_type[2],
-                                              regions[6],
-                                              task->regions[6],
+                                              regions[rid++],
+                                              task->regions[tid++],
                                               FID_DATA,
                                               ctx,
                                               runtime);
       beta_domain = runtime->get_index_space_domain(
-          ctx, task->regions[6].region.get_index_space());
+          ctx, task->regions[did++].region.get_index_space());
       assert(gamma_domain == beta_domain);
     }
 
@@ -707,16 +794,7 @@ void AddBiasResidualLayerNorm::inference_task(
   }
 
   AddBiasResidualLayerNorm::inference_kernel_wrapper(
-      m,
-      (int)attn_bias_dim,
-      (int)residual_domain.get_volume(),
-      input,
-      added_output,
-      output,
-      residual,
-      attn_bias,
-      gamma,
-      beta);
+      m, bc, input, attn_bias, residual, added_output, output, gamma, beta);
 
   if (m->inference_debugging) {
     assert(task->index_point.get_dim() == 1);
@@ -729,13 +807,299 @@ void AddBiasResidualLayerNorm::inference_task(
         weights_accessors.push_back(beta);
       }
     }
+    AddBiasResidualLayerNorm::save_inference_tensors_to_file(
+        m, shard_id, bc, {residual}, weights_accessors, {added_output, output});
+  }
+}
+
+void AddBiasResidualLayerNorm::backward(FFModel const &ff) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_backward(ff, argmap);
+  IndexLauncher launcher(ADD_BIAS_RESIDUAL_LAYERNORM_BWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  int field_id = 0;
+  // output_grad
+  launcher.add_region_requirement(RegionRequirement(outputs[1]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[1]->region_grad));
+  launcher.add_field(field_id++, FID_DATA);
+  // added output
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(field_id++, FID_DATA);
+  // input grad
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region_grad));
+  launcher.add_field(field_id++, FID_DATA);
+  // residual grad
+  launcher.add_region_requirement(RegionRequirement(inputs[1]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    inputs[1]->region_grad));
+  launcher.add_field(field_id++, FID_DATA);
+  // attn bias
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region_grad));
+  launcher.add_field(field_id++, FID_DATA);
+  if (elementwise_affine) {
+    // gamma
+    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[1]->region));
+    launcher.add_field(field_id++, FID_DATA);
+    // gamma_grad
+    launcher.add_region_requirement(RegionRequirement(weights[1]->part_grad,
+                                                      0 /*projection id*/,
+                                                      READ_WRITE,
+                                                      EXCLUSIVE,
+                                                      weights[1]->region_grad));
+    launcher.add_field(field_id++, FID_DATA);
+    if (use_bias) {
+      // beta_grad
+      launcher.add_region_requirement(
+          RegionRequirement(weights[2]->part_grad,
+                            0 /*projection id*/,
+                            READ_WRITE,
+                            EXCLUSIVE,
+                            weights[2]->region_grad));
+      launcher.add_field(field_id++, FID_DATA);
+    }
+  }
+  runtime->execute_index_space(ctx, launcher);
+}
+
+void AddBiasResidualLayerNorm::backward_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  assert(task->regions.size() == regions.size());
+  AddBiasResidualLayerNormMeta *m =
+      *((AddBiasResidualLayerNormMeta **)task->local_args);
+  assert(regions.size() ==
+         5 + (m->elementwise_affine ? (m->use_bias ? 3 : 2) : 0));
+
+  int region_idx = 0, task_region_idx = 0;
+
+  GenericTensorAccessorR output_grad =
+      helperGetGenericTensorAccessorRO(m->output_type[1],
+                                       regions[region_idx++],
+                                       task->regions[task_region_idx++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorR added_output =
+      helperGetGenericTensorAccessorRO(m->output_type[0],
+                                       regions[region_idx++],
+                                       task->regions[task_region_idx++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorW input_grad =
+      helperGetGenericTensorAccessorRW(m->input_type[0],
+                                       regions[region_idx++],
+                                       task->regions[task_region_idx++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorW residual_grad =
+      helperGetGenericTensorAccessorRW(m->input_type[1],
+                                       regions[region_idx++],
+                                       task->regions[task_region_idx++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorW attn_bias_grad =
+      helperGetGenericTensorAccessorRW(m->input_type[2],
+                                       regions[region_idx++],
+                                       task->regions[task_region_idx++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorR gamma;
+  GenericTensorAccessorW gamma_grad, beta_grad;
+  if (m->elementwise_affine) {
+    assert(m->use_bias == (regions.size() == 6));
+    gamma = helperGetGenericTensorAccessorRO(m->output_type[0],
+                                             regions[region_idx++],
+                                             task->regions[task_region_idx++],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
+    gamma_grad =
+        helperGetGenericTensorAccessorRW(m->output_type[0],
+                                         regions[region_idx++],
+                                         task->regions[task_region_idx++],
+                                         FID_DATA,
+                                         ctx,
+                                         runtime);
+    if (m->use_bias) {
+      beta_grad =
+          helperGetGenericTensorAccessorRW(m->output_type[0],
+                                           regions[region_idx++],
+                                           task->regions[task_region_idx++],
+                                           FID_DATA,
+                                           ctx,
+                                           runtime);
+    }
+  }
+  AddBiasResidualLayerNorm::backward_kernel_wrapper(m,
+                                                    output_grad,
+                                                    added_output,
+                                                    input_grad,
+                                                    residual_grad,
+                                                    attn_bias_grad,
+                                                    gamma,
+                                                    gamma_grad,
+                                                    beta_grad);
+}
+
+Legion::FutureMap AddBiasResidualLayerNorm::peft_bwd(
+    FFModel const &ff,
+    BatchConfigFuture const &bc,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+  IndexLauncher launcher(ADD_BIAS_RESIDUAL_LAYERNORM_PEFT_BWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
+  int field_id = 0;
+  // output_grad
+  launcher.add_region_requirement(
+      RegionRequirement(batch_outputs[1]->part_grad,
+                        0 /*projection id*/,
+                        READ_WRITE,
+                        EXCLUSIVE,
+                        batch_outputs[1]->region_grad));
+  launcher.add_field(field_id++, FID_DATA);
+  // input grad
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[0]->part_grad,
+                        0 /*projection id*/,
+                        reset_input_grads[0] ? WRITE_ONLY : READ_WRITE,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region_grad));
+  launcher.add_field(field_id++, FID_DATA);
+  // residual grad
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[1]->part_grad,
+                        0 /*projection id*/,
+                        reset_input_grads[1] ? WRITE_ONLY : READ_WRITE,
+                        EXCLUSIVE,
+                        batch_inputs[1]->region_grad));
+  launcher.add_field(field_id++, FID_DATA);
+  if (elementwise_affine) {
+    // gamma
+    launcher.add_region_requirement(RegionRequirement(weights[1]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[1]->region));
+    launcher.add_field(field_id++, FID_DATA);
+  }
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+void AddBiasResidualLayerNorm::peft_bwd_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_active_peft_tokens() == 0) {
+    return;
+  }
+  assert(task->regions.size() == regions.size());
+  AddBiasResidualLayerNormMeta *m =
+      *((AddBiasResidualLayerNormMeta **)task->local_args);
+  assert(regions.size() == 3 + m->elementwise_affine);
+
+  int region_idx = 0, task_region_idx = 0;
+
+  GenericTensorAccessorR output_grad =
+      helperGetGenericTensorAccessorRO(m->output_type[1],
+                                       regions[region_idx++],
+                                       task->regions[task_region_idx++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorW input_grad =
+      helperGetGenericTensorAccessorRW(m->input_type[0],
+                                       regions[region_idx++],
+                                       task->regions[task_region_idx++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorW residual_grad =
+      helperGetGenericTensorAccessorRW(m->input_type[1],
+                                       regions[region_idx++],
+                                       task->regions[task_region_idx++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+
+  GenericTensorAccessorR gamma;
+  if (m->elementwise_affine) {
+    gamma = helperGetGenericTensorAccessorRO(m->output_type[0],
+                                             regions[region_idx++],
+                                             task->regions[task_region_idx++],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
+  }
+  AddBiasResidualLayerNorm::peft_bwd_kernel_wrapper(
+      m, output_grad, input_grad, residual_grad, gamma);
+
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    std::vector<GenericTensorAccessorR> weights_accessors;
+    if (m->elementwise_affine) {
+      weights_accessors.push_back(gamma);
+    }
     AddBiasResidualLayerNorm::save_inference_tensors_to_file(
         m,
         shard_id,
         bc,
-        {input, residual},
+        {input_grad, residual_grad},
         weights_accessors,
-        {added_output, output});
+        {output_grad},
+        false /*fwd_pass*/);
   }
 }
 
@@ -755,6 +1119,7 @@ void AddBiasResidualLayerNorm::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->elementwise_affine);
   sez.serialize(this->eps);
   sez.serialize(this->use_bias);
+  sez.serialize(this->inplace_residual);
   sez.serialize(strlen(this->name));
   sez.serialize(this->name, strlen(this->name));
 }
@@ -771,6 +1136,7 @@ Node AddBiasResidualLayerNorm::deserialize(FFModel &ff,
   bool elementwise_affine;
   bool use_bias;
   float eps;
+  bool inplace_residual;
   size_t id, transformer_layer_id, deserialized_model_id;
   dez.deserialize(id);
   dez.deserialize(transformer_layer_id);
@@ -785,6 +1151,7 @@ Node AddBiasResidualLayerNorm::deserialize(FFModel &ff,
   dez.deserialize(elementwise_affine);
   dez.deserialize(eps);
   dez.deserialize(use_bias);
+  dez.deserialize(inplace_residual);
   size_t name_len;
   char name[MAX_OPNAME] = {0};
   dez.deserialize(name_len);
@@ -796,6 +1163,7 @@ Node AddBiasResidualLayerNorm::deserialize(FFModel &ff,
   params.elementwise_affine = elementwise_affine;
   params.eps = eps;
   params.use_bias = use_bias;
+  params.inplace_residual = inplace_residual;
   strcpy(params.name, name);
   return ff.get_or_create_node<AddBiasResidualLayerNorm>({inputs[0], inputs[1]},
                                                          params);
@@ -816,6 +1184,7 @@ size_t hash<FlexFlow::AddBiasResidualLayerNormParams>::operator()(
   }
   hash_combine(key, params.elementwise_affine);
   hash_combine(key, params.use_bias);
+  hash_combine(key, params.inplace_residual);
   return key;
 }
 }; // namespace std
diff --git a/src/ops/add_bias_residual_layer_norm.cpp b/src/ops/add_bias_residual_layer_norm.cpp
index 1add43ecd9..681f55c998 100644
--- a/src/ops/add_bias_residual_layer_norm.cpp
+++ b/src/ops/add_bias_residual_layer_norm.cpp
@@ -23,12 +23,13 @@ namespace FlexFlow {
 #define C10_WARP_SIZE 32
 constexpr int kCUDABlockReduceNumThreads = 512;
 constexpr int kCUDANumThreads = 256;
+constexpr int kColwiseReduceTileSize = 32;
 
 AddBiasResidualLayerNormMeta::AddBiasResidualLayerNormMeta(
     FFHandler handle,
     AddBiasResidualLayerNorm const *ln,
     MemoryAllocator &gpu_mem_allocator)
-    : OpMeta(handle) {
+    : OpMeta(handle, ln) {
   elementwise_affine = ln->elementwise_affine;
   use_bias = ln->use_bias;
   effective_batch_size = ln->effective_batch_size;
@@ -45,6 +46,7 @@ AddBiasResidualLayerNormMeta::AddBiasResidualLayerNormMeta(
       data_type_size(data_type) * effective_batch_size);
   bias_ptr = gpu_mem_allocator.allocate_instance_untyped(
       data_type_size(data_type) * effective_batch_size);
+  allocated_peft_buffer_size = 0;
 }
 
 AddBiasResidualLayerNormMeta::~AddBiasResidualLayerNormMeta(void) {
@@ -75,7 +77,7 @@ __inline__ __device__ T WarpReduceSum(T val) {
 }
 
 template <typename T>
-__inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
+__inline__ __device__ T BlockReduceSum(T val, T *shared) {
   int const lid = threadIdx.x % C10_WARP_SIZE;
   int const wid = threadIdx.x / C10_WARP_SIZE;
   val = WarpReduceSum(val);
@@ -84,9 +86,7 @@ __inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
     shared[wid] = val;
   }
   __syncthreads();
-  val = (threadIdx.x < min(blockDim.x, max_num_threads) / C10_WARP_SIZE)
-            ? shared[lid]
-            : 0;
+  val = (threadIdx.x < (blockDim.x / C10_WARP_SIZE)) ? shared[lid] : T(0);
   if (wid == 0) {
     val = WarpReduceSum(val);
   }
@@ -94,53 +94,36 @@ __inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
 }
 
 template <typename T>
-__global__ void LayerNormFusedForwardKernel(int attn_bias_dim,
-                                            int residual_volume,
-                                            int64_t effective_num_elements,
-                                            int64_t effective_batch_size,
+__global__ void LayerNormFusedForwardKernel(int64_t N,
+                                            int64_t attn_bias_dim,
                                             float eps,
                                             T const *input_ptr,
                                             T const *attn_bias_ptr,
                                             T const *residual_ptr,
-                                            T *added_output_ptr,
-                                            T *output_ptr,
-                                            T const *gamma_ptr,
-                                            T const *beta_ptr,
+                                            T *X,
                                             T *mean,
-                                            T *rstd) {
-  // Add attention bias and residual
-  CUDA_KERNEL_LOOP(i, residual_volume) {
-    int bias_idx = i % attn_bias_dim;
-    added_output_ptr[i] =
-        input_ptr[i] + attn_bias_ptr[bias_idx] + residual_ptr[i];
-  }
-
-  __syncthreads();
-
-  // LayerNorm
+                                            T *rstd,
+                                            T const *gamma,
+                                            T const *beta,
+                                            T *Y) {
   __shared__ float m_shared[C10_WARP_SIZE];
   __shared__ float v_shared[C10_WARP_SIZE];
   const int64_t i = blockIdx.x;
-  if (i >= effective_batch_size) {
-    return;
-  }
   float sum1 = 0.0f;
   float sum2 = 0.0f;
-  for (int64_t j = threadIdx.x; j < effective_num_elements;
-       j += min(blockDim.x, kCUDABlockReduceNumThreads)) {
-    const int64_t index = i * effective_num_elements + j;
-    sum1 += static_cast<float>(added_output_ptr[index]);
-    sum2 += static_cast<float>(added_output_ptr[index]) *
-            static_cast<float>(added_output_ptr[index]);
-  }
-  if (threadIdx.x < kCUDABlockReduceNumThreads) {
-    sum1 = BlockReduceSum<float>(
-        sum1, m_shared, min(blockDim.x, kCUDABlockReduceNumThreads));
-    sum2 = BlockReduceSum<float>(
-        sum2, v_shared, min(blockDim.x, kCUDABlockReduceNumThreads));
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
+    const int64_t index = i * N + j;
+    const int64_t bias_idx = index % attn_bias_dim;
+    X[index] = input_ptr[index] + attn_bias_ptr[bias_idx] + residual_ptr[index];
+    sum1 += static_cast<float>(X[index]);
+    sum2 += static_cast<float>(X[index]) * static_cast<float>(X[index]);
   }
+
+  sum1 = BlockReduceSum<float>(sum1, m_shared);
+  sum2 = BlockReduceSum<float>(sum2, v_shared);
+
   if (threadIdx.x == 0) {
-    float const scale = float(1) / static_cast<float>(effective_num_elements);
+    float const scale = float(1) / static_cast<float>(N);
     sum1 *= scale;
     sum2 = max(sum2 * scale - sum1 * sum1, float(0));
     mean[i] = static_cast<T>(sum1);
@@ -150,17 +133,15 @@ __global__ void LayerNormFusedForwardKernel(int attn_bias_dim,
   __syncthreads();
 
   using T_ACC = T;
-  for (int64_t j = threadIdx.x; j < effective_num_elements;
-       j += min(blockDim.x, kCUDANumThreads)) {
-    const int64_t index = i * effective_num_elements + j;
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
+    const int64_t index = i * N + j;
     const T_ACC gamma_v =
-        gamma_ptr == nullptr ? T_ACC(1) : static_cast<T_ACC>(gamma_ptr[j]);
+        gamma == nullptr ? T_ACC(1) : static_cast<T_ACC>(gamma[j]);
     const T_ACC beta_v =
-        beta_ptr == nullptr ? T_ACC(0) : static_cast<T_ACC>(beta_ptr[j]);
-    output_ptr[index] = (static_cast<T_ACC>(added_output_ptr[index]) -
-                         static_cast<T_ACC>(mean[i])) *
-                            static_cast<T_ACC>(rstd[i]) * gamma_v +
-                        beta_v;
+        beta == nullptr ? T_ACC(0) : static_cast<T_ACC>(beta[j]);
+    Y[index] = (static_cast<T_ACC>(X[index]) - static_cast<T_ACC>(mean[i])) *
+                   static_cast<T_ACC>(rstd[i]) * gamma_v +
+               beta_v;
   }
 }
 
@@ -178,57 +159,108 @@ void AddBiasResidualLayerNorm::inference_kernel(
     T const *gamma_ptr,
     T const *beta_ptr,
     hipStream_t stream) {
-
-  std::pair<int, int> kernel1_parallelism = std::make_pair(
-      GET_BLOCKS(residual_volume), std::min(residual_volume, CUDA_NUM_THREADS));
-  std::pair<int, int> kernel2_parallelism =
-      std::make_pair(m->effective_batch_size, kCUDABlockReduceNumThreads);
-  std::pair<int, int> kernel3_parallelism =
-      std::make_pair(m->effective_batch_size, kCUDANumThreads);
-
-  int num_blocks = std::max({kernel1_parallelism.first,
-                             kernel2_parallelism.first,
-                             kernel3_parallelism.first});
-  int num_threads = std::max({kernel1_parallelism.second,
-                              kernel2_parallelism.second,
-                              kernel3_parallelism.second});
-
   hipLaunchKernelGGL(HIP_KERNEL_NAME(LayerNormFusedForwardKernel<T>),
-                     num_blocks,
-                     num_threads,
+                     m->effective_batch_size,
+                     std::min(CUDA_NUM_THREADS, (int)m->effective_num_elements),
                      0,
                      stream,
-                     attn_bias_dim,
-                     residual_volume,
                      m->effective_num_elements,
-                     m->effective_batch_size,
+                     attn_bias_dim,
                      m->eps,
                      input_ptr,
                      attn_bias_ptr,
                      residual_ptr,
                      added_output_ptr,
-                     output_ptr,
+                     static_cast<T *>(m->mean_ptr),
+                     static_cast<T *>(m->rstd_ptr),
                      gamma_ptr,
                      beta_ptr,
-                     static_cast<T *>(m->mean_ptr),
-                     static_cast<T *>(m->rstd_ptr));
+                     output_ptr);
 }
 
 /*static*/
 void AddBiasResidualLayerNorm::inference_kernel_wrapper(
-    AddBiasResidualLayerNormMeta const *m,
-    int attn_bias_dim,
-    int residual_volume,
+    AddBiasResidualLayerNormMeta *m,
+    BatchConfig const *bc,
     GenericTensorAccessorR const &input,
+    GenericTensorAccessorR const &attn_bias,
+    GenericTensorAccessorR const &residual,
     GenericTensorAccessorW &added_output,
     GenericTensorAccessorW &output,
-    GenericTensorAccessorR const &residual,
-    GenericTensorAccessorR const &attn_bias,
     GenericTensorAccessorR const &gamma,
     GenericTensorAccessorR const &beta) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+  // save input activation if needed for PEFT
+  if (bc->num_active_peft_tokens() > 0) {
+    // Check that we have at most one request that requires peft_bwd
+    int num_peft_requests = 0;
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_bwd) {
+        num_peft_requests++;
+      }
+    }
+    assert(num_peft_requests <= 1);
+
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      // Skip non-PEFT requests
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        continue;
+      }
+      int num_peft_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+      int max_peft_tokens = bc->requestsInfo[i].max_sequence_length;
+      int first_token_offset = bc->requestsInfo[i].first_token_offset_in_batch;
+      int in_dim = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+      if (bc->requestsInfo[i].peft_bwd) {
+        size_t activation_size_needed =
+            data_type_size(m->input_type[0]) * max_peft_tokens * in_dim;
+        if (activation_size_needed > m->allocated_peft_buffer_size) {
+          MemoryAllocator *allocator = m->handle.peft_activation_allocator;
+          m->input_activation =
+              allocator->allocate_instance_untyped(activation_size_needed);
+          m->allocated_peft_buffer_size = activation_size_needed;
+        }
+        // copy input activation
+        if (m->input_type[0] == DT_FLOAT) {
+          checkCUDA(hipMemcpyAsync(
+              m->input_activation,
+              added_output.get_float_ptr() + first_token_offset * in_dim,
+              data_type_size(m->input_type[0]) * num_peft_tokens * in_dim,
+              hipMemcpyDeviceToDevice,
+              stream));
+        } else if (m->input_type[0] == DT_HALF) {
+          checkCUDA(hipMemcpyAsync(
+              m->input_activation,
+              added_output.get_half_ptr() + first_token_offset * in_dim,
+              data_type_size(m->input_type[0]) * num_peft_tokens * in_dim,
+              hipMemcpyDeviceToDevice,
+              stream));
+        } else {
+          assert(false && "unsupport datatype in layernorm");
+        }
+      }
+    }
+  }
+
+  // inference kernel
+  int attn_bias_dim = attn_bias.domain.hi()[0] - attn_bias.domain.lo()[0] + 1;
+  int residual_volume = residual.domain.get_volume();
   if (m->input_type[0] == DT_FLOAT) {
     AddBiasResidualLayerNorm::inference_kernel<float>(
         m,
@@ -239,8 +271,8 @@ void AddBiasResidualLayerNorm::inference_kernel_wrapper(
         residual.get_float_ptr(),
         added_output.get_float_ptr(),
         output.get_float_ptr(),
-        gamma.get_float_ptr(),
-        m->use_bias ? beta.get_float_ptr() : nullptr,
+        m->elementwise_affine ? gamma.get_float_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta.get_float_ptr() : nullptr,
         stream);
   } else if (m->input_type[0] == DT_HALF) {
     AddBiasResidualLayerNorm::inference_kernel<half>(
@@ -252,12 +284,566 @@ void AddBiasResidualLayerNorm::inference_kernel_wrapper(
         residual.get_half_ptr(),
         added_output.get_half_ptr(),
         output.get_half_ptr(),
-        gamma.get_half_ptr(),
-        m->use_bias ? beta.get_half_ptr() : nullptr,
+        m->elementwise_affine ? gamma.get_half_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta.get_half_ptr() : nullptr,
         stream);
   } else {
     assert(false && "unsupport datatype in layernorm");
   }
+
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("[AddBiasResidualLayerNorm] forward time (CF) = %.9fms\n", elapsed);
+    // if (m->input_type[0] == DT_FLOAT) {
+    //   print_tensor<float>(input.get_float_ptr(),
+    //                       32,
+    //                       "[AddBiasResidualLayerNorm:forward:input]");
+    //   print_tensor<float>(attn_bias.get_float_ptr(),
+    //                       32,
+    //                       "[AddBiasResidualLayerNorm:forward:attn_bias]");
+    //   print_tensor<float>(residual.get_float_ptr(),
+    //                       32,
+    //                       "[AddBiasResidualLayerNorm:forward:residual]");
+    //   print_tensor<float>(added_output.get_float_ptr(),
+    //                       32,
+    //                       "[AddBiasResidualLayerNorm:forward:added_output]");
+    //   print_tensor<float>(output.get_float_ptr(),
+    //                       32,
+    //                       "[AddBiasResidualLayerNorm:forward:output]");
+    //   print_tensor<float>(gamma.get_float_ptr(),
+    //                       32,
+    //                       "[AddBiasResidualLayerNorm:forward:gamma]");
+    //   print_tensor<float>(
+    //       beta.get_float_ptr(), 32,
+    //       "[AddBiasResidualLayerNorm:forward:beta]");
+    // } else {
+    //   print_tensor<half>(
+    //       input.get_half_ptr(), 32,
+    //       "[AddBiasResidualLayerNorm:forward:input]");
+    //   print_tensor<half>(attn_bias.get_half_ptr(),
+    //                      32,
+    //                      "[AddBiasResidualLayerNorm:forward:attn_bias]");
+    //   print_tensor<half>(residual.get_half_ptr(),
+    //                      32,
+    //                      "[AddBiasResidualLayerNorm:forward:residual]");
+    //   print_tensor<half>(added_output.get_half_ptr(),
+    //                      32,
+    //                      "[AddBiasResidualLayerNorm:forward:added_output]");
+    //   print_tensor<half>(output.get_half_ptr(),
+    //                      32,
+    //                      "[AddBiasResidualLayerNorm:forward:output]");
+    //   print_tensor<half>(
+    //       gamma.get_half_ptr(), 32,
+    //       "[AddBiasResidualLayerNorm:forward:gamma]");
+    //   print_tensor<half>(
+    //       beta.get_half_ptr(), 32,
+    //       "[AddBiasResidualLayerNorm:forward:beta]");
+    // }
+    // print_tensor<T>(in_ptr, 32, "[AddBiasResidualLayerNorm:forward:input]");
+    // print_tensor<T>(out_ptr, 32,
+    // "[AddBiasResidualLayerNorm:forward:output]");
+  }
+}
+
+template <typename T>
+__global__ void ComputeInternalGradientsCUDAKernel(
+    int64_t N, T const *dY, T const *X, T const *gamma, T *ds, T *db) {
+  using T_ACC = T;
+  __shared__ T_ACC ds_shared[C10_WARP_SIZE];
+  __shared__ T_ACC db_shared[C10_WARP_SIZE];
+  const int64_t i = blockIdx.x;
+  T_ACC sum1 = 0;
+  T_ACC sum2 = 0;
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
+    const int64_t index = i * N + j;
+    const T_ACC gamma_v =
+        gamma == nullptr ? T_ACC(1) : static_cast<T_ACC>(gamma[j]);
+    sum1 +=
+        static_cast<T_ACC>(dY[index]) * static_cast<T_ACC>(X[index]) * gamma_v;
+    sum2 += static_cast<T_ACC>(dY[index]) * gamma_v;
+  }
+  sum1 = BlockReduceSum<T_ACC>(sum1, ds_shared);
+  sum2 = BlockReduceSum<T_ACC>(sum2, db_shared);
+  if (threadIdx.x == 0) {
+    ds[i] = sum1;
+    db[i] = sum2;
+  }
+}
+
+template <typename T>
+__global__ void ComputeGradientFusedParamsCUDAKernel(int64_t M,
+                                                     int64_t N,
+                                                     T const *mean,
+                                                     T const *rstd,
+                                                     T const *ds,
+                                                     T const *db,
+                                                     T *c1,
+                                                     T *c2) {
+  using T_ACC = T;
+  const int64_t index = blockIdx.x * blockDim.x + threadIdx.x;
+  if (index < M) {
+    const T_ACC s = T_ACC(1) / static_cast<T_ACC>((int)N);
+    const T_ACC a = (db[index] * static_cast<T_ACC>(mean[index]) - ds[index]) *
+                    static_cast<T_ACC>(rstd[index]) *
+                    static_cast<T_ACC>(rstd[index]) *
+                    static_cast<T_ACC>(rstd[index]) * s;
+    c1[index] = a;
+    c2[index] = -(a * static_cast<T_ACC>(mean[index]) +
+                  db[index] * static_cast<T_ACC>(rstd[index]) * s);
+  }
+}
+
+template <typename T>
+__global__ void GammaBetaBackwardSimpleCUDAKernel(int64_t M,
+                                                  int64_t N,
+                                                  T const *dY,
+                                                  T const *X,
+                                                  T const *mean,
+                                                  T const *rstd,
+                                                  T *dg,
+                                                  T *db) {
+  using T_ACC = T;
+  const int64_t j = blockIdx.x * blockDim.x + threadIdx.x;
+  if (j < N) {
+    T_ACC sum1 = 0;
+    T_ACC sum2 = 0;
+    for (int64_t i = 0; i < M; ++i) {
+      const int64_t index = i * N + j;
+      sum1 += dg == nullptr ? T_ACC(0)
+                            : static_cast<T_ACC>(dY[index]) *
+                                  (static_cast<T_ACC>(X[index]) -
+                                   static_cast<T_ACC>(mean[i])) *
+                                  static_cast<T_ACC>(rstd[i]);
+      sum2 += db == nullptr ? T_ACC(0) : static_cast<T_ACC>(dY[index]);
+    }
+    if (dg != nullptr) {
+      dg[j] = sum1;
+    }
+    if (db != nullptr) {
+      db[j] = sum2;
+    }
+  }
+}
+
+template <typename T>
+__global__ void GammaBetaBackwardCUDAKernel(int64_t M,
+                                            int64_t N,
+                                            T const *dY,
+                                            T const *X,
+                                            T const *mean,
+                                            T const *rstd,
+                                            T *dg,
+                                            T *db) {
+  using T_ACC = T;
+  __shared__ T_ACC g_shared[kColwiseReduceTileSize][kColwiseReduceTileSize + 1];
+  __shared__ T_ACC b_shared[kColwiseReduceTileSize][kColwiseReduceTileSize + 1];
+  const int64_t j = blockIdx.x * blockDim.x + threadIdx.x;
+  T_ACC dg_sum1 = 0;
+  T_ACC dg_sum2 = 0;
+  T_ACC db_sum1 = 0;
+  T_ACC db_sum2 = 0;
+  if (j < N) {
+    for (int64_t i = threadIdx.y; i < M; i += blockDim.y * 2) {
+      const int64_t i1 = i;
+      const int64_t i2 = i + blockDim.y;
+      const int64_t index1 = i1 * N + j;
+      const int64_t index2 = i2 * N + j;
+      dg_sum1 += dg == nullptr ? T_ACC(0)
+                               : static_cast<T_ACC>(dY[index1]) *
+                                     (static_cast<T_ACC>(X[index1]) -
+                                      static_cast<T_ACC>(mean[i1])) *
+                                     static_cast<T_ACC>(rstd[i1]);
+      db_sum1 += db == nullptr ? T_ACC(0) : static_cast<T_ACC>(dY[index1]);
+      if (i2 < M) {
+        dg_sum2 += dg == nullptr ? T_ACC(0)
+                                 : static_cast<T_ACC>(dY[index2]) *
+                                       (static_cast<T_ACC>(X[index2]) -
+                                        static_cast<T_ACC>(mean[i2])) *
+                                       static_cast<T_ACC>(rstd[i2]);
+        db_sum2 += db == nullptr ? T_ACC(0) : static_cast<T_ACC>(dY[index2]);
+      }
+    }
+  }
+  g_shared[threadIdx.y][threadIdx.x] = dg_sum1;
+  g_shared[threadIdx.y + blockDim.y][threadIdx.x] = dg_sum2;
+  b_shared[threadIdx.y][threadIdx.x] = db_sum1;
+  b_shared[threadIdx.y + blockDim.y][threadIdx.x] = db_sum2;
+  __syncthreads();
+  T_ACC sum1 = g_shared[threadIdx.x][threadIdx.y];
+  T_ACC sum2 = b_shared[threadIdx.x][threadIdx.y];
+  sum1 = WarpReduceSum(sum1);
+  sum2 = WarpReduceSum(sum2);
+  if (threadIdx.x == 0) {
+    const int64_t j = blockIdx.x * blockDim.x + threadIdx.y;
+    if (j < N) {
+      if (dg != nullptr) {
+        dg[j] = sum1;
+      }
+      if (db != nullptr) {
+        db[j] = sum2;
+      }
+    }
+  }
+  sum1 = g_shared[threadIdx.x][threadIdx.y + blockDim.y];
+  sum2 = b_shared[threadIdx.x][threadIdx.y + blockDim.y];
+  sum1 = WarpReduceSum(sum1);
+  sum2 = WarpReduceSum(sum2);
+  if (threadIdx.x == 0) {
+    const int64_t j = blockIdx.x * blockDim.x + threadIdx.y + blockDim.y;
+    if (j < N) {
+      if (dg != nullptr) {
+        dg[j] = sum1;
+      }
+      if (db != nullptr) {
+        db[j] = sum2;
+      }
+    }
+  }
+}
+
+template <typename T>
+__device__ __inline__ void compute_gI(T const *__restrict__ dY,
+                                      T const *__restrict__ X,
+                                      T const *__restrict__ mean,
+                                      T const *__restrict__ rstd,
+                                      T const *__restrict__ gamma,
+                                      T *dX,
+                                      T *dX_residual,
+                                      bool reset_input_grad,
+                                      bool reset_residual_grad,
+                                      int const N,
+                                      T *buf) {
+  auto const i1 = blockIdx.x;
+  const T mean_val = mean[i1];
+  const T rstd_val = rstd[i1];
+  T stats_x1{0}, stats_x2{0};
+  constexpr int unroll = 4;
+  auto l = unroll * threadIdx.x;
+  T const *X_i = X + i1 * N;
+  T const *dY_i = dY + i1 * N;
+  T *dX_i = dX + i1 * N;
+  T *dX_residual_i = dX_residual + i1 * N;
+  // vectorized reads don't improve perf, so use regular unrolling
+
+  for (; l + unroll - 1 < N; l += blockDim.x * unroll) {
+#pragma unroll
+    for (int k = 0; k < unroll; k++) {
+      T gamma_val = (gamma != nullptr) ? static_cast<T>(gamma[l + k]) : T(1);
+      const T c_h = static_cast<T>(X_i[l + k]);
+      const T c_loss = static_cast<T>(dY_i[l + k]);
+      stats_x1 += c_loss * gamma_val;
+      stats_x2 += c_loss * gamma_val * (c_h - mean_val) * rstd_val;
+    }
+  }
+  for (; l < N; l++) {
+    T gamma_val = (gamma != nullptr) ? static_cast<T>(gamma[l]) : T(1);
+    const T c_h = static_cast<T>(X_i[l]);
+    const T c_loss = static_cast<T>(dY_i[l]);
+    stats_x1 += c_loss * gamma_val;
+    stats_x2 += c_loss * gamma_val * (c_h - mean_val) * rstd_val;
+  }
+
+  stats_x1 = BlockReduceSum(stats_x1, buf);
+  stats_x2 = BlockReduceSum(stats_x2, buf);
+  if (threadIdx.x == 0) {
+    buf[0] = stats_x1;
+    buf[1] = stats_x2;
+  }
+  __syncthreads();
+  stats_x1 = buf[0];
+  stats_x2 = buf[1];
+  T fH = N;
+  T term1 = (T(1) / fH) * rstd_val;
+
+  for (int l = threadIdx.x; l < N; l += blockDim.x) {
+    const T x = X_i[l];
+    const T dy = dY_i[l];
+    T gamma_val = (gamma != nullptr) ? static_cast<T>(gamma[l]) : T(1);
+    T f_grad_input = fH * gamma_val * dy;
+    f_grad_input -= (x - mean_val) * rstd_val * stats_x2;
+    f_grad_input -= stats_x1;
+    f_grad_input *= term1;
+    if (reset_input_grad) {
+      dX_i[l] = f_grad_input;
+    } else {
+      dX_i[l] += f_grad_input;
+    }
+    if (reset_residual_grad) {
+      dX_residual_i[l] = f_grad_input;
+    } else {
+      dX_residual_i[l] += f_grad_input;
+    }
+  }
+}
+
+template <typename T>
+__global__ void layer_norm_grad_input_kernel(T const *__restrict__ dY,
+                                             T const *__restrict__ X,
+                                             T const *__restrict__ mean,
+                                             T const *__restrict__ rstd,
+                                             T const *__restrict__ gamma,
+                                             T *dX,
+                                             T *dX_residual,
+                                             bool reset_input_grad,
+                                             bool reset_residual_grad,
+                                             int const N) {
+  alignas(sizeof(double)) extern __shared__ char s_data1[];
+  T *buf = reinterpret_cast<T *>(&s_data1);
+
+  compute_gI(dY,
+             X,
+             mean,
+             rstd,
+             gamma,
+             dX,
+             dX_residual,
+             reset_input_grad,
+             reset_residual_grad,
+             N,
+             buf);
+}
+
+/*static*/
+template <typename T>
+void AddBiasResidualLayerNorm::backward_kernel(
+    AddBiasResidualLayerNormMeta const *m,
+    T const *output_grad_ptr,
+    T const *added_output_ptr,
+    T *input_grad_ptr,
+    T *residual_grad_ptr,
+    T *attn_bias_grad_ptr,
+    T const *gamma_ptr,
+    T *gamma_grad_ptr,
+    T *beta_grad_ptr,
+    hipStream_t stream) {
+  const int64_t M = m->effective_batch_size;
+  const int64_t N = m->effective_num_elements;
+  hipLaunchKernelGGL(HIP_KERNEL_NAME(ComputeInternalGradientsCUDAKernel<T>),
+                     M,
+                     kCUDABlockReduceNumThreads,
+                     0,
+                     stream,
+                     N,
+                     output_grad_ptr,
+                     added_output_ptr,
+                     gamma_ptr,
+                     static_cast<T *>(m->ds_ptr),
+                     static_cast<T *>(m->db_ptr));
+  const int64_t B = (M + kCUDANumThreads - 1) / kCUDANumThreads;
+  hipLaunchKernelGGL(HIP_KERNEL_NAME(ComputeGradientFusedParamsCUDAKernel<T>),
+                     B,
+                     kCUDANumThreads,
+                     0,
+                     stream,
+                     M,
+                     N,
+                     static_cast<T *>(m->mean_ptr),
+                     static_cast<T *>(m->rstd_ptr),
+                     static_cast<T *>(m->ds_ptr),
+                     static_cast<T *>(m->db_ptr),
+                     static_cast<T *>(m->scale_ptr),
+                     static_cast<T *>(m->bias_ptr));
+  int const warp_size = C10_WARP_SIZE;
+  int const num_threads = 128;
+  const dim3 blocks(M);
+  int nshared = (num_threads / warp_size) * sizeof(T);
+  hipLaunchKernelGGL(HIP_KERNEL_NAME(layer_norm_grad_input_kernel),
+                     blocks,
+                     num_threads,
+                     nshared,
+                     stream,
+                     output_grad_ptr,
+                     added_output_ptr,
+                     static_cast<T *>(m->mean_ptr),
+                     static_cast<T *>(m->rstd_ptr),
+                     gamma_ptr,
+                     input_grad_ptr,
+                     residual_grad_ptr,
+                     m->reset_input_grads[0],
+                     m->reset_input_grads[1],
+                     N);
+
+  if (gamma_grad_ptr != NULL || beta_grad_ptr != NULL) {
+    if (M < 512) {
+      // For small batch size, do colwise reduce directly
+      const int64_t B = (N + kCUDANumThreads - 1) / kCUDANumThreads;
+      hipLaunchKernelGGL(HIP_KERNEL_NAME(GammaBetaBackwardSimpleCUDAKernel<T>),
+                         B,
+                         kCUDANumThreads,
+                         0,
+                         stream,
+                         M,
+                         N,
+                         output_grad_ptr,
+                         added_output_ptr,
+                         static_cast<T *>(m->mean_ptr),
+                         static_cast<T *>(m->rstd_ptr),
+                         gamma_grad_ptr,
+                         beta_grad_ptr);
+    } else {
+      const int64_t B =
+          (N + kColwiseReduceTileSize - 1) / kColwiseReduceTileSize;
+      constexpr int kThreadX = kColwiseReduceTileSize;
+      constexpr int kThreadY = kColwiseReduceTileSize / 2;
+      hipLaunchKernelGGL(HIP_KERNEL_NAME(GammaBetaBackwardCUDAKernel<T>),
+                         B,
+                         dim3(kThreadX, kThreadY),
+                         0,
+                         stream,
+                         M,
+                         N,
+                         output_grad_ptr,
+                         added_output_ptr,
+                         static_cast<T *>(m->mean_ptr),
+                         static_cast<T *>(m->rstd_ptr),
+                         gamma_grad_ptr,
+                         beta_grad_ptr);
+    }
+  }
+}
+
+/*static*/
+void AddBiasResidualLayerNorm::backward_kernel_wrapper(
+    AddBiasResidualLayerNormMeta const *m,
+    GenericTensorAccessorR const &output_grad,
+    GenericTensorAccessorR &added_output,
+    GenericTensorAccessorW &input_grad,
+    GenericTensorAccessorW const &residual_grad,
+    GenericTensorAccessorW const &attn_bias_grad,
+    GenericTensorAccessorR const &gamma,
+    GenericTensorAccessorW const &gamma_grad,
+    GenericTensorAccessorW const &beta_grad) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+
+  if (m->output_type[0] == DT_FLOAT) {
+    AddBiasResidualLayerNorm::backward_kernel(
+        m,
+        output_grad.get_float_ptr(),
+        added_output.get_float_ptr(),
+        input_grad.get_float_ptr(),
+        residual_grad.get_float_ptr(),
+        attn_bias_grad.get_float_ptr(),
+        m->elementwise_affine ? gamma.get_float_ptr() : nullptr,
+        m->elementwise_affine ? gamma_grad.get_float_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta_grad.get_float_ptr()
+                                               : nullptr,
+        stream);
+  } else if (m->output_type[0] == DT_HALF) {
+    AddBiasResidualLayerNorm::backward_kernel(
+        m,
+        output_grad.get_half_ptr(),
+        added_output.get_half_ptr(),
+        input_grad.get_half_ptr(),
+        residual_grad.get_half_ptr(),
+        attn_bias_grad.get_half_ptr(),
+        m->elementwise_affine ? gamma.get_half_ptr() : nullptr,
+        m->elementwise_affine ? gamma_grad.get_half_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta_grad.get_half_ptr()
+                                               : nullptr,
+        stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("[AddBiasResidualLayerNorm] backward time (CF) = %.2fms\n", elapsed);
+  }
+}
+
+/*static*/
+template <typename T>
+void AddBiasResidualLayerNorm::peft_bwd_kernel(
+    AddBiasResidualLayerNormMeta const *m,
+    T const *output_grad_ptr,
+    T *input_grad_ptr,
+    T *residual_grad_ptr,
+    T const *gamma_ptr,
+    hipStream_t stream) {
+  const int64_t M = m->effective_batch_size;
+  const int64_t N = m->effective_num_elements;
+
+  int const warp_size = C10_WARP_SIZE;
+  int const num_threads = 128;
+  const dim3 blocks(M);
+  int nshared = (num_threads / warp_size) * sizeof(T);
+  hipLaunchKernelGGL(HIP_KERNEL_NAME(layer_norm_grad_input_kernel),
+                     blocks,
+                     num_threads,
+                     nshared,
+                     stream,
+                     output_grad_ptr,
+                     static_cast<T const *>(m->input_activation),
+                     static_cast<T *>(m->mean_ptr),
+                     static_cast<T *>(m->rstd_ptr),
+                     gamma_ptr,
+                     input_grad_ptr,
+                     residual_grad_ptr,
+                     m->reset_input_grads[0],
+                     m->reset_input_grads[1],
+                     N);
+}
+
+/*static*/
+void AddBiasResidualLayerNorm::peft_bwd_kernel_wrapper(
+    AddBiasResidualLayerNormMeta const *m,
+    GenericTensorAccessorR const &output_grad,
+    GenericTensorAccessorW &input_grad,
+    GenericTensorAccessorW const &residual_grad,
+    GenericTensorAccessorR const &gamma) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+
+  if (m->output_type[0] == DT_FLOAT) {
+    peft_bwd_kernel(m,
+                    output_grad.get_float_ptr(),
+                    input_grad.get_float_ptr(),
+                    residual_grad.get_float_ptr(),
+                    m->elementwise_affine ? gamma.get_float_ptr() : nullptr,
+                    stream);
+  } else if (m->output_type[0] == DT_HALF) {
+    peft_bwd_kernel(m,
+                    output_grad.get_half_ptr(),
+                    input_grad.get_half_ptr(),
+                    residual_grad.get_half_ptr(),
+                    m->elementwise_affine ? gamma.get_half_ptr() : nullptr,
+                    stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("[AddBiasResidualLayerNorm] peft_bwd time (CF) = %.2fms\n", elapsed);
+  }
 }
 
 }; // namespace FlexFlow
diff --git a/src/ops/add_bias_residual_layer_norm.cu b/src/ops/add_bias_residual_layer_norm.cu
index ceb1a6514e..bcca1ba2c6 100644
--- a/src/ops/add_bias_residual_layer_norm.cu
+++ b/src/ops/add_bias_residual_layer_norm.cu
@@ -22,12 +22,13 @@ namespace FlexFlow {
 #define C10_WARP_SIZE 32
 constexpr int kCUDABlockReduceNumThreads = 512;
 constexpr int kCUDANumThreads = 256;
+constexpr int kColwiseReduceTileSize = 32;
 
 AddBiasResidualLayerNormMeta::AddBiasResidualLayerNormMeta(
     FFHandler handle,
     AddBiasResidualLayerNorm const *ln,
     MemoryAllocator &gpu_mem_allocator)
-    : OpMeta(handle) {
+    : OpMeta(handle, ln) {
   elementwise_affine = ln->elementwise_affine;
   use_bias = ln->use_bias;
   effective_batch_size = ln->effective_batch_size;
@@ -44,6 +45,7 @@ AddBiasResidualLayerNormMeta::AddBiasResidualLayerNormMeta(
       data_type_size(data_type) * effective_batch_size);
   bias_ptr = gpu_mem_allocator.allocate_instance_untyped(
       data_type_size(data_type) * effective_batch_size);
+  allocated_peft_buffer_size = 0;
 }
 
 AddBiasResidualLayerNormMeta::~AddBiasResidualLayerNormMeta(void) {
@@ -74,7 +76,7 @@ __inline__ __device__ T WarpReduceSum(T val) {
 }
 
 template <typename T>
-__inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
+__inline__ __device__ T BlockReduceSum(T val, T *shared) {
   int const lid = threadIdx.x % C10_WARP_SIZE;
   int const wid = threadIdx.x / C10_WARP_SIZE;
   val = WarpReduceSum(val);
@@ -83,9 +85,7 @@ __inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
     shared[wid] = val;
   }
   __syncthreads();
-  val = (threadIdx.x < min(blockDim.x, max_num_threads) / C10_WARP_SIZE)
-            ? shared[lid]
-            : 0;
+  val = (threadIdx.x < (blockDim.x / C10_WARP_SIZE)) ? shared[lid] : T(0);
   if (wid == 0) {
     val = WarpReduceSum(val);
   }
@@ -110,20 +110,17 @@ __global__ void LayerNormFusedForwardKernel(int64_t N,
   const int64_t i = blockIdx.x;
   float sum1 = 0.0f;
   float sum2 = 0.0f;
-  for (int64_t j = threadIdx.x; j < N;
-       j += min(blockDim.x, kCUDABlockReduceNumThreads)) {
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
     const int64_t index = i * N + j;
     const int64_t bias_idx = index % attn_bias_dim;
     X[index] = input_ptr[index] + attn_bias_ptr[bias_idx] + residual_ptr[index];
     sum1 += static_cast<float>(X[index]);
     sum2 += static_cast<float>(X[index]) * static_cast<float>(X[index]);
   }
-  if (threadIdx.x < kCUDABlockReduceNumThreads) {
-    sum1 = BlockReduceSum<float>(
-        sum1, m_shared, min(blockDim.x, kCUDABlockReduceNumThreads));
-    sum2 = BlockReduceSum<float>(
-        sum2, v_shared, min(blockDim.x, kCUDABlockReduceNumThreads));
-  }
+
+  sum1 = BlockReduceSum<float>(sum1, m_shared);
+  sum2 = BlockReduceSum<float>(sum2, v_shared);
+
   if (threadIdx.x == 0) {
     float const scale = float(1) / static_cast<float>(N);
     sum1 *= scale;
@@ -135,7 +132,7 @@ __global__ void LayerNormFusedForwardKernel(int64_t N,
   __syncthreads();
 
   using T_ACC = T;
-  for (int64_t j = threadIdx.x; j < N; j += min(blockDim.x, kCUDANumThreads)) {
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
     const int64_t index = i * N + j;
     const T_ACC gamma_v =
         gamma == nullptr ? T_ACC(1) : static_cast<T_ACC>(gamma[j]);
@@ -161,42 +158,33 @@ void AddBiasResidualLayerNorm::inference_kernel(
     T const *gamma_ptr,
     T const *beta_ptr,
     cudaStream_t stream) {
-
-  std::pair<int, int> kernel1_parallelism =
-      std::make_pair(m->effective_batch_size, kCUDABlockReduceNumThreads);
-  std::pair<int, int> kernel2_parallelism =
-      std::make_pair(m->effective_batch_size, kCUDANumThreads);
-
-  int num_blocks =
-      std::max(kernel1_parallelism.first, kernel2_parallelism.first);
-  int num_threads =
-      std::max(kernel1_parallelism.second, kernel2_parallelism.second);
-
   LayerNormFusedForwardKernel<T>
-      <<<num_blocks, num_threads, 0, stream>>>(m->effective_num_elements,
-                                               attn_bias_dim,
-                                               m->eps,
-                                               input_ptr,
-                                               attn_bias_ptr,
-                                               residual_ptr,
-                                               added_output_ptr,
-                                               static_cast<T *>(m->mean_ptr),
-                                               static_cast<T *>(m->rstd_ptr),
-                                               gamma_ptr,
-                                               beta_ptr,
-                                               output_ptr);
+      <<<m->effective_batch_size,
+         std::min(CUDA_NUM_THREADS, (int)m->effective_num_elements),
+         0,
+         stream>>>(m->effective_num_elements,
+                   attn_bias_dim,
+                   m->eps,
+                   input_ptr,
+                   attn_bias_ptr,
+                   residual_ptr,
+                   added_output_ptr,
+                   static_cast<T *>(m->mean_ptr),
+                   static_cast<T *>(m->rstd_ptr),
+                   gamma_ptr,
+                   beta_ptr,
+                   output_ptr);
 }
 
 /*static*/
 void AddBiasResidualLayerNorm::inference_kernel_wrapper(
-    AddBiasResidualLayerNormMeta const *m,
-    int attn_bias_dim,
-    int residual_volume,
+    AddBiasResidualLayerNormMeta *m,
+    BatchConfig const *bc,
     GenericTensorAccessorR const &input,
+    GenericTensorAccessorR const &attn_bias,
+    GenericTensorAccessorR const &residual,
     GenericTensorAccessorW &added_output,
     GenericTensorAccessorW &output,
-    GenericTensorAccessorR const &residual,
-    GenericTensorAccessorR const &attn_bias,
     GenericTensorAccessorR const &gamma,
     GenericTensorAccessorR const &beta) {
   cudaStream_t stream;
@@ -208,6 +196,69 @@ void AddBiasResidualLayerNorm::inference_kernel_wrapper(
     cudaEventCreate(&t_end);
     cudaEventRecord(t_start, stream);
   }
+  // save input activation if needed for PEFT
+  if (bc->num_active_peft_tokens() > 0) {
+    // Check that we have at most one request that requires peft_bwd
+    int num_peft_requests = 0;
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_bwd) {
+        num_peft_requests++;
+      }
+    }
+    assert(num_peft_requests <= 1);
+
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      // Skip non-PEFT requests
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        continue;
+      }
+      int num_peft_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+      int max_peft_tokens = bc->requestsInfo[i].max_sequence_length;
+      int first_token_offset = bc->requestsInfo[i].first_token_offset_in_batch;
+      int in_dim = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+      if (bc->requestsInfo[i].peft_bwd) {
+        size_t activation_size_needed =
+            data_type_size(m->input_type[0]) * max_peft_tokens * in_dim;
+        if (activation_size_needed > m->allocated_peft_buffer_size) {
+          MemoryAllocator *allocator = m->handle.peft_activation_allocator;
+          m->input_activation =
+              allocator->allocate_instance_untyped(activation_size_needed);
+          m->allocated_peft_buffer_size = activation_size_needed;
+        }
+        // copy input activation
+        if (m->input_type[0] == DT_FLOAT) {
+          checkCUDA(cudaMemcpyAsync(
+              m->input_activation,
+              added_output.get_float_ptr() + first_token_offset * in_dim,
+              data_type_size(m->input_type[0]) * num_peft_tokens * in_dim,
+              cudaMemcpyDeviceToDevice,
+              stream));
+        } else if (m->input_type[0] == DT_HALF) {
+          checkCUDA(cudaMemcpyAsync(
+              m->input_activation,
+              added_output.get_half_ptr() + first_token_offset * in_dim,
+              data_type_size(m->input_type[0]) * num_peft_tokens * in_dim,
+              cudaMemcpyDeviceToDevice,
+              stream));
+        } else {
+          assert(false && "unsupport datatype in layernorm");
+        }
+      }
+    }
+  }
+
+  // inference kernel
+  int attn_bias_dim = attn_bias.domain.hi()[0] - attn_bias.domain.lo()[0] + 1;
+  int residual_volume = residual.domain.get_volume();
   if (m->input_type[0] == DT_FLOAT) {
     AddBiasResidualLayerNorm::inference_kernel<float>(
         m,
@@ -297,4 +348,478 @@ void AddBiasResidualLayerNorm::inference_kernel_wrapper(
   }
 }
 
+template <typename T>
+__global__ void ComputeInternalGradientsCUDAKernel(
+    int64_t N, T const *dY, T const *X, T const *gamma, T *ds, T *db) {
+  using T_ACC = T;
+  __shared__ T_ACC ds_shared[C10_WARP_SIZE];
+  __shared__ T_ACC db_shared[C10_WARP_SIZE];
+  const int64_t i = blockIdx.x;
+  T_ACC sum1 = 0;
+  T_ACC sum2 = 0;
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
+    const int64_t index = i * N + j;
+    const T_ACC gamma_v =
+        gamma == nullptr ? T_ACC(1) : static_cast<T_ACC>(gamma[j]);
+    sum1 +=
+        static_cast<T_ACC>(dY[index]) * static_cast<T_ACC>(X[index]) * gamma_v;
+    sum2 += static_cast<T_ACC>(dY[index]) * gamma_v;
+  }
+  sum1 = BlockReduceSum<T_ACC>(sum1, ds_shared);
+  sum2 = BlockReduceSum<T_ACC>(sum2, db_shared);
+  if (threadIdx.x == 0) {
+    ds[i] = sum1;
+    db[i] = sum2;
+  }
+}
+
+template <typename T>
+__global__ void ComputeGradientFusedParamsCUDAKernel(int64_t M,
+                                                     int64_t N,
+                                                     T const *mean,
+                                                     T const *rstd,
+                                                     T const *ds,
+                                                     T const *db,
+                                                     T *c1,
+                                                     T *c2) {
+  using T_ACC = T;
+  const int64_t index = blockIdx.x * blockDim.x + threadIdx.x;
+  if (index < M) {
+    const T_ACC s = T_ACC(1) / static_cast<T_ACC>((int)N);
+    const T_ACC a = (db[index] * static_cast<T_ACC>(mean[index]) - ds[index]) *
+                    static_cast<T_ACC>(rstd[index]) *
+                    static_cast<T_ACC>(rstd[index]) *
+                    static_cast<T_ACC>(rstd[index]) * s;
+    c1[index] = a;
+    c2[index] = -(a * static_cast<T_ACC>(mean[index]) +
+                  db[index] * static_cast<T_ACC>(rstd[index]) * s);
+  }
+}
+
+template <typename T>
+__global__ void GammaBetaBackwardSimpleCUDAKernel(int64_t M,
+                                                  int64_t N,
+                                                  T const *dY,
+                                                  T const *X,
+                                                  T const *mean,
+                                                  T const *rstd,
+                                                  T *dg,
+                                                  T *db) {
+  using T_ACC = T;
+  const int64_t j = blockIdx.x * blockDim.x + threadIdx.x;
+  if (j < N) {
+    T_ACC sum1 = 0;
+    T_ACC sum2 = 0;
+    for (int64_t i = 0; i < M; ++i) {
+      const int64_t index = i * N + j;
+      sum1 += dg == nullptr ? T_ACC(0)
+                            : static_cast<T_ACC>(dY[index]) *
+                                  (static_cast<T_ACC>(X[index]) -
+                                   static_cast<T_ACC>(mean[i])) *
+                                  static_cast<T_ACC>(rstd[i]);
+      sum2 += db == nullptr ? T_ACC(0) : static_cast<T_ACC>(dY[index]);
+    }
+    if (dg != nullptr) {
+      dg[j] = sum1;
+    }
+    if (db != nullptr) {
+      db[j] = sum2;
+    }
+  }
+}
+
+template <typename T>
+__global__ void GammaBetaBackwardCUDAKernel(int64_t M,
+                                            int64_t N,
+                                            T const *dY,
+                                            T const *X,
+                                            T const *mean,
+                                            T const *rstd,
+                                            T *dg,
+                                            T *db) {
+  using T_ACC = T;
+  __shared__ T_ACC g_shared[kColwiseReduceTileSize][kColwiseReduceTileSize + 1];
+  __shared__ T_ACC b_shared[kColwiseReduceTileSize][kColwiseReduceTileSize + 1];
+  const int64_t j = blockIdx.x * blockDim.x + threadIdx.x;
+  T_ACC dg_sum1 = 0;
+  T_ACC dg_sum2 = 0;
+  T_ACC db_sum1 = 0;
+  T_ACC db_sum2 = 0;
+  if (j < N) {
+    for (int64_t i = threadIdx.y; i < M; i += blockDim.y * 2) {
+      const int64_t i1 = i;
+      const int64_t i2 = i + blockDim.y;
+      const int64_t index1 = i1 * N + j;
+      const int64_t index2 = i2 * N + j;
+      dg_sum1 += dg == nullptr ? T_ACC(0)
+                               : static_cast<T_ACC>(dY[index1]) *
+                                     (static_cast<T_ACC>(X[index1]) -
+                                      static_cast<T_ACC>(mean[i1])) *
+                                     static_cast<T_ACC>(rstd[i1]);
+      db_sum1 += db == nullptr ? T_ACC(0) : static_cast<T_ACC>(dY[index1]);
+      if (i2 < M) {
+        dg_sum2 += dg == nullptr ? T_ACC(0)
+                                 : static_cast<T_ACC>(dY[index2]) *
+                                       (static_cast<T_ACC>(X[index2]) -
+                                        static_cast<T_ACC>(mean[i2])) *
+                                       static_cast<T_ACC>(rstd[i2]);
+        db_sum2 += db == nullptr ? T_ACC(0) : static_cast<T_ACC>(dY[index2]);
+      }
+    }
+  }
+  g_shared[threadIdx.y][threadIdx.x] = dg_sum1;
+  g_shared[threadIdx.y + blockDim.y][threadIdx.x] = dg_sum2;
+  b_shared[threadIdx.y][threadIdx.x] = db_sum1;
+  b_shared[threadIdx.y + blockDim.y][threadIdx.x] = db_sum2;
+  __syncthreads();
+  T_ACC sum1 = g_shared[threadIdx.x][threadIdx.y];
+  T_ACC sum2 = b_shared[threadIdx.x][threadIdx.y];
+  sum1 = WarpReduceSum(sum1);
+  sum2 = WarpReduceSum(sum2);
+  if (threadIdx.x == 0) {
+    const int64_t j = blockIdx.x * blockDim.x + threadIdx.y;
+    if (j < N) {
+      if (dg != nullptr) {
+        dg[j] = sum1;
+      }
+      if (db != nullptr) {
+        db[j] = sum2;
+      }
+    }
+  }
+  sum1 = g_shared[threadIdx.x][threadIdx.y + blockDim.y];
+  sum2 = b_shared[threadIdx.x][threadIdx.y + blockDim.y];
+  sum1 = WarpReduceSum(sum1);
+  sum2 = WarpReduceSum(sum2);
+  if (threadIdx.x == 0) {
+    const int64_t j = blockIdx.x * blockDim.x + threadIdx.y + blockDim.y;
+    if (j < N) {
+      if (dg != nullptr) {
+        dg[j] = sum1;
+      }
+      if (db != nullptr) {
+        db[j] = sum2;
+      }
+    }
+  }
+}
+
+template <typename T>
+__device__ __inline__ void compute_gI(T const *__restrict__ dY,
+                                      T const *__restrict__ X,
+                                      T const *__restrict__ mean,
+                                      T const *__restrict__ rstd,
+                                      T const *__restrict__ gamma,
+                                      T *dX,
+                                      T *dX_residual,
+                                      bool reset_input_grad,
+                                      bool reset_residual_grad,
+                                      int const N,
+                                      T *buf) {
+  auto const i1 = blockIdx.x;
+  const T mean_val = mean[i1];
+  const T rstd_val = rstd[i1];
+  T stats_x1{0}, stats_x2{0};
+  constexpr int unroll = 4;
+  auto l = unroll * threadIdx.x;
+  T const *X_i = X + i1 * N;
+  T const *dY_i = dY + i1 * N;
+  T *dX_i = dX + i1 * N;
+  T *dX_residual_i = dX_residual + i1 * N;
+  // vectorized reads don't improve perf, so use regular unrolling
+
+  for (; l + unroll - 1 < N; l += blockDim.x * unroll) {
+#pragma unroll
+    for (int k = 0; k < unroll; k++) {
+      T gamma_val = (gamma != nullptr) ? static_cast<T>(gamma[l + k]) : T(1);
+      const T c_h = static_cast<T>(X_i[l + k]);
+      const T c_loss = static_cast<T>(dY_i[l + k]);
+      stats_x1 += c_loss * gamma_val;
+      stats_x2 += c_loss * gamma_val * (c_h - mean_val) * rstd_val;
+    }
+  }
+  for (; l < N; l++) {
+    T gamma_val = (gamma != nullptr) ? static_cast<T>(gamma[l]) : T(1);
+    const T c_h = static_cast<T>(X_i[l]);
+    const T c_loss = static_cast<T>(dY_i[l]);
+    stats_x1 += c_loss * gamma_val;
+    stats_x2 += c_loss * gamma_val * (c_h - mean_val) * rstd_val;
+  }
+
+  stats_x1 = BlockReduceSum(stats_x1, buf);
+  stats_x2 = BlockReduceSum(stats_x2, buf);
+  if (threadIdx.x == 0) {
+    buf[0] = stats_x1;
+    buf[1] = stats_x2;
+  }
+  __syncthreads();
+  stats_x1 = buf[0];
+  stats_x2 = buf[1];
+  T fH = N;
+  T term1 = (T(1) / fH) * rstd_val;
+
+  for (int l = threadIdx.x; l < N; l += blockDim.x) {
+    const T x = X_i[l];
+    const T dy = dY_i[l];
+    T gamma_val = (gamma != nullptr) ? static_cast<T>(gamma[l]) : T(1);
+    T f_grad_input = fH * gamma_val * dy;
+    f_grad_input -= (x - mean_val) * rstd_val * stats_x2;
+    f_grad_input -= stats_x1;
+    f_grad_input *= term1;
+    if (reset_input_grad) {
+      dX_i[l] = f_grad_input;
+    } else {
+      dX_i[l] += f_grad_input;
+    }
+    if (reset_residual_grad) {
+      dX_residual_i[l] = f_grad_input;
+    } else {
+      dX_residual_i[l] += f_grad_input;
+    }
+  }
+}
+
+template <typename T>
+__global__ void layer_norm_grad_input_kernel(T const *__restrict__ dY,
+                                             T const *__restrict__ X,
+                                             T const *__restrict__ mean,
+                                             T const *__restrict__ rstd,
+                                             T const *__restrict__ gamma,
+                                             T *dX,
+                                             T *dX_residual,
+                                             bool reset_input_grad,
+                                             bool reset_residual_grad,
+                                             int const N) {
+  alignas(sizeof(double)) extern __shared__ char s_data1[];
+  T *buf = reinterpret_cast<T *>(&s_data1);
+
+  compute_gI(dY,
+             X,
+             mean,
+             rstd,
+             gamma,
+             dX,
+             dX_residual,
+             reset_input_grad,
+             reset_residual_grad,
+             N,
+             buf);
+}
+
+/*static*/
+template <typename T>
+void AddBiasResidualLayerNorm::backward_kernel(
+    AddBiasResidualLayerNormMeta const *m,
+    T const *output_grad_ptr,
+    T const *added_output_ptr,
+    T *input_grad_ptr,
+    T *residual_grad_ptr,
+    T *attn_bias_grad_ptr,
+    T const *gamma_ptr,
+    T *gamma_grad_ptr,
+    T *beta_grad_ptr,
+    cudaStream_t stream) {
+  const int64_t M = m->effective_batch_size;
+  const int64_t N = m->effective_num_elements;
+  ComputeInternalGradientsCUDAKernel<T>
+      <<<M, kCUDABlockReduceNumThreads, 0, stream>>>(
+          N,
+          output_grad_ptr,
+          added_output_ptr,
+          gamma_ptr,
+          static_cast<T *>(m->ds_ptr),
+          static_cast<T *>(m->db_ptr));
+  const int64_t B = (M + kCUDANumThreads - 1) / kCUDANumThreads;
+  ComputeGradientFusedParamsCUDAKernel<T>
+      <<<B, kCUDANumThreads, 0, stream>>>(M,
+                                          N,
+                                          static_cast<T *>(m->mean_ptr),
+                                          static_cast<T *>(m->rstd_ptr),
+                                          static_cast<T *>(m->ds_ptr),
+                                          static_cast<T *>(m->db_ptr),
+                                          static_cast<T *>(m->scale_ptr),
+                                          static_cast<T *>(m->bias_ptr));
+  int const warp_size = C10_WARP_SIZE;
+  int const num_threads = 128;
+  const dim3 blocks(M);
+  int nshared = (num_threads / warp_size) * sizeof(T);
+  layer_norm_grad_input_kernel<<<blocks, num_threads, nshared, stream>>>(
+      output_grad_ptr,
+      added_output_ptr,
+      static_cast<T *>(m->mean_ptr),
+      static_cast<T *>(m->rstd_ptr),
+      gamma_ptr,
+      input_grad_ptr,
+      residual_grad_ptr,
+      m->reset_input_grads[0],
+      m->reset_input_grads[1],
+      N);
+
+  if (gamma_grad_ptr != NULL || beta_grad_ptr != NULL) {
+    if (M < 512) {
+      // For small batch size, do colwise reduce directly
+      const int64_t B = (N + kCUDANumThreads - 1) / kCUDANumThreads;
+      GammaBetaBackwardSimpleCUDAKernel<T>
+          <<<B, kCUDANumThreads, 0, stream>>>(M,
+                                              N,
+                                              output_grad_ptr,
+                                              added_output_ptr,
+                                              static_cast<T *>(m->mean_ptr),
+                                              static_cast<T *>(m->rstd_ptr),
+                                              gamma_grad_ptr,
+                                              beta_grad_ptr);
+    } else {
+      const int64_t B =
+          (N + kColwiseReduceTileSize - 1) / kColwiseReduceTileSize;
+      constexpr int kThreadX = kColwiseReduceTileSize;
+      constexpr int kThreadY = kColwiseReduceTileSize / 2;
+      GammaBetaBackwardCUDAKernel<T>
+          <<<B, dim3(kThreadX, kThreadY), 0, stream>>>(
+              M,
+              N,
+              output_grad_ptr,
+              added_output_ptr,
+              static_cast<T *>(m->mean_ptr),
+              static_cast<T *>(m->rstd_ptr),
+              gamma_grad_ptr,
+              beta_grad_ptr);
+    }
+  }
+}
+
+/*static*/
+void AddBiasResidualLayerNorm::backward_kernel_wrapper(
+    AddBiasResidualLayerNormMeta const *m,
+    GenericTensorAccessorR const &output_grad,
+    GenericTensorAccessorR &added_output,
+    GenericTensorAccessorW &input_grad,
+    GenericTensorAccessorW const &residual_grad,
+    GenericTensorAccessorW const &attn_bias_grad,
+    GenericTensorAccessorR const &gamma,
+    GenericTensorAccessorW const &gamma_grad,
+    GenericTensorAccessorW const &beta_grad) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+
+  if (m->output_type[0] == DT_FLOAT) {
+    AddBiasResidualLayerNorm::backward_kernel(
+        m,
+        output_grad.get_float_ptr(),
+        added_output.get_float_ptr(),
+        input_grad.get_float_ptr(),
+        residual_grad.get_float_ptr(),
+        attn_bias_grad.get_float_ptr(),
+        m->elementwise_affine ? gamma.get_float_ptr() : nullptr,
+        m->elementwise_affine ? gamma_grad.get_float_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta_grad.get_float_ptr()
+                                               : nullptr,
+        stream);
+  } else if (m->output_type[0] == DT_HALF) {
+    AddBiasResidualLayerNorm::backward_kernel(
+        m,
+        output_grad.get_half_ptr(),
+        added_output.get_half_ptr(),
+        input_grad.get_half_ptr(),
+        residual_grad.get_half_ptr(),
+        attn_bias_grad.get_half_ptr(),
+        m->elementwise_affine ? gamma.get_half_ptr() : nullptr,
+        m->elementwise_affine ? gamma_grad.get_half_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta_grad.get_half_ptr()
+                                               : nullptr,
+        stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[AddBiasResidualLayerNorm] backward time (CF) = %.2fms\n", elapsed);
+  }
+}
+
+/*static*/
+template <typename T>
+void AddBiasResidualLayerNorm::peft_bwd_kernel(
+    AddBiasResidualLayerNormMeta const *m,
+    T const *output_grad_ptr,
+    T *input_grad_ptr,
+    T *residual_grad_ptr,
+    T const *gamma_ptr,
+    cudaStream_t stream) {
+  const int64_t M = m->effective_batch_size;
+  const int64_t N = m->effective_num_elements;
+
+  int const warp_size = C10_WARP_SIZE;
+  int const num_threads = 128;
+  const dim3 blocks(M);
+  int nshared = (num_threads / warp_size) * sizeof(T);
+  layer_norm_grad_input_kernel<<<blocks, num_threads, nshared, stream>>>(
+      output_grad_ptr,
+      static_cast<T const *>(m->input_activation),
+      static_cast<T *>(m->mean_ptr),
+      static_cast<T *>(m->rstd_ptr),
+      gamma_ptr,
+      input_grad_ptr,
+      residual_grad_ptr,
+      m->reset_input_grads[0],
+      m->reset_input_grads[1],
+      N);
+}
+
+/*static*/
+void AddBiasResidualLayerNorm::peft_bwd_kernel_wrapper(
+    AddBiasResidualLayerNormMeta const *m,
+    GenericTensorAccessorR const &output_grad,
+    GenericTensorAccessorW &input_grad,
+    GenericTensorAccessorW const &residual_grad,
+    GenericTensorAccessorR const &gamma) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+
+  if (m->output_type[0] == DT_FLOAT) {
+    peft_bwd_kernel(m,
+                    output_grad.get_float_ptr(),
+                    input_grad.get_float_ptr(),
+                    residual_grad.get_float_ptr(),
+                    m->elementwise_affine ? gamma.get_float_ptr() : nullptr,
+                    stream);
+  } else if (m->output_type[0] == DT_HALF) {
+    peft_bwd_kernel(m,
+                    output_grad.get_half_ptr(),
+                    input_grad.get_half_ptr(),
+                    residual_grad.get_half_ptr(),
+                    m->elementwise_affine ? gamma.get_half_ptr() : nullptr,
+                    stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[AddBiasResidualLayerNorm] peft_bwd time (CF) = %.2fms\n", elapsed);
+  }
+}
+
 }; // namespace FlexFlow
diff --git a/src/ops/aggregate.cc b/src/ops/aggregate.cc
index 5f05458e34..c83b738a0e 100644
--- a/src/ops/aggregate.cc
+++ b/src/ops/aggregate.cc
@@ -85,7 +85,7 @@ AggregateParams Aggregate::get_params() const {
   AggregateParams params;
   params.n = this->n;
   params.lambda_bal = this->lambda_bal;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
@@ -242,7 +242,7 @@ OpMeta *Aggregate::init_task(Task const *task,
                              Runtime *runtime) {
   Aggregate *agg = (Aggregate *)task->args;
   FFHandler handle = *((FFHandler *)task->local_args);
-  AggregateMeta *m = new AggregateMeta(handle, agg->n);
+  AggregateMeta *m = new AggregateMeta(handle, agg);
   m->profiling = agg->profiling;
   m->inference_debugging = agg->inference_debugging;
   std::strcpy(m->op_name, agg->name);
@@ -603,7 +603,7 @@ bool Aggregate::measure_operator_cost(Simulator *sim,
     return false;
   }
 
-  AggregateMeta *m = new AggregateMeta(sim->handler, n);
+  AggregateMeta *m = new AggregateMeta(sim->handler, this);
 
   // allocate
   sim->free_all();
diff --git a/src/ops/aggregate.cpp b/src/ops/aggregate.cpp
index d5ebdb0c22..5a508cfac4 100644
--- a/src/ops/aggregate.cpp
+++ b/src/ops/aggregate.cpp
@@ -281,13 +281,14 @@ void Aggregate::backward_kernel_wrapper(AggregateMeta const *m,
                      out_dim);
 }
 
-AggregateMeta::AggregateMeta(FFHandler handler, int n) : OpMeta(handler) {
-  checkCUDA(hipMalloc(&dev_exp_preds, n * sizeof(float *)));
-  checkCUDA(hipMalloc(&dev_exp_grads, n * sizeof(float *)));
+AggregateMeta::AggregateMeta(FFHandler handler, Aggregate const *aggr)
+    : OpMeta(handler, aggr) {
+  checkCUDA(hipMalloc(&dev_exp_preds, aggr->n * sizeof(float *)));
+  checkCUDA(hipMalloc(&dev_exp_grads, aggr->n * sizeof(float *)));
 }
 AggregateMeta::~AggregateMeta(void) {
   checkCUDA(hipFree(&dev_exp_preds));
   checkCUDA(hipFree(&dev_exp_grads));
 }
 
-}; // namespace FlexFlow
\ No newline at end of file
+}; // namespace FlexFlow
diff --git a/src/ops/aggregate.cu b/src/ops/aggregate.cu
index 38e141b252..9704302092 100644
--- a/src/ops/aggregate.cu
+++ b/src/ops/aggregate.cu
@@ -307,9 +307,10 @@ void Aggregate::backward_kernel_wrapper(AggregateMeta const *m,
   }
 }
 
-AggregateMeta::AggregateMeta(FFHandler handler, int n) : OpMeta(handler) {
-  checkCUDA(cudaMalloc(&dev_exp_preds, n * sizeof(float *)));
-  checkCUDA(cudaMalloc(&dev_exp_grads, n * sizeof(float *)));
+AggregateMeta::AggregateMeta(FFHandler handler, Aggregate const *aggr)
+    : OpMeta(handler, aggr) {
+  checkCUDA(cudaMalloc(&dev_exp_preds, aggr->n * sizeof(float *)));
+  checkCUDA(cudaMalloc(&dev_exp_grads, aggr->n * sizeof(float *)));
 }
 AggregateMeta::~AggregateMeta(void) {
   checkCUDA(cudaFree(&dev_exp_preds));
diff --git a/src/ops/aggregate_spec.cc b/src/ops/aggregate_spec.cc
index 1edd430881..6ea3ff3747 100644
--- a/src/ops/aggregate_spec.cc
+++ b/src/ops/aggregate_spec.cc
@@ -84,7 +84,7 @@ AggregateSpecParams AggregateSpec::get_params() const {
   AggregateSpecParams params;
   params.n = this->n;
   params.lambda_bal = this->lambda_bal;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
@@ -210,7 +210,7 @@ OpMeta *AggregateSpec::init_task(Task const *task,
                                  Runtime *runtime) {
   AggregateSpec *agg = (AggregateSpec *)task->args;
   FFHandler handle = *((FFHandler *)task->local_args);
-  AggregateSpecMeta *m = new AggregateSpecMeta(handle, agg->n);
+  AggregateSpecMeta *m = new AggregateSpecMeta(handle, agg);
   m->profiling = agg->profiling;
   m->inference_debugging = agg->inference_debugging;
   std::strcpy(m->op_name, agg->name);
@@ -543,7 +543,7 @@ bool AggregateSpec::measure_operator_cost(Simulator *sim,
     return false;
   }
 
-  AggregateSpecMeta *m = new AggregateSpecMeta(sim->handler, n);
+  AggregateSpecMeta *m = new AggregateSpecMeta(sim->handler, this);
 
   // allocate
   sim->free_all();
diff --git a/src/ops/aggregate_spec.cpp b/src/ops/aggregate_spec.cpp
index 314e20a59c..a676fa81c3 100644
--- a/src/ops/aggregate_spec.cpp
+++ b/src/ops/aggregate_spec.cpp
@@ -290,9 +290,10 @@ void AggregateSpec::backward_kernel_wrapper(AggregateSpecMeta const *m,
                      out_dim);
 }
 
-AggregateSpecMeta::AggregateSpecMeta(FFHandler handler, int n)
-    : OpMeta(handler) {
-  checkCUDA(hipMalloc(&dev_region_ptrs, n * sizeof(float *)));
+AggregateSpecMeta::AggregateSpecMeta(FFHandler handler,
+                                     AggregateSpec const *aggr)
+    : OpMeta(handler, aggr) {
+  checkCUDA(hipMalloc(&dev_region_ptrs, aggr->n * sizeof(float *)));
 }
 AggregateSpecMeta::~AggregateSpecMeta(void) {
   checkCUDA(hipFree(&dev_region_ptrs));
diff --git a/src/ops/aggregate_spec.cu b/src/ops/aggregate_spec.cu
index 8d50d45d21..ac5a372efc 100644
--- a/src/ops/aggregate_spec.cu
+++ b/src/ops/aggregate_spec.cu
@@ -287,9 +287,10 @@ void AggregateSpec::backward_kernel_wrapper(AggregateSpecMeta const *m,
                                       out_dim);
 }
 
-AggregateSpecMeta::AggregateSpecMeta(FFHandler handler, int n)
-    : OpMeta(handler) {
-  checkCUDA(cudaMalloc(&dev_region_ptrs, n * sizeof(float *)));
+AggregateSpecMeta::AggregateSpecMeta(FFHandler handler,
+                                     AggregateSpec const *aggr)
+    : OpMeta(handler, aggr) {
+  checkCUDA(cudaMalloc(&dev_region_ptrs, aggr->n * sizeof(float *)));
 }
 AggregateSpecMeta::~AggregateSpecMeta(void) {
   checkCUDA(cudaFree(&dev_region_ptrs));
diff --git a/src/ops/arg_topk.cc b/src/ops/arg_topk.cc
index 780a77450e..534bac2419 100644
--- a/src/ops/arg_topk.cc
+++ b/src/ops/arg_topk.cc
@@ -112,7 +112,7 @@ ArgTopKParams ArgTopK::get_params() const {
   params.k = this->k;
   params.sorted = this->sorted;
   params.speculative_decoding = this->speculative_decoding;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
@@ -387,7 +387,7 @@ InferenceResult
       DT_INT32, regions[1], task->regions[1], FID_DATA, ctx, runtime);
   GenericTensorAccessorW probs;
 
-  int batch_size = bc->num_active_tokens();
+  int batch_size = bc->num_active_infr_tokens();
   ArgTopK::forward_kernel_wrapper(
       m, input, probs, indices, batch_size, nullptr);
 
@@ -399,7 +399,7 @@ InferenceResult
   }
 
   InferenceResult ir;
-  download_tensor<BatchConfig::TokenId>(
+  copy_tensor_dev_to_host<BatchConfig::TokenId>(
       indices.get_int32_ptr(), ir.token_ids, batch_size);
   return ir;
 }
@@ -431,9 +431,10 @@ BeamInferenceResult ArgTopK::inference_speculative_task(
   ArgTopK::forward_kernel_wrapper(m, input, probs, indices, batch_size, &bc);
 
   BeamInferenceResult ir;
-  download_tensor<BatchConfig::TokenId>(
+  copy_tensor_dev_to_host<BatchConfig::TokenId>(
       indices.get_int32_ptr(), ir.token_ids, batch_size * m->k);
-  download_tensor<float>(probs.get_float_ptr(), ir.probs, batch_size * m->k);
+  copy_tensor_dev_to_host<float>(
+      probs.get_float_ptr(), ir.probs, batch_size * m->k);
   return ir;
 }
 
diff --git a/src/ops/argmax.cc b/src/ops/argmax.cc
index 1892ac2353..4123e50e7e 100644
--- a/src/ops/argmax.cc
+++ b/src/ops/argmax.cc
@@ -91,7 +91,7 @@ Op *ArgMax::create_operator_from_layer(
 ArgMaxParams ArgMax::get_params() const {
   ArgMaxParams params;
   params.beam_search = this->beam_search;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
@@ -314,7 +314,7 @@ FutureMap ArgMax::inference(FFModel const &ff,
     launcher.add_future(bc);
     launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
                                                       0 /*projection id*/,
-                                                      READ_WRITE,
+                                                      READ_ONLY,
                                                       EXCLUSIVE,
                                                       batch_inputs[0]->region));
     launcher.add_field(0, FID_DATA);
@@ -348,15 +348,18 @@ BeamInferenceResult
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
   GenericTensorAccessorW indices = helperGetGenericTensorAccessorWO(
       DT_INT32, regions[1], task->regions[1], FID_DATA, ctx, runtime);
-  int batch_size = bc->num_active_tokens();
+  int batch_size = bc->num_active_infr_tokens();
   GenericTensorAccessorW parent = helperGetGenericTensorAccessorWO(
       DT_INT32, regions[2], task->regions[2], FID_DATA, ctx, runtime);
-  ArgMax::forward_kernel_wrapper(m, input, indices, parent, batch_size);
+  float loss = 0.0f;
+  ArgMax::forward_kernel_wrapper(
+      m, bc, input, indices, parent, batch_size, &loss);
   BeamInferenceResult ir;
-  download_tensor<BatchConfig::TokenId>(
+  copy_tensor_dev_to_host<BatchConfig::TokenId>(
       indices.get_int32_ptr(), ir.token_ids, batch_size);
-  download_tensor(m->probs, ir.probs, batch_size);
-  download_tensor<int>(parent.get_int32_ptr(), ir.parent_id, batch_size);
+  copy_tensor_dev_to_host(m->probs, ir.probs, batch_size);
+  copy_tensor_dev_to_host<int>(
+      parent.get_int32_ptr(), ir.parent_id, batch_size);
 
   if (m->inference_debugging) {
     assert(task->index_point.get_dim() == 1);
@@ -383,23 +386,36 @@ InferenceResult
     return ir;
   }
 
-  GenericTensorAccessorW input = helperGetGenericTensorAccessorRW(
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
   GenericTensorAccessorW indices = helperGetGenericTensorAccessorWO(
       DT_INT32, regions[1], task->regions[1], FID_DATA, ctx, runtime);
   GenericTensorAccessorW parent;
-  int batch_size = bc->num_active_tokens();
-  ArgMax::forward_kernel_wrapper(m, input, indices, parent, batch_size);
+  int batch_size = bc->num_active_infr_tokens();
+  float loss = 0.0f;
+
+  ArgMax::forward_kernel_wrapper(
+      m, bc, input, indices, parent, batch_size, &loss);
+
   InferenceResult ir;
+  ir.finetuning_loss = loss;
+
+  if (bc->num_active_peft_tokens() > 0) {
+    printf("Loss: %.4f\n", loss);
+  }
+
   if (m->inference_debugging) {
     assert(task->index_point.get_dim() == 1);
     int shard_id = task->index_point.point_data[0];
     ArgMax::save_inference_tensors_to_file(
-        m, shard_id, bc, {}, {}, {input, indices});
+        m, shard_id, bc, {input}, {}, {indices});
+  } else {
+    m->decoding_step++;
   }
 
-  download_tensor<BatchConfig::TokenId>(
+  copy_tensor_dev_to_host<BatchConfig::TokenId>(
       indices.get_int32_ptr(), ir.token_ids, batch_size);
+
   return ir;
 }
 
@@ -453,4 +469,4 @@ size_t hash<FlexFlow::ArgMaxParams>::operator()(
   hash_combine(key, params.beam_search);
   return key;
 }
-}; // namespace std
\ No newline at end of file
+}; // namespace std
diff --git a/src/ops/argmax.cpp b/src/ops/argmax.cpp
index 8a1cf0b3b0..60d44cdf2b 100644
--- a/src/ops/argmax.cpp
+++ b/src/ops/argmax.cpp
@@ -334,6 +334,21 @@ __device__ void mergeShards(int num_shards,
   }
 }
 
+template <typename DT>
+__global__ void compute_sparse_categorical_crossentropy_loss(
+    DT const *logits,
+    BatchConfig::TokenId const *labels,
+    float *loss,
+    int num_tokens,
+    int num_classes) {
+  float const LOG_MIN_VALUE = 0.00000001f;
+  CUDA_KERNEL_LOOP(b, num_tokens) {
+    float my_logit =
+        max((float)logits[b * num_classes + labels[b]], LOG_MIN_VALUE);
+    atomicAdd(loss, -log(my_logit));
+  }
+}
+
 template <typename T>
 __global__ void argmax_forward_kernel(T const *__restrict__ input,
                                       size_t shared_memory_size,
@@ -381,14 +396,16 @@ __global__ void copy_result(hipcub::KeyValuePair<int, DT> *d_out,
 /*static*/
 template <typename DT>
 void ArgMax::forward_kernel(ArgMaxMeta const *m,
-                            DT *input_ptr,
+                            BatchConfig const *bc,
+                            DT const *input_ptr,
                             int *indices_ptr,
                             float *prob_ptr,
                             int *parent,
                             int const length,
                             int const batch_size,
+                            float *loss,
                             hipStream_t stream) {
-  checkCUDA(get_legion_stream(&stream));
+
   checkCUDNN(miopenSetStream(m->handle.dnn, stream));
 
   if (m->beam_search) {
@@ -425,28 +442,77 @@ void ArgMax::forward_kernel(ArgMaxMeta const *m,
                      k,
                      prob_ptr,
                      indices_ptr);
+
+  // compute cross-entropy loss if there is a finetuning request
+  assert(loss != nullptr);
+  BatchConfig::TokenId token_ids[BatchConfig::MAX_NUM_TOKENS];
+  int num_finetuning_requests = 0, num_bwd_tokens = 0;
+  int tokens_previous_requests = 0;
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    // Skip non-PEFT requests
+    if (bc->requestsInfo[i].peft_bwd) {
+      assert(num_finetuning_requests == 0 && num_bwd_tokens == 0);
+      num_bwd_tokens = bc->requestsInfo[i].num_tokens_in_batch - 1;
+      // shift labels by 1 position to the left (ignore first token label)
+      for (int j = 0; j < num_bwd_tokens; j++) {
+        token_ids[j] =
+            bc->tokensInfo[j + tokens_previous_requests + 1].token_id;
+      }
+      num_finetuning_requests += 1;
+    } else {
+      tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
+    }
+  }
+  assert(num_finetuning_requests <= 1);
+  if (num_bwd_tokens > 0) {
+    checkCUDA(hipMemcpyAsync(m->handle.workSpace,
+                             token_ids,
+                             sizeof(BatchConfig::TokenId) * num_bwd_tokens,
+                             hipMemcpyHostToDevice,
+                             stream));
+    // copy loss to d_loss
+    checkCUDA(hipMemsetAsync(m->d_loss, 0, sizeof(float), stream));
+    compute_sparse_categorical_crossentropy_loss<<<GET_BLOCKS(num_bwd_tokens),
+                                                   min(CUDA_NUM_THREADS,
+                                                       num_bwd_tokens),
+                                                   0,
+                                                   stream>>>(
+        input_ptr,
+        static_cast<BatchConfig::TokenId *>(m->handle.workSpace),
+        m->d_loss,
+        num_bwd_tokens,
+        length);
+    // copy value from d_loss to loss
+    checkCUDA(hipMemcpyAsync(
+        loss, m->d_loss, sizeof(float), hipMemcpyDeviceToHost, stream));
+    *loss = *loss / (float)num_bwd_tokens;
+  }
 }
 
 /*static*/
 void ArgMax::forward_kernel_wrapper(ArgMaxMeta const *m,
-                                    GenericTensorAccessorW const &input,
+                                    BatchConfig const *bc,
+                                    GenericTensorAccessorR const &input,
                                     GenericTensorAccessorW const &indices,
                                     GenericTensorAccessorW const &parent,
-                                    int batch_size) {
+                                    int batch_size,
+                                    float *loss) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
-
   hipEvent_t t_start, t_end;
   if (m->profiling) {
     checkCUDA(hipEventCreate(&t_start));
     checkCUDA(hipEventCreate(&t_end));
     checkCUDA(hipEventRecord(t_start, stream));
   }
-
   int length = input.domain.hi()[0] - input.domain.lo()[0] + 1;
 
   if (input.data_type == DT_HALF) {
     ArgMax::forward_kernel<half>(m,
+                                 bc,
                                  input.get_half_ptr(),
                                  indices.get_int32_ptr(),
                                  m->probs,
@@ -454,10 +520,12 @@ void ArgMax::forward_kernel_wrapper(ArgMaxMeta const *m,
                                                 : nullptr,
                                  length,
                                  batch_size,
+                                 loss,
                                  stream);
 
   } else if (input.data_type == DT_FLOAT) {
     ArgMax::forward_kernel<float>(m,
+                                  bc,
                                   input.get_float_ptr(),
                                   indices.get_int32_ptr(),
                                   m->probs,
@@ -465,6 +533,7 @@ void ArgMax::forward_kernel_wrapper(ArgMaxMeta const *m,
                                                  : nullptr,
                                   length,
                                   batch_size,
+                                  loss,
                                   stream);
   } else {
     assert(false && "Unsupported data type");
diff --git a/src/ops/argmax.cu b/src/ops/argmax.cu
index 05c84719c1..8a2e2da2d0 100644
--- a/src/ops/argmax.cu
+++ b/src/ops/argmax.cu
@@ -44,19 +44,35 @@ __global__ void copy_result(cub::KeyValuePair<int, DT> *d_out,
   }
 }
 
+template <typename DT>
+__global__ void compute_sparse_categorical_crossentropy_loss(
+    DT const *logits,
+    BatchConfig::TokenId const *labels,
+    float *loss,
+    int num_tokens,
+    int num_classes) {
+  float const LOG_MIN_VALUE = 0.00000001f;
+  CUDA_KERNEL_LOOP(b, num_tokens) {
+    float my_logit =
+        max((float)logits[b * num_classes + labels[b]], LOG_MIN_VALUE);
+    atomicAdd(loss, -log(my_logit));
+  }
+}
+
 /*static*/
 template <typename DT>
 void ArgMax::forward_kernel(ArgMaxMeta const *m,
-                            DT *input_ptr,
+                            BatchConfig const *bc,
+                            DT const *input_ptr,
                             int *indices_ptr,
                             float *prob_ptr,
                             int *parent,
                             int const length,
                             int const batch_size,
+                            float *loss,
                             cudaStream_t stream) {
-
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
-  DT alpha = 1.0f, beta = 0.0f;
+
   if (m->beam_search) {
     // set all parents id zero in arg top1 case.
     checkCUDA(cudaMemsetAsync(parent, 0, batch_size * sizeof(int), stream));
@@ -73,7 +89,7 @@ void ArgMax::forward_kernel(ArgMaxMeta const *m,
       m->d_offsets + 1,
       stream));
 
-  // copy dout to incides
+  // copy dout to indices
   int parallelism = batch_size;
   copy_result<<<GET_BLOCKS(parallelism),
                 min(CUDA_NUM_THREADS, parallelism),
@@ -84,14 +100,64 @@ void ArgMax::forward_kernel(ArgMaxMeta const *m,
                           batch_size,
                           m->beam_search);
   // print_tensor<int>(indices_ptr, 32, "argmax op");
+
+  // compute cross-entropy loss if there is a finetuning request
+  assert(loss != nullptr);
+  BatchConfig::TokenId token_ids[BatchConfig::MAX_NUM_TOKENS];
+  int num_finetuning_requests = 0, num_bwd_tokens = 0;
+  int tokens_previous_requests = 0;
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    // Skip non-PEFT requests
+    if (bc->requestsInfo[i].peft_bwd) {
+      assert(num_finetuning_requests == 0 && num_bwd_tokens == 0);
+      num_bwd_tokens = bc->requestsInfo[i].num_tokens_in_batch - 1;
+      // shift labels by 1 position to the left (ignore first token label)
+      for (int j = 0; j < num_bwd_tokens; j++) {
+        token_ids[j] =
+            bc->tokensInfo[j + tokens_previous_requests + 1].token_id;
+      }
+      num_finetuning_requests += 1;
+    } else {
+      tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
+    }
+  }
+  assert(num_finetuning_requests <= 1);
+  if (num_bwd_tokens > 0) {
+    checkCUDA(cudaMemcpyAsync(m->handle.workSpace,
+                              token_ids,
+                              sizeof(BatchConfig::TokenId) * num_bwd_tokens,
+                              cudaMemcpyHostToDevice,
+                              stream));
+    // copy loss to d_loss
+    checkCUDA(cudaMemsetAsync(m->d_loss, 0, sizeof(float), stream));
+    compute_sparse_categorical_crossentropy_loss<<<GET_BLOCKS(num_bwd_tokens),
+                                                   min(CUDA_NUM_THREADS,
+                                                       num_bwd_tokens),
+                                                   0,
+                                                   stream>>>(
+        input_ptr,
+        static_cast<BatchConfig::TokenId *>(m->handle.workSpace),
+        m->d_loss,
+        num_bwd_tokens,
+        length);
+    // copy value from d_loss to loss
+    checkCUDA(cudaMemcpyAsync(
+        loss, m->d_loss, sizeof(float), cudaMemcpyDeviceToHost, stream));
+    *loss = *loss / (float)num_bwd_tokens;
+  }
 }
 
 /*static*/
 void ArgMax::forward_kernel_wrapper(ArgMaxMeta const *m,
-                                    GenericTensorAccessorW const &input,
+                                    BatchConfig const *bc,
+                                    GenericTensorAccessorR const &input,
                                     GenericTensorAccessorW const &indices,
                                     GenericTensorAccessorW const &parent,
-                                    int batch_size) {
+                                    int batch_size,
+                                    float *loss) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   cudaEvent_t t_start, t_end;
@@ -104,6 +170,7 @@ void ArgMax::forward_kernel_wrapper(ArgMaxMeta const *m,
 
   if (input.data_type == DT_HALF) {
     ArgMax::forward_kernel<half>(m,
+                                 bc,
                                  input.get_half_ptr(),
                                  indices.get_int32_ptr(),
                                  m->probs,
@@ -111,10 +178,12 @@ void ArgMax::forward_kernel_wrapper(ArgMaxMeta const *m,
                                                 : nullptr,
                                  length,
                                  batch_size,
+                                 loss,
                                  stream);
 
   } else if (input.data_type == DT_FLOAT) {
     ArgMax::forward_kernel<float>(m,
+                                  bc,
                                   input.get_float_ptr(),
                                   indices.get_int32_ptr(),
                                   m->probs,
@@ -122,6 +191,7 @@ void ArgMax::forward_kernel_wrapper(ArgMaxMeta const *m,
                                                  : nullptr,
                                   length,
                                   batch_size,
+                                  loss,
                                   stream);
   } else {
     assert(false && "Unsupported data type");
@@ -202,6 +272,10 @@ ArgMaxMeta::ArgMaxMeta(FFHandler handler,
   gpu_mem_allocator.create_legion_instance(reserveInst, temp_storage_bytes);
   d_temp_storage =
       gpu_mem_allocator.allocate_instance_untyped(temp_storage_bytes);
+
+  // allocate space for loss on device
+  gpu_mem_allocator.create_legion_instance(reserveInst, sizeof(float));
+  d_loss = gpu_mem_allocator.allocate_instance<float>(1);
 }
 
 ArgMaxMeta::~ArgMaxMeta(void) {
diff --git a/src/ops/attention.cc b/src/ops/attention.cc
index 203662d3ec..aef4f0a16a 100644
--- a/src/ops/attention.cc
+++ b/src/ops/attention.cc
@@ -1010,7 +1010,7 @@ MultiHeadAttentionParams MultiHeadAttention::get_params() const {
   params.bias = this->bias;
   params.add_bias_kv = this->add_bias_kv;
   params.add_zero_attn = this->add_zero_attn;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
diff --git a/src/ops/attention.cpp b/src/ops/attention.cpp
index ee7f87a7fb..10655a4a1a 100644
--- a/src/ops/attention.cpp
+++ b/src/ops/attention.cpp
@@ -156,7 +156,7 @@ MultiHeadAttentionMeta::MultiHeadAttentionMeta(FFHandler handler,
                                                Memory gpu_mem,
                                                int num_samples,
                                                int num_heads)
-    : OpMeta(handler) {
+    : OpMeta(handler, attn) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDNN(miopenSetStream(handler.dnn, stream));
diff --git a/src/ops/attention.cu b/src/ops/attention.cu
index 18fc810aed..4c460cdbbf 100644
--- a/src/ops/attention.cu
+++ b/src/ops/attention.cu
@@ -194,7 +194,7 @@ MultiHeadAttentionMeta::MultiHeadAttentionMeta(FFHandler handler,
                                                Memory gpu_mem,
                                                int num_samples,
                                                int num_heads)
-    : OpMeta(handler) {
+    : OpMeta(handler, attn) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDNN(cudnnSetStream(handler.dnn, stream));
diff --git a/src/ops/batch_matmul.cc b/src/ops/batch_matmul.cc
index e13169f6c1..e5f0611fb0 100644
--- a/src/ops/batch_matmul.cc
+++ b/src/ops/batch_matmul.cc
@@ -279,7 +279,7 @@ OpMeta *BatchMatmul::init_task(Task const *task,
                                Runtime *runtime) {
   BatchMatmul const *bmm = (BatchMatmul *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
-  BatchMatmulMeta *m = new BatchMatmulMeta(handle);
+  BatchMatmulMeta *m = new BatchMatmulMeta(handle, bmm);
   m->profiling = bmm->profiling;
   m->inference_debugging = bmm->inference_debugging;
   m->a_seq_length_dim = bmm->a_seq_length_dim;
@@ -616,7 +616,7 @@ bool BatchMatmul::measure_operator_cost(Simulator *sim,
     batch *= sub_input0.dims[i].size;
   }
 
-  BatchMatmulMeta *meta = sim->batch_matmul_meta;
+  BatchMatmulMeta *meta = new BatchMatmulMeta(sim->handler, this);
 
   // allocate tensors in simulator
   sim->free_all();
diff --git a/src/ops/batch_norm.cpp b/src/ops/batch_norm.cpp
index 7dee6fdaaf..5856f1dddf 100644
--- a/src/ops/batch_norm.cpp
+++ b/src/ops/batch_norm.cpp
@@ -284,7 +284,7 @@ BatchNormMeta::BatchNormMeta(FFHandler handler,
                              int output_c,
                              int output_h,
                              int output_w)
-    : OpMeta(handler) {
+    : OpMeta(handler, bn) {
   checkCUDNN(miopenCreateTensorDescriptor(&inputTensor));
   checkCUDNN(miopenCreateTensorDescriptor(&biasTensor));
   checkCUDNN(miopenCreateTensorDescriptor(&outputTensor));
diff --git a/src/ops/batch_norm.cu b/src/ops/batch_norm.cu
index 929ebf81f8..01e993067a 100644
--- a/src/ops/batch_norm.cu
+++ b/src/ops/batch_norm.cu
@@ -270,7 +270,7 @@ BatchNormMeta::BatchNormMeta(FFHandler handler,
                              int output_c,
                              int output_h,
                              int output_w)
-    : OpMeta(handler) {
+    : OpMeta(handler, bn) {
   checkCUDNN(cudnnCreateTensorDescriptor(&inputTensor));
   checkCUDNN(cudnnCreateTensorDescriptor(&biasTensor));
   checkCUDNN(cudnnCreateTensorDescriptor(&outputTensor));
diff --git a/src/ops/beam_topk.cc b/src/ops/beam_topk.cc
index 5f4547ace5..36cc7fd8fa 100644
--- a/src/ops/beam_topk.cc
+++ b/src/ops/beam_topk.cc
@@ -375,7 +375,7 @@ BeamInferenceResult
   // embedding size: eg. 4096
   int length = input_domain.hi()[0] - input_domain.lo()[0] + 1;
   // total token nums
-  size_t batch_size = bc.num_active_tokens();
+  size_t batch_size = bc.num_active_infr_tokens();
 
   // need meta for: how many sub requests in a main request
   BeamTopK::forward_kernel_wrapper(m,
@@ -390,9 +390,11 @@ BeamInferenceResult
 
   BeamInferenceResult ir;
 
-  download_tensor<int>(index_ptr, ir.token_ids, batch_size * m->max_beam_width);
-  download_tensor<float>(value_ptr, ir.probs, batch_size * m->max_beam_width);
-  download_tensor<int>(
+  copy_tensor_dev_to_host<int>(
+      index_ptr, ir.token_ids, batch_size * m->max_beam_width);
+  copy_tensor_dev_to_host<float>(
+      value_ptr, ir.probs, batch_size * m->max_beam_width);
+  copy_tensor_dev_to_host<int>(
       parent_ptr, ir.parent_id, batch_size * m->max_beam_width);
 
   if (m->inference_debugging) {
diff --git a/src/ops/beam_topk.cpp b/src/ops/beam_topk.cpp
index 8545bea7cb..5d80707ea7 100644
--- a/src/ops/beam_topk.cpp
+++ b/src/ops/beam_topk.cpp
@@ -681,7 +681,7 @@ void BeamTopK::forward_kernel_wrapper(BeamTopKMeta const *m,
 BeamTopKMeta::BeamTopKMeta(FFHandler handler,
                            Op const *op,
                            MemoryAllocator &gpu_mem_allocator)
-    : OpMeta(handler) {
+    : OpMeta(handler, op) {
   DataType data_type = op->inputs[0]->data_type;
   int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
   int max_requests_per_batch = BatchConfig::max_requests_per_batch();
diff --git a/src/ops/beam_topk.cu b/src/ops/beam_topk.cu
index c24bdf7c74..bf4c23cad0 100644
--- a/src/ops/beam_topk.cu
+++ b/src/ops/beam_topk.cu
@@ -723,7 +723,7 @@ void BeamTopK::forward_kernel_wrapper(BeamTopKMeta const *m,
 BeamTopKMeta::BeamTopKMeta(FFHandler handler,
                            Op const *op,
                            MemoryAllocator &gpu_mem_allocator)
-    : OpMeta(handler) {
+    : OpMeta(handler, op) {
   DataType data_type = op->inputs[0]->data_type;
   int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
   int max_requests_per_batch = BatchConfig::max_requests_per_batch();
diff --git a/src/ops/cache.cc b/src/ops/cache.cc
index 691e45b559..33b862ae85 100644
--- a/src/ops/cache.cc
+++ b/src/ops/cache.cc
@@ -165,7 +165,7 @@ OpMeta *Cache::init_task(Task const *task,
                          Runtime *runtime) {
   Cache *c = (Cache *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
-  CacheMeta *m = new CacheMeta(handle);
+  CacheMeta *m = new CacheMeta(handle, c);
   m->cache_score = 0.0f;
   m->profiling = c->profiling;
   m->inference_debugging = c->inference_debugging;
diff --git a/src/ops/cache.cpp b/src/ops/cache.cpp
index 95c5995f9e..a9512c2c59 100644
--- a/src/ops/cache.cpp
+++ b/src/ops/cache.cpp
@@ -75,7 +75,7 @@ float Cache::cache_update(Task const *task,
   return cache_score;
 }
 
-CacheMeta::CacheMeta(FFHandler handler) : OpMeta(handler) {}
+CacheMeta::CacheMeta(FFHandler handler, Cache const *c) : OpMeta(handler, c) {}
 
 template void
     Cache::cache_forward<float>(Task const *task,
diff --git a/src/ops/cache.cu b/src/ops/cache.cu
index a113e57a1c..2f95e59669 100644
--- a/src/ops/cache.cu
+++ b/src/ops/cache.cu
@@ -74,7 +74,7 @@ float Cache::cache_update(Task const *task,
   return cache_score;
 }
 
-CacheMeta::CacheMeta(FFHandler handler) : OpMeta(handler) {}
+CacheMeta::CacheMeta(FFHandler handler, Cache const *c) : OpMeta(handler, c) {}
 
 template void
     Cache::cache_forward<float>(Task const *task,
diff --git a/src/ops/cast.cc b/src/ops/cast.cc
index e514236a31..4a52bf874e 100644
--- a/src/ops/cast.cc
+++ b/src/ops/cast.cc
@@ -190,7 +190,7 @@ OpMeta *Cast::init_task(Task const *task,
                         Runtime *runtime) {
   Cast *cast = (Cast *)task->args;
   FFHandler handler = *((FFHandler const *)task->local_args);
-  CastMeta *m = new CastMeta(handler);
+  CastMeta *m = new CastMeta(handler, cast);
   m->input_data_type = cast->inputs[0]->data_type;
   m->output_data_type = cast->outputs[0]->data_type;
   std::strcpy(m->op_name, cast->name);
diff --git a/src/ops/concat.cc b/src/ops/concat.cc
index d4d8e525fc..0a82779b6d 100644
--- a/src/ops/concat.cc
+++ b/src/ops/concat.cc
@@ -197,7 +197,7 @@ OpMeta *Concat::init_task(Task const *task,
                           Runtime *runtime) {
   Concat *cc = (Concat *)task->args;
   FFHandler handler = *((FFHandler const *)task->local_args);
-  ConcatMeta *m = new ConcatMeta(handler);
+  ConcatMeta *m = new ConcatMeta(handler, cc);
   // Note that our internal axis index ordering is opposite to other frameworks
   init_meta(m, cc->legion_axis);
   m->profiling = cc->profiling;
@@ -365,7 +365,7 @@ bool Concat::measure_operator_cost(Simulator *sim,
     }
   }
 
-  ConcatMeta *m = sim->concat_meta;
+  ConcatMeta *m = new ConcatMeta(sim->handler, this);
   init_meta(m, this->legion_axis);
 
   sim->free_all();
diff --git a/src/ops/conv_2d.cc b/src/ops/conv_2d.cc
index 94850a178d..2428c9b99a 100644
--- a/src/ops/conv_2d.cc
+++ b/src/ops/conv_2d.cc
@@ -588,12 +588,13 @@ OpMeta *Conv2D::init_task(Task const *task,
   //     regions[4], task->regions[4], FID_DATA, ctx, runtime,
   //     false/*readOutput*/);
 
-  Conv2DMeta *m = new Conv2DMeta(handle);
+  Conv2DMeta *m = new Conv2DMeta(handle, conv);
   m->relu = conv->activation == AC_MODE_RELU;
   m->use_bias = conv->use_bias;
   m->profiling = conv->profiling;
   m->inference_debugging = conv->inference_debugging;
-  m->trainableInputs[0] = conv->trainableInputs[0];
+  m->trainable_inputs[0] = conv->trainable_inputs[0];
+  m->reset_input_grads[0] = conv->trainable_inputs[0];
   std::strcpy(m->op_name, conv->name);
   m->layer_guid = conv->layer_guid;
 
@@ -753,7 +754,7 @@ void Conv2D::backward(FFModel const &ff) {
                                                     inputs[0]->region));
   launcher.add_field(rid++, FID_DATA);
   // regions[1](I/O): input_grad
-  if (trainableInputs[0]) {
+  if (trainable_inputs[0]) {
     launcher.add_region_requirement(RegionRequirement(inputs[0]->part_grad,
                                                       0 /*projection id*/,
                                                       READ_WRITE,
@@ -803,7 +804,7 @@ void Conv2D::backward(FFModel const &ff) {
 
 /*
   region(I): input
-  region(I/O): input_grad (if trainableInputs[0])
+  region(I/O): input_grad (if trainable_inputs[0])
   region(I): output
   region(I/O): output_grad
   region(I): filter
@@ -816,17 +817,17 @@ void Conv2D::backward_task(Task const *task,
                            Runtime *runtime) {
   // Conv2D* conv = (Conv2D*) task->args;
   Conv2DMeta const *m = *((Conv2DMeta **)task->local_args);
-  assert(regions.size() == (5 + static_cast<size_t>(m->trainableInputs[0]) +
+  assert(regions.size() == (5 + static_cast<size_t>(m->trainable_inputs[0]) +
                             static_cast<size_t>(m->use_bias)));
   assert(task->regions.size() ==
-         (5 + static_cast<size_t>(m->trainableInputs[0]) +
+         (5 + static_cast<size_t>(m->trainable_inputs[0]) +
           static_cast<size_t>(m->use_bias)));
   size_t rid = 0;
   TensorAccessorR<float, Conv2DInput::NUMDIM> acc_input(
       regions[rid], task->regions[rid], FID_DATA, ctx, runtime);
   rid++;
   float *acc_input_grad_ptr = NULL;
-  if (m->trainableInputs[0]) {
+  if (m->trainable_inputs[0]) {
     TensorAccessorW<float, Conv2DInput::NUMDIM> acc_input_grad(
         regions[rid],
         task->regions[rid],
@@ -1119,7 +1120,7 @@ bool Conv2D::measure_operator_cost(Simulator *sim,
   int pad_h = ((output_h - 1) * stride_h + kernel_h - input_h + 1) / 2;
   int pad_w = ((output_w - 1) * stride_w + kernel_w - input_w + 1) / 2;
 
-  Conv2DMeta *m = sim->conv2d_meta;
+  Conv2DMeta *m = new Conv2DMeta(sim->handler, this);
   m->relu = activation == AC_MODE_RELU;
   // require input_c is divisible by groups
 
diff --git a/src/ops/element_binary.cc b/src/ops/element_binary.cc
index 4352f459b9..cf8696182b 100644
--- a/src/ops/element_binary.cc
+++ b/src/ops/element_binary.cc
@@ -429,7 +429,7 @@ OpMeta *ElementBinary::init_task(Task const *task,
   FFHandler handle = *((FFHandler *)task->local_args);
   ElementBinaryMeta *m = new ElementBinaryMeta(handle, eb);
   for (int i = 0; i < eb->numInputs; i++) {
-    m->trainableInputs[i] = eb->trainableInputs[i];
+    m->trainable_inputs[i] = eb->trainable_inputs[i];
   }
   m->op_type = eb->op_type;
   m->profiling = eb->profiling;
@@ -892,7 +892,7 @@ void ElementBinary::backward(FFModel const &ff) {
                                                       inputs[0]->region));
     launcher.add_field(rid++, FID_DATA);
     // regions[2](I/O): input0_grad
-    if (trainableInputs[0]) {
+    if (trainable_inputs[0]) {
       launcher.add_region_requirement(
           RegionRequirement(inputs[0]->part_grad,
                             0 /*projection id*/,
@@ -910,7 +910,7 @@ void ElementBinary::backward(FFModel const &ff) {
                                                         inputs[1]->region));
       launcher.add_field(rid++, FID_DATA);
       // regions[4](I/O): input1_grad
-      if (trainableInputs[1]) {
+      if (trainable_inputs[1]) {
         launcher.add_region_requirement(
             RegionRequirement(inputs[1]->part_grad,
                               0 /*projection id*/,
@@ -980,7 +980,7 @@ void ElementBinary::backward_task(Task const *task,
     in0_ptr = helperGetTensorPointerRO<float>(
         regions[rid], task->regions[rid], FID_DATA, ctx, runtime);
     rid++;
-    if (m->trainableInputs[0]) {
+    if (m->trainable_inputs[0]) {
       Domain in0_grad_domain = runtime->get_index_space_domain(
           ctx, task->regions[rid].region.get_index_space());
       assert(in0_domain == in0_grad_domain);
@@ -998,7 +998,7 @@ void ElementBinary::backward_task(Task const *task,
       in1_ptr = helperGetTensorPointerRO<float>(
           regions[rid], task->regions[rid], FID_DATA, ctx, runtime);
       rid++;
-      if (m->trainableInputs[1]) {
+      if (m->trainable_inputs[1]) {
         Domain in1_grad_domain = runtime->get_index_space_domain(
             ctx, task->regions[rid].region.get_index_space());
         // assert(out_grad_domain == in1_domain);
diff --git a/src/ops/element_unary.cc b/src/ops/element_unary.cc
index 0e1d115557..09cf13c717 100644
--- a/src/ops/element_unary.cc
+++ b/src/ops/element_unary.cc
@@ -354,7 +354,7 @@ OpMeta *ElementUnary::init_task(Task const *task,
                                 Runtime *runtime) {
   ElementUnary *eu = (ElementUnary *)task->args;
   FFHandler handle = *((FFHandler *)task->local_args);
-  ElementUnaryMeta *m = new ElementUnaryMeta(handle);
+  ElementUnaryMeta *m = new ElementUnaryMeta(handle, eu);
   m->op_type = eu->op_type;
   m->data_type = eu->outputs[0]->data_type;
   // Input and output should have the same data type
@@ -737,7 +737,7 @@ bool ElementUnary::measure_operator_cost(Simulator *sim,
   if (!inputs[0]->get_sub_tensor(mv, sub_input)) {
     return false;
   }
-  ElementUnaryMeta *m = sim->ele_unary_meta;
+  ElementUnaryMeta *m = new ElementUnaryMeta(sim->handler, this);
   m->op_type = op_type;
   if (use_cudnn(m->op_type)) {
     Domain input_domain, output_domain;
diff --git a/src/ops/element_unary.cpp b/src/ops/element_unary.cpp
index e20200420f..435abdfe11 100644
--- a/src/ops/element_unary.cpp
+++ b/src/ops/element_unary.cpp
@@ -282,7 +282,8 @@ void ElementUnary::backward_kernel_wrapper(ElementUnaryMeta const *m,
                                    stream);
 }
 
-ElementUnaryMeta::ElementUnaryMeta(FFHandler handler) : OpMeta(handler) {
+ElementUnaryMeta::ElementUnaryMeta(FFHandler handler, ElementUnary const *unary)
+    : OpMeta(handler, unary) {
   checkCUDNN(miopenCreateTensorDescriptor(&inputTensor));
   checkCUDNN(miopenCreateTensorDescriptor(&outputTensor));
   checkCUDNN(miopenCreateActivationDescriptor(&actiDesc));
diff --git a/src/ops/element_unary.cu b/src/ops/element_unary.cu
index c7f5e90f4c..15e6852388 100644
--- a/src/ops/element_unary.cu
+++ b/src/ops/element_unary.cu
@@ -291,7 +291,8 @@ void ElementUnary::backward_kernel_wrapper(ElementUnaryMeta const *m,
                                    stream);
 }
 
-ElementUnaryMeta::ElementUnaryMeta(FFHandler handler) : OpMeta(handler) {
+ElementUnaryMeta::ElementUnaryMeta(FFHandler handler, ElementUnary const *unary)
+    : OpMeta(handler, unary) {
   checkCUDNN(cudnnCreateTensorDescriptor(&inputTensor));
   checkCUDNN(cudnnCreateTensorDescriptor(&outputTensor));
   checkCUDNN(cudnnCreateActivationDescriptor(&actiDesc));
diff --git a/src/ops/embedding.cc b/src/ops/embedding.cc
index e630563b63..95b538bdb6 100644
--- a/src/ops/embedding.cc
+++ b/src/ops/embedding.cc
@@ -469,7 +469,7 @@ FutureMap Embedding::inference(FFModel const &ff,
   set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   size_t machine_view_hash = view->hash();
 
-  IndexLauncher launcher(EMBED_FWD_TASK_ID,
+  IndexLauncher launcher(EMBED_INF_TASK_ID,
                          parallel_is,
                          TaskArgument(NULL, 0),
                          argmap,
@@ -559,12 +559,6 @@ void Embedding::forward_task(Task const *task,
   }
   forward_kernel_wrapper(
       m, input, output, kernel, in_dim, out_dim, effective_batch_size);
-  if (m->inference_debugging) {
-    assert(task->index_point.get_dim() == 1);
-    int shard_id = task->index_point.point_data[0];
-    Embedding::save_inference_tensors_to_file(
-        m, shard_id, nullptr, {input}, {kernel}, {output});
-  }
 }
 
 /*
@@ -672,6 +666,16 @@ void Embedding::backward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
+Legion::FutureMap
+    Embedding::peft_bwd(FFModel const &ff,
+                        BatchConfigFuture const &bc,
+                        std::vector<ParallelTensor> const &batch_inputs,
+                        std::vector<ParallelTensor> const &batch_outputs,
+                        MachineView const *mv) {
+  // nothing to do (backward function only updates weights)
+  return FutureMap();
+}
+
 void Embedding::backward_task(Task const *task,
                               std::vector<PhysicalRegion> const &regions,
                               Context ctx,
diff --git a/src/ops/experts.cc b/src/ops/experts.cc
index 8c66f9c7bc..3acc68ed9b 100644
--- a/src/ops/experts.cc
+++ b/src/ops/experts.cc
@@ -589,18 +589,7 @@ OpMeta *Experts::init_task(Task const *task,
                            Runtime *runtime) {
   Experts const *exp = (Experts *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
-  ExpertsMeta *m = new ExpertsMeta(handle,
-                                   exp->num_experts,
-                                   exp->experts_start_idx,
-                                   exp->data_dim,
-                                   exp->out_dim,
-                                   exp->experts_num_layers,
-                                   exp->experts_internal_dim_size,
-                                   exp->effective_batch_size,
-                                   exp->num_chosen_experts,
-                                   exp->alpha,
-                                   exp->use_bias,
-                                   exp->activation);
+  ExpertsMeta *m = new ExpertsMeta(handle, exp);
   m->profiling = exp->profiling;
   m->inference_debugging = exp->inference_debugging;
   std::strcpy(m->op_name, exp->name);
@@ -682,7 +671,7 @@ FutureMap Experts::inference(FFModel const &ff,
   size_t machine_view_hash = view->hash();
   /* std::cout << "Experts op machine_view: " << *(MachineView const *)mv
             << std::endl; */
-  // int num_active_tokens = bc->num_active_tokens();
+  // int num_active_infr_tokens = bc->num_active_infr_tokens();
   IndexLauncher launcher(EXPERTS_INF_TASK_ID,
                          parallel_is,
                          TaskArgument(nullptr, 0),
@@ -1075,7 +1064,7 @@ void Experts::inference_task(Task const *task,
                                   output_ptr,
                                   weights_ptr,
                                   bias_ptr,
-                                  bc->num_active_tokens(),
+                                  bc->num_active_infr_tokens(),
                                   chosen_experts,
                                   batch_size,
                                   out_dim);
diff --git a/src/ops/experts.cpp b/src/ops/experts.cpp
index c06f02a647..502be878a9 100644
--- a/src/ops/experts.cpp
+++ b/src/ops/experts.cpp
@@ -27,7 +27,7 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                      float *output,
                                      float const *weights,
                                      float const *biases,
-                                     int num_active_tokens,
+                                     int num_active_infr_tokens,
                                      int chosen_experts,
                                      int batch_size,
                                      int out_dim) {
@@ -35,25 +35,15 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
   handle_unimplemented_hip_kernel(OP_EXPERTS);
 }
 
-ExpertsMeta::ExpertsMeta(FFHandler handler,
-                         int _num_experts,
-                         int _experts_start_idx,
-                         int _data_dim,
-                         int _out_dim,
-                         int _experts_num_layers,
-                         int _experts_internal_dim_size,
-                         int _effective_batch_size,
-                         int _num_chosen_experts,
-                         float _alpha,
-                         bool _use_bias,
-                         ActiMode _activation)
-    : OpMeta(handler), num_experts(_num_experts),
-      experts_start_idx(_experts_start_idx), data_dim(_data_dim),
-      out_dim(_out_dim), experts_num_layers(_experts_num_layers),
-      experts_internal_dim_size(_experts_internal_dim_size),
-      effective_batch_size(_effective_batch_size),
-      num_chosen_experts(_num_chosen_experts), alpha(_alpha),
-      use_bias(_use_bias), activation(_activation) {}
+ExpertsMeta::ExpertsMeta(FFHandler handler, Experts const *e)
+    : OpMeta(handler, e), num_experts(e->num_experts),
+      experts_start_idx(e->experts_start_idx), data_dim(e->data_dim),
+      out_dim(e->out_dim), experts_num_layers(e->experts_num_layers),
+      experts_internal_dim_size(e->experts_internal_dim_size),
+      effective_batch_size(e->effective_batch_size),
+      num_chosen_experts(e->num_chosen_experts), alpha(e->alpha),
+      use_bias(e->use_bias), activation(e->activation) {}
+
 ExpertsMeta::~ExpertsMeta(void) {}
 
 }; // namespace FlexFlow
diff --git a/src/ops/experts.cu b/src/ops/experts.cu
index ce15cdff55..f6f555d1ad 100644
--- a/src/ops/experts.cu
+++ b/src/ops/experts.cu
@@ -515,7 +515,7 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                                      float *output,
                                      float const *weights,
                                      float const *biases,
-                                     int num_active_tokens,
+                                     int num_active_infr_tokens,
                                      int chosen_experts,
                                      int batch_size,
                                      int out_dim) {
@@ -529,8 +529,8 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
     cudaEventRecord(t_start, stream);
   }
 
-  assert(num_active_tokens > 0);
-  assert(num_active_tokens <= m->effective_batch_size);
+  assert(num_active_infr_tokens > 0);
+  assert(num_active_infr_tokens <= m->effective_batch_size);
   assert(m->effective_batch_size == batch_size);
 
   int num_experts_per_block = m->num_experts;
@@ -540,7 +540,7 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
   int data_dim = m->data_dim;
   int num_chosen_experts = m->num_chosen_experts;
   // int num_tokens = m->effective_batch_size;
-  int num_tokens = num_active_tokens;
+  int num_tokens = num_active_infr_tokens;
   int expert_capacity = m->expert_capacity;
 
   assert(chosen_experts == num_chosen_experts);
@@ -579,14 +579,14 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
 #ifdef INFERENCE_TESTS
   // Checking
   // 1. check that m->sorted_indices contains indices sorted
-  int *indices_cpu = download_tensor<int>(indices, num_indices);
+  int *indices_cpu = copy_tensor_dev_to_host<int>(indices, num_indices);
   // assert(indices_cpu != nullptr);
   std::vector<int> indices_vec(indices_cpu, indices_cpu + num_indices);
   std::vector<int> indices_vec_sorted(indices_vec.size());
   std::copy(indices_vec.begin(), indices_vec.end(), indices_vec_sorted.begin());
   std::stable_sort(indices_vec_sorted.begin(), indices_vec_sorted.end());
 
-  int *thrust_sorted_indices_cpu = download_tensor<int>(
+  int *thrust_sorted_indices_cpu = copy_tensor_dev_to_host<int>(
       m->sorted_indices, m->num_chosen_experts * m->effective_batch_size);
   // assert(thrust_sorted_indices_cpu != nullptr);
   std::vector<int> thrust_sorted_indices_vec(
@@ -613,7 +613,7 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
     assert(indices_vec_sorted[i] == thrust_sorted_indices_vec[i]);
   }
   // 2. check that indices[m->original_indices[i]] = i
-  int *thrust_original_indices_cpu = download_tensor<int>(
+  int *thrust_original_indices_cpu = copy_tensor_dev_to_host<int>(
       m->original_indices, m->num_chosen_experts * m->effective_batch_size);
   // assert(thrust_original_indices_cpu != nullptr);
   std::vector<int> thrust_original_indices_vec(
@@ -668,8 +668,8 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
   }
   assert(non_zero_experts_count == non_zero_experts_check.size());
   // 7. check exp_local_label_to_index
-  int *non_zero_expert_labels_cpu =
-      download_tensor<int>(m->non_zero_expert_labels, non_zero_experts_count);
+  int *non_zero_expert_labels_cpu = copy_tensor_dev_to_host<int>(
+      m->non_zero_expert_labels, non_zero_experts_count);
   // assert(non_zero_expert_labels_cpu != nullptr);
   std::vector<int> non_zero_expert_labels_vec(non_zero_expert_labels_cpu,
                                               non_zero_expert_labels_cpu +
@@ -684,8 +684,8 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
                         non_zero_experts_check_vec.end()));
   assert(non_zero_expert_labels_vec == non_zero_experts_check_vec);
 
-  int *exp_local_label_to_index =
-      download_tensor<int>(m->exp_local_label_to_index, non_zero_experts_count);
+  int *exp_local_label_to_index = copy_tensor_dev_to_host<int>(
+      m->exp_local_label_to_index, non_zero_experts_count);
   // assert(exp_local_label_to_index != nullptr);
   std::vector<int> exp_local_label_to_index_vec(exp_local_label_to_index,
                                                 exp_local_label_to_index +
@@ -699,8 +699,8 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
   }
 
   // 8. Check expert_start_indexes
-  int *expert_start_indices_thrust =
-      download_tensor<int>(m->expert_start_indexes, non_zero_experts_count + 1);
+  int *expert_start_indices_thrust = copy_tensor_dev_to_host<int>(
+      m->expert_start_indexes, non_zero_experts_count + 1);
   // assert(expert_start_indices_thrust != nullptr);
   std::vector<int> expert_start_indices_thrust_vec(
       expert_start_indices_thrust,
@@ -746,9 +746,9 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
   int *num_assignments_per_expert_thrust =
       (int *)calloc(non_zero_experts_count, sizeof(int));
   assert(num_assignments_per_expert_thrust != nullptr);
-  assert(download_tensor<int>(m->num_assignments_per_expert,
-                              num_assignments_per_expert_thrust,
-                              non_zero_experts_count));
+  assert(copy_tensor_dev_to_host<int>(m->num_assignments_per_expert,
+                                      num_assignments_per_expert_thrust,
+                                      non_zero_experts_count));
   assert(num_assignments_per_expert_thrust != nullptr);
   std::vector<int> num_assignments_per_expert_thrust_vec(
       num_assignments_per_expert_thrust,
@@ -759,9 +759,9 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
   int *destination_start_indices_thrust =
       (int *)calloc(non_zero_experts_count, sizeof(int));
   assert(destination_start_indices_thrust != nullptr);
-  assert(download_tensor<int>(m->destination_start_indices,
-                              destination_start_indices_thrust,
-                              non_zero_experts_count));
+  assert(copy_tensor_dev_to_host<int>(m->destination_start_indices,
+                                      destination_start_indices_thrust,
+                                      non_zero_experts_count));
   assert(destination_start_indices_thrust != nullptr);
   std::vector<int> destination_start_indices_thrust_vec(
       destination_start_indices_thrust,
@@ -1233,25 +1233,14 @@ void Experts::forward_kernel_wrapper(ExpertsMeta const *m,
   }
 }
 
-ExpertsMeta::ExpertsMeta(FFHandler handler,
-                         int _num_experts,
-                         int _experts_start_idx,
-                         int _data_dim,
-                         int _out_dim,
-                         int _experts_num_layers,
-                         int _experts_internal_dim_size,
-                         int _effective_batch_size,
-                         int _num_chosen_experts,
-                         float _alpha,
-                         bool _use_bias,
-                         ActiMode _activation)
-    : OpMeta(handler), num_experts(_num_experts),
-      experts_start_idx(_experts_start_idx), data_dim(_data_dim),
-      out_dim(_out_dim), experts_num_layers(_experts_num_layers),
-      experts_internal_dim_size(_experts_internal_dim_size),
-      effective_batch_size(_effective_batch_size),
-      num_chosen_experts(_num_chosen_experts), alpha(_alpha),
-      use_bias(_use_bias), activation(_activation) {
+ExpertsMeta::ExpertsMeta(FFHandler handler, Experts const *e)
+    : OpMeta(handler, e), num_experts(e->num_experts),
+      experts_start_idx(e->experts_start_idx), data_dim(e->data_dim),
+      out_dim(e->out_dim), experts_num_layers(e->experts_num_layers),
+      experts_internal_dim_size(e->experts_internal_dim_size),
+      effective_batch_size(e->effective_batch_size),
+      num_chosen_experts(e->num_chosen_experts), alpha(e->alpha),
+      use_bias(e->use_bias), activation(e->activation) {
   expert_capacity =
       ceil(alpha * num_chosen_experts / num_experts * effective_batch_size);
 
diff --git a/src/ops/flat.cc b/src/ops/flat.cc
index 80aedbbb31..e9f637294a 100644
--- a/src/ops/flat.cc
+++ b/src/ops/flat.cc
@@ -187,7 +187,8 @@ OpMeta *Flat::init_task(Task const *task,
                         Context ctx,
                         Runtime *runtime) {
   FFHandler handler = *((FFHandler const *)task->local_args);
-  FlatMeta *m = new FlatMeta(handler);
+  Flat *flat = (Flat *)task->args;
+  FlatMeta *m = new FlatMeta(handler, flat);
   return m;
 }
 
diff --git a/src/ops/fused.cc b/src/ops/fused.cc
index 9ad5c4dc9c..121139beb1 100644
--- a/src/ops/fused.cc
+++ b/src/ops/fused.cc
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/ops/fused.h"
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/model.h"
 #include "flexflow/ops/batch_matmul.h"
 #include "flexflow/ops/batch_norm.h"
@@ -87,12 +88,32 @@ FusedOp::FusedOp(FFModel &model, Op *op)
     // weights[i]->owner_idx = i;
     weight_data_types[i] = op->weights[i]->data_type;
   }
-  numOutputs = op->numOutputs;
-  for (int i = 0; i < numOutputs; i++) {
-    outputs[i] = op->outputs[i];
-    outputs[i]->owner_op = this;
-    outputs[i]->owner_idx = i;
-    output_data_types[i] = op->outputs[i]->data_type;
+  numOutputs = 0;
+  for (int i = 0; i < op->numOutputs; i++) {
+    bool found = false;
+    // Handle in-place outputs
+    for (int j = 0; j < numInputs; j++) {
+      if (inputs[j]->region == op->outputs[i]->region) {
+        // This output is one of the inputs
+        assert(!found);
+        assert(inputs[j]->region != LogicalRegion::NO_REGION);
+        op_output_source[i] = SOURCE_INPUT;
+        op_input_idx[i] = j;
+        found = true;
+        break;
+      }
+    }
+    if (found) {
+      // do nothing
+    } else {
+      outputs[numOutputs] = op->outputs[i];
+      output_data_types[numOutputs] = op->outputs[i]->data_type;
+      op_output_source[i] = SOURCE_OUTPUT;
+      op_output_idx[i] = numOutputs;
+      outputs[numOutputs]->owner_op = this;
+      outputs[numOutputs]->owner_idx = numOutputs;
+      numOutputs++;
+    }
   }
   numOperators = 1;
   op_num_inputs[0] = op->numInputs;
@@ -109,10 +130,53 @@ FusedOp::FusedOp(FFModel &model, Op *op)
     op_weight_source[i] = SOURCE_WEIGHT;
     op_weight_idx[i] = i;
   }
-  for (int i = 0; i < numOutputs; i++) {
-    op_output_source[i] = SOURCE_OUTPUT;
-    op_output_idx[i] = i;
-  }
+  // for (int i = 0; i < numOutputs; i++) {
+  //   op_output_source[i] = SOURCE_OUTPUT;
+  //   op_output_idx[i] = i;
+  // }
+#if 0
+  int input_offset = 0, weight_offset = 0, output_offset = 0;
+  printf("\nNew fused op: %s (%s), #input:%i, #output:%i, #weights:%i. Fused: "
+         "#inputs=%i, #outputs=%i, #weights=%i\n",
+         op->name,
+         get_operator_type_name(op->op_type).c_str(),
+         op->numInputs,
+         op->numOutputs,
+         op->numWeights,
+         numInputs,
+         numOutputs,
+         numWeights);
+  printf("op_input_idx:\t");
+  for (int i = 0; i < input_offset + op->numInputs; i++) {
+    printf("%i\t", op_input_idx[i]);
+  }
+  printf("\n");
+  printf("op_input_source:\t");
+  for (int i = 0; i < input_offset + op->numInputs; i++) {
+    printf("%i\t", op_input_source[i]);
+  }
+  printf("\n");
+  printf("op_output_idx:\t");
+  for (int i = 0; i < output_offset + op->numOutputs; i++) {
+    printf("%i\t", op_output_idx[i]);
+  }
+  printf("\n");
+  printf("op_output_source:\t");
+  for (int i = 0; i < output_offset + op->numOutputs; i++) {
+    printf("%i\t", op_output_source[i]);
+  }
+  printf("\n");
+  printf("op_weight_idx:\t");
+  for (int i = 0; i < weight_offset + op->numWeights; i++) {
+    printf("%i\t", op_weight_idx[i]);
+  }
+  printf("\n");
+  printf("op_weight_source:\t");
+  for (int i = 0; i < weight_offset + op->numWeights; i++) {
+    printf("%i\t", op_weight_source[i]);
+  }
+  printf("\n");
+#endif
 }
 
 bool FusedOp::use_same_regions(
@@ -165,7 +229,8 @@ bool FusedOp::add_operator(
   // op->name, op_config));
   // Cannot fuse parallel operators (except allreduce) since they have different
   // paralel_is in forward and backward
-  assert(!op->is_parallel_op() || op->op_type == OP_ALLREDUCE);
+  assert(!op->is_parallel_op() || op->op_type == OP_ALLREDUCE ||
+         op->op_type == OP_PARALLEL_IDENTITY);
   // Currently don't consider nested fusion
   assert(op->op_type != OP_FUSED);
   MachineView my_view = outputs[0]->machine_view;
@@ -271,6 +336,18 @@ bool FusedOp::add_operator(
         found = true;
         op_output_source[output_offset + i] = SOURCE_OUTPUT;
         op_output_idx[output_offset + i] = j;
+        break;
+      }
+    }
+    for (int j = 0; j < numInputs; j++) {
+      if (inputs[j]->region == op->outputs[i]->region) {
+        // This input is one of my inputs
+        assert(!found);
+        assert(inputs[j]->region != LogicalRegion::NO_REGION);
+        op_output_source[output_offset + i] = SOURCE_INPUT;
+        op_output_idx[output_offset + i] = j;
+        found = true;
+        break;
       }
     }
     if (found) {
@@ -311,6 +388,50 @@ bool FusedOp::add_operator(
             "Reach to the #outputs limit during fusion.\n"
             "Consider increase MAX_NUM_OUTPUTS to allow more fusions.\n");
   }
+
+#if 0
+  printf("\nAdd op: %s (%s), #input:%i, #output:%i, #weights:%i. Fused: "
+         "#inputs=%i, #outputs=%i, #weights=%i\n",
+         op->name,
+         get_operator_type_name(op->op_type).c_str(),
+         op->numInputs,
+         op->numOutputs,
+         op->numWeights,
+         numInputs,
+         numOutputs,
+         numWeights);
+  printf("op_input_idx:\t");
+  for (int i = 0; i < input_offset + op->numInputs; i++) {
+    printf("%i\t", op_input_idx[i]);
+  }
+  printf("\n");
+  printf("op_input_source:\t");
+  for (int i = 0; i < input_offset + op->numInputs; i++) {
+    printf("%i\t", op_input_source[i]);
+  }
+  printf("\n");
+  printf("op_output_idx:\t");
+  for (int i = 0; i < output_offset + op->numOutputs; i++) {
+    printf("%i\t", op_output_idx[i]);
+  }
+  printf("\n");
+  printf("op_output_source:\t");
+  for (int i = 0; i < output_offset + op->numOutputs; i++) {
+    printf("%i\t", op_output_source[i]);
+  }
+  printf("\n");
+  printf("op_weight_idx:\t");
+  for (int i = 0; i < weight_offset + op->numWeights; i++) {
+    printf("%i\t", op_weight_idx[i]);
+  }
+  printf("\n");
+  printf("op_weight_source:\t");
+  for (int i = 0; i < weight_offset + op->numWeights; i++) {
+    printf("%i\t", op_weight_source[i]);
+  }
+  printf("\n");
+#endif
+
   return true;
 }
 
@@ -404,9 +525,13 @@ void FusedOp::init_inference(FFModel const &ff,
     }
     for (int i = 0; i < op_num_outputs[op]; i++) {
       int my_off = op_output_idx[i + ooff];
-      assert(op_output_source[i + ooff] == SOURCE_OUTPUT);
-      assert(my_off < batch_outputs.size());
-      my_batch_outputs.push_back(batch_outputs[my_off]);
+      if (op_output_source[i + ooff] == SOURCE_OUTPUT) {
+        my_batch_outputs.push_back(batch_outputs[my_off]);
+      } else if (op_output_source[i + ooff] == SOURCE_INPUT) {
+        my_batch_outputs.push_back(batch_inputs[my_off]);
+      } else {
+        assert(false);
+      }
     }
     ioff += op_num_inputs[op];
     ooff += op_num_outputs[op];
@@ -526,10 +651,6 @@ FutureMap FusedOp::inference(FFModel const &ff,
   set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
   MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
   size_t machine_view_hash = view->hash();
-  // bc is one of BatchConfig, TreeVerifyBatchConfig, and BeamSearchBatchConfig
-  // so we transfer the maximum of them
-  // size_t batch_config_size =
-  //    std::max(sizeof(TreeVerifyBatchConfig), sizeof(BeamSearchBatchConfig));
   IndexLauncher launcher(FUSEDOP_INF_TASK_ID,
                          parallel_is,
                          TaskArgument(nullptr, 0),
@@ -571,6 +692,83 @@ FutureMap FusedOp::inference(FFModel const &ff,
                           batch_outputs[i]->region));
     launcher.add_field(offset + i, FID_DATA);
   }
+  offset += numOutputs;
+  // add softmax output grad
+  if (operators[numOperators - 1]->op_type == OP_SOFTMAX) {
+    // printf("operator %i is last SOFTMAX! adding grad for output %i\n",
+    //        numOperators - 1,
+    //        numOutputs - 1);
+    assert(outputs[numOutputs - 1]->region != LogicalRegion::NO_REGION);
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[numOutputs - 1]->part_grad,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[numOutputs - 1]->region_grad));
+    launcher.add_field(offset, FID_DATA);
+  }
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+FutureMap FusedOp::peft_bwd(FFModel const &ff,
+                            BatchConfigFuture const &bc,
+                            std::vector<ParallelTensor> const &batch_inputs,
+                            std::vector<ParallelTensor> const &batch_outputs,
+                            MachineView const *mv) {
+  // Set iter_config
+  iter_config = ff.iter_config;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  size_t machine_view_hash = view->hash();
+  // bc is one of BatchConfig, TreeVerifyBatchConfig, and BeamSearchBatchConfig
+  // so we transfer the maximum of them
+  // size_t batch_config_size =
+  //    std::max(sizeof(TreeVerifyBatchConfig), sizeof(BeamSearchBatchConfig));
+  IndexLauncher launcher(FUSEDOP_PEFT_BWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(nullptr, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
+  int offset = 0;
+  for (int i = 0; i < numInputs; i++) {
+    assert(inputs[i]->part != LogicalPartition::NO_PART);
+    assert(inputs[i]->region != LogicalRegion::NO_REGION);
+    launcher.add_region_requirement(
+        RegionRequirement(batch_inputs[i]->part_grad,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_inputs[i]->region_grad));
+    launcher.add_field(offset + i, FID_DATA);
+  }
+  offset += numInputs;
+  for (int i = 0; i < numWeights; i++) {
+    assert(weights[i]->region != LogicalRegion::NO_REGION);
+    launcher.add_region_requirement(RegionRequirement(weights[i]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[i]->region));
+    launcher.add_field(offset + i, FID_DATA);
+  }
+  offset += numWeights;
+  for (int i = 0; i < numOutputs; i++) {
+    assert(outputs[i]->region != LogicalRegion::NO_REGION);
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[i]->part_grad,
+                          0 /*projection id*/,
+                          i == numOutputs - 1 ? READ_WRITE : WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[i]->region_grad));
+    launcher.add_field(offset + i, FID_DATA);
+  }
   return runtime->execute_index_space(ctx, launcher);
 }
 
diff --git a/src/ops/fused.cpp b/src/ops/fused.cpp
index 3282bc57d9..9f826cd611 100644
--- a/src/ops/fused.cpp
+++ b/src/ops/fused.cpp
@@ -15,6 +15,7 @@
 
 #include "flexflow/ops/fused.h"
 #include "flexflow/accessor.h"
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/model.h"
 #include "flexflow/ops/add_bias_residual_layer_norm.h"
 #include "flexflow/ops/batch_norm.h"
@@ -30,6 +31,7 @@
 #include "flexflow/ops/kernels/embedding_kernels.h"
 #include "flexflow/ops/kernels/flat_kernels.h"
 #include "flexflow/ops/kernels/linear_kernels.h"
+#include "flexflow/ops/kernels/lora_linear_kernels.h"
 #include "flexflow/ops/kernels/pool_2d_kernels.h"
 #include "flexflow/ops/kernels/reshape_kernels.h"
 #include "flexflow/ops/kernels/residual_rms_norm_kernels.h"
@@ -42,6 +44,7 @@
 #include "flexflow/ops/spec_inc_multihead_self_attention.h"
 #include "flexflow/ops/tree_inc_multihead_self_attention.h"
 #include "flexflow/parallel_ops/kernels/allreduce_kernels.h"
+#include "flexflow/parallel_ops/kernels/parallel_identity_kernels.h"
 #include "flexflow/utils/hip_helper.h"
 #include <hip/hip_runtime.h>
 
@@ -78,17 +81,27 @@ OpMeta *FusedOp::init_task(Task const *task,
   regions[...](I): weights
   regions[...](O): outputs
 */
-__host__ void FusedOp::forward_task(Task const *task,
-                                    std::vector<PhysicalRegion> const &regions,
-                                    Context ctx,
-                                    Runtime *runtime) {
+__host__ void
+    FusedOp::inference_task(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
   // const FusedOp* fused = (FusedOp*) task->args;
   FusedOpMeta const *metas = *((FusedOpMeta **)task->local_args);
   FusedOp const *fused = metas->fused_op;
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  // Return if no active tokens
+  if (bc->num_tokens == 0) {
+    return;
+  }
+
   assert(metas->numOperators == fused->numOperators);
   assert(regions.size() == task->regions.size());
-  assert((int)regions.size() ==
-         fused->numInputs + fused->numWeights + fused->numOutputs);
+  bool softmax_grad_additional_region =
+      (fused->op_op_type[fused->numOperators - 1] == OP_SOFTMAX);
+  assert((int)regions.size() == fused->numInputs + fused->numWeights +
+                                    fused->numOutputs +
+                                    softmax_grad_additional_region);
   GenericTensorAccessorR input_accessor[MAX_NUM_INPUTS];
   GenericTensorAccessorR weight_accessor[MAX_NUM_WEIGHTS];
   GenericTensorAccessorW output_accessor[MAX_NUM_OUTPUTS];
@@ -124,6 +137,7 @@ __host__ void FusedOp::forward_task(Task const *task,
                                          ctx,
                                          runtime);
   }
+  roff += fused->numOutputs;
   // Assert that all meta share the same dnn/blas handler
   int start = 0;
   for (start = 0; start < fused->numOperators; start++) {
@@ -138,11 +152,6 @@ __host__ void FusedOp::forward_task(Task const *task,
     }
   }
 
-  hipStream_t stream;
-  if (start < fused->numOperators) {
-    checkCUDA(get_legion_stream(&stream));
-  }
-
   int ioff = 0, woff = 0, ooff = 0;
   for (int op = 0; op < fused->numOperators; op++) {
     GenericTensorAccessorR my_input_accessor[MAX_NUM_INPUTS];
@@ -163,8 +172,9 @@ __host__ void FusedOp::forward_task(Task const *task,
       my_weight_accessor[i] = weight_accessor[fused->op_weight_idx[i + woff]];
     }
     for (int i = 0; i < fused->op_num_outputs[op]; i++) {
+      int my_off = fused->op_output_idx[i + ooff];
       assert(fused->op_output_source[i + ooff] == SOURCE_OUTPUT);
-      my_output_accessor[i] = output_accessor[i + ooff];
+      my_output_accessor[i] = output_accessor[my_off];
     }
     switch (fused->op_op_type[op]) {
       case OP_CONCAT: {
@@ -179,21 +189,6 @@ __host__ void FusedOp::forward_task(Task const *task,
                                                 m->legion_axis);
         break;
       }
-      case OP_CONV2D: {
-        assert(fused->op_num_inputs[op] == 1);
-        assert(fused->op_num_outputs[op] == 1);
-        assert(my_input_accessor[0].domain.get_dim() == 5);
-        assert(my_weight_accessor[0].domain.get_dim() == 5);
-        assert(my_output_accessor[0].domain.get_dim() == 5);
-        Conv2DMeta *m = (Conv2DMeta *)metas->meta[op];
-        Kernels::Conv2D::forward_kernel_wrapper(
-            m,
-            my_input_accessor[0].get_float_ptr(),
-            my_output_accessor[0].get_float_ptr(),
-            my_weight_accessor[0].get_float_ptr(),
-            my_weight_accessor[1].get_float_ptr());
-        break;
-      }
       case OP_BATCHNORM: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
@@ -209,16 +204,6 @@ __host__ void FusedOp::forward_task(Task const *task,
                                   my_weight_accessor[1].get_float_ptr());
         break;
       }
-      case OP_DROPOUT: {
-        assert(fused->op_num_inputs[op] == 1);
-        assert(fused->op_num_outputs[op] == 1);
-        DropoutMeta *m = (DropoutMeta *)metas->meta[op];
-        Kernels::Dropout::forward_kernel_wrapper(
-            m,
-            my_input_accessor[0].get_float_ptr(),
-            my_output_accessor[0].get_float_ptr());
-        break;
-      }
       case OP_LINEAR: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
@@ -229,25 +214,48 @@ __host__ void FusedOp::forward_task(Task const *task,
         assert(my_output_accessor[0].domain.get_volume() ==
                out_dim * batch_size);
         assert(my_input_accessor[0].domain.get_volume() == in_dim * batch_size);
-        float const *bias_ptr = nullptr;
+        void const *bias_ptr = nullptr;
         LinearMeta *m = (LinearMeta *)metas->meta[op];
         if (fused->op_num_weights[op] == 2) {
           assert(my_weight_accessor[1].domain.get_volume() == out_dim);
           if (!m->add_bias_only_once || task->index_point.point_data[0] == 0) {
-            bias_ptr = my_weight_accessor[1].get_float_ptr();
+            bias_ptr = my_weight_accessor[1].ptr;
           }
         } else {
           assert(fused->op_num_weights[op] == 1);
         }
-        Kernels::Linear::forward_kernel_wrapper(
-            m,
-            my_input_accessor[0].get_float_ptr(),
-            my_output_accessor[0].get_float_ptr(),
-            my_weight_accessor[0].get_float_ptr(),
-            bias_ptr,
-            in_dim,
-            out_dim,
-            batch_size);
+        assert(m->input_type[0] == my_input_accessor[0].data_type);
+        assert(m->input_type[0] == my_output_accessor[0].data_type);
+        batch_size = bc->num_active_infr_tokens();
+        Kernels::Linear::forward_kernel_wrapper(m,
+                                                my_input_accessor[0].ptr,
+                                                my_output_accessor[0].ptr,
+                                                my_weight_accessor[0].ptr,
+                                                bias_ptr,
+                                                in_dim,
+                                                out_dim,
+                                                batch_size);
+        break;
+      }
+      case OP_LORA: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_outputs[op] == 1);
+        Domain input_domain = my_input_accessor[0].domain;
+        Domain output_domain = my_output_accessor[0].domain;
+        int in_dim = input_domain.hi()[0] - input_domain.lo()[0] + 1;
+        int out_dim = output_domain.hi()[0] - output_domain.lo()[0] + 1;
+        int batch_size = my_input_accessor[0].domain.get_volume() / in_dim;
+        assert(my_output_accessor[0].domain.get_volume() ==
+               out_dim * batch_size);
+        assert(my_input_accessor[0].domain.get_volume() == in_dim * batch_size);
+        LoraLinearMeta *m = (LoraLinearMeta *)metas->meta[op];
+        assert(m->input_type[0] == my_input_accessor[0].data_type);
+        assert(m->output_type[0] == my_output_accessor[0].data_type);
+        // Assert that the output and the second input are at the same place
+        // since we ``inplace'' the output for LoRA
+        assert(my_input_accessor[1].ptr == my_output_accessor[0].ptr);
+        Kernels::LoraLinear::inference_kernel_wrapper(
+            m, bc, my_input_accessor[0], my_output_accessor[0]);
         break;
       }
       case OP_BATCHMATMUL: {
@@ -375,87 +383,127 @@ __host__ void FusedOp::forward_task(Task const *task,
       case OP_RELU:
       case OP_SIGMOID:
       case OP_TANH:
-      case OP_ELU: {
+      case OP_ELU:
+      case OP_SCALAR_TRUE_DIV: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_weights[op] == 0);
         assert(fused->op_num_outputs[op] == 1);
         assert(my_input_accessor[0].domain == my_output_accessor[0].domain);
         ElementUnaryMeta *m = (ElementUnaryMeta *)metas->meta[op];
-        ElementUnary::forward_kernel_wrapper(
-            m,
-            my_input_accessor[0].get_float_ptr(),
-            my_output_accessor[0].get_float_ptr(),
-            my_input_accessor[0].domain.get_volume());
+        if (m->data_type == DT_HALF) {
+          ElementUnary::forward_kernel_wrapper(
+              m,
+              my_input_accessor[0].get_half_ptr(),
+              my_output_accessor[0].get_half_ptr(),
+              my_input_accessor[0].domain.get_volume());
+        } else if (m->data_type == DT_FLOAT) {
+          ElementUnary::forward_kernel_wrapper(
+              m,
+              my_input_accessor[0].get_float_ptr(),
+              my_output_accessor[0].get_float_ptr(),
+              my_input_accessor[0].domain.get_volume());
+        } else {
+          assert(false && "Unsupported data type in ElementUnary forward");
+        }
         break;
       }
-      case OP_POOL2D: {
+      case OP_RMS_NORM: {
         assert(fused->op_num_inputs[op] == 1);
-        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_weights[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
-        Pool2DMeta *m = (Pool2DMeta *)metas->meta[op];
-        Kernels::Pool2D::forward_kernel_wrapper(
-            m,
-            my_input_accessor[0].get_float_ptr(),
-            my_output_accessor[0].get_float_ptr());
+        RMSNormMeta *m = (RMSNormMeta *)metas->meta[op];
+        Kernels::RMSNorm::inference_kernel_wrapper(m,
+                                                   bc,
+                                                   my_input_accessor[0],
+                                                   my_weight_accessor[0],
+                                                   my_output_accessor[0]);
         break;
       }
-      case OP_FLAT: {
-        assert(fused->op_num_inputs[op] == 1);
-        assert(fused->op_num_weights[op] == 0);
-        assert(fused->op_num_outputs[op] == 1);
-        assert(my_input_accessor[0].domain.get_volume() ==
-               my_output_accessor[0].domain.get_volume());
-        Kernels::Flat::forward_kernel_wrapper(
-            my_input_accessor[0].get_float_ptr(),
-            my_output_accessor[0].get_float_ptr(),
-            my_input_accessor[0].domain.get_volume());
+      case OP_RESIDUAL_RMS_NORM: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_weights[op] == 1);
+        assert(fused->op_num_outputs[op] == 2);
+        ResidualRMSNormMeta *m = (ResidualRMSNormMeta *)metas->meta[op];
+        Kernels::ResidualRMSNorm::inference_kernel_wrapper(
+            m,
+            bc,
+            my_input_accessor[0],
+            my_input_accessor[1],
+            my_weight_accessor[0],
+            my_output_accessor[0],
+            my_output_accessor[1]);
         break;
       }
-      case OP_SOFTMAX: {
+      case OP_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(fused->op_num_inputs[op] == 1);
-        assert(fused->op_num_weights[op] == 0);
         assert(fused->op_num_outputs[op] == 1);
-        assert(my_input_accessor[0].domain.get_volume() ==
-               my_output_accessor[0].domain.get_volume());
-        SoftmaxMeta *m = (SoftmaxMeta *)metas->meta[op];
-        if (m->input_type == DT_HALF) {
-          Kernels::Softmax::forward_kernel_wrapper(
-              m,
-              my_input_accessor[0].get_half_ptr(),
-              my_output_accessor[0].get_half_ptr());
-        } else if (m->input_type == DT_FLOAT) {
-          Kernels::Softmax::forward_kernel_wrapper(
-              m,
-              my_input_accessor[0].get_float_ptr(),
-              my_output_accessor[0].get_float_ptr());
+        IncMultiHeadSelfAttentionMeta *m =
+            (IncMultiHeadSelfAttentionMeta *)metas->meta[op];
+        assert(fused->op_num_weights[op] ==
+               (1 + (int)(*m->qkv_bias || *m->final_bias)));
+        GenericTensorAccessorR biases;
+        if (*m->qkv_bias || *m->final_bias) {
+          assert(fused->op_num_weights[op] == 2);
+          biases = my_weight_accessor[1];
         }
+        IncMultiHeadSelfAttention::inference_kernel_wrapper(
+            m,
+            bc,
+            task->index_point.point_data[0],
+            my_input_accessor[0],
+            my_weight_accessor[0],
+            my_output_accessor[0],
+            biases);
         break;
       }
-      case OP_RESHAPE: {
+      case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(fused->op_num_inputs[op] == 1);
-        assert(fused->op_num_weights[op] == 0);
         assert(fused->op_num_outputs[op] == 1);
-        assert(my_input_accessor[0].domain.get_volume() ==
-               my_output_accessor[0].domain.get_volume());
-        Kernels::Reshape::forward_kernel_wrapper(
-            my_input_accessor[0].get_float_ptr(),
-            my_output_accessor[0].get_float_ptr(),
-            my_input_accessor[0].domain.get_volume());
+        TreeIncMultiHeadSelfAttentionMeta *m =
+            (TreeIncMultiHeadSelfAttentionMeta *)metas->meta[op];
+        TreeVerifyBatchConfig const &tree_bc =
+            Future(task->futures[0]).get_result<TreeVerifyBatchConfig>();
+        assert(fused->op_num_weights[op] ==
+               (1 + (int)(*m->qkv_bias || *m->final_bias)));
+        GenericTensorAccessorR biases;
+        if (*m->qkv_bias || *m->final_bias) {
+          assert(fused->op_num_weights[op] == 2);
+          biases = my_weight_accessor[1];
+        }
+        TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
+            m,
+            &tree_bc,
+            task->index_point.point_data[0],
+            my_input_accessor[0],
+            my_weight_accessor[0],
+            my_output_accessor[0],
+            biases);
         break;
       }
-      case OP_TRANSPOSE: {
+      case OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(fused->op_num_inputs[op] == 1);
-        assert(fused->op_num_weights[op] == 0);
         assert(fused->op_num_outputs[op] == 1);
-        assert(my_input_accessor[0].domain.get_volume() ==
-               my_output_accessor[0].domain.get_volume());
-        TransposeMeta *m = (TransposeMeta *)metas->meta[op];
-        Kernels::Transpose::forward_kernel_wrapper(
+        SpecIncMultiHeadSelfAttentionMeta const *m =
+            (SpecIncMultiHeadSelfAttentionMeta *)metas->meta[op];
+        // BeamSearchBatchConfig const *beam_bc =
+        //     (BeamSearchBatchConfig *)task->args;
+        BeamSearchBatchConfig const &beam_bc =
+            Future(task->futures[0]).get_result<BeamSearchBatchConfig>();
+        assert(fused->op_num_weights[op] ==
+               (1 + (int)(*m->qkv_bias || *m->final_bias)));
+        GenericTensorAccessorR biases;
+        if (*m->qkv_bias || *m->final_bias) {
+          assert(fused->op_num_weights[op] == 2);
+          biases = my_weight_accessor[1];
+        }
+        SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
             m,
-            my_input_accessor[0].get_float_ptr(),
-            my_output_accessor[0].get_float_ptr(),
-            my_input_accessor[0].domain,
-            my_output_accessor[0].domain);
+            &beam_bc,
+            task->index_point.point_data[0],
+            my_input_accessor[0],
+            my_weight_accessor[0],
+            my_output_accessor[0],
+            biases);
         break;
       }
       case OP_LAYERNORM: {
@@ -477,23 +525,127 @@ __host__ void FusedOp::forward_task(Task const *task,
         break;
       }
       case OP_RESIDUAL_LAYERNORM: {
-        assert(false && "Operator ResidualLayerNorm does not support "
-                        "the forward() task");
+        assert(fused->op_num_outputs[op] == 2);
+        ResidualLayerNormMeta *m = (ResidualLayerNormMeta *)metas->meta[op];
+        if (m->use_two_residuals) {
+          assert(fused->op_num_inputs[op] == 3);
+        } else {
+          assert(fused->op_num_inputs[op] == 2);
+        }
+        if (!m->elementwise_affine) {
+          assert(fused->op_num_weights[op] == 0);
+        } else {
+          if (!m->use_bias) {
+            assert(fused->op_num_weights[op] == 1); // weight
+          } else {
+            assert(fused->op_num_weights[op] == 2); // weight + bias
+          }
+        }
+        GenericTensorAccessorR residual2;
+        if (m->use_two_residuals) {
+          residual2 = my_input_accessor[2];
+        }
+        GenericTensorAccessorR gamma, beta;
+        if (m->elementwise_affine) {
+          gamma = my_weight_accessor[0];
+          if (m->use_bias) {
+            beta = my_weight_accessor[1];
+          }
+        }
+        ResidualLayerNorm::inference_kernel_wrapper(m,
+                                                    bc,
+                                                    my_input_accessor[0],
+                                                    my_input_accessor[1],
+                                                    residual2,
+                                                    my_output_accessor[0],
+                                                    my_output_accessor[1],
+                                                    gamma,
+                                                    beta);
         break;
       }
       case OP_ADD_BIAS_RESIDUAL_LAYERNORM: {
-        assert(false && "Operator AddBiasResidualLayerNorm does not support "
-                        "the forward() task");
-        break;
-      }
-      case OP_RESIDUAL_RMS_NORM: {
-        assert(false && "Operator ResidualRMSNorm does not support "
-                        "the forward() task");
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_outputs[op] == 2);
+        AddBiasResidualLayerNormMeta *m =
+            (AddBiasResidualLayerNormMeta *)metas->meta[op];
+        if (!m->elementwise_affine) {
+          assert(fused->op_num_weights[op] == 1); // attn bias
+        } else {
+          if (!m->use_bias) {
+            assert(fused->op_num_weights[op] == 2); // attn bias + weight
+          } else {
+            assert(fused->op_num_weights[op] == 3); // attn bias + weight + bias
+          }
+        }
+        GenericTensorAccessorR gamma, beta;
+        if (m->elementwise_affine) {
+          gamma = my_weight_accessor[1];
+          if (m->use_bias) {
+            beta = my_weight_accessor[2];
+          }
+        }
+        AddBiasResidualLayerNorm::inference_kernel_wrapper(
+            m,
+            bc,
+            my_input_accessor[0],
+            my_weight_accessor[0],
+            my_input_accessor[1],
+            my_output_accessor[0],
+            my_output_accessor[1],
+            gamma,
+            beta);
         break;
       }
       case OP_SIGMOID_SILU_MULTI: {
-        assert(false && "Operator SigmoidSiluMulti does not support "
-                        "the forward() task");
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_outputs[op] == 1);
+        SigmoidSiluMultiMeta *m = (SigmoidSiluMultiMeta *)metas->meta[op];
+        SigmoidSiluMulti::inference_kernel_wrapper(m,
+                                                   bc,
+                                                   my_input_accessor[0],
+                                                   my_input_accessor[1],
+                                                   my_output_accessor[0]);
+        break;
+      }
+      case OP_SOFTMAX: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_accessor[0].domain.get_volume() ==
+               my_output_accessor[0].domain.get_volume());
+        if (op == fused->numOperators - 1) { // if this is the final operator
+          output_accessor[fused->numOutputs] = helperGetGenericTensorAccessorWO(
+              fused->output_data_types[fused->numOutputs - 1],
+              regions[roff],
+              task->regions[roff],
+              FID_DATA,
+              ctx,
+              runtime);
+        }
+        SoftmaxMeta *m = (SoftmaxMeta *)metas->meta[op];
+        Kernels::Softmax::inference_kernel_wrapper(
+            m,
+            bc,
+            (op == fused->numOperators - 1),
+            my_input_accessor[0],
+            my_output_accessor[0],
+            output_accessor[fused->numOutputs]);
+        break;
+      }
+      case OP_ALLREDUCE: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        AllReduceMeta const *m = (AllReduceMeta *)metas->meta[op];
+        Kernels::AllReduce::inference_kernel_wrapper(
+            m, bc, my_input_accessor[0], my_output_accessor[0]);
+        break;
+      }
+      case OP_PARALLEL_IDENTITY: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        ParallelIdentityMeta const *m = (ParallelIdentityMeta *)metas->meta[op];
+        Kernels::ParallelIdentity::inference_kernel_wrapper(
+            m, bc, my_input_accessor[0], my_output_accessor[0]);
         break;
       }
       default: {
@@ -503,6 +655,33 @@ __host__ void FusedOp::forward_task(Task const *task,
         assert(false && "Fusion currently does not support type");
       }
     }
+    if (metas->meta[op]->inference_debugging &&
+        !(fused->op_op_type[op] == OP_ALLREDUCE ||
+          fused->op_op_type[op] == OP_PARALLEL_IDENTITY ||
+          fused->op_op_type[op] == OP_REPLICATE ||
+          fused->op_op_type[op] == OP_REPARTITION ||
+          fused->op_op_type[op] == OP_COMBINE)) {
+      std::vector<GenericTensorAccessorR> input_accessors_to_save;
+      std::vector<GenericTensorAccessorR> weight_accessors_to_save;
+      std::vector<GenericTensorAccessorR> output_accessors_to_save;
+      for (int i = 0; i < fused->op_num_inputs[op]; i++) {
+        input_accessors_to_save.push_back(my_input_accessor[i]);
+      }
+      for (int i = 0; i < fused->op_num_weights[op]; i++) {
+        weight_accessors_to_save.push_back(my_weight_accessor[i]);
+      }
+      for (int i = 0; i < fused->op_num_outputs[op]; i++) {
+        output_accessors_to_save.push_back(my_output_accessor[i]);
+      }
+      assert(task->index_point.get_dim() == 1);
+      int shard_id = task->index_point.point_data[0];
+      FusedOp::save_inference_tensors_to_file(metas->meta[op],
+                                              shard_id,
+                                              bc,
+                                              input_accessors_to_save,
+                                              weight_accessors_to_save,
+                                              output_accessors_to_save);
+    }
     ioff += fused->op_num_inputs[op];
     woff += fused->op_num_weights[op];
     ooff += fused->op_num_outputs[op];
@@ -517,18 +696,525 @@ __host__ void FusedOp::forward_task(Task const *task,
   regions[...](I): weights
   regions[...](O): outputs
 */
-__host__ void
-    FusedOp::inference_task(Task const *task,
-                            std::vector<PhysicalRegion> const &regions,
-                            Context ctx,
-                            Runtime *runtime) {
+__host__ void FusedOp::peft_bwd_task(Task const *task,
+                                     std::vector<PhysicalRegion> const &regions,
+                                     Context ctx,
+                                     Runtime *runtime) {
   // const FusedOp* fused = (FusedOp*) task->args;
-  FusedOpMeta const *metas = *((FusedOpMeta **)task->local_args);
+  FusedOpMeta *metas = *((FusedOpMeta **)task->local_args);
   FusedOp const *fused = metas->fused_op;
+  // BatchConfig const *bc = (BatchConfig *)task->args;
   BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
-  if (bc->num_tokens == 0) {
+  // Return if no active PEFT bwd tokens
+  if (bc->num_active_peft_tokens() == 0) {
     return;
   }
+
+  assert(metas->numOperators == fused->numOperators);
+  assert(regions.size() == task->regions.size());
+  assert((int)regions.size() ==
+         fused->numInputs + fused->numWeights + fused->numOutputs);
+  // Domain input_domain[MAX_NUM_INPUTS];
+  // Domain weight_domain[MAX_NUM_WEIGHTS];
+  // Domain output_domain[MAX_NUM_OUTPUTS];
+  GenericTensorAccessorW input_grad_accessor[MAX_NUM_INPUTS];
+  GenericTensorAccessorR weight_accessor[MAX_NUM_WEIGHTS];
+  GenericTensorAccessorW output_grad_accessor[MAX_NUM_OUTPUTS];
+  assert(fused->numInputs <= MAX_NUM_INPUTS);
+  for (int i = 0; i < fused->numInputs; i++) {
+    // input_domain[i] = runtime->get_index_space_domain(
+    //     ctx, task->regions[i].region.get_index_space());
+    input_grad_accessor[i] =
+        helperGetGenericTensorAccessorRW(fused->input_data_types[i],
+                                         regions[i],
+                                         task->regions[i],
+                                         FID_DATA,
+                                         ctx,
+                                         runtime);
+  }
+  int roff = fused->numInputs;
+  assert(fused->numWeights <= MAX_NUM_WEIGHTS);
+  for (int i = 0; i < fused->numWeights; i++) {
+    // weight_domain[i] = runtime->get_index_space_domain(
+    //     ctx, task->regions[i + roff].region.get_index_space());
+    weight_accessor[i] =
+        helperGetGenericTensorAccessorRO(fused->weight_data_types[i],
+                                         regions[i + roff],
+                                         task->regions[i + roff],
+                                         FID_DATA,
+                                         ctx,
+                                         runtime);
+  }
+  roff += fused->numWeights;
+  assert(fused->numOutputs <= MAX_NUM_OUTPUTS);
+  for (int i = 0; i < fused->numOutputs; i++) {
+    // output_domain[i] = runtime->get_index_space_domain(
+    //     ctx, task->regions[i + roff].region.get_index_space());
+    output_grad_accessor[i] =
+        helperGetGenericTensorAccessorRW(fused->output_data_types[i],
+                                         regions[i + roff],
+                                         task->regions[i + roff],
+                                         FID_DATA,
+                                         ctx,
+                                         runtime);
+  }
+  // Assert that all meta share the same dnn/blas handler
+  int start = 0;
+  for (start = 0; start < fused->numOperators; start++) {
+    if (metas->meta[start] != NULL) {
+      break;
+    }
+  }
+  for (int op = start + 1; op < fused->numOperators; op++) {
+    if (metas->meta[op] != NULL) {
+      assert(metas->meta[start]->handle.blas == metas->meta[op]->handle.blas);
+      assert(metas->meta[start]->handle.dnn == metas->meta[op]->handle.dnn);
+    }
+  }
+
+  int ioff = 0, woff = 0, ooff = 0;
+  // Domain my_id[MAX_NUM_INPUTS];
+  // Domain my_wd[MAX_NUM_WEIGHTS];
+  // Domain my_od[MAX_NUM_OUTPUTS];
+  GenericTensorAccessorW my_input_grad_accessor[MAX_NUM_INPUTS];
+  GenericTensorAccessorR my_weight_accessor[MAX_NUM_WEIGHTS];
+  GenericTensorAccessorW my_output_grad_accessor[MAX_NUM_OUTPUTS];
+
+  // Do backpropagation in the reverse ordering
+  for (int op = 0; op < fused->numOperators; op++) {
+    ioff += fused->op_num_inputs[op];
+    woff += fused->op_num_weights[op];
+    ooff += fused->op_num_outputs[op];
+  }
+
+  for (int op = fused->numOperators - 1; op >= 0; op--) {
+    ioff -= fused->op_num_inputs[op];
+    woff -= fused->op_num_weights[op];
+    ooff -= fused->op_num_outputs[op];
+    for (int i = 0; i < fused->op_num_inputs[op]; i++) {
+      int my_off = fused->op_input_idx[i + ioff];
+      if (fused->op_input_source[i + ioff] == SOURCE_INPUT) {
+        // my_id[i] = input_domain[my_off];
+        my_input_grad_accessor[i] = input_grad_accessor[my_off];
+      } else if (fused->op_input_source[i + ioff] == SOURCE_OUTPUT) {
+        // my_id[i] = output_domain[my_off];
+        my_input_grad_accessor[i] = output_grad_accessor[my_off];
+      } else {
+        assert(false);
+      }
+    }
+    for (int i = 0; i < fused->op_num_weights[op]; i++) {
+      assert(fused->op_weight_source[i + woff] == SOURCE_WEIGHT);
+      // my_wd[i] = weight_domain[fused->op_weight_idx[i + woff]];
+      // my_wp[i] = weight_ptr[fused->op_weight_idx[i + woff]];
+      my_weight_accessor[i] = weight_accessor[fused->op_weight_idx[i + woff]];
+    }
+    for (int i = 0; i < fused->op_num_outputs[op]; i++) {
+      int my_off = fused->op_output_idx[i + ooff];
+      assert(fused->op_output_source[i + ooff] == SOURCE_OUTPUT);
+      // my_od[i] = output_domain[fused->op_output_idx[i + ooff]];
+      // my_op[i] = output_ptr[fused->op_output_idx[i + ooff]];
+      my_output_grad_accessor[i] = output_grad_accessor[my_off];
+    }
+    switch (fused->op_op_type[op]) {
+      case OP_CONCAT: {
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        // TODO: implement this
+        assert(false);
+        // ConcatMeta *m = (ConcatMeta *)metas->meta[op];
+        // int num_inputs = fused->op_num_inputs[op];
+        // Kernels::Concat::peft_bwd_kernel_wrapper(m,
+        //                                          my_output_accessor[0],
+        //                                          my_input_accessor,
+        //                                         num_inputs,
+        //                                          m->legion_axis);
+        break;
+      }
+      case OP_BATCHNORM: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_grad_accessor[0].domain.get_dim() == 5);
+        assert(my_output_grad_accessor[0].domain.get_dim() == 5);
+        assert(my_weight_accessor[0].domain.get_dim() == 2);
+        assert(my_weight_accessor[1].domain.get_dim() == 2);
+        // TODO: implement this
+        assert(false);
+        // BatchNormMeta *m = (BatchNormMeta *)metas->meta[op];
+        // BatchNorm::peft_bwd_kernel_kernel(
+        //     m,
+        //     my_input_accessor[0].get_float_ptr(),
+        //     my_output_accessor[0].get_float_ptr(),
+        //     my_weight_accessor[0].get_float_ptr(),
+        //     my_weight_accessor[1].get_float_ptr());
+        break;
+      }
+      case OP_LINEAR: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        Domain kernel_domain = my_weight_accessor[0].domain;
+        int in_dim = kernel_domain.hi()[0] - kernel_domain.lo()[0] + 1;
+        int out_dim = kernel_domain.hi()[1] - kernel_domain.lo()[1] + 1;
+        int batch_size = my_input_grad_accessor[0].domain.get_volume() / in_dim;
+        assert(my_output_grad_accessor[0].domain.get_volume() ==
+               out_dim * batch_size);
+        assert(my_input_grad_accessor[0].domain.get_volume() ==
+               in_dim * batch_size);
+        LinearMeta *m = (LinearMeta *)metas->meta[op];
+        assert(m->input_type[0] == my_input_grad_accessor[0].data_type);
+        assert(m->input_type[0] == my_output_grad_accessor[0].data_type);
+        int num_infr_tokens = bc->num_active_infr_tokens();
+        int num_peft_tokens = bc->num_active_peft_tokens();
+        Kernels::Linear::peft_bwd_kernel_wrapper(m,
+                                                 my_input_grad_accessor[0].ptr,
+                                                 my_output_grad_accessor[0].ptr,
+                                                 my_weight_accessor[0].ptr,
+                                                 in_dim,
+                                                 out_dim,
+                                                 num_infr_tokens,
+                                                 num_peft_tokens);
+        break;
+      }
+      case OP_LORA: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_outputs[op] == 1);
+        Domain input_domain = my_input_grad_accessor[0].domain;
+        Domain output_domain = my_output_grad_accessor[0].domain;
+        int in_dim = input_domain.hi()[0] - input_domain.lo()[0] + 1;
+        int out_dim = output_domain.hi()[0] - output_domain.lo()[0] + 1;
+        int batch_size = my_input_grad_accessor[0].domain.get_volume() / in_dim;
+        assert(my_output_grad_accessor[0].domain.get_volume() ==
+               out_dim * batch_size);
+        assert(my_input_grad_accessor[0].domain.get_volume() ==
+               in_dim * batch_size);
+        LoraLinearMeta *m = (LoraLinearMeta *)metas->meta[op];
+        assert(m->input_type[0] == my_input_grad_accessor[0].data_type);
+        assert(m->output_type[0] == my_output_grad_accessor[0].data_type);
+        // Assert that the output and the second input are at the same place
+        // since we ``inplace'' the output for LoRA
+        assert(my_input_grad_accessor[1].ptr == my_output_grad_accessor[0].ptr);
+        Kernels::LoraLinear::peft_bwd_kernel_wrapper(
+            m, bc, my_input_grad_accessor[0], my_output_grad_accessor[0]);
+        break;
+      }
+      case OP_BATCHMATMUL: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        Domain out_domain = my_output_grad_accessor[0].domain;
+        Domain a_domain = my_input_grad_accessor[0].domain;
+        Domain b_domain = my_input_grad_accessor[1].domain;
+        int m = b_domain.hi()[0] - b_domain.lo()[0] + 1;
+        assert(m == out_domain.hi()[0] - out_domain.lo()[0] + 1);
+        int n = a_domain.hi()[1] - a_domain.lo()[1] + 1;
+        assert(n == out_domain.hi()[1] - out_domain.lo()[1] + 1);
+        int k = a_domain.hi()[0] - a_domain.lo()[0] + 1;
+        assert(k == b_domain.hi()[1] - b_domain.lo()[1] + 1);
+        assert(a_domain.get_dim() == b_domain.get_dim());
+        assert(a_domain.get_dim() == out_domain.get_dim());
+        int batch = 1;
+        for (int i = 2; i < a_domain.get_dim(); i++) {
+          int dim_size = a_domain.hi()[i] - a_domain.lo()[i] + 1;
+          assert(dim_size == b_domain.hi()[i] - b_domain.lo()[i] + 1);
+          assert(dim_size == out_domain.hi()[i] - out_domain.lo()[i] + 1);
+          batch *= dim_size;
+        }
+        // TODO: implement me
+        assert(false);
+        // BatchMatmulMeta *meta = (BatchMatmulMeta *)metas->meta[op];
+        // Kernels::BatchMatmul::backward_kernel_wrapper(
+        //     meta,
+        //     my_output_accessor[0].get_float_ptr(),
+        //     my_input_accessor[0].get_float_ptr(),
+        //     my_input_accessor[1].get_float_ptr(),
+        //     (float const *)nullptr,
+        //     m,
+        //     n,
+        //     k,
+        //     batch,
+        //     meta->a_seq_length_dim,
+        //     meta->b_seq_length_dim,
+        //     fused->iter_config.seq_length);
+        break;
+      }
+      case OP_EW_ADD:
+      case OP_EW_SUB:
+      case OP_EW_MUL:
+      case OP_EW_DIV:
+      case OP_EW_MAX:
+      case OP_EW_MIN: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_grad_accessor[0].domain ==
+               my_input_grad_accessor[1].domain);
+        assert(my_input_grad_accessor[0].domain ==
+               my_output_grad_accessor[0].domain);
+        // ElementBinaryMeta *m = (ElementBinaryMeta *)metas->meta[op];
+        // Kernels::ElementBinary::forward_kernel_wrapper(m,
+        //                                                my_input_accessor[0],
+        //                                                my_input_accessor[1],
+        //                                                my_output_accessor[0]);
+        break;
+      }
+      case OP_EMBEDDING: {
+        // Currently assume the Embedding layer cannot be finetuned
+        // so we do nothing for embedding
+        break;
+      }
+      case OP_GELU:
+      case OP_RELU:
+      case OP_SIGMOID:
+      case OP_TANH:
+      case OP_ELU:
+      case OP_SCALAR_TRUE_DIV: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_grad_accessor[0].domain ==
+               my_output_grad_accessor[0].domain);
+        // TODO: implement me
+        assert(false);
+        // ElementUnaryMeta *m = (ElementUnaryMeta *)metas->meta[op];
+        //   if (m->data_type == DT_HALF) {
+        //     ElementUnary::forward_kernel_wrapper(
+        //         m,
+        //         my_input_accessor[0].get_half_ptr(),
+        //         my_output_accessor[0].get_half_ptr(),
+        //         my_input_accessor[0].domain.get_volume());
+        //   } else if (m->data_type == DT_FLOAT) {
+        //     ElementUnary::forward_kernel_wrapper(
+        //         m,
+        //         my_input_accessor[0].get_float_ptr(),
+        //         my_output_accessor[0].get_float_ptr(),
+        //         my_input_accessor[0].domain.get_volume());
+        //   } else {
+        //     assert(false && "Unsupported data type in ElementUnary forward");
+        //   }
+        break;
+      }
+      case OP_RMS_NORM: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        RMSNormMeta const *m = (RMSNormMeta *)metas->meta[op];
+        Kernels::RMSNorm::peft_bwd_kernel_wrapper(m,
+                                                  bc,
+                                                  my_output_grad_accessor[0],
+                                                  my_input_grad_accessor[0],
+                                                  my_weight_accessor[0]);
+        break;
+      }
+      case OP_RESIDUAL_RMS_NORM: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_weights[op] == 1);
+        assert(fused->op_num_outputs[op] == 2);
+        ResidualRMSNormMeta const *m = (ResidualRMSNormMeta *)metas->meta[op];
+        Kernels::ResidualRMSNorm::peft_bwd_kernel_wrapper(
+            m,
+            bc,
+            my_input_grad_accessor[0],
+            my_input_grad_accessor[1],
+            my_output_grad_accessor[0],
+            my_output_grad_accessor[1],
+            my_weight_accessor[0]);
+        break;
+      }
+      case OP_INC_MULTIHEAD_SELF_ATTENTION: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        IncMultiHeadSelfAttentionMeta *m =
+            (IncMultiHeadSelfAttentionMeta *)metas->meta[op];
+        assert(fused->op_num_weights[op] ==
+               (1 + (int)(*m->qkv_bias || *m->final_bias)));
+        GenericTensorAccessorR biases;
+        if (*m->qkv_bias || *m->final_bias) {
+          assert(fused->op_num_weights[op] == 2);
+          biases = my_weight_accessor[1];
+        }
+        IncMultiHeadSelfAttention::peft_bwd_kernel_wrapper(
+            m,
+            bc,
+            task->index_point.point_data[0],
+            my_input_grad_accessor[0],
+            my_weight_accessor[0],
+            my_output_grad_accessor[0],
+            biases);
+        break;
+      }
+      case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION:
+      case OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION: {
+        // TODO: implement me
+        assert(false);
+        break;
+      }
+      case OP_LAYERNORM: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        LayerNormMeta const *m = (LayerNormMeta *)metas->meta[op];
+        if (m->elementwise_affine) {
+          assert(fused->op_num_weights[op] == 1 + (int)(m->use_bias));
+        }
+        GenericTensorAccessorR gamma, beta;
+        if (m->elementwise_affine) {
+          gamma = my_weight_accessor[0];
+          if (m->use_bias) {
+            beta = my_weight_accessor[1];
+          }
+        }
+        LayerNorm::peft_bwd_kernel_wrapper(
+            m, my_output_grad_accessor[0], my_input_grad_accessor[0], gamma);
+        break;
+      }
+      case OP_RESIDUAL_LAYERNORM: {
+        assert(fused->op_num_outputs[op] == 2);
+        ResidualLayerNormMeta const *m =
+            (ResidualLayerNormMeta *)metas->meta[op];
+        if (m->use_two_residuals) {
+          assert(fused->op_num_inputs[op] == 3);
+        } else {
+          assert(fused->op_num_inputs[op] == 2);
+        }
+        if (!m->elementwise_affine) {
+          assert(fused->op_num_weights[op] == 0);
+        } else {
+          if (!m->use_bias) {
+            assert(fused->op_num_weights[op] == 1); // weight
+          } else {
+            assert(fused->op_num_weights[op] == 2); // weight + bias
+          }
+        }
+        GenericTensorAccessorW residual2;
+        if (m->use_two_residuals) {
+          residual2 = my_input_grad_accessor[2];
+        }
+        GenericTensorAccessorR gamma;
+        if (m->elementwise_affine) {
+          gamma = my_weight_accessor[0];
+        }
+        ResidualLayerNorm::peft_bwd_kernel_wrapper(m,
+                                                   my_output_grad_accessor[1],
+                                                   my_input_grad_accessor[0],
+                                                   my_input_grad_accessor[1],
+                                                   residual2,
+                                                   gamma);
+        break;
+      }
+      case OP_ADD_BIAS_RESIDUAL_LAYERNORM: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_outputs[op] == 2);
+        AddBiasResidualLayerNormMeta const *m =
+            (AddBiasResidualLayerNormMeta *)metas->meta[op];
+        if (!m->elementwise_affine) {
+          assert(fused->op_num_weights[op] == 1); // attn bias
+        } else {
+          if (!m->use_bias) {
+            assert(fused->op_num_weights[op] == 2); // attn bias + weight
+          } else {
+            assert(fused->op_num_weights[op] == 3); // attn bias + weight + bias
+          }
+        }
+        GenericTensorAccessorR gamma;
+        if (m->elementwise_affine) {
+          gamma = my_weight_accessor[1];
+        }
+
+        AddBiasResidualLayerNorm::peft_bwd_kernel_wrapper(
+            m,
+            my_output_grad_accessor[1],
+            my_input_grad_accessor[0],
+            my_input_grad_accessor[1],
+            gamma);
+        break;
+      }
+      case OP_SIGMOID_SILU_MULTI: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_outputs[op] == 1);
+        SigmoidSiluMultiMeta const *m = (SigmoidSiluMultiMeta *)metas->meta[op];
+        SigmoidSiluMulti::peft_bwd_kernel_wrapper(m,
+                                                  bc,
+                                                  my_output_grad_accessor[0],
+                                                  my_input_grad_accessor[0],
+                                                  my_input_grad_accessor[1]);
+        break;
+      }
+      case OP_SOFTMAX: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_grad_accessor[0].domain.get_volume() ==
+               my_output_grad_accessor[0].domain.get_volume());
+        SoftmaxMeta *m = (SoftmaxMeta *)metas->meta[op];
+        Kernels::Softmax::peft_bwd_kernel_wrapper(
+            m, bc, my_input_grad_accessor[0], my_output_grad_accessor[0]);
+        break;
+      }
+      case OP_ALLREDUCE: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        AllReduceMeta const *m = (AllReduceMeta *)metas->meta[op];
+        Kernels::AllReduce::peft_bwd_kernel_wrapper(
+            m, bc, my_input_grad_accessor[0], my_output_grad_accessor[0]);
+        break;
+      }
+      case OP_PARALLEL_IDENTITY: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        ParallelIdentityMeta const *m = (ParallelIdentityMeta *)metas->meta[op];
+        Kernels::ParallelIdentity::peft_bwd_kernel_wrapper(
+            m, bc, my_input_grad_accessor[0], my_output_grad_accessor[0]);
+        break;
+      }
+      default: {
+        fprintf(stderr,
+                "Fusion currently does not support type = %d\n",
+                fused->op_op_type[op]);
+        assert(false && "Fusion currently does not support type");
+      }
+    }
+    if (metas->meta[op]->inference_debugging &&
+        !(fused->op_op_type[op] == OP_ALLREDUCE ||
+          fused->op_op_type[op] == OP_PARALLEL_IDENTITY ||
+          fused->op_op_type[op] == OP_REPLICATE ||
+          fused->op_op_type[op] == OP_REPARTITION ||
+          fused->op_op_type[op] == OP_COMBINE)) {
+      std::vector<GenericTensorAccessorR> input_accessors_to_save;
+      std::vector<GenericTensorAccessorR> weight_accessors_to_save;
+      std::vector<GenericTensorAccessorR> output_accessors_to_save;
+      for (int i = 0; i < fused->op_num_inputs[op]; i++) {
+        input_accessors_to_save.push_back(my_input_grad_accessor[i]);
+      }
+      for (int i = 0; i < fused->op_num_weights[op]; i++) {
+        weight_accessors_to_save.push_back(my_weight_accessor[i]);
+      }
+      for (int i = 0; i < fused->op_num_outputs[op]; i++) {
+        output_accessors_to_save.push_back(my_output_grad_accessor[i]);
+      }
+      assert(task->index_point.get_dim() == 1);
+      int shard_id = task->index_point.point_data[0];
+      FusedOp::save_inference_tensors_to_file(metas->meta[op],
+                                              shard_id,
+                                              bc,
+                                              input_accessors_to_save,
+                                              weight_accessors_to_save,
+                                              output_accessors_to_save,
+                                              false);
+    }
+  }
+}
+
+/*
+  regions[...](I): inputs
+  regions[...](I): weights
+  regions[...](O): outputs
+*/
+__host__ void FusedOp::forward_task(Task const *task,
+                                    std::vector<PhysicalRegion> const &regions,
+                                    Context ctx,
+                                    Runtime *runtime) {
+  // const FusedOp* fused = (FusedOp*) task->args;
+  FusedOpMeta const *metas = *((FusedOpMeta **)task->local_args);
+  FusedOp const *fused = metas->fused_op;
   assert(metas->numOperators == fused->numOperators);
   assert(regions.size() == task->regions.size());
   assert((int)regions.size() ==
@@ -582,11 +1268,6 @@ __host__ void
     }
   }
 
-  hipStream_t stream;
-  if (start < fused->numOperators) {
-    checkCUDA(get_legion_stream(&stream));
-  }
-
   int ioff = 0, woff = 0, ooff = 0;
   for (int op = 0; op < fused->numOperators; op++) {
     GenericTensorAccessorR my_input_accessor[MAX_NUM_INPUTS];
@@ -595,8 +1276,10 @@ __host__ void
     for (int i = 0; i < fused->op_num_inputs[op]; i++) {
       int my_off = fused->op_input_idx[i + ioff];
       if (fused->op_input_source[i + ioff] == SOURCE_INPUT) {
+        assert(my_off < fused->numInputs);
         my_input_accessor[i] = input_accessor[my_off];
       } else if (fused->op_input_source[i + ioff] == SOURCE_OUTPUT) {
+        assert(my_off < fused->numOutputs);
         my_input_accessor[i] = output_accessor[my_off];
       } else {
         assert(false);
@@ -604,11 +1287,14 @@ __host__ void
     }
     for (int i = 0; i < fused->op_num_weights[op]; i++) {
       assert(fused->op_weight_source[i + woff] == SOURCE_WEIGHT);
+      assert(fused->op_weight_idx[i + woff] < fused->numWeights);
       my_weight_accessor[i] = weight_accessor[fused->op_weight_idx[i + woff]];
     }
     for (int i = 0; i < fused->op_num_outputs[op]; i++) {
+      int my_off = fused->op_output_idx[i + ooff];
       assert(fused->op_output_source[i + ooff] == SOURCE_OUTPUT);
-      my_output_accessor[i] = output_accessor[i + ooff];
+      assert(my_off < fused->numOutputs);
+      my_output_accessor[i] = output_accessor[my_off];
     }
     switch (fused->op_op_type[op]) {
       case OP_CONCAT: {
@@ -623,6 +1309,21 @@ __host__ void
                                                 m->legion_axis);
         break;
       }
+      case OP_CONV2D: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_accessor[0].domain.get_dim() == 5);
+        assert(my_weight_accessor[0].domain.get_dim() == 5);
+        assert(my_output_accessor[0].domain.get_dim() == 5);
+        Conv2DMeta *m = (Conv2DMeta *)metas->meta[op];
+        Kernels::Conv2D::forward_kernel_wrapper(
+            m,
+            my_input_accessor[0].get_float_ptr(),
+            my_output_accessor[0].get_float_ptr(),
+            my_weight_accessor[0].get_float_ptr(),
+            my_weight_accessor[1].get_float_ptr());
+        break;
+      }
       case OP_BATCHNORM: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
@@ -638,6 +1339,16 @@ __host__ void
                                   my_weight_accessor[1].get_float_ptr());
         break;
       }
+      case OP_DROPOUT: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        DropoutMeta *m = (DropoutMeta *)metas->meta[op];
+        Kernels::Dropout::forward_kernel_wrapper(
+            m,
+            my_input_accessor[0].get_float_ptr(),
+            my_output_accessor[0].get_float_ptr());
+        break;
+      }
       case OP_LINEAR: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
@@ -648,27 +1359,25 @@ __host__ void
         assert(my_output_accessor[0].domain.get_volume() ==
                out_dim * batch_size);
         assert(my_input_accessor[0].domain.get_volume() == in_dim * batch_size);
-        void const *bias_ptr = nullptr;
+        float const *bias_ptr = nullptr;
         LinearMeta *m = (LinearMeta *)metas->meta[op];
         if (fused->op_num_weights[op] == 2) {
           assert(my_weight_accessor[1].domain.get_volume() == out_dim);
           if (!m->add_bias_only_once || task->index_point.point_data[0] == 0) {
-            bias_ptr = my_weight_accessor[1].ptr;
+            bias_ptr = my_weight_accessor[1].get_float_ptr();
           }
         } else {
           assert(fused->op_num_weights[op] == 1);
         }
-        assert(m->input_type[0] == my_input_accessor[0].data_type);
-        assert(m->input_type[0] == my_output_accessor[0].data_type);
-        batch_size = bc->num_active_tokens();
-        Kernels::Linear::forward_kernel_wrapper(m,
-                                                my_input_accessor[0].ptr,
-                                                my_output_accessor[0].ptr,
-                                                my_weight_accessor[0].ptr,
-                                                bias_ptr,
-                                                in_dim,
-                                                out_dim,
-                                                batch_size);
+        Kernels::Linear::forward_kernel_wrapper(
+            m,
+            my_input_accessor[0].get_float_ptr(),
+            my_output_accessor[0].get_float_ptr(),
+            my_weight_accessor[0].get_float_ptr(),
+            bias_ptr,
+            in_dim,
+            out_dim,
+            batch_size);
         break;
       }
       case OP_BATCHMATMUL: {
@@ -796,124 +1505,78 @@ __host__ void
       case OP_RELU:
       case OP_SIGMOID:
       case OP_TANH:
-      case OP_ELU:
-      case OP_SCALAR_TRUE_DIV: {
+      case OP_ELU: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_weights[op] == 0);
         assert(fused->op_num_outputs[op] == 1);
         assert(my_input_accessor[0].domain == my_output_accessor[0].domain);
         ElementUnaryMeta *m = (ElementUnaryMeta *)metas->meta[op];
-        if (m->data_type == DT_HALF) {
-          ElementUnary::forward_kernel_wrapper(
-              m,
-              my_input_accessor[0].get_half_ptr(),
-              my_output_accessor[0].get_half_ptr(),
-              my_input_accessor[0].domain.get_volume());
-        } else if (m->data_type == DT_FLOAT) {
-          ElementUnary::forward_kernel_wrapper(
-              m,
-              my_input_accessor[0].get_float_ptr(),
-              my_output_accessor[0].get_float_ptr(),
-              my_input_accessor[0].domain.get_volume());
-        } else {
-          assert(false && "Unsupported data type in ElementUnary forward");
-        }
+        ElementUnary::forward_kernel_wrapper(
+            m,
+            my_input_accessor[0].get_float_ptr(),
+            my_output_accessor[0].get_float_ptr(),
+            my_input_accessor[0].domain.get_volume());
         break;
       }
-      case OP_RMS_NORM: {
+      case OP_POOL2D: {
         assert(fused->op_num_inputs[op] == 1);
-        assert(fused->op_num_weights[op] == 1);
+        assert(fused->op_num_weights[op] == 0);
         assert(fused->op_num_outputs[op] == 1);
-        RMSNormMeta const *m = (RMSNormMeta *)metas->meta[op];
-        Kernels::RMSNorm::forward_kernel_wrapper(m,
-                                                 my_input_accessor[0],
-                                                 my_weight_accessor[0],
-                                                 my_output_accessor[0]);
+        Pool2DMeta *m = (Pool2DMeta *)metas->meta[op];
+        Kernels::Pool2D::forward_kernel_wrapper(
+            m,
+            my_input_accessor[0].get_float_ptr(),
+            my_output_accessor[0].get_float_ptr());
         break;
       }
-      case OP_RESIDUAL_RMS_NORM: {
-        assert(fused->op_num_inputs[op] == 2);
-        assert(fused->op_num_weights[op] == 1);
-        assert(fused->op_num_outputs[op] == 2);
-        ResidualRMSNormMeta const *m = (ResidualRMSNormMeta *)metas->meta[op];
-        Kernels::ResidualRMSNorm::forward_kernel_wrapper(m,
-                                                         my_input_accessor[0],
-                                                         my_input_accessor[1],
-                                                         my_weight_accessor[0],
-                                                         my_output_accessor[0],
-                                                         my_output_accessor[1]);
+      case OP_FLAT: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_accessor[0].domain.get_volume() ==
+               my_output_accessor[0].domain.get_volume());
+        Kernels::Flat::forward_kernel_wrapper(
+            my_input_accessor[0].get_float_ptr(),
+            my_output_accessor[0].get_float_ptr(),
+            my_input_accessor[0].domain.get_volume());
         break;
       }
-      case OP_INC_MULTIHEAD_SELF_ATTENTION: {
+      case OP_SOFTMAX: {
         assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 0);
         assert(fused->op_num_outputs[op] == 1);
-        IncMultiHeadSelfAttentionMeta const *m =
-            (IncMultiHeadSelfAttentionMeta *)metas->meta[op];
-        assert(fused->op_num_weights[op] ==
-               (1 + (int)(*m->qkv_bias || *m->final_bias)));
-        GenericTensorAccessorR biases;
-        if (*m->qkv_bias || *m->final_bias) {
-          assert(fused->op_num_weights[op] == 2);
-          biases = my_weight_accessor[1];
-        }
-        IncMultiHeadSelfAttention::inference_kernel_wrapper(
-            m,
-            bc,
-            task->index_point.point_data[0],
-            my_input_accessor[0],
-            my_weight_accessor[0],
-            my_output_accessor[0],
-            biases);
+        assert(my_input_accessor[0].domain.get_volume() ==
+               my_output_accessor[0].domain.get_volume());
+        SoftmaxMeta *m = (SoftmaxMeta *)metas->meta[op];
+        Kernels::Softmax::forward_kernel_wrapper(
+            m, my_input_accessor[0], my_output_accessor[0]);
         break;
       }
-      case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION: {
+      case OP_RESHAPE: {
         assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 0);
         assert(fused->op_num_outputs[op] == 1);
-        TreeIncMultiHeadSelfAttentionMeta *m =
-            (TreeIncMultiHeadSelfAttentionMeta *)metas->meta[op];
-        TreeVerifyBatchConfig const &tree_bc =
-            Future(task->futures[0]).get_result<TreeVerifyBatchConfig>();
-        assert(fused->op_num_weights[op] ==
-               (1 + (int)(*m->qkv_bias || *m->final_bias)));
-        GenericTensorAccessorR biases;
-        if (*m->qkv_bias || *m->final_bias) {
-          assert(fused->op_num_weights[op] == 2);
-          biases = my_weight_accessor[1];
-        }
-        TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
-            m,
-            &tree_bc,
-            task->index_point.point_data[0],
-            my_input_accessor[0],
-            my_weight_accessor[0],
-            my_output_accessor[0],
-            biases);
+        assert(my_input_accessor[0].domain.get_volume() ==
+               my_output_accessor[0].domain.get_volume());
+        Kernels::Reshape::forward_kernel_wrapper(
+            my_input_accessor[0].get_float_ptr(),
+            my_output_accessor[0].get_float_ptr(),
+            my_input_accessor[0].domain.get_volume());
         break;
       }
-      case OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION: {
+      case OP_TRANSPOSE: {
         assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 0);
         assert(fused->op_num_outputs[op] == 1);
-        SpecIncMultiHeadSelfAttentionMeta const *m =
-            (SpecIncMultiHeadSelfAttentionMeta *)metas->meta[op];
-        // BeamSearchBatchConfig const *beam_bc =
-        //     (BeamSearchBatchConfig *)task->args;
-        BeamSearchBatchConfig const &beam_bc =
-            Future(task->futures[0]).get_result<BeamSearchBatchConfig>();
-        assert(fused->op_num_weights[op] ==
-               (1 + (int)(*m->qkv_bias || *m->final_bias)));
-        GenericTensorAccessorR biases;
-        if (*m->qkv_bias || *m->final_bias) {
-          assert(fused->op_num_weights[op] == 2);
-          biases = my_weight_accessor[1];
-        }
-        SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
+        assert(my_input_accessor[0].domain.get_volume() ==
+               my_output_accessor[0].domain.get_volume());
+        TransposeMeta *m = (TransposeMeta *)metas->meta[op];
+        Kernels::Transpose::forward_kernel_wrapper(
             m,
-            &beam_bc,
-            task->index_point.point_data[0],
-            my_input_accessor[0],
-            my_weight_accessor[0],
-            my_output_accessor[0],
-            biases);
+            my_input_accessor[0].get_float_ptr(),
+            my_output_accessor[0].get_float_ptr(),
+            my_input_accessor[0].domain,
+            my_output_accessor[0].domain);
         break;
       }
       case OP_LAYERNORM: {
@@ -935,119 +1598,23 @@ __host__ void
         break;
       }
       case OP_RESIDUAL_LAYERNORM: {
-        assert(fused->op_num_outputs[op] == 2);
-        ResidualLayerNormMeta const *m =
-            (ResidualLayerNormMeta *)metas->meta[op];
-        if (m->use_two_residuals) {
-          assert(fused->op_num_inputs[op] == 3);
-        } else {
-          assert(fused->op_num_inputs[op] == 2);
-        }
-        if (!m->elementwise_affine) {
-          assert(fused->op_num_weights[op] == 0);
-        } else {
-          if (!m->use_bias) {
-            assert(fused->op_num_weights[op] == 1); // weight
-          } else {
-            assert(fused->op_num_weights[op] == 2); // weight + bias
-          }
-        }
-        GenericTensorAccessorR residual2;
-        if (m->use_two_residuals) {
-          residual2 = my_input_accessor[2];
-        }
-        GenericTensorAccessorR gamma, beta;
-        if (m->elementwise_affine) {
-          gamma = my_weight_accessor[0];
-          if (m->use_bias) {
-            beta = my_weight_accessor[1];
-          }
-        }
-        ResidualLayerNorm::inference_kernel_wrapper(m,
-                                                    my_input_accessor[0],
-                                                    my_input_accessor[1],
-                                                    residual2,
-                                                    my_output_accessor[0],
-                                                    my_output_accessor[1],
-                                                    gamma,
-                                                    beta);
+        assert(false && "Operator ResidualLayerNorm does not support "
+                        "the forward() task");
         break;
       }
       case OP_ADD_BIAS_RESIDUAL_LAYERNORM: {
-        assert(fused->op_num_inputs[op] == 2);
-        assert(fused->op_num_outputs[op] == 2);
-        AddBiasResidualLayerNormMeta const *m =
-            (AddBiasResidualLayerNormMeta *)metas->meta[op];
-        if (!m->elementwise_affine) {
-          assert(fused->op_num_weights[op] == 1); // attn bias
-        } else {
-          if (!m->use_bias) {
-            assert(fused->op_num_weights[op] == 2); // attn bias + weight
-          } else {
-            assert(fused->op_num_weights[op] == 3); // attn bias + weight + bias
-          }
-        }
-        GenericTensorAccessorR gamma, beta;
-        if (m->elementwise_affine) {
-          gamma = my_weight_accessor[1];
-          if (m->use_bias) {
-            beta = my_weight_accessor[2];
-          }
-        }
-        Domain attn_bias_domain = my_weight_accessor[0].domain;
-        Domain residual_domain = my_input_accessor[1].domain;
-        int attn_bias_dim =
-            attn_bias_domain.hi()[0] - attn_bias_domain.lo()[0] + 1;
-        int residual_volume = residual_domain.get_volume();
-        AddBiasResidualLayerNorm::inference_kernel_wrapper(
-            m,
-            attn_bias_dim,
-            residual_volume,
-            my_input_accessor[0],
-            my_output_accessor[0],
-            my_output_accessor[1],
-            my_input_accessor[1],
-            my_weight_accessor[0],
-            gamma,
-            beta);
+        assert(false && "Operator AddBiasResidualLayerNorm does not support "
+                        "the forward() task");
         break;
       }
       case OP_SIGMOID_SILU_MULTI: {
-        assert(fused->op_num_inputs[op] == 2);
-        assert(fused->op_num_outputs[op] == 1);
-        SigmoidSiluMultiMeta const *m = (SigmoidSiluMultiMeta *)metas->meta[op];
-        SigmoidSiluMulti::inference_kernel_wrapper(m,
-                                                   my_input_accessor[0],
-                                                   my_input_accessor[1],
-                                                   my_output_accessor[0]);
-        break;
-      }
-      case OP_SOFTMAX: {
-        assert(fused->op_num_inputs[op] == 1);
-        assert(fused->op_num_weights[op] == 0);
-        assert(fused->op_num_outputs[op] == 1);
-        assert(my_input_accessor[0].domain.get_volume() ==
-               my_output_accessor[0].domain.get_volume());
-        SoftmaxMeta *m = (SoftmaxMeta *)metas->meta[op];
-        if (m->input_type == DT_HALF) {
-          Kernels::Softmax::forward_kernel_wrapper(
-              m,
-              my_input_accessor[0].get_half_ptr(),
-              my_output_accessor[0].get_half_ptr());
-        } else if (m->input_type == DT_FLOAT) {
-          Kernels::Softmax::forward_kernel_wrapper(
-              m,
-              my_input_accessor[0].get_float_ptr(),
-              my_output_accessor[0].get_float_ptr());
-        }
+        assert(false && "Operator SigmoidSiluMulti does not support "
+                        "the forward() task");
         break;
       }
-      case OP_ALLREDUCE: {
-        assert(fused->op_num_inputs[op] == 1);
-        assert(fused->op_num_outputs[op] == 1);
-        AllReduceMeta const *m = (AllReduceMeta *)metas->meta[op];
-        Kernels::AllReduce::inference_kernel_wrapper(
-            m, bc, my_input_accessor[0], my_output_accessor[0]);
+      case OP_RESIDUAL_RMS_NORM: {
+        assert(false && "Operator ResidualRMSNorm does not support "
+                        "the forward() task");
         break;
       }
       default: {
@@ -1176,9 +1743,6 @@ __host__ void FusedOp::backward_task(Task const *task,
     }
   }
 
-  hipStream_t stream;
-  checkCUDA(get_legion_stream(&stream));
-
   int ioff = 0, woff = 0, ooff = 0;
   GenericTensorAccessorR my_input_accessor[MAX_NUM_INPUTS];
   GenericTensorAccessorR my_weight_accessor[MAX_NUM_WEIGHTS];
@@ -1202,6 +1766,7 @@ __host__ void FusedOp::backward_task(Task const *task,
       if (fused->op_input_source[i + ioff] == SOURCE_INPUT) {
         my_input_accessor[i] = input_accessor[my_off];
         my_input_grad_accessor[i] = input_grad_accessor[my_off];
+        assert(my_input_grad_accessor[i].domain == my_input_accessor[i].domain);
       } else if (fused->op_input_source[i + ioff] == SOURCE_OUTPUT) {
         my_input_accessor[i] = output_accessor[my_off];
         my_input_grad_accessor[i] = output_grad_accessor[my_off];
@@ -1220,9 +1785,9 @@ __host__ void FusedOp::backward_task(Task const *task,
     }
     for (int i = 0; i < fused->op_num_outputs[op]; i++) {
       assert(fused->op_output_source[i + ooff] == SOURCE_OUTPUT);
-      my_output_accessor[i] = output_accessor[fused->op_output_idx[i + ooff]];
-      my_output_grad_accessor[i] =
-          output_grad_accessor[fused->op_output_idx[i + ooff]];
+      int my_off = fused->op_output_idx[i + ooff];
+      my_output_accessor[i] = output_accessor[my_off];
+      my_output_grad_accessor[i] = output_grad_accessor[my_off];
       assert(my_output_grad_accessor[i].domain == my_output_accessor[i].domain);
     }
     switch (fused->op_op_type[op]) {
diff --git a/src/ops/fused.cu b/src/ops/fused.cu
index 483028599e..cab28181da 100644
--- a/src/ops/fused.cu
+++ b/src/ops/fused.cu
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/accessor.h"
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/model.h"
 #include "flexflow/ops/add_bias_residual_layer_norm.h"
 #include "flexflow/ops/batch_norm.h"
@@ -30,6 +31,7 @@
 #include "flexflow/ops/kernels/embedding_kernels.h"
 #include "flexflow/ops/kernels/flat_kernels.h"
 #include "flexflow/ops/kernels/linear_kernels.h"
+#include "flexflow/ops/kernels/lora_linear_kernels.h"
 #include "flexflow/ops/kernels/pool_2d_kernels.h"
 #include "flexflow/ops/kernels/reshape_kernels.h"
 #include "flexflow/ops/kernels/residual_rms_norm_kernels.h"
@@ -42,6 +44,7 @@
 #include "flexflow/ops/spec_inc_multihead_self_attention.h"
 #include "flexflow/ops/tree_inc_multihead_self_attention.h"
 #include "flexflow/parallel_ops/kernels/allreduce_kernels.h"
+#include "flexflow/parallel_ops/kernels/parallel_identity_kernels.h"
 #include "flexflow/utils/cuda_helper.h"
 
 namespace FlexFlow {
@@ -77,27 +80,32 @@ OpMeta *FusedOp::init_task(Task const *task,
   regions[...](I): weights
   regions[...](O): outputs
 */
-__host__ void FusedOp::forward_task(Task const *task,
-                                    std::vector<PhysicalRegion> const &regions,
-                                    Context ctx,
-                                    Runtime *runtime) {
+__host__ void
+    FusedOp::inference_task(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
   // const FusedOp* fused = (FusedOp*) task->args;
   FusedOpMeta const *metas = *((FusedOpMeta **)task->local_args);
   FusedOp const *fused = metas->fused_op;
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  // Return if no active tokens
+  if (bc->num_tokens == 0) {
+    return;
+  }
+
   assert(metas->numOperators == fused->numOperators);
   assert(regions.size() == task->regions.size());
-  assert((int)regions.size() ==
-         fused->numInputs + fused->numWeights + fused->numOutputs);
-  // Domain input_domain[MAX_NUM_INPUTS];
-  // Domain weight_domain[MAX_NUM_WEIGHTS];
-  // Domain output_domain[MAX_NUM_OUTPUTS];
+  bool softmax_grad_additional_region =
+      (fused->op_op_type[fused->numOperators - 1] == OP_SOFTMAX);
+  assert((int)regions.size() == fused->numInputs + fused->numWeights +
+                                    fused->numOutputs +
+                                    softmax_grad_additional_region);
   GenericTensorAccessorR input_accessor[MAX_NUM_INPUTS];
   GenericTensorAccessorR weight_accessor[MAX_NUM_WEIGHTS];
   GenericTensorAccessorW output_accessor[MAX_NUM_OUTPUTS];
   assert(fused->numInputs <= MAX_NUM_INPUTS);
   for (int i = 0; i < fused->numInputs; i++) {
-    // input_domain[i] = runtime->get_index_space_domain(
-    //     ctx, task->regions[i].region.get_index_space());
     input_accessor[i] =
         helperGetGenericTensorAccessorRO(fused->input_data_types[i],
                                          regions[i],
@@ -109,8 +117,6 @@ __host__ void FusedOp::forward_task(Task const *task,
   int roff = fused->numInputs;
   assert(fused->numWeights <= MAX_NUM_WEIGHTS);
   for (int i = 0; i < fused->numWeights; i++) {
-    // weight_domain[i] = runtime->get_index_space_domain(
-    //     ctx, task->regions[i + roff].region.get_index_space());
     weight_accessor[i] =
         helperGetGenericTensorAccessorRO(fused->weight_data_types[i],
                                          regions[i + roff],
@@ -122,8 +128,6 @@ __host__ void FusedOp::forward_task(Task const *task,
   roff += fused->numWeights;
   assert(fused->numOutputs <= MAX_NUM_OUTPUTS);
   for (int i = 0; i < fused->numOutputs; i++) {
-    // output_domain[i] = runtime->get_index_space_domain(
-    //     ctx, task->regions[i + roff].region.get_index_space());
     output_accessor[i] =
         helperGetGenericTensorAccessorWO(fused->output_data_types[i],
                                          regions[i + roff],
@@ -132,6 +136,7 @@ __host__ void FusedOp::forward_task(Task const *task,
                                          ctx,
                                          runtime);
   }
+  roff += fused->numOutputs;
   // Assert that all meta share the same dnn/blas handler
   int start = 0;
   for (start = 0; start < fused->numOperators; start++) {
@@ -148,36 +153,39 @@ __host__ void FusedOp::forward_task(Task const *task,
 
   int ioff = 0, woff = 0, ooff = 0;
   for (int op = 0; op < fused->numOperators; op++) {
-    // Domain my_id[MAX_NUM_INPUTS];
-    // Domain my_wd[MAX_NUM_WEIGHTS];
-    // Domain my_od[MAX_NUM_OUTPUTS];
+#if 0
+    std::cout << get_operator_type_name(fused->op_op_type[op]) << std::endl;
+#endif
     GenericTensorAccessorR my_input_accessor[MAX_NUM_INPUTS];
     GenericTensorAccessorR my_weight_accessor[MAX_NUM_WEIGHTS];
     GenericTensorAccessorW my_output_accessor[MAX_NUM_OUTPUTS];
     for (int i = 0; i < fused->op_num_inputs[op]; i++) {
       int my_off = fused->op_input_idx[i + ioff];
       if (fused->op_input_source[i + ioff] == SOURCE_INPUT) {
-        // my_id[i] = input_domain[my_off];
         my_input_accessor[i] = input_accessor[my_off];
+#if 0
+        printf("\tmy_input_accessor[%i] = input_accessor[%i]\n", i, my_off);
+#endif
       } else if (fused->op_input_source[i + ioff] == SOURCE_OUTPUT) {
-        // my_id[i] = output_domain[my_off];
         my_input_accessor[i] = output_accessor[my_off];
+#if 0
+        printf("\tmy_input_accessor[%i] = output_accessor[%i]\n", i, my_off);
+#endif
       } else {
         assert(false);
       }
     }
     for (int i = 0; i < fused->op_num_weights[op]; i++) {
       assert(fused->op_weight_source[i + woff] == SOURCE_WEIGHT);
-      // my_wd[i] = weight_domain[fused->op_weight_idx[i + woff]];
-      // my_wp[i] = weight_ptr[fused->op_weight_idx[i + woff]];
       my_weight_accessor[i] = weight_accessor[fused->op_weight_idx[i + woff]];
     }
     for (int i = 0; i < fused->op_num_outputs[op]; i++) {
       int my_off = fused->op_output_idx[i + ooff];
       assert(fused->op_output_source[i + ooff] == SOURCE_OUTPUT);
-      // my_od[i] = output_domain[my_off];
-      // my_op[i] = output_ptr[my_off];
       my_output_accessor[i] = output_accessor[my_off];
+#if 0
+      printf("\tmy_output_accessor[%i] = output_accessor[%i]\n", i, my_off);
+#endif
     }
     switch (fused->op_op_type[op]) {
       case OP_CONCAT: {
@@ -192,21 +200,6 @@ __host__ void FusedOp::forward_task(Task const *task,
                                                 m->legion_axis);
         break;
       }
-      case OP_CONV2D: {
-        assert(fused->op_num_inputs[op] == 1);
-        assert(fused->op_num_outputs[op] == 1);
-        assert(my_input_accessor[0].domain.get_dim() == 5);
-        assert(my_weight_accessor[0].domain.get_dim() == 5);
-        assert(my_output_accessor[0].domain.get_dim() == 5);
-        Conv2DMeta *m = (Conv2DMeta *)metas->meta[op];
-        Kernels::Conv2D::forward_kernel_wrapper(
-            m,
-            my_input_accessor[0].get_float_ptr(),
-            my_output_accessor[0].get_float_ptr(),
-            my_weight_accessor[0].get_float_ptr(),
-            my_weight_accessor[1].get_float_ptr());
-        break;
-      }
       case OP_BATCHNORM: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
@@ -222,16 +215,6 @@ __host__ void FusedOp::forward_task(Task const *task,
                                   my_weight_accessor[1].get_float_ptr());
         break;
       }
-      case OP_DROPOUT: {
-        assert(fused->op_num_inputs[op] == 1);
-        assert(fused->op_num_outputs[op] == 1);
-        DropoutMeta *m = (DropoutMeta *)metas->meta[op];
-        Kernels::Dropout::forward_kernel_wrapper(
-            m,
-            my_input_accessor[0].get_float_ptr(),
-            my_output_accessor[0].get_float_ptr());
-        break;
-      }
       case OP_LINEAR: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
@@ -242,25 +225,48 @@ __host__ void FusedOp::forward_task(Task const *task,
         assert(my_output_accessor[0].domain.get_volume() ==
                out_dim * batch_size);
         assert(my_input_accessor[0].domain.get_volume() == in_dim * batch_size);
-        float const *bias_ptr = nullptr;
+        void const *bias_ptr = nullptr;
         LinearMeta *m = (LinearMeta *)metas->meta[op];
         if (fused->op_num_weights[op] == 2) {
           assert(my_weight_accessor[1].domain.get_volume() == out_dim);
           if (!m->add_bias_only_once || task->index_point.point_data[0] == 0) {
-            bias_ptr = my_weight_accessor[1].get_float_ptr();
+            bias_ptr = my_weight_accessor[1].ptr;
           }
         } else {
           assert(fused->op_num_weights[op] == 1);
         }
-        Kernels::Linear::forward_kernel_wrapper(
-            m,
-            my_input_accessor[0].get_float_ptr(),
-            my_output_accessor[0].get_float_ptr(),
-            my_weight_accessor[0].get_float_ptr(),
-            bias_ptr,
-            in_dim,
-            out_dim,
-            batch_size);
+        assert(m->input_type[0] == my_input_accessor[0].data_type);
+        assert(m->input_type[0] == my_output_accessor[0].data_type);
+        batch_size = bc->num_active_infr_tokens();
+        Kernels::Linear::forward_kernel_wrapper(m,
+                                                my_input_accessor[0].ptr,
+                                                my_output_accessor[0].ptr,
+                                                my_weight_accessor[0].ptr,
+                                                bias_ptr,
+                                                in_dim,
+                                                out_dim,
+                                                batch_size);
+        break;
+      }
+      case OP_LORA: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_outputs[op] == 1);
+        Domain input_domain = my_input_accessor[0].domain;
+        Domain output_domain = my_output_accessor[0].domain;
+        int in_dim = input_domain.hi()[0] - input_domain.lo()[0] + 1;
+        int out_dim = output_domain.hi()[0] - output_domain.lo()[0] + 1;
+        int batch_size = my_input_accessor[0].domain.get_volume() / in_dim;
+        assert(my_output_accessor[0].domain.get_volume() ==
+               out_dim * batch_size);
+        assert(my_input_accessor[0].domain.get_volume() == in_dim * batch_size);
+        LoraLinearMeta *m = (LoraLinearMeta *)metas->meta[op];
+        assert(m->input_type[0] == my_input_accessor[0].data_type);
+        assert(m->output_type[0] == my_output_accessor[0].data_type);
+        // Assert that the output and the second input are at the same place
+        // since we ``inplace'' the output for LoRA
+        assert(my_input_accessor[1].ptr == my_output_accessor[0].ptr);
+        Kernels::LoraLinear::inference_kernel_wrapper(
+            m, bc, my_input_accessor[0], my_output_accessor[0]);
         break;
       }
       case OP_BATCHMATMUL: {
@@ -388,88 +394,127 @@ __host__ void FusedOp::forward_task(Task const *task,
       case OP_RELU:
       case OP_SIGMOID:
       case OP_TANH:
-      case OP_ELU: {
+      case OP_ELU:
+      case OP_SCALAR_TRUE_DIV: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_weights[op] == 0);
         assert(fused->op_num_outputs[op] == 1);
         assert(my_input_accessor[0].domain == my_output_accessor[0].domain);
         ElementUnaryMeta *m = (ElementUnaryMeta *)metas->meta[op];
-        ElementUnary::forward_kernel_wrapper(
-            m,
-            my_input_accessor[0].get_float_ptr(),
-            my_output_accessor[0].get_float_ptr(),
-            my_input_accessor[0].domain.get_volume());
+        if (m->data_type == DT_HALF) {
+          ElementUnary::forward_kernel_wrapper(
+              m,
+              my_input_accessor[0].get_half_ptr(),
+              my_output_accessor[0].get_half_ptr(),
+              my_input_accessor[0].domain.get_volume());
+        } else if (m->data_type == DT_FLOAT) {
+          ElementUnary::forward_kernel_wrapper(
+              m,
+              my_input_accessor[0].get_float_ptr(),
+              my_output_accessor[0].get_float_ptr(),
+              my_input_accessor[0].domain.get_volume());
+        } else {
+          assert(false && "Unsupported data type in ElementUnary forward");
+        }
         break;
       }
-      case OP_POOL2D: {
+      case OP_RMS_NORM: {
         assert(fused->op_num_inputs[op] == 1);
-        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_weights[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
-        // assert(my_input_accessor[0].domain == my_output_accessor[0].domain);
-        Pool2DMeta *m = (Pool2DMeta *)metas->meta[op];
-        Kernels::Pool2D::forward_kernel_wrapper(
-            m,
-            my_input_accessor[0].get_float_ptr(),
-            my_output_accessor[0].get_float_ptr());
+        RMSNormMeta *m = (RMSNormMeta *)metas->meta[op];
+        Kernels::RMSNorm::inference_kernel_wrapper(m,
+                                                   bc,
+                                                   my_input_accessor[0],
+                                                   my_weight_accessor[0],
+                                                   my_output_accessor[0]);
         break;
       }
-      case OP_FLAT: {
-        assert(fused->op_num_inputs[op] == 1);
-        assert(fused->op_num_weights[op] == 0);
-        assert(fused->op_num_outputs[op] == 1);
-        assert(my_input_accessor[0].domain.get_volume() ==
-               my_output_accessor[0].domain.get_volume());
-        Kernels::Flat::forward_kernel_wrapper(
-            my_input_accessor[0].get_float_ptr(),
-            my_output_accessor[0].get_float_ptr(),
-            my_input_accessor[0].domain.get_volume());
+      case OP_RESIDUAL_RMS_NORM: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_weights[op] == 1);
+        assert(fused->op_num_outputs[op] == 2);
+        ResidualRMSNormMeta *m = (ResidualRMSNormMeta *)metas->meta[op];
+        Kernels::ResidualRMSNorm::inference_kernel_wrapper(
+            m,
+            bc,
+            my_input_accessor[0],
+            my_input_accessor[1],
+            my_weight_accessor[0],
+            my_output_accessor[0],
+            my_output_accessor[1]);
         break;
       }
-      case OP_SOFTMAX: {
+      case OP_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(fused->op_num_inputs[op] == 1);
-        assert(fused->op_num_weights[op] == 0);
         assert(fused->op_num_outputs[op] == 1);
-        assert(my_input_accessor[0].domain.get_volume() ==
-               my_output_accessor[0].domain.get_volume());
-        SoftmaxMeta *m = (SoftmaxMeta *)metas->meta[op];
-        if (m->input_type == DT_HALF) {
-          Kernels::Softmax::forward_kernel_wrapper(
-              m,
-              my_input_accessor[0].get_half_ptr(),
-              my_output_accessor[0].get_half_ptr());
-        } else if (m->input_type == DT_FLOAT) {
-          Kernels::Softmax::forward_kernel_wrapper(
-              m,
-              my_input_accessor[0].get_float_ptr(),
-              my_output_accessor[0].get_float_ptr());
+        IncMultiHeadSelfAttentionMeta *m =
+            (IncMultiHeadSelfAttentionMeta *)metas->meta[op];
+        assert(fused->op_num_weights[op] ==
+               (1 + (int)(*m->qkv_bias || *m->final_bias)));
+        GenericTensorAccessorR biases;
+        if (*m->qkv_bias || *m->final_bias) {
+          assert(fused->op_num_weights[op] == 2);
+          biases = my_weight_accessor[1];
         }
+        IncMultiHeadSelfAttention::inference_kernel_wrapper(
+            m,
+            bc,
+            task->index_point.point_data[0],
+            my_input_accessor[0],
+            my_weight_accessor[0],
+            my_output_accessor[0],
+            biases);
         break;
       }
-      case OP_RESHAPE: {
+      case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(fused->op_num_inputs[op] == 1);
-        assert(fused->op_num_weights[op] == 0);
         assert(fused->op_num_outputs[op] == 1);
-        assert(my_input_accessor[0].domain.get_volume() ==
-               my_output_accessor[0].domain.get_volume());
-        Kernels::Reshape::forward_kernel_wrapper(
-            my_input_accessor[0].get_float_ptr(),
-            my_output_accessor[0].get_float_ptr(),
-            my_input_accessor[0].domain.get_volume());
+        TreeIncMultiHeadSelfAttentionMeta *m =
+            (TreeIncMultiHeadSelfAttentionMeta *)metas->meta[op];
+        TreeVerifyBatchConfig const &tree_bc =
+            Future(task->futures[0]).get_result<TreeVerifyBatchConfig>();
+        assert(fused->op_num_weights[op] ==
+               (1 + (int)(*m->qkv_bias || *m->final_bias)));
+        GenericTensorAccessorR biases;
+        if (*m->qkv_bias || *m->final_bias) {
+          assert(fused->op_num_weights[op] == 2);
+          biases = my_weight_accessor[1];
+        }
+        TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
+            m,
+            &tree_bc,
+            task->index_point.point_data[0],
+            my_input_accessor[0],
+            my_weight_accessor[0],
+            my_output_accessor[0],
+            biases);
         break;
       }
-      case OP_TRANSPOSE: {
+      case OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION: {
         assert(fused->op_num_inputs[op] == 1);
-        assert(fused->op_num_weights[op] == 0);
         assert(fused->op_num_outputs[op] == 1);
-        assert(my_input_accessor[0].domain.get_volume() ==
-               my_output_accessor[0].domain.get_volume());
-        TransposeMeta *m = (TransposeMeta *)metas->meta[op];
-        Kernels::Transpose::forward_kernel_wrapper(
+        SpecIncMultiHeadSelfAttentionMeta const *m =
+            (SpecIncMultiHeadSelfAttentionMeta *)metas->meta[op];
+        // BeamSearchBatchConfig const *beam_bc =
+        //     (BeamSearchBatchConfig *)task->args;
+        BeamSearchBatchConfig const &beam_bc =
+            Future(task->futures[0]).get_result<BeamSearchBatchConfig>();
+        assert(fused->op_num_weights[op] ==
+               (1 + (int)(*m->qkv_bias || *m->final_bias)));
+        GenericTensorAccessorR biases;
+        if (*m->qkv_bias || *m->final_bias) {
+          assert(fused->op_num_weights[op] == 2);
+          biases = my_weight_accessor[1];
+        }
+        SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
             m,
-            my_input_accessor[0].get_float_ptr(),
-            my_output_accessor[0].get_float_ptr(),
-            my_input_accessor[0].domain,
-            my_output_accessor[0].domain);
+            &beam_bc,
+            task->index_point.point_data[0],
+            my_input_accessor[0],
+            my_weight_accessor[0],
+            my_output_accessor[0],
+            biases);
         break;
       }
       case OP_LAYERNORM: {
@@ -491,39 +536,694 @@ __host__ void FusedOp::forward_task(Task const *task,
         break;
       }
       case OP_RESIDUAL_LAYERNORM: {
-        assert(false && "Operator ResidualLayerNorm does not support "
-                        "the forward() task");
-        break;
-      }
-      case OP_ADD_BIAS_RESIDUAL_LAYERNORM: {
-        assert(false && "Operator AddBiasResidualLayerNorm does not support "
-                        "the forward() task");
-        break;
-      }
-      case OP_SIGMOID_SILU_MULTI: {
-        assert(false && "Operator SigmoidSiluMulti does not support "
-                        "the forward() task");
-        break;
-      }
-      case OP_RESIDUAL_RMS_NORM: {
-        assert(false && "Operator ResidualRMSNorm does not support "
-                        "the forward() task");
-        break;
-      }
-      default: {
-        fprintf(stderr,
-                "Fusion currently does not support type = %d\n",
-                fused->op_op_type[op]);
-        assert(false && "Fusion currently does not support type");
-      }
-    }
-    ioff += fused->op_num_inputs[op];
+        assert(fused->op_num_outputs[op] == 2);
+        ResidualLayerNormMeta *m = (ResidualLayerNormMeta *)metas->meta[op];
+        if (m->use_two_residuals) {
+          assert(fused->op_num_inputs[op] == 3);
+        } else {
+          assert(fused->op_num_inputs[op] == 2);
+        }
+        if (!m->elementwise_affine) {
+          assert(fused->op_num_weights[op] == 0);
+        } else {
+          if (!m->use_bias) {
+            assert(fused->op_num_weights[op] == 1); // weight
+          } else {
+            assert(fused->op_num_weights[op] == 2); // weight + bias
+          }
+        }
+        GenericTensorAccessorR residual2;
+        if (m->use_two_residuals) {
+          residual2 = my_input_accessor[2];
+        }
+        GenericTensorAccessorR gamma, beta;
+        if (m->elementwise_affine) {
+          gamma = my_weight_accessor[0];
+          if (m->use_bias) {
+            beta = my_weight_accessor[1];
+          }
+        }
+        ResidualLayerNorm::inference_kernel_wrapper(m,
+                                                    bc,
+                                                    my_input_accessor[0],
+                                                    my_input_accessor[1],
+                                                    residual2,
+                                                    my_output_accessor[0],
+                                                    my_output_accessor[1],
+                                                    gamma,
+                                                    beta);
+        break;
+      }
+      case OP_ADD_BIAS_RESIDUAL_LAYERNORM: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_outputs[op] == 2);
+        AddBiasResidualLayerNormMeta *m =
+            (AddBiasResidualLayerNormMeta *)metas->meta[op];
+        if (!m->elementwise_affine) {
+          assert(fused->op_num_weights[op] == 1); // attn bias
+        } else {
+          if (!m->use_bias) {
+            assert(fused->op_num_weights[op] == 2); // attn bias + weight
+          } else {
+            assert(fused->op_num_weights[op] == 3); // attn bias + weight + bias
+          }
+        }
+        GenericTensorAccessorR gamma, beta;
+        if (m->elementwise_affine) {
+          gamma = my_weight_accessor[1];
+          if (m->use_bias) {
+            beta = my_weight_accessor[2];
+          }
+        }
+        AddBiasResidualLayerNorm::inference_kernel_wrapper(
+            m,
+            bc,
+            my_input_accessor[0],
+            my_weight_accessor[0],
+            my_input_accessor[1],
+            my_output_accessor[0],
+            my_output_accessor[1],
+            gamma,
+            beta);
+        break;
+      }
+      case OP_SIGMOID_SILU_MULTI: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_outputs[op] == 1);
+        SigmoidSiluMultiMeta *m = (SigmoidSiluMultiMeta *)metas->meta[op];
+        SigmoidSiluMulti::inference_kernel_wrapper(m,
+                                                   bc,
+                                                   my_input_accessor[0],
+                                                   my_input_accessor[1],
+                                                   my_output_accessor[0]);
+        break;
+      }
+      case OP_SOFTMAX: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_accessor[0].domain.get_volume() ==
+               my_output_accessor[0].domain.get_volume());
+        if (op == fused->numOperators - 1) { // if this is the final operator
+          output_accessor[fused->numOutputs] = helperGetGenericTensorAccessorWO(
+              fused->output_data_types[fused->numOutputs - 1],
+              regions[roff],
+              task->regions[roff],
+              FID_DATA,
+              ctx,
+              runtime);
+        }
+        SoftmaxMeta *m = (SoftmaxMeta *)metas->meta[op];
+        Kernels::Softmax::inference_kernel_wrapper(
+            m,
+            bc,
+            (op == fused->numOperators - 1),
+            my_input_accessor[0],
+            my_output_accessor[0],
+            output_accessor[fused->numOutputs]);
+        break;
+      }
+      case OP_ALLREDUCE: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        AllReduceMeta const *m = (AllReduceMeta *)metas->meta[op];
+        Kernels::AllReduce::inference_kernel_wrapper(
+            m, bc, my_input_accessor[0], my_output_accessor[0]);
+        break;
+      }
+      case OP_PARALLEL_IDENTITY: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        ParallelIdentityMeta const *m = (ParallelIdentityMeta *)metas->meta[op];
+        Kernels::ParallelIdentity::inference_kernel_wrapper(
+            m, bc, my_input_accessor[0], my_output_accessor[0]);
+        break;
+      }
+      default: {
+        fprintf(stderr,
+                "Fusion currently does not support type = %d\n",
+                fused->op_op_type[op]);
+        assert(false && "Fusion currently does not support type");
+      }
+    }
+    if (metas->meta[op]->inference_debugging &&
+        !(fused->op_op_type[op] == OP_ALLREDUCE ||
+          fused->op_op_type[op] == OP_PARALLEL_IDENTITY ||
+          fused->op_op_type[op] == OP_REPLICATE ||
+          fused->op_op_type[op] == OP_REPARTITION ||
+          fused->op_op_type[op] == OP_COMBINE)) {
+      std::vector<GenericTensorAccessorR> input_accessors_to_save;
+      std::vector<GenericTensorAccessorR> weight_accessors_to_save;
+      std::vector<GenericTensorAccessorR> output_accessors_to_save;
+      for (int i = 0; i < fused->op_num_inputs[op]; i++) {
+        input_accessors_to_save.push_back(my_input_accessor[i]);
+      }
+      for (int i = 0; i < fused->op_num_weights[op]; i++) {
+        weight_accessors_to_save.push_back(my_weight_accessor[i]);
+      }
+      for (int i = 0; i < fused->op_num_outputs[op]; i++) {
+        output_accessors_to_save.push_back(my_output_accessor[i]);
+      }
+      assert(task->index_point.get_dim() == 1);
+      int shard_id = task->index_point.point_data[0];
+      FusedOp::save_inference_tensors_to_file(metas->meta[op],
+                                              shard_id,
+                                              bc,
+                                              input_accessors_to_save,
+                                              weight_accessors_to_save,
+                                              output_accessors_to_save);
+    }
+    ioff += fused->op_num_inputs[op];
     woff += fused->op_num_weights[op];
     ooff += fused->op_num_outputs[op];
   }
-  // for (int i = 0; i < fused->numOutputs; i++)
-  //   print_tensor<float>(output_ptr[i], output_domain[i].get_volume(),
-  //   "[Fused:forward:output]");
+  // for (int i = 0; i < fused->numOutputs; i++)
+  //   print_tensor<float>(output_ptr[i], output_domain[i].get_volume(),
+  //   "[Fused:forward:output]");
+}
+
+/*
+  regions[...](I): inputs
+  regions[...](I): weights
+  regions[...](O): outputs
+*/
+__host__ void FusedOp::peft_bwd_task(Task const *task,
+                                     std::vector<PhysicalRegion> const &regions,
+                                     Context ctx,
+                                     Runtime *runtime) {
+  // const FusedOp* fused = (FusedOp*) task->args;
+  FusedOpMeta *metas = *((FusedOpMeta **)task->local_args);
+  FusedOp const *fused = metas->fused_op;
+  // BatchConfig const *bc = (BatchConfig *)task->args;
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  // Return if no active PEFT bwd tokens
+  if (bc->num_active_peft_tokens() == 0) {
+    return;
+  }
+
+  assert(metas->numOperators == fused->numOperators);
+  assert(regions.size() == task->regions.size());
+  assert((int)regions.size() ==
+         fused->numInputs + fused->numWeights + fused->numOutputs);
+  // Domain input_domain[MAX_NUM_INPUTS];
+  // Domain weight_domain[MAX_NUM_WEIGHTS];
+  // Domain output_domain[MAX_NUM_OUTPUTS];
+  GenericTensorAccessorW input_grad_accessor[MAX_NUM_INPUTS];
+  GenericTensorAccessorR weight_accessor[MAX_NUM_WEIGHTS];
+  GenericTensorAccessorW output_grad_accessor[MAX_NUM_OUTPUTS];
+  assert(fused->numInputs <= MAX_NUM_INPUTS);
+  for (int i = 0; i < fused->numInputs; i++) {
+    // input_domain[i] = runtime->get_index_space_domain(
+    //     ctx, task->regions[i].region.get_index_space());
+    input_grad_accessor[i] =
+        helperGetGenericTensorAccessorRW(fused->input_data_types[i],
+                                         regions[i],
+                                         task->regions[i],
+                                         FID_DATA,
+                                         ctx,
+                                         runtime);
+  }
+  int roff = fused->numInputs;
+  assert(fused->numWeights <= MAX_NUM_WEIGHTS);
+  for (int i = 0; i < fused->numWeights; i++) {
+    // weight_domain[i] = runtime->get_index_space_domain(
+    //     ctx, task->regions[i + roff].region.get_index_space());
+    weight_accessor[i] =
+        helperGetGenericTensorAccessorRO(fused->weight_data_types[i],
+                                         regions[i + roff],
+                                         task->regions[i + roff],
+                                         FID_DATA,
+                                         ctx,
+                                         runtime);
+  }
+  roff += fused->numWeights;
+  assert(fused->numOutputs <= MAX_NUM_OUTPUTS);
+  for (int i = 0; i < fused->numOutputs; i++) {
+    // output_domain[i] = runtime->get_index_space_domain(
+    //     ctx, task->regions[i + roff].region.get_index_space());
+    output_grad_accessor[i] =
+        helperGetGenericTensorAccessorRW(fused->output_data_types[i],
+                                         regions[i + roff],
+                                         task->regions[i + roff],
+                                         FID_DATA,
+                                         ctx,
+                                         runtime);
+  }
+  // Assert that all meta share the same dnn/blas handler
+  int start = 0;
+  for (start = 0; start < fused->numOperators; start++) {
+    if (metas->meta[start] != NULL) {
+      break;
+    }
+  }
+  for (int op = start + 1; op < fused->numOperators; op++) {
+    if (metas->meta[op] != NULL) {
+      assert(metas->meta[start]->handle.blas == metas->meta[op]->handle.blas);
+      assert(metas->meta[start]->handle.dnn == metas->meta[op]->handle.dnn);
+    }
+  }
+
+  int ioff = 0, woff = 0, ooff = 0;
+  // Domain my_id[MAX_NUM_INPUTS];
+  // Domain my_wd[MAX_NUM_WEIGHTS];
+  // Domain my_od[MAX_NUM_OUTPUTS];
+  GenericTensorAccessorW my_input_grad_accessor[MAX_NUM_INPUTS];
+  GenericTensorAccessorR my_weight_accessor[MAX_NUM_WEIGHTS];
+  GenericTensorAccessorW my_output_grad_accessor[MAX_NUM_OUTPUTS];
+
+  // Do backpropagation in the reverse ordering
+  for (int op = 0; op < fused->numOperators; op++) {
+    ioff += fused->op_num_inputs[op];
+    woff += fused->op_num_weights[op];
+    ooff += fused->op_num_outputs[op];
+  }
+
+  for (int op = fused->numOperators - 1; op >= 0; op--) {
+#if 0
+    std::cout << get_operator_type_name(fused->op_op_type[op]) << std::endl;
+#endif
+    ioff -= fused->op_num_inputs[op];
+    woff -= fused->op_num_weights[op];
+    ooff -= fused->op_num_outputs[op];
+    for (int i = 0; i < fused->op_num_inputs[op]; i++) {
+      int my_off = fused->op_input_idx[i + ioff];
+      if (fused->op_input_source[i + ioff] == SOURCE_INPUT) {
+        // my_id[i] = input_domain[my_off];
+        my_input_grad_accessor[i] = input_grad_accessor[my_off];
+#if 0
+        printf("\tmy_input_grad_accessor[%i] = input_grad_accessor[%i]\n", i, my_off);
+#endif
+      } else if (fused->op_input_source[i + ioff] == SOURCE_OUTPUT) {
+        // my_id[i] = output_domain[my_off];
+        my_input_grad_accessor[i] = output_grad_accessor[my_off];
+#if 0
+        printf("\tmy_input_grad_accessor[%i] = output_grad_accessor[%i]\n", i, my_off);
+#endif
+      } else {
+        assert(false);
+      }
+    }
+    for (int i = 0; i < fused->op_num_weights[op]; i++) {
+      assert(fused->op_weight_source[i + woff] == SOURCE_WEIGHT);
+      // my_wd[i] = weight_domain[fused->op_weight_idx[i + woff]];
+      // my_wp[i] = weight_ptr[fused->op_weight_idx[i + woff]];
+      my_weight_accessor[i] = weight_accessor[fused->op_weight_idx[i + woff]];
+    }
+    for (int i = 0; i < fused->op_num_outputs[op]; i++) {
+      int my_off = fused->op_output_idx[i + ooff];
+      assert(fused->op_output_source[i + ooff] == SOURCE_OUTPUT);
+      // my_od[i] = output_domain[fused->op_output_idx[i + ooff]];
+      // my_op[i] = output_ptr[fused->op_output_idx[i + ooff]];
+      my_output_grad_accessor[i] = output_grad_accessor[my_off];
+#if 0
+      printf("\tmy_output_grad_accessor[%i] = output_grad_accessor[%i]\n", i, my_off);
+#endif
+    }
+    switch (fused->op_op_type[op]) {
+      case OP_CONCAT: {
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        // TODO: implement this
+        assert(false);
+        // ConcatMeta *m = (ConcatMeta *)metas->meta[op];
+        // int num_inputs = fused->op_num_inputs[op];
+        // Kernels::Concat::peft_bwd_kernel_wrapper(m,
+        //                                          my_output_accessor[0],
+        //                                          my_input_accessor,
+        //                                         num_inputs,
+        //                                          m->legion_axis);
+        break;
+      }
+      case OP_BATCHNORM: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_grad_accessor[0].domain.get_dim() == 5);
+        assert(my_output_grad_accessor[0].domain.get_dim() == 5);
+        assert(my_weight_accessor[0].domain.get_dim() == 2);
+        assert(my_weight_accessor[1].domain.get_dim() == 2);
+        // TODO: implement this
+        assert(false);
+        // BatchNormMeta *m = (BatchNormMeta *)metas->meta[op];
+        // BatchNorm::peft_bwd_kernel_kernel(
+        //     m,
+        //     my_input_accessor[0].get_float_ptr(),
+        //     my_output_accessor[0].get_float_ptr(),
+        //     my_weight_accessor[0].get_float_ptr(),
+        //     my_weight_accessor[1].get_float_ptr());
+        break;
+      }
+      case OP_LINEAR: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        Domain kernel_domain = my_weight_accessor[0].domain;
+        int in_dim = kernel_domain.hi()[0] - kernel_domain.lo()[0] + 1;
+        int out_dim = kernel_domain.hi()[1] - kernel_domain.lo()[1] + 1;
+        int batch_size = my_input_grad_accessor[0].domain.get_volume() / in_dim;
+        assert(my_output_grad_accessor[0].domain.get_volume() ==
+               out_dim * batch_size);
+        assert(my_input_grad_accessor[0].domain.get_volume() ==
+               in_dim * batch_size);
+        LinearMeta *m = (LinearMeta *)metas->meta[op];
+        assert(m->input_type[0] == my_input_grad_accessor[0].data_type);
+        assert(m->input_type[0] == my_output_grad_accessor[0].data_type);
+        int num_infr_tokens = bc->num_active_infr_tokens();
+        int num_peft_tokens = bc->num_active_peft_tokens();
+        Kernels::Linear::peft_bwd_kernel_wrapper(m,
+                                                 my_input_grad_accessor[0].ptr,
+                                                 my_output_grad_accessor[0].ptr,
+                                                 my_weight_accessor[0].ptr,
+                                                 in_dim,
+                                                 out_dim,
+                                                 num_infr_tokens,
+                                                 num_peft_tokens);
+        break;
+      }
+      case OP_LORA: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_outputs[op] == 1);
+        Domain input_domain = my_input_grad_accessor[0].domain;
+        Domain output_domain = my_output_grad_accessor[0].domain;
+        int in_dim = input_domain.hi()[0] - input_domain.lo()[0] + 1;
+        int out_dim = output_domain.hi()[0] - output_domain.lo()[0] + 1;
+        int batch_size = my_input_grad_accessor[0].domain.get_volume() / in_dim;
+        assert(my_output_grad_accessor[0].domain.get_volume() ==
+               out_dim * batch_size);
+        assert(my_input_grad_accessor[0].domain.get_volume() ==
+               in_dim * batch_size);
+        LoraLinearMeta *m = (LoraLinearMeta *)metas->meta[op];
+        assert(m->input_type[0] == my_input_grad_accessor[0].data_type);
+        assert(m->output_type[0] == my_output_grad_accessor[0].data_type);
+        // Assert that the output and the second input are at the same place
+        // since we ``inplace'' the output for LoRA
+        assert(my_input_grad_accessor[1].ptr == my_output_grad_accessor[0].ptr);
+        Kernels::LoraLinear::peft_bwd_kernel_wrapper(
+            m, bc, my_input_grad_accessor[0], my_output_grad_accessor[0]);
+        break;
+      }
+      case OP_BATCHMATMUL: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        Domain out_domain = my_output_grad_accessor[0].domain;
+        Domain a_domain = my_input_grad_accessor[0].domain;
+        Domain b_domain = my_input_grad_accessor[1].domain;
+        int m = b_domain.hi()[0] - b_domain.lo()[0] + 1;
+        assert(m == out_domain.hi()[0] - out_domain.lo()[0] + 1);
+        int n = a_domain.hi()[1] - a_domain.lo()[1] + 1;
+        assert(n == out_domain.hi()[1] - out_domain.lo()[1] + 1);
+        int k = a_domain.hi()[0] - a_domain.lo()[0] + 1;
+        assert(k == b_domain.hi()[1] - b_domain.lo()[1] + 1);
+        assert(a_domain.get_dim() == b_domain.get_dim());
+        assert(a_domain.get_dim() == out_domain.get_dim());
+        int batch = 1;
+        for (int i = 2; i < a_domain.get_dim(); i++) {
+          int dim_size = a_domain.hi()[i] - a_domain.lo()[i] + 1;
+          assert(dim_size == b_domain.hi()[i] - b_domain.lo()[i] + 1);
+          assert(dim_size == out_domain.hi()[i] - out_domain.lo()[i] + 1);
+          batch *= dim_size;
+        }
+        // TODO: implement me
+        assert(false);
+        // BatchMatmulMeta *meta = (BatchMatmulMeta *)metas->meta[op];
+        // Kernels::BatchMatmul::backward_kernel_wrapper(
+        //     meta,
+        //     my_output_accessor[0].get_float_ptr(),
+        //     my_input_accessor[0].get_float_ptr(),
+        //     my_input_accessor[1].get_float_ptr(),
+        //     (float const *)nullptr,
+        //     m,
+        //     n,
+        //     k,
+        //     batch,
+        //     meta->a_seq_length_dim,
+        //     meta->b_seq_length_dim,
+        //     fused->iter_config.seq_length);
+        break;
+      }
+      case OP_EW_ADD:
+      case OP_EW_SUB:
+      case OP_EW_MUL:
+      case OP_EW_DIV:
+      case OP_EW_MAX:
+      case OP_EW_MIN: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_grad_accessor[0].domain ==
+               my_input_grad_accessor[1].domain);
+        assert(my_input_grad_accessor[0].domain ==
+               my_output_grad_accessor[0].domain);
+        // ElementBinaryMeta *m = (ElementBinaryMeta *)metas->meta[op];
+        // Kernels::ElementBinary::forward_kernel_wrapper(m,
+        //                                                my_input_accessor[0],
+        //                                                my_input_accessor[1],
+        //                                                my_output_accessor[0]);
+        break;
+      }
+      case OP_EMBEDDING: {
+        // Currently assume the Embedding layer cannot be finetuned
+        // so we do nothing for embedding
+        break;
+      }
+      case OP_GELU:
+      case OP_RELU:
+      case OP_SIGMOID:
+      case OP_TANH:
+      case OP_ELU:
+      case OP_SCALAR_TRUE_DIV: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_grad_accessor[0].domain ==
+               my_output_grad_accessor[0].domain);
+        // TODO: implement me
+        assert(false);
+        // ElementUnaryMeta *m = (ElementUnaryMeta *)metas->meta[op];
+        //   if (m->data_type == DT_HALF) {
+        //     ElementUnary::forward_kernel_wrapper(
+        //         m,
+        //         my_input_accessor[0].get_half_ptr(),
+        //         my_output_accessor[0].get_half_ptr(),
+        //         my_input_accessor[0].domain.get_volume());
+        //   } else if (m->data_type == DT_FLOAT) {
+        //     ElementUnary::forward_kernel_wrapper(
+        //         m,
+        //         my_input_accessor[0].get_float_ptr(),
+        //         my_output_accessor[0].get_float_ptr(),
+        //         my_input_accessor[0].domain.get_volume());
+        //   } else {
+        //     assert(false && "Unsupported data type in ElementUnary forward");
+        //   }
+        break;
+      }
+      case OP_RMS_NORM: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        RMSNormMeta const *m = (RMSNormMeta *)metas->meta[op];
+        Kernels::RMSNorm::peft_bwd_kernel_wrapper(m,
+                                                  bc,
+                                                  my_output_grad_accessor[0],
+                                                  my_input_grad_accessor[0],
+                                                  my_weight_accessor[0]);
+        break;
+      }
+      case OP_RESIDUAL_RMS_NORM: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_weights[op] == 1);
+        assert(fused->op_num_outputs[op] == 2);
+        ResidualRMSNormMeta const *m = (ResidualRMSNormMeta *)metas->meta[op];
+        Kernels::ResidualRMSNorm::peft_bwd_kernel_wrapper(
+            m,
+            bc,
+            my_input_grad_accessor[0],
+            my_input_grad_accessor[1],
+            my_output_grad_accessor[0],
+            my_output_grad_accessor[1],
+            my_weight_accessor[0]);
+        break;
+      }
+      case OP_INC_MULTIHEAD_SELF_ATTENTION: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        IncMultiHeadSelfAttentionMeta *m =
+            (IncMultiHeadSelfAttentionMeta *)metas->meta[op];
+        assert(fused->op_num_weights[op] ==
+               (1 + (int)(*m->qkv_bias || *m->final_bias)));
+        GenericTensorAccessorR biases;
+        if (*m->qkv_bias || *m->final_bias) {
+          assert(fused->op_num_weights[op] == 2);
+          biases = my_weight_accessor[1];
+        }
+        IncMultiHeadSelfAttention::peft_bwd_kernel_wrapper(
+            m,
+            bc,
+            task->index_point.point_data[0],
+            my_input_grad_accessor[0],
+            my_weight_accessor[0],
+            my_output_grad_accessor[0],
+            biases);
+        break;
+      }
+      case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION:
+      case OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION: {
+        // TODO: implement me
+        assert(false);
+        break;
+      }
+      case OP_LAYERNORM: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        LayerNormMeta const *m = (LayerNormMeta *)metas->meta[op];
+        if (m->elementwise_affine) {
+          assert(fused->op_num_weights[op] == 1 + (int)(m->use_bias));
+        }
+        GenericTensorAccessorR gamma, beta;
+        if (m->elementwise_affine) {
+          gamma = my_weight_accessor[0];
+          if (m->use_bias) {
+            beta = my_weight_accessor[1];
+          }
+        }
+        LayerNorm::peft_bwd_kernel_wrapper(
+            m, my_output_grad_accessor[0], my_input_grad_accessor[0], gamma);
+        break;
+      }
+      case OP_RESIDUAL_LAYERNORM: {
+        assert(fused->op_num_outputs[op] == 2);
+        ResidualLayerNormMeta const *m =
+            (ResidualLayerNormMeta *)metas->meta[op];
+        if (m->use_two_residuals) {
+          assert(fused->op_num_inputs[op] == 3);
+        } else {
+          assert(fused->op_num_inputs[op] == 2);
+        }
+        if (!m->elementwise_affine) {
+          assert(fused->op_num_weights[op] == 0);
+        } else {
+          if (!m->use_bias) {
+            assert(fused->op_num_weights[op] == 1); // weight
+          } else {
+            assert(fused->op_num_weights[op] == 2); // weight + bias
+          }
+        }
+        GenericTensorAccessorW residual2;
+        if (m->use_two_residuals) {
+          residual2 = my_input_grad_accessor[2];
+        }
+        GenericTensorAccessorR gamma;
+        if (m->elementwise_affine) {
+          gamma = my_weight_accessor[0];
+        }
+        ResidualLayerNorm::peft_bwd_kernel_wrapper(m,
+                                                   my_output_grad_accessor[1],
+                                                   my_input_grad_accessor[0],
+                                                   my_input_grad_accessor[1],
+                                                   residual2,
+                                                   gamma);
+        break;
+      }
+      case OP_ADD_BIAS_RESIDUAL_LAYERNORM: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_outputs[op] == 2);
+        AddBiasResidualLayerNormMeta const *m =
+            (AddBiasResidualLayerNormMeta *)metas->meta[op];
+        if (!m->elementwise_affine) {
+          assert(fused->op_num_weights[op] == 1); // attn bias
+        } else {
+          if (!m->use_bias) {
+            assert(fused->op_num_weights[op] == 2); // attn bias + weight
+          } else {
+            assert(fused->op_num_weights[op] == 3); // attn bias + weight + bias
+          }
+        }
+        GenericTensorAccessorR gamma;
+        if (m->elementwise_affine) {
+          gamma = my_weight_accessor[1];
+        }
+
+        AddBiasResidualLayerNorm::peft_bwd_kernel_wrapper(
+            m,
+            my_output_grad_accessor[1],
+            my_input_grad_accessor[0],
+            my_input_grad_accessor[1],
+            gamma);
+        break;
+      }
+      case OP_SIGMOID_SILU_MULTI: {
+        assert(fused->op_num_inputs[op] == 2);
+        assert(fused->op_num_outputs[op] == 1);
+        SigmoidSiluMultiMeta const *m = (SigmoidSiluMultiMeta *)metas->meta[op];
+        SigmoidSiluMulti::peft_bwd_kernel_wrapper(m,
+                                                  bc,
+                                                  my_output_grad_accessor[0],
+                                                  my_input_grad_accessor[0],
+                                                  my_input_grad_accessor[1]);
+        break;
+      }
+      case OP_SOFTMAX: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_grad_accessor[0].domain.get_volume() ==
+               my_output_grad_accessor[0].domain.get_volume());
+        SoftmaxMeta *m = (SoftmaxMeta *)metas->meta[op];
+        Kernels::Softmax::peft_bwd_kernel_wrapper(
+            m, bc, my_input_grad_accessor[0], my_output_grad_accessor[0]);
+        break;
+      }
+      case OP_ALLREDUCE: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        AllReduceMeta const *m = (AllReduceMeta *)metas->meta[op];
+        Kernels::AllReduce::peft_bwd_kernel_wrapper(
+            m, bc, my_input_grad_accessor[0], my_output_grad_accessor[0]);
+        break;
+      }
+      case OP_PARALLEL_IDENTITY: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        ParallelIdentityMeta const *m = (ParallelIdentityMeta *)metas->meta[op];
+        Kernels::ParallelIdentity::peft_bwd_kernel_wrapper(
+            m, bc, my_input_grad_accessor[0], my_output_grad_accessor[0]);
+        break;
+      }
+      default: {
+        fprintf(stderr,
+                "Fusion currently does not support type = %d\n",
+                fused->op_op_type[op]);
+        assert(false && "Fusion currently does not support type");
+      }
+    }
+    if (metas->meta[op]->inference_debugging &&
+        !(fused->op_op_type[op] == OP_ALLREDUCE ||
+          fused->op_op_type[op] == OP_PARALLEL_IDENTITY ||
+          fused->op_op_type[op] == OP_REPLICATE ||
+          fused->op_op_type[op] == OP_REPARTITION ||
+          fused->op_op_type[op] == OP_COMBINE)) {
+      std::vector<GenericTensorAccessorR> input_accessors_to_save;
+      std::vector<GenericTensorAccessorR> weight_accessors_to_save;
+      std::vector<GenericTensorAccessorR> output_accessors_to_save;
+      for (int i = 0; i < fused->op_num_inputs[op]; i++) {
+        input_accessors_to_save.push_back(my_input_grad_accessor[i]);
+      }
+      for (int i = 0; i < fused->op_num_weights[op]; i++) {
+        weight_accessors_to_save.push_back(my_weight_accessor[i]);
+      }
+      for (int i = 0; i < fused->op_num_outputs[op]; i++) {
+        output_accessors_to_save.push_back(my_output_grad_accessor[i]);
+      }
+      assert(task->index_point.get_dim() == 1);
+      int shard_id = task->index_point.point_data[0];
+      FusedOp::save_inference_tensors_to_file(metas->meta[op],
+                                              shard_id,
+                                              bc,
+                                              input_accessors_to_save,
+                                              weight_accessors_to_save,
+                                              output_accessors_to_save,
+                                              false);
+    }
+  }
 }
 
 /*
@@ -531,35 +1231,22 @@ __host__ void FusedOp::forward_task(Task const *task,
   regions[...](I): weights
   regions[...](O): outputs
 */
-__host__ void
-    FusedOp::inference_task(Task const *task,
-                            std::vector<PhysicalRegion> const &regions,
-                            Context ctx,
-                            Runtime *runtime) {
+__host__ void FusedOp::forward_task(Task const *task,
+                                    std::vector<PhysicalRegion> const &regions,
+                                    Context ctx,
+                                    Runtime *runtime) {
   // const FusedOp* fused = (FusedOp*) task->args;
-  FusedOpMeta *metas = *((FusedOpMeta **)task->local_args);
+  FusedOpMeta const *metas = *((FusedOpMeta **)task->local_args);
   FusedOp const *fused = metas->fused_op;
-  // BatchConfig const *bc = (BatchConfig *)task->args;
-  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
-  // Return if no active tokens
-  if (bc->num_tokens == 0) {
-    return;
-  }
-
   assert(metas->numOperators == fused->numOperators);
   assert(regions.size() == task->regions.size());
   assert((int)regions.size() ==
          fused->numInputs + fused->numWeights + fused->numOutputs);
-  // Domain input_domain[MAX_NUM_INPUTS];
-  // Domain weight_domain[MAX_NUM_WEIGHTS];
-  // Domain output_domain[MAX_NUM_OUTPUTS];
   GenericTensorAccessorR input_accessor[MAX_NUM_INPUTS];
   GenericTensorAccessorR weight_accessor[MAX_NUM_WEIGHTS];
   GenericTensorAccessorW output_accessor[MAX_NUM_OUTPUTS];
   assert(fused->numInputs <= MAX_NUM_INPUTS);
   for (int i = 0; i < fused->numInputs; i++) {
-    // input_domain[i] = runtime->get_index_space_domain(
-    //     ctx, task->regions[i].region.get_index_space());
     input_accessor[i] =
         helperGetGenericTensorAccessorRO(fused->input_data_types[i],
                                          regions[i],
@@ -571,8 +1258,6 @@ __host__ void
   int roff = fused->numInputs;
   assert(fused->numWeights <= MAX_NUM_WEIGHTS);
   for (int i = 0; i < fused->numWeights; i++) {
-    // weight_domain[i] = runtime->get_index_space_domain(
-    //     ctx, task->regions[i + roff].region.get_index_space());
     weight_accessor[i] =
         helperGetGenericTensorAccessorRO(fused->weight_data_types[i],
                                          regions[i + roff],
@@ -584,8 +1269,6 @@ __host__ void
   roff += fused->numWeights;
   assert(fused->numOutputs <= MAX_NUM_OUTPUTS);
   for (int i = 0; i < fused->numOutputs; i++) {
-    // output_domain[i] = runtime->get_index_space_domain(
-    //     ctx, task->regions[i + roff].region.get_index_space());
     output_accessor[i] =
         helperGetGenericTensorAccessorWO(fused->output_data_types[i],
                                          regions[i + roff],
@@ -610,20 +1293,15 @@ __host__ void
 
   int ioff = 0, woff = 0, ooff = 0;
   for (int op = 0; op < fused->numOperators; op++) {
-    // Domain my_id[MAX_NUM_INPUTS];
-    // Domain my_wd[MAX_NUM_WEIGHTS];
-    // Domain my_od[MAX_NUM_OUTPUTS];
     GenericTensorAccessorR my_input_accessor[MAX_NUM_INPUTS];
     GenericTensorAccessorR my_weight_accessor[MAX_NUM_WEIGHTS];
     GenericTensorAccessorW my_output_accessor[MAX_NUM_OUTPUTS];
     for (int i = 0; i < fused->op_num_inputs[op]; i++) {
       int my_off = fused->op_input_idx[i + ioff];
       if (fused->op_input_source[i + ioff] == SOURCE_INPUT) {
-        // my_id[i] = input_domain[my_off];
         assert(my_off < fused->numInputs);
         my_input_accessor[i] = input_accessor[my_off];
       } else if (fused->op_input_source[i + ioff] == SOURCE_OUTPUT) {
-        // my_id[i] = output_domain[my_off];
         assert(my_off < fused->numOutputs);
         my_input_accessor[i] = output_accessor[my_off];
       } else {
@@ -632,8 +1310,6 @@ __host__ void
     }
     for (int i = 0; i < fused->op_num_weights[op]; i++) {
       assert(fused->op_weight_source[i + woff] == SOURCE_WEIGHT);
-      // my_wd[i] = weight_domain[fused->op_weight_idx[i + woff]];
-      // my_wp[i] = weight_ptr[fused->op_weight_idx[i + woff]];
       assert(fused->op_weight_idx[i + woff] < fused->numWeights);
       my_weight_accessor[i] = weight_accessor[fused->op_weight_idx[i + woff]];
     }
@@ -641,8 +1317,6 @@ __host__ void
       int my_off = fused->op_output_idx[i + ooff];
       assert(fused->op_output_source[i + ooff] == SOURCE_OUTPUT);
       assert(my_off < fused->numOutputs);
-      // my_od[i] = output_domain[fused->op_output_idx[i + ooff]];
-      // my_op[i] = output_ptr[fused->op_output_idx[i + ooff]];
       my_output_accessor[i] = output_accessor[my_off];
     }
     switch (fused->op_op_type[op]) {
@@ -658,6 +1332,21 @@ __host__ void
                                                 m->legion_axis);
         break;
       }
+      case OP_CONV2D: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_accessor[0].domain.get_dim() == 5);
+        assert(my_weight_accessor[0].domain.get_dim() == 5);
+        assert(my_output_accessor[0].domain.get_dim() == 5);
+        Conv2DMeta *m = (Conv2DMeta *)metas->meta[op];
+        Kernels::Conv2D::forward_kernel_wrapper(
+            m,
+            my_input_accessor[0].get_float_ptr(),
+            my_output_accessor[0].get_float_ptr(),
+            my_weight_accessor[0].get_float_ptr(),
+            my_weight_accessor[1].get_float_ptr());
+        break;
+      }
       case OP_BATCHNORM: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
@@ -673,6 +1362,16 @@ __host__ void
                                   my_weight_accessor[1].get_float_ptr());
         break;
       }
+      case OP_DROPOUT: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_outputs[op] == 1);
+        DropoutMeta *m = (DropoutMeta *)metas->meta[op];
+        Kernels::Dropout::forward_kernel_wrapper(
+            m,
+            my_input_accessor[0].get_float_ptr(),
+            my_output_accessor[0].get_float_ptr());
+        break;
+      }
       case OP_LINEAR: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_outputs[op] == 1);
@@ -683,27 +1382,25 @@ __host__ void
         assert(my_output_accessor[0].domain.get_volume() ==
                out_dim * batch_size);
         assert(my_input_accessor[0].domain.get_volume() == in_dim * batch_size);
-        void const *bias_ptr = nullptr;
+        float const *bias_ptr = nullptr;
         LinearMeta *m = (LinearMeta *)metas->meta[op];
         if (fused->op_num_weights[op] == 2) {
           assert(my_weight_accessor[1].domain.get_volume() == out_dim);
           if (!m->add_bias_only_once || task->index_point.point_data[0] == 0) {
-            bias_ptr = my_weight_accessor[1].ptr;
+            bias_ptr = my_weight_accessor[1].get_float_ptr();
           }
         } else {
           assert(fused->op_num_weights[op] == 1);
         }
-        assert(m->input_type[0] == my_input_accessor[0].data_type);
-        assert(m->input_type[0] == my_output_accessor[0].data_type);
-        batch_size = bc->num_active_tokens();
-        Kernels::Linear::forward_kernel_wrapper(m,
-                                                my_input_accessor[0].ptr,
-                                                my_output_accessor[0].ptr,
-                                                my_weight_accessor[0].ptr,
-                                                bias_ptr,
-                                                in_dim,
-                                                out_dim,
-                                                batch_size);
+        Kernels::Linear::forward_kernel_wrapper(
+            m,
+            my_input_accessor[0].get_float_ptr(),
+            my_output_accessor[0].get_float_ptr(),
+            my_weight_accessor[0].get_float_ptr(),
+            bias_ptr,
+            in_dim,
+            out_dim,
+            batch_size);
         break;
       }
       case OP_BATCHMATMUL: {
@@ -831,126 +1528,78 @@ __host__ void
       case OP_RELU:
       case OP_SIGMOID:
       case OP_TANH:
-      case OP_ELU:
-      case OP_SCALAR_TRUE_DIV: {
+      case OP_ELU: {
+        assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 0);
+        assert(fused->op_num_outputs[op] == 1);
+        assert(my_input_accessor[0].domain == my_output_accessor[0].domain);
+        ElementUnaryMeta *m = (ElementUnaryMeta *)metas->meta[op];
+        ElementUnary::forward_kernel_wrapper(
+            m,
+            my_input_accessor[0].get_float_ptr(),
+            my_output_accessor[0].get_float_ptr(),
+            my_input_accessor[0].domain.get_volume());
+        break;
+      }
+      case OP_POOL2D: {
         assert(fused->op_num_inputs[op] == 1);
         assert(fused->op_num_weights[op] == 0);
         assert(fused->op_num_outputs[op] == 1);
-        assert(my_input_accessor[0].domain == my_output_accessor[0].domain);
-        ElementUnaryMeta *m = (ElementUnaryMeta *)metas->meta[op];
-        if (m->data_type == DT_HALF) {
-          ElementUnary::forward_kernel_wrapper(
-              m,
-              my_input_accessor[0].get_half_ptr(),
-              my_output_accessor[0].get_half_ptr(),
-              my_input_accessor[0].domain.get_volume());
-        } else if (m->data_type == DT_FLOAT) {
-          ElementUnary::forward_kernel_wrapper(
-              m,
-              my_input_accessor[0].get_float_ptr(),
-              my_output_accessor[0].get_float_ptr(),
-              my_input_accessor[0].domain.get_volume());
-        } else {
-          assert(false && "Unsupported data type in ElementUnary forward");
-        }
+        Pool2DMeta *m = (Pool2DMeta *)metas->meta[op];
+        Kernels::Pool2D::forward_kernel_wrapper(
+            m,
+            my_input_accessor[0].get_float_ptr(),
+            my_output_accessor[0].get_float_ptr());
         break;
       }
-      case OP_RMS_NORM: {
+      case OP_FLAT: {
         assert(fused->op_num_inputs[op] == 1);
-        assert(fused->op_num_weights[op] == 1);
+        assert(fused->op_num_weights[op] == 0);
         assert(fused->op_num_outputs[op] == 1);
-        RMSNormMeta const *m = (RMSNormMeta *)metas->meta[op];
-        Kernels::RMSNorm::forward_kernel_wrapper(m,
-                                                 my_input_accessor[0],
-                                                 my_weight_accessor[0],
-                                                 my_output_accessor[0]);
-        break;
-      }
-      case OP_RESIDUAL_RMS_NORM: {
-        assert(fused->op_num_inputs[op] == 2);
-        assert(fused->op_num_weights[op] == 1);
-        assert(fused->op_num_outputs[op] == 2);
-        ResidualRMSNormMeta const *m = (ResidualRMSNormMeta *)metas->meta[op];
-        Kernels::ResidualRMSNorm::forward_kernel_wrapper(m,
-                                                         my_input_accessor[0],
-                                                         my_input_accessor[1],
-                                                         my_weight_accessor[0],
-                                                         my_output_accessor[0],
-                                                         my_output_accessor[1]);
+        assert(my_input_accessor[0].domain.get_volume() ==
+               my_output_accessor[0].domain.get_volume());
+        Kernels::Flat::forward_kernel_wrapper(
+            my_input_accessor[0].get_float_ptr(),
+            my_output_accessor[0].get_float_ptr(),
+            my_input_accessor[0].domain.get_volume());
         break;
       }
-      case OP_INC_MULTIHEAD_SELF_ATTENTION: {
+      case OP_SOFTMAX: {
         assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 0);
         assert(fused->op_num_outputs[op] == 1);
-        IncMultiHeadSelfAttentionMeta const *m =
-            (IncMultiHeadSelfAttentionMeta *)metas->meta[op];
-        assert(fused->op_num_weights[op] ==
-               (1 + (int)(*m->qkv_bias || *m->final_bias)));
-        GenericTensorAccessorR biases;
-        if (*m->qkv_bias || *m->final_bias) {
-          assert(fused->op_num_weights[op] == 2);
-          biases = my_weight_accessor[1];
-        }
-        IncMultiHeadSelfAttention::inference_kernel_wrapper(
-            m,
-            bc,
-            task->index_point.point_data[0],
-            my_input_accessor[0],
-            my_weight_accessor[0],
-            my_output_accessor[0],
-            biases);
+        assert(my_input_accessor[0].domain.get_volume() ==
+               my_output_accessor[0].domain.get_volume());
+        SoftmaxMeta *m = (SoftmaxMeta *)metas->meta[op];
+        Kernels::Softmax::forward_kernel_wrapper(
+            m, my_input_accessor[0], my_output_accessor[0]);
         break;
       }
-      case OP_TREE_INC_MULTIHEAD_SELF_ATTENTION: {
+      case OP_RESHAPE: {
         assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 0);
         assert(fused->op_num_outputs[op] == 1);
-        TreeIncMultiHeadSelfAttentionMeta *m =
-            (TreeIncMultiHeadSelfAttentionMeta *)metas->meta[op];
-        // TreeVerifyBatchConfig const *tree_bc =
-        //     (TreeVerifyBatchConfig *)task->args;
-        TreeVerifyBatchConfig const &tree_bc =
-            Future(task->futures[0]).get_result<TreeVerifyBatchConfig>();
-        assert(fused->op_num_weights[op] ==
-               (1 + (int)(*m->qkv_bias || *m->final_bias)));
-        GenericTensorAccessorR biases;
-        if (*m->qkv_bias || *m->final_bias) {
-          assert(fused->op_num_weights[op] == 2);
-          biases = my_weight_accessor[1];
-        }
-        TreeIncMultiHeadSelfAttention::inference_kernel_wrapper(
-            m,
-            &tree_bc,
-            task->index_point.point_data[0],
-            my_input_accessor[0],
-            my_weight_accessor[0],
-            my_output_accessor[0],
-            biases);
+        assert(my_input_accessor[0].domain.get_volume() ==
+               my_output_accessor[0].domain.get_volume());
+        Kernels::Reshape::forward_kernel_wrapper(
+            my_input_accessor[0].get_float_ptr(),
+            my_output_accessor[0].get_float_ptr(),
+            my_input_accessor[0].domain.get_volume());
         break;
       }
-      case OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION: {
+      case OP_TRANSPOSE: {
         assert(fused->op_num_inputs[op] == 1);
+        assert(fused->op_num_weights[op] == 0);
         assert(fused->op_num_outputs[op] == 1);
-        SpecIncMultiHeadSelfAttentionMeta const *m =
-            (SpecIncMultiHeadSelfAttentionMeta *)metas->meta[op];
-        // BeamSearchBatchConfig const *beam_bc =
-        //     (BeamSearchBatchConfig *)task->args;
-        BeamSearchBatchConfig const &beam_bc =
-            Future(task->futures[0]).get_result<BeamSearchBatchConfig>();
-        assert(fused->op_num_weights[op] ==
-               (1 + (int)(*m->qkv_bias || *m->final_bias)));
-        GenericTensorAccessorR biases;
-        if (*m->qkv_bias || *m->final_bias) {
-          assert(fused->op_num_weights[op] == 2);
-          biases = my_weight_accessor[1];
-        }
-        SpecIncMultiHeadSelfAttention::inference_kernel_wrapper(
+        assert(my_input_accessor[0].domain.get_volume() ==
+               my_output_accessor[0].domain.get_volume());
+        TransposeMeta *m = (TransposeMeta *)metas->meta[op];
+        Kernels::Transpose::forward_kernel_wrapper(
             m,
-            &beam_bc,
-            task->index_point.point_data[0],
-            my_input_accessor[0],
-            my_weight_accessor[0],
-            my_output_accessor[0],
-            biases);
+            my_input_accessor[0].get_float_ptr(),
+            my_output_accessor[0].get_float_ptr(),
+            my_input_accessor[0].domain,
+            my_output_accessor[0].domain);
         break;
       }
       case OP_LAYERNORM: {
@@ -972,119 +1621,23 @@ __host__ void
         break;
       }
       case OP_RESIDUAL_LAYERNORM: {
-        assert(fused->op_num_outputs[op] == 2);
-        ResidualLayerNormMeta const *m =
-            (ResidualLayerNormMeta *)metas->meta[op];
-        if (m->use_two_residuals) {
-          assert(fused->op_num_inputs[op] == 3);
-        } else {
-          assert(fused->op_num_inputs[op] == 2);
-        }
-        if (!m->elementwise_affine) {
-          assert(fused->op_num_weights[op] == 0);
-        } else {
-          if (!m->use_bias) {
-            assert(fused->op_num_weights[op] == 1); // weight
-          } else {
-            assert(fused->op_num_weights[op] == 2); // weight + bias
-          }
-        }
-        GenericTensorAccessorR residual2;
-        if (m->use_two_residuals) {
-          residual2 = my_input_accessor[2];
-        }
-        GenericTensorAccessorR gamma, beta;
-        if (m->elementwise_affine) {
-          gamma = my_weight_accessor[0];
-          if (m->use_bias) {
-            beta = my_weight_accessor[1];
-          }
-        }
-        ResidualLayerNorm::inference_kernel_wrapper(m,
-                                                    my_input_accessor[0],
-                                                    my_input_accessor[1],
-                                                    residual2,
-                                                    my_output_accessor[0],
-                                                    my_output_accessor[1],
-                                                    gamma,
-                                                    beta);
+        assert(false && "Operator ResidualLayerNorm does not support "
+                        "the forward() task");
         break;
       }
       case OP_ADD_BIAS_RESIDUAL_LAYERNORM: {
-        assert(fused->op_num_inputs[op] == 2);
-        assert(fused->op_num_outputs[op] == 2);
-        AddBiasResidualLayerNormMeta const *m =
-            (AddBiasResidualLayerNormMeta *)metas->meta[op];
-        if (!m->elementwise_affine) {
-          assert(fused->op_num_weights[op] == 1); // attn bias
-        } else {
-          if (!m->use_bias) {
-            assert(fused->op_num_weights[op] == 2); // attn bias + weight
-          } else {
-            assert(fused->op_num_weights[op] == 3); // attn bias + weight + bias
-          }
-        }
-        GenericTensorAccessorR gamma, beta;
-        if (m->elementwise_affine) {
-          gamma = my_weight_accessor[1];
-          if (m->use_bias) {
-            beta = my_weight_accessor[2];
-          }
-        }
-        Domain attn_bias_domain = my_weight_accessor[0].domain;
-        Domain residual_domain = my_input_accessor[1].domain;
-        int attn_bias_dim =
-            attn_bias_domain.hi()[0] - attn_bias_domain.lo()[0] + 1;
-        int residual_volume = residual_domain.get_volume();
-        AddBiasResidualLayerNorm::inference_kernel_wrapper(
-            m,
-            attn_bias_dim,
-            residual_volume,
-            my_input_accessor[0],
-            my_output_accessor[0],
-            my_output_accessor[1],
-            my_input_accessor[1],
-            my_weight_accessor[0],
-            gamma,
-            beta);
+        assert(false && "Operator AddBiasResidualLayerNorm does not support "
+                        "the forward() task");
         break;
       }
       case OP_SIGMOID_SILU_MULTI: {
-        assert(fused->op_num_inputs[op] == 2);
-        assert(fused->op_num_outputs[op] == 1);
-        SigmoidSiluMultiMeta const *m = (SigmoidSiluMultiMeta *)metas->meta[op];
-        SigmoidSiluMulti::inference_kernel_wrapper(m,
-                                                   my_input_accessor[0],
-                                                   my_input_accessor[1],
-                                                   my_output_accessor[0]);
-        break;
-      }
-      case OP_SOFTMAX: {
-        assert(fused->op_num_inputs[op] == 1);
-        assert(fused->op_num_weights[op] == 0);
-        assert(fused->op_num_outputs[op] == 1);
-        assert(my_input_accessor[0].domain.get_volume() ==
-               my_output_accessor[0].domain.get_volume());
-        SoftmaxMeta *m = (SoftmaxMeta *)metas->meta[op];
-        if (m->input_type == DT_HALF) {
-          Kernels::Softmax::forward_kernel_wrapper(
-              m,
-              my_input_accessor[0].get_half_ptr(),
-              my_output_accessor[0].get_half_ptr());
-        } else if (m->input_type == DT_FLOAT) {
-          Kernels::Softmax::forward_kernel_wrapper(
-              m,
-              my_input_accessor[0].get_float_ptr(),
-              my_output_accessor[0].get_float_ptr());
-        }
+        assert(false && "Operator SigmoidSiluMulti does not support "
+                        "the forward() task");
         break;
       }
-      case OP_ALLREDUCE: {
-        assert(fused->op_num_inputs[op] == 1);
-        assert(fused->op_num_outputs[op] == 1);
-        AllReduceMeta const *m = (AllReduceMeta *)metas->meta[op];
-        Kernels::AllReduce::inference_kernel_wrapper(
-            m, bc, my_input_accessor[0], my_output_accessor[0]);
+      case OP_RESIDUAL_RMS_NORM: {
+        assert(false && "Operator ResidualRMSNorm does not support "
+                        "the forward() task");
         break;
       }
       default: {
@@ -1094,37 +1647,6 @@ __host__ void
         assert(false && "Fusion currently does not support type");
       }
     }
-    if (metas->meta[op]->inference_debugging) {
-      std::vector<GenericTensorAccessorR> input_accessors_to_save;
-      std::vector<GenericTensorAccessorR> weight_accessors_to_save;
-      std::vector<GenericTensorAccessorR> output_accessors_to_save;
-      for (int i = 0; i < fused->op_num_inputs[op]; i++) {
-        int my_off = fused->op_input_idx[i + ioff];
-        if (fused->op_input_source[i + ioff] == SOURCE_INPUT) {
-          input_accessors_to_save.push_back(input_accessor[my_off]);
-        } else if (fused->op_input_source[i + ioff] == SOURCE_OUTPUT) {
-          input_accessors_to_save.push_back(output_accessor[my_off]);
-        } else {
-          assert(false);
-        }
-      }
-      for (int i = 0; i < fused->op_num_weights[op]; i++) {
-        assert(fused->op_weight_source[i + woff] == SOURCE_WEIGHT);
-        weight_accessors_to_save.push_back(
-            weight_accessor[fused->op_weight_idx[i + woff]]);
-      }
-      for (int i = 0; i < fused->op_num_outputs[op]; i++) {
-        output_accessors_to_save.push_back(output_accessor[i + ooff]);
-      }
-      assert(task->index_point.get_dim() == 1);
-      int shard_id = task->index_point.point_data[0];
-      FusedOp::save_inference_tensors_to_file(metas->meta[op],
-                                              shard_id,
-                                              bc,
-                                              input_accessors_to_save,
-                                              weight_accessors_to_save,
-                                              output_accessors_to_save);
-    }
     ioff += fused->op_num_inputs[op];
     woff += fused->op_num_weights[op];
     ooff += fused->op_num_outputs[op];
@@ -1156,9 +1678,6 @@ __host__ void FusedOp::backward_task(Task const *task,
     int sum = fused->numInputs + fused->numWeights + fused->numOutputs;
     assert(sum * 2 == (int)regions.size());
   }
-  // Domain input_domain[MAX_NUM_INPUTS], input_grad_domain[MAX_NUM_INPUTS];
-  // Domain weight_domain[MAX_NUM_WEIGHTS], weight_grad_domain[MAX_NUM_WEIGHTS];
-  // Domain output_domain[MAX_NUM_OUTPUTS], output_grad_domain[MAX_NUM_OUTPUTS];
   GenericTensorAccessorR input_accessor[MAX_NUM_INPUTS];
   GenericTensorAccessorW input_grad_accessor[MAX_NUM_INPUTS];
   GenericTensorAccessorR weight_accessor[MAX_NUM_WEIGHTS];
@@ -1168,8 +1687,6 @@ __host__ void FusedOp::backward_task(Task const *task,
   int roff = 0;
   assert(fused->numInputs <= MAX_NUM_INPUTS);
   for (int i = 0; i < fused->numInputs; i++) {
-    // input_domain[i] = runtime->get_index_space_domain(
-    //     ctx, task->regions[i].region.get_index_space());
     input_accessor[i] =
         helperGetGenericTensorAccessorRO(fused->input_data_types[i],
                                          regions[i],
@@ -1181,8 +1698,6 @@ __host__ void FusedOp::backward_task(Task const *task,
   roff += fused->numInputs;
   assert(fused->numWeights <= MAX_NUM_WEIGHTS);
   for (int i = 0; i < fused->numWeights; i++) {
-    // weight_domain[i] = runtime->get_index_space_domain(
-    //     ctx, task->regions[i + roff].region.get_index_space());
     weight_accessor[i] =
         helperGetGenericTensorAccessorRO(fused->weight_data_types[i],
                                          regions[i + roff],
@@ -1194,8 +1709,6 @@ __host__ void FusedOp::backward_task(Task const *task,
   roff += fused->numWeights;
   assert(fused->numOutputs <= MAX_NUM_OUTPUTS);
   for (int i = 0; i < fused->numOutputs; i++) {
-    // output_domain[i] = runtime->get_index_space_domain(
-    //     ctx, task->regions[i + roff].region.get_index_space());
     output_accessor[i] =
         helperGetGenericTensorAccessorRO(fused->output_data_types[i],
                                          regions[i + roff],
@@ -1206,8 +1719,6 @@ __host__ void FusedOp::backward_task(Task const *task,
   }
   roff += fused->numOutputs;
   for (int i = 0; i < fused->numInputs; i++) {
-    // input_grad_domain[i] = runtime->get_index_space_domain(
-    //     ctx, task->regions[i + roff].region.get_index_space());
     input_grad_accessor[i] =
         helperGetGenericTensorAccessorRW(fused->input_data_types[i],
                                          regions[i + roff],
@@ -1219,8 +1730,6 @@ __host__ void FusedOp::backward_task(Task const *task,
   }
   roff += fused->numInputs;
   for (int i = 0; i < fused->numWeights; i++) {
-    // weight_grad_domain[i] = runtime->get_index_space_domain(
-    //     ctx, task->regions[i + roff].region.get_index_space());
     weight_grad_accessor[i] =
         helperGetGenericTensorAccessorRW(fused->weight_data_types[i],
                                          regions[i + roff],
@@ -1233,8 +1742,6 @@ __host__ void FusedOp::backward_task(Task const *task,
   }
   roff += fused->numWeights;
   for (int i = 0; i < fused->numOutputs; i++) {
-    // output_grad_domain[i] = runtime->get_index_space_domain(
-    //     ctx, task->regions[i + roff].region.get_index_space());
     output_grad_accessor[i] =
         helperGetGenericTensorAccessorRW(fused->output_data_types[i],
                                          regions[i + roff],
@@ -1260,9 +1767,6 @@ __host__ void FusedOp::backward_task(Task const *task,
   }
 
   int ioff = 0, woff = 0, ooff = 0;
-  // Domain my_id[MAX_NUM_INPUTS], my_grad_id[MAX_NUM_INPUTS];
-  // Domain my_wd[MAX_NUM_WEIGHTS], my_grad_wd[MAX_NUM_WEIGHTS];
-  // Domain my_od[MAX_NUM_OUTPUTS], my_grad_od[MAX_NUM_OUTPUTS];
   GenericTensorAccessorR my_input_accessor[MAX_NUM_INPUTS];
   GenericTensorAccessorR my_weight_accessor[MAX_NUM_WEIGHTS];
   GenericTensorAccessorR my_output_accessor[MAX_NUM_OUTPUTS];
@@ -1283,19 +1787,11 @@ __host__ void FusedOp::backward_task(Task const *task,
     for (int i = 0; i < fused->op_num_inputs[op]; i++) {
       int my_off = fused->op_input_idx[i + ioff];
       if (fused->op_input_source[i + ioff] == SOURCE_INPUT) {
-        // my_id[i] = input_domain[my_off];
-        // my_ip[i] = input_ptr[my_off];
         my_input_accessor[i] = input_accessor[my_off];
-        // my_grad_id[i] = input_grad_domain[my_off];
-        // my_grad_ip[i] = input_grad_ptr[my_off];
         my_input_grad_accessor[i] = input_grad_accessor[my_off];
         assert(my_input_grad_accessor[i].domain == my_input_accessor[i].domain);
       } else if (fused->op_input_source[i + ioff] == SOURCE_OUTPUT) {
-        // my_id[i] = output_domain[my_off];
-        // my_ip[i] = output_ptr[my_off];
         my_input_accessor[i] = output_accessor[my_off];
-        // my_grad_id[i] = output_grad_domain[my_off];
-        // my_grad_ip[i] = output_grad_ptr[my_off];
         my_input_grad_accessor[i] = output_grad_accessor[my_off];
         assert(my_input_grad_accessor[i].domain == my_input_accessor[i].domain);
       } else {
@@ -1304,11 +1800,7 @@ __host__ void FusedOp::backward_task(Task const *task,
     }
     for (int i = 0; i < fused->op_num_weights[op]; i++) {
       assert(fused->op_weight_source[i + woff] == SOURCE_WEIGHT);
-      // my_wd[i] = weight_domain[fused->op_weight_idx[i + woff]];
-      // my_wp[i] = weight_ptr[fused->op_weight_idx[i + woff]];
       my_weight_accessor[i] = weight_accessor[fused->op_weight_idx[i + woff]];
-      // my_grad_wd[i] = weight_grad_domain[fused->op_weight_idx[i + woff]];
-      // my_grad_wp[i] = weight_grad_ptr[fused->op_weight_idx[i + woff]];
       my_weight_grad_accessor[i] =
           weight_grad_accessor[fused->op_weight_idx[i + woff]];
       assert(my_weight_grad_accessor[i].domain.get_volume() ==
@@ -1317,11 +1809,7 @@ __host__ void FusedOp::backward_task(Task const *task,
     for (int i = 0; i < fused->op_num_outputs[op]; i++) {
       assert(fused->op_output_source[i + ooff] == SOURCE_OUTPUT);
       int my_off = fused->op_output_idx[i + ooff];
-      // my_od[i] = output_domain[my_off];
-      // my_op[i] = output_ptr[my_off];
       my_output_accessor[i] = output_accessor[my_off];
-      // my_grad_od[i] = output_grad_domain[my_off];
-      // my_grad_op[i] = output_grad_ptr[my_off];
       my_output_grad_accessor[i] = output_grad_accessor[my_off];
       assert(my_output_grad_accessor[i].domain == my_output_accessor[i].domain);
     }
diff --git a/src/ops/group_by.cc b/src/ops/group_by.cc
index f2f402737c..03b9a5199b 100644
--- a/src/ops/group_by.cc
+++ b/src/ops/group_by.cc
@@ -99,7 +99,7 @@ Group_byParams Group_by::get_params() const {
   Group_byParams params;
   params.n = this->n;
   params.alpha = this->alpha;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
@@ -271,7 +271,7 @@ OpMeta *Group_by::init_task(Task const *task,
                             Runtime *runtime) {
   Group_by *gb = (Group_by *)task->args;
   FFHandler handle = *((FFHandler *)task->local_args);
-  GroupByMeta *m = new GroupByMeta(handle, gb->n, gb->alpha);
+  GroupByMeta *m = new GroupByMeta(handle, gb);
   m->profiling = gb->profiling;
   m->inference_debugging = gb->inference_debugging;
   std::strcpy(m->op_name, gb->name);
@@ -579,7 +579,7 @@ bool Group_by::measure_operator_cost(Simulator *sim,
     }
   }
 
-  GroupByMeta *m = new GroupByMeta(sim->handler, n, alpha);
+  GroupByMeta *m = new GroupByMeta(sim->handler, this);
 
   // allocate
   sim->free_all();
diff --git a/src/ops/group_by.cpp b/src/ops/group_by.cpp
index 761c35f182..9ca6f77898 100644
--- a/src/ops/group_by.cpp
+++ b/src/ops/group_by.cpp
@@ -188,9 +188,9 @@ void Group_by::backward_kernel_wrapper(GroupByMeta const *m,
                      data_dim);
 }
 
-GroupByMeta::GroupByMeta(FFHandler handler, int n, float _alpha)
-    : OpMeta(handler), alpha(_alpha) {
-  checkCUDA(hipMalloc(&dev_region_ptrs, n * sizeof(float *)));
+GroupByMeta::GroupByMeta(FFHandler handler, Group_by const *gb)
+    : OpMeta(handler, gb), alpha(gb->alpha) {
+  checkCUDA(hipMalloc(&dev_region_ptrs, gb->n * sizeof(float *)));
 }
 GroupByMeta::~GroupByMeta(void) {
   checkCUDA(hipFree(&dev_region_ptrs));
diff --git a/src/ops/group_by.cu b/src/ops/group_by.cu
index 0ed09e20b3..43bcb900df 100644
--- a/src/ops/group_by.cu
+++ b/src/ops/group_by.cu
@@ -198,9 +198,9 @@ void Group_by::backward_kernel_wrapper(GroupByMeta const *m,
   }
 }
 
-GroupByMeta::GroupByMeta(FFHandler handler, int n, float _alpha)
-    : OpMeta(handler), alpha(_alpha) {
-  checkCUDA(cudaMalloc(&dev_region_ptrs, n * sizeof(float *)));
+GroupByMeta::GroupByMeta(FFHandler handler, Group_by const *gb)
+    : OpMeta(handler, gb), alpha(gb->alpha) {
+  checkCUDA(cudaMalloc(&dev_region_ptrs, gb->n * sizeof(float *)));
 }
 GroupByMeta::~GroupByMeta(void) {
   checkCUDA(cudaFree(&dev_region_ptrs));
diff --git a/src/ops/inc_multihead_self_attention.cc b/src/ops/inc_multihead_self_attention.cc
index aa60d0f19c..8219cf9e1f 100644
--- a/src/ops/inc_multihead_self_attention.cc
+++ b/src/ops/inc_multihead_self_attention.cc
@@ -363,7 +363,9 @@ IncMultiHeadSelfAttention::IncMultiHeadSelfAttention(
         dims,
         quantization_type == DT_NONE ? this->data_type : quantization_type,
         nullptr /*owner_op*/,
-        true /*create_grad*/,
+        model.config.computationMode == COMP_MODE_INFERENCE
+            ? false
+            : true /*create_grad*/,
         initializer,
         CHOSEN_SYNC_TYPE);
     if (qkv_bias || final_bias) {
@@ -871,6 +873,139 @@ void IncMultiHeadSelfAttention::inference_task(
   }
 }
 
+FutureMap IncMultiHeadSelfAttention::peft_bwd(
+    FFModel const &ff,
+    BatchConfigFuture const &bc,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+  int idx = 0;
+  IndexLauncher launcher(INC_MULTIHEAD_SELF_ATTENTION_PEFT_BWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(nullptr, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[0]->part_grad,
+                        0 /*projection id*/,
+                        reset_input_grads[0] ? WRITE_ONLY : READ_WRITE,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region_grad));
+  launcher.add_field(idx++, FID_DATA);
+  launcher.add_region_requirement(
+      RegionRequirement(weights[0]->part,
+                        0 /*projection id*/,
+                        READ_ONLY,
+                        EXCLUSIVE,
+                        weights[0]->region,
+                        ff.cpu_offload ? MAP_TO_ZC_MEMORY : 0));
+  launcher.add_field(idx++, FID_DATA);
+  launcher.add_region_requirement(
+      RegionRequirement(batch_outputs[0]->part_grad,
+                        0 /*projection id*/,
+                        READ_WRITE,
+                        EXCLUSIVE,
+                        batch_outputs[0]->region_grad));
+  launcher.add_field(idx++, FID_DATA);
+  if (qkv_bias || final_bias) {
+    launcher.add_region_requirement(
+        RegionRequirement(weights[1]->part,
+                          0 /*projection id*/,
+                          READ_ONLY,
+                          EXCLUSIVE,
+                          weights[1]->region,
+                          ff.cpu_offload ? MAP_TO_ZC_MEMORY : 0));
+    launcher.add_field(idx++, FID_DATA);
+  }
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+/*
+  regions[0](I): input
+  regions[3](I): weight
+  regions[4](O): output
+*/
+void IncMultiHeadSelfAttention::peft_bwd_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  assert(task->regions.size() == regions.size());
+
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  log_inc_mha.debug("BatchConfig, num_tokens: %d, num_requests: %d",
+                    bc->num_tokens,
+                    bc->num_active_requests());
+  if (bc->num_active_peft_tokens() == 0) {
+    return;
+  }
+
+  IncMultiHeadSelfAttentionMeta *m =
+      *((IncMultiHeadSelfAttentionMeta **)task->local_args);
+
+  assert(((*m->qkv_bias || *m->final_bias) ? regions.size() == 4
+                                           : regions.size() == 3));
+
+  GenericTensorAccessorW input_grad = helperGetGenericTensorAccessorRW(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
+      m->weight_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output_grad = helperGetGenericTensorAccessorRW(
+      m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR biases;
+  if (*m->qkv_bias || *m->final_bias) {
+    biases = helperGetGenericTensorAccessorRO(m->weight_type[1],
+                                              regions[3],
+                                              task->regions[3],
+                                              FID_DATA,
+                                              ctx,
+                                              runtime);
+    Domain bias_domain = runtime->get_index_space_domain(
+        ctx, task->regions[3].region.get_index_space());
+    assert(bias_domain.get_dim() == 4);
+  }
+
+  Domain input_grad_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  Domain weight_domain = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+  Domain output_grad_domain = runtime->get_index_space_domain(
+      ctx, task->regions[2].region.get_index_space());
+
+  assert(input_grad_domain.get_dim() == 4);
+  assert(weight_domain.get_dim() == 2);
+  assert(output_grad_domain.get_dim() == 4);
+
+  assert(task->index_point.get_dim() == 1);
+
+  IncMultiHeadSelfAttention::peft_bwd_kernel_wrapper(
+      m,
+      bc,
+      task->index_point.point_data[0],
+      input_grad,
+      weight,
+      output_grad,
+      biases);
+
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    IncMultiHeadSelfAttention::save_inference_tensors_to_file(
+        m, shard_id, bc, {input_grad}, {weight}, {output_grad}, false);
+  }
+}
+
 void IncMultiHeadSelfAttention::backward(FFModel const &ff) {
   // IncMultiHeadSelfAttention does not support backward
   assert(false);
@@ -926,7 +1061,7 @@ IncMultiHeadSelfAttentionParams IncMultiHeadSelfAttention::get_params() const {
   params.quantization_type = this->quantization_type;
   params.offload = this->offload;
   params.num_kv_heads = this->num_kv_heads;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
 
diff --git a/src/ops/inc_multihead_self_attention.cpp b/src/ops/inc_multihead_self_attention.cpp
index d60386f927..826fea4347 100644
--- a/src/ops/inc_multihead_self_attention.cpp
+++ b/src/ops/inc_multihead_self_attention.cpp
@@ -12,13 +12,13 @@
  * See the License for the specific language governing permissions and
  * limitations under the License.
  */
-
 #include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ffconst_utils.h"
 #include "flexflow/ops/kernels/decompress_kernels.h"
 #include "flexflow/ops/kernels/inc_multihead_self_attention_kernels.h"
+#include "flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh"
 #include "flexflow/utils/hip_helper.h"
-#include <hip/hip_complex.h>
+#include "hip/hip_complex.h"
 #include <hip/hip_runtime.h>
 
 namespace FlexFlow {
@@ -27,9 +27,288 @@ namespace FlexFlow {
 using Legion::coord_t;
 using Legion::Memory;
 
+#define WARP_SIZE 32
+
 namespace Kernels {
 namespace IncMultiHeadAttention {
 
+template <typename T>
+__device__ __forceinline__ T
+    WARP_SHFL(unsigned mask, T var, int srcLane, int width = warpSize) {
+#ifndef __HIP_PLATFORM_HCC__
+  return __shfl_sync(mask, var, srcLane, width);
+#else
+  return __shfl(var, srcLane, width);
+#endif
+}
+
+template <typename T>
+__device__ __forceinline__ T
+    WARP_SHFL_XOR(unsigned mask, T var, int laneMask, int width = warpSize) {
+#ifndef __HIP_PLATFORM_HCC__
+  return __shfl_xor_sync(mask, var, laneMask, width);
+#else
+  return __shfl_xor(var, laneMask, width);
+#endif
+}
+
+// gridDim = num_heads
+// blockDim = num_tokens/num_request * head_size
+// QKV tensor layout: |QKV| * num_new_tokens. |Q=K=V=head_size * num_heads|
+// one thread process one head_size
+template <typename DT,
+          int THREADS_PER_BLOCK,
+          int Dh,
+          int Dh_MAX,
+          int THREADS_PER_KEY,
+          int THREADS_PER_VALUE>
+__global__ void compute_attention_kernel_generation_kernel(
+    DT const *query,
+    DT const *key_cache,
+    DT const *value_cache,
+    DT *output_ptr,
+    float const scale,
+    int max_seq_length,
+    int per_head_size,
+    int hidden_size,
+    BatchConfig::PerRequestInfo *request_infos) {
+
+  // q, k
+  using Q_vec = typename VEC_K<DT, THREADS_PER_KEY>::Type;
+  using K_vec = typename VEC_K<DT, THREADS_PER_KEY>::Type;
+  using V_vec = typename VEC_V<DT>::Type;
+  using Out_sum = typename Vec_fp32_<V_vec>::Type;
+
+  constexpr int WARPS_PER_BLOCK = THREADS_PER_BLOCK / WARP_SIZE;
+
+  // eg.  if head_size = 128, thread_per_key = 4, with float32 precision
+  // then K_VEC_SIZE = 1,  QK_VEC_SIZE = 4
+  //  K_ELTS_PER_THREAD = 128 / 4 = 32
+  //  K_VECS_PER_THREAD = 32 / 1 = 32
+  constexpr int K_VEC_SIZE = sizeof(K_vec) / sizeof(DT);
+  // constexpr int QK_VEC_SIZE = 16 / sizeof(DT);
+  // // constexpr int QK_VEC_SIZE = sizeof(Qk_vec_k) / sizeof(DT);
+  constexpr int K_ELTS_PER_THREAD = Dh / THREADS_PER_KEY;
+  constexpr int K_VECS_PER_THREAD = K_ELTS_PER_THREAD / K_VEC_SIZE;
+  // constexpr int QK_ELTS_IN_16B = 16 / sizeof(DT);
+
+  // thread id
+  int const tidx = threadIdx.x;
+  // head id
+  int const head_idx = blockIdx.x;
+  // request idx
+  int const request_idx = blockIdx.y;
+
+  int const batch_config_request_id =
+      request_infos[request_idx].batch_config_request_id;
+
+  int const first_step = 0;
+
+  int const tlength =
+      request_infos[batch_config_request_id].first_token_depth_in_request +
+      request_infos[batch_config_request_id].num_tokens_in_batch;
+
+  // shared memory objects
+  extern __shared__ char smem_[];
+
+  float *qk_smem = reinterpret_cast<float *>(smem_);
+  float *out_smem = reinterpret_cast<float *>(smem_);
+
+  float qk_max = -FLT_MAX;
+
+  // first WARPS_PER_BLOCK for store qk_max, second WARPS_PER_BLOCK for sum
+  __shared__ float red_smem[WARPS_PER_BLOCK * 2];
+
+  const DT *q_ptr = query + request_idx * hidden_size * QKV_WEIGHT_NUM +
+                    head_idx * per_head_size;
+  __shared__ Q_vec q_vecs[THREADS_PER_KEY][K_VECS_PER_THREAD];
+  // DT const *q_ptr =
+  //     query + request_idx * Dh * QKV_WEIGHT_NUM + head_idx * per_head_size;
+
+  // q tensor in this thread
+  // if THREADS_PER_KEY is 4, first thread load 0, 4, 8, 12..., total
+  // K_VECS_PER_THREAD elements
+  // QK_vec_k: 32->1, 64->2, 128->4... head_size
+  // K_vec_k: 4->1, 2->2, 1->4 threads_per_key
+
+  // the start offset of the element eg. (0, 1, 2, 3) * K_VEC_SIZE
+  int ki = tidx % THREADS_PER_KEY * K_VEC_SIZE;
+  int ki_o = tidx % THREADS_PER_KEY;
+  // the first key's offset for this thread
+  // ko = 0, 0, 0, 0, 1, 1, 1, 1, ....
+  int ko = tidx / THREADS_PER_KEY;
+  // load q tensor
+  Q_vec q_vec[K_VECS_PER_THREAD];
+#pragma unroll
+  for (int ii = 0; ii < K_VECS_PER_THREAD; ++ii) {
+    q_vecs[ki_o][ii] = *reinterpret_cast<Q_vec const *>(
+        q_ptr + ki + ii * THREADS_PER_KEY * K_VEC_SIZE);
+  }
+  __syncthreads();
+  // first iter = 128 / 4 = 32
+  // K_VECS_PER_THREAD = 32
+  //  K_PER_ITER how many keys in this loop
+  //  The number of timesteps loaded per iteration.
+  constexpr int K_PER_ITER = THREADS_PER_BLOCK / THREADS_PER_KEY;
+  //   // The number of keys per warp.
+  constexpr int K_PER_WARP = WARP_SIZE / THREADS_PER_KEY;
+
+  DT const *k_cache_batch =
+      key_cache + batch_config_request_id * max_seq_length * hidden_size + ki;
+
+  int ti_end =
+      div_up(tlength - first_step, K_PER_WARP) * K_PER_WARP + first_step;
+  // get k, perform qk proj
+
+  for (int ti = ko; ti < ti_end; ti += K_PER_ITER) {
+    K_vec k[K_VECS_PER_THREAD];
+    int const ti_circ = ti % max_seq_length;
+#pragma unroll
+    for (int ii = 0; ii < K_VECS_PER_THREAD; ++ii) {
+      int jj = ii * THREADS_PER_KEY * K_VEC_SIZE;
+      if (ti < tlength) {
+        k[ii] = *reinterpret_cast<K_vec const *>(k_cache_batch +
+                                                 ti_circ * hidden_size +
+                                                 head_idx * per_head_size + jj);
+      }
+      // Compute dot product.
+      // This includes a reduction across the threads in the same thread group.
+    }
+    float qk = scale * Qk_dot<DT, THREADS_PER_KEY>::dot(q_vecs[ki_o], k);
+    // // todo add positional embedding to the qk production
+    // // Store the product to shared memory. There's one qk value per
+    // timestep.
+    // // Update the max.
+    if (ti < tlength && tidx % THREADS_PER_KEY == 0) {
+      // todo add alobi here
+      bool const mask = ti_circ >= tlength;
+      if (mask) {
+        assert(false);
+      }
+      qk_max = mask ? qk_max : fmaxf(qk_max, qk);
+      qk_smem[ti - first_step] = mask ? 0.f : qk;
+    }
+  }
+
+  __syncthreads();
+
+#pragma unroll
+  for (int mask = WARP_SIZE / 2; mask >= THREADS_PER_KEY; mask /= 2) {
+    qk_max = fmaxf(qk_max, WARP_SHFL_XOR(uint32_t(-1), qk_max, mask));
+  }
+
+  // Decompose the thread index into warp and lane.
+  int const warp = tidx / WARP_SIZE;
+  int const lane = tidx % WARP_SIZE;
+
+  // The warp leader writes the max to shared memory.
+  if (lane == 0) {
+    red_smem[warp] = qk_max;
+  }
+
+  // Make sure the products are in shared memory.
+  __syncthreads();
+
+  // The warps finalize the reduction.
+  qk_max = lane < WARPS_PER_BLOCK ? red_smem[lane] : -FLT_MAX;
+#pragma unroll
+  for (int mask = WARPS_PER_BLOCK / 2; mask >= 1; mask /= 2) {
+    qk_max = fmaxf(qk_max, WARP_SHFL_XOR(uint32_t(-1), qk_max, mask));
+  }
+
+  // Broadcast to all the threads in the warp.
+  qk_max = WARP_SHFL(uint32_t(-1), qk_max, 0);
+
+  float exp_sum = 0.f;
+  for (int ti = first_step + tidx; ti < tlength; ti += THREADS_PER_BLOCK) {
+    float logit = __expf(qk_smem[ti - first_step] - qk_max);
+    exp_sum += logit;
+    qk_smem[ti - first_step] = logit;
+  }
+
+  // Compute the sum.
+  exp_sum = block_sum<WARPS_PER_BLOCK>(&red_smem[WARPS_PER_BLOCK], exp_sum);
+
+  // softmax
+  float inv_sum = __fdividef(1.f, exp_sum + 1.e-6);
+  for (int ti = first_step + tidx; ti < tlength; ti += THREADS_PER_BLOCK) {
+    qk_smem[ti - first_step] *= inv_sum;
+  }
+
+  __syncthreads();
+  // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0) {
+  //   printf("softmax %.10f\n", qk_smem[0]);
+  // }
+
+  // value projection
+  constexpr int V_VEC_SIZE = 16 / sizeof(DT);
+  // A vector of V elements for the current timestep.
+  // using V_vec_k = typename V_vec_k_<DT, V_VEC_SIZE>::Type;
+  // using V_vec_acum = typename V_vec_acum_fp32_<V_vec_k>::Type;
+
+  // The value computed by this thread.
+  int vo = tidx / THREADS_PER_VALUE;
+  // The hidden dimensions computed by this particular thread.
+  int vi = tidx % THREADS_PER_VALUE * V_VEC_SIZE;
+  constexpr int V_PER_ITER = THREADS_PER_BLOCK / THREADS_PER_VALUE;
+
+  Out_sum out;
+  zero(out);
+
+  // The base pointer for the value in the cache buffer.
+  DT const *v_cache_batch =
+      value_cache + batch_config_request_id * max_seq_length * hidden_size + vi;
+
+  if (Dh == Dh_MAX || vi < Dh) {
+    for (int ti = first_step + vo; ti < tlength; ti += V_PER_ITER) {
+      // Load the values from the cache.
+      int const ti_circ = ti % max_seq_length;
+
+      V_vec v = *reinterpret_cast<V_vec const *>(
+          v_cache_batch + ti_circ * hidden_size + head_idx * per_head_size);
+      float logit = qk_smem[ti - first_step];
+      out = FlexFlow::fma(logit, cast_to_float(v), out);
+    }
+  }
+
+  //   // Make sure we can start writing to shared memory.
+  __syncthreads();
+
+  // Run the final reduction amongst the different groups computing different
+  // partial outputs.
+  if (Dh == Dh_MAX || vi < Dh) {
+#pragma unroll
+    for (int active_groups = V_PER_ITER; active_groups >= 2;
+         active_groups /= 2) {
+
+      // The midpoint in the number of active groups.
+      int midpoint = active_groups / 2;
+
+      // The upper part of active threads store to shared memory.
+      if (vo >= midpoint && vo < active_groups && (Dh == Dh_MAX || vi < Dh)) {
+        *reinterpret_cast<Out_sum *>(out_smem + (vo - midpoint) * Dh + vi) =
+            out;
+      }
+      __syncthreads();
+
+      // The bottom warps update their values.
+      if (vo < midpoint && (Dh == Dh_MAX || vi < Dh)) {
+        out = add(*reinterpret_cast<Out_sum const *>(out_smem + vo * Dh + vi),
+                  out);
+      }
+      __syncthreads();
+    }
+  }
+
+  // Output the final values.
+  if (vo == 0 && (Dh == Dh_MAX || vi < Dh)) {
+    convert_from_float(
+        *reinterpret_cast<V_vec *>(output_ptr + request_idx * hidden_size +
+                                   head_idx * per_head_size + vi),
+        out);
+  }
+}
+
 // only used by MPT model. https://arxiv.org/abs/2108.12409
 template <typename DT>
 __global__ void apply_position_bias_qkprd(DT *input_ptr,
@@ -86,8 +365,10 @@ __global__ void apply_proj_bias_qkv(DT *input_ptr,
     // int qkv_index = i / (num_tokens * qProjSize) % 3;
 
     int token_idx = i / (hidden_size * QKV_WEIGHT_NUM);
-    size_t in_token_idx = i - token_idx * hidden_size * 3;
+    size_t in_token_idx = i - token_idx * hidden_size * QKV_WEIGHT_NUM;
+
     int qkv_index = in_token_idx / hidden_size;
+
     int proj_size = qkv_index == 0 ? qProjSize : kProjSize;
 
     int head_idx =
@@ -109,6 +390,7 @@ __global__ void apply_proj_bias_qkv(DT *input_ptr,
     }
   }
 }
+
 template <typename DT>
 __global__ void scaling_query_kernel(DT *input_ptr,
                                      int qProjSize,
@@ -158,6 +440,10 @@ __global__ void
     int token_idx =
         (real_i - head_idx * (num_tokens * proj_size / 2)) / (proj_size / 2);
     size_t pos = tokenInfos[token_idx].abs_depth_in_request;
+
+    // float before_real = complex_input[i].x, before_complex =
+    // complex_input[i].y;
+
     int pos_i = real_i % (proj_size / 2);
     float freq = pos * (1.0 / pow(10000.0, (float)2 * pos_i / proj_size));
     hipFloatComplex complex_pos = {cos(freq), sin(freq)};
@@ -189,7 +475,7 @@ __global__ void
     int head_idx = (real_i - (token_idx * (hidden_size / 2))) / (proj_size / 2);
 
     int real_part_index = idx + head_idx * proj_size +
-                          token_idx * hidden_size * 3 +
+                          token_idx * hidden_size * QKV_WEIGHT_NUM +
                           hidden_size * (q_tensor ? 0 : 1);
     int complex_part_index = real_part_index + (proj_size / 2);
 
@@ -217,28 +503,59 @@ __global__ void
 }
 
 template <typename DT>
-__global__ void store_kv_cache(DT const *devQKVProjArray,
-                               DT *kCache_ptr,
-                               DT *vCache_ptr,
+__global__ void
+    apply_rotary_embedding_bwd(DT *input_ptr,
+                               hipFloatComplex *complex_input,
                                BatchConfig::PerTokenInfo const *tokenInfos,
+                               int proj_size,
                                int num_tokens,
-                               int max_seq_len,
                                int hidden_size) {
   CUDA_KERNEL_LOOP(i, num_tokens * hidden_size) {
-    int token_idx = i / hidden_size;
-    int offset = i % hidden_size;
-    size_t val_idx = token_idx * 3 * hidden_size + hidden_size + offset;
-    DT kVal = devQKVProjArray[val_idx];
-    DT vVal = devQKVProjArray[val_idx + hidden_size];
+    // compute indexes to visit first half proj_size of each of q/k tensor.
+    // devQKVProj has shape [num_tokens, qProjSize, num_heads, 3] in peft_bwd
+    bool q_tensor = i < (num_tokens * hidden_size / 2);
+    int real_i = q_tensor ? i : i - num_tokens * hidden_size / 2;
+    assert(hidden_size % proj_size == 0);
+    int num_heads = hidden_size / proj_size;
+
+    int token_idx = real_i % num_tokens;
+    int idx = (real_i / num_tokens) % (proj_size / 2);
+    int head_idx = real_i / (num_tokens * proj_size / 2);
+    assert(head_idx < num_heads);
 
-    int const req_id = tokenInfos[token_idx].request_index;
-    int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
+    int complex_part_index = (q_tensor ? 0 : 1) * num_tokens * hidden_size +
+                             head_idx * num_tokens * proj_size +
+                             idx * num_tokens + token_idx;
+    int real_part_index = complex_part_index + (proj_size / 2) * num_tokens;
 
-    // key cache
-    kCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
-               offset] = kVal;
-    vCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
-               offset] = vVal;
+    complex_input[i] = {input_ptr[real_part_index],
+                        input_ptr[complex_part_index]};
+
+    size_t pos = tokenInfos[token_idx].abs_depth_in_request;
+
+    float freq = pos * (1.0 / pow(10000.0, (float)2 * idx / proj_size));
+    hipFloatComplex complex_pos = {cos(freq), sin(freq)};
+
+    complex_input[i] = hipCmulf(complex_input[i], complex_pos);
+    input_ptr[real_part_index] = complex_input[i].x;
+    input_ptr[complex_part_index] = complex_input[i].y;
+  }
+}
+
+template <typename DT>
+__global__ void fill_entries_above_diagonal(DT *matrix,
+                                            size_t num_rows,
+                                            size_t num_cols,
+                                            size_t num_q_heads,
+                                            size_t entries_above_diagonal,
+                                            DT value) {
+  CUDA_KERNEL_LOOP(i, entries_above_diagonal * num_q_heads) {
+    size_t head_idx = i / entries_above_diagonal;
+    size_t entry_idx = i % entries_above_diagonal;
+    size_t y = (-1 + sqrt(8 * (float)entry_idx + 1)) / 2;
+    size_t x = entry_idx - y * (y + 1) / 2;
+    y += (num_cols - num_rows) + 1;
+    matrix[head_idx * num_rows * num_cols + num_cols * y + x] = value;
   }
 }
 
@@ -254,56 +571,68 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
 
   checkCUDA(hipblasSetStream(m->handle.blas, stream));
   checkCUDNN(miopenSetStream(m->handle.dnn, stream));
-  DT alpha = 1.0f, beta = 0.0f;
   assert(m->qSize == m->vSize && m->qSize == m->kSize);
-  hipblasDatatype_t hipblas_data_type = ff_to_cuda_datatype(m->output_type[0]);
-#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
-  hipblasDatatype_t compute_type = hipblas_data_type;
-#else
-  // TODO: currently use the hipblas_data_type
-  // cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
-  hipblasDatatype_t compute_type = hipblas_data_type;
-#endif
-  // Compute (W^T)x matmul: einsum(ijkl,im->jmkl)
-  // Weights: qSize x qProjSize x 3 x num_q_heads
-  // Input: qSize x num_tokens
-  // Output >>> qProjSize x num_tokens x 3 x num_q_heads
-  int m_q = m->qProjSize * m->num_q_heads;
-  int m_k = m->kProjSize * m->num_q_heads;
-  int m_v = m->vProjSize * m->num_q_heads;
-  assert(m_q == m_k && m_k == m_v); // keep things simple for now
-  int n = bc->num_active_tokens();
-  int k = m->qSize;
-  int m_ = m_q * QKV_WEIGHT_NUM;
-  int lda = k, ldb = k, ldc = m_;
-  checkCUDA(hipblasGemmEx(m->handle.blas,
-                          HIPBLAS_OP_T,
-                          HIPBLAS_OP_N,
-                          m_,
-                          n,
-                          k,
-                          &alpha,
-                          weight_ptr,
-                          hipblas_data_type,
-                          lda,
-                          input_ptr,
-                          hipblas_data_type,
-                          ldb,
-                          &beta,
-                          output_ptr,
-                          hipblas_data_type,
-                          ldc,
-                          compute_type,
-                          HIPBLAS_GEMM_DEFAULT));
-
-  // apply rotary emmmbedding for q and k
-  // step1 change the k, v to complex tensor
+  hipblasDatatype_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
+  hipblasDatatype_t compute_type = cublas_data_type;
+  // #if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  //   hipblasDatatype_t compute_type = cublas_data_type;
+  // #else
+  //   // For best performance, set the default cublas compute type to
+  //   // CUBLAS_COMPUTE_16F for half precision and to
+  //   // CUBLAS_COMPUTE_32F_FAST_16F for full precision
+  //   hipblasDatatype_t compute_type = CUBLAS_COMPUTE_16F;
+  //   if (m->output_type[0] == DT_FLOAT) {
+  //     compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
+  //   }
+  // #endif
+
+  // Step 1: Compute QKV projections
+  {
+    DT alpha = 1.0f, beta = 0.0f;
+    // after transpositions
+    int m_q = m->qProjSize * m->num_q_heads;
+    int m_k = m->kProjSize * m->num_q_heads;
+    int m_v = m->vProjSize * m->num_q_heads;
+    assert(m_q == m_k && m_k == m_v); // keep things simple for now
+    int n = bc->num_active_infr_tokens();
+    int k = m->qSize;
+    int m_ = m_q * QKV_WEIGHT_NUM;
+    // before transpositions
+    int lda = k, ldb = k, ldc = m_;
+    // matrix A: QKV weights
+    // matrix A's layout: [qSize (hidden_dim), qProjSize, num_heads, 3]
+    // matrix B: input
+    // matrix B's layout: [qSize (hidden_dim), num_new_tokens]
+    // matrix C: devQKVProjArray
+    // matrix B's layout: [qProjSize, num_heads, 3, num_new_tokens]
+    checkCUDA(hipblasGemmEx(m->handle.blas,
+                            HIPBLAS_OP_T,
+                            HIPBLAS_OP_N,
+                            m_,
+                            n,
+                            k,
+                            &alpha,
+                            weight_ptr,
+                            cublas_data_type,
+                            lda,
+                            input_ptr,
+                            cublas_data_type,
+                            ldb,
+                            &beta,
+                            output_ptr,
+                            cublas_data_type,
+                            ldc,
+                            compute_type,
+                            HIPBLAS_GEMM_DEFAULT));
+  }
+
   int num_tokens = bc->num_active_tokens();
   int parallelism = m->kProjSize * num_tokens * m->num_q_heads;
   size_t q_array_size = m->qProjSize * num_tokens * m->num_q_heads;
-  // apply bias for q, k, v
+
+  // Step 2: apply bias for QKV, or scale the query
   if (*m->qkv_bias) {
-    hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_proj_bias_qkv<DT>),
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_proj_bias_qkv),
                        GET_BLOCKS(parallelism),
                        min(CUDA_NUM_THREADS, parallelism),
                        0,
@@ -321,7 +650,7 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                        m->scaling_factor,
                        m->hidden_size);
   } else if (m->scaling_query) {
-    hipLaunchKernelGGL(HIP_KERNEL_NAME(scaling_query_kernel<DT>),
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(scaling_query_kernel),
                        GET_BLOCKS(parallelism),
                        min(CUDA_NUM_THREADS, parallelism),
                        0,
@@ -333,10 +662,12 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                        m->scaling_factor,
                        m->hidden_size);
   }
+
+  // Step 3: apply rotary embedding if needed
   if (*m->apply_rotary_embedding) {
     /*q&k*/
     parallelism = num_tokens * m->hidden_size;
-    hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_rotary_embedding_hf<DT>),
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_rotary_embedding_hf),
                        GET_BLOCKS(parallelism),
                        min(CUDA_NUM_THREADS, parallelism),
                        0,
@@ -352,14 +683,42 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
   }
 }
 
+template <typename DT>
+__global__ void store_kv_cache(DT const *devQKVProjArray,
+                               DT *kCache_ptr,
+                               DT *vCache_ptr,
+                               BatchConfig::PerTokenInfo const *tokenInfos,
+                               int num_tokens,
+                               int max_seq_len,
+                               int hidden_size) {
+  CUDA_KERNEL_LOOP(i, num_tokens * hidden_size) {
+    int token_idx = i / hidden_size;
+    int offset = i % hidden_size;
+
+    size_t val_idx =
+        token_idx * QKV_WEIGHT_NUM * hidden_size + hidden_size + offset;
+
+    DT kVal = devQKVProjArray[val_idx];
+    DT vVal = devQKVProjArray[val_idx + hidden_size];
+    int const req_id = tokenInfos[token_idx].request_index;
+    int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
+
+    // key cache
+    kCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
+               offset] = kVal;
+    vCache_ptr[req_id * (hidden_size * max_seq_len) + tok_id * hidden_size +
+               offset] = vVal;
+  }
+}
+
 template <typename DT>
 void update_kv_cache_kernel(IncMultiHeadSelfAttentionMeta const *m,
                             BatchConfig const *bc,
                             hipStream_t stream) {
-  int num_tokens = bc->num_active_tokens();
+  int num_tokens = bc->num_active_infr_tokens();
   if (num_tokens > 0) {
     int parallelism = m->hidden_size * num_tokens;
-    hipLaunchKernelGGL(HIP_KERNEL_NAME(store_kv_cache<DT>),
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(store_kv_cache),
                        GET_BLOCKS(parallelism),
                        min(CUDA_NUM_THREADS, parallelism),
                        0,
@@ -374,6 +733,129 @@ void update_kv_cache_kernel(IncMultiHeadSelfAttentionMeta const *m,
   }
 }
 
+template <typename DT>
+void compute_o_prod_bias(IncMultiHeadSelfAttentionMeta const *m,
+                         BatchConfig const *bc,
+                         int shard_id,
+                         DT *output_ptr,
+                         DT const *weight_ptr,
+                         DT const *bias_ptr,
+                         int num_tokens,
+                         hipStream_t stream) {
+  hipblasDatatype_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
+  miopenDataType_t cudnn_data_type = ff_to_cudnn_datatype(m->output_type[0]);
+  assert(data_type_size(m->output_type[0]) == sizeof(DT));
+#if CUDA_VERSION >= 11000
+  // TODO: currently set the default to CUBLAS_COMPUTE_16F for best performance
+  hipblasDatatype_t compute_type = HIPBLAS_R_16F;
+#else
+  hipblasDatatype_t compute_type = cublas_data_type;
+#endif
+  // Project to output, save result directly on output tensor
+  {
+    DT alpha = 1.0f, beta = 0.0f;
+    // after transpositions
+    int m_ = m->oProjSize;
+    int k = m->vProjSize * m->num_q_heads;
+    int n = num_tokens;
+    // before transpositions
+    int lda = k, ldb = k, ldc = m_;
+    // matrix A: output projection weight
+    // matrix A's layout: [vProjSize * num_heads, oProjSize]
+    DT const *A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
+                                           m->kProjSize * m->num_q_heads +
+                                           m->vProjSize * m->num_q_heads);
+    // matrix B: attn heads
+    // matrix B's layout: [vProjSize * num_heads, num_new_tokens]
+    DT const *B = static_cast<DT *>(m->attn_heads);
+    // matrix B: output
+    // matrix B's layout: [oProjSize, num_new_tokens]
+    DT *C = static_cast<DT *>(output_ptr);
+
+    checkCUDA(hipblasGemmEx(m->handle.blas,
+                            HIPBLAS_OP_T,
+                            HIPBLAS_OP_N,
+                            m_,
+                            n,
+                            k,
+                            &alpha,
+                            A,
+                            cublas_data_type,
+                            lda,
+                            B,
+                            cublas_data_type,
+                            ldb,
+                            &beta,
+                            C,
+                            cublas_data_type,
+                            ldc,
+                            compute_type,
+                            HIPBLAS_GEMM_DEFAULT));
+  }
+  // Add final output bias
+  if (*m->final_bias && shard_id == 0) {
+    int parallelism = m->oProjSize * num_tokens;
+    int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
+                          m->kProjSize * m->global_num_q_heads +
+                          m->vProjSize * m->global_num_q_heads;
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_proj_bias_w),
+                       GET_BLOCKS(parallelism),
+                       min(CUDA_NUM_THREADS, parallelism),
+                       0,
+                       stream,
+                       output_ptr,
+                       bias_ptr,
+                       num_tokens,
+                       qkv_weight_size,
+                       m->oProjSize);
+  }
+}
+
+#define LAUNCH_ATTENTION_SCORE_KERNEL(                                         \
+    DT, Dh, Dh_MAX, THDS_PER_KEY, THREADS_PER_VALUE, THDS_PER_BLOCK, stream)   \
+  smem_sz = smem_size_in_bytes<DT>(m->qProjSize,                               \
+                                   BatchConfig::max_sequence_length(),         \
+                                   THREADS_PER_VALUE,                          \
+                                   THDS_PER_BLOCK);                            \
+  compute_attention_kernel_generation_kernel<DT,                               \
+                                             THDS_PER_BLOCK,                   \
+                                             Dh,                               \
+                                             Dh_MAX,                           \
+                                             THDS_PER_KEY,                     \
+                                             THREADS_PER_VALUE>                \
+      <<<grid, THDS_PER_BLOCK, smem_sz, stream>>>(                             \
+          static_cast<DT *>(m->devQKVProjArray),                               \
+          static_cast<DT *>(m->keyCache),                                      \
+          static_cast<DT *>(m->valueCache),                                    \
+          output_ptr,                                                          \
+          scale,                                                               \
+          BatchConfig::max_sequence_length(),                                  \
+          m->qProjSize,                                                        \
+          m->hidden_size,                                                      \
+          m->request_infos)
+
+template <typename DT>
+void compute_attention_kernel_generation(IncMultiHeadSelfAttentionMeta const *m,
+                                         BatchConfig const *bc,
+                                         DT *output_ptr,
+                                         hipStream_t stream) {
+  dim3 grid(m->num_q_heads, bc->num_generation_tokens);
+  int const per_head_size = m->qProjSize;
+  float scale = (*m->qk_prod_scaling) ? 1.0f / sqrt(m->kProjSize) : 1.0f;
+  size_t smem_sz;
+  if (per_head_size == 64) {
+    constexpr int THREADS_PER_VALUE_64 = threads_per_value_t<DT, 64>::value;
+    LAUNCH_ATTENTION_SCORE_KERNEL(
+        DT, 64, 64, 4, THREADS_PER_VALUE_64, 128, stream);
+  } else if (per_head_size == 128) {
+    constexpr int THREADS_PER_VALUE_128 = threads_per_value_t<DT, 128>::value;
+    LAUNCH_ATTENTION_SCORE_KERNEL(
+        DT, 128, 128, 4, THREADS_PER_VALUE_128, 128, stream);
+  } else {
+    assert(false && "a unsupported head size");
+  }
+}
+
 template <typename DT>
 void pre_build_weight_kernel(IncMultiHeadSelfAttentionMeta const *m,
                              GenericTensorAccessorR const weight,
@@ -393,27 +875,29 @@ void pre_build_weight_kernel(IncMultiHeadSelfAttentionMeta const *m,
 
     if (m->quantization_type == DT_INT4) {
       int parallelism = m->qProjSize * m->qSize * m->num_q_heads / 2;
-      decompress_int4_attention_weights<<<GET_BLOCKS(parallelism),
-                                          min(CUDA_NUM_THREADS, parallelism),
-                                          0,
-                                          stream>>>(
-          m->quantized_weight_ptr,
-          static_cast<DT *>(m->weight_ptr),
-          m->qProjSize,
-          m->qSize,
-          m->num_q_heads);
+      hipLaunchKernelGGL(HIP_KERNEL_NAME(decompress_int4_attention_weights),
+                         GET_BLOCKS(parallelism),
+                         min(CUDA_NUM_THREADS, parallelism),
+                         0,
+                         stream,
+                         m->quantized_weight_ptr,
+                         static_cast<DT *>(m->weight_ptr),
+                         m->qProjSize,
+                         m->qSize,
+                         m->num_q_heads);
     } else {
       assert(m->quantization_type == DT_INT8);
       int parallelism = m->qProjSize * m->qSize * m->num_q_heads;
-      decompress_int8_attention_weights<<<GET_BLOCKS(parallelism),
-                                          min(CUDA_NUM_THREADS, parallelism),
-                                          0,
-                                          stream>>>(
-          m->quantized_weight_ptr,
-          static_cast<DT *>(m->weight_ptr),
-          m->qProjSize,
-          m->qSize,
-          m->num_q_heads);
+      hipLaunchKernelGGL(HIP_KERNEL_NAME(decompress_int8_attention_weights),
+                         GET_BLOCKS(parallelism),
+                         min(CUDA_NUM_THREADS, parallelism),
+                         0,
+                         stream,
+                         m->quantized_weight_ptr,
+                         static_cast<DT *>(m->weight_ptr),
+                         m->qProjSize,
+                         m->qSize,
+                         m->num_q_heads);
     }
   } else {
     if (data_type == DT_FLOAT) {
@@ -435,7 +919,7 @@ void pre_build_weight_kernel(IncMultiHeadSelfAttentionMeta const *m,
 }
 
 template <typename DT>
-void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
+void inference_kernel(IncMultiHeadSelfAttentionMeta *m,
                       BatchConfig const *bc,
                       int shard_id,
                       DT const *input_ptr,
@@ -443,19 +927,13 @@ void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
                       DT *output_ptr,
                       DT const *bias_ptr,
                       hipStream_t stream) {
-  // here because we need postion info in infernece 1
 
   if (m->offload && m->biasSize > 0) {
     checkCUDA(hipMemcpyAsync(
         m->bias_ptr, bias_ptr, m->biasSize, hipMemcpyHostToDevice, stream));
     bias_ptr = static_cast<DT *>(m->bias_ptr);
   }
-  checkCUDA(hipMemcpyAsync(m->token_infos,
-                           &(bc->tokensInfo),
-                           bc->num_active_tokens() *
-                               sizeof(BatchConfig::PerTokenInfo),
-                           hipMemcpyHostToDevice,
-                           stream));
+
   // phase 1: Implement kernel to compute KQV for input tokens
   compute_qkv_kernel(m,
                      bc,
@@ -465,14 +943,520 @@ void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
                      static_cast<DT *>(m->devQKVProjArray),
                      bias_ptr,
                      stream);
-
-  // phase 2: Update key/val cache
   update_kv_cache_kernel<DT>(m, bc, stream);
 
-  // phase 3: Compute attention score
-  // 3 kernels for pahse 3: matmul1 - softmax - matmal2
-  compute_attention_kernel(
-      m, bc, shard_id, output_ptr, bias_ptr, weight_ptr, stream);
+  if (bc->num_generation_tokens > 0) {
+    // phase 3: Compute attention score for generation tokens
+    compute_attention_kernel_generation<DT>(
+        m, bc, static_cast<DT *>(m->attn_heads), stream);
+  }
+
+  if (bc->num_tokens > bc->num_generation_tokens) {
+    // phase 4: Compute attention score for prompt tokens;
+    compute_attention_kernel_prompt(
+        m, bc, shard_id, bias_ptr, weight_ptr, stream);
+  }
+
+  // compute output production and bias together for all tokens
+  int num_tokens = bc->num_active_tokens();
+  compute_o_prod_bias(
+      m, bc, shard_id, output_ptr, weight_ptr, bias_ptr, num_tokens, stream);
+}
+
+std::string get_peft_dbg_folder(IncMultiHeadSelfAttentionMeta const *m,
+                                int shard_id) {
+  std::string op_name_without_uid =
+      IncMultiHeadSelfAttention::get_op_name_without_uid(m);
+  fs::path dst_filepath = get_dst_folder("bwd", m->bwd_step, shard_id);
+  if (m->layer_guid.model_id > 0) {
+    assert(false && "Model ID > 0 not supported yet");
+  }
+  std::string layername = "layers." +
+                          std::to_string(m->layer_guid.transformer_layer_id) +
+                          "." + op_name_without_uid;
+  dst_filepath /= layername;
+  return dst_filepath.string();
+}
+
+template <typename DT>
+void peft_bwd_kernel(IncMultiHeadSelfAttentionMeta const *m,
+                     BatchConfig const *bc,
+                     int shard_id,
+                     DT *input_grad_ptr,
+                     DT const *weight_ptr,
+                     DT const *output_grad_ptr,
+                     DT const *bias_ptr,
+                     hipStream_t stream) {
+  assert(!m->offload);
+  checkCUDA(hipblasSetStream(m->handle.blas, stream));
+  checkCUDNN(miopenSetStream(m->handle.dnn, stream));
+  hipblasDatatype_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
+  miopenDataType_t cudnn_data_type = ff_to_cudnn_datatype(m->output_type[0]);
+  assert(data_type_size(m->output_type[0]) == sizeof(DT));
+  hipblasDatatype_t compute_type = cublas_data_type;
+  // #if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  //   hipblasDatatype_t compute_type = cublas_data_type;
+  // #else
+  //   // For best performance, set the default cublas compute type to
+  //   // CUBLAS_COMPUTE_16F for half precision and to
+  //   // CUBLAS_COMPUTE_32F_FAST_16F for full precision
+  //   hipblasDatatype_t compute_type = CUBLAS_COMPUTE_16F;
+  //   if (m->output_type[0] == DT_FLOAT) {
+  //     compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
+  //   }
+  // #endif
+
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    if (!bc->requestsInfo[i].peft_bwd) {
+      continue;
+    }
+    int num_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+    int num_total_tokens = bc->requestsInfo[i].first_token_depth_in_request +
+                           bc->requestsInfo[i].num_tokens_in_batch;
+    // Currently assume we are calculating gradients for all tokens
+    // of a request
+    assert(num_tokens == num_total_tokens);
+    int kt_block_size = m->kProjSize;
+    int kt_req_block_size =
+        kt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+    int vt_block_size = m->vProjSize;
+    int vt_req_block_size =
+        vt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+    assert(m->qProjSize == m->kProjSize && m->kProjSize == m->vProjSize);
+    // Step 1: compute gradients before final projection
+    {
+      int m_ = m->vProjSize * m->num_q_heads;
+      int n_ = num_tokens;
+      int k_ = m->oProjSize;
+      int lda = m_;
+      int ldb = k_;
+      int ldc = m_;
+      float alpha = 1.0f, beta = 0.0f;
+      // matrix A: output projection weight
+      // matrix A's layout: [vProjSize * num_heads, oProjSize]
+      DT const *A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
+                                             m->kProjSize * m->num_q_heads +
+                                             m->vProjSize * m->num_q_heads);
+      // matrix B: output gradients
+      // matrix B's layout: [oProjSize, num_new_tokens]
+      DT const *B =
+          output_grad_ptr +
+          bc->requestsInfo[i].first_token_offset_in_batch * m->oProjSize;
+      // matrix C: attn_heads gradients
+      // matrix C's layout: [vProjSize * num_heads, num_new_tokens]
+      DT *C = static_cast<DT *>(m->handle.workSpace);
+      checkCUDA(hipblasGemmEx(m->handle.blas,
+                              HIPBLAS_OP_N,
+                              HIPBLAS_OP_N,
+                              m_,
+                              n_,
+                              k_,
+                              &alpha,
+                              A,
+                              cublas_data_type,
+                              lda,
+                              B,
+                              cublas_data_type,
+                              ldb,
+                              &beta,
+                              C,
+                              cublas_data_type,
+                              ldc,
+                              compute_type,
+                              HIPBLAS_GEMM_DEFAULT));
+      if (m->inference_debugging) {
+        // save result to file for checking
+        std::string filename =
+            get_peft_dbg_folder(m, shard_id) + ".o_proj.input_gradient_0";
+        save_tensor(C, m_ * n_, filename.c_str());
+      }
+    }
+    // Step 2: compute gradients w.r.t. value
+    {
+      float alpha = 1.0f, beta = 0.0f;
+      // matrix A: qk_prods_softmax
+      // matrix A's layout: [num_new_tokens, total_tokens, num_heads]
+      DT const *A = static_cast<DT *>(m->qk_prods_softmax);
+      // matrix B: attn_heads gradients
+      // matrix B's layout: [vProjSize * num_heads, num_new_tokens]
+      DT const *B = static_cast<DT *>(m->handle.workSpace);
+      // matrix C: gradients for value (saved as part of m->devQKVProjArray)
+      // matrix C's layout: [num_tokens, qProjsize * num_heads, 3]
+      DT *C = static_cast<DT *>(m->devQKVProjArray) +
+              2 * num_tokens *
+                  (m->qProjSize * m->num_q_heads); // skip over regions reserved
+                                                   // for Q and K gradients
+      // after transpositions
+      int m_ = num_tokens;   // total_tokens
+      int n_ = m->vProjSize; // num_new_tokens
+      int k_ = num_tokens;   // num_new_tokens
+      // before transpositions
+      int lda = num_tokens; // num_new_tokens
+      int ldb = m->vProjSize * m->num_q_heads;
+      int ldc = num_tokens; // total_tokens
+      // N.B. strides are applied before transpose operations
+      int strideA = num_tokens * num_tokens; // num_new_tokens * total_tokens
+      int strideB = m->vProjSize;
+      int strideC = num_tokens * m->vProjSize;
+      checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
+                                            HIPBLAS_OP_T,
+                                            HIPBLAS_OP_T,
+                                            m_,
+                                            n_,
+                                            k_,
+                                            &alpha,
+                                            A,
+                                            cublas_data_type,
+                                            lda,
+                                            strideA,
+                                            B,
+                                            cublas_data_type,
+                                            ldb,
+                                            strideB,
+                                            &beta,
+                                            C,
+                                            cublas_data_type,
+                                            ldc,
+                                            strideC,
+                                            m->num_q_heads,
+                                            compute_type,
+                                            HIPBLAS_GEMM_DEFAULT));
+      // save result to file for checking
+      if (m->inference_debugging) {
+        std::string filename =
+            get_peft_dbg_folder(m, shard_id) + ".v_proj.input_gradient_0";
+        save_tensor(C, m_ * n_ * m->num_q_heads, filename.c_str());
+        std::string filename2 =
+            get_peft_dbg_folder(m, shard_id) + ".qk_prods.softmax";
+        save_tensor(A, m_ * k_ * m->num_q_heads, filename2.c_str());
+      }
+    }
+    // Step 3: compute gradients w.r.t. the qk_prods_softmax tensor
+    {
+      float alpha = 1.0f, beta = 0.0f;
+      // matrix A: attn_heads gradients
+      // matrix A's layout: [vProjSize * num_heads, num_new_tokens]
+      DT const *A = static_cast<DT *>(m->handle.workSpace);
+      // matrix B: value cache
+      // matrix B's layout: [vProjSize * num_heads, max_num_tokens, num_req]
+      DT const *B = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
+      // matrix C: qk_prods_softmax gradients
+      // matrix C's layout: [num_new_tokens, total_tokens, num_heads]
+      DT *C = static_cast<DT *>(m->qk_prods_softmax);
+      // after transposition & striding
+      int m_ = num_tokens; // num_new_tokens
+      int n_ = num_tokens;
+      int k_ = m->vProjSize;
+      // before transposition and striding
+      int lda = m->vProjSize * m->num_q_heads;
+      int ldb = m->vProjSize * m->num_q_heads;
+      int ldc = num_tokens; // num_new_tokens
+      int strideA = m->vProjSize;
+      int strideB = m->vProjSize;
+      int strideC = num_tokens * num_tokens; // num_new_tokens * total_tokens
+
+      checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
+                                            HIPBLAS_OP_T,
+                                            HIPBLAS_OP_N,
+                                            m_,
+                                            n_,
+                                            k_,
+                                            &alpha,
+                                            A,
+                                            cublas_data_type,
+                                            lda,
+                                            strideA,
+                                            B,
+                                            cublas_data_type,
+                                            ldb,
+                                            strideB,
+                                            &beta,
+                                            C,
+                                            cublas_data_type,
+                                            ldc,
+                                            strideC,
+                                            m->num_q_heads,
+                                            compute_type,
+                                            HIPBLAS_GEMM_DEFAULT));
+      if (m->inference_debugging) {
+        std::string filename =
+            get_peft_dbg_folder(m, shard_id) + ".qk_prods.softmax_grad";
+        save_tensor(
+            C, num_tokens * num_tokens * m->num_q_heads, filename.c_str());
+        std::string filename2 = get_peft_dbg_folder(m, shard_id) + ".vcache";
+        save_tensor(
+            B, m->vProjSize * m->num_q_heads * num_tokens, filename2.c_str());
+      }
+    }
+    // Step 4: softmax backpropagation
+    {
+      float alpha = 1.0f, beta = 0.0f;
+      int n_param = m->num_q_heads;
+      int c_param = num_tokens;
+      int h_param = 1;
+      int w_param = num_tokens;
+      checkCUDNN(miopenSet4dTensorDescriptor(
+          m->qk_tensor, cudnn_data_type, n_param, c_param, h_param, w_param));
+      checkCUDNN(miopenSoftmaxBackward_V2(m->handle.dnn,
+                                          &alpha,
+                                          m->qk_tensor,
+                                          m->softmax_activation_buffer,
+                                          m->qk_tensor,
+                                          m->qk_prods_softmax,
+                                          &beta,
+                                          m->qk_tensor,
+                                          m->qk_prods,
+                                          MIOPEN_SOFTMAX_ACCURATE,
+                                          MIOPEN_SOFTMAX_MODE_CHANNEL));
+
+      if (m->inference_debugging) {
+        DT *C = static_cast<DT *>(m->qk_prods);
+        std::string filename =
+            get_peft_dbg_folder(m, shard_id) + ".qk_prods.softmax_grad_in";
+        save_tensor(
+            C, num_tokens * num_tokens * m->num_q_heads, filename.c_str());
+      }
+
+      //  TODO: fill all elements above diagonal to force causal attention
+      size_t entries_above_diagonal = num_tokens * (num_tokens - 1) / 2;
+      if (entries_above_diagonal > 0) {
+        size_t parallelism = m->num_q_heads * entries_above_diagonal;
+        hipLaunchKernelGGL(HIP_KERNEL_NAME(fill_entries_above_diagonal),
+                           GET_BLOCKS(parallelism),
+                           min((size_t)CUDA_NUM_THREADS, parallelism),
+                           0,
+                           stream,
+                           static_cast<DT *>(m->qk_prods),
+                           num_tokens,
+                           num_tokens,
+                           m->num_q_heads,
+                           entries_above_diagonal,
+                           DT(0.0f));
+      }
+      if (m->inference_debugging) {
+        DT *C = static_cast<DT *>(m->qk_prods);
+        std::string filename = get_peft_dbg_folder(m, shard_id) +
+                               ".qk_prods.softmax_grad_in.masked";
+        save_tensor(
+            C, num_tokens * num_tokens * m->num_q_heads, filename.c_str());
+      }
+    }
+    // Step 5: compute gradients w.r.t. key
+    {
+      float alpha = 1.0f, beta = 0.0f;
+      if (*m->qk_prod_scaling) {
+        alpha = 1.0f / sqrt(m->kProjSize);
+      }
+      // matrix A: gradients w.r.t. qk_prods
+      // matrix A's layout: [num_new_tokens, num_tokens, num_heads]
+      DT const *A = static_cast<DT *>(m->qk_prods);
+      // matrix B: query activation (in query_activation_buffer)
+      // matrix B's layout: [m->qProjSize * num_heads, num_new_tokens]
+      DT const *B = static_cast<DT *>(m->query_activation_buffer);
+      // matrix C: gradients for key (saved as part of m->devQKVProjArray)
+      // matrix C's layout: [num_tokens, qProjsize * num_heads, 3]
+      DT *C =
+          static_cast<DT *>(m->devQKVProjArray) +
+          num_tokens *
+              (m->qProjSize *
+               m->num_q_heads); // skip over regions reserved for Q gradients
+      // after transposition & striding
+      int m_ = num_tokens;
+      int n_ = m->kProjSize;
+      int k_ = num_tokens; // num_new_tokens
+      // before transposition and striding
+      int lda = num_tokens; // num_new_tokens
+      int ldb = m->kProjSize * m->num_q_heads;
+      int ldc = num_tokens;
+      int strideA = num_tokens * num_tokens;
+      int strideB = m->kProjSize;
+      int strideC = num_tokens * m->kProjSize;
+      checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
+                                            HIPBLAS_OP_T,
+                                            HIPBLAS_OP_T,
+                                            m_,
+                                            n_,
+                                            k_,
+                                            &alpha,
+                                            A,
+                                            cublas_data_type,
+                                            lda,
+                                            strideA,
+                                            B,
+                                            cublas_data_type,
+                                            ldb,
+                                            strideB,
+                                            &beta,
+                                            C,
+                                            cublas_data_type,
+                                            ldc,
+                                            strideC,
+                                            m->num_q_heads,
+                                            compute_type,
+                                            HIPBLAS_GEMM_DEFAULT));
+      if (m->inference_debugging) {
+        std::string filename =
+            get_peft_dbg_folder(m, shard_id) + ".query_activation";
+        save_tensor(
+            B, m->qProjSize * m->num_q_heads * num_tokens, filename.c_str());
+        std::string filename2 =
+            get_peft_dbg_folder(m, shard_id) + ".devkproj_pre";
+        save_tensor(
+            C, num_tokens * (m->qProjSize * m->num_q_heads), filename2.c_str());
+      }
+    }
+    // Step 6: compute gradients w.r.t query
+    {
+      float alpha = 1.0f, beta = 0.0f;
+      if (*m->qk_prod_scaling) {
+        alpha = 1.0f / sqrt(m->kProjSize);
+      }
+      // matrix A: gradients w.r.t. qk_prods
+      // matrix A's layout: [num_new_tokens, num_tokens, num_heads]
+      DT const *A = static_cast<DT *>(m->qk_prods);
+      // matrix B: key cache
+      // matrix B's layout: [vProjSize * num_heads, max_num_tokens, num_req]
+      DT const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
+      // matrix C: gradients for query (saved as part of m->devQKVProjArray)
+      // matrix C's layout: [num_tokens, qProjsize * num_heads, 3]
+      DT *C = static_cast<DT *>(m->devQKVProjArray);
+      // after transposition & striding
+      int m_ = num_tokens; // num_new_tokens
+      int n_ = m->qProjSize;
+      int k_ = num_tokens;
+      // before transposition and striding
+      int lda = num_tokens; // num_new_tokens
+      int ldb = m->qProjSize * m->num_q_heads;
+      int ldc = num_tokens;
+      int strideA = num_tokens * num_tokens;
+      int strideB = m->qProjSize;
+      int strideC = num_tokens * m->qProjSize;
+      checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
+                                            HIPBLAS_OP_N,
+                                            HIPBLAS_OP_T,
+                                            m_,
+                                            n_,
+                                            k_,
+                                            &alpha,
+                                            A,
+                                            cublas_data_type,
+                                            lda,
+                                            strideA,
+                                            B,
+                                            cublas_data_type,
+                                            ldb,
+                                            strideB,
+                                            &beta,
+                                            C,
+                                            cublas_data_type,
+                                            ldc,
+                                            strideC,
+                                            m->num_q_heads,
+                                            compute_type,
+                                            HIPBLAS_GEMM_DEFAULT));
+      if (m->inference_debugging) {
+        std::string filename =
+            get_peft_dbg_folder(m, shard_id) + ".devQKVPRojArray_pre";
+        save_tensor(C,
+                    num_tokens * m->qProjSize * m->num_q_heads * 3,
+                    filename.c_str());
+      }
+    }
+
+    // Step 7: perform rotary position embeddings (RoPE) bwd
+    {
+      if (*m->apply_rotary_embedding) {
+        assert(m->hidden_size == m->qProjSize * m->num_q_heads);
+        assert(m->qProjSize == m->kProjSize);
+        /*q&k*/
+        int parallelism = num_tokens * m->hidden_size;
+        DT *A = static_cast<DT *>(m->devQKVProjArray);
+        hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_rotary_embedding_bwd),
+                           GET_BLOCKS(parallelism),
+                           min(CUDA_NUM_THREADS, parallelism),
+                           0,
+                           stream,
+                           A,
+                           m->complex_input,
+                           m->token_infos,
+                           m->qProjSize,
+                           num_tokens,
+                           m->hidden_size);
+        DT *C = static_cast<DT *>(m->devQKVProjArray);
+        if (m->inference_debugging) {
+          std::string filename =
+              get_peft_dbg_folder(m, shard_id) + ".devQKVPRojArray";
+          save_tensor(C,
+                      num_tokens * m->qProjSize * m->num_q_heads * 3,
+                      filename.c_str());
+        }
+      }
+
+      // matrix C: gradients for key (saved as part of m->devQKVProjArray)
+      // matrix C's layout: [num_tokens, qProjsize * num_heads, 3]
+      DT *C =
+          static_cast<DT *>(m->devQKVProjArray) +
+          num_tokens *
+              (m->qProjSize *
+               m->num_q_heads); // skip over regions reserved for Q gradients
+      if (m->inference_debugging) {
+        std::string filename = get_peft_dbg_folder(m, shard_id) + ".devkproj";
+        save_tensor(
+            C, num_tokens * (m->qProjSize * m->num_q_heads), filename.c_str());
+      }
+    }
+
+    // Step 8: compute gradients w.r.t. input
+    {
+      float alpha = 1.0f, beta = 0.0f;
+      if (!m->reset_input_grads[0]) {
+        beta = 1.0f;
+      }
+      // matrix A: QKV projection weights
+      // matrix A's layout: [qSize, qProjSize * num_q_heads, 3]
+      DT const *A = weight_ptr;
+      // matrix B: gradients w.r.t. QKV (concatenated in devQKVArray)
+      // matrix B's layout: [num_tokens, qProjsize * num_heads, 3]
+      DT const *B = static_cast<DT *>(m->devQKVProjArray);
+      // matrix C: gradients w.r.t. input
+      // matrix C's layout: [m->qSize, num_tokens]
+      DT *C = input_grad_ptr +
+              bc->requestsInfo[i].first_token_offset_in_batch * m->qSize;
+      int m_ = m->qSize;
+      int n_ = num_tokens;
+      int k_ = m->num_q_heads * (m->qProjSize + m->kProjSize + m->vProjSize);
+      int lda = m_;
+      int ldb = n_;
+      int ldc = m_;
+      checkCUDA(hipblasGemmEx(m->handle.blas,
+                              HIPBLAS_OP_N,
+                              HIPBLAS_OP_T,
+                              m_,
+                              n_,
+                              k_,
+                              &alpha,
+                              A,
+                              cublas_data_type,
+                              lda,
+                              B,
+                              cublas_data_type,
+                              ldb,
+                              &beta,
+                              C,
+                              cublas_data_type,
+                              ldc,
+                              compute_type,
+                              HIPBLAS_GEMM_DEFAULT));
+      if (m->inference_debugging) {
+        std::string filename =
+            get_peft_dbg_folder(m, shard_id) + ".self_attn.input_gradient_0";
+        save_tensor(C, num_tokens * m->qSize, filename.c_str());
+      }
+    }
+  }
 }
 
 } // namespace IncMultiHeadAttention
@@ -481,42 +1465,47 @@ void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
 using namespace Kernels::IncMultiHeadAttention;
 
 template <typename DT>
-__global__ void fill_entries_above_diagonal(DT *matrix,
-                                            size_t num_rows,
-                                            size_t num_cols,
-                                            size_t num_q_heads,
-                                            size_t entries_above_diagonal,
-                                            DT value) {
-  CUDA_KERNEL_LOOP(i, entries_above_diagonal * num_q_heads) {
-    size_t head_idx = i / entries_above_diagonal;
-    size_t entry_idx = i % entries_above_diagonal;
-    size_t y = (-1 + sqrt(8 * (float)entry_idx + 1)) / 2;
-    size_t x = entry_idx - y * (y + 1) / 2;
-    y += (num_cols - num_rows) + 1;
-    matrix[head_idx * num_rows * num_cols + num_cols * y + x] = value;
+__global__ void store_query_cache(DT const *devQKVProjArray,
+                                  DT *qCache_ptr,
+                                  int num_tokens,
+                                  int hidden_size) {
+  CUDA_KERNEL_LOOP(i, num_tokens * hidden_size) {
+    int token_idx = i / hidden_size;
+    int offset = i % hidden_size;
+
+    size_t val_idx = token_idx * QKV_WEIGHT_NUM * hidden_size + offset;
+
+    DT qVal = devQKVProjArray[val_idx];
+
+    // query cache
+    qCache_ptr[i] = qVal;
   }
 }
 
 template <typename DT>
-void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
-                              BatchConfig const *bc,
-                              int shard_id,
-                              DT *output_ptr,
-                              DT const *bias_ptr,
-                              DT const *weight_ptr,
-                              hipStream_t stream) {
+void compute_attention_kernel_prompt(IncMultiHeadSelfAttentionMeta *m,
+                                     BatchConfig const *bc,
+                                     int shard_id,
+                                     DT const *bias_ptr,
+                                     DT const *weight_ptr,
+                                     hipStream_t stream) {
   checkCUDA(hipblasSetStream(m->handle.blas, stream));
   checkCUDNN(miopenSetStream(m->handle.dnn, stream));
-  hipblasDatatype_t hipblas_data_type = ff_to_cuda_datatype(m->output_type[0]);
-  miopenDataType_t miopen_data_type = ff_to_cudnn_datatype(m->output_type[0]);
+  hipblasDatatype_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
+  miopenDataType_t cudnn_data_type = ff_to_cudnn_datatype(m->output_type[0]);
   assert(data_type_size(m->output_type[0]) == sizeof(DT));
-#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
-  hipblasDatatype_t compute_type = hipblas_data_type;
-#else
-  // TODO: currently use the hipblas_data_type
-  // cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
-  hipblasDatatype_t compute_type = hipblas_data_type;
-#endif
+  hipblasDatatype_t compute_type = cublas_data_type;
+  // #if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  //   hipblasDatatype_t compute_type = cublas_data_type;
+  // #else
+  //   // For best performance, set the default cublas compute type to
+  //   // CUBLAS_COMPUTE_16F for half precision and to
+  //   // CUBLAS_COMPUTE_32F_FAST_16F for full precision
+  //   hipblasDatatype_t compute_type = CUBLAS_COMPUTE_16F;
+  //   if (m->output_type[0] == DT_FLOAT) {
+  //     compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
+  //   }
+  // #endif
   // int num_requests = bc->num_active_requests();
   int num_tokens = bc->num_active_tokens();
   int tokens_previous_requests = 0;
@@ -530,64 +1519,102 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
-    if (bc->request_completed[i]) {
+    if (bc->request_completed[i] ||
+        (!bc->requestsInfo[i].prompt_phase && !bc->requestsInfo[i].peft_bwd)) {
       continue;
     }
     int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
     int total_tokens = bc->requestsInfo[i].first_token_depth_in_request +
                        bc->requestsInfo[i].num_tokens_in_batch;
-    // bc->token_last_available_idx[i] + 1;
-    // Compute (QK^T/sqrt(d_k))
-    // a flag of using this scaling alpha
-    int m_ = num_new_tokens;
-    int n = total_tokens;
-    int k = m->qProjSize;
-    int lda = k * m->num_q_heads * QKV_WEIGHT_NUM, ldb = k * m->num_q_heads,
-        ldc = m_;
-    int strideA = q_block_size;
-    int strideB = kt_block_size;
-    int strideC = num_new_tokens * total_tokens;
-    DT alpha = 1.0f, beta = 0.0f;
-    if (*m->qk_prod_scaling) {
-      alpha = static_cast<DT>(1.0f / sqrt(m->kProjSize));
+    int max_peft_tokens = bc->requestsInfo[i].max_sequence_length;
+    // Copy query to m->query_activation_buffer if we need to compute
+    // PEFT backward
+    if (bc->requestsInfo[i].peft_bwd) {
+      size_t activation_size_needed =
+          sizeof(DT) * max_peft_tokens * m->num_q_heads * m->qProjSize;
+      if (activation_size_needed > m->allocated_peft_buffer_size1) {
+        MemoryAllocator *allocator = m->handle.peft_activation_allocator;
+        m->query_activation_buffer =
+            allocator->allocate_instance_untyped(activation_size_needed);
+        m->allocated_peft_buffer_size1 = activation_size_needed;
+      }
+      int parallelism = m->hidden_size * num_tokens;
+      hipLaunchKernelGGL(HIP_KERNEL_NAME(store_query_cache),
+                         GET_BLOCKS(parallelism),
+                         min(CUDA_NUM_THREADS, parallelism),
+                         0,
+                         stream,
+                         static_cast<DT *>(m->devQKVProjArray),
+                         static_cast<DT *>(m->query_activation_buffer),
+                         num_tokens,
+                         m->hidden_size);
     }
-    // To get A, skip over Q entries from previous requests (same head)
-    DT const *A = static_cast<DT *>(m->devQKVProjArray) +
-                  tokens_previous_requests * m->qProjSize * m->num_q_heads *
-                      QKV_WEIGHT_NUM;
-    // To get B, skip over K entries from previous requests (all heads +
-    // padding)
-    DT const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
-    // To get C, skip over QK^T products from previous requests
+    // Step 1: compute query-key product QK.T/sqrt(d_k)
+    {
+      // Scale by sqrt(d_k) as per the original attention paper
+      DT alpha = 1.0f, beta = 0.0f;
+      if (*m->qk_prod_scaling) {
+        alpha = static_cast<DT>(1.0f / sqrt(m->kProjSize));
+      }
+      // after transpositions
+      int m_ = num_new_tokens;
+      int n = total_tokens;
+      int k = m->qProjSize;
+      // before transpositions
+      int lda = k * m->num_q_heads * QKV_WEIGHT_NUM, ldb = k * m->num_q_heads,
+          ldc = m_;
+      // N.B. strides are applied before transpose operations
+      int strideA = q_block_size;
+      int strideB = kt_block_size;
+      int strideC = num_new_tokens * total_tokens;
+
+      // matrix A: devQKVProjArray
+      // matrix A's layout: [qProjSize, num_heads, 3, num_new_tokens]
+      // To get query projection, skip over Q entries from previous requests
+      DT const *A = static_cast<DT *>(m->devQKVProjArray) +
+                    bc->requestsInfo[i].first_token_offset_in_batch *
+                        m->qProjSize * m->num_q_heads * QKV_WEIGHT_NUM;
+      // matrix B: key cache
+      // matrix B's layout: [kProjSize * num_heads, total_tokens]
+      // To get B, skip over K entries from previous requests (all heads +
+      // padding)
+      DT const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
+      // matrix C: qk_prods
+      // matrix C's layout: [num_new_tokens, total_tokens, num_heads]
+      // To get C, skip over QK.T products from previous requests
+      DT *C = static_cast<DT *>(m->qk_prods);
+      checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
+                                            HIPBLAS_OP_T,
+                                            HIPBLAS_OP_N,
+                                            m_,
+                                            n,
+                                            k,
+                                            &alpha,
+                                            A,
+                                            cublas_data_type,
+                                            lda,
+                                            strideA,
+                                            B,
+                                            cublas_data_type,
+                                            ldb,
+                                            strideB,
+                                            &beta,
+                                            C,
+                                            cublas_data_type,
+                                            ldc,
+                                            strideC,
+                                            m->num_q_heads,
+                                            compute_type,
+                                            HIPBLAS_GEMM_DEFAULT));
+    }
+    // Step 2: Add alibi position bias to qk production
+    // matrix C: qk_prods
+    // matrix C's layout: [num_new_tokens, total_tokens, num_heads]
+    // To get C, skip over QK.T products from previous requests
     DT *C = static_cast<DT *>(m->qk_prods);
-    checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
-                                          HIPBLAS_OP_T,
-                                          HIPBLAS_OP_N,
-                                          m_,
-                                          n,
-                                          k,
-                                          &alpha,
-                                          A,
-                                          hipblas_data_type,
-                                          lda,
-                                          strideA,
-                                          B,
-                                          hipblas_data_type,
-                                          ldb,
-                                          strideB,
-                                          &beta,
-                                          C,
-                                          hipblas_data_type,
-                                          ldc,
-                                          strideC,
-                                          m->num_q_heads,
-                                          compute_type,
-                                          HIPBLAS_GEMM_DEFAULT));
-
-    // add alibi position bias to qk production
     if (*m->position_bias) {
       size_t parallelism = m->num_q_heads * total_tokens * num_new_tokens;
-      hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_position_bias_qkprd<DT>),
+      hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_position_bias_qkprd),
                          GET_BLOCKS(parallelism),
                          min((size_t)CUDA_NUM_THREADS, parallelism),
                          0,
@@ -599,13 +1626,14 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
                          m->global_num_q_heads,
                          shard_id);
     }
-    // Fill all elements above diagonal in qk prods with -inf to force
-    // causal attention.
+
+    // Step 3: Apply causal mask. Fill all elements above diagonal in qk prods
+    // with -inf to force causal attention.
     assert(num_new_tokens <= total_tokens);
     size_t entries_above_diagonal = num_new_tokens * (num_new_tokens - 1) / 2;
     if (entries_above_diagonal > 0) {
       size_t parallelism = m->num_q_heads * entries_above_diagonal;
-      hipLaunchKernelGGL(HIP_KERNEL_NAME(fill_entries_above_diagonal<DT>),
+      hipLaunchKernelGGL(HIP_KERNEL_NAME(fill_entries_above_diagonal),
                          GET_BLOCKS(parallelism),
                          min((size_t)CUDA_NUM_THREADS, parallelism),
                          0,
@@ -617,137 +1645,129 @@ void compute_attention_kernel(IncMultiHeadSelfAttentionMeta const *m,
                          entries_above_diagonal,
                          static_cast<DT>(-INFINITY));
     }
-    // Compute Softmax(QK^T/sqrt(d_k))
-    // Before modifying the parameters below, make sure to read the following
-    // description of the CUDNN_TENSOR_NCHW tensor layout, from
-    // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#cudnnTensorFormat_t:
-    // This tensor format specifies that the data is laid out in the following
-    // order: batch size, feature maps, rows, columns. The strides are
-    // implicitly defined in such a way that the data are contiguous in memory
-    // with no padding between images, feature maps, rows, and columns; the
-    // columns are the inner dimension and the images are the outermost
-    // dimension.
-    int n_param = m->num_q_heads;
-    int c_param = total_tokens;
-    int h_param = 1;
-    int w_param = num_new_tokens;
-    checkCUDNN(miopenSet4dTensorDescriptor(
-        m->qk_tensor, miopen_data_type, n_param, c_param, h_param, w_param));
-    float softmax_alpha = 1.0f, softmax_beta = 0.0f;
-    DT *C_softmax = static_cast<DT *>(m->qk_prods_softmax);
-    // The softmax operation below is executed according to the
-    // CUDNN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
-    // softmax operation is computed per spatial location (H,W) per image (N)
-    // across dimension C.
-    checkCUDNN(miopenSoftmaxForward_V2(m->handle.dnn,
-                                       &softmax_alpha,
-                                       m->qk_tensor,
-                                       C,
-                                       &softmax_beta,
-                                       m->qk_tensor,
-                                       C_softmax,
-                                       MIOPEN_SOFTMAX_ACCURATE,
-                                       MIOPEN_SOFTMAX_MODE_CHANNEL));
-    // Matmul softmax(QK^T/sqrt(d_k)) by V
-    alpha = 1.0f, beta = 0.0f;
-    m_ = num_new_tokens;
-    n = m->vProjSize;
-    k = total_tokens;
-    lda = m_, ldb = n * m->num_q_heads, ldc = m_;
-    strideA = num_new_tokens * total_tokens;
-    strideB = vt_block_size;
-    strideC = num_new_tokens * m->vProjSize;
-    // To get A, skip over softmax(QK^T/sqrt(d_k)) entries from previous
-    // requests (all heads)
-    A = C_softmax;
-    // To get B, skip over V^T entries from previous requests (all heads +
-    // padding)
-    B = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
-    // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
-    // requests
-    C = static_cast<DT *>(m->attn_heads) +
-        tokens_previous_requests * m->num_q_heads * m->vProjSize;
-
-    checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
-                                          HIPBLAS_OP_N,
-                                          HIPBLAS_OP_T,
-                                          m_,
-                                          n,
-                                          k,
-                                          &alpha,
-                                          A,
-                                          hipblas_data_type,
-                                          lda,
-                                          strideA,
-                                          B,
-                                          hipblas_data_type,
-                                          ldb,
-                                          strideB,
-                                          &beta,
-                                          C,
-                                          hipblas_data_type,
-                                          ldc,
-                                          strideC,
-                                          m->num_q_heads,
-                                          compute_type,
-                                          HIPBLAS_GEMM_DEFAULT));
-    // Project to output, save result directly on output tensor
-    alpha = 1.0f, beta = 0.0f;
-    m_ = m->oProjSize;
-    k = m->vProjSize * m->num_q_heads;
-    n = num_new_tokens;
-    lda = k, ldb = n, ldc = m_;
-    A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
-                                 m->kProjSize * m->num_q_heads +
-                                 m->vProjSize * m->num_q_heads);
-    B = C;
-    C = static_cast<DT *>(output_ptr) + tokens_previous_requests * m->oProjSize;
 
-    checkCUDA(hipblasGemmEx(m->handle.blas,
-                            HIPBLAS_OP_T,
-                            HIPBLAS_OP_T,
-                            m_,
-                            n,
-                            k,
-                            &alpha,
-                            A,
-                            hipblas_data_type,
-                            lda,
-                            B,
-                            hipblas_data_type,
-                            ldb,
-                            &beta,
-                            C,
-                            hipblas_data_type,
-                            ldc,
-                            compute_type,
-                            HIPBLAS_GEMM_DEFAULT));
+    // Step 4: Compute Softmax(QK.T/sqrt(d_k))
+    {
+      // Before modifying the parameters below, make sure to read the following
+      // description of the HIPDNN_TENSOR_NCHW tensor layout, from
+      // https://docs.nvidia.com/deeplearning/cudnn/api/index.html#hipdnnTensorFormat_t:
+      // This tensor format specifies that the data is laid out in the following
+      // order: batch size, feature maps, rows, columns. The strides are
+      // implicitly defined in such a way that the data are contiguous in memory
+      // with no padding between images, feature maps, rows, and columns; the
+      // columns are the inner dimension and the images are the outermost
+      // dimension.
+      int n_param = m->num_q_heads;
+      int c_param = total_tokens;
+      int h_param = 1;
+      int w_param = num_new_tokens;
+      checkCUDNN(miopenSet4dTensorDescriptor(
+          m->qk_tensor, cudnn_data_type, n_param, c_param, h_param, w_param));
+      float softmax_alpha = 1.0f, softmax_beta = 0.0f;
+      DT *C_softmax = static_cast<DT *>(m->qk_prods_softmax);
+      // The softmax operation below is executed according to the
+      // MIOPEN_SOFTMAX_MODE_CHANNEL, which is also described in the docs: The
+      // softmax operation is computed per spatial location (H,W) per image (N)
+      // across dimension C.
+      checkCUDNN(miopenSoftmaxForward_V2(m->handle.dnn,
+                                         &softmax_alpha,
+                                         m->qk_tensor,
+                                         C,
+                                         &softmax_beta,
+                                         m->qk_tensor,
+                                         C_softmax,
+                                         MIOPEN_SOFTMAX_ACCURATE,
+                                         MIOPEN_SOFTMAX_MODE_CHANNEL));
+    }
+    // Copy C_softmax to m->softmax_activation_buffer if we need to compute
+    // PEFT backward
+    if (bc->requestsInfo[i].peft_bwd) {
+      DT *C_softmax = static_cast<DT *>(m->qk_prods_softmax);
+      size_t activation_size_needed =
+          sizeof(DT) * max_peft_tokens * max_peft_tokens * m->num_q_heads;
+      if (activation_size_needed > m->allocated_peft_buffer_size2) {
+        MemoryAllocator *allocator = m->handle.peft_activation_allocator;
+        m->softmax_activation_buffer =
+            allocator->allocate_instance_untyped(activation_size_needed);
+        m->allocated_peft_buffer_size2 = activation_size_needed;
+      }
+      checkCUDA(hipMemcpyAsync(m->softmax_activation_buffer,
+                               C_softmax,
+                               sizeof(DT) * total_tokens * num_new_tokens *
+                                   m->num_q_heads,
+                               hipMemcpyDeviceToDevice,
+                               stream));
+    }
+    // Step 5: Matmul softmax(QK.T/sqrt(d_k)) by V. Implemented as V @
+    // softmax(QK.T/sqrt(d_k)).T
+    {
+      DT alpha = 1.0f, beta = 0.0f;
+      // after transpositions
+      int m_ = m->vProjSize;
+      int n = num_new_tokens;
+      int k = total_tokens;
+      // before transpositions
+      int lda = m_ * m->num_q_heads, ldb = n, ldc = m_ * m->num_q_heads;
+      // N.B. strides are applied before transpose operations
+      int strideA = vt_block_size;
+      int strideB = num_new_tokens * total_tokens;
+      int strideC = m->vProjSize;
+      // matrix A: value cache
+      // matrix A's layout: [vProjSize, num_heads, total_tokens]
+      // To get A, skip over V.T entries from previous requests (all heads +
+      // padding)
+      DT *A = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
+      // matrix B: qk_prods_softmax
+      // matrix B's layout: [num_new_tokens, total_tokens, num_heads]
+      // To get B, skip over softmax(QK.T/sqrt(d_k)) entries from previous
+      // requests (all heads)
+      DT *B = static_cast<DT *>(m->qk_prods_softmax);
+      // matrix C: attn heads
+      // matrix C's layout: [vProjSize, num_heads, num_new_tokens]
+      // To get C, skip over softmax(QK.T/sqrt(d_k))V products from previous
+      // requests
+      // store the result attn heads, also skip the genration tokens
+      DT *C = static_cast<DT *>(m->attn_heads) +
+              (bc->requestsInfo[i].first_token_offset_in_batch) *
+                  m->num_q_heads * m->vProjSize;
+      checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
+                                            HIPBLAS_OP_N,
+                                            HIPBLAS_OP_T,
+                                            m_,
+                                            n,
+                                            k,
+                                            &alpha,
+                                            A,
+                                            cublas_data_type,
+                                            lda,
+                                            strideA,
+                                            B,
+                                            cublas_data_type,
+                                            ldb,
+                                            strideB,
+                                            &beta,
+                                            C,
+                                            cublas_data_type,
+                                            ldc,
+                                            strideC,
+                                            m->num_q_heads,
+                                            compute_type,
+                                            HIPBLAS_GEMM_DEFAULT));
+    }
     tokens_previous_requests += num_new_tokens;
   }
-
-  if (*m->final_bias && shard_id == 0) {
-    int parallelism = m->oProjSize * num_tokens;
-    int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
-                          m->kProjSize * m->global_num_q_heads +
-                          m->vProjSize * m->global_num_q_heads;
-    hipLaunchKernelGGL(HIP_KERNEL_NAME(apply_proj_bias_w<DT>),
-                       GET_BLOCKS(parallelism),
-                       min(CUDA_NUM_THREADS, parallelism),
-                       0,
-                       stream,
-                       output_ptr,
-                       bias_ptr,
-                       num_tokens,
-                       qkv_weight_size,
-                       m->oProjSize);
+  if (tokens_previous_requests != (num_tokens - bc->num_generation_tokens)) {
+    bc->print();
+    printf("tokens_previous_requests: %i\n", tokens_previous_requests);
+    printf("num_tokens: %i\n", num_tokens);
+    printf("bc->num_generation_tokens: %i\n", bc->num_generation_tokens);
   }
-
-  assert(tokens_previous_requests == num_tokens);
+  assert(tokens_previous_requests == (num_tokens - bc->num_generation_tokens));
 }
 
 /*static*/
 void IncMultiHeadSelfAttention::inference_kernel_wrapper(
-    IncMultiHeadSelfAttentionMeta const *m,
+    IncMultiHeadSelfAttentionMeta *m,
     BatchConfig const *bc,
     int shard_id,
     GenericTensorAccessorR const &input,
@@ -813,10 +1833,71 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
     checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
     checkCUDA(hipEventDestroy(t_start));
     checkCUDA(hipEventDestroy(t_end));
-    printf("IncMultiHeadSelfAttention forward time = %.2fms\n", elapsed);
-    // print_tensor<3, float>(acc_query.ptr, acc_query.rect,
-    // "[Attention:forward:query]"); print_tensor<3, float>(acc_output.ptr,
-    // acc_output.rect, "[Attention:forward:output]");
+    printf("IncMultiHeadSelfAttention forward time = %.9fms\n", elapsed);
+  }
+}
+
+/*static*/
+void IncMultiHeadSelfAttention::peft_bwd_kernel_wrapper(
+    IncMultiHeadSelfAttentionMeta *m,
+    BatchConfig const *bc,
+    int shard_id,
+    GenericTensorAccessorW const &input_grad,
+    GenericTensorAccessorR const &weight,
+    GenericTensorAccessorR const &output_grad,
+    GenericTensorAccessorR const &bias) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  bool use_bias = *m->qkv_bias || *m->final_bias;
+
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+
+  // assert(input.data_type == weight.data_type);
+  assert(input_grad.data_type == output_grad.data_type);
+  if (use_bias) {
+    assert(input_grad.data_type == bias.data_type);
+  }
+
+  if (input_grad.data_type == DT_HALF) {
+    assert(!m->offload);
+    half const *bias_ptr =
+        use_bias ? bias.get_half_ptr() : static_cast<half const *>(nullptr);
+    Kernels::IncMultiHeadAttention::peft_bwd_kernel(m,
+                                                    bc,
+                                                    shard_id,
+                                                    input_grad.get_half_ptr(),
+                                                    weight.get_half_ptr(),
+                                                    output_grad.get_half_ptr(),
+                                                    bias_ptr,
+                                                    stream);
+  } else if (input_grad.data_type == DT_FLOAT) {
+    assert(!m->offload);
+    float const *bias_ptr =
+        use_bias ? bias.get_float_ptr() : static_cast<float const *>(nullptr);
+    Kernels::IncMultiHeadAttention::peft_bwd_kernel(m,
+                                                    bc,
+                                                    shard_id,
+                                                    input_grad.get_float_ptr(),
+                                                    weight.get_float_ptr(),
+                                                    output_grad.get_float_ptr(),
+                                                    bias_ptr,
+                                                    stream);
+  } else {
+    assert(false && "Unspported data type");
+  }
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("IncMultiHeadSelfAttention PEFT backward time = %.9fms\n", elapsed);
   }
 }
 
@@ -895,7 +1976,7 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
   assert(kSize == vSize);
   qProjSize = _qProjSize;
   kProjSize = _kProjSize;
-  assert(qProjSize == kProjSize); // required for attention QK^T matmul
+  assert(qProjSize == kProjSize); // required for attention QK.T matmul
   vProjSize = _vProjSize;
   oProjSize = _oProjSize;
   size_t size_of_dt = data_type_size(attn->data_type);
@@ -949,14 +2030,15 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
 
   // allocate memory for the seqArray and reserve space
   {
-    int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
+    int max_tokens_per_batch = infer_mode == TREE_VERIFY_MODE
+                                   ? BatchConfig::max_verify_tokens_per_batch()
+                                   : BatchConfig::max_tokens_per_batch();
     size_t qkv_max_proj_size = max_tokens_per_batch * (qProjSize * num_q_heads +
                                                        kProjSize * num_q_heads +
                                                        vProjSize * num_q_heads);
     size_t key_cache_size = 0, value_cache_size = 0;
     switch (infer_mode) {
-      case INC_DECODING_MODE:
-      case TREE_VERIFY_MODE: {
+      case INC_DECODING_MODE: {
         key_cache_size = num_q_heads * kProjSize *
                          BatchConfig::max_requests_per_batch() *
                          BatchConfig::max_sequence_length();
@@ -965,21 +2047,24 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
                            BatchConfig::max_sequence_length();
         break;
       }
-      case BEAM_SEARCH_MODE: {
+      case BEAM_SEARCH_MODE:
+      case TREE_VERIFY_MODE: {
+        // a K-ary tree max node is (k^n - 1) / 2
         key_cache_size = num_q_heads * kProjSize *
                          BeamSearchBatchConfig::max_requests_per_batch() *
-                         BatchConfig::max_sequence_length() *
-                         BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+                         (BatchConfig::max_sequence_length() +
+                          BatchConfig::max_spec_tree_token_num());
         value_cache_size = num_q_heads * vProjSize *
                            BeamSearchBatchConfig::max_requests_per_batch() *
-                           BatchConfig::max_sequence_length() *
-                           BeamSearchBatchConfig::MAX_BEAM_WIDTH;
+                           (BatchConfig::max_sequence_length() +
+                            BatchConfig::max_spec_tree_token_num());
         break;
       }
       default:
         assert(false && "Unkown inference mode");
     }
-    size_t tokeninfo_size = max_tokens_per_batch;
+    size_t requestinfo_size = BatchConfig::max_requests_per_batch();
+    // size_t tokeninfo_size = max_tokens_per_batch;
     size_t qk_prod_size =
         max_tokens_per_batch * BatchConfig::max_sequence_length() * num_q_heads;
     size_t attn_heads_size = max_tokens_per_batch * num_q_heads * vProjSize;
@@ -990,7 +2075,6 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
         (qkv_max_proj_size + key_cache_size + value_cache_size +
          2 * qk_prod_size + attn_heads_size) *
             size_of_dt +
-        tokeninfo_size * sizeof(BatchConfig::PerTokenInfo) +
         complex_size * sizeof(hipFloatComplex); // more components will
                                                 // be added here later
     if (offload) {
@@ -1035,10 +2119,15 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     valueCache = gpu_mem_allocator.allocate_instance_untyped(value_cache_size *
                                                              size_of_dt);
 
+    token_infos = static_cast<BatchConfig::PerTokenInfo *>(
+        handler.batch_config_metadata->tokens_info);
+    request_infos = static_cast<BatchConfig::PerRequestInfo *>(
+        handler.batch_config_metadata->requestsInfo);
+
     if (offload) {
-      token_infos =
-          gpu_mem_allocator.allocate_reserved<BatchConfig::PerTokenInfo>(
-              tokeninfo_size);
+      // token_infos =
+      //     gpu_mem_allocator.allocate_reserved<BatchConfig::PerTokenInfo>(
+      //         tokeninfo_size);
       // offset += sizeof(BatchConfig::PerTokenInfo) * tokeninfo_size;
       qk_prods = gpu_mem_allocator.allocate_reserved_untyped(qk_prod_size *
                                                              size_of_dt);
@@ -1052,10 +2141,13 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
       complex_input =
           gpu_mem_allocator.allocate_reserved<hipFloatComplex>(complex_size);
       // offset += complex_size * sizeof(hipFloatComplex);
+      // request_infos =
+      //     gpu_mem_allocator.allocate_reserved<BatchConfig::PerRequestInfo>(
+      //         requestinfo_size);
     } else {
-      token_infos =
-          gpu_mem_allocator.allocate_instance<BatchConfig::PerTokenInfo>(
-              tokeninfo_size);
+      // token_infos =
+      //     gpu_mem_allocator.allocate_instance<BatchConfig::PerTokenInfo>(
+      //         tokeninfo_size);
       qk_prods = gpu_mem_allocator.allocate_instance_untyped(qk_prod_size *
                                                              size_of_dt);
       qk_prods_softmax = gpu_mem_allocator.allocate_instance_untyped(
@@ -1064,6 +2156,9 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
                                                                size_of_dt);
       complex_input =
           gpu_mem_allocator.allocate_instance<hipFloatComplex>(complex_size);
+      // request_infos =
+      //     gpu_mem_allocator.allocate_instance<BatchConfig::PerRequestInfo>(
+      //         requestinfo_size);
     }
 
     // allocate more size for quantization data
@@ -1077,6 +2172,8 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
              gpu_mem_allocator.reserved_allocated_size);
     }
   }
+  allocated_peft_buffer_size1 = 0;
+  allocated_peft_buffer_size2 = 0;
   checkCUDA(hipStreamSynchronize(stream));
 }
 
@@ -1098,4 +2195,37 @@ template void Kernels::IncMultiHeadAttention::pre_build_weight_kernel<half>(
     DataType data_type,
     hipStream_t stream);
 
+template void Kernels::IncMultiHeadAttention::compute_o_prod_bias<float>(
+    IncMultiHeadSelfAttentionMeta const *m,
+    BatchConfig const *bc,
+    int shard_id,
+    float *output_ptr,
+    float const *weight_ptr,
+    float const *bias_ptr,
+    int num_tokens,
+    hipStream_t stream);
+
+template void Kernels::IncMultiHeadAttention::compute_o_prod_bias<half>(
+    IncMultiHeadSelfAttentionMeta const *m,
+    BatchConfig const *bc,
+    int shard_id,
+    half *output_ptr,
+    half const *weight_ptr,
+    half const *bias_ptr,
+    int num_tokens,
+    hipStream_t stream);
+
+template void
+    Kernels::IncMultiHeadAttention::compute_attention_kernel_generation<float>(
+        IncMultiHeadSelfAttentionMeta const *m,
+        BatchConfig const *bc,
+        float *output_ptr,
+        hipStream_t stream);
+
+template void
+    Kernels::IncMultiHeadAttention::compute_attention_kernel_generation<half>(
+        IncMultiHeadSelfAttentionMeta const *m,
+        BatchConfig const *bc,
+        half *output_ptr,
+        hipStream_t stream);
 }; // namespace FlexFlow
diff --git a/src/ops/inc_multihead_self_attention.cu b/src/ops/inc_multihead_self_attention.cu
index a0d31bb6ef..b278611b60 100644
--- a/src/ops/inc_multihead_self_attention.cu
+++ b/src/ops/inc_multihead_self_attention.cu
@@ -12,9 +12,7 @@
  * See the License for the specific language governing permissions and
  * limitations under the License.
  */
-#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
 #include "cuComplex.h"
-#endif
 #include "flexflow/ffconst_utils.h"
 #include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ops/kernels/decompress_kernels.h"
@@ -483,6 +481,63 @@ __global__ void
   }
 }
 
+template <typename DT>
+__global__ void
+    apply_rotary_embedding_bwd(DT *input_ptr,
+                               cuFloatComplex *complex_input,
+                               BatchConfig::PerTokenInfo const *tokenInfos,
+                               int proj_size,
+                               int num_tokens,
+                               int hidden_size) {
+  CUDA_KERNEL_LOOP(i, num_tokens * hidden_size) {
+    // compute indexes to visit first half proj_size of each of q/k tensor.
+    // devQKVProj has shape [num_tokens, qProjSize, num_heads, 3] in peft_bwd
+    bool q_tensor = i < (num_tokens * hidden_size / 2);
+    int real_i = q_tensor ? i : i - num_tokens * hidden_size / 2;
+    assert(hidden_size % proj_size == 0);
+    int num_heads = hidden_size / proj_size;
+
+    int token_idx = real_i % num_tokens;
+    int idx = (real_i / num_tokens) % (proj_size / 2);
+    int head_idx = real_i / (num_tokens * proj_size / 2);
+    assert(head_idx < num_heads);
+
+    int complex_part_index = (q_tensor ? 0 : 1) * num_tokens * hidden_size +
+                             head_idx * num_tokens * proj_size +
+                             idx * num_tokens + token_idx;
+    int real_part_index = complex_part_index + (proj_size / 2) * num_tokens;
+
+    complex_input[i] = {input_ptr[real_part_index],
+                        input_ptr[complex_part_index]};
+
+    size_t pos = tokenInfos[token_idx].abs_depth_in_request;
+
+    float freq = pos * (1.0 / pow(10000.0, (float)2 * idx / proj_size));
+    cuFloatComplex complex_pos = {cos(freq), sin(freq)};
+
+    complex_input[i] = cuCmulf(complex_input[i], complex_pos);
+    input_ptr[real_part_index] = complex_input[i].x;
+    input_ptr[complex_part_index] = complex_input[i].y;
+  }
+}
+
+template <typename DT>
+__global__ void fill_entries_above_diagonal(DT *matrix,
+                                            size_t num_rows,
+                                            size_t num_cols,
+                                            size_t num_q_heads,
+                                            size_t entries_above_diagonal,
+                                            DT value) {
+  CUDA_KERNEL_LOOP(i, entries_above_diagonal * num_q_heads) {
+    size_t head_idx = i / entries_above_diagonal;
+    size_t entry_idx = i % entries_above_diagonal;
+    size_t y = (-1 + sqrt(8 * (float)entry_idx + 1)) / 2;
+    size_t x = entry_idx - y * (y + 1) / 2;
+    y += (num_cols - num_rows) + 1;
+    matrix[head_idx * num_rows * num_cols + num_cols * y + x] = value;
+  }
+}
+
 template <typename DT>
 void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
                         BatchConfig const *bc,
@@ -497,17 +552,18 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
   checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
   assert(m->qSize == m->vSize && m->qSize == m->kSize);
   cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
-#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
   cudaDataType_t compute_type = cublas_data_type;
-#else
-  // For best performance, set the default cublas compute type to
-  // CUBLAS_COMPUTE_16F for half precision and to
-  // CUBLAS_COMPUTE_32F_FAST_16F for full precision
-  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
-  if (m->output_type[0] == DT_FLOAT) {
-    compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
-  }
-#endif
+  // #if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  //   cudaDataType_t compute_type = cublas_data_type;
+  // #else
+  //   // For best performance, set the default cublas compute type to
+  //   // CUBLAS_COMPUTE_16F for half precision and to
+  //   // CUBLAS_COMPUTE_32F_FAST_16F for full precision
+  //   cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+  //   if (m->output_type[0] == DT_FLOAT) {
+  //     compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
+  //   }
+  // #endif
 
   // Step 1: Compute QKV projections
   {
@@ -517,7 +573,7 @@ void compute_qkv_kernel(IncMultiHeadSelfAttentionMeta const *m,
     int m_k = m->kProjSize * m->num_q_heads;
     int m_v = m->vProjSize * m->num_q_heads;
     assert(m_q == m_k && m_k == m_v); // keep things simple for now
-    int n = bc->num_active_tokens();
+    int n = bc->num_active_infr_tokens();
     int k = m->qSize;
     int m_ = m_q * QKV_WEIGHT_NUM;
     // before transpositions
@@ -604,7 +660,7 @@ template <typename DT>
 void update_kv_cache_kernel(IncMultiHeadSelfAttentionMeta const *m,
                             BatchConfig const *bc,
                             cudaStream_t stream) {
-  int num_tokens = bc->num_active_tokens();
+  int num_tokens = bc->num_active_infr_tokens();
   if (num_tokens > 0) {
     int parallelism = m->hidden_size * num_tokens;
     store_kv_cache<<<GET_BLOCKS(parallelism),
@@ -799,7 +855,7 @@ void pre_build_weight_kernel(IncMultiHeadSelfAttentionMeta const *m,
 }
 
 template <typename DT>
-void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
+void inference_kernel(IncMultiHeadSelfAttentionMeta *m,
                       BatchConfig const *bc,
                       int shard_id,
                       DT const *input_ptr,
@@ -843,6 +899,504 @@ void inference_kernel(IncMultiHeadSelfAttentionMeta const *m,
       m, bc, shard_id, output_ptr, weight_ptr, bias_ptr, num_tokens, stream);
 }
 
+std::string get_peft_dbg_folder(IncMultiHeadSelfAttentionMeta const *m,
+                                int shard_id) {
+  std::string op_name_without_uid =
+      IncMultiHeadSelfAttention::get_op_name_without_uid(m);
+  fs::path dst_filepath = get_dst_folder("bwd", m->bwd_step, shard_id);
+  if (m->layer_guid.model_id > 0) {
+    assert(false && "Model ID > 0 not supported yet");
+  }
+  std::string layername = "layers." +
+                          std::to_string(m->layer_guid.transformer_layer_id) +
+                          "." + op_name_without_uid;
+  dst_filepath /= layername;
+  return dst_filepath.string();
+}
+
+template <typename DT>
+void peft_bwd_kernel(IncMultiHeadSelfAttentionMeta const *m,
+                     BatchConfig const *bc,
+                     int shard_id,
+                     DT *input_grad_ptr,
+                     DT const *weight_ptr,
+                     DT const *output_grad_ptr,
+                     DT const *bias_ptr,
+                     cudaStream_t stream) {
+  assert(!m->offload);
+  checkCUDA(cublasSetStream(m->handle.blas, stream));
+  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
+  cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
+  cudnnDataType_t cudnn_data_type = ff_to_cudnn_datatype(m->output_type[0]);
+  assert(data_type_size(m->output_type[0]) == sizeof(DT));
+  cudaDataType_t compute_type = cublas_data_type;
+  // #if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  //   cudaDataType_t compute_type = cublas_data_type;
+  // #else
+  //   // For best performance, set the default cublas compute type to
+  //   // CUBLAS_COMPUTE_16F for half precision and to
+  //   // CUBLAS_COMPUTE_32F_FAST_16F for full precision
+  //   cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+  //   if (m->output_type[0] == DT_FLOAT) {
+  //     compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
+  //   }
+  // #endif
+
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    if (!bc->requestsInfo[i].peft_bwd) {
+      continue;
+    }
+    int num_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+    int num_total_tokens = bc->requestsInfo[i].first_token_depth_in_request +
+                           bc->requestsInfo[i].num_tokens_in_batch;
+    // Currently assume we are calculating gradients for all tokens
+    // of a request
+    assert(num_tokens == num_total_tokens);
+    int kt_block_size = m->kProjSize;
+    int kt_req_block_size =
+        kt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+    int vt_block_size = m->vProjSize;
+    int vt_req_block_size =
+        vt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+    assert(m->qProjSize == m->kProjSize && m->kProjSize == m->vProjSize);
+    // Step 1: compute gradients before final projection
+    {
+      int m_ = m->vProjSize * m->num_q_heads;
+      int n_ = num_tokens;
+      int k_ = m->oProjSize;
+      int lda = m_;
+      int ldb = k_;
+      int ldc = m_;
+      float alpha = 1.0f, beta = 0.0f;
+      // matrix A: output projection weight
+      // matrix A's layout: [vProjSize * num_heads, oProjSize]
+      DT const *A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
+                                             m->kProjSize * m->num_q_heads +
+                                             m->vProjSize * m->num_q_heads);
+      // matrix B: output gradients
+      // matrix B's layout: [oProjSize, num_new_tokens]
+      DT const *B =
+          output_grad_ptr +
+          bc->requestsInfo[i].first_token_offset_in_batch * m->oProjSize;
+      // matrix C: attn_heads gradients
+      // matrix C's layout: [vProjSize * num_heads, num_new_tokens]
+      DT *C = static_cast<DT *>(m->handle.workSpace);
+      checkCUDA(cublasGemmEx(m->handle.blas,
+                             CUBLAS_OP_N,
+                             CUBLAS_OP_N,
+                             m_,
+                             n_,
+                             k_,
+                             &alpha,
+                             A,
+                             cublas_data_type,
+                             lda,
+                             B,
+                             cublas_data_type,
+                             ldb,
+                             &beta,
+                             C,
+                             cublas_data_type,
+                             ldc,
+                             compute_type,
+                             CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+      if (m->inference_debugging) {
+        // save result to file for checking
+        std::string filename =
+            get_peft_dbg_folder(m, shard_id) + ".o_proj.input_gradient_0";
+        save_tensor(C, m_ * n_, filename.c_str());
+      }
+    }
+    // Step 2: compute gradients w.r.t. value
+    {
+      float alpha = 1.0f, beta = 0.0f;
+      // matrix A: qk_prods_softmax
+      // matrix A's layout: [num_new_tokens, total_tokens, num_heads]
+      DT const *A = static_cast<DT *>(m->qk_prods_softmax);
+      // matrix B: attn_heads gradients
+      // matrix B's layout: [vProjSize * num_heads, num_new_tokens]
+      DT const *B = static_cast<DT *>(m->handle.workSpace);
+      // matrix C: gradients for value (saved as part of m->devQKVProjArray)
+      // matrix C's layout: [num_tokens, qProjsize * num_heads, 3]
+      DT *C = static_cast<DT *>(m->devQKVProjArray) +
+              2 * num_tokens *
+                  (m->qProjSize * m->num_q_heads); // skip over regions reserved
+                                                   // for Q and K gradients
+      // after transpositions
+      int m_ = num_tokens;   // total_tokens
+      int n_ = m->vProjSize; // num_new_tokens
+      int k_ = num_tokens;   // num_new_tokens
+      // before transpositions
+      int lda = num_tokens; // num_new_tokens
+      int ldb = m->vProjSize * m->num_q_heads;
+      int ldc = num_tokens; // total_tokens
+      // N.B. strides are applied before transpose operations
+      int strideA = num_tokens * num_tokens; // num_new_tokens * total_tokens
+      int strideB = m->vProjSize;
+      int strideC = num_tokens * m->vProjSize;
+      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                           CUBLAS_OP_T,
+                                           CUBLAS_OP_T,
+                                           m_,
+                                           n_,
+                                           k_,
+                                           &alpha,
+                                           A,
+                                           cublas_data_type,
+                                           lda,
+                                           strideA,
+                                           B,
+                                           cublas_data_type,
+                                           ldb,
+                                           strideB,
+                                           &beta,
+                                           C,
+                                           cublas_data_type,
+                                           ldc,
+                                           strideC,
+                                           m->num_q_heads,
+                                           compute_type,
+                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+      // save result to file for checking
+      if (m->inference_debugging) {
+        std::string filename =
+            get_peft_dbg_folder(m, shard_id) + ".v_proj.input_gradient_0";
+        save_tensor(C, m_ * n_ * m->num_q_heads, filename.c_str());
+        std::string filename2 =
+            get_peft_dbg_folder(m, shard_id) + ".qk_prods.softmax";
+        save_tensor(A, m_ * k_ * m->num_q_heads, filename2.c_str());
+      }
+    }
+    // Step 3: compute gradients w.r.t. the qk_prods_softmax tensor
+    {
+      float alpha = 1.0f, beta = 0.0f;
+      // matrix A: attn_heads gradients
+      // matrix A's layout: [vProjSize * num_heads, num_new_tokens]
+      DT const *A = static_cast<DT *>(m->handle.workSpace);
+      // matrix B: value cache
+      // matrix B's layout: [vProjSize * num_heads, max_num_tokens, num_req]
+      DT const *B = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
+      // matrix C: qk_prods_softmax gradients
+      // matrix C's layout: [num_new_tokens, total_tokens, num_heads]
+      DT *C = static_cast<DT *>(m->qk_prods_softmax);
+      // after transposition & striding
+      int m_ = num_tokens; // num_new_tokens
+      int n_ = num_tokens;
+      int k_ = m->vProjSize;
+      // before transposition and striding
+      int lda = m->vProjSize * m->num_q_heads;
+      int ldb = m->vProjSize * m->num_q_heads;
+      int ldc = num_tokens; // num_new_tokens
+      int strideA = m->vProjSize;
+      int strideB = m->vProjSize;
+      int strideC = num_tokens * num_tokens; // num_new_tokens * total_tokens
+
+      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                           CUBLAS_OP_T,
+                                           CUBLAS_OP_N,
+                                           m_,
+                                           n_,
+                                           k_,
+                                           &alpha,
+                                           A,
+                                           cublas_data_type,
+                                           lda,
+                                           strideA,
+                                           B,
+                                           cublas_data_type,
+                                           ldb,
+                                           strideB,
+                                           &beta,
+                                           C,
+                                           cublas_data_type,
+                                           ldc,
+                                           strideC,
+                                           m->num_q_heads,
+                                           compute_type,
+                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+      if (m->inference_debugging) {
+        std::string filename =
+            get_peft_dbg_folder(m, shard_id) + ".qk_prods.softmax_grad";
+        save_tensor(
+            C, num_tokens * num_tokens * m->num_q_heads, filename.c_str());
+        std::string filename2 = get_peft_dbg_folder(m, shard_id) + ".vcache";
+        save_tensor(
+            B, m->vProjSize * m->num_q_heads * num_tokens, filename2.c_str());
+      }
+    }
+    // Step 4: softmax backpropagation
+    {
+      float alpha = 1.0f, beta = 0.0f;
+      int n_param = m->num_q_heads;
+      int c_param = num_tokens;
+      int h_param = 1;
+      int w_param = num_tokens;
+      checkCUDNN(cudnnSetTensor4dDescriptor(m->qk_tensor,
+                                            CUDNN_TENSOR_NCHW,
+                                            cudnn_data_type,
+                                            n_param,
+                                            c_param,
+                                            h_param,
+                                            w_param));
+      checkCUDNN(cudnnSoftmaxBackward(m->handle.dnn,
+                                      CUDNN_SOFTMAX_ACCURATE,
+                                      CUDNN_SOFTMAX_MODE_CHANNEL,
+                                      &alpha,
+                                      m->qk_tensor,
+                                      m->softmax_activation_buffer,
+                                      m->qk_tensor,
+                                      m->qk_prods_softmax,
+                                      &beta,
+                                      m->qk_tensor,
+                                      m->qk_prods));
+
+      if (m->inference_debugging) {
+        DT *C = static_cast<DT *>(m->qk_prods);
+        std::string filename =
+            get_peft_dbg_folder(m, shard_id) + ".qk_prods.softmax_grad_in";
+        save_tensor(
+            C, num_tokens * num_tokens * m->num_q_heads, filename.c_str());
+      }
+
+      //  TODO: fill all elements above diagonal to force causal attention
+      size_t entries_above_diagonal = num_tokens * (num_tokens - 1) / 2;
+      if (entries_above_diagonal > 0) {
+        size_t parallelism = m->num_q_heads * entries_above_diagonal;
+        fill_entries_above_diagonal<<<GET_BLOCKS(parallelism),
+                                      min((size_t)CUDA_NUM_THREADS,
+                                          parallelism),
+                                      0,
+                                      stream>>>(static_cast<DT *>(m->qk_prods),
+                                                num_tokens,
+                                                num_tokens,
+                                                m->num_q_heads,
+                                                entries_above_diagonal,
+                                                DT(0.0f));
+      }
+      if (m->inference_debugging) {
+        DT *C = static_cast<DT *>(m->qk_prods);
+        std::string filename = get_peft_dbg_folder(m, shard_id) +
+                               ".qk_prods.softmax_grad_in.masked";
+        save_tensor(
+            C, num_tokens * num_tokens * m->num_q_heads, filename.c_str());
+      }
+    }
+    // Step 5: compute gradients w.r.t. key
+    {
+      float alpha = 1.0f, beta = 0.0f;
+      if (*m->qk_prod_scaling) {
+        alpha = 1.0f / sqrt(m->kProjSize);
+      }
+      // matrix A: gradients w.r.t. qk_prods
+      // matrix A's layout: [num_new_tokens, num_tokens, num_heads]
+      DT const *A = static_cast<DT *>(m->qk_prods);
+      // matrix B: query activation (in query_activation_buffer)
+      // matrix B's layout: [m->qProjSize * num_heads, num_new_tokens]
+      DT const *B = static_cast<DT *>(m->query_activation_buffer);
+      // matrix C: gradients for key (saved as part of m->devQKVProjArray)
+      // matrix C's layout: [num_tokens, qProjsize * num_heads, 3]
+      DT *C =
+          static_cast<DT *>(m->devQKVProjArray) +
+          num_tokens *
+              (m->qProjSize *
+               m->num_q_heads); // skip over regions reserved for Q gradients
+      // after transposition & striding
+      int m_ = num_tokens;
+      int n_ = m->kProjSize;
+      int k_ = num_tokens; // num_new_tokens
+      // before transposition and striding
+      int lda = num_tokens; // num_new_tokens
+      int ldb = m->kProjSize * m->num_q_heads;
+      int ldc = num_tokens;
+      int strideA = num_tokens * num_tokens;
+      int strideB = m->kProjSize;
+      int strideC = num_tokens * m->kProjSize;
+      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                           CUBLAS_OP_T,
+                                           CUBLAS_OP_T,
+                                           m_,
+                                           n_,
+                                           k_,
+                                           &alpha,
+                                           A,
+                                           cublas_data_type,
+                                           lda,
+                                           strideA,
+                                           B,
+                                           cublas_data_type,
+                                           ldb,
+                                           strideB,
+                                           &beta,
+                                           C,
+                                           cublas_data_type,
+                                           ldc,
+                                           strideC,
+                                           m->num_q_heads,
+                                           compute_type,
+                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+      if (m->inference_debugging) {
+        std::string filename =
+            get_peft_dbg_folder(m, shard_id) + ".query_activation";
+        save_tensor(
+            B, m->qProjSize * m->num_q_heads * num_tokens, filename.c_str());
+        std::string filename2 =
+            get_peft_dbg_folder(m, shard_id) + ".devkproj_pre";
+        save_tensor(
+            C, num_tokens * (m->qProjSize * m->num_q_heads), filename2.c_str());
+      }
+    }
+    // Step 6: compute gradients w.r.t query
+    {
+      float alpha = 1.0f, beta = 0.0f;
+      if (*m->qk_prod_scaling) {
+        alpha = 1.0f / sqrt(m->kProjSize);
+      }
+      // matrix A: gradients w.r.t. qk_prods
+      // matrix A's layout: [num_new_tokens, num_tokens, num_heads]
+      DT const *A = static_cast<DT *>(m->qk_prods);
+      // matrix B: key cache
+      // matrix B's layout: [vProjSize * num_heads, max_num_tokens, num_req]
+      DT const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
+      // matrix C: gradients for query (saved as part of m->devQKVProjArray)
+      // matrix C's layout: [num_tokens, qProjsize * num_heads, 3]
+      DT *C = static_cast<DT *>(m->devQKVProjArray);
+      // after transposition & striding
+      int m_ = num_tokens; // num_new_tokens
+      int n_ = m->qProjSize;
+      int k_ = num_tokens;
+      // before transposition and striding
+      int lda = num_tokens; // num_new_tokens
+      int ldb = m->qProjSize * m->num_q_heads;
+      int ldc = num_tokens;
+      int strideA = num_tokens * num_tokens;
+      int strideB = m->qProjSize;
+      int strideC = num_tokens * m->qProjSize;
+      checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
+                                           CUBLAS_OP_N,
+                                           CUBLAS_OP_T,
+                                           m_,
+                                           n_,
+                                           k_,
+                                           &alpha,
+                                           A,
+                                           cublas_data_type,
+                                           lda,
+                                           strideA,
+                                           B,
+                                           cublas_data_type,
+                                           ldb,
+                                           strideB,
+                                           &beta,
+                                           C,
+                                           cublas_data_type,
+                                           ldc,
+                                           strideC,
+                                           m->num_q_heads,
+                                           compute_type,
+                                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+      if (m->inference_debugging) {
+        std::string filename =
+            get_peft_dbg_folder(m, shard_id) + ".devQKVPRojArray_pre";
+        save_tensor(C,
+                    num_tokens * m->qProjSize * m->num_q_heads * 3,
+                    filename.c_str());
+      }
+    }
+
+    // Step 7: perform rotary position embeddings (RoPE) bwd
+    {
+      if (*m->apply_rotary_embedding) {
+        assert(m->hidden_size == m->qProjSize * m->num_q_heads);
+        assert(m->qProjSize == m->kProjSize);
+        /*q&k*/
+        int parallelism = num_tokens * m->hidden_size;
+        DT *A = static_cast<DT *>(m->devQKVProjArray);
+        apply_rotary_embedding_bwd<<<GET_BLOCKS(parallelism),
+                                     min(CUDA_NUM_THREADS, parallelism),
+                                     0,
+                                     stream>>>(A,
+                                               m->complex_input,
+                                               m->token_infos,
+                                               m->qProjSize,
+                                               num_tokens,
+                                               m->hidden_size);
+        DT *C = static_cast<DT *>(m->devQKVProjArray);
+        if (m->inference_debugging) {
+          std::string filename =
+              get_peft_dbg_folder(m, shard_id) + ".devQKVPRojArray";
+          save_tensor(C,
+                      num_tokens * m->qProjSize * m->num_q_heads * 3,
+                      filename.c_str());
+        }
+      }
+
+      // matrix C: gradients for key (saved as part of m->devQKVProjArray)
+      // matrix C's layout: [num_tokens, qProjsize * num_heads, 3]
+      DT *C =
+          static_cast<DT *>(m->devQKVProjArray) +
+          num_tokens *
+              (m->qProjSize *
+               m->num_q_heads); // skip over regions reserved for Q gradients
+      if (m->inference_debugging) {
+        std::string filename = get_peft_dbg_folder(m, shard_id) + ".devkproj";
+        save_tensor(
+            C, num_tokens * (m->qProjSize * m->num_q_heads), filename.c_str());
+      }
+    }
+
+    // Step 8: compute gradients w.r.t. input
+    {
+      float alpha = 1.0f, beta = 0.0f;
+      if (!m->reset_input_grads[0]) {
+        beta = 1.0f;
+      }
+      // matrix A: QKV projection weights
+      // matrix A's layout: [qSize, qProjSize * num_q_heads, 3]
+      DT const *A = weight_ptr;
+      // matrix B: gradients w.r.t. QKV (concatenated in devQKVArray)
+      // matrix B's layout: [num_tokens, qProjsize * num_heads, 3]
+      DT const *B = static_cast<DT *>(m->devQKVProjArray);
+      // matrix C: gradients w.r.t. input
+      // matrix C's layout: [m->qSize, num_tokens]
+      DT *C = input_grad_ptr +
+              bc->requestsInfo[i].first_token_offset_in_batch * m->qSize;
+      int m_ = m->qSize;
+      int n_ = num_tokens;
+      int k_ = m->num_q_heads * (m->qProjSize + m->kProjSize + m->vProjSize);
+      int lda = m_;
+      int ldb = n_;
+      int ldc = m_;
+      checkCUDA(cublasGemmEx(m->handle.blas,
+                             CUBLAS_OP_N,
+                             CUBLAS_OP_T,
+                             m_,
+                             n_,
+                             k_,
+                             &alpha,
+                             A,
+                             cublas_data_type,
+                             lda,
+                             B,
+                             cublas_data_type,
+                             ldb,
+                             &beta,
+                             C,
+                             cublas_data_type,
+                             ldc,
+                             compute_type,
+                             CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+      if (m->inference_debugging) {
+        std::string filename =
+            get_peft_dbg_folder(m, shard_id) + ".self_attn.input_gradient_0";
+        save_tensor(C, num_tokens * m->qSize, filename.c_str());
+      }
+    }
+  }
+}
+
 } // namespace IncMultiHeadAttention
 } // namespace Kernels
 
@@ -877,24 +1431,25 @@ __global__ void store_kv_cache(DT const *devQKVProjArray,
 }
 
 template <typename DT>
-__global__ void fill_entries_above_diagonal(DT *matrix,
-                                            size_t num_rows,
-                                            size_t num_cols,
-                                            size_t num_q_heads,
-                                            size_t entries_above_diagonal,
-                                            DT value) {
-  CUDA_KERNEL_LOOP(i, entries_above_diagonal * num_q_heads) {
-    size_t head_idx = i / entries_above_diagonal;
-    size_t entry_idx = i % entries_above_diagonal;
-    size_t y = (-1 + sqrt(8 * (float)entry_idx + 1)) / 2;
-    size_t x = entry_idx - y * (y + 1) / 2;
-    y += (num_cols - num_rows) + 1;
-    matrix[head_idx * num_rows * num_cols + num_cols * y + x] = value;
+__global__ void store_query_cache(DT const *devQKVProjArray,
+                                  DT *qCache_ptr,
+                                  int num_tokens,
+                                  int hidden_size) {
+  CUDA_KERNEL_LOOP(i, num_tokens * hidden_size) {
+    int token_idx = i / hidden_size;
+    int offset = i % hidden_size;
+
+    size_t val_idx = token_idx * QKV_WEIGHT_NUM * hidden_size + offset;
+
+    DT qVal = devQKVProjArray[val_idx];
+
+    // query cache
+    qCache_ptr[i] = qVal;
   }
 }
 
 template <typename DT>
-void compute_attention_kernel_prompt(IncMultiHeadSelfAttentionMeta const *m,
+void compute_attention_kernel_prompt(IncMultiHeadSelfAttentionMeta *m,
                                      BatchConfig const *bc,
                                      int shard_id,
                                      DT const *bias_ptr,
@@ -905,17 +1460,18 @@ void compute_attention_kernel_prompt(IncMultiHeadSelfAttentionMeta const *m,
   cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
   cudnnDataType_t cudnn_data_type = ff_to_cudnn_datatype(m->output_type[0]);
   assert(data_type_size(m->output_type[0]) == sizeof(DT));
-#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
   cudaDataType_t compute_type = cublas_data_type;
-#else
-  // For best performance, set the default cublas compute type to
-  // CUBLAS_COMPUTE_16F for half precision and to
-  // CUBLAS_COMPUTE_32F_FAST_16F for full precision
-  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
-  if (m->output_type[0] == DT_FLOAT) {
-    compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
-  }
-#endif
+  // #if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  //   cudaDataType_t compute_type = cublas_data_type;
+  // #else
+  //   // For best performance, set the default cublas compute type to
+  //   // CUBLAS_COMPUTE_16F for half precision and to
+  //   // CUBLAS_COMPUTE_32F_FAST_16F for full precision
+  //   cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+  //   if (m->output_type[0] == DT_FLOAT) {
+  //     compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
+  //   }
+  // #endif
   // int num_requests = bc->num_active_requests();
   int num_tokens = bc->num_active_tokens();
   int tokens_previous_requests = 0;
@@ -929,12 +1485,35 @@ void compute_attention_kernel_prompt(IncMultiHeadSelfAttentionMeta const *m,
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
-    if (bc->request_completed[i] || (!bc->requestsInfo[i].prompt_phase)) {
+    if (bc->request_completed[i] ||
+        (!bc->requestsInfo[i].prompt_phase && !bc->requestsInfo[i].peft_bwd)) {
       continue;
     }
     int num_new_tokens = bc->requestsInfo[i].num_tokens_in_batch;
     int total_tokens = bc->requestsInfo[i].first_token_depth_in_request +
                        bc->requestsInfo[i].num_tokens_in_batch;
+    int max_peft_tokens = bc->requestsInfo[i].max_sequence_length;
+    // Copy query to m->query_activation_buffer if we need to compute
+    // PEFT backward
+    if (bc->requestsInfo[i].peft_bwd) {
+      size_t activation_size_needed =
+          sizeof(DT) * max_peft_tokens * m->num_q_heads * m->qProjSize;
+      if (activation_size_needed > m->allocated_peft_buffer_size1) {
+        MemoryAllocator *allocator = m->handle.peft_activation_allocator;
+        m->query_activation_buffer =
+            allocator->allocate_instance_untyped(activation_size_needed);
+        m->allocated_peft_buffer_size1 = activation_size_needed;
+      }
+      int parallelism = m->hidden_size * num_tokens;
+      store_query_cache<<<GET_BLOCKS(parallelism),
+                          min(CUDA_NUM_THREADS, parallelism),
+                          0,
+                          stream>>>(
+          static_cast<DT *>(m->devQKVProjArray),
+          static_cast<DT *>(m->query_activation_buffer),
+          num_tokens,
+          m->hidden_size);
+    }
     // Step 1: compute query-key product QK.T/sqrt(d_k)
     {
       // Scale by sqrt(d_k) as per the original attention paper
@@ -1066,6 +1645,25 @@ void compute_attention_kernel_prompt(IncMultiHeadSelfAttentionMeta const *m,
                                      m->qk_tensor,
                                      C_softmax));
     }
+    // Copy C_softmax to m->softmax_activation_buffer if we need to compute
+    // PEFT backward
+    if (bc->requestsInfo[i].peft_bwd) {
+      DT *C_softmax = static_cast<DT *>(m->qk_prods_softmax);
+      size_t activation_size_needed =
+          sizeof(DT) * max_peft_tokens * max_peft_tokens * m->num_q_heads;
+      if (activation_size_needed > m->allocated_peft_buffer_size2) {
+        MemoryAllocator *allocator = m->handle.peft_activation_allocator;
+        m->softmax_activation_buffer =
+            allocator->allocate_instance_untyped(activation_size_needed);
+        m->allocated_peft_buffer_size2 = activation_size_needed;
+      }
+      checkCUDA(cudaMemcpyAsync(m->softmax_activation_buffer,
+                                C_softmax,
+                                sizeof(DT) * total_tokens * num_new_tokens *
+                                    m->num_q_heads,
+                                cudaMemcpyDeviceToDevice,
+                                stream));
+    }
     // Step 5: Matmul softmax(QK.T/sqrt(d_k)) by V. Implemented as V @
     // softmax(QK.T/sqrt(d_k)).T
     {
@@ -1090,7 +1688,6 @@ void compute_attention_kernel_prompt(IncMultiHeadSelfAttentionMeta const *m,
       // To get B, skip over softmax(QK.T/sqrt(d_k)) entries from previous
       // requests (all heads)
       DT *B = static_cast<DT *>(m->qk_prods_softmax);
-      ;
       // matrix C: attn heads
       // matrix C's layout: [vProjSize, num_heads, num_new_tokens]
       // To get C, skip over softmax(QK.T/sqrt(d_k))V products from previous
@@ -1136,7 +1733,7 @@ void compute_attention_kernel_prompt(IncMultiHeadSelfAttentionMeta const *m,
 
 /*static*/
 void IncMultiHeadSelfAttention::inference_kernel_wrapper(
-    IncMultiHeadSelfAttentionMeta const *m,
+    IncMultiHeadSelfAttentionMeta *m,
     BatchConfig const *bc,
     int shard_id,
     GenericTensorAccessorR const &input,
@@ -1206,6 +1803,70 @@ void IncMultiHeadSelfAttention::inference_kernel_wrapper(
   }
 }
 
+/*static*/
+void IncMultiHeadSelfAttention::peft_bwd_kernel_wrapper(
+    IncMultiHeadSelfAttentionMeta *m,
+    BatchConfig const *bc,
+    int shard_id,
+    GenericTensorAccessorW const &input_grad,
+    GenericTensorAccessorR const &weight,
+    GenericTensorAccessorR const &output_grad,
+    GenericTensorAccessorR const &bias) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  bool use_bias = *m->qkv_bias || *m->final_bias;
+
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+
+  // assert(input.data_type == weight.data_type);
+  assert(input_grad.data_type == output_grad.data_type);
+  if (use_bias) {
+    assert(input_grad.data_type == bias.data_type);
+  }
+
+  if (input_grad.data_type == DT_HALF) {
+    assert(!m->offload);
+    half const *bias_ptr =
+        use_bias ? bias.get_half_ptr() : static_cast<half const *>(nullptr);
+    Kernels::IncMultiHeadAttention::peft_bwd_kernel(m,
+                                                    bc,
+                                                    shard_id,
+                                                    input_grad.get_half_ptr(),
+                                                    weight.get_half_ptr(),
+                                                    output_grad.get_half_ptr(),
+                                                    bias_ptr,
+                                                    stream);
+  } else if (input_grad.data_type == DT_FLOAT) {
+    assert(!m->offload);
+    float const *bias_ptr =
+        use_bias ? bias.get_float_ptr() : static_cast<float const *>(nullptr);
+    Kernels::IncMultiHeadAttention::peft_bwd_kernel(m,
+                                                    bc,
+                                                    shard_id,
+                                                    input_grad.get_float_ptr(),
+                                                    weight.get_float_ptr(),
+                                                    output_grad.get_float_ptr(),
+                                                    bias_ptr,
+                                                    stream);
+  } else {
+    assert(false && "Unspported data type");
+  }
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("IncMultiHeadSelfAttention PEFT backward time = %.9fms\n", elapsed);
+  }
+}
+
 IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     FFHandler handler,
     IncMultiHeadSelfAttention const *attn,
@@ -1424,11 +2085,10 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
     valueCache = gpu_mem_allocator.allocate_instance_untyped(value_cache_size *
                                                              size_of_dt);
 
-    token_infos =
-        static_cast<BatchConfig::PerTokenInfo *>(handler.batch_config_metadata);
-    request_infos = reinterpret_cast<BatchConfig::PerRequestInfo *>(
-        reinterpret_cast<char *>(handler.batch_config_metadata) +
-        sizeof(BatchConfig::tokensInfo));
+    token_infos = static_cast<BatchConfig::PerTokenInfo *>(
+        handler.batch_config_metadata->tokens_info);
+    request_infos = static_cast<BatchConfig::PerRequestInfo *>(
+        handler.batch_config_metadata->requestsInfo);
 
     if (offload) {
       // token_infos =
@@ -1478,6 +2138,8 @@ IncMultiHeadSelfAttentionMeta::IncMultiHeadSelfAttentionMeta(
              gpu_mem_allocator.reserved_allocated_size);
     }
   }
+  allocated_peft_buffer_size1 = 0;
+  allocated_peft_buffer_size2 = 0;
   cudaStreamSynchronize(stream);
 }
 
diff --git a/src/ops/kernels/batch_matmul.cpp b/src/ops/kernels/batch_matmul.cpp
index 7145af2108..8eeede65c7 100644
--- a/src/ops/kernels/batch_matmul.cpp
+++ b/src/ops/kernels/batch_matmul.cpp
@@ -13,13 +13,15 @@
  * limitations under the License.
  */
 
+#include "flexflow/ops/batch_matmul.h"
 #include "flexflow/ops/kernels/batch_matmul_kernels.h"
 #include "flexflow/utils/hip_helper.h"
 #include <hip/hip_runtime.h>
 
 namespace FlexFlow {
 
-BatchMatmulMeta::BatchMatmulMeta(FFHandler handler) : OpMeta(handler) {}
+BatchMatmulMeta::BatchMatmulMeta(FFHandler handler, BatchMatmul const *bmm)
+    : OpMeta(handler, bmm) {}
 
 namespace Kernels {
 namespace BatchMatmul {
diff --git a/src/ops/kernels/batch_matmul.cu b/src/ops/kernels/batch_matmul.cu
index ac280db1a4..97f13fa5a8 100644
--- a/src/ops/kernels/batch_matmul.cu
+++ b/src/ops/kernels/batch_matmul.cu
@@ -13,12 +13,14 @@
  * limitations under the License.
  */
 
+#include "flexflow/ops/batch_matmul.h"
 #include "flexflow/ops/kernels/batch_matmul_kernels.h"
 #include "flexflow/utils/cuda_helper.h"
 
 namespace FlexFlow {
 
-BatchMatmulMeta::BatchMatmulMeta(FFHandler handler) : OpMeta(handler) {}
+BatchMatmulMeta::BatchMatmulMeta(FFHandler handler, BatchMatmul const *bmm)
+    : OpMeta(handler, bmm) {}
 
 namespace Kernels {
 namespace BatchMatmul {
diff --git a/src/ops/kernels/cast_kernels.cpp b/src/ops/kernels/cast_kernels.cpp
index 16b9b4cec0..1e561959f1 100644
--- a/src/ops/kernels/cast_kernels.cpp
+++ b/src/ops/kernels/cast_kernels.cpp
@@ -14,12 +14,13 @@
  */
 
 #include "flexflow/ops/kernels/cast_kernels.h"
+#include "flexflow/ops/cast.h"
 #include "flexflow/utils/hip_helper.h"
 #include <hip/hip_runtime.h>
 
 namespace FlexFlow {
 
-CastMeta::CastMeta(FFHandler handle) : OpMeta(handle) {}
+CastMeta::CastMeta(FFHandler handle, Cast const *cast) : OpMeta(handle, cast) {}
 
 namespace Kernels {
 namespace Cast {
diff --git a/src/ops/kernels/cast_kernels.cu b/src/ops/kernels/cast_kernels.cu
index a96f37dbbd..fdce63b9f1 100644
--- a/src/ops/kernels/cast_kernels.cu
+++ b/src/ops/kernels/cast_kernels.cu
@@ -13,12 +13,13 @@
  * limitations under the License.
  */
 
+#include "flexflow/ops/cast.h"
 #include "flexflow/ops/kernels/cast_kernels.h"
 #include "flexflow/utils/cuda_helper.h"
 
 namespace FlexFlow {
 
-CastMeta::CastMeta(FFHandler handle) : OpMeta(handle) {}
+CastMeta::CastMeta(FFHandler handle, Cast const *cast) : OpMeta(handle, cast) {}
 
 namespace Kernels {
 namespace Cast {
diff --git a/src/ops/kernels/concat_kernels.cpp b/src/ops/kernels/concat_kernels.cpp
index bf5d46b9cc..6c05e0143c 100644
--- a/src/ops/kernels/concat_kernels.cpp
+++ b/src/ops/kernels/concat_kernels.cpp
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/ops/kernels/concat_kernels.h"
+#include "flexflow/ops/concat.h"
 #include "flexflow/utils/hip_helper.h"
 #include <hip/hip_runtime.h>
 
@@ -23,6 +24,9 @@ namespace FlexFlow {
 using Legion::coord_t;
 using Legion::Rect;
 
+ConcatMeta::ConcatMeta(FFHandler handler, Concat const *cc)
+    : OpMeta(handler, cc) {}
+
 namespace Kernels {
 namespace Concat {
 
diff --git a/src/ops/kernels/concat_kernels.cu b/src/ops/kernels/concat_kernels.cu
index f625560625..2569c36b21 100644
--- a/src/ops/kernels/concat_kernels.cu
+++ b/src/ops/kernels/concat_kernels.cu
@@ -13,6 +13,7 @@
  * limitations under the License.
  */
 
+#include "flexflow/ops/concat.h"
 #include "flexflow/ops/kernels/concat_kernels.h"
 #include "flexflow/utils/cuda_helper.h"
 
@@ -22,6 +23,9 @@ namespace FlexFlow {
 using Legion::coord_t;
 using Legion::Rect;
 
+ConcatMeta::ConcatMeta(FFHandler handler, Concat const *cc)
+    : OpMeta(handler, cc) {}
+
 namespace Kernels {
 namespace Concat {
 
diff --git a/src/ops/kernels/conv_2d_kernels.cpp b/src/ops/kernels/conv_2d_kernels.cpp
index 7d2fa20c49..85a94ad6be 100644
--- a/src/ops/kernels/conv_2d_kernels.cpp
+++ b/src/ops/kernels/conv_2d_kernels.cpp
@@ -14,12 +14,14 @@
  */
 
 #include "flexflow/ops/kernels/conv_2d_kernels.h"
+#include "flexflow/ops/conv_2d.h"
 #include "flexflow/utils/hip_helper.h"
 #include <hip/hip_runtime.h>
 
 namespace FlexFlow {
 
-Conv2DMeta::Conv2DMeta(FFHandler handler) : OpMeta(handler) {
+Conv2DMeta::Conv2DMeta(FFHandler handler, Conv2D const *conv)
+    : OpMeta(handler, conv) {
   checkCUDNN(miopenCreateTensorDescriptor(&inputTensor));
   checkCUDNN(miopenCreateTensorDescriptor(&biasTensor));
   checkCUDNN(miopenCreateTensorDescriptor(&outputTensor));
@@ -326,7 +328,7 @@ void backward_kernel(Conv2DMeta const *m,
                        output_ptr,
                        n * c * h * w);
   }
-  // Compute filter gradiant
+  // Compute filter gradient
   // NOTE: we use alpha for kernel_grad to accumulate gradients
   checkCUDNN(miopenConvolutionBackwardWeights(m->handle.dnn,
                                               &alpha,
@@ -341,7 +343,7 @@ void backward_kernel(Conv2DMeta const *m,
                                               kernel_grad_ptr,
                                               m->handle.workSpace,
                                               m->handle.workSpaceSize));
-  // Compute bias gradiant
+  // Compute bias gradient
   // NOTE: we use alpha for bias_grad to accumulate gradients
   if (bias_grad_ptr != NULL) {
     checkCUDNN(miopenConvolutionBackwardBias(m->handle.dnn,
@@ -352,7 +354,7 @@ void backward_kernel(Conv2DMeta const *m,
                                              m->biasTensor,
                                              bias_grad_ptr));
   }
-  // Compute data gradiant
+  // Compute data gradient
   // NOTE: we use alpha for input_grad to accumulate gradients
   if (input_grad_ptr != NULL) {
     checkCUDNN(miopenConvolutionBackwardData(m->handle.dnn,
diff --git a/src/ops/kernels/conv_2d_kernels.cu b/src/ops/kernels/conv_2d_kernels.cu
index 6c0fd85496..661acdf732 100644
--- a/src/ops/kernels/conv_2d_kernels.cu
+++ b/src/ops/kernels/conv_2d_kernels.cu
@@ -1,9 +1,11 @@
+#include "flexflow/ops/conv_2d.h"
 #include "flexflow/ops/kernels/conv_2d_kernels.h"
 #include "flexflow/utils/cuda_helper.h"
 
 namespace FlexFlow {
 
-Conv2DMeta::Conv2DMeta(FFHandler handler) : OpMeta(handler) {
+Conv2DMeta::Conv2DMeta(FFHandler handler, Conv2D const *conv)
+    : OpMeta(handler, conv) {
   checkCUDNN(cudnnCreateTensorDescriptor(&inputTensor));
   checkCUDNN(cudnnCreateTensorDescriptor(&biasTensor));
   checkCUDNN(cudnnCreateTensorDescriptor(&outputTensor));
@@ -309,7 +311,7 @@ void backward_kernel(Conv2DMeta const *m,
     reluBackward<<<GET_BLOCKS(n * c * h * w), CUDA_NUM_THREADS, 0, stream>>>(
         output_grad_ptr, output_ptr, n * c * h * w);
   }
-  // Compute filter gradiant
+  // Compute filter gradient
   // NOTE: we use alpha for kernel_grad to accumulate gradients
   checkCUDNN(cudnnConvolutionBackwardFilter(m->handle.dnn,
                                             &alpha,
@@ -324,7 +326,7 @@ void backward_kernel(Conv2DMeta const *m,
                                             &alpha,
                                             m->filterDesc,
                                             kernel_grad_ptr));
-  // Compute bias gradiant
+  // Compute bias gradient
   // NOTE: we use alpha for bias_grad to accumulate gradients
   if (bias_grad_ptr != NULL) {
     checkCUDNN(cudnnConvolutionBackwardBias(m->handle.dnn,
@@ -335,7 +337,7 @@ void backward_kernel(Conv2DMeta const *m,
                                             m->biasTensor,
                                             bias_grad_ptr));
   }
-  // Compute data gradiant
+  // Compute data gradient
   // NOTE: we use alpha for input_grad to accumulate gradients
   if (input_grad_ptr != NULL) {
     checkCUDNN(cudnnConvolutionBackwardData(m->handle.dnn,
diff --git a/src/ops/kernels/dropout_kernels.cpp b/src/ops/kernels/dropout_kernels.cpp
index 14225f0bce..c8b1887fd4 100644
--- a/src/ops/kernels/dropout_kernels.cpp
+++ b/src/ops/kernels/dropout_kernels.cpp
@@ -28,7 +28,7 @@ DropoutMeta::DropoutMeta(FFHandler handler,
                          Dropout const *dropout,
                          Memory gpu_mem,
                          Domain const &output_domain)
-    : OpMeta(handler) {
+    : OpMeta(handler, dropout) {
   profiling = dropout->profiling;
   inference_debugging = dropout->inference_debugging;
   checkCUDNN(miopenCreateTensorDescriptor(&inputTensor));
diff --git a/src/ops/kernels/dropout_kernels.cu b/src/ops/kernels/dropout_kernels.cu
index e142bba83b..d65b951f51 100644
--- a/src/ops/kernels/dropout_kernels.cu
+++ b/src/ops/kernels/dropout_kernels.cu
@@ -27,7 +27,7 @@ DropoutMeta::DropoutMeta(FFHandler handler,
                          Dropout const *dropout,
                          Memory gpu_mem,
                          Domain const &output_domain)
-    : OpMeta(handler) {
+    : OpMeta(handler, dropout) {
   profiling = dropout->profiling;
   inference_debugging = dropout->inference_debugging;
   checkCUDNN(cudnnCreateTensorDescriptor(&inputTensor));
diff --git a/src/ops/kernels/flat_kernels.cpp b/src/ops/kernels/flat_kernels.cpp
index be48854fc0..6815ce7492 100644
--- a/src/ops/kernels/flat_kernels.cpp
+++ b/src/ops/kernels/flat_kernels.cpp
@@ -14,11 +14,15 @@
  */
 
 #include "flexflow/ops/kernels/flat_kernels.h"
+#include "flexflow/ops/flat.h"
 #include "flexflow/utils/hip_helper.h"
 #include <hip/hip_runtime.h>
 
 namespace FlexFlow {
 
+FlatMeta::FlatMeta(FFHandler handler, Flat const *flat)
+    : OpMeta(handler, flat) {}
+
 namespace Kernels {
 namespace Flat {
 
diff --git a/src/ops/kernels/flat_kernels.cu b/src/ops/kernels/flat_kernels.cu
index 3836c02c94..fc0c0270c1 100644
--- a/src/ops/kernels/flat_kernels.cu
+++ b/src/ops/kernels/flat_kernels.cu
@@ -13,11 +13,15 @@
  * limitations under the License.
  */
 
+#include "flexflow/ops/flat.h"
 #include "flexflow/ops/kernels/flat_kernels.h"
 #include "flexflow/utils/cuda_helper.h"
 
 namespace FlexFlow {
 
+FlatMeta::FlatMeta(FFHandler handler, Flat const *flat)
+    : OpMeta(handler, flat) {}
+
 namespace Kernels {
 namespace Flat {
 
diff --git a/src/ops/kernels/linear_kernels.cpp b/src/ops/kernels/linear_kernels.cpp
index 072eb5e96b..a36d6719c9 100644
--- a/src/ops/kernels/linear_kernels.cpp
+++ b/src/ops/kernels/linear_kernels.cpp
@@ -14,6 +14,8 @@
  */
 
 #include "flexflow/ops/kernels/linear_kernels.h"
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/ops/kernels/decompress_kernels.h"
 #include "flexflow/utils/hip_helper.h"
 #include <hip/hip_runtime.h>
 
@@ -24,24 +26,53 @@ LinearMeta::LinearMeta(FFHandler handler,
                        Linear const *li,
                        MemoryAllocator gpu_mem_allocator,
                        int weightSize)
-    : OpMeta(handler, li) {
+    : OpMeta(handler, li), weight_ptr(nullptr) {
+  DataType data_type = li->data_type;
+  // allocate weight and bias in the reserve space for cpu offloading
+  if (li->offload) {
+    weight_ptr = gpu_mem_allocator.allocate_reserved_untyped(
+        weightSize * data_type_size(data_type));
+    if (li->quantization_type != DT_NONE) {
+      quantized_weightSize = get_quantization_to_byte_size(
+          data_type, li->quantization_type, weightSize);
+      quantized_weight_ptr =
+          gpu_mem_allocator.allocate_reserved<char>(quantized_weightSize);
+    }
+  }
   // Allocate an all-one's vector
-  float *dram_one_ptr = (float *)malloc(sizeof(float) * batch_size);
-  for (int i = 0; i < batch_size; i++) {
-    dram_one_ptr[i] = 1.0f;
+  gpu_mem_allocator.create_legion_instance(
+      reserveInst, data_type_size(data_type) * batch_size);
+  one_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * batch_size);
+  int parallelism = batch_size;
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  if (data_type == DT_FLOAT) {
+    Kernels::Linear::Internal::
+        build_one_ptr<<<GET_BLOCKS(parallelism),
+                        min(CUDA_NUM_THREADS, parallelism),
+                        0,
+                        stream>>>((float *)one_ptr, batch_size);
+  } else if (data_type == DT_HALF) {
+    Kernels::Linear::Internal::
+        build_one_ptr<<<GET_BLOCKS(parallelism),
+                        min(CUDA_NUM_THREADS, parallelism),
+                        0,
+                        stream>>>((half *)one_ptr, batch_size);
   }
-  float *fb_one_ptr;
-  checkCUDA(hipMalloc(&fb_one_ptr, sizeof(float) * batch_size));
-  checkCUDA(hipMemcpy(fb_one_ptr,
-                      dram_one_ptr,
-                      sizeof(float) * batch_size,
-                      hipMemcpyHostToDevice));
-  one_ptr = (void *)fb_one_ptr;
+
   // Allocate descriptors
   checkCUDNN(miopenCreateActivationDescriptor(&actiDesc));
   checkCUDNN(miopenCreateTensorDescriptor(&outputTensor));
+
+  allocated_peft_buffer_size = 0;
+}
+
+LinearMeta::~LinearMeta(void) {
+  if (reserveInst != Realm::RegionInstance::NO_INST) {
+    reserveInst.destroy();
+  }
 }
-LinearMeta::~LinearMeta(void) {}
 
 namespace Kernels {
 namespace Linear {
@@ -96,7 +127,61 @@ void forward_kernel_wrapper(LinearMeta const *m,
                             int batch_size) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+  if (m->input_type[0] == DT_FLOAT) {
+    Internal::forward_kernel<float>(m,
+                                    input_ptr,
+                                    output_ptr,
+                                    weight_ptr,
+                                    bias_ptr,
+                                    in_dim,
+                                    out_dim,
+                                    batch_size,
+                                    stream);
+  } else if (m->input_type[0] == DT_HALF) {
+    Internal::forward_kernel<half>(m,
+                                   input_ptr,
+                                   output_ptr,
+                                   weight_ptr,
+                                   bias_ptr,
+                                   in_dim,
+                                   out_dim,
+                                   batch_size,
+                                   stream);
+  }
+
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("%s [Linear] forward time = %.2lfms\n", m->op_name, elapsed);
+    // print_tensor<float>((float*)input_ptr, in_dim * batch_size,
+    // "[Linear:forward:input]"); print_tensor<float>((float*)weight_ptr, in_dim
+    // * out_dim, "[Linear:forward:kernel]");
+    // print_tensor<float>((float*)output_ptr, out_dim * batch_size,
+    // "[Linear:forward:output]");
+  }
+}
 
+void inference_kernel_wrapper(LinearMeta *m,
+                              BatchConfig const *bc,
+                              void const *input_ptr,
+                              void *output_ptr,
+                              void const *weight_ptr,
+                              void const *bias_ptr,
+                              int in_dim,
+                              int out_dim,
+                              int batch_size) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
   hipEvent_t t_start, t_end;
   if (m->profiling) {
     checkCUDA(hipEventCreate(&t_start));
@@ -126,6 +211,67 @@ void forward_kernel_wrapper(LinearMeta const *m,
                                    stream);
   }
 
+  if (m->activation == AC_MODE_RELU || m->activation == AC_MODE_SIGMOID) {
+    // save input activation if needed for PEFT
+    if (bc->num_active_peft_tokens() > 0) {
+      // Check that we have at most one request that requires peft_bwd
+      int num_peft_requests = 0;
+      for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+        if (bc->request_completed[i]) {
+          continue;
+        }
+        if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+          continue;
+        }
+        if (bc->requestsInfo[i].peft_bwd) {
+          num_peft_requests++;
+        }
+      }
+      assert(num_peft_requests <= 1);
+
+      for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+        if (bc->request_completed[i]) {
+          continue;
+        }
+        // Skip non-PEFT requests
+        if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+          continue;
+        }
+        int num_peft_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+        int max_peft_tokens = bc->requestsInfo[i].max_sequence_length;
+        int first_token_offset = bc->requestsInfo[i].num_tokens_in_batch;
+        if (bc->requestsInfo[i].peft_bwd) {
+          size_t activation_size_needed =
+              data_type_size(m->output_type[0]) * max_peft_tokens * out_dim;
+          if (activation_size_needed > m->allocated_peft_buffer_size) {
+            MemoryAllocator *allocator = m->handle.peft_activation_allocator;
+            m->output_activation_buffer =
+                allocator->allocate_instance_untyped(activation_size_needed);
+            m->allocated_peft_buffer_size = activation_size_needed;
+          }
+          // copy output activation
+          if (m->output_type[0] == DT_FLOAT) {
+            checkCUDA(hipMemcpyAsync(
+                m->output_activation_buffer,
+                static_cast<float *>(output_ptr) + first_token_offset * out_dim,
+                data_type_size(m->output_type[0]) * num_peft_tokens * out_dim,
+                hipMemcpyDeviceToDevice,
+                stream));
+          } else if (m->output_type[0] == DT_HALF) {
+            checkCUDA(hipMemcpyAsync(
+                m->output_activation_buffer,
+                static_cast<half *>(output_ptr) + first_token_offset * out_dim,
+                data_type_size(m->output_type[0]) * num_peft_tokens * out_dim,
+                hipMemcpyDeviceToDevice,
+                stream));
+          } else {
+            assert(false && "unsupport datatype in layernorm");
+          }
+        }
+      }
+    }
+  }
+
   if (m->profiling) {
     checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
@@ -134,12 +280,60 @@ void forward_kernel_wrapper(LinearMeta const *m,
     checkCUDA(hipEventDestroy(t_start));
     checkCUDA(hipEventDestroy(t_end));
     printf("%s [Linear] forward time = %.2lfms\n", m->op_name, elapsed);
-    // print_tensor<float>(acc_input.ptr, acc_input.rect.volume(),
-    // "[Linear:forward:input]"); print_tensor<float>(acc_kernel.ptr,
-    // acc_kernel.rect.volume(), "[Linear:forward:kernel]");
-    // print_tensor<float>(acc_bias.ptr, acc_bias.rect.volume(),
-    // "[Linear:forward:bias]"); print_tensor<float>(acc_output.ptr,
-    // acc_output.rect.volume(), "[Linear:forward:output]");
+  }
+}
+
+void peft_bwd_kernel_wrapper(LinearMeta const *m,
+                             void *input_grad_ptr,
+                             void *output_grad_ptr,
+                             void const *weight_ptr,
+                             int in_dim,
+                             int out_dim,
+                             int num_infr_tokens,
+                             int num_peft_tokens) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+  if (m->input_type[0] == DT_FLOAT) {
+    Internal::peft_bwd_kernel<float>(m,
+                                     input_grad_ptr,
+                                     output_grad_ptr,
+                                     weight_ptr,
+                                     in_dim,
+                                     out_dim,
+                                     num_infr_tokens,
+                                     num_peft_tokens,
+                                     stream);
+  } else if (m->input_type[0] == DT_HALF) {
+    Internal::peft_bwd_kernel<half>(m,
+                                    input_grad_ptr,
+                                    output_grad_ptr,
+                                    weight_ptr,
+                                    in_dim,
+                                    out_dim,
+                                    num_infr_tokens,
+                                    num_peft_tokens,
+                                    stream);
+  }
+
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("%s [Linear] PEFT Bwd time = %.2lfms\n", m->op_name, elapsed);
+    // print_tensor<float>((float*)input_ptr, in_dim * batch_size,
+    // "[Linear:forward:input]"); print_tensor<float>((float*)weight_ptr, in_dim
+    // * out_dim, "[Linear:forward:kernel]");
+    // print_tensor<float>((float*)output_ptr, out_dim * batch_size,
+    // "[Linear:forward:output]");
   }
 }
 
@@ -223,8 +417,20 @@ Parameter* Linear::get_parameter(int index)
   }
 }
 */
-
 namespace Internal {
+
+template <typename DT>
+__global__ void AddBiasWithReLU(DT *output_ptr,
+                                DT const *bias_ptr,
+                                int out_dim,
+                                int batch_size) {
+  CUDA_KERNEL_LOOP(i, out_dim * batch_size) {
+    int bias_idx = i % out_dim;
+    DT value = output_ptr[i] + bias_ptr[bias_idx];
+    output_ptr[i] = ((float)value > 0.0f) ? value : (DT)0.0f;
+  }
+}
+
 template <typename DT>
 void forward_kernel(LinearMeta const *m,
                     void const *input_ptr,
@@ -234,20 +440,57 @@ void forward_kernel(LinearMeta const *m,
                     int in_dim,
                     int out_dim,
                     int batch_size,
-                    hipStream_t stream) {
+                    ffStream_t stream) {
+  // additional processing for uploading weights
+  if (m->offload) {
+    // Note that we update weight_ptr when uploading weight
+    if (m->quantization_type != DT_NONE) {
+      checkCUDA(hipMemcpyAsync(m->quantized_weight_ptr,
+                               weight_ptr,
+                               m->quantized_weightSize,
+                               hipMemcpyHostToDevice,
+                               stream));
+      if (m->quantization_type == DT_INT4) {
+        int parallelism = in_dim * out_dim / 2;
+        decompress_int4_general_weights<DT>
+            <<<GET_BLOCKS(parallelism),
+               min(CUDA_NUM_THREADS, parallelism),
+               0,
+               stream>>>(m->quantized_weight_ptr,
+                         static_cast<DT *>(m->weight_ptr),
+                         in_dim,
+                         in_dim * out_dim);
+      } else {
+        assert(m->quantization_type == DT_INT8);
+        int parallelism = in_dim * out_dim;
+        decompress_int8_general_weights<DT>
+            <<<GET_BLOCKS(parallelism),
+               min(CUDA_NUM_THREADS, parallelism),
+               0,
+               stream>>>(m->quantized_weight_ptr,
+                         static_cast<DT *>(m->weight_ptr),
+                         in_dim,
+                         in_dim * out_dim);
+      }
+
+    } else {
+      checkCUDA(hipMemcpyAsync(m->weight_ptr,
+                               weight_ptr,
+                               in_dim * out_dim * sizeof(DT),
+                               hipMemcpyHostToDevice,
+                               stream));
+    }
+  }
   checkCUDA(hipblasSetStream(m->handle.blas, stream));
   checkCUDNN(miopenSetStream(m->handle.dnn, stream));
   DT alpha = 1.0f, beta = 0.0f;
   hipblasDatatype_t input_type = ff_to_cuda_datatype(m->input_type[0]);
-  hipblasDatatype_t weight_type = ff_to_cuda_datatype(m->weight_type[0]);
+  hipblasDatatype_t weight_type = m->offload
+                                      ? ff_to_cuda_datatype(m->weight_ptr_type)
+                                      : ff_to_cuda_datatype(m->weight_type[0]);
   hipblasDatatype_t output_type = ff_to_cuda_datatype(m->output_type[0]);
-#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
-  hipblasDatatype_t compute_type = output_type;
-#else
-  // TODO: currently use the output_type
-  // cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+  assert(input_type == weight_type && weight_type == output_type);
   hipblasDatatype_t compute_type = output_type;
-#endif
   checkCUDA(hipblasGemmEx(m->handle.blas,
                           HIPBLAS_OP_T,
                           HIPBLAS_OP_N,
@@ -255,7 +498,7 @@ void forward_kernel(LinearMeta const *m,
                           batch_size,
                           in_dim,
                           &alpha,
-                          weight_ptr,
+                          m->offload ? m->weight_ptr : weight_ptr,
                           weight_type,
                           in_dim,
                           input_ptr,
@@ -269,6 +512,16 @@ void forward_kernel(LinearMeta const *m,
                           HIPBLAS_GEMM_DEFAULT));
   // use_bias = True
   if (bias_ptr != NULL) {
+    // fuse bias and relu
+    if (m->activation == AC_MODE_RELU) {
+      int parallelism = out_dim * batch_size;
+      AddBiasWithReLU<<<GET_BLOCKS(parallelism), CUDA_NUM_THREADS, 0, stream>>>(
+          static_cast<DT *>(output_ptr),
+          static_cast<DT const *>(bias_ptr),
+          out_dim,
+          batch_size);
+      return;
+    }
     checkCUDA(hipblasGemmEx(m->handle.blas,
                             HIPBLAS_OP_T,
                             HIPBLAS_OP_N,
@@ -306,7 +559,7 @@ void forward_kernel(LinearMeta const *m,
                        GET_BLOCKS(elements),
                        CUDA_NUM_THREADS,
                        0,
-                       0,
+                       stream,
                        elements,
                        B,
                        C,
@@ -318,6 +571,74 @@ void forward_kernel(LinearMeta const *m,
   }
 }
 
+template <typename DT>
+void peft_bwd_kernel(LinearMeta const *m,
+                     void *input_grad_ptr,
+                     void *output_grad_ptr,
+                     void const *kernel_ptr,
+                     int in_dim,
+                     int out_dim,
+                     int num_infr_tokens,
+                     int num_peft_tokens,
+                     ffStream_t stream) {
+  checkCUDA(hipblasSetStream(m->handle.blas, stream));
+  checkCUDNN(miopenSetStream(m->handle.dnn, stream));
+
+  hipblasDatatype_t input_type = ff_to_cuda_datatype(m->input_type[0]);
+  hipblasDatatype_t weight_type = ff_to_cuda_datatype(m->weight_type[0]);
+  hipblasDatatype_t output_type = ff_to_cuda_datatype(m->output_type[0]);
+  // update input_grad_ptr and output_grad_ptr offset
+  int num_infr_only_tokens = num_infr_tokens - num_peft_tokens;
+  input_grad_ptr =
+      static_cast<DT *>(input_grad_ptr) + num_infr_only_tokens * in_dim;
+  output_grad_ptr =
+      static_cast<DT *>(output_grad_ptr) + num_infr_only_tokens * out_dim;
+  hipblasDatatype_t compute_type = output_type;
+  int output_size = out_dim * num_peft_tokens;
+  if (m->activation == AC_MODE_RELU) {
+    relu_backward_kernel(m->output_type[0],
+                         output_grad_ptr,
+                         m->output_activation_buffer,
+                         output_size,
+                         stream);
+  } else if (m->activation == AC_MODE_SIGMOID) {
+    sigmoid_backward_kernel(m->output_type[0],
+                            output_grad_ptr,
+                            m->output_activation_buffer,
+                            output_size,
+                            stream);
+  } else {
+    // TODO: only support relu and sigmoid for now
+    assert(m->activation == AC_MODE_NONE);
+  }
+
+  // Compute data gradient
+  // NOTE: we use beta=1 for input_grad to accumulate gradients when needed
+  DT alpha = 1.0f;
+  DT beta = m->reset_input_grads[0] ? 0.0f : 1.0f;
+  if (input_grad_ptr != NULL) {
+    checkCUDA(hipblasGemmEx(m->handle.blas,
+                            HIPBLAS_OP_N,
+                            HIPBLAS_OP_N,
+                            in_dim,
+                            num_peft_tokens,
+                            out_dim,
+                            &alpha,
+                            kernel_ptr,
+                            weight_type,
+                            in_dim,
+                            output_grad_ptr,
+                            output_type,
+                            out_dim,
+                            &beta,
+                            input_grad_ptr,
+                            input_type,
+                            in_dim,
+                            compute_type,
+                            HIPBLAS_GEMM_DEFAULT));
+  }
+}
+
 template <typename DT>
 void backward_kernel(LinearMeta const *m,
                      void const *input_ptr,
@@ -335,16 +656,11 @@ void backward_kernel(LinearMeta const *m,
   checkCUDNN(miopenSetStream(m->handle.dnn, stream));
 
   DT alpha = 1.0f;
+  float sgeam_alpha = 1.0f;
   hipblasDatatype_t input_type = ff_to_cuda_datatype(m->input_type[0]);
   hipblasDatatype_t weight_type = ff_to_cuda_datatype(m->weight_type[0]);
   hipblasDatatype_t output_type = ff_to_cuda_datatype(m->output_type[0]);
-#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
   hipblasDatatype_t compute_type = output_type;
-#else
-  // TODO: currently use output_type
-  // cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
-  hipblasDatatype_t compute_type = output_type;
-#endif
   int output_size = out_dim * batch_size;
   if (m->activation == AC_MODE_RELU) {
     relu_backward_kernel(
@@ -356,7 +672,7 @@ void backward_kernel(LinearMeta const *m,
     // TODO: only support relu and sigmoid for now
     assert(m->activation == AC_MODE_NONE);
   }
-  // Compute weight gradiant
+  // Compute weight gradient
   // NOTE: we use alpha=1 for kernel_grad to accumulate gradients
   checkCUDA(hipblasGemmEx(m->handle.blas,
                           HIPBLAS_OP_N,
@@ -377,7 +693,27 @@ void backward_kernel(LinearMeta const *m,
                           in_dim,
                           compute_type,
                           HIPBLAS_GEMM_DEFAULT));
-  // Compute bias gradiant
+  if (m->kernel_reg_type == REG_MODE_NONE) {
+    // do nothing
+  } else if (m->kernel_reg_type == REG_MODE_L2) {
+    checkCUDA(hipblasSgeam(m->handle.blas,
+                           HIPBLAS_OP_N,
+                           HIPBLAS_OP_N,
+                           in_dim,
+                           out_dim,
+                           &sgeam_alpha,
+                           (float *)kernel_grad_ptr,
+                           in_dim,
+                           &(m->kernel_reg_lambda),
+                           (float *)kernel_ptr,
+                           in_dim,
+                           (float *)kernel_grad_ptr,
+                           in_dim));
+  } else {
+    assert(false && "Only L2 regularization is supported");
+  }
+
+  // Compute bias gradient
   // NOTE: we use alpha=1 for bias_grad to accumulate gradients
   // use_bias = True
   if (bias_grad_ptr != NULL) {
@@ -388,7 +724,7 @@ void backward_kernel(LinearMeta const *m,
                             out_dim,
                             batch_size,
                             &alpha,
-                            m->one_ptr,
+                            static_cast<DT *>(m->one_ptr),
                             HIPBLAS_R_32F,
                             1,
                             output_grad_ptr,
@@ -401,7 +737,7 @@ void backward_kernel(LinearMeta const *m,
                             compute_type,
                             HIPBLAS_GEMM_DEFAULT));
   }
-  // Compute data gradiant
+  // Compute data gradient
   // NOTE: we use alpha=1 for input_grad to accumulate gradients
   if (input_grad_ptr != NULL) {
     checkCUDA(hipblasGemmEx(m->handle.blas,
@@ -426,7 +762,14 @@ void backward_kernel(LinearMeta const *m,
   }
 }
 
+template <typename DT>
+__global__ void build_one_ptr(DT *one_ptr, int batch_size) {
+  CUDA_KERNEL_LOOP(i, batch_size) {
+    one_ptr[i] = static_cast<DT>(1.0f);
+  }
+}
+
 } // namespace Internal
 } // namespace Linear
 } // namespace Kernels
-}; // namespace FlexFlow
+} // namespace FlexFlow
diff --git a/src/ops/kernels/linear_kernels.cu b/src/ops/kernels/linear_kernels.cu
index c30c9f71c1..d4f930db6c 100644
--- a/src/ops/kernels/linear_kernels.cu
+++ b/src/ops/kernels/linear_kernels.cu
@@ -63,6 +63,8 @@ LinearMeta::LinearMeta(FFHandler handler,
   // Allocate descriptors
   checkCUDNN(cudnnCreateActivationDescriptor(&actiDesc));
   checkCUDNN(cudnnCreateTensorDescriptor(&outputTensor));
+
+  allocated_peft_buffer_size = 0;
 }
 
 LinearMeta::~LinearMeta(void) {
@@ -170,6 +172,172 @@ void forward_kernel_wrapper(LinearMeta const *m,
   }
 }
 
+void inference_kernel_wrapper(LinearMeta *m,
+                              BatchConfig const *bc,
+                              void const *input_ptr,
+                              void *output_ptr,
+                              void const *weight_ptr,
+                              void const *bias_ptr,
+                              int in_dim,
+                              int out_dim,
+                              int batch_size) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+
+  if (m->input_type[0] == DT_FLOAT) {
+    Internal::forward_kernel<float>(m,
+                                    input_ptr,
+                                    output_ptr,
+                                    weight_ptr,
+                                    bias_ptr,
+                                    in_dim,
+                                    out_dim,
+                                    batch_size,
+                                    stream);
+  } else if (m->input_type[0] == DT_HALF) {
+    Internal::forward_kernel<half>(m,
+                                   input_ptr,
+                                   output_ptr,
+                                   weight_ptr,
+                                   bias_ptr,
+                                   in_dim,
+                                   out_dim,
+                                   batch_size,
+                                   stream);
+  }
+
+  if (m->activation == AC_MODE_RELU || m->activation == AC_MODE_SIGMOID) {
+    // save input activation if needed for PEFT
+    if (bc->num_active_peft_tokens() > 0) {
+      // Check that we have at most one request that requires peft_bwd
+      int num_peft_requests = 0;
+      for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+        if (bc->request_completed[i]) {
+          continue;
+        }
+        if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+          continue;
+        }
+        if (bc->requestsInfo[i].peft_bwd) {
+          num_peft_requests++;
+        }
+      }
+      assert(num_peft_requests <= 1);
+
+      for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+        if (bc->request_completed[i]) {
+          continue;
+        }
+        // Skip non-PEFT requests
+        if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+          continue;
+        }
+        int num_peft_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+        int max_peft_tokens = bc->requestsInfo[i].max_sequence_length;
+        int first_token_offset = bc->requestsInfo[i].num_tokens_in_batch;
+        if (bc->requestsInfo[i].peft_bwd) {
+          size_t activation_size_needed =
+              data_type_size(m->output_type[0]) * max_peft_tokens * out_dim;
+          if (activation_size_needed > m->allocated_peft_buffer_size) {
+            MemoryAllocator *allocator = m->handle.peft_activation_allocator;
+            m->output_activation_buffer =
+                allocator->allocate_instance_untyped(activation_size_needed);
+            m->allocated_peft_buffer_size = activation_size_needed;
+          }
+          // copy output activation
+          if (m->output_type[0] == DT_FLOAT) {
+            checkCUDA(cudaMemcpyAsync(
+                m->output_activation_buffer,
+                static_cast<float *>(output_ptr) + first_token_offset * out_dim,
+                data_type_size(m->output_type[0]) * num_peft_tokens * out_dim,
+                cudaMemcpyDeviceToDevice,
+                stream));
+          } else if (m->output_type[0] == DT_HALF) {
+            checkCUDA(cudaMemcpyAsync(
+                m->output_activation_buffer,
+                static_cast<half *>(output_ptr) + first_token_offset * out_dim,
+                data_type_size(m->output_type[0]) * num_peft_tokens * out_dim,
+                cudaMemcpyDeviceToDevice,
+                stream));
+          } else {
+            assert(false && "unsupport datatype in layernorm");
+          }
+        }
+      }
+    }
+  }
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("%s [Linear] inference time = %.2lfms\n", m->op_name, elapsed);
+  }
+}
+
+void peft_bwd_kernel_wrapper(LinearMeta const *m,
+                             void *input_grad_ptr,
+                             void *output_grad_ptr,
+                             void const *weight_ptr,
+                             int in_dim,
+                             int out_dim,
+                             int num_infr_tokens,
+                             int num_peft_tokens) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+  if (m->input_type[0] == DT_FLOAT) {
+    Internal::peft_bwd_kernel<float>(m,
+                                     input_grad_ptr,
+                                     output_grad_ptr,
+                                     weight_ptr,
+                                     in_dim,
+                                     out_dim,
+                                     num_infr_tokens,
+                                     num_peft_tokens,
+                                     stream);
+  } else if (m->input_type[0] == DT_HALF) {
+    Internal::peft_bwd_kernel<half>(m,
+                                    input_grad_ptr,
+                                    output_grad_ptr,
+                                    weight_ptr,
+                                    in_dim,
+                                    out_dim,
+                                    num_infr_tokens,
+                                    num_peft_tokens,
+                                    stream);
+  }
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("%s [Linear] PEFT Bwd time = %.2lfms\n", m->op_name, elapsed);
+    // print_tensor<float>((float*)input_ptr, in_dim * batch_size,
+    // "[Linear:forward:input]"); print_tensor<float>((float*)weight_ptr, in_dim
+    // * out_dim, "[Linear:forward:kernel]");
+    // print_tensor<float>((float*)output_ptr, out_dim * batch_size,
+    // "[Linear:forward:output]");
+  }
+}
+
 void backward_kernel_wrapper(LinearMeta const *m,
                              void const *input_ptr,
                              void *input_grad_ptr,
@@ -323,17 +491,7 @@ void forward_kernel(LinearMeta const *m,
                                    : ff_to_cuda_datatype(m->weight_type[0]);
   cudaDataType_t output_type = ff_to_cuda_datatype(m->output_type[0]);
   assert(input_type == weight_type && weight_type == output_type);
-#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
-  cudaDataType_t compute_type = cublas_data_type;
-#else
-  // For best performance, set the default cublas compute type to
-  // CUBLAS_COMPUTE_16F for half precision and to
-  // CUBLAS_COMPUTE_32F_FAST_16F for full precision
-  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
-  if (m->output_type[0] == DT_FLOAT) {
-    compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
-  }
-#endif
+  cudaDataType_t compute_type = output_type;
   checkCUDA(cublasGemmEx(m->handle.blas,
                          CUBLAS_OP_T,
                          CUBLAS_OP_N,
@@ -398,7 +556,7 @@ void forward_kernel(LinearMeta const *m,
     size_t elements = (size_t)out_dim * (size_t)batch_size;
     constexpr float B = 0.7978845608028654f;   // sqrt(2.0/M_PI)
     constexpr float C = 0.035677408136300125f; // 0.044715 * sqrt(2.0/M_PI)
-    gelu_forward_kernel<<<GET_BLOCKS(elements), CUDA_NUM_THREADS>>>(
+    gelu_forward_kernel<<<GET_BLOCKS(elements), CUDA_NUM_THREADS, 0, stream>>>(
         elements, B, C, (float *)output_ptr);
   } else if (m->activation == AC_MODE_NONE) {
     // Do nothing
@@ -407,6 +565,74 @@ void forward_kernel(LinearMeta const *m,
   }
 }
 
+template <typename DT>
+void peft_bwd_kernel(LinearMeta const *m,
+                     void *input_grad_ptr,
+                     void *output_grad_ptr,
+                     void const *kernel_ptr,
+                     int in_dim,
+                     int out_dim,
+                     int num_infr_tokens,
+                     int num_peft_tokens,
+                     ffStream_t stream) {
+  checkCUDA(cublasSetStream(m->handle.blas, stream));
+  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
+
+  cudaDataType_t input_type = ff_to_cuda_datatype(m->input_type[0]);
+  cudaDataType_t weight_type = ff_to_cuda_datatype(m->weight_type[0]);
+  cudaDataType_t output_type = ff_to_cuda_datatype(m->output_type[0]);
+  // update input_grad_ptr and output_grad_ptr offset
+  int num_infr_only_tokens = num_infr_tokens - num_peft_tokens;
+  input_grad_ptr =
+      static_cast<DT *>(input_grad_ptr) + num_infr_only_tokens * in_dim;
+  output_grad_ptr =
+      static_cast<DT *>(output_grad_ptr) + num_infr_only_tokens * out_dim;
+  cudaDataType_t compute_type = output_type;
+  int output_size = out_dim * num_peft_tokens;
+  if (m->activation == AC_MODE_RELU) {
+    relu_backward_kernel(m->output_type[0],
+                         output_grad_ptr,
+                         m->output_activation_buffer,
+                         output_size,
+                         stream);
+  } else if (m->activation == AC_MODE_SIGMOID) {
+    sigmoid_backward_kernel(m->output_type[0],
+                            output_grad_ptr,
+                            m->output_activation_buffer,
+                            output_size,
+                            stream);
+  } else {
+    // TODO: only support relu and sigmoid for now
+    assert(m->activation == AC_MODE_NONE);
+  }
+
+  // Compute data gradient
+  // NOTE: we use beta=1 for input_grad to accumulate gradients when needed
+  DT alpha = 1.0f;
+  DT beta = m->reset_input_grads[0] ? 0.0f : 1.0f;
+  if (input_grad_ptr != NULL) {
+    checkCUDA(cublasGemmEx(m->handle.blas,
+                           CUBLAS_OP_N,
+                           CUBLAS_OP_N,
+                           in_dim,
+                           num_peft_tokens,
+                           out_dim,
+                           &alpha,
+                           kernel_ptr,
+                           weight_type,
+                           in_dim,
+                           output_grad_ptr,
+                           output_type,
+                           out_dim,
+                           &beta,
+                           input_grad_ptr,
+                           input_type,
+                           in_dim,
+                           compute_type,
+                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+  }
+}
+
 template <typename DT>
 void backward_kernel(LinearMeta const *m,
                      void const *input_ptr,
@@ -428,17 +654,7 @@ void backward_kernel(LinearMeta const *m,
   cudaDataType_t input_type = ff_to_cuda_datatype(m->input_type[0]);
   cudaDataType_t weight_type = ff_to_cuda_datatype(m->weight_type[0]);
   cudaDataType_t output_type = ff_to_cuda_datatype(m->output_type[0]);
-#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
-  cudaDataType_t compute_type = cublas_data_type;
-#else
-  // For best performance, set the default cublas compute type to
-  // CUBLAS_COMPUTE_16F for half precision and to
-  // CUBLAS_COMPUTE_32F_FAST_16F for full precision
-  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
-  if (m->output_type[0] == DT_FLOAT) {
-    compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
-  }
-#endif
+  cudaDataType_t compute_type = output_type;
   int output_size = out_dim * batch_size;
   if (m->activation == AC_MODE_RELU) {
     relu_backward_kernel(
@@ -450,7 +666,7 @@ void backward_kernel(LinearMeta const *m,
     // TODO: only support relu and sigmoid for now
     assert(m->activation == AC_MODE_NONE);
   }
-  // Compute weight gradiant
+  // Compute weight gradient
   // NOTE: we use alpha=1 for kernel_grad to accumulate gradients
   checkCUDA(cublasGemmEx(m->handle.blas,
                          CUBLAS_OP_N,
@@ -491,7 +707,7 @@ void backward_kernel(LinearMeta const *m,
     assert(false && "Only L2 regularization is supported");
   }
 
-  // Compute bias gradiant
+  // Compute bias gradient
   // NOTE: we use alpha=1 for bias_grad to accumulate gradients
   // use_bias = True
   if (bias_grad_ptr != NULL) {
@@ -515,7 +731,7 @@ void backward_kernel(LinearMeta const *m,
                            compute_type,
                            CUBLAS_GEMM_DEFAULT_TENSOR_OP));
   }
-  // Compute data gradiant
+  // Compute data gradient
   // NOTE: we use alpha=1 for input_grad to accumulate gradients
   if (input_grad_ptr != NULL) {
     checkCUDA(cublasGemmEx(m->handle.blas,
diff --git a/src/ops/kernels/lora_linear_kernels.cpp b/src/ops/kernels/lora_linear_kernels.cpp
new file mode 100644
index 0000000000..c3c2cce3cf
--- /dev/null
+++ b/src/ops/kernels/lora_linear_kernels.cpp
@@ -0,0 +1,576 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ops/kernels/lora_linear_kernels.h"
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/ops/kernels/decompress_kernels.h"
+#include "flexflow/utils/hip_helper.h"
+#include <hip/hip_runtime.h>
+#include <random>
+#include <vector>
+
+namespace FlexFlow {
+
+LoraLinearMeta::LoraLinearMeta(FFHandler handler, LoraLinear const *li)
+    : OpMeta(handler, li) {
+  allocated_peft_buffer_size1 = 0;
+  allocated_peft_buffer_size2 = 0;
+}
+
+LoraLinearMeta::~LoraLinearMeta(void) {}
+
+namespace Kernels {
+namespace LoraLinear {
+
+void init_kernel_wrapper(LoraLinearMeta *m, int seed) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  if (m->input_type[0] == DT_FLOAT) {
+    Internal::init_kernel<float>(m, seed, stream);
+  } else if (m->input_type[0] == DT_HALF) {
+    Internal::init_kernel<half>(m, seed, stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+}
+
+void inference_kernel_wrapper(LoraLinearMeta *m,
+                              BatchConfig const *bc,
+                              GenericTensorAccessorR const &input,
+                              GenericTensorAccessorW const &output) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  hipEvent_t t_start, t_end;
+  int in_dim = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+  int out_dim = output.domain.hi()[0] - output.domain.lo()[0] + 1;
+
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+  if (m->input_type[0] == DT_FLOAT) {
+    Internal::inference_kernel<float>(m,
+                                      bc,
+                                      input.get_float_ptr(),
+                                      output.get_float_ptr(),
+                                      in_dim,
+                                      out_dim,
+                                      stream);
+  } else if (m->input_type[0] == DT_HALF) {
+    Internal::inference_kernel<half>(m,
+                                     bc,
+                                     input.get_half_ptr(),
+                                     output.get_half_ptr(),
+                                     in_dim,
+                                     out_dim,
+                                     stream);
+  }
+
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("%s [LoraLinear] forward time = %.2lfms\n", m->op_name, elapsed);
+    // print_tensor<float>((float*)input_ptr, in_dim * batch_size,
+    // "[LoraLinear:forward:input]"); print_tensor<float>((float*)weight_ptr,
+    // in_dim
+    // * out_dim, "[LoraLinear:forward:kernel]");
+    // print_tensor<float>((float*)output_ptr, out_dim * batch_size,
+    // "[LoraLinear:forward:output]");
+  }
+}
+
+void peft_bwd_kernel_wrapper(LoraLinearMeta *m,
+                             BatchConfig const *bc,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &output_grad) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+  int in_dim = input_grad.domain.hi()[0] - input_grad.domain.lo()[0] + 1;
+  int out_dim = output_grad.domain.hi()[0] - output_grad.domain.lo()[0] + 1;
+  if (m->input_type[0] == DT_FLOAT) {
+    Internal::peft_bwd_kernel<float>(m,
+                                     bc,
+                                     input_grad.get_float_ptr(),
+                                     output_grad.get_float_ptr(),
+                                     in_dim,
+                                     out_dim,
+                                     stream);
+  } else if (m->input_type[0] == DT_HALF) {
+    Internal::peft_bwd_kernel<half>(m,
+                                    bc,
+                                    input_grad.get_half_ptr(),
+                                    output_grad.get_half_ptr(),
+                                    in_dim,
+                                    out_dim,
+                                    stream);
+  }
+
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("%s [LoraLinear] PEFT Bwd time = %.2lfms\n", m->op_name, elapsed);
+    // print_tensor<float>((float*)input_ptr, in_dim * batch_size,
+    // "[LoraLinear:forward:input]"); print_tensor<float>((float*)weight_ptr,
+    // in_dim
+    // * out_dim, "[LoraLinear:forward:kernel]");
+    // print_tensor<float>((float*)output_ptr, out_dim * batch_size,
+    // "[LoraLinear:forward:output]");
+  }
+}
+
+namespace Internal {
+
+template <typename DT>
+void init_kernel(LoraLinearMeta *m, int seed, hipStream_t stream) {
+  // Initialize generator
+  std::mt19937 gen(seed);
+
+  // Get handle to weights by iterating over m->model_state to get each
+  // LoraLinearWeight object
+  for (auto &model_state : m->model_state) {
+    LoraLinearWeight weight = model_state.second.weights;
+    int w0_num_elements = weight.rank * weight.in_dim;
+    int w1_num_elements = weight.rank * weight.out_dim;
+
+    // LoRA_A weight: [in_dim, rank]
+    float stdv_lora_a = 1.0f / sqrt(weight.in_dim);
+    std::uniform_real_distribution<float> dis_lora_a(-stdv_lora_a, stdv_lora_a);
+    std::vector<DT> lora_a_random_init(w0_num_elements);
+    for (auto &num : lora_a_random_init) {
+      float num_float = dis_lora_a(gen);
+      if (std::is_same<DT, half>::value) {
+        num = __float2half(num_float);
+      } else {
+        num = num_float;
+      }
+    }
+    checkCUDA(hipMemcpyAsync(static_cast<DT *>(weight.w0_ptr),
+                             lora_a_random_init.data(),
+                             w0_num_elements * sizeof(DT),
+                             hipMemcpyHostToDevice,
+                             stream));
+
+    // LoRA_B weight: [rank, out_dim]
+    float stdv_lora_b = 1.0f / sqrt(weight.rank);
+    std::uniform_real_distribution<float> dis_lora_b(-stdv_lora_b, stdv_lora_b);
+    std::vector<float> lora_b_random_init(w1_num_elements);
+    for (auto &num : lora_b_random_init) {
+      float num_float = dis_lora_b(gen);
+      if (std::is_same<DT, half>::value) {
+        num = __float2half(num_float);
+      } else {
+        num = num_float;
+      }
+    }
+    checkCUDA(hipMemcpyAsync(static_cast<DT *>(weight.w1_ptr),
+                             lora_b_random_init.data(),
+                             w1_num_elements * sizeof(DT),
+                             hipMemcpyHostToDevice,
+                             stream));
+  }
+}
+
+template <typename DT>
+void inference_kernel(LoraLinearMeta *m,
+                      BatchConfig const *bc,
+                      DT const *input_ptr,
+                      DT *output_ptr,
+                      int in_dim,
+                      int out_dim,
+                      ffStream_t stream) {
+  checkCUDA(hipblasSetStream(m->handle.blas, stream));
+  checkCUDNN(miopenSetStream(m->handle.dnn, stream));
+  DT alpha = 1.0f, beta = 0.0f;
+  hipblasDatatype_t input_type = ff_to_cuda_datatype(m->input_type[0]);
+  hipblasDatatype_t output_type = ff_to_cuda_datatype(m->input_type[1]);
+  hipblasDatatype_t lr_actv_type = output_type;
+  assert(input_type == output_type);
+  hipblasDatatype_t weight_type = output_type;
+  hipblasDatatype_t compute_type = output_type;
+  // #if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  //   hipDataType compute_type = output_type;
+  // #else
+  //   // For best performance, set the default cublas compute type to
+  //   // CUBLAS_COMPUTE_16F for half precision and to
+  //   // CUBLAS_COMPUTE_32F_FAST_16F for full precision
+  //   cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+  //   if (m->input_type[0] == DT_FLOAT) {
+  //     compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
+  //   }
+  // #endif
+  int num_peft_requests = 0;
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+      continue;
+    }
+    if (bc->requestsInfo[i].peft_bwd) {
+      num_peft_requests++;
+    }
+  }
+  // Assert that we have at most one request that requires peft_bwd
+  assert(num_peft_requests <= 1);
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    // Skip non-PEFT requests
+    if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+      continue;
+    }
+    int num_peft_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+    int max_peft_tokens = bc->requestsInfo[i].max_sequence_length;
+    int first_token_offset = bc->requestsInfo[i].first_token_offset_in_batch;
+    assert(m->model_state.find(bc->requestsInfo[i].peft_model_id) !=
+           m->model_state.end());
+    LoraLinearWeight weight =
+        m->model_state[bc->requestsInfo[i].peft_model_id].weights;
+    int rank = weight.rank;
+    void *intermediate_result_ptr = nullptr;
+    if (bc->requestsInfo[i].peft_bwd) {
+      size_t activation_size_needed1 =
+          data_type_size(m->input_type[0]) * max_peft_tokens * in_dim;
+      size_t activation_size_needed2 =
+          data_type_size(m->input_type[1]) * max_peft_tokens * rank;
+      MemoryAllocator *allocator = m->handle.peft_activation_allocator;
+      if (activation_size_needed1 > m->allocated_peft_buffer_size1) {
+        m->input_activation =
+            allocator->allocate_instance_untyped(activation_size_needed1);
+        m->allocated_peft_buffer_size1 = activation_size_needed1;
+      }
+      if (activation_size_needed2 > m->allocated_peft_buffer_size2) {
+        m->low_rank_activation =
+            allocator->allocate_instance_untyped(activation_size_needed2);
+        m->allocated_peft_buffer_size2 = activation_size_needed2;
+      }
+      // copy input activation
+      checkCUDA(hipMemcpyAsync(m->input_activation,
+                               input_ptr + first_token_offset * in_dim,
+                               data_type_size(m->input_type[0]) *
+                                   num_peft_tokens * in_dim,
+                               hipMemcpyDeviceToDevice,
+                               stream));
+      intermediate_result_ptr = m->low_rank_activation;
+    } else {
+      // use workspace to save intermediate result
+      assert(m->handle.workSpaceSize >=
+             data_type_size(m->input_type[1]) * num_peft_tokens * rank);
+      intermediate_result_ptr = m->handle.workSpace;
+    }
+    // buffer = weight_first * input
+    // [rank, num_peft_tokens] = [in_dim, rank].T * [in_dim, num_peft_tokens]
+    checkCUDA(hipblasGemmEx(m->handle.blas,
+                            HIPBLAS_OP_T,
+                            HIPBLAS_OP_N,
+                            rank,
+                            num_peft_tokens,
+                            in_dim,
+                            &alpha,
+                            weight.w0_ptr,
+                            weight_type,
+                            in_dim,
+                            input_ptr + first_token_offset * in_dim,
+                            input_type,
+                            in_dim,
+                            &beta,
+                            intermediate_result_ptr,
+                            lr_actv_type,
+                            rank,
+                            compute_type,
+                            HIPBLAS_GEMM_DEFAULT));
+    // output = weight_second * buffer
+    // [out_dim, num_peft_tokens] = [rank, out_dim].T * [rank, num_peft_tokens]
+    // Note that we use alpha in both places since we do
+    // an in-place update for LoraLinear
+    float lora_alpha =
+        m->model_state[bc->requestsInfo[i].peft_model_id].lora_alpha;
+    DT scaling_constant = (DT)(lora_alpha / rank);
+    checkCUDA(hipblasGemmEx(m->handle.blas,
+                            HIPBLAS_OP_T,
+                            HIPBLAS_OP_N,
+                            out_dim,
+                            num_peft_tokens,
+                            rank,
+                            &scaling_constant,
+                            weight.w1_ptr,
+                            weight_type,
+                            rank,
+                            intermediate_result_ptr,
+                            lr_actv_type,
+                            rank,
+                            &alpha,
+                            output_ptr + first_token_offset * out_dim,
+                            output_type,
+                            out_dim,
+                            compute_type,
+                            HIPBLAS_GEMM_DEFAULT));
+  }
+}
+
+template <typename DT>
+__global__ void sgd_update(size_t count,
+                           float lr,
+                           float weight_decay,
+                           float momentum,
+                           bool nesterov,
+                           DT const *WGrad,
+                           DT *V,
+                           DT *W) {
+  // Refernce https://pytorch.org/docs/stable/_modules/torch/optim/sgd.html#SGD
+  CUDA_KERNEL_LOOP(i, count) {
+    DT gt = WGrad[i] + (DT)weight_decay * W[i];
+    if (momentum > 0.0f) {
+      V[i] = V[i] * (DT)momentum + gt;
+      if (nesterov) {
+        gt = gt + (DT)momentum * V[i];
+      } else {
+        gt = V[i];
+      }
+    }
+    W[i] -= (DT)lr * gt;
+  }
+}
+
+template <typename DT>
+void peft_bwd_kernel(LoraLinearMeta *m,
+                     BatchConfig const *bc,
+                     DT *input_grad_ptr,
+                     DT const *output_grad_ptr,
+                     int in_dim,
+                     int out_dim,
+                     ffStream_t stream) {
+  checkCUDA(hipblasSetStream(m->handle.blas, stream));
+  checkCUDNN(miopenSetStream(m->handle.dnn, stream));
+  hipblasDatatype_t input_type = ff_to_cuda_datatype(m->input_type[0]);
+  hipblasDatatype_t output_type = ff_to_cuda_datatype(m->output_type[0]);
+  assert(input_type == output_type);
+  hipblasDatatype_t weight_type = output_type;
+  hipblasDatatype_t lr_actv_type = output_type;
+  hipblasDatatype_t compute_type = output_type;
+  // #if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  //   hipDataType compute_type = output_type;
+  // #else
+  //   // For best performance, set the default cublas compute type to
+  //   // CUBLAS_COMPUTE_16F for half precision and to
+  //   // CUBLAS_COMPUTE_32F_FAST_16F for full precision
+  //   cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+  //   if (m->output_type[0] == DT_FLOAT) {
+  //     compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
+  //   }
+  // #endif
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    // Skip non-PEFT requests
+    if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+      continue;
+    }
+    // Skip PEFT forward-only requests
+    if (!bc->requestsInfo[i].peft_bwd) {
+      continue;
+    }
+    int num_peft_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+    // int first_token_offset = bc->requestsInfo[i].first_token_offset_in_batch;
+    assert(m->model_state.find(bc->requestsInfo[i].peft_model_id) !=
+           m->model_state.end());
+    LoraLinearWeight weight =
+        m->model_state[bc->requestsInfo[i].peft_model_id].weights;
+    int rank = weight.rank;
+    float lora_alpha =
+        m->model_state[bc->requestsInfo[i].peft_model_id].lora_alpha;
+    DT scaling_constant = (DT)(lora_alpha / rank);
+
+    // Compute LORA_B weight's gradient
+    if (bc->requestsInfo[i].optimizer_tasks.compute_gradients) {
+      DT alpha = 1.0f;
+      DT beta = (bc->requestsInfo[i].optimizer_tasks.reset_gradients_to_zero)
+                    ? 0.0f
+                    : 1.0f;
+      checkCUDA(hipblasGemmEx(m->handle.blas,
+                              HIPBLAS_OP_N,
+                              HIPBLAS_OP_T,
+                              rank,
+                              out_dim,
+                              num_peft_tokens,
+                              &scaling_constant,
+                              m->low_rank_activation,
+                              lr_actv_type,
+                              rank,
+                              output_grad_ptr,
+                              output_type,
+                              out_dim,
+                              &beta,
+                              weight.w1_grad_ptr,
+                              weight_type,
+                              rank,
+                              compute_type,
+                              HIPBLAS_GEMM_DEFAULT));
+    }
+
+    // Compute LORA_B input's (and LORA_A output's) gradient inplace in
+    // low_rank_activation
+    {
+      DT alpha = 1.0f, beta = 0.0f;
+      checkCUDA(hipblasGemmEx(m->handle.blas,
+                              HIPBLAS_OP_N,
+                              HIPBLAS_OP_N,
+                              rank,
+                              num_peft_tokens,
+                              out_dim,
+                              &scaling_constant,
+                              weight.w1_ptr,
+                              weight_type,
+                              rank,
+                              output_grad_ptr,
+                              output_type,
+                              out_dim,
+                              &beta,
+                              m->low_rank_activation,
+                              lr_actv_type,
+                              rank,
+                              compute_type,
+                              HIPBLAS_GEMM_DEFAULT));
+    }
+
+    // Compute LORA_A weight's gradient
+    if (bc->requestsInfo[i].optimizer_tasks.compute_gradients) {
+      DT alpha = 1.0f;
+      DT beta = (bc->requestsInfo[i].optimizer_tasks.reset_gradients_to_zero)
+                    ? 0.0f
+                    : 1.0f;
+      checkCUDA(hipblasGemmEx(m->handle.blas,
+                              HIPBLAS_OP_N,
+                              HIPBLAS_OP_T,
+                              in_dim,
+                              rank,
+                              num_peft_tokens,
+                              &alpha,
+                              m->input_activation,
+                              input_type,
+                              in_dim,
+                              m->low_rank_activation,
+                              lr_actv_type,
+                              rank,
+                              &beta,
+                              weight.w0_grad_ptr,
+                              weight_type,
+                              in_dim,
+                              compute_type,
+                              HIPBLAS_GEMM_DEFAULT));
+    }
+    // Compute input gradient
+    // NOTE: we use beta=1 for input_grad to accumulate gradients when needed
+    if (input_grad_ptr != nullptr) {
+      DT alpha = 1.0f;
+      DT beta = m->reset_input_grads[0] ? 0.0f : 1.0f;
+      checkCUDA(hipblasGemmEx(m->handle.blas,
+                              HIPBLAS_OP_N,
+                              HIPBLAS_OP_N,
+                              in_dim,
+                              num_peft_tokens,
+                              rank,
+                              &alpha,
+                              weight.w0_ptr,
+                              weight_type,
+                              in_dim,
+                              m->low_rank_activation,
+                              lr_actv_type,
+                              rank,
+                              &beta,
+                              input_grad_ptr,
+                              input_type,
+                              in_dim,
+                              compute_type,
+                              HIPBLAS_GEMM_DEFAULT));
+    }
+
+    if (bc->requestsInfo[i].optimizer_tasks.update_weights) {
+      LoraOptimizerConfig const *optimizer_config =
+          m->model_state[bc->requestsInfo[i].peft_model_id].optimizer_config;
+      assert(optimizer_config != nullptr);
+      assert(typeid(*optimizer_config) != typeid(LoraOptimizerConfig));
+      int w0_num_elements = rank * in_dim;
+      int w1_num_elements = rank * out_dim;
+
+      // Get optimizer config
+      if (typeid(*optimizer_config) == typeid(LoraSGDOptimizerConfig)) {
+        LoraSGDOptimizerConfig const *sgd_config =
+            (LoraSGDOptimizerConfig const *)optimizer_config;
+        // LoRA_A weight is split in tensor parallelism, so no need to apply
+        // all-reduce
+        sgd_update<<<GET_BLOCKS(w0_num_elements),
+                     CUDA_NUM_THREADS,
+                     0,
+                     stream>>>(w0_num_elements,
+                               sgd_config->lr,
+                               sgd_config->weight_decay,
+                               sgd_config->momentum,
+                               sgd_config->nesterov,
+                               static_cast<DT const *>(weight.w0_grad_ptr),
+                               static_cast<DT *>(weight.w0_v_values_ptr),
+                               static_cast<DT *>(weight.w0_ptr));
+        // LoRA_B weight is replicated w tensor parallelism, so we need to sync
+        // and sum first
+        ncclDataType_t nccl_data_type = ff_to_nccl_datatype(m->output_type[0]);
+        checkCUDA(ncclAllReduce(static_cast<DT const *>(weight.w1_grad_ptr),
+                                static_cast<DT *>(weight.w1_grad_ptr),
+                                w1_num_elements,
+                                nccl_data_type,
+                                ncclSum,
+                                m->handle.ncclComm,
+                                stream));
+        sgd_update<<<GET_BLOCKS(w1_num_elements),
+                     CUDA_NUM_THREADS,
+                     0,
+                     stream>>>(w1_num_elements,
+                               sgd_config->lr,
+                               sgd_config->weight_decay,
+                               sgd_config->momentum,
+                               sgd_config->nesterov,
+                               static_cast<DT const *>(weight.w1_grad_ptr),
+                               static_cast<DT *>(weight.w1_v_values_ptr),
+                               static_cast<DT *>(weight.w1_ptr));
+      } else if (typeid(*optimizer_config) == typeid(LoraAdamOptimizerConfig)) {
+        assert(false && "Adam optimizer type not implemented yet");
+      } else {
+        assert(false && "Unsupported optimizer type");
+      }
+    }
+  }
+}
+
+} // namespace Internal
+} // namespace LoraLinear
+} // namespace Kernels
+} // namespace FlexFlow
diff --git a/src/ops/kernels/lora_linear_kernels.cu b/src/ops/kernels/lora_linear_kernels.cu
new file mode 100644
index 0000000000..5f130782aa
--- /dev/null
+++ b/src/ops/kernels/lora_linear_kernels.cu
@@ -0,0 +1,579 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/ops/kernels/decompress_kernels.h"
+#include "flexflow/ops/kernels/lora_linear_kernels.h"
+#include "flexflow/utils/cuda_helper.h"
+#include <random>
+#include <vector>
+
+namespace FlexFlow {
+
+LoraLinearMeta::LoraLinearMeta(FFHandler handler, LoraLinear const *li)
+    : OpMeta(handler, li) {
+  allocated_peft_buffer_size1 = 0;
+  allocated_peft_buffer_size2 = 0;
+}
+
+LoraLinearMeta::~LoraLinearMeta(void) {}
+
+namespace Kernels {
+namespace LoraLinear {
+
+void init_kernel_wrapper(LoraLinearMeta *m, int seed) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  if (m->input_type[0] == DT_FLOAT) {
+    Internal::init_kernel<float>(m, seed, stream);
+  } else if (m->input_type[0] == DT_HALF) {
+    Internal::init_kernel<half>(m, seed, stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+}
+
+void inference_kernel_wrapper(LoraLinearMeta *m,
+                              BatchConfig const *bc,
+                              GenericTensorAccessorR const &input,
+                              GenericTensorAccessorW const &output) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  cudaEvent_t t_start, t_end;
+  int in_dim = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+  int out_dim = output.domain.hi()[0] - output.domain.lo()[0] + 1;
+
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+  if (m->input_type[0] == DT_FLOAT) {
+    Internal::inference_kernel<float>(m,
+                                      bc,
+                                      input.get_float_ptr(),
+                                      output.get_float_ptr(),
+                                      in_dim,
+                                      out_dim,
+                                      stream);
+  } else if (m->input_type[0] == DT_HALF) {
+    Internal::inference_kernel<half>(m,
+                                     bc,
+                                     input.get_half_ptr(),
+                                     output.get_half_ptr(),
+                                     in_dim,
+                                     out_dim,
+                                     stream);
+  }
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("%s [LoraLinear] forward time = %.2lfms\n", m->op_name, elapsed);
+    // print_tensor<float>((float*)input_ptr, in_dim * batch_size,
+    // "[LoraLinear:forward:input]"); print_tensor<float>((float*)weight_ptr,
+    // in_dim
+    // * out_dim, "[LoraLinear:forward:kernel]");
+    // print_tensor<float>((float*)output_ptr, out_dim * batch_size,
+    // "[LoraLinear:forward:output]");
+  }
+}
+
+void peft_bwd_kernel_wrapper(LoraLinearMeta *m,
+                             BatchConfig const *bc,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &output_grad) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+  int in_dim = input_grad.domain.hi()[0] - input_grad.domain.lo()[0] + 1;
+  int out_dim = output_grad.domain.hi()[0] - output_grad.domain.lo()[0] + 1;
+  if (m->input_type[0] == DT_FLOAT) {
+    Internal::peft_bwd_kernel<float>(m,
+                                     bc,
+                                     input_grad.get_float_ptr(),
+                                     output_grad.get_float_ptr(),
+                                     in_dim,
+                                     out_dim,
+                                     stream);
+  } else if (m->input_type[0] == DT_HALF) {
+    Internal::peft_bwd_kernel<half>(m,
+                                    bc,
+                                    input_grad.get_half_ptr(),
+                                    output_grad.get_half_ptr(),
+                                    in_dim,
+                                    out_dim,
+                                    stream);
+  }
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("%s [LoraLinear] PEFT Bwd time = %.2lfms\n", m->op_name, elapsed);
+    // print_tensor<float>((float*)input_ptr, in_dim * batch_size,
+    // "[LoraLinear:forward:input]"); print_tensor<float>((float*)weight_ptr,
+    // in_dim
+    // * out_dim, "[LoraLinear:forward:kernel]");
+    // print_tensor<float>((float*)output_ptr, out_dim * batch_size,
+    // "[LoraLinear:forward:output]");
+  }
+}
+
+namespace Internal {
+
+template <typename DT>
+void init_kernel(LoraLinearMeta *m, int seed, cudaStream_t stream) {
+  // Initialize generator
+  std::mt19937 gen(seed);
+
+  // Get handle to weights by iterating over m->model_state to get each
+  // LoraLinearWeight object
+  for (auto &model_state : m->model_state) {
+    LoraLinearWeight weight = model_state.second.weights;
+    int w0_num_elements = weight.rank * weight.in_dim;
+    int w1_num_elements = weight.rank * weight.out_dim;
+
+    // LoRA_A weight: [in_dim, rank]
+    float stdv_lora_a = 1.0f / sqrt(weight.in_dim);
+    std::uniform_real_distribution<float> dis_lora_a(-stdv_lora_a, stdv_lora_a);
+    std::vector<DT> lora_a_random_init(w0_num_elements);
+    for (auto &num : lora_a_random_init) {
+      float num_float = dis_lora_a(gen);
+      if (std::is_same<DT, half>::value) {
+        num = __float2half(num_float);
+      } else {
+        num = num_float;
+      }
+    }
+    checkCUDA(cudaMemcpyAsync(static_cast<DT *>(weight.w0_ptr),
+                              lora_a_random_init.data(),
+                              w0_num_elements * sizeof(DT),
+                              cudaMemcpyHostToDevice,
+                              stream));
+
+    // LoRA_B weight: [rank, out_dim]
+    float stdv_lora_b = 1.0f / sqrt(weight.rank);
+    std::uniform_real_distribution<float> dis_lora_b(-stdv_lora_b, stdv_lora_b);
+    std::vector<float> lora_b_random_init(w1_num_elements);
+    for (auto &num : lora_b_random_init) {
+      float num_float = dis_lora_b(gen);
+      if (std::is_same<DT, half>::value) {
+        num = __float2half(num_float);
+      } else {
+        num = num_float;
+      }
+    }
+    checkCUDA(cudaMemcpyAsync(static_cast<DT *>(weight.w1_ptr),
+                              lora_b_random_init.data(),
+                              w1_num_elements * sizeof(DT),
+                              cudaMemcpyHostToDevice,
+                              stream));
+  }
+}
+
+template <typename DT>
+void inference_kernel(LoraLinearMeta *m,
+                      BatchConfig const *bc,
+                      DT const *input_ptr,
+                      DT *output_ptr,
+                      int in_dim,
+                      int out_dim,
+                      ffStream_t stream) {
+  checkCUDA(cublasSetStream(m->handle.blas, stream));
+  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
+  DT alpha = 1.0f, beta = 0.0f;
+  cudaDataType_t input_type = ff_to_cuda_datatype(m->input_type[0]);
+  cudaDataType_t output_type = ff_to_cuda_datatype(m->input_type[1]);
+  cudaDataType_t lr_actv_type = output_type;
+  assert(input_type == output_type);
+  cudaDataType_t weight_type = output_type;
+  cudaDataType_t compute_type = output_type;
+  // #if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  //   cudaDataType_t compute_type = output_type;
+  // #else
+  //   // For best performance, set the default cublas compute type to
+  //   // CUBLAS_COMPUTE_16F for half precision and to
+  //   // CUBLAS_COMPUTE_32F_FAST_16F for full precision
+  //   cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+  //   if (m->input_type[0] == DT_FLOAT) {
+  //     compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
+  //   }
+  // #endif
+  int num_peft_requests = 0;
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+      continue;
+    }
+    if (bc->requestsInfo[i].peft_bwd) {
+      num_peft_requests++;
+    }
+  }
+  // Assert that we have at most one request that requires peft_bwd
+  assert(num_peft_requests <= 1);
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    // Skip non-PEFT requests
+    if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+      continue;
+    }
+    int num_peft_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+    int max_peft_tokens = bc->requestsInfo[i].max_sequence_length;
+    int first_token_offset = bc->requestsInfo[i].first_token_offset_in_batch;
+    assert(m->model_state.find(bc->requestsInfo[i].peft_model_id) !=
+           m->model_state.end());
+    LoraLinearWeight weight =
+        m->model_state[bc->requestsInfo[i].peft_model_id].weights;
+    int rank = weight.rank;
+    void *intermediate_result_ptr = nullptr;
+    if (bc->requestsInfo[i].peft_bwd) {
+      size_t activation_size_needed1 =
+          data_type_size(m->input_type[0]) * max_peft_tokens * in_dim;
+      size_t activation_size_needed2 =
+          data_type_size(m->input_type[1]) * max_peft_tokens * rank;
+      MemoryAllocator *allocator = m->handle.peft_activation_allocator;
+      if (activation_size_needed1 > m->allocated_peft_buffer_size1) {
+        m->input_activation =
+            allocator->allocate_instance_untyped(activation_size_needed1);
+        m->allocated_peft_buffer_size1 = activation_size_needed1;
+      }
+      if (activation_size_needed2 > m->allocated_peft_buffer_size2) {
+        m->low_rank_activation =
+            allocator->allocate_instance_untyped(activation_size_needed2);
+        m->allocated_peft_buffer_size2 = activation_size_needed2;
+      }
+      // copy input activation
+      checkCUDA(cudaMemcpyAsync(m->input_activation,
+                                input_ptr + first_token_offset * in_dim,
+                                data_type_size(m->input_type[0]) *
+                                    num_peft_tokens * in_dim,
+                                cudaMemcpyDeviceToDevice,
+                                stream));
+      intermediate_result_ptr = m->low_rank_activation;
+    } else {
+      // use workspace to save intermediate result
+      assert(m->handle.workSpaceSize >=
+             data_type_size(m->input_type[1]) * num_peft_tokens * rank);
+      intermediate_result_ptr = m->handle.workSpace;
+    }
+    // buffer = weight_first * input
+    // [rank, num_peft_tokens] = [in_dim, rank].T * [in_dim, num_peft_tokens]
+    checkCUDA(cublasGemmEx(m->handle.blas,
+                           CUBLAS_OP_T,
+                           CUBLAS_OP_N,
+                           rank,
+                           num_peft_tokens,
+                           in_dim,
+                           &alpha,
+                           weight.w0_ptr,
+                           weight_type,
+                           in_dim,
+                           input_ptr + first_token_offset * in_dim,
+                           input_type,
+                           in_dim,
+                           &beta,
+                           intermediate_result_ptr,
+                           lr_actv_type,
+                           rank,
+                           compute_type,
+                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+    // output = weight_second * buffer
+    // [out_dim, num_peft_tokens] = [rank, out_dim].T * [rank, num_peft_tokens]
+    // Note that we use alpha in both places since we do
+    // an in-place update for LoraLinear
+    float lora_alpha =
+        m->model_state[bc->requestsInfo[i].peft_model_id].lora_alpha;
+    DT scaling_constant = (DT)(lora_alpha / rank);
+    checkCUDA(cublasGemmEx(m->handle.blas,
+                           CUBLAS_OP_T,
+                           CUBLAS_OP_N,
+                           out_dim,
+                           num_peft_tokens,
+                           rank,
+                           &scaling_constant,
+                           weight.w1_ptr,
+                           weight_type,
+                           rank,
+                           intermediate_result_ptr,
+                           lr_actv_type,
+                           rank,
+                           &alpha,
+                           output_ptr + first_token_offset * out_dim,
+                           output_type,
+                           out_dim,
+                           compute_type,
+                           CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+  }
+}
+
+template <typename DT>
+__global__ void sgd_update(size_t count,
+                           float lr,
+                           float weight_decay,
+                           float momentum,
+                           bool nesterov,
+                           DT const *WGrad,
+                           DT *V,
+                           DT *W) {
+  // Refernce https://pytorch.org/docs/stable/_modules/torch/optim/sgd.html#SGD
+  CUDA_KERNEL_LOOP(i, count) {
+    DT gt = WGrad[i] + (DT)weight_decay * W[i];
+    if (momentum > 0.0f) {
+      V[i] = V[i] * (DT)momentum + gt;
+      if (nesterov) {
+        gt = gt + (DT)momentum * V[i];
+      } else {
+        gt = V[i];
+      }
+    }
+    W[i] -= (DT)lr * gt;
+  }
+}
+
+template <typename DT>
+void peft_bwd_kernel(LoraLinearMeta *m,
+                     BatchConfig const *bc,
+                     DT *input_grad_ptr,
+                     DT const *output_grad_ptr,
+                     int in_dim,
+                     int out_dim,
+                     ffStream_t stream) {
+  checkCUDA(cublasSetStream(m->handle.blas, stream));
+  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
+  cudaDataType_t input_type = ff_to_cuda_datatype(m->input_type[0]);
+  cudaDataType_t output_type = ff_to_cuda_datatype(m->output_type[0]);
+  assert(input_type == output_type);
+  cudaDataType_t weight_type = output_type;
+  cudaDataType_t lr_actv_type = output_type;
+  cudaDataType_t compute_type = output_type;
+  // #if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  //   cudaDataType_t compute_type = output_type;
+  // #else
+  //   // For best performance, set the default cublas compute type to
+  //   // CUBLAS_COMPUTE_16F for half precision and to
+  //   // CUBLAS_COMPUTE_32F_FAST_16F for full precision
+  //   cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+  //   if (m->output_type[0] == DT_FLOAT) {
+  //     compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
+  //   }
+  // #endif
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    // Skip non-PEFT requests
+    if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+      continue;
+    }
+    // Skip PEFT forward-only requests
+    if (!bc->requestsInfo[i].peft_bwd) {
+      continue;
+    }
+    int num_peft_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+    // int first_token_offset = bc->requestsInfo[i].first_token_offset_in_batch;
+    assert(m->model_state.find(bc->requestsInfo[i].peft_model_id) !=
+           m->model_state.end());
+    LoraLinearWeight weight =
+        m->model_state[bc->requestsInfo[i].peft_model_id].weights;
+    int rank = weight.rank;
+    float lora_alpha =
+        m->model_state[bc->requestsInfo[i].peft_model_id].lora_alpha;
+    DT scaling_constant = (DT)(lora_alpha / rank);
+
+    // Compute LORA_B weight's gradient
+    if (bc->requestsInfo[i].optimizer_tasks.compute_gradients) {
+      DT alpha = 1.0f;
+      DT beta = (bc->requestsInfo[i].optimizer_tasks.reset_gradients_to_zero)
+                    ? 0.0f
+                    : 1.0f;
+      checkCUDA(cublasGemmEx(m->handle.blas,
+                             CUBLAS_OP_N,
+                             CUBLAS_OP_T,
+                             rank,
+                             out_dim,
+                             num_peft_tokens,
+                             &scaling_constant,
+                             m->low_rank_activation,
+                             lr_actv_type,
+                             rank,
+                             output_grad_ptr,
+                             output_type,
+                             out_dim,
+                             &beta,
+                             weight.w1_grad_ptr,
+                             weight_type,
+                             rank,
+                             compute_type,
+                             CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+    }
+
+    // Compute LORA_B input's (and LORA_A output's) gradient inplace in
+    // low_rank_activation
+    {
+      DT alpha = 1.0f, beta = 0.0f;
+      checkCUDA(cublasGemmEx(m->handle.blas,
+                             CUBLAS_OP_N,
+                             CUBLAS_OP_N,
+                             rank,
+                             num_peft_tokens,
+                             out_dim,
+                             &scaling_constant,
+                             weight.w1_ptr,
+                             weight_type,
+                             rank,
+                             output_grad_ptr,
+                             output_type,
+                             out_dim,
+                             &beta,
+                             m->low_rank_activation,
+                             lr_actv_type,
+                             rank,
+                             compute_type,
+                             CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+    }
+
+    // Compute LORA_A weight's gradient
+    if (bc->requestsInfo[i].optimizer_tasks.compute_gradients) {
+      DT alpha = 1.0f;
+      DT beta = (bc->requestsInfo[i].optimizer_tasks.reset_gradients_to_zero)
+                    ? 0.0f
+                    : 1.0f;
+      checkCUDA(cublasGemmEx(m->handle.blas,
+                             CUBLAS_OP_N,
+                             CUBLAS_OP_T,
+                             in_dim,
+                             rank,
+                             num_peft_tokens,
+                             &alpha,
+                             m->input_activation,
+                             input_type,
+                             in_dim,
+                             m->low_rank_activation,
+                             lr_actv_type,
+                             rank,
+                             &beta,
+                             weight.w0_grad_ptr,
+                             weight_type,
+                             in_dim,
+                             compute_type,
+                             CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+    }
+    // Compute input gradient
+    // NOTE: we use beta=1 for input_grad to accumulate gradients when needed
+    if (input_grad_ptr != nullptr) {
+      DT alpha = 1.0f;
+      DT beta = m->reset_input_grads[0] ? 0.0f : 1.0f;
+      checkCUDA(cublasGemmEx(m->handle.blas,
+                             CUBLAS_OP_N,
+                             CUBLAS_OP_N,
+                             in_dim,
+                             num_peft_tokens,
+                             rank,
+                             &alpha,
+                             weight.w0_ptr,
+                             weight_type,
+                             in_dim,
+                             m->low_rank_activation,
+                             lr_actv_type,
+                             rank,
+                             &beta,
+                             input_grad_ptr,
+                             input_type,
+                             in_dim,
+                             compute_type,
+                             CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+    }
+
+    if (bc->requestsInfo[i].optimizer_tasks.update_weights) {
+      LoraOptimizerConfig const *optimizer_config =
+          m->model_state[bc->requestsInfo[i].peft_model_id].optimizer_config;
+      assert(optimizer_config != nullptr);
+      assert(typeid(*optimizer_config) != typeid(LoraOptimizerConfig));
+      int w0_num_elements = rank * in_dim;
+      int w1_num_elements = rank * out_dim;
+
+      // Get optimizer config
+      if (typeid(*optimizer_config) == typeid(LoraSGDOptimizerConfig)) {
+        LoraSGDOptimizerConfig const *sgd_config =
+            (LoraSGDOptimizerConfig const *)optimizer_config;
+        // LoRA_A weight is split in tensor parallelism, so no need to apply
+        // all-reduce
+        sgd_update<<<GET_BLOCKS(w0_num_elements),
+                     CUDA_NUM_THREADS,
+                     0,
+                     stream>>>(w0_num_elements,
+                               sgd_config->lr,
+                               sgd_config->weight_decay,
+                               sgd_config->momentum,
+                               sgd_config->nesterov,
+                               static_cast<DT const *>(weight.w0_grad_ptr),
+                               static_cast<DT *>(weight.w0_v_values_ptr),
+                               static_cast<DT *>(weight.w0_ptr));
+        // LoRA_B weight is replicated w tensor parallelism, so we need to sync
+        // and sum first
+#ifdef FF_USE_NCCL
+        ncclDataType_t nccl_data_type = ff_to_nccl_datatype(m->output_type[0]);
+        checkCUDA(ncclAllReduce(static_cast<DT const *>(weight.w1_grad_ptr),
+                                static_cast<DT *>(weight.w1_grad_ptr),
+                                w1_num_elements,
+                                nccl_data_type,
+                                ncclSum,
+                                m->handle.ncclComm,
+                                stream));
+#else
+        assert(false && "Must enable FF_USE_NCCL to use AllReduce operators");
+#endif
+        sgd_update<<<GET_BLOCKS(w1_num_elements),
+                     CUDA_NUM_THREADS,
+                     0,
+                     stream>>>(w1_num_elements,
+                               sgd_config->lr,
+                               sgd_config->weight_decay,
+                               sgd_config->momentum,
+                               sgd_config->nesterov,
+                               static_cast<DT const *>(weight.w1_grad_ptr),
+                               static_cast<DT *>(weight.w1_v_values_ptr),
+                               static_cast<DT *>(weight.w1_ptr));
+      } else if (typeid(*optimizer_config) == typeid(LoraAdamOptimizerConfig)) {
+        assert(false && "Adam optimizer type not implemented yet");
+      } else {
+        assert(false && "Unsupported optimizer type");
+      }
+    }
+  }
+}
+
+} // namespace Internal
+} // namespace LoraLinear
+} // namespace Kernels
+} // namespace FlexFlow
diff --git a/src/ops/kernels/pool_2d_kernels.cpp b/src/ops/kernels/pool_2d_kernels.cpp
index 8af85612ca..b3f20a35dd 100644
--- a/src/ops/kernels/pool_2d_kernels.cpp
+++ b/src/ops/kernels/pool_2d_kernels.cpp
@@ -14,11 +14,13 @@
  */
 
 #include "flexflow/ops/kernels/pool_2d_kernels.h"
+#include "flexflow/ops/pool_2d.h"
 #include "flexflow/utils/hip_helper.h"
 
 namespace FlexFlow {
 
-Pool2DMeta::Pool2DMeta(FFHandler handler) : OpMeta(handler) {
+Pool2DMeta::Pool2DMeta(FFHandler handler, Pool2D const *pool)
+    : OpMeta(handler, pool) {
   checkCUDNN(miopenCreateTensorDescriptor(&inputTensor));
   checkCUDNN(miopenCreateTensorDescriptor(&outputTensor));
   checkCUDNN(miopenCreatePoolingDescriptor(&poolDesc));
diff --git a/src/ops/kernels/pool_2d_kernels.cu b/src/ops/kernels/pool_2d_kernels.cu
index b418d20cd3..c236f049ba 100644
--- a/src/ops/kernels/pool_2d_kernels.cu
+++ b/src/ops/kernels/pool_2d_kernels.cu
@@ -14,11 +14,13 @@
  */
 
 #include "flexflow/ops/kernels/pool_2d_kernels.h"
+#include "flexflow/ops/pool_2d.h"
 #include "flexflow/utils/cuda_helper.h"
 
 namespace FlexFlow {
 
-Pool2DMeta::Pool2DMeta(FFHandler handler) : OpMeta(handler) {
+Pool2DMeta::Pool2DMeta(FFHandler handler, Pool2D const *pool)
+    : OpMeta(handler, pool) {
   checkCUDNN(cudnnCreateTensorDescriptor(&inputTensor));
   checkCUDNN(cudnnCreateTensorDescriptor(&outputTensor));
   checkCUDNN(cudnnCreatePoolingDescriptor(&poolDesc));
diff --git a/src/ops/kernels/reshape_kernels.cpp b/src/ops/kernels/reshape_kernels.cpp
index b17d95bfea..47f407fd82 100644
--- a/src/ops/kernels/reshape_kernels.cpp
+++ b/src/ops/kernels/reshape_kernels.cpp
@@ -14,12 +14,14 @@
  */
 
 #include "flexflow/ops/kernels/reshape_kernels.h"
+#include "flexflow/ops/reshape.h"
 #include "flexflow/utils/hip_helper.h"
 #include <hip/hip_runtime.h>
 
 namespace FlexFlow {
 
-ReshapeMeta::ReshapeMeta(FFHandler handler) : OpMeta(handler) {}
+ReshapeMeta::ReshapeMeta(FFHandler handler, Reshape const *reshape)
+    : OpMeta(handler, reshape) {}
 
 namespace Kernels {
 namespace Reshape {
diff --git a/src/ops/kernels/reshape_kernels.cu b/src/ops/kernels/reshape_kernels.cu
index 9786f63815..0a2b01ae52 100644
--- a/src/ops/kernels/reshape_kernels.cu
+++ b/src/ops/kernels/reshape_kernels.cu
@@ -14,11 +14,13 @@
  */
 
 #include "flexflow/ops/kernels/reshape_kernels.h"
+#include "flexflow/ops/reshape.h"
 #include "flexflow/utils/cuda_helper.h"
 
 namespace FlexFlow {
 
-ReshapeMeta::ReshapeMeta(FFHandler handler) : OpMeta(handler) {}
+ReshapeMeta::ReshapeMeta(FFHandler handler, Reshape const *reshape)
+    : OpMeta(handler, reshape) {}
 
 namespace Kernels {
 namespace Reshape {
diff --git a/src/ops/kernels/residual_rms_norm_kernels.cpp b/src/ops/kernels/residual_rms_norm_kernels.cpp
index 6906556452..016364edfd 100644
--- a/src/ops/kernels/residual_rms_norm_kernels.cpp
+++ b/src/ops/kernels/residual_rms_norm_kernels.cpp
@@ -22,18 +22,16 @@
 namespace FlexFlow {
 // declare Legion names
 using Legion::coord_t;
+
 #define C10_WARP_SIZE 32
-constexpr int kCUDABlockReduceNumThreads = 512;
-constexpr int kCUDANumThreads = 256;
 
 ResidualRMSNormMeta::ResidualRMSNormMeta(FFHandler handler,
                                          ResidualRMSNorm const *rms,
                                          MemoryAllocator &gpu_mem_allocator)
     : OpMeta(handler, rms) {
   eps = rms->eps;
-  alpha = 1.0f;
-  beta = 0.0f;
 
+  inplace_residual = rms->inplace_residual;
   in_dim = rms->data_dim;
   batch_size = rms->effective_batch_size;
   num_elements = in_dim * batch_size;
@@ -47,12 +45,14 @@ ResidualRMSNormMeta::ResidualRMSNormMeta(FFHandler handler,
       rms_ptr_size * data_type_size(data_type));
   norm_ptr = gpu_mem_allocator.allocate_instance_untyped(
       norm_ptr_size * data_type_size(data_type));
+  allocated_peft_buffer_size = 0;
 }
 ResidualRMSNormMeta::~ResidualRMSNormMeta(void) {
   if (reserveInst != Realm::RegionInstance::NO_INST) {
     reserveInst.destroy();
   }
 }
+
 namespace Kernels {
 namespace ResidualRMSNorm {
 
@@ -78,7 +78,7 @@ __inline__ __device__ T WarpReduceSum(T val) {
 }
 
 template <typename T>
-__inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
+__inline__ __device__ T BlockReduceSum(T val, T *shared) {
   int const lid = threadIdx.x % C10_WARP_SIZE;
   int const wid = threadIdx.x / C10_WARP_SIZE;
   val = WarpReduceSum(val);
@@ -87,9 +87,7 @@ __inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
     shared[wid] = val;
   }
   __syncthreads();
-  val = (threadIdx.x < (min(blockDim.x, max_num_threads) / C10_WARP_SIZE))
-            ? shared[lid]
-            : T(0);
+  val = (threadIdx.x < (blockDim.x / C10_WARP_SIZE)) ? shared[lid] : T(0);
   if (wid == 0) {
     val = WarpReduceSum(val);
   }
@@ -109,18 +107,13 @@ __global__ void ResidualRMSNormFusedForwardKernel(int64_t N,
   __shared__ float v_shared[C10_WARP_SIZE];
   int64_t const i = blockIdx.x;
   float sum = 0.0f;
-  for (int64_t j = threadIdx.x; j < N;
-       j += min(blockDim.x, kCUDABlockReduceNumThreads)) {
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
     int64_t const index = i * N + j;
     X_out[index] = X1[index] + X2[index];
     sum +=
         (static_cast<float>(X_out[index]) * static_cast<float>(X_out[index]));
   }
-  sum = BlockReduceSum<float>(
-      sum,
-      v_shared,
-      min(blockDim.x,
-          kCUDABlockReduceNumThreads)); // use BlockReduceSum() to sum X_ij^2
+  sum = BlockReduceSum<float>(sum, v_shared);
 
   if (threadIdx.x == 0) {
     rms[i] = static_cast<T>(rsqrt((sum / static_cast<float>(N)) + eps));
@@ -128,11 +121,12 @@ __global__ void ResidualRMSNormFusedForwardKernel(int64_t N,
 
   __syncthreads();
 
-  using T_ACC = T;
-  for (int64_t j = threadIdx.x; j < N; j += min(blockDim.x, kCUDANumThreads)) {
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
     const int64_t index = i * N + j;
-    Y[index] = static_cast<T_ACC>(X_out[index]) * static_cast<T_ACC>(rms[i]);
-    output[index] = Y[index] * weights[index % N];
+    Y[index] = static_cast<T>(static_cast<float>(X_out[index]) *
+                              static_cast<float>(rms[i]));
+    output[index] = static_cast<T>(static_cast<float>(Y[index]) *
+                                   static_cast<float>(weights[index % N]));
   }
 }
 
@@ -144,19 +138,10 @@ void forward_kernel(ResidualRMSNormMeta const *m,
                     T *residual_output_ptr,
                     T *output_ptr,
                     hipStream_t stream) {
-  std::pair<int, int> kernel1_parallelism =
-      std::make_pair(m->batch_size, kCUDABlockReduceNumThreads);
-  std::pair<int, int> kernel2_parallelism =
-      std::make_pair(m->batch_size, kCUDANumThreads);
-
-  int num_blocks =
-      std::max(kernel1_parallelism.first, kernel2_parallelism.first);
-  int num_threads =
-      std::max(kernel1_parallelism.second, kernel2_parallelism.second);
 
   hipLaunchKernelGGL(HIP_KERNEL_NAME(ResidualRMSNormFusedForwardKernel<T>),
-                     num_blocks,
-                     num_threads,
+                     m->batch_size,
+                     std::min(CUDA_NUM_THREADS, m->in_dim),
                      0,
                      stream,
                      m->in_dim,
@@ -178,7 +163,57 @@ void forward_kernel_wrapper(ResidualRMSNormMeta const *m,
                             GenericTensorAccessorW const &output) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+
+  assert(input1.data_type == input2.data_type);
+  assert(output.data_type == input1.data_type);
+  assert(weight.data_type == output.data_type);
+  assert(residual_output.data_type == output.data_type);
+  if (output.data_type == DT_HALF) {
+    forward_kernel(m,
+                   input1.get_half_ptr(),
+                   input2.get_half_ptr(),
+                   weight.get_half_ptr(),
+                   residual_output.get_half_ptr(),
+                   output.get_half_ptr(),
+                   stream);
+  } else if (output.data_type == DT_FLOAT) {
+    forward_kernel(m,
+                   input1.get_float_ptr(),
+                   input2.get_float_ptr(),
+                   weight.get_float_ptr(),
+                   residual_output.get_float_ptr(),
+                   output.get_float_ptr(),
+                   stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("[ResidualRMSNorm] forward time (CF) = %.2fms\n", elapsed);
+  }
+}
 
+void inference_kernel_wrapper(ResidualRMSNormMeta *m,
+                              BatchConfig const *bc,
+                              GenericTensorAccessorR const &input1,
+                              GenericTensorAccessorR const &input2,
+                              GenericTensorAccessorR const &weight,
+                              GenericTensorAccessorW const &residual_output,
+                              GenericTensorAccessorW const &output) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
   hipEvent_t t_start, t_end;
   if (m->profiling) {
     checkCUDA(hipEventCreate(&t_start));
@@ -211,6 +246,67 @@ void forward_kernel_wrapper(ResidualRMSNormMeta const *m,
     assert(false && "Unsupported data type");
   }
 
+  // save input activation if needed for PEFT. This must be done after the
+  // forward kernel since that's where we add the residual
+  if (bc->num_active_peft_tokens() > 0) {
+    // Check that we have at most one request that requires peft_bwd
+    int num_peft_requests = 0;
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_bwd) {
+        num_peft_requests++;
+      }
+    }
+    assert(num_peft_requests <= 1);
+
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      // Skip non-PEFT requests
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        continue;
+      }
+      int num_peft_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+      int max_peft_tokens = bc->requestsInfo[i].max_sequence_length;
+      int first_token_offset = bc->requestsInfo[i].first_token_offset_in_batch;
+      int in_dim = input1.domain.hi()[0] - input1.domain.lo()[0] + 1;
+      if (bc->requestsInfo[i].peft_bwd) {
+        size_t activation_size_needed =
+            data_type_size(m->input_type[0]) * max_peft_tokens * in_dim;
+        if (activation_size_needed > m->allocated_peft_buffer_size) {
+          MemoryAllocator *allocator = m->handle.peft_activation_allocator;
+          m->input_activation =
+              allocator->allocate_instance_untyped(activation_size_needed);
+          m->allocated_peft_buffer_size = activation_size_needed;
+        }
+        // copy input activation
+        if (m->input_type[0] == DT_FLOAT) {
+          checkCUDA(hipMemcpyAsync(
+              m->input_activation,
+              residual_output.get_float_ptr() + first_token_offset * in_dim,
+              data_type_size(m->input_type[0]) * num_peft_tokens * in_dim,
+              hipMemcpyDeviceToDevice,
+              stream));
+        } else if (m->input_type[0] == DT_HALF) {
+          checkCUDA(hipMemcpyAsync(
+              m->input_activation,
+              residual_output.get_half_ptr() + first_token_offset * in_dim,
+              data_type_size(m->input_type[0]) * num_peft_tokens * in_dim,
+              hipMemcpyDeviceToDevice,
+              stream));
+        } else {
+          assert(false && "unsupport datatype in layernorm");
+        }
+      }
+    }
+  }
+
   if (m->profiling) {
     checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
@@ -222,6 +318,288 @@ void forward_kernel_wrapper(ResidualRMSNormMeta const *m,
   }
 }
 
+template <typename T>
+__global__ void ComputeInternalGradientsCUDAKernel(
+    int64_t N, T const *dY, T const *X, T const *gamma, T const *rrms, T *c2) {
+  __shared__ float ds_storage[C10_WARP_SIZE];
+  const int64_t i = blockIdx.x;
+  float ds = 0;
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
+    int const index = i * N + j;
+    ds += static_cast<float>(dY[index]) * static_cast<float>(X[index]) *
+          static_cast<float>(gamma[j]);
+  }
+  ds = BlockReduceSum<float>(ds, ds_storage);
+  if (threadIdx.x == 0) {
+    float const c2_val =
+        -ds *
+        (static_cast<float>(rrms[i]) * static_cast<float>(rrms[i]) *
+         static_cast<float>(rrms[i])) /
+        static_cast<float>((int)N);
+    c2[i] = static_cast<T>(c2_val);
+  }
+}
+
+template <typename T>
+__global__ void RMSNormBackwardCUDAKernel(int64_t N,
+                                          T const *dX1_residual,
+                                          T const *dY,
+                                          T const *X,
+                                          T const *gamma,
+                                          T const *c1,
+                                          T const *c2,
+                                          T *dX1,
+                                          T *dX2,
+                                          bool reset_input_grad1,
+                                          bool reset_input_grad2) {
+  const int64_t i = blockIdx.x;
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
+    const int64_t index = i * N + j;
+    float const dX_val =
+        static_cast<float>(c1[i]) * static_cast<float>(dY[index]) *
+            static_cast<float>(gamma[j]) +
+        static_cast<float>(c2[i]) * static_cast<float>(X[index]);
+    if (reset_input_grad1) {
+      dX1[index] = static_cast<T>(dX_val);
+    } else {
+      dX1[index] = dX1_residual[index] + static_cast<T>(dX_val);
+    }
+    if (reset_input_grad2) {
+      dX2[index] = static_cast<T>(dX1[index]);
+    } else {
+      dX2[index] += static_cast<T>(dX1[index]);
+    }
+  }
+}
+
+// Assume the batch size will not be very large, direct implementation is the
+// most efficient one.
+template <typename T>
+__global__ void GammaBackwardCUDAKernel(
+    int64_t M, int64_t N, T const *dY, T const *X, T const *rrms, T *dg) {
+  const int64_t j = blockIdx.x * blockDim.x + threadIdx.x;
+  if (j < N) {
+    T sum1 = 0;
+    for (int64_t i = 0; i < M; ++i) {
+      const int64_t index = i * N + j;
+      sum1 += dY[index] * X[index] * rrms[i];
+    }
+    dg[j] = sum1;
+  }
+}
+
+template <typename T>
+void backward_kernel(ResidualRMSNormMeta const *m,
+                     T const *output_grad_ptr,
+                     T const *residual_output_rms_input_ptr,
+                     T *residual_input0_grad_ptr,
+                     T *residual_input1_grad_ptr,
+                     T const *weight_ptr,
+                     T *weight_grad_ptr,
+                     hipStream_t stream) {
+  int M = m->batch_size;
+  int N = m->in_dim;
+  ComputeInternalGradientsCUDAKernel<T>
+      <<<M, std::min(N, CUDA_NUM_THREADS), 0, stream>>>(
+          N,
+          output_grad_ptr,
+          residual_output_rms_input_ptr,
+          weight_ptr,
+          static_cast<T *>(m->rms_ptr),
+          static_cast<T *>(m->norm_ptr));
+
+  RMSNormBackwardCUDAKernel<T><<<M, std::min(N, CUDA_NUM_THREADS), 0, stream>>>(
+      N,
+      nullptr,
+      output_grad_ptr,
+      residual_output_rms_input_ptr,
+      weight_ptr,
+      static_cast<T *>(m->rms_ptr),
+      static_cast<T *>(m->norm_ptr),
+      residual_input0_grad_ptr,
+      residual_input1_grad_ptr,
+      m->reset_input_grads[0],
+      m->reset_input_grads[1]);
+
+  GammaBackwardCUDAKernel<T><<<M, std::min(N, CUDA_NUM_THREADS), 0, stream>>>(
+      M,
+      N,
+      output_grad_ptr,
+      residual_output_rms_input_ptr,
+      static_cast<T *>(m->rms_ptr),
+      weight_grad_ptr);
+}
+
+template <typename T>
+void peft_bwd_kernel(ResidualRMSNormMeta const *m,
+                     BatchConfig const *bc,
+                     T const *output_grad_0_ptr,
+                     T const *output_grad_1_ptr,
+                     T *input_grad_0_ptr,
+                     T *input_grad_1_ptr,
+                     T const *weight_ptr,
+                     hipStream_t stream) {
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    // Skip non-PEFT requests
+    if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+      continue;
+    }
+    // Skip PEFT forward-only requests
+    if (!bc->requestsInfo[i].peft_bwd) {
+      continue;
+    }
+
+    int M = bc->requestsInfo[i].num_tokens_in_batch;
+    int N = m->in_dim;
+
+    T const *residual_output_rms_input_ptr =
+        static_cast<T *>(m->input_activation);
+
+    ComputeInternalGradientsCUDAKernel<T>
+        <<<M, std::min(N, CUDA_NUM_THREADS), 0, stream>>>(
+            N,
+            output_grad_1_ptr,
+            residual_output_rms_input_ptr,
+            weight_ptr,
+            static_cast<T *>(m->rms_ptr),
+            static_cast<T *>(m->norm_ptr));
+
+    RMSNormBackwardCUDAKernel<T>
+        <<<M, std::min(N, CUDA_NUM_THREADS), 0, stream>>>(
+            N,
+            output_grad_0_ptr,
+            output_grad_1_ptr,
+            residual_output_rms_input_ptr,
+            weight_ptr,
+            static_cast<T *>(m->rms_ptr),
+            static_cast<T *>(m->norm_ptr),
+            input_grad_0_ptr,
+            input_grad_1_ptr,
+            m->reset_input_grads[0],
+            m->reset_input_grads[1]);
+  }
+}
+
+/*
+  regions[0](I): RMS output_grad
+  regions[1](I): Residual output / RMS input
+  regions[2](I/O): Residual input 0 grad
+  regions[3](I/O): Residual input 1 grad
+  regions[4](I): weight
+  regions[5](I/O): weight_grad
+*/
+void backward_kernel_wrapper(
+    ResidualRMSNormMeta const *m,
+    GenericTensorAccessorR const &output_grad,
+    GenericTensorAccessorR const &residual_output_rms_input,
+    GenericTensorAccessorW const &residual_input0_grad,
+    GenericTensorAccessorW const &residual_input1_grad,
+    GenericTensorAccessorR const &weight,
+    GenericTensorAccessorW const &weight_grad) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+  assert(output_grad.data_type == residual_output_rms_input.data_type);
+  assert(residual_output_rms_input.data_type == residual_input0_grad.data_type);
+  assert(residual_input0_grad.data_type == residual_input1_grad.data_type);
+  assert(residual_input1_grad.data_type == weight.data_type);
+  assert(weight.data_type == weight_grad.data_type);
+
+  if (output_grad.data_type == DT_HALF) {
+    backward_kernel(m,
+                    output_grad.get_half_ptr(),
+                    residual_output_rms_input.get_half_ptr(),
+                    residual_input0_grad.get_half_ptr(),
+                    residual_input1_grad.get_half_ptr(),
+                    weight.get_half_ptr(),
+                    weight_grad.get_half_ptr(),
+                    stream);
+  } else if (output_grad.data_type == DT_FLOAT) {
+    backward_kernel(m,
+                    output_grad.get_float_ptr(),
+                    residual_output_rms_input.get_float_ptr(),
+                    residual_input0_grad.get_float_ptr(),
+                    residual_input1_grad.get_float_ptr(),
+                    weight.get_float_ptr(),
+                    weight_grad.get_float_ptr(),
+                    stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("[ResidualRMSNorm] backward time (CF) = %.2fms\n", elapsed);
+  }
+}
+
+void peft_bwd_kernel_wrapper(ResidualRMSNormMeta const *m,
+                             BatchConfig const *bc,
+                             GenericTensorAccessorR const &output_grad_0,
+                             GenericTensorAccessorR const &output_grad_1,
+                             GenericTensorAccessorW const &input_grad_0,
+                             GenericTensorAccessorW const &input_grad_1,
+                             GenericTensorAccessorR const &weight) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+  assert(output_grad_1.data_type == input_grad_0.data_type);
+  assert(input_grad_0.data_type == input_grad_1.data_type);
+  assert(input_grad_1.data_type == weight.data_type);
+
+  if (output_grad_1.data_type == DT_HALF) {
+    peft_bwd_kernel(m,
+                    bc,
+                    m->reset_input_grads[0] ? nullptr
+                                            : output_grad_0.get_half_ptr(),
+                    output_grad_1.get_half_ptr(),
+                    input_grad_0.get_half_ptr(),
+                    input_grad_1.get_half_ptr(),
+                    weight.get_half_ptr(),
+                    stream);
+  } else if (output_grad_1.data_type == DT_FLOAT) {
+    peft_bwd_kernel(m,
+                    bc,
+                    m->reset_input_grads[0] ? nullptr
+                                            : output_grad_0.get_float_ptr(),
+                    output_grad_1.get_float_ptr(),
+                    input_grad_0.get_float_ptr(),
+                    input_grad_1.get_float_ptr(),
+                    weight.get_float_ptr(),
+                    stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("[ResidualRMSNorm] backward time (CF) = %.2fms\n", elapsed);
+  }
+}
+
 } // namespace ResidualRMSNorm
 } // namespace Kernels
 } // namespace FlexFlow
diff --git a/src/ops/kernels/residual_rms_norm_kernels.cu b/src/ops/kernels/residual_rms_norm_kernels.cu
index 17ac14449b..0d44f0260a 100644
--- a/src/ops/kernels/residual_rms_norm_kernels.cu
+++ b/src/ops/kernels/residual_rms_norm_kernels.cu
@@ -24,17 +24,14 @@ namespace FlexFlow {
 using Legion::coord_t;
 
 #define C10_WARP_SIZE 32
-constexpr int kCUDABlockReduceNumThreads = 512;
-constexpr int kCUDANumThreads = 256;
 
 ResidualRMSNormMeta::ResidualRMSNormMeta(FFHandler handler,
                                          ResidualRMSNorm const *rms,
                                          MemoryAllocator &gpu_mem_allocator)
     : OpMeta(handler, rms) {
   eps = rms->eps;
-  alpha = 1.0f;
-  beta = 0.0f;
 
+  inplace_residual = rms->inplace_residual;
   in_dim = rms->data_dim;
   batch_size = rms->effective_batch_size;
   num_elements = in_dim * batch_size;
@@ -48,6 +45,7 @@ ResidualRMSNormMeta::ResidualRMSNormMeta(FFHandler handler,
       rms_ptr_size * data_type_size(data_type));
   norm_ptr = gpu_mem_allocator.allocate_instance_untyped(
       norm_ptr_size * data_type_size(data_type));
+  allocated_peft_buffer_size = 0;
 }
 ResidualRMSNormMeta::~ResidualRMSNormMeta(void) {
   if (reserveInst != Realm::RegionInstance::NO_INST) {
@@ -80,7 +78,7 @@ __inline__ __device__ T WarpReduceSum(T val) {
 }
 
 template <typename T>
-__inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
+__inline__ __device__ T BlockReduceSum(T val, T *shared) {
   int const lid = threadIdx.x % C10_WARP_SIZE;
   int const wid = threadIdx.x / C10_WARP_SIZE;
   val = WarpReduceSum(val);
@@ -89,9 +87,7 @@ __inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
     shared[wid] = val;
   }
   __syncthreads();
-  val = (threadIdx.x < (min(blockDim.x, max_num_threads) / C10_WARP_SIZE))
-            ? shared[lid]
-            : T(0);
+  val = (threadIdx.x < (blockDim.x / C10_WARP_SIZE)) ? shared[lid] : T(0);
   if (wid == 0) {
     val = WarpReduceSum(val);
   }
@@ -111,18 +107,13 @@ __global__ void ResidualRMSNormFusedForwardKernel(int64_t N,
   __shared__ float v_shared[C10_WARP_SIZE];
   int64_t const i = blockIdx.x;
   float sum = 0.0f;
-  for (int64_t j = threadIdx.x; j < N;
-       j += min(blockDim.x, kCUDABlockReduceNumThreads)) {
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
     int64_t const index = i * N + j;
     X_out[index] = X1[index] + X2[index];
     sum +=
         (static_cast<float>(X_out[index]) * static_cast<float>(X_out[index]));
   }
-  sum = BlockReduceSum<float>(
-      sum,
-      v_shared,
-      min(blockDim.x,
-          kCUDABlockReduceNumThreads)); // use BlockReduceSum() to sum X_ij^2
+  sum = BlockReduceSum<float>(sum, v_shared);
 
   if (threadIdx.x == 0) {
     rms[i] = static_cast<T>(rsqrt((sum / static_cast<float>(N)) + eps));
@@ -130,11 +121,12 @@ __global__ void ResidualRMSNormFusedForwardKernel(int64_t N,
 
   __syncthreads();
 
-  using T_ACC = T;
-  for (int64_t j = threadIdx.x; j < N; j += min(blockDim.x, kCUDANumThreads)) {
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
     const int64_t index = i * N + j;
-    Y[index] = static_cast<T_ACC>(X_out[index]) * static_cast<T_ACC>(rms[i]);
-    output[index] = Y[index] * weights[index % N];
+    Y[index] = static_cast<T>(static_cast<float>(X_out[index]) *
+                              static_cast<float>(rms[i]));
+    output[index] = static_cast<T>(static_cast<float>(Y[index]) *
+                                   static_cast<float>(weights[index % N]));
   }
 }
 
@@ -147,26 +139,17 @@ void forward_kernel(ResidualRMSNormMeta const *m,
                     T *output_ptr,
                     cudaStream_t stream) {
 
-  std::pair<int, int> kernel1_parallelism =
-      std::make_pair(m->batch_size, kCUDABlockReduceNumThreads);
-  std::pair<int, int> kernel2_parallelism =
-      std::make_pair(m->batch_size, kCUDANumThreads);
-
-  int num_blocks =
-      std::max(kernel1_parallelism.first, kernel2_parallelism.first);
-  int num_threads =
-      std::max(kernel1_parallelism.second, kernel2_parallelism.second);
-
   ResidualRMSNormFusedForwardKernel<T>
-      <<<num_blocks, num_threads, 0, stream>>>(m->in_dim,
-                                               m->eps,
-                                               input1_ptr,
-                                               input2_ptr,
-                                               residual_output_ptr,
-                                               static_cast<T *>(m->rms_ptr),
-                                               static_cast<T *>(m->norm_ptr),
-                                               weight_ptr,
-                                               output_ptr);
+      <<<m->batch_size, std::min(CUDA_NUM_THREADS, m->in_dim), 0, stream>>>(
+          m->in_dim,
+          m->eps,
+          input1_ptr,
+          input2_ptr,
+          residual_output_ptr,
+          static_cast<T *>(m->rms_ptr),
+          static_cast<T *>(m->norm_ptr),
+          weight_ptr,
+          output_ptr);
 }
 
 void forward_kernel_wrapper(ResidualRMSNormMeta const *m,
@@ -219,6 +202,401 @@ void forward_kernel_wrapper(ResidualRMSNormMeta const *m,
   }
 }
 
+void inference_kernel_wrapper(ResidualRMSNormMeta *m,
+                              BatchConfig const *bc,
+                              GenericTensorAccessorR const &input1,
+                              GenericTensorAccessorR const &input2,
+                              GenericTensorAccessorR const &weight,
+                              GenericTensorAccessorW const &residual_output,
+                              GenericTensorAccessorW const &output) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+
+  assert(input1.data_type == input2.data_type);
+  assert(output.data_type == input1.data_type);
+  assert(weight.data_type == output.data_type);
+  assert(residual_output.data_type == output.data_type);
+
+  if (output.data_type == DT_HALF) {
+    forward_kernel(m,
+                   input1.get_half_ptr(),
+                   input2.get_half_ptr(),
+                   weight.get_half_ptr(),
+                   residual_output.get_half_ptr(),
+                   output.get_half_ptr(),
+                   stream);
+  } else if (output.data_type == DT_FLOAT) {
+    forward_kernel(m,
+                   input1.get_float_ptr(),
+                   input2.get_float_ptr(),
+                   weight.get_float_ptr(),
+                   residual_output.get_float_ptr(),
+                   output.get_float_ptr(),
+                   stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  // save input activation if needed for PEFT. This must be done after the
+  // forward kernel since that's where we add the residual
+  if (bc->num_active_peft_tokens() > 0) {
+    // Check that we have at most one request that requires peft_bwd
+    int num_peft_requests = 0;
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_bwd) {
+        num_peft_requests++;
+      }
+    }
+    assert(num_peft_requests <= 1);
+
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      // Skip non-PEFT requests
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        continue;
+      }
+      int num_peft_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+      int max_peft_tokens = bc->requestsInfo[i].max_sequence_length;
+      int first_token_offset = bc->requestsInfo[i].first_token_offset_in_batch;
+      int in_dim = input1.domain.hi()[0] - input1.domain.lo()[0] + 1;
+      if (bc->requestsInfo[i].peft_bwd) {
+        size_t activation_size_needed =
+            data_type_size(m->input_type[0]) * max_peft_tokens * in_dim;
+        if (activation_size_needed > m->allocated_peft_buffer_size) {
+          MemoryAllocator *allocator = m->handle.peft_activation_allocator;
+          m->input_activation =
+              allocator->allocate_instance_untyped(activation_size_needed);
+          m->allocated_peft_buffer_size = activation_size_needed;
+        }
+        // copy input activation
+        if (m->input_type[0] == DT_FLOAT) {
+          checkCUDA(cudaMemcpyAsync(
+              m->input_activation,
+              residual_output.get_float_ptr() + first_token_offset * in_dim,
+              data_type_size(m->input_type[0]) * num_peft_tokens * in_dim,
+              cudaMemcpyDeviceToDevice,
+              stream));
+        } else if (m->input_type[0] == DT_HALF) {
+          checkCUDA(cudaMemcpyAsync(
+              m->input_activation,
+              residual_output.get_half_ptr() + first_token_offset * in_dim,
+              data_type_size(m->input_type[0]) * num_peft_tokens * in_dim,
+              cudaMemcpyDeviceToDevice,
+              stream));
+        } else {
+          assert(false && "unsupport datatype in layernorm");
+        }
+      }
+    }
+  }
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[ResidualRMSNorm] forward time (CF) = %.2fms\n", elapsed);
+  }
+}
+
+template <typename T>
+__global__ void ComputeInternalGradientsCUDAKernel(
+    int64_t N, T const *dY, T const *X, T const *gamma, T const *rrms, T *c2) {
+  __shared__ float ds_storage[C10_WARP_SIZE];
+  const int64_t i = blockIdx.x;
+  float ds = 0;
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
+    int const index = i * N + j;
+    ds += static_cast<float>(dY[index]) * static_cast<float>(X[index]) *
+          static_cast<float>(gamma[j]);
+  }
+  ds = BlockReduceSum<float>(ds, ds_storage);
+  if (threadIdx.x == 0) {
+    float const c2_val =
+        -ds *
+        (static_cast<float>(rrms[i]) * static_cast<float>(rrms[i]) *
+         static_cast<float>(rrms[i])) /
+        static_cast<float>((int)N);
+    c2[i] = static_cast<T>(c2_val);
+  }
+}
+
+template <typename T>
+__global__ void RMSNormBackwardCUDAKernel(int64_t N,
+                                          T const *dX1_residual,
+                                          T const *dY,
+                                          T const *X,
+                                          T const *gamma,
+                                          T const *c1,
+                                          T const *c2,
+                                          T *dX1,
+                                          T *dX2,
+                                          bool reset_input_grad1,
+                                          bool reset_input_grad2) {
+  const int64_t i = blockIdx.x;
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
+    const int64_t index = i * N + j;
+    float const dX_val =
+        static_cast<float>(c1[i]) * static_cast<float>(dY[index]) *
+            static_cast<float>(gamma[j]) +
+        static_cast<float>(c2[i]) * static_cast<float>(X[index]);
+    if (reset_input_grad1) {
+      dX1[index] = static_cast<T>(dX_val);
+    } else {
+      dX1[index] = dX1_residual[index] + static_cast<T>(dX_val);
+    }
+    if (reset_input_grad2) {
+      dX2[index] = static_cast<T>(dX1[index]);
+    } else {
+      dX2[index] += static_cast<T>(dX1[index]);
+    }
+  }
+}
+
+// Assume the batch size will not be very large, direct implementation is the
+// most efficient one.
+template <typename T>
+__global__ void GammaBackwardCUDAKernel(
+    int64_t M, int64_t N, T const *dY, T const *X, T const *rrms, T *dg) {
+  const int64_t j = blockIdx.x * blockDim.x + threadIdx.x;
+  if (j < N) {
+    T sum1 = 0;
+    for (int64_t i = 0; i < M; ++i) {
+      const int64_t index = i * N + j;
+      sum1 += dY[index] * X[index] * rrms[i];
+    }
+    dg[j] = sum1;
+  }
+}
+
+template <typename T>
+void backward_kernel(ResidualRMSNormMeta const *m,
+                     T const *output_grad_ptr,
+                     T const *residual_output_rms_input_ptr,
+                     T *residual_input0_grad_ptr,
+                     T *residual_input1_grad_ptr,
+                     T const *weight_ptr,
+                     T *weight_grad_ptr,
+                     cudaStream_t stream) {
+  int M = m->batch_size;
+  int N = m->in_dim;
+  ComputeInternalGradientsCUDAKernel<T>
+      <<<M, std::min(N, CUDA_NUM_THREADS), 0, stream>>>(
+          N,
+          output_grad_ptr,
+          residual_output_rms_input_ptr,
+          weight_ptr,
+          static_cast<T *>(m->rms_ptr),
+          static_cast<T *>(m->norm_ptr));
+
+  RMSNormBackwardCUDAKernel<T><<<M, std::min(N, CUDA_NUM_THREADS), 0, stream>>>(
+      N,
+      nullptr,
+      output_grad_ptr,
+      residual_output_rms_input_ptr,
+      weight_ptr,
+      static_cast<T *>(m->rms_ptr),
+      static_cast<T *>(m->norm_ptr),
+      residual_input0_grad_ptr,
+      residual_input1_grad_ptr,
+      m->reset_input_grads[0],
+      m->reset_input_grads[1]);
+
+  GammaBackwardCUDAKernel<T><<<M, std::min(N, CUDA_NUM_THREADS), 0, stream>>>(
+      M,
+      N,
+      output_grad_ptr,
+      residual_output_rms_input_ptr,
+      static_cast<T *>(m->rms_ptr),
+      weight_grad_ptr);
+}
+
+template <typename T>
+void peft_bwd_kernel(ResidualRMSNormMeta const *m,
+                     BatchConfig const *bc,
+                     T const *output_grad_0_ptr,
+                     T const *output_grad_1_ptr,
+                     T *input_grad_0_ptr,
+                     T *input_grad_1_ptr,
+                     T const *weight_ptr,
+                     cudaStream_t stream) {
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    // Skip non-PEFT requests
+    if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+      continue;
+    }
+    // Skip PEFT forward-only requests
+    if (!bc->requestsInfo[i].peft_bwd) {
+      continue;
+    }
+
+    int M = bc->requestsInfo[i].num_tokens_in_batch;
+    int N = m->in_dim;
+
+    T const *residual_output_rms_input_ptr =
+        static_cast<T *>(m->input_activation);
+
+    ComputeInternalGradientsCUDAKernel<T>
+        <<<M, std::min(N, CUDA_NUM_THREADS), 0, stream>>>(
+            N,
+            output_grad_1_ptr,
+            residual_output_rms_input_ptr,
+            weight_ptr,
+            static_cast<T *>(m->rms_ptr),
+            static_cast<T *>(m->norm_ptr));
+
+    RMSNormBackwardCUDAKernel<T>
+        <<<M, std::min(N, CUDA_NUM_THREADS), 0, stream>>>(
+            N,
+            output_grad_0_ptr,
+            output_grad_1_ptr,
+            residual_output_rms_input_ptr,
+            weight_ptr,
+            static_cast<T *>(m->rms_ptr),
+            static_cast<T *>(m->norm_ptr),
+            input_grad_0_ptr,
+            input_grad_1_ptr,
+            m->reset_input_grads[0],
+            m->reset_input_grads[1]);
+  }
+}
+
+/*
+  regions[0](I): RMS output_grad
+  regions[1](I): Residual output / RMS input
+  regions[2](I/O): Residual input 0 grad
+  regions[3](I/O): Residual input 1 grad
+  regions[4](I): weight
+  regions[5](I/O): weight_grad
+*/
+void backward_kernel_wrapper(
+    ResidualRMSNormMeta const *m,
+    GenericTensorAccessorR const &output_grad,
+    GenericTensorAccessorR const &residual_output_rms_input,
+    GenericTensorAccessorW const &residual_input0_grad,
+    GenericTensorAccessorW const &residual_input1_grad,
+    GenericTensorAccessorR const &weight,
+    GenericTensorAccessorW const &weight_grad) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+  assert(output_grad.data_type == residual_output_rms_input.data_type);
+  assert(residual_output_rms_input.data_type == residual_input0_grad.data_type);
+  assert(residual_input0_grad.data_type == residual_input1_grad.data_type);
+  assert(residual_input1_grad.data_type == weight.data_type);
+  assert(weight.data_type == weight_grad.data_type);
+
+  if (output_grad.data_type == DT_HALF) {
+    backward_kernel(m,
+                    output_grad.get_half_ptr(),
+                    residual_output_rms_input.get_half_ptr(),
+                    residual_input0_grad.get_half_ptr(),
+                    residual_input1_grad.get_half_ptr(),
+                    weight.get_half_ptr(),
+                    weight_grad.get_half_ptr(),
+                    stream);
+  } else if (output_grad.data_type == DT_FLOAT) {
+    backward_kernel(m,
+                    output_grad.get_float_ptr(),
+                    residual_output_rms_input.get_float_ptr(),
+                    residual_input0_grad.get_float_ptr(),
+                    residual_input1_grad.get_float_ptr(),
+                    weight.get_float_ptr(),
+                    weight_grad.get_float_ptr(),
+                    stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[ResidualRMSNorm] backward time (CF) = %.2fms\n", elapsed);
+  }
+}
+
+void peft_bwd_kernel_wrapper(ResidualRMSNormMeta const *m,
+                             BatchConfig const *bc,
+                             GenericTensorAccessorR const &output_grad_0,
+                             GenericTensorAccessorR const &output_grad_1,
+                             GenericTensorAccessorW const &input_grad_0,
+                             GenericTensorAccessorW const &input_grad_1,
+                             GenericTensorAccessorR const &weight) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+  assert(output_grad_1.data_type == input_grad_0.data_type);
+  assert(input_grad_0.data_type == input_grad_1.data_type);
+  assert(input_grad_1.data_type == weight.data_type);
+
+  if (output_grad_1.data_type == DT_HALF) {
+    peft_bwd_kernel(m,
+                    bc,
+                    m->reset_input_grads[0] ? nullptr
+                                            : output_grad_0.get_half_ptr(),
+                    output_grad_1.get_half_ptr(),
+                    input_grad_0.get_half_ptr(),
+                    input_grad_1.get_half_ptr(),
+                    weight.get_half_ptr(),
+                    stream);
+  } else if (output_grad_1.data_type == DT_FLOAT) {
+    peft_bwd_kernel(m,
+                    bc,
+                    m->reset_input_grads[0] ? nullptr
+                                            : output_grad_0.get_float_ptr(),
+                    output_grad_1.get_float_ptr(),
+                    input_grad_0.get_float_ptr(),
+                    input_grad_1.get_float_ptr(),
+                    weight.get_float_ptr(),
+                    stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[ResidualRMSNorm] backward time (CF) = %.2fms\n", elapsed);
+  }
+}
+
 } // namespace ResidualRMSNorm
 } // namespace Kernels
 } // namespace FlexFlow
diff --git a/src/ops/kernels/rms_norm_kernels.cpp b/src/ops/kernels/rms_norm_kernels.cpp
index 24ab7051e6..4158628005 100644
--- a/src/ops/kernels/rms_norm_kernels.cpp
+++ b/src/ops/kernels/rms_norm_kernels.cpp
@@ -23,16 +23,12 @@ namespace FlexFlow {
 // declare Legion names
 using Legion::coord_t;
 #define C10_WARP_SIZE 32
-constexpr int kCUDABlockReduceNumThreads = 512;
-constexpr int kCUDANumThreads = 256;
 
 RMSNormMeta::RMSNormMeta(FFHandler handler,
                          RMSNorm const *rms,
                          MemoryAllocator &gpu_mem_allocator)
     : OpMeta(handler, rms) {
   eps = rms->eps;
-  alpha = 1.0f;
-  beta = 0.0f;
 
   in_dim = rms->data_dim;
   batch_size = rms->effective_batch_size;
@@ -47,12 +43,14 @@ RMSNormMeta::RMSNormMeta(FFHandler handler,
       rms_ptr_size * data_type_size(data_type));
   norm_ptr = gpu_mem_allocator.allocate_instance_untyped(
       norm_ptr_size * data_type_size(data_type));
+  allocated_peft_buffer_size = 0;
 }
 RMSNormMeta::~RMSNormMeta(void) {
   if (reserveInst != Realm::RegionInstance::NO_INST) {
     reserveInst.destroy();
   }
 }
+
 namespace Kernels {
 namespace RMSNorm {
 
@@ -78,7 +76,7 @@ __inline__ __device__ T WarpReduceSum(T val) {
 }
 
 template <typename T>
-__inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
+__inline__ __device__ T BlockReduceSum(T val, T *shared) {
   int const lid = threadIdx.x % C10_WARP_SIZE;
   int const wid = threadIdx.x / C10_WARP_SIZE;
   val = WarpReduceSum(val);
@@ -87,9 +85,7 @@ __inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
     shared[wid] = val;
   }
   __syncthreads();
-  val = (threadIdx.x < (min(blockDim.x, max_num_threads) / C10_WARP_SIZE))
-            ? shared[lid]
-            : T(0);
+  val = (threadIdx.x < (blockDim.x / C10_WARP_SIZE)) ? shared[lid] : T(0);
   if (wid == 0) {
     val = WarpReduceSum(val);
   }
@@ -107,16 +103,11 @@ __global__ void RMSNormFusedForwardKernel(int64_t N,
   __shared__ float v_shared[C10_WARP_SIZE];
   int64_t const i = blockIdx.x;
   float sum = 0.0f;
-  for (int64_t j = threadIdx.x; j < N;
-       j += min(blockDim.x, kCUDABlockReduceNumThreads)) {
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
     int64_t const index = i * N + j;
     sum += (static_cast<float>(X[index]) * static_cast<float>(X[index]));
   }
-  sum = BlockReduceSum<float>(
-      sum,
-      v_shared,
-      min(blockDim.x,
-          kCUDABlockReduceNumThreads)); // use BlockReduceSum() to sum X_ij^2
+  sum = BlockReduceSum<float>(sum, v_shared);
 
   if (threadIdx.x == 0) {
     rms[i] = static_cast<T>(rsqrt((sum / static_cast<float>(N)) + eps));
@@ -124,10 +115,9 @@ __global__ void RMSNormFusedForwardKernel(int64_t N,
 
   __syncthreads();
 
-  using T_ACC = T;
-  for (int64_t j = threadIdx.x; j < N; j += min(blockDim.x, kCUDANumThreads)) {
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
     const int64_t index = i * N + j;
-    Y[index] = static_cast<T_ACC>(X[index]) * static_cast<T_ACC>(rms[i]);
+    Y[index] = static_cast<T>(X[index]) * static_cast<T>(rms[i]);
     output[index] = Y[index] * weights[index % N];
   }
 }
@@ -138,19 +128,10 @@ void forward_kernel(RMSNormMeta const *m,
                     T const *weight_ptr,
                     T *output_ptr,
                     hipStream_t stream) {
-  std::pair<int, int> kernel1_parallelism =
-      std::make_pair(m->batch_size, kCUDABlockReduceNumThreads);
-  std::pair<int, int> kernel2_parallelism =
-      std::make_pair(m->batch_size, kCUDANumThreads);
-
-  int num_blocks =
-      std::max(kernel1_parallelism.first, kernel2_parallelism.first);
-  int num_threads =
-      std::max(kernel1_parallelism.second, kernel2_parallelism.second);
 
   hipLaunchKernelGGL(HIP_KERNEL_NAME(RMSNormFusedForwardKernel<T>),
-                     num_blocks,
-                     num_threads,
+                     m->batch_size,
+                     std::min(CUDA_NUM_THREADS, m->in_dim),
                      0,
                      stream,
                      m->in_dim,
@@ -204,6 +185,363 @@ void forward_kernel_wrapper(RMSNormMeta const *m,
   }
 }
 
+void inference_kernel_wrapper(RMSNormMeta *m,
+                              BatchConfig const *bc,
+                              GenericTensorAccessorR const &input,
+                              GenericTensorAccessorR const &weight,
+                              GenericTensorAccessorW const &output) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+
+  assert(output.data_type == input.data_type);
+  assert(weight.data_type == output.data_type);
+
+  // save input activation if needed for PEFT
+  if (bc->num_active_peft_tokens() > 0) {
+    // Check that we have at most one request that requires peft_bwd
+    int num_peft_requests = 0;
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_bwd) {
+        num_peft_requests++;
+      }
+    }
+    assert(num_peft_requests <= 1);
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      // Skip non-PEFT requests
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        continue;
+      }
+      int num_peft_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+      int max_peft_tokens = bc->requestsInfo[i].max_sequence_length;
+      int first_token_offset = bc->requestsInfo[i].first_token_offset_in_batch;
+      int in_dim = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+      if (bc->requestsInfo[i].peft_bwd) {
+        size_t activation_size_needed =
+            data_type_size(m->input_type[0]) * max_peft_tokens * in_dim;
+        if (activation_size_needed > m->allocated_peft_buffer_size) {
+          MemoryAllocator *allocator = m->handle.peft_activation_allocator;
+          m->input_activation =
+              allocator->allocate_instance_untyped(activation_size_needed);
+          m->allocated_peft_buffer_size = activation_size_needed;
+        }
+
+        if (input.data_type == DT_FLOAT) {
+          checkCUDA(hipMemcpyAsync(
+              m->input_activation,
+              input.get_float_ptr() + first_token_offset * in_dim,
+              data_type_size(input.data_type) * num_peft_tokens * in_dim,
+              hipMemcpyDeviceToDevice,
+              stream));
+        } else if (input.data_type == DT_HALF) {
+          checkCUDA(hipMemcpyAsync(
+              m->input_activation,
+              input.get_half_ptr() + first_token_offset * in_dim,
+              data_type_size(input.data_type) * num_peft_tokens * in_dim,
+              hipMemcpyDeviceToDevice,
+              stream));
+        } else {
+          assert(false && "unsupport datatype in layernorm");
+        }
+      }
+    }
+  }
+
+  if (output.data_type == DT_HALF) {
+    forward_kernel(m,
+                   input.get_half_ptr(),
+                   weight.get_half_ptr(),
+                   output.get_half_ptr(),
+                   stream);
+  } else if (output.data_type == DT_FLOAT) {
+    forward_kernel(m,
+                   input.get_float_ptr(),
+                   weight.get_float_ptr(),
+                   output.get_float_ptr(),
+                   stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("[RMSNorm] forward time (CF) = %.2fms\n", elapsed);
+  }
+}
+
+template <typename T>
+__global__ void ComputeInternalGradientsCUDAKernel(
+    int64_t N, T const *dY, T const *X, T const *gamma, T const *rrms, T *c2) {
+  __shared__ T ds_storage[C10_WARP_SIZE];
+  const int64_t i = blockIdx.x;
+  float ds = 0;
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
+    int const index = i * N + j;
+    ds += static_cast<float>(dY[index]) * static_cast<float>(X[index]) *
+          static_cast<float>(gamma[j]);
+  }
+  ds = BlockReduceSum<T>(ds, ds_storage);
+  if (threadIdx.x == 0) {
+    float const c2_val =
+        -ds *
+        (static_cast<float>(rrms[i]) * static_cast<float>(rrms[i]) *
+         static_cast<float>(rrms[i])) /
+        static_cast<float>((int)N);
+    c2[i] = static_cast<T>(c2_val);
+  }
+}
+
+template <typename T>
+__global__ void RMSNormBackwardCUDAKernel(int64_t N,
+                                          T const *dY,
+                                          T const *X,
+                                          T const *gamma,
+                                          T const *c1,
+                                          T const *c2,
+                                          T *dX,
+                                          bool reset_input_grad) {
+  const int64_t i = blockIdx.x;
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
+    const int64_t index = i * N + j;
+    float const dX_val =
+        static_cast<float>(c1[i]) * static_cast<float>(dY[index]) *
+            static_cast<float>(gamma[j]) +
+        static_cast<float>(c2[i]) * static_cast<float>(X[index]);
+    if (reset_input_grad) {
+      dX[index] = dX_val;
+    } else {
+      dX[index] += dX_val;
+    }
+  }
+}
+
+// Assume the batch size will not be very large, direct implementation is the
+// most efficient one.
+template <typename T>
+__global__ void GammaBackwardCUDAKernel(
+    int64_t M, int64_t N, T const *dY, T const *X, T const *rrms, T *dg) {
+  const int64_t j = blockIdx.x * blockDim.x + threadIdx.x;
+  if (j < N) {
+    T sum1 = 0;
+    for (int64_t i = 0; i < M; ++i) {
+      const int64_t index = i * N + j;
+      sum1 += dY[index] * X[index] * rrms[i];
+    }
+    dg[j] = sum1;
+  }
+}
+
+template <typename T>
+void backward_kernel(RMSNormMeta const *m,
+                     T const *output_grad_ptr,
+                     T const *input_ptr,
+                     T *input_grad_ptr,
+                     T const *weight_ptr,
+                     T *weight_grad_ptr,
+                     hipStream_t stream) {
+  int M = m->batch_size;
+  int N = m->in_dim;
+  hipLaunchKernelGGL(HIP_KERNEL_NAME(ComputeInternalGradientsCUDAKernel<T>),
+                     M,
+                     std::min(N, CUDA_NUM_THREADS),
+                     0,
+                     stream,
+                     N,
+                     output_grad_ptr,
+                     input_ptr,
+                     weight_ptr,
+                     static_cast<T *>(m->rms_ptr),
+                     static_cast<T *>(m->norm_ptr));
+
+  hipLaunchKernelGGL(HIP_KERNEL_NAME(RMSNormBackwardCUDAKernel<T>),
+                     M,
+                     std::min(N, CUDA_NUM_THREADS),
+                     0,
+                     stream,
+                     m->in_dim,
+                     output_grad_ptr,
+                     input_ptr,
+                     weight_ptr,
+                     static_cast<T *>(m->rms_ptr),
+                     static_cast<T *>(m->norm_ptr),
+                     input_grad_ptr,
+                     m->reset_input_grads[0]);
+  hipLaunchKernelGGL(HIP_KERNEL_NAME(GammaBackwardCUDAKernel<T>),
+                     M,
+                     std::min(N, CUDA_NUM_THREADS),
+                     0,
+                     stream,
+                     M,
+                     N,
+                     output_grad_ptr,
+                     input_ptr,
+                     static_cast<T *>(m->rms_ptr),
+                     weight_grad_ptr);
+}
+
+void backward_kernel_wrapper(RMSNormMeta const *m,
+                             GenericTensorAccessorR const &output_grad,
+                             GenericTensorAccessorR const &input,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &weight,
+                             GenericTensorAccessorW const &weight_grad) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+  assert(input_grad.data_type == input.data_type);
+  assert(weight_grad.data_type == weight.data_type);
+  assert(output_grad.data_type == input.data_type);
+  assert(weight.data_type == output_grad.data_type);
+
+  if (output_grad.data_type == DT_HALF) {
+    backward_kernel(m,
+                    output_grad.get_half_ptr(),
+                    input.get_half_ptr(),
+                    input_grad.get_half_ptr(),
+                    weight.get_half_ptr(),
+                    weight_grad.get_half_ptr(),
+                    stream);
+  } else if (output_grad.data_type == DT_FLOAT) {
+    backward_kernel(m,
+                    output_grad.get_float_ptr(),
+                    input.get_float_ptr(),
+                    input_grad.get_float_ptr(),
+                    weight.get_float_ptr(),
+                    weight_grad.get_float_ptr(),
+                    stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("[RMSNorm] backward time (CF) = %.2fms\n", elapsed);
+  }
+}
+
+template <typename T>
+void peft_bwd_kernel(RMSNormMeta const *m,
+                     BatchConfig const *bc,
+                     T const *output_grad_ptr,
+                     T *input_grad_ptr,
+                     T const *weight_ptr,
+                     hipStream_t stream) {
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    // Skip non-PEFT requests
+    if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+      continue;
+    }
+    // Skip PEFT forward-only requests
+    if (!bc->requestsInfo[i].peft_bwd) {
+      continue;
+    }
+
+    int M = bc->requestsInfo[i].num_tokens_in_batch;
+    int N = m->num_elements;
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(ComputeInternalGradientsCUDAKernel<T>),
+                       M,
+                       std::min(N, CUDA_NUM_THREADS),
+                       0,
+                       stream,
+                       N,
+                       output_grad_ptr,
+                       static_cast<T *>(m->input_activation),
+                       weight_ptr,
+                       static_cast<T *>(m->rms_ptr),
+                       static_cast<T *>(m->norm_ptr));
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(RMSNormBackwardCUDAKernel<T>),
+                       M,
+                       std::min(N, CUDA_NUM_THREADS),
+                       0,
+                       stream,
+                       m->in_dim,
+                       output_grad_ptr,
+                       static_cast<T *>(m->input_activation),
+                       weight_ptr,
+                       static_cast<T *>(m->rms_ptr),
+                       static_cast<T *>(m->norm_ptr),
+                       input_grad_ptr,
+                       m->reset_input_grads[0]);
+  }
+}
+
+void peft_bwd_kernel_wrapper(RMSNormMeta const *m,
+                             BatchConfig const *bc,
+                             GenericTensorAccessorR const &output_grad,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &weight) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+  assert(input_grad.data_type == output_grad.data_type);
+  assert(output_grad.data_type == weight.data_type);
+
+  if (output_grad.data_type == DT_HALF) {
+    peft_bwd_kernel(m,
+                    bc,
+                    output_grad.get_half_ptr(),
+                    input_grad.get_half_ptr(),
+                    weight.get_half_ptr(),
+                    stream);
+  } else if (output_grad.data_type == DT_FLOAT) {
+    peft_bwd_kernel(m,
+                    bc,
+                    output_grad.get_float_ptr(),
+                    input_grad.get_float_ptr(),
+                    weight.get_float_ptr(),
+                    stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("[RMSNorm] peft_bwd time (CF) = %.2fms\n", elapsed);
+  }
+}
+
 } // namespace RMSNorm
 } // namespace Kernels
 } // namespace FlexFlow
diff --git a/src/ops/kernels/rms_norm_kernels.cu b/src/ops/kernels/rms_norm_kernels.cu
index 7c9f4a9f98..dd6ada864d 100644
--- a/src/ops/kernels/rms_norm_kernels.cu
+++ b/src/ops/kernels/rms_norm_kernels.cu
@@ -24,16 +24,12 @@ namespace FlexFlow {
 using Legion::coord_t;
 
 #define C10_WARP_SIZE 32
-constexpr int kCUDABlockReduceNumThreads = 512;
-constexpr int kCUDANumThreads = 256;
 
 RMSNormMeta::RMSNormMeta(FFHandler handler,
                          RMSNorm const *rms,
                          MemoryAllocator &gpu_mem_allocator)
     : OpMeta(handler, rms) {
   eps = rms->eps;
-  alpha = 1.0f;
-  beta = 0.0f;
 
   in_dim = rms->data_dim;
   batch_size = rms->effective_batch_size;
@@ -48,6 +44,7 @@ RMSNormMeta::RMSNormMeta(FFHandler handler,
       rms_ptr_size * data_type_size(data_type));
   norm_ptr = gpu_mem_allocator.allocate_instance_untyped(
       norm_ptr_size * data_type_size(data_type));
+  allocated_peft_buffer_size = 0;
 }
 RMSNormMeta::~RMSNormMeta(void) {
   if (reserveInst != Realm::RegionInstance::NO_INST) {
@@ -96,66 +93,6 @@ __inline__ __device__ T BlockReduceSum(T val, T *shared) {
   return val;
 }
 
-template <typename T>
-__inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
-  int const lid = threadIdx.x % C10_WARP_SIZE;
-  int const wid = threadIdx.x / C10_WARP_SIZE;
-  val = WarpReduceSum(val);
-  __syncthreads();
-  if (lid == 0) {
-    shared[wid] = val;
-  }
-  __syncthreads();
-  val = (threadIdx.x < (min(blockDim.x, max_num_threads) / C10_WARP_SIZE))
-            ? shared[lid]
-            : T(0);
-  if (wid == 0) {
-    val = WarpReduceSum(val);
-  }
-  return val;
-}
-
-#ifdef DEADCODE
-template <typename T>
-__global__ void
-    RowwiseRootMeanSquareKernel(long long N, float eps, T const *X, T *rms) {
-  __shared__ float v_shared[C10_WARP_SIZE];
-  long long const i = blockIdx.x;
-  float sum = 0.0f;
-  for (long long j = threadIdx.x; j < N; j += blockDim.x) {
-    long long const index = i * N + j;
-    sum += (static_cast<float>(X[index]) * static_cast<float>(X[index]));
-  }
-  sum = BlockReduceSum<float>(sum,
-                              v_shared); // use BlockReduceSum() to sum X_ij^2
-
-  if (threadIdx.x == 0) {
-    rms[i] = static_cast<T>(rsqrt((sum / static_cast<float>(N)) + eps));
-  }
-}
-
-template <typename T>
-__global__ void NormKernel(int64_t N, T const *X, T const *rstd, T *Y) {
-  using T_ACC = T;
-  const int64_t i = blockIdx.x;
-  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
-    const int64_t index = i * N + j;
-    Y[index] = static_cast<T_ACC>(X[index]) * static_cast<T_ACC>(rstd[i]);
-  }
-}
-
-template <typename T>
-__global__ void elewise_apply_weights(int64_t batch_size,
-                                      int64_t in_dim,
-                                      T const *norm,
-                                      T const *weights,
-                                      T *output) {
-  CUDA_KERNEL_LOOP(i, batch_size * in_dim) {
-    output[i] = norm[i] * weights[i % in_dim];
-  }
-}
-#endif
-
 template <typename T>
 __global__ void RMSNormFusedForwardKernel(int64_t N,
                                           float eps,
@@ -167,16 +104,11 @@ __global__ void RMSNormFusedForwardKernel(int64_t N,
   __shared__ float v_shared[C10_WARP_SIZE];
   int64_t const i = blockIdx.x;
   float sum = 0.0f;
-  for (int64_t j = threadIdx.x; j < N;
-       j += min(blockDim.x, kCUDABlockReduceNumThreads)) {
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
     int64_t const index = i * N + j;
     sum += (static_cast<float>(X[index]) * static_cast<float>(X[index]));
   }
-  sum = BlockReduceSum<float>(
-      sum,
-      v_shared,
-      min(blockDim.x,
-          kCUDABlockReduceNumThreads)); // use BlockReduceSum() to sum X_ij^2
+  sum = BlockReduceSum<float>(sum, v_shared);
 
   if (threadIdx.x == 0) {
     rms[i] = static_cast<T>(rsqrt((sum / static_cast<float>(N)) + eps));
@@ -184,10 +116,9 @@ __global__ void RMSNormFusedForwardKernel(int64_t N,
 
   __syncthreads();
 
-  using T_ACC = T;
-  for (int64_t j = threadIdx.x; j < N; j += min(blockDim.x, kCUDANumThreads)) {
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
     const int64_t index = i * N + j;
-    Y[index] = static_cast<T_ACC>(X[index]) * static_cast<T_ACC>(rms[i]);
+    Y[index] = static_cast<T>(X[index]) * static_cast<T>(rms[i]);
     output[index] = Y[index] * weights[index % N];
   }
 }
@@ -199,24 +130,15 @@ void forward_kernel(RMSNormMeta const *m,
                     T *output_ptr,
                     cudaStream_t stream) {
 
-  std::pair<int, int> kernel1_parallelism =
-      std::make_pair(m->batch_size, kCUDABlockReduceNumThreads);
-  std::pair<int, int> kernel2_parallelism =
-      std::make_pair(m->batch_size, kCUDANumThreads);
-
-  int num_blocks =
-      std::max(kernel1_parallelism.first, kernel2_parallelism.first);
-  int num_threads =
-      std::max(kernel1_parallelism.second, kernel2_parallelism.second);
-
   RMSNormFusedForwardKernel<T>
-      <<<num_blocks, num_threads, 0, stream>>>(m->in_dim,
-                                               m->eps,
-                                               input_ptr,
-                                               static_cast<T *>(m->rms_ptr),
-                                               static_cast<T *>(m->norm_ptr),
-                                               weight_ptr,
-                                               output_ptr);
+      <<<m->batch_size, std::min(CUDA_NUM_THREADS, m->in_dim), 0, stream>>>(
+          m->in_dim,
+          m->eps,
+          input_ptr,
+          static_cast<T *>(m->rms_ptr),
+          static_cast<T *>(m->norm_ptr),
+          weight_ptr,
+          output_ptr);
 }
 
 void forward_kernel_wrapper(RMSNormMeta const *m,
@@ -261,6 +183,346 @@ void forward_kernel_wrapper(RMSNormMeta const *m,
   }
 }
 
+void inference_kernel_wrapper(RMSNormMeta *m,
+                              BatchConfig const *bc,
+                              GenericTensorAccessorR const &input,
+                              GenericTensorAccessorR const &weight,
+                              GenericTensorAccessorW const &output) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+
+  assert(output.data_type == input.data_type);
+  assert(weight.data_type == output.data_type);
+
+  // save input activation if needed for PEFT
+  if (bc->num_active_peft_tokens() > 0) {
+    // Check that we have at most one request that requires peft_bwd
+    int num_peft_requests = 0;
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_bwd) {
+        num_peft_requests++;
+      }
+    }
+    assert(num_peft_requests <= 1);
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      // Skip non-PEFT requests
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        continue;
+      }
+      int num_peft_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+      int max_peft_tokens = bc->requestsInfo[i].max_sequence_length;
+      int first_token_offset = bc->requestsInfo[i].first_token_offset_in_batch;
+      int in_dim = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+      if (bc->requestsInfo[i].peft_bwd) {
+        size_t activation_size_needed =
+            data_type_size(m->input_type[0]) * max_peft_tokens * in_dim;
+        if (activation_size_needed > m->allocated_peft_buffer_size) {
+          MemoryAllocator *allocator = m->handle.peft_activation_allocator;
+          m->input_activation =
+              allocator->allocate_instance_untyped(activation_size_needed);
+          m->allocated_peft_buffer_size = activation_size_needed;
+        }
+
+        if (input.data_type == DT_FLOAT) {
+          checkCUDA(cudaMemcpyAsync(
+              m->input_activation,
+              input.get_float_ptr() + first_token_offset * in_dim,
+              data_type_size(input.data_type) * num_peft_tokens * in_dim,
+              cudaMemcpyDeviceToDevice,
+              stream));
+        } else if (input.data_type == DT_HALF) {
+          checkCUDA(cudaMemcpyAsync(
+              m->input_activation,
+              input.get_half_ptr() + first_token_offset * in_dim,
+              data_type_size(input.data_type) * num_peft_tokens * in_dim,
+              cudaMemcpyDeviceToDevice,
+              stream));
+        } else {
+          assert(false && "unsupport datatype in layernorm");
+        }
+      }
+    }
+  }
+
+  if (output.data_type == DT_HALF) {
+    forward_kernel(m,
+                   input.get_half_ptr(),
+                   weight.get_half_ptr(),
+                   output.get_half_ptr(),
+                   stream);
+  } else if (output.data_type == DT_FLOAT) {
+    forward_kernel(m,
+                   input.get_float_ptr(),
+                   weight.get_float_ptr(),
+                   output.get_float_ptr(),
+                   stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[RMSNorm] forward time (CF) = %.2fms\n", elapsed);
+  }
+}
+
+template <typename T>
+__global__ void ComputeInternalGradientsCUDAKernel(
+    int64_t N, T const *dY, T const *X, T const *gamma, T const *rrms, T *c2) {
+  __shared__ T ds_storage[C10_WARP_SIZE];
+  const int64_t i = blockIdx.x;
+  float ds = 0;
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
+    int const index = i * N + j;
+    ds += static_cast<float>(dY[index]) * static_cast<float>(X[index]) *
+          static_cast<float>(gamma[j]);
+  }
+  ds = BlockReduceSum<T>(ds, ds_storage);
+  if (threadIdx.x == 0) {
+    float const c2_val =
+        -ds *
+        (static_cast<float>(rrms[i]) * static_cast<float>(rrms[i]) *
+         static_cast<float>(rrms[i])) /
+        static_cast<float>((int)N);
+    c2[i] = static_cast<T>(c2_val);
+  }
+}
+
+template <typename T>
+__global__ void RMSNormBackwardCUDAKernel(int64_t N,
+                                          T const *dY,
+                                          T const *X,
+                                          T const *gamma,
+                                          T const *c1,
+                                          T const *c2,
+                                          T *dX,
+                                          bool reset_input_grad) {
+  const int64_t i = blockIdx.x;
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
+    const int64_t index = i * N + j;
+    float const dX_val =
+        static_cast<float>(c1[i]) * static_cast<float>(dY[index]) *
+            static_cast<float>(gamma[j]) +
+        static_cast<float>(c2[i]) * static_cast<float>(X[index]);
+    if (reset_input_grad) {
+      dX[index] = dX_val;
+    } else {
+      dX[index] += dX_val;
+    }
+  }
+}
+
+// Assume the batch size will not be very large, direct implementation is the
+// most efficient one.
+template <typename T>
+__global__ void GammaBackwardCUDAKernel(
+    int64_t M, int64_t N, T const *dY, T const *X, T const *rrms, T *dg) {
+  const int64_t j = blockIdx.x * blockDim.x + threadIdx.x;
+  if (j < N) {
+    T sum1 = 0;
+    for (int64_t i = 0; i < M; ++i) {
+      const int64_t index = i * N + j;
+      sum1 += dY[index] * X[index] * rrms[i];
+    }
+    dg[j] = sum1;
+  }
+}
+
+template <typename T>
+void backward_kernel(RMSNormMeta const *m,
+                     T const *output_grad_ptr,
+                     T const *input_ptr,
+                     T *input_grad_ptr,
+                     T const *weight_ptr,
+                     T *weight_grad_ptr,
+                     cudaStream_t stream) {
+  int M = m->batch_size;
+  int N = m->in_dim;
+  ComputeInternalGradientsCUDAKernel<T>
+      <<<M, std::min(N, CUDA_NUM_THREADS), 0, stream>>>(
+          N,
+          output_grad_ptr,
+          input_ptr,
+          weight_ptr,
+          static_cast<T *>(m->rms_ptr),
+          static_cast<T *>(m->norm_ptr));
+
+  RMSNormBackwardCUDAKernel<T><<<M, std::min(N, CUDA_NUM_THREADS), 0, stream>>>(
+      m->in_dim,
+      output_grad_ptr,
+      input_ptr,
+      weight_ptr,
+      static_cast<T *>(m->rms_ptr),
+      static_cast<T *>(m->norm_ptr),
+      input_grad_ptr,
+      m->reset_input_grads[0]);
+  GammaBackwardCUDAKernel<T><<<M, std::min(N, CUDA_NUM_THREADS), 0, stream>>>(
+      M,
+      N,
+      output_grad_ptr,
+      input_ptr,
+      static_cast<T *>(m->rms_ptr),
+      weight_grad_ptr);
+}
+
+void backward_kernel_wrapper(RMSNormMeta const *m,
+                             GenericTensorAccessorR const &output_grad,
+                             GenericTensorAccessorR const &input,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &weight,
+                             GenericTensorAccessorW const &weight_grad) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+  assert(input_grad.data_type == input.data_type);
+  assert(weight_grad.data_type == weight.data_type);
+  assert(output_grad.data_type == input.data_type);
+  assert(weight.data_type == output_grad.data_type);
+
+  if (output_grad.data_type == DT_HALF) {
+    backward_kernel(m,
+                    output_grad.get_half_ptr(),
+                    input.get_half_ptr(),
+                    input_grad.get_half_ptr(),
+                    weight.get_half_ptr(),
+                    weight_grad.get_half_ptr(),
+                    stream);
+  } else if (output_grad.data_type == DT_FLOAT) {
+    backward_kernel(m,
+                    output_grad.get_float_ptr(),
+                    input.get_float_ptr(),
+                    input_grad.get_float_ptr(),
+                    weight.get_float_ptr(),
+                    weight_grad.get_float_ptr(),
+                    stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[RMSNorm] backward time (CF) = %.2fms\n", elapsed);
+  }
+}
+
+template <typename T>
+void peft_bwd_kernel(RMSNormMeta const *m,
+                     BatchConfig const *bc,
+                     T const *output_grad_ptr,
+                     T *input_grad_ptr,
+                     T const *weight_ptr,
+                     cudaStream_t stream) {
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    // Skip non-PEFT requests
+    if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+      continue;
+    }
+    // Skip PEFT forward-only requests
+    if (!bc->requestsInfo[i].peft_bwd) {
+      continue;
+    }
+
+    int M = bc->requestsInfo[i].num_tokens_in_batch;
+    int N = m->num_elements;
+    ComputeInternalGradientsCUDAKernel<T>
+        <<<M, std::min(N, CUDA_NUM_THREADS), 0, stream>>>(
+            N,
+            output_grad_ptr,
+            static_cast<T *>(m->input_activation),
+            weight_ptr,
+            static_cast<T *>(m->rms_ptr),
+            static_cast<T *>(m->norm_ptr));
+    RMSNormBackwardCUDAKernel<T>
+        <<<M, std::min(N, CUDA_NUM_THREADS), 0, stream>>>(
+            m->in_dim,
+            output_grad_ptr,
+            static_cast<T *>(m->input_activation),
+            weight_ptr,
+            static_cast<T *>(m->rms_ptr),
+            static_cast<T *>(m->norm_ptr),
+            input_grad_ptr,
+            m->reset_input_grads[0]);
+  }
+}
+
+void peft_bwd_kernel_wrapper(RMSNormMeta const *m,
+                             BatchConfig const *bc,
+                             GenericTensorAccessorR const &output_grad,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &weight) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+  assert(input_grad.data_type == output_grad.data_type);
+  assert(output_grad.data_type == weight.data_type);
+
+  if (output_grad.data_type == DT_HALF) {
+    peft_bwd_kernel(m,
+                    bc,
+                    output_grad.get_half_ptr(),
+                    input_grad.get_half_ptr(),
+                    weight.get_half_ptr(),
+                    stream);
+  } else if (output_grad.data_type == DT_FLOAT) {
+    peft_bwd_kernel(m,
+                    bc,
+                    output_grad.get_float_ptr(),
+                    input_grad.get_float_ptr(),
+                    weight.get_float_ptr(),
+                    stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[RMSNorm] peft_bwd time (CF) = %.2fms\n", elapsed);
+  }
+}
+
 } // namespace RMSNorm
 } // namespace Kernels
 } // namespace FlexFlow
diff --git a/src/ops/kernels/softmax.cpp b/src/ops/kernels/softmax.cpp
index 89c9f14a01..fa31c5adff 100644
--- a/src/ops/kernels/softmax.cpp
+++ b/src/ops/kernels/softmax.cpp
@@ -25,13 +25,13 @@ using Legion::Domain;
 SoftmaxMeta::SoftmaxMeta(FFHandler handler,
                          Softmax const *softmax,
                          Domain const &input_domain)
-    : OpMeta(handler) {
+    : OpMeta(handler, softmax) {
   checkCUDNN(miopenCreateTensorDescriptor(&inputTensor));
-  checkCUDNN(
-      cudnnSetTensorDescriptorFromDomain4SoftMax(inputTensor, input_domain));
+  checkCUDNN(cudnnSetTensorDescriptorFromDomain4SoftMax(
+      inputTensor, input_domain, softmax->data_type));
   checkCUDNN(miopenCreateTensorDescriptor(&outputTensor));
-  checkCUDNN(
-      cudnnSetTensorDescriptorFromDomain4SoftMax(outputTensor, input_domain));
+  checkCUDNN(cudnnSetTensorDescriptorFromDomain4SoftMax(
+      outputTensor, input_domain, softmax->data_type));
   dim = softmax->dim;
   profiling = softmax->profiling;
   inference_debugging = softmax->inference_debugging;
@@ -41,20 +41,26 @@ SoftmaxMeta::SoftmaxMeta(FFHandler handler,
 namespace Kernels {
 namespace Softmax {
 
-template <typename DT>
 void forward_kernel_wrapper(SoftmaxMeta const *m,
-                            DT const *input_ptr,
-                            DT *output_ptr) {
+                            GenericTensorAccessorR const &input,
+                            GenericTensorAccessorW const &output) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
-
   hipEvent_t t_start, t_end;
   if (m->profiling) {
     checkCUDA(hipEventCreate(&t_start));
     checkCUDA(hipEventCreate(&t_end));
     checkCUDA(hipEventRecord(t_start, stream));
   }
-  Internal::forward_kernel(m, input_ptr, output_ptr, stream);
+  if (m->output_type[0] == DT_FLOAT) {
+    Internal::forward_kernel(
+        m, input.get_float_ptr(), output.get_float_ptr(), stream);
+  } else if (m->output_type[0] == DT_HALF) {
+    Internal::forward_kernel(
+        m, input.get_half_ptr(), output.get_half_ptr(), stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
   if (m->profiling) {
     checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
@@ -70,11 +76,9 @@ void forward_kernel_wrapper(SoftmaxMeta const *m,
   }
 }
 
-template <typename DT>
 void backward_kernel_wrapper(SoftmaxMeta const *m,
-                             DT *input_grad_ptr,
-                             DT const *output_grad_ptr,
-                             size_t num_elements) {
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &output_grad) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -84,8 +88,22 @@ void backward_kernel_wrapper(SoftmaxMeta const *m,
     checkCUDA(hipEventCreate(&t_end));
     checkCUDA(hipEventRecord(t_start, stream));
   }
-  Internal::backward_kernel(
-      input_grad_ptr, output_grad_ptr, num_elements, stream);
+  assert(input_grad.domain == output_grad.domain);
+  if (m->output_type[0] == DT_FLOAT) {
+    Internal::backward_kernel(m,
+                              input_grad.get_float_ptr(),
+                              output_grad.get_float_ptr(),
+                              output_grad.domain.get_volume(),
+                              stream);
+  } else if (m->output_type[0] == DT_HALF) {
+    Internal::backward_kernel(m,
+                              input_grad.get_half_ptr(),
+                              output_grad.get_half_ptr(),
+                              output_grad.domain.get_volume(),
+                              stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
   if (m->profiling) {
     checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
@@ -101,21 +119,112 @@ void backward_kernel_wrapper(SoftmaxMeta const *m,
   }
 }
 
-template void forward_kernel_wrapper<float>(SoftmaxMeta const *m,
-                                            float const *input_ptr,
-                                            float *output_ptr);
-template void forward_kernel_wrapper<half>(SoftmaxMeta const *m,
-                                           half const *input_ptr,
-                                           half *output_ptr);
-
-template void backward_kernel_wrapper<float>(SoftmaxMeta const *m,
-                                             float *input_grad_ptr,
-                                             float const *output_grad_ptr,
-                                             size_t num_elements);
-template void backward_kernel_wrapper<half>(SoftmaxMeta const *m,
-                                            half *input_grad_ptr,
-                                            half const *output_grad_ptr,
-                                            size_t num_elements);
+void inference_kernel_wrapper(SoftmaxMeta const *m,
+                              BatchConfig const *bc,
+                              bool is_last_op,
+                              GenericTensorAccessorR const &input,
+                              GenericTensorAccessorW const &output,
+                              GenericTensorAccessorW const &output_grad) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+  int num_classes = output.domain.hi()[0] - output.domain.lo()[0] + 1;
+  if (m->output_type[0] == DT_FLOAT) {
+    Internal::inference_kernel(m,
+                               bc,
+                               input.get_float_ptr(),
+                               output.get_float_ptr(),
+                               num_classes,
+                               stream);
+    if (is_last_op) {
+      checkCUDA(hipMemcpyAsync(output_grad.get_float_ptr(),
+                               output.get_float_ptr(),
+                               output.domain.get_volume() * sizeof(float),
+                               hipMemcpyDeviceToDevice,
+                               stream));
+    }
+  } else if (m->output_type[0] == DT_HALF) {
+    Internal::inference_kernel(m,
+                               bc,
+                               input.get_half_ptr(),
+                               output.get_half_ptr(),
+                               num_classes,
+                               stream);
+    if (is_last_op) {
+      checkCUDA(hipMemcpyAsync(output_grad.get_half_ptr(),
+                               output.get_half_ptr(),
+                               output.domain.get_volume() * sizeof(half),
+                               hipMemcpyDeviceToDevice,
+                               stream));
+    }
+  } else {
+    assert(false && "Unsupported data type");
+  }
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    // print_tensor<float>(acc_input.ptr, acc_input.rect.volume(),
+    // "[Softmax:forward:input]"); print_tensor<float>(acc_output.ptr,
+    // acc_output.rect.volume(), "[Softmax:forward:output]");
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    log_measure.debug(
+        "%s [Softmax] inference time = %.2fms\n", m->op_name, elapsed);
+  }
+}
+
+void peft_bwd_kernel_wrapper(SoftmaxMeta const *m,
+                             BatchConfig const *bc,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &output_grad) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+
+  int num_classes = output_grad.domain.hi()[0] - output_grad.domain.lo()[0] + 1;
+  if (m->output_type[0] == DT_FLOAT) {
+    Internal::peft_bwd_kernel(m,
+                              bc,
+                              input_grad.get_float_ptr(),
+                              output_grad.get_float_ptr(),
+                              num_classes,
+                              stream);
+  } else if (m->output_type[0] == DT_HALF) {
+    Internal::peft_bwd_kernel(m,
+                              bc,
+                              input_grad.get_half_ptr(),
+                              output_grad.get_half_ptr(),
+                              num_classes,
+                              stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    // print_tensor<float>(acc_input.ptr, acc_input.rect.volume(),
+    // "[Softmax:forward:input]"); print_tensor<float>(acc_output.ptr,
+    // acc_output.rect.volume(), "[Softmax:forward:output]");
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    log_measure.debug(
+        "%s [Softmax] inference time = %.2fms\n", m->op_name, elapsed);
+  }
+}
 
 namespace Internal {
 template <typename DT>
@@ -138,7 +247,8 @@ void forward_kernel(SoftmaxMeta const *m,
 }
 
 template <typename DT>
-void backward_kernel(DT *input_grad_ptr,
+void backward_kernel(SoftmaxMeta const *m,
+                     DT *input_grad_ptr,
                      DT const *output_grad_ptr,
                      size_t num_elements,
                      hipStream_t stream) {
@@ -149,6 +259,116 @@ void backward_kernel(DT *input_grad_ptr,
                            stream));
 }
 
+template <typename DT>
+void inference_kernel(SoftmaxMeta const *m,
+                      BatchConfig const *bc,
+                      DT const *input_ptr,
+                      DT *output_ptr,
+                      int num_classes,
+                      hipStream_t stream) {
+  checkCUDNN(miopenSetStream(m->handle.dnn, stream));
+
+  float alpha = 1.0f, beta = 0.0f;
+  miopenDataType_t cudnn_data_type = ff_to_cudnn_datatype(m->output_type[0]);
+  checkCUDNN(miopenSet4dTensorDescriptor(m->outputTensor,
+                                         cudnn_data_type,
+                                         bc->num_active_tokens(),
+                                         num_classes,
+                                         1,
+                                         1));
+  checkCUDNN(miopenSoftmaxForward_V2(m->handle.dnn,
+                                     &alpha,
+                                     m->outputTensor,
+                                     input_ptr,
+                                     &beta,
+                                     m->outputTensor,
+                                     output_ptr,
+                                     MIOPEN_SOFTMAX_ACCURATE,
+                                     MIOPEN_SOFTMAX_MODE_CHANNEL));
+}
+
+template <typename DT>
+__global__ void sparse_categorical_crossentropy_loss_peft_backward(
+    DT *input_grad,
+    DT const *output_grad,
+    BatchConfig::TokenId const *token_ids,
+    int num_tokens,
+    int num_classes) {
+  CUDA_KERNEL_LOOP(i, num_tokens * num_classes) {
+    int class_idx = i % num_classes;
+    int token_idx = i / num_classes;
+    input_grad[i] = output_grad[i];
+    if (class_idx == token_ids[token_idx]) {
+      input_grad[i] = input_grad[i] - (DT)1.0f;
+    }
+  }
+}
+
+template <typename DT>
+void peft_bwd_kernel(SoftmaxMeta const *m,
+                     BatchConfig const *bc,
+                     DT *input_grad_ptr,
+                     DT const *output_grad_ptr,
+                     int num_classes,
+                     hipStream_t stream) {
+  BatchConfig::TokenId token_ids[BatchConfig::MAX_NUM_TOKENS];
+  int tokens_previous_requests = 0;
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    // Skip non-PEFT requests
+    if (!bc->requestsInfo[i].peft_bwd) {
+      tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
+      continue;
+    }
+    int num_bwd_tokens = bc->requestsInfo[i].num_tokens_in_batch - 1;
+    // shift labels by 1 position to the left (ignore first token label)
+    for (int j = 0; j < num_bwd_tokens; j++) {
+      token_ids[j] = bc->tokensInfo[j + tokens_previous_requests + 1].token_id;
+    }
+
+    DT scale_factor = 1.0 / (bc->requestsInfo[i].num_tokens_in_batch - 1);
+    // ignore last token
+    checkCUDA(hipMemsetAsync(input_grad_ptr +
+                                 (tokens_previous_requests +
+                                  bc->requestsInfo[i].num_tokens_in_batch - 1) *
+                                     num_classes,
+                             0,
+                             num_classes * sizeof(DT),
+                             stream));
+    checkCUDA(hipMemcpyAsync(m->handle.workSpace,
+                             token_ids,
+                             sizeof(BatchConfig::TokenId) * num_bwd_tokens,
+                             hipMemcpyHostToDevice,
+                             stream));
+    hipLaunchKernelGGL(
+        HIP_KERNEL_NAME(sparse_categorical_crossentropy_loss_peft_backward<DT>),
+        GET_BLOCKS(num_bwd_tokens * num_classes),
+        CUDA_NUM_THREADS,
+        0,
+        stream,
+        input_grad_ptr + tokens_previous_requests * num_classes,
+        output_grad_ptr + tokens_previous_requests * num_classes,
+        static_cast<BatchConfig::TokenId const *>(m->handle.workSpace),
+        num_bwd_tokens,
+        num_classes);
+    // scale
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(scale_kernel<DT>),
+                       GET_BLOCKS(num_bwd_tokens * num_classes),
+                       CUDA_NUM_THREADS,
+                       0,
+                       stream,
+                       input_grad_ptr + tokens_previous_requests * num_classes,
+                       num_bwd_tokens * num_classes,
+                       DT(0.0),
+                       scale_factor);
+
+    tokens_previous_requests += num_bwd_tokens + 1;
+  }
+  assert(tokens_previous_requests == bc->num_active_tokens());
+}
+
 } // namespace Internal
 } // namespace Softmax
 } // namespace Kernels
diff --git a/src/ops/kernels/softmax.cu b/src/ops/kernels/softmax.cu
index e47006cc9d..16f1219bf6 100644
--- a/src/ops/kernels/softmax.cu
+++ b/src/ops/kernels/softmax.cu
@@ -24,7 +24,7 @@ using Legion::Domain;
 SoftmaxMeta::SoftmaxMeta(FFHandler handler,
                          Softmax const *softmax,
                          Domain const &input_domain)
-    : OpMeta(handler) {
+    : OpMeta(handler, softmax) {
   checkCUDNN(cudnnCreateTensorDescriptor(&inputTensor));
   checkCUDNN(cudnnSetTensorDescriptorFromDomain4SoftMax(
       inputTensor, input_domain, softmax->data_type));
@@ -40,10 +40,9 @@ SoftmaxMeta::SoftmaxMeta(FFHandler handler,
 namespace Kernels {
 namespace Softmax {
 
-template <typename DT>
 void forward_kernel_wrapper(SoftmaxMeta const *m,
-                            DT const *input_ptr,
-                            DT *output_ptr) {
+                            GenericTensorAccessorR const &input,
+                            GenericTensorAccessorW const &output) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   cudaEvent_t t_start, t_end;
@@ -52,7 +51,15 @@ void forward_kernel_wrapper(SoftmaxMeta const *m,
     cudaEventCreate(&t_end);
     cudaEventRecord(t_start, stream);
   }
-  Internal::forward_kernel(m, input_ptr, output_ptr, stream);
+  if (m->output_type[0] == DT_FLOAT) {
+    Internal::forward_kernel(
+        m, input.get_float_ptr(), output.get_float_ptr(), stream);
+  } else if (m->output_type[0] == DT_HALF) {
+    Internal::forward_kernel(
+        m, input.get_half_ptr(), output.get_half_ptr(), stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
     checkCUDA(cudaEventSynchronize(t_end));
@@ -68,11 +75,9 @@ void forward_kernel_wrapper(SoftmaxMeta const *m,
   }
 }
 
-template <typename DT>
 void backward_kernel_wrapper(SoftmaxMeta const *m,
-                             DT *input_grad_ptr,
-                             DT const *output_grad_ptr,
-                             size_t num_elements) {
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &output_grad) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
 
@@ -82,8 +87,22 @@ void backward_kernel_wrapper(SoftmaxMeta const *m,
     cudaEventCreate(&t_end);
     cudaEventRecord(t_start, stream);
   }
-  Internal::backward_kernel(
-      input_grad_ptr, output_grad_ptr, num_elements, stream);
+  assert(input_grad.domain == output_grad.domain);
+  if (m->output_type[0] == DT_FLOAT) {
+    Internal::backward_kernel(m,
+                              input_grad.get_float_ptr(),
+                              output_grad.get_float_ptr(),
+                              output_grad.domain.get_volume(),
+                              stream);
+  } else if (m->output_type[0] == DT_HALF) {
+    Internal::backward_kernel(m,
+                              input_grad.get_half_ptr(),
+                              output_grad.get_half_ptr(),
+                              output_grad.domain.get_volume(),
+                              stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
     checkCUDA(cudaEventSynchronize(t_end));
@@ -99,21 +118,113 @@ void backward_kernel_wrapper(SoftmaxMeta const *m,
   }
 }
 
-template void forward_kernel_wrapper<float>(SoftmaxMeta const *m,
-                                            float const *input_ptr,
-                                            float *output_ptr);
-template void forward_kernel_wrapper<half>(SoftmaxMeta const *m,
-                                           half const *input_ptr,
-                                           half *output_ptr);
-
-template void backward_kernel_wrapper<float>(SoftmaxMeta const *m,
-                                             float *input_grad_ptr,
-                                             float const *output_grad_ptr,
-                                             size_t num_elements);
-template void backward_kernel_wrapper<half>(SoftmaxMeta const *m,
-                                            half *input_grad_ptr,
-                                            half const *output_grad_ptr,
-                                            size_t num_elements);
+void inference_kernel_wrapper(SoftmaxMeta const *m,
+                              BatchConfig const *bc,
+                              bool is_last_op,
+                              GenericTensorAccessorR const &input,
+                              GenericTensorAccessorW const &output,
+                              GenericTensorAccessorW const &output_grad) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+  int num_classes = output.domain.hi()[0] - output.domain.lo()[0] + 1;
+  if (m->output_type[0] == DT_FLOAT) {
+    Internal::inference_kernel(m,
+                               bc,
+                               input.get_float_ptr(),
+                               output.get_float_ptr(),
+                               num_classes,
+                               stream);
+    if (is_last_op) {
+      checkCUDA(cudaMemcpyAsync(output_grad.get_float_ptr(),
+                                output.get_float_ptr(),
+                                output.domain.get_volume() * sizeof(float),
+                                cudaMemcpyDeviceToDevice,
+                                stream));
+    }
+  } else if (m->output_type[0] == DT_HALF) {
+    Internal::inference_kernel(m,
+                               bc,
+                               input.get_half_ptr(),
+                               output.get_half_ptr(),
+                               num_classes,
+                               stream);
+    if (is_last_op) {
+      checkCUDA(cudaMemcpyAsync(output_grad.get_half_ptr(),
+                                output.get_half_ptr(),
+                                output.domain.get_volume() * sizeof(half),
+                                cudaMemcpyDeviceToDevice,
+                                stream));
+    }
+  } else {
+    assert(false && "Unsupported data type");
+  }
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    // print_tensor<float>(acc_input.ptr, acc_input.rect.volume(),
+    // "[Softmax:forward:input]"); print_tensor<float>(acc_output.ptr,
+    // acc_output.rect.volume(), "[Softmax:forward:output]");
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    log_measure.debug(
+        "%s [Softmax] inference time = %.2fms\n", m->op_name, elapsed);
+  }
+}
+
+void peft_bwd_kernel_wrapper(SoftmaxMeta const *m,
+                             BatchConfig const *bc,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &output_grad) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+
+  int num_classes = output_grad.domain.hi()[0] - output_grad.domain.lo()[0] + 1;
+  if (m->output_type[0] == DT_FLOAT) {
+    Internal::peft_bwd_kernel(m,
+                              bc,
+                              input_grad.get_float_ptr(),
+                              output_grad.get_float_ptr(),
+                              num_classes,
+                              stream);
+  } else if (m->output_type[0] == DT_HALF) {
+    Internal::peft_bwd_kernel(m,
+                              bc,
+                              input_grad.get_half_ptr(),
+                              output_grad.get_half_ptr(),
+                              num_classes,
+                              stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    // print_tensor<float>(acc_input.ptr, acc_input.rect.volume(),
+    // "[Softmax:forward:input]"); print_tensor<float>(acc_output.ptr,
+    // acc_output.rect.volume(), "[Softmax:forward:output]");
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    log_measure.debug(
+        "%s [Softmax] inference time = %.2fms\n", m->op_name, elapsed);
+  }
+}
+
 namespace Internal {
 template <typename DT>
 void forward_kernel(SoftmaxMeta const *m,
@@ -135,7 +246,8 @@ void forward_kernel(SoftmaxMeta const *m,
 }
 
 template <typename DT>
-void backward_kernel(DT *input_grad_ptr,
+void backward_kernel(SoftmaxMeta const *m,
+                     DT *input_grad_ptr,
                      DT const *output_grad_ptr,
                      size_t num_elements,
                      cudaStream_t stream) {
@@ -146,6 +258,115 @@ void backward_kernel(DT *input_grad_ptr,
                             stream));
 }
 
+template <typename DT>
+void inference_kernel(SoftmaxMeta const *m,
+                      BatchConfig const *bc,
+                      DT const *input_ptr,
+                      DT *output_ptr,
+                      int num_classes,
+                      cudaStream_t stream) {
+  checkCUDNN(cudnnSetStream(m->handle.dnn, stream));
+
+  float alpha = 1.0f, beta = 0.0f;
+  cudnnDataType_t cudnn_data_type = ff_to_cudnn_datatype(m->output_type[0]);
+  checkCUDNN(cudnnSetTensor4dDescriptor(m->outputTensor,
+                                        CUDNN_TENSOR_NCHW,
+                                        cudnn_data_type,
+                                        bc->num_active_tokens(),
+                                        num_classes,
+                                        1,
+                                        1));
+  checkCUDNN(cudnnSoftmaxForward(m->handle.dnn,
+                                 CUDNN_SOFTMAX_ACCURATE,
+                                 CUDNN_SOFTMAX_MODE_CHANNEL,
+                                 &alpha,
+                                 m->outputTensor,
+                                 input_ptr,
+                                 &beta,
+                                 m->outputTensor,
+                                 output_ptr));
+}
+
+template <typename DT>
+__global__ void sparse_categorical_crossentropy_loss_peft_backward(
+    DT *input_grad,
+    DT const *output_grad,
+    BatchConfig::TokenId const *token_ids,
+    int num_tokens,
+    int num_classes) {
+  CUDA_KERNEL_LOOP(i, num_tokens * num_classes) {
+    int class_idx = i % num_classes;
+    int token_idx = i / num_classes;
+    input_grad[i] = output_grad[i];
+    if (class_idx == token_ids[token_idx]) {
+      input_grad[i] = input_grad[i] - (DT)1.0f;
+    }
+  }
+}
+
+template <typename DT>
+void peft_bwd_kernel(SoftmaxMeta const *m,
+                     BatchConfig const *bc,
+                     DT *input_grad_ptr,
+                     DT const *output_grad_ptr,
+                     int num_classes,
+                     cudaStream_t stream) {
+  BatchConfig::TokenId token_ids[BatchConfig::MAX_NUM_TOKENS];
+  int tokens_previous_requests = 0;
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    // Skip non-PEFT requests
+    if (!bc->requestsInfo[i].peft_bwd) {
+      tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
+      continue;
+    }
+    int num_bwd_tokens = bc->requestsInfo[i].num_tokens_in_batch - 1;
+    // shift labels by 1 position to the left (ignore first token label)
+    for (int j = 0; j < num_bwd_tokens; j++) {
+      token_ids[j] = bc->tokensInfo[j + tokens_previous_requests + 1].token_id;
+    }
+
+    DT scale_factor = 1.0 / (bc->requestsInfo[i].num_tokens_in_batch - 1);
+    // ignore last token
+    checkCUDA(cudaMemsetAsync(
+        input_grad_ptr + (tokens_previous_requests +
+                          bc->requestsInfo[i].num_tokens_in_batch - 1) *
+                             num_classes,
+        0,
+        num_classes * sizeof(DT),
+        stream));
+    checkCUDA(cudaMemcpyAsync(m->handle.workSpace,
+                              token_ids,
+                              sizeof(BatchConfig::TokenId) * num_bwd_tokens,
+                              cudaMemcpyHostToDevice,
+                              stream));
+    sparse_categorical_crossentropy_loss_peft_backward<<<
+        GET_BLOCKS(num_bwd_tokens * num_classes),
+        CUDA_NUM_THREADS,
+        0,
+        stream>>>(
+        input_grad_ptr + tokens_previous_requests * num_classes,
+        output_grad_ptr + tokens_previous_requests * num_classes,
+        static_cast<BatchConfig::TokenId const *>(m->handle.workSpace),
+        num_bwd_tokens,
+        num_classes);
+    // scale
+    scale_kernel<<<GET_BLOCKS(num_bwd_tokens * num_classes),
+                   CUDA_NUM_THREADS,
+                   0,
+                   stream>>>(input_grad_ptr +
+                                 tokens_previous_requests * num_classes,
+                             num_bwd_tokens * num_classes,
+                             DT(0.0),
+                             scale_factor);
+
+    tokens_previous_requests += num_bwd_tokens + 1;
+  }
+  assert(tokens_previous_requests == bc->num_active_tokens());
+}
+
 } // namespace Internal
 } // namespace Softmax
 } // namespace Kernels
diff --git a/src/ops/kernels/transpose_kernels.cpp b/src/ops/kernels/transpose_kernels.cpp
index 49a7d827f5..199e1cd0c1 100644
--- a/src/ops/kernels/transpose_kernels.cpp
+++ b/src/ops/kernels/transpose_kernels.cpp
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/ops/kernels/transpose_kernels.h"
+#include "flexflow/ops/transpose.h"
 #include "flexflow/utils/hip_helper.h"
 #include <hip/hip_runtime.h>
 
@@ -22,6 +23,9 @@ namespace FlexFlow {
 using Legion::coord_t;
 using Legion::Domain;
 
+TransposeMeta::TransposeMeta(FFHandler handler, Transpose const *transpose)
+    : OpMeta(handler, transpose) {}
+
 struct TransposeStrides {
   int num_dim;
   int in_strides[MAX_TENSOR_DIM], out_strides[MAX_TENSOR_DIM],
diff --git a/src/ops/kernels/transpose_kernels.cu b/src/ops/kernels/transpose_kernels.cu
index b401ff0ba1..18a6e405af 100644
--- a/src/ops/kernels/transpose_kernels.cu
+++ b/src/ops/kernels/transpose_kernels.cu
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/ops/kernels/transpose_kernels.h"
+#include "flexflow/ops/transpose.h"
 #include "flexflow/utils/cuda_helper.h"
 
 namespace FlexFlow {
@@ -21,6 +22,9 @@ namespace FlexFlow {
 using Legion::coord_t;
 using Legion::Domain;
 
+TransposeMeta::TransposeMeta(FFHandler handler, Transpose const *transpose)
+    : OpMeta(handler, transpose) {}
+
 struct TransposeStrides {
   int num_dim;
   int in_strides[MAX_TENSOR_DIM], out_strides[MAX_TENSOR_DIM],
diff --git a/src/ops/layer_norm.cc b/src/ops/layer_norm.cc
index b19f400eb2..3161987d60 100644
--- a/src/ops/layer_norm.cc
+++ b/src/ops/layer_norm.cc
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/ops/layer_norm.h"
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/model.h"
 #include "flexflow/utils/hash_utils.h"
 #include "legion/legion_utilities.h"
@@ -56,7 +57,7 @@ LayerNormParams LayerNorm::get_params() const {
   params.elementwise_affine = this->elementwise_affine;
   params.eps = this->eps;
   params.use_bias = this->use_bias;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
@@ -561,7 +562,7 @@ void LayerNorm::inference_task(Task const *task,
     assert(regions.size() == 2);
   }
 
-  LayerNorm::forward_kernel_wrapper(m, in, out, gamma, beta);
+  LayerNorm::inference_kernel_wrapper(m, bc, in, out, gamma, beta);
 
   if (m->inference_debugging) {
     assert(task->index_point.get_dim() == 1);
@@ -645,6 +646,104 @@ void LayerNorm::forward_task(Task const *task,
   LayerNorm::forward_kernel_wrapper(m, in, out, gamma, beta);
 }
 
+Legion::FutureMap
+    LayerNorm::peft_bwd(FFModel const &ff,
+                        BatchConfigFuture const &bc,
+                        std::vector<ParallelTensor> const &batch_inputs,
+                        std::vector<ParallelTensor> const &batch_outputs,
+                        MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+  /* std::cout << "LayerNorm op machine_view: " << *(MachineView const *)mv
+            << std::endl; */
+  IndexLauncher launcher(LAYERNORM_PEFT_BWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
+  // regions[0](I): output_grad
+  launcher.add_region_requirement(
+      RegionRequirement(batch_outputs[0]->part_grad,
+                        0 /*projection id*/,
+                        READ_WRITE,
+                        EXCLUSIVE,
+                        batch_outputs[0]->region_grad));
+  launcher.add_field(0, FID_DATA);
+  // regions[1](I/O): input_grad
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[0]->part_grad,
+                        0 /*projection id*/,
+                        READ_WRITE,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region_grad));
+  launcher.add_field(2, FID_DATA);
+  if (elementwise_affine) {
+    // regions[2](I): gamma
+    launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[0]->region));
+    launcher.add_field(3, FID_DATA);
+  }
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+/*
+  regions[0](I): output_grad
+  regions[1](I/O): input_grad
+  regions[2](I): gamma
+*/
+void LayerNorm::peft_bwd_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_active_peft_tokens() == 0) {
+    return;
+  }
+  LayerNormMeta const *m = *((LayerNormMeta **)task->local_args);
+  assert(task->regions.size() == regions.size());
+
+  GenericTensorAccessorR output_grad = helperGetGenericTensorAccessorRO(
+      m->output_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW input_grad = helperGetGenericTensorAccessorRW(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR gamma;
+  GenericTensorAccessorW gamma_grad, beta_grad;
+
+  Domain out_grad_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  Domain in_grad_domain = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+
+  if (m->elementwise_affine) {
+    assert(m->use_bias == (regions.size() == 3));
+    gamma = helperGetGenericTensorAccessorRO(m->output_type[0],
+                                             regions[2],
+                                             task->regions[2],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
+    Domain gamma_domain = runtime->get_index_space_domain(
+        ctx, task->regions[2].region.get_index_space());
+
+    assert(gamma_domain.get_volume() == m->effective_num_elements);
+  } else {
+    assert(regions.size() == 2);
+  }
+  LayerNorm::peft_bwd_kernel_wrapper(m, output_grad, input_grad, gamma);
+}
+
 void LayerNorm::backward(FFModel const &ff) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
@@ -722,55 +821,60 @@ void LayerNorm::backward_task(Task const *task,
                               Runtime *runtime) {
   LayerNormMeta const *m = *((LayerNormMeta **)task->local_args);
   assert(task->regions.size() == regions.size());
-  float const *in_ptr = NULL, *out_grad_ptr = NULL, *gamma_ptr = NULL;
-  float *in_grad_ptr = NULL, *gamma_grad_ptr = NULL, *beta_grad_ptr = NULL;
+  GenericTensorAccessorR output_grad = helperGetGenericTensorAccessorRO(
+      m->output_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW input_grad = helperGetGenericTensorAccessorRW(
+      m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR gamma;
+  GenericTensorAccessorW gamma_grad, beta_grad;
   Domain out_grad_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
-  out_grad_ptr = helperGetTensorPointerRO<float>(
-      regions[0], task->regions[0], FID_DATA, ctx, runtime);
   Domain in_domain = runtime->get_index_space_domain(
       ctx, task->regions[1].region.get_index_space());
-  in_ptr = helperGetTensorPointerRO<float>(
-      regions[1], task->regions[1], FID_DATA, ctx, runtime);
   Domain in_grad_domain = runtime->get_index_space_domain(
       ctx, task->regions[2].region.get_index_space());
-  in_grad_ptr = helperGetTensorPointerRW<float>(
-      regions[2], task->regions[2], FID_DATA, ctx, runtime);
   assert(in_domain == out_grad_domain);
   assert(in_domain.get_volume() ==
          m->effective_num_elements * m->effective_batch_size);
+
   if (m->elementwise_affine) {
     assert(m->use_bias == (regions.size() == 6));
+    gamma = helperGetGenericTensorAccessorRO(m->output_type[0],
+                                             regions[3],
+                                             task->regions[3],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
+    gamma_grad = helperGetGenericTensorAccessorRW(m->output_type[0],
+                                                  regions[4],
+                                                  task->regions[4],
+                                                  FID_DATA,
+                                                  ctx,
+                                                  runtime);
     Domain gamma_domain = runtime->get_index_space_domain(
         ctx, task->regions[3].region.get_index_space());
-    gamma_ptr = helperGetTensorPointerRO<float>(
-        regions[3], task->regions[3], FID_DATA, ctx, runtime);
     Domain gamma_grad_domain = runtime->get_index_space_domain(
         ctx, task->regions[4].region.get_index_space());
-    gamma_grad_ptr = helperGetTensorPointerRW<float>(
-        regions[4], task->regions[4], FID_DATA, ctx, runtime);
     if (m->use_bias) {
       Domain beta_grad_domain = runtime->get_index_space_domain(
           ctx, task->regions[5].region.get_index_space());
-      beta_grad_ptr = helperGetTensorPointerRW<float>(
-          regions[5], task->regions[5], FID_DATA, ctx, runtime);
+      beta_grad = helperGetGenericTensorAccessorRW(m->output_type[0],
+                                                   regions[5],
+                                                   task->regions[5],
+                                                   FID_DATA,
+                                                   ctx,
+                                                   runtime);
       assert(gamma_domain == beta_grad_domain);
     }
-
     assert(gamma_domain == gamma_grad_domain);
-
     assert(gamma_domain.get_volume() == m->effective_num_elements);
   } else {
     assert(regions.size() == 3);
   }
-
-  LayerNorm::backward_kernel_wrapper<float>(m,
-                                            out_grad_ptr,
-                                            in_ptr,
-                                            in_grad_ptr,
-                                            gamma_ptr,
-                                            gamma_grad_ptr,
-                                            beta_grad_ptr);
+  LayerNorm::backward_kernel_wrapper(
+      m, output_grad, input, input_grad, gamma, gamma_grad, beta_grad);
 }
 
 bool LayerNorm::measure_operator_cost(Simulator *sim,
@@ -785,7 +889,8 @@ bool LayerNorm::measure_operator_cost(Simulator *sim,
   }
   Domain input_domain = sub_input.get_domain();
   Domain output_domain = sub_output.get_domain();
-  LayerNormMeta *m = sim->layernorm_meta;
+  MemoryAllocator gpu_mem_allocator(sim->memory);
+  LayerNormMeta *m = new LayerNormMeta(sim->handler, this, gpu_mem_allocator);
 
   sim->free_all();
   float *in_ptr = (float *)sim->allocate(sub_input.get_volume(), DT_FLOAT);
@@ -821,16 +926,24 @@ bool LayerNorm::measure_operator_cost(Simulator *sim,
   if (sim->computationMode == COMP_MODE_TRAINING) {
     float *in_grad_ptr =
         (float *)sim->allocate(sub_input.get_volume(), DT_FLOAT);
+    GenericTensorAccessorW in_grad_acc(
+        inputs[0]->data_type, input_domain, in_grad_ptr);
     assert(in_grad_ptr != NULL);
     cost_metrics.inputs_memory += cost_metrics.total_mem_diff_from(sim->offset);
 
     float *out_grad_ptr = NULL;
     out_grad_ptr = (float *)sim->allocate(sub_output.get_volume(), DT_FLOAT);
+    GenericTensorAccessorR out_grad_acc(
+        outputs[0]->data_type, output_domain, out_grad_ptr);
     assert(out_grad_ptr != NULL);
     cost_metrics.outputs_memory +=
         cost_metrics.total_mem_diff_from(sim->offset);
 
     float *gamma_grad_ptr = NULL, *beta_grad_ptr = NULL;
+    GenericTensorAccessorW gamma_grad_acc(
+        outputs[0]->data_type, output_domain, gamma_grad_ptr);
+    GenericTensorAccessorW beta_grad_acc(
+        outputs[0]->data_type, output_domain, beta_grad_ptr);
 
     out_of_memory = (in_grad_ptr == NULL) || (out_grad_ptr == NULL) ||
                     (((gamma_grad_ptr == NULL) || (beta_grad_ptr == NULL)) &&
@@ -842,13 +955,13 @@ bool LayerNorm::measure_operator_cost(Simulator *sim,
     }
 
     backward = [=] {
-      backward_kernel_wrapper<float>(m,
-                                     out_grad_ptr,
-                                     in_ptr,
-                                     in_grad_ptr,
-                                     gamma_ptr,
-                                     gamma_grad_ptr,
-                                     beta_grad_ptr);
+      backward_kernel_wrapper(m,
+                              out_grad_acc,
+                              input1_acc,
+                              in_grad_acc,
+                              gamma_acc,
+                              gamma_grad_acc,
+                              beta_grad_acc);
     };
   }
 
diff --git a/src/ops/layer_norm.cpp b/src/ops/layer_norm.cpp
index 07dbdb3dfb..27d314e21e 100644
--- a/src/ops/layer_norm.cpp
+++ b/src/ops/layer_norm.cpp
@@ -14,6 +14,7 @@
  */
 
 #include "flexflow/ops/layer_norm.h"
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/utils/hip_helper.h"
 #include <hip/hip_runtime.h>
 
@@ -27,21 +28,37 @@ constexpr int kColwiseReduceTileSize = 32;
 LayerNormMeta::LayerNormMeta(FFHandler handle,
                              LayerNorm const *ln,
                              MemoryAllocator &gpu_mem_allocator)
-    : OpMeta(handle) {
+    : OpMeta(handle, ln) {
   elementwise_affine = ln->elementwise_affine;
+  use_bias = ln->use_bias;
   effective_batch_size = ln->effective_batch_size;
   effective_num_elements = ln->effective_num_elements;
-  use_bias = ln->use_bias;
+  profiling = ln->profiling;
+  inference_debugging = ln->inference_debugging;
   eps = ln->eps;
-  checkCUDA(hipMalloc(&mean_ptr, sizeof(float) * effective_batch_size));
-  checkCUDA(hipMalloc(&rstd_ptr, sizeof(float) * effective_batch_size));
-  checkCUDA(hipMalloc(&ds_ptr, sizeof(float) * effective_batch_size));
-  checkCUDA(hipMalloc(&db_ptr, sizeof(float) * effective_batch_size));
-  checkCUDA(hipMalloc(&scale_ptr, sizeof(float) * effective_batch_size));
-  checkCUDA(hipMalloc(&bias_ptr, sizeof(float) * effective_batch_size));
+  DataType data_type = ln->data_type;
+  size_t totalSize = effective_batch_size * data_type_size(data_type) * 6;
+  gpu_mem_allocator.create_legion_instance(reserveInst, totalSize);
+  mean_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+  rstd_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+  ds_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+  db_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+  scale_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+  bias_ptr = gpu_mem_allocator.allocate_instance_untyped(
+      data_type_size(data_type) * effective_batch_size);
+  allocated_peft_buffer_size = 0;
 }
 
-LayerNormMeta::~LayerNormMeta(void) {}
+LayerNormMeta::~LayerNormMeta(void) {
+  if (reserveInst != Realm::RegionInstance::NO_INST) {
+    reserveInst.destroy();
+  }
+}
 
 template <typename T>
 __device__ __forceinline__ T WARP_SHFL_DOWN(T value,
@@ -74,7 +91,7 @@ __inline__ __device__ T BlockReduceSum(T val, T *shared) {
     shared[wid] = val;
   }
   __syncthreads();
-  val = (threadIdx.x < blockDim.x / C10_WARP_SIZE) ? shared[lid] : 0;
+  val = (threadIdx.x < (blockDim.x / C10_WARP_SIZE)) ? shared[lid] : T(0);
   if (wid == 0) {
     val = WarpReduceSum(val);
   }
@@ -82,8 +99,14 @@ __inline__ __device__ T BlockReduceSum(T val, T *shared) {
 }
 
 template <typename T>
-__global__ void RowwiseMomentsCUDAKernel(
-    int64_t N, float eps, T const *X, T *mean, T *rstd) {
+__global__ void LayerNormFusedForwardKernel(int64_t N,
+                                            float eps,
+                                            T const *X,
+                                            T *mean,
+                                            T *rstd,
+                                            T const *gamma,
+                                            T const *beta,
+                                            T *Y) {
   __shared__ float m_shared[C10_WARP_SIZE];
   __shared__ float v_shared[C10_WARP_SIZE];
   const int64_t i = blockIdx.x;
@@ -103,18 +126,10 @@ __global__ void RowwiseMomentsCUDAKernel(
     mean[i] = static_cast<T>(sum1);
     rstd[i] = static_cast<T>(rsqrt(sum2 + eps));
   }
-}
 
-template <typename T>
-__global__ void LayerNormForwardCUDAKernel(int64_t N,
-                                           T const *X,
-                                           T const *mean,
-                                           T const *rstd,
-                                           T const *gamma,
-                                           T const *beta,
-                                           T *Y) {
+  __syncthreads();
+
   using T_ACC = T;
-  const int64_t i = blockIdx.x;
   for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
     const int64_t index = i * N + j;
     const T_ACC gamma_v =
@@ -135,28 +150,19 @@ void LayerNorm::forward_kernel(LayerNormMeta const *m,
                                T const *gamma_ptr,
                                T const *beta_ptr,
                                hipStream_t stream) {
-  hipLaunchKernelGGL(HIP_KERNEL_NAME(RowwiseMomentsCUDAKernel<T>),
-                     m->effective_batch_size,
-                     kCUDABlockReduceNumThreads,
-                     0,
-                     stream,
-                     m->effective_num_elements,
-                     m->eps,
-                     in_ptr,
-                     static_cast<T *>(m->mean_ptr),
-                     static_cast<T *>(m->rstd_ptr));
-  hipLaunchKernelGGL(HIP_KERNEL_NAME(LayerNormForwardCUDAKernel<T>),
-                     m->effective_batch_size,
-                     kCUDANumThreads,
-                     0,
-                     stream,
-                     m->effective_num_elements,
-                     in_ptr,
-                     static_cast<T *>(m->mean_ptr),
-                     static_cast<T *>(m->rstd_ptr),
-                     gamma_ptr,
-                     beta_ptr,
-                     out_ptr);
+
+  LayerNormFusedForwardKernel<T>
+      <<<m->effective_batch_size,
+         std::min(CUDA_NUM_THREADS, (int)m->effective_num_elements),
+         0,
+         stream>>>(m->effective_num_elements,
+                   m->eps,
+                   in_ptr,
+                   static_cast<T *>(m->mean_ptr),
+                   static_cast<T *>(m->rstd_ptr),
+                   gamma_ptr,
+                   beta_ptr,
+                   out_ptr);
 }
 
 /*static*/
@@ -167,24 +173,154 @@ void LayerNorm::forward_kernel_wrapper(LayerNormMeta const *m,
                                        GenericTensorAccessorR const &beta) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
+
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
   if (m->input_type[0] == DT_FLOAT) {
-    LayerNorm::forward_kernel<float>(m,
-                                     input.get_float_ptr(),
-                                     output.get_float_ptr(),
-                                     gamma.get_float_ptr(),
-                                     m->use_bias ? beta.get_float_ptr()
-                                                 : nullptr,
-                                     stream);
+    LayerNorm::forward_kernel<float>(
+        m,
+        input.get_float_ptr(),
+        output.get_float_ptr(),
+        m->elementwise_affine ? gamma.get_float_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta.get_float_ptr() : nullptr,
+        stream);
   } else if (m->input_type[0] == DT_HALF) {
-    LayerNorm::forward_kernel<half>(m,
-                                    input.get_half_ptr(),
-                                    output.get_half_ptr(),
-                                    gamma.get_half_ptr(),
-                                    m->use_bias ? beta.get_half_ptr() : nullptr,
-                                    stream);
+    LayerNorm::forward_kernel<half>(
+        m,
+        input.get_half_ptr(),
+        output.get_half_ptr(),
+        m->elementwise_affine ? gamma.get_half_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta.get_half_ptr() : nullptr,
+        stream);
   } else {
     assert(false && "unsupport datatype in layernorm");
   }
+
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("[LayerNorm] forward time (CF) = %.9fms\n", elapsed);
+    // print_tensor<T>(in_ptr, 32, "[LayerNorm:forward:input]");
+    // print_tensor<T>(out_ptr, 32, "[LayerNorm:forward:output]");
+  }
+}
+
+/*static*/
+void LayerNorm::inference_kernel_wrapper(LayerNormMeta *m,
+                                         BatchConfig const *bc,
+                                         GenericTensorAccessorR const &input,
+                                         GenericTensorAccessorW &output,
+                                         GenericTensorAccessorR const &gamma,
+                                         GenericTensorAccessorR const &beta) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+
+  // save input activation if needed for PEFT
+  if (bc->num_active_peft_tokens() > 0) {
+    // Check that we have at most one request that requires peft_bwd
+    int num_peft_requests = 0;
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_bwd) {
+        num_peft_requests++;
+      }
+    }
+    assert(num_peft_requests <= 1);
+
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      // Skip non-PEFT requests
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        continue;
+      }
+      int num_peft_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+      int max_peft_tokens = bc->requestsInfo[i].max_sequence_length;
+      int first_token_offset = bc->requestsInfo[i].first_token_offset_in_batch;
+      int in_dim = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+      if (bc->requestsInfo[i].peft_bwd) {
+        size_t activation_size_needed =
+            data_type_size(m->input_type[0]) * max_peft_tokens * in_dim;
+        if (activation_size_needed > m->allocated_peft_buffer_size) {
+          MemoryAllocator *allocator = m->handle.peft_activation_allocator;
+          m->input_activation =
+              allocator->allocate_instance_untyped(activation_size_needed);
+          m->allocated_peft_buffer_size = activation_size_needed;
+        }
+        // copy input activation
+        if (m->input_type[0] == DT_FLOAT) {
+          checkCUDA(hipMemcpyAsync(
+              m->input_activation,
+              input.get_float_ptr() + first_token_offset * in_dim,
+              data_type_size(m->input_type[0]) * num_peft_tokens * in_dim,
+              hipMemcpyDeviceToDevice,
+              stream));
+        } else if (m->input_type[0] == DT_HALF) {
+          checkCUDA(hipMemcpyAsync(
+              m->input_activation,
+              input.get_half_ptr() + first_token_offset * in_dim,
+              data_type_size(m->input_type[0]) * num_peft_tokens * in_dim,
+              hipMemcpyDeviceToDevice,
+              stream));
+        } else {
+          assert(false && "unsupport datatype in layernorm");
+        }
+      }
+    }
+  }
+
+  if (m->input_type[0] == DT_FLOAT) {
+    LayerNorm::forward_kernel<float>(
+        m,
+        input.get_float_ptr(),
+        output.get_float_ptr(),
+        m->elementwise_affine ? gamma.get_float_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta.get_float_ptr() : nullptr,
+        stream);
+  } else if (m->input_type[0] == DT_HALF) {
+    LayerNorm::forward_kernel<half>(
+        m,
+        input.get_half_ptr(),
+        output.get_half_ptr(),
+        m->elementwise_affine ? gamma.get_half_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta.get_half_ptr() : nullptr,
+        stream);
+  } else {
+    assert(false && "unsupport datatype in layernorm");
+  }
+
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("[LayerNorm] forward time (CF) = %.9fms\n", elapsed);
+    // print_tensor<T>(in_ptr, 32, "[LayerNorm:forward:input]");
+    // print_tensor<T>(out_ptr, 32, "[LayerNorm:forward:output]");
+  }
 }
 
 template <typename T>
@@ -224,7 +360,7 @@ __global__ void ComputeGradientFusedParamsCUDAKernel(int64_t M,
   using T_ACC = T;
   const int64_t index = blockIdx.x * blockDim.x + threadIdx.x;
   if (index < M) {
-    const T_ACC s = T_ACC(1) / static_cast<T_ACC>(N);
+    const T_ACC s = T_ACC(1) / static_cast<T_ACC>((int)N);
     const T_ACC a = (db[index] * static_cast<T_ACC>(mean[index]) - ds[index]) *
                     static_cast<T_ACC>(rstd[index]) *
                     static_cast<T_ACC>(rstd[index]) *
@@ -235,27 +371,6 @@ __global__ void ComputeGradientFusedParamsCUDAKernel(int64_t M,
   }
 }
 
-template <typename T>
-__global__ void LayerNormBackwardCUDAKenrel(int64_t N,
-                                            T const *dY,
-                                            T const *X,
-                                            T const *gamma,
-                                            T const *a,
-                                            T const *b,
-                                            T const *c,
-                                            T *dX) {
-  using T_ACC = T;
-  const int64_t i = blockIdx.x;
-  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
-    const int64_t index = i * N + j;
-    const T_ACC gamma_v =
-        gamma == nullptr ? T_ACC(1) : static_cast<T_ACC>(gamma[j]);
-    dX[index] =
-        static_cast<T_ACC>(a[i]) * static_cast<T_ACC>(dY[index]) * gamma_v +
-        b[i] * static_cast<T_ACC>(X[index]) + c[i];
-  }
-}
-
 template <typename T>
 __global__ void GammaBetaBackwardSimpleCUDAKernel(int64_t M,
                                                   int64_t N,
@@ -452,116 +567,148 @@ void LayerNorm::backward_kernel(LayerNormMeta const *m,
                                 hipStream_t stream) {
   const int64_t M = m->effective_batch_size;
   const int64_t N = m->effective_num_elements;
-  hipLaunchKernelGGL(HIP_KERNEL_NAME(ComputeInternalGradientsCUDAKernel<T>),
-                     M,
-                     kCUDABlockReduceNumThreads,
-                     0,
-                     stream,
-                     N,
-                     output_grad_ptr,
-                     input_ptr,
-                     gamma_ptr,
-                     static_cast<T *>(m->ds_ptr),
-                     static_cast<T *>(m->db_ptr));
+  ComputeInternalGradientsCUDAKernel<T>
+      <<<M, kCUDABlockReduceNumThreads, 0, stream>>>(
+          N,
+          output_grad_ptr,
+          input_ptr,
+          gamma_ptr,
+          static_cast<T *>(m->ds_ptr),
+          static_cast<T *>(m->db_ptr));
   const int64_t B = (M + kCUDANumThreads - 1) / kCUDANumThreads;
-  hipLaunchKernelGGL(HIP_KERNEL_NAME(ComputeGradientFusedParamsCUDAKernel<T>),
-                     B,
-                     kCUDANumThreads,
-                     0,
-                     stream,
-                     M,
-                     N,
-                     static_cast<T *>(m->mean_ptr),
-                     static_cast<T *>(m->rstd_ptr),
-                     static_cast<T *>(m->ds_ptr),
-                     static_cast<T *>(m->db_ptr),
-                     static_cast<T *>(m->scale_ptr),
-                     static_cast<T *>(m->bias_ptr));
-
+  ComputeGradientFusedParamsCUDAKernel<T>
+      <<<B, kCUDANumThreads, 0, stream>>>(M,
+                                          N,
+                                          static_cast<T *>(m->mean_ptr),
+                                          static_cast<T *>(m->rstd_ptr),
+                                          static_cast<T *>(m->ds_ptr),
+                                          static_cast<T *>(m->db_ptr),
+                                          static_cast<T *>(m->scale_ptr),
+                                          static_cast<T *>(m->bias_ptr));
   int const warp_size = C10_WARP_SIZE;
   int const num_threads = 128;
   const dim3 blocks(M);
   int nshared = (num_threads / warp_size) * sizeof(T);
+  layer_norm_grad_input_kernel<<<blocks, num_threads, nshared, stream>>>(
+      output_grad_ptr,
+      input_ptr,
+      static_cast<T *>(m->mean_ptr),
+      static_cast<T *>(m->rstd_ptr),
+      gamma_ptr,
+      input_grad_ptr,
+      N);
 
-  hipLaunchKernelGGL(HIP_KERNEL_NAME(layer_norm_grad_input_kernel),
-                     blocks,
-                     num_threads,
-                     nshared,
-                     stream,
-                     output_grad_ptr,
-                     input_ptr,
-                     static_cast<T *>(m->mean_ptr),
-                     static_cast<T *>(m->rstd_ptr),
-                     gamma_ptr,
-                     input_grad_ptr,
-                     N);
   if (gamma_grad_ptr != NULL || beta_grad_ptr != NULL) {
     if (M < 512) {
       // For small batch size, do colwise reduce directly
       const int64_t B = (N + kCUDANumThreads - 1) / kCUDANumThreads;
-      hipLaunchKernelGGL(HIP_KERNEL_NAME(GammaBetaBackwardSimpleCUDAKernel<T>),
-                         B,
-                         kCUDANumThreads,
-                         0,
-                         stream,
-                         M,
-                         N,
-                         output_grad_ptr,
-                         input_ptr,
-                         static_cast<T *>(m->mean_ptr),
-                         static_cast<T *>(m->rstd_ptr),
-                         gamma_grad_ptr,
-                         beta_grad_ptr);
+      GammaBetaBackwardSimpleCUDAKernel<T>
+          <<<B, kCUDANumThreads, 0, stream>>>(M,
+                                              N,
+                                              output_grad_ptr,
+                                              input_ptr,
+                                              static_cast<T *>(m->mean_ptr),
+                                              static_cast<T *>(m->rstd_ptr),
+                                              gamma_grad_ptr,
+                                              beta_grad_ptr);
     } else {
       const int64_t B =
           (N + kColwiseReduceTileSize - 1) / kColwiseReduceTileSize;
       constexpr int kThreadX = kColwiseReduceTileSize;
       constexpr int kThreadY = kColwiseReduceTileSize / 2;
-      hipLaunchKernelGGL(HIP_KERNEL_NAME(GammaBetaBackwardCUDAKernel<T>),
-                         B,
-                         dim3(kThreadX, kThreadY),
-                         0,
-                         stream,
-                         M,
-                         N,
-                         output_grad_ptr,
-                         input_ptr,
-                         static_cast<T *>(m->mean_ptr),
-                         static_cast<T *>(m->rstd_ptr),
-                         gamma_grad_ptr,
-                         beta_grad_ptr);
+      GammaBetaBackwardCUDAKernel<T>
+          <<<B, dim3(kThreadX, kThreadY), 0, stream>>>(
+              M,
+              N,
+              output_grad_ptr,
+              input_ptr,
+              static_cast<T *>(m->mean_ptr),
+              static_cast<T *>(m->rstd_ptr),
+              gamma_grad_ptr,
+              beta_grad_ptr);
     }
   }
 }
 
 /*static*/
 template <typename T>
-void LayerNorm::backward_kernel_wrapper(LayerNormMeta const *m,
-                                        T const *output_grad_ptr,
-                                        T const *input_ptr,
-                                        T *input_grad_ptr,
-                                        T const *gamma_ptr,
-                                        T *gamma_grad_ptr,
-                                        T *beta_grad_ptr) {
+void LayerNorm::peft_bwd_kernel(LayerNormMeta const *m,
+                                T const *output_grad_ptr,
+                                T *input_grad_ptr,
+                                T const *gamma_ptr,
+                                hipStream_t stream) {
+  const int64_t M = m->effective_batch_size;
+  const int64_t N = m->effective_num_elements;
+  int const warp_size = C10_WARP_SIZE;
+  int const num_threads = 128;
+  const dim3 blocks(M);
+  int nshared = (num_threads / warp_size) * sizeof(T);
+  layer_norm_grad_input_kernel<<<blocks, num_threads, nshared, stream>>>(
+      output_grad_ptr,
+      static_cast<T *>(m->input_activation),
+      static_cast<T *>(m->mean_ptr),
+      static_cast<T *>(m->rstd_ptr),
+      gamma_ptr,
+      input_grad_ptr,
+      N);
+}
+
+/*static*/
+void LayerNorm::peft_bwd_kernel_wrapper(
+    LayerNormMeta const *m,
+    GenericTensorAccessorR const &output_grad,
+    GenericTensorAccessorW const &input_grad,
+    GenericTensorAccessorR const &gamma) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
-  LayerNorm::backward_kernel<float>(m,
-                                    output_grad_ptr,
-                                    input_ptr,
-                                    input_grad_ptr,
-                                    gamma_ptr,
-                                    gamma_grad_ptr,
-                                    beta_grad_ptr,
-                                    stream);
+  if (m->output_type[0] == DT_FLOAT) {
+    LayerNorm::peft_bwd_kernel(m,
+                               output_grad.get_float_ptr(),
+                               input_grad.get_float_ptr(),
+                               gamma.get_float_ptr(),
+                               stream);
+  } else {
+    assert(m->output_type[0] == DT_HALF);
+    LayerNorm::peft_bwd_kernel(m,
+                               output_grad.get_half_ptr(),
+                               input_grad.get_half_ptr(),
+                               gamma.get_half_ptr(),
+                               stream);
+  }
 }
 
-template void
-    LayerNorm::backward_kernel_wrapper<float>(LayerNormMeta const *m,
-                                              float const *output_grad_ptr,
-                                              float const *input_ptr,
-                                              float *input_grad_ptr,
-                                              float const *gamma_ptr,
-                                              float *gamma_grad_ptr,
-                                              float *beta_grad_ptr);
+/*static*/
+void LayerNorm::backward_kernel_wrapper(
+    LayerNormMeta const *m,
+    GenericTensorAccessorR const &output_grad,
+    GenericTensorAccessorR const &input,
+    GenericTensorAccessorW const &input_grad,
+    GenericTensorAccessorR const &gamma,
+    GenericTensorAccessorW const &gamma_grad,
+    GenericTensorAccessorW const &beta_grad) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  if (m->output_type[0] == DT_FLOAT) {
+    LayerNorm::backward_kernel(m,
+                               output_grad.get_float_ptr(),
+                               input.get_float_ptr(),
+                               input_grad.get_float_ptr(),
+                               gamma.get_float_ptr(),
+                               gamma_grad.get_float_ptr(),
+                               beta_grad.get_float_ptr(),
+                               stream);
+  } else if (m->output_type[0] == DT_HALF) {
+    LayerNorm::backward_kernel(m,
+                               output_grad.get_half_ptr(),
+                               input.get_half_ptr(),
+                               input_grad.get_half_ptr(),
+                               gamma.get_half_ptr(),
+                               gamma_grad.get_half_ptr(),
+                               beta_grad.get_half_ptr(),
+                               stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+}
 
-}; // namespace FlexFlow
+} // namespace FlexFlow
diff --git a/src/ops/layer_norm.cu b/src/ops/layer_norm.cu
index 44979c48fe..0801d11617 100644
--- a/src/ops/layer_norm.cu
+++ b/src/ops/layer_norm.cu
@@ -27,7 +27,7 @@ constexpr int kColwiseReduceTileSize = 32;
 LayerNormMeta::LayerNormMeta(FFHandler handle,
                              LayerNorm const *ln,
                              MemoryAllocator &gpu_mem_allocator)
-    : OpMeta(handle) {
+    : OpMeta(handle, ln) {
   elementwise_affine = ln->elementwise_affine;
   use_bias = ln->use_bias;
   effective_batch_size = ln->effective_batch_size;
@@ -50,6 +50,7 @@ LayerNormMeta::LayerNormMeta(FFHandler handle,
       data_type_size(data_type) * effective_batch_size);
   bias_ptr = gpu_mem_allocator.allocate_instance_untyped(
       data_type_size(data_type) * effective_batch_size);
+  allocated_peft_buffer_size = 0;
 }
 
 LayerNormMeta::~LayerNormMeta(void) {
@@ -96,73 +97,6 @@ __inline__ __device__ T BlockReduceSum(T val, T *shared) {
   return val;
 }
 
-template <typename T>
-__inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
-  int const lid = threadIdx.x % C10_WARP_SIZE;
-  int const wid = threadIdx.x / C10_WARP_SIZE;
-  val = WarpReduceSum(val);
-  __syncthreads();
-  if (lid == 0) {
-    shared[wid] = val;
-  }
-  __syncthreads();
-  val = (threadIdx.x < (min(blockDim.x, max_num_threads) / C10_WARP_SIZE))
-            ? shared[lid]
-            : T(0);
-  if (wid == 0) {
-    val = WarpReduceSum(val);
-  }
-  return val;
-}
-
-#ifdef DEADCODE
-template <typename T>
-__global__ void RowwiseMomentsCUDAKernel(
-    int64_t N, float eps, T const *X, T *mean, T *rstd) {
-  __shared__ float m_shared[C10_WARP_SIZE];
-  __shared__ float v_shared[C10_WARP_SIZE];
-  const int64_t i = blockIdx.x;
-  float sum1 = 0.0f;
-  float sum2 = 0.0f;
-  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
-    const int64_t index = i * N + j;
-    sum1 += static_cast<float>(X[index]);
-    sum2 += static_cast<float>(X[index]) * static_cast<float>(X[index]);
-  }
-  sum1 = BlockReduceSum<float>(sum1, m_shared);
-  sum2 = BlockReduceSum<float>(sum2, v_shared);
-  if (threadIdx.x == 0) {
-    float const scale = float(1) / static_cast<float>(N);
-    sum1 *= scale;
-    sum2 = max(sum2 * scale - sum1 * sum1, float(0));
-    mean[i] = static_cast<T>(sum1);
-    rstd[i] = static_cast<T>(rsqrt(sum2 + eps));
-  }
-}
-
-template <typename T>
-__global__ void LayerNormForwardCUDAKernel(int64_t N,
-                                           T const *X,
-                                           T const *mean,
-                                           T const *rstd,
-                                           T const *gamma,
-                                           T const *beta,
-                                           T *Y) {
-  using T_ACC = T;
-  const int64_t i = blockIdx.x;
-  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
-    const int64_t index = i * N + j;
-    const T_ACC gamma_v =
-        gamma == nullptr ? T_ACC(1) : static_cast<T_ACC>(gamma[j]);
-    const T_ACC beta_v =
-        beta == nullptr ? T_ACC(0) : static_cast<T_ACC>(beta[j]);
-    Y[index] = (static_cast<T_ACC>(X[index]) - static_cast<T_ACC>(mean[i])) *
-                   static_cast<T_ACC>(rstd[i]) * gamma_v +
-               beta_v;
-  }
-}
-#endif
-
 template <typename T>
 __global__ void LayerNormFusedForwardKernel(int64_t N,
                                             float eps,
@@ -177,18 +111,13 @@ __global__ void LayerNormFusedForwardKernel(int64_t N,
   const int64_t i = blockIdx.x;
   float sum1 = 0.0f;
   float sum2 = 0.0f;
-  for (int64_t j = threadIdx.x; j < N;
-       j += min(blockDim.x, kCUDABlockReduceNumThreads)) {
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
     const int64_t index = i * N + j;
     sum1 += static_cast<float>(X[index]);
     sum2 += static_cast<float>(X[index]) * static_cast<float>(X[index]);
   }
-  if (threadIdx.x < kCUDABlockReduceNumThreads) {
-    sum1 = BlockReduceSum<float>(
-        sum1, m_shared, min(blockDim.x, kCUDABlockReduceNumThreads));
-    sum2 = BlockReduceSum<float>(
-        sum2, v_shared, min(blockDim.x, kCUDABlockReduceNumThreads));
-  }
+  sum1 = BlockReduceSum<float>(sum1, m_shared);
+  sum2 = BlockReduceSum<float>(sum2, v_shared);
   if (threadIdx.x == 0) {
     float const scale = float(1) / static_cast<float>(N);
     sum1 *= scale;
@@ -200,7 +129,7 @@ __global__ void LayerNormFusedForwardKernel(int64_t N,
   __syncthreads();
 
   using T_ACC = T;
-  for (int64_t j = threadIdx.x; j < N; j += min(blockDim.x, kCUDANumThreads)) {
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
     const int64_t index = i * N + j;
     const T_ACC gamma_v =
         gamma == nullptr ? T_ACC(1) : static_cast<T_ACC>(gamma[j]);
@@ -221,25 +150,18 @@ void LayerNorm::forward_kernel(LayerNormMeta const *m,
                                T const *beta_ptr,
                                cudaStream_t stream) {
 
-  std::pair<int, int> kernel1_parallelism =
-      std::make_pair(m->effective_batch_size, kCUDABlockReduceNumThreads);
-  std::pair<int, int> kernel2_parallelism =
-      std::make_pair(m->effective_batch_size, kCUDANumThreads);
-
-  int num_blocks =
-      std::max(kernel1_parallelism.first, kernel2_parallelism.first);
-  int num_threads =
-      std::max(kernel1_parallelism.second, kernel2_parallelism.second);
-
   LayerNormFusedForwardKernel<T>
-      <<<num_blocks, num_threads, 0, stream>>>(m->effective_num_elements,
-                                               m->eps,
-                                               in_ptr,
-                                               static_cast<T *>(m->mean_ptr),
-                                               static_cast<T *>(m->rstd_ptr),
-                                               gamma_ptr,
-                                               beta_ptr,
-                                               out_ptr);
+      <<<m->effective_batch_size,
+         std::min(CUDA_NUM_THREADS, (int)m->effective_num_elements),
+         0,
+         stream>>>(m->effective_num_elements,
+                   m->eps,
+                   in_ptr,
+                   static_cast<T *>(m->mean_ptr),
+                   static_cast<T *>(m->rstd_ptr),
+                   gamma_ptr,
+                   beta_ptr,
+                   out_ptr);
 }
 
 /*static*/
@@ -290,6 +212,116 @@ void LayerNorm::forward_kernel_wrapper(LayerNormMeta const *m,
   }
 }
 
+/*static*/
+void LayerNorm::inference_kernel_wrapper(LayerNormMeta *m,
+                                         BatchConfig const *bc,
+                                         GenericTensorAccessorR const &input,
+                                         GenericTensorAccessorW &output,
+                                         GenericTensorAccessorR const &gamma,
+                                         GenericTensorAccessorR const &beta) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+
+  // save input activation if needed for PEFT
+  if (bc->num_active_peft_tokens() > 0) {
+    // Check that we have at most one request that requires peft_bwd
+    int num_peft_requests = 0;
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_bwd) {
+        num_peft_requests++;
+      }
+    }
+    assert(num_peft_requests <= 1);
+
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      // Skip non-PEFT requests
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        continue;
+      }
+      int num_peft_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+      int max_peft_tokens = bc->requestsInfo[i].max_sequence_length;
+      int first_token_offset = bc->requestsInfo[i].first_token_offset_in_batch;
+      int in_dim = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+      if (bc->requestsInfo[i].peft_bwd) {
+        size_t activation_size_needed =
+            data_type_size(m->input_type[0]) * max_peft_tokens * in_dim;
+        if (activation_size_needed > m->allocated_peft_buffer_size) {
+          MemoryAllocator *allocator = m->handle.peft_activation_allocator;
+          m->input_activation =
+              allocator->allocate_instance_untyped(activation_size_needed);
+          m->allocated_peft_buffer_size = activation_size_needed;
+        }
+        // copy input activation
+        if (m->input_type[0] == DT_FLOAT) {
+          checkCUDA(cudaMemcpyAsync(
+              m->input_activation,
+              input.get_float_ptr() + first_token_offset * in_dim,
+              data_type_size(m->input_type[0]) * num_peft_tokens * in_dim,
+              cudaMemcpyDeviceToDevice,
+              stream));
+        } else if (m->input_type[0] == DT_HALF) {
+          checkCUDA(cudaMemcpyAsync(
+              m->input_activation,
+              input.get_half_ptr() + first_token_offset * in_dim,
+              data_type_size(m->input_type[0]) * num_peft_tokens * in_dim,
+              cudaMemcpyDeviceToDevice,
+              stream));
+        } else {
+          assert(false && "unsupport datatype in layernorm");
+        }
+      }
+    }
+  }
+
+  if (m->input_type[0] == DT_FLOAT) {
+    LayerNorm::forward_kernel<float>(
+        m,
+        input.get_float_ptr(),
+        output.get_float_ptr(),
+        m->elementwise_affine ? gamma.get_float_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta.get_float_ptr() : nullptr,
+        stream);
+  } else if (m->input_type[0] == DT_HALF) {
+    LayerNorm::forward_kernel<half>(
+        m,
+        input.get_half_ptr(),
+        output.get_half_ptr(),
+        m->elementwise_affine ? gamma.get_half_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta.get_half_ptr() : nullptr,
+        stream);
+  } else {
+    assert(false && "unsupport datatype in layernorm");
+  }
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[LayerNorm] forward time (CF) = %.9fms\n", elapsed);
+    // print_tensor<T>(in_ptr, 32, "[LayerNorm:forward:input]");
+    // print_tensor<T>(out_ptr, 32, "[LayerNorm:forward:output]");
+  }
+}
+
 template <typename T>
 __global__ void ComputeInternalGradientsCUDAKernel(
     int64_t N, T const *dY, T const *X, T const *gamma, T *ds, T *db) {
@@ -327,7 +359,7 @@ __global__ void ComputeGradientFusedParamsCUDAKernel(int64_t M,
   using T_ACC = T;
   const int64_t index = blockIdx.x * blockDim.x + threadIdx.x;
   if (index < M) {
-    const T_ACC s = T_ACC(1) / static_cast<T_ACC>(N);
+    const T_ACC s = T_ACC(1) / static_cast<T_ACC>((int)N);
     const T_ACC a = (db[index] * static_cast<T_ACC>(mean[index]) - ds[index]) *
                     static_cast<T_ACC>(rstd[index]) *
                     static_cast<T_ACC>(rstd[index]) *
@@ -338,27 +370,6 @@ __global__ void ComputeGradientFusedParamsCUDAKernel(int64_t M,
   }
 }
 
-template <typename T>
-__global__ void LayerNormBackwardCUDAKenrel(int64_t N,
-                                            T const *dY,
-                                            T const *X,
-                                            T const *gamma,
-                                            T const *a,
-                                            T const *b,
-                                            T const *c,
-                                            T *dX) {
-  using T_ACC = T;
-  const int64_t i = blockIdx.x;
-  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
-    const int64_t index = i * N + j;
-    const T_ACC gamma_v =
-        gamma == nullptr ? T_ACC(1) : static_cast<T_ACC>(gamma[j]);
-    dX[index] =
-        static_cast<T_ACC>(a[i]) * static_cast<T_ACC>(dY[index]) * gamma_v +
-        b[i] * static_cast<T_ACC>(X[index]) + c[i];
-  }
-}
-
 template <typename T>
 __global__ void GammaBetaBackwardSimpleCUDAKernel(int64_t M,
                                                   int64_t N,
@@ -620,44 +631,83 @@ void LayerNorm::backward_kernel(LayerNormMeta const *m,
 
 /*static*/
 template <typename T>
-void LayerNorm::backward_kernel_wrapper(LayerNormMeta const *m,
-                                        T const *output_grad_ptr,
-                                        T const *input_ptr,
-                                        T *input_grad_ptr,
-                                        T const *gamma_ptr,
-                                        T *gamma_grad_ptr,
-                                        T *beta_grad_ptr) {
+void LayerNorm::peft_bwd_kernel(LayerNormMeta const *m,
+                                T const *output_grad_ptr,
+                                T *input_grad_ptr,
+                                T const *gamma_ptr,
+                                cudaStream_t stream) {
+  const int64_t M = m->effective_batch_size;
+  const int64_t N = m->effective_num_elements;
+  int const warp_size = C10_WARP_SIZE;
+  int const num_threads = 128;
+  const dim3 blocks(M);
+  int nshared = (num_threads / warp_size) * sizeof(T);
+  layer_norm_grad_input_kernel<<<blocks, num_threads, nshared, stream>>>(
+      output_grad_ptr,
+      static_cast<T *>(m->input_activation),
+      static_cast<T *>(m->mean_ptr),
+      static_cast<T *>(m->rstd_ptr),
+      gamma_ptr,
+      input_grad_ptr,
+      N);
+}
+
+/*static*/
+void LayerNorm::peft_bwd_kernel_wrapper(
+    LayerNormMeta const *m,
+    GenericTensorAccessorR const &output_grad,
+    GenericTensorAccessorW const &input_grad,
+    GenericTensorAccessorR const &gamma) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   if (m->output_type[0] == DT_FLOAT) {
-    LayerNorm::backward_kernel<float>(m,
-                                      output_grad_ptr,
-                                      input_ptr,
-                                      input_grad_ptr,
-                                      gamma_ptr,
-                                      gamma_grad_ptr,
-                                      beta_grad_ptr,
-                                      stream);
+    LayerNorm::peft_bwd_kernel(m,
+                               output_grad.get_float_ptr(),
+                               input_grad.get_float_ptr(),
+                               gamma.get_float_ptr(),
+                               stream);
+  } else {
+    assert(m->output_type[0] == DT_HALF);
+    LayerNorm::peft_bwd_kernel(m,
+                               output_grad.get_half_ptr(),
+                               input_grad.get_half_ptr(),
+                               gamma.get_half_ptr(),
+                               stream);
   }
-  // }else if(m->output_type[0] == DT_HALF){
-  //   LayerNorm::backward_kernel<half>(m,
-  //                                   output_grad_ptr,
-  //                                   input_ptr,
-  //                                   input_grad_ptr,
-  //                                   gamma_ptr,
-  //                                   gamma_grad_ptr,
-  //                                   beta_grad_ptr,
-  //                                   stream);
-  // }
 }
 
-template void
-    LayerNorm::backward_kernel_wrapper<float>(LayerNormMeta const *m,
-                                              float const *output_grad_ptr,
-                                              float const *input_ptr,
-                                              float *input_grad_ptr,
-                                              float const *gamma_ptr,
-                                              float *gamma_grad_ptr,
-                                              float *beta_grad_ptr);
+/*static*/
+void LayerNorm::backward_kernel_wrapper(
+    LayerNormMeta const *m,
+    GenericTensorAccessorR const &output_grad,
+    GenericTensorAccessorR const &input,
+    GenericTensorAccessorW const &input_grad,
+    GenericTensorAccessorR const &gamma,
+    GenericTensorAccessorW const &gamma_grad,
+    GenericTensorAccessorW const &beta_grad) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  if (m->output_type[0] == DT_FLOAT) {
+    LayerNorm::backward_kernel(m,
+                               output_grad.get_float_ptr(),
+                               input.get_float_ptr(),
+                               input_grad.get_float_ptr(),
+                               gamma.get_float_ptr(),
+                               gamma_grad.get_float_ptr(),
+                               beta_grad.get_float_ptr(),
+                               stream);
+  } else if (m->output_type[0] == DT_HALF) {
+    LayerNorm::backward_kernel(m,
+                               output_grad.get_half_ptr(),
+                               input.get_half_ptr(),
+                               input_grad.get_half_ptr(),
+                               gamma.get_half_ptr(),
+                               gamma_grad.get_half_ptr(),
+                               beta_grad.get_half_ptr(),
+                               stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+}
 
-}; // namespace FlexFlow
+} // namespace FlexFlow
diff --git a/src/ops/linear.cc b/src/ops/linear.cc
index 44b56d623e..20ad762b62 100644
--- a/src/ops/linear.cc
+++ b/src/ops/linear.cc
@@ -498,7 +498,7 @@ OpMeta *Linear::init_task_with_dim(Task const *task,
   m->add_bias_only_once = linear->add_bias_only_once;
   m->profiling = linear->profiling;
   m->inference_debugging = linear->inference_debugging;
-  m->trainableInputs[0] = linear->trainableInputs[0];
+  m->trainable_inputs[0] = linear->trainable_inputs[0];
   m->weight_ptr_type = m->input_type[0];
   m->quantization_type = linear->quantization_type;
   m->offload = linear->offload;
@@ -632,8 +632,11 @@ void Linear::inference_task(Task const *task,
       m->weight_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
   int in_dim = input.domain.hi()[0] - input.domain.lo()[0] + 1;
   int out_dim = output.domain.hi()[0] - output.domain.lo()[0] + 1;
+  assert((weight.domain.hi()[0] - weight.domain.lo()[0] + 1) == in_dim);
+  assert((weight.domain.hi()[1] - weight.domain.lo()[1] + 1) == out_dim);
+  assert(weight.domain.get_volume() == in_dim * out_dim);
 
-  int batch_size = bc->num_active_tokens();
+  int batch_size = bc->num_active_infr_tokens();
   GenericTensorAccessorR bias;
   if (m->use_bias &&
       !(m->add_bias_only_once && task->index_point.point_data[0] != 0)) {
@@ -645,14 +648,15 @@ void Linear::inference_task(Task const *task,
                                             runtime);
     assert(bias.domain.get_volume() == static_cast<size_t>(out_dim));
   }
-  forward_kernel_wrapper(m,
-                         input.ptr,
-                         output.ptr,
-                         weight.ptr,
-                         bias.ptr,
-                         in_dim,
-                         out_dim,
-                         batch_size);
+  inference_kernel_wrapper(m,
+                           bc,
+                           input.ptr,
+                           output.ptr,
+                           weight.ptr,
+                           bias.ptr,
+                           in_dim,
+                           out_dim,
+                           batch_size);
   if (m->inference_debugging) {
     assert(task->index_point.get_dim() == 1);
     int shard_id = task->index_point.point_data[0];
@@ -664,6 +668,119 @@ void Linear::inference_task(Task const *task,
     }
     Linear::save_inference_tensors_to_file(
         m, shard_id, bc, {input}, weights_accessors, {output});
+    printf("\tin=[%i,%i].T @ w=[%i,%i] -> out=[%i,%i]\n",
+           in_dim,
+           bc->num_tokens,
+           in_dim,
+           out_dim,
+           out_dim,
+           bc->num_tokens);
+  }
+}
+
+FutureMap Linear::peft_bwd(FFModel const &ff,
+                           BatchConfigFuture const &bc,
+                           std::vector<ParallelTensor> const &batch_inputs,
+                           std::vector<ParallelTensor> const &batch_outputs,
+                           MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+  /* std::cout << "Linear op machine_view: " << *(MachineView const *)mv
+            << std::endl; */
+  IndexLauncher launcher(LINEAR_PEFT_BWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(nullptr, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[0]->part_grad,
+                        0 /*projection id*/,
+                        reset_input_grads[0] ? WRITE_ONLY : READ_WRITE,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region_grad));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(
+      RegionRequirement(batch_outputs[0]->part_grad,
+                        0 /*projection id*/,
+                        READ_WRITE,
+                        EXCLUSIVE,
+                        batch_outputs[0]->region_grad));
+  launcher.add_field(1, FID_DATA);
+  launcher.add_region_requirement(
+      RegionRequirement(weights[0]->part,
+                        0 /*projection id*/,
+                        READ_ONLY,
+                        EXCLUSIVE,
+                        weights[0]->region,
+                        ff.cpu_offload ? MAP_TO_ZC_MEMORY : 0));
+  launcher.add_field(2, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+void Linear::peft_bwd_task(Task const *task,
+                           std::vector<PhysicalRegion> const &regions,
+                           Context ctx,
+                           Runtime *runtime) {
+  Domain input_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  LinearMeta *m = *((LinearMeta **)task->local_args);
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_active_peft_tokens() == 0) {
+    return;
+  }
+  assert(regions.size() == 3);
+  assert(task->regions.size() == 3);
+  if (m->quantization_type == DT_NONE) {
+    assert(m->input_type[0] == m->weight_type[0]);
+  }
+  assert(m->input_type[0] == m->output_type[0]);
+
+  GenericTensorAccessorW input_grad = helperGetGenericTensorAccessorRW(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output_grad = helperGetGenericTensorAccessorRW(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
+      m->weight_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  int in_dim = input_grad.domain.hi()[0] - input_grad.domain.lo()[0] + 1;
+  int out_dim = output_grad.domain.hi()[0] - output_grad.domain.lo()[0] + 1;
+
+  int num_infr_tokens = bc->num_active_infr_tokens();
+  int num_peft_tokens = bc->num_active_peft_tokens();
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    Linear::save_inference_tensors_to_file(
+        m, shard_id, bc, {input_grad}, {weight}, {output_grad}, false, true);
+    printf("\tw=[%i,%i] @ out_grad=[%i,%i] -> in_grad[%i,%i]\n",
+           in_dim,
+           out_dim,
+           out_dim,
+           num_peft_tokens,
+           in_dim,
+           num_peft_tokens);
+  }
+  peft_bwd_kernel_wrapper(m,
+                          input_grad.ptr,
+                          output_grad.ptr,
+                          weight.ptr,
+                          in_dim,
+                          out_dim,
+                          num_infr_tokens,
+                          num_peft_tokens);
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    Linear::save_inference_tensors_to_file(
+        m, shard_id, bc, {input_grad}, {weight}, {output_grad}, false);
   }
 }
 
@@ -782,7 +899,7 @@ void Linear::backward(FFModel const &ff) {
     launcher.add_field(rid++, FID_DATA);
     // regions[1](I/O): replica_grad
     assert(replica == NULL);
-    if (trainableInputs[0]) {
+    if (trainable_inputs[0]) {
       launcher.add_region_requirement(
           RegionRequirement(inputs[0]->part_grad,
                             0 /*projection id*/,
@@ -878,17 +995,17 @@ void Linear::backward_task_with_dim(Task const *task,
                                     Runtime *runtime) {
   // Linear* linear = (Linear*) task->args;
   LinearMeta const *m = *((LinearMeta **)task->local_args);
-  assert(regions.size() == (5 + static_cast<size_t>(m->trainableInputs[0]) +
+  assert(regions.size() == (5 + static_cast<size_t>(m->trainable_inputs[0]) +
                             static_cast<size_t>(m->use_bias)));
   assert(task->regions.size() ==
-         (5 + static_cast<size_t>(m->trainableInputs[0]) +
+         (5 + static_cast<size_t>(m->trainable_inputs[0]) +
           static_cast<size_t>(m->use_bias)));
   DT *input_grad = nullptr;
   size_t rid = 0;
   TensorAccessorR<DT, NDIM> acc_input(
       regions[rid], task->regions[rid], FID_DATA, ctx, runtime);
   rid++;
-  if (m->trainableInputs[0]) {
+  if (m->trainable_inputs[0]) {
     Domain domain = runtime->get_index_space_domain(
         ctx, task->regions[rid].region.get_index_space());
     if (domain.get_dim() == NDIM + 1) {
@@ -1119,7 +1236,10 @@ bool Linear::measure_operator_cost(Simulator *sim,
   int input_n = sub_input.get_volume() / input_c;
   int output_c = sub_output.dims[0].size;
   int output_n = sub_output.get_volume() / output_c;
-  LinearMeta *m = sim->linear_meta;
+
+  MemoryAllocator gpu_mem_allocator(sim->memory);
+  LinearMeta *m = new LinearMeta(
+      sim->handler, output_n, this, gpu_mem_allocator, input_c * output_c);
   m->activation = activation;
   m->kernel_reg_type = kernel_reg_type;
   m->kernel_reg_lambda = kernel_reg_lambda;
@@ -1164,7 +1284,7 @@ bool Linear::measure_operator_cost(Simulator *sim,
   };
   if (sim->computationMode == COMP_MODE_TRAINING) {
     void *input_grad_ptr = NULL;
-    if (trainableInputs[0]) {
+    if (trainable_inputs[0]) {
       input_grad_ptr =
           sim->allocate(sub_input.get_volume(), inputs[0]->data_type);
     } else {
@@ -1313,7 +1433,7 @@ LinearParams Linear::get_params() const {
   params.kernel_reg_lambda = this->kernel_reg_lambda;
   params.quantization_type = this->quantization_type;
   params.offload = this->offload;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
 
diff --git a/src/ops/lora_linear.cc b/src/ops/lora_linear.cc
new file mode 100644
index 0000000000..fde6bc2b28
--- /dev/null
+++ b/src/ops/lora_linear.cc
@@ -0,0 +1,1316 @@
+#include "flexflow/ops/lora_linear.h"
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/layer.h"
+#include "flexflow/model.h"
+#include "flexflow/ops/kernels/lora_linear_kernels.h"
+#include "flexflow/utils/hash_utils.h"
+#include "flexflow/utils/peft_weight_allocator.h"
+#include "legion/legion_utilities.h"
+#include <sys/stat.h>
+#include <sys/types.h>
+#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
+#include "flexflow/utils/cuda_helper.h"
+#else
+#include "flexflow/utils/hip_helper.h"
+#endif
+
+namespace FlexFlow {
+
+// declare Legion names
+using Legion::ArgumentMap;
+using Legion::Context;
+using Legion::coord_t;
+using Legion::Domain;
+using Legion::Future;
+using Legion::FutureMap;
+using Legion::IndexLauncher;
+using Legion::InlineLauncher;
+using Legion::Machine;
+using Legion::Memory;
+using Legion::PhysicalRegion;
+using Legion::Predicate;
+using Legion::Rect;
+using Legion::RegionRequirement;
+using Legion::Runtime;
+using Legion::Task;
+using Legion::TaskArgument;
+using Legion::TaskLauncher;
+
+using namespace FlexFlow::Kernels::LoraLinear;
+
+bool check_lora_layer_match(Layer *potential_target,
+                            std::string target_module_name) {
+  if (potential_target->op_type == OP_LINEAR &&
+      potential_target->name != nullptr && strlen(potential_target->name) > 0) {
+    std::string s(potential_target->name);
+    if (s.find(target_module_name) != std::string::npos &&
+        s.find("lora") == std::string::npos) {
+      return true;
+    }
+  }
+  return false;
+}
+
+PEFTModelID *FFModel::add_lora_layer(LoraLinearConfig const peft_config) {
+  assert(config.enable_peft &&
+         "Cannot add a LoRA layer if PEFT mode is not enabled");
+  if (peft_config.target_modules.size() == 0) {
+    printf("PEFT config does not contain any target module\n");
+    std::cout << peft_config << std::endl;
+    assert(false);
+  }
+  PEFTModelID *peft_model_id = new PEFTModelID(peft_model_global_guid++);
+  peft_configs[*peft_model_id] = peft_config;
+
+  for (std::string target_module_name : peft_config.target_modules) {
+    assert(target_module_name.length() > 0 &&
+           "LoRA target module name is empty");
+    // find target layer
+    for (auto it = layers.begin(); it != layers.end(); ++it) {
+      Layer *target_module = *it;
+      bool match = check_lora_layer_match(target_module, target_module_name);
+      if (!match) {
+        continue;
+      }
+
+      if (base_layer_to_peft_layer.find(target_module) !=
+          base_layer_to_peft_layer.end()) {
+        // lora linear layer already added, no need to add again
+        Layer *peft_layer = base_layer_to_peft_layer[target_module];
+        peft_layer_to_peft_id[peft_layer].push_back(*peft_model_id);
+      } else {
+        Tensor const input = target_module->inputs[0];
+        Tensor const output = target_module->outputs[0];
+        assert(input->data_type == output->data_type);
+        std::string name_ = target_module->name
+                                ? std::string(target_module->name)
+                                : std::string("");
+        size_t last_underscore = name_.length() - 1;
+        for (int i = name_.length() - 1; i > 0; i--) {
+          if (!(std::isdigit(target_module->name[i]) ||
+                target_module->name[i] == '_')) {
+            break;
+          } else if (target_module->name[i] == '_') {
+            last_underscore = i;
+          }
+        }
+        name_.erase(last_underscore);
+
+        name_ += ".lora";
+        std::cout << "Adding layer " << name_ << std::endl;
+        Layer *peft_layer = new Layer(this,
+                                      OP_LORA,
+                                      output->data_type,
+                                      name_.c_str(),
+                                      2 /*inputs*/,
+                                      0 /*weights*/,
+                                      1 /*outputs*/,
+                                      input,
+                                      output);
+        // fix LoRA layer's transformer layer ID and model ID
+        peft_layer->layer_guid.transformer_layer_id =
+            target_module->layer_guid.transformer_layer_id;
+        peft_layer->layer_guid.model_id = target_module->layer_guid.model_id;
+        {
+          int numdims = output->num_dims;
+          int dims[MAX_TENSOR_DIM];
+          for (int i = 0; i < numdims; i++) {
+            dims[i] = output->dims[i];
+          }
+          peft_layer->outputs[0] =
+              create_tensor_legion_ordering(numdims,
+                                            dims,
+                                            output->data_type,
+                                            peft_layer,
+                                            0,
+                                            true /*create_grad*/);
+        }
+        it = layers.insert(it + 1, peft_layer);
+        ++it;
+        base_layer_to_peft_layer[target_module] = peft_layer;
+        peft_layer_to_peft_id[peft_layer] = std::vector<PEFTModelID>();
+        peft_layer_to_peft_id[peft_layer].push_back(*peft_model_id);
+      }
+    }
+  }
+
+  // save finetuned lora model configs to file
+  if (peft_config.trainable) {
+    std::string finetuned_model_folder = join_path({
+        peft_config.cache_folder,
+        "finetuned_models",
+        peft_config.peft_model_id,
+    });
+    fs::remove_all(finetuned_model_folder);
+    std::string finetuned_model_config_folder = join_path({
+        finetuned_model_folder,
+        "config",
+    });
+    fs::create_directories(finetuned_model_config_folder);
+    std::string lora_linear_config_filepath = join_path({
+        finetuned_model_config_folder,
+        "ff_config.json",
+    });
+    serialize_to_json_file(peft_config, lora_linear_config_filepath);
+    std::string optimizer_config_filepath = join_path({
+        finetuned_model_config_folder,
+        "ff_optimizer_config.json",
+    });
+    if (typeid(*peft_config.optimizer_config) ==
+        typeid(LoraSGDOptimizerConfig)) {
+      LoraSGDOptimizerConfig const *sgd_config =
+          static_cast<LoraSGDOptimizerConfig const *>(
+              peft_config.optimizer_config);
+      serialize_to_json_file(*sgd_config, optimizer_config_filepath);
+    } else if (typeid(*peft_config.optimizer_config) ==
+               typeid(LoraAdamOptimizerConfig)) {
+      LoraAdamOptimizerConfig const *adam_config =
+          static_cast<LoraAdamOptimizerConfig const *>(
+              peft_config.optimizer_config);
+      serialize_to_json_file(*adam_config, optimizer_config_filepath);
+    } else {
+      assert(false && "Optimizer not supported");
+    }
+  }
+
+  return peft_model_id;
+}
+
+Op *LoraLinear::create_operator_from_layer(
+    FFModel &model,
+    Layer const *layer,
+    std::vector<ParallelTensor> const &inputs) {
+  std::unordered_map<PEFTModelID, LoraLinearConfig> _peft_configs;
+  std::vector<PEFTModelID> const &peft_ids =
+      model.peft_layer_to_peft_id[(Layer *)layer];
+  for (int i = 0; i < peft_ids.size(); i++) {
+    _peft_configs.emplace(
+        std::make_pair(peft_ids[i], model.peft_configs[peft_ids[i]]));
+  }
+  return new LoraLinear(model,
+                        layer->layer_guid,
+                        layer->op_type,
+                        inputs[0],
+                        inputs[1],
+                        _peft_configs,
+                        layer->name);
+}
+
+LoraLinear::LoraLinear(FFModel &model,
+                       LoraLinear const &other,
+                       ParallelTensor const input,
+                       ParallelTensor const output)
+    : LoraLinear(model,
+                 other.layer_guid,
+                 other.op_type,
+                 input,
+                 output,
+                 other.peft_configs,
+                 other.name) {}
+
+LoraLinear::LoraLinear(FFModel &model,
+                       Params const &params,
+                       Input const &inputs,
+                       char const *name)
+    : LoraLinear(model,
+                 params.layer_guid,
+                 params.type,
+                 inputs.first,
+                 inputs.second,
+                 params.peft_configs,
+                 params.name) {}
+
+LoraLinear::LoraLinear(
+    FFModel &model,
+    LayerID const &_layer_guid,
+    OperatorType _op_type,
+    ParallelTensor const _input,
+    ParallelTensor const _output,
+    std::unordered_map<PEFTModelID, LoraLinearConfig> const &_peft_configs,
+    char const *name)
+    : Op(model,
+         _op_type,
+         _output->data_type,
+         name,
+         2 /*inputs*/,
+         0 /*weights*/,
+         false,
+         1 /*outputs*/,
+         _input,
+         _output) {
+  assert(_input->data_type == _output->data_type);
+  // overwrite layer_guid
+  layer_guid = _layer_guid;
+  data_type = _output->data_type;
+
+  ParallelTensorShape input_shape = this->inputs[0]->get_shape();
+  LoraLinearParams params = this->get_params();
+
+  // Create output tensor
+  {
+    int numdim = inputs[1]->num_dims;
+    ParallelDim dims[MAX_TENSOR_DIM];
+    for (int i = 0; i < numdim; i++) {
+      dims[i] = inputs[1]->dims[i];
+    }
+    outputs[0] = model.create_parallel_tensor_legion_ordering(
+        numdim, dims, inputs[1]->data_type, this);
+  }
+  for (auto const &kv : _peft_configs) {
+    peft_configs.insert(kv);
+  }
+  // assert(check_output_input_weight_parallel_dims(allocate_weights));
+}
+
+void LoraLinear::init(FFModel const &ff) {
+  assert(false && "LoraLinear does not support normal init");
+}
+
+void LoraLinear::init_inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  assert(check_output_input_weight_same_parallel_is());
+  assert(batch_inputs.size() == 2);
+  assert(batch_outputs.size() == 1);
+  // Assert that the output and the second input are mapped to the same
+  // region/part
+  assert(batch_outputs[0]->region == batch_inputs[1]->region);
+  assert(batch_outputs[0]->part == batch_inputs[1]->part);
+  // assert(check_output_input_weight_same_machine_view());
+  // output is considered as an input to allow in-place optimization
+  ParallelTensor output_tensor = batch_outputs[0];
+  parallel_is = output_tensor->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  MachineView const *view = mv ? mv : &output_tensor->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_init_inference(ff, argmap, output_tensor);
+  IndexLauncher launcher(LORA_LINEAR_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(LoraLinear)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[1]->region));
+  launcher.add_field(1, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, output_tensor);
+}
+
+template <typename DT>
+void load_peft_from_file(DT *ptr,
+                         size_t num_rows,
+                         size_t num_columns,
+                         int num_shards,
+                         int shard_id,
+                         std::string filepath) {
+  std::ifstream in(filepath, std::ios::in | std::ios::binary);
+  if (!in.good()) {
+    printf("Could not open file: %s\n", filepath.c_str());
+  }
+  assert(in.good() && "incorrect weight file path");
+
+  // HuggingFace dims (serialized in row-major order)
+  //    lora_A: [rank, intermediate_dim]
+  //    lora_B: [hidden_dim, rank]
+  // FlexFlow dims (serialized in column-major order)
+  //    lora_A: [intermediate_dim, rank]
+  //    lora_B: [rank, out_dim]
+  // Tensor parallelism: shard lora_A along intermediate_dim, replicate lora_B
+  assert(num_rows % num_shards == 0);
+  size_t chunk_size = num_rows / num_shards;
+  size_t offset = (num_shards > 1) ? shard_id * chunk_size : 0;
+
+  // Allocate memory for the weight shard
+  std::vector<DT> host_array(chunk_size * num_columns);
+  // Read the chunk
+  size_t total_size_read = 0;
+  for (int i = 0; i < num_columns; ++i) {
+    in.seekg((i * num_rows + offset) * sizeof(DT));
+    in.read(reinterpret_cast<char *>(host_array.data() + i * chunk_size),
+            chunk_size * sizeof(DT));
+    total_size_read += in.gcount();
+  }
+  // Check weight shard size
+  size_t expected_data_size = chunk_size * num_columns * sizeof(DT);
+  if (total_size_read != expected_data_size) {
+    printf("load weight data error: expected %lu bytes, got: %lu bytes, data "
+           "size: %lu\n",
+           expected_data_size,
+           total_size_read,
+           sizeof(DT));
+    assert(false);
+  }
+  assert(host_array.size() == chunk_size * num_columns);
+  // Copy weight to device memory
+  copy_tensor_host_to_dev(ptr, host_array.data(), chunk_size * num_columns);
+  in.close();
+}
+
+/*
+  regions[0](O): output
+  regions[1](I): kernel
+  regions[2](I): bias
+*/
+OpMeta *LoraLinear::init_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  LoraLinear const *lora = (LoraLinear *)task->args;
+  FFHandler handle = *((FFHandler const *)task->local_args);
+  GenericTensorAccessorR input =
+      helperGetGenericTensorAccessorRO(lora->inputs[0]->data_type,
+                                       regions[0],
+                                       task->regions[0],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorW output =
+      helperGetGenericTensorAccessorRW(lora->outputs[0]->data_type,
+                                       regions[1],
+                                       task->regions[1],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  int in_dim = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+  int out_dim = output.domain.hi()[0] - output.domain.lo()[0] + 1;
+  int batch_size = output.domain.get_volume() / out_dim;
+  assert(input.domain.get_volume() == in_dim * batch_size);
+  assert(output.domain.get_volume() == out_dim * batch_size);
+
+  LoraLinearMeta *m = new LoraLinearMeta(handle, lora);
+  m->trainable_inputs[0] = lora->trainable_inputs[0];
+  std::strcpy(m->op_name, lora->name);
+  m->layer_guid = lora->layer_guid;
+
+  int num_shards = lora->inputs[0]->dims[0].degree;
+  int shard_id = task->index_point.point_data[0];
+  int num_dims = lora->inputs[0]->num_dims;
+  assert(in_dim == lora->inputs[0]->dims[0].size / num_shards);
+  assert(out_dim ==
+         lora->inputs[1]->dims[0].size / lora->inputs[1]->dims[0].degree);
+
+  DataType dt = m->input_type[0];
+  assert(dt == m->input_type[1]);
+  assert(dt == m->output_type[0]);
+  assert(dt == lora->inputs[0]->data_type);
+  assert(dt == lora->inputs[1]->data_type);
+  assert(dt == lora->outputs[0]->data_type);
+
+  // get layer name
+  assert(lora->name != nullptr &&
+         "Layer name is not set, cannot determine weights location");
+  std::string lora_layername = std::string(lora->name);
+  std::string searchString = "lora";
+  size_t found = lora_layername.find(searchString);
+  if (found == std::string::npos) {
+    std::cout << "LoraLinear layer name not in the right format (does not "
+                 "contain word 'lora')"
+              << std::endl;
+    assert(false);
+  }
+  std::string lora_layername_substr =
+      lora_layername.substr(0, found + searchString.length());
+
+  for (auto const &kv : lora->peft_configs) {
+    PEFTModelID const &model_id = kv.first;
+    LoraLinearConfig const &lora_config = kv.second;
+
+    int rank = lora_config.rank;
+
+    int w0_num_elements = rank * in_dim;
+    int w1_num_elements = rank * out_dim;
+    // values below represent total weight sizes before sharding. Lora B is not
+    // sharded.
+    int lora_A_num_rows = in_dim * num_shards;
+    int lora_A_num_cols = rank;
+    int lora_B_num_rows = rank;
+    int lora_B_num_cols = out_dim;
+    int lora_A_num_shards = num_shards;
+    int lora_B_num_shards = 1;
+
+    LoraLinearWeight weight;
+    weight.in_dim = in_dim;
+    weight.out_dim = out_dim;
+    weight.rank = rank;
+    weight.num_shards = num_shards;
+    PEFTWeightAllocator *allocator = m->handle.peft_weight_allocator;
+    weight.w0_ptr = allocator->allocate_local_weights_untyped(
+        model_id, w0_num_elements * data_type_size(dt));
+    weight.w1_ptr = allocator->allocate_local_weights_untyped(
+        model_id, w1_num_elements * data_type_size(dt));
+
+    if (!lora_config.init_lora_weights) {
+      // load weights from file
+      std::string weights_folder_filepath = join_path({
+          lora_config.cache_folder,
+          "weights",
+          lora_config.peft_model_id,
+          dt == DT_FLOAT ? "full-precision" : "half-precision",
+      });
+      std::string w0_filepath = join_path(
+          {weights_folder_filepath, lora_layername_substr + "_A.weight"});
+      std::string w1_filepath = join_path(
+          {weights_folder_filepath, lora_layername_substr + "_B.weight"});
+      if (dt == DT_FLOAT) {
+        std::cout << "Loading LORA weight "
+                  << lora_layername_substr + "_A.weight"
+                  << ", num_rows: " << lora_A_num_rows
+                  << ", num_cols: " << lora_A_num_cols
+                  << ", num_shards: " << lora_A_num_shards
+                  << ", shard_id: " << shard_id << std::endl;
+        load_peft_from_file((float *)weight.w0_ptr,
+                            lora_A_num_rows,
+                            lora_A_num_cols,
+                            lora_A_num_shards,
+                            shard_id,
+                            w0_filepath);
+        std::cout << "Loading LORA weight "
+                  << lora_layername_substr + "_B.weight"
+                  << ", num_rows: " << lora_B_num_rows
+                  << ", num_cols: " << lora_B_num_cols
+                  << ", num_shards: " << lora_B_num_shards
+                  << ", shard_id: " << shard_id << std::endl;
+        load_peft_from_file((float *)weight.w1_ptr,
+                            lora_B_num_rows,
+                            lora_B_num_cols,
+                            lora_B_num_shards,
+                            shard_id,
+                            w1_filepath);
+      } else if (dt == DT_HALF) {
+        std::cout << "Loading LORA weight "
+                  << lora_layername_substr + "_A.weight"
+                  << ", num_rows: " << lora_A_num_rows
+                  << ", num_cols: " << lora_A_num_cols
+                  << ", num_shards: " << lora_A_num_shards
+                  << ", shard_id: " << shard_id << std::endl;
+        load_peft_from_file((half *)weight.w0_ptr,
+                            lora_A_num_rows,
+                            lora_A_num_cols,
+                            lora_A_num_shards,
+                            shard_id,
+                            w0_filepath);
+        std::cout << "Loading LORA weight "
+                  << lora_layername_substr + "_B.weight"
+                  << ", num_rows: " << lora_B_num_rows
+                  << ", num_cols: " << lora_B_num_cols
+                  << ", num_shards: " << lora_B_num_shards
+                  << ", shard_id: " << shard_id << std::endl;
+        load_peft_from_file((half *)weight.w1_ptr,
+                            lora_B_num_rows,
+                            lora_B_num_cols,
+                            lora_B_num_shards,
+                            shard_id,
+                            w1_filepath);
+      } else {
+        assert(false && "Data type not supported");
+      }
+    } else {
+      // initialize weights
+      int seed = 0;
+      init_kernel_wrapper(m, seed);
+    }
+
+    // allocate space for gradients if the LoRA layer is trainable
+    if (lora_config.trainable) {
+      // Ensure we have an optimizer
+      assert(lora_config.optimizer_config != nullptr && "Optimizer not set");
+      assert(typeid(*lora_config.optimizer_config) !=
+                 typeid(LoraOptimizerConfig) &&
+             "Optimizer config is not a subclass of LoraOptimizerConfig");
+      if (lora->inputs[0]->dims[num_dims - 1].degree == 1) {
+        // Input is partitioned (no replication)
+        // w0_grad is local weight gradients
+        weight.w0_grad_ptr = allocator->allocate_local_weights_untyped(
+            model_id, w0_num_elements * data_type_size(dt));
+        // w1_grad is sync weight gradients
+        weight.w1_grad_ptr = allocator->allocate_sync_weights_untyped(
+            model_id, w1_num_elements * data_type_size(dt));
+      } else {
+        // Input is replicated
+        // w0_grad is sync weight gradients
+        weight.w0_grad_ptr = allocator->allocate_sync_weights_untyped(
+            model_id, w0_num_elements * data_type_size(dt));
+        // w1_grad is local weight gradients
+        weight.w1_grad_ptr = allocator->allocate_local_weights_untyped(
+            model_id, w1_num_elements * data_type_size(dt));
+      }
+      // allocate space for v_values if needed by optimizer
+      if (typeid(*lora_config.optimizer_config) ==
+          typeid(LoraSGDOptimizerConfig)) {
+        LoraSGDOptimizerConfig const *sgd_config =
+            static_cast<LoraSGDOptimizerConfig const *>(
+                lora_config.optimizer_config);
+        if (sgd_config->momentum > 0.0f) {
+          if (lora->inputs[0]->dims[num_dims - 1].degree == 1) {
+            weight.w0_v_values_ptr = allocator->allocate_local_weights_untyped(
+                model_id, w0_num_elements * data_type_size(dt));
+            weight.w1_v_values_ptr = allocator->allocate_sync_weights_untyped(
+                model_id, w1_num_elements * data_type_size(dt));
+          } else {
+            weight.w0_v_values_ptr = allocator->allocate_sync_weights_untyped(
+                model_id, w0_num_elements * data_type_size(dt));
+            weight.w1_v_values_ptr = allocator->allocate_local_weights_untyped(
+                model_id, w1_num_elements * data_type_size(dt));
+          }
+        }
+      } else if (typeid(*lora_config.optimizer_config) ==
+                 typeid(LoraAdamOptimizerConfig)) {
+        assert(false && "Adam optim not yet implemented");
+      } else {
+        assert(false && "Optimizer not supported");
+      }
+    }
+    assert(m->model_state.find(model_id) == m->model_state.end());
+    m->model_state[model_id].weights = weight;
+    m->model_state[model_id].optimizer_config = lora_config.optimizer_config;
+    m->model_state[model_id].lora_alpha = lora_config.lora_alpha;
+    m->model_state[model_id].cache_folder = lora_config.cache_folder;
+    m->model_state[model_id].peft_model_id = lora_config.peft_model_id;
+  }
+  return m;
+}
+
+void LoraLinear::forward(FFModel const &ff) {
+  assert(false && "LoraLinear does not support normal init");
+}
+
+FutureMap
+    LoraLinear::inference(FFModel const &ff,
+                          BatchConfigFuture const &bc,
+                          std::vector<ParallelTensor> const &batch_inputs,
+                          std::vector<ParallelTensor> const &batch_outputs,
+                          MachineView const *mv) {
+  assert(check_output_input_weight_same_parallel_is());
+  assert(batch_inputs.size() == 2);
+  assert(batch_outputs.size() == 1);
+  // Assert that the output and the second input are mapped to the same
+  // region/part
+  assert(batch_outputs[0]->region == batch_inputs[1]->region);
+  assert(batch_outputs[0]->part == batch_inputs[1]->part);
+  // assert(check_output_input_weight_same_machine_view());
+  // output is considered as an input to allow in-place optimization
+  ParallelTensor output_tensor = batch_outputs[0];
+  parallel_is = output_tensor->parallel_is;
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  MachineView const *view = mv ? mv : &output_tensor->machine_view;
+  size_t machine_view_hash = view->hash();
+  set_argumentmap_for_inference(ff, argmap, output_tensor);
+  IndexLauncher launcher(LORA_LINEAR_INF_TASK_ID,
+                         parallel_is,
+                         TaskArgument(nullptr, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[1]->region));
+  launcher.add_field(1, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+void LoraLinear::inference_task(Task const *task,
+                                std::vector<PhysicalRegion> const &regions,
+                                Context ctx,
+                                Runtime *runtime) {
+  LoraLinearMeta *m = *((LoraLinearMeta **)task->local_args);
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_active_tokens() == 0) {
+    return;
+  }
+  assert(regions.size() == 2);
+  assert(task->regions.size() == regions.size());
+  assert(m->input_type[0] == m->output_type[0]);
+
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorRW(
+      m->input_type[1], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  // int in_dim = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+  // int out_dim = output.domain.hi()[0] - output.domain.lo()[0] + 1;
+
+  // int num_infr_tokens = bc->num_active_infr_tokens();
+  // int num_peft_tokens = bc->num_active_peft_tokens();
+  inference_kernel_wrapper(m, bc, input, output);
+
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+
+    // get layer name
+    std::string lora_layername = std::string(m->op_name);
+    std::string searchString = "lora";
+    size_t found = lora_layername.find(searchString);
+    if (found == std::string::npos) {
+      std::cout << "LoraLinear layer name not in the right format (does not "
+                   "contain word 'lora')"
+                << std::endl;
+      assert(false);
+    }
+    std::string lora_layername_substr =
+        lora_layername.substr(0, found + searchString.length());
+    // print layer name
+    std::cout << "INF " << lora_layername_substr << std::endl;
+
+    // build output filepath
+    fs::path dst_filepath = get_dst_folder("fwd", m->decoding_step, shard_id);
+    if (m->layer_guid.model_id > 0) {
+      assert(false && "Model ID > 0 not supported yet");
+    }
+    std::string layername = "layers." +
+                            std::to_string(m->layer_guid.transformer_layer_id) +
+                            "." + lora_layername_substr;
+    dst_filepath /= layername;
+
+    // save batch config, if passed
+    if (bc != nullptr) {
+      bc->save_to_file(dst_filepath.string() + ".batch_config");
+    }
+
+    std::string filename = dst_filepath.string() + ".input_0";
+    if (input.data_type == DT_FLOAT) {
+      save_tensor(
+          input.get_float_ptr(), input.domain.get_volume(), filename.c_str());
+    } else if (input.data_type == DT_HALF) {
+      save_tensor(
+          input.get_half_ptr(), input.domain.get_volume(), filename.c_str());
+    } else {
+      assert(false);
+    }
+
+    int rank, num_tokens;
+    for (auto it = m->model_state.begin(); it != m->model_state.end(); ++it) {
+      PEFTModelID peft_model_id = it->first;
+      LoraLinearWeight weight = m->model_state[peft_model_id].weights;
+      rank = weight.rank;
+      num_tokens = input.domain.get_volume() / weight.in_dim;
+      fs::path dst_filepath_weights =
+          get_dst_folder("weights", m->decoding_step, shard_id) / layername;
+      std::string filenameA =
+          dst_filepath_weights.string() + ".weight_A.original";
+      std::string filenameB =
+          dst_filepath_weights.string() + ".weight_B.original";
+      if (m->input_type[0] == DT_FLOAT) {
+        save_tensor((float *)weight.w0_ptr,
+                    weight.rank * weight.in_dim,
+                    filenameA.c_str());
+        save_tensor((float *)weight.w1_ptr,
+                    weight.rank * weight.out_dim,
+                    filenameB.c_str());
+      } else if (m->input_type[0] == DT_HALF) {
+        save_tensor((half *)weight.w0_ptr,
+                    weight.rank * weight.in_dim,
+                    filenameA.c_str());
+        save_tensor((half *)weight.w1_ptr,
+                    weight.rank * weight.out_dim,
+                    filenameB.c_str());
+      } else {
+        assert(false && "Data type not supported");
+      }
+    }
+
+    filename = dst_filepath.string() + ".output_0";
+    if (output.data_type == DT_FLOAT) {
+      save_tensor(
+          output.get_float_ptr(), output.domain.get_volume(), filename.c_str());
+    } else if (output.data_type == DT_HALF) {
+      save_tensor(
+          output.get_half_ptr(), output.domain.get_volume(), filename.c_str());
+    } else {
+      assert(false);
+    }
+
+    if (bc->num_active_peft_tokens() > 0) {
+      // input activation (intermediate)
+      filename = dst_filepath.string() + ".low_rank_activation";
+      if (output.data_type == DT_FLOAT) {
+        save_tensor((float *)m->low_rank_activation,
+                    rank * num_tokens,
+                    filename.c_str());
+      } else if (output.data_type == DT_HALF) {
+        save_tensor((half *)m->low_rank_activation,
+                    rank * num_tokens,
+                    filename.c_str());
+      } else {
+        assert(false);
+      }
+    }
+    m->decoding_step++;
+  }
+}
+
+FutureMap LoraLinear::peft_bwd(FFModel const &ff,
+                               BatchConfigFuture const &bc,
+                               std::vector<ParallelTensor> const &batch_inputs,
+                               std::vector<ParallelTensor> const &batch_outputs,
+                               MachineView const *mv) {
+  assert(batch_inputs.size() == 2);
+  assert(batch_outputs.size() == 1);
+  // Assert that the output and the second input are mapped to the same
+  // region/part
+  assert(batch_outputs[0]->region == batch_inputs[1]->region);
+  assert(batch_outputs[0]->part == batch_inputs[1]->part);
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  ParallelTensor output_tensor = batch_outputs[0];
+  parallel_is = output_tensor->parallel_is;
+  MachineView const *view = mv ? mv : &output_tensor->machine_view;
+  set_argumentmap_for_inference(ff, argmap, output_tensor);
+  size_t machine_view_hash = view->hash();
+  IndexLauncher launcher(LORA_LINEAR_PEFT_BWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(nullptr, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[0]->part_grad,
+                        0 /*projection id*/,
+                        reset_input_grads[0] ? WRITE_ONLY : READ_WRITE,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region_grad));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[1]->part_grad,
+                        0 /*projection id*/,
+                        reset_input_grads[1] ? WRITE_ONLY : READ_WRITE,
+                        EXCLUSIVE,
+                        batch_inputs[1]->region_grad));
+  launcher.add_field(1, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+void lora_inference_debugging(LoraLinearMeta *m,
+                              BatchConfig const *bc,
+                              GenericTensorAccessorW input_grad,
+                              GenericTensorAccessorR output_grad,
+                              int shard_id) {
+  // get layer name
+  std::string lora_layername = std::string(m->op_name);
+  std::string searchString = "lora";
+  size_t found = lora_layername.find(searchString);
+  if (found == std::string::npos) {
+    std::cout << "LoraLinear layer name not in the right format (does not "
+                 "contain word 'lora')"
+              << std::endl;
+    assert(false);
+  }
+  std::string lora_layername_substr =
+      lora_layername.substr(0, found + searchString.length());
+  // print layer name
+  std::cout << "BWD " << lora_layername_substr << std::endl;
+
+  // build output filepath
+  fs::path dst_filepath = get_dst_folder("bwd", m->bwd_step, shard_id);
+  if (m->layer_guid.model_id > 0) {
+    assert(false && "Model ID > 0 not supported yet");
+  }
+  std::string layername = "layers." +
+                          std::to_string(m->layer_guid.transformer_layer_id) +
+                          "." + lora_layername_substr;
+  dst_filepath /= layername;
+
+  // save batch config, if passed
+  if (bc != nullptr) {
+    bc->save_to_file(dst_filepath.string() + ".batch_config");
+  }
+
+  // weights, weights gradients
+  fs::path dst_filepath_weights =
+      get_dst_folder("weights", m->bwd_step, shard_id) / layername;
+  assert(m->model_state.size() >= 1 && "Model state empty!");
+  for (auto it = m->model_state.begin(); it != m->model_state.end(); ++it) {
+    PEFTModelID peft_model_id = it->first;
+    LoraLinearWeight weight = m->model_state[peft_model_id].weights;
+    std::string filename_weight_A =
+        dst_filepath_weights.string() + ".weight_A.finetuned";
+    std::string filename_weight_B =
+        dst_filepath_weights.string() + ".weight_B.finetuned";
+    std::string filename_grad_A =
+        dst_filepath_weights.string() + ".weight_A.gradient";
+    std::string filename_grad_B =
+        dst_filepath_weights.string() + ".weight_B.gradient";
+    if (m->input_type[0] == DT_FLOAT) {
+      // weight A
+      save_tensor((float *)weight.w0_ptr,
+                  weight.rank * weight.in_dim,
+                  filename_weight_A.c_str());
+      // weight grad A
+      save_tensor((float *)weight.w0_grad_ptr,
+                  weight.rank * weight.in_dim,
+                  filename_grad_A.c_str());
+      // weight B
+      save_tensor((float *)weight.w1_ptr,
+                  weight.rank * weight.out_dim,
+                  filename_weight_B.c_str());
+      // weight grad B
+      save_tensor((float *)weight.w1_grad_ptr,
+                  weight.rank * weight.out_dim,
+                  filename_grad_B.c_str());
+    } else if (m->input_type[0] == DT_HALF) {
+      // weight A
+      save_tensor((half *)weight.w0_ptr,
+                  weight.rank * weight.in_dim,
+                  filename_weight_A.c_str());
+      // weight grad A
+      save_tensor((half *)weight.w0_grad_ptr,
+                  weight.rank * weight.in_dim,
+                  filename_grad_A.c_str());
+      // weight B
+      save_tensor((half *)weight.w1_ptr,
+                  weight.rank * weight.out_dim,
+                  filename_weight_B.c_str());
+      // weight grad B
+      save_tensor((half *)weight.w1_grad_ptr,
+                  weight.rank * weight.out_dim,
+                  filename_grad_B.c_str());
+    } else {
+      assert(false && "Data type not supported");
+    }
+  }
+
+  std::string filename = dst_filepath.string() + ".input_gradient_0";
+  if (input_grad.data_type == DT_FLOAT) {
+    save_tensor(input_grad.get_float_ptr(),
+                input_grad.domain.get_volume(),
+                filename.c_str());
+  } else if (input_grad.data_type == DT_HALF) {
+    save_tensor(input_grad.get_half_ptr(),
+                input_grad.domain.get_volume(),
+                filename.c_str());
+  } else {
+    assert(false);
+  }
+
+  filename = dst_filepath.string() + ".output_gradient_0";
+  if (output_grad.data_type == DT_FLOAT) {
+    save_tensor(output_grad.get_float_ptr(),
+                output_grad.domain.get_volume(),
+                filename.c_str());
+  } else if (output_grad.data_type == DT_HALF) {
+    save_tensor(output_grad.get_half_ptr(),
+                output_grad.domain.get_volume(),
+                filename.c_str());
+  } else {
+    assert(false);
+  }
+  m->bwd_step++;
+}
+
+template <typename DT>
+void save_peft_to_file(DT const *weight_ptr,
+                       size_t size,
+                       std::string filepath) {
+  std::ofstream out(filepath, std::ios::binary);
+  // Check if the file was opened successfully
+  if (!out || !out.is_open() || !out.good()) {
+    printf("Could not open file: %s\n", filepath.c_str());
+  }
+  assert(out && out.is_open() && out.good() &&
+         "can't write to lora weight file path");
+  std::vector<DT> host_array(size);
+  copy_tensor_dev_to_host(weight_ptr, host_array.data(), size);
+
+  size_t target_data_size = sizeof(DT) * size;
+  out.write((char *)host_array.data(), target_data_size);
+
+  size_t out_written_size = out.tellp();
+  if (out_written_size != target_data_size) {
+    printf("save weight data error: %lu, %lu, %lu\n",
+           out_written_size,
+           target_data_size,
+           sizeof(DT));
+    assert(false);
+  }
+  out.close();
+}
+
+void save_peft_weights_if_needed(LoraLinearMeta *m,
+                                 BatchConfig const *bc,
+                                 int in_dim,
+                                 int out_dim,
+                                 int shard_id) {
+  std::string lora_layername = std::string(m->op_name);
+  std::string searchString = "lora";
+  size_t found = lora_layername.find(searchString);
+  if (found == std::string::npos) {
+    std::cout << "LoraLinear layer name not in the right format (does not "
+                 "contain word 'lora')"
+              << std::endl;
+    assert(false);
+  }
+  std::string lora_layername_substr =
+      lora_layername.substr(0, found + searchString.length());
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    // Skip non-PEFT requests
+    if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+      continue;
+    }
+    // Skip PEFT forward-only requests
+    if (!bc->requestsInfo[i].peft_bwd) {
+      continue;
+    }
+    if (bc->requestsInfo[i].optimizer_tasks.save_updated_weights) {
+      assert(m->model_state.find(bc->requestsInfo[i].peft_model_id) !=
+             m->model_state.end());
+      std::string weight_export_folder = join_path({
+          m->model_state[bc->requestsInfo[i].peft_model_id].cache_folder,
+          "finetuned_models",
+          m->model_state[bc->requestsInfo[i].peft_model_id].peft_model_id,
+          "weights",
+          "shard_" + std::to_string(shard_id),
+      });
+      fs::create_directories(weight_export_folder);
+
+      int rank = m->model_state[bc->requestsInfo[i].peft_model_id].weights.rank;
+      int w0_num_elements = rank * in_dim;
+      int w1_num_elements = rank * out_dim;
+      std::string w0_filepath = join_path(
+          {weight_export_folder, lora_layername_substr + "_A.weight"});
+      std::string w1_filepath = join_path(
+          {weight_export_folder, lora_layername_substr + "_B.weight"});
+      if (m->input_type[0] == DT_FLOAT) {
+        save_peft_to_file(
+            (float *)m->model_state[bc->requestsInfo[i].peft_model_id]
+                .weights.w0_ptr,
+            w0_num_elements,
+            w0_filepath);
+        if (shard_id == 0) {
+          save_peft_to_file(
+              (float *)m->model_state[bc->requestsInfo[i].peft_model_id]
+                  .weights.w1_ptr,
+              w1_num_elements,
+              w1_filepath);
+        }
+      } else if (m->input_type[0] == DT_HALF) {
+        save_peft_to_file(
+            (half *)m->model_state[bc->requestsInfo[i].peft_model_id]
+                .weights.w0_ptr,
+            w0_num_elements,
+            w0_filepath);
+        if (shard_id == 0) {
+          save_peft_to_file(
+              (half *)m->model_state[bc->requestsInfo[i].peft_model_id]
+                  .weights.w1_ptr,
+              w1_num_elements,
+              w1_filepath);
+        }
+      } else {
+        assert(false && "Data type not supported");
+      }
+    }
+  }
+}
+
+void LoraLinear::peft_bwd_task(Task const *task,
+                               std::vector<PhysicalRegion> const &regions,
+                               Context ctx,
+                               Runtime *runtime) {
+  Domain input_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  LoraLinearMeta *m = *((LoraLinearMeta **)task->local_args);
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_active_peft_tokens() == 0) {
+    return;
+  }
+  assert(regions.size() == 2);
+  assert(task->regions.size() == regions.size());
+  assert(m->input_type[0] == m->output_type[0]);
+  assert(task->index_point.get_dim() == 1);
+  int shard_id = task->index_point.point_data[0];
+
+  GenericTensorAccessorW input_grad = helperGetGenericTensorAccessorRW(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR output_grad = helperGetGenericTensorAccessorRO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  int in_dim = input_grad.domain.hi()[0] - input_grad.domain.lo()[0] + 1;
+  int out_dim = output_grad.domain.hi()[0] - output_grad.domain.lo()[0] + 1;
+  // int num_infr_tokens = bc->num_active_infr_tokens();
+  // int num_peft_tokens = bc->num_active_peft_tokens();
+  peft_bwd_kernel_wrapper(m, bc, input_grad, output_grad);
+
+  save_peft_weights_if_needed(m, bc, in_dim, out_dim, shard_id);
+
+  if (m->inference_debugging) {
+    lora_inference_debugging(m, bc, input_grad, output_grad, shard_id);
+  }
+}
+
+void LoraLinear::backward(FFModel const &ff) {
+  assert(false && "LoraLinear does not support normal backward");
+}
+
+void LoraLinear::print_layer(FFModel const &ff) {}
+
+void LoraLinear::map_output_tensors(FFModel &ff) {
+  assert(numOutputs == 1);
+  assert(numInputs == 2);
+  assert(outputs[0]->get_volume() == inputs[1]->get_volume());
+  outputs[0]->parallel_is = inputs[1]->parallel_is;
+  outputs[0]->region = inputs[1]->region;
+  outputs[0]->part = inputs[1]->part;
+  outputs[0]->region_grad = inputs[1]->region_grad;
+  outputs[0]->part_grad = inputs[1]->part_grad;
+}
+
+bool LoraLinear::measure_operator_cost(Simulator *sim,
+                                       MachineView const &mv,
+                                       CostMetrics &cost_metrics) const {
+  return false;
+}
+
+bool operator==(LoraLinearParams const &lhs, LoraLinearParams const &rhs) {
+  if (lhs.layer_guid == rhs.layer_guid && lhs.type == rhs.type &&
+      lhs.peft_configs.size() == rhs.peft_configs.size()) {
+    for (auto const &kv : lhs.peft_configs) {
+      auto it = rhs.peft_configs.find(kv.first);
+      if (it == rhs.peft_configs.end() || !(it->second == kv.second)) {
+        return false;
+      }
+    }
+    return true;
+  }
+  return false;
+}
+
+fs::path create_unique_temp_directory() {
+  std::srand(static_cast<unsigned int>(std::time(nullptr)));
+
+  fs::path temp_dir = fs::temp_directory_path();
+  fs::path unique_path;
+
+  do {
+    std::string unique_name = "flexflow_tmp_" + std::to_string(std::rand());
+    unique_path = temp_dir / unique_name;
+  } while (fs::exists(unique_path));
+
+  fs::create_directory(unique_path);
+  return unique_path;
+}
+
+void serialize_string(Legion::Serializer &sez,
+                      std::string string_to_serialize) {
+  sez.serialize(string_to_serialize.length());
+  sez.serialize(string_to_serialize.c_str(), string_to_serialize.length());
+}
+
+std::string deserialize_string(Legion::Deserializer &dez) {
+  size_t string_size;
+  char buffer[4096] = {0};
+  dez.deserialize(string_size);
+  dez.deserialize(buffer, string_size);
+  return std::string(buffer);
+}
+
+void LoraLinear::serialize(Legion::Serializer &sez) const {
+  sez.serialize(this->layer_guid.id);
+  sez.serialize(this->layer_guid.transformer_layer_id);
+  sez.serialize(this->layer_guid.model_id);
+  sez.serialize(this->op_type);
+  sez.serialize(this->peft_configs.size());
+  for (auto const &kv : this->peft_configs) {
+    // Serialize PEFTModelID
+    sez.serialize(kv.first.id);
+
+    // Serialize LoraLinearConfig and OptimizerConfig to tmp folder
+    // 1. Create tmp dir and serialize it
+    fs::path unique_temp_dir = create_unique_temp_directory();
+    serialize_string(sez, unique_temp_dir.string());
+    // 2. Dump LoraLinearConfig to json file in tmp dir
+    std::string lora_config_filename = std::string("lora_linear_config_") +
+                                       std::to_string(kv.first.id) +
+                                       std::string(".json");
+    fs::path lora_config_json_filepath = unique_temp_dir / lora_config_filename;
+    serialize_to_json_file(kv.second, lora_config_json_filepath);
+    // 3. Dump optimizer to json file in tmp dir, and serialize optimizer type
+    std::string optimizer_filename = std::string("optimizer_config_") +
+                                     std::to_string(kv.first.id) +
+                                     std::string(".json");
+    fs::path optim_config_filepath = unique_temp_dir / optimizer_filename;
+    assert((kv.second.trainable) == (kv.second.optimizer_config != nullptr));
+    if (kv.second.trainable) {
+      if (typeid(*kv.second.optimizer_config) ==
+          typeid(LoraSGDOptimizerConfig)) {
+        sez.serialize(OPTIMIZER_TYPE_SGD);
+        LoraSGDOptimizerConfig const *sgd_config =
+            static_cast<LoraSGDOptimizerConfig const *>(
+                kv.second.optimizer_config);
+        serialize_to_json_file(*sgd_config, optim_config_filepath);
+      } else if (typeid(*kv.second.optimizer_config) ==
+                 typeid(LoraAdamOptimizerConfig)) {
+        sez.serialize(OPTIMIZER_TYPE_ADAM);
+        LoraAdamOptimizerConfig const *adam_config =
+            static_cast<LoraAdamOptimizerConfig const *>(
+                kv.second.optimizer_config);
+        serialize_to_json_file(*adam_config, optim_config_filepath);
+      } else {
+        assert(false && "Optimizer type not yet supported");
+      }
+    }
+  }
+  sez.serialize(strlen(this->name));
+  sez.serialize(this->name, strlen(this->name));
+}
+
+/* static */
+using PCG::Node;
+Node LoraLinear::deserialize(FFModel &ff,
+                             Legion::Deserializer &dez,
+                             ParallelTensor inputs[],
+                             int num_inputs) {
+  assert(num_inputs == 2);
+  size_t id, transformer_layer_id, deserialized_model_id;
+  OperatorType op_type;
+  size_t num_pefts;
+  size_t name_len;
+  char name[MAX_OPNAME] = {0};
+
+  LoraLinearParams params;
+
+  dez.deserialize(id);
+  dez.deserialize(transformer_layer_id);
+  dez.deserialize(deserialized_model_id);
+  dez.deserialize(op_type);
+  dez.deserialize(num_pefts);
+  for (int i = 0; i < num_pefts; i++) {
+    // Deserialize PEFTModelID
+    size_t pid;
+    dez.deserialize(pid);
+    PEFTModelID peft_model_id(pid);
+    // Deserialize tmp folder containing LoraLinearConfig and optimizer config
+    fs::path unique_temp_dir = fs::path(deserialize_string(dez));
+    // 1. Deserialize LoraLinearConfig
+    std::string lora_config_filename = std::string("lora_linear_config_") +
+                                       std::to_string(pid) +
+                                       std::string(".json");
+    fs::path lora_config_json_filepath = unique_temp_dir / lora_config_filename;
+    std::unique_ptr<LoraLinearConfig> lora_linear_config =
+        deserialize_from_json_file<LoraLinearConfig>(lora_config_json_filepath);
+    // 2. Deserialize optimizer if needed
+    if (lora_linear_config->trainable) {
+      std::string optimizer_filename = std::string("optimizer_config_") +
+                                       std::to_string(pid) +
+                                       std::string(".json");
+      fs::path optim_config_filepath = unique_temp_dir / optimizer_filename;
+      OptimizerType type_;
+      dez.deserialize(type_);
+      if (type_ == OPTIMIZER_TYPE_SGD) {
+        std::unique_ptr<LoraSGDOptimizerConfig> sgd_optimizer_config =
+            deserialize_from_json_file<LoraSGDOptimizerConfig>(
+                optim_config_filepath);
+        lora_linear_config->optimizer_config =
+            dynamic_cast<LoraOptimizerConfig *>(sgd_optimizer_config.release());
+      } else if (type_ == OPTIMIZER_TYPE_ADAM) {
+        std::unique_ptr<LoraAdamOptimizerConfig> adam_optimizer_config =
+            deserialize_from_json_file<LoraAdamOptimizerConfig>(
+                optim_config_filepath);
+        lora_linear_config->optimizer_config =
+            dynamic_cast<LoraOptimizerConfig *>(
+                adam_optimizer_config.release());
+      } else {
+        printf("Optimizer type: %d\n", type_);
+        assert(false && "Optimizer type not yet supported");
+      }
+    }
+    try {
+      fs::remove_all(unique_temp_dir);
+    } catch (fs::filesystem_error const &e) {
+      std::cerr << "Error removing tmp directory: " << e.what() << std::endl;
+    }
+    params.peft_configs.emplace(
+        std::make_pair(peft_model_id, *lora_linear_config));
+  }
+  dez.deserialize(name_len);
+  dez.deserialize(name, name_len);
+  LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
+
+  params.layer_guid = layer_guid;
+  params.type = op_type;
+  strcpy(params.name, name);
+  return ff.get_or_create_node<LoraLinear>({inputs[0], inputs[1]}, params);
+}
+
+Op *LoraLinear::materialize(FFModel &ff,
+                            ParallelTensor inputs[],
+                            int num_inputs) const {
+  LoraLinearParams params = get_params();
+  return new LoraLinear(ff, params, {inputs[0], inputs[1]}, this->name);
+}
+
+LoraLinearParams LoraLinear::get_params() const {
+  LoraLinearParams params;
+  params.layer_guid = this->layer_guid;
+  params.type = this->op_type;
+  if (strlen(this->name) < MAX_OPNAME) {
+    strcpy(params.name, this->name);
+  }
+  params.peft_configs = this->peft_configs;
+  return params;
+}
+
+bool LoraLinearParams::is_valid(
+    std::pair<ParallelTensorShape, ParallelTensorShape> const &input_shape)
+    const {
+  return true;
+}
+
+}; // namespace FlexFlow
+
+namespace std {
+size_t hash<FlexFlow::LoraLinearParams>::operator()(
+    FlexFlow::LoraLinearParams const &params) const {
+  size_t key = 0;
+  hash_combine(key, params.layer_guid.id);
+  hash_combine(key, params.layer_guid.transformer_layer_id);
+  hash_combine(key, params.layer_guid.model_id);
+  for (auto const &kv : params.peft_configs) {
+    hash_combine(key, kv.first.id);
+    hash_combine(key, kv.second.rank);
+    hash_combine(key, kv.second.trainable);
+    hash_combine(key, kv.second.cache_folder);
+    hash_combine(key, kv.second.peft_model_id);
+    hash_combine(key, kv.second.lora_alpha);
+    hash_combine(key, kv.second.lora_dropout);
+    hash_combine(key, kv.second.target_modules);
+    hash_combine(key, kv.second.init_lora_weights);
+  }
+  return key;
+}
+}; // namespace std
diff --git a/src/ops/lora_linear_params.cc b/src/ops/lora_linear_params.cc
new file mode 100644
index 0000000000..6e0c60e057
--- /dev/null
+++ b/src/ops/lora_linear_params.cc
@@ -0,0 +1,221 @@
+#include "flexflow/ops/lora_linear_params.h"
+#include <fstream>
+#include <nlohmann/json.hpp>
+#include <string>
+using json = nlohmann::json;
+
+namespace FlexFlow {
+
+// ---------------- Optimizer configs ----------------
+// ---------------------------------------------------
+
+// empty optimizer
+LoraOptimizerConfig::LoraOptimizerConfig() {}
+
+// SGD optimizer
+LoraSGDOptimizerConfig::LoraSGDOptimizerConfig()
+    : lr(0.001f), momentum(0.0f), nesterov(false), weight_decay(0.0f) {}
+
+LoraSGDOptimizerConfig::LoraSGDOptimizerConfig(double lr_,
+                                               double momentum_,
+                                               bool nesterov_,
+                                               bool weight_decay_)
+    : lr(lr_), momentum(momentum_), nesterov(nesterov_),
+      weight_decay(weight_decay_) {}
+
+std::ostream &operator<<(std::ostream &os, LoraSGDOptimizerConfig const &llc) {
+  os << "SGD Optimizer (lr=" << llc.lr << ",momentum=" << llc.momentum
+     << ",nesterov=" << llc.nesterov << ",weight_decay=" << llc.weight_decay
+     << ")";
+  return os;
+}
+
+// Adam optimizer
+LoraAdamOptimizerConfig::LoraAdamOptimizerConfig()
+    : alpha(0.001f), beta1(0.9f), beta2(0.999f), weight_decay(0.0f),
+      epsilon(1e-8) {}
+
+LoraAdamOptimizerConfig::LoraAdamOptimizerConfig(double alpha_,
+                                                 double beta1_,
+                                                 double beta2_,
+                                                 double weight_decay_,
+                                                 double epsilon_)
+    : alpha(alpha_), beta1(beta1_), beta2(beta2_), weight_decay(weight_decay_),
+      epsilon(epsilon_) {}
+
+std::ostream &operator<<(std::ostream &os, LoraAdamOptimizerConfig const &llc) {
+  os << "SGD Optimizer (alpha=" << llc.alpha << ",beta1=" << llc.beta1
+     << ",beta2=" << llc.beta2 << ",weight_decay=" << llc.weight_decay
+     << ",epsilon=" << llc.epsilon << ")";
+  return os;
+}
+
+// Serialization helpers
+template <typename T>
+void serialize_to_json_file(T const &obj, fs::path const &filepath) {
+  json j = obj;
+  std::ofstream file(filepath);
+  file << j.dump(4);
+}
+
+template <typename T>
+std::unique_ptr<T> deserialize_from_json_file(fs::path const &filepath) {
+  std::ifstream file(filepath);
+  json j;
+  file >> j;
+  return std::make_unique<T>(j.get<T>());
+}
+
+template void
+    serialize_to_json_file<LoraLinearConfig>(LoraLinearConfig const &obj,
+                                             fs::path const &filepath);
+template void serialize_to_json_file<LoraSGDOptimizerConfig>(
+    LoraSGDOptimizerConfig const &obj, fs::path const &filepath);
+template void serialize_to_json_file<LoraAdamOptimizerConfig>(
+    LoraAdamOptimizerConfig const &obj, fs::path const &filepath);
+template std::unique_ptr<LoraLinearConfig>
+    deserialize_from_json_file<LoraLinearConfig>(fs::path const &filepath);
+template std::unique_ptr<LoraSGDOptimizerConfig>
+    deserialize_from_json_file<LoraSGDOptimizerConfig>(
+        fs::path const &filepath);
+template std::unique_ptr<LoraAdamOptimizerConfig>
+    deserialize_from_json_file<LoraAdamOptimizerConfig>(
+        fs::path const &filepath);
+
+// ------------------ LoRA configs -------------------
+// ---------------------------------------------------
+const LoraLinearConfig LoraLinearConfig::EmptyConfig = LoraLinearConfig("", "");
+
+LoraLinearConfig::LoraLinearConfig(
+    std::string const &cache_folder_,
+    std::string const &peft_model_id_,
+    bool trainable_,
+    LoraOptimizerConfig *optimizer_config_,
+    bool init_lora_weights_,
+    std::string const &base_model_name_or_path_,
+    std::string const &precision_,
+    int rank_,
+    float lora_alpha_,
+    float lora_dropout_,
+    std::vector<std::string> const &target_modules_)
+    : cache_folder(cache_folder_), peft_model_id(peft_model_id_), rank(rank_),
+      lora_alpha(lora_alpha_), lora_dropout(lora_dropout_),
+      trainable(trainable_), optimizer_config(optimizer_config_),
+      init_lora_weights(init_lora_weights_),
+      base_model_name_or_path(base_model_name_or_path_), precision(precision_),
+      target_modules(target_modules_) {
+
+  if (peft_model_id.empty()) {
+    return;
+  }
+  assert(!cache_folder.empty() &&
+         "cache_folder must be provided when using PEFT");
+  if (trainable) {
+    assert(optimizer_config != nullptr &&
+           "optimizer_config must be provided when using PEFT");
+    assert(
+        !base_model_name_or_path.empty() &&
+        "base_model_name_or_path must be provided when training a PEFT model");
+    assert(!precision.empty() &&
+           "precision must be provided when training a PEFT model");
+  } else {
+    assert(init_lora_weights == false &&
+           "init_lora_weights must be false when LORA not trainable");
+    assert(optimizer_config == nullptr &&
+           "optimizer_config must be nullptr when not trainable");
+  }
+  // if we are not initializing LORA from scratch, load the configs from
+  // existing repository
+  if (!init_lora_weights) {
+    std::string peft_inference_config_file_path =
+        join_path({cache_folder, "configs", peft_model_id, "config.json"});
+    std::ifstream config_file(peft_inference_config_file_path);
+    if (config_file.is_open()) {
+      try {
+        json model_config;
+        config_file >> model_config;
+        rank = model_config["r"];
+        lora_alpha = float(model_config["lora_alpha"]);
+        lora_dropout = model_config["lora_dropout"];
+        for (auto &s : model_config["target_modules"]) {
+          target_modules.push_back(s);
+        }
+        // do not load the base_model_name_or_path from the HF config because we
+        // may be applying LoRA to another model
+      } catch (json::exception const &e) {
+        std::cerr << "Error parsing PEFT config from JSON file: " << e.what()
+                  << std::endl;
+        assert(false);
+      }
+    } else {
+      std::cerr << "Error opening JSON file " << peft_inference_config_file_path
+                << std::endl;
+      assert(false);
+    }
+  }
+  assert(rank > 0 && "rank must be greater than 0");
+  assert(lora_alpha > 0.0f && "lora_alpha must be greater than 0.0");
+  assert(lora_dropout >= 0.0f && lora_dropout <= 1.0f &&
+         "lora_dropout must be in [0.0, 1.0]");
+  assert(target_modules.size() > 0 && "target_modules must not be left empty");
+}
+
+// constructor used to support unordered_map
+LoraLinearConfig::LoraLinearConfig() : LoraLinearConfig("", "") {}
+
+bool operator==(LoraLinearConfig const &lhs, LoraLinearConfig const &rhs) {
+  if (lhs.cache_folder == rhs.cache_folder &&
+      lhs.peft_model_id == rhs.peft_model_id && lhs.rank == rhs.rank &&
+      lhs.lora_alpha == rhs.lora_alpha &&
+      lhs.lora_dropout == rhs.lora_dropout &&
+      lhs.target_modules.size() == rhs.target_modules.size() &&
+      lhs.trainable == rhs.trainable &&
+      lhs.init_lora_weights == rhs.init_lora_weights &&
+      lhs.optimizer_config == rhs.optimizer_config &&
+      lhs.base_model_name_or_path == rhs.base_model_name_or_path &&
+      lhs.precision == rhs.precision) {
+    for (int i = 0; i < lhs.target_modules.size(); i++) {
+      if (lhs.target_modules[i] != rhs.target_modules[i]) {
+        return false;
+      }
+    }
+    return true;
+  }
+  return false;
+}
+
+std::ostream &operator<<(std::ostream &os, LoraLinearConfig const &llc) {
+  os << "LoraLinearConfig: ";
+  os << "cache_folder: " << llc.cache_folder << ", ";
+  os << "peft_model_id: " << llc.peft_model_id << ", ";
+  os << "rank: " << llc.rank << ", ";
+  os << "lora_alpha: " << llc.lora_alpha << ", ";
+  os << "lora_dropout: " << llc.lora_dropout << ", ";
+  os << "target_modules: [";
+  for (int i = 0; i < llc.target_modules.size(); i++) {
+    os << llc.target_modules[i];
+    if (i < llc.target_modules.size() - 1) {
+      os << ", ";
+    }
+  }
+  os << "], ";
+  os << "trainable: " << llc.trainable << ", ";
+  if (llc.optimizer_config != nullptr) {
+    os << "optimizer_config: ";
+    if (typeid(*llc.optimizer_config) == typeid(LoraSGDOptimizerConfig)) {
+      os << *static_cast<LoraSGDOptimizerConfig *>(llc.optimizer_config);
+    } else if (typeid(*llc.optimizer_config) ==
+               typeid(LoraAdamOptimizerConfig)) {
+      os << *static_cast<LoraAdamOptimizerConfig *>(llc.optimizer_config);
+    } else {
+      os << "Unknown optimizer config type";
+    }
+    std::cout << std::endl;
+  }
+  os << "init_lora_weights: " << llc.init_lora_weights << std::endl;
+  os << "base_model_name_or_path: " << llc.base_model_name_or_path << std::endl;
+  os << "precision: " << llc.precision << std::endl;
+  return os;
+}
+
+}; // namespace FlexFlow
diff --git a/src/ops/mean.cc b/src/ops/mean.cc
index b2ec94fdf8..0d41276735 100644
--- a/src/ops/mean.cc
+++ b/src/ops/mean.cc
@@ -87,8 +87,7 @@ OpMeta *Mean::init_task(Task const *task,
                         Context ctx,
                         Runtime *runtime) {
   FFHandler handler = *((FFHandler const *)task->local_args);
-  OpMeta *m = new OpMeta(handler);
-  return m;
+  return nullptr;
 }
 
 void Mean::forward(FFModel const &ff) {}
diff --git a/src/ops/noop.cc b/src/ops/noop.cc
index da2d4922e3..45bd76d59d 100644
--- a/src/ops/noop.cc
+++ b/src/ops/noop.cc
@@ -90,8 +90,9 @@ OpMeta *NoOp::init_task(Task const *task,
                         std::vector<PhysicalRegion> const &regions,
                         Context ctx,
                         Runtime *runtime) {
+  NoOp *no_op = (NoOp *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
-  OpMeta *m = new OpMeta(handle);
+  OpMeta *m = new OpMeta(handle, no_op);
   return m;
 }
 
@@ -167,7 +168,7 @@ void NoOp::init_inference(FFModel const &ff,
     set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
     IndexLauncher launcher(NOOP_INIT_TASK_ID,
                            parallel_is,
-                           TaskArgument(NULL, 0),
+                           TaskArgument(this, sizeof(NoOp)),
                            argmap,
                            Predicate::TRUE_PRED,
                            false /*must*/,
@@ -244,7 +245,7 @@ void NoOp::init(FFModel const &ff) {
     set_argumentmap_for_init(ff, argmap);
     IndexLauncher launcher(NOOP_INIT_TASK_ID,
                            parallel_is,
-                           TaskArgument(NULL, 0),
+                           TaskArgument(this, sizeof(NoOp)),
                            argmap,
                            Predicate::TRUE_PRED,
                            false /*must*/,
diff --git a/src/ops/pool_2d.cc b/src/ops/pool_2d.cc
index 4621ab5909..c8b194afa9 100644
--- a/src/ops/pool_2d.cc
+++ b/src/ops/pool_2d.cc
@@ -315,7 +315,7 @@ OpMeta *Pool2D::init_task(Task const *task,
   assert(task->regions.size() == 2);
   Pool2D const *pool = (Pool2D *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
-  Pool2DMeta *m = new Pool2DMeta(handle);
+  Pool2DMeta *m = new Pool2DMeta(handle, pool);
   m->profiling = pool->profiling;
   m->inference_debugging = pool->inference_debugging;
   std::strcpy(m->op_name, pool->name);
@@ -545,7 +545,7 @@ bool Pool2D::measure_operator_cost(Simulator *sim,
   int output_n = sub_output.dims[3].size;
   int pad_h = ((output_h - 1) * stride_h + kernel_h - input_h + 1) / 2;
   int pad_w = ((output_w - 1) * stride_w + kernel_w - input_w + 1) / 2;
-  Pool2DMeta *m = sim->pool2d_meta;
+  Pool2DMeta *m = new Pool2DMeta(sim->handler, this);
 
   init_kernel(m,
               input_w,
diff --git a/src/ops/reduce.cc b/src/ops/reduce.cc
index 454a35caf4..1c0566e9ca 100644
--- a/src/ops/reduce.cc
+++ b/src/ops/reduce.cc
@@ -41,7 +41,7 @@ ReduceParams Reduce::get_params() const {
   }
   params.keepdims = keepdims;
   params.layer_guid = this->layer_guid;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
diff --git a/src/ops/reduce.cpp b/src/ops/reduce.cpp
index c062955ed6..fe122b13eb 100644
--- a/src/ops/reduce.cpp
+++ b/src/ops/reduce.cpp
@@ -25,7 +25,7 @@ using Legion::Domain;
 ReduceMeta::ReduceMeta(FFHandler handler,
                        Reduce const *rd,
                        Domain const &input_domain)
-    : OpMeta(handler) {
+    : OpMeta(handler, rd) {
   checkCUDNN(miopenCreateReduceTensorDescriptor(&reduceDesc));
   checkCUDNN(miopenCreateTensorDescriptor(&inputTensor));
   checkCUDNN(miopenCreateTensorDescriptor(&outputTensor));
diff --git a/src/ops/reduce.cu b/src/ops/reduce.cu
index 65efd90e9b..1352787a12 100644
--- a/src/ops/reduce.cu
+++ b/src/ops/reduce.cu
@@ -24,7 +24,7 @@ using Legion::Domain;
 ReduceMeta::ReduceMeta(FFHandler handler,
                        Reduce const *rd,
                        Domain const &input_domain)
-    : OpMeta(handler) {
+    : OpMeta(handler, rd) {
   checkCUDNN(cudnnCreateReduceTensorDescriptor(&reduceDesc));
   checkCUDNN(cudnnCreateTensorDescriptor(&inputTensor));
   checkCUDNN(cudnnCreateTensorDescriptor(&outputTensor));
diff --git a/src/ops/reshape.cc b/src/ops/reshape.cc
index 49f99e2cb5..4e7fd2eb96 100644
--- a/src/ops/reshape.cc
+++ b/src/ops/reshape.cc
@@ -180,7 +180,7 @@ OpMeta *Reshape::init_task(Task const *task,
                            Runtime *runtime) {
   Reshape const *reshape = (Reshape *)task->args;
   FFHandler handle = *((FFHandler const *)task->local_args);
-  ReshapeMeta *m = new ReshapeMeta(handle);
+  ReshapeMeta *m = new ReshapeMeta(handle, reshape);
   std::strcpy(m->op_name, reshape->name);
   m->layer_guid = reshape->layer_guid;
   m->data_type = reshape->outputs[0]->data_type;
@@ -296,7 +296,7 @@ ReshapeParams Reshape::get_params() const {
   ReshapeParams params;
   params.shape = shape_vec;
   params.layer_guid = this->layer_guid;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
diff --git a/src/ops/residual_layer_norm.cc b/src/ops/residual_layer_norm.cc
index 8dd670eea3..2a30d12d6d 100644
--- a/src/ops/residual_layer_norm.cc
+++ b/src/ops/residual_layer_norm.cc
@@ -44,7 +44,8 @@ bool operator==(ResidualLayerNormParams const &lhs,
   return lhs.layer_guid == rhs.layer_guid && lhs.axes == rhs.axes &&
          lhs.elementwise_affine == rhs.elementwise_affine &&
          lhs.use_bias == rhs.use_bias &&
-         lhs.use_two_residuals == rhs.use_two_residuals;
+         lhs.use_two_residuals == rhs.use_two_residuals &&
+         lhs.inplace_residual == rhs.inplace_residual;
 }
 
 bool ResidualLayerNormParams::is_valid(
@@ -63,7 +64,8 @@ ResidualLayerNormParams ResidualLayerNorm::get_params() const {
   params.eps = this->eps;
   params.use_bias = this->use_bias;
   params.use_two_residuals = this->use_two_residuals;
-  if (this->name != nullptr) {
+  params.inplace_residual = this->inplace_residual;
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
@@ -78,6 +80,7 @@ void FFModel::residual_layer_norm(const Tensor input,
                                   bool elementwise_affine,
                                   float eps,
                                   bool use_bias,
+                                  bool inplace_residual,
                                   DataType data_type,
                                   char const *name) {
   // In PyTorch, axes must be the sizes of the last axes.size() dimensions of
@@ -117,7 +120,6 @@ void FFModel::residual_layer_norm(const Tensor input,
   }
 
   int num_weights = elementwise_affine ? (use_bias ? 2 : 1) : 0;
-  Layer *ln = nullptr;
   Tensor casted_input =
       (data_type != input->data_type)
           ? cast(input, data_type, "type cast for residual_layer_norm")
@@ -133,20 +135,20 @@ void FFModel::residual_layer_norm(const Tensor input,
             ? cast(residual2, data_type, "type cast for residual2_layer_norm")
             : residual2;
   }
-  ln = new Layer(this,
-                 OP_RESIDUAL_LAYERNORM,
-                 data_type,
-                 name,
-                 2 + use_two_residuals /*inputs*/,
-                 num_weights,
-                 2 /*outputs*/,
-                 casted_input,
-                 casted_residual1,
-                 casted_residual2);
+  Layer *ln = new Layer(this,
+                        OP_RESIDUAL_LAYERNORM,
+                        data_type,
+                        name,
+                        2 + use_two_residuals /*inputs*/,
+                        num_weights,
+                        2 /*outputs*/,
+                        casted_input,
+                        casted_residual1,
+                        casted_residual2);
   ln->outputs[0] = create_tensor_legion_ordering(
-      input->num_dims, input->dims, data_type, ln, 0, false /*create_grad*/);
+      input->num_dims, input->dims, data_type, ln, 0, true /*create_grad*/);
   ln->outputs[1] = create_tensor_legion_ordering(
-      input->num_dims, input->dims, data_type, ln, 1, false /*create_grad*/);
+      input->num_dims, input->dims, data_type, ln, 1, true /*create_grad*/);
   {
     int numdims = axes.size();
     int dims[numdims];
@@ -179,6 +181,7 @@ void FFModel::residual_layer_norm(const Tensor input,
   ln->add_int_vector_property("axes", axes);
   ln->add_float_property("eps", eps);
   ln->add_int_property("use_two_residuals", use_two_residuals);
+  ln->add_int_property("inplace_residual", inplace_residual);
   layers.push_back(ln);
   outputs[0] = ln->outputs[0];
   outputs[1] = ln->outputs[1];
@@ -199,6 +202,9 @@ Op *ResidualLayerNorm::create_operator_from_layer(
   layer->get_float_property("eps", eps);
   layer->get_int_property("use_two_residuals", value);
   bool use_two_residuals = (bool)value;
+  layer->get_int_property("inplace_residual", value);
+  bool inplace_residual = (bool)value;
+
   return new ResidualLayerNorm(model,
                                layer->layer_guid,
                                inputs[0],
@@ -209,6 +215,7 @@ Op *ResidualLayerNorm::create_operator_from_layer(
                                elementwise_affine,
                                use_bias,
                                eps,
+                               inplace_residual,
                                false, // allocate_weights
                                layer->name);
 }
@@ -230,6 +237,7 @@ ResidualLayerNorm::ResidualLayerNorm(
                         params.elementwise_affine,
                         params.use_bias,
                         params.eps,
+                        params.inplace_residual,
                         allocate_weights,
                         params.name) {}
 
@@ -243,6 +251,7 @@ ResidualLayerNorm::ResidualLayerNorm(FFModel &model,
                                      bool _elementwise_affine,
                                      bool _use_bias,
                                      float _eps,
+                                     bool _inplace_residual,
                                      bool allocate_weights,
                                      char const *name)
     : Op(model,
@@ -256,7 +265,8 @@ ResidualLayerNorm::ResidualLayerNorm(FFModel &model,
          _residual1,
          _use_two_residuals ? _residual2 : nullptr),
       elementwise_affine(_elementwise_affine), eps(_eps), axes(_axes),
-      use_bias(_use_bias), use_two_residuals(_use_two_residuals) {
+      use_bias(_use_bias), use_two_residuals(_use_two_residuals),
+      inplace_residual(_inplace_residual) {
   // overwrite layer_guid
   layer_guid = _layer_guid;
   outputs[0] = model.create_parallel_tensor_legion_ordering(
@@ -326,6 +336,22 @@ ResidualLayerNorm::ResidualLayerNorm(FFModel &model,
   }
 }
 
+void ResidualLayerNorm::map_output_tensors(FFModel &ff) {
+  assert(numOutputs == 2);
+  assert(outputs[0]->get_volume() == inputs[0]->get_volume());
+  if (inplace_residual) {
+    outputs[0]->parallel_is = inputs[0]->parallel_is;
+    outputs[0]->region = inputs[0]->region;
+    outputs[0]->part = inputs[0]->part;
+    outputs[0]->region_grad = inputs[0]->region_grad;
+    outputs[0]->part_grad = inputs[0]->part_grad;
+    // map output 1 to new region
+    ff.map_tensor(outputs[1], this);
+  } else {
+    Op::map_output_tensors(ff);
+  }
+}
+
 void ResidualLayerNorm::init_inference(
     FFModel const &ff,
     std::vector<ParallelTensor> const &batch_inputs,
@@ -347,13 +373,19 @@ void ResidualLayerNorm::init_inference(
                          false /*must*/,
                          0 /*mapper_id*/,
                          machine_view_hash);
+  if (inplace_residual) {
+    assert(batch_outputs[0]->part == batch_inputs[0]->part);
+    assert(batch_outputs[0]->region == batch_inputs[0]->region);
+  }
   int field_id = 0;
   // input
-  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_inputs[0]->region));
+  // added: input + residual(s)
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[0]->part,
+                        0 /*projection id*/,
+                        inplace_residual ? READ_WRITE : READ_ONLY,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region));
   launcher.add_field(field_id++, FID_DATA);
   // residual1
   launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
@@ -371,13 +403,15 @@ void ResidualLayerNorm::init_inference(
                                                       batch_inputs[2]->region));
     launcher.add_field(field_id++, FID_DATA);
   }
-  // added: input + residual(s)
-  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_outputs[0]->region));
-  launcher.add_field(field_id++, FID_DATA);
+  if (!inplace_residual) {
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[0]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[0]->region));
+    launcher.add_field(field_id++, FID_DATA);
+  }
   // layer norm output
   launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
                                                     0 /*projection id*/,
@@ -422,13 +456,17 @@ void ResidualLayerNorm::init(FFModel const &ff) {
                          false /*must*/,
                          0 /*mapper_id*/,
                          outputs[0]->machine_view.hash());
+  assert(outputs[0]->part == inputs[0]->part);
+  assert(outputs[0]->region == inputs[0]->region);
   int field_id = 0;
   // input
-  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    inputs[0]->region));
+  // added: input + residual(s)
+  launcher.add_region_requirement(
+      RegionRequirement(inputs[0]->part,
+                        0 /*projection id*/,
+                        inplace_residual ? READ_WRITE : READ_ONLY,
+                        EXCLUSIVE,
+                        inputs[0]->region));
   launcher.add_field(field_id++, FID_DATA);
   // residual1
   launcher.add_region_requirement(RegionRequirement(inputs[1]->part,
@@ -439,20 +477,21 @@ void ResidualLayerNorm::init(FFModel const &ff) {
   launcher.add_field(field_id++, FID_DATA);
   // residual2
   if (use_two_residuals) {
-    launcher.add_region_requirement(RegionRequirement(inputs[1]->part,
+    launcher.add_region_requirement(RegionRequirement(inputs[2]->part,
                                                       0 /*projection id*/,
                                                       READ_ONLY,
                                                       EXCLUSIVE,
-                                                      inputs[1]->region));
+                                                      inputs[2]->region));
+    launcher.add_field(field_id++, FID_DATA);
+  }
+  if (!inplace_residual) {
+    launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                      0 /*projection id*/,
+                                                      WRITE_ONLY,
+                                                      EXCLUSIVE,
+                                                      outputs[0]->region));
     launcher.add_field(field_id++, FID_DATA);
   }
-  // added: input + residual(s)
-  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    outputs[0]->region));
-  launcher.add_field(field_id++, FID_DATA);
   // layer norm output
   launcher.add_region_requirement(RegionRequirement(outputs[1]->part,
                                                     0 /*projection id*/,
@@ -516,7 +555,323 @@ void ResidualLayerNorm::forward(FFModel const &ff) {
 }
 
 void ResidualLayerNorm::backward(FFModel const &ff) {
-  assert(false);
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_backward(ff, argmap);
+  IndexLauncher launcher(RESIDUAL_LAYERNORM_BWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  int field_id = 0;
+  // output_grad
+  launcher.add_region_requirement(RegionRequirement(outputs[1]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[1]->region_grad));
+  launcher.add_field(field_id++, FID_DATA);
+  // added output
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(field_id++, FID_DATA);
+  // input grad
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region_grad));
+  launcher.add_field(field_id++, FID_DATA);
+  // residual grad 1
+  launcher.add_region_requirement(RegionRequirement(inputs[1]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    inputs[1]->region_grad));
+  launcher.add_field(field_id++, FID_DATA);
+  if (use_two_residuals) {
+    // residual grad 2
+    launcher.add_region_requirement(RegionRequirement(inputs[2]->part_grad,
+                                                      0 /*projection id*/,
+                                                      READ_WRITE,
+                                                      EXCLUSIVE,
+                                                      inputs[2]->region_grad));
+    launcher.add_field(field_id++, FID_DATA);
+  }
+  if (elementwise_affine) {
+    // gamma
+    launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[0]->region));
+    launcher.add_field(field_id++, FID_DATA);
+    // gamma_grad
+    launcher.add_region_requirement(RegionRequirement(weights[0]->part_grad,
+                                                      0 /*projection id*/,
+                                                      READ_WRITE,
+                                                      EXCLUSIVE,
+                                                      weights[0]->region_grad));
+    launcher.add_field(field_id++, FID_DATA);
+    if (use_bias) {
+      // beta_grad
+      launcher.add_region_requirement(
+          RegionRequirement(weights[1]->part_grad,
+                            0 /*projection id*/,
+                            READ_WRITE,
+                            EXCLUSIVE,
+                            weights[1]->region_grad));
+      launcher.add_field(field_id++, FID_DATA);
+    }
+  }
+  runtime->execute_index_space(ctx, launcher);
+}
+
+void ResidualLayerNorm::backward_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  assert(task->regions.size() == regions.size());
+  ResidualLayerNormMeta const *m =
+      *((ResidualLayerNormMeta **)task->local_args);
+  assert(regions.size() ==
+         4 + m->use_two_residuals +
+             (m->elementwise_affine ? (m->use_bias ? 3 : 2) : 0));
+
+  int region_idx = 0, task_region_idx = 0;
+
+  GenericTensorAccessorR output_grad =
+      helperGetGenericTensorAccessorRO(m->output_type[1],
+                                       regions[region_idx++],
+                                       task->regions[task_region_idx++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorR added_output =
+      helperGetGenericTensorAccessorRO(m->output_type[0],
+                                       regions[region_idx++],
+                                       task->regions[task_region_idx++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorW input_grad =
+      helperGetGenericTensorAccessorRW(m->input_type[0],
+                                       regions[region_idx++],
+                                       task->regions[task_region_idx++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorW residual1_grad =
+      helperGetGenericTensorAccessorRW(m->input_type[1],
+                                       regions[region_idx++],
+                                       task->regions[task_region_idx++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorW residual2_grad;
+  if (m->use_two_residuals) {
+    residual2_grad =
+        helperGetGenericTensorAccessorRW(m->input_type[2],
+                                         regions[region_idx++],
+                                         task->regions[task_region_idx++],
+                                         FID_DATA,
+                                         ctx,
+                                         runtime);
+  }
+  GenericTensorAccessorR gamma;
+  GenericTensorAccessorW gamma_grad, beta_grad;
+  if (m->elementwise_affine) {
+    assert(m->use_bias == (regions.size() == 6));
+    gamma = helperGetGenericTensorAccessorRO(m->output_type[0],
+                                             regions[region_idx++],
+                                             task->regions[task_region_idx++],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
+    gamma_grad =
+        helperGetGenericTensorAccessorRW(m->output_type[0],
+                                         regions[region_idx++],
+                                         task->regions[task_region_idx++],
+                                         FID_DATA,
+                                         ctx,
+                                         runtime);
+    if (m->use_bias) {
+      beta_grad =
+          helperGetGenericTensorAccessorRW(m->output_type[0],
+                                           regions[region_idx++],
+                                           task->regions[task_region_idx++],
+                                           FID_DATA,
+                                           ctx,
+                                           runtime);
+    }
+  }
+  ResidualLayerNorm::backward_kernel_wrapper(m,
+                                             output_grad,
+                                             added_output,
+                                             input_grad,
+                                             residual1_grad,
+                                             residual2_grad,
+                                             gamma,
+                                             gamma_grad,
+                                             beta_grad);
+}
+
+Legion::FutureMap ResidualLayerNorm::peft_bwd(
+    FFModel const &ff,
+    BatchConfigFuture const &bc,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+  IndexLauncher launcher(RESIDUAL_LAYERNORM_PEFT_BWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
+  int field_id = 0;
+  // output_grad
+  launcher.add_region_requirement(
+      RegionRequirement(batch_outputs[1]->part_grad,
+                        0 /*projection id*/,
+                        READ_WRITE,
+                        EXCLUSIVE,
+                        batch_outputs[1]->region_grad));
+  launcher.add_field(field_id++, FID_DATA);
+  // input grad
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[0]->part_grad,
+                        0 /*projection id*/,
+                        reset_input_grads[0] ? WRITE_ONLY : READ_WRITE,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region_grad));
+  launcher.add_field(field_id++, FID_DATA);
+  // residual grad 1
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[1]->part_grad,
+                        0 /*projection id*/,
+                        reset_input_grads[1] ? WRITE_ONLY : READ_WRITE,
+                        EXCLUSIVE,
+                        batch_inputs[1]->region_grad));
+  launcher.add_field(field_id++, FID_DATA);
+  if (use_two_residuals) {
+    // residual grad 2
+    launcher.add_region_requirement(
+        RegionRequirement(batch_inputs[2]->part_grad,
+                          0 /*projection id*/,
+                          reset_input_grads[2] ? WRITE_ONLY : READ_WRITE,
+                          EXCLUSIVE,
+                          batch_inputs[2]->region_grad));
+    launcher.add_field(field_id++, FID_DATA);
+  }
+  if (elementwise_affine) {
+    // gamma
+    launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                      0 /*projection id*/,
+                                                      READ_ONLY,
+                                                      EXCLUSIVE,
+                                                      weights[0]->region));
+    launcher.add_field(field_id++, FID_DATA);
+  }
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+void ResidualLayerNorm::peft_bwd_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_active_peft_tokens() == 0) {
+    return;
+  }
+  assert(task->regions.size() == regions.size());
+  ResidualLayerNormMeta *m = *((ResidualLayerNormMeta **)task->local_args);
+  assert(regions.size() == 3 + m->use_two_residuals + m->elementwise_affine);
+
+  int region_idx = 0, task_region_idx = 0;
+
+  GenericTensorAccessorR output_grad =
+      helperGetGenericTensorAccessorRO(m->output_type[1],
+                                       regions[region_idx++],
+                                       task->regions[task_region_idx++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorW input_grad =
+      helperGetGenericTensorAccessorRW(m->input_type[0],
+                                       regions[region_idx++],
+                                       task->regions[task_region_idx++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorW residual1_grad =
+      helperGetGenericTensorAccessorRW(m->input_type[1],
+                                       regions[region_idx++],
+                                       task->regions[task_region_idx++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorW residual2_grad;
+  if (m->use_two_residuals) {
+    GenericTensorAccessorW residual2_grad =
+        helperGetGenericTensorAccessorRW(m->input_type[2],
+                                         regions[region_idx++],
+                                         task->regions[task_region_idx++],
+                                         FID_DATA,
+                                         ctx,
+                                         runtime);
+  }
+  GenericTensorAccessorR gamma;
+  if (m->elementwise_affine) {
+    gamma = helperGetGenericTensorAccessorRO(m->weight_type[0],
+                                             regions[region_idx++],
+                                             task->regions[task_region_idx++],
+                                             FID_DATA,
+                                             ctx,
+                                             runtime);
+  }
+  ResidualLayerNorm::peft_bwd_kernel_wrapper(
+      m, output_grad, input_grad, residual1_grad, residual2_grad, gamma);
+
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    std::vector<GenericTensorAccessorR> input_accessors;
+    input_accessors.push_back(input_grad);
+    input_accessors.push_back(residual1_grad);
+    if (m->use_two_residuals) {
+      input_accessors.push_back(residual2_grad);
+    }
+    std::vector<GenericTensorAccessorR> weights_accessors;
+    if (m->elementwise_affine) {
+      weights_accessors.push_back(gamma);
+    }
+    ResidualLayerNorm::save_inference_tensors_to_file(m,
+                                                      shard_id,
+                                                      bc,
+                                                      input_accessors,
+                                                      weights_accessors,
+                                                      {output_grad},
+                                                      false);
+  }
 }
 
 Op *ResidualLayerNorm::materialize(FFModel &ff,
@@ -554,13 +909,19 @@ FutureMap ResidualLayerNorm::inference(
                          0 /*mapper_id*/,
                          machine_view_hash);
   launcher.add_future(bc);
+  if (inplace_residual) {
+    assert(batch_outputs[0]->part == batch_inputs[0]->part);
+    assert(batch_outputs[0]->region == batch_inputs[0]->region);
+  }
   int field_id = 0;
   // input
-  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_inputs[0]->region));
+  // added: input + residual(s)
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[0]->part,
+                        0 /*projection id*/,
+                        inplace_residual ? READ_WRITE : READ_ONLY,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region));
   launcher.add_field(field_id++, FID_DATA);
   // residual1
   launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
@@ -578,13 +939,15 @@ FutureMap ResidualLayerNorm::inference(
                                                       batch_inputs[2]->region));
     launcher.add_field(field_id++, FID_DATA);
   }
-  // added: input + residual(s)
-  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_outputs[0]->region));
-  launcher.add_field(field_id++, FID_DATA);
+  if (!inplace_residual) {
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[0]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[0]->region));
+    launcher.add_field(field_id++, FID_DATA);
+  }
   // layer norm output
   launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
                                                     0 /*projection id*/,
@@ -620,14 +983,13 @@ void ResidualLayerNorm::inference_task(
 
   assert(task->regions.size() == regions.size());
   BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  ResidualLayerNormMeta *m = *((ResidualLayerNormMeta **)task->local_args);
   if (bc->num_tokens == 0) {
     return;
   }
 
-  ResidualLayerNormMeta *m = *((ResidualLayerNormMeta **)task->local_args);
-
   assert(regions.size() ==
-         4 + m->use_two_residuals +
+         3 + m->use_two_residuals +
              (m->elementwise_affine ? (m->use_bias ? 2 : 1) : 0));
 
   int region_idx = 0, task_region_idx = 0;
@@ -655,13 +1017,23 @@ void ResidualLayerNorm::inference_task(
                                          ctx,
                                          runtime);
   }
-  GenericTensorAccessorW added_output =
-      helperGetGenericTensorAccessorWO(m->output_type[0],
-                                       regions[region_idx++],
-                                       task->regions[task_region_idx++],
-                                       FID_DATA,
-                                       ctx,
-                                       runtime);
+  GenericTensorAccessorW added_output;
+  if (m->inplace_residual) {
+    added_output = helperGetGenericTensorAccessorWO(m->output_type[0],
+                                                    regions[0],
+                                                    task->regions[0],
+                                                    FID_DATA,
+                                                    ctx,
+                                                    runtime);
+  } else {
+    added_output =
+        helperGetGenericTensorAccessorWO(m->output_type[0],
+                                         regions[region_idx++],
+                                         task->regions[task_region_idx++],
+                                         FID_DATA,
+                                         ctx,
+                                         runtime);
+  }
   GenericTensorAccessorW output =
       helperGetGenericTensorAccessorWO(m->output_type[1],
                                        regions[region_idx++],
@@ -699,8 +1071,14 @@ void ResidualLayerNorm::inference_task(
     assert(in_domain.get_volume() == residual2_domain.get_volume());
     assert(residual2_domain == in_domain);
   }
-  Domain added_out_domain = runtime->get_index_space_domain(
-      ctx, task->regions[task_region_idx++].region.get_index_space());
+  Domain added_out_domain;
+  if (m->inplace_residual) {
+    added_out_domain = runtime->get_index_space_domain(
+        ctx, task->regions[0].region.get_index_space());
+  } else {
+    added_out_domain = runtime->get_index_space_domain(
+        ctx, task->regions[task_region_idx++].region.get_index_space());
+  }
   Domain out_domain = runtime->get_index_space_domain(
       ctx, task->regions[task_region_idx++].region.get_index_space());
   Domain gamma_domain, beta_domain;
@@ -734,13 +1112,13 @@ void ResidualLayerNorm::inference_task(
          m->effective_num_elements * m->effective_batch_size);
 
   ResidualLayerNorm::inference_kernel_wrapper(
-      m, input, residual1, residual2, added_output, output, gamma, beta);
+      m, bc, input, residual1, residual2, added_output, output, gamma, beta);
 
   if (m->inference_debugging) {
     assert(task->index_point.get_dim() == 1);
     int shard_id = task->index_point.point_data[0];
     std::vector<GenericTensorAccessorR> input_accessors;
-    input_accessors.push_back(input);
+    // input_accessors.push_back(input);
     input_accessors.push_back(residual1);
     if (m->use_two_residuals) {
       input_accessors.push_back(residual2);
@@ -779,6 +1157,7 @@ void ResidualLayerNorm::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->eps);
   sez.serialize(this->use_bias);
   sez.serialize(this->use_two_residuals);
+  sez.serialize(this->inplace_residual);
   sez.serialize(strlen(this->name));
   sez.serialize(this->name, strlen(this->name));
 }
@@ -794,6 +1173,7 @@ Node ResidualLayerNorm::deserialize(FFModel &ff,
   bool elementwise_affine;
   bool use_bias;
   bool use_two_residuals;
+  bool inplace_residual;
   float eps;
   size_t id, transformer_layer_id, deserialized_model_id;
   dez.deserialize(id);
@@ -810,6 +1190,7 @@ Node ResidualLayerNorm::deserialize(FFModel &ff,
   dez.deserialize(eps);
   dez.deserialize(use_bias);
   dez.deserialize(use_two_residuals);
+  dez.deserialize(inplace_residual);
   size_t name_len;
   char name[MAX_OPNAME] = {0};
   dez.deserialize(name_len);
@@ -827,6 +1208,7 @@ Node ResidualLayerNorm::deserialize(FFModel &ff,
   params.eps = eps;
   params.use_bias = use_bias;
   params.use_two_residuals = use_two_residuals;
+  params.inplace_residual = inplace_residual;
   strcpy(params.name, name);
   if (use_two_residuals) {
     return ff.get_or_create_node<ResidualLayerNorm>(
@@ -853,6 +1235,7 @@ size_t hash<FlexFlow::ResidualLayerNormParams>::operator()(
   hash_combine(key, params.elementwise_affine);
   hash_combine(key, params.use_bias);
   hash_combine(key, params.use_two_residuals);
+  hash_combine(key, params.inplace_residual);
   return key;
 }
 }; // namespace std
diff --git a/src/ops/residual_layer_norm.cpp b/src/ops/residual_layer_norm.cpp
index f1b7a537b0..582e0752ef 100644
--- a/src/ops/residual_layer_norm.cpp
+++ b/src/ops/residual_layer_norm.cpp
@@ -23,11 +23,12 @@ namespace FlexFlow {
 #define C10_WARP_SIZE 32
 constexpr int kCUDABlockReduceNumThreads = 512;
 constexpr int kCUDANumThreads = 256;
+constexpr int kColwiseReduceTileSize = 32;
 
 ResidualLayerNormMeta::ResidualLayerNormMeta(FFHandler handle,
                                              ResidualLayerNorm const *ln,
                                              MemoryAllocator &gpu_mem_allocator)
-    : OpMeta(handle) {
+    : OpMeta(handle, ln) {
   elementwise_affine = ln->elementwise_affine;
   use_bias = ln->use_bias;
   use_two_residuals = ln->use_two_residuals;
@@ -36,6 +37,7 @@ ResidualLayerNormMeta::ResidualLayerNormMeta(FFHandler handle,
   profiling = ln->profiling;
   inference_debugging = ln->inference_debugging;
   eps = ln->eps;
+  inplace_residual = ln->inplace_residual;
   DataType data_type = ln->data_type;
   size_t totalSize = effective_batch_size * data_type_size(data_type) * 3;
   gpu_mem_allocator.create_legion_instance(reserveInst, totalSize);
@@ -45,6 +47,7 @@ ResidualLayerNormMeta::ResidualLayerNormMeta(FFHandler handle,
       data_type_size(data_type) * effective_batch_size);
   bias_ptr = gpu_mem_allocator.allocate_instance_untyped(
       data_type_size(data_type) * effective_batch_size);
+  allocated_peft_buffer_size = 0;
 }
 
 ResidualLayerNormMeta::~ResidualLayerNormMeta(void) {
@@ -75,7 +78,7 @@ __inline__ __device__ T WarpReduceSum(T val) {
 }
 
 template <typename T>
-__inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
+__inline__ __device__ T BlockReduceSum(T val, T *shared) {
   int const lid = threadIdx.x % C10_WARP_SIZE;
   int const wid = threadIdx.x / C10_WARP_SIZE;
   val = WarpReduceSum(val);
@@ -84,9 +87,7 @@ __inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
     shared[wid] = val;
   }
   __syncthreads();
-  val = (threadIdx.x < min(blockDim.x, max_num_threads) / C10_WARP_SIZE)
-            ? shared[lid]
-            : 0;
+  val = (threadIdx.x < (blockDim.x / C10_WARP_SIZE)) ? shared[lid] : T(0);
   if (wid == 0) {
     val = WarpReduceSum(val);
   }
@@ -110,8 +111,7 @@ __global__ void ResidualLayerNormKernel(int64_t N,
   const int64_t i = blockIdx.x;
   float sum1 = 0.0f;
   float sum2 = 0.0f;
-  for (int64_t j = threadIdx.x; j < N;
-       j += min(blockDim.x, kCUDABlockReduceNumThreads)) {
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
     const int64_t index = i * N + j;
     const T residual2_val = (residual2_ptr == nullptr)
                                 ? T(0)
@@ -120,12 +120,10 @@ __global__ void ResidualLayerNormKernel(int64_t N,
     sum1 += static_cast<float>(X[index]);
     sum2 += static_cast<float>(X[index]) * static_cast<float>(X[index]);
   }
-  if (threadIdx.x < kCUDABlockReduceNumThreads) {
-    sum1 = BlockReduceSum<float>(
-        sum1, m_shared, min(blockDim.x, kCUDABlockReduceNumThreads));
-    sum2 = BlockReduceSum<float>(
-        sum2, v_shared, min(blockDim.x, kCUDABlockReduceNumThreads));
-  }
+
+  sum1 = BlockReduceSum<float>(sum1, m_shared);
+  sum2 = BlockReduceSum<float>(sum2, v_shared);
+
   if (threadIdx.x == 0) {
     float const scale = float(1) / static_cast<float>(N);
     sum1 *= scale;
@@ -137,7 +135,7 @@ __global__ void ResidualLayerNormKernel(int64_t N,
   __syncthreads();
 
   using T_ACC = T;
-  for (int64_t j = threadIdx.x; j < N; j += min(blockDim.x, kCUDANumThreads)) {
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
     const int64_t index = i * N + j;
     const T_ACC gamma_v =
         gamma == nullptr ? T_ACC(1) : static_cast<T_ACC>(gamma[j]);
@@ -161,19 +159,9 @@ void ResidualLayerNorm::inference_kernel(ResidualLayerNormMeta const *m,
                                          T const *beta_ptr,
                                          hipStream_t stream) {
 
-  std::pair<int, int> kernel1_parallelism =
-      std::make_pair(m->effective_batch_size, kCUDABlockReduceNumThreads);
-  std::pair<int, int> kernel2_parallelism =
-      std::make_pair(m->effective_batch_size, kCUDANumThreads);
-
-  int num_blocks =
-      std::max(kernel1_parallelism.first, kernel2_parallelism.first);
-  int num_threads =
-      std::max(kernel1_parallelism.second, kernel2_parallelism.second);
-
   hipLaunchKernelGGL(HIP_KERNEL_NAME(ResidualLayerNormKernel<T>),
-                     num_blocks,
-                     num_threads,
+                     m->effective_batch_size,
+                     std::min(CUDA_NUM_THREADS, (int)m->effective_num_elements),
                      0,
                      stream,
                      m->effective_num_elements,
@@ -188,10 +176,41 @@ void ResidualLayerNorm::inference_kernel(ResidualLayerNormMeta const *m,
                      beta_ptr,
                      output_ptr);
 }
+template <typename T>
+void save_inference_tensors(ResidualLayerNormMeta const *m) {
+  if (m->inference_debugging) {
+    // save stuff here
+    std::string op_name_without_uid =
+        ResidualLayerNorm::get_op_name_without_uid(m);
+    char const *folder_path = "./inference_tensors/";
+    std::string base_filepath = std::string(folder_path);
+    if (m->layer_guid.model_id > 0) {
+      base_filepath += "model_" + std::to_string(m->layer_guid.model_id) + "_";
+    }
+    base_filepath += "fwd_step_" + std::to_string(m->decoding_step);
+    base_filepath += "_layers_" +
+                     std::to_string(m->layer_guid.transformer_layer_id) + "_" +
+                     op_name_without_uid + "_shard_" + std::to_string(0);
+
+    std::string filename1 = base_filepath + "_mean";
+    save_tensor(static_cast<T *>(m->mean_ptr),
+                m->effective_batch_size,
+                filename1.c_str());
+    std::string filename2 = base_filepath + "_rstd";
+    save_tensor(static_cast<T *>(m->rstd_ptr),
+                m->effective_batch_size,
+                filename2.c_str());
+    std::string filename3 = base_filepath + "_input_activation";
+    save_tensor(static_cast<T *>(m->input_activation),
+                m->effective_batch_size * m->effective_num_elements,
+                filename3.c_str());
+  }
+}
 
 /*static*/
 void ResidualLayerNorm::inference_kernel_wrapper(
-    ResidualLayerNormMeta const *m,
+    ResidualLayerNormMeta *m,
+    BatchConfig const *bc,
     GenericTensorAccessorR const &input,
     GenericTensorAccessorR const &residual1,
     GenericTensorAccessorR const &residual2,
@@ -208,12 +227,13 @@ void ResidualLayerNorm::inference_kernel_wrapper(
     checkCUDA(hipEventCreate(&t_end));
     checkCUDA(hipEventRecord(t_start, stream));
   }
+
   if (m->input_type[0] == DT_FLOAT) {
     ResidualLayerNorm::inference_kernel<float>(
         m,
         input.get_float_ptr(),
         residual1.get_float_ptr(),
-        residual2.get_float_ptr(),
+        m->use_two_residuals ? residual2.get_float_ptr() : nullptr,
         added_output.get_float_ptr(),
         output.get_float_ptr(),
         m->elementwise_affine ? gamma.get_float_ptr() : nullptr,
@@ -224,7 +244,7 @@ void ResidualLayerNorm::inference_kernel_wrapper(
         m,
         input.get_half_ptr(),
         residual1.get_half_ptr(),
-        residual2.get_half_ptr(),
+        m->use_two_residuals ? residual2.get_half_ptr() : nullptr,
         added_output.get_half_ptr(),
         output.get_half_ptr(),
         m->elementwise_affine ? gamma.get_half_ptr() : nullptr,
@@ -234,6 +254,76 @@ void ResidualLayerNorm::inference_kernel_wrapper(
     assert(false && "unsupport datatype in layernorm");
   }
 
+  // save input activation if needed for PEFT
+  if (bc->num_active_peft_tokens() > 0) {
+    // Check that we have at most one request that requires peft_bwd
+    int num_peft_requests = 0;
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_bwd) {
+        num_peft_requests++;
+      }
+    }
+    assert(num_peft_requests <= 1);
+
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      // Skip non-PEFT requests
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        continue;
+      }
+      int num_peft_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+      int max_peft_tokens = bc->requestsInfo[i].max_sequence_length;
+      int first_token_offset = bc->requestsInfo[i].first_token_offset_in_batch;
+      int in_dim = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+      if (bc->requestsInfo[i].peft_bwd) {
+        size_t activation_size_needed =
+            data_type_size(m->input_type[0]) * max_peft_tokens * in_dim;
+        if (activation_size_needed > m->allocated_peft_buffer_size) {
+          MemoryAllocator *allocator = m->handle.peft_activation_allocator;
+          m->input_activation =
+              allocator->allocate_instance_untyped(activation_size_needed);
+          m->allocated_peft_buffer_size = activation_size_needed;
+        }
+        // copy input activation
+        if (m->input_type[0] == DT_FLOAT) {
+          checkCUDA(hipMemcpyAsync(
+              m->input_activation,
+              added_output.get_float_ptr() + first_token_offset * in_dim,
+              data_type_size(m->input_type[0]) * num_peft_tokens * in_dim,
+              hipMemcpyDeviceToDevice,
+              stream));
+        } else if (m->input_type[0] == DT_HALF) {
+          checkCUDA(hipMemcpyAsync(
+              m->input_activation,
+              added_output.get_half_ptr() + first_token_offset * in_dim,
+              data_type_size(m->input_type[0]) * num_peft_tokens * in_dim,
+              hipMemcpyDeviceToDevice,
+              stream));
+        } else {
+          assert(false && "unsupport datatype in layernorm");
+        }
+      }
+    }
+  }
+
+  if (m->inference_debugging) {
+    if (m->input_type[0] == DT_FLOAT) {
+      save_inference_tensors<float>(m);
+    } else if (m->input_type[0] == DT_HALF) {
+      save_inference_tensors<half>(m);
+    } else {
+      assert(false && "unsupport datatype in layernorm");
+    }
+  }
+
   if (m->profiling) {
     checkCUDA(hipEventRecord(t_end, stream));
     checkCUDA(hipEventSynchronize(t_end));
@@ -245,4 +335,551 @@ void ResidualLayerNorm::inference_kernel_wrapper(
   }
 }
 
+template <typename T>
+__global__ void ComputeInternalGradientsCUDAKernel(
+    int64_t N, T const *dY, T const *X, T const *gamma, T *ds, T *db) {
+  using T_ACC = T;
+  __shared__ T_ACC ds_shared[C10_WARP_SIZE];
+  __shared__ T_ACC db_shared[C10_WARP_SIZE];
+  const int64_t i = blockIdx.x;
+  T_ACC sum1 = 0;
+  T_ACC sum2 = 0;
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
+    const int64_t index = i * N + j;
+    const T_ACC gamma_v =
+        gamma == nullptr ? T_ACC(1) : static_cast<T_ACC>(gamma[j]);
+    sum1 +=
+        static_cast<T_ACC>(dY[index]) * static_cast<T_ACC>(X[index]) * gamma_v;
+    sum2 += static_cast<T_ACC>(dY[index]) * gamma_v;
+  }
+  sum1 = BlockReduceSum<T_ACC>(sum1, ds_shared);
+  sum2 = BlockReduceSum<T_ACC>(sum2, db_shared);
+  if (threadIdx.x == 0) {
+    ds[i] = sum1;
+    db[i] = sum2;
+  }
+}
+
+template <typename T>
+__global__ void ComputeGradientFusedParamsCUDAKernel(int64_t M,
+                                                     int64_t N,
+                                                     T const *mean,
+                                                     T const *rstd,
+                                                     T const *ds,
+                                                     T const *db,
+                                                     T *c1,
+                                                     T *c2) {
+  using T_ACC = T;
+  const int64_t index = blockIdx.x * blockDim.x + threadIdx.x;
+  if (index < M) {
+    const T_ACC s = T_ACC(1) / static_cast<T_ACC>((int)N);
+    const T_ACC a = (db[index] * static_cast<T_ACC>(mean[index]) - ds[index]) *
+                    static_cast<T_ACC>(rstd[index]) *
+                    static_cast<T_ACC>(rstd[index]) *
+                    static_cast<T_ACC>(rstd[index]) * s;
+    c1[index] = a;
+    c2[index] = -(a * static_cast<T_ACC>(mean[index]) +
+                  db[index] * static_cast<T_ACC>(rstd[index]) * s);
+  }
+}
+
+template <typename T>
+__global__ void GammaBetaBackwardSimpleCUDAKernel(int64_t M,
+                                                  int64_t N,
+                                                  T const *dY,
+                                                  T const *X,
+                                                  T const *mean,
+                                                  T const *rstd,
+                                                  T *dg,
+                                                  T *db) {
+  using T_ACC = T;
+  const int64_t j = blockIdx.x * blockDim.x + threadIdx.x;
+  if (j < N) {
+    T_ACC sum1 = 0;
+    T_ACC sum2 = 0;
+    for (int64_t i = 0; i < M; ++i) {
+      const int64_t index = i * N + j;
+      sum1 += dg == nullptr ? T_ACC(0)
+                            : static_cast<T_ACC>(dY[index]) *
+                                  (static_cast<T_ACC>(X[index]) -
+                                   static_cast<T_ACC>(mean[i])) *
+                                  static_cast<T_ACC>(rstd[i]);
+      sum2 += db == nullptr ? T_ACC(0) : static_cast<T_ACC>(dY[index]);
+    }
+    if (dg != nullptr) {
+      dg[j] = sum1;
+    }
+    if (db != nullptr) {
+      db[j] = sum2;
+    }
+  }
+}
+
+template <typename T>
+__global__ void GammaBetaBackwardCUDAKernel(int64_t M,
+                                            int64_t N,
+                                            T const *dY,
+                                            T const *X,
+                                            T const *mean,
+                                            T const *rstd,
+                                            T *dg,
+                                            T *db) {
+  using T_ACC = T;
+  __shared__ T_ACC g_shared[kColwiseReduceTileSize][kColwiseReduceTileSize + 1];
+  __shared__ T_ACC b_shared[kColwiseReduceTileSize][kColwiseReduceTileSize + 1];
+  const int64_t j = blockIdx.x * blockDim.x + threadIdx.x;
+  T_ACC dg_sum1 = 0;
+  T_ACC dg_sum2 = 0;
+  T_ACC db_sum1 = 0;
+  T_ACC db_sum2 = 0;
+  if (j < N) {
+    for (int64_t i = threadIdx.y; i < M; i += blockDim.y * 2) {
+      const int64_t i1 = i;
+      const int64_t i2 = i + blockDim.y;
+      const int64_t index1 = i1 * N + j;
+      const int64_t index2 = i2 * N + j;
+      dg_sum1 += dg == nullptr ? T_ACC(0)
+                               : static_cast<T_ACC>(dY[index1]) *
+                                     (static_cast<T_ACC>(X[index1]) -
+                                      static_cast<T_ACC>(mean[i1])) *
+                                     static_cast<T_ACC>(rstd[i1]);
+      db_sum1 += db == nullptr ? T_ACC(0) : static_cast<T_ACC>(dY[index1]);
+      if (i2 < M) {
+        dg_sum2 += dg == nullptr ? T_ACC(0)
+                                 : static_cast<T_ACC>(dY[index2]) *
+                                       (static_cast<T_ACC>(X[index2]) -
+                                        static_cast<T_ACC>(mean[i2])) *
+                                       static_cast<T_ACC>(rstd[i2]);
+        db_sum2 += db == nullptr ? T_ACC(0) : static_cast<T_ACC>(dY[index2]);
+      }
+    }
+  }
+  g_shared[threadIdx.y][threadIdx.x] = dg_sum1;
+  g_shared[threadIdx.y + blockDim.y][threadIdx.x] = dg_sum2;
+  b_shared[threadIdx.y][threadIdx.x] = db_sum1;
+  b_shared[threadIdx.y + blockDim.y][threadIdx.x] = db_sum2;
+  __syncthreads();
+  T_ACC sum1 = g_shared[threadIdx.x][threadIdx.y];
+  T_ACC sum2 = b_shared[threadIdx.x][threadIdx.y];
+  sum1 = WarpReduceSum(sum1);
+  sum2 = WarpReduceSum(sum2);
+  if (threadIdx.x == 0) {
+    const int64_t j = blockIdx.x * blockDim.x + threadIdx.y;
+    if (j < N) {
+      if (dg != nullptr) {
+        dg[j] = sum1;
+      }
+      if (db != nullptr) {
+        db[j] = sum2;
+      }
+    }
+  }
+  sum1 = g_shared[threadIdx.x][threadIdx.y + blockDim.y];
+  sum2 = b_shared[threadIdx.x][threadIdx.y + blockDim.y];
+  sum1 = WarpReduceSum(sum1);
+  sum2 = WarpReduceSum(sum2);
+  if (threadIdx.x == 0) {
+    const int64_t j = blockIdx.x * blockDim.x + threadIdx.y + blockDim.y;
+    if (j < N) {
+      if (dg != nullptr) {
+        dg[j] = sum1;
+      }
+      if (db != nullptr) {
+        db[j] = sum2;
+      }
+    }
+  }
+}
+
+template <typename T>
+__device__ __inline__ void compute_gI(T const *__restrict__ dY,
+                                      T const *__restrict__ X,
+                                      T const *__restrict__ mean,
+                                      T const *__restrict__ rstd,
+                                      T const *__restrict__ gamma,
+                                      T *dX,
+                                      T *dX_residual1,
+                                      T *dX_residual2,
+                                      bool reset_input_grad,
+                                      bool reset_residual_grad1,
+                                      bool reset_residual_grad2,
+                                      int const N,
+                                      T *buf) {
+  auto const i1 = blockIdx.x;
+  const T mean_val = mean[i1];
+  const T rstd_val = rstd[i1];
+  T stats_x1{0}, stats_x2{0};
+  constexpr int unroll = 4;
+  auto l = unroll * threadIdx.x;
+  T const *X_i = X + i1 * N;
+  T const *dY_i = dY + i1 * N;
+  T *dX_i = dX + i1 * N;
+  T *dX_residual1_i = dX_residual1 + i1 * N;
+  T *dX_residual2_i =
+      (dX_residual2 != nullptr) ? dX_residual2 + i1 * N : nullptr;
+  // vectorized reads don't improve perf, so use regular unrolling
+
+  for (; l + unroll - 1 < N; l += blockDim.x * unroll) {
+#pragma unroll
+    for (int k = 0; k < unroll; k++) {
+      T gamma_val = (gamma != nullptr) ? static_cast<T>(gamma[l + k]) : T(1);
+      const T c_h = static_cast<T>(X_i[l + k]);
+      const T c_loss = static_cast<T>(dY_i[l + k]);
+      stats_x1 += c_loss * gamma_val;
+      stats_x2 += c_loss * gamma_val * (c_h - mean_val) * rstd_val;
+    }
+  }
+  for (; l < N; l++) {
+    T gamma_val = (gamma != nullptr) ? static_cast<T>(gamma[l]) : T(1);
+    const T c_h = static_cast<T>(X_i[l]);
+    const T c_loss = static_cast<T>(dY_i[l]);
+    stats_x1 += c_loss * gamma_val;
+    stats_x2 += c_loss * gamma_val * (c_h - mean_val) * rstd_val;
+  }
+
+  stats_x1 = BlockReduceSum(stats_x1, buf);
+  stats_x2 = BlockReduceSum(stats_x2, buf);
+  if (threadIdx.x == 0) {
+    buf[0] = stats_x1;
+    buf[1] = stats_x2;
+  }
+  __syncthreads();
+  stats_x1 = buf[0];
+  stats_x2 = buf[1];
+  T fH = N;
+  T term1 = (T(1) / fH) * rstd_val;
+
+  for (int l = threadIdx.x; l < N; l += blockDim.x) {
+    const T x = X_i[l];
+    const T dy = dY_i[l];
+    T gamma_val = (gamma != nullptr) ? static_cast<T>(gamma[l]) : T(1);
+    T f_grad_input = fH * gamma_val * dy;
+    f_grad_input -= (x - mean_val) * rstd_val * stats_x2;
+    f_grad_input -= stats_x1;
+    f_grad_input *= term1;
+    if (reset_input_grad) {
+      dX_i[l] = f_grad_input;
+    } else {
+      dX_i[l] += f_grad_input;
+    }
+    if (reset_residual_grad1) {
+      dX_residual1_i[l] = f_grad_input;
+    } else {
+      dX_residual1_i[l] += f_grad_input;
+    }
+    if (dX_residual2 != nullptr) {
+      if (reset_residual_grad2) {
+        dX_residual2_i[l] = f_grad_input;
+      } else {
+        dX_residual2_i[l] += f_grad_input;
+      }
+    }
+  }
+}
+
+template <typename T>
+__global__ void layer_norm_grad_input_kernel(T const *__restrict__ dY,
+                                             T const *__restrict__ X,
+                                             T const *__restrict__ mean,
+                                             T const *__restrict__ rstd,
+                                             T const *__restrict__ gamma,
+                                             T *dX,
+                                             T *dX_residual1,
+                                             T *dX_residual2,
+                                             bool reset_input_grad,
+                                             bool reset_residual_grad1,
+                                             bool reset_residual_grad2,
+                                             int const N) {
+  alignas(sizeof(double)) extern __shared__ char s_data1[];
+  T *buf = reinterpret_cast<T *>(&s_data1);
+  compute_gI(dY,
+             X,
+             mean,
+             rstd,
+             gamma,
+             dX,
+             dX_residual1,
+             dX_residual2,
+             reset_input_grad,
+             reset_residual_grad1,
+             reset_residual_grad2,
+             N,
+             buf);
+}
+
+/*static*/
+template <typename T>
+void backward_kernel(ResidualLayerNormMeta const *m,
+                     T const *output_grad_ptr,
+                     T const *added_output_ptr,
+                     T *input_grad_ptr,
+                     T *residual1_grad_ptr,
+                     T *residual2_grad_ptr,
+                     T const *gamma_ptr,
+                     T *gamma_grad_ptr,
+                     T *beta_grad_ptr,
+                     hipStream_t stream) {
+  const int64_t M = m->effective_batch_size;
+  const int64_t N = m->effective_num_elements;
+  hipLaunchKernelGGL(HIP_KERNEL_NAME(ComputeInternalGradientsCUDAKernel<T>),
+                     M,
+                     kCUDABlockReduceNumThreads,
+                     0,
+                     stream,
+                     N,
+                     output_grad_ptr,
+                     added_output_ptr,
+                     gamma_ptr,
+                     static_cast<T *>(m->ds_ptr),
+                     static_cast<T *>(m->db_ptr));
+  const int64_t B = (M + kCUDANumThreads - 1) / kCUDANumThreads;
+  hipLaunchKernelGGL(HIP_KERNEL_NAME(ComputeGradientFusedParamsCUDAKernel<T>),
+                     B,
+                     kCUDANumThreads,
+                     0,
+                     stream,
+                     M,
+                     N,
+                     static_cast<T *>(m->mean_ptr),
+                     static_cast<T *>(m->rstd_ptr),
+                     static_cast<T *>(m->ds_ptr),
+                     static_cast<T *>(m->db_ptr),
+                     static_cast<T *>(m->scale_ptr),
+                     static_cast<T *>(m->bias_ptr));
+  int const warp_size = C10_WARP_SIZE;
+  int const num_threads = 128;
+  const dim3 blocks(M);
+  int nshared = (num_threads / warp_size) * sizeof(T);
+  hipLaunchKernelGGL(HIP_KERNEL_NAME(layer_norm_grad_input_kernel),
+                     blocks,
+                     num_threads,
+                     nshared,
+                     stream,
+                     output_grad_ptr,
+                     added_output_ptr,
+                     static_cast<T *>(m->mean_ptr),
+                     static_cast<T *>(m->rstd_ptr),
+                     gamma_ptr,
+                     input_grad_ptr,
+                     residual1_grad_ptr,
+                     residual2_grad_ptr,
+                     m->reset_input_grads[0],
+                     m->reset_input_grads[1],
+                     m->reset_input_grads[2],
+                     N);
+
+  if (gamma_grad_ptr != NULL || beta_grad_ptr != NULL) {
+    if (M < 512) {
+      // For small batch size, do colwise reduce directly
+      const int64_t B = (N + kCUDANumThreads - 1) / kCUDANumThreads;
+      hipLaunchKernelGGL(HIP_KERNEL_NAME(GammaBetaBackwardSimpleCUDAKernel<T>),
+                         B,
+                         kCUDANumThreads,
+                         0,
+                         stream,
+                         M,
+                         N,
+                         output_grad_ptr,
+                         added_output_ptr,
+                         static_cast<T *>(m->mean_ptr),
+                         static_cast<T *>(m->rstd_ptr),
+                         gamma_grad_ptr,
+                         beta_grad_ptr);
+    } else {
+      const int64_t B =
+          (N + kColwiseReduceTileSize - 1) / kColwiseReduceTileSize;
+      constexpr int kThreadX = kColwiseReduceTileSize;
+      constexpr int kThreadY = kColwiseReduceTileSize / 2;
+      hipLaunchKernelGGL(HIP_KERNEL_NAME(GammaBetaBackwardCUDAKernel<T>),
+                         B,
+                         dim3(kThreadX, kThreadY),
+                         0,
+                         stream,
+                         M,
+                         N,
+                         output_grad_ptr,
+                         added_output_ptr,
+                         static_cast<T *>(m->mean_ptr),
+                         static_cast<T *>(m->rstd_ptr),
+                         gamma_grad_ptr,
+                         beta_grad_ptr);
+    }
+  }
+}
+
+/*static*/
+void ResidualLayerNorm::backward_kernel_wrapper(
+    ResidualLayerNormMeta const *m,
+    GenericTensorAccessorR const &output_grad,
+    GenericTensorAccessorR const &added_output,
+    GenericTensorAccessorW const &input_grad,
+    GenericTensorAccessorW const &residual1_grad,
+    GenericTensorAccessorW const &residual2_grad,
+    GenericTensorAccessorR const &gamma,
+    GenericTensorAccessorW const &gamma_grad,
+    GenericTensorAccessorW const &beta_grad) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+
+  if (m->output_type[0] == DT_FLOAT) {
+    backward_kernel(
+        m,
+        output_grad.get_float_ptr(),
+        added_output.get_float_ptr(),
+        input_grad.get_float_ptr(),
+        residual1_grad.get_float_ptr(),
+        m->use_two_residuals ? residual2_grad.get_float_ptr() : nullptr,
+        m->elementwise_affine ? gamma.get_float_ptr() : nullptr,
+        m->elementwise_affine ? gamma_grad.get_float_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta_grad.get_float_ptr()
+                                               : nullptr,
+        stream);
+  } else if (m->output_type[0] == DT_HALF) {
+    backward_kernel(
+        m,
+        output_grad.get_half_ptr(),
+        added_output.get_half_ptr(),
+        input_grad.get_half_ptr(),
+        residual1_grad.get_half_ptr(),
+        m->use_two_residuals ? residual2_grad.get_half_ptr() : nullptr,
+        m->elementwise_affine ? gamma.get_half_ptr() : nullptr,
+        m->elementwise_affine ? gamma_grad.get_half_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta_grad.get_half_ptr()
+                                               : nullptr,
+        stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("[ResidualLayerNorm] backward time (CF) = %.2fms\n", elapsed);
+  }
+}
+
+/*static*/
+template <typename T>
+void peft_bwd_kernel(ResidualLayerNormMeta const *m,
+                     T const *output_grad_ptr,
+                     T *input_grad_ptr,
+                     T *residual1_grad_ptr,
+                     T *residual2_grad_ptr,
+                     T const *gamma_ptr,
+                     hipStream_t stream) {
+  const int64_t M = m->effective_batch_size;
+  const int64_t N = m->effective_num_elements;
+
+  if (m->inference_debugging) {
+    // save stuff here
+    std::string op_name_without_uid =
+        ResidualLayerNorm::get_op_name_without_uid(m);
+    char const *folder_path = "./inference_tensors/";
+    std::string base_filepath = std::string(folder_path);
+    if (m->layer_guid.model_id > 0) {
+      base_filepath += "model_" + std::to_string(m->layer_guid.model_id) + "_";
+    }
+    base_filepath += "bwd_step_" + std::to_string(m->bwd_step);
+    base_filepath += "_layers_" +
+                     std::to_string(m->layer_guid.transformer_layer_id) + "_" +
+                     op_name_without_uid + "_shard_" + std::to_string(0);
+
+    std::string filename1 = base_filepath + "_mean";
+    save_tensor(static_cast<T *>(m->mean_ptr),
+                m->effective_batch_size,
+                filename1.c_str());
+    std::string filename2 = base_filepath + "_rstd";
+    save_tensor(static_cast<T *>(m->rstd_ptr),
+                m->effective_batch_size,
+                filename2.c_str());
+    std::string filename3 = base_filepath + "_input_activation";
+    save_tensor(static_cast<T *>(m->input_activation),
+                m->effective_batch_size * m->effective_num_elements,
+                filename3.c_str());
+  }
+
+  int const warp_size = C10_WARP_SIZE;
+  int const num_threads = 128;
+  const dim3 blocks(M);
+  int nshared = (num_threads / warp_size) * sizeof(T);
+
+  hipLaunchKernelGGL(HIP_KERNEL_NAME(layer_norm_grad_input_kernel),
+                     blocks,
+                     num_threads,
+                     nshared,
+                     stream,
+                     output_grad_ptr,
+                     static_cast<T const *>(m->input_activation),
+                     static_cast<T *>(m->mean_ptr),
+                     static_cast<T *>(m->rstd_ptr),
+                     gamma_ptr,
+                     input_grad_ptr,
+                     residual1_grad_ptr,
+                     residual2_grad_ptr,
+                     m->reset_input_grads[0],
+                     m->reset_input_grads[1],
+                     m->reset_input_grads[2],
+                     N);
+}
+
+/*static*/
+void ResidualLayerNorm::peft_bwd_kernel_wrapper(
+    ResidualLayerNormMeta const *m,
+    GenericTensorAccessorR const &output_grad,
+    GenericTensorAccessorW const &input_grad,
+    GenericTensorAccessorW const &residual1_grad,
+    GenericTensorAccessorW const &residual2_grad,
+    GenericTensorAccessorR const &gamma) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+
+  if (m->output_type[0] == DT_FLOAT) {
+    peft_bwd_kernel(m,
+                    output_grad.get_float_ptr(),
+                    input_grad.get_float_ptr(),
+                    residual1_grad.get_float_ptr(),
+                    m->use_two_residuals ? residual2_grad.get_float_ptr()
+                                         : nullptr,
+                    m->elementwise_affine ? gamma.get_float_ptr() : nullptr,
+                    stream);
+  } else if (m->output_type[0] == DT_HALF) {
+    peft_bwd_kernel(m,
+                    output_grad.get_half_ptr(),
+                    input_grad.get_half_ptr(),
+                    residual1_grad.get_half_ptr(),
+                    m->use_two_residuals ? residual2_grad.get_half_ptr()
+                                         : nullptr,
+                    m->elementwise_affine ? gamma.get_half_ptr() : nullptr,
+                    stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("[ResidualLayerNorm] peft_bwd time (CF) = %.2fms\n", elapsed);
+  }
+}
+
 }; // namespace FlexFlow
diff --git a/src/ops/residual_layer_norm.cu b/src/ops/residual_layer_norm.cu
index e5ebdce6ed..8cdf87a92c 100644
--- a/src/ops/residual_layer_norm.cu
+++ b/src/ops/residual_layer_norm.cu
@@ -22,11 +22,12 @@ namespace FlexFlow {
 #define C10_WARP_SIZE 32
 constexpr int kCUDABlockReduceNumThreads = 512;
 constexpr int kCUDANumThreads = 256;
+constexpr int kColwiseReduceTileSize = 32;
 
 ResidualLayerNormMeta::ResidualLayerNormMeta(FFHandler handle,
                                              ResidualLayerNorm const *ln,
                                              MemoryAllocator &gpu_mem_allocator)
-    : OpMeta(handle) {
+    : OpMeta(handle, ln) {
   elementwise_affine = ln->elementwise_affine;
   use_bias = ln->use_bias;
   use_two_residuals = ln->use_two_residuals;
@@ -35,6 +36,7 @@ ResidualLayerNormMeta::ResidualLayerNormMeta(FFHandler handle,
   profiling = ln->profiling;
   inference_debugging = ln->inference_debugging;
   eps = ln->eps;
+  inplace_residual = ln->inplace_residual;
   DataType data_type = ln->data_type;
   size_t totalSize = effective_batch_size * data_type_size(data_type) * 3;
   gpu_mem_allocator.create_legion_instance(reserveInst, totalSize);
@@ -44,6 +46,7 @@ ResidualLayerNormMeta::ResidualLayerNormMeta(FFHandler handle,
       data_type_size(data_type) * effective_batch_size);
   bias_ptr = gpu_mem_allocator.allocate_instance_untyped(
       data_type_size(data_type) * effective_batch_size);
+  allocated_peft_buffer_size = 0;
 }
 
 ResidualLayerNormMeta::~ResidualLayerNormMeta(void) {
@@ -74,7 +77,7 @@ __inline__ __device__ T WarpReduceSum(T val) {
 }
 
 template <typename T>
-__inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
+__inline__ __device__ T BlockReduceSum(T val, T *shared) {
   int const lid = threadIdx.x % C10_WARP_SIZE;
   int const wid = threadIdx.x / C10_WARP_SIZE;
   val = WarpReduceSum(val);
@@ -83,9 +86,7 @@ __inline__ __device__ T BlockReduceSum(T val, T *shared, int max_num_threads) {
     shared[wid] = val;
   }
   __syncthreads();
-  val = (threadIdx.x < min(blockDim.x, max_num_threads) / C10_WARP_SIZE)
-            ? shared[lid]
-            : 0;
+  val = (threadIdx.x < (blockDim.x / C10_WARP_SIZE)) ? shared[lid] : T(0);
   if (wid == 0) {
     val = WarpReduceSum(val);
   }
@@ -109,8 +110,7 @@ __global__ void ResidualLayerNormKernel(int64_t N,
   const int64_t i = blockIdx.x;
   float sum1 = 0.0f;
   float sum2 = 0.0f;
-  for (int64_t j = threadIdx.x; j < N;
-       j += min(blockDim.x, kCUDABlockReduceNumThreads)) {
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
     const int64_t index = i * N + j;
     const T residual2_val = (residual2_ptr == nullptr)
                                 ? T(0)
@@ -119,12 +119,10 @@ __global__ void ResidualLayerNormKernel(int64_t N,
     sum1 += static_cast<float>(X[index]);
     sum2 += static_cast<float>(X[index]) * static_cast<float>(X[index]);
   }
-  if (threadIdx.x < kCUDABlockReduceNumThreads) {
-    sum1 = BlockReduceSum<float>(
-        sum1, m_shared, min(blockDim.x, kCUDABlockReduceNumThreads));
-    sum2 = BlockReduceSum<float>(
-        sum2, v_shared, min(blockDim.x, kCUDABlockReduceNumThreads));
-  }
+
+  sum1 = BlockReduceSum<float>(sum1, m_shared);
+  sum2 = BlockReduceSum<float>(sum2, v_shared);
+
   if (threadIdx.x == 0) {
     float const scale = float(1) / static_cast<float>(N);
     sum1 *= scale;
@@ -136,7 +134,7 @@ __global__ void ResidualLayerNormKernel(int64_t N,
   __syncthreads();
 
   using T_ACC = T;
-  for (int64_t j = threadIdx.x; j < N; j += min(blockDim.x, kCUDANumThreads)) {
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
     const int64_t index = i * N + j;
     const T_ACC gamma_v =
         gamma == nullptr ? T_ACC(1) : static_cast<T_ACC>(gamma[j]);
@@ -160,33 +158,57 @@ void ResidualLayerNorm::inference_kernel(ResidualLayerNormMeta const *m,
                                          T const *beta_ptr,
                                          cudaStream_t stream) {
 
-  std::pair<int, int> kernel1_parallelism =
-      std::make_pair(m->effective_batch_size, kCUDABlockReduceNumThreads);
-  std::pair<int, int> kernel2_parallelism =
-      std::make_pair(m->effective_batch_size, kCUDANumThreads);
-
-  int num_blocks =
-      std::max(kernel1_parallelism.first, kernel2_parallelism.first);
-  int num_threads =
-      std::max(kernel1_parallelism.second, kernel2_parallelism.second);
-
   ResidualLayerNormKernel<T>
-      <<<num_blocks, num_threads, 0, stream>>>(m->effective_num_elements,
-                                               m->eps,
-                                               input_ptr,
-                                               residual1_ptr,
-                                               residual2_ptr,
-                                               added_output_ptr,
-                                               static_cast<T *>(m->mean_ptr),
-                                               static_cast<T *>(m->rstd_ptr),
-                                               gamma_ptr,
-                                               beta_ptr,
-                                               output_ptr);
+      <<<m->effective_batch_size,
+         std::min(CUDA_NUM_THREADS, (int)m->effective_num_elements),
+         0,
+         stream>>>(m->effective_num_elements,
+                   m->eps,
+                   input_ptr,
+                   residual1_ptr,
+                   residual2_ptr,
+                   added_output_ptr,
+                   static_cast<T *>(m->mean_ptr),
+                   static_cast<T *>(m->rstd_ptr),
+                   gamma_ptr,
+                   beta_ptr,
+                   output_ptr);
+}
+template <typename T>
+void save_inference_tensors(ResidualLayerNormMeta const *m) {
+  if (m->inference_debugging) {
+    // save stuff here
+    std::string op_name_without_uid =
+        ResidualLayerNorm::get_op_name_without_uid(m);
+    char const *folder_path = "./inference_tensors/";
+    std::string base_filepath = std::string(folder_path);
+    if (m->layer_guid.model_id > 0) {
+      base_filepath += "model_" + std::to_string(m->layer_guid.model_id) + "_";
+    }
+    base_filepath += "fwd_step_" + std::to_string(m->decoding_step);
+    base_filepath += "_layers_" +
+                     std::to_string(m->layer_guid.transformer_layer_id) + "_" +
+                     op_name_without_uid + "_shard_" + std::to_string(0);
+
+    std::string filename1 = base_filepath + "_mean";
+    save_tensor(static_cast<T *>(m->mean_ptr),
+                m->effective_batch_size,
+                filename1.c_str());
+    std::string filename2 = base_filepath + "_rstd";
+    save_tensor(static_cast<T *>(m->rstd_ptr),
+                m->effective_batch_size,
+                filename2.c_str());
+    std::string filename3 = base_filepath + "_input_activation";
+    save_tensor(static_cast<T *>(m->input_activation),
+                m->effective_batch_size * m->effective_num_elements,
+                filename3.c_str());
+  }
 }
 
 /*static*/
 void ResidualLayerNorm::inference_kernel_wrapper(
-    ResidualLayerNormMeta const *m,
+    ResidualLayerNormMeta *m,
+    BatchConfig const *bc,
     GenericTensorAccessorR const &input,
     GenericTensorAccessorR const &residual1,
     GenericTensorAccessorR const &residual2,
@@ -203,6 +225,7 @@ void ResidualLayerNorm::inference_kernel_wrapper(
     cudaEventCreate(&t_end);
     cudaEventRecord(t_start, stream);
   }
+
   if (m->input_type[0] == DT_FLOAT) {
     ResidualLayerNorm::inference_kernel<float>(
         m,
@@ -229,6 +252,76 @@ void ResidualLayerNorm::inference_kernel_wrapper(
     assert(false && "unsupport datatype in layernorm");
   }
 
+  // save input activation if needed for PEFT
+  if (bc->num_active_peft_tokens() > 0) {
+    // Check that we have at most one request that requires peft_bwd
+    int num_peft_requests = 0;
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_bwd) {
+        num_peft_requests++;
+      }
+    }
+    assert(num_peft_requests <= 1);
+
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      // Skip non-PEFT requests
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        continue;
+      }
+      int num_peft_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+      int max_peft_tokens = bc->requestsInfo[i].max_sequence_length;
+      int first_token_offset = bc->requestsInfo[i].first_token_offset_in_batch;
+      int in_dim = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+      if (bc->requestsInfo[i].peft_bwd) {
+        size_t activation_size_needed =
+            data_type_size(m->input_type[0]) * max_peft_tokens * in_dim;
+        if (activation_size_needed > m->allocated_peft_buffer_size) {
+          MemoryAllocator *allocator = m->handle.peft_activation_allocator;
+          m->input_activation =
+              allocator->allocate_instance_untyped(activation_size_needed);
+          m->allocated_peft_buffer_size = activation_size_needed;
+        }
+        // copy input activation
+        if (m->input_type[0] == DT_FLOAT) {
+          checkCUDA(cudaMemcpyAsync(
+              m->input_activation,
+              added_output.get_float_ptr() + first_token_offset * in_dim,
+              data_type_size(m->input_type[0]) * num_peft_tokens * in_dim,
+              cudaMemcpyDeviceToDevice,
+              stream));
+        } else if (m->input_type[0] == DT_HALF) {
+          checkCUDA(cudaMemcpyAsync(
+              m->input_activation,
+              added_output.get_half_ptr() + first_token_offset * in_dim,
+              data_type_size(m->input_type[0]) * num_peft_tokens * in_dim,
+              cudaMemcpyDeviceToDevice,
+              stream));
+        } else {
+          assert(false && "unsupport datatype in layernorm");
+        }
+      }
+    }
+  }
+
+  if (m->inference_debugging) {
+    if (m->input_type[0] == DT_FLOAT) {
+      save_inference_tensors<float>(m);
+    } else if (m->input_type[0] == DT_HALF) {
+      save_inference_tensors<half>(m);
+    } else {
+      assert(false && "unsupport datatype in layernorm");
+    }
+  }
+
   if (m->profiling) {
     cudaEventRecord(t_end, stream);
     checkCUDA(cudaEventSynchronize(t_end));
@@ -240,4 +333,529 @@ void ResidualLayerNorm::inference_kernel_wrapper(
   }
 }
 
+template <typename T>
+__global__ void ComputeInternalGradientsCUDAKernel(
+    int64_t N, T const *dY, T const *X, T const *gamma, T *ds, T *db) {
+  using T_ACC = T;
+  __shared__ T_ACC ds_shared[C10_WARP_SIZE];
+  __shared__ T_ACC db_shared[C10_WARP_SIZE];
+  const int64_t i = blockIdx.x;
+  T_ACC sum1 = 0;
+  T_ACC sum2 = 0;
+  for (int64_t j = threadIdx.x; j < N; j += blockDim.x) {
+    const int64_t index = i * N + j;
+    const T_ACC gamma_v =
+        gamma == nullptr ? T_ACC(1) : static_cast<T_ACC>(gamma[j]);
+    sum1 +=
+        static_cast<T_ACC>(dY[index]) * static_cast<T_ACC>(X[index]) * gamma_v;
+    sum2 += static_cast<T_ACC>(dY[index]) * gamma_v;
+  }
+  sum1 = BlockReduceSum<T_ACC>(sum1, ds_shared);
+  sum2 = BlockReduceSum<T_ACC>(sum2, db_shared);
+  if (threadIdx.x == 0) {
+    ds[i] = sum1;
+    db[i] = sum2;
+  }
+}
+
+template <typename T>
+__global__ void ComputeGradientFusedParamsCUDAKernel(int64_t M,
+                                                     int64_t N,
+                                                     T const *mean,
+                                                     T const *rstd,
+                                                     T const *ds,
+                                                     T const *db,
+                                                     T *c1,
+                                                     T *c2) {
+  using T_ACC = T;
+  const int64_t index = blockIdx.x * blockDim.x + threadIdx.x;
+  if (index < M) {
+    const T_ACC s = T_ACC(1) / static_cast<T_ACC>((int)N);
+    const T_ACC a = (db[index] * static_cast<T_ACC>(mean[index]) - ds[index]) *
+                    static_cast<T_ACC>(rstd[index]) *
+                    static_cast<T_ACC>(rstd[index]) *
+                    static_cast<T_ACC>(rstd[index]) * s;
+    c1[index] = a;
+    c2[index] = -(a * static_cast<T_ACC>(mean[index]) +
+                  db[index] * static_cast<T_ACC>(rstd[index]) * s);
+  }
+}
+
+template <typename T>
+__global__ void GammaBetaBackwardSimpleCUDAKernel(int64_t M,
+                                                  int64_t N,
+                                                  T const *dY,
+                                                  T const *X,
+                                                  T const *mean,
+                                                  T const *rstd,
+                                                  T *dg,
+                                                  T *db) {
+  using T_ACC = T;
+  const int64_t j = blockIdx.x * blockDim.x + threadIdx.x;
+  if (j < N) {
+    T_ACC sum1 = 0;
+    T_ACC sum2 = 0;
+    for (int64_t i = 0; i < M; ++i) {
+      const int64_t index = i * N + j;
+      sum1 += dg == nullptr ? T_ACC(0)
+                            : static_cast<T_ACC>(dY[index]) *
+                                  (static_cast<T_ACC>(X[index]) -
+                                   static_cast<T_ACC>(mean[i])) *
+                                  static_cast<T_ACC>(rstd[i]);
+      sum2 += db == nullptr ? T_ACC(0) : static_cast<T_ACC>(dY[index]);
+    }
+    if (dg != nullptr) {
+      dg[j] = sum1;
+    }
+    if (db != nullptr) {
+      db[j] = sum2;
+    }
+  }
+}
+
+template <typename T>
+__global__ void GammaBetaBackwardCUDAKernel(int64_t M,
+                                            int64_t N,
+                                            T const *dY,
+                                            T const *X,
+                                            T const *mean,
+                                            T const *rstd,
+                                            T *dg,
+                                            T *db) {
+  using T_ACC = T;
+  __shared__ T_ACC g_shared[kColwiseReduceTileSize][kColwiseReduceTileSize + 1];
+  __shared__ T_ACC b_shared[kColwiseReduceTileSize][kColwiseReduceTileSize + 1];
+  const int64_t j = blockIdx.x * blockDim.x + threadIdx.x;
+  T_ACC dg_sum1 = 0;
+  T_ACC dg_sum2 = 0;
+  T_ACC db_sum1 = 0;
+  T_ACC db_sum2 = 0;
+  if (j < N) {
+    for (int64_t i = threadIdx.y; i < M; i += blockDim.y * 2) {
+      const int64_t i1 = i;
+      const int64_t i2 = i + blockDim.y;
+      const int64_t index1 = i1 * N + j;
+      const int64_t index2 = i2 * N + j;
+      dg_sum1 += dg == nullptr ? T_ACC(0)
+                               : static_cast<T_ACC>(dY[index1]) *
+                                     (static_cast<T_ACC>(X[index1]) -
+                                      static_cast<T_ACC>(mean[i1])) *
+                                     static_cast<T_ACC>(rstd[i1]);
+      db_sum1 += db == nullptr ? T_ACC(0) : static_cast<T_ACC>(dY[index1]);
+      if (i2 < M) {
+        dg_sum2 += dg == nullptr ? T_ACC(0)
+                                 : static_cast<T_ACC>(dY[index2]) *
+                                       (static_cast<T_ACC>(X[index2]) -
+                                        static_cast<T_ACC>(mean[i2])) *
+                                       static_cast<T_ACC>(rstd[i2]);
+        db_sum2 += db == nullptr ? T_ACC(0) : static_cast<T_ACC>(dY[index2]);
+      }
+    }
+  }
+  g_shared[threadIdx.y][threadIdx.x] = dg_sum1;
+  g_shared[threadIdx.y + blockDim.y][threadIdx.x] = dg_sum2;
+  b_shared[threadIdx.y][threadIdx.x] = db_sum1;
+  b_shared[threadIdx.y + blockDim.y][threadIdx.x] = db_sum2;
+  __syncthreads();
+  T_ACC sum1 = g_shared[threadIdx.x][threadIdx.y];
+  T_ACC sum2 = b_shared[threadIdx.x][threadIdx.y];
+  sum1 = WarpReduceSum(sum1);
+  sum2 = WarpReduceSum(sum2);
+  if (threadIdx.x == 0) {
+    const int64_t j = blockIdx.x * blockDim.x + threadIdx.y;
+    if (j < N) {
+      if (dg != nullptr) {
+        dg[j] = sum1;
+      }
+      if (db != nullptr) {
+        db[j] = sum2;
+      }
+    }
+  }
+  sum1 = g_shared[threadIdx.x][threadIdx.y + blockDim.y];
+  sum2 = b_shared[threadIdx.x][threadIdx.y + blockDim.y];
+  sum1 = WarpReduceSum(sum1);
+  sum2 = WarpReduceSum(sum2);
+  if (threadIdx.x == 0) {
+    const int64_t j = blockIdx.x * blockDim.x + threadIdx.y + blockDim.y;
+    if (j < N) {
+      if (dg != nullptr) {
+        dg[j] = sum1;
+      }
+      if (db != nullptr) {
+        db[j] = sum2;
+      }
+    }
+  }
+}
+
+template <typename T>
+__device__ __inline__ void compute_gI(T const *__restrict__ dY,
+                                      T const *__restrict__ X,
+                                      T const *__restrict__ mean,
+                                      T const *__restrict__ rstd,
+                                      T const *__restrict__ gamma,
+                                      T *dX,
+                                      T *dX_residual1,
+                                      T *dX_residual2,
+                                      bool reset_input_grad,
+                                      bool reset_residual_grad1,
+                                      bool reset_residual_grad2,
+                                      int const N,
+                                      T *buf) {
+  auto const i1 = blockIdx.x;
+  const T mean_val = mean[i1];
+  const T rstd_val = rstd[i1];
+  T stats_x1{0}, stats_x2{0};
+  constexpr int unroll = 4;
+  auto l = unroll * threadIdx.x;
+  T const *X_i = X + i1 * N;
+  T const *dY_i = dY + i1 * N;
+  T *dX_i = dX + i1 * N;
+  T *dX_residual1_i = dX_residual1 + i1 * N;
+  T *dX_residual2_i =
+      (dX_residual2 != nullptr) ? dX_residual2 + i1 * N : nullptr;
+  // vectorized reads don't improve perf, so use regular unrolling
+
+  for (; l + unroll - 1 < N; l += blockDim.x * unroll) {
+#pragma unroll
+    for (int k = 0; k < unroll; k++) {
+      T gamma_val = (gamma != nullptr) ? static_cast<T>(gamma[l + k]) : T(1);
+      const T c_h = static_cast<T>(X_i[l + k]);
+      const T c_loss = static_cast<T>(dY_i[l + k]);
+      stats_x1 += c_loss * gamma_val;
+      stats_x2 += c_loss * gamma_val * (c_h - mean_val) * rstd_val;
+    }
+  }
+  for (; l < N; l++) {
+    T gamma_val = (gamma != nullptr) ? static_cast<T>(gamma[l]) : T(1);
+    const T c_h = static_cast<T>(X_i[l]);
+    const T c_loss = static_cast<T>(dY_i[l]);
+    stats_x1 += c_loss * gamma_val;
+    stats_x2 += c_loss * gamma_val * (c_h - mean_val) * rstd_val;
+  }
+
+  stats_x1 = BlockReduceSum(stats_x1, buf);
+  stats_x2 = BlockReduceSum(stats_x2, buf);
+  if (threadIdx.x == 0) {
+    buf[0] = stats_x1;
+    buf[1] = stats_x2;
+  }
+  __syncthreads();
+  stats_x1 = buf[0];
+  stats_x2 = buf[1];
+  T fH = N;
+  T term1 = (T(1) / fH) * rstd_val;
+
+  for (int l = threadIdx.x; l < N; l += blockDim.x) {
+    const T x = X_i[l];
+    const T dy = dY_i[l];
+    T gamma_val = (gamma != nullptr) ? static_cast<T>(gamma[l]) : T(1);
+    T f_grad_input = fH * gamma_val * dy;
+    f_grad_input -= (x - mean_val) * rstd_val * stats_x2;
+    f_grad_input -= stats_x1;
+    f_grad_input *= term1;
+    if (reset_input_grad) {
+      dX_i[l] = f_grad_input;
+    } else {
+      dX_i[l] += f_grad_input;
+    }
+    if (reset_residual_grad1) {
+      dX_residual1_i[l] = f_grad_input;
+    } else {
+      dX_residual1_i[l] += f_grad_input;
+    }
+    if (dX_residual2 != nullptr) {
+      if (reset_residual_grad2) {
+        dX_residual2_i[l] = f_grad_input;
+      } else {
+        dX_residual2_i[l] += f_grad_input;
+      }
+    }
+  }
+}
+
+template <typename T>
+__global__ void layer_norm_grad_input_kernel(T const *__restrict__ dY,
+                                             T const *__restrict__ X,
+                                             T const *__restrict__ mean,
+                                             T const *__restrict__ rstd,
+                                             T const *__restrict__ gamma,
+                                             T *dX,
+                                             T *dX_residual1,
+                                             T *dX_residual2,
+                                             bool reset_input_grad,
+                                             bool reset_residual_grad1,
+                                             bool reset_residual_grad2,
+                                             int const N) {
+  alignas(sizeof(double)) extern __shared__ char s_data1[];
+  T *buf = reinterpret_cast<T *>(&s_data1);
+  compute_gI(dY,
+             X,
+             mean,
+             rstd,
+             gamma,
+             dX,
+             dX_residual1,
+             dX_residual2,
+             reset_input_grad,
+             reset_residual_grad1,
+             reset_residual_grad2,
+             N,
+             buf);
+}
+
+/*static*/
+template <typename T>
+void backward_kernel(ResidualLayerNormMeta const *m,
+                     T const *output_grad_ptr,
+                     T const *added_output_ptr,
+                     T *input_grad_ptr,
+                     T *residual1_grad_ptr,
+                     T *residual2_grad_ptr,
+                     T const *gamma_ptr,
+                     T *gamma_grad_ptr,
+                     T *beta_grad_ptr,
+                     cudaStream_t stream) {
+  const int64_t M = m->effective_batch_size;
+  const int64_t N = m->effective_num_elements;
+  ComputeInternalGradientsCUDAKernel<T>
+      <<<M, kCUDABlockReduceNumThreads, 0, stream>>>(
+          N,
+          output_grad_ptr,
+          added_output_ptr,
+          gamma_ptr,
+          static_cast<T *>(m->ds_ptr),
+          static_cast<T *>(m->db_ptr));
+  const int64_t B = (M + kCUDANumThreads - 1) / kCUDANumThreads;
+  ComputeGradientFusedParamsCUDAKernel<T>
+      <<<B, kCUDANumThreads, 0, stream>>>(M,
+                                          N,
+                                          static_cast<T *>(m->mean_ptr),
+                                          static_cast<T *>(m->rstd_ptr),
+                                          static_cast<T *>(m->ds_ptr),
+                                          static_cast<T *>(m->db_ptr),
+                                          static_cast<T *>(m->scale_ptr),
+                                          static_cast<T *>(m->bias_ptr));
+  int const warp_size = C10_WARP_SIZE;
+  int const num_threads = 128;
+  const dim3 blocks(M);
+  int nshared = (num_threads / warp_size) * sizeof(T);
+  layer_norm_grad_input_kernel<<<blocks, num_threads, nshared, stream>>>(
+      output_grad_ptr,
+      added_output_ptr,
+      static_cast<T *>(m->mean_ptr),
+      static_cast<T *>(m->rstd_ptr),
+      gamma_ptr,
+      input_grad_ptr,
+      residual1_grad_ptr,
+      residual2_grad_ptr,
+      m->reset_input_grads[0],
+      m->reset_input_grads[1],
+      m->reset_input_grads[2],
+      N);
+
+  if (gamma_grad_ptr != NULL || beta_grad_ptr != NULL) {
+    if (M < 512) {
+      // For small batch size, do colwise reduce directly
+      const int64_t B = (N + kCUDANumThreads - 1) / kCUDANumThreads;
+      GammaBetaBackwardSimpleCUDAKernel<T>
+          <<<B, kCUDANumThreads, 0, stream>>>(M,
+                                              N,
+                                              output_grad_ptr,
+                                              added_output_ptr,
+                                              static_cast<T *>(m->mean_ptr),
+                                              static_cast<T *>(m->rstd_ptr),
+                                              gamma_grad_ptr,
+                                              beta_grad_ptr);
+    } else {
+      const int64_t B =
+          (N + kColwiseReduceTileSize - 1) / kColwiseReduceTileSize;
+      constexpr int kThreadX = kColwiseReduceTileSize;
+      constexpr int kThreadY = kColwiseReduceTileSize / 2;
+      GammaBetaBackwardCUDAKernel<T>
+          <<<B, dim3(kThreadX, kThreadY), 0, stream>>>(
+              M,
+              N,
+              output_grad_ptr,
+              added_output_ptr,
+              static_cast<T *>(m->mean_ptr),
+              static_cast<T *>(m->rstd_ptr),
+              gamma_grad_ptr,
+              beta_grad_ptr);
+    }
+  }
+}
+
+/*static*/
+void ResidualLayerNorm::backward_kernel_wrapper(
+    ResidualLayerNormMeta const *m,
+    GenericTensorAccessorR const &output_grad,
+    GenericTensorAccessorR const &added_output,
+    GenericTensorAccessorW const &input_grad,
+    GenericTensorAccessorW const &residual1_grad,
+    GenericTensorAccessorW const &residual2_grad,
+    GenericTensorAccessorR const &gamma,
+    GenericTensorAccessorW const &gamma_grad,
+    GenericTensorAccessorW const &beta_grad) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+
+  if (m->output_type[0] == DT_FLOAT) {
+    backward_kernel(
+        m,
+        output_grad.get_float_ptr(),
+        added_output.get_float_ptr(),
+        input_grad.get_float_ptr(),
+        residual1_grad.get_float_ptr(),
+        m->use_two_residuals ? residual2_grad.get_float_ptr() : nullptr,
+        m->elementwise_affine ? gamma.get_float_ptr() : nullptr,
+        m->elementwise_affine ? gamma_grad.get_float_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta_grad.get_float_ptr()
+                                               : nullptr,
+        stream);
+  } else if (m->output_type[0] == DT_HALF) {
+    backward_kernel(
+        m,
+        output_grad.get_half_ptr(),
+        added_output.get_half_ptr(),
+        input_grad.get_half_ptr(),
+        residual1_grad.get_half_ptr(),
+        m->use_two_residuals ? residual2_grad.get_half_ptr() : nullptr,
+        m->elementwise_affine ? gamma.get_half_ptr() : nullptr,
+        m->elementwise_affine ? gamma_grad.get_half_ptr() : nullptr,
+        (m->elementwise_affine && m->use_bias) ? beta_grad.get_half_ptr()
+                                               : nullptr,
+        stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[ResidualLayerNorm] backward time (CF) = %.2fms\n", elapsed);
+  }
+}
+
+/*static*/
+template <typename T>
+void peft_bwd_kernel(ResidualLayerNormMeta const *m,
+                     T const *output_grad_ptr,
+                     T *input_grad_ptr,
+                     T *residual1_grad_ptr,
+                     T *residual2_grad_ptr,
+                     T const *gamma_ptr,
+                     cudaStream_t stream) {
+  const int64_t M = m->effective_batch_size;
+  const int64_t N = m->effective_num_elements;
+
+  if (m->inference_debugging) {
+    // save stuff here
+    std::string op_name_without_uid =
+        ResidualLayerNorm::get_op_name_without_uid(m);
+    char const *folder_path = "./inference_tensors/";
+    std::string base_filepath = std::string(folder_path);
+    if (m->layer_guid.model_id > 0) {
+      base_filepath += "model_" + std::to_string(m->layer_guid.model_id) + "_";
+    }
+    base_filepath += "bwd_step_" + std::to_string(m->bwd_step);
+    base_filepath += "_layers_" +
+                     std::to_string(m->layer_guid.transformer_layer_id) + "_" +
+                     op_name_without_uid + "_shard_" + std::to_string(0);
+
+    std::string filename1 = base_filepath + "_mean";
+    save_tensor(static_cast<T *>(m->mean_ptr),
+                m->effective_batch_size,
+                filename1.c_str());
+    std::string filename2 = base_filepath + "_rstd";
+    save_tensor(static_cast<T *>(m->rstd_ptr),
+                m->effective_batch_size,
+                filename2.c_str());
+    std::string filename3 = base_filepath + "_input_activation";
+    save_tensor(static_cast<T *>(m->input_activation),
+                m->effective_batch_size * m->effective_num_elements,
+                filename3.c_str());
+  }
+
+  int const warp_size = C10_WARP_SIZE;
+  int const num_threads = 128;
+  const dim3 blocks(M);
+  int nshared = (num_threads / warp_size) * sizeof(T);
+
+  layer_norm_grad_input_kernel<<<blocks, num_threads, nshared, stream>>>(
+      output_grad_ptr,
+      static_cast<T const *>(m->input_activation),
+      static_cast<T *>(m->mean_ptr),
+      static_cast<T *>(m->rstd_ptr),
+      gamma_ptr,
+      input_grad_ptr,
+      residual1_grad_ptr,
+      residual2_grad_ptr,
+      m->reset_input_grads[0],
+      m->reset_input_grads[1],
+      m->reset_input_grads[2],
+      N);
+}
+
+/*static*/
+void ResidualLayerNorm::peft_bwd_kernel_wrapper(
+    ResidualLayerNormMeta const *m,
+    GenericTensorAccessorR const &output_grad,
+    GenericTensorAccessorW const &input_grad,
+    GenericTensorAccessorW const &residual1_grad,
+    GenericTensorAccessorW const &residual2_grad,
+    GenericTensorAccessorR const &gamma) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+
+  if (m->output_type[0] == DT_FLOAT) {
+    peft_bwd_kernel(m,
+                    output_grad.get_float_ptr(),
+                    input_grad.get_float_ptr(),
+                    residual1_grad.get_float_ptr(),
+                    m->use_two_residuals ? residual2_grad.get_float_ptr()
+                                         : nullptr,
+                    m->elementwise_affine ? gamma.get_float_ptr() : nullptr,
+                    stream);
+  } else if (m->output_type[0] == DT_HALF) {
+    peft_bwd_kernel(m,
+                    output_grad.get_half_ptr(),
+                    input_grad.get_half_ptr(),
+                    residual1_grad.get_half_ptr(),
+                    m->use_two_residuals ? residual2_grad.get_half_ptr()
+                                         : nullptr,
+                    m->elementwise_affine ? gamma.get_half_ptr() : nullptr,
+                    stream);
+  } else {
+    assert(false && "Unsupported data type");
+  }
+
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[ResidualLayerNorm] peft_bwd time (CF) = %.2fms\n", elapsed);
+  }
+}
+
 }; // namespace FlexFlow
diff --git a/src/ops/residual_rms_norm.cc b/src/ops/residual_rms_norm.cc
index b3ee7179d0..744902f908 100644
--- a/src/ops/residual_rms_norm.cc
+++ b/src/ops/residual_rms_norm.cc
@@ -42,7 +42,8 @@ using namespace FlexFlow::Kernels::ResidualRMSNorm;
 
 bool operator==(ResidualRMSNormParams const &lhs,
                 ResidualRMSNormParams const &rhs) {
-  return lhs.layer_guid == rhs.layer_guid && lhs.eps == rhs.eps;
+  return lhs.layer_guid == rhs.layer_guid && lhs.eps == rhs.eps &&
+         lhs.dim == rhs.dim && lhs.inplace_residual == rhs.inplace_residual;
 }
 
 bool ResidualRMSNormParams::is_valid(
@@ -55,7 +56,8 @@ ResidualRMSNormParams ResidualRMSNorm::get_params() const {
   params.layer_guid = this->layer_guid;
   params.eps = this->eps;
   params.dim = this->dim;
-  if (this->name != nullptr) {
+  params.inplace_residual = this->inplace_residual;
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
@@ -66,6 +68,7 @@ void FFModel::residual_rms_norm(const Tensor input1,
                                 Tensor *outputs,
                                 float eps,
                                 int dim,
+                                bool inplace_residual,
                                 DataType data_type,
                                 char const *name) {
   if (data_type == DT_NONE) {
@@ -90,9 +93,9 @@ void FFModel::residual_rms_norm(const Tensor input1,
                         casted_input2);
 
   rm->outputs[0] = create_tensor_legion_ordering(
-      input1->num_dims, input1->dims, data_type, rm, 0, false /*create_grad*/);
+      input1->num_dims, input1->dims, data_type, rm, 0, true /*create_grad*/);
   rm->outputs[1] = create_tensor_legion_ordering(
-      input1->num_dims, input1->dims, data_type, rm, 1, false /*create_grad*/);
+      input1->num_dims, input1->dims, data_type, rm, 1, true /*create_grad*/);
 
   // weights
   int weight_dims[1] = {dim};
@@ -100,12 +103,13 @@ void FFModel::residual_rms_norm(const Tensor input1,
                                                  weight_dims,
                                                  data_type,
                                                  rm,
-                                                 true /*create_grad*/,
+                                                 false /*create_grad*/,
                                                  nullptr,
                                                  CHOSEN_SYNC_TYPE);
 
   rm->add_float_property("eps", eps);
   rm->add_int_property("dim", dim);
+  rm->add_int_property("inplace_residual", inplace_residual);
   layers.push_back(rm);
   outputs[0] = rm->outputs[0];
   outputs[1] = rm->outputs[1];
@@ -120,6 +124,8 @@ Op *ResidualRMSNorm::create_operator_from_layer(
   long long value;
   layer->get_int_property("dim", value);
   int dim = value;
+  layer->get_int_property("inplace_residual", value);
+  bool inplace_residual = (bool)value;
 
   return new ResidualRMSNorm(model,
                              layer->layer_guid,
@@ -127,6 +133,7 @@ Op *ResidualRMSNorm::create_operator_from_layer(
                              inputs[1],
                              eps,
                              dim,
+                             inplace_residual,
                              false,
                              layer->name);
 }
@@ -143,6 +150,7 @@ ResidualRMSNorm::ResidualRMSNorm(
                       inputs.second,
                       params.eps,
                       params.dim,
+                      params.inplace_residual,
                       allocate_weights,
                       params.name) {}
 
@@ -157,6 +165,7 @@ ResidualRMSNorm::ResidualRMSNorm(
                       inputs.second,
                       other.eps,
                       other.dim,
+                      other.inplace_residual,
                       allocate_weights,
                       other.name) {}
 ResidualRMSNorm::ResidualRMSNorm(FFModel &model,
@@ -165,6 +174,7 @@ ResidualRMSNorm::ResidualRMSNorm(FFModel &model,
                                  const ParallelTensor _input2,
                                  float _eps,
                                  int dim,
+                                 bool _inplace_residual,
                                  bool allocate_weights,
                                  char const *name)
     : Op(model,
@@ -177,6 +187,7 @@ ResidualRMSNorm::ResidualRMSNorm(FFModel &model,
          _input1,
          _input2) {
   eps = _eps;
+  inplace_residual = _inplace_residual;
   inputs[0] = _input1;
   inputs[1] = _input2;
   layer_guid = _layer_guid;
@@ -234,6 +245,22 @@ ResidualRMSNorm::ResidualRMSNorm(FFModel &model,
   }
 }
 
+void ResidualRMSNorm::map_output_tensors(FFModel &ff) {
+  assert(numOutputs == 2);
+  assert(outputs[0]->get_volume() == inputs[0]->get_volume());
+  if (inplace_residual) {
+    outputs[0]->parallel_is = inputs[0]->parallel_is;
+    outputs[0]->region = inputs[0]->region;
+    outputs[0]->part = inputs[0]->part;
+    outputs[0]->region_grad = inputs[0]->region_grad;
+    outputs[0]->part_grad = inputs[0]->part_grad;
+    // map output 1 to new region
+    ff.map_tensor(outputs[1], this);
+  } else {
+    Op::map_output_tensors(ff);
+  }
+}
+
 void ResidualRMSNorm::init(FFModel const &ff) {
   assert(check_output_input_weight_same_parallel_is());
   parallel_is = outputs[0]->parallel_is;
@@ -249,36 +276,44 @@ void ResidualRMSNorm::init(FFModel const &ff) {
                          false /*must*/,
                          0 /*mapper_id*/,
                          outputs[0]->machine_view.hash());
-  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    inputs[0]->region));
-  launcher.add_field(0, FID_DATA);
+  if (inplace_residual) {
+    assert(outputs[0]->part == inputs[0]->part);
+    assert(outputs[0]->region == inputs[0]->region);
+  }
+  int fid = 0;
+  launcher.add_region_requirement(
+      RegionRequirement(inputs[0]->part,
+                        0 /*projection id*/,
+                        inplace_residual ? READ_WRITE : READ_ONLY,
+                        EXCLUSIVE,
+                        inputs[0]->region));
+  launcher.add_field(fid++, FID_DATA);
   launcher.add_region_requirement(RegionRequirement(inputs[1]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
                                                     EXCLUSIVE,
                                                     inputs[1]->region));
-  launcher.add_field(1, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    outputs[0]->region));
-  launcher.add_field(2, FID_DATA);
+  launcher.add_field(fid++, FID_DATA);
+  if (!inplace_residual) {
+    launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                      0 /*projection id*/,
+                                                      WRITE_ONLY,
+                                                      EXCLUSIVE,
+                                                      outputs[0]->region));
+    launcher.add_field(fid++, FID_DATA);
+  }
   launcher.add_region_requirement(RegionRequirement(outputs[1]->part,
                                                     0 /*projection id*/,
                                                     WRITE_ONLY,
                                                     EXCLUSIVE,
                                                     outputs[1]->region));
-  launcher.add_field(3, FID_DATA);
+  launcher.add_field(fid++, FID_DATA);
   launcher.add_region_requirement(RegionRequirement(weights[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
                                                     EXCLUSIVE,
                                                     weights[0]->region));
-  launcher.add_field(4, FID_DATA);
+  launcher.add_field(fid++, FID_DATA);
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
   set_opmeta_from_futuremap(ff, fm);
@@ -306,36 +341,45 @@ void ResidualRMSNorm::init_inference(
                          false /*must*/,
                          0 /*mapper_id*/,
                          machine_view_hash);
-  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_inputs[0]->region));
-  launcher.add_field(0, FID_DATA);
+  if (inplace_residual) {
+    assert(batch_outputs[0]->part == batch_inputs[0]->part);
+    assert(batch_outputs[0]->region == batch_inputs[0]->region);
+  }
+  int fid = 0;
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[0]->part,
+                        0 /*projection id*/,
+                        inplace_residual ? READ_WRITE : READ_ONLY,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region));
+  launcher.add_field(fid++, FID_DATA);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
                                                     EXCLUSIVE,
                                                     batch_inputs[1]->region));
-  launcher.add_field(1, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_outputs[0]->region));
-  launcher.add_field(2, FID_DATA);
+  launcher.add_field(fid++, FID_DATA);
+  if (!inplace_residual) {
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[0]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[0]->region));
+    launcher.add_field(fid++, FID_DATA);
+  }
   launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
                                                     0 /*projection id*/,
                                                     WRITE_ONLY,
                                                     EXCLUSIVE,
                                                     batch_outputs[1]->region));
-  launcher.add_field(3, FID_DATA);
+  launcher.add_field(fid++, FID_DATA);
   launcher.add_region_requirement(RegionRequirement(weights[0]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
                                                     EXCLUSIVE,
                                                     weights[0]->region));
-  launcher.add_field(4, FID_DATA);
+  launcher.add_field(fid++, FID_DATA);
   FutureMap fm = runtime->execute_index_space(ctx, launcher);
   fm.wait_all_results();
   set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
@@ -383,73 +427,131 @@ FutureMap
                          0 /*mapper_id*/,
                          machine_view_hash);
   launcher.add_future(bc);
-  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_inputs[0]->region));
-  launcher.add_field(0, FID_DATA);
+  if (inplace_residual) {
+    assert(batch_outputs[0]->part == batch_inputs[0]->part);
+    assert(batch_outputs[0]->region == batch_inputs[0]->region);
+  }
+  int fid = 0;
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[0]->part,
+                        0 /*projection id*/,
+                        inplace_residual ? READ_WRITE : READ_ONLY,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region));
+  launcher.add_field(fid++, FID_DATA);
   launcher.add_region_requirement(RegionRequirement(batch_inputs[1]->part,
                                                     0 /*projection id*/,
                                                     READ_ONLY,
                                                     EXCLUSIVE,
                                                     batch_inputs[1]->region));
-  launcher.add_field(1, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_outputs[0]->region));
-  launcher.add_field(2, FID_DATA);
+  launcher.add_field(fid++, FID_DATA);
+  if (!inplace_residual) {
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[0]->part,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[0]->region));
+    launcher.add_field(fid++, FID_DATA);
+  }
   launcher.add_region_requirement(RegionRequirement(batch_outputs[1]->part,
                                                     0 /*projection id*/,
                                                     WRITE_ONLY,
                                                     EXCLUSIVE,
                                                     batch_outputs[1]->region));
-  launcher.add_field(3, FID_DATA);
+  launcher.add_field(fid++, FID_DATA);
   launcher.add_region_requirement(RegionRequirement(weights[0]->part,
                                                     0 /*projection id*/,
-                                                    READ_WRITE,
+                                                    READ_ONLY,
                                                     EXCLUSIVE,
                                                     weights[0]->region));
-  launcher.add_field(4, FID_DATA);
+  launcher.add_field(fid++, FID_DATA);
   return runtime->execute_index_space(ctx, launcher);
 }
 
 /*
-  regions[0](I): input1
+  regions[0](I/O): input1 / residual output
   regions[1](I): input2
-  regions[2](O): residual output
-  regions[3](O): output
-  regions[4](I/O): weight
+  regions[2](O): output
+  regions[3](I): weight
 */
 void ResidualRMSNorm::inference_task(Task const *task,
                                      std::vector<PhysicalRegion> const &regions,
                                      Context ctx,
                                      Runtime *runtime) {
-  assert(task->regions.size() == 5);
-  assert(regions.size() == 5);
   BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
   if (bc->num_tokens == 0) {
     return;
   }
   ResidualRMSNormMeta *m = *((ResidualRMSNormMeta **)task->local_args);
+  assert(task->regions.size() == 5 - m->inplace_residual);
+  assert(regions.size() == 5 - m->inplace_residual);
   GenericTensorAccessorR input1 = helperGetGenericTensorAccessorRO(
       m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
   GenericTensorAccessorR input2 = helperGetGenericTensorAccessorRO(
       m->input_type[1], regions[1], task->regions[1], FID_DATA, ctx, runtime);
-  GenericTensorAccessorW residual_output = helperGetGenericTensorAccessorWO(
-      m->output_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
-  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
-      m->output_type[1], regions[3], task->regions[3], FID_DATA, ctx, runtime);
-  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
-      m->weight_type[0], regions[4], task->regions[4], FID_DATA, ctx, runtime);
-  forward_kernel_wrapper(m, input1, input2, weight, residual_output, output);
+
+  GenericTensorAccessorW residual_output, output;
+  GenericTensorAccessorR weight;
+  if (m->inplace_residual) {
+    // residual_output is mapped to the same region as the input
+    residual_output = helperGetGenericTensorAccessorWO(m->output_type[0],
+                                                       regions[0],
+                                                       task->regions[0],
+                                                       FID_DATA,
+                                                       ctx,
+                                                       runtime);
+    output = helperGetGenericTensorAccessorWO(m->output_type[1],
+                                              regions[2],
+                                              task->regions[2],
+                                              FID_DATA,
+                                              ctx,
+                                              runtime);
+    weight = helperGetGenericTensorAccessorRO(m->weight_type[0],
+                                              regions[3],
+                                              task->regions[3],
+                                              FID_DATA,
+                                              ctx,
+                                              runtime);
+  } else {
+    residual_output = helperGetGenericTensorAccessorWO(m->output_type[0],
+                                                       regions[2],
+                                                       task->regions[2],
+                                                       FID_DATA,
+                                                       ctx,
+                                                       runtime);
+    output = helperGetGenericTensorAccessorWO(m->output_type[1],
+                                              regions[3],
+                                              task->regions[3],
+                                              FID_DATA,
+                                              ctx,
+                                              runtime);
+    weight = helperGetGenericTensorAccessorRO(m->weight_type[0],
+                                              regions[4],
+                                              task->regions[4],
+                                              FID_DATA,
+                                              ctx,
+                                              runtime);
+  }
+
+  inference_kernel_wrapper(
+      m, bc, input1, input2, weight, residual_output, output);
+
   if (m->inference_debugging) {
     assert(task->index_point.get_dim() == 1);
     int shard_id = task->index_point.point_data[0];
-    ResidualRMSNorm::save_inference_tensors_to_file(
-        m, shard_id, bc, {input1, input2}, {weight}, {residual_output, output});
+    if (m->inplace_residual) {
+      ResidualRMSNorm::save_inference_tensors_to_file(
+          m, shard_id, bc, {input2}, {weight}, {residual_output, output});
+    } else {
+      ResidualRMSNorm::save_inference_tensors_to_file(
+          m,
+          shard_id,
+          bc,
+          {input1, input2},
+          {weight},
+          {residual_output, output});
+    }
   }
 }
 
@@ -459,6 +561,7 @@ void ResidualRMSNorm::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.model_id);
   sez.serialize(this->eps);
   sez.serialize(this->dim);
+  sez.serialize(this->inplace_residual);
   sez.serialize(strlen(this->name));
   sez.serialize(this->name, strlen(this->name));
 }
@@ -479,6 +582,8 @@ Node ResidualRMSNorm::deserialize(FFModel &ff,
   LayerID layer_guid(id, transformer_layer_id, deserialized_model_id);
   dez.deserialize(eps);
   dez.deserialize(dim);
+  int inplace_residual;
+  dez.deserialize(inplace_residual);
   size_t name_len;
   char name[MAX_OPNAME] = {0};
   dez.deserialize(name_len);
@@ -487,13 +592,285 @@ Node ResidualRMSNorm::deserialize(FFModel &ff,
   params.layer_guid = layer_guid;
   params.eps = eps;
   params.dim = dim;
+  params.inplace_residual = inplace_residual;
   strcpy(params.name, name);
   return ff.get_or_create_node<ResidualRMSNorm>({inputs[0], inputs[1]}, params);
 }
 
 void ResidualRMSNorm::backward(FFModel const &ff) {
-  assert(false);
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_backward(ff, argmap);
+  IndexLauncher launcher(RESIDUAL_RMSNORM_BWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  // regions[0](I): RMS output_grad
+  launcher.add_region_requirement(RegionRequirement(outputs[1]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[1]->region_grad));
+  launcher.add_field(0, FID_DATA);
+  // regions[1](I): residual output / RMS input
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  // regions[2](I/O): residual input grad 0
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region_grad));
+  launcher.add_field(2, FID_DATA);
+  // regions[3](I/O): residual input grad 1
+  launcher.add_region_requirement(RegionRequirement(inputs[1]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    inputs[1]->region_grad));
+  launcher.add_field(3, FID_DATA);
+  // regions[4](I): gamma
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(4, FID_DATA);
+  // regions[5](I/O): gamma_grad
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region_grad));
+  launcher.add_field(5, FID_DATA);
+
+  runtime->execute_index_space(ctx, launcher);
+}
+
+/*
+  regions[0](I): RMS output_grad
+  regions[1](I): Residual output / RMS input
+  regions[2](I/O): Residual input 0 grad
+  regions[3](I/O): Residual input 1 grad
+  regions[4](I): weight
+  regions[5](I/O): weight_grad
+*/
+void ResidualRMSNorm::backward_task(Task const *task,
+                                    std::vector<PhysicalRegion> const &regions,
+                                    Context ctx,
+                                    Runtime *runtime) {
+  assert(task->regions.size() == 6);
+  assert(regions.size() == 6);
+  ResidualRMSNormMeta const *m = *((ResidualRMSNormMeta **)task->local_args);
+  GenericTensorAccessorR output_grad = helperGetGenericTensorAccessorRO(
+      m->output_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW residual_output_rms_input =
+      helperGetGenericTensorAccessorRW(m->input_type[0],
+                                       regions[1],
+                                       task->regions[1],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorW residual_input0_grad =
+      helperGetGenericTensorAccessorRW(m->input_type[0],
+                                       regions[2],
+                                       task->regions[2],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorW residual_input1_grad =
+      helperGetGenericTensorAccessorRW(m->input_type[0],
+                                       regions[3],
+                                       task->regions[3],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
+      m->weight_type[0], regions[4], task->regions[4], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW weight_grad = helperGetGenericTensorAccessorRW(
+      m->weight_type[0], regions[5], task->regions[5], FID_DATA, ctx, runtime);
+  backward_kernel_wrapper(m,
+                          output_grad,
+                          residual_output_rms_input,
+                          residual_input0_grad,
+                          residual_input1_grad,
+                          weight,
+                          weight_grad);
 }
+
+Legion::FutureMap
+    ResidualRMSNorm::peft_bwd(FFModel const &ff,
+                              BatchConfigFuture const &bc,
+                              std::vector<ParallelTensor> const &batch_inputs,
+                              std::vector<ParallelTensor> const &batch_outputs,
+                              MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+  IndexLauncher launcher(RESIDUAL_RMSNORM_PEFT_BWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
+  int fid = 0;
+  // residual input grad 0
+  launcher.add_region_requirement(RegionRequirement(
+      batch_inputs[0]->part_grad,
+      0 /*projection id*/,
+      inplace_residual && !reset_input_grads[0] ? READ_WRITE : WRITE_ONLY,
+      EXCLUSIVE,
+      batch_inputs[0]->region_grad));
+  launcher.add_field(fid++, FID_DATA);
+  // residual input grad 1
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[1]->part_grad,
+                        0 /*projection id*/,
+                        reset_input_grads[1] ? WRITE_ONLY : READ_WRITE,
+                        EXCLUSIVE,
+                        batch_inputs[1]->region_grad));
+  launcher.add_field(fid++, FID_DATA);
+  if (!inplace_residual && !reset_input_grads[0]) {
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[0]->part_grad,
+                          0 /*projection id*/,
+                          READ_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[0]->region_grad));
+    launcher.add_field(fid++, FID_DATA);
+  }
+  // RMS output_grad
+  launcher.add_region_requirement(
+      RegionRequirement(batch_outputs[1]->part_grad,
+                        0 /*projection id*/,
+                        READ_ONLY,
+                        EXCLUSIVE,
+                        batch_outputs[1]->region_grad));
+  launcher.add_field(fid++, FID_DATA);
+  // gamma
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(fid++, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+/*
+  regions[0](I): RMS output_grad
+  regions[1](I/O): Residual input 0 grad
+  regions[2](I/O): Residual input 1 grad
+  regions[3](I): weight
+*/
+void ResidualRMSNorm::peft_bwd_task(Task const *task,
+                                    std::vector<PhysicalRegion> const &regions,
+                                    Context ctx,
+                                    Runtime *runtime) {
+  ResidualRMSNormMeta *m = *((ResidualRMSNormMeta **)task->local_args);
+  int expected_regions =
+      (m->inplace_residual || m->reset_input_grads[0]) ? 4 : 5;
+  assert(task->regions.size() == expected_regions);
+  assert(regions.size() == expected_regions);
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_active_peft_tokens() == 0) {
+    return;
+  }
+
+  int rid = 0, t_rid = 0;
+  GenericTensorAccessorW input_grad_0 =
+      helperGetGenericTensorAccessorRW(m->input_type[0],
+                                       regions[rid++],
+                                       task->regions[t_rid++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorW input_grad_1 =
+      helperGetGenericTensorAccessorRW(m->input_type[0],
+                                       regions[rid++],
+                                       task->regions[t_rid++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+
+  GenericTensorAccessorR output_grad_0;
+  if (!m->reset_input_grads[0]) {
+    if (m->inplace_residual) {
+      // mapped to input 0
+      output_grad_0 = helperGetGenericTensorAccessorRO(m->output_type[0],
+                                                       regions[0],
+                                                       task->regions[0],
+                                                       FID_DATA,
+                                                       ctx,
+                                                       runtime);
+    } else {
+      output_grad_0 = helperGetGenericTensorAccessorRO(m->output_type[0],
+                                                       regions[rid++],
+                                                       task->regions[t_rid++],
+                                                       FID_DATA,
+                                                       ctx,
+                                                       runtime);
+    }
+  }
+  GenericTensorAccessorR output_grad_1 =
+      helperGetGenericTensorAccessorRO(m->output_type[0],
+                                       regions[rid++],
+                                       task->regions[t_rid++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+  GenericTensorAccessorR weight =
+      helperGetGenericTensorAccessorRO(m->weight_type[0],
+                                       regions[rid++],
+                                       task->regions[t_rid++],
+                                       FID_DATA,
+                                       ctx,
+                                       runtime);
+
+  peft_bwd_kernel_wrapper(
+      m, bc, output_grad_0, output_grad_1, input_grad_0, input_grad_1, weight);
+
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    if (!m->reset_input_grads[0]) {
+      ResidualRMSNorm::save_inference_tensors_to_file(
+          m,
+          shard_id,
+          bc,
+          {input_grad_0, input_grad_1},
+          {weight},
+          {output_grad_0, output_grad_1},
+          false);
+    } else {
+      ResidualRMSNorm::save_inference_tensors_to_file(
+          m,
+          shard_id,
+          bc,
+          {input_grad_0, input_grad_1},
+          {weight},
+          {output_grad_1},
+          false);
+    }
+  }
+}
+
 Op *ResidualRMSNorm::materialize(FFModel &ff,
                                  ParallelTensor inputs[],
                                  int num_inputs) const {
@@ -516,6 +893,7 @@ size_t hash<FlexFlow::ResidualRMSNormParams>::operator()(
   hash_combine(key, params.eps);
   hash_combine(key, params.layer_guid.id);
   hash_combine(key, params.dim);
+  hash_combine(key, params.inplace_residual);
   return key;
 }
 }; // namespace std
diff --git a/src/ops/rms_norm.cc b/src/ops/rms_norm.cc
index 79dce65c57..8dadd7dcc3 100644
--- a/src/ops/rms_norm.cc
+++ b/src/ops/rms_norm.cc
@@ -53,7 +53,7 @@ RMSNormParams RMSNorm::get_params() const {
   params.layer_guid = this->layer_guid;
   params.eps = this->eps;
   params.dim = this->dim;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
@@ -422,7 +422,7 @@ void RMSNorm::inference_task(Task const *task,
       m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
   GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
       m->weight_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
-  forward_kernel_wrapper(m, input, weight, output);
+  inference_kernel_wrapper(m, bc, input, weight, output);
   if (m->inference_debugging) {
     assert(task->index_point.get_dim() == 1);
     int shard_id = task->index_point.point_data[0];
@@ -431,6 +431,166 @@ void RMSNorm::inference_task(Task const *task,
   }
 }
 
+void RMSNorm::backward(FFModel const &ff) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_backward(ff, argmap);
+  IndexLauncher launcher(RMSNORM_BWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  // regions[0](I): output_grad
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region_grad));
+  launcher.add_field(0, FID_DATA);
+  // regions[1](I): input
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  // regions[2](I/O): input_grad
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region_grad));
+  launcher.add_field(2, FID_DATA);
+  // regions[3](I): gamma
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(3, FID_DATA);
+  // regions[4](I/O): gamma_grad
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region_grad));
+  launcher.add_field(4, FID_DATA);
+
+  runtime->execute_index_space(ctx, launcher);
+}
+
+/*
+  regions[0](I): output_grad
+  regions[1](I): input
+  regions[2](I/O): input_grad
+  regions[3](I): weight
+  regions[4](I/O): weight_grad
+*/
+void RMSNorm::backward_task(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
+  assert(task->regions.size() == 5);
+  assert(regions.size() == 5);
+  RMSNormMeta const *m = *((RMSNormMeta **)task->local_args);
+  GenericTensorAccessorR output_grad = helperGetGenericTensorAccessorRO(
+      m->output_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW input_grad = helperGetGenericTensorAccessorRW(
+      m->input_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
+      m->weight_type[0], regions[3], task->regions[3], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW weight_grad = helperGetGenericTensorAccessorRW(
+      m->weight_type[0], regions[4], task->regions[4], FID_DATA, ctx, runtime);
+  backward_kernel_wrapper(
+      m, output_grad, input, input_grad, weight, weight_grad);
+}
+
+Legion::FutureMap
+    RMSNorm::peft_bwd(FFModel const &ff,
+                      BatchConfigFuture const &bc,
+                      std::vector<ParallelTensor> const &batch_inputs,
+                      std::vector<ParallelTensor> const &batch_outputs,
+                      MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+  IndexLauncher launcher(RMSNORM_PEFT_BWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
+  // regions[0](I): output_grad
+  launcher.add_region_requirement(
+      RegionRequirement(batch_outputs[0]->part_grad,
+                        0 /*projection id*/,
+                        READ_WRITE,
+                        EXCLUSIVE,
+                        batch_outputs[0]->region_grad));
+  launcher.add_field(0, FID_DATA);
+  // regions[1](I/O): input_grad
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[0]->part_grad,
+                        0 /*projection id*/,
+                        reset_input_grads[0] ? WRITE_ONLY : READ_WRITE,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region_grad));
+  launcher.add_field(1, FID_DATA);
+  // regions[2](I): weight
+  launcher.add_region_requirement(RegionRequirement(weights[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    weights[0]->region));
+  launcher.add_field(2, FID_DATA);
+
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+/*
+  regions[0](I): output_grad
+  regions[1](I/O): input_grad
+  regions[2](I): weight
+*/
+void RMSNorm::peft_bwd_task(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
+  assert(task->regions.size() == 3);
+  assert(regions.size() == 3);
+  RMSNormMeta *m = *((RMSNormMeta **)task->local_args);
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_active_peft_tokens() == 0) {
+    return;
+  }
+  GenericTensorAccessorR output_grad = helperGetGenericTensorAccessorRO(
+      m->output_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW input_grad = helperGetGenericTensorAccessorRW(
+      m->input_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR weight = helperGetGenericTensorAccessorRO(
+      m->weight_type[0], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  peft_bwd_kernel_wrapper(m, bc, output_grad, input_grad, weight);
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    RMSNorm::save_inference_tensors_to_file(
+        m, shard_id, bc, {input_grad}, {weight}, {output_grad}, false);
+  }
+}
+
 void RMSNorm::serialize(Legion::Serializer &sez) const {
   sez.serialize(this->layer_guid.id);
   sez.serialize(this->layer_guid.transformer_layer_id);
@@ -474,11 +634,9 @@ Op *RMSNorm::materialize(FFModel &ff,
                          ParallelTensor inputs[],
                          int num_inputs) const {
   RMSNormParams params = get_params();
-  return new RMSNorm(ff, params, inputs[0], true, this->name);
+  return new RMSNorm(ff, params, inputs[0], true, params.name);
 }
 
-void RMSNorm::backward(FFModel const &ff) {}
-
 bool RMSNorm::measure_operator_cost(Simulator *sim,
                                     MachineView const &mv,
                                     CostMetrics &cost_metrics) const {
diff --git a/src/ops/sampling.cc b/src/ops/sampling.cc
index b38c68843b..0358a2cd31 100644
--- a/src/ops/sampling.cc
+++ b/src/ops/sampling.cc
@@ -88,7 +88,7 @@ Op *Sampling::create_operator_from_layer(
 SamplingParams Sampling::get_params() const {
   SamplingParams params;
   params.top_p = this->top_p;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
@@ -302,7 +302,7 @@ InferenceResult
   GenericTensorAccessorW indices = helperGetGenericTensorAccessorWO(
       DT_INT32, regions[1], task->regions[1], FID_DATA, ctx, runtime);
 
-  int batch_size = bc->num_active_tokens();
+  int batch_size = bc->num_active_infr_tokens();
   Sampling::forward_kernel_wrapper(m, input, indices, batch_size);
 
   if (m->inference_debugging) {
@@ -313,7 +313,7 @@ InferenceResult
   }
 
   InferenceResult ir;
-  download_tensor<BatchConfig::TokenId>(
+  copy_tensor_dev_to_host<BatchConfig::TokenId>(
       indices.get_int32_ptr(), ir.token_ids, batch_size);
   return ir;
 }
diff --git a/src/ops/sigmoid_silu_multi.cc b/src/ops/sigmoid_silu_multi.cc
index 3d1c8d9094..e7c2fea19c 100644
--- a/src/ops/sigmoid_silu_multi.cc
+++ b/src/ops/sigmoid_silu_multi.cc
@@ -52,7 +52,7 @@ bool SigmoidSiluMultiParams::is_valid(
 SigmoidSiluMultiParams SigmoidSiluMulti::get_params() const {
   SigmoidSiluMultiParams params;
   params.layer_guid = this->layer_guid;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
@@ -254,7 +254,188 @@ void SigmoidSiluMulti::forward(FFModel const &ff) {
 }
 
 void SigmoidSiluMulti::backward(FFModel const &ff) {
-  assert(false);
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  set_argumentmap_for_backward(ff, argmap);
+  IndexLauncher launcher(SIGMOID_SILU_MULTI_BWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  // output grad
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region_grad));
+  launcher.add_field(0, FID_DATA);
+  // input 1
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  // input 2
+  launcher.add_region_requirement(RegionRequirement(inputs[1]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[1]->region));
+  launcher.add_field(2, FID_DATA);
+  // input 1 grad
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region_grad));
+  launcher.add_field(3, FID_DATA);
+  // input 2 grad
+  launcher.add_region_requirement(RegionRequirement(inputs[1]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    inputs[1]->region_grad));
+  launcher.add_field(4, FID_DATA);
+  runtime->execute_index_space(ctx, launcher);
+}
+
+/*
+  regions[0](I): output grad
+  regions[1](I): input 1
+  regions[2](I): input 2
+  regions[3](I/O): input 1 grad
+  regions[4](I/O): input 2 grad
+*/
+void SigmoidSiluMulti::backward_task(Task const *task,
+                                     std::vector<PhysicalRegion> const &regions,
+                                     Context ctx,
+                                     Runtime *runtime) {
+
+  assert(task->regions.size() == regions.size());
+  assert(regions.size() == 5);
+
+  SigmoidSiluMultiMeta *m = *((SigmoidSiluMultiMeta **)task->local_args);
+
+  GenericTensorAccessorR output_grad = helperGetGenericTensorAccessorRO(
+      m->output_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR input1 = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR input2 = helperGetGenericTensorAccessorRO(
+      m->input_type[1], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW input1_grad = helperGetGenericTensorAccessorRW(
+      m->input_type[0], regions[3], task->regions[3], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW input2_grad = helperGetGenericTensorAccessorRW(
+      m->input_type[1], regions[4], task->regions[4], FID_DATA, ctx, runtime);
+
+  SigmoidSiluMulti::backward_kernel_wrapper(
+      m, output_grad, input1, input2, input1_grad, input2_grad);
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    SigmoidSiluMulti::save_inference_tensors_to_file(
+        m,
+        shard_id,
+        nullptr,
+        {output_grad, input1, input2},
+        {},
+        {input1_grad, input2_grad});
+  }
+}
+
+FutureMap
+    SigmoidSiluMulti::peft_bwd(FFModel const &ff,
+                               BatchConfigFuture const &bc,
+                               std::vector<ParallelTensor> const &batch_inputs,
+                               std::vector<ParallelTensor> const &batch_outputs,
+                               MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+  IndexLauncher launcher(SIGMOID_SILU_MULTI_PEFT_BWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
+  // output grad
+  launcher.add_region_requirement(
+      RegionRequirement(batch_outputs[0]->part_grad,
+                        0 /*projection id*/,
+                        READ_WRITE,
+                        EXCLUSIVE,
+                        batch_outputs[0]->region_grad));
+  launcher.add_field(0, FID_DATA);
+  // input 1 grad
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[0]->part_grad,
+                        0 /*projection id*/,
+                        reset_input_grads[0] ? WRITE_ONLY : READ_WRITE,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region_grad));
+  launcher.add_field(1, FID_DATA);
+  // input 2 grad
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[1]->part_grad,
+                        0 /*projection id*/,
+                        reset_input_grads[1] ? WRITE_ONLY : READ_WRITE,
+                        EXCLUSIVE,
+                        batch_inputs[1]->region_grad));
+  launcher.add_field(2, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+/*
+  regions[0](I): output grad
+  regions[3](I/O): input 1 grad
+  regions[4](I/O): input 2 grad
+*/
+void SigmoidSiluMulti::peft_bwd_task(Task const *task,
+                                     std::vector<PhysicalRegion> const &regions,
+                                     Context ctx,
+                                     Runtime *runtime) {
+
+  assert(task->regions.size() == regions.size());
+  assert(regions.size() == 3);
+
+  SigmoidSiluMultiMeta *m = *((SigmoidSiluMultiMeta **)task->local_args);
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_active_peft_tokens() == 0) {
+    return;
+  }
+
+  GenericTensorAccessorR output_grad = helperGetGenericTensorAccessorRO(
+      m->output_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW input1_grad = helperGetGenericTensorAccessorRW(
+      m->input_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW input2_grad = helperGetGenericTensorAccessorRW(
+      m->input_type[1], regions[2], task->regions[2], FID_DATA, ctx, runtime);
+
+  SigmoidSiluMulti::peft_bwd_kernel_wrapper(
+      m, bc, output_grad, input1_grad, input2_grad);
+
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    SigmoidSiluMulti::save_inference_tensors_to_file(m,
+                                                     shard_id,
+                                                     nullptr,
+                                                     {input1_grad, input2_grad},
+                                                     {},
+                                                     {output_grad},
+                                                     false);
+  }
 }
 
 FutureMap SigmoidSiluMulti::inference(
@@ -347,7 +528,7 @@ void SigmoidSiluMulti::inference_task(
   assert(input1_domain == input2_domain);
   assert(input1_domain == output_domain);
 
-  SigmoidSiluMulti::inference_kernel_wrapper(m, input1, input2, output);
+  SigmoidSiluMulti::inference_kernel_wrapper(m, bc, input1, input2, output);
   if (m->inference_debugging) {
     assert(task->index_point.get_dim() == 1);
     int shard_id = task->index_point.point_data[0];
diff --git a/src/ops/sigmoid_silu_multi.cpp b/src/ops/sigmoid_silu_multi.cpp
index 7b7f30a288..ceaa1a7788 100644
--- a/src/ops/sigmoid_silu_multi.cpp
+++ b/src/ops/sigmoid_silu_multi.cpp
@@ -23,7 +23,7 @@ namespace FlexFlow {
 SigmoidSiluMultiMeta::SigmoidSiluMultiMeta(FFHandler handle,
                                            SigmoidSiluMulti const *ssm,
                                            MemoryAllocator &gpu_mem_allocator)
-    : OpMeta(handle) {
+    : OpMeta(handle, ssm) {
   profiling = ssm->profiling;
   inference_debugging = ssm->inference_debugging;
 }
@@ -34,36 +34,56 @@ SigmoidSiluMultiMeta::~SigmoidSiluMultiMeta(void) {
   }
 }
 
-__device__ __forceinline__ float sigmoid_float(float x) {
-  return 1.0 / (1.0 + expf(-x));
-}
-
-__device__ __forceinline__ half sigmoid_half(half x) {
-  return (half)1.0 / ((half)1.0 + hexp(-x));
-}
-
-__global__ void SigmoidSiluMultiKernelFloat(int num_elements,
-                                            float const *input1_ptr,
-                                            float const *input2_ptr,
-                                            float *output_ptr) {
+template <typename T>
+__global__ void SigmoidSiluMultiKernel(int num_elements,
+                                       T const *input1_ptr,
+                                       T const *input2_ptr,
+                                       T *output_ptr) {
   CUDA_KERNEL_LOOP(i, num_elements) {
-    output_ptr[i] =
-        input1_ptr[i] * sigmoid_float(input1_ptr[i]) * input2_ptr[i];
+    float sigmoid_val = static_cast<float>(input1_ptr[i]);
+    sigmoid_val = 1.0f / (1.0f + exp(-sigmoid_val));
+    output_ptr[i] = input1_ptr[i] * T(sigmoid_val) * input2_ptr[i];
   }
 }
 
-__global__ void SigmoidSiluMultiKernelHalf(int num_elements,
-                                           half const *input1_ptr,
-                                           half const *input2_ptr,
-                                           half *output_ptr) {
+template <typename T>
+__global__ void SigmoidSiluMultiBackwardKernel(int num_elements,
+                                               T const *output_grad_ptr,
+                                               T const *input1_ptr,
+                                               T const *input2_ptr,
+                                               T *input1_grad_ptr,
+                                               T *input2_grad_ptr,
+                                               bool reset_input_grad1,
+                                               bool reset_input_grad2) {
   CUDA_KERNEL_LOOP(i, num_elements) {
-    output_ptr[i] = input1_ptr[i] * sigmoid_half(input1_ptr[i]) * input2_ptr[i];
+    float sigmoid_val = static_cast<float>(input1_ptr[i]);
+    sigmoid_val = 1.0f / (1.0f + exp(-sigmoid_val));
+
+    if (reset_input_grad2) {
+      input2_grad_ptr[i] =
+          output_grad_ptr[i] * (input1_ptr[i] * T(sigmoid_val));
+    } else {
+      input2_grad_ptr[i] +=
+          output_grad_ptr[i] * (input1_ptr[i] * T(sigmoid_val));
+    }
+    T ss_grad_val = output_grad_ptr[i] * input2_ptr[i];
+    if (reset_input_grad1) {
+      input1_grad_ptr[i] = ss_grad_val * T(sigmoid_val);
+    } else {
+      input1_grad_ptr[i] += ss_grad_val * T(sigmoid_val);
+    }
+    T sig_grad = ss_grad_val * input1_ptr[i];
+
+    float x1_grad_val = static_cast<float>(sig_grad);
+    x1_grad_val = x1_grad_val * sigmoid_val * (1.0f - sigmoid_val);
+    input1_grad_ptr[i] += T(x1_grad_val);
   }
 }
 
 /*static*/
 void SigmoidSiluMulti::inference_kernel_wrapper(
-    SigmoidSiluMultiMeta const *m,
+    SigmoidSiluMultiMeta *m,
+    BatchConfig const *bc,
     GenericTensorAccessorR const &input1,
     GenericTensorAccessorR const &input2,
     GenericTensorAccessorW const &output) {
@@ -81,8 +101,84 @@ void SigmoidSiluMulti::inference_kernel_wrapper(
     checkCUDA(hipEventRecord(t_start, stream));
   }
 
+  // save input activation if needed for PEFT
+  if (bc->num_active_peft_tokens() > 0) {
+    // Check that we have at most one request that requires peft_bwd
+    int num_peft_requests = 0;
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_bwd) {
+        num_peft_requests++;
+      }
+    }
+    assert(num_peft_requests <= 1);
+
+    int tokens_previous_requests = 0;
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      // Skip non-PEFT requests
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        // FIXME: use the new approach to computing token offset
+        tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
+        continue;
+      }
+      int num_peft_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+      int max_peft_tokens = bc->requestsInfo[i].max_sequence_length;
+      int in_dim = input1.domain.hi()[0] - input1.domain.lo()[0] + 1;
+      if (bc->requestsInfo[i].peft_bwd) {
+        size_t input_tensor_size =
+            data_type_size(m->input_type[0]) * num_peft_tokens * in_dim;
+        size_t activation_size_needed =
+            2 * data_type_size(m->input_type[0]) * max_peft_tokens * in_dim;
+        if (activation_size_needed > m->allocated_peft_buffer_size) {
+          MemoryAllocator *allocator = m->handle.peft_activation_allocator;
+          m->input_activation =
+              allocator->allocate_instance_untyped(activation_size_needed);
+          m->allocated_peft_buffer_size = activation_size_needed;
+        }
+        // copy input activation
+        if (m->input_type[0] == DT_FLOAT) {
+          checkCUDA(hipMemcpyAsync(m->input_activation,
+                                   input1.get_float_ptr() +
+                                       tokens_previous_requests * in_dim,
+                                   input_tensor_size,
+                                   hipMemcpyDeviceToDevice,
+                                   stream));
+          checkCUDA(hipMemcpyAsync(
+              (void *)((char *)m->input_activation + input_tensor_size),
+              input2.get_float_ptr() + tokens_previous_requests * in_dim,
+              input_tensor_size,
+              hipMemcpyDeviceToDevice,
+              stream));
+        } else if (m->input_type[0] == DT_HALF) {
+          checkCUDA(hipMemcpyAsync(m->input_activation,
+                                   input1.get_half_ptr() +
+                                       tokens_previous_requests * in_dim,
+                                   input_tensor_size,
+                                   hipMemcpyDeviceToDevice,
+                                   stream));
+          checkCUDA(hipMemcpyAsync(
+              (void *)((char *)m->input_activation + input_tensor_size),
+              input2.get_half_ptr() + tokens_previous_requests * in_dim,
+              input_tensor_size,
+              hipMemcpyDeviceToDevice,
+              stream));
+        } else {
+          assert(false && "unsupport datatype in layernorm");
+        }
+      }
+    }
+  }
+
   if (m->input_type[0] == DT_FLOAT) {
-    hipLaunchKernelGGL(HIP_KERNEL_NAME(SigmoidSiluMultiKernelFloat),
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(SigmoidSiluMultiKernel),
                        GET_BLOCKS(num_elements),
                        min(CUDA_NUM_THREADS, num_elements),
                        0,
@@ -92,7 +188,7 @@ void SigmoidSiluMulti::inference_kernel_wrapper(
                        input2.get_float_ptr(),
                        output.get_float_ptr());
   } else if (m->input_type[0] == DT_HALF) {
-    hipLaunchKernelGGL(HIP_KERNEL_NAME(SigmoidSiluMultiKernelHalf),
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(SigmoidSiluMultiKernel),
                        GET_BLOCKS(num_elements),
                        min(CUDA_NUM_THREADS, num_elements),
                        0,
@@ -116,4 +212,159 @@ void SigmoidSiluMulti::inference_kernel_wrapper(
   }
 }
 
+/*static*/
+void SigmoidSiluMulti::backward_kernel_wrapper(
+    SigmoidSiluMultiMeta const *m,
+    GenericTensorAccessorR const &output_grad,
+    GenericTensorAccessorR const &input1,
+    GenericTensorAccessorR const &input2,
+    GenericTensorAccessorW const &input1_grad,
+    GenericTensorAccessorW const &input2_grad) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  int num_elements = output_grad.domain.get_volume();
+  assert(input1.domain.get_volume() == num_elements);
+  assert(input2.domain.get_volume() == num_elements);
+  assert(input1_grad.domain.get_volume() == num_elements);
+  assert(input2_grad.domain.get_volume() == num_elements);
+
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+
+  if (m->input_type[0] == DT_FLOAT) {
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(SigmoidSiluMultiBackwardKernel),
+                       GET_BLOCKS(num_elements),
+                       min(CUDA_NUM_THREADS, num_elements),
+                       0,
+                       stream,
+                       output_grad.domain.get_volume(),
+                       output_grad.get_float_ptr(),
+                       input1.get_float_ptr(),
+                       input2.get_float_ptr(),
+                       input1_grad.get_float_ptr(),
+                       input2_grad.get_float_ptr(),
+                       m->reset_input_grads[0],
+                       m->reset_input_grads[1]);
+  } else if (m->input_type[0] == DT_HALF) {
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(SigmoidSiluMultiBackwardKernel),
+                       GET_BLOCKS(num_elements),
+                       min(CUDA_NUM_THREADS, num_elements),
+                       0,
+                       stream,
+                       output_grad.domain.get_volume(),
+                       output_grad.get_half_ptr(),
+                       input1.get_half_ptr(),
+                       input2.get_half_ptr(),
+                       input1_grad.get_half_ptr(),
+                       input2_grad.get_half_ptr(),
+                       m->reset_input_grads[0],
+                       m->reset_input_grads[1]);
+  } else {
+    assert(false && "unsupport datatype in SigmoidSiluMulti");
+  }
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("[SigmoidSiluMulti] backward time (CF) = %.9fms\n", elapsed);
+  }
+}
+
+/*static*/
+void SigmoidSiluMulti::peft_bwd_kernel_wrapper(
+    SigmoidSiluMultiMeta const *m,
+    BatchConfig const *bc,
+    GenericTensorAccessorR const &output_grad,
+    GenericTensorAccessorW const &input1_grad,
+    GenericTensorAccessorW const &input2_grad) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  assert(input1_grad.domain.get_volume() == output_grad.domain.get_volume());
+  assert(input2_grad.domain.get_volume() == input1_grad.domain.get_volume());
+
+  hipEvent_t t_start, t_end;
+  if (m->profiling) {
+    checkCUDA(hipEventCreate(&t_start));
+    checkCUDA(hipEventCreate(&t_end));
+    checkCUDA(hipEventRecord(t_start, stream));
+  }
+
+  int num_peft_requests = 0;
+  int num_peft_tokens = 0;
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+      continue;
+    }
+    if (bc->requestsInfo[i].peft_bwd) {
+      num_peft_requests++;
+      num_peft_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+    }
+  }
+  if (num_peft_requests == 0) {
+    // No PEFT requests
+    return;
+  } else {
+    // Otherwise assume at most 1 peft request
+    assert(num_peft_requests == 1);
+    assert(num_peft_tokens >= 1);
+  }
+  int in_dim = output_grad.domain.hi()[0] - output_grad.domain.lo()[0] + 1;
+  int num_elements = in_dim * num_peft_tokens;
+
+  if (m->input_type[0] == DT_FLOAT) {
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(SigmoidSiluMultiBackwardKernel),
+                       GET_BLOCKS(num_elements),
+                       min(CUDA_NUM_THREADS, num_elements),
+                       0,
+                       stream,
+                       num_elements,
+                       output_grad.get_float_ptr(),
+                       static_cast<float const *>(m->input_activation),
+                       static_cast<float const *>(m->input_activation) +
+                           num_peft_tokens * in_dim,
+                       input1_grad.get_float_ptr(),
+                       input2_grad.get_float_ptr(),
+                       m->reset_input_grads[0],
+                       m->reset_input_grads[1]);
+  } else if (m->input_type[0] == DT_HALF) {
+    hipLaunchKernelGGL(HIP_KERNEL_NAME(SigmoidSiluMultiBackwardKernel),
+                       GET_BLOCKS(num_elements),
+                       min(CUDA_NUM_THREADS, num_elements),
+                       0,
+                       stream,
+                       num_elements,
+                       output_grad.get_half_ptr(),
+                       static_cast<half const *>(m->input_activation),
+                       static_cast<half const *>(m->input_activation) +
+                           num_peft_tokens * in_dim,
+                       input1_grad.get_half_ptr(),
+                       input2_grad.get_half_ptr(),
+                       m->reset_input_grads[0],
+                       m->reset_input_grads[1]);
+  } else {
+    assert(false && "unsupport datatype in SigmoidSiluMulti");
+  }
+  if (m->profiling) {
+    checkCUDA(hipEventRecord(t_end, stream));
+    checkCUDA(hipEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(hipEventElapsedTime(&elapsed, t_start, t_end));
+    checkCUDA(hipEventDestroy(t_start));
+    checkCUDA(hipEventDestroy(t_end));
+    printf("[SigmoidSiluMulti] peft_bwd time (CF) = %.9fms\n", elapsed);
+  }
+}
+
 }; // namespace FlexFlow
diff --git a/src/ops/sigmoid_silu_multi.cu b/src/ops/sigmoid_silu_multi.cu
index 590b641b5a..929d557a17 100644
--- a/src/ops/sigmoid_silu_multi.cu
+++ b/src/ops/sigmoid_silu_multi.cu
@@ -22,7 +22,7 @@ namespace FlexFlow {
 SigmoidSiluMultiMeta::SigmoidSiluMultiMeta(FFHandler handle,
                                            SigmoidSiluMulti const *ssm,
                                            MemoryAllocator &gpu_mem_allocator)
-    : OpMeta(handle) {
+    : OpMeta(handle, ssm) {
   profiling = ssm->profiling;
   inference_debugging = ssm->inference_debugging;
 }
@@ -45,9 +45,44 @@ __global__ void SigmoidSiluMultiKernel(int num_elements,
   }
 }
 
+template <typename T>
+__global__ void SigmoidSiluMultiBackwardKernel(int num_elements,
+                                               T const *output_grad_ptr,
+                                               T const *input1_ptr,
+                                               T const *input2_ptr,
+                                               T *input1_grad_ptr,
+                                               T *input2_grad_ptr,
+                                               bool reset_input_grad1,
+                                               bool reset_input_grad2) {
+  CUDA_KERNEL_LOOP(i, num_elements) {
+    float sigmoid_val = static_cast<float>(input1_ptr[i]);
+    sigmoid_val = 1.0f / (1.0f + exp(-sigmoid_val));
+
+    if (reset_input_grad2) {
+      input2_grad_ptr[i] =
+          output_grad_ptr[i] * (input1_ptr[i] * T(sigmoid_val));
+    } else {
+      input2_grad_ptr[i] +=
+          output_grad_ptr[i] * (input1_ptr[i] * T(sigmoid_val));
+    }
+    T ss_grad_val = output_grad_ptr[i] * input2_ptr[i];
+    if (reset_input_grad1) {
+      input1_grad_ptr[i] = ss_grad_val * T(sigmoid_val);
+    } else {
+      input1_grad_ptr[i] += ss_grad_val * T(sigmoid_val);
+    }
+    T sig_grad = ss_grad_val * input1_ptr[i];
+
+    float x1_grad_val = static_cast<float>(sig_grad);
+    x1_grad_val = x1_grad_val * sigmoid_val * (1.0f - sigmoid_val);
+    input1_grad_ptr[i] += T(x1_grad_val);
+  }
+}
+
 /*static*/
 void SigmoidSiluMulti::inference_kernel_wrapper(
-    SigmoidSiluMultiMeta const *m,
+    SigmoidSiluMultiMeta *m,
+    BatchConfig const *bc,
     GenericTensorAccessorR const &input1,
     GenericTensorAccessorR const &input2,
     GenericTensorAccessorW const &output) {
@@ -64,6 +99,83 @@ void SigmoidSiluMulti::inference_kernel_wrapper(
     cudaEventCreate(&t_end);
     cudaEventRecord(t_start, stream);
   }
+
+  // save input activation if needed for PEFT
+  if (bc->num_active_peft_tokens() > 0) {
+    // Check that we have at most one request that requires peft_bwd
+    int num_peft_requests = 0;
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        continue;
+      }
+      if (bc->requestsInfo[i].peft_bwd) {
+        num_peft_requests++;
+      }
+    }
+    assert(num_peft_requests <= 1);
+
+    int tokens_previous_requests = 0;
+    for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+      if (bc->request_completed[i]) {
+        continue;
+      }
+      // Skip non-PEFT requests
+      if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+        // FIXME: use the new approach to computing token offset
+        tokens_previous_requests += bc->requestsInfo[i].num_tokens_in_batch;
+        continue;
+      }
+      int num_peft_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+      int max_peft_tokens = bc->requestsInfo[i].max_sequence_length;
+      int in_dim = input1.domain.hi()[0] - input1.domain.lo()[0] + 1;
+      if (bc->requestsInfo[i].peft_bwd) {
+        size_t input_tensor_size =
+            data_type_size(m->input_type[0]) * num_peft_tokens * in_dim;
+        size_t activation_size_needed =
+            2 * data_type_size(m->input_type[0]) * max_peft_tokens * in_dim;
+        if (activation_size_needed > m->allocated_peft_buffer_size) {
+          MemoryAllocator *allocator = m->handle.peft_activation_allocator;
+          m->input_activation =
+              allocator->allocate_instance_untyped(activation_size_needed);
+          m->allocated_peft_buffer_size = activation_size_needed;
+        }
+        // copy input activation
+        if (m->input_type[0] == DT_FLOAT) {
+          checkCUDA(cudaMemcpyAsync(m->input_activation,
+                                    input1.get_float_ptr() +
+                                        tokens_previous_requests * in_dim,
+                                    input_tensor_size,
+                                    cudaMemcpyDeviceToDevice,
+                                    stream));
+          checkCUDA(cudaMemcpyAsync(
+              (void *)((char *)m->input_activation + input_tensor_size),
+              input2.get_float_ptr() + tokens_previous_requests * in_dim,
+              input_tensor_size,
+              cudaMemcpyDeviceToDevice,
+              stream));
+        } else if (m->input_type[0] == DT_HALF) {
+          checkCUDA(cudaMemcpyAsync(m->input_activation,
+                                    input1.get_half_ptr() +
+                                        tokens_previous_requests * in_dim,
+                                    input_tensor_size,
+                                    cudaMemcpyDeviceToDevice,
+                                    stream));
+          checkCUDA(cudaMemcpyAsync(
+              (void *)((char *)m->input_activation + input_tensor_size),
+              input2.get_half_ptr() + tokens_previous_requests * in_dim,
+              input_tensor_size,
+              cudaMemcpyDeviceToDevice,
+              stream));
+        } else {
+          assert(false && "unsupport datatype in layernorm");
+        }
+      }
+    }
+  }
+
   if (m->input_type[0] == DT_FLOAT) {
     SigmoidSiluMultiKernel<<<GET_BLOCKS(num_elements),
                              min(CUDA_NUM_THREADS, num_elements),
@@ -95,4 +207,152 @@ void SigmoidSiluMulti::inference_kernel_wrapper(
   }
 }
 
+/*static*/
+void SigmoidSiluMulti::backward_kernel_wrapper(
+    SigmoidSiluMultiMeta const *m,
+    GenericTensorAccessorR const &output_grad,
+    GenericTensorAccessorR const &input1,
+    GenericTensorAccessorR const &input2,
+    GenericTensorAccessorW const &input1_grad,
+    GenericTensorAccessorW const &input2_grad) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  int num_elements = output_grad.domain.get_volume();
+  assert(input1.domain.get_volume() == num_elements);
+  assert(input2.domain.get_volume() == num_elements);
+  assert(input1_grad.domain.get_volume() == num_elements);
+  assert(input2_grad.domain.get_volume() == num_elements);
+
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+  if (m->input_type[0] == DT_FLOAT) {
+    SigmoidSiluMultiBackwardKernel<<<GET_BLOCKS(num_elements),
+                                     min(CUDA_NUM_THREADS, num_elements),
+                                     0,
+                                     stream>>>(output_grad.domain.get_volume(),
+                                               output_grad.get_float_ptr(),
+                                               input1.get_float_ptr(),
+                                               input2.get_float_ptr(),
+                                               input1_grad.get_float_ptr(),
+                                               input2_grad.get_float_ptr(),
+                                               m->reset_input_grads[0],
+                                               m->reset_input_grads[1]);
+  } else if (m->input_type[0] == DT_HALF) {
+    SigmoidSiluMultiBackwardKernel<<<GET_BLOCKS(num_elements),
+                                     min(CUDA_NUM_THREADS, num_elements),
+                                     0,
+                                     stream>>>(output_grad.domain.get_volume(),
+                                               output_grad.get_half_ptr(),
+                                               input1.get_half_ptr(),
+                                               input2.get_half_ptr(),
+                                               input1_grad.get_half_ptr(),
+                                               input2_grad.get_half_ptr(),
+                                               m->reset_input_grads[0],
+                                               m->reset_input_grads[1]);
+  } else {
+    assert(false && "unsupport datatype in SigmoidSiluMulti");
+  }
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[SigmoidSiluMulti] backward time (CF) = %.9fms\n", elapsed);
+  }
+}
+
+/*static*/
+void SigmoidSiluMulti::peft_bwd_kernel_wrapper(
+    SigmoidSiluMultiMeta const *m,
+    BatchConfig const *bc,
+    GenericTensorAccessorR const &output_grad,
+    GenericTensorAccessorW const &input1_grad,
+    GenericTensorAccessorW const &input2_grad) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+
+  assert(input1_grad.domain.get_volume() == output_grad.domain.get_volume());
+  assert(input2_grad.domain.get_volume() == input1_grad.domain.get_volume());
+
+  cudaEvent_t t_start, t_end;
+  if (m->profiling) {
+    cudaEventCreate(&t_start);
+    cudaEventCreate(&t_end);
+    cudaEventRecord(t_start, stream);
+  }
+
+  int num_peft_requests = 0;
+  int num_peft_tokens = 0;
+  for (int i = 0; i < bc->max_requests_per_batch(); i++) {
+    if (bc->request_completed[i]) {
+      continue;
+    }
+    if (bc->requestsInfo[i].peft_model_id == PEFTModelID::NO_ID) {
+      continue;
+    }
+    if (bc->requestsInfo[i].peft_bwd) {
+      num_peft_requests++;
+      num_peft_tokens = bc->requestsInfo[i].num_tokens_in_batch;
+    }
+  }
+  if (num_peft_requests == 0) {
+    // No PEFT requests
+    return;
+  } else {
+    // Otherwise assume at most 1 peft request
+    assert(num_peft_requests == 1);
+    assert(num_peft_tokens >= 1);
+  }
+  int in_dim = output_grad.domain.hi()[0] - output_grad.domain.lo()[0] + 1;
+  int num_elements = in_dim * num_peft_tokens;
+
+  if (m->input_type[0] == DT_FLOAT) {
+    SigmoidSiluMultiBackwardKernel<<<GET_BLOCKS(num_elements),
+                                     min(CUDA_NUM_THREADS, num_elements),
+                                     0,
+                                     stream>>>(
+        num_elements,
+        output_grad.get_float_ptr(),
+        static_cast<float const *>(m->input_activation),
+        static_cast<float const *>(m->input_activation) +
+            num_peft_tokens * in_dim,
+        input1_grad.get_float_ptr(),
+        input2_grad.get_float_ptr(),
+        m->reset_input_grads[0],
+        m->reset_input_grads[1]);
+  } else if (m->input_type[0] == DT_HALF) {
+    SigmoidSiluMultiBackwardKernel<<<GET_BLOCKS(num_elements),
+                                     min(CUDA_NUM_THREADS, num_elements),
+                                     0,
+                                     stream>>>(
+        num_elements,
+        output_grad.get_half_ptr(),
+        static_cast<half const *>(m->input_activation),
+        static_cast<half const *>(m->input_activation) +
+            num_peft_tokens * in_dim,
+        input1_grad.get_half_ptr(),
+        input2_grad.get_half_ptr(),
+        m->reset_input_grads[0],
+        m->reset_input_grads[1]);
+  } else {
+    assert(false && "unsupport datatype in SigmoidSiluMulti");
+  }
+  if (m->profiling) {
+    cudaEventRecord(t_end, stream);
+    checkCUDA(cudaEventSynchronize(t_end));
+    float elapsed = 0;
+    checkCUDA(cudaEventElapsedTime(&elapsed, t_start, t_end));
+    cudaEventDestroy(t_start);
+    cudaEventDestroy(t_end);
+    printf("[SigmoidSiluMulti] peft_bwd time (CF) = %.9fms\n", elapsed);
+  }
+}
+
 }; // namespace FlexFlow
diff --git a/src/ops/softmax.cc b/src/ops/softmax.cc
index 03618423be..a02d88b98b 100644
--- a/src/ops/softmax.cc
+++ b/src/ops/softmax.cc
@@ -86,7 +86,7 @@ SoftmaxParams Softmax::get_params() const {
   SoftmaxParams params;
   params.layer_guid = this->layer_guid;
   params.dim = this->dim;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
@@ -270,52 +270,12 @@ OpMeta *Softmax::init_task(Task const *task,
     domain = input_domain;
   }
   SoftmaxMeta *m = new SoftmaxMeta(handle, softmax, domain);
-  m->input_type = softmax->inputs[0]->data_type;
-  m->output_type = softmax->outputs[0]->data_type;
   // checkCUDNN(cudnnCreateTensorDescriptor(&m->outputTensor));
   std::strcpy(m->op_name, softmax->name);
   m->layer_guid = softmax->layer_guid;
   return m;
 }
 
-FutureMap Softmax::inference(FFModel const &ff,
-                             BatchConfigFuture const &bc,
-                             std::vector<ParallelTensor> const &batch_inputs,
-                             std::vector<ParallelTensor> const &batch_outputs,
-                             MachineView const *mv) {
-  ArgumentMap argmap;
-  Context ctx = ff.config.lg_ctx;
-  Runtime *runtime = ff.config.lg_hlr;
-  parallel_is = batch_outputs[0]->parallel_is;
-  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
-  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
-  size_t machine_view_hash = view->hash();
-  /* std::cout << "Softmax op machine_view: " << *(MachineView const *)mv
-            << std::endl; */
-  IndexLauncher launcher(SOFTMAX_INF_TASK_ID,
-                         parallel_is,
-                         TaskArgument(nullptr, 0),
-                         argmap,
-                         Predicate::TRUE_PRED,
-                         false /*must*/,
-                         0 /*mapper_id*/,
-                         machine_view_hash);
-  launcher.add_future(bc);
-  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_inputs[0]->region));
-  launcher.add_field(0, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    batch_outputs[0]->region));
-  launcher.add_field(1, FID_DATA);
-  return runtime->execute_index_space(ctx, launcher);
-}
-
 void Softmax::forward(FFModel const &ff) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
@@ -354,17 +314,11 @@ void Softmax::forward_task(Task const *task,
       ctx, task->regions[0].region.get_index_space());
   SoftmaxMeta const *m = *((SoftmaxMeta **)task->local_args);
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
-      m->output_type, regions[0], task->regions[0], FID_DATA, ctx, runtime);
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
   GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
-      m->output_type, regions[1], task->regions[1], FID_DATA, ctx, runtime);
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
 
-  if (m->output_type == DT_HALF) {
-    forward_kernel_wrapper(m, input.get_half_ptr(), output.get_half_ptr());
-  } else if (m->output_type == DT_FLOAT) {
-    forward_kernel_wrapper(m, input.get_float_ptr(), output.get_float_ptr());
-  } else {
-    assert(false && "Unsupported data type");
-  }
+  forward_kernel_wrapper(m, input, output);
 }
 
 void Softmax::backward(FFModel const &ff) {
@@ -402,52 +356,69 @@ void Softmax::backward_task(Task const *task,
   Domain in_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
   SoftmaxMeta const *m = *((SoftmaxMeta **)task->local_args);
-  switch (in_domain.get_dim()) {
-#define DIMFUNC(DIM)                                                           \
-  case DIM:                                                                    \
-    if (m->output_type == DT_HALF) {                                           \
-      return backward_task_with_dim<half, DIM>(task, regions, ctx, runtime);   \
-    } else if (m->output_type == DT_FLOAT) {                                   \
-      return backward_task_with_dim<float, DIM>(task, regions, ctx, runtime);  \
-    } else {                                                                   \
-      assert(false && "Unsupported data type");                                \
-    }
-    LEGION_FOREACH_N(DIMFUNC)
-#undef DIMFUNC
-    default:
-      assert(false);
-  }
+  GenericTensorAccessorW input_grad = helperGetGenericTensorAccessorRW(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR output_grad = helperGetGenericTensorAccessorRO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  backward_kernel_wrapper(m, input_grad, output_grad);
 }
 
-/*
-  regions[0](I/O): input_grad
-  regions[1](I): output_grad
-*/
-// Note that the backward task of softmax is actually a no op (i.e., input_grad
-// = output_grad) since the upstream cross_entropy_loss function computes
-// performs softmax_cross_entropy_loss to avoid intermediate zeros
-template <typename DT, int NDIM>
-void Softmax::backward_task_with_dim(Task const *task,
-                                     std::vector<PhysicalRegion> const &regions,
-                                     Context ctx,
-                                     Runtime *runtime) {
-  assert(regions.size() == 2);
-  assert(task->regions.size() == 2);
-  // const Softmax* softmax = (Softmax*) task->args;
-  SoftmaxMeta const *m = *((SoftmaxMeta **)task->local_args);
-  TensorAccessorW<DT, NDIM> acc_input_grad(regions[0],
-                                           task->regions[0],
-                                           FID_DATA,
-                                           ctx,
-                                           runtime,
-                                           true /*readOutput*/);
-  TensorAccessorR<DT, NDIM> acc_output_grad(
-      regions[1], task->regions[1], FID_DATA, ctx, runtime);
-  // make sure the image indices match!
-  assert(acc_input_grad.rect == acc_output_grad.rect);
-
-  backward_kernel_wrapper(
-      m, acc_input_grad.ptr, acc_output_grad.ptr, acc_input_grad.rect.volume());
+FutureMap Softmax::inference(FFModel const &ff,
+                             BatchConfigFuture const &bc,
+                             std::vector<ParallelTensor> const &batch_inputs,
+                             std::vector<ParallelTensor> const &batch_outputs,
+                             MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+  /* std::cout << "Softmax op machine_view: " << *(MachineView const *)mv
+            << std::endl; */
+  IndexLauncher launcher(SOFTMAX_INF_TASK_ID,
+                         parallel_is,
+                         TaskArgument(nullptr, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  // if this is the last operator, we add the region below in order to copy the
+  // output to the grad tensor
+  assert(ff.config.computationMode == COMP_MODE_INFERENCE);
+  int last_op = ff.operators.size() - 1;
+  assert(ff.operators[last_op]->op_type == OP_ARGMAX ||
+         ff.operators[last_op]->op_type == OP_ARG_TOPK ||
+         ff.operators[last_op]->op_type == OP_SAMPLING);
+  last_op -= 1;
+  while (ff.operators[last_op]->op_type == OP_WEIGHT && last_op > 0) {
+    last_op -= 1;
+  }
+  if (ff.operators[last_op] == this) {
+    launcher.add_region_requirement(
+        RegionRequirement(batch_outputs[0]->part_grad,
+                          0 /*projection id*/,
+                          WRITE_ONLY,
+                          EXCLUSIVE,
+                          batch_outputs[0]->region_grad));
+    launcher.add_field(2, FID_DATA);
+  }
+  return runtime->execute_index_space(ctx, launcher);
 }
 
 void Softmax::inference_task(Task const *task,
@@ -455,8 +426,8 @@ void Softmax::inference_task(Task const *task,
                              Context ctx,
                              Runtime *runtime) {
   assert(task->regions.size() == regions.size());
-  assert(regions.size() == 2);
-  assert(task->regions.size() == 2);
+  assert(regions.size() == 3 || regions.size() == 2);
+  bool is_last_op = (regions.size() == 3);
   BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
   if (bc->num_tokens == 0) {
     return;
@@ -465,16 +436,19 @@ void Softmax::inference_task(Task const *task,
       ctx, task->regions[0].region.get_index_space());
   SoftmaxMeta *m = *((SoftmaxMeta **)task->local_args);
   GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
-      m->output_type, regions[0], task->regions[0], FID_DATA, ctx, runtime);
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
   GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
-      m->output_type, regions[1], task->regions[1], FID_DATA, ctx, runtime);
-  if (m->output_type == DT_HALF) {
-    forward_kernel_wrapper(m, input.get_half_ptr(), output.get_half_ptr());
-  } else if (m->output_type == DT_FLOAT) {
-    forward_kernel_wrapper(m, input.get_float_ptr(), output.get_float_ptr());
-  } else {
-    assert(false && "Unsupported data type");
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output_grad;
+  if (is_last_op) {
+    output_grad = helperGetGenericTensorAccessorWO(m->output_type[0],
+                                                   regions[2],
+                                                   task->regions[2],
+                                                   FID_DATA,
+                                                   ctx,
+                                                   runtime);
   }
+  inference_kernel_wrapper(m, bc, is_last_op, input, output, output_grad);
   if (m->inference_debugging) {
     assert(task->index_point.get_dim() == 1);
     int shard_id = task->index_point.point_data[0];
@@ -483,6 +457,73 @@ void Softmax::inference_task(Task const *task,
   }
 }
 
+FutureMap Softmax::peft_bwd(FFModel const &ff,
+                            BatchConfigFuture const &bc,
+                            std::vector<ParallelTensor> const &batch_inputs,
+                            std::vector<ParallelTensor> const &batch_outputs,
+                            MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_outputs[0]->machine_view;
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+  /* std::cout << "Softmax op machine_view: " << *(MachineView const *)mv
+            << std::endl; */
+  IndexLauncher launcher(SOFTMAX_PEFT_BWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(nullptr, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[0]->part_grad,
+                        0 /*projection id*/,
+                        reset_input_grads[0] ? WRITE_ONLY : READ_WRITE,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region_grad));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(
+      RegionRequirement(batch_outputs[0]->part_grad,
+                        0 /*projection id*/,
+                        READ_ONLY,
+                        EXCLUSIVE,
+                        batch_outputs[0]->region_grad));
+  launcher.add_field(1, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+void Softmax::peft_bwd_task(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
+  assert(task->regions.size() == regions.size());
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_active_peft_tokens() == 0) {
+    return;
+  }
+  Domain in_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  SoftmaxMeta *m = *((SoftmaxMeta **)task->local_args);
+  GenericTensorAccessorW input_grad = helperGetGenericTensorAccessorRW(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR output_grad = helperGetGenericTensorAccessorRO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  peft_bwd_kernel_wrapper(m, bc, input_grad, output_grad);
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    Softmax::save_inference_tensors_to_file(
+        m, shard_id, bc, {input_grad}, {}, {output_grad}, false);
+  }
+}
+
 bool Softmax::get_int_parameter(PMParameter para, int *value) const {
   switch (para) {
     case PM_SOFTMAX_DIM:
@@ -508,29 +549,35 @@ bool Softmax::measure_operator_cost(Simulator *sim,
 
   sim->free_all();
   float *input_ptr = (float *)sim->allocate(sub_input.get_volume(), DT_FLOAT);
+  GenericTensorAccessorR input_acc(DT_FLOAT, sub_input.get_domain(), input_ptr);
   assert(input_ptr != NULL);
   cost_metrics.inputs_memory += cost_metrics.total_mem_diff_from(sim->offset);
 
   float *output_ptr = (float *)sim->allocate(sub_output.get_volume(), DT_FLOAT);
+  GenericTensorAccessorW output_acc(
+      DT_FLOAT, sub_output.get_domain(), output_ptr);
   assert(output_ptr != NULL);
   cost_metrics.outputs_memory += cost_metrics.total_mem_diff_from(sim->offset);
 
   std::function<void()> forward, backward;
-  forward = [&] { forward_kernel_wrapper(m, input_ptr, output_ptr); };
+  forward = [&] { forward_kernel_wrapper(m, input_acc, output_acc); };
   if (sim->computationMode == COMP_MODE_TRAINING) {
     float *input_grad_ptr =
         (float *)sim->allocate(sub_input.get_volume(), DT_FLOAT);
+    GenericTensorAccessorW input_grad_acc(
+        DT_FLOAT, sub_input.get_domain(), input_grad_ptr);
     assert(input_grad_ptr != NULL);
     cost_metrics.inputs_memory += cost_metrics.total_mem_diff_from(sim->offset);
 
     float *output_grad_ptr =
         (float *)sim->allocate(sub_output.get_volume(), DT_FLOAT);
+    GenericTensorAccessorW output_grad_acc(
+        DT_FLOAT, sub_output.get_domain(), output_grad_ptr);
     assert(output_grad_ptr != NULL);
     cost_metrics.outputs_memory +=
         cost_metrics.total_mem_diff_from(sim->offset);
     backward = [&] {
-      backward_kernel_wrapper(
-          m, input_grad_ptr, output_grad_ptr, sub_output.get_volume());
+      backward_kernel_wrapper(m, input_grad_acc, output_grad_acc);
     };
   }
 
diff --git a/src/ops/spec_inc_multihead_self_attention.cc b/src/ops/spec_inc_multihead_self_attention.cc
index 68d3a4c205..52da51fb26 100644
--- a/src/ops/spec_inc_multihead_self_attention.cc
+++ b/src/ops/spec_inc_multihead_self_attention.cc
@@ -850,7 +850,7 @@ SpecIncMultiHeadSelfAttentionParams
   params.scaling_factor = this->scaling_factor;
   params.qk_prod_scaling = this->qk_prod_scaling;
   params.position_bias = this->position_bias;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
 
diff --git a/src/ops/spec_inc_multihead_self_attention.cpp b/src/ops/spec_inc_multihead_self_attention.cpp
index b1687d12a2..aebd5e8892 100644
--- a/src/ops/spec_inc_multihead_self_attention.cpp
+++ b/src/ops/spec_inc_multihead_self_attention.cpp
@@ -141,7 +141,7 @@ template <typename DT>
 void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                             BeamSearchBatchConfig const *bc,
                             hipStream_t stream) {
-  int num_tokens = bc->num_active_tokens();
+  int num_tokens = bc->num_active_infr_tokens();
   int curr_depth = bc->beamRequestsInfo[0].current_depth;
   // printf("curr depth: %d\n", curr_depth);
   // assert(curr_depth < 3);
@@ -200,15 +200,16 @@ void compute_attention_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
   hipblasDatatype_t hipblas_data_type = ff_to_cuda_datatype(m->output_type[0]);
   miopenDataType_t miopen_data_type = ff_to_cudnn_datatype(m->output_type[0]);
   assert(data_type_size(m->output_type[0]) == sizeof(DT));
-#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
   hipblasDatatype_t compute_type = hipblas_data_type;
-#else
-  // TODO: currently use the hipblas_data_type
-  // cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
-  hipblasDatatype_t compute_type = hipblas_data_type;
-#endif
+  // #if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  //   hipblasDatatype_t compute_type = hipblas_data_type;
+  // #else
+  //   // TODO: currently use the hipblas_data_type
+  //   // cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+  //   hipblasDatatype_t compute_type = hipblas_data_type;
+  // #endif
   // int num_requests = bc->num_active_requests();
-  int num_tokens = bc->num_active_tokens();
+  int num_tokens = bc->num_active_infr_tokens();
   int tokens_previous_requests = 0;
   int tokens_prev_requests_squares = 0;
   // int qkv_block_size =
diff --git a/src/ops/spec_inc_multihead_self_attention.cu b/src/ops/spec_inc_multihead_self_attention.cu
index a00ea9c95f..4688a8233c 100644
--- a/src/ops/spec_inc_multihead_self_attention.cu
+++ b/src/ops/spec_inc_multihead_self_attention.cu
@@ -361,7 +361,7 @@ template <typename DT>
 void update_kv_cache_kernel(SpecIncMultiHeadSelfAttentionMeta const *m,
                             BeamSearchBatchConfig const *bc,
                             cudaStream_t stream) {
-  int num_tokens = bc->num_active_tokens();
+  int num_tokens = bc->num_active_infr_tokens();
   int curr_depth = bc->beamRequestsInfo[0].current_depth;
   if (num_tokens > 0) {
     int parallelism = m->hidden_size * KV_WEIGHT_NUM * num_tokens;
@@ -471,17 +471,18 @@ void compute_attention_kernel_prompt(SpecIncMultiHeadSelfAttentionMeta const *m,
   cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
   cudnnDataType_t cudnn_data_type = ff_to_cudnn_datatype(m->output_type[0]);
   assert(data_type_size(m->output_type[0]) == sizeof(DT));
-#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
   cudaDataType_t compute_type = cublas_data_type;
-#else
-  // For best performance, set the default cublas compute type to
-  // CUBLAS_COMPUTE_16F for half precision and to
-  // CUBLAS_COMPUTE_32F_FAST_16F for full precision
-  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
-  if (m->output_type[0] == DT_FLOAT) {
-    compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
-  }
-#endif
+  // #if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  //   cudaDataType_t compute_type = cublas_data_type;
+  // #else
+  //   // For best performance, set the default cublas compute type to
+  //   // CUBLAS_COMPUTE_16F for half precision and to
+  //   // CUBLAS_COMPUTE_32F_FAST_16F for full precision
+  //   cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+  //   if (m->output_type[0] == DT_FLOAT) {
+  //     compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
+  //   }
+  // #endif
   // int num_requests = bc->num_active_requests();
   int num_tokens = bc->num_active_tokens();
   int tokens_previous_requests = 0;
@@ -541,20 +542,9 @@ void compute_attention_kernel_prompt(SpecIncMultiHeadSelfAttentionMeta const *m,
     DT const *A = static_cast<DT *>(m->devQKVProjArray) +
                   bc->requestsInfo[i].first_token_offset_in_batch *
                       m->qProjSize * m->num_q_heads * QKV_WEIGHT_NUM;
-    // To get B, skip over K entries from previous requests (all heads +
-    // padding)
-
-    // print_tensor<float>((float*)A, 32, "A");
     DT const *B = static_cast<DT *>(m->keyCache) + i * kt_req_block_size;
+    DT *C = static_cast<DT *>(m->qk_prods);
 
-    // if (i == 0 && sub_req_id == 0 &&
-    //     bc->beam_slots.at(0).current_depth == 1) {
-    //   int offset = (float *)B - m->keyCache;
-    //   printf("key cache offset %d\n", kt_req_block_size);
-    // }
-    // To get C, skip over QK^T products from previous requests
-    DT *C = static_cast<DT *>(m->qk_prods) +
-            m->num_q_heads * tokens_prev_requests_squares;
     checkCUDA(cublasGemmStridedBatchedEx(m->handle.blas,
                                          CUBLAS_OP_T,
                                          CUBLAS_OP_N,
@@ -854,29 +844,15 @@ SpecIncMultiHeadSelfAttentionMeta::SpecIncMultiHeadSelfAttentionMeta(
   // allocate memory for the seqArray and reserve space
   {
     beam_token_infos =
-        reinterpret_cast<BeamSearchBatchConfig::BeamSearchPerTokenInfo *>(
-            reinterpret_cast<char *>(handler.batch_config_metadata) +
-            sizeof(BatchConfig::tokensInfo) +
-            sizeof(BatchConfig::requestsInfo));
-
+        static_cast<BeamSearchBatchConfig::BeamSearchPerTokenInfo *>(
+            handler.batch_config_metadata->beamTokenInfo);
     beam_request_infos =
-        reinterpret_cast<BeamSearchBatchConfig::BeamSearchPerRequestInfo *>(
-            reinterpret_cast<char *>(handler.batch_config_metadata) +
-            sizeof(BatchConfig::tokensInfo) +
-            sizeof(BatchConfig::requestsInfo) +
-            sizeof(BeamSearchBatchConfig::beamTokenInfo));
-    causalMask = reinterpret_cast<BatchConfig::BitMask *>(
-        reinterpret_cast<char *>(handler.batch_config_metadata) +
-        sizeof(BatchConfig::tokensInfo) + sizeof(BatchConfig::requestsInfo) +
-        sizeof(BeamSearchBatchConfig::beamTokenInfo) +
-        sizeof(BeamSearchBatchConfig::beamRequestsInfo));
-
-    request_completed = reinterpret_cast<bool *>(
-        reinterpret_cast<char *>(handler.batch_config_metadata) +
-        sizeof(BatchConfig::tokensInfo) + sizeof(BatchConfig::requestsInfo) +
-        sizeof(BeamSearchBatchConfig::beamTokenInfo) +
-        sizeof(BeamSearchBatchConfig::beamRequestsInfo) +
-        sizeof(BatchConfig::causalMask));
+        static_cast<BeamSearchBatchConfig::BeamSearchPerRequestInfo *>(
+            handler.batch_config_metadata->beamRequestsInfo);
+    causalMask = static_cast<BatchConfig::BitMask *>(
+        handler.batch_config_metadata->causalMask);
+    request_completed =
+        static_cast<bool *>(handler.batch_config_metadata->request_completed);
   }
 
   cudaStreamSynchronize(stream);
diff --git a/src/ops/split.cc b/src/ops/split.cc
index 7c6b631b20..92cfbd49e9 100644
--- a/src/ops/split.cc
+++ b/src/ops/split.cc
@@ -50,7 +50,7 @@ SplitParams Split::get_params() const {
   SplitParams params;
   params.splits = this->splits;
   params.legion_axis = this->legion_axis;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
diff --git a/src/ops/topk.cc b/src/ops/topk.cc
index 7d30a8aff3..0e88befa68 100644
--- a/src/ops/topk.cc
+++ b/src/ops/topk.cc
@@ -87,7 +87,7 @@ TopKParams TopK::get_params() const {
   TopKParams params;
   params.k = this->k;
   params.sorted = this->sorted;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
@@ -226,7 +226,7 @@ OpMeta *TopK::init_task(Task const *task,
                         Runtime *runtime) {
   TopK *topk = (TopK *)task->args;
   FFHandler handle = *((FFHandler *)task->local_args);
-  TopKMeta *m = new TopKMeta(handle);
+  TopKMeta *m = new TopKMeta(handle, topk);
   m->profiling = topk->profiling;
   m->inference_debugging = topk->inference_debugging;
   m->sorted = topk->sorted;
@@ -474,7 +474,7 @@ bool TopK::measure_operator_cost(Simulator *sim,
     return false;
   }
 
-  TopKMeta *m = new TopKMeta(sim->handler);
+  TopKMeta *m = new TopKMeta(sim->handler, this);
   m->sorted = sorted;
 
   // allocate
diff --git a/src/ops/topk.cpp b/src/ops/topk.cpp
index b6e898b654..303c6e85e9 100644
--- a/src/ops/topk.cpp
+++ b/src/ops/topk.cpp
@@ -513,6 +513,7 @@ void TopK::backward_kernel_wrapper(TopKMeta const *m,
   // TODO: missing profiling here
 }
 
-TopKMeta::TopKMeta(FFHandler handler) : OpMeta(handler) {}
+TopKMeta::TopKMeta(FFHandler handler, TopK const *topk)
+    : OpMeta(handler, topk) {}
 
 }; // namespace FlexFlow
diff --git a/src/ops/topk.cu b/src/ops/topk.cu
index cc87ee8a42..cfb2bf6448 100644
--- a/src/ops/topk.cu
+++ b/src/ops/topk.cu
@@ -509,6 +509,7 @@ void TopK::backward_kernel_wrapper(TopKMeta const *m,
   }
 }
 
-TopKMeta::TopKMeta(FFHandler handler) : OpMeta(handler) {}
+TopKMeta::TopKMeta(FFHandler handler, TopK const *topk)
+    : OpMeta(handler, topk) {}
 
 }; // namespace FlexFlow
diff --git a/src/ops/transpose.cc b/src/ops/transpose.cc
index 7a179c4f7d..bffde477de 100644
--- a/src/ops/transpose.cc
+++ b/src/ops/transpose.cc
@@ -51,7 +51,7 @@ TransposeParams Transpose::get_params() const {
   for (int i = 0; i < outputs[0]->num_dims; i++) {
     params.perm.push_back(this->perm[i]);
   }
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
@@ -193,7 +193,7 @@ OpMeta *Transpose::init_task(Task const *task,
   Domain out_domain = runtime->get_index_space_domain(
       ctx, task->regions[1].region.get_index_space());
 
-  TransposeMeta *m = new TransposeMeta(handle);
+  TransposeMeta *m = new TransposeMeta(handle, transpose);
   transpose->init_meta(m, in_domain, out_domain);
   m->profiling = transpose->profiling;
   m->inference_debugging = transpose->inference_debugging;
@@ -320,7 +320,7 @@ bool Transpose::measure_operator_cost(Simulator *sim,
     return false;
   }
 
-  TransposeMeta *m = sim->transpose_meta;
+  TransposeMeta *m = new TransposeMeta(sim->handler, this);
   this->init_meta(m, sub_input.get_domain(), sub_output.get_domain());
 
   sim->free_all();
diff --git a/src/ops/tree_inc_multihead_self_attention.cc b/src/ops/tree_inc_multihead_self_attention.cc
index df722a3d51..132a48be40 100644
--- a/src/ops/tree_inc_multihead_self_attention.cc
+++ b/src/ops/tree_inc_multihead_self_attention.cc
@@ -924,7 +924,7 @@ TreeIncMultiHeadSelfAttentionParams
   params.qk_prod_scaling = this->qk_prod_scaling;
   params.position_bias = this->position_bias;
   params.tensor_parallelism_degree = this->tensor_parallelism_degree;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
diff --git a/src/ops/tree_inc_multihead_self_attention.cpp b/src/ops/tree_inc_multihead_self_attention.cpp
index 26291fb3b4..890d32bc87 100644
--- a/src/ops/tree_inc_multihead_self_attention.cpp
+++ b/src/ops/tree_inc_multihead_self_attention.cpp
@@ -16,6 +16,8 @@
 #include "flexflow/ops/tree_inc_multihead_self_attention.h"
 #include "flexflow/ffconst_utils.h"
 #include "flexflow/ops/kernels/inc_multihead_self_attention_kernels.h"
+#include "flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh"
+#include "flexflow/ops/tree_inc_multihead_self_attention.h"
 #include "flexflow/utils/hip_helper.h"
 #include <hip/hip_complex.h>
 #include <hip/hip_runtime.h>
@@ -26,11 +28,333 @@ namespace FlexFlow {
 using Legion::coord_t;
 using Legion::Memory;
 
+#define WARP_SIZE 32
+
 using namespace Kernels::IncMultiHeadAttention;
 
 namespace Kernels {
 namespace TreeIncMultiHeadAttention {
 
+template <typename T>
+__device__ __forceinline__ T
+    WARP_SHFL(unsigned mask, T var, int srcLane, int width = warpSize) {
+#ifndef __HIP_PLATFORM_HCC__
+  return __shfl_sync(mask, var, srcLane, width);
+#else
+  return __shfl(var, srcLane, width);
+#endif
+}
+
+template <typename T>
+__device__ __forceinline__ T
+    WARP_SHFL_XOR(unsigned mask, T var, int laneMask, int width = warpSize) {
+#ifndef __HIP_PLATFORM_HCC__
+  return __shfl_xor_sync(mask, var, laneMask, width);
+#else
+  return __shfl_xor(var, laneMask, width);
+#endif
+}
+
+template <typename DT,
+          int THREADS_PER_BLOCK,
+          int Dh,
+          int Dh_MAX,
+          int THREADS_PER_KEY,
+          int THREADS_PER_VALUE>
+__global__ void compute_attention_kernel_fused_kernel(
+    DT const *query,
+    DT const *key_cache,
+    DT const *value_cache,
+    DT *output_ptr,
+    float const scale,
+    int const max_seq_length,
+    int const max_token_per_batch,
+    int per_head_size,
+    int hidden_size,
+    BatchConfig::PerRequestInfo *request_infos,
+    int num_heads,
+    int num_requests,
+    BatchConfig::BitMask *causalMask,
+    bool *request_completed,
+    int qk_smem_sz) {
+
+  // q, k
+  using Q_vec = typename VEC_K<DT, THREADS_PER_KEY>::Type;
+  using K_vec = typename VEC_K<DT, THREADS_PER_KEY>::Type;
+  using V_vec = typename VEC_V<DT>::Type;
+  using Out_sum = typename Vec_fp32_<V_vec>::Type;
+
+  constexpr int WARPS_PER_BLOCK = THREADS_PER_BLOCK / WARP_SIZE;
+
+  constexpr int K_VEC_SIZE = sizeof(K_vec) / sizeof(DT);
+  constexpr int K_ELTS_PER_THREAD = Dh / THREADS_PER_KEY;
+  constexpr int K_VECS_PER_THREAD = K_ELTS_PER_THREAD / K_VEC_SIZE;
+  // constexpr int QK_ELTS_IN_16B = 16 / sizeof(DT);
+
+  // thread id
+  int const tidx = threadIdx.x;
+  // head id
+  int const head_idx = blockIdx.x;
+  // request idx
+  int const request_idx = blockIdx.y;
+
+  int const batch_config_request_id =
+      request_infos[request_idx].batch_config_request_id;
+
+  int const first_step = 0;
+
+  int const tlength =
+      request_infos[batch_config_request_id].first_token_depth_in_request +
+      request_infos[batch_config_request_id].num_tokens_in_batch;
+  int const qlength =
+      request_infos[batch_config_request_id].num_tokens_in_batch;
+
+  BatchConfig::BitMask bitmask = causalMask[batch_config_request_id];
+
+  int first_token_idx = 0;
+  for (int r = 0; r < batch_config_request_id; r++) {
+    first_token_idx +=
+        request_completed[r] ? 0 : request_infos[r].num_tokens_in_batch;
+  }
+
+  bool prompt_phase = request_infos[batch_config_request_id].prompt_phase;
+  int q_start =
+      request_infos[batch_config_request_id].first_token_depth_in_request;
+
+  // shared memory objects
+  extern __shared__ char smem_[];
+
+  float *qk_smem = reinterpret_cast<float *>(smem_);
+  float *out_smem = reinterpret_cast<float *>(smem_ + qk_smem_sz);
+
+  float qk_max = -FLT_MAX;
+
+  // first WARPS_PER_BLOCK for store qk_max, second WARPS_PER_BLOCK for sum
+  __shared__ float red_smem[WARPS_PER_BLOCK * 2];
+
+  const DT *q_ptr = query + first_token_idx * hidden_size * QKV_WEIGHT_NUM +
+                    head_idx * per_head_size;
+  __shared__ Q_vec q_vecs[THREADS_PER_KEY][K_VECS_PER_THREAD];
+
+  // the start offset of the element eg. (0, 1, 2, 3) * K_VEC_SIZE
+  int ki = tidx % THREADS_PER_KEY * K_VEC_SIZE;
+  int ki_o = tidx % THREADS_PER_KEY;
+  // the first key's offset for this thread
+  // ko = 0, 0, 0, 0, 1, 1, 1, 1, ....
+  int ko = tidx / THREADS_PER_KEY;
+  // load q tensor
+  Q_vec q_vec[K_VECS_PER_THREAD];
+
+  constexpr int K_PER_ITER = THREADS_PER_BLOCK / THREADS_PER_KEY;
+  // The number of keys per warp.
+  constexpr int K_PER_WARP = WARP_SIZE / THREADS_PER_KEY;
+
+  DT const *k_cache_batch =
+      key_cache + batch_config_request_id * max_seq_length * hidden_size + ki;
+
+  int ti_end =
+      div_up(tlength - first_step, K_PER_WARP) * K_PER_WARP + first_step;
+
+  for (int qi = 0; qi < qlength; qi += 1) {
+#pragma unroll
+    for (int ii = 0; ii < K_VECS_PER_THREAD; ++ii) {
+      q_vecs[ki_o][ii] = *reinterpret_cast<Q_vec const *>(
+          q_ptr + (hidden_size * QKV_WEIGHT_NUM * qi) + ki +
+          ii * THREADS_PER_KEY * K_VEC_SIZE);
+
+      // if (head_idx == 0 && request_idx == 1 && tidx == 0) {
+      //     printf("laod q %d,  %d %.10f\n",
+      //     request_idx,
+      //            qi,q_vecs[ki_o][ii].x);
+      //   }
+    }
+
+    __syncthreads();
+    for (int ti = ko; ti < ti_end; ti += K_PER_ITER) {
+      K_vec k[K_VECS_PER_THREAD];
+      int const ti_circ = ti % max_seq_length;
+
+      for (int ii = 0; ii < K_VECS_PER_THREAD; ++ii) {
+        int jj = ii * THREADS_PER_KEY * K_VEC_SIZE;
+        if (ti < tlength) {
+          k[ii] = *reinterpret_cast<K_vec const *>(
+              k_cache_batch + ti_circ * hidden_size + head_idx * per_head_size +
+              jj);
+        }
+      }
+      float qk = scale * Qk_dot<DT, THREADS_PER_KEY>::dot(q_vecs[ki_o], k);
+
+      if (ti < tlength && tidx % THREADS_PER_KEY == 0) {
+        bool const mask =
+            prompt_phase ? (qi + q_start < ti)
+                         : (ti >= bitmask.non_tree_cache_size &&
+                            (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
+                               (1 << qi))));
+
+        qk_max = mask ? qk_max : fmaxf(qk_max, qk);
+
+        // if (head_idx == 0 && !mask) {
+        //   printf("tree attn qkqkqkqk request id %d qi%d, ti %d, %.10f, %.10f,
+        //   %.10f, %d\n",
+        //          request_idx,
+        //          qi,
+        //          ti,
+        //          qk,
+        //          q_vecs[ki_o][0].x,
+        //          k[0].x,
+        //          bitmask.non_tree_cache_size);
+        // }
+        qk_smem[ti - first_step] = mask ? 0.0f : qk;
+      }
+    }
+
+    __syncthreads();
+
+#pragma unroll
+    for (int mask = WARP_SIZE / 2; mask >= THREADS_PER_KEY; mask /= 2) {
+      qk_max = fmaxf(qk_max, WARP_SHFL_XOR(uint32_t(-1), qk_max, mask));
+    }
+
+    // Decompose the thread index into warp and lane.
+    int const warp = tidx / WARP_SIZE;
+    int const lane = tidx % WARP_SIZE;
+
+    // The warp leader writes the max to shared memory.
+    if (lane == 0) {
+      red_smem[warp] = qk_max;
+    }
+
+    // Make sure the products are in shared memory.
+    __syncthreads();
+
+    // The warps finalize the reduction.
+    qk_max = lane < WARPS_PER_BLOCK ? red_smem[lane] : -FLT_MAX;
+#pragma unroll
+    for (int mask = WARPS_PER_BLOCK / 2; mask >= 1; mask /= 2) {
+      qk_max = fmaxf(qk_max, WARP_SHFL_XOR(uint32_t(-1), qk_max, mask));
+    }
+
+    // Broadcast to all the threads in the warp.
+    qk_max = WARP_SHFL(uint32_t(-1), qk_max, 0);
+
+    // if (head_idx == 0 && qi == 9 && tidx == 0) {
+    //   printf("tree attn first token qk_max %f\n", qk_max);
+    // }
+
+    float exp_sum = 0.f;
+    for (int ti = first_step + tidx; ti < tlength; ti += THREADS_PER_BLOCK) {
+      bool const mask =
+          prompt_phase ? (q_start + qi < ti)
+                       : (ti >= bitmask.non_tree_cache_size &&
+                          (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
+                             (1 << qi))));
+      float logit = mask ? 0.0f : __expf(qk_smem[ti - first_step] - qk_max);
+      exp_sum += logit;
+      qk_smem[ti - first_step] = mask ? 0.0f : logit;
+    }
+
+    // Compute the sum.
+    exp_sum = block_sum<WARPS_PER_BLOCK>(&red_smem[WARPS_PER_BLOCK], exp_sum);
+
+    // softmax
+    float inv_sum = __fdividef(1.f, exp_sum + 1.e-6);
+    for (int ti = first_step + tidx; ti < tlength; ti += THREADS_PER_BLOCK) {
+      qk_smem[ti - first_step] *= inv_sum;
+    }
+
+    __syncthreads();
+
+    // value projection
+    constexpr int V_VEC_SIZE = 16 / sizeof(DT);
+    // A vector of V elements for the current timestep.
+    // using V_vec_k = typename V_vec_k_<DT, V_VEC_SIZE>::Type;
+    // using V_vec_acum = typename V_vec_acum_fp32_<V_vec_k>::Type;
+
+    // The value computed by this thread.
+    int vo = tidx / THREADS_PER_VALUE;
+    // The hidden dimensions computed by this particular thread.
+    int vi = tidx % THREADS_PER_VALUE * V_VEC_SIZE;
+    constexpr int V_PER_ITER = THREADS_PER_BLOCK / THREADS_PER_VALUE;
+
+    Out_sum out;
+    zero(out);
+
+    // The base pointer for the value in the cache buffer.
+    DT const *v_cache_batch =
+        value_cache + batch_config_request_id * max_seq_length * hidden_size +
+        vi;
+
+    if (Dh == Dh_MAX || vi < Dh) {
+      for (int ti = first_step + vo; ti < tlength; ti += V_PER_ITER) {
+        // Load the values from the cache.
+        int const ti_circ = ti % max_seq_length;
+        // int const real_cache_idx = topology.real_token_pos[sub_req_idx][ti];
+        V_vec v = *reinterpret_cast<V_vec const *>(
+            v_cache_batch + ti_circ * hidden_size + head_idx * per_head_size);
+
+        if (ti < tlength) {
+          bool const mask =
+              prompt_phase
+                  ? (q_start + qi < ti)
+                  : (ti >= bitmask.non_tree_cache_size &&
+                     (!(bitmask.mask[ti - bitmask.non_tree_cache_size] &
+                        (1 << qi))));
+          float logit = mask ? 0.0f : qk_smem[ti - first_step];
+          out = FlexFlow::fma(logit, cast_to_float(v), out);
+        }
+      }
+    }
+
+    //   // Make sure we can start writing to shared memory.
+    __syncthreads();
+
+    // Run the final reduction amongst the different groups computing different
+    // partial outputs.
+    if (Dh == Dh_MAX || vi < Dh) {
+#pragma unroll
+      for (int active_groups = V_PER_ITER; active_groups >= 2;
+           active_groups /= 2) {
+
+        // The midpoint in the number of active groups.
+        int midpoint = active_groups / 2;
+
+        // The upper part of active threads store to shared memory.
+        if (vo >= midpoint && vo < active_groups && (Dh == Dh_MAX || vi < Dh)) {
+          *reinterpret_cast<Out_sum *>(out_smem + (vo - midpoint) * Dh + vi) =
+              out;
+        }
+        __syncthreads();
+
+        // The bottom warps update their values.
+        if (vo < midpoint && (Dh == Dh_MAX || vi < Dh)) {
+          out = add(*reinterpret_cast<Out_sum const *>(out_smem + vo * Dh + vi),
+                    out);
+        }
+        __syncthreads();
+      }
+    }
+
+    // Output the final values.
+    if (vo == 0 && (Dh == Dh_MAX || vi < Dh)) {
+      convert_from_float(*reinterpret_cast<V_vec *>(
+                             output_ptr + (first_token_idx + qi) * hidden_size +
+                             head_idx * per_head_size + vi),
+                         out);
+      // if (blockIdx.y == 0 && blockIdx.x == 0 && tidx == 0 && qi == 1) {
+      //   printf("tree attn final value, %.9f, %.9f, %.9f, %.9f, %d, %d\n",
+      //          out.x,
+      //          out.y,
+      //          out.z,
+      //          out.w,
+      //          vi,
+      //          (first_token_idx + qi) * hidden_size + head_idx *
+      //          per_head_size +
+      //              vi);
+      // }
+    }
+  }
+}
+
 template <typename DT>
 __global__ void commit_tokens_kernel(
     DT const *devQKVProjArray,
@@ -45,15 +369,15 @@ __global__ void commit_tokens_kernel(
     int max_seq_len,
     int hidden_size) {
 
-  CUDA_KERNEL_LOOP(i, num_tokens_to_commit * hidden_size * 2) {
+  CUDA_KERNEL_LOOP(i, num_tokens_to_commit * hidden_size) {
 
-    int token_pos = i / (hidden_size * KV_WEIGHT_NUM);
+    int token_pos = i / (hidden_size);
     int token_idx_in_last_batch = committedTokenInfos[token_pos].token_index;
     int offset = i % hidden_size;
     assert(token_idx_in_last_batch < num_active_tokens_in_last_batch);
 
-    size_t val_idx =
-        token_idx_in_last_batch * 3 * hidden_size + hidden_size + offset;
+    size_t val_idx = token_idx_in_last_batch * QKV_WEIGHT_NUM * hidden_size +
+                     hidden_size + offset;
 
     DT kVal = devQKVProjArray[val_idx];
     DT vVal = devQKVProjArray[val_idx + hidden_size];
@@ -89,8 +413,9 @@ void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
         m->kProjSize,
         m->vProjSize,
         num_tokens_to_commit,
-        m->num_active_tokens, // number of active tokens in previous batch
-        BatchConfig::max_sequence_length(),
+        m->num_active_infr_tokens, // number of active tokens in previous batch
+        BatchConfig::max_sequence_length() +
+            BatchConfig::max_spec_tree_token_num(),
         m->hidden_size);
   }
 }
@@ -109,12 +434,15 @@ __global__ void update_tree_branch_kv_cache(
     int total_tokens_in_batch,
     int max_seq_len,
     int hidden_size) {
-  CUDA_KERNEL_LOOP(i, num_tokens_in_branch * hidden_size * 2) {
-    int token_idx = i / (hidden_size * KV_WEIGHT_NUM);
+  CUDA_KERNEL_LOOP(i, num_tokens_in_branch * hidden_size) {
+
+    int token_idx = i / (hidden_size);
     int offset = i % hidden_size;
 
     token_idx += processed_tokens_in_batch; // get index in the whole batch
-    size_t val_idx = token_idx * 3 * hidden_size + hidden_size + offset;
+    size_t val_idx =
+        token_idx * QKV_WEIGHT_NUM * hidden_size + hidden_size + offset;
+
     DT kVal = devQKVProjArray[val_idx];
     DT vVal = devQKVProjArray[val_idx + hidden_size];
 
@@ -127,6 +455,53 @@ __global__ void update_tree_branch_kv_cache(
   }
 }
 
+template <typename DT>
+__global__ void update_tree_branch_kv_cache_fused(
+    DT const *devQKVProjArray,
+    DT *kCache_ptr,
+    DT *vCache_ptr,
+    TreeVerifyBatchConfig::PerTokenInfo const *tokenInfos,
+    BatchConfig::PerRequestInfo *request_infos,
+    int qProjSize,
+    int kProjSize,
+    int vProjSize,
+    int num_new_tokens,
+    int max_seq_len,
+    int hidden_size) {
+  CUDA_KERNEL_LOOP(i, num_new_tokens * hidden_size) {
+
+    int token_idx = i / hidden_size;
+    int offset = i % hidden_size;
+    size_t val_idx =
+        token_idx * QKV_WEIGHT_NUM * hidden_size + hidden_size + offset;
+
+    DT kVal = devQKVProjArray[val_idx];
+    DT vVal = devQKVProjArray[val_idx + hidden_size];
+
+    int const req_id = tokenInfos[token_idx].request_index;
+    // int const tok_id = tokenInfos[token_idx].abs_depth_in_request;
+
+    int const request_token_offset =
+        request_infos[req_id].first_token_offset_in_batch;
+    int const first_token_depth =
+        request_infos[req_id].first_token_depth_in_request;
+
+    // if(i % hidden_size == 0){
+    //   printf("update token request id: %d, %d, %d  real id %d, value%.10f\n",
+    //   req_id, token_idx, request_token_offset,(token_idx + first_token_depth
+    //   - request_token_offset), kVal);
+    // }
+    kCache_ptr[req_id * (hidden_size * max_seq_len) +
+               (token_idx + first_token_depth - request_token_offset) *
+                   hidden_size +
+               offset] = kVal;
+    vCache_ptr[req_id * (hidden_size * max_seq_len) +
+               (token_idx + first_token_depth - request_token_offset) *
+                   hidden_size +
+               offset] = vVal;
+  }
+}
+
 template <typename DT>
 __global__ void tree_fill_entries_above_diagonal(DT *matrix,
                                                  size_t new_tokens,
@@ -157,13 +532,14 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
   hipblasDatatype_t hipblas_data_type = ff_to_cuda_datatype(m->output_type[0]);
   miopenDataType_t miopen_data_type = ff_to_cudnn_datatype(m->output_type[0]);
   assert(data_type_size(m->output_type[0]) == sizeof(DT));
-#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
   hipblasDatatype_t compute_type = hipblas_data_type;
-#else
-  // TODO: currently use the hipblas_data_type
-  // cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
-  hipblasDatatype_t compute_type = hipblas_data_type;
-#endif
+  // #if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  //   hipblasDatatype_t compute_type = hipblas_data_type;
+  // #else
+  //   // TODO: currently use the hipblas_data_type
+  //   // cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+  //   hipblasDatatype_t compute_type = hipblas_data_type;
+  // #endif
   // int num_requests = bc->num_active_requests();
   int processed_tokens_in_batch = 0;
   // int qkv_block_size =
@@ -171,16 +547,20 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
   int q_block_size = m->qProjSize;
   int kt_block_size = m->kProjSize;
   int kt_req_block_size =
-      kt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+      kt_block_size * m->num_q_heads * BatchConfig::max_sequence_length() +
+      BatchConfig::max_spec_tree_token_num();
   int vt_block_size = m->vProjSize;
   int vt_req_block_size =
-      vt_block_size * m->num_q_heads * BatchConfig::max_sequence_length();
+      vt_block_size * m->num_q_heads * BatchConfig::max_sequence_length() +
+      BatchConfig::max_spec_tree_token_num();
   assert(m->qProjSize == m->kProjSize);
 
   for (int i = 0; i < bc->max_requests_per_batch(); i++) {
     if (bc->request_completed[i]) {
       continue;
     }
+    assert(processed_tokens_in_batch ==
+           bc->requestsInfo[i].first_token_offset_in_batch);
     int last_token_idx_of_the_request =
         processed_tokens_in_batch + bc->requestsInfo[i].num_tokens_in_batch - 1;
     while (processed_tokens_in_batch <= last_token_idx_of_the_request) {
@@ -213,7 +593,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
             m->vProjSize,
             num_new_tokens,            // num_tokens_in_branch
             processed_tokens_in_batch, // num_processed_tokens_in_batch
-            m->num_active_tokens,      // total_tokens_in_batch
+            m->num_active_infr_tokens, // total_tokens_in_batch
             BatchConfig::max_sequence_length(),
             m->hidden_size);
       }
@@ -335,24 +715,23 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                                          MIOPEN_SOFTMAX_MODE_CHANNEL));
       // Matmul softmax(QK^T/sqrt(d_k)) by V
       alpha = 1.0f, beta = 0.0f;
-      m_ = num_new_tokens;
-      n = m->vProjSize;
+      m_ = m->vProjSize;
+      n = num_new_tokens;
       k = total_tokens_in_request;
-      lda = m_, ldb = n * m->num_q_heads, ldc = m_;
-      strideA = num_new_tokens * total_tokens_in_request;
-      strideB = vt_block_size;
-      strideC = num_new_tokens * m->vProjSize;
-      // To get A, skip over softmax(QK^T/sqrt(d_k)) entries from previous
-      // requests (all heads)
-      A = C_softmax;
-      // To get B, skip over V^T entries from previous requests (all heads +
+      lda = m_ * m->num_q_heads, ldb = n, ldc = m_ * m->num_q_heads;
+      strideA = vt_block_size;
+      strideB = num_new_tokens * total_tokens_in_request;
+      strideC = m->vProjSize;
+      // To get A, skip over V^T entries from previous requests (all heads +
       // padding)
-      B = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
+      A = static_cast<DT *>(m->valueCache) + i * vt_req_block_size;
+      // To get B, skip over softmax(QK^T/sqrt(d_k)) entries from previous
+      // requests (all heads)
+      B = C_softmax;
       // To get C, skip over softmax(QK^T/sqrt(d_k))V products from previous
       // requests
       C = static_cast<DT *>(m->attn_heads) +
           processed_tokens_in_batch * m->num_q_heads * m->vProjSize;
-
       checkCUDA(hipblasGemmStridedBatchedEx(m->handle.blas,
                                             HIPBLAS_OP_N,
                                             HIPBLAS_OP_T,
@@ -376,45 +755,44 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                                             m->num_q_heads,
                                             compute_type,
                                             HIPBLAS_GEMM_DEFAULT));
-
-      // Project to output, save result directly on output tensor
-      alpha = 1.0f, beta = 0.0f;
-      m_ = m->oProjSize;
-      k = m->vProjSize * m->num_q_heads;
-      n = num_new_tokens;
-      lda = k, ldb = n, ldc = m_;
-      A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
-                                   m->kProjSize * m->num_q_heads +
-                                   m->vProjSize * m->num_q_heads);
-      B = C;
-      C = static_cast<DT *>(output_ptr) +
-          processed_tokens_in_batch * m->oProjSize;
-
-      checkCUDA(hipblasGemmEx(m->handle.blas,
-                              HIPBLAS_OP_T,
-                              HIPBLAS_OP_T,
-                              m_,
-                              n,
-                              k,
-                              &alpha,
-                              A,
-                              hipblas_data_type,
-                              lda,
-                              B,
-                              hipblas_data_type,
-                              ldb,
-                              &beta,
-                              C,
-                              hipblas_data_type,
-                              ldc,
-                              compute_type,
-                              HIPBLAS_GEMM_DEFAULT));
       processed_tokens_in_batch += num_new_tokens;
     }
     // Before moving to the next request
     // check that we have finished all tokens of the request
     assert(last_token_idx_of_the_request + 1 == processed_tokens_in_batch);
   }
+  // Project to output, save result directly on output tensor
+  DT alpha = 1.0f, beta = 0.0f;
+  int m_ = m->oProjSize;
+  int k = m->vProjSize * m->num_q_heads;
+  int n = processed_tokens_in_batch;
+  int lda = k, ldb = k, ldc = m_;
+  DT const *A = weight_ptr + m->qSize * (m->qProjSize * m->num_q_heads +
+                                         m->kProjSize * m->num_q_heads +
+                                         m->vProjSize * m->num_q_heads);
+  DT const *B = static_cast<DT *>(m->attn_heads);
+  DT *C = static_cast<DT *>(output_ptr);
+
+  checkCUDA(hipblasGemmEx(m->handle.blas,
+                          HIPBLAS_OP_T,
+                          HIPBLAS_OP_T,
+                          m_,
+                          n,
+                          k,
+                          &alpha,
+                          A,
+                          hipblas_data_type,
+                          lda,
+                          B,
+                          hipblas_data_type,
+                          ldb,
+                          &beta,
+                          C,
+                          hipblas_data_type,
+                          ldc,
+                          compute_type,
+                          HIPBLAS_GEMM_DEFAULT));
+
   if (*m->final_bias && shard_id == 0) {
     int parallelism = m->oProjSize * processed_tokens_in_batch;
     int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
@@ -432,7 +810,85 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                        m->oProjSize);
   }
 
-  assert(processed_tokens_in_batch == bc->num_active_tokens());
+  assert(processed_tokens_in_batch == bc->num_active_infr_tokens());
+}
+
+#define LAUNCH_TREE_VERIFY_ATTENTION_SCORE_KERNEL(                             \
+    DT, Dh, Dh_MAX, THDS_PER_KEY, THDS_PER_VALUE, THDS_PER_BLOCK, stream)      \
+  smem_size_in_bytes_tree<DT>(m->qProjSize,                                    \
+                              BatchConfig::max_sequence_length() +             \
+                                  BatchConfig::max_spec_tree_token_num(),      \
+                              THDS_PER_VALUE,                                  \
+                              THDS_PER_BLOCK,                                  \
+                              bc,                                              \
+                              smem_sz);                                        \
+  compute_attention_kernel_fused_kernel<DT,                                    \
+                                        THDS_PER_BLOCK,                        \
+                                        Dh,                                    \
+                                        Dh_MAX,                                \
+                                        THDS_PER_KEY,                          \
+                                        THDS_PER_VALUE>                        \
+      <<<grid, THDS_PER_BLOCK, smem_sz[1], stream>>>(                          \
+          static_cast<DT *>(m->devQKVProjArray),                               \
+          static_cast<DT *>(m->keyCache),                                      \
+          static_cast<DT *>(m->valueCache),                                    \
+          output_ptr,                                                          \
+          scale,                                                               \
+          BatchConfig::max_sequence_length() +                                 \
+              BatchConfig::BatchConfig::max_spec_tree_token_num(),             \
+          BatchConfig::max_tokens_per_batch(),                                 \
+          m->qProjSize,                                                        \
+          m->hidden_size,                                                      \
+          m->request_infos,                                                    \
+          m->num_q_heads,                                                      \
+          bc->num_active_requests(),                                           \
+          m->causalMask,                                                       \
+          m->request_completed,                                                \
+          smem_sz[0])
+
+template <typename DT>
+void compute_attention_kernel_fused(TreeIncMultiHeadSelfAttentionMeta const *m,
+                                    TreeVerifyBatchConfig const *bc,
+                                    DT *output_ptr,
+                                    hipStream_t stream) {
+
+  // update the kv cache
+  //  update K-V cache
+  int num_new_tokens = bc->num_active_tokens();
+  int parallelism = m->hidden_size * num_new_tokens;
+  update_tree_branch_kv_cache_fused<<<GET_BLOCKS(parallelism),
+                                      min(CUDA_NUM_THREADS, parallelism),
+                                      0,
+                                      stream>>>(
+      static_cast<DT *>(m->devQKVProjArray),
+      static_cast<DT *>(m->keyCache),
+      static_cast<DT *>(m->valueCache),
+      m->token_infos,
+      m->request_infos,
+      m->qProjSize,
+      m->kProjSize,
+      m->vProjSize,
+      num_new_tokens,
+      BatchConfig::max_sequence_length() +
+          BatchConfig::max_spec_tree_token_num(),
+      m->hidden_size);
+
+  dim3 grid(m->num_q_heads, bc->num_active_requests());
+  int const per_head_size = m->qProjSize;
+  float scale = (*m->qk_prod_scaling) ? 1.0f / sqrt(m->kProjSize) : 1.0f;
+  // 0->qk production size, 1->total shared size
+  int smem_sz[2];
+  if (per_head_size == 64) {
+    constexpr int THREADS_PER_VALUE_64 = threads_per_value_t<DT, 64>::value;
+    LAUNCH_TREE_VERIFY_ATTENTION_SCORE_KERNEL(
+        DT, 64, 64, 4, THREADS_PER_VALUE_64, 128, stream);
+  } else if (per_head_size == 128) {
+    constexpr int THREADS_PER_VALUE_128 = threads_per_value_t<DT, 128>::value;
+    LAUNCH_TREE_VERIFY_ATTENTION_SCORE_KERNEL(
+        DT, 128, 128, 4, THREADS_PER_VALUE_128, 128, stream);
+  } else {
+    assert(false && "a unsupported head size");
+  }
 }
 
 template <typename DT>
@@ -461,21 +917,17 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
     }
   }
   // copy committed tokens info to GPU for the commit_tokens kernel
-  // Note that m->num_active_tokens stores the number of active
+  // Note that m->num_active_infr_tokens stores the number of active
   // tokens in the previous batch, which is needed for committing
   // keys/values to the key-value cache
-  checkCUDA(
-      hipMemcpyAsync(m->committed_token_infos,
-                     &(bc->committed_tokens),
-                     bc->num_tokens_to_commit *
-                         sizeof(TreeVerifyBatchConfig::CommittedTokensInfo),
-                     hipMemcpyHostToDevice,
-                     stream));
+  // std::cout << "tokens to be committed: " << bc->num_tokens_to_commit <<
+  // "\n";
+
   commit_tokens<DT>(m, bc, stream);
 
-  // After commit we update m->num_active_tokens to be the number of active
+  // After commit we update m->num_active_infr_tokens to be the number of active
   // tokens for the current batch
-  m->num_active_tokens = bc->num_active_tokens();
+  m->num_active_infr_tokens = bc->num_active_infr_tokens();
 
   // here because we need postion info in infernece 1
   if (m->offload && m->biasSize > 0) {
@@ -483,12 +935,6 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
         m->bias_ptr, bias_ptr, m->biasSize, hipMemcpyHostToDevice, stream));
     bias_ptr = static_cast<DT *>(m->bias_ptr);
   }
-  checkCUDA(hipMemcpyAsync(m->token_infos,
-                           &(bc->tokensInfo),
-                           bc->num_active_tokens() *
-                               sizeof(TreeVerifyBatchConfig::PerTokenInfo),
-                           hipMemcpyHostToDevice,
-                           stream));
   // phase 1: Implement kernel to compute KQV for input tokens
   compute_qkv_kernel(m,
                      bc,
@@ -502,11 +948,20 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
   // phase 2: No need to update key/val cache
   // IncMultiHeadSelfAttention::update_kv_cache_kernel(
   //    m, bc, stream);
+  // use the new kernel
+  compute_attention_kernel_fused<DT>(
+      m, bc, static_cast<DT *>(m->attn_heads), stream);
+
+  int processed_tokens_in_batch = bc->num_active_tokens();
 
-  // phase 3: Compute attention score
-  // 3 kernels for pahse 3: matmul1 - softmax - matmal2
-  compute_attention_kernel(
-      m, bc, shard_id, output_ptr, bias_ptr, weight_ptr, stream);
+  compute_o_prod_bias(m,
+                      bc,
+                      shard_id,
+                      output_ptr,
+                      weight_ptr,
+                      bias_ptr,
+                      processed_tokens_in_batch,
+                      stream);
 }
 
 } // namespace TreeIncMultiHeadAttention
@@ -622,34 +1077,21 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
                                     _num_kv_heads,
                                     attn->quantization_type,
                                     attn->offload),
-      num_active_tokens(0) {
+      num_active_infr_tokens(0) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDNN(miopenSetStream(handler.dnn, stream));
 
   // allocate memory for the seqArray and reserve space
   {
-    int max_tokens_per_batch = BatchConfig::max_tokens_per_batch();
-    size_t committed_tokeninfo_size = max_tokens_per_batch;
-    size_t total_size = committed_tokeninfo_size *
-                        sizeof(TreeVerifyBatchConfig::CommittedTokensInfo);
-    if (offload) {
-      // assert that we have enough reserved work space left
-      assert(gpu_mem_allocator.reserved_total_size -
-                 gpu_mem_allocator.reserved_allocated_size >=
-             total_size);
-      committed_token_infos =
-          gpu_mem_allocator
-              .allocate_reserved<TreeVerifyBatchConfig::CommittedTokensInfo>(
-                  committed_tokeninfo_size);
-    } else {
-      gpu_mem_allocator.create_legion_instance(committed_token_reserve_inst,
-                                               total_size);
-      committed_token_infos =
-          gpu_mem_allocator
-              .allocate_instance<TreeVerifyBatchConfig::CommittedTokensInfo>(
-                  committed_tokeninfo_size);
-    }
+
+    causalMask = static_cast<BatchConfig::BitMask *>(
+        handler.batch_config_metadata->causalMask);
+    committed_token_infos =
+        static_cast<TreeVerifyBatchConfig::CommittedTokensInfo *>(
+            handler.batch_config_metadata->committed_tokens);
+    request_completed =
+        static_cast<bool *>(handler.batch_config_metadata->request_completed);
   }
 
   checkCUDA(hipStreamSynchronize(stream));
diff --git a/src/ops/tree_inc_multihead_self_attention.cu b/src/ops/tree_inc_multihead_self_attention.cu
index 50c056c816..86c53d7ea1 100644
--- a/src/ops/tree_inc_multihead_self_attention.cu
+++ b/src/ops/tree_inc_multihead_self_attention.cu
@@ -12,9 +12,7 @@
  * See the License for the specific language governing permissions and
  * limitations under the License.
  */
-#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
 #include "cuComplex.h"
-#endif
 #include "flexflow/ffconst_utils.h"
 #include "flexflow/ops/kernels/inc_multihead_self_attention_kernels.h"
 #include "flexflow/ops/kernels/inc_multihead_self_attention_utils.cuh"
@@ -390,7 +388,7 @@ void commit_tokens(TreeIncMultiHeadSelfAttentionMeta const *m,
         m->kProjSize,
         m->vProjSize,
         num_tokens_to_commit,
-        m->num_active_tokens, // number of active tokens in previous batch
+        m->num_active_infr_tokens, // number of active tokens in previous batch
         BatchConfig::max_sequence_length() +
             BatchConfig::max_spec_tree_token_num(),
         m->hidden_size);
@@ -509,17 +507,18 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
   cudaDataType_t cublas_data_type = ff_to_cuda_datatype(m->output_type[0]);
   cudnnDataType_t cudnn_data_type = ff_to_cudnn_datatype(m->output_type[0]);
   assert(data_type_size(m->output_type[0]) == sizeof(DT));
-#if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
   cudaDataType_t compute_type = cublas_data_type;
-#else
-  // For best performance, set the default cublas compute type to
-  // CUBLAS_COMPUTE_16F for half precision and to
-  // CUBLAS_COMPUTE_32F_FAST_16F for full precision
-  cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
-  if (m->output_type[0] == DT_FLOAT) {
-    compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
-  }
-#endif
+  // #if defined(CUDA_VERSION) && (CUDA_VERSION < 11000)
+  //   cudaDataType_t compute_type = cublas_data_type;
+  // #else
+  //   // For best performance, set the default cublas compute type to
+  //   // CUBLAS_COMPUTE_16F for half precision and to
+  //   // CUBLAS_COMPUTE_32F_FAST_16F for full precision
+  //   cublasComputeType_t compute_type = CUBLAS_COMPUTE_16F;
+  //   if (m->output_type[0] == DT_FLOAT) {
+  //     compute_type = CUBLAS_COMPUTE_32F_FAST_16F;
+  //   }
+  // #endif
   // int num_requests = bc->num_active_requests();
   int processed_tokens_in_batch = 0;
   // int qkv_block_size =
@@ -571,7 +570,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
             m->vProjSize,
             num_new_tokens,            // num_tokens_in_branch
             processed_tokens_in_batch, // num_processed_tokens_in_batch
-            m->num_active_tokens,      // total_tokens_in_batch
+            m->num_active_infr_tokens, // total_tokens_in_batch
             BatchConfig::max_sequence_length(),
             m->hidden_size);
       }
@@ -773,6 +772,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                          ldc,
                          compute_type,
                          CUBLAS_GEMM_DEFAULT_TENSOR_OP));
+
   if (*m->final_bias && shard_id == 0) {
     int parallelism = m->oProjSize * processed_tokens_in_batch;
     int qkv_weight_size = m->qProjSize * m->global_num_q_heads +
@@ -788,7 +788,7 @@ void compute_attention_kernel(TreeIncMultiHeadSelfAttentionMeta const *m,
                                   m->oProjSize);
   }
 
-  assert(processed_tokens_in_batch == bc->num_active_tokens());
+  assert(processed_tokens_in_batch == bc->num_active_infr_tokens());
 }
 
 #define LAUNCH_TREE_VERIFY_ATTENTION_SCORE_KERNEL(                             \
@@ -896,7 +896,7 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
   }
 
   // copy committed tokens info to GPU for the commit_tokens kernel
-  // Note that m->num_active_tokens stores the number of active
+  // Note that m->num_active_infr_tokens stores the number of active
   // tokens in the previous batch, which is needed for committing
   // keys/values to the key-value cache
   // std::cout << "tokens to be committed: " << bc->num_tokens_to_commit <<
@@ -904,9 +904,9 @@ void inference_kernel(TreeIncMultiHeadSelfAttentionMeta *m,
 
   commit_tokens<DT>(m, bc, stream);
 
-  // After commit we update m->num_active_tokens to be the number of active
+  // After commit we update m->num_active_infr_tokens to be the number of active
   // tokens for the current batch
-  m->num_active_tokens = bc->num_active_tokens();
+  m->num_active_infr_tokens = bc->num_active_infr_tokens();
 
   // here because we need postion info in infernece 1
   if (m->offload && m->biasSize > 0) {
@@ -1052,7 +1052,7 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
                                     _num_kv_heads,
                                     attn->quantization_type,
                                     attn->offload),
-      num_active_tokens(0) {
+      num_active_infr_tokens(0) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   checkCUDNN(cudnnSetStream(handler.dnn, stream));
@@ -1060,21 +1060,13 @@ TreeIncMultiHeadSelfAttentionMeta::TreeIncMultiHeadSelfAttentionMeta(
   // allocate memory for the seqArray and reserve space
   {
 
-    causalMask = reinterpret_cast<BatchConfig::BitMask *>(
-        reinterpret_cast<char *>(handler.batch_config_metadata) +
-        sizeof(BatchConfig::tokensInfo) + sizeof(BatchConfig::requestsInfo));
+    causalMask = static_cast<BatchConfig::BitMask *>(
+        handler.batch_config_metadata->causalMask);
     committed_token_infos =
-        reinterpret_cast<TreeVerifyBatchConfig::CommittedTokensInfo *>(
-            reinterpret_cast<char *>(handler.batch_config_metadata) +
-            sizeof(BatchConfig::tokensInfo) +
-            sizeof(BatchConfig::requestsInfo) +
-            sizeof(BatchConfig::causalMask));
-
-    request_completed = reinterpret_cast<bool *>(
-        reinterpret_cast<char *>(handler.batch_config_metadata) +
-        sizeof(BatchConfig::tokensInfo) + sizeof(BatchConfig::requestsInfo) +
-        sizeof(BatchConfig::causalMask) +
-        sizeof(TreeVerifyBatchConfig::committed_tokens));
+        static_cast<TreeVerifyBatchConfig::CommittedTokensInfo *>(
+            handler.batch_config_metadata->committed_tokens);
+    request_completed =
+        static_cast<bool *>(handler.batch_config_metadata->request_completed);
   }
 
   cudaStreamSynchronize(stream);
diff --git a/src/parallel_ops/allreduce.cc b/src/parallel_ops/allreduce.cc
index 5d38e28903..52c4ec2e28 100644
--- a/src/parallel_ops/allreduce.cc
+++ b/src/parallel_ops/allreduce.cc
@@ -45,7 +45,8 @@ using namespace FlexFlow::Kernels::AllReduce;
 
 /* Params */
 bool operator==(AllReduceParams const &lhs, AllReduceParams const &rhs) {
-  return lhs.allreduce_legion_dim == rhs.allreduce_legion_dim;
+  return lhs.allreduce_legion_dim == rhs.allreduce_legion_dim &&
+         std::strcmp(lhs.name, rhs.name) == 0;
 }
 
 bool AllReduceParams::is_valid(ParallelTensorShape const &input) const {
@@ -55,7 +56,7 @@ bool AllReduceParams::is_valid(ParallelTensorShape const &input) const {
 AllReduceParams AllReduce::get_params() const {
   AllReduceParams params;
   params.allreduce_legion_dim = this->allreduce_dim;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
@@ -110,6 +111,7 @@ OpMeta *AllReduce::init_task(Task const *task,
   meta->input_type[0] = ar->inputs[0]->data_type;
   meta->output_type[0] = ar->outputs[0]->data_type;
   assert(meta->input_type[0] == meta->output_type[0]);
+  std::strcpy(meta->op_name, ar->name);
   return meta;
 }
 
@@ -146,6 +148,102 @@ void AllReduce::init(FFModel const &ff) {
   set_opmeta_from_futuremap(ff, fm);
 }
 
+void AllReduce::forward(FFModel const &ff) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = outputs[0]->parallel_is;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  set_argumentmap_for_forward(ff, argmap);
+  IndexLauncher launcher(ALLREDUCE_FWD_TASK_ID,
+                         outputs[0]->parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  runtime->execute_index_space(ctx, launcher);
+}
+
+/*static*/
+void AllReduce::forward_task(Task const *task,
+                             std::vector<PhysicalRegion> const &regions,
+                             Context ctx,
+                             Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+
+  AllReduceMeta const *m = *((AllReduceMeta **)task->local_args);
+
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  assert(input.data_type == output.data_type);
+  forward_kernel_wrapper(m, input, output);
+}
+
+void AllReduce::backward(FFModel const &ff) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  IndexLauncher launcher(ALLREDUCE_BWD_TASK_ID,
+                         inputs[0]->parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         inputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region_grad));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region_grad));
+  launcher.add_field(1, FID_DATA);
+  runtime->execute_index_space(ctx, launcher);
+}
+
+void AllReduce::backward_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+  AllReduceMeta const *m = *((AllReduceMeta **)task->local_args);
+
+  GenericTensorAccessorW input_grad = helperGetGenericTensorAccessorRW(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR output_grad = helperGetGenericTensorAccessorRO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  assert(input_grad.data_type == output_grad.data_type);
+  backward_kernel_wrapper(m, input_grad, output_grad);
+}
+
 void AllReduce::init_inference(FFModel const &ff,
                                std::vector<ParallelTensor> const &batch_inputs,
                                std::vector<ParallelTensor> const &batch_outputs,
@@ -224,64 +322,103 @@ FutureMap AllReduce::inference(FFModel const &ff,
   return runtime->execute_index_space(ctx, launcher);
 }
 
-void AllReduce::forward(FFModel const &ff) {
-  ArgumentMap argmap;
-  Context ctx = ff.config.lg_ctx;
-  Runtime *runtime = ff.config.lg_hlr;
-  parallel_is = outputs[0]->parallel_is;
-  assert(numOutputs == 1);
-  assert(numInputs == 1);
-  set_argumentmap_for_forward(ff, argmap);
-  IndexLauncher launcher(ALLREDUCE_FWD_TASK_ID,
-                         outputs[0]->parallel_is,
-                         TaskArgument(NULL, 0),
-                         argmap,
-                         Predicate::TRUE_PRED,
-                         false /*must*/,
-                         0 /*mapper_id*/,
-                         outputs[0]->machine_view.hash());
-  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    inputs[0]->region));
-  launcher.add_field(0, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
-                                                    0 /*projection id*/,
-                                                    WRITE_ONLY,
-                                                    EXCLUSIVE,
-                                                    outputs[0]->region));
-  launcher.add_field(1, FID_DATA);
-  runtime->execute_index_space(ctx, launcher);
+/*static*/
+void AllReduce::inference_task(Task const *task,
+                               std::vector<PhysicalRegion> const &regions,
+                               Context ctx,
+                               Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+
+  AllReduceMeta *m = *((AllReduceMeta **)task->local_args);
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_active_tokens() == 0) {
+    return;
+  }
+
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  assert(input.data_type == output.data_type);
+  inference_kernel_wrapper(m, bc, input, output);
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    AllReduce::save_inference_tensors_to_file(
+        m, shard_id, bc, {input}, {}, {output});
+  }
 }
 
-void AllReduce::backward(FFModel const &ff) {
+FutureMap AllReduce::peft_bwd(FFModel const &ff,
+                              BatchConfigFuture const &bc,
+                              std::vector<ParallelTensor> const &batch_inputs,
+                              std::vector<ParallelTensor> const &batch_outputs,
+                              MachineView const *mv) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
   Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
   assert(numOutputs == 1);
   assert(numInputs == 1);
-  IndexLauncher launcher(ALLREDUCE_BWD_TASK_ID,
-                         inputs[0]->parallel_is,
-                         TaskArgument(NULL, 0),
+  assert(batch_inputs[0]->data_type == batch_outputs[0]->data_type);
+  DataType data_type = batch_inputs[0]->data_type;
+  size_t machine_view_hash =
+      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher launcher(ALLREDUCE_PEFT_BWD_TASK_ID,
+                         batch_outputs[0]->parallel_is,
+                         TaskArgument(nullptr, 0),
                          argmap,
                          Predicate::TRUE_PRED,
                          false /*must*/,
                          0 /*mapper_id*/,
-                         inputs[0]->machine_view.hash());
-  launcher.add_region_requirement(RegionRequirement(inputs[0]->part_grad,
-                                                    0 /*projection id*/,
-                                                    READ_WRITE,
-                                                    EXCLUSIVE,
-                                                    inputs[0]->region_grad));
+                         machine_view_hash);
+  launcher.add_future(bc);
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[0]->part_grad,
+                        0 /*projection id*/,
+                        WRITE_ONLY,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region_grad));
   launcher.add_field(0, FID_DATA);
-  launcher.add_region_requirement(RegionRequirement(outputs[0]->part_grad,
-                                                    0 /*projection id*/,
-                                                    READ_ONLY,
-                                                    EXCLUSIVE,
-                                                    outputs[0]->region_grad));
+  launcher.add_region_requirement(
+      RegionRequirement(batch_outputs[0]->part_grad,
+                        0 /*projection id*/,
+                        READ_WRITE,
+                        EXCLUSIVE,
+                        batch_outputs[0]->region_grad));
   launcher.add_field(1, FID_DATA);
-  runtime->execute_index_space(ctx, launcher);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+/*static*/
+void AllReduce::peft_bwd_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+
+  AllReduceMeta *m = *((AllReduceMeta **)task->local_args);
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_active_peft_tokens() == 0) {
+    return;
+  }
+  GenericTensorAccessorW input_grad = helperGetGenericTensorAccessorRW(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR output_grad = helperGetGenericTensorAccessorRO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  assert(input_grad.data_type == output_grad.data_type);
+  peft_bwd_kernel_wrapper(m, bc, input_grad, output_grad);
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    AllReduce::save_inference_tensors_to_file(
+        m, shard_id, bc, {input_grad}, {}, {output_grad}, false);
+  }
 }
 
 bool AllReduce::measure_operator_cost(Simulator *sim,
@@ -318,62 +455,6 @@ bool AllReduce::append_parallel_op_info(
   return true;
 }
 
-/*static*/
-void AllReduce::inference_task(Task const *task,
-                               std::vector<PhysicalRegion> const &regions,
-                               Context ctx,
-                               Runtime *runtime) {
-  assert(regions.size() == 2);
-  assert(task->regions.size() == 2);
-
-  AllReduceMeta const *m = *((AllReduceMeta **)task->local_args);
-  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
-
-  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
-      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
-      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
-
-  assert(input.data_type == output.data_type);
-  inference_kernel_wrapper(m, bc, input, output);
-}
-
-/*static*/
-void AllReduce::forward_task(Task const *task,
-                             std::vector<PhysicalRegion> const &regions,
-                             Context ctx,
-                             Runtime *runtime) {
-  assert(regions.size() == 2);
-  assert(task->regions.size() == 2);
-
-  AllReduceMeta const *m = *((AllReduceMeta **)task->local_args);
-
-  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
-      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
-      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
-
-  assert(input.data_type == output.data_type);
-  forward_kernel_wrapper(m, input, output);
-}
-
-void AllReduce::backward_task(Task const *task,
-                              std::vector<PhysicalRegion> const &regions,
-                              Context ctx,
-                              Runtime *runtime) {
-  assert(regions.size() == 2);
-  assert(task->regions.size() == 2);
-  AllReduceMeta const *m = *((AllReduceMeta **)task->local_args);
-
-  GenericTensorAccessorW input_grad = helperGetGenericTensorAccessorRW(
-      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
-  GenericTensorAccessorR output_grad = helperGetGenericTensorAccessorRO(
-      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
-
-  assert(input_grad.data_type == output_grad.data_type);
-  backward_kernel_wrapper(m, input_grad, output_grad);
-}
-
 }; // namespace FlexFlow
 
 namespace std {
diff --git a/src/parallel_ops/combine.cc b/src/parallel_ops/combine.cc
index acc5c414c7..ce9c032350 100644
--- a/src/parallel_ops/combine.cc
+++ b/src/parallel_ops/combine.cc
@@ -44,7 +44,8 @@ using namespace FlexFlow::Kernels::Combine;
 /* Params */
 bool operator==(CombineParams const &lhs, CombineParams const &rhs) {
   return lhs.combine_legion_dim == rhs.combine_legion_dim &&
-         lhs.combine_degree == rhs.combine_degree;
+         lhs.combine_degree == rhs.combine_degree &&
+         std::strcmp(lhs.name, rhs.name) == 0;
 }
 
 bool CombineParams::is_valid(ParallelTensorShape const &input) const {
@@ -58,7 +59,7 @@ CombineParams Combine::get_params() const {
   CombineParams params;
   params.combine_legion_dim = this->combine_dim;
   params.combine_degree = this->combine_degree;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
@@ -102,10 +103,11 @@ OpMeta *Combine::init_task(Task const *task,
                            Runtime *runtime) {
   Combine *cmb = (Combine *)task->args;
   FFHandler handle = *((FFHandler *)task->local_args);
-  CombineMeta *m = new CombineMeta(handle);
+  CombineMeta *m = new CombineMeta(handle, cmb);
   m->input_type[0] = cmb->inputs[0]->data_type;
   m->output_type[0] = cmb->outputs[0]->data_type;
   assert(m->input_type[0] == m->output_type[0]);
+  std::strcpy(m->op_name, cmb->name);
   return m;
 }
 
@@ -202,12 +204,23 @@ void Combine::create_input_partition_inference(
   assert(ff.config.computationMode == COMP_MODE_INFERENCE);
   assert(batch_outputs[0]->part != LogicalPartition::NO_PART);
   assert(batch_inputs[0]->part != LogicalPartition::NO_PART);
-  // input_lp is a disjoint partition
+  // partition batch_inputs[0]->region into inference_input_lps[batch_inputs[0]]
+  // according to the partitioning of batch_outputs[0] (i.e. make the
+  // partitioned dimension whole again by combining the partitions)
   ff.create_disjoint_partition(batch_outputs[0]->num_dims,
                                batch_outputs[0]->dims,
                                batch_outputs[0]->parallel_is,
                                batch_inputs[0]->region,
                                inference_input_lps[batch_inputs[0]]);
+  // partition batch_outputs[0]->region_grad into
+  // inference_output_grad_lps[batch_outputs[0]] according to the partitioning
+  // of batch_inputs[0] (i.e. restore the partition in the dimension that was
+  // combined in the forward pass)
+  ff.create_disjoint_partition(batch_inputs[0]->num_dims,
+                               batch_inputs[0]->dims,
+                               batch_inputs[0]->parallel_is,
+                               batch_outputs[0]->region_grad,
+                               inference_output_grad_lps[batch_outputs[0]]);
 }
 
 FutureMap Combine::inference(FFModel const &ff,
@@ -226,7 +239,7 @@ FutureMap Combine::inference(FFModel const &ff,
   size_t machine_view_hash =
       mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
   set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
-  IndexLauncher launcher(COMBINE_FWD_TASK_ID,
+  IndexLauncher launcher(COMBINE_INF_TASK_ID,
                          batch_outputs[0]->parallel_is,
                          TaskArgument(nullptr, 0),
                          argmap,
@@ -234,6 +247,7 @@ FutureMap Combine::inference(FFModel const &ff,
                          false /*must*/,
                          0 /*mapper_id*/,
                          machine_view_hash);
+  launcher.add_future(bc);
   launcher.add_region_requirement(
       RegionRequirement(inference_input_lps[batch_inputs[0]],
                         0 /*projection id*/,
@@ -278,6 +292,52 @@ void Combine::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
+FutureMap Combine::peft_bwd(FFModel const &ff,
+                            BatchConfigFuture const &bc,
+                            std::vector<ParallelTensor> const &batch_inputs,
+                            std::vector<ParallelTensor> const &batch_outputs,
+                            MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  assert(batch_inputs[0]->data_type == batch_outputs[0]->data_type);
+  DataType data_type = inputs[0]->data_type;
+
+  // Warning: we need to use batch_inputs[0] here, instead of the usual
+  // batch_outputs[0]
+  parallel_is = batch_inputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_inputs[0]->machine_view;
+
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+  IndexLauncher launcher(COMBINE_PEFT_BWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(&data_type, sizeof(DataType)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
+  launcher.add_region_requirement(
+      RegionRequirement(inference_output_grad_lps[batch_outputs[0]],
+                        0 /*projection id*/,
+                        READ_WRITE,
+                        EXCLUSIVE,
+                        batch_outputs[0]->region_grad));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[0]->part_grad,
+                        0 /*projection id*/,
+                        WRITE_ONLY,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region_grad));
+  launcher.add_field(1, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
 void Combine::backward(FFModel const &ff) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
@@ -357,6 +417,37 @@ tl::optional<RecordFormatter> Combine::as_dot() const {
   return rf;
 }
 
+/*static*/
+void Combine::inference_task(Task const *task,
+                             std::vector<PhysicalRegion> const &regions,
+                             Context ctx,
+                             Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+  CombineMeta const *m = *((CombineMeta **)task->local_args);
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_active_tokens() == 0) {
+    return;
+  }
+  DataType data_type = m->input_type[0];
+  if (m->inference_debugging) {
+    std::cout << "INF " << m->op_name << std::endl;
+  }
+  if (data_type == DT_HALF) {
+    forward_task_with_type<half>(task, regions, ctx, runtime);
+  } else if (data_type == DT_FLOAT) {
+    forward_task_with_type<float>(task, regions, ctx, runtime);
+  } else if (data_type == DT_DOUBLE) {
+    forward_task_with_type<double>(task, regions, ctx, runtime);
+  } else if (data_type == DT_INT32) {
+    forward_task_with_type<int32_t>(task, regions, ctx, runtime);
+  } else if (data_type == DT_INT64) {
+    forward_task_with_type<int64_t>(task, regions, ctx, runtime);
+  } else {
+    assert(false && "Unsupported data type in Combine forward");
+  }
+}
+
 /*static*/
 void Combine::forward_task(Task const *task,
                            std::vector<PhysicalRegion> const &regions,
@@ -400,6 +491,56 @@ void Combine::forward_task_with_type(Task const *task,
   forward_kernel<DT>(input_ptr, output_ptr, output_domain.get_volume());
 }
 
+void Combine::peft_bwd_task(Task const *task,
+                            std::vector<PhysicalRegion> const &regions,
+                            Context ctx,
+                            Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+  // CombineMeta const *m = *((CombineMeta **)task->local_args);
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_active_peft_tokens() == 0) {
+    return;
+  }
+  // TODO: figure out why m->output_type[0] or m->input_type[0] are not working
+  DataType data_type = *((DataType *)task->args);
+  GenericTensorAccessorR output_grad = helperGetGenericTensorAccessorRO(
+      data_type, regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW input_grad = helperGetGenericTensorAccessorRW(
+      data_type, regions[1], task->regions[1], FID_DATA, ctx, runtime);
+  assert(input_grad.data_type == data_type);
+  assert(output_grad.domain == input_grad.domain);
+  CombineMeta const *m = *((CombineMeta **)task->local_args);
+  int shard_id = task->index_point.point_data[0];
+  if (shard_id == 0 && m->inference_debugging) {
+    // m is null when shard_id > 0 for some reason
+    std::cout << "BWD " << m->op_name << std::endl;
+  }
+  if (data_type == DT_HALF) {
+    backward_kernel<half>(output_grad.get_half_ptr(),
+                          input_grad.get_half_ptr(),
+                          output_grad.domain.get_volume());
+  } else if (data_type == DT_FLOAT) {
+    backward_kernel<float>(output_grad.get_float_ptr(),
+                           input_grad.get_float_ptr(),
+                           output_grad.domain.get_volume());
+  } else if (data_type == DT_DOUBLE) {
+    backward_kernel<double>(output_grad.get_double_ptr(),
+                            input_grad.get_double_ptr(),
+                            output_grad.domain.get_volume());
+  } else if (data_type == DT_INT32) {
+    backward_kernel<int32_t>(output_grad.get_int32_ptr(),
+                             input_grad.get_int32_ptr(),
+                             output_grad.domain.get_volume());
+  } else if (data_type == DT_INT64) {
+    backward_kernel<int64_t>(output_grad.get_int64_ptr(),
+                             input_grad.get_int64_ptr(),
+                             output_grad.domain.get_volume());
+  } else {
+    assert(false && "Unsupported data type in Combine backward");
+  }
+}
+
 void Combine::backward_task(Task const *task,
                             std::vector<PhysicalRegion> const &regions,
                             Context ctx,
diff --git a/src/parallel_ops/fused_parallel_op.cc b/src/parallel_ops/fused_parallel_op.cc
index 1a76cbfc40..dec7b20fb2 100644
--- a/src/parallel_ops/fused_parallel_op.cc
+++ b/src/parallel_ops/fused_parallel_op.cc
@@ -59,7 +59,7 @@ FusedParallelOpParams FusedParallelOp::get_params() const {
   std::vector<ParallelOpInfo> ops(std::begin(this->parallel_ops),
                                   std::end(this->parallel_ops));
   params.parallel_ops = ops;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
diff --git a/src/parallel_ops/kernels/allreduce_kernels.cpp b/src/parallel_ops/kernels/allreduce_kernels.cpp
index 8d7e20e395..7067035465 100644
--- a/src/parallel_ops/kernels/allreduce_kernels.cpp
+++ b/src/parallel_ops/kernels/allreduce_kernels.cpp
@@ -20,26 +20,23 @@
 namespace FlexFlow {
 
 AllReduceMeta::AllReduceMeta(FFHandler handle, AllReduce const *reduct)
-    : OpMeta(handle) {}
+    : OpMeta(handle, reduct) {}
 
 namespace Kernels {
 namespace AllReduce {
 
-void inference_kernel_wrapper(AllReduceMeta const *m,
-                              BatchConfig const *bc,
-                              GenericTensorAccessorR const &input,
-                              GenericTensorAccessorW const &output) {
+void forward_kernel_wrapper(AllReduceMeta const *m,
+                            GenericTensorAccessorR const &input,
+                            GenericTensorAccessorW const &output) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   assert(input.data_type == output.data_type);
   assert(input.domain == output.domain);
-  size_t hidden_dim_size = input.domain.hi()[0] - input.domain.lo()[0] + 1;
-  size_t num_elements = bc->num_tokens * hidden_dim_size;
 #ifdef FF_USE_NCCL
   ncclDataType_t nccl_data_type = ff_to_nccl_datatype(input.data_type);
   checkNCCL(ncclAllReduce(input.ptr,
                           output.ptr,
-                          num_elements,
+                          input.domain.get_volume(),
                           nccl_data_type,
                           ncclSum,
                           m->handle.ncclComm,
@@ -49,19 +46,27 @@ void inference_kernel_wrapper(AllReduceMeta const *m,
 #endif
 }
 
-void forward_kernel_wrapper(AllReduceMeta const *m,
-                            GenericTensorAccessorR const &input,
-                            GenericTensorAccessorW const &output) {
+void backward_kernel_wrapper(AllReduceMeta const *m,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &output_grad) {
+  assert(false && "To be implemented");
+}
+
+void inference_kernel_wrapper(AllReduceMeta const *m,
+                              BatchConfig const *bc,
+                              GenericTensorAccessorR const &input,
+                              GenericTensorAccessorW const &output) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   assert(input.data_type == output.data_type);
   assert(input.domain == output.domain);
   size_t hidden_dim_size = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+  size_t num_elements = bc->num_active_tokens() * hidden_dim_size;
 #ifdef FF_USE_NCCL
   ncclDataType_t nccl_data_type = ff_to_nccl_datatype(input.data_type);
   checkNCCL(ncclAllReduce(input.ptr,
                           output.ptr,
-                          input.domain.get_volume(),
+                          num_elements,
                           nccl_data_type,
                           ncclSum,
                           m->handle.ncclComm,
@@ -71,10 +76,29 @@ void forward_kernel_wrapper(AllReduceMeta const *m,
 #endif
 }
 
-void backward_kernel_wrapper(AllReduceMeta const *m,
+void peft_bwd_kernel_wrapper(AllReduceMeta const *m,
+                             BatchConfig const *bc,
                              GenericTensorAccessorW const &input_grad,
                              GenericTensorAccessorR const &output_grad) {
-  assert(false && "To be implemented");
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  assert(input_grad.data_type == output_grad.data_type);
+  assert(input_grad.domain == output_grad.domain);
+  size_t hidden_dim_size =
+      input_grad.domain.hi()[0] - input_grad.domain.lo()[0] + 1;
+  size_t num_elements = bc->num_active_tokens() * hidden_dim_size;
+#ifdef FF_USE_NCCL
+  ncclDataType_t nccl_data_type = ff_to_nccl_datatype(input_grad.data_type);
+  checkNCCL(ncclAllReduce(output_grad.ptr,
+                          input_grad.ptr,
+                          num_elements,
+                          nccl_data_type,
+                          ncclSum,
+                          m->handle.ncclComm,
+                          stream));
+#else
+  assert(false && "Must enable FF_USE_NCCL to use AllReduce operators");
+#endif
 }
 
 } // namespace AllReduce
diff --git a/src/parallel_ops/kernels/allreduce_kernels.cu b/src/parallel_ops/kernels/allreduce_kernels.cu
index 2c000137a1..3041f9adf9 100644
--- a/src/parallel_ops/kernels/allreduce_kernels.cu
+++ b/src/parallel_ops/kernels/allreduce_kernels.cu
@@ -13,32 +13,30 @@
  * limitations under the License.
  */
 
+#include "flexflow/ffconst_utils.h"
 #include "flexflow/parallel_ops/kernels/allreduce_kernels.h"
 #include "flexflow/utils/cuda_helper.h"
 
 namespace FlexFlow {
 
 AllReduceMeta::AllReduceMeta(FFHandler handle, AllReduce const *reduct)
-    : OpMeta(handle) {}
+    : OpMeta(handle, reduct) {}
 
 namespace Kernels {
 namespace AllReduce {
 
-void inference_kernel_wrapper(AllReduceMeta const *m,
-                              BatchConfig const *bc,
-                              GenericTensorAccessorR const &input,
-                              GenericTensorAccessorW const &output) {
+void forward_kernel_wrapper(AllReduceMeta const *m,
+                            GenericTensorAccessorR const &input,
+                            GenericTensorAccessorW const &output) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   assert(input.data_type == output.data_type);
   assert(input.domain == output.domain);
-  size_t hidden_dim_size = input.domain.hi()[0] - input.domain.lo()[0] + 1;
-  size_t num_elements = bc->num_tokens * hidden_dim_size;
 #ifdef FF_USE_NCCL
   ncclDataType_t nccl_data_type = ff_to_nccl_datatype(input.data_type);
   checkNCCL(ncclAllReduce(input.ptr,
                           output.ptr,
-                          num_elements,
+                          input.domain.get_volume(),
                           nccl_data_type,
                           ncclSum,
                           m->handle.ncclComm,
@@ -48,18 +46,27 @@ void inference_kernel_wrapper(AllReduceMeta const *m,
 #endif
 }
 
-void forward_kernel_wrapper(AllReduceMeta const *m,
-                            GenericTensorAccessorR const &input,
-                            GenericTensorAccessorW const &output) {
+void backward_kernel_wrapper(AllReduceMeta const *m,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &output_grad) {
+  assert(false && "To be implemented");
+}
+
+void inference_kernel_wrapper(AllReduceMeta const *m,
+                              BatchConfig const *bc,
+                              GenericTensorAccessorR const &input,
+                              GenericTensorAccessorW const &output) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   assert(input.data_type == output.data_type);
   assert(input.domain == output.domain);
+  size_t hidden_dim_size = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+  size_t num_elements = bc->num_active_tokens() * hidden_dim_size;
 #ifdef FF_USE_NCCL
   ncclDataType_t nccl_data_type = ff_to_nccl_datatype(input.data_type);
   checkNCCL(ncclAllReduce(input.ptr,
                           output.ptr,
-                          input.domain.get_volume(),
+                          num_elements,
                           nccl_data_type,
                           ncclSum,
                           m->handle.ncclComm,
@@ -69,10 +76,23 @@ void forward_kernel_wrapper(AllReduceMeta const *m,
 #endif
 }
 
-void backward_kernel_wrapper(AllReduceMeta const *m,
+void peft_bwd_kernel_wrapper(AllReduceMeta const *m,
+                             BatchConfig const *bc,
                              GenericTensorAccessorW const &input_grad,
                              GenericTensorAccessorR const &output_grad) {
-  assert(false && "To be implemented");
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  assert(input_grad.data_type == output_grad.data_type);
+  assert(input_grad.domain == output_grad.domain);
+  size_t hidden_dim_size =
+      input_grad.domain.hi()[0] - input_grad.domain.lo()[0] + 1;
+  size_t num_elements = bc->num_active_tokens();
+  size_t data_size = data_type_size(output_grad.data_type);
+  checkCUDA(cudaMemcpyAsync(input_grad.ptr,
+                            output_grad.ptr,
+                            hidden_dim_size * num_elements * data_size,
+                            cudaMemcpyDeviceToDevice,
+                            stream));
 }
 
 } // namespace AllReduce
diff --git a/src/parallel_ops/kernels/combine_kernels.cpp b/src/parallel_ops/kernels/combine_kernels.cpp
index d6e9568223..2a29be1ad4 100644
--- a/src/parallel_ops/kernels/combine_kernels.cpp
+++ b/src/parallel_ops/kernels/combine_kernels.cpp
@@ -14,12 +14,14 @@
  */
 
 #include "flexflow/parallel_ops/kernels/combine_kernels.h"
+#include "flexflow/parallel_ops/combine.h"
 #include "flexflow/utils/hip_helper.h"
 #include <hip/hip_runtime.h>
 
 namespace FlexFlow {
 
-CombineMeta::CombineMeta(FFHandler handler) : OpMeta(handler) {}
+CombineMeta::CombineMeta(FFHandler handler, Combine const *comb)
+    : OpMeta(handler, comb) {}
 
 namespace Kernels {
 namespace Combine {
diff --git a/src/parallel_ops/kernels/combine_kernels.cu b/src/parallel_ops/kernels/combine_kernels.cu
index 1ab79a7944..5809e2d4f3 100644
--- a/src/parallel_ops/kernels/combine_kernels.cu
+++ b/src/parallel_ops/kernels/combine_kernels.cu
@@ -13,12 +13,14 @@
  * limitations under the License.
  */
 
+#include "flexflow/parallel_ops/combine.h"
 #include "flexflow/parallel_ops/kernels/combine_kernels.h"
 #include "flexflow/utils/cuda_helper.h"
 
 namespace FlexFlow {
 
-CombineMeta::CombineMeta(FFHandler handler) : OpMeta(handler) {}
+CombineMeta::CombineMeta(FFHandler handler, Combine const *comb)
+    : OpMeta(handler, comb) {}
 
 namespace Kernels {
 namespace Combine {
diff --git a/src/parallel_ops/kernels/parallel_identity_kernels.cpp b/src/parallel_ops/kernels/parallel_identity_kernels.cpp
new file mode 100644
index 0000000000..8378231fb2
--- /dev/null
+++ b/src/parallel_ops/kernels/parallel_identity_kernels.cpp
@@ -0,0 +1,97 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/parallel_ops/kernels/parallel_identity_kernels.h"
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/utils/hip_helper.h"
+#include <hip/hip_runtime.h>
+
+namespace FlexFlow {
+
+ParallelIdentityMeta::ParallelIdentityMeta(FFHandler handle,
+                                           ParallelIdentity const *reduct)
+    : OpMeta(handle, reduct) {}
+
+namespace Kernels {
+namespace ParallelIdentity {
+
+void forward_kernel_wrapper(ParallelIdentityMeta const *m,
+                            GenericTensorAccessorR const &input,
+                            GenericTensorAccessorW const &output) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  assert(input.data_type == output.data_type);
+  assert(input.domain == output.domain);
+  size_t data_size = data_type_size(input.data_type);
+  // copy input to output
+  checkCUDA(hipMemcpyAsync(output.ptr,
+                           input.ptr,
+                           input.domain.get_volume() * data_size,
+                           hipMemcpyDeviceToDevice,
+                           stream));
+}
+
+void backward_kernel_wrapper(ParallelIdentityMeta const *m,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &output_grad) {
+  assert(false && "To be implemented");
+}
+
+void inference_kernel_wrapper(ParallelIdentityMeta const *m,
+                              BatchConfig const *bc,
+                              GenericTensorAccessorR const &input,
+                              GenericTensorAccessorW const &output) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  assert(input.data_type == output.data_type);
+  assert(input.domain == output.domain);
+  size_t hidden_dim_size = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+  size_t num_elements = bc->num_active_tokens();
+  size_t data_size = data_type_size(input.data_type);
+  checkCUDA(hipMemcpyAsync(output.ptr,
+                           input.ptr,
+                           hidden_dim_size * num_elements * data_size,
+                           hipMemcpyDeviceToDevice,
+                           stream));
+}
+
+void peft_bwd_kernel_wrapper(ParallelIdentityMeta const *m,
+                             BatchConfig const *bc,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &output_grad) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  assert(input_grad.data_type == output_grad.data_type);
+  assert(input_grad.domain == output_grad.domain);
+  size_t hidden_dim_size =
+      input_grad.domain.hi()[0] - input_grad.domain.lo()[0] + 1;
+  size_t num_elements = bc->num_active_tokens() * hidden_dim_size;
+#ifdef FF_USE_NCCL
+  ncclDataType_t nccl_data_type = ff_to_nccl_datatype(input_grad.data_type);
+  checkNCCL(ncclAllReduce(output_grad.ptr,
+                          input_grad.ptr,
+                          num_elements,
+                          nccl_data_type,
+                          ncclSum,
+                          m->handle.ncclComm,
+                          stream));
+#else
+  assert(false && "Must enable FF_USE_NCCL to use ParallelIdentity operators");
+#endif
+}
+
+} // namespace ParallelIdentity
+} // namespace Kernels
+} // namespace FlexFlow
diff --git a/src/parallel_ops/kernels/parallel_identity_kernels.cu b/src/parallel_ops/kernels/parallel_identity_kernels.cu
new file mode 100644
index 0000000000..6800f3ab16
--- /dev/null
+++ b/src/parallel_ops/kernels/parallel_identity_kernels.cu
@@ -0,0 +1,96 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/parallel_ops/kernels/parallel_identity_kernels.h"
+#include "flexflow/utils/cuda_helper.h"
+
+namespace FlexFlow {
+
+ParallelIdentityMeta::ParallelIdentityMeta(FFHandler handle,
+                                           ParallelIdentity const *reduct)
+    : OpMeta(handle, reduct) {}
+
+namespace Kernels {
+namespace ParallelIdentity {
+
+void forward_kernel_wrapper(ParallelIdentityMeta const *m,
+                            GenericTensorAccessorR const &input,
+                            GenericTensorAccessorW const &output) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  assert(input.data_type == output.data_type);
+  assert(input.domain == output.domain);
+  size_t data_size = data_type_size(input.data_type);
+  // copy input to output
+  checkCUDA(cudaMemcpyAsync(output.ptr,
+                            input.ptr,
+                            input.domain.get_volume() * data_size,
+                            cudaMemcpyDeviceToDevice,
+                            stream));
+}
+
+void backward_kernel_wrapper(ParallelIdentityMeta const *m,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &output_grad) {
+  assert(false && "To be implemented");
+}
+
+void inference_kernel_wrapper(ParallelIdentityMeta const *m,
+                              BatchConfig const *bc,
+                              GenericTensorAccessorR const &input,
+                              GenericTensorAccessorW const &output) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  assert(input.data_type == output.data_type);
+  assert(input.domain == output.domain);
+  size_t hidden_dim_size = input.domain.hi()[0] - input.domain.lo()[0] + 1;
+  size_t num_elements = bc->num_active_tokens();
+  size_t data_size = data_type_size(input.data_type);
+  checkCUDA(cudaMemcpyAsync(output.ptr,
+                            input.ptr,
+                            hidden_dim_size * num_elements * data_size,
+                            cudaMemcpyDeviceToDevice,
+                            stream));
+}
+
+void peft_bwd_kernel_wrapper(ParallelIdentityMeta const *m,
+                             BatchConfig const *bc,
+                             GenericTensorAccessorW const &input_grad,
+                             GenericTensorAccessorR const &output_grad) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  assert(input_grad.data_type == output_grad.data_type);
+  assert(input_grad.domain == output_grad.domain);
+  size_t hidden_dim_size =
+      input_grad.domain.hi()[0] - input_grad.domain.lo()[0] + 1;
+  size_t num_elements = bc->num_active_tokens() * hidden_dim_size;
+#ifdef FF_USE_NCCL
+  ncclDataType_t nccl_data_type = ff_to_nccl_datatype(input_grad.data_type);
+  checkNCCL(ncclAllReduce(output_grad.ptr,
+                          input_grad.ptr,
+                          num_elements,
+                          nccl_data_type,
+                          ncclSum,
+                          m->handle.ncclComm,
+                          stream));
+#else
+  assert(false && "Must enable FF_USE_NCCL to use ParallelIdentity operators");
+#endif
+}
+
+} // namespace ParallelIdentity
+} // namespace Kernels
+} // namespace FlexFlow
diff --git a/src/parallel_ops/kernels/partition_kernels.cpp b/src/parallel_ops/kernels/partition_kernels.cpp
index cfd76c0f18..bd1c96d4c7 100644
--- a/src/parallel_ops/kernels/partition_kernels.cpp
+++ b/src/parallel_ops/kernels/partition_kernels.cpp
@@ -14,12 +14,14 @@
  */
 
 #include "flexflow/parallel_ops/kernels/partition_kernels.h"
+#include "flexflow/parallel_ops/partition.h"
 #include "flexflow/utils/hip_helper.h"
 #include <hip/hip_runtime.h>
 
 namespace FlexFlow {
 
-RepartitionMeta::RepartitionMeta(FFHandler handler) : OpMeta(handler) {}
+RepartitionMeta::RepartitionMeta(FFHandler handler, Repartition const *repart)
+    : OpMeta(handler, repart) {}
 
 namespace Kernels {
 namespace Repartition {
diff --git a/src/parallel_ops/kernels/partition_kernels.cu b/src/parallel_ops/kernels/partition_kernels.cu
index 08008f1035..3a39b39fe4 100644
--- a/src/parallel_ops/kernels/partition_kernels.cu
+++ b/src/parallel_ops/kernels/partition_kernels.cu
@@ -14,11 +14,13 @@
  */
 
 #include "flexflow/parallel_ops/kernels/partition_kernels.h"
+#include "flexflow/parallel_ops/partition.h"
 #include "flexflow/utils/cuda_helper.h"
 
 namespace FlexFlow {
 
-RepartitionMeta::RepartitionMeta(FFHandler handler) : OpMeta(handler) {}
+RepartitionMeta::RepartitionMeta(FFHandler handler, Repartition const *repart)
+    : OpMeta(handler, repart) {}
 
 namespace Kernels {
 namespace Repartition {
diff --git a/src/parallel_ops/kernels/reduction_kernels.cpp b/src/parallel_ops/kernels/reduction_kernels.cpp
index 2a3fe5cca1..1f3e8e0962 100644
--- a/src/parallel_ops/kernels/reduction_kernels.cpp
+++ b/src/parallel_ops/kernels/reduction_kernels.cpp
@@ -20,7 +20,7 @@
 namespace FlexFlow {
 
 ReductionMeta::ReductionMeta(FFHandler handle, Reduction const *reduct)
-    : OpMeta(handle) {}
+    : OpMeta(handle, reduct) {}
 
 namespace Kernels {
 namespace Reduction {
diff --git a/src/parallel_ops/kernels/reduction_kernels.cu b/src/parallel_ops/kernels/reduction_kernels.cu
index 34ae8007da..df7630976b 100644
--- a/src/parallel_ops/kernels/reduction_kernels.cu
+++ b/src/parallel_ops/kernels/reduction_kernels.cu
@@ -19,7 +19,7 @@
 namespace FlexFlow {
 
 ReductionMeta::ReductionMeta(FFHandler handle, Reduction const *reduct)
-    : OpMeta(handle) {}
+    : OpMeta(handle, reduct) {}
 
 namespace Kernels {
 namespace Reduction {
diff --git a/src/parallel_ops/kernels/replicate_kernels.cpp b/src/parallel_ops/kernels/replicate_kernels.cpp
index 1647f014be..f49e0d4eb0 100644
--- a/src/parallel_ops/kernels/replicate_kernels.cpp
+++ b/src/parallel_ops/kernels/replicate_kernels.cpp
@@ -20,7 +20,7 @@
 namespace FlexFlow {
 
 ReplicateMeta::ReplicateMeta(FFHandler handle, Replicate const *repl)
-    : OpMeta(handle) {}
+    : OpMeta(handle, repl) {}
 
 namespace Kernels {
 namespace Replicate {
diff --git a/src/parallel_ops/kernels/replicate_kernels.cu b/src/parallel_ops/kernels/replicate_kernels.cu
index 35bc109bd3..0b5c434aa6 100644
--- a/src/parallel_ops/kernels/replicate_kernels.cu
+++ b/src/parallel_ops/kernels/replicate_kernels.cu
@@ -19,7 +19,7 @@
 namespace FlexFlow {
 
 ReplicateMeta::ReplicateMeta(FFHandler handle, Replicate const *repl)
-    : OpMeta(handle) {}
+    : OpMeta(handle, repl) {}
 
 namespace Kernels {
 namespace Replicate {
diff --git a/src/parallel_ops/parallel_identity.cc b/src/parallel_ops/parallel_identity.cc
new file mode 100644
index 0000000000..883910ae09
--- /dev/null
+++ b/src/parallel_ops/parallel_identity.cc
@@ -0,0 +1,474 @@
+/* Copyright 2023 CMU, Facebook, LANL, MIT, NVIDIA, and Stanford (alphabetical)
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+#include "flexflow/parallel_ops/parallel_identity.h"
+#include "flexflow/ffconst_utils.h"
+#include "flexflow/model.h"
+#include "flexflow/parallel_ops/kernels/parallel_identity_kernels.h"
+#include "flexflow/utils/hash_utils.h"
+
+namespace FlexFlow {
+// declare Legion names
+using Legion::ArgumentMap;
+using Legion::Context;
+using Legion::coord_t;
+using Legion::Domain;
+using Legion::Future;
+using Legion::FutureMap;
+using Legion::IndexLauncher;
+using Legion::LogicalPartition;
+using Legion::LogicalRegion;
+using Legion::Machine;
+using Legion::Memory;
+using Legion::PhysicalRegion;
+using Legion::Predicate;
+using Legion::Rect;
+using Legion::RegionRequirement;
+using Legion::Runtime;
+using Legion::Task;
+using Legion::TaskArgument;
+using Legion::TaskLauncher;
+
+using namespace FlexFlow::Kernels::ParallelIdentity;
+
+/* Params */
+bool operator==(ParallelIdentityParams const &lhs,
+                ParallelIdentityParams const &rhs) {
+  return lhs.parallel_identity_legion_dim == rhs.parallel_identity_legion_dim &&
+         std::strcmp(lhs.name, rhs.name) == 0;
+}
+
+bool ParallelIdentityParams::is_valid(ParallelTensorShape const &input) const {
+  return input.is_valid();
+}
+
+ParallelIdentityParams ParallelIdentity::get_params() const {
+  ParallelIdentityParams params;
+  params.parallel_identity_legion_dim = this->parallel_identity_dim;
+  if (strlen(this->name) < MAX_OPNAME) {
+    strcpy(params.name, this->name);
+  }
+  return params;
+}
+
+ParallelIdentity::ParallelIdentity(FFModel &model,
+                                   const ParallelTensor _input,
+                                   int _parallel_identity_legion_dim,
+                                   char const *name)
+    : ParallelOp(model, OP_PARALLEL_IDENTITY, name, _input),
+      parallel_identity_dim(_parallel_identity_legion_dim) {
+  int numdim = _input->num_dims;
+  ParallelDim dims[MAX_TENSOR_DIM];
+  for (int i = 0; i < numdim; i++) {
+    dims[i] = _input->dims[i];
+  }
+  assert(dims[parallel_identity_dim].degree > 1);
+  // ParallelTensorBase::update_parallel_ids(numdim, dims);
+  outputs[0] = model.create_parallel_tensor_legion_ordering(
+      numdim, dims, _input->data_type, this);
+}
+
+ParallelIdentity::ParallelIdentity(FFModel &model,
+                                   ParallelIdentityParams const &params,
+                                   ParallelTensor const input,
+                                   char const *name)
+    : ParallelIdentity(
+          model, input, params.parallel_identity_legion_dim, params.name) {}
+
+void ParallelIdentity::create_input_partition(FFModel &ff) {
+  // Do nothing
+  return;
+}
+
+void ParallelIdentity::create_input_partition_inference(
+    FFModel &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs) {
+  assert(ff.config.computationMode == COMP_MODE_INFERENCE);
+  assert(batch_outputs[0]->part != LogicalPartition::NO_PART);
+  assert(batch_inputs[0]->part != LogicalPartition::NO_PART);
+  // Do nothing
+  return;
+}
+
+OpMeta *ParallelIdentity::init_task(Task const *task,
+                                    std::vector<PhysicalRegion> const &regions,
+                                    Context ctx,
+                                    Runtime *runtime) {
+  ParallelIdentity *ar = (ParallelIdentity *)task->args;
+  FFHandler handle = *((FFHandler const *)task->local_args);
+  ParallelIdentityMeta *meta = new ParallelIdentityMeta(handle, ar);
+  meta->input_type[0] = ar->inputs[0]->data_type;
+  meta->output_type[0] = ar->outputs[0]->data_type;
+  assert(meta->input_type[0] == meta->output_type[0]);
+  std::strcpy(meta->op_name, ar->name);
+  return meta;
+}
+
+void ParallelIdentity::init(FFModel const &ff) {
+  ArgumentMap argmap;
+  parallel_is = outputs[0]->parallel_is;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  set_argumentmap_for_init(ff, argmap);
+  IndexLauncher launcher(PARALLEL_IDENTITY_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(ParallelIdentity)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap(ff, fm);
+}
+
+void ParallelIdentity::forward(FFModel const &ff) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = outputs[0]->parallel_is;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  set_argumentmap_for_forward(ff, argmap);
+  IndexLauncher launcher(PARALLEL_IDENTITY_FWD_TASK_ID,
+                         outputs[0]->parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         outputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  runtime->execute_index_space(ctx, launcher);
+}
+
+/*static*/
+void ParallelIdentity::forward_task(Task const *task,
+                                    std::vector<PhysicalRegion> const &regions,
+                                    Context ctx,
+                                    Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+
+  ParallelIdentityMeta const *m = *((ParallelIdentityMeta **)task->local_args);
+
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  assert(input.data_type == output.data_type);
+  forward_kernel_wrapper(m, input, output);
+}
+
+void ParallelIdentity::backward(FFModel const &ff) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  IndexLauncher launcher(PARALLEL_IDENTITY_BWD_TASK_ID,
+                         inputs[0]->parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         inputs[0]->machine_view.hash());
+  launcher.add_region_requirement(RegionRequirement(inputs[0]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_WRITE,
+                                                    EXCLUSIVE,
+                                                    inputs[0]->region_grad));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(outputs[0]->part_grad,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    outputs[0]->region_grad));
+  launcher.add_field(1, FID_DATA);
+  runtime->execute_index_space(ctx, launcher);
+}
+
+void ParallelIdentity::backward_task(Task const *task,
+                                     std::vector<PhysicalRegion> const &regions,
+                                     Context ctx,
+                                     Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+  ParallelIdentityMeta const *m = *((ParallelIdentityMeta **)task->local_args);
+
+  GenericTensorAccessorW input_grad = helperGetGenericTensorAccessorRW(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR output_grad = helperGetGenericTensorAccessorRO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  assert(input_grad.data_type == output_grad.data_type);
+  backward_kernel_wrapper(m, input_grad, output_grad);
+}
+
+void ParallelIdentity::init_inference(
+    FFModel const &ff,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  ArgumentMap argmap;
+  parallel_is = batch_outputs[0]->parallel_is;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  size_t machine_view_hash =
+      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  set_argumentmap_for_init_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher launcher(PARALLEL_IDENTITY_INIT_TASK_ID,
+                         parallel_is,
+                         TaskArgument(this, sizeof(ParallelIdentity)),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  FutureMap fm = runtime->execute_index_space(ctx, launcher);
+  fm.wait_all_results();
+  set_opmeta_from_futuremap_inference(ff, fm, batch_outputs[0]);
+}
+
+FutureMap ParallelIdentity::inference(
+    FFModel const &ff,
+    BatchConfigFuture const &bc,
+    std::vector<ParallelTensor> const &batch_inputs,
+    std::vector<ParallelTensor> const &batch_outputs,
+    MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  assert(batch_inputs[0]->data_type == batch_outputs[0]->data_type);
+  DataType data_type = batch_inputs[0]->data_type;
+  size_t machine_view_hash =
+      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher launcher(PARALLEL_IDENTITY_INF_TASK_ID,
+                         batch_outputs[0]->parallel_is,
+                         TaskArgument(nullptr, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
+  launcher.add_region_requirement(RegionRequirement(batch_inputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    READ_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_inputs[0]->region));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(RegionRequirement(batch_outputs[0]->part,
+                                                    0 /*projection id*/,
+                                                    WRITE_ONLY,
+                                                    EXCLUSIVE,
+                                                    batch_outputs[0]->region));
+  launcher.add_field(1, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+/*static*/
+void ParallelIdentity::inference_task(
+    Task const *task,
+    std::vector<PhysicalRegion> const &regions,
+    Context ctx,
+    Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+
+  ParallelIdentityMeta *m = *((ParallelIdentityMeta **)task->local_args);
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_active_tokens() == 0) {
+    return;
+  }
+
+  GenericTensorAccessorR input = helperGetGenericTensorAccessorRO(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  assert(input.data_type == output.data_type);
+  inference_kernel_wrapper(m, bc, input, output);
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    ParallelIdentity::save_inference_tensors_to_file(
+        m, shard_id, bc, {input}, {}, {output});
+  }
+}
+
+FutureMap
+    ParallelIdentity::peft_bwd(FFModel const &ff,
+                               BatchConfigFuture const &bc,
+                               std::vector<ParallelTensor> const &batch_inputs,
+                               std::vector<ParallelTensor> const &batch_outputs,
+                               MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  parallel_is = batch_outputs[0]->parallel_is;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  assert(batch_inputs[0]->data_type == batch_outputs[0]->data_type);
+  DataType data_type = batch_inputs[0]->data_type;
+  size_t machine_view_hash =
+      mv ? mv->hash() : batch_outputs[0]->machine_view.hash();
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  IndexLauncher launcher(PARALLEL_IDENTITY_PEFT_BWD_TASK_ID,
+                         batch_outputs[0]->parallel_is,
+                         TaskArgument(nullptr, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_future(bc);
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[0]->part_grad,
+                        0 /*projection id*/,
+                        WRITE_ONLY,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region_grad));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(
+      RegionRequirement(batch_outputs[0]->part_grad,
+                        0 /*projection id*/,
+                        READ_WRITE,
+                        EXCLUSIVE,
+                        batch_outputs[0]->region_grad));
+  launcher.add_field(1, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
+/*static*/
+void ParallelIdentity::peft_bwd_task(Task const *task,
+                                     std::vector<PhysicalRegion> const &regions,
+                                     Context ctx,
+                                     Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+
+  ParallelIdentityMeta *m = *((ParallelIdentityMeta **)task->local_args);
+  BatchConfig const *bc = BatchConfig::from_future(task->futures[0]);
+  if (bc->num_active_peft_tokens() == 0) {
+    return;
+  }
+  GenericTensorAccessorW input_grad = helperGetGenericTensorAccessorRW(
+      m->input_type[0], regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  GenericTensorAccessorR output_grad = helperGetGenericTensorAccessorRO(
+      m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  assert(input_grad.data_type == output_grad.data_type);
+  peft_bwd_kernel_wrapper(m, bc, input_grad, output_grad);
+  if (m->inference_debugging) {
+    assert(task->index_point.get_dim() == 1);
+    int shard_id = task->index_point.point_data[0];
+    ParallelIdentity::save_inference_tensors_to_file(
+        m, shard_id, bc, {input_grad}, {}, {output_grad}, false);
+  }
+}
+
+bool ParallelIdentity::measure_operator_cost(Simulator *sim,
+                                             MachineView const &pc,
+                                             CostMetrics &cost_metrics) const {
+  cost_metrics = CostMetrics();
+  cost_metrics.forward_time = 0.0f;
+  cost_metrics.backward_time = 0.0f;
+
+  cost_metrics.sync_time = 0;
+  cost_metrics.inputs_memory = 0;
+  cost_metrics.outputs_memory = 0;
+  cost_metrics.weights_memory = 0;
+  return true;
+}
+
+bool ParallelIdentity::get_int_parameter(PMParameter para, int *value) const {
+  switch (para) {
+    case PM_PARALLEL_IDENTITY_DIM:
+      *value = parallel_identity_dim;
+      return true;
+    default:
+      return Op::get_int_parameter(para, value);
+  }
+}
+
+bool ParallelIdentity::append_parallel_op_info(
+    std::vector<ParallelOpInfo> &parallel_ops) const {
+  ParallelOpInfo ret;
+  ret.op_type = op_type;
+  ret.parallel_dim = parallel_identity_dim;
+  ret.parallel_degree = -1; // ParallelIdentity does not affect parallel degree
+  parallel_ops.push_back(ret);
+  return true;
+}
+
+}; // namespace FlexFlow
+
+namespace std {
+size_t hash<FlexFlow::ParallelIdentityParams>::operator()(
+    FlexFlow::ParallelIdentityParams const &params) const {
+  size_t key = 0;
+  hash_combine(key, params.parallel_identity_legion_dim);
+  return key;
+}
+
+} // namespace std
diff --git a/src/parallel_ops/partition.cc b/src/parallel_ops/partition.cc
index e6ab09d088..fddf739599 100644
--- a/src/parallel_ops/partition.cc
+++ b/src/parallel_ops/partition.cc
@@ -44,7 +44,8 @@ using namespace FlexFlow::Kernels::Repartition;
 /* Params */
 bool operator==(RepartitionParams const &lhs, RepartitionParams const &rhs) {
   return lhs.repartition_legion_dim == rhs.repartition_legion_dim &&
-         lhs.repartition_degree == rhs.repartition_degree;
+         lhs.repartition_degree == rhs.repartition_degree &&
+         std::strcmp(lhs.name, rhs.name) == 0;
 }
 
 bool RepartitionParams::is_valid(ParallelTensorShape const &input) const {
@@ -60,7 +61,7 @@ RepartitionParams Repartition::get_params() const {
   RepartitionParams params;
   params.repartition_legion_dim = this->repartition_dim;
   params.repartition_degree = this->repartition_degree;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
@@ -200,6 +201,11 @@ void Repartition::create_input_partition_inference(
                                batch_outputs[0]->parallel_is,
                                batch_inputs[0]->region,
                                inference_input_lps[batch_inputs[0]]);
+  ff.create_disjoint_partition(batch_inputs[0]->num_dims,
+                               batch_inputs[0]->dims,
+                               batch_inputs[0]->parallel_is,
+                               batch_outputs[0]->region_grad,
+                               inference_output_grad_lps[batch_outputs[0]]);
 }
 
 FutureMap
diff --git a/src/parallel_ops/reduction.cc b/src/parallel_ops/reduction.cc
index 5ca2b1301c..7306e04334 100644
--- a/src/parallel_ops/reduction.cc
+++ b/src/parallel_ops/reduction.cc
@@ -45,7 +45,8 @@ using namespace FlexFlow::Kernels::Reduction;
 /* Params */
 bool operator==(ReductionParams const &lhs, ReductionParams const &rhs) {
   return lhs.reduction_legion_dim == rhs.reduction_legion_dim &&
-         lhs.reduction_degree == rhs.reduction_degree;
+         lhs.reduction_degree == rhs.reduction_degree &&
+         std::strcmp(lhs.name, rhs.name) == 0;
 }
 
 bool ReductionParams::is_valid(ParallelTensorShape const &input) const {
@@ -56,7 +57,7 @@ ReductionParams Reduction::get_params() const {
   ReductionParams params;
   params.reduction_legion_dim = this->reduction_dim;
   params.reduction_degree = this->reduction_degree;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
@@ -125,6 +126,13 @@ void Reduction::create_input_partition_inference(
                                batch_outputs[0]->parallel_is,
                                batch_inputs[0]->region,
                                inference_input_lps[batch_inputs[0]]);
+  // output_grad_lp is an aliased partitioning along the replica dim
+  ff.create_aliased_partition(batch_inputs[0]->num_dims,
+                              batch_inputs[0]->dims,
+                              reduction_dim,
+                              batch_inputs[0]->parallel_is,
+                              batch_outputs[0]->region_grad,
+                              inference_output_grad_lps[batch_outputs[0]]);
 }
 
 OpMeta *Reduction::init_task(Task const *task,
@@ -137,6 +145,7 @@ OpMeta *Reduction::init_task(Task const *task,
   meta->input_type[0] = reduct->inputs[0]->data_type;
   meta->output_type[0] = reduct->outputs[0]->data_type;
   assert(meta->input_type[0] == meta->output_type[0]);
+  std::strcpy(meta->op_name, reduct->name);
   return meta;
 }
 
@@ -372,6 +381,10 @@ void Reduction::forward_task(Task const *task,
   GenericTensorAccessorW output = helperGetGenericTensorAccessorWO(
       m->output_type[0], regions[1], task->regions[1], FID_DATA, ctx, runtime);
 
+  if (m->inference_debugging) {
+    std::cout << "INF " << m->op_name << std::endl;
+  }
+
   assert(input.data_type == output.data_type);
   if (input.data_type == DT_HALF) {
     forward_kernel<half>(input.get_half_ptr(),
diff --git a/src/parallel_ops/replicate.cc b/src/parallel_ops/replicate.cc
index ba7bb6677f..38215fc903 100644
--- a/src/parallel_ops/replicate.cc
+++ b/src/parallel_ops/replicate.cc
@@ -44,7 +44,8 @@ using namespace FlexFlow::Kernels::Replicate;
 /* Params */
 bool operator==(ReplicateParams const &lhs, ReplicateParams const &rhs) {
   return lhs.replicate_legion_dim == rhs.replicate_legion_dim &&
-         lhs.replicate_degree == rhs.replicate_degree;
+         lhs.replicate_degree == rhs.replicate_degree &&
+         std::strcmp(lhs.name, rhs.name) == 0;
 }
 
 bool ReplicateParams::is_valid(ParallelTensorShape const &input) const {
@@ -55,7 +56,7 @@ ReplicateParams Replicate::get_params() const {
   ReplicateParams params;
   params.replicate_legion_dim = this->replicate_dim;
   params.replicate_degree = this->replicate_degree;
-  if (this->name != nullptr) {
+  if (strlen(this->name) < MAX_OPNAME) {
     strcpy(params.name, this->name);
   }
   return params;
@@ -125,6 +126,12 @@ void Replicate::create_input_partition_inference(
                               batch_outputs[0]->parallel_is,
                               batch_inputs[0]->region,
                               inference_input_lps[batch_inputs[0]]);
+  // output_grad_lp is a disjoint partition
+  ff.create_disjoint_partition(batch_inputs[0]->num_dims,
+                               batch_inputs[0]->dims,
+                               batch_inputs[0]->parallel_is,
+                               batch_outputs[0]->region_grad,
+                               inference_output_grad_lps[batch_outputs[0]]);
 }
 
 OpMeta *Replicate::init_task(Task const *task,
@@ -137,6 +144,7 @@ OpMeta *Replicate::init_task(Task const *task,
   meta->input_type[0] = repl->inputs[0]->data_type;
   meta->output_type[0] = repl->outputs[0]->data_type;
   assert(meta->input_type[0] == meta->output_type[0]);
+  std::strcpy(meta->op_name, repl->name);
   return meta;
 }
 
@@ -276,6 +284,51 @@ void Replicate::forward(FFModel const &ff) {
   runtime->execute_index_space(ctx, launcher);
 }
 
+FutureMap Replicate::peft_bwd(FFModel const &ff,
+                              BatchConfigFuture const &bc,
+                              std::vector<ParallelTensor> const &batch_inputs,
+                              std::vector<ParallelTensor> const &batch_outputs,
+                              MachineView const *mv) {
+  ArgumentMap argmap;
+  Context ctx = ff.config.lg_ctx;
+  Runtime *runtime = ff.config.lg_hlr;
+  assert(numOutputs == 1);
+  assert(numInputs == 1);
+  assert(batch_inputs[0]->data_type == batch_outputs[0]->data_type);
+  DataType data_type = batch_inputs[0]->data_type;
+
+  // Warning: we need to use batch_inputs[0] here, instead of the usual
+  // batch_outputs[0]
+  parallel_is = batch_inputs[0]->parallel_is;
+  MachineView const *view = mv ? mv : &batch_inputs[0]->machine_view;
+
+  set_argumentmap_for_inference(ff, argmap, batch_outputs[0]);
+  size_t machine_view_hash = view->hash();
+  IndexLauncher launcher(REPLICATE_PEFT_BWD_TASK_ID,
+                         parallel_is,
+                         TaskArgument(NULL, 0),
+                         argmap,
+                         Predicate::TRUE_PRED,
+                         false /*must*/,
+                         0 /*mapper_id*/,
+                         machine_view_hash);
+  launcher.add_region_requirement(
+      RegionRequirement(inference_output_grad_lps[batch_outputs[0]],
+                        0 /*projection id*/,
+                        READ_ONLY,
+                        EXCLUSIVE,
+                        batch_outputs[0]->region_grad));
+  launcher.add_field(0, FID_DATA);
+  launcher.add_region_requirement(
+      RegionRequirement(batch_inputs[0]->part_grad,
+                        0 /*projection id*/,
+                        READ_WRITE,
+                        EXCLUSIVE,
+                        batch_inputs[0]->region_grad));
+  launcher.add_field(1, FID_DATA);
+  return runtime->execute_index_space(ctx, launcher);
+}
+
 void Replicate::backward(FFModel const &ff) {
   ArgumentMap argmap;
   Context ctx = ff.config.lg_ctx;
@@ -350,6 +403,9 @@ void Replicate::forward_task(Task const *task,
   assert(task->regions.size() == 2);
 
   ReplicateMeta const *m = *((ReplicateMeta **)task->local_args);
+  if (m->inference_debugging) {
+    std::cout << "INF " << m->op_name << std::endl;
+  }
 
   Domain input_domain = runtime->get_index_space_domain(
       ctx, task->regions[0].region.get_index_space());
@@ -381,6 +437,37 @@ void Replicate::forward_task(Task const *task,
   }
 }
 
+void Replicate::peft_bwd_task(Task const *task,
+                              std::vector<PhysicalRegion> const &regions,
+                              Context ctx,
+                              Runtime *runtime) {
+  assert(regions.size() == 2);
+  assert(task->regions.size() == 2);
+  Domain output_grad_domain = runtime->get_index_space_domain(
+      ctx, task->regions[0].region.get_index_space());
+  Domain input_grad_domain = runtime->get_index_space_domain(
+      ctx, task->regions[1].region.get_index_space());
+  // Currently only support the outter most dimension
+  for (int i = 0; i < output_grad_domain.get_dim() - 1; i++) {
+    assert(output_grad_domain.lo()[i] == input_grad_domain.lo()[i]);
+    assert(output_grad_domain.hi()[i] == input_grad_domain.hi()[i]);
+  }
+  size_t num_elements = input_grad_domain.get_volume();
+  size_t num_replicas = output_grad_domain.get_volume() / num_elements;
+  float const *output_grad_ptr = helperGetTensorPointerRO<float>(
+      regions[0], task->regions[0], FID_DATA, ctx, runtime);
+  float *input_grad_ptr = helperGetTensorPointerRW<float>(
+      regions[1], task->regions[1], FID_DATA, ctx, runtime);
+
+  ReplicateMeta const *m = *((ReplicateMeta **)task->local_args);
+  if (m->inference_debugging) {
+    std::cout << "BWD " << m->op_name << std::endl;
+  }
+
+  backward_kernel<float>(
+      output_grad_ptr, input_grad_ptr, num_elements, num_replicas);
+}
+
 void Replicate::backward_task(Task const *task,
                               std::vector<PhysicalRegion> const &regions,
                               Context ctx,
diff --git a/src/runtime/batch_config.cc b/src/runtime/batch_config.cc
index 7989b0799e..4c339750c7 100644
--- a/src/runtime/batch_config.cc
+++ b/src/runtime/batch_config.cc
@@ -25,7 +25,35 @@ Legion::Logger log_bc("BatchConfig");
 using Legion::Future;
 using Legion::Memory;
 
-BatchConfig::BatchConfig() : num_tokens(0) {
+void set_optimizer_tasks(OptimizerTasks &tasks,
+                         int max_training_steps,
+                         int completed_training_steps,
+                         int gradient_accumulation_steps) {
+  assert(max_training_steps > 0);
+  assert(completed_training_steps >= 0);
+  assert(gradient_accumulation_steps > 0);
+  assert(completed_training_steps < max_training_steps);
+  // Compute gradients should always be true
+  tasks.compute_gradients = true;
+
+  // Reset gradients to zero in the first iteration and after weight updates
+  tasks.reset_gradients_to_zero =
+      (completed_training_steps == 0) ||
+      (completed_training_steps % gradient_accumulation_steps == 0);
+
+  // Update weights every gradient_accumulation_steps
+  tasks.update_weights =
+      ((completed_training_steps + 1) % gradient_accumulation_steps == 0);
+
+  // Save updated weights only in the very last training step
+  tasks.save_updated_weights =
+      (completed_training_steps == max_training_steps - 1);
+  if (tasks.save_updated_weights) {
+    assert(tasks.update_weights);
+  }
+}
+
+BatchConfig::BatchConfig() : num_tokens(0), num_peft_tokens(0) {
   for (int i = 0; i < MAX_NUM_REQUESTS; i++) {
     requestsInfo[i].first_token_depth_in_request = 0;
     requestsInfo[i].first_token_offset_in_batch = 0;
@@ -74,6 +102,14 @@ int BatchConfig::num_active_tokens() const {
   return num_tokens;
 }
 
+int BatchConfig::num_active_infr_tokens() const {
+  return num_tokens;
+}
+
+int BatchConfig::num_active_peft_tokens() const {
+  return num_peft_tokens;
+}
+
 /*static*/
 int BatchConfig::max_requests_per_batch() {
   return RequestManager::get_request_manager()->get_max_requests_per_batch();
@@ -107,8 +143,13 @@ std::ostream &operator<<(std::ostream &os, BatchConfig const &bc) {
   os << "Max number of tokens: " << bc.max_tokens_per_batch() << std::endl;
   os << "Max sequence length: " << bc.max_sequence_length() << std::endl;
   // Current values
-  os << "Number of tokens: " << bc.num_active_tokens() << std::endl;
+  os << "Number of active tokens: " << bc.num_active_tokens() << std::endl;
+  os << "Number of inference tokens: " << bc.num_active_infr_tokens()
+     << std::endl;
+  os << "Number of peft tokens: " << bc.num_active_peft_tokens() << std::endl;
   os << "Number of requests: " << bc.num_active_requests() << std::endl;
+  os << "Number of generation tokens: " << bc.num_generation_tokens
+     << std::endl;
 
   // Per-request info
   os << "Per-request info:\n";
@@ -121,9 +162,27 @@ std::ostream &operator<<(std::ostream &os, BatchConfig const &bc) {
          << bc.requestsInfo[i].first_token_offset_in_batch << std::endl;
       os << "    Number of tokens in batch: "
          << bc.requestsInfo[i].num_tokens_in_batch << std::endl;
-      os << "    GUID: " << bc.requestsInfo[i].request_guid << std::endl;
       os << "    Max sequence length: "
          << bc.requestsInfo[i].max_sequence_length << std::endl;
+      os << "    BatchConfig Req ID: "
+         << bc.requestsInfo[i].batch_config_request_id << std::endl;
+      os << "    Prompt phase: " << bc.requestsInfo[i].prompt_phase
+         << std::endl;
+      os << "    GUID: " << bc.requestsInfo[i].request_guid << std::endl;
+      // PEFT values
+      os << "    PEFT Model ID: " << bc.requestsInfo[i].peft_model_id
+         << std::endl;
+      os << "    PEFT bwd: " << bc.requestsInfo[i].peft_bwd << std::endl;
+      os << "    optimizer_tasks: {"
+         << "compute_gradients: " << std::boolalpha
+         << bc.requestsInfo[i].optimizer_tasks.compute_gradients
+         << ", reset_gradients_to_zero: "
+         << bc.requestsInfo[i].optimizer_tasks.reset_gradients_to_zero
+         << ", update_weights: "
+         << bc.requestsInfo[i].optimizer_tasks.update_weights
+         << ", save_updated_weights: "
+         << bc.requestsInfo[i].optimizer_tasks.save_updated_weights << "}"
+         << std::endl;
       os << "    Request completed: " << bc.request_completed[i] << std::endl;
       os << "    Request running: " << bc.request_running[i] << std::endl;
     }
diff --git a/src/runtime/beam_search_batch_config.cc b/src/runtime/beam_search_batch_config.cc
index 0509c23afe..b10f8e82ab 100644
--- a/src/runtime/beam_search_batch_config.cc
+++ b/src/runtime/beam_search_batch_config.cc
@@ -137,6 +137,10 @@ std::ostream &operator<<(std::ostream &os, BeamSearchBatchConfig const &bc) {
       os << "    Number of tokens in batch: "
          << bc.requestsInfo[i].num_tokens_in_batch << std::endl;
       os << "    GUID: " << bc.requestsInfo[i].request_guid << std::endl;
+      // PEFT values
+      os << "    PEFT Model ID: " << bc.requestsInfo[i].peft_model_id
+         << std::endl;
+      os << "    PEFT bwd: " << bc.requestsInfo[i].peft_bwd << std::endl;
       os << "    Max sequence length: "
          << bc.requestsInfo[i].max_sequence_length << std::endl;
       os << "    Request completed: " << bc.request_completed[i] << std::endl;
diff --git a/src/runtime/cuda_helper.cu b/src/runtime/cuda_helper.cu
index 57bc5a0458..386a0c940b 100644
--- a/src/runtime/cuda_helper.cu
+++ b/src/runtime/cuda_helper.cu
@@ -36,7 +36,8 @@ cudaError_t get_legion_stream(cudaStream_t *stream) {
 
 using FlexFlow::get_legion_stream;
 
-__global__ void scale_kernel(float *ptr, coord_t size, float a, float b) {
+template <typename DT>
+__global__ void scale_kernel(DT *ptr, coord_t size, DT a, DT b) {
   CUDA_KERNEL_LOOP(i, size) {
     ptr[i] = (b - a) * ptr[i] + a;
   }
@@ -271,18 +272,10 @@ __host__ void print_beam_tensor(T const *ptr,
 template <>
 __host__ void
     save_tensor(float const *ptr, size_t num_elements, char const *file_name) {
-  cudaStream_t stream;
-  checkCUDA(get_legion_stream(&stream));
-  float *host_ptr;
-  checkCUDA(cudaHostAlloc(&host_ptr,
-                          sizeof(float) * num_elements,
-                          cudaHostAllocPortable | cudaHostAllocMapped));
-  checkCUDA(cudaMemcpyAsync(host_ptr,
-                            ptr,
-                            sizeof(float) * num_elements,
-                            cudaMemcpyDeviceToHost,
-                            stream));
+  float *host_ptr = (float *)calloc(num_elements, sizeof(float));
   checkCUDA(cudaDeviceSynchronize());
+  checkCUDA(cudaMemcpy(
+      host_ptr, ptr, sizeof(float) * num_elements, cudaMemcpyDeviceToHost));
   FILE *tensor_file;
   tensor_file = fopen(file_name, "w");
   assert(tensor_file != NULL);
@@ -293,26 +286,17 @@ __host__ void
       fprintf(tensor_file, "%.9f", host_ptr[i]);
     }
   }
-
   fclose(tensor_file);
-  checkCUDA(cudaFreeHost(host_ptr));
+  free(host_ptr);
 }
 
 template <>
 __host__ void
     save_tensor(half const *ptr, size_t num_elements, char const *file_name) {
-  cudaStream_t stream;
-  checkCUDA(get_legion_stream(&stream));
-  half *host_ptr;
-  checkCUDA(cudaHostAlloc(&host_ptr,
-                          sizeof(half) * num_elements,
-                          cudaHostAllocPortable | cudaHostAllocMapped));
-  checkCUDA(cudaMemcpyAsync(host_ptr,
-                            ptr,
-                            sizeof(half) * num_elements,
-                            cudaMemcpyDeviceToHost,
-                            stream));
+  half *host_ptr = (half *)calloc(num_elements, sizeof(half));
   checkCUDA(cudaDeviceSynchronize());
+  checkCUDA(cudaMemcpy(
+      host_ptr, ptr, sizeof(half) * num_elements, cudaMemcpyDeviceToHost));
   FILE *tensor_file;
   tensor_file = fopen(file_name, "w");
   assert(tensor_file != NULL);
@@ -323,27 +307,18 @@ __host__ void
       fprintf(tensor_file, "%.9f", (float)host_ptr[i]);
     }
   }
-
   fclose(tensor_file);
-  checkCUDA(cudaFreeHost(host_ptr));
+  free(host_ptr);
 }
 
 template <>
 __host__ void save_tensor(int32_t const *ptr,
                           size_t num_elements,
                           char const *file_name) {
-  cudaStream_t stream;
-  checkCUDA(get_legion_stream(&stream));
-  int32_t *host_ptr;
-  checkCUDA(cudaHostAlloc(&host_ptr,
-                          sizeof(int32_t) * num_elements,
-                          cudaHostAllocPortable | cudaHostAllocMapped));
-  checkCUDA(cudaMemcpyAsync(host_ptr,
-                            ptr,
-                            sizeof(int32_t) * num_elements,
-                            cudaMemcpyDeviceToHost,
-                            stream));
+  int32_t *host_ptr = (int32_t *)calloc(num_elements, sizeof(int32_t));
   checkCUDA(cudaDeviceSynchronize());
+  checkCUDA(cudaMemcpy(
+      host_ptr, ptr, sizeof(int32_t) * num_elements, cudaMemcpyDeviceToHost));
   FILE *tensor_file;
   tensor_file = fopen(file_name, "w");
   assert(tensor_file != NULL);
@@ -354,27 +329,18 @@ __host__ void save_tensor(int32_t const *ptr,
       fprintf(tensor_file, "%d", host_ptr[i]);
     }
   }
-
   fclose(tensor_file);
-  checkCUDA(cudaFreeHost(host_ptr));
+  free(host_ptr);
 }
 
 template <>
 __host__ void save_tensor(int64_t const *ptr,
                           size_t num_elements,
                           char const *file_name) {
-  cudaStream_t stream;
-  checkCUDA(get_legion_stream(&stream));
-  int64_t *host_ptr;
-  checkCUDA(cudaHostAlloc(&host_ptr,
-                          sizeof(int64_t) * num_elements,
-                          cudaHostAllocPortable | cudaHostAllocMapped));
-  checkCUDA(cudaMemcpyAsync(host_ptr,
-                            ptr,
-                            sizeof(int64_t) * num_elements,
-                            cudaMemcpyDeviceToHost,
-                            stream));
+  int64_t *host_ptr = (int64_t *)calloc(num_elements, sizeof(int64_t));
   checkCUDA(cudaDeviceSynchronize());
+  checkCUDA(cudaMemcpy(
+      host_ptr, ptr, sizeof(int64_t) * num_elements, cudaMemcpyDeviceToHost));
   FILE *tensor_file;
   tensor_file = fopen(file_name, "w");
   assert(tensor_file != NULL);
@@ -385,13 +351,12 @@ __host__ void save_tensor(int64_t const *ptr,
       fprintf(tensor_file, "%ld", host_ptr[i]);
     }
   }
-
   fclose(tensor_file);
-  checkCUDA(cudaFreeHost(host_ptr));
+  free(host_ptr);
 }
 
 template <typename T>
-__host__ T *download_tensor(T const *ptr, size_t num_elements) {
+__host__ T *copy_tensor_dev_to_host(T const *ptr, size_t num_elements) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   T *host_ptr;
@@ -404,14 +369,25 @@ __host__ T *download_tensor(T const *ptr, size_t num_elements) {
 }
 
 template <typename T>
-__host__ bool download_tensor(T const *ptr, T *dst, size_t num_elements) {
+__host__ void
+    copy_tensor_dev_to_host(T const *ptr, T *dst, size_t num_elements) {
   cudaStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   assert(dst != nullptr);
   checkCUDA(cudaMemcpyAsync(
       dst, ptr, sizeof(T) * num_elements, cudaMemcpyDeviceToHost, stream));
-  return true;
 }
+
+template <typename T>
+__host__ void
+    copy_tensor_host_to_dev(T *dst, T const *src, size_t num_elements) {
+  cudaStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  assert(src != nullptr);
+  checkCUDA(cudaMemcpyAsync(
+      dst, src, sizeof(T) * num_elements, cudaMemcpyHostToDevice, stream));
+}
+
 cudnnStatus_t cudnnSetTensorDescriptorFromDomain4SoftMax(
     cudnnTensorDescriptor_t tensor, Domain domain, DataType data_type) {
   int dims[MAX_TENSOR_DIM];
@@ -609,6 +585,48 @@ cudnnDataType_t cuda_to_cudnn_datatype(cudaDataType_t type) {
   return CUDNN_DATA_FLOAT;
 }
 
+void check_device_vs_host_ptr(void const *maybe_devicePtr) {
+  cudaPointerAttributes attributes;
+  cudaError_t cudaStatus =
+      cudaPointerGetAttributes(&attributes, maybe_devicePtr);
+
+  if (cudaStatus == cudaSuccess) {
+    // Check attributes and perform actions accordingly
+    if (attributes.type == cudaMemoryTypeDevice) {
+      printf("Pointer is allocated in device memory.\n");
+    } else if (attributes.type == cudaMemoryTypeHost) {
+      printf("Pointer is allocated in host memory.\n");
+    } else if (attributes.type == cudaMemoryTypeUnregistered) {
+      printf("Pointer is unregistered.\n");
+    } else if (attributes.type == cudaMemoryTypeManaged) {
+      printf("Pointer is managed.\n");
+    } else {
+      printf("Pointer is not allocated in recognized memory type.\n");
+    }
+  } else {
+    fprintf(stderr,
+            "cudaPointerGetAttributes failed: %s\n",
+            cudaGetErrorString(cudaStatus));
+  }
+}
+
+void check_ptr_alignment(void const *ptr) {
+  if (!ptr) {
+    printf("Pointer is NULL\n");
+    return;
+  }
+  bool aligned2 = ((uintptr_t)ptr % 2 == 0);
+  bool aligned4 = ((uintptr_t)ptr % 4 == 0);
+  bool aligned8 = ((uintptr_t)ptr % 8 == 0);
+  bool aligned16 = ((uintptr_t)ptr % 16 == 0);
+  printf("Pointer %p is aligned as follows: 2=%s, 4=%s, 8=%s, 16=%s\n",
+         ptr,
+         (aligned2 ? "yes" : "no"),
+         (aligned4 ? "yes" : "no"),
+         (aligned8 ? "yes" : "no"),
+         (aligned16 ? "yes" : "no"));
+}
+
 template __global__ void
     assign_kernel<half>(half *ptr, coord_t size, half value);
 template __global__ void
@@ -620,6 +638,13 @@ template __global__ void
 template __global__ void
     assign_kernel<int64_t>(int64_t *ptr, coord_t size, int64_t value);
 
+template __global__ void
+    scale_kernel<half>(half *ptr, coord_t size, half a, half b);
+template __global__ void
+    scale_kernel<float>(float *ptr, coord_t size, float a, float b);
+template __global__ void
+    scale_kernel<double>(double *ptr, coord_t size, double a, double b);
+
 template __global__ void
     add_kernel<half>(half *dst, half const *src, size_t size);
 template __global__ void
@@ -716,26 +741,43 @@ template __host__ void save_tensor<int64_t>(int64_t const *ptr,
 template __host__ void
     save_tensor<half>(half const *ptr, size_t rect, char const *file_name);
 
-template __host__ float *download_tensor<float>(float const *ptr,
-                                                size_t num_elements);
-template __host__ half *download_tensor<half>(half const *ptr,
-                                              size_t num_elements);
-template __host__ double *download_tensor<double>(double const *ptr,
-                                                  size_t num_elements);
-template __host__ int32_t *download_tensor<int32_t>(int32_t const *ptr,
-                                                    size_t num_elements);
-template __host__ int64_t *download_tensor<int64_t>(int64_t const *ptr,
-                                                    size_t num_elements);
-template __host__ bool
-    download_tensor<float>(float const *ptr, float *dst, size_t num_elements);
-template __host__ bool
-    download_tensor<half>(half const *ptr, half *dst, size_t num_elements);
-template __host__ bool download_tensor<double>(double const *ptr,
-                                               double *dst,
-                                               size_t num_elements);
-template __host__ bool download_tensor<int32_t>(int32_t const *ptr,
-                                                int32_t *dst,
-                                                size_t num_elements);
-template __host__ bool download_tensor<int64_t>(int64_t const *ptr,
-                                                int64_t *dst,
-                                                size_t num_elements);
+template __host__ float *copy_tensor_dev_to_host<float>(float const *ptr,
+                                                        size_t num_elements);
+template __host__ half *copy_tensor_dev_to_host<half>(half const *ptr,
+                                                      size_t num_elements);
+template __host__ double *copy_tensor_dev_to_host<double>(double const *ptr,
+                                                          size_t num_elements);
+template __host__ int32_t *
+    copy_tensor_dev_to_host<int32_t>(int32_t const *ptr, size_t num_elements);
+template __host__ int64_t *
+    copy_tensor_dev_to_host<int64_t>(int64_t const *ptr, size_t num_elements);
+template __host__ void copy_tensor_dev_to_host<float>(float const *ptr,
+                                                      float *dst,
+                                                      size_t num_elements);
+template __host__ void copy_tensor_dev_to_host<half>(half const *ptr,
+                                                     half *dst,
+                                                     size_t num_elements);
+template __host__ void copy_tensor_dev_to_host<double>(double const *ptr,
+                                                       double *dst,
+                                                       size_t num_elements);
+template __host__ void copy_tensor_dev_to_host<int32_t>(int32_t const *ptr,
+                                                        int32_t *dst,
+                                                        size_t num_elements);
+template __host__ void copy_tensor_dev_to_host<int64_t>(int64_t const *ptr,
+                                                        int64_t *dst,
+                                                        size_t num_elements);
+template __host__ void copy_tensor_host_to_dev<float>(float *dst,
+                                                      float const *src,
+                                                      size_t num_elements);
+template __host__ void copy_tensor_host_to_dev<half>(half *dst,
+                                                     half const *src,
+                                                     size_t num_elements);
+template __host__ void copy_tensor_host_to_dev<double>(double *dst,
+                                                       double const *src,
+                                                       size_t num_elements);
+template __host__ void copy_tensor_host_to_dev<int32_t>(int32_t *dst,
+                                                        int32_t const *src,
+                                                        size_t num_elements);
+template __host__ void copy_tensor_host_to_dev<int64_t>(int64_t *dst,
+                                                        int64_t const *src,
+                                                        size_t num_elements);
diff --git a/src/runtime/ffconst_utils.cc b/src/runtime/ffconst_utils.cc
index c7b6e1257a..5a7d98b4dc 100644
--- a/src/runtime/ffconst_utils.cc
+++ b/src/runtime/ffconst_utils.cc
@@ -188,6 +188,9 @@ std::string get_operator_type_name(OperatorType type) {
       return "Sampling";
     case OP_ARGMAX:
       return "ArgMax";
+    // PEFT Ops
+    case OP_LORA:
+      return "Lora Layer";
     // Parallel Ops
     case OP_REPARTITION:
       return "Repartition";
@@ -199,6 +202,8 @@ std::string get_operator_type_name(OperatorType type) {
       return "Reduction";
     case OP_ALLREDUCE:
       return "AllReduce";
+    case OP_PARALLEL_IDENTITY:
+      return "ParallelIdentity";
     case OP_PIPELINE:
       return "Pipeline";
     case OP_FUSED_PARALLEL:
diff --git a/src/runtime/fftype.cc b/src/runtime/fftype.cc
index 819e6527e5..8213726e8a 100644
--- a/src/runtime/fftype.cc
+++ b/src/runtime/fftype.cc
@@ -30,4 +30,29 @@ bool operator==(LayerID const &lhs, LayerID const &rhs) {
   return lhs.id == rhs.id;
 }
 
+const PEFTModelID PEFTModelID::NO_ID = PEFTModelID();
+
+PEFTModelID::PEFTModelID() : id(0) {}
+
+PEFTModelID::PEFTModelID(size_t _id) : id(_id) {
+  assert(is_valid_id());
+}
+
+bool PEFTModelID::is_valid_id() const {
+  return (id >= PEFT_MODEL_ID_FIRST_VALID && id <= PEFT_MODEL_ID_LAST_VALID);
+}
+
+bool operator==(PEFTModelID const &lhs, PEFTModelID const &rhs) {
+  return lhs.id == rhs.id;
+}
+
+std::ostream &operator<<(std::ostream &os, PEFTModelID const &peft_model_id) {
+  if (peft_model_id == PEFTModelID::NO_ID) {
+    os << "NO_ID";
+  } else {
+    os << peft_model_id.id;
+  }
+  return os;
+}
+
 }; // namespace FlexFlow
diff --git a/src/runtime/file_loader.cc b/src/runtime/file_loader.cc
index 43ce9d7005..c373e0da9b 100644
--- a/src/runtime/file_loader.cc
+++ b/src/runtime/file_loader.cc
@@ -136,12 +136,12 @@ void load_attention_bias_v2(DT *ptr,
                             bool final_bias,
                             std::string layer_name,
                             std::string weights_folder) {
-  std::string q_file = layer_name + "_wq_bias";
-  std::string k_file = layer_name + "_wk_bias";
-  std::string v_file = layer_name + "_wv_bias";
+  std::string q_file = layer_name + ".q_proj.bias";
+  std::string k_file = layer_name + ".k_proj.bias";
+  std::string v_file = layer_name + ".v_proj.bias";
   std::vector<std::string> bias_files = {q_file, k_file, v_file};
   if (final_bias) {
-    std::string o_file = layer_name + "_wo_bias";
+    std::string o_file = layer_name + ".o_proj.bias";
     bias_files.push_back(o_file);
   }
 
@@ -217,12 +217,10 @@ void load_attention_weights_v2(DT *ptr,
                                std::string weights_folder,
                                size_t volume,
                                int tensor_parallelism_degree) {
-  // layers_0_attention_wq_weight
-  // layers_0_self_attn_q_proj_weight
-  std::string q_file = layer_name + "_wq_weight";
-  std::string k_file = layer_name + "_wk_weight";
-  std::string v_file = layer_name + "_wv_weight";
-  std::string o_file = layer_name + "_wo_weight";
+  std::string q_file = layer_name + ".q_proj.weight";
+  std::string k_file = layer_name + ".k_proj.weight";
+  std::string v_file = layer_name + ".v_proj.weight";
+  std::string o_file = layer_name + ".o_proj.weight";
   std::vector<std::string> weight_filenames = {q_file, k_file, v_file};
   int file_index = 0;
 
@@ -407,12 +405,10 @@ void load_attention_weights_quantized(char *ptr,
                                       std::string weights_folder,
                                       DataType data_type,
                                       bool use_full_precision) {
-  // layers_0_attention_wq_weight
-  // layers_0_self_attn_q_proj_weight
-  std::string q_file = layer_name + "_wq_weight";
-  std::string k_file = layer_name + "_wk_weight";
-  std::string v_file = layer_name + "_wv_weight";
-  std::string o_file = layer_name + "_wo_weight";
+  std::string q_file = layer_name + ".q_proj.weight";
+  std::string k_file = layer_name + ".k_proj.weight";
+  std::string v_file = layer_name + ".v_proj.weight";
+  std::string o_file = layer_name + ".o_proj.weight";
   std::vector<std::string> weight_filenames = {q_file, k_file, v_file, o_file};
 
   int file_index = 0;
@@ -690,7 +686,7 @@ void FileDataLoader::load_quantization_weight(FFModel *ff,
     if (weight_idx > 0) {
       assert(weight_idx == 0 || weight_idx == 1);
       if (weight_filename != "embed_tokens_weight_lm_head") {
-        weight_filename += weight_idx == 0 ? "_weight" : "_bias";
+        weight_filename += weight_idx == 0 ? ".weight" : ".bias";
       }
     }
     load_from_quantized_file(data,
@@ -734,44 +730,34 @@ void FileDataLoader::load_single_weight_tensor(FFModel *ff,
     if (l->op_type == OP_INC_MULTIHEAD_SELF_ATTENTION ||
         l->op_type == OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION ||
         l->op_type == OP_TREE_INC_MULTIHEAD_SELF_ATTENTION) {
-      if (weight_filename.find("self_attention") != std::string::npos) {
-        load_attention_weights_multi_query(
-            data, weight_filename, weights_folder, hidden_dim, num_heads);
-      } else if (weight_filename.find("attention") != std::string::npos &&
-                 weight_filename.rfind("attention") ==
-                     weight_filename.length() - strlen("attention")) {
-        if (weight_idx == 0) {
-          load_attention_weights_v2(data,
-                                    num_heads,
-                                    num_kv_heads,
-                                    hidden_dim,
-                                    qkv_inner_dim,
-                                    weight_filename,
-                                    weights_folder,
-                                    volume,
-                                    tensor_parallelism_degree);
-        } else {
-          long long value;
-          l->get_int_property("final_bias", value);
-          bool final_bias = (bool)value;
-          load_attention_bias_v2(data,
-                                 num_heads,
-                                 num_kv_heads,
-                                 hidden_dim,
-                                 qkv_inner_dim,
-                                 final_bias,
-                                 weight_filename,
-                                 weights_folder);
-        }
-
+      if (weight_idx == 0) {
+        load_attention_weights_v2(data,
+                                  num_heads,
+                                  num_kv_heads,
+                                  hidden_dim,
+                                  qkv_inner_dim,
+                                  weight_filename,
+                                  weights_folder,
+                                  volume,
+                                  tensor_parallelism_degree);
       } else {
-        assert(false);
+        long long value;
+        l->get_int_property("final_bias", value);
+        bool final_bias = (bool)value;
+        load_attention_bias_v2(data,
+                               num_heads,
+                               num_kv_heads,
+                               hidden_dim,
+                               qkv_inner_dim,
+                               final_bias,
+                               weight_filename,
+                               weights_folder);
       }
     } else if (l->op_type == OP_ADD_BIAS_RESIDUAL_LAYERNORM) {
       assert(weight_idx >= 0 || weight_idx <= 2);
       weight_filename += (weight_idx == 0)
-                             ? "_attn_bias"
-                             : ((weight_idx == 1) ? "_weight" : "_bias");
+                             ? ".attn_bias"
+                             : ((weight_idx == 1) ? ".weight" : ".bias");
       std::cout << "Loading weight file " << weight_filename << std::endl;
       std::string weight_filepath =
           join_path({weights_folder, weight_filename});
@@ -781,7 +767,7 @@ void FileDataLoader::load_single_weight_tensor(FFModel *ff,
       assert(weight_idx == 0 || weight_idx == 1);
       // handle exception
       if (weight_filename != "embed_tokens_weight_lm_head") {
-        weight_filename += weight_idx == 0 ? "_weight" : "_bias";
+        weight_filename += weight_idx == 0 ? ".weight" : ".bias";
       }
       std::cout << "Loading weight file " << weight_filename << std::endl;
       std::string weight_filepath =
@@ -809,6 +795,10 @@ void FileDataLoader::load_weights(FFModel *ff) {
       if (weight == NULL) {
         continue;
       }
+      // TODO: currently skip Lora layers
+      if (l->op_type == OP_LORA) {
+        continue;
+      }
       switch (weight->data_type) {
         case DT_HALF:
           load_single_weight_tensor<half>(ff, l, i);
diff --git a/src/runtime/graph.cc b/src/runtime/graph.cc
index b023aced6e..1a38782e81 100644
--- a/src/runtime/graph.cc
+++ b/src/runtime/graph.cc
@@ -36,6 +36,7 @@
 #include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ops/layer_norm.h"
 #include "flexflow/ops/linear.h"
+#include "flexflow/ops/lora_linear.h"
 #include "flexflow/ops/noop.h"
 #include "flexflow/ops/pool_2d.h"
 #include "flexflow/ops/reduce.h"
@@ -54,6 +55,7 @@
 #include "flexflow/parallel_ops/allreduce.h"
 #include "flexflow/parallel_ops/combine.h"
 #include "flexflow/parallel_ops/fused_parallel_op.h"
+#include "flexflow/parallel_ops/parallel_identity.h"
 #include "flexflow/parallel_ops/partition.h"
 #include "flexflow/parallel_ops/reduction.h"
 #include "flexflow/parallel_ops/replicate.h"
@@ -1992,6 +1994,7 @@ std::pair<std::unique_ptr<Graph>, std::unordered_map<Node, MachineView>>
         mv.device_type = MachineView::GPU;
         mv.ndims = 1;
         int total_parallel_degree = 1;
+        assert(op->numOutputs > 0);
         for (int i = 0; i < op->outputs[0]->num_dims; i++) {
           total_parallel_degree *= op->outputs[0]->dims[i].degree;
         }
@@ -2434,6 +2437,13 @@ GraphOptimalViewSerialized
         sez.serialize(allreduce->name, strlen(allreduce->name));
         break;
       }
+      case OP_PARALLEL_IDENTITY: {
+        ParallelIdentity *parallel_identity = (ParallelIdentity *)op;
+        sez.serialize(parallel_identity->parallel_identity_dim);
+        sez.serialize(strlen(parallel_identity->name));
+        sez.serialize(parallel_identity->name, strlen(parallel_identity->name));
+        break;
+      }
       case OP_FUSED_PARALLEL: {
         FusedParallelOp *fused = (FusedParallelOp *)op;
         sez.serialize(fused->num_parallel_ops);
@@ -2475,6 +2485,7 @@ namespace FlexFlow {
 using PCG::Edge;
 using PCG::Graph;
 using PCG::GraphCostResult;
+using PCG::log_graph;
 using PCG::Node;
 
 void FFModel::register_all_machine_views(
@@ -2759,6 +2770,10 @@ void FFModel::deserialize_graph_optimal_view(
         node = Linear::deserialize(*this, dez, inputs, num_inputs);
         break;
       }
+      case OP_LORA: {
+        node = LoraLinear::deserialize(*this, dez, inputs, num_inputs);
+        break;
+      }
       case OP_MULTIHEAD_ATTENTION: {
         assert(num_inputs == 3);
         int embed_dim, num_heads, k_dim, v_dim;
@@ -3042,8 +3057,11 @@ void FFModel::deserialize_graph_optimal_view(
         char name[MAX_OPNAME] = {0};
         dez.deserialize(name_len);
         dez.deserialize(name, name_len);
-        node = get_or_create_node<Combine>(inputs[0],
-                                           {combine_dim, combine_degree});
+        CombineParams params;
+        params.combine_legion_dim = combine_dim;
+        params.combine_degree = combine_degree;
+        strcpy(params.name, name);
+        node = get_or_create_node<Combine>(inputs[0], params);
         break;
       }
       case OP_REPARTITION: {
@@ -3055,8 +3073,11 @@ void FFModel::deserialize_graph_optimal_view(
         char name[MAX_OPNAME] = {0};
         dez.deserialize(name_len);
         dez.deserialize(name, name_len);
-        node = get_or_create_node<Repartition>(
-            inputs[0], {repartition_dim, repartition_degree});
+        RepartitionParams params;
+        params.repartition_legion_dim = repartition_dim;
+        params.repartition_degree = repartition_degree;
+        strcpy(params.name, name);
+        node = get_or_create_node<Repartition>(inputs[0], params);
         break;
       }
       case OP_REPLICATE: {
@@ -3068,8 +3089,11 @@ void FFModel::deserialize_graph_optimal_view(
         char name[MAX_OPNAME] = {0};
         dez.deserialize(name_len);
         dez.deserialize(name, name_len);
-        node = get_or_create_node<Replicate>(inputs[0],
-                                             {replicate_dim, replicate_degree});
+        ReplicateParams params;
+        params.replicate_legion_dim = replicate_dim;
+        params.replicate_degree = replicate_degree;
+        strcpy(params.name, name);
+        node = get_or_create_node<Replicate>(inputs[0], params);
         break;
       }
       case OP_REDUCTION: {
@@ -3081,8 +3105,11 @@ void FFModel::deserialize_graph_optimal_view(
         char name[MAX_OPNAME] = {0};
         dez.deserialize(name_len);
         dez.deserialize(name, name_len);
-        node = get_or_create_node<Reduction>(inputs[0],
-                                             {reduction_dim, reduction_degree});
+        ReductionParams params;
+        params.reduction_legion_dim = reduction_dim;
+        params.reduction_degree = reduction_degree;
+        strcpy(params.name, name);
+        node = get_or_create_node<Reduction>(inputs[0], params);
         break;
       }
       case OP_ALLREDUCE: {
@@ -3093,24 +3120,43 @@ void FFModel::deserialize_graph_optimal_view(
         char name[MAX_OPNAME] = {0};
         dez.deserialize(name_len);
         dez.deserialize(name, name_len);
-        node = get_or_create_node<AllReduce>(inputs[0], {allreduce_dim});
+        AllReduceParams params;
+        params.allreduce_legion_dim = allreduce_dim;
+        strcpy(params.name, name);
+        node = get_or_create_node<AllReduce>(inputs[0], params);
+        break;
+      }
+      case OP_PARALLEL_IDENTITY: {
+        assert(num_inputs == 1);
+        int parallel_identity_dim;
+        dez.deserialize(parallel_identity_dim);
+        size_t name_len;
+        char name[MAX_OPNAME] = {0};
+        dez.deserialize(name_len);
+        dez.deserialize(name, name_len);
+        ParallelIdentityParams params;
+        params.parallel_identity_legion_dim = parallel_identity_dim;
+        strcpy(params.name, name);
+        node = get_or_create_node<ParallelIdentity>(inputs[0], params);
         break;
       }
       case OP_FUSED_PARALLEL: {
         assert(num_inputs == 1);
-        std::vector<ParallelOpInfo> parallel_ops;
+        FusedParallelOpParams params;
         int num_parallel_ops;
         dez.deserialize(num_parallel_ops);
         for (int i = 0; i < num_parallel_ops; i++) {
           ParallelOpInfo info;
           dez.deserialize(info);
-          parallel_ops.push_back(info);
+          params.parallel_ops.push_back(info);
         }
         size_t name_len;
         char name[MAX_OPNAME] = {0};
         dez.deserialize(name_len);
         dez.deserialize(name, name_len);
-        node = get_or_create_node<FusedParallelOp>(inputs[0], {parallel_ops});
+        strcpy(params.name, name);
+
+        node = get_or_create_node<FusedParallelOp>(inputs[0], params);
         break;
       }
       default: {
@@ -3149,20 +3195,20 @@ void FFModel::deserialize_graph_optimal_view(
     optimal_views[guid_to_nodes[guid]] = view;
   }
   assert(dez.get_remaining_bytes() == 0);
-  printf("Deserialized Views...\n");
+  log_graph.debug("Deserialized Views...\n");
   for (auto const &it : optimal_views) {
-    printf("node[%zu]: type(%s) view(%d %d %d) ",
-           it.first.guid,
-           it.first.to_string().c_str(),
-           it.second.ndims,
-           it.second.dim[0],
-           it.second.start_device_id);
+    log_graph.debug("node[%zu]: type(%s) view(%d %d %d) ",
+                    it.first.guid,
+                    it.first.to_string().c_str(),
+                    it.second.ndims,
+                    it.second.dim[0],
+                    it.second.start_device_id);
     auto const &list = graph->inEdges.at(it.first);
     for (auto const &it2 : list) {
       Edge e = it2;
-      printf(" inEdge(node(%zu) idx(%d))", e.srcOp.guid, e.srcIdx);
+      log_graph.debug(" inEdge(node(%zu) idx(%d))", e.srcOp.guid, e.srcIdx);
     }
-    printf("\n");
+    log_graph.debug("\n");
   }
 }
 
diff --git a/src/runtime/hip_helper.cpp b/src/runtime/hip_helper.cpp
index 613df1cbcf..057be8f443 100644
--- a/src/runtime/hip_helper.cpp
+++ b/src/runtime/hip_helper.cpp
@@ -29,7 +29,8 @@ hipError_t get_legion_stream(hipStream_t *stream) {
 
 using FlexFlow::get_legion_stream;
 
-__global__ void scale_kernel(float *ptr, coord_t size, float a, float b) {
+template <typename DT>
+__global__ void scale_kernel(DT *ptr, coord_t size, DT a, DT b) {
   CUDA_KERNEL_LOOP(i, size) {
     ptr[i] = (b - a) * ptr[i] + a;
   }
@@ -55,6 +56,14 @@ __global__ void copy_kernel(DT *dst, const DT *src, coord_t size) {
   }
 }
 
+template <typename DT>
+__global__ void
+    copy_kernel_discrete(DT *dst, const DT *src, coord_t size, size_t *index) {
+  CUDA_KERNEL_LOOP(i, size) {
+    dst[i] = src[index[i]];
+  }
+}
+
 template <typename DT>
 __global__ void reluBackward(DT *grad_ptr, const DT *output, size_t n) {
   CUDA_KERNEL_LOOP(i, n) {
@@ -224,22 +233,24 @@ __host__ void updateGAS(float *para_ptr,
 }
 
 template <typename T>
-__host__ void
-    print_tensor(T const *ptr, size_t num_elements, char const *prefix) {
-  // device synchronize to make sure the data are ready
-  // checkCUDA(hipDeviceSynchronize());
+__host__ void print_tensor(T const *ptr,
+                           size_t num_elements,
+                           char const *prefix,
+                           int shard_id) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
   T *host_ptr;
-  checkCUDA(hipHostMalloc((void **)&host_ptr,
+  checkCUDA(hipHostMalloc(&host_ptr,
                           sizeof(T) * num_elements,
                           hipHostMallocPortable | hipHostMallocMapped));
-  checkCUDA(hipMemcpy(
-      host_ptr, ptr, sizeof(T) * num_elements, hipMemcpyDeviceToHost));
-  // checkCUDA(hipDeviceSynchronize());
+  checkCUDA(hipMemcpyAsync(
+      host_ptr, ptr, sizeof(T) * num_elements, hipMemcpyDeviceToHost, stream));
+  checkCUDA(hipDeviceSynchronize());
   int idx = 0;
-  printf("%s", prefix);
+  printf("%s, %d---->", prefix, shard_id);
   for (idx = 0; idx < num_elements; idx++) {
-    printf(" %.4lf", (float)host_ptr[idx]);
-    if (idx >= 16) {
+    printf(" %.20lf", (float)host_ptr[idx]);
+    if (idx >= 100) {
       break;
     }
   }
@@ -247,6 +258,40 @@ __host__ void
   checkCUDA(hipHostFree(host_ptr));
 }
 
+template <typename T>
+__host__ void print_beam_tensor(T const *ptr,
+                                size_t num_elements,
+                                int skip,
+                                int channel,
+                                char const *prefix) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  T *host_ptr;
+  checkCUDA(hipHostMalloc(&host_ptr,
+                          sizeof(T) * channel * skip,
+                          hipHostMallocPortable | hipHostMallocMapped));
+  checkCUDA(hipMemcpyAsync(host_ptr,
+                           ptr,
+                           sizeof(T) * channel * skip,
+                           hipMemcpyDeviceToHost,
+                           stream));
+  // checkCUDA(hipDeviceSynchronize());
+  int idx = 0;
+  printf("%s", prefix);
+
+  for (int i = 0; i < channel; i += 1) {
+    for (idx = 0; idx < num_elements; idx++) {
+      printf(" %.20lf", (float)host_ptr[idx + i * skip]);
+      if (idx >= 100) {
+        break;
+      }
+    }
+    printf("\n-----***********------\n");
+  }
+
+  checkCUDA(hipHostFree(host_ptr));
+}
+
 template <>
 __host__ void
     save_tensor(float const *ptr, size_t num_elements, char const *file_name) {
@@ -370,9 +415,7 @@ __host__ void save_tensor(int64_t const *ptr,
 }
 
 template <typename T>
-__host__ T *download_tensor(T const *ptr, size_t num_elements) {
-  // device synchronize to make sure the data are ready
-  // checkCUDA(hipDeviceSynchronize());
+__host__ T *copy_tensor_dev_to_host(T const *ptr, size_t num_elements) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   T *host_ptr;
@@ -381,21 +424,27 @@ __host__ T *download_tensor(T const *ptr, size_t num_elements) {
                           hipHostMallocPortable | hipHostMallocMapped));
   checkCUDA(hipMemcpyAsync(
       host_ptr, ptr, sizeof(T) * num_elements, hipMemcpyDeviceToHost, stream));
-  // checkCUDA(hipDeviceSynchronize());
   return host_ptr;
 }
 
 template <typename T>
-__host__ bool download_tensor(T const *ptr, T *dst, size_t num_elements) {
-  // device synchronize to make sure the data are ready
-  // checkCUDA(hipDeviceSynchronize());
+__host__ void
+    copy_tensor_dev_to_host(T const *ptr, T *dst, size_t num_elements) {
   hipStream_t stream;
   checkCUDA(get_legion_stream(&stream));
   assert(dst != nullptr);
   checkCUDA(hipMemcpyAsync(
       dst, ptr, sizeof(T) * num_elements, hipMemcpyDeviceToHost, stream));
-  // checkCUDA(hipDeviceSynchronize());
-  return true;
+}
+
+template <typename T>
+__host__ void
+    copy_tensor_host_to_dev(T *dst, T const *src, size_t num_elements) {
+  hipStream_t stream;
+  checkCUDA(get_legion_stream(&stream));
+  assert(src != nullptr);
+  checkCUDA(hipMemcpyAsync(
+      dst, src, sizeof(T) * num_elements, hipMemcpyHostToDevice, stream));
 }
 
 miopenStatus_t cudnnSetTensorDescriptorFromDomain(
@@ -450,22 +499,23 @@ miopenStatus_t cudnnSetTensorDescriptorFromDomain(
   return miopenStatusBadParm;
 }
 
-miopenStatus_t
-    cudnnSetTensorDescriptorFromDomain4SoftMax(miopenTensorDescriptor_t tensor,
-                                               Domain domain) {
+miopenStatus_t cudnnSetTensorDescriptorFromDomain4SoftMax(
+    miopenTensorDescriptor_t tensor, Domain domain, DataType data_type) {
   int dims[MAX_TENSOR_DIM];
+  miopenDataType_t cudnn_data_type = ff_to_cudnn_datatype(data_type);
   switch (domain.get_dim()) {
     case 1: {
       Rect<1> rect = domain;
       dims[0] = rect.hi[0] - rect.lo[0] + 1;
-      return miopenSet4dTensorDescriptor(tensor, miopenFloat, dims[0], 1, 1, 1);
+      return miopenSet4dTensorDescriptor(
+          tensor, cudnn_data_type, dims[0], 1, 1, 1);
     }
     case 2: {
       Rect<2> rect = domain;
       dims[0] = rect.hi[0] - rect.lo[0] + 1;
       dims[1] = rect.hi[1] - rect.lo[1] + 1;
       return miopenSet4dTensorDescriptor(
-          tensor, miopenFloat, dims[1], dims[0], 1, 1);
+          tensor, cudnn_data_type, dims[1], dims[0], 1, 1);
     }
     case 3: {
       Rect<3> rect = domain;
@@ -473,7 +523,7 @@ miopenStatus_t
       dims[1] = rect.hi[1] - rect.lo[1] + 1;
       dims[2] = rect.hi[2] - rect.lo[2] + 1;
       return miopenSet4dTensorDescriptor(
-          tensor, miopenFloat, dims[2] * dims[1], dims[0], 1, 1);
+          tensor, cudnn_data_type, dims[2] * dims[1], dims[0], 1, 1);
     }
     case 4: {
       Rect<4> rect = domain;
@@ -482,7 +532,7 @@ miopenStatus_t
       dims[2] = rect.hi[2] - rect.lo[2] + 1;
       dims[3] = rect.hi[3] - rect.lo[3] + 1;
       return miopenSet4dTensorDescriptor(
-          tensor, miopenFloat, dims[3] * dims[2] * dims[1], dims[0], 1, 1);
+          tensor, cudnn_data_type, dims[3] * dims[2] * dims[1], dims[0], 1, 1);
     }
     case 5: {
       Rect<5> rect = domain;
@@ -493,7 +543,7 @@ miopenStatus_t
       dims[2] = rect.hi[2] - rect.lo[2] + 1;
       dims[3] = rect.hi[3] - rect.lo[3] + 1;
       return miopenSet4dTensorDescriptor(
-          tensor, miopenFloat, dims[3], dims[2], dims[1], dims[0]);
+          tensor, cudnn_data_type, dims[3], dims[2], dims[1], dims[0]);
     }
     default:
       assert(false && "Unsupported dim number");
@@ -553,6 +603,49 @@ void handle_unimplemented_hip_kernel(OperatorType op_type) {
   throw std::runtime_error("Unimplemented hip kernel for Operator: " +
                            FlexFlow::get_operator_type_name(op_type));
 }
+void check_device_vs_host_ptr(void const *maybe_devicePtr) {
+  hipPointerAttribute_t attributes;
+  hipError_t hipStatus = hipPointerGetAttributes(&attributes, maybe_devicePtr);
+
+  if (hipStatus == hipSuccess) {
+    // Check attributes and perform actions accordingly
+    if (attributes.memoryType == hipMemoryTypeDevice) {
+      printf("Pointer is allocated in device memory.\n");
+    } else if (attributes.memoryType == hipMemoryTypeHost) {
+      printf("Pointer is allocated in host memory.\n");
+    } else if (attributes.memoryType == hipMemoryTypeArray) {
+      printf("Pointer points to array memory, physically located on device.\n");
+    } else if (attributes.memoryType == hipMemoryTypeManaged) {
+      printf("Pointer points to managed memory, automaticallly managed by the "
+             "unified memory system.\n");
+    } else if (attributes.memoryType == hipMemoryTypeUnified) {
+      printf("Pointer points to unified memory (not supported currently) \n");
+    } else {
+      printf("Pointer is not allocated in recognized memory type.\n");
+    }
+  } else {
+    fprintf(stderr,
+            "hipPointerGetAttributes failed: %s\n",
+            hipGetErrorString(hipStatus));
+  }
+}
+
+void check_ptr_alignment(void const *ptr) {
+  if (!ptr) {
+    printf("Pointer is NULL\n");
+    return;
+  }
+  bool aligned2 = ((uintptr_t)ptr % 2 == 0);
+  bool aligned4 = ((uintptr_t)ptr % 4 == 0);
+  bool aligned8 = ((uintptr_t)ptr % 8 == 0);
+  bool aligned16 = ((uintptr_t)ptr % 16 == 0);
+  printf("Pointer %p is aligned as follows: 2=%s, 4=%s, 8=%s, 16=%s\n",
+         ptr,
+         (aligned2 ? "yes" : "no"),
+         (aligned4 ? "yes" : "no"),
+         (aligned8 ? "yes" : "no"),
+         (aligned16 ? "yes" : "no"));
+}
 
 template __global__ void
     assign_kernel<half>(half *ptr, coord_t size, half value);
@@ -565,6 +658,13 @@ template __global__ void
 template __global__ void
     assign_kernel<int64_t>(int64_t *ptr, coord_t size, int64_t value);
 
+template __global__ void
+    scale_kernel<half>(half *ptr, coord_t size, half a, half b);
+template __global__ void
+    scale_kernel<float>(float *ptr, coord_t size, float a, float b);
+template __global__ void
+    scale_kernel<double>(double *ptr, coord_t size, double a, double b);
+
 template __global__ void
     add_kernel<half>(half *dst, half const *src, size_t size);
 template __global__ void
@@ -587,6 +687,15 @@ template __global__ void
 template __global__ void
     copy_kernel<int64_t>(int64_t *dst, int64_t const *src, coord_t size);
 
+template __global__ void copy_kernel_discrete<float>(float *dst,
+                                                     float const *src,
+                                                     coord_t size,
+                                                     size_t *index);
+template __global__ void copy_kernel_discrete<int64_t>(int64_t *dst,
+                                                       int64_t const *src,
+                                                       coord_t size,
+                                                       size_t *index);
+
 template __global__ void apply_add_with_scale<float>(float *data_ptr,
                                                      float const *grad_ptr,
                                                      size_t size,
@@ -604,16 +713,42 @@ template __global__ void apply_add_with_scale<int64_t>(int64_t *data_ptr,
                                                        size_t size,
                                                        int64_t scale);
 
-template __host__ void
-    print_tensor<float>(float const *ptr, size_t rect, char const *prefix);
-template __host__ void
-    print_tensor<double>(double const *ptr, size_t rect, char const *prefix);
-template __host__ void
-    print_tensor<int32_t>(int32_t const *ptr, size_t rect, char const *prefix);
-template __host__ void
-    print_tensor<int64_t>(int64_t const *ptr, size_t rect, char const *prefix);
-template __host__ void
-    print_tensor<half>(half const *ptr, size_t rect, char const *prefix);
+template __host__ void print_tensor<float>(float const *ptr,
+                                           size_t rect,
+                                           char const *prefix,
+                                           int shard_id);
+template __host__ void print_tensor<double>(double const *ptr,
+                                            size_t rect,
+                                            char const *prefix,
+                                            int shard_id);
+template __host__ void print_tensor<int32_t>(int32_t const *ptr,
+                                             size_t rect,
+                                             char const *prefix,
+                                             int shard_id);
+template __host__ void print_tensor<int64_t>(int64_t const *ptr,
+                                             size_t rect,
+                                             char const *prefix,
+                                             int shard_id);
+template __host__ void print_tensor<half>(half const *ptr,
+                                          size_t rect,
+                                          char const *prefix,
+                                          int shard_id);
+
+template __host__ void print_beam_tensor<float>(float const *ptr,
+                                                size_t num_elements,
+                                                int skip,
+                                                int channel,
+                                                char const *prefix);
+template __host__ void print_beam_tensor<int32_t>(int32_t const *ptr,
+                                                  size_t num_elements,
+                                                  int skip,
+                                                  int channel,
+                                                  char const *prefix);
+template __host__ void print_beam_tensor<int64_t>(int64_t const *ptr,
+                                                  size_t num_elements,
+                                                  int skip,
+                                                  int channel,
+                                                  char const *prefix);
 
 template __host__ void
     save_tensor<float>(float const *ptr, size_t rect, char const *file_name);
@@ -626,24 +761,43 @@ template __host__ void save_tensor<int64_t>(int64_t const *ptr,
 template __host__ void
     save_tensor<half>(half const *ptr, size_t rect, char const *file_name);
 
-template __host__ float *download_tensor<float>(float const *ptr,
-                                                size_t num_elements);
-template __host__ half *download_tensor<half>(half const *ptr,
-                                              size_t num_elements);
-template __host__ double *download_tensor<double>(double const *ptr,
-                                                  size_t num_elements);
-template __host__ int32_t *download_tensor<int32_t>(int32_t const *ptr,
-                                                    size_t num_elements);
-template __host__ int64_t *download_tensor<int64_t>(int64_t const *ptr,
-                                                    size_t num_elements);
-template __host__ bool
-    download_tensor<float>(float const *ptr, float *dst, size_t num_elements);
-template __host__ bool download_tensor<double>(double const *ptr,
-                                               double *dst,
-                                               size_t num_elements);
-template __host__ bool download_tensor<int32_t>(int32_t const *ptr,
-                                                int32_t *dst,
-                                                size_t num_elements);
-template __host__ bool download_tensor<int64_t>(int64_t const *ptr,
-                                                int64_t *dst,
-                                                size_t num_elements);
+template __host__ float *copy_tensor_dev_to_host<float>(float const *ptr,
+                                                        size_t num_elements);
+template __host__ half *copy_tensor_dev_to_host<half>(half const *ptr,
+                                                      size_t num_elements);
+template __host__ double *copy_tensor_dev_to_host<double>(double const *ptr,
+                                                          size_t num_elements);
+template __host__ int32_t *
+    copy_tensor_dev_to_host<int32_t>(int32_t const *ptr, size_t num_elements);
+template __host__ int64_t *
+    copy_tensor_dev_to_host<int64_t>(int64_t const *ptr, size_t num_elements);
+template __host__ void copy_tensor_dev_to_host<float>(float const *ptr,
+                                                      float *dst,
+                                                      size_t num_elements);
+template __host__ void copy_tensor_dev_to_host<half>(half const *ptr,
+                                                     half *dst,
+                                                     size_t num_elements);
+template __host__ void copy_tensor_dev_to_host<double>(double const *ptr,
+                                                       double *dst,
+                                                       size_t num_elements);
+template __host__ void copy_tensor_dev_to_host<int32_t>(int32_t const *ptr,
+                                                        int32_t *dst,
+                                                        size_t num_elements);
+template __host__ void copy_tensor_dev_to_host<int64_t>(int64_t const *ptr,
+                                                        int64_t *dst,
+                                                        size_t num_elements);
+template __host__ void copy_tensor_host_to_dev<float>(float *dst,
+                                                      float const *src,
+                                                      size_t num_elements);
+template __host__ void copy_tensor_host_to_dev<half>(half *dst,
+                                                     half const *src,
+                                                     size_t num_elements);
+template __host__ void copy_tensor_host_to_dev<double>(double *dst,
+                                                       double const *src,
+                                                       size_t num_elements);
+template __host__ void copy_tensor_host_to_dev<int32_t>(int32_t *dst,
+                                                        int32_t const *src,
+                                                        size_t num_elements);
+template __host__ void copy_tensor_host_to_dev<int64_t>(int64_t *dst,
+                                                        int64_t const *src,
+                                                        size_t num_elements);
diff --git a/src/runtime/inference_manager.cc b/src/runtime/inference_manager.cc
index 3d299aeedd..1b65dfd869 100644
--- a/src/runtime/inference_manager.cc
+++ b/src/runtime/inference_manager.cc
@@ -54,10 +54,31 @@ bool parallel_tensor_list_overlaps(std::vector<ParallelTensor> const &list1,
 }
 
 void InferenceManager::compile_model_and_allocate_buffer(FFModel *model) {
+
+  // Check if the model object exists
+  if (model == nullptr) {
+    std::cout << "###PEFT DEBUGGING### Model object does not exist."
+              << std::endl;
+    return; // Early return to prevent further operations on a nullptr
+  } else {
+    std::cout << "###PEFT DEBUGGING### Model object exists." << std::endl;
+  }
+
   // TODO: currently assume there is a single data-parallel pipeline
   // (i.e., data-parallel-degree == 1)
   assert(model->config.data_parallelism_degree == 1);
   model->config.batchSize = BatchConfig::max_tokens_per_batch();
+
+  // Check if the model object exists after importing config
+  if (model == nullptr) {
+    std::cout << "###PEFT DEBUGGING### Model object does not exist after "
+                 "setting config and batch size."
+              << std::endl;
+    return; // Early return to prevent further operations on a nullptr
+  } else {
+    std::cout << "###PEFT DEBUGGING### Model object still exists." << std::endl;
+  }
+
   model->compile_inference();
   Context ctx = model->config.lg_ctx;
   Runtime *runtime = model->config.lg_hlr;
@@ -117,7 +138,28 @@ void InferenceManager::compile_model_and_allocate_buffer(FFModel *model) {
     for (int i = 0; i < op->numOutputs; i++) {
       ParallelTensor pt_base = op->outputs[i];
       assert(tensor_buffer.find(pt_base) == tensor_buffer.end());
-
+      // no need to map inplace tensor
+      // A tensor is inplace if it shares the same region as another tensor
+      {
+        bool inplace = false;
+        for (int j = 0; j < op->numInputs; j++) {
+          if (op->inputs[j]->region == op->outputs[i]->region) {
+            assert(tensor_buffer.find(op->inputs[j]) != tensor_buffer.end());
+            tensor_buffer[pt_base] = tensor_buffer[op->inputs[j]];
+            inplace = true;
+          }
+        }
+        for (int j = 0; j < i; j++) {
+          if (op->outputs[j]->region == op->outputs[i]->region) {
+            assert(tensor_buffer.find(op->outputs[j]) != tensor_buffer.end());
+            tensor_buffer[pt_base] = tensor_buffer[op->outputs[j]];
+            inplace = true;
+          }
+        }
+        if (inplace) {
+          continue;
+        }
+      }
       if (op->op_type == OP_REPLICATE) {
         assert(op->numInputs == 1 && op->numOutputs == 1);
       }
@@ -175,7 +217,7 @@ void InferenceManager::compile_model_and_allocate_buffer(FFModel *model) {
           }
         }
         if (!found_parallel_tensor) {
-          log_offload.print(
+          log_offload.debug(
               "Cannot find a previous tensor for operator(%d) output_idx(%d)",
               op_idx,
               i);
@@ -191,6 +233,13 @@ void InferenceManager::compile_model_and_allocate_buffer(FFModel *model) {
                                              pt_base->region.get_field_space());
           pt->part = runtime->get_logical_partition(
               ctx, pt->region, pt_base->part.get_index_partition());
+
+          pt->region_grad =
+              runtime->create_logical_region(ctx,
+                                             pt_base->region.get_index_space(),
+                                             pt_base->region.get_field_space());
+          pt->part_grad = runtime->get_logical_partition(
+              ctx, pt->region_grad, pt_base->part.get_index_partition());
           pt->machine_view = machine_views[j];
           // std::cout << "output mv: " << pt->machine_view << std::endl;
           Domain part_domain =
@@ -205,6 +254,30 @@ void InferenceManager::compile_model_and_allocate_buffer(FFModel *model) {
     // std::cout << std::endl;
   }
 
+  // Check whether we need to reset input grads
+  // We use a parallel tensor's region as the key
+  std::set<LogicalRegion> reset_inputs;
+  for (int l = model->operators.size() - 1; l >= 0; l--) {
+    Op *op = model->operators[l];
+    for (int i = 0; i < op->numInputs; i++) {
+      assert(op->inputs[i]->region != LogicalRegion::NO_REGION);
+      if (reset_inputs.find(op->inputs[i]->region) != reset_inputs.end()) {
+        // We should not reset input grads since other operators have already
+        // saved gradients into the region
+        op->reset_input_grads[i] = false;
+      } else if (i == 0 && (op->op_type == OP_RESIDUAL_LAYERNORM ||
+                            op->op_type == OP_RESIDUAL_RMS_NORM ||
+                            op->op_type == OP_ADD_BIAS_RESIDUAL_LAYERNORM)) {
+        if (reset_inputs.find(op->outputs[0]->region) != reset_inputs.end()) {
+          op->reset_input_grads[0] = false;
+        }
+        reset_inputs.insert(op->inputs[i]->region);
+      } else {
+        reset_inputs.insert(op->inputs[i]->region);
+      }
+    }
+  }
+
   // Perform fusion optimizations
   if (model->config.perform_fusion) {
     fprintf(stderr, "Applying fusion optimizations during compilation...\n");
@@ -235,34 +308,35 @@ void InferenceManager::compile_model_and_allocate_buffer(FFModel *model) {
     if (op->op_type == OP_INPUT || op->op_type == OP_WEIGHT) {
       continue;
     }
-    printf("operator[%zu]: type(%s) guid(%lu)\n",
-           i,
-           get_operator_type_name(model->operators[i]->op_type).c_str(),
-           model->operators[i]->op_guid);
+    log_inf_mgr.debug(
+        "operator[%zu]: type(%s) guid(%lu)\n",
+        i,
+        get_operator_type_name(model->operators[i]->op_type).c_str(),
+        model->operators[i]->op_guid);
     for (int j = 0; j < op->numInputs; j++) {
       assert(tensor_buffer.find(op->inputs[j]) != tensor_buffer.end());
       LogicalRegion handle = tensor_buffer[op->inputs[j]][0]->region;
-      printf("\tinputs[%d] mapped_region(%d,%d,%d)\n",
-             j,
-             handle.get_index_space().get_id(),
-             handle.get_field_space().get_id(),
-             handle.get_tree_id());
+      log_inf_mgr.debug("\tinputs[%d] mapped_region(%d,%d,%d)\n",
+                        j,
+                        handle.get_index_space().get_id(),
+                        handle.get_field_space().get_id(),
+                        handle.get_tree_id());
     }
     for (int j = 0; j < op->numOutputs; j++) {
       LogicalRegion handle = tensor_buffer[op->outputs[j]][0]->region;
-      printf("\toutputs[%d] mapped_region(%d,%d,%d)\n",
-             j,
-             handle.get_index_space().get_id(),
-             handle.get_field_space().get_id(),
-             handle.get_tree_id());
+      log_inf_mgr.debug("\toutputs[%d] mapped_region(%d,%d,%d)\n",
+                        j,
+                        handle.get_index_space().get_id(),
+                        handle.get_field_space().get_id(),
+                        handle.get_tree_id());
     }
     for (int j = 0; j < op->numWeights; j++) {
       LogicalRegion handle = op->weights[j]->region;
-      printf("\tweights[%d] mapped_region(%d,%d,%d)\n",
-             j,
-             handle.get_index_space().get_id(),
-             handle.get_field_space().get_id(),
-             handle.get_tree_id());
+      log_inf_mgr.debug("\tweights[%d] mapped_region(%d,%d,%d)\n",
+                        j,
+                        handle.get_index_space().get_id(),
+                        handle.get_field_space().get_id(),
+                        handle.get_tree_id());
     }
   }
 }
@@ -290,9 +364,9 @@ void InferenceManager::init_operators_inference(FFModel *model) {
         assert(op->outputs[i]->parallel_is != IndexSpace::NO_SPACE);
         assert(tensor_buffer[op->outputs[i]].size() > batch_index);
         outputs[i] = tensor_buffer[op->outputs[i]][batch_index];
-        if (i > 0) {
-          assert(outputs[0]->machine_view == outputs[i]->machine_view);
-        }
+        // if (i > 0) {
+        //   assert(outputs[0]->machine_view == outputs[i]->machine_view);
+        // }
         assert(outputs[i]->parallel_is != IndexSpace::NO_SPACE);
       }
       if (op->is_parallel_op()) {
@@ -332,11 +406,12 @@ FutureMap InferenceManager::inference(FFModel *model,
 FutureMap InferenceManager::inference(FFModel *model,
                                       int index,
                                       BatchConfigFuture const &bc) {
-  // log_inf_mgr.print("mode(%d) num_active_tokens(%d) num_active_requests(%d)",
+  // log_inf_mgr.print("mode(%d) num_active_infr_tokens(%d)
+  // num_active_requests(%d)",
   //                   bc.get_mode(),
-  //                   bc.num_active_tokens(),
+  //                   bc.num_active_infr_tokens(),
   //                   bc.num_active_requests());
-  //  assert(bc.num_active_tokens() > 0 && bc.num_active_requests() > 0);
+  //  assert(bc.num_active_infr_tokens() > 0 && bc.num_active_requests() > 0);
   //  We currently assume that the index-th batch will be placed
   //  on the device_index-th device (except for the experts layers)
   int batch_index = index % model->config.data_parallelism_degree;
@@ -390,6 +465,53 @@ FutureMap InferenceManager::inference(FFModel *model,
   return fm;
 };
 
+void InferenceManager::peft_bwd(FFModel *model,
+                                int index,
+                                BatchConfigFuture const &bc) {
+  int batch_index = index % model->config.data_parallelism_degree;
+  FutureMap fm;
+  bool found_input_operator = false;
+  int last_op = model->operators.size() - 1;
+  // Assert that the last operator must be argmax or sampling
+  assert(model->operators[last_op]->op_type == OP_ARGMAX ||
+         model->operators[last_op]->op_type == OP_ARG_TOPK ||
+         model->operators[last_op]->op_type == OP_SAMPLING);
+  last_op -= 1;
+  while (model->operators[last_op]->op_type == OP_WEIGHT && last_op > 0) {
+    last_op -= 1;
+  }
+  for (int o = last_op; o >= 0; o--) {
+    Op *op = model->operators[o];
+    if (op->op_type == OP_WEIGHT) {
+      continue;
+    }
+    if (op->op_type == OP_INPUT) {
+      continue;
+    }
+    std::vector<ParallelTensor> inputs(op->numInputs);
+    std::vector<ParallelTensor> outputs(op->numOutputs);
+    for (int i = 0; i < op->numInputs; i++) {
+      assert(op->inputs[i] != nullptr);
+      assert(op->inputs[i]->parallel_is != IndexSpace::NO_SPACE);
+      assert(tensor_buffer[op->inputs[i]].size() > batch_index);
+      inputs[i] = tensor_buffer[op->inputs[i]][batch_index];
+      assert(inputs[i]->parallel_is != IndexSpace::NO_SPACE);
+    }
+    for (int i = 0; i < op->numOutputs; i++) {
+      assert(op->outputs[i] != nullptr);
+      assert(op->outputs[i]->parallel_is != IndexSpace::NO_SPACE);
+      if (op->op_type == OP_INPUT &&
+          tensor_buffer[op->outputs[i]].size() == 0) {
+        continue;
+      }
+      assert(tensor_buffer[op->outputs[i]].size() > batch_index);
+      outputs[i] = tensor_buffer[op->outputs[i]][batch_index];
+      assert(outputs[i]->parallel_is != IndexSpace::NO_SPACE);
+    }
+    op->peft_bwd(*model, bc, inputs, outputs);
+  }
+};
+
 void InferenceManager::load_input_tokens_from_batch_config(
     FFModel *model,
     BatchConfigFuture const &bc,
@@ -509,17 +631,26 @@ void FFModel::set_position_offset(int offset) {
 }
 
 void FFModel::compile_inference() {
+  std::cout << "###PEFT DEBUGGING### Entering compile_inference." << std::endl;
+
   // Request at least four CPU processors for inference runs
   assert(
       config.cpusPerNode >= 4 &&
       "FlexFlow Serve requires at least four CPU cores per node, please add "
       "`-ll:cpu 4` in the command line if you are using the C++ interface or "
       "set `num_cpus` in `ff.init` if you are using the Python interface");
+
+  std::cout << "###PEFT DEBUGGING### Configuration check passed: At least four "
+               "CPU cores per node."
+            << std::endl;
   Context ctx = config.lg_ctx;
   Runtime *runtime = config.lg_hlr;
   config.computationMode = COMP_MODE_INFERENCE;
   create_operators_from_layers();
+
   // Launch the graph optimize task
+  std::cout << "###PEFT DEBUGGING### Launching graph optimization task."
+            << std::endl;
   {
     FFModel *model = this;
     TaskLauncher launcher(GRAPH_OPTIMIZE_TASK_ID,
@@ -535,7 +666,7 @@ void FFModel::compile_inference() {
     deserialize_graph_optimal_view(dez, best_graph, optimal_views);
     operators.clear();
     convert_graph_to_operators(best_graph, optimal_views);
-    best_graph->print_dot();
+    // best_graph->print_dot();
     delete best_graph;
     for (auto const &layer : layers) {
       // map inputs to parallel tensor
@@ -570,6 +701,14 @@ void FFModel::compile_inference() {
       }
     }
   }
+
+  std::cout
+      << "###PEFT DEBUGGING### Operators reconstructed from optimized graph."
+      << std::endl;
+  // Perform inplace optimizations
+  std::cout << "###PEFT DEBUGGING### Starting inplace optimizations."
+            << std::endl;
+
   loss_op = nullptr;
   metrics_op = nullptr;
   // Perform inplace optimizations
@@ -609,6 +748,8 @@ void FFModel::compile_inference() {
     }
   }
 
+  // Output tensor mapping
+  std::cout << "###PEFT DEBUGGING### Mapping output tensors." << std::endl;
   for (size_t l = 0; l < operators.size(); l++) {
     Op *op = operators[l];
 
@@ -634,11 +775,14 @@ void FFModel::compile_inference() {
   }
 
 #ifdef FF_USE_NCCL
+  std::cout << "###PEFT DEBUGGING### Setting up NCCL communications."
+            << std::endl;
   for (size_t l = 0; l < operators.size(); l++) {
     // Only create nccl for allreduce and fusedop for inference
     // (fusedop may include allreduces)
     if (operators[l]->op_type == OP_ALLREDUCE ||
-        operators[l]->op_type == OP_FUSED) {
+        operators[l]->op_type == OP_PARALLEL_IDENTITY ||
+        operators[l]->op_type == OP_LORA || operators[l]->op_type == OP_FUSED) {
       MachineView view = operators[l]->outputs[0]->machine_view;
       if (view_hash_to_nccl_comms.find(view.hash()) ==
           view_hash_to_nccl_comms.end()) {
@@ -670,6 +814,8 @@ void FFModel::compile_inference() {
     }
   }
 #endif
+  std::cout << "###PEFT DEBUGGING### compile_inference completed successfully."
+            << std::endl;
 }
 
 std::string join_path(std::vector<std::string> const &paths) {
diff --git a/src/runtime/model.cc b/src/runtime/model.cc
index 4c67de1aa9..f46630db3c 100644
--- a/src/runtime/model.cc
+++ b/src/runtime/model.cc
@@ -47,6 +47,7 @@
 #include "flexflow/ops/inc_multihead_self_attention.h"
 #include "flexflow/ops/layer_norm.h"
 #include "flexflow/ops/linear.h"
+#include "flexflow/ops/lora_linear.h"
 #include "flexflow/ops/noop.h"
 #include "flexflow/ops/pool_2d.h"
 #include "flexflow/ops/reduce.h"
@@ -66,6 +67,7 @@
 #include "flexflow/parallel_ops/allreduce.h"
 #include "flexflow/parallel_ops/combine.h"
 #include "flexflow/parallel_ops/fused_parallel_op.h"
+#include "flexflow/parallel_ops/parallel_identity.h"
 #include "flexflow/parallel_ops/partition.h"
 #include "flexflow/parallel_ops/reduction.h"
 #include "flexflow/parallel_ops/replicate.h"
@@ -77,6 +79,7 @@
 #include <dirent.h>
 #include <queue>
 #include <unordered_set>
+#include <wordexp.h>
 
 namespace FlexFlow {
 
@@ -135,19 +138,21 @@ Op::Op(FFModel &model,
   std::string pcname;
   if (_name == NULL) {
     pcname = get_operator_type_name(op_type);
+    pcname = pcname + "_" + std::to_string(op_guid);
   } else {
     pcname = std::string(_name);
   }
-  pcname = pcname + "_" + std::to_string(op_guid);
   assert(pcname.length() < MAX_OPNAME);
+  // std::cout << "Creating operator: " << pcname << std::endl;
   std::strcpy(name, pcname.c_str());
+  // std::cout << "copied name into name var: " << this->name << std::endl;
   for (int i = 0; i < numInputs; i++) {
     assert(tensors[i] != NULL);
     inputs[i] = tensors[i];
   }
   for (int i = 0; i < numInputs; i++) {
-    trainableInputs[i] = true;
-    // resetInputGrads[i] = true;
+    trainable_inputs[i] = true;
+    reset_input_grads[i] = true;
   }
   for (int i = 0; i < MAX_NUM_OUTPUTS; i++) {
     outputs[i] = nullptr;
@@ -191,8 +196,8 @@ Op::Op(FFModel &model,
     }
   }
   for (int i = 0; i < numInputs; i++) {
-    trainableInputs[i] = true;
-    // resetInputGrads[i] = true;
+    trainable_inputs[i] = true;
+    reset_input_grads[i] = true;
   }
   for (int i = 0; i < MAX_NUM_OUTPUTS; i++) {
     outputs[i] = NULL;
@@ -1245,7 +1250,8 @@ void Op::set_argumentmap_for_init_inference(FFModel const &ff,
     int idx = 0;                                                               \
     for (PointInRectIterator<DIM> it(rect); it(); it++) {                      \
       FFHandler handle = ff.handlers[view.get_device_id(*it)];                 \
-      if (op_type == OP_ALLREDUCE) {                                           \
+      if (op_type == OP_ALLREDUCE || op_type == OP_LORA ||                     \
+          op_type == OP_PARALLEL_IDENTITY) {                                   \
         ncclComm_t *nccl_comms = ff.find_nccl_comms(view);                     \
         handle.ncclComm = nccl_comms[idx++];                                   \
       }                                                                        \
@@ -1475,10 +1481,12 @@ bool Op::get_weight_parameter(TNParameter tnp,
   return true;
 }
 
+#ifdef DEADCODE
 OpMeta::OpMeta(FFHandler _handle)
     : handle(_handle), profiling(false), inference_debugging(false) {
   for (int i = 0; i < MAX_NUM_INPUTS; i++) {
-    trainableInputs[i] = true;
+    trainable_inputs[i] = true;
+    reset_input_grads[i] = true;
   }
   for (int i = 0; i < MAX_NUM_INPUTS; i++) {
     input_type[i] = DT_NONE;
@@ -1490,9 +1498,17 @@ OpMeta::OpMeta(FFHandler _handle)
     output_type[i] = DT_NONE;
   }
   decoding_step = 0;
+  bwd_step = 0;
 }
+#endif
 
-OpMeta::OpMeta(FFHandler _handle, Op const *op) : OpMeta(_handle) {
+OpMeta::OpMeta(FFHandler _handle, Op const *op)
+    : handle(_handle), profiling(op->profiling),
+      inference_debugging(op->inference_debugging) {
+  for (int i = 0; i < op->numInputs; i++) {
+    trainable_inputs[i] = op->trainable_inputs[i];
+    reset_input_grads[i] = op->reset_input_grads[i];
+  }
   for (int i = 0; i < op->numInputs; i++) {
     input_type[i] = op->inputs[i]->data_type;
   }
@@ -1503,6 +1519,7 @@ OpMeta::OpMeta(FFHandler _handle, Op const *op) : OpMeta(_handle) {
     output_type[i] = op->outputs[i]->data_type;
   }
   decoding_step = 0;
+  bwd_step = 0;
 }
 
 FFRuntime::FFRuntime(FFConfig &config) {
@@ -1520,6 +1537,10 @@ FFRuntime::FFRuntime(FFConfig &config) {
     info.workSpaceSize = config.workSpaceSize;
     info.offload_reserve_space_size =
         config.cpu_offload ? config.offload_reserve_space_size : 0;
+    info.peft_activation_reserve_space_size =
+        config.enable_peft ? config.peft_activation_reserve_space_size : 0;
+    info.peft_weight_reserve_space_size =
+        config.enable_peft ? config.peft_weight_reserve_space_size : 0;
     info.quantization_type = config.quantization_type;
     info.allowTensorOpMathConversion = config.allow_tensor_op_math_conversion;
     argmap.set_point(*it, TaskArgument(&info, sizeof(FFInitInfo)));
@@ -1546,9 +1567,32 @@ FFRuntime *ffruntime_singleton = nullptr;
 
 int FFModel::model_counter = 0;
 
+void make_debug_dirs() {
+  char const *ff_cache_path = std::getenv("FF_CACHE_PATH");
+  std::string debug_dir_ =
+      ff_cache_path ? std::string(ff_cache_path) + "/debug/flexflow"
+                    : std::string("~/.cache/flexflow/debug/flexflow");
+  wordexp_t p;
+  wordexp(debug_dir_.c_str(), &p, 0);
+  debug_dir_ = p.we_wordv[0];
+  wordfree(&p);
+  fs::path debug_dir = debug_dir_;
+  if (fs::exists(debug_dir)) {
+    fs::remove_all(debug_dir);
+  }
+  fs::create_directories(debug_dir);
+  assert(fs::is_directory(debug_dir));
+  std::vector<std::string> debug_subdirs = {"fwd", "bwd", "optim", "weights"};
+  for (auto const &subdir : debug_subdirs) {
+    fs::path subdir_path = debug_dir / subdir;
+    fs::create_directory(subdir_path);
+  }
+}
+
 FFModel::FFModel(FFConfig &_config, bool cpu_offload)
     : op_global_guid(OP_GUID_FIRST_VALID),
       layer_global_guid(LAYER_GUID_FIRST_VALID),
+      peft_model_global_guid(PEFT_MODEL_ID_FIRST_VALID),
       tensor_global_guid(TENSOR_GUID_FIRST_VALID),
       parallel_tensor_global_guid(PARALLEL_TENSOR_GUID_FIRST_VALID),
       node_global_guid(NODE_GUID_FIRST_VALID), current_transformer_layer_id(0),
@@ -1586,6 +1630,9 @@ FFModel::FFModel(FFConfig &_config, bool cpu_offload)
   for (int idx = 0; idx < config.workersPerNode * config.numNodes; idx++) {
     handlers[idx] = ffruntime_singleton->handlers[idx];
   }
+  if (config.inference_debugging) {
+    make_debug_dirs();
+  }
   model_id = model_counter++;
 }
 
@@ -2932,7 +2979,8 @@ bool FFModel::apply_fusion(
     // don't fuse parallel op except allReduce since they have different
     // parallel_is in forward/backward
     if (operators[l]->is_parallel_op() &&
-        operators[l]->op_type != OP_ALLREDUCE) {
+        operators[l]->op_type != OP_ALLREDUCE &&
+        operators[l]->op_type != OP_PARALLEL_IDENTITY) {
       continue;
     }
     size_t start = 0;
@@ -2978,7 +3026,8 @@ bool FFModel::apply_fusion(
           // don't fuse parallel op except allReduce since they have different
           // parallel_is in forward/backward
           if (operators[i]->is_parallel_op() &&
-              operators[i]->op_type != OP_ALLREDUCE) {
+              operators[i]->op_type != OP_ALLREDUCE &&
+              operators[i]->op_type != OP_PARALLEL_IDENTITY) {
             continue;
           }
           fused_op = new FusedOp(*this, operators[i]);
@@ -3010,8 +3059,19 @@ bool FFModel::apply_fusion(
                     found = k;
                   }
                 }
-                assert(found >= 0);
-                op->inputs[idx] = fused_op->outputs[found];
+                if (found >= 0) {
+                  op->inputs[idx] = fused_op->outputs[found];
+                } else {
+                  for (int k = 0; k < fused_op->numInputs; k++) {
+                    if (fused_op->inputs[k]->region ==
+                        op->inputs[idx]->region) {
+                      assert(found == -1);
+                      found = k;
+                    }
+                  }
+                  assert(found >= 0);
+                  op->inputs[idx] = fused_op->inputs[found];
+                }
               }
             }
             // Insert op
@@ -3287,6 +3347,12 @@ Op *FFModel::create_operator_from_layer(
       operators.push_back(op);
       return op;
     }
+    // PEFT layers
+    case OP_LORA: {
+      Op *op = LoraLinear::create_operator_from_layer(*this, layer, inputs);
+      operators.push_back(op);
+      return op;
+    }
     default:
       assert(false);
   }
@@ -3313,9 +3379,123 @@ bool FFModel::is_mlp_block(int layer_idx) const {
   return false;
 }
 
+bool FFModel::need_to_add_combine(int layer_idx) const {
+  if (config.computationMode != COMP_MODE_INFERENCE ||
+      config.tensor_parallelism_degree == 1 || layers.size() <= 2) {
+    return false;
+  }
+  auto const &l = layers[layer_idx];
+  // softmax followed by argmax/arg_topk: add combine before softmax
+  if (layer_idx == layers.size() - 2) {
+    auto const &l_next = layers[layer_idx + 1];
+    if (l->op_type == OP_SOFTMAX &&
+        (l_next->op_type == OP_ARG_TOPK || l_next->op_type == OP_ARGMAX)) {
+      return true;
+    } else {
+      return false;
+    }
+  }
+  // argmax/arg_topk not precedent by softmax: add combine before
+  // argmax/arg_topk
+  if (layer_idx == layers.size() - 1 &&
+      (l->op_type == OP_ARG_TOPK || l->op_type == OP_ARGMAX)) {
+    auto const &l_prev = layers[layer_idx - 1];
+    if (l_prev->op_type == OP_SOFTMAX) {
+      return false;
+    }
+    return true;
+  }
+  return false;
+}
+
+bool FFModel::need_to_add_allreduce(int layer_idx) const {
+  auto const &l = layers[layer_idx];
+  if (config.computationMode == COMP_MODE_INFERENCE &&
+      config.tensor_parallelism_degree > 1 &&
+      (l->op_type == OP_INC_MULTIHEAD_SELF_ATTENTION ||
+       l->op_type == OP_TREE_INC_MULTIHEAD_SELF_ATTENTION ||
+       // mlp layer
+       is_mlp_block(layer_idx) ||
+       // llama mlp layer
+       (l->op_type == OP_LINEAR && layer_idx >= 2 &&
+        layers[layer_idx - 1]->op_type == OP_GELU &&
+        layers[layer_idx - 2]->op_type == OP_LINEAR) ||
+       // LLAMA without element-wise operator fusion
+       (l->op_type == OP_LINEAR && layer_idx >= 5 &&
+        layers[layer_idx - 1]->op_type == OP_EW_MUL &&
+        layers[layer_idx - 2]->op_type == OP_EW_MUL &&
+        layers[layer_idx - 3]->op_type == OP_SIGMOID &&
+        layers[layer_idx - 4]->op_type == OP_LINEAR &&
+        layers[layer_idx - 5]->op_type == OP_LINEAR) ||
+       // LLAMA with element-wise operator fusion
+       (l->op_type == OP_LINEAR && layer_idx >= 3 &&
+        layers[layer_idx - 1]->op_type == OP_SIGMOID_SILU_MULTI &&
+        layers[layer_idx - 2]->op_type == OP_LINEAR &&
+        layers[layer_idx - 3]->op_type == OP_LINEAR))) {
+    return true;
+  }
+  return false;
+}
+
+#ifdef DEADCODE
+bool FFModel::need_to_add_parallel_identity(int layer_idx) const {
+  auto const &l = layers[layer_idx];
+  // add parallel identity (allreduce in the backward pass) before the lm head
+  // we find the lm head by looking for the linear layer right after a residual
+  // rms norm / layer norm, and before a softmax, followed by
+  // argmax/argtopk/sampling
+  if (config.computationMode == COMP_MODE_INFERENCE &&
+      config.tensor_parallelism_degree > 1 &&
+      ((l->op_type == OP_RESIDUAL_RMS_NORM ||
+        l->op_type == OP_RESIDUAL_LAYERNORM) &&
+       // there are at least 2 layers before the norm, and at least 3 following
+       // the norm
+       layer_idx >= 2 && layer_idx < layers.size() - 3 &&
+       // norm is followed by linear layer (lm head)
+       layers[layer_idx + 1]->op_type == OP_LINEAR &&
+       // lm head is followed by softmax
+       layers[layer_idx + 2]->op_type == OP_SOFTMAX &&
+       // softmax is followed by argmax/argtopk/sampling
+       (layers[layer_idx + 3]->op_type == OP_ARG_TOPK ||
+        layers[layer_idx + 3]->op_type == OP_SAMPLING ||
+        layers[layer_idx + 3]->op_type == OP_ARGMAX ||
+        layers[layer_idx + 3]->op_type == OP_SCALAR_TRUE_DIV))) {
+    return true;
+  }
+  return false;
+}
+#endif
+bool FFModel::need_to_add_parallel_identity(int layer_idx) const {
+  auto const &l = layers[layer_idx];
+  // add parallel identity (allreduce in the backward pass) before the lm head
+  // we find the lm head by looking for the linear layer right after a residual
+  // rms norm / layer norm, and before a softmax, followed by
+  // argmax/argtopk/sampling
+  if (config.computationMode == COMP_MODE_INFERENCE &&
+      config.tensor_parallelism_degree > 1 &&
+      ((l->op_type == OP_RMS_NORM || l->op_type == OP_RESIDUAL_RMS_NORM ||
+        l->op_type == OP_LAYERNORM || l->op_type == OP_RESIDUAL_LAYERNORM) &&
+       // there are at least 2 layers before the norm, and at least 1 following
+       // the norm
+       layer_idx >= 2 && layer_idx < layers.size() - 1 &&
+       // norm is followed by linear layer or attention
+       (layers[layer_idx + 1]->op_type == OP_LINEAR ||
+        layers[layer_idx + 1]->op_type == OP_INC_MULTIHEAD_SELF_ATTENTION ||
+        layers[layer_idx + 1]->op_type ==
+            OP_TREE_INC_MULTIHEAD_SELF_ATTENTION ||
+        layers[layer_idx + 1]->op_type ==
+            OP_SPEC_INC_MULTIHEAD_SELF_ATTENTION))) {
+    return true;
+  }
+  return false;
+}
+
 void FFModel::create_operators_from_layers() {
   std::map<const Tensor, ParallelTensor> tensors_to_parallel_tensors;
-  // for (auto const &l : layers) {
+  std::map<const Tensor, ParallelTensor>
+      op_before_allreduce_tensors_to_parallel_tensors;
+  std::map<size_t, int> transformer_layer_allreduce_count;
+  std::map<size_t, int> transformer_layer_parallel_identity_count;
   for (int layer_idx = 0; layer_idx < layers.size(); layer_idx++) {
     auto const &l = layers[layer_idx];
     std::vector<ParallelTensor> inputs;
@@ -3323,14 +3503,19 @@ void FFModel::create_operators_from_layers() {
       // create new input tensors
       assert(tensors_to_parallel_tensors.find(l->inputs[i]) !=
              tensors_to_parallel_tensors.end());
-      inputs.push_back(tensors_to_parallel_tensors[l->inputs[i]]);
+      if (l->op_type == OP_LORA &&
+          op_before_allreduce_tensors_to_parallel_tensors.find(l->inputs[i]) !=
+              op_before_allreduce_tensors_to_parallel_tensors.end()) {
+        inputs.push_back(
+            op_before_allreduce_tensors_to_parallel_tensors[l->inputs[i]]);
+      } else {
+        inputs.push_back(tensors_to_parallel_tensors[l->inputs[i]]);
+      }
     }
     Op *op = nullptr;
-    // add a combine before arg_topk
-    if (config.computationMode == COMP_MODE_INFERENCE &&
-        config.tensor_parallelism_degree > 1 &&
-        (l->op_type == OP_ARG_TOPK || l->op_type == OP_SOFTMAX ||
-         l->op_type == OP_ARGMAX)) {
+    // add a combine before last arg_max / arg_topk or before second-to-last
+    // softmax
+    if (need_to_add_combine(layer_idx)) {
       std::vector<ParallelTensor> partitioned_inputs;
       assert(inputs.size() == 1);
       Combine *comb = new Combine(*this,
@@ -3353,37 +3538,97 @@ void FFModel::create_operators_from_layers() {
       //                                 config.tensor_parallelism_degree);
       // operators.push_back(repl);
       // op = repl;
-    } else if (config.computationMode == COMP_MODE_INFERENCE &&
-               config.tensor_parallelism_degree > 1 &&
-               (l->op_type == OP_INC_MULTIHEAD_SELF_ATTENTION ||
-                l->op_type == OP_TREE_INC_MULTIHEAD_SELF_ATTENTION ||
-                // mlp layer
-                is_mlp_block(layer_idx) ||
-                // llama mlp layer
-                (l->op_type == OP_LINEAR && layer_idx >= 2 &&
-                 layers[layer_idx - 1]->op_type == OP_GELU &&
-                 layers[layer_idx - 2]->op_type == OP_LINEAR) ||
-                // LLAMA without element-wise operator fusion
-                (l->op_type == OP_LINEAR && layer_idx >= 5 &&
-                 layers[layer_idx - 1]->op_type == OP_EW_MUL &&
-                 layers[layer_idx - 2]->op_type == OP_EW_MUL &&
-                 layers[layer_idx - 3]->op_type == OP_SIGMOID &&
-                 layers[layer_idx - 4]->op_type == OP_LINEAR &&
-                 layers[layer_idx - 5]->op_type == OP_LINEAR) ||
-                // LLAMA with element-wise operator fusion
-                (l->op_type == OP_LINEAR && layer_idx >= 3 &&
-                 layers[layer_idx - 1]->op_type == OP_SIGMOID_SILU_MULTI &&
-                 layers[layer_idx - 2]->op_type == OP_LINEAR &&
-                 layers[layer_idx - 3]->op_type == OP_LINEAR))) {
+      assert(op->numOutputs == l->numOutputs);
+      for (int i = 0; i < op->numOutputs; i++) {
+        assert(tensors_to_parallel_tensors.find(l->outputs[i]) ==
+               tensors_to_parallel_tensors.end());
+        tensors_to_parallel_tensors[l->outputs[i]] = op->outputs[i];
+      }
+    } else if (need_to_add_allreduce(layer_idx)) {
       assert(op->numOutputs == 1);
-      AllReduce *allreduce =
-          new AllReduce(*this, op->outputs[0], op->outputs[0]->num_dims - 1);
+      size_t transformer_layer_id = op->layer_guid.transformer_layer_id;
+      if (transformer_layer_allreduce_count.find(transformer_layer_id) ==
+          transformer_layer_allreduce_count.end()) {
+        transformer_layer_allreduce_count[transformer_layer_id] = 0;
+      }
+      std::string allreduce_name = std::string(
+          "layers." + std::to_string(transformer_layer_id) + ".allreduce." +
+          std::to_string(
+              transformer_layer_allreduce_count[transformer_layer_id]));
+      transformer_layer_allreduce_count[transformer_layer_id]++;
+      AllReduce *allreduce = new AllReduce(*this,
+                                           op->outputs[0],
+                                           op->outputs[0]->num_dims - 1,
+                                           allreduce_name.c_str());
       operators.push_back(allreduce);
+      op_before_allreduce_tensors_to_parallel_tensors[l->outputs[0]] =
+          op->outputs[0];
       op = allreduce;
+      assert(op->numOutputs == l->numOutputs);
+      for (int i = 0; i < op->numOutputs; i++) {
+        assert(tensors_to_parallel_tensors.find(l->outputs[i]) ==
+               tensors_to_parallel_tensors.end());
+        tensors_to_parallel_tensors[l->outputs[i]] = op->outputs[i];
+      }
+    } else if (need_to_add_parallel_identity(layer_idx)) {
+      assert(op->numOutputs == 1 || op->numOutputs == 2);
+      size_t transformer_layer_id = op->layer_guid.transformer_layer_id;
+      if (transformer_layer_parallel_identity_count.find(
+              transformer_layer_id) ==
+          transformer_layer_parallel_identity_count.end()) {
+        transformer_layer_parallel_identity_count[transformer_layer_id] = 0;
+      }
+      std::string parallel_identity_name = std::string(
+          "layers." + std::to_string(transformer_layer_id) +
+          ".parallel_identity." +
+          std::to_string(
+              transformer_layer_parallel_identity_count[transformer_layer_id]));
+      transformer_layer_parallel_identity_count[transformer_layer_id]++;
+      ParallelIdentity *parallel_identity = nullptr;
+      if (op->numOutputs == 1) {
+        parallel_identity =
+            new ParallelIdentity(*this,
+                                 op->outputs[0],
+                                 op->outputs[0]->num_dims - 1,
+                                 parallel_identity_name.c_str());
+      } else if (op->numOutputs == 2) {
+        parallel_identity =
+            new ParallelIdentity(*this,
+                                 op->outputs[1],
+                                 op->outputs[1]->num_dims - 1,
+                                 parallel_identity_name.c_str());
+        // output 0 is taken from the residual rms norm
+        assert(tensors_to_parallel_tensors.find(l->outputs[0]) ==
+               tensors_to_parallel_tensors.end());
+        tensors_to_parallel_tensors[l->outputs[0]] = op->outputs[0];
+      } else {
+        assert(false &&
+               "Op needing ParallelIdentity has unexpected number of outputs");
+      }
+      operators.push_back(parallel_identity);
+      assert(op->numOutputs == l->numOutputs);
+      // last output is taken from the parallel identity
+      assert(tensors_to_parallel_tensors.find(l->outputs[op->numOutputs - 1]) ==
+             tensors_to_parallel_tensors.end());
+      tensors_to_parallel_tensors[l->outputs[l->numOutputs - 1]] =
+          parallel_identity->outputs[0];
+      op = parallel_identity;
+    } else {
+      assert(op->numOutputs == l->numOutputs);
+      for (int i = 0; i < op->numOutputs; i++) {
+        assert(tensors_to_parallel_tensors.find(l->outputs[i]) ==
+               tensors_to_parallel_tensors.end());
+        tensors_to_parallel_tensors[l->outputs[i]] = op->outputs[i];
+      }
     }
-    assert(op->numOutputs == l->numOutputs);
-    for (int i = 0; i < op->numOutputs; i++) {
-      tensors_to_parallel_tensors[l->outputs[i]] = op->outputs[i];
+    // if the operator has op_type==OP_LORA, and the second-to-last operator in
+    // the operators vector has op_type==OP_ALLREDUCE, move the operator before
+    // the ALLREDUCE
+    if (op->op_type == OP_LORA && operators.size() > 1 &&
+        operators[operators.size() - 2]->op_type == OP_ALLREDUCE) {
+      Op *tmp = operators[operators.size() - 2];
+      operators[operators.size() - 2] = operators[operators.size() - 1];
+      operators[operators.size() - 1] = tmp;
     }
   }
 }
@@ -3424,7 +3669,7 @@ void FFModel::compile(LossType loss_type,
     deserialize_graph_optimal_view(dez, best_graph, optimal_views);
     operators.clear();
     convert_graph_to_operators(best_graph, optimal_views);
-    best_graph->print_dot();
+    // best_graph->print_dot();
     delete best_graph;
     for (auto const &layer : layers) {
       // map inputs to parallel tensor
@@ -3549,7 +3794,7 @@ void FFModel::compile(LossType loss_type,
     for (int i = 0; i < op->numInputs; i++) {
       assert(op->inputs[i]->owner_op != nullptr);
       if (op->inputs[i]->owner_op->op_type == OP_INPUT) {
-        op->trainableInputs[i] = false;
+        op->trainable_inputs[i] = false;
       }
     }
   }
@@ -3745,9 +3990,18 @@ bool FFModel::check_operators_integrity(
         }
         for (int i = 0; i < fused->op_num_outputs[op]; i++) {
           int my_off = fused->op_output_idx[i + ooff];
-          assert(fused->op_output_source[i + ooff] == FusedOp::SOURCE_OUTPUT);
-          assert(FusedOp::use_same_regions(
-              fused->outputs[my_off], old_op->outputs[i], pt_mapping));
+          assert(fused->op_output_source[i + ooff] == FusedOp::SOURCE_OUTPUT ||
+                 (fused->op_output_source[i + ooff] == FusedOp::SOURCE_INPUT &&
+                  (old_op->op_type == OP_RESIDUAL_LAYERNORM ||
+                   old_op->op_type == OP_RESIDUAL_RMS_NORM ||
+                   old_op->op_type == OP_ADD_BIAS_RESIDUAL_LAYERNORM)));
+          if (fused->op_output_source[i + ooff] == FusedOp::SOURCE_OUTPUT) {
+            assert(FusedOp::use_same_regions(
+                fused->outputs[my_off], old_op->outputs[i], pt_mapping));
+          } else {
+            assert(FusedOp::use_same_regions(
+                fused->inputs[my_off], old_op->outputs[i], pt_mapping));
+          }
         }
         ioff += fused->op_num_inputs[op];
         woff += fused->op_num_weights[op];
@@ -4086,6 +4340,12 @@ struct DefaultConfig {
   const static bool searchOverlapBackwardUpdate = false;
   const static size_t offloadReserveSpaceSize =
       (size_t)8 * 1024 * 1024 * 1024; // 8 GB
+  // PEFT related fields
+  const static bool enablePeft = false;
+  const static size_t peftActivationReserveSpaceSize =
+      (size_t)1 * 1024 * 1024 * 1024; // 1GB
+  const static size_t peftWeightReserveSpaceSize =
+      (size_t)1 * 1024 * 1024 * 1024; // 1GB
   const static bool cpuOffload = false;
   const static bool onlyDataParallel = true;
   const static bool enableSampleParallel = true;
@@ -4122,6 +4382,11 @@ FFConfig::FFConfig() {
   computationMode = COMP_MODE_TRAINING;
   cpu_offload = DefaultConfig::cpuOffload;
   offload_reserve_space_size = DefaultConfig::offloadReserveSpaceSize;
+  // PEFT related fields
+  enable_peft = DefaultConfig::enablePeft;
+  peft_activation_reserve_space_size =
+      DefaultConfig::peftActivationReserveSpaceSize;
+  peft_weight_reserve_space_size = DefaultConfig::peftWeightReserveSpaceSize;
   quantization_type = DT_NONE;
   only_data_parallel = DefaultConfig::onlyDataParallel;
   data_parallelism_degree = 1;
@@ -4248,6 +4513,18 @@ void FFConfig::parse_args(char **argv, int argc) {
       quantization_type = DT_INT8;
       continue;
     }
+    if ((!strcmp(argv[i], "-enable-peft"))) {
+      enable_peft = true;
+      continue;
+    }
+    if (!strcmp(argv[i], "-peft-activation-reserve-space-size")) {
+      peft_activation_reserve_space_size = atoll(argv[++i]) * 1024 * 1024;
+      continue;
+    }
+    if (!strcmp(argv[i], "-peft-weight-reserve-space-size")) {
+      peft_weight_reserve_space_size = atoll(argv[++i]) * 1024 * 1024;
+      continue;
+    }
     if ((!strcmp(argv[i], "--only-data-parallel"))) {
       only_data_parallel = true;
       continue;
@@ -5383,6 +5660,38 @@ void register_flexflow_internal_tasks(Runtime *runtime,
           registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(RESIDUAL_LAYERNORM_BWD_TASK_ID,
+                                   "residual_layernorm_bwd_task");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<ResidualLayerNorm::backward_task>(
+          registrar, "residual_layernorm_backward_task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<ResidualLayerNorm::backward_task>(
+          registrar);
+    }
+  }
+  {
+    TaskVariantRegistrar registrar(RESIDUAL_LAYERNORM_PEFT_BWD_TASK_ID,
+                                   "residual_layernorm_peft_bwd_task");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<ResidualLayerNorm::peft_bwd_task>(
+          registrar, "residual_layernorm_peft_bwd_task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<ResidualLayerNorm::peft_bwd_task>(
+          registrar);
+    }
+  }
   // AddBiasResidualLayerNorm task
   {
     TaskVariantRegistrar registrar(ADD_BIAS_RESIDUAL_LAYERNORM_INIT_TASK_ID,
@@ -5419,6 +5728,40 @@ void register_flexflow_internal_tasks(Runtime *runtime,
           registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(ADD_BIAS_RESIDUAL_LAYERNORM_BWD_TASK_ID,
+                                   "AddBiasResidualLayerNorm Backward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<
+          AddBiasResidualLayerNorm::backward_task>(
+          registrar, "AddBiasResidualLayerNorm Backward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<AddBiasResidualLayerNorm::backward_task>(
+          registrar);
+    }
+  }
+  {
+    TaskVariantRegistrar registrar(ADD_BIAS_RESIDUAL_LAYERNORM_PEFT_BWD_TASK_ID,
+                                   "AddBiasResidualLayerNorm PEFT Backward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<
+          AddBiasResidualLayerNorm::peft_bwd_task>(
+          registrar, "AddBiasResidualLayerNorm PEFT Backward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<AddBiasResidualLayerNorm::peft_bwd_task>(
+          registrar);
+    }
+  }
   // SigmoidSiluMulti task
   {
     TaskVariantRegistrar registrar(SIGMOID_SILU_MULTI_INIT_TASK_ID,
@@ -5452,6 +5795,38 @@ void register_flexflow_internal_tasks(Runtime *runtime,
           registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(SIGMOID_SILU_MULTI_BWD_TASK_ID,
+                                   "SigmoidSiluMulti Backward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<SigmoidSiluMulti::backward_task>(
+          registrar, "SigmoidSiluMulti Backward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<SigmoidSiluMulti::backward_task>(
+          registrar);
+    }
+  }
+  {
+    TaskVariantRegistrar registrar(SIGMOID_SILU_MULTI_PEFT_BWD_TASK_ID,
+                                   "SigmoidSiluMulti PEFT Bwd");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<SigmoidSiluMulti::peft_bwd_task>(
+          registrar, "SigmoidSiluMulti PEFT Bwd Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<SigmoidSiluMulti::peft_bwd_task>(
+          registrar);
+    }
+  }
   // rms norm task
   {
     TaskVariantRegistrar registrar(RMSNORM_INIT_TASK_ID, "rmsnorm_init_task");
@@ -5495,7 +5870,36 @@ void register_flexflow_internal_tasks(Runtime *runtime,
       runtime->register_task_variant<RMSNorm::inference_task>(registrar);
     }
   }
-  // rms norm task
+  {
+    TaskVariantRegistrar registrar(RMSNORM_BWD_TASK_ID, "RMS Norm Backward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<RMSNorm::backward_task>(
+          registrar, "RMS Norm Backward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<RMSNorm::backward_task>(registrar);
+    }
+  }
+  {
+    TaskVariantRegistrar registrar(RMSNORM_PEFT_BWD_TASK_ID,
+                                   "RMS Norm PEFT Backward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<RMSNorm::peft_bwd_task>(
+          registrar, "RMS Norm PEFT Backward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<RMSNorm::peft_bwd_task>(registrar);
+    }
+  }
+  // residual rms norm task
   {
     TaskVariantRegistrar registrar(RESIDUAL_RMSNORM_INIT_TASK_ID,
                                    "Residual RMS Norm Init");
@@ -5519,7 +5923,7 @@ void register_flexflow_internal_tasks(Runtime *runtime,
     registrar.set_leaf();
     if (pre_register) {
       Runtime::preregister_task_variant<ResidualRMSNorm::inference_task>(
-          registrar, "RMS Norm Inference Task");
+          registrar, "Residual RMS Norm Inference Task");
     } else {
       if (enable_control_replication) {
         registrar.global_registration = false;
@@ -5528,6 +5932,51 @@ void register_flexflow_internal_tasks(Runtime *runtime,
           registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(RESIDUAL_RMSNORM_BWD_TASK_ID,
+                                   "Residual RMS Norm Backward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<ResidualRMSNorm::backward_task>(
+          registrar, "Residual RMS Norm Backward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<ResidualRMSNorm::backward_task>(registrar);
+    }
+  }
+  {
+    TaskVariantRegistrar registrar(RESIDUAL_RMSNORM_PEFT_BWD_TASK_ID,
+                                   "Residual RMS Norm PEFT Backward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<ResidualRMSNorm::peft_bwd_task>(
+          registrar, "Residual RMS Norm PEFT Backward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<ResidualRMSNorm::peft_bwd_task>(registrar);
+    }
+  }
+  {
+    TaskVariantRegistrar registrar(LAYERNORM_PEFT_BWD_TASK_ID,
+                                   "layernorm_peft_bwd_task");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<LayerNorm::peft_bwd_task>(
+          registrar, "peft_bwd_task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<LayerNorm::peft_bwd_task>(registrar);
+    }
+  }
   {
     TaskVariantRegistrar registrar(LAYERNORM_BWD_TASK_ID, "layernorm_bwd_task");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
@@ -5571,6 +6020,21 @@ void register_flexflow_internal_tasks(Runtime *runtime,
       runtime->register_task_variant<Linear::inference_task>(registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(LINEAR_PEFT_BWD_TASK_ID,
+                                   "Linear PEFT Backward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<Linear::peft_bwd_task>(
+          registrar, "Linear PEFT Backward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<Linear::peft_bwd_task>(registrar);
+    }
+  }
   {
     TaskVariantRegistrar registrar(LINEAR_FWD_TASK_ID, "Linear Forward");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
@@ -5699,6 +6163,22 @@ void register_flexflow_internal_tasks(Runtime *runtime,
       runtime->register_task_variant<Softmax::inference_task>(registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(SOFTMAX_PEFT_BWD_TASK_ID,
+                                   "Softmax PEFT Backward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<Softmax::peft_bwd_task>(
+          registrar, "Softmax PEFT Backward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<Softmax::peft_bwd_task>(registrar);
+    }
+  }
+
   // compute Loss
   {
     TaskVariantRegistrar registrar(LOSS_BWD_TASK_ID, "Loss Backward");
@@ -6303,6 +6783,24 @@ void register_flexflow_internal_tasks(Runtime *runtime,
           registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(
+        INC_MULTIHEAD_SELF_ATTENTION_PEFT_BWD_TASK_ID,
+        "IncMultiHeadSelfAttention PEFT Backward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<
+          IncMultiHeadSelfAttention::peft_bwd_task>(
+          registrar, "IncMultiHeadSelfAttention PEFT Backward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<IncMultiHeadSelfAttention::peft_bwd_task>(
+          registrar);
+    }
+  }
   // speculative MultiHeadAttention task
   {
     TaskVariantRegistrar registrar(
@@ -6380,6 +6878,54 @@ void register_flexflow_internal_tasks(Runtime *runtime,
           TreeIncMultiHeadSelfAttention::inference_task>(registrar);
     }
   }
+  // PEFT tasks
+  // LoraLinear tasks
+  {
+    TaskVariantRegistrar registrar(LORA_LINEAR_INIT_TASK_ID, "LoraLinear Init");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<OpMeta *, LoraLinear::init_task>(
+          registrar, "LoraLinear Init Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<OpMeta *, LoraLinear::init_task>(
+          registrar);
+    }
+  }
+  {
+    TaskVariantRegistrar registrar(LORA_LINEAR_INF_TASK_ID,
+                                   "LoraLinear Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<LoraLinear::inference_task>(
+          registrar, "LoraLinear Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<LoraLinear::inference_task>(registrar);
+    }
+  }
+  {
+    TaskVariantRegistrar registrar(LORA_LINEAR_PEFT_BWD_TASK_ID,
+                                   "LoraLinear PEFT Backward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<LoraLinear::peft_bwd_task>(
+          registrar, "LoraLinear PEFT Backward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<LoraLinear::peft_bwd_task>(registrar);
+    }
+  }
+
   // NoOp
   {
     TaskVariantRegistrar registrar(NOOP_INIT_TASK_ID, "Weight NCCL Init");
@@ -6411,31 +6957,47 @@ void register_flexflow_internal_tasks(Runtime *runtime,
     }
   }
   {
-    TaskVariantRegistrar registrar(FUSEDOP_FWD_TASK_ID, "FusedOp Forward");
+    TaskVariantRegistrar registrar(FUSEDOP_INF_TASK_ID, "FusedOp Inference");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
     if (pre_register) {
-      Runtime::preregister_task_variant<FusedOp::forward_task>(
-          registrar, "FusedOp Forward Task");
+      Runtime::preregister_task_variant<FusedOp::inference_task>(
+          registrar, "FusedOp Inference Task");
     } else {
       if (enable_control_replication) {
         registrar.global_registration = false;
       }
-      runtime->register_task_variant<FusedOp::forward_task>(registrar);
+      runtime->register_task_variant<FusedOp::inference_task>(registrar);
     }
   }
   {
-    TaskVariantRegistrar registrar(FUSEDOP_INF_TASK_ID, "FusedOp Inference");
+    TaskVariantRegistrar registrar(FUSEDOP_PEFT_BWD_TASK_ID,
+                                   "FusedOp PEFT Backward");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
     if (pre_register) {
-      Runtime::preregister_task_variant<FusedOp::inference_task>(
-          registrar, "FusedOp Inference Task");
+      Runtime::preregister_task_variant<FusedOp::peft_bwd_task>(
+          registrar, "FusedOp PEFT Backward Task");
     } else {
       if (enable_control_replication) {
         registrar.global_registration = false;
       }
-      runtime->register_task_variant<FusedOp::inference_task>(registrar);
+      runtime->register_task_variant<FusedOp::peft_bwd_task>(registrar);
+    }
+  }
+
+  {
+    TaskVariantRegistrar registrar(FUSEDOP_FWD_TASK_ID, "FusedOp Forward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<FusedOp::forward_task>(
+          registrar, "FusedOp Forward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<FusedOp::forward_task>(registrar);
     }
   }
   {
@@ -6529,6 +7091,20 @@ void register_flexflow_internal_tasks(Runtime *runtime,
       runtime->register_task_variant<Combine::forward_task>(registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(COMBINE_INF_TASK_ID, "Combine Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<Combine::inference_task>(
+          registrar, "Combine Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<Combine::inference_task>(registrar);
+    }
+  }
   {
     TaskVariantRegistrar registrar(COMBINE_BWD_TASK_ID, "Combine Backward");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
@@ -6543,6 +7119,21 @@ void register_flexflow_internal_tasks(Runtime *runtime,
       runtime->register_task_variant<Combine::backward_task>(registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(COMBINE_PEFT_BWD_TASK_ID,
+                                   "Combine PEFT Backward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<Combine::peft_bwd_task>(
+          registrar, "Combine PEFT Backward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<Combine::peft_bwd_task>(registrar);
+    }
+  }
   // Replicate
   {
     TaskVariantRegistrar registrar(REPLICATE_INIT_TASK_ID, "Replicate Init");
@@ -6586,6 +7177,21 @@ void register_flexflow_internal_tasks(Runtime *runtime,
       runtime->register_task_variant<Replicate::backward_task>(registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(REPLICATE_PEFT_BWD_TASK_ID,
+                                   "Replicate PEFT Backward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<Replicate::peft_bwd_task>(
+          registrar, "Replicate PEFT Backward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<Replicate::peft_bwd_task>(registrar);
+    }
+  }
   // Reduction
   {
     TaskVariantRegistrar registrar(REDUCTION_INIT_TASK_ID, "Reduction Init");
@@ -6644,6 +7250,34 @@ void register_flexflow_internal_tasks(Runtime *runtime,
       runtime->register_task_variant<OpMeta *, AllReduce::init_task>(registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(ALLREDUCE_FWD_TASK_ID, "AllReduce Forward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<AllReduce::forward_task>(
+          registrar, "AllReduce Forward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<AllReduce::forward_task>(registrar);
+    }
+  }
+  {
+    TaskVariantRegistrar registrar(ALLREDUCE_BWD_TASK_ID, "AllReduce Backward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<AllReduce::backward_task>(
+          registrar, "AllReduce Backward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<AllReduce::backward_task>(registrar);
+    }
+  }
   {
     TaskVariantRegistrar registrar(ALLREDUCE_INF_TASK_ID,
                                    "AllReduce Inference");
@@ -6660,33 +7294,101 @@ void register_flexflow_internal_tasks(Runtime *runtime,
     }
   }
   {
-    TaskVariantRegistrar registrar(ALLREDUCE_FWD_TASK_ID, "AllReduce Forward");
+    TaskVariantRegistrar registrar(ALLREDUCE_PEFT_BWD_TASK_ID,
+                                   "AllReduce PEFT Backward");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
     if (pre_register) {
-      Runtime::preregister_task_variant<AllReduce::forward_task>(
-          registrar, "AllReduce Forward Task");
+      Runtime::preregister_task_variant<AllReduce::peft_bwd_task>(
+          registrar, "AllReduce PEFT Backward Task");
     } else {
       if (enable_control_replication) {
         registrar.global_registration = false;
       }
-      runtime->register_task_variant<AllReduce::forward_task>(registrar);
+      runtime->register_task_variant<AllReduce::peft_bwd_task>(registrar);
     }
   }
+  // ParallelIdentity
   {
-    TaskVariantRegistrar registrar(ALLREDUCE_BWD_TASK_ID, "AllReduce Backward");
+    TaskVariantRegistrar registrar(PARALLEL_IDENTITY_INIT_TASK_ID,
+                                   "ParallelIdentity Init");
     registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
     registrar.set_leaf();
     if (pre_register) {
-      Runtime::preregister_task_variant<AllReduce::backward_task>(
-          registrar, "AllReduce Backward Task");
+      Runtime::preregister_task_variant<OpMeta *, ParallelIdentity::init_task>(
+          registrar, "ParallelIdentity init Task");
     } else {
       if (enable_control_replication) {
         registrar.global_registration = false;
       }
-      runtime->register_task_variant<AllReduce::backward_task>(registrar);
+      runtime->register_task_variant<OpMeta *, ParallelIdentity::init_task>(
+          registrar);
     }
   }
+  {
+    TaskVariantRegistrar registrar(PARALLEL_IDENTITY_FWD_TASK_ID,
+                                   "ParallelIdentity Forward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<ParallelIdentity::forward_task>(
+          registrar, "ParallelIdentity Forward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<ParallelIdentity::forward_task>(registrar);
+    }
+  }
+  {
+    TaskVariantRegistrar registrar(PARALLEL_IDENTITY_BWD_TASK_ID,
+                                   "ParallelIdentity Backward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<ParallelIdentity::backward_task>(
+          registrar, "ParallelIdentity Backward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<ParallelIdentity::backward_task>(
+          registrar);
+    }
+  }
+  {
+    TaskVariantRegistrar registrar(PARALLEL_IDENTITY_INF_TASK_ID,
+                                   "ParallelIdentity Inference");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<ParallelIdentity::inference_task>(
+          registrar, "ParallelIdentity Inference Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<ParallelIdentity::inference_task>(
+          registrar);
+    }
+  }
+  {
+    TaskVariantRegistrar registrar(PARALLEL_IDENTITY_PEFT_BWD_TASK_ID,
+                                   "ParallelIdentity PEFT Backward");
+    registrar.add_constraint(ProcessorConstraint(Processor::TOC_PROC));
+    registrar.set_leaf();
+    if (pre_register) {
+      Runtime::preregister_task_variant<ParallelIdentity::peft_bwd_task>(
+          registrar, "ParallelIdentity PEFT Backward Task");
+    } else {
+      if (enable_control_replication) {
+        registrar.global_registration = false;
+      }
+      runtime->register_task_variant<ParallelIdentity::peft_bwd_task>(
+          registrar);
+    }
+  }
+
   // FusedParallelOp
   {
     TaskVariantRegistrar registrar(FUSED_PARALLELOP_FWD_TASK_ID,
diff --git a/src/runtime/model.cpp b/src/runtime/model.cpp
index 62f6b89b7f..9f3e2fbb10 100644
--- a/src/runtime/model.cpp
+++ b/src/runtime/model.cpp
@@ -165,8 +165,8 @@ FFHandler
                                            0,
                                            Realm::ProfilingRequestSet())
         .wait();
-    handle.batch_config_metadata =
-        workspaceInst.pointer_untyped(0, sizeof(char));
+    handle.batch_config_metadata = static_cast<CombinedBatchConfigMetaStruct *>(
+        workspaceInst.pointer_untyped(0, sizeof(char)));
   } else {
     handle.batch_config_metadata = nullptr;
   }
diff --git a/src/runtime/model.cu b/src/runtime/model.cu
index fd39ed0db0..5dab73e1a4 100644
--- a/src/runtime/model.cu
+++ b/src/runtime/model.cu
@@ -14,6 +14,8 @@
  */
 #include "flexflow/model.h"
 #include "flexflow/utils/cuda_helper.h"
+#include "flexflow/utils/memory_allocator.h"
+#include "flexflow/utils/peft_weight_allocator.h"
 
 namespace FlexFlow {
 // declare Legion names
@@ -161,12 +163,51 @@ FFHandler
                                            0,
                                            Realm::ProfilingRequestSet())
         .wait();
-    handle.batch_config_metadata =
-        workspaceInst.pointer_untyped(0, sizeof(char));
+    handle.batch_config_metadata = static_cast<CombinedBatchConfigMetaStruct *>(
+        workspaceInst.pointer_untyped(0, sizeof(char)));
   } else {
     handle.batch_config_metadata = nullptr;
   }
 
+  if (info->peft_activation_reserve_space_size > 0) {
+    // allocate memory for peft activation reserve space
+    Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                         .only_kind(Memory::GPU_FB_MEM)
+                         .best_affinity_to(task->target_proc)
+                         .first();
+    Realm::RegionInstance workspaceInst;
+    handle.peft_activation_allocator = new MemoryAllocator(gpu_mem);
+    handle.peft_activation_allocator->create_legion_instance(
+        workspaceInst, info->peft_activation_reserve_space_size);
+  } else {
+    handle.peft_activation_allocator = nullptr;
+  }
+
+  if (info->peft_weight_reserve_space_size > 0) {
+    // allocate memory for peft weight reserve space
+    Memory gpu_mem = Machine::MemoryQuery(Machine::get_machine())
+                         .only_kind(Memory::GPU_FB_MEM)
+                         .best_affinity_to(task->target_proc)
+                         .first();
+    Realm::Rect<1, coord_t> bounds(
+        Realm::Point<1, coord_t>(0),
+        Realm::Point<1, coord_t>(info->peft_weight_reserve_space_size - 1));
+    std::vector<size_t> field_sizes;
+    field_sizes.push_back(sizeof(char));
+    Realm::RegionInstance workspaceInst;
+    Realm::RegionInstance::create_instance(workspaceInst,
+                                           gpu_mem,
+                                           bounds,
+                                           field_sizes,
+                                           0,
+                                           Realm::ProfilingRequestSet())
+        .wait();
+    void *ptr = workspaceInst.pointer_untyped(0, sizeof(char));
+    handle.peft_weight_allocator =
+        new PEFTWeightAllocator(ptr, info->peft_weight_reserve_space_size);
+  } else {
+    handle.peft_weight_allocator = nullptr;
+  }
   // checkCUDA(cudaMalloc(&handle.workSpace, handle.workSpaceSize));
 #ifdef FF_USE_NCCL
   handle.ncclComm = NULL;
diff --git a/src/runtime/operator.cc b/src/runtime/operator.cc
index 36ac02a3a3..dcac52397a 100644
--- a/src/runtime/operator.cc
+++ b/src/runtime/operator.cc
@@ -2,14 +2,7 @@
 #include "flexflow/ffconst_utils.h"
 #include "flexflow/simulator.h"
 #include <stdexcept>
-
-#include <sys/stat.h>
-#include <sys/types.h>
-#if defined(FF_USE_CUDA) || defined(FF_USE_HIP_CUDA)
-#include "flexflow/utils/cuda_helper.h"
-#else
-#include "flexflow/utils/hip_helper.h"
-#endif
+#include <wordexp.h>
 
 namespace FlexFlow {
 
@@ -25,4 +18,31 @@ size_t Op::get_params_hash() const {
       get_operator_type_name(this->op_type));
 }
 
+fs::path get_dst_folder(std::string const &subdir,
+                        int step_idx,
+                        int shard_idx,
+                        bool before_kernel) {
+  std::vector<std::string> debug_subdirs = {"fwd", "bwd", "optim", "weights"};
+  assert(std::find(debug_subdirs.begin(), debug_subdirs.end(), subdir) !=
+         debug_subdirs.end());
+  std::string step_substr = "step_" + std::to_string(step_idx);
+  if (before_kernel) {
+    step_substr += "_pre";
+  }
+  char const *ff_cache_path = std::getenv("FF_CACHE_PATH");
+  std::string debug_dir_ =
+      ff_cache_path ? std::string(ff_cache_path) + "/debug/flexflow"
+                    : std::string("~/.cache/flexflow/debug/flexflow");
+  wordexp_t p;
+  wordexp(debug_dir_.c_str(), &p, 0);
+  debug_dir_ = p.we_wordv[0];
+  wordfree(&p);
+  fs::path debug_dir = debug_dir_;
+  assert(fs::is_directory(debug_dir));
+  fs::path dst_folder =
+      debug_dir / subdir / step_substr / ("shard_" + std::to_string(shard_idx));
+  fs::create_directories(dst_folder);
+  return dst_folder;
+}
+
 }; // namespace FlexFlow
\ No newline at end of file
diff --git a/src/runtime/operator_params.cc b/src/runtime/operator_params.cc
index 6b2d223f54..e9feb86eb5 100644
--- a/src/runtime/operator_params.cc
+++ b/src/runtime/operator_params.cc
@@ -42,6 +42,7 @@
 #include "flexflow/parallel_ops/allreduce.h"
 #include "flexflow/parallel_ops/combine.h"
 #include "flexflow/parallel_ops/fused_parallel_op.h"
+#include "flexflow/parallel_ops/parallel_identity.h"
 #include "flexflow/parallel_ops/partition.h"
 #include "flexflow/parallel_ops/reduction.h"
 #include "flexflow/parallel_ops/replicate.h"
@@ -119,6 +120,8 @@ tl::optional<OperatorParameters> get_op_parameters(Op const *op) {
       return ((Combine *)op)->get_params();
     case OP_ALLREDUCE:
       return ((AllReduce *)op)->get_params();
+    case OP_PARALLEL_IDENTITY:
+      return ((ParallelIdentity *)op)->get_params();
     case OP_FUSED_PARALLEL:
       return ((FusedParallelOp *)op)->get_params();
     case OP_TRANSPOSE:
diff --git a/src/runtime/request_manager.cc b/src/runtime/request_manager.cc
index bada87ab19..31a32dd3c8 100644
--- a/src/runtime/request_manager.cc
+++ b/src/runtime/request_manager.cc
@@ -14,6 +14,8 @@
  */
 
 #include "flexflow/request_manager.h"
+#include "flexflow/ops/fused.h"
+#include "flexflow/ops/lora_linear.h"
 #include "flexflow/parallel_ops/parallel_op.h"
 // #include "flexflow/tokenizers.h"
 #include <bitset>
@@ -21,6 +23,7 @@
 #include <future>
 #include <iomanip>
 #include <new>
+#include <nlohmann/json.hpp>
 #include <stack>
 #include <stdexcept>
 
@@ -28,12 +31,16 @@ namespace FlexFlow {
 
 using namespace Legion;
 using tokenizers::Tokenizer;
+using json = nlohmann::json;
 
 Legion::Logger log_req_mgr("RequestManager");
 
 std::string LoadBytesFromFile(std::string const &path) {
   std::ifstream fs(path, std::ios::in | std::ios::binary);
-  assert(!fs.fail() && "no such file");
+  if (fs.fail()) {
+    std::cerr << "Failed to open file: " << path << std::endl;
+    assert(false);
+  }
   std::string data;
   fs.seekg(0, std::ios::end);
   size_t size = static_cast<size_t>(fs.tellg());
@@ -43,6 +50,52 @@ std::string LoadBytesFromFile(std::string const &path) {
   return data;
 }
 
+std::ostream &operator<<(std::ostream &os, Request const &req) {
+  os << "Request {\n";
+  os << "  guid: " << req.guid << "\n";
+  os << "  peft_model_id: " << req.peft_model_id << "\n";
+  os << "  max_sequence_length: " << req.max_sequence_length << "\n";
+  os << "  initial_len: " << req.initial_len << "\n";
+  os << "  ssm_cache_size: " << req.ssm_cache_size << "\n";
+  os << "  llm_cache_size: " << req.llm_cache_size << "\n";
+  os << "  status: " << static_cast<int>(req.status) << "\n";
+  os << "  tokens: [";
+  for (auto const &token : req.tokens) {
+    os << token << " ";
+  }
+  os << "]\n";
+  os << "  prompt: " << req.prompt << "\n";
+  // os << "  beam_trees: [";
+  // for (const auto& tree : req.beam_trees) {
+  //     // Assuming BeamTree has its own << operator defined
+  //     os << tree << " ";
+  // }
+  // os << "]\n";
+  os << "  req_type: " << static_cast<int>(req.req_type) << "\n";
+  os << "  completed_training_steps: " << req.completed_training_steps << "\n";
+  os << "  gradient_accumulation_steps: " << req.gradient_accumulation_steps
+     << "\n";
+  os << "  max_training_steps: " << req.max_training_steps << "\n";
+  os << "  dataset_filepath: " << req.dataset_filepath << "\n";
+  os << "  dataset: [";
+  for (auto const &pair : req.dataset) {
+    os << "[";
+    for (auto const &token : pair.first) {
+      os << token << " ";
+    }
+    os << "], [";
+    for (auto const &token : pair.second) {
+      os << token << " ";
+    }
+    os << "] ";
+  }
+  os << "]\n";
+  os << "}\n";
+  return os;
+}
+
+bool RequestManager::inference_finished = false;
+
 RequestManager::RequestManager()
     : request_manager_status(INITIALIZED), verbose(false),
       next_available_guid(1000000), num_processed_requests(0),
@@ -114,6 +167,14 @@ void RequestManager::push_spec_infer_tree_width(int tree_width) {
   spec_infer_tree_width.emplace_back(tree_width);
 }
 
+void RequestManager::set_enable_peft_finetuning(bool enable_peft_finetuning_) {
+  enable_peft_finetuning = enable_peft_finetuning_;
+}
+
+void RequestManager::set_inference_finished(bool finished) {
+  inference_finished = finished;
+}
+
 void RequestManager::register_tokenizer(ModelType type,
                                         int bos_token_id,
                                         int eos_token_id,
@@ -121,33 +182,45 @@ void RequestManager::register_tokenizer(ModelType type,
   this->model_type = type;
   this->bos_token_id = bos_token_id;
   this->eos_token_id = eos_token_id;
-  std::string tokenizer_folder =
-      (!path.empty() && path.back() != '/') ? path + '/' : path;
+  std::filesystem::path tokenizer_folder(path);
+
   if (model_type == ModelType::LLAMA) {
-    bool path_to_file = !path.empty() &&
-                        (path.size() >= strlen("tokenizer.model")) &&
-                        path.find("tokenizer.model") ==
-                            (path.size() - strlen("tokenizer.model"));
-    std::string tokenizer_filepath =
-        path_to_file ? path : tokenizer_folder + "tokenizer.model";
-    this->tokenizer_ =
-        Tokenizer::FromBlobSentencePiece(LoadBytesFromFile(tokenizer_filepath));
+    std::filesystem::path tokenizer_model_path;
+    if (std::filesystem::is_directory(tokenizer_folder)) {
+      tokenizer_model_path =
+          std::filesystem::path(tokenizer_folder) / "tokenizer.model";
+    } else {
+      tokenizer_model_path = tokenizer_folder;
+    }
+    if (std::filesystem::exists(tokenizer_model_path)) {
+      // load from tokenizer.model
+      this->tokenizer_ = Tokenizer::FromBlobSentencePiece(
+          LoadBytesFromFile(tokenizer_model_path.string()));
+    } else {
+      // load from tokenizer.json
+      std::filesystem::path tokenizer_json_path =
+          tokenizer_folder / "tokenizer.json";
+      if (!std::filesystem::exists(tokenizer_json_path)) {
+        std::cerr << "Failed to open file: " << tokenizer_json_path
+                  << std::endl;
+        assert(false);
+      }
+      this->tokenizer_ = Tokenizer::FromBlobJSON(
+          LoadBytesFromFile(tokenizer_json_path.string()));
+    }
   } else if (model_type == ModelType::OPT) {
-    std::string vocab_file = tokenizer_folder + "vocab.json";
-    std::string merges_file = tokenizer_folder + "merges.txt";
-    std::string added_tokens_file =
-        tokenizer_folder + "special_tokens_map.json";
-    std::filesystem::path path1(vocab_file);
-    std::filesystem::path path2(merges_file);
-    std::filesystem::path path3(added_tokens_file);
-    assert(std::filesystem::exists(path1) &&
+    std::filesystem::path vocab_file = tokenizer_folder / "vocab.json";
+    std::filesystem::path merges_file = tokenizer_folder / "merges.txt";
+    std::filesystem::path added_tokens_file =
+        tokenizer_folder / "special_tokens_map.json";
+    assert(std::filesystem::exists(vocab_file) &&
            "Vocab file vocab.json does not exist at the specified path");
-    assert(std::filesystem::exists(path2) &&
+    assert(std::filesystem::exists(merges_file) &&
            "Merge file merges.txt does not exist at the specified path");
     // opt_tokenizer = new OptTokenizer(vocab_file, merges_file);
-    std::string vocab = LoadBytesFromFile(path1.string());
-    std::string merges = LoadBytesFromFile(path2.string());
-    std::string added_tokens = LoadBytesFromFile(path3.string());
+    std::string vocab = LoadBytesFromFile(vocab_file.string());
+    std::string merges = LoadBytesFromFile(merges_file.string());
+    std::string added_tokens = LoadBytesFromFile(added_tokens_file.string());
 
     this->tokenizer_ =
         Tokenizer::FromBlobByteLevelBPE(vocab, merges, added_tokens);
@@ -182,28 +255,40 @@ size_t RequestManager::get_num_ssms() {
 }
 
 RequestManager::RequestGuid
-    RequestManager::register_new_request(std::vector<TokenId> const &prompt,
-                                         int max_sequence_length) {
+    RequestManager::register_new_request(Request const &request_) {
   const std::lock_guard<std::mutex> lock(request_queue_mutex);
-
   // Add a new request
   Request request;
   request.status = Request::PENDING;
   request.guid = next_available_guid++;
-  request.max_sequence_length = max_sequence_length;
-
-  if (prompt.size() >= get_max_sequence_length()) {
-    std::cout << "Warning: too many tokens in prompt, only load up to "
-              << get_max_sequence_length() << " tokens, but got "
-              << prompt.size() << ".\n";
-
-    printf("tokens size: %zu\n", request.tokens.size());
-    return INVALID_GUID;
+  request.max_sequence_length = request_.max_sequence_length;
+  request.peft_model_id = request_.peft_model_id;
+  request.warmup = request_.warmup;
+  if (bos_token_id >= 0 && model_type != ModelType::FALCON) {
+    request.tokens.push_back(bos_token_id);
+  }
+  if (request_.benchmarking_tokens >= 0) {
+    assert(request_.benchmarking_tokens < get_max_sequence_length());
+    request.benchmarking_tokens = request_.benchmarking_tokens;
+    request.tokens.insert(request.tokens.end(),
+                          request_.benchmarking_tokens,
+                          15); // insert random number
   } else {
-    request.initial_len = prompt.size();
-    request.tokens = prompt;
+    std::vector<int32_t> tokens = this->tokenizer_->Encode(request_.prompt);
+    if (tokens.size() >= get_max_sequence_length()) {
+      std::cout << "Warning: too many tokens in prompt, only load up to "
+                << get_max_sequence_length() << " tokens, but got "
+                << tokens.size() << ".\n";
+      return INVALID_GUID;
+    }
+    for (int i = 0; i < tokens.size(); i++) {
+      std::cout << "[" << i << "]" << tokens.at(i) << "\n";
+    }
+    request.tokens.insert(request.tokens.end(), tokens.begin(), tokens.end());
   }
 
+  request.initial_len = request.tokens.size();
+
   if (get_num_ssms() == 0) {
     std::cout << "No small speculative model registered, using incremental "
                  "decoding."
@@ -216,58 +301,111 @@ RequestManager::RequestGuid
     }
   }
 
-  pending_request_queue.push(request);
+  pending_infr_request_queue.push(request);
   all_requests[request.guid] = request;
   {
     const std::lock_guard<std::mutex> lock(request_to_promise_mutex);
     request_to_promise[request.guid] = new std::promise<void>();
   }
 
-  if (verbose) {
-    std::cout << "new req: " << request.tokens.size() << std::endl;
+  {
+    std::string output = "New request tokens:";
+    output = "[" + std::to_string(request.guid) + "]" + output;
     for (int i = 0; i < request.tokens.size(); i++) {
-      std::cout << i << " : " << request.tokens[i] << std::endl;
+      output = output + " " + std::to_string(request.tokens[i]);
     }
+    log_req_mgr.print("%s", output.c_str());
   }
 
   GenerationResult gr;
   gr.guid = request.guid;
-  gr.input_text = "";
-  gr.input_tokens = prompt;
-  gr.output_text = "";
-  gr.output_tokens = prompt;
+  gr.input_text = request_.prompt;
+  gr.input_tokens = request.tokens;
+  gr.output_text = request_.prompt;
+  gr.output_tokens = request.tokens;
   request_generation_results[request.guid] = gr;
 
+  ProfileInfo profile_info;
+  profile_info.registration_time = Realm::Clock::current_time_in_microseconds();
+  profiling_requests[request.guid] = profile_info;
+
   return request.guid;
 }
 
 RequestManager::RequestGuid
-    RequestManager::register_new_request(std::string const &prompt,
-                                         int max_sequence_length) {
+    RequestManager::register_new_peft_request(Request const &request_) {
+  assert(enable_peft_finetuning && "PEFT finetuning is not enabled");
   const std::lock_guard<std::mutex> lock(request_queue_mutex);
   // Add a new request
   Request request;
   request.status = Request::PENDING;
   request.guid = next_available_guid++;
-  request.max_sequence_length = max_sequence_length;
-  if (bos_token_id >= 0 && model_type != ModelType::FALCON) {
-    request.tokens.push_back(bos_token_id);
+  request.initial_len = 0;
+  request.max_sequence_length = request_.max_sequence_length;
+  request.peft_model_id = request_.peft_model_id;
+  request.req_type = RequestType::REQ_FINETUNING;
+  request.completed_training_steps = 0;
+  request.gradient_accumulation_steps = request_.gradient_accumulation_steps;
+  request.max_training_steps = request_.max_training_steps;
+  request.dataset_filepath = request_.dataset_filepath;
+  request.warmup = request_.warmup;
+
+  // Load dataset
+  if (request_.benchmarking_tokens >= 0) {
+    assert(request_.benchmarking_tokens <= get_max_sequence_length());
+    request.benchmarking_tokens = request_.benchmarking_tokens;
+    std::vector<int32_t> input_tokens;
+    std::vector<int32_t> output_tokens;
+    bool bos_added = (bos_token_id >= 0 && model_type != ModelType::FALCON);
+    if (bos_added) {
+      input_tokens.push_back(bos_token_id);
+    }
+    input_tokens.insert(input_tokens.end(),
+                        request_.benchmarking_tokens - (int)bos_added,
+                        15); // insert random number
+    request.dataset.push_back(std::make_pair(input_tokens, output_tokens));
+  } else {
+    using json = nlohmann::json;
+    std::ifstream file_handle(request.dataset_filepath);
+    assert(file_handle.good() && "Dataset file does not exist.");
+    json dataset_json = json::parse(file_handle,
+                                    /*parser_callback_t */ nullptr,
+                                    /*allow_exceptions */ true,
+                                    /*ignore_comments */ true);
+
+    for (auto &prompt : dataset_json) {
+      std::string text = prompt.get<std::string>();
+      std::string output_text("");
+      std::vector<int32_t> input_tokens;
+      input_tokens = this->tokenizer_->Encode(text);
+      if (bos_token_id >= 0 && model_type != ModelType::FALCON) {
+        input_tokens.insert(input_tokens.begin(), bos_token_id);
+      }
+      std::vector<int32_t> output_tokens =
+          this->tokenizer_->Encode(output_text);
+      if (input_tokens.size() + output_tokens.size() >
+          get_max_sequence_length()) {
+        std::cout << "Warning: too many tokens in sample, only load up to "
+                  << get_max_sequence_length() << " tokens, but got "
+                  << input_tokens.size() + output_tokens.size() << ".\n";
+        return INVALID_GUID;
+      } else {
+        request.dataset.push_back(std::make_pair(input_tokens, output_tokens));
+      }
+    }
   }
-  std::vector<int32_t> tokens = this->tokenizer_->Encode(prompt);
-  if (tokens.size() >= get_max_sequence_length()) {
-    std::cout << "Warning: too many tokens in prompt, only load up to "
-              << get_max_sequence_length() << " tokens, but got "
-              << tokens.size() << ".\n";
 
-    printf("tokens size: %zu\n", tokens.size());
-    return INVALID_GUID;
+  if (request.gradient_accumulation_steps == -1) {
+    request.gradient_accumulation_steps = request.dataset.size();
   }
-  for (int i = 0; i < tokens.size(); i++) {
-    std::cout << "[" << i << "]" << tokens.at(i) << "\n";
-  }
-  request.tokens.insert(request.tokens.end(), tokens.begin(), tokens.end());
-  request.initial_len = request.tokens.size();
+  assert(request.gradient_accumulation_steps > 0 &&
+         "Invalid gradient accumulation steps");
+  assert(request.gradient_accumulation_steps <= request.max_training_steps &&
+         "Gradient accumulation steps should be less than or equal to max "
+         "training steps");
 
+  // Currently don't support speculative inference for PEFT
+  assert(get_num_ssms() == 0);
   if (get_num_ssms() == 0) {
     std::cout << "No small speculative model registered, using incremental "
                  "decoding."
@@ -280,29 +418,38 @@ RequestManager::RequestGuid
     }
   }
 
-  pending_request_queue.push(request);
+  pending_peft_request_queue.push(request);
   all_requests[request.guid] = request;
   {
     const std::lock_guard<std::mutex> lock(request_to_promise_mutex);
     request_to_promise[request.guid] = new std::promise<void>();
   }
 
-  {
-    std::string output = "New request tokens:";
-    output = "[" + std::to_string(request.guid) + "]" + output;
-    for (int i = 0; i < request.tokens.size(); i++) {
-      output = output + " " + std::to_string(request.tokens[i]);
+  for (size_t r = 0; r < request.dataset.size(); r++) {
+    std::string input = "[" + std::to_string(r) + "] input:";
+    std::string output = "[" + std::to_string(r) + "] output:";
+    for (size_t i = 0; i < request.dataset[r].first.size(); i++) {
+      input = input + " " + std::to_string(request.dataset[r].first[i]);
     }
+    for (size_t i = 0; i < request.dataset[r].second.size(); i++) {
+      output = output + " " + std::to_string(request.dataset[r].second[i]);
+    }
+    log_req_mgr.print("%s", input.c_str());
     log_req_mgr.print("%s", output.c_str());
   }
 
   GenerationResult gr;
   gr.guid = request.guid;
-  gr.input_text = prompt;
-  gr.input_tokens = request.tokens;
-  gr.output_text = prompt;
-  gr.output_tokens = request.tokens;
+  // gr.input_text = prompt;
+  // gr.input_tokens = request.tokens;
+  // gr.output_text = prompt;
+  // gr.output_tokens = request.tokens;
   request_generation_results[request.guid] = gr;
+
+  ProfileInfo profile_info;
+  profile_info.registration_time = Realm::Clock::current_time_in_microseconds();
+  profiling_requests[request.guid] = profile_info;
+
   return request.guid;
 }
 
@@ -363,51 +510,117 @@ BatchConfig RequestManager::prepare_next_batch_task(
   return rm->prepare_next_batch(*bc, result);
 }
 
+bool RequestManager::check_inf_req_completion(BatchConfig const &old_bc,
+                                              int i) {
+  Request &request = all_requests[old_bc.requestsInfo[i].request_guid];
+  bool request_completed = false;
+  // printf("model_type = %d\n", this->model_type);
+  if (request.tokens.size() >= old_bc.requestsInfo[i].max_sequence_length) {
+    request_completed = true;
+  } else if (request.tokens.back() == eos_token_id) {
+    // Encounter EOS token id
+    request_completed = true;
+  }
+  return request_completed;
+}
+
+void RequestManager::check_batch(BatchConfig const &old_bc,
+                                 BatchConfig const &new_bc) {
+  int num_incomplete_prompts = 0;
+  for (int i = 0; i < BatchConfig::max_requests_per_batch(); i++) {
+    if (new_bc.request_completed[i]) {
+      continue;
+    }
+    // ensure there is no request with zero tokens
+    assert(new_bc.requestsInfo[i].num_tokens_in_batch > 0);
+    // ensure there is no more than one incomplete prompt
+    if (new_bc.requestsInfo[i].prompt_phase &&
+        new_bc.requestsInfo[i].num_tokens_in_batch +
+                new_bc.requestsInfo[i].first_token_depth_in_request <
+            all_requests[new_bc.requestsInfo[i].request_guid].tokens.size()) {
+      num_incomplete_prompts++;
+    }
+  }
+  if (num_incomplete_prompts > 1) {
+    std::cout << "Error: more than one incomplete prompt in the batch\n";
+    pid_t pid = getpid();
+    std::string filenamen = "new_bc_" + std::to_string(pid) + ".txt";
+    std::ofstream filen(filenamen);
+    if (filen.is_open()) {
+      filen << new_bc << std::endl;
+      filen.close();
+      std::cout << "String written to file: " << filenamen << std::endl;
+    } else {
+      std::cout << "Unable to open file: " << filenamen << std::endl;
+    }
+    std::string filenameo = "old_bc_" + std::to_string(pid) + ".txt";
+    std::ofstream fileo(filenameo);
+    if (fileo.is_open()) {
+      fileo << old_bc << std::endl;
+      fileo.close();
+      std::cout << "String written to file: " << filenameo << std::endl;
+    } else {
+      std::cout << "Unable to open file: " << filenameo << std::endl;
+    }
+    assert(false);
+  }
+}
+
 BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
                                                InferenceResult const &result) {
   const std::lock_guard<std::mutex> lock(request_queue_mutex);
-
   // Step 1: append result from previous iteration to request's tokens
-  for (int i = 0; i < old_bc.num_tokens; i++) {
+  for (int i = 0; i < old_bc.num_active_tokens(); i++) {
     size_t guid =
         old_bc.requestsInfo[old_bc.tokensInfo[i].request_index].request_guid;
     Request &request = all_requests[guid];
+    if (request.req_type == RequestType::REQ_FINETUNING) {
+      continue;
+    }
     if (old_bc.tokensInfo[i].abs_depth_in_request + 1 < request.tokens.size()) {
       // This is a prompt token
       continue;
     } else {
+      // This is a decoding token
       assert(old_bc.tokensInfo[i].abs_depth_in_request + 1 ==
              request.tokens.size());
-      // This is a decoding token
+      if (!profiling_requests[guid].first_token_time_set) {
+        profiling_requests[guid].first_token_time =
+            Realm::Clock::current_time_in_microseconds();
+        profiling_requests[guid].first_token_time_set = true;
+      }
       log_req_mgr.print("Output token is: %d", result.token_ids[i]);
       request.tokens.push_back(result.token_ids[i]);
       // std::string output = this->tokenizer_->Decode(request.tokens);
       // log_req_mgr.print("Output: %s", output.c_str());
     }
   }
+
   int num_generation_tokens = 0;
   int num_active_req = -1;
 
-  // Step 2: prepare the next batch for existing requests
+  // when finetuning is enabled, the last entry in the batch cannot be used for
+  // inference
+  int inference_batch_size =
+      BatchConfig::max_requests_per_batch() - (int)enable_peft_finetuning;
+
+  // Step 2: prepare the next batch for existing inference requests
   BatchConfig new_bc;
-  for (int i = 0; i < BatchConfig::max_requests_per_batch(); i++) {
-    if (old_bc.request_completed[i]) { // add new requests to the next batch
+  for (int i = 0; i < inference_batch_size; i++) {
+    if (old_bc.request_completed[i]) {
+      // no need to carry over tokens to new batch for this request
       continue;
     } else {
       assert(old_bc.requestsInfo[i].num_tokens_in_batch > 0);
       Request &request = all_requests[old_bc.requestsInfo[i].request_guid];
+      assert(request.req_type == RequestType::REQ_INFERENCE &&
+             "Found misplaced finetuning request");
+
       int processed_tokens =
           old_bc.requestsInfo[i].first_token_depth_in_request +
           old_bc.requestsInfo[i].num_tokens_in_batch;
       assert(processed_tokens < request.tokens.size());
-      bool request_completed = false;
-      // printf("model_type = %d\n", this->model_type);
-      if (request.tokens.size() >= old_bc.requestsInfo[i].max_sequence_length) {
-        request_completed = true;
-      } else if (request.tokens.back() == eos_token_id) {
-        // Encounter EOS token id
-        request_completed = true;
-      }
+      bool request_completed = check_inf_req_completion(old_bc, i);
       if (request_completed) {
         std::string output = this->tokenizer_->Decode(request.tokens);
         // Unlike Huggingface, the sentencepiece C++ library automatically
@@ -435,32 +648,40 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
         total_request_run_time +=
             profile_info.finish_time - profile_info.start_time;
         profiling_requests[request.guid] = profile_info;
-        log_req_mgr.print(
-            "[Profile] guid(%zu) llm_decoding_steps(%d) start(%.1lf) "
-            "finish(%.1lf) latency(%.1lf)",
-            request.guid,
-            profile_info.llm_decoding_steps,
-            profile_info.start_time,
-            profile_info.finish_time,
-            profile_info.finish_time - profile_info.start_time);
+        log_req_mgr.print("[%s] guid(%zu) llm_decoding_steps(%d) start(%.1lf) "
+                          "finish(%.1lf) latency(%.1lf) ttft(%.1lf)",
+                          request.warmup ? "Warmup" : "Profile",
+                          request.guid,
+                          profile_info.llm_decoding_steps,
+                          profile_info.start_time,
+                          profile_info.finish_time,
+                          profile_info.finish_time - profile_info.start_time,
+                          profile_info.first_token_time -
+                              profile_info.registration_time);
         // Write output to file if needed:
         if (!output_filepath.empty()) {
           std::ofstream outputFile(output_filepath, std::ios::app);
           if (outputFile.is_open()) {
-            outputFile << "end-to-end latency: " << std::fixed
-                       << std::setprecision(3) << total_request_run_time
-                       << std::endl;
-            outputFile << "num decoding steps: "
-                       << profile_info.llm_decoding_steps << std::endl;
-            outputFile << "token IDs: ";
-            for (int i = 0; i < request.tokens.size(); i++) {
-              outputFile << request.tokens[i];
-              if (i < request.tokens.size() - 1) {
-                outputFile << ",";
+            outputFile << "[" << (request.warmup ? "Warmup" : "Profile")
+                       << "] guid(" << request.guid << ") llm_decoding_steps("
+                       << profile_info.llm_decoding_steps << ") latency("
+                       << std::fixed << std::setprecision(3)
+                       << (profile_info.finish_time - profile_info.start_time)
+                       << ") ttft(" << std::fixed << std::setprecision(3)
+                       << (profile_info.first_token_time -
+                           profile_info.registration_time)
+                       << ")\n";
+            if (request.benchmarking_tokens <= 0) {
+              outputFile << "token IDs: ";
+              for (int i = 0; i < request.tokens.size(); i++) {
+                outputFile << request.tokens[i];
+                if (i < request.tokens.size() - 1) {
+                  outputFile << ",";
+                }
               }
+              outputFile << std::endl;
+              outputFile << output;
             }
-            outputFile << std::endl;
-            outputFile << output;
             outputFile.close();
           } else {
             std::cout << "Unable to open the output file: " << output_filepath
@@ -468,13 +689,15 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
             assert(false);
           }
         }
-
       } else {
         new_bc.request_completed[i] = false;
         new_bc.requestsInfo[i].first_token_depth_in_request = processed_tokens;
         new_bc.requestsInfo[i].first_token_offset_in_batch = new_bc.num_tokens;
         new_bc.requestsInfo[i].request_guid =
             old_bc.requestsInfo[i].request_guid;
+        new_bc.requestsInfo[i].peft_model_id =
+            old_bc.requestsInfo[i].peft_model_id;
+        new_bc.requestsInfo[i].peft_bwd = old_bc.requestsInfo[i].peft_bwd;
         new_bc.requestsInfo[i].max_sequence_length =
             old_bc.requestsInfo[i].max_sequence_length;
         num_active_req++;
@@ -487,8 +710,25 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
           new_bc.requestsInfo[i].prompt_phase = false;
         } else {
           // Prompt phase
+          assert(old_bc.requestsInfo[i].prompt_phase == true);
+          int space_for_incr_dec_requests = 0;
+          // If the prompt can't fit in the batch, compute how much space we
+          // need to leave out for incomplete requests in decoding phase at
+          // higher indices.
+          for (int ii = i + 1; ii < inference_batch_size; ii++) {
+            if (old_bc.request_completed[ii]) {
+              continue;
+            }
+            Request &old_request =
+                all_requests[old_bc.requestsInfo[ii].request_guid];
+            bool req_completed = check_inf_req_completion(old_bc, ii);
+            if (!req_completed) {
+              space_for_incr_dec_requests++;
+            }
+          }
           new_bc.requestsInfo[i].num_tokens_in_batch =
-              std::min(get_max_tokens_per_batch() - new_bc.num_tokens,
+              std::min(get_max_tokens_per_batch() - new_bc.num_tokens -
+                           space_for_incr_dec_requests,
                        (int)request.tokens.size() -
                            new_bc.requestsInfo[i].first_token_depth_in_request);
           new_bc.requestsInfo[i].prompt_phase = true;
@@ -509,13 +749,14 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
   }
   new_bc.num_generation_tokens = num_generation_tokens;
 
-  // Step 3: add new requests to the next batch
-  for (int i = 0; i < BatchConfig::max_requests_per_batch(); i++) {
+  // Step 3: add new inference requests to the next batch if there is space
+  for (int i = 0; i < inference_batch_size; i++) {
     if (new_bc.request_completed[i]) {
-      if (!pending_request_queue.empty() &&
+      if (!pending_infr_request_queue.empty() &&
           new_bc.num_tokens < get_max_tokens_per_batch()) {
-        Request new_request = pending_request_queue.front();
-        pending_request_queue.pop();
+        Request new_request = pending_infr_request_queue.front();
+        assert(new_request.req_type == RequestType::REQ_INFERENCE);
+        pending_infr_request_queue.pop();
         // all_requests[new_request.guid] = new_request;
 
         new_bc.requestsInfo[i].first_token_depth_in_request = 0;
@@ -526,15 +767,16 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
                      (int)new_request.tokens.size());
         new_bc.requestsInfo[i].max_sequence_length =
             new_request.max_sequence_length;
+        new_bc.requestsInfo[i].peft_model_id = new_request.peft_model_id;
+        new_bc.requestsInfo[i].peft_bwd = false;
         new_bc.request_completed[i] = false;
         new_bc.requestsInfo[i].prompt_phase = true;
         num_active_req++;
         new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
-        // add profile_info for the new request
-        ProfileInfo profile_info;
-        profile_info.llm_decoding_steps = 1;
-        profile_info.start_time = Realm::Clock::current_time_in_microseconds();
-        profiling_requests[new_request.guid] = profile_info;
+        // add start time to profile_info for the new request
+        profiling_requests[new_request.guid].llm_decoding_steps = 1;
+        profiling_requests[new_request.guid].start_time =
+            Realm::Clock::current_time_in_microseconds();
         for (int j = 0; j < new_bc.requestsInfo[i].num_tokens_in_batch; j++) {
           int depth = new_bc.requestsInfo[i].first_token_depth_in_request + j;
           new_bc.tokensInfo[new_bc.num_tokens].request_index = i;
@@ -551,6 +793,170 @@ BatchConfig RequestManager::prepare_next_batch(BatchConfig const &old_bc,
     }
   }
 
+  if (enable_peft_finetuning &&
+      !old_bc.request_completed[inference_batch_size]) {
+    assert(old_bc.requestsInfo[inference_batch_size].num_tokens_in_batch > 0);
+    Request &request =
+        all_requests[old_bc.requestsInfo[inference_batch_size].request_guid];
+    assert(request.req_type == RequestType::REQ_FINETUNING &&
+           "Found misplaced inference request");
+
+    request.finetuning_losses.push_back(result.finetuning_loss);
+
+    request.dataset_entry_processed_tokens +=
+        old_bc.requestsInfo[inference_batch_size].num_tokens_in_batch;
+    request.processed_finetuning_tokens +=
+        old_bc.requestsInfo[inference_batch_size].num_tokens_in_batch;
+    request.finetuning_tokens_per_batch.push_back(
+        old_bc.requestsInfo[inference_batch_size].num_tokens_in_batch);
+    int dataset_entry =
+        request.completed_training_steps % request.dataset.size();
+    if (old_bc.requestsInfo[inference_batch_size].first_token_depth_in_request +
+            old_bc.requestsInfo[inference_batch_size].num_tokens_in_batch ==
+        request.dataset[dataset_entry].first.size()) {
+      // completed the current dataset entry
+      assert(request.dataset_entry_processed_tokens ==
+             request.dataset[dataset_entry].first.size());
+      request.completed_training_steps += 1;
+      request.dataset_entry_processed_tokens = 0;
+    }
+
+    assert(request.completed_training_steps <= request.max_training_steps);
+    if (request.completed_training_steps == request.max_training_steps ||
+        inference_finished) {
+      // check if the fine tuning request has completed
+      request.status = Request::COMPLETED;
+
+      GenerationResult &gr = request_generation_results[request.guid];
+      assert(gr.guid == request.guid);
+      gr.finetuning_losses = request.finetuning_losses;
+      trigger_request_completion_future(request.guid);
+      num_processed_requests++;
+
+      ProfileInfo profile_info = profiling_requests[request.guid];
+      profile_info.finish_time = Realm::Clock::current_time_in_microseconds();
+      total_request_run_time +=
+          profile_info.finish_time - profile_info.start_time;
+      profiling_requests[request.guid] = profile_info;
+      log_req_mgr.print("[%s] guid(%zu) completed_training_steps(%d) "
+                        "processed_finetuning_tokens(%lu) latency(%.1lf)",
+                        request.warmup ? "Warmup" : "Finetuning",
+                        request.guid,
+                        request.completed_training_steps,
+                        request.processed_finetuning_tokens,
+                        profile_info.finish_time - profile_info.start_time);
+      if (!output_filepath.empty()) {
+        std::ofstream outputFile(output_filepath, std::ios::app);
+        if (outputFile.is_open()) {
+          std::string tokens_str = "[";
+          for (size_t i = 0; i < request.finetuning_tokens_per_batch.size();
+               i++) {
+            tokens_str +=
+                std::to_string(request.finetuning_tokens_per_batch[i]);
+            if (i != request.finetuning_tokens_per_batch.size() - 1) {
+              tokens_str += ", ";
+            }
+          }
+          tokens_str += "]";
+          outputFile << "[" << (request.warmup ? "Warmup" : "Finetuning")
+                     << "] guid(" << request.guid
+                     << ") completed_training_steps("
+                     << request.completed_training_steps
+                     << ") processed_finetuning_tokens("
+                     << request.processed_finetuning_tokens << ") latency("
+                     << std::fixed << std::setprecision(3)
+                     << (profile_info.finish_time - profile_info.start_time)
+                     << ") tokens_per_batch(" << tokens_str << ")\n";
+          outputFile.close();
+        } else {
+          std::cout << "Unable to open the output file: " << output_filepath
+                    << std::endl;
+          assert(false);
+        }
+      }
+    }
+  }
+
+  // Step 4: add PEFT bwd requests, if there is additional space
+  while (pending_peft_request_queue.size() > 0) {
+    Request &request = pending_peft_request_queue.front();
+    // assert(request.req_type = RequestType::REQ_FINETUNING);
+    Request &all_req_handle = all_requests[request.guid];
+    // assert(all_req_handle.req_type = RequestType::REQ_FINETUNING);
+    if (all_req_handle.status == Request::COMPLETED) {
+      pending_peft_request_queue.pop();
+    } else {
+      break;
+    }
+  }
+
+  if (pending_peft_request_queue.size() > 0 && !inference_finished) {
+    Request &request = pending_peft_request_queue.front();
+    assert(request.req_type = RequestType::REQ_FINETUNING);
+    assert(request.dataset.size() > 0);
+    // update status and training steps
+    Request &all_req_handle = all_requests[request.guid];
+    assert(all_req_handle.req_type = RequestType::REQ_FINETUNING);
+
+    request.completed_training_steps = all_req_handle.completed_training_steps;
+    request.processed_finetuning_tokens =
+        all_req_handle.processed_finetuning_tokens;
+    request.status = all_req_handle.status;
+    int dataset_entry =
+        request.completed_training_steps % request.dataset.size();
+    request.dataset_entry_processed_tokens =
+        all_req_handle.dataset_entry_processed_tokens;
+    request.gradient_accumulation_steps =
+        all_req_handle.gradient_accumulation_steps;
+
+    assert(request.status != Request::COMPLETED);
+    assert(request.max_training_steps > 0 &&
+           request.completed_training_steps < request.max_training_steps);
+    assert(request.dataset_entry_processed_tokens <=
+           request.dataset[dataset_entry].first.size());
+
+    int num_peft_tokens =
+        min((int)request.dataset[dataset_entry].first.size() -
+                request.dataset_entry_processed_tokens,
+            get_max_tokens_per_batch() - new_bc.num_active_infr_tokens());
+    int num_peft_label_tokens = request.dataset[dataset_entry].second.size();
+    assert(num_peft_label_tokens == 0);
+
+    if (num_peft_tokens > 0) {
+      assert(new_bc.request_completed[inference_batch_size]);
+      // request info
+      new_bc.request_completed[inference_batch_size] = false;
+      new_bc.requestsInfo[inference_batch_size].first_token_depth_in_request =
+          request.dataset_entry_processed_tokens;
+      new_bc.requestsInfo[inference_batch_size].first_token_offset_in_batch =
+          new_bc.num_active_infr_tokens();
+      new_bc.requestsInfo[inference_batch_size].num_tokens_in_batch =
+          num_peft_tokens;
+      new_bc.requestsInfo[inference_batch_size].max_sequence_length =
+          request.max_sequence_length;
+      new_bc.requestsInfo[inference_batch_size].request_guid = request.guid;
+      new_bc.requestsInfo[inference_batch_size].peft_model_id =
+          request.peft_model_id;
+      new_bc.requestsInfo[inference_batch_size].peft_bwd = true;
+      set_optimizer_tasks(
+          new_bc.requestsInfo[inference_batch_size].optimizer_tasks,
+          request.max_training_steps,
+          request.completed_training_steps,
+          request.gradient_accumulation_steps);
+      // tokens info
+      for (size_t i = request.dataset_entry_processed_tokens;
+           i < request.dataset_entry_processed_tokens + num_peft_tokens;
+           i++) {
+        new_bc.tokensInfo[new_bc.num_tokens].token_id =
+            request.dataset[dataset_entry].first[i];
+        new_bc.tokensInfo[new_bc.num_tokens].request_index =
+            inference_batch_size;
+        new_bc.tokensInfo[new_bc.num_tokens].abs_depth_in_request = i;
+        new_bc.num_tokens++;
+        new_bc.num_peft_tokens++;
+      }
+    }
+  }
   return new_bc;
 }
 
@@ -722,11 +1128,17 @@ BeamSearchBatchConfig
         if (!output_filepath.empty()) {
           std::ofstream outputFile(output_filepath, std::ios::app);
           if (outputFile.is_open()) {
-            outputFile << "end-to-end latency: " << std::fixed
-                       << std::setprecision(3) << total_request_run_time
-                       << std::endl;
-            outputFile << "num decoding steps: "
-                       << profile_info.llm_decoding_steps << std::endl;
+            outputFile << "[Profile] guid(" << request.guid
+                       << ") llm_decoding_steps("
+                       << profile_info.llm_decoding_steps << ") latency("
+                       << std::fixed << std::setprecision(3)
+                       << (profile_info.finish_time - profile_info.start_time)
+                       << ")\n";
+            // outputFile << "end-to-end latency: " << std::fixed
+            //            << std::setprecision(3) << total_request_run_time
+            //            << std::endl;
+            // outputFile << "num decoding steps: "
+            //            << profile_info.llm_decoding_steps << std::endl;
             outputFile << "token IDs: ";
             for (int i = 0; i < request.tokens.size(); i++) {
               outputFile << request.tokens[i];
@@ -736,7 +1148,6 @@ BeamSearchBatchConfig
             }
             outputFile << std::endl;
             outputFile << output;
-
             outputFile.close();
           } else {
             std::cout << "Unable to open the output file: " << output_filepath
@@ -884,10 +1295,10 @@ BeamSearchBatchConfig
   // Step 2: Initialize new request
   for (int i = 0; i < BeamSearchBatchConfig::max_requests_per_batch(); i++) {
     if (new_bc.request_completed[i]) {
-      if (!pending_request_queue.empty() &&
+      if (!pending_infr_request_queue.empty() &&
           new_bc.num_tokens < get_max_tokens_per_batch()) {
-        Request new_request = pending_request_queue.front();
-        pending_request_queue.pop();
+        Request new_request = pending_infr_request_queue.front();
+        pending_infr_request_queue.pop();
         // all_requests[new_request.guid] = new_request;
         num_active_req++;
         new_bc.requestsInfo[i].first_token_depth_in_request = 0;
@@ -901,13 +1312,13 @@ BeamSearchBatchConfig
         new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
 
         // add profile_info for the new request
-        ProfileInfo profile_info;
-        profile_info.llm_decoding_steps = 0;
-        profile_info.ssm_decoding_steps = 0;
-        profile_info.start_time = Realm::Clock::current_time_in_microseconds();
-        profiling_requests[new_request.guid] = profile_info;
+        profiling_requests[new_request.guid].llm_decoding_steps = 0;
+        profiling_requests[new_request.guid].ssm_decoding_steps = 0;
+        profiling_requests[new_request.guid].start_time =
+            Realm::Clock::current_time_in_microseconds();
         // init the beam search metadata per request
-        int ssm_decoding_steps = profile_info.ssm_decoding_steps;
+        int ssm_decoding_steps =
+            profiling_requests[new_request.guid].ssm_decoding_steps;
 
         new_bc.beamRequestsInfo[i].beam_size =
             spec_infer_tree_width.size() > ssm_decoding_steps
@@ -1552,7 +1963,6 @@ TreeVerifyBatchConfig RequestManager::prepare_next_batch_verify(
       new_bc.requestsInfo[num_active_req].batch_config_request_id = i;
 
       new_bc.request_completed[i] = false;
-
       new_bc.requestsInfo[i].num_tokens_in_batch =
           std::min(max_prompt_load_size,
                    (int)request.initial_len -
@@ -2105,7 +2515,7 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
         // must in this branch.
         int layer_slot = i - processed_whole_layer_tokens;
         int layer_slot_total = treeLayers[layer_num];
-        if ((first_layer_slot == layer_slot)) {
+        if (first_layer_slot == layer_slot) {
           verifiedTree.push_back(output);
           new_committed_tokens.push_back(std::make_pair(
               input.second, committed_tokens.at(guid).at(i).second));
@@ -2297,19 +2707,34 @@ std::vector<std::pair<BatchConfig::TokenId, int>>
 }
 
 std::vector<GenerationResult>
-    FFModel::generate(std::vector<std::string> &prompts, int max_seq_length) {
+    FFModel::generate(std::vector<Request> const &requests) {
   RequestManager *rm = RequestManager::get_request_manager();
-  std::vector<RequestManager::RequestGuid> guids;
-  for (int i = 0; i < prompts.size(); i++) {
-    RequestManager::RequestGuid guid =
-        rm->register_new_request(prompts.at(i), max_seq_length);
-    if (guid != RequestManager::INVALID_GUID) {
-      guids.push_back(guid);
+  // reset inference_finished flag
+  rm->set_inference_finished(false);
+  std::vector<RequestManager::RequestGuid> inf_guids, peft_guids;
+  for (int i = 0; i < requests.size(); i++) {
+    RequestManager::RequestGuid guid;
+    if (requests.at(i).req_type == RequestType::REQ_INFERENCE) {
+      guid = rm->register_new_request(requests.at(i));
+      if (guid != RequestManager::INVALID_GUID) {
+        inf_guids.push_back(guid);
+      }
+    } else {
+      guid = rm->register_new_peft_request(requests.at(i));
+      if (guid != RequestManager::INVALID_GUID) {
+        peft_guids.push_back(guid);
+      }
     }
   }
   std::vector<GenerationResult> results;
-  for (int i = 0; i < guids.size(); i++) {
-    results.push_back(rm->get_generation_result(guids[i]));
+  for (int i = 0; i < inf_guids.size(); i++) {
+    results.push_back(rm->get_generation_result(inf_guids[i]));
+  }
+  if (inf_guids.size() > 0) {
+    rm->set_inference_finished();
+  }
+  for (int i = 0; i < peft_guids.size(); i++) {
+    results.push_back(rm->get_generation_result(peft_guids[i]));
   }
   return results;
 }
@@ -2342,6 +2767,18 @@ void RequestManager::background_serving_task(
     std::vector<PhysicalRegion> const &regions,
     Context ctx,
     Runtime *runtime) {
+
+  auto print_timestamped_message = [](std::string const &message) {
+    auto now =
+        std::chrono::system_clock::to_time_t(std::chrono::system_clock::now());
+    std::cout << std::put_time(std::localtime(&now), "%Y-%m-%d %X") << " - "
+              << message << std::endl;
+  };
+
+  // Print at the start of the task
+  print_timestamped_message(
+      "###PEFT DEBUGGING### Starting background serving task.");
+
   RequestManager *rm = RequestManager::get_request_manager();
   FFModel *llm = *(FFModel **)task->args;
   {
@@ -2358,6 +2795,11 @@ void RequestManager::background_serving_task(
       ssm->config.lg_ctx = ctx;
     }
   }
+
+  // Checkpoint print
+  print_timestamped_message(
+      "###PEFT DEBUGGING### Updated models' configuration.");
+
   if (rm->get_num_ssms() == 0) {
     // No SSMs: perform incremental decoding
     rm->serve_incr_decoding(llm);
@@ -2365,13 +2807,48 @@ void RequestManager::background_serving_task(
     // Registered SSMs: perform speculative inference
     rm->serve_spec_infer(llm);
   }
+
 #ifdef FF_USE_NCCL
   llm->finish_nccl_comms();
 #endif
+
+  // Print at the end of the task
+  print_timestamped_message(
+      "###PEFT DEBUGGING### Background serving task completed.");
+}
+
+std::string find_layer_name_from_guid(FFModel *model, LayerID guid) {
+  for (size_t i = 0; i < model->layers.size(); i++) {
+    if (model->layers[i]->layer_guid == guid) {
+      std::string layer_name(model->layers[i]->name);
+      return layer_name;
+    }
+  }
+  assert(false);
+  return "invalid_layer_name";
+}
+
+bool is_peft_operator_type(OperatorType type) {
+  switch (type) {
+    case OP_LORA:
+      return true;
+    default:
+      return false;
+  }
 }
 
 /*static*/
 void RequestManager::serve_incr_decoding(FFModel *llm) {
+
+  // Check if the model object exists
+  if (llm == nullptr) {
+    std::cout << "###PEFT DEBUGGING### LLM Model object does not exist."
+              << std::endl;
+    return; // Early return to prevent further operations on a nullptr
+  } else {
+    std::cout << "###PEFT DEBUGGING### LLM Model object exists." << std::endl;
+  }
+
   Context ctx = llm->config.lg_ctx;
   Runtime *runtime = llm->config.lg_hlr;
   // Compile the llm
@@ -2419,6 +2896,9 @@ void RequestManager::serve_incr_decoding(FFModel *llm) {
     BatchConfigFuture bcf =
         prepare_next_batch(next_batch.first, next_batch.second, ctx, runtime);
     FutureMap fm = im->inference(llm, 0, bcf);
+    if (llm->config.enable_peft) {
+      im->peft_bwd(llm, 0, bcf);
+    }
     assert(fm.get_future_map_domain().get_volume() == 1);
     InferenceResultFuture irf = fm.get_future(0);
     batch_pipeline.push(std::make_pair(bcf, irf));
diff --git a/src/runtime/request_manager.cpp b/src/runtime/request_manager.cpp
index fadbf80d6d..8e5f302466 100644
--- a/src/runtime/request_manager.cpp
+++ b/src/runtime/request_manager.cpp
@@ -73,74 +73,69 @@ void RequestManager::load_batch_config_task(
 
   // copy meta data to workSpace
   FFHandler handle = *((FFHandler const *)task->local_args);
-  size_t total_copy_size = 0;
-  checkCUDA(hipMemcpyAsync(handle.batch_config_metadata,
+  checkCUDA(hipMemcpyAsync(handle.batch_config_metadata->tokens_info,
                            &(batch_config->tokensInfo),
                            sizeof(BatchConfig::tokensInfo),
                            hipMemcpyHostToDevice,
                            stream));
-  total_copy_size += sizeof(BatchConfig::tokensInfo);
 
-  checkCUDA(hipMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-                               total_copy_size,
+  checkCUDA(hipMemcpyAsync(handle.batch_config_metadata->requestsInfo,
                            &(batch_config->requestsInfo),
                            sizeof(BatchConfig::requestsInfo),
                            hipMemcpyHostToDevice,
                            stream));
-  total_copy_size += sizeof(BatchConfig::requestsInfo);
 
   // load speculative metadata
   if (batch_config->get_mode() == BEAM_SEARCH_MODE) {
     BeamSearchBatchConfig const *beam_batch_config =
         static_cast<BeamSearchBatchConfig const *>(batch_config);
 
-    checkCUDA(hipMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-                                 total_copy_size,
+    checkCUDA(hipMemcpyAsync(handle.batch_config_metadata->beamTokenInfo,
                              &(beam_batch_config->beamTokenInfo),
                              sizeof(BeamSearchBatchConfig::beamTokenInfo),
                              hipMemcpyHostToDevice,
                              stream));
 
-    total_copy_size += sizeof(BeamSearchBatchConfig::beamTokenInfo);
-
-    checkCUDA(hipMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-                                 total_copy_size,
+    checkCUDA(hipMemcpyAsync(handle.batch_config_metadata->beamRequestsInfo,
                              &(beam_batch_config->beamRequestsInfo),
                              sizeof(BeamSearchBatchConfig::beamRequestsInfo),
                              hipMemcpyHostToDevice,
                              stream));
-    total_copy_size += sizeof(BeamSearchBatchConfig::beamRequestsInfo);
 
-    checkCUDA(hipMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-                                 total_copy_size,
+    checkCUDA(hipMemcpyAsync(handle.batch_config_metadata->causalMask,
                              &(beam_batch_config->causalMask),
                              sizeof(BatchConfig::causalMask),
                              hipMemcpyHostToDevice,
                              stream));
 
-    total_copy_size += sizeof(BatchConfig::causalMask);
+    checkCUDA(hipMemcpyAsync(handle.batch_config_metadata->request_completed,
+                             &(batch_config->request_completed),
+                             sizeof(BatchConfig::request_completed),
+                             hipMemcpyHostToDevice,
+                             stream));
+
   } else if (batch_config->get_mode() == TREE_VERIFY_MODE) {
     TreeVerifyBatchConfig const *tree_batch_config =
         static_cast<TreeVerifyBatchConfig const *>(batch_config);
 
-    checkCUDA(hipMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-                                 total_copy_size,
+    checkCUDA(hipMemcpyAsync(handle.batch_config_metadata->causalMask,
                              &(tree_batch_config->causalMask),
                              sizeof(BatchConfig::causalMask),
                              hipMemcpyHostToDevice,
                              stream));
-    total_copy_size += sizeof(BatchConfig::causalMask);
-    checkCUDA(hipMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-                                 total_copy_size,
+
+    checkCUDA(hipMemcpyAsync(handle.batch_config_metadata->committed_tokens,
                              &(tree_batch_config->committed_tokens),
                              sizeof(TreeVerifyBatchConfig::committed_tokens),
                              hipMemcpyHostToDevice,
                              stream));
-    total_copy_size += sizeof(TreeVerifyBatchConfig::committed_tokens);
-  }
 
-  // add a size check
-  assert(total_copy_size <= handle.batch_config_metadata_size);
+    checkCUDA(hipMemcpyAsync(handle.batch_config_metadata->request_completed,
+                             &(batch_config->request_completed),
+                             sizeof(BatchConfig::request_completed),
+                             hipMemcpyHostToDevice,
+                             stream));
+  }
 }
 
 void RequestManager::load_positions_task(
diff --git a/src/runtime/request_manager.cu b/src/runtime/request_manager.cu
index 8380d6be73..343f1dd6e6 100644
--- a/src/runtime/request_manager.cu
+++ b/src/runtime/request_manager.cu
@@ -40,8 +40,21 @@ void RequestManager::load_tokens_task(
     printf("Warning: too many tokens in prompt, only load up to %d tokens\n",
            BatchConfig::max_tokens_per_batch());
     printf("Got: %d tokens\n", batch_config->num_tokens);
+
+    // pid_t pid = getpid();
+    // std::string filename = "bc_" + std::to_string(pid) + ".txt";
+    // std::ofstream file(filename);
+    // if (file.is_open()) {
+    //     file << *batch_config << std::endl;
+    //     file.close();
+    //     std::cout << "String written to file: " << filename << std::endl;
+    // } else {
+    //     std::cout << "Unable to open file: " << filename << std::endl;
+    // }
+
   } else if (batch_config->num_tokens >
-             BatchConfig::max_verify_tokens_per_batch()) {
+                 BatchConfig::max_verify_tokens_per_batch() &&
+             batch_config->get_mode() != INC_DECODING_MODE) {
     printf("Warning: Speculative decoding. too many tokens in prompt, only "
            "load up to %d tokens\n",
            BatchConfig::max_verify_tokens_per_batch());
@@ -80,91 +93,69 @@ void RequestManager::load_batch_config_task(
 
   // copy meta data to workSpace
   FFHandler handle = *((FFHandler const *)task->local_args);
-  size_t total_copy_size = 0;
-  checkCUDA(cudaMemcpyAsync(handle.batch_config_metadata,
+  checkCUDA(cudaMemcpyAsync(handle.batch_config_metadata->tokens_info,
                             &(batch_config->tokensInfo),
                             sizeof(BatchConfig::tokensInfo),
                             cudaMemcpyHostToDevice,
                             stream));
-  total_copy_size += sizeof(BatchConfig::tokensInfo);
 
-  checkCUDA(cudaMemcpyAsync(static_cast<char *>(handle.batch_config_metadata) +
-                                total_copy_size,
+  checkCUDA(cudaMemcpyAsync(handle.batch_config_metadata->requestsInfo,
                             &(batch_config->requestsInfo),
                             sizeof(BatchConfig::requestsInfo),
                             cudaMemcpyHostToDevice,
                             stream));
-  total_copy_size += sizeof(BatchConfig::requestsInfo);
 
   // load speculative metadata
   if (batch_config->get_mode() == BEAM_SEARCH_MODE) {
     BeamSearchBatchConfig const *beam_batch_config =
         static_cast<BeamSearchBatchConfig const *>(batch_config);
 
-    checkCUDA(cudaMemcpyAsync(
-        static_cast<char *>(handle.batch_config_metadata) + total_copy_size,
-        &(beam_batch_config->beamTokenInfo),
-        sizeof(BeamSearchBatchConfig::beamTokenInfo),
-        cudaMemcpyHostToDevice,
-        stream));
-
-    total_copy_size += sizeof(BeamSearchBatchConfig::beamTokenInfo);
-
-    checkCUDA(cudaMemcpyAsync(
-        static_cast<char *>(handle.batch_config_metadata) + total_copy_size,
-        &(beam_batch_config->beamRequestsInfo),
-        sizeof(BeamSearchBatchConfig::beamRequestsInfo),
-        cudaMemcpyHostToDevice,
-        stream));
-    total_copy_size += sizeof(BeamSearchBatchConfig::beamRequestsInfo);
-
-    checkCUDA(cudaMemcpyAsync(
-        static_cast<char *>(handle.batch_config_metadata) + total_copy_size,
-        &(beam_batch_config->causalMask),
-        sizeof(BatchConfig::causalMask),
-        cudaMemcpyHostToDevice,
-        stream));
-    total_copy_size += sizeof(BatchConfig::causalMask);
-
-    checkCUDA(cudaMemcpyAsync(
-        static_cast<char *>(handle.batch_config_metadata) + total_copy_size,
-        &(batch_config->request_completed),
-        sizeof(BatchConfig::request_completed),
-        cudaMemcpyHostToDevice,
-        stream));
-
-    total_copy_size += sizeof(BatchConfig::request_completed);
+    checkCUDA(cudaMemcpyAsync(handle.batch_config_metadata->beamTokenInfo,
+                              &(beam_batch_config->beamTokenInfo),
+                              sizeof(BeamSearchBatchConfig::beamTokenInfo),
+                              cudaMemcpyHostToDevice,
+                              stream));
+
+    checkCUDA(cudaMemcpyAsync(handle.batch_config_metadata->beamRequestsInfo,
+                              &(beam_batch_config->beamRequestsInfo),
+                              sizeof(BeamSearchBatchConfig::beamRequestsInfo),
+                              cudaMemcpyHostToDevice,
+                              stream));
+
+    checkCUDA(cudaMemcpyAsync(handle.batch_config_metadata->causalMask,
+                              &(beam_batch_config->causalMask),
+                              sizeof(BatchConfig::causalMask),
+                              cudaMemcpyHostToDevice,
+                              stream));
+
+    checkCUDA(cudaMemcpyAsync(handle.batch_config_metadata->request_completed,
+                              &(batch_config->request_completed),
+                              sizeof(BatchConfig::request_completed),
+                              cudaMemcpyHostToDevice,
+                              stream));
+
   } else if (batch_config->get_mode() == TREE_VERIFY_MODE) {
     TreeVerifyBatchConfig const *tree_batch_config =
         static_cast<TreeVerifyBatchConfig const *>(batch_config);
 
-    checkCUDA(cudaMemcpyAsync(
-        static_cast<char *>(handle.batch_config_metadata) + total_copy_size,
-        &(tree_batch_config->causalMask),
-        sizeof(BatchConfig::causalMask),
-        cudaMemcpyHostToDevice,
-        stream));
-    total_copy_size += sizeof(BatchConfig::causalMask);
-    checkCUDA(cudaMemcpyAsync(
-        static_cast<char *>(handle.batch_config_metadata) + total_copy_size,
-        &(tree_batch_config->committed_tokens),
-        sizeof(TreeVerifyBatchConfig::committed_tokens),
-        cudaMemcpyHostToDevice,
-        stream));
-    total_copy_size += sizeof(TreeVerifyBatchConfig::committed_tokens);
-
-    checkCUDA(cudaMemcpyAsync(
-        static_cast<char *>(handle.batch_config_metadata) + total_copy_size,
-        &(batch_config->request_completed),
-        sizeof(BatchConfig::request_completed),
-        cudaMemcpyHostToDevice,
-        stream));
-
-    total_copy_size += sizeof(BatchConfig::request_completed);
+    checkCUDA(cudaMemcpyAsync(handle.batch_config_metadata->causalMask,
+                              &(tree_batch_config->causalMask),
+                              sizeof(BatchConfig::causalMask),
+                              cudaMemcpyHostToDevice,
+                              stream));
+
+    checkCUDA(cudaMemcpyAsync(handle.batch_config_metadata->committed_tokens,
+                              &(tree_batch_config->committed_tokens),
+                              sizeof(TreeVerifyBatchConfig::committed_tokens),
+                              cudaMemcpyHostToDevice,
+                              stream));
+
+    checkCUDA(cudaMemcpyAsync(handle.batch_config_metadata->request_completed,
+                              &(batch_config->request_completed),
+                              sizeof(BatchConfig::request_completed),
+                              cudaMemcpyHostToDevice,
+                              stream));
   }
-
-  // add a size check
-  assert(total_copy_size <= handle.batch_config_metadata_size);
 }
 
 void RequestManager::load_positions_task(
diff --git a/src/runtime/simulator.cpp b/src/runtime/simulator.cpp
index 0daf151d2c..56931e0dc7 100644
--- a/src/runtime/simulator.cpp
+++ b/src/runtime/simulator.cpp
@@ -82,17 +82,17 @@ Simulator::Simulator(FFModel const *model,
 
   checkCUDA(hipEventCreate(&start_event));
   checkCUDA(hipEventCreate(&end_event));
-  conv2d_meta = new Conv2DMeta(handler);
-  // linear_meta = new LinearMeta(handler, 4096);
-  pool2d_meta = new Pool2DMeta(handler);
-  ele_unary_meta = new ElementUnaryMeta(handler);
-  // ele_binary_meta = new ElementBinaryMeta(handler);
-  // embedding_meta = new EmbeddingMeta(handler);
-  //  softmax_meta = new SoftmaxMeta(handler);
-  batch_matmul_meta = new BatchMatmulMeta(handler);
-  concat_meta = new ConcatMeta(handler);
-  // dropout_meta = new DropoutMeta(handler);
-  transpose_meta = new TransposeMeta(handler);
+  // conv2d_meta = new Conv2DMeta(handler);
+  //  linear_meta = new LinearMeta(handler, 4096);
+  // pool2d_meta = new Pool2DMeta(handler);
+  // ele_unary_meta = new ElementUnaryMeta(handler);
+  //  ele_binary_meta = new ElementBinaryMeta(handler);
+  //  embedding_meta = new EmbeddingMeta(handler);
+  //   softmax_meta = new SoftmaxMeta(handler);
+  // batch_matmul_meta = new BatchMatmulMeta(handler);
+  // concat_meta = new ConcatMeta(handler);
+  //  dropout_meta = new DropoutMeta(handler);
+  // transpose_meta = new TransposeMeta(handler);
   this->machine = machine;
   segment_size = model->config.simulator_segment_size;
   max_num_segments = model->config.simulator_max_num_segments;
diff --git a/src/runtime/simulator.cu b/src/runtime/simulator.cu
index b44ce1690a..056781f73d 100644
--- a/src/runtime/simulator.cu
+++ b/src/runtime/simulator.cu
@@ -81,17 +81,17 @@ Simulator::Simulator(FFModel const *model,
 
   cudaEventCreate(&start_event);
   cudaEventCreate(&end_event);
-  conv2d_meta = new Conv2DMeta(handler);
+  // conv2d_meta = new Conv2DMeta(handler);
   // linear_meta = new LinearMeta(handler, 4096);
-  pool2d_meta = new Pool2DMeta(handler);
-  ele_unary_meta = new ElementUnaryMeta(handler);
+  // pool2d_meta = new Pool2DMeta(handler);
+  // ele_unary_meta = new ElementUnaryMeta(handler);
   // ele_binary_meta = new ElementBinaryMeta(handler);
   // embedding_meta = new EmbeddingMeta(handler);
   // softmax_meta = new SoftmaxMeta(handler);
-  batch_matmul_meta = new BatchMatmulMeta(handler);
-  concat_meta = new ConcatMeta(handler);
+  // batch_matmul_meta = new BatchMatmulMeta(handler);
+  // concat_meta = new ConcatMeta(handler);
   // dropout_meta = new DropoutMeta(handler);
-  transpose_meta = new TransposeMeta(handler);
+  // transpose_meta = new TransposeMeta(handler);
   this->machine = machine;
   segment_size = model->config.simulator_segment_size;
   max_num_segments = model->config.simulator_max_num_segments;
@@ -103,13 +103,13 @@ Simulator::~Simulator(void) {
   simulatorInst.destroy();
   cudaEventDestroy(start_event);
   cudaEventDestroy(end_event);
-  delete conv2d_meta;
-  delete pool2d_meta;
-  delete ele_unary_meta;
-  delete batch_matmul_meta;
-  delete concat_meta;
-  delete transpose_meta;
-  delete task_manager;
+  // delete conv2d_meta;
+  // delete pool2d_meta;
+  // delete ele_unary_meta;
+  // delete batch_matmul_meta;
+  // delete concat_meta;
+  // delete transpose_meta;
+  // delete task_manager;
 }
 
 __host__ void
diff --git a/src/runtime/substitution.cc b/src/runtime/substitution.cc
index b86964049d..9b6510fe5e 100644
--- a/src/runtime/substitution.cc
+++ b/src/runtime/substitution.cc
@@ -43,6 +43,7 @@
 #include "flexflow/parallel_ops/allreduce.h"
 #include "flexflow/parallel_ops/combine.h"
 #include "flexflow/parallel_ops/fused_parallel_op.h"
+#include "flexflow/parallel_ops/parallel_identity.h"
 #include "flexflow/parallel_ops/partition.h"
 #include "flexflow/parallel_ops/reduction.h"
 #include "flexflow/parallel_ops/replicate.h"
@@ -3754,14 +3755,17 @@ bool FFModel::convert_graph_to_operators(
         assert(inList.size() == 1);
         Softmax *softmax = (Softmax *)node.ptr;
         new_op = new Softmax(
-            *this, softmax->layer_guid, inputs[0], softmax->dim, NULL);
+            *this, softmax->layer_guid, inputs[0], softmax->dim, softmax->name);
         break;
       }
       case OP_COMBINE: {
         assert(inList.size() == 1);
         Combine *combine = (Combine *)node.ptr;
-        new_op = new Combine(
-            *this, inputs[0], combine->combine_dim, combine->combine_degree);
+        new_op = new Combine(*this,
+                             inputs[0],
+                             combine->combine_dim,
+                             combine->combine_degree,
+                             combine->name);
         break;
       }
       case OP_REPARTITION: {
@@ -3770,7 +3774,8 @@ bool FFModel::convert_graph_to_operators(
         new_op = new Repartition(*this,
                                  inputs[0],
                                  repart->repartition_dim,
-                                 repart->repartition_degree);
+                                 repart->repartition_degree,
+                                 repart->name);
         break;
       }
       case OP_REPLICATE: {
@@ -3779,7 +3784,8 @@ bool FFModel::convert_graph_to_operators(
         new_op = new Replicate(*this,
                                inputs[0],
                                replicate->replicate_dim,
-                               replicate->replicate_degree);
+                               replicate->replicate_degree,
+                               replicate->name);
         break;
       }
       case OP_REDUCTION: {
@@ -3788,13 +3794,24 @@ bool FFModel::convert_graph_to_operators(
         new_op = new Reduction(*this,
                                inputs[0],
                                reduction->reduction_dim,
-                               reduction->reduction_degree);
+                               reduction->reduction_degree,
+                               reduction->name);
         break;
       }
       case OP_ALLREDUCE: {
         assert(inList.size() == 1);
         AllReduce *allreduce = (AllReduce *)node.ptr;
-        new_op = new AllReduce(*this, inputs[0], allreduce->allreduce_dim);
+        new_op = new AllReduce(
+            *this, inputs[0], allreduce->allreduce_dim, allreduce->name);
+        break;
+      }
+      case OP_PARALLEL_IDENTITY: {
+        assert(inList.size() == 1);
+        ParallelIdentity *parallel_identity = (ParallelIdentity *)node.ptr;
+        new_op = new ParallelIdentity(*this,
+                                      inputs[0],
+                                      parallel_identity->parallel_identity_dim,
+                                      parallel_identity->name);
         break;
       }
       case OP_FUSED_PARALLEL: {
@@ -3819,8 +3836,9 @@ bool FFModel::convert_graph_to_operators(
                                               abr_ln->elementwise_affine,
                                               abr_ln->use_bias,
                                               abr_ln->eps,
+                                              abr_ln->inplace_residual,
                                               true,
-                                              NULL);
+                                              abr_ln->name);
         break;
       }
       case OP_SIGMOID_SILU_MULTI: {
@@ -3828,7 +3846,7 @@ bool FFModel::convert_graph_to_operators(
         SigmoidSiluMulti *ssm = (SigmoidSiluMulti *)node.ptr;
         SigmoidSiluMultiParams params = ssm->get_params();
         new_op = new SigmoidSiluMulti(
-            *this, ssm->layer_guid, inputs[0], inputs[1], NULL);
+            *this, ssm->layer_guid, inputs[0], inputs[1], ssm->name);
         break;
       }
       default: {
diff --git a/src/runtime/tree_verify_batch_config.cc b/src/runtime/tree_verify_batch_config.cc
index 49d42bb6dd..a71b1070b2 100644
--- a/src/runtime/tree_verify_batch_config.cc
+++ b/src/runtime/tree_verify_batch_config.cc
@@ -54,6 +54,10 @@ std::ostream &operator<<(std::ostream &os, TreeVerifyBatchConfig const &bc) {
       os << "    Number of tokens in batch: "
          << bc.requestsInfo[i].num_tokens_in_batch << std::endl;
       os << "    GUID: " << bc.requestsInfo[i].request_guid << std::endl;
+      // PEFT values
+      os << "    PEFT Model ID: " << bc.requestsInfo[i].peft_model_id
+         << std::endl;
+      os << "    PEFT bwd: " << bc.requestsInfo[i].peft_bwd << std::endl;
       os << "    Max sequence length: "
          << bc.requestsInfo[i].max_sequence_length << std::endl;
       os << "    Request completed: " << bc.request_completed[i] << std::endl;
diff --git a/tests/.gitignore b/tests/.gitignore
deleted file mode 100644
index f3732d54f4..0000000000
--- a/tests/.gitignore
+++ /dev/null
@@ -1 +0,0 @@
-inference/python_test_configs/*.json
diff --git a/tests/align/test_all_operators.sh b/tests/align/test_all_operators.sh
index 3fb361f25c..73b0cb30dc 100755
--- a/tests/align/test_all_operators.sh
+++ b/tests/align/test_all_operators.sh
@@ -11,7 +11,7 @@ function generate_torch_tensor(){
     python tests/align/align_create_tensor_torch.py -o "$1"
 }
 
-ops=(add concat conv2d cos embedding exp flat getitem identity multiply pool2d reducesum relu reshape scalar_add scalar_multiply scalar_sub scalar_truediv sigmoid sin subtract tanh transpose view_embedding max min linear gather)
+ops=(add concat conv2d cos embedding exp flat getitem identity multiply pool2d reducesum relu reshape scalar_add scalar_multiply scalar_sub scalar_truediv sigmoid sin subtract tanh transpose view_embedding max min linear layernorm gather)
 
 #create flexflow tensors
 conda activate flexflow
diff --git a/tests/cpp_gpu_tests.sh b/tests/cpp_gpu_tests.sh
index 1e8dd4298f..c7206eac93 100755
--- a/tests/cpp_gpu_tests.sh
+++ b/tests/cpp_gpu_tests.sh
@@ -23,8 +23,8 @@ remove_mnist() {
 download_mnist() {
 	if [[ ! -f train-images-idx3-ubyte || ! -f train-labels-idx1-ubyte ]]; then
 		remove_mnist
-		wget http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz
-		wget http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz
+		wget https://mnist-backup.s3.us-east-2.amazonaws.com/train-images-idx3-ubyte.gz
+		wget https://mnist-backup.s3.us-east-2.amazonaws.com/train-labels-idx1-ubyte.gz
 		gzip -d train-images-idx3-ubyte.gz
 		gzip -d train-labels-idx1-ubyte.gz
 	fi
diff --git a/tests/inference/cpp_inference_tests.sh b/tests/inference/cpp_inference_tests.sh
index 8beea55999..a9dd8809ba 100755
--- a/tests/inference/cpp_inference_tests.sh
+++ b/tests/inference/cpp_inference_tests.sh
@@ -10,26 +10,26 @@ cd "${BASH_SOURCE[0]%/*}"
 ###############################################################################################
 
 # LLAMA
-../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama.txt -pipeline-parallelism-degree 4
+../../build/inference/spec_infer/spec_infer -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama.txt -pipeline-parallelism-degree 4
 # LLAMA (half precision)
-../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_half.txt -pipeline-parallelism-degree 4
+../../build/inference/spec_infer/spec_infer -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_half.txt -pipeline-parallelism-degree 4
 
 # OPT
-../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-6.7b -ssm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt.txt -pipeline-parallelism-degree 4
+../../build/inference/spec_infer/spec_infer -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-6.7b -ssm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt.txt -pipeline-parallelism-degree 4
 # OPT (half precision)
-../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-6.7b -ssm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt_half.txt -pipeline-parallelism-degree 4
+../../build/inference/spec_infer/spec_infer -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-6.7b -ssm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt_half.txt -pipeline-parallelism-degree 4
 
 # Tensor parallelism tests
 if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
     # LLAMA
-    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/spec_infer/spec_infer -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     # LLAMA (half precision)
-    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/spec_infer/spec_infer -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model meta-llama/Llama-2-7b-hf -ssm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_llama_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     
     # OPT
-    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-6.7b -ssm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/spec_infer/spec_infer -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-6.7b -ssm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     # OPT (half precision)
-    ../../build/inference/spec_infer/spec_infer -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-6.7b -ssm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/spec_infer/spec_infer -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-6.7b -ssm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/spec_inference_opt_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
 fi
 
 ###############################################################################################
@@ -37,63 +37,63 @@ fi
 ###############################################################################################
 
 # LLAMA (small model)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M.txt -pipeline-parallelism-degree 4
 
 ../../build/inference/incr_decoding/incr_decoding -ll:gpu 1 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M.txt -pipeline-parallelism-degree 1
 
 # LLAMA (small model, half precision)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half.txt -pipeline-parallelism-degree 4
 
 # LLAMA (big model)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model meta-llama/Llama-2-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_2_7B.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model meta-llama/Llama-2-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_2_7B.txt -pipeline-parallelism-degree 4
 # LLAMA (big model, half precision)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model meta-llama/Llama-2-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_2_7B_half.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model meta-llama/Llama-2-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_2_7B_half.txt -pipeline-parallelism-degree 4
 
 # OPT (small model)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M.txt -pipeline-parallelism-degree 4
 # OPT (small model, half precision)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_half.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_half.txt -pipeline-parallelism-degree 4
 
 # OPT (big model)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-6.7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_6B.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-6.7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_6B.txt -pipeline-parallelism-degree 4
 # OPT (big model, half precision)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-6.7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_6B_half.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-6.7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_6B_half.txt -pipeline-parallelism-degree 4
 
 # Falcon (full precision)
-../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 40000 --fusion --use-full-precision -llm-model tiiuae/falcon-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_falcon_7B.txt -pipeline-parallelism-degree 4
+../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 40000 --fusion --use-full-precision -llm-model tiiuae/falcon-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_falcon_7B.txt -pipeline-parallelism-degree 4
 # Falcon (half precision)
-# ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model tiiuae/falcon-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_falcon_7B.txt -pipeline-parallelism-degree 4
+# ../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model tiiuae/falcon-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_falcon_7B.txt -pipeline-parallelism-degree 4
 
 # # StarCoder (full precision)
-# ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model bigcode/starcoderbase-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_starcoder_7B.txt -pipeline-parallelism-degree 4
+# ../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model bigcode/starcoderbase-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_starcoder_7B.txt -pipeline-parallelism-degree 4
 # # StarCoder (half precision)
-# ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model bigcode/starcoderbase-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_starcoder_7B_half.txt -pipeline-parallelism-degree 4
+# ../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model bigcode/starcoderbase-7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_starcoder_7B_half.txt -pipeline-parallelism-degree 4
 
 # Tensor parallelism tests
 if [ "$TENSOR_PARALLELISM_TESTS" = "ON" ]; then
     # LLAMA (small model)
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
+    ../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
     # LLAMA (small model, half precision)
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
+    ../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model JackFram/llama-160m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_160M_half_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
 
     # LLAMA (big model)
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model meta-llama/Llama-2-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_2_7B_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model meta-llama/Llama-2-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_2_7B_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     # LLAMA (big model, half precision)
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model meta-llama/Llama-2-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_2_7B_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model meta-llama/Llama-2-7b-hf -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_llama_2_7B_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
 
     # OPT (small model)
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
+    ../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_tp4.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
     # OPT (small model, half precision)
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_half_tp.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
+    ../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-125m -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_125M_half_tp.txt -pipeline-parallelism-degree 1 -tensor-parallelism-degree 4
 
     # OPT (big model)
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-6.7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_6B_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion --use-full-precision -llm-model facebook/opt-6.7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_6B_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
     # OPT (big model, half precision)
-    ../../build/inference/incr_decoding/incr_decoding -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-6.7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_6B_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
+    ../../build/inference/incr_decoding/incr_decoding -ll:cpu 4 -ll:util 4 -ll:gpu 4 -ll:fsize 14000 -ll:zsize 30000 --fusion -llm-model facebook/opt-6.7b -prompt ../../inference/prompt/test.json -output-file ../../inference/output/incr_decoding_opt_6B_half_tp.txt -pipeline-parallelism-degree 2 -tensor-parallelism-degree 2
 fi
 
 ###############################################################################################
diff --git a/tests/inference/huggingface_inference.py b/tests/inference/huggingface_inference.py
index 6857b5cbc1..5e563c9974 100644
--- a/tests/inference/huggingface_inference.py
+++ b/tests/inference/huggingface_inference.py
@@ -77,20 +77,18 @@ def main():
 
     # Set default tensor type depending on argument indicating the float type to use
     if not args.use_full_precision:
-        torch.set_default_tensor_type(torch.HalfTensor)
-
+        torch.set_default_dtype(torch.float16)
+    else:
+        torch.set_default_dtype(torch.float32)
+    
     # Run huggingface model
     cuda_availble = torch.cuda.is_available()
     device = "cuda" if args.gpu and cuda_availble else "cpu"
     # Get Model
-    model = AutoModelForCausalLM.from_pretrained(args.model_name).to(device)
+    model = AutoModelForCausalLM.from_pretrained(args.model_name, trust_remote_code=True).to(device)
     # Get Tokenizer
     hf_config = AutoConfig.from_pretrained(args.model_name, trust_remote_code=True)
-    hf_arch = getattr(hf_config, "architectures")[0]
-    if hf_arch == "LLaMAForCausalLM" or hf_arch == "LlamaForCausalLM":
-        tokenizer = LlamaTokenizer.from_pretrained(args.model_name, use_fast=True)
-    else:
-        tokenizer = AutoTokenizer.from_pretrained(args.model_name)
+    tokenizer = AutoTokenizer.from_pretrained(args.model_name, trust_remote_code=True)
     generation_config = GenerationConfig.from_pretrained(args.model_name)
     generation_config.do_sample = args.do_sample
     ################# debugging #################
diff --git a/tests/inference/python_inference_tests.sh b/tests/inference/python_inference_tests.sh
index a1ee281914..a83464754f 100755
--- a/tests/inference/python_inference_tests.sh
+++ b/tests/inference/python_inference_tests.sh
@@ -84,12 +84,13 @@ function compare_decoding_steps_spec_infer_incr_decoding {
     local specInf_file="$2"
 
     # Read the number of decoding steps from the second line of the files
-    second_line=$(sed -n '2p' "$incrDec_file")
-    read -r line <<< "$second_line"
-    incrDec=${line#*: }
-    second_line=$(sed -n '2p' "$specInf_file")
-    read -r line <<< "$second_line"
-    specInf=${line#*: }
+    first_line=$(sed -n '1p' "$incrDec_file")
+    incr_dec_steps="${first_line##*llm_decoding_steps(}"
+    incr_dec_steps="${incr_dec_steps%%)*}"
+    
+    first_line=$(sed -n '1p' "$specInf_file")
+    spec_inf_steps="${first_line##*llm_decoding_steps(}"
+    spec_inf_steps="${spec_inf_steps%%)*}"
 
     if ! command -v bc &> /dev/null; then
         echo "bc is not installed. Installing..."
@@ -97,8 +98,8 @@ function compare_decoding_steps_spec_infer_incr_decoding {
     fi
     
     # Perform the comparison
-    threshold=$(bc <<< "$specInf * 1.5")
-    if (( $(echo "$incrDec >= $threshold" | bc -l) )); then
+    threshold=$(bc <<< "$spec_inf_steps * 1.5")
+    if (( $(echo "$incr_dec_steps >= $threshold" | bc -l) )); then
         #echo "The decoding steps in $specInf_file are at least 1.5x less than those in $incrDec_file."
         :
     else
@@ -184,13 +185,13 @@ python3 ./huggingface_inference.py --model-name "facebook/opt-6.7b" --use-full-p
 # Falcon (full precision)
 python3 ./huggingface_inference.py --model-name "tiiuae/falcon-7b" --use-full-precision --prompt-file "../../inference/prompt/test.json" --output-file "../../inference/output/huggingface_falcon_7B.txt" --max-length 128
 
-diff "../../inference/output/huggingface_llama_160M.txt" <(tail -n +4 "../../inference/output/incr_dec-python-llama-160m-full_prec-1_tp_4_pp.txt")
-diff <( < ../../inference/output/huggingface_llama_160M_half.txt tr -s '[:space:]' '\n' | head -n 20) <(tail -n +4 "../../inference/output/incr_dec-python-llama-160m-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
-diff "../../inference/output/huggingface_llama_7B.txt" <(tail -n +4 "../../inference/output/incr_dec-python-llama-2-7b-hf-full_prec-1_tp_4_pp.txt")
-diff <( < ../../inference/output/huggingface_llama_7B_half.txt tr -s '[:space:]' '\n' | head -n 20) <(tail -n +4 "../../inference/output/incr_dec-python-llama-2-7b-hf-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
+diff "../../inference/output/huggingface_llama_160M.txt" <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-full_prec-1_tp_4_pp.txt")
+diff <( < ../../inference/output/huggingface_llama_160M_half.txt tr -s '[:space:]' '\n' | head -n 20) <(tail -n +3 "../../inference/output/incr_dec-python-llama-160m-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
+diff "../../inference/output/huggingface_llama_7B.txt" <(tail -n +3 "../../inference/output/incr_dec-python-llama-2-7b-hf-full_prec-1_tp_4_pp.txt")
+diff <( < ../../inference/output/huggingface_llama_7B_half.txt tr -s '[:space:]' '\n' | head -n 20) <(tail -n +3 "../../inference/output/incr_dec-python-llama-2-7b-hf-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
 
-diff "../../inference/output/huggingface_opt_125M.txt" <(tail -n +4 "../../inference/output/incr_dec-python-opt-125m-full_prec-1_tp_4_pp.txt")
-diff <( < ../../inference/output/huggingface_opt_125M_half.txt tr -s '[:space:]' '\n' | head -n 20) <(tail -n +4 "../../inference/output/incr_dec-python-opt-125m-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
-diff "../../inference/output/huggingface_opt_6B.txt" <(tail -n +4 "../../inference/output/incr_dec-python-opt-6.7b-full_prec-1_tp_4_pp.txt")
-#diff "../../inference/output/huggingface_opt_6B_half.txt" <(tail -n +4 "../../inference/output/incr_dec-python-opt-6.7b-half_prec-1_tp_4_pp.txt")
-diff "../../inference/output/huggingface_falcon_7B.txt" <(tail -n +4 "../../inference/output/incr_dec-python-falcon-7b-full_prec-1_tp_4_pp.txt")
+diff "../../inference/output/huggingface_opt_125M.txt" <(tail -n +3 "../../inference/output/incr_dec-python-opt-125m-full_prec-1_tp_4_pp.txt")
+diff <( < ../../inference/output/huggingface_opt_125M_half.txt tr -s '[:space:]' '\n' | head -n 20) <(tail -n +3 "../../inference/output/incr_dec-python-opt-125m-half_prec-1_tp_4_pp.txt" | tr -s '[:space:]' '\n' | head -n 20)
+diff "../../inference/output/huggingface_opt_6B.txt" <(tail -n +3 "../../inference/output/incr_dec-python-opt-6.7b-full_prec-1_tp_4_pp.txt")
+#diff "../../inference/output/huggingface_opt_6B_half.txt" <(tail -n +3 "../../inference/output/incr_dec-python-opt-6.7b-half_prec-1_tp_4_pp.txt")
+diff "../../inference/output/huggingface_falcon_7B.txt" <(tail -n +3 "../../inference/output/incr_dec-python-falcon-7b-full_prec-1_tp_4_pp.txt")
diff --git a/tests/inference/python_test_configs/generate_configs.py b/tests/inference/python_test_configs/generate_configs.py
index 41703cf431..0a745c7984 100644
--- a/tests/inference/python_test_configs/generate_configs.py
+++ b/tests/inference/python_test_configs/generate_configs.py
@@ -14,9 +14,12 @@
     "tensor_parallelism_degree": 1,
     "pipeline_parallelism_degree": 4,
     "offload": False,
-    "offload_reserve_space_size": 1024**2,
+    "offload_reserve_space_size": 8 * 1024, # 8 GB
     "use_4bit_quantization": False,
     "use_8bit_quantization": False,
+    "enable_peft": False,
+    "peft_activation_reserve_space_size": 1024, # 1GB
+    "peft_weight_reserve_space_size": 1024, # 1GB
     "profiling": False,
     "benchmarking": False,
     "inference_debugging": False,
diff --git a/tests/peft/alignment/align_test_utils.py b/tests/peft/alignment/align_test_utils.py
new file mode 100644
index 0000000000..93727bdc89
--- /dev/null
+++ b/tests/peft/alignment/align_test_utils.py
@@ -0,0 +1,510 @@
+import os, re, torch
+import numpy as np
+from typing import List
+from enum import Enum
+from dataclasses import dataclass
+
+abs_dirname = os.path.dirname(os.path.abspath(__file__))
+cache_folder = os.path.expanduser(os.getenv("FF_CACHE_PATH", "~/.cache/flexflow"))
+hf_path = os.path.join(cache_folder, "debug/huggingface")
+ff_path = os.path.join(cache_folder, "debug/flexflow")
+
+
+def print_unique_files_list(dirname):
+    files_list = os.listdir(dirname)
+    for f in sorted(files_list):
+        match = re.search(r"layers.\d+", f)
+        if match:
+            if "layers." in match[0]:
+                layer_num = int(match[0].split(".")[1])
+                if layer_num > 0:
+                    files_list.remove(f)
+            elif "layers_" in match[0]:
+                layer_num = int(match[0].split("_")[1])
+                if layer_num > 0 and layer_num != 100:
+                    files_list.remove(f)
+    return sorted(files_list)
+
+
+def compare_tensors(hf_tensor_filepath: str, ff_tensor_filepath: str, tolerance=1e-2):
+    """Check whether a HuggingFace tensor and a FlexFlow tensor are equal
+
+    Args:
+        hf_tensor_filepath (str): The file path of the HuggingFace tensor
+        ff_tensor_filepath (str): The file path of the FlexFlow tensor
+        tolerance (float, optional): Floating-point error tolerance for the checks. Defaults to 1e-2.
+
+    Raises:
+        FileNotFoundError: _description_
+        FileNotFoundError: _description_
+    """
+    if not os.path.exists(hf_tensor_filepath):
+        raise FileNotFoundError(f"HF tensor file: {hf_tensor_filepath} not found")
+    if not os.path.exists(ff_tensor_filepath):
+        raise FileNotFoundError(f"FF tensor file {ff_tensor_filepath} not found")
+    hf_tensor = torch.load(hf_tensor_filepath)
+    if type(hf_tensor) == tuple or type(hf_tensor) == list:
+        assert len(hf_tensor) == 1
+        hf_tensor = hf_tensor[0]
+    hf_tensor = torch.nan_to_num(hf_tensor)
+    hf_tensor = hf_tensor.flatten().detach().cpu().numpy()
+    ff_tensor = np.loadtxt(ff_tensor_filepath, delimiter=",")
+
+    len_hf_tensor = hf_tensor.shape[0]
+    ff_tensor = ff_tensor[:len_hf_tensor]
+
+    mismatches = []
+    if not np.allclose(ff_tensor, hf_tensor, atol=tolerance):
+        print(f"mismatch between {hf_tensor_filepath} and {ff_tensor_filepath}")
+        print(f"HF: {hf_tensor}\nFF:{ff_tensor}")
+        print(np.isclose(ff_tensor, hf_tensor, atol=tolerance))
+        mismatches = np.where(~np.isclose(ff_tensor, hf_tensor, atol=tolerance))[0]
+        print(mismatches)
+        # print(np.nonzero(hf_tensor)[0])
+        # print(np.where(np.isclose(ff_tensor, hf_tensor, atol=tolerance) ==0)[0])
+        # print(ff_tensor[36], hf_tensor[36])
+    # assert(np.allclose(ff_tensor, hf_tensor, atol=tolerance))
+    assert len(mismatches) <= 0.05 * len_hf_tensor
+    print("Ok!")
+
+
+def compare_tensors_difference(
+    hf_tensor_filepath: str,
+    ff_tensor1_filepath: str,
+    ff_tensor2_filepath: str,
+    tolerance: float = 1e-2,
+):
+    """Check whether a HuggingFace tensor is equal to the difference between two FlexFlow tensors
+
+    Args:
+        hf_tensor_filepath (str): The file path of the HuggingFace tensor
+        ff_tensor1_filepath (str): The file path of the first FlexFlow tensor
+        ff_tensor2_filepath (str): The file path of the second FlexFlow tensor
+        tolerance (float, optional): The floating-point error tolerance for the equality check. Defaults to 1e-2.
+    """
+    assert os.path.exists(hf_tensor_filepath)
+    assert os.path.exists(ff_tensor1_filepath)
+    assert os.path.exists(ff_tensor2_filepath)
+    hf_tensor = torch.load(hf_tensor_filepath)
+    if type(hf_tensor) == tuple or type(hf_tensor) == list:
+        assert len(hf_tensor) == 1
+        hf_tensor = hf_tensor[0]
+    hf_tensor = torch.nan_to_num(hf_tensor)
+    hf_tensor = hf_tensor.flatten().detach().cpu().numpy()
+    ff_tensor1 = np.loadtxt(ff_tensor1_filepath, delimiter=",")
+    ff_tensor2 = np.loadtxt(ff_tensor2_filepath, delimiter=",")
+
+    len_hf_tensor = hf_tensor.shape[0]
+    ff_tensor1 = ff_tensor1[:len_hf_tensor]
+    ff_tensor2 = ff_tensor2[:len_hf_tensor]
+    ff_tensor = ff_tensor1 - ff_tensor2
+
+    mismatches = []
+    if not np.allclose(ff_tensor, hf_tensor, atol=tolerance):
+        print(
+            f"mismatch between {hf_tensor_filepath} and {ff_tensor1_filepath} - {ff_tensor2_filepath}"
+        )
+        print(f"HF: {hf_tensor}\nFF:{ff_tensor}")
+        print(np.isclose(ff_tensor, hf_tensor, atol=tolerance))
+        mismatches = np.where(~np.isclose(ff_tensor, hf_tensor, atol=tolerance))[0]
+        print(mismatches)
+        # print(np.nonzero(hf_tensor)[0])
+        # print(np.where(np.isclose(ff_tensor, hf_tensor, atol=tolerance) ==0)[0])
+        # print(ff_tensor[36], hf_tensor[36])
+    # assert(np.allclose(ff_tensor, hf_tensor, atol=tolerance))
+    assert len(mismatches) <= 0.05 * len_hf_tensor
+    print("Ok!")
+
+
+def compare_hf_tensors(tensor1_fp: str, tensor2_fp: str):
+    """Checks whether two HuggingFace tensors are equal
+
+    Args:
+        tensor1_fp (str): The file path of the first tensor
+        tensor2_fp (str): The file path of the second tensor
+    """
+    if not os.path.exists(tensor1_fp):
+        raise FileNotFoundError(f"HF tensor file: {tensor1_fp} not found")
+    if not os.path.exists(tensor2_fp):
+        raise FileNotFoundError(f"HF tensor file {tensor2_fp} not found")
+    hf_tensor1 = torch.load(tensor1_fp)
+    hf_tensor2 = torch.load(tensor2_fp)
+    if type(hf_tensor1) == tuple or type(hf_tensor1) == list:
+        assert len(hf_tensor1) == 1
+        hf_tensor1 = hf_tensor1[0]
+    if type(hf_tensor2) == tuple or type(hf_tensor2) == list:
+        assert len(hf_tensor2) == 1
+        hf_tensor2 = hf_tensor2[0]
+    assert torch.squeeze(hf_tensor1).shape == torch.squeeze(hf_tensor2).shape
+    hf_tensor1 = torch.nan_to_num(hf_tensor1)
+    hf_tensor2 = torch.nan_to_num(hf_tensor2)
+    if not (
+        np.allclose(
+            hf_tensor1.detach().cpu().numpy(), hf_tensor2.detach().cpu().numpy()
+        )
+    ):
+        print(f"mismatch between {tensor1_fp} and {tensor2_fp}")
+        print(hf_tensor1)
+        print(hf_tensor2)
+        print(
+            np.isclose(
+                hf_tensor1.detach().cpu().numpy(), hf_tensor2.detach().cpu().numpy()
+            )
+        )
+        mismatches = np.where(
+            ~np.isclose(
+                hf_tensor1.detach().cpu().numpy(), hf_tensor2.detach().cpu().numpy()
+            )
+        )[0]
+        print(mismatches)
+        assert False
+    print("Ok!")
+
+
+def check_hf_sum_tensors(tensor_sum_fp: str, tensor1_fp: str, tensor2_fp: str):
+    """Checks whether a HuggingFace tensor is equal to the sum of two other HuggingFace tensors
+
+    Args:
+        tensor_sum_fp (str): The file path of the sum tensor
+        tensor1_fp (str): The file path of the first tensor
+        tensor2_fp (str): The file path of the second tensor
+    """
+    if not os.path.exists(tensor_sum_fp):
+        raise FileNotFoundError(f"HF tensor file: {tensor_sum_fp} not found")
+    if not os.path.exists(tensor1_fp):
+        raise FileNotFoundError(f"HF tensor file {tensor1_fp} not found")
+    if not os.path.exists(tensor2_fp):
+        raise FileNotFoundError(f"HF tensor file {tensor2_fp} not found")
+    hf_tensor_sum = torch.load(tensor_sum_fp)
+    hf_tensor1 = torch.load(tensor1_fp)
+    hf_tensor2 = torch.load(tensor2_fp)
+    if type(hf_tensor_sum) == tuple or type(hf_tensor_sum) == list:
+        assert len(hf_tensor_sum) == 1
+        hf_tensor_sum = hf_tensor_sum[0]
+    if type(hf_tensor1) == tuple or type(hf_tensor1) == list:
+        assert len(hf_tensor1) == 1
+        hf_tensor1 = hf_tensor1[0]
+    if type(hf_tensor2) == tuple or type(hf_tensor2) == list:
+        assert len(hf_tensor2) == 1
+        hf_tensor2 = hf_tensor2[0]
+    assert torch.squeeze(hf_tensor_sum).shape == torch.squeeze(hf_tensor1).shape
+    assert torch.squeeze(hf_tensor1).shape == torch.squeeze(hf_tensor2).shape
+    hf_tensor1 = torch.nan_to_num(hf_tensor1)
+    hf_tensor2 = torch.nan_to_num(hf_tensor2)
+    hf_tensor_sum = torch.nan_to_num(hf_tensor_sum)
+    sum_check_tensor = hf_tensor1 + hf_tensor2
+    if not (
+        np.allclose(
+            sum_check_tensor.detach().cpu().numpy(),
+            hf_tensor_sum.detach().cpu().numpy(),
+        )
+    ):
+        print(f"mismatch between {sum_check_tensor} and {tensor1_fp} + {tensor2_fp}")
+        print(tensor_sum_fp)
+        print(sum_check_tensor)
+        print(hf_tensor1)
+        print(hf_tensor2)
+        print(
+            np.isclose(
+                sum_check_tensor.detach().cpu().numpy(),
+                hf_tensor_sum.detach().cpu().numpy(),
+            )
+        )
+        mismatches = np.where(
+            ~np.isclose(
+                sum_check_tensor.detach().cpu().numpy(),
+                hf_tensor_sum.detach().cpu().numpy(),
+            )
+        )[0]
+        print(mismatches)
+        assert False
+    print("Ok!")
+
+
+def check_hf_zero_tensor(hf_tensor_fp: str):
+    """Check whether a HuggingFace tensor is a zero tensor
+
+    Args:
+        hf_tensor_fp (str): The file path of the HuggingFace tensor
+    """
+    if not os.path.exists(hf_tensor_fp):
+        raise FileNotFoundError(f"HF tensor file: {hf_tensor_fp} not found")
+    hf_tensor1 = torch.load(hf_tensor_fp)
+    if type(hf_tensor1) == tuple or type(hf_tensor1) == list:
+        assert len(hf_tensor1) == 1
+        hf_tensor1 = hf_tensor1[0]
+    assert torch.count_nonzero(torch.nan_to_num(hf_tensor1)).sum() == 0
+
+
+def print_tensors(hf_tensor_filepath: str, ff_tensor_filepath: str, txt: str = ""):
+    """Print the contents of a HuggingFace tensor and a FlexFlow tensor
+
+    Args:
+        hf_tensor_filepath (str): The file path of the HuggingFace tensor
+        ff_tensor_filepath (str): The file path of the FlexFlow tensor
+        txt (str, optional): Additional text to prepend to the tensors. Defaults to "".
+    """
+    assert os.path.exists(hf_tensor_filepath) and os.path.exists(ff_tensor_filepath)
+    hf_tensor = torch.load(hf_tensor_filepath)
+    if type(hf_tensor) == tuple or type(hf_tensor) == list:
+        assert len(hf_tensor) == 1
+        hf_tensor = hf_tensor[0]
+    hf_tensor = torch.nan_to_num(hf_tensor)
+    hf_tensor = hf_tensor.flatten().detach().cpu().numpy()
+    ff_tensor = np.loadtxt(ff_tensor_filepath, delimiter=",")
+
+    len_hf_tensor = hf_tensor.shape[0]
+    ff_tensor = ff_tensor[:len_hf_tensor]
+
+    print(f"{txt} - HF tensor:")
+    print(hf_tensor)
+    print(f"{txt} - FF tensor: ")
+    print(ff_tensor)
+
+
+def compare_flexflow_tensors(
+    ff_tensor1_fp: str, ff_tensor2_fp: str, tolerance: float = 1e-5, max_len: int = -1
+):
+    """Check whether two FlexFlow tensors are equal
+
+    Args:
+        ff_tensor1_fp (str): The file path of the first FlexFlow tensor
+        ff_tensor2_fp (str): The file path of the second FlexFlow tensor
+        tolerance (float, optional): Floating-point error tolernace for the check. Defaults to 1e-5.
+        max_len (int, optional): Maximum number of elements to check (if > 0). Defaults to -1.
+
+    Raises:
+        FileNotFoundError: _description_
+        FileNotFoundError: _description_
+    """
+    if not os.path.exists(ff_tensor1_fp):
+        raise FileNotFoundError(f"FF tensor file: {ff_tensor1_fp} not found")
+    if not os.path.exists(ff_tensor2_fp):
+        raise FileNotFoundError(f"FF tensor file {ff_tensor2_fp} not found")
+    assert os.path.exists(ff_tensor1_fp) and os.path.exists(ff_tensor2_fp)
+    ff_tensor1 = np.loadtxt(ff_tensor1_fp, delimiter=",")
+    ff_tensor2 = np.loadtxt(ff_tensor2_fp, delimiter=",")
+
+    if ff_tensor1.shape != ff_tensor2.shape:
+        print(ff_tensor1.shape, ff_tensor2.shape)
+    assert ff_tensor1.shape == ff_tensor2.shape
+
+    if max_len > -1:
+        ff_tensor1 = ff_tensor1[:max_len]
+        ff_tensor2 = ff_tensor2[:max_len]
+
+    mismatches = []
+    if not np.allclose(ff_tensor1, ff_tensor2, atol=tolerance):
+        print(f"mismatch between {ff_tensor1_fp} and {ff_tensor2_fp}")
+        print(f"Tensor1: {ff_tensor1}\nTensor2:{ff_tensor2}")
+        print(np.isclose(ff_tensor1, ff_tensor2, atol=tolerance))
+        mismatches = np.where(~np.isclose(ff_tensor1, ff_tensor2, atol=tolerance))[0]
+        print(mismatches)
+    # assert(np.allclose(ff_tensor, hf_tensor, atol=tolerance))
+    assert len(mismatches) <= 0.05 * len(ff_tensor1)
+    print("Ok!")
+
+
+def compare_flexflow_tensors_shortest(
+    ff_tensor1_fp: str, ff_tensor2_fp: str, tolerance: float = 1e-5
+):
+    """Compare two FlexFlow tensors up to the maximum length of the shortest tensor
+
+    Args:
+        ff_tensor1_fp (str): The file path of the first FlexFlow tensor
+        ff_tensor2_fp (str): The file path of the second FlexFlow tensor
+        tolerance (float, optional): Floating point error tolerance for the check. Defaults to 1e-5.
+
+    Raises:
+        FileNotFoundError: _description_
+        FileNotFoundError: _description_
+    """
+    if not os.path.exists(ff_tensor1_fp):
+        raise FileNotFoundError(f"FF tensor file: {ff_tensor1_fp} not found")
+    if not os.path.exists(ff_tensor2_fp):
+        raise FileNotFoundError(f"FF tensor file {ff_tensor2_fp} not found")
+    ff_tensor1 = np.loadtxt(ff_tensor1_fp, delimiter=",")
+    ff_tensor2 = np.loadtxt(ff_tensor2_fp, delimiter=",")
+    minlen = min(ff_tensor1.shape[0], ff_tensor2.shape[0])
+    ff_tensor1 = ff_tensor1[:minlen]
+    ff_tensor2 = ff_tensor2[:minlen]
+    mismatches = []
+    if not np.allclose(ff_tensor1, ff_tensor2, atol=tolerance):
+        print(f"mismatch between {ff_tensor1_fp} and {ff_tensor2_fp}")
+        print(f"Tensor1: {ff_tensor1}\nTensor2:{ff_tensor2}")
+        print(np.isclose(ff_tensor1, ff_tensor2, atol=tolerance))
+        mismatches = np.where(~np.isclose(ff_tensor1, ff_tensor2, atol=tolerance))[0]
+        print(mismatches)
+    # assert(np.allclose(ff_tensor, hf_tensor, atol=tolerance))
+    assert len(mismatches) <= 0.05 * len(ff_tensor1)
+    print("Ok!")
+
+
+def check_flexflow_tensors_sum(
+    ff_tensor_sum_fp: str, ff_tensor1_fp: str, ff_tensor2_fp: str, tolerance=1e-5
+):
+    """Check whether a FlexFlow tensor is equal to the sum of two other FlexFlow tensors
+
+    Args:
+        ff_tensor_sum_fp (str): The file path of the FlexFlow sum tensor
+        ff_tensor1_fp (str): The file path of the first FlexFlow tensor
+        ff_tensor2_fp (str): The file path of the second FlexFlow tensor
+        tolerance (_type_, optional): Floating-point error tolerance for the check. Defaults to 1e-5.
+
+    Raises:
+        FileNotFoundError: _description_
+        FileNotFoundError: _description_
+    """
+    if not os.path.exists(ff_tensor1_fp):
+        raise FileNotFoundError(f"FF tensor file: {ff_tensor1_fp} not found")
+    if not os.path.exists(ff_tensor2_fp):
+        raise FileNotFoundError(f"FF tensor file {ff_tensor2_fp} not found")
+    ff_tensor1 = np.loadtxt(ff_tensor1_fp, delimiter=",")
+    ff_tensor2 = np.loadtxt(ff_tensor2_fp, delimiter=",")
+    ff_tensor_sum = np.loadtxt(ff_tensor_sum_fp, delimiter=",")
+
+    ff_sum = ff_tensor1 + ff_tensor2
+    assert ff_tensor1.shape == ff_tensor2.shape
+
+    mismatches = []
+    if not np.allclose(ff_tensor_sum, ff_sum, atol=tolerance):
+        print(
+            f"mismatch between {ff_tensor_sum_fp} and sum of {ff_tensor1_fp} + {ff_tensor2_fp}"
+        )
+        print(f"Tensor1: {ff_tensor1}\nTensor2:{ff_tensor2}")
+        print(f"Sum Tensor: {ff_tensor_sum}\nActual sum:{ff_sum}")
+        print(np.isclose(ff_tensor_sum, ff_sum, atol=tolerance))
+        mismatches = np.where(~np.isclose(ff_tensor_sum, ff_sum, atol=tolerance))[0]
+        print(mismatches)
+    # assert(np.allclose(ff_tensor, hf_tensor, atol=tolerance))
+    assert len(mismatches) <= 0.05 * len(ff_tensor1)
+    print("Ok!")
+
+
+def load_ff_tensor(filename: str, shape: List[int]):
+    """Load a FlexFlow tensor from a file as a numpy array
+
+    Args:
+        filename (str): The file path of the FF tensor
+        shape (List[int]): The shape of the FF tensor
+
+    Returns:
+        _type_: The FF tensor as a numpy array
+    """
+    if ff_path not in filename:
+        filename = os.path.join(ff_path, filename)
+    ff_tensor = np.loadtxt(filename, delimiter=",").reshape(shape, order="F")
+    return ff_tensor
+
+
+def load_hf_tensor(filename: str):
+    """Load a HuggingFace tensor from a file as a numpy array
+
+    Args:
+        filename (str): The file path of the HF tensor
+
+    Returns:
+        _type_: The HF tensor as a numpy array
+    """
+    if hf_path not in filename:
+        filename = os.path.join(hf_path, filename)
+    hf_tensor = torch.load(filename)
+    hf_tensor = hf_tensor.detach().cpu().numpy()
+    return hf_tensor
+
+
+def compare_loaded_tensors(hf_tensor, ff_tensor, tolerance=1e-2):
+    """Check whether a Huggingface and a FlexFlow tensors, both loaded to memory in the form of a numpy array, are equal
+
+    Args:
+        hf_tensor (_type_): The HuggingFace tensor (in numpy array form)
+        ff_tensor (_type_): The FlexFlow tensor (in numpy array form)
+        tolerance (_type_, optional): The floating point error tolerance for the check. Defaults to 1e-2.
+    """
+    assert hf_tensor.shape == ff_tensor.shape
+    mismatches = []
+    if not np.allclose(hf_tensor, ff_tensor, atol=tolerance):
+        print(f"mismatch between hf_tensor and ff_tensor")
+        print(f"HF: {hf_tensor}\nFF:{ff_tensor}")
+        print(np.isclose(hf_tensor, ff_tensor, atol=tolerance))
+        mismatches = np.where(~np.isclose(hf_tensor, ff_tensor, atol=tolerance))[0]
+        print(mismatches)
+    len_hf_tensor = hf_tensor.flatten().shape[0]
+    assert len(mismatches) <= 0.05 * len_hf_tensor
+    print("Ok!")
+
+
+def are_np_arrays_identical(*np_arrays):
+    if len(np_arrays) < 2:
+        return True
+
+    first = np_arrays[0]
+
+    # Check shapes and dtypes
+    if not all(
+        t.shape == first.shape and t.dtype == first.dtype for t in np_arrays[1:]
+    ):
+        return False
+
+    # Stack all tensors along a new axis
+    stacked = np.stack(np_arrays)
+
+    # Check if all elements along the new axis are equal
+    return np.all(stacked == stacked[0])
+
+
+class TPType(Enum):
+    REPLICATE = 0
+    PARTITION = 1
+    TO_REDUCE = 2
+
+
+@dataclass
+class TensorComparisonIdxs:
+    hf_tensor_type: str
+    ff_tensor_type: str
+    hf_tensor_idx: int
+    ff_tensor_idx: int
+
+
+def replace_value(lst, old_value, new_value):
+    occurrences = lst.count(old_value)
+    if occurrences == 0:
+        raise ValueError(f"Value {old_value} not found in the list.")
+    elif occurrences > 1:
+        raise ValueError(f"Multiple instances of {old_value} found in the list.")
+    else:
+        index = lst.index(old_value)
+        lst[index] = new_value
+        return lst
+
+
+def truncate_dimension(tensor, old_dim, new_dim):
+    # Check if old_dim appears exactly once in the tensor's shape
+    shape = tensor.shape
+    dim_occurrences = shape.count(old_dim)
+
+    if dim_occurrences == 0:
+        raise ValueError(f"Dimension {old_dim} not found in the tensor shape.")
+    elif dim_occurrences > 1:
+        raise ValueError(
+            f"Multiple instances of dimension {old_dim} found in the tensor shape."
+        )
+
+    # Check if new_dim is less than or equal to old_dim
+    if new_dim > old_dim:
+        raise ValueError(
+            f"New dimension ({new_dim}) must be less than or equal to old dimension ({old_dim})."
+        )
+
+    # Find the index of the dimension to truncate
+    dim_index = shape.index(old_dim)
+
+    # Create a slice object for truncation
+    slices = [slice(None)] * len(shape)
+    slices[dim_index] = slice(0, new_dim)
+
+    # Truncate the tensor
+    truncated_tensor = tensor[tuple(slices)]
+
+    return truncated_tensor
diff --git a/tests/peft/alignment/llama_alignment_tests.ipynb b/tests/peft/alignment/llama_alignment_tests.ipynb
new file mode 100644
index 0000000000..86a4ef76c4
--- /dev/null
+++ b/tests/peft/alignment/llama_alignment_tests.ipynb
@@ -0,0 +1,2651 @@
+{
+ "cells": [
+  {
+   "cell_type": "code",
+   "execution_count": 1,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "import numpy as np\n",
+    "import os, torch\n",
+    "from align_test_utils import *"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 2,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "/usr/FlexFlow/tests/peft/hf_peft_tensors /usr/FlexFlow/build/inference_tensors\n"
+     ]
+    }
+   ],
+   "source": [
+    "print(hf_path, ff_path)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "### Check weights (semi-automatically)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 8,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n"
+     ]
+    }
+   ],
+   "source": [
+    "def convert_hf_filename_to_ff_filename(f, num_layers=12):\n",
+    "    if f.endswith(\".lm_head.weight\"):\n",
+    "        f_version = f\"fwd_step_0_layers_{num_layers-1}_lm_head_shard_0_weight_0\"\n",
+    "    elif f == \"norm.weight\":\n",
+    "        f_version = f\"fwd_step_0_layers_{num_layers-1}_norm_shard_0_weight_0\"\n",
+    "    else:\n",
+    "        f_version = \"fwd_step_0_\"\n",
+    "        if f.startswith(\"layers.\"):\n",
+    "            layernum = f.split(\"layers.\")[1].split(\".\")[0]\n",
+    "            f_version += f\"layers_{layernum}_\"\n",
+    "        f_version += f.split(\".weight\")[0].replace(\".base_layer\", \"\").replace(\".default\", \"\")\n",
+    "        weight_index=\"0\"\n",
+    "        if \"lora_A\" in f_version:\n",
+    "            weight_index=\"A\"\n",
+    "        elif \"lora_B\" in f_version:\n",
+    "            weight_index=\"B\"\n",
+    "        f_version = f_version.replace(\"lora_A\", \"lora\").replace(\"lora_B\", \"lora\")\n",
+    "        f_version += f\"_shard_0_weight_{weight_index}\"\n",
+    "    return f_version\n",
+    "\n",
+    "files_list = os.listdir(hf_path)\n",
+    "num_layers=12\n",
+    "for f in sorted(files_list):\n",
+    "    if f.endswith(\".weight\"):\n",
+    "        if \"self_attn\" in f:\n",
+    "            continue\n",
+    "        f_version = convert_hf_filename_to_ff_filename(f, num_layers=num_layers)\n",
+    "        # print(f, f_version)\n",
+    "        hf_w_path = os.path.join(hf_path, f)\n",
+    "        ff_w_path = os.path.join(ff_path, f_version)\n",
+    "        assert(os.path.isfile(hf_w_path))\n",
+    "        assert(os.path.isfile(ff_w_path))\n",
+    "        # print(\"\\t\", os.path.isfile(hf_w_path), os.path.isfile(ff_w_path))\n",
+    "        # print(\"\\t\", ff_w_path)\n",
+    "\n",
+    "        # check equivalence\n",
+    "        compare_tensors(hf_w_path, ff_w_path, tolerance=1e-5)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "### Load model for automatic check"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 3,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "/opt/conda/lib/python3.11/site-packages/tqdm/auto.py:21: TqdmWarning: IProgress not found. Please update jupyter and ipywidgets. See https://ipywidgets.readthedocs.io/en/stable/user_install.html\n",
+      "  from .autonotebook import tqdm as notebook_tqdm\n",
+      "/opt/conda/lib/python3.11/site-packages/huggingface_hub/file_download.py:1132: FutureWarning: `resume_download` is deprecated and will be removed in version 1.0.0. Downloads always resume when possible. If you want to force a new download, use `force_download=True`.\n",
+      "  warnings.warn(\n"
+     ]
+    }
+   ],
+   "source": [
+    "from transformers import AutoModelForCausalLM\n",
+    "from peft import PeftModel, PeftConfig\n",
+    "use_full_precision=True\n",
+    "peft_model_id=\"goliaro/llama-160m-lora\"\n",
+    "peft_config = PeftConfig.from_pretrained(peft_model_id)\n",
+    "if peft_config.peft_type != \"LORA\":\n",
+    "    raise ValueError(f\"PEFT type {peft_config.peft_type} not supported yet\")\n",
+    "\n",
+    "peft_config.init_lora_weights = (\n",
+    "    False\n",
+    ")  # prevent HF from re-inizialing the weights randomly\n",
+    "model_name = peft_config.base_model_name_or_path\n",
+    "# Load base model, and apply the PEFT layer\n",
+    "model = AutoModelForCausalLM.from_pretrained(\n",
+    "    model_name,\n",
+    "    torch_dtype=torch.float32 if use_full_precision else torch.float16,\n",
+    "    device_map=\"auto\",\n",
+    ")\n",
+    "model = PeftModel.from_pretrained(model, peft_model_id, config=peft_config)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 18,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "embed_tokens True True\n",
+      "layers.0.self_attn.q_proj True True\n",
+      "layers.0.self_attn.k_proj True True\n",
+      "layers.0.self_attn.v_proj True True\n",
+      "layers.0.self_attn.o_proj True True\n",
+      "layers.0.self_attn.rotary_emb True True\n",
+      "layers.0.mlp.gate_proj True True\n",
+      "layers.0.mlp.up_proj True True\n",
+      "layers.0.mlp.down_proj.base_layer True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_0_layers.0.mlp.down_proj.base_layer_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_0_layers.0.mlp.down_proj.base_layer_shard_0_output_0\n",
+      "layers.0.mlp.down_proj.lora_dropout.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_0_layers.0.mlp.down_proj.lora_dropout.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_0_layers.0.mlp.down_proj.lora_dropout.default_shard_0_output_0\n",
+      "layers.0.mlp.down_proj.lora_A.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_0_layers.0.mlp.down_proj.lora_A.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_0_layers.0.mlp.down_proj.lora_A.default_shard_0_output_0\n",
+      "layers.0.mlp.down_proj.lora_B.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_0_layers.0.mlp.down_proj.lora_B.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_0_layers.0.mlp.down_proj.lora_B.default_shard_0_output_0\n",
+      "layers.0.mlp.down_proj.lora_embedding_A False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_0_layers.0.mlp.down_proj.lora_embedding_A_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_0_layers.0.mlp.down_proj.lora_embedding_A_shard_0_output_0\n",
+      "layers.0.mlp.down_proj.lora_embedding_B False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_0_layers.0.mlp.down_proj.lora_embedding_B_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_0_layers.0.mlp.down_proj.lora_embedding_B_shard_0_output_0\n",
+      "layers.0.mlp.act_fn True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_0_layers.0.mlp.act_fn_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_0_layers.0.mlp.act_fn_shard_0_output_0\n",
+      "layers.0.input_layernorm True True\n",
+      "layers.0.post_attention_layernorm True True\n",
+      "layers.1.self_attn.q_proj True True\n",
+      "layers.1.self_attn.k_proj True True\n",
+      "layers.1.self_attn.v_proj True True\n",
+      "layers.1.self_attn.o_proj True True\n",
+      "layers.1.self_attn.rotary_emb True True\n",
+      "layers.1.mlp.gate_proj True True\n",
+      "layers.1.mlp.up_proj True True\n",
+      "layers.1.mlp.down_proj.base_layer True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_1_layers.1.mlp.down_proj.base_layer_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_1_layers.1.mlp.down_proj.base_layer_shard_0_output_0\n",
+      "layers.1.mlp.down_proj.lora_dropout.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_1_layers.1.mlp.down_proj.lora_dropout.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_1_layers.1.mlp.down_proj.lora_dropout.default_shard_0_output_0\n",
+      "layers.1.mlp.down_proj.lora_A.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_1_layers.1.mlp.down_proj.lora_A.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_1_layers.1.mlp.down_proj.lora_A.default_shard_0_output_0\n",
+      "layers.1.mlp.down_proj.lora_B.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_1_layers.1.mlp.down_proj.lora_B.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_1_layers.1.mlp.down_proj.lora_B.default_shard_0_output_0\n",
+      "layers.1.mlp.down_proj.lora_embedding_A False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_1_layers.1.mlp.down_proj.lora_embedding_A_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_1_layers.1.mlp.down_proj.lora_embedding_A_shard_0_output_0\n",
+      "layers.1.mlp.down_proj.lora_embedding_B False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_1_layers.1.mlp.down_proj.lora_embedding_B_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_1_layers.1.mlp.down_proj.lora_embedding_B_shard_0_output_0\n",
+      "layers.1.mlp.act_fn True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_1_layers.1.mlp.act_fn_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_1_layers.1.mlp.act_fn_shard_0_output_0\n",
+      "layers.1.input_layernorm True True\n",
+      "layers.1.post_attention_layernorm True True\n",
+      "layers.2.self_attn.q_proj True True\n",
+      "layers.2.self_attn.k_proj True True\n",
+      "layers.2.self_attn.v_proj True True\n",
+      "layers.2.self_attn.o_proj True True\n",
+      "layers.2.self_attn.rotary_emb True True\n",
+      "layers.2.mlp.gate_proj True True\n",
+      "layers.2.mlp.up_proj True True\n",
+      "layers.2.mlp.down_proj.base_layer True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_2_layers.2.mlp.down_proj.base_layer_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_2_layers.2.mlp.down_proj.base_layer_shard_0_output_0\n",
+      "layers.2.mlp.down_proj.lora_dropout.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_2_layers.2.mlp.down_proj.lora_dropout.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_2_layers.2.mlp.down_proj.lora_dropout.default_shard_0_output_0\n",
+      "layers.2.mlp.down_proj.lora_A.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_2_layers.2.mlp.down_proj.lora_A.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_2_layers.2.mlp.down_proj.lora_A.default_shard_0_output_0\n",
+      "layers.2.mlp.down_proj.lora_B.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_2_layers.2.mlp.down_proj.lora_B.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_2_layers.2.mlp.down_proj.lora_B.default_shard_0_output_0\n",
+      "layers.2.mlp.down_proj.lora_embedding_A False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_2_layers.2.mlp.down_proj.lora_embedding_A_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_2_layers.2.mlp.down_proj.lora_embedding_A_shard_0_output_0\n",
+      "layers.2.mlp.down_proj.lora_embedding_B False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_2_layers.2.mlp.down_proj.lora_embedding_B_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_2_layers.2.mlp.down_proj.lora_embedding_B_shard_0_output_0\n",
+      "layers.2.mlp.act_fn True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_2_layers.2.mlp.act_fn_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_2_layers.2.mlp.act_fn_shard_0_output_0\n",
+      "layers.2.input_layernorm True True\n",
+      "layers.2.post_attention_layernorm True True\n",
+      "layers.3.self_attn.q_proj True True\n",
+      "layers.3.self_attn.k_proj True True\n",
+      "layers.3.self_attn.v_proj True True\n",
+      "layers.3.self_attn.o_proj True True\n",
+      "layers.3.self_attn.rotary_emb True True\n",
+      "layers.3.mlp.gate_proj True True\n",
+      "layers.3.mlp.up_proj True True\n",
+      "layers.3.mlp.down_proj.base_layer True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_3_layers.3.mlp.down_proj.base_layer_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_3_layers.3.mlp.down_proj.base_layer_shard_0_output_0\n",
+      "layers.3.mlp.down_proj.lora_dropout.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_3_layers.3.mlp.down_proj.lora_dropout.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_3_layers.3.mlp.down_proj.lora_dropout.default_shard_0_output_0\n",
+      "layers.3.mlp.down_proj.lora_A.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_3_layers.3.mlp.down_proj.lora_A.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_3_layers.3.mlp.down_proj.lora_A.default_shard_0_output_0\n",
+      "layers.3.mlp.down_proj.lora_B.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_3_layers.3.mlp.down_proj.lora_B.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_3_layers.3.mlp.down_proj.lora_B.default_shard_0_output_0\n",
+      "layers.3.mlp.down_proj.lora_embedding_A False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_3_layers.3.mlp.down_proj.lora_embedding_A_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_3_layers.3.mlp.down_proj.lora_embedding_A_shard_0_output_0\n",
+      "layers.3.mlp.down_proj.lora_embedding_B False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_3_layers.3.mlp.down_proj.lora_embedding_B_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_3_layers.3.mlp.down_proj.lora_embedding_B_shard_0_output_0\n",
+      "layers.3.mlp.act_fn True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_3_layers.3.mlp.act_fn_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_3_layers.3.mlp.act_fn_shard_0_output_0\n",
+      "layers.3.input_layernorm True True\n",
+      "layers.3.post_attention_layernorm True True\n",
+      "layers.4.self_attn.q_proj True True\n",
+      "layers.4.self_attn.k_proj True True\n",
+      "layers.4.self_attn.v_proj True True\n",
+      "layers.4.self_attn.o_proj True True\n",
+      "layers.4.self_attn.rotary_emb True True\n",
+      "layers.4.mlp.gate_proj True True\n",
+      "layers.4.mlp.up_proj True True\n",
+      "layers.4.mlp.down_proj.base_layer True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_4_layers.4.mlp.down_proj.base_layer_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_4_layers.4.mlp.down_proj.base_layer_shard_0_output_0\n",
+      "layers.4.mlp.down_proj.lora_dropout.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_4_layers.4.mlp.down_proj.lora_dropout.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_4_layers.4.mlp.down_proj.lora_dropout.default_shard_0_output_0\n",
+      "layers.4.mlp.down_proj.lora_A.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_4_layers.4.mlp.down_proj.lora_A.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_4_layers.4.mlp.down_proj.lora_A.default_shard_0_output_0\n",
+      "layers.4.mlp.down_proj.lora_B.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_4_layers.4.mlp.down_proj.lora_B.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_4_layers.4.mlp.down_proj.lora_B.default_shard_0_output_0\n",
+      "layers.4.mlp.down_proj.lora_embedding_A False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_4_layers.4.mlp.down_proj.lora_embedding_A_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_4_layers.4.mlp.down_proj.lora_embedding_A_shard_0_output_0\n",
+      "layers.4.mlp.down_proj.lora_embedding_B False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_4_layers.4.mlp.down_proj.lora_embedding_B_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_4_layers.4.mlp.down_proj.lora_embedding_B_shard_0_output_0\n",
+      "layers.4.mlp.act_fn True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_4_layers.4.mlp.act_fn_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_4_layers.4.mlp.act_fn_shard_0_output_0\n",
+      "layers.4.input_layernorm True True\n",
+      "layers.4.post_attention_layernorm True True\n",
+      "layers.5.self_attn.q_proj True True\n",
+      "layers.5.self_attn.k_proj True True\n",
+      "layers.5.self_attn.v_proj True True\n",
+      "layers.5.self_attn.o_proj True True\n",
+      "layers.5.self_attn.rotary_emb True True\n",
+      "layers.5.mlp.gate_proj True True\n",
+      "layers.5.mlp.up_proj True True\n",
+      "layers.5.mlp.down_proj.base_layer True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_5_layers.5.mlp.down_proj.base_layer_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_5_layers.5.mlp.down_proj.base_layer_shard_0_output_0\n",
+      "layers.5.mlp.down_proj.lora_dropout.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_5_layers.5.mlp.down_proj.lora_dropout.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_5_layers.5.mlp.down_proj.lora_dropout.default_shard_0_output_0\n",
+      "layers.5.mlp.down_proj.lora_A.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_5_layers.5.mlp.down_proj.lora_A.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_5_layers.5.mlp.down_proj.lora_A.default_shard_0_output_0\n",
+      "layers.5.mlp.down_proj.lora_B.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_5_layers.5.mlp.down_proj.lora_B.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_5_layers.5.mlp.down_proj.lora_B.default_shard_0_output_0\n",
+      "layers.5.mlp.down_proj.lora_embedding_A False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_5_layers.5.mlp.down_proj.lora_embedding_A_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_5_layers.5.mlp.down_proj.lora_embedding_A_shard_0_output_0\n",
+      "layers.5.mlp.down_proj.lora_embedding_B False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_5_layers.5.mlp.down_proj.lora_embedding_B_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_5_layers.5.mlp.down_proj.lora_embedding_B_shard_0_output_0\n",
+      "layers.5.mlp.act_fn True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_5_layers.5.mlp.act_fn_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_5_layers.5.mlp.act_fn_shard_0_output_0\n",
+      "layers.5.input_layernorm True True\n",
+      "layers.5.post_attention_layernorm True True\n",
+      "layers.6.self_attn.q_proj True True\n",
+      "layers.6.self_attn.k_proj True True\n",
+      "layers.6.self_attn.v_proj True True\n",
+      "layers.6.self_attn.o_proj True True\n",
+      "layers.6.self_attn.rotary_emb True True\n",
+      "layers.6.mlp.gate_proj True True\n",
+      "layers.6.mlp.up_proj True True\n",
+      "layers.6.mlp.down_proj.base_layer True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_6_layers.6.mlp.down_proj.base_layer_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_6_layers.6.mlp.down_proj.base_layer_shard_0_output_0\n",
+      "layers.6.mlp.down_proj.lora_dropout.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_6_layers.6.mlp.down_proj.lora_dropout.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_6_layers.6.mlp.down_proj.lora_dropout.default_shard_0_output_0\n",
+      "layers.6.mlp.down_proj.lora_A.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_6_layers.6.mlp.down_proj.lora_A.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_6_layers.6.mlp.down_proj.lora_A.default_shard_0_output_0\n",
+      "layers.6.mlp.down_proj.lora_B.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_6_layers.6.mlp.down_proj.lora_B.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_6_layers.6.mlp.down_proj.lora_B.default_shard_0_output_0\n",
+      "layers.6.mlp.down_proj.lora_embedding_A False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_6_layers.6.mlp.down_proj.lora_embedding_A_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_6_layers.6.mlp.down_proj.lora_embedding_A_shard_0_output_0\n",
+      "layers.6.mlp.down_proj.lora_embedding_B False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_6_layers.6.mlp.down_proj.lora_embedding_B_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_6_layers.6.mlp.down_proj.lora_embedding_B_shard_0_output_0\n",
+      "layers.6.mlp.act_fn True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_6_layers.6.mlp.act_fn_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_6_layers.6.mlp.act_fn_shard_0_output_0\n",
+      "layers.6.input_layernorm True True\n",
+      "layers.6.post_attention_layernorm True True\n",
+      "layers.7.self_attn.q_proj True True\n",
+      "layers.7.self_attn.k_proj True True\n",
+      "layers.7.self_attn.v_proj True True\n",
+      "layers.7.self_attn.o_proj True True\n",
+      "layers.7.self_attn.rotary_emb True True\n",
+      "layers.7.mlp.gate_proj True True\n",
+      "layers.7.mlp.up_proj True True\n",
+      "layers.7.mlp.down_proj.base_layer True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_7_layers.7.mlp.down_proj.base_layer_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_7_layers.7.mlp.down_proj.base_layer_shard_0_output_0\n",
+      "layers.7.mlp.down_proj.lora_dropout.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_7_layers.7.mlp.down_proj.lora_dropout.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_7_layers.7.mlp.down_proj.lora_dropout.default_shard_0_output_0\n",
+      "layers.7.mlp.down_proj.lora_A.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_7_layers.7.mlp.down_proj.lora_A.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_7_layers.7.mlp.down_proj.lora_A.default_shard_0_output_0\n",
+      "layers.7.mlp.down_proj.lora_B.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_7_layers.7.mlp.down_proj.lora_B.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_7_layers.7.mlp.down_proj.lora_B.default_shard_0_output_0\n",
+      "layers.7.mlp.down_proj.lora_embedding_A False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_7_layers.7.mlp.down_proj.lora_embedding_A_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_7_layers.7.mlp.down_proj.lora_embedding_A_shard_0_output_0\n",
+      "layers.7.mlp.down_proj.lora_embedding_B False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_7_layers.7.mlp.down_proj.lora_embedding_B_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_7_layers.7.mlp.down_proj.lora_embedding_B_shard_0_output_0\n",
+      "layers.7.mlp.act_fn True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_7_layers.7.mlp.act_fn_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_7_layers.7.mlp.act_fn_shard_0_output_0\n",
+      "layers.7.input_layernorm True True\n",
+      "layers.7.post_attention_layernorm True True\n",
+      "layers.8.self_attn.q_proj True True\n",
+      "layers.8.self_attn.k_proj True True\n",
+      "layers.8.self_attn.v_proj True True\n",
+      "layers.8.self_attn.o_proj True True\n",
+      "layers.8.self_attn.rotary_emb True True\n",
+      "layers.8.mlp.gate_proj True True\n",
+      "layers.8.mlp.up_proj True True\n",
+      "layers.8.mlp.down_proj.base_layer True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_8_layers.8.mlp.down_proj.base_layer_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_8_layers.8.mlp.down_proj.base_layer_shard_0_output_0\n",
+      "layers.8.mlp.down_proj.lora_dropout.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_8_layers.8.mlp.down_proj.lora_dropout.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_8_layers.8.mlp.down_proj.lora_dropout.default_shard_0_output_0\n",
+      "layers.8.mlp.down_proj.lora_A.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_8_layers.8.mlp.down_proj.lora_A.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_8_layers.8.mlp.down_proj.lora_A.default_shard_0_output_0\n",
+      "layers.8.mlp.down_proj.lora_B.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_8_layers.8.mlp.down_proj.lora_B.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_8_layers.8.mlp.down_proj.lora_B.default_shard_0_output_0\n",
+      "layers.8.mlp.down_proj.lora_embedding_A False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_8_layers.8.mlp.down_proj.lora_embedding_A_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_8_layers.8.mlp.down_proj.lora_embedding_A_shard_0_output_0\n",
+      "layers.8.mlp.down_proj.lora_embedding_B False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_8_layers.8.mlp.down_proj.lora_embedding_B_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_8_layers.8.mlp.down_proj.lora_embedding_B_shard_0_output_0\n",
+      "layers.8.mlp.act_fn True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_8_layers.8.mlp.act_fn_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_8_layers.8.mlp.act_fn_shard_0_output_0\n",
+      "layers.8.input_layernorm True True\n",
+      "layers.8.post_attention_layernorm True True\n",
+      "layers.9.self_attn.q_proj True True\n",
+      "layers.9.self_attn.k_proj True True\n",
+      "layers.9.self_attn.v_proj True True\n",
+      "layers.9.self_attn.o_proj True True\n",
+      "layers.9.self_attn.rotary_emb True True\n",
+      "layers.9.mlp.gate_proj True True\n",
+      "layers.9.mlp.up_proj True True\n",
+      "layers.9.mlp.down_proj.base_layer True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_9_layers.9.mlp.down_proj.base_layer_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_9_layers.9.mlp.down_proj.base_layer_shard_0_output_0\n",
+      "layers.9.mlp.down_proj.lora_dropout.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_9_layers.9.mlp.down_proj.lora_dropout.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_9_layers.9.mlp.down_proj.lora_dropout.default_shard_0_output_0\n",
+      "layers.9.mlp.down_proj.lora_A.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_9_layers.9.mlp.down_proj.lora_A.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_9_layers.9.mlp.down_proj.lora_A.default_shard_0_output_0\n",
+      "layers.9.mlp.down_proj.lora_B.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_9_layers.9.mlp.down_proj.lora_B.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_9_layers.9.mlp.down_proj.lora_B.default_shard_0_output_0\n",
+      "layers.9.mlp.down_proj.lora_embedding_A False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_9_layers.9.mlp.down_proj.lora_embedding_A_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_9_layers.9.mlp.down_proj.lora_embedding_A_shard_0_output_0\n",
+      "layers.9.mlp.down_proj.lora_embedding_B False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_9_layers.9.mlp.down_proj.lora_embedding_B_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_9_layers.9.mlp.down_proj.lora_embedding_B_shard_0_output_0\n",
+      "layers.9.mlp.act_fn True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_9_layers.9.mlp.act_fn_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_9_layers.9.mlp.act_fn_shard_0_output_0\n",
+      "layers.9.input_layernorm True True\n",
+      "layers.9.post_attention_layernorm True True\n",
+      "layers.10.self_attn.q_proj True True\n",
+      "layers.10.self_attn.k_proj True True\n",
+      "layers.10.self_attn.v_proj True True\n",
+      "layers.10.self_attn.o_proj True True\n",
+      "layers.10.self_attn.rotary_emb True True\n",
+      "layers.10.mlp.gate_proj True True\n",
+      "layers.10.mlp.up_proj True True\n",
+      "layers.10.mlp.down_proj.base_layer True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_10_layers.10.mlp.down_proj.base_layer_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_10_layers.10.mlp.down_proj.base_layer_shard_0_output_0\n",
+      "layers.10.mlp.down_proj.lora_dropout.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_10_layers.10.mlp.down_proj.lora_dropout.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_10_layers.10.mlp.down_proj.lora_dropout.default_shard_0_output_0\n",
+      "layers.10.mlp.down_proj.lora_A.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_10_layers.10.mlp.down_proj.lora_A.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_10_layers.10.mlp.down_proj.lora_A.default_shard_0_output_0\n",
+      "layers.10.mlp.down_proj.lora_B.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_10_layers.10.mlp.down_proj.lora_B.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_10_layers.10.mlp.down_proj.lora_B.default_shard_0_output_0\n",
+      "layers.10.mlp.down_proj.lora_embedding_A False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_10_layers.10.mlp.down_proj.lora_embedding_A_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_10_layers.10.mlp.down_proj.lora_embedding_A_shard_0_output_0\n",
+      "layers.10.mlp.down_proj.lora_embedding_B False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_10_layers.10.mlp.down_proj.lora_embedding_B_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_10_layers.10.mlp.down_proj.lora_embedding_B_shard_0_output_0\n",
+      "layers.10.mlp.act_fn True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_10_layers.10.mlp.act_fn_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_10_layers.10.mlp.act_fn_shard_0_output_0\n",
+      "layers.10.input_layernorm True True\n",
+      "layers.10.post_attention_layernorm True True\n",
+      "layers.11.self_attn.q_proj True True\n",
+      "layers.11.self_attn.k_proj True True\n",
+      "layers.11.self_attn.v_proj True True\n",
+      "layers.11.self_attn.o_proj True True\n",
+      "layers.11.self_attn.rotary_emb True True\n",
+      "layers.11.mlp.gate_proj True True\n",
+      "layers.11.mlp.up_proj True True\n",
+      "layers.11.mlp.down_proj.base_layer True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_11_layers.11.mlp.down_proj.base_layer_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_11_layers.11.mlp.down_proj.base_layer_shard_0_output_0\n",
+      "layers.11.mlp.down_proj.lora_dropout.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_11_layers.11.mlp.down_proj.lora_dropout.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_11_layers.11.mlp.down_proj.lora_dropout.default_shard_0_output_0\n",
+      "layers.11.mlp.down_proj.lora_A.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_11_layers.11.mlp.down_proj.lora_A.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_11_layers.11.mlp.down_proj.lora_A.default_shard_0_output_0\n",
+      "layers.11.mlp.down_proj.lora_B.default True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_11_layers.11.mlp.down_proj.lora_B.default_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_11_layers.11.mlp.down_proj.lora_B.default_shard_0_output_0\n",
+      "layers.11.mlp.down_proj.lora_embedding_A False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_11_layers.11.mlp.down_proj.lora_embedding_A_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_11_layers.11.mlp.down_proj.lora_embedding_A_shard_0_output_0\n",
+      "layers.11.mlp.down_proj.lora_embedding_B False False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_11_layers.11.mlp.down_proj.lora_embedding_B_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_11_layers.11.mlp.down_proj.lora_embedding_B_shard_0_output_0\n",
+      "layers.11.mlp.act_fn True False\n",
+      "\t /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_11_layers.11.mlp.act_fn_shard_0_input_0 /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_11_layers.11.mlp.act_fn_shard_0_output_0\n",
+      "layers.11.input_layernorm True True\n",
+      "layers.11.post_attention_layernorm True True\n",
+      "norm True True\n",
+      "lm_head True True\n"
+     ]
+    }
+   ],
+   "source": [
+    "named_modules_ = [\n",
+    "    name.replace(\"base_model.model.model.\", \"\").replace(\"base_model.model.model\", \"\").replace(\"base_model.model.\", \"\").replace(\"base_model.model\", \"\").replace(\"base_model.\", \"\").replace(\"base_model\", \"\")\n",
+    "    for name, _ in model.named_modules()\n",
+    "]\n",
+    "\n",
+    "def remove_prefixes(named_modules):\n",
+    "    i = 0\n",
+    "    while i < len(named_modules) - 1:\n",
+    "        if named_modules[i + 1].startswith(named_modules[i]):\n",
+    "            named_modules.pop(i)\n",
+    "        else:\n",
+    "            i += 1\n",
+    "    return named_modules\n",
+    "named_modules = remove_prefixes(named_modules_)\n",
+    "\n",
+    "def convert_hf_module_name_to_ff_filenames(n, num_layers=12):\n",
+    "    if n == \"embed_tokens\":\n",
+    "        ff_in_name = \"fwd_step_0_layers_0_embed_tokens_shard_0_input_0\"\n",
+    "        ff_out_name = \"fwd_step_0_layers_0_embed_tokens_shard_0_output_0\"\n",
+    "    elif n == \"lm_head\" or n == \"norm\":\n",
+    "        ff_in_name = f\"fwd_step_0_layers_{num_layers-1}_{n}_shard_0_input_0\"\n",
+    "        ff_out_name = f\"fwd_step_0_layers_{num_layers-1}_{n}_shard_0_output_0\"\n",
+    "    elif n.startswith(\"layers.\"):\n",
+    "        layernum = n.split(\"layers.\")[1].split(\".\")[0]\n",
+    "        ff_in_name = f\"fwd_step_0_layers_{layernum}_{n}_shard_0_input_0\"\n",
+    "        ff_out_name = f\"fwd_step_0_layers_{layernum}_{n}_shard_0_output_0\"\n",
+    "    else:\n",
+    "        assert False, f\"Module {n} not supported yet\"\n",
+    "    return os.path.join(ff_path, ff_in_name), os.path.join(ff_path, ff_out_name)\n",
+    "\n",
+    "# Compute the hf path, check if the input and output are there\n",
+    "for n in named_modules:\n",
+    "    in_name = f\"fwd_step_0_{n}.input_0\"\n",
+    "    out_name = f\"fwd_step_0_{n}.output_0\"\n",
+    "    if n == \"lm_head\":\n",
+    "        in_name = f\"fwd_step_0_base_model.model.{n}.input_0\"\n",
+    "        out_name = f\"fwd_step_0_base_model.model.{n}.output_0\"\n",
+    "    hf_mod_in = os.path.join(hf_path, in_name)\n",
+    "    hf_mod_out = os.path.join(hf_path, out_name)\n",
+    "    check = os.path.exists(hf_mod_in) and os.path.exists(hf_mod_out)\n",
+    "    \n",
+    "    check2=True\n",
+    "    if \"self_attn\" not in n:\n",
+    "        ff_mod_in, ff_mod_out = convert_hf_module_name_to_ff_filenames(n, num_layers=num_layers)\n",
+    "        check2 = os.path.exists(ff_mod_in) and os.path.exists(ff_mod_out)\n",
+    "    print(n, check, check2)\n",
+    "    if not check2:\n",
+    "        print(\"\\t\", ff_mod_in, ff_mod_out)\n",
+    "    # print(n, check)\n",
+    "    # print(\"\\t\", )\n",
+    "    \n",
+    "\n",
+    "# Compute the corresponding ff path, check if the input and output are there\n",
+    "\n",
+    "# for x in named_modules:\n",
+    "#     print(x)\n"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 28,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "{'down_proj'}\n"
+     ]
+    }
+   ],
+   "source": [
+    "print(model.peft_config['default'].target_modules)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "### Manual check"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 29,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Ok!\n",
+      "Ok!\n"
+     ]
+    }
+   ],
+   "source": [
+    "hf_embed_input= \"/usr/FlexFlow/tests/peft/hf_peft_tensors/fwd_step_0_embed_tokens.input_0\"\n",
+    "ff_embed_input=\"/usr/FlexFlow/tests/peft/inference_tensors/fwd_step_0_layers_0_embed_tokens_shard_0_input_0\"\n",
+    "compare_tensors(hf_embed_input, ff_embed_input)\n",
+    "hf_embed_output=\"/usr/FlexFlow/tests/peft/hf_peft_tensors/fwd_step_0_embed_tokens.output_0\"\n",
+    "ff_embed_output=\"/usr/FlexFlow/tests/peft/inference_tensors/fwd_step_0_layers_0_embed_tokens_shard_0_output_0\"\n",
+    "compare_tensors(hf_embed_output, ff_embed_output)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 46,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "mismatch between /usr/FlexFlow/tests/peft/hf_peft_tensors/fwd_step_0_layers.10.input_layernorm.input_0 and /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_10_layers.10.input_layernorm_shard_0_output_0\n",
+      "HF: [ 0.          0.          0.         ...  0.06630182  6.3429456\n",
+      " -0.21220279]\n",
+      "FF:[ 0.          0.          0.         ...  0.06630275  6.34293985\n",
+      " -0.21219885]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[15889]\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "mismatch between /usr/FlexFlow/tests/peft/hf_peft_tensors/fwd_step_0_layers.11.input_layernorm.input_0 and /usr/FlexFlow/build/inference_tensors/fwd_step_0_layers_11_layers.11.input_layernorm_shard_0_output_0\n",
+      "HF: [ 0.          0.          0.         ...  0.14172177  9.79423\n",
+      " -6.2940273 ]\n",
+      "FF:[ 0.          0.          0.         ...  0.14172006  9.79421902\n",
+      " -6.29402065]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[ 2878  3206  3367  3607  5183  5346  6257  6544  7466  7679  7805  8119\n",
+      "  8159  8911  9450  9897 13696 13938 14058 14599 15126 15839 16128 16195]\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n"
+     ]
+    }
+   ],
+   "source": [
+    "tot_num_layers = 12\n",
+    "for i in range(tot_num_layers):\n",
+    "    hf_input_ln_in = f\"{hf_path}/fwd_step_0_layers.{i}.input_layernorm.input_0\"\n",
+    "    ff_input_ln_in = f\"{ff_path}/fwd_step_0_layers_{i}_layers.{i}.input_layernorm_shard_0_input_0\"\n",
+    "    if i > 0:\n",
+    "        ff_input_ln_in = f\"{ff_path}/fwd_step_0_layers_{i}_layers.{i}.input_layernorm_shard_0_output_0\"\n",
+    "    compare_tensors(hf_input_ln_in, ff_input_ln_in, tolerance=1e-5)\n",
+    "    hf_input_ln_out = f\"{hf_path}/fwd_step_0_layers.{i}.input_layernorm.output_0\"\n",
+    "    ff_input_ln_out = f\"{ff_path}/fwd_step_0_layers_{i}_layers.{i}.input_layernorm_shard_0_output_0\"\n",
+    "    if i > 0:\n",
+    "        ff_input_ln_out = f\"{ff_path}/fwd_step_0_layers_{i}_layers.{i}.input_layernorm_shard_0_output_1\"\n",
+    "    compare_tensors(hf_input_ln_out, ff_input_ln_out, tolerance=1e-5)\n",
+    "    hf_attn_out = f\"{hf_path}/fwd_step_0_layers.{i}.self_attn.o_proj.output_0\"\n",
+    "    ff_attn_out = f\"{ff_path}/fwd_step_0_layers_{i}_layers.{i}.self_attn_shard_0_output_0\"\n",
+    "    compare_tensors(hf_attn_out, ff_attn_out, tolerance=1e-5)\n",
+    "    hf_ffn_norm_out = f\"{hf_path}/fwd_step_0_layers.{i}.post_attention_layernorm.output_0\"\n",
+    "    ff_ffn_norm_out = f\"{ff_path}/fwd_step_0_layers_{i}_layers.{i}.post_attention_layernorm_shard_0_output_1\"\n",
+    "    compare_tensors(hf_ffn_norm_out, ff_ffn_norm_out, tolerance=1e-5)\n",
+    "    # w1\n",
+    "    hf_gate_proj_out = f\"{hf_path}/fwd_step_0_layers.{i}.mlp.gate_proj.output_0\"\n",
+    "    ff_gate_proj_out = f\"{ff_path}/fwd_step_0_layers_{i}_layers.{i}.mlp.gate_proj_shard_0_output_0\"\n",
+    "    compare_tensors(hf_gate_proj_out, ff_gate_proj_out, tolerance=1e-5)\n",
+    "    # w3\n",
+    "    hf_up_proj_out = f\"{hf_path}/fwd_step_0_layers.{i}.mlp.up_proj.output_0\" \n",
+    "    ff_up_proj_out = f\"{ff_path}/fwd_step_0_layers_{i}_layers.{i}.mlp.up_proj_shard_0_output_0\"\n",
+    "    compare_tensors(hf_up_proj_out, ff_up_proj_out, tolerance=1e-5)\n",
+    "    # w2\n",
+    "    hf_down_proj_in = f\"{hf_path}/fwd_step_0_layers.{i}.mlp.down_proj.input_0\"\n",
+    "    hf_down_proj_out = f\"{hf_path}/fwd_step_0_layers.{i}.mlp.down_proj.output_0\"\n",
+    "    ff_down_proj_in = f\"{ff_path}/fwd_step_0_layers_{i}_layers.{i}.mlp.down_proj_shard_0_input_0\"\n",
+    "    ff_down_proj_out = f\"{ff_path}/fwd_step_0_layers_{i}_layers.{i}.mlp.down_proj_shard_0_output_0\"\n",
+    "    compare_tensors(hf_down_proj_in, ff_down_proj_in)\n",
+    "    # compare_tensors(hf_down_proj_out, ff_down_proj_out)\n",
+    "    # LORA input\n",
+    "    hf_lora_A_in = f\"{hf_path}/fwd_step_0_layers.{i}.mlp.down_proj.lora_A.default.input_0\"\n",
+    "    ff_lora_A_in = f\"{ff_path}/fwd_step_0_layers_{i}_layers.{i}.mlp.down_proj.lora_shard_0_input_0\"\n",
+    "    compare_hf_tensors(hf_down_proj_in, hf_lora_A_in)\n",
+    "    compare_tensors(hf_lora_A_in, ff_lora_A_in)\n",
+    "    # LORA weights\n",
+    "    hf_lora_A_weight_fp = f\"{hf_path}/layers.{i}.mlp.down_proj.lora_A.default.weight\"\n",
+    "    ff_lora_A_weight_fp = f\"{ff_path}/fwd_step_0_layers_{i}_layers.{i}.mlp.down_proj.lora_shard_0_weight_A\"\n",
+    "    compare_tensors(hf_lora_A_weight_fp, ff_lora_A_weight_fp)\n",
+    "    hf_lora_B_weight_fp = f\"{hf_path}/layers.{i}.mlp.down_proj.lora_B.default.weight\"\n",
+    "    ff_lora_B_weight_fp = f\"{ff_path}/fwd_step_0_layers_{i}_layers.{i}.mlp.down_proj.lora_shard_0_weight_B\"\n",
+    "    compare_tensors(hf_lora_B_weight_fp, ff_lora_B_weight_fp)\n",
+    "    # LORA intermediate hf\n",
+    "    hf_lora_A_out = f\"{hf_path}/fwd_step_0_layers.{i}.mlp.down_proj.lora_A.default.output_0\"\n",
+    "    hf_lora_B_in = f\"{hf_path}/fwd_step_0_layers.{i}.mlp.down_proj.lora_B.default.input_0\"\n",
+    "    compare_hf_tensors(hf_lora_A_out, hf_lora_B_in)\n",
+    "    # LORA output\n",
+    "    hf_lora_out = f\"{hf_path}/fwd_step_0_layers.{i}.mlp.down_proj.lora_B.default.output_0\"\n",
+    "    ff_lora_out = f\"{ff_path}/fwd_step_0_layers_{i}_layers.{i}.mlp.down_proj.lora_shard_0_output_0\"\n",
+    "    # compare_tensors(hf_lora_out, ff_lora_out)\n",
+    "    # compare_flexflow_tensors(ff_down_proj_out, ff_lora_out)\n",
+    "    # compare_tensors(hf_down_proj_out, ff_lora_out)\n",
+    "    compare_tensors_difference(hf_lora_out, ff_lora_out, ff_down_proj_out)\n",
+    "    \n",
+    "\n",
+    "# After last layer only\n",
+    "hf_norm_out = f\"{hf_path}/fwd_step_0_norm.output_0\"\n",
+    "ff_norm_out = f\"{ff_path}/fwd_step_0_layers_{tot_num_layers-1}_norm_shard_0_output_1\"\n",
+    "compare_tensors(hf_norm_out, ff_norm_out, tolerance=1e-5)\n",
+    "hf_lm_head_out = f\"{hf_path}/fwd_step_0_base_model.model.lm_head.output_0\"\n",
+    "ff_lm_head_out = f\"{ff_path}/fwd_step_0_layers_{tot_num_layers-1}_lm_head_shard_0_output_0\"\n",
+    "compare_tensors(hf_lm_head_out, ff_lm_head_out, tolerance=1e-5)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "-- LM head --\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "-- Final Norm --\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n"
+     ]
+    }
+   ],
+   "source": [
+    "tot_num_layers = 12\n",
+    "\n",
+    "# ff_BWD_softmax_in = f\"{ff_path}/model_0_bwd-step_0_layer-num_100_layer-name_Softmax_shard-id_0_input_0\"\n",
+    "print(\"-- LM head --\")\n",
+    "hf_BWD_lm_head_out = f\"{hf_path}/bwd_step_0_base_model.model.lm_head.go_0\"\n",
+    "ff_BWD_lm_head_out = f\"{ff_path}/bwd_step_0_layers_{tot_num_layers-1}_output_shard_0_output_0\"\n",
+    "compare_tensors(hf_BWD_lm_head_out, ff_BWD_lm_head_out, tolerance=1e-5)\n",
+    "# compare weights\n",
+    "hf_lm_head_weight = f\"{hf_path}/base_model.model.lm_head.weight\"\n",
+    "ff_lm_head_weight = f\"{ff_path}/fwd_step_0_layers_{tot_num_layers-1}_output_shard_0_weight_0\"\n",
+    "compare_tensors(hf_lm_head_weight, ff_lm_head_weight, tolerance=1e-5)\n",
+    "hf_BWD_lm_head_in = f\"{hf_path}/bwd_step_0_base_model.model.lm_head.gi_0\"\n",
+    "ff_BWD_lm_head_in = f\"{ff_path}/bwd_step_0_layers_{tot_num_layers-1}_output_shard_0_input_0\"\n",
+    "compare_tensors(hf_BWD_lm_head_in, ff_BWD_lm_head_in, tolerance=1e-5)\n",
+    "# # Manually check the matmul\n",
+    "# ff_tensor_out = np.loadtxt(ff_BWD_lm_head_out, delimiter=',')\n",
+    "# ff_weight = np.loadtxt(ff_lm_head_weight, delimiter=',').reshape((4096,32000), order='F')\n",
+    "# ff_tensor_out = ff_tensor_out[:32000*24].reshape((32000,24), order='F')\n",
+    "# print(ff_tensor_out.shape)\n",
+    "# print(ff_weight.shape)\n",
+    "# print(np.matmul(ff_weight, ff_tensor_out))\n",
+    "# compare_tensors(hf_BWD_lm_head_in, ff_BWD_lm_head_in)\n",
+    "# ff_tensor = np.loadtxt(ff_tensor_filepath, delimiter=',')\n",
+    "print(\"-- Final Norm --\")\n",
+    "hf_BWD_norm_out = f\"{hf_path}/bwd_step_0_norm.go_0\"\n",
+    "ff_BWD_norm_out = f\"{ff_path}/bwd_step_0_layers_{tot_num_layers-1}_norm_shard_0_output_0\"\n",
+    "compare_hf_tensors(hf_BWD_lm_head_in, hf_BWD_norm_out)\n",
+    "compare_tensors(hf_BWD_norm_out, ff_BWD_norm_out)\n",
+    "ff_BWD_norm_weight = f\"{ff_path}/fwd_step_0_layers_{tot_num_layers-1}_norm_shard_0_weight_0\"\n",
+    "hf_FWD_norm_weight = f\"{hf_path}/norm.weight\"\n",
+    "compare_tensors(hf_FWD_norm_weight, ff_BWD_norm_weight, tolerance=1e-5)\n",
+    "hf_BWD_norm_in = f\"{hf_path}/bwd_step_0_norm.gi_0\"\n",
+    "ff_BWD_norm_in = f\"{ff_path}/bwd_step_0_layers_{tot_num_layers-1}_norm_shard_0_input_1\"\n",
+    "compare_tensors(hf_BWD_norm_in, ff_BWD_norm_in, tolerance=1e-5)\n"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from torch import nn\n",
+    "class LlamaRotaryEmbedding(nn.Module):\n",
+    "    def __init__(self, dim, max_position_embeddings=2048, base=10000, device=None):\n",
+    "        super().__init__()\n",
+    "\n",
+    "        self.dim = dim\n",
+    "        self.max_position_embeddings = max_position_embeddings\n",
+    "        self.base = base\n",
+    "        inv_freq = 1.0 / (self.base ** (torch.arange(0, self.dim, 2).float().to(device) / self.dim))\n",
+    "        self.register_buffer(\"inv_freq\", inv_freq, persistent=False)\n",
+    "\n",
+    "        # Build here to make `torch.jit.trace` work.\n",
+    "        self._set_cos_sin_cache(\n",
+    "            seq_len=max_position_embeddings, device=self.inv_freq.device, dtype=torch.get_default_dtype()\n",
+    "        )\n",
+    "\n",
+    "    def _set_cos_sin_cache(self, seq_len, device, dtype):\n",
+    "        self.max_seq_len_cached = seq_len\n",
+    "        t = torch.arange(self.max_seq_len_cached, device=device, dtype=self.inv_freq.dtype)\n",
+    "\n",
+    "        freqs = torch.einsum(\"i,j->ij\", t, self.inv_freq)\n",
+    "        # Different from paper, but it uses a different permutation in order to obtain the same calculation\n",
+    "        emb = torch.cat((freqs, freqs), dim=-1)\n",
+    "        self.register_buffer(\"cos_cached\", emb.cos().to(dtype), persistent=False)\n",
+    "        self.register_buffer(\"sin_cached\", emb.sin().to(dtype), persistent=False)\n",
+    "\n",
+    "    def forward(self, x, seq_len=None):\n",
+    "        # x: [bs, num_attention_heads, seq_len, head_size]\n",
+    "        if seq_len > self.max_seq_len_cached:\n",
+    "            self._set_cos_sin_cache(seq_len=seq_len, device=x.device, dtype=x.dtype)\n",
+    "\n",
+    "        return (\n",
+    "            self.cos_cached[:seq_len].to(dtype=x.dtype),\n",
+    "            self.sin_cached[:seq_len].to(dtype=x.dtype),\n",
+    "        )\n",
+    "def rotate_half(x):\n",
+    "    \"\"\"Rotates half the hidden dims of the input.\"\"\"\n",
+    "    x1 = x[..., : x.shape[-1] // 2] # first half\n",
+    "    x2 = x[..., x.shape[-1] // 2 :] # second half\n",
+    "    return torch.cat((x2, -x1), dim=-1)\n",
+    "def apply_rotary_pos_emb(q, k, cos, sin, position_ids, unsqueeze_dim=1):\n",
+    "    \"\"\"Applies Rotary Position Embedding to the query and key tensors.\n",
+    "\n",
+    "    Args:\n",
+    "        q (`torch.Tensor`): The query tensor.\n",
+    "        k (`torch.Tensor`): The key tensor.\n",
+    "        cos (`torch.Tensor`): The cosine part of the rotary embedding.\n",
+    "        sin (`torch.Tensor`): The sine part of the rotary embedding.\n",
+    "        position_ids (`torch.Tensor`):\n",
+    "            The position indices of the tokens corresponding to the query and key tensors. For example, this can be\n",
+    "            used to pass offsetted position ids when working with a KV-cache.\n",
+    "        unsqueeze_dim (`int`, *optional*, defaults to 1):\n",
+    "            The 'unsqueeze_dim' argument specifies the dimension along which to unsqueeze cos[position_ids] and\n",
+    "            sin[position_ids] so that they can be properly broadcasted to the dimensions of q and k. For example, note\n",
+    "            that cos[position_ids] and sin[position_ids] have the shape [batch_size, seq_len, head_dim]. Then, if q and\n",
+    "            k have the shape [batch_size, heads, seq_len, head_dim], then setting unsqueeze_dim=1 makes\n",
+    "            cos[position_ids] and sin[position_ids] broadcastable to the shapes of q and k. Similarly, if q and k have\n",
+    "            the shape [batch_size, seq_len, heads, head_dim], then set unsqueeze_dim=2.\n",
+    "    Returns:\n",
+    "        `tuple(torch.Tensor)` comprising of the query and key tensors rotated using the Rotary Position Embedding.\n",
+    "    \"\"\"\n",
+    "    cos = cos[position_ids].unsqueeze(unsqueeze_dim)\n",
+    "    sin = sin[position_ids].unsqueeze(unsqueeze_dim)\n",
+    "    q_embed = (q * cos) + (rotate_half(q) * sin)\n",
+    "    k_embed = (k * cos) + (rotate_half(k) * sin)\n",
+    "    return q_embed, k_embed\n",
+    "head_dim = 64\n",
+    "max_position_embeddings = 2048\n",
+    "rope_theta=10_000\n",
+    "kv_seq_len = 24\n",
+    "rotary_emb = LlamaRotaryEmbedding(\n",
+    "    head_dim,\n",
+    "    max_position_embeddings=max_position_embeddings,\n",
+    "    base=rope_theta,\n",
+    ")"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "\n",
+      "Huggingface checks:\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "\n",
+      "FlexFlow checks:\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "\n",
+      "Huggingface-FlexFlow checks:\n",
+      "-- W2 --\n",
+      "Ok!\n",
+      "Ok!\n",
+      "-- Lora --\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "-- W2/W1/W3 --\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.11.mlp.down_proj.gi_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_11_SigmoidSiluMulti_shard_0_output_0\n",
+      "HF: [ 6.4350547e+03 -6.4898600e+05  1.1761116e+05 ...  2.1410337e+01\n",
+      "  1.2096541e+01  3.6424692e+00]\n",
+      "FF:[ 6.43525000e+03 -6.48986062e+05  1.17611250e+05 ...  2.14103413e+01\n",
+      "  1.20965385e+01  3.64246368e+00]\n",
+      "[False  True  True ...  True  True  True]\n",
+      "[   0  162  185  308  339  745  747  820  830  909  933  968 1008 1156\n",
+      " 1160 1190 1212 1296 1304 1311 1323 1353 1395 1421 1523 1578 1689 1717\n",
+      " 1736 1748 1836 2074 2124 2192 2221 2313 2394 2515 2518 2693 2758 2825\n",
+      " 2888 2894 2937 3024]\n",
+      "Ok!\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.11.mlp.down_proj.gi_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_11_layers_11_feed_forward_w2_shard_0_input_0\n",
+      "HF: [ 6.4350547e+03 -6.4898600e+05  1.1761116e+05 ...  2.1410337e+01\n",
+      "  1.2096541e+01  3.6424692e+00]\n",
+      "FF:[ 6.43525000e+03 -6.48986062e+05  1.17611250e+05 ...  2.14103413e+01\n",
+      "  1.20965385e+01  3.64246368e+00]\n",
+      "[False  True  True ...  True  True  True]\n",
+      "[   0  162  185  308  339  745  747  820  830  909  933  968 1008 1156\n",
+      " 1160 1190 1212 1296 1304 1311 1323 1353 1395 1421 1523 1578 1689 1717\n",
+      " 1736 1748 1836 2074 2124 2192 2221 2313 2394 2515 2518 2693 2758 2825\n",
+      " 2888 2894 2937 3024]\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "-- Attention --\n",
+      "Ok!\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.11.self_attn.o_proj.gi_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_11_layers_11_attention_shard_0_o_proj_in_grad\n",
+      "HF: [ 1.2223595e+06 -2.6348565e+06 -5.0760525e+05 ...  6.8275871e+01\n",
+      " -5.8116108e+01  9.5347488e+01]\n",
+      "FF:[ 1.22235925e+06 -2.63485625e+06 -5.07605000e+05 ...  6.82758865e+01\n",
+      " -5.81161423e+01  9.53475494e+01]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[ 51  77  95 168 175 232 725]\n",
+      "Ok!\n",
+      "mismatch between hf_tensor and ff_tensor\n",
+      "HF: [[ 1.22235950e+06  9.93645859e+01 -2.82157593e+01 ... -3.94578514e+01\n",
+      "  -1.98409653e+01 -1.33438044e+01]\n",
+      " [-2.63485650e+06 -1.13461929e+02  1.14223976e+02 ...  7.52578735e+01\n",
+      "   1.33362747e+02  6.78501587e+01]\n",
+      " [-5.07605250e+05  4.34111862e+01  8.10619354e+01 ...  4.70537224e+01\n",
+      "   4.02149696e+01  6.98045502e+01]\n",
+      " ...\n",
+      " [ 3.02792250e+06  3.31295319e+02  9.98417091e+00 ...  4.90895653e+01\n",
+      "   9.71413574e+01  6.82758713e+01]\n",
+      " [-3.64456375e+06 -2.43692596e+02 -6.85474396e+00 ... -3.71503868e+01\n",
+      "  -1.34136658e+01 -5.81161079e+01]\n",
+      " [ 3.31921500e+06  2.24193970e+02 -6.64005566e+00 ...  2.11662292e+00\n",
+      "   3.37400856e+01  9.53474884e+01]]\n",
+      "FF:[[ 1.22235925e+06  9.93645630e+01 -2.82157211e+01 ... -3.94577713e+01\n",
+      "  -1.98408775e+01 -1.33438234e+01]\n",
+      " [-2.63485625e+06 -1.13461960e+02  1.14224037e+02 ...  7.52577744e+01\n",
+      "   1.33362701e+02  6.78501205e+01]\n",
+      " [-5.07605000e+05  4.34111404e+01  8.10619278e+01 ...  4.70536804e+01\n",
+      "   4.02149124e+01  6.98045578e+01]\n",
+      " ...\n",
+      " [ 3.02792250e+06  3.31295227e+02  9.98412323e+00 ...  4.90895386e+01\n",
+      "   9.71413727e+01  6.82758865e+01]\n",
+      " [-3.64456400e+06 -2.43692627e+02 -6.85472488e+00 ... -3.71504822e+01\n",
+      "  -1.34137001e+01 -5.81161423e+01]\n",
+      " [ 3.31921500e+06  2.24193970e+02 -6.64004517e+00 ...  2.11670875e+00\n",
+      "   3.37400322e+01  9.53475494e+01]]\n",
+      "[[ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " ...\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]]\n",
+      "[ 51  77  95 168 175 232 725]\n",
+      "Ok!\n",
+      "mismatch between hf_tensor and ff_tensor\n",
+      "HF: [[ 1.2223588e+06 -2.6348530e+06 -5.0760291e+05 ...  3.0279325e+06\n",
+      "  -3.6445672e+06  3.3192180e+06]\n",
+      " [-4.2496326e+02  1.1576636e+03  9.8397858e+02 ...  1.6480791e+03\n",
+      "  -5.9697235e+02  6.2627173e+02]\n",
+      " [-2.2012039e+01  6.6097900e+01  3.9933994e+01 ...  5.7103355e+01\n",
+      "  -1.5968766e+01  3.6536639e+00]\n",
+      " ...\n",
+      " [-1.2302110e+00  5.3052688e+00  2.1982718e+00 ...  1.3990868e+00\n",
+      "  -5.5132383e-01  4.8985812e-01]\n",
+      " [-1.0771493e+00  6.9571300e+00  2.7373023e+00 ...  4.9663010e+00\n",
+      "  -9.9705428e-01  2.1829298e+00]\n",
+      " [-5.9534687e-01  3.0272012e+00  3.1143982e+00 ...  2.4072502e+00\n",
+      "  -2.0490403e+00  3.3617332e+00]]\n",
+      "FF:[[ 1.22235850e+06 -2.63485275e+06 -5.07602656e+05 ...  3.02793250e+06\n",
+      "  -3.64456750e+06  3.31921800e+06]\n",
+      " [-4.24962585e+02  1.15766296e+03  9.83978577e+02 ...  1.64807898e+03\n",
+      "  -5.96972351e+02  6.26271790e+02]\n",
+      " [-2.20120354e+01  6.60979462e+01  3.99340210e+01 ...  5.71033745e+01\n",
+      "  -1.59687757e+01  3.65366316e+00]\n",
+      " ...\n",
+      " [-1.23020661e+00  5.30526114e+00  2.19826817e+00 ...  1.39908671e+00\n",
+      "  -5.51325083e-01  4.89858717e-01]\n",
+      " [-1.07714510e+00  6.95712519e+00  2.73729825e+00 ...  4.96630049e+00\n",
+      "  -9.97055829e-01  2.18292713e+00]\n",
+      " [-5.95347941e-01  3.02720070e+00  3.11439991e+00 ...  2.40725493e+00\n",
+      "  -2.04904509e+00  3.36174107e+00]]\n",
+      "[[ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " ...\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]]\n",
+      "[0 0 0 0 0 0 0]\n",
+      "Ok!\n",
+      "7.4363425925925934% mismatch in QK prods softmax out grad\n",
+      "Ok!\n",
+      "hf_attn_in:  (768, 24)\n",
+      "[[-7.52523500e+06 -1.27625415e+03 -4.39338150e+01 ... -3.34414902e+01\n",
+      "   2.38160934e+01  3.15938339e+01]\n",
+      " [-9.55138900e+06  6.71377197e+02  2.06871887e+02 ... -3.86393509e+01\n",
+      "   2.14816055e+01 -6.58599396e+01]\n",
+      " [ 1.14522670e+07  2.19898975e+03 -6.89673233e+00 ...  9.51593590e+00\n",
+      "  -1.68612709e+01  6.02474251e+01]\n",
+      " ...\n",
+      " [ 2.10891925e+06  3.78648706e+03  1.02701221e+03 ...  3.59794388e+01\n",
+      "   5.03902206e+01  4.19777756e+01]\n",
+      " [ 2.11695300e+06 -2.36283508e+02 -1.08002625e+02 ...  9.36443710e+00\n",
+      "   3.84094887e+01 -7.51948738e+00]\n",
+      " [ 7.39155050e+06  1.11731885e+03  3.38369843e+02 ...  3.70399475e+01\n",
+      "   1.77629051e+01  9.76780853e+01]]\n",
+      "ff_attn_in:  (768, 24)\n",
+      "[[-7.52523600e+06 -1.27625293e+03 -4.39336700e+01 ... -3.34414597e+01\n",
+      "   2.38162422e+01  3.15938187e+01]\n",
+      " [-9.55138900e+06  6.71377319e+02  2.06871674e+02 ... -3.86393127e+01\n",
+      "   2.14817867e+01 -6.58600464e+01]\n",
+      " [ 1.14522660e+07  2.19898950e+03 -6.89660644e+00 ...  9.51594448e+00\n",
+      "  -1.68611774e+01  6.02474518e+01]\n",
+      " ...\n",
+      " [ 2.10891850e+06  3.78648633e+03  1.02701196e+03 ...  3.59794846e+01\n",
+      "   5.03901253e+01  4.19777679e+01]\n",
+      " [ 2.11695400e+06 -2.36282440e+02 -1.08002762e+02 ...  9.36448860e+00\n",
+      "   3.84096107e+01 -7.51954842e+00]\n",
+      " [ 7.39155000e+06  1.11731921e+03  3.38370087e+02 ...  3.70398293e+01\n",
+      "   1.77627277e+01  9.76782227e+01]]\n",
+      "6.011284722222222% mismatch in attention input grads\n",
+      "\n",
+      "Huggingface checks:\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "\n",
+      "FlexFlow checks:\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "\n",
+      "Huggingface-FlexFlow checks:\n",
+      "-- W2 --\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.10.mlp.down_proj.go_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_10_layers_10_feed_forward_w2_shard_0_output_0\n",
+      "HF: [-9.4779546e+09 -1.2174155e+10  1.4899113e+10 ...  4.9057606e+01\n",
+      "  4.7770348e+01  5.8564331e+01]\n",
+      "FF:[-9.47795558e+09 -1.21741548e+10  1.48991119e+10 ...  4.90575981e+01\n",
+      "  4.77703362e+01  5.85643845e+01]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[   88   138   187   203   232   242   493   657   750   900  1198  1249\n",
+      "  1287  1305  1414  1428  1490  1588  1600  1612  1625  1657  1676  1677\n",
+      "  1692  1694  1724  1730  1772  1822  1825  1838  1853  1910  2035  2043\n",
+      "  2053  2059  2073  2078  2123  2145  2214  2238  2241  2285  2292  2389\n",
+      "  2542  2582  2589  2599  2674  2688  2711  2840  2856  2961  2963  2980\n",
+      "  3064  3176  3192  3255  3262  3278  3338  3341  3412  3419  3492  3590\n",
+      "  3624  3646  3657  3807  3840  3842  3846  3883  3887  4005  4049  4071\n",
+      "  4076  4077  4079  4137  4142  4192  4193  4202  4218  4224  4273  4355\n",
+      "  4358  4381  4401  4435  4469  4499  4514  4546  4598  4619  4747  4846\n",
+      "  4872  4916  4952  4966  5016  5067  5107  5112  5116  5194  5225  5350\n",
+      "  5364  5403  5515  5537  5550  5578  5650  5653  5654  5736  5751  5837\n",
+      "  5870  5881  5972  5998  6006  6051  6061  6107  6129  6204  6236  6292\n",
+      "  6296  6327  6382  6393  6403  6420  6424  6436  6468  6542  6599  6675\n",
+      "  6681  6711  6723  6767  6823  6914  6983  7047  7064  7133  7167  7197\n",
+      "  7198  7209  7528  7537  7538  7686  7850  7855  7889  7910  7919  7927\n",
+      "  7937  7939  8089  8101  8157  8169  8175  8223  8292  8304  8306  8342\n",
+      "  8351  8414  8475  8500  8543  8558  8609  8656  8687  8704  8724  8726\n",
+      "  8777  8816  8826  8871  8904  8934  8983  9012  9033  9043  9068  9093\n",
+      "  9125  9133  9144  9151  9154  9217  9222  9320  9335  9367  9398  9421\n",
+      "  9434  9521  9547  9633  9702  9726  9763  9949 10018 10053 10062 10079\n",
+      " 10137 10149 10203 10261 10269 10292 10312 10332 10471 10478 10514 10596\n",
+      " 10645 10676 10678 10781 10795 10810 10833 10891 10904 10935 10957 10977\n",
+      " 10982 11028 11095 11172 11223 11251 11283 11303 11319 11374 11392 11437\n",
+      " 11486 11627 11678 11750 11759 11979 11996 12019 12126 12237 12262 12288\n",
+      " 12303 12309 12315 12387 12543 12569 12613 12648 12786 12852 12866 12879\n",
+      " 12947 12963 13037 13058 13261 13284 13312 13394 13399 13427 13526 13527\n",
+      " 13592 13695 13741 13752 13775 13803 13812 13866 13902 14049 14170 14241\n",
+      " 14354 14382 14426 14451 14455 14486 14502 14582 14820 14934 14961 14976\n",
+      " 15000 15003 15014 15077 15096 15108 15135 15148 15165 15219 15232 15290\n",
+      " 15339 15345 15819 15945 15994 16077 16135 16218 16231 16233 16239 16243\n",
+      " 16295 16311 16339 16356 16366 16417 16456 16498 16502 16503 16506 16547\n",
+      " 16585 16603 16611 16633 16661 16683 16704 16710 16723 16724 16745 16754\n",
+      " 16773 16787 16789 16818 16829 16833 16913 16933 17025 17033 17037 17055\n",
+      " 17084 17098 17109 17176 17225 17240 17292 17294 17339 17390 17427 17437\n",
+      " 17579 17626 17630 17654 17719 17902 17912 18023 18025 18124 18203 18339\n",
+      " 18344]\n",
+      "Ok!\n",
+      "Ok!\n",
+      "-- Lora --\n",
+      "Ok!\n",
+      "Ok!\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.10.mlp.down_proj.lora_B.default.go_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_10_layers_10_feed_forward_w2_lora_shard_0_output_0\n",
+      "HF: [-9.4779546e+09 -1.2174155e+10  1.4899113e+10 ...  4.9057606e+01\n",
+      "  4.7770348e+01  5.8564331e+01]\n",
+      "FF:[-9.47795558e+09 -1.21741548e+10  1.48991119e+10 ...  4.90575981e+01\n",
+      "  4.77703362e+01  5.85643845e+01]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[ 88 138 187 203 232 242 493 657 750]\n",
+      "Ok!\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.10.mlp.down_proj.lora_A.default.gi_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_10_layers_10_feed_forward_w2_lora_shard_0_input_0\n",
+      "HF: [ 4.7819588e+07  3.8833264e+07  4.7789860e+07 ...  1.0804405e+00\n",
+      "  2.7186510e-01 -2.9918199e+00]\n",
+      "FF:[ 4.78195960e+07  3.88332640e+07  4.77898600e+07 ...  1.08044124e+00\n",
+      "  2.71864563e-01 -2.99182224e+00]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[ 109  211  312  422  590  832  835 1016 1053 1076 1268 1353 1374 1693\n",
+      " 1701 1710 1722 1832 1954 1965 1997 2076 2124 2146 2378 2520 2605 2624\n",
+      " 2967 3007 3015]\n",
+      "Ok!\n",
+      "-- W2/W1/W3 --\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.10.mlp.down_proj.gi_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_10_SigmoidSiluMulti_shard_0_output_0\n",
+      "HF: [ 3.3558659e+09  1.3409817e+10 -1.4671958e+10 ...  7.2100967e+01\n",
+      "  6.5979071e+00 -2.1230124e+01]\n",
+      "FF:[ 3.35586406e+09  1.34098166e+10 -1.46719611e+10 ...  7.21009750e+01\n",
+      "  6.59790993e+00 -2.12301121e+01]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[   4   95  111  163  179  191  279  305  363  406  447  487  489  494\n",
+      "  517  617  703  713  735  796  805  819  826  858  882  959  964  967\n",
+      "  986 1020 1035 1054 1067 1070 1077 1081 1095 1097 1123 1139 1181 1238\n",
+      " 1296 1342 1369 1489 1550 1557 1623 1669 1752 1757 1783 1819 1876 1949\n",
+      " 1963 1993 2034 2047 2091 2115 2153 2170 2306 2381 2419 2431 2456 2501\n",
+      " 2503 2591 2653 2768 2778 2791 2970 2980 3053 3067]\n",
+      "Ok!\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.10.mlp.down_proj.gi_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_10_layers_10_feed_forward_w2_shard_0_input_0\n",
+      "HF: [ 3.3558659e+09  1.3409817e+10 -1.4671958e+10 ...  7.2100967e+01\n",
+      "  6.5979071e+00 -2.1230124e+01]\n",
+      "FF:[ 3.35586406e+09  1.34098166e+10 -1.46719611e+10 ...  7.21009750e+01\n",
+      "  6.59790993e+00 -2.12301121e+01]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[   4   95  111  163  179  191  279  305  363  406  447  487  489  494\n",
+      "  517  617  703  713  735  796  805  819  826  858  882  959  964  967\n",
+      "  986 1020 1035 1054 1067 1070 1077 1081 1095 1097 1123 1139 1181 1238\n",
+      " 1296 1342 1369 1489 1550 1557 1623 1669 1752 1757 1783 1819 1876 1949\n",
+      " 1963 1993 2034 2047 2091 2115 2153 2170 2306 2381 2419 2431 2456 2501\n",
+      " 2503 2591 2653 2768 2778 2791 2970 2980 3053 3067]\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "-- Attention --\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.10.self_attn.o_proj.go_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_10_layers_10_attention_shard_0_output_0\n",
+      "HF: [-9.4779546e+09 -1.2174155e+10  1.4899113e+10 ...  9.3464905e+01\n",
+      "  7.5613129e+01  7.6598846e+01]\n",
+      "FF:[-9.47795558e+09 -1.21741548e+10  1.48991119e+10 ...  9.34649200e+01\n",
+      "  7.56131058e+01  7.65989227e+01]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[ 88 138 187 203 232 242 493 657 750]\n",
+      "Ok!\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.10.self_attn.o_proj.gi_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_10_layers_10_attention_shard_0_o_proj_in_grad\n",
+      "HF: [-9.4470595e+09 -7.3870331e+09  1.2659395e+10 ... -2.8149616e+01\n",
+      "  1.7019112e+02 -7.7236428e+00]\n",
+      "FF:[-9.44706150e+09 -7.38703309e+09  1.26593966e+10 ... -2.81496239e+01\n",
+      "  1.70191177e+02 -7.72364044e+00]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[ 11  98 109 134 262 266 274 309 310 327 328 364 398 409 429 605 645]\n",
+      "Ok!\n",
+      "mismatch between hf_tensor and ff_tensor\n",
+      "HF: [[-9.44705946e+09  2.28078384e+01  3.18554016e+02 ...  1.17267204e+02\n",
+      "   2.06791725e+01  1.13138672e+02]\n",
+      " [-7.38703309e+09 -7.36898804e+00  7.93705673e+01 ...  2.04039650e+01\n",
+      "   3.18331490e+01  5.44241562e+01]\n",
+      " [ 1.26593946e+10  1.77534424e+02 -2.97175941e+01 ...  1.16716766e+01\n",
+      "   7.70214081e+01  2.81902496e+02]\n",
+      " ...\n",
+      " [ 4.51210445e+10  3.63867615e+02 -8.04915466e+01 ... -1.34332123e+02\n",
+      "  -1.22151840e+02 -2.81496162e+01]\n",
+      " [-1.39591885e+10  1.59216873e+02  6.11343079e+01 ...  1.56675262e+02\n",
+      "   9.68551483e+01  1.70191116e+02]\n",
+      " [-1.29442345e+10 -2.39441833e+02  2.73647644e+02 ... -4.41197014e+01\n",
+      "  -9.48526230e+01 -7.72364283e+00]]\n",
+      "FF:[[-9.44706150e+09  2.28079376e+01  3.18553864e+02 ...  1.17267227e+02\n",
+      "   2.06791859e+01  1.13138741e+02]\n",
+      " [-7.38703309e+09 -7.36921692e+00  7.93703690e+01 ...  2.04038925e+01\n",
+      "   3.18332825e+01  5.44241333e+01]\n",
+      " [ 1.26593966e+10  1.77534454e+02 -2.97174206e+01 ...  1.16717224e+01\n",
+      "   7.70213699e+01  2.81902618e+02]\n",
+      " ...\n",
+      " [ 4.51210527e+10  3.63867554e+02 -8.04915695e+01 ... -1.34332092e+02\n",
+      "  -1.22151901e+02 -2.81496239e+01]\n",
+      " [-1.39591834e+10  1.59216995e+02  6.11343040e+01 ...  1.56675293e+02\n",
+      "   9.68551559e+01  1.70191177e+02]\n",
+      " [-1.29442304e+10 -2.39441772e+02  2.73647644e+02 ... -4.41196594e+01\n",
+      "  -9.48526916e+01 -7.72364044e+00]]\n",
+      "[[ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " ...\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]]\n",
+      "[ 11  98 109 134 262 266 274 309 310 327 328 364 398 409 429 605 645]\n",
+      "Ok!\n",
+      "mismatch between hf_tensor and ff_tensor\n",
+      "HF: [[-9.44705946e+09 -7.38703309e+09  1.26593946e+10 ...  4.51210445e+10\n",
+      "  -1.39591885e+10 -1.29442345e+10]\n",
+      " [ 1.14852783e+03  4.39543152e+02  1.07877356e+03 ... -2.42416113e+03\n",
+      "   2.64504834e+03  4.68633453e+02]\n",
+      " [ 5.72417107e+01  4.12602806e+01 -2.27319489e+01 ... -3.40788422e+01\n",
+      "   4.86237946e+01  1.25752163e+01]\n",
+      " ...\n",
+      " [ 6.76848269e+00  8.23165894e+00  2.10253639e+01 ... -3.19590777e-01\n",
+      "   3.68098617e-01 -1.95310101e-01]\n",
+      " [ 4.08574820e+00  5.33035660e+00  1.41003275e+01 ... -1.35607815e+00\n",
+      "   4.06074905e+00 -7.67630756e-01]\n",
+      " [ 2.03186665e+01  9.77407932e+00  5.06271019e+01 ... -6.80029154e-01\n",
+      "   4.11142111e+00 -1.86585218e-01]]\n",
+      "FF:[[-9.44706150e+09 -7.38703309e+09  1.26593966e+10 ...  4.51210527e+10\n",
+      "  -1.39591834e+10 -1.29442304e+10]\n",
+      " [ 1.14852808e+03  4.39542755e+02  1.07877344e+03 ... -2.42416138e+03\n",
+      "   2.64504932e+03  4.68633698e+02]\n",
+      " [ 5.72415771e+01  4.12602005e+01 -2.27318707e+01 ... -3.40787392e+01\n",
+      "   4.86236725e+01  1.25752039e+01]\n",
+      " ...\n",
+      " [ 6.76847696e+00  8.23167515e+00  2.10253181e+01 ... -3.19590837e-01\n",
+      "   3.68098557e-01 -1.95310280e-01]\n",
+      " [ 4.08574867e+00  5.33037567e+00  1.41003180e+01 ... -1.35607564e+00\n",
+      "   4.06074095e+00 -7.67629445e-01]\n",
+      " [ 2.03186874e+01  9.77407932e+00  5.06271439e+01 ... -6.80029511e-01\n",
+      "   4.11142349e+00 -1.86585203e-01]]\n",
+      "[[ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " ...\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]]\n",
+      "[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]\n",
+      "Ok!\n",
+      "6.640625% mismatch in QK prods softmax out grad\n",
+      "Ok!\n",
+      "hf_attn_in:  (768, 24)\n",
+      "[[-5.1505955e+10 -4.7166772e+03 -1.3288132e+02 ... -3.0123844e+00\n",
+      "  -5.5234032e+01  6.0299168e+00]\n",
+      " [-3.5960029e+10 -5.3263096e+03 -1.9434322e+02 ... -5.6601189e+01\n",
+      "  -1.0787462e+02 -6.0718418e+01]\n",
+      " [ 4.8131662e+10  1.1578307e+04  1.7744476e+02 ... -5.6970375e+01\n",
+      "  -1.7497168e+01 -7.2297249e+00]\n",
+      " ...\n",
+      " [-9.0346426e+08  6.4752144e+03  3.2408417e+02 ...  6.1075470e+01\n",
+      "   8.5356834e+01  8.3221588e+01]\n",
+      " [-5.0754217e+09 -2.2929268e+03 -1.4913528e+02 ...  8.6639397e+01\n",
+      "   1.1156468e+02  1.0695674e+02]\n",
+      " [ 5.5844772e+09  3.0225920e+03 -6.3137859e+01 ... -6.5270996e+01\n",
+      "   8.2730171e+01 -1.0107367e+02]]\n",
+      "ff_attn_in:  (768, 24)\n",
+      "[[-5.15059548e+10 -4.71667773e+03 -1.32881012e+02 ... -3.01225996e+00\n",
+      "  -5.52339973e+01  6.02991867e+00]\n",
+      " [-3.59600292e+10 -5.32630957e+03 -1.94343079e+02 ... -5.66010437e+01\n",
+      "  -1.07874649e+02 -6.07182846e+01]\n",
+      " [ 4.81316659e+10  1.15783076e+04  1.77444519e+02 ... -5.69703102e+01\n",
+      "  -1.74972763e+01 -7.22990799e+00]\n",
+      " ...\n",
+      " [-9.03455232e+08  6.47521484e+03  3.24083832e+02 ...  6.10753632e+01\n",
+      "   8.53567886e+01  8.32217255e+01]\n",
+      " [-5.07543654e+09 -2.29292749e+03 -1.49135025e+02 ...  8.66392517e+01\n",
+      "   1.11564789e+02  1.06956917e+02]\n",
+      " [ 5.58446592e+09  3.02259229e+03 -6.31376152e+01 ... -6.52709351e+01\n",
+      "   8.27302551e+01 -1.01073837e+02]]\n",
+      "7.025824652777778% mismatch in attention input grads\n",
+      "\n",
+      "Huggingface checks:\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "\n",
+      "FlexFlow checks:\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "\n",
+      "Huggingface-FlexFlow checks:\n",
+      "-- W2 --\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.9.mlp.down_proj.go_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_9_layers_9_feed_forward_w2_shard_0_output_0\n",
+      "HF: [-6.33203254e+13 -4.43651289e+13  6.35509366e+13 ...  1.08435585e+02\n",
+      "  9.42303467e+01  5.89958420e+01]\n",
+      "FF:[-6.33203296e+13 -4.43651289e+13  6.35509408e+13 ...  1.08435623e+02\n",
+      "  9.42303467e+01  5.89958954e+01]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[   26    51    66    85   259   262   272   296   298   329   392   415\n",
+      "   428   482   492   514   526   531   671   731   763   777   893   927\n",
+      "   984  1105  1184  1206  1418  1541  1548  1572  1577  1613  1619  1643\n",
+      "  1658  1661  1691  1701  1706  1726  1757  1784  1815  1833  1849  1856\n",
+      "  1880  1891  1921  1956  1969  2012  2021  2028  2030  2059  2065  2144\n",
+      "  2149  2183  2210  2238  2292  2342  2357  2384  2414  2495  2531  2565\n",
+      "  2597  2662  2713  2781  2821  2829  2877  2904  2921  2927  2962  2973\n",
+      "  3044  3066  3094  3100  3106  3159  3193  3251  3377  3389  3397  3427\n",
+      "  3436  3570  3594  3703  3729  3770  3772  3780  3811  3840  3842  3860\n",
+      "  3907  3920  3929  3946  3955  3969  4005  4009  4034  4048  4077  4089\n",
+      "  4104  4129  4134  4178  4202  4212  4219  4239  4245  4256  4273  4373\n",
+      "  4407  4463  4464  4465  4481  4511  4537  4541  4543  4549  4597  4599\n",
+      "  4633  4759  4760  4789  4846  4884  4901  4930  4954  4971  4993  5024\n",
+      "  5030  5041  5050  5116  5130  5163  5207  5224  5282  5313  5322  5349\n",
+      "  5363  5403  5410  5412  5454  5543  5581  5590  5654  5673  5784  5821\n",
+      "  5849  5880  5911  5917  5982  6000  6062  6165  6178  6193  6200  6272\n",
+      "  6322  6351  6366  6376  6380  6382  6393  6412  6420  6430  6433  6446\n",
+      "  6476  6482  6488  6490  6519  6527  6540  6556  6563  6567  6577  6600\n",
+      "  6619  6680  6709  6735  6768  6777  6780  6823  6825  6826  6830  6863\n",
+      "  6880  6912  6988  7006  7030  7071  7077  7102  7123  7244  7264  7367\n",
+      "  7389  7390  7434  7451  7452  7455  7505  7532  7539  7589  7598  7620\n",
+      "  7651  7653  7659  7709  7714  7740  7751  7759  7803  7808  7820  7917\n",
+      "  7923  7926  7949  7962  7966  7978  8002  8004  8040  8050  8052  8068\n",
+      "  8180  8223  8250  8253  8265  8341  8344  8375  8376  8386  8449  8468\n",
+      "  8501  8509  8522  8535  8585  8590  8593  8642  8657  8674  8687  8707\n",
+      "  8714  8726  8729  8737  8756  8769  8801  8846  8850  8865  8907  8998\n",
+      "  9018  9043  9059  9066  9083  9093  9098  9130  9131  9165  9189  9216\n",
+      "  9285  9337  9368  9526  9539  9563  9620  9659  9723  9793  9804  9817\n",
+      "  9820  9827  9908  9995 10053 10128 10135 10143 10205 10253 10274 10292\n",
+      " 10300 10311 10327 10356 10406 10441 10491 10494 10551 10562 10563 10634\n",
+      " 10649 10674 10710 10734 10821 10831 10833 10838 10845 10911 10966 10981\n",
+      " 10988 10990 10998 11008 11044 11049 11100 11127 11141 11197 11250 11269\n",
+      " 11285 11308 11361 11383 11437 11460 11494 11502 11511 11522 11546 11557\n",
+      " 11564 11588 11649 11658 11671 11674 11703 11729 11749 11759 11832 11892\n",
+      " 11979 11988 12000 12038 12063 12078 12107 12119 12165 12259 12269 12270\n",
+      " 12347 12369 12386 12415 12475 12518 12566 12569 12574 12652 12693 12792\n",
+      " 12833 12834 12852 12872 12900 12946 13117 13121 13124 13321 13345 13357\n",
+      " 13427 13431 13446 13473 13526 13635 13638 13662 13706 13733 13803 13807\n",
+      " 13852 13882 13912 13924 13962 13969 13986 14023 14036 14046 14085 14110\n",
+      " 14130 14141 14175 14183 14191 14220 14222 14223 14285 14310 14331 14336\n",
+      " 14354 14375 14425 14427 14451 14482 14493 14516 14560 14563 14581 14623\n",
+      " 14671 14677 14679 14680 14685 14688 14742 14799 14860 14868 14870 14872\n",
+      " 14900 14909 14916 14940 14964 14991 15003 15023 15027 15033 15038 15051\n",
+      " 15086 15100 15184 15214 15232 15290 15352 15363 15365 15407 15433 15451\n",
+      " 15522 15577 15707 15720 15725 15739 15830 15837 15875 15937 15965 15985\n",
+      " 16017 16054 16113 16136 16142 16169 16191 16232 16238 16250 16268 16282\n",
+      " 16285 16290 16295 16304 16327 16334 16353 16356 16363 16382 16403 16407\n",
+      " 16408 16409 16458 16459 16495 16497 16499 16500 16516 16532 16595 16603\n",
+      " 16611 16657 16678 16680 16695 16701 16704 16754 16768 16807 16818 16856\n",
+      " 16870 16951 16971 16986 16989 16992 17048 17134 17181 17208 17217 17236\n",
+      " 17243 17319 17363 17398 17448 17471 17497 17557 17646 17654 17659 17692\n",
+      " 17754 17947 17957 17969 17975 18029 18128 18146 18196 18206 18207 18250\n",
+      " 18265 18313 18406]\n",
+      "Ok!\n",
+      "Ok!\n",
+      "-- Lora --\n",
+      "Ok!\n",
+      "Ok!\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.9.mlp.down_proj.lora_B.default.go_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_9_layers_9_feed_forward_w2_lora_shard_0_output_0\n",
+      "HF: [-6.33203254e+13 -4.43651289e+13  6.35509366e+13 ...  1.08435585e+02\n",
+      "  9.42303467e+01  5.89958420e+01]\n",
+      "FF:[-6.33203296e+13 -4.43651289e+13  6.35509408e+13 ...  1.08435623e+02\n",
+      "  9.42303467e+01  5.89958954e+01]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[ 26  51  66  85 259 262 272 296 298 329 392 415 428 482 492 514 526 531\n",
+      " 671 731 763]\n",
+      "Ok!\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.9.mlp.down_proj.lora_A.default.gi_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_9_layers_9_feed_forward_w2_lora_shard_0_input_0\n",
+      "HF: [ 5.0590863e+10  3.7823513e+11 -5.0394451e+11 ... -5.5814421e-01\n",
+      "  2.2970559e-01 -1.2293311e+00]\n",
+      "FF:[ 5.05906831e+10  3.78235290e+11 -5.03944544e+11 ... -5.58144033e-01\n",
+      "  2.29705781e-01 -1.22933090e+00]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[ 189  254  317  418  515  546  577  634  636  675  712  808 1011 1030\n",
+      " 1080 1091 1132 1168 1254 1265 1285 1287 1354 1381 1427 1459 1506 1620\n",
+      " 1654 1752 1887 1897 1900 1937 1981 1985 1986 2003 2029 2152 2181 2295\n",
+      " 2395 2426 2445 2673 2687 2859 2947 2977 3037]\n",
+      "Ok!\n",
+      "-- W2/W1/W3 --\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.9.mlp.down_proj.gi_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_9_SigmoidSiluMulti_shard_0_output_0\n",
+      "HF: [ 2.5211001e+13 -5.6630301e+13 -2.3639437e+13 ... -4.6000423e+01\n",
+      "  1.2655228e+01  7.1020460e+00]\n",
+      "FF:[ 2.52109673e+13 -5.66302930e+13 -2.36394182e+13 ... -4.60003510e+01\n",
+      "  1.26551876e+01  7.10206795e+00]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[   9   49  113  174  243  267  271  288  323  335  397  399  438  439\n",
+      "  457  475  506  568  569  652  680  689  715  735  739  758  766  777\n",
+      "  785  837  842  852  865  884  893  919  930  932  936  939  957 1018\n",
+      " 1095 1105 1112 1114 1129 1168 1217 1220 1229 1230 1233 1237 1283 1304\n",
+      " 1354 1453 1532 1542 1547 1550 1592 1597 1603 1615 1647 1679 1698 1699\n",
+      " 1712 1770 1819 1835 1875 1977 2007 2016 2039 2066 2078 2102 2153 2245\n",
+      " 2403 2447 2621 2698 2704 2728 2736 2743 2774 2792 2836 2858 2870 2881\n",
+      " 2932 2948 3018 3034 3066]\n",
+      "Ok!\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.9.mlp.down_proj.gi_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_9_layers_9_feed_forward_w2_shard_0_input_0\n",
+      "HF: [ 2.5211001e+13 -5.6630301e+13 -2.3639437e+13 ... -4.6000423e+01\n",
+      "  1.2655228e+01  7.1020460e+00]\n",
+      "FF:[ 2.52109673e+13 -5.66302930e+13 -2.36394182e+13 ... -4.60003510e+01\n",
+      "  1.26551876e+01  7.10206795e+00]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[   9   49  113  174  243  267  271  288  323  335  397  399  438  439\n",
+      "  457  475  506  568  569  652  680  689  715  735  739  758  766  777\n",
+      "  785  837  842  852  865  884  893  919  930  932  936  939  957 1018\n",
+      " 1095 1105 1112 1114 1129 1168 1217 1220 1229 1230 1233 1237 1283 1304\n",
+      " 1354 1453 1532 1542 1547 1550 1592 1597 1603 1615 1647 1679 1698 1699\n",
+      " 1712 1770 1819 1835 1875 1977 2007 2016 2039 2066 2078 2102 2153 2245\n",
+      " 2403 2447 2621 2698 2704 2728 2736 2743 2774 2792 2836 2858 2870 2881\n",
+      " 2932 2948 3018 3034 3066]\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "-- Attention --\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.9.self_attn.o_proj.go_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_9_layers_9_attention_shard_0_output_0\n",
+      "HF: [-6.3320325e+13 -4.4365129e+13  6.3550937e+13 ...  7.2449814e+01\n",
+      "  8.6617142e+01  8.3981407e+01]\n",
+      "FF:[-6.33203296e+13 -4.43651289e+13  6.35509408e+13 ...  7.24498901e+01\n",
+      "  8.66170959e+01  8.39814606e+01]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[ 26  51  66  85 259 262 272 296 298 329 392 415 428 482 492 514 526 531\n",
+      " 671 731 763]\n",
+      "Ok!\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.9.self_attn.o_proj.gi_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_9_layers_9_attention_shard_0_o_proj_in_grad\n",
+      "HF: [ 7.2885461e+13 -6.0835821e+13 -7.9732612e+13 ...  2.5297220e+02\n",
+      " -8.1722275e+01 -7.0014725e+01]\n",
+      "FF:[ 7.28854608e+13 -6.08357832e+13 -7.97326201e+13 ...  2.52972260e+02\n",
+      " -8.17222137e+01 -7.00146637e+01]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[  6  36  43  55  60  82 101 110 117 217 221 229 236 256 289 392 421 429\n",
+      " 433 454 486 518 523 565 568 629 639 648 707 725 744]\n",
+      "Ok!\n",
+      "mismatch between hf_tensor and ff_tensor\n",
+      "HF: [[ 7.28854608e+13  6.37500977e+02  2.96775421e+02 ...  8.35403061e+01\n",
+      "   1.72460327e+02  2.90482426e+01]\n",
+      " [-6.08358210e+13 -5.23222847e+01 -2.34542664e+02 ... -1.87500763e+01\n",
+      "  -8.99429398e+01  8.64021378e+01]\n",
+      " [-7.97326117e+13 -4.24736328e+02 -1.82208099e+02 ...  3.21808720e+00\n",
+      "  -5.87415466e+01 -2.08511108e+02]\n",
+      " ...\n",
+      " [-1.13411917e+14 -3.48418640e+02  1.52205795e+02 ...  1.51519928e+02\n",
+      "   2.45651031e+02  2.52972198e+02]\n",
+      " [-3.75985275e+12  2.39696625e+02  1.51989685e+02 ... -2.85605354e+01\n",
+      "  -1.79121232e+00 -8.17222748e+01]\n",
+      " [ 1.11016038e+14 -1.96372967e+01 -1.27668396e+02 ...  3.35008011e+01\n",
+      "  -7.46116943e+01 -7.00147247e+01]]\n",
+      "FF:[[ 7.28854608e+13  6.37500977e+02  2.96775513e+02 ...  8.35403976e+01\n",
+      "   1.72460068e+02  2.90483646e+01]\n",
+      " [-6.08357832e+13 -5.23225098e+01 -2.34542755e+02 ... -1.87501526e+01\n",
+      "  -8.99431992e+01  8.64022217e+01]\n",
+      " [-7.97326201e+13 -4.24736572e+02 -1.82207733e+02 ...  3.21793270e+00\n",
+      "  -5.87416573e+01 -2.08511139e+02]\n",
+      " ...\n",
+      " [-1.13411925e+14 -3.48418640e+02  1.52205902e+02 ...  1.51519714e+02\n",
+      "   2.45650864e+02  2.52972260e+02]\n",
+      " [-3.75988630e+12  2.39696686e+02  1.51989319e+02 ... -2.85606136e+01\n",
+      "  -1.79138493e+00 -8.17222137e+01]\n",
+      " [ 1.11016046e+14 -1.96372318e+01 -1.27668480e+02 ...  3.35009079e+01\n",
+      "  -7.46116791e+01 -7.00146637e+01]]\n",
+      "[[ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " ...\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]]\n",
+      "[  6  36  43  55  60  82 101 110 117 217 221 229 236 256 289 392 421 429\n",
+      " 433 454 486 518 523 565 568 629 639 648 707 725 744]\n",
+      "Ok!\n",
+      "mismatch between hf_tensor and ff_tensor\n",
+      "HF: [[ 7.2885461e+13 -6.0835821e+13 -7.9732612e+13 ... -1.1341192e+14\n",
+      "  -3.7598527e+12  1.1101604e+14]\n",
+      " [ 3.3241980e+03 -6.3044128e+02 -3.0447307e+03 ...  3.0137921e+02\n",
+      "   3.8262988e+02 -4.2889914e+02]\n",
+      " [ 3.5639046e+01 -1.6155790e+01 -2.4461178e+01 ...  2.7450909e+02\n",
+      "   1.6181946e+02 -2.5407137e+02]\n",
+      " ...\n",
+      " [ 4.6487908e+00 -9.6633381e-01 -2.7078497e-01 ...  3.6374569e+01\n",
+      "  -1.7563061e+00 -7.1206141e+00]\n",
+      " [ 1.8901447e+00  8.9006472e-01 -4.3125896e+00 ...  2.6014965e+01\n",
+      "  -3.7720141e-01 -7.8855257e+00]\n",
+      " [ 1.9513500e+00  5.8041654e+00 -1.4006979e+01 ...  7.2743622e+01\n",
+      "  -2.3499712e+01 -2.0133139e+01]]\n",
+      "FF:[[ 7.28854608e+13 -6.08357832e+13 -7.97326201e+13 ... -1.13411925e+14\n",
+      "  -3.75988630e+12  1.11016046e+14]\n",
+      " [ 3.32419922e+03 -6.30442505e+02 -3.04472998e+03 ...  3.01379364e+02\n",
+      "   3.82629669e+02 -4.28898712e+02]\n",
+      " [ 3.56390572e+01 -1.61558037e+01 -2.44611683e+01 ...  2.74509308e+02\n",
+      "   1.61819229e+02 -2.54071594e+02]\n",
+      " ...\n",
+      " [ 4.64879847e+00 -9.66338813e-01 -2.70792574e-01 ...  3.63745117e+01\n",
+      "  -1.75632846e+00 -7.12060070e+00]\n",
+      " [ 1.89013767e+00  8.90062451e-01 -4.31257772e+00 ...  2.60149212e+01\n",
+      "  -3.77217919e-01 -7.88551569e+00]\n",
+      " [ 1.95135939e+00  5.80417490e+00 -1.40069904e+01 ...  7.27435226e+01\n",
+      "  -2.34996586e+01 -2.01330910e+01]]\n",
+      "[[ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " ...\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]]\n",
+      "[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]\n",
+      "Ok!\n",
+      "7.609953703703703% mismatch in QK prods softmax out grad\n",
+      "Ok!\n",
+      "hf_attn_in:  (768, 24)\n",
+      "[[-1.17282076e+14 -2.12461621e+03  8.80099030e+01 ...  4.34470520e+01\n",
+      "   7.55885468e+01 -2.88791332e+01]\n",
+      " [-2.07757936e+14 -3.81796265e+02 -2.33774780e+02 ...  8.11984329e+01\n",
+      "  -4.41825638e+01  7.35064125e+00]\n",
+      " [ 4.11484165e+13  2.50572113e+02  1.91601822e+02 ...  1.00269365e+01\n",
+      "  -3.41638985e+01  1.20433075e+02]\n",
+      " ...\n",
+      " [ 7.95562329e+13  1.55007373e+03  1.70351212e+02 ... -1.80320053e+01\n",
+      "   8.77533417e+01  2.14678173e+01]\n",
+      " [-1.86546485e+14 -5.18847070e+03 -3.34331085e+02 ...  2.51586838e+01\n",
+      "  -4.06135368e+01 -6.27860641e+00]\n",
+      " [ 1.89751705e+14 -3.09853809e+03 -1.18278351e+01 ... -1.24640663e+02\n",
+      "   1.59719009e+01 -6.47173615e+01]]\n",
+      "ff_attn_in:  (768, 24)\n",
+      "[[-1.17282034e+14 -2.12461694e+03  8.80101547e+01 ...  4.34468918e+01\n",
+      "   7.55886002e+01 -2.88791542e+01]\n",
+      " [-2.07757920e+14 -3.81795776e+02 -2.33774765e+02 ...  8.11985397e+01\n",
+      "  -4.41825829e+01  7.35066986e+00]\n",
+      " [ 4.11484543e+13  2.50570099e+02  1.91601196e+02 ...  1.00270777e+01\n",
+      "  -3.41638451e+01  1.20433121e+02]\n",
+      " ...\n",
+      " [ 7.95562413e+13  1.55007288e+03  1.70350784e+02 ... -1.80321960e+01\n",
+      "   8.77533112e+01  2.14678249e+01]\n",
+      " [-1.86546469e+14 -5.18847070e+03 -3.34331268e+02 ...  2.51588135e+01\n",
+      "  -4.06132622e+01 -6.27861023e+00]\n",
+      " [ 1.89751521e+14 -3.09853711e+03 -1.18275299e+01 ... -1.24640862e+02\n",
+      "   1.59719791e+01 -6.47173767e+01]]\n",
+      "7.530381944444445% mismatch in attention input grads\n",
+      "\n",
+      "Huggingface checks:\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "\n",
+      "FlexFlow checks:\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "\n",
+      "Huggingface-FlexFlow checks:\n",
+      "-- W2 --\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.8.mlp.down_proj.go_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_8_layers_8_feed_forward_w2_shard_0_output_0\n",
+      "HF: [-1.3223293e+17 -2.3794983e+17  4.7027590e+16 ...  7.7873253e+01\n",
+      "  8.6085976e+01  6.8200005e+01]\n",
+      "FF:[-1.32232886e+17 -2.37949812e+17  4.70276284e+16 ...  7.78733292e+01\n",
+      "  8.60859299e+01  6.82000580e+01]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[    3    24    66    71    94    95   124   134   141   150   163   181\n",
+      "   226   261   284   318   320   378   382   385   391   395   403   422\n",
+      "   434   495   515   523   524   549   579   610   644   710   764   772\n",
+      "   870   984   987  1045  1249  1330  1362  1489  1517  1550  1556  1588\n",
+      "  1595  1659  1672  1684  1689  1768  1792  1799  1808  1818  1842  1871\n",
+      "  1889  1899  1910  1915  1925  1936  1993  1997  2033  2041  2059  2062\n",
+      "  2066  2098  2111  2124  2129  2130  2146  2153  2159  2166  2197  2206\n",
+      "  2210  2212  2222  2234  2237  2320  2321  2357  2359  2362  2385  2428\n",
+      "  2518  2539  2553  2568  2598  2683  2689  2694  2711  2714  2733  2787\n",
+      "  2788  2795  2811  2815  2853  2881  2890  2917  2981  2997  3021  3037\n",
+      "  3089  3149  3163  3191  3196  3217  3225  3248  3277  3287  3292  3305\n",
+      "  3327  3361  3385  3402  3417  3425  3456  3479  3516  3521  3528  3555\n",
+      "  3587  3599  3608  3684  3702  3733  3770  3779  3819  3822  3823  3898\n",
+      "  3921  3942  3950  4012  4053  4077  4086  4091  4139  4185  4198  4225\n",
+      "  4241  4296  4347  4349  4368  4403  4407  4418  4453  4471  4472  4473\n",
+      "  4494  4537  4549  4555  4558  4598  4623  4648  4666  4698  4729  4782\n",
+      "  4848  4866  4886  4943  4959  5008  5010  5012  5057  5079  5177  5178\n",
+      "  5186  5211  5271  5281  5296  5313  5328  5356  5364  5409  5429  5440\n",
+      "  5453  5455  5457  5476  5529  5563  5591  5621  5625  5631  5654  5661\n",
+      "  5692  5705  5720  5740  5751  5758  5787  5799  5813  5835  5836  5867\n",
+      "  5872  5893  5953  5974  5980  5982  6000  6055  6082  6086  6102  6107\n",
+      "  6123  6159  6172  6193  6220  6230  6231  6263  6286  6297  6362  6396\n",
+      "  6401  6430  6436  6485  6497  6499  6502  6510  6537  6554  6555  6563\n",
+      "  6564  6579  6586  6598  6615  6625  6626  6649  6651  6661  6754  6764\n",
+      "  6776  6852  6863  6874  6883  6892  6913  6945  6969  7036  7057  7066\n",
+      "  7082  7138  7147  7150  7157  7197  7202  7231  7234  7235  7240  7270\n",
+      "  7278  7287  7322  7327  7345  7348  7361  7390  7402  7490  7539  7573\n",
+      "  7610  7714  7721  7758  7794  7812  7827  7829  7837  7839  7882  7894\n",
+      "  7943  7948  7952  7969  7975  7996  8024  8027  8037  8043  8055  8078\n",
+      "  8079  8088  8090  8095  8154  8258  8264  8283  8297  8313  8329  8336\n",
+      "  8359  8361  8376  8383  8416  8421  8428  8454  8475  8502  8521  8613\n",
+      "  8642  8653  8696  8756  8764  8777  8791  8837  8849  8859  8878  8955\n",
+      "  8991  8997  9006  9012  9040  9066  9093  9097  9098  9131  9158  9162\n",
+      "  9165  9214  9216  9280  9297  9301  9316  9355  9371  9412  9421  9475\n",
+      "  9510  9580  9620  9645  9696  9713  9732  9768  9802  9817  9819  9826\n",
+      "  9839  9846  9947 10004 10062 10065 10072 10103 10107 10108 10138 10167\n",
+      " 10173 10228 10262 10292 10326 10356 10360 10372 10421 10446 10466 10468\n",
+      " 10499 10505 10513 10517 10589 10606 10612 10645 10664 10669 10726 10777\n",
+      " 10835 10838 10839 10848 10855 10877 10897 10941 10963 10971 10977 10997\n",
+      " 11030 11060 11065 11076 11088 11140 11167 11174 11231 11252 11257 11259\n",
+      " 11275 11297 11302 11319 11331 11333 11357 11358 11380 11382 11402 11423\n",
+      " 11446 11447 11500 11501 11522 11585 11623 11670 11728 11736 11759 11761\n",
+      " 11772 11785 11839 11894 11916 11924 11936 11962 11968 11969 11977 11984\n",
+      " 12008 12030 12054 12074 12123 12175 12182 12194 12237 12262 12282 12285\n",
+      " 12341 12348 12351 12370 12376 12386 12399 12449 12507 12513 12518 12522\n",
+      " 12549 12572 12643 12648 12663 12689 12696 12710 12769 12780 12788 12792\n",
+      " 12793 12852 12864 12879 12884 12985 13018 13041 13057 13176 13264 13272\n",
+      " 13274 13275 13292 13303 13333 13379 13427 13428 13442 13451 13454 13500\n",
+      " 13510 13533 13564 13588 13607 13640 13655 13686 13687 13688 13732 13747\n",
+      " 13786 13801 13803 13826 13841 13846 13850 13892 13909 13946 14036 14040\n",
+      " 14046 14060 14080 14152 14161 14183 14195 14210 14240 14278 14331 14354\n",
+      " 14370 14372 14386 14395 14409 14432 14434 14497 14506 14531 14559 14589\n",
+      " 14648 14663 14686 14698 14715 14743 14757 14799 14808 14810 14849 14893\n",
+      " 14902 14929 14937 14947 14953 14958 15005 15012 15018 15036 15066 15069\n",
+      " 15083 15152 15154 15196 15197 15212 15292 15309 15323 15340 15343 15375\n",
+      " 15389 15396 15408 15410 15454 15499 15532 15557 15605 15647 15677 15736\n",
+      " 15745 15756 15769 15809 15824 15876 15882 15900 15906 15941 16027 16030\n",
+      " 16040 16116 16190 16192 16205 16207 16239 16279 16285 16295 16348 16358\n",
+      " 16367 16384 16386 16394 16399 16455 16457 16458 16471 16495 16500 16502\n",
+      " 16520 16541 16542 16598 16623 16643 16651 16665 16673 16679 16713 16725\n",
+      " 16734 16736 16739 16751 16756 16768 16861 16870 16939 16976 17007 17028\n",
+      " 17040 17069 17087 17108 17125 17139 17151 17158 17174 17175 17178 17182\n",
+      " 17189 17221 17258 17341 17360 17370 17381 17395 17396 17415 17432 17450\n",
+      " 17463 17470 17472 17473 17496 17507 17536 17608 17626 17627 17649 17653\n",
+      " 17664 17771 17815 17822 17831 17864 17883 17931 17994 17999 18035 18174\n",
+      " 18209 18250 18274 18307 18327 18403 18423]\n",
+      "Ok!\n",
+      "Ok!\n",
+      "-- Lora --\n",
+      "Ok!\n",
+      "Ok!\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.8.mlp.down_proj.lora_B.default.go_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_8_layers_8_feed_forward_w2_lora_shard_0_output_0\n",
+      "HF: [-1.3223293e+17 -2.3794983e+17  4.7027590e+16 ...  7.7873253e+01\n",
+      "  8.6085976e+01  6.8200005e+01]\n",
+      "FF:[-1.32232886e+17 -2.37949812e+17  4.70276284e+16 ...  7.78733292e+01\n",
+      "  8.60859299e+01  6.82000580e+01]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[  3  24  66  71  94  95 124 134 141 150 163 181 226 261 284 318 320 378\n",
+      " 382 385 391 395 403 422 434 495 515 523 524 549 579 610 644 710 764]\n",
+      "Ok!\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.8.mlp.down_proj.lora_A.default.gi_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_8_layers_8_feed_forward_w2_lora_shard_0_input_0\n",
+      "HF: [ 6.5550952e+14  4.9376585e+14  3.8510841e+14 ...  1.6802770e+00\n",
+      " -1.1248941e+00 -1.1701980e+00]\n",
+      "FF:[ 6.55509317e+14  4.93765882e+14  3.85108377e+14 ...  1.68027747e+00\n",
+      " -1.12489426e+00 -1.17019880e+00]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[   6   79  111  149  155  168  187  195  220  223  252  261  329  343\n",
+      "  347  369  386  392  403  438  439  450  461  524  535  643  656  659\n",
+      "  661  668  722  727  732  742  754  801  816  820  835  837  849  850\n",
+      "  978  993  997 1012 1019 1034 1044 1071 1088 1094 1114 1135 1151 1170\n",
+      " 1190 1212 1273 1275 1277 1289 1290 1308 1311 1337 1364 1379 1394 1430\n",
+      " 1454 1460 1469 1474 1703 1725 1728 1732 1733 1741 1754 1757 1804 1806\n",
+      " 1856 1862 1932 1945 1996 2030 2044 2045 2065 2071 2075 2094 2149 2152\n",
+      " 2163 2180 2182 2215 2254 2357 2362 2370 2392 2398 2428 2484 2519 2521\n",
+      " 2524 2582 2618 2641 2645 2664 2674 2681 2691 2735 2747 2779 2872 2899\n",
+      " 2909 2935 2957 3000 3033]\n",
+      "Ok!\n",
+      "-- W2/W1/W3 --\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.8.mlp.down_proj.gi_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_8_SigmoidSiluMulti_shard_0_output_0\n",
+      "HF: [-1.3871785e+17 -8.3164397e+16  4.9509505e+16 ...  4.3806694e+01\n",
+      "  9.4386072e+00 -2.4460859e+01]\n",
+      "FF:[-1.38717840e+17 -8.31644654e+16  4.95094495e+16 ...  4.38065948e+01\n",
+      "  9.43864822e+00 -2.44608364e+01]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[  80   83  172  173  176  184  215  285  329  338  341  395  403  465\n",
+      "  468  565  572  601  614  636  639  651  660  749  750  806  828  844\n",
+      "  873  952  971  988  992 1014 1082 1083 1085 1123 1152 1195 1200 1227\n",
+      " 1391 1397 1462 1546 1548 1563 1584 1629 1704 1706 1759 1764 1820 1833\n",
+      " 1851 1857 1864 1899 1929 1943 1958 1967 1980 1985 2002 2030 2069 2076\n",
+      " 2120 2127 2130 2157 2180 2187 2195 2212 2243 2249 2256 2299 2393 2505\n",
+      " 2516 2525 2546 2562 2604 2702 2712 2731 2745 2764 2789 2821 2873 2915\n",
+      " 2936 2945 2951 3013 3016]\n",
+      "Ok!\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.8.mlp.down_proj.gi_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_8_layers_8_feed_forward_w2_shard_0_input_0\n",
+      "HF: [-1.3871785e+17 -8.3164397e+16  4.9509505e+16 ...  4.3806694e+01\n",
+      "  9.4386072e+00 -2.4460859e+01]\n",
+      "FF:[-1.38717840e+17 -8.31644654e+16  4.95094495e+16 ...  4.38065948e+01\n",
+      "  9.43864822e+00 -2.44608364e+01]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[  80   83  172  173  176  184  215  285  329  338  341  395  403  465\n",
+      "  468  565  572  601  614  636  639  651  660  749  750  806  828  844\n",
+      "  873  952  971  988  992 1014 1082 1083 1085 1123 1152 1195 1200 1227\n",
+      " 1391 1397 1462 1546 1548 1563 1584 1629 1704 1706 1759 1764 1820 1833\n",
+      " 1851 1857 1864 1899 1929 1943 1958 1967 1980 1985 2002 2030 2069 2076\n",
+      " 2120 2127 2130 2157 2180 2187 2195 2212 2243 2249 2256 2299 2393 2505\n",
+      " 2516 2525 2546 2562 2604 2702 2712 2731 2745 2764 2789 2821 2873 2915\n",
+      " 2936 2945 2951 3013 3016]\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "-- Attention --\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.8.self_attn.o_proj.go_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_8_layers_8_attention_shard_0_output_0\n",
+      "HF: [-1.3223293e+17 -2.3794983e+17  4.7027590e+16 ...  3.5121140e+01\n",
+      " -3.5587997e+00  9.5641022e+01]\n",
+      "FF:[-1.32232886e+17 -2.37949812e+17  4.70276284e+16 ...  3.51211472e+01\n",
+      " -3.55898285e+00  9.56410980e+01]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[  3  24  66  71  94  95 124 134 141 150 163 181 226 261 284 318 320 378\n",
+      " 382 385 391 395 403 422 434 495 515 523 524 549 579 610 644 710 764]\n",
+      "Ok!\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.8.self_attn.o_proj.gi_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_8_layers_8_attention_shard_0_o_proj_in_grad\n",
+      "HF: [-1.6186993e+17 -3.5698813e+17  3.4442975e+16 ... -2.5844165e+02\n",
+      "  2.0677340e+01 -2.4573349e+01]\n",
+      "FF:[-1.61869621e+17 -3.56988336e+17  3.44430865e+16 ... -2.58441467e+02\n",
+      "  2.06775093e+01 -2.45735531e+01]\n",
+      "[ True  True  True ...  True  True  True]\n",
+      "[ 93  99 114 137 141 142 160 193 235 259 269 299 307 316 350 364 400 523\n",
+      " 608 702 720 731 759]\n",
+      "Ok!\n",
+      "mismatch between hf_tensor and ff_tensor\n",
+      "HF: [[-1.6186993e+17 -2.1968115e+02  8.5754425e+01 ... -6.9909119e+01\n",
+      "  -2.6478451e+01 -7.4195160e+01]\n",
+      " [-3.5698813e+17  3.9582391e+02  5.5431940e+02 ...  1.9529277e+02\n",
+      "   1.2558211e+02  6.7965935e+01]\n",
+      " [ 3.4442975e+16  2.8310864e+02 -8.1522171e+01 ... -2.3606525e+01\n",
+      "  -2.0410315e+01 -1.5228156e+02]\n",
+      " ...\n",
+      " [ 4.0923264e+16 -2.4507169e+02 -8.2614380e+02 ... -2.6583340e+02\n",
+      "  -1.9878247e+02 -2.5844165e+02]\n",
+      " [ 6.9156258e+17  1.3969666e+02 -7.5639044e+02 ... -1.5231053e+02\n",
+      "  -3.3650037e+02  2.0677340e+01]\n",
+      " [ 9.9511712e+16 -3.2348724e+01  3.0624988e+02 ...  1.0391423e+02\n",
+      "   6.0626881e+01 -2.4573349e+01]]\n",
+      "FF:[[-1.61869621e+17 -2.19681122e+02  8.57541504e+01 ... -6.99092026e+01\n",
+      "  -2.64783611e+01 -7.41952515e+01]\n",
+      " [-3.56988336e+17  3.95823853e+02  5.54319275e+02 ...  1.95292725e+02\n",
+      "   1.25582062e+02  6.79659348e+01]\n",
+      " [ 3.44430865e+16  2.83108551e+02 -8.15224686e+01 ... -2.36064014e+01\n",
+      "  -2.04101429e+01 -1.52281570e+02]\n",
+      " ...\n",
+      " [ 4.09233933e+16 -2.45071564e+02 -8.26143555e+02 ... -2.65833405e+02\n",
+      "  -1.98782272e+02 -2.58441467e+02]\n",
+      " [ 6.91562577e+17  1.39696579e+02 -7.56390808e+02 ... -1.52310455e+02\n",
+      "  -3.36500092e+02  2.06775093e+01]\n",
+      " [ 9.95114373e+16 -3.23486938e+01  3.06250122e+02 ...  1.03914482e+02\n",
+      "   6.06264191e+01 -2.45735531e+01]]\n",
+      "[[ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " ...\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]]\n",
+      "[ 93  99 114 137 141 142 160 193 235 259 269 299 307 316 350 364 400 523\n",
+      " 608 702 720 731 759]\n",
+      "Ok!\n",
+      "mismatch between hf_tensor and ff_tensor\n",
+      "HF: [[-1.6186993e+17 -3.5698813e+17  3.4442975e+16 ...  4.0923264e+16\n",
+      "   6.9156258e+17  9.9511712e+16]\n",
+      " [-5.3483575e+02  2.6249797e+03 -6.7268573e+02 ... -6.1204077e+03\n",
+      "  -4.3047915e+03 -9.5139771e+01]\n",
+      " [-1.2200641e+01  1.0347147e+02 -2.6777636e+01 ... -1.4766699e+02\n",
+      "  -9.8514114e+01  1.2616925e+01]\n",
+      " ...\n",
+      " [-3.2097631e+00  9.1431990e+00 -1.6333975e+00 ... -6.9996667e+00\n",
+      "  -6.4008064e+00  1.9126304e+00]\n",
+      " [-3.0982289e+00  1.2355285e+01 -3.1715555e+00 ... -4.6754313e+00\n",
+      "  -6.2553053e+00  1.0515085e+00]\n",
+      " [-2.9516125e+00  2.7038031e+00 -6.0580249e+00 ... -1.6555168e+01\n",
+      "   1.3245420e+00 -1.5741113e+00]]\n",
+      "FF:[[-1.61869621e+17 -3.56988336e+17  3.44430865e+16 ...  4.09233933e+16\n",
+      "   6.91562577e+17  9.95114373e+16]\n",
+      " [-5.34834961e+02  2.62497900e+03 -6.72686401e+02 ... -6.12040576e+03\n",
+      "  -4.30479297e+03 -9.51402283e+01]\n",
+      " [-1.22006664e+01  1.03471611e+02 -2.67777309e+01 ... -1.47666946e+02\n",
+      "  -9.85141525e+01  1.26169167e+01]\n",
+      " ...\n",
+      " [-3.20977211e+00  9.14321709e+00 -1.63339353e+00 ... -6.99966621e+00\n",
+      "  -6.40081263e+00  1.91262615e+00]\n",
+      " [-3.09821057e+00  1.23552399e+01 -3.17152786e+00 ... -4.67541933e+00\n",
+      "  -6.25528765e+00  1.05149710e+00]\n",
+      " [-2.95161533e+00  2.70380235e+00 -6.05802393e+00 ... -1.65551491e+01\n",
+      "   1.32455230e+00 -1.57412362e+00]]\n",
+      "[[ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " ...\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]\n",
+      " [ True  True  True ...  True  True  True]]\n",
+      "[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]\n",
+      "Ok!\n",
+      "8.101851851851851% mismatch in QK prods softmax out grad\n",
+      "Ok!\n",
+      "hf_attn_in:  (768, 24)\n",
+      "[[-7.3778828e+16  1.0956941e+03  1.1773144e+02 ... -4.0466427e+01\n",
+      "  -3.1198654e+01 -1.7603550e+01]\n",
+      " [-1.2087128e+18  6.9384756e+03  6.1327003e+01 ...  1.5329468e+01\n",
+      "   7.6757736e+00 -4.5589094e+00]\n",
+      " [-6.7892266e+17  5.4895034e+03  7.6927376e+01 ...  9.1396770e+00\n",
+      "   2.3195824e+01 -6.1995559e+00]\n",
+      " ...\n",
+      " [ 2.6452032e+17  9.9761787e+03  2.2349066e+02 ...  5.7504387e+01\n",
+      "  -8.6791611e-01  4.6890911e+01]\n",
+      " [-6.7528534e+16  3.3856902e+03  2.5189743e+02 ...  2.2824722e+01\n",
+      "   8.7917282e+01 -2.1569672e+01]\n",
+      " [-2.1779064e+17  5.2511855e+03  6.6282043e+01 ...  9.9689598e+00\n",
+      "  -5.5022659e+00 -3.2573143e+01]]\n",
+      "ff_attn_in:  (768, 24)\n",
+      "[[-7.37791458e+16  1.09569678e+03  1.17731285e+02 ... -4.04664154e+01\n",
+      "  -3.11988506e+01 -1.76035423e+01]\n",
+      " [-1.20871251e+18  6.93847900e+03  6.13275528e+01 ...  1.53295393e+01\n",
+      "   7.67594433e+00 -4.55900288e+00]\n",
+      " [-6.78922523e+17  5.48950342e+03  7.69272308e+01 ...  9.13961220e+00\n",
+      "   2.31957569e+01 -6.19959354e+00]\n",
+      " ...\n",
+      " [ 2.64520284e+17  9.97617871e+03  2.23490509e+02 ...  5.75044785e+01\n",
+      "  -8.67943764e-01  4.68908234e+01]\n",
+      " [-6.75287400e+16  3.38569165e+03  2.51897339e+02 ...  2.28247147e+01\n",
+      "   8.79171448e+01 -2.15696106e+01]\n",
+      " [-2.17790679e+17  5.25118652e+03  6.62821960e+01 ...  9.96885872e+00\n",
+      "  -5.50213098e+00 -3.25731125e+01]]\n",
+      "9.809027777777777% mismatch in attention input grads\n",
+      "\n",
+      "Huggingface checks:\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "\n",
+      "FlexFlow checks:\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "\n",
+      "Huggingface-FlexFlow checks:\n",
+      "-- W2 --\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/bwd_step_0_layers.7.mlp.down_proj.go_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/bwd_step_0_layers_7_layers_7_feed_forward_w2_shard_0_output_0\n",
+      "HF: [-7.5522525e+19 -1.3283726e+21 -7.2549753e+20 ...  4.9017162e+01\n",
+      " -9.7436657e+00  8.5870697e+01]\n",
+      "FF:[-7.55228501e+19 -1.32837218e+21 -7.25497390e+20 ...  4.90171394e+01\n",
+      " -9.74382782e+00  8.58707886e+01]\n",
+      "[ True  True  True ...  True False  True]\n",
+      "[   19    64    75 ... 18418 18428 18430]\n"
+     ]
+    },
+    {
+     "ename": "AssertionError",
+     "evalue": "",
+     "output_type": "error",
+     "traceback": [
+      "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m",
+      "\u001b[0;31mAssertionError\u001b[0m                            Traceback (most recent call last)",
+      "Cell \u001b[0;32mIn[23], line 95\u001b[0m\n\u001b[1;32m     93\u001b[0m \u001b[38;5;28mprint\u001b[39m(\u001b[38;5;124m\"\u001b[39m\u001b[38;5;130;01m\\n\u001b[39;00m\u001b[38;5;124mHuggingface-FlexFlow checks:\u001b[39m\u001b[38;5;124m\"\u001b[39m)\n\u001b[1;32m     94\u001b[0m \u001b[38;5;28mprint\u001b[39m(\u001b[38;5;124m\"\u001b[39m\u001b[38;5;124m-- W2 --\u001b[39m\u001b[38;5;124m\"\u001b[39m)\n\u001b[0;32m---> 95\u001b[0m \u001b[43mcompare_tensors\u001b[49m\u001b[43m(\u001b[49m\u001b[43mhf_BWD_w2_out\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mff_BWD_w2_out\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mtolerance\u001b[49m\u001b[38;5;241;43m=\u001b[39;49m\u001b[38;5;241;43m1e-5\u001b[39;49m\u001b[43m)\u001b[49m\n\u001b[1;32m     96\u001b[0m compare_tensors(hf_w2_weight, ff_w2_weight, tolerance\u001b[38;5;241m=\u001b[39m\u001b[38;5;241m1e-5\u001b[39m)\n\u001b[1;32m     98\u001b[0m \u001b[38;5;28mprint\u001b[39m(\u001b[38;5;124m\"\u001b[39m\u001b[38;5;124m-- Lora --\u001b[39m\u001b[38;5;124m\"\u001b[39m)\n",
+      "File \u001b[0;32m~/Desktop/FlexFlow/tests/peft/align_test_utils.py:47\u001b[0m, in \u001b[0;36mcompare_tensors\u001b[0;34m(hf_tensor_filepath, ff_tensor_filepath, tolerance)\u001b[0m\n\u001b[1;32m     42\u001b[0m     \u001b[38;5;28mprint\u001b[39m(mismatches)\n\u001b[1;32m     43\u001b[0m     \u001b[38;5;66;03m#print(np.nonzero(hf_tensor)[0])\u001b[39;00m\n\u001b[1;32m     44\u001b[0m     \u001b[38;5;66;03m# print(np.where(np.isclose(ff_tensor, hf_tensor, atol=tolerance) ==0)[0])\u001b[39;00m\n\u001b[1;32m     45\u001b[0m     \u001b[38;5;66;03m# print(ff_tensor[36], hf_tensor[36])\u001b[39;00m\n\u001b[1;32m     46\u001b[0m \u001b[38;5;66;03m#assert(np.allclose(ff_tensor, hf_tensor, atol=tolerance))\u001b[39;00m\n\u001b[0;32m---> 47\u001b[0m \u001b[38;5;28;01massert\u001b[39;00m(\u001b[38;5;28mlen\u001b[39m(mismatches) \u001b[38;5;241m<\u001b[39m\u001b[38;5;241m=\u001b[39m \u001b[38;5;241m.05\u001b[39m\u001b[38;5;241m*\u001b[39mlen_hf_tensor)\n\u001b[1;32m     48\u001b[0m \u001b[38;5;28mprint\u001b[39m(\u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mOk!\u001b[39m\u001b[38;5;124m\"\u001b[39m)\n",
+      "\u001b[0;31mAssertionError\u001b[0m: "
+     ]
+    }
+   ],
+   "source": [
+    "tot_num_layers = 12\n",
+    "attention_tests=True\n",
+    "for i in range(tot_num_layers-1, -1, -1):\n",
+    "    # HuggingFace filepaths\n",
+    "    hf_BWD_norm_in = f\"{hf_path}/bwd_step_0_norm.gi_0\"\n",
+    "    hf_BWD_loraB_out = f\"{hf_path}/bwd_step_0_layers.{i}.mlp.down_proj.lora_B.default.go_0\"\n",
+    "    hf_BWD_loraB_in = f\"{hf_path}/bwd_step_0_layers.{i}.mlp.down_proj.lora_B.default.gi_0\"\n",
+    "    hf_BWD_loraA_out = f\"{hf_path}/bwd_step_0_layers.{i}.mlp.down_proj.lora_A.default.go_0\"\n",
+    "    hf_BWD_loraA_in = f\"{hf_path}/bwd_step_0_layers.{i}.mlp.down_proj.lora_A.default.gi_0\"\n",
+    "    hf_loraA_weight = f\"{hf_path}/layers.{i}.mlp.down_proj.lora_A.default.weight\"\n",
+    "    hf_loraB_weight = f\"{hf_path}/layers.{i}.mlp.down_proj.lora_B.default.weight\"\n",
+    "    hf_BWD_lora_dropout_out = f\"{hf_path}/bwd_step_0_layers.{i}.mlp.down_proj.lora_dropout.default.go_0\"\n",
+    "    hf_BWD_lora_dropout_in = f\"{hf_path}/bwd_step_0_layers.{i}.mlp.down_proj.lora_dropout.default.gi_0\"\n",
+    "    hf_BWD_w2_out = f\"{hf_path}/bwd_step_0_layers.{i}.mlp.down_proj.go_0\"\n",
+    "    hf_BWD_w2_in = f\"{hf_path}/bwd_step_0_layers.{i}.mlp.down_proj.gi_0\"\n",
+    "    hf_w2_weight = f\"{hf_path}/layers.{i}.mlp.down_proj.weight\"\n",
+    "    hf_BWD_w3_out = f\"{hf_path}/bwd_step_0_layers.{i}.mlp.up_proj.go_0\"\n",
+    "    hf_BWD_w3_in = f\"{hf_path}/bwd_step_0_layers.{i}.mlp.up_proj.gi_0\"\n",
+    "    hf_BWD_w1_out = f\"{hf_path}/bwd_step_0_layers.{i}.mlp.gate_proj.go_0\"\n",
+    "    hf_BWD_w1_in = f\"{hf_path}/bwd_step_0_layers.{i}.mlp.gate_proj.gi_0\"\n",
+    "    hf_BWD_act_fn_in = f\"{hf_path}/bwd_step_0_layers.{i}.mlp.act_fn.gi_0\"\n",
+    "    hf_BWD_act_fn_out = f\"{hf_path}/bwd_step_0_layers.{i}.mlp.act_fn.go_0\"\n",
+    "    hf_BWD_ffn_norm_out = f\"{hf_path}/bwd_step_0_layers.{i}.post_attention_layernorm.go_0\"\n",
+    "    hf_BWD_ffn_norm_in = f\"{hf_path}/bwd_step_0_layers.{i}.post_attention_layernorm.gi_0\"\n",
+    "    hf_BWD_attn_out_out = f\"{hf_path}/bwd_step_0_layers.{i}.self_attn.o_proj.go_0\"\n",
+    "    hf_BWD_attn_q_in = f\"{hf_path}/bwd_step_0_layers.11.self_attn.q_proj.gi_0\"\n",
+    "    hf_FWD_w1_out = f\"{hf_path}/fwd_step_0_layers.{i}.mlp.gate_proj.output_0\"\n",
+    "    hf_FWD_w3_out = f\"{hf_path}/fwd_step_0_layers.{i}.mlp.up_proj.output_0\"\n",
+    "    hf_FWD_act_fn_out = f\"{hf_path}/fwd_step_0_layers.{i}.mlp.act_fn.output_0\"\n",
+    "    hf_BWD_attn_oproj_in = f\"{hf_path}/bwd_step_0_layers.{i}.self_attn.o_proj.gi_0\"\n",
+    "    hf_attn_qproj_weight = f\"{hf_path}/layers.{i}.self_attn.q_proj.weight\"\n",
+    "    hf_attn_kproj_weight = f\"{hf_path}/layers.{i}.self_attn.k_proj.weight\"\n",
+    "    hf_attn_vproj_weight = f\"{hf_path}/layers.{i}.self_attn.v_proj.weight\"\n",
+    "    hf_attn_oproj_weight = f\"{hf_path}/layers.{i}.self_attn.o_proj.weight\"\n",
+    "    \n",
+    "    # FlexFlow filepaths\n",
+    "    ff_BWD_w2_out = f\"{ff_path}/bwd_step_0_layers_{i}_layers_{i}_feed_forward_w2_shard_0_output_0\"\n",
+    "    ff_BWD_w2_in = f\"{ff_path}/bwd_step_0_layers_{i}_layers_{i}_feed_forward_w2_shard_0_input_0\"\n",
+    "    ff_BWD_w2_in_pre = f\"{ff_path}/bwd_step_0_layers_{i}_layers_{i}_feed_forward_w2_shard_0_pre_input_0\"\n",
+    "    ff_w2_weight = f\"{ff_path}/fwd_step_0_layers_{i}_layers_{i}_feed_forward_w2_shard_0_weight_0\"\n",
+    "    ff_BWD_ssm_out = f\"{ff_path}/bwd_step_0_layers_{i}_SigmoidSiluMulti_shard_0_output_0\"\n",
+    "    ff_BWD_ssm_in1 = f\"{ff_path}/bwd_step_0_layers_{i}_SigmoidSiluMulti_shard_0_input_0\"\n",
+    "    ff_BWD_ssm_in2 = f\"{ff_path}/bwd_step_0_layers_{i}_SigmoidSiluMulti_shard_0_input_1\"\n",
+    "    ff_BWD_w3_out = f\"{ff_path}/bwd_step_0_layers_{i}_layers_{i}_feed_forward_w3_shard_0_output_0\"\n",
+    "    ff_BWD_w3_in = f\"{ff_path}/bwd_step_0_layers_{i}_layers_{i}_feed_forward_w3_shard_0_input_0\"\n",
+    "    ff_BWD_lora_A_in = f\"{ff_path}/bwd_step_0_layers_{i}_layers_{i}_feed_forward_w2_lora_shard_0_input_0\"\n",
+    "    ff_BWD_lora_B_out = f\"{ff_path}/bwd_step_0_layers_{i}_layers_{i}_feed_forward_w2_lora_shard_0_output_0\"\n",
+    "    ff_lora_A_weight = f\"{ff_path}/fwd_step_0_layers_{i}_layers_{i}_feed_forward_w2_lora_shard_0_weight_A\"\n",
+    "    ff_lora_B_weight = f\"{ff_path}/fwd_step_0_layers_{i}_layers_{i}_feed_forward_w2_lora_shard_0_weight_B\"\n",
+    "    ff_BWD_w1_out = f\"{ff_path}/bwd_step_0_layers_{i}_layers_{i}_feed_forward_w1_shard_0_output_0\"\n",
+    "    ff_BWD_w1_in = f\"{ff_path}/bwd_step_0_layers_{i}_layers_{i}_feed_forward_w1_shard_0_input_0\"\n",
+    "    ff_BWD_w1_in_pre = f\"{ff_path}/bwd_step_0_layers_{i}_layers_{i}_feed_forward_w1_shard_0_pre_input_0\"\n",
+    "    ff_w1_weight = f\"{ff_path}/bwd_step_0_layers_{i}_layers_{i}_feed_forward_w1_shard_0_weight_0\"\n",
+    "    ff_BWD_ffn_norm_in1 = f\"{ff_path}/bwd_step_0_layers_{i}_layers_{i}_ffn_norm_shard_0_input_0\"\n",
+    "    ff_BWD_ffn_norm_in2 = f\"{ff_path}/bwd_step_0_layers_{i}_layers_{i}_ffn_norm_shard_0_input_1\"\n",
+    "    ff_BWD_ffn_norm_out = f\"{ff_path}/bwd_step_0_layers_{i}_layers_{i}_ffn_norm_shard_0_output_0\"\n",
+    "    ff_BWD_attn_out = ff_path + f\"/bwd_step_0_layers_{i}_layers_{i}_attention_shard_0_output_0\"\n",
+    "    ff_BWD_attn_in = f\"{ff_path}/bwd_step_0_layers_{i}_layers_{i}_attention_shard_0_input_0\"\n",
+    "    ff_BWD_ssm_cached_w1_input = f\"{ff_path}/bwd_step_0_layers_{i}_SigmoidSiluMulti_shard_0_cached_w1_output\"\n",
+    "    ff_BWD_ssm_cached_w3_input = f\"{ff_path}/bwd_step_0_layers_{i}_SigmoidSiluMulti_shard_0_cached_w3_output\"\n",
+    "    ff_FWD_w1_out = f\"{ff_path}/fwd_step_0_layers_0_layers_0_feed_forward_w1_shard_0_output_0\"\n",
+    "    ff_FWD_w3_out = f\"{ff_path}/fwd_step_0_layers_0_layers_0_feed_forward_w3_shard_0_output_0\"\n",
+    "    ff_FWD_act_fnc_out = f\"{ff_path}/bwd_step_0_layers_{i}_SigmoidSiluMulti_shard_0_act_fn_output\"\n",
+    "    ff_BWD_attn_o_proj_in = f\"{ff_path}/bwd_step_0_layers_{i}_layers_{i}_attention_shard_0_o_proj_in_grad\"\n",
+    "    ff_attn_oproj_weight = f\"{ff_path}/fwd_step_0_layers_{i}_layers_{i}_attention_shard_0_weight_0\"\n",
+    "    \n",
+    "    \n",
+    "    # HuggingFace checks\n",
+    "    print(\"\\nHuggingface checks:\")\n",
+    "    if i == tot_num_layers-1:\n",
+    "        compare_hf_tensors(hf_BWD_norm_in, hf_BWD_loraB_out)\n",
+    "        compare_hf_tensors(hf_BWD_norm_in, hf_BWD_w2_out)\n",
+    "    compare_hf_tensors(hf_BWD_loraB_out, hf_BWD_w2_out)\n",
+    "    compare_hf_tensors(hf_BWD_loraB_in, hf_BWD_loraA_out)\n",
+    "\n",
+    "    compare_hf_tensors(hf_BWD_act_fn_in, hf_BWD_w1_out)\n",
+    "    check_hf_sum_tensors(hf_BWD_ffn_norm_out, hf_BWD_w1_in, hf_BWD_w3_in)\n",
+    "    if i == tot_num_layers-1:\n",
+    "        check_hf_sum_tensors(hf_BWD_attn_out_out, hf_BWD_ffn_norm_in, hf_BWD_norm_in)\n",
+    "\n",
+    "    # FlexFlow checks\n",
+    "    print(\"\\nFlexFlow checks:\")\n",
+    "    compare_flexflow_tensors(ff_BWD_w2_out, ff_BWD_lora_B_out)\n",
+    "    compare_flexflow_tensors(ff_BWD_w2_in_pre, ff_BWD_lora_A_in)\n",
+    "    compare_flexflow_tensors(ff_BWD_w2_in, ff_BWD_ssm_out)\n",
+    "    compare_flexflow_tensors(ff_BWD_ssm_in2, ff_BWD_w3_out)\n",
+    "    compare_flexflow_tensors(ff_BWD_ssm_in1, ff_BWD_w1_out)\n",
+    "    compare_flexflow_tensors(ff_BWD_w1_in, ff_BWD_ffn_norm_out)\n",
+    "    compare_flexflow_tensors(ff_BWD_w1_in_pre, ff_BWD_w3_in)\n",
+    "    compare_flexflow_tensors(ff_BWD_ffn_norm_in1, ff_BWD_ffn_norm_in2, max_len=24*768)\n",
+    "    \n",
+    "    # HF-FlexFlow checks\n",
+    "    print(\"\\nHuggingface-FlexFlow checks:\")\n",
+    "    print(\"-- W2 --\")\n",
+    "    compare_tensors(hf_BWD_w2_out, ff_BWD_w2_out, tolerance=1e-5)\n",
+    "    compare_tensors(hf_w2_weight, ff_w2_weight, tolerance=1e-5)\n",
+    "    \n",
+    "    print(\"-- Lora --\")\n",
+    "    compare_tensors(hf_loraA_weight, ff_lora_A_weight, tolerance=1e-5)\n",
+    "    compare_tensors(hf_loraB_weight, ff_lora_B_weight, tolerance=1e-5)\n",
+    "\n",
+    "    compare_tensors(hf_BWD_loraB_out, ff_BWD_lora_B_out)\n",
+    "    compare_tensors(hf_BWD_loraA_in, ff_BWD_lora_A_in)\n",
+    "    \n",
+    "    print(\"-- W2/W1/W3 --\")\n",
+    "    compare_tensors(hf_BWD_w2_in, ff_BWD_ssm_out)\n",
+    "    compare_tensors(hf_BWD_w2_in, ff_BWD_w2_in)\n",
+    "    compare_tensors(hf_BWD_w1_out, ff_BWD_w1_out)\n",
+    "    compare_tensors_difference(hf_BWD_w1_in, ff_BWD_w1_in, ff_BWD_w1_in_pre)\n",
+    "    compare_tensors(hf_BWD_w3_out, ff_BWD_w3_out)\n",
+    "    compare_tensors(hf_BWD_w3_in, ff_BWD_w3_in)\n",
+    "    compare_tensors(hf_BWD_w1_out, ff_BWD_w1_out)\n",
+    "    \n",
+    "    print(\"-- Attention --\")\n",
+    "    compare_tensors(hf_BWD_attn_out_out, ff_BWD_attn_out)\n",
+    "    hidden_size = 768\n",
+    "    qProjSize = 64\n",
+    "    num_heads = 12\n",
+    "    num_new_tokens = num_tokens = 24\n",
+    "    if attention_tests:\n",
+    "        # compare attn weight tensors\n",
+    "        ff_attn_weight_tensor = np.loadtxt(ff_attn_oproj_weight, delimiter=',')\n",
+    "        ff_attn_qproj_weight_tensor = ff_attn_weight_tensor[:hidden_size*qProjSize*num_heads].reshape((hidden_size,qProjSize*num_heads), order = 'F')\n",
+    "        ff_attn_kproj_weight_tensor = ff_attn_weight_tensor[hidden_size*qProjSize*num_heads:2*hidden_size*qProjSize*num_heads].reshape((hidden_size,qProjSize*num_heads), order = 'F')\n",
+    "        ff_attn_vproj_weight_tensor = ff_attn_weight_tensor[2*hidden_size*qProjSize*num_heads:3*hidden_size*qProjSize*num_heads].reshape((hidden_size,qProjSize*num_heads), order = 'F')\n",
+    "        ff_attn_oproj_weight_tensor = ff_attn_weight_tensor[3*hidden_size*qProjSize*num_heads:].reshape((qProjSize*num_heads,hidden_size), order='F')\n",
+    "        \n",
+    "        hf_attn_qproj_weight_tensor = torch.load(hf_attn_qproj_weight).T.detach().cpu().numpy()\n",
+    "        hf_attn_kproj_weight_tensor = torch.load(hf_attn_kproj_weight).T.detach().cpu().numpy()\n",
+    "        hf_attn_vproj_weight_tensor = torch.load(hf_attn_vproj_weight).T.detach().cpu().numpy()\n",
+    "        hf_attn_oproj_weight_tensor = torch.load(hf_attn_oproj_weight).T.detach().cpu().numpy()\n",
+    "        \n",
+    "        assert(np.allclose(ff_attn_qproj_weight_tensor, hf_attn_qproj_weight_tensor, atol=1e-5))\n",
+    "        assert(np.allclose(ff_attn_kproj_weight_tensor, hf_attn_kproj_weight_tensor, atol=1e-5))\n",
+    "        assert(np.allclose(ff_attn_vproj_weight_tensor, hf_attn_vproj_weight_tensor, atol=1e-5))\n",
+    "        assert(np.allclose(ff_attn_oproj_weight_tensor, hf_attn_oproj_weight_tensor, atol=1e-5))\n",
+    "        \n",
+    "        # Compare attn outproj grad in tensors\n",
+    "        compare_tensors(hf_BWD_attn_oproj_in, ff_BWD_attn_o_proj_in)\n",
+    "        \n",
+    "        ########### Compare value projs grads ######################\n",
+    "        # 1. compare qk prods softmax\n",
+    "        hf_qk_prods_softmax = f\"{hf_path}/fwd_step_0_layers.{i}.self_attn.qk_prods_softmax.output_0\"\n",
+    "        ff_attn_qk_prods_softmax = ff_path + f\"/bwd_step_0_layers_{i}_layers_{i}_attention_shard_0_qk_prods_softmax\"\n",
+    "        \n",
+    "        hf_qk_prods_softmax = torch.load(hf_qk_prods_softmax)\n",
+    "        ff_qk_prods_softmax = np.loadtxt(ff_attn_qk_prods_softmax, delimiter=',').reshape((num_new_tokens, num_tokens, num_heads), order = 'F')\n",
+    "\n",
+    "        for head_idx in range(num_heads):\n",
+    "            hf_qkps = hf_qk_prods_softmax.squeeze()[head_idx, :, :].detach().cpu().numpy()\n",
+    "            ff_qkps = ff_qk_prods_softmax[:,:,head_idx]\n",
+    "            assert(np.allclose(ff_qkps, hf_qkps, atol=1e-5))\n",
+    "        \n",
+    "        # 2. compare attn heads grads\n",
+    "        hf_attn_heads_grads = f\"{hf_path}/bwd_step_0_layers.{i}.self_attn.o_proj.gi_0\"\n",
+    "        ff_attn_heads_grads = ff_path + f\"/bwd_step_0_layers_{i}_layers_{i}_attention_shard_0_o_proj_in_grad\"\n",
+    "\n",
+    "        hf_attn_heads_grads = torch.load(hf_attn_heads_grads).T.squeeze().detach().cpu().numpy()\n",
+    "        ff_attn_heads_grads = np.loadtxt(ff_attn_heads_grads, delimiter=',').reshape((qProjSize*num_heads, num_new_tokens), order = 'F')\n",
+    "        # NEED TO VISUALLY INSPECT\n",
+    "        compare_loaded_tensors(hf_attn_heads_grads, ff_attn_heads_grads)\n",
+    "\n",
+    "        # 3. vproj grads\n",
+    "        hf_vproj_grads = f\"{hf_path}/bwd_step_0_layers.{i}.self_attn.v_proj.go_0\"\n",
+    "        ff_vproj_grads = ff_path + f\"/bwd_step_0_layers_{i}_layers_{i}_attention_shard_0_v_proj_in_grad\"\n",
+    "\n",
+    "        hf_vproj_grads = torch.load(hf_vproj_grads).squeeze().detach().cpu().numpy()\n",
+    "        ff_vproj_grads = np.loadtxt(ff_vproj_grads, delimiter=',').reshape((num_tokens, qProjSize*num_heads), order='F')\n",
+    "        compare_loaded_tensors(hf_vproj_grads, ff_vproj_grads)\n",
+    "        \n",
+    "        \n",
+    "        ##############################\n",
+    "        hf_value_states = f\"{hf_path}/fwd_step_0_layers.{i}.self_attn.value_states.output_0\"\n",
+    "        hf_value_states = torch.load(hf_value_states).squeeze().permute(2,0,1).detach().cpu().numpy()\n",
+    "        # print(hf_value_states.shape)\n",
+    "        ff_value_states = ff_path + f\"/bwd_step_0_layers_{i}_layers_{i}_attention_shard_0_vcache\"\n",
+    "        ff_value_states = np.loadtxt(ff_value_states, delimiter=',').reshape((qProjSize, num_heads, num_tokens), order='F')\n",
+    "        # print(ff_value_states.shape)\n",
+    "        assert(np.allclose(hf_value_states, ff_value_states, atol=1e-2))\n",
+    "        \n",
+    "        \n",
+    "        \n",
+    "        ########## Compare key and query projs grads ##################\n",
+    "        ff_devQKVPRojArray = ff_path + f\"/bwd_step_0_layers_{i}_layers_{i}_attention_shard_0_devQKVPRojArray\"\n",
+    "        ff_devQKVPRojArray = np.loadtxt(ff_devQKVPRojArray, delimiter=',').reshape((num_tokens, qProjSize*num_heads, 3), order = 'F')\n",
+    "        ff_qProjGrads = ff_devQKVPRojArray[:,:,0]\n",
+    "        ff_kProjGrads = ff_devQKVPRojArray[:,:,1]\n",
+    "        ff_vProjGrads = ff_devQKVPRojArray[:,:,2]\n",
+    "        assert(np.allclose(ff_vProjGrads, ff_vproj_grads, atol=1e-5))\n",
+    "\n",
+    "        # simulate qk_prods_softmax\n",
+    "        ff_attn_heads_grads = ff_path + f\"/bwd_step_0_layers_{i}_layers_{i}_attention_shard_0_o_proj_in_grad\"\n",
+    "        ff_attn_heads_grads = np.loadtxt(ff_attn_heads_grads, delimiter=',').reshape((qProjSize,num_heads, num_new_tokens), order = 'F')\n",
+    "        ff_attn_heads_grads = torch.from_numpy(ff_attn_heads_grads)\n",
+    "        ff_attn_heads_grads = ff_attn_heads_grads.permute(1,2,0)\n",
+    "        ff_value_states = torch.from_numpy(ff_value_states)\n",
+    "        ff_value_states = ff_value_states.permute(1,0,2)\n",
+    "        # print(ff_attn_heads_grads.shape)\n",
+    "        # print(ff_value_states.shape)\n",
+    "        simulated_qk_prods_softmax_grads = torch.matmul(ff_attn_heads_grads, ff_value_states)\n",
+    "        #simulated_qk_prods_softmax_grads = simulated_qk_prods_softmax_grads\n",
+    "        #print(\"Simulated QK prods grads:\")\n",
+    "        #print(simulated_qk_prods_softmax_grads[0,:,:])\n",
+    "\n",
+    "        # qk prods softmax right before softmax\n",
+    "        hf_qk_prods_softmax2 = f\"{hf_path}/bwd_step_0_layers.{i}.self_attn.qk_prods_softmax.go_0\"\n",
+    "        hf_qk_prods_softmax2 = torch.load(hf_qk_prods_softmax2)\n",
+    "        ff_qk_prods_softmax2 = ff_path + f\"/bwd_step_0_layers_{i}_layers_{i}_attention_shard_0_qk_prods_softmax_grad\"\n",
+    "        ff_qk_prods_softmax2 = np.loadtxt(ff_qk_prods_softmax2, delimiter=',').reshape((num_new_tokens, num_tokens, num_heads), order = 'F')\n",
+    "        hf_qk_prods_softmax2 = hf_qk_prods_softmax2.squeeze().permute(1,2,0)\n",
+    "        hf_qk_prods_softmax2 = hf_qk_prods_softmax2.detach().cpu().numpy()\n",
+    "        \n",
+    "        mismatches = np.where(~np.isclose(ff_qk_prods_softmax2, hf_qk_prods_softmax2))\n",
+    "        mismatches = [(mismatches[0][i],mismatches[1][i], mismatches[2][i]) for i in range(len(mismatches[0]))]\n",
+    "        pct_mismatch = len(mismatches) / (hf_qk_prods_softmax2.shape[0] * hf_qk_prods_softmax2.shape[1] * hf_qk_prods_softmax2.shape[2])\n",
+    "        print(f\"{pct_mismatch*100}% mismatch in QK prods softmax out grad\")\n",
+    "        # print(hf_qk_prods_softmax2[:2,:,0])\n",
+    "        # print(ff_qk_prods_softmax2[:2,:,0])\n",
+    "        assert(pct_mismatch <= 0.1)\n",
+    "\n",
+    "        # qk prods softmax right after softmax\n",
+    "        hf_qk_prods_softmax2 = f\"{hf_path}/bwd_step_0_layers.{i}.self_attn.pre_softmax.gi_0\"\n",
+    "        hf_qk_prods_softmax2 = torch.load(hf_qk_prods_softmax2)\n",
+    "        ff_qk_prods_softmax2 = ff_path + f\"/bwd_step_0_layers_{i}_layers_{i}_attention_shard_0_qk_prods_softmax_grad_in\"\n",
+    "        ff_qk_prods_softmax2 = np.loadtxt(ff_qk_prods_softmax2, delimiter=',').reshape((num_new_tokens, num_tokens, num_heads), order = 'F')\n",
+    "        hf_qk_prods_softmax2 = hf_qk_prods_softmax2.squeeze().permute(1,2,0)\n",
+    "        hf_qk_prods_softmax2 = hf_qk_prods_softmax2.detach().cpu().numpy()\n",
+    "        compare_loaded_tensors(hf_qk_prods_softmax2, ff_qk_prods_softmax2)\n",
+    "        \n",
+    "        # qk prods softmax after mask\n",
+    "        hf_qk_prods_softmax2 = f\"{hf_path}/bwd_step_0_layers.{i}.self_attn.matmul_op.go_0\"\n",
+    "        hf_qk_prods_softmax2 = torch.load(hf_qk_prods_softmax2)\n",
+    "        ff_qk_prods_softmax2 = ff_path + f\"/bwd_step_0_layers_{i}_layers_{i}_attention_shard_0_qk_prods_softmax_grad_in_masked\"\n",
+    "        ff_qk_prods_softmax2 = np.loadtxt(ff_qk_prods_softmax2, delimiter=',').reshape((num_new_tokens, num_tokens, num_heads), order = 'F')\n",
+    "        hf_qk_prods_softmax2 = hf_qk_prods_softmax2.squeeze().permute(1,2,0)\n",
+    "        hf_qk_prods_softmax2 = hf_qk_prods_softmax2.detach().cpu().numpy()\n",
+    "        assert(np.allclose(ff_qk_prods_softmax2, hf_qk_prods_softmax2, atol=1e-2))\n",
+    "\n",
+    "        # Compare query activation\n",
+    "        hf_query_activation = hf_path + f\"/fwd_step_0_layers.11.self_attn.query_activation.output_0\"\n",
+    "        hf_query_activation = torch.load(hf_query_activation)\n",
+    "        ff_query_activation = ff_path + f\"/bwd_step_0_layers_{i}_layers_{i}_attention_shard_0_query_activation\"\n",
+    "        ff_query_activation = np.loadtxt(ff_query_activation, delimiter=',').reshape((qProjSize, num_heads, num_new_tokens), order = 'F')\n",
+    "        hf_query_activation = hf_query_activation.squeeze().permute(2,0,1).detach().cpu().numpy()\n",
+    "        # assert(np.allclose(ff_query_activation, hf_query_activation, atol=1e-2))\n",
+    "        # print(hf_query_activation[:,0,:])\n",
+    "        # print()\n",
+    "        # print(ff_query_activation[:,0,:])\n",
+    "        # assert False\n",
+    "        # compare_loaded_tensors(hf_query_activation, ff_query_activation)\n",
+    "        check_rope = False\n",
+    "        if check_rope:\n",
+    "        ########################################## ROPE and Kproj ##########################################\n",
+    "\n",
+    "            # Compare FF kproj with intermediate kproj data from HF\n",
+    "            hf_kproj_grads_post_rotary = f\"{hf_path}/bwd_step_0_layers.{i}.self_attn.identity_kv_post_rotary.go_0\"\n",
+    "            hf_kproj_grads_post_rotary = torch.load(hf_kproj_grads_post_rotary)\n",
+    "            hf_kproj_grads_post_rotary_copy = hf_kproj_grads_post_rotary.squeeze().permute(1,2,0).detach().cpu().numpy()\n",
+    "            # print(\"hf_kproj_grads_post_rotary: \", hf_kproj_grads_post_rotary_copy.shape)\n",
+    "            # print(hf_kproj_grads_post_rotary_copy[:,:,0])\n",
+    "            # Check hf ROPE \n",
+    "            cos, sin = rotary_emb(hf_kproj_grads_post_rotary, seq_len=24)\n",
+    "            cos = cos.cuda()\n",
+    "            sin = sin.cuda()\n",
+    "            # query_states:  torch.Size([1, 12, 24, 64])\n",
+    "            # key_states:  torch.Size([1, 12, 24, 64])\n",
+    "            # position_ids:  torch.Size([1, 24])\n",
+    "            # tensor([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,\n",
+    "            #          18, 19, 20, 21, 22, 23]], device='cuda:0')\n",
+    "            query_states = torch.zeros([1, 12, 24, 64]).cuda()\n",
+    "            position_ids = torch.arange(24).unsqueeze(0).cuda()\n",
+    "            query_states, hf_kproj_grads_post_rotary = apply_rotary_pos_emb(query_states, hf_kproj_grads_post_rotary, cos, sin, position_ids)\n",
+    "            hf_kproj_grads_post_rotary = hf_kproj_grads_post_rotary.squeeze().permute(1,2,0).detach().cpu().numpy()\n",
+    "            # print(\"hf_kproj_grads_post_rotary: \", hf_kproj_grads_post_rotary.shape)\n",
+    "            # print(hf_kproj_grads_post_rotary[:,:,0])\n",
+    "            \n",
+    "            hf_kproj_grads_before_rotary = f\"{hf_path}/bwd_step_0_layers.{i}.self_attn.identity_kv_before_rotary.go_0\"\n",
+    "            hf_kproj_grads_before_rotary = torch.load(hf_kproj_grads_before_rotary)\n",
+    "            hf_kproj_grads_before_rotary = hf_kproj_grads_before_rotary.squeeze().permute(1,2,0).detach().cpu().numpy()\n",
+    "            # print(\"hf_kproj_grads_before_rotary: \", hf_kproj_grads_before_rotary.shape)\n",
+    "            # print(hf_kproj_grads_before_rotary[:,:,0])\n",
+    "            # Compare HF rope with manual ROPE\n",
+    "            assert(np.allclose(hf_kproj_grads_post_rotary, hf_kproj_grads_before_rotary, atol=1e-5))\n",
+    "            # Compare HF Kproj with FF Kproj (before ROPE) \n",
+    "            ff_kproj_pre = ff_path + f\"/bwd_step_0_layers_{i}_layers_{i}_attention_shard_0_devkproj_pre\"\n",
+    "            ff_kproj_pre = np.loadtxt(ff_kproj_pre, delimiter=',').reshape((num_tokens, qProjSize, num_heads), order = 'F')\n",
+    "            # print(\"ff_kproj_pre: \", ff_kproj_pre.shape)\n",
+    "            #print(ff_kproj_pre[:,:,0])\n",
+    "            mismatches = np.where(~np.isclose(ff_kproj_pre, hf_kproj_grads_post_rotary_copy, atol=1e-5))\n",
+    "            mismatches = [(mismatches[0][i],mismatches[1][i], mismatches[2][i]) for i in range(len(mismatches[0]))]\n",
+    "            pct_mismatch = len(mismatches) / (ff_kproj_pre.shape[0] * ff_kproj_pre.shape[1] * ff_kproj_pre.shape[2])\n",
+    "            print(f\"{pct_mismatch*100}% mismatch between HF and FF for kproj (before applying ROPE)\")\n",
+    "            assert(pct_mismatch <= 0.05)\n",
+    "            #assert(np.allclose(ff_kproj_pre, hf_kproj_grads_post_rotary_copy, atol=1e-5))\n",
+    "            \n",
+    "            ff_kproj = ff_path + f\"/bwd_step_0_layers_{i}_layers_{i}_attention_shard_0_devkproj\"\n",
+    "            ff_kproj = np.loadtxt(ff_kproj, delimiter=',').reshape((num_tokens, qProjSize, num_heads), order = 'F')\n",
+    "            # print(\"ff_kproj: \", ff_kproj.shape)\n",
+    "            #print(ff_kproj[:,:,0])\n",
+    "            mismatches = np.where(~np.isclose(ff_kproj, hf_kproj_grads_before_rotary, atol=1e-5))\n",
+    "            mismatches = [(mismatches[0][i],mismatches[1][i], mismatches[2][i]) for i in range(len(mismatches[0]))]\n",
+    "            pct_mismatch = len(mismatches) / (ff_kproj.shape[0] * ff_kproj.shape[1] * ff_kproj.shape[2])\n",
+    "            print(f\"{pct_mismatch*100}% mismatch between HF and FF for kproj (after applying ROPE)\")\n",
+    "            assert(pct_mismatch <= 0.05)\n",
+    "            #assert(np.allclose(ff_kproj, hf_kproj_grads_before_rotary, atol=1e-5))\n",
+    "        \n",
+    "        \n",
+    "            #assert(np.allclose(hf_kproj_grads_post_rotary, hf_kproj_grads_before_rotary, atol=1e-2))\n",
+    "            hf_kproj_grads = f\"{hf_path}/bwd_step_0_layers.{i}.self_attn.k_proj.go_0\"\n",
+    "            hf_kproj_grads = torch.load(hf_kproj_grads).squeeze()\n",
+    "            #print(\"hf_kproj_grads: \", hf_kproj_grads.shape)\n",
+    "            #print(hf_kproj_grads[:,:64])\n",
+    "            reshaped_tensor = hf_kproj_grads.view(24, 12, 64).transpose(1, 2).contiguous().detach().cpu().numpy()\n",
+    "            #print(reshaped_tensor.shape)\n",
+    "            assert(np.allclose(ff_kproj, reshaped_tensor, atol=1e-2))\n",
+    "\n",
+    "        ########################################## Qproj (with ROPE) ##########################################\n",
+    "\n",
+    "        # Compare QProj\n",
+    "        hf_qproj_grads = f\"{hf_path}/bwd_step_0_layers.{i}.self_attn.q_proj.go_0\"\n",
+    "        hf_qproj_grads = torch.load(hf_qproj_grads).squeeze()\n",
+    "        # print(\"HF Qproj:\")\n",
+    "        # print(hf_qproj_grads.shape)\n",
+    "        reshaped_tensor = hf_qproj_grads.view(24, 12, 64).transpose(1, 2).contiguous().detach().cpu().numpy()\n",
+    "        # print(\"\\t reshaped: \", reshaped_tensor.shape)\n",
+    "        # print(reshaped_tensor[:,:,0])\n",
+    "        ff_qproj = ff_path + f\"/bwd_step_0_layers_{i}_layers_{i}_attention_shard_0_devQKVPRojArray\"\n",
+    "        ff_qproj = np.loadtxt(ff_qproj, delimiter=',').reshape((num_tokens, qProjSize, num_heads, 3), order = 'F')[:,:,:,0]\n",
+    "        # print(\"FF Qproj:\")\n",
+    "        # print(ff_qproj.shape)\n",
+    "        # print(ff_qproj[:,:,0])\n",
+    "        assert(np.allclose(ff_qproj, reshaped_tensor, atol=1e-2))\n",
+    "\n",
+    "    hf_attn_in = f\"{hf_path}/bwd_step_0_layers.{i}.input_layernorm.go_0\"\n",
+    "    hf_attn_in = torch.load(hf_attn_in)\n",
+    "    hf_attn_in = hf_attn_in.squeeze().T\n",
+    "    hf_attn_in = hf_attn_in.detach().cpu().numpy()\n",
+    "    print(\"hf_attn_in: \", hf_attn_in.shape)\n",
+    "    print(hf_attn_in)\n",
+    "\n",
+    "    ff_attn_in = f\"{ff_path}/bwd_step_0_layers_{i}_layers_{i}_attention_shard_0_attn_final_grad_in\"\n",
+    "    ff_attn_in = np.loadtxt(ff_attn_in, delimiter=',').reshape((768,num_tokens), order = 'F')\n",
+    "    print(\"ff_attn_in: \", ff_attn_in.shape)\n",
+    "    print(ff_attn_in)\n",
+    "    #assert(np.allclose(ff_attn_in, hf_attn_in, atol=1e-2))\n",
+    "\n",
+    "    mismatches = np.where(~np.isclose(ff_attn_in, hf_attn_in))\n",
+    "    mismatches = [(mismatches[0][i], mismatches[1][i]) for i in range(len(mismatches[0]))]\n",
+    "    pct_mismatch = len(mismatches) / (hf_attn_in.shape[0] * hf_attn_in.shape[1])\n",
+    "    print(f\"{pct_mismatch*100}% mismatch in attention input grads\")\n",
+    "    assert(pct_mismatch <= 0.1)\n",
+    "    \n",
+    "\n"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "[-0.01614726  0.01363804  0.01768043 ...  0.00724926 -0.00149747\n",
+      " -0.01781223]\n"
+     ]
+    }
+   ],
+   "source": [
+    "a = np.fromfile(\"/usr0/home/goliaro/.cache/flexflow/weights/goliaro/llama-160m-lora-full/full-precision/layers_11_feed_forward_w2_lora_A_weight\", dtype=np.float32)\n",
+    "print(a)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "# value states: torch.Size([1, 12, 24, 64])\n",
+    "value_states=torch.from_numpy(hf_kproj_grads_post_rotary).permute(2,0,1).unsqueeze(0)\n",
+    "key_states = value_states\n",
+    "cos, sin = rotary_emb(value_states, seq_len=kv_seq_len)\n",
+    "# query_states:  torch.Size([1, 12, 24, 64])\n",
+    "# key_states:  torch.Size([1, 12, 24, 64])\n",
+    "# position_ids:  torch.Size([1, 24])\n",
+    "# tensor([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,\n",
+    "#          18, 19, 20, 21, 22, 23]], device='cuda:0')\n",
+    "query_states = torch.zeros([1, 12, 24, 64])\n",
+    "position_ids = torch.arange(24).unsqueeze(0)\n",
+    "query_states, key_states = apply_rotary_pos_emb(query_states, key_states, cos, sin, position_ids)\n",
+    "key_states = key_states.squeeze()\n",
+    "print(key_states.shape)\n",
+    "print(key_states[0,:,:])\n",
+    "print(hf_kproj_grads_before_rotary.shape)\n",
+    "print(hf_kproj_grads_before_rotary[:,:,0])"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "tensor([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,\n",
+       "         18, 19, 20, 21, 22, 23]], device='cuda:0')"
+      ]
+     },
+     "execution_count": 26,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "torch.arange(24).unsqueeze(0).cuda()"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "torch.Size([1, 12, 24, 24])\n"
+     ]
+    },
+    {
+     "ename": "AssertionError",
+     "evalue": "",
+     "output_type": "error",
+     "traceback": [
+      "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m",
+      "\u001b[0;31mAssertionError\u001b[0m                            Traceback (most recent call last)",
+      "\u001b[1;32m/usr0/home/goliaro/Desktop/FlexFlow/tests/peft/alignment_tests.ipynb Cell 6\u001b[0m line \u001b[0;36m1\n\u001b[1;32m     <a href='vscode-notebook-cell://ssh-remote%2Bgs22359.sp.cs.cmu.edu/usr0/home/goliaro/Desktop/FlexFlow/tests/peft/alignment_tests.ipynb#X11sdnNjb2RlLXJlbW90ZQ%3D%3D?line=16'>17</a>\u001b[0m     ff_qkps \u001b[39m=\u001b[39m ff_qk_prods_softmax[:,:,head_idx]\n\u001b[1;32m     <a href='vscode-notebook-cell://ssh-remote%2Bgs22359.sp.cs.cmu.edu/usr0/home/goliaro/Desktop/FlexFlow/tests/peft/alignment_tests.ipynb#X11sdnNjb2RlLXJlbW90ZQ%3D%3D?line=17'>18</a>\u001b[0m     \u001b[39massert\u001b[39;00m(np\u001b[39m.\u001b[39mallclose(ff_qkps, hf_qkps, atol\u001b[39m=\u001b[39m\u001b[39m1e-5\u001b[39m))\n\u001b[0;32m---> <a href='vscode-notebook-cell://ssh-remote%2Bgs22359.sp.cs.cmu.edu/usr0/home/goliaro/Desktop/FlexFlow/tests/peft/alignment_tests.ipynb#X11sdnNjb2RlLXJlbW90ZQ%3D%3D?line=18'>19</a>\u001b[0m \u001b[39massert\u001b[39;00m(\u001b[39mFalse\u001b[39;00m)\n\u001b[1;32m     <a href='vscode-notebook-cell://ssh-remote%2Bgs22359.sp.cs.cmu.edu/usr0/home/goliaro/Desktop/FlexFlow/tests/peft/alignment_tests.ipynb#X11sdnNjb2RlLXJlbW90ZQ%3D%3D?line=20'>21</a>\u001b[0m hf_value_states \u001b[39m=\u001b[39m torch\u001b[39m.\u001b[39mload(hf_value_states)\u001b[39m#.squeeze().T.detach().cpu().numpy()\u001b[39;00m\n\u001b[1;32m     <a href='vscode-notebook-cell://ssh-remote%2Bgs22359.sp.cs.cmu.edu/usr0/home/goliaro/Desktop/FlexFlow/tests/peft/alignment_tests.ipynb#X11sdnNjb2RlLXJlbW90ZQ%3D%3D?line=21'>22</a>\u001b[0m \u001b[39mprint\u001b[39m(hf_value_states\u001b[39m.\u001b[39mshape)\n",
+      "\u001b[0;31mAssertionError\u001b[0m: "
+     ]
+    }
+   ],
+   "source": [
+    "layer_num = 11\n",
+    "hf_qk_prods_softmax = f\"{hf_path}/fwd_step_0_layers.11.self_attn.qk_prods_softmax\"\n",
+    "ff_qk_prods_softmax = f\"{ff_path}/model_0_bwd-step_0_layer-num_{layer_num}_layer-name_layers_{layer_num}_attention_shard-id_0_qk_prods_softmax\"\n",
+    "\n",
+    "hf_value_states = f\"{hf_path}/fwd_step_0_layers.11.self_attn.value_states\"\n",
+    "\n",
+    "hf_qk_prods_softmax = torch.load(hf_qk_prods_softmax)#.squeeze().T.detach().cpu().numpy()\n",
+    "ff_qk_prods_softmax = np.loadtxt(ff_qk_prods_softmax, delimiter=',').reshape((24, 24, 12), order = 'F')\n",
+    "print(hf_qk_prods_softmax.shape)\n",
+    "#print(ff_qk_prods_softmax.shape)\n",
+    "#print(hf_qk_prods_softmax[:,:,0])\n",
+    "#print()\n",
+    "#print(ff_qk_prods_softmax[:,:,0])\n",
+    "\n",
+    "for head_idx in range(12):\n",
+    "    hf_qkps = hf_qk_prods_softmax.squeeze()[head_idx, :, :].detach().cpu().numpy()\n",
+    "    ff_qkps = ff_qk_prods_softmax[:,:,head_idx]\n",
+    "    assert(np.allclose(ff_qkps, hf_qkps, atol=1e-5))\n",
+    "\n",
+    "\n",
+    "hf_value_states = torch.load(hf_value_states)#.squeeze().T.detach().cpu().numpy()\n",
+    "print(hf_value_states.shape)\n",
+    "attn_output = torch.matmul(hf_qk_prods_softmax, hf_value_states)\n",
+    "print()\n",
+    "print(attn_output.shape)\n",
+    "print(attn_output.transpose(1, 2).contiguous().shape)\n",
+    "print(\"Hf attn heads\")\n",
+    "print(torch.load(\"/usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/fwd_step_0_layers.11.self_attn.o_proj.input_0\").shape)\n",
+    "\n",
+    "print(\"Attn heads grads:\")\n",
+    "hf_attn_heads_grads = f\"{hf_path}/bwd_step_0_layers.{layer_num}.self_attn.o_proj.gi_0\"\n",
+    "print(torch.load(hf_attn_heads_grads).shape)\n",
+    "print(\"HF value grads:\")\n",
+    "vproj_grads = f\"{hf_path}/bwd_step_0_layers.{layer_num}.self_attn.v_proj.gi_0\"\n",
+    "print(torch.load(vproj_grads).shape)\n"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "torch.Size([2, 3, 4])\n",
+      "torch.Size([4, 3, 2])\n"
+     ]
+    }
+   ],
+   "source": [
+    "a = torch.randn(2,3,4)\n",
+    "print(a.shape)\n",
+    "print(a.T.shape)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "tensor([[[   0.0000,    0.0000,    0.0000,  ...,    0.0000,    0.0000,\n",
+      "             0.0000],\n",
+      "         [  27.8890,  -21.5089,   45.8214,  ...,    5.4010,  -10.8787,\n",
+      "            39.7619],\n",
+      "         [  19.2197,   27.4681,  -68.7141,  ...,  102.3280,   66.7925,\n",
+      "          -160.8711],\n",
+      "         ...,\n",
+      "         [  63.9532,   17.4273,  -29.4416,  ...,  101.6105,   67.5937,\n",
+      "          -198.4432],\n",
+      "         [  31.2799,   13.0724,  -44.7179,  ...,  132.4898,   42.3135,\n",
+      "          -194.4037],\n",
+      "         [  42.3453,  -16.2693,  -55.7386,  ...,   90.5921,   52.2032,\n",
+      "          -124.1802]]], device='cuda:0')\n",
+      "tensor([[[-1.1845e+06, -6.7460e+05,  7.4494e+05,  ..., -9.1441e+05,\n",
+      "          -1.4912e+05,  3.5769e+06],\n",
+      "         [-7.3920e+01, -7.9389e+01,  1.1027e+02,  ..., -7.3020e+01,\n",
+      "          -2.3540e+01,  3.4587e+02],\n",
+      "         [-5.3885e+01, -1.7373e+01, -1.9780e+01,  ...,  4.1291e+01,\n",
+      "           5.5099e+01,  5.5910e+01],\n",
+      "         ...,\n",
+      "         [-2.1948e+01, -3.2109e+01,  2.8364e+01,  ...,  3.4321e+01,\n",
+      "           5.0713e+01,  5.6592e+01],\n",
+      "         [-4.4339e+01, -2.8339e+01,  1.4070e+01,  ...,  6.2797e+01,\n",
+      "           3.0760e+01,  6.1743e+01],\n",
+      "         [-1.6287e+01, -5.0413e+01, -1.9940e+01,  ...,  4.3766e+01,\n",
+      "           4.7833e+01,  4.7295e+01]]], device='cuda:0')\n"
+     ]
+    }
+   ],
+   "source": [
+    "a = \"./hf_peft_tensors/bwd_step_0_layers.11.post_attention_layernorm.gi_0\"\n",
+    "b = \"./hf_peft_tensors/bwd_step_0_layers.11.self_attn.o_proj.go_0\"\n",
+    "a = torch.load(a)\n",
+    "b = torch.load(b)\n",
+    "print(a)\n",
+    "print(b)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n"
+     ]
+    }
+   ],
+   "source": [
+    "for layer_num in range(12):\n",
+    "    hf_lora_A_weight_fp = f\"{hf_path}/layers.{layer_num}.mlp.down_proj.lora_A.default.weight\"\n",
+    "    ff_lora_A_weight_fp = f\"{ff_path}/model_0_decoding-step_0_layer-num_{layer_num}_layer-name_layers_{layer_num}_feed_forward_w2_lora_shard-id_0_weight_A\"\n",
+    "    compare_tensors(hf_lora_A_weight_fp, ff_lora_A_weight_fp, tolerance=1e-5)\n",
+    "    hf_lora_B_weight_fp = f\"{hf_path}/layers.{layer_num}.mlp.down_proj.lora_B.default.weight\"\n",
+    "    ff_lora_B_weight_fp = f\"{ff_path}/model_0_decoding-step_0_layer-num_{layer_num}_layer-name_layers_{layer_num}_feed_forward_w2_lora_shard-id_0_weight_B\"\n",
+    "    compare_tensors(hf_lora_B_weight_fp, ff_lora_B_weight_fp, tolerance=1e-5)\n",
+    "    hf_w1_weight = f\"{hf_path}/layers.{layer_num}.mlp.gate_proj.weight\"\n",
+    "    ff_w1_weight = f\"{ff_path}/model_0_decoding-step_0_layer-num_{layer_num}_layer-name_layers_{layer_num}_feed_forward_w1_shard-id_0_weight_0\"\n",
+    "    compare_tensors(hf_w1_weight, ff_w1_weight, tolerance=1e-5)\n",
+    "    hf_w3_weight = f\"{hf_path}/layers.{layer_num}.mlp.up_proj.weight\"\n",
+    "    ff_w3_weight = f\"{ff_path}/model_0_decoding-step_0_layer-num_{layer_num}_layer-name_layers_{layer_num}_feed_forward_w3_shard-id_0_weight_0\"\n",
+    "    compare_tensors(hf_w3_weight, ff_w3_weight, tolerance=1e-5)\n",
+    "    hf_w2_weight = f\"{hf_path}/layers.{layer_num}.mlp.down_proj.weight\"\n",
+    "    ff_w2_weight = f\"{ff_path}/model_0_decoding-step_0_layer-num_{layer_num}_layer-name_layers_{layer_num}_feed_forward_w2_shard-id_0_weight_0\"\n",
+    "    compare_tensors(hf_w2_weight, ff_w2_weight, tolerance=1e-5)\n",
+    "    "
+   ]
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": "base",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.11.9"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 2
+}
diff --git a/tests/peft/alignment/opt_alignment_tests.ipynb b/tests/peft/alignment/opt_alignment_tests.ipynb
new file mode 100644
index 0000000000..ca679b1857
--- /dev/null
+++ b/tests/peft/alignment/opt_alignment_tests.ipynb
@@ -0,0 +1,450 @@
+{
+ "cells": [
+  {
+   "cell_type": "code",
+   "execution_count": 2,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "import numpy as np\n",
+    "import os, torch\n",
+    "from align_test_utils import *"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 15,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Ok!\n",
+      "Ok!\n",
+      "--- Attn bias + residual ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- MLP ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- Attn bias + residual ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- MLP ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- Attn bias + residual ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- MLP ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- Attn bias + residual ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- MLP ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- Attn bias + residual ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- MLP ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- Attn bias + residual ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- MLP ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- Attn bias + residual ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- MLP ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- Attn bias + residual ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- MLP ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- Attn bias + residual ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- MLP ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- Attn bias + residual ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- MLP ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- Attn bias + residual ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- MLP ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- Attn bias + residual ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "--- MLP ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "\n",
+      "--- LM head ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "\n",
+      "--- Final Norm ---\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n"
+     ]
+    }
+   ],
+   "source": [
+    "tot_num_layers = 12\n",
+    "qProjSize = 64\n",
+    "num_heads = 12\n",
+    "num_tokens = 25\n",
+    "for i in range(tot_num_layers):\n",
+    "    hf_base = os.path.join(hf_path, f\"fwd_step_0_decoder.layers.{i}.\")\n",
+    "    ff_base = os.path.join(ff_path, f\"fwd_step_0_layers_{i}_layers_{i}_\")\n",
+    "    \n",
+    "    # LayerNorm\n",
+    "    hf_tensor = hf_base + \"self_attn_layer_norm.input_0\"\n",
+    "    ff_tensor = ff_base + \"attention_layer_norm_shard_0_output_0\"\n",
+    "    compare_tensors(hf_tensor, ff_tensor)\n",
+    "    hf_tensor = hf_base + \"self_attn_layer_norm.output_0\"\n",
+    "    ff_tensor = ff_base + \"attention_layer_norm_shard_0_output_1\"\n",
+    "    compare_tensors(hf_tensor, ff_tensor)\n",
+    "\n",
+    "    # # Attention QKV proj\n",
+    "    # print(\"---Attn---\")\n",
+    "    # ff_tensor = ff_base + \"attention_shard_0_qkv_proj_output\"\n",
+    "    # ff_tensor = load_ff_tensor(ff_tensor, [qProjSize, num_heads, 3, num_tokens])\n",
+    "    # ff_q_proj = ff_tensor[:,:,0,:]\n",
+    "    # ff_k_proj = ff_tensor[:,:,1,:]\n",
+    "    # ff_v_proj = ff_tensor[:,:,2,:]\n",
+    "    # hf_q_proj = hf_base + \"self_attn.q_proj.output_0\"\n",
+    "    # hf_q_proj = load_hf_tensor(hf_q_proj).squeeze().T\n",
+    "    # hf_q_proj = hf_q_proj.reshape(12,64,25)\n",
+    "    # hf_q_proj = np.transpose(hf_q_proj, (1,0,2))\n",
+    "    # hf_k_proj = hf_base + \"self_attn.k_proj.output_0\"\n",
+    "    # hf_k_proj = load_hf_tensor(hf_k_proj).squeeze().T\n",
+    "    # hf_k_proj = hf_k_proj.reshape(12,64,25)\n",
+    "    # hf_k_proj = np.transpose(hf_k_proj, (1,0,2))\n",
+    "    # hf_v_proj = hf_base + \"self_attn.v_proj.output_0\"\n",
+    "    # hf_v_proj = load_hf_tensor(hf_v_proj).squeeze().T\n",
+    "    # hf_v_proj = hf_v_proj.reshape(12,64,25)\n",
+    "    # hf_v_proj = np.transpose(hf_v_proj, (1,0,2))\n",
+    "    # compare_loaded_tensors(hf_q_proj/np.sqrt(qProjSize), ff_q_proj)\n",
+    "    # compare_loaded_tensors(hf_k_proj, ff_k_proj)\n",
+    "    # compare_loaded_tensors(hf_v_proj, ff_v_proj)\n",
+    "\n",
+    "    # Compare attn bias, residuals\n",
+    "    print(\"--- Attn bias + residual ---\")\n",
+    "    ff_residual1 = ff_path + f\"/fwd_step_0_layers_{i}_AddBiasResidualLayerNorm_shard_0_input_1\"\n",
+    "    ff_residual2 = ff_base + \"attention_layer_norm_shard_0_output_0\"\n",
+    "    compare_flexflow_tensors(ff_residual1, ff_residual2)\n",
+    "    hf_tensor = hf_base + \"self_attn_layer_norm.input_0\"\n",
+    "    compare_tensors(hf_tensor, ff_residual2)\n",
+    "    ff_tensor = ff_path + f\"/fwd_step_0_layers_{i}_AddBiasResidualLayerNorm_shard_0_output_0\"\n",
+    "    hf_tensor = hf_base + \"final_layer_norm.input_0\"\n",
+    "    compare_tensors(hf_tensor, ff_tensor)\n",
+    "    \n",
+    "    print(\"--- MLP ---\")\n",
+    "    hf_tensor = hf_base + \"fc1.input_0\"\n",
+    "    ff_tensor = ff_base + \"fc1_shard_0_input_0\"\n",
+    "    compare_tensors(hf_tensor, ff_tensor)\n",
+    "    hf_tensor = hf_base + \"fc2.input_0\"\n",
+    "    ff_tensor = ff_base + \"fc2_shard_0_input_0\"\n",
+    "    compare_tensors(hf_tensor, ff_tensor)\n",
+    "# LM head\n",
+    "print(\"\\n--- LM head ---\")\n",
+    "hf_tensor = hf_path + \"/fwd_step_0_base_model.model.lm_head.input_0\"\n",
+    "ff_tensor = ff_path + \"/fwd_step_0_layers_11_embed_tokens_weight_lm_head_shard_0_input_0\"\n",
+    "compare_tensors(hf_tensor, ff_tensor)\n",
+    "hf_tensor = hf_path + \"/fwd_step_0_base_model.model.lm_head.output_0\"\n",
+    "ff_tensor = ff_path + \"/fwd_step_0_layers_11_embed_tokens_weight_lm_head_shard_0_output_0\"\n",
+    "compare_tensors(hf_tensor, ff_tensor)\n",
+    "# Final layer norm\n",
+    "print(\"\\n--- Final Norm ---\")\n",
+    "hf_tensor = hf_path + \"/fwd_step_0_decoder.final_layer_norm.input_0\"\n",
+    "ff_tensor = ff_path + \"/fwd_step_0_layers_11_final_layer_norm_shard_0_output_0\"\n",
+    "compare_tensors(hf_tensor, ff_tensor)\n",
+    "ff_tensor1 = ff_path + \"/fwd_step_0_layers_11_final_layer_norm_shard_0_input_activation\"\n",
+    "# compare_flexflow_tensors_shortest(ff_tensor, ff_tensor1)\n",
+    "hf_tensor = hf_path + \"/fwd_step_0_decoder.final_layer_norm.output_0\"\n",
+    "ff_tensor = ff_path + \"/fwd_step_0_layers_11_final_layer_norm_shard_0_output_1\"\n",
+    "compare_tensors(hf_tensor, ff_tensor)\n",
+    "hf_tensor = hf_path + \"/fwd_step_0_decoder.final_layer_norm.saved_result_1\"\n",
+    "ff_tensor = ff_path + \"/fwd_step_0_layers_11_final_layer_norm_shard_0_mean\"\n",
+    "compare_tensors(hf_tensor, ff_tensor)\n",
+    "hf_tensor = hf_path + \"/fwd_step_0_decoder.final_layer_norm.saved_result_2\"\n",
+    "ff_tensor = ff_path + \"/fwd_step_0_layers_11_final_layer_norm_shard_0_rstd\"\n",
+    "compare_tensors(hf_tensor, ff_tensor)\n"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 17,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n"
+     ]
+    },
+    {
+     "ename": "AssertionError",
+     "evalue": "",
+     "output_type": "error",
+     "traceback": [
+      "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m",
+      "\u001b[0;31mAssertionError\u001b[0m                            Traceback (most recent call last)",
+      "Cell \u001b[0;32mIn[17], line 22\u001b[0m\n\u001b[1;32m     19\u001b[0m compare_flexflow_tensors(ff_tensor, ff_tensor1)\n\u001b[1;32m     20\u001b[0m compare_tensors(hf_tensor, ff_tensor) \u001b[38;5;66;03m# fails\u001b[39;00m\n\u001b[0;32m---> 22\u001b[0m \u001b[38;5;28;01massert\u001b[39;00m \u001b[38;5;28;01mFalse\u001b[39;00m\n\u001b[1;32m     24\u001b[0m \u001b[38;5;66;03m# Compare fwd input/output of layernorm\u001b[39;00m\n\u001b[1;32m     25\u001b[0m hf_FWD_norm_in \u001b[38;5;241m=\u001b[39m \u001b[38;5;124mf\u001b[39m\u001b[38;5;124m\"\u001b[39m\u001b[38;5;132;01m{\u001b[39;00mhf_path\u001b[38;5;132;01m}\u001b[39;00m\u001b[38;5;124m/fwd_step_0_decoder.final_layer_norm.input_0\u001b[39m\u001b[38;5;124m\"\u001b[39m\n",
+      "\u001b[0;31mAssertionError\u001b[0m: "
+     ]
+    }
+   ],
+   "source": [
+    "# Compare backward pass\n",
+    "hf_tensor = hf_path + \"/bwd_step_0_base_model.model.lm_head.go_0\"\n",
+    "ff_tensor = ff_path + \"/bwd_step_0_layers_11_embed_tokens_weight_lm_head_shard_0_output_0\"\n",
+    "compare_tensors(hf_tensor, ff_tensor, tolerance=1e-5)\n",
+    "hf_tensor = hf_path + \"/bwd_step_0_base_model.model.lm_head.gi_0\"\n",
+    "ff_tensor = ff_path + \"/bwd_step_0_layers_11_embed_tokens_weight_lm_head_shard_0_input_0\"\n",
+    "compare_tensors(hf_tensor, ff_tensor, tolerance=1e-5)\n",
+    "\n",
+    "hf_tensor1 = hf_path + \"/bwd_step_0_decoder.final_layer_norm.go_0\"\n",
+    "compare_hf_tensors(hf_tensor, hf_tensor1)\n",
+    "ff_tensor = ff_path + \"/bwd_step_0_layers_11_final_layer_norm_shard_0_output_0\"\n",
+    "compare_tensors(hf_tensor1, ff_tensor)\n",
+    "\n",
+    "hf_tensor = hf_path + \"/bwd_step_0_decoder.final_layer_norm.gi_0\"\n",
+    "ff_tensor = ff_path + \"/bwd_step_0_layers_11_final_layer_norm_shard_0_input_0\"\n",
+    "ff_tensor1 = ff_path + \"/bwd_step_0_layers_11_final_layer_norm_shard_0_input_1\"\n",
+    "compare_flexflow_tensors(ff_tensor, ff_tensor1)\n",
+    "compare_tensors(hf_tensor, ff_tensor) # fails"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Ok!\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/fwd_step_0_decoder.layers.0.fc1.input_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/model_0_decoding-step_0_layer-num_0_layer-name_layers_0_fc1_shard-id_0_input_0\n",
+      "HF: [ 0.0193019  -1.0467215   0.21579844 ...  0.04534929 -0.25642633\n",
+      "  0.10879952]\n",
+      "FF:[ 0.01458706 -1.02212262  0.20589906 ...  0.04446212 -0.25625792\n",
+      "  0.108039  ]\n",
+      "[ True False  True ...  True  True  True]\n",
+      "[    1     3     7 ... 19170 19174 19188]\n"
+     ]
+    },
+    {
+     "ename": "AssertionError",
+     "evalue": "",
+     "output_type": "error",
+     "traceback": [
+      "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m",
+      "\u001b[0;31mAssertionError\u001b[0m                            Traceback (most recent call last)",
+      "Cell \u001b[0;32mIn[11], line 16\u001b[0m\n\u001b[1;32m     14\u001b[0m hf_fc1_in \u001b[38;5;241m=\u001b[39m \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124m/usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/fwd_step_0_decoder.layers.0.fc1.input_0\u001b[39m\u001b[38;5;124m\"\u001b[39m\n\u001b[1;32m     15\u001b[0m ff_fc1_in \u001b[38;5;241m=\u001b[39m \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124m/usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/model_0_decoding-step_0_layer-num_0_layer-name_layers_0_fc1_shard-id_0_input_0\u001b[39m\u001b[38;5;124m\"\u001b[39m\n\u001b[0;32m---> 16\u001b[0m \u001b[43mcompare_tensors\u001b[49m\u001b[43m(\u001b[49m\u001b[43mhf_fc1_in\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mff_fc1_in\u001b[49m\u001b[43m)\u001b[49m\n\u001b[1;32m     19\u001b[0m \u001b[38;5;66;03m# LORA input\u001b[39;00m\n\u001b[1;32m     20\u001b[0m hf_lora_A_in \u001b[38;5;241m=\u001b[39m \u001b[38;5;124mf\u001b[39m\u001b[38;5;124m\"\u001b[39m\u001b[38;5;132;01m{\u001b[39;00mhf_weight_base_path\u001b[38;5;132;01m}\u001b[39;00m\u001b[38;5;124m/fwd_step_0_layers.\u001b[39m\u001b[38;5;132;01m{\u001b[39;00mlayer_num\u001b[38;5;132;01m}\u001b[39;00m\u001b[38;5;124m.mlp.down_proj.lora_A.default.input_0\u001b[39m\u001b[38;5;124m\"\u001b[39m\n",
+      "File \u001b[0;32m~/Desktop/FlexFlow/tests/peft/align_test_utils.py:32\u001b[0m, in \u001b[0;36mcompare_tensors\u001b[0;34m(hf_tensor_filepath, ff_tensor_filepath, tolerance)\u001b[0m\n\u001b[1;32m     27\u001b[0m     \u001b[38;5;28mprint\u001b[39m(mismatches)\n\u001b[1;32m     28\u001b[0m     \u001b[38;5;66;03m#print(np.nonzero(hf_tensor)[0])\u001b[39;00m\n\u001b[1;32m     29\u001b[0m     \u001b[38;5;66;03m# print(np.where(np.isclose(ff_tensor, hf_tensor, atol=tolerance) ==0)[0])\u001b[39;00m\n\u001b[1;32m     30\u001b[0m     \u001b[38;5;66;03m# print(ff_tensor[36], hf_tensor[36])\u001b[39;00m\n\u001b[1;32m     31\u001b[0m \u001b[38;5;66;03m#assert(np.allclose(ff_tensor, hf_tensor, atol=tolerance))\u001b[39;00m\n\u001b[0;32m---> 32\u001b[0m \u001b[38;5;28;01massert\u001b[39;00m(\u001b[38;5;28mlen\u001b[39m(mismatches) \u001b[38;5;241m<\u001b[39m\u001b[38;5;241m=\u001b[39m \u001b[38;5;241m.05\u001b[39m\u001b[38;5;241m*\u001b[39mlen_hf_tensor)\n\u001b[1;32m     33\u001b[0m \u001b[38;5;28mprint\u001b[39m(\u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mOk!\u001b[39m\u001b[38;5;124m\"\u001b[39m)\n",
+      "\u001b[0;31mAssertionError\u001b[0m: "
+     ]
+    }
+   ],
+   "source": [
+    "tot_num_layers = 12\n",
+    "for layer_num in range(tot_num_layers):\n",
+    "    hf_input_ln_out = f\"{hf_path}/fwd_step_0_decoder.layers.{layer_num}.self_attn_layer_norm.output_0\"\n",
+    "    ff_input_ln_out = f\"{ff_path}/model_0_decoding-step_0_layer-num_{layer_num}_layer-name_layers_{layer_num}_attention_layer_norm_shard-id_0_output_1\"\n",
+    "    compare_tensors(hf_input_ln_out, ff_input_ln_out)\n",
+    "   \n",
+    "    hf_ffn_norm_in = f\"{hf_path}/fwd_step_0_decoder.layers.{layer_num}.final_layer_norm.input_0\"\n",
+    "    ff_ffn_norm_in = f\"{ff_path}/model_0_decoding-step_0_layer-num_{layer_num}_layer-name_AddBiasResidualLayerNorm_shard-id_0_output_0\"\n",
+    "    # compare_tensors(hf_ffn_norm_in, ff_ffn_norm_in)\n",
+    "    \n",
+    "    hf_ffn_norm_out = f\"{hf_path}/fwd_step_0_decoder.layers.{layer_num}.final_layer_norm.output_0\"\n",
+    "    ff_ffn_norm_out = f\"{ff_path}/model_0_decoding-step_0_layer-num_{layer_num}_layer-name_AddBiasResidualLayerNorm_shard-id_0_output_1\"\n",
+    "    # compare_tensors(hf_ffn_norm_out, ff_ffn_norm_out)\n",
+    "    hf_fc1_in = \"/usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/fwd_step_0_decoder.layers.0.fc1.input_0\"\n",
+    "    ff_fc1_in = \"/usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/model_0_decoding-step_0_layer-num_0_layer-name_layers_0_fc1_shard-id_0_input_0\"\n",
+    "    compare_tensors(hf_fc1_in, ff_fc1_in)\n",
+    "\n",
+    "\n",
+    "    # LORA input\n",
+    "    hf_lora_A_in = f\"{hf_path}/fwd_step_0_layers.{layer_num}.mlp.down_proj.lora_A.default.input_0\"\n",
+    "    ff_lora_A_in = f\"{ff_path}/model_0_decoding-step_0_layer-num_{layer_num}_layer-name_layers_{layer_num}_feed_forward_w2_lora_shard-id_0_input_0\"\n",
+    "    compare_hf_tensors(hf_down_proj_in, hf_lora_A_in)\n",
+    "    compare_tensors(hf_lora_A_in, ff_lora_A_in)\n",
+    "    # LORA weights\n",
+    "    hf_lora_A_weight_fp = f\"{hf_path}/base_model.model.model.layers.{layer_num}.mlp.down_proj.lora_A.default.weight\"\n",
+    "    ff_lora_A_weight_fp = f\"{ff_path}/model_0_decoding-step_0_layer-num_{layer_num}_layer-name_layers_{layer_num}_feed_forward_w2_lora_shard-id_0_weight_A\"\n",
+    "    compare_tensors(hf_lora_A_weight_fp, ff_lora_A_weight_fp)\n",
+    "    hf_lora_B_weight_fp = f\"{hf_path}/base_model.model.model.layers.{layer_num}.mlp.down_proj.lora_B.default.weight\"\n",
+    "    ff_lora_B_weight_fp = f\"{ff_path}/model_0_decoding-step_0_layer-num_{layer_num}_layer-name_layers_{layer_num}_feed_forward_w2_lora_shard-id_0_weight_B\"\n",
+    "    compare_tensors(hf_lora_B_weight_fp, ff_lora_B_weight_fp)\n",
+    "    # LORA intermediate hf\n",
+    "    hf_lora_A_out = f\"{hf_path}/fwd_step_0_layers.{layer_num}.mlp.down_proj.lora_A.default.output_0\"\n",
+    "    hf_lora_B_in = f\"{hf_path}/fwd_step_0_layers.{layer_num}.mlp.down_proj.lora_B.default.input_0\"\n",
+    "    compare_hf_tensors(hf_lora_A_out, hf_lora_B_in)\n",
+    "    # LORA output\n",
+    "    hf_lora_out = f\"{hf_path}/fwd_step_0_layers.{layer_num}.mlp.down_proj.lora_B.default.output_0\"\n",
+    "    ff_lora_out = f\"{ff_path}/model_0_decoding-step_0_layer-num_{layer_num}_layer-name_layers_{layer_num}_feed_forward_w2_lora_shard-id_0_output_0\"\n",
+    "    # compare_tensors(hf_lora_out, ff_lora_out)\n",
+    "    # compare_flexflow_tensors(ff_down_proj_out, ff_lora_out)\n",
+    "    # compare_tensors(hf_down_proj_out, ff_lora_out)\n",
+    "    compare_tensors_difference(hf_lora_out, ff_lora_out, ff_down_proj_out)\n",
+    "    \n",
+    "\n",
+    "# After last layer only\n",
+    "hf_norm_out = f\"{hf_path}/fwd_step_0_norm.output_0\"\n",
+    "ff_norm_out = f\"{ff_path}/model_0_decoding-step_0_layer-num_{tot_num_layers-1}_layer-name_norm_shard-id_0_output_1\"\n",
+    "compare_tensors(hf_norm_out, ff_norm_out)\n",
+    "hf_lm_head_out = f\"{hf_path}/fwd_step_0_base_model.model.lm_head.output_0\"\n",
+    "ff_lm_head_out = f\"{ff_path}/model_0_decoding-step_0_layer-num_{tot_num_layers-1}_layer-name_output_shard-id_0_output_0\"\n",
+    "compare_tensors(hf_lm_head_out, ff_lm_head_out)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "Ok!\n",
+      "mismatch between /usr0/home/goliaro/Desktop/FlexFlow/tests/peft/hf_peft_tensors/fwd_step_0_decoder.final_layer_norm.input_0 and /usr0/home/goliaro/Desktop/FlexFlow/build/inference_tensors/model_0_decoding-step_0_layer-num_11_layer-name_final_layer_norm_shard-id_0_output_0\n",
+      "HF: [-0.00542103 -1.781267    0.16552497 ... -0.77217525 -0.5760026\n",
+      "  0.04363118]\n",
+      "FF:[ 0.03817766 -1.5644939   0.22477378 ... -0.94569921 -0.43960798\n",
+      " -0.06447437]\n",
+      "[False False False ... False False False]\n",
+      "[    0     1     2 ... 19197 19198 19199]\n"
+     ]
+    },
+    {
+     "ename": "AssertionError",
+     "evalue": "",
+     "output_type": "error",
+     "traceback": [
+      "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m",
+      "\u001b[0;31mAssertionError\u001b[0m                            Traceback (most recent call last)",
+      "Cell \u001b[0;32mIn[10], line 22\u001b[0m\n\u001b[1;32m     20\u001b[0m ff_FWD_norm_in \u001b[38;5;241m=\u001b[39m \u001b[38;5;124mf\u001b[39m\u001b[38;5;124m\"\u001b[39m\u001b[38;5;132;01m{\u001b[39;00mff_weight_base_path\u001b[38;5;132;01m}\u001b[39;00m\u001b[38;5;124m/model_0_decoding-step_0_layer-num_11_layer-name_final_layer_norm_shard-id_0_output_0\u001b[39m\u001b[38;5;124m\"\u001b[39m\n\u001b[1;32m     21\u001b[0m ff_FWD_norm_out \u001b[38;5;241m=\u001b[39m \u001b[38;5;124mf\u001b[39m\u001b[38;5;124m\"\u001b[39m\u001b[38;5;132;01m{\u001b[39;00mff_weight_base_path\u001b[38;5;132;01m}\u001b[39;00m\u001b[38;5;124m/model_0_decoding-step_0_layer-num_11_layer-name_final_layer_norm_shard-id_0_output_1\u001b[39m\u001b[38;5;124m\"\u001b[39m\n\u001b[0;32m---> 22\u001b[0m \u001b[43mcompare_tensors\u001b[49m\u001b[43m(\u001b[49m\u001b[43mhf_FWD_norm_in\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mff_FWD_norm_in\u001b[49m\u001b[43m)\u001b[49m\n\u001b[1;32m     23\u001b[0m compare_tensors(hf_FWD_norm_out, ff_FWD_norm_out)\n\u001b[1;32m     25\u001b[0m hf_BWD_norm_in \u001b[38;5;241m=\u001b[39m \u001b[38;5;124mf\u001b[39m\u001b[38;5;124m\"\u001b[39m\u001b[38;5;132;01m{\u001b[39;00mhf_weight_base_path\u001b[38;5;132;01m}\u001b[39;00m\u001b[38;5;124m/bwd_step_0_decoder.final_layer_norm.gi_0\u001b[39m\u001b[38;5;124m\"\u001b[39m\n",
+      "File \u001b[0;32m~/Desktop/FlexFlow/tests/peft/align_test_utils.py:29\u001b[0m, in \u001b[0;36mcompare_tensors\u001b[0;34m(hf_tensor_filepath, ff_tensor_filepath, tolerance)\u001b[0m\n\u001b[1;32m     24\u001b[0m     \u001b[38;5;28mprint\u001b[39m(mismatches)\n\u001b[1;32m     25\u001b[0m     \u001b[38;5;66;03m#print(np.nonzero(hf_tensor)[0])\u001b[39;00m\n\u001b[1;32m     26\u001b[0m     \u001b[38;5;66;03m# print(np.where(np.isclose(ff_tensor, hf_tensor, atol=tolerance) ==0)[0])\u001b[39;00m\n\u001b[1;32m     27\u001b[0m     \u001b[38;5;66;03m# print(ff_tensor[36], hf_tensor[36])\u001b[39;00m\n\u001b[1;32m     28\u001b[0m \u001b[38;5;66;03m#assert(np.allclose(ff_tensor, hf_tensor, atol=tolerance))\u001b[39;00m\n\u001b[0;32m---> 29\u001b[0m \u001b[38;5;28;01massert\u001b[39;00m(\u001b[38;5;28mlen\u001b[39m(mismatches) \u001b[38;5;241m<\u001b[39m\u001b[38;5;241m=\u001b[39m \u001b[38;5;241m.05\u001b[39m\u001b[38;5;241m*\u001b[39mlen_hf_tensor)\n\u001b[1;32m     30\u001b[0m \u001b[38;5;28mprint\u001b[39m(\u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mOk!\u001b[39m\u001b[38;5;124m\"\u001b[39m)\n",
+      "\u001b[0;31mAssertionError\u001b[0m: "
+     ]
+    }
+   ],
+   "source": [
+    "tot_num_layers = 12\n",
+    "\n",
+    "ff_BWD_softmax_in = f\"{ff_path}/model_0_bwd-step_0_layer-num_100_layer-name_Softmax_shard-id_0_input_0\"\n",
+    "\n",
+    "hf_BWD_lm_head_out = f\"{hf_path}/bwd_step_0_base_model.model.lm_head.go_0\"\n",
+    "ff_BWD_lm_head_out = f\"{ff_path}/model_0_bwd-step_0_layer-num_{tot_num_layers-1}_layer-name_embed_tokens_weight_lm_head_shard-id_0_output_0\"\n",
+    "compare_tensors(hf_BWD_lm_head_out, ff_BWD_lm_head_out, tolerance=1e-5)\n",
+    "hf_BWD_lm_head_in = f\"{hf_path}/bwd_step_0_base_model.model.lm_head.gi_0\"\n",
+    "ff_BWD_lm_head_in = f\"{ff_path}/model_0_bwd-step_0_layer-num_{tot_num_layers-1}_layer-name_embed_tokens_weight_lm_head_shard-id_0_input_0\"\n",
+    "compare_tensors(hf_BWD_lm_head_in, ff_BWD_lm_head_in, tolerance=1e-5)\n",
+    "\n",
+    "hf_BWD_norm_out = f\"{hf_path}/bwd_step_0_decoder.final_layer_norm.go_0\"\n",
+    "ff_BWD_norm_out = f\"{ff_path}/model_0_bwd-step_0_layer-num_{tot_num_layers-1}_layer-name_final_layer_norm_shard-id_0_output_0\"\n",
+    "compare_hf_tensors(hf_BWD_lm_head_in, hf_BWD_norm_out)\n",
+    "compare_tensors(hf_BWD_norm_out, ff_BWD_norm_out)\n",
+    "\n",
+    "# Compare fwd input/output of layernorm\n",
+    "hf_FWD_norm_in = f\"{hf_path}/fwd_step_0_decoder.final_layer_norm.input_0\"\n",
+    "hf_FWD_norm_out = f\"{hf_path}/fwd_step_0_decoder.final_layer_norm.output_0\"\n",
+    "ff_FWD_norm_in = f\"{ff_path}/model_0_decoding-step_0_layer-num_11_layer-name_final_layer_norm_shard-id_0_output_0\"\n",
+    "ff_FWD_norm_out = f\"{ff_path}/model_0_decoding-step_0_layer-num_11_layer-name_final_layer_norm_shard-id_0_output_1\"\n",
+    "compare_tensors(hf_FWD_norm_in, ff_FWD_norm_in)\n",
+    "compare_tensors(hf_FWD_norm_out, ff_FWD_norm_out)\n",
+    "\n",
+    "hf_BWD_norm_in = f\"{hf_path}/bwd_step_0_decoder.final_layer_norm.gi_0\"\n",
+    "ff_BWD_norm_in = f\"{ff_path}/model_0_bwd-step_0_layer-num_{tot_num_layers-1}_layer-name_final_layer_norm_shard-id_0_input_1\"\n",
+    "compare_tensors(hf_BWD_norm_in, ff_BWD_norm_in, tolerance=1e-5)\n"
+   ]
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": "base",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.10.4"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 2
+}
diff --git a/tests/peft/hf_finetune.py b/tests/peft/hf_finetune.py
new file mode 100644
index 0000000000..16b46cfa81
--- /dev/null
+++ b/tests/peft/hf_finetune.py
@@ -0,0 +1,129 @@
+import os, sys, shutil
+import torch
+
+# Reproducibility
+import random
+import numpy as np
+
+torch.manual_seed(0)
+random.seed(0)
+np.random.seed(0)
+# torch.use_deterministic_algorithms(True)
+
+# import bitsandbytes as bnb
+import argparse
+import transformers
+
+if transformers.__version__ < "4.31.0":
+    raise RuntimeError(
+        "Please update the transformers library version to 4.31.0 or above"
+    )
+from datasets import load_dataset
+
+
+from hf_utils import *
+
+
+def main():
+    parser = argparse.ArgumentParser()
+    parser.add_argument("--peft-model-id", type=str, default="goliaro/llama-160m-lora")
+    parser.add_argument(
+        "--lora-alpha",
+        type=int,
+        default=-1,
+        help="The scaling coefficient for LoRA. Leave it set to -1 to use the original value from the HF config",
+    )
+    parser.add_argument(
+        "--lora-dropout",
+        type=float,
+        default=0.0,
+        help="The dropout rate for LoRA. Set it to -1 to use the original value from the HF config",
+    )
+    parser.add_argument("-lr", "--learning-rate", type=float, default=0.001)
+    parser.add_argument("-n", "--max-steps", type=int, default=2)
+    parser.add_argument(
+        "--optimizer", type=str, choices=["sgs", "adam", "adamw"], default="sgd"
+    )
+    parser.add_argument(
+        "--use-full-precision", action="store_true", help="Use full precision"
+    )
+    parser.add_argument("--output-dir", type=str, default="")
+    parser.add_argument("--publish-peft-with-id", type=str, default="")
+    parser.add_argument(
+        "--save-peft-tensors",
+        action="store_true",
+        help="Save PEFT hidden states and weights to file",
+    )
+    args = parser.parse_args()
+
+    # Change working dir to folder storing this script
+    abspath = os.path.abspath(__file__)
+    dname = os.path.dirname(abspath)
+    os.chdir(dname)
+
+    # Get PEFT config, model, tokenizer, and optimizer type
+    peft_config = build_peft_config(args, finetuning=True)
+    tokenizer = get_peft_tokenizer(args, peft_config)
+    model = build_peft_model(args, peft_config)
+    optim_type = get_optim_type(args)
+
+    # Print model with PEFT
+    print(model)
+    for name, params in model.named_parameters():
+        print(name)
+    print_trainable_parameters(model)
+
+    # Add hooks to save PEFT tensors, save any weights of interest before finetuning
+    if args.save_peft_tensors:
+        make_debug_dirs()
+        register_peft_hooks(model)
+        save_peft_weights(model, target_modules=["lora", "lm_head", "down_proj"])
+
+    # Load fine-tuning dataset
+    data = load_dataset("Abirate/english_quotes")
+    # TODO: remove using of a single row
+    key_to_filter = "quote"
+    desired_value = "“Two things are infinite: the universe and human stupidity; and I'm not sure about the universe.”"
+    data = filter_dataset_for_debugging(data, key_to_filter, desired_value)
+    data = data.map(lambda samples: tokenizer(samples["quote"]), batched=True)
+
+    # Training loop
+    trainer = transformers.Trainer(
+        model=model,
+        train_dataset=data["train"],
+        args=transformers.TrainingArguments(
+            per_device_train_batch_size=1,
+            gradient_accumulation_steps=1,
+            max_grad_norm=None,  # Disable gradient clipping
+            warmup_steps=0,
+            max_steps=args.max_steps,
+            learning_rate=args.learning_rate,
+            fp16=True if not args.use_full_precision else False,
+            logging_steps=1,
+            output_dir=os.path.join(
+                args.output_dir if len(args.output_dir) > 0 else "./",
+                "lora_training_logs",
+            ),
+            optim=optim_type,
+            lr_scheduler_type=transformers.training_args.SchedulerType.CONSTANT,
+        ),
+        data_collator=transformers.DataCollatorForLanguageModeling(
+            tokenizer, mlm=False
+        ),
+        callbacks=[HFTrainingCallBack] if args.save_peft_tensors else None,
+    )
+    # silence the warnings. Please re-enable for inference!
+    model.config.use_cache = False
+
+    # for batch in trainer.get_train_dataloader():
+    #     print("First batch: ")
+    #     print(batch)
+    #     break
+
+    trainer.train()
+
+    save_finetuned_model(model, args)
+
+
+if __name__ == "__main__":
+    main()
diff --git a/tests/peft/hf_serve.py b/tests/peft/hf_serve.py
new file mode 100644
index 0000000000..7bfc560cc2
--- /dev/null
+++ b/tests/peft/hf_serve.py
@@ -0,0 +1,140 @@
+import argparse
+import torch
+import os, sys, shutil, json
+from peft import PeftModel, PeftConfig
+from transformers import (
+    AutoModelForCausalLM,
+    AutoTokenizer,
+    AutoConfig,
+    LlamaTokenizer,
+    GenerationConfig,
+)
+
+
+def peft_pre_forward_hook(module, input):
+    assert module.name is not None and module.decoding_step is not None
+    name = module.name.replace("base_model.model.model.", "")
+    print(
+        f"Pre-forward hook activated on module: {name}, decoding step: {module.decoding_step}"
+    )
+    print("Pre-Input: ", input[0].shape)
+    torch.save(
+        input, f"./hf_peft_tensors/decoding_step_{module.decoding_step}_{name}.input"
+    )
+    # print("===")
+
+
+def peft_post_forward_hook(module, input, output):
+    assert module.name is not None and module.decoding_step is not None
+    name = module.name.replace("base_model.model.model.", "")
+    print(
+        f"Post-forward Hook activated for module: {name}, decoding step: {module.decoding_step}"
+    )
+    print("Post-Input/Output: ", input[0].shape, output[0].shape)
+    torch.save(
+        output, f"./hf_peft_tensors/decoding_step_{module.decoding_step}_{name}.output"
+    )
+    print("===")
+    module.decoding_step += 1
+
+
+def main():
+    parser = argparse.ArgumentParser()
+    parser.add_argument("--peft-model-id", type=str, required=True)
+    parser.add_argument(
+        "--use-full-precision", action="store_true", help="Use full precision"
+    )
+    parser.add_argument("--max-length", type=int, default=50)
+    parser.add_argument("--prompt-file", type=str, required=True)
+    parser.add_argument("--do-sample", action="store_true", help="Use sampling")
+    parser.add_argument(
+        "--save-peft-tensors",
+        action="store_true",
+        help="Save PEFT hidden states and weights to file",
+    )
+    args = parser.parse_args()
+
+    # Check if prompt-file exists
+    if not os.path.isfile(args.prompt_file):
+        print(f"Error: {args.prompt_file} does not exist.")
+        return
+
+    # Get peft model config
+    config = PeftConfig.from_pretrained(args.peft_model_id)
+    
+    # Load the base model
+    model = AutoModelForCausalLM.from_pretrained(
+        config.base_model_name_or_path,
+        return_dict=True,
+        # load_in_8bit=True,
+        torch_dtype=torch.float32 if args.use_full_precision else torch.float16,
+        device_map="auto",
+    )
+    # Load the Lora model
+    model = PeftModel.from_pretrained(model, args.peft_model_id)
+    print(model)
+    
+    # Get tokenizer
+    hf_config = AutoConfig.from_pretrained(
+        config.base_model_name_or_path, trust_remote_code=True
+    )
+    hf_arch = getattr(hf_config, "architectures")[0]
+    if hf_arch == "LLaMAForCausalLM" or hf_arch == "LlamaForCausalLM":
+        tokenizer = LlamaTokenizer.from_pretrained(
+            config.base_model_name_or_path,
+            use_fast=True,
+            torch_dtype=torch.float32 if args.use_full_precision else torch.float16,
+        )
+    else:
+        tokenizer = AutoTokenizer.from_pretrained(
+            config.base_model_name_or_path,
+            torch_dtype=torch.float32 if args.use_full_precision else torch.float16,
+        )
+    
+    # Generation config
+    generation_config = GenerationConfig.from_pretrained(config.base_model_name_or_path)
+    generation_config.do_sample = args.do_sample
+
+    # Register hooks to save tensors, if needed
+    if args.save_peft_tensors:
+        # Change working dir to folder storing this script
+        abspath = os.path.abspath(__file__)
+        dname = os.path.dirname(abspath)
+        os.chdir(dname)
+        # Create output dir
+        shutil.rmtree("./hf_peft_tensors")
+        os.makedirs("./hf_peft_tensors", exist_ok=True)
+        # Save weights
+        for name, params in model.named_parameters():
+            if "lora" in name:
+                torch.save(params, f"./hf_peft_tensors/{name}")
+                # params.detach().cpu().numpy().tofile(f"{weights_path}/{name}")
+        # Save hidden states
+        for name, layer in dict(model.named_modules()).items():
+            if "lora_A.default" in name or "lora_B.default" in name:
+                layer.name = name
+                layer.decoding_step = 0
+                print(f"Adding hooks to layer {layer.name}")
+                layer.register_forward_pre_hook(peft_pre_forward_hook)
+                layer.register_forward_hook(peft_post_forward_hook)
+
+    # Run inference
+    # Read prompt-file into a list of strings
+    with open(args.prompt_file, "r") as f:
+        try:
+            prompt_list = json.load(f)
+        except json.JSONDecodeError:
+            print(f"Error: Unable to parse {args.prompt_file} as JSON.")
+            sys.exit(1)
+    
+    for i, prompt in enumerate(prompt_list):
+        batch = tokenizer(prompt, return_tensors="pt", add_special_tokens=True)
+        with torch.cuda.amp.autocast():
+            output_tokens = model.generate(
+                **batch, max_new_tokens=args.max_length, generation_config=generation_config
+            )
+        print("\n\n", tokenizer.decode(output_tokens[0], skip_special_tokens=False))
+
+
+if __name__ == "__main__":
+    main()
diff --git a/tests/peft/hf_train.py b/tests/peft/hf_train.py
new file mode 100644
index 0000000000..707fc9d0ae
--- /dev/null
+++ b/tests/peft/hf_train.py
@@ -0,0 +1,161 @@
+import os, sys
+
+# os.environ["CUDA_VISIBLE_DEVICES"]="0"
+import torch
+import torch.nn as nn
+
+# import bitsandbytes as bnb
+from transformers import AutoTokenizer, AutoConfig, AutoModelForCausalLM, LlamaTokenizer
+import argparse
+from peft import LoraConfig, get_peft_model
+import transformers
+from datasets import load_dataset
+
+
+class CastOutputToFloat(nn.Sequential):
+    def forward(self, x):
+        return super().forward(x).to(torch.float32)
+
+
+def print_trainable_parameters(model):
+    """
+    Prints the number of trainable parameters in the model.
+    """
+    trainable_params = 0
+    all_param = 0
+    for _, param in model.named_parameters():
+        all_param += param.numel()
+        if param.requires_grad:
+            trainable_params += param.numel()
+    print(
+        f"trainable params: {trainable_params} || all params: {all_param} || trainable%: {100 * trainable_params / all_param}"
+    )
+
+
+def main():
+    parser = argparse.ArgumentParser()
+    parser.add_argument("--model-name", type=str, default="meta-llama/Llama-2-7b-hf")
+    parser.add_argument("--lora-rank", type=int, default=16)
+    parser.add_argument("--lora-alpha", type=int, default=32)
+    parser.add_argument(
+        "--lora-target-modules",
+        type=str,
+        default="down_proj",
+        help="Comma-separated list of layers from the base model to target",
+    )
+    parser.add_argument("--lora-dropout", type=float, default=0.05)
+    parser.add_argument(
+        "--use-full-precision", action="store_true", help="Use full precision"
+    )
+    parser.add_argument("--output-dir", type=str, default="")
+    parser.add_argument("--publish-peft-with-id", type=str, default="")
+    args = parser.parse_args()
+    model_name = args.model_name
+    use_full_precision = args.use_full_precision
+    lora_rank = args.lora_rank
+    lora_alpha = args.lora_alpha
+    lora_target_modules = args.lora_target_modules.split(",")
+    lora_dropout = args.lora_dropout
+    output_dir = args.output_dir
+    publish_peft_with_id = args.publish_peft_with_id
+    if len(output_dir) == 0 and len(publish_peft_with_id) == 0:
+        raise ValueError(
+            "Please pass either a --output-dir or a --publish-peft-with-id to specify where to store the trained model"
+        )
+
+    # Change working dir to folder storing this script
+    abspath = os.path.abspath(__file__)
+    dname = os.path.dirname(abspath)
+    os.chdir(dname)
+
+    model = AutoModelForCausalLM.from_pretrained(
+        model_name,
+        # load_in_8bit=True,
+        torch_dtype=torch.float32 if use_full_precision else torch.float16,
+        device_map="auto",
+    )
+
+    # Get Tokenizer
+    hf_config = AutoConfig.from_pretrained(model_name, trust_remote_code=True)
+    hf_arch = getattr(hf_config, "architectures")[0]
+    if hf_arch == "LLaMAForCausalLM" or hf_arch == "LlamaForCausalLM":
+        tokenizer = LlamaTokenizer.from_pretrained(
+            model_name,
+            use_fast=True,
+            torch_dtype=torch.float32 if use_full_precision else torch.float16,
+        )
+    else:
+        tokenizer = AutoTokenizer.from_pretrained(
+            model_name,
+            torch_dtype=torch.float32 if use_full_precision else torch.float16,
+        )
+    if tokenizer.pad_token is None:
+        tokenizer.pad_token = "[PAD]"
+        tokenizer.padding_side = "left"
+
+    for param in model.parameters():
+        param.requires_grad = False  # freeze the model - train adapters later
+        if param.ndim == 1:
+            # cast the small parameters (e.g. layernorm) to fp32 for stability
+            param.data = param.data.to(torch.float32)
+
+    model.gradient_checkpointing_enable()  # reduce number of stored activations
+    model.enable_input_require_grads()
+
+    model.lm_head = CastOutputToFloat(model.lm_head)
+
+    config = LoraConfig(
+        r=lora_rank,
+        lora_alpha=lora_alpha,
+        # target_modules=["q_proj", "v_proj"],
+        # target_modules=["down_proj"],
+        target_modules=lora_target_modules,
+        lora_dropout=lora_dropout,
+        bias="none",
+        task_type="CAUSAL_LM",
+    )
+    print(model)
+    print(model.named_parameters())
+    model = get_peft_model(model, config)
+    print_trainable_parameters(model)
+
+    data = load_dataset("Abirate/english_quotes")
+    data = data.map(lambda samples: tokenizer(samples["quote"]), batched=True)
+
+    trainer = transformers.Trainer(
+        model=model,
+        train_dataset=data["train"],
+        args=transformers.TrainingArguments(
+            per_device_train_batch_size=4,
+            gradient_accumulation_steps=4,
+            warmup_steps=100,
+            max_steps=200,
+            learning_rate=2e-4,
+            fp16=True if not use_full_precision else False,
+            logging_steps=1,
+            output_dir=os.path.join(
+                output_dir if len(output_dir) > 0 else "./", "lora_training_logs"
+            ),
+        ),
+        data_collator=transformers.DataCollatorForLanguageModeling(
+            tokenizer, mlm=False
+        ),
+    )
+    model.config.use_cache = (
+        False
+    )  # silence the warnings. Please re-enable for inference!
+    trainer.train()
+
+    if len(output_dir) > 0:
+        print(f"Done training! Saving the model to {output_dir}...")
+        model.save_pretrained(output_dir)
+
+    if len(publish_peft_with_id) > 0:
+        print(
+            f"Done training! Uploading the model to HF hub with id: {publish_peft_with_id}..."
+        )
+        model.push_to_hub(publish_peft_with_id, use_auth_token=True)
+
+
+if __name__ == "__main__":
+    main()
diff --git a/tests/peft/hf_utils.py b/tests/peft/hf_utils.py
new file mode 100644
index 0000000000..9332c803b2
--- /dev/null
+++ b/tests/peft/hf_utils.py
@@ -0,0 +1,352 @@
+import torch
+import torch.nn as nn
+import transformers
+from transformers import (
+    TrainerCallback,
+    AutoConfig,
+    AutoModelForCausalLM,
+    AutoTokenizer,
+    LlamaTokenizer,
+)
+import os, shutil
+from peft import PeftConfig, PeftModel
+from datasets import load_dataset, DatasetDict
+
+debug_dir = None
+debug_subdirs = ["fwd", "bwd", "optim", "weights"]
+verbose = False
+
+
+def make_debug_dirs():
+    global debug_dir
+    global debug_subdirs
+    debug_dir = os.environ.get("FF_CACHE_PATH", os.path.expanduser("~/.cache/flexflow"))
+    debug_dir = os.path.join(debug_dir, "debug", "huggingface")
+    shutil.rmtree(debug_dir, ignore_errors=True)
+    os.makedirs(debug_dir, exist_ok=True)
+    assert debug_dir is not None
+    assert os.path.isdir(debug_dir)
+    for subdir in debug_subdirs:
+        subdir_path = os.path.join(debug_dir, subdir)
+        os.makedirs(subdir_path, exist_ok=False)
+
+
+def get_dst_folder(subdir, step_idx=0):
+    global debug_dir, debug_subdirs
+    assert subdir in debug_subdirs
+    dst_folder = os.path.join(debug_dir, subdir, f"step_{step_idx}")
+    os.makedirs(dst_folder, exist_ok=True)
+    return dst_folder
+
+
+def simplify_name(name):
+    return name.replace("base_model.model.model.", "").replace("base_model.model.", "")
+
+
+def get_optim_type(args):
+    if args.optimizer == "sgd":
+        return transformers.training_args.OptimizerNames.SGD
+    elif args.optimizer == "adam":
+        return transformers.training_args.OptimizerNames.ADAM
+    elif args.optimizer == "adamw":
+        return transformers.training_args.OptimizerNames.ADAMW
+    else:
+        raise ValueError(f"Optimizer {args.optimizer} not supported")
+
+
+class CastOutputToFloat(nn.Sequential):
+    def forward(self, x):
+        return super().forward(x).to(torch.float32)
+
+
+def print_trainable_parameters(model):
+    """
+    Prints the number of trainable parameters in the model.
+    """
+    trainable_params = 0
+    all_param = 0
+    for _, param in model.named_parameters():
+        all_param += param.numel()
+        if param.requires_grad:
+            trainable_params += param.numel()
+    print(
+        f"trainable params: {trainable_params} || all params: {all_param} || trainable%: {100 * trainable_params / all_param}"
+    )
+
+
+def peft_backward_hook(module, grad_input, grad_output):
+    assert type(grad_input) == tuple and type(grad_output) == tuple
+    if len(grad_input) == 0 or len(grad_output) == 0:
+        return
+    assert module.name is not None and module.bwd_step is not None
+    name = simplify_name(module.name)
+    if verbose:
+        print(
+            f"Backward Hook activated for module: {name}, bwd step: {module.bwd_step}"
+        )
+        print("Backward GRAD Output:")
+    for i, out_grad in enumerate(grad_output):
+        if type(out_grad) == torch.Tensor:
+            dst_folder = get_dst_folder("bwd", module.bwd_step)
+            dst_filepath = os.path.join(dst_folder, f"{name}.output_gradient_{i}")
+            if verbose:
+                print("\t", out_grad.shape)
+                print(f"\t\tSaving to {dst_filepath}")
+            torch.save(out_grad, dst_filepath)
+        else:
+            if verbose:
+                print(out_grad)
+    if verbose:
+        print("Backward GRAD Input:")
+    for i, in_grad in enumerate(grad_input):
+        if type(in_grad) == torch.Tensor:
+            dst_folder = get_dst_folder("bwd", module.bwd_step)
+            dst_filepath = os.path.join(dst_folder, f"{name}.input_gradient_{i}")
+            if verbose:
+                print("\t", in_grad.shape)
+                print(f"\t\tSaving to {dst_filepath}")
+            torch.save(in_grad, dst_filepath)
+        else:
+            if verbose:
+                print(in_grad)
+    if verbose:
+        print("===")
+    module.bwd_step += 1
+
+
+def peft_forward_hook(module, input, output):
+    if len(input) == 0 or len(output) == 0:
+        return
+    assert module.name is not None and module.fwd_step is not None
+    name = simplify_name(module.name)
+    if verbose:
+        print(f"Forward Hook activated for module: {name}, fwd step: {module.fwd_step}")
+        print("Input:")
+    if type(input) == torch.Tensor:
+        if verbose:
+            print(input.shape)
+        dst_folder = get_dst_folder("fwd", module.fwd_step)
+        dst_filepath = os.path.join(dst_folder, f"{name}.input_0")
+        torch.save(input, dst_filepath)
+    elif type(input) == tuple:
+        for i, inp in enumerate(input):
+            if type(inp) == torch.Tensor:
+                if verbose:
+                    print(inp.shape)
+                dst_folder = get_dst_folder("fwd", module.fwd_step)
+                dst_filepath = os.path.join(dst_folder, f"{name}.input_{i}")
+                torch.save(inp, dst_filepath)
+            else:
+                if verbose:
+                    print(inp)
+    else:
+        assert False
+    if verbose:
+        print("Output:")
+    if type(output) == torch.Tensor:
+        if verbose:
+            print(output.shape)
+        dst_folder = get_dst_folder("fwd", module.fwd_step)
+        dst_filepath = os.path.join(dst_folder, f"{name}.output_0")
+        torch.save(output, dst_filepath)
+    elif type(output) == tuple:
+        for i, out in enumerate(output):
+            if type(out) == torch.Tensor:
+                if verbose:
+                    print(out.shape)
+                dst_folder = get_dst_folder("fwd", module.fwd_step)
+                dst_filepath = os.path.join(dst_folder, f"{name}.output_{i}")
+                torch.save(out, dst_filepath)
+            else:
+                if verbose:
+                    print(out)
+    else:
+        assert False
+    if verbose:
+        print("===")
+    module.fwd_step += 1
+
+
+def peft_optimizer_hook(model_, callback_func_handle):
+    def post_hook(optimizer, args, kwargs):
+        if verbose:
+            print("Optimizer Hook activated")
+        bwd_step = callback_func_handle.step_count
+        for name_, module in model_.named_modules():
+            name = simplify_name(name_)
+            for param_name, param in module.named_parameters(recurse=False):
+                if param.requires_grad:
+                    if verbose:
+                        print(
+                            f"Step #{bwd_step}: Saving weight gradient for {name} ({param.grad.shape})"
+                        )
+                    dst_folder = get_dst_folder("weights", bwd_step)
+                    dst_filepath = os.path.join(dst_folder, f"{name}.gradient")
+                    torch.save(param.grad, dst_filepath)
+
+    return post_hook
+
+
+class HFTrainingCallBack(TrainerCallback):
+    def on_train_begin(self, args, state, control, **kwargs):
+        if verbose:
+            print("Starting finetuning")
+        model_ = kwargs.get("model", None)
+        optim = kwargs.get("optimizer", None)
+        assert model_ is not None
+        assert optim is not None
+        self.step_count = 0
+        optim.optimizer.register_step_post_hook(peft_optimizer_hook(model_, self))
+
+    def save_lora_weights(self, model, pre_finetuning=False):
+        lora_weights_handles = [
+            (simplify_name(name), params)
+            for name, params in model.named_parameters()
+            if "lora" in name
+        ]
+        for simplified_name, params in lora_weights_handles:
+            dst_folder = get_dst_folder("weights", self.step_count)
+            if pre_finetuning:
+                dst_filepath = os.path.join(dst_folder, f"{simplified_name}_original")
+                torch.save(params, dst_filepath)
+                if verbose:
+                    print(
+                        f"Step #{self.step_count}: Saving ORIGINAL weight {simplified_name} ({params.shape})"
+                    )
+            else:
+                dst_filepath = os.path.join(dst_folder, f"{simplified_name}_finetuned")
+                torch.save(params, dst_filepath)
+                if verbose:
+                    print(
+                        f"Step #{self.step_count}: Saving FINETUNED weight {simplified_name} ({params.shape})"
+                    )
+        if not pre_finetuning:
+            self.step_count += 1
+
+    def on_step_end(
+        self, args, state, control, model, tokenizer, optimizer, lr_scheduler, **kwargs
+    ):
+        self.save_lora_weights(model, pre_finetuning=False)
+
+    def on_step_begin(
+        self, args, state, control, model, tokenizer, optimizer, lr_scheduler, **kwargs
+    ):
+        self.save_lora_weights(model, pre_finetuning=True)
+
+    def on_train_end(self, args, state, control, **kwargs):
+        if verbose:
+            print(f"Finetuning ended after {self.step_count} steps")
+
+
+def build_peft_config(args, finetuning=False):
+    peft_config = PeftConfig.from_pretrained(args.peft_model_id)
+    if peft_config.peft_type != "LORA":
+        raise ValueError(f"PEFT type {peft_config.peft_type} not supported yet")
+    if args.lora_alpha > 0.0:
+        peft_config.lora_alpha = args.lora_alpha
+    if peft_config.lora_dropout >= 0.0:
+        peft_config.lora_dropout = args.lora_dropout
+    # prevent HF from re-inizialing the weights randomly if finetuning
+    if finetuning:
+        peft_config.init_lora_weights = False
+    return peft_config
+
+
+def prepare_model_for_lora_finetuning(model, save_peft_tensors=False):
+    # Freeze all layers except the LORA ones. Cast small layers to full precision for stability
+    for name, param in model.named_parameters():
+        if "lora" not in name:
+            param.requires_grad = False  # freeze the model - train adapters later
+        else:
+            param.requires_grad = True
+        if param.ndim == 1:
+            # cast the small parameters (e.g. layernorm) to fp32 for stability
+            param.data = param.data.to(torch.float32)
+    if not save_peft_tensors:
+        model.gradient_checkpointing_enable()  # reduce number of stored activations
+    model.enable_input_require_grads()
+    model.lm_head = CastOutputToFloat(model.lm_head)
+    return model
+
+
+def build_peft_model(args, peft_config):
+    # Load base model, and apply the PEFT layer
+    model = AutoModelForCausalLM.from_pretrained(
+        peft_config.base_model_name_or_path,
+        torch_dtype=torch.float32 if args.use_full_precision else torch.float16,
+        device_map="auto",
+    )
+    model = PeftModel.from_pretrained(model, args.peft_model_id, config=peft_config)
+    model = prepare_model_for_lora_finetuning(model, args.save_peft_tensors)
+    return model
+
+
+def get_peft_tokenizer(args, peft_config):
+    # Get Tokenizer
+    hf_config = AutoConfig.from_pretrained(
+        peft_config.base_model_name_or_path, trust_remote_code=True
+    )
+    hf_arch = getattr(hf_config, "architectures")[0]
+    if hf_arch == "LLaMAForCausalLM" or hf_arch == "LlamaForCausalLM":
+        tokenizer = LlamaTokenizer.from_pretrained(
+            peft_config.base_model_name_or_path,
+            use_fast=True,
+            torch_dtype=torch.float32 if args.use_full_precision else torch.float16,
+        )
+    else:
+        tokenizer = AutoTokenizer.from_pretrained(
+            peft_config.base_model_name_or_path,
+            torch_dtype=torch.float32 if args.use_full_precision else torch.float16,
+        )
+    if tokenizer.pad_token is None:
+        tokenizer.pad_token = "[PAD]"
+        tokenizer.padding_side = "left"
+    return tokenizer
+
+
+def register_peft_hooks(model):
+    # Save hidden states and gradients
+    for name, layer in dict(model.named_modules()).items():
+        layer.name = name
+        layer.fwd_step = 0
+        layer.bwd_step = 0
+        if verbose:
+            print(f"Adding hooks to layer {layer.name}")
+        layer.register_forward_hook(peft_forward_hook)
+        layer.register_full_backward_hook(peft_backward_hook)
+
+
+def save_peft_weights(model, target_modules=[]):
+    # Save any weights of interest
+    for name, params in model.named_parameters():
+        simplified_name = simplify_name(name)
+        for target_module in target_modules:
+            if target_module in name:
+                dst_folder = get_dst_folder("weights")
+                dst_filepath = os.path.join(dst_folder, f"{simplified_name}")
+                torch.save(params, dst_filepath)
+
+
+def filter_dataset_for_debugging(data, key_to_filter, desired_value):
+    filtered_dataset_dict = DatasetDict()
+    for split, dataset in data.items():
+        filtered_dataset = dataset.filter(
+            lambda example: example[key_to_filter] == desired_value
+        )
+        filtered_dataset_dict[split] = filtered_dataset
+    data = filtered_dataset_dict
+    return data
+
+
+def save_finetuned_model(model, args):
+    if len(args.output_dir) > 0:
+        if verbose:
+            print(f"Saving the model to {args.output_dir}...")
+        model.save_pretrained(args.output_dir)
+
+    if len(args.publish_peft_with_id) > 0:
+        if verbose:
+            print(
+                f"Uploading the model to HF hub with id: {args.publish_peft_with_id}..."
+            )
+        model.push_to_hub(args.publish_peft_with_id, use_auth_token=True)
diff --git a/tests/peft/peft_alignment_test.py b/tests/peft/peft_alignment_test.py
new file mode 100644
index 0000000000..266bb64137
--- /dev/null
+++ b/tests/peft/peft_alignment_test.py
@@ -0,0 +1,730 @@
+import numpy as np
+import os, torch, argparse
+from alignment.align_test_utils import *
+from transformers import AutoConfig
+from peft import PeftConfig
+from tqdm import tqdm
+
+class AlignmentTest:
+    def __init__(self, model_name, tp_degree=1):
+        raise NotImplementedError()
+    def check_weights_alignment(self):
+        raise NotImplementedError()
+    def check_fwd_pass(self):
+        raise NotImplementedError()
+    def check_bwd_pass(self):
+        raise NotImplementedError()
+    def check_step(self, step_idx, learning_rate=0.001):
+        raise NotImplementedError()
+
+class LllamaAlignmentTest(AlignmentTest):
+    def __init__(self, model_name, tp_degree=1):
+        self.model_name = model_name
+        self.peft_config = PeftConfig.from_pretrained(model_name)
+        self.hf_config = AutoConfig.from_pretrained(self.peft_config.base_model_name_or_path)
+        self.num_layers = self.hf_config.num_hidden_layers
+        self.hidden_size = self.hf_config.hidden_size
+        self.intermediate_size = self.hf_config.intermediate_size
+        self.num_attention_heads = self.hf_config.num_attention_heads
+        self.num_key_value_heads = self.num_attention_heads
+        self.projsize = self.hidden_size // self.num_attention_heads
+        self.tp_degree = tp_degree
+        self.lora_scaling_factor = self.peft_config.lora_alpha / self.peft_config.r
+
+        self.num_tokens = None
+        self.ff_batch_size = None
+    
+
+    def check_weights_alignment(self):
+        def convert_hf_filename_to_ff(hf_filename):
+            if hf_filename == "lm_head.weight":
+                f_version = f"layers.{self.num_layers-1}.lm_head.weight_0"
+            elif hf_filename == "norm.weight":
+                f_version = f"layers.{self.num_layers-1}.norm.weight_0"
+            else:
+                f_version = ""
+                if hf_filename.startswith("layers."):
+                    layernum = hf_filename.split("layers.")[1].split(".")[0]
+                    f_version += f"layers.{layernum}."
+                f_version += hf_filename.replace(".base_layer", "").replace(".default", "")
+                # compute weight index, then rename lora if needed if needed
+                weight_index="0"
+                if "lora_A" in f_version:
+                    weight_index="A"
+                elif "lora_B" in f_version:
+                    weight_index="B"
+                f_version = f_version.replace("lora_A", "lora").replace("lora_B", "lora")
+                if f_version.endswith(".weight"):
+                    if weight_index == "0":
+                        f_version += f"_{weight_index}"
+                    else:
+                        f_version += f"_{weight_index}.original"
+                elif f_version.endswith(".gradient"):
+                    prefix = f_version.split(".gradient")[0]
+                    f_version = prefix + f".weight_{weight_index}.gradient"
+            return f_version
+        def get_tp_partition_dim(ff_weight_name) -> int:
+            # MLP layers split the intermediate size dimension
+            # gate_proj, up_proj: [hidden_size, intermediate_size]
+            # down_proj: [intermediate_size, hidden_size]
+            if self.tp_degree == 1:
+                return -1
+            if "lora.weight_B" in ff_weight_name:
+                return -1
+            if "lm_head" in ff_weight_name or "norm" in ff_weight_name:
+                return 1
+            if "gate_proj" in ff_weight_name or "up_proj" in ff_weight_name:
+                return 1
+            elif "down_proj" in ff_weight_name:
+                return 0
+            else:
+                return -1
+        print("-- Weights alignment --")
+        hf_weights_folder = os.path.join(hf_path, "weights", "step_0")
+        ff_weights_folder = os.path.join(ff_path, "weights", "step_0", "shard_0")
+        files_list = os.listdir(hf_weights_folder)
+        for hf_weight_name in tqdm(sorted(files_list)):
+            if hf_weight_name.endswith(".weight"):
+                ff_weight_name = convert_hf_filename_to_ff(hf_weight_name)
+                # print(hf_weight_name, ff_weight_name)
+                hf_w_path = os.path.join(hf_weights_folder, hf_weight_name)
+                ff_w_path = os.path.join(ff_weights_folder, ff_weight_name)
+                if not os.path.isfile(hf_w_path):
+                    print(f"File '{hf_w_path}' not found")
+                if not os.path.isfile(ff_w_path):
+                    print(f"File '{ff_w_path}' not found")
+                assert(os.path.isfile(hf_w_path))
+                assert(os.path.isfile(ff_w_path))
+
+                # 1. get shape of hf weight
+                hf_weight = torch.load(hf_w_path, map_location='cpu')
+                hf_weigth_shape = hf_weight.shape
+                ff_partition_dim = get_tp_partition_dim(ff_weight_name)
+                ff_weigth_shape = list(hf_weigth_shape)[::-1]
+                if ff_partition_dim >= 0:
+                    ff_weigth_shape[ff_partition_dim] //= self.tp_degree
+                
+                # 2. handle flexflow shards in case of tensor parallelism
+                ff_weights = [load_ff_tensor(ff_w_path.replace("shard_0", f"shard_{tp_idx}"), ff_weigth_shape) for tp_idx in range(self.tp_degree)]
+                if self.tp_degree > 1:
+                    if ff_partition_dim >= 0:
+                        ff_weight = np.concatenate(ff_weights, axis=ff_partition_dim)
+                    else:
+                        assert(are_np_arrays_identical(ff_weights))
+                        ff_weight = ff_weights[0]
+                else:
+                    ff_weight = ff_weights[0]
+                ff_weight = torch.from_numpy(ff_weight).to(hf_weight.dtype)
+                
+                # check equivalence
+                try:
+                    torch.testing.assert_close(ff_weight, hf_weight.T)
+                except Exception as e:
+                    print(f"Error comparing {ff_w_path} weight to {hf_w_path}:\n{e}\n")
+                    raise e
+    
+    def check_fwd_pass(self, step_idx=0):
+        hf_fwd_folder = os.path.join(hf_path, "fwd", f"step_{step_idx}")
+        ff_fwd_folder = os.path.join(ff_path, "fwd", f"step_{step_idx}", "shard_0")
+        
+        def convert_hf_filename_to_ff(hf_filename):
+            if hf_filename == "embed_tokens":
+                f_version = f"layers.0.embed_tokens"
+            elif hf_filename == "lm_head" or hf_filename == "norm":
+                f_version = f"layers.{self.num_layers-1}.{hf_filename}"
+            else:
+                assert hf_filename.startswith("layers.")
+                layernum = hf_filename.split("layers.")[1].split(".")[0]
+                f_version = f"layers.{layernum}."
+                f_version += hf_filename.replace(".base_layer", "").replace(".default", "")
+                # right now, attention in flexflow is done with a single operator, so there is a single output file without the projection suffix
+                f_version = f_version.replace(".q_proj", "").replace(".k_proj", "").replace(".v_proj", "").replace(".o_proj", "")
+                # lora in HuggingFace is split into A and B operators, in FF we use a single operator.
+                f_version = f_version.replace("lora_A", "lora").replace("lora_B", "lora")
+            return f_version
+        
+        def get_hf_tensor(hf_tensor_name, tensor_comparison_idx):
+            hf_tensor_filename = f"{hf_tensor_name}.{tensor_comparison_idx.hf_tensor_type}_{tensor_comparison_idx.hf_tensor_idx}"
+            hf_tensor_path = os.path.join(hf_fwd_folder, hf_tensor_filename)
+
+            if not os.path.isfile(hf_tensor_path):
+                raise FileNotFoundError(f"File '{hf_tensor_path}' not found")
+            hf_tensor = torch.load(hf_tensor_path, map_location='cpu')
+            if hf_tensor_name == "embed_tokens":
+                self.num_tokens = hf_tensor.shape[1]
+            return hf_tensor
+        
+        def get_ff_tensor(ff_tensor_name, tensor_comparison_idx, hf_shape, tp_type=TPType.REPLICATE):
+            ff_tensor_suffix = f".{tensor_comparison_idx.ff_tensor_type}" if len(tensor_comparison_idx.ff_tensor_type) > 0 else ""
+            ff_tensor_idx_suffix = f"_{tensor_comparison_idx.ff_tensor_idx}" if tensor_comparison_idx.ff_tensor_idx is not None else ""
+            ff_tensor_filename = f"{ff_tensor_name}{ff_tensor_suffix}{ff_tensor_idx_suffix}"
+            ff_tensor_path = os.path.join(ff_fwd_folder, ff_tensor_filename)
+            if not os.path.isfile(ff_tensor_path):
+                raise FileNotFoundError(f"File '{ff_tensor_path}' not found")
+
+            ff_shape = list(hf_shape)[::-1]
+            if tp_type == TPType.PARTITION:
+                ff_shape[0] //= self.tp_degree
+            
+            if "layers.0.embed_tokens.input_0" in ff_tensor_path:
+                # get number of tokens
+                ff_tensor = np.loadtxt(ff_tensor_path, delimiter=',')
+                self.ff_batch_size = ff_tensor.shape[0]
+
+            ff_shape = replace_value(ff_shape, self.num_tokens, self.ff_batch_size)
+            ff_tensors = [load_ff_tensor(ff_tensor_path.replace("shard_0", f"shard_{tp_idx}"), ff_shape) for tp_idx in range(self.tp_degree)]
+            if self.tp_degree > 1:
+                # if replicate, check that they are identical
+                if tp_type == TPType.REPLICATE:
+                    assert(are_np_arrays_identical(ff_tensors))
+                    ff_tensor = ff_tensors[0]
+                # if partition, concatenate along the partition dimension
+                elif tp_type == TPType.PARTITION:
+                    ff_tensor = np.concatenate(ff_tensors, axis=0)
+                # if to_reduce, sum along the partition dimension
+                elif tp_type == TPType.TO_REDUCE:
+                    ff_tensor = np.sum(ff_tensors, axis=0)
+            else:
+                ff_tensor = ff_tensors[0]
+            ff_tensor = torch.from_numpy(ff_tensor)
+            ff_tensor = truncate_dimension(ff_tensor, self.ff_batch_size, self.num_tokens)
+            return ff_tensor
+
+        def compare(hf_tensor, ff_tensor, label="", additional_ff_tensor=None, tolerance=1e-2):
+            ff_tensor = ff_tensor.to(hf_tensor.dtype)
+            hf_tensor = hf_tensor.T
+            if additional_ff_tensor is not None:
+                additional_ff_tensor = additional_ff_tensor.to(hf_tensor.dtype)
+                ff_tensor = ff_tensor - additional_ff_tensor
+            try:
+                # torch.testing.assert_close(hf_tensor, ff_tensor, rtol=1.3e-6, atol=tolerance)
+                if not np.allclose(hf_tensor.detach().numpy(), ff_tensor.detach().numpy(), atol=tolerance):
+                    mismatches = np.where(~np.isclose(hf_tensor.detach().numpy(), ff_tensor.detach().numpy(), atol=tolerance))[0]
+                    print(f"Pct mismatch {label}: {100.0*(np.prod(mismatches.shape) / ff_tensor.numel()):.3f}%")
+                    assert(np.prod(mismatches.shape) <= .05 * ff_tensor.numel())
+            except Exception as e:
+                print(f"Error in comparison {label}:\n{e}\n")
+                print("HF tensor:")
+                print(hf_tensor.squeeze())
+                print("FF tensor:")
+                print(ff_tensor.squeeze())
+                raise e
+
+        print(f"-- FWD pass {step_idx}--")
+
+        # Embedding layer
+        hf_tensor_name = "embed_tokens"
+        ff_tensor_name = convert_hf_filename_to_ff(hf_tensor_name)
+        input_comparison = TensorComparisonIdxs(hf_tensor_type="input", ff_tensor_type="input", hf_tensor_idx=0, ff_tensor_idx=0)
+        output_comparison = TensorComparisonIdxs(hf_tensor_type="output", ff_tensor_type="output", hf_tensor_idx=0, ff_tensor_idx=0)
+        hf_tensor = get_hf_tensor(hf_tensor_name, input_comparison)
+        ff_tensor = get_ff_tensor(ff_tensor_name, input_comparison, hf_tensor.shape)
+        compare(hf_tensor, ff_tensor, label="Embedding input")
+        hf_tensor = get_hf_tensor(hf_tensor_name, output_comparison)
+        ff_tensor = get_ff_tensor(ff_tensor_name, output_comparison, hf_tensor.shape)
+        compare(hf_tensor, ff_tensor, label="Embedding output")
+        
+        # Transformers blocks
+        for i in range(self.num_layers):
+            # Input laye norm
+            hf_tensor_name = f"layers.{i}.input_layernorm"
+            ff_tensor_name = convert_hf_filename_to_ff(hf_tensor_name)
+            if i == 0:
+                input_comparison = TensorComparisonIdxs(hf_tensor_type="input", ff_tensor_type="input", hf_tensor_idx=0, ff_tensor_idx=0)
+                output_comparison = TensorComparisonIdxs(hf_tensor_type="output", ff_tensor_type="output", hf_tensor_idx=0, ff_tensor_idx=0)
+            else:
+                input_comparison = TensorComparisonIdxs(hf_tensor_type="input", ff_tensor_type="output", hf_tensor_idx=0, ff_tensor_idx=0)
+                output_comparison = TensorComparisonIdxs(hf_tensor_type="output", ff_tensor_type="output", hf_tensor_idx=0, ff_tensor_idx=1)
+            hf_tensor = get_hf_tensor(hf_tensor_name, input_comparison)
+            ff_tensor = get_ff_tensor(ff_tensor_name, input_comparison, hf_tensor.shape)
+            compare(hf_tensor, ff_tensor, label=f"Input layernorm {i} input")
+            hf_tensor = get_hf_tensor(hf_tensor_name, output_comparison)
+            ff_tensor = get_ff_tensor(ff_tensor_name, output_comparison, hf_tensor.shape)
+            compare(hf_tensor, ff_tensor, label=f"Input layernorm {i} output")
+
+            # Attention
+            hf_tensor_name = f"layers.{i}.self_attn.o_proj"
+            ff_tensor_name = convert_hf_filename_to_ff(hf_tensor_name)
+            output_comparison = TensorComparisonIdxs(hf_tensor_type="output", ff_tensor_type="output", hf_tensor_idx=0, ff_tensor_idx=0)
+            hf_tensor = get_hf_tensor(hf_tensor_name, output_comparison)
+            ff_tensor = get_ff_tensor(ff_tensor_name, output_comparison, hf_tensor.shape, tp_type=TPType.TO_REDUCE)
+            compare(hf_tensor, ff_tensor, label=f"Attention {i} output")
+            
+            # Post-attention layernorm
+            hf_tensor_name = f"layers.{i}.post_attention_layernorm"
+            ff_tensor_name = convert_hf_filename_to_ff(hf_tensor_name)
+            output_comparison = TensorComparisonIdxs(hf_tensor_type="output", ff_tensor_type="output", hf_tensor_idx=0, ff_tensor_idx=1)
+            hf_tensor = get_hf_tensor(hf_tensor_name, output_comparison)
+            ff_tensor = get_ff_tensor(ff_tensor_name, output_comparison, hf_tensor.shape)
+            compare(hf_tensor, ff_tensor, label=f"Post-attention layernorm {i} output")
+
+            # W1 (gate_proj)
+            hf_tensor_name = f"layers.{i}.mlp.gate_proj"
+            ff_tensor_name = convert_hf_filename_to_ff(hf_tensor_name)
+            output_comparison = TensorComparisonIdxs(hf_tensor_type="output", ff_tensor_type="output", hf_tensor_idx=0, ff_tensor_idx=0)
+            hf_tensor = get_hf_tensor(hf_tensor_name, output_comparison)
+            ff_tensor = get_ff_tensor(ff_tensor_name, output_comparison, hf_tensor.shape, tp_type=TPType.PARTITION)
+            compare(hf_tensor, ff_tensor, label=f"W1 {i} output")
+
+            # W3 (up_proj)
+            hf_tensor_name = f"layers.{i}.mlp.up_proj"
+            ff_tensor_name = convert_hf_filename_to_ff(hf_tensor_name)
+            output_comparison = TensorComparisonIdxs(hf_tensor_type="output", ff_tensor_type="output", hf_tensor_idx=0, ff_tensor_idx=0)
+            hf_tensor = get_hf_tensor(hf_tensor_name, output_comparison)
+            ff_tensor = get_ff_tensor(ff_tensor_name, output_comparison, hf_tensor.shape, tp_type=TPType.PARTITION)
+            compare(hf_tensor, ff_tensor, label=f"W3 {i} output")
+
+            # W2 (down_proj)
+            hf_tensor_name = f"layers.{i}.mlp.down_proj"
+            ff_tensor_name = convert_hf_filename_to_ff(hf_tensor_name)
+            input_comparison = TensorComparisonIdxs(hf_tensor_type="input", ff_tensor_type="input", hf_tensor_idx=0, ff_tensor_idx=0)
+            output_comparison = TensorComparisonIdxs(hf_tensor_type="output", ff_tensor_type="output", hf_tensor_idx=0, ff_tensor_idx=0)
+            hf_down_proj_out = get_hf_tensor(hf_tensor_name, output_comparison)
+            hf_tensor = get_hf_tensor(hf_tensor_name, input_comparison)
+            ff_tensor = get_ff_tensor(ff_tensor_name, input_comparison, hf_tensor.shape, tp_type=TPType.PARTITION)
+            compare(hf_tensor, ff_tensor, label=f"W2 {i} input")
+
+            hf_down_proj_in = hf_tensor.clone()
+            hf_tensor = get_hf_tensor(hf_tensor_name, output_comparison)
+            ff_down_proj_out = get_ff_tensor(ff_tensor_name, output_comparison, hf_tensor.shape, tp_type=TPType.TO_REDUCE)
+
+            # LoRA_A
+            hf_tensor_name = f"layers.{i}.mlp.down_proj.lora_A.default"
+            ff_tensor_name = convert_hf_filename_to_ff(hf_tensor_name)
+            input_comparison = TensorComparisonIdxs(hf_tensor_type="input", ff_tensor_type="input", hf_tensor_idx=0, ff_tensor_idx=0)
+            hf_tensor = get_hf_tensor(hf_tensor_name, input_comparison)
+            ff_tensor = get_ff_tensor(ff_tensor_name, input_comparison, hf_tensor.shape, tp_type=TPType.PARTITION)
+            compare(hf_tensor, ff_tensor, label=f"LoRA_A {i} input")
+            torch.testing.assert_close(hf_down_proj_in, hf_tensor, rtol=1.3e-6, atol=1e-5)
+
+            # LoRA intermediate
+            input_comparison = TensorComparisonIdxs(hf_tensor_type="input", ff_tensor_type="input", hf_tensor_idx=0, ff_tensor_idx=0)
+            output_comparison = TensorComparisonIdxs(hf_tensor_type="output", ff_tensor_type="low_rank_activation", hf_tensor_idx=0, ff_tensor_idx=None)
+            hf_lora_A_out = get_hf_tensor(hf_tensor_name, output_comparison)
+            hf_tensor_name = f"layers.{i}.mlp.down_proj.lora_B.default"
+            hf_lora_B_in = get_hf_tensor(hf_tensor_name, input_comparison)
+            torch.testing.assert_close(hf_lora_A_out, hf_lora_B_in, rtol=1.3e-6, atol=1e-5)
+            ff_tensor_name = f"layers.{i}.layers.{i}.mlp.down_proj.lora"
+            ff_lora_A_out = get_ff_tensor(ff_tensor_name, output_comparison, hf_lora_A_out.shape, tp_type=TPType.TO_REDUCE)
+            compare(hf_lora_A_out, ff_lora_A_out, label=f"LoRA_A {i} output")
+
+            # LoRA_B
+            hf_tensor_name = f"layers.{i}.mlp.down_proj.lora_B.default"
+            ff_tensor_name = convert_hf_filename_to_ff(hf_tensor_name)
+            output_comparison = TensorComparisonIdxs(hf_tensor_type="output", ff_tensor_type="output", hf_tensor_idx=0, ff_tensor_idx=0)
+            hf_tensor = get_hf_tensor(hf_tensor_name, output_comparison) * self.lora_scaling_factor
+            ff_tensor = get_ff_tensor(ff_tensor_name, output_comparison, hf_down_proj_out.shape, tp_type=TPType.TO_REDUCE)
+            compare(hf_down_proj_out, ff_tensor, label=f"W2_out + scaling*LoRA_B_out {i}")
+            compare(hf_tensor, ff_tensor, additional_ff_tensor=ff_down_proj_out, label=f"LoRA_B {i} output")
+        
+        # Norm
+        hf_tensor_name = "norm"
+        ff_tensor_name = convert_hf_filename_to_ff(hf_tensor_name)
+        output_comparison = TensorComparisonIdxs(hf_tensor_type="output", ff_tensor_type="output", hf_tensor_idx=0, ff_tensor_idx=1)
+        hf_tensor = get_hf_tensor(hf_tensor_name, output_comparison)
+        ff_tensor = get_ff_tensor(ff_tensor_name, output_comparison, hf_tensor.shape)
+        compare(hf_tensor, ff_tensor, label="Norm output")
+
+        # LM head
+        hf_tensor_name = "lm_head"
+        ff_tensor_name = convert_hf_filename_to_ff(hf_tensor_name)
+        input_comparison = TensorComparisonIdxs(hf_tensor_type="input", ff_tensor_type="input", hf_tensor_idx=0, ff_tensor_idx=0)
+        hf_tensor = get_hf_tensor(hf_tensor_name, input_comparison)
+        ff_tensor = get_ff_tensor(ff_tensor_name, input_comparison, hf_tensor.shape, tp_type=TPType.REPLICATE)
+        compare(hf_tensor, ff_tensor, label="LM head input")
+        output_comparison = TensorComparisonIdxs(hf_tensor_type="output", ff_tensor_type="output", hf_tensor_idx=0, ff_tensor_idx=0)
+        hf_tensor = get_hf_tensor(hf_tensor_name, output_comparison)
+        ff_tensor = get_ff_tensor(ff_tensor_name, output_comparison, hf_tensor.shape, tp_type=TPType.PARTITION)
+        compare(hf_tensor, ff_tensor, label="LM head output")
+
+    def check_bwd_pass(self, step_idx=0):
+        if not self.num_tokens or not self.ff_batch_size:
+            raise ValueError("Number of tokens and batch size must be set before running backward pass check")
+        hf_bwd_folder = os.path.join(hf_path, "bwd", f"step_{step_idx}")
+        ff_bwd_folder = os.path.join(ff_path, "bwd", f"step_{step_idx}", "shard_0")
+        
+        def convert_hf_filename_to_ff(hf_filename):
+            if hf_filename == "embed_tokens":
+                f_version = f"layers.0.embed_tokens"
+            elif hf_filename == "lm_head" or hf_filename == "norm":
+                f_version = f"layers.{self.num_layers-1}.{hf_filename}"
+            else:
+                assert hf_filename.startswith("layers.")
+                layernum = hf_filename.split("layers.")[1].split(".")[0]
+                f_version = f"layers.{layernum}."
+                f_version += hf_filename.replace(".base_layer", "").replace(".default", "")
+                # right now, attention in flexflow is done with a single operator, so there is a single output file without the projection suffix
+                # f_version = f_version.replace(".q_proj", "").replace(".k_proj", "").replace(".v_proj", "").replace(".o_proj", "")
+                # lora in HuggingFace is split into A and B operators, in FF we use a single operator.
+                f_version = f_version.replace("lora_A", "lora").replace("lora_B", "lora")
+            return f_version
+        
+        def get_hf_tensor(hf_tensor_name, tensor_comparison_idx):
+            hf_tensor_filename = f"{hf_tensor_name}.{tensor_comparison_idx.hf_tensor_type}_{tensor_comparison_idx.hf_tensor_idx}"
+            hf_tensor_path = os.path.join(hf_bwd_folder, hf_tensor_filename)
+
+            if not os.path.isfile(hf_tensor_path):
+                raise FileNotFoundError(f"File '{hf_tensor_path}' not found")
+            hf_tensor = torch.load(hf_tensor_path, map_location='cpu')
+            return hf_tensor
+        
+        def get_ff_tensor(ff_tensor_name, tensor_comparison_idx, hf_shape, tp_type=TPType.REPLICATE, pre=False, shard_axis=0):
+            ff_tensor_suffix = f".{tensor_comparison_idx.ff_tensor_type}" if len(tensor_comparison_idx.ff_tensor_type) > 0 else ""
+            ff_tensor_idx_suffix = f"_{tensor_comparison_idx.ff_tensor_idx}" if tensor_comparison_idx.ff_tensor_idx is not None else ""
+            ff_tensor_filename = f"{ff_tensor_name}{ff_tensor_suffix}{ff_tensor_idx_suffix}"
+            
+            ff_tensor_path = os.path.join(ff_bwd_folder, ff_tensor_filename)
+            if pre:
+                ff_tensor_path = ff_tensor_path.replace(f"step_{step_idx}", f"step_{step_idx}_pre")
+            if not os.path.isfile(ff_tensor_path):
+                raise FileNotFoundError(f"File '{ff_tensor_path}' not found")
+
+            ff_shape = list(hf_shape)[::-1]
+            if tp_type == TPType.PARTITION:
+                ff_shape[shard_axis] //= self.tp_degree
+
+            # exception: intermediate attention tensors
+            intermediate_attention_tensor = (
+                "self_attn" in ff_tensor_name and 
+                not (
+                    ff_tensor_name.endswith(".self_attn") and
+                    (
+                        tensor_comparison_idx.ff_tensor_type == "output_gradient" or
+                        tensor_comparison_idx.ff_tensor_type == "input_gradient"
+                    )
+                )
+            )
+            if not intermediate_attention_tensor:
+                ff_shape = replace_value(ff_shape, self.num_tokens, self.ff_batch_size)
+            
+            ff_tensors = [load_ff_tensor(ff_tensor_path.replace("shard_0", f"shard_{tp_idx}"), ff_shape) for tp_idx in range(self.tp_degree)]
+            if self.tp_degree > 1:
+                # if replicate, check that they are identical
+                if tp_type == TPType.REPLICATE:
+                    assert(are_np_arrays_identical(ff_tensors))
+                    ff_tensor = ff_tensors[0]
+                # if partition, concatenate along the partition dimension
+                elif tp_type == TPType.PARTITION:
+                    ff_tensor = np.concatenate(ff_tensors, axis=shard_axis)
+                # if to_reduce, sum along the partition dimension
+                elif tp_type == TPType.TO_REDUCE:
+                    ff_tensor = np.sum(ff_tensors, axis=shard_axis)
+            else:
+                ff_tensor = ff_tensors[0]
+            ff_tensor = torch.from_numpy(ff_tensor)
+            if not intermediate_attention_tensor:
+                ff_tensor = truncate_dimension(ff_tensor, self.ff_batch_size, self.num_tokens)
+            return ff_tensor
+
+        def compare(hf_tensor, ff_tensor, label="", additional_ff_tensor=None, tolerance=1e-3):
+            ff_tensor = ff_tensor.to(hf_tensor.dtype)
+            hf_tensor = hf_tensor.T
+            if additional_ff_tensor is not None:
+                additional_ff_tensor = additional_ff_tensor.to(hf_tensor.dtype)
+                ff_tensor = ff_tensor - additional_ff_tensor
+            try:
+                # torch.testing.assert_close(hf_tensor, ff_tensor, rtol=rtol, atol=tolerance)
+                if not np.allclose(hf_tensor.numpy(), ff_tensor.numpy(), atol=tolerance):
+                    mismatches = np.where(~np.isclose(hf_tensor, ff_tensor, atol=tolerance))[0]
+                    print(f"Pct mismatch {label}: {100.0*(np.prod(mismatches.shape) / ff_tensor.numel()):.3f}%")
+                    assert(np.prod(mismatches.shape) <= .06 * ff_tensor.numel())
+            except Exception as e:
+                print(f"Error in comparison {label}:\n{e}\n")
+                print("HF tensor:")
+                print(hf_tensor.squeeze())
+                print("FF tensor:")
+                print(ff_tensor.squeeze())
+                raise e
+        
+        print(f"-- BWD pass {step_idx}--")
+        
+        # LM head
+        hf_tensor_name = "lm_head"
+        ff_tensor_name = convert_hf_filename_to_ff(hf_tensor_name)
+        output_comparison = TensorComparisonIdxs(hf_tensor_type="output_gradient", ff_tensor_type="output_gradient", hf_tensor_idx=0, ff_tensor_idx=0)
+        input_comparison = TensorComparisonIdxs(hf_tensor_type="input_gradient", ff_tensor_type="input_gradient", hf_tensor_idx=0, ff_tensor_idx=0)
+        hf_tensor = get_hf_tensor(hf_tensor_name, output_comparison)
+        ff_tensor = get_ff_tensor(ff_tensor_name, output_comparison, hf_tensor.shape, tp_type=TPType.PARTITION)
+        compare(hf_tensor, ff_tensor, label="LM head gradient output")
+        hf_tensor = get_hf_tensor(hf_tensor_name, input_comparison)
+        ff_tensor = get_ff_tensor(ff_tensor_name, input_comparison, hf_tensor.shape, TPType.TO_REDUCE)
+        compare(hf_tensor, ff_tensor, label="LM head gradient input")
+
+        # Norm
+        hf_tensor_name = "norm"
+        ff_tensor_name = convert_hf_filename_to_ff(hf_tensor_name)
+        output_comparison = TensorComparisonIdxs(hf_tensor_type="output_gradient", ff_tensor_type="output_gradient", hf_tensor_idx=0, ff_tensor_idx=0)
+        input_comparison = TensorComparisonIdxs(hf_tensor_type="input_gradient", ff_tensor_type="input_gradient", hf_tensor_idx=0, ff_tensor_idx=0)
+        hf_tensor = get_hf_tensor(hf_tensor_name, output_comparison)
+        ff_tensor = get_ff_tensor(ff_tensor_name, output_comparison, hf_tensor.shape, tp_type=TPType.REPLICATE)
+        compare(hf_tensor, ff_tensor, label="Norm gradient output")
+        hf_tensor = get_hf_tensor(hf_tensor_name, input_comparison)
+        ff_tensor = get_ff_tensor(ff_tensor_name, input_comparison, hf_tensor.shape)
+        compare(hf_tensor, ff_tensor, label="Norm gradient input")
+
+        # Transformers blocks
+        for i in range(self.num_layers-1, -1, -1):
+            # W2 (down_proj) output
+            hf_tensor_name = f"layers.{i}.mlp.down_proj"
+            ff_tensor_name = convert_hf_filename_to_ff(hf_tensor_name)
+            output_comparison = TensorComparisonIdxs(hf_tensor_type="output_gradient", ff_tensor_type="output_gradient", hf_tensor_idx=0, ff_tensor_idx=0)
+            hf_tensor = get_hf_tensor(hf_tensor_name, output_comparison)
+            ff_tensor = get_ff_tensor(ff_tensor_name, output_comparison, hf_tensor.shape, tp_type=TPType.REPLICATE)
+            compare(hf_tensor, ff_tensor, label=f"W2 {i} gradient output")
+
+            # LoRA_B
+            hf_tensor_name = f"layers.{i}.mlp.down_proj.lora_B.default"
+            ff_tensor_name = convert_hf_filename_to_ff(hf_tensor_name)
+            output_comparison = TensorComparisonIdxs(hf_tensor_type="output_gradient", ff_tensor_type="output_gradient", hf_tensor_idx=0, ff_tensor_idx=0)
+            hf_tensor = get_hf_tensor(hf_tensor_name, output_comparison)
+            ff_tensor = get_ff_tensor(ff_tensor_name, output_comparison, hf_tensor.shape, tp_type=TPType.REPLICATE) * self.lora_scaling_factor
+            compare(hf_tensor, ff_tensor, label=f"LoRA_B {i} gradient output")
+
+            # LoRA_A
+            hf_tensor_name = f"layers.{i}.mlp.down_proj.lora_A.default"
+            ff_tensor_name = convert_hf_filename_to_ff(hf_tensor_name)
+            input_comparison = TensorComparisonIdxs(hf_tensor_type="input_gradient", ff_tensor_type="input_gradient", hf_tensor_idx=0, ff_tensor_idx=0)
+            hf_tensor = get_hf_tensor(hf_tensor_name, input_comparison)
+            ff_tensor = get_ff_tensor(ff_tensor_name, input_comparison, hf_tensor.shape, tp_type=TPType.PARTITION)
+            compare(hf_tensor, ff_tensor, label=f"LoRA_A {i} gradient input")
+
+            # W2 (down_proj) input
+            hf_tensor_name = f"layers.{i}.mlp.down_proj"
+            ff_tensor_name = convert_hf_filename_to_ff(hf_tensor_name)
+            input_comparison = TensorComparisonIdxs(hf_tensor_type="input_gradient", ff_tensor_type="input_gradient", hf_tensor_idx=0, ff_tensor_idx=0)
+            hf_tensor = get_hf_tensor(hf_tensor_name, input_comparison)
+            ff_tensor = get_ff_tensor(ff_tensor_name, input_comparison, hf_tensor.shape, tp_type=TPType.PARTITION)
+            compare(hf_tensor, ff_tensor, label=f"W2 {i} gradient input")
+            
+            # W2 input (HF) and SigmoidSiluMulti output (FF)
+            hf_w2_input = hf_tensor.clone()
+            ff_tensor_name = f"layers.{i}.SigmoidSiluMulti"
+            output_comparison = TensorComparisonIdxs(hf_tensor_type="output_gradient", ff_tensor_type="output_gradient", hf_tensor_idx=0, ff_tensor_idx=0)
+            ff_tensor = get_ff_tensor(ff_tensor_name, output_comparison, hf_tensor.shape, tp_type=TPType.PARTITION)
+            compare(hf_w2_input, ff_tensor, label=f"HF W2 {i} output and FF SSM output")
+
+            # W1 (gate_proj) output
+            hf_tensor_name = f"layers.{i}.mlp.gate_proj"
+            ff_tensor_name = convert_hf_filename_to_ff(hf_tensor_name)
+            output_comparison = TensorComparisonIdxs(hf_tensor_type="output_gradient", ff_tensor_type="output_gradient", hf_tensor_idx=0, ff_tensor_idx=0)
+            hf_tensor = get_hf_tensor(hf_tensor_name, output_comparison)
+            ff_tensor = get_ff_tensor(ff_tensor_name, output_comparison, hf_tensor.shape, tp_type=TPType.PARTITION)
+            compare(hf_tensor, ff_tensor, label=f"W1 {i} gradient output")
+            # W1 (gate_proj) input
+            # HF W1 in = FF W1 in - HF W1 in (pre)
+            input_comparison = TensorComparisonIdxs(hf_tensor_type="input_gradient", ff_tensor_type="input_gradient", hf_tensor_idx=0, ff_tensor_idx=0)
+            hf_tensor = get_hf_tensor(hf_tensor_name, input_comparison)
+            ff_tensor = get_ff_tensor(ff_tensor_name, input_comparison, hf_tensor.shape, tp_type=TPType.TO_REDUCE)
+            ff_tensor_pre = get_ff_tensor(ff_tensor_name, input_comparison, hf_tensor.shape, tp_type=TPType.TO_REDUCE, pre=True)
+            compare(hf_tensor, ff_tensor, additional_ff_tensor=ff_tensor_pre, label=f"W1 {i} gradient input")
+
+            # W3 (up_proj) output
+            hf_tensor_name = f"layers.{i}.mlp.up_proj"
+            ff_tensor_name = convert_hf_filename_to_ff(hf_tensor_name)
+            output_comparison = TensorComparisonIdxs(hf_tensor_type="output_gradient", ff_tensor_type="output_gradient", hf_tensor_idx=0, ff_tensor_idx=0)
+            hf_tensor = get_hf_tensor(hf_tensor_name, output_comparison)
+            ff_tensor = get_ff_tensor(ff_tensor_name, output_comparison, hf_tensor.shape, tp_type=TPType.PARTITION)
+            compare(hf_tensor, ff_tensor, label=f"W3 {i} gradient output")
+            # W3 (up_proj) input
+            input_comparison = TensorComparisonIdxs(hf_tensor_type="input_gradient", ff_tensor_type="input_gradient", hf_tensor_idx=0, ff_tensor_idx=0)
+            hf_tensor = get_hf_tensor(hf_tensor_name, input_comparison)
+            ff_tensor = get_ff_tensor(ff_tensor_name, input_comparison, hf_tensor.shape, tp_type=TPType.TO_REDUCE)
+            compare(hf_tensor, ff_tensor, label=f"W3 {i} gradient input")
+
+            # Attn O-proj
+            hf_tensor_name = f"layers.{i}.self_attn.o_proj"
+            ff_tensor_name = f"layers.{i}.layers.{i}.self_attn"
+            output_comparison = TensorComparisonIdxs(hf_tensor_type="output_gradient", ff_tensor_type="output_gradient", hf_tensor_idx=0, ff_tensor_idx=0)
+            hf_tensor = get_hf_tensor(hf_tensor_name, output_comparison)
+            ff_tensor = get_ff_tensor(ff_tensor_name, output_comparison, hf_tensor.shape, tp_type=TPType.REPLICATE)
+            compare(hf_tensor, ff_tensor, label=f"Attn O-proj {i} gradient output")
+            ff_tensor_name = f"layers.{i}.layers.{i}.self_attn.o_proj"
+            input_comparison = TensorComparisonIdxs(hf_tensor_type="input_gradient", ff_tensor_type="input_gradient", hf_tensor_idx=0, ff_tensor_idx=0)
+            hf_tensor = get_hf_tensor(hf_tensor_name, input_comparison)
+            ff_tensor = get_ff_tensor(ff_tensor_name, input_comparison, hf_tensor.shape, tp_type=TPType.PARTITION)
+            compare(hf_tensor, ff_tensor, label=f"Attn O-proj {i} gradient input")
+
+            # V-proj grads
+            # FF shape: [num_tokens, qProjSize*num_heads]
+            hf_tensor_name = f"layers.{i}.self_attn.v_proj"
+            ff_tensor_name = convert_hf_filename_to_ff(hf_tensor_name)
+            mixed_comparison = TensorComparisonIdxs(hf_tensor_type="output_gradient", ff_tensor_type="input_gradient", hf_tensor_idx=0, ff_tensor_idx=0)
+            hf_tensor = get_hf_tensor(hf_tensor_name, mixed_comparison)
+            hf_tensor = hf_tensor.squeeze().T
+            ff_tensor = get_ff_tensor(ff_tensor_name, mixed_comparison, hf_tensor.shape, tp_type=TPType.PARTITION, shard_axis=1)
+            compare(hf_tensor, ff_tensor, label=f"V-proj {i} gradient input")
+
+            # K-proj grads
+            # FF shape: (num_tokens, qProjSize, num_heads)
+            hf_tensor_name = f"layers.{i}.self_attn.k_proj"
+            ff_tensor_name = f"layers.{i}.layers.{i}.self_attn"
+            k_proj_comparison = TensorComparisonIdxs(hf_tensor_type="output_gradient", ff_tensor_type="devkproj", hf_tensor_idx=0, ff_tensor_idx=None)
+            hf_tensor = get_hf_tensor(hf_tensor_name, k_proj_comparison)
+            hf_tensor = hf_tensor.squeeze().view(self.num_tokens, self.num_attention_heads, self.projsize).transpose(1, 2).contiguous()
+            hf_tensor = hf_tensor.T
+            ff_tensor = get_ff_tensor(ff_tensor_name, k_proj_comparison, hf_tensor.shape, tp_type=TPType.PARTITION, shard_axis=2)
+            compare(hf_tensor, ff_tensor, label=f"K-proj {i} gradient input")
+            
+            # Q-proj grads
+            # FF shape (devQKVPRojArray): (num_tokens, qProjSize, num_heads, 3)
+            # Q-proj out grad: devQKVPRojArray[:,:,:,0]
+            hf_tensor_name = f"layers.{i}.self_attn.q_proj"
+            ff_tensor_name = f"layers.{i}.layers.{i}.self_attn.devQKVPRojArray"
+            q_proj_comparison = TensorComparisonIdxs(hf_tensor_type="output_gradient", ff_tensor_type="", hf_tensor_idx=0, ff_tensor_idx=None)
+            hf_tensor = get_hf_tensor(hf_tensor_name, q_proj_comparison)
+            hf_tensor = hf_tensor.view(self.num_tokens, self.num_attention_heads, self.projsize).transpose(1, 2).contiguous().T
+            augmented_hf_tensor_shape = torch.Size([3]+list(hf_tensor.size()))
+            ff_tensor = get_ff_tensor(ff_tensor_name, q_proj_comparison, augmented_hf_tensor_shape, tp_type=TPType.PARTITION, shard_axis=2)[:,:,:,0]
+            compare(hf_tensor, ff_tensor, label=f"Q-proj {i} gradient input")
+            
+            # FF Attn input with HF layernorm out
+            hf_tensor_name = f"layers.{i}.input_layernorm"
+            ff_tensor_name = f"layers.{i}.layers.{i}.self_attn"
+            input_comparison = TensorComparisonIdxs(hf_tensor_type="output_gradient", ff_tensor_type="input_gradient", hf_tensor_idx=0, ff_tensor_idx=0)
+            hf_tensor = get_hf_tensor(hf_tensor_name, input_comparison)
+            ff_tensor = get_ff_tensor(ff_tensor_name, input_comparison, hf_tensor.shape, tp_type=TPType.TO_REDUCE)
+            compare(hf_tensor, ff_tensor, label=f"Attn input {i} gradient input")
+
+            if i > 0:
+                # FF attn input with FF layernorm out 1
+                attn_input = ff_tensor.clone()
+                ff_tensor_name = f"layers.{i}.layers.{i}.input_layernorm"
+                _output_comparison = TensorComparisonIdxs(hf_tensor_type="input_gradient", ff_tensor_type="output_gradient", hf_tensor_idx=0, ff_tensor_idx=1)
+                input_layernorm_out1 = get_ff_tensor(ff_tensor_name, _output_comparison, hf_tensor.shape, tp_type=TPType.REPLICATE)
+                torch.testing.assert_close(attn_input, input_layernorm_out1, rtol=1.3e-6, atol=1e-5)
+
+                # Input layernorm
+                
+                hf_tensor_name = f"layers.{i}.input_layernorm"
+                ff_tensor_name = convert_hf_filename_to_ff(hf_tensor_name)
+                input_comparison = TensorComparisonIdxs(hf_tensor_type="input_gradient", ff_tensor_type="input_gradient", hf_tensor_idx=0, ff_tensor_idx=0)
+                ff_in1_comparison = TensorComparisonIdxs(hf_tensor_type="input_gradient", ff_tensor_type="input_gradient", hf_tensor_idx=0, ff_tensor_idx=1)
+                input_layernorm0 = get_ff_tensor(ff_tensor_name, input_comparison, hf_tensor.shape, tp_type=TPType.REPLICATE)
+                input_layernorm1 = get_ff_tensor(ff_tensor_name, ff_in1_comparison, hf_tensor.shape, tp_type=TPType.REPLICATE)
+                torch.testing.assert_close(input_layernorm0, input_layernorm1, rtol=1.3e-6, atol=1e-5)
+                hf_tensor = get_hf_tensor(hf_tensor_name, input_comparison)
+                # if i > 1:
+                #     compare(hf_tensor, input_layernorm1, label=f"Input layernorm {i} gradient input")
+
+    def check_step(self, step_idx=0, learning_rate=0.001):
+        hf_weight_folder = os.path.join(hf_path, "weights", f"step_{step_idx}")
+        ff_weight_folder = os.path.join(ff_path, "weights", f"step_{step_idx}", "shard_0")
+        def convert_hf_filename_to_ff(hf_filename):
+            assert hf_filename.startswith("layers.")
+            layernum = hf_filename.split("layers.")[1].split(".")[0]
+            f_version = f"layers.{layernum}."
+            f_version += hf_filename.replace(".base_layer", "").replace(".default", "")
+            # lora in HuggingFace is split into A and B operators, in FF we use a single operator.
+            f_version = f_version.replace("lora_A", "lora.weight_A").replace("lora_B", "lora.weight_B")
+            return f_version
+        def get_hf_tensor(hf_tensor_name):
+            hf_tensor_path = os.path.join(hf_weight_folder, hf_tensor_name)
+
+            if not os.path.isfile(hf_tensor_path):
+                raise FileNotFoundError(f"File '{hf_tensor_path}' not found")
+            hf_tensor = torch.load(hf_tensor_path, map_location='cpu')
+            return hf_tensor
+        def get_ff_tensor(ff_tensor_name, hf_shape, tp_type=TPType.REPLICATE, pre=False):
+            ff_tensor_path = os.path.join(ff_weight_folder, ff_tensor_name)
+            if pre:
+                ff_tensor_path = ff_tensor_path.replace(f"step_{step_idx}", f"step_{step_idx}_pre")
+            if not os.path.isfile(ff_tensor_path):
+                raise FileNotFoundError(f"File '{ff_tensor_path}' not found")
+
+            ff_shape = list(hf_shape)[::-1]
+            if tp_type == TPType.PARTITION:
+                ff_shape[0] //= self.tp_degree
+            
+            ff_tensors = [load_ff_tensor(ff_tensor_path.replace("shard_0", f"shard_{tp_idx}"), ff_shape) for tp_idx in range(self.tp_degree)]
+            if self.tp_degree > 1:
+                # if replicate, check that they are identical
+                if tp_type == TPType.REPLICATE:
+                    assert(are_np_arrays_identical(ff_tensors))
+                    ff_tensor = ff_tensors[0]
+                # if partition, concatenate along the partition dimension
+                elif tp_type == TPType.PARTITION:
+                    ff_tensor = np.concatenate(ff_tensors, axis=0)
+                # if to_reduce, sum along the partition dimension
+                elif tp_type == TPType.TO_REDUCE:
+                    ff_tensor = np.sum(ff_tensors, axis=0)
+            else:
+                ff_tensor = ff_tensors[0]
+            ff_tensor = torch.from_numpy(ff_tensor)
+            return ff_tensor
+        def compare(hf_tensor, ff_tensor, label="", tolerance=1e-4):
+            ff_tensor = ff_tensor.to(hf_tensor.dtype)
+            hf_tensor = hf_tensor.T
+            try:
+                # torch.testing.assert_close(hf_tensor, ff_tensor, rtol=rtol, atol=tolerance)
+                if not np.allclose(hf_tensor.numpy(), ff_tensor.numpy(), atol=tolerance):
+                    mismatches = np.where(~np.isclose(hf_tensor, ff_tensor, atol=tolerance))[0]
+                    print(f"Pct mismatch {label}: {100.0*(np.prod(mismatches.shape) / ff_tensor.numel()):.3f}%")
+                    assert(np.prod(mismatches.shape) <= .05 * ff_tensor.numel())
+            except Exception as e:
+                print(f"Error in comparison {label}:\n{e}\n")
+                print("HF tensor:")
+                print(hf_tensor.squeeze())
+                print("FF tensor:")
+                print(ff_tensor.squeeze())
+                raise e
+        print(f"-- optimizer pass {step_idx}--")
+        
+        for i in range(self.num_layers-1, -1, -1):
+            # LoRA_B gradient
+            hf_gradient_name = f"layers.{i}.mlp.down_proj.lora_B.default.gradient"
+            hf_gradient = get_hf_tensor(hf_gradient_name)
+            hf_original_weight_name = f"layers.{i}.mlp.down_proj.lora_B.default.weight_original"
+            hf_original_weight = get_hf_tensor(hf_original_weight_name)
+            hf_finetuned_weight_name = f"layers.{i}.mlp.down_proj.lora_B.default.weight_finetuned"
+            hf_finetuned_weight = get_hf_tensor(hf_finetuned_weight_name)
+            torch.testing.assert_close(hf_gradient, (hf_original_weight-hf_finetuned_weight)/learning_rate, rtol=1.3e-6, atol=1e-5)
+            ff_gradient_name = convert_hf_filename_to_ff(hf_gradient_name)
+            ff_gradient = get_ff_tensor(ff_gradient_name, hf_gradient.shape, tp_type=TPType.REPLICATE)
+            compare(hf_gradient, ff_gradient, label=f"LoRA_B {i} gradient")
+            # ff_out_gradient_name = f"layers.{i}.layers.{i}.mlp.down_proj.lora.output_gradient_0"
+            # ff_fwd_folder = os.path.join(ff_path, "fwd", f"step_{step_idx}", "shard_0")
+            # ff_bwd_folder = os.path.join(ff_path, "bwd", f"step_{step_idx}", "shard_0")
+            # ff_out_gradient = load_ff_tensor(os.path.join(ff_bwd_folder, ff_out_gradient_name), [self.hidden_size, 128])[:,:self.num_tokens]
+            # ff_out_gradient = torch.from_numpy(ff_out_gradient)
+            # print("Output gradient shape: ", ff_out_gradient.shape)
+            # ff_low_rank_activation = f"layers.{i}.layers.{i}.mlp.down_proj.lora.low_rank_activation"
+            # ff_low_rank_activation = load_ff_tensor(os.path.join(ff_fwd_folder, ff_low_rank_activation), [16, 128])[:,:self.num_tokens]
+            # ff_low_rank_activation = torch.from_numpy(ff_low_rank_activation)
+            # print("Low rank activation shape: ", ff_low_rank_activation.shape)
+            # simulated_weight_grad = ff_low_rank_activation @ ff_out_gradient.T
+            # print("Simulated weight grad shape: ", simulated_weight_grad.shape)
+            # print(simulated_weight_grad)
+            # print(ff_gradient)
+            # compare(hf_gradient, simulated_weight_grad, label=f"LoRA_B {i} simulated gradient")
+            
+
+            # LoRA_A gradient
+            hf_gradient_name = f"layers.{i}.mlp.down_proj.lora_A.default.gradient"
+            hf_gradient = get_hf_tensor(hf_gradient_name)
+            ff_gradient_name = convert_hf_filename_to_ff(hf_gradient_name)
+            hf_original_weight_name = f"layers.{i}.mlp.down_proj.lora_A.default.weight_original"
+            hf_original_weight = get_hf_tensor(hf_original_weight_name)
+            hf_finetuned_weight_name = f"layers.{i}.mlp.down_proj.lora_A.default.weight_finetuned"
+            hf_finetuned_weight = get_hf_tensor(hf_finetuned_weight_name)
+            torch.testing.assert_close(hf_gradient, (hf_original_weight-hf_finetuned_weight)/learning_rate, rtol=1.3e-6, atol=1e-5)
+            ff_gradient_name = convert_hf_filename_to_ff(hf_gradient_name)
+            ff_gradient = get_ff_tensor(ff_gradient_name, hf_gradient.shape, tp_type=TPType.PARTITION)
+            compare(hf_gradient, ff_gradient, label=f"LoRA_A {i} gradient")
+
+parser = argparse.ArgumentParser(description='Argument Parser Example') 
+# Adding arguments
+parser.add_argument('-m', '--model-name', type=str, default="goliaro/llama-160m-lora", help='Name of the model')
+parser.add_argument('-n', '--num-steps', type=int, default=1, help='Number of finetuning steps')
+parser.add_argument('-tp', '--tensor-parallelism-degree', type=int, default=1, help='The tensor parallelism degree used when running FlexFlow')
+parser.add_argument('-lr', '--learning-rate', type=float, default=0.001, help='The learning rate used at finetuning time')
+
+# Parse the arguments from command line
+args = parser.parse_args()
+
+if __name__ == "__main__":
+    llama_alignment = LllamaAlignmentTest(args.model_name, tp_degree=args.tensor_parallelism_degree)
+    # llama_alignment.check_weights_alignment()
+    for i in range(args.num_steps):
+        llama_alignment.check_fwd_pass(i)
+        llama_alignment.check_bwd_pass(i)
+        llama_alignment.check_step(i, args.learning_rate)
diff --git a/tests/peft_test.sh b/tests/peft_test.sh
new file mode 100755
index 0000000000..5600d57edf
--- /dev/null
+++ b/tests/peft_test.sh
@@ -0,0 +1,66 @@
+#! /usr/bin/env bash
+# set -x
+set -e
+
+cleanup() {
+    rm -rf ~/.cache/flexflow/debug
+}
+
+# Cd into directory holding this script
+cd "${BASH_SOURCE[0]%/*}/.."
+
+# Token to access private huggingface models (e.g. LLAMA-2)
+HUGGINGFACE_TOKEN=${HUGGINGFACE_TOKEN:-none}
+if [[ "$HUGGINGFACE_TOKEN" != "none" ]]; then
+    huggingface-cli login --token "$HUGGINGFACE_TOKEN"
+fi
+
+# Clean up before test (just in case)
+cleanup
+
+# Create test prompt file
+mkdir -p ./inference/prompt
+echo '["Two things are infinite: "]' > ./inference/prompt/peft.json
+echo '["“Two things are infinite: the universe and human stupidity; and I'\''m not sure about the universe.”"]' > ./inference/prompt/peft_dataset.json
+
+
+# Create output folder
+mkdir -p ./inference/output
+
+# Enable backtrace in case we run into a segfault or assertion failure
+export LEGION_BACKTRACE=1
+
+# Download test model
+python ./inference/utils/download_peft_model.py goliaro/llama-160m-lora --base_model_name JackFram/llama-160m 
+
+# Run PEFT in Huggingface to get ground truth tensors
+python ./tests/peft/hf_finetune.py --peft-model-id goliaro/llama-160m-lora --save-peft-tensors --use-full-precision
+
+# Python test
+echo "Python test"
+python ./inference/python/ff_peft.py
+# Check alignment
+python ./tests/peft/peft_alignment_test.py -tp 2
+
+# C++ test
+echo "C++ test"
+./build/inference/peft/peft \
+    -ll:gpu 2 -ll:cpu 4 -ll:util 4 \
+    -tensor-parallelism-degree 2 \
+    -ll:fsize 8192 -ll:zsize 12000 \
+    -llm-model JackFram/llama-160m \
+    -finetuning-dataset ./inference/prompt/peft_dataset.json \
+    -peft-model goliaro/llama-160m-lora \
+    -enable-peft \
+    --use-full-precision \
+    --inference-debugging
+# Check alignment
+python ./tests/peft/peft_alignment_test.py -tp 2
+
+# Print succeess message
+echo ""
+echo "PEFT tests passed!"
+echo ""
+
+# Cleanup after the test
+cleanup